智能導購方法
【技術領域】
[0001] 本發(fā)明涉及大數(shù)據(jù)分析技術、數(shù)據(jù)挖掘技術領域;具體涉及一種智能導購方法。
【背景技術】
[0002] 隨著電子商務的迅猛發(fā)展,零售實體(以下簡稱商超)的市場分額受到了嚴重擠 壓;不僅如此,眾多商超間的同質(zhì)化競爭也使得商超留住客戶越來越難。為了應對電商的沖 擊及同行的挑戰(zhàn),提升消費體驗、留住消費者是商超的必由之路。
[0003] 考慮到智能手機的普及使人們能夠方便的獲取用戶的實時位置數(shù)據(jù),在這些數(shù)據(jù) 背后,隱含了豐富的用戶行為規(guī)律信息。因此,在商業(yè)環(huán)境下,對逛店消費者的時空信息進 行深入的挖掘和分析,可以使我們更加深刻地理解個體消費者的逛店行為特征以及對產(chǎn)品 及商鋪的偏好,進而對產(chǎn)品推薦,商鋪推薦,商鋪布局以及廣告推送等具有非常重要的意 義。
[0004] 目前,商業(yè)環(huán)境下針對消費者時空信息的應用主要集中在定位導航方面,例如:將 消費者導航至商超內(nèi)的電梯、店鋪、收銀臺等任意地點;此外,基于時空數(shù)據(jù)的統(tǒng)計分析也 可以直觀,全面地展示逛店消費者的實時位置、駐留時間、到訪頻次以及商超內(nèi)客流密度、 客流動線等。
[0005] 雖然以上應用建立在對消費者時空信息初步分析的基礎上,截止目前,我們尚未 發(fā)現(xiàn)相關技術對這些時空信息背后所蘊藏的知識進行深入分析,發(fā)掘消費者的購物偏好, 并據(jù)此進行智能化、多樣化的導購。然而,這樣的技術被廣泛認為是"提高消費者消費滿意 度,為商超在激烈的競爭中尋找新的增長點"的關鍵。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的目的是針對上述【背景技術】中存在的問題,對消費者的逛店時空信息進行 深入分析,發(fā)現(xiàn)消費者對于產(chǎn)品、品牌等的興趣度,進而實現(xiàn)智能化導購。
[0007] 為了達到上述的技術效果,本發(fā)明采取以下技術方案:一種智能導購方法,包括以 下步驟:
[0008] al、數(shù)據(jù)采集:通過開發(fā)基于地圖的快速wifi定位指紋數(shù)據(jù)采集算法,獲取移動 終端位置數(shù)據(jù),同時,獲取商場內(nèi)的詳細地圖數(shù)據(jù);
[0009] a2、數(shù)據(jù)清洗:對采集到的數(shù)據(jù)進行清洗,消除數(shù)據(jù)中存在的不一致、空缺、噪音的 問題;
[0010] a3、數(shù)據(jù)分析:對清洗后的數(shù)據(jù)進行聚類分析,提取消費者的群體軌跡模型,挖掘 頻繁模式;
[0011] a4、智能導購:結(jié)合應用場景,客戶軌跡和頻繁模式進行智能化的導購。
[0012] 進一步的技術方案是:上述步驟a2數(shù)據(jù)清洗包括以下步驟:
[0013] a21、采用窗口平滑濾波方式,去除數(shù)據(jù)采集導致的客戶樓層定位誤差;
[0014] a22、最近鄰判斷,根據(jù)Jordancurve理論,判斷消費者位置是否在某個店鋪內(nèi),同 時計算消費者位置與店鋪中心點的歐式距離,并將消費者歸入離其最近的店鋪,去除數(shù)據(jù) 采集導致的客戶入店定位誤差。
[0015] 進一步的技術方案是:上述步驟a3數(shù)據(jù)分析包括以下步驟:
[0016]a31、獲取客戶逛店軌跡;
[0017]a32、熱門/冷門店鋪判斷;
[0018] a33、熱門軌跡分析;
[0019]a33、基于用戶逛店興趣進行協(xié)同過濾推薦。
[0020] 進一步的技術方案是:所述熱門/冷門店鋪判斷采取以下方法:獲取各個店
[0021] 鋪所有逛店消費者的ID及人數(shù),設定高、低兩個閾值,當逛店人數(shù)大于高
[0022] 閾值,說明該店鋪為熱門店鋪;當逛店人數(shù)小于低閾值,說明該店鋪為冷
[0023] 門點店鋪。
[0024] 進一步的技術方案是:所述熱門軌跡分析采取以下方法:
[0025] bl、計算頻繁2項路徑集;
[0026] b2、分別對每個頻繁2項進行路徑擴展,保存最終的路徑。
[0027] 進一步的技術方案是:步驟b2通過以下步驟實現(xiàn):
[0028] b21、提取該頻繁2項的頭結(jié)點和尾結(jié)點;
[0029] b22、遍歷頻繁2項路徑集,尋找頭結(jié)點的子結(jié)點;
[0030] b23、遍歷頻繁2項路徑集,尋找尾結(jié)點的子節(jié)點;
[0031] b24、獲取頭結(jié)點和尾結(jié)點擴展后的路徑;如果路徑長度沒有發(fā)生變化,則保存該 路徑;反之,如果路徑長度發(fā)生變化,則返回到步驟b21。
[0032] 進一步的技術方案是:所述基于用戶逛店興趣進行協(xié)同過濾推薦采取以下方法:
[0033] cl、獲取每位消費者所逛店鋪及相應的逛店時間;
[0034] c2、利用以下公式計算消費者u和消費者v間的相似度sinvv):
[0035]
[0036] 公式中RUil、RVil分別為消費者u、v對店鋪i的逛店時間,E、瓦分別為消費者 u、v所逛店鋪的平均時間;
[0037] c3、利用消費者相似度找出與指定消費者最相似的k個消費者,及其所逛店鋪集 合;從前述集合中去掉指定消費者的已逛店鋪,作為推薦店鋪集合;
[0038] c4、計算指定消費者對推薦店鋪集合中每個店鋪的預測逛店時間PUil
[0039]
[0040] 公式中Su,#消費者u、v的相似度;
[0041] c5、對預測的逛店時間從高到底排序,并選取前N個店鋪推薦給指定消費者。
[0042] 本發(fā)明與現(xiàn)有技術相比,具有以下的有益效果:,對逛店消費者的時空信息進行 深入的挖掘和分析,可以使我們更加深刻地理解個體消費者的逛店行為特征以及對產(chǎn)品及 商鋪的偏好,進而對產(chǎn)品推薦,商鋪推薦,商鋪布局以及廣告推送等具有非常重要的意義。 發(fā)掘消費者的購物偏好,并據(jù)此進行智能化、多樣化的導購,提高消費者消費滿意度,為商 超在激烈的競爭中尋找新的增長點。
【附圖說明】
[0043] 圖1是本發(fā)明方法流程不意圖;
[0044] 圖2是本發(fā)明軌跡分析流程圖。
【具體實施方式】
[0045] 下面結(jié)合本發(fā)明的實施例對本發(fā)明作進一步的闡述和說明。
[0046] 實施例:
[0047] 如圖1所示,智能導購的方法主要包括以下步驟:
[0048] ( -)數(shù)據(jù)采集:通過開發(fā)基于地圖的快速wifi定位指紋數(shù)據(jù)采集算法,獲取移 動終端位置數(shù)據(jù),同時,獲取商場內(nèi)的詳細地圖數(shù)據(jù)。
[0049] (二)數(shù)據(jù)清洗:
[0050] 通過定位技術采集到的消費者位置數(shù)據(jù)可能存在誤差。因此,我們采用以下方法 進行數(shù)據(jù)清洗,以消除不一致及錯誤的信息,為后續(xù)分析提供高質(zhì)量的數(shù)據(jù)。
[0051] (1)、針對消費者在短時間內(nèi)在不同樓層跳躍的情況,我們采用窗口平滑濾波的方 式進行過濾及修正。
[0052] (2)、針對同一消費者在同一店鋪內(nèi)外不停跳躍出現(xiàn)的情況,我們對消費者的入店 行為進行更加靈活的處理,詳見步驟入店判斷。
[0053] (三)數(shù)據(jù)分析:
[0054] (1)、入店判斷。根據(jù)Jordancurve理論,判斷消費者位置是否在某個店鋪(多變 形)內(nèi)。同時計算消費者位置與店鋪中心點的歐式距離,并將消費者歸入離其最近的店鋪, 作為入店判斷的輔助條件。
[0055] Jordancurve理論,即對一個封閉的弧線區(qū)域,如果某個點在該區(qū)域內(nèi),那么從該 點向任意方向延伸的射線都與該區(qū)域的邊有交點;反之,如果某個點在該區(qū)域以外,那么從 該點沿部分方向的射線與該區(qū)域的任何一條邊都沒有交點。
[0056] 歐式距離,也即歐氏距離(Euclideandistance)也稱歐幾里得距離,它是一個通 常采用的距離定義,它是在m維空間中兩個點之間的真實距離。在二維和三維空間中的歐 氏距離就是兩點之間的距離。
[0057] 二維的公式
[0058] d=sqrt((xl~x2)'2+(yl-y2)'2)
[0059] 三維的公式
[0060] d=sqrt((xl_x2)~2+(yl_y2)~2+(zl_z2)~2)
[0061] 推廣到n維空間,
[0062] 歐氏距離的公式
[0063] d=sqrt(E(xil_xi2) ~2)這里i= 1,2. ?n
[0064] Xil表示第一個點的第i維坐標,Xi2表示第二個點的第i維坐標,
[0065] n維歐氏空間是一個點集,它的每個點可以表示