一種基于無線網(wǎng)絡(luò)的用戶位置預(yù)測系統(tǒng)和方法
【專利摘要】一種基于無線網(wǎng)絡(luò)的用戶位置預(yù)測系統(tǒng),包括移動數(shù)據(jù)獲取模塊、移動數(shù)據(jù)清洗模塊、用戶歷史移動記錄模塊、混合位置預(yù)測模塊,混合位置預(yù)測模塊設(shè)置有停留假設(shè)預(yù)測子模塊、基于時段劃分的歷史預(yù)測子模塊、跳轉(zhuǎn)預(yù)測子模塊、協(xié)同過濾預(yù)測子模塊和預(yù)測結(jié)果子模塊,預(yù)測結(jié)果子模塊根據(jù)停留假設(shè)預(yù)測子模塊、基于時段劃分的歷史預(yù)測子模塊、跳轉(zhuǎn)預(yù)測子模塊和協(xié)同過濾預(yù)測子模塊的預(yù)測結(jié)果,完成用戶位置預(yù)測。本發(fā)明還提供一種基于無線網(wǎng)絡(luò)的用戶位置預(yù)測方法。本發(fā)明的系統(tǒng)和方法具有提供24小時內(nèi)實時位置預(yù)測且預(yù)測結(jié)果準(zhǔn)確度高的優(yōu)點(diǎn)。
【專利說明】—種基于無線網(wǎng)絡(luò)的用戶位置預(yù)測系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種基于無線網(wǎng)絡(luò)的用戶位置預(yù)測系統(tǒng)和方法,尤其是在移動通信領(lǐng)域中通過移動通信網(wǎng)用戶無線上網(wǎng)數(shù)據(jù)來挖掘用戶移動行為特征,做出用戶未來24小時的動態(tài)位置預(yù)測,并能隨時根據(jù)新數(shù)據(jù)的變化,實時動態(tài)修改預(yù)測結(jié)果的系統(tǒng)和方法。
【背景技術(shù)】
[0002]位置預(yù)測,已有很多相關(guān)的研究在進(jìn)行,大部分使用GPS數(shù)據(jù)或者結(jié)合藍(lán)牙等進(jìn)行室內(nèi)的定位。位置預(yù)測的方法有通過時序進(jìn)行預(yù)測,還有的將地點(diǎn)試圖做分類處理然后進(jìn)行預(yù)測,有些采用神經(jīng)網(wǎng)絡(luò)的方法來做預(yù)測。但是,針對實時二十四小時或更長時間的位置預(yù)測,暫時還沒有被考慮。
[0003]現(xiàn)有技術(shù)中提出的一些對移動終端的位置進(jìn)行預(yù)測/估計的方法有:
[0004]中國申請?zhí)枮镃N200810118092.8的“預(yù)測移動終端位置的方法及裝置”,該發(fā)明公開了一種預(yù)測移動終端位置的方法,包括在依次間隔相同時間長度的第一時間點(diǎn)、第二時間點(diǎn)、第三時間點(diǎn)上,分別獲得移動終端所處第一位置、第二位置、第三位置的坐標(biāo)信息,根據(jù)獲得的移動終端所處的第一位置、第二位置、第三位置的坐標(biāo)值,確定與第三時間點(diǎn)間隔所述時間長度的第四時間點(diǎn)上,移動終端所處的第四位置的位置信息。同時,該發(fā)明還公開了一種預(yù)測移動終端位置的裝置。該發(fā)明預(yù)測方案過于簡單,預(yù)測結(jié)果只依賴于前三個位置的坐標(biāo)信息,只要用戶改變移動計劃,預(yù)測結(jié)果就會與現(xiàn)實情況產(chǎn)生巨大偏差,穩(wěn)定性差。
[0005]本發(fā)明的目的在于建立用戶實時二十四小時的位置預(yù)測,結(jié)合用戶的歷史移動行為進(jìn)行分析,預(yù)測其訪問各個地點(diǎn)的可能性,做出最大可能訪問的地點(diǎn)預(yù)測。
【發(fā)明內(nèi)容】
[0006]為了解決上面提出的問題,本發(fā)明提供了一種用戶位置預(yù)測的系統(tǒng),具有提供24小時內(nèi)實時位置預(yù)測且預(yù)測結(jié)果準(zhǔn)確度高的優(yōu)點(diǎn)。
[0007]根據(jù)本發(fā)明的一個方面,提供一種基于無線網(wǎng)絡(luò)的用戶位置預(yù)測系統(tǒng),包括移動數(shù)據(jù)獲取模塊、移動數(shù)據(jù)清洗模塊、用戶歷史移動記錄模塊、混合位置預(yù)測模塊,其中:移動數(shù)據(jù)獲取模塊用于從移動通信網(wǎng)中獲取的用戶數(shù)據(jù)識別地點(diǎn)字段,并將其提取出來,構(gòu)建成為用戶移動數(shù)據(jù),所述用戶數(shù)據(jù)包括該用戶的標(biāo)志字段、地點(diǎn)的標(biāo)志字段、處于該地點(diǎn)的時間字段;移動數(shù)據(jù)清洗模塊用于對獲取到的用戶移動數(shù)據(jù)進(jìn)行清洗處理,輸出一個已處理的用戶移動數(shù)據(jù)信息;用戶歷史移動記錄模塊將用戶新出現(xiàn)的訪問記錄及時更新到用戶歷史移動訪問數(shù)據(jù)庫中,用戶歷史移動訪問數(shù)據(jù)庫的每條記錄包括用戶標(biāo)志字段、地點(diǎn)訪問字段,地點(diǎn)訪問時間等字段;混合位置預(yù)測模塊設(shè)置有停留假設(shè)預(yù)測子模塊、基于時段劃分的歷史預(yù)測子模塊、跳轉(zhuǎn)預(yù)測子模塊、協(xié)同過濾預(yù)測子模塊和預(yù)測結(jié)果子模塊,停留假設(shè)預(yù)測子模塊,根據(jù)停留假設(shè),假設(shè)用戶每次都選擇停留在上一時刻所在的地點(diǎn),從而完成預(yù)測,基于時段劃分的歷史預(yù)測子模塊,基于用戶地點(diǎn)訪問的時間統(tǒng)計規(guī)律,返回用戶在當(dāng)前時段劃分情況下訪問不同地點(diǎn)的概率,根據(jù)得到的概率向量,概率最大值對應(yīng)的地點(diǎn)將有可能是下一時段會訪問的地點(diǎn),跳轉(zhuǎn)預(yù)測子模塊,生成一階馬爾科夫跳轉(zhuǎn)概率矩陣,其中只保留用戶軌跡當(dāng)中的訪問地點(diǎn)跳轉(zhuǎn)的數(shù)據(jù),而忽略那些停留的數(shù)據(jù),體現(xiàn)用戶移動過程中的地點(diǎn)跳轉(zhuǎn)情況,協(xié)同過濾預(yù)測子模塊,根據(jù)用戶之間的相似度,篩選出相似度大于某一閾值的相似度用戶群,統(tǒng)計該用戶群體的移動行為特征,返回這個群體在該時段下的訪問各個地點(diǎn)的整合概率,作為最終返回的預(yù)測結(jié)果,預(yù)測結(jié)果子模塊,根據(jù)停留假設(shè)預(yù)測子模塊、基于時段劃分的歷史預(yù)測子模塊、跳轉(zhuǎn)預(yù)測子模塊和協(xié)同過濾預(yù)測子模塊的預(yù)測結(jié)果,完成用戶位置預(yù)測。
[0008]進(jìn)一步,用戶歷史移動記錄模塊還更新基于時段的用戶地點(diǎn)訪問次數(shù)以及更新基于用戶歷史移動訪問數(shù)據(jù)庫中的用戶跳轉(zhuǎn)矩陣,基于時段的用戶地點(diǎn)訪問次數(shù)是在特定時
間段內(nèi)用戶對不同地點(diǎn)的不同訪問次數(shù)——向量,通過這個向量,確定用戶在特定時間段內(nèi)在某處的可能性大小.,
【權(quán)利要求】
1.一種基于無線網(wǎng)絡(luò)的用戶位置預(yù)測系統(tǒng),其特征在于:包括移動數(shù)據(jù)獲取模塊、移動數(shù)據(jù)清洗模塊、用戶歷史移動記錄模塊、混合位置預(yù)測模塊,其中: 移動數(shù)據(jù)獲取模塊用于從移動通信網(wǎng)中獲取的用戶數(shù)據(jù)識別地點(diǎn)字段,并將其提取出來,構(gòu)建成為用戶移動數(shù)據(jù),所述用戶數(shù)據(jù)包括該用戶的標(biāo)志字段、地點(diǎn)的標(biāo)志字段、處于該地點(diǎn)的時間字段; 移動數(shù)據(jù)清洗模塊用于對獲取到的用戶移動數(shù)據(jù)進(jìn)行清洗處理,輸出一個已處理的用戶移動數(shù)據(jù)信息; 用戶歷史移動記錄模塊將用戶新出現(xiàn)的訪問記錄及時更新到用戶歷史移動訪問數(shù)據(jù)庫中,用戶歷史移動訪問數(shù)據(jù)庫的每條記錄包括用戶標(biāo)志字段、地點(diǎn)訪問字段,地點(diǎn)訪問時間等字段; 混合位置預(yù)測模塊設(shè)置有停留假設(shè)預(yù)測子模塊、基于時段劃分的歷史預(yù)測子模塊、跳轉(zhuǎn)預(yù)測子模塊、協(xié)同過濾預(yù)測子模塊和預(yù)測結(jié)果子模塊, 停留假設(shè)預(yù)測子模塊,根據(jù)停留假設(shè),假設(shè)用戶每次都選擇停留在上一時刻所在的地點(diǎn),從而完成預(yù)測, 基于時段劃分的歷史預(yù)測子模塊,基于用戶地點(diǎn)訪問的時間統(tǒng)計規(guī)律,返回用戶在當(dāng)前時段劃分情況下訪問不同地點(diǎn)的概率,根據(jù)得到的概率向量,概率最大值對應(yīng)的地點(diǎn)將有可能是下一時段會訪問的地點(diǎn), 跳轉(zhuǎn)預(yù)測子模塊,生成一階馬爾科夫跳轉(zhuǎn)概率矩陣,其中只保留用戶軌跡當(dāng)中的訪問地點(diǎn)跳轉(zhuǎn)的數(shù)據(jù),而忽略那些停留的數(shù)據(jù),體現(xiàn)用戶移動過程中的地點(diǎn)跳轉(zhuǎn)情況, 協(xié)同過濾預(yù)測子模塊,根據(jù)用戶之間的相似度,篩選出相似度大于某一閾值的相似度用戶群,統(tǒng)計該用戶群體的移動行為特征,返回這個群體在該時段下的訪問各個地點(diǎn)的整合概率,作為最終返 回的預(yù)測結(jié)果, 預(yù)測結(jié)果子模塊,根據(jù)停留假設(shè)預(yù)測子模塊、基于時段劃分的歷史預(yù)測子模塊、跳轉(zhuǎn)預(yù)測子模塊和協(xié)同過濾預(yù)測子模塊的預(yù)測結(jié)果,完成用戶位置預(yù)測。
2.如權(quán)利要求1所述的基于無線網(wǎng)絡(luò)的用戶位置預(yù)測系統(tǒng),其特征在于:停留假設(shè)預(yù)測子模塊在經(jīng)過時間間隔At之后預(yù)測所處的地點(diǎn)為Lsi (t+At) =Li(t), 其中Li (t)表示用戶i在t時間所處的地點(diǎn),為向量形式,所處的地點(diǎn)值為1,其余都為O,Lti (t+At)表示用戶i在t+At使用該預(yù)測方法得到的訪問地點(diǎn)的概率結(jié)果為pi ——(0,0,0,...,0,IjO,...,0)。
3.如權(quán)利要求2所述的基于無線網(wǎng)絡(luò)的用戶位置預(yù)測系統(tǒng),其特征在于:該停留假設(shè)發(fā)生的可能性是一個與間隔時間At有關(guān)的函數(shù)
4.如權(quán)利要求1所述的基于無線網(wǎng)絡(luò)的用戶位置預(yù)測系統(tǒng),其特征在于:基于時段劃分的歷史預(yù)測子模塊將一周劃分成七天,一天劃分成24小時的時段,根據(jù)得到的概率向量,概率最大值對應(yīng)的地點(diǎn)將是下一小時會訪問的地點(diǎn)Lti (t+Δ t) = Fi ( τ P τ 2), 其中 τ i e {1,2,3,4,5,6,7]表示一周的七天,τ2 e {0,1,2,3,4,...,22,23]表示一天的24小時,Fi ( τ j, τ 2)表示基于當(dāng)前(T1, τ 2)在t+Δ t對應(yīng)的時段下該用戶對全部去過的地點(diǎn)的歷史訪問概率,Lti(t+At)表示用戶i在t+At使用該預(yù)測方法得到的訪問地點(diǎn)的概率結(jié)果為:
5.如權(quán)利要求1所述的基于無線網(wǎng)絡(luò)的用戶位置預(yù)測系統(tǒng),其特征在于:跳轉(zhuǎn)預(yù)測子模塊根據(jù)馬爾科夫跳轉(zhuǎn)矩陣,基于起始地點(diǎn),得到該起始地點(diǎn)跳往其他地點(diǎn)的概率,作為用戶對于每個地點(diǎn)的不同的訪問概率預(yù)測結(jié)果:
6.如權(quán)利要求5所述的基于無線網(wǎng)絡(luò)的用戶位置預(yù)測系統(tǒng),其特征在于:跳轉(zhuǎn)是基于用戶會發(fā)生跳轉(zhuǎn)的假設(shè)進(jìn)行的,而跳轉(zhuǎn)假設(shè)實現(xiàn)的概率%(機(jī)跟間隔時間Λ t、跳轉(zhuǎn)地點(diǎn)與當(dāng)前地點(diǎn)的距離Ad相關(guān),
d“—max = v*At
7.如權(quán)利要求1所述的基于無線網(wǎng)絡(luò)的用戶位置預(yù)測系統(tǒng),其特征在于:協(xié)同過濾預(yù)測子模塊采用余弦相似度計算方法計算用戶相似度:
8.如權(quán)利要求7所述的基于無線網(wǎng)絡(luò)的用戶位置預(yù)測系統(tǒng),其特征在于:協(xié)同過濾預(yù)測子模塊還包括用戶相似度更新模塊, 用戶相似度更新模塊用于從用戶歷史移動訪問數(shù)據(jù)庫中讀取全體用戶的歷史移動訪問記錄,每隔一定周期重新計算系統(tǒng)內(nèi)全部用戶間彼此的移動行為的相似度,然后將計算后的新結(jié)果更新到用戶相似度數(shù)據(jù)庫。
9.一種基于無線網(wǎng)絡(luò)的用戶位置預(yù)測方法,其特征在于:包括以下步驟: 步驟一,從移動通信網(wǎng)中獲取的用戶數(shù)據(jù)識別地點(diǎn)字段,并將其提取出來,構(gòu)建成為用戶移動數(shù)據(jù),所述用戶數(shù)據(jù)包括該用戶的標(biāo)志字段、地點(diǎn)的標(biāo)志字段、處于該地點(diǎn)的時間字段; 步驟二,對獲取到的用戶移動數(shù)據(jù)進(jìn)行清洗處理,輸出一個已處理的用戶移動數(shù)據(jù)信息; 步驟三,將用戶移動數(shù)據(jù) 信息中新出現(xiàn)的用戶訪問記錄及時更新到用戶歷史移動訪問數(shù)據(jù)庫中,用戶歷史移動訪問數(shù)據(jù)庫的每條記錄包括用戶標(biāo)志字段、地點(diǎn)訪問字段,地點(diǎn)訪問時間等字段; 步驟四,根據(jù)停留假設(shè)預(yù)測、基于時段劃分的歷史預(yù)測、跳轉(zhuǎn)預(yù)測和協(xié)同過濾預(yù)測的預(yù)測結(jié)果,完成用戶位置預(yù)測, 其中: 停留假設(shè)預(yù)測,根據(jù)停留假設(shè),假設(shè)用戶每次都選擇停留在上一時刻所在的地點(diǎn),從而完成預(yù)測, 基于時段劃分的歷史預(yù)測,基于用戶地點(diǎn)訪問的時間統(tǒng)計規(guī)律,返回用戶在當(dāng)前時段劃分情況下訪問不同地點(diǎn)的概率,根據(jù)得到的概率向量,概率最大值對應(yīng)的地點(diǎn)將有可能是下一時段會訪問的地點(diǎn), 跳轉(zhuǎn)預(yù)測,生成一階馬爾科夫跳轉(zhuǎn)概率矩陣,其中只保留用戶軌跡當(dāng)中的訪問地點(diǎn)跳轉(zhuǎn)的數(shù)據(jù),而忽略那些停留的數(shù)據(jù),體現(xiàn)用戶移動過程中的地點(diǎn)跳轉(zhuǎn)情況, 協(xié)同過濾預(yù)測,根據(jù)用戶之間的相似度,篩選出相似度大于某一閾值的相似度用戶群,統(tǒng)計該用戶群體的移動行為特征,返回這個群體在該時段下的訪問各個地點(diǎn)的整合概率,作為最終返回的預(yù)測結(jié)果。
10.如權(quán)利要求9所述的基于無線網(wǎng)絡(luò)的用戶位置預(yù)測方法,其特征在于:步驟四中的基于時段劃分的歷史預(yù)測將一周劃分成七天,一天劃分成24小時的時段,根據(jù)得到的概率向量,概率最大值對應(yīng)的地點(diǎn)將是下一小時會訪問的地點(diǎn)Lti (t+At) = Fi( τ j, τ 2), 其中 τ i e [1,2,3,4,5,6,7]表示一周的七天,τ2 e [0,1,2,3,4,...,22,23]表示一天的24小時,Fi ( τ j, τ 2)表示基于當(dāng)前(T1, τ 2)在t+Δ t對應(yīng)的時段下該用戶對全部去過的地點(diǎn)的歷史訪問概率,Lti(t+At)表示用戶i在t+At使用該預(yù)測方法得到的訪問地點(diǎn)的概率結(jié)果為:
【文檔編號】H04W64/00GK103747523SQ201410015061
【公開日】2014年4月23日 申請日期:2014年1月14日 優(yōu)先權(quán)日:2014年1月14日
【發(fā)明者】劉臻, 盧揚(yáng), 韓筱璞, 周濤, 黃盼華, 呂琳媛, 劉潤然, 李輝 申請人:上海河廣信息科技有限公司