1.一種融合個(gè)體與近鄰移動(dòng)規(guī)律的位置預(yù)測(cè)方法,其特征在于,包括以下步驟:
(1)、用戶移動(dòng)數(shù)據(jù)收集與整理清洗
收集用戶移動(dòng)數(shù)據(jù),根據(jù)分析需求對(duì)用戶移動(dòng)數(shù)據(jù)進(jìn)行整理清洗,采用相關(guān)的關(guān)鍵地點(diǎn)信息提取技術(shù)(即POI,Point of Interest發(fā)現(xiàn)及提取)對(duì)隱藏在用戶移動(dòng)數(shù)據(jù)中重要(關(guān)鍵)地點(diǎn)的位置信息進(jìn)行提取,并獲取對(duì)應(yīng)位置的時(shí)間分布信息,得到用戶軌跡數(shù)據(jù);
(2)、K近鄰發(fā)現(xiàn)
將每個(gè)用戶的軌跡數(shù)據(jù)映射為一個(gè)帶時(shí)空特征的網(wǎng)絡(luò)即用戶軌跡網(wǎng)絡(luò),對(duì)需要進(jìn)行位置預(yù)測(cè)的用戶即預(yù)測(cè)用戶,將其用戶軌跡網(wǎng)絡(luò)與其他用戶軌跡網(wǎng)絡(luò)進(jìn)行相似度度量,找到相似度最大的K個(gè)用戶,這K個(gè)用戶為預(yù)測(cè)用戶的K個(gè)近鄰;
對(duì)K個(gè)近鄰的相似度進(jìn)行歸一化處理,并作為K個(gè)近鄰對(duì)預(yù)測(cè)用戶的影響權(quán)值:
其中,Sk為K個(gè)近鄰中第k個(gè)的相似度,wk為對(duì)應(yīng)的影響權(quán)值;
(3)、位置移動(dòng)模式確定
對(duì)于預(yù)測(cè)用戶,在時(shí)間段T內(nèi),從位置A到位置B后所有可能到達(dá)的位置為Ci,則三個(gè)連續(xù)位置即位置A、位置B以及Ci構(gòu)成一個(gè)位置移動(dòng)模式<A-B-Ci,T>;其中,i為可能到達(dá)的位置序號(hào),i=1,2,…,I,I為所有可能到達(dá)位置的數(shù)量;
(4)、用戶位置預(yù)測(cè)
在預(yù)測(cè)用戶的K個(gè)近鄰中,對(duì)于每個(gè)近鄰,在其歷史用戶軌跡數(shù)據(jù)找到位置移動(dòng)模式<A-B-Ci,T>,并計(jì)算該位置移動(dòng)模式發(fā)生的可能性NPrk<A-B-Ci,T>,則預(yù)測(cè)用戶到達(dá)第i個(gè)位置的可能性為:
其中,Pr(<A-B-Ci,T>)為預(yù)測(cè)用戶在時(shí)間段T內(nèi),從位置A到位置B后到達(dá)的位置Ci的可能性,UPr(<A-B-Ci,T>)為預(yù)測(cè)用戶歷史用戶軌跡數(shù)據(jù)中位置移動(dòng)模式<A-B-Ci,T>發(fā)生的可能性。
2.根據(jù)權(quán)利要求1所述的位置預(yù)測(cè)方法,其特征在于,步驟(2)中,所述將其用戶軌跡網(wǎng)絡(luò)與其他用戶軌跡網(wǎng)絡(luò)進(jìn)行相似度度量為:
2.1)、預(yù)測(cè)用戶的用戶軌跡數(shù)據(jù)為第m條,表示為L(zhǎng)(m),其他與之進(jìn)行相似度度量的用戶的用戶軌跡數(shù)據(jù)為第n條,表示為L(zhǎng)(n),兩個(gè)用戶(預(yù)測(cè)用戶與之進(jìn)行相似度度量的用戶)軌跡網(wǎng)絡(luò)到達(dá)節(jié)點(diǎn)的空間距離Diss(m,n)in為:
其中為預(yù)測(cè)用戶的用戶軌跡數(shù)據(jù)中到達(dá)第q個(gè)位置的概率,為到達(dá)第q個(gè)位置的次數(shù),表示預(yù)測(cè)用戶的用戶軌跡數(shù)據(jù)中所有位置到達(dá)次數(shù)之和;為與預(yù)測(cè)用戶進(jìn)行相似度度量的用戶軌跡數(shù)據(jù)中到達(dá)第q個(gè)位置的概率,為到達(dá)第q個(gè)位置的次數(shù),表示與預(yù)測(cè)用戶進(jìn)行相似度度量的用戶軌跡數(shù)據(jù)中所有位置到達(dá)次數(shù)之和;表示位置q屬于預(yù)測(cè)用戶的用戶軌跡數(shù)據(jù)或其他與之進(jìn)行相似度度量用戶的用戶軌跡數(shù)據(jù)中的一個(gè)位置,并且其中的
表示所有屬于兩個(gè)用戶軌跡數(shù)據(jù)中位置上到達(dá)概率乘積的平方根之和;
同理,可以得到兩個(gè)用戶(預(yù)測(cè)用戶與之進(jìn)行相似度度量的用戶)軌跡網(wǎng)絡(luò)離開(kāi)節(jié)點(diǎn)的空間距離Diss(m,n)out;
2.2)、兩個(gè)用戶(預(yù)測(cè)用戶與之進(jìn)行相似度度量的用戶)軌跡網(wǎng)絡(luò)到達(dá)節(jié)點(diǎn)的時(shí)間距離Dist(m,n)in可表示為:
其中,N為兩個(gè)用戶(預(yù)測(cè)用戶與之進(jìn)行相似度度量的用戶)軌跡網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)量,為預(yù)測(cè)用戶的用戶軌跡數(shù)據(jù)中到達(dá)第q個(gè)位置的時(shí)間出現(xiàn)在第h位置時(shí)間段內(nèi)的概率,為與預(yù)測(cè)用戶進(jìn)行相似度度量用戶的用戶軌跡數(shù)據(jù)中到達(dá)第q個(gè)位置的時(shí)間出現(xiàn)在第h位置時(shí)間段內(nèi)的概率;
并且其中的
表示兩個(gè)用戶軌跡數(shù)據(jù)中所有H個(gè)位置時(shí)間段到達(dá)第q個(gè)位置的出現(xiàn)在各個(gè)位置時(shí)間段內(nèi)的概率乘積的平方根之和;
同理,可以得到得到兩個(gè)用戶(預(yù)測(cè)用戶與之進(jìn)行相似度度量的用戶)軌跡網(wǎng)絡(luò)離開(kāi)節(jié)點(diǎn)的的時(shí)間距離Dist(m,n)out可表示為:
其中為預(yù)測(cè)用戶的用戶軌跡數(shù)據(jù)中離開(kāi)第q個(gè)位置的時(shí)間出現(xiàn)在第h位置時(shí)間段內(nèi)的概率,為與預(yù)測(cè)用戶進(jìn)行相似度度量用戶的用戶軌跡數(shù)據(jù)中離開(kāi)第q個(gè)位置的時(shí)間出現(xiàn)在第h位置時(shí)間段內(nèi)的概率;
并且其中的
表示兩個(gè)用戶軌跡數(shù)據(jù)中所有H個(gè)位置時(shí)間段離開(kāi)第q個(gè)位置出現(xiàn)在各個(gè)位置時(shí)間段內(nèi)的概率乘積的平方根之和;
則到達(dá)節(jié)點(diǎn)的時(shí)空分布度量為Diss(m,n)in與Dist(m,n)in的積:
Dis(m,n)in=Diss(m,n)in×Dist(m,n)in
離開(kāi)節(jié)點(diǎn)的時(shí)空分布度量方法與到達(dá)對(duì)應(yīng)節(jié)點(diǎn)的時(shí)空分布度量方法相同,為Dis(m,n)out=Diss(m,n)out×Dist(m,n)out;
2.3)、兩個(gè)用戶(預(yù)測(cè)用戶與之進(jìn)行相似度度量的用戶)軌跡網(wǎng)絡(luò)的距離Dis(m,n)最終由上述兩部分距離共同決定,即:
Dis(m,n)=Dis(m,n)in+Dis(m,n)out
兩個(gè)用戶(預(yù)測(cè)用戶與之進(jìn)行相似度度量的用戶)軌跡網(wǎng)絡(luò)的相似度S(m,n)可以簡(jiǎn)單地由Dis(m,n)得到:
S(m,n)=e-Dis(m,n)。