本發(fā)明涉及城市人群建模技術(shù)領(lǐng)域,特別涉及一種人群移動規(guī)律的建模方法。
背景技術(shù):
近年來人類行為定量化分析,特別對行為模式的建模是當(dāng)前復(fù)雜性學(xué)科的研究熱點(diǎn)。人類行為的理解和探索對城市規(guī)劃、交通流化和信息推薦等方面有至關(guān)重要的作用。城市計算的目標(biāo)是使城市變得更加適宜居住,生活更加便捷。城市計算作為一個新興領(lǐng)域,為社會各種復(fù)雜現(xiàn)象提供了新的視角。在城市規(guī)劃、交通優(yōu)化和流行病等領(lǐng)域中,了解和認(rèn)識人類移動模式變得越來越重要。了解人們的目的地和出行工具反應(yīng)了人類行為和周圍建筑環(huán)境的關(guān)系,同時也為城市路線規(guī)劃、災(zāi)害預(yù)防等提供了參考依據(jù)。
由于手機(jī)用戶的爆發(fā)式增長,大量的高精度的手機(jī)基站數(shù)據(jù)使得人類移動行為建模變得更具可靠性,科研人員現(xiàn)在能夠以前所未有的角度研究人類移動行為。同時也有越來越多的研究者關(guān)注數(shù)據(jù)驅(qū)動人類移動模式的發(fā)展。同樣也有許多最新工作在研究軌跡數(shù)據(jù)的可視化分析,但是從城市數(shù)據(jù)中可視化挖掘移動行為模式仍具有挑戰(zhàn)性。
目前基于手機(jī)數(shù)據(jù)的工作在探索人類行為和移動模式上有了巨大的進(jìn)步。研究人員用了多種方法研究人類移動模式,包括統(tǒng)計力學(xué),信息論,移動模型,數(shù)據(jù)挖掘。
上述的這些方法都具有一定的效果,但當(dāng)前的研究都集中于挖掘大規(guī)模行動的統(tǒng)計規(guī)律,或者分析個體的移動軌跡數(shù)據(jù),仍缺少同時對人群軌跡、統(tǒng)計人群運(yùn)動規(guī)律和個體移動軌跡數(shù)據(jù)進(jìn)行建模分析的方法。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供了一種人群移動規(guī)律的建模方法,可以得到所有人的移動行為模式及其轉(zhuǎn)移的視圖,便于體現(xiàn)和觀察不同時間點(diǎn)上的移動行為模式以及移動行為模式間轉(zhuǎn)移的概率。
一種人群移動規(guī)律的建模方法,包括以下步驟:
(1)對每個用戶的軌跡按照移動行為的動態(tài)變化進(jìn)行劃分,將軌跡劃分為多個軌跡片段,每一個軌跡片段對應(yīng)描述一種行為;
(2)對步驟(1)中得到的軌跡片段集合進(jìn)行特征抽取,獲得用來刻畫軌跡片段的特征向量;
(3)將步驟(2)得到的所有用戶的所有軌跡片段的特征向量進(jìn)行聚類以將相似行為的軌跡片段組成一個移動行為模式;
(4)計算每個軌跡片段和各移動行為模式的相似性,得到描述軌跡片段屬于各個移動行為模式概率的移動模式描述向量;
(5)根據(jù)步驟(3)和步驟(4)計算得到的移動行為模式和移動模式描述向量,計算得到刻畫所有人的移動行為模式及其轉(zhuǎn)移的移動行為模式轉(zhuǎn)移圖,圖中的結(jié)點(diǎn)集合是不同時間點(diǎn)上的移動行為模式,邊集合是移動行為模式間轉(zhuǎn)移的概率。
軌跡片段可以分為停留軌跡片段和移動軌跡片段,為了方便計算,優(yōu)選的,步驟(1)中,將軌跡劃分為多個軌跡片段的具體過程如下:
定義用戶的軌跡R={r1,r2,...,rn},定義ri=(xi,yi,ti)是帶有時間戳的位置記錄;
檢測R={r1,r2,...,rn}中的停留軌跡片段,檢測方法如下:
從第一個記錄點(diǎn)向后掃描,當(dāng)滿足以下條件時一系列軌跡記錄點(diǎn)構(gòu)成停留軌跡片段條件為:
給定時間閾值τ和距離閾值δ,第一個記錄點(diǎn)的時間到最后一個記錄點(diǎn)的時間應(yīng)當(dāng)大于τ:第一個記錄點(diǎn)到任意一個記錄點(diǎn)的距離要小于δ;是最長的序列:
除了停留軌跡片段外其余屬于移動軌跡片段。
為了使本發(fā)明方法得到的移動行為模式轉(zhuǎn)移圖體現(xiàn)出更豐富的人的移動特性,優(yōu)選的,步驟(2)中,對于每個軌跡片段,提取以下特征中的至少一個,構(gòu)成至少三維的特征向量;
特征1:時間無關(guān)熵,描述了在不同地點(diǎn)被觀察到的概率,公式如下:
其中P(j)是用戶出現(xiàn)在地點(diǎn)j的概率,Ij是一個指示函數(shù),當(dāng)記錄點(diǎn)出現(xiàn)在地點(diǎn)j時,否則l是軌跡片段中記錄點(diǎn)的總數(shù);
特征2:時間相關(guān)熵,帶有所停留的時間影響的用戶出現(xiàn)在不同地點(diǎn)的概率,公式如下:
提取了記錄點(diǎn)兩端軌跡片段的平均時間作為當(dāng)前記錄點(diǎn)的停留時間
特征3:中心位置,是軌跡片段的地理中心經(jīng)緯度坐標(biāo),公式如下:
特征4:回轉(zhuǎn)半徑,描述了用戶移動軌跡的范圍大小,公式如下:
特征5:家庭位置,是一個用戶可能的家庭住址,通過用戶在0:00am到6:00am的軌跡位置計算得到,公式如下:
特征6:活動半徑,是用戶離家的平均距離,公式如下:
其中dis(x,y)是x和y之間的歐式距離;
特征7:平均速度,是軌跡片段中用戶移動的平均速度;
特征8:活動距離,是軌跡片段總體移動距離,公式如下:
為了便于計算和提高計算效率,優(yōu)選的,將軌跡片段用移動行為模式描述向量來表達(dá)的具體步驟如下:
通過對所有用戶的所有軌跡片段的特征向量的K-means聚類,得到Km個聚類移動行為模式及他們的聚類中心
為了便于計算,提高計算效率和描述的準(zhǔn)確性,優(yōu)選的,計算每個軌跡片段和各移動行為模式的相似性,得到描述軌跡片段屬于各個移動行為模式概率的移動模式描述向量的具體過程如下:
對于每個軌跡片段,計算和Km個移動行為模式的相似性,得到描述軌跡片段屬于各個移動行為模式概率的移動模式描述向量其中f(x)是一個高斯權(quán)重函數(shù),c是中心,w是高斯核的寬度。
為了更好地分析數(shù)據(jù),優(yōu)選的,步驟(5)中:計算得到移動行為模式轉(zhuǎn)移圖的具體過程如下:
圖中的結(jié)點(diǎn)集合V是不同時間點(diǎn)上的移動行為模式,通過對軌跡片段的均勻重采樣,可以得到在時間點(diǎn)ti上屬于第j個移動行為模式的軌跡片段的數(shù)目,作為結(jié)點(diǎn)的大?。?/p>
其中,是一個指示函數(shù),當(dāng)時間點(diǎn)ti在軌跡片段Fk的時間間隔中且軌跡片段Fk屬于第j個移動行為模式時,否則
利用動態(tài)貝葉斯網(wǎng)絡(luò)對移動行為模式的轉(zhuǎn)移進(jìn)行建模,通過求解以下方程,得到任意時刻的轉(zhuǎn)移概率,構(gòu)成圖中的邊集合E:
其中d代表轉(zhuǎn)移矩陣的第d行;
轉(zhuǎn)移矩陣中的每一個元素代表結(jié)點(diǎn)中軌跡片段轉(zhuǎn)移到結(jié)點(diǎn)中軌跡片段的概率;
L是總?cè)藬?shù),L1是每個人的軌跡片段數(shù)目;
λ是控制轉(zhuǎn)移矩陣系數(shù)度的參數(shù);
是權(quán)重系數(shù):
其中h是高斯分布的方差。
使用動態(tài)貝葉斯網(wǎng)絡(luò)從大規(guī)模軌跡數(shù)據(jù)中挖掘移動行為轉(zhuǎn)移規(guī)律,解決了傳統(tǒng)方法不能很好地分析大規(guī)模軌跡數(shù)據(jù)的問題。
本發(fā)明的有益效果:
本發(fā)明的人群移動規(guī)律的建模方法,可以在多個角度和尺度上分析軌跡數(shù)據(jù),不僅提供了分析群體移動規(guī)律的移動行為模式轉(zhuǎn)移圖,同時還可以基于個人分析移動行為模式隨時間的演化。
附圖說明
圖1為本發(fā)明的人群移動規(guī)律的建模方法的流程示意圖。
具體實(shí)施方式
結(jié)合附圖1,挖掘人群移動規(guī)律的建模方法,具體步驟如下:
1)對一個用戶的軌跡R按照移動行為的動態(tài)變化進(jìn)行劃分,一條軌跡會被劃分為多個軌跡片段:每一個軌跡片段描述了某種行為;
軌跡分割方法如下:
對一個用戶的軌跡R={r1,r2,...,rn},ri=(xi,yi,ti)是一個有時間戳的位置記錄。軌跡方法首先檢測停留軌跡片段,其余屬于移動軌跡片段。從第一個記錄點(diǎn)向后掃描,當(dāng)滿足以下條件時一系列軌跡記錄點(diǎn)構(gòu)成停留軌跡片段給定時間閾值τ和距離閾值δ,第一個記錄點(diǎn)到最后一個記錄點(diǎn)的時間應(yīng)當(dāng)大于τ:第一個記錄點(diǎn)到任意一個記錄點(diǎn)的距離要小于δ;是最長的序列:
2)在對軌跡片段聚類前,需要對軌跡片段集合進(jìn)行自定義的特征抽取,獲得一個用來刻畫軌跡片段的特征向量Fi;
特征選擇的方法如下:
對于軌跡片段提取以下8個特征構(gòu)成10維特征向量:
2-1時間無關(guān)熵描述了在不同地點(diǎn)被觀察到的概率:
其中P(j)是用戶出現(xiàn)在地點(diǎn)j的概率,Ij是一個指示函數(shù),當(dāng)記錄點(diǎn)出現(xiàn)在地點(diǎn)j時,否則l是軌跡片段中記錄點(diǎn)的總數(shù)。
2-2類似于特征2-1,時間相關(guān)熵考慮到用戶出現(xiàn)在地點(diǎn)j的概率與所停留的時間也有關(guān):
2-3中心位置n是軌跡片段的地理中心經(jīng)緯度坐標(biāo):
2-4回轉(zhuǎn)半徑描述了用戶移動軌跡的范圍大?。?/p>
2-5家庭位置是一個用戶可能的家庭住址,通過用戶在0:00am到6:00am的軌跡位置計算得到:
2-6活動半徑是用戶離家的平均距離:
其中dis(x,y)是x和y之間的歐式距離。
2-7平均速度是軌跡片段中用戶移動的平均速度。
2-8活動距離是軌跡片段總體移動距離:
軌跡片段的特征向量Fi由上述8個特征組成:Fi=(Sunc,Stc,CLx,CLy,rg,RLx,CLy,ra,savg,ma)。
3)利用K-means算法把所有用戶的所有軌跡片段的特征向量進(jìn)行聚類,把相似行為的軌跡片段組成一個移動行為模式,最終得到Km個移動行為模式。通過計算每個軌跡片段和Km個移動行為模式的相似性,得到描述軌跡片段屬于各個移動行為模式概率的移動模式描述向量;
計算方法將軌跡片段用移動行為模式描述向量來表達(dá):
通過對所有用戶的所有軌跡片段的特征向量的K-means聚類,得到Km個聚類移動行為模式及他們的聚類中心
對于每個軌跡片段,計算和Km個移動行為模式的相似性,得到描述軌跡片段屬于各個移動行為模式概率的移動模式描述向量其中f(x)是一個高斯權(quán)重函數(shù),c是中心,w是高斯核的寬度。
4)針對步驟3)中計算得到的移動行為模式和移動模式描述向量,可以采用一個移動行為模式轉(zhuǎn)移圖G=(V,E)來刻畫所有人的移動行為模式及其轉(zhuǎn)移。移動行為模式轉(zhuǎn)移圖中的結(jié)點(diǎn)集合V是不同時間點(diǎn)上的移動行為模式,邊集合E表示移動行為模式間轉(zhuǎn)移的概率,通過動態(tài)貝葉斯網(wǎng)絡(luò)計算得到轉(zhuǎn)移概率;
構(gòu)造移動行為模式轉(zhuǎn)移圖G=(V,E)的方法:
移動行為模式轉(zhuǎn)移圖中的結(jié)點(diǎn)集合V是不同時間點(diǎn)上的移動行為模式,通過對軌跡片段的均勻重采樣,可以得到在時間點(diǎn)ti上屬于第j個移動行為模式的軌跡片段的數(shù)目,作為結(jié)點(diǎn)的大小:
其中,是一個指示函數(shù),當(dāng)時間點(diǎn)ti在軌跡片段Fk的時間間隔中且軌跡片段Fk屬于第j個移動行為模式時,否則
利用動態(tài)貝葉斯網(wǎng)絡(luò)對移動行為模式的轉(zhuǎn)移進(jìn)行建模,通過求解一下方程,得到任意時刻的轉(zhuǎn)移概率,構(gòu)成邊集合E:
其中d代表轉(zhuǎn)移矩陣的第d行,轉(zhuǎn)移矩陣中的每一個元素代表結(jié)點(diǎn)中軌跡片段轉(zhuǎn)移到結(jié)點(diǎn)中軌跡片段的概率,L是總?cè)藬?shù),L1是每個人的軌跡片段數(shù)目,λ是控制轉(zhuǎn)移矩陣系數(shù)度的參數(shù)。是權(quán)重系數(shù),當(dāng)移動行為模式的轉(zhuǎn)移發(fā)生的時間越靠近正在計算的時間t權(quán)重越高:
其中h是高斯分布的方差。
本實(shí)施例的人群移動規(guī)律的可視化方法,與傳統(tǒng)軌跡數(shù)據(jù)研究方法相比具有兩個主要優(yōu)點(diǎn):第一,首先使用聚類將軌跡抽象為數(shù)目較少易于理解的移動行為模式,然后使用動態(tài)貝葉斯網(wǎng)絡(luò)從大規(guī)模軌跡數(shù)據(jù)中挖掘移動行為轉(zhuǎn)移規(guī)律,解決了傳統(tǒng)方法不能很好地分析大規(guī)模軌跡數(shù)據(jù)的問題。第二,本文所提出的方法可以在多個尺度上分析軌跡數(shù)據(jù),不僅提供了分析群體移動規(guī)律的移動行為模式轉(zhuǎn)移圖,同時還可以基于個人分析移動行為模式隨時間的演化。