本發(fā)明屬于城市規(guī)劃管理技術(shù)領(lǐng)域,具體涉及一種基于移動網(wǎng)絡(luò)數(shù)據(jù)的人員出行鏈識別方法。
背景技術(shù):
近年來,隨著GPS導(dǎo)航儀和智能手機(jī)為代表的智能終端的普及與應(yīng)用,人們已經(jīng)可以以相對低廉的代價(jià)獲得大量用戶的位置數(shù)據(jù),這些數(shù)據(jù)的背后,隱含豐富的用戶行為規(guī)律信息,本專利通過對這些信息的深入挖掘和利用,闡述一種基于移動網(wǎng)絡(luò)數(shù)據(jù)的人員出行鏈識別方法,不僅有可能發(fā)現(xiàn)個(gè)體用戶的日常行為規(guī)律和群體用戶的共性行為特征,還可以掌握社交關(guān)系信息,這對于智能交通、廣告投送、面向企業(yè)的商業(yè)合作應(yīng)用服務(wù)具有重要意義,為交通規(guī)劃工作提供相關(guān)數(shù)據(jù),并具有比傳統(tǒng)交通調(diào)查方法更低的成本和更短的數(shù)據(jù)更新周期。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是根據(jù)上述現(xiàn)有技術(shù)的不足之處,提供一種基于移動網(wǎng)絡(luò)數(shù)據(jù)的人員出行鏈識別方法,該識別方法根據(jù)手機(jī)用戶的移動網(wǎng)絡(luò)數(shù)據(jù),采用DBSCAN空間聚類方法對移動網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行空間聚類分簇;根據(jù)時(shí)間相鄰不同聚類點(diǎn)間的速度排除異常數(shù)據(jù),得到篩選后的用戶位置數(shù)據(jù),選取位置代表點(diǎn)記錄起始時(shí)刻,生成用戶位置序列數(shù)據(jù);關(guān)聯(lián)土地利用性質(zhì),根據(jù)位置停留時(shí)間和土地利用性質(zhì)來判定用戶的停留點(diǎn)或移動點(diǎn),最終生成用戶的出行鏈數(shù)據(jù)。
本發(fā)明目的實(shí)現(xiàn)由以下技術(shù)方案完成:
一種基于移動網(wǎng)絡(luò)數(shù)據(jù)的人員出行鏈識別方法,其特征在于所述識別方法包括以下步驟:
(步驟1)選取待識別手機(jī)用戶的移動網(wǎng)絡(luò)數(shù)據(jù),包括用戶ID、時(shí)間戳、基站ID、基站經(jīng)緯度;
(步驟2)基于DBSCAN空間聚類方法,對所述手機(jī)用戶的移動網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行空間聚類分簇,得到空間聚類分簇后的用戶位置數(shù)據(jù),包括用戶ID、時(shí)間戳、基站經(jīng)緯度、聚類簇編號;
(步驟3)將用戶位置數(shù)據(jù)中的位置點(diǎn)按照時(shí)間戳進(jìn)行升序排序,按順序計(jì)算時(shí)間相鄰的不同位置點(diǎn)間的距離和速度,判定速度是否處于速度閾值[a,b]范圍內(nèi),若是則表明位置點(diǎn)數(shù)據(jù)合理,若否則舍棄該位置點(diǎn),其中,a、b分別表示速度閾值下限和速度閾值上限;繼續(xù)下一相鄰位置點(diǎn)的判定,直至完成所有位置點(diǎn)的判定;隨后對于聚類簇編號來回切換的位置點(diǎn)進(jìn)行篩選,篩選之后的用戶位置數(shù)據(jù)沿用原聚類簇編號,包括用戶ID、時(shí)間戳、基站經(jīng)緯度、聚類簇編號;
(步驟4)對于每一聚類簇位置點(diǎn)集合,以相同位置的出現(xiàn)次數(shù)為權(quán)重選取重心位置作為該聚類簇的位置代表點(diǎn),并選取該聚類簇的時(shí)間上第一條記錄的時(shí)刻作為起始時(shí)刻、最后一條記錄的時(shí)刻作為終止時(shí)刻,生成所述手機(jī)用戶的位置序列數(shù)據(jù),包括用戶ID、起始時(shí)刻、終止時(shí)刻、位置代表點(diǎn)的經(jīng)緯度;
(步驟5)將所述手機(jī)用戶的位置序列數(shù)據(jù)中位置代表點(diǎn)的經(jīng)緯度與土體利用數(shù)據(jù)進(jìn)行空間關(guān)聯(lián),生成所述手機(jī)用戶含有土地利用性質(zhì)的位置序列數(shù)據(jù),包括用戶ID、起始時(shí)刻、終止時(shí)刻、位置代表點(diǎn)的經(jīng)緯度、土地利用類型;
(步驟6)根據(jù)位置序列數(shù)據(jù)中的終止時(shí)刻與起始時(shí)刻之差計(jì)算獲得位置停留時(shí)間,根據(jù)停留時(shí)間和土地利用類型,判斷該位置點(diǎn)的位置狀態(tài),所述位置狀態(tài)是指停留或移動,生成所述手機(jī)用戶的出行軌跡數(shù)據(jù),包括用戶ID、起始時(shí)刻、終止時(shí)刻、代表點(diǎn)的經(jīng)緯度、土地利用類型、位置狀態(tài)。
所述步驟(2)包括以下步驟:
(2.1)DBSCAN空間聚類算法中MinPts的確定,其中,MinPts是指以所述移動網(wǎng)絡(luò)數(shù)據(jù)中某一數(shù)據(jù)點(diǎn)為中心的鄰域內(nèi)最少點(diǎn)的數(shù)量;
(2.2)DBSCAN空間聚類算法中半徑Eps的確定,其中,半徑Eps是指以給定數(shù)據(jù)點(diǎn)為中心的圓形鄰域范圍;計(jì)算所述手機(jī)用戶每個(gè)數(shù)據(jù)點(diǎn)位置與其它所有數(shù)據(jù)點(diǎn)位置之間的歐幾里德距離,計(jì)算每個(gè)數(shù)據(jù)點(diǎn)的k-距離值,并對所有數(shù)據(jù)點(diǎn)的k-距離值集合進(jìn)行升序排列,輸出排序后的k-距離值;
其中,k值對應(yīng)于MinPts,指:給定數(shù)據(jù)集P={p(i);i=0,1…n},對于任一點(diǎn)p(i),計(jì)算點(diǎn)p(i)到集合D的子集S={p(1),p(2),…,p(i-1),p(i+1),…,p(n)}中所有點(diǎn)之間的距離,距離按照從小到大的順序排列,假設(shè)排序后的距離集合為D={d(1),d(2),…,d(k-1),d(k),d(k+1),…,d(n)},d(k)就被成為k-距離;
將所有數(shù)據(jù)點(diǎn)的k-距離值使用散點(diǎn)圖進(jìn)行顯示,計(jì)算散點(diǎn)圖中所有相鄰數(shù)據(jù)點(diǎn)間連線所成的斜率的平均值,挑選所有大于4倍斜率平均值的斜率所對應(yīng)的k-距離,這些k-距離的平均值即為半徑Eps的值;
(2.3)DBSCAN空間聚類算法中核心點(diǎn)的計(jì)算:以點(diǎn)P為中心、半徑為Eps的鄰域內(nèi)的點(diǎn)的個(gè)數(shù)不少于MinPts,則稱點(diǎn)P為核心點(diǎn);根據(jù)Eps和MinPts,計(jì)算所有核心點(diǎn),并建立核心點(diǎn)與到核心點(diǎn)距離小于半徑Eps的點(diǎn)的映射,即為核心點(diǎn)集合;
(2.4)根據(jù)核心點(diǎn)集合以及半徑Eps的值,計(jì)算能夠連通的核心點(diǎn),將能夠連通的每一組核心點(diǎn)以及到核心點(diǎn)距離小于半徑Eps的點(diǎn),都放到一起形成一個(gè)聚類簇,并進(jìn)行聚類簇編號ClusterID(1,2,3…n)。
DBSCAN空間聚類算法中MinPts取4。
所述步驟(3)為:
(3.1)將聚類分簇后的用戶位置數(shù)據(jù)中的位置點(diǎn)記錄按照時(shí)間戳進(jìn)行升序排序,選取一條記錄,若此記錄為第一條記錄則進(jìn)入步驟3.2,若否則進(jìn)入步驟3.3;
(3.2)選取下一條記錄,進(jìn)入步驟3.3;
(3.3)判斷本記錄與上一條記錄的聚類簇編號是否相同,若相同則保留上一條記錄,并返回步驟3.2;若否則計(jì)算兩條記錄的距離和速度,若速度處于速度閾值[a,b]范圍之內(nèi),則保存本記錄,若否則舍棄本條記錄,進(jìn)入步驟3.4;
(3.4)判斷記錄是否遍歷完,若遍歷完則結(jié)束,若否則返回步驟3.2;直至遍歷完所有記錄,得到經(jīng)速度篩選后的用戶位置數(shù)據(jù);
(3.5)篩選聚類簇編號來回切換的位置點(diǎn),對于步驟(3.4)中得到的每一條記錄,判斷其之后10分鐘時(shí)間段內(nèi)是否有位置點(diǎn)的聚類簇編號來回切換大于或等于4次的,若有,則保留出現(xiàn)次數(shù)多的位置點(diǎn)數(shù)據(jù),刪除出現(xiàn)次數(shù)少的位置點(diǎn)數(shù)據(jù);若無,則判斷下一條記錄;直至遍歷完成所有記錄。
所述步驟(4)包括以下步驟:
(4.1)以相同位置的出現(xiàn)次數(shù)為權(quán)重選取重心位置為位置代表點(diǎn),包括步驟:對于每一聚類簇位置集合,即當(dāng)聚類簇編號ClusterID=i時(shí),該聚類簇的位置點(diǎn)用(LONij,LATij)表示,其中,j=1,2,3,…,m,則該聚類簇位置集合的位置代表點(diǎn)的經(jīng)緯度為(CoreLongitudei, CoreLatitudei),其中, QUOTE, QUOTE ,將該聚類簇上所有位置點(diǎn)的坐標(biāo)都變更為位置代表點(diǎn)的經(jīng)緯度(CoreLongitudei, CoreLatitudei);
(4.2)生成用戶位置序列數(shù)據(jù),包括以下步驟:
(4.2.1)將聚類簇上的位置點(diǎn)記錄按照時(shí)間戳生序排列,選取任一條記錄;
(4.2.2)判斷當(dāng)前記錄是否為第一條記錄,若為第一條記錄,則起始時(shí)刻為當(dāng)前記錄的時(shí)間,終止時(shí)刻為當(dāng)前記錄時(shí)刻,繼續(xù)選取下一條記錄;若非第一條記錄,則進(jìn)入步驟(4.2.3);
(4.2.3)判斷當(dāng)前記錄是否與前一條記錄的聚類簇編號相同,若相同,則更新終止時(shí)刻為當(dāng)前記錄的時(shí)間;若不相同,則當(dāng)前記錄為另一聚類簇位置數(shù)據(jù),則起始時(shí)刻為當(dāng)前記錄的時(shí)間,終止時(shí)刻為當(dāng)前記錄時(shí)刻;
(4.2.4)判斷數(shù)據(jù)是否遍歷完全,若遍歷未完全,則返回步驟(4.2.2);若遍歷完全則結(jié)束,生成用戶位置序列數(shù)據(jù),包括用戶ID、起始時(shí)刻、終止時(shí)刻、位置代表點(diǎn)的經(jīng)緯度。
所述步驟(5)中所述土地利用類型分為9類,包括住宅用地、商業(yè)金融業(yè)用地、交通用地、公共建筑用地、工業(yè)或倉儲用地、湖泊用地、市政用地、特殊用地、其它用地。
所述步驟(6)包括以下步驟:根據(jù)位置序列數(shù)據(jù)中的終止時(shí)刻與起始時(shí)刻之差計(jì)算獲得位置停留時(shí)間,若停留時(shí)間小于1h,則位置狀態(tài)為移動;若停留時(shí)間大于1h且土地利用類型為交通用地或市政用地,則狀態(tài)為停留;若停留時(shí)間大于3h且土體利用類型為住宅用地或商業(yè)金融業(yè)用地或公共建筑用地,則狀態(tài)為停留;其它情況皆為移動;生成所述手機(jī)用戶的出行軌跡數(shù)據(jù),包括用戶ID、起始時(shí)刻、終止時(shí)刻、代表點(diǎn)的經(jīng)緯度、土地利用類型、位置狀態(tài)。
本發(fā)明的優(yōu)點(diǎn)是,充分依托現(xiàn)有的無線通信網(wǎng)絡(luò)信息資源,結(jié)合用地性質(zhì)快速方便的進(jìn)行人員出行鏈識別,為交通規(guī)劃工作提供相關(guān)數(shù)據(jù),并具有比傳統(tǒng)交通調(diào)查方法更低的成本和更短的數(shù)據(jù)更新周期。
附圖說明
圖1為本發(fā)明中基于移動網(wǎng)絡(luò)數(shù)據(jù)的人員出行鏈識別方法流程示意圖;
圖2為本發(fā)明實(shí)施例中某手機(jī)用戶的部分移動網(wǎng)絡(luò)數(shù)據(jù)統(tǒng)計(jì)表;
圖3為本發(fā)明實(shí)施例中某手機(jī)用戶每個(gè)位置點(diǎn)與其它所有位置點(diǎn)之間的歐幾里德距離統(tǒng)計(jì)表;
圖4為本發(fā)明實(shí)施例中某手機(jī)用戶所有位置點(diǎn)的4-距離集合升序排列統(tǒng)計(jì)表;
圖5為本發(fā)明實(shí)施例中某手機(jī)用戶所有位置點(diǎn)的4-距離散點(diǎn)圖;
圖6為本發(fā)明圖5中排名570至624的位置點(diǎn)所對應(yīng)的4-距離散點(diǎn)圖;
圖7為本發(fā)明實(shí)施例中形成4個(gè)聚類簇的數(shù)據(jù)統(tǒng)計(jì)表;
圖8為本發(fā)明步驟3中異常點(diǎn)排除方法流程示意圖;
圖9為本發(fā)明實(shí)施例中聚類后全天位置數(shù)據(jù)中上午9-10點(diǎn)時(shí)間段數(shù)據(jù)統(tǒng)計(jì)表;
圖10為本發(fā)明實(shí)施例中兩條記錄之間的速度判定數(shù)據(jù)統(tǒng)計(jì)表;
圖11為本發(fā)明實(shí)施例中遍歷判定完所有記錄后的數(shù)據(jù)結(jié)果統(tǒng)計(jì)表;
圖12為本發(fā)明實(shí)施例中9:04:01至9:14:49時(shí)間段內(nèi)篩選來回切換位置點(diǎn)數(shù)據(jù)統(tǒng)計(jì)表;
圖13為本發(fā)明實(shí)施例中所有時(shí)間段內(nèi)篩選來回切換位置點(diǎn)數(shù)據(jù)統(tǒng)計(jì)表;
圖14為本發(fā)明步驟4中用戶位置序列數(shù)據(jù)生成方法流程示意圖;
圖15為本發(fā)明實(shí)施例中將用戶記錄按照時(shí)間戳Time升序排列的數(shù)據(jù)統(tǒng)計(jì)表;
圖16為本發(fā)明實(shí)施例中生成用戶位置序列數(shù)據(jù)的數(shù)據(jù)統(tǒng)計(jì)表;
圖17為本發(fā)明中土地利用類型分類表;
圖18為本發(fā)明實(shí)施例中生成的含有土地利用性質(zhì)的位置序列數(shù)據(jù)統(tǒng)計(jì)表;
圖19為本發(fā)明實(shí)施例中所生成的某手機(jī)用戶的出行軌跡數(shù)據(jù)表。
具體實(shí)施方式
以下結(jié)合附圖通過實(shí)施例對本發(fā)明的特征及其它相關(guān)特征作進(jìn)一步詳細(xì)說明,以便于同行業(yè)技術(shù)人員的理解:
實(shí)施例:如圖1所示,本實(shí)施例具體涉及一種基于移動網(wǎng)絡(luò)數(shù)據(jù)的人員出行鏈識別方法,該人員出行鏈識別方法具體以下步驟:
【步驟1】
選取某一手機(jī)用戶全天內(nèi)的移動網(wǎng)絡(luò)數(shù)據(jù),該移動網(wǎng)絡(luò)數(shù)據(jù)主要包括用戶ID(UserID)、時(shí)間戳(Time)、基站ID(CELLID)、基站經(jīng)緯度(Longitude,Latitude);
如圖2所示,本實(shí)施例中選取用戶ID為30C0F16的手機(jī)用戶在2016年4月26日的全天移動網(wǎng)絡(luò)數(shù)據(jù),總共672個(gè)位置點(diǎn),由于位置點(diǎn)數(shù)量較多,因此圖2中僅列出其中部分?jǐn)?shù)據(jù)。
【步驟2】
基于DBSCAN空間聚類方法,對該手機(jī)用戶的全天移動網(wǎng)絡(luò)數(shù)據(jù)中的位置數(shù)據(jù)進(jìn)行空間聚類,得到該手機(jī)用戶全天位置數(shù)據(jù);
(步驟2.1)DBSCAN空間聚類算法中MinPts的確定:
DBSCAN空間聚類算法中的一個(gè)參數(shù)是MinPts,表示以某一位置點(diǎn)為中心的鄰域內(nèi)最少位置點(diǎn)的數(shù)量;DBSCAN算法中取MinPts=4,下面確定Eps時(shí),k-距離中設(shè)置k=4;
(步驟2.2)DBSCAN空間聚類算法中Eps的確定:
(2.2.1)DBSCAN空間聚類算法中另一個(gè)是參數(shù)半徑Eps,表示以給定位置點(diǎn)為中心的圓形鄰域的范圍;計(jì)算該手機(jī)用戶每個(gè)位置點(diǎn)與其它所有位置點(diǎn)之間的歐幾里德距離,計(jì)算每個(gè)位置點(diǎn)的4-距離值,并對所有位置點(diǎn)的4-距離集合進(jìn)行升序排列,輸出排序后的4-距離值;
在本實(shí)施例中,該手機(jī)用戶每個(gè)位置點(diǎn)與其它所有位置點(diǎn)之間的歐幾里德距離如圖3所示;該手機(jī)用戶所有位置點(diǎn)的4-距離集合進(jìn)行升序排列后如圖4所示;
(2.2.2)將如圖4中所示的4-距離值,在Excel軟件中使用散點(diǎn)圖顯示4-距離變化趨勢,將急劇發(fā)生變化的位置點(diǎn)所對應(yīng)的4-距離值,確定為半徑Eps的值,如圖5所示(橫坐標(biāo)是名次,縱坐標(biāo)是4-距離值),排名570往后所對應(yīng)的距離變化較為明顯,橫坐標(biāo)排名625后變化太快可忽略;如圖6所示,進(jìn)一步放大570至624所對應(yīng)的4-距離;
所有相鄰位置點(diǎn)連線所成斜率的平均值為0.003685,則斜率均值的4倍為0.01474,大于此值所對應(yīng)的4-距離值共有20個(gè)位置點(diǎn),這20個(gè)平均4-距離值為540米,則半徑EPS=540米;
(步驟2.3)DBSCAN空間聚類算法中核心點(diǎn)計(jì)算:
以點(diǎn)P為中心、半徑為Eps的鄰域內(nèi)的點(diǎn)的個(gè)數(shù)不少于MinPts,則稱點(diǎn)P為核心點(diǎn);根據(jù)Eps=510米和MinPts=4,計(jì)算所有核心點(diǎn),并建立核心點(diǎn)與到核心點(diǎn)距離小于半徑Eps的點(diǎn)的映射;
(步驟2.4)根據(jù)核心點(diǎn)集合,以及半徑Eps的值,計(jì)算能夠連通的核心點(diǎn),將能夠聯(lián)通的每一組核心點(diǎn),以及到核心點(diǎn)距離小于半徑Eps=540米的點(diǎn),都放到一起,形成一個(gè)聚類簇,并進(jìn)行聚類簇編號ClusterID(1,2,3…n),此實(shí)際案例中,形成4簇?cái)?shù)據(jù),如圖7所示。
【步驟3】
對于聚類后的全天位置數(shù)據(jù),按照時(shí)間TIME進(jìn)行升序排序,按速度(Speed)進(jìn)行篩選,包括用戶ID(UserID)、時(shí)間戳(TIME)、基站經(jīng)緯度(Longitude ,Latitude)、聚類簇編號(ClusterID);
如圖8、9所示,下文從聚類后的全天位置數(shù)據(jù)中選取上午9點(diǎn)至10點(diǎn)時(shí)間段,共26個(gè)記錄做具體分析:
(3.1)將聚類后的該用戶的全天位置數(shù)據(jù)按照Time進(jìn)行升序排序,如下表,選取一條記錄,本案例選取時(shí)間為9:04:01的記錄,并假設(shè)為第一條記錄;
(3.2)選取下一條記錄,時(shí)間為9:07:00的記錄,作為本條記錄 ;
(3.3)本記錄9:07:00與上一條記錄09:04:01的聚類簇編號(ClusterID)均為2,保留上一條記錄;
(3.4)繼續(xù)選取下一條09:08:30記錄作為本條記錄,本記錄與上一條記錄09:07:00的聚類簇編號分別為1和2,計(jì)算兩條記錄的距離和速度;城市道路中車速一般不超過100km/h,即27m/s左右;行人速度一般1.5m/s,在此認(rèn)為速度合理范圍為[1,27]m/s,速度合理范圍因地區(qū)不同而有所差異;
如圖10所示,上述兩條記錄之間速度為24.5m/s,在合理速度范圍內(nèi),保留本條09:08:30記錄;依此方法繼續(xù)遍歷數(shù)據(jù)直至遍歷完所有數(shù)據(jù),數(shù)據(jù)結(jié)果如圖11所示;
(3.5)篩選來回切換位置點(diǎn),對于如圖11表中的每一條記錄,時(shí)間向后推10分鐘,判斷這段時(shí)間內(nèi)是否有位置點(diǎn)來回切換大于或等于4次的記錄,若有則保留出現(xiàn)次數(shù)多的位置點(diǎn)數(shù)據(jù),刪除出現(xiàn)次數(shù)少的位置點(diǎn)數(shù)據(jù);否則下一條記錄直至遍歷完所有記錄;此處所指的位置點(diǎn)來回切換具體是指位置點(diǎn)所屬的聚類簇編號來回變化;
以9:04:01向后10分鐘內(nèi)的數(shù)據(jù)為例,即9:04:01至9:14:49這一時(shí)間段,該用戶在聚類簇編號CLUSTERID=2或1或0的位置聚類簇點(diǎn)之間來回切換,超過4次,聚類簇編號CLUSTERID=2或1或0的位置聚類簇點(diǎn)出現(xiàn)次數(shù)分別為:4次、1次2次;因此保留此時(shí)間段聚類簇編號CLUSTERID=2的數(shù)據(jù),刪除此時(shí)間段聚類簇編號CLUSTERID=1或0的數(shù)據(jù),得到如圖12所示的結(jié)果;
同樣的方法判斷9:07:00向后10分鐘內(nèi)數(shù)據(jù)情況,以此類推直至全部數(shù)據(jù),得到如圖13所示的最終位置序列數(shù)據(jù)。
【步驟4】
如圖14所示,對于每一聚類簇位置集合,以位置出現(xiàn)次數(shù)為權(quán)重選取重心位置作為位置代表點(diǎn),并選取該聚類簇的時(shí)間上第一條記錄的時(shí)刻作為起始時(shí)刻(StartTime),選取該類的時(shí)間上最后一條記錄的時(shí)刻作為終止時(shí)刻(EndTime),生成該用戶的位置序列數(shù)據(jù);
(4.1)對于每一聚類簇位置集合,即當(dāng)聚類簇編號ClusterID=0時(shí),這一聚類簇的位置點(diǎn)共有16個(gè),獲得這一聚類簇位置集合的位置代表點(diǎn)的經(jīng)緯度,將該聚類簇所有位置點(diǎn)的坐標(biāo)都變更為位置代表點(diǎn)的經(jīng)緯度;同樣的方法求出聚類簇編號ClusterID為1、2、3、4時(shí)的經(jīng)緯度,分別為(121.61001,29.85892)、(121.58609,29.864989)、(121.543767,29.89086)、(121.565849,29.870109),用位置代表點(diǎn)的經(jīng)緯度代替同一聚類簇所有位置點(diǎn)的經(jīng)緯度;
(4.2)如圖14所示生成用戶位置序列數(shù)據(jù)
(4.2.1)將用戶記錄按照時(shí)間戳Time升序排列,選取一條記錄,時(shí)間為9:04:01,如圖15所示;
(4.2.2)假設(shè)此記錄為第一條記錄,則StartTime=9:04:01,EndTime=9:04:01;
(4.2.3)繼續(xù)選取下一條數(shù)據(jù)9:07:00,作為當(dāng)前記錄,當(dāng)前記錄是與上一條記錄的聚類簇編號ClusterID相同,均為2,則更新EndTime=9:07:00;
(4.2.4)繼續(xù)選取記錄,當(dāng)選取9:29:21時(shí),本記錄與上一條記錄分屬不同的聚類簇編號,則StartTime=9:29:21,EndTime=9:29:21,依次遍歷記錄,直至所有記錄;生成該用戶的位置序列數(shù)據(jù),如圖16所示。
【步驟5】
將該手機(jī)用戶的位置序列數(shù)據(jù)的位置與土地利用數(shù)據(jù)進(jìn)行空間關(guān)聯(lián),生成該用戶的含有土地利用性質(zhì)的位置序列數(shù)據(jù),主要包括用戶ID(UserID)、起始時(shí)刻(StartTime)、終止時(shí)刻(EndTime)、代表位置經(jīng)緯度(CoreLongitude , CoreLatitude)、土地利用類型(LanduseType);其中,由于土地利用類型眾多,本方法將之歸為9類,這9類包含所有土地利用類型,如圖17所示;
本實(shí)施例中所生成的含有土地利用性質(zhì)的位置序列數(shù)據(jù)如圖18所示。
【步驟6】
如圖17、18所示,計(jì)算位置停留時(shí)間StayTime=EndTime-StartTime,根據(jù)停留時(shí)間和土地利用類型,判斷該位置點(diǎn)是停留點(diǎn)還是移動點(diǎn),生成該用戶的出行軌跡數(shù)據(jù)。
若StayTime<1h,則狀態(tài)為Move;
若StayTime>1h 且LanduseType為3或7,則狀態(tài)為Stay;
若StayTime>3h 且LanduseType為1或2或4,則狀態(tài)為Stay;
其他情況,狀態(tài)皆為Move;
從而得到生成該用戶的出行軌跡數(shù)據(jù),如圖19所示。