基于emd算法的個(gè)體出行手機(jī)切換序列道路匹配方法
【專利摘要】本發(fā)明公開了一種基于EMD算法的個(gè)體出行手機(jī)切換序列道路匹配方法,通過先標(biāo)定每條道路對(duì)應(yīng)的手機(jī)基站切換主序列,然后計(jì)算個(gè)體出行產(chǎn)生的待匹配切換序列與每條道路上的已知標(biāo)定切換主序列間的EMD值,最后選擇其中的最小EMD值所對(duì)應(yīng)的標(biāo)定道路即為該個(gè)體出行所匹配的道路。本發(fā)明的積極效果是:通過利用通信運(yùn)營商提供的手機(jī)基站切換序列、切換時(shí)刻等數(shù)據(jù)信息,將手機(jī)切換序列數(shù)據(jù)構(gòu)建為相應(yīng)的EMD模式,然后根據(jù)EMD值將不同道路的手機(jī)切換模式進(jìn)行分析歸類,當(dāng)?shù)玫叫碌奈粗獋€(gè)體手機(jī)切換數(shù)據(jù)后只需對(duì)其進(jìn)行模式歸類即可獲得該用戶出行軌跡并實(shí)現(xiàn)道路地圖匹配。在當(dāng)前手機(jī)普及率高的背景下,本發(fā)明可用于大范圍居民出行軌跡信息識(shí)別與采集。
【專利說明】基于EMD算法的個(gè)體出行手機(jī)切換序列道路匹配方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及交通管理【技術(shù)領(lǐng)域】,尤其涉及一種利用手機(jī)通信數(shù)據(jù)進(jìn)行個(gè)體出行軌 跡所屬道路的識(shí)別與地圖匹配方法。
【背景技術(shù)】
[0002] 利用空間定位信息來識(shí)別個(gè)體出行道路軌跡能夠?yàn)槌鞘幸?guī)劃、交通規(guī)劃提供有力 支持。現(xiàn)有的個(gè)體出行道路匹配識(shí)別主要依靠GPS定位、航位推算數(shù)據(jù)等進(jìn)行地圖匹配完 成,例如通過手持或者車載GPS定位儀器采集出行軌跡經(jīng)緯度數(shù)據(jù),再將GPS經(jīng)緯度數(shù)據(jù)導(dǎo) 入電子地圖中進(jìn)行道路的匹配與識(shí)別。目前,該類方法應(yīng)用效果受儀器定位精度、匹配方法 影響較大,并且儀器都較為昂貴、普及率非常有限,技術(shù)很難在實(shí)際項(xiàng)目中大規(guī)模應(yīng)用,存 在一定的技術(shù)缺陷。另一方面,目前利用儀器時(shí)空定位數(shù)據(jù)進(jìn)行道路地圖匹配的相關(guān)算法 也存在很多缺陷,尤其當(dāng)定位頻率較低或道路網(wǎng)復(fù)雜時(shí),匹配效果還不理想。已有道路匹配 算法可以分為以下幾類:
[0003] 1.幾何形狀分析匹配算法
[0004] 計(jì)算定位點(diǎn)與路網(wǎng)節(jié)點(diǎn)或者與鄰近路段垂直投影距離,或者計(jì)算一系列定位點(diǎn)構(gòu) 成的曲線到附近交通線路的距離,選擇距離最小值實(shí)現(xiàn)道路匹配。
[0005] 2.路網(wǎng)拓?fù)浣Y(jié)構(gòu)分析匹配算法
[0006] 車輛在行駛過程中,它的運(yùn)動(dòng)軌跡所處的道路必然具有連通性?;诼肪W(wǎng)拓?fù)浣Y(jié) 構(gòu)的道路匹配方法利用道路網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),通過判斷候選道路的連通性,在多條候選道 路中選擇出可能性最大、連通性最好的道路作為匹配道路。
[0007] 3.概率分析匹配算法
[0008] 這類算法需要首先定義一個(gè)在導(dǎo)航設(shè)備定位點(diǎn)的橢圓或者矩形的誤差范圍,然后 將這些誤差范圍疊加在路網(wǎng)上來識(shí)別車輛的行駛軌跡。如果誤差范圍覆蓋了數(shù)段道路,則 將利用方向、連通性和距離參數(shù)對(duì)候選路段進(jìn)行評(píng)估,選擇最可能的識(shí)別結(jié)果。
[0009] 而隨著現(xiàn)代手機(jī)技術(shù)的快速發(fā)展,手機(jī)用戶的普及率及其地區(qū)覆蓋率迅速攀升, 加之?dāng)?shù)據(jù)成本較低,利用居民日常手機(jī)通信信令數(shù)據(jù)來進(jìn)行個(gè)體出行道路匹配體現(xiàn)出了良 好應(yīng)用前景。該方法只需通過連續(xù)追蹤通話過程中手機(jī)與服務(wù)信號(hào)塔(即通信基站)間切 換變化序列,再將該序列對(duì)應(yīng)的基站位置與道路設(shè)施進(jìn)行關(guān)聯(lián)匹配判定,即可識(shí)別手機(jī)用 戶的出行道路軌跡并實(shí)現(xiàn)道路地圖匹配。目前應(yīng)用手機(jī)定位數(shù)據(jù)研究個(gè)體出行信息的方法 還非常少,有學(xué)者曾設(shè)計(jì)使用序列相似度算法進(jìn)行手機(jī)切換道路匹配,其原理是在每一條 道路上進(jìn)行切換實(shí)驗(yàn),記錄下每條道路的已知切換序列,在判斷待匹配切換序列的道路歸 屬時(shí),將其與每條道路的已知序列進(jìn)行序列相似度計(jì)算,相似度最高的即為匹配道路。這 種方法計(jì)算簡(jiǎn)便,然而僅僅將切換序列作為參數(shù),忽略了切換時(shí)間、服務(wù)基站位置等重要信 息,該方法在復(fù)雜路網(wǎng)中其匹配精確度非常有限。
[0010]EMD(EarthMover'sDistance)算法本質(zhì)為運(yùn)輸規(guī)劃中的線性最優(yōu)化問題,已廣 泛應(yīng)用于圖像處理和其他諸多領(lǐng)域,作為不同排列(組合)的差異度衡量方法,它非常適合 于不同手機(jī)切換序列與道路的匹配識(shí)別?;贓MD算法,本專利實(shí)現(xiàn)了利用手機(jī)切換定位 數(shù)據(jù)(包括切換基站編號(hào)序列、切換時(shí)間、服務(wù)基站位置信息)進(jìn)行個(gè)體出行軌跡的道路識(shí) 別與匹配,識(shí)別精度較好,具有很好的行業(yè)應(yīng)用價(jià)值。
【發(fā)明內(nèi)容】
[0011] 為了克服現(xiàn)有技術(shù)的上述缺點(diǎn),本發(fā)明提出了一種基于EMD算法的個(gè)體出行手機(jī) 切換序列道路匹配方法,運(yùn)用手機(jī)切換序列、服務(wù)基站編號(hào)、切換發(fā)生時(shí)刻等數(shù)據(jù)進(jìn)行手機(jī) 用戶所經(jīng)過的道路匹配;本發(fā)明創(chuàng)新性地提出應(yīng)用EMD算法來進(jìn)行手機(jī)切換序列間差異性 度量,并根據(jù)量化結(jié)果對(duì)手機(jī)切換序列進(jìn)行道路匹配,提出了整套數(shù)據(jù)處理方法與出行軌 跡道路匹配技術(shù)。
[0012] 本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:一種基于EMD算法的個(gè)體出行手機(jī) 切換序列道路匹配方法,包括如下步驟:
[0013] 第一步、手機(jī)切換基礎(chǔ)樣本數(shù)據(jù)的采集:
[0014] 確定目標(biāo)區(qū)域與目標(biāo)道路,在每條目標(biāo)道路上采集至少五條手機(jī)切換樣本數(shù)據(jù)作 為基礎(chǔ)樣本數(shù)據(jù),稱為已知切換序列;
[0015] 第二步、數(shù)據(jù)預(yù)處理:
[0016] 將每條道路的切換序列按照切換基站編號(hào)ID和切換時(shí)刻time順序排列;
[0017] 第三步、確定每條道路上的已知切換主序列:
[0018] 1)從每條道路上的已知切換序列中隨機(jī)抽取一個(gè)切換序列作為主序列;
[0019] 2)計(jì)算不同道路上主序列之間的EMD值;
[0020] 3)計(jì)算每條道路上的主序列與相同道路上的其他已知切換序列之間的EMD值;
[0021] 4)將本步驟第2)步和第3)步的計(jì)算結(jié)果用矩陣形式表示,形成EMD矩陣;
[0022] 5)判斷EMD矩陣對(duì)角線上的數(shù)值是否為所在行和所在列的最小值:若是,則將本 步驟的第1)步選取的主序列作為已知切換主序列,然后進(jìn)入第四步;若否,則重新選取每 條道路上一個(gè)切換序列作為主序列,然后返回本步驟的第2)步;
[0023] 第四步、計(jì)算待匹配切換序列與每條道路上的已知切換主序列間的EMD值,選擇 其中的最小值所對(duì)應(yīng)的道路即為待匹配切換序列所匹配的道路。
[0024] 與現(xiàn)有技術(shù)相比,本發(fā)明的積極效果是:本發(fā)明基于目前GPS定位等道路匹配技 術(shù)成本昂貴、覆蓋率低等缺點(diǎn),提出了一種基于EMD算法及手機(jī)通信數(shù)據(jù)的出行道路匹配 識(shí)別方法。通過利用通信運(yùn)營商提供的手機(jī)基站切換序列、切換時(shí)刻等數(shù)據(jù)信息,將手機(jī)切 換數(shù)據(jù)構(gòu)建為相應(yīng)的EMD模式,然后根據(jù)EMD值將不同道路的手機(jī)切換模式進(jìn)行分析歸類, 當(dāng)?shù)玫叫碌奈粗獋€(gè)體手機(jī)切換數(shù)據(jù)后只需對(duì)其進(jìn)行模式歸類即可獲得該用戶出行軌跡并 實(shí)現(xiàn)道路地圖匹配。本方法創(chuàng)新性地將EMD算法及手機(jī)切換數(shù)據(jù)應(yīng)用到個(gè)體出行軌跡的道 路地圖匹配中,技術(shù)應(yīng)用效果較好,且在當(dāng)前手機(jī)普及率高的背景下,具有很好的行業(yè)應(yīng)用 前景。
【專利附圖】
【附圖說明】
[0025] 本發(fā)明將通過例子并參照附圖的方式說明,其中:
[0026] 圖1是EMD算法思想應(yīng)用舉例示意圖;
[0027] 圖2是m= 3,η= 3的EMD模型及其應(yīng)用于手機(jī)切換的EMD模式;
[0028] 圖3為兩個(gè)通話切換模式之間的EMD;
[0029] 圖4為不同道路手機(jī)切換序列EMD分布框圖;
[0030] 圖5為切換基站和切換時(shí)間對(duì)不同手機(jī)切換模式差異的影響示意圖。
【具體實(shí)施方式】
[0031] 考慮到手機(jī)用戶數(shù)據(jù)保密性,我們選取某一城市區(qū)域,收集了該區(qū)域地理、交通及 通信基礎(chǔ)數(shù)據(jù),建立無線通信網(wǎng)絡(luò)仿真平臺(tái)進(jìn)行模擬驗(yàn)證。選擇該目標(biāo)區(qū)域中六條主要道 路進(jìn)行手機(jī)切換數(shù)據(jù)仿真,每條道路分別產(chǎn)生10條切換序列,隨機(jī)選取6條切換序列進(jìn)行 EMD矩陣計(jì)算并實(shí)現(xiàn)路段切換主序列標(biāo)定,將剩余切換序列分成4個(gè)小組作為待識(shí)別序列, 每個(gè)小組包含6條道路上各一個(gè)手機(jī)切換序列,通過將待識(shí)別序列與各路段標(biāo)定主序列進(jìn) 行EMD值計(jì)算與模式分類識(shí)別。結(jié)果表明,4個(gè)小組的所有切換序列均成功匹配到所屬道 路,匹配成功率為100%,該方法應(yīng)用效果理想,能夠大規(guī)模推廣應(yīng)用。
[0032] 本發(fā)明方法的原理及詳細(xì)案例說明如下:
[0033]EMD算法的概念在1781年由學(xué)者GaspardMonge提出,描述的是一個(gè)古老的運(yùn)輸 問題,用來衡量同一空間中兩種分布之間的差異度,一種分布是空間中的土堆立方量,另一 種分布則是空間中需要土方填補(bǔ)的坑洞,利用EMD算法求運(yùn)送所有的泥土來填充坑洞所需 的最小工作量。以一個(gè)簡(jiǎn)單的例子介紹EMD算法的基本思路:二維空間中有兩種數(shù)字分布 模式,引入EMD算法概念來量化兩種模式之間的差異度,過程如圖1所示,所有方案中存在 運(yùn)輸成本最小的移動(dòng)方案,最小的總運(yùn)輸成本為(? = 3,即EMD(模式一,模式二)=3。 [0034] 在手機(jī)切換中,我們將不同的切換數(shù)據(jù)定義成不同的模式,假設(shè)有兩條 不同的切換數(shù)據(jù)構(gòu)成的切換模式P、Q,其對(duì)應(yīng)于EMD模式的基本構(gòu)成為:用元素PjPq」表示不同切換基站的空間位置坐標(biāo)點(diǎn),其距離用歐氏幾何地面距離計(jì)算: da=(λ-,-XiY+(yi-v,)2 + (pt,-ptjY,(Xi,Yi),(Xj,yP分別為兩條切換數(shù)據(jù)中第i次和第 j次切換基站的坐標(biāo),為對(duì)應(yīng)于基站Pi和Qj的手機(jī)切換發(fā)生時(shí)刻。系數(shù)P為引進(jìn) 的轉(zhuǎn)換系數(shù),目的是將時(shí)間和空間兩個(gè)維度的單位進(jìn)行統(tǒng)一化。而分布模式中的權(quán)重Wpi和 Wqj則采用手機(jī)在基站pjPqj所接受的服務(wù)時(shí)間長度,這個(gè)時(shí)間長度的計(jì)算可以通過記錄 每次切換發(fā)生的時(shí)刻得到。EMD模型及其應(yīng)用于手機(jī)切換的EMD模式構(gòu)建如圖2所示。
[0035] 如圖3所示為兩個(gè)通話切換模式A和B之間的EMD值計(jì)算過程。通話中手機(jī)接受 不同基站的服務(wù)就是切換,(a)為通話A接受的基站服務(wù)情況,(b)為通話B接受的基站服 務(wù)情況,(c)則是通話A切換模式轉(zhuǎn)化為通話B切換模式的過程,也體現(xiàn)了通話A和通話B 的EMD距離產(chǎn)生過程。圖中的曲線為道路,每一個(gè)顏色點(diǎn)代表了該通話在每個(gè)對(duì)應(yīng)基站內(nèi) 接受Imin的服務(wù)時(shí)間,可以看出通話A和通話B的時(shí)長都是8min。將每?jī)蓚€(gè)基站之間轉(zhuǎn)移 的顏色點(diǎn)數(shù)(即時(shí)間長度)乘以這兩個(gè)基站之間的歐氏距離,對(duì)所有基站對(duì)的這個(gè)乘積求 和后除以所有轉(zhuǎn)移的顏色點(diǎn)數(shù),就得到了兩個(gè)通話之間的EMD值。
[0036] 本發(fā)明案例中,手機(jī)切換數(shù)據(jù)仿真平臺(tái)選用了某城市的實(shí)際道路網(wǎng)絡(luò)為仿真背景 通過實(shí)地勘察、網(wǎng)站資料收集等獲取仿真系統(tǒng)中道路等級(jí)、道路渠化、路口信號(hào)配時(shí)、交通 流量、通信基站位置、發(fā)射功率等基礎(chǔ)數(shù)據(jù),利用Corsim軟件實(shí)現(xiàn)交通仿真,利用Matlab軟 件實(shí)現(xiàn)通信切換仿真通信,實(shí)驗(yàn)選取該城市道路網(wǎng)絡(luò)中的6條道路作為目標(biāo)分析對(duì)象。
[0037] 第一步、手機(jī)切換基礎(chǔ)樣本數(shù)據(jù)的采集
[0038] 在以上仿真系統(tǒng)中選取城市道路網(wǎng)絡(luò)中的6條道路作為目標(biāo)分析道路,隨機(jī)抽取 每條道路上的10條手機(jī)切換序列(共60條)作為研究基礎(chǔ)數(shù)據(jù),然后抽取每條道路的10 個(gè)手機(jī)切換序列中的6條共6*6條作為已知切換序列,見表1。剩余的4*6條數(shù)據(jù)作為待匹 配切換序列。
[0039] 表1(a)目標(biāo)道路①手機(jī)已知切換序列
[0040]
【權(quán)利要求】
1. 一種基于EMD算法的個(gè)體出行手機(jī)切換序列道路匹配方法,其特征在于:包括如下 步驟: 第一步、手機(jī)切換基礎(chǔ)樣本數(shù)據(jù)的采集: 確定目標(biāo)區(qū)域與目標(biāo)道路,在每條目標(biāo)道路上采集至少五條手機(jī)切換樣本數(shù)據(jù)作為基 礎(chǔ)樣本數(shù)據(jù),稱為已知切換序列; 第二步、數(shù)據(jù)預(yù)處理: 將每條道路的切換序列按照切換基站編號(hào)ID和切換時(shí)刻time順序排列; 第三步、確定每條道路上的已知切換主序列: 1) 首先從每條道路的已知切換序列中隨機(jī)抽取一個(gè)切換序列作為主序列; 2) 計(jì)算不同道路上主序列之間的EMD值; 3) 計(jì)算每條道路上的主序列與相同道路上的其他已知切換序列之間的EMD值; 4) 將本步驟第2)步和第3)步的計(jì)算結(jié)果用矩陣形式表示,形成EMD矩陣; 5) 判斷EMD矩陣對(duì)角線上的數(shù)值是否為所在行和所在列的最小值:若是,則將本步驟 的第1)步選取的主序列作為已知切換主序列,然后進(jìn)入第四步;若否,則重新選取每條道 路上一個(gè)切換序列作為主序列,然后返回本步驟的第2)步; 第四步、計(jì)算待匹配切換序列與每條道路上的已知切換主序列間的EMD值,選擇其中 的最小值所對(duì)應(yīng)的道路即為待匹配切換序列所匹配的道路。
2. 根據(jù)權(quán)利要求1所述的基于EMD算法的個(gè)體出行手機(jī)切換序列道路匹配方法,其特 征在于:所述基礎(chǔ)樣本數(shù)據(jù)包括各切換基站的空間位置坐標(biāo)、每次切換對(duì)應(yīng)的基站編號(hào)及 切換時(shí)間。
3. 根據(jù)權(quán)利要求1所述的基于EMD算法的個(gè)體出行手機(jī)切換序列道路匹配方法,其特 征在于:數(shù)據(jù)預(yù)處理時(shí),將所有切換時(shí)刻設(shè)置為相對(duì)于車輛在相應(yīng)道路上出發(fā)起始時(shí)刻的 相對(duì)時(shí)間。
【文檔編號(hào)】H04W64/00GK104504900SQ201410824917
【公開日】2015年4月8日 申請(qǐng)日期:2014年12月26日 優(yōu)先權(quán)日:2014年12月26日
【發(fā)明者】楊飛, 姚振興, 曾大堃, 韓旭, 劉中游 申請(qǐng)人:西南交通大學(xué)