一種基于歐氏空間的車輛匯聚預(yù)測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及智能交通技術(shù)領(lǐng)域,具體設(shè)及一種基于歐氏空間的車輛匯聚預(yù)測方 法。
【背景技術(shù)】
[0002] 如今,面對著全球信息化的發(fā)展趨勢,傳統(tǒng)的交通技術(shù)和手段已經(jīng)不再適應(yīng)經(jīng)濟(jì) 社會的發(fā)展要求。智能交通系統(tǒng)是交通事業(yè)發(fā)展的必然選擇。智能交通隨著傳感器技術(shù)、 通信技術(shù)、GIS技術(shù)(地理信息系統(tǒng))、3S技術(shù)(遙感技術(shù)、地理信息系統(tǒng)、全球定位系統(tǒng)S 種技術(shù))和計(jì)算機(jī)技術(shù)的不斷發(fā)展而發(fā)展。
[0003] 近年來,隨著衛(wèi)星定位技術(shù)的成熟和普遍,現(xiàn)在的交通工具,包括車輛,基本都配 備了衛(wèi)星定位設(shè)備來對車輛的軌跡進(jìn)行定時(shí)記錄。因此,每天會有大量的車輛衛(wèi)星定位軌 跡數(shù)據(jù)產(chǎn)生。對車輛運(yùn)營過程中產(chǎn)生的衛(wèi)星定位數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘是智能交通領(lǐng)域的研究 熱點(diǎn)。
[0004] 現(xiàn)有的對于衛(wèi)星定位數(shù)據(jù)進(jìn)行挖掘的方法有很多。例如GuoQ,LuoJ,等 人 在文獻(xiàn)"Adata-drivenapproachforconvergencepredictiononroad network"(WebandWirelessGeographicalInformationSystems.SpringerBerlin Heide化erg, 2013:41-53)中提出了一種基于路網(wǎng)的預(yù)測車輛未來軌跡的方法,該方法中不 需要事先知道任何的個(gè)人駕駛習(xí)慣,并且提出了一個(gè)統(tǒng)計(jì)模型來預(yù)測實(shí)時(shí)的基于路網(wǎng)的車 輛匯聚情況。
[0005] 由于一些實(shí)際因素的影響,譬如傳輸過程中的包丟失、時(shí)間間隔過長的定時(shí)位置 更新策略等,車輛等移動對象的位置更新可能會遺漏部分路徑信息,因此導(dǎo)致數(shù)據(jù)庫中的 車輛衛(wèi)星定位軌跡存在不確定性。
[0006] 針對該問題,郭黎敏等人在文獻(xiàn)"基于路網(wǎng)的不確定性軌跡預(yù)測"(計(jì)算機(jī)研究與 發(fā)展,2010, 47(1): 104-112.)中提出了一種基于路網(wǎng)的不確定性軌跡生成的方法及其表示 形式W及不確定性軌跡頻繁模式挖掘的算法,此外還提供了一種快速查找軌跡模式的索引 結(jié)構(gòu)。該方法提供了一種能夠減少實(shí)際過程中遇到的如包丟失等情況所帶來的誤差的有效 方法。,但是也存在如下問題;前提是必須知道路網(wǎng)信息的情況下,才能進(jìn)行后續(xù)操作
【發(fā)明內(nèi)容】
[0007] 針對現(xiàn)有技術(shù)的不足,本發(fā)明提出了一種基于歐氏空間的車輛匯聚預(yù)測方法。
[0008] 一種基于歐氏空間的車輛匯聚預(yù)測方法,包括如下步驟:
[0009] (1)獲取待預(yù)測區(qū)域內(nèi)所有車輛的載客運(yùn)行軌跡,并對各個(gè)載客運(yùn)行軌跡進(jìn)行預(yù) 處理;
[0010] (2)對所述步驟(1)的預(yù)處理結(jié)果進(jìn)行線段聚類得到聚類結(jié)果,并根據(jù)所述的聚 類結(jié)果進(jìn)行運(yùn)動模式挖掘;
[0011] (3)根據(jù)當(dāng)前時(shí)刻各個(gè)車輛的位置和運(yùn)動模式挖掘結(jié)果,預(yù)測設(shè)定時(shí)間內(nèi)到達(dá)設(shè) 定位置的車輛。
[0012] 本發(fā)明中待預(yù)測區(qū)域應(yīng)理解為設(shè)定位置所在的地區(qū),通常為一個(gè)城市或城市中某 一設(shè)定區(qū)域根據(jù)應(yīng)用需求設(shè)定。
[0013] 本發(fā)明中載客軌跡可通過如下方法獲?。?br>[0014] 首先獲取待預(yù)測區(qū)域內(nèi)所有車輛在設(shè)定時(shí)間段內(nèi)運(yùn)行的歷史衛(wèi)星定位數(shù)據(jù)(直 接從車輛公司獲取)。所述的衛(wèi)星定位數(shù)據(jù)包括車牌號、各個(gè)衛(wèi)星定位數(shù)據(jù)獲取的時(shí)間戳, 位置(位置坐標(biāo),包括經(jīng)度和紳度)、空重車狀態(tài)等等。其中,空重車狀態(tài)即載客狀態(tài),重車 狀態(tài)表示處于載客狀態(tài),輕車狀態(tài)表示處于未載客狀態(tài)。
[0015] 然后針對每一輛車輛,對其歷史衛(wèi)星定位數(shù)據(jù)進(jìn)行篩選,篩選出衛(wèi)星定位數(shù)據(jù)中 車輛載客時(shí)(即為重車狀態(tài)時(shí))的衛(wèi)星定位數(shù)據(jù),并將篩選出的衛(wèi)星定位數(shù)據(jù)按照車牌號 和時(shí)間戳排序,然后W各個(gè)衛(wèi)星定位數(shù)據(jù)作為軌跡點(diǎn)繪制得到該車輛的載客運(yùn)行軌跡。
[0016] 所述步驟(1)中通過如下步驟對每一個(gè)載客運(yùn)行軌跡進(jìn)行預(yù)處理:
[0017] (1-1)確定該載客運(yùn)行軌跡的時(shí)間跳躍點(diǎn)和空間跳躍點(diǎn)的位置,并根據(jù)時(shí)間跳躍 點(diǎn)和空間跳躍點(diǎn)的位置對該載客運(yùn)行軌跡進(jìn)行軌跡分離;
[0018] (1-2)采用Douglas-Peucker算法對軌跡分離后的結(jié)果進(jìn)行軌跡簡化得到預(yù)處理 后的載客運(yùn)行軌跡。
[0019] 作為優(yōu)選,通過如下方法確定時(shí)間跳躍點(diǎn)的位置:
[0020] 若載客運(yùn)行軌跡中任意兩個(gè)相鄰的衛(wèi)星定位數(shù)據(jù)(軌跡點(diǎn))對應(yīng)的時(shí)間戳的間隔 大于設(shè)定的時(shí)間闊值,則認(rèn)為該相鄰的兩個(gè)衛(wèi)星定位數(shù)據(jù)之間存在時(shí)間跳躍點(diǎn)。
[0021] 進(jìn)一步優(yōu)選,通過如下方法確定空間跳躍點(diǎn)的位置:
[0022] 若載客運(yùn)行軌跡中任意兩個(gè)相鄰的衛(wèi)星定位數(shù)據(jù)(軌跡點(diǎn))對應(yīng)的位置之間空間 歐幾里得距離(即歐氏距離)的大于設(shè)定的空間闊值,則認(rèn)為該相鄰的兩個(gè)衛(wèi)星定位數(shù)據(jù) 之間存在空間跳躍點(diǎn)。
[0023] 其中,時(shí)間闊值和空間闊值根據(jù)車輛的運(yùn)行規(guī)律設(shè)定,時(shí)間闊值通常為10~20分 鐘,優(yōu)選為15分鐘??臻g闊值為2~3km,優(yōu)選為2. 5km。
[0024] 軌跡分離的目的是將運(yùn)行軌跡分割成多個(gè)單次運(yùn)行軌跡。單次運(yùn)行軌跡是指車輛 有目的地從一個(gè)地點(diǎn)移動到另一個(gè)地點(diǎn)的過程中的運(yùn)動軌跡。單次運(yùn)行軌跡是后面挖掘運(yùn) 動模式的基礎(chǔ),因?yàn)檫\(yùn)動模式反映的是車輛在完成一個(gè)單次運(yùn)行軌跡時(shí)的運(yùn)動習(xí)慣和路徑 選擇偏好。軌跡分離通過識別分離點(diǎn)的方式實(shí)現(xiàn),分離點(diǎn)包括時(shí)間跳躍點(diǎn)、空間跳躍點(diǎn)、速 度異常點(diǎn)、長時(shí)間停留點(diǎn)(在預(yù)處理時(shí)已經(jīng)處理好)等。
[0025] 作為優(yōu)選,所述步驟(1-1)中對載客運(yùn)行軌跡進(jìn)行軌跡分離如下:
[0026] (1-11)根據(jù)時(shí)間跳躍點(diǎn)的位置將對各個(gè)車輛的載客軌跡進(jìn)行軌跡分類得到相應(yīng) 的單次運(yùn)行軌跡作為軌跡分離結(jié)果;
[0027] (1-12)針對任意一個(gè)單次運(yùn)行軌跡,根據(jù)空間跳躍點(diǎn)的位置對當(dāng)前單次運(yùn)行軌跡 進(jìn)行劃分得到若干子運(yùn)行軌跡作為軌跡分離結(jié)果。
[002引為進(jìn)一步提高預(yù)測精度,進(jìn)一步優(yōu)選,所述步驟(1-1)中對載客運(yùn)行軌跡進(jìn)行軌 跡分離得到子運(yùn)行軌跡后還對所述的子運(yùn)行軌跡進(jìn)行速度判決:
[0029] 若所述子運(yùn)行軌跡中任意兩個(gè)連續(xù)點(diǎn)之間的速度超過預(yù)設(shè)的速度闊值,則認(rèn)為后 面那個(gè)點(diǎn)為異常點(diǎn),并舍棄該異常點(diǎn),得到修正子運(yùn)行軌跡作為軌跡分離結(jié)果。通過速度判 決能夠有效去除錯(cuò)誤的衛(wèi)星定位數(shù)據(jù),可w有效提高預(yù)測精度。
[0030] 所述步驟(1-2)采用基于高線的Douglas-Peucker算法對各軌跡分離結(jié)果進(jìn)行 軌跡簡化。本發(fā)明中得到的軌跡分離結(jié)果仍然是軌跡,對其進(jìn)行軌跡簡化具體包括如下步 驟:
[0031] (a)將軌跡分離結(jié)果的兩個(gè)端點(diǎn)連接成線段;
[0032] 化)確定軌跡分離結(jié)果上離該線段距離最遠(yuǎn)的點(diǎn),計(jì)算該距離最遠(yuǎn)的點(diǎn)到線段的 高線距離,并進(jìn)行如下操作:
[0033] 若該高線距離小于預(yù)設(shè)的高線距離闊值,則舍棄該點(diǎn),并W舍棄后的軌跡分離結(jié) 果作為簡化運(yùn)行軌跡(即預(yù)處理后的載客運(yùn)行軌跡);
[0034] 否則,保留距離最遠(yuǎn)的點(diǎn),并將其與兩個(gè)端點(diǎn)相連接,得到兩條子線段;
[0035] (C)針對得到的兩條子線段分別執(zhí)行步驟化)。
[0036] 所述的高線距離闊值的范圍為50~150m,優(yōu)選為80m。
[0037] 由于軌跡分離之后得到的結(jié)果中通常會包含了很多冗余的記錄。例如當(dāng)某個(gè)對象 (車輛)長時(shí)間在某個(gè)位置停留時(shí)將連續(xù)報(bào)告一系列經(jīng)紳度相同的位置信息,某個(gè)對象直 線行駛時(shí)將報(bào)告多個(gè)在同一條直線上的點(diǎn)。該些冗余的記錄可能是沒有意義的或者可W由 其它記錄通過線性擬合的方式推斷出來。軌跡簡化的目的就是去掉單次運(yùn)行軌跡中該些冗 余記錄,只保留軌跡中的關(guān)鍵點(diǎn)。
[003引所述步驟(2)中基于歐氏空間距離對所有預(yù)處理結(jié)果進(jìn)行線段聚類,包括如下步 驟:
[0039] (2-1)將各預(yù)處理結(jié)果劃分為若干線段;
[0040] 本發(fā)明中的預(yù)處理結(jié)果經(jīng)過預(yù)處理后的載客運(yùn)行軌跡,實(shí)際上也是運(yùn)行軌跡,對 其劃分線段時(shí),直接W相鄰兩個(gè)點(diǎn)之間作為一個(gè)線段即可。針對每一個(gè)預(yù)處理結(jié)果,最終得 到的線段數(shù)量取決于實(shí)際情況,但由于對數(shù)據(jù)進(jìn)行過預(yù)處理,實(shí)際每條載客運(yùn)行軌跡分離 得到的線段數(shù)量不會相差太大。
[0041] (2-2)針對當(dāng)前預(yù)處理結(jié)果對應(yīng)的任意一條線段,在其他預(yù)處理結(jié)果對應(yīng)的線段 中確定與其距離最近的線段:
[0042] 若該兩條線段之間的距離小于預(yù)設(shè)的線段距離闊值,則將該兩條線段聚為同一 類;
[0043] 否則,W該線段單獨(dú)作為一個(gè)類;
[0044] (2-3)針對任意兩個(gè)類,計(jì)算二者之間的距離,若所述的距離小于預(yù)設(shè)的類距離闊 值,則將二者合并為一類;
[0045] 否則,不處理;
[0046] (2-4)返回執(zhí)行步驟(2-3)直至總類數(shù)不變時(shí)停止;
[0047] (2-5)統(tǒng)計(jì)每個(gè)類中的線段數(shù)量,舍棄線段數(shù)量小于預(yù)設(shè)線段數(shù)量闊值的類。
[0048] 所述的線段距離闊值為150m,所述的類距離闊值為150m,所述的線段數(shù)量闊值 15。實(shí)際應(yīng)用時(shí),線段距離闊值、類距離闊值W及線段數(shù)量闊值均可根據(jù)實(shí)際應(yīng)用需求設(shè) 定。
[0049] 所述步驟(2)中進(jìn)行運(yùn)動模式挖掘過程如下:
[0化0] (S1)針對任意兩個(gè)類,計(jì)算任意兩個(gè)類之間的距離,并根據(jù)距離W及當(dāng)前兩個(gè)類 中