本發(fā)明涉及智能交通數(shù)據(jù)處理技術(shù)領(lǐng)域,特別涉及一種基于閾值結(jié)合算法的車輛運行軌跡壓縮方法。
背景技術(shù):
移動對象的運動軌跡信息對于研究物體的運動有著重要的理論和應(yīng)用價值。隨著經(jīng)濟的發(fā)展與科技的進步,移動設(shè)備和全球定位系統(tǒng)(Global Positioning System ,GPS)的成熟與大眾化普及應(yīng)用,以時間、地理位置、速度、方向等移動軌跡特征為基礎(chǔ)的軌跡數(shù)據(jù)的采集及存儲成高速增長狀態(tài)。如何對GPS數(shù)據(jù)進行壓縮與處理,消除冗余信息,成為當(dāng)下研究的一個熱點。
David Douglas和Thomas Peucker于1973年提出了經(jīng)典的Douglas-peucker算法,該算法通過迭代測算信息損失量(在GPS軌跡數(shù)據(jù)壓縮中使用的點是軌跡點的偏移量)后擇優(yōu)刪除冗余點;該算法被提出后,很多學(xué)者對它進行了改進:為了提高時間效率,John Her-shberger等以及P.K.Agarwal等對DP算法進行了改進,進而大大減少了時間復(fù)雜度。Keogh等提出了開放窗口(Opening Window,OPW)算法,該算法也是利用迭代測算信息損失量對軌跡進行簡化,但不是針對整條軌跡信息進行迭代,而是借助“窗口”的概念,令“窗口”包含軌跡中的一部分點,迭代只在這個“窗口”中進行,然后不停地更新“窗口”中的軌跡信息,直到簡化完成整條軌跡,這種算法可以進行同步在線壓縮?;瑒哟翱冢⊿liding Window,SW)算法與開放窗口(Opening Window,OPW)算法類似,其主要思想是從軌跡起點開始,初始化一個大小為1的滑動窗口,并逐步擴大窗口,從而加入后續(xù)的軌跡點。把窗口內(nèi)的第一個軌跡點和最后一個軌跡點進行連接,得到的線段作為近似線段。計算近似線段與原始軌跡的垂直歐氏距離,若距離小于預(yù)先設(shè)定的距離閾值,則繼續(xù)增大滑動窗口,直到窗口內(nèi)的誤差小于設(shè)定的距離閾值。但是滑動窗口算法的缺點在于沒有考慮GPS軌跡信息中的時間信息。針對這一情況,Meratnia等提出了上下時間比(Top-Down Time Ratio)算法。這種算法使用同步歐氏距離(SED)代替垂直距離,從而考慮到了GPS軌跡信息中的時間信息。Schmid等人提出使用路網(wǎng)語義信息的形式代替軌跡點儲存壓縮軌跡。利用路網(wǎng)中的路段信息加上移動對象在路段的進入和離開時間信息表示壓縮軌跡,大大減小了壓縮軌跡的數(shù)據(jù)儲存量。
閾值結(jié)合算法(Thresholds Algorighm,TA)是Potamias等提出的另一類算法,這種算法利用移動物體在當(dāng)前軌跡點的速度、方向以及規(guī)定的閾值預(yù)測下一個點的可能區(qū)域,利用位置的預(yù)測結(jié)果來判定點的刪除和保留。該算法用了速度及方向作為刪除冗余點的質(zhì)保,充分考慮了軌跡運動的狀態(tài),但是預(yù)測下一個點的可能區(qū)域,帶有一定的不確定性,會造成刪除的點較多;雖然壓縮率較高,但是壓縮前后軌跡的趨勢和內(nèi)部特征之間的相似性降低。
技術(shù)實現(xiàn)要素:
本發(fā)明為了彌補現(xiàn)有技術(shù)的不足,提供了一種壓縮數(shù)據(jù)快、可靠性高、實用性強的基于閾值結(jié)合算法的車輛運行軌跡壓縮方法。
本發(fā)明是通過如下技術(shù)方案實現(xiàn)的:
一種基于閾值結(jié)合算法的車輛運行軌跡壓縮方法,包括如下步驟:
(1)根據(jù)車輛運動行駛狀態(tài)下的GPS定位系統(tǒng)記錄的軌跡點數(shù)據(jù)信息,提取出每個軌跡點的位置信息、速度信息和方向信息;
(2)通過設(shè)定的角度閾值和速度閾值的加權(quán),建立閾值結(jié)合模型;
(3)選擇數(shù)據(jù)庫中某軌跡的第一軌跡點開始掃描,并依次向后掃描直到軌跡結(jié)束,將不滿足閾值條件的點刪除,將滿足閾值條件的點儲存并形成新的軌跡點集序列;
(4)根據(jù)上述形成的軌跡點集序列生成新的車輛運動軌跡;
(5)計算軌跡壓縮率并運用位置信息計算出壓縮前后的軌跡絕對差異度。
本發(fā)明將移動車輛的速度方向(角度)閾值與速度閾值相結(jié)合,構(gòu)造新的指標(biāo),即二者的加權(quán)組合,通過閾值尋找關(guān)鍵點(滿足閾值條件的點),并通過抽樣統(tǒng)計,確定最優(yōu)的閾值,進而實現(xiàn)去除車輛軌跡中的冗余信息,得到能夠準(zhǔn)確表示出車輛運動軌跡特征的壓縮軌跡。
本發(fā)明的更優(yōu)技術(shù)方案為:
步驟(1)中,速度信息和方向信息分別用ν、θ來表示,數(shù)據(jù)r的位置信息分別用經(jīng)度x、緯度y標(biāo)示,作為閾值結(jié)合模型的建立基礎(chǔ)。
步驟(2)中,設(shè)定角度閾值、速度閾值以及角度閾值權(quán)重α1、速度閾值權(quán)重α2;運用、、α1、α2建立閾值結(jié)合模型:
表示第條軌跡相鄰兩點與的速度改變值的絕對值;
表示第條軌跡相鄰兩點與的角度改變值的絕對值。
驟(3)中,運用ν、θ及權(quán)重系數(shù)α1、α2構(gòu)建出速度、角度加權(quán)結(jié)合閾值為;
令,如果,則刪除點,如果則保留點。
步驟(5)中,運用相對差異度來表示原軌跡和壓縮后軌跡的差異度,其中,,和分別表示原軌跡和壓縮后的軌跡與橫軸所形成的面積。
本發(fā)明壓縮數(shù)據(jù)快,可靠性高,實用性強,可在準(zhǔn)確反應(yīng)車輛運動趨勢和軌跡信息的前提下壓縮軌跡,具有很大的實際應(yīng)用價值。
附圖說明
下面結(jié)合附圖對本發(fā)明作進一步的說明。
圖1為本發(fā)明平均壓縮率隨角度閾值的變化趨勢示意圖;
圖2為本發(fā)明“669148”車不同角度閾值下壓縮前后軌跡圖;
圖3為本發(fā)明“669148”車在不同角度和速度閾值下壓縮前后軌跡圖;
圖4為本發(fā)明壓縮率隨角度閾值和速度閾值變化的趨勢圖;
圖5為本發(fā)明壓縮前后軌跡之間差異度示意圖。
具體實施方式
本發(fā)明直接利用速度和角度,構(gòu)造新的指標(biāo),即二者的加權(quán)組合,通過閾值尋找關(guān)鍵點,并通過抽樣統(tǒng)計,尋找最優(yōu)的閾值。
實施例1:基于角度的壓縮算法
設(shè)有n條出租車軌跡,令xi表示第i(i=1,···,n)條軌跡,每條軌跡有mi個點構(gòu)成。通過GPS定位系統(tǒng),每個軌跡點有時間信息、位置信息、速度信息、速度方向信息。令表示第i條軌跡的第j個點,j=1,···,m,其中,中的5個分量分別表示第i條軌跡中第j個點的時刻、經(jīng)度、緯度、速度及速度方向。
由于每條軌跡采集的數(shù)據(jù)點個數(shù)較多,對數(shù)據(jù)的存儲和運行速度有很大的影響;因此在不丟失原軌跡的基本特征的前提下,可以對軌跡進行壓縮,即尋找關(guān)鍵點,去除冗余數(shù)據(jù)。為了減小數(shù)據(jù)量,需要尋找數(shù)據(jù)點保留或去除的指標(biāo)。從直觀上來看,當(dāng)一個軌跡點的運動速度方向改變較大時,說明車輛在行駛過程中,由于道路變更或突遇偶然狀況,從而改變了原運行軌跡。因此本文首先考慮以速度方向,即角度做為篩選數(shù)據(jù)點的指標(biāo)。
設(shè)為角度閾值,表示第i條軌跡相鄰兩點與的速度方向改變值的絕對值。
若,則刪除;
若,則保留。
按照該原則,從一條軌跡的第一個點,逐次向后檢驗,得到一條壓縮軌跡。為了體現(xiàn)壓縮效果,定義壓縮率:,其中表示第i條軌跡在角度閾值為時的壓縮率,、分別表示第i條軌跡壓縮率前后的軌跡點的個數(shù)。
本發(fā)明分別取=5,10,15,20做為角度閾值。以北京市2000輛出租車近一個月運行軌跡進行驗證,發(fā)現(xiàn)平均壓縮率隨著的增大而增大,附圖1 描繪了2000條軌跡的平均壓縮率隨的變化趨勢。
從圖1中看出,平均壓縮率已超過45%,大大提高了時間效率。但是由于只考慮了角度信息,一些帶有重要特征信息的點被刪除了,導(dǎo)致原軌跡的運動趨勢發(fā)生了變化,以車號“669148”的出租車軌跡為例,展示了在不同角度閾值下壓縮前后軌跡的變化,見附圖2。
圖2中四張圖為角度閾值分別取5,10,15,20時出租車軌跡壓縮前后的對照圖,點數(shù)據(jù)較多的軌跡為原軌跡,另一條為壓縮后的軌跡。從圖中可以看出四種情況下點A和點B之間的運動趨勢在壓縮前后均發(fā)生了較大的變化。主要原因是A點和B點之間的軌跡點都被刪除了。為了避免出現(xiàn)這種情況,只能適當(dāng)降低壓縮率。從圖2中看出,僅考慮變化角度閾值是不夠的,因此需要增加新的指標(biāo),重新考慮關(guān)鍵點的選取。由于軌跡點的信息中有不同時刻的速度,速度改變值的大小反映了路況是否順暢和擁堵,它揭示了軌跡內(nèi)部的特征。但若單獨以速度做為指標(biāo),勢必出現(xiàn)與角度閾值控制關(guān)鍵點的情況,即可以保證較高的壓縮率,但會丟失一些反映軌跡趨勢的點,從而無法完全展現(xiàn)軌跡的特征?;谝陨显虮疚挠媒嵌群退俣葍蓚€指標(biāo),同時控制軌跡關(guān)鍵點的選取。
實施例2:基于角度、速度“與”關(guān)系的壓縮算法
設(shè)為速度閾值,表示第i條軌跡相鄰兩點與的速度改變值的絕對值。我們將同時滿足角度閾值和速度閾值限制的點去掉,即:
若和則刪除;
否則,保留。
按照該原則,從一條軌跡的第一個點,逐次向后檢驗。得到一條壓縮軌跡。在不致引起混淆的情況下,壓縮后的軌跡仍記作,同時定義壓縮率,定義同前,為在角度和速度閾值同時控制下,壓縮后軌跡點的個數(shù)。
本發(fā)明分別取=5,10,15,20,25做為角度閾值,=5,10,15,20,25,30做為速度閾值,得到30種組合。
從附圖3中可以看出,該方法下,不論哪種情況,A點和B點壓縮前后的軌跡趨勢被很好地保存下來。最后一張帶網(wǎng)格的圖形是=25和=30時軌跡壓縮前后的軌跡,被圈住的兩點分別是圖2中的A點和B點,可以比較直觀地看出,即使在較大的閾值下,A點和B點的運動趨勢也被很好地保留下來。
但是該算法的壓縮率較低。附圖4描繪的是2000條出租車軌跡的平均壓縮率同時隨角度、速度閾值變化趨勢圖,從圖中可以看出,壓縮率最高值在50%左右,最低值僅在20%左右,這是因為我們過分地看中了軌跡特征的保留,對數(shù)據(jù)點的要求過于嚴(yán)格,同時滿足速度和角度閾值的點較少,從而造成了軌跡形狀相似度較高,但壓縮率較低的情況。
實施例3:基于運動狀態(tài)改變下的軌跡數(shù)據(jù)壓縮算法
為了使壓縮率盡量高,同時壓縮前后的重要信息不被刪除,本發(fā)明構(gòu)造了一個新的指標(biāo),即速度和角度的加權(quán)閾值,記作。
令,α1和α2分別為和的權(quán)重。
若,則刪除;
否則,保留。
按照該原則,從一條軌跡的第一個點,逐次向后檢驗,得到一條壓縮軌跡。在不致引起混淆的情況下,壓縮后的軌跡仍記作,同時定義壓縮率,定義同前,是在速度和角度的加權(quán)閾值控制下,壓縮后軌跡點的個數(shù)。
軌跡的壓縮既要考慮效率,又要保證壓縮前后兩條軌跡盡量相似。
為了反映壓縮前后兩條軌跡的相似性,定義兩條曲線的差異度指標(biāo),用Di表示第i條軌跡壓縮前后的絕對差異度。由于我們關(guān)心的是壓縮前后運動趨勢是否發(fā)生變化,因此若去除冗余點,留下的關(guān)鍵點形成的軌跡與原軌跡之間所夾部分的面積(如附圖5所示,陰影部分的面積)之和不會太大。
圖5中,實線為原軌跡數(shù)據(jù)點連接折線,虛線為壓縮后剩余軌跡點連接折線。若關(guān)鍵點選取得當(dāng),應(yīng)該使得各個陰影部分面積之和盡量小?;谝陨峡紤],定義,其中和表示原軌跡和壓縮后的軌跡分別與橫軸形成的面積。
由于原始軌跡的長度不同,因此用相對差異度表示兩軌跡的差異度。
分別取=10,15,20,25,30;α1和α2為0.1和0.9;0.2和0.8;0.3和0.7;0.4和0.6;…;0.9和0.1共9對權(quán)重,對2000條軌跡進行實驗。計算軌跡在、α1和α2不同取值下壓縮率的平均值及軌跡相對差異度的平均值,選取平均壓縮率盡量高,而平均軌跡相對差異度盡量小的那組、α1和α2做為最終的閾值和權(quán)重?,F(xiàn)將試驗結(jié)果列于表1。為了便于確定閾值和權(quán)重,通過P=平均壓縮率與(1-平均差異度)之和的大小進行選擇。根據(jù)表1的結(jié)果發(fā)現(xiàn),當(dāng)=30,α1=0.6和α2=0.3時,P值為所在不同情況下的最大值。因此以30,0.6,0.4做為壓縮閾值和權(quán)重,此時平均壓縮率達到了71%以上,平均差異度僅為10%,壓縮前后兩條軌跡趨勢相似度接近90%。
下表為不同閾值、權(quán)重下的平均壓縮率、平均相對差異度檢測:
。