1.一種基于Isolation Forest的城市道路交通異常檢測方法,其特征在于,包括以下步驟:
步驟1、以道路為檢測對(duì)象,根據(jù)道路在不同時(shí)段的平均運(yùn)行速度劃分不同類別數(shù)據(jù)集;
步驟2、基于每個(gè)數(shù)據(jù)集訓(xùn)練一個(gè)Isolation Forest,通過檢測道路速度在Isolation Forest中到根節(jié)點(diǎn)的距離來判斷道路是否異常。
2.如權(quán)利要求1所述的基于Isolation Forest的城市道路交通異常檢測方法,其特征在于,步驟1具體為:
設(shè)城市路網(wǎng)用一個(gè)有向圖G表示:
G=(V,E)
V是有向圖的點(diǎn)集,每個(gè)點(diǎn)表示路網(wǎng)中的交叉口,由經(jīng)度和緯度組成的兩元組表示;E是有向圖的邊集,每條邊表示路網(wǎng)中某條道路;
浮動(dòng)車通過攜帶的GPS設(shè)備返回車輛狀態(tài),返回?cái)?shù)據(jù)的形式如下:
record=[carID,time,latitude,lontitude,speed,angel]
其中carID表示車輛的車牌號(hào),time表示返回記錄時(shí)的時(shí)間,latitude、lontitude表示返回記錄時(shí)車輛所在位置的經(jīng)度和緯度,speed表示車輛速度,angel表示車輛行駛角度;
首先,對(duì)浮動(dòng)車返回的數(shù)據(jù)進(jìn)行地圖匹配,計(jì)算與浮動(dòng)車返回?cái)?shù)據(jù)(latitude、lontitude)最接近的道路上的點(diǎn),即使浮動(dòng)車數(shù)據(jù)與路段匹配的正確位置;
其次,將浮動(dòng)車數(shù)據(jù)匹配后的道路數(shù)據(jù)進(jìn)行分類,分類有時(shí)間和速度兩個(gè)維度的標(biāo)準(zhǔn):1)對(duì)每日06:00到21:00時(shí)間段以預(yù)設(shè)時(shí)間間隔進(jìn)行劃分;2)將每個(gè)時(shí)間段內(nèi)道路速度按照城市道路交通評(píng)價(jià)指標(biāo)體系分為四個(gè)速度區(qū)間,
然后對(duì)路網(wǎng)中所有道路按照時(shí)間段標(biāo)記速度區(qū)間,即<e,t,s>表示在時(shí)間段t,道路e屬于速度區(qū)間s,s∈{S1,S2,S3,S4},e∈E,其中s是n天內(nèi)的時(shí)間段t道路e速度的均值;
根據(jù)道路標(biāo)記的速度區(qū)間,將所有的道路數(shù)據(jù)分為四個(gè)數(shù)據(jù)集Di,i∈{1,2,3,4},如果<e,t,s>的分量s∈Si,則道路e在n天內(nèi)的時(shí)間段t的記錄<e,tj,speed>∈Di,j={1,2,……n}。
3.如權(quán)利要求1所述的基于Isolation Forest的城市道路交通異常檢測方法,其特征在于,步驟2具體包括以下步驟為:
步驟2.1、基于數(shù)據(jù)集Di構(gòu)建Isolation Forest Fi={Tk|k=1,2,…,m}用于檢測城市道路交通異常,F(xiàn)i是包含m棵異常樹的森林;
步驟2.2、檢測一條道路記錄<e,tj,speed>,即道路e在第j天的時(shí)間段t內(nèi)的平均速度speed是否異常,先找到其所屬的速度區(qū)間Si,即找到了對(duì)應(yīng)的Isolation Forest Fi,然后計(jì)算道路記錄在Fi中的平均深度;
步驟2.3、根據(jù)計(jì)算得到道路記錄在Isolation Forest Fi中的平均深度,即道路記錄距離根節(jié)點(diǎn)的期望長度為length,按照公式(1)計(jì)算異常值
c(ψ)由公式(2)計(jì)算。
H(ψ-1)=ln(ψ-1)+0.57721(歐拉常數(shù))
其中,ψ為256,
如果記錄的返回值s非常接近1,表明記錄離根節(jié)點(diǎn)近,通過很少的劃分便能隔離出來,則這條記錄可以認(rèn)為是異常的;
如果返回值遠(yuǎn)遠(yuǎn)小于0.5,說明記錄距離根節(jié)點(diǎn)較遠(yuǎn),需要多次劃分才能將這條記錄隔離出來,則這條記錄可以認(rèn)為是正常的。