大小,但是我們建議訓(xùn)練數(shù)據(jù)集要 更大。
[0095] (5)預(yù)測結(jié)果檢驗(yàn)評價(jià):
[0096] 我們利用實(shí)測的流量數(shù)據(jù)集,做了大量的實(shí)驗(yàn)來評價(jià)所提出的PMA模型的性能。 在本部分中,我們將首先解釋數(shù)據(jù)集與實(shí)驗(yàn)設(shè)定,接下來通過評價(jià)矩陣測量性能,最后給出 實(shí)驗(yàn)結(jié)果。
[0097] ①研究區(qū)域
[0098] 用于實(shí)驗(yàn)的數(shù)據(jù)由大都會(huì)區(qū)的交通監(jiān)控系統(tǒng)記錄的2013年4月1日至2013年5 月5日的實(shí)測車輛通過記錄組成。數(shù)據(jù)集包含140, 440, 933個(gè)實(shí)測車輛通過記錄,涉及全 部308個(gè)位于主干道的攝像頭,我們將其分為兩個(gè)部分,訓(xùn)練數(shù)據(jù)集與測試數(shù)據(jù)集。以上模 型的訓(xùn)練數(shù)據(jù)集包含了 2013年4月1日至2013年5月2日,而測試數(shù)據(jù)集為2013年5月 3日至5月5日的交通記錄。我們所有攝像區(qū)域的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行了平均。交通流量數(shù)據(jù)進(jìn) 行了聚合并平均至每個(gè)周期At分組中。
[0099] ②預(yù)處理
[0100] 我們對數(shù)據(jù)集進(jìn)行預(yù)處理,形成流量模態(tài),計(jì)算車輛在每個(gè)時(shí)間周期中的數(shù)量,建 議將間隙時(shí)間At設(shè)為60。如果由于攝像頭損壞或其他原因,采樣流量丟失(該情況下一 直為〇),我們通過平均樞紐的值來填補(bǔ)它。在預(yù)處理之后,我們得到共計(jì)10780個(gè)水平流量 模態(tài)和7392個(gè)垂直模態(tài),我們在實(shí)驗(yàn)中預(yù)測未來一個(gè)周期的交通流量。
[0101] ③擬合優(yōu)度統(tǒng)計(jì)
[0102] 我們使用兩個(gè)最廣泛的評價(jià)統(tǒng)計(jì)方法來獲得預(yù)測結(jié)果的準(zhǔn)確性。
[0103] 1)均方根誤差(RMSE)是用來測量預(yù)測結(jié)果平均誤差的一種方法,可以通過下式 計(jì)算:
[0105] 2)平均絕對值百分比誤差(MPAE)是測量預(yù)測結(jié)果比例誤差的一種方法,可以通 過下式進(jìn)行計(jì)算
[0107] 此處%與I分別表示第η次觀測的觀測值與預(yù)測值,N表示觀測的總數(shù)。
[0108] ④評價(jià)ΡΜΑ
[0109] 我們在這兩種子模型中評價(jià)ΡΜΑ算法的性能,獨(dú)立模型與相似模型,以及它們的 融合。對于每次實(shí)驗(yàn),我們對所有攝像頭區(qū)域進(jìn)行預(yù)測,并報(bào)告評價(jià)統(tǒng)計(jì)的平均值。
[0110] 首先,我們改變式(1)和式(2)中獨(dú)立模型與相似模型的參數(shù)<L,W> (前面提到, 為平面序列的尺寸)。通過RMSE可以反映交通流量的絕對誤差,我們選擇它來幫助訓(xùn)練我 們的模型。圖2(a)和(b)顯示了獨(dú)立模型與相似模型在不同<L,W>值下的RMSE,其中RMSE 基于24個(gè)觀測(60分鐘,1天)計(jì)算得出。基于圖中顯示的結(jié)果,當(dāng)RMSE最小時(shí)我們對于 獨(dú)立模型選擇L = 6, W = 2,對于相似模型選擇L = 7, W = 2作為PMA的最佳尺寸。
[0111] 其次,對于NN融合模型,隱藏層中不同數(shù)目的神經(jīng)元的NN的序列被訓(xùn)練。神經(jīng)元 的數(shù)目在4到12之間變化,同時(shí)計(jì)算了訓(xùn)練數(shù)據(jù)集與測試數(shù)據(jù)集的RMSE。根據(jù)測試數(shù)據(jù) 集自身的泛化能力,RMSE的值越低,網(wǎng)絡(luò)模型越好。圖3(a)顯示了 RMSE與隱藏層神經(jīng)元 數(shù)目的關(guān)系曲線。在圖3(a)中,我們發(fā)現(xiàn)最佳的隱藏層神經(jīng)元數(shù)目為8。因此,2-8-1NN模 型被選作用來進(jìn)行預(yù)測。圖3(b)中顯示了子模型與融合模型的性能對比。我們可以卡出 RMSE顯著降低了而MPAE適當(dāng)?shù)奶岣吡恕?br>[0112] ⑤結(jié)果對比
[0113] -些單源模型包括naiye,. ma,arima,以及NN模型,以及聚合模型被用于時(shí)間序列 Sa(t)與Sb(t)。我們比較它們利用PMA模型在測試數(shù)據(jù)集上的預(yù)測。
[0114] 1) naive (或不變)模型對于交通流量預(yù)測可用最簡單的形式:
[one] 此處為時(shí)間間隙t中的預(yù)測值。
[0117] 2) MA模型:MA模型序列可以由下式計(jì)算:
[0119] 此處k為MA項(xiàng)的數(shù)目[12]。MA技術(shù)僅能處理最后的k個(gè)周期的已知數(shù)據(jù),每個(gè) 平均中的數(shù)據(jù)點(diǎn)的數(shù)目隨時(shí)間不變。
[0120] 3)ARIMA模型:序列(r,d,s)的普通ARIMA模型,此處d表示差分的階數(shù),階數(shù)r與 s為AR和MA運(yùn)算符。
[0121] 4)人工NN:用于與PMA對比的單源模型,NN模型用于擬合非線性關(guān)系:
[0123] NN模型的輸入為前1個(gè)連續(xù)時(shí)間間隙的交通流量記錄,它的輸出為時(shí)間間隙t的 交通流量預(yù)測。輸入1的數(shù)目與NN隱藏神經(jīng)元的數(shù)目也由實(shí)驗(yàn)優(yōu)化。5)聚合模型(DA): 它融合了三種子模型(MA,ES與ARIMA),使用簡單的神經(jīng)網(wǎng)絡(luò)方法融合預(yù)測結(jié)果。
[0124] 注意不同的模型(nalfve,MA,ARIMA,NN,DA)需要不同長度的歷史數(shù)據(jù)。另外,采 樣大小需要針對每個(gè)模型進(jìn)行選擇。例如,對于na_ive模型訓(xùn)練數(shù)據(jù)的時(shí)間長度不能超過預(yù) 測時(shí)間前4個(gè)小時(shí),對于ARIMA模型的訓(xùn)練數(shù)據(jù),至少要包含之前2天。對于每個(gè)模型,我 們通過觀察最佳的擬合或預(yù)測選擇參數(shù),并比較在相同測試數(shù)據(jù)集上的預(yù)測結(jié)果。
[0125] 我們?yōu)槲磥硪粋€(gè)周期生成預(yù)測。圖4給出了使用不同預(yù)測模型在測試數(shù)據(jù)集下的 RMSE與MAPE。對于Naive,我們簡單地使用最終值作為預(yù)測值。對于MA模型,我們設(shè)置k =3為最佳參數(shù)。對于ARIMA模型,我們設(shè)置參數(shù)為(1,1,0),此時(shí)RMSE最小。我們在ES 模型中設(shè)置ct = 〇. 1與Y = 〇. 1建立DA方法。對于最后一種個(gè),我們選擇3-12-1NN模 型用于比較。圖4(a)與(b)顯示了 PMA預(yù)測的結(jié)果要優(yōu)于其他5種方法的預(yù)測結(jié)果。
[0126] 以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精 神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種利用PM建模預(yù)測短期交通流量的方法,其特征在于,步驟如下: (1) 初步準(zhǔn)備,定義術(shù)語: 采樣流量:交通流量數(shù)據(jù)在所有時(shí)間內(nèi)進(jìn)行收集,每個(gè)采樣流量涉及在某個(gè)特定的時(shí) 間周期內(nèi)經(jīng)過車輛的總數(shù)。每個(gè)周期為At分鐘,交通流量在時(shí)間間隙內(nèi)進(jìn)行 收集,t為整數(shù);q(t)同樣也是整數(shù),表示第t周期內(nèi)的交通流量; 流量模態(tài):對于每個(gè)采樣流量,q(t)為源時(shí)間序列;2個(gè)相關(guān)時(shí)間序列構(gòu)成周期序列 Sa (t)以及曰序列Sb (t),如下所示: ① .Sa(t)為包括q(t)之前的匕個(gè)周期交通流量數(shù)據(jù)的集合;② .Sb(t)為包括q(t)kb天之前相同時(shí)間周期內(nèi)交通流量記錄的集合;(2) PMA建模-建立獨(dú)立模型: i. 獨(dú)立模型的平面流量模態(tài):Sa(t)為水平流量模態(tài),Sb(t)為垂直流量模態(tài),為 預(yù)測值;ii. 模態(tài)權(quán)值:L表不PFP的長度,δ表不的列,m為目標(biāo)日的數(shù)據(jù)集編號(hào)。 iii. PMA預(yù)測值:W為PFP的寬度(見圖2)。每個(gè)PM預(yù)測值對應(yīng)一個(gè)指定的PM大小L1XW1 (3) PMA建模-建立相似模型: WWL算法:在兩個(gè)時(shí)間序列(相同長度)之間,我們使用由歐式距離與皮爾遜相關(guān)系數(shù) 組成的混合距離計(jì)算來生成距離矩陣定義相似性;這里S (t)表示目標(biāo)流量模態(tài),S1 (t)表示第i個(gè)與S (t)相似的模態(tài),數(shù)字d表示W(wǎng)ffL 算法的參數(shù); (4) PM建模-融合: 選擇神經(jīng)網(wǎng)絡(luò)模型將之前獲得的兩個(gè)預(yù)測結(jié)果進(jìn)行融合;η表TK隱藏層中神經(jīng)兀的數(shù)目,1^表不隱藏層的輸出,net表TK最終輸出; (5) 預(yù)測結(jié)果檢驗(yàn)評價(jià)。2.如權(quán)利要求1所述的一種利用PM建模預(yù)測短期交通流量的方法,其特征在于,所述 步驟(4)中必須為至少一天以前。
【專利摘要】本發(fā)明公開了一種利用PMA建模預(yù)測短期交通流量的方法。該發(fā)明步驟包括初步準(zhǔn)備,定義術(shù)語;PMA建模-建立獨(dú)立模型;PMA建模-建立相似模型;PMA建模-融合和預(yù)測結(jié)果檢驗(yàn)評價(jià)。本發(fā)明具有以下優(yōu)點(diǎn):(1)該方法在做出預(yù)測時(shí)同時(shí)綜合了獨(dú)立與相似流量模態(tài),(2)無需大量的交通數(shù)據(jù)集,(3)該方法在預(yù)測復(fù)雜不可預(yù)測的城市交通流量方面與以前的預(yù)測方法相比具有更強(qiáng)的泛化能力。
【IPC分類】G08G1/01
【公開號(hào)】CN105355038
【申請?zhí)枴緾N201510662880
【發(fā)明人】禹曉輝, 康健, 于自強(qiáng), 楊柳
【申請人】青島觀瀾數(shù)據(jù)技術(shù)有限公司
【公開日】2016年2月24日
【申請日】2015年10月14日