一種基于時空關(guān)聯(lián)數(shù)據(jù)挖掘的交通流預(yù)測方法
【專利摘要】本發(fā)明屬于交通流預(yù)測【技術(shù)領(lǐng)域】,具體為一種基于時空關(guān)聯(lián)數(shù)據(jù)挖掘的交通流預(yù)測方法。本發(fā)明主要包括預(yù)測模型建立、時空關(guān)聯(lián)數(shù)據(jù)挖掘以及基于時空關(guān)聯(lián)數(shù)據(jù)的交通流預(yù)測等。預(yù)測模型可采用多因子線性回歸模型;時空關(guān)聯(lián)數(shù)據(jù)挖掘是基于多因子線性回歸模型并通過稀疏表達(dá)的優(yōu)化方法自動地選取對于預(yù)測目標(biāo)相關(guān)的時空關(guān)聯(lián)傳感器的數(shù)據(jù);基于時空關(guān)聯(lián)數(shù)據(jù)的交通流預(yù)測是以時空關(guān)聯(lián)傳感器的數(shù)據(jù)作為預(yù)測模型的輸入進(jìn)行的預(yù)測。本發(fā)明從整個交通網(wǎng)絡(luò)中自動地確定與預(yù)測目標(biāo)節(jié)點(diǎn)的傳感器相關(guān)的時空關(guān)聯(lián)傳感器,并以時空關(guān)聯(lián)傳感器的數(shù)據(jù)作為預(yù)測模型的輸入,全自動時空關(guān)聯(lián)數(shù)據(jù)挖掘提升了預(yù)測模型的預(yù)測性能。
【專利說明】一種基于時空關(guān)聯(lián)數(shù)據(jù)挖掘的交通流預(yù)測方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于交通流預(yù)測【技術(shù)領(lǐng)域】,具體涉及一種基于時空關(guān)聯(lián)數(shù)據(jù)挖掘的交通流預(yù)測方法。
【背景技術(shù)】
[0002]近年來,交通流預(yù)測技術(shù)一直在智能交通系統(tǒng)(ITS)中發(fā)揮很重要的作用。交通流預(yù)測技術(shù)能夠幫助通行的個人進(jìn)行智能的出行路線選擇,也可以為交通管理者提供決策支持。
[0003]早期的一些技術(shù)主要針對單序列的交通流預(yù)測??梢愿鶕?jù)預(yù)測模型的有無參數(shù)分為有參數(shù)預(yù)測模型和無參數(shù)預(yù)測模型。在有參數(shù)預(yù)測模型中,季節(jié)性ARIMA(Autoregressive Integrate Moving Average)模型是應(yīng)用最廣泛的一種方法(見參考文獻(xiàn)[I])。它在基于單時間序列的交通流預(yù)測上可以達(dá)到最小的均方誤差(MSE)。而在無參數(shù)預(yù)測模型中,最近鄰方法(Nearest Neighbor Method)被認(rèn)為是可替代季節(jié)性ARIMA的方案(見參考文獻(xiàn)[2]),但是最鄰近預(yù)測方法的預(yù)測效果依賴于歷史數(shù)據(jù)的質(zhì)量??傮w來講,單序列的交通流預(yù)測方法只考慮了序列自身的特征,忽視了不同序列之間的相互作用和關(guān)系O
[0004]由于交通流的演化是通過交通網(wǎng)中所有節(jié)點(diǎn)交通流之間的相互作用而形成的,所以在交通流的預(yù)測中,不同節(jié)點(diǎn)交通流之間的關(guān)系應(yīng)該被考慮進(jìn)去。從而,在近些年基于數(shù)據(jù)時空關(guān)聯(lián)性的多因子交通流預(yù)測成為了研究的熱點(diǎn)。目前流行的方法大致有三種:1、狀態(tài)空間模型或卡爾曼濾 波器(見參考文獻(xiàn)[3] );2、神經(jīng)網(wǎng)絡(luò)(Neural Network)等機(jī)器學(xué)習(xí)方法(見參考文獻(xiàn)[4] ) ;3、時間序列方法,如Vector Autoregressive Moving Average模型(見參考文獻(xiàn)[5]) (VARMA)0而時空關(guān)聯(lián)數(shù)據(jù)的選取則是進(jìn)行多因子交通流預(yù)測的必要步驟。在以往的研究中,時空關(guān)聯(lián)傳感器的選取大部分是根據(jù)人工經(jīng)驗手動選取目標(biāo)節(jié)點(diǎn)一定鄰近范圍內(nèi)的傳感器。只選取目標(biāo)節(jié)點(diǎn)鄰近范圍內(nèi)的傳感器的數(shù)據(jù)作為與預(yù)測模型的輸入比較主觀,沒有反映現(xiàn)實(shí)中數(shù)據(jù)之間真正的時空關(guān)聯(lián)性,無法獲得最佳的預(yù)測性能,基于人工經(jīng)驗的方法缺乏適應(yīng)性,很難實(shí)施到大型的交通網(wǎng)中。
[0005]稀疏表達(dá)作為一種數(shù)學(xué)工具最早應(yīng)用于信號處理領(lǐng)域,被廣泛應(yīng)用于信號壓縮、圖像去模糊、特征提取等,本發(fā)明提出將其應(yīng)用于面向交通流預(yù)測的時空關(guān)聯(lián)數(shù)據(jù)挖掘。稀疏表達(dá)的主要思想為:一個信號y可以通過一個字典D包含的K個原子信號Id1, d2,..., dj,..., dK}的線性組合表示為 y=Dx,其中 y e Rn,dj e Rn,D e RnXK ;或者近似
表達(dá)為y ^ Dx,這里||j-<εη,其中X e Rk為信號y的表示系數(shù),稀疏表達(dá)要求通過盡
可能少的原子信號來表示信號1,即要求線性組合系數(shù)X包含的非零系數(shù)盡可能少,因此,求稀疏解的目標(biāo)函數(shù)可以寫作
[0006]
【權(quán)利要求】
1.一種基于時空關(guān)聯(lián)數(shù)據(jù)挖掘的交通流預(yù)測方法,其特征在于具體步驟為: Ca)通過布局到交通網(wǎng)各個節(jié)點(diǎn)的傳感器采集交通流量的原始數(shù)據(jù); (b)通過數(shù)據(jù)預(yù)處理,將采集的原始數(shù)據(jù)處理為有效的交通流數(shù)據(jù); (C)建立預(yù)測模型:令
2.根據(jù)權(quán)利要求1所述的預(yù)測方法,其特征在于步驟(d)所述通過稀疏表達(dá)優(yōu)化方法要優(yōu)化的目標(biāo)為:
3.根據(jù)權(quán)利要求1所述的預(yù)測方法,其特征在于步驟(d)所述稀疏表達(dá)優(yōu)化方法要優(yōu)化的目標(biāo)為:
4.根據(jù)權(quán)利要求1所述的預(yù)測方法,其特征在于步驟(d)所述的稀疏表達(dá)優(yōu)化方法要優(yōu)化的目標(biāo)為:
【文檔編號】G08G1/00GK103700255SQ201310749807
【公開日】2014年4月2日 申請日期:2013年12月30日 優(yōu)先權(quán)日:2013年12月30日
【發(fā)明者】史世雄, 楊夙 申請人:復(fù)旦大學(xué)