專利名稱:一種數(shù)據(jù)處理方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及智能交通系統(tǒng)技術(shù)領(lǐng)域,尤其涉及一種數(shù)據(jù)處理方法及裝置。
背景技術(shù):
先進(jìn)交通信息服務(wù)系統(tǒng)(Advanced Traffic Information System, ATIS)建立在 完善的信息網(wǎng)絡(luò)基礎(chǔ)之上,該系統(tǒng)可以通過裝備在道路、車、換乘站、停車場以及氣象中心 的傳感器或者數(shù)據(jù)傳輸設(shè)備來獲取各類交通信息,根據(jù)所述獲取到的數(shù)據(jù)進(jìn)行綜合處理。 該系統(tǒng)可以實(shí)時(shí)向社會(huì)提供全面、準(zhǔn)確的實(shí)時(shí)道路交通擁堵信息。但是,通過所述設(shè)備所獲 取到的數(shù)據(jù)不能完全覆蓋所有的道路,從而需要通過歷史數(shù)據(jù)的相似查詢進(jìn)行實(shí)時(shí)數(shù)據(jù)填 補(bǔ),并可用歷史數(shù)據(jù)經(jīng)過分析后進(jìn)行預(yù)測。 為了提高動(dòng)態(tài)交通信息的可用性,需要增加系統(tǒng)的信息預(yù)測的功能,需要對過去
一定時(shí)間周期內(nèi)的歷史路況數(shù)據(jù)進(jìn)行獨(dú)立分析,獲取每條道路在歷史數(shù)據(jù)周期內(nèi)的交通狀
況的變化趨勢,通過接口的方式提供給交通信息服務(wù)系統(tǒng)使用。然而在現(xiàn)有技術(shù)中,通常采
用中值濾波平滑處理來對歷史數(shù)據(jù)進(jìn)行處理,從而實(shí)現(xiàn)數(shù)據(jù)預(yù)測的目的。 在實(shí)現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問題由于現(xiàn)有技
術(shù)所采用的中值濾波平滑處理技術(shù)預(yù)測過程較為隨機(jī),使得預(yù)測精度較低,無法滿足實(shí)際
預(yù)測的需要。
發(fā)明內(nèi)容
本發(fā)明的實(shí)施例提供一種數(shù)據(jù)處理方法及裝置。
為達(dá)到上述目的,本發(fā)明的實(shí)施例采用如下技術(shù)方案
—種數(shù)據(jù)處理方法,包括
獲取歷史數(shù)據(jù)信息; 對所述歷史數(shù)據(jù)信息進(jìn)行數(shù)據(jù)預(yù)處理; 對所述預(yù)處理后的歷史數(shù)據(jù)信息進(jìn)行數(shù)據(jù)合并及填補(bǔ); 將所述數(shù)據(jù)合并及填補(bǔ)后的歷史數(shù)據(jù)信息進(jìn)行動(dòng)態(tài)指數(shù)平滑處理。
—種數(shù)據(jù)處理裝置,包括 信息獲取單元,用于獲取歷史數(shù)據(jù)信息; 預(yù)處理單元,用于對所述歷史數(shù)據(jù)信息進(jìn)行數(shù)據(jù)預(yù)處理; 數(shù)據(jù)合并填補(bǔ)單元,用于對所述預(yù)處理后的歷史數(shù)據(jù)信息進(jìn)行數(shù)據(jù)合并及填補(bǔ);
數(shù)據(jù)平滑單元,用于將所述數(shù)據(jù)合并及填補(bǔ)后的歷史數(shù)據(jù)信息進(jìn)行動(dòng)態(tài)指數(shù)平滑 處理。 本發(fā)明實(shí)施例提供的數(shù)據(jù)處理方法及裝置,通過獲取歷史數(shù)據(jù)信息;對所述歷史 數(shù)據(jù)信息進(jìn)行數(shù)據(jù)預(yù)處理;對所述預(yù)處理后的歷史數(shù)據(jù)信息進(jìn)行數(shù)據(jù)合并及填補(bǔ);將所述 數(shù)據(jù)合并及填補(bǔ)后的歷史數(shù)據(jù)信息進(jìn)行動(dòng)態(tài)指數(shù)平滑處理。與現(xiàn)有技術(shù)相比,本發(fā)明所述 采用的動(dòng)態(tài)指數(shù)平滑處理,可以使得預(yù)測精度較高且能夠滿足實(shí)際預(yù)測的需要。
圖1為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理方法流程圖; 圖2為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理方法中對所述歷史數(shù)據(jù)信息進(jìn)行數(shù)據(jù) 預(yù)處理的步驟的實(shí)現(xiàn)過程流程圖; 圖3為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理方法中對所述預(yù)處理后的歷史數(shù)據(jù)信 息進(jìn)行數(shù)據(jù)合并及填補(bǔ)的步驟的實(shí)現(xiàn)過程過程流程圖; 圖4為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理方法中將所述數(shù)據(jù)合并及填補(bǔ)后的歷 史數(shù)據(jù)信息進(jìn)行動(dòng)態(tài)指數(shù)平滑處理的步驟的實(shí)現(xiàn)過程流程圖;
圖5為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理裝置結(jié)構(gòu)示意圖。
具體實(shí)施例方式
下面結(jié)合附圖對本發(fā)明實(shí)施例數(shù)據(jù)處理方法及裝置進(jìn)行詳細(xì)描述。
如圖1所示,為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理方法,該方法包括
101 :獲取歷史數(shù)據(jù)信息; 102 :對所述歷史數(shù)據(jù)信息進(jìn)行數(shù)據(jù)預(yù)處理;該步驟主要是對所述歷史數(shù)據(jù)進(jìn)行 異常數(shù)據(jù)的剔除,提高歷史數(shù)據(jù)的質(zhì)量。
103 :對所述預(yù)處理后的歷史數(shù)據(jù)信息進(jìn)行數(shù)據(jù)合并及填補(bǔ); 104:將所述數(shù)據(jù)合并及填補(bǔ)后的歷史數(shù)據(jù)信息進(jìn)行動(dòng)態(tài)指數(shù)平滑處理。 由于所述歷史數(shù)據(jù)在采集和處理輸出過程中存在各種干擾會(huì)產(chǎn)生一批異常數(shù)據(jù),
如果對所述異常數(shù)據(jù)進(jìn)行數(shù)據(jù)分析會(huì)影響到最后預(yù)測結(jié)果的準(zhǔn)確度,所以需要對所述歷史
數(shù)據(jù)進(jìn)行預(yù)處理,消除所述異常數(shù)據(jù)。本發(fā)明實(shí)施例中可以采用一種基于時(shí)間帶的統(tǒng)計(jì)方
法來剔除異常車速值。 如圖2所示,為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理方法中對所述歷史數(shù)據(jù)信息進(jìn) 行數(shù)據(jù)預(yù)處理的步驟的實(shí)現(xiàn)過程;設(shè)所述歷史數(shù)據(jù)的時(shí)間維度的取值為00:00-23:59 ;每5 分鐘為一個(gè)時(shí)間段;時(shí)間帶是指某道路的一天的車速值;其中,以半小時(shí)為一個(gè)時(shí)間帶。所 述歷史數(shù)據(jù)預(yù)處理以連續(xù)一個(gè)月以上的城市歷史路況數(shù)據(jù)為基礎(chǔ),剔除一些異常數(shù)據(jù),其 具體的實(shí)現(xiàn)過程包括 201 :將所述歷史數(shù)據(jù)信息進(jìn)行時(shí)間帶劃分;其中,所述歷史數(shù)據(jù)可以是從數(shù)據(jù)庫 中讀出的歷史車速值;所述的時(shí)間帶劃分是對指定道路的一天的車速以半小時(shí)進(jìn)行劃分, 從而初步得到48個(gè)時(shí)間帶。
202 :按照劃分的時(shí)間帶,進(jìn)行合并校驗(yàn);該步驟的具體實(shí)現(xiàn)過程為 將所述劃分好的時(shí)間帶先后使用F檢驗(yàn)和雙樣本的T檢驗(yàn)來判斷是否能夠合并時(shí)
間帶;其中,所述F檢驗(yàn)用于判斷兩個(gè)待檢驗(yàn)的時(shí)間帶的方差是否相等;所述雙樣本的T檢
驗(yàn)用于判斷兩個(gè)待檢驗(yàn)的時(shí)間帶的均值是否相等;如果所述的F檢驗(yàn)與所述雙樣本的T檢
驗(yàn)都通過則合并相鄰的兩個(gè)時(shí)間帶。
構(gòu)造F檢驗(yàn)統(tǒng)計(jì)量的公式為F二古 F("! _1,"2 -1)
巧—丄,=i "2 — i /=I
Xi、 l分別為兩個(gè)正態(tài)總體的各個(gè)車速值; 文、?為樣本均值。
F檢驗(yàn)的拒絕域?yàn)?br>
『=< & - 1, "2 - l)或F >《2 (", - 1, "2 - 1)}
a為檢驗(yàn)水平。
<formula>formula see original document page 6</formula>
構(gòu)造T檢驗(yàn)統(tǒng)計(jì)量的公式為<formula>formula see original document page 6</formula>
其中,&、&分別為兩個(gè)正態(tài)總體的有效值個(gè)數(shù);
~2 - 1)&2 "2、"分別為兩個(gè)正態(tài)總體的方差)<formula>formula see original document page 6</formula>
T檢驗(yàn)的拒絕域?yàn)? =們> + "2 一 2)} 需要注意的是,如果所述時(shí)間帶滿足合并條件,則將其合并,然后將合并后的時(shí)間 帶作為一個(gè)時(shí)間帶進(jìn)行處理;如果所述時(shí)間帶不滿足合并條件,則將其仍然按照其預(yù)處理 后劃分的時(shí)間帶進(jìn)行后續(xù)的處理。 203 :將所述經(jīng)過合并校驗(yàn)的時(shí)間帶進(jìn)行異常校驗(yàn),給出異常校驗(yàn)結(jié)果;該步驟的 實(shí)現(xiàn)過程為遍歷經(jīng)過合并處理的時(shí)間帶,對所述有效的時(shí)間帶分別進(jìn)行U檢驗(yàn)或單樣本 的T檢驗(yàn),如果所述有效的時(shí)間帶未通過所述檢驗(yàn),則認(rèn)為該條數(shù)據(jù)為異常數(shù)據(jù),將所述異
常數(shù)據(jù)記錄到異常校驗(yàn)結(jié)果中。其中,所述u檢驗(yàn)適用于樣本量充分大的情況。 需要注意的是,U檢驗(yàn)用于樣本數(shù)很大的情況下,此處條件為車速有效值個(gè)數(shù)大于 30。構(gòu)造U檢驗(yàn)統(tǒng)計(jì)量的公式為# = 其中,Xi代表該時(shí)間帶中的車速變量,P代表時(shí)間帶的車速均值,o代表時(shí)間帶
的車速方差,n代表時(shí)間帶的有效值個(gè)數(shù); U檢驗(yàn)的拒絕域?yàn)閃= {|U| > ii a/2}; 單樣本T檢驗(yàn)用于小樣本量的情況下,此處條件為車速有效值個(gè)數(shù)小于或等于30
A構(gòu)造T檢驗(yàn)統(tǒng)計(jì)量的公式為 其中,Xi代表該時(shí)間帶中的車速變量,P代表時(shí)間帶的車速均值,s代表時(shí)間帶的
車速方差,n代表時(shí)間帶的有效值個(gè)數(shù); T檢驗(yàn)的拒絕域?yàn)閃 = {I T I > ta (n-1)}。 204 :根據(jù)所述異常校驗(yàn)結(jié)果,將異常數(shù)據(jù)剔除。 如圖3所示,為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理方法中對所述預(yù)處理后的歷史 數(shù)據(jù)信息進(jìn)行數(shù)據(jù)合并及填補(bǔ)的步驟的實(shí)現(xiàn)過程,該過程包括
301 :接收所述經(jīng)過異常數(shù)據(jù)剔除的歷史數(shù)據(jù)信息;
302 :將所述歷史數(shù)據(jù)信息中相同時(shí)刻的數(shù)據(jù)進(jìn)行合并處理;具體的講,就是對相 同星期特征日,相同時(shí)間點(diǎn)上的數(shù)據(jù)進(jìn)行合并,簡單的使用算術(shù)平均值的方法進(jìn)行合并處 理后,得到一組數(shù)據(jù)。
303 :檢測所述合并處理后的數(shù)據(jù)是否存在時(shí)刻點(diǎn)上無數(shù)據(jù); 304:如果存在時(shí)刻點(diǎn)上無數(shù)據(jù),則進(jìn)行數(shù)據(jù)填補(bǔ)處理。其中,所述進(jìn)行數(shù)據(jù)填補(bǔ)處 理可以采用最小二乘法的方法進(jìn)行填補(bǔ),例如可以取需要填補(bǔ)數(shù)據(jù)的時(shí)間點(diǎn)前后各兩個(gè) 時(shí)間上的數(shù)據(jù)做樣本點(diǎn);其具體實(shí)現(xiàn)過程如下
建立回歸模型為f =在+>^; 其中X表示需要填充數(shù)據(jù)的時(shí)間點(diǎn);
f表示該時(shí)間點(diǎn)上應(yīng)該要填補(bǔ)的數(shù)據(jù);
在4-4 .
1=1 ;=i 1=1 ,=i (Xi, y》為選取的x時(shí)間點(diǎn)前后各兩個(gè)時(shí)間上的數(shù)據(jù)值。 如圖4所示,為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理方法中將所述數(shù)據(jù)合并及填補(bǔ) 后的歷史數(shù)據(jù)信息進(jìn)行動(dòng)態(tài)指數(shù)平滑處理的步驟的實(shí)現(xiàn)過程,該過程設(shè)平滑系數(shù)a的初 值為a。,指數(shù)平滑的初值及控制精度e 。其中,所述控制精度用來判斷是否為近似最優(yōu)解。 該過程具體包括 401 :接收所述經(jīng)過數(shù)填補(bǔ)處理的歷史數(shù)據(jù)信息; 402:獲取平滑系數(shù)a的初值a 。,指數(shù)平滑初值以及控制精度e ; 403 :根據(jù)所述平滑系數(shù)的初值以及所述指數(shù)平滑初值,獲取所述指數(shù)平滑初值下
一時(shí)刻點(diǎn)的指數(shù)平滑數(shù)值;其中,所述的指數(shù)平滑數(shù)值是通過指數(shù)平滑法的計(jì)算公式獲得
的。所述的指數(shù)平滑法是由移動(dòng)平均方法發(fā)展而來的一種信息處理方法。該方法不需要存
儲(chǔ)n期的時(shí)間序列數(shù)據(jù),而給近期的實(shí)際數(shù)據(jù)以較大的權(quán)數(shù),給遠(yuǎn)期的數(shù)據(jù)以較小的權(quán)數(shù),
而且各期數(shù)據(jù)的權(quán)數(shù)符合指數(shù)規(guī)律。指數(shù)平滑法計(jì)算公式為 =吼+(1 —(1-1) 式中,由于本發(fā)明實(shí)施例中的數(shù)據(jù)為0:00-23:59中每5分鐘的一個(gè)數(shù)據(jù),t取值 1-288,表示從0:00開始每5分鐘一個(gè)時(shí)間點(diǎn),t = l,表示0:00 ;t = 288,表示23:55 ; -—時(shí)期t后一個(gè)5分鐘的平滑值; yt-—時(shí)期t的實(shí)際值; ^-—時(shí)期t的平滑值; a—一平滑系數(shù),又稱加權(quán)因子,取值范圍為O《a《1。 上式表明指數(shù)平滑預(yù)測是用預(yù)測誤差不斷地對上期的預(yù)測值進(jìn)行修正,而得到 本期的預(yù)測值。;,+1是;和yt的加權(quán)算數(shù)平均數(shù),隨著a取值的大小變化,決定^和yt對
;w的影響程度。^+1具有逐期追溯性質(zhì),包含有全期數(shù)據(jù)的影響。
7
所述最優(yōu)梯度法是應(yīng)用目標(biāo)函數(shù)的負(fù)梯度方向作為每一步迭代的搜索方向。因?yàn)?每一步都取負(fù)梯度方向的最優(yōu)步長,所以稱為最優(yōu)梯度法。應(yīng)用最優(yōu)梯度法,會(huì)使其目標(biāo)函 數(shù)值在前幾步下降最快,故稱為最速下降法。
例如一個(gè)n維非線性函數(shù)f (X)的梯度定義為
<formula>formula see original document page 8</formula>
這是一個(gè)n維偏導(dǎo)向J
梯度的單位向量為S<formula>formula see original document page 8</formula> 可以看出,梯度方向也就是函數(shù)的法線方向,負(fù)梯度方向與-s同向。其中iiy/tx)u
叫做梯度v/(x)的模,也叫范數(shù)。模的計(jì)算公式為
梯度方向的性質(zhì)有沿負(fù)梯度方向函數(shù)值下降最快,為最速下降方向。最優(yōu)梯度法 的迭代公式 先令Xk+1 = Xk+ A kSk ; 其中,單位向量^ 入k為最優(yōu)步長。因此,對最優(yōu)梯度法的具體定義是始終沿負(fù)梯度方向取最優(yōu)步 長搜索的最優(yōu)化數(shù)值方法。 由最優(yōu)梯度法的迭代公式,可有函數(shù)極小化的公式 m*(X* + a )=瓶+義a )=瓶+1)
將f (X)在Xk點(diǎn)附近展開成泰勒級數(shù)/(X卜/(X*)+VT/(X》X + ^AXTAAX ; 其中,h
32/ 52/32/
3x23x ;
將AX= ASk代入上式,有 /(X)=/(X4)+VT/(XAK +>)TA(A&)
而
3義
所以最優(yōu)步長可表示為
vT/(x)&
4=— 由于本發(fā)明實(shí)施例中為求min5SE二 J]
i
7=1
的最小值,該函數(shù)
是含變量a的一維函數(shù)。所以推導(dǎo)一維的cik值,推導(dǎo)過程如下 [O川]ak+1 = ak+ASk射"=—^k^,入亂 mjn /(a + ao = /(a + v*) = ) 將f(x)在cik點(diǎn)附近展開成泰勒級數(shù)/(x)^(cO+V/(cOAx +會(huì)/"(cOAx2; 因Ax =入Sk,帶入上式,有 =/(^)+v/( * ;k +1 /" )27/8頁
驗(yàn)結(jié)果
而蓋= v/(a k +義/" h2 = o
所以最優(yōu)步長可表示為 ,、_ v/(q)
這樣,利用最優(yōu)梯度法的方式,從a。出發(fā)沿-v&s^(cO方向進(jìn)行一維搜索,求最
獲取至'K = a—, - V,v鵬(aH ) , " 1;
若iiv5^(cOl^"則ak就是近似最優(yōu)解,輸出cik并轉(zhuǎn)向步驟二,否則轉(zhuǎn)向步驟
步驟二 根據(jù)所述建立的優(yōu)化模型,獲取所述最優(yōu)平滑系數(shù)。具體的講就是將近似 牟ak帶入指數(shù)平滑模型,并用于預(yù)測。
如圖5所示,為本發(fā)明實(shí)施例提供的一種數(shù)據(jù)處理裝置,該裝置包括 信息獲取單元501,用于獲取歷史數(shù)據(jù)信息; 預(yù)處理單元502,用于對所述歷史數(shù)據(jù)信息進(jìn)行數(shù)據(jù)預(yù)處理; 數(shù)據(jù)合并填補(bǔ)單元503,用于對所述預(yù)處理后的歷史數(shù)據(jù)信息進(jìn)行數(shù)據(jù)合并及填
數(shù)據(jù)平滑單元504,用于將所述數(shù)據(jù)合并及填補(bǔ)后的歷史數(shù)據(jù)信息進(jìn)行動(dòng)態(tài)指數(shù)
其中,所述預(yù)處理單元,包括
時(shí)間帶劃分子單元,用于將所述歷史數(shù)據(jù)信息進(jìn)行時(shí)間帶劃分; 合并校驗(yàn)子單元,用于按照劃分的時(shí)間帶,進(jìn)行合并校驗(yàn);
異常校驗(yàn)子單元,用于將所述經(jīng)過合并校驗(yàn)的時(shí)間帶進(jìn)行異常校驗(yàn),給出異常校
異常值剔除子單元,用于根據(jù)所述異常校驗(yàn)結(jié)果,將異常數(shù)據(jù)剔除。 所述數(shù)據(jù)合并填補(bǔ)單元,包括
數(shù)據(jù)信息接收子單元,用于接收所述經(jīng)過異常數(shù)據(jù)剔除的歷史數(shù)據(jù)信息; 數(shù)據(jù)合并子單元,用于將所述歷史數(shù)據(jù)信息中相同時(shí)刻的數(shù)據(jù)進(jìn)行合并處理; 數(shù)據(jù)檢查子單元,用于檢測所述合并處理后的數(shù)據(jù)是否存在時(shí)刻點(diǎn)上無數(shù)據(jù); 數(shù)據(jù)填補(bǔ)子單元,用于如果存在時(shí)刻點(diǎn)上無數(shù)據(jù),則進(jìn)行數(shù)據(jù)填補(bǔ)處理。
所述數(shù)據(jù)合并填補(bǔ)單元,包括
數(shù)據(jù)信息接收子單元,用于接收所述經(jīng)過異常數(shù)據(jù)剔除的歷史數(shù)據(jù)信息; 數(shù)據(jù)合并子單元,用于將所述歷史數(shù)據(jù)信息中相同時(shí)刻的數(shù)據(jù)進(jìn)行合并處理; 數(shù)據(jù)檢查子單元,用于檢測所述合并處理后的數(shù)據(jù)是否存在時(shí)刻點(diǎn)上無數(shù)據(jù); 數(shù)據(jù)填補(bǔ)子單元,用于如果存在時(shí)刻點(diǎn)上無數(shù)據(jù),則進(jìn)行數(shù)據(jù)填補(bǔ)處理。
所述數(shù)據(jù)平滑單元,包括
數(shù)據(jù)信息接收子單元,用于接收所述經(jīng)過數(shù)填補(bǔ)處理的歷史數(shù)據(jù)信息; 參數(shù)獲取子單元,用于獲取平滑系數(shù)的初值,指數(shù)平滑初值以及控制精度; 指數(shù)平滑值獲取子單元,用于根據(jù)所述平滑系數(shù)的初值以及所述指數(shù)平滑初值,獲取所述指數(shù)平滑初值下一時(shí)刻點(diǎn)的指數(shù)平滑數(shù)值; 最優(yōu)平滑系數(shù)判斷子單元,用于根據(jù)所述獲取到的指數(shù)平滑數(shù)據(jù)以及控制精度, 判斷所述平滑系數(shù)是否最優(yōu)平滑系數(shù); 平滑處理子單元,用于如果是最優(yōu)平滑系數(shù),則繼續(xù)進(jìn)行下一時(shí)刻點(diǎn)的指數(shù)平滑 處理; 平滑系數(shù)搜索子單元,用于如果不是最優(yōu)平滑系數(shù),則進(jìn)行平滑系數(shù)搜索。
需要注意的是,所述平滑系數(shù)搜索子單元,可以進(jìn)一步包括 優(yōu)化模型建立分單元,用于為所述平滑系數(shù)建立預(yù)測誤差平方和最小的優(yōu)化模 型; 最優(yōu)平滑系數(shù)獲取分單元,用于根據(jù)所述建立的優(yōu)化模型,獲取所述最優(yōu)平滑系 數(shù)。 本發(fā)明實(shí)施例提供的數(shù)據(jù)處理方法及裝置,通過獲取歷史數(shù)據(jù)信息;對所述歷史 數(shù)據(jù)信息進(jìn)行數(shù)據(jù)預(yù)處理;對所述預(yù)處理后的歷史數(shù)據(jù)信息進(jìn)行數(shù)據(jù)合并及填補(bǔ);將所述 數(shù)據(jù)合并及填補(bǔ)后的歷史數(shù)據(jù)信息進(jìn)行動(dòng)態(tài)指數(shù)平滑處理。與現(xiàn)有技術(shù)相比,本發(fā)明所述 采用的動(dòng)態(tài)指數(shù)平滑處理,可以使得預(yù)測精度較高且能夠滿足實(shí)際預(yù)測的需要。
通過以上的實(shí)施方式的描述,本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方 法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成,所述的程序可以存儲(chǔ)于 一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),包括如上述方法實(shí)施例的步驟,所述的存儲(chǔ) 介質(zhì),如FLASH、 R0M/RAM、磁碟、光盤等。 以上所述,僅為本發(fā)明的具體實(shí)施方式
,但本發(fā)明的保護(hù)范圍并不局限于此,任何 熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵 蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)所述以權(quán)利要求的保護(hù)范圍為準(zhǔn)。
權(quán)利要求
一種數(shù)據(jù)處理方法,其特征在于,包括獲取歷史數(shù)據(jù)信息;對所述歷史數(shù)據(jù)信息進(jìn)行數(shù)據(jù)預(yù)處理;對所述預(yù)處理后的歷史數(shù)據(jù)信息進(jìn)行數(shù)據(jù)合并及填補(bǔ);將所述數(shù)據(jù)合并及填補(bǔ)后的歷史數(shù)據(jù)信息進(jìn)行動(dòng)態(tài)指數(shù)平滑處理。
2. 根據(jù)權(quán)利要求1所述的數(shù)據(jù)處理方法,其特征在于,對所述歷史數(shù)據(jù)信息進(jìn)行數(shù)據(jù) 預(yù)處理的步驟,包括將所述歷史數(shù)據(jù)信息進(jìn)行時(shí)間帶劃分; 按照劃分的時(shí)間帶,進(jìn)行合并校驗(yàn);將所述經(jīng)過合并校驗(yàn)的時(shí)間帶進(jìn)行異常校驗(yàn),給出異常校驗(yàn)結(jié)果; 根據(jù)所述異常校驗(yàn)結(jié)果,將異常數(shù)據(jù)剔除。
3. 根據(jù)權(quán)利要求2所述的數(shù)據(jù)處理方法,其特征在于,對所述預(yù)處理后的歷史數(shù)據(jù)信 息進(jìn)行數(shù)據(jù)合并及填補(bǔ)的步驟,包括接收所述經(jīng)過異常數(shù)據(jù)剔除的歷史數(shù)據(jù)信息; 將所述歷史數(shù)據(jù)信息中相同時(shí)刻的數(shù)據(jù)進(jìn)行合并處理; 檢測所述合并處理后的數(shù)據(jù)是否存在時(shí)刻點(diǎn)上無數(shù)據(jù); 如果存在時(shí)刻點(diǎn)上無數(shù)據(jù),則進(jìn)行數(shù)據(jù)填補(bǔ)處理。
4. 根據(jù)權(quán)利要求3所述的數(shù)據(jù)處理方法,其特征在于,將所述數(shù)據(jù)合并及填補(bǔ)后的歷 史數(shù)據(jù)信息進(jìn)行動(dòng)態(tài)指數(shù)平滑處理的步驟,包括接收所述經(jīng)過數(shù)填補(bǔ)處理的歷史數(shù)據(jù)信息; 獲取平滑系數(shù)的初值,指數(shù)平滑初值以及控制精度;根據(jù)所述平滑系數(shù)的初值以及所述指數(shù)平滑初值,獲取所述指數(shù)平滑初值下一時(shí)刻點(diǎn) 的指數(shù)平滑數(shù)值;根據(jù)所述獲取到的指數(shù)平滑數(shù)據(jù)以及控制精度,判斷所述平滑系數(shù)是否最優(yōu)平滑系數(shù);如果是最優(yōu)平滑系數(shù),則繼續(xù)進(jìn)行下一時(shí)刻點(diǎn)的指數(shù)平滑處理; 如果不是最優(yōu)平滑系數(shù),則進(jìn)行平滑系數(shù)搜索。
5. 根據(jù)權(quán)利要求4所述的數(shù)據(jù)處理方法,其特征在于,所述平滑系數(shù)搜索的步驟,包括為所述平滑系數(shù)建立預(yù)測誤差平方和最小的優(yōu)化模型; 根據(jù)所述建立的優(yōu)化模型,獲取所述最優(yōu)平滑系數(shù)。
6. —種數(shù)據(jù)處理裝置,其特征在于, 信息獲取單元,用于獲取歷史數(shù)據(jù)信息; 預(yù)處理單元,用于對所述歷史數(shù)據(jù)信息進(jìn)行數(shù)據(jù)預(yù)處理;數(shù)據(jù)合并填補(bǔ)單元,用于對所述預(yù)處理后的歷史數(shù)據(jù)信息進(jìn)行數(shù)據(jù)合并及填補(bǔ); 數(shù)據(jù)平滑單元,用于將所述數(shù)據(jù)合并及填補(bǔ)后的歷史數(shù)據(jù)信息進(jìn)行動(dòng)態(tài)指數(shù)平滑處理。
7. 根據(jù)權(quán)利要求6所述的數(shù)據(jù)處理裝置,其特征在于,所述預(yù)處理單元,包括 時(shí)間帶劃分子單元,用于將所述歷史數(shù)據(jù)信息進(jìn)行時(shí)間帶劃分;合并校驗(yàn)子單元,用于按照劃分的時(shí)間帶,進(jìn)行合并校驗(yàn);異常校驗(yàn)子單元,用于將所述經(jīng)過合并校驗(yàn)的時(shí)間帶進(jìn)行異常校驗(yàn),給出異常校驗(yàn)結(jié)果;異常值剔除子單元,用于根據(jù)所述異常校驗(yàn)結(jié)果,將異常數(shù)據(jù)剔除。
8. 根據(jù)權(quán)利要求7所述的數(shù)據(jù)處理裝置,其特征在于,所述數(shù)據(jù)合并填補(bǔ)單元,包括 數(shù)據(jù)信息接收子單元,用于接收所述經(jīng)過異常數(shù)據(jù)剔除的歷史數(shù)據(jù)信息; 數(shù)據(jù)合并子單元,用于將所述歷史數(shù)據(jù)信息中相同時(shí)刻的數(shù)據(jù)進(jìn)行合并處理; 數(shù)據(jù)檢查子單元,用于檢測所述合并處理后的數(shù)據(jù)是否存在時(shí)刻點(diǎn)上無數(shù)據(jù); 數(shù)據(jù)填補(bǔ)子單元,用于如果存在時(shí)刻點(diǎn)上無數(shù)據(jù),則進(jìn)行數(shù)據(jù)填補(bǔ)處理。
9. 根據(jù)權(quán)利要求8所述的數(shù)據(jù)處理裝置,其特征在于,所述數(shù)據(jù)平滑單元,包括 數(shù)據(jù)信息接收子單元,用于接收所述經(jīng)過數(shù)填補(bǔ)處理的歷史數(shù)據(jù)信息; 參數(shù)獲取子單元,用于獲取平滑系數(shù)的初值,指數(shù)平滑初值以及控制精度; 指數(shù)平滑值獲取子單元,用于根據(jù)所述平滑系數(shù)的初值以及所述指數(shù)平滑初值,獲取所述指數(shù)平滑初值下一時(shí)刻點(diǎn)的指數(shù)平滑數(shù)值;最優(yōu)平滑系數(shù)判斷子單元,用于根據(jù)所述獲取到的指數(shù)平滑數(shù)據(jù)以及控制精度,判斷 所述平滑系數(shù)是否最優(yōu)平滑系數(shù);平滑處理子單元,用于如果是最優(yōu)平滑系數(shù),則繼續(xù)進(jìn)行下一時(shí)刻點(diǎn)的指數(shù)平滑處理;平滑系數(shù)搜索子單元,用于如果不是最優(yōu)平滑系數(shù),則進(jìn)行平滑系數(shù)搜索。
10. 根據(jù)權(quán)利要求9所述的數(shù)據(jù)處理裝置,其特征在于,所述平滑系數(shù)搜索子單元,包括優(yōu)化模型建立分單元,用于為所述平滑系數(shù)建立預(yù)測誤差平方和最小的優(yōu)化模型; 最優(yōu)平滑系數(shù)獲取分單元,用于根據(jù)所述建立的優(yōu)化模型,獲取所述最優(yōu)平滑系數(shù)。
全文摘要
本發(fā)明公開了一種數(shù)據(jù)處理方法及裝置,涉及智能交通系統(tǒng)技術(shù)領(lǐng)域。為了解決現(xiàn)有技術(shù)中由于現(xiàn)有技術(shù)所采用的中值濾波平滑處理技術(shù)預(yù)測過程較為隨機(jī),使得預(yù)測精度較低,無法滿足實(shí)際預(yù)測的需要而發(fā)明。本發(fā)明實(shí)施例提供了一種數(shù)據(jù)處理方法,該方法包括獲取歷史數(shù)據(jù)信息;對所述歷史數(shù)據(jù)信息進(jìn)行數(shù)據(jù)預(yù)處理;對所述預(yù)處理后的歷史數(shù)據(jù)信息進(jìn)行數(shù)據(jù)合并及填補(bǔ);將所述數(shù)據(jù)合并及填補(bǔ)后的歷史數(shù)據(jù)信息進(jìn)行動(dòng)態(tài)指數(shù)平滑處理。采用本發(fā)明實(shí)施例可以提高預(yù)測精度,滿足實(shí)際預(yù)測的需要。
文檔編號G06F19/00GK101794345SQ20091024415
公開日2010年8月4日 申請日期2009年12月30日 優(yōu)先權(quán)日2009年12月30日
發(fā)明者付新剛, 莊明亮, 李建軍, 申小次, 賈學(xué)力 申請人:北京世紀(jì)高通科技有限公司