專利名稱:一種用于時(shí)間序列相似性比較的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)挖掘領(lǐng)域,特別涉及一種用于時(shí)間序列相似性比較的方法。
技術(shù)背景
時(shí)間序列是客觀對(duì)象的某個(gè)物理量在時(shí)間點(diǎn)上的采樣值按照先后順序排列組成的序列,時(shí)間序列的表示形式為X = Ix1, χ2,知......xj, X表示了所要研究的對(duì)象的物理量,其中^表示在時(shí)刻tn物理量的值。時(shí)間序列的相似性比較,即比較不同時(shí)間序 列之間的相似度,計(jì)算不同時(shí)間序列之間的距離。
時(shí)間序列相似性比較有不同的方法,動(dòng)態(tài)時(shí)間彎折方法的中心思想是在時(shí)間序列 相似性比較中,打破嚴(yán)格的維度對(duì)等(即對(duì)應(yīng)維度進(jìn)行距離計(jì)算)。
現(xiàn)有技術(shù)中的LBJlust距離計(jì)算方法是一種基于動(dòng)態(tài)時(shí)間彎折思想的方法,X和Y 是兩個(gè)時(shí)間序列
X= {x1; x2,......xj
Y = Iy1, J2,……yn}
其中,m和η為元素的個(gè)數(shù),對(duì)X和Y分別定義序列U和L,序列U是時(shí)間序列中的 每個(gè)元素,在2w時(shí)間窗內(nèi)的上界;序列L是時(shí)間序列中的每個(gè)元素,在2w時(shí)間窗內(nèi)的下界。定義第--公式
Uxi =max (Xi-W,Xi+w)
LSi —min(Xi_w,Xi+w)
Uyi =max (Yi_w,yi+w)
Lyi —πι η(Υ -¥,yi+w)
LB_Hust距離計(jì)算公式為
權(quán)利要求
1.一種用于時(shí)間序列相似性比較的方法,其特征在于,所述方法包括以下步驟(1)獲取第一時(shí)間序列X和第二時(shí)間序列Y;(2)對(duì)所述第一時(shí)間序列X和所述第二時(shí)間序列Y,在每一個(gè)時(shí)間點(diǎn)i,在2w時(shí)間窗內(nèi), 根據(jù)第一公式,獲取上界序列Ux、Uy和下界序列Lx、Ly ;(3)對(duì)所述第一時(shí)間序列X和所述第二時(shí)間序列Y,根據(jù)第二公式,在每一個(gè)時(shí)間點(diǎn)i, 計(jì)算趨勢(shì)判斷因子Signi ;(4)根據(jù)第三公式、第四公式,對(duì)所述趨勢(shì)判斷因子Signi為正的時(shí)間點(diǎn)i求LBJlust 距離,獲取正距離distp。s ;對(duì)所述趨勢(shì)判斷因子Signi為負(fù)的時(shí)間點(diǎn)i求LBJlust距離,獲 取負(fù)距離diStneg ;(5)根據(jù)所述正距離distp。s、所述負(fù)距離Clistneg和第五公式,獲取LBJlust符號(hào)距離。
2.根據(jù)權(quán)利要求1所述的用于時(shí)間序列相似性比較的方法,其特征在于,所述第二公 式具體為Signi = (maxindexxi-minindexxi) ^ (maxindexyi-minindexyi)其中,Hiaxindexxi是所述第一時(shí)間序列X在時(shí)間點(diǎn)i的上界化對(duì)應(yīng)的時(shí)間點(diǎn)、 minindexxi是所述第一時(shí)間序列X在時(shí)間點(diǎn)i的下界Lxi對(duì)應(yīng)的時(shí)間點(diǎn)、maxindeXyi是所述 第二時(shí)間序列Y在時(shí)間點(diǎn)i的上界Uyi對(duì)應(yīng)的時(shí)間點(diǎn)、Hiinindexyi是所述第二時(shí)間序列Y在 時(shí)間點(diǎn)i的下界Lyi對(duì)應(yīng)的時(shí)間點(diǎn)。
3.根據(jù)權(quán)利要求1所述的用于時(shí)間序列相似性比較的方法,其特征在于,所述第二么、
4.根據(jù)權(quán)利要求1所述的用于時(shí)間序列相似性比較的方法,其特征在于,所述第四公 式具體為
5.根據(jù)權(quán)利要求1所述的用于時(shí)間序列相似性比較的方法,其特征在于,所述第五公式具體為
6.根據(jù)權(quán)利要求1所述的用于時(shí)間序列相似性比較的方法,其特征在于,在步驟(1)之 前,所述方法還包括對(duì)所述第一時(shí)間序列X和所述第二時(shí)間序列Y進(jìn)行平滑處理和去噪處理。
全文摘要
本發(fā)明公開了一種用于時(shí)間序列相似性比較的方法,屬于數(shù)據(jù)挖掘領(lǐng)域。獲取等長的兩個(gè)時(shí)間序列,第一時(shí)間序列X和第二時(shí)間序列Y;對(duì)第一時(shí)間序列X和第二時(shí)間序列Y,在每一個(gè)時(shí)間點(diǎn)i,在2w時(shí)間窗內(nèi),根據(jù)第一公式,獲取上界序列Ux、Uy和下界序列Lx、Ly;對(duì)第一時(shí)間序列X和第二時(shí)間序列Y,根據(jù)第二公式,在每一個(gè)時(shí)間點(diǎn)i,計(jì)算趨勢(shì)判斷因子signi;根據(jù)第三公式、第四公式,對(duì)趨勢(shì)判斷因子signi為正的時(shí)間點(diǎn)i求LB_Hust距離,獲取正距離distpos,對(duì)趨勢(shì)判斷因子signi為負(fù)的時(shí)間點(diǎn)i求LB_Hust距離,獲取負(fù)距離distneg;根據(jù)正距離distpos、負(fù)距離distneg和第五公式,獲取LB_Hust符號(hào)距離。本發(fā)明提高了判斷精度,滿足了實(shí)際應(yīng)用中的需要。
文檔編號(hào)G06F17/30GK102033936SQ201010596668
公開日2011年4月27日 申請(qǐng)日期2010年12月20日 優(yōu)先權(quán)日2010年12月20日
發(fā)明者劉江, 崔美玲, 王浩 申請(qǐng)人:天津大學(xué)