本發(fā)明涉及相似性度量技術(shù)領(lǐng)域,具體地說,是一種面向海洋領(lǐng)域的多元時間序列相似性度量方法。
背景技術(shù):
21世紀是海洋世紀,在面臨可持續(xù)發(fā)展大課題的新時代,海洋的地位及開發(fā)價值日益為人們所重視。我國作為一個發(fā)展中的沿海國家,毋庸置疑,海洋對我國的發(fā)展也將發(fā)揮越來越重要的作用。然而,近幾十年來,在促進經(jīng)濟發(fā)展的同時,各類海洋災害隨之而來,海洋災害有許多類,其引發(fā)的因素也各不相同。主要有災害性海冰、赤潮、風暴潮和海嘯等等,與大氣相關(guān)的災害現(xiàn)象還有臺風等,其中,我國是受臺風影響最嚴重的國家之一。因此能夠有效描述海洋災害并進行災害預報、發(fā)展趨勢分析具有重要意義。
臺風具有動態(tài)性、空間性、可預測性等特點,動態(tài)性是指其強度在不斷變化;空間性是指在不同區(qū)域其強度不同或者具有相同強度但不發(fā)生在同一個區(qū)域;可預測性是指其發(fā)生過程具有規(guī)律性。臺風數(shù)據(jù)庫中記載了已發(fā)生臺風的發(fā)生時間、結(jié)束時間、經(jīng)緯度、等級、速度、移動速度、移動方向以及壓強等信息,臺風數(shù)據(jù)具有多屬性,需要利用多元時間序列進行研究。目前,對于臺風數(shù)據(jù)的描述、定量分析還不是很完善。
中國發(fā)明專利CN201610811178.3,公開日為2017.02.08,公開了一種交通流相似性的判別方法。但是該方法得到的相似性精確度不如本發(fā)明方法高。
中國發(fā)明專利CN201610264725.0,公開日為2016.08.31,公開了一種基于大數(shù)據(jù)的趨勢曲線局部特征的匹配方法。但是該方法進行二次篩選,數(shù)據(jù)處理量增大,處理速度較慢。
因此,亟需一種準確描述臺風數(shù)據(jù)、進行臺風相似性度量的加權(quán)DTW度量方法,而目前關(guān)于這種相似性度量方法還未見報道。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是針對現(xiàn)有技術(shù)中的不足,提供一種面向海洋領(lǐng)域的多元時間序列相似性度量方法。
為實現(xiàn)上述目的,本發(fā)明采取的技術(shù)方案是:
一種面向海洋領(lǐng)域的多元時間序列相似性度量方法,所述的相似性度量方法包括以下步驟:
S1:收集臺風數(shù)據(jù);
S2:對臺風數(shù)據(jù)進行預處理;
S3:對臺風數(shù)據(jù)進行描述;
S4:對臺風數(shù)據(jù)進行相似性度量;
S5:輸出相似臺風;
其中,所述的步驟S2包括篩選臺風屬性、補充數(shù)據(jù),所述的步驟S3包括移動方向表示、臺風時間序列表示,所述的步驟S4包括臺風屬性權(quán)重計算、W-DTW距離計算、W-DTW距離判斷。
所述的步驟S1收集臺風數(shù)據(jù)包括收集現(xiàn)有臺風原始數(shù)據(jù)、收集數(shù)據(jù)庫中臺風數(shù)據(jù)。
所述的步驟S2對臺風原始數(shù)據(jù)進行預處理的步驟如下:
S21:篩選臺風屬性
選擇需要考慮的臺風屬性,所屬的臺風屬性包括強度L、風速V、移動方向MD、移動速度MV、壓強P;
S22:補充數(shù)據(jù)
將篩選出的臺風屬性值為null的字段根據(jù)前后數(shù)據(jù)進行補充。
所述的步驟S3對臺風數(shù)據(jù)進行描述的步驟如下:
S31:移動方向表示
由于臺風的移動方向采用十六風向圖表示,對其進行數(shù)值化,即臺風數(shù)據(jù)中的移動方向共有16種,用0-15表示,以正北為0,順時針旋轉(zhuǎn),依次是1,2,……,15,對于未采用十六風向圖表示的,也對其進行數(shù)值化表示;
S32:臺風時間序列表示
設(shè)臺風強度L=[L1,L2,……,Ln]T,風速V=[V1,V2,……,Vn]T,移動方向MD=[MD1,MD2,……,MDn]T,移動速度MV=[MV1,MV2,……,MVn]T,壓強P=[P1,P2,……,Pn]T,則臺風時間序列A為:
其中,n表示時間點數(shù),第一行的元素表示該臺風在時刻1時的強度、風速、移動方向、移動速度、壓強的相關(guān)記錄,依此類推,最后一行表示該臺風在時刻n時的強度、風速、移動方向、移動速度、壓強的相關(guān)記錄。
所述的步驟S4對臺風數(shù)據(jù)進行相似性度量的步驟如下:
S41:臺風屬性權(quán)重計算
利用層次構(gòu)造法構(gòu)造判斷矩陣,獲取臺風屬性權(quán)重,其步驟如下:
S411:設(shè)臺風的強度、風速、移動方向、移動速度、壓強的屬性權(quán)重分別為W1、W2、W3、W4、W5;
S412:構(gòu)造判斷矩陣
利用層次構(gòu)造法構(gòu)造判斷矩陣,所得矩陣如下:
S413:對判斷矩陣進行近似解計算
S4131:計算判斷矩陣各行各元素乘積Mi,計算公式為
Mi=Li×Vi×MVi×MDi×Pi(i∈[1,5]);
S4132:計算Mi的n次方根Wi′,計算公式為
S4133:歸一化處理,得到權(quán)重Wi,計算公式為
S4134:計算判斷矩陣的最大特征值λmax;
S4135:進行一致性檢驗,計算公式為
CR=CI/RI
其中,CR是檢驗系數(shù),CI是一致性指標,RI是隨機一致性指標,若CR<0.1,則通過一致性檢驗,則表明權(quán)重符合要求;若CR>0.1,則一致性檢驗不通過,需重新進行權(quán)重計算;
S42:W-DTW距離計算
W-DTW距離為加權(quán)的DTW距離,其計算步驟如下:
S421:選擇現(xiàn)有臺風的時間序列和數(shù)據(jù)庫中任一臺風的時間序列,分別設(shè)為X、Y,則X、Y分別為
S422:計算基距離d(xi,yj),計算公式為
其中,i∈[1,m],j∈[1,n];
S423:計算時間序列X與Y的W-DTW距離,計算公式為
其中,r(i,j)表示r(X(1:i),Y(1:j)),i∈[1,m],j∈[1,n];
S424:重復步驟S421-S423,獲得現(xiàn)有臺風與數(shù)據(jù)庫中每一個臺風的W-DTW距離;
S43:W-DTW距離判斷
將所有的W-DTW距離進行兩兩對比,獲得一個最小的W-DTW距離。
所述的步驟S5輸出相似臺風為輸出與現(xiàn)有臺風W-DTW距離最小的數(shù)據(jù)庫中的臺風。
所述的步驟S413,近似解計算還包括和法計算、冪法計算。
本發(fā)明優(yōu)點在于:
1、判斷具有動態(tài)性、空間性、可預測性以及多屬性的兩個海洋時間序列是否相似;
2、根據(jù)已發(fā)生的海洋事件來判斷當前海洋事件的發(fā)展趨勢;
3、對于海洋災害,可以為相關(guān)部門提供便捷的輔助決策,做好防護措施,減少其帶來的經(jīng)濟損失和人員傷亡。
附圖說明
附圖1是本發(fā)明的一種面向海洋領(lǐng)域的多元時間序列相似性度量方法的流程圖。
附圖2是臺風移動方向數(shù)值化表示參照圖。
附圖3是重要性等級及其賦值參照圖。
附圖4是隨機一致性指標值參照圖。
具體實施方式
下面結(jié)合附圖對本發(fā)明提供的具體實施方式作詳細說明。
實施例1
參照圖1,本發(fā)明的一種面向海洋領(lǐng)域的多元時間序列相似性度量方法的步驟如下:
S1:收集臺風數(shù)據(jù);
S2:對臺風數(shù)據(jù)進行預處理;
S3:對臺風數(shù)據(jù)進行描述;
S4:對臺風數(shù)據(jù)進行相似性度量;
S5:輸出相似臺風;
其中,所述的步驟S2包括篩選臺風屬性、補充數(shù)據(jù),所述的步驟S3包括移動方向表示、臺風時間序列表示,所述的步驟S4包括臺風屬性權(quán)重計算、W-DTW距離計算、W-DTW距離判斷。
實施例2
本發(fā)明的一種面向海洋領(lǐng)域的多元時間序列相似性度量方法的具體工作步驟如下:
S1:收集臺風數(shù)據(jù)
收集臺風數(shù)據(jù)包括收集現(xiàn)有臺風原始數(shù)據(jù)、收集數(shù)據(jù)庫中臺風數(shù)據(jù)。
S2:對臺風原始數(shù)據(jù)進行預處理
S21:篩選臺風屬性
選擇需要考慮的臺風屬性,所屬的臺風屬性包括強度L、風速V、移動方向MD、移動速度MV、壓強P;
S22:補充數(shù)據(jù)
將篩選出的臺風屬性值為null的字段根據(jù)前后數(shù)據(jù)進行補充。
S3:對臺風數(shù)據(jù)進行描述
S31:移動方向表示
由于臺風的移動方向采用十六風向圖表示,對其進行數(shù)值化,參照圖2,即臺風數(shù)據(jù)中的移動方向共有16種,用0-15表示,以正北為0,順時針旋轉(zhuǎn),依次是1,2,……,15,對于未采用十六風向圖表示的,也對其進行數(shù)值化表示;
S32:臺風時間序列表示
設(shè)臺風強度L=[L1,L2,……,Ln]T,風速V=[V1,V2,……,Vn]T,移動方向MD=[MD1,MD2,……,MDn]T,移動速度MV=[MV1,MV2,……,MVn]T,壓強P=[P1,P2,……,Pn]T,則臺風時間序列A為:
其中,n表示時間點數(shù),第一行的元素表示該臺風在時刻1時的強度、風速、移動方向、移動速度、壓強的相關(guān)記錄,依此類推,最后一行表示該臺風在時刻n時的強度、風速、移動方向、移動速度、壓強的相關(guān)記錄;
S4:對臺風數(shù)據(jù)進行相似性度量
S41:臺風屬性權(quán)重計算
利用層次構(gòu)造法構(gòu)造判斷矩陣,獲取臺風屬性權(quán)重,其步驟如下:
S411:設(shè)臺風的強度、風速、移動方向、移動速度、壓強的屬性權(quán)重分別為W1、W2、W3、W4、W5;
S412:構(gòu)造判斷矩陣
利用層次構(gòu)造法構(gòu)造判斷矩陣,所得矩陣如下:
S413:對判斷矩陣進行近似解計算
近似解計算包括根法計算、和法計算、冪法計算,本步驟利用根法進行近似解計算,其步驟如下:
S4131:計算判斷矩陣各行各元素乘積Mi,計算公式為
Mi=Li×Vi×MVi×MDi×Pi(i∈[1,5]);
S4132:計算Mi的n次方根Wi′,計算公式為
S4133:歸一化處理,得到權(quán)重Wi,計算公式為
S4134:計算判斷矩陣的最大特征值λmax;
S4135:進行一致性檢驗,計算公式為
CR=CI/RI
其中,CR是檢驗系數(shù),CI是一致性指標,RI是隨機一致性指標,若CR<0.1,則通過一致性檢驗,則表明權(quán)重符合要求;若CR>0.1,則一致性檢驗不通過,需重新進行權(quán)重計算;
S42:W-DTW距離計算
W-DTW距離為加權(quán)的DTW距離,其計算步驟如下:
S421:選擇現(xiàn)有臺風時間序列和數(shù)據(jù)庫中任一臺風時間序列,分別設(shè)為X、Y,則X、Y分別為
S422:計算基距離d(xi,yj),計算公式為
其中,i∈[1,m],j∈[1,n];
S423:計算時間序列X與Y的W-DTW距離,計算公式為
其中,r(i,j)表示r(X(1:i),Y(1:j)),i∈[1,m],j∈[1,n];
S424:重復步驟S421-S423,獲得現(xiàn)有臺風與數(shù)據(jù)庫中每一個臺風的W-DTW距離;
S43:W-DTW距離判斷
將所有的W-DTW距離進行兩兩對比,獲得一個最小的W-DTW距離;
S5:輸出相似臺風
輸出與現(xiàn)有臺風W-DTW距離最小的數(shù)據(jù)庫中的臺風。
本發(fā)明的一種面向海洋領(lǐng)域的多元時間序列相似性度量方法的優(yōu)點在于,判斷具有動態(tài)性、空間性、可預測性以及多屬性的兩個海洋時間序列是否相似;根據(jù)已發(fā)生的海洋事件來判斷當前海洋事件的發(fā)展趨勢;對于海洋災害,可以為相關(guān)部門提供便捷的輔助決策,做好防護措施,減少其帶來的經(jīng)濟損失和人員傷亡。
實施例3
本發(fā)明的一種面向海洋領(lǐng)域的多元時間序列相似性度量方法的應(yīng)用實施例如下:
S1:收集臺風數(shù)據(jù)
收集臺風數(shù)據(jù)包括收集現(xiàn)有臺風原始數(shù)據(jù)1、收集數(shù)據(jù)庫中臺風數(shù)據(jù)2、3。
S2:對臺風原始數(shù)據(jù)進行預處理
S21:篩選臺風屬性
選擇需要考慮的臺風屬性,所屬的臺風屬性包括強度L、風速V、移動方向MD、移動速度MV、壓強P;
S22:補充數(shù)據(jù)
將篩選出的臺風屬性值為null的字段根據(jù)前后數(shù)據(jù)進行補充。
S3:對臺風數(shù)據(jù)進行描述
S31:移動方向表示
由于臺風的移動方向采用十六風向圖表示,對其進行數(shù)值化,參照圖2,即臺風數(shù)據(jù)中的移動方向共有16種,用0-15表示,以正北為0,順時針旋轉(zhuǎn),依次是1,2,……,15,對于未采用十六風向圖表示的,也對其進行數(shù)值化表示;
S32:臺風時間序列表示
設(shè)臺風強度L=[L1,L2,……,Ln]T,風速V=[V1,V2,……,Vn]T,移動方向MD=[MD1,MD2,……,MDn]T,移動速度MV=[MV1,MV2,……,MVn]T,壓強P=[P1,P2,……,Pn]T,則臺風時間序列A為:
其中,n表示時間點數(shù),第一行的元素表示該臺風在時刻1時的強度、風速、移動方向、移動速度、壓強的相關(guān)記錄,依此類推,最后一行表示該臺風在時刻n時的強度、風速、移動方向、移動速度、壓強的相關(guān)記錄。
獲得臺風1-3的時間序列,如下
S4:對臺風數(shù)據(jù)進行相似性度量
S41:臺風屬性權(quán)重計算
利用層次構(gòu)造法構(gòu)造判斷矩陣,獲取臺風屬性權(quán)重,其步驟如下:
S411:設(shè)臺風的強度、風速、移動方向、移動速度、壓強的屬性權(quán)重分別為W1、W2、W3、W4、W5;
S412:構(gòu)造判斷矩陣
利用層次構(gòu)造法并參照圖3構(gòu)造判斷矩陣,所得矩陣如下:
S413:對判斷矩陣進行近似解計算
本步驟利用根法進行近似解計算,其步驟如下:
S4131:計算判斷矩陣各行各元素乘積Mi,計算公式為
Mi=Li×Vi×MVi×MDi×Pi(i∈[1,5]);
S4132:計算Mi的n次方根Wi′,計算公式為
S4133:歸一化處理,得到權(quán)重Wi,計算公式為
S4134:計算判斷矩陣的最大特征值λmax;
S4135:進行一致性檢驗,計算公式為
CR=CI/RI
其中,CR是檢驗系數(shù),CI是一致性指標,RI是隨機一致性指標,RI的值參照圖4,若CR<0.1,則通過一致性檢驗,則表明權(quán)重符合要求;若CR>0.1,則一致性檢驗不通過,需重新進行權(quán)重計算;
得到權(quán)重W,權(quán)重W如下,
S42:W-DTW距離計算
W-DTW距離為加權(quán)的DTW距離,其計算步驟如下:
S421:選擇時間序列1、2,分別設(shè)為X、Y,則X、Y分別為
S422:計算基距離d(xi,yj),計算公式為
其中,i∈[1,m],j∈[1,n];
取i=8,j=9,并代入相應(yīng)的W值,則d(x8,y9)=1.673;
S423:計算時間序列X與Y的W-DTW距離,計算公式為
其中,r(i,j)表示r(X(1:i),Y(1:j)),i∈[1,m],j∈[1,n]。
將d(x8,y9)=1.673代入計算得r(8,9)=17.297;
S424:重復步驟S421-S423,獲得時間序列1與3的W-DTW距離,r(8,9)=340.928;
S43:W-DTW距離判斷
將所有的W-DTW距離進行對比,獲得一個最小的W-DTW距離,即17.297;
S5:輸出相似臺風
輸出與臺風1相似的臺風2。
以上所述僅是本發(fā)明的優(yōu)選實施方式,應(yīng)當指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員,在不脫離本發(fā)明方法的前提下,還可以做出若干改進和補充,這些改進和補充也應(yīng)視為本發(fā)明的保護范圍。