基于改進dtw算法的間歇過程批次數(shù)據(jù)同步方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于間歇過程故障檢測領(lǐng)域,更為具體地講,涉及一種基于改進DTW算法 的間歇過程批次數(shù)據(jù)同步方法。
【背景技術(shù)】
[0002] 間歇過程是現(xiàn)代流程工業(yè)最主要的生產(chǎn)方式,由于其本身的靈活性,被廣泛應用 于多品種、高附加值產(chǎn)品的生產(chǎn)中。然而,由于其過程本身的復雜性以及其他干擾的影響, 使得實際運行軌跡與期望軌跡間往往存在較大差異,并最終導致產(chǎn)品質(zhì)量顯著下降。此外, 這類系統(tǒng)一旦發(fā)生故障,不僅會造成人員和財產(chǎn)損失,而且環(huán)境污染也比其他事故嚴重得 多。因此,間歇過程的故障監(jiān)測和質(zhì)量預測,一直是過程控制領(lǐng)域研宄的熱點之一。
[0003] 傳統(tǒng)的間歇過程故障檢測方法如MPCA((MultilinearPrincipalComponent Analysis,多線性主成分分析),進行間歇過程故障檢測的一個重要前提是不同批次的數(shù)據(jù) 具有相同的長度。而實際間歇過程具有很強的復雜性,這樣就導致同一個間歇過程的不同 批次之間不可能達到理想的重復生產(chǎn),因此過程數(shù)據(jù)的長度也不可能完全相同。在多階段 間歇過程中,數(shù)據(jù)不同步問題表現(xiàn)的相當復雜,數(shù)據(jù)不同步現(xiàn)象在某一個或某幾個特定的 階段中都有可能發(fā)生。針對以上問題,Lakshminarayanan等提出將所有批次軌跡都擴至最 長,即選取批次中最長軌跡為標準,將其他批次數(shù)據(jù)擴至標準軌跡長度,人為加上測量值。 當然還有按最短軌跡為標準,人為刪除非標準長度批次數(shù)據(jù)的一些數(shù)據(jù)點,實現(xiàn)不同批次 數(shù)據(jù)等長。這些方法都忽略了局部模式的特點,即只是簡單地強行將數(shù)據(jù)變?yōu)榈乳L,很可能 放大或丟失原始數(shù)據(jù)的局部特性。動態(tài)時間規(guī)整(DynamicTimeWraping,DTW)是基于動 態(tài)規(guī)劃(DP)的思想,是一種衡量兩個長度不同的時間序列的相似度的方法,主要用于模板 匹配中,比如語音識別、手勢識別、數(shù)據(jù)挖掘和信息檢索等,因而該方法可以將間歇過程各 批次數(shù)據(jù)規(guī)整到標準批次序列,實現(xiàn)各批次同步。
[0004] DTW是一種基于動態(tài)規(guī)劃理論(DP)提出的模式匹配方法,該算法將時間規(guī)整和距 離測度計算相結(jié)合,通過搜尋兩條軌跡間的相似特征來進行壓縮、擴張或轉(zhuǎn)換某些向量,以 獲得兩條軌跡間的最小距離。
[0005] 以本發(fā)明所針對的間歇過程為例,設T(tXN)和R(rXN)為2條多元軌跡,分別代 表參考批次和參考批次,其中t和r分別為兩個批次的采樣點數(shù),也就是采樣次數(shù),N為每次 采樣所采集的變量個數(shù)。DTW運用動態(tài)規(guī)劃原理,非線性地錯位2條軌跡,排列相似事件,使 其中一條軌跡的各向量與另一條軌跡的各向量相對應,以獲得兩條軌跡間的最短距離。設 i和j分別為R(rXN)和T(tXN)軌跡上的關(guān)于時間的坐標,即表示第幾次采樣,取值范圍 分別為1彡i彡r,l彡j彡t,R(iXN)表示R(rXN)軌跡第i個采樣數(shù)據(jù),T(jXN)表示 T(tXN)軌跡第j個采樣數(shù)據(jù)。DTW在rXt網(wǎng)格中建立K個點的F*序列:
[0006] F* = {c (I),c (2),? ? ?,c (k),? ? ?,c (K)} (1)
[0007] 其中max(t,r) <K<t+r,c(k) =[i(k),j(k)],為網(wǎng)格中表示i和j匹配的每 一點。
[0008] 在DTW算法中,F(xiàn)*序列可看作使兩軌跡之間標準距離最短的一條處于rXt網(wǎng)格 中的最優(yōu)路徑。設d(i,j)代表R(iXN)和T(jXN)的歐氏距離值:
【主權(quán)項】
1. 一種基于改進DTW算法的間歇過程批次數(shù)據(jù)同步方法,其特征在于,包括以下步驟: 51 :預設參考批次的采樣點數(shù)r,從正常間歇過程的批次數(shù)據(jù)中選取采樣點數(shù)為r的若 干批次數(shù)據(jù),對選取的批次數(shù)據(jù)進行聚類,將得到的聚類數(shù)量記為D,從每個聚類中選擇與 聚類中心距離最近的批次數(shù)據(jù)作為參考批次數(shù)據(jù),共計D個參考批次數(shù)據(jù); 52 :對于需要進行同步的測試批次數(shù)據(jù)批次數(shù)據(jù),分別以步驟Sl得到的D個參考批次 數(shù)據(jù)為參考軌跡,采用改進DTW算法進行等長同步處理,得到D個采樣點數(shù)為r的同步數(shù) 據(jù),等長同步處理的具體方法包括以下步驟: S2. 1 :計算測試批次數(shù)據(jù)T(tXN)和參考批次數(shù)據(jù)R(rXN)中各采樣數(shù)據(jù)之間的距離 矩陣d,d(i,j)表示R(iXN)和T(jXN)的歐氏距離值,R(iXN)表示參考批次數(shù)據(jù)R(rXN) 第i個采樣數(shù)據(jù),T(jXN)表示測試批次數(shù)據(jù)T(tXN)第j個采樣數(shù)據(jù),i和j的取值范圍 分別為1彡i彡r,1彡j彡t ; S2. 2 :初始化累積矩陣D# D A(l,I) = d(l,1),其余元素為正無窮; S2. 3 :令循環(huán)變量i = 2 ; S2. 4 :計算本次搜索區(qū)間[ymin,ymax],分為以下三種情況: 當i e [1,X1],ymin、ymax的計算公式為:
&和Xr都取與計算結(jié)果最相近的整數(shù),a、b為預設的路徑限制平行四邊形相鄰兩條邊 的斜率,其中 〇<a<k,b>k,k = t/r; S2. 5 :依次對搜索區(qū)間[y^,y_]
中的每個值j,計算累積距離DA(i, j),計算公式為: S2. 6:判斷是否i <r,如果是,令i = i+Ι,返回步驟S2. 4,否則進入步驟S2. 7; S2. 7 :回溯得到同步數(shù)據(jù)S (r XN),具體步驟包括: S2. 7. 1:令同步數(shù)據(jù)S(rXN)中的最后一個數(shù)據(jù)S(rXN) =T(tXN); S2. 7· 2 :初始化 p = r-l,q = t ; S2. 7. 3 :根據(jù)累積距離矩陣Da向前搜索D A(p, q)、DA(p, q-1)和DA(p, q-2),選擇其中最 小值,將其對應的測試批次數(shù)據(jù)的采樣點序號記為V,令S(pXN) =T(q< XN); S2. 7. 4 :如果p > 1,令p = p-1,q = q',返回步驟S2. 7. 3,否則結(jié)束搜索,得到同步 數(shù)據(jù) S(rXN); S3 :將步驟S2得到的D個同步數(shù)據(jù)進行平均,得到該測試批次數(shù)據(jù)的同步結(jié)果。
2. 根據(jù)權(quán)利要求1所述的間歇過程批次數(shù)據(jù)同步方法,其特征在于,所述步驟Sl中的 聚類方法為K均值聚類方法。
3. 根據(jù)權(quán)利要求1所述的間歇過程批次數(shù)據(jù)同步方法,其特征在于,所述步驟S2. 4中, 如果k < 1,斜率a、b的取值范圍分別為0. 2k彡a < k,k < b彡5k ;如果k > 1,斜率a、b 的取值范圍分別為〇. 5k彡a < k,k < b彡2k。
【專利摘要】本發(fā)明公開了一種基于改進DTW算法的間歇過程批次數(shù)據(jù)同步方法,首先從正常間歇過程的批次數(shù)據(jù)中選取相同采樣點數(shù)的若干批次數(shù)據(jù),采用聚類算法對這些批次數(shù)據(jù)進行聚類后從每個聚類中選擇與聚類中心距離最近的批次數(shù)據(jù)作為參考批次數(shù)據(jù),共計D個參考批次數(shù)據(jù);對于需要進行同步的測試批次數(shù)據(jù),分別以D個參考批次數(shù)據(jù)為參考軌跡,采用改進DTW算法進行等長同步處理,得到D個同步數(shù)據(jù),再將D個同步數(shù)據(jù)進行平均,得到該測試批次數(shù)據(jù)的同步結(jié)果。本發(fā)明通過采用改進DTW算法,限制搜索面積,提高算法效率,并且由于采用多個參考批次數(shù)據(jù)作為參考軌跡,避免了單一參考樣本造成的過偏同步,提高了同步結(jié)果的穩(wěn)定性。
【IPC分類】G06F17-30
【公開號】CN104679844
【申請?zhí)枴緾N201510076381
【發(fā)明人】凡時財, 陳川, 鄒見效, 徐紅兵
【申請人】電子科技大學
【公開日】2015年6月3日
【申請日】2015年2月13日