本發(fā)明屬于機械異常檢測領(lǐng)域,涉及針對轉(zhuǎn)動機械運行狀態(tài)的異常檢測方法,具體是一種基于狄利克雷混合模型的轉(zhuǎn)動機械運行狀態(tài)異常檢測方法。
背景技術(shù):
化工機械遍布在化工生產(chǎn)的方方面面,對化工生產(chǎn)起著至關(guān)重要的作用。一旦發(fā)生故障,輕則影響生產(chǎn),重則機毀人亡。因此如何有效實現(xiàn)轉(zhuǎn)動機械實時智能狀態(tài)監(jiān)測,及時發(fā)現(xiàn)機組異常,成為當(dāng)前研究的熱點。
目前,國內(nèi)對轉(zhuǎn)動機械運行狀態(tài)異常檢測進行了大量的研究,異常檢測方法主要分為兩種:一、單特征值預(yù)警;二、提取多特征值,運用降維方法將多特征降維成一個或少數(shù)幾個特征,根據(jù)特征值在空間分布上的變化判斷機組是否發(fā)生異常。這些方法雖然在異常檢測方面取得了一些成果,但還存在很多不足。轉(zhuǎn)動機械信號具有非平穩(wěn)性,機組發(fā)生異常后,波形幅值可能不會升高。因此,單特征值很難較全面的描述波形特征實現(xiàn)預(yù)警;高維特征降維獲取一個或少數(shù)幾個特征的方法,在降維過程中,做了很多理想的假設(shè),忽視了特征之間實際的相互聯(lián)系,弱化了降維方法的性能,使異常檢測的準確率低。因此如何利用高維特征實現(xiàn)異常檢測,成為當(dāng)前研究的難點。
針對上述問題,提出了基于統(tǒng)計模型的異常檢測方法。傳統(tǒng)的基于統(tǒng)計模型的異常檢測方法存在諸多的局限性,比如,實際生產(chǎn)中的狀態(tài)監(jiān)測數(shù)據(jù)很復(fù)雜,難以確定其分布形式,為了簡化計算,大多假設(shè)數(shù)據(jù)呈高斯分布,這種假設(shè)具有較大的主觀性,對于復(fù)雜的數(shù)據(jù)分布問題,會使分析結(jié)果和實際偏離較大;訓(xùn)練過程中,模型參數(shù)直接由樣本數(shù)據(jù)計算得到,忽視了先驗知識對異常檢測的作用;模型個數(shù)依據(jù)經(jīng)驗設(shè)定等。這些都大大降低了異常檢測的準確率。
近年來,隨著機器學(xué)習(xí)的發(fā)展,狄利克雷混合模型受到越來越多的關(guān)注,該方法目前較成熟的運用于多個領(lǐng)域,且取得了很好的效果。因此,將狄利克雷混合模型與機械異常檢測相結(jié)合,提出了一種基于狄利克雷混合模型的機械異常檢測方法,該方法無需假設(shè)數(shù)據(jù)分布形式,運用先驗知識建立統(tǒng)計分布模型,可依據(jù)訓(xùn)練數(shù)據(jù)學(xué)習(xí)出最優(yōu)的模型參數(shù)和模型個數(shù)。該方法提高了異常檢測準確率,提前了報警時間點,適用于轉(zhuǎn)動機械多種故障的異常檢測。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是克服現(xiàn)有技術(shù)缺點,將狄利克雷混合模型與機械異常檢測相結(jié)合,提供一套全新的,智能的,實時的,準確率高的轉(zhuǎn)動機械異常檢測方法。該方法將狄利克雷混合模型用于轉(zhuǎn)動機械異常檢測,能夠在不停車的情況下應(yīng)用實時監(jiān)測數(shù)據(jù),監(jiān)測轉(zhuǎn)動機械運行狀態(tài),準確率高,能夠?qū)崿F(xiàn)機械異常檢測和預(yù)警。
本發(fā)明公開了一種基于狄利克雷混合模型的轉(zhuǎn)動機械異常檢測方法,具體步驟為:
步驟1分別采集機組正常工況運行數(shù)據(jù)和實時工況運行數(shù)據(jù):通過安裝在機械上的傳感器采集可以表征機組運行狀態(tài)的數(shù)據(jù),數(shù)據(jù)包括正常工況數(shù)據(jù)和實時工況數(shù)據(jù),每種工況數(shù)據(jù)推薦樣本數(shù)為50-150組。
步驟2提取數(shù)據(jù)特征,構(gòu)造特征相空間:提取能反映機組狀態(tài)監(jiān)測數(shù)據(jù)變化的多種特征,包括時域特征,頻域特征。運用這些特征構(gòu)造相空間,結(jié)果如下:
其中:x(i,j)(i=1,2,…,n;j=1,2,…,m)代表樣本特征,Xi(i=1,2,…,n)代表每組樣本m個特征構(gòu)造的相空間,Aj(j=1,2,…,m)為n組樣本的同一類特征構(gòu)成的特征子集。
步驟3設(shè)定狄利克雷混合模型初始聚集參數(shù)α。
步驟4運用正常數(shù)據(jù)特征相空間訓(xùn)練得到基于狄利克雷混合模型的統(tǒng)計分布模型,模型數(shù)自學(xué)習(xí)結(jié)果為T,并將該模型設(shè)定為基準模型:
狄利克雷混合模型形式定義如下式:
Xi|θi~F(θi);
θi|G~G;
G|α,G0~DP(α,G0);
其中:
Xi服從參數(shù)為θi的某種分布F(θi);
θi代表觀測數(shù)據(jù)服從的混合分布中某個分布分量,可能被重復(fù)抽樣,分量個數(shù)可以從相空間自動推斷,無需人工設(shè)定,根據(jù)推斷結(jié)果,可自學(xué)習(xí)出狄利克雷混合模型個數(shù)T。該分量先驗分布服從某種未知隨機測度G,G可以通過狄利克雷過程構(gòu)造。
G0為基礎(chǔ)分布,α為聚集參數(shù)或者質(zhì)量參數(shù),基礎(chǔ)分部G0可以理解為狄利克雷過程均值,即E(G(A))=G0(A),聚集參數(shù)α可以理解為狄利克雷過程逆方差,即V(G(A))=G0(A)(1-G0(A))/(α+1)。
基于上述方法,運用正常數(shù)據(jù)特征相空間Xnorm,構(gòu)造基于狄利克雷混合模型的轉(zhuǎn)動機械運行狀態(tài)相空間的統(tǒng)計分布模型:
(1)根據(jù)正常數(shù)據(jù)特征相空間Xnorm,構(gòu)造狄利克雷分布模型DP(α,G0(A));
(2)依據(jù)DP(α,G0(A))構(gòu)造出θi的先驗分布,并計算θi的后驗分布;
(3)根據(jù)θi的后驗分布,推導(dǎo)出特征相空間X的分布,得出正常數(shù)據(jù)特征相空間Xnorm基于狄利克雷混合模型的相空間統(tǒng)計分布模型:
其中:αi為模型權(quán)重,θ為模型參數(shù)集。
步驟5計算正常數(shù)據(jù)特征相空間模型間距離,自學(xué)習(xí)報警門限。
步驟6將模型數(shù)設(shè)定為T,訓(xùn)練實時數(shù)據(jù)統(tǒng)計分布模型:
假設(shè)當(dāng)前數(shù)據(jù)特征相空間為Xcurrent,則依據(jù)步驟4的方法,得到模型為:
其中:βj為模型權(quán)重,θ為模型參數(shù)集。
步驟7計算正常數(shù)據(jù)和實時運行數(shù)據(jù)特征相空間模型間的距離D:
D=|f(Xcurrent)-f(Xnorm)|
步驟8判斷距離是否超過設(shè)定的報警門限,超過報警門限則報警,反之,繼續(xù)采集數(shù)據(jù):
式中:th為報警門限。若距離D超過報警門限,則認為正常數(shù)據(jù)相空間模型和當(dāng)前運行數(shù)據(jù)相空間模型差異度較大,機組存在異常,發(fā)生報警;若未超過報警門限,則繼續(xù)采集運行數(shù)據(jù)。
本發(fā)明提出基于狄利克雷混合模型的轉(zhuǎn)動機械運行狀態(tài)異常檢測方法,該方法在轉(zhuǎn)動機械運行狀態(tài)下即可進行異常檢測,具有實時性強,準確率高等優(yōu)點。
本發(fā)明的第一方面,公開了用特征值構(gòu)造相空間的方法;
本發(fā)明的第二方面,公開了基于狄利克雷混合模型的轉(zhuǎn)動機械運行狀態(tài)異常檢測方法流程。
附圖說明
圖1:轉(zhuǎn)動機械異常檢測流程圖
圖2:機組波形數(shù)據(jù)
圖3:特征值
圖4:A1特征
圖5:均值向量
圖6:協(xié)方差矩陣
圖7:模型距離及報警線
具體實施方式
下面將結(jié)合附圖對本發(fā)明的具體的異常檢測流程做進一步說明。
如圖1所示,本發(fā)明具體的流程如下所示:
1、分別采集機組正常工況運行數(shù)據(jù)和實時工況運行數(shù)據(jù):通過安裝在機械上的傳感器采集可以表征機組運行狀態(tài)的數(shù)據(jù),數(shù)據(jù)包括正常工況數(shù)據(jù)和實時工況數(shù)據(jù),每種工況數(shù)據(jù)推薦樣本數(shù)為50-150組;
2、提取數(shù)據(jù)特征,構(gòu)造特征相空間:提取能反映機組狀態(tài)監(jiān)測數(shù)據(jù)變化的多種特征,包括時域特征,頻域特征。運用這些特征構(gòu)造相空間,結(jié)果如下:
其中:x(i,j)(i=1,2,…,n;j=1,2,…,m)代表樣本特征,Xi(i=1,2,…,n)代表每組樣本m個特征構(gòu)造的相空間,Aj(j=1,2,…,m)為n組樣本的同一類特征構(gòu)成的特征子集。
3、設(shè)定初始參數(shù):設(shè)定狄利克雷混合模型初始參數(shù)α。
4、運用正常數(shù)據(jù)特征相空間訓(xùn)練得到基于狄利克雷混合模型的統(tǒng)計分布模型,模型數(shù)自學(xué)習(xí)結(jié)果為T,并將該模型設(shè)定為基準模型:
狄利克雷混合模型形式定義如下式:
Xi|θi~F(θi);
θi|G~G;
G|α,G0~DP(α,G0);
其中:
Xi服從參數(shù)為θi的某種分布F(θi);
θi代表觀測數(shù)據(jù)服從的混合分布中某個分布分量,可能被重復(fù)抽樣,分量個數(shù)可以從相空間自動推斷,無需人工設(shè)定,根據(jù)推斷結(jié)果,可自學(xué)習(xí)出狄利克雷混合模型個數(shù)T。該分量先驗分布服從某種未知隨機測度G,G可以通過狄利克雷過程構(gòu)造。
G0為基礎(chǔ)分布,α為聚集參數(shù)或者質(zhì)量參數(shù),基礎(chǔ)分部G0可以理解為狄利克雷過程均值,即E(G(A))=G0(A),聚集參數(shù)α可以理解為狄利克雷過程逆方差,即V(G(A))=G0(A)(1-G0(A))/(α+1)。
基于上述方法,運用正常數(shù)據(jù)特征相空間Xnorm,構(gòu)造基于狄利克雷混合模型的轉(zhuǎn)動機械運行狀態(tài)相空間的統(tǒng)計分布模型:
(1)根據(jù)正常數(shù)據(jù)特征相空間Xnorm,構(gòu)造狄利克雷分布模型DP(α,G0(A));
(2)依據(jù)DP(α,G0(A))構(gòu)造出θi的先驗分布,并計算θi的后驗分布;
(3)根據(jù)θi的后驗分布,推導(dǎo)出特征相空間X的分布,得出正常數(shù)據(jù)特征相空間Xnorm基于狄利克雷混合模型的相空間統(tǒng)計分布模型:
其中:αi為模型權(quán)重,θ為模型參數(shù)集。
5、計算正常數(shù)據(jù)模型間距離,自學(xué)習(xí)報警門限。
6、將模型數(shù)設(shè)定為T,訓(xùn)練實時數(shù)據(jù)統(tǒng)計分布模型:
假設(shè)當(dāng)前數(shù)據(jù)特征相空間為Xcurrent,則依據(jù)步驟4的方法,得到模型為:
其中:βj為模型權(quán)重,θ為模型參數(shù)集。
7、計算正常數(shù)據(jù)和實時運行數(shù)據(jù)特征相空間模型間的距離D:
D=|f(Xcurrent)-f(Xnorm)|
8、判斷距離是否超過設(shè)定的報警門限,超過報警門限則報警,反之,繼續(xù)采集數(shù)據(jù):
式中:th為報警門限。若距離D超過報警門限,則認為正常數(shù)據(jù)特征相空間模型和當(dāng)前運行數(shù)據(jù)特征相空間模型差異度較大,機組存在異常,發(fā)生報警;若未超過報警門限,則繼續(xù)采集運行數(shù)據(jù)。
這里以某石化2缸往復(fù)機組拉缸故障數(shù)據(jù)為例進行說明。
1、分別采集50組正常工況數(shù)據(jù)和50組異常數(shù)據(jù)。其中一組振動波形數(shù)據(jù)如圖2;
2、將波形數(shù)據(jù)帶入特征值計算公式,提取特征值,本案例波形數(shù)為n=50,提取特征數(shù)為m=22,特征種類包括時域波形峰值、有效值、峭度、形狀因子、脈沖因子;小波包分解后,各層的峰值、有效值。一組波形的特征X1見圖3,特征包括波形的時域特征和頻域特征。A1至A22為分別代表所有波形的22類特征中的一類,A1特征見圖4。50組波形22類特征構(gòu)成了相空間X。
3、參考相關(guān)文獻,可將狄利克雷模型參數(shù)α值設(shè)定為0.01。
4、將X輸入至算法,自學(xué)習(xí)出模型數(shù)T=3和模型f(Xnorm)。生成的模型參數(shù)θ包括均值μ和協(xié)方差Σ,每一個模型對應(yīng)一個均值和一個協(xié)方差矩陣,分別為22×1的向量和22×22的矩陣,第一個模型的均值和協(xié)方差矩陣學(xué)習(xí)結(jié)果見圖5和圖6(圖6(a)為協(xié)方差矩陣1-22行1-12列,圖6(b)為協(xié)方差矩陣1-22行13-22列)。模型權(quán)重
5、計算正常工況數(shù)據(jù)相空間模型間距離,距離計算方法見7中說明。將正常數(shù)據(jù)模型距離最大值設(shè)定為報警門限,本案例前20組為正常工況距離值,報警門限為圖7中的紅線。
6、根據(jù)4中的學(xué)習(xí)結(jié)果,將模型數(shù)設(shè)定為3,用同樣的方法學(xué)習(xí)出當(dāng)前工況數(shù)據(jù)特征相空間模型f(Xcurrent)。
7、計算正常數(shù)據(jù)和實時運行數(shù)據(jù)特征相空間模型間的距離D:
D=|f(Xcurrent)-f(Xnorm)|
多組當(dāng)前工況數(shù)據(jù)(含故障數(shù)據(jù))模型距離計算結(jié)果見圖7。
傳統(tǒng)的單值報警時間點在第60個點處,本方法報警時間點在第48個點,報警時間提前了4小時(點與點之間的時間差為20分鐘),提高了異常檢測準確率。