基于改進(jìn)的kpca和隱馬爾科夫模型的工業(yè)故障診斷方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于工業(yè)過(guò)程監(jiān)控與故障診斷領(lǐng)域,特別涉及一種基于改進(jìn)的KPCA和隱 馬爾科夫模型的工業(yè)故障診斷方法。
【背景技術(shù)】
[0002] 隨著工業(yè)過(guò)程復(fù)雜性的增長(zhǎng),工業(yè)過(guò)程監(jiān)測(cè)和診斷的有效性對(duì)于保障生產(chǎn)過(guò)程安 全、維持產(chǎn)品質(zhì)量和優(yōu)化產(chǎn)品利益變得日益重要。
[0003] 對(duì)于過(guò)程監(jiān)控和故障診斷問(wèn)題,傳統(tǒng)的方法大多采用多元統(tǒng)計(jì)過(guò)程監(jiān)控技術(shù) (MultivariableStatisticalProcessMonitoring,MSPM),其中以主元分析(Principal ComponentAnalysis,PCA)、偏最小二乘(PartialLeastSquares,PLS)和獨(dú)立成分分析 (IndependentComponentAnalysis,ICA)為代表等方法已在工業(yè)過(guò)程監(jiān)控中得到了成功 的應(yīng)用。傳統(tǒng)的PCA、ICA等方法均假設(shè)過(guò)程變量間的關(guān)系是線性的,但是實(shí)際中測(cè)量變 量難以滿足這個(gè)假設(shè)條件,常呈現(xiàn)強(qiáng)烈的非線性特性。盡管核方法的引入,如核扣八,核 PCA(KerneIPCA)等方法被提出用于解決變量間的非線性,但是,上述方法具有以下缺點(diǎn), 原始數(shù)據(jù)從輸入空間映射到高維特征空間后變得冗余,而且核矩陣是一個(gè)以樣本數(shù)目為大 小的方陣。隨著樣本數(shù)目的增多,計(jì)算量不斷增大,而在工業(yè)過(guò)程,樣本數(shù)目往往是巨大的, 因此用原始的KPCA來(lái)提取變量間的非線性關(guān)系是困難的,由此,可能會(huì)引起故障診斷發(fā)生 錯(cuò)誤。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的在針對(duì)現(xiàn)有技術(shù)的不足,提供一種基于改進(jìn)的KPCA和隱馬爾科夫 模型的工業(yè)故障診斷方法,通過(guò)相似性分析方法的引入大大提高了KPCA在大樣本情況下 的計(jì)算效率,并且利用隱馬爾科夫模型極強(qiáng)的動(dòng)態(tài)過(guò)程時(shí)間序列建模能力和時(shí)序模式分類(lèi) 能力。因此,本方法在工業(yè)過(guò)程具有強(qiáng)非線性以及存在海量數(shù)據(jù)的情況下,可以實(shí)現(xiàn)有效地 故障診斷。
[0005] 一種基于改進(jìn)的KPCA和隱馬爾科夫模型的工業(yè)故障診斷方法,該方法的步驟如 下:
[0006] 步驟一:離線建模,對(duì)工業(yè)過(guò)程采集的離線數(shù)據(jù),在原空間進(jìn)行相似性分析,去除 相似樣本,得到數(shù)據(jù)集D1,引入核函數(shù)巾將數(shù)據(jù)集D1投影到高維特征空間,同樣在特征 空間進(jìn)行數(shù)據(jù)的相似性分析,去除相似樣本,得到數(shù)據(jù)集D2,根據(jù)數(shù)據(jù)集D2中數(shù)據(jù)計(jì)算相 應(yīng)的核矩陣以及核主元,將得到的核主元作為隱馬爾科夫模型(HMM)的觀測(cè)序列,訓(xùn)練隱 馬爾科夫模型;
[0007] 步驟二:在線診斷,對(duì)在線采集的數(shù)據(jù)在原空間進(jìn)行相似性分析,去除相似樣本, 同樣在特征空間進(jìn)行數(shù)據(jù)的相似性分析,去除相似樣本,計(jì)算相應(yīng)的核矩陣以及核主元,即 得到相應(yīng)的觀測(cè)序列后,選擇最匹配的HMM模型,從而判斷故障類(lèi)型。
[0008] 步驟一所述的離線建模過(guò)程如下:
[0009] 1)工業(yè)過(guò)程采集的第i個(gè)時(shí)刻監(jiān)測(cè)數(shù)據(jù)M=[各,毛,…,足f,i= 1,…,U, 其中^表示樣本個(gè)數(shù);
[0010] 2)在原輸入空間進(jìn)行相似性分析,去除相似樣本,得到數(shù)據(jù)集Q1,
[0011] 2. 1)初始時(shí)只有2個(gè)數(shù)據(jù)點(diǎn),即W1 = {名..?」} = ,新數(shù)據(jù)點(diǎn)根據(jù)以下提出 的相似性指數(shù)公式進(jìn)行相似性的判斷,
【主權(quán)項(xiàng)】
1. 一種基于改進(jìn)的KPCA和隱馬爾科夫模型的工業(yè)故障診斷方法,其特征在于,該方法 的步驟如下: 步驟一:離線建模,對(duì)工業(yè)過(guò)程采集的離線數(shù)據(jù),在原空間進(jìn)行相似性分析,去除相似 樣本,得到數(shù)據(jù)集〇1,引入核函數(shù)4將數(shù)據(jù)集口1投影到高維特征空間,同樣在特征空間 進(jìn)行數(shù)據(jù)的相似性分析,去除相似樣本,得到數(shù)據(jù)集Q2,根據(jù)數(shù)據(jù)集Q2中數(shù)據(jù)計(jì)算相應(yīng)的 核矩陣W及核主元,將得到的核主元作為隱馬爾科夫模型(HMM)的觀測(cè)序列,訓(xùn)練隱馬爾 科夫模型; 步驟二:在線診斷,對(duì)在線采集的數(shù)據(jù)在原空間進(jìn)行相似性分析,去除相似樣本,同樣 在特征空間進(jìn)行數(shù)據(jù)的相似性分析,去除相似樣本,計(jì)算相應(yīng)的核矩陣W及核主元,即得到 相應(yīng)的觀測(cè)序列后,選擇最匹配的HMM模型,從而判斷故障類(lèi)型。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟一所述的離線建模過(guò)程如下: 1) 工業(yè)過(guò)程采集的第i個(gè)時(shí)刻監(jiān)測(cè)數(shù)據(jù)風(fēng)二防為,…,兩,,f,*二1,柄< ^1),其中n;表示樣本個(gè)數(shù); 2) 在原輸入空間進(jìn)行相似性分析,去除相似樣本,得到數(shù)據(jù)集口1, 2. 1)初始時(shí)只有2個(gè)數(shù)據(jù)點(diǎn),即A^i二位?馬}二,新數(shù)據(jù)點(diǎn)根據(jù)W下提出的相 似性指數(shù)公式進(jìn)行相似性的判斷,
(1) 其中X。。,表示新數(shù)據(jù)點(diǎn);
2.。如果導(dǎo)<7^,新數(shù)據(jù)點(diǎn)被引入,否則該樣本點(diǎn)被舍棄,即Ni=Nw,其中丫。是預(yù) 先設(shè)定好的一個(gè)足夠小的值,滿足〇 < >/^ < 1 ; 2. 3)對(duì)原始輸入空間進(jìn)行相似性分析之后,被保留的數(shù)據(jù)點(diǎn)個(gè)數(shù)為ni,所W我們獲得 了數(shù)據(jù)集Qi; 3) 引入核函數(shù)4將數(shù)據(jù)集投影到高維特征空間,在特征空間進(jìn)行相似性分析,去 除相似樣本,得到數(shù)據(jù)集Q2, 3. 1)特征空間中相似性指數(shù)公式定義如下:
3. 2)如果< ?^,新數(shù)據(jù)點(diǎn)被引入,否則該樣本點(diǎn)被舍棄,其中丫1是預(yù)先設(shè)定好的 一個(gè)足夠小的值,滿足0 < < 1; 3. 3)對(duì)特征空間進(jìn)行相似性分析之后,被保留的數(shù)據(jù)點(diǎn)個(gè)數(shù)為ri2,所W我們獲得了數(shù) 據(jù)集口2; 4) 對(duì)數(shù)據(jù)集Q2,計(jì)算核矩陣KW及核主元, 4.1)計(jì)算核矩陣 K。' = < 巫(X,巫(xj)〉=K(X。xj) (3) 其中使用徑向基核函數(shù)
r為常數(shù); 4.2)對(duì)核矩陣K進(jìn)行中屯、化處理, K=K-\J<-K\-\\"K\" (4) 其中
4. 3)計(jì)算主成分tk
(5) 5)將得到的核主元作為隱馬爾科夫模型的觀測(cè)序列0,訓(xùn)練隱馬爾科夫模型,得到其 參數(shù) ^ = (A,B, 31,M,腳; 其中,A是隱含狀態(tài)轉(zhuǎn)移概率矩陣,描述了HMM模型中各個(gè)狀態(tài)之間的轉(zhuǎn)移概率,見(jiàn)下 式做~(7)
式中,"V、'/簡(jiǎn)記為au,表示在t時(shí)刻,狀態(tài)為Si的條件下,在t+1時(shí)刻狀態(tài)是SJ的概 率. B是觀測(cè)值概率密度矩陣,見(jiàn)下式
其中0是觀測(cè)向量,Cj.m是隱含狀態(tài)j的第m個(gè)混合成分的混合系數(shù),H是對(duì)數(shù)凹或楠 圓對(duì)稱密度,y是隱含狀態(tài)Sj.的第m個(gè)混合成分的均值向量,U是隱含狀態(tài)Sj.的第m個(gè) 混合成分的協(xié)方差矩陣,Cj.m滿足隨機(jī)約束:
Cjm、yJm、Uj.m的重估是該樣的;C的重估值是HMM在隱含狀態(tài)Sj.帶有第k個(gè)混合成分 的次數(shù)的期望除WHMM處于隱含狀態(tài)Sj.的次數(shù)的期望,y的重估值是由第k個(gè)混合成分 說(shuō)明的觀測(cè)矢量的部分期望值,Uj.m是由第k個(gè)混合成分說(shuō)明的觀測(cè)矢量的部分協(xié)方差,見(jiàn) 公式(11)~(13),
n是初始狀態(tài)概率矩陣,N是隱含狀態(tài)的數(shù)目,M是每個(gè)隱含狀態(tài)下的高斯混合成分的 數(shù)目。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,步驟二所述的在線診斷程如下: a) 在線采集工業(yè)過(guò)程的數(shù)據(jù); b) 在原空間進(jìn)行相似性分析,去除相似樣本,得到數(shù)據(jù)集〇1,引入核函數(shù)4將數(shù)據(jù)集 Q1投影到高維特征空間,同樣在高維特征空間進(jìn)行數(shù)據(jù)的相似性分析,去除相似樣本,得 到數(shù)據(jù)集〇2,根據(jù)數(shù)據(jù)集中數(shù)據(jù)計(jì)算相應(yīng)的核矩陣W及核主元; C)W核主元作為觀測(cè)序列,選擇最匹配的HMM模型,從而判斷故障類(lèi)型。
4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述的工業(yè)過(guò)程具有非線性。
5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述的工業(yè)故障為高爐冶煉過(guò)程故障。
6. -種根據(jù)權(quán)利要求1-4任一項(xiàng)所述的方法用于高爐冶煉過(guò)程故障診斷。
【專利摘要】本發(fā)明公開(kāi)了一種基于改進(jìn)的KPCA和隱馬爾科夫模型的工業(yè)故障診斷方法,屬于工業(yè)過(guò)程監(jiān)控與診斷技術(shù)領(lǐng)域。本發(fā)明通過(guò)相似性分析方法的引入大大提高了KPCA在大樣本情況下的計(jì)算效率,并且利用隱馬爾科夫模型極強(qiáng)的動(dòng)態(tài)過(guò)程時(shí)間序列建模能力和時(shí)序模式分類(lèi)能力,對(duì)工業(yè)過(guò)程的故障進(jìn)行分類(lèi)。因此與其它現(xiàn)有的方法相比,由于充分考慮了工業(yè)數(shù)據(jù)的非線性特性以及海量數(shù)據(jù)的特點(diǎn),本發(fā)明方法不僅可以降低計(jì)算的復(fù)雜度,而且可以更有效處理過(guò)程的非線性特征,從而對(duì)于非線性工業(yè)故障診斷具有更高的準(zhǔn)確率。
【IPC分類(lèi)】G05B23-02
【公開(kāi)號(hào)】CN104793606
【申請(qǐng)?zhí)枴緾N201510177746
【發(fā)明人】楊春節(jié), 王琳, 孫優(yōu)賢
【申請(qǐng)人】浙江大學(xué)
【公開(kāi)日】2015年7月22日
【申請(qǐng)日】2015年4月15日