一種在線升級主樣本模型的kNN故障檢測方法
【專利摘要】一種在線升級主樣本模型的kNN故障檢測方法,涉及一種批次過程故障檢測方法,包括將主樣本空間的數(shù)據(jù)作為建模數(shù)據(jù)的訓(xùn)練集,利用kNN故障檢測方法進(jìn)行建模和故障檢測,在主樣本空間中找到每個樣本的k個最近鄰,對每個樣本計算k個最近鄰距離的平方和,將所有樣本的k近鄰平方和按序排列確定故障檢測的閾值;對于新來的一個待檢測樣本x,從主樣本空間中找到x的k個最近鄰,計算樣本x的k個最近鄰距離平方和并將其與閾值進(jìn)行比較,如果小于閾值則樣本x是正常的,否則樣本是故障的;通過主樣本模型的選取可以使各工況的數(shù)據(jù)結(jié)構(gòu)得到優(yōu)化,提高故障檢測模型的精確度。
【專利說明】一種在線升級主樣本模型的kNN故障檢測方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種批次過程故障檢測方法,特別是涉及一種在線升級主樣本模型的kNN故障檢測方法。
【背景技術(shù)】
[0002]批次過程是一種重要的化工生產(chǎn)過程,被廣泛應(yīng)用于生產(chǎn)高質(zhì)量、高附加值產(chǎn)品行業(yè),如:生物制藥、半導(dǎo)體制造、農(nóng)業(yè)化學(xué)等。因此,批次過程的檢測與故障診斷一直是國內(nèi)外研究的熱點。在批次過程故障檢測中,采集到的數(shù)據(jù)往往呈現(xiàn)非高斯、非線性、多工況的特性,這就對故障檢測方法的性能提出了很高的要求。
[0003]隨著計算機(jī)在工業(yè)控制中的應(yīng)用日益廣泛和深入,工業(yè)過程故障檢測中遇到的數(shù)據(jù)將呈指數(shù)增長,其中所包含的噪聲信息影響程度也會不斷增加,使用已知的所有數(shù)據(jù)建模進(jìn)行故障檢測不僅極大的增加了數(shù)據(jù)存儲負(fù)擔(dān),而且不能夠得到最精確的結(jié)果。主元分析方法實現(xiàn)了對原始數(shù)據(jù)的降維處理,但是如何對大量訓(xùn)練數(shù)據(jù)進(jìn)行取舍,選擇出最具代表性的訓(xùn)練集進(jìn)行建模,目前還未有較好的減少建模空間的有效方法。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的在于提供一種在線升級主樣本模型的kNN故障檢測方法,該方法對大批量歷史數(shù)據(jù)和在線數(shù)據(jù)進(jìn)行壓縮與kNN方法相結(jié)合,在線升級主樣本模型負(fù)責(zé)對訓(xùn)練數(shù)據(jù)集的選取,然后利用kNN方法進(jìn)行建模和故障檢測,提高故障檢測模型的精確度。
[0005]本發(fā)明的目的是通過以下技術(shù)方案實現(xiàn)的:
一種在線升級主樣本模型的kNN故障檢測方法,所述方法包括以下過程:
將主樣本空間的數(shù)據(jù)作為建模數(shù)據(jù)的訓(xùn)練集,利用kNN故障檢測方法進(jìn)行建模和故障檢測,在主樣本空間中找到每個樣本的k個最近鄰,對每個樣本計算k個最近鄰距離的平方和,將所有樣本的k近鄰平方和按序排列確定故障檢測的閾值;對于新來的一個待檢測樣本X,從主樣本空間中找到χ的k個最近鄰,計算樣本χ的k個最近鄰距離平方和并將其與閾值進(jìn)行比較,如果小于閾值則樣本χ是正常的,否則樣本是故障的;即對工業(yè)過程中采集到的實時數(shù)據(jù)進(jìn)行檢測,當(dāng)檢測到的數(shù)據(jù)k最近鄰距離平方和大于閾值,表明系統(tǒng)出現(xiàn)故障,需要工作人員及時查明情況,排除險情。
[0006]所述的一種在線升級主樣本模型的kNN故障檢測方法,所述建模包括主樣本選取模型、主樣本空間升級模型、kNN故障檢測模型,對于工業(yè)過程中的正常歷史數(shù)據(jù),使用主樣本選取模型選擇出數(shù)據(jù)特征明顯的批次數(shù)據(jù)組成主樣本空間,當(dāng)新檢測到一批正常數(shù)據(jù),代入主樣本空間升級模型完成一次主樣本空間的升級,并利用最新的主樣本空間數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)通過kNN故障檢測方法進(jìn)行建模和故障檢測。
[0007]所述的一種在線升級主樣本模型的kNN故障檢測方法,所述主樣本選取模型在選取主樣本時所利用的綜合各數(shù)學(xué)統(tǒng)計量的思想,以及各統(tǒng)計量的權(quán)重確定。
[0008]所述的一種在線升級主樣本模型的kNN故障檢測方法,所述主樣本空間升級模型利用新檢測到的正常數(shù)據(jù)對原有的主樣本空間進(jìn)行在線升級。
[0009]本發(fā)明的優(yōu)點與效果是:
1.本發(fā)明降低數(shù)據(jù)的存儲負(fù)擔(dān)。傳統(tǒng)的故障檢測方法不加區(qū)分的利用所有的正常數(shù)據(jù),隨著計算機(jī)在工業(yè)控制中的應(yīng)用日益廣泛和深入,工業(yè)過程故障檢測中遇到的數(shù)據(jù)將呈指數(shù)增長,大批量的數(shù)據(jù)會造成極大的存儲負(fù)擔(dān);而本發(fā)明提出的方法只需要存儲主樣本空間的少量數(shù)據(jù)即可滿足正常的故障檢測。
[0010]2.本發(fā)明提高數(shù)據(jù)利用率。通過主樣本空間的在線升級,不但有效的利用了歷史數(shù)據(jù),而且將實時檢測到的正常數(shù)據(jù)加入到主樣本空間的優(yōu)化升級,提高了數(shù)據(jù)利用率。
[0011]3.本發(fā)明降低噪聲影響,提高模型精確度。工業(yè)過程中采集到的數(shù)據(jù)都會在一定程度上受到噪聲影響,通過大量降低建模樣本個數(shù)的同時,會在很大程度上降低噪聲對檢測結(jié)果的影響,提高模型精確度。
[0012]4.本發(fā)明優(yōu)化數(shù)據(jù)結(jié)構(gòu)。對于多工況的工業(yè)生產(chǎn)過程,不同工況的批次個數(shù)、數(shù)據(jù)特點都不盡相同,通過主樣本模型的選取可以使各工況的數(shù)據(jù)結(jié)構(gòu)得到優(yōu)化。
[0013]5.本發(fā)明提高計算速度。通過選取主樣本進(jìn)行建模和故障檢測,在減少訓(xùn)練樣本集的同時,也降低了參與計算的數(shù)據(jù)量,從而極大的提高了計算速度。
【專利附圖】
【附圖說明】
[0014]圖1為本發(fā)明的核心算法流程圖。
【具體實施方式】
[0015]下面結(jié)合實施例對本發(fā)明進(jìn)行詳細(xì)說明。
[0016]本發(fā)明是在大量正常歷史數(shù)據(jù)中,通過對原始數(shù)據(jù)樣本間協(xié)方差、相關(guān)系數(shù)、樣本方差等統(tǒng)計特征的分析進(jìn)行主樣本的提取,使原始數(shù)據(jù)空間得到壓縮,并將新采集的正常數(shù)據(jù)代入主樣本模型,使得主樣本空間得到在線升級。然后,基于在線升級的主樣本建模運用k最近鄰規(guī)則(kNN)進(jìn)行批次過程故障檢測。本技術(shù)解決了批次過程建模樣本數(shù)據(jù)量大、重復(fù)性強(qiáng)、噪聲干擾多、數(shù)據(jù)利用率低的問題為了準(zhǔn)確的選擇特征明顯的主樣本,需要通過分析處理原始樣本的統(tǒng)計特征。本發(fā)明通過綜合原始樣本數(shù)據(jù)的行方差矩陣、行相關(guān)系數(shù)矩陣、行協(xié)方差矩陣等信息得到一個新的指標(biāo)——相對信息提供量Qi, Qi越小表明第i個樣本提供的信息越多,其中原始統(tǒng)計特征在Qi中的權(quán)重根據(jù)主成分分析法得到。由于在實際生產(chǎn)過程中,故障檢測往往伴隨著數(shù)據(jù)采集過程進(jìn)行,長期的故障檢測會收集到大量的正常數(shù)據(jù)。為了提高數(shù)據(jù)利用率、增加模型精確度,每當(dāng)檢測出一個正常樣本就讀入主樣本空間升級模型,完成一次主樣本空間的在線更新。
[0017]kNN故障檢測技術(shù):為了進(jìn)行過程故障檢測,需要利用已知的正常數(shù)據(jù)建模,然后對新來的數(shù)據(jù)進(jìn)行檢測。本發(fā)明將主樣本空間的數(shù)據(jù)作為建模數(shù)據(jù)的訓(xùn)練集,利用kNN故障檢測方法進(jìn)行建模和故障檢測。在主樣本空間中找到每個樣本的k個最近鄰,對每個樣本計算k個最近鄰距離的平方和,將所有樣本的k近鄰平方和按序排列確定故障檢測的閾值;對于新來的一個待檢測樣本X,從主樣本空間中找到χ的k個最近鄰,計算樣本χ的k個最近鄰距離平方和并將其與閾值進(jìn)行比較,如果小于閾值則樣本χ是正常的,否則樣本是故障的。[0018]軟件系統(tǒng):為了能夠?qū)崿F(xiàn)故障檢測,本發(fā)明采用MathWorks公司的MALTAB軟件編程開發(fā),對工業(yè)過程中采集到的實時數(shù)據(jù)進(jìn)行檢測,當(dāng)檢測到的數(shù)據(jù)k最近鄰距離平方和大于閾值,表明系統(tǒng)出現(xiàn)故障,需要工作人員及時查明情況,排除險情。
[0019]本發(fā)明由以下幾個部分組成:主樣本選取模型、主樣本空間升級模型、kNN故障檢測模型;對于工業(yè)過程中的正常歷史數(shù)據(jù),使用主樣本選取模型選擇出數(shù)據(jù)特征明顯的批次數(shù)據(jù)組成主樣本空間,當(dāng)新檢測到一批正常數(shù)據(jù),代入主樣本空間升級模型完成一次主樣本空間的升級;利用最新的主樣本空間數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)通過kNN故障檢測方法進(jìn)行建模和故障檢測。主樣本選取模型在選取主樣本時所利用的數(shù)學(xué)統(tǒng)計量,如協(xié)方差、相關(guān)系數(shù)等,以及各統(tǒng)計量的權(quán)重確定。主樣本空間升級模型利用新檢測到的正常數(shù)據(jù)對原有的主樣本空間進(jìn)行在線升級。kNN方法利用升級的主樣本空間進(jìn)行建模和故障檢測,實現(xiàn)基于在線升級主樣本模型的kNN故障檢測。本發(fā)明通過對批次過程中收集到的大量歷史離線數(shù)據(jù)選取主樣本,降低數(shù)據(jù)的存儲負(fù)擔(dān),提高故障檢測模型建立時的計算速度,而且在一定程度上解決大數(shù)據(jù)量建模時會包含大量噪聲的問題,提高故障檢測模型的精確度;同時,在檢測到新的正常樣本時,及時的更新主樣本空間,提高了有效數(shù)據(jù)的利用率使故障檢測模型更加優(yōu)化。
【權(quán)利要求】
1.一種在線升級主樣本模型的kNN故障檢測方法,其特征在于,所述方法包括以下過程: 將主樣本空間的數(shù)據(jù)作為建模數(shù)據(jù)的訓(xùn)練集,利用kNN故障檢測方法進(jìn)行建模和故障檢測,在主樣本空間中找到每個樣本的k個最近鄰,對每個樣本計算k個最近鄰距離的平方和,將所有樣本的k近鄰平方和按序排列確定故障檢測的閾值;對于新來的一個待檢測樣本X,從主樣本空間中找到χ的k個最近鄰,計算樣本χ的k個最近鄰距離平方和并將其與閾值進(jìn)行比較,如果小于閾值則樣本χ是正常的,否則樣本是故障的;即對工業(yè)過程中采集到的實時數(shù)據(jù)進(jìn)行檢測,當(dāng)檢測到的數(shù)據(jù)k最近鄰距離平方和大于閾值,表明系統(tǒng)出現(xiàn)故障,需要工作人員及時查明情況,排除險情。
2.根據(jù)權(quán)利要求1所述的一種在線升級主樣本模型的kNN故障檢測方法,其特征在于,所述建模包括主樣本選取模型、主樣本空間升級模型、kNN故障檢測模型,對于工業(yè)過程中的正常歷史數(shù)據(jù),使用主樣本選取模型選擇出數(shù)據(jù)特征明顯的批次數(shù)據(jù)組成主樣本空間,當(dāng)新檢測到一批正常數(shù)據(jù),代入主樣本空間升級模型完成一次主樣本空間的升級,并利用最新的主樣本空間數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)通過kNN故障檢測方法進(jìn)行建模和故障檢測。
3.根據(jù)權(quán)利要求1所述的一種在線升級主樣本模型的kNN故障檢測方法,其特征在于,所述主樣本選取模型在選取主樣本時所利用的綜合各數(shù)學(xué)統(tǒng)計量的思想,以及各統(tǒng)計量的權(quán)重確定。
4.根據(jù)權(quán)利要求1所述的一種在線升級主樣本模型的kNN故障檢測方法,其特征在于,所述主樣本空間升級模型利用新檢測到的正常數(shù)據(jù)對原有的主樣本空間進(jìn)行在線升級。
【文檔編號】G06F11/36GK103488561SQ201310286065
【公開日】2014年1月1日 申請日期:2013年7月9日 優(yōu)先權(quán)日:2013年7月9日
【發(fā)明者】陳海彬, 張曉丹, 李元 申請人:沈陽化工大學(xué)