本發(fā)明屬于工業(yè)過程預(yù)測和控制領(lǐng)域,尤其涉及一種時間維度拓展局部加權(quán)極限學(xué)習(xí)機的軟測量建模方法。
背景技術(shù):
在傳統(tǒng)工業(yè)過程中,存在許多對于提高產(chǎn)品質(zhì)量和保證安全有著至關(guān)重要作用過的參數(shù)如反應(yīng)速率、產(chǎn)品成分含量等,但是很多往往難以或者無法直接用傳感器加以測量。采用需要大量投資的在線分析儀表進行檢測,往往有較大的滯后而使得調(diào)節(jié)不夠及時,從而使產(chǎn)品質(zhì)量難以得到保證。我們稱這些對于工業(yè)過程具有重要作用的變量為主導(dǎo)變量,其他的一些已與測量的變量我們稱之為輔助變量。軟測量實質(zhì)事通過建立工業(yè)過程變量之間的數(shù)學(xué)模型,實現(xiàn)通過輔助變量預(yù)測主導(dǎo)變量的技術(shù)方法。在近年來,軟測量在工業(yè)過程中應(yīng)用了許多神經(jīng)網(wǎng)絡(luò)算法,但是由于神經(jīng)網(wǎng)絡(luò)算法仍存在收斂速度較慢,容易陷入局部最優(yōu)解和泛化性能較差等缺點。
為了克服神經(jīng)網(wǎng)絡(luò)算法存在的上述問題,極限學(xué)習(xí)機作為一種單隱層隨機神經(jīng)網(wǎng)絡(luò),能夠克服傳統(tǒng)神經(jīng)網(wǎng)絡(luò)算法反迭代產(chǎn)生的收斂速度慢,陷入局部最優(yōu)解問題。但是由于其模型的隨機性和隱層節(jié)點數(shù)目往往大于其他神經(jīng)網(wǎng)絡(luò)犧牲了泛化性能。為解決這一問題,提出了局部加權(quán)極限學(xué)習(xí)機模型,利用即時學(xué)習(xí)的思想,通過時間維度拓展局部加權(quán)的方法,改善了極限學(xué)習(xí)機模型作為一種非線性方法應(yīng)用于工業(yè)過程極限學(xué)習(xí)機泛化能力較差的缺點,針對工業(yè)過程數(shù)據(jù)動態(tài)性的問題,改善了模型建立和預(yù)測的性能。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于針對現(xiàn)有技術(shù)的不足,提供了一種時間維度拓展局部加權(quán)極限學(xué)習(xí)機的軟測量建模方法。
本發(fā)明的目的是通過以下技術(shù)方案來實現(xiàn)的:一種基于局部加權(quán)極限學(xué)習(xí)機的軟測量模型的建立,主要包括以下幾個步驟:
(1)利用集散控制下系統(tǒng)以及離線監(jiān)測方法,工業(yè)生產(chǎn)過程的數(shù)據(jù)按時間排列的訓(xùn)練樣本集Xtr∈RN×n和Ytrain∈RN×m和測試樣本集Xte∈RK×n和Ytest∈RN×m。其中N為訓(xùn)練樣本長度,n為訓(xùn)練樣本維度,K為測試樣本集長度。測試樣本集為將這些數(shù)據(jù)存入歷史數(shù)據(jù)庫。并且對訓(xùn)練樣本集和測試樣本按照訓(xùn)練樣本集進行前處理和歸一化使訓(xùn)練樣本集其均值為0且方差為1。
(2)按時間差對原訓(xùn)練樣本和測試樣本采樣,即將Xtr和Xt分別進行時間維度拓展,拓展參數(shù)為T形成新的測試集Xtrain∈R(2T+1)N×n和訓(xùn)練集矩陣Xtest∈R(2T+1)K×n。
(3)將測試樣本Xtest依次取行作為查詢樣本qi(i=1,2,…,K),及對應(yīng)測試樣本真實值yi(i=1,2,…,K)。之后按每個查詢樣本分別進行局部加權(quán)極限學(xué)習(xí)機建模。
(4)對查詢樣本和訓(xùn)練集進行去查詢樣本均值。這部分去均值的值要在建模并得到建模結(jié)果后再在最終結(jié)果上還原去查詢均值的數(shù)據(jù)偏差。
(5)依據(jù)查詢樣本和歷史樣本(訓(xùn)練集樣本)的距離d確定權(quán)重參數(shù)w,對歷史樣本加權(quán),得到新的訓(xùn)練樣本Xw的到局部加權(quán)化的樣本空間。
(6)對時間維度拓展并局部加權(quán)化的樣本空間進行極限學(xué)習(xí)機建模,得到軟測量結(jié)果。
(7)重復(fù)進行所有的查詢樣本向量的建模和軟測量結(jié)果后得到了整個測試樣本的軟測量結(jié)果。
(8)采用以上得到的基于時間維度拓展局部加權(quán)極限學(xué)習(xí)機方法對工業(yè)過程的數(shù)據(jù)進行建模,實現(xiàn)過程的軟測量。
本發(fā)明的有益效果是:本發(fā)明采用即時學(xué)習(xí)思想,時間維度上進行時間維度拓展以提取模型的動態(tài)性能,空間上采用局部加權(quán)方法,以針對工業(yè)過程中數(shù)據(jù)的動態(tài)性問題,結(jié)合極限學(xué)習(xí)機作為一種成熟的高速度高精度非線性方法針對工業(yè)過程中數(shù)據(jù)非線性的問題。在結(jié)合過程中,時間維度拓展產(chǎn)生的大量相關(guān)性大的動態(tài)矩陣解決了極限學(xué)習(xí)機最大的問題即泛化性能不足,需要數(shù)據(jù)樣本大而無視樣本相關(guān)性的問題,局部加權(quán)方法在提取系統(tǒng)動態(tài)性的過程中也能在一定程度上解決極限學(xué)習(xí)機沒有降噪過程的問題,而且可以降低及極限學(xué)習(xí)機在實際過程中的不穩(wěn)定性。得到了高速度高精度針對工業(yè)過程非線性和動態(tài)性的軟測量器。
附圖說明
圖1是極限學(xué)習(xí)機脫丁烷塔軟測量誤差圖;
圖2是局部加權(quán)極限學(xué)習(xí)機脫丁烷塔軟測量誤差圖;
圖3是時間維度拓展極限學(xué)習(xí)機脫丁烷塔軟測量誤差圖;
圖4是時間維度拓展局部加權(quán)極限學(xué)習(xí)機脫丁烷塔軟測量誤差圖。
具體實施方式
本發(fā)明是針對工業(yè)過程非線性,動態(tài)性問題,使用即時學(xué)習(xí)思想通過時間維度拓展方法和空間上的局部加權(quán)方法解決動態(tài)性的問題,結(jié)合極限學(xué)習(xí)機算法作為一種非線性算法解決過程非線性問題。其中,尤其是時間維度拓展方法可以大大增加過程數(shù)據(jù)量的方法,能過在很大程度上解決極限學(xué)習(xí)機在工業(yè)過程樣本普遍不夠大的情況下的泛化問題較差的問題,而樣本相關(guān)性大的問題也不會對極限學(xué)習(xí)機的精度和速度造成很大負(fù)擔(dān)。局部加權(quán)方法在一定程度上可以降低噪聲該繞和降低極限學(xué)習(xí)機不穩(wěn)定性。本方法既能夠?qū)崿F(xiàn)時間維度拓展方法和局部加權(quán)方法對工業(yè)過程動態(tài)性的提取和建模,也能體現(xiàn)出極限學(xué)習(xí)機作為一種非線性回歸算法精度高、速度快的優(yōu)勢。
下面結(jié)合附圖和具體實例對本發(fā)明進行詳細(xì)說明
本發(fā)明采用的技術(shù)方案主要步驟如下:
第一步 利用集散控制下系統(tǒng)以及離線監(jiān)測方法,工業(yè)生產(chǎn)過程的數(shù)據(jù)組成建模用的訓(xùn)練樣本集和測試樣本集。其中,訓(xùn)練樣本集包括Xtr∈RN×n和Ytrain∈RN×m,其中,N為訓(xùn)練樣本長度,n為訓(xùn)練樣本維度。測試樣本集為Xte∈RK×n和Ytest∈RN×m將這些數(shù)據(jù)存入歷史數(shù)據(jù)庫,其中,K為測試樣本長度,n為訓(xùn)練樣本維度。并且對訓(xùn)練樣本集和測試樣本按照訓(xùn)練樣本集進行前處理和歸一化使訓(xùn)練樣本集其均值為0且方差為1。
第二步 將Xtr和Xte進行時間維度拓展形成新的測試集和訓(xùn)練集矩陣,設(shè)定時間維度拓展參數(shù)為T,則將Xtr和Xte進行時間點不同的采樣形成新的矩陣Xtrain=[Xtr(t=0)Xtr(t=1)Xtr(t=-1)…Xtr(t=T)Xtr(t=-T)],Xtest=[Xte(t=0)Xte(t=1)Xte(t=-1)…Xte(t=T)Xte(t=-T)],其中,Xtrain∈R(2T+1)N×n,Xtest∈R(2T+1)K×n
第三步 將測試樣本Xtest依次取行作為查詢樣本,即為(q1,q2,…qi…qK),其中qi為查詢樣本,n維行向量。分別對應(yīng)測試樣本真實值yi(i=1,2,…,K)。從第一行(i=1)到最后一行分別進行局部加權(quán)極限學(xué)習(xí)機建模。
第四步 當(dāng)查詢樣本為qi(i=1,2,…,K)時,對查詢樣本和訓(xùn)練集進行去查詢樣本均值。這部分去均值的值要在建模并得到建模結(jié)果后再在最終結(jié)果上還原去查詢均值的數(shù)據(jù)偏差。
第五步 將訓(xùn)練樣本集中Xtrain分解為行量形式,將中各個xj作為歷史樣本(j=1,2,…,N),即可對各個歷史樣本和查詢樣本qi的相似度或點的距離進行度量然后可以對相似樣本制定權(quán)重其中為設(shè)定的局部加權(quán)參數(shù)。得到所有權(quán)重W=[w1,w2,…wN]。將輸入神經(jīng)網(wǎng)絡(luò)的輸入值更換為之后使用極限學(xué)習(xí)機進行建模。
第六步 極限學(xué)習(xí)機是一種單隱層隨機神經(jīng)元網(wǎng)絡(luò),隨機生成C個隱神經(jīng)元節(jié)點g(ai,bi)的所有參數(shù)(a1,b1)(a2,b2)…(aC,bC)生成好后,依照單層神經(jīng)網(wǎng)絡(luò)的輸出公式此公式也可寫成:
Hβ=T,其中β為神經(jīng)元輸出權(quán)重矩陣,T為神經(jīng)網(wǎng)絡(luò)輸出結(jié)果,
為追求使得誤差|T-Y|2最小,可得到權(quán)重矩陣計算公式β=H+T。得到的神經(jīng)網(wǎng)絡(luò)的權(quán)重β加上之前隨機生成的節(jié)點參數(shù)ai,bi就是整個極限學(xué)習(xí)機的神經(jīng)網(wǎng)絡(luò)參數(shù)。
第七步 重復(fù)以上步驟,每次得到一個查詢樣本局部加權(quán)極限學(xué)習(xí)的預(yù)測值,重復(fù)進行所有的查詢樣本向量的建模和軟測量結(jié)果后得到了整個測試樣本的軟測量結(jié)果。
第八步 采用以上得到的基于時間維度拓展局部加權(quán)極限學(xué)習(xí)機方法對工業(yè)過程的數(shù)據(jù)進行建模,實現(xiàn)過程的軟測量。
以下結(jié)合一個具體的脫丁烷塔例子來說明本發(fā)明的有效性。針對該過程,一共采集了2394個數(shù)據(jù),其中1197個數(shù)據(jù)用來建模,并對其對應(yīng)的丁烷含量值進行離線分析和標(biāo)記。另外采集的1197個數(shù)據(jù)樣本用來驗證軟測量模型的有效性。在該過程中,一共選取了7個過程變量對該過程的丁烷含量進行軟測量建模,這7個過程變量分別為塔頂溫度、塔頂壓力、回流流量、下一級流量、靈敏板溫度、塔底溫度和塔底壓力。接下來結(jié)合該具體過程對本發(fā)明的實施步驟進行詳細(xì)地闡述:
1.數(shù)據(jù)前處理,對2394個建模樣本中的過程變量和丁烷含量進行預(yù)處理和歸一化,使得各個過程變量和關(guān)鍵變量的均值為零,方差為1,得到新的建模數(shù)據(jù)矩陣。
2.基于時間維度拓展局部加權(quán)極限學(xué)習(xí)機的軟測量建模
將選取的過程過程變量組成的數(shù)據(jù)矩陣作為軟測量模型的輸入,丁烷含量數(shù)據(jù)矩陣作為軟測量模型的輸出,按照實施步驟中給出的詳細(xì)方法,對每個測試樣本點建立相關(guān)的時間維度拓展局部加權(quán)極限學(xué)習(xí)機的軟測量模型。
3.對全部樣本集的數(shù)據(jù)進行建模和預(yù)測
為了測試新方法的有效性,我們對2394個測試樣本均進行局部建模和軟測量預(yù)測,得到軟測量結(jié)果后進行比對和研究。
4.丁烷含量的軟測量建模預(yù)測比較
對2394個驗證樣本進行在線軟測量,獲得相應(yīng)的在線估計值。應(yīng)用極限學(xué)習(xí)機方法針對2394個驗證樣本的在線軟測量,誤差為0.130686。僅進行局部加權(quán)而沒有進行時間維度拓展的極限學(xué)習(xí)機軟測量模型對相同樣本進行軟測量,結(jié)果和真實值進行比對,誤差為0.0880488。僅進行時間維度拓展而沒有進行局部加權(quán)的極限學(xué)習(xí)機軟測量模型對相同樣本進行軟測量,結(jié)果和真實值進行比對,誤差為0.0549991。應(yīng)用本發(fā)明時間維度拓展極限學(xué)習(xí)機軟測量對該樣本進行的軟測量的結(jié)果和真實值的比對,誤差為0.0480588??梢钥闯鰰r間維度拓展極限學(xué)習(xí)機和局部加權(quán)極限學(xué)習(xí)機都降低了預(yù)測的誤差,提升了軟側(cè)臉模型的精度,而時間維度拓展局部加權(quán)極限學(xué)習(xí)機更進一步降低了預(yù)測的誤差,提升了軟測量模型的精度。
上述實施例又來解釋說明本發(fā)明,而不是對本發(fā)明進行限制,在本發(fā)明的精神和權(quán)利要求的保護范圍內(nèi),對本發(fā)明最初的人和修改和改變,都落入本發(fā)明的保護范圍。