本發(fā)明涉及一種工業(yè)過程軟測量方法,尤其是涉及一種基于多樣性變量加權(quán)PLSR模型的工業(yè)過程軟測量方法。
背景技術(shù):
實時監(jiān)測產(chǎn)品質(zhì)量信息是保證產(chǎn)品質(zhì)量穩(wěn)定與提高企業(yè)盈利能力的基本手段,在整個生產(chǎn)自動化系統(tǒng)中占有著重要的地位。隨著計算機技術(shù)以及先進儀表技術(shù)的飛速發(fā)展,工業(yè)過程可以很容易地測量到流量、液位、壓力、溫度等信息,直接或間接反應(yīng)產(chǎn)品質(zhì)量的信息也能通過儀器儀表測量得到實時數(shù)據(jù)。然而,相對于流量或溫度等儀表,在線實時分析產(chǎn)品質(zhì)量信息的設(shè)備通常價格高昂。若是采用離線分析手段,產(chǎn)品質(zhì)量數(shù)據(jù)的獲取就存在一定的延時,操作人員因此無法及時而準確的知曉產(chǎn)品質(zhì)量數(shù)據(jù)。近十幾年來,隨著數(shù)據(jù)驅(qū)動方法的廣泛應(yīng)用,軟測量技術(shù)應(yīng)運而生。它通過建立生產(chǎn)過程中容易測量的數(shù)據(jù)與產(chǎn)品質(zhì)量數(shù)據(jù)之間的回歸模型,實現(xiàn)了對質(zhì)量數(shù)據(jù)的實時估計。近年來,針對軟測量方法技術(shù)的研究已受到了工業(yè)界與學術(shù)界越來越多的關(guān)注。
軟測量技術(shù)的核心在于建立輸入數(shù)據(jù)(通常是工業(yè)過程中易測量的信息,如壓力、溫度、流量等)與輸出數(shù)據(jù)(通常為能直接或間接反映質(zhì)量信息的測量指標,如濃度)之間的回歸模型。而在當前已有的文獻與專利資料中,建立回歸模型常采用的方法有:統(tǒng)計回歸法、神經(jīng)網(wǎng)絡(luò)、支持向量機等。在數(shù)據(jù)量充分以及非線性特性很強的條件下,利用神經(jīng)網(wǎng)絡(luò)與支持向量機所建立的回歸模型精度高,通常能達到較滿意的軟測量效果。相比較而言,統(tǒng)計回歸法所需的數(shù)據(jù)量較小,而且訓(xùn)練時間很短,已越來越多地被應(yīng)用在工業(yè)過程軟測量領(lǐng)域。在眾多的統(tǒng)計回歸方法中,偏最小二乘回歸(Partial Least Square Regression,PLSR)是最基本也是最常用的算法。近年來,對PLSR的改進舉措也層出不窮,衍生出了諸如核PLSR、動態(tài)PLSR、多重PLSR等回歸模型。然而,作為一種最基本的回歸建模方法,PLSR在迭代訓(xùn)練模型之前,默認需將輸入輸出數(shù)據(jù)進行標準化處理,以消除各測量變量的量綱影響。從某種程度上看,標準化處理后的數(shù)據(jù)變量其賦予的權(quán)值都相等。也就是說,輸入數(shù)據(jù)中各測量變量在建立PLSR模型時是同等重要的。在無法確切知曉每個輸入變量如何影響輸出變量的前提下,這么預(yù)處理數(shù)據(jù)是可行的。可想而知,這種預(yù)處理方法對所有變量一視同仁,不能區(qū)分各個測量變量的差異。因此,基于PLSR的軟測量模型預(yù)測精度還有很大程度的提升空間。
此外,理論和實踐都已經(jīng)證明了通過構(gòu)建多重模型來建立軟測量模型可以使所建立的模型更好地匹配過程數(shù)據(jù)變化的多樣性,進而有效地提高模型的預(yù)測精度。這種利用多重回歸模型實施軟測量的技術(shù)手段關(guān)鍵在于如何多樣化輸入輸出數(shù)據(jù)的特征,并在此基礎(chǔ)上建立多樣化的回歸模型。若是生產(chǎn)過程有足夠的經(jīng)驗知識可供參考,根據(jù)過程的變化特征多樣化輸入輸出數(shù)據(jù)就不是什么難題。然而,實際操作中通常是缺乏這些可用來多樣化數(shù)據(jù)的先驗知識。因此,在過程經(jīng)驗知識缺乏的前提下,如何描述過程數(shù)據(jù)變化的多樣性并建立多樣化的回歸模型仍是一個有待解決的問題。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的主要技術(shù)問題是:針對傳統(tǒng)PLSR回歸模型在以上兩個方面的不足,通過利用輸入數(shù)據(jù)各測量變量間相關(guān)性大小的差異為不同變量賦予不同的權(quán)值,一則將各輸入變量間相關(guān)性差異考慮進回歸模型中,二則實現(xiàn)了多樣化數(shù)據(jù)特征的目的。與此同時,原始數(shù)據(jù)通過這種多樣性變量加權(quán)后重新作為PLSR模型的輸入數(shù)據(jù),可以建立多樣化的回歸模型,進而可以有效地改善傳統(tǒng)PLSR模型用于工業(yè)過程軟測量的效果。
本發(fā)明解決上述技術(shù)問題所采用的技術(shù)方案為:一種基于多樣性變量加權(quán)PLSR模型的工業(yè)過程軟測量方法,包括以下步驟:
(1)從生產(chǎn)過程的歷史數(shù)據(jù)庫中找出容易測量變量所對應(yīng)的采樣數(shù)據(jù)組成輸入數(shù)據(jù)矩陣X∈Rn×m,能直接或間接反映產(chǎn)品質(zhì)量的指標所對應(yīng)的數(shù)據(jù)組成輸出向量y∈Rn×1。其中,n為訓(xùn)練樣本數(shù),m為過程測量變量數(shù),R為實數(shù)集,Rn×m表示n×m維的實數(shù)矩陣。
(2)將向量y與矩陣X中的每一列進行標準化處理,得到均值為0,標準差為1的新輸出向量與新數(shù)據(jù)矩陣記錄向量y的標準差δ與均值μ并初始化i=1。
(3)按照下式計算第i個輸入測量變量與中不同列之間的相關(guān)系數(shù)Ci,j:
其中,上標號T表示矩陣或向量的轉(zhuǎn)置,下標號j=1,2,…,m,符號|| ||表示計算向量的長度,并將得到的m個相關(guān)系數(shù)組成向量Ci=[Ci,1,Ci,2,…,Ci,m]。
(4)將向量Ci中各元素做為權(quán)值賦予矩陣中相應(yīng)的列,得到加權(quán)后的輸入數(shù)據(jù)矩陣Xi,即:
其中,diag(Ci)表示將向量Ci變成對角矩陣,且對角線上的元素為Ci中各元素。
(5)利用PLSR算法建立輸入矩陣Xi與向量之間的回歸模型,即:
上式中,bi為回歸系數(shù)向量,ei為模型誤差,并利用bi與Xi求得該PLSR模型的輸出估計值yi=Xibi。
(6)置i=i+1后,判斷是否滿足條件i≤m。若是,重復(fù)步驟(4)~(6);若否,執(zhí)行步驟(7).
(7)將m個PLSR模型的輸出估計值組成新的輸入矩陣Y=[y1,y2,…,ym]∈Rn×m后,再次利用PLSR算法建立輸入矩陣Y與輸出向量之間的回歸模型,即:
上式中,q為回歸系數(shù)向量,f為模型誤差,并保留所有的回歸系數(shù)向量b1,b2,…,bm,q以備調(diào)用。
(8)實施在線工業(yè)過程軟測量,具體的實施過程如下所示:
①采集新時刻易測量變量的樣本數(shù)據(jù)z∈R1×m,并對其實施與矩陣X相同的標準化處理得到
②調(diào)用m個不同的權(quán)值向量C1,C2,…,Cm,按照下式分別對數(shù)據(jù)向量中各列進行加權(quán)處理,對應(yīng)得到m個新輸入數(shù)據(jù)向量z1,z2,…,zm:
其中,下標號i=1,2,…,m;
③調(diào)用回歸系數(shù)向量b1,b2,…,bm按照下式分別求得對應(yīng)的模型輸出估計值
④將所得到的輸出估計值組成向量并調(diào)用回歸系數(shù)向量q求得那么最終的產(chǎn)品質(zhì)量估計值
與現(xiàn)有方法相比,本發(fā)明方法的優(yōu)勢在于:
首先,通過計算輸入數(shù)據(jù)各測量變量與其他測量變量間相關(guān)性的大小,并以之作為輸入數(shù)據(jù)變量的權(quán)值,這從數(shù)據(jù)統(tǒng)計特性角度體現(xiàn)了各個輸入變量間相關(guān)性的差異在回歸建模中的重要性。此外,在不需要任何過程經(jīng)驗知識的前提下,直接基于多樣性變量加權(quán)處理后的數(shù)據(jù)建立多樣化的PLSR模型。從這兩點上將,本發(fā)明方法為解決如前所述傳統(tǒng)PLSR模型用于軟測量時的不足提供了一條可行之路。其次,本發(fā)明方法在多個PLSR模型估計值的基礎(chǔ)上再次使用PLSR方法,能更進一步的優(yōu)化軟測量模型輸出估計值。相比于傳統(tǒng)基于PLSR的軟測量方法而言,不僅能在數(shù)據(jù)特征描述上充分考慮輸入變量差異的多樣性,而且還利用了多樣化的回歸模型提升軟測量模型對產(chǎn)品質(zhì)量指標的預(yù)測精度。
附圖說明
圖1為本發(fā)明方法的實施流程圖。
圖2為PLSR算法的實施流程圖。
具體實施方式
下面結(jié)合附圖對本發(fā)明方法進行詳細的說明。
如圖1所示,本發(fā)明提供了一種基于多樣性變量加權(quán)PLSR模型的工業(yè)過程軟測量方法,該方法的具體實施步驟如下所示:
步驟1:從生產(chǎn)過程的歷史數(shù)據(jù)庫中找出容易測量變量所對應(yīng)的采樣數(shù)據(jù)組成輸入數(shù)據(jù)矩陣X∈Rn×m,能直接或間接反映產(chǎn)品質(zhì)量的指標所對應(yīng)的數(shù)據(jù)組成輸出向量y∈Rn×1。其中,n為訓(xùn)練樣本數(shù),m為過程測量變量數(shù),R為實數(shù)集,Rn×m表示n×m維的實數(shù)矩陣。
步驟2:將向量y與矩陣X中的每一列進行標準化處理,得到均值為0,標準差為1的新輸出向量與新數(shù)據(jù)矩陣記錄向量y的標準差δ與均值μ并初始化i=1。
步驟3:按照下式計算第i個輸入測量變量與中不同列之間的相關(guān)系數(shù)Ci,j:
其中,上標號T表示矩陣或向量的轉(zhuǎn)置,下標號j=1,2,…,m,符號|| ||表示計算向量的長度,并將得到的m個相關(guān)系數(shù)組成向量Ci=[Ci,1,Ci,2,…,Ci,m]。
步驟4:將向量Ci中各元素做為權(quán)值賦予矩陣中相應(yīng)的列,得到加權(quán)后的輸入數(shù)據(jù)矩陣Xi,即:
其中,diag(Ci)表示將向量Ci變成對角矩陣,且對角線上的元素為Ci中各元素。
步驟5:利用PLSR算法建立輸入矩陣Xi與向量之間的回歸模型,即:
上式中,bi為回歸系數(shù)向量,ei為模型誤差,并利用bi與Xi求得該PLSR模型的輸出估計值yi=Xibi。
如圖2所示,利用PLSR算法建立矩陣Xi與向量回歸模型的詳細實施過程如下所示:
①初始化h=1,并設(shè)置向量與向量
②依據(jù)公式wh=XiTu/(uTu)計算輸入權(quán)值向量wh,并用公式wh=wh/||wh||單位化向量wh;
③依據(jù)公式sh=Xiwh/(whTwh)計算得分向量sh;
④依據(jù)公式gh=y(tǒng)0Tsh/(shTsh)計算輸出權(quán)值gh;
⑤依據(jù)公式u=y(tǒng)0gh更新向量u;
⑥重復(fù)②~⑤直至sh收斂(即向量sh中各元素不再變化);
⑦保留輸入權(quán)值向量wh與輸出權(quán)值gh,并依據(jù)公式ph=XiTsh/(shTsh)計算投影向量ph;
⑧依據(jù)如下兩式更新輸入矩陣Xi與輸出向量y0:
Xi=Xi-shphT (10)
y0=y(tǒng)0-shgh (11)
⑨令h=h+1后,若h≤3ki/4,重復(fù)②~⑧求解下一個wh、gh、和ph;若h>3ki/4,則執(zhí)行⑩;
⑩將得到的所有輸入權(quán)值向量組成矩陣W=[w1,w2,…,wh]、所有輸出權(quán)值向量組成行向量G=[g1,g2,…,gh]、以及所有投影向量組成矩陣P=[p1,p2,…,ph],那么PLSR模型的回歸系數(shù)向量bi=W(PTW)-1GT。
步驟6:置i=i+1后,判斷是否滿足條件i≤m。若是,重復(fù)步驟4~6;若否,執(zhí)行步驟7.
步驟7:將m個PLSR模型的輸出估計值組成新的輸入矩陣Y=[y1,y2,…,ym]∈Rn×m后,再次利用PLSR算法建立輸入矩陣Y與輸出向量之間的回歸模型,即:
上式中,q為回歸系數(shù)向量,f為模型誤差,并保留所有的回歸系數(shù)向量b1,b2,…,bm,q以備調(diào)用。具體建立Y與輸出向量之間的PLSR模型的實施步驟與步驟5類似,這里不再贅述。
步驟8:實施在線工業(yè)過程軟測量,具體的實施過程如下所示:
①采集新時刻易測量變量的樣本數(shù)據(jù)z∈R1×m,并對其實施與矩陣X相同的標準化處理得到
②調(diào)用m個不同的權(quán)值向量C1,C2,…,Cm,按照下式分別對數(shù)據(jù)向量中各列進行加權(quán)處理,對應(yīng)得到m個新輸入數(shù)據(jù)向量z1,z2,…,zm:
其中,下標號i=1,2,…,m;
③調(diào)用回歸系數(shù)向量b1,b2,…,bm按照下式分別求得對應(yīng)的模型輸出估計值
④將所得到的輸出估計值組成向量并調(diào)用回歸系數(shù)向量q求得那么最終的產(chǎn)品質(zhì)量估計值
上述實施例僅是對本發(fā)明的優(yōu)選實施方式,在本發(fā)明的精神和權(quán)利要求的保護范圍內(nèi),對本發(fā)明做出的任何修改和改變,不應(yīng)排除在本發(fā)明的保護范圍之外。