結(jié)合過(guò)程先驗(yàn)和數(shù)據(jù)驅(qū)動(dòng)模型的混合建模方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于化工過(guò)程建模領(lǐng)域,涉及一種過(guò)程建模方法,尤其涉及一種結(jié)合過(guò)程 先驗(yàn)和數(shù)據(jù)驅(qū)動(dòng)模型的混合建模方法;同時(shí),本發(fā)明還涉及一種結(jié)合過(guò)程先驗(yàn)和數(shù)據(jù)驅(qū)動(dòng) 模型的混合模型。
【背景技術(shù)】
[0002] 傳統(tǒng)的機(jī)理信息建模方法必須對(duì)建模的系統(tǒng)有足夠的了解,并且通過(guò)質(zhì)量能量方 程、反應(yīng)動(dòng)力學(xué)方程等公式建立精確的描述模型。但是,實(shí)際工業(yè)過(guò)程復(fù)雜度高、反應(yīng)機(jī)理 多,難以準(zhǔn)確把握,導(dǎo)致機(jī)理信息建模常難以達(dá)到過(guò)程系統(tǒng)模型的精度要求?;跀?shù)據(jù)驅(qū)動(dòng) 的方法迅速發(fā)展,并廣泛應(yīng)用于化工過(guò)程建模與優(yōu)化。數(shù)據(jù)驅(qū)動(dòng)建模方法的優(yōu)點(diǎn)在于僅依 托于歷史數(shù)據(jù)或現(xiàn)場(chǎng)實(shí)時(shí)數(shù)據(jù),不需要明確的機(jī)理信息。對(duì)于復(fù)雜的非線性過(guò)程,在能夠獲 取充足的輸入輸出樣本下,數(shù)據(jù)驅(qū)動(dòng)建模常具有較好的效果。然而,數(shù)據(jù)驅(qū)動(dòng)建模方法也有 明顯的缺點(diǎn),如機(jī)理表達(dá)的模糊,外延特性不好,以及在小樣本建模中常見的過(guò)擬合現(xiàn)象。
[0003] 目前的主要避免過(guò)擬合的方法主要利用樣本自身信息(如外部檢驗(yàn)法、引導(dǎo)重采 樣和噪聲注入技術(shù)擴(kuò)充樣本法)實(shí)現(xiàn)對(duì)過(guò)擬合現(xiàn)象的一定制約,但研宄表明小樣本建模作 用有限。過(guò)程對(duì)象本身存在諸多的機(jī)理信息難以應(yīng)用,例如過(guò)程中大量的可以分析得到的 一階信息(表現(xiàn)為單調(diào)性)、二階信息(表現(xiàn)為凹凸性)和輸出限制信息。一些學(xué)者也提 出綜合過(guò)程機(jī)理的數(shù)據(jù)驅(qū)動(dòng)建模方法(如帶有機(jī)理的代理模型方法、輸出增益檢測(cè)的神經(jīng) 網(wǎng)絡(luò)模型、合概率密度估計(jì)的建模方法和單調(diào)神經(jīng)網(wǎng)絡(luò)),但是綜合建模方法也存在一些缺 陷,要么模型結(jié)構(gòu)過(guò)于簡(jiǎn)單,要么建模對(duì)象約束較高。
[0004] 傳統(tǒng)的機(jī)理信息結(jié)合樣本信息的建模方法在克服過(guò)擬合問(wèn)題上存在諸多的缺陷, 容易對(duì)部分有用信息進(jìn)行舍棄。有鑒于此,如今迫切需要設(shè)計(jì)一種新的建模方法和模型,綜 合利用機(jī)理信息和樣本信息,客服小樣本建模的過(guò)擬合問(wèn)題。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明所要解決的技術(shù)問(wèn)題是:提供一種結(jié)合過(guò)程先驗(yàn)和數(shù)據(jù)驅(qū)動(dòng)模型的混合建 模方法,可以在少量數(shù)據(jù)樣本的神經(jīng)網(wǎng)絡(luò)訓(xùn)練下得到更符合先驗(yàn)知識(shí)的模型,避免過(guò)擬合 現(xiàn)象的發(fā)生。
[0006] 此外,本發(fā)明還提供一種結(jié)合過(guò)程先驗(yàn)和數(shù)據(jù)驅(qū)動(dòng)模型的混合系統(tǒng),可以在少量 數(shù)據(jù)樣本的情形下訓(xùn)練得到更符合先驗(yàn)知識(shí)的數(shù)據(jù)驅(qū)動(dòng)模型,避免過(guò)擬合現(xiàn)象的發(fā)生和提 尚豐旲型魯棒性。
[0007] 為解決上述技術(shù)問(wèn)題,本發(fā)明采用如下技術(shù)方案:
[0008] -種結(jié)合過(guò)程先驗(yàn)和數(shù)據(jù)驅(qū)動(dòng)模型的混合建模方法,所述方法包括如下步驟:
[0009] 步驟S1、從已知的數(shù)據(jù)驅(qū)動(dòng)模型中選擇合適的數(shù)據(jù)驅(qū)動(dòng)模型和合適的模型結(jié)構(gòu), 建立對(duì)應(yīng)模型的數(shù)學(xué)關(guān)系表達(dá)式,將所有的模型參數(shù)按照一定的順序排列;
[0010] 步驟S2、定步掃描方法對(duì)模型過(guò)程先驗(yàn)(主要包括輸出響應(yīng)信息、輸出響應(yīng)的一 階信息(表現(xiàn)為單調(diào)性)和二階信息(表現(xiàn)為凹凸性)進(jìn)行驗(yàn)證,得到檢驗(yàn)?zāi)P瓦`反過(guò)程 先驗(yàn)程度的約束方程;
[0011] 步驟S3、將樣本的模型輸出和觀測(cè)值比較,根據(jù)均方差公式和正則化方法建立檢 驗(yàn)?zāi)P蛿M合訓(xùn)練樣本程度的優(yōu)化目標(biāo)方程;
[0012] 步驟S4、將約束方程和優(yōu)化目標(biāo)方程聯(lián)合,構(gòu)建約束優(yōu)化問(wèn)題,采用約束處理智能 算法求解最優(yōu)參數(shù)解;
[0013] 步驟S5、將求解得到的最優(yōu)參數(shù)解,作為Sl的模型參數(shù)解,代入原模型中,用于模 型預(yù)測(cè)或模型優(yōu)化。
[0014] 作為本發(fā)明的一種優(yōu)選方案,所述步驟Sl的模型數(shù)學(xué)關(guān)系表達(dá)式和模型參數(shù)排 列:選擇某一數(shù)據(jù)驅(qū)動(dòng)模型,一般的我們常選擇BP神經(jīng)網(wǎng)絡(luò)模型、響應(yīng)曲面模型、支持向量 機(jī)等。
[0015] 對(duì)于BP神經(jīng)網(wǎng)絡(luò)模型,其模型輸入輸出關(guān)系式為:
[0016]
[0017]其中:
[0018] par為模型參數(shù)排列,在BP網(wǎng)絡(luò)模型中為所有權(quán)值和閾值的一種固定排列,包括 所有的Wij, Tli, 和Θ p
[0019] X為輸入向量組合,也可表示成(X1, X2,…,X1),
[0020] Wu為輸入層到隱含層的權(quán)值系數(shù),
[0021] Θ」為隱含層各神經(jīng)元的閾值系數(shù),
[0022] Tli為隱含層到輸出層的權(quán)值系數(shù),
[0023] Θ 輸出層神經(jīng)元的閾值系數(shù),
[0024] L為輸入層神經(jīng)元數(shù),由實(shí)際系統(tǒng)的輸入變量決定,
[0025] H為隱含層神經(jīng)元數(shù),為建模者根據(jù)經(jīng)驗(yàn)或者試湊法不確定方法來(lái)決定,
[0026] B為輸出層神經(jīng)元數(shù),由于研宄對(duì)象為多輸入單輸出對(duì)象,輸出層神經(jīng)元數(shù)取1,
[0027] fi_h為隱含層激活函數(shù),激活函數(shù)種類繁多,簡(jiǎn)單線性函數(shù)(purelin)、有sigmoid 函數(shù)(tansig和logsig)、正弦函數(shù)、雙曲正切和反正切,自適應(yīng)多項(xiàng)式函數(shù)等。常用的包括 tansig,Iogsig 和 purelin 三種,一般隱含層選取 tansig 或 logsig,
[0028] fh_。為隱含層激活函數(shù),一般選取purelin ;
[0029] 類似的,對(duì)于響應(yīng)曲面模型,其模型輸入輸出關(guān)系式為:
[0030]
[0031] 其中:
[0032] par表不模型參數(shù)組合,包含b。、t^、bjk和b p
[0033] Idci為常數(shù)項(xiàng),
[0034] bi為輸入Xi的一階項(xiàng),
[0035] bjk為輸入X』和X k的相關(guān)系數(shù)項(xiàng),
[0036] Id1為輸入X1的二階項(xiàng),
[0037] Xi為第i個(gè)輸入變量,共計(jì)L維;
[0038] 作為本發(fā)明的一種優(yōu)選方案,所述步驟S2通過(guò)以下3個(gè)子步驟獲得模型的約束方 程表達(dá)式:
[0039] 步驟S2. 1、檢測(cè)點(diǎn)采樣:在整個(gè)空間用固定步長(zhǎng)Au將整個(gè)空間進(jìn)行劃分成多個(gè) 子空間,分別在子空間內(nèi)采樣,作為輸出范圍先驗(yàn)的多次檢測(cè)。同樣的,用固采定步長(zhǎng)Aij 將已知的單調(diào)性先驗(yàn)和凹凸性先驗(yàn)的區(qū)間劃分成個(gè)更小的M,7子區(qū)間,標(biāo)記為
[0040] 步驟S2. 2、采樣點(diǎn)的先驗(yàn)檢測(cè):對(duì)于整個(gè)對(duì)象輸入空間內(nèi)的輸出范圍檢測(cè),可通 過(guò)采樣點(diǎn)的輸出值與輸出上下限比較得到,已知輸出上限為yH,下限為5^,比較檢驗(yàn)?zāi)P?輸出值與它們的關(guān)系,當(dāng)且僅當(dāng)Λ {^,辦時(shí),輸出范圍先驗(yàn)正確,否則在該小區(qū)域內(nèi) 違反輸出范圍先驗(yàn)。若所有采樣點(diǎn)均符合輸出范圍檢驗(yàn)結(jié)果,則近似認(rèn)為模型對(duì)該條單調(diào) 先驗(yàn)無(wú)違反。對(duì)于該小區(qū)間內(nèi)的單調(diào)信息正確性檢驗(yàn)可通過(guò)多次固定其他輸入變量值,僅 求解區(qū)間兩端點(diǎn)(和的輸出值,比較大小檢驗(yàn)單調(diào)性信息,若輸出值比較結(jié)果與 單調(diào)信息符合,近似認(rèn)為該小區(qū)間符合單調(diào)信息。例如,若該區(qū)間為單調(diào)遞增區(qū)間,必有 λ >iu,若為單調(diào)遞減區(qū)間,必有λ <?,"ρ若所有小區(qū)間均符合單調(diào)信息檢驗(yàn)結(jié)果,則 近似認(rèn)為模型對(duì)該條單調(diào)先驗(yàn)無(wú)違反。同理,檢驗(yàn)該小區(qū)間的凹凸性可采用兩端點(diǎn) 和^ )和中點(diǎn)的輸出值比較,近似檢驗(yàn)小區(qū)間的凹凸信息。例如,若該區(qū)間為嚴(yán) 格凸區(qū)間,必有+ > 2 X ,若為嚴(yán)格凹區(qū)間,必有+ y< 2 X ??捎梅?hào) 函數(shù)表示每一條先驗(yàn)的每一次檢驗(yàn)結(jié)果,如公式(3)、公式(4)和公式(5),公式(3)用于檢 驗(yàn)輸出范圍,公式(4)用于檢驗(yàn)單調(diào)性先驗(yàn),公式(5)用于檢驗(yàn)凹凸性先驗(yàn);
[0041]
[0042]
[0043]
[0044] 其中,h(i,j,m)為第i維上第j條已知先驗(yàn)的第m次檢測(cè)結(jié)果;
[0045] 如果每一個(gè)h(i,j,m)對(duì)應(yīng)的值均為"1",則近似認(rèn)為模型完全符合對(duì)應(yīng)先驗(yàn); h (i,j,m)為"-1",模型在對(duì)應(yīng)的小區(qū)間內(nèi)必然違背對(duì)應(yīng)先驗(yàn)知識(shí);
[0046] 步驟S2. 3、違反程度統(tǒng)計(jì):根據(jù)統(tǒng)計(jì)"-1"的次數(shù)占所有掃描檢驗(yàn)次數(shù)的比例 viol,刻畫模型的先驗(yàn)機(jī)理違反程度,計(jì)算公式如下:
[0047]
[0048] 如果系統(tǒng)模型完全符合所有過(guò)程先驗(yàn),viol值為0。viol值較小代表模型輕微違 反已知的過(guò)程先驗(yàn);Viol越接近1,表示模型違反過(guò)程的程度越大。
[0049] 作為本發(fā)明的一種優(yōu)選方案,所述步驟S3通過(guò)以下2個(gè)子步驟獲得模型的優(yōu)化目 標(biāo)函數(shù)F(W):
[0050] 步驟S3. 1、構(gòu)建數(shù)據(jù)驅(qū)動(dòng)模型輸出值與測(cè)量值的均方差模型,見公式(7):
[0051]
(7)
[0052] 為第k個(gè)樣本的模型輸出,計(jì)算公式參考模型數(shù)學(xué)關(guān)系式,例如若是選擇BP網(wǎng) 絡(luò)則參考公式(1),若是選擇響應(yīng)曲面模型則選擇公式(2),選擇其他數(shù)據(jù)驅(qū)動(dòng)建模方法則 建立對(duì)應(yīng)的模型數(shù)學(xué)關(guān)系式,
[0053