專利名稱:一種改進(jìn)的tr多組分氣體傅里葉變換紅外光譜特征變量提取方法
技術(shù)領(lǐng)域:
本發(fā)明涉及光譜定量分析領(lǐng)域,特別涉及一種多組分氣體傅里葉變換紅外光譜分析中的特征變量提取方法。
背景技術(shù):
特征變量提取有時(shí)又叫特征光譜選擇,是光譜分析的重要內(nèi)容之一,選取了合適的特征變量有助于提高氣體光譜分析的信噪比,減小分析誤差。常用的特征變量提取方法包括前向選擇、分段回歸(SWR)、遺傳算法、模擬退火等。這些方法大多是基于標(biāo)定數(shù)據(jù)偏差或者驗(yàn)證數(shù)據(jù)偏差進(jìn)行優(yōu)化的。只基于標(biāo)定數(shù)據(jù)偏差標(biāo)準(zhǔn)進(jìn)行優(yōu)化,會(huì)導(dǎo)致過(guò)擬合,而只基于驗(yàn)證數(shù)據(jù)的偏差標(biāo)準(zhǔn)進(jìn)行優(yōu)化,則對(duì)新獲得的X集合會(huì)得到差的預(yù)測(cè)。Tikhonov正則化(TR)法是基于同時(shí)最優(yōu)化預(yù)測(cè)偏差和方差測(cè)度的。因此大大減小了出現(xiàn)過(guò)擬合和欠擬合的概率。Tikhonov正則化是基于式(I)的線性模型的y = Xb+e (I)式中X是ー個(gè)mXw的矩陣,包含m個(gè)標(biāo)定樣本在w條譜線上的光譜;b = [b1; b2,…,bw]T是wX I的回歸向量,其中上標(biāo)T表示向量或矩陣的轉(zhuǎn)置算子;y是mX I的向量,它包含了某種被分析氣體的濃度信息;e也是mXl的向量,表示隨機(jī)誤差。由于譜線值不論是透射率還是吸光度,它總是與被分析氣體的濃度單調(diào)遞增,或者單調(diào)遞減。因此,盡管光譜分辨率較低,被分析氣體吸收光譜交疊嚴(yán)重時(shí),光譜值與氣體濃度之間的關(guān)系是非線性的,也依然可以從線性方法入手來(lái)選擇合適的譜線作為分析模型的輸入。Tikhonov正則化的思想可以用式(2)來(lái)表示min|xb-y|:+/l|Lb|:)(2)該式也稱為Tikhonov正則化的目標(biāo)泛函。式中Il Il p表示p_模,P = 2時(shí)就是歐幾里模;a和b分別表不回歸偏差和回歸向量的模,I ^ a,b <°° ;L表不一個(gè)正則化算子,它迫使b的估計(jì)值屬于相應(yīng)的特性良好的函數(shù)的子空間;\表示控制第2項(xiàng)相對(duì)于第I 項(xiàng)的權(quán)值。明顯地,式(2)中的第一項(xiàng)是最小化式(I)中的隨機(jī)誤差e,而第二項(xiàng)則是為了最小化回歸向量b,以獲得靈敏度高、信噪比高的特征譜線,以提高標(biāo)定模型分析結(jié)果的準(zhǔn)確性。光譜信號(hào)往往是以透射率或者吸光度作為輸出的。由于長(zhǎng)時(shí)間工作后,環(huán)境參數(shù)的變化,光源光譜強(qiáng)度分布的變化,探測(cè)器對(duì)不同波長(zhǎng)光信號(hào)靈敏度的變化等,致使光譜的基線發(fā)生漂移。這種漂移可能是基線的平移,也可能是基線的傾斜,還可能是兩者的組合, 甚至是非線性的。在這種情況下,TR特征變量提取算法所提取的特征變量將存在很大的噪聲分量。雖然目前已有相關(guān)基線校正方法,但由于基線漂移的非線性關(guān)系,這些方法往往只能進(jìn)行基線的整體校正,在局部范圍內(nèi),依然存在一定的漂移,這將給分析結(jié)果帶來(lái)較大的誤差。
發(fā)明內(nèi)容
本發(fā)明的目的在于,提供一種改進(jìn)的TR特征變量提取方法,該方法在(I)式所示的Tikhonov正則化光譜選擇基礎(chǔ)上,將Tikhonov正則化模型中的內(nèi)積進(jìn)行因式分解,并在正則化目標(biāo)泛函中増加一項(xiàng)因式中譜線位置距離損失函數(shù)約束項(xiàng),并采用基于Engl誤差極小化準(zhǔn)則(Engl,s criterion)的 LASSO (Least Absolute Shrinkage and Selection Operator)算法對(duì)目標(biāo)泛函進(jìn)行損失函數(shù)最小化進(jìn)化計(jì)算,以獲得該TR正則化模型的回歸向量,最終得到可以降低甚至消除光譜基線規(guī)則畸變所帶來(lái)的偏差的特征變量。為了實(shí)現(xiàn)上述任務(wù),本發(fā)明采用如下技術(shù)解決方案—種改進(jìn)的TR特征變量提取方法,其特征在于首先將Tikhonov正則化模型的譜線內(nèi)積Xb進(jìn)行因式分解,修改成
權(quán)利要求
1.一種改進(jìn)的TR多組分氣體傅里葉變換紅外光譜特征變量提取方法,其特征在于首先在標(biāo)準(zhǔn)Tikhonov正則化光譜選擇基礎(chǔ)上,將Tikhonov正則化模型中的內(nèi)積項(xiàng)進(jìn)行因式分解,并在正則化目標(biāo)泛函中増加一項(xiàng)譜線位置距離損失函數(shù)約束項(xiàng),然后采用基于Engl 誤差極小化準(zhǔn)則的LASSO算法對(duì)目標(biāo)泛函進(jìn)行損失函數(shù)最小化進(jìn)化計(jì)算,以獲得改進(jìn)正則化模型的回歸向量,最終得到可以降低甚至消除光譜基線規(guī)則畸變所帶來(lái)的偏差的特征變量。
2.根據(jù)權(quán)利要求I所述的TR多組分氣體傅里葉變換紅外光譜特征變量提取方法,其特征在于TikhonoV正則化的線性模型為式中X是ー個(gè)mXw的矩陣,包含m個(gè)標(biāo)定樣本在w條譜線上的光譜;b = [b1; b2,…, bw]T是wXl的回歸向量,其中上標(biāo)T表示向量或矩陣的轉(zhuǎn)置算子;yimXl的向量,它包含了某種被分析氣體的濃度信息;e也是mX I的向量,表示隨機(jī)誤差Jikhonov正則化的目標(biāo)泛函為式中Il Il P表示P-范數(shù),P = 2時(shí)就是歐幾里范數(shù);a和b分別表示回歸偏差和回歸向量的范數(shù),I a,b ;L表示ー個(gè)正則化算子,它迫使b的估計(jì)值屬于相應(yīng)的特性良好的函數(shù)的子空間;、表示控制第2項(xiàng)相對(duì)于第I項(xiàng)的權(quán)值;改進(jìn)的Tikhonov正則化模型其特征在于將上述線性模型的譜線內(nèi)積項(xiàng)Xb進(jìn)行因式分解,修改成ny = -x^u+ly>c^ +ei=\式中Xij表不第i個(gè)分量第j條譜線的值,n表不一共有n個(gè)因式,Ci表不第i個(gè)因式的系數(shù);于是標(biāo)準(zhǔn)Tikhonov正則化目標(biāo)泛函可修正為fa\min Zlxy -x^K -y + aIIlcC式中 c = [C1, C2,…,Cn]T, k > jo
3.如權(quán)利要求2所述的TR多組分氣體傅里葉變換紅外光譜特征變量提取方法,其特征在于針對(duì)譜線內(nèi)積因式分解項(xiàng)中斜率的變化范圍及趨勢(shì),増加一項(xiàng)因式中譜線位置距離損失函數(shù)約束項(xiàng)Vi A Ij- V j A Ij — 0式中V為所提取的特征量,Al為特征譜線間距;該式表示以譜線斜率變化量為基準(zhǔn), 在相等譜線間距內(nèi),所選取的特征光譜及其之間譜線間距的乘積的絕對(duì)值盡可等相同或相近,以補(bǔ)償因受外界環(huán)境或條件干擾產(chǎn)生的基線波動(dòng)或漂移所引入的誤差,從而降低TR特征變量提取算法所提取的特征變量中的噪聲分量;將該譜線位置距離損失函數(shù)約束項(xiàng)引入到Tikhonov正則化目標(biāo)泛函中,則其進(jìn)ー步修正為式中Iu表示第i個(gè)因式中第j條譜線的波數(shù)序號(hào),、表示控制第3項(xiàng)相對(duì)于第I項(xiàng)權(quán)重的系數(shù),三個(gè)分項(xiàng)的上下標(biāo)a、b和d分別表示回歸偏差、回歸向量和因式譜線位置距離的范數(shù)。
4.如權(quán)利要求2所述的TR多組分氣體傅里葉變換紅外光譜特征變量提取方法,其特征在干采用基于Engl誤差極小化準(zhǔn)則的LASSO算法對(duì)目標(biāo)泛函進(jìn)行損失函數(shù)最小化進(jìn)化計(jì)算,包括如下步驟(1)預(yù)估回歸向量初值Ctl,為保證后面計(jì)算準(zhǔn)確度,先采用最小ニ乘算法對(duì)光譜矩陣做初始擬合,即采用最小二乗法使得光譜濃度矩陣偏差的加權(quán)平方和為最小 解方程
全文摘要
本發(fā)明公開了一種改進(jìn)的TR多組分氣體傅里葉變換紅外光譜特征變量提取方法。該方法首先將特征變量提取模型分解成多項(xiàng)譜線值之差的加權(quán)和,并將原TR正則化目標(biāo)泛函轉(zhuǎn)換成基于該模型的目標(biāo)泛函,然后在該目標(biāo)泛函中增加一項(xiàng)譜線位置差的約束項(xiàng),并采用基于Engl誤差極小化準(zhǔn)則(Engl’s criterion)的LASSO(Least Absolute Shrinkage and Selection Operator)算法實(shí)現(xiàn)最優(yōu)泛函求解,以獲得回歸向量的最優(yōu)值,得到可以克服光譜基線偏移帶來(lái)的影響的特征變量,提高多組分氣體在線分析結(jié)果的準(zhǔn)確性。本發(fā)明實(shí)現(xiàn)的多組分氣體特征量提取方法可用于石油、天然氣勘探的氣錄井,產(chǎn)品質(zhì)量檢查與故障診斷、五金、化工、環(huán)境保護(hù)領(lǐng)域的多組分氣體光譜定量分析應(yīng)用中。
文檔編號(hào)G01N21/35GK102608061SQ20121007650
公開日2012年7月25日 申請(qǐng)日期2012年3月21日 優(yōu)先權(quán)日2012年3月21日
發(fā)明者劉君華, 張蕾, 湯曉君 申請(qǐng)人:西安交通大學(xué)