本發(fā)明涉及紅外光譜分析領(lǐng)域,特別涉及一種紅外光譜的定性分析方法。
背景技術(shù):
紅外光譜分析是物質(zhì)定性的重要方法,它的解析能夠提供許多關(guān)于官能團的信息,可以幫助確定部分乃至全部分子類型及結(jié)構(gòu),其定性分析有特征性高、分析時間短、需要的試樣量少、不破壞試樣、測定方便等優(yōu)點。紅外光譜定性分析主要用于物質(zhì)的定性判別,即通過比較未知樣品與已知參考樣品集的光譜來確定未知物的歸屬。隨著紅外光譜的定性分析方法的發(fā)展,尤其是傅里葉變換紅外光譜,現(xiàn)有技術(shù)已經(jīng)有多種方法可以對傅里葉變換紅外光譜進行定性分析:如經(jīng)典最小二乘回歸法(cls)、偏最小二乘法(pls)、人工神經(jīng)網(wǎng)絡(luò)算法(ann)等,基于這些方法對紅外光譜進行定性分析時都存在著一定的缺陷。比如,采用cls來進行組分識別時,首先需要選出所考察波段所有光譜的吸光度數(shù)據(jù),但是所有光譜數(shù)據(jù)最后都能影響到該算法的識別結(jié)果,同時cls分析方法無法解決光譜數(shù)據(jù)庫中光譜的多重共線性問題,而在采用pls建模進行定性分析時,新組分的出現(xiàn)將會降低識別的準確度;近年來人工神經(jīng)網(wǎng)絡(luò)算法發(fā)展迅速,但是該算法需要復雜的訓練過程,并且單一人工神經(jīng)網(wǎng)絡(luò)算法只能對單一組分進行定性識別,且無法實現(xiàn)快速定性識別分析。
同時,隨著紅外光譜數(shù)據(jù)庫中紅外光譜種類的增加,組分吸收光譜特性共線性加重,現(xiàn)有紅外光譜的定性分析方法很難解決此類問題。為此,對于實時在線應(yīng)用,要想從紅外光譜的大數(shù)據(jù)庫中實現(xiàn)對待檢測樣本的紅外光譜的準確、快速定性分析,目前來說還尚有難度。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于提供一種紅外光譜的定性分析方法,實時在線應(yīng)用對待檢測樣本的紅外光譜進行準確、快速的定性分析,識別樣本組分。
為了實現(xiàn)上述目的,本發(fā)明采取以下技術(shù)方案:一種紅外光譜的定性分析方法,包括如下步驟:(a)、制備待檢測樣本;(b)、調(diào)取待檢測樣本所屬領(lǐng)域的光譜數(shù)據(jù)庫;(c)、利用光譜儀采集待檢測樣本的紅外光譜圖;(d)、采用enet(基于彈性網(wǎng)的變量選擇技術(shù))方法從光譜數(shù)據(jù)庫中進行初次選擇樣本組分,建立樣本紅外光譜組分的吸光度矩陣xae,即n行mae的矩陣(x為組分標準吸收光譜,n為組分光譜數(shù)據(jù)點數(shù),m為組分光譜的個數(shù));(e)、根據(jù)步驟d中的樣本組分數(shù)據(jù)建立cls(線性最小二乘擬合)模型:cae=(xaetxae)-1xaet*y,隨后進入循環(huán)迭代計算剔除cae<0的組分,進行二次篩選,得出新的樣本組分數(shù)據(jù)xac,mac,cac(c為組分濃度,y為紅外吸光度譜);(f)、根據(jù)步驟e中二次篩選的樣本組分數(shù)據(jù)再次擬合計算得出yac值,xac*cac的每一列在yac方向上的投影長度與yac自身長度的比值記為pa1,xac*cac的長度與yac在各自組分方向上的投影長度比值記為pa2,比較pa1與pa2進行組分三次篩選;(g)整合步驟f中三次篩選的組分,即為樣本的紅外光譜的定性分析結(jié)果。
與現(xiàn)有技術(shù)相比,本發(fā)明采用enet方法從光譜數(shù)據(jù)庫中對待檢測樣本光譜圖進行初次篩選組分;隨后建立cls模型進行循環(huán)迭代計算剔除cae<0的組分,完成二次篩選組分;最后根據(jù)二次篩選光譜數(shù)據(jù)進行擬合yac,計算判斷pa1與pa2的大小,完成三次篩選組分,整個過程結(jié)合了enet方法的變量選擇能力,通過循環(huán)迭代cls過程,以及upas過程,實現(xiàn)紅外光譜的快速、準確定性識別分析,同時,方法不需要事先建模,還能解決多組分紅外光譜中,光譜組分的嚴重多重共線性問題。
附圖說明
圖1為本發(fā)明方法的流程圖;
圖2為實施例2700cm-1~3040cm-1波段的吸光度譜;
圖3為采用enet方法初次篩選結(jié)果圖;
圖4為采用enet方法篩選的組分、濃度表格;
圖5為lcls一次迭代結(jié)果圖;
圖6為lcls一次迭代篩選的組分、濃度表格;
圖7為lcls二次迭代結(jié)果圖;
圖8為lcls二次迭代篩選的組分、濃度表格;
圖9為lcls三次迭代結(jié)果圖;
圖10為lcls三次迭代篩選的組分、濃度表格;
圖11為upas值三次篩選計算圖表;
圖12為最終篩選結(jié)果擬合圖。
具體實施方式
結(jié)合附圖1~12對本發(fā)明做出進一步的說明:
一種紅外光譜的定性分析方法,包括如下步驟:(a)、制備待檢測樣本;(b)、調(diào)取待檢測樣本所屬領(lǐng)域的光譜數(shù)據(jù)庫;(c)、利用光譜儀采集待檢測樣本的紅外光譜圖;(d)、采用enet(基于彈性網(wǎng)的變量選擇技術(shù))方法從光譜數(shù)據(jù)庫中進行初次選擇樣本組分,建立樣本紅外光譜組分的吸光度矩陣xae,即n行mae的矩陣(x為組分標準吸收光譜,n為組分光譜數(shù)據(jù)點數(shù),m為組分光譜的個數(shù));(e)、根據(jù)步驟d中的樣本組分數(shù)據(jù)建立cls(線性最小二乘擬合)模型:cae=(xaetxae)-1xaet*y,隨后進入循環(huán)迭代計算剔除cae<0的組分,進行二次篩選,得出新的樣本組分數(shù)據(jù)xac,mac,cac(c為組分濃度,y為紅外吸光度譜);(f)、根據(jù)步驟e中二次篩選的樣本組分數(shù)據(jù)再次擬合計算得出yac值,xac*cac的每一列在yac方向上的投影長度與yac自身長度的比值記為pa1,xac*cac的長度與yac在各自組分方向上的投影長度比值記為pa2,比較pa1與pa2進行組分三次篩選;(g)整合步驟f中三次篩選的組分,即為樣本的紅外光譜的定性分析結(jié)果。采用enet方法從光譜數(shù)據(jù)庫中對待檢測樣本光譜圖進行初次篩選組分;隨后建立cls模型進行循環(huán)迭代計算剔除cae<0的組分,完成二次篩選組分;最后根據(jù)二次篩選光譜數(shù)據(jù)進行擬合yac,計算判斷pa1與pa2的大小,完成三次篩選組分,整個過程結(jié)合了enet方法的變量選擇能力,通過循環(huán)迭代cls計算,以及pa判斷,實現(xiàn)紅外光譜的快速、準確定性識別分析,同時不需要事先建模,還能解決多組分紅外光譜中,光譜組分的嚴重多重共線性問題。
所述的步驟e按如下步驟進行二次篩選:(e1)、進行變量初始化c(0)=(xaetxae)-1xaet*y,x(0)=xae;(e2)、進行循環(huán)迭代,迭代次數(shù)k=k+1;(e3)、剔除x(k-1)中與c(k-1)中小于0對應(yīng)位置的光譜列向量,得到新的光譜矩陣x(k),其中選入的列向量的個數(shù)為m(k);(e4)、計算c(k)=(x(k)tx(k))-1x(k)t*y;(e5)、判斷對于任意i,i∈{1...m(k)}時ci≥0是否成立,如果是則進入e6,否則進入e2;(e6)、計算結(jié)果,得出新的樣本組分數(shù)據(jù)xac,mac,cac。此過程可稱為lcls(循環(huán)線性最小二乘擬合過程),模型的建立根據(jù)比爾朗博定量模型y=xaec+ε,對于任意i,i∈{1...m(k)}時ci≥0,因此可以通過線性最小二乘擬合方法計算出新的模型參數(shù)cae=(xaetxae)-1xaet*y,里面會存在cae<0的情況,事實上cae<0為過擬合造成,因此需剔除相對應(yīng)的組分,進行循環(huán)迭代計算對組分進行二次篩選剔除不符合模型參數(shù)的組分,得出新的樣本組分數(shù)據(jù)xac,mac,cac。
所述的步驟f按如下步驟進行三次篩選:(f1)、根據(jù)公式cac=(xactxac)-1xact*yac,將步驟e中得出的xac,mac,cac代入,得出再擬合的yac;(f2)、xac*cac的每一列在yac方向上的投影長度與yac自身長度比值記為pa1,xac*cac的長度與yac在各自組分方向上的投影長度比值記為pa2;(f3)、根據(jù)pa1、pa2定義
以下為本發(fā)明方法的具體實施例:
(1)、采用傅里葉光譜儀變換紅外儀采集一條含有c4h10氣體組分吸收的光譜圖以及純氮氣的背景吸收光譜圖,通過計算得到一段波段的光譜,這里光譜波段為2700cm-1~3040cm-1波段,如圖2所示,為吸光度譜;
(2)、采用enet方法分析,從紅外光譜數(shù)據(jù)庫368種空氣組分中進行初次篩選,選擇出來15種組分,如圖3、4所示;
(3)、采用lcls循環(huán)線性最小二乘擬合進行迭代計算,3次迭代之后精揀限定為3種組分,如圖5~10所示;
(4)、采用upas分析過程,設(shè)參數(shù)λ=0.5,threadupas=0.5,根據(jù)上述算法公式計算每種組分的pa1、pa2以及upas值,剔除upas值小于threadupas的組分,得到定性識別結(jié)果c4h10,采用c4h10單獨擬合的結(jié)果如圖12所示。整個算法過程在win7平臺運行,采用matlabr2012b編碼實現(xiàn),耗時10.02266s計算得出結(jié)果??梢姡痉椒茉诩t外光譜的大數(shù)據(jù)庫中快速、準確識別待檢測樣本的紅外光譜中的組分。
附圖擬合圖中,為了區(qū)分原始光譜,虛線實則為連續(xù)線段代表擬合光譜。