本發(fā)明涉及煙草樣品分析測(cè)試技術(shù)領(lǐng)域,尤其是涉及一種基于支持向量機(jī)的煙葉兩糖比獲取方法。
背景技術(shù):
煙葉的內(nèi)在質(zhì)量是許多自然因素例如,氣候環(huán)境,種植地域等因素影響。煙葉中各種化學(xué)成分的含量復(fù)雜,煙草中的各類化學(xué)成分例如:糖類,酚類,氮雜環(huán)類,煙堿等會(huì)隨生長(zhǎng)的地域環(huán)境,氣候條件的不同而產(chǎn)生變化。而這些化學(xué)成分的含量不僅關(guān)系到煙草的品質(zhì),也會(huì)對(duì)煙草的口感產(chǎn)生影響。
糖類物質(zhì)是煙葉生長(zhǎng)中重要的大量營(yíng)養(yǎng)元素之一,在烤煙生產(chǎn)中具有舉足輕重的作用,是影響煙葉品質(zhì)的重要因素,在煙草質(zhì)量研究中具有重要意義。因此測(cè)定煙草中的兩糖比(總糖分含量/還原糖含量)有著較為重要的意義。傳統(tǒng)上測(cè)定煙草糖類組分含量的方法是用酒精浸提—銅還原—高錳酸鉀反滴定,該方法操作都十分繁瑣,費(fèi)時(shí)費(fèi)力,對(duì)人員的技術(shù)水平要求較高,精密度也不好。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的就是為了克服上述現(xiàn)有技術(shù)存在的缺陷而提供一種簡(jiǎn)便快捷、低成本、數(shù)據(jù)全面準(zhǔn)確、無(wú)污染、測(cè)試簡(jiǎn)單、快捷的基于支持向量機(jī)的煙葉兩糖比獲取方法。
本發(fā)明的目的可以通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn):
一種基于支持向量機(jī)的煙葉兩糖比獲取方法,包括以下步驟:
1)獲取多種已知煙葉的樣品,進(jìn)行預(yù)處理后通過(guò)電子鼻掃描,得到每種已知煙葉樣品的電子鼻數(shù)據(jù),并且獲取每種煙葉對(duì)應(yīng)的兩糖比數(shù)據(jù);
2)采用主成分分析法對(duì)電子鼻數(shù)據(jù)進(jìn)行降維,獲取已知煙葉樣品的多個(gè)主成分的類型和數(shù)據(jù);
3)根據(jù)已知煙葉樣品的多個(gè)主成分的類型和數(shù)據(jù),采用支持向量機(jī)回歸算法建立煙葉兩糖比的預(yù)測(cè)模型;
4)根據(jù)煙葉兩糖比的預(yù)測(cè)模型和待檢測(cè)煙葉品種的主成分?jǐn)?shù)據(jù),獲取待檢測(cè)煙葉品種的兩糖比。
所述的步驟1)中的預(yù)處理包括研磨、過(guò)篩和烘干。
所述的電子鼻為fox-4000氣味指紋分析儀。
所述的步驟2)中具體包括以下步驟:
21)根據(jù)電子鼻數(shù)據(jù),建立標(biāo)準(zhǔn)化因素矩陣x及其協(xié)方差陣c:
c=xtx;
22)獲取標(biāo)準(zhǔn)化因素矩陣x的mxm階特征向量矩陣v;
23)計(jì)算主成分矩陣y:
y=xv;
24)計(jì)算主成分矩陣y中每個(gè)成分的方差貢獻(xiàn)率,并選取累積貢獻(xiàn)率dac>85%時(shí)的前二十個(gè)成分類型作為主成分:
其中,dc為第i個(gè)成分的方差貢獻(xiàn)率,λi為其協(xié)方差陣c的第i個(gè)非零特征根,λj為第j個(gè)本征值,k為第k個(gè)主成分,q為第q個(gè)主成分,且k>q,q≤20。
所述的步驟3)中煙葉兩糖比的預(yù)測(cè)模型為:
f(x)=wtx+b
wt=[0.0005590688,0.002689181,0.001950974,0.007650455,0.005971182,
0.004008356,0.001990211,0.02224272,0.008110035,0.01578008,
0.03030127,0.0110831,0.02924935,0.05724236,0.0780258,
0.02033698,0.05535544,0.09482377,0.08040231,0.03373479,0.8143367]
b=0.8143367
其中,wt和b為線性方程常數(shù),f(x)為煙葉兩糖比,x為主成分?jǐn)?shù)據(jù)。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn):
一、簡(jiǎn)便快捷、低成本:本發(fā)明材料電子鼻檢測(cè)煙葉主成分,建立煙葉兩糖比 的線性函數(shù)預(yù)測(cè)模型來(lái)獲取未知待檢測(cè)煙葉的兩糖比,相比于原始的酒精浸提—銅還原—高錳酸鉀反滴定方法,操作簡(jiǎn)單,精細(xì)度高。
二、數(shù)據(jù)全面準(zhǔn)確:本發(fā)明通過(guò)主成分分析法對(duì)電子鼻數(shù)據(jù)進(jìn)行降維,從800多個(gè)數(shù)據(jù)中選取最具有代表性的20個(gè)作為主成分,提高了數(shù)據(jù)精度和維度,另外采用線性方程作為煙葉兩糖比的預(yù)測(cè)模型,模型簡(jiǎn)單,計(jì)算方便。
三、無(wú)污染:本發(fā)明在整個(gè)過(guò)程中不用到化學(xué)藥品,對(duì)環(huán)境沒(méi)有污染。
四、測(cè)試簡(jiǎn)單、快捷:利用電子鼻儀器掃描一個(gè)煙葉樣品需要1分鐘,把得到的電子鼻數(shù)據(jù)帶入建立的模型,1秒鐘就可以計(jì)算出結(jié)果,方便、快捷,僅需一人即可完成。
附圖說(shuō)明
圖1為煙葉電子鼻數(shù)據(jù)圖。
圖2為煙葉中兩糖比建模結(jié)果圖。
圖3為煙葉中兩糖比預(yù)測(cè)結(jié)果圖。
具體實(shí)施方式
下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)說(shuō)明。
實(shí)施例:
本發(fā)明基于煙葉電子鼻技術(shù)和支持向量機(jī)算法檢測(cè)煙葉中兩糖比的方法。包括如下步驟:
(1)收集煙葉樣品,進(jìn)行除梗、整理等工作后稱量50g,放置到烘箱中,在50℃下進(jìn)行烘干2小時(shí);
(2)、用磨粉機(jī)對(duì)烘干的煙葉進(jìn)行粉碎,然后將粉碎的煙葉粉末過(guò)60目篩,得到要進(jìn)行中紅外掃描的樣品;
(3)取5g煙葉粉末放置于hs100電子鼻配套自動(dòng)進(jìn)樣器,隨后用fox-4000氣味指紋分析儀對(duì)樣品進(jìn)行掃描。
(4)收集煙葉電子鼻數(shù)據(jù)后,用主成分分析對(duì)煙葉電子鼻數(shù)據(jù)進(jìn)行降維。主成分的目的是將數(shù)據(jù)降維,以排除眾多化學(xué)信息共存中相互重疊的信息,把原來(lái)多個(gè)變量組合為少數(shù)幾個(gè)互不相關(guān)的變量但同時(shí)又盡可能多地表征原變量的數(shù)據(jù)結(jié)構(gòu)特征而使丟失的信息盡可能地少,圖1為煙葉電子鼻數(shù)據(jù)圖。
求主成分的方法與步驟可概括如下:
計(jì)算標(biāo)準(zhǔn)化因素矩陣x及其協(xié)方差陣c:
c=(x)tx
(x)t為x的轉(zhuǎn)置矩陣。用jacobi變換求出c的m個(gè)按大小順序排列的非零特征根λi(i=1,…m)及其相應(yīng)的m個(gè)單位化特征向量,構(gòu)成如下m×m階特征向量集矩陣:
其中每一列代表一個(gè)特征向量,計(jì)算主成分矩陣y:
設(shè)第i個(gè)主成分的方差貢獻(xiàn)率為dc,則:
設(shè)前q個(gè)(q≤k)主成分的累積方差貢獻(xiàn)率為dac,則:
在實(shí)際應(yīng)用中可取前幾個(gè)對(duì)信息量貢獻(xiàn)較大(即dc較大)的主成分便可達(dá)到空間維數(shù)下降而使信息量丟失盡可能少的目的。若取兩個(gè)主成分構(gòu)成投影平面即可在平面上剖析數(shù)據(jù)結(jié)構(gòu)。
主成分分析的幾何意義是一個(gè)線性的旋軸變換,使第一主成分指向樣本散布最大的方向,第二主成分指向樣本散布次大的方向,余此類推
通過(guò)主成分分析降維,得到煙葉電子鼻數(shù)據(jù)降維后的數(shù)據(jù),如表1所示。
表1煙葉電子鼻降維后數(shù)據(jù)
(5)對(duì)降維的數(shù)據(jù)進(jìn)行變量選擇后,用支持向量機(jī)算法建立煙葉中兩糖比的檢測(cè)模型。數(shù)學(xué)家vladimirn.vapnik提出支持向量機(jī)(upportvectormachin)算法。設(shè)樣本集為:(y1,x1)…(yl,xl),x∈rn,y∈r,回歸函數(shù)用下列線性方程來(lái)表示,
f(x)=wtx+b
最佳回歸函數(shù)通過(guò)求以下函數(shù)的最小極值得出:
其中c是設(shè)定的懲罰因子值,ζi、ζi*為松弛變量的上限與下限。
vapnik提出運(yùn)用下列不敏感損耗函數(shù):
通過(guò)下面的優(yōu)化方程:
在下列約束條件下:
0≤αi≤ci=1,2,...,l
0≤αi*≤ci=1,2,...,l
求解:
由此可得拉格朗日方程的待定系數(shù)αi和
通過(guò)對(duì)上述支持向量機(jī)算法的編程實(shí)現(xiàn),建立煙葉中兩糖比的支持向量機(jī)預(yù)報(bào)模型為:
f(x)=wtx+b=(0.0005590688)x1+(0.002689181)x2+(0.001950974)x3+(0.007650455)x4+(0.005971182)x5+(0.004008356)x6+(0.001990211)x7+(0.02224272)x8+(0.008110035)x9+(0.01578008)x10+(0.03030127)x11+(0.0110831)x12+(0.02924935)x13+(0.05724236)x14+(0.0780258)x15+(0.02033698)x16+(0.05535544)x17+(0.09482377)x18+(0.08040231)x19+(0.03373479)x20+(0.8143367)
(6)利用建立的煙葉中兩糖比的支持向量機(jī)模型預(yù)報(bào)新的煙葉樣品中兩糖比。
實(shí)施例1:114個(gè)煙葉中兩糖比的支持向量機(jī)模型的建模結(jié)果
如圖2所示,利用支持向量機(jī)算法對(duì)預(yù)處理的煙草電子鼻數(shù)據(jù)進(jìn)行回歸建模,建立煙草中兩糖比的電子鼻支持向量機(jī)預(yù)測(cè)模型,兩糖比計(jì)算值和實(shí)驗(yàn)檢測(cè)值的相關(guān)系數(shù)0.904,平均相對(duì)誤差3.16%。
實(shí)施例2:對(duì)56個(gè)新煙草樣本兩糖比的預(yù)報(bào)結(jié)果
如圖3所示,利用建立的煙葉中兩糖比的支持向量機(jī)模型對(duì)新的56個(gè)煙草樣本進(jìn)行預(yù)報(bào),得到了很好的預(yù)報(bào)結(jié)果。兩糖比計(jì)算值和實(shí)驗(yàn)檢測(cè)值的相關(guān)系數(shù)為0.893,平均相對(duì)誤差4.19%。
近年來(lái),電子鼻技術(shù)以其簡(jiǎn)便、快速、低成本、無(wú)污染及樣品的非破壞性和多組分同時(shí)測(cè)定等優(yōu)點(diǎn)而受到重視。而且沒(méi)有看到應(yīng)用電子鼻技術(shù)測(cè)定煙草中的兩糖比這方面的報(bào)道。因此,本本發(fā)明涉及基于煙葉電子鼻技術(shù)和支持向量機(jī)算法檢測(cè)煙葉中兩糖比的方法。該發(fā)明方法的優(yōu)勢(shì)是不破壞樣本,不污染樣本,在用量上也比傳統(tǒng)方法用量少,而且速度上比統(tǒng)方法更快捷。