本發(fā)明屬于牛奶檢測技術(shù)領(lǐng)域,具體來說涉及一種基于二維近紅外相關(guān)光譜不變矩特征判別摻雜尿素牛奶的方法。
背景技術(shù):
牛奶中含有人體所需的蛋白質(zhì)、脂肪、乳糖、無機(jī)鹽和鈣等各種營養(yǎng)物質(zhì),隨著人們生活水平的提高,對乳制品的需求量也越來越大。不法商販在利益的驅(qū)使下向牛奶中摻雜大豆蛋白、水、乳清、三聚氰胺等物質(zhì),以降低生產(chǎn)成本,從而導(dǎo)致牛奶安全問題頻出,對消費(fèi)者的身體健康造成很大影響。
傳統(tǒng)的奶制品質(zhì)量檢測主要是采用一些物理化學(xué)方法,這些方法雖然結(jié)果比較準(zhǔn)確,但其過程一般比較復(fù)雜,對實(shí)驗(yàn)人員有一定的要求,且耗時(shí)費(fèi)力,有時(shí)還需要特定的試劑,對樣本具有破壞性,不適合于原料奶收購中質(zhì)量的及時(shí)控制。紅外光譜分析技術(shù)其過程簡單,對實(shí)驗(yàn)人員要求不高,成本低,且無需對樣品處理就可實(shí)現(xiàn)對樣品的無損檢測,適合對乳制品中摻雜物質(zhì)的檢測。目前二維相關(guān)光譜技術(shù)的應(yīng)用主要是科研人員針對研究對象和特定外擾,構(gòu)建等高線形式的同步譜和異步譜,結(jié)合相應(yīng)讀譜規(guī)則進(jìn)行定性分析。隨著科學(xué)技術(shù)的不斷進(jìn)步,二維相關(guān)光譜技術(shù)正向著與化學(xué)計(jì)量學(xué)模式識別、人工智能相結(jié)合,實(shí)現(xiàn)自動(dòng)識別的道路。
中國發(fā)明專利公開號CN104316491A公開了一種基于同步-異步二維近紅外相關(guān)譜檢測摻尿素牛奶的方法,該方法直接將同步-異步二維近紅外相關(guān)譜矩陣與多維化學(xué)計(jì)量學(xué)集合實(shí)現(xiàn)摻尿素牛奶的定性判別。雖然其分析結(jié)果較好,但同步-異步二維近紅外相關(guān)譜矩陣是三維矩陣,包含大量的數(shù)據(jù),需要多維化學(xué)計(jì)量學(xué)來進(jìn)行建模,模型復(fù)雜,計(jì)算時(shí)間長,效率低。本發(fā)明所提出摻尿素牛奶的判別方法是建立在提取不變矩特征的基礎(chǔ)上進(jìn)行的,其不僅有效提取了二維近紅外相關(guān)譜的特征信息,而且壓縮了數(shù)據(jù),提高了建模效率。
技術(shù)實(shí)現(xiàn)要素:
針對現(xiàn)有技術(shù)的不足,本發(fā)明的目的在于提供一種基于二維近紅外相關(guān)光譜不變矩特征判別摻雜尿素牛奶的方法,該方法利用支持向量機(jī)算法和樣品的特征信號建立分類器,通過提取二維近紅外相關(guān)光譜不變矩特征和對樣品類別的支持向量機(jī)算法模型研究,檢測牛奶是否摻雜。
本發(fā)明的目的是通過下述技術(shù)方案予以實(shí)現(xiàn)的。
一種基于二維近紅外相關(guān)光譜不變矩特征判別摻雜尿素牛奶的方法,包括以下步驟:
1)準(zhǔn)備純牛奶和摻雜牛奶作為訓(xùn)練樣品,通過掃描得到所述訓(xùn)練樣品的一維近紅外光譜,并通過Noda理論進(jìn)行相關(guān)譜計(jì)算,得到每一個(gè)訓(xùn)練樣品的同步—異步二維近紅外光譜矩陣(詳細(xì)計(jì)算過程見楊仁杰.基于二維相關(guān)譜摻雜牛奶檢測方法研究[D].天津大學(xué),2013.),并將所得到的同步—異步二維近紅外光譜矩陣轉(zhuǎn)化成二維近紅外相關(guān)光譜圖;
在所述步驟1)中,所述同步—異步二維近紅外光譜矩陣轉(zhuǎn)化成二維近紅外相關(guān)光譜圖的方法為:將所述同步—異步二維近紅外光譜矩陣的數(shù)據(jù)歸一化至0-255之間,通過matlab軟件的image命令得到所述二維近紅外相關(guān)光譜圖。
在上述技術(shù)方案中,采用離差標(biāo)準(zhǔn)化(min-max標(biāo)準(zhǔn)化)對所述同步—異步近紅外二維光譜矩陣的數(shù)據(jù)進(jìn)行歸一化,離差標(biāo)準(zhǔn)化的轉(zhuǎn)換公式為:
新數(shù)據(jù)=(原數(shù)據(jù)-原數(shù)據(jù)的極小值)*255/(原數(shù)據(jù)的極大值-原數(shù)據(jù)的極小值)(1)
其中,原數(shù)據(jù)為未歸一化的同步—異步二維近紅外光譜矩陣的數(shù)據(jù),新數(shù)據(jù)為歸一化后的同步—異步二維近紅外光譜矩陣的數(shù)據(jù)。
2)根據(jù)不變矩理論,提取步驟1)所得二維近紅外相關(guān)光譜圖的不變矩特征;
在所述步驟2)中,提取不變矩特征的方法為:
①根據(jù)公式(2)和(3)計(jì)算m×n的所述二維近紅外相關(guān)光譜圖的二維矩陣f(x,y)的p+q階中心矩upq:
其中,p和q均為整數(shù),p和q=0、1、2和3,f(x,y)為所獲得的同步—異步二維近紅外光譜矩陣按所述歸一化方法轉(zhuǎn)化后的二維矩陣,M00為所述二維近紅外相關(guān)光譜圖的二維矩陣f(x,y)的零階矩,M10和M01均為所述二維近紅外相關(guān)光譜圖的二維矩陣f(x,y)的一階矩;
②通過公式(4)計(jì)算所述二維近紅外相關(guān)光譜圖的二維矩陣f(x,y)的M00、M10和M01:
其中,m×n為所述二維近紅外相關(guān)光譜圖的分辨率。
③通過公式(5)對步驟①中所得的p+q階中心矩upq進(jìn)行歸一化,得到ηpq,
ηpq=upq/u00γ (5)
其中,
④將步驟③所得的ηpq依次代入公式(6),得到不變矩特征φ1、φ2、φ3、φ4、φ5、φ6和φ7。
3)利用主成分分析法對步驟2)所得不變矩特征進(jìn)行優(yōu)選,得到優(yōu)選不變矩特征;
在所述步驟3)中,對步驟2)所得不變矩特征進(jìn)行優(yōu)選的方法為:
I按照公式(7)將多個(gè)訓(xùn)練樣品的不變矩特征組成特征數(shù)據(jù)矩陣X′=(xij')s×l:
其中,xij'為第i個(gè)訓(xùn)練樣品的第j個(gè)不變矩特征參數(shù),l為不變矩特征個(gè)數(shù),s為訓(xùn)練樣品的個(gè)數(shù);標(biāo)準(zhǔn)化處理所述特征數(shù)據(jù)矩陣X′,得到X=(xij)s×l,其中,
其中,
II按照公式(11)計(jì)算X的相關(guān)系數(shù),得到相關(guān)系數(shù)矩陣R=(rij)s×l:
III計(jì)算所述相關(guān)系數(shù)矩陣R的特征值(λ1,λ2,…,λl);
IV計(jì)算貢獻(xiàn)率:將步驟III所得特征值依次代入公式(12),得到l個(gè)貢獻(xiàn)率;
V確定主成分:將l個(gè)步驟IV所得貢獻(xiàn)率從大到小排列并進(jìn)行累加,選取貢獻(xiàn)率累加值大于等于85%的前t個(gè)主成分,確定所述t個(gè)主成分的不變矩特征為優(yōu)選不變矩特征。
4)建立支持向量機(jī)模型,采用支持向量機(jī)法對所述訓(xùn)練樣品的二維近紅外相關(guān)光譜圖進(jìn)行分類識別,輸入為步驟3)所得的優(yōu)選不變矩特征,輸出為訓(xùn)練樣品的種類:純牛奶或摻雜牛奶,其中,調(diào)用支持向量機(jī)模型的訓(xùn)練函數(shù)Svmtrain對所述訓(xùn)練樣品進(jìn)行訓(xùn)練;
5)按照上述方法計(jì)算未知種類牛奶的二維近紅外相關(guān)光譜圖的優(yōu)選不變矩特,將未知種類牛奶的二維近紅外相關(guān)光譜圖的優(yōu)選不變矩特征輸入步驟4)中訓(xùn)練后的支持向量機(jī)模型中,即可判別所述未知種類牛奶的種類。
相比于現(xiàn)有技術(shù),本發(fā)明的方法采用二維近紅外相關(guān)光譜圖的不變矩特征表征純牛奶與摻雜牛奶所包含的信息,將圖像處理技術(shù)與牛奶摻雜判別結(jié)合起來,有別于以往的構(gòu)建等高線形式的同步譜和異步譜,結(jié)合相應(yīng)讀譜規(guī)則進(jìn)行定性分析。該方法可實(shí)現(xiàn)大量數(shù)據(jù)的同時(shí)處理,判別效率高。除此之外,本發(fā)明將二維近紅外相關(guān)光譜圖不變矩特征與支持向量機(jī)相結(jié)合,通過提取二維近紅外相關(guān)光譜圖的不變矩特征將二維近紅外光譜技術(shù)與模式識別相結(jié)合,實(shí)現(xiàn)了摻雜牛奶與純牛奶的定性判別。該方法克服了譜圖用人眼直接比對存在主觀誤判和無法大量譜圖同時(shí)比對的缺點(diǎn),判別效率和正確率高。
附圖說明
圖1為本發(fā)明方法的流程圖;
圖2為支持向量機(jī)的原理圖。
具體實(shí)施方式
下面結(jié)合附圖和具體實(shí)施例進(jìn)一步說明本發(fā)明的技術(shù)方案。
如圖1~2所示,一種基于二維相關(guān)光譜不變矩特征判別摻雜尿素牛奶的方法,包括以下步驟:
1)準(zhǔn)備純牛奶和摻雜牛奶作為訓(xùn)練樣品,通過掃描得到所述訓(xùn)練樣品的一維近紅外光譜,并通過Noda理論進(jìn)行相關(guān)譜計(jì)算,得到每一個(gè)訓(xùn)練樣品的同步—異步二維近紅外光譜矩陣,將所述同步—異步二維近紅外光譜矩陣轉(zhuǎn)化成二維近紅外相關(guān)光譜圖,建立樣品圖庫。
其中,獲得同步—異步二維近紅外光譜矩陣的方法記載于公開號為:CN104316491A的發(fā)明專利中(也可參考文獻(xiàn)楊仁杰.基于二維相關(guān)譜摻雜牛奶檢測方法研究[D].天津大學(xué),2013)。同步—異步近紅外二維光譜矩陣轉(zhuǎn)化成二維近紅外相關(guān)光譜圖的方法為:將所述同步—異步二維近紅外光譜矩陣的數(shù)據(jù)歸一化至0-255之間,歸一化處理方法有很多種,在本發(fā)明的具體實(shí)施方式中采用離差標(biāo)準(zhǔn)化(min-max標(biāo)準(zhǔn)化)對同步—異步二維近紅外光譜矩陣的數(shù)據(jù)進(jìn)行歸一化,使結(jié)果值映射到[0-255]之間。離差標(biāo)準(zhǔn)化的轉(zhuǎn)換公式為:
新數(shù)據(jù)=(原數(shù)據(jù)-原數(shù)據(jù)的極小值)*255/(原數(shù)據(jù)的極大值-原數(shù)據(jù)的極小值)(1)
其中,原數(shù)據(jù)為未歸一化的同步—異步二維近紅外光譜矩陣的數(shù)據(jù),新數(shù)據(jù)為歸一化后的同步—異步二維近紅外光譜矩陣的數(shù)據(jù)。
對歸一化的同步—異步二維近紅外光譜矩陣的數(shù)據(jù)使用matlab軟件的image()命令即可得到二維近紅外相關(guān)光譜圖。
2)根據(jù)不變矩理論,提取步驟1)所得二維近紅外相關(guān)光譜圖的不變矩特征;
在所述步驟2)中,提取不變矩特征的方法為:
①根據(jù)公式(2)和(3)計(jì)算m×n的所述二維近紅外相關(guān)光譜圖的二維矩陣f(x,y)的p+q階中心矩upq:
其中,p和q均為整數(shù),p和q=0、1、2和3,f(x,y)為同步—異步二維近紅外光譜矩陣按前述歸一化方法轉(zhuǎn)化后的二維矩陣,M00為所述二維相關(guān)光譜圖的二維矩陣
f(x,y)的零階矩,M10和M01均為所述二維近紅外相關(guān)光譜圖的二維矩陣f(x,y)的一階矩;
②通過公式(4)計(jì)算二維近紅外相關(guān)光譜圖的二維矩陣f(x,y)的M00、M10和M01:
其中,m×n為所述二維近紅外相關(guān)光譜圖的分辨率。
③通過公式(5)對步驟①中所得的p+q階中心矩upq進(jìn)行歸一化,得到ηpq,
ηpq=upq/u00γ (5)
其中,
④將步驟③所得的ηpq依次代入公式(6),得到不變矩特征φ1、φ2、φ3、φ4、φ5、φ6和φ7。
3)利用主成分分析法對步驟2)所得不變矩特征進(jìn)行優(yōu)選,得到優(yōu)選不變矩特征;
其中,對步驟2)所得不變矩特征進(jìn)行優(yōu)選的方法為:
I按照公式(7)將多個(gè)訓(xùn)練樣品的不變矩特征組成特征數(shù)據(jù)矩陣X′=(xij')s×l:
其中,xij'為第i個(gè)訓(xùn)練樣品的第j個(gè)不變矩特征參數(shù),l為不變矩特征個(gè)數(shù),s為訓(xùn)練樣品的個(gè)數(shù);原始的不變矩特征數(shù)據(jù)量綱不同,會(huì)對結(jié)果產(chǎn)生一定的影響,為了消除不同不變矩特征的量綱影響,必須標(biāo)準(zhǔn)化處理所述特征數(shù)據(jù)矩陣X′,得到X=(xij)s×l,其中,
其中,
II按照公式(11)計(jì)算X的相關(guān)系數(shù),得到相關(guān)系數(shù)矩陣R=(rij)s×l:
III計(jì)算所述相關(guān)系數(shù)矩陣R的特征值(λ1,λ2,…,λl);
IV計(jì)算貢獻(xiàn)率:貢獻(xiàn)率是指某個(gè)主成分的方差占全部方差的比重,實(shí)際也就是某個(gè)特征值占全部特征值合計(jì)的比重。將步驟III所得特征值依次代入公式(12),得到l個(gè)貢獻(xiàn)率;
V確定主成分:將l個(gè)步驟IV所得貢獻(xiàn)率從大到小排列并進(jìn)行累加,選取貢獻(xiàn)率累加值大于等于85%的前t個(gè)主成分,確定所述t個(gè)主成分的不變矩特征為優(yōu)選不變矩特征;
4)建立支持向量機(jī)(SVM)模型,支持向量機(jī)原理如圖2所示,輸入為X1,X2……,Xn,輸出為Y,內(nèi)積核函數(shù)為K1(X),K2(X),……,Kn(X)。采用支持向量機(jī)法對所述訓(xùn)練樣品的二維近紅外相關(guān)光譜圖進(jìn)行分類識別,輸入為步驟3)所得的優(yōu)選不變矩特征,輸出為訓(xùn)練樣品的種類:純牛奶或摻雜牛奶,其中,調(diào)用支持向量機(jī)模型的訓(xùn)練函數(shù)Svmtrain對所述訓(xùn)練樣品進(jìn)行訓(xùn)練;
5)將未知種類牛奶的二維近紅外相關(guān)光譜圖的優(yōu)選不變矩特征輸入步驟4)中訓(xùn)練后的支持向量機(jī)模型中,即可判別所述未知種類牛奶的種類。
下面以純牛奶和摻雜尿素牛奶為例,對本發(fā)明的技術(shù)方法進(jìn)行說明。
1)準(zhǔn)備27個(gè)純牛奶和27個(gè)摻雜尿素牛奶作為訓(xùn)練樣品,通過掃描得到54個(gè)訓(xùn)練樣品的同步-異步二維近紅外光譜矩陣,將同步-異步二維近紅外光譜矩陣轉(zhuǎn)化成二維近紅外相關(guān)光譜圖;
2)根據(jù)不變矩理論,提取步驟1)所得二維近紅外相關(guān)光譜圖的不變矩特征,表1和表2分別為54個(gè)訓(xùn)練樣品中5個(gè)純牛奶和5個(gè)摻雜尿素牛奶的不變矩特征數(shù)據(jù);
表1純牛奶的同步-異步二維近紅外光譜圖的不變矩特征數(shù)據(jù)
表2摻雜尿素牛奶的同步-異步二維近紅外光譜圖的不變矩特征數(shù)據(jù)
3)利用主成分分析法對步驟2)所得不變矩特征進(jìn)行優(yōu)選,得到4個(gè)優(yōu)選不變矩特征,如表3所示。
表3主成分分析結(jié)果
由表3可知,經(jīng)過主成分分析,純牛奶與摻雜尿素的同步-異步二維近紅外光譜圖的前4個(gè)主成分累計(jì)貢獻(xiàn)率為92.94%,達(dá)到85%以上,能夠很好提取原特征統(tǒng)計(jì)量的分布特性,即,不變矩φ1、不變矩φ3、不變矩φ2和不變矩φ6為優(yōu)選不變矩特征。
4)建立支持向量機(jī)模型,采用支持向量機(jī)法對所述訓(xùn)練樣品的二維近紅外相關(guān)光譜圖進(jìn)行分類識別,輸入為步驟3)所得的54個(gè)訓(xùn)練樣品的優(yōu)選不變矩特征,輸出為訓(xùn)練樣品的種類:純牛奶或摻雜牛奶,其中,調(diào)用支持向量機(jī)模型的訓(xùn)練函數(shù)Svmtrain對所述訓(xùn)練樣品進(jìn)行訓(xùn)練。利用支持向量機(jī)模型對校正集進(jìn)行外部預(yù)測,其結(jié)果顯示,54個(gè)訓(xùn)練樣品中有3個(gè)判別錯(cuò)誤,其中有一個(gè)純牛奶被誤判為摻雜尿素的牛奶,兩個(gè)摻雜尿素牛奶別誤判為純牛奶。所建支持向量機(jī)模型對校正集的判別準(zhǔn)確率為94.4444%。
5)將13個(gè)純牛奶和13個(gè)摻雜尿素牛奶作為未知種類牛奶,將26個(gè)未知種類牛奶的二維近紅外相關(guān)光譜圖的優(yōu)選不變矩特征輸入步驟4)中訓(xùn)練后的支持向量機(jī)模型中,即可判別所述未知種類牛奶的種類。利用模型對校正集進(jìn)行外部預(yù)測,其結(jié)果顯示,26個(gè)樣本數(shù)據(jù)中有4個(gè)判別錯(cuò)誤,其中純牛奶判別結(jié)果全部正確,4個(gè)摻雜尿素的牛奶誤判為純牛奶。所建模型對校正集的判別準(zhǔn)確率為84.6154%。
以上對本發(fā)明做了示例性的描述,應(yīng)該說明的是,在不脫離本發(fā)明的核心的情況下,任何簡單的變形、修改或者其他本領(lǐng)域技術(shù)人員能夠不花費(fèi)創(chuàng)造性勞動(dòng)的等同替換均落入本發(fā)明的保護(hù)范圍。