本發(fā)明涉及食品檢測(cè)技術(shù)領(lǐng)域,具體為一種用于桃的糖度和酸度實(shí)時(shí)無損檢測(cè)方法。
背景技術(shù):
我國(guó)是世界性水果生產(chǎn)大國(guó),水果產(chǎn)業(yè)在國(guó)民經(jīng)濟(jì)中占有重要地位,水果出口是我國(guó)外貿(mào)的重要組成部分。桃原產(chǎn)我國(guó),屬薔薇科落葉小喬木,迄今已有4000多年的栽培歷史,中國(guó)的桃產(chǎn)量和桃消費(fèi)量都居世界前列。然而由于我國(guó)農(nóng)產(chǎn)品商品化低,在國(guó)際競(jìng)爭(zhēng)中常常處于劣勢(shì)。因此,農(nóng)產(chǎn)品的檢測(cè)和分級(jí)技術(shù)成為了我國(guó)科研領(lǐng)域的重要研究方向。
傳統(tǒng)的水果內(nèi)部品質(zhì)檢測(cè)方法主要是通過化學(xué)分析的方式測(cè)定水果的含糖量、酸度以及糖酸比來判斷水果的品質(zhì)。比如,桃中的糖度,可以參照食品衛(wèi)生監(jiān)測(cè)方法理化總則(gb/t5009.1-2003),通過阿貝折射儀測(cè)定。桃的酸度則可參照食品衛(wèi)生監(jiān)測(cè)方法理化總則(gb/t5009.1-2003)及食品中酸度的測(cè)定方法(gb/t12456-90),通過ph計(jì)測(cè)定。然而,這些方法都需要對(duì)桃進(jìn)行破壞,屬于有損檢測(cè);而且,它們制樣繁瑣、檢測(cè)時(shí)間長(zhǎng),無法滿足水果快速分級(jí)分選的實(shí)際要求。
近紅外光譜能夠快速反映被測(cè)物的結(jié)構(gòu)和組成信息,適合于無損檢測(cè)水果及其他農(nóng)產(chǎn)品內(nèi)部組份。近紅外光譜檢測(cè)作為一種無預(yù)處理,檢測(cè)速度快,檢測(cè)范圍廣,準(zhǔn)確率高的無損檢測(cè)技術(shù)備受人們關(guān)注。近年來,近紅外檢測(cè)技術(shù)正在迅猛發(fā)展,在保留原有優(yōu)勢(shì)的基礎(chǔ)上日漸趨于小型化,便捷化。近紅外光譜法已初步用于檢測(cè)少數(shù)品種桃的糖度,但是所研究的對(duì)象樣本來源有限。對(duì)于市場(chǎng)上不同產(chǎn)地的桃,其糖度和酸度的預(yù)測(cè)仍然需要建立更有效的方法。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種用于桃的糖度和酸度實(shí)時(shí)無損檢測(cè)方法,以解決上述背景技術(shù)中提出的問題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種用于桃的糖度和酸度實(shí)時(shí)無損檢測(cè)方法,其具體步驟如下:
第一步,通過近紅外光譜儀對(duì)桃樣品進(jìn)行光譜采集,得到原始光譜,所述的近紅外光譜儀到波長(zhǎng)范圍為500-1900nm;
第二步,對(duì)桃樣品進(jìn)行糖度和酸度測(cè)量,作為分析預(yù)測(cè)模型的觀測(cè)值;
第三步,采用數(shù)據(jù)滑動(dòng)平均濾波法對(duì)原始光譜進(jìn)行平滑和濾波;
第四步,構(gòu)建桃糖度的預(yù)測(cè)模型,首先通過混合主成分分析方法、等差映射、遺傳算法三種方法對(duì)收集到的桃光譜數(shù)據(jù)進(jìn)行降維處理;然后將降維后的數(shù)據(jù)進(jìn)行bp神經(jīng)網(wǎng)絡(luò)分類,包括利用訓(xùn)練集數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)和測(cè)試集測(cè)試網(wǎng)絡(luò)預(yù)測(cè)能力,多次驗(yàn)證,最終確定桃糖度最佳的預(yù)測(cè)模型;
第五步,構(gòu)建桃酸度的預(yù)測(cè)模型,通過主成分分析和等距映射方法對(duì)收集到的桃光譜數(shù)據(jù)進(jìn)行降維處理,再對(duì)降維后的數(shù)據(jù)進(jìn)行bp神經(jīng)網(wǎng)絡(luò)分類,多次驗(yàn)證,最終確定桃酸度最佳的預(yù)測(cè)模型;
第六步,采集待測(cè)桃的光譜信息并按第三步進(jìn)行預(yù)處理,將預(yù)處理后的光譜數(shù)據(jù)代入到第四步和第五步建立的預(yù)測(cè)模型中,得到待測(cè)樣品的糖度和酸度的預(yù)測(cè)值。
作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述的第一步中的樣品數(shù)量不少于50個(gè),優(yōu)選50-300個(gè)。
作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述的第一步中近紅外光譜儀采用漫反射的方式,隨機(jī)選取每個(gè)桃的環(huán)赤道面上5-20個(gè)點(diǎn)進(jìn)行光譜掃描,優(yōu)選15個(gè)點(diǎn)。
作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述的第二步中桃糖度的測(cè)量方法為:首先用蒸餾水將糖度儀的棱鏡清洗干凈并擦凈水分,校正調(diào)零,再將已經(jīng)測(cè)過光譜的桃用干凈的刀切開并擠壓出汁水于折光棱鏡的鏡面上,連續(xù)測(cè)量三次,記錄并求平均值。
作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述的第二步中桃酸度的測(cè)量方法為:用蒸餾水清洗手持式ph計(jì)前端,直至顯示ph為中性;甩干ph計(jì)上的水分,將其插入桃環(huán)赤道面上,測(cè)量6個(gè)位置的ph值,記錄數(shù)據(jù)并求其平均值。
作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述的第四步中的混合主成分分析方法、等差映射、遺傳算法三種方法,將原有的2047維數(shù)據(jù)規(guī)約到最低維數(shù)。
作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述的第四步中的bp神經(jīng)網(wǎng)絡(luò)分類算法包括bp神經(jīng)網(wǎng)絡(luò)構(gòu)建、bp神經(jīng)網(wǎng)絡(luò)訓(xùn)練和bp神經(jīng)網(wǎng)絡(luò)分類三步。
作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述的第四步中的遺傳算法從任一初始群體出發(fā),通過隨機(jī)選擇、交叉和變異操作,產(chǎn)生一群更加適應(yīng)環(huán)境的個(gè)體,最后收斂到一群最適應(yīng)環(huán)境的個(gè)體。
作為本發(fā)明的一種優(yōu)選技術(shù)方案,所述的第六步中將誤差百分比在10%以內(nèi)認(rèn)定為預(yù)測(cè)準(zhǔn)確。
有益效果:與傳統(tǒng)技術(shù)相比,本發(fā)明通過近紅外光譜分析可對(duì)桃的糖度和酸度進(jìn)行實(shí)時(shí),快速,準(zhǔn)確,無損的檢測(cè)。傳統(tǒng)方法需要對(duì)桃進(jìn)行破壞,是有損檢測(cè),而且對(duì)糖度和酸度需要分別檢測(cè),對(duì)桃品種更沒有合適的方法進(jìn)行檢測(cè)。本發(fā)明具有無破壞性、速度快、成本低、樣品無需預(yù)處理、無需化學(xué)試劑和無污染等優(yōu)點(diǎn),并且可以同時(shí)對(duì)桃的糖度和酸度進(jìn)行預(yù)測(cè)。
附圖說明
圖1為遺傳算法基本計(jì)算流程;
圖2為bp神經(jīng)網(wǎng)絡(luò)算法流程;
圖3為pca-isomap-ga-bp法預(yù)測(cè)桃的糖度和酸度:(a)測(cè)試集的糖度實(shí)際值(三角形)和預(yù)測(cè)值(方形)。(b)糖度預(yù)測(cè)的誤差百分比。(c)測(cè)試集的酸度實(shí)際值(三角形)和預(yù)測(cè)值(方形)。(d)酸度預(yù)測(cè)的誤差百分比。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
實(shí)施案例1
選取表面無損傷且無病蟲害的兩種桃子:毛桃、油桃各30個(gè)作為材料,并對(duì)每個(gè)桃子進(jìn)行編號(hào),共計(jì)60個(gè)。
近紅外光譜數(shù)據(jù)的采集使用漫反射的方式,選取每個(gè)桃子環(huán)赤道面附近避開側(cè)面棱角且互為90°的面上選取20個(gè)點(diǎn)進(jìn)行光譜掃描,采集光譜譜區(qū)為340~1021nm,共2047個(gè)點(diǎn)。將每個(gè)樣本的采樣點(diǎn)采集到的光譜數(shù)據(jù)用于之后的數(shù)據(jù)分析。
利用手持?jǐn)?shù)字式折光糖度儀檢測(cè)每個(gè)桃樣品的糖度。首先用蒸餾水將糖度儀的棱鏡清洗干凈并擦凈水分,校正調(diào)零,再將已經(jīng)測(cè)過光譜的桃用干凈的刀切開并擠壓出汁水于折光棱鏡的鏡面上,連續(xù)測(cè)量?jī)纱?,記錄并求平均值?/p>
利用錐形筆式ph計(jì)檢測(cè)每個(gè)桃樣品的酸度。用蒸餾水清洗手持式ph計(jì)前端,直至顯示ph為中性。甩干ph計(jì)上的水分,將其插入桃環(huán)赤道面上,取6個(gè)點(diǎn)處的ph值,記錄數(shù)據(jù)并求其平均值。
由于桃的光譜數(shù)據(jù)維度較大,預(yù)測(cè)變量之間相互關(guān)聯(lián),多重共線性會(huì)導(dǎo)致解空間的不穩(wěn)定,從而可能導(dǎo)致結(jié)果的不連貫。所以我們首先要對(duì)收集到的桃的光譜數(shù)據(jù)進(jìn)行降維處理。我們選擇pca(主成分分析)方法進(jìn)行降維。它不僅僅是對(duì)高維數(shù)據(jù)進(jìn)行降維,更重要的是通過降維去除了噪聲,發(fā)現(xiàn)了數(shù)據(jù)中的模式。pca法通過創(chuàng)建一個(gè)替換的、較小的變量集來“組合”屬性的基本要素,讓原數(shù)據(jù)可以投影到該較小的集合中。根據(jù)主成分分析結(jié)果,將原有的2047維數(shù)據(jù)規(guī)約到最低維數(shù)。
pca的基本過程如下:
(a)對(duì)輸入數(shù)據(jù)規(guī)范化,使得每個(gè)屬性都落入相同的區(qū)間。該步驟有助于確保具有較大定義域的屬性不會(huì)支配具有較小定義域的屬性。
(b)pca計(jì)算k個(gè)標(biāo)準(zhǔn)正交向量,作為規(guī)范化輸入數(shù)據(jù)的基。這些是單位向量,每一個(gè)都垂直于其他向量。這些向量稱為主成分。輸入數(shù)據(jù)是主成分的線性組合。
(c)對(duì)主成分按“重要性”或強(qiáng)度降序排列。主成分本質(zhì)上充當(dāng)數(shù)據(jù)的新坐標(biāo)系,提供關(guān)于方差的重要信息。
(d)因?yàn)橹鞒煞质歉鶕?jù)“重要性”降序排列,因此可以通過去掉較弱的成分(即方差較小的那些)來規(guī)約數(shù)據(jù)。使用最強(qiáng)的主成分,能夠重構(gòu)元數(shù)據(jù)很好的近似。
將經(jīng)過主成分分析后規(guī)約到十維的數(shù)據(jù)用等距映射(isomap)算法進(jìn)行優(yōu)化,以達(dá)到進(jìn)一步提高模型預(yù)測(cè)準(zhǔn)確率的目的。
等距映射(isomap)算法是基于領(lǐng)域圖與經(jīng)典的mds算法的具有全局特性的非線性流型學(xué)習(xí)算法。本算法是一種非監(jiān)督算法,因?yàn)槭褂昧薽ultidimensionalscaling算法進(jìn)行降維,isomap算法能夠很好地保留數(shù)據(jù)的全局特性,降維之后得到的數(shù)據(jù)的整體結(jié)構(gòu)也較為逼近于原數(shù)據(jù)。iosmap算法的主要思想是利用局部領(lǐng)域距離對(duì)數(shù)據(jù)點(diǎn)之間的全局流形測(cè)地線距離進(jìn)行估計(jì),借助建立原數(shù)據(jù)間測(cè)地距離與降維數(shù)據(jù)間空間距離的對(duì)等關(guān)系實(shí)現(xiàn)數(shù)據(jù)降維。其算法流程描述如下:
構(gòu)建近鄰圖g。計(jì)算點(diǎn)和點(diǎn)之間的歐式距離d(),如果點(diǎn)落在以點(diǎn)為圓心,為半徑的圓,或者點(diǎn)是點(diǎn)的k個(gè)近鄰點(diǎn)之一,則將和用邊連接,并用歐式距離作為這條邊的權(quán)重。否則不連接,權(quán)重記為無窮大。
根據(jù)弗洛伊德(floyd)算法計(jì)算最短路徑。對(duì)于和,如果它們之間存在邊,初始化其最短路徑=()。對(duì)于m=1,2,…,n,計(jì)算(1)
由(1)式可以求得最短路徑距離矩陣={}。
求解降維嵌入。利用經(jīng)典的mds算法,建立最短路徑距離矩陣與降維數(shù)據(jù)之間的距離矩陣={=}的對(duì)等關(guān)系,通過將代價(jià)函數(shù)最小化,從而獲得全局低維坐標(biāo):
(2)
式中:矩陣操作算子=-hsh./2,平方距離矩陣s={}={},中心化矩陣h={}={},其中為kroneckerdelta算子。
我們假設(shè)的最大d個(gè)特征值,,...,對(duì)應(yīng)的特征向量為,…,當(dāng)y=diag{,,...,}時(shí),式(2)達(dá)到全局最小。
將等距映射算法優(yōu)化挑選出符合條件的變量作為輸入,進(jìn)行bp神經(jīng)網(wǎng)絡(luò)分類。bp神經(jīng)網(wǎng)絡(luò)是一種多層前饋神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)的主要特點(diǎn)是信號(hào)前向傳遞,誤差反向傳播。在前向傳遞中,輸入信號(hào)從輸入層經(jīng)隱含層逐層處理,直至輸出層。每一層的神經(jīng)元狀態(tài)只影響下一層神經(jīng)元狀態(tài)。如果輸出層得不到期望輸出,則轉(zhuǎn)入反向傳播,根據(jù)預(yù)測(cè)誤差調(diào)整網(wǎng)絡(luò)權(quán)值和閾值,從而使bp神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)輸出不斷逼近期望輸出。bp神經(jīng)網(wǎng)絡(luò)可以看成是一個(gè)非線性函數(shù),網(wǎng)絡(luò)輸入值和預(yù)測(cè)值分別為該函數(shù)的自變量和因變量。當(dāng)輸入節(jié)點(diǎn)數(shù)為n、輸出節(jié)點(diǎn)數(shù)為m時(shí),bp神經(jīng)網(wǎng)絡(luò)就表達(dá)了從n個(gè)自變量到m個(gè)因變量的函數(shù)映射關(guān)系。bp神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)前首先要訓(xùn)練網(wǎng)絡(luò),通過訓(xùn)練使網(wǎng)絡(luò)具有聯(lián)想記憶和預(yù)測(cè)能力。基于bp網(wǎng)絡(luò)的桃分類算法包括bp神經(jīng)網(wǎng)絡(luò)構(gòu)建、bp神經(jīng)網(wǎng)絡(luò)訓(xùn)練和bp神經(jīng)網(wǎng)絡(luò)分類三步,算法流程如圖2所示。
構(gòu)建預(yù)測(cè)桃糖度和酸度的pca-isomap-ga-bp模型。我們首先要對(duì)收集到的桃的平均光譜數(shù)據(jù)進(jìn)行降維處理。將高維數(shù)據(jù)投影到較低維空間,即用幾個(gè)主要變量體現(xiàn)事物的整體屬性。通過混合三種方法pca,isomap和ga三種方法,對(duì)原數(shù)據(jù)集進(jìn)行處理優(yōu)化,在糖度預(yù)測(cè)中,將數(shù)據(jù)維度降為8維;在酸度預(yù)測(cè)中,將數(shù)據(jù)維度降至6維。將處理后數(shù)據(jù)通過bp網(wǎng)絡(luò)模型分別建立糖度、酸度預(yù)測(cè)模型。從每個(gè)品種數(shù)據(jù)中選擇5組數(shù)據(jù)作為測(cè)試集測(cè)試網(wǎng)絡(luò)分類能力,其他數(shù)據(jù)作為訓(xùn)練集訓(xùn)練網(wǎng)絡(luò)。
如圖3所示,我們分析了pca-isomap-ga-bp模型對(duì)桃糖度和酸度的預(yù)測(cè)效果。圖3中(a)測(cè)試集三角形為糖度實(shí)際值,方形為糖度預(yù)測(cè)值。(b)為糖度預(yù)測(cè)的誤差百分比。(c)測(cè)試集的酸度實(shí)際值(三角形)和預(yù)測(cè)值(方形)。(d)酸度預(yù)測(cè)的誤差百分比。糖度預(yù)測(cè)模型中,預(yù)測(cè)值基本與實(shí)際值相同,誤差百分比較小,平均絕對(duì)百分比誤差為7.55%。酸度預(yù)測(cè)中,絕大部分預(yù)測(cè)值均勻排布于實(shí)際值周圍,平均絕對(duì)百分比誤差為4.79%。此混合算法將原有2047維數(shù)據(jù)分別規(guī)約至8到6維,為所有模型中維數(shù)最少的,充分體現(xiàn)混合模型在較小維數(shù)中仍保有原數(shù)據(jù)結(jié)構(gòu)且預(yù)測(cè)效果佳的特點(diǎn)。我們建立的pca-isomap-ga-bp模型可以很好的預(yù)測(cè)桃的糖度和酸度。
盡管已經(jīng)示出和描述了本發(fā)明的實(shí)施例,對(duì)于本領(lǐng)域的普通技術(shù)人員而言,可以理解在不脫離本發(fā)明的原理和精神的情況下可以對(duì)這些實(shí)施例進(jìn)行多種變化、修改、替換和變型,本發(fā)明的范圍由所附權(quán)利要求及其等同物限定。