一種假高粱及其近似物種的快速檢測方法
【專利摘要】本發(fā)明公開了一種基于近紅外光譜的假高粱及其近似物種的快速檢測方法,包括以下步驟:采用近紅外光譜獲取高粱、假高粱、蘇丹草三種高粱屬種子在325-1075nm之間的光譜反射特征曲線,采用偏最小二乘法進行模式特征分析,經過交互驗證法判別,確定最佳主成分數(shù)為9。完成特征提取后,將9種主成分作為神經網絡的輸入變量,建立了三層BP神經網絡,計算各種子所屬類別。本發(fā)明通過紅外光譜分析結合化學計量學的方法快速準確判別三種高粱屬種子所屬類別,大大縮短了檢測的時間,提高了檢測效率,降低了檢測成本。
【專利說明】一種假高粱及其近似物種的快速檢測方法
【技術領域】
[0001]本發(fā)明涉及出入境檢驗檢疫領域,特別涉及一種假高粱及其近似物種的快速檢測方法。
【背景技術】
[0002]高粱屬(Sorghum)有多種植物作為糧食、飼料和工業(yè)用原料在世界各個干旱地區(qū)被廣泛種植。但是高粱屬中也有相當一部分屬于入侵植物或具有入侵性的種類,其中最具代表性的有假高粱(S.halepenSe(L.Pers))。假高梁是世界十大惡性雜草之一,它能以根狀莖和種子共同繁殖,破壞我國植被多樣性能力強,其危害大、繁殖快、難防治,是我國進境植物檢疫性有害生物。假高粱原僅在福建、廣東、臺灣地區(qū)有引種分布,但隨著糧食進口數(shù)量的不斷增大,在海南、廣西等10多個省及直轄市報道曾有假高粱的分布。高粱(Sorghumbicolor)、黑高梁(S.almum)及蘇丹草(S.sudanense)是假高粱的近緣種,在形態(tài)上與假高粱十分相似,雖然形態(tài)近似,但檢疫地位卻不盡相同,黑高梁屬于入侵性種類,而高梁和蘇丹草則屬于栽培經濟作物可作為牧草,沒有表現(xiàn)出人侵性。因此,正確鑒定高粱屬植物,在口岸檢疫上具有重要應用價值?,F(xiàn)有的針對高粱屬植物的鑒定分類方法是基于細胞學方法及DNA檢測進行區(qū)別,這些方法耗時長,操作過程復雜。本發(fā)明提供一種快速簡便無損的分析方法對高粱屬的植物進行鑒別。
[0003]紅外光譜技術以其具有的“指紋”特性,近年來越來越受到人們的重視。紅外光譜法是一種快速簡便無損的分析方法,可以反映物質內部的有機成分,特別是C-H、0-H、N-H等基閉的倍頻和合頻吸收,可用于定量測定物質有機物質的含量。紅外光譜法已被廣泛應用于農業(yè)、食品、飼料、醫(yī)藥、石油化工等行業(yè)。國內外很多學者利用近紅外光譜技術進行物質品種鑒別。在高粱屬種子快速檢測研究中具有廣泛的應用潛力。
【發(fā)明內容】
[0004]為了解決現(xiàn)有口岸檢疫檢測技術存在的問題,本發(fā)明提供一種快速簡便無損的分類鑒定方法對相類似的高粱屬種子進行鑒別,該發(fā)明在口岸檢疫上具有重要應用價值。
[0005]一種基于近紅外光譜的假高粱及其近似物種的快速檢測方法,包括如下步驟:
[0006]I)利用近紅外光譜儀采集已知樣本的原始光譜數(shù)據(jù),并對采集到的原始光譜數(shù)據(jù)預處理;
[0007]2)運用遺傳算法抽取原始光譜數(shù)據(jù)的15個特征波長的原始光譜數(shù)據(jù);
[0008]3)對步驟(2)抽取的15個特征波長的原始光譜數(shù)據(jù)依次運用偏最小二乘法進行模式特征分析、再經過交互驗證判別法完成特征提取、最后建立三層BP神經網絡;
[0009]4)采用步驟(3)建立的三層BP神經網絡對未知樣本進行預測。
[0010]所述采集原始光譜數(shù)據(jù)的波長范圍為325-1075nm。
[0011]所述已知樣本均用直徑為40-50mm,高度8_10mm的培養(yǎng)皿盛裝,每個培養(yǎng)皿裝滿作為一個實驗樣本。[0012]所述近紅外光譜儀置于已知樣本的正上方,距已知樣本表面90_100mm ;分析譜區(qū)采用了部分的掃描區(qū)間進行分析,采用500-750nm范圍的數(shù)據(jù),間隔點為3,即在500_750nm區(qū)間每三個波長點選取一個數(shù)據(jù)點。
[0013]所述原始光譜數(shù)據(jù)預處理的方法依次為:先對原始光譜數(shù)據(jù)進行SavitzkyGolayDerivatives處理;再采用Savitzky-Golay平滑法對原始光譜數(shù)據(jù)進行處理,選用平滑點數(shù)為9 ;最后對原始光譜數(shù)據(jù)進行SNV處理。運用遺傳算法抽取15個特征波長分別是:543nm, 378nm, 747nm, 817nm, 730nm, 545nm, 610nm, 663nm, 915nm, 676nm, 582nm,506nm,756nm,459nm,446nm。
[0014]所述BP神經網絡為誤差反向傳播網絡,建立BP神經網絡的方法如下:首先采用主成分分析對抽取的15個特征波長的原始光譜數(shù)據(jù)進行壓縮和降維,得到的主成分作為BP神經網絡輸入;BP神經網絡分3層即輸入層、隱含層和輸出層,采用sigmoid激發(fā)函數(shù),并運用改進的BP算法-LevenberMarquardt方法。
[0015]所述網絡輸入層、隱含層、輸出層節(jié)點數(shù)分別為7、7、1,其中輸入層的7個節(jié)點來自PLS分析得到的主成分;最小訓練速率為0.1,訓練迭代次數(shù)為1000次。
[0016]與現(xiàn)有技術相比,本發(fā)明的有益效果是:現(xiàn)有的針對高粱屬植物的鑒定分類方法是基于細胞學方法及DNA檢測進行區(qū)別,這些方法耗時長,操作過程復雜。本發(fā)明應用近紅外光譜技術結合特征波長提取方法提取15個特征波長,提取的特征波長分別是:543nm,378nm,747nm,817nm,730nm,545nm,610nm,663nm,915nm,676nm,582nm,506nm,756nm,459nm,446nm,建立了高粱屬種子類別鑒別的模型,該模型對未知樣品的預測相對誤差均在4%以下,識別精度高,該模型的預測效果能夠滿足實際應用要求。說明運用近紅外光譜可以快速、準確對高粱屬種子類別進行鑒別。
【專利附圖】
【附圖說明】
[0017]圖1是本發(fā)明的系統(tǒng)框圖;
[0018]圖2是本發(fā)明建模集樣本分類結果散點分布圖。
【具體實施方式】
[0019]如圖1所示,本發(fā)明一種基于近紅外光譜的假高粱及其近似物種的快速檢測方法,包括如下步驟:
[0020]I)利用近紅外光譜儀采集已知樣本的原始光譜數(shù)據(jù),并對采集到的原始光譜數(shù)據(jù)預處理;
[0021]2)運用遺傳算法抽取原始光譜數(shù)據(jù)的15個特征波長的原始光譜數(shù)據(jù);
[0022]3)對步驟(2)抽取的15個特征波長的原始光譜數(shù)據(jù)依次運用偏最小二乘法進行模式特征分析、再經過交互驗證判別法完成特征提取、最后建立三層BP神經網絡;
[0023]4)采用步驟(3)建立的三層BP神經網絡對未知樣本進行預測。
[0024]所述采集原始光譜數(shù)據(jù)的波長范圍為325_1075nm。
[0025]所述已知樣本均用直徑為40-50mm,高度8_10mm的培養(yǎng)皿盛裝,每個培養(yǎng)皿裝滿作為一個實驗樣本。
[0026]所述近紅外光譜儀置于已知樣本的正上方,距已知樣本表面90_100mm ;分析譜區(qū)采用了部分的掃描區(qū)間進行分析,采用500-750nm范圍的數(shù)據(jù),間隔點為3,即在500_750nm區(qū)間每三個波長點選取一個數(shù)據(jù)點。
[0027]所述原始光譜數(shù)據(jù)預處理的方法依次為:先對原始光譜數(shù)據(jù)進行SavitzkyGolayDerivatives處理;再采用Savitzky-Golay平滑法對原始光譜數(shù)據(jù)進行處理,選用平滑點數(shù)為9 ;最后對原始光譜數(shù)據(jù)進行SNV處理。
[0028]運用遺傳算法抽取15個特征波長分別是:543nm,378nm,747nm,817nm,730nm,545nm,610nm,663nm,915nm,676nm,582nm,506nm,756nm,459nm,446nm。
[0029]所述BP神經網絡為誤差反向傳播網絡,建立BP神經網絡的方法如下:首先采用主成分分析對抽取的15個特征波長的原始光譜數(shù)據(jù)進行壓縮和降維,得到的主成分作為BP神經網絡輸入;BP神經網絡分3層即輸入層、隱含層和輸出層,采用sigmoid激發(fā)函數(shù),并運用改進的BP算法-LevenberMarquardt方法。
[0030]所述網絡輸入層、隱含層、輸出層節(jié)點數(shù)分別為7、7、1,其中輸入層的7個節(jié)點來自PLS分析得到的主成分;最小訓練速率為0.1,訓練迭代次數(shù)為1000次。
[0031]實施例
[0032]采集對象為高粱、假高粱、蘇丹草三種高粱屬種子。該檢測方法也適用于高粱屬其它種子。
[0033]采集范圍在325-1075nm之間的光譜數(shù)據(jù),光譜采樣間隔為1.5nm,掃描次數(shù)30次,探頭視場角為20度。光源采用與光譜儀配套的14.5V鹵素燈。
[0034]三種高粱屬種子共120個樣本(每個品種40個)。各種樣本均用直徑為40_50mm,高度8-lOmm的培養(yǎng)皿盛裝。為了減小實驗誤差保證被測物體與儀器等距,將每個培養(yǎng)皿裝滿作為一個實驗樣本。每個品種各做40個樣本,共計120個樣本。全部實驗樣本隨機分成建模集和預測集,建模集有90個樣本(每個品種30個),預測集有30個樣本(每個品種10個)。光譜儀經白板校準后進行測試。光譜儀置于樣本的上方,距大米表面90-100mm,對每一個樣本掃描20次,取平均值。
[0035]為了去除隨機噪音、基線漂移、光散射、樣本不均勻等影響,需要對采集到的光譜數(shù)據(jù)進行預處理。先對數(shù)據(jù)進行SavitzkyGolayDerivatives —階微分處理,平滑點數(shù)設置為6,用以去除同波長無關的漂移。再采用MovingAverageSmoothing平滑法,平滑點數(shù)設置為9,用以提高分析信號的信噪比,有效地濾除各種因素產生的高頻噪音。最后對數(shù)據(jù)進行多元散射校正處理,MSC可以去除近紅外漫反射光譜中樣品的鏡面反射及不均勻性造成的噪聲,消除漫反射光譜的基線及光譜的不重復性。處理后的光譜數(shù)據(jù)作為遺傳算法的輸入。
[0036]遺傳算法控制參數(shù)設定:初始群體100,遺傳迭代次數(shù)50,交叉概率0.8,變異概率
0.1。將預處理后的光譜數(shù)據(jù)用GA進行波長篩選,共提取15個特征波長作為PLS輸入變量。經過主成分分析得出的前面7個主成分已經包含了大部分光譜信息。因此,將這7個特征變量作為BP神經網絡的輸入變量,即網絡輸入層、隱含層、輸出層節(jié)點數(shù)分別為7、7、
1。最小訓練速率為0.1,設定訓練迭代次數(shù)為1000次,對輸入樣本進行標準化處理。訓練集和預測集樣本數(shù)為90和30。對30個未知樣本的預測結果表明這3個品種,擬和殘差為
0.0013,30個樣本的預測相對偏差均在4%以下,即預測的正確率可以滿足實際要求。
[0037]如圖2所示,應用近紅外光譜技術建立了高粱屬種子類別鑒別的模型,該模型的預測效果能夠滿足實際應用要求,對未知樣品的預測相對誤差均在4%以下,識別精度高。說明運用近紅外光譜可以快速、準確對高粱屬種子類別進行鑒別。采用遺傳算法對特征波長進行提取,并用偏最小二乘法進行主成分分析,最后結合BP神經網絡對預測樣本進行預測,識別精度得到了很大提高。采用從PLS分析中得到的主成分作為BP神經網絡的輸入,不但減少了計算量,加快了訓練速率,同時因為去除了光譜干擾信息,也提高了預測的正確率。因此,應用遺傳算法、偏最小二乘法結合BP神經網絡的模式識別方法和近紅外光譜技術可以對高粱屬種子類別進行快速準確鑒別。
【權利要求】
1.一種基于近紅外光譜的假高粱及其近似物種的快速檢測方法,其特征包括如下步驟: 1)利用近紅外光譜儀采集已知樣本的原始光譜數(shù)據(jù),并對采集到的原始光譜數(shù)據(jù)預處理; 2)運用遺傳算法抽取原始光譜數(shù)據(jù)的15個特征波長的原始光譜數(shù)據(jù); 3)對步驟(2)抽取的15個特征波長的原始光譜數(shù)據(jù)依次運用偏最小二乘法進行模式特征分析、再經過交互驗證判別法完成特征提取、最后建立三層BP神經網絡; 4)采用步驟(3)建立的三層BP神經網絡對未知樣本進行預測。
2.根據(jù)權利要求1所述的一種基于近紅外光譜的假高粱及其近似物種的快速檢測方法,其特征在于:所述采集原始光譜數(shù)據(jù)的波長范圍為325-1075nm。
3.根據(jù)權利要求1所述的一種基于近紅外光譜的假高粱及其近似物種的快速檢測方法,其特征在于:所述已知樣本均用直徑為40-50mm,高度8_10mm的培養(yǎng)皿盛裝,每個培養(yǎng)皿裝滿作為一個實驗樣本。
4.根據(jù)權利要求1所述的一種基于近紅外光譜的假高粱及其近似物種的快速檢測方法,其特征在于:所述近紅外光譜儀置于已知樣本的正上方,距已知樣本表面90-100mm;分析譜區(qū)采用了部分的掃描區(qū)間進行分析,采用500-750nm范圍的數(shù)據(jù),間隔點為3,即在500-750nm區(qū)間每三個波長點選取一個數(shù)據(jù)點。
5.根據(jù)權利要求1所述的一種基于近紅外光譜的假高粱及其近似物種的快速檢測方法,其特征在于:所述原始光譜數(shù)據(jù)預處理的方法依次為:先對原始光譜數(shù)據(jù)進行SavitzkyGolayDerivatives處理;再采用Savitzky-Golay平滑法對原始光譜數(shù)據(jù)進行處理,選用平滑點數(shù)為9 ;最后對原始光譜數(shù)據(jù)進行SNV處理。
6.根據(jù)權利要求1所述的一種基于近紅外光譜的假高粱及其近似物種的快速檢測方法,其特征在于:運用遺傳算法抽取15個特征波長分別是:543nm,378nm,747nm,817nm,730nm,545nm,610nm,663nm,915nm,676nm,582nm,506nm,756nm,459nm,446nm。
7.根據(jù)權利要求1所述的一種基于近紅外光譜的假高粱及其近似物種的快速檢測方法,其特征在于:所述BP神經網絡為誤差反向傳播網絡,建立BP神經網絡的方法如下:首先采用主成分分析對抽取的15個特征波長的原始光譜數(shù)據(jù)進行壓縮和降維,得到的主成分作為BP神經網絡輸入;BP神經網絡分3層即輸入層、隱含層和輸出層,采用sigmoid激發(fā)函數(shù),并運用改進的BP算法-LevenberMarquardt方法。
8.根據(jù)權利要求7所述的一種基于近紅外光譜的假高粱及其近似物種的快速檢測方法,其特征在于:所述網絡輸入層、隱含層、輸出層節(jié)點數(shù)分別為7、7、1,其中輸入層的7個節(jié)點來自PLS分析得到的主成分;最小訓練速率為0.1,訓練迭代次數(shù)為1000次。
【文檔編號】G01N21/359GK103743705SQ201410042766
【公開日】2014年4月23日 申請日期:2014年1月28日 優(yōu)先權日:2014年1月28日
【發(fā)明者】林萍, 陳永明, 胡國文 申請人:鹽城工學院