本發(fā)明涉及紅外無損檢測技術(shù)領(lǐng)域,尤其涉及一種pso-ricaelm的近紅外光譜分析鑒別翠冠梨成熟度的方法。
背景技術(shù):
現(xiàn)代近紅外光譜分析法是一種快速無損的檢測方法,其原理為對有機物中的含氫基團x-h的倍頻合頻產(chǎn)生吸收,通過化學計量方法測得有機物的理化指標,用有效的數(shù)學算法將理化指標與光譜建立函數(shù)關(guān)系,與傳統(tǒng)的方法相比更加快速方便,節(jié)約時間,已經(jīng)被廣泛應用于多個方面的分析中。但是目前存在的基于近紅外光譜分析的水果成熟度鑒別方法中,例如bp神經(jīng)網(wǎng)絡(luò),在訓練過程中會出現(xiàn)收斂速度慢,進入局部最小值而訓練失敗等情況;由于支持向量機(svm)對大規(guī)模訓練難以實施,所以,解決多分類有很大的困難,具有魯棒性小等缺點。因此為解決建模所需樣品基數(shù)大、訓練時間久,不穩(wěn)定等問題,急需一種普適性較強的模型,能有效的鑒別翠冠梨的成熟度。
傳統(tǒng)的分解降維方法如pca、svd等,只能分解出不相關(guān)的各分量,并不能保證這些分量互相獨立,這就缺少實際意義,降低了所提取特征的典型性。
極限學習機(elm)是一種新型的神經(jīng)網(wǎng)絡(luò),隨機給予輸入層權(quán)值和隱含層偏差,但是這樣容易造成模型泛化能力差,精度不夠高。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于針對現(xiàn)有技術(shù)的不足,提供一種基于pso-ricaelm的近紅外光譜分析鑒別翠冠梨成熟度的方法。ica輸出的是非高斯信號,提高了模型的準確率,本文所提出的穩(wěn)健性獨立分量分析算法是ica的一種,減少了迭代次數(shù)并且有更快的收斂速度,可以提取出所有不為0的基本成分光譜矩陣。將經(jīng)過穩(wěn)健性獨立分量分析算法處理的光譜作為輸入到極限學習機網(wǎng)絡(luò)中,得到ricaelm模型。本發(fā)明提出了粒子群算法優(yōu)化ricaelm網(wǎng)絡(luò)的輸入層權(quán)值和隱含層偏差來提高模型的精度。
本發(fā)明是通過以下技術(shù)方案實現(xiàn)的:一種基于pso-ricaelm的近紅外光譜分析鑒別翠冠梨成熟度的方法,包括以下步驟:
(1)收集樣品;在樣品成熟期前一周開始采摘樣品,每隔n(4<n<10)天采摘一次樣品,至少采摘三次;用近紅外光譜儀對樣品進行多次掃描,多次掃描后取平均值,得到不同成熟度的樣品近紅外光譜;并對近紅外光譜進行二階導數(shù)和離散小波變換處理,得到壓縮后的近紅外光譜數(shù)據(jù)矩陣;
(2)將步驟(1)得到的壓縮后的近紅外光譜數(shù)據(jù)矩陣運用穩(wěn)健性獨立分量分析分解,得到近似濃度矩陣;建立校正集模型,將實際已知成熟度及近似濃度矩陣作為初始模型輸入,得到ricaelm模型;用粒子群算法尋優(yōu)ricaelm模型,得到最佳翠冠梨成熟度鑒別模型;
(3)將預測集樣品的近似濃度矩陣輸入最佳翠冠梨成熟度鑒別模型,得到預測集樣品的成熟度。
進一步的,所述步驟(1)具體實現(xiàn)如下:
在樣品成熟期前一周開始采摘樣品,每隔n(4<n<10)天采摘一次樣品,至少采摘三次;使用近紅外光譜儀對不同成熟度的樣品進行掃描,得到樣品的近紅外光譜,將不同成熟度的樣品隨機分為校正集樣品和預測集樣品,其中,校正集樣品用于模型訓練,預測集樣品用于模型的質(zhì)量評價;將樣品的近紅外光譜進行二階導數(shù)和離散小波變換處理,離散小波變換選擇小波母函數(shù)為dbn,n為消失矩,得到壓縮后的近紅外光譜數(shù)據(jù)矩陣。
進一步的,所述步驟(2)具體實現(xiàn)如下:將處理后的數(shù)據(jù)作為輸入進行穩(wěn)健性獨立分量分析運算,在光譜成分獨立性的前提下,將光譜分解成不同的成分,輸出是近似濃度矩陣。穩(wěn)健性獨立分量分析算法以峭度為對照函數(shù),通過最優(yōu)步長的尋找方法對峭度進行優(yōu)化,得到所有峭度不為0的基本成分光譜矩陣和對應的近似濃度矩陣。將輸出的非高斯型、包含絕大部分光譜特征的近似濃度矩陣輸入到極限學習機網(wǎng)絡(luò)中,得到ricaelm模型。
進一步的,所述步驟(3)具體實現(xiàn)如下:將翠冠梨成熟度鑒別模型輸入層與隱含層之間的連接權(quán)值和隱含層節(jié)點的偏置值作為粒子群搜索空間中的一個粒子,采用粒子群優(yōu)化算法對粒子進行迭代尋優(yōu),設(shè)定粒子數(shù)m,產(chǎn)生種群,初始化pso的粒子速度v、慣性權(quán)值w、學習因子c1和c2、最大迭代次數(shù)k,按照適應度函數(shù)計算粒子的適應度值,然后更新粒子的位置和速度,具體更新公式如下:
vi(a+1)=vi(a)+c1r1[pbesti-xi(a)]+c2r2[gbest-xi(a)]
xi(a+1)=xi(a)+vi(a+1)
其中,i是粒子(i=1、2…),xi(a+1)、vi(a+1)是第i個粒子的第a+1次迭代時的位置和速度,c1和c2學習因子,r1和r2是在[0,1]區(qū)間內(nèi)均勻分布的隨機數(shù),vi、xi是第i個粒子第a次迭代速度和位置,pbesti是第i個粒子的個體最優(yōu)位置,gbest是全局最優(yōu)位置。
當尋優(yōu)滿足尋優(yōu)達到最大迭代次數(shù)k或評價值小于指定的精度b(b>0)時,搜索就結(jié)束,得到最優(yōu)的輸入權(quán)值和隱含層偏置,并賦值給ricaelm網(wǎng)絡(luò),得到最佳翠冠梨成熟度鑒別模型。
進一步的,所述步驟(3)中,極限學習機elm隱含層激活函數(shù)選擇sigmoidal函數(shù)。
本發(fā)明的有益效果是:利用二階導數(shù),消除光譜的基線漂移和背景光干擾,提高光譜分辨率。利用離散小波變換,能壓縮數(shù)據(jù),節(jié)約成本空間,提高建模的效率和精度。利用穩(wěn)健性獨立分量分析算法,選取最優(yōu)獨立分量數(shù)建立校正模型;采用pso-ricaelm算法建立模型,是一種分類精度更高、更穩(wěn)定、泛化能力更好的模型,所建模型更具實際意義。整個測量過程不消耗化學試劑,測試快速,節(jié)省人力物力,批量測試時結(jié)果準確,大大提高檢測效率。本方法可以在采摘、貯藏、運輸、銷售等環(huán)節(jié)推廣使用。
附圖說明
圖1為本發(fā)明成熟度方法流程圖;
圖2為本發(fā)明四種不同成熟度的樣品原始光譜圖;
具體實施方式
由于近紅外光譜可以視作多種主要成分光譜的組合,近些年,有學者將“盲源分離(bbs)”問題引入近紅外光譜分析方法中,將主要成分的光譜從復雜的混合光譜中分離出來。穩(wěn)健性獨立分量分析算法是一種基于峭度和最優(yōu)步長的算法,為信號盲源分離提供了一種高效率的方法,主要優(yōu)點在于可以選取最佳步長以及任何不為零的獨立分量,適用于光譜的分解,可以提取光譜的典型特征。同時,elm屬于前饋神經(jīng)網(wǎng)絡(luò),學習訓練速度快,設(shè)置參數(shù)少,可以較大程度的減少人為誤差。將經(jīng)過穩(wěn)健性獨立分量分析算法處理后的光譜作為輸入到elm網(wǎng)絡(luò)中,得到精度更高、更穩(wěn)定的ricaelm模型。經(jīng)過采用pso尋優(yōu),ricaelm輸入層權(quán)值和隱含層偏差選擇最優(yōu)輸入,得到分類精度更高、更穩(wěn)定、泛化能力更好的模型。
本發(fā)明采用了pso-ricaelm結(jié)合的方法,使近紅外光譜分析法可以有效的鑒別翠冠梨成熟度,豐富了化學計量方法并為近紅外光譜分析領(lǐng)域中農(nóng)作物成熟度鑒別提供了理論前提和技術(shù)支持。
本發(fā)明提供了一種翠冠梨成熟度準確鑒別的近紅外光譜分析法。下面結(jié)合附圖1、附圖2以及實施例對本發(fā)明進一步說明。實施例為本發(fā)明舉例,并非對該發(fā)明限定。
本發(fā)明的技術(shù)方案為,收集樣品和采譜,對原始光譜預處理,首先用二階導數(shù)對近紅外光譜數(shù)據(jù)進行處理,其次用離散小波變換對近紅外光譜數(shù)據(jù)進行有效壓縮,得到數(shù)據(jù)量合適的矩陣,對該矩陣使用穩(wěn)健性獨立分量分析算法分解,提取基本成分光譜矩陣和相應的近似濃度矩陣,將近似濃度矩陣作為模型輸入,通過粒子群尋優(yōu)ricaelm建模。整個方案流程圖如附圖1所示。
附圖2是近紅外光譜儀直接獲取的原始光譜,不同成熟度翠冠梨的光譜存在差異,部分譜區(qū)交疊嚴重,這是因為翠冠梨的糖、酸等含量發(fā)生了變化,從而在近紅外光譜的吸收上出現(xiàn)了區(qū)別,這是鑒別成熟度的基礎(chǔ),也說明鑒別翠冠梨成熟度是有意義的。利用二階導數(shù),能有效的消除基線漂移和其他干擾的影響。利用離散小波變換方法,壓縮光譜數(shù)據(jù),并去除光譜噪聲,保留了光譜的主要信息且大大減小了數(shù)據(jù)量,此步驟需選擇合理的小波函數(shù)及小波分解層數(shù)。
穩(wěn)健性獨立分量分析算法用于分解小波壓縮后數(shù)據(jù)。穩(wěn)健性獨立分量分析算法是盲源分離算法的一種,為信號盲源分離提供了一種高效率的方法,目的是將混合信號中的獨立成分分離出來,該類算法的主要優(yōu)點在于可以選取最佳步長以及任何不為零的獨立分量,解決了盲源分離信號排序問題,提升了魯棒性。用于光譜數(shù)據(jù)矩陣分解時,可以得到獨立成分矩陣和相應的近似濃度矩陣。獨立成分矩陣的每一行相當于一種統(tǒng)計獨立成分的光譜信息,及混合物樣品中的純物質(zhì)信息,是光譜的基本成分矩陣。與其對應的近似濃度矩陣反映了該物質(zhì)在原始數(shù)據(jù)中所占比重,即該獨立分量對整個樣品近紅外光譜的貢獻。
pso-ricaelm是粒子群尋優(yōu)極限學習機網(wǎng)絡(luò)。elm屬于前饋神經(jīng)網(wǎng)絡(luò),學習訓練速度快,設(shè)置參數(shù)少,可以較大程度的減少人為誤差。將經(jīng)過穩(wěn)健性獨立分量分析算法處理后的光譜作為輸入到elm網(wǎng)絡(luò)中,得到精度更高、更穩(wěn)定的ricaelm模型。ricaelm輸入層權(quán)值和隱含層偏差隨機輸入,采用pso尋優(yōu),得到分類精度更高、更穩(wěn)定、泛化能力更好的模型。實施中,應用pso-ricaelm算法,將隱含層神經(jīng)元個數(shù)初始設(shè)定為10,并以d=2為步長依次增加至24,在各隱含神經(jīng)元取值下重復訓練15次,得到最佳模型的模型參數(shù),從而獲得最佳pso-ricaelm模型。
實施例:
1.樣品收集與光譜采集
試驗樣品來自某標準化果業(yè)園,在樣品正常成熟期前一周開始采摘樣品,挑選中等大小,色澤相近且無病蟲害和機械損傷的翠冠梨36個,每隔6天采摘一次樣品,共采摘四次樣品;采摘的樣品在當天內(nèi)完成實驗,用光譜儀對樣品掃描三次取平均值;采譜完成后,得到四種不同成熟度的樣品光譜共144條光譜數(shù)據(jù),將所有數(shù)據(jù)用k/s算法按3:1數(shù)量比劃分為校正集樣品和預測集樣品。光譜采集儀器是型號為mcs600的德國蔡司光譜儀。譜區(qū)采集范圍:800nm-1700nm,實驗均在室溫下進行。實驗中對每個樣品3次不同位置的掃描,取其平均光譜。模型建立軟件基于matlab2015a進行。
2.光譜數(shù)據(jù)處理
對采集到的光譜進行二階導數(shù)處理,消除基線漂移和背景光的干擾。
對處理過的光譜進行離散小波變換,壓縮數(shù)據(jù)。小波基函數(shù)選擇db2,分解至4層,壓縮后數(shù)據(jù)約占原數(shù)據(jù)量的7%,且壓縮后數(shù)據(jù)包含了原始數(shù)據(jù)的大部分信息。
用穩(wěn)健性獨立分量分析算法分解壓縮后的矩陣。穩(wěn)健性獨立分量分析算法中需設(shè)置獨立分量數(shù),將獨立分量數(shù)的初始值設(shè)為5,為找到最佳獨立分量數(shù),以1為步長依次將獨立分量數(shù)增加至20,并進行分析,得到獨立分量最優(yōu)值為12。根據(jù)獨立分量值,使用穩(wěn)健性獨立分量分析算法分解壓縮后矩陣得到了基本成分光譜矩陣和對應的近似濃度矩陣
3.建立pso-ricaelm模型
將四種翠冠梨的實際成熟度以及它們的近似濃度矩陣作為分析模型,使用pso-ricaelm方法建立分析模型;在建立模型過程中,pso的各參數(shù)如下:設(shè)定粒子數(shù)m=20,學習因子c1=1.5和c2=1.5、最大迭代次數(shù)k=200,最小精度b為0.01。應用pso-ricaelm算法,將隱含層神經(jīng)元個數(shù)初始設(shè)定為10,并以d=2為步長依次增加至24,在各隱含神經(jīng)元取值下重復訓練15次,得到最佳模型的模型參數(shù),從而獲得最佳pso-ricaelm分析模型。
4.結(jié)果與分析
采用正確識別率(car)為所建定性模型的評價指標:
正確識別率=正確識別的樣本個數(shù)/應當被識別的總個數(shù)。
經(jīng)驗證,經(jīng)粒子尋優(yōu)后,模型預測能力增加,準確率從88.9%增加到94.4%,從而驗證了pso-ricaelm模型的正確性。