基于紅外光譜智能鑒定模型的土壤有機(jī)質(zhì)快速檢測(cè)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于農(nóng)業(yè)信息化領(lǐng)域,具體設(shè)及一種基于中紅外光聲光譜建立智能鑒定模 型對(duì)檢測(cè)±壤有機(jī)質(zhì)含量的快速、精確、無(wú)損的測(cè)定方法。
【背景技術(shù)】
[0002] ±壤有機(jī)質(zhì)是±壤的重要組成部分,也是農(nóng)田±壤肥力和±壤質(zhì)量的重要指標(biāo), ±壤有機(jī)質(zhì)含量的快速檢測(cè)對(duì)于農(nóng)田精準(zhǔn)施肥具有重要意義。
[0003] 目前傳統(tǒng)的測(cè)定±壤有機(jī)質(zhì)含量一般采用重銘酸鐘容量法、水合熱重銘酸鐘氧 化-比色法等,運(yùn)些方法需要對(duì)樣本進(jìn)行預(yù)處理、操作復(fù)雜、成本較高、測(cè)試周期長(zhǎng)、且需要 大量化學(xué)試劑,易污染環(huán)境,不適合大規(guī)模快速測(cè)定要求。
[0004] 近年來(lái)紅外光譜技術(shù)已經(jīng)用于±壤的定性定量分析。中紅外光光聲光譜是一種基 于現(xiàn)代光聲轉(zhuǎn)換的紅外光譜,其原理是將紅外光入射到光聲附件的樣品池中,樣品受到紅 外光照射后產(chǎn)生熱效應(yīng),光聲池中的氣體受到熱效應(yīng)后轉(zhuǎn)化為熱波,熱波被敏感的微音器 檢測(cè),得到紅外光聲光譜。紅外光聲光譜測(cè)樣無(wú)需前處理、對(duì)樣品無(wú)損、可實(shí)現(xiàn)原位測(cè)定,在 農(nóng)業(yè)中顯示出很好的應(yīng)用潛力。
[0005] 將紅外光譜與化學(xué)計(jì)量學(xué)方法相結(jié)合,構(gòu)建預(yù)測(cè)模型,可實(shí)現(xiàn)對(duì)±壤有機(jī)質(zhì)含量 的預(yù)測(cè),該類模基于給定樣本進(jìn)行模型構(gòu)建,模型單一穩(wěn)定,且校正集和驗(yàn)證集相對(duì)固定。 但±壤結(jié)構(gòu)復(fù)雜,背景干擾大,且±壤變異系數(shù)大,不同采樣點(diǎn)±壤具有不同特征,易受背 景干擾影響,且建模樣本數(shù)過(guò)少或過(guò)多都會(huì)影響模型的精確度和普適性。如何將紅外光譜 與化學(xué)計(jì)量學(xué)相結(jié)合,構(gòu)建和優(yōu)化模型,實(shí)現(xiàn)±壤性質(zhì)快速、精確的預(yù)測(cè),對(duì)±壤有機(jī)質(zhì)含 量的測(cè)定具有重要的意義,也是該領(lǐng)域的研究重點(diǎn)與難點(diǎn)。
【發(fā)明內(nèi)容】
[0006] 針對(duì)上述問題,本發(fā)明提供一種智能化學(xué)計(jì)量學(xué)建模方法,可W實(shí)現(xiàn)對(duì)±壤有機(jī) 質(zhì)含量快速、精確、無(wú)損的檢測(cè)。通過(guò)檢測(cè)上壤樣品的紅外光聲光譜信息,將待測(cè)的樣品光 譜與已知光譜樣本通過(guò)相似性進(jìn)行排序鑒定,針對(duì)每一種±壤樣品不同特征,選擇最相似 ±壤光譜矩陣與最佳建模樣本數(shù)目建立化SR模型預(yù)測(cè),形成"一樣一模型"的智能鑒定模 型,能夠有效降低±壤背景干擾。該方法與W往單純采用區(qū)域全部±壤樣本光譜預(yù)測(cè)建模 方法相比,其模型穩(wěn)定性和預(yù)測(cè)精度大大提高,模型普適性更強(qiáng),實(shí)現(xiàn)了對(duì)±壤樣品有機(jī)質(zhì) 進(jìn)行快速、精確的檢測(cè)。
[0007] 本發(fā)明的技術(shù)方案如下: 一種基于紅外光譜智能鑒定模型的±壤有機(jī)質(zhì)快速檢測(cè)方法快速、精確、無(wú)損的模型 建立方法,包含W下步驟: (1) :采集±壤樣品,劃分訓(xùn)練樣本和待測(cè)樣本; (2) :±壤訓(xùn)練樣本取樣,置于傅里葉變換中紅外光譜儀-光聲附件樣品池中,采集中紅 外光聲光譜信息,連續(xù)多次掃描,取平均光譜; (3) :采用化學(xué)方法分析步驟(1)中已測(cè)光譜的±壤樣品的有機(jī)質(zhì)含量; (4) :將步驟(2)采集的光譜信息進(jìn)行預(yù)處理,采用消噪、平滑、標(biāo)準(zhǔn)化預(yù)處理; 巧):待測(cè)±壤樣本取樣,置于傅里葉變換中紅外光譜儀-光聲附件樣品池中,采集中紅 外光聲光譜信息;連續(xù)多次掃描,取平均光譜,并通過(guò)步驟(4)的方法對(duì)待測(cè)樣本的光譜進(jìn) 行預(yù)處理。根據(jù)步驟(3)方法,測(cè)定待測(cè)樣本的化學(xué)參考值; (6) :每次提取一個(gè)預(yù)處理好待測(cè)樣本光譜,通過(guò)馬氏距離方法進(jìn)行計(jì)算比較,并根據(jù) 待測(cè)樣本與訓(xùn)練樣本間的馬氏距離建立從小到大的新序列矩陣; (7) :新序列矩陣根據(jù)待測(cè)樣本的特點(diǎn),通過(guò)偏最小二乘回歸(PLSR)方法建立各自的預(yù) 測(cè)模型,并根據(jù)不同建模集數(shù)目得到不同的化SR模型; (8) :通過(guò)相關(guān)指標(biāo)如樣本的標(biāo)準(zhǔn)差SD、相關(guān)系數(shù)R2,均方根誤差RMSEW及模型預(yù)測(cè)性 能綜合性評(píng)價(jià)指標(biāo)RPD,W及驗(yàn)證模型的均方根誤差RMSEP和預(yù)測(cè)樣本的均方根誤差 PRMSECV的比值對(duì)化SR中不同建模集數(shù)目所建立的不同模型進(jìn)行評(píng)價(jià); (9) :通過(guò)步驟(6)、(7)、(8)的方法,對(duì)每一個(gè)待測(cè)樣本進(jìn)行模型的建立與優(yōu)化,得到最 佳"一樣一模型"的智能上壤鑒定模型。
[0008] 將待測(cè)樣本光譜帶入模型,對(duì)有機(jī)質(zhì)含量進(jìn)行計(jì)算與預(yù)測(cè),得出預(yù)測(cè)值;然后利用 步驟(5)化學(xué)方法所得化學(xué)參考值與智能鑒定模型預(yù)測(cè)所得的預(yù)測(cè)值進(jìn)行比較,所構(gòu)建的 智能鑒定模型對(duì)化學(xué)參考值基本一致,預(yù)測(cè)結(jié)果可靠。
[0009] 更優(yōu)化和更具體地說(shuō),本發(fā)明各步驟操作方法如下: (1):采集±壤樣品,對(duì)采集的樣本進(jìn)行風(fēng)干、研磨并通過(guò)2mm孔篩。劃分訓(xùn)練樣本和待 測(cè)樣本。
[0010] (2):±壤訓(xùn)練樣本取樣每份100-200mg,置于傅里葉變換中紅外光譜儀(Nicolet 6700 Jhermo Fisher Scientific,USA)-光聲附件(PA 300,MTEC,USA)樣品池中,采集中紅 外光聲光譜信息,采集波長(zhǎng)范圍為4000-400cm-i,掃描分辨率為4cm-i;動(dòng)鏡速率為0.3162cm -Is,32次連續(xù)掃描取平均光譜,測(cè)試之前采用炭黑進(jìn)行背景校正。
[0011] (3):采用化學(xué)方法分析步驟(1)中已測(cè)光譜的±壤樣品的有機(jī)質(zhì)含量,優(yōu)選方法 為水合熱重銘酸鐘氧化-比色法。
[0012] (4):將步驟(2)采集的光譜信息進(jìn)行預(yù)處理,采用消噪、平滑、標(biāo)準(zhǔn)化預(yù)處理(杜昌 文,《±壤紅外光聲光譜原理及應(yīng)用》,科學(xué)出版社,北京,2012版)。具體方法如下:去噪平滑 方法采用小波濾波進(jìn)行,Matlab軟件中提供很多數(shù)字濾波函數(shù),采用mtmt函數(shù)進(jìn)行,其 語(yǔ)法結(jié)構(gòu)為:
[b,a] =butter(n,wn, ' low') SpectrumF = filtfi It (b,a, spectrum) 其中變量a,b為尺數(shù)程序定義了一個(gè)n階截止頻率為wn的己特沃茲濾波器,low表示截 止頻率為wn的低通濾波,光譜Spectr皿濾波后,返回值為SpectrumF。
[OOU]標(biāo)準(zhǔn)化采用Matlab軟件中提供的標(biāo)準(zhǔn)化函數(shù):
[pn,ps] =mapminmas( spectrum) 其中pn是標(biāo)準(zhǔn)后的數(shù)據(jù),PS是含有原數(shù)據(jù)平均數(shù)與標(biāo)準(zhǔn)差信息的數(shù)據(jù)。
[0014] (5):采集待測(cè)±壤樣本取樣每份100-200mg,置于傅里葉變換中紅外光譜儀 (Nicolet6700,Thermo Fisher Scientific,USA)-光聲附件(PA 300,MTEC,USA)樣品池中, 采集中紅外光聲光譜信息,采集波長(zhǎng)范圍為4000-400cnfi,掃描分辨率為4cnfi;動(dòng)鏡速率為 0.3162cnfis,32次連續(xù)掃描取平均光譜,并通過(guò)步驟(4)的方法對(duì)待測(cè)樣本的光譜進(jìn)行預(yù)處 理。根據(jù)步驟(3)方法,測(cè)定待測(cè)樣本的化學(xué)參考值。
[0015] (6):每次提取一個(gè)待測(cè)樣本,將經(jīng)步驟(4)預(yù)處理好的待測(cè)樣本光譜通過(guò)馬氏距 離方法進(jìn)行計(jì)算比較。兩樣本之間的馬氏距離的十算公式如下:
其中X為訓(xùn)練樣本的光譜數(shù)據(jù)向量,y為待測(cè)樣本的光譜數(shù)據(jù)向量,S為待測(cè)樣本協(xié)方差 矩陣;計(jì)算待測(cè)樣本與訓(xùn)練樣本的馬氏距離,并將馬氏距離按照從小到大排序組成新序列 集,該計(jì)算方法可通過(guò)Mat lab 2013a軟件計(jì)算得出。
[0016] (7):新序列矩陣根據(jù)待測(cè)樣本的特點(diǎn),通過(guò)偏最小二乘回歸(PLSR)方法建立各自 的預(yù)測(cè)模型。每個(gè)待測(cè)的樣本的預(yù)測(cè)模型中,建模的樣本數(shù)目分別為25個(gè)、30個(gè)、35個(gè)、40 個(gè),……,W間隔為數(shù)目為5個(gè)遞增,依次類推,直至光矩陣的最大數(shù)目為建模集輸入,分別 采用Leave-one-out交叉驗(yàn)證方法,得到不同建模集數(shù)目的化SR預(yù)測(cè)模型。
[0018] (8):通過(guò)相關(guān)指