本發(fā)明涉及一種基于高光譜測定花色苷含量的方法,尤其涉及一種基于近紅外高光譜的楊梅中花色苷含量測定的方法。
背景技術(shù):
楊梅是我國的特色水果,在浙江、福建和廣東等省份有較大面積的種植。楊梅具有較高的營養(yǎng)價(jià)值,富含多種活性物質(zhì),尤其含有豐富的花色苷。楊梅中的花色苷主要為矢車菊素-3-O-葡萄糖苷,具有抗氧化、抗炎癥和抗衰老等作用(徐淵金.楊梅和桑椹花色苷的提取分離,結(jié)構(gòu)鑒定及其生物活性研究[D].杭州:浙江工商大學(xué),2007.)。
花色苷在楊梅的成熟過程中逐漸積累,并在果實(shí)成熟時(shí)達(dá)到最大。楊梅花色苷是賦予楊梅顏色的主要物質(zhì),并對(duì)其風(fēng)味、口感和營養(yǎng)價(jià)值等有重要影響,是決定楊梅感官質(zhì)量的重要因素之一?;ㄉ赵诿绹W洲等國家已廣泛應(yīng)用于保健食品行業(yè)。楊梅是中國特色漿果資源,且含有豐富的花色苷。因此,研究楊梅中的花色苷含量有助于評(píng)價(jià)楊梅的營養(yǎng)價(jià)值,鑒定楊梅成熟度,對(duì)進(jìn)一步開發(fā)楊梅資源具有十分重要的意義。
目前對(duì)楊梅中花色苷含量的測定主要有兩種:一種是pH示差法,主要利用花色苷的色調(diào)和色度隨pH值的不同而發(fā)生改變。而干擾物質(zhì)特征光譜不隨pH的改變而改變。結(jié)合朗伯-比爾定律可得出,在兩個(gè)不同的pH值下,花色苷溶液的吸光度的差值與花色苷的含量成比例。然而大多數(shù)水果中不止含有一種花色苷,而且每種花色苷的消光系數(shù)都有稍微差別,所以測定的結(jié)果并非完全準(zhǔn)確;另外一種是液相色譜法,主要利用液相色譜技術(shù)直接測定果實(shí)中花色苷的含量。液相色譜法測定花色苷含量十分精確,然而需要昂貴的檢測設(shè)備,檢測時(shí)間較長。
上述兩種檢測方法都需要對(duì)樣品進(jìn)行處理,會(huì)破壞檢測樣品,難以實(shí)現(xiàn)快速、大樣本量的無損檢測。近年來,近紅外高光譜成像技術(shù)作為一種無損檢測方法引起了廣泛的關(guān)注。其最大特點(diǎn)是結(jié)合光譜技術(shù)與計(jì)算機(jī)圖像技術(shù)兩者的優(yōu)點(diǎn),可獲得大量包含連續(xù)波長光譜信息的圖像塊,由于其具有檢測速度快、效率高、成本低等優(yōu)點(diǎn),越來越多地應(yīng)用于農(nóng)產(chǎn)品品質(zhì)與安全的無損檢測。有相關(guān)專利采用高光譜檢測釀酒葡萄果皮中花色苷的含量(一種基于高光譜的釀酒葡萄果皮中花色苷含量測定的方法,ZL201310393516.2),其采用pH示差法測定葡萄皮花色苷含量,以矢車菊素-3-葡萄糖苷為當(dāng)量,然而葡萄皮中花色苷種類很多,采用pH示差法測定并不能準(zhǔn)確的測定葡萄皮中的花色苷含量,從而導(dǎo)致建模后預(yù)測的準(zhǔn)確性有所偏差;同時(shí)其采用大范圍光譜數(shù)據(jù)建模,導(dǎo)致測定時(shí)需要掃描大范圍波長光譜數(shù)據(jù)。因此采用高效液相色譜檢測楊梅中花色苷含量,采集特征光譜波長數(shù)據(jù)建模,可以確保預(yù)測值的準(zhǔn)確性,同時(shí)大大減少掃描波段,可實(shí)現(xiàn)快速、無損、精確的花色苷檢測。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種基于高光譜的楊梅中花色苷含量測定的方法,旨在實(shí)現(xiàn)無損、快速、大樣本量的檢測。
本發(fā)明提供了一種楊梅中花色苷含量的測定方法,該基于近紅外高光譜的楊梅中花色苷含量測定的方法包括以下步驟:
1)樣本光譜的建立:
收集不同品種新鮮楊梅樣本隨機(jī)分配,建立校正樣本集和檢驗(yàn)樣本集;對(duì)校正和檢驗(yàn)樣本集中的樣本運(yùn)用高光譜成像系統(tǒng)進(jìn)行光譜掃描,其中鏡頭與樣本距離為15~30cm,曝光時(shí)間為1~5s,樣本移動(dòng)速度為10~20mm/s,采集900~1700nm近紅外波段高光譜圖像,得到校正和檢驗(yàn)樣本集光譜;
2)樣本花色苷含量的測定:
采集光譜后,使用體積百分比為40~80%的乙醇提取樣本,再應(yīng)用高效液相色譜(HPLC)測定校正和檢驗(yàn)樣本中花色苷含量,以矢車菊素-3-O-葡萄糖苷作為標(biāo)準(zhǔn)品定量,HPLC檢測波長為520nm;
3)樣本光譜的預(yù)處理:
首先采用平滑法(移動(dòng)平均平滑法(Moving Average)、卷積平滑法(Savitzky-Golay)、高斯平滑濾波(Gaussian filter)和中值濾波平滑(Median filter smoothing)等)對(duì)樣本原始光譜進(jìn)行處理,消除光譜噪聲,提高分辨率和靈敏度;繼續(xù)使用標(biāo)準(zhǔn)正態(tài)變量變換算法(Standard normal variate transformation,SNV)或多元散射校正算法(Multiplicative scatter correction,MSC)處理,消除固體顆粒大小、表面散射以及光程變化對(duì)光譜的影響。預(yù)處理過程中根據(jù)需要剔除差異性較大的個(gè)別數(shù)據(jù)。
4)采用多元回歸算法建立校正模型:
首先結(jié)合預(yù)處理后校正樣本集900~1700nm的光譜數(shù)據(jù)和花色苷含量,采用偏最小二乘回歸法(partial least squares regression,PLSR)建模,通過X-載荷(X-loading weight)圖,提取光譜特征值,選取波峰及波谷段光譜,特征光譜波長范圍是921.34~934.76、954.88~991.79、1025.37~1095.92、1139.26~1176.63、1230.49~1294.49nm;以第一次建模得到的部分或全部校正特征光譜波長數(shù)據(jù)和花色苷含量再次使用PLSR建模,建模后代入檢測樣本集光譜數(shù)據(jù),計(jì)算花色苷實(shí)際值,與預(yù)測值的相關(guān)性系數(shù)(R2),優(yōu)化上述特征光譜范圍至R2大于0.9,選取R2最大值時(shí)對(duì)應(yīng)的特征光譜波長范圍,得到最佳建模特征光譜,建立楊梅中花色苷含量的最優(yōu)預(yù)測模型。
上述最優(yōu)建模特征光譜波長范圍是924.60~931.40、961.59~981.73、1042.16~1069.03、1146.35~1159.82和1257.43~1274.27nm,模型預(yù)測值與實(shí)際值的R2為0.9165,均方根誤差(Root-mean-square error,RMSE)值為0.0766。
5)預(yù)測樣本花色苷含量測定:
掃描樣品特征光譜波長,采集近紅外高光譜數(shù)據(jù),將光譜數(shù)據(jù)輸入楊梅花色苷含量預(yù)測模型,計(jì)算得到待測樣品中花色苷含量。
光譜數(shù)據(jù)預(yù)處理、建模及預(yù)測均在The Unscrambler X軟件上操作。
本發(fā)明提供的基于近紅外高光譜的楊梅中花色苷含量測定的方法,通過采用近紅外高光譜圖像提取楊梅光譜數(shù)據(jù),利用高效液相色譜測定楊梅中的花色苷含量,結(jié)合光譜預(yù)處理方法,提取特征光譜,利用最小二乘回歸法(PLSR)建模,得到楊梅中花色苷含量的預(yù)測模型。第一次建模采用的是900~1700nm波長的所有數(shù)據(jù),第一次建??梢缘贸霾ㄩL與含量之間的關(guān)系,可以通過第一次建模,得到特征光譜波長段,第二次建模利用第一次建模得到的特征波長段再次建模,選擇特定波長段的數(shù)據(jù),提高建模準(zhǔn)確性,減少數(shù)據(jù)計(jì)算量。
本發(fā)明采用高效液相色譜測定楊梅中花色苷含量,可以精確測定楊梅中花色苷含量,保證建模的準(zhǔn)確性。
本發(fā)明建模中通過選取特征光譜波長數(shù)據(jù)建模,檢測樣本花色苷含量是,僅需掃描特征光譜波長數(shù)據(jù),可以縮短掃描時(shí)間,提高檢測速率。
本發(fā)明可以避免花色苷現(xiàn)有的化學(xué)檢測法會(huì)破壞檢測對(duì)象,可實(shí)現(xiàn)無損、快速和大量的檢測楊梅中花色苷的含量。
附圖說明
圖1是本發(fā)明實(shí)施例一提供的基于近紅外高光譜的楊梅中花色苷含量測定的方法流程圖;
圖2是本發(fā)明實(shí)施例二提供的楊梅花色苷液相色譜圖;
圖3是本發(fā)明實(shí)施例二提供的近紅外高光譜圖像的平均光譜曲線圖;
圖4是本發(fā)明實(shí)施例三提供的經(jīng)平滑處理和標(biāo)準(zhǔn)正態(tài)變量變換算法(SNV)處理后的近紅外高光譜曲線圖;
圖5是本發(fā)明實(shí)施例三提供的楊梅花色苷的X-載荷(X-loading weight)圖;
圖6是本發(fā)明實(shí)施例四提供的PLSR建模方法下楊梅中花色苷預(yù)測值與實(shí)際值的比較示意圖;
具體實(shí)施方式
下面結(jié)合具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步描述,以下列舉的僅是本發(fā)明的具體實(shí)施例,但本發(fā)明的保護(hù)范圍并不僅限于此:
實(shí)施例一
一種基于近紅外高光譜的楊梅中花色苷含量測定的方法,其特征在于該方法的步驟如下:
1)樣本光譜的建立:
收集不同品種新鮮楊梅樣本隨機(jī)分配,建立校正樣本集和檢驗(yàn)樣本集;對(duì)校正和檢驗(yàn)樣本集中的樣本運(yùn)用高光譜成像系統(tǒng)進(jìn)行光譜掃描,其中鏡頭與樣本距離為15cm,曝光時(shí)間為2s,樣本移動(dòng)速度為10mm/s,采集近紅外波段高光譜圖像,得到校正和檢驗(yàn)樣本集光譜;
上述步驟中,樣本集和檢驗(yàn)樣本集各包含400和200顆楊梅,采集的近紅外波段范圍是1000~1600nm
2)樣本花色苷含量的測定:
采集光譜后,使用80%乙醇提取樣本,再應(yīng)用高效液相色譜(HPLC)測定校正和檢驗(yàn)樣本中花色苷含量,以矢車菊素-3-O-葡萄糖苷作為標(biāo)準(zhǔn)品定量,HPLC檢測波長為520nm;
3)樣本光譜的預(yù)處理:
首先采用移動(dòng)平均平滑法(Moving Average)對(duì)樣本原始光譜進(jìn)行處理,消除光譜噪聲,提高分辨率和靈敏度;繼續(xù)使用標(biāo)準(zhǔn)正態(tài)變量變換算法(Standard normal variate transformation,SNV)處理,消除固體顆粒大小、表面散射以及光程變化對(duì)光譜的影響。預(yù)處理過程中根據(jù)需要剔除差異性較大的個(gè)別數(shù)據(jù)。
4)采用多元回歸算法建立校正模型:
偏最小二乘回歸法(partial least square regression,PLSR)是一種新型的多元統(tǒng)計(jì)數(shù)據(jù)分析方法,它主要研究的是多因變量對(duì)多自變量的回歸建模,特別當(dāng)各變量內(nèi)部高度線性相關(guān)時(shí),用PLSR更有效。另外,偏最小二乘回歸較好地解決了樣本個(gè)數(shù)少于變量個(gè)數(shù)等問題。
對(duì)于預(yù)處理后的校正樣本集光譜數(shù)據(jù)和校正樣本集的花色苷含量測量值,通過多元回歸算法來建立校正模型;具體操作為結(jié)合光譜預(yù)處理方法和偏最小二乘回歸法建模,采用檢測樣本集,評(píng)估建立模型的效果,確定出最佳的處理方法,建立楊梅中花色苷含量的預(yù)測模型。
首先結(jié)合預(yù)處理后校正樣本集900~1700nm的光譜數(shù)據(jù)和花色苷含量,采用偏最小二乘回歸法(partial least squares regression,PLSR)建模,通過X-載荷(X-loading weight)圖,提取光譜特征值,選取波峰及波谷段光譜,特征光譜波長范圍是921.34~934.76、954.88~991.79、1025.37~1095.92、1139.26~1176.63、1230.49~1294.49nm;以第一次建模得到的部分或全部校正特征光譜波長數(shù)據(jù)和花色苷含量再次使用PLSR建模,建模后代入檢測樣本集光譜數(shù)據(jù),計(jì)算花色苷實(shí)際值,與預(yù)測值的相關(guān)性系數(shù)(R2),優(yōu)化上述特征光譜范圍至R2大于0.9,選取R2最大值時(shí)對(duì)應(yīng)的特征光譜波長范圍,得到最佳建模特征光譜,建立楊梅中花色苷含量的最優(yōu)預(yù)測模型。
上述最優(yōu)建模特征光譜波長范圍是924.60~934.76、1042.16~1069.03、1146.35~1159.82和1257.43~1274.27nm,模型預(yù)測值與實(shí)際值的R2為0.9021,均方根誤差(Root-mean-square error,RMSE)值為0.1124。
5)預(yù)測樣本花色苷含量測定:
掃描樣品特征光譜波長,采集近紅外高光譜數(shù)據(jù),將光譜數(shù)據(jù)輸入楊梅花色苷含量預(yù)測模型,計(jì)算得到待測樣品中花色苷含量。
光譜數(shù)據(jù)預(yù)處理、建模及預(yù)測均在The Unscrambler X軟件上操作。
圖1是本發(fā)明的基于近紅外高光譜的楊梅中花色苷含量測定的方法流程圖,主要步驟包括樣品的采集,近紅外高光譜掃描,讀取光譜數(shù)據(jù),光譜數(shù)據(jù)預(yù)處理,液相色譜檢測楊梅花色苷含量,結(jié)合光譜數(shù)據(jù)和花色苷含量建立預(yù)測模型;
實(shí)施例二
一種基于近紅外高光譜的楊梅中花色苷含量測定的方法,其特征在于該方法的步驟如下:
1)樣本光譜的建立:
收集不同品種新鮮楊梅樣本隨機(jī)分配,建立校正樣本集和檢驗(yàn)樣本集;對(duì)校正和檢驗(yàn)樣本集中的樣本運(yùn)用高光譜成像系統(tǒng)進(jìn)行光譜掃描,其中鏡頭與樣本距離為20cm,曝光時(shí)間為3s,樣本移動(dòng)速度為15mm/s,采集近紅外波段高光譜圖像,得到校正和檢驗(yàn)樣本集光譜;
上述步驟中,樣本集和檢驗(yàn)樣本集各包含500和500顆楊梅,采集的近紅外波段范圍是900~1500nm
2)樣本花色苷含量的測定:
采集光譜后,使用40%乙醇提取樣本,再應(yīng)用高效液相色譜(HPLC)測定校正和檢驗(yàn)樣本中花色苷含量,以矢車菊素-3-O-葡萄糖苷作為標(biāo)準(zhǔn)品定量,HPLC檢測波長為520nm;
3)樣本光譜的預(yù)處理:
首先采用卷積平滑法(Savitzky-Golay)對(duì)樣本原始光譜進(jìn)行處理,消除光譜噪聲,提高分辨率和靈敏度;繼續(xù)使用多元散射校正算法(Multiplicative scatter correction,MSC)處理光譜,消除顆粒分布不均勻級(jí)顆粒大小產(chǎn)生的散射影響。預(yù)處理過程中需剔除差異性較大的個(gè)別數(shù)據(jù)。
4)采用多元回歸算法建立校正模型:
偏最小二乘回歸法(partial least square regression,PLSR)是一種新型的多元統(tǒng)計(jì)數(shù)據(jù)分析方法,它主要研究的是多因變量對(duì)多自變量的回歸建模,特別當(dāng)各變量內(nèi)部高度線性相關(guān)時(shí),用PLSR更有效。另外,偏最小二乘回歸較好地解決了樣本個(gè)數(shù)少于變量個(gè)數(shù)等問題。
對(duì)于預(yù)處理后的校正樣本集光譜數(shù)據(jù)和校正樣本集的花色苷含量測量值,通過多元回歸算法來建立校正模型;具體操作為結(jié)合光譜預(yù)處理方法和偏最小二乘回歸法建模,采用檢測樣本集,評(píng)估建立模型的效果,確定出最佳的處理方法,建立楊梅中花色苷含量的預(yù)測模型。
首先結(jié)合預(yù)處理后校正樣本集900~1700nm的光譜數(shù)據(jù)和花色苷含量,采用偏最小二乘回歸法(partial least squares regression,PLSR)建模,通過X-載荷(X-loading weight)圖,提取光譜特征值,選取波峰及波谷段光譜,特征光譜波長范圍是921.34~934.76、954.88~991.79、1025.37~1095.92、1139.26~1176.63、1230.49~1294.49nm;以第一次建模得到的部分或全部校正特征光譜波長數(shù)據(jù)和花色苷含量再次使用PLSR建模,建模后代入檢測樣本集光譜數(shù)據(jù),計(jì)算花色苷實(shí)際值,與預(yù)測值的相關(guān)性系數(shù)(R2),優(yōu)化上述特征光譜范圍至R2大于0.9,選取R2最大值時(shí)對(duì)應(yīng)的特征光譜波長范圍,得到最佳建模特征光譜,建立楊梅中花色苷含量的最優(yōu)預(yù)測模型。
上述最優(yōu)建模特征光譜波長范圍是924.60~931.40、961.59~981.73、1042.16~1176.63和1257.43~1274.27nm,模型預(yù)測值與實(shí)際值的R2為0.9112,模型預(yù)測值與實(shí)際值R2為0.9021,均方根誤差(Root-mean-square error,RMSE)值為0.0924。
5)預(yù)測樣本花色苷含量測定:
掃描樣品特征光譜波長,采集近紅外高光譜數(shù)據(jù),將光譜數(shù)據(jù)輸入楊梅花色苷含量預(yù)測模型,計(jì)算得到待測樣品中花色苷含量。
光譜數(shù)據(jù)預(yù)處理、建模及預(yù)測均在The Unscrambler X軟件上操作。
圖2是本發(fā)明的楊梅花色苷液相色譜圖,結(jié)果表明,楊梅中的花色苷為矢車菊素-3-O-葡萄糖苷。
圖3是本發(fā)明的近紅外高光譜圖像的原始平均光譜曲線圖。
實(shí)施例三
一種基于近紅外高光譜的楊梅中花色苷含量測定的方法,其特征在于該方法的步驟如下:
1)樣本光譜的建立:
收集不同品種新鮮楊梅樣本隨機(jī)分配,建立校正樣本集和檢驗(yàn)樣本集;對(duì)校正和檢驗(yàn)樣本集中的樣本運(yùn)用高光譜成像系統(tǒng)進(jìn)行光譜掃描,其中鏡頭與樣本距離為30cm,曝光時(shí)間為5s,樣本移動(dòng)速度為20mm/s,采集近紅外波段高光譜圖像,得到校正和檢驗(yàn)樣本集光譜;
上述步驟中,樣本集和檢驗(yàn)樣本集各包含400和400顆楊梅,采集的近紅外波段范圍是900~1700nm
2)樣本花色苷含量的測定:
采集光譜后,使用50%乙醇提取樣本,再應(yīng)用高效液相色譜(HPLC)測定校正和檢驗(yàn)樣本中花色苷含量,以矢車菊素-3-O-葡萄糖苷作為標(biāo)準(zhǔn)品定量,HPLC檢測波長為520nm;
3)樣本光譜的預(yù)處理:
首先采用高斯平滑濾波(Gaussian filter)對(duì)樣本原始光譜進(jìn)行處理,消除光譜噪聲,提高分辨率和靈敏度;繼續(xù)使用標(biāo)準(zhǔn)正態(tài)變量變換算法(Standard normal variate transformation,SNV)處理,消除固體顆粒大小、表面散射以及光程變化對(duì)光譜的影響。預(yù)處理過程中需剔除差異性較大的個(gè)別數(shù)據(jù)。
4)采用多元回歸算法建立校正模型:
偏最小二乘回歸法(partial least square regression,PLSR)是一種新型的多元統(tǒng)計(jì)數(shù)據(jù)分析方法,它主要研究的是多因變量對(duì)多自變量的回歸建模,特別當(dāng)各變量內(nèi)部高度線性相關(guān)時(shí),用PLSR更有效。另外,偏最小二乘回歸較好地解決了樣本個(gè)數(shù)少于變量個(gè)數(shù)等問題。
對(duì)于預(yù)處理后的校正樣本集光譜數(shù)據(jù)和校正樣本集的花色苷含量測量值,通過多元回歸算法來建立校正模型;具體操作為結(jié)合光譜預(yù)處理方法和偏最小二乘回歸法建模,采用檢測樣本集,評(píng)估建立模型的效果,確定出最佳的處理方法,建立楊梅中花色苷含量的預(yù)測模型。
首先結(jié)合預(yù)處理后校正樣本集900~1700nm的光譜數(shù)據(jù)和花色苷含量,采用偏最小二乘回歸法(partial least squares regression,PLSR)建模,通過X-載荷(X-loading weight)圖,提取光譜特征值,選取波峰及波谷段光譜,特征光譜波長范圍是921.34~934.76、954.88~991.79、1025.37~1095.92、1139.26~1176.63、1230.49~1294.49nm。;以第一次建模得到的部分或全部校正特征光譜波長數(shù)據(jù)和花色苷含量再次使用PLSR建模,建模后代入檢測樣本集光譜數(shù)據(jù),計(jì)算花色苷實(shí)際值,與預(yù)測值的相關(guān)性系數(shù)(R2),優(yōu)化上述特征光譜范圍至R2大于0.9,選取R2最大值時(shí)對(duì)應(yīng)的特征光譜波長范圍,得到最佳建模特征光譜,建立楊梅中花色苷含量的最優(yōu)預(yù)測模型。
上述最優(yōu)建模特征光譜波長范圍是961.59~991.79、1042.16~1176.63和1257.43~1294.49nm,模型預(yù)測值與實(shí)際值的R2為0.9038,模型預(yù)測值與實(shí)際值R2為0.9021,均方根誤差(Root-mean-square error,RMSE)值為0.0837。
5)預(yù)測樣本花色苷含量測定:
掃描樣品特征光譜波長,采集近紅外高光譜數(shù)據(jù),將光譜數(shù)據(jù)輸入楊梅花色苷含量預(yù)測模型,計(jì)算得到待測樣品中花色苷含量。
光譜數(shù)據(jù)預(yù)處理、建模及預(yù)測均在The Unscrambler X軟件上操作。
圖4是本發(fā)明的經(jīng)平滑處理和標(biāo)準(zhǔn)正態(tài)變量變換算法(SNV)處理后的近紅外高光譜曲線圖,處理后噪聲明顯降低;
圖5是本發(fā)明的楊梅花色苷的X-載荷(X-loading weight)圖,通過波峰和波谷選擇特征光譜;
實(shí)施例四
一種基于近紅外高光譜的楊梅中花色苷含量測定的方法,其特征在于該方法的步驟如下:
1)樣本光譜的建立:
收集不同品種新鮮楊梅樣本隨機(jī)分配,建立校正樣本集和檢驗(yàn)樣本集;對(duì)校正和檢驗(yàn)樣本集中的樣本運(yùn)用高光譜成像系統(tǒng)進(jìn)行光譜掃描,其中鏡頭與樣本距離為25cm,曝光時(shí)間為4s,樣本移動(dòng)速度為16mm/s,采集近紅外波段高光譜圖像,得到校正和檢驗(yàn)樣本集光譜;
上述步驟中,樣本集和檢驗(yàn)樣本集各包含300和300顆楊梅,采集的近紅外波段范圍是900~1600nm
2)樣本花色苷含量的測定:
采集光譜后,使用60%乙醇提取樣本,再應(yīng)用高效液相色譜(HPLC)測定校正和檢驗(yàn)樣本中花色苷含量,以矢車菊素-3-O-葡萄糖苷作為標(biāo)準(zhǔn)品定量,HPLC檢測波長為520nm;
3)樣本光譜的預(yù)處理:
首先采用中值濾波平滑(Median filter smoothing)對(duì)樣本原始光譜進(jìn)行處理,消除光譜噪聲,提高分辨率和靈敏度;繼續(xù)使用標(biāo)準(zhǔn)正態(tài)變量變換算法(Standard normal variate transformation,SNV)處理,消除固體顆粒大小、表面散射以及光程變化對(duì)光譜的影響。預(yù)處理過程中需剔除差異性較大的個(gè)別數(shù)據(jù)。
4)采用多元回歸算法建立校正模型:
偏最小二乘回歸法(partial least square regression,PLSR)是一種新型的多元統(tǒng)計(jì)數(shù)據(jù)分析方法,它主要研究的是多因變量對(duì)多自變量的回歸建模,特別當(dāng)各變量內(nèi)部高度線性相關(guān)時(shí),用PLSR更有效。另外,偏最小二乘回歸較好地解決了樣本個(gè)數(shù)少于變量個(gè)數(shù)等問題。
對(duì)于預(yù)處理后的校正樣本集光譜數(shù)據(jù)和校正樣本集的花色苷含量測量值,通過多元回歸算法來建立校正模型;具體操作為結(jié)合光譜預(yù)處理方法和偏最小二乘回歸法建模,采用檢測樣本集,評(píng)估建立模型的效果,確定出最佳的處理方法,建立楊梅中花色苷含量的預(yù)測模型。
首先結(jié)合預(yù)處理后校正樣本集900~1700nm的光譜數(shù)據(jù)和花色苷含量,采用偏最小二乘回歸法(partial least squares regression,PLSR)建模,通過X-載荷(X-loading weight)圖,提取光譜特征值,選取波峰及波谷段光譜,特征光譜波長范圍是921.34~934.76、954.88~991.79、1025.37~1095.92、1139.26~1176.63、1230.49~1294.49nm;以第一次建模得到的部分或全部校正特征光譜波長數(shù)據(jù)和花色苷含量再次使用PLSR建模,建模后代入檢測樣本集光譜數(shù)據(jù),計(jì)算花色苷實(shí)際值,與預(yù)測值的相關(guān)性系數(shù)(R2),優(yōu)化上述特征光譜范圍至R2大于0.9,選取R2最大值時(shí)對(duì)應(yīng)的特征光譜波長范圍,得到最佳建模特征光譜,建立楊梅中花色苷含量的最優(yōu)預(yù)測模型。
上述最優(yōu)建模特征光譜波長范圍是924.60~931.40、961.59~981.73、1042.16~1069.03、1146.35~1159.82和1257.43~1274.27nm,模型預(yù)測值與實(shí)際值R2為0.9165,模型預(yù)測值與實(shí)際值的R2為0.9021,均方根誤差(Root-mean-square error,RMSE)值為0.0766。
5)預(yù)測樣本花色苷含量測定:
掃描樣品特征光譜波長,采集近紅外高光譜數(shù)據(jù),將光譜數(shù)據(jù)輸入楊梅花色苷含量預(yù)測模型,計(jì)算得到待測樣品中花色苷含量。
光譜數(shù)據(jù)預(yù)處理、建模及預(yù)測均在The Unscrambler X軟件上操作。
圖6本發(fā)明的楊梅花色苷預(yù)測模型,擬合度可達(dá)91.65%,說明該模型可以較好的預(yù)測楊梅中花色苷含量。
最后,本發(fā)明可用其他的不違背本發(fā)明的精神和主要特征的具體形式來概述。因此,無論從那一點(diǎn)來看,本發(fā)明的上述實(shí)施方案都只能認(rèn)為是對(duì)本發(fā)明的說明而不能限制本發(fā)明,權(quán)利要求書指出了本發(fā)明的范圍,而上述的說明并未指出本發(fā)明的范圍,因此,在與本發(fā)明的權(quán)利要求書相當(dāng)?shù)暮x和范圍內(nèi)的任何改變,都應(yīng)認(rèn)為是包括在權(quán)利要求書的范圍內(nèi)。