一種基于多尺度太赫茲光譜的原包裝奶粉無損檢測方法
背景技術(shù):
奶粉具有營養(yǎng)豐富、成分配比合理、易被人體吸收等優(yōu)點,深受人們喜愛,長期以來一直是嬰幼兒的主要營養(yǎng)來源和中老年人主要營養(yǎng)補給品之一。然而,近年來在高額利潤的驅(qū)使下,以營養(yǎng)成份造假為主導的、“三聚氰胺”“皮革奶”等奶粉安全問題層出不窮,已成為我國政治、經(jīng)濟、公共衛(wèi)生多重領(lǐng)域下的主要矛盾之一。然而,傳統(tǒng)的奶粉檢測方法大都依賴于高值易耗的儀器和設備,存在檢測成本高、樣品前處理繁瑣、需要拆包裝檢測等問題,費時費力且費用高,嚴重阻礙了傳統(tǒng)儀器檢測方法在廣大基層現(xiàn)場檢測的推廣,更無法滿足我國當前奶粉安全篩查的嚴峻局勢。此外,目前的檢測方法都需要對奶粉包裝進行拆封處理,會對商品包裝造成不可逆的損傷,并造成食品安全執(zhí)法中不必要的浪費及開支,難以適應我國當前嚴峻的奶粉安全形勢。因此,迫切需要開發(fā)新型高效的奶粉原包裝無損檢測技術(shù),以快速獲取奶粉的營養(yǎng)成份及品質(zhì)信息。
光譜檢測技術(shù)目前是一種良好的快速檢測技術(shù),但傳統(tǒng)的光譜建模方法一般采用多元線性回歸校正法,如偏最小二乘法、嶺回歸等,但由于光譜信號大多存在嚴重的基線漂移和背景、基質(zhì)等干擾,需要在光譜進行多元回歸校正前對其進行去噪、平滑等預處理。但在預處理過程中,不同預處理算法克服光譜干擾的偏重點差異較大,易造成有效信息的丟失,使得所建出的模型預測效果和穩(wěn)健性較差。在面對復雜體系的太赫茲光譜時,這類算法缺陷尤為顯著,其原因在于太赫茲光譜的譜峰較寬,簡單的光譜預處理難以準確提取待測物質(zhì)的太赫茲光譜譜帶信息。因此,發(fā)展新型高效的太赫茲光譜解析技術(shù)迫在眉睫。
技術(shù)實現(xiàn)要素:
基于傳統(tǒng)光譜建模方法的缺陷,為滿足奶粉品質(zhì)高通量篩查的需求,本發(fā)明提供一種原包裝奶粉無損檢測方法。技術(shù)方案如下:
一種基于多尺度太赫茲光譜的原包裝奶粉無損檢測方法,包括以下步驟:
s1、通過太赫茲光譜信號采集系統(tǒng)采集營養(yǎng)成分真實值已知并合格的原包裝奶粉的太赫茲光譜,將其作為校正集的原始光譜。
s2、進行高密度小波變換,根據(jù)原包裝奶粉太赫茲光譜信號的特征,選取最優(yōu)高密度小波基。
s3、采用步驟s2中所選取的最優(yōu)高密度小波基,對比原始光譜信號在不同分解尺度下不同樣品間信號的差異性,按照交叉預測誤差最小的方式確立最優(yōu)的分解尺度。
s4、采用步驟s2、s3中確立的最優(yōu)高密度小波分解參數(shù),包括最優(yōu)高密度小波基和最優(yōu)分解尺度,對太赫茲光譜信號進行多尺度高密度小波分解,獲得各層高密度小波系數(shù)。
s5、對步驟s4中所獲取的各層高密度小波系數(shù),分別采用偏最小二乘回歸算法建立預測子模型,過程如步驟s6、s7所述。
s6、以步驟s4中獲得的各層高密度小波系數(shù)中的某一層為自變量,對應營養(yǎng)成分的含量為因變量,進行1000-5000次的偏最小二乘蒙特卡羅交叉驗證,根據(jù)蒙特卡羅交叉驗證均方根誤差最小原則確定預測子模型的最優(yōu)主成分數(shù),并記錄對應的最小交叉驗證均方根誤差。
s7、根據(jù)步驟s6中確立的最優(yōu)主成分數(shù),采用非線性迭代偏最小二乘法建立對應的預測子模型。
s8、對于不同層次的高密度小波系數(shù),通過重復步驟s6和s7分別建立對應的預測子模型,構(gòu)成預測子模型組。
s9、通過合適的融合策略,對所有的預測子模型進行融合:可采用步驟s5中所得的各子模型蒙特卡羅交叉驗證均方根誤差為融合依據(jù),以蒙特卡羅交叉驗證均方根誤差平方的倒數(shù)為子模型的權(quán)重,并通過權(quán)值融合方式得到最終多尺度融合模型。
s10、進一步收集驗證樣本,驗證所建立的多尺度融合模型的預測效果,如模型的預測誤差能夠達檢測需求,則保留該模型,否則重新計算和修正該模型,直至該模型達到檢測需求。
s11、針對不同營養(yǎng)成分,重復進行步驟s1-s10,完成不同營養(yǎng)成分預測模型的訓練。
本發(fā)明由于采取以上技術(shù)方案,其具有以下優(yōu)點:
首先采用太赫茲光譜實現(xiàn)了原包裝奶粉的無損檢測,檢測時無需樣品預處理,避免了傳統(tǒng)檢測過程中對非金屬奶粉外包裝的破壞,且不會對內(nèi)部奶粉品質(zhì)造成影響;其次采用高密度小波變換以過采樣的方式顯著提升了太赫茲光譜的時/頻多尺度分辨能力,有利于準確提取奶粉體系中待測物質(zhì)的太赫茲譜帶信息;分析終端采用多尺度建模的方式實現(xiàn)一鍵式操作,具備良好的易用性;本發(fā)明還具有檢測速度快、系統(tǒng)響應速度快(僅需數(shù)十秒即可完成一次檢測)、操作簡便、預測精度高可實現(xiàn)現(xiàn)場檢測等優(yōu)點。此外,本方法相比較于常規(guī)奶粉檢測方法,無需破壞奶粉包裝即可實現(xiàn)奶粉的營養(yǎng)成分檢測及品質(zhì)鑒定,極大提升了奶粉的檢測效率和性能,尤其適用于海關(guān)大規(guī)模通關(guān)檢測、食品安全現(xiàn)場執(zhí)法檢測及終端客戶現(xiàn)場檢測等領(lǐng)域,提升奶粉安全篩查的效率及經(jīng)濟性,為提高乳制品安全監(jiān)管效率提供有力的技術(shù)支持,在奶粉無損檢測領(lǐng)域具有廣闊的應用前景。
附圖說明
圖1是光譜信號采集系統(tǒng)的關(guān)鍵結(jié)構(gòu)示意圖。
圖中標號說明:1飛秒激光器;2為半波片;3為分束鏡;4延遲裝置;5斬波器;6透鏡;7高通光電導天線砷化鎵晶體;8離軸拋物面鏡;9為硅透鏡;10為碲化鋅晶體;11為透鏡;12為偏振片;13為四分之一波片;14為沃拉斯頓棱鏡;15為平衡二極管;16為鎖相放大器;17為計算機;18為反射鏡;19為充有氮氣的箱體;20為非金屬包裝的原包裝奶粉樣品。
圖2是本發(fā)明的算法流程框圖。
圖3是奶粉太赫茲吸收光譜。
圖4是高密度小波變換系數(shù)序列。
圖5是蒙特卡羅交叉驗證示意圖。
具體實施方式
太赫茲光譜是基于飛秒激光技術(shù)的新型光譜測量技術(shù),具有穿透性強、能量較低、安全性高、等優(yōu)點,本發(fā)明利用太赫茲波能量較低且對大多數(shù)非金屬材料和非極性物質(zhì)穿透性極強的特性,針對非金屬包裝的奶粉產(chǎn)品,利用太赫茲波穿透其外包裝直接獲取內(nèi)部奶粉的太赫茲光譜信息,通過進行高密度小波多尺度建模處理,得到樣品中的關(guān)鍵營養(yǎng)成分信息。檢測過程既不破壞奶粉原包裝又不對奶粉品質(zhì)造成損壞。
本發(fā)明由信號采集終端和信號分析終端兩部分構(gòu)成。各部分詳細介紹如下:
1、信號采集終端:
信號采集終端主要由太赫茲時域光譜信號采集系統(tǒng)(如附圖1所示),和控制模塊構(gòu)成。
(1)太赫茲時域光譜信號采集系統(tǒng)主要由太赫茲光源,樣品池,太赫茲檢測器等部分構(gòu)成,其主要任務為產(chǎn)生太赫茲脈沖波并透射樣品池中的樣品,并由太赫茲探測器收集太赫茲信號。
(2)控制模塊由高性能運算芯片和控制電路構(gòu)成,主要負責協(xié)調(diào)、控制、監(jiān)控太赫茲時域光譜信號的采集過程,確保光譜信號的正確性,并負責將采集的光譜信號發(fā)送至信號分析終端進行處理。
(3)信號采集終端工作過程簡述如下:
s1、太赫茲時域光譜分析系統(tǒng)中飛秒激光器1產(chǎn)生激光脈沖,通過半波片2,分束鏡3,激光分為泵浦光和探測光。
s2、泵浦光通過延遲裝置4,斬波器5,透鏡6,高通光電導天線砷化鎵晶體7,由離軸拋物面鏡8和硅透鏡9聚焦后準直射到非金屬包裝的原包裝奶粉樣品20,透過樣品20后再經(jīng)硅透鏡9及離軸拋物面鏡8與探測光共線后再次聚焦到碲化鋅晶體10上。
s3、探測光經(jīng)透鏡11,偏振片12與泵浦光共線后再次聚焦到碲化鋅晶體10上。
s4、太赫茲脈沖通過碲化鋅晶體10后,通過四分之一波片13,沃拉斯頓棱鏡14,經(jīng)平衡二極管15探測,將信號送入鎖相放大器16放大后輸入計算機17進行處理。
s5、本系統(tǒng)中使用反射鏡18改變光路方向。
s6、透鏡6,高通光電導天線砷化鎵晶體7,立軸拋物面鏡8,硅透鏡9,非金屬包裝的原包裝奶粉樣品20,碲化鋅晶體10,透鏡11,偏振片12,四分之一波片13,沃拉斯頓棱鏡14和平衡二極管15密封在充有氮氣的箱體19內(nèi)。
2、信號分析處理終端:
該終端一般由具有較強運算能力的高性能工作站構(gòu)成,主要負責收集來自信號采集終端的太赫茲光譜信號并采用高密度小波變換以過采樣的方式顯著提升其時/頻多尺度分辨能力,并通過數(shù)據(jù)預處理與多元校正的一體化運算避免奶粉定量信息丟失,進而完成太赫茲光譜的多尺度建模過程,以此獲得奶粉的營養(yǎng)成分和品質(zhì)信息。
在多尺度建模算法中,需要對光譜信號進行多尺度分解,其分解方式由尺度算法決定,因此,尺度算法是多尺度建模算法的核心,其性能將直接影響最終建模的效果。然而,傳統(tǒng)的離散小波變換,僅可粗略實現(xiàn)信號的時/頻多尺度分解,且存在分辨率差、時頻分析不夠精細、信號易畸變等諸多缺陷,不適用于太赫茲光譜的解析。高密度小波變換具分辨率高、緊支撐、過采樣等優(yōu)點,能夠以過采樣的方式有效提升原始光譜的時/頻多尺度分辨率,進而提供比離散小波變換更多的尺度信息,顯著提升復雜體系太赫茲光譜的物質(zhì)分辨能力。因此,高密度小波變換能夠有效克服目前的太赫茲光譜分辨率較低、頻帶較窄的缺陷。
本發(fā)明根據(jù)不同物質(zhì)太赫茲波譜帶的特征性差異,以樣品的太赫茲波時域吸收譜為光譜信號,采用高密度小波多尺度建模算法對太赫茲時域吸收光譜進行多尺度解析,有效提升原始光譜的分辨率,突出特征信號在頻域上的響應。針對各尺度高密度小波系數(shù)序列,分別采用偏最小二乘算法建立預測子模型,并采用權(quán)重融合策略對子模型進行融合,進而得到最終的高密度小波多尺度融合模型,并以此測量原包裝中奶粉的不同營養(yǎng)成份的含量信息。在此基礎上,實現(xiàn)奶粉品質(zhì)的準確判斷。
多尺度建模算法步驟如下:
s1、通過太赫茲光譜信號采集系統(tǒng)采集有代表性的原包裝奶粉光譜,其營養(yǎng)成分真實值可由傳統(tǒng)的檢測方法獲得,并將其作為校正集的原始光譜。
s2、根據(jù)原包裝奶粉太赫茲光譜信號的特征,選取最優(yōu)的高密度小波基,實際中可根據(jù)奶粉中不同營養(yǎng)成分物質(zhì)的吸收峰特性確定不同的最優(yōu)高密度小波基,如2vm、4vm、bi4等。
s3、采用步驟s2中所選取的最優(yōu)高密度小波基,對比原始光譜信號在不同分解尺度下不同樣品間信號的差異性,按照交叉預測誤差最小的方式確立最優(yōu)的分解尺度。
s4、采用步驟s2、s3中確立的最優(yōu)高密度小波分解參數(shù)對太赫茲光譜信號進行多尺度高密度小波分解,獲得各層高密度小波系數(shù)。
s5、對步驟s4中所獲取的各層高密度小波系數(shù),分別采用偏最小二乘回歸算法建立預測子模型,其具體過程如步驟s6、s7所述。
s6、以步驟s4中獲得的各層高密度小波系數(shù)中的某一層為自變量,對應營養(yǎng)成分的含量為因變量,進行1000-5000次的偏最小二乘蒙特卡羅交叉驗證,并根據(jù)蒙特卡羅交叉驗證均方根誤差最小原則確定預測子模型的最優(yōu)主成分數(shù),并記錄對應的最小交叉驗證均方根誤差。
步驟s6中所述的蒙特卡特交叉驗證均方根誤差具體如下:
式中:mcrmsecv為蒙特卡羅交叉驗證均方根誤差,t為蒙特卡羅抽樣次數(shù),n為每次抽樣預測的樣品數(shù),pressi為第i次蒙特卡羅抽樣的預測誤差平方和,cir為第i次蒙特卡羅抽樣的樣品真實值,cip為第i次蒙特卡羅抽樣的樣品預測值。
s7、根據(jù)步驟s6中確立的最優(yōu)主成分數(shù),采用非線性迭代偏最小二乘法建立對應的預測子模型。
s8、對于不同層次的小波系數(shù),通過重復步驟s6和s7分別建立對應的預測子模型,構(gòu)成預測子模型組。
s9、通過合適的融合策略,對所有的預測子模型進行融合。實際中,可采用步驟s5中所得的各子模型蒙特卡羅交叉驗證均方根誤差為融合依據(jù)。例如,以蒙特卡羅交叉驗證均方根誤差平方的倒數(shù)為子模型的權(quán)重,并通過權(quán)值融合方式得到最終多尺度融合模型。基于蒙特卡特交叉驗證均方根誤差的融合策略具體公式如下:
式中:mf為融合模型,msi為第i個子模型,m為子模型總數(shù),wi是第i個子模型的權(quán)重,mcrmsecvi為第i個子模型的蒙特卡特交叉驗證均方根誤差。
s10、進一步收集驗證樣本,驗證所建立多尺度融合模型的預測效果,如模型的預測誤差能夠達檢測需求,則保留該模型,否則重新計算該模型,直至該模型達到檢測需求。
s11、針對不同營養(yǎng)成分,重復進行步驟s1-s10,完成不同營養(yǎng)成分預測模型的訓練。
下面結(jié)合實施例進行說明。
本發(fā)明采用的光譜信號采集系統(tǒng)的最佳工作模式如下所述:
飛秒激光器1發(fā)出中心波長為800nm的飛秒激光脈沖,脈沖寬度為100fs,重復頻率為80mhz,輸出功率為720mw。進入太赫茲時域光譜分析系統(tǒng)后,光束經(jīng)半波片2和分束鏡3后分為較強的泵浦光和較弱的探測光束。泵浦光通過延遲器4,經(jīng)頻率為1.1khz的斬波器5斬波,經(jīng)透鏡6聚焦后入射到高通光電導天線砷化鎵gaas7晶體上,通過光整流效應產(chǎn)生頻率范圍約為0.2~3thz的太赫茲脈沖。太赫茲脈沖經(jīng)離軸拋物面鏡8及硅透鏡9聚焦后入射到帶有非金屬包裝的樣品20上。探測光通過透鏡11,偏振片12后與透過樣品射出的泵浦光共線后再次聚焦入射到探測元件碲化鋅znte10晶體上。這時太赫茲脈沖的電場通過電光效應調(diào)制電光晶體碲化鋅晶體10的折射率橢球,使探測脈沖的偏振態(tài)發(fā)生改變。脈沖通過四分之一波片13,沃拉斯頓棱14后,經(jīng)平衡二極管15探測光的偏振態(tài)的變化,即可得到載有樣品信息的太赫茲脈沖電場的大小及變化信號,將信號送入鎖相放大器16進行放大,并通過改變延遲長度的方法探測太赫茲信號的整個時域波形,最后將信號送入計算機17進行處理。為防止空氣中水蒸汽對太赫茲信號的影響,從產(chǎn)生太赫茲信號的砷化鎵晶體7、待測樣品20到探測晶體碲化鋅znte10的這一段光路被密封在充有氮氣的箱體19內(nèi)。箱體19內(nèi)的相對濕度小于2%,溫度為294k21℃。在探測過程中,系統(tǒng)信噪比為1000,譜分辨率好于40ghz。
由于太赫茲波對于塑料、紙盒、紙袋、布袋以及泡沫等非金屬包裝可以完全透過,且透過率遠高于其他波長的電磁波;但對于金屬包裝和鋁箔復合材料,太赫茲無法通過,故而本發(fā)明樣品為紙盒、紙袋、塑料等非金屬包裝的原包裝奶粉(20),金屬包裝奶粉不在此列。
預測過程如下:
s1、收集已有營養(yǎng)成分真實值的奶粉標準樣品300個,其各項營養(yǎng)成分所覆蓋的范圍盡可能廣闊,分布盡可能均勻。以蛋白質(zhì)為例,樣本中的蛋白質(zhì)含量覆蓋范圍為10g/100g-21g/100g,樣品濃度間隔為0.1g/100g。
s2、對收集到的300個標準樣品采用太赫茲信號收集系統(tǒng)進行光譜采集,獲取其原始吸收光譜,作為校正集樣本的原始光譜,如附圖3所示。附圖3為包裝內(nèi)奶粉的太赫茲吸收光譜實例。
s3、根據(jù)奶粉中蛋白質(zhì)吸收峰的特性,選取最優(yōu)高密度小波基:“4vm”。
s4、通過對比不同分解尺度下不同樣品信號間的差異性,可確立蛋白質(zhì)含量的最優(yōu)分解尺度為4層。并獲得該分解尺度下的校正集樣本各層小波系數(shù)。本例中,信號將被分解為9層高密度小波系數(shù)序列,如附圖4所示。附圖4為各層次小波系數(shù)按升序排列后的小波系數(shù)示意圖。
s5、對各層小波系數(shù)分別采用蒙特卡羅交叉驗證確定最優(yōu)主成分數(shù),抽樣次數(shù)為1000次,抽樣比例為70%。其中第一層小波系數(shù)的蒙特卡羅交叉驗證結(jié)果如圖5所示,由蒙特卡羅交叉驗證均方根誤差最小原則,可確定主成分數(shù)為10,并記錄最小蒙特卡羅交叉驗證誤差。
s6、根據(jù)步驟s5所得最優(yōu)主成分數(shù),采用非線性迭代偏最小二乘算法建立預測子模型。
s7、對于不同層次的高密度小波系數(shù),重復步驟s5、s6建立所有的預測子模型。
s8、依據(jù)各子模型的蒙特卡羅交叉驗證均方根誤差,計算各子模型的權(quán)重,并進行權(quán)重融合,得到最終的多尺度融合模型。
s9、在完成模型建立后,新收集100個樣本作為驗證集進行預測,并與真實值進行對比驗證。結(jié)果表明,對于蛋白質(zhì),檢測誤差不超過5%,足夠達到檢測需求。
以上所述僅是本發(fā)明的優(yōu)選實施方式,應當指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以作出若干改進和潤飾,例如,將該技術(shù)應用于其它營養(yǎng)成分(如脂肪、碳水化合物、亞油酸、亞麻酸、乳糖等成分)的檢測,這些改進和潤飾也應視為本發(fā)明的保護范圍。