專利名稱:基于遺傳神經(jīng)網(wǎng)絡(luò)的激光誘導擊穿光譜定量分析方法
技術(shù)領(lǐng)域:
本發(fā)明屬于激光誘導擊穿光譜的定量分析方法,具體涉及一種基于遺傳神經(jīng)網(wǎng)絡(luò) 的激光誘導擊穿光譜定量分析方法。
背景技術(shù):
激光誘導擊穿光譜技術(shù)(LaserInduced Breakdown Spectroscopy,簡稱 LIBS), 作為原子發(fā)射光譜的一種,是近些年逐漸興起的一種光譜檢測技術(shù)。LIBS利用高強度脈沖 激光激發(fā)樣品產(chǎn)生等離子體,通過光譜儀獲取原子和離子發(fā)射譜線并進行分析,并由分析 線的位置及信號強度來鑒定物質(zhì)的存在和進行定量分析。LIBS技術(shù)具有無需復雜的樣品預 處理、操作快捷、能同時對多種元素進行分析等特點,非常適合于氣體、液體、固體物質(zhì)中元 素成分的實時檢測,近年來發(fā)展迅速,在生物醫(yī)學研究、軍事安全、宇宙開發(fā)、工業(yè)加工、環(huán) 境污染檢測等諸多領(lǐng)域都得到了廣泛應用。隨著工業(yè)、城市污染的加劇和農(nóng)用化學物質(zhì)種類、數(shù)量的增加,重金屬污染日益嚴 重。目前,全世界平均每年排放Hg約1.5萬噸,Cu 340萬噸,Pb 500萬噸,Mn 1500萬噸, Ni 100萬噸。重金屬污染具有污染物移動性差、滯留時間長、不能被微生物降解的特點,并 可經(jīng)水、植物等介質(zhì)最終影響人類健康。近20年來,國際上已開展了采用LIBS技術(shù)進行重 金屬污染檢測的研究工作,并取得了一定的成果。然而,激光誘導產(chǎn)生等離子體是一個非常 復雜的過程,容易受激光能量,光譜儀的觸發(fā)時間(延遲時間),檢測環(huán)境,實驗樣品準備、 樣品的基體效應和數(shù)據(jù)采集方式等諸多因素的影響,繼而影響其定量化分析的準確度。LIBS定量分析最為普遍使用的方法是建立在標準濃度和成分分析線強度之間對 應關(guān)系上的定標曲線法,基于絕對強度的外標法和強度比的內(nèi)標法已被很多研究者用于成 分定量檢測,并取得了一定的成就。然而受到基體效應和自吸收效應的制約,難以得到令人 滿意的結(jié)果。神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,簡稱ANN)由于強大的分類和預測能 力,近年來國外LIBS研究者逐漸將其應用到LIBS定量分析中,已有采用反向傳播(Back Propagation,簡稱BP) ANN結(jié)合LIBS技術(shù)定量分析Cu、Mn、Fe等元素的報道。研究表明ANN 方法能減弱基體效應對定量分析的影響,從而有效地提高了 LIBS的檢測準確度。BP算法的 核心是通過一邊向后傳播誤差、一邊修正誤差的方法來不斷調(diào)節(jié)網(wǎng)絡(luò)參數(shù)(權(quán)值、閾值), 以實現(xiàn)或逼近所希望的輸入輸出映射關(guān)系。BP-ANN能夠根據(jù)網(wǎng)絡(luò)的實際輸出與期望輸出之 間的最小均方差值,通過誤差的反向傳播,利用梯度下降法迭代調(diào)整神經(jīng)元之間的權(quán)值與 閾值,直至收斂于較小的均方差。它的訓練預測結(jié)果常依賴于權(quán)值和閾值的設(shè)置。BP算法 通過梯度下降法在權(quán)值和閾值空間中尋找問題的最優(yōu)解,故收斂速度慢且易陷入局部極小 值。另外,不同的初始權(quán)值設(shè)置可能會對收斂性、泛化誤差造成較大的差異,而神經(jīng)網(wǎng)絡(luò)的 初始連接權(quán)值和閾值的選擇缺乏理論依據(jù),具有很大的隨機性,很難選擇具有全局性的初 始點。因而用BP神經(jīng)網(wǎng)絡(luò)求得全局最優(yōu)的可能性較小,限制它的作用。
發(fā)明內(nèi)容
針對現(xiàn)有元素含量分析方法的不足,我們提出基于激光誘導擊穿光譜和遺傳神經(jīng) 網(wǎng)絡(luò)的元素定量檢測技術(shù),用ANN結(jié)合遺傳算法(Genetic Algorithm,簡稱GA)分析LIBS 光譜數(shù)據(jù)以實現(xiàn)元素的定量檢測。較之采用傳統(tǒng)的LIBS內(nèi)定標法和BP-ANN法,該方法具 有受基體效應的影響小、簡單快捷、避免局部收斂、定量檢測的可靠性高等優(yōu)點。經(jīng)檢索,目 前還未見采用遺傳神經(jīng)網(wǎng)絡(luò)方法結(jié)合LIBS技術(shù)對元素進行定量分析的研究報道。本發(fā)明基于遺傳神經(jīng)網(wǎng)絡(luò)的激光誘導擊穿光譜定量分析方法,其特征在于包括以 下步驟被測物的LIBS光譜數(shù)據(jù)的采集和預處理經(jīng)預處理后的有效光譜數(shù)據(jù)按樣品分 為訓練集樣本和預測集樣本;遺傳神經(jīng)網(wǎng)絡(luò)的訓練訓練集樣本被測成分的有效光譜數(shù)據(jù)矩陣作為定量分析模 型的輸入;訓練集樣本被測成分的標準濃度矩陣作為標準輸出;采用三層BP-ANN網(wǎng)絡(luò)建立 定量分析模型,包括輸入層、輸出層和隱層,BP-ANN網(wǎng)絡(luò)的初始權(quán)值和閾值通過遺傳算法進 行優(yōu)化,得到一個最優(yōu)化的初始個體,作為BP-ANN網(wǎng)絡(luò)的初始權(quán)值和閾值;再經(jīng)BP-ANN細 化訓練,進行精確求解,當訓練集樣本被測成分的求解濃度和標準濃度的誤差平方和達到 預設(shè)的目標誤差時,訓練結(jié)束,得到GA-BP-ANN定量分析模型;被測成分的定量分析用訓練好的GA-BP-ANN定量分析模型對未知被測成分含量 的預測集樣本進行分析,將預測集樣本光譜數(shù)據(jù)矩陣輸入GA-BP-ANN定量分析模型進行分 析預測,得到被測成分的濃度含量。所述被測物的LIBS光譜數(shù)據(jù)預處理包括對原始光譜數(shù)據(jù)進行求平均、強度歸一 化、尋峰、扣背景、譜線去干擾擬合,形成完整的譜峰輪廓后,對譜峰強度進行采點并保存為 一個數(shù)據(jù)矩陣,作為被測成分的有效光譜數(shù)據(jù)。所述遺傳算法對BP-ANN網(wǎng)絡(luò)的優(yōu)化過程,其步驟為a)用遺傳算法對BP-ANN權(quán)值、閾值的解空間進行實數(shù)編碼,隨機產(chǎn)生一個初始的 群體,b)根據(jù)以下適應度函數(shù)計算步驟a)初始群體中每個個體的適應度函數(shù)值其中t是期望值,對應訓練樣本被測成分的真實含量,y是BP-ANN網(wǎng)絡(luò)的輸出值, 對應預測含量,q是訓練集樣本數(shù),c)判斷步驟b)中獲得的適應度函數(shù)值是否滿足以下預設(shè)條件該適應度函數(shù)值 達到預設(shè)的目標適應度函數(shù)值,如滿足,結(jié)束優(yōu)化過程;如不滿足,則進入下一代優(yōu)化,對該編碼的權(quán)值和閾值個體進行選擇、交叉和變異 操作后返回至步驟b)。所述訓練集樣本被測成分的有效光譜數(shù)據(jù)為被測成分的單一譜線的數(shù)據(jù)矩陣。所述輸入的訓練集樣本被測成分的有效光譜數(shù)據(jù)和輸出的訓練集樣本被測成分 的標準濃度分別進行如下歸一化處理
4,_ x-ax =T--,、
b-a(2)其中,χ為原始數(shù)據(jù),χ'為歸一化后的數(shù)據(jù),a為χ的最小值,b為χ的最大值。所述被測成分的定量分析過程中,將預測集樣本光譜數(shù)據(jù)矩陣按公式(2)進行歸 一化后輸入GA-BP-ANN定量分析模型,得到歸一化的濃度值,對此濃度值進行反歸一化,得 到被測物對應的被測成分濃度。本發(fā)明更詳細的描述如下BP神經(jīng)網(wǎng)絡(luò)的原理和結(jié)構(gòu)如圖1所示,通過神經(jīng)元,輸入量Xi與權(quán)值Wi相乘對 其求和,并與一個給定的閾值b相減,將差值通過傳遞函數(shù)f轉(zhuǎn)換得到輸出η。各層之間的 神經(jīng)元通過權(quán)值相互連接構(gòu)成一個網(wǎng)絡(luò),權(quán)值和閾值代表著網(wǎng)絡(luò)所包含的信息。三層神經(jīng) 網(wǎng)絡(luò)包含輸入層、輸出層和一個隱層,輸入層的節(jié)點對應輸入變量,即光譜數(shù)據(jù),輸出層的 節(jié)點對應預測變量,即元素濃度,在輸入層和輸出層之間是隱層,隱層中節(jié)點的個數(shù)決定了 神經(jīng)網(wǎng)絡(luò)的復雜程度。網(wǎng)絡(luò)將輸入的光譜訓練數(shù)據(jù)進行處理,得到相應的輸出濃度值并與 真實濃度值作比較得到誤差,將誤差反饋給網(wǎng)絡(luò)使其調(diào)整權(quán)值和閾值以實現(xiàn)降低誤差的目 的,當達到預設(shè)的目標誤差EBP時,訓練結(jié)束。BP-ANN是基于梯度下降的誤差反向傳播算法進行學習的,在網(wǎng)絡(luò)的設(shè)計過程中, 往往要經(jīng)過反復的訓練和試湊,雖然能保證網(wǎng)絡(luò)學習過程最終收斂,但無法保證每次訓練 時BP算法的收斂性和全局最優(yōu)性,因而在實際應用中,BP算法存在明顯的局限性。首先, 通過梯度下降法在權(quán)空間中尋找問題的最優(yōu)解,故極易陷入局部極小值。另外,神經(jīng)網(wǎng)絡(luò)初 始連接權(quán)值及閾值的選擇缺乏理論依據(jù),具有很大的隨機性,難以控制其具有全局性的初 始解。為了克服BP網(wǎng)絡(luò)的缺陷,人們提出了在BP算法上加入動量因子、調(diào)整學習速率、 使用其它梯度優(yōu)化算法、改變目標函數(shù)或激勵函數(shù)、對樣本進行預處理等改進方法。這些算 法都能不同程度地提高算法的收斂速度,但它們都是基于梯度算法的,共同弱點仍然是無 法避免網(wǎng)絡(luò)陷于局部極值。正是由于改進的BP算法不能從根本上克服陷于局部極值的缺 陷,使得其訓練效果未必優(yōu)于標準BP算法。因此,有必要尋求一種具有全局優(yōu)化功能的算 法對神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值進行優(yōu)化。遺傳算法(GA)是一種以自然選擇和遺傳理論為基礎(chǔ),將生物進化過程中適者生 存原則與群體內(nèi)部染色體的隨機信息交換機制相結(jié)合產(chǎn)生的全局尋優(yōu)搜索算法,該算法從 許多點開始搜索,因而可以防止收斂于局部最優(yōu)解,并且容易找到全局最優(yōu)解或性能很好 的次優(yōu)解。本發(fā)明將GA與BP-ANN相結(jié)合,先用GA對網(wǎng)絡(luò)權(quán)值和閾值進行全局搜索,保證其 落入全局最優(yōu)點的鄰域,再利用基于梯度法的BP-ANN進行精確求解以進一步減小誤差,使 其收斂于全局最優(yōu)解或性能很好的近似最優(yōu)解。這樣,可以達到全局尋優(yōu)和快速高效的目 的,最終得到最優(yōu)化的網(wǎng)絡(luò)模型。GA-BP-ANN模型的具體優(yōu)化流程如圖2所示。在GA優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值的過程中,首先由GA對BP網(wǎng)絡(luò)權(quán)值、閾 值的解空間進行實數(shù)編碼,隨機產(chǎn)生一個初始的群體。然后,調(diào)用BP-ANN對群體中的每個 個體進行適應度評價,GA在進化搜索過程中是以適應度函數(shù)為依據(jù)的,故適應度函數(shù)的選 擇直接影響到GA的收斂速度以及能否找到最優(yōu)解。本發(fā)明采用的適應度函數(shù)表示為
5[0032/ 其中t是期望值,對應訓練樣本成分的真實含量。y是網(wǎng)絡(luò)的輸出值,對應預測含 量。q是訓練集樣本數(shù)。適應度函數(shù)值為訓練集誤差平方和的倒數(shù),本專利的最優(yōu)化問題是 求適應度函數(shù)的最大值,且為正值。在優(yōu)化過程中,根據(jù)個體的適應度值,GA對群體中的個 體進行選擇、交叉、變異等操作。按照這樣的進化原則,逐代進化,使得訓練集誤差平方和不 斷減小,適應度函數(shù)值不斷增大。當適應度函數(shù)值達到目標適應度值feA時,遺傳算法進化 結(jié)束,得到最佳個體,從而獲得權(quán)值和閾值的最優(yōu)解,并將其作為BP-ANN的初始權(quán)值和閾 值細化訓練網(wǎng)絡(luò),進行精確求解。如上所述,本發(fā)明采用GA優(yōu)化BP-ANN的初始權(quán)值和閾值,建立GA_BP_ANN,并結(jié)合 LIBS技術(shù)對待測成分進行定量分析?;诩す庹T導擊穿光譜和遺傳神經(jīng)網(wǎng)絡(luò)的成分定量檢測技術(shù)的流程如圖3所示, 具體分析步驟如下1、采集被測物的LIBS光譜數(shù)據(jù),對原始光譜數(shù)據(jù)進行求平均、強度歸一化、尋峰、 扣背景、譜線去干擾擬合等常規(guī)光譜數(shù)據(jù)處理,在確定擬合后的譜峰輪廓完整的基礎(chǔ)上對 譜峰強度進行采點并保存為一個數(shù)據(jù)矩陣,作為被測目標成分的有效光譜數(shù)據(jù)。將樣本有 效光譜數(shù)據(jù)分為訓練集樣本和預測集樣本,各取總樣本數(shù)的2/3和1/3,其中訓練集樣本的 被測成分濃度含量用理化方法測定,用于ANN網(wǎng)絡(luò)建模;預測集樣本的被測成分濃度含量 未知,通過所建模型進行預測。將采集的每個樣品的50個原始數(shù)據(jù)點分別進行求平均,得到的數(shù)據(jù)采用七點法 尋峰,當中間點數(shù)據(jù)依次大于左右三個點的數(shù)據(jù),認為這七個點組成一個峰。而有些峰是由 五個點組成的,再結(jié)合五點法尋峰,找到七點法漏掉的峰。為了克服系統(tǒng)參數(shù)及光譜儀響應 率的影響采用譜線強度歸一化處理。選取在各樣品中含量基本相等的成分作為參考成分, 挑選該成分一條靈敏線作為參考譜線,求出目標成分的譜線強度與該參考譜線強度的比 值。使用扣背景技術(shù)扣除由于韌致輻射等原因產(chǎn)生的連續(xù)背景,得到真實的信號強度。采 用遺傳算法結(jié)合洛倫茲線型函數(shù)對譜線輪廓進行擬合,能得到完整的譜峰輪廓,同時對有 干擾的峰完成去干擾功能,因此可避免不同成分間及待測目標成分不同譜線間的交叉干擾 影響。最后,在保證整個目標成分分析譜線輪廓完整的前提下,在分析譜線左右平均各取10 個點,這21個點的強度值和峰值強度組成一個數(shù)據(jù)矩陣。在網(wǎng)絡(luò)輸入層神經(jīng)元數(shù)據(jù)的選取過程中,本發(fā)明研究發(fā)現(xiàn)用目標成分的多條靈敏 線作為神經(jīng)網(wǎng)絡(luò)輸入得到的定量分析模型的預測能力比采用單一譜線強度作為神經(jīng)網(wǎng)絡(luò) 輸入差,因此,本發(fā)明采用目標成分的單一譜線的21個數(shù)據(jù)點作為神經(jīng)網(wǎng)絡(luò)輸入矩陣來進 行定量分析。2、取訓練集樣本被測成分標準濃度與參考成分濃度的比值作為最終的標準濃度。 將通過步驟1得到訓練集樣本被測目標成分的有效光譜數(shù)據(jù)作為定量分析模型的輸入,訓 練集樣本的濃度比值矩陣作為標準輸出,采用三層BP-ANN建立定量分析模型,包括輸入 層、輸出層和隱層。隱層神經(jīng)元數(shù)目的選取很重要,數(shù)目太少,網(wǎng)絡(luò)結(jié)果過于簡單,仿真精度 差;數(shù)目太多,會產(chǎn)生過擬合,導致預測結(jié)果不精確。本發(fā)明從預測精確度來考慮,經(jīng)初步 的優(yōu)化訓練,最后確定隱層神經(jīng)元數(shù)目。輸入層與隱層、隱層與輸出層之間的傳遞函數(shù)都采
6用Iogsig函數(shù),訓練/學習函數(shù)選用增加動量項且自適應調(diào)整學習率的函數(shù)。網(wǎng)絡(luò)的初始 權(quán)值和閾值通過GA來優(yōu)化,得到一個最優(yōu)化的初始個體。最后用ANN對訓練集進行細化訓 練,得到最終的GA-BP-ANN網(wǎng)絡(luò)模型。將LIBS數(shù)據(jù)與BP-ANN結(jié)合建立模型,用上述求平均、強度歸一化、扣背景、尋峰、 去干擾、譜峰強度采樣等程序處理過的訓練集樣本的被測目標成分的有效LIBS光譜數(shù)據(jù) 作為定量分析模型的輸入,用理化方法測得的訓練集樣本被測成分濃度與參考成分的濃度 比值矩陣作為定量分析模型的標準輸出。為了避免由于輸入的大幅度變化而導致網(wǎng)絡(luò)輸出 的不穩(wěn)定性,將輸入的有效光譜數(shù)據(jù)和輸出的訓練集樣本被測成分標準濃度分別歸一化在 O到1的范圍內(nèi)。具體歸一化處理如下式
, χ-ax =T~
b - a這里,χ為原始數(shù)據(jù),χ'為歸一化后的數(shù)據(jù),a、b分別為χ的最小值和最大值。據(jù) 經(jīng)驗,隱層神經(jīng)元數(shù)目在0. 5m 3m的范圍內(nèi),其中m為輸入層神經(jīng)元數(shù)目。本發(fā)明的輸入 層神經(jīng)元數(shù)目為21,因此隱層神經(jīng)元數(shù)目為10 63。確定大致范圍后,利用逐步增長法 進行試算,開始用很少的隱層神經(jīng)元數(shù)進行網(wǎng)絡(luò)訓練和驗證,然后不斷增加神經(jīng)元數(shù),并比 較不同神經(jīng)元個數(shù)下網(wǎng)絡(luò)驗證的平均相對誤差值(MRE)。本專利中,選取的每個節(jié)點數(shù)分別 測試了 30次,最后分別取30次測試的MRE值進行比較,選擇最小的MRE值對應的個數(shù)為最 佳隱層神經(jīng)元個數(shù)。BP-ANN的初始權(quán)值和閾值通過GA進行全局搜索,保證其落入全局最優(yōu)點的鄰域, 再利用BP-ANN進行精確求解以進一步減小誤差,使其收斂于全局最優(yōu)解或性能很好的近 似最優(yōu)解,提高網(wǎng)絡(luò)的泛化能力。3、用訓練好的GA-BP-ANN對未知成分含量的預測集樣本進行分析,將預測集樣本 光譜數(shù)據(jù)矩陣輸入GA-BP-ANN網(wǎng)絡(luò)模型進行分析預測,得到被測成分的濃度含量。利用未知被測成分含量的預測集樣本對訓練好的GA-BP-ANN進行測試,將預測集 樣本光譜數(shù)據(jù)矩陣按訓練集輸入的歸一化方案進行歸一化并輸入GA-BP-ANN定量分析模 型,得到歸一化的濃度值,對此濃度值進行反歸一化,得到預測樣本LIBS光譜數(shù)據(jù)矩陣對 應的被測成分濃度。最后采用相關(guān)系數(shù)(R)和平均相對誤差來評價預測的精確度及判斷所 建模型的效果。在實際的LIBS技術(shù)在線檢測中,待測樣品目標成分濃度未知,如果用ANN方法定 量檢測,極有可能因為BP-ANN初始權(quán)值和閾值的不合適而造成所建定標模型效果不好、預 測的精確度差等問題。因此,使用GA-BP-ANN,可以保證被測樣品目標成分檢測的可靠性,對 于重金屬等成分的高精確度定量分析有重要的現(xiàn)實意義。
圖1為神經(jīng)網(wǎng)絡(luò)原理及結(jié)構(gòu)2為GA-BP-ANN優(yōu)化模型圖3為基于LIBS和GA_BP_ANN的成分定量分析流程4為Ba元素LIBS光譜圖 圖5為GA-BP-ANN定量分析結(jié)果與標準濃度的比較圖
具體實施例方式以下呈現(xiàn)的是本發(fā)明的一個應用實例,這里結(jié)合附圖和實例對本發(fā)明作進一步解 釋,但本發(fā)明不限于此例。本實例采用LIBS系統(tǒng)獲取樣本光譜數(shù)據(jù),系統(tǒng)主要由調(diào)Q脈沖Nd: YAG激光器,光 纖光譜儀,快速光電二極管,二維精密移動平臺和計算機等組成。激光光源為退壓式Nd: YAG 調(diào)Q脈沖激光器,基頻光波長1064nm,脈寬為10ns,光束直徑為6mm,單脈沖激光能量在 20-300mJ范圍內(nèi)可調(diào)。多通道快觸發(fā)型小型光纖光譜儀(Avantes公司)由C⑶探測器、 小型光纖光柵、數(shù)字脈沖延遲發(fā)生器、信號采集系統(tǒng)和相關(guān)軟件組成。線陣CCD探測器共有 4096個像素組成。光譜儀的光譜范圍為200nm 500nm,采樣間隔為0. lnm。本實例采用的樣品是國家標準物質(zhì)土壤樣品GBW07406,GBW07419, GBW07421, GBW07429,以及用這些標準樣品按一定比例配置而成共14個樣品。將其中的9個樣品劃分 為訓練集,另外5個劃分為預測集_,#11,#12, #13, #14)。將4g的土壤樣品放入去離 子水清洗過的塑料環(huán)中,用8. 0噸/厘米2的壓力制成直徑約33mm,厚約2. 5mm的圓片狀樣 品,供實驗使用。將土壤樣品固定在二維精密移動平臺上,保證了每次轟擊時靶點的相對穩(wěn) 定,有利于光譜信號的穩(wěn)定。對土壤樣品連續(xù)轟擊50次,將所得的數(shù)據(jù)送入電腦進行分析。對采集到的原始光譜數(shù)據(jù)進行求平均、強度歸一化、扣背景、尋峰、譜線擬合、譜峰 強度采樣等常規(guī)光譜處理獲得有效光譜數(shù)據(jù),以Ba元素為例,預處理后的光譜如圖4所示。 采用前面提到的網(wǎng)絡(luò)結(jié)構(gòu),本實例對土壤中的元素Ba、M、Cr分別建立了定量分析模型,各 樣品中三種元素的含量如表1所示。取無譜線干擾的Ba II 455. 40nm、Ni I 349. 30nm、Cr I 425. 43nm這三條譜線作為分析線,并利用Si I 478. 30nm譜線對Ba和Cr的兩條譜線強 度進行歸一化,用Si 1302. 16nm譜線對Ni譜線強度進行歸一化。采用三層BP-ANN模型,輸 入層與隱層、隱層與輸出層之間的傳遞函數(shù)都用Iogsig函數(shù)。在保證整個譜線輪廓完整的 前提下,在訓練集分析譜線左右平均各取10個采樣點,這21個點的強度和峰值強度組成一 個數(shù)據(jù)矩陣,將此數(shù)據(jù)矩陣和訓練集樣本被測成分標準濃度矩陣分別進行歸一化,并作為 ANN的21個神經(jīng)元的輸入矢量和標準輸出,對網(wǎng)絡(luò)進行訓練。輸出層神經(jīng)元個數(shù)為1,輸出 結(jié)果即為所預測成分濃度。通過元素含量的預測精確度情況與隱層神經(jīng)元的個數(shù)之間的關(guān) 系,最終確定三個元素分別建立的分析模型的隱層神經(jīng)元個數(shù)均為25。BP-ANN的初始權(quán)值 和閾值通過GA算法進行優(yōu)化。最大迭代次數(shù)取4000次,學習速率為0.01。GA算法的初始 種群數(shù)取100,總進化代數(shù)取100,兩條染色體上基因的交換概率是80 %,變異概率是20 %, 得到優(yōu)化的個體。將此優(yōu)化個體作為ANN的初始參數(shù)再進行訓練,訓練結(jié)束時的網(wǎng)絡(luò)模型 即為最終分析模型。采用經(jīng)上述方法優(yōu)化后的網(wǎng)絡(luò)模型對預測集土壤樣品中元素Ba、Ni、Cr進行定量 檢測,GA-BP-ANN方法預測得到Ba、Ni、Cr的濃度與標準濃度如圖5所示,直線代表元素歸 一化后的標準濃度,三種符號分別表示三種元素的預測含量。為了進一步驗證我們提出方 法的有效性,采用內(nèi)定標和ANN方法(與GA-BP-ANN方法具有相同的結(jié)構(gòu))分別對樣品中 三種元素的濃度進行檢測,并將這兩種方法得到的定量分析結(jié)果與GA-BP-ANN預測結(jié)果作 了比較,如表2所示。表3是用三種方法檢測預測集樣品得到預測濃度與標準濃度值之間 的平均相對誤差和相關(guān)系數(shù)。從圖5、表2和表3的結(jié)果表明GA-BP-ANN方法具有相對誤 差小、預測相關(guān)性比ANN方法和內(nèi)定標方法好、定量分析可靠性強等優(yōu)點。因此,GA-BP-ANN
8結(jié)合LIBS技術(shù)可對元素進行較好的定量檢測。理論上,訓練集樣品個數(shù)越多建立的定標模型分析能力越強。然而,近兩年國外研 究者的成果表明,在一定程度上較少的已知樣品也能取得較好的結(jié)果。在本實例中,我們采 用9個樣品作為訓練集樣品,也取得了較為滿意的預測結(jié)果。然而,若增加用于訓練和預測 的樣品數(shù)目,往往能得到更加穩(wěn)定可靠的定量分析模型。我們提出了基于激光誘導擊穿光譜和遺傳神經(jīng)網(wǎng)絡(luò)的重金屬定量檢測技術(shù)。本發(fā) 明采用GA算法對建模所用BP-ANN進行優(yōu)化,提高了 BP-ANN獲得全局最優(yōu)的初始個體的可 能性,進一步確保了網(wǎng)絡(luò)得到良好的預測結(jié)果。相比其它定量分析方法,本發(fā)明在LIBS技 術(shù)在線檢測中具有使用簡單、快捷、定量化可靠性程度強等優(yōu)點,有巨大的應用潛力。該技 術(shù)在土壤、工業(yè)污水和廢氣、食品、化妝品等重金屬含量實時檢測中具有重要的應用價值, 同時,本發(fā)明豐富了 LIBS微量或痕量元素檢測分析的方法,為LIBS定量檢測技術(shù)實用化奠 定了基石出。表1. Ba、Ni、Cr 的濃度(μ g.樣品 表2. GA-BP-ANN、BP-ANN和內(nèi)定標方法的預測結(jié)果
權(quán)利要求
基于遺傳神經(jīng)網(wǎng)絡(luò)的激光誘導擊穿光譜定量分析方法,其特征在于包括以下步驟1)被測物的LIBS光譜數(shù)據(jù)的采集和預處理經(jīng)預處理后的有效光譜數(shù)據(jù)按樣品分為訓練集樣本和預測集樣本;2)遺傳神經(jīng)網(wǎng)絡(luò)的訓練訓練集樣本被測成分的有效光譜數(shù)據(jù)矩陣作為定量分析模型的輸入;訓練集樣本被測成分的已知濃度矩陣作為標準輸出;采用三層BP ANN網(wǎng)絡(luò)建立定量分析模型,包括輸入層、輸出層和隱層,BP ANN網(wǎng)絡(luò)的初始權(quán)值和閾值通過遺傳算法進行優(yōu)化,得到一個最優(yōu)化的初始個體,作為BP ANN網(wǎng)絡(luò)的初始權(quán)值和閾值;再經(jīng)BP ANN細化訓練,進行精確求解,當訓練集樣本被測成分的求解濃度和標準濃度的誤差平方和達到預設(shè)的目標誤差時,訓練結(jié)束,得到GA BP ANN定量分析模型;3)被測成分的定量分析用訓練好的GA BP ANN定量分析模型對未知被測成分含量的預測集樣本進行分析,將預測集樣本光譜數(shù)據(jù)矩陣輸入GA BP ANN定量分析模型進行分析預測,得到被測成分的濃度含量。
2.根據(jù)權(quán)利要求1所述的光譜定量分析方法,其特征在于所述被測物的LIBS光譜數(shù)據(jù) 預處理包括對原始光譜數(shù)據(jù)進行求平均、強度歸一化、尋峰、扣背景、譜線去干擾擬合,形成 完整的譜峰輪廓后,對譜峰強度進行采點并保存為一個數(shù)據(jù)矩陣,作為被測成分的有效光 譜數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的光譜定量分析方法,其特征在于所述遺傳算法對BP-ANN網(wǎng)絡(luò) 的優(yōu)化過程,其步驟為a)用遺傳算法對BP-ANN權(quán)值、閾值的解空間進行實數(shù)編碼,隨機產(chǎn)生一個初始的群體,b)根據(jù)以下適應度函數(shù)計算步驟a)初始群體中每個個體的適應度函數(shù)值 其中t是期望值,對應訓練樣本被測成分的真實含量,y是BP-ANN網(wǎng)絡(luò)的輸出值,對應 預測含量,q是訓練集樣本數(shù),c)判斷步驟b)中獲得的適應度函數(shù)值是否滿足以下預設(shè)條 件該適應度函數(shù)值達到預設(shè)的目標適應度函數(shù)值,如滿足,結(jié)束優(yōu)化過程;如不滿足,則進入下一代優(yōu)化,對該編碼的權(quán)值和閾值個體進行選擇、交叉和變異操作 后返回至步驟b)。
4.根據(jù)權(quán)利要求1所述的光譜定量分析方法,其特征在于所述訓練集樣本被測成分的 有效光譜數(shù)據(jù)為被測成分的單一譜線的數(shù)據(jù)矩陣。
5.根據(jù)權(quán)利要求1所述的光譜定量分析方法,其特征在于所述輸入的訓練集樣本被 測成分的有效光譜數(shù)據(jù)和輸出的訓練集樣本被測成分的已知濃度分別進行如下歸一化處 理 其中,X為原始數(shù)據(jù),X'為歸一化后的數(shù)據(jù),a為χ的最小值,b為χ的最大值。
6.根據(jù)權(quán)利要求5所述的光譜定量分析方法,其特征在于所述被測成分的定量分析過 程中,將預測集樣本光譜數(shù)據(jù)矩陣按公式(2)進行歸一化后輸入GA-BP ANN定量分析模型, 得到歸一化的濃度值,對此濃度值進行反歸一化,得到被測物對應的被測成分濃度。
全文摘要
本發(fā)明屬于激光誘導擊穿光譜的定量分析方法,具體涉及一種基于遺傳神經(jīng)網(wǎng)絡(luò)的激光誘導擊穿光譜定量分析方法?;诩す庹T導擊穿光譜和遺傳神經(jīng)網(wǎng)絡(luò)的元素定量檢測技術(shù),用ANN結(jié)合遺傳算法(Genetic Algorithm,簡稱GA)分析LIBS光譜數(shù)據(jù)以實現(xiàn)元素的定量檢測。較之采用傳統(tǒng)的LIBS內(nèi)定標法和BP-ANN法,該方法具有受基體效應的影響小、簡單快捷、避免局部收斂、定量檢測的可靠性高等優(yōu)點。
文檔編號G06N3/08GK101915753SQ20101024084
公開日2010年12月15日 申請日期2010年7月30日 優(yōu)先權(quán)日2010年7月30日
發(fā)明者周衛(wèi)東, 沈沁梅 申請人:浙江師范大學