本發(fā)明涉及核輻射探測(cè)技術(shù)領(lǐng)域,特別是一種基于模糊決策樹的復(fù)雜核素識(shí)別方法。
背景技術(shù):
隨著科學(xué)技術(shù)的發(fā)展,核技術(shù)已被廣泛應(yīng)用于工業(yè)、農(nóng)業(yè)等各個(gè)領(lǐng)域。傳統(tǒng)的放射性核素識(shí)別方法是對(duì)放射性核素所放射出的γ能譜進(jìn)行尋峰,通過所尋道址獲取其對(duì)應(yīng)能量,經(jīng)反檢索核素庫(kù)后,即可得到該處峰位對(duì)應(yīng)的核素種類。這種方法在研究初期有很好的適用性,但隨著待檢測(cè)樣品復(fù)雜程度的增加,特別是在放射性核素活度較低時(shí),識(shí)別所需時(shí)間很長(zhǎng),且效果偏差。近年來,人工神經(jīng)網(wǎng)絡(luò)、小波變換等新的數(shù)據(jù)處理技術(shù)不斷得到發(fā)展,這些技術(shù)在譜分析方面的應(yīng)用也受到了關(guān)注。人工神經(jīng)網(wǎng)絡(luò)具有非線性映射、快速并行處理功能,但要求學(xué)習(xí)譜的探測(cè)條件和實(shí)測(cè)時(shí)的探測(cè)條件保持一致,且如要識(shí)別更多核素,則需要大量學(xué)習(xí)樣本?,F(xiàn)有方法均存在一定的局限性,在數(shù)據(jù)分析方面都沒有擺脫傳統(tǒng)γ能譜的概念,對(duì)于復(fù)雜γ能譜的特征屬性提取不夠完備,且大多屬于黑箱算法,模型不透明。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是:針對(duì)上述存在的問題,提供了一種基于模糊決策樹的復(fù)雜核素識(shí)別方法。
本發(fā)明采用的技術(shù)方案如下:一種基于模糊決策樹的復(fù)雜核素識(shí)別方法,具體包括以下過程:
步驟s1:對(duì)放射性核素γ能譜采用時(shí)域最小二乘法進(jìn)行平滑預(yù)處理;
步驟s2:對(duì)處理后的γ能譜采用對(duì)稱零面積變換法進(jìn)行尋峰,提取特征峰位值;
步驟s3:對(duì)處理后的γ能譜采用db5小波基對(duì)混合能譜進(jìn)行5層一維小波變換,提取變換后最大的分波能量值;
步驟s4:整合特征信息即特征峰位值和分波能量值形成樣本庫(kù),基于模糊決策樹方法,在建樹過程中動(dòng)態(tài)地對(duì)特征空間進(jìn)行劃分,構(gòu)造核素識(shí)別分類器,實(shí)現(xiàn)核素的識(shí)別。
進(jìn)一步的,所述步驟s1中,選取核素γ能譜數(shù)據(jù)的第m點(diǎn),并在第m點(diǎn)左右各取k個(gè)數(shù)據(jù),所述m、k均為整數(shù),形成2k+1個(gè)數(shù)據(jù)點(diǎn)的窗口;在所述窗口中用多項(xiàng)式擬合原始譜數(shù)據(jù),多項(xiàng)式在第m點(diǎn)的值就是平滑預(yù)處理后的譜在m點(diǎn)的值;m的值沿能譜數(shù)據(jù)移動(dòng)則獲取整個(gè)平滑后的譜數(shù)據(jù)。
進(jìn)一步的,所述步驟s3中,小波變換將混合能譜分解為低頻信息和高頻信息,分別選取低頻信息和高頻信息中最大的分波能量值。
進(jìn)一步的,所述步驟s4中模糊決策樹方法的具體流程為:(a)輸入樣本庫(kù)中原始數(shù)據(jù)集,根據(jù)原始數(shù)據(jù)集構(gòu)造根節(jié)點(diǎn);(b)判斷根節(jié)點(diǎn)上的數(shù)據(jù)集是否符合葉節(jié)點(diǎn)的條件,如果符合則生成葉子節(jié)點(diǎn)獲取最終的模糊決策樹,如果不符合則到步驟c;(c)計(jì)算當(dāng)前節(jié)點(diǎn)的信息量,使用fcm聚類算法對(duì)當(dāng)前節(jié)點(diǎn)上數(shù)據(jù)集的可用屬性進(jìn)行分類;(d)計(jì)算數(shù)據(jù)集中每個(gè)可用屬性的模糊信息增益,選取最大者作為擴(kuò)展屬性對(duì)數(shù)據(jù)集進(jìn)行分割;(e)根據(jù)所選擴(kuò)展屬性進(jìn)行的模糊分割,將當(dāng)前節(jié)點(diǎn)樣本集映射到相應(yīng)的子模糊集;(f)將所選屬性去活躍;(g)為每個(gè)子模糊集構(gòu)造相應(yīng)的子節(jié)點(diǎn),再返回到步驟b。
與現(xiàn)有技術(shù)相比,采用上述技術(shù)方案的有益效果為:
(1)在特征提取過程中,將新興方法與傳統(tǒng)方法相結(jié)合,即將小波變換的分波能量與放射性核素能譜特征峰相結(jié)合,作為識(shí)別核素的依據(jù)。用小波變換后的分波能量取代傳統(tǒng)方法中核素特征射線的全能峰面積,作為分析和識(shí)別核素種類的特征之一,綜合利用了全譜計(jì)數(shù)來進(jìn)行分析,避免了傳統(tǒng)識(shí)別方法中環(huán)境和儀器噪聲對(duì)能譜影響較大的情況,從一個(gè)新的視角對(duì)能譜特征進(jìn)行提取,提高了核素識(shí)別的可靠性和穩(wěn)定性。
(2)本發(fā)明中涉及到的模糊決策樹算法在其建樹過程中動(dòng)態(tài)地對(duì)特征空間進(jìn)行劃分。這種建樹方式追求每個(gè)結(jié)點(diǎn)處的最優(yōu)劃分,故可以提高決策樹的測(cè)試精度,且相比起現(xiàn)有的核素識(shí)別算法,本發(fā)明所用的模糊決策樹算法擁有透明的模型,靈活地對(duì)特征信息進(jìn)行模糊化,建立合適的決策樹并輸出模糊規(guī)則,能很好地針對(duì)核素識(shí)別問題做出決策。
附圖說明
圖1是本發(fā)明中一種基于模糊決策樹的復(fù)雜核素識(shí)別方法的流程示意圖。
圖2是本發(fā)明中137cs(銫137)、60co(鈷60)及(152eu鈾152)混合源的實(shí)測(cè)γ能譜圖。
圖3是本發(fā)明中137cs(銫137)、60co(鈷60)及(152eu鈾152)混合源的實(shí)測(cè)γ能譜圖進(jìn)行時(shí)域最小二乘法平滑預(yù)處理后的能譜。
圖4是本發(fā)明中平滑預(yù)處理后的能譜使用自刻度對(duì)稱零面積變換法進(jìn)行尋峰的結(jié)果圖。
圖5是本發(fā)明中平滑預(yù)處理后的能譜利用db5小波基對(duì)能譜進(jìn)行5層一維小波分解的低頻(近似)信號(hào)譜圖。
圖6是平滑預(yù)處理后的能譜利用db5小波基對(duì)能譜進(jìn)行5層一維小波分解的高頻(細(xì)節(jié))信號(hào)譜圖。
圖7為本發(fā)明中模糊決策樹方法的具體流程示意圖。
具體實(shí)施方式
下面結(jié)合附圖對(duì)本發(fā)明做進(jìn)一步描述。
本實(shí)施例以放射性核素137cs(銫137)、60co(鈷60)及152eu(鈾152)在強(qiáng)本底情況下的混合γ能譜為例,能譜圖如圖2所示,對(duì)本發(fā)明作進(jìn)一步的闡述,由于混合了三種放射性核素,該混合γ能譜是一種復(fù)雜放射性核素γ能譜。
一種基于模糊決策樹的復(fù)雜核素識(shí)別方法,如圖1所示為所述復(fù)雜核素識(shí)別方法的流程示意圖。
步驟s1:對(duì)137cs(銫137)、60co(鈷60)及152eu(鈾152)混合γ能譜采用時(shí)域最小二乘法進(jìn)行平滑預(yù)處理;
采用時(shí)域最小二乘法時(shí)的基本過程為:選取核素γ能譜數(shù)據(jù)的第m點(diǎn),第m點(diǎn)是能譜數(shù)據(jù)中所有數(shù)據(jù)點(diǎn)中的其中一點(diǎn),并在第m點(diǎn)左右各取k個(gè)數(shù)據(jù),所述m、k均為整數(shù),形成2k+1個(gè)數(shù)據(jù)點(diǎn)的窗口,例如k取3時(shí)即在第m點(diǎn)前后各取3點(diǎn),進(jìn)行7點(diǎn)最小二乘法;在7個(gè)數(shù)據(jù)點(diǎn)的窗口中用多項(xiàng)式擬合原始譜數(shù)據(jù),多項(xiàng)式在第m點(diǎn)的值就是平滑預(yù)處理后的譜在m點(diǎn)的值;m的值沿能譜數(shù)據(jù)移動(dòng)則獲取整個(gè)平滑后的譜數(shù)據(jù),如圖3所示。
步驟s2:對(duì)平滑預(yù)處理后的γ能譜采用對(duì)稱零面積變換法進(jìn)行尋峰,提取特征峰位值;
對(duì)稱零面積變換法是用面積為零的窗函數(shù)與能譜數(shù)據(jù)進(jìn)行卷積變換,并且要求窗函數(shù)為對(duì)稱函數(shù)。對(duì)于線性本底,二階差分為零,只有峰出現(xiàn)時(shí),二階差分才不為零,且為一個(gè)負(fù)的極小值,極小值位置即為特征峰位值。
尋峰的具體過程為:通過計(jì)算得到能譜的對(duì)稱零面積變換譜,結(jié)合下式(1)判定峰的存在,其中,y為原始能譜,
通過改變尋峰閾值,可以調(diào)整尋峰算法對(duì)假峰的容忍度,從而達(dá)到控制尋峰數(shù)量的目的。本實(shí)施例選定尋峰閾值為-0.60,如圖4為使用自刻度對(duì)稱零面積變換法得到的尋峰結(jié)果,能譜中每個(gè)全能峰及附近的輔助峰位均被識(shí)別出來,如圖中豎線標(biāo)示。
步驟s3:對(duì)處理后的γ能譜采用db5小波基對(duì)混合能譜進(jìn)行5層一維小波變換,提取變換后最大的分波能量值;
小波變換將混合能譜分解為低頻信息和高頻信息。低頻信息是變化緩慢的部分,是圖像的框架,也是輪廓,占全部信息的大部分;高頻信息是變化迅速的部分,反映的是圖像的細(xì)節(jié)信息,占全部信息的小部分。
設(shè)hjf為能量有限信號(hào)f∈l2(r)在分辨率2j下的近似,則hjf可以進(jìn)一步分解為f在分辨率2j-1下的近似hj-1f(通過低通濾波器得到),以及位于分辨率2j-1與2j之間的細(xì)節(jié)dj-1f(通過高通濾波器得到)之和,基本分解過程如下式(3)所示:
hjf=hj-1f+dj-1f.....................(3)
圖5為利用db5小波基對(duì)混合能譜進(jìn)行5層一維小波分解低頻(逼近)信號(hào)譜圖,圖6為利用db5小波基對(duì)混合能譜進(jìn)行5層一維小波分解高頻(細(xì)節(jié))信號(hào)譜圖;分別選取低頻信息和高頻信息中最大的分波能量值。
步驟s4:整合特征信息即特征峰位值和分波能量值形成樣本庫(kù),基于模糊決策樹方法,在建樹過程中動(dòng)態(tài)地對(duì)特征空間進(jìn)行劃分,構(gòu)造核素識(shí)別分類器,實(shí)現(xiàn)核素的識(shí)別。
優(yōu)選地,本實(shí)施例的模糊決策樹方法與傳統(tǒng)的模糊決策樹方法不同,區(qū)別在于:本實(shí)施例中,建樹過程中動(dòng)態(tài)地對(duì)特征空間進(jìn)行劃分,而并不是傳統(tǒng)方法中建樹前對(duì)特征空間就進(jìn)行模糊劃分。
如圖7所示,本實(shí)施例模糊決策樹方法的具體流程為:(a)輸入樣本庫(kù)中原始數(shù)據(jù)集,根據(jù)原始數(shù)據(jù)集構(gòu)造根節(jié)點(diǎn);(b)判斷根節(jié)點(diǎn)上的數(shù)據(jù)集是否符合葉節(jié)點(diǎn)的條件,如果符合則生成葉子節(jié)點(diǎn)獲取最終的模糊決策樹,如果不符合則到步驟c;(c)計(jì)算當(dāng)前節(jié)點(diǎn)的信息量,使用fcm聚類算法對(duì)當(dāng)前節(jié)點(diǎn)上數(shù)據(jù)集的可用屬性進(jìn)行分類;(d)計(jì)算數(shù)據(jù)集中每個(gè)可用屬性的模糊信息增益,選取最大者作為擴(kuò)展屬性對(duì)數(shù)據(jù)集進(jìn)行分割;(e)根據(jù)所選擴(kuò)展屬性進(jìn)行的模糊分割,將當(dāng)前節(jié)點(diǎn)樣本集映射到相應(yīng)的子模糊集;(f)將所選屬性去活躍;(g)為每個(gè)子模糊集構(gòu)造相應(yīng)的子節(jié)點(diǎn),再返回到步驟b。本實(shí)施例的建樹方式追求每個(gè)結(jié)點(diǎn)處的最優(yōu)劃分,故可以提高決策樹的測(cè)試精度。
例如,在對(duì)當(dāng)前結(jié)點(diǎn)例如節(jié)點(diǎn)a進(jìn)行劃分時(shí),分別對(duì)結(jié)點(diǎn)內(nèi)樣本的每一個(gè)可用屬性值進(jìn)行模糊c均值聚類(fcm)劃分,且計(jì)算出此種劃分的信息增益值,模糊信息增益為信息量的差值。信息增益是每一個(gè)決策結(jié)點(diǎn)選取最佳決策屬性的度量標(biāo)準(zhǔn),信息增益越大,說明采用該屬性進(jìn)行篩選后,信息熵變得越小,樣本集合純度更高。屬性v相對(duì)于當(dāng)前結(jié)點(diǎn)a樣本集s的信息增益gain(s,v)定義為:
其中sv是樣本集s中進(jìn)行模糊聚類后屬性值為v的子集。式子的第一項(xiàng)entropy(s)就是當(dāng)前結(jié)點(diǎn)a樣本集s的熵,第二項(xiàng)
本發(fā)明并不局限于前述的具體實(shí)施方式。本發(fā)明擴(kuò)展到任何在本說明書中披露的新特征或任何新的組合,以及披露的任一新的方法或過程的步驟或任何新的組合。如果本領(lǐng)域技術(shù)人員,在不脫離本發(fā)明的精神所做的非實(shí)質(zhì)性改變或改進(jìn),都應(yīng)該屬于本發(fā)明權(quán)利要求保護(hù)的范圍。