本發(fā)明涉及水下目標識別領域,尤其是一種基于imf能量熵與pca的水下船艦噪聲特征提取方法。
背景技術:
目前,我國對海洋資源的需求不斷增加,開發(fā)和利用規(guī)模不斷加大。水下目標識別技術也迅速發(fā)展,并應用到了諸多方面,如魚類探測、海洋生物研究以及水下潛艇的探測等。水下目標識別對于生物保護以及加強海洋防御安全有重要作用,對于海洋開發(fā)利用和可持續(xù)發(fā)展具有重要意義。而水下船艦噪聲信號的識別與分類是水下目標識別分類的重點及難點,主要通過船艦的發(fā)動機噪聲來判斷船艦的類別。在復雜的海洋環(huán)境中,船艦等水聲目標信號輻射噪聲的產(chǎn)生機理十分復雜,成分多樣。同時由于水聲信道的復雜多變以及水聲信號傳播的多途效應,使水聲信號往往呈現(xiàn)非高斯、非平穩(wěn)、非線性的“三非”性質。而傳統(tǒng)的方法都是基于信號和噪聲是平穩(wěn)和高斯隨機過程這一假設的,隨著水聲目標減振降噪性能的提高,基于fourier變換的傳統(tǒng)信號處理方法很難精確的提取水下輻射噪聲的特征。且傳統(tǒng)方法提取到的特征向量數(shù)據(jù)量大,容易造成維數(shù)災,在分類器中極易造成過擬合現(xiàn)象,降低分類精度。因此提取完備的特征信息,降低數(shù)據(jù)維度成為水聲信號特征提取及分類的關鍵。
技術實現(xiàn)要素:
本發(fā)明目的在于提供一種精確提取噪聲信號特征、減少運算量、提高分類精度的基于imf能量熵與pca的水下船艦噪聲特征提取方法。
為實現(xiàn)上述目的,采用了以下技術方案:本發(fā)明所述方法包括以下步驟:
步驟1,提取船艦噪聲信號均值、方差、峰值、偏度時域特征參數(shù),作為時域特征向量,構成時域特征矩陣;
步驟2,采用emd改進的eemd方法,將原船艦噪聲信號分解,得到imf分量,并將imf分量轉化為能量特征向量,從而觀測自頻帶能量特征的變化,構成頻域特征向量,與步驟1中的時域特征向量共同構成特征矩陣a;
步驟3,利用pca降維方法對特征矩陣a做降維處理,將高維度的特征矩陣映射到低維度作為新的特征,且盡可能的代表原特征,構成特征矩陣b;
步驟4,訓練lssvm(最小二乘支持向量機)參數(shù),根據(jù)風險最小化原則,調整參數(shù)γ和核寬度σ,最后將降維后的特征矩陣b向量輸入到分類器中,測驗分類結果,并與未降維的特征矩陣分類結果進行對比。
進一步的,步驟2中,所述emd方法為經(jīng)驗模態(tài)分解,可以將動態(tài)信號的本征模態(tài)分量(imf)提取出來;所述eemd方法是在emd方法的基礎上給信號加入極小幅度白噪聲,利用白噪聲頻譜均衡分布的特點來均衡信號的中斷區(qū)域,從而去除模式混淆;所述eemd方法提取的imf分量的能量熵構成頻域特征矩陣,并與步驟1中的時域特征向量構成船艦噪聲特征矩陣a,提取更加完整、全面的特征。
進一步的,步驟3中,將提取到的時頻域特征矩陣a與pca相結合,做降維處理,降低數(shù)據(jù)維度,避免在分類器中發(fā)生過擬合現(xiàn)象。
與現(xiàn)有技術相比,本發(fā)明方法具有如下優(yōu)點:
1、提出時域頻域信息相結合的方法,采用均值,方差,峰值,偏度等時域特征以及求得的imf能量熵構成的頻域特征共同組成的特征矩陣,使得獲得的特征信息更完整,更全面;
2、針對傳統(tǒng)方法提取的特征矩陣維數(shù)過高,容易產(chǎn)生維數(shù)災,從而在分類器中產(chǎn)生過擬合問題,采用pca降維方法,分析原特征矩陣的主成分以及貢獻率,將累計貢獻率>95%的主成分代替原來的所有評價指標,達到降維目的。
附圖說明
圖1是本發(fā)明方法的流程圖。
圖2是本發(fā)明方法中imf能量熵的流程圖。
圖3為樣本的采樣信號圖。
具體實施方式
下面結合附圖對本發(fā)明做進一步說明:
如圖1所示,本發(fā)明所述方法包括以下步驟:
步驟1,提取船艦噪聲信號均值、方差、峰值、偏度等時域特征參數(shù),作為時域特征向量,構成時域特征矩陣;
步驟2,對原船艦噪聲信號進行eemd分解,經(jīng)驗模態(tài)分解(emd)是信號處理領域解決非平穩(wěn)、非線性信號的新方法,它可以將動態(tài)信號的本征模態(tài)分量(imf)提取出來,但在實際應用中,由于端點效應或間歇性的影響,使得emd分解引起模式混淆現(xiàn)象。而集成經(jīng)驗模式分解(eemd)方法可以克服這種現(xiàn)象,它給信號加入極小幅度白噪聲,利用白噪聲頻譜均衡分布的特點來均衡信號的中斷區(qū)域,從而去除模式混淆。分解后得到imf分量,考慮到不同信號的不同頻率成分,且imf幅度差異,將imf的能量熵作為特征向量構成頻域特征并與時域特征參數(shù)相結合,形成信息互補,從而進一步提高識別率,與步驟1中的時域特征向量共同構成特征矩陣a;
步驟3,利用pca降維方法對特征矩陣a做降維處理,將高維度的特征矩陣映射到低維度作為新的特征,且盡可能的代表原特征,構成特征矩陣b;一般情況下,選取累計貢獻率>90%的主成分代替所有主成分,并將特征值對應的特征向量與原矩陣的乘積作為新的特征矩陣輸入到分類器中;
步驟4,訓練lssvm(最小二乘支持向量機)參數(shù),根據(jù)風險最小化原則,調整參數(shù)γ和核寬度σ,最后將降維后的特征矩陣b向量輸入到分類器中,測驗分類結果,并與未降維的特征矩陣分類結果進行對比。
實施例1:
本發(fā)明方法包括以下幾個步驟:
(1)提取時域特征信息
提取船艦噪聲信號的時域特征參數(shù),作為時域特征向量,其參數(shù)分別為:
均值
a=mean(x)
方差
峰值
f=max(x)
偏度
其中,xi是采樣數(shù)據(jù),
t=[a,d,b,f],均值,方差,峰值,偏度信息,從不同角度反映振動信號的時域特征,并且具有一定的互補性,將這四個時域參數(shù)組合起來,形成四維向量t=[a,d,b,f],可以作為船艦噪聲的時域特征向量。
(2)提取頻域信息imf能量熵
運用emd的改進模型eemd與信息熵方法,提取船艦噪聲信號的頻域特征。如附圖2所示,首先,在原始振動信號x(t)中疊加均值為零、標準差是常數(shù)的隨機高斯白噪聲wi(t),得到待分解的信號xi(t)
xi(t)=x(t)+wi(t)
其中,wi(t)是第i次加入高斯白噪聲后的信號。
對上式進行emd分解,循環(huán)j次后可得到第j個imf分量fij(t),
循環(huán)n次后,計算imf的總體平均值:
在此基礎上引入能量熵概念,求每個imf分量的能量ei
對每個imf分量的能量進行歸一化處理:
pm=em/e
求每個imf的能量熵:
將imf的能量熵值作為頻域特征向量來區(qū)分不同模式間的分布情況。
(3)pca降維
現(xiàn)取a,b,c,d四類船艦噪聲,每類噪聲包含訓練樣本30個,測試樣本30個,則目前的特征向量矩陣為120*16,采用pca降維處理,首先對其進行標準化處理,消除量綱和數(shù)量級的限制,標準化的計算公式如下:
式中,u代表向量x的均值向量;std(x)表示x的標準向量差;
然后解相關系數(shù)矩陣r,相關系數(shù)矩陣反應了2個變量的線性相關程度的大小。相關系數(shù)越大,表明2個變量間的線性關系越密切;相關系數(shù)越小,標明2個變量間的線性相關程度越小。
式中,rij(ij=1,2,…,p)為原變量xi與xj相關系數(shù),其計算公式為:
計算特征值與特征向量,令det(r-λi)=0,求出其特征值,并使其按照大小排列,λ1≥λ2≥…≥λp。最后分別求出對應與特征根λi的特征向量ui。
計算貢獻率與累計貢獻率,第k個主成分yk的方差貢獻率為
主成分ym的累計貢獻率為
選擇累計貢獻率達到95%的前i個主成分,此時認為i個主成分的可代替原來的n項指標。獲得主成分后,按照特征值的由大到小的順序提取前i個特征值所對應的特征向量μi(1,2,…,n)構成的投影矩陣。將原始數(shù)據(jù)與投影矩陣相乘,最終得到主成分的得分,作為特征向量輸入到分類器中。
(4)使用最小二乘支持向量機分類
分類器模型采用suyukens等提出的svm改進模型lssvm。假設有m類分類樣本,則訓練樣本設為s1:{(xi,yi)},i=1,2,…n,其中,yi是1和-1組成的m維向量,當樣本屬于第j時,則yi的第j為1,其他均為-1?,F(xiàn)將特征向量陣設為x,分類陣設為y,則它們的第i行分別為xi和yi。
lssvm將svm的不等式約束問題轉化為等式約束問題:
式中,w和b為分類超平面,
為解決上述優(yōu)化問題,引入拉格朗日函數(shù):
對于拉格朗日乘子中的變量w,b,e,α求極值,經(jīng)變換后可得到:
式中,yi為y的第i行,ωjk(t)=y(tǒng)ij.yik.k(xj,xk),單位陣i∈rn×n,αt和bi分別為對應yi的lagrange乘子向量和常數(shù)項,可建立ls-svm函數(shù):
式中,x為測試數(shù)據(jù),xi為訓練數(shù)據(jù);k(.)為核函數(shù),通常選擇rbf型函數(shù):
(xi,xj)=exp(-||xi-xj||2)/σ2
最后,由判別函數(shù)cj(x)=sign(y,j(x))(j=1,2,…m)決定x的狀態(tài)類別。
本發(fā)明實施例的識別效果可以通過以下仿真數(shù)據(jù)進一步說明:
(1)現(xiàn)取a,b,c,d四種樣本,分別取訓練樣本各30個,測試樣本各30個,a,b,c,d的噪聲信號采樣圖如附圖3所示。
分別將訓練樣本的時域信息以及imf能量熵等頻域信息提取,構成120*16的特征矩陣,如表1所示:
表1樣本時域與imf能量熵值
經(jīng)過pca降維后,選取主成分貢獻率>95%的主成分,并將其對應的特征值與原矩陣的乘積作為新的特征矩陣輸入到分類器中:如表2
表2pca降維后的特征矩陣(前4*10)
將數(shù)據(jù)輸入到分類器中進行測試,并未降維數(shù)據(jù)分類進行對比,結果如下:
表3識別率對比
由表3可知,imf信息熵與時域信息結合的識別率經(jīng)過降維后的識別率比未降維前的識別率提高了5%左右,證明了本發(fā)明方法的有效性。
以上所述的實施例僅僅是對本發(fā)明的優(yōu)選實施方式進行描述,并非對本發(fā)明的范圍進行限定,在不脫離本發(fā)明設計精神的前提下,本領域普通技術人員對本發(fā)明的技術方案做出的各種變形和改進,均應落入本發(fā)明權利要求書確定的保護范圍內。