本發(fā)明屬于信號識別技術領域,具體地說,涉及一種聯合三維熵特征的雷達輻射源信號識別方法。
背景技術:
雷達輻射源信號識別是電子情報偵察系統(tǒng)(ELINT)和電子支援系統(tǒng)(ESM)中的重要組成部分,直接影響著電子偵察設備性能的發(fā)揮并關系到后續(xù)的作戰(zhàn)決策。傳統(tǒng)識別方法依賴于常規(guī)五參數(RF、PA、PW、DOA和TOA),但是這種方法在一定條件下僅適合于常規(guī)雷達信號的識別,對于復雜電磁環(huán)境下密集雷達信號的識別效果不佳。因此,當前研究方向趨向于通過對雷達信號脈內數據進行分析,研究脈內有意調制特征和無意調制特征,擴展參數空間,減少多參數空間的交迭概率,以便快速、準確的識別信號。在這個意義上,許多新的脈內特征提取技術相繼被提出,例如小波變換法、時頻分布法、原子分解法、高階統(tǒng)計分析方法等。但是,這些方法都存在一定的不足,有的技術采用的小波變換方法提取的特征僅適合少數信號,應用局限性大,同時提取的特征數目較多,造成時間開銷較大;用Choi-Williams分布提取出輻射源信號的制特征向量,并用神經網絡分類器對取出的特征向量進行分類,可以取得較好分類效果。但是該分布雖然可以抑制模糊域中橫軸和縱軸以外的交叉項,但仍然保留了橫軸和縱軸上的交叉項,對信號調制識別仍然有影響;利用改進量子遺傳算法進行匹配追蹤以實現最佳原子的快速匹配,作者思想主要體現在時頻原子匹配上,但是特征原子數目較多,30個Gabor原子雖然可充分表示原信號的主要特征信息,但是直接應用這些原子進行識別時其維數相當高,造成的計算量也是巨大的。
而基于熵特征的輻射源信號識別方法在一定程度上彌補了上述方法的不足,有的技術將近似熵和范數熵構成特征向量并利用神經網絡分類器進行分類識別,取得了較好的識別效果。
目前,現有技術中還沒有一種聯合三維熵特征的雷達輻射源信號識別方法。
技術實現要素:
本發(fā)明的目的在于基于脈內特征的輻射源信號識別中存在的缺陷,提供一種聯合三維熵特征的雷達輻射源信號識別方法,該方法將樣本熵,模糊熵和歸一化能量熵作為信號的三維特征向量,以樣本熵描述輻射源信號的復雜性,利用模糊熵來衡量信號的不確定度,同時利用歸一化能量熵度量信號能量的分布情況。文章對六種典型雷達輻射源信號進行特征提取,并利用支持向量機進行分類識別試驗,結果表明,提取的特征向量在較大信噪比范圍內能夠較好地實現對雷達輻射源信號的分類識別,證明該方法是有效的。
其具體技術方案為:
一種聯合三維熵特征的雷達輻射源信號識別方法,包括以下步驟:
步驟1、信號預處理
1.1將脈沖數據變換到頻域,并截取對稱幅頻譜的中心點以右部分,記為f(i),i=1,2,…,M,M為脈沖數據長度的1/2;
1.2根據公式(1)將信號f(i)能量歸一化:
1.3求出能量歸一化后信號f′(i)的中心頻率和有效帶寬,并對帶寬進行歸一化處理;
1.4采樣頻率一定的情況下,不同脈寬的脈沖數據其信號長度是不同的,為了避免這種不同長度信號對后文提取特征的影響,對所有帶寬歸一化處理后的信號進行重采樣,并記重采樣后的信號為x(n),n=1,2,…,N,N為重采樣后信號長度;
步驟2、特征提取
2.1樣本熵特征提取
記重采樣后的N點信號序列為x(n)=[x1x2…xN],則SampEn估計算法如下所述:
2.1.1按照式(2)對序列x(n)構造m維矢量:
x(i)=[xi xi+1…xi+m-1],i=1,2,…,N-m+1 (2)
2.1.2按照式(3)計算矢量對之間的距離:
2.1.3計算相似矢量對的數目:
(1)令nm=0,如果dm[x(i),x(j)]≤r,i≠j,則nm=nm+1;
(2)令nm+1=0,如果dm+1[x(i),x(j)]≤r,i≠j,則nm+1=nm+1+1;
2.1.4按照式(4)計算所有相似矢量對相似測度:
2.1.5按照式(5)計算相似矢量對平均相似測度:
2.1.6按照式(6)計算樣本熵估計:
其中,本發(fā)明采用尺度參數m=2和容限參數作為估算樣本熵的參數,σ為x(n)的標準差;
2.2模糊熵特征提取
熵在信息論中表示信源的平均不確定度,在模糊子集論中可以用來度量一個模糊集合所含有的模糊性的大小,因此用模糊熵來表示模糊集的不確定度;模糊集A的模糊熵定義為:
其中,f(t)=-tlnt-(1-t)ln(1-t),k>0是正常數,μA(xi)表示模糊集A的隸屬函數;
證明,f(t)是一個關于t=0.5的對稱函數,在區(qū)間[0,0.5]內嚴格單調遞增,在區(qū)間[0.5,1]內嚴格單調遞減,當t=0.5時取得最大值ln2;由(7)式可以看出,如果μA(x)∈{0,1},則Fe(A)=0;如果μA(x)∈{1},則Fe(A)取得最大值Nln2,取k-1=Nln2作為歸一化因子;
經多次試驗,采用如(8)式的S型函數[9]作為隸屬度函數:
其中,b=(a+c)/2;a與c確定了S函數中模糊窗寬的范圍,且隨所取模糊窗的不同而發(fā)生變化,作為函數的一個轉接點,可以通過求得模糊集的熵最大值來獲得最優(yōu)的參數a,b,c的值,即所求參數應滿足(9)式;
max{Fe(A),a,b,c∈x(n)&a<b<c} (9)
考慮到輻射源信號包含了一定的不確定性,因此可以用模糊熵來衡量信號的不確定性;記重采樣后的N點信號序列為x(n)=[x1x2…xN],A為該序列對應的模糊子集,則確定最優(yōu)參數a,b,c的值后,根據(8)式求出信號序列的隸屬度即可由(7)式求出信號序列的模糊熵;
2.3歸一化能量熵特征提取
2.3.1令i=1,j=1;
2.3.2以三次樣條函數分別連接信號s(t)的局部極大值和極小值序列,形成信號的上下包絡;
2.3.3計算上下包絡的均值mij(t),同時記hij(t)=s(t)-mij(t);
2.3.4如果hij(t)滿足IMF條件,則轉到步驟5,否則以hij(t)替代s(t),并令j=j+1,轉到步驟2;
2.3.5記ci(t)為EMD分解得到的第i個IMF分量,則ci(t)=hij(t),令ri(t)=s(t)-ci(t),如果ri(t)為一個單調函數,則分解過程終止,此時稱ri(t)為趨勢余項,否則以ri(t)替代s(t),并令i=i+1,轉到步驟2;
由以上步驟可以看出,原信號s(t)經EMD分解為k個IMF分量與趨勢余項的和,即:
其中,k為總共分解次數;
得到脈沖數據序列s(t)的IMF分量后,即可通過式(11)求出信號的IMF分量歸一化能量熵:
式(11)中,
其中,pi表示歸一化IMF能量,N表示信號序列s(t)的長度;顯然∑pi=1,i=1,2,…k,分解次數k與信號的復雜程度有關,由分解算法自適應確定;由熵理論可知,如果輻射源信號各IMF分量的能量分布均勻,則歸一化能量熵最大;若能量集中在少數IMF分量處,則歸一化能量熵較??;
步驟3、輻射源信號識別方法
3.1對輻射源信號進行預處理,得到重采樣后的信號x(n),n=1,2,…,N,計算歸一化能量熵時,直接由個體脈沖數據重采樣得到序列s(t),t=1,2,…,N,N為重采樣后的信號長度;
3.2按照SampEn估計算法求得信號序列x(n)的樣本熵Se;
3.3按照(7)式求得序列x(n)的模糊熵Fe;
3.4按照(11)式求得序列s(t)的歸一化能量熵Pe;
3.5將特征矢量T=[Se,Fe,Pe]輸入SVM分類器對信號進行分類識別。
與現有技術相比,本發(fā)明的有益效果:
本發(fā)明將樣本熵,模糊熵和歸一化能量熵作為信號的三維特征向量,以樣本熵描述輻射源信號的復雜性,利用模糊熵來衡量信號的不確定度,同時利用歸一化能量熵度量信號能量的分布情況。文章對六種典型雷達輻射源信號進行特征提取,并利用支持向量機進行分類識別試驗,結果表明,提取的特征向量在較大信噪比范圍內能夠較好地實現對雷達輻射源信號的分類識別,證明該方法是有效的。
附圖說明
圖1是輻射源信號特征分布圖,其中,(a)為樣本熵,模糊熵和歸一化能量熵特征分布,(b)樣本熵和模糊熵特征分布,(c)為樣本熵和歸一化能量熵特征分布,(d)為模糊熵和歸一化能量熵特征分布。
具體實施方式
下面結合附圖和具體實施方案對本發(fā)明的技術方案作進一步詳細地說明。
1基于熵特征的輻射源信號識別
1.1信號預處理
為了避免提取的特征受到輻射源信號載頻以及噪聲等的影響,需要對分割后的個體脈沖數據進行進一步的預處理,主要包括以下幾個步驟[5]:
步驟1將脈沖數據變換到頻域,并截取對稱幅頻譜的中心點以右部分,記為f(i),i=1,2,…,M,M為脈沖數據長度的1/2;
步驟2根據公式(1)將信號f(i)能量歸一化:
步驟3求出能量歸一化后信號f′(i)的中心頻率和有效帶寬,并對帶寬進行歸一化處理;
步驟4采樣頻率一定的情況下,不同脈寬的脈沖數據其信號長度是不同的,為了避免這種不同長度信號對后文提取特征的影響,對所有帶寬歸一化處理后的信號進行重采樣,并記重采樣后的信號為x(n),n=1,2,…,N,N為重采樣后信號長度。
后文中的樣本熵和模糊熵特征提取算法都是針對重采樣后的信號x(n)進行的。
1.2特征提取方法
熵在信息論中表示信源的平均不確定度,由于噪聲干擾以及不同調制方式的影響,輻射源信號包含了一定的不確定性,這種不確定性主要表現為信號時域波形的差別,頻譜形狀的不同和能量分布的差異等,這些不確定性或者模糊性都可以用熵來衡量。本發(fā)明從輻射源信號中分別提取出樣本熵,模糊熵和歸一化能量熵三種參數組成特征向量用來進行輻射源信號的分類識別。
1.2.1樣本熵特征提取
近似熵是一種衡量時間序列復雜性的統(tǒng)計學參數,它僅需要較短數據就可度量出信號中產生新模式的概率,抗干擾能力較好[6],但是該方法存在信號自匹配而帶來的估計偏差問題。文獻[7]提出以樣本熵(SampEn)作為時間序列的統(tǒng)計參數,該參數具有與近似熵相同的物理意義和優(yōu)點,解決了估計偏差和對微小的復雜性變化不靈敏的問題。因此,本發(fā)明將樣本熵作為輻射源信號的一個特征參數,在利用該特征可以有效抑制噪聲的同時,也避免了估計偏差問題對輻射源信號分類識別的影響。
記重采樣后的N點信號序列為x(n)=[x1x2…xN],則SampEn估計算法如下所述:
步驟1按照式(2)對序列x(n)構造m維矢量:
x(i)=[xi xi+1…xi+m-1],i=1,2,…,N-m+1 (2)
步驟2按照式(3)計算矢量對之間的距離:
步驟3計算相似矢量對的數目:
(1)令nm=0,如果dm[x(i),x(j)]≤r,i≠j,則nm=nm+1;
(2)令nm+1=0,如果dm+1[x(i),x(j)]≤r,i≠j,則nm+1=nm+1+1;
步驟4按照式(4)計算所有相似矢量對相似測度:
步驟5按照式(5)計算相似矢量對平均相似測度:
步驟6按照式(6)計算樣本熵估計:
其中,本發(fā)明采用尺度參數m=2和容限參數作為估算樣本熵的參數,σ為x(n)的標準差。
1.2.2模糊熵特征提取
熵在信息論中表示信源的平均不確定度,在模糊子集論中可以用來度量一個模糊集合所含有的模糊性的大小,因此用模糊熵來表示模糊集的不確定度。模糊集A的模糊熵定義為[8]:
其中,f(t)=-tlnt-(1-t)ln(1-t),k>0是正常數,μA(xi)表示模糊集A的隸屬函數。
容易證明,f(t)是一個關于t=0.5的對稱函數,在區(qū)間[0,0.5]內嚴格單調遞增,在區(qū)間[0.5,1]內嚴格單調遞減,當t=0.5時取得最大值ln2。由(7)式可以看出,如果μA(x)∈{0,1},則Fe(A)=0;如果μA(x)∈{1},則Fe(A)取得最大值Nln2,因此,本發(fā)明取k-1=Nln2作為歸一化因子。
經多次試驗,本發(fā)明采用如(8)式的S型函數[9]作為隸屬度函數:
其中,b=(a+c)/2。a與c確定了S函數中模糊窗寬的范圍,且隨所取模糊窗的不同而發(fā)生變化,作為函數的一個轉接點,可以通過求得模糊集的熵最大值來獲得最優(yōu)的參數a,b,c的值,即所求參數應滿足(9)式。
max{Fe(A),a,b,c∈x(n)&a<b<c} (9)
考慮到輻射源信號包含了一定的不確定性,因此可以用模糊熵來衡量信號的不確定性。記重采樣后的N點信號序列為x(n)=[x1x2…xN],A為該序列對應的模糊子集,則確定最優(yōu)參數a,b,c的值后,根據(8)式求出信號序列的隸屬度即可由(7)式求出信號序列的模糊熵。
1.2.3歸一化能量熵特征提取
經驗模態(tài)分解(empirical mode decomposition,EMD)是指逐級分解信號中不同尺度的波動或趨勢,產生一系列具有不同特征尺度的數據序列,稱其為本征模式分量函數(intrinsic mode function,IMF)[10,11]。EMD方法的本質就是將信號分解為若干不同IMF之和,不同的IMF代表信號不同頻段的成分,每個頻段所包含的頻率成分是不相同的。IMF定義為滿足以下兩個條件的信號分量:(1)極值點和零交叉點的個數相差不超過1個;(2)由局部極大值和局部極小值點構成包絡的均值為0。
對雷達輻射源信號來講,不同頻帶內的信號能量分布隨調制方式的不同而發(fā)生改變,因此通過計算不同輻射源信號的IMF分量歸一化能量熵可以判斷輻射源信號的類型。設得到的脈沖數據序列直接經信號預處理中的步驟4重采樣后為s(t),則利用EMD分解s(t)的過程如下所述:
步驟1令i=1,j=1;
步驟2以三次樣條函數分別連接信號s(t)的局部極大值和極小值序列,形成信號的上下包絡;
步驟3計算上下包絡的均值mij(t),同時記hij(t)=s(t)-mij(t);
步驟4如果hij(t)滿足IMF條件,則轉到步驟5,否則以hij(t)替代s(t),并令j=j+1,轉到步驟2;
步驟5記ci(t)為EMD分解得到的第i個IMF分量,則ci(t)=hij(t),令ri(t)=s(t)-ci(t),如果ri(t)為一個單調函數,則分解過程終止,此時稱ri(t)為趨勢余項,否則以ri(t)替代s(t),并令i=i+1,轉到步驟2;
由以上步驟可以看出,原信號s(t)經EMD分解為k個IMF分量與趨勢余項的和,即:
其中,k為總共分解次數。
得到脈沖數據序列s(t)的IMF分量后,即可通過式(11)求出信號的IMF分量歸一化能量熵:
式(11)中,
其中,pi表示歸一化IMF能量,N表示信號序列s(t)的長度。顯然∑pi=1,i=1,2,…k,分解次數k與信號的復雜程度有關,由分解算法自適應確定。由熵理論可知,如果輻射源信號各IMF分量的能量分布均勻,則歸一化能量熵最大;若能量集中在少數IMF分量處,則歸一化能量熵較小。
1.3輻射源信號識別方法
考慮到輻射源訓練數據庫一般不是很完備以及實際戰(zhàn)場環(huán)境的應用問題,需要選擇一種適用于較少訓練樣本,而且訓練和分類速度快,不容易陷入局部極小值的分類器,而SVM恰好具有這些優(yōu)點,因此本發(fā)明選用SVM作為分類識別的學習算法。
SVM是方法不僅較好的解決了以往機器學習方法中存在的小樣本、非線性、過學習、高維數、局部極小值點等實際問題,而且與基于經驗風險最小化原理的神經網絡學習算法相比,SVM具有更強的理論基礎和更好的泛化能力[12]。SVM通過核函數將輸入特征矢量由低維特征空間映射到高維特征空間,將原始輸入空間的非線性可分問題轉化為高維空間的線性可分問題,從而達到分類識別輻射源信號的目的。
鑒于樣本熵和模糊熵可以有效描述輻射源信號的復雜性和不確定性,本發(fā)明提出了利用樣本熵和模糊熵組成的特征向量來進行輻射源信號的SVM分類識別方法,具體步驟如下:
步驟1對輻射源信號進行預處理,得到重采樣后的信號x(n),n=1,2,…,N,計算歸一化能量熵時,直接由個體脈沖數據重采樣得到序列s(t),t=1,2,…,N,N為重采樣后的信號長度;
步驟2按照SampEn估計算法求得信號序列x(n)的樣本熵Se;
步驟3按照(7)式求得序列x(n)的模糊熵Fe;
步驟4按照(11)式求得序列s(t)的歸一化能量熵Pe;
步驟5將特征矢量T=[Se,Fe,Pe]輸入SVM分類器對信號進行分類識別。
2實驗結果與分析
本發(fā)明選擇6種典型雷達輻射源信號進行仿真實驗[13],這6種信號分別為:常規(guī)雷達信號(CW)、線性調頻雷達信號(LFM)、非線性調頻雷達信號(NLFM)、二相編碼雷達信號(BPSK)、四相編碼雷達信號(QPSK)和頻率編碼雷達信號(FSK)。信號載頻為850MHz,采樣頻率為2.4GHz,脈寬為10.8us,LFM的頻偏為45MHz,NLFM采用正弦頻率調制,BPSK采用31位偽隨機碼,QPSK采用Huffman碼,FSK采用Barker碼。對每一種雷達信號在0~20dB的信噪比范圍內每隔5dB產生120個樣本,總共為600個樣本,其中200個用于分類器訓練,其余400個用作信號分類識別的測試集。在訓練分類器和測試信號分類識別效果之前,要對所有樣本進行樣本熵和模糊熵特征的提取。為了直觀反映各輻射源信號的特征分布情況,本發(fā)明從提取到的特征向量中選取各信號不同信噪比的60組特征樣本,總共300組特征樣本做如圖1所示的特征分布圖。
由圖1(a)中可以看出,CW,LFM和NLFM三種信號的三維特征類內聚集性較好,而FSK,BPSK和QPSK三種信號的特征較發(fā)散;由圖1(b)中可以看出,BPSK和QPSK的樣本熵和模糊熵特征有部分重疊;在圖1(c)中,FSK和NFLM有部分重疊,同時QPSK和LFM重疊較嚴重,幾乎不能分辨;在圖1(d)中,NLFM和QPSK有部分重疊。因此僅依靠二維熵特征不能總是得到好的分類識別結果??紤]到上述因素,本發(fā)明用SVM對三維特征向量表征的輻射源信號進行分類識別,結果如表1所示。
表1中列出了利用SVM得到的各信號正確識別率隨信噪比的變化情況,其中分類識別率是指20次試驗結果的平均,平均識別率是指每一信號在0~20dB信噪比范圍內分類識別率的平均。
表1輻射源信號正確識別率隨信噪比的變化情況
從表1可看出,在一定的SNR范圍內,以提取的三種熵為特征向量,并用SVM分類器對輻射源信號進行分類識別時,每種雷達輻射源信號都可以取得較高正確識別率。信號識別率的高低與信號的復雜程度有關,對于較為簡單的信號形式,例如CW和LFM調制信號,其平均正確識別率可達到98.74%和96.97%,這種結果與圖1(a)中這兩種信號較好的特征類內聚集性是一致的;對于較為復雜的信號形式,例如BPSK和FSK調制信號,其平均正確識別率為90.21%和88.21%,該結果與三維特征的聚集程度不佳和特征的部分重疊有關,但是這種結果在工程應用中是可以接受的。另外,6種輻射源信號的平均正確識別率達到了94.02%,識別效果較好。
以上所述,僅為本發(fā)明較佳的具體實施方式,本發(fā)明的保護范圍不限于此,任何熟悉本技術領域的技術人員在本發(fā)明披露的技術范圍內,可顯而易見地得到的技術方案的簡單變化或等效替換均落入本發(fā)明的保護范圍內。