本發(fā)明屬于電磁信號處理領(lǐng)域,涉及一種ESMD樣本熵結(jié)合FCM的電磁信號頻譜數(shù)據(jù)分類方法。
背景技術(shù):
:電子信息技術(shù)的發(fā)展極大地促進(jìn)了科技的進(jìn)步,但是日益增多的電子設(shè)備同時(shí)也造成了嚴(yán)重的電磁干擾問題,導(dǎo)致環(huán)境中電子設(shè)備正常的工作性能下降。為了減輕電磁干擾,一般設(shè)計(jì)電磁兼容,找出電磁信號頻譜中的各類數(shù)據(jù)。通過對電磁信號頻譜數(shù)據(jù)進(jìn)行分類,分析電磁干擾的來源,具有良好的輔助作用。當(dāng)前,電磁信號的分類主要針對時(shí)域的數(shù)據(jù),直接用來分析頻譜數(shù)據(jù)具有一定的局限性。關(guān)于數(shù)據(jù)的提取,文獻(xiàn)[1]:廣州:華南理工大學(xué),曾作欽.基于奇異值分解的信號處理方法及其在機(jī)械故障診斷中的應(yīng)用[D]中將Hankel矩陣的奇異值作為數(shù)據(jù)的特征,取得了一定的效果。但是該方法中對嵌套窗口的選擇偏主觀,不同的選擇結(jié)果差異較大。文獻(xiàn)[2]:震動(dòng)與沖擊,2012,31(19):21-25.黃林洲等.EMD近似熵結(jié)合支持向量機(jī)的心音號識別研究[J].中選擇近似熵作為數(shù)據(jù)特征。但是近似熵幾乎完全依賴于信號數(shù)據(jù)的長度,會(huì)導(dǎo)致前后不一致的計(jì)算結(jié)果。相比,固有模態(tài)函數(shù)的樣本熵(SampleEntropy)能夠全面地刻畫出電磁信號頻譜數(shù)據(jù)的內(nèi)在復(fù)雜性特征。提取了數(shù)據(jù)特征之后,建立信號數(shù)據(jù)特征空間的基礎(chǔ),將提取的數(shù)據(jù)特征輸入分類算法,利用分類算法依據(jù)不同的數(shù)據(jù)特征進(jìn)行分類?,F(xiàn)有的分類算法中,K均值算法簡單易行,但是如果它的初始值選得不恰當(dāng),將很難獲得理想的聚類結(jié)果。人工神經(jīng)網(wǎng)絡(luò)方法能夠在短時(shí)間內(nèi)確定最優(yōu)分類結(jié)果,但是其需要充分多的樣本,這個(gè)條件往往在實(shí)際中難以得到滿足。相比目前比較成功的對數(shù)據(jù)進(jìn)行分類的經(jīng)典方法:模糊C均值(FCM)算法,通過極小化數(shù)據(jù)點(diǎn)與各個(gè)聚類中心的歐氏距離及模糊隸屬度的加權(quán)和,將具有相似特征的數(shù)據(jù)樣本聚為一類。極值點(diǎn)對稱模態(tài)分解方法(ESMD)能夠自適應(yīng)地分解非線性非穩(wěn)定的電磁頻譜數(shù)據(jù),克服了傳統(tǒng)方法如小波分解方法僅適用于線性數(shù)據(jù)的缺點(diǎn)。將ESMD樣本熵結(jié)合FCM算法結(jié)合起來對非線性非穩(wěn)定的電磁信號頻譜數(shù)據(jù)進(jìn)行分類,能夠克服傳統(tǒng)分類方法只適用于線性穩(wěn)定數(shù)據(jù)的缺點(diǎn),能夠根據(jù)已提取出的頻譜數(shù)據(jù)特征客觀地給出分類結(jié)果。技術(shù)實(shí)現(xiàn)要素:本發(fā)明針對現(xiàn)有的電磁信號頻譜數(shù)據(jù)分類方法的不足,提出一種ESMD樣本熵結(jié)合FCM的電磁信號頻譜數(shù)據(jù)分類方法。具體步驟如下:步驟一、利用頻譜儀分別測量不同的電磁設(shè)備,獲取電磁信號的頻譜數(shù)據(jù);每種電磁設(shè)備的頻譜數(shù)據(jù)均包括設(shè)備正線和設(shè)備負(fù)線兩種數(shù)據(jù);所有的頻譜數(shù)據(jù)數(shù)量為M。步驟二、對每種電磁設(shè)備的每種頻譜數(shù)據(jù),分別用ESMD方法進(jìn)行分解,獲得各頻譜數(shù)據(jù)的固有模態(tài)函數(shù)分量;具體為:步驟201、針對某種頻譜數(shù)據(jù)s,獲取全部極大值點(diǎn)和極小值點(diǎn),并用直線連接相鄰的極大值點(diǎn)和極小值點(diǎn),得到一系列極值點(diǎn)的中點(diǎn);頻譜數(shù)據(jù)s中的數(shù)據(jù)點(diǎn)數(shù)量為N;中點(diǎn)為相鄰極大值點(diǎn)和極小值點(diǎn)的中間值;步驟202、針對所有中點(diǎn)進(jìn)行三次樣條插值得到均值曲線X*;步驟203、判斷均值曲線X*的幅值|X*|是否小于給定精度τ,如果是,進(jìn)入步驟204,否則進(jìn)入步驟205;步驟204、X*為頻譜數(shù)據(jù)s的一個(gè)固有模態(tài)函數(shù)分量;X*的數(shù)據(jù)點(diǎn)數(shù)量為N;步驟205、計(jì)算s*=s-X*作為新的頻譜數(shù)據(jù),返回步驟201,重新獲取固有模態(tài)函數(shù)分量;最終頻譜數(shù)據(jù)s得到的固有模態(tài)函數(shù)分量為L個(gè),L≤log2N。步驟三、對每種電磁設(shè)備的每種頻譜數(shù)據(jù),利用固有模態(tài)函數(shù)分量的樣本熵作為特征,構(gòu)成該頻譜數(shù)據(jù)的特征向量;具體步驟如下:步驟301、針對頻譜數(shù)據(jù)s中,某個(gè)固有模態(tài)函數(shù)分量X*的所有數(shù)據(jù)點(diǎn),構(gòu)成r維數(shù)據(jù)點(diǎn)列集合Q(I);r是指每維數(shù)據(jù)點(diǎn)列Q(i)的長度,也就是每個(gè)Q(i)中的數(shù)據(jù)點(diǎn)個(gè)數(shù)。數(shù)據(jù)點(diǎn)列集合Q(I)的數(shù)據(jù)點(diǎn)列個(gè)數(shù)為N-r+1。步驟302、依次選取數(shù)據(jù)點(diǎn)列集合Q(I)中的數(shù)據(jù)點(diǎn)列Q(i)作為當(dāng)前數(shù)據(jù)點(diǎn)列,分別與其余所有數(shù)據(jù)點(diǎn)列一一做差;當(dāng)前數(shù)據(jù)點(diǎn)列Q(i)初始值為Q(1);步驟303、將每次作差的兩個(gè)數(shù)據(jù)點(diǎn)列作為一組,將該組中的數(shù)據(jù)點(diǎn)分別一一對應(yīng)作差,并選擇最大差值作為當(dāng)前兩個(gè)數(shù)據(jù)點(diǎn)列之間的距離;當(dāng)前兩個(gè)數(shù)據(jù)點(diǎn)列分別為Q(i)和Q(j)時(shí)的距離d(Q(i),Q(j))計(jì)算公式如下:d(Q(i),Q(j))=maxk∈[0,r-1](|P(i+k)-P(j+k)|)步驟304、確定與當(dāng)前數(shù)據(jù)點(diǎn)列Q(i)的距離d(Q(i),Q(j))≤d0的Q(j)數(shù)目Ki;1≤Ki≤N-r;步驟305、計(jì)算所有Ki與N-r+1的比值并計(jì)算平均值Rr(d0);步驟306、利用平均值Rr(d0)計(jì)算該固有模態(tài)函數(shù)分量X*的樣本熵SP(r,d0,N);步驟307、重復(fù)上述步驟,計(jì)算頻譜數(shù)據(jù)s的所有固有模態(tài)函數(shù)分量的樣本熵向量SE作為頻譜數(shù)據(jù)s的特征向量;SE=[SP1,...,SPL]步驟四、將M個(gè)頻譜數(shù)據(jù)的樣本熵向量SamEn=[SE1,...,SEM]輸入到FCM算法,輸出最優(yōu)隸屬度矩陣和最優(yōu)聚類中心;步驟五、根據(jù)最優(yōu)隸屬度矩陣和最優(yōu)聚類中心,分析電磁信號頻譜數(shù)據(jù)的分類結(jié)果。本發(fā)明具有以下顯著優(yōu)點(diǎn):1)、一種ESMD樣本熵結(jié)合FCM的電磁信號頻譜數(shù)據(jù)分類方法,對提取的電磁信號頻譜數(shù)據(jù)進(jìn)行ESMD分解,而獲得各個(gè)固有模態(tài)函數(shù);與EMD方法相比,ESMD方法具有更好的自適應(yīng)性。2)、一種ESMD樣本熵結(jié)合FCM的電磁信號頻譜數(shù)據(jù)分類方法,利用固有模態(tài)函數(shù)的樣本熵作為頻譜數(shù)據(jù)的特征,能充分地度量出頻譜數(shù)據(jù)的復(fù)雜程度;與近似熵相比,樣本熵具有更加一致的計(jì)算結(jié)果。3)、一種ESMD樣本熵結(jié)合FCM的電磁信號頻譜數(shù)據(jù)分類方法,F(xiàn)CM算法能有效地建立頻譜數(shù)據(jù)對類別的不確定性描述,與K均值算法和人工神經(jīng)網(wǎng)絡(luò)算法相比能夠更加客觀地對頻譜數(shù)據(jù)進(jìn)行分類。附圖說明圖1為本發(fā)明一種ESMD樣本熵結(jié)合FCM的電磁信號頻譜數(shù)據(jù)分類方法的流程圖;圖2為本發(fā)明對頻譜數(shù)據(jù)用ESMD方法分解得到固有模態(tài)函數(shù)分量的流程圖;圖3為本發(fā)明利用固有模態(tài)函數(shù)分量的樣本熵作為特征構(gòu)成特征向量的流程圖;圖4為本發(fā)明筆記本電腦負(fù)線的電磁頻譜數(shù)據(jù)的各個(gè)固有模態(tài)函數(shù)。具體實(shí)施方式下面將結(jié)合附圖對本發(fā)明作進(jìn)一步的詳細(xì)說明。本發(fā)明一種ESMD樣本熵結(jié)合FCM的電磁信號頻譜數(shù)據(jù)分類方法,利用ESMD方法首先分解電磁信號的頻譜數(shù)據(jù)獲得固有模態(tài)函數(shù),再計(jì)算出固有模態(tài)函數(shù)的樣本熵作為數(shù)據(jù)的特征,最后利用FCM產(chǎn)生分類結(jié)果;如圖1所示,具體步驟如下:步驟一、利用頻譜儀分別測量不同的電磁設(shè)備,獲取電磁信號的頻譜數(shù)據(jù);每種電磁設(shè)備的頻譜數(shù)據(jù)均包括設(shè)備正線和設(shè)備負(fù)線兩種數(shù)據(jù);所有的頻譜數(shù)據(jù)數(shù)量為M。步驟二、對每種電磁設(shè)備的每種頻譜數(shù)據(jù),分別用ESMD方法進(jìn)行分解,獲得各頻譜數(shù)據(jù)的固有模態(tài)函數(shù)分量;如圖2所示,具體為:步驟201、針對某種頻譜數(shù)據(jù)s,獲取全部極大值點(diǎn)和極小值點(diǎn),并用直線連接相鄰的極大值點(diǎn)和極小值點(diǎn),得到一系列極值點(diǎn)的中點(diǎn);頻譜數(shù)據(jù)s中的數(shù)據(jù)點(diǎn)數(shù)量為N;極大值點(diǎn)或極小值點(diǎn)用Gi(1≤i≤N)表示,中點(diǎn)Mi(1≤i≤N-1)為相鄰極大值點(diǎn)和極小值點(diǎn)的中間值;步驟202、針對所有中點(diǎn),構(gòu)造三次樣條插值曲線X1,...,Xn及均值曲線X*;X*=(X1+...+Xn)/n;n≥1步驟203、判斷均值曲線X*的幅值|X*|是否小于給定精度τ,如果是,進(jìn)入步驟204,否則進(jìn)入步驟205;步驟204、X*為頻譜數(shù)據(jù)s的一個(gè)固有模態(tài)函數(shù)分量;X*的數(shù)據(jù)點(diǎn)數(shù)量為N;步驟205、計(jì)算s*=s-X*作為新的頻譜數(shù)據(jù),返回步驟201,重新獲取固有模態(tài)函數(shù)分量;最終得到頻譜數(shù)據(jù)s的固有模態(tài)函數(shù)分量為L個(gè);L≤log2N。步驟三、對每種電磁設(shè)備的每種頻譜數(shù)據(jù),利用固有模態(tài)函數(shù)分量的樣本熵作為特征,構(gòu)成該頻譜數(shù)據(jù)的特征向量;對于任意固有模態(tài)函數(shù)分量X*,設(shè)其數(shù)據(jù)點(diǎn)為{P(i),1≤i≤N};如圖3所示,樣本熵的計(jì)算步驟如下:步驟301、針對頻譜數(shù)據(jù)s中,某個(gè)固有模態(tài)函數(shù)分量X*的所有數(shù)據(jù)點(diǎn),構(gòu)成r維數(shù)據(jù)點(diǎn)列集合Q(I);數(shù)據(jù)點(diǎn)列集合Q(I)的數(shù)據(jù)點(diǎn)列個(gè)數(shù)為N-r+1;1≤i≤N-r+1;r是指每維數(shù)據(jù)點(diǎn)列Q(i)的長度,也就是每個(gè)Q(i)中的數(shù)據(jù)點(diǎn)個(gè)數(shù)。步驟302、依次選取數(shù)據(jù)點(diǎn)列集合Q(I)中的數(shù)據(jù)點(diǎn)列Q(i)作為當(dāng)前數(shù)據(jù)點(diǎn)列,分別與其余所有數(shù)據(jù)點(diǎn)列一一做差;當(dāng)前數(shù)據(jù)點(diǎn)列Q(i)初始值為Q(1);步驟303、將每次作差的兩個(gè)r維向量數(shù)據(jù)點(diǎn)列作為一組,將該組中的數(shù)據(jù)點(diǎn)分別一一對應(yīng)作差,并選擇最大差值作為當(dāng)前兩個(gè)數(shù)據(jù)點(diǎn)列之間的距離;當(dāng)前兩個(gè)數(shù)據(jù)點(diǎn)列分別為Q(i)和Q(j)時(shí)的距離d(Q(i),Q(j))計(jì)算公式如下:d(Q(i),Q(j))=maxk∈[0,r-1](|P(i+k)-P(j+k)|)步驟304、確定與當(dāng)前數(shù)據(jù)點(diǎn)列Q(i)的距離d(Q(i),Q(j))≤d0的Q(j)數(shù)目Ki;針對數(shù)據(jù)點(diǎn)列Q(i),當(dāng)Q(i)與其余所有數(shù)據(jù)點(diǎn)列一一做差后,尋找差值距離小于等于給定距離常量d0的數(shù)據(jù)點(diǎn)列組,得到數(shù)目Ki;1≤Ki≤N-r;N-r+1個(gè)數(shù)據(jù)點(diǎn)列的所有數(shù)目集合為:[K1,K2,...Ki,...KN-r+1]。步驟305、計(jì)算所有Ki與N-r+1的比值并計(jì)算平均值Rr(d0);步驟306、利用平均值Rr(d0)計(jì)算該固有模態(tài)函數(shù)分量X*的樣本熵SP(r,d0,N);步驟307、重復(fù)上述步驟,計(jì)算頻譜數(shù)據(jù)s的所有固有模態(tài)函數(shù)分量的樣本熵向量SE作為頻譜數(shù)據(jù)s的特征向量;SE=[SP1,...,SPL]第四步:將M個(gè)頻譜數(shù)據(jù)的樣本熵向量SamEn=[SE1,...,SEL]輸入到FCM算法,輸出最優(yōu)隸屬度矩陣和最優(yōu)聚類中心;具體步驟為:步驟401、初始化頻譜數(shù)據(jù)的分類數(shù)目、迭代精度和權(quán)重比例,每類頻譜數(shù)據(jù)的聚類中心和隸屬度矩陣;頻譜數(shù)據(jù)的分類數(shù)目為k,迭代精度為ε和權(quán)重比例為ω;每類頻譜數(shù)據(jù)的聚類中心Cm(1≤m≤k);利用0和1之間的隨機(jī)數(shù)初始化隸屬度矩陣H=[hmn],其中hmn是第n個(gè)特征向量xn隸屬于第m類的隸屬度,且步驟402、更新隸屬度矩陣H和聚類中心Cm;dmn=||Cm-xn||表示第m個(gè)聚類中心Cm和第n個(gè)特征向量xn之間的歐幾里得距離;Ct為第t個(gè)聚類中心;是隸屬度hmn的ω次方。步驟403、根據(jù)更新的隸屬度矩陣H和聚類中心Cm計(jì)算目標(biāo)函數(shù)Jz(H,C):z表示優(yōu)化迭代的第z步。步驟404、判斷相鄰優(yōu)化迭代的目標(biāo)函數(shù)之間的差是否滿足:|Jz(H,C)-Jz-1(H,C)|<ε,如果是,則第z步結(jié)果為迭代的最優(yōu)解,輸出最優(yōu)隸屬度矩陣H*和最優(yōu)聚類中心矩陣C*。否則,返回步驟402直到滿足迭代終止條件。第五步:根據(jù)FCM算法產(chǎn)生的最優(yōu)隸屬度矩陣H*和最優(yōu)聚類中心,分析電磁信號頻譜數(shù)據(jù)的分類結(jié)果?!緦?shí)施例】第一步:利用頻譜儀分別測量實(shí)際電磁環(huán)境中的4種設(shè)備,獲得8組長度均為1024的電磁信號頻譜數(shù)據(jù),實(shí)測設(shè)備電磁信號的頻譜數(shù)據(jù)如表1所示。表1電磁設(shè)備頻譜數(shù)據(jù)筆記本電腦負(fù)線s1筆記本電腦正線s2臺式電腦負(fù)線s3臺式電腦正線s4吹風(fēng)機(jī)負(fù)線s5吹風(fēng)機(jī)正線s6打印機(jī)負(fù)線s7打印機(jī)正線s8第二步:對每種頻譜數(shù)據(jù)分別進(jìn)行ESMD分解,獲得各頻譜數(shù)據(jù)的固有模態(tài)函數(shù)分量;對以上8組電磁信號的頻譜數(shù)據(jù)分別進(jìn)行ESMD分解,得到8組固有模態(tài)函數(shù),每組均包含10個(gè)固有模態(tài)函數(shù)分量。頻譜數(shù)據(jù)s1的10個(gè)固有模態(tài)函數(shù)分量如圖4所示;第三步:對4種電磁設(shè)備的8種頻譜數(shù)據(jù),分別計(jì)算每種頻譜數(shù)據(jù)的固有模態(tài)函數(shù)分量的樣本熵構(gòu)成8種頻譜數(shù)據(jù)的特征向量;從圖4可以看出,其主要特征體現(xiàn)在前6個(gè)固有模態(tài)函數(shù)分量中;因此只計(jì)算前6個(gè)固有模態(tài)函數(shù)分量的樣本熵來構(gòu)成各個(gè)電磁信號頻譜數(shù)據(jù)的特征向量。分別計(jì)算每種電磁信號頻譜數(shù)據(jù)的前6個(gè)固有模態(tài)函數(shù)(IMF)分量的樣本熵,結(jié)果如表2所示。表2第四步:將8種頻譜數(shù)據(jù)固有模態(tài)函數(shù)分量的特征向量,輸入FCM算法進(jìn)行分類,輸出分類結(jié)果;電磁信號頻譜數(shù)據(jù)的分類結(jié)果如表3所示;表3設(shè)備第1類第2類第3類第4類第5類筆記本電腦負(fù)線0.01010.96350.01550.00320.0077筆記本電腦正線0.00930.95980.02520.00460.0011臺式電腦負(fù)線0.00890.00310.00210.00470.9812臺式電腦正線0.00860.00300.00280.00230.9833吹風(fēng)機(jī)負(fù)線0.95990.00670.00950.00610.0178吹風(fēng)機(jī)正線0.96050.00780.00620.00800.0175打印機(jī)負(fù)線0.01010.01180.00190.97040.0058打印機(jī)正線0.00960.01230.00260.97300.0025第五步:結(jié)果分析:根據(jù)FCM算法的基本原理,表中的元素越接近于1,表明該元素所在行對應(yīng)的頻譜數(shù)據(jù)與其所在列對應(yīng)的類別相關(guān)程度越高。表3表明,筆記本電腦的正負(fù)線與第2類的相關(guān)程度分別為0.9598和0.9635,十分接近于1,因此將其歸為第1類頻譜數(shù)據(jù)。類似地,表3給出了其他3類頻譜數(shù)據(jù)的對應(yīng)關(guān)系。此方法的分類結(jié)果與電磁信號頻譜數(shù)據(jù)的情況完全吻合。因此,本發(fā)明的方法能夠有效地對電磁信號的頻譜數(shù)據(jù)進(jìn)行分類。當(dāng)前第1頁1 2 3