一種基于模糊核聚類高階譜的數(shù)據(jù)分類方法
【專利摘要】本發(fā)明公開了一種基于模糊核聚類高階譜的數(shù)據(jù)分類方法,步驟是:a把原始數(shù)據(jù)進(jìn)行預(yù)處理,即分成已知的多類別數(shù)據(jù)和待分析的某類別數(shù)據(jù);b獲得學(xué)習(xí)樣本和訓(xùn)練樣本及其各自的高階譜分析結(jié)果;c對(duì)學(xué)習(xí)樣本和測(cè)試樣本的高階譜分析結(jié)果分別進(jìn)行模糊閾值處理,分別得到其模糊閾值處理結(jié)果;d對(duì)學(xué)習(xí)樣本的模糊閾值處理結(jié)果進(jìn)行模糊核聚類處理,獲取其模糊核聚類類別特征;e將測(cè)試樣本的模糊閾值處理結(jié)果和模糊核聚類類別特征進(jìn)行運(yùn)算,以判斷訓(xùn)練樣本的類別歸屬。本發(fā)明可以在樣本數(shù)量不穩(wěn)定的情況下、特別是小樣本情況下較好地提取模糊核聚類類別特征,獲得較好的數(shù)據(jù)分類效果。
【專利說明】一種基于模糊核聚類高階譜的數(shù)據(jù)分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)據(jù)分類方法的【技術(shù)領(lǐng)域】,尤其是一種基于模糊核聚類高階譜的數(shù)據(jù) 分類方法。
【背景技術(shù)】
[0002] 數(shù)據(jù)分類方法在各個(gè)領(lǐng)域都有著廣泛的應(yīng)用,如機(jī)械的故障識(shí)別、醫(yī)學(xué)心音信號(hào) 的識(shí)別與判決、圖像識(shí)別與歸類、信號(hào)特征識(shí)別等。如在故障診斷領(lǐng)域,故障診斷過程其實(shí) 就是對(duì)不同類別的故障特征進(jìn)行分類的過程,屬于數(shù)據(jù)分類的范疇。
[0003] 在以機(jī)器學(xué)習(xí)為代表的數(shù)據(jù)分類方法中,包括人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等,其基 本原理都是通過機(jī)器模擬人的思維方式去"學(xué)習(xí)"某些類別特征,并建立穩(wěn)定可靠的類別特 證庫,然后用測(cè)試樣本去與類別特征庫進(jìn)行對(duì)比以判斷其類別歸屬。這種方法對(duì)樣本數(shù)量 的要求較高,當(dāng)樣本數(shù)量不穩(wěn)定或者樣本數(shù)量較少時(shí),難以達(dá)到較好的學(xué)習(xí)效果,因而建立 的類別特征不具有代表性,容易產(chǎn)生類別識(shí)別錯(cuò)誤,進(jìn)而出現(xiàn)數(shù)據(jù)分類錯(cuò)誤。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的在于解決樣本數(shù)量不穩(wěn)定或者樣本數(shù)量較少時(shí),也能較好完成數(shù)據(jù) 分類,提出了一種基于模糊核聚類高階譜的數(shù)據(jù)分類方法,該方法克服了樣本數(shù)量不穩(wěn)定 或樣本數(shù)量較少的情況下數(shù)據(jù)分類存在的問題,在樣本數(shù)量不穩(wěn)定或樣本數(shù)量較少時(shí)也能 有效地提取類別特征,獲得較好的分類效果。
[0005] 本發(fā)明解決其技術(shù)問題所采用的技術(shù)方法是:
[0006] a對(duì)原始信號(hào)進(jìn)行預(yù)處理,得到學(xué)習(xí)樣本和訓(xùn)練樣本;
[0007] b對(duì)步驟a所得的學(xué)習(xí)樣本和訓(xùn)練樣本進(jìn)行高階譜分析,得到各自的高階譜分析 結(jié)果;
[0008] C對(duì)步驟b所得的學(xué)習(xí)樣本和測(cè)試樣本的高階譜分析結(jié)果進(jìn)行模糊閾值處理,分 別得到其模糊閾值處理結(jié)果;
[0009] d對(duì)步驟C所得的學(xué)習(xí)樣本的模糊閾值處理結(jié)果進(jìn)行模糊核聚類處理,獲取其模 糊核聚類類別特征;
[0010] e對(duì)步驟c所得的測(cè)試樣本的模糊閾值處理結(jié)果和步驟d)所得的模糊核聚類類別 特征進(jìn)行運(yùn)算,以判斷訓(xùn)練樣本的類別歸屬。
[0011] 優(yōu)選地,所述步驟a中對(duì)傳感器采集到的原始信號(hào)進(jìn)行預(yù)處理,得到已知共計(jì)m類 的數(shù)據(jù),每一類數(shù)據(jù)取出η段數(shù)據(jù),則得到mXn段供訓(xùn)練使用的學(xué)習(xí)樣本,記為L(zhǎng) (i,j)(其 中i = l,...,m,j = l,...,n);對(duì)于待分析類別的數(shù)據(jù),取k段作為測(cè)試樣本以供測(cè)試使 用,記為T(i)(其中i = 1,...,k)。其中,每段數(shù)據(jù)的長(zhǎng)度1可以根據(jù)計(jì)算條件而人為確 定。
[0012] 優(yōu)選地,所述步驟b中的高階譜分析是指如下運(yùn)算:
【權(quán)利要求】
1. 一種基于模糊核聚類高階譜的數(shù)據(jù)分類方法,其分類方法包括(a)、(b)、(c)、(d)、 (e)五個(gè)步驟,其特征是: (a) 對(duì)原始信號(hào)進(jìn)行預(yù)處理,得到已知共計(jì)m類的數(shù)據(jù),每一類數(shù)據(jù)取出η段數(shù)據(jù),則 得到mXn段供訓(xùn)練使用的學(xué)習(xí)樣本,記為L(zhǎng)(i,j)(其中i= 1,. . .,m,j= 1,. . .,η);對(duì)于 待分析類別的數(shù)據(jù),取k段作為測(cè)試樣本以供測(cè)試使用,記為T(i)(其中i= 1,. . .,k)。其 中,每段數(shù)據(jù)的長(zhǎng)度1可以根據(jù)計(jì)算條件確定; (b) 高階譜分析運(yùn)算:
式中,c3x為隨機(jī)變量X的3階累積量,Bx(Q1,ω2)為輸出的高階譜結(jié)果; 學(xué)習(xí)樣本L(i,j)的高階譜分析結(jié)果記為BuU(O1,ω2)(其中i= 1,. . .,m,j= 1,· · ·,η),測(cè)試樣本T(i)的高階譜分析結(jié)果記為BT(i) (O1,ω2)(其中i= 1,· · ·,k); (c) 模糊閾值處理,對(duì)步驟(b)中的高階譜分析結(jié)果ρω2)和Bt⑴(O1,ω2) 分別進(jìn)行如下運(yùn)算:
式中,Βχ(ωι,ω2)為高階譜分析結(jié)果,N為該高階譜分析結(jié)果的長(zhǎng)度,T為閾值,ΒΒχ(ωι,ω2)為運(yùn)算結(jié)果; 步驟(c)中的模糊閾值運(yùn)算Bui^ (O1,ω2)和BT(i) (O1,ω2)的運(yùn)算結(jié)果分別記為BBL(i,j) (ωι,ω2)(其中i= 1,· · ·,m,J· = 1,· · ·,η)和ββτ⑴(ωι,ω2)(其中i= 1,· · ·,k); (d) 模糊核聚類處理,是指對(duì)η段同類別的運(yùn)算結(jié)果Β^^(ωι,ω2)進(jìn)行如下運(yùn)算: η 萬</>(斗⑴?J (斗%M(其中i= 1,· · ·,m,j= 1,· · ·,η) (4) i-ι 運(yùn)算獲得模糊核聚類類別特征、即共得到m種類別的每一類特征BmUi)(ωi,ω2)(其中i=I,. . .,m); (e) 將步驟(c)中通過訓(xùn)練樣本獲得的模糊閾值運(yùn)算結(jié)果ΒΒτω(ωι,ω2)和步驟(d) 中通過學(xué)習(xí)樣本獲得的模糊核聚類類別特征Β_ω(ωι,ω2)分別進(jìn)行如下運(yùn)算:
(其中i= 1,· · ·,k,j= 1,· · ·,m) (5)
在結(jié)果BMK(i,j)中,每一個(gè)行向量中的最小值對(duì)應(yīng)的模糊核聚類類別特征Bmui) (ωι,ω2)即是該測(cè)試樣本的歸屬。
【文檔編號(hào)】G06F19/00GK104462831SQ201410768532
【公開日】2015年3月25日 申請(qǐng)日期:2014年12月12日 優(yōu)先權(quán)日:2014年12月12日
【發(fā)明者】劉文藝, 張昱, 韓繼光, 楊存智 申請(qǐng)人:江蘇師范大學(xué)