專利名稱:基于巴氏距離和有向無(wú)環(huán)圖構(gòu)建多分類支持向量機(jī)分類器的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于巴氏距離和有向無(wú)環(huán)圖構(gòu)建多分類支持向量機(jī)分類器的方 法,屬于模式識(shí)別領(lǐng)域。
背景技術(shù):
由Viadimir N. Vapnik與其同事所提出來(lái)的支持向量機(jī)(Support Vector Machine, SVM)作為一個(gè)強(qiáng)有力的機(jī)器學(xué)習(xí)方法,已成功地應(yīng)用于模式識(shí)別尤其是故障診 斷與分類領(lǐng)域。SVM采用基于統(tǒng)計(jì)學(xué)習(xí)理論的結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則(Structural Risk Minimizatiorfrinciple),能有效地解決非線性、有限樣本和高維數(shù)等問(wèn)題,通??梢蕴峁?良好的學(xué)習(xí)能力和推廣能力。支持向量機(jī)最初是針對(duì)二元分類問(wèn)題提出來(lái)的,不能直接用 于多元分類問(wèn)題,而大部分的故障診斷問(wèn)題為多元分類情況,如何有效地把它擴(kuò)展到多分 類情況是一個(gè)正在研究的熱點(diǎn)問(wèn)題,而且合理的多分類策略,能夠有效地組織各自分類器 的工作,提高子分類器精度并最終得到更好的決策分類精度。為了更有針對(duì)性地提升每個(gè)子分類器的分類性能,需要對(duì)每?jī)煞N類別之間的可分 性作出評(píng)定。最理想的可分性度量準(zhǔn)則是Bayes分類最小誤差。但由于通常情況下數(shù)據(jù)的 概率分布難以確定,導(dǎo)致Bayes分類誤差無(wú)法計(jì)算和分析。類別間Miattacharyya距離,即 巴氏距離,確定了 Bayes分類誤差的一個(gè)上界,也是模式識(shí)別中一種常用的分析手段。在應(yīng) 用中,假設(shè)同種類別的同一屬性數(shù)據(jù)值均服從高斯分布,則可用下式來(lái)求取兩種類別之間 的巴氏距離
權(quán)利要求
1.基于巴氏距離和有向無(wú)環(huán)圖構(gòu)建多分類支持向量機(jī)分類器的方法,其特征在于,該 方法包括以下步驟步驟一、對(duì)多分類對(duì)象,分別計(jì)算訓(xùn)練樣本中兩兩類別之間的巴氏距離; 步驟二、根據(jù)步驟一獲取的兩兩類別之間的巴氏距離建立初始操作表單; 步驟三、根據(jù)步驟二獲取的初始操作表單構(gòu)建基于有向無(wú)環(huán)圖結(jié)構(gòu)的多分類器; 步驟四、采用支持向量機(jī)作為二元分類器,基于有向無(wú)環(huán)圖結(jié)構(gòu)實(shí)施多分類。
2.根據(jù)權(quán)利要求1所述的基于巴氏距離和有向無(wú)環(huán)圖構(gòu)建多分類支持向量機(jī)分類器 的方法,其特征在于,步驟一中的兩兩類別之間的巴氏距離按如下公式獲取
3.根據(jù)權(quán)利要求1所述的基于巴氏距離和有向無(wú)環(huán)圖構(gòu)建多分類支持向量機(jī)分類器 的方法,其特征在于,步驟二中的建立初始操作表單的過(guò)程步驟21、將第k類與其他類的巴氏距離Bkt按從小到大的順序重新排列為
4.根據(jù)權(quán)利要求1所述的基于巴氏距離和有向無(wú)環(huán)圖構(gòu)建多分類支持向量機(jī)分類器 的方法,其特征在于,步驟三中的有向無(wú)環(huán)圖結(jié)構(gòu)共含有m(m-l)/2個(gè)二元分類器,依等差 數(shù)列分布于m-1層結(jié)構(gòu),則構(gòu)建基于有向無(wú)環(huán)圖結(jié)構(gòu)的多分類器的過(guò)程為第1層設(shè)置1個(gè)二元分類器,處理a (m)-a (1)之間的分類,得到“非a (m) ”和“非a (1),, 兩組數(shù)據(jù),將此分類器簡(jiǎn)記為;第2層設(shè)置2個(gè)二元分類器,第2層第一個(gè)分類器i^Mhd)對(duì)第1層得到的“非a (m),, 數(shù)據(jù)進(jìn)行二分類,進(jìn)一步得到“非a(m)&非a(m-l) ”和“非a(m)&非a(1) ”兩組數(shù)據(jù);第2層 第二個(gè)分類器對(duì)第1層得到的“非乂 1廣’數(shù)據(jù)進(jìn)行二分類,進(jìn)一步得到“非a⑴&非 a(m) ”和“非a(l)&非a(2) ”兩組數(shù)據(jù)。將第2層得到的4組數(shù)據(jù)中的“非a(m)&非a(1),, 與“非a (1) &非a (m),,合并,故第2層獲得3組數(shù)據(jù);依此類推,弟 m_l 層設(shè)直 m_l 個(gè)一兀分類器,分另Ij是
5.根據(jù)權(quán)利要求1所述的基于巴氏距離和有向無(wú)環(huán)圖構(gòu)建多分類支持向量機(jī)分類器 的方法,其特征在于,步驟四中采用支持向量機(jī)作為二元分類器,基于有向無(wú)環(huán)圖結(jié)構(gòu)實(shí)施 多分類的過(guò)程為對(duì)于類別{-1,+1},支持向量機(jī)分類器€00可表示為
全文摘要
基于巴氏距離和有向無(wú)環(huán)圖構(gòu)建多分類支持向量機(jī)分類器的方法,屬于模式識(shí)別領(lǐng)域,本發(fā)明為解決傳統(tǒng)多分類策略因結(jié)構(gòu)固定而無(wú)法利用類別間可分性不同的先驗(yàn)信息,訓(xùn)練速度隨著訓(xùn)練樣本數(shù)或類別數(shù)的增多而變慢,計(jì)算量大的問(wèn)題。本發(fā)明方法包括以下步驟步驟一、對(duì)多分類對(duì)象,分別計(jì)算訓(xùn)練樣本中兩兩類別之間的巴氏距離;步驟二、根據(jù)步驟一獲取的兩兩類別之間的巴氏距離建立初始操作表單;步驟三、根據(jù)步驟二獲取的初始操作表單構(gòu)建基于有向無(wú)環(huán)圖結(jié)構(gòu)的多分類器;步驟四、采用支持向量機(jī)作為二元分類器,基于有向無(wú)環(huán)圖結(jié)構(gòu)實(shí)施多分類。
文檔編號(hào)G06K9/62GK102122349SQ201110038900
公開日2011年7月13日 申請(qǐng)日期2011年2月16日 優(yōu)先權(quán)日2011年2月16日
發(fā)明者張淼, 沈毅, 王強(qiáng) 申請(qǐng)人:哈爾濱工業(yè)大學(xué)