專利名稱:模式識(shí)別中的非超球面幾何形體覆蓋方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計(jì)算機(jī)技術(shù)領(lǐng)域,特別是指一種模式識(shí)別中的非超球面幾何形體覆蓋方法。
在這種方法中,模式識(shí)別系統(tǒng)先根據(jù)訓(xùn)練樣本的種類和分布特征對(duì)空間進(jìn)行完全的劃分,即將樣本空間完全劃分為已知類型樣本空間的組合。在識(shí)別的時(shí)候,則根據(jù)特征函數(shù)將要識(shí)別的樣本根據(jù)一定的判定規(guī)則將樣本歸入已經(jīng)劃分好的某一空間。比如,在
圖1只有三種類型樣本的系統(tǒng)中,則根據(jù)訓(xùn)練樣本經(jīng)過訓(xùn)練后,系統(tǒng)將樣本空間劃分為R1、R2和R3三個(gè)空間,在識(shí)別的時(shí)候,如果有樣本A,則樣本A根據(jù)某一判定規(guī)則必然落入這三個(gè)空間中其中的一個(gè),即將A識(shí)別成R1、R2或R3中的一類。在這種方法中,存在兩個(gè)問題1、線性函數(shù)(超平面)不能適應(yīng)樣本空間分布復(fù)雜的系統(tǒng)中,導(dǎo)致誤識(shí)率很大,如圖1中,R2中的樣本部分就分在了R1中。
2、由于一般的模式識(shí)別方法是基于分類的思想,即將根據(jù)已知樣本的類型數(shù)目將樣本空間劃分成相應(yīng)數(shù)目的子空間,這樣必然導(dǎo)致這樣的結(jié)果即在上例中,如果有另一新類數(shù)據(jù)輸入到上述系統(tǒng)中,這個(gè)新類必然被錯(cuò)誤的分在R1、R2或R3中的一個(gè)類中,而不能標(biāo)識(shí)為新類R4,這導(dǎo)致由該方法構(gòu)造的模式識(shí)別系統(tǒng)的誤識(shí)率不可避免的存在。
改進(jìn)的方法中采用了非線性的函數(shù)將樣本空間根據(jù)樣本類型的數(shù)目劃分成相應(yīng)數(shù)目的子空間,如圖2所示。
在這種方法中,解決了線性函數(shù)(超平面)不能適應(yīng)樣本空間分布復(fù)雜的情況。同類的解決辦法(如支持向量機(jī)SVM)還有將低維的線性不可分的樣本空間映射到高維的線性可分的空間,然后再用線性函數(shù)(超平面)按原來的方法對(duì)空間進(jìn)行劃分。但是,這些方法都沒有解決上述的第二個(gè)問題。
最近的神經(jīng)網(wǎng)絡(luò)理論中提出了徑向基函數(shù)網(wǎng)絡(luò)(RBF網(wǎng)絡(luò)),該網(wǎng)絡(luò)采用超球面作為分類函數(shù)(面),如圖3所示。
在該方法中,選擇一個(gè)超球面,將一類樣本劃分成一個(gè)獨(dú)立的子空間。與傳統(tǒng)方法不同的是,這種方法劃分出來的子空間是一個(gè)封閉的空間,這樣,可以降低對(duì)未知類型的誤識(shí)率。如圖3中,R1和R2為已知類空間,R0未知類空間。
但是,該方法仍然存在兩個(gè)問題1、在設(shè)計(jì)思想上,還是沿襲原有的分類思想,沒有能從根本上提出解決“分類”思想本身不合理性的方法。
2、利用超球面來進(jìn)行樣本空間的劃分,在高維空間中,有可能會(huì)帶來非常大的誤識(shí)率。因?yàn)闃颖驹诟呔S空間中的分布一般不是一個(gè)超球,如圖4,如果這時(shí)候用一個(gè)超球體對(duì)樣本空間進(jìn)行包含,會(huì)將許多不屬于樣本空間的空間錯(cuò)誤地劃分為該樣本空間,而且隨著空間維數(shù)的增大,其RBF樣本空間與實(shí)際樣本空間的比值成指數(shù)增長(zhǎng),從而帶來很大地誤識(shí)率。本專利采用了非超球面的復(fù)雜幾何形體覆蓋方法,能夠克服超球面覆蓋所帶來的大誤識(shí)率問題,顯著提高了模式識(shí)別系統(tǒng)的性能。
本發(fā)明一種模式識(shí)別中的非超球面幾何形體覆蓋方法,其特征在于,包括如下步驟(1)初始化樣本空間,將樣本空間分成已知樣本子空間和未知樣本子空間兩大類;
(2)開始針對(duì)某種類型樣本的訓(xùn)練;(3)根據(jù)規(guī)則構(gòu)造同類型樣本之間的相互關(guān)系,構(gòu)造該樣本子空間;(4)采用非超球面的幾何形體對(duì)每種類型樣本子空間進(jìn)行覆蓋;(5)形成封閉的樣本子空間。
其中所述的初始化樣本空間,即在劃分一個(gè)類型的樣本子空間的時(shí)候,采用封閉的幾何形體進(jìn)行覆蓋,從而構(gòu)造一個(gè)有限的和封閉的空間。
其中所述的開始針對(duì)某種類型樣本的訓(xùn)練,是系統(tǒng)認(rèn)識(shí)樣本的過程是指在構(gòu)造樣本子空間的過程中,不依賴其它類型樣本的分布,僅僅需要考慮該類型樣本自身的分布,在樣本空間中構(gòu)造出該類型樣本的相應(yīng)子空間。
其中所述的根據(jù)一種類型的訓(xùn)練樣本在空間的分布關(guān)系構(gòu)造該樣本子空間是指在訓(xùn)練過程中構(gòu)造某類型樣本子空間的時(shí)候,依靠該類型訓(xùn)練樣本自身之間的關(guān)系,并采用一定的規(guī)則,構(gòu)造出盡可能符合該類型樣本實(shí)際分布的子空間。
其中采用非超球面的幾何形體對(duì)每種類型的樣本子空間進(jìn)行覆蓋,是指在根據(jù)訓(xùn)練樣本劃分樣本子空間時(shí),是根據(jù)訓(xùn)練樣本在樣本空間中的分布采用相對(duì)復(fù)雜的幾何形體進(jìn)行覆蓋,從而得到更接近實(shí)際樣本子空間形體的樣本子空間。
其中所述的形成封閉的樣本子空間,是將已知樣本空間和未知樣本空間兩大類,即一個(gè)樣本空間的組成是由若干個(gè)已知的有限的封閉的樣本子空間和一個(gè)未知的無(wú)限的開放的未知空間組成。
圖5是本發(fā)明樣本空間的構(gòu)成示意圖;圖6是本發(fā)明非超球面復(fù)雜幾何形體覆蓋方法示意圖;圖7是本發(fā)明模式識(shí)別中的非超球面幾何形體覆蓋方法流程圖;圖8是本發(fā)明實(shí)施例實(shí)物識(shí)別系統(tǒng)結(jié)構(gòu)圖;圖9是本發(fā)明實(shí)施例實(shí)物識(shí)別系統(tǒng)在樣本空間中的幾何形體形成示意圖。
表1是本發(fā)明方法和其它模式識(shí)別方法在實(shí)物識(shí)別系統(tǒng)中的效果比較表1
該系統(tǒng)在使用了本發(fā)明的方法后,性能得到了大幅度提高,已訓(xùn)練物體識(shí)別率達(dá)到了99%以上,未訓(xùn)練物體誤識(shí)率降到了1%以下,即基本上消除了誤識(shí)率。表1是該系統(tǒng)應(yīng)用其它方法和本發(fā)明方法的效果比較。
本發(fā)明主要思想是根據(jù)已知樣本類型對(duì)樣本空間進(jìn)行劃分,即是基于“分類”的思想。在這種方法中,在分類的時(shí)候需要根據(jù)已知樣本(訓(xùn)練樣本)相互之間的特點(diǎn)進(jìn)行樣本空間的劃分;如果已經(jīng)訓(xùn)練好的一個(gè)系統(tǒng)中要識(shí)別一個(gè)新類,那么必然會(huì)把該新類錯(cuò)分到已經(jīng)存在的類中,不符合實(shí)際的人的認(rèn)知情況。后來出現(xiàn)的RBF方法對(duì)這種情況做了一些改進(jìn),但是并沒有從基本思想方法上解決現(xiàn)有模式識(shí)別辦法中存在的缺陷,從而難以提高識(shí)別率和降低誤識(shí)率。本申請(qǐng)專利從基本思想上否定了原有的模式識(shí)別方法,提出了基于“認(rèn)識(shí)”的思想的模式識(shí)別方法,有效地提高了模式識(shí)別系統(tǒng)的性能。
請(qǐng)參閱圖7所示,本發(fā)明一種模式識(shí)別中的非超球面幾何形體覆蓋方法,包括如下步驟(1)初始化樣本空間,將樣本空間分成已知樣本子空間和未知樣本子空間兩大類;其中所述的初始化樣本空間,即在劃分一個(gè)類型的樣本子空間的時(shí)候,采用封閉的幾何形體進(jìn)行覆蓋,從而構(gòu)造一個(gè)有限的和封閉的空間;(2)開始針對(duì)某種類型樣本的訓(xùn)練;其中所述的開始針對(duì)某種類型樣本的訓(xùn)練,是系統(tǒng)認(rèn)識(shí)樣本的過程是指在構(gòu)造樣本子空間的過程中,不依賴其它類型樣本的分布,僅僅需要考慮該類型樣本自身的分布,在樣本空間中構(gòu)造出該類型樣本的相應(yīng)子空間;(3)根據(jù)規(guī)則構(gòu)造同類型樣本之間的相互關(guān)系,構(gòu)造該樣本子空間;其中所述的根據(jù)一種類型的訓(xùn)練樣本在空間的分布關(guān)系構(gòu)造該樣本子空間是指在訓(xùn)練過程中構(gòu)造某類型樣本子空間的時(shí)候,依靠該類型訓(xùn)練樣本自身之間的關(guān)系,并采用一定的規(guī)則,構(gòu)造出盡可能符合該類型樣本實(shí)際分布的子空間;(4)采用非超球面的幾何形體對(duì)每種類型樣本子空間進(jìn)行覆蓋;其中采用非超球面的幾何形體對(duì)每種類型的樣本子空間進(jìn)行覆蓋,是指在根據(jù)訓(xùn)練樣本劃分樣本子空間時(shí),是根據(jù)訓(xùn)練樣本在樣本空間中的分布采用相對(duì)復(fù)雜的幾何形體進(jìn)行覆蓋,從而得到更接近實(shí)際樣本子空間形體的樣本子空間;(5)形成封閉的樣本子空間;其中所述的形成封閉的樣本子空間,是將已知樣本空間和未知樣本空間兩大類,即一個(gè)樣本空間的組成是由若干個(gè)已知的有限的封閉的樣本子空間和一個(gè)未知的無(wú)限的開放的未知空間組成。
本技術(shù)方案基于以下三點(diǎn)認(rèn)識(shí)1、模式識(shí)別的問題在于對(duì)每個(gè)特殊物體(樣本類型)的“認(rèn)識(shí)”,而不是對(duì)有限個(gè)物體(樣本類型)進(jìn)行“區(qū)別”和樣本空間的“劃分”。
2、一個(gè)樣本(或認(rèn)知)空間應(yīng)該是有若干個(gè)已知類型的封閉的樣本子空間和一個(gè)未知類型的開放的樣本空間組成,如圖5。當(dāng)一個(gè)樣本A進(jìn)入識(shí)別系統(tǒng)的時(shí)候,如果它是已知的樣本類型(認(rèn)識(shí)的情況),那么A應(yīng)該落在一個(gè)已知樣本空間中,否則(不認(rèn)識(shí)的情況),A就應(yīng)該落在未知樣本空間中。這個(gè)過程,是”認(rèn)識(shí)”一個(gè)樣本的過程。一個(gè)符合實(shí)際的智能系統(tǒng),如人腦,正是如此構(gòu)成的,比如一個(gè)人對(duì)已知的事物,他會(huì)很快說出該事物的名字,如果是不認(rèn)識(shí)的事物,則他會(huì)說“不認(rèn)識(shí)”。
2、一個(gè)樣本類型在樣本空間中的分布一般來說是不規(guī)則的,是一個(gè)復(fù)雜的幾何形體,并不是簡(jiǎn)單的超球面所能概括和覆蓋的,如果用簡(jiǎn)單的超球面來覆蓋,那么必然造成很大的誤差,從而導(dǎo)致比較大的誤識(shí)率。
本方案在基于上述三點(diǎn)認(rèn)識(shí)的基礎(chǔ)上,提出了非超球面的幾何形體覆蓋方法,如圖6所示。在本方案中,根據(jù)某樣本類型在高維空間中的分布特征,采用封閉的幾何形體對(duì)該樣本特征空間進(jìn)行覆蓋,從而避免了采用超球面覆蓋所造成的大量誤識(shí)空間。對(duì)于未覆蓋的空間,如圖6中的R0空間,則標(biāo)志為未知空間。在實(shí)現(xiàn)該方案時(shí),先將所有訓(xùn)練樣本映射到高維空間,然后根據(jù)各種樣本類型在高維空間的分布形體,分別采用復(fù)雜的幾何形體進(jìn)行覆蓋,得到了各類型的樣本子空間。在識(shí)別的時(shí)候,如果樣本落入到某一個(gè)樣本類型所對(duì)應(yīng)的幾何形體內(nèi),則該樣本歸為該類;如果該樣本不落入任何一個(gè)幾何形體內(nèi),則該樣本為未知類型樣本,即“不認(rèn)識(shí)”該樣本。本方案通過非超球面的幾何形體覆蓋的方法,有效降低了模式識(shí)別系統(tǒng)的誤識(shí)率,提高了模式識(shí)別系統(tǒng)的性能。
權(quán)利要求
1.一種模式識(shí)別中的非超球面幾何形體覆蓋方法,其特征在于,包括如下步驟(1)初始化樣本空間,將樣本空間分成已知樣本子空間和未知樣本子空間兩大類;(2)開始針對(duì)某種類型樣本的訓(xùn)練;(3)根據(jù)規(guī)則構(gòu)造同類型樣本之間的相互關(guān)系,構(gòu)造該樣本子空間;(4)采用非超球面的幾何形體對(duì)每種類型樣本子空間進(jìn)行覆蓋;(5)形成封閉的樣本子空間。
2.根據(jù)權(quán)利要求1所述的非超球面幾何形體覆蓋方法,其特征在于其中所述的初始化樣本空間,即在劃分一個(gè)類型的樣本子空間的時(shí)候,采用封閉的幾何形體進(jìn)行覆蓋,從而構(gòu)造一個(gè)有限的和封閉的空間。
3.根據(jù)權(quán)利要求1所述的非超球面幾何形體覆蓋方法,其特征在于其中所述的開始針對(duì)某種類型樣本的訓(xùn)練,是系統(tǒng)認(rèn)識(shí)樣本的過程是指在構(gòu)造樣本子空間的過程中,不依賴其它類型樣本的分布,僅僅需要考慮該類型樣本自身的分布,在樣本空間中構(gòu)造出該類型樣本的相應(yīng)子空間。
4.根據(jù)權(quán)利要求1所述的非超球面幾何形體覆蓋方法,其特征在于其中所述的根據(jù)一種類型的訓(xùn)練樣本在空間的分布關(guān)系構(gòu)造該樣本子空間是指在訓(xùn)練過程中構(gòu)造某類型樣本子空間的時(shí)候,依靠該類型訓(xùn)練樣本自身之間的關(guān)系,并采用一定的規(guī)則,構(gòu)造出盡可能符合該類型樣本實(shí)際分布的子空間。
5.根據(jù)權(quán)利要求1所述的非超球面幾何形體覆蓋方法,其特征在于其中采用非超球面的幾何形體對(duì)每種類型的樣本子空間進(jìn)行覆蓋,是指在根據(jù)訓(xùn)練樣本劃分樣本子空間時(shí),是根據(jù)訓(xùn)練樣本在樣本空間中的分布采用相對(duì)復(fù)雜的幾何形體進(jìn)行覆蓋,從而得到更接近實(shí)際樣本子空間形體的樣本子空間。
6.根據(jù)權(quán)利要求1所述的非超球面幾何形體覆蓋方法,其特征在于其中所述的形成封閉的樣本子空間,是將已知樣本空間和未知樣本空間兩大類,即一個(gè)樣本空間的組成是由若干個(gè)已知的有限的封閉的樣本子空間和一個(gè)未知的無(wú)限的開放的未知空間組成。
全文摘要
一種模式識(shí)別中的非超球面幾何形體覆蓋方法,其特征在于,包括如下步驟(1)初始化樣本空間,將樣本空間分成已知樣本子空間和未知樣本子空間兩大類;(2)開始針對(duì)某種類型樣本的訓(xùn)練;(3)根據(jù)規(guī)則構(gòu)造同類型樣本之間的相互關(guān)系,構(gòu)造該樣本子空間;(4)采用非超球面的幾何形體對(duì)每種類型樣本子空間進(jìn)行覆蓋;(5)形成封閉的樣本子空間。
文檔編號(hào)G06N3/00GK1464478SQ0212483
公開日2003年12月31日 申請(qǐng)日期2002年6月20日 優(yōu)先權(quán)日2002年6月20日
發(fā)明者王守覺, 石寅, 魯華祥, 王志海 申請(qǐng)人:中國(guó)科學(xué)院半導(dǎo)體研究所