專利名稱:一種漢字圖片的部件識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計(jì)算機(jī)虛擬現(xiàn)實(shí)技術(shù)領(lǐng)域,特別是漢字圖片的骨架提取、筆段生成的圖像處理領(lǐng)域以及基于語義知識(shí)的部件識(shí)別的模式識(shí)別領(lǐng)域。
背景技術(shù):
作為表意文字的典型代表,中文書寫和語音文字書寫有較大的差別。象形文集結(jié)構(gòu)研究表示,組成漢字的有著明確含義的各個(gè)部分被定義為部件,而漢字可以看成是由各個(gè)部件通過不同的組合方式組合而成。利用,像“桃”和“李”兩個(gè)字,他們之中都有一個(gè)“木”的部件,實(shí)際上代表著有樹的意思。因此,如何將一個(gè)漢字拆分成各個(gè)具有具體語義信息的部件的組合成為漢字學(xué)習(xí)中一個(gè)比較重要的部分。目前,漢字圖片的識(shí)別大致可以分為兩類,基于統(tǒng)計(jì)方法和基于結(jié)構(gòu)方法兩種?;?于統(tǒng)計(jì)的方法傾向于利用圖片的圖像特征,如像素布局等,將漢字的識(shí)別轉(zhuǎn)換成目標(biāo)圖片與標(biāo)準(zhǔn)庫圖片的相似度計(jì)算。而結(jié)構(gòu)識(shí)別方法傾向于描述漢字的結(jié)構(gòu)關(guān)系和漢字的筆畫特征,如利用筆畫間的夾角、相對位置關(guān)系來描述結(jié)構(gòu),最后通過總體結(jié)構(gòu)的相似度計(jì)算完成識(shí)別。利用統(tǒng)計(jì)方法解決漢字識(shí)別問題,當(dāng)前已經(jīng)有了許多的研究工作。例如,k近鄰分類器、k均值聚類、高斯分布、非線性形狀模型以及上下文向量法?;诮y(tǒng)計(jì)特征的方法是速度較快,且對噪聲的抵抗能力較強(qiáng),但對于像“王”和“玉”這樣結(jié)構(gòu)相近的兩個(gè)字容易造成識(shí)別上的錯(cuò)誤。而結(jié)構(gòu)方法傾向于將漢字分解為各個(gè)部分,通過對拆分出的部分的分析,進(jìn)而得到識(shí)別的結(jié)果??梢杂脕肀碚鳚h字結(jié)構(gòu)的常用的特征有輪廓、筆畫等。事實(shí)上,對于結(jié)構(gòu)識(shí)別而言,其實(shí)質(zhì)實(shí)際上就是一個(gè)筆畫匹配的過程。結(jié)構(gòu)方法的特點(diǎn)就是可以區(qū)分細(xì)小的差另IJ,從而識(shí)別出結(jié)構(gòu)相似的不同漢字,但識(shí)別速度會(huì)有所限制。
發(fā)明內(nèi)容
本發(fā)明的技術(shù)解決問題克服現(xiàn)有技術(shù)的不足,提供一種漢字圖片的部件識(shí)別方法,能夠有效的提聞識(shí)別率。本發(fā)明技術(shù)解決方案一種漢字圖片的部件識(shí)別方法,實(shí)現(xiàn)步驟如下步驟(I)、漢字部件的筆畫與結(jié)構(gòu)關(guān)系描述對已經(jīng)有的標(biāo)準(zhǔn)的漢字514個(gè)部件圖片進(jìn)行骨架提取處理,并檢測特征點(diǎn),這里描述的特征點(diǎn)為筆畫的端點(diǎn)和筆畫之間的交叉點(diǎn),這樣可以通過這些特征點(diǎn)之間的連線來檢測初始筆段;從一個(gè)特征點(diǎn)通過骨架上的其他點(diǎn)找到另外一個(gè)特征點(diǎn)的路徑,將這個(gè)路徑記錄稱之為初始筆段,所述特征點(diǎn)定義為交叉點(diǎn)或者是端點(diǎn);然后通過人為的交互將所述初始筆段進(jìn)行合并,得到標(biāo)記好的漢字部件的筆畫;對得到的部件筆畫進(jìn)行Gabor特征的提取,描述漢字部件筆畫的方向特征,將每一個(gè)筆畫描述為一個(gè)4維向量和一個(gè)4*4協(xié)方差矩陣的高斯分布,完成筆畫的統(tǒng)計(jì)建模;通過最大熵原理,鄰居筆畫的選取可以讓近似結(jié)構(gòu)關(guān)系,即將部件中一個(gè)筆畫與其他所有筆畫的結(jié)構(gòu)關(guān)系近似為相對于自己鄰居的結(jié)構(gòu)關(guān)系,這里的結(jié)構(gòu)關(guān)系可以用條件概率描述,即在某個(gè)筆畫鄰居被匹配后,該筆畫匹配時(shí)需要采用條件概率計(jì)算,所述鄰居筆畫是指除了本身以外,漢字部件中其他筆畫中對該筆畫影響值最大的一個(gè)筆畫,這個(gè)影響值通過兩個(gè)協(xié)方差矩陣的差的模取對數(shù)描述;然后提取互為鄰居的兩個(gè)筆畫局部特征,所述局部特征為兩個(gè)互為鄰居的筆畫的中心相對位置、長度比例和角度差,將這些計(jì)算好的局部特征的信息進(jìn)行存儲(chǔ),這里所做的部件筆畫標(biāo)注和特征提取可以用來幫助識(shí)別輸入漢字中的部件;步驟(2)、部件候選筆畫生成對輸入的漢字圖片進(jìn)行圖像細(xì)化和骨架提取之后,檢測細(xì)化和骨架提取之后的圖片中的端點(diǎn)和交叉點(diǎn)作為特征點(diǎn),通過尋找特征點(diǎn)間通過骨架的連線來尋找初始筆段,檢測出初始筆段后,針對待匹配的部件的某個(gè)筆畫,概率組合這些初始筆段,形成可能匹配對應(yīng)部件這個(gè)筆畫的一組筆畫,稱之為候選筆畫(由初始筆段針對待匹配部件的對應(yīng)筆畫組合而成),之后便可以利用這些候選筆畫去和目標(biāo)部件的合并好的筆畫進(jìn)行匹配;步驟(3)、基于目標(biāo)部件生成可能解重復(fù)的利用步驟2的方法,對步驟I中初始 筆段合并為筆畫做匹配,對于庫中每一個(gè)部件,都得到一個(gè)可能的部件匹配的解,即針對各個(gè)部件生成可能解,這個(gè)匹配過程描述為一個(gè)矩陣,每一列表示目標(biāo)部件中的各個(gè)筆畫,某一列的每一行都存儲(chǔ)著依據(jù)步驟(2)中方法得到的目標(biāo)部件筆畫的候選筆畫,整個(gè)匹配過程就是尋找一個(gè)從第一列找到最后一列,每一列都找到一個(gè)可行節(jié)點(diǎn)的解中相似度最大的值,從而將得到輸入漢字圖片,對于庫中所有部件生成的最可能匹配的結(jié)果;所述相似度描述為每一個(gè)筆畫匹配時(shí)的由高斯函數(shù)計(jì)算出的概率值的累積。利用上述的方法,對于輸入漢字的提取出的所有初始筆段,可以尋找到針對部件庫中每一個(gè)部件的最可能的匹配解,為后續(xù)的步驟4的算法提供數(shù)據(jù);步驟(4)、基于部件最優(yōu)組合原理得到識(shí)別結(jié)果在得到步驟3生成的針對各個(gè)部件的可能解之后,利用最優(yōu)選取的策略,將部件識(shí)別的問題轉(zhuǎn)化為一個(gè)背包問題,即認(rèn)為如果可以找到一組由步驟3中得到的各個(gè)部件的可能解,且互相之間沒有在初始筆段的占用上存在沖突,且最大程度的占用了初始筆段,這樣的一組部件解即為識(shí)別的最優(yōu)解,輸入漢字的初始筆段相當(dāng)于是一個(gè)背包,背包的大小為檢測出的初始筆段數(shù)目,而在步驟3中尋找部件匹配的可能的解時(shí),標(biāo)記該部件識(shí)別的可能解占用了哪些輸入漢字的初始筆段,這樣就可以完成整個(gè)識(shí)別的過程。進(jìn)一步的,所述步驟(I)中對漢字部件的筆畫與結(jié)構(gòu)關(guān)系描述的具體內(nèi)容如下步驟(Al)、將部件圖片進(jìn)行圖像細(xì)化和骨架提取,檢測特征點(diǎn),如筆畫之間的交叉點(diǎn)和筆畫端點(diǎn),通過尋找特征點(diǎn)之間的路徑提取出初始筆段。通過適當(dāng)?shù)娜藶榻换?,合并一些初始筆段,形成比較標(biāo)準(zhǔn)的筆畫。步驟(A2 )、對已經(jīng)合并好的筆畫,對其進(jìn)行Gabor濾波,得到每個(gè)點(diǎn)4個(gè)方向(0°,45°,90° ,135° )的響應(yīng)值,這樣將每個(gè)筆畫描述為一個(gè)具有4維向量和4*4協(xié)方差矩陣的高斯函數(shù)。隨后利用最大熵的原理,計(jì)算每個(gè)筆畫的鄰居,這里的鄰居定義為除了自身其他筆畫對該筆畫影響最大的筆畫,影響值由兩個(gè)協(xié)方差矩陣的差的模取對數(shù)描述,隨后提取局部特征,將互為鄰居的筆畫的相對長度比例、中心相對位置等計(jì)算并存儲(chǔ)。進(jìn)一步的,所述步驟(2)部件候選筆畫生成的步驟具體如下
步驟(BI)、將部件圖片進(jìn)行圖像細(xì)化和骨架提取,檢測特征點(diǎn),如筆畫之間的交叉點(diǎn)和筆畫端點(diǎn),通過尋找特征點(diǎn)之間的路徑提取出初始筆段。步驟(B2)、對某個(gè)目標(biāo)部件進(jìn)行識(shí)別時(shí),目的是要將對應(yīng)的部件的各個(gè)筆畫得到,進(jìn)而需要尋找的就是針對部件的每一個(gè)筆畫,都會(huì)自動(dòng)生成一組可能的解,這些解有可能是初始筆段,也有可能是一些初始筆段的組合結(jié)果。所以定義組合規(guī)則為兩個(gè)筆段首尾相連且方向差不超過15°,或者其中一個(gè)筆段足夠短小,這樣就可以將兩個(gè)筆段合成作為可能的筆畫匹配解加入到候選筆畫隊(duì)列中。進(jìn)一步的,所述步驟(3)中基于目標(biāo)部件生成可能解的步驟如下
步驟(Cl)、構(gòu)建搜索圖,這張圖的描述如下,每一列表示待匹配的部件的各個(gè)標(biāo)注好的筆畫,而某一列中的每一行都表示著對于這個(gè)部件的筆畫的由輸入漢字的初始筆段生成的候選筆畫,這樣就將匹配問題轉(zhuǎn)化成了一個(gè)圖的搜索過程,目標(biāo)變?yōu)橐乙粋€(gè)每一列都找到一個(gè)點(diǎn),從第一列找到最后一列的所有可行解中相似度最大的解。步驟(C2)、圖的搜索過程規(guī)則如下第一,在匹配某一個(gè)筆畫時(shí),如果待匹配的候選筆畫在對輸入漢字的初始筆段占用上與前面已經(jīng)選取的候選筆畫相沖突,那么該候選筆畫不能被選取。第二,在匹配某一個(gè)筆畫時(shí),如果作為這個(gè)筆畫的鄰居的筆畫已經(jīng)在前面的路徑中被選取了,那么要采用條件概率計(jì)算,并引入之前存儲(chǔ)的局部特征信息,計(jì)算這個(gè)待匹配的候選筆畫和前面已經(jīng)匹配的候選筆畫的中心相對位置關(guān)系、筆畫長度比例等。進(jìn)一步的,所述步驟(4)中基于部件最優(yōu)組合原理得到識(shí)別結(jié)果的步驟如下步驟(D1)、利用步驟(3)中得到的對于各個(gè)部件生成的可能解,尋找最優(yōu)的組合作為輸入漢字的部件識(shí)別結(jié)果。這里將問題描述為尋找一組最優(yōu)的組合,使得組合中這些部件可能解在對輸入漢字的初始筆段的占用上不沖突,且最大程度上的消耗掉輸入漢字的初始筆段。定義這樣的組合為輸入漢字的最優(yōu)的部件識(shí)別的結(jié)果。利用動(dòng)態(tài)規(guī)劃思想,將上述問題轉(zhuǎn)化為一個(gè)背包問題,背包的容量為輸入漢字的初始筆段數(shù)目,每一個(gè)可能的部件識(shí)別解都有一個(gè)標(biāo)記數(shù)組來標(biāo)記這個(gè)可能解對輸入漢字的初始筆段的占用情況,這樣相當(dāng)于選取不沖突的幾件物品放入背包中,使得背包盡可能的放滿。本發(fā)明與現(xiàn)有技術(shù)相比的優(yōu)點(diǎn)在于(I)本發(fā)明考慮到在輸出漢字中識(shí)別部件是一個(gè)更趨向于局部識(shí)別的過程,加入條件概率的基礎(chǔ)上,加入局部特征描述,例如互為鄰居的兩個(gè)筆畫之間的中心相對位置、長度比例和角度差等,實(shí)驗(yàn)證明,本發(fā)明中局部特征的加入可以有效的提高識(shí)別率。(2)本發(fā)明通過最優(yōu)組合的策略選擇結(jié)果,是為了避免在識(shí)別過程中不同的部件閾值不好統(tǒng)一的問題,可以得到一個(gè)最優(yōu)的部件識(shí)別結(jié)果,提高的識(shí)別的準(zhǔn)確率。
圖I為本發(fā)明的一種漢字圖片的部件識(shí)別方法的整體過程示意圖;圖2為本發(fā)明的部件候選筆畫生成的結(jié)果圖;圖3為本發(fā)明的基于部件最優(yōu)組合原理得到識(shí)別結(jié)果的示意圖;圖4為本發(fā)明的部分漢字部件識(shí)別的結(jié)果圖。
具體實(shí)施方式
下面結(jié)合附圖與實(shí)例對本發(fā)明作進(jìn)一步詳細(xì)描述本發(fā)明實(shí)施過程包括四個(gè)主要步驟漢字部件的筆畫與結(jié)構(gòu)關(guān)系描述,部件候選筆畫生成,基于目標(biāo)部件生成可能解,基于部件最優(yōu)組合原理得到識(shí)別結(jié)果。如圖I所示,本發(fā)明具體實(shí)現(xiàn)如下步驟一漢字部件的筆畫與結(jié)構(gòu)關(guān)系描述利用統(tǒng)計(jì)結(jié)構(gòu)建模方法,將部件和輸入漢字都表示成一組筆畫的集合。對于部件庫中的部件,將由圖像細(xì)化和筆畫提取后得到的細(xì)碎筆段進(jìn)行人為的符合語義的合并,這樣做的目的一方面是為了符合漢字學(xué)筆畫的規(guī)范要求,另一方面在后續(xù)的匹配過程中會(huì)大幅度的減少搜索次數(shù),提高識(shí)別的效率。這里認(rèn)為組成部件和漢字的筆畫都服從一個(gè)4維的高斯分布,即X Ν( μ,Σ )。這個(gè)4維向量是由筆畫上的每一個(gè)點(diǎn)的4維向量值加權(quán)得至IJ,本發(fā)明采用Gabor濾波檢測每個(gè)點(diǎn)在4個(gè)方向上(0°,45° ,90°和135° )的響應(yīng)值。在如此定義之后,可以看到對于一副輸入的漢字圖片S和一個(gè)待匹配的部件C,他們之間的相似度可以用公式(I)中表示的聯(lián)合概率進(jìn)行計(jì)算,這里A和Si分別代表部件中的筆畫和輸入漢字中的筆畫。Pr (S = C)= Pr (S1 = T1, S2 = r2, . . . , sn = rn)(I)進(jìn)而,公式(I)中的聯(lián)合概率分布可以通過條件概率計(jì)算,如公式(2)所示
權(quán)利要求
1.一種漢字圖片的部件識(shí)別方法,其特征在于該方法步驟如下 步驟(I)、對漢字部件中的筆畫和結(jié)構(gòu)關(guān)系描述,標(biāo)注構(gòu)造統(tǒng)計(jì)結(jié)構(gòu)模型所需要的信息; 步驟(2)、根據(jù)步驟(I)的漢字部件的標(biāo)注結(jié)果,對輸入的漢字圖片中檢測出的筆段進(jìn)行有選擇性的概率合并,生成可能匹配部件中標(biāo)注筆畫的可能筆畫,稱為候選筆畫生成; 步驟(3)、根據(jù)步驟(2)中得到的可能匹配部件中標(biāo)注好的筆畫的候選筆畫,尋找一組最優(yōu)的候選筆畫,基于目標(biāo)部件生成可能的解; 步驟(4)、根據(jù)步驟(3)中得到的針對各個(gè)目標(biāo)部件的可能解,利用動(dòng)態(tài)規(guī)劃思想,尋找可能部件的最優(yōu)組合結(jié)果,作為漢字部件識(shí)別的結(jié)果。
2.根據(jù)權(quán)利要求I所述一種漢字圖片的部件識(shí)別方法,其特征在于所述步驟(I)中對漢字部件中的筆畫和結(jié)構(gòu)關(guān)系描述的具體內(nèi)容如下 步驟(Al)、對已經(jīng)有的標(biāo)準(zhǔn)部件庫中的514個(gè)漢字部件圖片進(jìn)行骨架提取處理,并檢測特征點(diǎn),所述特征點(diǎn)為筆畫的端點(diǎn)和筆畫之間的交叉點(diǎn);通過這些特征點(diǎn)之間的連線得到初始筆段,從一個(gè)特征點(diǎn)通過骨架上的其他點(diǎn)找到另外一個(gè)特征點(diǎn)的路徑,將這個(gè)路徑記錄稱之為初始筆段; 步驟(A2)、通過人為的交互將所述初始筆段進(jìn)行合并,得到標(biāo)記好的漢字部件的筆畫;對得到的漢字部件筆畫進(jìn)行Gabor特征的提取,描述漢字部件筆畫的方向特征,將每一個(gè)筆畫描述為一個(gè)4維向量和一個(gè)4*4協(xié)方差矩陣的高斯分布,完成漢字部件筆畫的統(tǒng)計(jì)建模; 步驟(A3)、通過最大熵原理,利用近似結(jié)構(gòu)關(guān)系進(jìn)行鄰居筆畫的選取,近似結(jié)構(gòu)關(guān)系即將漢字部件中一個(gè)筆畫與其他所有筆畫的結(jié)構(gòu)關(guān)系近似為相對于自己鄰居的結(jié)構(gòu)關(guān)系,結(jié)構(gòu)關(guān)系采用條件概率描述,即在某個(gè)筆畫鄰居被匹配后,該筆畫匹配時(shí)需要采用條件概率計(jì)算,所述鄰居筆畫是指除了本身以外,漢字部件中其他筆畫中對該筆畫影響值最大的一個(gè)筆畫,這個(gè)影響值通過兩個(gè)協(xié)方差矩陣的差的模取對數(shù)描述; 步驟(A4)、計(jì)算互為鄰居的兩個(gè)鄰居筆畫局部特征,局部特征包括中心相對位置、長度比例和角度差,將這些計(jì)算好的局部特征的信息進(jìn)行存儲(chǔ),以用來幫助識(shí)別輸入的漢字部件。
3.根據(jù)權(quán)利要求I所述一種漢字圖片的部件識(shí)別方法,其特征在于所述步驟(2)部件候選筆畫生成的步驟具體如下 步驟(BI)、將輸入漢字圖片進(jìn)行圖像細(xì)化和骨架提取,檢測特征點(diǎn),如筆畫之間的交叉點(diǎn)和筆畫端點(diǎn),通過尋找特征點(diǎn)之間的路徑提取出初始筆段; 步驟(B2)、對某個(gè)目標(biāo)部件進(jìn)行識(shí)別時(shí),將對應(yīng)的部件的各個(gè)筆畫得到,要計(jì)算的就是針對部件的每一個(gè)筆畫,都會(huì)生成一組可能的解,這些解有可能是初始筆段,也有可能是一些初始筆段的組合結(jié)果,定義組合規(guī)則為兩個(gè)筆段首尾相連且方向差不超過15°,或者其中一個(gè)筆段足夠短小,這樣就將兩個(gè)筆段合成作為可能的筆畫匹配解加入到候選筆畫隊(duì)列中。
4.根據(jù)權(quán)利要求I所述一種漢字圖片的部件識(shí)別方法,其特征在于所述步驟(3)中基于目標(biāo)部件生成可能解的步驟如下 步驟(Cl)、構(gòu)建搜索圖,這張圖的描述如下,每一列表示待匹配的部件的各個(gè)標(biāo)注好的筆畫,而某一列中的每一行都表示著對于這個(gè)部件的筆畫的由輸入漢字的初始筆段生成的候選筆畫,這樣將匹配問題轉(zhuǎn)化成了一個(gè)圖的搜索過程,要找一個(gè)每一列都找到一個(gè)點(diǎn),從第一列找到最后一列的所有可行解中相似度最大的解。
步驟(C2)、圖的搜索過程規(guī)則如下第一,在匹配某一個(gè)筆畫時(shí),如果待匹配的候選筆畫在對輸入漢字的初始筆段占用上與前面已經(jīng)選取的候選筆畫相沖突,那么該候選筆畫不能被選取;第二,在匹配某一個(gè)筆畫時(shí),如果作為這個(gè)筆畫的鄰居的筆畫已經(jīng)在前面的路徑中被選取了,則要采用條件概率計(jì)算,并引入之前存儲(chǔ)的局部特征信息,計(jì)算這個(gè)待匹配的候選筆畫和前面已經(jīng)匹配的候選筆畫的中心相對位置關(guān)系、筆畫長度比例,并和存儲(chǔ)的局部特征信息相比較,描述局部特征的相似度。
5.根據(jù)權(quán)利要求I所述一種漢字圖片的部件識(shí)別方法,其特征在于所述步驟(4)中基于部件最優(yōu)組合原理得到識(shí)別結(jié)果的步驟如下 步驟(D1)、利用步驟(3)中得到的對于各個(gè)漢字部件生成的可能解,尋找最優(yōu)的組合作為輸入漢字部件識(shí)別結(jié)果;這樣將部件識(shí)別問題描述為尋找一組最優(yōu)的組合,使得組合中這些部件可能解在對輸入漢字的初始筆段的占用上不沖突,且最大程度上的消耗掉輸入 漢字的初始筆段;定義這樣的組合為輸入漢字的最優(yōu)的部件識(shí)別的結(jié)果;利用動(dòng)態(tài)規(guī)劃思想,將上述問題轉(zhuǎn)化為一個(gè)背包問題,背包的容量為輸入漢字的初始筆段數(shù)目,每一個(gè)可能的部件識(shí)別解都有一個(gè)標(biāo)記數(shù)組來標(biāo)記這個(gè)可能解對輸入漢字的初始筆段的占用情況,這樣相當(dāng)于選取不沖突的幾件物品放入背包中,使得背包盡可能的放滿。
全文摘要
一種漢字圖片的部件識(shí)別方法,屬于圖像處理與模式識(shí)別的領(lǐng)域,首先對特定字體的漢字部件圖片進(jìn)行預(yù)處理,對其進(jìn)行骨架提取之后,依據(jù)檢測出的端點(diǎn)和交叉點(diǎn)形成初始的筆段,人為交互的將某些筆段合并;其次,對標(biāo)記好的筆段進(jìn)行統(tǒng)計(jì)建模,利用4維向量描述筆段方向信息;然后根據(jù)最大生成樹原則構(gòu)建筆段鄰居關(guān)系,完成部件建模過程。對于輸入漢字,首先,將其分解為各個(gè)筆段;隨后,對照庫中每個(gè)部件生成一組相似性最大的筆段集合;最后通過最優(yōu)選取策略,即解決變種的背包問題得到最優(yōu)解,得到輸入漢字的部件識(shí)別結(jié)果。本發(fā)明引入局部特征,并采取最優(yōu)組合策略,形成一套完整的針對漢字圖片的部件識(shí)別方法,能夠有效的提高識(shí)別率。
文檔編號G06K9/62GK102968619SQ20121045493
公開日2013年3月13日 申請日期2012年11月13日 優(yōu)先權(quán)日2012年11月13日
發(fā)明者梁曉輝, 于博文, 孫林嘉 申請人:北京航空航天大學(xué)