專利名稱:一種基于結(jié)構(gòu)模型的漢字識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及基于結(jié)構(gòu)模型的漢字識(shí)別方法,要求保護(hù)的技術(shù)方案屬于模式識(shí)別、人工智能和中文信息處理領(lǐng)域。
用結(jié)構(gòu)方法識(shí)別漢字的首要問題是建立漢字圖像的結(jié)構(gòu)模型。本發(fā)明提供兩種用于描述漢字結(jié)構(gòu)的數(shù)學(xué)模型筆段中心點(diǎn)模型和筆劃關(guān)系矩陣模型。
筆段中心點(diǎn)模型以筆段為組成漢字的基元,通過筆段的類型和位置來描述漢字。這里,筆段指漢字圖像中與人們對(duì)橫、豎、撇、捺四種基本筆劃(其它筆劃可由這四種基本筆劃組合而成)的認(rèn)識(shí)相符合的一個(gè)前景像素的集合。筆段中心點(diǎn)模型的表述如下
1)筆段類型根據(jù)筆段對(duì)應(yīng)的方向向量,分為橫、豎、撇、捺四種。
2)筆段位置筆段位置由筆段的中點(diǎn)歐氏坐標(biāo)來表示,稱之為中心點(diǎn)坐標(biāo)。該坐標(biāo)是在規(guī)范化漢字圖像上求得的。
3)模型構(gòu)成H=(N,Bi|i=0,1,2,.....N-1|)Bi=(Ci,Tj),Ci=(Xi,Yj)(1)其中,H代表某一漢字,Bi代表某一筆段,Ci代表將漢字規(guī)范化到某一標(biāo)準(zhǔn)大小之后該筆段對(duì)應(yīng)的幾何中心點(diǎn)的坐標(biāo)(Xi為橫坐標(biāo)值,Yi為縱坐標(biāo)值),Ti代表該筆段的類型,N為組成漢字的筆段個(gè)數(shù)。
公式(1)說明,如果一個(gè)規(guī)范化漢字圖像在所有確定位置上(由Ci確定)都有確定類型(由Ti確定)的筆段,則這個(gè)圖像就是某一漢字(由H確定),反之則不是。
以筆段中心點(diǎn)模型為基礎(chǔ),本發(fā)明提供如下的漢字識(shí)別方法,該方法被稱為筆段中心點(diǎn)識(shí)別法。
首先確定每個(gè)漢字類別所對(duì)應(yīng)的標(biāo)準(zhǔn)筆段中心點(diǎn)模型。識(shí)別時(shí),計(jì)算待識(shí)別漢字所對(duì)應(yīng)的筆段中心點(diǎn)模型與諸標(biāo)準(zhǔn)筆段中心點(diǎn)模型之間的距離,以距離最小者所屬類別或次小的前N個(gè)所屬類別為識(shí)別結(jié)果。距離的計(jì)算公式如下
(1)其中,D(SP,RP)表示標(biāo)準(zhǔn)中心點(diǎn)集合與待識(shí)中心點(diǎn)集合之間的距離,Q表示標(biāo)準(zhǔn)中心點(diǎn)集合與待識(shí)中心點(diǎn)集合之間可匹配的筆段的最大個(gè)數(shù),I表示標(biāo)準(zhǔn)中心點(diǎn)集合的筆段個(gè)數(shù),J表示待識(shí)中心點(diǎn)集合的筆段個(gè)數(shù),J′表示從輸入筆段集合中除去在匹配過程中被認(rèn)為是連筆的筆段以后剩下的筆段個(gè)數(shù)。(GiX,GiY)為標(biāo)準(zhǔn)中心點(diǎn)集合的中心點(diǎn)坐標(biāo),(HjX,HjY)為待識(shí)中心點(diǎn)集合的中心點(diǎn)坐標(biāo),MSi表示已經(jīng)與標(biāo)準(zhǔn)中心點(diǎn)集合中前i-1個(gè)筆段相匹配的待識(shí)中心點(diǎn)集合中的筆段子集,Simi(STi,PTj)表示標(biāo)準(zhǔn)中心點(diǎn)集合中第i個(gè)筆段的類型與待識(shí)中心點(diǎn)集合中第j個(gè)筆段的類型的相似度,V為所允許的筆段個(gè)數(shù)差異的閾值,T為給不能匹配的筆段所賦予的最大距離的閾值,W為允許匹配的筆段之間的最小距離的閾值。
筆段中心點(diǎn)識(shí)別法的具體步驟如下(1)建立每一個(gè)漢字的標(biāo)準(zhǔn)筆段中心點(diǎn)集合;(2)將待識(shí)漢字規(guī)范化到標(biāo)準(zhǔn)大小,然后提取待識(shí)別漢字中的所有筆段,形成待識(shí)別中心點(diǎn)集合;(3)按公式(1)計(jì)算每個(gè)標(biāo)準(zhǔn)中心點(diǎn)集合與待識(shí)別中心點(diǎn)集合之間的距離,并以之作為每個(gè)標(biāo)準(zhǔn)漢字與待識(shí)別漢字之間的距離;(4)在所有標(biāo)準(zhǔn)漢字中,取與待識(shí)別漢字之間距離最小者或次小的前N個(gè)為識(shí)別結(jié)果。
筆劃關(guān)系矩陣模型以筆劃為組成漢字的基元,通過筆劃的類型以及相互之間的位置關(guān)系來描述漢字。這里,筆劃是指人們通常所認(rèn)識(shí)的漢字筆劃。筆劃關(guān)系矩陣模型的具體形式為(1)筆劃的類型見附
圖1(2)筆劃之間的相互位置關(guān)系為了盡可能的表示一個(gè)漢字各種形態(tài)之間的共性而忽略那些有可能產(chǎn)生劇烈變動(dòng)的因素,我們將各筆劃之間的相互位置關(guān)系模糊化為六種上、下、左、右、交叉、相連。(3)組合模型由于漢字圖像是二維的,所以筆劃及其相互位置關(guān)系用二維方式來表達(dá)能更精確地反映其結(jié)構(gòu)特征。我們采用矩陣的形式來描述S1S2……SN-1SNS1R11R12……R1(N-1)R1NS2R21R22……R2(N-1)R2N…… …… …… ………… ……SN-1R(N-1)1R(N-1)2…… R(N-1)(N-1)R(N-1)NSNRN1RN2……RN(N-1)RNN其中,S代表筆劃,R代表關(guān)系,N代表筆劃個(gè)數(shù)。S1~SN代表行或列的意義,即筆劃類型,R11~RNN為矩陣元素,表示與之對(duì)應(yīng)的行與列上兩筆劃之間的相互位置關(guān)系。
以筆劃關(guān)系矩陣模型為基礎(chǔ),本發(fā)明提供如下的漢字識(shí)別方法,該方法被稱為筆劃關(guān)系矩陣識(shí)別法首先確定每個(gè)漢字類別所對(duì)應(yīng)的標(biāo)準(zhǔn)筆劃關(guān)系矩陣模型。識(shí)別時(shí),計(jì)算待識(shí)別漢字所對(duì)應(yīng)的筆段集合與諸標(biāo)準(zhǔn)筆劃關(guān)系矩陣模型之間的相似度。以相似度值最大者所屬類別為識(shí)別結(jié)果。相似度值的計(jì)算公式如下 其中,S(SP,RP)表示標(biāo)準(zhǔn)矩陣與待識(shí)矩陣之間的相似度,BN(SP)表示與標(biāo)準(zhǔn)矩陣對(duì)應(yīng)的筆段個(gè)數(shù),BN(RP)表示與待識(shí)矩陣對(duì)應(yīng)的筆段個(gè)數(shù),BN(RP′)表示從待識(shí)矩陣對(duì)應(yīng)的并且在匹配過程中除去被認(rèn)為是連筆的筆段之后剩下的筆段個(gè)數(shù),SS(Sk,Tk)表示標(biāo)準(zhǔn)矩陣中第k個(gè)筆劃與待識(shí)矩陣中第k個(gè)筆劃之間類型上的相似度(k為i或j),RS(Rij,Gij)表示標(biāo)準(zhǔn)矩陣中第i行第j列元素與待識(shí)矩陣中第i行第j列元素之間的相似度,V為所允許的筆段個(gè)數(shù)差異的閾值。
筆劃關(guān)系矩陣識(shí)別法的具體步驟如下(1)建立每一個(gè)漢字的標(biāo)準(zhǔn)筆劃關(guān)系矩陣模型。
(2)將待識(shí)別漢字規(guī)范化到標(biāo)準(zhǔn)大小,然后提取待識(shí)別漢字中的所有筆段,形成輸入筆段集合。
(3)按公式(2)計(jì)算每個(gè)標(biāo)準(zhǔn)矩陣與輸入筆段集合之間的相似度,并以之作為每個(gè)標(biāo)準(zhǔn)漢字與待識(shí)別漢字之間的相似度。
(4)在所有標(biāo)準(zhǔn)漢字中,取與待識(shí)別漢字之間相似度最大的一個(gè)為識(shí)別結(jié)果。
筆段中心點(diǎn)識(shí)別法與筆劃關(guān)系矩陣識(shí)別法各有特點(diǎn),筆劃關(guān)系矩陣識(shí)別法更精確,筆段中心點(diǎn)識(shí)別法速度更快。因此,本發(fā)明提供的漢字識(shí)別方法采用筆段中心點(diǎn)識(shí)別法進(jìn)行粗分類,采用筆劃關(guān)系矩陣識(shí)別法進(jìn)行細(xì)分類。同時(shí),筆段中心點(diǎn)識(shí)別法對(duì)形狀比較規(guī)范的漢字進(jìn)行識(shí)別的正確率也是令人滿意的,因此,在實(shí)施本發(fā)明識(shí)別形狀比較規(guī)范的漢字時(shí),可以單獨(dú)采用筆段中心點(diǎn)識(shí)別法進(jìn)行細(xì)分類。
本發(fā)明具有以下優(yōu)點(diǎn)1、本發(fā)明提供的漢字識(shí)別方法以統(tǒng)一的機(jī)制進(jìn)行漢字識(shí)別,既可用于脫機(jī)識(shí)別,也可用于脫機(jī)識(shí)別,既可用于手寫體識(shí)別,也可用于印刷體識(shí)別。
2、本發(fā)明提供的漢字識(shí)別方法識(shí)別正確率高,對(duì)變形的適應(yīng)能力強(qiáng),穩(wěn)定性好。
權(quán)利要求
1.一種基于結(jié)構(gòu)模型的漢字識(shí)別方法,其特征在于它采用以筆段中心點(diǎn)模型為基礎(chǔ)的筆段中心點(diǎn)識(shí)別法作粗分類,采用以筆劃關(guān)系矩陣模型為基礎(chǔ)的筆劃關(guān)系矩陣識(shí)別法作細(xì)分類。
2.如權(quán)利要求1中所述的筆段中心點(diǎn)模型,其特征在于具有如下形式首先將一個(gè)漢字圖像規(guī)范化為標(biāo)準(zhǔn)大小,然后把它分解為筆段的集合,并將這些筆段確定為橫、豎、撇、捺四種,最后用這些筆段的中心點(diǎn)的坐標(biāo)和這些筆段的類型來構(gòu)成表示一個(gè)漢字的模型。上述模型可歸結(jié)為以下公式H=(N,Bi|i=0,1,2,.....N-1|)Bi=(Ci,Ti),Ci=(Xi,Yi)其中,H代表某一漢字,Bi代表某一筆段,Ci代表將漢字規(guī)范化到某一標(biāo)準(zhǔn)大小之后該筆段對(duì)應(yīng)的幾何中心點(diǎn)的坐標(biāo)(Xi為橫坐標(biāo)值,Yi為縱坐標(biāo)值),Ti代表該筆段的類型,N為組成漢字的筆段個(gè)數(shù)。
3.如權(quán)利要求1中所述的筆段中心點(diǎn)識(shí)別法,其特征在于包含以下步驟(1)建立標(biāo)準(zhǔn)模型庫根據(jù)權(quán)利要求2中所述的筆段中心點(diǎn)模型,建立每一個(gè)漢字的標(biāo)準(zhǔn)模型并保存在模型庫中;(2)根據(jù)每一個(gè)標(biāo)準(zhǔn)模型確定與輸入筆段集合對(duì)應(yīng)的待識(shí)模型;(3)計(jì)算標(biāo)準(zhǔn)模型與待識(shí)模型的距離;(4)取距離值最小及次小的前N個(gè)標(biāo)準(zhǔn)模型所對(duì)應(yīng)的漢字為識(shí)別結(jié)果。
4.如權(quán)利要求3中所述的根據(jù)標(biāo)準(zhǔn)模型和輸入筆段集合確定待識(shí)模型的方法,其特征在于包含以下步驟(1)對(duì)于標(biāo)準(zhǔn)模型中的每一個(gè)筆段,在輸入的筆段集合中尋找與其距離最小的筆段;(2)如果該最小距離大于所限定的最大閾值,認(rèn)為該標(biāo)準(zhǔn)筆段在輸入的筆段集合中無可以匹配的筆段,否則將這兩個(gè)筆段對(duì)應(yīng)起來,并從各自的筆段集合中刪除;(3)重復(fù)上述過程,直到標(biāo)準(zhǔn)模型中的每一個(gè)筆段都得到處理;(4)在上述計(jì)算過程中得到的與標(biāo)準(zhǔn)模型對(duì)應(yīng)的筆段構(gòu)成匹配集;(5)在沒有被納入匹配集的輸入筆段中,除去連接了匹配集中兩個(gè)筆段的筆段,剩下的筆段構(gòu)成非匹配集;(6)確定匹配集和非匹配集中所有筆段的類型以及中心點(diǎn)坐標(biāo),形成待識(shí)模型。
5.如權(quán)利要求4中所述的計(jì)算標(biāo)準(zhǔn)模型與待識(shí)模型之間的距離的方法,其特征在于采用下面的公式進(jìn)行計(jì)算 其中,D(SP,RP)表示標(biāo)準(zhǔn)中心點(diǎn)集合與待識(shí)中心點(diǎn)集合之間的距離,Q表示標(biāo)準(zhǔn)中心點(diǎn)集合與待識(shí)中心點(diǎn)集合之間可匹配的筆段的最大個(gè)數(shù),I表示標(biāo)準(zhǔn)中心點(diǎn)集合的筆段個(gè)數(shù),J表示待識(shí)中心點(diǎn)集合的筆段個(gè)數(shù),J′表示匹配集和非匹配集中所有筆段的個(gè)數(shù)。(GiX,GiY)為標(biāo)準(zhǔn)中心點(diǎn)集合的中心點(diǎn)坐標(biāo),(HjX,HjY)為待識(shí)中心點(diǎn)集合的中心點(diǎn)坐標(biāo),MSi表示已經(jīng)與標(biāo)準(zhǔn)中心點(diǎn)集合中前i-1個(gè)筆段相匹配的待識(shí)中心點(diǎn)集合中的筆段子集,Simi(STi,PTj)表示標(biāo)準(zhǔn)中心點(diǎn)集合中第i個(gè)筆段的類型與待識(shí)中心點(diǎn)集合中第j個(gè)筆段的類型的相似度,V為所允許的筆段個(gè)數(shù)差異的閾值,T為給不能匹配的筆段所賦予的最大距離的閾值,W為允許匹配的筆段之間的最小距離的閾值。
6.如權(quán)利要求4中所述的計(jì)算標(biāo)準(zhǔn)筆段與待識(shí)別筆段之間的距離的方法,其特征在于包含以下步驟(1)計(jì)算標(biāo)準(zhǔn)筆段的中心點(diǎn)與待識(shí)筆段的中心點(diǎn)之間的歐式距離;(2)根據(jù)標(biāo)準(zhǔn)筆段與待識(shí)筆段的類型,確定其類型相似度。橫與豎之間、撇與捺之間的相似度為0,相同類型之間的相似度為1,其他情況下的相似度的確定則根據(jù)待識(shí)別筆段的角度偏離標(biāo)準(zhǔn)筆段的類型所允許的角度范圍值的程度來定;(3)將步驟(1)中求出的距離除以步驟(2)中求出的類型相似度,得到最終的距離,如果類型相似度為0,則最終距離為所賦予的最大值。
7.如權(quán)利要求1中所述的筆劃關(guān)系矩陣模型,其特征在于具有如下形式首先將一個(gè)漢字圖像規(guī)范化為標(biāo)準(zhǔn)大小,然后把它分解為預(yù)先定義的不同類型筆劃的集合,并確定這些筆劃之間的相互位置關(guān)系,最后用這些筆劃及其相互位置關(guān)系組成矩陣來構(gòu)成表示一個(gè)漢字的模型。該模型可歸結(jié)為以下矩陣公式S1S2……SN-1SNS1R11R12……R1(N-1)R1NS2R21R22……R2(N-1)R2N…… …………………… ……SN-1R(N-1)1R(N-1)2……R(N-1)(N-1)R(N-1)NSNRN1RN2……RN(N-1)RNN其中,S代表筆劃,R代表關(guān)系,N代表筆劃個(gè)數(shù)。S1~SN代表行或列的意義,即筆劃類型,R11~RNN為矩陣元素,表示與之對(duì)應(yīng)的行與列上兩筆劃之間的相互位置關(guān)系。
8.如權(quán)利要求1中所述的筆劃關(guān)系矩陣識(shí)別法,其特征在于包含以下步驟(1)建立標(biāo)準(zhǔn)模型庫根據(jù)權(quán)利要求8中所述的漢字的筆劃關(guān)系矩陣模型,建立每一個(gè)漢字的標(biāo)準(zhǔn)模型并保存在模型庫中;(2)根據(jù)每一個(gè)標(biāo)準(zhǔn)模型從輸入的筆段集合中確定筆劃及其相互位置關(guān)系,構(gòu)成一個(gè)待識(shí)模型;(4)計(jì)算標(biāo)準(zhǔn)模型與待識(shí)模型的相似度值;(5)重復(fù)步驟(3)及(4)直到可以從標(biāo)準(zhǔn)模型導(dǎo)出的所有待識(shí)模型都已計(jì)算過,取其中最小的相似度值為該標(biāo)準(zhǔn)模型對(duì)應(yīng)的最終相似度值;(6)取最終相似度值最小的標(biāo)準(zhǔn)模型所對(duì)應(yīng)的漢字為識(shí)別結(jié)果。
9.如權(quán)利要求8中所述的根據(jù)標(biāo)準(zhǔn)模型從輸入筆段集合中確定待識(shí)模型的方法,其特征在于包含以下步驟(1)對(duì)于標(biāo)準(zhǔn)模型中的每一個(gè)筆劃,在輸入的筆段集合中尋找與之相同或相似的筆劃,形成與之對(duì)應(yīng)的一個(gè)筆段子集;(2)從標(biāo)準(zhǔn)模型的所有筆劃對(duì)應(yīng)的待識(shí)別筆劃集合中各自取出一個(gè)(這些取出的筆劃彼此之間不應(yīng)矛盾,即不能共享筆段),構(gòu)成待識(shí)模型中的所有筆劃;(3)從原始筆段集合中暫時(shí)刪除那些沒有被納入待識(shí)模型但是連接了待識(shí)模型中兩個(gè)筆劃的筆段,剩下的筆段形成與待識(shí)模型對(duì)應(yīng)的筆段集合;(4)根據(jù)所得到的待識(shí)模型中的所有筆劃確定各自的類型以及相互之間的位置關(guān)系,形成待識(shí)別的筆劃—關(guān)系矩陣模型。
10.如權(quán)利要求11中所述的計(jì)算標(biāo)準(zhǔn)模型與待識(shí)模型之間的相似度的方法,其特征在于采用下面的公式進(jìn)行計(jì)算 其中,S(SP,RP)表示標(biāo)準(zhǔn)模型與待識(shí)模型之間的相似度,BN(SP)表示與標(biāo)準(zhǔn)模型對(duì)應(yīng)的筆段個(gè)數(shù),BN(RP)表示與待識(shí)模型對(duì)應(yīng)的筆段個(gè)數(shù),BN(RP′)表示與待識(shí)模型對(duì)應(yīng)的筆段集合中包含的筆段個(gè)數(shù),SS(Sk,Tk)表示標(biāo)準(zhǔn)模型中第k個(gè)筆劃與待識(shí)模型中第k個(gè)筆劃之間類型上的相似度(k為i或j),RS(Rij,Gij)表示標(biāo)準(zhǔn)模型中第i行第j列元素與待識(shí)模型中第i行第j列元素之間的相似度,V為所允許的筆段個(gè)數(shù)差異的閾值。
11.如權(quán)利要求9中所述的從輸入筆段集合中尋找相同或相似筆劃的方法,其特征在于包含以下步驟(1)建立描述各個(gè)筆劃的模板;(2)建立各個(gè)筆劃之間的類型相似度值;(3)根據(jù)給定的相似度值的閾值,確定需要查找的筆劃類型;(4)根據(jù)所要查找的筆劃類型的模板在輸入筆段集合中搜索,確定與之對(duì)應(yīng)的筆段子集。
全文摘要
本發(fā)明涉及基于結(jié)構(gòu)模型的漢字識(shí)別方法,屬于模式識(shí)別、人工智能和中文信息處理領(lǐng)域。本發(fā)明采用筆段和筆劃兩種基元分別建立兩種描述漢字結(jié)構(gòu)的數(shù)學(xué)模型筆段中心點(diǎn)模型和筆劃關(guān)系矩陣模型,并建立了筆段中心點(diǎn)識(shí)別法和筆劃關(guān)系矩陣識(shí)別法。將筆段中心點(diǎn)識(shí)別法和筆劃矩陣識(shí)別法相結(jié)合,用筆段中心點(diǎn)識(shí)別法進(jìn)行漢字識(shí)別粗分類,用筆劃矩陣識(shí)別法進(jìn)行漢字識(shí)別細(xì)分類,形成一套完整的漢字識(shí)別方法。該方法以統(tǒng)一的機(jī)制處理印刷體漢字識(shí)別和手寫體漢字識(shí)別,既可用于脫機(jī)識(shí)別,也可用于聯(lián)機(jī)識(shí)別,識(shí)別正確率高,性能穩(wěn)定。
文檔編號(hào)G06K9/72GK1474351SQ02125949
公開日2004年2月11日 申請(qǐng)日期2002年8月6日 優(yōu)先權(quán)日2002年8月6日
發(fā)明者賈云得, 劉峽壁 申請(qǐng)人:北京理工大學(xué)