專利名稱:一種基于段化規(guī)律的漢字筆段提取方法
技術領域:
本發(fā)明涉及基于段化規(guī)律的漢字筆段提取方法,要求保護的技術方案屬于模式識別、人工智能和中文信息處理領域。
總結前人工作,我們認為漢字筆段提取的段化法對字體和字形的適應能力較強,因此,本發(fā)明立足于段化法,從筆段的角度出發(fā),研究漢字點陣圖像中行(列)上的連續(xù)像素段的相互位置關系,發(fā)現兩種類型的筆段階梯型筆段和平行長筆段,歸納出行(列)上的連續(xù)像素段構成這兩種筆段的相應規(guī)律,依據所歸納出的規(guī)律建立了漢字筆段提取方法。
為了便于敘述本發(fā)明提供的漢字筆段提取方法,首先給出如下基本定義定義1.漢字圖像中某一行上連續(xù)前景像素的集合稱為行段,記為HL(X1,X2,Y),其中X1和X2分別為起點和終點橫坐標,且X1≤X2,Y為縱坐標。
定義2.漢字圖像中某一列上連續(xù)前景像素的集合稱為列段,記為HL(Y1,Y2,X),其中Y1和Y2為起點和終點縱坐標,且Y1≤Y2,X為橫坐標。
定義3.漢字圖像中與人們對橫、豎、撇、捺四種基本筆劃的認識相符合的一個前景像素的集合稱為筆段。
定義4.設兩個相鄰且8-連通的行段為HL(X1,X2,Y)和HL′(X1′,X2′,Y′),如果X1<X1′-1≤X2<X2′,或X1′<X1且X1-1≤X2′<X2,則它們之間的關系稱為梯型關系。類似的,可定義兩個列段之間的梯型關系。
定義5.設兩個相鄰且8-連通的行段為HL(X1,X2,Y)和HL′(X1′,X2′,Y′),如果X1≠X1′,且X2=X2′,或X2≠X2′且X1=X1′,則它們之間的關系稱為準梯型關系。類似的,可定義兩個列段之間的準梯型關系。
定義6.設兩個相鄰且8-連通的行段為HL(X1,X2,Y)和HL′(X1′,X2′,Y′),如果X1=X1′且X2=X2′,則它們之間的關系稱為平行關系。類似的,可定義兩個列段之間的平行關系。
定義7.設兩個相鄰且8-連通的行段為HL(X1,X2,Y)和HL′(X1′,X2′,Y′),如果X1>X1′且X2<X2′,或X1′>X1且X2′<X2,則它們之間的關系稱為塔型關系。在塔型關系中,從HL的角度出發(fā),滿足X1>X1′且X2<X2′的塔型關系稱為增大塔型關系,滿足X1′>X1且X2′<X2的塔型關系稱為縮小塔型關系。類似的,可定義兩個列段之間的增大塔型關系和縮小塔型關系。
定義8.設兩個具有梯型(或準梯型)關系的行段為HL(X1,X2,Y)和HL′(X1′,X2′,Y′),如果X1′-X1>0或X2′-X2>0,則HL′相對于HL的變化方向為右移;如果X1′-X1<0或X2′-X2<0,則HL′相對于HL的變化方向為左移。類似的,可定義列段之間的上移和下移。
定義9.行(列)段中連續(xù)前景像素的個數稱為行(列)段的段長。
定義10.如果行段滿足以下三個條件,1)段長大于所有行段段長的平均值;2)與之相鄰且8-連通的行段的段長大于所有行段段長的平均值,或與該行段的段長相比有顯著差異;3)行段中大部分點所對應的列段的段長小于該行段的段長,則該行段稱為長行段,否則稱為短行段。類似的,可定義長(短)列段。
定義11.如果行段是長行段并且其上部不再有與之8-連通的長行段,或者行段是短行段并且其上部不再有與之8-連通的行段,則該行段稱為上邊界段。類似地,可定義下邊界段、左邊界段和右邊界段。
上述定義可以通過附
圖1來說明,其中,列段1與2是梯型關系,并且2相對于1的變化方向為上移;列段3與4是準梯型關系,并且3相對于4的變化方向為下移;列段5與6是平行關系;列段7與8是塔型關系,并且從8的角度出發(fā)是增大塔型關系,從7的角度出發(fā)是縮小塔型關系。9為長行段,10為長列段。9、12為上邊界段,9、14為下邊界段,5、11為左邊界段,6、10、13為右邊界段。
從筆段的角度來觀察屬于同一筆段的各個行(列)段的類型以及相互之間的位置關系,可以發(fā)現在漢字圖像中只存在兩種類型的筆段階梯型筆段和平行長筆段,如附圖2所示。階梯型筆段是指從某一列段開始沿水平方向行走或從某一行段開始沿垂直方向行走,相互8-連通的各個列段或各個行段的位置構成一種逐漸上升(下降)或逐漸左移(右移)的運動趨勢,在筆段的兩側可能有少量附加列段或行段;平行長筆段是指若干個平行且連通的行(列)段,在該筆段的兩側可能附帶有一些段長顯著減小的行(列)段。
由于漢字圖像中只存在階梯型筆段和平行長筆段,因此,筆段提取過程就是分別從漢字圖像中提取階梯型筆段和平行長筆段的過程。通過行(列)段的類型以及相互之間的位置關系,我們歸納出行(列)段形成這兩種筆段的相應規(guī)律,所歸納出的規(guī)律在下面的平行長筆段以及階梯型筆段的判斷與提取方法中得到體現。
本發(fā)明提供的平行長筆段判斷與提取方法如下設一組相互8-連通的行(列)段序列L為Ls(N1s,N2s,M),s∈[1,p],其中N可為X或Y,M相應的可為Y或X;相應的關系序列R為Rt(Lt,Lt+1)={Tt,St,Kt},t∈[1,p-1],其中Tt表示關系類型的取值,值域為{梯型、準梯型、平行、增大塔型、縮小塔型};St表示起點或終點位移量的取值,值域為{-q,q};Kt為段長變化量的取值,值域為{-q,q};q表示二維點陣圖像的尺寸;如果L滿足(1)不形成階梯型筆段;(2)存在且僅存在一個連續(xù)子序列L′,L′中每個行(列)段均為長行(列)段;(3)除L′之外的其他行(列)段均為短行(列)段,并形成n個連續(xù)子序列Li″,i∈{1,n};并且Li″,i∈{1,n}滿足(4)Li″位于L′端點附近,i∈{1,n};(5)Pi″<U,U為閾值,i∈{1,n};(6)Tic″≠梯型,且Tic″≠增大塔型,1≤c≤Pi″-1,i∈{1,n};(7)Li″中均不存在這樣的點Z如果Li″為列段序列,則Z對應的行段為長行段;如果Li″為行段序列,則Z對應的列段為長列段,i∈{1,n};則L形成一個平行長筆段。
本發(fā)明提供的階梯型筆段判斷與提取方法如下設一組相互8-連通的行(列)段序列L為Ls(N1s,N2s,M),s∈[1,p],其中N可為X或Y,M相應的可為Y或X;相應的關系序列R為Rt(Lt,Lt+1)={Tt,St,Kt},t∈[1,p-1],其中Tt表示關系類型的取值,值域為{梯型、準梯型、平行、增大塔型、縮小塔型};St表示起點或終點位移量的取值,值域為{-q,q};Kt為段長變化量的取值,值域為{-q,q};q表示二維點陣圖像的尺寸。
如果R滿足(1)寬度為M(M是閾值)的任意連續(xù)子序列內必有一個Tt的取值為梯型或準梯型;(2)寬度為H(H為閾值)的任意連續(xù)子序列內必有一個Tt的取值不為平行;(3)設
則Σt=1p-1f(t)<<Σt=1p-1g(t),]]>或Σt=1p-1g(t)<<Σt=1p-1f(t);]]>(4)設Tt=增大塔型,Tg=縮小塔型,則g-t<D且Kt<J,D、J為閾值;(5)設 其中TX表示梯形或準梯形,則Σt=1p-1f(t)≥W,]]>W為閾值;并且L滿足(6)寬度為Q(Q為閾值)的任意連續(xù)子序列內必有一個Ls中存在一個點Z,如果L為行段序列,則Z對應的列段為短列段;如果L為列段序列,則Z對應的行段為短行段;(7)p≥V,V為閾值;(8)不存在滿足上述條件并且包含L的更大序列;則L形成一個階梯型筆段。
階梯型筆段提取方法對應的具體步驟如下(1)根據邊界段L1的類型構造行(列)段子集S={L1};(2)以L1為當前行(列)段Lc;(3)根據Lc的類型確定相鄰且8-連通的下一行(列)段為Ln,如果Ln不存在,轉(7);(4)將Ln加入集合S;(5)判斷S是否符合階梯型筆段的判斷條件1、2、3、4、6,如果符合,則以Ln為Lc,轉③;如果不符合,轉⑥;(6)從S中刪除Ln;(7)判斷S是否符合階梯型筆段的判斷條件5、7,如果符合,則標記S為階梯型筆段。
在上述階梯型筆段提取步驟中,需要處理兩種特殊情況第一種情況是當階梯型筆段與平行長筆段接觸或交叉時,為了求得完整的階梯型筆段,需要對某些行(列)段作動態(tài)分裂,具體方法是如果在求階梯型筆段的過程中兩個相鄰的行(列)段的長度之差大于閾值,此時需從其中較長的行(列)段中分裂出一個新的行(列)段。比如,設當前列段為HL(Y1,Y2,X),相鄰且8-連通的下一列段為HL′(Y1′,Y2′,X′),令QC=|Y1′-Y1|,ZC=|Y2′-Y2|,如果ZC<<QC且在當前列段之前的階梯型變化方向為下降,則生成一個新的列段HL″(Y1,Y2′,X′);如果QC<<ZC且在當前列段之前的階梯型變化方向為上升,則生成一個新的列段HL″(Y1′,Y2,X′)。然后用HL″取代HL′作為當前列段子集的下一成員。如附圖3所示,為了求出階梯型筆段3的整體,又不受平行長筆段4的影響,從列段2中分離出一個新的列段,其起點為2的起點,終點為1的終點。
第二種情況是當階梯型筆段的開始處出現附加成分時,需要對邊界作逐層剝離。具體方法是如果某些階梯型筆段開始處的幾個行(列)段之間的關系不滿足規(guī)律1的條件,此時為了忽略這種附加成分的干擾,則依次以這些行(列)段為邊界進行嘗試,即首先從當前邊界出發(fā),如果不存在滿足階梯型筆段提取條件的行(列)段子集,則剝離該邊界而將與該邊界相鄰的下一行(列)段作為新的邊界重新計算,直到滿足規(guī)律1的條件或者嘗試的次數超過閾值為止。如果最后能夠出現滿足規(guī)律1條件的行(列)段子集,將該行(列)段子集與已經剝離掉的所有行(列)段共同構成一個階梯型筆段。如附圖4所示,筆段3的列段1到列段2之間的3個列段為附加列段,從這三個列段出發(fā)都不能得到筆段3,則層層剝離這三個列段,直到從列段2出發(fā)進行判斷。
如附圖6所示,以階梯型筆段提取方法和平行長筆段提取方法為基礎,本發(fā)明提供的漢字筆段提取方法的具體步驟如下(1)輸入漢字圖像;(2)從圖像中形成行段集和列段集;(3)從行段集中標定長行段,從列段中標定長列段;(4)根據行段集和其中的長行段標記,標定上邊界段和下邊界段。根據列段集和其中的長列段標記,標定左邊界段和右邊界段;(5)從各個邊界段開始,根據階梯型筆段提取方法和平行長筆段提取方法求出以各個邊界段為起始行(列)段的階梯型筆段或平行長筆段;(6)從圖像中刪除當前得到的各個筆段中的所有點;(7)如果圖像為空或循環(huán)次數超過閾值,則進入步驟(8),否則返回步驟(2);(8)合并所得到的各個筆段;(9)將各個筆段細化為相應的寬度為1的直線段,稱為細化筆段;(10)對細化筆段作數量上和位置上的調整。
本發(fā)明的優(yōu)點是發(fā)現了漢字點陣圖像中行(列)上連續(xù)像素段構成完整筆段的科學準確的規(guī)律,根據規(guī)律建立的漢字筆段提取方法正確率高、速度快、性能穩(wěn)定。
權利要求
1.一種基于段化規(guī)律的漢字筆段提取方法,其特征在于它將漢字圖像中的筆段確定為階梯型筆段和平行長筆段兩種,并根據行(列)段形成這兩種筆段的相應規(guī)律分別進行提取。
2.如權利要求1中所述的筆段提取方法,其特征還在于具有以下步驟(1)輸入漢字圖像;(2)從漢字圖像中形成行段集和列段集;(3)從行段集中標定長行段,從列段集中標定長列段;(4)根據行段集和其中的長行段標記,標定上邊界段和下邊界段。根據列段集和其中的長列段標記,標定左邊界段和右邊界段;(5)從各個邊界段開始,根據階梯型筆段提取方法和平行長筆段提取方法求出以各個邊界段為起始行(列)段的階梯型筆段或平行長筆段;(6)從漢字圖像中刪除當前得到的各個筆段中的所有點;(7)如果漢字圖像為空或循環(huán)次數超過閾值,則進入步驟(8),否則返回步驟(2);(8)合并所得到的各個筆段;(9)將各個筆段細化為相應的寬度為1的直線段,稱為細化筆段;(10)對細化筆段作數量上和位置上的調整。
3.如權利要求1中所述的筆段提取方法,其特征還在于具有以下階梯型筆段判斷與提取方法設一組相互8-連通的行(列)段序列L為Ls(N1s,N2s,M),s∈[1,p],其中N可為X或Y,M相應的可為Y或X;相應的關系序列R為Rt(Lt,Lt+1)={Tt,St,Kt},t∈[1,p-1],其中Tt表示關系類型的取值,值域為{梯型、準梯型、平行、增大塔型、縮小塔型};St表示起點或終點位移量的取值,值域為{-q,q};Kt為段長變化量的取值,值域為{-q,q};q表示二維點陣圖像的尺寸。如果R滿足(0)寬度為M(M是閾值)的任意連續(xù)子序列內必有一個Tt的取值為梯型或準梯型;(2)寬度為H(H為閾值)的任意連續(xù)子序列內必有一個Tt的取值不為平行;(3)設 則Σt=1p-1f(t)<<Σt=1p-1g(t),]]>或Σt=1p-1g(t)<<Σt=1p-1f(t);]]>(4)設Tt=增大塔型,Tg=縮小塔型,則g-t<D且Kt<J,D、J為閾值;(5)設 其中TX表示梯形或準梯形,則Σt=1p-1f(t)≥W,]]>W為閾值;并且L滿足(6)寬度為Q(Q為閾值)的任意連續(xù)子序列內必有一個Ls中存在一個點Z,如果L為行段序列,則Z對應的列段為短列段;如果L為列段序列,則Z對應的行段為短行段;(7)p≥V,V為閾值;(8)不存在滿足上述條件并且包含L的更大序列;則L形成一個階梯型筆段。
4.如權利要求1中所述的筆段提取方法,其特征還在于具有以下平行長筆段判斷與提取方法設行(列)段序列L以及對應的關系序列R的定義同權利要求3,如果L滿足(1)不形成階梯型筆段;(2)存在且僅存在一個連續(xù)子序列L′,L′中每個行(列)段均為長行(列)段;(3)除L′之外的其他行(列)段均為短行(列)段,并形成n個連續(xù)子序列Li″,i∈{1,n};并且Li″i∈{1,n}滿足(0)Li″位于L′端點附近,i∈{1,n};(1)Pi″<U,U為閾值,i∈{1,n};(2)Tic″≠梯型,且Tic″≠增大塔型,1≤c≤pi″-1,i∈{1,n};(3)Li″中均不存在這樣的點Z如果Li″為列段序列,則Z對應的行段為長行段;如果Li″為行段序列,則Z對應的列段為長列段,i∈{1,n};則L形成一個平行長筆段。
5.如權利要求3中所述的階梯型筆段判斷與提取方法,其特征還在于具有以下步驟(1)根據邊界段L1的類型構造行(列)段子集S={L1};(2)以L1為當前行(列)段Lc;(3)根據Lc的類型確定相鄰且8-連通的下一行(列)段為Ln,如果Ln不存在,轉(7);(4)將Ln加入集合S;(5)判斷S是否符合階梯型筆段的判斷條件1、2、3、4、6,如果符合,則以Ln為Lc,轉(3);如果不符合,轉(6);(6)從S中刪除Ln;判斷S是否符合階梯型筆段的判斷條件5、7,如果符合,則標記S為階梯型筆段。
6.如權利要求3中所述的階梯型筆段判斷與提取方法,其特征還在于它包括處理動態(tài)分裂和邊界剝離兩種情況的方法。
7.如權利要求6中所述的處理動態(tài)分裂的方法,其特征在于如果在求階梯型筆段的過程中兩個相鄰的行(列)段的長度之差大于閾值,此時需從其中較長的行(列)段中分裂出一個新的行(列)段。比如,設當前列段為HL(Y1,Y2,X),相鄰且8-連通的下一列段為HL′(Y1′,Y2′,X′),令QC=|Y1′-Y1|,ZC=|Y2′-Y2|,如果ZC<<QC且在當前列段之前的階梯型變化方向為下降,則生成一個新的列段HL″(Y1,Y2′,X′);如果QC<<ZC且在當前列段之前的階梯型變化方向為上升,則生成一個新的列段HL″(Y1′,Y2,X′)。然后用HL″取代HL′作為當前列段子集的下一成員。
8.如權利要求6中所述的處理邊界剝離的方法,其特征在于如果某些階梯型筆段開始處的幾個行(列)段之間的關系不滿足階梯型筆段的判斷條件,此時為了忽略這種附加成分的干擾,則依次以這些行(列)段為邊界進行嘗試,即首先從當前邊界出發(fā),如果不存在滿足階梯型筆段判斷條件的行(列)段子集,則剝離該邊界而將與該邊界相鄰的下一行(列)段作為新的邊界重新計算,直到滿足階梯型筆段提取方法中的條件或者嘗試的次數超過閾值為止。如果最后能夠出現滿足階梯型筆段判斷條件的行(列)段子集,將該行(列)段子集與已經剝離掉的所有行(列)段共同構成一個階梯型筆段。
全文摘要
本發(fā)明是一種基于段化規(guī)律的漢字筆段提取方法,屬于模式識別、人工智能和中文信息處理領域。它將漢字點陣圖像中的筆段確定為階梯型筆段和平行長筆段兩種類型,通過漢字點陣圖像中行(列)上的連續(xù)像素段形成這兩種筆段的相應規(guī)律進行漢字筆段提取。本發(fā)明對于漢字字體及字形變化的適應能力較強,能有效地從印刷體漢字和手寫體漢字中提取對應的筆段。通過將漢字的像素級圖像轉化為以筆段為單位的圖像,有利于漢字識別、漢字細化以及漢字字體的自動生成。
文檔編號G06K9/72GK1474350SQ02125948
公開日2004年2月11日 申請日期2002年8月6日 優(yōu)先權日2002年8月6日
發(fā)明者賈云得, 劉峽壁 申請人:北京理工大學