專利名稱:基于十六值變換的符號識別方法
技術領域:
本發(fā)明屬于圖像數據處理與模式識別方法,具體涉及一種符號識別方法。
背景技術:
符號識別是在各種紙質文檔數字化過程中自動識別其上各種印刷體、手寫體圖符標注的過程。理想的符號識別能正確識別出數字化文檔圖像上的各種符號標注,并不受各種干擾的影響,從而使更高層的圖像理解成為可能。傳統(tǒng)的符號識別方法(參見文獻張忻中.漢字識別技術.北京清華大學出版社,1992 ;周昌樂.手寫漢字的機器識別.北京科學出版社,1997.) 一般有基于神經網絡的識別和基于形狀分析的識別兩大類。神經網絡是一種計算智能中的仿生結構算法,它是一類由結點相互連結所組成的計算模型,每一結點通過簡單的運算完成從輸入到輸出的計算,然后這一輸出結果通過連接傳到其他結點。神經網絡模擬了大腦神經系統(tǒng),結點對應神經元,連接對應神經元傳遞信號的突觸。基于神經網絡的識別需要設計網絡系統(tǒng),還需要通過訓練樣本對其進行訓練學習。而基于形狀分析的識別提取待識別符號的形狀描述特征進行匹配識別,屬于統(tǒng)計模式識別的方法。這些傳統(tǒng)方法在掃描圖像質量好、不同符號之間差異很大而相同符號之間差異很小的情況下可以取得較好的識別效果。但在實際的掃描圖像上,往往會有噪聲和符號變形等因素的影響。不同應用背景的數字化文檔圖像中,有的符號是印刷體,有的符號是手寫體,即使同一種符號之間可能存在較大形狀差異。此外,從圖像上分割出來的待識符號中還常常存在許多非法符號會對識別造成干擾。對于這些情況,如果采用傳統(tǒng)的方法來識別則會出現時間開銷大、算法適用范圍窄、抗干擾能力差和識別率不高等缺點。
發(fā)明內容
本發(fā)明提出一種基于十六值變換的符號識別方法,解決現有符號識別方法抗干擾能力差、難以工程實用化的問題;其識別結果用于紙質文檔數字化及自動理解,提高符號識別的可用性?;谑底儞Q的符號識別方法,步驟為(1)特征知識庫的建立步驟(1. 1)針對待識別符號的類型,準備該類型所有符號的標準符號圖像;(1. 2)對于一個符號的圖像,建立背景十六值變換的特征表達,確定該圖符背景區(qū)域的類型,形成對其特征的描述;(1. 3)對準備的所有符號圖像進行上一步的處理,建立某一類型所有符號的特征描述,即可構建出該類型符號的特征知識庫。(2)符號識別步驟(2. 1)對輸入圖像進行二值化,從中分割出待識別的符號圖像;(2. 2)統(tǒng)一尺度的保真規(guī)整化,即保持高寬比例將包含待識別符號圖像的最小外接矩陣圖像進行縮放,使其長邊為一定值,并將圖像居中填充到以該定值為邊長的正方形空白圖像中,形成規(guī)整化后的符號圖像;(2. 3)使用背景十六值變換的特征表達方法,對規(guī)整化后的待識別圖像的特征進行描述;(2. 4)基于特征知識庫和背景區(qū)域的特征描述對圖符進行識別。本發(fā)明相對現有技術具有以下優(yōu)點1.提出了一種基于十六值變換的符號背景描述方法,通過該描述方法獲取了圖符背景區(qū)域的結構特征,該特征描述方法具有抗干擾能力強,能夠適應小角度旋轉、尺度縮放等特點,同時具有算法簡潔、計算復雜度低的特點;2.基于符號背景十六值變換特征描述的符號標注識別方法,能夠自動識別數字化圖像上的各種印刷體、手寫體符號,識別率高,同時具有算法簡潔、計算復雜度低、易于工程實現等特點;采用本發(fā)明,可以快速識別數字化圖像上的各種印刷及手寫體符號標注,對于圖像上的其它特殊符號標注,基于該特征描述方法也可以快速實現自動識別錄入。同時該算法時間復雜度和空間復雜度都很低,可用非常低的硬件成本實現。在識別性能、處理速度和性價比等方面均優(yōu)于現有符號識別系統(tǒng)。
圖1是本發(fā)明的流程圖;圖2是數值背景表達算法示意圖;
圖3是數值背景表達結果示意圖;圖4是待識別的符號示例圖;圖5是圖4中各符號經數值背景表達后典型背景區(qū)域的特征值示意圖;圖6是統(tǒng)一尺度的保真規(guī)整化示意圖;圖7是0 9十個待識別的手寫體數字圖像及其經數值背景表達后的結果,其中 (a)是0 9十個待識別的手寫體數字圖像示例,(b)是各數字圖像經數值背景表達后典型背景區(qū)域的特征值示意圖。
具體實施例方式為了更加清楚明白的闡述本發(fā)明的目的、技術方案和優(yōu)點,下面結合附圖及具體實施例對本發(fā)明作進一步詳細的說明。針對傳統(tǒng)的識別方法在有符號變形和非法符號干擾等情況下識別效果不理想的問題,本發(fā)明提出了一種基于十六值變換的符號識別方法。其基本思想是對二值符號圖像 (圖符)中的背景像素按照一定規(guī)律進行編碼得到十六種不同的特征值,以此來反映每個背景像素所處的環(huán)境,從而反映圖符的結構特征。該識別方法的處理流程如圖1所示,首先預估需要識別的符號所屬的類型,準備好該類型所有符號的圖像,分別進行十六值背景表達,建立各符號與特征表達之間的聯系,形成特征知識庫,作為識別前的準備。輸入一幅掃描的圖像,首先作預處理,對圖像進行二值化并從中分割出待識別的符號;接著對待識圖符進行規(guī)整化,保持高寬比例將其規(guī)整為符合一定要求的圖像;然后對規(guī)整化后的圖像進行背景十六值數值表達變換,形成圖符背景區(qū)域的特征值;最后利用知識庫進行特征識別,并輸出識別結果。圖1是基于十六值變換的符號識別方法處理流程圖。一種基于十六值變換的符號識別方法,包括(1)預估待識別符號的類型,構建包含該類型中所有符號的特征知識庫的步驟;(2)基于知識庫的符號識別步驟。其中,構建所述特征知識庫的步驟具體為(1. 1)針對待識別符號的類型,準備該類型所有符號的符號圖像,該符號圖像滿足(i) 一定尺寸(如64*64像素,與之后識別過程中對輸入圖像進行規(guī)整的尺寸一致)的正方形二值圖像;(ii)符號的最小外接矩陣居中且其長邊等于正方形圖像邊長;(iii)圖像中的符號形態(tài)規(guī)整、標準。(1. 2)對于所準備的該類型中一個符號的標準圖像,建立背景十六值變換的特征表達,確定該圖符背景區(qū)域的類型,形成對其特征的描述;數值背景表達就是對圖像中的背景點進行數值變換,以獲取圖符背景區(qū)域的結構特征。建立背景十六值變換特征的數值背景表達并確定圖符的背景區(qū)域類型的過程主要分以下兩步首先,計算該符號圖像背景點的特征值。置背景點的初始特征值為0。數值變換就是對圖像進行掃描,對每一個背景點P進行變換。具體做法是從P出發(fā),分別向垂直向上(方向4)、垂直向下(方向2)、水平向左 (方向1)、水平向右(方向3)四個方向引射線,如圖2所示。若在方向3上遇到遮擋(即遇到目標像素),則特征值加1 ;若在方向1上遇到遮擋,則特征值加2 ;若在方向2上遇到遮擋,則特征值加4 ;若在方向4上遇到遮擋,則特征值加8,如此形成每個背景點的特征值。所有背景點經過上述變換后,共可能形成C’4° + C14 + C42 + C43 + C = 16種不同的特征值,這16種特征值分別代表該像素所處的不同背景環(huán)境。表1列出了背景點所有可能的特征值。圖3是一幅待識別符號圖像的數值背景表達結果示意圖(“*”表示符號的目標像素)。表1背景和區(qū)域的特征值及其表達的含義
權利要求
1.一種基于十六值變換的符號識別方法,通過圖像處理方式對符號進行識別,該方法具體包括如下步驟(1)特征知識庫的建立步驟(1.1)針對待識別符號的類型,準備該類型所有符號的符號圖像;(1.2)對每個符號圖像,建立背景十六值變換的特征表達,確定該圖符背景區(qū)域的類型,獲得代表該符號圖像的特征表達,建立該類型所有圖像符號的特征表達,即可構建出該類型符號的特征知識庫;(2)符號識別步驟(2. 1)對輸入圖像進行二值化處理,從中分割出待識別的符號圖像;(2. 2)統(tǒng)一尺度的保真規(guī)整化即保持高寬比例一定將包含待識別符號圖像的最小外接矩陣圖像進行縮放處理,使其長邊為一定值,并將該縮放后的圖像居中填充到以該定值為邊長的正方形空白圖像中,形成規(guī)整化后的符號圖像;(2. 3)對規(guī)整化后的符號圖像,建立背景十六值變換的特征表達,確定規(guī)整化后的符號圖像背景區(qū)域的類型,從而獲得代表該符號圖像的特征表達;(2. 4)根據獲得的符號圖像的特征表達,利用上述構建的特征知識庫,即可識別出待識別符號。
2.根據權利要求1所述的基于十六值變換的符號識別方法,其特征在于,所述步驟 (1. 1)中,所述準備的該類型所有符號的符號圖像滿足(i) 一定尺寸的正方形二值圖像; ( )符號的最小外接矩陣居中且其長邊等于所述正方形二值圖像的邊長。
3.根據權利要求1或2所述的基于十六值變換的符號識別方法,其特征在于,所述建立背景十六值變換的特征表達,即對符號圖像中的各背景點進行數值變換,以獲取符號圖像背景區(qū)域的結構特征,其具體過程為(1. 2. 1)計算符號圖像背景點的特征值首先,置各背景點的初始特征值為0 ;其次,對圖像進行掃描,對每一個背景點的特征值進行數值變換,得到各背景點的特征值;(1. 2. 2)統(tǒng)計背景點特征值的分布,得到背景各區(qū)域的類型,進而獲得符號圖像的整個背景區(qū)域的特征表達首先,根據目標點對整個背景劃分成的多個背景區(qū)域,統(tǒng)計各背景區(qū)域背景點的分布和數量,確定各背景區(qū)域的類型,即將處于同一區(qū)域內、具有同一特征值且數量最多的背景點的特征值指定為該背景區(qū)域的特征值;然后,通過各背景區(qū)域的面積和相對位置關系對符號圖像的整個背景區(qū)域進行描述, 獲得代表該符號圖像的特征表達。
4.根據權利要求3所述的基于十六值變換的符號識別方法,其特征在于,所述對背景點的特征值進行數值變換具體過程為對每個背景點P,從P出發(fā)分別向該點的垂直和水平的四個方向引射線,若在其中的第一方向a上遇到遮擋即遇到目標,則該背景點特征值加1 ;若在與該第一方向相反的第二方向b上遇到遮擋,則該背景點特征值加2 ;若在垂直于該第一方向的第三方向c上遇到遮擋,則該背景點特征值加4 ;若在與該第三方向相反的第四方向d上遇到遮擋,則該背景點特征值加8,其中,所述第一方向為所述垂直和水平的四個方向中的任一方向。
5.根據權利要求1-4之一所述的基于十六值變換的符號識別方法,其特征在于,所述步驟(2. 1)中,首先將二值化的符號圖像劃分為若干個子圖像,然后分別確定各子圖像的門限值,進而獲得二值圖像中所有的連通域,并將最小外接矩陣的長和寬在一定范圍之內的連通域作為待識別的符號圖像。
6.根據權利要求1-5之一所述的基于十六值變換的符號識別方法,其特征在于所述步驟(2. 2)中,所述保真規(guī)整化具體為設符號圖像的最小外接矩陣圖像的高和寬分別為h 和w,那么縮放比率為r = 64/max (h, w)以符號圖像左上方的頂點作為坐標原點,水平向右為X軸正向,垂直向下為y軸正向, 對于規(guī)整化后符號圖像中的任一點(χ,y),給出如下不等式 χ < (64-wXr)/2, y < (64-hXr)/2, χ >= (64-wXr)/2+wXr, y >= (64-hXr)/2+hXr,若滿足以上不等式之一,則直接將(x,y)置為背景點,否則(x,y)對應原最小外接矩陣圖中的點(xc^y。),其中X0 = (x- (64-wXr)/2)/r, Y0 = (y-(64-hXr)/2)/r.。
全文摘要
本發(fā)明公開了一種基于十六值變換的符號識別方法,包括如下步驟(1.1)針對待識別符號的類型,準備該類型所有符號的符號圖像(1.2)對每個符號圖像,建立背景十六值變換的特征描述,獲得代表該符號圖像的特征表達,構建該類型符號的特征知識庫(2.1)對輸入圖像進行二值化處理,從中分割出待識別的符號圖像(2.2)對符號圖像規(guī)整化(2.3)對規(guī)整化后的符號圖像建立背景十六值變換的特征描述,獲得代表該符號圖像的特征表達(2.4)根據獲得的符號圖像的特征表達,利用構建的特征知識庫,識別出符號。本發(fā)明能有效消除非法符號的干擾,具有特征提取簡單、識別率高、識別速度快等特點,大大提高了符號識別技術的可用性。
文檔編號G06K9/00GK102156876SQ201110080680
公開日2011年8月17日 申請日期2011年3月31日 優(yōu)先權日2011年3月31日
發(fā)明者明德烈, 田甜, 田金文 申請人:華中科技大學