專利名稱:二值圖像的識別方法和識別裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字圖像識別領(lǐng)域,特別地,涉及二值圖像的識別方法和識別裝置。
背景技術(shù):
隨著數(shù)字圖像識別技術(shù)的不斷發(fā)展,其應(yīng)用的領(lǐng)域和范圍也越來越廣。通過使用 這一技術(shù),人們可對各種各樣的數(shù)字圖像進行自動識別和提取。例如,通過使用數(shù)字圖像識 別技術(shù)可以將用戶填寫的身份證號碼、支票數(shù)額以及其他數(shù)字、字母等信息作為二值圖像 進行自動識別。通常情況下,在要求用戶填寫信息的介質(zhì)上往往會預(yù)先設(shè)置好相應(yīng)的表格, 要求用戶將相關(guān)的信息填寫在表格中。這些表格可用于限制用戶所填寫的信息的位置,使 所填寫的內(nèi)容符合一定的格式標準。相應(yīng)地,在對用戶所填寫的信息進行識別的過程中,這 些表格可用于對所填寫的內(nèi)容進行大致的定位,以方便對所述信息的識別和讀取。但是,在 對包括表格的這類數(shù)字圖像進行識別的過程中,為了達到高的識別效率和識別準確度,通 常需要將這些表格從數(shù)字圖像中刪除,而將用戶填寫的筆劃信息保留下來以用于識別和讀 取。對于包括表格線和筆劃的二值圖像而言,其中筆劃和表格線所在的像素的值為“1”,而 不包含任何信息的像素的值為“0”。另外,在二值圖像中往往還包括一些噪聲信息,包含這 些噪聲信息的像素值也為“1”?,F(xiàn)有技術(shù)中,移除表格線的方法通常是將表格線連同表格線之外的像素值為“1” 的信息統(tǒng)統(tǒng)移除,僅保留在表格線內(nèi)部的像素信息,如圖14所示,其中示出現(xiàn)有技術(shù)中對 用戶填寫的身份證號碼進行二值圖像識別的結(jié)果。然而,由于一些表格框相對較小或者由 于用戶的特殊的書寫習(xí)慣,常常會出現(xiàn)用戶填寫的筆劃與這些表格的框線相交的情況,如 果使用現(xiàn)有技術(shù)的這種移除表格的方法,就會給后續(xù)的識別帶來困難,甚至使后續(xù)的識別 出現(xiàn)錯誤。如圖14中所示,用戶填寫的這些數(shù)字有的與表格的邊框重合,有的超出了表格 的邊框。為了識別這些二值圖像,現(xiàn)有技術(shù)移除了在表格線邊框之上和之外的所有信息,所 移除的信息中包括數(shù)字“4”、“5”、“2”、“8”等超出表格線邊框的部分筆劃信息??梢钥闯?, 在將所述表格以及在表格上和表格外的筆劃統(tǒng)統(tǒng)移除之后,這些在之前與表格相交的筆劃 便出現(xiàn)了殘缺,不再是原始填寫的完整的筆劃。可想而知,基于這些殘缺的筆劃信息進行識 別,很可能會出現(xiàn)識別錯誤。例如,在圖14中,對第4個數(shù)字“5”以及第5個數(shù)字“2”的識 別均出現(xiàn)了錯誤。由此,在對具有表格線和筆劃的二值圖像進行識別時,通過將表格以及表格之外 的內(nèi)容移除而僅保留表格內(nèi)部的信息來進行識別很可能會得到殘缺不全的筆劃信息,從而 給后續(xù)的識別帶來困難,甚至造成識別錯誤。
發(fā)明內(nèi)容
鑒于現(xiàn)有技術(shù)中的上述問題,本發(fā)明提出了一種二值圖像的識別方法和裝置。本 發(fā)明的方法和裝置在移除表格線的同時保留了完整的筆劃信息,實現(xiàn)了正確、高效地
根據(jù)本發(fā)明的一個方面,提供了一種二值圖像的識別方法,其中,在所述二值圖像 中包括表格線和筆劃,所述方法包括確定表格線的垂直和水平框線的位置;對所述表格 線的垂直框線進行移除處理;對移除表格線的垂直框線后的二值圖像進行細化;在細化后 的二值圖像上跟蹤所述表格線的水平框線的最短路徑;判斷所跟蹤的路徑與筆劃的相交類 型,基于預(yù)設(shè)的相交類型和相應(yīng)的相交部分是否是筆劃部分的對應(yīng)關(guān)系來確定所述跟蹤路 徑上與所述筆劃相交的部分是否是筆劃部分;以及保留所述跟蹤路徑上的筆劃部分,以及 移除所述跟蹤路徑上的非筆劃部分。根據(jù)本發(fā)明的一個優(yōu)選實施例,所述二值圖像的識別方法還包括將所保留的跟 蹤路徑上的筆劃部分在垂直方向上的游程與所述筆劃的寬度進行比較,并基于比較結(jié)果判 斷是否需要對所述筆劃部分進行部分移除。根據(jù)本發(fā)明的另一優(yōu)選實施例,在所述二值圖像的識別方法中,所述基于比較結(jié) 果來判斷是否需要對所述筆劃部分進行部分移除的步驟包括當所述筆劃部分在垂直方向 上的游程小于或等于所述筆劃寬度時,保留該游程內(nèi)的所有點;當所述筆劃部分在垂直方 向上的游程大于所述筆劃寬度但小于或等于所述筆劃寬度的預(yù)定倍數(shù)時,刪除該游程內(nèi)的 部分點;或者/以及當所述筆劃部分在垂直方向上的游程大于所述筆劃寬度的預(yù)定倍數(shù) 時,保留該游程內(nèi)的所有點。根據(jù)本發(fā)明的又一優(yōu)選實施例,在所述二值圖像的識別方法中,所述對所述表格 線的垂直框線進行移除處理的步驟包括計算所述垂直框線在水平方向上的游程;估計所 述垂直框線在水平方向的線寬;以及比較所述垂直框線在水平方向上的游程和所估計的線 寬,以及根據(jù)比較結(jié)果來移除所述垂直框線。根據(jù)本發(fā)明的另一個方面,提供了一種二值圖像的識別裝置,其中所述二值圖像 包括表格線和筆劃,所述裝置包括垂直和水平框線位置確定模塊,用于確定表格線的垂直 和水平框線的位置;垂直框線處理模塊,用于對所述表格線的垂直框線進行移除處理;二 值圖像細化模塊,用于對移除表格線的垂直框線后的二值圖像進行細化;路徑跟蹤模塊,用 于在細化后的二值圖像上跟蹤所述表格線的水平框線的最短路徑;筆劃部分確定模塊,用 于判斷所跟蹤的路徑與筆劃的相交類型,以及基于預(yù)設(shè)的相交類型與相應(yīng)的相交部分是否 是筆劃部分的對應(yīng)關(guān)系來確定所述跟蹤路徑上與所述筆劃相交的部分是否是筆劃部分;以 及跟蹤路徑處理模塊,用于保留所述跟蹤路徑上的筆劃部分,以及移除所述跟蹤路徑上的 非筆劃部分。由于本發(fā)明不是簡單地將表格線之上和之外的信息完全移除,而是通過細化和跟 蹤處理以及進一步的分析判斷來決定哪些部分應(yīng)當移除哪些部分應(yīng)當保留,相應(yīng)地進行移 除和保留。由此,根據(jù)本發(fā)明的識別方法所得到的筆劃信息是完整的且具有很好的保形性, 便于對其進行高效率和高準確度的識別和讀取。
以下將參考附圖詳細描述本發(fā)明的優(yōu)選實施例。通過參考下面結(jié)合附圖對本發(fā)明 實施例的說明,本發(fā)明的以上和其他目的、特點和優(yōu)點將會更加明顯。在附圖中,相同的或 類似的技術(shù)特征或部件將采用相同或類似的附圖標記來表示。在各個附圖中圖1示出了根據(jù)本發(fā)明一實施例的二值圖像識別方法的流程圖2示出了根據(jù)本發(fā)明一實施例的在如圖1中所示的二值圖像識別方法中的步驟 Sll的流程圖;圖3示出了根據(jù)本發(fā)明一實施例的在如圖1中所示的二值圖像識別方法中的步驟 S12的流程圖;圖4示出了根據(jù)本發(fā)明一實施例的在如圖3中所示的步驟S12的子步驟S123的 判斷流程圖;圖5示出了根據(jù)本發(fā)明一實施例的在如圖1中所示的二值圖像識別方法中的步驟 S17的判斷流程圖;圖6a示出了包括表格線和筆劃信息的二值圖像,圖6b_6f示出了圖6a所示的二 值圖像在經(jīng)過本發(fā)明的二值圖像識別方法的相應(yīng)步驟處理之后的示圖;圖7是使用圖2所示的步驟Sll對圖6a所示的二值圖像進行相應(yīng)處理的示意圖; 其中,圖7a示出了對所述二值圖像分別進行垂直和水平方向的累加投影的示圖;圖7b示出 了所得到的垂直方向的累加投影以及與其進行卷積的水平方波序列模板;圖7c示出了基 于分別獲得最大卷積響應(yīng)時的方波序列模板的位置確定垂直和水平框線的位置后的所述 二值圖像;圖8示出了使用動態(tài)規(guī)劃法跟蹤最短路徑的示意圖;圖9示出了所填寫的筆劃與表格線的邊框的幾種相交類型;圖10示出了根據(jù)本發(fā)明一實施例的二值圖像識別裝置的組成框圖;圖11示出了根據(jù)本發(fā)明一實施例的在如圖10中所示的二值圖像識別裝置中的模 塊垂直和水平框線位置確定模塊11的組成框圖;圖12示出了根據(jù)本發(fā)明一實施例的在如圖10中所示的二值圖像識別裝置中的垂 直框線處理模塊12的組成框圖;圖13示出了根據(jù)本發(fā)明一實施例的移除噪聲前后的二值圖像的示圖;以及圖14示出了現(xiàn)有技術(shù)中對二值圖像進行識別的示例圖。
具體實施例方式在下文中,將參考附圖詳細描述根據(jù)本發(fā)明實施例的二值圖像的識別方法和識別
直ο關(guān)于眾所周知的功能或者結(jié)構(gòu)的詳細描述可能會使本公開內(nèi)容的主題內(nèi)容不清 楚。因此,在下文中,將僅對與本公開內(nèi)容的技術(shù)范圍直接相關(guān)的必要組件進行描述。圖1示出了根據(jù)本發(fā)明一實施例的二值圖像識別方法的流程圖。所述的二值圖像 包括表格線和用戶所填寫的筆劃,且其中,所述表格線包括水平框線和垂直框線。如圖1中 所示,所述二值圖像識別方法包括步驟S11-S17。步驟Sll包括確定二值圖像中的表格線的垂直框線和水平框線的位置的操作。識 別所述二值圖像的目的是為了識別其中的筆劃信息。為了準確、高效地識別所述筆劃信息, 需要移除二值圖像中不是筆劃的部分,包括移除二值圖像中的表格線。為移除表格線,首先 需要確定表格線中的垂直框線和水平框線的位置。可使用現(xiàn)有的多種表格線位置確定方法 來確定所述表格線的位置。以下以使用投影卷積法為例來描述確定所述垂直框線和水平框 線的位置的操作,如圖2中所示,其中包括步驟S111-S113。
步驟Slll包括對二值圖像進行垂直方向和水平方向的累加投影的操作,相應(yīng)地 得到垂直方向和水平方向的累加投影波形。在圖7a所示的二值圖像中,假設(shè)空白處的像素 值為0,而筆劃和表格線處的像素值為1,則通過分別對所述二值圖像進行垂直方向和水平 方向的像素值累加,可得到如圖7a中所示的垂直方向和水平方向的累加投影波形。從圖7a 中可以看出,在所得到的垂直方向的累加投影波形中,在對應(yīng)于表格線的垂直框線的位置 處具有幅值近似相等的波峰,這些波峰的峰值遠高于其他波峰的峰值,對這些高幅值的波 峰的位置進行定位即可定位表格線的垂直框線的位置;類似地,在所得到的水平方向的累 加投影波形中,在與兩個水平框線對應(yīng)的位置處具有幅值近似相等的兩個波峰,這兩個波 峰的幅值遠高于它們之間的其他波峰的幅值,對這兩個高幅值的波峰的位置進行定位即可 定位表格線的水平框線的位置。為定位這些高幅值波峰的位置,執(zhí)行步驟S112。步驟S112包括使用相應(yīng)的方波序列模板分別與上述得到的投影波形進行卷積, 即用水平方向的方波序列模板與二值圖像在垂直方向上的投影得到的波形進行卷積,以及 使用垂直方向的方波序列模板與二值圖像在水平方向上的投影得到的波形進行卷積。參考 圖7b,其中示出在垂直方向上進行累加得到的累加投影以及與其進行卷積的水平方向的方 波序列模板。其中,對于水平方向的方波模板,遍歷該方波模板的所有的χ-偏移而分別與 二值圖像在垂直方向上的投影得到的投影波形進行卷積,找出最大的卷積響應(yīng);類似地,對 于垂直方向的方波模板,遍歷該方波模板的所有的Y-偏移而分別與二值圖像在水平方向 上的投影得到的投影波形進行卷積,找出最大的卷積響應(yīng)。S113包括基于分別獲得最大卷積響應(yīng)時的方波序列模板的位置,確定垂直和水平 框線的位置。由圖7b可知,當此水平方波序列模板的波峰分別與二值圖像在垂直方向的投 影得到的投影波形的波峰準確對準時,即可得到最大的卷積響應(yīng)。由于如之前所提到的,所 述二值圖像在垂直方向上的投影得到的投影波形的波峰的位置對應(yīng)于表格線的垂直框線 的位置,因此在獲得最大卷積響應(yīng)時所述方波序列模板的峰值的位置即為各個垂直框線的 位置。由此,可通過獲得最大卷積響應(yīng)時的所述水平方波序列模板的位置來準確地定位垂 直框線的位置;類似地,可通過獲得最大卷積響應(yīng)時所述垂直方波序列模板的位置來準確 定位水平框線的位置。上述對垂直和水平框線進行定位的步驟可以同時進行,也可以先后分開進行?;?者,也可以在上述步驟中僅確定垂直框線的位置,對于水平框線,可在之后需要移除水平框 線的步驟之前再使用上述類似的方法來確定其位置。另外,雖然在上述實施例中描述了通過累加卷積法來確定垂直框線和水平框線的 位置,但是本發(fā)明不限于使用上述方法,而是可以根據(jù)實際的情況和需要使用其他的方法, 例如,根據(jù)一實施例,可利用已保存的表格線的位置信息來實現(xiàn)本發(fā)明的垂直框線和水平 框線的位置確定的操作。所述二值圖像識別方法的步驟S12包括移除二值圖像中的表格線中的垂直框線。 在確定了表格線的垂直框線和水平框線的位置之后,即可對垂直框線進行移除處理。可根 據(jù)圖3所示的流程圖來進行相應(yīng)的移除處理操作。如圖3中所示,移除垂直框線的步驟S12 包括步驟S121-S123。步驟S121包括計算垂直框線在水平方向的游程。這里所提到的垂直框線在水平 方向的游程是指每條垂直框線的每一個水平像素行的實際寬度,如之前提到的,假設(shè)在二值圖像中的表格線和筆劃處的像素的像素值為1,而其他空白處的像素的像素值為0。因 此,所述每條垂直框線的每一個水平像素行的實際寬度可由該水平像素行上的像素值連續(xù) 為1的像素個數(shù)來表示。由此,根據(jù)一個實施例,可通過計算連續(xù)的像素值為1的像素的個 數(shù)來計算垂直框線的游程,具體包括基于之前所確定的垂直框線的位置,針對每一個垂直 框線的每一個水平像素行,計算該水平像素行中連續(xù)的像素值為1的像素的個數(shù),所得到 的像素個數(shù)即為該水平像素行的游程。其中,所述每一水平像素行的高度可以是1個像素, 也可以是多個像素,可根據(jù)實際需要進行選擇。所述每條垂直框線的每個水平像素行的實 際寬度可能與垂直框線本身在水平方向的線寬相等,但也可能大于垂直框線在水平方向的 線寬,例如在用戶填寫的筆劃與垂直框線發(fā)生交叉或相切等的情況下。步驟S122包括估計垂直框線在水平方向的線寬。所述垂直框線在水平方向的線 寬的估計值可通過對在步驟S121中得到的游程進行求和平均而近似得到。具體而言,可將 上述得到的針對一條垂直框線的每一個水平像素行的游程相加,然后除以該垂直框線的水 平像素行的個數(shù),所得到的數(shù)字即可作為該垂直框線在水平方向的線寬的估計值。當然,也 可對多個或所有的垂直框線的每一水平像素行的游程進行加和平均,得到更為準確的估計 值。除了基于上述方法估計之外,還可根據(jù)事先獲得的已知信息來獲知垂直框線的線寬。步驟S123包括比較上述所計算的垂直框線在水平方向的游程和所估計的垂直框 線在水平方向的線寬,以及根據(jù)比較結(jié)果來移除所述垂直框線。具體包括將所計算的垂直 框線的游程(即實際寬度)逐一與所估計的線寬進行比較,然后根據(jù)比較的結(jié)果來對每一 垂直框線進行移除處理。所述比較結(jié)果與筆劃和垂直框線的相交類型有關(guān),其中,所述相交 類型包括交叉、相切等,如圖9所示,該圖中主要示出了筆劃與水平框線相交的幾種類型, 所述相交類型同樣適用于筆劃與垂直框線相交的情形。結(jié)合筆劃和垂直框線的所述相交類 型,可將所述比較結(jié)果分為以下幾種第一種垂直框線在水平方向上的游程小于或等于垂直框線在水平方向上的線寬 (S1231)??梢岳斫猓朔N情形包括所填寫的筆劃不與垂直框線存在相交的情形。第二種垂直框線在水平方向的游程大于垂直框線在水平方向上的線寬但小于或 等于所述線寬的預(yù)定倍數(shù)(S1232)。其中所述預(yù)定倍數(shù)可參考所述筆劃部分的寬度和所述 垂直框線的線寬之間的關(guān)系來決定。例如,如果前者是后者的N倍,則所述預(yù)定倍數(shù)可取 (1+N),例如在所述筆劃部分的寬度和所述垂直框線的線寬的寬度相等(即N= 1)時,則所 述預(yù)定倍數(shù)為1+1 = 2。此種情形包括所述筆劃與垂直邊框相切或部分融合的情況;第三種垂直框線在水平方向上的游程大于所述線寬的預(yù)定倍數(shù)(S1233)。此種 情況包括所填寫的筆劃與垂直框線存在交叉或部分融合的情形。其中所述預(yù)定倍數(shù)可以是 2或更大的倍數(shù),可根據(jù)實際需要進行選擇。基于上述所述比較結(jié)果和相交類型的對應(yīng)關(guān)系,根據(jù)本發(fā)明的實施例,可按照如 下的判斷規(guī)則來移除所述垂直框線(如圖4所示)如果垂直框線在水平方向上的游程小于或等于所估計的線寬(S1231),則刪除該 垂直框線在該游程內(nèi)的所有像素點;如果垂直框線在水平方向的游程大于所估計的線寬但小于或等于所述線寬的預(yù) 定倍數(shù)(S1232),則刪除該垂直框線在所述游程內(nèi)的部分像素點。如之前提到的,假設(shè)所述 筆劃部分的寬度和所述垂直框線的線寬的寬度相等,則所述預(yù)定倍數(shù)可取2。在此情形下,如果所述垂直框線的游程等于所述垂直框線的線寬的M倍,其中M滿足2 >= M > 1,則從 外向內(nèi)刪除所述游程的(1-1/M)的像素點。例如,如果所述垂直框線在水平方向上的游程 等于所述線寬的2倍,則從外向內(nèi)刪除所述游程的半數(shù)像素點;如果所述垂直框線在水平 方向上的游程等于所述線寬的1. 5(M= 1. 5)倍,則從外向內(nèi)刪除所述游程的三分之一像素 點,等等。例如數(shù)字“8”與垂直框線相切,則在所述筆劃部分的寬度和所述垂直框線的線寬 的寬度相等的情況下,垂直框線在水平方向的游程等于線寬的2倍,此時,從外到內(nèi)刪除該 游程的半數(shù)點后會使得刪除垂直框線的部分而保留完整的筆劃“8” ;如果垂直框線在水平方向上的游程大于所述線寬的預(yù)定倍數(shù)(S1233),則保留該 垂直框線在該游程內(nèi)的所有像素點。以數(shù)字“5”為例進行說明,如果數(shù)字“5”的上部的水 平筆劃與垂直邊框交叉,則該垂直框線在水平方向的游程會大于垂直框線的線寬的預(yù)定倍 數(shù),例如2倍或更多倍,此時,保留該垂直框線在該游程內(nèi)的所有點即可保留數(shù)字“5”的全 部筆劃?;谏鲜雠袛嘁?guī)則逐一移除每條垂直框線,由此完成對垂直框線的移除處理。需 要說明的是,針對每一垂直框線,判斷步驟S1231、S1232、S1233的順序不限于上述的判斷 順序,而是可以隨意調(diào)換的。另外,根據(jù)實際的需要,上述移除垂直框線的步驟S12也可在 以下的步驟S13和S14之間進行。之后可進行所述二值圖像識別方法的步驟S13,該步驟包括對移除垂直框線后 的二值圖像進行細化。所謂的細化就是經(jīng)過一層層的剝離,從原來的圖中去掉一些點,但仍 要保持原來的形狀,直到得到圖像的骨架或者說是圖像的中軸。所使用的細化算法應(yīng)當保 證細化后細線的連通性,保持原圖的基本形狀,減少筆畫相交處的畸變,細化結(jié)果是原圖像 的中心線。由于后續(xù)的處理和判斷均要基于細化后的二值圖像進行,因此,圖像細化是很重 要的一步,圖像細化的效果將對識別的效率和正確性產(chǎn)生重要的影響。本發(fā)明可使用多種 細化算法,例如Hilditch細化算法、Pavlidis細化算法、Rosenfeld細化算法等來對所述二 值圖像進行細化。圖6c中示出使用Hilditch細化算法細化處理后的二值圖像。對所述二值圖像進行細化處理后,繼續(xù)執(zhí)行步驟S14 在細化后的二值圖像上跟 蹤水平框線的最短路徑。為獲得最短路徑,可使用動態(tài)規(guī)劃法來對水平框線進行跟蹤處理。 以下結(jié)合圖8來說明根據(jù)動態(tài)規(guī)劃法獲得最短路徑的方法。圖8中示出了在所示的黑白點 形成的二值圖上獲得從左到右的最短路徑的示意圖,其中的黑點和白點可分別對應(yīng)于本發(fā) 明中細化圖像中的像素值為“1”和“O”的像素點。圖8中的每一步示出了三條路徑,由此得 到了多條跟蹤路徑。為得到其中的最短路徑,可向其中的黑白點和每一步賦予不同的分值。 例如,黑點的分值為“255”,白點的分值為“0”,兩點間的水平路徑的分值為“255”,而一點 與其相鄰的右上點以及右下點的路徑的分值均為“177”,等等。對于每一從左到右的路徑, 將該路徑所包括的每一點和每一步的分值進行求和,所得到的分值最大的路徑即為最短路 徑,如其中的加粗線所示?;诖朔N方法,可在本發(fā)明的細化的二值圖像上跟蹤水平框線的 最短路徑,所得到的具有最短路徑的跟蹤路徑如圖6d所示。在所述筆劃與水平框線存在相交的情況下,所述跟蹤路徑上既包括水平框線部 分,即非筆劃部分,也包括筆劃部分。為區(qū)分其中的筆劃部分和非筆劃部分,執(zhí)行所述細化 圖像識別方法的步驟S15 判斷所填寫的筆劃與所述跟蹤路徑的相交類型,基于預(yù)設(shè)的“相 交類型”和“跟蹤路徑上的相交部分是否是筆劃部分”的對應(yīng)關(guān)系來確定所述跟蹤路徑上與所述筆劃相交的部分是否是筆劃部分?!跋嘟活愋汀焙汀案櫬窂缴系南嘟徊糠质欠袷枪P劃部分”的對應(yīng)關(guān)系可通過事先 對各種筆劃和跟蹤路徑實際相交的各種情形進行分析和歸納后得到。所述對應(yīng)關(guān)系表的獲 得首先需要考慮筆劃與跟蹤路徑相交的各種相交方式,例如,數(shù)字“ 1,,或“7”與跟蹤路徑的 相交方式通常為穿過跟蹤路徑、與跟蹤路線相接但沒穿過跟蹤路徑,等等;數(shù)字“8”與跟蹤 路徑的相交方式通常包括數(shù)字“8”的部分圓弧在跟蹤路徑之下或者與跟蹤路徑相切;以及 其他數(shù)字與跟蹤路徑的其他的一些相交方式,等等。然后,基于這些相交方式的特點對它們 進行歸納總結(jié),列出不同的相交類型,例如,對于數(shù)字“1”穿過跟蹤路徑的情形,可知其特點 是該筆劃在跟蹤路徑的上面有1個點與跟蹤路徑相接,在跟蹤路徑的下面有1個點與跟蹤 路徑相接,這里將具有這種特點的相交方式定義為“一點交叉”的相交類型;對于數(shù)字“8” 的部分圓弧在跟蹤路徑之下的情形,可知其特點是該筆劃在跟蹤路徑的上面有兩個點與跟 蹤路徑相接,在跟蹤路徑的下面也有兩個點與跟蹤路徑相接,這里將具有這種特點的相交 方式定義為“兩點交叉”的相交類型;對于數(shù)字“8”的部分圓弧與跟蹤路徑相切的情形(如 圖6a中的“8”),可知其特點是該筆劃在跟蹤路徑的上面有兩個點與跟蹤路徑相接,而在跟 蹤路徑的下面則沒有點與跟蹤路徑相接,這里將具有這種特點的相交方式定義為“兩點相 切”的相交類型;另外還可將例如在跟蹤路徑之上與跟蹤路徑相接但不穿過跟蹤路徑的數(shù) 字“1”(如圖6a中的第4-第7個“1”)與跟蹤路徑的相交方式定義為“一點相交”的相交 類型,等等。之后,基于這些相交類型所對應(yīng)的跟蹤路徑上的相交部分是否是筆劃來設(shè)置對 應(yīng)關(guān)系表中的“跟蹤路徑上的相交部分是否是筆劃部分”項。還以上述“一點相交”、“兩點 相交”和“兩點相切”的相交類型為例進行說明。在所述數(shù)字“ 1 ”與跟蹤路徑“一點交叉”的 情形下,所述跟蹤路徑上的相交部分即為這一交叉點,可知該交叉點屬于筆劃部分,因此, 如果相交類型為“一點交叉”,則其在對應(yīng)關(guān)系表中對應(yīng)的“跟蹤路徑上的相交部分是否是 筆劃部分”項應(yīng)為“是”;在所述數(shù)字“8”與跟蹤路徑“兩點交叉”的情形下,所述跟蹤路徑 上的相交部分即為這兩個交叉點之間的部分,可知該相交部分不屬于筆劃部分,因此,如果 相交類型為“兩點交叉”,則其在對應(yīng)關(guān)系表中對應(yīng)的“跟蹤路徑上的相交部分是否是筆劃 部分”項應(yīng)為“否”;再比如在所述數(shù)字“8”與跟蹤路徑兩點相切的情形下,所述跟蹤路徑上 的相交部分即為這兩個相切點之間的部分,可知該相交部分屬于筆劃部分,因此,如果相交 類型為“兩點相切”,則其在對應(yīng)關(guān)系表中對應(yīng)的“跟蹤路徑上的相交部分是否是筆劃”項應(yīng) 為“是”。由此,得到“相交類型”和“跟蹤路徑上的相交部分是否是筆劃部分”的對應(yīng)關(guān)系 表。以上僅例舉了筆劃與跟蹤路徑的幾種常見的相交類型,實際上,由于筆劃的多樣化和個 人書寫的個性化,筆劃和跟蹤路徑之間的相交類型也是多種多樣的,其包括但不限于一點 相切或融合、兩點相切或融合、兩點交叉、多點交叉等等,這里不一一例舉。本發(fā)明即通過對 這些類型的分析、歸納和總結(jié),預(yù)先制作出筆劃和跟蹤路徑的“相交類型”和對應(yīng)的“跟蹤路 徑上的相交部分是否是筆劃部分”的對應(yīng)關(guān)系表,以備在步驟S15中進行判斷時查詢。在步驟S15中,針對筆劃與跟蹤路徑出現(xiàn)相交的情形,需判斷跟蹤路徑與筆劃的 相交類型。為此,需確定跟蹤路徑與筆劃的相交特點。例如,如果檢測出所述筆劃有一個點 在跟蹤路徑的上面與跟蹤路徑相接,有一個點在跟蹤路徑的下面與跟蹤路徑相接,則可判 斷其與跟蹤路徑的相交類型為“一點交叉”;又例如,如果檢測出所述筆劃有兩個點在跟蹤 路徑的上面與跟蹤路徑相接,在跟蹤路徑下沒有點與跟蹤路徑相接,則可判斷其與跟蹤路徑的相交類型為“兩點相切”;再例如,如果檢測出所述筆劃有兩個點在跟蹤路徑的上面與 跟蹤路徑相接,有兩個點在跟蹤路徑的下面與跟蹤路徑相接,則判斷其與跟蹤路徑的相交 類型為“兩點交叉”。然后,根據(jù)所判斷得到的相交類型,查詢預(yù)先存儲的“相交類型”與“跟 蹤路徑上相應(yīng)的相交部分是否是筆劃”的對應(yīng)關(guān)系表。如之前提到的,根據(jù)對應(yīng)關(guān)系表中的 記錄,當相交類型為“一點交叉”時,相應(yīng)的“跟蹤路徑上相應(yīng)的相交部分是否是筆劃”項為 “是”;當相交類型為“兩點相切”時,相應(yīng)的“跟蹤路徑上相應(yīng)的相交部分是否是筆劃部分” 項為“是”;當相交類型為“兩點相交”時,相應(yīng)的“跟蹤路徑上相應(yīng)的相交部分是否是筆劃 部分”項為“否”。以上僅對一點交叉、兩點交叉和兩點相切的相交類型的判斷進行了說明, 應(yīng)當理解,這些相交類型僅是示例性的,并非是對相交類型的窮舉,也并非用于限制本發(fā)明 的范圍。之后執(zhí)行步驟S16 基于上述判斷和查詢的結(jié)果,保留所述跟蹤路徑上被確定為 筆劃的部分,刪除跟蹤路徑上的其余部分。圖6a示出了包括表格線和筆劃信息的二值圖像的示圖。圖6b_6f示出了圖6a所 示的二值圖像經(jīng)過本發(fā)明的二值圖像識別方法的相應(yīng)步驟處理之后的示圖,其中,圖6b示 出了移除表格線的垂直框線之后的二值圖像;圖6c示出了在移除垂直框線之后的二值圖 像被細化后的圖像;圖6d示出了在細化的二值圖像上跟蹤得到水平框線的最短路徑之后 的二值圖像;圖6e示出了刪除跟蹤路徑上的非筆劃部分同時保留跟蹤路徑上的筆劃部分 而得到的二值圖像;以及圖6f示出了上述處理之后的筆劃還原后的形狀。從上述圖6f中可以看出,經(jīng)過上述處理后,所有的數(shù)字均保持了完整的筆劃,且 均被準確地識別。與現(xiàn)有技術(shù)相比,本發(fā)明的上述識別方法實現(xiàn)了對二值圖像的更加準確 和高效的識別,大大降低了誤識別的概率。但是可以看出,圖6f中的數(shù)字“4”和“5”的下 部包含贅余的內(nèi)容,在一定程度上存在失真。為了進一步改善識別的效果,提高識別的準確 性,所述二值圖像識別方法還可進一步包括步驟S17 基于所述筆劃部分的游程和所述筆 劃的寬度的比較結(jié)果對筆劃部分進行進一步的相應(yīng)處理。所述筆劃的寬度可通過沿X和/ 或Y方向計算和統(tǒng)計所述二值圖像上的像素值為1的連續(xù)像素的游程長度來估計得到。具 體包括沿X和/或Y方向計算所述二值圖像上的像素值為1的連續(xù)像素的游程長度;統(tǒng)計 各個游程長度的個數(shù);根據(jù)游程長度個數(shù)分布的直方圖,找到個數(shù)最多的游程長度。該個數(shù) 最多的游程長度即可作為筆劃的寬度的估計值。根據(jù)本發(fā)明的實施例,步驟S17中基于比較結(jié)果對所述筆劃部分進行處理可基于 以下規(guī)則來進行(參見圖5所示)如果所述筆劃部分在垂直方向上的游程小于或等于所述筆劃的寬度(S171),則保 留該游程內(nèi)的所有點;此種情形包括之前所述筆劃不與跟蹤路徑交叉的情形;如果所述筆劃部分在垂直方向上的游程大于筆劃的寬度但小于或等于筆劃寬度 的預(yù)定倍數(shù)(S172),則刪除該游程內(nèi)的部分像素點。此種情形包括之前所述筆劃與跟蹤路 徑相切或部分融合的情況。在筆劃的寬度和表格線的線寬相等的情況下,所述預(yù)定倍數(shù)可 以是2。在此情形下,如果所述筆劃部分在垂直方向上的游程等于筆劃的寬度的M倍,其中M 滿足2 >= M >1,則從外向內(nèi)刪除所述游程的(1-1/M)的像素點。例如,如果所述筆劃部 分在垂直方向上的游程等于筆劃寬度的2 (M= 2)倍,則從外向內(nèi)刪除所述游程的半數(shù)像素 點;如果所述筆劃部分在垂直方向上的游程等于筆劃寬度的1. 5(M = 1. 5)倍,則從外向內(nèi)刪除所述游程的三分之一像素點,等等。例如數(shù)字“8”與水平框線相切或部分融合,則通過 該步驟之前的細化、跟蹤和筆劃判斷和保留步驟之后,數(shù)字“8”與跟蹤路徑相切的部分以及 跟蹤路徑上的相交部分均保留了下來,所保留的跟蹤路徑就成為該數(shù)字上贅余的部分。結(jié) 果,數(shù)字“8”的底部在垂直方向的游程會大于筆劃的寬度但是小于或等于筆劃寬度的2倍, 通過執(zhí)行步驟S17刪除部分點后會使失真的筆劃“8”恢復(fù)到接近于原始“8”的形狀;或者當所述筆劃部分在垂直方向上的游程大于筆劃寬度的預(yù)定倍數(shù)時,則保留該游程 內(nèi)的所有點(S17!3)。此種情形包括之前所述筆劃與跟蹤路徑一點交叉的情況,例如數(shù)字 “ 1”與跟蹤路徑一點交叉,則通過之前的細化、跟蹤和筆劃判斷和保留步驟之后,保留了 “ 1” 的全部筆劃,其在垂直方向的游程會大于筆劃寬度的預(yù)定倍數(shù)。此時,保留該筆劃游程內(nèi)的 所有點即保持了完整的筆劃“1”。其中,所述預(yù)定倍數(shù)可根據(jù)實際情況進行選取,例如可選 擇2或者更大的倍數(shù)。根據(jù)本發(fā)明的實施例,所述二值圖像的識別方法還包括在確定表格線的垂直和水 平框線的位置之前,移除二值圖像中的白噪聲和黑噪聲。在對二值圖像上的噪聲進行移除 前和后的二值圖像如圖13示出,其中,第一行二值圖像示出未對其進行噪聲移除之前的情 形,從圖中可以看出,在未對二值圖像進行噪聲移除之前,所述二值圖像上除了筆劃和表格 之外,還存在孤立的噪聲點;第二行的二值圖像示出對其進行了噪聲移除之后的情形,從中 可以看出,已不再具有明顯的噪聲點。移除噪聲點的方法可采用連通域分析法,根據(jù)連通域 分析法,可判斷像素值為“1”的連通域的閾值的大小,如果所述連通域的閾值小于某一值, 例如小于5,則判斷該連通域為噪聲,相應(yīng)地移除該連通域。圖10示出了根據(jù)本發(fā)明實施例的二值圖像識別裝置1。所述二值圖像識別裝置 1可用于根據(jù)上述的本發(fā)明的二值圖像識別方法來進行包括筆劃和表格線的二值圖像的識 別。所述二值圖像識別裝置1包括垂直和水平框線位置確定模塊11、垂直框線處理模塊 12、細化模塊13、路徑跟蹤模塊14、筆劃部分確定模塊15以及跟蹤路徑處理模塊16。所述垂 直和水平框線位置確定模塊11用于確定二值圖像中的表格線的垂直框線和水平框線的位 置。所述垂直框線處理模塊12用于對所述表格線的垂直框線進行移除處理。所述二值圖像 細化模塊13用于對移除表格線的垂直框線后的二值圖像進行細化;根據(jù)本發(fā)明的實施例, 所述二值圖像細化模塊13可通過使用hilditch細化算法、Pavlidis細化算法、Rosenfeld 細化算法等對所述二值圖像進行細化。所述路徑跟蹤模塊14用于在細化后的二值圖像上 跟蹤所述表格線的水平框線的最短路徑;根據(jù)本發(fā)明的實施例,所述路徑跟蹤模塊14可通 過使用動態(tài)規(guī)劃算法來執(zhí)行相應(yīng)的操作。所述筆劃部分確定模塊15用于判斷所填寫的筆 劃與所跟蹤的路徑的相交類型,以及基于預(yù)設(shè)的“相交類型”與相應(yīng)的“跟蹤路徑上的相交 部分是否是筆劃部分”的對應(yīng)關(guān)系來確定所述跟蹤路徑上與所述筆劃相交的部分是否是筆 劃部分,其中,所述筆劃與所述跟蹤路徑的相交類型包括一點交叉、一點相切或融合、兩點 交叉、兩點相切或融合或它們的任意組合,等等。所述跟蹤路徑處理模塊16用于保留所述 跟蹤路徑上的被確定為筆劃的部分,以及移除所述跟蹤路徑上的非筆劃部分。為進一步提高識別效率和準確性,根據(jù)本發(fā)明的一優(yōu)選實施方式,所述二值圖像 識別裝置1還可包括筆劃部分處理模塊17,用于將所保留的跟蹤路徑上的筆劃部分在垂直 方向上的游程與筆劃的寬度進行比較,并基于比較結(jié)果判斷是否需要對所述筆劃部分進行 部分移除。根據(jù)本發(fā)明的實施例,所述筆劃部分處理模塊17可通過以下規(guī)則來判斷是否需要對所述筆劃部分進行部分移除當所述筆劃部分在垂直方向上的游程小于或等于筆劃寬 度時或者當所述筆劃部分在垂直方向上的游程大于筆劃寬度的預(yù)定倍數(shù)時,保留該游程內(nèi) 的所有點;以及當所述筆劃部分在垂直方向上的游程大于筆劃寬度但小于或等于筆劃寬度 的預(yù)定倍數(shù)時,刪除該游程內(nèi)的部分點。圖11示出了所述二值圖像識別裝置1中包括的垂直和水平框線位置確定模塊11 的具體組成。所述垂直和水平框線位置確定模塊11可執(zhí)行本發(fā)明的二值圖像識別方法中 的垂直和水平框線的確定位置的步驟。如圖11中所示,所述垂直和水平框線位置確定模塊 11包括累加投影模塊111,用于對所述二值圖像分別進行垂直和水平方向的累加投影;卷 積模塊112,用于使用方波序列模板分別與上述累加投影得到的垂直方向和水平方向的投 影波形進行卷積;以及位置處理模塊113,用于基于分別獲得最大卷積響應(yīng)時的方波序列 模板的位置確定所述垂直和水平框線的位置。圖12示出了所述二值圖像識別裝置1中包括的垂直框線處理模塊12的具體組 成。所述垂直框線處理模塊12可執(zhí)行上述本發(fā)明的二值圖像識別方法中的對垂直框線進 行移除處理的步驟。如圖12中所示,所述垂直框線處理模塊12包括游程計算模塊121, 用于計算所述垂直框線在水平方向上的游程;線寬估計模塊122,用于估計所述垂直框線 在水平方向的線寬;以及垂直框線移除模塊123,用于基于所述垂直框線在水平方向上的 游程和所估計的線寬的比較結(jié)果來移除所述垂直框線。根據(jù)本發(fā)明的實施例,所述垂直框線移除模塊123基于以下規(guī)則來移除所述垂直 框線當所述垂直框線在水平方向上的游程小于或等于所述線寬時,刪除該游程內(nèi)的所有 點;當所述垂直框線在水平方向上的游程大于所述線寬但小于或等于所述線寬的預(yù)定倍數(shù) 時,刪除該游程內(nèi)的部分點;以及當所述垂直框線在水平方向上的游程大于所述線寬的預(yù) 定倍數(shù)時,保留該游程內(nèi)的所有點。其中,所述預(yù)定倍數(shù)包括2,且相應(yīng)地,所述游程內(nèi)的部 分點包括所述游程內(nèi)的所有點的一半。根據(jù)本發(fā)明的優(yōu)選實施例,所述二值圖像的識別裝置1還包括噪聲處理模塊,用 于在確定表格線的垂直和水平框線的位置之前,通過連通域分析移除二值圖像中的孤立的
噪聲點。本發(fā)明還提供了一種包括其中存儲的機器可讀取的指令代碼的程序產(chǎn)品,其中, 所述指令代碼在被讀取和執(zhí)行時,能夠使所述機器執(zhí)行之前圖1-5中描述的、以及雖然沒 有在附圖中具體地示出,但是已經(jīng)在本說明書中充分地披露的各種功能。此外,根據(jù)本發(fā)明上述各個實施例所述的方法可以通過存儲有機器可讀取的指令 代碼的程序產(chǎn)品進來實現(xiàn)。這些指令代碼由機器例如計算機讀取并執(zhí)行時,可執(zhí)行根據(jù)本 發(fā)明上述實施例的二值圖像識別方法。該程序產(chǎn)品可以具有任意的表現(xiàn)形式,例如,目標程 序、解釋器執(zhí)行的程序或者提供給操作系統(tǒng)的腳本程序等。相應(yīng)地,用于承載上述存儲有機器可讀取的指令代碼的程序產(chǎn)品的存儲介質(zhì)也包 括在本發(fā)明的公開中。所述存儲介質(zhì)包括但不限于軟盤、光盤、磁光盤、存儲卡、存儲棒,等等。以上結(jié)合附圖和實施例對本發(fā)明進行了描述。應(yīng)當理解,本發(fā)明不限于上述具體 的描述,而是在所附權(quán)項或其等同內(nèi)容的范圍內(nèi)可根據(jù)設(shè)計要求和其他因素進行各種修 改、組合、子組合或者替換。
通過上面對本發(fā)明的實施例的描述可知,本發(fā)明涵蓋的技術(shù)方案包括但不限于如 下的內(nèi)容附記1. 一種二值圖像的識別方法,在所述二值圖像中包括表格線和筆劃,所述方 法包括確定表格線的垂直和水平框線的位置;對所述表格線的垂直框線進行移除處理;對移除表格線的垂直框線后的二值圖像進行細化;在細化后的二值圖像上跟蹤所述表格線的水平框線的最短路徑;判斷所跟蹤的路徑與筆劃的相交類型,基于預(yù)設(shè)的相交類型和相應(yīng)的相交部分是 否是筆劃部分的對應(yīng)關(guān)系來確定所述跟蹤路徑上與所述筆劃相交的部分是否是筆劃部分; 以及保留所述跟蹤路徑上的筆劃部分,以及移除所述跟蹤路徑上的非筆劃部分。附記2.如附記1所述的二值圖像的識別方法,還包括將所保留的跟蹤路徑上的筆劃部分在垂直方向上的游程與所述筆劃的寬度進行 比較,并基于比較結(jié)果判斷是否需要對所述筆劃部分進行部分移除。附記3.如附記2所述的二值圖像的識別方法,其中所述基于比較結(jié)果來判斷是否 需要對所述筆劃部分進行部分移除的步驟包括當所述筆劃部分在垂直方向上的游程小于或等于所述筆劃寬度時,保留該游程內(nèi) 的所有點;當所述筆劃部分在垂直方向上的游程大于所述筆劃寬度但小于或等于所述線寬 的預(yù)定倍數(shù)時,刪除該游程內(nèi)的部分點;或者/以及當所述筆劃部分在垂直方向上的游程大于所述筆劃寬度的預(yù)定倍數(shù)時,保留該游 程內(nèi)的所有點。附記4.如附記1所述的二值圖像的識別方法,其中,所述跟蹤所述表格線的水平 框線的最短路徑的步驟是通過使用動態(tài)規(guī)劃算法來實現(xiàn)的。附記5.如附記1所述的二值圖像的識別方法,其中,所述跟蹤路徑與筆劃的相交 類型包括一點交叉、一點相切或融合、兩點交叉、兩點相切或融合或它們的任意組合。附記6.如附記1所述的二值圖像的識別方法,其中所述確定表格線的垂直和水平 框線的位置的步驟包括對所述二值圖像分別進行垂直和水平方向的累加投影;使用方波序列模板分別與上述累加投影得到的投影波形進行卷積;以及基于分別獲得最大卷積響應(yīng)時的方波序列模板的位置確定所述垂直和水平框線 的位置。附記7.如附記1所述的二值圖像的識別方法,其中,所述對所述表格線的垂直框 線進行移除處理的步驟包括計算所述垂直框線在水平方向上的游程;估計所述垂直框線在水平方向的線寬;以及比較所述垂直框線在水平方向上的游程和所估計的線寬,以及根據(jù)比較結(jié)果來移 除所述垂直框線。
附記8.如附記7所述的二值圖像的識別方法,其中,根據(jù)比較結(jié)果來移除所述垂 直框線包括當所述垂直框線在水平方向上的游程小于或等于所述線寬時,刪除該游程內(nèi)的所當所述垂直框線在水平方向上的游程大于所述線寬但小于或等于所述線寬的預(yù) 定倍數(shù)時,刪除該游程內(nèi)的部分點;或者當所述垂直框線在水平方向上的游程大于其線寬的預(yù)定倍數(shù)時,保留該游程內(nèi)的 所有點。附記9.如附記3或8所述的二值圖像的識別方法,其中,所述預(yù)定倍數(shù)包括2,且 所述游程內(nèi)的部分點包括所述游程內(nèi)的所有點的一半。附記10.如附記1所述的二值圖像的識別方法,其中,對二值圖像進行細化的步驟 是通過使用hiIditch細化算法實現(xiàn)的。附記11.如附記1所述的二值圖像的識別方法,進一步包括在確定表格線的垂直和水平框線的位置之前,通過連通域分析移除二值圖像中的 白噪聲和黑噪聲。附記12.如附記11所述的二值圖像的識別方法,其中,在連通域的閾值小于5的 情況下,移除該連通域。附記13. —種二值圖像的識別裝置,其中所述二值圖像包括表格線和筆劃,所述 裝置包括垂直和水平框線位置確定模塊,用于確定表格線的垂直和水平框線的位置;垂直框線處理模塊,用于對所述表格線的垂直框線進行移除處理;二值圖像細化模塊,用于對移除表格線的垂直框線后的二值圖像進行細化;路徑跟蹤模塊,用于在細化后的二值圖像上跟蹤所述表格線的水平框線的最短路 徑;筆劃部分確定模塊,用于判斷所跟蹤的路徑與筆劃的相交類型,以及基于預(yù)設(shè)的 相交類型與相應(yīng)的相交部分是否是筆劃部分的對應(yīng)關(guān)系來確定所述跟蹤路徑上與所述筆 劃相交的部分是否是筆劃部分;以及跟蹤路徑處理模塊,用于保留所述跟蹤路徑上的筆劃部分,以及移除所述跟蹤路 徑上的非筆劃部分。附記14.如附記13所述的二值圖像的識別裝置,還包括筆劃部分處理模塊,用于將所保留的跟蹤路徑上的筆劃部分在垂直方向上的游程 與所述筆劃的寬度進行比較,并基于比較結(jié)果判斷是否需要對所述筆劃部分進行部分移 除。附記15.如附記14所述的二值圖像的識別裝置,其中所述筆劃部分處理模塊通過 以下規(guī)則來判斷是否需要對所述筆劃部分進行部分移除當所述筆劃部分在垂直方向上的游程小于或等于所述筆劃寬度時或者當所述筆 劃部分在垂直方向上的游程大于所述筆劃寬度的預(yù)定倍數(shù)時,保留該游程內(nèi)的所有點;以 及當所述筆劃部分在垂直方向上的游程大于所述筆劃寬度但小于或等于所述筆劃寬度的預(yù)定倍數(shù)時,刪除該游程內(nèi)的部分點。附記16.如附記13所述的二值圖像的識別裝置,其中,所述路徑跟蹤模塊通過使 用動態(tài)規(guī)劃算法來執(zhí)行相應(yīng)的操作。附記17.如附記13所述的二值圖像的識別裝置,其中,所述跟蹤路徑與筆劃的相 交類型包括一點交叉、一點相切或融合、兩點交叉、兩點相切或融合或它們的任意組合。附記18.如附記13所述的二值圖像的識別裝置,其中所述垂直和水平框線位置確 定模塊包括累加投影模塊,用于對所述二值圖像分別進行垂直和水平方向的累加投影;卷積模塊,用于使用方波序列模板分別與上述累加投影得到的垂直方向和水平方 向的投影波形進行卷積;以及位置處理模塊,用于基于分別獲得最大卷積響應(yīng)時的方波序列模板的位置確定所 述垂直和水平框線的位置。附記19.如附記13所述的二值圖像的識別裝置,其中,所述垂直框線處理模塊包 括游程計算模塊,用于計算所述垂直框線在水平方向上的游程;線寬估計模塊,用于估計所述垂直框線在水平方向的線寬;以及垂直框線移除模塊,用于基于所述垂直框線在水平方向上的游程和所估計的線寬 的比較結(jié)果來移除所述垂直框線。附記20.如附記19所述的二值圖像的識別裝置,其中,所述垂直框線移除模塊基 于以下規(guī)則來移除所述垂直框線當所述垂直框線在水平方向上的游程小于或等于所述線寬時,刪除該游程內(nèi)的所當所述垂直框線在水平方向上的游程大于所述線寬但小于或等于所述線寬的預(yù) 定倍數(shù)時,刪除該游程內(nèi)的部分點;以及當所述垂直框線在水平方向上的游程大于所述線寬的預(yù)定倍數(shù)時,保留該游程內(nèi) 的所有點。附記21.如附記15或20所述的二值圖像的識別裝置,其中,所述預(yù)定倍數(shù)包括2, 且所述游程內(nèi)的部分點包括所述游程內(nèi)的所有點的一半。附記22.如附記13所述的二值圖像的識別裝置,其中,所述二值圖像細化模塊通 過使用hilditch細化算法對所述二值圖像進行細化。附記23.如附記13所述的二值圖像的識別裝置,進一步包括噪聲處理模塊,用于在確定表格線的垂直和水平框線的位置之前,通過連通域分 析移除二值圖像中的白噪聲和黑噪聲。附記24.如附記23所述的二值圖像的識別裝置,其中,所述噪聲處理模塊在連通 域的閾值小于5的情況下,移除該連通域。
權(quán)利要求
1.一種二值圖像的識別方法,在所述二值圖像中包括表格線和筆劃,所述方法包括 確定表格線的垂直和水平框線的位置;對所述表格線的垂直框線進行移除處理; 對移除表格線的垂直框線后的二值圖像進行細化; 在細化后的二值圖像上跟蹤所述表格線的水平框線的最短路徑; 判斷所跟蹤的路徑與筆劃的相交類型,基于預(yù)設(shè)的相交類型和相應(yīng)的相交部分是否是 筆劃部分的對應(yīng)關(guān)系來確定所述跟蹤路徑上與所述筆劃相交的部分是否是筆劃部分;以及 保留所述跟蹤路徑上的筆劃部分,以及移除所述跟蹤路徑上的非筆劃部分。
2.如權(quán)利要求1所述的二值圖像的識別方法,還包括將所保留的跟蹤路徑上的筆劃部分在垂直方向上的游程與所述筆劃的寬度進行比較, 并基于比較結(jié)果判斷是否需要對所述筆劃部分進行部分移除。
3.如權(quán)利要求2所述的二值圖像的識別方法,其中所述基于比較結(jié)果來判斷是否需要 對所述筆劃部分進行部分移除的步驟包括當所述筆劃部分在垂直方向上的游程小于或等于所述筆劃的寬度時,保留該游程內(nèi)的 所有點;當所述筆劃部分在垂直方向上的游程大于所述線寬但小于或等于所述寬度的預(yù)定倍 數(shù)時,刪除該游程內(nèi)的部分點;或者/以及當所述筆劃部分在垂直方向上的游程大于所述寬度的預(yù)定倍數(shù)時,保留該游程內(nèi)的所 有點。
4.如權(quán)利要求1所述的二值圖像的識別方法,其中,所述對所述表格線的垂直框線進 行移除處理的步驟包括計算所述垂直框線在水平方向上的游程; 估計所述垂直框線在水平方向的線寬;以及比較所述垂直框線在水平方向上的游程和所估計的線寬,以及根據(jù)比較結(jié)果來移除所 述垂直框線。
5.如權(quán)利要求4所述的二值圖像的識別方法,其中,根據(jù)比較結(jié)果來移除所述垂直框 線包括當所述垂直框線在水平方向上的游程小于或等于所述線寬時,刪除該游程內(nèi)的所有點 當所述垂直框線在水平方向上的游程大于所述線寬但小于或等于所述線寬的預(yù)定倍 數(shù)時,刪除該游程內(nèi)的部分點;或者當所述垂直框線在水平方向上的游程大于其線寬的預(yù)定倍數(shù)時,保留該游程內(nèi)的所有點ο
6.一種二值圖像的識別裝置,其中所述二值圖像包括表格線和筆劃,所述裝置包括 垂直和水平框線位置確定模塊,用于確定表格線的垂直和水平框線的位置;垂直框線處理模塊,用于對所述表格線的垂直框線進行移除處理; 二值圖像細化模塊,用于對移除表格線的垂直框線后的二值圖像進行細化; 路徑跟蹤模塊,用于在細化后的二值圖像上跟蹤所述表格線的水平框線的最短路徑; 筆劃部分確定模塊,用于判斷所跟蹤的路徑與筆劃的相交類型,以及基于預(yù)設(shè)的相交類型與相應(yīng)的相交部分是否是筆劃部分的對應(yīng)關(guān)系來確定所述跟蹤路徑上與所述筆劃相 交的部分是否是筆劃部分;以及跟蹤路徑處理模塊,用于保留所述跟蹤路徑上的筆劃部分,以及移除所述跟蹤路徑上 的非筆劃部分。
7.如權(quán)利要求6所述的二值圖像的識別裝置,還包括筆劃部分處理模塊,用于將所保留的跟蹤路徑上的筆劃部分在垂直方向上的游程與所 述筆劃的寬度進行比較,并基于比較結(jié)果判斷是否需要對所述筆劃部分進行部分移除。
8.如權(quán)利要求7所述的二值圖像的識別裝置,其中所述筆劃部分處理模塊通過以下規(guī) 則來判斷是否需要對所述筆劃部分進行部分移除當所述筆劃部分在垂直方向上的游程小于或等于所述筆劃寬度時或者當所述筆劃部 分在垂直方向上的游程大于所述筆劃寬度的預(yù)定倍數(shù)時,保留該游程內(nèi)的所有點;以及當所述筆劃部分在垂直方向上的游程大于所述線寬但小于或等于所述筆劃寬度的預(yù) 定倍數(shù)時,刪除該游程內(nèi)的部分點。
9.如權(quán)利要求6所述的二值圖像的識別裝置,其中,所述垂直框線處理模塊包括 游程計算模塊,用于計算所述垂直框線在水平方向上的游程;線寬估計模塊,用于估計所述垂直框線在水平方向的線寬;以及 垂直框線移除模塊,用于基于所述垂直框線在水平方向上的游程和所估計的線寬的比 較結(jié)果來移除所述垂直框線。
10.如權(quán)利要求9所述的二值圖像的識別裝置,其中,所述垂直框線移除模塊基于以下 規(guī)則來移除所述垂直框線當所述垂直框線在水平方向上的游程小于或等于所述線寬時,刪除該游程內(nèi)的所有占. 當所述垂直框線在水平方向上的游程大于所述線寬但小于或等于所述線寬的預(yù)定倍 數(shù)時,刪除該游程內(nèi)的部分點;以及當所述垂直框線在水平方向上的游程大于所述線寬的預(yù)定倍數(shù)時,保留該游程內(nèi)的所 有點。
全文摘要
提供了一種二值圖像的識別方法和裝置,其中,在所述二值圖像中包括表格線和筆劃,所述方法包括確定表格線的垂直和水平框線的位置;對所述表格線的垂直框線進行移除處理;對移除表格線的垂直框線后的二值圖像進行細化;在細化后的二值圖像上跟蹤所述表格線的水平框線的最短路徑;判斷所跟蹤的路徑與筆劃的相交類型,基于預(yù)設(shè)的相交類型和相應(yīng)的相交部分是否是筆劃部分的對應(yīng)關(guān)系來確定所述跟蹤路徑上與所述筆劃相交的部分是否是筆劃部分;以及保留所述跟蹤路徑上的筆劃部分,移除所述跟蹤路徑上的非筆劃部分。
文檔編號G06K9/68GK102129546SQ20101000443
公開日2011年7月20日 申請日期2010年1月15日 優(yōu)先權(quán)日2010年1月15日
發(fā)明者于浩, 堀田悅伸, 孫俊, 桂天宜, 直井聰, 鄭大念 申請人:富士通株式會社