專利名稱:字符識(shí)別裝置和字符識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及字符識(shí)別裝置和字符識(shí)別方法。
背景技術(shù):
在圖1中,利用OCR (光字符讀取器)等自動(dòng)識(shí)別手寫字母。 圖2A到圖2D示出了在自動(dòng)識(shí)別中如何使用候選字符點(diǎn)陣(lattice) 的示例。
在此情況下,包括如圖2A所示的彼此接觸的數(shù)字的手寫字符經(jīng)由圖 2B、圖2C和圖2D所示的各階段分開,從而進(jìn)行字符識(shí)別。
另一方面,當(dāng)自動(dòng)識(shí)別包括如圖3A到圖3D所示的示例中或圖4A 到4C所示的示例中的彼此接觸的數(shù)字的手寫字符時(shí),可能會(huì)出現(xiàn)錯(cuò)誤識(shí) 別的情況。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個(gè)方面, 一種字符識(shí)別裝置包括劃分機(jī)構(gòu),用于基 于從輸入字符串的帳票(slip)表面獲得的圖,將所述圖劃分為多個(gè)部分。 候選字符串獲取機(jī)制組合通過(guò)劃分機(jī)制劃分的圖的多個(gè)部分,從而獲得 圖中的字符串的多個(gè)候選字符串。字符串選擇機(jī)制從多個(gè)候選字符串中 選擇一個(gè)字符串。所述候選字符串獲取機(jī)制至少包括下述之一第一機(jī) 制,用于復(fù)制在相鄰字符之間接觸的字符線,然后將所復(fù)制的字符線包 括為候選字符串的元素;以及第二機(jī)制,用于在多個(gè)候選字符串中包括 己經(jīng)移除了相鄰字符之間的接觸字符線的候選字符串、和包含所述字符 線的候選字符串。
本發(fā)明實(shí)施方式的其他特征和優(yōu)點(diǎn)將通過(guò)詳細(xì)的說(shuō)明而變得顯而易 見(jiàn),因而意圖將它們包括在所附權(quán)利要求的范圍內(nèi)。此外,因?yàn)榛谶@
6里的說(shuō)明,各種修改和改變對(duì)于本領(lǐng)域技術(shù)人員將是顯而易見(jiàn)的,所以 不期望將本發(fā)明實(shí)施方式限制為所圖示和描述的精確構(gòu)造和操作,因而 包括所有適當(dāng)?shù)淖冃秃偷葍r(jià)物。
圖l是示出了手寫數(shù)字串的圖; 圖2A是候選字符點(diǎn)陣的圖; 圖2B是候選字符點(diǎn)陣的圖; 圖2C是候選字符點(diǎn)陣的圖; 圖2D是候選字符點(diǎn)陣的圖3A是用于彼此接觸的手寫數(shù)字的字符識(shí)別的圖(#1) 圖3B是用于彼此接觸的手寫數(shù)字的字符識(shí)別的圖(#1) 圖3C是用于彼此接觸的手寫數(shù)字的字符識(shí)別的圖(#1) 圖3D是用于彼此接觸的手寫數(shù)字的字符識(shí)別的圖(#1) 圖4A是用于彼此接觸的手寫數(shù)字的字符識(shí)別的圖(#2) 圖4B是用于彼此接觸的手寫數(shù)字的字符識(shí)別的圖(#2); 圖4C是用于彼此接觸的手寫數(shù)字的字符識(shí)別的圖(#2); 圖5A是實(shí)施方式的功能和優(yōu)點(diǎn)圖(#1); 圖5B是實(shí)施方式的功能和優(yōu)點(diǎn)圖(#1);
圖6是邊接觸候選處理的操作流程圖7A是實(shí)施方式的功能和優(yōu)點(diǎn)圖(#2); 圖7B是實(shí)施方式的功能和優(yōu)點(diǎn)圖(#2); 圖8是連線候選處理的操作流程圖; 圖9是字符識(shí)別裝置的配置的框圖10是圖9所示的圖形化單元的配置的框圖; 圖11是圖形化單元的處理流程圖; 圖12A是圖形化單元的處理的圖; 圖12B是圖形化單元的處理的圖; 圖12C是圖形化單元的處理的圖;圖12D是圖形化單元的處理的圖; 圖12E是圖形化單元的處理的圖; 圖12F是圖形化單元的處理的圖13A是用于頂點(diǎn)提取的掩碼(mask)圖案的圖13B是用于頂點(diǎn)提取的掩碼圖案的圖14A是用于頂點(diǎn)信息文件的示例的圖14B是用于邊信息文件的示例的圖15A是用于獲得邊接觸候選的字符線的處理的圖15B是用于獲得邊接觸候選的字符線的處理的圖16A是用于獲得連線候選的字符線的處理的圖16B是用于獲得連線候選的字符線的處理的圖17A是用于候選字符點(diǎn)陣的創(chuàng)建的圖17B是用于候選字符點(diǎn)陣的創(chuàng)建的圖17C是用于候選字符點(diǎn)陣的創(chuàng)建的圖17D是用于候選字符點(diǎn)陣的創(chuàng)建的圖17E是用于候選字符點(diǎn)陣的創(chuàng)建的圖17F是用于候選字符點(diǎn)陣的創(chuàng)建的圖18A是用于表示點(diǎn)陣的結(jié)構(gòu)的示例圖18B是用于表示邊的結(jié)構(gòu)的示例圖18C是用于表示頂點(diǎn)的結(jié)構(gòu)的示例圖19A是針對(duì)圖17A到17F的示例,最短路徑搜索結(jié)果的圖19B是針對(duì)圖17A到17F的示例,最短路徑搜索結(jié)果的圖;以及
圖20是計(jì)算機(jī)的硬件的框圖。
具體實(shí)施例方式
在實(shí)施方式中,考慮到字符識(shí)別中混淆的可能性,在候選字符點(diǎn)陣 中表示了如下面將解釋的用于移除如字符之間的連線的不必要的字符線 的處理、或也將在下面解釋的用于分離字符之間的邊接觸的處理。如眾 所周知的動(dòng)態(tài)編程的最短路徑搜索可系統(tǒng)地應(yīng)用到這樣的處理。換句話說(shuō),可考慮到要識(shí)別的整個(gè)字符串的一致性來(lái)確定最佳路徑。
這里,"路徑"意味著包括在候選字符點(diǎn)陣中的多個(gè)路徑,并且它意 味著分別對(duì)應(yīng)于多個(gè)候選字符串的多個(gè)路徑。
例如,根據(jù)各實(shí)施方式的具體過(guò)程可以被描述如下。 (i)當(dāng)要識(shí)別的字符串中彼此相鄰的兩個(gè)字符在邊接觸空間中彼此 接觸時(shí),獲取形成該接觸空間中的字符線的各字符線候選。此外,將字 符線的候選在候選字符點(diǎn)陣中登記兩次。
因此,在候選字符點(diǎn)陣中,可考慮三種可能性字符線的候選包含 在彼此相鄰的兩個(gè)字符的左邊字符中的情況、字符線的候選包含在彼此 相鄰的兩個(gè)字符的右邊字符中的情況、以及字符線的候選包含在兩個(gè)字 符中的情況。順帶提及,這里的"字符線"表示構(gòu)成要識(shí)別的字符串中 所包含的字符的線(如下面將解釋的,為了說(shuō)明方便,"連線"也被稱為 "字符線")。此外,通過(guò)應(yīng)用如動(dòng)態(tài)編程的最短搜索技術(shù),基于候選字 符點(diǎn)陣確定最可能路徑(即,多個(gè)候選字符串中的一個(gè)字符串)。結(jié)果, 可增加如此確定的字符串是要識(shí)別的字符串本身的概率,換句話說(shuō),增 加識(shí)別結(jié)果正確的可能性。
更具體地,即使在字符線在要識(shí)別的字符串中相鄰的兩個(gè)字符之間 彼此重疊從而兩個(gè)字符彼此接觸(換句話說(shuō),兩個(gè)字符處于邊接觸狀態(tài)) 的情況下,這兩個(gè)字符也可以被適當(dāng)?shù)胤珠_。
作為與字符線在要識(shí)別的字符串中相鄰的兩個(gè)字符之間彼此重疊從 而兩個(gè)字符彼此接觸的情況不同的情況,可能會(huì)存在下面的情況,即要 識(shí)別的字符串中的相鄰的兩個(gè)字符以這樣的狀態(tài)相互接觸兩個(gè)字符中 的一個(gè)字符包含的字符線在兩處接觸另一字符。
存在在外觀上難以區(qū)分前一情況和后一情況的趨勢(shì),但是通過(guò)上述 雙重登記方便了兩者之間的區(qū)分。
現(xiàn)在,將結(jié)合圖5A和5B以及圖6,通過(guò)陳述具體示例來(lái)描述雙重 登記(以下稱為"邊接觸候選處理")的處理。
圖5A的左側(cè)示出了在識(shí)別如圖5A的右側(cè)示出的手寫字符"03"的 情況下獲得的候選字符點(diǎn)陣的示例。首先,將通過(guò)例示所圖示的候選字符點(diǎn)陣來(lái)描述候選字符點(diǎn)陣的創(chuàng)建。
在候選字符點(diǎn)陣中,從最左端的黑點(diǎn)(以下,這樣的黑點(diǎn)被稱為"節(jié) 點(diǎn)",并且最左端的節(jié)點(diǎn)被稱為"起點(diǎn)")到最右端的節(jié)點(diǎn)(以下稱為"終
點(diǎn)")延伸的路徑對(duì)應(yīng)于上述路徑。在圖5A的示例中,如根據(jù)圖中的候
選字符點(diǎn)陣的配置可以理解的,存在以起點(diǎn)開始并導(dǎo)向終點(diǎn)的多個(gè)路徑。 這表示在候選字符點(diǎn)陣中包括多個(gè)路徑,換句話說(shuō),包括對(duì)應(yīng)于各個(gè)路 徑的多個(gè)字符串候選(即,候選字符串)。
這多個(gè)路徑中的每個(gè)路徑都包括作為其構(gòu)成元素的鏈路。在路徑不 包括任何節(jié)點(diǎn)的情況下,路徑本身是鏈路。在路徑包括節(jié)點(diǎn)的情況下, 由節(jié)點(diǎn)連接的路徑的構(gòu)成元素是鏈路。
以下,當(dāng)要指示構(gòu)成包括在這樣的候選字符點(diǎn)陣中的各個(gè)路徑的各 個(gè)鏈路時(shí),以附到相關(guān)鏈路的編號(hào)(以下將描述)指示。通過(guò)示例的方
式,在圖5A的候選字符點(diǎn)陣中,編號(hào)O (98)附到最上方的鏈路,因此 該鏈路被稱為"鏈路O (98)"。
這里,鏈路0 (98)是構(gòu)成對(duì)應(yīng)于手寫字符"03"被識(shí)別為其中兩 個(gè)字符"0"和"3"相接觸的一個(gè)字符的情況(即,錯(cuò)誤識(shí)別的情況) 下的候選字符串的路徑的鏈路。
下面將描述附到每個(gè)鏈路的編號(hào)。在編號(hào)中,第一位指示作為識(shí)別 結(jié)果的字符。后面的括號(hào)中的數(shù)值指示識(shí)別所需的代價(jià)(即,識(shí)別代價(jià)), 并且識(shí)別代價(jià)越低,識(shí)別結(jié)果越可能。在最上方的鏈路O (98)的示例中, 如上所述,兩個(gè)字母相接觸并且被識(shí)別為一個(gè)字符。識(shí)別結(jié)果是"0", 并且在此情況下的識(shí)別代價(jià)是"98"。
類似地,如圖5A所示,在最上方的鏈路0(98)緊下方的鏈路0(02) 和在鏈路O (02)的右側(cè)連接的中間的鏈路3 (05)構(gòu)成了另一路徑。該 路徑是對(duì)應(yīng)于手寫字符"03"具有分開的兩個(gè)字符"0"和"3"并且它 們被正確地識(shí)別為這兩個(gè)字符的情況下的候選字符串的路徑。如下面將 描述的,該路徑是手寫字符"03"被正確分開、并且路徑對(duì)應(yīng)于正確識(shí) 別出"03"的路徑。這里,它是彼此接觸的兩個(gè)字符的接觸空間中的字
10符線被正確地判斷為形成字符"0"的一部分的字符線的情況下的路徑。 在此情況下,"接觸的字符線"是構(gòu)成左邊字符"0"并且在右側(cè)垂直延 伸的部分的字符線。因此,基于該路徑的識(shí)別結(jié)果是"0"和"3",并且
識(shí)別代價(jià)是02+05=07。
類似地,中間的鏈路0 (31)和在鏈路0 (31)的右上側(cè)連接的鏈路 8 (97)構(gòu)成另一路徑。該路徑是其中手寫字符"03"被識(shí)別為兩個(gè)字符 的路徑。然而,在此情況下,與前面的情況不同,彼此接觸的兩個(gè)字符 的接觸空間中的字符線被判斷為是形成右邊字符"3"的一部分的字符線。 即,該路徑是其中如上所述原來(lái)為左邊字符"0"的在右側(cè)垂直延伸的部 分的字符線被錯(cuò)誤識(shí)別為構(gòu)成右邊字符的字符線的路徑?;谠撀窂降?識(shí)別結(jié)果是"0"和"8",并且識(shí)別代價(jià)是31+97=128。在此情況下,識(shí) 別代價(jià)顯然高于上面的正確情況下的識(shí)別代價(jià)07 (即,7),并且被指示 出概率較低。
類似地,下方的鏈路0 (02)和在鏈路0 (02)的右上側(cè)連接的鏈路 8 (97)構(gòu)成另一路徑。這是其中手寫字符"03"被識(shí)別為兩個(gè)字符的路 徑。然而,在此情況下,與前面的情況不同,彼此接觸的兩個(gè)字符的接 觸空間中的字符線被判斷為形成字符"0"和"3"兩者的一部分的字符 線。即,這是其中如上所述左邊字符"0"的原本在右側(cè)垂直延伸的部分 的字符線被識(shí)別為即屬于右邊字符又屬于左邊字符的路徑。因此,該路 徑對(duì)應(yīng)于錯(cuò)誤的識(shí)別?;谠撀窂降淖R(shí)別結(jié)果是"0"和"8",并且識(shí)別 代價(jià)是02+97=99。同樣,在此情況下,識(shí)別代價(jià)顯然高于上面的正確情 況下的識(shí)別代價(jià)7,并且被指示出概率較低。
以此方式,在使用候選字符點(diǎn)陣的字符識(shí)別中,根據(jù)形成手寫字符 的圖的配置獲取讀取的手寫字符的多個(gè)候選字符串。此外,候選字符串 分別與構(gòu)成候選字符點(diǎn)陣的路徑關(guān)聯(lián)。此后,利用識(shí)別代價(jià)來(lái)評(píng)估各個(gè) 路徑的概率(即,對(duì)應(yīng)候選字符串的概率)。如將在下面看到的,通過(guò)為 各路徑的各個(gè)鏈路加權(quán)來(lái)進(jìn)行評(píng)估。基于評(píng)估的結(jié)果選擇一條路徑(即, 一個(gè)候選字符串)。這里,為選擇路徑,可利用最短路徑搜索技術(shù)。獲得 選擇的候選字符串,作為讀取的手寫字符的識(shí)別結(jié)果。根據(jù)本實(shí)施方式的方法,如上所述,即使在如圖5A的示例那樣的兩 個(gè)字符線接觸的情況下,在候選字符點(diǎn)陣中也能夠包括按實(shí)際字符的可
能性假定的所有情況的路徑。即,在圖5A的示例的情況下,候選字符點(diǎn)
陣中包括對(duì)應(yīng)于其中兩個(gè)字符的相互接觸的字符線屬于任一字符的各個(gè)
情況的路徑(即,鏈路O (02)和3 (05)組成的路徑以及鏈路O (31) 和8 (97)組成的路徑)。此外,還包括對(duì)應(yīng)于其中該字符線屬于兩個(gè)字 符的情況的路徑(即,鏈路0 (02)和8 (97)組成的路徑)。結(jié)果,正 確路徑可靠地包括在候選字符點(diǎn)陣中,使得可以有效增強(qiáng)字符識(shí)別的精 度。
以此方式,利用本實(shí)施方式的方法,如果兩個(gè)字符相接觸,則對(duì)應(yīng) 于按照實(shí)際字符的可能性假定的所有情況(即,下面的三類情況)的路
徑可包括在候選字符點(diǎn)陣中(1)兩個(gè)字符的相互接觸的字符線屬于左
側(cè)的字符的情況,(2)所述字符線屬于右側(cè)的字符的情況,以及(3)所 述字符線屬于兩個(gè)字符的情況(換句話說(shuō),邊接觸的情況)。下面將描述 為什么分別對(duì)應(yīng)于總共三種情況的路徑可以以此方式包括在候選字符點(diǎn) 陣中的原因。
在圖5A的示例中,串聯(lián)連接的兩個(gè)鏈路l (09)包括在候選字符點(diǎn) 陣中,作為對(duì)應(yīng)于兩個(gè)字符的相互接觸空間中的字符線的鏈路。結(jié)果, 在兩個(gè)字符接觸的情況下,可以包括對(duì)應(yīng)于實(shí)際字符的三種可能性的各 個(gè)情況的路徑。
更具體地,在圖5A的候選字符點(diǎn)陣中,總共獲得三個(gè)節(jié)點(diǎn)串聯(lián)連 接的兩個(gè)鏈路1 (09)的兩端的節(jié)點(diǎn)以及對(duì)應(yīng)于相互接觸兩個(gè)字符的字符 線的相互連接的節(jié)點(diǎn)。此外,穿過(guò)三個(gè)節(jié)點(diǎn)的左邊一個(gè)的路徑對(duì)應(yīng)于上 面的情況(2),即,兩個(gè)字符的相互接觸的字符線屬于右邊字符的情況。 類似地,穿過(guò)三個(gè)節(jié)點(diǎn)的中間一個(gè)的路徑對(duì)應(yīng)于上面的情況(3),艮卩, 兩個(gè)字符的相互接觸的字符線屬于兩個(gè)字符的情況。同樣,穿過(guò)三個(gè)節(jié) 點(diǎn)的右邊一個(gè)的路徑對(duì)應(yīng)于上面的情況(1),即,兩個(gè)字符的相互接觸 的字符線屬于左邊字符的情況(即,正確路徑)。
圖5B示出了手寫字符串的另一示例。與圖5A的示例中的情況一樣,
12串聯(lián)連接的兩個(gè)鏈路1(08)包括在候選字符點(diǎn)陣中,作為對(duì)應(yīng)于相互接觸 兩個(gè)字符的字符線的鏈路。結(jié)果,與圖5A的示例中的情況一樣,可以在 候選字符點(diǎn)陣中包括對(duì)應(yīng)于按照實(shí)際字符的可能性假定的三種情況中的 各個(gè)情況的路徑。
圖6示出了在上述實(shí)施方式的方法中的邊接觸候選處理的處理流程。
參照?qǐng)D6,在步驟S1 (圖案分割),處理基于從讀取的字符圖像獲得 的圖,將該圖劃分為多個(gè)部分。在圖5A的示例的情況下,處理將讀取的 手寫字符"03"的圖劃分為多個(gè)部分,例如構(gòu)成圖5A中的候選字符串點(diǎn) 陣的、附到各個(gè)鏈路O (02)、 3 (05)、 0 (31)、 8 (97)和1 (09)的字 符線。
順帶提及,通過(guò)掃描和拍照例如輸入有字符串的紙帳票獲得所述圖。
隨后,在步驟S2 (邊接觸候選判定),該處理判定是否可以如上所 述假設(shè)兩個(gè)字符的接觸空間中的字符線屬于兩個(gè)字符。將結(jié)合圖15A和 15B在后面描述在此情況下的判斷方法。
作為判斷的結(jié)果(步驟S3),如果可以假設(shè)接觸空間中的字符線屬 于兩個(gè)字符,則在此情況下,處理進(jìn)行到步驟S4,而當(dāng)為否時(shí),處理跳 過(guò)步驟S4直接進(jìn)行到步驟S5。
在步驟S4,接觸空間中的字符線被登記兩次。更具體地,在圖5A 的示例中,對(duì)應(yīng)于接觸空間中的字符線的兩個(gè)鏈路1 (09)串聯(lián)連接,并 且包括在候選字符點(diǎn)陣中。
在步驟S5,針對(duì)由此產(chǎn)生的候選字符點(diǎn)陣,為候選字符點(diǎn)陣中包括 的各個(gè)鏈路獲得對(duì)應(yīng)的字符識(shí)別結(jié)果。在圖5A的示例中,在附到各鏈路 的編號(hào)中,編號(hào)的第一位是字符識(shí)別結(jié)果。
隨后,在步驟S6,處理針對(duì)各個(gè)鏈路計(jì)算進(jìn)行字符識(shí)別所需的識(shí)別 代價(jià)。
最后,在步驟S7,處理通過(guò)最短路徑搜索等技術(shù),基于如步驟S6 計(jì)算出的各個(gè)鏈路的識(shí)別代價(jià),確定候選字符點(diǎn)陣中包括的路徑中的最 可能的路徑,并且獲得對(duì)應(yīng)的候選字符串作為字符識(shí)別結(jié)果。(ii)此外,在該實(shí)施方式中,還可共同執(zhí)行連線候選處理。以下將 描述連線候選處理。
當(dāng)在要識(shí)別的字符串中彼此相鄰的兩個(gè)字符通過(guò)連線接觸時(shí)(以下 將描述),獲取形成該接觸的字符線的候選。此外,將繞過(guò)與字符線的候 選對(duì)應(yīng)的鏈路的鏈路添加到候選字符點(diǎn)陣中。此外,空白圖像(以下也
稱為"空?qǐng)D像")與添加的鏈路關(guān)聯(lián)???qǐng)D像的識(shí)別字符種類是(j)(NULL),
并且識(shí)別代價(jià)d可以根據(jù)經(jīng)驗(yàn)適當(dāng)?shù)卮_定。結(jié)果,在使用基于動(dòng)態(tài)編程 等的最短路徑搜索的候選字符點(diǎn)陣的技術(shù)框架內(nèi),能夠?qū)崿F(xiàn)連線的移除。 此外,在對(duì)于構(gòu)成要識(shí)別的字符串中的任何其他字符線同樣的處理框架 內(nèi),可能進(jìn)行有關(guān)于對(duì)應(yīng)的字符線是連線還是難以與連線區(qū)分的橫向字 符線(以下將描述)的判斷。
將結(jié)合圖4A到4C描述連線和橫向字符線。
圖4A示出了兩個(gè)數(shù)字構(gòu)成的手寫字符字符串"00"。如圖所示,在 手寫字符中,在兩個(gè)字符"00"之間的空間的上部存在水平延伸而使兩 個(gè)字符接觸的字符線。該字符線是連線。即,該字符線不形成字符"00" 的一部分,而是書寫工具在手寫的過(guò)程中在紙面上滑過(guò)而畫出的線。因 此,應(yīng)當(dāng)在字符識(shí)別中移除連線。順帶提及,連線不構(gòu)成如上所述的任 何字符,但是出于描述方便,它被描述為字符線。
圖4B示出了兩個(gè)數(shù)字構(gòu)成的手寫字符字符串"50"。如圖所示,在 手寫字符中,形成字符"50"中的數(shù)字"5"的最上部并且水平延伸的字 符線的右端與下一數(shù)字"0"的上端接觸。該字符線是橫向字符線。橫向 字符線出于以下原因與下一數(shù)字"0"接觸當(dāng)在手寫過(guò)程中從第一個(gè)數(shù) 字"5"書寫移動(dòng)到下一數(shù)字"0"時(shí),書寫工具未從紙面上抬起。與連 線不同,橫向字符線是形成第一字符"5"的一部分的字符線,因此,在 字符識(shí)別中應(yīng)當(dāng)考慮它。然而,因?yàn)槿缟纤鲈谄渫獠啃螤钌想y以將橫 向字符線與連線區(qū)分,所以可能會(huì)出現(xiàn)橫向字符線被錯(cuò)誤地移除以導(dǎo)致 錯(cuò)誤識(shí)別的情況。
圖7A和圖7B示出了在連線候選處理中與空?qǐng)D像關(guān)聯(lián)的鏈路被添加 到連線候選的字符線中的情況下的候選字符點(diǎn)陣的示例。圖7A的左側(cè)例示了針對(duì)圖4B的示例中的手寫字符串"50"獲得的 候選字符點(diǎn)陣。在該候選字符點(diǎn)陣中,中間的中間部分的鏈路3 (99)是 對(duì)應(yīng)于水平延伸并且是連線候選的鏈路。如圖所示,提供對(duì)應(yīng)于空?qǐng)D像 的鏈路(Kd)以便繞過(guò)鏈路3 (99)。這里,空?qǐng)D像是如上所述的空白圖像。 結(jié)果,在具有對(duì)應(yīng)于空?qǐng)D像的鏈路(Kd)的路徑中,該鏈路僅是繞道鏈路 (detouringlink)。候選字符點(diǎn)陣包括如下兩條路徑具有連線的候選(鏈 路3 (99))的路徑、和具有繞過(guò)鏈路3 (99)的空?qǐng)D像的鏈路(j)(d)的路徑。 結(jié)果,通過(guò)不加區(qū)別地將它們并入基于動(dòng)態(tài)編程的最短路徑搜索技術(shù)中, 可以處理連線的候選是連線(即,圖4A的示例的情況)和其是橫向字符 線(即,圖4B的示例的情況)這兩種情況。因此,正確評(píng)估兩種情況, 可以有效降低錯(cuò)誤識(shí)別的可能性。
如上所述,在圖7A的示例的情況下,鏈路3 (99)所對(duì)應(yīng)的連線的 候選實(shí)際是作為數(shù)字"5"的構(gòu)成元素的字符線,并且它是橫向字符線。 根據(jù)候選字符點(diǎn)陣,如上所述不加區(qū)別地評(píng)估連線的候選是連線的情況 和連線的候選是橫向字符線的情況。結(jié)果,如果具有作為連線的候選的 鏈路3 (99)的路徑比具有空?qǐng)D像的鏈路(()(d)的路徑的總識(shí)別代價(jià)小, 則選擇具有作為連線的候選的鏈路3 (99)的路徑的可能性將增大。艮P, 字符串將被正確地識(shí)別為如圖7A的右側(cè)所示的"50"的可能性增加。此 外,如上所述,根據(jù)經(jīng)驗(yàn)等獲得空?qǐng)D像的識(shí)別代價(jià)d,使得可獲得這樣的 結(jié)果。
圖7B的左側(cè)示出了針對(duì)要識(shí)別的字符串是類似于圖4B所示的"00" 的示例獲得的候選字符點(diǎn)陣的示例。在圖7B的示例的情況下,如上所述, 鏈路3 (99)所對(duì)應(yīng)的連線的候選是作為使構(gòu)成字符串的兩個(gè)數(shù)字"00" 彼此接觸的連線的字符線。根據(jù)候選字符點(diǎn)陣,如上所述,對(duì)連線的候 選實(shí)際是連線的情況和連線的候選是橫向字符線的情況進(jìn)行評(píng)估。結(jié)果, 如果具有空?qǐng)D像的鏈路(Kd)的路徑比具有連線的候選的鏈路3 (99)的
路徑的總識(shí)別代價(jià)小,則選擇具有空?qǐng)D像的鏈路(Kd)的路徑的可能性更 高。在此路徑中,通過(guò)空?qǐng)D像的鏈路(])(d)繞過(guò)作為連線的候選的鏈路3 (99),使得移除了作為連線的候選的字符線。因此,當(dāng)選擇了該路徑時(shí),字符串將被正確地識(shí)別為如圖7B的右側(cè)所示的"00"的可能性增加。此 外,如上所述根據(jù)經(jīng)驗(yàn)等獲得空?qǐng)D像的識(shí)別代價(jià)d,使得可獲得這樣的結(jié) 果。
圖8中示出了在該實(shí)施方式中的連線候選處理的處理流程。
參照?qǐng)D8,步驟Sll到S17分別對(duì)應(yīng)于圖6的上述流程圖中的步驟 S1到S7。其中,除了步驟S12到S14與步驟S2到步驟S4不同外,步驟 S11和S15到S17分別與圖6的步驟S1和S5到S7相同。因此,將僅描 述不同的步驟S12到S14,而省略對(duì)其他步驟的重復(fù)描述。
在步驟S12 (連線候選判定),處理判斷是否可如上所述地假設(shè)接觸 兩個(gè)字符的字符線是連線的情況。將在后面結(jié)合圖16A和16B描述該情 況下的判斷方法。
作為判斷的結(jié)果(步驟S13),當(dāng)接觸兩個(gè)字符的字符線是連線時(shí), 處理進(jìn)行到步驟S14,而當(dāng)不是連線時(shí),處理通過(guò)跳過(guò)步驟S14直接進(jìn)行 到步驟S15。
在步驟S14,處理產(chǎn)生與空?qǐng)D像關(guān)聯(lián)的鏈路(即,上述鏈路())(d)), 所述鏈路繞過(guò)在要識(shí)別的字符串中的彼此接觸并且相鄰的兩個(gè)字符的接 觸的字符線(即,連線的候選字符串)。更具體地,在圖7A的示例中, 處理提供與空?qǐng)D像關(guān)聯(lián)的鏈路,作為與鏈路3 (99)并聯(lián)連接的鏈路,所 述鏈路3 (99)對(duì)應(yīng)于與彼此接觸的兩個(gè)字符接觸的字符線,并且在候選 字符點(diǎn)陣中包括空?qǐng)D像的鏈路。
順帶提及,可使用具有如圖20所述的配置的計(jì)算機(jī)實(shí)現(xiàn)結(jié)合圖6和 圖8如上所述的各個(gè)處理。更具體地,如隨后將看到的,制備了用于使 得計(jì)算機(jī)的CPU執(zhí)行各處理的程序,并且用于讀取字符圖像的掃描儀(未 示出)連接到該計(jì)算機(jī)。此外,CPU基于由掃描儀讀取的字符圖像,相 繼執(zhí)行在程序中描述的指令,從而執(zhí)行圖6或圖8的處理。這里,可利 用公知的OCR技術(shù)作為用于基于用掃描儀讀取的字符圖像獲得圖的處 理。
根據(jù)該實(shí)施方式,字符識(shí)別裝置中包括候選字符點(diǎn)陣產(chǎn)生單元,該 字符識(shí)別裝置識(shí)別由光學(xué)圖像輸入裝置根據(jù)帳票圖像等自由輸入的圖像
16數(shù)據(jù)(特別是在沒(méi)有字符框的區(qū)域中的圖像數(shù)據(jù))的字符。在候選點(diǎn)陣
產(chǎn)生單元中,如上面結(jié)合圖5A和5B以及圖6描述的,首先識(shí)別字符線 或其部分是否重疊(即,邊接觸的字符線或其部分),以形成邊接觸候選。 此外,被判斷為形成邊接觸候選的字符線或其部分的圖案(即,圖)在 點(diǎn)陣中登記兩次。此外,通過(guò)字符識(shí)別,點(diǎn)陣的各節(jié)點(diǎn)之間的鏈路根據(jù) 識(shí)別代價(jià)(分?jǐn)?shù))給出權(quán)重。隨后,通過(guò)基于權(quán)重的動(dòng)態(tài)編程獲得距離 最短的路徑(在根據(jù)分?jǐn)?shù)的情況下,為距離最長(zhǎng)的路徑)。結(jié)果,使用動(dòng) 態(tài)編程,在候選字符點(diǎn)陣的技術(shù)框架內(nèi),可考慮整體一致性地分開相鄰 字符之間的邊接觸。
此外,根據(jù)本實(shí)施方式,字符識(shí)別裝置中包括候選字符點(diǎn)陣產(chǎn)生單 元,該字符識(shí)別裝置識(shí)別由光學(xué)圖像輸入裝置根據(jù)帳票圖像等自由輸入 的圖像數(shù)據(jù)(特別是在沒(méi)有字符框的區(qū)域中的圖像數(shù)據(jù))的字符。在候 選字符點(diǎn)陣產(chǎn)生單元中,如上面結(jié)合圖7A和7B以及圖8所述的,首先 識(shí)別可能是連線的字符線候選是否是連線的候選,并且對(duì)應(yīng)于發(fā)現(xiàn)是連 線候選的字符線的圖案(即,圖)被登記為點(diǎn)陣的節(jié)點(diǎn)之間的鏈路。在 此情況下,在節(jié)點(diǎn)之間設(shè)置繞過(guò)上述鏈路的鏈路,并且在設(shè)置的鏈路中 登記空?qǐng)D像。結(jié)果,可以使用動(dòng)態(tài)編程,在候選字符點(diǎn)陣的技術(shù)框架內(nèi), 考慮整體一致性地移除字符識(shí)別不需要的連線。
作為這一實(shí)施方式中可執(zhí)行的處理,己經(jīng)結(jié)合圖5A和5B以及圖6
描述了邊接觸候選的字符線被登記兩次并且包括在候選字符點(diǎn)陣中的處
理(該處理被稱為"第一單元的處理")。此外,己經(jīng)結(jié)合圖7A和7B以
及圖8描述了繞過(guò)連線的候選的鏈路被登記并且被包括在候選字符點(diǎn)陣
中的處理(該處理被稱為"第二單元的處理")。在該實(shí)施方式中,可僅
執(zhí)行第一單元的處理或第二單元的處理。此外,在該實(shí)施方式中,也可 執(zhí)行第一單元的處理和第二單元的處理兩者。
此外,在第二單元的處理中,可根據(jù)經(jīng)驗(yàn)適當(dāng)?shù)卦O(shè)置對(duì)應(yīng)于各節(jié)點(diǎn) 之間的空?qǐng)D像的權(quán)重,提供所述空?qǐng)D像以繞過(guò)節(jié)點(diǎn)之間的在候選字符點(diǎn) 陣中為其適當(dāng)?shù)怯浟诉B線的候選的鏈路。
現(xiàn)在,將更詳細(xì)地描述該實(shí)施方式的配置。圖9示出了根據(jù)該實(shí)施方式的字符識(shí)別裝置的總體配置。
字符識(shí)別裝置io通過(guò)掃描儀接受紙帳票等的圖像,并將圖像轉(zhuǎn)為電
子數(shù)據(jù),并且將電子數(shù)據(jù)轉(zhuǎn)換為黑白二進(jìn)制圖像。此外,裝置io對(duì)字符 串進(jìn)行分段,并且判定接觸圖案(接觸圖案指示字符串中包含的字符線 之間的接觸狀態(tài))。這些處理可通過(guò)利用現(xiàn)有技術(shù)體現(xiàn)。
在該實(shí)施方式中,在已經(jīng)獲得接觸圖案的情況下,執(zhí)行一個(gè)接一個(gè) 地分出字符并識(shí)別出它們的處理。
字符識(shí)別裝置10廣義上包括候選字符點(diǎn)陣產(chǎn)生單元16和最短路徑
搜索單元17。進(jìn)一步,候選字符點(diǎn)陣產(chǎn)生單元16包括線細(xì)化單元11、 圖形化單元12、點(diǎn)接觸/連線候選判定單元13、邊接觸候選判定單元14、 以及候選字符點(diǎn)陣創(chuàng)建單元15。
線細(xì)化單元ll通過(guò)現(xiàn)有技術(shù)將輸入的二進(jìn)制接觸圖案轉(zhuǎn)換為其線寬 為l (像素)的線細(xì)化圖案。如將在下面詳細(xì)描述的,圖形化單元12從 線細(xì)化圖案中提取頂點(diǎn)和邊,并且獲得頂點(diǎn)和邊的相鄰和連接關(guān)系,從 而將線細(xì)化圖案(即,圖)表達(dá)為曲線圖。
點(diǎn)接觸/連線候選判定單元13和邊接觸候選判定單元14從曲線圖的 各個(gè)邊中識(shí)別點(diǎn)接觸的候選的邊、連線的候選的邊、以及邊接觸的候選 的邊。候選字符點(diǎn)陣創(chuàng)建單元15將曲線圖劃分為邊的部分集合,并且根 據(jù)各個(gè)部分集合的規(guī)則在候選字符點(diǎn)陣中登記它們。此外,候選字符點(diǎn) 陣創(chuàng)建單元15通過(guò)鏈路連接能夠產(chǎn)生識(shí)別字符候選的圖案的節(jié)點(diǎn),并且 它根據(jù)設(shè)置在節(jié)點(diǎn)之間的邊的部分集合產(chǎn)生識(shí)別字符候選的圖案。
此外,候選字符點(diǎn)陣創(chuàng)建單元15對(duì)利用現(xiàn)有技術(shù)如此產(chǎn)生的識(shí)別字 符候選的圖案實(shí)際執(zhí)行字符識(shí)別。此外,候選字符點(diǎn)陣創(chuàng)建單元15根據(jù) 字符識(shí)別結(jié)果的差異度確定鏈路的權(quán)重。對(duì)于以如上方式產(chǎn)生的候選字 符點(diǎn)陣,最短路徑搜索單元17通過(guò)如動(dòng)態(tài)編程或Dijkstra方法的公知方 法獲得最短路徑,從而獲得最終字符識(shí)別結(jié)果。
接下來(lái),將詳細(xì)描述圖形化單元12的處理。
圖形化單元12通過(guò)使用現(xiàn)有技術(shù),將線細(xì)化單元11得到的、讀取 的圖像己經(jīng)經(jīng)受了線細(xì)化的線細(xì)化圖案(即,圖)表達(dá)為曲線圖。圖IO示出了圖形化單元12的內(nèi)部配置。圖11示出了基于圖形化單 元12的處理的流程圖。
如圖IO所示,圖形化單元12包括頂點(diǎn)提取單元22、邊提取單元23、 二度頂點(diǎn)添加單元24、以及頂點(diǎn)相鄰矩陣計(jì)算單元25。
如上所述,由掃描儀等讀取的要識(shí)別的字符串的圖像(即,讀取的 圖像)的圖案經(jīng)受線細(xì)化單元11的線細(xì)化,從而獲得線細(xì)化圖案(圖11 中的步驟S31)。頂點(diǎn)提取單元22檢查線細(xì)化圖案的各像素的8個(gè)附近區(qū) 域,并且它檢查這8個(gè)附近區(qū)域是否與事先為各度數(shù)的頂點(diǎn)的提取準(zhǔn)備 的(3X3)大小的掩碼圖案一致(參照?qǐng)D13A和13B)(步驟S32)。在8 個(gè)附近區(qū)域與掩碼圖案一致的情況下,相關(guān)像素被存儲(chǔ)為由該掩碼圖案 所指示的度數(shù)的頂點(diǎn)(步驟S33)。這里,"頂點(diǎn)的度數(shù)"表示連接到頂點(diǎn) 的邊的數(shù)量。由此提取的頂點(diǎn)的位置坐標(biāo)保留在頂點(diǎn)信息文件中。
邊提取單元23為各個(gè)頂點(diǎn)準(zhǔn)備計(jì)數(shù)器,并且用零初始化計(jì)數(shù)器。首 先,選擇計(jì)數(shù)器的值小于邊的度數(shù)的一個(gè)期望的頂點(diǎn),并且相關(guān)頂點(diǎn)的 計(jì)數(shù)器遞增1 (步驟S34)。相關(guān)頂點(diǎn)被設(shè)置為起始頂點(diǎn),并且從起始頂 點(diǎn)開始追蹤線細(xì)化圖案上的黑色像素,直到到達(dá)另一頂點(diǎn)(步驟S35)。 另一頂點(diǎn)被稱為"結(jié)束頂點(diǎn)"。結(jié)束頂點(diǎn)的計(jì)數(shù)器遞增l (步驟S36)。
追蹤的黑色像素的坐標(biāo)、起始頂點(diǎn)的編號(hào)和結(jié)束頂點(diǎn)的編號(hào)被保留 為邊信息(步驟S37)。繼續(xù)這樣的邊提取,直到所有頂點(diǎn)的計(jì)數(shù)器變?yōu)?等于其度數(shù)(步驟S38的"是")。
以如下方式獲得邊在線細(xì)化圖案上,以某個(gè)頂點(diǎn)開始追蹤黑色像 素,直到到達(dá)另一頂點(diǎn)。邊的編號(hào)、頂點(diǎn)之間的黑色像素的位置坐標(biāo)的 軌跡、以及連接到邊的頂點(diǎn)的編號(hào)保留在邊信息文件中。
此外,二度頂點(diǎn)添加單元24檢查所有頂點(diǎn)對(duì),并且在連接在兩個(gè)頂 點(diǎn)之間的邊的數(shù)量是至少兩個(gè)時(shí)(步驟S39的"是"),向最短邊以外的 任何邊添加二度頂點(diǎn)(步驟S40)。結(jié)果,重新產(chǎn)生邊,因此,重寫頂點(diǎn) 信息文件和邊信息文件(步驟S41)。
頂點(diǎn)相鄰矩陣計(jì)算單元25根據(jù)由此獲得的邊信息計(jì)算頂點(diǎn)相鄰矩 陣。這里,"頂點(diǎn)相鄰矩陣"是在頂點(diǎn)由邊連接的情況下其元素具有值"1 "、
19而在頂點(diǎn)沒(méi)有被邊連接的情況下其元素具有值"0"的矩陣。
圖12A到12F概念地示出了圖9所示的線細(xì)化單元11和圖IO所示 的圖形化單元12的構(gòu)成單元22到25輸出的數(shù)據(jù)。
圖12A示出了掃描儀讀取的讀取圖像的示例。圖12B示出了經(jīng)過(guò)了 線細(xì)化單元ll的線細(xì)化的線細(xì)化圖案(即,圖)的示例。圖12C示出了 頂點(diǎn)提取單元22提取了頂點(diǎn)vl和v2的情況。圖12D示出了邊提取單元 23提取了邊el、 e2和e3的情況。圖12E示出了二度頂點(diǎn)添加單元24添 加了二度頂點(diǎn)e4和e5和相伴的二度頂點(diǎn)v3和v4的情況。圖12F示出 了頂點(diǎn)相鄰矩陣計(jì)算單元25獲得的頂點(diǎn)相鄰矩陣的示例。
圖13A和圖13B例示了在上述掩碼圖案中的用于提取度數(shù)"1"和 "3"的頂點(diǎn)的一些掩碼圖案。在圖中,"1"表達(dá)黑色像素,而"0"表 達(dá)白色像素。
圖13A示出了用于提取度數(shù)"1"的頂點(diǎn)的掩碼圖案。圖13B示出 了用于提取度數(shù)"3"的掩碼圖案的示例。
圖14A和14B分別示出了最終得到的頂點(diǎn)信息文件和邊信息文件的 示例。圖14A例示了頂點(diǎn)信息文件,而圖14B例示了邊信息文件。
接下來(lái),將參照?qǐng)D15A和15B詳細(xì)描述圖9所示的邊接觸候選判定 單元14的邊接觸候選判斷處理。圖15A示出了與上面參照的圖12A、12B 和12C類似的圖。
如下所述地確定接觸圖案中相鄰字符的字符線的邊接觸的候選。 (i)檢查所有曲線圖的邊,并且移除不滿足特定條件的邊,從而縮 窄候選者。如果邊接觸,則對(duì)應(yīng)曲線圖的邊滿足如下示例性的條件,因 此,從邊接觸的候選中移除其他邊。(條件#1)連接到相關(guān)邊的各個(gè)頂點(diǎn) 的度數(shù)至少是"3"(字母T或十字)。(條件#2)相關(guān)邊的梯度至少是閾 值(垂直或傾斜),例如,高寬比至少是1。即,相關(guān)邊基本與相關(guān)字符 串的延伸方向垂直。
在圖15A的示例中,僅邊61滿足條件#1和#2。因此,獲取邊el作 為邊接觸的候選。更具體地,邊el具有頂點(diǎn)vl和v2,并且因?yàn)轫旤c(diǎn)vl 和v2每個(gè)都具有T形接觸,所以其度數(shù)為"3",從而滿足條件#1。此外,因?yàn)檫卐l基本垂直延伸,所以高寬比至少為l,從而也滿足條件#2。其 他邊e2到e5不滿足這些條件。作為示例,在圖15A中,邊e2不滿足條 件#1,這是因?yàn)槠漤旤c(diǎn)v3的度數(shù)是"2"。
(ii)此外,對(duì)于曲線圖的邊,利用頂點(diǎn)相鄰矩陣復(fù)制邊接觸候選的 邊和與其連接的頂點(diǎn),并且適當(dāng)劃分相鄰邊,從而判斷曲線圖是否被劃 分為兩個(gè)。
圖15B示出了其中己經(jīng)復(fù)制了邊接觸候選的邊el和與其連接的頂點(diǎn) vl和v2的情況。如下所述地具體執(zhí)行這樣的邊和頂點(diǎn)的復(fù)制。
在圖15B的示例中,如圖中間所示,新的行l(wèi)'和2'以及新的列l(wèi)'和 2'分別插入到曲線圖的頂點(diǎn)相鄰矩陣中的行1和2以及列1和2旁邊,所 述行1和2以及列1和2對(duì)應(yīng)于與要復(fù)制的邊el連接的頂點(diǎn)vl和v2。
隨后,連接到由此復(fù)制的頂點(diǎn)vl'和v2'的復(fù)制邊以外的邊的其他頂 點(diǎn)的x坐標(biāo)(即,沿字符串的延伸方向的坐標(biāo)軸上的坐標(biāo))彼此比較, 并且確定各邊以便連接到任一復(fù)制的頂點(diǎn)。在圖15B的示例中,邊e2和 e3連接到與邊el連接的頂點(diǎn)vl。在此情況下,設(shè)"x3"和"x4"分別 表示邊e2和e3的其他頂點(diǎn)v3和v4的x坐標(biāo),并且設(shè)"xl"表示頂點(diǎn) vl的x坐標(biāo),x3<xl成立,從而邊e2切斷其與頂點(diǎn)vl'的連接以使得僅 與左邊的復(fù)制邊el相鄰,并且x4〉xl成立,從而邊e3切斷其與頂點(diǎn)vl 的連接以使得僅與右邊的復(fù)制邊er連接。即,在頂點(diǎn)相鄰矩陣中,頂點(diǎn) v4和vl'之間的矩陣元素被設(shè)置為"1",頂點(diǎn)v4和vl之間的矩陣元素被 設(shè)置為"0",頂點(diǎn)v3和vl之間的矩陣元素被設(shè)置為"1",并且頂點(diǎn)v3 和W'之間的矩陣元素被設(shè)置為"0"。要處理的邊el以外的邊、以及與 邊el連接的頂點(diǎn)vl和v2以外的頂點(diǎn)之間的相鄰關(guān)系保持原樣。在由此 通過(guò)復(fù)制要處理的邊el產(chǎn)生新的邊el'的情況下的新頂點(diǎn)相鄰矩陣的示 例如圖15B中間所示。
隨后,判定在適當(dāng)替代由此獲得的頂點(diǎn)相鄰矩陣的各行和各列的情 況下,矩陣是否變成的塊對(duì)角線形式。圖15B的右側(cè)示出了已經(jīng)適當(dāng)替 換了頂點(diǎn)相鄰矩陣的各行和各列的情況,其結(jié)果是矩陣已經(jīng)變成塊對(duì)角 線形式。在頂點(diǎn)相鄰矩陣已經(jīng)以此方式變成塊對(duì)角線形式的情況下,認(rèn)為通過(guò)邊的復(fù)制將曲線圖分為兩個(gè)子曲線圖gl和g2。對(duì)應(yīng)于各個(gè)塊的頂 點(diǎn)與各個(gè)部分曲線圖具有的頂點(diǎn)相對(duì)應(yīng)。
以這種方式,如圖15B的左側(cè)所示,圖15A的中間所示的曲線圖被 分為兩個(gè)子曲線圖gl和g2。此外,復(fù)制邊接觸候選的邊el,并且將其 登記和包括為分別屬于兩個(gè)子曲線圖gl和g2的字符線。換句話說(shuō),邊 接觸候選的邊el登記兩次(對(duì)應(yīng)于圖6中的步驟S4)。
接下來(lái),將結(jié)合圖16A和16B詳細(xì)描述圖9中示出的點(diǎn)接觸/連線候 選判定單元13的處理。
通過(guò)如下所述的過(guò)程確定連線的候選,并且分開圖案(即,圖)。(i) 經(jīng)受過(guò)線細(xì)化的讀取圖像的線細(xì)化圖案通過(guò)上述方法被圖形化,并且獲 得與上面類似的頂點(diǎn)相鄰矩陣。使用頂點(diǎn)相鄰矩陣,通過(guò)曲線圖理論技 術(shù)從頂點(diǎn)相鄰矩陣獲得邊的部分集基本矩陣(section set basic matrix)。這 里,"邊的部分集基本矩陣"是這樣的矩陣,其中各行表示段集合,并且 段集合的元素是與部分集的編號(hào)為"1"的組員相對(duì)應(yīng)的邊。這里,表達(dá) "部分集"意味著這樣的部分集,當(dāng)從曲線圖移除作為其元素的邊時(shí), 相關(guān)曲線圖被分為兩個(gè)。在圖16A的右側(cè)所示的頂點(diǎn)相鄰矩陣的示例的 情況下,獲得圖16B的右側(cè)所示的部分基本集矩陣。作為示例,在部分 基本集矩陣中包括的部分集編號(hào)"1"的部分集基本矩陣具有"1"個(gè)元 素,并且其以邊編號(hào)為"1"的邊el作為對(duì)應(yīng)的元素。在該部分集中, 當(dāng)移除邊el時(shí),圖16A的中間所示的原始曲線圖被分為如圖16B的左側(cè) 所示的兩個(gè)部分曲線圖。類似地,"3"號(hào)部分集編號(hào)的部分集基本矩陣 具有"2"個(gè)元素,并且其具有邊編號(hào)"2"和"4"的邊e2和e4作為對(duì) 應(yīng)的元素。在該部分集中,當(dāng)移除邊e2和e4時(shí),圖16A的中間所示的 原始曲線圖分為邊e3構(gòu)成的部分曲線圖和邊el、 e5、 e6和e7構(gòu)成的部 分曲線圖。
這里要獲得的連線的候選包括在這些部分集中。(ii)為了獲得連線 的候選的邊,對(duì)于各個(gè)部分集基礎(chǔ)通過(guò)如下所述的規(guī)則縮窄候選。首先, 獲得點(diǎn)接觸的候選的邊。(條件#1)邊屬于元素?cái)?shù)目為"1"的部分集。(條 件#2)邊具有至多為閾值(水平)的梯度,例如是高寬比至多為1的邊。
22即,基本與字符串的延伸方向平行的邊。
關(guān)于由此縮窄的點(diǎn)接觸候選的邊,獲得還滿足下述規(guī)則的邊作為連 線的候選的邊。(條件#3)邊的質(zhì)心的y坐標(biāo)(即,垂直于字符串的延伸 方向的坐標(biāo)軸上的坐標(biāo))在至多為圖案(即,整個(gè)圖,并且對(duì)下面同樣
適用)的高度的閾值的位置,例如,其質(zhì)心至多在圖案的高度的1/3處的
邊。在此情況下,坐標(biāo)的原點(diǎn)設(shè)置為左上位置,并且表達(dá)"至多閾值"
或"至多1/3"表示質(zhì)心位于閾值的上側(cè),或在圖案的上側(cè)的1/3內(nèi)。(條 件4)邊長(zhǎng)度至少是閾值,例如,其長(zhǎng)度至少是圖案的高度的1/2的邊。 在圖16A的示例中,僅部分集編號(hào)"1"的部分集基本矩陣保留為候 選,并且對(duì)應(yīng)的邊el被設(shè)置為連線的候選的邊。更具體地,如上所述, 該部分集基本矩陣具有1個(gè)元素(條件#1)。此外,如從圖16A的中間的 曲線圖理解的,邊el基本在水平方向延伸,并且邊的高與邊的寬的比率 至多是l (條件#2)。此外,如從該曲線圖可理解的,邊el位于整個(gè)圖案 上方,并且邊的質(zhì)心的y坐標(biāo)位于圖案的上側(cè)的1/3之內(nèi)(條件#3)。此 外,邊el的長(zhǎng)度至少是圖案的高度的1/2 (條件糾)。因此,滿足所有條 件。此外,在圖16B的右側(cè)的部分集基本矩陣中,僅關(guān)于其部分集編號(hào) 為"1"的邊el的矩陣中的元素?cái)?shù)是"1"。
接下來(lái),將詳細(xì)描述圖9所述的候選字符點(diǎn)陣創(chuàng)建單元15的處理。 在通過(guò)上述方法獲得全部邊接觸候選的邊、點(diǎn)接觸候選的邊和連線 候選的邊后,候選字符點(diǎn)陣創(chuàng)建單元15如下所述地創(chuàng)建候選字符點(diǎn)陣。 (i)使得邊接觸候選的邊、點(diǎn)接觸候選的邊和連線接觸候選的邊中的所 有邊被分入各包括一個(gè)邊的多個(gè)部分集,并且這些部分集以其各自外接 矩形的x坐標(biāo)的降序排列。這里,假設(shè)總共存在n個(gè)部分集。(ii)如圖 17E所示,之前所述的曲線圖被劃分為邊接觸候選的邊、點(diǎn)接觸候選的邊 和連線候選的邊、以及其間插入的各部分,B卩,總共(2n+l)個(gè)邊的部 分集。(iii)由此獲得的(2n+l)個(gè)邊的部分集相繼登記為相鄰節(jié)點(diǎn)之間 的鏈路。然而,在邊的部分集對(duì)應(yīng)于邊接觸候選的邊的情況下,相同邊 集作為接下來(lái)的相鄰節(jié)點(diǎn)之間的鏈路登記兩次。即,串聯(lián)連接的兩個(gè)鏈 路作為對(duì)應(yīng)于相關(guān)邊的鏈路提供。在邊的部分集對(duì)應(yīng)于連線候選的邊的情況下,在這些節(jié)點(diǎn)之間提供繞過(guò)對(duì)應(yīng)節(jié)點(diǎn)之間的鏈路的鏈路,并且(j)(空 白集)作為邊集相關(guān)聯(lián)。即,對(duì)于與相關(guān)邊的鏈路并聯(lián)連接的空?qǐng)D像提
供鏈路。(iv)起點(diǎn)s (s>0, s<n+l)和終點(diǎn)t (t>s, t<n+l)通過(guò)鏈路連 接,并且利用其來(lái)連接起點(diǎn)和終點(diǎn)之間存在的邊集的那些邊集與各個(gè)鏈 路相關(guān)聯(lián)。然而,對(duì)于其大小不滿足預(yù)定條件的邊集不產(chǎn)生鏈路。艮P, 在邊集的外接矩形的寬度與其高度的比為至少閾值的情況下,對(duì)相關(guān)邊 集不產(chǎn)生任何鏈路。(v)從各個(gè)邊集恢復(fù)圖案。通過(guò)例如根據(jù)邊信息創(chuàng) 建線細(xì)化圖案、并且將線細(xì)化圖案放寬(inflate)假定字符寬度的一半的 處理來(lái)恢復(fù)圖案(即,讀取圖像的狀態(tài)下的圖案)。(vi)由此恢復(fù)的所有 圖案經(jīng)受現(xiàn)有技術(shù)的字符識(shí)別,并且對(duì)于所獲得的識(shí)別字符種類(即, 識(shí)別結(jié)果的字符)的差異度自身或差異度定義的識(shí)別代價(jià)被設(shè)置為對(duì)應(yīng) 節(jié)點(diǎn)之間的鏈路的權(quán)重。
圖17A示出了掃描儀讀取的要識(shí)別的原始圖案。圖17B示出了從原 始圖案獲得的曲線圖。圖17C和圖17D分別示出了經(jīng)如上獲得的連線候 選的邊e5和邊接觸候選的邊ell劃分后的曲線圖的情況。圖17E示出了 整個(gè)曲線圖被劃分為邊的部分集的情況。圖17F示出了如上所述地創(chuàng)建 的候選字符點(diǎn)陣。候選字符點(diǎn)陣、邊信息和頂點(diǎn)信息分別以如圖18A到 18C例示的結(jié)構(gòu)實(shí)際存儲(chǔ)。
接下來(lái),將描述圖9所示的最短路徑搜索單元17的處理。
通過(guò)如動(dòng)態(tài)編程或Dijkastra方法的通用方法從由此創(chuàng)建的候選字符 點(diǎn)陣中搜索具有最短距離的路徑。結(jié)果,獲得了字符的最終識(shí)別結(jié)果。 在圖17A到17F的示例的情況下,作為最短路徑搜索的結(jié)果,獲得了節(jié) 點(diǎn)1 —節(jié)點(diǎn)2—節(jié)點(diǎn)5—節(jié)點(diǎn)7的路徑作為圖17F的候選字符點(diǎn)陣上的最 短路徑。這里,節(jié)點(diǎn)由如上所述的候選字符點(diǎn)陣中的黑點(diǎn)指示,并且其 編號(hào)從左邊連續(xù)分配為l, 2,…。圖19A和圖19B分別示出了對(duì)應(yīng)的讀 取圖像和與最短路徑對(duì)應(yīng)的識(shí)別結(jié)果的字符代碼(即,數(shù)字"039")。
圖20是示出了計(jì)算機(jī)的配置示例的框圖,用以解釋由計(jì)算機(jī)實(shí)現(xiàn)上 述實(shí)施方式中的字符識(shí)別裝置10的情況。
如圖20所示,計(jì)算機(jī)500包括CPU 501,其執(zhí)行構(gòu)成給定程序的指令,從而執(zhí)行各種操作;以及操縱單元502,用戶通過(guò)其利用鍵盤、鼠 標(biāo)等輸入操縱內(nèi)容或數(shù)據(jù)。計(jì)算機(jī)500還包括向用戶顯示CPU 501的處 理進(jìn)程、處理結(jié)果等的顯示單元503,如CRT、液晶顯示面板等。計(jì)算 機(jī)500還包括由ROM、 RAM等組成的存儲(chǔ)器504,其中存儲(chǔ)由CPU504 運(yùn)行的程序、數(shù)據(jù)等,并且其用作工作區(qū)域。計(jì)算機(jī)500還包括其中存 儲(chǔ)程序、數(shù)據(jù)等的硬盤驅(qū)動(dòng)器(HDD) 505。計(jì)算機(jī)500還包括通過(guò) CD-ROM 507從外部加載程序以及加載數(shù)據(jù)的CD-ROM驅(qū)動(dòng)器506。計(jì) 算機(jī)500還包括用于通過(guò)如因特網(wǎng)或LAN的通信網(wǎng)絡(luò)509從外部服務(wù)器 等下載程序的調(diào)制解調(diào)器508。
計(jì)算機(jī)500通過(guò)如CD-ROM 507的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)或通過(guò)通信 網(wǎng)絡(luò)509加載或下載指令構(gòu)成的程序,使CPU 501執(zhí)行上述字符識(shí)別裝 置10所執(zhí)行的處理。此外,程序安裝在硬盤驅(qū)動(dòng)器505內(nèi),適當(dāng)?shù)丶虞d 到存儲(chǔ)器504內(nèi),并且由CPU501運(yùn)行。結(jié)果,通過(guò)計(jì)算機(jī)500來(lái)實(shí)現(xiàn) 字符識(shí)別裝置10。
相關(guān)申請(qǐng)的交叉引用
本申請(qǐng)涉及并要求于2008年2月19日向日本專利局提交的日本專 利申請(qǐng)第2008-36785號(hào)的優(yōu)先權(quán),該申請(qǐng)通過(guò)引用合并于此。
權(quán)利要求
1、一種存儲(chǔ)字符識(shí)別程序的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),用于使計(jì)算機(jī)用作劃分單元,用于基于從輸入有字符串的帳票表面獲得的圖,將所述圖劃分為多個(gè)部分;候選字符串獲取單元,用于組合所述劃分單元?jiǎng)澐殖龅膱D的多個(gè)部分,從而獲得所述帳票上的字符串的多個(gè)候選字符串;以及字符串選擇單元,用于從所述多個(gè)候選字符串中選擇一個(gè)字符串;所述候選字符串獲取單元至少包括下述之一第一單元,用于復(fù)制接觸相鄰字符的字符線,然后將所復(fù)制的字符線包括為候選字符串的元素;以及第二單元,用于在多個(gè)候選字符串中包括已經(jīng)移除相鄰字符之間的接觸字符線的候選字符串、和包含所述字符線的候選字符串。
2、 根據(jù)權(quán)利要求l所述的存儲(chǔ)程序的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中所 述候選字符串獲取單元中的所述第一單元在所述多個(gè)候選字符串中包括 覆蓋下述情況的候選字符串相鄰字符之間的接觸字符線屬于相鄰字符之一的情況、所述字符線屬于另一字符的情況、以及所述字符線屬于相 鄰字符兩者的情況。
3、 根據(jù)權(quán)利要求1所述的存儲(chǔ)程序的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中 所述候選字符串獲取單元包括路徑產(chǎn)生單元,該路徑產(chǎn)生單元用于將通過(guò)將所述圖劃分為多個(gè)部分所獲得的各個(gè)部分與相鄰節(jié)點(diǎn)之間的鏈 路關(guān)聯(lián);在通過(guò)將相應(yīng)節(jié)點(diǎn)之間包括的部分圖案聯(lián)合而獲得的圖案變?yōu)?一個(gè)字符的情況下,產(chǎn)生對(duì)應(yīng)節(jié)點(diǎn)之間的鏈路;然后將所聯(lián)合的圖案與 鏈路關(guān)聯(lián),將這些鏈路彼此連接,從而產(chǎn)生分別對(duì)應(yīng)于多個(gè)候選字符串 的多個(gè)路徑;所述字符串選擇單元包括字符識(shí)別代價(jià)設(shè)置單元,用于將所述圖的對(duì)應(yīng)部分的字符識(shí)別 所需的識(shí)別代價(jià)設(shè)置為構(gòu)成路徑的各個(gè)鏈路的權(quán)重;以及路徑選擇單元,用于將通過(guò)對(duì)每個(gè)路徑的各個(gè)鏈路的權(quán)重求和獲得的識(shí)別成本總計(jì)為最小值的一個(gè)路徑選擇為所述字符串的路徑;所述候選字符串獲取單元中的所述第一單元提供串聯(lián)連接的兩個(gè)鏈 路作為對(duì)應(yīng)于接觸字符線的鏈路,并且這兩個(gè)鏈路中的一個(gè)鏈路具有接 觸字符線,而另一條線具有與所述兩個(gè)鏈路中的所述一個(gè)鏈路的接觸字 符線相同的接觸字符線;以及所述候選字符串獲取單元中的所述第二單元提供與接觸字符線并聯(lián) 連接的兩個(gè)鏈路,作為對(duì)應(yīng)于所述接觸字符線的鏈路,并且所述兩個(gè)鏈 路中一個(gè)鏈路具有接觸字符線,而另一鏈路是繞道鏈路并具有空白圖案。
4、 根據(jù)權(quán)利要求l所述的存儲(chǔ)程序的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其中 在所述接觸字符線沿與所述字符串的延伸方向基本垂直的方向延伸的情況下應(yīng)用所述候選字符串獲取單元中的所述第一單元;以及在所述接觸字符線沿與所述字符串的延伸方向基本相同的方向延伸 的情況下應(yīng)用所述候選字符串獲取單元中的所述第二單元。
5、 一種字符識(shí)別裝置,所述裝置包括劃分單元,用于基于從輸入有字符串的帳票表面獲得的圖,將所述 圖劃分為多個(gè)部分;候選字符串獲取單元,用于組合所述劃分單元?jiǎng)澐殖龅乃鰣D的所 述多個(gè)部分,從而獲得所述圖中的所述字符串的多個(gè)候選字符串;以及字符串選擇單元,用于從所述多個(gè)候選字符串中選擇一個(gè)字符串;其中,所述候選字符串獲取單元至少包括下述單元之一第一單元, 用于復(fù)制在相鄰字符之間接觸的字符線,然后將所復(fù)制的字符線包括為 候選字符串的元素;以及第二單元,用于在所述多個(gè)候選字符串中包括 已經(jīng)移除了所述接觸字符線的候選字符串、和包含所述字符線的候選字 符串。
6、 根據(jù)權(quán)利要求5所述的字符識(shí)別裝置,其中所述候選字符串獲取 單元中的所述第一單元在所述多個(gè)候選字符串中包括覆蓋下述情況的候 選字符串所述接觸字符線屬于相鄰字符中一個(gè)字符的情況、所述字符 線屬于另一字符的情況、以及所述字符線屬于相鄰字符兩者的情況。
7、 根據(jù)權(quán)利要求5所述的字符識(shí)別裝置,其中所述候選字符串獲取單元包括路徑產(chǎn)生單元,該路徑產(chǎn)生單元用于 將所述圖的所述多個(gè)部分與多個(gè)鏈路關(guān)聯(lián),并且將所述多個(gè)鏈路彼此連接,從而產(chǎn)生分別對(duì)應(yīng)于多個(gè)候選字符串的多個(gè)路徑; 所述字符串選擇單元包括字符識(shí)別代價(jià)設(shè)置單元,用于將所述圖的對(duì)應(yīng)部分的字符識(shí)別所需的識(shí)別代價(jià)設(shè)置為構(gòu)成路徑的各個(gè)鏈路的權(quán)重;以及路徑選擇單元,用于將對(duì)每個(gè)路徑的各個(gè)鏈路的權(quán)重求和獲得的識(shí)別成本總計(jì)為最小值的一個(gè)路徑選擇為所述字符串的路徑;所述候選字符串獲取單元中的所述第一單元提供串聯(lián)連接的兩個(gè)鏈路作為對(duì)應(yīng)于所述接觸字符線的鏈路;以及所述候選字符串獲取單元中的所述第二單元提供與所述接觸字符線并聯(lián)連接的兩個(gè)鏈路,作為對(duì)應(yīng)于所述接觸字符線的鏈路,并且兩個(gè)鏈路之一具有所述接觸字符線,而另一鏈路是繞道鏈路。
8、 根據(jù)權(quán)利要求5所述的字符識(shí)別裝置,其中 在所述接觸字符線沿與所述字符串的延伸方向基本垂直的方向延伸的情況下應(yīng)用所述候選字符串獲取單元中的所述第一單元;以及在所述接觸字符線沿與所述字符串的延伸方向基本相同的方向延伸 的情況下應(yīng)用所述候選字符串獲取單元中的所述第二單元。
9、 一種字符識(shí)別方法,所述方法包括劃分步驟,用于基于從輸入有字符串的帳票表面獲得的圖,將所述 圖劃分為多個(gè)部分;候選字符串獲取步驟,用于組合在所述劃分步驟劃分出的圖的多個(gè) 部分,從而獲得所述圖中的字符串多個(gè)候選字符串;以及字符串選擇步驟,用于從所述多個(gè)候選字符串中選擇一個(gè)字符串;其中,所述候選字符串獲取步驟至少包括下述之一第一步驟,用 于復(fù)制在相鄰字符之間接觸的字符線,然后將所復(fù)制的字符線包括為候 選字符串的元素;以及第二步驟,用于在所述多個(gè)候選字符串中包括已 經(jīng)移除相鄰字符之間的接觸字符線的候選字符串、和包含所述字符線的 候選字符串。
10、 根據(jù)權(quán)利要求9所述的字符識(shí)別方法,其中所述候選字符串獲取步驟中的所述第一步驟在所述多個(gè)候選字符串中包括覆蓋下述情況的候選字符串所述接觸字符線屬于相鄰字符之一的情況、所述接觸字符 線屬于另一字符的情況、以及所述字符線屬于相鄰字符兩者的情況。
11、 根據(jù)權(quán)利要求9所述的字符識(shí)別方法,其中所述候選字符串獲取步驟包括路徑產(chǎn)生步驟,所述路徑產(chǎn)生步驟用 于將圖的多個(gè)部分與多個(gè)鏈路關(guān)聯(lián),并且將這些鏈路彼此連接,從而產(chǎn)生分別對(duì)應(yīng)于多個(gè)候選字符串的路徑;所述字符串選擇步驟包括字符識(shí)別代價(jià)設(shè)置步驟,用于將圖的對(duì)應(yīng)部分的字符識(shí)別所需的識(shí)別代價(jià)設(shè)置為構(gòu)成路徑的各個(gè)鏈路的權(quán)重;以及路徑選擇步驟,用于將通過(guò)對(duì)每個(gè)路徑的各自的鏈路的權(quán)重求和獲得的識(shí)別成本總計(jì)為最小值的一個(gè)路徑選擇為所述字符串的路徑; 所述候選字符串獲取步驟中的所述第一步驟提供串聯(lián)連接的兩個(gè)鏈路作為對(duì)應(yīng)于接觸中的字符線的鏈路;以及所述候選字符串獲取步驟中的所述第二步驟提供與接觸字符線并聯(lián)連接的兩個(gè)鏈路,作為對(duì)應(yīng)于所述接觸字符線的鏈路,并且兩個(gè)鏈路之一具有接觸字符線,而另一鏈路是繞過(guò)鏈路。
12、 根據(jù)權(quán)利要求9所述的字符識(shí)別方法,其中 在所述接觸字符線沿與所述字符串的延伸方向基本垂直的方向延伸的情況下應(yīng)用所述候選字符串獲取步驟中的所述第一步驟;以及在所述接觸字符線沿與所述字符串的延伸方向基本相同的方向延伸 的情況下應(yīng)用所述候選字符串獲取步驟中的所述第二步驟。
全文摘要
一種字符識(shí)別裝置,包括劃分機(jī)制,用于將圖劃分為多個(gè)部分;候選字符串獲取機(jī)制,用于組合圖的多個(gè)部分;以及字符串選擇機(jī)制,用于選擇一個(gè)字符串。所述候選字符串獲取機(jī)制至少包括下述之一第一機(jī)制,用于復(fù)制接觸相鄰字符的字符線,然后將所復(fù)制的字符線包括為候選字符串的元素;以及第二機(jī)制,用于在多個(gè)候選字符串中包括已經(jīng)移除相鄰字符之間的接觸字符線的候選字符串、和包含所述接觸字符線的候選字符串。
文檔編號(hào)G06K9/34GK101515323SQ20091000425
公開日2009年8月26日 申請(qǐng)日期2009年2月18日 優(yōu)先權(quán)日2008年2月19日
發(fā)明者藤本克仁, 諏訪美佐子 申請(qǐng)人:富士通株式會(huì)社