專(zhuān)利名稱(chēng):文字識(shí)別裝置、區(qū)分裝置、區(qū)分控制裝置,以及文字識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及文字識(shí)別裝置、區(qū)分裝置、區(qū)分控制裝置,以及文字識(shí)別方法。
背景技術(shù):
已知有讀出圖像中的文字的OCR (Optical character reader 光學(xué)字符閱讀器) 等的文字識(shí)別裝置。在帶窗封口信函中,收件方住址位于窗口一端,有時(shí)出現(xiàn)構(gòu)成收件方住址的文字的一部分隱匿,文字缺失的現(xiàn)象。提出了不限于封口信函的窗口的、用于識(shí)別這種缺失的文字的各種技術(shù)。例如,提出了從未隱匿的行的文字的高度推斷隱匿的行的文字的高度,利用推斷結(jié)果識(shí)別文字的技術(shù)。另外,還提出了從沒(méi)有下線(xiàn)的行的文字的高度推斷除去下線(xiàn)時(shí)缺失的文字的高度,利用推斷結(jié)果識(shí)別文字的技術(shù)。但是,在上述的技術(shù)中文字識(shí)別精度還不夠高了,期望更高精度的文字識(shí)別技術(shù)。
發(fā)明內(nèi)容
本發(fā)明就是為了解決上述的課題而完成的。根據(jù)本發(fā)明的一個(gè)方面,提供一種文字識(shí)別裝置,包括檢測(cè)部,從圖像檢測(cè)各文字候補(bǔ);識(shí)別部,基于與多個(gè)不同的文字缺失的程度對(duì)應(yīng)的多個(gè)文字識(shí)別詞典來(lái)識(shí)別各文字候補(bǔ)。根據(jù)本發(fā)明的另一個(gè)方面,提供一種區(qū)分裝置,包括如上所述的文字識(shí)別裝置,還包括區(qū)分部,基于各文字候補(bǔ)的識(shí)別結(jié)果對(duì)區(qū)分對(duì)象物進(jìn)行區(qū)分。根據(jù)本發(fā)明的另一個(gè)方面,提供一種區(qū)分控制裝置,包括如上所述的文字識(shí)別裝置,還包括通信部,接收從區(qū)分處理部發(fā)送的圖像,將與各文字候補(bǔ)的識(shí)別結(jié)果對(duì)應(yīng)的區(qū)分信息發(fā)送到上述區(qū)分處理部,所述區(qū)分處理部從區(qū)分對(duì)象物讀取上述圖像并基于上述區(qū)分信息區(qū)分上述區(qū)分對(duì)象物。根據(jù)本發(fā)明的另一個(gè)方面,提供一種文字識(shí)別方法,包括從圖像檢測(cè)各文字候補(bǔ)的步驟;基于與多個(gè)不同的文字缺失的程度對(duì)應(yīng)的多個(gè)文字識(shí)別詞典來(lái)識(shí)別各文字候補(bǔ)的步驟。根據(jù)本發(fā)明的另一個(gè)方面,提供一種文字識(shí)別裝置,識(shí)別將多個(gè)文字成列狀地記載的文字列,所述文字識(shí)別裝置包括隱匿文字列候補(bǔ)檢測(cè)部,在上述文字列的一部分隱匿的狀態(tài)下,檢測(cè)有隱匿的可能性的文字部分作為隱匿文字列區(qū)域候補(bǔ);確認(rèn)部,對(duì)由上述隱匿文字列候補(bǔ)檢測(cè)部檢測(cè)到的隱匿文字列區(qū)域候補(bǔ)確認(rèn)實(shí)際上是否有文字隱匿;識(shí)別部, 基于上述確認(rèn)部的確認(rèn)結(jié)果進(jìn)行對(duì)象文字列的識(shí)別處理。根據(jù)本發(fā)明的另一個(gè)方面,提供一種文字識(shí)別方法,識(shí)別將多個(gè)文字成列狀地記載的文字列,所述文字識(shí)別方法包括在上述文字列的一部分被隱匿的狀態(tài)下,檢測(cè)有隱匿的可能性的文字部分作為隱匿文字列區(qū)域候補(bǔ);對(duì)檢測(cè)到的隱匿文字列區(qū)域候補(bǔ)確認(rèn)實(shí)際上是否有文字隱匿;基于確認(rèn)結(jié)果進(jìn)行對(duì)象文字列的識(shí)別處理。根據(jù)本發(fā)明的另一個(gè)方面,提供一種區(qū)分裝置,基于區(qū)分信息區(qū)分處理由文字列顯示著上述區(qū)分信息的物體,上述區(qū)分信息表示區(qū)分目的地,所述區(qū)分裝置包括傳輸部, 傳輸上述物體;讀取部,讀取由上述傳輸部傳輸?shù)纳鲜鑫矬w的圖像;文字識(shí)別部,從由上述讀取部讀取的圖像識(shí)別表示上述區(qū)分信息的文字列;區(qū)分部,基于作為由上述文字識(shí)別部識(shí)別的區(qū)分信息的文字列,區(qū)分上述物體,上述文字識(shí)別部具備隱匿文字列候補(bǔ)檢測(cè)部, 在上述文字列的一部分被隱匿的狀態(tài)下,檢測(cè)有隱匿可能性的文字部分作為隱匿文字列區(qū)域候補(bǔ);確認(rèn)部,對(duì)由上述隱匿文字列候補(bǔ)檢測(cè)部檢測(cè)出的隱匿文字列區(qū)域候補(bǔ),確認(rèn)實(shí)際上是否有文字隱匿;識(shí)別部,基于上述確認(rèn)部的確認(rèn)結(jié)果,進(jìn)行對(duì)象文字列的識(shí)別處理。
圖1是表示第1種實(shí)施方式的區(qū)分系統(tǒng)(文字識(shí)別裝置)之一例的方框圖。圖2是表示第1種實(shí)施方式的區(qū)分系統(tǒng)的變形例子的方框圖。圖3是表示第1種實(shí)施方式的文字列識(shí)別處理之一例的流程圖。圖4是表示第1種實(shí)施方式的區(qū)分對(duì)象物之一例的圖。圖5是表示第1種實(shí)施方式的文字候補(bǔ)檢測(cè)之一例的圖。圖6是表示涉及第1種實(shí)施方式的文字下端位置的推斷之一例的圖。圖7是表示第1種實(shí)施方式的文字識(shí)別候補(bǔ)的選出之一例的圖。圖8是表示第2種實(shí)施方式的帶窗封口信函等的帶窗郵件之一例的平面圖。圖9是模式化表示適用第2種實(shí)施方式的文字識(shí)別裝置以及文字識(shí)別方法的區(qū)分裝置的構(gòu)成的方框圖。圖10是說(shuō)明第2種實(shí)施方式的文字識(shí)別處理流程的流程圖。圖11是說(shuō)明第2種實(shí)施方式的文字識(shí)別處理流程的流程圖。圖12是說(shuō)明在帶窗郵件的窗口上文字列的一部分隱匿的情況和與之相對(duì)的輪廓跟蹤情況的圖。圖13是表示排他部分文字圖之一例的圖。圖14A以及圖14B是說(shuō)明在英文的使用文字中的排他部分文字的例子和非排他性的例子的圖。圖15是說(shuō)明采用連字符檢測(cè)進(jìn)行的文字列的缺損部分的高度推斷之一例的圖。
具體實(shí)施例方式實(shí)施方式的文字識(shí)別裝置具備檢測(cè)部和識(shí)別部。上述檢測(cè)部從圖像中檢測(cè)各文字候補(bǔ)。上述識(shí)別部根據(jù)與多個(gè)不同的文字缺失的程度對(duì)應(yīng)的多個(gè)文字識(shí)別詞典識(shí)別文字候補(bǔ)。(第1種實(shí)施方式)以下,參照
第1種實(shí)施方式。圖1是表示第1種實(shí)施方式的區(qū)分系統(tǒng)之一例的方框圖。如圖1所示,區(qū)分系統(tǒng)1具備傳輸部11、讀取部12、識(shí)別部13、文字識(shí)別詞典數(shù)據(jù)庫(kù)14、排列驗(yàn)證部15、文字列驗(yàn)證部16、文字列數(shù)據(jù)庫(kù)17、區(qū)分部18。而且,用傳輸部11、 讀取部12、區(qū)分部18構(gòu)成區(qū)分處理部(區(qū)分裝置)1A,另外,用識(shí)別部13、文字識(shí)別詞典數(shù)據(jù)庫(kù)14,排列驗(yàn)證部15、文字列驗(yàn)證部16、文字列數(shù)據(jù)庫(kù)17構(gòu)成文字識(shí)別處理部(文字識(shí)別裝置)1B。如圖2所示,還能夠構(gòu)成區(qū)分系統(tǒng)1。S卩,區(qū)分系統(tǒng)1可以用多臺(tái)區(qū)分處理部1A、 1臺(tái)文字識(shí)別處理部IB以及通信部IC構(gòu)成。而且,用1臺(tái)文字識(shí)別處理部IB以及通信部 IC構(gòu)成區(qū)分控制處理部(區(qū)分控制裝置)1D。通信部IC將來(lái)自多臺(tái)區(qū)分處理部IA的信息 (區(qū)分對(duì)象物的圖像數(shù)據(jù))發(fā)送到文字識(shí)別處理部1B,另外,將來(lái)自文字識(shí)別處理部IB的信息(從圖像中讀取并識(shí)別的收件方信息(區(qū)分信息))發(fā)送到多臺(tái)區(qū)分處理部1A。如圖 2所示通過(guò)構(gòu)成區(qū)分系統(tǒng)1,能夠分散區(qū)分處理,集中判別處理(識(shí)別處理),能夠謀求提高整體處理效率。傳輸部11用傳輸路徑等構(gòu)成,沿著傳輸路徑傳輸信函以及包裹等的區(qū)分對(duì)象物。 讀取部12在傳輸路徑的中途讀取區(qū)分對(duì)象物的圖像。例如,區(qū)分對(duì)象物是帶窗封口信函, 構(gòu)成收件方的文字列的一部分在窗口一端隱匿。文字識(shí)別詞典數(shù)據(jù)庫(kù)14存儲(chǔ)與多個(gè)不同的文字缺失程度對(duì)應(yīng)的多個(gè)文字識(shí)別詞典。進(jìn)而,文字識(shí)別詞典數(shù)據(jù)庫(kù)14還存儲(chǔ)沒(méi)有文字缺失的完整文字的文字識(shí)別詞典。例
如,文字識(shí)別詞典數(shù)據(jù)庫(kù)14存儲(chǔ)文字識(shí)別詞典D1、D2.....DN的N個(gè)(N:自然數(shù))的文字
識(shí)別詞典。例如,文字識(shí)別詞典Dl (無(wú)缺失詞典)是由無(wú)文字缺失的多個(gè)文字生成的文字識(shí)別詞典。文字識(shí)別詞典D2(l成缺失詞典)是由缺失 20的多個(gè)文字生成的文字識(shí)別詞典。文字識(shí)別詞典D3 (3成缺失詞典)是由缺失21% 40%的多個(gè)文字生成的文字識(shí)別詞典。文字識(shí)別詞典D4(5成缺失詞典)是從缺少41% 60%的多個(gè)文字生成的文字識(shí)別詞典。識(shí)別部13從圖4所示的區(qū)分對(duì)象物的圖像中檢測(cè)各文字候補(bǔ)。例如,識(shí)別部13 從區(qū)分對(duì)象物的圖像中檢測(cè)如同文字行以及如同文字列的圖像,從這些如同文字行以及文字列的圖像中檢測(cè)如同多個(gè)文字的圖像,從如同多個(gè)文字的圖像中檢測(cè)多個(gè)文字候補(bǔ)。進(jìn)而,識(shí)別部13根據(jù)存儲(chǔ)在文字識(shí)別詞典數(shù)據(jù)庫(kù)14中的多個(gè)文字識(shí)別詞典D1、
D2.....DN來(lái)識(shí)別各文字候補(bǔ)。S卩,識(shí)別部13能夠識(shí)別記載在區(qū)分對(duì)象物中的收件方住址
(由各文字候補(bǔ)構(gòu)成的收件方住址)。排列驗(yàn)證部15在恢復(fù)各文字候補(bǔ)的缺失時(shí),驗(yàn)證下端(下側(cè))是否排列整齊(參照?qǐng)D6)。換句話(huà)說(shuō),排列驗(yàn)證部15在復(fù)原各文字候補(bǔ)的缺失時(shí),驗(yàn)證下端(下側(cè))沿著文字的排列是否排列成一條直線(xiàn)。文字列驗(yàn)證部16使用存儲(chǔ)在文字列數(shù)據(jù)庫(kù)17中的文字列數(shù)據(jù)(住址數(shù)據(jù)),驗(yàn)證作為文字列數(shù)據(jù)(住址數(shù)據(jù))是否存在的文字列。而且,文字列數(shù)據(jù)(住址數(shù)據(jù))是有可能記載在區(qū)分對(duì)象物中的文字列圖案。區(qū)分部18根據(jù)與識(shí)別部13的文字識(shí)別結(jié)果對(duì)應(yīng)的收件方信息(區(qū)分信息)區(qū)分由傳輸部11傳輸?shù)膮^(qū)分對(duì)象物。以下,參照?qǐng)D3說(shuō)明第1種實(shí)施方式的文字列識(shí)別處理之一例。而且,在第1種實(shí)施方式中,說(shuō)明英文文字列處理之一例。首先,讀取部12在傳輸路徑的途中讀入?yún)^(qū)分對(duì)象物的圖像(Si)。圖4是表示第1 種實(shí)施方式的區(qū)分對(duì)象物之一例的圖。如圖4所示,例如,區(qū)分對(duì)象物是帶窗封口信函,構(gòu)成收件方的文字列“TARG”的一部分在窗口的一端隱匿。接著,識(shí)別部13從圖4所示的區(qū)分對(duì)象物的圖像中抽出圖5所示那樣的各文字候補(bǔ)C1、C2、C3、C4(S2)。用圖5所示的虛線(xiàn)的矩形包圍的多個(gè)如同文字的圖像區(qū)域是各文字候補(bǔ) C1、C2、C3、C4。而且,識(shí)別部13也可以從一個(gè)如同文字的圖像區(qū)域中抽出多個(gè)文字候補(bǔ)。例如, 如圖5所示,識(shí)別部13還可以從一個(gè)如同文字的圖像區(qū)域中抽出多個(gè)文字候補(bǔ)C4a、C4b。接著,識(shí)別部13根據(jù)多個(gè)文字識(shí)別詞典D1、D2.....DN選出與各文字候補(bǔ)Cl、
C2、C3、C4對(duì)應(yīng)的1個(gè)以上的文字識(shí)別候補(bǔ)(S; )。而且識(shí)別部13對(duì)各文字候補(bǔ)選擇出滿(mǎn)足大于等于規(guī)定相似度的條件的1個(gè)以上的文字識(shí)別候補(bǔ)。例如,當(dāng)對(duì)文字識(shí)別詞典 DM(1彡M彡N)規(guī)定文字候補(bǔ)完全一致的情況下,設(shè)該規(guī)定文字候補(bǔ)對(duì)于文字識(shí)別詞典DM
具有相似度1000。識(shí)別部13根據(jù)多個(gè)文字識(shí)別詞典D1、D2.....DN,對(duì)各文字候補(bǔ)選出滿(mǎn)
足相似度大于等于700的條件的1個(gè)以上的文字識(shí)別候補(bǔ)。例如,如圖7所示,識(shí)別部13選出與文字候補(bǔ)Cl對(duì)應(yīng)的文字識(shí)別候補(bǔ)Cll、C12、 C13,選出與文字候補(bǔ)C2對(duì)應(yīng)的文字識(shí)別候補(bǔ)C21,選出與文字候補(bǔ)C3對(duì)應(yīng)的文字識(shí)別候補(bǔ) C31、C32、C33,選出與文字識(shí)別候補(bǔ)C4對(duì)應(yīng)的文字識(shí)別候補(bǔ)C41、C42。S卩,文字識(shí)別候補(bǔ)Cll對(duì)于文字識(shí)別詞典Dl (無(wú)缺失詞典)與相似度950 (1位) 的“T”對(duì)應(yīng),文字識(shí)別候補(bǔ)C12對(duì)于文字識(shí)別詞典D4 (5成缺失詞典)與相似度900 (2位) 的“ I,,對(duì)應(yīng),文字識(shí)別候補(bǔ)C13對(duì)于文字識(shí)別詞典D2 (1成缺失詞典)與相似度850 (3位) 的“T”對(duì)應(yīng)。另外,文字識(shí)別候補(bǔ)C21對(duì)于文字識(shí)別詞典D3(3成缺失詞典)與相似度900(1位) 的“A”對(duì)應(yīng)。另外,文字識(shí)別候補(bǔ)C31對(duì)于文字識(shí)別詞典D3(3成缺失詞典)與相似度900(1位) 的“B”對(duì)應(yīng),文字識(shí)別候補(bǔ)C32對(duì)于文字識(shí)別詞典D3 (3成缺失詞典)與相似度850 (2位) 的“R”對(duì)應(yīng),文字識(shí)別候補(bǔ)C33對(duì)于文字識(shí)別詞典Dl (無(wú)缺失詞典)與相似度700 (3位) 的“D”對(duì)應(yīng)。另外,文字識(shí)別候補(bǔ)C41對(duì)于文字識(shí)別詞典D3(3成缺失詞典)與相似度850(1位) 的“G”對(duì)應(yīng),文字識(shí)別候補(bǔ)C42對(duì)于文字識(shí)別詞典D2 (1成缺失詞典)與相似度700 (2位) 的“E”對(duì)應(yīng)。而且,將與文字候補(bǔ)Cl對(duì)應(yīng)的1個(gè)以上的文字識(shí)別候補(bǔ)(文字識(shí)別候補(bǔ)C11、C12、 C13)稱(chēng)為第1文字識(shí)別候補(bǔ)群G1,將與文字候補(bǔ)C2對(duì)應(yīng)的1個(gè)以上的文字識(shí)別候補(bǔ)(文字識(shí)別候補(bǔ)C21)稱(chēng)為第2文字識(shí)別候補(bǔ)群G2,將與文字候補(bǔ)C3對(duì)應(yīng)的1個(gè)以上的文字識(shí)別候補(bǔ)(文字識(shí)別候補(bǔ)C31、C32、C3;3)稱(chēng)為第3文字識(shí)別候補(bǔ)群G3,將與文字候補(bǔ)C4對(duì)應(yīng)的1個(gè)以上的文字識(shí)別候補(bǔ)(文字識(shí)別候補(bǔ)C41、C42、C43)稱(chēng)為第4文字識(shí)別候補(bǔ)群G4。接著,文字列驗(yàn)證部16從各文字識(shí)別候補(bǔ)群Gl、G2、G3、G4中選出1個(gè)文字識(shí)別候補(bǔ),生成1個(gè)以上的文字列候補(bǔ)(S4)。例如,文字列驗(yàn)證部16從第1文字識(shí)別候補(bǔ)群Gl中選擇文字識(shí)別候補(bǔ)C11,從第2 文字識(shí)別候補(bǔ)群G2中選擇文字識(shí)別候補(bǔ)C21,從第3文字識(shí)別候補(bǔ)群G3中選擇文字識(shí)別候補(bǔ)C31,從第4文字識(shí)別候補(bǔ)群G4中選擇文字識(shí)別候補(bǔ)C41,生成第1文字列候補(bǔ)(TABG)。同樣,文字列驗(yàn)證部16從第1文字識(shí)別候補(bǔ)群Gl中選擇文字識(shí)別候補(bǔ)C12,從第2 文字識(shí)別候補(bǔ)群G2中選擇文字識(shí)別候補(bǔ)C21,從第3文字識(shí)別候補(bǔ)群G3中選擇文字識(shí)別候補(bǔ)C31,從第4文字識(shí)別候補(bǔ)群G4中選擇文字識(shí)別候補(bǔ)C41,生成第2文字列候補(bǔ)(IABG)。同樣,文字列驗(yàn)證部16從第1文字識(shí)別候補(bǔ)群Gl中選擇文字識(shí)別候補(bǔ)Cl 1,從第2 文字識(shí)別候補(bǔ)群G2中選擇文字識(shí)別候補(bǔ)C21,從第3文字識(shí)別候補(bǔ)群G3中選擇文字識(shí)別候補(bǔ)C32,從第4文字識(shí)別候補(bǔ)群G4中選擇文字識(shí)別候補(bǔ)C41,生成第3文字列候補(bǔ)(TARG)。同樣,文字列驗(yàn)證部16從第1文字識(shí)別候補(bǔ)群Gl中選擇文字識(shí)別候補(bǔ)C12,從第2 文字識(shí)別候補(bǔ)群G2中選擇文字識(shí)別候補(bǔ)C21,從第3文字識(shí)別候補(bǔ)群G3中選擇文字識(shí)別候補(bǔ)C32,從第4文字識(shí)別候補(bǔ)群G4中選擇文字識(shí)別候補(bǔ)C42,生成第4文字列候補(bǔ)(IARE)。
同樣,文字列驗(yàn)證部16從第1文字識(shí)別候補(bǔ)群Gl中選擇文字識(shí)別候補(bǔ)C13,從第2 文字識(shí)別候補(bǔ)群G2中選擇文字識(shí)別候補(bǔ)C21,從第3文字識(shí)別候補(bǔ)群G3中選擇文字識(shí)別候補(bǔ)C32,從第4文字識(shí)別候補(bǔ)群G4中選擇文字識(shí)別候補(bǔ)C42,生成第5文字列候補(bǔ)(TADE)。同樣,文字列驗(yàn)證部16從第1文字識(shí)別候補(bǔ)群Gl中選擇文字識(shí)別候補(bǔ)C13,從第2 文字識(shí)別候補(bǔ)群G2中選擇文字識(shí)別候補(bǔ)C21,從第3文字識(shí)別候補(bǔ)群G3中選擇文字識(shí)別候補(bǔ)C33,從第4文字識(shí)別候補(bǔ)群G4中選擇文字識(shí)別候補(bǔ)C42,生成第6文字列候補(bǔ)(TARE)。接著,排列驗(yàn)證部15在復(fù)原各文字列候補(bǔ)的缺失時(shí),驗(yàn)證下端(下側(cè))是否排列整齊(S5)。例如,構(gòu)成第5文字列候補(bǔ)的文字識(shí)別候補(bǔ)Cll (T)是根據(jù)文字識(shí)別詞典Dl (無(wú)缺失詞典)選出的候補(bǔ)。因而,排列驗(yàn)證部15將文字識(shí)別候補(bǔ)Cll推斷為無(wú)缺失,如圖6 所示那樣,推斷文字識(shí)別候補(bǔ)Cll的文字下端位置P1。同樣,構(gòu)成第5文字列候補(bǔ)的文字識(shí)別候補(bǔ)C21 (A)是根據(jù)文字識(shí)別詞典D3 (3成缺失詞典)選出的候補(bǔ)。因而,排列驗(yàn)證部15將文字識(shí)別候補(bǔ)C21推斷為3成缺失。如圖 6所示那樣,推斷文字識(shí)別候補(bǔ)C21的文字下端位置P2。同樣,構(gòu)成第5文字列候補(bǔ)的文字識(shí)別候補(bǔ)C33 (D)是根據(jù)文字識(shí)別詞典Dl (無(wú)缺失詞典)選出的候補(bǔ)。因而,排列驗(yàn)證部15將文字識(shí)別候補(bǔ)C33推斷為無(wú)缺失。如圖6所示那樣,推斷文字識(shí)別候補(bǔ)C33的文字下端位置P3。同樣,構(gòu)成第5文字列候補(bǔ)的文字識(shí)別候補(bǔ)C42 (E)是根據(jù)文字識(shí)別詞典D2 (1成缺失詞典)選出的候補(bǔ)。因而,排列驗(yàn)證部15將文字識(shí)別候補(bǔ)C41推斷為1成缺失。如圖 6所示那樣,推斷文字識(shí)別候補(bǔ)C42的文字下端位置P4。如圖6所示,文字識(shí)別候補(bǔ)Cll的文字下端位置P1、文字識(shí)別候補(bǔ)C21的文字下端位置P2、文字識(shí)別候補(bǔ)C33的文字下端位置P3、文字識(shí)別候補(bǔ)C42位置下端位置P4在文字列方向上不在一條直線(xiàn)上。因此,排列驗(yàn)證部15將第5文字列候補(bǔ)判斷為不是適宜的文字列候補(bǔ),廢除第5文字列候補(bǔ)。如上所述,排列驗(yàn)證部15驗(yàn)證各文字列候補(bǔ)的排列,廢除不適宜的文字列候補(bǔ)。換句話(huà)說(shuō),排列驗(yàn)證部15驗(yàn)證構(gòu)成各文字列候補(bǔ)的文字識(shí)別候補(bǔ)的組合,廢除不適宜的文字列候補(bǔ)。接著,文字列驗(yàn)證部16根據(jù)存儲(chǔ)在文字列數(shù)據(jù)庫(kù)17中的文字列數(shù)據(jù)(住址數(shù)據(jù)),用排列驗(yàn)證部15驗(yàn)證未刪除的各文字列候補(bǔ)是否是適宜的文字列(S6)。換句話(huà)說(shuō), 文字列驗(yàn)證部16根據(jù)存儲(chǔ)在文字列數(shù)據(jù)庫(kù)17中的文字列數(shù)據(jù)(住址數(shù)據(jù)),驗(yàn)證構(gòu)成各文字列候補(bǔ)的文字識(shí)別候補(bǔ)的組合,刪除不適宜的文字列候補(bǔ)。例如,文字列驗(yàn)證部16在第 4文字列候補(bǔ)(IARE)在文字列數(shù)據(jù)中不存在的情況下,將第4文字列候補(bǔ)判斷為不是適宜的文字列候補(bǔ),刪除第4文字列候補(bǔ)。這樣,文字列驗(yàn)證部16驗(yàn)證各文字列候補(bǔ)是否是適宜的文字列,刪除不適宜的文字列候補(bǔ)。接著,識(shí)別部13根據(jù)文字排列驗(yàn)證結(jié)果以及文字列的驗(yàn)證結(jié)果,輸出與適宜的文字列候補(bǔ)對(duì)應(yīng)的文字列識(shí)別結(jié)果(S7)。S卩,識(shí)別部13輸出與由排列驗(yàn)證部15進(jìn)行的文字列排列驗(yàn)證而未被刪除的、另外由文字列驗(yàn)證部16進(jìn)行的文字列驗(yàn)證而未被刪除的適宜的文字列候補(bǔ)對(duì)應(yīng)的文字列識(shí)別結(jié)果。換句話(huà)說(shuō),識(shí)別部13根據(jù)由排列驗(yàn)證部15完成的構(gòu)成各文字列候補(bǔ)的文字識(shí)別候補(bǔ)的組合的驗(yàn)證結(jié)果、以及由文字列驗(yàn)證部16完成的構(gòu)成各文字列候補(bǔ)的文字識(shí)別候補(bǔ)的組合的驗(yàn)證結(jié)果,輸出與適宜的文字列候補(bǔ)對(duì)應(yīng)的文字列識(shí)別結(jié)果。另外,識(shí)別部13在選擇出多個(gè)適宜的文字列候補(bǔ)的情況下,識(shí)別部13計(jì)算與選擇出的多個(gè)適宜的文字列候補(bǔ)對(duì)應(yīng)的各文字識(shí)別候補(bǔ)列的平均相似度,輸出與具有最大平均相似度的文字列候補(bǔ)(最佳的文字列候補(bǔ))對(duì)應(yīng)的文字列識(shí)別結(jié)果。例如,識(shí)別部13 當(dāng)作為適宜的文字列候補(bǔ)選擇出第1文字列候補(bǔ)和第2文字列候補(bǔ)的情況下,比較與第1 文字列候補(bǔ)對(duì)應(yīng)的各文字識(shí)別候補(bǔ)列(文字識(shí)別候補(bǔ)Cll、C21、C31、C41)的平均相似度 ((950+900+900+850) /4 = 900),和與第2文字列候補(bǔ)對(duì)應(yīng)的各文字識(shí)別候補(bǔ)列(文字識(shí)別候補(bǔ) C12、C21、C31、C41)的平均相似度((900+900+900+850)/4 = 887. 5),輸出與第 1 文字列候補(bǔ)(最佳文字列候補(bǔ))對(duì)應(yīng)的文字列識(shí)別結(jié)果。而且,本發(fā)明并不限于在上述第1種實(shí)施方式中說(shuō)明的文字列識(shí)別處理。例如,從多個(gè)適宜的文字列候補(bǔ)中選擇最佳的文字列候補(bǔ)的方法并不限于在上述第1種實(shí)施方式中說(shuō)明的方法。在上述第1種實(shí)施方式中,說(shuō)明了排列驗(yàn)證部15刪除不適宜的文字列候補(bǔ),進(jìn)而文字列驗(yàn)證部16刪除不適宜的文字列候補(bǔ),識(shí)別部13從剩下的1個(gè)以上的適宜文字列候補(bǔ)中選擇出最佳的文字列候補(bǔ)的情況。但是,如下也能夠選擇出最佳的文字列。例如,排列驗(yàn)證部15根據(jù)文字排列驗(yàn)證效果,對(duì)各文字列候補(bǔ)給予文字排列評(píng)價(jià)值,文字列驗(yàn)證部16根據(jù)文字列的驗(yàn)證結(jié)果,對(duì)各文字列候補(bǔ)給予文字列評(píng)價(jià)值,識(shí)別部13根據(jù)各文字列候補(bǔ)的文字排列評(píng)價(jià)值和各文字列候補(bǔ)的文字列評(píng)價(jià)值,還能夠綜合從各文字列候補(bǔ)中選擇出最佳的文字列候補(bǔ)。另外,識(shí)別部13可以根據(jù)由排列驗(yàn)證部15進(jìn)行的文字排列驗(yàn)證以及由文字列驗(yàn)證部16進(jìn)行的文字列驗(yàn)證中的某一方的驗(yàn)證,從各文字列候補(bǔ)中選擇出最佳的文字列候補(bǔ)。即,區(qū)分系統(tǒng)也可以把由排列驗(yàn)證部15進(jìn)行的文字排列驗(yàn)證以及由文字列驗(yàn)證部16 進(jìn)行的文字列驗(yàn)證的雙方的驗(yàn)證不作為必須的構(gòu)成。另外,識(shí)別部13也可以根據(jù)與各文字列候補(bǔ)對(duì)應(yīng)的各文字識(shí)別候補(bǔ)列的相似度合計(jì)值,從各文字列候補(bǔ)中選擇出最佳的文字列候補(bǔ)。另外,識(shí)別部13也可以根據(jù)相似度合計(jì)值、文字排列驗(yàn)證,以及文字列驗(yàn)證中的至少一個(gè),從各文字列候補(bǔ)中選擇出最佳的文字列候補(bǔ)。另外,在上述的第1種實(shí)施方式中,說(shuō)明了在文字列候補(bǔ)的生成(S4)之后,執(zhí)行文字排列驗(yàn)證(S5)、文字列驗(yàn)證(S6)的情況。但是,也可以如下那樣執(zhí)行文字列識(shí)別處理。 例如,可以生成文字列候補(bǔ)以滿(mǎn)足文字排列驗(yàn)證的條件以及文字列驗(yàn)證的條件。另外,在上述第1種實(shí)施方式中,說(shuō)明了文字的下端隱匿的事件中的文字列識(shí)別處理。但是,也可以如下那樣實(shí)現(xiàn)文字的上端、下端、右端,以及左端中的1個(gè)以上的端部隱匿的事件中的文字識(shí)別處理。例如,文字識(shí)別詞典數(shù)據(jù)庫(kù)14存儲(chǔ)文字識(shí)別詞典D1、D21、D22、D23、D24、D31、D32、 D33、D34、. . .、DNl、DN2、DN3、DN4((NX4)-3)個(gè)(N 是自然數(shù))的文字識(shí)別詞典。文字識(shí)別詞典Dl是從沒(méi)有文字缺失的多個(gè)文字中生成的文字識(shí)別詞典。文字識(shí)別詞典D21(l成缺失詞典)是由 20%文字的上端缺失的多個(gè)文字生成的文字識(shí)別詞典。文字識(shí)別詞典D22(l成缺失詞典)是由 20%文字的下端缺失的多個(gè)文字生成的文字識(shí)別詞典。文字識(shí)別詞典D23(l成缺失詞典)是由 20%文字的右端缺失的多個(gè)文字生成的文字識(shí)別詞典。文字識(shí)別詞典DM (1成缺失詞典)是由 20%文字的左端缺失的多個(gè)文字生成的文字識(shí)別詞典。文字識(shí)別詞典D31 (3成缺失詞典)是由21% 40%文字的上端缺失的多個(gè)文字生成的文字識(shí)別詞典。文字識(shí)別詞典D32 (3成缺失詞典)是由21% 40%文字的下端缺失的多個(gè)文字生成的文字識(shí)別詞典。文字識(shí)別詞典D33 (3成缺失詞典)是由21% 40% 文字的右端缺失的多個(gè)文字生成的文字識(shí)別詞典。文字識(shí)別詞典D34 (3成缺失詞典)是由 21% 40%文字的左端缺失的多個(gè)文字生成的文字識(shí)別詞典。識(shí)別部13 根據(jù)文字識(shí)別詞典 D1、D21、D22、D23、D24、D31、D32、D33、D34、. . .、DN1、 DN2、DN3、DN4,選擇出與各文字候補(bǔ)對(duì)應(yīng)的1個(gè)以上的文字識(shí)別候補(bǔ)。排列驗(yàn)證部15根據(jù)各文字候補(bǔ)的上端、下端、右端,以及左端中的1個(gè)以上的端部的檢測(cè)結(jié)果驗(yàn)證各文字候補(bǔ)的排列。根據(jù)上述方法,即使文字的某個(gè)方向隱匿或者不明的情況下,也能夠?qū)崿F(xiàn)高精度的文字列識(shí)別處理。另外,在上述的第1種實(shí)施方式中,說(shuō)明了排列驗(yàn)證部15推斷各文字候補(bǔ)的缺失程度,驗(yàn)證文字列候補(bǔ)的排列,刪除不適宜的文字列候補(bǔ)的情況。進(jìn)而,排列驗(yàn)證部15還能夠在推斷各文字候補(bǔ)的缺失程度的同時(shí),還推斷各文字候補(bǔ)的大小,根據(jù)這些推斷結(jié)果驗(yàn)證文字列候補(bǔ)的排列,刪除不適宜的文字列候補(bǔ)。如上所述,第1種實(shí)施方式的區(qū)分系統(tǒng)在隱匿的文字行的高度和其他的文字行的高度不同的情況下也能夠高精度地識(shí)別文字列,并且在因文字的隱匿而引起的缺失大的情況下也能夠高精度地識(shí)別文字列。另外,第1種實(shí)施方式的區(qū)分系統(tǒng)在文字隱匿程度對(duì)每個(gè)文字不同的情況下,也能夠高精度地識(shí)別文字列。由此,第1種實(shí)施方式的區(qū)分系統(tǒng)能夠高精度地對(duì)區(qū)分對(duì)象物進(jìn)行區(qū)分。如果采用上述的實(shí)施方式,則能夠提供對(duì)缺失的文字的識(shí)別優(yōu)異的文字識(shí)別裝置以及文字識(shí)別方法。另外,如果采用上述至少一種實(shí)施方式,則能夠提供對(duì)缺失的文字識(shí)別優(yōu)異并且在區(qū)分精度上優(yōu)異的區(qū)分裝置以及區(qū)分控制裝置。
(第2種實(shí)施方式)以下,參照
第2種實(shí)施方式。例如,在帶窗封口信函等的帶窗郵件中,表示收件方信息的文字列位于窗口的一端,有時(shí)文字的一部分隱匿而不能看到。這種情況下的收件方信息的讀取是個(gè)難題。作為解決這種課題的方法,例如以下所示的技術(shù)是公知的技術(shù)。(1)使用未隱匿的行推斷隱匿的行的文字的高度,在和樣板匹配時(shí)進(jìn)行補(bǔ)正。另外,不限于郵件的窗口,提出了多種一般一部分缺失的文字的讀取方法,例如, 以下所示的技術(shù)是公知的。(2)從沒(méi)有下線(xiàn)的行推斷除去下線(xiàn)時(shí)缺失的文字的高度,在和樣板匹配時(shí)進(jìn)行補(bǔ)正。(3)推斷在除去帳本的格線(xiàn)時(shí)缺失的文字的高度以及上下位置,在和樣板匹配時(shí)進(jìn)行補(bǔ)正。(4)點(diǎn)狀的缺損部分的復(fù)原方法。(5)在帳本的識(shí)別中與格線(xiàn)重合的部分的復(fù)原方法。但是,上述的方法不能說(shuō)一定能夠有效地解決課題。S卩,上述(1)的方法當(dāng)隱匿的行的高度和未隱匿的行的高度不同的情況下推斷失敗。上述( 的方法當(dāng)有下線(xiàn)的行的高度和沒(méi)有下線(xiàn)行的文字的高度不同的情況下推斷失敗。上述(3)的方法只將已決定的大小的文字作為對(duì)象,不能適用于文字大小不明的對(duì)象。 上述的方法只能適用于缺失微小的情況,如由于窗口而產(chǎn)生的隱匿那樣的缺失大的情況不能適用。上述(5)的方法只能適用于缺失詳細(xì)的區(qū)域的情況,如由于窗口的隱匿那樣缺失大的情況不能適用。圖8表示作為本實(shí)施方式的處理對(duì)象物體的帶窗封口信函的帶窗郵件之一例。該帶窗郵件11在表面上具有玻璃紙等的窗口 12,在該窗口 12內(nèi)作為區(qū)分信息的收件方信息 13用由多個(gè)文字組成的文字列表示(記載)。圖8的例子表示在窗口 12的上端表示的收件方信息13的文字列的一部分隱匿的狀況。圖9是模式化表示適用本實(shí)施方式的文字識(shí)別裝置以及文字識(shí)別方法的區(qū)分裝置的構(gòu)成的圖。如圖9所示,本實(shí)施方式的區(qū)分裝置例如是根據(jù)其收件方信息13區(qū)分處理圖8所示的帶窗郵件11的裝置,由以下部分構(gòu)成郵件供給部21、作為傳輸單元的傳輸路徑22、作為區(qū)分單元的區(qū)分部23、作為讀取單元的讀取部M、作為識(shí)別單元的識(shí)別部25、詞典部沈、 作為隱匿文字列候補(bǔ)檢測(cè)·確認(rèn)單元的隱匿文字列候補(bǔ)檢測(cè)·確認(rèn)部27、作為隱匿文字列高度推斷單元的隱匿文字列高度推斷部觀、作為文字列驗(yàn)證單元的文字列驗(yàn)證部四以及數(shù)據(jù)庫(kù)30。郵件供給部21逐個(gè)提供處理的郵件(例如,圖9所示的帶窗郵件11)。傳輸路徑 22逐個(gè)傳輸由郵件供給部21提供的郵件11。區(qū)分部23根據(jù)識(shí)別部25的識(shí)別結(jié)果將用傳輸路徑22傳輸來(lái)的郵件11按照不同收件方進(jìn)行區(qū)分處理。讀取部M在傳輸路徑22的途中光學(xué)讀取由傳輸路徑22傳輸?shù)泥]件11的窗口 12 所在面的圖像。識(shí)別部25從用讀取部M讀取的圖像中識(shí)別表示收件方信息13的文字列。詞典部沈由多個(gè)文字識(shí)別詞典26i 26n構(gòu)成。文字識(shí)別詞典26i 26N例如由1個(gè)完整文字詞典和每種文字缺損率05^110^,20^,30^,40%)的缺損文字詞典構(gòu)成。 在此,假設(shè)所謂完整文字詞典是指沒(méi)有因隱匿引起的缺損的文字圖案的一般的文字詞典, 所謂缺損文字詞典是指因隱匿左右上下以某一比例消失(缺損)的詞典。隱匿文字列候補(bǔ)檢測(cè) 確認(rèn)部27在文字列的一部分隱匿的狀態(tài)下,檢測(cè)有隱匿的可能性的文字部分作為隱匿文字列區(qū)域候補(bǔ),確認(rèn)該隱匿文字列區(qū)域候補(bǔ)是否是實(shí)際的隱匿文字列區(qū)域。隱匿文字列高度推斷部28對(duì)于用隱匿文字列候補(bǔ)檢測(cè) 確認(rèn)部27檢測(cè)出的隱匿文字列區(qū)域確認(rèn)實(shí)際上是否有文字隱匿,當(dāng)判斷為有文字隱匿的情況下,對(duì)該對(duì)象文字列推斷高度。識(shí)別部25在進(jìn)行文字識(shí)別時(shí),由隱匿文字列候補(bǔ)檢測(cè)·確認(rèn)部27檢測(cè)是否有收件方信息13隱匿的可能性的候補(bǔ),用隱匿文字列高度推斷部觀推斷隱匿的文字列部分的高度,使用與文字列的缺失比例(缺損比例)相當(dāng)?shù)奈淖肿R(shí)別詞典求各個(gè)文字識(shí)別得分。文字列檢測(cè)部四使用從識(shí)別部25得到的文字識(shí)別得分(文字識(shí)別結(jié)果)進(jìn)行和數(shù)據(jù)庫(kù)30內(nèi)的住址數(shù)據(jù)的匹配處理,將其結(jié)果作為最終的識(shí)別結(jié)果向區(qū)分部23輸出。本實(shí)施方式的特征在于,檢測(cè)并確認(rèn)文字列的隱匿候補(bǔ),通過(guò)推斷隱匿文字列的高度知道文字的缺失比例,因此,以下以上述2點(diǎn)為中心進(jìn)行詳細(xì)的說(shuō)明。以下,參照?qǐng)D10以及圖11所示的流程圖說(shuō)明本實(shí)施方式的文字識(shí)別處理的流程。如果輸入由讀取部M讀取的郵件11上的圖像后(Si),隱匿文字列候補(bǔ)檢測(cè)·確認(rèn)部27對(duì)輸入的圖像進(jìn)行窗口 13(窗框)的候補(bǔ)(隱匿文字列區(qū)域候補(bǔ))的檢測(cè)(S2, S3)。在此的窗框候補(bǔ)檢測(cè)的方法使用哪種方法都可以,但例如可以使用對(duì)微分圖像適用哈夫(Hough)變換發(fā)現(xiàn)窗框的4條線(xiàn)段的方法、使用當(dāng)郵件11的表面和窗框的部分有濃度差的情況下,將從濃度2值標(biāo)條中檢測(cè)適當(dāng)大小標(biāo)條的部分作為窗框候補(bǔ)的方法等。當(dāng)檢測(cè)出窗框候補(bǔ)的情況下,一般隱匿文字列(以下,還稱(chēng)為缺損文字列)的近邊處變成圖12所示那樣的狀態(tài)。在圖12中,31表示窗框的上端,32表示在窗框的上端31上文字的一部分缺損(隱匿)的缺損文字列,33表示輪廓跟蹤的狀態(tài)。在窗框的左右上下端上分別進(jìn)行輪廓跟蹤(S4),如果對(duì)各個(gè)方向成分投票,則缺損文字列不存在的端只是相同方向成分連續(xù)。例如,如果將投票方向成分的右方向設(shè)置為 “0”,上方向設(shè)置為“1”,左方向設(shè)置為“2”,下方向設(shè)置為“3”,則當(dāng)從窗框的邊緣內(nèi)部沿著右手方向探索的情況下,在窗框下端,上成分和下成分雖然有一些混合,但結(jié)果是幾乎只投票右成分的“0”。同樣,在窗框的右端上,其結(jié)果是幾乎全部投票上成分,在上端上,其結(jié)果是幾乎全部投票左成分。在此,如圖12所示當(dāng)包含缺損文字列32的情況下,原本應(yīng)該變成主要成分的方向多少混合有相反的方向。由此,判斷為在輪廓跟蹤方向成分中有異常(S5)。當(dāng)有異常的情況下,將該部分判定為缺損文字列連續(xù),作為實(shí)際的對(duì)象區(qū)域(隱匿文字列區(qū)域)(S6)。在S2、S3中當(dāng)未檢測(cè)窗框候補(bǔ)的情況下,或者在S5中在窗框候補(bǔ)的方向成分中沒(méi)有發(fā)現(xiàn)異常的情況下,對(duì)在郵件11中存在的文字列實(shí)施用完整文字詞典進(jìn)行的一般文字識(shí)別(S7)。在本實(shí)施方式中,所謂完整文字詞典如上所述,是指作為沒(méi)有缺損的圖案的一般的文字詞典,所謂缺損詞典是指左右上下消失了某一比例的詞典。該缺損比例例如只要具有在左右上下各自之上隔10%消失的詞典等即可,用樣板匹配進(jìn)行各個(gè)文字識(shí)別而標(biāo)準(zhǔn)化的圖像也可以,用各個(gè)分類(lèi)的缺損圖案進(jìn)行學(xué)習(xí)的特征分類(lèi)群的詞典也可以。
S7中的完整文字詞典中的文字識(shí)別的結(jié)果,如果有文字識(shí)別得分差的文字連續(xù)的部分(S8),則判斷為有缺損文字列連續(xù)的可能性并進(jìn)入S6,判定為缺損文字列連續(xù),作為實(shí)際的對(duì)象區(qū)域(隱匿文字列區(qū)域)。在S8中,如果沒(méi)有文字識(shí)別得分差的部分連續(xù)的狀況,則進(jìn)行一般的收件方信息的識(shí)別處理并結(jié)束。在本例子中,假定檢測(cè)出窗框并繼續(xù)說(shuō)明。當(dāng)檢測(cè)出窗框的情況下,因?yàn)榇翱虿糠值倪吘壸兂珊蠖蔚奶幚淼母蓴_的可能性高,所以只存儲(chǔ)位置并消去外框邊緣部分等情況會(huì)好。在S6中當(dāng)檢測(cè)出缺損文字列區(qū)域的情況下,隱匿文字列高度推斷部觀進(jìn)行以下說(shuō)明的缺損文字列的高度的推斷處理。而且,在本實(shí)施方式中,作為缺損文字詞典用限定使用數(shù)字的情況進(jìn)行說(shuō)明,但也可以是其他的文字詞典。首先,在數(shù)字的缺損文字詞典中,對(duì)各缺損比例的每種重復(fù)實(shí)施文字識(shí)別(S9)。當(dāng)然,也可以對(duì)左右上下全部的候補(bǔ)進(jìn)行識(shí)別,但如前面說(shuō)明的那樣當(dāng)在輪廓跟蹤的方向成分中檢測(cè)出缺損文字列區(qū)域的情況下(與S5的流程對(duì)應(yīng)),因?yàn)橹涝诖翱虻淖笥疑舷露说哪睦锟吹疆惓#灾灰辉谠摲较蛏嫌萌睋p文字詞典進(jìn)行文字識(shí)別就可以。即使是從文字識(shí)別得分的差的文字列連續(xù)這一判斷中檢測(cè)出缺損文字列區(qū)域 (與S8的流程對(duì)應(yīng)),如果有在對(duì)象區(qū)域附近的文字列正確的文字識(shí)別連續(xù)進(jìn)行的部分,因?yàn)槟軌蛲茰y(cè)在該方向上不存在缺損狀態(tài),所以能夠推測(cè)為在和正確的文字識(shí)別連續(xù)的區(qū)域相反一側(cè)上發(fā)生缺損狀態(tài)。由此,和在輪廓跟蹤的方向成分中實(shí)施的一樣,能夠確定優(yōu)先使用缺損文字詞典的方向。對(duì)缺損文字區(qū)域的文字重復(fù)實(shí)施的在各缺損比例下的文字識(shí)別得分暫時(shí)保持,在后段的處理中使用。以下,使用圖13所示那樣的排他部分文字表34進(jìn)行與其登錄內(nèi)容的比較。排他部分文字表34是在動(dòng)作前預(yù)先制作的表,登錄有作為對(duì)象語(yǔ)言的非數(shù)字文字不可能有的數(shù)字缺損圖案。另外,如果以在英語(yǔ)中使用的文字為例子,則圖14A所示那樣的缺損數(shù)字的圖案是作為其他的英語(yǔ)部分文字不可能存在的圖案。即,圖14A例如如果是英語(yǔ)的一般使用文字,則因?yàn)樵搱D形只可能是數(shù)字“8”的下側(cè)缺損了 20%,所以變成排他部分文字。在這種情況下,如圖13所示,由于在排他部分文字表34中預(yù)先登錄有下側(cè)缺損 20%的“8”,因而當(dāng)實(shí)際識(shí)別下側(cè)缺損20%的“8”的情況下,即使只用數(shù)字詞典識(shí)別也肯定可以判斷為是隱匿了 20%的“8”。另外,圖14B例如如果是英語(yǔ)的一般使用文字,則該圖形除了英語(yǔ)“E”的下側(cè)缺損 70%外,因?yàn)橐灿杏⒄Z(yǔ)“F”的下側(cè)缺損70%的可能性,所以不能成為排他部分文字。這樣,當(dāng)用在排他部分文字表34中的比例的缺損文字高分識(shí)別的情況下(SlO), 能夠從識(shí)別詞典的缺損比例中推斷文字列的缺損部分的高度Hl (參照?qǐng)D12) (Sll)。當(dāng)然, 因?yàn)樵谧R(shí)別處理中不存在所謂的100%,所以也可以設(shè)置需要3個(gè)以上用高分來(lái)識(shí)別的部分等、為了提高精度而轉(zhuǎn)移到高度推斷處理的限制。在SlO中當(dāng)不能進(jìn)行文字缺損部分的高度推斷的情況下,在羅列了前面的數(shù)字識(shí)別得分時(shí),核對(duì)是否有以同樣比例連續(xù)取得高分的地方(Si》。因?yàn)閿?shù)字以郵政編碼和門(mén)牌號(hào)等中連續(xù)的居多,所以當(dāng)在同樣比例的缺損文字詞典中連續(xù)出高分那樣的情況可以判斷為實(shí)際上缺損的地方。
在S12的判定中當(dāng)高分連續(xù)的情況下,從識(shí)別詞典的缺損比例中能夠直接推斷文字列的缺損部分的高度Hl (參照?qǐng)D12) (S13)。在S12的判定中當(dāng)高分不連續(xù)的情況下,用文字識(shí)別確認(rèn)在對(duì)象文字列中如同連字符的文字是否存在(S14)。當(dāng)能夠檢測(cè)出如同連字符的文字的情況下,因?yàn)檫B字符一般記載在文字的中間高度上,所以如圖15所示那樣,可以根據(jù)連字符以外的其他文字高度推斷文字列的缺損部分的高度H2(S15)。S卩,圖15的例子因?yàn)槲淖至械纳蟼?cè)缺損,所以能夠推斷從連字符到文字列的下端的高度H3,能夠?qū)⒃摳叨菻3的一倍的位置推斷為文字列的高度H4。而后,能夠從該推斷的文字列的高度H4和缺損的文字的高度H5推斷(H2 = H4-H5)缺損部分的高度H2。這是因?yàn)楦鶕?jù)識(shí)別對(duì)象的語(yǔ)言、連字符推斷高度微妙地變化,所以可以隨時(shí)根據(jù)需要進(jìn)行高度推斷。這里的關(guān)鍵在于可以在連字符的識(shí)別中進(jìn)行缺損部分的高度檢測(cè)。另外,例如,因?yàn)槭占叫畔⒌泥]政編碼和門(mén)牌號(hào)等數(shù)字和連字符的記載大多接近,所以即使未到在前面的Sll和S13中進(jìn)行缺損部分的高度推斷的情況下,通過(guò)增加和連字符的識(shí)別結(jié)果的位置關(guān)系接近這一條件,可以進(jìn)一步無(wú)誤地進(jìn)行高度推斷。這樣,在發(fā)現(xiàn)了連字符文字時(shí)也可以執(zhí)行高度推斷。而且,對(duì)于SlO S15的3種高度推斷處理,可以分別獨(dú)立進(jìn)行,也可以實(shí)施全部并付與優(yōu)先順序,還可以取各推斷結(jié)果的平均值等,重新取得綜合的缺損部分的高度推定值。在S14的判定中,當(dāng)不能檢測(cè)如同連字符的文字的情況下,因?yàn)椴荒芡茢辔淖至械娜睋p部分的高度,所以進(jìn)行一般的收件方信息的識(shí)別處理并結(jié)束(S16)。在Sll或者S13或者S15中,如果推斷出文字列的缺損部分的高度,則接收到該高度的推斷結(jié)果的識(shí)別部25從收到的高度推斷結(jié)果中,確定使用什么缺損比例的缺損文字詞典(S17),從詞典部沈中選擇已確定的缺損文字詞典進(jìn)行對(duì)象文字列的文字識(shí)別處理 (S18)。S卩,從高度推斷結(jié)果中,判斷對(duì)象文字列以原本哪個(gè)高度進(jìn)行文字識(shí)別最佳,如果進(jìn)行了判明,就僅縮小范圍到該缺損情況的文字分類(lèi)來(lái)進(jìn)行文字識(shí)別。在這種情況下,可以預(yù)先具有全部文字分類(lèi)的缺損文字詞典,當(dāng)進(jìn)行樣板匹配等的情況下也可以在知道缺損部分的高度后指定作為樣板使用的范圍來(lái)進(jìn)行文字識(shí)別。接著,文字列驗(yàn)證部四使用在S18中用指定的缺損文字詞典得到的文字識(shí)別結(jié)果,進(jìn)行和數(shù)據(jù)庫(kù)30內(nèi)的住址數(shù)據(jù)的匹配處理(S19),將其結(jié)果作為最終的識(shí)別結(jié)果向區(qū)分部23輸出(S20)。如上所述如果采用上述實(shí)施方式,因?yàn)橥ㄟ^(guò)高度推斷處理能夠高精度地發(fā)現(xiàn)文字列隱匿的部分的高度,所以即使是隱匿的文字列的高度和其他的文字列的高度不同的情況下也能夠有效地進(jìn)行文字識(shí)別,并且即使因隱匿致使文字的缺失大的情況下也能夠有效地進(jìn)行文字識(shí)別,進(jìn)而,即使隱匿程度對(duì)每個(gè)文字不同的情況下也可以進(jìn)行文字識(shí)別,文字列的識(shí)別精度顯著提高。因而,當(dāng)在郵件區(qū)分裝置等的節(jié)省人力的機(jī)器中使用的情況下,節(jié)省效果顯著提高。而且,在上述實(shí)施方式中,說(shuō)明了適用于在根據(jù)收件方信息區(qū)分處理帶窗郵件的區(qū)分裝置的情況,但并不限于此,例如,只要是根據(jù)區(qū)分信息對(duì)鈔票等的有價(jià)證券、小貨物等的投遞物等、顯示用文字列表示區(qū)分目的地的區(qū)分信息的物體進(jìn)行區(qū)分處理的區(qū)分裝置就可以適用。如果采用上述的實(shí)施方式,則即使在隱匿的文字列的高度和其他的文字列的高度不同的情況下也能夠有效地進(jìn)行文字識(shí)別,并且,即使是因隱匿致使文字的缺失大的情況下也能夠有效地進(jìn)行文字識(shí)別,進(jìn)而,能夠提供即使隱匿程度對(duì)每個(gè)文字不同的情況下也可以進(jìn)行文字識(shí)別的文字識(shí)別裝置、文字識(shí)別方法以及區(qū)分裝置。盡管描述了特定的實(shí)施例,這些實(shí)施例僅是通過(guò)舉例的方式呈現(xiàn)的,并不試圖限制本發(fā)明的范圍。實(shí)際上這里描述的新穎的方法和系統(tǒng)可以通過(guò)各種其他形式體現(xiàn)。此外,在不脫離本發(fā)明精神的情況下,可以對(duì)這里描述的方法和系統(tǒng)的形式進(jìn)行各種省略、替換和改變。所附的權(quán)利要求及其等效物試圖覆蓋將落入本發(fā)明的范圍和精神內(nèi)的這種形式和修改。
權(quán)利要求
1.一種文字識(shí)別裝置,包括 檢測(cè)部,從圖像檢測(cè)各文字候補(bǔ);識(shí)別部,基于與多個(gè)不同的文字缺失的程度對(duì)應(yīng)的多個(gè)文字識(shí)別詞典來(lái)識(shí)別各文字候補(bǔ)。
2.根據(jù)權(quán)利要求1所述的文字識(shí)別裝置,其特征在于上述識(shí)別部基于多個(gè)文字識(shí)別詞典選出與各文字候補(bǔ)對(duì)應(yīng)的1個(gè)以上的文字識(shí)別候補(bǔ),組合文字識(shí)別候補(bǔ)生成多個(gè)文字列候補(bǔ),基于文字識(shí)別候補(bǔ)的組合的驗(yàn)證結(jié)果選擇最佳的文字列候補(bǔ),輸出與最佳的文字列候補(bǔ)對(duì)應(yīng)的各文字候補(bǔ)的識(shí)別結(jié)果。
3.根據(jù)權(quán)利要求2所述的文字識(shí)別裝置,其特征在于包括第1驗(yàn)證部,基于存儲(chǔ)有多個(gè)文字列圖案的文字列數(shù)據(jù)庫(kù),驗(yàn)證文字識(shí)別候補(bǔ)的組合, 上述識(shí)別部基于上述第1驗(yàn)證部的驗(yàn)證結(jié)果輸出最佳的文字列候補(bǔ)。
4.根據(jù)權(quán)利要求2所述的文字識(shí)別裝置,其特征在于包括第2驗(yàn)證部,推斷各文字候補(bǔ)的文字缺失的程度,基于各文字候補(bǔ)的推斷缺失程度,驗(yàn)證文字識(shí)別候補(bǔ)的組合,上述識(shí)別部基于上述第2驗(yàn)證部的驗(yàn)證結(jié)果輸出最佳的文字列候補(bǔ)。
5.根據(jù)權(quán)利要求4所述的文字識(shí)別裝置,其特征在于上述第2驗(yàn)證部推斷各文字候補(bǔ)的上端、下端、右端以及左端中的一個(gè)端部的缺失程度。
6.根據(jù)權(quán)利要求1所述的文字識(shí)別裝置,其特征在于上述識(shí)別部對(duì)各文字候補(bǔ)選出 1個(gè)以上的文字識(shí)別候補(bǔ),組合文字識(shí)別候補(bǔ)生成多個(gè)文字列候補(bǔ),基于各文字識(shí)別候補(bǔ)的相似度輸出最佳的文字列候補(bǔ)。
7.—種區(qū)分裝置,包括權(quán)利要求1所述的文字識(shí)別裝置,還包括 區(qū)分部,基于各文字候補(bǔ)的識(shí)別結(jié)果對(duì)區(qū)分對(duì)象物進(jìn)行區(qū)分。
8.—種區(qū)分控制裝置,包括權(quán)利要求1所述的文字識(shí)別裝置,還包括通信部,接收從區(qū)分處理部發(fā)送的圖像,將與各文字候補(bǔ)的識(shí)別結(jié)果對(duì)應(yīng)的區(qū)分信息發(fā)送到上述區(qū)分處理部,所述區(qū)分處理部從區(qū)分對(duì)象物讀取上述圖像并基于上述區(qū)分信息區(qū)分上述區(qū)分對(duì)象物。
9.一種文字識(shí)別方法,包括 從圖像檢測(cè)各文字候補(bǔ)的步驟;基于與多個(gè)不同的文字缺失的程度對(duì)應(yīng)的多個(gè)文字識(shí)別詞典來(lái)識(shí)別各文字候補(bǔ)的步馬聚ο
10.一種文字識(shí)別裝置,識(shí)別將多個(gè)文字成列狀地記載的文字列,所述文字識(shí)別裝置包括隱匿文字列候補(bǔ)檢測(cè)部,在上述文字列的一部分隱匿的狀態(tài)下,檢測(cè)有隱匿的可能性的文字部分作為隱匿文字列區(qū)域候補(bǔ);確認(rèn)部,對(duì)由上述隱匿文字列候補(bǔ)檢測(cè)部檢測(cè)到的隱匿文字列區(qū)域候補(bǔ)確認(rèn)實(shí)際上是否有文字隱匿;識(shí)別部,基于上述確認(rèn)部的確認(rèn)結(jié)果進(jìn)行對(duì)象文字列的識(shí)別處理。
11.根據(jù)權(quán)利要求10所述的文字識(shí)別裝置,其特征在于包括隱匿文字列候補(bǔ)確認(rèn)部,進(jìn)行由上述隱匿文字列候補(bǔ)檢測(cè)部檢測(cè)到的隱匿文字列區(qū)域候補(bǔ)的輪廓跟蹤,通過(guò)確認(rèn)輪廓跟蹤的方向成分的離散,確認(rèn)上述檢測(cè)到的隱匿文字列區(qū)域候補(bǔ)是否是實(shí)際的隱匿文字列區(qū)域。
12.根據(jù)權(quán)利要求10所述的文字識(shí)別裝置,其特征在于包括隱匿文字列高度推斷部,當(dāng)由上述確認(rèn)部判斷為有文字隱匿的情況下,對(duì)上述對(duì)象文字列推斷高度,上述識(shí)別部基于由上述隱匿文字列高度推斷部推斷的文字列的高度進(jìn)行文字列的識(shí)別處理。
13.根據(jù)權(quán)利要求12所述的文字識(shí)別裝置,其特征在于上述隱匿文字列高度推斷部對(duì)對(duì)象文字列使用隱匿用部分文字識(shí)別詞典進(jìn)行文字識(shí)別,當(dāng)能夠連續(xù)得到高分的識(shí)別結(jié)果情況下,推斷文字列的隱匿部分的高度。
14.根據(jù)權(quán)利要求13所述的文字識(shí)別裝置,其特征在于上述隱匿文字列高度推斷部對(duì)使用了上述隱匿用部分文字識(shí)別詞典的文字識(shí)別結(jié)果,通過(guò)對(duì)在對(duì)象語(yǔ)言的其他文字中不可能存在的部分文字預(yù)先進(jìn)行匹配,作為文字列的隱匿高度推斷的線(xiàn)索。
15.根據(jù)權(quán)利要求12所述的文字識(shí)別裝置,其特征在于上述隱匿文字列高度推斷部通過(guò)檢測(cè)文字列中的連字符,推斷文字列的隱匿部分的高度。
16.一種文字識(shí)別方法,識(shí)別將多個(gè)文字成列狀地記載的文字列,所述文字識(shí)別方法包括在上述文字列的一部分被隱匿的狀態(tài)下,檢測(cè)有隱匿的可能性的文字部分作為隱匿文字列區(qū)域候補(bǔ);對(duì)檢測(cè)到的隱匿文字列區(qū)域候補(bǔ)確認(rèn)實(shí)際上是否有文字隱匿;基于確認(rèn)結(jié)果進(jìn)行對(duì)象文字列的識(shí)別處理。
17.—種區(qū)分裝置,基于區(qū)分信息區(qū)分處理由文字列顯示著上述區(qū)分信息的物體,上述區(qū)分信息表示區(qū)分目的地,所述區(qū)分裝置包括傳輸部,傳輸上述物體;讀取部,讀取由上述傳輸部傳輸?shù)纳鲜鑫矬w的圖像;文字識(shí)別部,從由上述讀取部讀取的圖像識(shí)別表示上述區(qū)分信息的文字列;區(qū)分部,基于作為由上述文字識(shí)別部識(shí)別的區(qū)分信息的文字列,區(qū)分上述物體,上述文字識(shí)別部具備隱匿文字列候補(bǔ)檢測(cè)部,在上述文字列的一部分被隱匿的狀態(tài)下,檢測(cè)有隱匿可能性的文字部分作為隱匿文字列區(qū)域候補(bǔ);確認(rèn)部,對(duì)由上述隱匿文字列候補(bǔ)檢測(cè)部檢測(cè)出的隱匿文字列區(qū)域候補(bǔ),確認(rèn)實(shí)際上是否有文字隱匿;識(shí)別部,基于上述確認(rèn)部的確認(rèn)結(jié)果,進(jìn)行對(duì)象文字列的識(shí)別處理。
18.根據(jù)權(quán)利要求17所述的區(qū)分裝置,其特征在于上述物體是帶窗郵件,是表示區(qū)分信息的文字列的一部分隱匿在上述窗口中的郵件。
19.根據(jù)權(quán)利要求17所述的區(qū)分裝置,其特征在于包括隱匿文字列候補(bǔ)確認(rèn)部,進(jìn)行由上述隱匿文字列候補(bǔ)檢測(cè)部檢測(cè)到的隱匿文字列區(qū)域候補(bǔ)的輪廓跟蹤,通過(guò)確認(rèn)輪廓跟蹤的方向成分的離散,確認(rèn)上述檢測(cè)到的隱匿文字列區(qū)域候補(bǔ)是否是實(shí)際的隱匿文字列區(qū)域。
20.根據(jù)權(quán)利要求17所述的區(qū)分裝置,其特征在于包括隱匿文字列高度推斷部,當(dāng)由上述確認(rèn)部判斷為有文字隱匿的情況下,對(duì)上述對(duì)象文字列推斷高度,上述識(shí)別部基于由上述隱匿文字列高度推斷部推斷的文字列的高度,進(jìn)行文字列的識(shí)別處理。
全文摘要
本申請(qǐng)?zhí)峁┪淖肿R(shí)別裝置、區(qū)分裝置、區(qū)分控制裝置,以及文字識(shí)別方法。實(shí)施方式的文字識(shí)別裝置具備檢測(cè)部和識(shí)別部。上述檢測(cè)部從圖像檢測(cè)各文字候補(bǔ)。上述識(shí)別部基于與多個(gè)不同的文字缺失的程度對(duì)應(yīng)的多個(gè)文字識(shí)別詞典來(lái)識(shí)別文字候補(bǔ)。
文檔編號(hào)G06K9/20GK102402682SQ201110274400
公開(kāi)日2012年4月4日 申請(qǐng)日期2011年9月16日 優(yōu)先權(quán)日2010年9月16日
發(fā)明者入江文平, 前田匡哉, 樸英, 浜村倫行 申請(qǐng)人:株式會(huì)社東芝