專利名稱:字符識別裝置、字符識別程序及字符識別方法
技術領域:
本發(fā)明涉及識別諸如圖像數(shù)據(jù)所包含的字符的字符識別裝置、字符識別程序、及 字符識別方法。
背景技術:
和英語等相比,日文、中文的字符數(shù)非常多,各自的僅第一標準漢字就有3000字 以上,加上第2標準漢字則有6000字以上。因此,要識別日文或中文等的字符,在各自的字 符識別處理中需要與3000-6000以上的字符進行核對的處理。其結果,對CPU成為負荷很重 的處理,特別是在像便攜式設備那樣的簡陋的CPU環(huán)境中,處理時間過長成為嚴重的問題。另外,作為字符識別的對象,諸如存在名片等記載內容某種程度上被固定的印刷 媒體。作為讀取這樣的字符印刷媒體的字符的裝置,提出了識別名片字符的裝置(參照特 許文獻1 3)。特許文獻1的名片識別裝置,讓用戶用筆指定識別圖像的范圍,然后指定將該范 圍的識別字符登錄到哪個屬性(姓名、公司名、地址等)中。特許文獻2的字符識別裝置,將字符識別所需的區(qū)域作為模板事先登錄多個,在 選擇了模板后,識別由模板確定的區(qū)域內的字符。特許文獻3的字符識別裝置,是通過鍵盤指定識別對象的區(qū)域,對該對象區(qū)域來 識別字符。哪個裝置都不是一次處理整個名片,而是僅處理指定了區(qū)域的分類部分。因此,對 用戶希望的分類部分,可以快速地進行識別處理。也就是說,識別處理所進行的范圍被壓縮 在了用戶所希望的分類中,所以可以快速進行識別處理,減輕對CPU施加的負荷。但是,這種以往的技術通過壓縮字符識別的范圍而縮短了識別處理所需的時間, 但對于該壓縮后的范圍內的字符識別處理本身,并沒有縮短時間。另外,上述這種以往的技術中,有操作費時、繁瑣的缺點。具體來說,上述以往的技 術,讓用戶每張名片地指定被字符識別的范圍(或模板),需要設定使該范圍內的字符對應 哪個分類。因此,要輸入的名片數(shù)越多,越要求用戶多次進行繁瑣的操作。另一方面,還提出一種名片OCR處理系統(tǒng),將名片從終端裝置作為圖像數(shù)據(jù)讀入, 讀入所得的圖像數(shù)據(jù)通過通信網(wǎng)絡發(fā)送到服務器,由服務器進行字符識別,將識別結果再 從服務器通過通信網(wǎng)絡發(fā)送到終端裝置(參照特許文獻4)。根據(jù)這種方法,即使終端裝置的CPU簡陋,只要服務器的CPU處理能力強,也可以 縮短識別處理時間。但是,這種使用通信網(wǎng)絡的方法,需要通信時間。通信時間隨著網(wǎng)絡的擁堵程度而 為長時間。另外,由于必須進行通信,所以像手機那樣進行無線通信的便攜終端,還產(chǎn)生在 在地下等電波到達不了的場所無法使用的問題。特許文獻特許文獻1特開平10-55413號公報特許文獻2特開平2001-202475號公報
特許文獻3特開平2-240787號公報特許文獻4特開2003-296353號公報
發(fā)明內容
鑒于以上問題,本發(fā)明的目的在于,提供字符識別裝置、字符識別程序及字符識別 方法,對包含字符的圖像數(shù)據(jù),用簡便的操作實現(xiàn)高速的識別字符,并提高用戶滿意度。本發(fā)明提供一種字符識別裝置,具有存儲用于字符識別的匹配數(shù)據(jù)(matching data)的存儲部件,獲取圖像數(shù)據(jù)的圖像數(shù)據(jù)獲取部件,根據(jù)所述匹配數(shù)據(jù),識別所述圖像 數(shù)據(jù)中的字符的字符識別部件,其特征在于,所述匹配數(shù)據(jù)可區(qū)分地構成預定的有關第1 識別用字符的第1識別用匹配數(shù)據(jù);以及包含所述第1識別用字符以外的字符的、字符數(shù)比 該第1識別用字符多的關于第2識別用字符的第2識別用匹配數(shù)據(jù),所述字符識別部件執(zhí) 行第1字符識別處理,對所述圖像數(shù)據(jù)通過所述第1識別用匹配數(shù)據(jù)進行字符識別;再識 別要否判別處理,判別該第1字符識別處理的結果是否符合再識別的條件;以及第2字符識 別處理,對通過該再識別要否判別處理判別為需要再識別的再識別對象,通過所述第2識 別用匹配數(shù)據(jù)進行字符識別。所述匹配數(shù)據(jù)由表示字符特征的特征數(shù)據(jù)等構成,可由用于字符識別的匹配的數(shù) 據(jù)構成。所述存儲部件可由硬盤、非易失性存儲器等存儲數(shù)據(jù)的部件構成。所述圖像數(shù)據(jù)可以是彩色圖像、灰度圖像、二值黑白圖像等適當?shù)膱D像數(shù)據(jù)。所述圖像數(shù)據(jù)獲取部件是指諸如CCD相機或CMOS相機等攝像部件,或者指從該攝 像部件接受用這些攝像部件攝取的字符串圖像數(shù)據(jù)的USB (Universal Serial Bus:通用串 行總線)、LAN (Local Area Network 局域網(wǎng))等通信接口,可由能獲取圖像數(shù)據(jù)的適當?shù)?部件構成。所述字符識別部件可以是指,例如,從圖像數(shù)據(jù)中的字符圖像提取特征數(shù)據(jù),將該 特征數(shù)據(jù)和匹配數(shù)據(jù)的特征數(shù)據(jù)進行匹配,并識別是哪個字符的部件。所述第1識別用字符是指,例如字母數(shù)字、判別分類的字符,以及這些字符的多個 字符等事先確定的適當?shù)淖址K龅?識別用字符是指,例如平假名、片假名、漢字,以及這些字符的多個字符 等事先確定的適當?shù)淖址K鲎址R別裝置是指由具有進行信息處理的CPU等信息處理單元、進行信息 存儲的存儲器等信息存儲單元、與外部裝置連接的連接接頭等接口單元的半導體芯片 等裝置構成,或者由具有攝像部件、控制部件、存儲部件的手機、PDA (Personal Digital Assistant 個人數(shù)碼助理(掌上電腦))、個人電腦等信息處理終端構成,及類似的適當?shù)?裝置構成。依據(jù)本發(fā)明,可以對圖像數(shù)據(jù)用簡便的操作來實現(xiàn)快速的字符識別,提高用戶的 滿意度作為本發(fā)明的形態(tài),所述字符識別部件執(zhí)行對所述圖像數(shù)據(jù)內的字符集的分類進 行判別的分類判別處理,所述第1識別用匹配數(shù)據(jù)包含了用于所述分類判別的分類判別用字符。
所述分類判別字符,可以由諸如“E_Mail”、“URL”、“TEL”、“FAX”、“郵政編碼”,以及 這些字符的多個字符中所使用的字符等用于分類判別的字符來構成。根據(jù)該形態(tài),在第1字符識別處理時也可以執(zhí)行分類判別。作為本發(fā)明的形態(tài),所述第1識別用匹配數(shù)據(jù),對于在所述分類判別用字符中被 分類為二個以上的部首的結合字符,包含了將該結合分離成不同要素的部首字符。所述結合字符可以設為,在字符串方向為左右時,由偏和旁組成的字符,或者在字 符方向為上下時,由字頭和字身組成。具體地說,例如“話”、“住”、“所”等。所述部首字符可以設為,在字符方向為左右時,所述結合字符的偏或旁所對應的 字符,或者在字符方向為上下時,所述結合字符的字頭或字身所對應的字符,具體地說,舉 例“言”和“舌”、“ ^ ”和“主”、“戸”和“斤”等。由此,即使一字符的結合字符被誤識別為兩字符的部首字符,在該誤識別的狀態(tài) 下,也能正確判別分類。詳細來說,比如一個結合字符“話”被識別成“言”和“舌”,即使字 符串被識別成“電言舌”時,仍然可以識別為“電話”的分類。作為本發(fā)明的形態(tài),所述字符識別部件在所述分類判別處理中被判別了分類的字 符集內判別是否包含不該被該分類使用的錯認字符,并在包含了錯認字符時執(zhí)行將該錯認 字符修正為分類所使用的字符的修正處理。由此,例如,將用“電話號碼”的分類而識別為字母“Z”的字符可以修正為數(shù)字的 “ 2 ”,從而可以高效地提高識別精度。作為本發(fā)明的形態(tài),所述修正處理通過在包含所述錯認字符時,僅將分類所使用 的字符作為識別對象再次執(zhí)行字符識別來進行修正。由此,由于可以僅用匹配數(shù)據(jù)中分類所使用的字符數(shù)據(jù)進行字符識別,因此可以 高速、高精度地進行字符識別。作為本發(fā)明的形態(tài),所述第1字符識別處理從可靠性匹配可靠性較高的字符中求 得多個字符候選并采用匹配可靠性最高的字符,所述修正處理在包含所述錯認字符時,將 其修正為在該錯認字符的字符候選中的、該分類所使用的字符中匹配可靠性最高的字符。由此,可以不用再次使用匹配數(shù)據(jù)進行字符識別而修正為正確的字符,可以高速、 高精度地完成字符識別。本發(fā)明可以是字符識別程序,在存儲部件中存儲匹配數(shù)據(jù),所述匹配數(shù)據(jù)可區(qū)分 地構成預定的有關第1識別用字符的第1識別用匹配數(shù)據(jù);以及包含所述第1識別用字符 以外的字符的、字符數(shù)比該第1識別用字符多的有關第2識別用字符的第2識別用匹配數(shù) 據(jù),使計算機執(zhí)行圖像數(shù)據(jù)獲取步驟,通過圖像數(shù)據(jù)獲取部件獲取圖像數(shù)據(jù);第1字符識 別步驟,通過所述第1識別用匹配數(shù)據(jù),由字符識別部件對所述圖像數(shù)據(jù)用字符執(zhí)行字符 識別;再識別要否判別步驟,由所述字符識別部件判別該第1字符識別處理的結果是否符 合再識別的條件;以及第2字符識別步驟,對通過該再識別要否判別處理判定為需要再識 別的再識別對象,通過所述第2識別用匹配數(shù)據(jù),由所述字符識別部件執(zhí)行字符識別。所述字符識別程序,可以存儲在CD (Compact Disk)、DVD (Digital VersatileDisk)、軟盤、內存、芯片、硬盤等適當?shù)拇鎯γ襟w中。依據(jù)本發(fā)明,在電腦上安裝字符識別程序后,可以對圖像數(shù)據(jù)用簡便的操作實現(xiàn) 高速的字符識別。
本發(fā)明可以是字符識別方法,在存儲部件中存儲匹配數(shù)據(jù),所述匹配數(shù)據(jù)可區(qū)分 地構成預定的有關第1識別用字符的第1識別用匹配數(shù)據(jù);以及包含所述第1識別用字符 以外的字符的、字符數(shù)比該第1識別用字符多的有關第2識別用字符的第2識別用匹配數(shù) 據(jù),所述字符識別方法執(zhí)行圖像數(shù)據(jù)獲取步驟,通過圖像數(shù)據(jù)獲取部件獲取圖像數(shù)據(jù);第 1字符識別步驟,通過所述第1識別用匹配數(shù)據(jù),由字符識別部件對所述圖像數(shù)據(jù)用字符執(zhí) 行字符識別;再識別要否判別步驟,由所述字符識別部件判別該第1字符識別處理的結果 是否符合再識別的條件;以及第2字符識別步驟,對通過該再識別要否判別處理判定為需 要再識別的再識別對象,通過所述第2識別用匹配數(shù)據(jù),由所述字符識別部件執(zhí)行字符識 別。由此,可以對圖像數(shù)據(jù)用簡便的操作進行高速的字符識別。根據(jù)本發(fā)明,提供字符識別裝置、字符識別程序及字符識別方法,對拍攝的名片圖 像等圖像數(shù)據(jù),用簡便的操作實現(xiàn)高速的字符識別,可以提高用戶的滿意度。
圖1是便攜終端的立體圖。
圖2是表示便攜終端結構的框圖。圖3的(A) (B)是說明詞典數(shù)據(jù)的結構的說明圖。圖4是利用字符識別程序的字符識別處理的流程圖。圖5的(A) (C)是進行字符識別的攝影圖像和識別字符的說明圖。符號的說明1...便攜終端、3...圖像輸入單元、11. . . CPU、13. . . RAM,23...字符識別程序、
24. · ·比對詞典數(shù)據(jù)、24a. .第1識別用字母數(shù)字字符單元、24b. .第1識別用分類字符單 元、24c...第2識別用字符單元
具體實施例方式用以下的圖形說明本發(fā)明的一實施形態(tài)。圖1表示便攜終端1的立體圖,圖2表示便攜終端1的結構框圖,圖3表示詞典數(shù) 據(jù)的結構圖。如圖1所示,便攜終端1設有圖像輸入單元3、操作單元5、以及畫面顯示單元7。 圖像輸入單元3是拍攝圖像的數(shù)碼相機,操作單元5是按鍵操作的按鈕,畫面顯示單元7是 顯示圖像的液晶顯示屏或有機EL(電致發(fā)光)顯示器。如圖2所示,便攜終端1除了圖像輸入單元3、操作單元5、畫面顯示單元7,還連接 到總線16來設有CPU11、R0M12及RAMI3 圖像輸入單元3為CXD相機或CMOS相機等數(shù)碼相機,連接到總線16。圖像輸入單 元3拍攝所得的圖像作為數(shù)字圖像數(shù)據(jù)被發(fā)送到CPU11。該數(shù)字圖像數(shù)據(jù)也可以最終被保 存在另外的存儲裝置(非易失性存儲器等)中。再有,圖像輸入單元3從CPUll接收拍攝 信號而開始拍攝。操作單元5連接到總線16。該操作單元5將用戶的按鍵操作信號通過總線16發(fā) 送到CPUl 1。
畫面顯示單元7具有顯示操作畫面的操作畫面顯示單元7a的功能,以及顯示字符 識別結果的識別結果顯示單元7b的功能。該操作畫面顯示單元7連接到總線16。從CPUll 傳送來圖像數(shù)據(jù)后,將該圖像數(shù)據(jù)的圖像顯示在操作畫面顯示單元7a或識別結果顯示單 元7b上。CPUll是依據(jù)R0M12中存儲的程序,用RAM13作為臨時存儲區(qū)域來進行各種動作的 處理器,具有控制各個部分的控制功能21和字符識別功能22。該字符識別處理功能22包含字符串提取處理單元31、字符提取處理單元32、字符 識別處理單元33、識別可靠性判定處理單元34,分類判別處理單元35、及識別結果修正處 理單元36。字符串提取處理單元31執(zhí)行從圖像數(shù)據(jù)中提取字符串的處理。該字符串的提取 采用適當?shù)姆椒▉韴?zhí)行,例如,將圖像數(shù)據(jù)兩值化后獲取投影數(shù)據(jù),從該投影數(shù)據(jù)中區(qū)分字 符串和空白等。具體來說,對于名片等橫向書寫字符,由每行像素的黑色像素數(shù)量算出上下 方向的直方圖,超過規(guī)定數(shù)以上的黑像素的行所持續(xù)的范圍定為字符串,或者,對于明信片 的收件人等縱向書寫字符,由每列像素的黑色像素數(shù)量算出左右方向的直方圖,超過規(guī)定 數(shù)以上的黑像素的列所持續(xù)的范圍定為字符串等適當?shù)姆椒▉韴?zhí)行。字符提取處理單元32執(zhí)行從所述字符串提取字符的處理。該字符的提取,對于 橫向書寫字符,由每列像素的黑色像素數(shù)量算出左右方向的直方圖,超過規(guī)定數(shù)以上的黑 像素所持續(xù)的范圍定為一字符,或者,對于縱向書寫字符,由每行像素的黑色像素數(shù)量算出 上下方向的直方圖,超過規(guī)定數(shù)以上的黑像素所持續(xù)的范圍定為一字符等適當?shù)姆椒▉韴?zhí) 行。字符識別處理部33通過使用匹配用詞典數(shù)據(jù)24的匹配信息來判別與哪個字符的 匹配信息一致或近似,進行字符識別處理,并且執(zhí)行求匹配可靠性的處理。在識別該字符的 處理中,有包括僅高速地識別以字母數(shù)字為主的特定字符的特定字符識別處理和識別所有 字符的全文字符識別處理。識別可靠性判定處理單元34執(zhí)行判定由字符識別處理單元33求得的匹配可靠性 (識別可靠性)是否超過規(guī)定的閾值的處理。分類判別處理35執(zhí)行用分類判別用詞典數(shù)據(jù)25判別字符串屬于哪個分類的處理。如果在字符串中有在該分類中不被使用的字符,則識別結果修正處理單元36執(zhí) 行將該字符修正為在分類中被使用的字符的處理。R0M12存儲字符識別程序23、比對詞典數(shù)據(jù)24、分類判別用詞典數(shù)據(jù)25。如圖3(A)所示,匹配用詞典數(shù)據(jù)24由字符代碼、匹配信息、以及對象分類構成。字符代碼為諸如Shift-JIS等適當方式的字符代碼。匹配信息中各個字符地存儲了字符特征數(shù)據(jù)。對象分類對一個字符登錄多個種類。具體來說,作為對象分類,登錄“E-Mail”、 “URL”、“ TEL”、“FAX”、“ 郵政編碼,,等。該匹配用詞典數(shù)據(jù)24所存儲的數(shù)據(jù),可區(qū)分地存儲在第1識別用字母數(shù)字字符單 元24a、第1識別用分類字符單元24b、以及第2識別使用的字符單元24c中。第1識別用字母數(shù)字字符單元24a主要由字母、數(shù)字、符號等歐美類字符組成。
第1識別用分類字符單元24b由用于分類識別的字符組成,即由作為匹配用詞典 數(shù)據(jù)24的對象分類登錄的“E-Mail”、“URL”、“TEL”、“FAX”、“郵政編碼”中的任意一個使用 的字符組成。具體來說,包括對象分類的關鍵字的“ ^ ”、“-”、“ A ”、“ * ”、“ Λ ”、“ ”、“ ” ”、“電”、 “話”、“ 7 ”、“ T ”、“ ? ”、“夕”、“ ^ ”、“郵”、“便”、“番”、“號”等字符。另外,對于這些字符中的
“話”、“便”等結合字符,也包括將其偏旁作為一字符的“言”、“舌”、”、“更”等部首字符。從結合字符分離的部首字符,最好至少在要識別的字符串方向上,部首字符并列 成結合字符。所謂字符串方向可以設為,字符是縱方向排列時為縱方向,字符是橫方向排列 時為橫方向等字符排列的適當?shù)姆较?。?識別用字符單元24c,由既不在第1識別用字母數(shù)字字符單元24a,也不在第 1識別用分類字符單元24b中的字符(主要是日語字符)構成。第2識別用字符單元24c不包含第1識別用分類字符單元24b,但第2識別用字符 單元24c的一部分可以作為第1識別用分類字符單元24b。如圖3的(B)所示,分類判別用詞典數(shù)據(jù)25由分類不同的多個文件構成,在各個 文件中,存儲著作為該該分類進行判別的字符串。在字符串中,將登錄了“電話”和“電言 舌”等的、結合字符也作為了部首字符串來存儲。分類判別用詞典數(shù)據(jù)25中存儲的字符串 也可以設為字符代碼的羅列。RAM13臨時存儲CPUll進行各種控制和演算時使用的數(shù)據(jù),同時在圖像存儲器14 中存儲字符串圖像等圖像。再有,便攜終端1中設有進行無線通信的通信天線、輸出聲音的揚聲器、以及采集 聲音的話筒等。由此,可以作為手機來使用。如圖2的假想線所示,CPUll和R0M12也可以裝載在一個芯片15內而作為電子零 件來構成。此時,如果在便攜終端1中裝備了芯片15,就可以簡單地追加字符識別功能。圖4是便攜終端1的CPUll根據(jù)字符識別程序23執(zhí)行的字符識別處理的流程圖, 圖5是進行字符識別的攝影圖像和識別字符的說明圖。首先,作為事前準備,CPUll根據(jù)用戶的操作輸入而被選擇名片讀取模式等字符識 別處理時,通過圖像輸入單元3成為可進行圖像拍攝的狀態(tài),在畫面顯示單元7上顯示圖5 的(A)所示的操作畫面顯示單元7a。該操作畫面顯示單元7包含識別畫面顯示單元71,表示是進行字符識別的畫面; 預覽圖像顯示單元72,動畫顯示圖像輸入單元3 (相機)拍攝的預覽圖像;返回按鈕73,用 于返回到前畫面;識別按鈕74,用于開始識別處理;以及子菜單按鈕75,用于顯示子菜單。用戶選擇識別按鈕74后,CPUll利用圖像輸入單元3執(zhí)行圖像拍攝,從而獲取字 符圖像(步驟Si)。CPUll利用字符串提取處理單元31執(zhí)行字符串提取處理,從字符圖像中提取‘字 符串(步驟S2)。此時,獲取表示公司名部分的字符串、表示姓名部分的字符串、表示地址部 分的字符串等多個字符串。CPUll將在變量‘i’中代入‘0’而進行初始化(步驟S3),對第i提取的字符串 由字符識別處理單元33執(zhí)行第1字符識別處理(步驟S4)。該第1字符識別處理中,對由 字符提取處理單元32從字符串中提取出的各個字符,僅用匹配用詞典數(shù)據(jù)24中的第1識別用字母數(shù)字字符單元24a和第1識別用分類字符單元24b,執(zhí)行字符識別。再有,字符提取處理單元32所進行的字符提取,相當于提取字符之間的分界的處 理。例如對字符串圖像,字符部分進行兩值化處理以使其成為黑色,在字符串垂直方向將黑 色像素進行投影處理,該投影數(shù)據(jù)的間斷處作為字符和字符之間的分界的候選。第1識別用字母數(shù)字字符單元24a由字母數(shù)字為中心而構成,第1識別用分類字 符單元24b由用于分類判別的字符為中心而構成,所以與匹配用詞典數(shù)據(jù)24的所有字符數(shù) 相比,數(shù)量非常少。因此,第1字符識別處理比起后面所說明的第2字符識別處理,非常高 速地完成。CPUll通過識別可靠性判定處理單元34來判定第1識別處理的匹配可靠性(步 驟S5)。這里,匹配可靠性的判定,例如確認各個字符的匹配可靠性,對匹配可靠性最低的 字符,如果該匹配可靠性在作為重新識別條件的閾值以上時,則將字符串的匹配可靠性設 為0K,如果不是如此,則設為NG。以此類推,求字符串中各個字符的匹配可靠性的平均值, 如果該平均值在重新識別條件閾值以上,則將字符串的匹配可靠性設為0K,如果不是如此, 則可以設為NG。再有,判定該匹配可靠性時,對各個字符,可以將多個字符候選按匹配可靠性的從 高到低的順序存儲規(guī)定個數(shù)。CPUll在匹配可靠性的判定為OK時(步驟S6 “是”),將處理推進到步驟S8。
如果匹配可靠性的判定為NG(步驟S6 “否”),則CPUll對第i提取的字符串,通 過字符識別處理單元33執(zhí)行第2字符識別處理(步驟S7)。在該第2字符識別處理中,使 用匹配用詞典數(shù)據(jù)24的所有數(shù)據(jù)進行字符識別。再有,也可以僅利用第2識別用字符單元24c進行字符識別,還包括第1字符識別 處理中的匹配可靠性而將匹配可靠性最高的字符作為識別出的字符。另外,在該第2字符識別處理中,從字符串提取字符時,為了不將結合字符錯認為 多個部首字符,也可以研究字符的邊界候選,比第1字符識別處理高精準地分離出一字符。 這種情況下,也可以識別一字符的長度,以該字符長度為單位來識別邊界。該字符長度是指 在字符串方向上一字符的長度,例如,可以設為一字符中的字符串方向上的像素數(shù)。由此, 可以進一步提高字符的識別精度。CPUll在變量‘i,上加‘1,(步驟S8),返回到步驟S4重復處理,直到i達到提取 的字符串數(shù)為止(步驟S9:“是”),?!甶,達到提取的字符串數(shù)時(步驟S9 “否”),CPUll在變量‘i,中代入‘0,進行 初始化(步驟S10),對第i提取字符串,通過分類判別處理單元35執(zhí)行分類判別處理(步 驟 S11)。該分類判別處理,通過判別步驟S4、S7識別的字符的排列和分類判別用詞典數(shù)據(jù) 25中存儲的各個分類的字符的排列是否一致來進行。如果一致(如果匹配可靠性比規(guī)定的 閾值高),則判定是該分類。CPUll通過識別結果修正處理單元36執(zhí)行識別結果修正處理(步驟S12)。該識 別結果修正處理,判別在第i提取的字符串中,是否包含在步驟Sl 1判別出的分類中不使用 的字符,如果包含,則進行修正。進行該修正的識別結果修正處理單元36,根據(jù)步驟S5中存儲的多個字符候選的匹配可靠性,用該分類中使用的字符中匹配可靠性最高的字符進行修正。如果該分類中使 用的字符中沒有匹配可靠性較高的字符,則僅以該分類中使用的字符為對象再次進行字符 識別處理,修正為識別出的字符。再有,該修正可以通過僅使用匹配用詞典數(shù)據(jù)24中該分類的字符,再次進行字符 識別等適當?shù)姆椒▉磉M行。CPUll將變量‘i,加‘1,(步驟S13),返回步驟Sll重復處理,直到‘i,達到提取 的字符串數(shù)為止(步驟S14 “是”),。如果‘i’達到提取的字符串數(shù)(步驟S14 “否”),則 CPUll將如圖5的(B)所示的識別結果顯示單元7b顯示在畫面顯示單元7上,結束處理。通過該字符識別處理,如果是圖5所示的例子,則被如下處理。首先,通過字符串提取處理(步驟S2),如圖5的⑶所示,識別⑴ (9)的各個 字符串。通過對該(1) (9)的各個字符串順序地執(zhí)行第1字符識別處理(步驟S4),可以 識別能夠用第1識別用字母數(shù)字字符單元24a和第1識別用分類字符單元24b識別的分類 字符。也就是說,可以識別⑷的郵政編碼、(6)的電話號碼、(7)的FAX、(8)的E-Mail、及 (9)的 URL。
此時,由于在第1識別用分類字符單元24b中,也登錄了將結合字符分離為部首的 部首字符,如圖5的(C)所示,即使在將結合字符的“話”分離成“言”和“舌而分出了字符 的情況下,仍照樣作為“言”和“舌”來識別。由于圖5(B)的⑴、⑵、(3)、(5)的匹配可靠性較低,所以執(zhí)行第2字符識別處 理(步驟S7),使用全部字符進行字符識別。由此,對于圖5(B)的(1)、(2)、(3)、(5)也可 進行字符識別。之后,通過分類判別處理(步驟S11),可以判別各個字符串的分類。在該分類判別 時,包含像“電話”這樣的結合字符的分類,由于像“電言舌”這樣結合字符變?yōu)椴渴鬃址?字符串也登錄在分類判別用詞典數(shù)據(jù)25中,所以可以高精度且容易地識別正確的分類。也就是說,假如需要正確地識別結合字符,則為了提取字符時不要作為2個字符 而需要研究字符的分界候選的處理,從而計算量增多。但是,不進行這樣的處理,由于就作 為2字符進行識別而判別分類,所以字符的分界只有一種,從而可以高速處理。處理分界的 時間的消減量遠大于因將結合字符識別為部首字符的集合的比較對象的增加所造成的時 間增加量,因而可以縮短整體的處理時間。而且,通過識別結果修正處理(步驟S12)對判別出的分類的字符串,修正為排除 了在該分類中不使用的字符的識別,從而可以進行精度高的字符識別。具體地說,例如,圖5的(B)的(6)的“電話(075) 1234-5678”為分類是“TEL”的 字符串。假設在第1字符識別處理中將其錯認為“電話(075) 1Ζ34-5678”,由于“Ζ”不是 分類“TEL”中使用的字符,對其進行修正處理,修正為在“TEL”分類中使用的“2”。由此,不 僅提高識別精度,并且可以抑制輸出使用戶有不諧調感覺的識別結果。通過以上的結構和動作,可以對圖像數(shù)據(jù)通過簡便的操作實現(xiàn)高速的識別字符, 可以提高用戶的滿意度。執(zhí)行了受到限定的字符的第1字符識別處理后,由于僅對匹配可靠性比閾值低的 字符串執(zhí)行第2字符識別處理,所以可以減輕演算處理的負荷,即使像日語、中文那樣字符數(shù)很多的語言,也可以作為整體而高速地進行字符識別。特別地,即使是簡陋的CPU,也可以 極高速地進行字符識別。詳細來說,在第1字符識別處理中,僅使用英文、數(shù)字、符號等歐美類字符(約100 字)作為第ι識別用字母數(shù)字字符單元24a,和更少的第1識別用分類字符單元24b,所以 比進行全字符的核對下的情況能夠快數(shù)倍以上高速地進行處理。另外在讀取名片時,表示“E-Mail”、“URL”、“TEL”、“FAX”、“郵政編碼”的字符串一 般由英文、數(shù)字、符號等歐美類字符組成。其中,特別是“E-Mail”、“URL”,與“姓名”、“公司 名”等表示其他信息的字符串相比,多為長字符串。因此,一般在名片中英文、數(shù)字、符號等 歐美類字符所占比例較大。最初僅對比例較大的英文、數(shù)字、符號等歐美類字符執(zhí)行簡單的 第1字符識別處理,可以確定表示由這些字符組成的“E-Mail”、“URL”、“TEL”、“FAX”、“郵政 編碼”的字符串。然后,僅對除此以外的字符串,執(zhí)行以日語或中文等為對象的重要的第2 字符識別處理,其結果,整體上可以提高名片讀取的處理速度。另外,在第1字符識別處理中,通過第1識別用分類字符單元24b,表示分類的關 鍵字的字符也作為對象,所以在第1字符識別處理中就可以準確地識別表示“E-Mail”、 “ URL ”、“ TEL ”、“ FAX ”、“郵政編碼,,的字符串。詳細地說,作為表示“E-Mail ”、“URL”、“TEL”、“FAX”、“郵政編碼”等分類的關鍵字, 有時在名片中也包含像“ 乂,,“-,,“>,,“‘于、,,“ A,,…“夕,,那樣的歐美類以外的字符。比 如,“ 乂一義abc@氺氺氺氺· Co. jp,,、“ 水一厶《一夕;http://www.co. ip,,就是如此。因此,假如在第1字符識別處理時,如果沒有第1識別用分類字符單元24b的字 符,則識別時的匹配可靠性變差,發(fā)生最初無法確定表示“E-Mail”、“URL”、“TEL”、“FAX”、 “郵政編碼”的字符串。對此,通過使用第1識別用分類字符單元24b,可以解決該問題。另外,可以削減研究字符的分界的必要性,并高速地進行處理。具體來說,對由偏 旁組成的結合字符“話”,要正確地識別,一般地必須進行研究分界的處理,以避免分別識別 成兩個分離出來的部首字符“言”和“舌”。但英文、數(shù)字、符號等歐美類字符沒有這樣的結 合字符,所以不用研究分界。盡管為了識別“E-Mai 1,,、“URL,,、“ TEL,,、“FAX,,、“郵政編碼,,這 樣的分類字符,但因偶爾混入“電話”等結合字符,所以若對所有字符執(zhí)行分界研究處理,處 理時間變長。對此,在第1字符識別處理中,由于還登錄將結合字符分離成部首的部首字符,因 而不必研究字符的分界,可以高速地進行處理。特別地,包含結合字符的情況,例如受限于“電話”、“郵政編碼”的顯示等表示分類 的顯示部分,不包括分類的內容信息(實際的電話號碼和郵政編碼)。因此,即使該分類的 顯示部分識別成“電言舌”,只要能知道是“電話”分類即可。利用該特性,還登錄結合字符 分離出的部首字符并進行識別,結合字符被識別成部首字符并不會產(chǎn)生弊害(例如即使識 別成“電言舌”,并不是登錄字符“電言舌”),從而可以高速地進行處理。另外,對識別了分類的字符串,可以執(zhí)行修正處理,所以提高了識別精度,并且可 以抑制輸出使用戶感覺不諧調的識別結果。另外,由字符串提取處理單元31提取字符串,直至用分類判別處理單元35判別分 類,所以可以削減用戶通過操作來指定字符識別區(qū)域的時間,和選擇操作所指定的區(qū)域的 分類的時間,可以提高操作的便利性。
再有,字符識別程序23存儲在連接到因特網(wǎng)等電通信線路的服務器的存儲部件 中,可通過電通信線路下載,或者也可以是通過電通信線路作為ASP(AppliCati0n Service Provider 應用服務提供商)的服務來使用的結構。這種情況下通信負荷加大,但可以減輕 服務器演算處理的負荷。在本發(fā)明的結構和上述實施形態(tài)的對應中,本發(fā)明的字符識別裝置及計算機,對應實施形態(tài)的便攜終端1,以下類似,圖像數(shù)據(jù)獲取部件,對應圖像輸入單元3,字符識別部件,對應CPUl 1,存儲部件,對應R0M12,匹配數(shù)據(jù),對應比對詞典數(shù)據(jù)24,第1識別使用的匹配數(shù)據(jù),對應第1識別用字母數(shù)字字符單元24a和第1識別用 分類字符單元24b,第2識別用匹配數(shù)據(jù),對應第1識別用字母數(shù)字字符單元24a、第1識別用分類字 符單元24b及第2識別用字符單元24c,分類判別用字符,對應第1識別用分類字符單元24b,圖像數(shù)據(jù)獲取步驟,對應部步驟Si,第1字符識別處理及第1字符識別步驟,對應步驟S4,再識別要否判別處理及再識別要否判別步驟,對應步驟S5-S6,第2字符識別處理及第2字符識別步驟,對應步驟S7,分類判別處理,對應步驟S11,修正處理,對應步驟S12,第1識別用字符,對應字母、數(shù)字、符號、分類字符,第2識別用字符,對應所有的字符,但本發(fā)明不限定于上述的實施形態(tài)的結構,也可以得到多種實施形態(tài)。工業(yè)實用性本發(fā)明可以用于識別字符的裝置,特別用于名片的讀取、明信片和信封的地址讀 取等從某種程度上記載項目(分類)固定的字符顯示媒體識別字符的裝置。
權利要求
一種字符識別裝置,具有存儲用于字符識別的匹配數(shù)據(jù)的存儲部件;獲取圖像數(shù)據(jù)的圖像數(shù)據(jù)獲取部件;以及根據(jù)所述匹配數(shù)據(jù),識別所述圖像數(shù)據(jù)中的字符的字符識別部件,所述匹配數(shù)據(jù)可區(qū)分地構成預定的有關第1識別用字符的第1識別用匹配數(shù)據(jù);以及包含所述第1識別用字符以外的字符的、字符數(shù)比該第1識別用字符多的關于第2識別用字符的第2識別用匹配數(shù)據(jù),所述字符識別部件執(zhí)行第1字符識別處理,對所述圖像數(shù)據(jù)通過所述第1識別用匹配數(shù)據(jù)進行字符識別;再識別要否判別處理,判別該第1字符識別處理的結果是否符合再識別的條件;以及第2字符識別處理,對通過該再識別要否判別處理判別為需要再識別的再識別對象,通過所述第2識別用匹配數(shù)據(jù)進行字符識別。
2.如權利要求1所述的字符識別裝置,所述字符識別部件執(zhí)行對所述圖像數(shù)據(jù)內的字符集的分類進行判別的分類判別處理, 所述第1識別用匹配數(shù)據(jù)包含了用于所述分類判別的分類判別用字符。
3.如權利要求2所述的字符識別裝置,所述第1識別用匹配數(shù)據(jù),對于在所述分類判別用字符中被分類為二個以上的部首的 結合字符,包含了將該結合分離成不同要素的部首字符。
4.如權利要求2或3所述的字符識別裝置,所述字符識別部件在所述分類判別處理中被判別了分類的字符集內判別是否包含不 該被該分類使用的錯認字符,并在包含了錯認字符時執(zhí)行將該錯認字符修正為分類所使用 的字符的修正處理。
5.如權利要求4所述的字符識別裝置, 所述修正處理通過在包含所述錯認字符時,僅將分類所使用的字符作為識別對象而再次執(zhí)行字符識別來 進行修正。
6.如權利要求4所述的字符識別裝置,所述第1字符識別處理從匹配可靠性較高的字符中求得多個字符候選并采用匹配可 靠性最高的字符, 所述修正處理在包含所述錯認字符時,將其修正為在該錯認字符的字符候選中的、該分類所使用的 字符中匹配可靠性最高的字符。
7.一種字符識別程序,在存儲部件中存儲匹配數(shù)據(jù),所述匹配數(shù)據(jù)可區(qū)分地構成預 定的有關第1識別用字符的第1識別用匹配數(shù)據(jù);以及包含所述第1識別用字符以外的字 符的、字符數(shù)比該第1識別用字符多的關于第2識別用字符的第2識別用匹配數(shù)據(jù),使計算 機執(zhí)行圖像數(shù)據(jù)獲取步驟,通過圖像數(shù)據(jù)獲取部件獲取圖像數(shù)據(jù);第1字符識別步驟,通過所述第1識別用匹配數(shù)據(jù),由字符識別部件對所述圖像數(shù)據(jù)執(zhí)行字符識別;再識別要否判別步驟,由所述字符識別部件判別該第1字符識別處理的結果是否符合 再識別的條件;以及第2字符識別步驟,對通過該再識別要否判別處理判定為需要再識別的再識別對象, 通過所述第2識別用匹配數(shù)據(jù),由所述字符識別部件執(zhí)行字符識別。
8. 一種字符識別方法,在存儲部件中存儲匹配數(shù)據(jù),所述匹配數(shù)據(jù)可區(qū)分地構成預 定的有關第1識別用字符的第1識別用匹配數(shù)據(jù);以及包含所述第1識別用字符以外的字 符的、字符數(shù)比該第1識別用字符多的關于第2識別用字符的第2識別用匹配數(shù)據(jù),所述字 符識別方法執(zhí)行圖像數(shù)據(jù)獲取步驟,通過圖像數(shù)據(jù)獲取部件獲取圖像數(shù)據(jù);第1字符識別步驟,通過所述第1識別用匹配數(shù)據(jù),由字符識別部件對所述圖像數(shù)據(jù)執(zhí) 行字符識別;再識別要否判別步驟,由所述字符識別部件判別該第1字符識別處理的結果是否符合 再識別的條件;以及第2字符識別步驟,對通過該再識別要否判別處理判定為需要再識別的再識別對象, 通過所述第2識別用匹配數(shù)據(jù),由所述字符識別部件執(zhí)行字符識別。
全文摘要
提供字符識別裝置、字符識別程序及字符識別方法,對包含字符的圖像數(shù)據(jù),使用簡便的操作,實現(xiàn)高速的字符識別。通過便攜終端(1),將主要由字母數(shù)字組成的第1識別用字母數(shù)字字符單元(24a)、由分類字符組成的第1識別用分類字符單元(24b)、以及包含這些字符之外的、字符量比這些字符量多的第2識別用字符單元(24c)可區(qū)分地存儲,由第1識別用字母數(shù)字字符單元(24a)及第1識別用分類字符單元(24b)執(zhí)行第1字符識別處理(步驟S4),并在該處理中的匹配可靠性較低時(步驟S5~S6),執(zhí)行至少由第2識別用字符單元(24c)執(zhí)行字符識別的第2字符識別處理(步驟S7)。
文檔編號G06K9/68GK101833661SQ20101012353
公開日2010年9月15日 申請日期2010年3月2日 優(yōu)先權日2009年3月13日
發(fā)明者相澤知禎 申請人:歐姆龍株式會社