專利名稱:字符識別設(shè)備中用于識別字符的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及字符識別設(shè)備中用于識別字符的方法和設(shè)備,更具體而 言,涉及字符識別設(shè)備中用于識別字符的方法和設(shè)備,其中,當(dāng)識別包括在 輸入圖像中的字符時,能夠有效去除誤識別的字符。
背景技術(shù):
字符識別在文檔被掃描并轉(zhuǎn)換為文本文件或電子文檔時使用。近來照相
機(jī)技術(shù)的發(fā)展引起了通過照相機(jī)與移動裝置(諸個人數(shù)字助理(PDA)和蜂 窩電話)結(jié)合來處理字符圖像的需求的增長。
與輸入典型紙張文檔的掃描儀不同,照相機(jī)通過獲取任何類型的字符信 息來執(zhí)行字符識別。使用照相機(jī)的字符識別可識別諸如游客位置、各種材料、 紀(jì)念碑、廣告牌、名片和菜單的任何信息。使用照相機(jī)的字符識別可以通過 便攜式照相機(jī)容易地獲得并識別字符,而不管記錄有將被輸入的字符的介質(zhì) 為何,因此,對使用照相機(jī)的字符識別的研究正在積極進(jìn)行。
然而,其缺點在于,與基于掃描儀的字符識別方案相反,輸入圖像的條 件不受限制,導(dǎo)致通過照相機(jī)識別的圖像受周圍光線的影響很大。此外,基 于照相機(jī)的字符識別方案不受環(huán)境的影響。因此,各類字符均是識別的對象, 因而對字符的誤識別率增加,使得識別設(shè)備^艮難穩(wěn)定地運行。
根據(jù)傳統(tǒng)字符識別方案中的后處理方法,字符識別設(shè)備在諸如字典的數(shù) 據(jù)庫中搜索包括通過掃描儀識別的字符的字(word)。如果在該數(shù)據(jù)庫中不存 在相應(yīng)的字,則設(shè)備將該字確定為誤識別字符。字符識別設(shè)備搜索與通過掃 描儀識別的字符最相似的字。
通常,在使用照相機(jī)識別字符時,文檔的背景連同該文檔一起被拍攝, 并且所拍攝的圖像包括文檔和背景二者。因此,字符識別設(shè)備或程序接收包 括背景的文檔圖像,并且不能將文檔區(qū)域與背景區(qū)域區(qū)分開。于是,其甚至 打算識別出背景區(qū)域中的字符。具體而言,字符識別設(shè)備將背景中具有與字 符類似特征的部分誤識別為字符,并且將誤識別字符包括在字符識別結(jié)果中。因此,產(chǎn)生了根據(jù)該識別結(jié)果的破碎字符結(jié)構(gòu)。
前述基于照相機(jī)的字符識別方案因為需要用戶手動搜索并刪除每個背景 中的誤識別結(jié)果,所以降低了字符識別的總體速率。這種刪除誤識別字符的 手動工作是不方便的,且不必要地耗費了時間。作為另一個缺點,手動工作 需要用戶直接選擇所拍攝圖像中的文檔區(qū)域。此外,照相機(jī)中用于接收用戶 輸入的設(shè)備局限于按鈕或觸摸屏。因為許多小型或自動照相機(jī)甚至不包括觸 摸屏,所以用戶必須承受用有限數(shù)量的按鈕來選擇文檔區(qū)域的不便。此外, 如果文檔區(qū)域是多邊形的形式而不是矩形,更增大了用戶僅選擇文檔區(qū)域的 難度。
因此,為了改進(jìn)基于照相機(jī)的字符識別方案的性能,需要一種用于識別 字符的方法和設(shè)備,其具有能夠標(biāo)識出由照相機(jī)拍攝的字符是否被正確識別 且改正誤識別字符的后處理功能。
發(fā)明內(nèi)容
因此,本發(fā)明的一個方面是要解決在現(xiàn)有技術(shù)中出現(xiàn)的上述問題,并且 本發(fā)明的目的是提供用于識別字符的方法和設(shè)備,其中,當(dāng)識別在輸入圖像 中包括的字符時,誤識別字符^皮有效去除。
根據(jù)本發(fā)明的一個方面,提供一種用于在字符識別設(shè)備中識別字符的方
法,包括將輸入圖像轉(zhuǎn)換為二值圖像,并區(qū)分每個都包括至少一個字符的 字符區(qū)域和非字符區(qū)域;確定在字符區(qū)域中是否包括無效字符區(qū)域,并將無 效字符區(qū)域分類為非字符區(qū)域,其中,所述無效字符區(qū)域包括預(yù)存儲或更少 數(shù)目的字符(即,字符數(shù)目等于或小于閾值);以及通過從字符區(qū)域中去除無 效字符區(qū)域來確定驗證字符區(qū)域,并且輸出在驗證字符區(qū)域中包括的字符。
根據(jù)本發(fā)明的另一個方面,提供一種字符識別設(shè)備,包括字符區(qū)域檢 測單元,用于在輸入圖像中檢測每個都包括至少一個字符的字符區(qū)域;二值 圖像轉(zhuǎn)換單元,用于將輸入圖像轉(zhuǎn)換為二值圖像,并區(qū)分字符區(qū)域和不包括 字符的非字符區(qū)域;控制單元,用于確定在字符區(qū)域中是否存在無效字符區(qū) 域,如果存在無效字符區(qū)域,則將無效字符區(qū)域重新分類為非字符區(qū)域,其 中,所述無效字符區(qū)域包括的字符數(shù)目等于或小于閾值;以及字符輸出單元,
括的字符。根據(jù)本發(fā)明的再一個方面,提供一種用于在字符識別設(shè)備中識別字符的
方法,該方法包括在輸入圖像中檢測每個都包括至少一個字符的字符區(qū)域, 并存儲關(guān)于每個字符區(qū)域的位置信息;生成大小與輸入圖像相同的復(fù)制圖像; 將復(fù)制圖像轉(zhuǎn)換為二值圖像,并分別用黑色和白色來區(qū)分字符區(qū)域和不包括 字符的非字符區(qū)域;對字符區(qū)域執(zhí)行形態(tài)學(xué)運算中的膨脹運算,并放大每個 字符區(qū)域;確定在字符區(qū)域中是否存在無效字符區(qū)域,其中,所述無效字符 區(qū)域包括閾值或更少數(shù)目的字符;如果存在無效字符區(qū)域,則通過從字符區(qū) 域中去除無效字符區(qū)域來確定驗證字符區(qū)域;以及輸出在驗證字符區(qū)域中包 括的字符。
通過參照附圖進(jìn)行的下述具體描述,本發(fā)明的上述和其他方面、特征和 優(yōu)點將更加顯而易見,附圖中
圖1示出了根據(jù)本發(fā)明的字符識別設(shè)備;
圖2示出了根據(jù)本發(fā)明的在字符識別設(shè)備中識別字符的方法;
圖3A示出了根據(jù)本發(fā)明的輸入圖像; 圖像; ,'-'— -' i, — / 、、
圖3C示出了根據(jù)本發(fā)明的、圖3A和圖3B的圖像被二值圖像轉(zhuǎn)換單元 轉(zhuǎn)換成的二值圖像;
圖3D示出了通過對圖3C的二值圖像的每個字符區(qū)域應(yīng)用形態(tài)學(xué)運算 (morphology operation)中的膨月設(shè)算(dilatation operation)而得到的結(jié)果;
圖3E示出了才艮據(jù)本發(fā)明的被控制單元重新分類為非字符區(qū)域的B區(qū)的 字符區(qū)域;
圖3F示出了根據(jù)本發(fā)明的最終劃分的字符區(qū)域和非字符區(qū)域;以及 圖4示出了根據(jù)本發(fā)明的用于在字符識別設(shè)備中識別字符的方法。
具體實施例方式
此后,將參照附圖描述本發(fā)明的優(yōu)選實施例。在說明書和附圖的通篇中, 相同的參考數(shù)字指代相同的元素。在下面的描述中,為了清楚和簡明的目的, 省略了對公知相關(guān)功能和結(jié)構(gòu)的具體解釋。根據(jù)本發(fā)明,輸入圖像中被識別為具有至少一個字符的每個區(qū)域被稱為 字符區(qū)域,不包括字符的區(qū)域被稱為非字符區(qū)域。此外,如果區(qū)域中的字符 并非輸入圖像中的真實字符,但是該字符在字符識別處理中被誤識別為字符, 結(jié)果又被重新分類為非字符,那么每個這樣的區(qū)域被稱為無效字符區(qū)域,而 僅包括去除字符區(qū)域中的無效字符區(qū)域后的字符的區(qū)域被稱為驗證字符區(qū) 域。
圖1示出了根據(jù)本發(fā)明的字符識別設(shè)備。
字符識別設(shè)備10包括字符區(qū)域檢測單元12、 二值圖像轉(zhuǎn)換單元14、字 符輸出單元16、控制單元ll、顯示單元22、存儲器24和字符數(shù)據(jù)庫26。
字符區(qū)域才企測單元12從通過字符識別設(shè)備10輸入的圖像、即輸入圖像 中檢測字符區(qū)域。此時,字符區(qū)域包括包含至少一個字符的每個區(qū)域,而非 字符區(qū)域包括不包含字符的區(qū)域,并且輸入圖像包括用于字符識別的、通過 字符識別設(shè)備IO輸入的每個圖像。
在另一實施例中,字符區(qū)域檢測單元12從輸入圖像中檢測字符區(qū)域,并 且提取關(guān)于字符區(qū)域的位置信息。字符區(qū)域4企測單元12可以在控制單元11 (稍后將在這里描述)的控制下,將位置信息存儲在存儲器24中。
通過將輸入圖像轉(zhuǎn)換為灰度圖像或者通過字符識別所需的識別預(yù)處理 (諸如校正字符梯度(gradient)或分離單個字符)來實現(xiàn)字符區(qū)域的檢測。 識別預(yù)處理過程是本領(lǐng)域技術(shù)人員所公知的,并且本發(fā)明涉及的是執(zhí)行識別 預(yù)處理之后的識別后處理。因而,將省略對識別預(yù)處理的描述。
二值圖像轉(zhuǎn)換單元14對通過字符識別設(shè)備IO輸入的圖像進(jìn)行二值處理, 并將其轉(zhuǎn)換成由黑和白表示的二值圖像。如果字符區(qū)域檢測單元12檢測到字 符區(qū)域,則二值圖像轉(zhuǎn)換單元14轉(zhuǎn)換輸入圖像,以便使字符區(qū)域和除字符區(qū) 域之外的其他區(qū)域、即不包含字符的非字符區(qū)域分別具有不同的二元值。例 如,如果字符區(qū)域的值為"0(黑)",則非字符區(qū)域的值為"1 (白)",相反, 如果字符區(qū)域的值為T,則非字符區(qū)域的值為"0"。
此外,二值圖像轉(zhuǎn)換單元14在控制單元11 (稍后描述)的控制下,對 二值圖像之中的每個字符區(qū)域執(zhí)行形態(tài)學(xué)運算中的膨te算,以增加字符區(qū) 域的大小。如果字符區(qū)域的大小被增加,則會產(chǎn)生字符區(qū)域之間的距離縮短 的字符區(qū)域或具有接觸點的連接的字符區(qū)域。二值圖像轉(zhuǎn)換單元14在控制單 元11的i制下重復(fù)膨脹運算多次,重復(fù)次數(shù)預(yù)存儲在存儲器24中,以使得相鄰的字符區(qū)域相互連接以產(chǎn)生至少一個集群、即至少一個字符區(qū)域組。字 符區(qū)域包括不與其它字符區(qū)域連接的單個字符區(qū)域或由彼此連接的字符區(qū)域 組成的字符區(qū)域組。
根據(jù)本發(fā)明的另一實施例的二值圖像轉(zhuǎn)換單元14在控制單元11 (稍后 描述)的控制下,生成大小與通過字符識別設(shè)備10輸入的圖像相同的復(fù)制圖 像,并將該復(fù)制圖像轉(zhuǎn)換為二值圖像。此時,二值圖像轉(zhuǎn)換單元14使用由字 符區(qū)域檢測單元12提取的關(guān)于各個字符區(qū)域的位置信息來將所述復(fù)制圖像 轉(zhuǎn)換為二值圖像。
如果一個區(qū)域具有與關(guān)于輸入圖像的字符區(qū)域的位置信息的位置值相同 的位置值,則二值圖像轉(zhuǎn)換單元14在控制單元11的控制下將該區(qū)域當(dāng)作字 符區(qū)域,并且如果一個區(qū)域不具有與關(guān)于輸入圖像的字符區(qū)域的位置信息的 位置值相同的位置值,則二值圖像轉(zhuǎn)換單元14將該區(qū)域當(dāng)作非字符區(qū)域。二 值圖像轉(zhuǎn)換單元14以黑和白對字符區(qū)域和非字符區(qū)域進(jìn)行二值處理。
字符輸出單元16通過使用稍后描述的字符數(shù)據(jù)庫26輸出包括在字符區(qū) 域中的字符,并且以句子或類似形式輸出包括在通過連接多個字符區(qū)域產(chǎn)生 的字符區(qū)域組中的字符。字符輸出單元16搜索字符數(shù)據(jù)庫26,并且,如果 存在其形式與包括在字符區(qū)域中的字符相對應(yīng)的字符,則字符輸出單元16將 該要輸出的字符識別為字,并輸出該字。
控制單元11確定在被分類為字符區(qū)域的區(qū)域中,是否存在包括閾值或更 少數(shù)量的字符的無效字符區(qū)域。如果存在無效字符區(qū)域,則控制單元ll將相 應(yīng)的無效字符區(qū)域重新分類為非字符區(qū)域。無效字符區(qū)域包括不與其它區(qū)域 相連的單個無效字符區(qū)域或由彼此連接的無效字符區(qū)域組成的無效字符區(qū)域 組。
確定所述閾值的方法包括接收用戶輸入并確定閾值的被動確定方法,以 及通過用于字符識別的計算算法自動確定閾值的自動確定方法。此外,自動 確定方法包括不論輸入圖像如何均具有相同閾值的固定閾值確定方法,以及 根據(jù)輸入圖像靈活改變閾值的可變閾值確定方法。
由控制單元11將無效字符區(qū)域重新確定為非字符區(qū)域利用了下述特征 在通常的文檔中,具有均勻排列或距離的多個字符聚集在一起。包括閾值或 更少數(shù)目的字符的無效字符區(qū)域?qū)?yīng)于在輸入圖像的背景、即在拍才聶過程中 與文檔一起被拍攝的背景中包括的字符,而不是要通過字符識別設(shè)備10識別的字符。因此,控制單元11必須去除這類字符。
當(dāng)二值圖像轉(zhuǎn)換單元14將輸入圖像轉(zhuǎn)換為二值圖像時,根據(jù)本發(fā)明的控
制單元11控制二值圖像轉(zhuǎn)換單元14對字符區(qū)域執(zhí)行二值圖像形態(tài)學(xué)運算中
的膨脹運算。通過如此,字符區(qū)域的大小變得大于輸入圖像的實際大小。此 外,當(dāng)字符區(qū)域的大小增加時,每個字符區(qū)域與另外的相鄰的字符區(qū)域結(jié)合。
控制單元11控制二值圖像轉(zhuǎn)換單元14放大每個字符區(qū)域,直到相鄰的字符 區(qū)域結(jié)合到一起為止。例如,可以將每個字符區(qū)域放大到范圍在原始大小的 150%至300°/。的預(yù)存儲大小。在圖3D中,每個字符區(qū)域被方文大到原始大小的 200%。
此時,字符區(qū)域之間的距離和預(yù)存儲大小是預(yù)存儲在存儲器24 (稍后描 述)中的值,或者是根據(jù)由用戶輸入的圖像的特征而任意確定的值。
顯示單元22顯示通過字符輸出單元16輸出的字符,以向用戶提供輸出 字符。此外,顯示單元22顯示由二值圖像轉(zhuǎn)換單元14轉(zhuǎn)換的二值圖像。
存儲器24包括程序存儲器和數(shù)據(jù)存儲器。存儲器存儲控制字符識別設(shè)備 10的操作所需的各種信息。存儲器24存儲控制單元11用來將字符區(qū)域中實 質(zhì)上為非字符區(qū)域的無效字符區(qū)域重新分類的閾值。此外,存儲器24存儲由 字符區(qū)域檢測單元12提取的關(guān)于各個字符的位置信息。
字符數(shù)據(jù)庫26存儲能夠通過字符輸出單元16輸出的每個字符。字符輸 出單元16進(jìn)行搜索以確定在字符數(shù)據(jù)庫26中是否存在形式與包括在各個字 符區(qū)域中的字符相同的字符,并且,如果存在,則字符輸出單元16以相應(yīng)的 字符輸出包括在字符區(qū)域中的字符。例如,假設(shè)包括在字符區(qū)域中的字符具 有"CT的形式,則字符輸出單元16搜索形式與包括在字符區(qū)域中的"or 相同的字符、即在字符數(shù)據(jù)庫26中被存儲為"0P,的字符。因此,字符輸出 單元16根據(jù)搜索結(jié)果將在字符區(qū)域中包括的字符輸出為"0P'。
圖2示出了根據(jù)本發(fā)明的在字符識別設(shè)備中識別字符的方法。
在步驟S32中,字符識別設(shè)備10的字符區(qū)域檢測單元12從輸入圖像中 檢測字符區(qū)域,并將其劃分為字符區(qū)域和非字符區(qū)域。然后,在步驟S34中, 二值圖像轉(zhuǎn)換單元14將輸入圖像轉(zhuǎn)換為二值圖像。例如,二值圖像轉(zhuǎn)換單元 14以值為"1"的白色表示字符區(qū)域,以值為"0"的黑色表示非字符區(qū)域, 并且對輸入圖像進(jìn)行二值處理和轉(zhuǎn)換。
二值圖像轉(zhuǎn)換單元14在控制單元11的控制下對字符區(qū)域執(zhí)行形態(tài)學(xué)運算,并且放大和連接字符區(qū)域。優(yōu)選地,二值圖像轉(zhuǎn)換單元14對字符區(qū)域應(yīng) 用形態(tài)學(xué)運算中的膨脹運算,以增加能夠在步驟S34中被轉(zhuǎn)換的二值圖像中 顯示的字符區(qū)域的實際大小。此外,由于放大了字符區(qū)域,所以各個字符區(qū) 域中的相鄰字符區(qū)域彼此連接,因而可能產(chǎn)生接觸點。
二值圖像轉(zhuǎn)換單元14可以通過擴(kuò)大字符區(qū)域以連接和結(jié)合在預(yù)定距離 內(nèi)相鄰的字符區(qū)域來產(chǎn)生字符區(qū)域組。同樣,字符識別設(shè)備10將需要識別的 字符統(tǒng)一成一個集群,以將該集群與非字符區(qū)域相區(qū)分,并且控制單元ll可 以將一個字符區(qū)域組當(dāng)作一個字符區(qū)域。
如上所述,如果劃分了字符區(qū)域和非字符區(qū)域,則在步驟S38中,控制 單元11確定是否存在包括閾值或更少數(shù)目的字符(即字符的數(shù)目等于或少于 閾值)的無效字符區(qū)域。如果不存在無效字符區(qū)域,則在步驟S42中,控制 單元11控制字符輸出單元16并輸出在字符區(qū)域中包括的字符。
如果存在包括的字符數(shù)目等于或小于閾值的無效字符區(qū)域,則因為在步 驟S32中被分類為字符區(qū)域的部分區(qū)域是非字符區(qū)域,所以在步驟S40中, 控制單元11將相應(yīng)的無效字符區(qū)域重新分類為非字符區(qū)域。如果在字符區(qū)域 中存在在存儲器24中預(yù)存儲的距離之內(nèi)相鄰的另一字符區(qū)域,則即使所述字 符區(qū)域通過步驟S36被放大,控制單元11也確定字符不包括在所述字符區(qū)域 中。
在典型的文檔結(jié)構(gòu)中,由于各個字符之間的距離縮短并且字符的排列是 均勻的,所以當(dāng)在步驟S36中放大字符區(qū)域時,字所占據(jù)的字符區(qū)域擴(kuò)大, 從而產(chǎn)生接觸點或字符區(qū)域組。因此,如果字符區(qū)域和另一字符區(qū)域之間的 距離等于或大于預(yù)存儲值(此后稱為閾值距離),則即使已經(jīng)執(zhí)行了放大字符 區(qū)域的處理,控制單元11也確定該字符區(qū)域并不實際包括字符,從而將該字 符區(qū)域重新確定為非字符區(qū)域。
此時,用于確定在字符區(qū)域中是否實際包括字符的闊值距離可以是預(yù)存 儲在存儲器24中的值。此外,即使產(chǎn)生了字符區(qū)域和另一字符區(qū)域之間的接 觸點,如果字符區(qū)域的距離或排列并不是均勻的,控制單元ll也可以將該字 符區(qū)域重新確定為非字符區(qū)域,因為在典型文檔結(jié)構(gòu)中字符的排列是均勻和 規(guī)則的。
在步驟S42中,控制單元11控制字符輸出單元16輸出僅包括在字符區(qū) 域中的字符,該字符區(qū)域是除去了在步驟S40中被重新分類為非字符區(qū)域的字符區(qū)域之后的字符區(qū)域。
圖3A到圖3F示出了根據(jù)本發(fā)明,在字符識別的處理過程中應(yīng)用字符識 別的字符圖像。
圖3A示出了根據(jù)本發(fā)明的輸入圖像。輸入圖像可以通過例如照相機(jī)(未 示出)而被輸入到字符識別設(shè)備10中。假設(shè)根據(jù)'本發(fā)明的字符識別設(shè)備10 應(yīng)當(dāng)識別A區(qū)52中包括的字符52A。
圖3B示出了根據(jù)本發(fā)明的、當(dāng)字符區(qū)域檢測單元12檢測到字符區(qū)域時 的輸入圖像。參照圖3B,在A區(qū)52和B區(qū)54中都檢測到字符區(qū)域52B和 54B。 B區(qū)54中的日歷作為背景被包括在輸入圖^f象中。字符區(qū)域沖企測單元12 將日歷中的數(shù)字識別為字符,并且如果其也將B區(qū)54中的數(shù)字識別為字符, 則在字符輸出過程中可能發(fā)生錯誤。于是,優(yōu)選的是去除B區(qū)54中的字符區(qū) 域54B。
圖3C示出了根據(jù)本發(fā)明的、圖3A和圖3B的圖像被二值圖像轉(zhuǎn)換單元 14轉(zhuǎn)換成的二值圖像。參照圖3A, 二值圖像轉(zhuǎn)換單元14轉(zhuǎn)換輸入圖像,以 使得字符區(qū)域52C和54C具有值"1 (白色)",并且非字符區(qū)域具有值"0 (黑 色)"。
圖3D示出了通it^"圖3C的二值圖像中的字符區(qū)域52C和54C中的每 個應(yīng)用形態(tài)學(xué)運算中的膨脹運算而得到的結(jié)果。參照圖3D,所有字符區(qū)域 52D彼此連接,從而在A區(qū)52中形成一個集群,其中聚集了將被字符識別設(shè) 備10識別的字符。即使放大B區(qū)54的字符區(qū)域54D,各個字符仍然是M 的。因此,字符與非字符被區(qū)分開來??刂茊卧?1將B區(qū)的字符區(qū)域54D 重新分類為非字符區(qū)域。
圖3E示出了根據(jù)本發(fā)明的、被控制單元11重新分類為非字符區(qū)域的B 區(qū)54的字符區(qū)域。參照圖3E,全部B區(qū)54具有值"0"。字符識別設(shè)備10 的控制單元11控制二值圖像轉(zhuǎn)換單元14對被重新分類為非字符區(qū)域的區(qū)域 的輸入圖像進(jìn)行重新轉(zhuǎn)換,以使其具有值"0"。
圖3F示出了根據(jù)本發(fā)明的最終劃分的字符區(qū)域和非字符區(qū)域。參照圖 3F, A區(qū)52中的所有字符凈皮表示為字符區(qū)域52B,且B區(qū)54中的每個字符 54A被分類為非字符區(qū)域,從而使B區(qū)54的日歷成為背景。
圖4示出了根據(jù)本發(fā)明的用于在字符識別設(shè)備中識別字符的方法。
在步驟S62中,字符區(qū)域檢測單元12從輸入的原始圖像中檢測字符區(qū)域,并提取關(guān)于各個字符區(qū)域的位置信息,且將所提取的位置信息存儲在存儲器
24中。在步驟S64中,二值圖像轉(zhuǎn)換單元14生成大小與輸入原始圖像相同 的復(fù)制圖像,并且在步驟S66中,字符區(qū)域檢測單元12在控制單元11的控 制下,使用存儲在存儲器24中的位置信息將復(fù)制圖像劃分為字符區(qū)域和非字 符區(qū)域。
當(dāng)輸入原始圖像具有"1024x 768像素"的分辨率時,復(fù)制圖像具有相 同的分辨率,這表示相同的大小。因此,如果對輸入原始圖像和復(fù)制圖像應(yīng) 用相同的坐標(biāo)軸,則關(guān)于輸入原始圖像的位置的位置信息可以^皮應(yīng)用到復(fù)制 圖像。也就是說,如果輸入原始原始圖像具有坐標(biāo)點(3, 3),則復(fù)制圖像也 具有坐標(biāo)點(3, 3)。這樣,輸入原始圖像和復(fù)制圖像具有相同的大小,使得 字符識別設(shè)備10可以在復(fù)制圖像中精確地識別與輸入原始圖像的字符區(qū)域 對應(yīng)的區(qū)域。此外,字符識別設(shè)備10精確地識別輸入原始圖像的字符區(qū)域, 從而即使在復(fù)制區(qū)域中也能將其與非字符區(qū)域相區(qū)分,進(jìn)而顯示字符區(qū)域。
在步驟S68中,二值圖像轉(zhuǎn)換單元14將復(fù)制圖像轉(zhuǎn)換為二值圖像,以使 得字符區(qū)域和非字符區(qū)域具有不同的值。二值圖像轉(zhuǎn)換單元14參考存儲在存 儲器24中的關(guān)于各個字符區(qū)域的位置信息,并將位置與關(guān)于輸入原始圖像的 字符區(qū)域的位置信息相同的復(fù)制圖像的區(qū)域顯示為字符區(qū)域。在步驟S70中, 二值圖像轉(zhuǎn)換單元14在控制單元11的控制下,對復(fù)制圖像的各個字符區(qū)域 執(zhí)行形態(tài)學(xué)運算,并放大和連接各個字符區(qū)域。
在步驟S72中,控制單元11確定在與復(fù)制圖像的各個字符區(qū)域?qū)?yīng)的輸 入圖像的字符區(qū)域中,是否存在包括閾值數(shù)目或更少數(shù)目的字符的無效字符 區(qū)域。控制單元11使用與復(fù)制圖像的各個字符區(qū)域相對應(yīng)的位置信息來確定 在與輸入原始圖像的位置信息相對應(yīng)的區(qū)域中包括的字符數(shù)目是否等于或小 于閾值。在步驟S70中,當(dāng)通過形態(tài)學(xué)運算放大了各個字符區(qū)域且相鄰的字 符區(qū)域連接為一個集群時,控制單元11將該集群當(dāng)作一個字符區(qū)域。
作為步驟S72中的確定的結(jié)果,如果在字符區(qū)域中包括闊值或更少數(shù)目 的字符,則在步驟S74中,控制單元ll將相應(yīng)的字符區(qū)域重新分類為非字符 區(qū)域。控制單元11從存儲在存儲器24中的位置信息中刪除與已在步驟S74 中被重新分類為非字符區(qū)域的無效字符區(qū)域相對應(yīng)的位置信息。這樣,不必 要的信息被刪除,在字符識別設(shè)備10中僅留下了關(guān)于包括要輸出的字符的字 符區(qū)域的位置信息。在步驟S76中,控制單元11控制字符輸出單元16輸出包括在字符區(qū)域中的字符。字符輸出單元16參考存儲在存儲器24中的位置 信息,僅輸出包括在相應(yīng)區(qū)域中的字符。作為步驟S72中的確定的結(jié)果,如果在字符區(qū)域中并非包括閾值或更少 數(shù)目的字符,則在步驟S76中,控制單元11控制字符輸出單元16輸出步驟 S62中被分類為字符區(qū)域中包括的所有字符。因此,本發(fā)明提供了一種用于在字符識別設(shè)備中識別字符的方法和設(shè)備, 其中當(dāng)識別包括在輸入圖像中的字符時,有效地去除了誤識別字符。此外,通過去除誤識別字符,本發(fā)明通過輸出正確的、去除了錯誤的字 符而減少了在輸入圖像處理期間的錯誤。雖然已參照本發(fā)明的優(yōu)選實施例及其附圖示出并描述了本發(fā)明,但是本 領(lǐng)域技術(shù)人員應(yīng)當(dāng)明白,可以在其中做出形式上和細(xì)節(jié)上的各種改變,而不 會背離由所附權(quán)利要求書所限定的本發(fā)明的精神和范圍。
權(quán)利要求
1.一種用于在字符識別設(shè)備中識別字符的方法,該方法包括將輸入圖像轉(zhuǎn)換為二值圖像,并區(qū)分每個都包括至少一個字符的字符區(qū)域和不包括字符的非字符區(qū)域;確定在字符區(qū)域中是否包括無效字符區(qū)域,并將無效字符區(qū)域分類為非字符區(qū)域,其中,所述無效字符區(qū)域具有的字符數(shù)目等于或小于閾值;以及通過從字符區(qū)域中去除無效字符區(qū)域來確定驗證字符區(qū)域,并且輸出在驗證字符區(qū)域中包括的字符。
2. 根據(jù)權(quán)利要求1所述的方法,其中,區(qū)分字符區(qū)域和非字符區(qū)域包括 通過不同于以白色表示的非字符區(qū)域、以黑色表示字符區(qū)域來對字符區(qū)域和 非字符區(qū)域進(jìn)行黑白處理。
3. 根據(jù)權(quán)利要求1所述的方法,其中,區(qū)分字符區(qū)域和非字符區(qū)域包括 通過不同于以黑色表示的非字符區(qū)域、以白色表示字符區(qū)域來對字符區(qū)域和 非字符區(qū)域進(jìn)行黑白處理。
4. 根據(jù)權(quán)利要求1所述的方法,其中,區(qū)分字符區(qū)域和非字符區(qū)域包括 放大每個字符區(qū)域;并且將字符區(qū)域相互連接以形成至少 一個字符區(qū)域組。
5. 才艮據(jù)權(quán)利要求1所述的方法,還包括如果在字符區(qū)域中不存在包括的字符數(shù)目等于或小于閾值的無效字符區(qū)域,則輸出包括在字符區(qū)域中的字您 付。
6. —種字符識別設(shè)備,包括字符區(qū)域檢測單元,用于在輸入圖像中檢測每個都包括至少一個字符的 字符區(qū)域;二值圖像轉(zhuǎn)換單元,用于將輸入圖像轉(zhuǎn)換為二值圖像,并區(qū)分字符區(qū)域 和不包括字符的非字符區(qū)域;控制單元,用于確定在字符區(qū)域中是否存在無效字符區(qū)域,如果存在無 效字符區(qū)域,則將無效字符區(qū)域重新分類為非字符區(qū)域,其中,所述無效字 符區(qū)域包括的字符數(shù)目等于或小于閾值;以及字符輸出單元,用于輸出在通過從字符區(qū)域中去除無效字符區(qū)域而得到 的驗證字符區(qū)域中包括的字符。
7. 根據(jù)權(quán)利要求6所述的字符識別設(shè)備,其中,所述二值圖像轉(zhuǎn)換單元 以黑色來表示字符區(qū)域,并以白色來表示非字符區(qū)域。
8. 根據(jù)權(quán)利要求6所述的字符識別設(shè)備,其中,所述二值圖像轉(zhuǎn)換單元 以白色來表示字符區(qū)域,并以黑色來表示非字符區(qū)域。
9. 根據(jù)權(quán)利要求6所述的字符識別設(shè)備,其中,所述二值圖像轉(zhuǎn)換單元 放大與各個字符相對應(yīng)的字符區(qū)域,并將字符區(qū)域相互連接以形成至少一個 字符區(qū)域組。
10. 根據(jù)權(quán)利要求9所述的字符識別設(shè)備,其中,所述二值圖像轉(zhuǎn)換單 元對字符區(qū)域執(zhí)行形態(tài)學(xué)運算中的膨脹運算,以形成所述字符區(qū)域組。
11. 根據(jù)權(quán)利要求6所述的字符識別設(shè)備,其中,如果在字符區(qū)域中不 存在包括的字符數(shù)目等于或小于閾值的無效字符區(qū)域,則所述控制單元控制
12. —種用于在字符識別設(shè)備中識別字符的方法,該方法包括 在輸入圖像中檢測每個都包括至少一個字符的字符區(qū)域,并存儲關(guān)于字符區(qū)域的每個區(qū)域的位置信息;生成大小與輸入圖像相同的復(fù)制圖像;將復(fù)制圖像轉(zhuǎn)換為二值圖像,并分別用黑色和白色來區(qū)分字符區(qū)域和不 包括字符的非字符區(qū)域;對字符區(qū)域執(zhí)行形態(tài)學(xué)運算中的膨脹運算,并放大每個字符區(qū)域;確定在字符區(qū)域中是否存在無效字符區(qū)域,其中,所述無效字符區(qū)域包 括的字符數(shù)目等于或小于閾值;如果存在無效字符區(qū)域,則通過^Mv字符區(qū)域中去除無效字符區(qū)域來確定 驗證字符區(qū)域;以及輸出在驗證字符區(qū)域中包括的字符。
13. 根據(jù)權(quán)利要求12所述的方法,還包括如果在字符區(qū)域中不存在包 括的字符數(shù)目等于或小于闊值的無效字符區(qū)域,則輸出包括在字符區(qū)域中的 每個字符。
全文摘要
公開了用于識別字符并有效去除誤識別字符的方法和設(shè)備。所述方法包括在輸入圖像中檢測包括至少一個字符的字符區(qū)域;將輸入圖像轉(zhuǎn)換為二值圖像;區(qū)分字符和非字符;將包括的字符數(shù)目等于或小于閾值的字符區(qū)域重新分類為非字符區(qū)域;以及僅輸出存在于字符區(qū)域中的字符。
文檔編號G06K9/00GK101615251SQ20091015032
公開日2009年12月30日 申請日期2009年6月23日 優(yōu)先權(quán)日2008年6月24日
發(fā)明者吳尚昱, 鄭熙遠(yuǎn), 金尚鎬, 黃星澤 申請人:三星電子株式會社