專利名稱:字符識別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于讀取圖像信息的方法。
背景技術(shù):
將圖像信息讀取至計算機的處理可以使用光學字符識別(在下文中
被稱為OCR)技術(shù)。OCR技術(shù)是一種根據(jù)圖像上呈現(xiàn)的形狀來檢測字符 并且輸出可以由計算機處理的文本代碼信息的技術(shù)。例如,OCR技術(shù)可 以被用于讀取報告。報告具有其上要寫入字符的預(yù)定區(qū)域。該區(qū)域由繪 制在報告上的框線來限定。OCR技術(shù)必須準確地檢測出要寫入字符的所 述區(qū)域。為了準確檢測要寫入字符的區(qū)域,有效的是,標識框線的位置、 角、尺寸等??蚓€的位置例如可以基于作為預(yù)先保持的模板的報告圖像 數(shù)據(jù)的框線信息與從輸入的報告的圖像數(shù)據(jù)中獲取的框線信息之間的偏 移量來精確標識。
報告的框線信息例如可以包括多個彩色信息片段或者包括多個密度 級(其將被稱為彩色報告)。在將OCR技術(shù)應(yīng)用于彩色報告時,刪除讀 取的彩色報告圖像信息的預(yù)定彩色信息片段。從刪除了該彩色信息片段 之后的報告圖像數(shù)據(jù)中檢測文本信息。當從彩色報告中刪除彩色信息片 段時,報告圖像信息的部分框線信息也可能被刪除,或者可能殘留報告 圖像信息的部分不需要的噪聲信息。
通用霍夫變換(Generalized Hough Transform)可用作用于計算模板 圖像信息與輸入的圖像信息之間的偏移量的方法。通用霍夫變換保持作 為基準圖像的具有復(fù)雜且不同的結(jié)構(gòu)的報告模板。通用霍夫變換針對諸 如平行、旋轉(zhuǎn)以及擴展/收縮各變形參數(shù)限定投票空間(voting space)并 且通過針對各參數(shù)在投票空間進行投票來估計輸入圖像的偏移量。通用 霍夫變換可以在輸入報告圖像是具有復(fù)雜結(jié)構(gòu)的報告圖像并且在框線中
具有噪聲和/或中斷的情況下,估計該輸入報告圖像與模板的報告圖像之
間的偏移量。在日本特開專利公報10-27208和日本專利3756309中公開 了涉及上述技術(shù)的技術(shù)。
然而,通用霍夫變換需要用于實現(xiàn)投票空間的巨大存儲器空間和用 于投票的大量處理時間。
發(fā)明內(nèi)容
根據(jù)一實施方式的一個方面,提供了一種從一區(qū)域中具有框架和多 個字符的圖像中識別出字符的方法,所述方法包括以下步驟區(qū)域劃分 步驟,該區(qū)域劃分步驟將所述區(qū)域分成分別具有多個局部圖像的多個局 部區(qū)域;模板圖像提供步驟,該模板圖像提供步驟提供具有基準框架圖 像的模板圖像;圖像差別計算步驟,該圖像差別計算步驟分別計算所述 多個局部圖像與所述模板圖像的所述基準框架圖像之間的差別;不重合 度計算步驟,該不重合度計算步驟基于所述多個局部圖像與所述基準框 架圖像的所述差別的平均來計算所述圖像與所述模板圖像的不重合度; 以及字符識別步驟,該字符識別步驟修正所述不重合度,從而從所述圖 像中識別出所述多個字符。
圖1是圖像處理裝置1的硬件構(gòu)造圖2是從接收輸入圖像信息17到輸出修正圖像的處理的流程圖3是輸入圖像信息17的實施例;
圖4是二進制化的模板圖像信息18的圖像;
圖5是Sobel的水平邊緣過濾器的設(shè)置值21-1;
圖6是Sobel的垂直邊緣過濾器的設(shè)置值21-2;
圖7是將輸入圖像信息17分成多個局部圖像區(qū)所得的圖8是用于應(yīng)用Bucket方法的說明圖9是模板圖像信息18的局部圖像區(qū);
圖10是比較矢量190的實施例;
圖11是投票處理的流程圖12是投票空間的構(gòu)造實施例;
圖13是投票處理的原理圖14是用于計算與各像素相對應(yīng)的偏移參數(shù)的說明圖15是示出了輸入圖像信息17的局部區(qū)域55的圖。
具體實施例方式
圖1是圖像處理裝置1的硬件構(gòu)造圖。
圖像處理裝置1包括連接至 總線107的控制模塊101、存儲器102、輸入模塊103、存儲模塊104以 及輸出模塊105。
控制模塊101控制整個圖像處理裝置1。例如,控制模塊101可以 是中央處理單元(CPU)。控制模塊101執(zhí)行在存儲器102中展開的圖像 處理程序108。圖像處理程序108使控制模塊101充任輪廓點集創(chuàng)建模塊、 局部圖像投票模塊、參數(shù)窄化模塊、局部圖像粘貼模塊等??刂颇K101 具有這樣的功能在輸入圖像信息17為報告的情況下,將呈現(xiàn)在報告上 的字符串圖像(stringimage)轉(zhuǎn)換成計算機可以處理的文本代碼信息。
存儲器102是要展開存儲在存儲模塊104中的圖像處理程序108的 存儲區(qū)。存儲器102是存儲控制模塊101執(zhí)行圖像處理程序108時產(chǎn)生 的各種操作結(jié)果的存儲區(qū)。存儲器102可以是隨機存儲存儲器(RAM)。
輸入模塊103接收與用戶要指定給控制模塊101的各種命令或圖像 有關(guān)的信息。輸入模塊103可以是鍵盤、鼠標器或觸摸板。輸入模塊103 例如可以是圖像掃描器。存儲模塊104例如可以是硬盤驅(qū)動器。存儲模 塊104可以存儲圖像處理程序108、作為基準報告圖像的基準圖像信息(其 在下文中將被稱為模板圖像信息)18、輸入圖像信息17等。輸出模塊105 輸出圖像處理的結(jié)果信息。輸出模塊105例如可以是顯示器(顯示裝置)。
輪廓點集創(chuàng)建模塊提取來自輸入圖像信息17的圖像內(nèi)呈現(xiàn)的形狀 的輪廓。輪廓點集創(chuàng)建模塊創(chuàng)建構(gòu)成輸入圖像信息17中包含的框線信息 的輪廓(筆劃)的點集(輸入圖像輪廓點集)。框線用于限定報告內(nèi)的文 本的輸入?yún)^(qū)域,或者更清楚地示出報告的特征。輪廓點集創(chuàng)建模塊可以預(yù)先標識模板圖像信息18中包含的輪廓的點集(模板輪廓點集)。例如, 輪廓點集創(chuàng)建模塊在登記模板圖像信息18時限定模板輪廓點集。輪廓點 集創(chuàng)建模塊將限定的模板輪廓點集存儲到存儲模塊104中。輪廓點集創(chuàng) 建模塊獲取與將輸入圖像信息17分成格子圖案所得的各局部圖像相對應(yīng) 的輸入圖像輪廓點集和模板輪廓點集。
局部圖像投票模塊使用與將輸入圖像信息17分成格子圖案所得的 各局部圖像相對應(yīng)的模板輪廓點集和輸入圖像輪廓點集,基于通用霍夫 變換的原理,在示出偏移參數(shù)的投票空間投票。作為通過局部圖像投票 模塊投票的結(jié)果,投票空間內(nèi)具有較高的投票頻率的區(qū)域可以是偏移參 數(shù)的估計值。
參數(shù)窄化模塊按步進方式將通用霍夫變換的操作參數(shù)(分辨率)從 低分辨率切換成高分辨率。如果目標精度是第二小數(shù)位,則該操作參數(shù) 是第一小數(shù)位的值。在獲取了第一小數(shù)位的候選之后,將該操作參數(shù)假 定為第一小數(shù)位的值。通過重復(fù)這個處理,計算出具有目標精度的偏移 參數(shù)。參數(shù)窄化模塊允許逐步窄化偏移參數(shù)的候選,同時抑制輪廓點數(shù) 量和/或表示偏移參數(shù)的投票空間的尺寸的大量增加。
局部圖像粘貼模塊在根據(jù)將圖像分成格子圖案所得的區(qū)域計算出的 偏移參數(shù)中提取具有較高可靠性的偏移參數(shù)。局部圖像粘貼模塊通過內(nèi) 插局部圖像區(qū)的偏移參數(shù)來計算針對輸入圖像信息17內(nèi)各像素的偏移參 數(shù)。結(jié)果,即使在局部圖像區(qū)之間偏移參數(shù)不同的情況下,局部圖像粘 貼模塊也可以平滑地粘貼局部圖像區(qū)。局部圖像粘貼模塊輸出利用與輸 入圖像信息17內(nèi)的像素相對應(yīng)的偏移參數(shù)進行位置修正所得的修正圖 像。
接下來,對根據(jù)這種實施方式的從接收輸入圖像信息17到輸出修正 圖像的處理進行說明。圖2是從接收輸入圖像信息17到輸出修正圖像的 處理的流程圖??刂颇K101根據(jù)輸入圖像信息17創(chuàng)建輪廓點集(S01)。 控制模塊101將輸入圖像信息17分成多個局部圖像區(qū)(S02)??刂颇K 101采用預(yù)定尺寸的矩形將輸入圖像信息17劃分成格子圖案。劃分出的 矩形被稱為局部圖像區(qū)。控制模塊101對各局部圖像區(qū)執(zhí)行通用霍夫變 換而執(zhí)行投票處理(S03)。當在S03中執(zhí)行通用霍夫變換時,控制模塊 101執(zhí)行窄化投票處理的操作參數(shù)的處理(S04)??刂颇K101在S03 中執(zhí)行對局部圖像的投票處理,直到獲取了針對所有局部圖像區(qū)的投票 結(jié)果為止(S05:否)。如果獲取了針對所有局部圖像區(qū)的投票結(jié)果(S05: 是),則控制模塊101執(zhí)行粘貼局部圖像的處理(S06)。下面,對這些步 驟進行詳細說明。
這種實施方式的輸入圖像信息17可以是黑白色二值報告、彩色報告 或灰度級報告。圖3是輸入圖像信息17的實施例。輸入圖像信息17具 有框線信息173-1、框線信息173-2以及文本信息172。框線信息173-1 是要輸入特征的框架。框線信息173-2是澄清報告的特征同時不是直接寫 入特征的區(qū)域的框架。圖像處理裝置1獲取準確地定位框線信息173-1 以便高精度地檢測文本信息172的修正圖像。為了獲取修正圖像,圖像 處理裝置1將框線信息173-1和框線信息173-2與模板圖像信息相對準。 框線信息173-1、 173-4以及173-5是輸入圖像信息17的框架中的有色框 架。
控制模塊101執(zhí)行針對輸入圖像信息17的退出(dropout)處理。該 退出處理是將預(yù)先打印在報告上的線和/或文本的色彩中的特定顏色(退 出顏色)中的一部分限定為在隨后的圖像處理中不處理的圖形信息的處理。
接下來,對SOl中的輪廓點集創(chuàng)建處理進行說明。根據(jù)這種實施方 式,輪廓點集創(chuàng)建模塊針對色彩和灰度級報告執(zhí)行根據(jù)Niblack方法對輸 入圖像進行二值化的處理。該Niback方法是局部二值化處理方法。 Niblack方法是這樣的二值化方法其限定與對象像素(subject pixel)有 關(guān)的周圍信息(如每一條邊都具有等于5個像素的長度的矩形和每一條 邊都具有7個像素的矩形)并且獲取針對各像素的閾值。首先,將矩形 過濾器限定為背景分離處理。根據(jù)矩形過濾器內(nèi)的密度分散值確定背景 部分或信息部分。接著,限定用于與背景分離的閾值(omin),并且如果 該過濾器內(nèi)的計算結(jié)果等于或高于cimin,則確定存在信息。如果密度分 散值等于或高于閾值(cnnin),則獲取聚焦像素k的密度的閾值,并且確
定白色像素或黑色像素。在隨后處理中,黑色像素是要被操作的像素。 黑色像素可以被包括在框線的邊緣線或文本信息中。輪廓點集創(chuàng)建模塊 在轉(zhuǎn)換后的二值圖形信息內(nèi)創(chuàng)建筆劃的輪廓點集。
圖4示出了模板圖像信息18。該模板圖像信息18是對報告進行二 值化所得的圖像。模板圖像信息18是報告的框線的形狀的基準??蚓€的 形狀例如根據(jù)相對于基準點的距離、角度、框線的擴展/收縮的尺寸以及 框線的擴展/收縮方向來標識。在該報告的情況下,可以標識輸入特征的 位置。在模板圖像信息18的文本要輸入的區(qū)域的坐標信息已知的情況下, 當裝置執(zhí)行讀取文本數(shù)據(jù)的處理時,容易檢測文本形狀信息。因此,可 以通過將根據(jù)框線的位置旋轉(zhuǎn)角、擴展/收縮等所得的形狀與模板圖像信 息18的框線的形狀相匹配而高精度地讀出輸入圖像信息17的框線內(nèi)的 字符串。
下面是為應(yīng)用Niblack而使用的設(shè)置值的實施例。經(jīng)受局部Niblack 的窗口的一邊的長度是"5"。 Niblack的設(shè)置值在此為"-0.1"。通過將平 均密度差閾值添加至將聚焦像素k的密度乘以標準偏差所得的值來計算 該設(shè)置值。平均密度差閾值在此為"8.0"。平均邊緣強度閾值在此為"8.0"。 邊緣數(shù)閾值為"6"。
這里,對用于S02中的輪廓點集創(chuàng)建處理的另一方法進行說明。輪 廓點集創(chuàng)建模塊通過Sobd邊緣過濾器從具有顏色/陰影像素值的輸入圖 像信息17中提取輪廓點集。輪廓點集創(chuàng)建模塊創(chuàng)建構(gòu)成所提取的輸入圖 像信息17的框線的像素集。
輪廓點集創(chuàng)建模塊利用Sobel邊緣過濾器在圖像上執(zhí)行區(qū)域劃分。 該區(qū)域劃分是獲取不是輸入圖像信息17內(nèi)的背景的筆劃的像素的處理。 輪廓點集創(chuàng)建模塊通過比較針對像素檢測出的邊緣的值與預(yù)定閾值來確 定聚焦像素是否為背景像素。圖5是Sobel水平邊緣過濾器的設(shè)置值21-1 。 圖6是針對Sobel垂直邊緣過濾器的設(shè)置值21-2。輪廓點集創(chuàng)建模塊計算 輸入圖像信息17的各像素的邊緣值。例如,輪廓點集創(chuàng)建模塊可以限定 邊緣值,以使其成為整合成255或以下的值。例如,在將密度閾值預(yù)先 設(shè)置成25的情況下,如果該邊緣值小于25,則輪廓點集創(chuàng)建模塊確定該聚焦像素是黑色像素。
邊緣值可以根據(jù)報告來設(shè)置。例如,對于彩色報告中的背景顏色與 提取的文本顏色之間存在較小色差的情況下來說,該邊緣值必須被設(shè)置 得較低。另一方面,如果背景顏色與要提取的文本顏色之間存在較大色
差,則即使將邊緣值設(shè)置得較高也可進行提取。這里,水平分量值是H, 而垂直分量值是V。輪廓點集創(chuàng)建模塊根據(jù)下面的等式(等式1)計算邊 緣值。
<formula>complex formula see original document page 10</formula>(等式l)
對于圖像處理的對象是報告圖像的情況來說,水平分量的邊緣分量 和垂直分量的邊緣分量可以是通用霍夫變換處理的對象。這是因為與一 般報告相比,報告圖像的框架或文本的形狀具有更多的縱向(垂直)線 段或橫向(水平)線段。通用霍夫變換考慮了黑色像素的方向分量。因 此,對于報告圖像的情況來說,輪廓點集創(chuàng)建模塊根據(jù)獲取的各種邊緣 分量的方向分量提取水平分量的邊緣分量和垂直分量的邊緣分量。另選 的是,輪廓點集創(chuàng)建模塊可構(gòu)造成將獲取的各種邊緣分量的方向分量分 類成水平分量的邊緣分量和垂直分量的邊緣分量。這種構(gòu)造因為在通用 霍夫變換中縮減了要比較的元素數(shù),所以可以縮減為了局部圖像投票模 塊計算偏移參數(shù)所需的時間。
對于報告圖像是對象的情況來說,僅僅水平分量的邊緣分量可以是 通用霍夫變換的對象,或者僅僅垂直分量的邊緣分量可以是通用霍夫變 換的對象。在這種情況下,輪廓點集創(chuàng)建模塊將根據(jù)通用霍夫變換計算 偏移參數(shù)的處理應(yīng)用至水平分量和垂直分量中的任一個。這種構(gòu)造因為 可以更多地減少通用霍夫變換中要比較的元素數(shù),所以可以縮減局部圖 像投票模塊計算偏移參數(shù)所需的時間。輪廓點集創(chuàng)建模塊可以處理具有 更多像素的方向分量,作為根據(jù)通用霍夫變換計算偏移參數(shù)的處理的對 象。
接下來,對將輸入圖像信息17分成局部圖像區(qū)的處理進行說明。 局部圖像投票模塊將輸入圖像信息17劃分為格子圖案。預(yù)先限定了 劃分為格子圖案的范圍。要劃分的范圍取決于報告的格式。按包括報告的圖像內(nèi)的獨特元素單位的方式來劃分該范圍。因為精細地劃分報告可 以縮減針對一個范圍的投票處理的次數(shù),所以可以有利地縮減局部圖像 投票模塊計算的量。另一方面,精細劃分報告所得的范圍不具有不利地 縮減局部圖像投票模塊的處理結(jié)果的可靠性的任何圖形特征。因此,將 覆蓋報告內(nèi)特征部分的區(qū)域限定為所述范圍。
圖7是將輸入圖像信息17分成多個局部圖像區(qū)的圖。標號176指劃 分輸入圖像信息17的線。根據(jù)這種實施方式,線176將輸入圖像信息17 分成格子圖案。例如,當將具有連續(xù)格子形狀的表分成多個范圍時,在 格子的每一個交點處出現(xiàn)偏移參數(shù)的峰值。可以通過將整個表限定為所 述范圍來防止通用霍夫變換中出現(xiàn)的偽峰值。在圖7中,局部圖像投票 模塊將輸入圖像信息17分成水平3個乘以垂直3個共9個局部圖像區(qū) 170。
接下來,對S03中對局部圖像進行投票的處理進行說明。局部圖像 投票模塊根據(jù)與各局部圖像區(qū)相對應(yīng)的模板輪廓點集和輸入圖像輪廓點 集計算偏移參數(shù)。局部圖像投票模塊根據(jù)通用霍夫變換的原理計算偏移 參數(shù)。通用霍夫變換對表示偏移參數(shù)的投票空間進行投票。通用霍夫變 換根據(jù)投票空間中的具有高投票頻率的局部圖像區(qū)的參數(shù)輸出針對該參 數(shù)的估計值。
局部圖像投票模塊根據(jù)Bucket方法來限定投票空間。Bucket方法是 計算機科學的一種方法。Bucket方法將具有空間范圍的對象分成多個較 小區(qū)域。因為可以將通用霍夫變換應(yīng)用至每一個局部圖像區(qū),所以應(yīng)用 Bucket方法可以增加處理的速度。
圖8示出了針對應(yīng)用Bucekt方法的說明圖。局部圖像投票模塊還劃 分輸入圖像信息17的在S02中劃分為格子圖案所得的局部圖像區(qū)170。 標號175指劃分局部圖像區(qū)170的格子線。預(yù)先限定了劃分用格子線之 間的距離。例如,限定了偏移的最大量,其例如被希望為出現(xiàn)在圖像掃 描儀裝置中。對于圖像掃描儀中出現(xiàn)的偏移量為lcm的情況來說,局部 圖像投票模塊按各自等于1 cm的多個間隔創(chuàng)建紙質(zhì)報告的格子線。標號 183指模板圖像信息18的與輸入圖像信息17的局部圖像區(qū)170相對應(yīng)的
區(qū)域。局部圖像投票模塊處理區(qū)域183中被格子線175包圍的區(qū)域,作 為模板圖像信息18的局部圖像區(qū)180。
局部圖像投票模塊通過將通用霍夫變換的原理應(yīng)用至各局部圖像區(qū) 來計算偏移參數(shù)。局部圖像投票模塊使用模板輪廓點集和輸入圖像輪廓 點集,來將允許投票空間中的最大得票數(shù)的參數(shù)估計為偏移參數(shù)。通用 霍夫變換是霍夫變換的應(yīng)用?;舴蜃儞Q是將初始(x、 y)坐標系統(tǒng)變換 成(R、 e)極坐標系統(tǒng)并且基于極坐標系統(tǒng)檢測直線的形狀的方法。不 僅對于直線來說,而且對于采用任意形式的圖形來說,通用霍夫變換都 可以提取平行移動/旋轉(zhuǎn)/擴展或收縮等的參數(shù)。根據(jù)這種實施方式,通過 通用霍夫變換計算出的參數(shù)是報告的偏移參數(shù)。通用霍夫變換對模板輪 廓點集與輸入圖像輪廓點集之間的坐標差進行投票并且將最多投票參數(shù) 處理為要獲取的參數(shù)。因為通用霍夫變換輪詢(poll)具有最大得票數(shù)的 參數(shù),所以即使對象圖像具有噪聲或中斷,該檢測也會具有高精度。
對根據(jù)這種實施方式的通用霍夫變換的處理進行說明。局部圖像投 票模塊根據(jù)下面的處理對表示偏移參數(shù)的投票空間進行投票。
局部圖像投票模塊限定從模板圖像信息18的局部圖像區(qū)內(nèi)的基準 點和模板圖像信息18中的基準點起到局部圖像區(qū)180上的各黑色像素的 矢量。圖9示出了模板圖像信息18的局部圖像區(qū)。標號180指模板圖像 信息18的局部圖像區(qū)。標號181指周部圖像區(qū)180內(nèi)的基準點。基準點 181被預(yù)先限定。標號182指局部圖像區(qū)180內(nèi)的模板輪廓點集。
局部圖像投票模塊限定比較矢量,其是相對基準點181對稱的矢量。 圖10是比較矢量的實施例。標號191是比較矢量190與局部圖像區(qū)180 之間的對稱中心。中心191對應(yīng)于基準點181。標號192指針對比較矢量 190的模板輪廓點集。比較矢量190和模板輪廓點集182針對一點相對稱。 因此,對于作為比較矢量的對象的中心191是上述模板輪廓點集182的 情況來說,模板輪廓點集192始終經(jīng)過基準點181。值得注意的是,通用 霍夫變換不僅可以考慮像素的交疊,而且可以考慮像素的方向矢量的交 疊。增加針對通用霍夫變換的參數(shù)的數(shù)量可以增加計算偏移量的精度, 然而,這導(dǎo)致了大量的計算。因此,根據(jù)圖像處理裝置1的硬件的處理能力限定參數(shù)的維度。
局部圖像投票模塊根據(jù)下面的處理來執(zhí)行投票處理。圖11是投票處 理的流程圖。局部圖像投票模塊創(chuàng)建投票空間(Sll)。投票空間是多維 空間。
圖12是投票空間的構(gòu)造實施例。標號30指投票空間的數(shù)據(jù)構(gòu)造圖。 標號30-1到30-7是存儲針對水平軸向位置32和垂直軸向位置33的得票 數(shù)的區(qū)域。區(qū)域30-1到30-7是在比較矢量190的角旋轉(zhuǎn)一度的情況下的 區(qū)域。另外,該空間基于線性擴展/收縮的比例和/或線性擴展/收縮的方向 增加。標號31指用于存儲針對各參數(shù)創(chuàng)建的得票數(shù)的區(qū)域。
局部圖像投票模塊基于諸如水平軸向位置、垂直軸向位置、旋轉(zhuǎn)角、 線性擴展/收縮的比例和線性擴展/收縮的方向以及參數(shù)的精度的參數(shù)類 型來確定投票空間的尺寸(S12)。
接下來,局部圖像投票模塊通過下面的步驟確定要投票的對象并且 在投票空間中對其進行投票(S13)。值得注意的是,通用霍夫變換可以 考慮輪廓線的方向矢量。為簡化說明,在這種實施方式的描述中省略了 針對輪廓線的方向矢量的描述。
圖13是投票處理的原理圖。標號170指輸入圖像信息17的局部圖 像區(qū)。標號171指局部圖像區(qū)170的基準點。在此假定基準點171相對 模板圖像信息18的周部圖像區(qū)180中的基準點180偏移橫向x、縱向y 以及旋轉(zhuǎn)角e。
局部圖像投票模塊基于當前旋轉(zhuǎn)角的參數(shù)來識別比較矢量190的旋 轉(zhuǎn)方向。局部圖像投票模塊在輸入圖像信息17的局部圖像區(qū)170的位置 上設(shè)置作為旋轉(zhuǎn)比較矢量190的對象的、基于所述參數(shù)標識其水平軸向 和垂直軸向的中心。局部圖像投票模塊針對局部圖像區(qū)170內(nèi)的、比較 矢量l卯與模板輪廓點集192交疊的輸入圖像輪廓點集173-1和173-2的 水平軸向位置和垂直軸向位置進行投票。對于水平x、垂直y以及旋轉(zhuǎn)角 6的參數(shù)值表示偏移量,并且對象中心191被設(shè)置在輸入圖像輪廓點集 173-1和173-2上的情況來說,模板輪廓點集192始終經(jīng)過基準點171。 局部圖像投票模塊可以獲取可以作為具有特定參數(shù)的最大值的基準點。
局部圖像投票模塊執(zhí)行針對局部圖像區(qū)170內(nèi)的所有像素的投票處 理。局部圖像投票模塊還可以僅在局部圖像區(qū)170的黑色像素上限定比 較矢量190的對象中心191。通過僅在局部圖像區(qū)170的黑色像素上執(zhí)行 投票處理,與在局部圖像區(qū)170的所有像素上執(zhí)行投票處理的操作量相 比,可以更有利地減少投票所需的操作量。
對于要計算偏移參數(shù)的對象是報告的情況來說,輸入圖像信息17與 模板圖像信息18之間的平行移動的值(x、 y)和旋轉(zhuǎn)角的值(e)處于 限制范圍內(nèi)。因此,根據(jù)這種實施方式的通用霍夫變換利用針對限制旋 轉(zhuǎn)角的每一個值e的一對值(x、 y)進行投票,并將得票最多的旋轉(zhuǎn)角 的值e和平行移動的值(x、 y)的組合作為偏移參數(shù)的計算結(jié)果。
在對所有預(yù)置參數(shù)的組合執(zhí)行完投票處理之前(S14:否),局部圖 像投票模塊重復(fù)S12和S13中的處理。在局部圖像投票模塊對所有預(yù)置 參數(shù)的組合執(zhí)行了投票處理之后(S14:是),局部圖像投票模塊根據(jù)獲 取的投票空間的分布圖檢測最大參數(shù)。該最大參數(shù)被估計為模板圖像信 息18的局部圖像區(qū)180與輸入圖像信息17的局部圖像區(qū)之間的仿射變 換(Affme transformation)矩陣。該仿射變換矩陣可以是偏移參數(shù)。
在這種實施方式中使用的輸入圖像信息17等同于利用偏移參數(shù)對 模板圖像信息18進行仿射變換的結(jié)果。仿射變換是諸如平行移動和旋轉(zhuǎn) 的線性變換。因此,可以通過利用偏移參數(shù)對輸入圖像信息17執(zhí)行逆變 換來創(chuàng)建修正偏移所得的修正圖像。
局部圖像投票模塊獲取水平軸行程Tx、垂直軸行程Ty以及旋轉(zhuǎn)角0, 作為偏移參數(shù)。局部圖像投票模塊在針對線性擴展/收縮的比例和線性擴 展/收縮的方向執(zhí)行投票處理時獲取線性擴展/收縮的比例和線性擴展/收 縮的方向的參數(shù)。偏移參數(shù)是仿射變換矩陣,并且輸入圖像信息和模板 報告圖像具有線性映射的關(guān)系。變換等式由下面的等式(等式2)來表示。
<formula>complex formula see original document page 14</formula>
等式2中的值(x、 y)是變換之前的坐標。根據(jù)這種實施方式,它 們是模板圖像信息18中的像素的坐標。值(x', y')是變換之后的坐標。 根據(jù)這種實施方式,它們是輸入圖像信息17中的像素的坐標。符號Tx、Ty以及e是仿射變換矩陣。
根據(jù)(等式2)得出用于根據(jù)輸入圖像信息17獲取修正圖像信息的
等式(等式3)。
<formula>complex formula see original document page 15</formula>
(等式3)的值(x", y")是修正圖像中的像素的坐標。
接下來,對S04中的參數(shù)窄化處理進行說明。為了縮減圖像處理所 需計算量,這種實施方式執(zhí)行具有多分辨率的多級處理。根據(jù)這種實施 方式的要通過通用霍夫變換獲取的圖像信息的偏移參數(shù)是水平和垂直平 行移動的偏移、旋轉(zhuǎn)移動的偏移和線性擴展/收縮的方向、線性擴展/收縮 的比例等。通用霍夫變換需要存儲針對每一個具有目標精度的參數(shù)的投 票結(jié)果的存儲器區(qū)。投票空間的尺寸按數(shù)量等于參數(shù)的類型數(shù)量的乘數(shù) 級增加。因此,從一開始就執(zhí)行用于獲取具有目標精度的三維參數(shù)的操 作會導(dǎo)致圖像處理需要的大量處理時間和用于存儲三維參數(shù)的大量存儲 器空間。
因此,參數(shù)窄化模塊執(zhí)行首先獲取偏移參數(shù)的粗略估計值接著精確 獲取圍繞粗略估計值的參數(shù)的多級處理。參數(shù)窄化模塊將局部圖像區(qū)的 結(jié)果從粗略結(jié)果改變成精細結(jié)果。作為按多級改變分辨率的結(jié)果,可以 防止表示輪廓點數(shù)量和/或偏移參數(shù)的大尺寸投票空間,并且可以逐漸窄 化最佳參數(shù)的候選。結(jié)果,可以縮減要由參數(shù)窄化模塊執(zhí)行的投票處理 中的計算量,并且可以在不造成任何精度上的降低的情況下,計算出偏 移參數(shù)。例如,可以將為獲取估計值而限定的通用霍夫變換的對象的改 變量(步驟數(shù))限定為使該結(jié)果可以與圖像處理裝置1內(nèi)的存儲器區(qū)相 適配,并且可以使用整個存儲器區(qū)。
例如,參數(shù)窄化模塊可以通過下面的方法限定針對投票空間的參數(shù) 的增量。參數(shù)窄化模塊根據(jù)參數(shù)可以具有的范圍和存儲器區(qū)的尺寸計算 可用于各參數(shù)的存儲器區(qū)。對于平行移動(水平和垂直)和旋轉(zhuǎn)角的情 況來說,存儲器區(qū)是三維的,并且參數(shù)窄化模塊將存儲器分成三個。接 下來,參數(shù)窄化模塊根據(jù)參數(shù)可以采取的范圍、存儲參數(shù)的各存儲器量 以及分配給對象參數(shù)的存儲器的量獲取各參數(shù)的最佳增量。
下面,對計算角參數(shù)的實施例進行說明。對于局部圖像投票模塊針
對一個投票需要處理時間a (ms)和估計角的數(shù)目為P的情況來說,直 到獲取仿射變換矩陣為止所需的處理時間為a(3 (rns)。因此,利用多分 辨率的參數(shù)窄化模塊按步驟窄化P估計角。
在第一步驟中的投票處理中,參數(shù)窄化模塊將估計角分成n個范圍 并且使用每一個范圍的中心角,來獲取被最多投票的角。第一步驟中的 投票處理是用于窄化角范圍的目的的處理。因為不需要投票位置的精度, 所以參數(shù)窄化模塊利用縮減輸入圖像信息17所得的具有更少黑色像素信 息的圖像縮減了經(jīng)受投票處理的黑色像素的數(shù)量,并且可以進一步縮減 處理時間。
為了減少非意想的角被偶然地最多投票的情況,要作為窄化結(jié)果而 選擇的角應(yīng)是滿足等式(等式4)的條件的角。<formula>complex formula see original document page 16</formula>(等式4)
在等式4中,B指按任意角的得票數(shù),Bm指按具有最大得票數(shù)的角 的得票數(shù),而a是預(yù)選閾值。
在第二步驟中的投票處理中,參數(shù)窄化模塊對選定角范圍中呈現(xiàn)的 角進行投票。參數(shù)窄化模塊獲取具有最多得票的投票空間的角,作為仿 射變換矩陣。該仿射變換矩陣是偏移參數(shù)。值得注意的是,對于用于投 票的黑色像素的數(shù)量具有可靠的比例的情況來說,參數(shù)窄化模塊可以獲
,取最大投票位置,作為仿射變換矩陣。對于第二步驟中的投票處理是用 于識別角的目的的處理來說,參數(shù)窄化模塊在第三步驟中執(zhí)行投票處理。 第三步驟中的投票處理僅在識別出的角執(zhí)行針對投票空間的投票處理。 因為此處以識別最大得票位置為目的,所以要使用的黑色像素的數(shù)量必 須足夠。預(yù)先限定了每一個步驟中的角的范圍的大小。
局部圖像投票模塊可以通過通用霍夫變換窄化經(jīng)受投票處理的像 素。局部圖像投票模塊基于局部輪廓點集窄化投票處理。
對于寬度方向上具有W個像素而高度方向上具有H個像素的圖像內(nèi) 的黑色像素與全部像素的比例為G。/。的情況來說,該圖像中的黑色像素的 數(shù)量為(G*W*H/100)。因此,總處理量為N^ ((G*W*H/100)的平方),
其中在根據(jù)通用霍夫變換進行投票處理時的處理量對模板圖像信息18和 輸入圖像信息的全部黑色像素執(zhí)行一次。
在通用霍夫變換中,是否出現(xiàn)最大值(峰值)處的得票位置是重要 的。因此,如果出現(xiàn)峰值,則不需要對所有黑色像素執(zhí)行投票處理。如 果投票處理被執(zhí)行了較少次數(shù),則可以縮減處理時間。然而,對于模板 圖像信息18的黑色像素的數(shù)量和輸入圖像信息的黑色像素的數(shù)量例如被 縮減至F。/。的情況來說,偏移參數(shù)的計算精度降低了。更具體地說,針對 要被投票的位置的投票率降低至((F的平方)/100) %,其中,在對所 有黑色像素執(zhí)行投票處理的情況下,投票率為100%。
因此,根據(jù)這種實施方式,僅縮減輸入圖像信息17的黑色像素的數(shù) 量。例如,管理者預(yù)選要用于輸出修正圖像的處理的黑色像素的數(shù)量占 輸入圖像信息17的全部黑色像素的數(shù)量的比例。這是因為,對于輸入圖 像信息17的黑色像素的數(shù)量較低的情況來說,利用模板圖像信息18的 投票結(jié)果具有較少劣化的統(tǒng)計學精度。更具體地說,這是因為模板圖像 信息18不包含噪聲信息而輸入圖像信息17可能包含噪聲信息。值得注 意的是,該方法可以在對模板圖像信息1S執(zhí)行通用霍夫變換的處理之前 縮減該模板圖像信息的黑色像素。然而,檢測的精度在縮減模板圖像信 息18的黑色像素的數(shù)量時降低。
要縮減的黑色像素的數(shù)量可以根據(jù)執(zhí)行通用霍夫變換的計算機的處 理能力恰當改變。通過進行這種操作,局部圖像投票模塊可以通過僅對 輸入圖像信息17的要用于投票處理的一部分黑色像素執(zhí)行通用霍夫變換 的操作來縮減處理時間。
接下來,對局部圖像粘貼模塊在S06中根據(jù)局部圖像投票模塊計算 出的各局部圖像區(qū)的偏移參數(shù)來輸出輸入圖像信息的修正圖像的處理進 行說明。
通用霍夫變換所需的計算量隨變換參數(shù)的數(shù)量增加。為了在實用的 處理時間內(nèi)獲取根據(jù)通用霍夫變換提供的結(jié)果,可以將偏移限制成仿射 變換的偏移。因此,對于偏移包括局部擴展/收縮(非線性擴展/收縮)的 情況來說,難于估計偏移參數(shù)。因此,在通過應(yīng)用通用霍夫變換獲取了針對允許仿射變換的范圍內(nèi)的各局部圖像區(qū)的偏移參數(shù)之后,局部圖像 粘貼模塊通過對圖像變換參數(shù)的雙線性插值來對局部圖像區(qū)進行插值。 局部圖像粘貼模塊不僅可以修正因仿射變換造成的畸變而且可以修正因 局部擴展/收縮而造成的畸變。
實際輸入圖像信息17具有非線性擴展/收縮。非線性擴展/收縮例如 可能在圖像掃描儀裝置獲取報告上的圖像信息時因自動饋紙器的旋轉(zhuǎn)不 均和/或報告紙的顫動而造成。
局部圖像投票模塊計算各個局部圖像區(qū)的修正圖像。偏移參數(shù)值可 能在局部圖像區(qū)之間不同。因此,當將局部圖像區(qū)的修正圖像按照原狀 合并時在區(qū)域之間的邊界可能出現(xiàn)不連續(xù)部分(不重合)。如果可以獲取 連續(xù)的用于修正非連續(xù)部分的參數(shù),則可以輸出修正局部擴展/收縮畸變 所得的修正圖像信息。
圖14是用于計算與各像素相對應(yīng)的偏移參數(shù)的說明圖。標號52指 與在輸入圖像信息17的各局部圖像區(qū)170中獲取的偏移參數(shù)有關(guān)的像 素。偏移參數(shù)52例如與各局部圖像區(qū)170的中心處的像素有關(guān)。
局部圖像粘貼模塊計算與輸入圖像信息17的局部圖像區(qū)170內(nèi)的各 像素相對應(yīng)的偏移參數(shù)。例如可以通過對在局部圖像區(qū)中獲取的偏移參 數(shù)值進行插值來計算與輸入圖像信息17的每一個像素相對應(yīng)的修正參數(shù) 值。
標號53指在局部圖像區(qū)處于輸入圖像信息17外的情況下各局部圖 像區(qū)的中心的位置。標號54指用于通過控制模塊101對輸入圖像信息17 的像素的偏移參數(shù)值進行插值的矩形區(qū)。矩形區(qū)54的頂點是像素52或 像素53。輸入圖像信息17的各局部圖像區(qū)170的像素52不存在于輸入 圖像信息17的外邊緣外。因此,控制模塊101不能創(chuàng)建矩形區(qū)54。因此, 控制模塊101定義輸入圖像信息17外的虛擬像素53。像素53的位置處 于具有與輸入圖像信息17內(nèi)的像素52形成的矩形區(qū)54的形狀相同的形 狀的矩形區(qū)的頂點處??刂颇K101將外邊緣處的局部圖像區(qū)170的像 素52的偏移參數(shù)值定義為像素53的偏移參數(shù)值。
對于輸入圖像信息17具有M x N個局部圖像區(qū)來說,每一個都用于
計算各像素的偏移參數(shù)值的矩形區(qū)54的數(shù)量為(M+l) x (N+l)。接 下來,局部圖像粘貼模塊計算與各像素相對應(yīng)的偏移參數(shù)值。
圖15是示出了圖14中的輸入圖像信息17的一部分中的區(qū)域55的圖。
標號55指輸入圖像信息17的一部分中的區(qū)域。標號52指與針對各 局部圖像區(qū)170計算出的偏移參數(shù)值有關(guān)的像素。偏移參數(shù)值A(chǔ)是針對 局部圖像區(qū)A的中心位置處的像素52-1的偏移參數(shù)值。偏移參數(shù)值B是 針對局部圖像區(qū)B的中心位置處的像素52-2的偏移參數(shù)值。偏移參數(shù)值 C是針對局部圖像區(qū)C的中心位置處的像素52-3的偏移參數(shù)值。偏移參 數(shù)值D是針對局部圖像區(qū)D的中心位置處的像素52-4的偏移參數(shù)值。
標號56指經(jīng)受計算的像素。像素56的修正參數(shù)值在此為E。標號 57指像素E的水平位置。水平位置57是點X,在該點X處,從像素E 起的、與連接像素52-1和像素52-3的直線平行的直線與連接像素52-1 和像素52-2的直線相交。點X位于這樣的位置處,g卩,在該位置處,對 于像素52-1與像素52-2之間的距離為"1"的情況來說,距像素52-1的 距離為"X",而距像素52-2的距離為"l-X"。垂直位置58具有點Y, 在該點Y處,從像素E起的與連接像素52-1和像素52-2的直線平行的 直線與連接像素52-1和像素52-3的直線相交。點Y位于這樣的位置處, 即,在該位置處,對于像素52-1與像素52-3之間的距離為"1"的情況 來說,距像素52-l的距離為"Y",而距像素52-3的距離為"1-Y"。
輸入圖像信息17中的像素56的修正參數(shù)例如通過按下面的等式(等 式5)進行雙線性插值來計算。
<formula>complex formula see original document page 19</formula> (等式5)
局部圖像粘貼模塊利用修正參數(shù)修正輸入圖像信息17中的每一個 像素。局部圖像粘貼模塊輸出修正后的圖像,作為"修正圖像"。
在此,對要通過局部圖像粘貼模塊執(zhí)行的其它實施例進行說明。局 部圖像粘貼模塊可以僅利用高度可靠的偏移參數(shù)通過雙線性插值來計算 針對各像素的修正參數(shù)。作為對各個局部圖像區(qū)執(zhí)行投票處理的結(jié)果而 獲取的仿射變換矩陣可能不是始終有效的。因此,局部圖像粘貼模塊通過將投票處理計算出的數(shù)據(jù)值與預(yù)置閾值相比較來確定有效性。因為局 部圖像粘貼模塊僅使用有效偏移參數(shù)來執(zhí)行針對像素的修正處理,結(jié)果, 與直接利用根據(jù)通用霍夫變換獲取的所有偏移參數(shù)值進行修正相比,可 以更準確地執(zhí)行修正。
局部圖像粘貼模塊基于是否滿足下面的等式(等式6)中的條件來 確定針對每一個局部圖像區(qū)計算出的仿射變換矩陣是否正確。
"EB>0" n "MC/EB>CB" (等式6)
在此,EB是輸入圖像信息17的局部圖像區(qū)170的黑色像素的數(shù)量。 MC是投票空間內(nèi)的最大得票數(shù)。CB是用于確定它是否為正常仿射變換 矩陣的閾值。CB是統(tǒng)計學地獲取的允許正常仿射變換矩陣的值。局部圖 像粘貼模塊將滿足等式6中的條件的投票結(jié)果確定為有效區(qū)域中的仿射 變換矩陣。
接下來,針對被確定為具有無效仿射變換矩陣的局部圖像區(qū),局部 圖像粘貼模塊根據(jù)下面的處理計算偏移參數(shù)。局部圖像粘貼模塊通過根 據(jù)具有有效仿射變換矩陣的其它局部圖像區(qū)的偏移參數(shù)進行線性插值, 來計算針對具有無效仿射變換矩陣的局部圖像區(qū)的偏移參數(shù)。
根據(jù)這種實施方式,局部圖像粘貼模塊例如可以從輸入圖像信息17 的上左處的局部圖像區(qū)起按次序執(zhí)行確定處理。如果檢測到具有無效仿 射變換矩陣的局部圖像區(qū)170,則局部圖像粘貼模塊搜索具有無效仿射變 換矩陣的局部圖像區(qū)170的上、下以及左側(cè)和右側(cè)的局部圖像區(qū)170。如 果上、下、左以及右局部圖像區(qū)170是具有正常仿射變換矩陣的局部圖 像區(qū),則局部圖像粘貼模塊針對具有無效仿射變換值的局部圖像區(qū)170 的偏移參數(shù),利用上、下以及左和右正常偏移參數(shù)執(zhí)行線性插值。局部 圖像粘貼模塊利用與該上、下、左以及右正常局部圖像區(qū)的偏移參數(shù)有 關(guān)的像素到與具有無效仿射變換矩陣的局部圖像區(qū)170的偏移參數(shù)有關(guān) 的像素的距離以及該上、下、左以及右正常局部圖像區(qū)的偏移參數(shù)值執(zhí) 行線性插值。
局部圖像粘貼模塊從輸入圖像信息17的上左處的局部圖像區(qū)170起 搜索上述線性插值處理。因此,對于輸入圖像信息中從左側(cè)起的第一列
(Mx 1)上的所有區(qū)域或從頂部起第一行(1 xN)上的所有區(qū)域都是具 有無效仿射變換矩陣的情況來說,局部圖像粘貼模塊不能找到用于執(zhí)行 線性插值的有效區(qū)域。因此,局部圖像粘貼模塊利用第二行或列上的局 部圖像區(qū)170對第一行或列上的局部圖像區(qū)170與執(zhí)行線性插值處理。 因為局部圖像粘貼模塊通過線性插值處理獲取輸入圖像區(qū)17的所有局部 圖像區(qū)170,所以每一個局部圖像區(qū)170的偏移參數(shù)可以是有效仿射變換 矩陣。
局部圖像粘貼模塊執(zhí)行確定偏移參數(shù)值是否有效的處理。例如,根 據(jù)由局部圖像投票模塊執(zhí)行的投票處理來確定投票空間中具有最大值的 參數(shù)。局部圖像投票模塊將投票空間中具有最大值的最高參數(shù)確定為偏 移參數(shù)值。在此,如果與最高參數(shù)相對應(yīng)的最大值高于預(yù)置值,則局部 圖像粘貼模塊確定該偏移參數(shù)值有效。如果與最高參數(shù)相對應(yīng)的最大值 不同于第二最大值達預(yù)置值或更大,則局部圖像粘貼模塊也確定該偏移 參數(shù)值無效。
局部圖像粘貼模塊在確定偏移參數(shù)值的有效性之后,針對具有無效 偏移參數(shù)值的局部圖像區(qū)中的偏移參數(shù)值,利用另一有效偏移參數(shù)值執(zhí) 行線性插值處理。因此,在一個例程中包括了確定偏移參數(shù)值的有效性 的處理和針對偏移參數(shù)值進行線性插值的處理。
通過局部圖像粘貼模塊來執(zhí)行包括確定處理和線性插值處理的例 程,輸入圖像信息17的全部局部圖像區(qū)可能都是有效區(qū)域。然而,對于 局部地存在具有問題的多個局部圖像區(qū)的情況來說,不能僅通過執(zhí)行一 次該例程將具有無效偏移參數(shù)值的局部圖像區(qū)轉(zhuǎn)換成具有有效偏移參數(shù) 值的局部圖像區(qū)。因此,局部圖像粘貼模塊執(zhí)行包括確定處理和線性插 值處理的例程多次。
局部圖像粘貼模塊獲取與局部圖像區(qū)的中心有關(guān)的有效偏移參數(shù) 值。值得注意的是,局部圖像粘貼模塊可以僅利用有效偏移參數(shù)值來計 算與無效區(qū)域的各像素相對應(yīng)的修正參數(shù)。然而,根據(jù)這種實施方式, 預(yù)先修正了與局部圖像區(qū)有關(guān)的偏移參數(shù)。結(jié)果,有利地簡化了計算修 正參數(shù)的處理。
通過執(zhí)行上述操作,可以輸出根據(jù)用于輸入圖像信息17的模板圖像 進行的有關(guān)于平行移動、旋轉(zhuǎn)移動、線性擴展/收縮以及非線性擴展/收縮 的修正所得的圖像??刂颇K101根據(jù)修正圖像內(nèi)存儲字符串的框架 173-1檢測文本172的圖像信息,并將該圖像信息轉(zhuǎn)換成可以由計算機處 理的文本代碼信息。
權(quán)利要求
1、一種計算機可讀介質(zhì),該計算機可讀介質(zhì)存儲有執(zhí)行用于從一區(qū)域中具有框架和多個字符的圖像中識別出字符的處理的程序,所述處理包括以下步驟區(qū)域劃分步驟,該區(qū)域劃分步驟將所述區(qū)域分成分別具有多個局部圖像的多個局部區(qū)域;模板圖像提供步驟,該模板圖像提供步驟提供具有基準框架圖像的模板圖像;圖像差別計算步驟,該圖像差別計算步驟分別計算所述多個局部圖像與所述模板圖像的所述基準框架圖像之間的差別;不重合度計算步驟,該不重合度計算步驟基于所述多個局部圖像與所述基準框架圖像的所述差別的平均來計算所述圖像與所述模板圖像的不重合度;以及字符識別步驟,該字符識別步驟修正所述不重合度,從所述圖像識別出所述多個字符。
2、 根據(jù)權(quán)利要求1所述的計算機可讀介質(zhì),其中,所述圖像差別計算步驟計算平行移動、旋轉(zhuǎn)角以及線性延伸的比例中的至少一種。
3、 根據(jù)權(quán)利要求1所述的計算機可讀介質(zhì),其中,所述圖像差別計算步驟利用廣義霍夫變換來計算。
4、 根據(jù)權(quán)利要求1所述的計算機可讀介質(zhì),其中,所述圖像差別計算步驟計算所述框架的垂直分量和水平分量中的至少一種的所述差別。
5、 根據(jù)權(quán)利要求1所述的計算機可讀介質(zhì),其中,所述不重合度計算步驟還包括,關(guān)聯(lián)步驟,該關(guān)聯(lián)步驟將所述差別與所述局部圖像的多 個像素中的一個像素相關(guān)聯(lián),和像素差別計算步驟,該像素差別計算步驟基于與設(shè)置所述局部圖像的所述差別的所述區(qū)域的距離來計算所述多個像素中的另一像素的所述 差別。
6、 根據(jù)權(quán)利要求1所述的計算機可讀介質(zhì),其中,所述關(guān)聯(lián)步驟在所述局部圖像的中心像素處關(guān)聯(lián)所述差別。
7、 一種用于從一區(qū)域中具有框架和多個字符的圖像中識別出字符的裝置,所述裝置包括存儲器,該存儲器用于存儲具有基準框架圖像的模板圖像;和處理器,該處理器用于執(zhí)行如下處理,所述處理包括以下步驟 區(qū)域劃分步驟,該區(qū)域劃分步驟將所述區(qū)域分成分別具有多個局部圖像的多個局部區(qū)域;圖像差別計算步驟,該圖像差別計算步驟分別計算所述多個局部圖像與所述模板圖像的所述基準框架圖像之間的差別;不重合度計算步驟,該不重合度計算步驟基于所述多個局部圖像與 所述基準框架圖像的所述差別的平均來計算所述圖像與所述模板圖像的 不重合度;以及字符識別步驟,該字符識別步驟修正所述不重合度,從所述圖像中 識別出所述多個字符。
8、 一種用于從一區(qū)域中具有框架和多個字符的圖像中識別出字符的 方法,所述方法包括以下步驟-區(qū)域劃分步驟,該區(qū)域劃分步驟將所述區(qū)域分成分別具有多個局部 圖像的多個局部區(qū)域;模板圖像提供步驟,該模板圖像提供步驟提供具有基準框架圖像的 模板圖像;圖像差別計算步驟,該圖像差別計算步驟分別計算所述多個局部圖 像與所述模板圖像的所述基準框架圖像之間的差別;不重合度計算步驟,該不重合度計算步驟基于所述多個局部圖像與 所述基準框架圖像的所述差別的平均來計算所述圖像與所述模板圖像的 不重合度;以及字符識別步驟,該字符識別步驟修正所述不重合度,從所述圖像中 識別出所述多個字符。
全文摘要
本發(fā)明涉及字符識別方法。根據(jù)一個方面的實施方式,提供了一種從一區(qū)域中具有框架和多個字符的圖像中識別出字符的方法,該方法包括以下步驟區(qū)域劃分步驟,該區(qū)域劃分步驟將所述區(qū)域分成分別具有多個局部圖像的多個局部區(qū)域;模板圖像提供步驟,該模板圖像提供步驟提供具有基準框架圖像的模板圖像;圖像差別計算步驟,該圖像差別計算步驟分別計算所述多個局部圖像與所述模板圖像的所述基準框架圖像之間的差別;不重合度計算步驟,該不重合度計算步驟基于所述多個局部圖像與所述基準框架圖像的該差別的平均來計算所述圖像與所述模板圖像的不重合度;以及字符識別步驟,該字符識別步驟修正所述不重合度,從而從所述圖像中識別出該多個字符。
文檔編號G06K9/34GK101344925SQ20081012806
公開日2009年1月14日 申請日期2008年7月10日 優(yōu)先權(quán)日2007年7月10日
發(fā)明者直井聰, 藤本克仁, 諏訪美佐子 申請人:富士通株式會社