亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

二進(jìn)制化文字圖像的方法

文檔序號(hào):6370419閱讀:518來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):二進(jìn)制化文字圖像的方法
技術(shù)領(lǐng)域
本發(fā)明涉及光學(xué)字符識(shí)別(OCR),即把圖像數(shù)據(jù)中的文本字符圖像轉(zhuǎn)化成字符代碼數(shù)據(jù),更具體地說(shuō),涉及作為OCR過(guò)程的一部分,把圖像數(shù)據(jù)中的灰度文本和背景像素二進(jìn)制化。
背景技術(shù)
OCR可以被定義成把文本圖像數(shù)據(jù)轉(zhuǎn)化為文字處理軟件可讀的字符代碼形式(如ASCII碼)的過(guò)程。在原始的文本圖像數(shù)據(jù)中,文本字符與其它類(lèi)型的圖像數(shù)據(jù)(如圖片或者線(xiàn)條)一樣,是由各個(gè)象素組成的。在轉(zhuǎn)化成為字符編碼形式之后,不再有文本字符的原始圖像。這樣,為了把圖像轉(zhuǎn)化成為特定字符編碼,OCR過(guò)程要求每個(gè)字符的圖像質(zhì)量都要相當(dāng)高。很多OCR過(guò)程把字符定義成互相連接的點(diǎn)或者象素的獨(dú)立的集合。如果文本圖像質(zhì)量較低,比如單個(gè)字符模糊,或者弄臟了相鄰的字符,OCR過(guò)程可能無(wú)法把字符區(qū)分出來(lái)對(duì)應(yīng)到它們各自的編碼,文本將無(wú)法被文字處理軟件辨識(shí)。
多種原因都可能造成文字圖像的質(zhì)量比較低。例如,由復(fù)印機(jī)、傳真機(jī)、打印機(jī)和數(shù)碼相機(jī)生成的文本圖像,經(jīng)常由于高背景噪聲、低空間分辨率、或者照明變化而導(dǎo)致質(zhì)量低。這樣的圖像通常是單色的,或者是灰度圖像,其中為每個(gè)個(gè)體像素分配一個(gè)灰度或者亮度等級(jí),范圍從全黑到全白。
一種常見(jiàn)的灰度格式是八比特灰度圖像。在這種格式中,賦值為0的像素是全黑的,賦值為255的像素是全白的。中等灰色的像素則被賦予0和255中間的某個(gè)值,比如110。
OCR初步處理過(guò)程通常需要把灰度文本圖像二進(jìn)制化,這樣,圖像中的每個(gè)像素或者被當(dāng)作文本字符的一部分,或者被當(dāng)作頁(yè)面背景的一部分。例如,如果一個(gè)特定的像素要形成文本字符的一部分,則給它賦低亮度值零(0)來(lái)代表黑色。不是個(gè)體文本字符的一部分,而是背景頁(yè)面一部分的其他像素,則賦予高亮度值壹(1)。
當(dāng)二進(jìn)制化一幅低質(zhì)量灰度文本圖像時(shí),OCR的二進(jìn)制化過(guò)程可能會(huì)產(chǎn)生錯(cuò)誤像素。錯(cuò)誤像素就是或者,比如作為文本符號(hào)前景的圖像,應(yīng)當(dāng)取低亮度,如值零(0),但是卻在圖像中被當(dāng)作背景的一部分而取了高亮度,如值壹(1);或者相反。
OCR初步二進(jìn)制化過(guò)程通常通過(guò)設(shè)定閾值值來(lái)決定什么灰度像素值應(yīng)當(dāng)被當(dāng)作文本,以及什么應(yīng)當(dāng)被當(dāng)作背景。例如,取值低于閾值的灰度像素都被賦予二進(jìn)制值零(0),取值高于閾值的灰度像素都被賦予二進(jìn)制值壹(1)。
上述技術(shù)的一個(gè)問(wèn)題在于,經(jīng)常由于低信躁比(SNR)或者文本和背景像素之間的低對(duì)比度而導(dǎo)致低質(zhì)量的灰度圖像。因此,在應(yīng)當(dāng)被二進(jìn)制化為背景的灰度像素值和應(yīng)當(dāng)被二進(jìn)制化為文本前景的灰度像素值之間,可能只有一個(gè)非常小的差別。例如,一頁(yè)文本的8比特灰度圖像可能包括一些值為50的像素,它們很可能應(yīng)當(dāng)被二進(jìn)制化為背景;以及值為45的相鄰像素,它們應(yīng)當(dāng)被二進(jìn)制化為文本前景。五個(gè)點(diǎn)的差別表示灰色的深淺僅僅發(fā)生了很小的改變。此外,當(dāng)生成原始的灰度圖像時(shí),文本頁(yè)面的照明不同,可能導(dǎo)致同一文本頁(yè)面的另一個(gè)區(qū)域包括值為45而應(yīng)當(dāng)被二進(jìn)制化為背景的像素,它的相鄰像素值為40,應(yīng)當(dāng)被二進(jìn)制化為文本前景。換言之,同樣的灰度值可能在頁(yè)面的一個(gè)區(qū)域代表背景,而在同樣頁(yè)面的另一個(gè)區(qū)域代表文本前景。
因此,已經(jīng)開(kāi)發(fā)出這樣的技術(shù),它能適應(yīng)性地計(jì)算設(shè)定的閾值,使其根據(jù)頁(yè)面上被二進(jìn)制化的區(qū)域而發(fā)生改變??梢匀我庖?guī)定這些區(qū)域,比如通過(guò)在頁(yè)面上應(yīng)用柵格圖案;或者,也可以根據(jù)迭代二進(jìn)制分析來(lái)求出頁(yè)面上文本行或者文本塊的位置,從而確定區(qū)域。在迭代二進(jìn)制分析過(guò)程中,使用了采用改進(jìn)閾值的第二二進(jìn)制化過(guò)程,來(lái)清除實(shí)際文本字符邊緣附近的錯(cuò)誤像素。這樣,在最終的OCR處理步驟中,二進(jìn)制化的文本字符輸出更有可能被準(zhǔn)確地識(shí)別。
通常,如果被分析的文本區(qū)域與頁(yè)面上單個(gè)文本字符所在區(qū)域的范圍很一致,迭代二進(jìn)制化過(guò)程會(huì)產(chǎn)生更好的OCR結(jié)果。再次二進(jìn)制化個(gè)體字符使得OCR機(jī)器更有可能正確地識(shí)別字符?,F(xiàn)有的識(shí)別文本塊或者任意確定柵格的技術(shù)框起字符組或者個(gè)體字符片斷。因此,需要改進(jìn)的迭代二進(jìn)制化方法,更準(zhǔn)確地框起可能包括被錯(cuò)誤二進(jìn)制化的像素的個(gè)體字符區(qū)域。

發(fā)明內(nèi)容
在本發(fā)明的方法中,作為光學(xué)字符識(shí)別(OCR)系統(tǒng)的一部分,在灰度圖像上進(jìn)行第一二進(jìn)制化步驟,來(lái)生成第一二進(jìn)制圖像輸出。然后,在第一二進(jìn)制圖像輸出上進(jìn)行布局分析步驟,來(lái)識(shí)別第一二進(jìn)制圖像輸出上框起個(gè)體文本字符的邊界,以生成二進(jìn)制字符區(qū)域。接下去,在灰度文本圖像的二進(jìn)制字符區(qū)域上進(jìn)行第二二進(jìn)制化步驟,來(lái)生成第二二進(jìn)制圖像輸出。然后,第二二進(jìn)制圖像輸出被輸入到OCR機(jī)器中,來(lái)完成文字識(shí)別過(guò)程。


通過(guò)下面對(duì)照附圖的詳細(xì)說(shuō)明,本發(fā)明的其它方面會(huì)更加清晰。附圖中,圖1是一個(gè)一般化的流程圖,說(shuō)明本發(fā)明的一個(gè)實(shí)施例;圖2示是根據(jù)本發(fā)明的一個(gè)實(shí)施例的布局分析步驟的結(jié)果,并示出了由框起個(gè)體文本字符的矩形框所確定的二進(jìn)制化字符區(qū)域;圖3A是可能出現(xiàn)在文本字符邊緣的被錯(cuò)誤二進(jìn)制化的像素的例子,這種錯(cuò)誤二進(jìn)制化的像素可能是由于非理想條件而引起的,例如在生成灰度文本圖像時(shí)原始文件不均勻的照明;
圖3B示出了附圖3A中被正確辨識(shí)的字符,包括根據(jù)本發(fā)明的一個(gè)實(shí)施例,由框住的體文本字符的矩形框所確定的二進(jìn)制字符區(qū)域;圖4是一個(gè)柵格,說(shuō)明了根據(jù)本發(fā)明的一個(gè)實(shí)施例,待估計(jì)并二進(jìn)制化的目標(biāo)像素周?chē)痪幪?hào)的相鄰像素。
具體實(shí)施例方式
參照附圖,其中,相同參考字符表示相同或者相應(yīng)的元素。圖1是一個(gè)一般化的流程圖,說(shuō)明了本發(fā)明的一個(gè)實(shí)施例?;叶任谋緢D像105在一第一二進(jìn)制化步驟(S1)中被二進(jìn)制化,以生成一第一二進(jìn)制文本圖像110。接著,在第一二進(jìn)制文本圖像110上進(jìn)行布局分析步驟(S2)。在圖2中,給出了布局分析步驟(S2)的結(jié)果的例子,它包括二進(jìn)制字符區(qū)域205,該區(qū)域是由框起從第一二進(jìn)制圖像110中辨識(shí)出來(lái)的個(gè)體文本字符210的矩形框所確定的。再次參見(jiàn)圖1,二進(jìn)制字符區(qū)域205的坐標(biāo)被提供給一第二二進(jìn)制化步驟(S3),從而用來(lái)辨別原始灰度圖像105的什么區(qū)域要被二進(jìn)制化。第二二進(jìn)制化步驟(S3)在原始灰度文本圖像105上進(jìn)行。然而,在第二二進(jìn)制化步驟(S3)中,只有二進(jìn)制字符區(qū)域205被二進(jìn)制化。接著,第二二進(jìn)制化步驟生成第二二進(jìn)制文本圖像115,輸入到OCR機(jī)器120中,來(lái)完成文字識(shí)別過(guò)程。
在本發(fā)明的一個(gè)實(shí)施例中,灰度文本圖像105可能從各種類(lèi)型的設(shè)備中獲得,比如數(shù)字復(fù)印機(jī)、傳真機(jī)、打印機(jī),或者數(shù)碼相機(jī)。如本領(lǐng)域的技術(shù)人員所知,第一二進(jìn)制化步驟(S1)通常利用一個(gè)或多個(gè)標(biāo)準(zhǔn)閾值技術(shù),來(lái)二進(jìn)制化整個(gè)灰度文本圖像105。第一二進(jìn)制化步驟(S1)的輸出是第一二進(jìn)制圖像110,它可能包括一些錯(cuò)誤。
如圖3A所示,原始文件在生成灰度文本圖像105時(shí)不均勻的照明等非理想化的條件,可能導(dǎo)致一些被錯(cuò)誤二進(jìn)制化的像素305出現(xiàn)在第一二進(jìn)制圖像110中。由于低信噪比(SNR),以及用來(lái)在灰度文本圖像105中區(qū)分背景像素和文本像素的閾值技術(shù),錯(cuò)誤二進(jìn)制化的像素305經(jīng)常出現(xiàn)在個(gè)體文本字符210的邊緣附近。不幸的是,正是在個(gè)體文本字符210的邊緣附近,錯(cuò)誤二進(jìn)制化的像素305造成了OCR機(jī)器120在試圖準(zhǔn)確識(shí)別文本字符210過(guò)程中的絕大部分問(wèn)題。例如,在圖3A中,在字母“c”和“e”之間的錯(cuò)誤二進(jìn)制化的像素可能導(dǎo)致OCR機(jī)器120錯(cuò)誤地把這兩個(gè)字母當(dāng)作一個(gè)字母“w”。類(lèi)似地,圖3A中字母“c”里面的兩個(gè)錯(cuò)誤二進(jìn)制化的像素305可能導(dǎo)致OCR機(jī)器120錯(cuò)誤地把字母“c”當(dāng)成字母“o”。
本發(fā)明的布局分析步驟(S2)有助于更正出現(xiàn)在文本字符210邊緣的被錯(cuò)誤二進(jìn)制化的像素305。它通過(guò)辨識(shí)由框住單個(gè)文本字符210的矩形框所確定的二進(jìn)制字符區(qū)域205來(lái)完成這項(xiàng)任務(wù)。如本領(lǐng)域的技術(shù)人員所知,可以通過(guò)標(biāo)準(zhǔn)文本配準(zhǔn)和分段技術(shù),比如垂直和水平直方圖整形法,來(lái)辨識(shí)區(qū)域205。通常,布局分析步驟(S2)涉及幾個(gè)操作,包括判斷傾斜、將圖片與文本分離,以及將辨認(rèn)出的文本劃分成欄、行、詞和字。文本的劃分通過(guò)一個(gè)通常稱(chēng)為分段的過(guò)程來(lái)完成,這個(gè)過(guò)程在G.Nagy的thefrontiers of OCR,Proceedings of the IEEE,80(7)1093-1100,1992年7月中進(jìn)行了描述。
布局分析步驟(S2)也可包括使用后處理技術(shù),例如消除噪聲,以在識(shí)別特定的二進(jìn)制字符區(qū)域205之前,提高第一二進(jìn)制圖像110的質(zhì)量。
在第二二進(jìn)制化步驟(S3)中,在布局分析步驟(S2)中辨別出來(lái)的二進(jìn)制字符區(qū)域205的位置被傳送到原始灰度圖像105。之后,第二二進(jìn)制化步驟(S3)僅需要對(duì)原始灰度圖像105中的字符區(qū)域205進(jìn)行再次二進(jìn)制化,而并不需要再次二進(jìn)制化整個(gè)灰度圖像105。因此,由于需要二進(jìn)制化的像素少了,第二二進(jìn)制化步驟(S3)的二進(jìn)制化速度通常要比第一二進(jìn)制化步驟(S1)的速度快。
第二二進(jìn)制化步驟(S3)能夠比第一二進(jìn)制化步驟(S1)更加準(zhǔn)確地辨識(shí)出像素是文本還是背景像素,因?yàn)榭梢杂?jì)算局部化的閾值,來(lái)補(bǔ)償灰度圖像105中局部化的信噪比和局部化的亮度差別。例如,可以計(jì)算出或者預(yù)置兩個(gè)局部化的閾值t1和t2,其中t1小于t2。例如,如果一個(gè)二進(jìn)制字符區(qū)域205(通常稱(chēng)為一塊瓦片)的大小是寬為三列、高為四行,那么就形成了一個(gè)12像素的陣列AP。根據(jù)這個(gè)像素陣列AP,考慮一種情況,其中每個(gè)像素的灰度值如下最上一行從左至右200,150,150;第二行從左至右200,150,150;第三行從左至右200,150,150;最下面一行從左至右220,220,220。
根據(jù)像素陣列AP,像素陣列AP的所有像素的灰度值的平均值計(jì)算如下Mean=Σi=112xi/12]]>=(200+150+150+200+150+150+200+150+150+220+220+220)/12]]>=180]]>其中,xi是像素的灰度值。
同時(shí),瓦片內(nèi)所有像素的灰度值的方差可以如下計(jì)算Var=Σi=112(xi-mean)212]]>=(200-180)2+.........+(220-180)212]]>=31]]>這樣,我們可以設(shè)t1=Mean-Var*B;其中B是一個(gè)參數(shù),其值通過(guò)實(shí)驗(yàn)確定,且已經(jīng)發(fā)現(xiàn)的一個(gè)B的適當(dāng)取值為0.2。因此,取最接近的整數(shù)值,那么t1=Mean-Var*0.2=174t2=Mean=180然后,這兩個(gè)閾值t1和t2就可以用于一個(gè)或多個(gè)二進(jìn)制字符區(qū)域205。
如果字符區(qū)域205之內(nèi)的像素灰度值大于t2,該像素可被賦二進(jìn)制值壹(1),來(lái)表示它是一個(gè)背景像素。如果字符區(qū)域205之內(nèi)的像素灰度值小于t1,該像素可被賦二進(jìn)制值零(0),來(lái)表示它是一個(gè)前景像素。否則,如果像素的灰度值在t1和t2之間,那么該像素被認(rèn)為是低信噪比像素,可能代表背景或者文本像素,這時(shí)會(huì)使用一個(gè)特別的像素識(shí)別算法。
圖4是根據(jù)本發(fā)明方法的一個(gè)柵格,說(shuō)明了圍繞著有待估計(jì)并二進(jìn)制化的目標(biāo)像素405的有編號(hào)的相鄰像素410??杀挥迷诒景l(fā)明中的像素識(shí)別算法的一個(gè)例子(與上面描述的12像素陣列AP相似)是一種求出在四個(gè)方向上圍繞著目標(biāo)像素405的相鄰像素410的灰度值的算法。計(jì)算像素410在四個(gè)方向i(i=0,1,2,3)中的每一個(gè)上面的灰度值的均值。然后,從四個(gè)灰度值均值之中確定最大灰度值均值iMax,以及最小灰度值均值iMin。如果目標(biāo)像素405的灰度值更接近iMax而不是iMin,那么目標(biāo)像素405會(huì)被賦值壹(1),代表背景像素。反之,如果目標(biāo)像素405的灰度值更接近iMin而不是iMax,那么目標(biāo)像素405會(huì)被賦值零(0),代表文本像素。
根據(jù)特殊系統(tǒng)的需要,在本發(fā)明的范圍內(nèi)也可以使用其它類(lèi)型的特殊像素識(shí)別算法。例如,可以求出位于圍繞著目標(biāo)像素405并以之為中心的矩形的邊緣上的相鄰像素的灰度值,來(lái)確定目標(biāo)像素應(yīng)當(dāng)作為背景還是前景文本。
如圖3B所示,本發(fā)明的方法被用來(lái)從第一二進(jìn)制化步驟(S1)中有效地清除被錯(cuò)誤二進(jìn)制化的像素305,以對(duì)文本字符210進(jìn)行更加精確的再現(xiàn)。再次參照?qǐng)D3A,在兩個(gè)字母“c”和“e”之間被錯(cuò)誤二進(jìn)制化的像素305可能導(dǎo)致布局分析步驟(S2)認(rèn)為兩個(gè)字母被包圍在一個(gè)矩形二進(jìn)制文本區(qū)域205中。然而,在第二二進(jìn)制化步驟(S3)中執(zhí)行的特殊像素識(shí)別算法可以正確地識(shí)別出在兩個(gè)字母“c”和“e”之間的錯(cuò)誤二進(jìn)制化像素是背景的一部分,并重新為其賦值壹(1)。當(dāng)?shù)诙M(jìn)制圖像115被提交給OCR機(jī)器120時(shí),OCR機(jī)器能夠正確地把這兩個(gè)字母分到兩個(gè)獨(dú)立的二進(jìn)制區(qū)域205中,如附圖3B所示,并且接下去識(shí)別兩個(gè)獨(dú)立字母“c”和“e”。
本發(fā)明的方法提出了通過(guò)使用局部化的第二二進(jìn)制化步驟(S3)來(lái)二進(jìn)制化文本圖像,可能僅需要對(duì)灰度圖像105中特定的二進(jìn)制字符區(qū)域205進(jìn)行再次二進(jìn)制化。第二二進(jìn)制化步驟(S3)可以更加準(zhǔn)確地辨識(shí)出像素是文本還是背景像素,因?yàn)榭梢杂?jì)算局部化的閾值值,來(lái)補(bǔ)償在灰度圖像105中的局部化的信噪比和局部化的亮度差別。因此,得到的第二二進(jìn)制圖像115比只通過(guò)一次二進(jìn)制化步驟而產(chǎn)生的二進(jìn)制圖像包含更少的錯(cuò)誤二進(jìn)制化像素305。更少的錯(cuò)誤二進(jìn)制化像素305意味著最終的OCR過(guò)程會(huì)更加準(zhǔn)確地識(shí)別原始文本中的字符和單詞。應(yīng)當(dāng)理解的是,上述說(shuō)明旨在舉例說(shuō)明,而不是加以限制。盡管已經(jīng)參考附圖通過(guò)優(yōu)選實(shí)施例對(duì)本發(fā)明進(jìn)行了充分地闡述,但是應(yīng)當(dāng)注意,對(duì)本領(lǐng)域的技術(shù)人員來(lái)說(shuō),顯而易見(jiàn)可以有無(wú)數(shù)的改變和修正。這些改變和修正應(yīng)當(dāng)被認(rèn)為是包括在所附權(quán)利要求所限定的本發(fā)明的范圍之內(nèi)的。
權(quán)利要求
1.在光學(xué)字符識(shí)別(OCR)系統(tǒng)中,一種二進(jìn)制化灰度文本圖像的方法包括以下步驟在灰度圖像上進(jìn)行第一二進(jìn)制化步驟,以生成第一二進(jìn)制圖像輸出;在所述第一二進(jìn)制圖像輸出上進(jìn)行布局分析步驟,以辨別所述第一二進(jìn)制圖像輸出中框住個(gè)體文本字符的邊界,來(lái)生成二進(jìn)制字符區(qū)域;在所述灰度圖像的所述二進(jìn)制字符區(qū)域上進(jìn)行第二二進(jìn)制化步驟,來(lái)生成第二二進(jìn)制圖像輸出;把所述第二二進(jìn)制圖像輸出輸入到OCR機(jī)器中。
2.根據(jù)權(quán)利要求1的方法,其中所述的在所述第一二進(jìn)制圖像輸出上進(jìn)行布局分析的步驟,在所述圖像輸出上辨識(shí)框住所述個(gè)體文本字符的矩形框,來(lái)生成所述二進(jìn)制字符區(qū)域。
3.根據(jù)權(quán)利要求1的方法,其中所述的在所述第一二進(jìn)制圖像輸出上進(jìn)行布局分析的步驟還包括,使用后處理技術(shù),例如噪聲消除,來(lái)提高所述第一二進(jìn)制圖像的質(zhì)量。
4.根據(jù)權(quán)利要求1的方法,其中所述的進(jìn)行第二二進(jìn)制化的步驟,僅僅對(duì)所述第一二進(jìn)制圖像輸出上所述的框起所述個(gè)體文本字符的二進(jìn)制字符區(qū)域進(jìn)行再次二進(jìn)制化,而不對(duì)所述灰度圖像的其它區(qū)域進(jìn)行再次二進(jìn)制化。
5.根據(jù)權(quán)利要求1的方法,其中所述的進(jìn)行第二二進(jìn)制化的步驟,比所述的進(jìn)行第一二進(jìn)制化步驟的步驟需要更少的執(zhí)行時(shí)間。
6.根據(jù)權(quán)利要求1的方法,其中在所述灰度圖像上的所述二進(jìn)制字符區(qū)域上進(jìn)行第二二進(jìn)制化步驟以生成第二二進(jìn)制圖像輸出的步驟,還包括計(jì)算局部化閾值的步驟,其中局部化閾值用來(lái)補(bǔ)償所述灰度圖像中局部化的信噪比和局部化的亮度差別。
7.根據(jù)權(quán)利要求6的方法,其中所述的計(jì)算局部化閾值的步驟計(jì)算出兩個(gè)局部化閾值,其中局部化閾值用來(lái)補(bǔ)償所述灰度圖像中局部化的信噪比和局部化的亮度差別。
8.根據(jù)權(quán)利要求6的方法,其中所述的計(jì)算局部化閾值的步驟包括使用特定的像素識(shí)別算法,其中局部化的閾值用來(lái)補(bǔ)償所述灰度圖像中局部化的信噪比和局部化的亮度差別。
9.根據(jù)權(quán)利要求8的方法,其中所述的特定像素識(shí)別算法在多個(gè)方向上求出圍繞著目標(biāo)像素的相鄰像素的灰度值。
10.根據(jù)權(quán)利要求8的方法,其中所述的特定像素識(shí)別算法在四個(gè)方向上求出圍繞著目標(biāo)像素的相鄰像素的灰度值。
全文摘要
作為光學(xué)字符識(shí)別(OCR)系統(tǒng)的一部分的一種二進(jìn)制化灰度文本圖像(105)的方法。在灰度圖像(105)上進(jìn)行第一二進(jìn)制化步驟(S1),來(lái)生成第一二進(jìn)制圖像輸出(110)。然后,在第一二進(jìn)制圖像輸出(110)上進(jìn)行布局分析步驟(S2),以在第一二進(jìn)制圖像輸出(110)上辨別框住個(gè)體文本字符(210)的邊界,來(lái)生成二進(jìn)制字符區(qū)域(205)。在灰度文本圖像(105)的二進(jìn)制字符區(qū)域(205)上,進(jìn)行第二二進(jìn)制化步驟(S3),來(lái)生成第二二進(jìn)制圖像輸出(115)。然后,第二二進(jìn)制圖像輸出(115)被輸入到OCR機(jī)器(120)中,完成字符識(shí)別過(guò)程。
文檔編號(hào)G06F17/22GK1567357SQ0314631
公開(kāi)日2005年1月19日 申請(qǐng)日期2003年7月8日 優(yōu)先權(quán)日2003年7月8日
發(fā)明者羅希平, 李俊, 鎮(zhèn)立新 申請(qǐng)人:摩托羅拉公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1