專利名稱:灰度字符圖像歸一化裝置和灰度字符圖像歸一化方法
技術(shù)領(lǐng)域:
本發(fā)明涉及字符識(shí)別技術(shù),尤其涉及灰度字符識(shí)別技術(shù)。
背景技術(shù):
傳統(tǒng)的OCR (Optical Character Recognition-光學(xué)字符識(shí)別)技術(shù)專注于掃描文檔中的文字識(shí)別。一般情況下,在前景和背景容易區(qū)分的情況下,傳統(tǒng)的基于二值圖像的字符識(shí)別可獲得較高的識(shí)別精度。近年來(lái),越來(lái)越多的字符識(shí)別需求來(lái)自于基于照相機(jī)的文檔圖像、web圖像和自然場(chǎng)景圖像。在這些圖像中,文字往往不夠清晰,背景也不夠干凈。進(jìn)一步而言,低分辨率、模糊、畸變、光照變化和復(fù)雜背景等諸多會(huì)使圖像質(zhì)量降低的因素容易在這些圖像中出現(xiàn)。所有這些因素使得自然場(chǎng)景圖像中的文字識(shí)別非常困難,極具挑戰(zhàn)性。很難準(zhǔn)確地將文字從這些圖像中分割出來(lái),由此,傳統(tǒng)的二值字符識(shí)別方法不能發(fā)揮 出原有的功效。另外,在字符識(shí)別引擎中,通常只接受固定大小的字符圖像,多數(shù)字符圖像不能直接滿足這一要求。因此,在進(jìn)行字符識(shí)別前,需要?dú)w一化到引擎所要求的圖像尺寸。在常規(guī)的二值字符識(shí)別中,需要假定字符圖像的背景是干凈的、從而易于分割,但自然場(chǎng)景圖像往往不能滿足這個(gè)假設(shè)。若要在尺寸歸一化中保持字符縱橫比(即保形變換),則會(huì)在字符周圍產(chǎn)生白條,這會(huì)對(duì)灰度字符識(shí)別產(chǎn)生很大的負(fù)面影響。
發(fā)明內(nèi)容
本發(fā)明鑒于現(xiàn)有技術(shù)的上述情況提出,用以克服或緩解因現(xiàn)有技術(shù)的缺陷而造成的一種或更多種缺點(diǎn),至少提供一種有益的選擇。根據(jù)本發(fā)明的一個(gè)方面,提供了一種灰度字符圖像歸一化方法,所述方法包括灰度分布參數(shù)獲得處理,獲得待識(shí)別灰度字符圖像的灰度分布參數(shù);灰度分布參數(shù)歸一化處理,使所述待識(shí)別灰度字符圖像的灰度分布參數(shù)與根據(jù)訓(xùn)練樣本灰度字符圖像所得的灰度分布參數(shù)相接近。根據(jù)本發(fā)明的另一個(gè)方面,提供了一種灰度字符圖像歸一化裝置,所述裝置包括灰度分布參數(shù)獲得單元,獲得待識(shí)別灰度字符圖像的灰度分布參數(shù);灰度分布參數(shù)歸一化單元,使所述待識(shí)別灰度字符圖像的灰度分布參數(shù)與根據(jù)訓(xùn)練樣本灰度字符圖像所得的灰度分布參數(shù)相接近。根據(jù)本發(fā)明的再一方面,提供了一種邏輯部件可讀程序以及存儲(chǔ)該邏輯部件可讀程序的邏輯部件可讀有形存儲(chǔ)介質(zhì),當(dāng)所述邏輯部件可讀程序被邏輯部件執(zhí)行時(shí),能夠使所述邏輯部件用作本文所述的灰度字符圖像歸一化裝置或使所述邏輯部件實(shí)現(xiàn)本文所述的灰度字符圖像歸一化方法。應(yīng)該注意,術(shù)語(yǔ)“包括/包含/具有”在本文使用時(shí)指特征、要件、步驟或組件的存在,但并不排除一個(gè)或更多個(gè)其它特征、要件、步驟或組件的存在或附加。以上的一般說(shuō)明和以下結(jié)合附圖的詳細(xì)說(shuō)明都是示意性的,不是對(duì)本發(fā)明的保護(hù)范圍的限制。
從以下參照附圖對(duì)本發(fā)明的詳細(xì)描述中,將更清楚地理解本發(fā)明的以上和其它目的、特征和優(yōu)點(diǎn)。在附圖中,相同或類似的標(biāo)號(hào)指示相同或類似的元素。圖I示出了依據(jù)本發(fā)明一種實(shí)施方式的灰度字符圖像灰度分布?xì)w一化方法的流程圖。圖2是以灰度直方圖的方式示出了圖I的步驟S103的技術(shù)效果的示意圖。圖3示出了將待識(shí)別的灰度字符圖像統(tǒng)一變換為黑底白字的灰度字符圖像的情況下,依據(jù)本發(fā)明實(shí)施方式的字符圖像保形歸一化的流程圖。
圖4示出了將待識(shí)別的灰度字符圖像統(tǒng)一變換為白底黑字的灰度字符圖像的情況下,依據(jù)本發(fā)明實(shí)施方式的字符圖像保形歸一化的流程圖。圖5示出了本發(fā)明的保形歸一化方法與常規(guī)灰度字符歸一化方法的比較。圖6示出了依據(jù)本發(fā)明一種實(shí)施方式的灰度字符圖像灰度分布?xì)w一化裝置的方框圖。圖7示出了依據(jù)本發(fā)明一種實(shí)施方式的灰度字符圖像尺寸歸一化裝置。圖8示出了可用于實(shí)施根據(jù)本發(fā)明實(shí)施例的方法和裝置的計(jì)算機(jī)的示意性框圖。
具體實(shí)施例方式下面參照附圖對(duì)本發(fā)明的實(shí)施方式進(jìn)行詳細(xì)的說(shuō)明。依據(jù)本發(fā)明的實(shí)施方式,在進(jìn)行自然場(chǎng)景字符識(shí)別時(shí),一般需要進(jìn)行如下的步驟(I)將彩色字符圖像灰度化,得到灰度字符圖像;(2)灰度字符圖像歸一化;(3)進(jìn)行灰度字符識(shí)別。本領(lǐng)域已經(jīng)知道了很多種將彩色圖像灰度化的方法,例如常用的彩色圖像灰度化方法使用以下公式將RGB值轉(zhuǎn)化為灰度值Gray。Gray = (R+G+B) / 3Gray = 0. 301R+0. 586G+0. 113B其他的方法也是本領(lǐng)域技術(shù)人員所知的,本文不予詳述。對(duì)灰度字符進(jìn)行識(shí)另II,也可以采用本領(lǐng)域所知的各種方法,例如可以采用基于CNN (Convolutional NeuralNetwork,卷積神經(jīng)網(wǎng)絡(luò))分類器的自然場(chǎng)景文字識(shí)別方法?;叶茸址麍D像歸一化可以包括灰度字符圖像尺寸的歸一化和灰度字符圖像的灰度分布的歸一化這兩者或者這兩者中的一個(gè)。當(dāng)灰度字符圖像歸一化可以包括灰度字符圖像尺寸的歸一化和灰度字符圖像的灰度分布的歸一化這兩者時(shí),灰度字符圖像尺寸的歸一化和灰度字符圖像的灰度分布的歸一化可以按照任意的順序進(jìn)行。下面介紹依據(jù)本發(fā)明一種實(shí)施方式的進(jìn)行字符圖像歸一化的方法。圖I示出了依據(jù)本發(fā)明一種實(shí)施方式的灰度字符圖像灰度分布?xì)w一化的方法的流程圖。如圖I所示,依據(jù)本發(fā)明的一種實(shí)施方式的灰度字符圖像分布?xì)w一化方法,首先,在步驟S101,獲得待識(shí)別灰度字符圖像的灰度分布參數(shù)。所述的灰度分布參數(shù)例如為該待識(shí)別灰度字符圖像的灰度級(jí)數(shù)目(灰度級(jí)的數(shù)目)以及該待識(shí)別灰度字符圖像的灰度均值。然后,在步驟S102,利用預(yù)先保存的、根據(jù)訓(xùn)練字符圖像樣本(樣本圖像)所獲得的灰度分布參數(shù)和所獲得的該待識(shí)別灰度字符圖像的灰度分布參數(shù),對(duì)待識(shí)別灰度字符圖像的各像素的灰度值進(jìn)行變換,使得所述待識(shí)別灰度字符圖像的灰度分布參數(shù)與訓(xùn)練樣本灰度字符圖像的灰度分布參數(shù)相接近,從而實(shí)現(xiàn)所述灰度字符圖像灰度分布的歸一化。該步驟也稱灰度分布校準(zhǔn)步驟。具體地,在一種實(shí)施例中,利用以下的公式對(duì)該待識(shí)別灰度字符圖像的各像素的
灰度進(jìn)行變換。a (X) = s* (χ-c) +Cs為灰度范圍尺度因子,c為待識(shí)別灰度字符圖像的灰度均值,C為根據(jù)訓(xùn)練樣本灰度字符圖像所預(yù)先獲得的灰度均值。X表示待識(shí)別灰度字符圖像的像素的灰度值,a(x)為轉(zhuǎn)換后的待識(shí)別灰度字符圖像的像素的灰度值。在一種實(shí)施方式中,S = L/1,其中L為訓(xùn)練樣本的灰度字符圖像的灰度級(jí)的數(shù)目,I為所述待識(shí)別灰度字符圖像的灰度級(jí)的數(shù)目。在另一種實(shí)施方式中,可以采用以下的公式計(jì)算s
權(quán)利要求
1.一種灰度字符圖像歸一化方法,所述方法包括 灰度分布參數(shù)獲得處理,獲得待識(shí)別灰度字符圖像的灰度分布參數(shù); 灰度分布參數(shù)歸一化處理,使所述待識(shí)別灰度字符圖像的灰度分布參數(shù)與根據(jù)訓(xùn)練樣本灰度字符圖像所得的灰度分布參數(shù)相接近。
2.根據(jù)權(quán)利要求I所述的方法,其中利用公式a(x)=s* (x-c)+C使所述待識(shí)別灰度字符圖像的灰度分布參數(shù)與根據(jù)訓(xùn)練樣本灰度字符圖像所得的灰度分布參數(shù)相接近, 其中X表示待識(shí)別灰度字符圖像的像素的灰度值,a (X)為待識(shí)別灰度字符圖像的像素的轉(zhuǎn)換后的灰度值,s = L/l,L為根據(jù)訓(xùn)練樣本灰度字符圖像獲得的灰度級(jí)數(shù)目,C為根據(jù)訓(xùn)練樣本灰度字符圖像獲得的灰度均值,I為所述待識(shí)別灰度字符圖像的灰度級(jí)數(shù)目以及c為所述待識(shí)別灰度字符圖像的灰度均值。
3.根據(jù)權(quán)利要求I所述的方法,其中利用公式a(x)=s* (x-c)+C使所述待識(shí)別灰度字符圖像的灰度分布參數(shù)與根據(jù)訓(xùn)練樣本灰度字符圖像所得的灰度分布參數(shù)相接近, 其中X表示待識(shí)別灰度字符圖像的像素的灰度值,a(x)為待測(cè)灰度字符像素的轉(zhuǎn)換后的灰度值,
4.根據(jù)權(quán)利要求I所述的方法,其中所述方法還包括 雙峰增強(qiáng)處理,加大灰度分布參數(shù)歸一化處理后的所述待識(shí)別灰度字符圖像的前景色與背景色之間的距離。
5.根據(jù)權(quán)利要求I所述的灰度字符圖像歸一化方法,所述方法還包括保形歸一化處理,所述保形歸一化處理包括以下處理 估計(jì)要進(jìn)行保形歸一化處理的灰度字符圖像的圖像區(qū)的背景色; 對(duì)所述要進(jìn)行保形歸一化的灰度字符圖像進(jìn)行保形變換, 將經(jīng)過(guò)所述保形變換的灰度字符圖像的空白區(qū)的顏色設(shè)定為所述圖像區(qū)的背景色。
6.根據(jù)權(quán)利要求5所述的方法,其中,所述保形歸一化處理還包括 反色判斷步驟,判斷所述要進(jìn)行保形歸一化的灰度字符圖像的前景色與背景色的灰度關(guān)系是否是與期望的灰度字符圖像的前景色與背景色的灰度關(guān)系相反; 反色糾正步驟,在所述的要進(jìn)行保形歸一化的灰度字符圖像的前景色與背景色的灰度關(guān)系是與期望的灰度字符圖像的前景色與背景色的灰度關(guān)系相反時(shí),對(duì)所述要進(jìn)行保形歸一化的灰度字符圖像進(jìn)行灰度逆轉(zhuǎn),從而使所述要進(jìn)行保形歸一化的灰度字符圖像的前景色與背景色之間的灰度關(guān)系與期望的灰度字符圖像的前景色與背景色之間的灰度關(guān)系相同。
7.根據(jù)權(quán)利要求6所述的方法,其中, 在所述反色判斷步驟中,將所述要進(jìn)行保形歸一化的灰度字符圖像的圖像區(qū)的邊界像素的灰度平均值與所述要進(jìn)行保形歸一化的灰度字符圖像的所有區(qū)域的灰度平均值進(jìn)行比較, 當(dāng)期望的灰度字符圖像的前景色與背景色之間的灰度關(guān)系為前景色的灰度大于背景色的灰度時(shí),則如果所述要進(jìn)行保形歸一化的灰度字符圖像的圖像區(qū)的邊界像素的灰度平均值大于所述灰度字符圖像的所有區(qū)域的灰度平均值,判斷出所述要進(jìn)行保形歸一化的灰度字符圖像的前景色與背景色的灰度關(guān)系與期望的灰度字符圖像的前景色與背景色的灰度關(guān)系相反, 當(dāng)期望的灰度字符圖像的前景色與背景色之間的灰度關(guān)系為前景色的灰度小于背景色的灰度時(shí),則如果所述要進(jìn)行保形歸一化的灰度字符圖像的圖像區(qū)的邊界像素的灰度平均值小于所述要進(jìn)行保形歸一化的灰度字符圖像的所有像素的灰度平均值,則判斷出所述要進(jìn)行保形歸一化的灰度字符圖像的前景色與背景色的灰度關(guān)系與期望的灰度字符圖像的前景色與背景色的灰度關(guān)系相反。
8.根據(jù)權(quán)利要求5所述的方法,其中在估計(jì)所述要進(jìn)行保形歸一化的灰度字符圖像的圖像區(qū)的背景色的處理中,當(dāng)期望的灰度字符圖像的前景色與背景色之間的灰度關(guān)系為前景色的灰度小于背景色的灰度時(shí),將所述圖像區(qū)的邊沿像素的最大灰度確定為所述背景色,當(dāng)期望的灰度字符圖像的前景色與背景色之間的灰度關(guān)系為前景色的灰度大于背景色的灰度時(shí),在將所述圖像區(qū)的邊沿像素的最小灰度確定為所述背景色。
9.根據(jù)權(quán)利要求5所述的方法,其中在估計(jì)所述要進(jìn)行保形歸一化的灰度字符圖像的圖像區(qū)的背景色的處理中,其中將所述圖像區(qū)的邊沿像素的平均灰度確定為所述背景色。
10.一種灰度字符圖像歸一化裝置,所述裝置包括 灰度分布參數(shù)獲得單元,獲得待識(shí)別灰度字符圖像的灰度分布參數(shù); 灰度分布參數(shù)歸一化單元,使所述待識(shí)別灰度字符圖像的灰度分布參數(shù)與根據(jù)訓(xùn)練樣本灰度字符圖像所得的灰度分布參數(shù)相接近。
全文摘要
本發(fā)明提供了一種灰度字符圖像歸一化裝置和一種灰度字符圖像歸一化方法。所述灰度字符圖像歸一化包括灰度分布參數(shù)獲得處理,獲得待識(shí)別灰度字符圖像的灰度分布參數(shù);灰度分布參數(shù)歸一化處理,使所述待識(shí)別灰度字符圖像的灰度分布參數(shù)與根據(jù)訓(xùn)練樣本灰度字符圖像所得的灰度分布參數(shù)相接近。
文檔編號(hào)G06K9/00GK102867180SQ20111019118
公開(kāi)日2013年1月9日 申請(qǐng)日期2011年7月8日 優(yōu)先權(quán)日2011年7月8日
發(fā)明者朱遠(yuǎn)平, 孫俊, 直井聰 申請(qǐng)人:富士通株式會(huì)社