專利名稱:一種字符識(shí)別方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)圖像處理技術(shù)領(lǐng)域,尤其涉及一種字符識(shí)別方法及裝置。
背景技術(shù):
隨著社會(huì)經(jīng)濟(jì)的發(fā)展,車輛的數(shù)量不斷增加,因此通過計(jì)算機(jī)信息化、智能化的方案管理車輛成為必然?,F(xiàn)有技術(shù)中車牌識(shí)別在智能交通領(lǐng)域扮演者重要的角色,其在交通流量監(jiān)測(cè)、高速公路卡口收費(fèi)、闖紅燈違章車輛監(jiān)控及社區(qū)自動(dòng)收費(fèi)系統(tǒng)中具有廣泛的應(yīng)用?,F(xiàn)有的車牌類型識(shí)別的過程中主要包括車牌定位、車牌矯正、車牌字符分割和字符識(shí)別等幾個(gè)主要步驟。字符識(shí)別為車牌識(shí)別中的核心技術(shù),將字符序列識(shí)別出后,需要通 過字符識(shí)別技術(shù)將字符序列中的每個(gè)字符識(shí)別出。目前采用的車牌字符識(shí)別算法包括模板匹配算法和機(jī)器學(xué)習(xí)算法。其中,機(jī)器學(xué)習(xí)算法需要學(xué)習(xí)大量的字符樣本,并且需要經(jīng)過長(zhǎng)時(shí)間的訓(xùn)練,計(jì)算量大并且效率低。模板匹配算法相對(duì)機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)簡(jiǎn)單,但是其魯棒性較差,這是因?yàn)槟0迤ヅ渌惴ň褪菍⒆R(shí)別字符與所存儲(chǔ)的標(biāo)準(zhǔn)字符模板集合中的每個(gè)模板進(jìn)行比較,然后選擇與之距離最相近的模板作為識(shí)別結(jié)果。模板匹配方法多利用了字符的輪廓、網(wǎng)格、投影等統(tǒng)計(jì)特征,因此會(huì)導(dǎo)致相似字符區(qū)分能力差以及因?yàn)樘卣鲾?shù)據(jù)維數(shù)過大而導(dǎo)致識(shí)別速度慢等問題,對(duì)于有變形、位移、傾斜的待識(shí)別字符,模板匹配方法很容易產(chǎn)生誤識(shí)別,識(shí)別準(zhǔn)確性較差
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例提供一種字符識(shí)別方法及裝置,用以解決現(xiàn)有技術(shù)字符識(shí)別過程中魯棒性差的問題。本發(fā)明提供一種字符識(shí)別方法,所述方法包括對(duì)包含待識(shí)別字符信息的圖片進(jìn)行二值化處理,識(shí)別二值化處理后該圖片中字符的邊界,根據(jù)確定的邊界,在包含待識(shí)別字符信息的樣本圖片中截取待識(shí)別字符區(qū)域,對(duì)該截取的字符區(qū)域進(jìn)行二值化、歸一化處理;在歸一化處理后的待識(shí)別字符區(qū)域中,識(shí)別像素值的跳變,根據(jù)跳變時(shí)白色像素點(diǎn)的位置,在字符邊緣信息圖中相應(yīng)像素點(diǎn)的位置賦值255,其他像素點(diǎn)的位置賦其他值,其中該字符邊緣信息圖與該歸一化后的字符區(qū)域大小相等;識(shí)別該字符邊緣信息圖中每個(gè)像素點(diǎn)的像素值,當(dāng)識(shí)別到該字符邊緣信息圖中像素點(diǎn)的像素值為255時(shí),計(jì)算該像素點(diǎn)的梯度值,并確定歸屬方向,采用該歸屬方向值對(duì)邊緣梯度數(shù)組中相應(yīng)位置賦值,該數(shù)組的其他位置賦值為-I ;將該邊緣梯度數(shù)組與保存的每個(gè)字符對(duì)應(yīng)的每個(gè)模板進(jìn)行匹配,確定匹配距離,將匹配距離最小值對(duì)應(yīng)的字符作為識(shí)別結(jié)果。本發(fā)明提供一種字符識(shí)別裝置,所述裝置包括歸一化模塊,用于對(duì)包含待識(shí)別字符信息的圖片進(jìn)行二值化處理,識(shí)別二值化處理后該圖片中待識(shí)別字符的邊界,根據(jù)確定的邊界,在包含待識(shí)別字符信息的樣本圖片中截取待識(shí)別字符區(qū)域,對(duì)該截取的字符區(qū)域進(jìn)行二值化、歸一化處理;邊緣信息確定模塊,用于在歸一化處理后的待識(shí)別字符區(qū)域中,識(shí)別像素值的跳變,根據(jù)跳變時(shí)白色像素點(diǎn)的位置,在字符邊緣信息圖中相應(yīng)像素點(diǎn)的位置賦值255,其他像素點(diǎn)的位置賦其他值,其中該字符邊緣信息圖與該歸一化后的字符區(qū)域大小相等;梯度方向確定模塊,用于識(shí)別該字符邊緣信息圖中每個(gè)像素點(diǎn)的像素值,當(dāng)識(shí)別到該字符邊緣信息圖中像素點(diǎn)的像素值為255時(shí),計(jì)算該像素點(diǎn)的梯度值,并確定歸屬方向,采用該歸屬方向值對(duì)邊緣梯度數(shù)組中相應(yīng)位置賦值,該數(shù)組的其他位置賦值為-I ;匹配識(shí)別模塊,用于將該邊緣梯度數(shù)組與保存的每個(gè)模板進(jìn)行匹配,確定匹配距離,將匹配距離最小值對(duì)應(yīng)的字符作為識(shí)別結(jié)果。本發(fā)明提供了一種字符識(shí)別方法及裝置,該方法針對(duì)待識(shí)別字符識(shí)別和模板創(chuàng)建時(shí),進(jìn)行歸一化處理、確定字符邊緣信息圖,并確定邊緣梯度數(shù)組中每個(gè)數(shù)值的取值,當(dāng)確定了邊緣梯度數(shù)組中相應(yīng)位置的賦值后,根據(jù)待識(shí)別字符對(duì)應(yīng)邊緣梯度數(shù)組與每個(gè)字符對(duì)應(yīng)的每個(gè)模板之間的匹配,確定匹配距離,根據(jù)匹配距離識(shí)別字符。由于在本發(fā)明中根據(jù)字符中每個(gè)像素點(diǎn)的梯度方向,作為邊緣梯度數(shù)組中的相應(yīng)數(shù)值,而梯度方向具有較強(qiáng)的抗干擾能力,因此本字符識(shí)別方法具有較強(qiáng)的魯棒性,并且在識(shí)別的過程中與每個(gè)字符對(duì)應(yīng)的每個(gè)模板進(jìn)行匹配,根據(jù)匹配距離,將匹配距離最小值對(duì)應(yīng)的字符作為識(shí)別結(jié)果,因此可以避免字符單模板匹配的魯棒性差的問題,提高了該匹配方法的適用范圍。
此處所說明的附圖用來提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本發(fā)明的一部分,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中圖I為本發(fā)明提供的字符識(shí)別過程示意圖;圖2為本發(fā)明提供的字符模板創(chuàng)建過程中的歸一化處理的過程;圖3為本發(fā)明提供的字符模板創(chuàng)建過程中的特征提取過程;圖4為本發(fā)明提供的字符識(shí)別裝置的結(jié)構(gòu)示意圖。
具體實(shí)施例方式本發(fā)明實(shí)施例為了提高字符識(shí)別的效率及精度,提供了一種字符識(shí)別方法及裝置。下面結(jié)合說明書附圖,對(duì)本發(fā)明進(jìn)行詳細(xì)說明。圖I為本發(fā)明提供的字符識(shí)別過程示意圖,該過程包括以下步驟SlOl :對(duì)包含待識(shí)別字符信息的圖片進(jìn)行二值化處理,識(shí)別二值化處理后該圖片中待識(shí)別字符的邊界,根據(jù)確定的邊界,在包含待識(shí)別字符信息的樣本圖片中截取待識(shí)別字符區(qū)域,對(duì)該截取的字符區(qū)域進(jìn)行二值化、歸一化處理。S102:在歸一化處理后的待識(shí)別字符區(qū)域中,識(shí)別像素值的跳變,根據(jù)跳變時(shí)白色 像素點(diǎn)的位置,在字符邊緣信息圖中相應(yīng)像素點(diǎn)的位置賦值255,其他像素點(diǎn)的位置賦其他值,其中該字符邊緣信息圖與該歸一化后的字符區(qū)域大小相等。S103 :識(shí)別該字符邊緣信息圖中每個(gè)像素點(diǎn)的像素值,當(dāng)識(shí)別到該字符邊緣信息圖中像素點(diǎn)的像素值為255時(shí),計(jì)算該像素點(diǎn)的梯度值,并確定歸屬方向,采用該歸屬方向值對(duì)邊緣梯度數(shù)組中相應(yīng)位置賦值,該數(shù)組的其他位置賦值為-I。S104 :將該邊緣梯度數(shù)組與保存的每個(gè)字符對(duì)應(yīng)的每個(gè)模板進(jìn)行匹配,確定匹配距離,將匹配距離最小值對(duì)應(yīng)的字符作為識(shí)別結(jié)果。在對(duì)字符識(shí)別之前還包括針對(duì)每個(gè)字符,創(chuàng)建該字符的多個(gè)模板,在創(chuàng)建每個(gè)字符的每個(gè)模板時(shí),也需要進(jìn)行歸一化處理、確定字符邊緣信息圖,并確定邊緣梯度數(shù)組中每個(gè)數(shù)值的取值,即模板的創(chuàng)建過程與在字符識(shí)別過程中進(jìn)行的步驟相同。當(dāng)確定了模板對(duì)應(yīng)的邊緣梯度數(shù)組中相應(yīng)位置的賦值后,采用相同的方法確定待識(shí)別字符對(duì)應(yīng)的邊緣梯度數(shù)組中每個(gè)相應(yīng)位置的賦值,根據(jù)待識(shí)別字符對(duì)應(yīng)邊緣梯度數(shù)組與模板之間的匹配,確定匹配距離,根據(jù)匹配距離識(shí)別字符。由于在本發(fā)明中由于根據(jù)字符中每個(gè)像素點(diǎn)的梯度方向,作為邊緣梯度數(shù)組中的相應(yīng)數(shù)值,而梯度方向具有較強(qiáng)的抗干擾能力,因此本字符識(shí)別方法具有較強(qiáng)的魯棒性,并且在識(shí)別的過程中與每個(gè)字符對(duì)應(yīng)的每個(gè)模板進(jìn)行匹配,根據(jù)匹配距離,將匹配距離最小 值對(duì)應(yīng)的字符作為識(shí)別結(jié)果,因此可以避免字符單模板匹配的魯棒性差的問題,提高了該匹配方法的適用范圍。下面通過具體的實(shí)施例,對(duì)本發(fā)明字符識(shí)別過程進(jìn)行詳細(xì)說明。為了提高字符識(shí)別的準(zhǔn)確性,并提高字符識(shí)別的效率,需要針對(duì)每個(gè)字符保存了多個(gè)模板,每個(gè)模板需要具有代表性,模板之間的差異比較大。在創(chuàng)建并保存字符的模板時(shí),需要對(duì)字符區(qū)域進(jìn)行歸一化處理,并提取該歸一化處理后字符區(qū)域的特征。圖2為本發(fā)明提供的字符模板創(chuàng)建過程中的歸一化處理的過程,該過程包括以下步驟S201 :將包含字符信息的樣本圖片進(jìn)行二值化處理。一般包括字符信息的樣本圖片為彩色圖片,在對(duì)該彩色圖片進(jìn)行二值化之前,需要首先將該彩色圖片轉(zhuǎn)換為灰度圖片,之后采用相應(yīng)的二值化算法對(duì)該灰度圖片進(jìn)行二值化處理,在本發(fā)明中可以采用Otsu 二值化算法對(duì)灰度圖片進(jìn)行二值化處理。S202:從二值化處理后的圖片的四個(gè)邊界開始,分別向圖片內(nèi)部搜索;當(dāng)搜索到該圖片中的白色像素點(diǎn)時(shí),確定該白色像素點(diǎn)位于該字符的邊界;根據(jù)從每個(gè)邊界方向掃描到的白色像素點(diǎn)的位置,確定該字符的邊界。在本發(fā)明中為了在該二值化處理后的圖片中檢測(cè)字符所在的區(qū)域,分別從該二值化處理后的圖片的四個(gè)邊界開始,向圖片內(nèi)部掃描,即從該二值化處理后的圖片的上、下、左、右四個(gè)方向分別向圖片內(nèi)部掃描。具體的當(dāng)從上、下兩個(gè)方向首次識(shí)別到白色像素點(diǎn)時(shí),則認(rèn)為該白色像素點(diǎn)所在的行為字符的上、下邊界所在的行,當(dāng)從左、右兩個(gè)方向首次識(shí)別到白色像素點(diǎn)時(shí),則認(rèn)為該白色像素點(diǎn)所在的列為該字符的左、右邊界所在的列。S203 :根據(jù)確定的字符的邊界,在包含字符信息的樣本圖片中截取字符區(qū)域。當(dāng)確定了構(gòu)成字符邊界的行和列后,即可在包含字符信息的樣本圖片中截取字符區(qū)域的圖片了。S204:對(duì)截取的字符區(qū)域進(jìn)行二值化處理,并按照設(shè)置的大小,對(duì)該二值化處理后的圖片進(jìn)行歸一化處理。當(dāng)從彩色圖片中截取了該字符區(qū)域后,對(duì)該字符區(qū)域?qū)?yīng)的圖片仍然為彩色圖片,將字符區(qū)域的彩色圖片轉(zhuǎn)換為灰度圖片,并對(duì)該灰度圖片采用OtSU 二值化算法進(jìn)行二值化處理,之后根據(jù)設(shè)置的大小,例如在本發(fā)明中該設(shè)定的大小可以為寬24,高48,對(duì)該二值化后的圖片進(jìn)行歸一化處理,并且同時(shí)對(duì)該轉(zhuǎn)換后的灰度圖片,按照該設(shè)置的大小進(jìn)行歸一化處理。從而得到歸一化后的二值圖和灰度圖。圖3為本發(fā)明提供的字符模板創(chuàng)建過程中的特征提取過程,該過程包括以下步驟S301 :在歸一化后的字 符區(qū)域中,識(shí)別像素點(diǎn)像素值的跳變。該歸一化后的字符區(qū)域?yàn)槎底址麍D,該二值字符圖的寬度為W,高度為H。在該二值字符圖中識(shí)別像素值的跳變,即兩個(gè)相鄰像素點(diǎn)的像素值由I變?yōu)?,或由0變?yōu)镮的情況。S302:根據(jù)像素值跳變時(shí)白色像素點(diǎn)的位置,在字符邊緣信息圖中將與該白色像素點(diǎn)位置對(duì)應(yīng)的像素點(diǎn)賦值為255,否則,賦值為其他值,其中該字符邊緣信息圖與該歸一化后的字符區(qū)域大小相等。該字符邊緣信息圖與該歸一化后的字符區(qū)域大小相等,即該字符邊緣信息圖與二值字符圖的大小相等,即行數(shù)、列數(shù)、像素點(diǎn)的數(shù)目相等。在確定該字符邊緣信息圖中每個(gè)像素點(diǎn)的像素值時(shí),需要識(shí)別到的該而二值字符圖中像素值的跳變,根據(jù)跳變時(shí)白色像素點(diǎn)對(duì)應(yīng)的位置,在字符邊緣信息圖中將與該白色像素點(diǎn)位置對(duì)應(yīng)的像素點(diǎn)賦值為255,該字符邊緣信息圖中其他像素點(diǎn)的位置賦值為其他值,例如可以為0。S303 :識(shí)別該字符邊緣信息圖中每個(gè)像素點(diǎn)的像素值,當(dāng)識(shí)別到該字符邊緣信息圖中像素點(diǎn)的像素值為255時(shí),計(jì)算該像素點(diǎn)的梯度值,并確定歸屬方向。S304 :將模板中與該像素點(diǎn)位置對(duì)應(yīng)的位置賦值為該梯度方向角,其他位置賦值為-I。在本發(fā)明中創(chuàng)建一個(gè)和字符邊緣信息圖高度和寬度相等模板,模板也可以認(rèn)為是一個(gè)與該字符邊緣信息圖高度和寬度相等的二維數(shù)組。在確定該模板中每個(gè)位置的賦值時(shí),掃描該字符邊緣信息圖,當(dāng)掃描到像素點(diǎn)的像素值為其他值時(shí),例如為0時(shí),則將與該像素點(diǎn)位置對(duì)應(yīng)的該模板中的相應(yīng)位置賦值為-I ;當(dāng)掃描到像素點(diǎn)的像素值為255時(shí),即掃描到白點(diǎn)時(shí),則在歸一化后的灰色圖中與該像素點(diǎn)對(duì)應(yīng)的位置上,根據(jù)下式計(jì)算該像素點(diǎn)的梯度值Gradient=dy/dx其中,dy= g(i, j+l)-g(i, j_l), dx = g(i+l, j)-g(i_l, j),g(i, j)在歸一化后的灰度圖像中該像素點(diǎn)對(duì)應(yīng)位置的灰度值,i表示該像素點(diǎn)所在的行,j表示該像素點(diǎn)所在的列,Gradient為計(jì)算的該像素點(diǎn)的梯度值。將0度到360度的角度范圍8等分,每一等份對(duì)應(yīng)一個(gè)梯度方向,分別采用廣8來標(biāo)記,根據(jù)計(jì)算出的該像素點(diǎn)的梯度值,計(jì)算該像素點(diǎn)的梯度方向角,根據(jù)計(jì)算的該梯度方向角,確定該梯度方向角歸屬的方向。在針對(duì)每個(gè)字符創(chuàng)建了多個(gè)模板后,將每個(gè)模板保存在模板庫中與每個(gè)字符對(duì)應(yīng)的位置,即在模板庫中針對(duì)每個(gè)字符保存了多個(gè)模板。在針對(duì)字符進(jìn)行識(shí)別時(shí),當(dāng)獲取了包含待識(shí)別字符的圖片后,依據(jù)上述模板的創(chuàng)建過程,將該圖片轉(zhuǎn)換為灰度圖,并采用相應(yīng)的二值化算法,對(duì)轉(zhuǎn)換后的圖片進(jìn)行二值化處理,該二值化算法與模板創(chuàng)建過程中的二值化算法相同。在二值化處理后的圖片中,分別從圖片的四個(gè)方向開始向圖片內(nèi)部掃描,識(shí)別每個(gè)方向上第一個(gè)白色像素點(diǎn)的位置,根據(jù)每個(gè)方向上識(shí)別到的白色像素點(diǎn)的位置,確定該待識(shí)別字符的邊界;根據(jù)確定的字符邊界,從該待識(shí)別字符的彩色圖片中截取該待識(shí)別字符區(qū)域。將截取的待識(shí)別字符區(qū)域轉(zhuǎn)換為灰度圖,并采用相應(yīng)的二值化算法,對(duì)該灰度圖進(jìn)行二值化處理,并按照設(shè)置的大小,對(duì)該灰度圖及二值化處理后的待識(shí)別字符區(qū)域進(jìn)行歸一化處理,其中該設(shè)置的大小,與模板創(chuàng)建過程中設(shè)置的大小相同,例如都是寬24,高48等,并且這里采用的二值化算法也與模板創(chuàng)建中歸一化過程采用的二值化算法相同。對(duì)二值化后該待識(shí)別字符區(qū)域進(jìn)行歸一化處理后,識(shí)別該歸一化后像素點(diǎn)的像素值的跳變,當(dāng)識(shí)別到像素值出現(xiàn)從0到1,或者從I到0的跳變時(shí),根據(jù)跳變時(shí)白色像素點(diǎn)的位置,在字符邊緣信息圖中相應(yīng)像素點(diǎn)的位置賦值為255,其余像素點(diǎn)的位置賦值為O。識(shí)別賦值后字符邊緣信息圖中每個(gè)像素點(diǎn)的像素值,當(dāng)識(shí)別到像素值為255的像素點(diǎn)時(shí),根據(jù)歸一化后的灰度圖中該像素點(diǎn)與其相鄰像素點(diǎn)的灰度值,計(jì)算該像素點(diǎn)的梯度值,根據(jù)計(jì)算的該像素點(diǎn)的梯度值,確定該像素點(diǎn)的梯度方向。根據(jù)確定的該像素點(diǎn)的梯度方向,在0度到360度角度范圍內(nèi)等分的8個(gè)方向中,確定該梯度方向歸屬的方向,將其歸屬的方向作為待識(shí)別字符邊緣梯度數(shù)組中對(duì)應(yīng)該像素點(diǎn)位置的數(shù)值,該數(shù)組的其他位置賦值為-I。將該邊緣梯度數(shù)組與保存的每個(gè)字符對(duì)應(yīng)的每個(gè)模板進(jìn)行匹配,確定與每個(gè)模板的匹配距離,具體在確定匹配距離時(shí),根據(jù)下式n
U =---
,V
fO if (c(/, /) = t(i, /))其中,#,/1^j5,)) c (i,j)為待識(shí)別字符的邊緣梯度數(shù)組中第
i行,第j列的數(shù)值,t(i, j)為模板中第i行,第j列的數(shù)值,H為歸一化后模板的高度,W為歸一化后模板的寬度,S的數(shù)值根據(jù)待識(shí)別字符的邊緣梯度數(shù)組中不等于-I的次數(shù),SP模板每個(gè)位置不等于-I的次數(shù)和確定。圖4為本發(fā)明提供的字符識(shí)別裝置的結(jié)構(gòu)示意圖,該裝置包括歸一化模塊41,用于對(duì)包含待識(shí)別字符信息的圖片進(jìn)行二值化處理,識(shí)別二值化處理后該圖片中待識(shí)別字符的邊界,根據(jù)確定的邊界,在包含待識(shí)別字符信息的樣本圖片中截取待識(shí)別字符區(qū)域,對(duì)該截取的字符區(qū)域進(jìn)行二值化、歸一化處理;邊緣信息確定模塊42,用于在歸一化處理后的待識(shí)別字符區(qū)域中,識(shí)別像素值的跳變,根據(jù)跳變時(shí)白色像素點(diǎn)的位置,在字符邊緣信息圖中相應(yīng)像素點(diǎn)的位置賦值255,其他像素點(diǎn)的位置賦其他值,其中該字符邊緣信息圖與該歸一化后的字符區(qū)域大小相等;梯度方向確定模塊43,用于識(shí)別該字符邊緣信息圖中每個(gè)像素點(diǎn)的像素值,當(dāng)識(shí)別到該字符邊緣信息圖中像素點(diǎn)的像素值為255時(shí),計(jì)算該像素點(diǎn)的梯度值,并確定歸屬方向,采用該歸屬方向值對(duì)邊緣梯度數(shù)組中相應(yīng)位置賦值,該數(shù)組的其他位置賦值為-I ;匹配識(shí)別模塊44,用于將該邊緣梯度數(shù)組與保存的每個(gè)字符對(duì)應(yīng)的每個(gè)模板進(jìn)行、匹配,確定匹配距離,將匹配距離最小值對(duì)應(yīng)的字符作為識(shí)別結(jié)果。所述歸一化模塊41,還用于在創(chuàng)建模板時(shí),對(duì)包含字符信息的樣本圖片進(jìn)行二值化處理,識(shí)別二值化處理后該圖片中字符的邊界;根據(jù)確定的字符邊界,在包含字符信息的樣本圖片中截取字符區(qū)域,對(duì)該截取的字符區(qū)域進(jìn)行二值化、歸一化處理;所述邊緣信息確定模塊42,還用于在創(chuàng)建模板時(shí),在歸一化處理后的字符區(qū)域中,識(shí)別像素值的跳變,根據(jù)跳變時(shí)白色像素點(diǎn)的位置,在字符邊緣信息圖中相應(yīng)像素點(diǎn)的位置賦值255,其他像素點(diǎn)的位置賦其他值,其中該字符邊緣信息圖與該歸一化后的字符區(qū)域大小相等;所述梯度方向確定模塊43,還用于在創(chuàng)建模板時(shí),識(shí)別該字符邊緣信息圖中每個(gè)像素點(diǎn)的像素值,當(dāng)識(shí)別到該字符邊緣信息圖中像素點(diǎn)的像素值為255時(shí),計(jì)算該像素點(diǎn)的梯度值,并確定歸屬方向,將模板中與該像素點(diǎn)位置對(duì)應(yīng)的位置賦值為方向值,其他位置 賦值為_1。所述歸一化模塊41,具體用于從二值化處理后的圖片的四個(gè)邊界開始,分別向圖片內(nèi)部搜索;當(dāng)搜索到該圖片中的白色像素點(diǎn)時(shí),確定該白色像素點(diǎn)位于該字符的邊界;根據(jù)從每個(gè)邊界方向掃描到的白色像素點(diǎn)的位置,確定該字符的邊界。所述歸一化模塊41,還用于將該截取的字符區(qū)域轉(zhuǎn)換為灰度圖,并進(jìn)行歸一化處理;所述梯度方向確定模塊43,用于在歸一化后的灰色圖中與該像素點(diǎn)對(duì)應(yīng)的位置上,根據(jù)下式計(jì)算該像素點(diǎn)的梯度值Gradient=dy/dx其中,dy= g(i, j+l)-g(i, j_l), dx = g(i+l, j)-g(i_l, j),g(i, j)在歸一化后的灰度圖像中該像素點(diǎn)對(duì)應(yīng)位置的灰度值,i表示該像素點(diǎn)所在的行,j表示該像素點(diǎn)所在的列,Gradient為計(jì)算的該像素點(diǎn)的梯度值;根據(jù)計(jì)算的該梯度值,計(jì)算梯度方向角;根據(jù)該梯度方向角,以及在0到360度間劃分的8個(gè)方向,確定該梯度方向角歸屬的方向。
H W所述匹配識(shí)別模塊44,具體用于根據(jù)0 =確定匹配距離,其中,
.._ 5
[0 //(c(/,/) = /(/ ,/))
#(U) = js ific{i j)[=t{i j)) c(i, j)為待識(shí)別字符的邊緣梯度數(shù)組中第i行,第j列的
數(shù)值,t(i,j)為模板中第i行,第j列的數(shù)值,H為歸一化后模板的高度,W為歸一化后模板的寬度,S的數(shù)值根據(jù)待識(shí)別字符的邊緣梯度數(shù)組中不等于-I的次數(shù),即模板每個(gè)位置不等于-I的次數(shù)和確定。本發(fā)明提供了一種字符識(shí)別方法及裝置,該方法針對(duì)待識(shí)別字符識(shí)別和模板創(chuàng)建時(shí),進(jìn)行歸一化處理、確定字符邊緣信息圖,并確定邊緣梯度數(shù)組中每個(gè)數(shù)值的取值,當(dāng)確定了邊緣梯度數(shù)組中相應(yīng)位置的賦值后,根據(jù)待識(shí)別字符對(duì)應(yīng)邊緣梯度數(shù)組與每個(gè)字符對(duì)應(yīng)的每個(gè)模板之間的匹配,確定匹配距離,根據(jù)匹配距離識(shí)別字符。由于在本發(fā)明中根據(jù)字符中每個(gè)像素點(diǎn)的梯度方向,作為邊緣梯度數(shù)組中的相應(yīng)數(shù)值,而梯度方向具有較強(qiáng)的抗干擾能力,因此本字符識(shí)別方法具有較強(qiáng)的魯棒性,并且在識(shí)別的過程中與每個(gè)字符對(duì)應(yīng)的每個(gè)模板進(jìn)行匹配,根據(jù)匹配距離,將匹配距離最小值對(duì)應(yīng)的字符作為識(shí)別結(jié)果,因此可以避免字符單模板匹配的魯棒性差的問題,提高了該匹配方法的適用范圍。上述說明示出并描述了本發(fā)明的一個(gè)優(yōu)選實(shí)施例,但如前所述,應(yīng)當(dāng)理解本發(fā)明并非局限于本文所披露的形式,不應(yīng)看作是對(duì)其他實(shí)施例的排除,而可用于各種其他組合、 修改和環(huán)境,并能夠在本文所述發(fā)明構(gòu)想范圍內(nèi),通過上述構(gòu)思或相關(guān)領(lǐng)域的技術(shù)或知識(shí)進(jìn)行改進(jìn)。而本領(lǐng)域人員所進(jìn)行的改動(dòng)和變化不脫離本發(fā)明的精神和范圍,則都應(yīng)在本發(fā)明所附權(quán)利要求的保護(hù)范圍內(nèi)。
權(quán)利要求
1.一種字符識(shí)別方法,其特征在于,所述方法包括 對(duì)包含待識(shí)別字符信息的圖片進(jìn)行二值化處理,識(shí)別二值化處理后該圖片中字符的邊界,根據(jù)確定的邊界,在包含待識(shí)別字符信息的樣本圖片中截取待識(shí)別字符區(qū)域,對(duì)該截取的字符區(qū)域進(jìn)行二值化、歸一化處理; 在歸一化處理后的待識(shí)別字符區(qū)域中,識(shí)別像素值的跳變,根據(jù)跳變時(shí)白色像素點(diǎn)的位置,在字符邊緣信息圖中相應(yīng)像素點(diǎn)的位置賦值255,其他像素點(diǎn)的位置賦其他值,其中該字符邊緣信息圖與該歸一化后的字符區(qū)域大小相等; 識(shí)別該字符邊緣信息圖中每個(gè)像素點(diǎn)的像素值,當(dāng)識(shí)別到該字符邊緣信息圖中像素點(diǎn)的像素值為255時(shí),計(jì)算該像素點(diǎn)的梯度值,并確定歸屬方向,采用該歸屬方向值對(duì)邊緣梯度數(shù)組中相應(yīng)位置賦值,該數(shù)組的其他位置賦值為-I ; 將該邊緣梯度數(shù)組與保存的每個(gè)字符對(duì)應(yīng)的每個(gè)模板進(jìn)行匹配,確定匹配距離,將匹配距離最小值對(duì)應(yīng)的字符作為識(shí)別結(jié)果。
2.如權(quán)利要求I所述的方法,其特征在于,創(chuàng)建并保存針對(duì)每個(gè)字符的每個(gè)模板包括 對(duì)包含字符信息的樣本圖片進(jìn)行二值化處理,識(shí)別二值化處理后該圖片中字符的邊界; 根據(jù)確定的字符邊界,在包含字符信息的樣本圖片中截取字符區(qū)域,對(duì)該截取的字符區(qū)域進(jìn)行二值化、歸一化處理; 在歸一化處理后的字符區(qū)域中,識(shí)別像素值的跳變,根據(jù)跳變時(shí)白色像素點(diǎn)的位置,在字符邊緣信息圖中相應(yīng)像素點(diǎn)的位置賦值255,其他像素點(diǎn)的位置賦其他值,其中該字符邊緣信息圖與該歸一化后的字符區(qū)域大小相等; 識(shí)別該字符邊緣信息圖中每個(gè)像素點(diǎn)的像素值,當(dāng)識(shí)別到該字符邊緣信息圖中像素點(diǎn)的像素值為255時(shí),計(jì)算該像素點(diǎn)的梯度值,并確定歸屬方向,將模板中與該像素點(diǎn)位置對(duì)應(yīng)的位置賦值為方向值,其他位置賦值為-I。
3.如權(quán)利要求I或2所述的方法,其特征在于,所述識(shí)別二值化處理后該圖片中字符的邊界包括 從二值化處理后的圖片的四個(gè)邊界開始,分別向圖片內(nèi)部搜索; 當(dāng)搜索到該圖片中的白色像素點(diǎn)時(shí),確定該白色像素點(diǎn)位于該字符的邊界; 根據(jù)從每個(gè)邊界方向掃描到的白色像素點(diǎn)的位置,確定該字符的邊界。
4.如權(quán)利要求I或2所述的方法,其特征在于,對(duì)該截取的字符區(qū)域進(jìn)行二值化、歸一化處理后,該方法還包括 將該截取的字符區(qū)域轉(zhuǎn)換為灰度圖,并進(jìn)行歸一化處理; 所述計(jì)算該像素點(diǎn)的梯度值,并確定歸屬方向角包括 在歸一化后的灰色圖中與該像素點(diǎn)對(duì)應(yīng)的位置上,根據(jù)下式計(jì)算該像素點(diǎn)的梯度值 Gradient=dy/dx 其中,dy = g(i, j+l)-g(i, j-1), dx = g(i+l, j)-g(i_l, j),g(i, j)在歸一化后的灰度圖像中該像素點(diǎn)對(duì)應(yīng)位置的灰度值,i表示該像素點(diǎn)所在的行,j表示該像素點(diǎn)所在的列,Gradient為計(jì)算的該像素點(diǎn)的梯度值; 根據(jù)計(jì)算的該梯度值,計(jì)算梯度方向角; 根據(jù)該梯度方向角,以及在O到360度間劃分的8個(gè)方向,確定該梯度方向角歸屬的方向。
5.如權(quán)利要求I所述的方法,其特征在于,所述將該二值化邊緣梯度圖與保存的每個(gè)模板進(jìn)行匹配,確定匹配距離包括 根據(jù)n確定匹配距離,其中
6.一種字符識(shí)別裝置,其特征在于,所述裝置包括 歸一化模塊,用于對(duì)包含待識(shí)別字符信息的圖片進(jìn)行二值化處理,識(shí)別二值化處理后該圖片中待識(shí)別字符的邊界,根據(jù)確定的邊界,在包含待識(shí)別字符信息的樣本圖片中截取待識(shí)別字符區(qū)域,對(duì)該截取的字符區(qū)域進(jìn)行二值化、歸一化處理; 邊緣信息確定模塊,用于在歸一化處理后的待識(shí)別字符區(qū)域中,識(shí)別像素值的跳變,根據(jù)跳變時(shí)白色像素點(diǎn)的位置,在字符邊緣信息圖中相應(yīng)像素點(diǎn)的位置賦值255,其他像素點(diǎn)的位置賦其他值,其中該字符邊緣信息圖與該歸一化后的字符區(qū)域大小相等; 梯度方向確定模塊,用于識(shí)別該字符邊緣信息圖中每個(gè)像素點(diǎn)的像素值,當(dāng)識(shí)別到該字符邊緣信息圖中像素點(diǎn)的像素值為255時(shí),計(jì)算該像素點(diǎn)的梯度值,并確定歸屬方向,采用該歸屬方向值對(duì)邊緣梯度數(shù)組中相應(yīng)位置賦值,該數(shù)組的其他位置賦值為-I ; 匹配識(shí)別模塊,用于將該邊緣梯度數(shù)組與保存的每個(gè)模板進(jìn)行匹配,確定匹配距離,將匹配距離最小值對(duì)應(yīng)的字符作為識(shí)別結(jié)果。
7.如權(quán)利要求6所述的裝置,其特征在于,所述歸一化模塊,還用于在創(chuàng)建模板時(shí),對(duì)包含字符信息的樣本圖片進(jìn)行二值化處理,識(shí)別二值化處理后該圖片中字符的邊界;根據(jù)確定的字符邊界,在包含字符信息的樣本圖片中截取字符區(qū)域,對(duì)該截取的字符區(qū)域進(jìn)行二值化、歸一化處理; 所述邊緣信息確定模塊,還用于在創(chuàng)建模板時(shí),在歸一化處理后的字符區(qū)域中,識(shí)別像素值的跳變,根據(jù)跳變時(shí)白色像素點(diǎn)的位置,在字符邊緣信息圖中相應(yīng)像素點(diǎn)的位置賦值255,其他像素點(diǎn)的位置賦其他值,其中該字符邊緣信息圖與該歸一化后的字符區(qū)域大小相等; 所述梯度方向確定模塊,還用于在創(chuàng)建模板時(shí),識(shí)別該字符邊緣信息圖中每個(gè)像素點(diǎn)的像素值,當(dāng)識(shí)別到該字符邊緣信息圖中像素點(diǎn)的像素值為255時(shí),計(jì)算該像素點(diǎn)的梯度值,并確定歸屬方向,將模板中與該像素點(diǎn)位置對(duì)應(yīng)的位置賦值為方向值,其他位置賦值為
8.如權(quán)利要求6或7所述的裝置,其特征在于,所述歸一化模塊,具體用于從二值化處理后的圖片的四個(gè)邊界開始,分別向圖片內(nèi)部搜索;當(dāng)搜索到該圖片中的白色像素點(diǎn)時(shí),確定該白色像素點(diǎn)位于該字符的邊界;根據(jù)從每個(gè)邊界方向掃描到的白色像素點(diǎn)的位置,確定該字符的邊界。
9.如權(quán)利要求6或7所述的裝置,其特征在于,所述歸一化模塊,還用于將該截取的字符區(qū)域轉(zhuǎn)換為灰度圖,并進(jìn)行歸一化處理;所述梯度方向確定模塊,用于在歸一化后的灰色圖中與該像素點(diǎn)對(duì)應(yīng)的位置上,根據(jù)下式計(jì)算該像素點(diǎn)的梯度值Gradient=dy/dx 其中,dy = g(i, j+l)-g(i, j-1), dx = g(i+l, j)-g(i_l, j),g(i, j)在歸一化后的灰度圖像中該像素點(diǎn)對(duì)應(yīng)位置的灰度值,i表示該像素點(diǎn)所在的行,j表示該像素點(diǎn)所在的列,Gradient為計(jì)算的該像素點(diǎn)的梯度值; 根據(jù)計(jì)算的該梯度值,計(jì)算梯度方向角; 根據(jù)該梯度方向角,以及在O到360度間劃分的8個(gè)方向,確定該梯度方向角歸屬的方向。
10.如權(quán)利要求6所述的裝置,其特征在于,所述匹配識(shí)別模塊,具體用于根據(jù)
全文摘要
本發(fā)明公開了一種字符識(shí)別方法及裝置,該方法針對(duì)待識(shí)別字符的識(shí)別和模板創(chuàng)建時(shí),進(jìn)行歸一化處理、確定字符邊緣信息圖,并確定邊緣梯度數(shù)組中每個(gè)數(shù)值的取值,當(dāng)確定了邊緣梯度數(shù)組中相應(yīng)位置的賦值后,根據(jù)待識(shí)別字符對(duì)應(yīng)邊緣梯度數(shù)組與每個(gè)字符對(duì)應(yīng)的每個(gè)模板之間的匹配,確定匹配距離,根據(jù)匹配距離識(shí)別字符。由于本發(fā)明中根據(jù)字符中每個(gè)像素點(diǎn)的梯度方向,作為邊緣梯度數(shù)組中的相應(yīng)數(shù)值,而梯度方向具有較強(qiáng)的抗干擾能力,因此該字符識(shí)別方法具有較強(qiáng)的魯棒性,而在識(shí)別的過程中與每個(gè)字符對(duì)應(yīng)的每個(gè)模板進(jìn)行匹配,將匹配距離最小值對(duì)應(yīng)的字符作為識(shí)別結(jié)果,因此可以避免字符單模板匹配的魯棒性差的問題,提高了該匹配方法的適用范圍。
文檔編號(hào)G06K9/20GK102750530SQ20121017776
公開日2012年10月24日 申請(qǐng)日期2012年5月31日 優(yōu)先權(quán)日2012年5月31日
發(fā)明者王海峰 申請(qǐng)人:信幀電子技術(shù)(北京)有限公司