亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

字符識(shí)別方法和字符識(shí)別裝置制造方法

文檔序號(hào):6500099閱讀:220來(lái)源:國(guó)知局
字符識(shí)別方法和字符識(shí)別裝置制造方法
【專利摘要】本發(fā)明公開(kāi)了一種字符識(shí)別方法和字符識(shí)別裝置。該字符識(shí)別方法包括:獲取閾值數(shù)組;從閾值數(shù)組中選取第一閾值作為選定閾值;采用選定閾值對(duì)字符圖像進(jìn)行二值化處理,得到字符圖像的二值圖像;對(duì)二值圖像進(jìn)行字符識(shí)別,得到識(shí)別結(jié)果;計(jì)算識(shí)別結(jié)果的置信度;判斷識(shí)別結(jié)果的置信度是否大于置信度預(yù)定值,如果識(shí)別結(jié)果的置信度大于置信度預(yù)定值,則將識(shí)別結(jié)果作為字符圖像的識(shí)別結(jié)果;以及如果識(shí)別結(jié)果的置信度不大于置信度預(yù)定值,則從閾值數(shù)組中選取第二閾值,采用第二閾值替換第一閾值作為選定閾值。通過(guò)本發(fā)明,解決了傳統(tǒng)的字符識(shí)別方法僅適用于識(shí)別圖像對(duì)比度高的原稿,而對(duì)圖像對(duì)比度低的原稿識(shí)別率較低的問(wèn)題。
【專利說(shuō)明】字符識(shí)別方法和字符識(shí)別裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及字符識(shí)別領(lǐng)域,具體而言,涉及一種字符識(shí)別方法和字符識(shí)別裝置。
【背景技術(shù)】
[0002]傳統(tǒng)的字符識(shí)別方法包括:a)掃描獲取原稿的灰度圖像;b)通過(guò)對(duì)獲取到的圖像的灰度直方圖的分析和計(jì)算來(lái)得到閾值,根據(jù)閾值對(duì)灰度圖像進(jìn)行二值化處理得到二值圖像;c)對(duì)二值圖像進(jìn)行字符切割,對(duì)切割的字符塊和模板字符進(jìn)行對(duì)比,選取與模板字符最相近的字符為識(shí)別字符。
[0003]在傳統(tǒng)的字符識(shí)別方法中,進(jìn)行閾值計(jì)算的方法有Otsu方法、NiBlack方法、最小誤差法或最大熵方法等。發(fā)明人發(fā)現(xiàn),無(wú)論采用哪種方法獲得的閾值,在對(duì)灰度圖像進(jìn)行二值化處理時(shí)均存在一定的局限性。具體的,對(duì)于對(duì)比度低的原稿,使用單一閾值對(duì)原稿圖像二值化時(shí)容易產(chǎn)生失真現(xiàn)象。比如,當(dāng)需要進(jìn)行字符識(shí)別的原稿為紙幣時(shí),由于紙幣在使用過(guò)程中容易受到磨損、污染或涂鴉,因此,紙幣圖像的對(duì)比度較低,如圖1a所示的紙幣號(hào)碼區(qū)域圖像,由于字符“C”所在區(qū)域受到污染,當(dāng)利用傳統(tǒng)的字符識(shí)別方法使用單一閾值對(duì)圖1a所示圖像進(jìn)行二值化處理得到圖1b所示的二值圖像,從圖中可以看出,很難準(zhǔn)確識(shí)別出字符“C”。因此,傳統(tǒng)的字符識(shí)別方法僅適用于識(shí)別圖像對(duì)比度高的原稿,而對(duì)圖像對(duì)比度低的原稿識(shí)別率較低。

【發(fā)明內(nèi)容】

[0004]本發(fā)明的主要目的在于提供一種字符識(shí)別方法和字符識(shí)別裝置,以解決傳統(tǒng)的字符識(shí)別方法僅適用于識(shí)別圖像對(duì)比度高的原稿,而對(duì)圖像對(duì)比度低的原稿識(shí)別率較低的問(wèn)題。
[0005]為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種字符識(shí)別方法。該字符識(shí)別方法包括:獲取閾值數(shù)組,其中,閾值數(shù)組包括多個(gè)閾值;從閾值數(shù)組中選取第一閾值作為選定閾值;步驟a,采用選定閾值對(duì)字符圖像進(jìn)行二值化處理,得到字符圖像的二值圖像;步驟b,對(duì)二值圖像進(jìn)行字符識(shí)別,得到識(shí)別結(jié)果;步驟C,計(jì)算識(shí)別結(jié)果的置信度;步驟d,判斷識(shí)別結(jié)果的置信度是否大于置信度預(yù)定值,如果識(shí)別結(jié)果的置信度大于置信度預(yù)定值,則將識(shí)別結(jié)果作為字符圖像的識(shí)別結(jié)果;以及如果識(shí)別結(jié)果的置信度不大于置信度預(yù)定值,則從閾值數(shù)組中選取第二閾值,采用第二閾值替換第一閾值作為選定閾值,并返回執(zhí)行步驟a。
[0006]進(jìn)一步地,步驟a還包括:切分二值圖像,得到N個(gè)切分區(qū)域,其中,N個(gè)切分區(qū)域中的每一個(gè)切分區(qū)域分別與一個(gè)待識(shí)別字符相對(duì)應(yīng)。步驟b包括:對(duì)N個(gè)切分區(qū)域進(jìn)行字符識(shí)別,得到分別對(duì)應(yīng)于N個(gè)切分區(qū)域的N個(gè)識(shí)別結(jié)果。步驟c包括:計(jì)算N個(gè)識(shí)別結(jié)果的置信度。步驟d包括:判斷N個(gè)識(shí)別結(jié)果的置信度是否均大于置信度預(yù)定值,如果N個(gè)識(shí)別結(jié)果的置信度均大于置信度預(yù)定值,則確定識(shí)別結(jié)果的置信度大于置信度預(yù)定值,如果N個(gè)識(shí)別結(jié)果中任意一個(gè)的置信度不大于置信度預(yù)定值,則確定識(shí)別結(jié)果的置信度不大于置信度預(yù)定值。
[0007]進(jìn)一步地,在選取第一閾值作為選定閾值時(shí),如果N個(gè)識(shí)別結(jié)果中任意一個(gè)的置信度不大于置信度預(yù)定值,該方法還包括:記錄第一切分區(qū)域的識(shí)別結(jié)果和第二切分區(qū)域,其中,第一切分區(qū)域?yàn)镹個(gè)識(shí)別結(jié)果中置信度大于置信度預(yù)定值的識(shí)別結(jié)果對(duì)應(yīng)的切分區(qū)域,第二切分區(qū)域?yàn)镹個(gè)識(shí)別結(jié)果中置信度不大于置信度預(yù)定值的識(shí)別結(jié)果對(duì)應(yīng)的切分區(qū)域。在選取第二閾值作為選定閾值時(shí):步驟a包括:采用第二閾值作為選定閾值對(duì)字符圖像進(jìn)行二值化處理,得到字符圖像的二值圖像,切分二值圖像,得到N個(gè)切分區(qū)域,步驟b包括:對(duì)N個(gè)切分區(qū)域中與第二切分區(qū)域?qū)?yīng)的切分區(qū)域進(jìn)行字符識(shí)別。
[0008]進(jìn)一步地,在采用選定閾值對(duì)字符圖像進(jìn)行二值化處理之前,該方法還包括:獲取字符圖像的直方圖;對(duì)字符圖像的直方圖進(jìn)行計(jì)算,得到基礎(chǔ)閾值;以基礎(chǔ)閾值為中心閾值進(jìn)行拓展得到閾值數(shù)組。
[0009]進(jìn)一步地,采用以下方式由基礎(chǔ)閾值為中心閾值進(jìn)行拓展得到閾值數(shù)組TH:
[0010]TH= {TO, TO+ Δ , TO- Δ , T0+2 Δ , T0-2 Δ ,…},
[0011]其中,Δ為閾值數(shù)組TH中相鄰閾值之間的差值,TO為基礎(chǔ)閾值。
[0012]為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的另一方面,提供了一種字符識(shí)別裝置。該字符識(shí)別裝置包括:獲取單元,用于獲取閾值數(shù)組,其中,閾值數(shù)組包括多個(gè)閾值;二值化處理單元,用于采用選定閾值對(duì)字符圖像進(jìn)行二值化處理,得到字符圖像的二值圖像;識(shí)別單元,用于對(duì)二值圖像進(jìn)行字符識(shí)別,得到識(shí)別結(jié)果;計(jì)算單元,用于計(jì)算識(shí)別結(jié)果的置信度;判斷單元,判斷識(shí)別結(jié)果的置信度是否大于置信度預(yù)定值,其中,如果識(shí)別結(jié)果的置信度大于置信度預(yù)定值,則將識(shí) 別結(jié)果作為字符圖像的識(shí)別結(jié)果;選取單元,用于從閾值數(shù)組中選取第一閾值或第二閾值作為選定閾值,其中,首先選取第一閾值作為選定閾值,在第一閾值作為選定閾值時(shí),如果識(shí)別結(jié)果的置信度不大于置信度預(yù)定值,則從閾值數(shù)組中選取第二閾值。
[0013]進(jìn)一步地,二值化處理單元還用于切分二值圖像,得到N個(gè)切分區(qū)域,其中,N個(gè)切分區(qū)域中的每一個(gè)切分區(qū)域分別與一個(gè)待識(shí)別字符相對(duì)應(yīng),識(shí)別單元還用于對(duì)N個(gè)切分區(qū)域進(jìn)行字符識(shí)別,得到分別對(duì)應(yīng)于N個(gè)切分區(qū)域的N個(gè)識(shí)別結(jié)果,計(jì)算單元還用于計(jì)算N個(gè)識(shí)別結(jié)果的置信度,判斷單元還用于判斷N個(gè)識(shí)別結(jié)果的置信度是否均大于置信度預(yù)定值,如果N個(gè)識(shí)別結(jié)果的置信度均大于置信度預(yù)定值,則確定識(shí)別結(jié)果的置信度大于置信度預(yù)定值,如果N個(gè)識(shí)別結(jié)果中任意一個(gè)的置信度不大于置信度預(yù)定值,則確定識(shí)別結(jié)果的置信度不大于置信度預(yù)定值。
[0014]進(jìn)一步地,該字符識(shí)別裝置還包括:記錄單元,用于在選取第一閾值作為選定閾值時(shí),如果N個(gè)識(shí)別結(jié)果中任意一個(gè)的置信度不大于置信度預(yù)定值,記錄第一切分區(qū)域的識(shí)別結(jié)果和第二切分區(qū)域,其中,第一切分區(qū)域?yàn)镹個(gè)識(shí)別結(jié)果中置信度大于置信度預(yù)定值的識(shí)別結(jié)果對(duì)應(yīng)的切分區(qū)域,第二切分區(qū)域?yàn)镹個(gè)識(shí)別結(jié)果中置信度不大于置信度預(yù)定值的識(shí)別結(jié)果對(duì)應(yīng)的切分區(qū)域,其中,二值化處理單元還用于在選取第二閾值作為選定閾值時(shí),采用第二閾值作為選定閾值對(duì)字符圖像進(jìn)行二值化處理,得到字符圖像的二值圖像,切分二值圖像,得到N個(gè)切分區(qū)域,其中,識(shí)別單元還用于對(duì)N個(gè)切分區(qū)域中與第二切分區(qū)域?qū)?yīng)的切分區(qū)域進(jìn)行字符識(shí)別。
[0015]進(jìn)一步地,獲取單元包括:獲取模塊,用于在采用選定閾值對(duì)字符圖像進(jìn)行二值化處理之前,獲取字符圖像的直方圖;計(jì)算模塊,用于對(duì)字符圖像的直方圖進(jìn)行計(jì)算,得到基礎(chǔ)閾值;拓展模塊,用于以基礎(chǔ)閾值為中心閾值進(jìn)行拓展得到閾值數(shù)組TH。
[0016]進(jìn)一步地,拓展模塊用于采用以下方式由基礎(chǔ)閾值為中心閾值進(jìn)行拓展得到閾值數(shù)組TH:
[0017]TH= {TO, TO+ Δ , TO- Δ , T0+2 Δ , T0-2 Δ ,…},
[0018]其中,Δ為閾值數(shù)組TH中相鄰閾值之間的差值,TO為基礎(chǔ)閾值。
[0019]通過(guò)本發(fā)明,對(duì)識(shí)別字符進(jìn)行置信度評(píng)估,通過(guò)置信度的評(píng)估結(jié)果對(duì)閾值動(dòng)態(tài)調(diào)整,只有置信度符合要求的識(shí)別字符為最終的識(shí)別字符,解決了傳統(tǒng)的字符識(shí)別方法僅適用于識(shí)別圖像對(duì)比度高的原稿,而對(duì)圖像對(duì)比度低的原稿識(shí)別率較低的問(wèn)題。
【專利附圖】

【附圖說(shuō)明】
[0020]構(gòu)成本申請(qǐng)的一部分的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,本發(fā)明的示意性實(shí)施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
[0021]圖1a是對(duì)比度較低的紙幣號(hào)碼區(qū)域圖像的示意圖;
[0022]圖1b是利用傳統(tǒng) 的閾值計(jì)算方法得到的閾值對(duì)圖1a中圖像進(jìn)行二值化處理得到的二值圖像的示意圖;
[0023]圖2是根據(jù)本發(fā)明一實(shí)施例的字符識(shí)別裝置的模塊組成示意圖;
[0024]圖3是根據(jù)本發(fā)明第一實(shí)施例的字符識(shí)別方法的流程圖;
[0025]圖4是根據(jù)本發(fā)明第二實(shí)施例的字符識(shí)別方法的流程圖;
[0026]圖5是根據(jù)本發(fā)明第三實(shí)施例的字符識(shí)別方法的流程圖;
[0027]圖6a是根據(jù)本發(fā)明一實(shí)施例的字符圖像的示意圖;
[0028]圖6b是圖6a中字符圖像的灰度直方圖;
[0029]圖7是根據(jù)本發(fā)明第一實(shí)施例的字符識(shí)別方法中利用不同閾值對(duì)字符圖像進(jìn)行二值化處理和字符識(shí)別結(jié)果之間的關(guān)系圖;以及
[0030]圖8是根據(jù)本發(fā)明第二實(shí)施例的字符識(shí)別方法中利用不同閾值對(duì)字符圖像進(jìn)行二值化處理和字符識(shí)別結(jié)果之間的關(guān)系圖。
【具體實(shí)施方式】
[0031]需要說(shuō)明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來(lái)詳細(xì)說(shuō)明本發(fā)明。
[0032]圖2是本發(fā)明一實(shí)施例的字符識(shí)別裝置的模塊組成示意圖。如圖所示,該字符識(shí)別裝置10包括:獲取單元11、選取單元12、二值化處理單元13、識(shí)別單元14、計(jì)算單元15和判斷單元16。
[0033]獲取單元11,用于獲取閾值數(shù)組TH,其中,閾值數(shù)組TH包括多個(gè)閾值。例如,可以先對(duì)輸入的原始圖像進(jìn)行計(jì)算以得到基礎(chǔ)閾值T0,其中,原始圖像為待識(shí)別字符所在區(qū)域的灰度圖像,如在識(shí)別紙幣的冠字號(hào)時(shí),原始圖像為紙幣冠字號(hào)所在區(qū)域的灰度圖像,也稱為字符圖像。然后由基礎(chǔ)閾值TO計(jì)算得到多個(gè)閾值,從而由基礎(chǔ)閾值TO拓展得到閾值數(shù)組TH,優(yōu)選地,閾值數(shù)組TH中的閾值是以基礎(chǔ)閾值TO為中心閾值擴(kuò)展得到的。
[0034]二值化處理單元13,用于采用選定閾值對(duì)字符圖像進(jìn)行二值化處理,得到字符圖像的二值圖像。選定閾值為從閾值數(shù)組TH中選取得到的閾值。利用閾值數(shù)組TH中的某一數(shù)據(jù)對(duì)字符圖像進(jìn)行二值化處理,把以灰度表示的字符圖像轉(zhuǎn)換為僅包括以“O”表示的白像素和“I”表示的黑像素的二值圖像,比如,利用基礎(chǔ)閾值TO對(duì)字符圖像進(jìn)行二值化處理,則把字符圖像中灰度值大于等于TO的像素轉(zhuǎn)換為像素“0”,把字符圖像中灰度值小于TO的像素轉(zhuǎn)換為像素“I”。
[0035]識(shí)別單元14,用于對(duì)二值圖像進(jìn)行字符識(shí)別,得到識(shí)別結(jié)果。
[0036]計(jì)算單元15,用于計(jì)算識(shí)別結(jié)果的置信度。計(jì)算每個(gè)識(shí)別字符的置信度C,把計(jì)算得到的置信度C與置信度預(yù)定值進(jìn)行比較,如果置信度C大于置信度預(yù)定值,表示識(shí)別的字符可信,如果C小于等于置信度預(yù)定值,表示識(shí)別的字符不可信,需要重新進(jìn)行識(shí)別,其中,置信度C表示識(shí)別結(jié)果的可信度,其數(shù)值越大,則識(shí)別結(jié)果的可信度越高。
[0037]判斷單元16,判斷識(shí)別結(jié)果的置信度是否大于置信度預(yù)定值,其中,如果識(shí)別結(jié)果的置信度大于置信度預(yù)定值,則將識(shí)別結(jié)果作為字符圖像的識(shí)別結(jié)果。
[0038]選取單元12,用于從閾值數(shù)組TH中選取第一閾值或第二閾值作為選定閾值,其中,首先選取第一閾值作為選定閾值,在第一閾值作為選定閾值時(shí),如果識(shí)別結(jié)果的置信度不大于置信度預(yù)定值,則從閾值數(shù)組中選取第二閾值。這里的第一閾值和第二閾值僅僅是舉例描述,可以是閾值數(shù)組TH中的任意兩個(gè)不同的閾值,S卩,在閾值數(shù)組TH中存儲(chǔ)有多個(gè)閾值,選取單元12從閾值數(shù)組TH中依次選取閾值對(duì)字符圖像進(jìn)行二值化處理,直到二值化處理之后的二值圖像的識(shí)別結(jié)果的置信度C大于置信度預(yù)定值。
[0039]優(yōu)選地,二值化處理單元13還用于切分二值圖像,得到N個(gè)切分區(qū)域,其中,N個(gè)切分區(qū)域中的每一個(gè)切分區(qū)域分別與一個(gè)待識(shí)別字符相對(duì)應(yīng),此時(shí),識(shí)別單元14還用于對(duì)N個(gè)切分區(qū)域進(jìn)行字符識(shí)別,得到分別對(duì)應(yīng)于N個(gè)切分區(qū)域的N個(gè)識(shí)別結(jié)果,計(jì)算單元15還用于計(jì)算N個(gè)識(shí)別結(jié)果的置信度,判斷單元16還用于判斷N個(gè)識(shí)別結(jié)果的置信度是否均大于置信度預(yù)定值,如果N個(gè)識(shí)別結(jié)果的置信度均大于置信度預(yù)定值,則確定識(shí)別結(jié)果的置信度大于置信度預(yù)定值,如果N個(gè)識(shí)別結(jié)果中任意一個(gè)的置信度不大于置信度預(yù)定值,則確定識(shí)別結(jié)果的置信度不大于置信度預(yù)定值。識(shí)別單元14通過(guò)對(duì)切分區(qū)域進(jìn)行字符識(shí)另O,可以得到每個(gè)切分區(qū)域?qū)?yīng)的字符,從而得到二值圖像對(duì)應(yīng)的字符串,如對(duì)紙幣冠字號(hào)區(qū)域進(jìn)行識(shí)別,得到包括多個(gè)字符和數(shù)字的紙幣冠字號(hào)。
[0040]優(yōu)選地,字符識(shí)別裝置還包括:記錄單元17,用于在選取第一閾值作為選定閾值時(shí),如果N個(gè)識(shí)別結(jié)果中任意一個(gè)的置信度不大于置信度預(yù)定值,記錄第一切分區(qū)域的識(shí)別結(jié)果和第二切分區(qū)域,其中,第一切分區(qū)域?yàn)镹個(gè)識(shí)別結(jié)果中置信度大于置信度預(yù)定值的識(shí)別結(jié)果對(duì)應(yīng)的切分區(qū)域,第二切分區(qū)域?yàn)镹個(gè)識(shí)別結(jié)果中置信度不大于置信度預(yù)定值的識(shí)別結(jié)果對(duì)應(yīng)的切分區(qū)域。此時(shí),二值化處理單元13還用于在選取第二閾值作為選定閾值時(shí),采用第二閾值作為選定閾值對(duì)字符圖像進(jìn)行二值化處理,得到字符圖像的二值圖像,切分二值圖像,得到N個(gè)切分區(qū)域,識(shí)別單元14還用于對(duì)N個(gè)切分區(qū)域中與第二切分區(qū)域?qū)?yīng)的切分區(qū)域進(jìn)行字符識(shí)別。
[0041]獲取單元12可以進(jìn)一步包括:獲取模塊121,用于在采用選定閾值對(duì)字符圖像進(jìn)行二值化處理之前,獲取字符圖像的直方圖;計(jì)算模塊122,用于對(duì)字符圖像的直方圖進(jìn)行計(jì)算,得到基礎(chǔ)閾值;拓展模塊123,用于以基礎(chǔ)閾值為中心閾值進(jìn)行拓展得到閾值數(shù)組TH,該拓展模塊可以采用以下方式由基礎(chǔ)閾值為中心閾值進(jìn)行拓展得到閾值數(shù)組TH:[0042]TH= {TO, TO+ Δ , TO- Δ , TO+2 Δ , TO-2 Δ ,…},
[0043]其中,Δ為閾值數(shù)組TH中相鄰閾值之間的差值,TO為基礎(chǔ)閾值。
[0044]以下對(duì)本發(fā)明實(shí)施例提供的字符識(shí)別方法進(jìn)行介紹。需要說(shuō)明的是,本發(fā)明實(shí)施例提供的字符識(shí)別方法可以通過(guò)本發(fā)明實(shí)施例的字符識(shí)別裝置來(lái)執(zhí)行。相應(yīng)地,本發(fā)明實(shí)施例提供的字符識(shí)別裝置也可以用于本發(fā)明實(shí)施例的字符識(shí)別方法。本發(fā)明實(shí)施例的字符識(shí)別裝置可以是計(jì)算機(jī)、打印機(jī)、掃描設(shè)備等。
[0045]圖3是根據(jù)本發(fā)明第一實(shí)施例的字符識(shí)別方法的流程圖。如圖3所示,該字符識(shí)別方法包括以下步驟:
[0046]步驟SI I,獲取閾值數(shù)組,其中,閾值數(shù)組包括多個(gè)閾值。
[0047]閾值數(shù)組中的多個(gè)閾值可以是預(yù)先設(shè)置或存儲(chǔ)的,也可以是在字符識(shí)別的過(guò)程中通過(guò)一個(gè)基礎(chǔ)閾值計(jì)算得到的。
[0048]步驟S12,從閾值數(shù)組中選取第一閾值作為選定閾值。
[0049]從閾值數(shù)組中任意選取一個(gè)閾值作為第一閾值,如果閾值數(shù)組是通過(guò)一個(gè)基礎(chǔ)閾值拓展得到的,優(yōu)選地,可以選取該基礎(chǔ)閾值作為第一閾值。
[0050]步驟S13,采用選定閾值對(duì)字符圖像進(jìn)行二值化處理,得到字符圖像的二值圖像。
[0051]步驟S14,對(duì)二值 圖像進(jìn)行字符識(shí)別,得到識(shí)別結(jié)果。
[0052]步驟S15,計(jì)算識(shí)別結(jié)果的置信度。
[0053]步驟S16,判斷識(shí)別結(jié)果的置信度是否大于置信度預(yù)定值。如果識(shí)別結(jié)果的置信度大于置信度預(yù)定值,則執(zhí)行步驟S17。如果識(shí)別結(jié)果的置信度不大于置信度預(yù)定值,則執(zhí)行步驟S18。
[0054]步驟S17,將識(shí)別結(jié)果作為字符圖像的識(shí)別結(jié)果。
[0055]步驟S18,從閾值數(shù)組中選取第二閾值,采用第二閾值替換第一閾值作為選定閾值,并返回執(zhí)行步驟S13。
[0056]從閾值數(shù)組中任意選取一個(gè)與第一閾值不同的閾值作為第二閾值,如果閾值數(shù)組是通過(guò)一個(gè)基礎(chǔ)閾值拓展得到的,優(yōu)選地,該第二閾值為與基礎(chǔ)閾值最臨近的一個(gè)閾值。
[0057]優(yōu)選地,步驟S13還包括:切分二值圖像,得到N個(gè)切分區(qū)域,其中,N個(gè)切分區(qū)域中的每一個(gè)切分區(qū)域分別與一個(gè)待識(shí)別字符相對(duì)應(yīng)。步驟S14包括:對(duì)N個(gè)切分區(qū)域進(jìn)行字符識(shí)別,得到分別對(duì)應(yīng)于N個(gè)切分區(qū)域的N個(gè)識(shí)別結(jié)果。步驟15包括:計(jì)算N個(gè)識(shí)別結(jié)果的置信度。步驟16包括:判斷N個(gè)識(shí)別結(jié)果的置信度是否均大于置信度預(yù)定值,如果N個(gè)識(shí)別結(jié)果的置信度均大于置信度預(yù)定值,則確定識(shí)別結(jié)果的置信度大于置信度預(yù)定值,如果N個(gè)識(shí)別結(jié)果中任意一個(gè)的置信度不大于置信度預(yù)定值,則確定識(shí)別結(jié)果的置信度不大于置信度預(yù)定值。
[0058]優(yōu)選地,在選取第一閾值作為選定閾值時(shí),如果N個(gè)識(shí)別結(jié)果中任意一個(gè)的置信度不大于置信度預(yù)定值,該方法還包括:記錄第一切分區(qū)域的識(shí)別結(jié)果和第二切分區(qū)域,其中,第一切分區(qū)域?yàn)镹個(gè)識(shí)別結(jié)果中置信度大于置信度預(yù)定值的識(shí)別結(jié)果對(duì)應(yīng)的切分區(qū)域,第二切分區(qū)域?yàn)镹個(gè)識(shí)別結(jié)果中置信度不大于置信度預(yù)定值的識(shí)別結(jié)果對(duì)應(yīng)的切分區(qū)域。在選取第二閾值作為選定閾值時(shí):步驟S13包括:采用第二閾值作為選定閾值對(duì)字符圖像進(jìn)行二值化處理,得到字符圖像的二值圖像,切分二值圖像,得到N個(gè)切分區(qū)域,步驟S14包括:對(duì)N個(gè)切分區(qū)域中與第二切分區(qū)域?qū)?yīng)的切分區(qū)域進(jìn)行字符識(shí)別。[0059]圖4是根據(jù)本發(fā)明第二實(shí)施例的字符識(shí)別方法的流程圖。該實(shí)施例可以作為圖3所示第一實(shí)施例的一種優(yōu)選實(shí)施方式,如圖4所示,具體處理過(guò)程如下:
[0060]步驟S21,根據(jù)字符圖像的直方圖,確定基礎(chǔ)閾值T0,得到閾值數(shù)組TH。
[0061]該步驟S21可以作為圖3所示步驟Sll的一種優(yōu)選實(shí)施方式。
[0062]如圖6a所示,對(duì)字符圖像30進(jìn)行處理,得到如圖6b所示的字符圖像30的灰度直方圖,其中,坐標(biāo)系的橫軸為像素的灰度值,縱軸為具有各種灰度值的像素占總像素?cái)?shù)的比例,可以利用現(xiàn)有技術(shù)中的任意一種閾值計(jì)算方法,得到原始圖像的基礎(chǔ)閾值T0,如通過(guò)Ostu算法(出處N.0tsu,“A threshold selection method from grey-1 evelhistogramsIEEE Trans.Syst.,Man, Cybern.,vol.SMC-1, pp.62-66,Jan.1979)得到基礎(chǔ)閾值 TO。為了滿足對(duì)不同對(duì)比度圖像的二值化,因此,需要設(shè)置多個(gè)閾值,多個(gè)閾值的獲得方法是在以基礎(chǔ)閾值TO為中心閾值擴(kuò)展得到的。優(yōu)選的,從TO擴(kuò)展為Τ0±η*Λ,由此得到由多個(gè)閾值組成的閾值數(shù)組TH,ΤΗ={Τ0,Τ0+Λ,Τ0-Λ,Τ0+2Λ,Τ0-2Λ,...},Δ為相鄰閾值之間的差值,優(yōu)選取值為0x10,當(dāng)然也可以取比0x10更小的數(shù)值。閾值數(shù)組TH的數(shù)據(jù)個(gè)數(shù)可以根據(jù)需要設(shè)定,經(jīng)測(cè)試驗(yàn)證,閾值數(shù)組包括5個(gè)數(shù)據(jù)、Δ等于0x10能夠達(dá)到識(shí)別準(zhǔn)確率的要求,從而得到閾值數(shù)組TH={T0,TO+OxlO, TO-OxlO, T0+0x20, Τ0-0χ20}。如圖6b所示,基礎(chǔ)閾值TO等于0x41,閾值數(shù)組TH的第二個(gè)數(shù)據(jù)TO+Λ為0x51,閾值數(shù)組TH的第三個(gè)數(shù)據(jù)TO-Λ為 0x31。
[0063]步驟S22,令閾值T等于閾值數(shù)組TH的第一個(gè)數(shù)據(jù)。
[0064]該步驟S22可以作為圖3所示步驟S12的一種優(yōu)選實(shí)施方式。
[0065]令閾值T等于閾值數(shù)組TH的第一個(gè)數(shù)據(jù),本實(shí)施例中,TH的第一個(gè)數(shù)據(jù)為Τ0,第二個(gè)數(shù)據(jù)為TO+ Δ,第三個(gè)數(shù)據(jù)為TO- Δ,第四個(gè)數(shù)據(jù)為ΤΟ+2 Δ,第五個(gè)數(shù)據(jù)為Τ0_2 Δ,因此首先令閾值T=TO對(duì)字符圖像進(jìn)行二值化處理。
[0066]步驟S23,使用閾值T對(duì)字符圖像進(jìn)行二值化處理。
[0067]該步驟S23可以作為圖3所示步驟S13的一種優(yōu)選實(shí)施方式。
[0068]使用閾值T對(duì)字符圖像進(jìn)行二值化,以得到字符圖像的二值圖像。如圖7所示,二值圖像40是以閾值0x41對(duì)圖6a中字符圖像30進(jìn)行二值化得到的圖像,二值圖像50是以閾值0x51對(duì)圖6a中字符圖像30進(jìn)行二值化得到的圖像,二值圖像60是以閾值0x31對(duì)圖6a中字符圖像30進(jìn)行二值化得到的圖像。
[0069]步驟S24,切分二值圖像得到N個(gè)切分區(qū)域。
[0070]對(duì)二值圖像進(jìn)行切分,得到N個(gè)切分區(qū)域,每一個(gè)切分區(qū)域與一個(gè)待識(shí)別字符相對(duì)應(yīng)。如圖7所示,對(duì)二值圖像40進(jìn)行切分時(shí)得到10個(gè)切分區(qū)域。對(duì)二值圖像進(jìn)行切分時(shí),常用的切分方式為利用二值圖像的垂直投影,結(jié)合字符間距、字符寬度、字符高度等,對(duì)二值圖像進(jìn)行切割。
[0071]步驟S25,對(duì)第一個(gè)切分區(qū)域進(jìn)行字符識(shí)別。
[0072]對(duì)N個(gè)切分區(qū)域,按照一定的順序,如從左到右的順序,進(jìn)行字符識(shí)別。首先從第一個(gè)切分區(qū)域開(kāi)始字符識(shí)別,如圖7所示,對(duì)二值圖像40的切分區(qū)域進(jìn)行處理時(shí),從左邊的第一個(gè)切分區(qū)域開(kāi)始處理。
[0073]提取第一切分區(qū)域的特征向量,計(jì)算特征向量與標(biāo)準(zhǔn)模板向量的歐式距離:[0074]
【權(quán)利要求】
1.一種字符識(shí)別方法,其特征在于,包括: 獲取閾值數(shù)組,其中,所述閾值數(shù)組包括多個(gè)閾值; 從所述閾值數(shù)組中選取第一閾值作為選定閾值; 步驟a,采用所述選定閾值對(duì)字符圖像進(jìn)行二值化處理,得到所述字符圖像的二值圖像; 步驟b,對(duì)所述二值圖像進(jìn)行字符識(shí)別,得到識(shí)別結(jié)果; 步驟C,計(jì)算所述識(shí)別結(jié)果的置信度; 步驟d,判斷所述識(shí)別結(jié)果的置信度是否大于置信度預(yù)定值, 如果所述識(shí)別結(jié)果的置信度大于所述置信度預(yù)定值,則將所述識(shí)別結(jié)果作為所述字符圖像的識(shí)別結(jié)果;以及 如果所述識(shí)別結(jié)果的置信度不大于所述置信度預(yù)定值,則從所述閾值數(shù)組中選取第二閾值,采用所述第二閾值替換所述第一閾值作為所述選定閾值,并返回執(zhí)行所述步驟a。
2.根據(jù)權(quán)利要求1所述的字符識(shí)別方法,其特征在于, 所述步驟a還包括:切分所述二值圖像,得到N個(gè)切分區(qū)域,其中,所述N個(gè)切分區(qū)域中的每一個(gè)切分區(qū)域分別與一個(gè)待識(shí)別字符相對(duì)應(yīng), 所述步驟b包括:對(duì)所述N個(gè)切分區(qū)域進(jìn)行字符識(shí)別,得到分別對(duì)應(yīng)于所述N個(gè)切分區(qū)域的N個(gè)識(shí)別結(jié)果, 所述步驟c包括:計(jì)算所述N個(gè)識(shí)別結(jié)果的置信度, 所述步驟d包括:判斷所述N個(gè)識(shí)別結(jié)果的置信度是否均大于置信度預(yù)定值, 如果所述N個(gè)識(shí)別結(jié)果的置信度均大于所述置信度預(yù)定值,則確定所述識(shí)別結(jié)果的置信度大于所述置信度預(yù)定值, 如果所述N個(gè)識(shí)別結(jié)果中任意一個(gè)的置信度不大于所述置信度預(yù)定值,則確定所述識(shí)別結(jié)果的置信度不大于所述置信度預(yù)定值。
3.根據(jù)權(quán)利要求2所述的字符識(shí)別方法,其特征在于, 在選取所述第一閾值作為所述選定閾值時(shí),如果所述N個(gè)識(shí)別結(jié)果中任意一個(gè)的置信度不大于所述置信度預(yù)定值,所述方法還包括: 記錄第一切分區(qū)域的識(shí)別結(jié)果和第二切分區(qū)域,其中,所述第一切分區(qū)域?yàn)樗鯪個(gè)識(shí)別結(jié)果中置信度大于所述置信度預(yù)定值的識(shí)別結(jié)果對(duì)應(yīng)的切分區(qū)域,所述第二切分區(qū)域?yàn)樗鯪個(gè)識(shí)別結(jié)果中置信度不大于所述置信度預(yù)定值的識(shí)別結(jié)果對(duì)應(yīng)的切分區(qū)域,在選取所述第二閾值作為所述選定閾值時(shí): 所述步驟a包括:采用所述第二閾值作為所述選定閾值對(duì)所述字符圖像進(jìn)行二值化處理,得到所述字符圖像的二值圖像,切分所述二值圖像,得到N個(gè)切分區(qū)域, 所述步驟b包括:對(duì)所述N個(gè)切分區(qū)域中與所述第二切分區(qū)域?qū)?yīng)的切分區(qū)域進(jìn)行字符識(shí)別。
4.根據(jù)權(quán)利要求1所述的字符識(shí)別方法,其特征在于,在采用選定閾值對(duì)字符圖像進(jìn)行二值化處理之前,所述方法還包括: 獲取所述字符圖像的直方圖; 對(duì)所述字符圖像的直方圖進(jìn)行計(jì)算,得到基礎(chǔ)閾值;以及 以所述基礎(chǔ)閾值為中心閾值進(jìn)行拓展得到所述閾值數(shù)組。
5.根據(jù)權(quán)利要求4所述的字符識(shí)別方法,其特征在于,采用以下方式由所述基礎(chǔ)閾值為中心閾值進(jìn)行拓展得到所述閾值數(shù)組TH:
TH= {TO, TO+ Δ, Τ0-Δ, T0+2 Δ,T0-2 Δ ,...}, 其中,Δ為所述閾值數(shù)組TH中相鄰閾值之間的差值,TO為所述基礎(chǔ)閾值。
6.一種字符識(shí)別裝置,其特征在于,包括: 獲取單元,用于獲取閾值數(shù)組,其中,所述閾值數(shù)組包括多個(gè)閾值; 二值化處理單元,用于采用選定閾值對(duì)字符圖像進(jìn)行二值化處理,得到所述字符圖像的二值圖像; 識(shí)別單元,用于對(duì)所述二值圖像進(jìn)行字符識(shí)別,得到識(shí)別結(jié)果; 計(jì)算單元,用于計(jì)算所述識(shí)別結(jié)果的置信度; 判斷單元,判斷所述識(shí)別結(jié)果的置信度是否大于置信度預(yù)定值,其中,如果所述識(shí)別結(jié)果的置信度大于所述置信度預(yù)定值,則將所述識(shí)別結(jié)果作為所述字符圖像的識(shí)別結(jié)果; 選取單元,用于從所述閾值數(shù)組中選取第一閾值或第二閾值作為所述選定閾值,其中,首先選取所述第一閾值作為所述選定閾值,在所述第一閾值作為所述選定閾值時(shí),如果所述識(shí)別結(jié)果的置信度不大于所述置信度預(yù)定值,則從所述閾值數(shù)組中選取所述第二閾值。
7.根據(jù)權(quán)利要求6所述的字符識(shí)別裝置,其特征在于, 所述二值化處理單元還用于切分所述二值圖像,得到N個(gè)切分區(qū)域,其中,所述N個(gè)切分區(qū)域中的每一個(gè)切分區(qū)域分別與一個(gè)待識(shí)別字符相對(duì)應(yīng), 所述識(shí)別單元還用于對(duì)所述N個(gè)切分區(qū)域進(jìn)行字符識(shí)別,得到分別對(duì)應(yīng)于所述N個(gè)切分區(qū)域的N個(gè)識(shí)別結(jié)果, 所述計(jì)算單元還用于計(jì)算所述N個(gè)識(shí)別結(jié)果的置信度, 所述判斷單元還用于判斷所述N個(gè)識(shí)別結(jié)果的置信度是否均大于置信度預(yù)定值,如果所述N個(gè)識(shí)別結(jié)果的置信度均大于所述置信度預(yù)定值,則確定所述識(shí)別結(jié)果的置信度大于所述置信度預(yù)定值,如果所述N個(gè)識(shí)別結(jié)果中任意一個(gè)的置信度不大于所述置信度預(yù)定值,則確定所述識(shí)別結(jié)果的置信度不大于所述置信度預(yù)定值。
8.根據(jù)權(quán)利要求7所述的字符識(shí)別裝置,其特征在于,還包括: 記錄單元,用于在選取所述第一閾值作為所述選定閾值時(shí),如果所述N個(gè)識(shí)別結(jié)果中任意一個(gè)的置信度不大于所述置信度預(yù)定值,記錄第一切分區(qū)域的識(shí)別結(jié)果和第二切分區(qū)域,其中,所述第一切分區(qū)域?yàn)樗鯪個(gè)識(shí)別結(jié)果中置信度大于所述置信度預(yù)定值的識(shí)別結(jié)果對(duì)應(yīng)的切分區(qū)域,所述第二切分區(qū)域?yàn)樗鯪個(gè)識(shí)別結(jié)果中置信度不大于所述置信度預(yù)定值的識(shí)別結(jié)果對(duì)應(yīng)的切分區(qū)域, 其中,所述二值化處理單元還用于在選取所述第二閾值作為所述選定閾值時(shí),采用所述第二閾值作為所述選定閾值對(duì)所述字符圖像進(jìn)行二值化處理,得到所述字符圖像的二值圖像,切分所述二值圖像,得到N個(gè)切分區(qū)域, 其中,所述識(shí)別單元還用于對(duì)所述N個(gè)切分區(qū)域中與所述第二切分區(qū)域?qū)?yīng)的切分區(qū)域進(jìn)行字符識(shí)別。
9.根據(jù)權(quán)利要求6所述的字符識(shí)別裝置,其特征在于,所述獲取單元包括: 獲取模塊,用于在采用選定閾值對(duì)字符圖像進(jìn)行二值化處理之前,獲取所述字符圖像的直方圖;計(jì)算模塊,用于對(duì)所述字符圖像的直方圖進(jìn)行計(jì)算,得到基礎(chǔ)閾值; 拓展模塊,用于以所述基礎(chǔ)閾值為中心閾值進(jìn)行拓展得到所述閾值數(shù)組。
10.根據(jù)權(quán)利要求9所述的字符識(shí)別裝置,其特征在于,所述拓展模塊用于采用以下方式由所述基礎(chǔ)閾值為中心閾值進(jìn)行拓展得到所述閾值數(shù)組TH:
TH= {TO, TO+ Δ, Τ0-Δ, T0+2 Δ,T0-2 Δ ,...}, 其中,Δ為所述閾值數(shù) 組TH中相鄰閾值之間的差值,TO為所述基礎(chǔ)閾值。
【文檔編號(hào)】G06K9/20GK104008384SQ201310060434
【公開(kāi)日】2014年8月27日 申請(qǐng)日期:2013年2月26日 優(yōu)先權(quán)日:2013年2月26日
【發(fā)明者】邢月啟, 許春凱, 董述恂, 王春濤 申請(qǐng)人:山東新北洋信息技術(shù)股份有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1