基于lvq神經(jīng)網(wǎng)絡(luò)的光學(xué)字符識(shí)別方法
【專利摘要】本發(fā)明涉及一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學(xué)字符識(shí)別方法,所述方法包括以下步驟:對(duì)待識(shí)別字符圖像進(jìn)行預(yù)處理,包括圖像去噪、字符切分、二值化以及特征提??;將單個(gè)字符特征送入LVQ神經(jīng)網(wǎng)絡(luò)的輸入層,根據(jù)競(jìng)爭(zhēng)算法找到獲勝的競(jìng)爭(zhēng)層神經(jīng)元并進(jìn)行拒判檢驗(yàn);將符合判別條件的字符特征輸入LVQ神經(jīng)網(wǎng)絡(luò)的競(jìng)爭(zhēng)層進(jìn)行識(shí)別,輸出識(shí)別結(jié)果。本發(fā)明方法適應(yīng)對(duì)誤判率有嚴(yán)格要求的小字符集自動(dòng)識(shí)別領(lǐng)域。
【專利說(shuō)明】基于LVQ神經(jīng)網(wǎng)絡(luò)的光學(xué)字符識(shí)別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種基于學(xué)習(xí)向量量化(LVQ, Learning Vector Quantization)神經(jīng)網(wǎng)絡(luò)的光學(xué)字符識(shí)別方法,主要用于對(duì)錯(cuò)識(shí)率有嚴(yán)格要求的小字符集智能識(shí)別。
【背景技術(shù)】
[0002]光學(xué)字符識(shí)別(Optical Character Recognition, OCR)通過(guò)掃描和攝像等光學(xué)輸入方式獲取紙張上的文字圖像信息,利用各種模式識(shí)別算法分析文字形態(tài)特征,判斷出文字的標(biāo)準(zhǔn)編碼,并按通用格式存儲(chǔ)在文本文件中。在過(guò)去的幾十年里,光學(xué)字符識(shí)別已經(jīng)成為許多研究者的研究目標(biāo),它在許多不同的領(lǐng)域,如銀行,航運(yùn),商業(yè),通信以及國(guó)防等都有重要影響。
[0003]德國(guó)科學(xué)家Tausheck于1929年正式提出OCR的概念,但電子計(jì)算機(jī)誕生后才得以真正實(shí)現(xiàn)。現(xiàn)代商品化OCR系統(tǒng)分為三代:第一代OCR出現(xiàn)在1960年到1965年,最早為IBM公司的IBM1418。此產(chǎn)品識(shí)別字符少,需經(jīng)過(guò)特殊指定。第二代OCR產(chǎn)品出現(xiàn)在60年代中期到70年代初期,典型系統(tǒng)為IBM1287。日本東芝公司首先實(shí)現(xiàn)了手寫郵政編碼識(shí)別的信函自動(dòng)分揀系統(tǒng)。第三個(gè)時(shí)期開始于上世紀(jì)70年代中期。這一時(shí)期,人們已經(jīng)把目光投向了解決質(zhì)量較差的字符識(shí)別,以及大字符集的識(shí)別,例如漢字識(shí)別,高精度手寫體數(shù)字識(shí)別。近年來(lái)也出現(xiàn)了能夠識(shí)別印刷體、手寫體的漢字、韓文、日文、數(shù)字、英文等多種字符的系統(tǒng)。而銀行票據(jù)自動(dòng)處理系統(tǒng)也成為了手寫體字符識(shí)別系統(tǒng)中的熱點(diǎn)。
[0004]我國(guó)的OCR技術(shù),基本上起步于上述第三個(gè)時(shí)期,商業(yè)OCR產(chǎn)品的識(shí)別率最高己經(jīng)可以達(dá)到99%以上,并且可以識(shí)別多種字體。但是目前還沒(méi)有針對(duì)國(guó)防科技領(lǐng)域,例如遙控碼表、航天器彈道以及其他特殊文件的識(shí)別與驗(yàn)證等對(duì)錯(cuò)識(shí)率有嚴(yán)格要求的小字符集智能識(shí)別方法及相關(guān)產(chǎn)品。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于克服上述不足,提供一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學(xué)字符識(shí)別方法,可以顯著降低錯(cuò)識(shí)率,對(duì)印刷質(zhì)量較好的小字符集識(shí)別效果達(dá)到零錯(cuò)識(shí)率。
[0006]本發(fā)明的目的是這樣實(shí)現(xiàn)的:一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學(xué)字符識(shí)別方法,所述LVQ神經(jīng)網(wǎng)絡(luò)分為輸入層、競(jìng)爭(zhēng)層和輸出層,所述方法包括以下步驟:
步驟A、對(duì)待識(shí)別字符圖像進(jìn)行預(yù)處理,包括圖像去噪、字符切分、二值化以及特征提取。其中圖像去噪處理是去除字符圖像在采樣、數(shù)據(jù)傳輸過(guò)程中產(chǎn)生的墨點(diǎn)、折痕等噪聲信號(hào);字符切分處理是對(duì)整個(gè)字符圖像進(jìn)行行列劃分,獲取每個(gè)字符的大小與位置;圖像二值化處理可以減少大量冗余信息,將單個(gè)字符圖像轉(zhuǎn)化為一個(gè)二維像素矩陣,O表示白色像素,I表示黑色像素;特征提取過(guò)程是對(duì)單個(gè)字符的二維像素矩陣進(jìn)行某種運(yùn)算,提取可用于分類的關(guān)鍵特征。本方法提取的特征為網(wǎng)格特征,網(wǎng)格特征體現(xiàn)了字符整體形狀的分布,具有平移和縮放不變性,有較強(qiáng)的容錯(cuò)能力和區(qū)分相似字符的能力。網(wǎng)格特征的計(jì)算方法如下:將字符圖像均分為Fxli的網(wǎng)格,記第i個(gè)網(wǎng)格的中黑色像素的數(shù)量與總像素的比值為Xk,網(wǎng)格的總數(shù)為.則字符特征可用向量表示為:
【權(quán)利要求】
1.一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學(xué)字符識(shí)別方法,其特征在于所述方法包括以下步驟: 步驟A、對(duì)待識(shí)別字符圖像進(jìn)行預(yù)處理,包括圖像去噪、字符切分、二值化以及特征提取,本方法提取的特征為網(wǎng)格特征,將字符圖像均分為Ixf的網(wǎng)格,統(tǒng)計(jì)每個(gè)網(wǎng)格中的字符像素所占的面積比例,記字符特征向量為;
2.根據(jù)權(quán)利要求1所述的一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學(xué)字符識(shí)別方法,其特征在于: 在步驟C中,所述競(jìng)爭(zhēng)規(guī)則為:根據(jù)式(4)計(jì)算每個(gè)競(jìng)爭(zhēng)層神經(jīng)元與輸入向量的距離,距離最小的競(jìng)爭(zhēng)層神經(jīng)元為獲勝神經(jīng)元,其次為次獲勝神經(jīng)元,序號(hào)分別記為Kl和K2
3.根據(jù)權(quán)利要求2所述的一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學(xué)字符識(shí)別方法,其特征在于:在步驟D中,拒判條件為
4.根據(jù)權(quán)利要求2所述的一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學(xué)字符識(shí)別方法,其特征在于:在步驟D中,拒判條件為
5.根據(jù)權(quán)利要求1所述的一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學(xué)字符識(shí)別方法,其特征在于: 在步驟C中,所述競(jìng)爭(zhēng)規(guī)則為:根據(jù)式(6)計(jì)算每個(gè)競(jìng)爭(zhēng)層神經(jīng)元與輸入向量的相似度,相似度最大的競(jìng)爭(zhēng)層神經(jīng)元為獲勝神經(jīng)元,其次為次獲勝神經(jīng)元,
6.根據(jù)權(quán)利要求5所述的一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學(xué)字符識(shí)別方法,其特征在于:在步驟D中,拒判條件為
7.根據(jù)權(quán)利要求5所述的一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學(xué)字符識(shí)別方法,其特征在于:在步驟D中,拒判條件為
8.根據(jù)權(quán)利要求1至7所述的一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學(xué)字符識(shí)別方法,其特征在于:在步驟E中的學(xué)習(xí)速率-隨著訓(xùn)練次數(shù)t根據(jù)式(7)進(jìn)行同步調(diào)整,
9.根據(jù)權(quán)利要求1至7所述的一種基于LVQ神經(jīng)網(wǎng)絡(luò)的光學(xué)字符識(shí)別方法,其特征在于:在步驟E中的學(xué)習(xí)速率-隨著訓(xùn)練次數(shù)t根據(jù)式(8)進(jìn)行同步調(diào)整:
【文檔編號(hào)】G06K9/60GK103745213SQ201310709595
【公開日】2014年4月23日 申請(qǐng)日期:2014年2月28日 優(yōu)先權(quán)日:2014年2月28日
【發(fā)明者】張煜昕, 李永剛, 何劍偉, 周琳琦, 郭力兵, 李祥明, 茅文浩, 李清梅, 胡上成, 張龍 申請(qǐng)人:中國(guó)人民解放軍63680部隊(duì)