字符識別方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本申請涉及文字識別技術(shù)領(lǐng)域,尤其涉及一種字符識別方法和裝置。
【背景技術(shù)】
[0002] OCR(OpticalCharacterRecognition,光學(xué)字符識別)是指電子設(shè)備(例如:掃 描儀)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形 狀翻譯成文字的過程。
[0003] 目前的字符識別系統(tǒng)大多基于二值化的圖片提取特征進(jìn)行識別。其中,對漢字進(jìn) 行識別的方法可包括結(jié)構(gòu)模式識別方法、統(tǒng)計模式識別方法以及兩者結(jié)合的方法。
[0004] 結(jié)構(gòu)模式識別是早期漢字識別研究的主要方法,直接從字符的輪廓或骨架上提取 的字符像素分布特征,如筆畫、圈、端點(diǎn)、節(jié)點(diǎn)、弧、突起、凹陷等多個基元組合,再用結(jié)構(gòu)方 法描述基元組合所代表的結(jié)構(gòu)和關(guān)系,通常提取筆段或基本筆畫作為基元,由基元組合及 其相互關(guān)系描述漢字,最后利用形式語言及自動機(jī)理論進(jìn)行識別。
[0005] 統(tǒng)計模式識別方法是用概率統(tǒng)計模型提取待識別漢字的特征向量,然后根據(jù)決策 函數(shù)進(jìn)行分類,判斷待識別漢字的特征向量屬于的類別。具體地,統(tǒng)計模式識別的主流特征 可包括漢字外圍及網(wǎng)格特征、方向線素特征、梯度直方圖特征等。
[0006] 但是,在實現(xiàn)本申請的過程中發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問題:結(jié)構(gòu)模式 識別方法抗干擾能力差,受噪點(diǎn)、斷裂、扭曲的干擾影響嚴(yán)重,導(dǎo)致識別準(zhǔn)確率低。統(tǒng)計模式 識別方法對于相似字的區(qū)分能力差,需要結(jié)合多種特征進(jìn)行識別,且無法保證字符切割的 準(zhǔn)確度,導(dǎo)致識別準(zhǔn)確率低。
【發(fā)明內(nèi)容】
[0007] 本申請旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。為此,本申請的 第一個目的在于提出一種字符識別方法,該方法可以顯著提升字符識別的準(zhǔn)確率。
[0008] 本申請的第二個目的在于提出一種字符識別裝置。
[0009] 為了實現(xiàn)上述目的,本申請第一方面實施例的字符識別方法,包括:獲得所有字符 的訓(xùn)練樣本,對每個訓(xùn)練樣本進(jìn)行濾波處理,獲得每個訓(xùn)練樣本的特征信息;以及獲得待識 別的字符,并將所述字符與所述特征信息進(jìn)行匹配,以完成對所述字符的識別。
[0010] 本申請實施例的字符識別方法,通過對所有字符的訓(xùn)練樣本進(jìn)行濾波處理,獲得 每個訓(xùn)練樣本的特征信息,然后將待識別字符與特征信息進(jìn)行匹配,完成對字符的識別,可 以顯著提升字符識別的準(zhǔn)確率。
[0011] 為了實現(xiàn)上述目的,本申請第二方面實施例的字符識別裝置,包括:處理模塊,用 于獲得所有字符的訓(xùn)練樣本,對每個訓(xùn)練樣本進(jìn)行濾波處理,獲得每個訓(xùn)練樣本的特征信 息;以及識別模塊,用于獲得待識別的字符,并將所述字符與所述特征信息進(jìn)行匹配,以完 成對所述字符的識別。
[0012] 本申請實施例的字符識別裝置,通過對所有字符的訓(xùn)練樣本進(jìn)行濾波處理,獲得 每個訓(xùn)練樣本的特征信息,然后將待識別字符與特征信息進(jìn)行匹配,完成對字符的識別,可 以顯著提升字符識別的準(zhǔn)確率。
【附圖說明】
[0013] 圖1是根據(jù)本申請一個實施例的字符識別方法的流程圖。
[0014]圖2是根據(jù)本申請一個實施例的獲得訓(xùn)練樣本的特征信息的流程示意圖。
[0015] 圖3是根據(jù)本申請一個實施例的字符識別裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0016]下面詳細(xì)描述本申請的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實施例是示例性的,旨在用于解釋本申請,而不能理解為對本申請的限制。
[0017]下面參考附圖描述本申請實施例的字符識別方法和裝置。
[0018] 圖1是根據(jù)本申請一個實施例的字符識別方法的流程圖。
[0019] 如圖1所示,字符識別方法包括:
[0020]S101,獲得所有字符的訓(xùn)練樣本,對每個訓(xùn)練樣本進(jìn)行濾波處理,獲得每個訓(xùn)練樣 本的特征信息。
[0021] 在本申請的實施例中,首先可獲得所有字符的訓(xùn)練樣本。其中,字符可包括文字、 字母、數(shù)字和各種符號等。由于字符的數(shù)量巨大,尤其是漢字(6000多個),且漢字還有不 同的字體如:宋體、楷體等,對每個字符需要生成至少幾百個訓(xùn)練樣本,工作量大,人工成本 高。因此,可通過模擬的方式生成訓(xùn)練樣本,可有效地減少工作量,降低人工成本。具體地, 可生成每個文字每種字體的二值化模板,對二值化模板進(jìn)行變換(如:旋轉(zhuǎn)變換等),并將 變換后的文字和獲得的背景圖片進(jìn)行融合,以模擬出所有字符的訓(xùn)練樣本。
[0022] 在獲得所有字符的訓(xùn)練樣本后,可對每個訓(xùn)練樣本進(jìn)行濾波處理。具體地,如圖2 所示,可針對每個訓(xùn)練樣本,使用至少一個濾波器對當(dāng)前訓(xùn)練樣本進(jìn)行濾波,并對濾波結(jié)果 進(jìn)行正負(fù)區(qū)分。例如,圖2中使用四個濾波器,且具有不同的濾波器參數(shù)。其中,濾波器可 包括Gabor濾波器或其他濾波器。Gabor變換屬于加窗傅立葉變換,Gabor濾波器可以在頻 域不同尺度、不同方向上提取相關(guān)的特征。
[0023]Gabor濾波器的沖激響應(yīng)函數(shù)可采用如下公式所示:
[0024]
[0025]其中,R! =Xcos<i)+ysin<i),R2=-Xsin<i)+ycos<i),λ為波長,妒為濾波器的 方向,σ為高斯函數(shù)的標(biāo)準(zhǔn)差,〇5!和別表示X和y方向的標(biāo)準(zhǔn)差,X和y為橫縱坐 標(biāo)。濾波器的另一個參數(shù)為濾波器的尺寸也就是確定X和y范圍,根據(jù)這些參數(shù)可以確定 出一個特定的濾波器系數(shù)矩陣h。
[0026] 對于每個訓(xùn)練樣本與每一組濾波器系數(shù)進(jìn)行Gabor濾波,濾波結(jié)果只需要選取實 數(shù)部分,然后對于實數(shù)部分的濾波結(jié)果進(jìn)行正負(fù)區(qū)分,即每個濾波結(jié)果矩陣最終得到兩個 矩陣,一個只包含正數(shù)部分,相應(yīng)的負(fù)數(shù)位置用零填充,另一個則只包含負(fù)數(shù)部分,其余位 置用零填充。應(yīng)當(dāng)理解的是,矩陣即區(qū)分后的數(shù)據(jù)。如果不采用正負(fù)區(qū)分的方法,則可能導(dǎo) 致正數(shù)部分與負(fù)數(shù)部分相互抵消,導(dǎo)致識別的準(zhǔn)確率降低。因此,采用正負(fù)區(qū)分的方法可有 效地提高識別的準(zhǔn)確率。
[0027] 在對濾波結(jié)果進(jìn)行正負(fù)區(qū)分之后,還可分別對區(qū)分后的數(shù)據(jù)進(jìn)行模糊濾波、采樣、 歸一化處理等。此處可以只進(jìn)行模糊濾波,也可以只進(jìn)行采樣,同樣可以只進(jìn)行歸一化處 理,當(dāng)然也可以結(jié)合上述多種方式對區(qū)分后的數(shù)據(jù)進(jìn)行處理。具體地,可分別對正負(fù)兩個矩 陣進(jìn)行模糊濾波,此處可看作一個低通濾波器,由于濾波后的每個像素位置結(jié)果是綜合原 始矩陣相應(yīng)位置及其周邊位置的信息,因此可有效地減少偏移、噪聲等干擾。模糊濾波后, 可獲得兩個與原始圖片大小一樣的矩陣。然后通過采樣的方式,去掉模糊濾波產(chǎn)生的冗余 的相鄰位置信息,降低維數(shù)。其中,采樣的間隔可通過實驗獲得。采樣后,可對每個采樣結(jié) 果進(jìn)行歸一化處理。歸一化處理可使正負(fù)信息以及不同參數(shù)的濾波器濾波結(jié)果融合保持尺 度統(tǒng)一。
[0028] 在對區(qū)分后的數(shù)據(jù)進(jìn)行模糊濾波、采樣和歸一化處理之后,可獲得正矩陣對應(yīng)的 第一結(jié)果和負(fù)矩陣對應(yīng)的第二結(jié)果,并將獲得的與濾波器對應(yīng)的第一結(jié)果和第二結(jié)果進(jìn)行 拼接,生成當(dāng)前訓(xùn)練樣本的特征信息。例如,假設(shè)使用一個濾波器時,獲得的濾波結(jié)果可為 l*2k的數(shù)組;則使用四個濾波器濾波后,可將獲得的濾波結(jié)果拼接為l*8k的數(shù)組。通過上 述方法,可有效地降低計算量和計算復(fù)雜度。如果生成的特征信息的維數(shù)依然很高,信息存 在冗余,則可進(jìn)一步進(jìn)行降維。例如采用無監(jiān)督的PCA(PrincipalComponentAnalysis, 主成分分析)或有監(jiān)督的LDA(LinearDiscriminantAnalysis,線性判別式分析),降低維 度,可有效地降低計算量。
[0029] 目前,現(xiàn)有的基于訓(xùn)練樣本的特征信息的字符識別方法,其重點(diǎn)通常在于對特征 信息的參數(shù)進(jìn)行優(yōu)化,卻忽略了獲取訓(xùn)練樣本的特征信息的過程。因此,在實際應(yīng)用中,對 字符進(jìn)行切割的準(zhǔn)確度低,需要對訓(xùn)練樣本進(jìn)行濾波、正負(fù)區(qū)分、歸一化處理等,增強(qiáng)魯棒 性,提升實際應(yīng)用中識別的準(zhǔn)確率。
[0030] S102,獲得待識別的字符,并將字符與特征信息進(jìn)行匹配,以完成對字符的識別。
[0031] 在獲得每個訓(xùn)練樣本的特征信息之后,可獲得待識別的字符。具體地,可獲得待識 別的圖片,對識別的圖片進(jìn)行分割