字符識別方法和裝置的制造方法

文檔序號：9579577閱讀：325來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

字符識別方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本申請涉及文字識別技術(shù)領(lǐng)域，尤其涉及一種字符識別方法和裝置。
【背景技術(shù)】
[0002] OCR(OpticalCharacterRecognition,光學(xué)字符識別）是指電子設(shè)備（例如：掃描儀）檢查紙上打印的字符，通過檢測暗、亮的模式確定其形狀，然后用字符識別方法將形狀翻譯成文字的過程。
[0003] 目前的字符識別系統(tǒng)大多基于二值化的圖片提取特征進(jìn)行識別。其中，對漢字進(jìn) 行識別的方法可包括結(jié)構(gòu)模式識別方法、統(tǒng)計模式識別方法以及兩者結(jié)合的方法。
[0004] 結(jié)構(gòu)模式識別是早期漢字識別研究的主要方法，直接從字符的輪廓或骨架上提取的字符像素分布特征，如筆畫、圈、端點(diǎn)、節(jié)點(diǎn)、弧、突起、凹陷等多個基元組合，再用結(jié)構(gòu)方法描述基元組合所代表的結(jié)構(gòu)和關(guān)系，通常提取筆段或基本筆畫作為基元，由基元組合及其相互關(guān)系描述漢字，最后利用形式語言及自動機(jī)理論進(jìn)行識別。
[0005] 統(tǒng)計模式識別方法是用概率統(tǒng)計模型提取待識別漢字的特征向量，然后根據(jù)決策函數(shù)進(jìn)行分類，判斷待識別漢字的特征向量屬于的類別。具體地，統(tǒng)計模式識別的主流特征可包括漢字外圍及網(wǎng)格特征、方向線素特征、梯度直方圖特征等。
[0006] 但是，在實現(xiàn)本申請的過程中發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問題：結(jié)構(gòu)模式識別方法抗干擾能力差，受噪點(diǎn)、斷裂、扭曲的干擾影響嚴(yán)重，導(dǎo)致識別準(zhǔn)確率低。統(tǒng)計模式識別方法對于相似字的區(qū)分能力差，需要結(jié)合多種特征進(jìn)行識別，且無法保證字符切割的準(zhǔn)確度，導(dǎo)致識別準(zhǔn)確率低。

【發(fā)明內(nèi)容】

[0007] 本申請旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。為此，本申請的第一個目的在于提出一種字符識別方法，該方法可以顯著提升字符識別的準(zhǔn)確率。
[0008] 本申請的第二個目的在于提出一種字符識別裝置。
[0009] 為了實現(xiàn)上述目的，本申請第一方面實施例的字符識別方法，包括：獲得所有字符的訓(xùn)練樣本，對每個訓(xùn)練樣本進(jìn)行濾波處理，獲得每個訓(xùn)練樣本的特征信息；以及獲得待識別的字符，并將所述字符與所述特征信息進(jìn)行匹配，以完成對所述字符的識別。
[0010] 本申請實施例的字符識別方法，通過對所有字符的訓(xùn)練樣本進(jìn)行濾波處理，獲得每個訓(xùn)練樣本的特征信息，然后將待識別字符與特征信息進(jìn)行匹配，完成對字符的識別，可以顯著提升字符識別的準(zhǔn)確率。
[0011] 為了實現(xiàn)上述目的，本申請第二方面實施例的字符識別裝置，包括：處理模塊，用于獲得所有字符的訓(xùn)練樣本，對每個訓(xùn)練樣本進(jìn)行濾波處理，獲得每個訓(xùn)練樣本的特征信息；以及識別模塊，用于獲得待識別的字符，并將所述字符與所述特征信息進(jìn)行匹配，以完成對所述字符的識別。
[0012] 本申請實施例的字符識別裝置，通過對所有字符的訓(xùn)練樣本進(jìn)行濾波處理，獲得每個訓(xùn)練樣本的特征信息，然后將待識別字符與特征信息進(jìn)行匹配，完成對字符的識別，可以顯著提升字符識別的準(zhǔn)確率。
【附圖說明】
[0013] 圖1是根據(jù)本申請一個實施例的字符識別方法的流程圖。
[0014]圖2是根據(jù)本申請一個實施例的獲得訓(xùn)練樣本的特征信息的流程示意圖。
[0015] 圖3是根據(jù)本申請一個實施例的字符識別裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0016]下面詳細(xì)描述本申請的實施例，所述實施例的示例在附圖中示出，其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的，旨在用于解釋本申請，而不能理解為對本申請的限制。
[0017]下面參考附圖描述本申請實施例的字符識別方法和裝置。
[0018] 圖1是根據(jù)本申請一個實施例的字符識別方法的流程圖。
[0019] 如圖1所示，字符識別方法包括：
[0020]S101，獲得所有字符的訓(xùn)練樣本，對每個訓(xùn)練樣本進(jìn)行濾波處理，獲得每個訓(xùn)練樣本的特征信息。
[0021] 在本申請的實施例中，首先可獲得所有字符的訓(xùn)練樣本。其中，字符可包括文字、字母、數(shù)字和各種符號等。由于字符的數(shù)量巨大，尤其是漢字（6000多個），且漢字還有不同的字體如：宋體、楷體等，對每個字符需要生成至少幾百個訓(xùn)練樣本，工作量大，人工成本高。因此，可通過模擬的方式生成訓(xùn)練樣本，可有效地減少工作量，降低人工成本。具體地，可生成每個文字每種字體的二值化模板，對二值化模板進(jìn)行變換（如：旋轉(zhuǎn)變換等），并將變換后的文字和獲得的背景圖片進(jìn)行融合，以模擬出所有字符的訓(xùn)練樣本。
[0022] 在獲得所有字符的訓(xùn)練樣本后，可對每個訓(xùn)練樣本進(jìn)行濾波處理。具體地，如圖2 所示，可針對每個訓(xùn)練樣本，使用至少一個濾波器對當(dāng)前訓(xùn)練樣本進(jìn)行濾波，并對濾波結(jié)果進(jìn)行正負(fù)區(qū)分。例如，圖2中使用四個濾波器，且具有不同的濾波器參數(shù)。其中，濾波器可包括Gabor濾波器或其他濾波器。Gabor變換屬于加窗傅立葉變換，Gabor濾波器可以在頻域不同尺度、不同方向上提取相關(guān)的特征。
[0023]Gabor濾波器的沖激響應(yīng)函數(shù)可采用如下公式所示：
[0024]
[0025]其中，R! =Xcos<i)+ysin<i),R2=-Xsin<i)+ycos<i),λ為波長，妒為濾波器的方向，σ為高斯函數(shù)的標(biāo)準(zhǔn)差，〇5!和別表示X和y方向的標(biāo)準(zhǔn)差，X和y為橫縱坐標(biāo)。濾波器的另一個參數(shù)為濾波器的尺寸也就是確定X和y范圍，根據(jù)這些參數(shù)可以確定出一個特定的濾波器系數(shù)矩陣h。
[0026] 對于每個訓(xùn)練樣本與每一組濾波器系數(shù)進(jìn)行Gabor濾波，濾波結(jié)果只需要選取實數(shù)部分，然后對于實數(shù)部分的濾波結(jié)果進(jìn)行正負(fù)區(qū)分，即每個濾波結(jié)果矩陣最終得到兩個矩陣，一個只包含正數(shù)部分，相應(yīng)的負(fù)數(shù)位置用零填充，另一個則只包含負(fù)數(shù)部分，其余位置用零填充。應(yīng)當(dāng)理解的是，矩陣即區(qū)分后的數(shù)據(jù)。如果不采用正負(fù)區(qū)分的方法，則可能導(dǎo) 致正數(shù)部分與負(fù)數(shù)部分相互抵消，導(dǎo)致識別的準(zhǔn)確率降低。因此，采用正負(fù)區(qū)分的方法可有效地提高識別的準(zhǔn)確率。
[0027] 在對濾波結(jié)果進(jìn)行正負(fù)區(qū)分之后，還可分別對區(qū)分后的數(shù)據(jù)進(jìn)行模糊濾波、采樣、歸一化處理等。此處可以只進(jìn)行模糊濾波，也可以只進(jìn)行采樣，同樣可以只進(jìn)行歸一化處理，當(dāng)然也可以結(jié)合上述多種方式對區(qū)分后的數(shù)據(jù)進(jìn)行處理。具體地，可分別對正負(fù)兩個矩陣進(jìn)行模糊濾波，此處可看作一個低通濾波器，由于濾波后的每個像素位置結(jié)果是綜合原始矩陣相應(yīng)位置及其周邊位置的信息，因此可有效地減少偏移、噪聲等干擾。模糊濾波后，可獲得兩個與原始圖片大小一樣的矩陣。然后通過采樣的方式，去掉模糊濾波產(chǎn)生的冗余的相鄰位置信息，降低維數(shù)。其中，采樣的間隔可通過實驗獲得。采樣后，可對每個采樣結(jié) 果進(jìn)行歸一化處理。歸一化處理可使正負(fù)信息以及不同參數(shù)的濾波器濾波結(jié)果融合保持尺度統(tǒng)一。
[0028] 在對區(qū)分后的數(shù)據(jù)進(jìn)行模糊濾波、采樣和歸一化處理之后，可獲得正矩陣對應(yīng)的第一結(jié)果和負(fù)矩陣對應(yīng)的第二結(jié)果，并將獲得的與濾波器對應(yīng)的第一結(jié)果和第二結(jié)果進(jìn)行拼接，生成當(dāng)前訓(xùn)練樣本的特征信息。例如，假設(shè)使用一個濾波器時，獲得的濾波結(jié)果可為 l*2k的數(shù)組；則使用四個濾波器濾波后，可將獲得的濾波結(jié)果拼接為l*8k的數(shù)組。通過上述方法，可有效地降低計算量和計算復(fù)雜度。如果生成的特征信息的維數(shù)依然很高，信息存在冗余，則可進(jìn)一步進(jìn)行降維。例如采用無監(jiān)督的PCA(PrincipalComponentAnalysis, 主成分分析）或有監(jiān)督的LDA(LinearDiscriminantAnalysis,線性判別式分析），降低維度，可有效地降低計算量。
[0029] 目前，現(xiàn)有的基于訓(xùn)練樣本的特征信息的字符識別方法，其重點(diǎn)通常在于對特征信息的參數(shù)進(jìn)行優(yōu)化，卻忽略了獲取訓(xùn)練樣本的特征信息的過程。因此，在實際應(yīng)用中，對字符進(jìn)行切割的準(zhǔn)確度低，需要對訓(xùn)練樣本進(jìn)行濾波、正負(fù)區(qū)分、歸一化處理等，增強(qiáng)魯棒性，提升實際應(yīng)用中識別的準(zhǔn)確率。
[0030] S102,獲得待識別的字符，并將字符與特征信息進(jìn)行匹配，以完成對字符的識別。
[0031] 在獲得每個訓(xùn)練樣本的特征信息之后，可獲得待識別的字符。具體地，可獲得待識別的圖片，對識別的圖片進(jìn)行分割

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張宇;
技術(shù)所有人：阿里巴巴集團(tuán)控股有限公司;
我是此專利的發(fā)明人

上一篇：基于車輛的手勢識別方法
上一篇：一種基于視覺圖像的飛機(jī)機(jī)型識別方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

車牌字符識別方法相關(guān)技術(shù)

字符識別方法相關(guān)技術(shù)

字符識別的方法相關(guān)技術(shù)

濕熱處理的方法和裝置相關(guān)技術(shù)

檢查裝置氣密性的方法相關(guān)技術(shù)

裝置氣密性檢查方法相關(guān)技術(shù)

檢驗裝置氣密性的方法相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

字符識別方法和裝置的制造方法