專利名稱:一種環(huán)形排布字符圖像分割方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種環(huán)形排布字符圖像分割方法,用于環(huán)形排布字符圖像中的字符識(shí)另IJ,屬于光學(xué)字符識(shí)別技術(shù)領(lǐng)域。
背景技術(shù):
光學(xué)字符識(shí)別技術(shù)是指電子設(shè)備對(duì)文本資料進(jìn)行掃描,然后對(duì)圖像文件進(jìn)行分析處理,獲取文字及版面信息的過程。光學(xué)字符識(shí)別技術(shù)早在七十年代就已經(jīng)有人開始研究,發(fā)展了幾十年后,目前技術(shù)相對(duì)比較成熟,字符識(shí)別率比較高?,F(xiàn)有字符識(shí)別系統(tǒng)的使用環(huán)境都比較理想,如白底黒字,圖像像素對(duì)比度高,且字符均呈現(xiàn)水平或豎直排列,字符排布比較規(guī)整,易于進(jìn)行字符分割。而對(duì)于環(huán)形排布的字符圖像,由于難以對(duì)圖像進(jìn)行準(zhǔn)確有效的分割,使用現(xiàn)有字符識(shí)別方法無法得到滿意的識(shí)別效果。以金屬表盤上的環(huán)形排布鋼印字符為例,由于金屬材質(zhì)的反光性等因素,鋼印字符圖像的清晰度很低,而且表盤字符排布并不是水平排列,而是呈現(xiàn)環(huán)形排布,怎樣進(jìn)行準(zhǔn)確的字符分割是ー個(gè)難題,現(xiàn)有的光學(xué)字符識(shí)別系統(tǒng)都難以解決。定位字符所在位置,要用到橢圓檢測(cè)方法,而以往的橢圓檢測(cè)方法只能擬合單個(gè)橢圓,環(huán)形表盤存在同心橢圓問題,直接使用單個(gè)橢圓擬合方法,會(huì)出現(xiàn)擬合出的多橢圓并不完全同心,導(dǎo)致后續(xù)的幾何變換和字符分割產(chǎn)生誤差。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題在于克服現(xiàn)有技術(shù)無法對(duì)環(huán)形排布字符圖像進(jìn)行準(zhǔn) 確分割的不足,提供一種環(huán)形排布字符圖像分割方法,可實(shí)現(xiàn)環(huán)形排布字符圖像的準(zhǔn)確分害わ從而提高環(huán)形排布字符圖像的字符識(shí)別準(zhǔn)確率。本發(fā)明的環(huán)形排布字符圖像分割方法,用于環(huán)形排布字符圖像中的字符識(shí)別,包括以下步驟
步驟A、提取環(huán)形排布字符圖像的邊緣特征點(diǎn),得到所述環(huán)形排布字符區(qū)域的內(nèi)、外輪
廓;
步驟B、利用以下方法對(duì)表征環(huán)形排布字符區(qū)域內(nèi)、外輪廓的ー對(duì)同心橢圓進(jìn)行檢測(cè) 步驟BI、利用以下方法對(duì)所述同心橢圓的中心點(diǎn)進(jìn)行檢測(cè)
步驟B101、在同心橢圓中心點(diǎn)可能存在的圖像區(qū)域內(nèi)取一點(diǎn)執(zhí)行以下操作從該點(diǎn)處引出兩條射線,如兩條射線與環(huán)形排布字符區(qū)域內(nèi)輪廓的交點(diǎn)間的連線,和兩條射線與環(huán)形排布字符區(qū)域外輪廓的交點(diǎn)間的連線平行,則對(duì)該點(diǎn)所在位置投票加I ;再從該點(diǎn)出發(fā)旋轉(zhuǎn)ー個(gè)預(yù)設(shè)角度引出兩條射線,執(zhí)行同樣的操作進(jìn)行投票,所述預(yù)設(shè)角度小于等于90° ;依此處理直至射線旋轉(zhuǎn)完360°,則該點(diǎn)的投票結(jié)束;
步驟B102、遍歷執(zhí)行同心橢圓中心點(diǎn)可能存在的圖像區(qū)域內(nèi)所有點(diǎn)的投票后,得到一個(gè)ニ維投票值數(shù)組;選擇投票值最大的點(diǎn)作為同心橢圓的中心點(diǎn),則該點(diǎn)對(duì)應(yīng)的橫、縱坐標(biāo)即為橢圓中心點(diǎn)的橫、縱坐標(biāo);步驟B2、利用以下方法檢測(cè)所述同心橢圓的偏角
步驟B201、取過所述同心橢圓的中心點(diǎn)的一條直線,對(duì)環(huán)形排布字符區(qū)域的內(nèi)輪廓/外輪廓上的所有點(diǎn)求關(guān)于該直線的對(duì)稱點(diǎn),有一個(gè)對(duì)稱點(diǎn)在環(huán)形排布字符區(qū)域的內(nèi)輪廓/外輪廓上就對(duì)該直線投一票;
步驟B202、將該直線旋轉(zhuǎn)ー預(yù)設(shè)角度并重復(fù)步驟B201,直至旋轉(zhuǎn)完360°,得到一個(gè)ー維投票數(shù)組;
步驟B203、選擇投票值最大的直線所對(duì)應(yīng)的角度,該角度即為所述同心橢圓的長軸方
向;
步驟B3、利用以下方法檢測(cè)所述同心橢圓的參數(shù)比值及其他參數(shù)值
步驟B301、過所述同心橢圓的中心點(diǎn)引兩條射線,如果在其中一條射線上,中心點(diǎn)到內(nèi)輪廓上的焦點(diǎn)與到外輪廓上焦點(diǎn)的比值和在另一條射線上的比值相等,則為該比值投ー票;
步驟B302、選擇投票值最大比值即為兩個(gè)橢圓參數(shù)的比值;
步驟B303、根據(jù)橢圓第一定義橢圓上的任意點(diǎn)到該橢圓輪廓兩個(gè)焦點(diǎn)的距離和為兩倍的長半軸長,對(duì)其中一個(gè)橢圓的長半軸和焦距進(jìn)行投票;
步驟B304、選擇票數(shù)最大值作為最終的焦距和長半軸長,井根據(jù)橢圓性質(zhì)求得短半軸長度;
步驟B305、由步驟B302所得的比值,求得另ー個(gè)橢圓的所有參數(shù);
步驟C、通過仿射變換將兩同心橢圓之間的環(huán)形圖像區(qū)域拉伸為矩形區(qū)域,并進(jìn)行ニ值化處理,得到含有字符串的矩形圖像;
步驟D、定位所述矩形圖像中字符串的首字符位置,然后對(duì)矩形圖像進(jìn)行平移變換,得到以首字符為起始的新矩形圖像;
步驟E、對(duì)步驟D中得到的新矩形圖像進(jìn)行字符分割。優(yōu)選地,所述步驟D具體包括
步驟D1、過濾掉所述矩形圖像中的噪聲信息;
步驟D2、對(duì)步驟Dl中得到的圖像進(jìn)行膨脹處理,使其近鄰的所有字符連成一體;
步驟D3、通過直方圖投影尋找最大連通域,最大連通域的起始位置即為首字符開始
處;
步驟D4、將原先的含有字符串的矩形圖像平移變換為以首字符所在位置為起始處的新矩形圖像。優(yōu)選地,所述對(duì)步驟D中得到的新矩形圖像進(jìn)行字符分割,具體按照以下方法分別計(jì)算步驟D中得到的新矩形圖像的単行統(tǒng)計(jì)和與單列統(tǒng)計(jì)和,根據(jù)預(yù)定義閾值確定圖像的有效區(qū)域;重新計(jì)算該有效區(qū)域的單列和與組列和,在預(yù)定義字符寬度閾值內(nèi)根據(jù)單列和與組列和的極小值位置確定最佳分隔點(diǎn),從而完成所述環(huán)形排布字符圖像的分割。優(yōu)選地,步驟A中所述環(huán)形排布字符圖像是采用雙邊濾波算法對(duì)源圖像進(jìn)行濾波處理后得到。優(yōu)選地,步驟A中采用Canny算子提取環(huán)形排布字符圖像的邊緣特征點(diǎn)。根據(jù)本發(fā)明的圖像分割方法,可得到ー種金屬表盤環(huán)形排布鋼印字符識(shí)別方法及系統(tǒng),分別如下ー種金屬表盤環(huán)形排布鋼印字符識(shí)別方法,包括以下步驟
步驟I、采集所述金屬表盤圖像;
步驟2、通過基于有效像素域的統(tǒng)計(jì)學(xué)方法獲取金屬表盤圖像中環(huán)形排布鋼印字符區(qū)域圖像;
步驟3、利用上述任ー圖像分割方法對(duì)所述環(huán)形排布鋼印字符區(qū)域圖像進(jìn)行分割; 步驟4、對(duì)分割后的圖像進(jìn)行字符識(shí)別。進(jìn)ー步地,步驟4中所述字符識(shí)別利用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)。ー種金屬表盤環(huán)形排布鋼印字符識(shí)別系統(tǒng),包括
圖像采集模塊,用于對(duì)金屬表盤圖像進(jìn)行實(shí)時(shí)采集;
圖像預(yù)處理模塊,用于從圖像采集模塊采集的圖像中獲取金屬表盤圖像中環(huán)形排布鋼印字符區(qū)域圖像;
圖像分割模塊,接收?qǐng)D像預(yù)處理模塊輸出的圖像,并利用上述任ー圖像分割方法對(duì)其進(jìn)行圖像分割;
字符識(shí)別模塊,對(duì)圖像分割模塊輸出的分割后圖像進(jìn)行字符識(shí)別。本發(fā)明采用獨(dú)創(chuàng)的同心橢圓檢測(cè)定位算法對(duì)表征環(huán)形排布字符區(qū)域內(nèi)外輪廓的ー對(duì)同心橢圓進(jìn)行檢測(cè),通過仿射變換將位于兩同心橢圓之間的環(huán)形圖像區(qū)域映射到矩形區(qū)域,并進(jìn)行字符定位與分割,可實(shí)現(xiàn)環(huán)形排布字符圖像的準(zhǔn)確分割;本發(fā)明進(jìn)一步通過神經(jīng)網(wǎng)絡(luò)對(duì)分割后圖像進(jìn)行字符識(shí)別。相比現(xiàn)有技術(shù),本發(fā)明具有字符識(shí)別準(zhǔn)確率高,識(shí)別速度快的優(yōu)點(diǎn),可用以解決所有類似表盤鋼印的環(huán)形排布字符的識(shí)別問題。
圖I為本發(fā)明金屬表盤環(huán)形排布鋼印字符識(shí)別系統(tǒng)的結(jié)構(gòu)框 圖2為本發(fā)明金屬表盤環(huán)形排布鋼印字符識(shí)別方法的流程示意 圖3為同心橢圓中心檢測(cè)的原理示意 圖4為同心橢圓偏角檢測(cè)的原理示意 圖5為同心橢圓焦距和長軸長檢測(cè)的原理示意圖。
具體實(shí)施例方式下面結(jié)合附圖對(duì)本發(fā)明的技術(shù)方案進(jìn)行詳細(xì)說明
本發(fā)明的金屬表盤環(huán)形排布鋼印字符識(shí)別系統(tǒng),如圖I所示,包括
圖像采集模塊,用于對(duì)金屬表盤圖像進(jìn)行實(shí)時(shí)采集;
圖像預(yù)處理模塊,用于從圖像采集模塊采集的圖像中獲取金屬表盤圖像中環(huán)形排布鋼印字符區(qū)域圖像;
圖像分割模塊,接收?qǐng)D像預(yù)處理模塊輸出的圖像,并對(duì)其進(jìn)行圖像分割;
字符識(shí)別模塊,對(duì)圖像分割模塊輸出的分割后圖像進(jìn)行字符識(shí)別。下面結(jié)合該系統(tǒng)的工作過程來對(duì)本發(fā)明的金屬表盤環(huán)形排布鋼印字符識(shí)別方法進(jìn)行詳細(xì)描述。該方法流程如圖2所示,具體按照以下步驟
步驟I、采集所述金屬表盤圖像;
利用攝像機(jī)等圖像采集設(shè)備采集金屬表盤圖像并將其作為后續(xù)處理的源圖像傳輸至圖像預(yù)處理模塊。步驟2、通過基于有效像素域的統(tǒng)計(jì)學(xué)方法獲取金屬表盤圖像中環(huán)形排布鋼印字符區(qū)域圖像;
源圖像中僅有字符區(qū)域圖像是我們感興趣的部分,而其他部分并不需要,因此本發(fā)明在圖像預(yù)處理模塊中,通過基于有效像素域的統(tǒng)計(jì)學(xué)方法獲取金屬表盤圖像中環(huán)形排布鋼印字符區(qū)域圖像,并將獲取到的環(huán)形排布鋼印字符區(qū)域圖像傳輸至圖像分割模塊。步驟3、對(duì)所述環(huán)形排布鋼印字符區(qū)域圖像進(jìn)行分割;
對(duì)圖像的分割是本發(fā)明的核心所在,為了能夠?qū)Νh(huán)形排布字符圖像進(jìn)行準(zhǔn)確分割,本發(fā)明采用獨(dú)創(chuàng)的同心橢圓檢測(cè)定位算法對(duì)表征環(huán)形排布字符區(qū)域內(nèi)外輪廓的ー對(duì)同心橢圓進(jìn)行檢測(cè),通過仿射變換將位于兩同心橢圓之間的環(huán)形圖像區(qū)域映射到矩形區(qū)域,并進(jìn)行字符定位與分割。具體而言,本步驟具體包括
步驟A、提取環(huán)形排布字符圖像的邊緣特征點(diǎn),得到所述環(huán)形排布字符區(qū)域的內(nèi)、外輪
廓;
本具體實(shí)施方式
中,首先采用邊緣信息不會(huì)丟失的雙邊濾波法對(duì)圖像進(jìn)行濾波平滑處理,當(dāng)然,如果采集到的源圖像質(zhì)量較高,則不需要濾波過程。然后利用邊緣檢測(cè)算法提取環(huán)形排布字符圖像的邊緣特征點(diǎn),得到所述環(huán)形排布字符區(qū)域的內(nèi)、外輪廓本具體實(shí)施方式
中采用Canny算子提取輪廓邊緣特征,并使用鏈表保存每ー個(gè)輪廓上的邊緣特征點(diǎn)。步驟B、同心橢圓的檢測(cè);本發(fā)明采用獨(dú)創(chuàng)的基于幾何性質(zhì)的Hough算法對(duì)表征環(huán)形排布字符區(qū)域內(nèi)、外輪廓的ー對(duì)同心橢圓進(jìn)行檢測(cè);具體如下
步驟BI、利用以下方法對(duì)所述同心橢圓的中心點(diǎn)進(jìn)行檢測(cè)
步驟B101、在同心橢圓中心點(diǎn)可能存在的圖像區(qū)域內(nèi)取一點(diǎn)執(zhí)行以下操作從該點(diǎn)處引出兩條射線,如兩條射線與環(huán)形排布字符區(qū)域內(nèi)輪廓的交點(diǎn)間的連線,和兩條射線與環(huán)形排布字符區(qū)域外輪廓的交點(diǎn)間的連線平行,則對(duì)該點(diǎn)所在位置投票加I ;再從該點(diǎn)出發(fā)旋轉(zhuǎn)ー個(gè)預(yù)設(shè)角度引出兩條射線,執(zhí)行同樣的操作進(jìn)行投票,所述預(yù)設(shè)角度小于等于90° ;依此處理直至射線旋轉(zhuǎn)完360°,則該點(diǎn)的投票結(jié)束;
步驟B102、遍歷執(zhí)行同心橢圓中心點(diǎn)可能存在的圖像區(qū)域內(nèi)所有點(diǎn)的投票后,得到一個(gè)ニ維投票值數(shù)組;選擇投票值最大的點(diǎn)作為同心橢圓的中心點(diǎn),則該點(diǎn)對(duì)應(yīng)的橫、縱坐標(biāo)即為橢圓中心點(diǎn)的橫、縱坐標(biāo)。通過幾何證明可以得知,當(dāng)兩橢圓同心同向時(shí),若分別位于兩個(gè)橢圓上的弦平行,則弦端點(diǎn)的連線必交于橢圓中心點(diǎn)。利用此性質(zhì)進(jìn)行ニ維Hough變換累加投票,可以得出最大峰值點(diǎn)即為橢圓圓心。其原理如圖3所示,具體方法為在橢圓中心點(diǎn)可能存在的圖像區(qū)域A內(nèi),依次假設(shè)A內(nèi)每個(gè)點(diǎn)為中心點(diǎn)0,從O點(diǎn)處引出兩條射線與同心的內(nèi)、外兩橢圓輪廓相交于點(diǎn)B、D和C、E,若BD與CE平行,則對(duì)該o點(diǎn)所在位置投票加I。再從o點(diǎn)出引出兩條射線,每條射線與與前一次的射線夾角相差10°,執(zhí)行同樣的操作進(jìn)行投票,以此處理直到射線旋轉(zhuǎn)完360°,則該O點(diǎn)的投票結(jié)束。遍歷執(zhí)行所有假設(shè)中心點(diǎn)的投票后,得到一個(gè)ニ維投票值數(shù)組,選擇投票值最大的點(diǎn)作為候選圓心,則該點(diǎn)對(duì)應(yīng)的橫、縱坐標(biāo)即為橢圓中心的橫、縱坐標(biāo)。步驟B2、利用以下方法檢測(cè)所述同心橢圓的偏角
步驟B201、取過所述同心橢圓的中心點(diǎn)的一條直線,對(duì)環(huán)形排布字符區(qū)域的內(nèi)輪廓/外輪廓上的所有點(diǎn)求關(guān)于該直線的對(duì)稱點(diǎn),有一個(gè)對(duì)稱點(diǎn)在環(huán)形排布字符區(qū)域的內(nèi)輪廓/外輪廓上就對(duì)該直線投一票,如圖4,Pl和P2關(guān)于直線LO對(duì)稱;
步驟B202、將該直線旋轉(zhuǎn)一個(gè)預(yù)設(shè)角度并重復(fù)步驟B201,直至旋轉(zhuǎn)完360°,得到ー個(gè)ー維投票數(shù)組;
步驟B203、選擇投票值最大的直線所對(duì)應(yīng)的角度,該角度即為所述同心橢圓的長軸方
向;
具體方法為假設(shè)LO與X軸的夾角為0,投票空間為
,0初值為0°,對(duì)橢圓 上的所有點(diǎn)求關(guān)于LO的對(duì)稱點(diǎn),有一個(gè)對(duì)稱點(diǎn)在橢圓上就對(duì)該0值投一票。e角從0°到180°遍歷整個(gè)投票空間,毎次遞增0. 5°,最后得到一個(gè)ー維投票數(shù)組,選擇投票值最大的兩個(gè)點(diǎn),這兩個(gè)點(diǎn)對(duì)應(yīng)的角度值即為橢圓長軸方向。步驟B3、利用以下方法檢測(cè)所述同心橢圓的參數(shù)比值及其他參數(shù)值
步驟B301、過步驟BI中找到的中心點(diǎn)0引兩條射線,分別交內(nèi)輪廓于點(diǎn)P1、P2,交外輪廓于點(diǎn)Ql、Q2,如果OPl的長度和0P2的長度的比值與OQl的長度和0Q2的長度的比值相等,則為該比值投一票;
步驟B302、選擇投票值最大比值即為兩個(gè)橢圓參數(shù)的比值;
步驟B303、在內(nèi)輪廓/外輪廓上隨機(jī)取兩點(diǎn)PI、P2,如圖5所示,由橢圓第一定義這兩個(gè)點(diǎn)中任意點(diǎn)到該橢圓輪廓兩個(gè)焦點(diǎn)的距離和為長軸長,即\PFi\+\PF^2a0由此性質(zhì)可以用ー維Hough變換累加,即可得出焦距大小,繼而亦可算出長
軸長。在步驟B2求得的角度方向過中心點(diǎn)的直線上取兩點(diǎn)作為焦點(diǎn)FI、F2,則連接Pl和Fl, Pl和F2,P2和Fl, P2和F2,如果PlFl的長度與P1F2的長度和與P2F1的長度與P2F2的長度和相等,則對(duì)于該長度和Fl到中心點(diǎn)的距離(即焦距)投一票;
步驟B304、選擇票數(shù)最大值作為最終的焦距和長半軸長。根據(jù)橢圓性質(zhì),短半軸長度可由焦距和長半軸求出;
具體方法為先用步驟BI和B2中得到的中心與偏角將原橢圓變換為以(0,0)點(diǎn)為橢圓中心、X軸為橢圓長軸方向的標(biāo)準(zhǔn)橢圓。焦距c的取值范圍為(0,a)。(I)假設(shè)c取定某ー值,則左右焦點(diǎn)F1、F2坐標(biāo)為為(-C,0)、(C,0),b是橢圓短軸長度的一半,b的值可通過橢圓輪廓與I軸的交點(diǎn)到原點(diǎn)的距離求出,而a可由b2+c2的平方根求出。從橢圓某一點(diǎn)P開始,如果PF1、PF2之和等于2a,則該c值投票加1,從P點(diǎn)開始遍歷橢圓上所有點(diǎn),對(duì)該c值投票;(2)在c的取值范圍內(nèi),遍歷所有的c值,重復(fù)執(zhí)行(I)的投票操作,最后得到ー個(gè)ー維投票數(shù)組,選擇投票值最大點(diǎn)即為焦距c的大小,繼而長軸長度2a也能求出來。步驟B305、由步驟B302求得的比值I求得另ー個(gè)橢圓的所有參數(shù);
橢圓上的每個(gè)點(diǎn)到兩焦點(diǎn)的距離之和相等,此距離和為橢圓的長軸長,即為2a。由此性質(zhì)可以用ー維Hough變換累加,即可得出焦距大小,繼而亦可算出長軸長。其原理如圖5所示,具體方法為先用步驟BI和B2中得到的中心與偏角將原橢圓變換為以(0,0)點(diǎn)為橢圓中心、X軸為橢圓長軸方向的標(biāo)準(zhǔn)橢圓。焦距c的取值范圍為(0,a)。(I)假設(shè)c取定某ー值,則左右焦點(diǎn)C1、C2坐標(biāo)為為(-C,0)、(C,0),b是橢圓短軸長度的一半,b的值可通過橢圓輪廓與I軸的交點(diǎn)到原點(diǎn)的距離求出,而a可由b2+c2的平方根求出。從橢圓某一點(diǎn)N開始,如果NC1、NC2之和等于2a,則該c值投票加1,從N點(diǎn)開始遍歷橢圓上所有點(diǎn),對(duì)該c值投票;(2)在c的取值范圍內(nèi),遍歷所有的c值,重復(fù)執(zhí)行(I)的投票操作,最后得到ー個(gè)ー維投票數(shù)組,選擇投票值最大點(diǎn)即為焦距C的大小,繼而長軸長度2a也能求出來。步驟C、通過仿射變換將兩同心橢圓之間的環(huán)形圖像區(qū)域拉伸為矩形區(qū)域,并進(jìn)行ニ值化處理,得到含有字符串的矩形圖像;根據(jù)步驟B所得到的金屬表盤內(nèi)外兩個(gè)同心橢圓的橢圓參數(shù),對(duì)兩橢圓輪廓之間的環(huán)形圖像區(qū)域像素進(jìn)行仿射變換先通過環(huán)形區(qū)域點(diǎn)到矩形區(qū)域點(diǎn)的對(duì)應(yīng)關(guān)系計(jì)算出仿射變換矩陣,然后用仿射變換矩陣將源圖像中兩橢圓環(huán)形區(qū)域圖像映射成含有字符區(qū)域的矩形圖像,由于橢圓環(huán)區(qū)域圖像被拉直了,橢圓環(huán)上環(huán)形排布的字符串也被拉直為水平排列;然后采用自適應(yīng)閾值ニ值算法對(duì)該矩形圖像進(jìn)行ニ值化處理,得到ニ值化圖像 ,ニ值化圖像更利于字符分割與識(shí)別。步驟D、定位所述矩形圖像中字符串的首字符位置,然后對(duì)矩形圖像進(jìn)行平移變換,得到以首字符為起始的新矩形圖像。步驟C所得到的圖像是含有字符串的矩形圖像,字符串的起始位置以隨機(jī)概率分布在矩形長的任意位置上。本具體實(shí)施方式
中采用連通域分析法進(jìn)行首字符定位,然后對(duì)圖像進(jìn)行平移變換,輸出以首字符為起始的新矩形圖像;本步驟具體包括以下步驟
步驟D1、過濾掉所述矩形圖像中的噪聲信息;
步驟D2、對(duì)步驟Dl中得到的圖像進(jìn)行膨脹處理,使其近鄰的所有字符連成一體;
步驟D3、通過直方圖投影尋找最大連通域,最大連通域的起始位置即為首字符開始
處;
步驟D4、將原先的含有字符串的矩形圖像平移變換為以首字符所在位置為起始處的新矩形圖像。步驟E、對(duì)步驟D中得到的新矩形圖像進(jìn)行字符分割;由于此時(shí)環(huán)形排布字符圖像已轉(zhuǎn)換為常規(guī)的矩形圖像,因此可以采用現(xiàn)有的各種方法對(duì)其進(jìn)行字符分割及字符識(shí)別;本具體實(shí)施方式
中具體按照以下方法進(jìn)行字符分割
步驟E1、對(duì)于步驟D所得到的以首字符為起始的圖像矩陣,計(jì)算水平灰度直方圖,根據(jù)預(yù)定義閾值去除上下兩端不符合要求的區(qū)域,保留中部范圍最大有效域;
步驟E2、計(jì)算垂直灰度直方圖,去除從左側(cè)始連續(xù)不滿足預(yù)定義閾值區(qū)域;
步驟E3、根據(jù)垂直灰度直方圖A,計(jì)算得到對(duì)A進(jìn)行濾波的新直方圖B,方法及步驟如
下
步驟E301、根據(jù)預(yù)定義寬度值WIDTH,從A起始位置計(jì)算連續(xù)WIDTH寬度的數(shù)值和SUM,將SUM保存至B中;
步驟E302、將A起始位置后移一位,重復(fù)步驟E301過程,并將SUM順序保存至B中; 步驟E303、直至A中所有數(shù)據(jù)均參與計(jì)算,結(jié)束。步驟E4、在預(yù)定義字符寬度范圍內(nèi),通過A與B的極小值位置關(guān)系確定最佳分隔點(diǎn)當(dāng)A、B極小位置差滿足預(yù)定閾值時(shí),取其平均位置作為最佳分隔點(diǎn);當(dāng)A、B極小位置差超過預(yù)定閾值時(shí),先以A極小值位置作為最佳分隔點(diǎn),再以B極小值位置作為最佳分隔點(diǎn),這兩個(gè)分隔點(diǎn)的優(yōu)劣將在接下來的字符識(shí)別部分中指出,由此得到初歩分割的圖像矩陣C。步驟E5、對(duì)圖像矩陣C進(jìn)行上下左右無效數(shù)據(jù)的去除和最大有效區(qū)域的提取;方法及步驟如下
步驟E501、計(jì)算C的水平灰度直方圖,據(jù)此得到滿足預(yù)定義閾值的無效區(qū)域D和有效區(qū)域E,其中D、E可能分別包含多個(gè)連續(xù)子區(qū)域;步驟E502、如果D中存在這樣的子區(qū)域F :它臨近圖像的上邊緣或者下邊緣,則以F為分割線,如果F臨近上邊緣,就將F及其以上數(shù)據(jù)全部去除,如果F臨近下邊緣,則將F及其以下數(shù)據(jù)全部去除。將經(jīng)過本步驟處理后的D與E進(jìn)行合并,得到新的有效區(qū)域E ;
步驟E503、如果E中存在這樣的連續(xù)子區(qū)域G :它約在圖像的中部位置,并且在E中具有最大高度值,這個(gè)高度值滿足預(yù)定義閾值,則G作為待識(shí)別圖像;
步驟E504、計(jì)算G的垂直灰度直方圖,類似于上述水平灰度直方圖的處理方法對(duì)G進(jìn)行再處理,得到待識(shí)別圖像H ;
步驟E505、統(tǒng)計(jì)H中數(shù)據(jù)點(diǎn)個(gè)數(shù)I,并將H邊緣化后統(tǒng)計(jì)邊緣點(diǎn)個(gè)數(shù)J,在I、J均達(dá)到預(yù)定義閾值的情況下,將圖像規(guī)格化為固定寬高的ニ值圖像K。步驟4、對(duì)分割后的圖像進(jìn)行字符識(shí)別。
通過步驟Iー步驟3的處理,環(huán)形分布字符圖像已轉(zhuǎn)換為單字符矩形圖像,下面進(jìn)行字符識(shí)別。本具體實(shí)施方式
中采用以下方法將步驟3中得到的ニ值圖像K按行展開,送入神經(jīng)網(wǎng)絡(luò)識(shí)別器進(jìn)行字符識(shí)別,神經(jīng)網(wǎng)絡(luò)具有兩個(gè)輸出,ー個(gè)是識(shí)別輸出值L,一個(gè)是識(shí)別結(jié)果分類M,根據(jù)L是否滿足預(yù)定義閾值確定待識(shí)別字符圖像K是否符合要求,如果符合要求,則存儲(chǔ)M并準(zhǔn)備接收下一幅圖像數(shù)據(jù)。如果不符合要求,則調(diào)節(jié)預(yù)定義字符寬度范圍后轉(zhuǎn)入步驟3重新進(jìn)行圖像分割。整個(gè)圖像處理完畢后,若結(jié)果滿足字符串先驗(yàn)規(guī)則定義,則輸出識(shí)別結(jié)果,否則回到開始的圖像采集步驟重新開始。本方法的特點(diǎn)是將整個(gè)ニ值圖像作為源輸入到神經(jīng)網(wǎng)絡(luò)分類器,并且根據(jù)神經(jīng)網(wǎng)絡(luò)的輸出值反饋所輸入的ニ值圖像是否符合要求,在符合要求和不符合要求兩種情況下,分別作了不同的后續(xù)處理。本發(fā)明方法的時(shí)間、空間復(fù)雜度小,在外界環(huán)境條件適宜的情況下能做到I秒內(nèi)識(shí)別2-3次,識(shí)別速度快,正確率可達(dá)到99%以上??蓪⒃摲椒☉?yīng)用于エ業(yè)檢測(cè)領(lǐng)域,通過傳送帶進(jìn)行自動(dòng)化流水作業(yè),大大減輕操作人員的工作強(qiáng)度,極大地提高工作效率。
權(quán)利要求
1.一種環(huán)形排布字符圖像分割方法,用于環(huán)形排布字符圖像中的字符識(shí)別,其特征在于,包括以下步驟 步驟A、提取環(huán)形排布字符圖像的邊緣特征點(diǎn),得到所述環(huán)形排布字符區(qū)域的內(nèi)、外輪廓; 步驟B、利用以下方法對(duì)表征環(huán)形排布字符區(qū)域內(nèi)、外輪廓的ー對(duì)同心橢圓進(jìn)行檢測(cè) 步驟BI、利用以下方法對(duì)所述同心橢圓的中心點(diǎn)進(jìn)行檢測(cè) 步驟B101、在同心橢圓中心點(diǎn)可能存在的圖像區(qū)域內(nèi)取一點(diǎn)執(zhí)行以下操作從該點(diǎn)處引出兩條射線,如兩條射線與環(huán)形排布字符區(qū)域內(nèi)輪廓的交點(diǎn)間的連線,和兩條射線與環(huán)形排布字符區(qū)域外輪廓的交點(diǎn)間的連線平行,則對(duì)該點(diǎn)所在位置投票加I ;再從該點(diǎn)出發(fā)旋轉(zhuǎn)ー個(gè)預(yù)設(shè)角度引出兩條射線,執(zhí)行同樣的操作進(jìn)行投票,所述預(yù)設(shè)角度小于等于90° ;依此處理直至射線旋轉(zhuǎn)完360°,則該點(diǎn)的投票結(jié)束; 步驟B102、遍歷執(zhí)行同心橢圓中心點(diǎn)可能存在的圖像區(qū)域內(nèi)所有點(diǎn)的投票后,得到一個(gè)ニ維投票值數(shù)組;選擇投票值最大的點(diǎn)作為同心橢圓的中心點(diǎn),則該點(diǎn)對(duì)應(yīng)的橫、縱坐標(biāo)即為橢圓中心點(diǎn)的橫、縱坐標(biāo); 步驟B2、利用以下方法檢測(cè)所述同心橢圓的偏角 步驟B201、取過所述同心橢圓的中心點(diǎn)的一條直線,對(duì)環(huán)形排布字符區(qū)域的內(nèi)輪廓/外輪廓上的所有點(diǎn)求關(guān)于該直線的對(duì)稱點(diǎn),有一個(gè)對(duì)稱點(diǎn)在環(huán)形排布字符區(qū)域的內(nèi)輪廓/外輪廓上就對(duì)該直線投一票; 步驟B202、將該直線旋轉(zhuǎn)ー預(yù)設(shè)角度并重復(fù)步驟B201,直至旋轉(zhuǎn)完360°,得到一個(gè)ー維投票數(shù)組; 步驟B203、選擇投票值最大的直線所對(duì)應(yīng)的角度,該角度即為所述同心橢圓的長軸方向; 步驟B3、利用以下方法檢測(cè)所述同心橢圓的參數(shù)比值及其他參數(shù)值 步驟B301、過所述同心橢圓的中心點(diǎn)引兩條射線,如果在其中一條射線上,中心點(diǎn)到內(nèi)輪廓上的焦點(diǎn)與到外輪廓上焦點(diǎn)的比值和在另一條射線上的比值相等,則為該比值投ー票; 步驟B302、選擇投票值最大比值即為兩個(gè)橢圓參數(shù)的比值; 步驟B303、根據(jù)橢圓第一定義橢圓上的任意點(diǎn)到該橢圓輪廓兩個(gè)焦點(diǎn)的距離和為兩倍的長半軸長,對(duì)其中一個(gè)橢圓的長半軸和焦距進(jìn)行投票; 步驟B304、選擇票數(shù)最大值作為最終的焦距和長半軸長,井根據(jù)橢圓性質(zhì)求得短半軸長度; 步驟B305、由步驟B302所得的比值,求得另ー個(gè)橢圓的所有參數(shù); 步驟C、通過仿射變換將兩同心橢圓之間的環(huán)形圖像區(qū)域拉伸為矩形區(qū)域,并進(jìn)行ニ值化處理,得到含有字符串的矩形圖像; 步驟D、定位所述矩形圖像中字符串的首字符位置,然后對(duì)矩形圖像進(jìn)行平移變換,得到以首字符為起始的新矩形圖像; 步驟E、對(duì)步驟D中得到的新矩形圖像進(jìn)行字符分割。
2.如權(quán)利要求I所述環(huán)形排布字符圖像分割方法,其特征在于,所述步驟D具體包括 步驟D1、過濾掉所述矩形圖像中的噪聲信息;步驟D2、對(duì)步驟Dl中得到的圖像進(jìn)行膨脹處理,使其近鄰的所有字符連成一體; 步驟D3、通過直方圖投影尋找最大連通域,最大連通域的起始位置即為首字符開始處;步驟D4、將原先的含有字符串的矩形圖像平移變換為以首字符所在位置為起始處的新矩形圖像。
3.如權(quán)利要求I所述環(huán)形排布字符圖像分割方法,其特征在于,所述對(duì)步驟D中得到的新矩形圖像進(jìn)行字符分割,具體按照以下方法分別計(jì)算步驟D中得到的新矩形圖像的單行統(tǒng)計(jì)和與單列統(tǒng)計(jì)和,根據(jù)預(yù)定義閾值確定圖像的有效區(qū)域;重新計(jì)算該有效區(qū)域的單列和與組列和,在預(yù)定義字符寬度閾值內(nèi)根據(jù)單列和與組列和的極小值位置確定最佳分隔點(diǎn),從而完成所述環(huán)形排布字符圖像的分割。
4.如權(quán)利要求I所述環(huán)形排布字符圖像分割方法,其特征在干,步驟A中所述環(huán)形排布字符圖像是采用雙邊濾波算法對(duì)源圖像進(jìn)行濾波處理后得到。
5.如權(quán)利要求I所述環(huán)形排布字符圖像分割方法,其特征在于,步驟A中采用Canny算子提取環(huán)形排布字符圖像的邊緣特征點(diǎn)。
6.ー種金屬表盤環(huán)形排布鋼印字符識(shí)別方法,其特征在于,包括以下步驟 步驟I、采集所述金屬表盤圖像; 步驟2、通過基于有效像素域的統(tǒng)計(jì)學(xué)方法獲取金屬表盤圖像中環(huán)形排布鋼印字符區(qū)域圖像; 步驟3、利用權(quán)利要求I一5任ー項(xiàng)所述圖像分割方法對(duì)所述環(huán)形排布鋼印字符區(qū)域圖像進(jìn)行分割; 步驟4、對(duì)分割后的圖像進(jìn)行字符識(shí)別。
7.如權(quán)利要求6所述金屬表盤環(huán)形排布鋼印字符識(shí)別方法,其特征在于,步驟4中所述字符識(shí)別利用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)。
8.ー種金屬表盤環(huán)形排布鋼印字符識(shí)別系統(tǒng),其特征在于,包括 圖像采集模塊,用于對(duì)金屬表盤圖像進(jìn)行實(shí)時(shí)采集; 圖像預(yù)處理模塊,用于從圖像采集模塊采集的圖像中獲取金屬表盤圖像中環(huán)形排布鋼印字符區(qū)域圖像; 圖像分割模塊,接收?qǐng)D像預(yù)處理模塊輸出的圖像,并利用權(quán)利要求I一5任ー項(xiàng)所述圖像分割方法對(duì)其進(jìn)行圖像分割; 字符識(shí)別模塊,對(duì)圖像分割模塊輸出的分割后圖像進(jìn)行字符識(shí)別。
全文摘要
本發(fā)明公開了一種環(huán)形排布字符圖像分割方法,用于環(huán)形排布字符圖像中的字符識(shí)別。本發(fā)明采用獨(dú)創(chuàng)的同心橢圓檢測(cè)定位算法對(duì)表征環(huán)形排布字符區(qū)域內(nèi)外輪廓的一對(duì)同心橢圓進(jìn)行檢測(cè),通過仿射變換將位于兩同心橢圓之間的環(huán)形圖像區(qū)域映射到矩形區(qū)域,并進(jìn)行字符定位與分割,可實(shí)現(xiàn)環(huán)形排布字符圖像的準(zhǔn)確分割。本發(fā)明還公開了一種金屬表盤環(huán)形排布鋼印字符識(shí)別方法及系統(tǒng)。相比現(xiàn)有技術(shù),本發(fā)明具有字符識(shí)別準(zhǔn)確率高,識(shí)別速度快的優(yōu)點(diǎn),可用以解決所有類似表盤鋼印的環(huán)形排布字符的識(shí)別問題。
文檔編號(hào)G06K9/46GK102646193SQ20121007892
公開日2012年8月22日 申請(qǐng)日期2012年3月23日 優(yōu)先權(quán)日2012年3月23日
發(fā)明者劉惠義, 劉顏君, 周斌, 曾曉勤, 裴沛, 黃利宏 申請(qǐng)人:河海大學(xué)