專利名稱:基于計算提取數(shù)字圖像選擇性骨骼面積特征的數(shù)字識別方法
技術領域:
本發(fā)明涉及一種數(shù)字識別方法,特別是一種基于計算提取數(shù)字圖像選擇性骨骼面積特征的數(shù)字識別方法。
背景技術:
數(shù)字識別在實際生活中有著重要的應用價值,比如工業(yè)生產中的儀表數(shù)字,利用數(shù)字識別技術可以實現(xiàn)自動讀表,并建立數(shù)據(jù)庫,提高抄表員的效率和準確率。再如規(guī)范手寫體或者印刷體數(shù)字的識別在支票、彩票或者身份證等方面應用。
從90年代初期就有很多人參與了數(shù)字識別的研究,從圖像處理、分割、特征提取到分類器的構造都提出了很多新的算法,極大地促進了數(shù)字識別的正確率和應用范圍,其中特征構造是降低學習器輸入維數(shù)并有效地提高了學習器的識別率的重要手段,比較常用的是有統(tǒng)計特征、結構特征和變換特征,其中統(tǒng)計特征穩(wěn)健但會忽略細節(jié),結構特征細致但易受噪聲干擾,所以需要將兩者結合提取特征。
提取的特征要求,1)穩(wěn)健性,因為只有穩(wěn)健性高了,識別時才能克服噪聲影響;2)快速,才能滿足實時識別的要求。
發(fā)明內容
本發(fā)明的目的在于提供一種基于計算提取數(shù)字圖像選擇性骨骼面積特征的數(shù)字識別算法,能可靠、快速、實時識別數(shù)字。
為了實現(xiàn)這個目的,本發(fā)明的構思是圖像經過預處理后首先利用一些常用的方法提取圖像的骨架,然后再利用數(shù)字在不同位置區(qū)域黑白面積不同的特性,從四角和中心位置提取五個區(qū)域的面積作為特征,最后基于所選擇的特征進行數(shù)字識別。
根據(jù)上述的發(fā)明構思,本發(fā)明采用下述技術方案一種基于計算提取數(shù)字圖像選擇性骨骼面積特征的數(shù)字識別方法,其特征在于提取數(shù)字圖像的骨架后,利用數(shù)字在數(shù)字圖像中不同位置區(qū)域黑白面積不同的特性,提取從數(shù)字圖像的四角和中心位置五個區(qū)域的面積作為數(shù)字特征,而后根據(jù)該數(shù)字特征進行數(shù)字識別。其具體操作步驟如下(1)數(shù)字圖像的骨架提?。?2)理想數(shù)字圖像(一套24*16的數(shù)字圖像)的具有選擇性的骨骼面積算法將經骨架提取后的數(shù)字圖像等面積劃分為九份(如圖1所示),并將計算所得的四個角和中心區(qū)域的面積作為整個理想數(shù)字的特征,即每一個理想數(shù)字各有五個數(shù)字特征值;(3)待識別數(shù)字圖像的具有選擇性的骨骼面積算法將經骨架提取后的待識別的數(shù)字圖像等面積劃分為九份(如圖1所示),并將計算所得的四個角和中心區(qū)域的面積作為整個數(shù)字的特征,即每一個待識別數(shù)字有五個數(shù)字特征值;(4)數(shù)字圖像識別利用相關系數(shù)(標準化的斜方差)方法分別計算待識別的數(shù)字圖像的特征與0至9的各理想數(shù)字圖像的特征的匹配程度;(5)得出識別結果找出步驟(4)中和待識別數(shù)字圖像的匹配程度最高的理想數(shù)字圖像,該數(shù)字圖像中的數(shù)字即為對待識別數(shù)字圖像的識別結果。
上述的基于計算提取數(shù)字圖像選擇性骨骼面積特征的數(shù)字識別方法,所述的步驟(1)中的數(shù)字圖像的骨架提取的具體操作如下①灰度均衡化;②二值化假設域值為σ(根據(jù)經驗或實驗確定),將數(shù)字圖像經灰度均衡化處理之后的像素表示值在區(qū)域
內的像素表示值均置為0,其余的像素表示值均置為1;③去除噪聲利用Gauss濾波器濾波;④骨骼化利用細化技術(保持原有數(shù)字形狀的同時使數(shù)字筆畫寬度降為1bit)以得到區(qū)域的骨架,從而把一個平面區(qū)域簡化成圖。
⑤提取目標提取可以充滿數(shù)字的最小的矩形。
上述的基于計算提取數(shù)字圖像選擇性骨骼面積特征的數(shù)字識別方法,所述的步驟①中的灰度均衡化的計算的步驟的計算步驟如下a、列出原始數(shù)字圖灰度級Sk,k=0,1.....L-1,L為表示單個灰度圖像像素的比特數(shù)目;b、統(tǒng)計原始直方圖各個灰度級像素個數(shù)nk;c、計算原始直方圖p(sk)=nk/n(k=0,1,...,L-1),n是原始數(shù)字圖像中像素的總個數(shù);d、計算累計直方圖tk=Σi=0knin;]]>e、取整擴展tk=int[L-1)tk+0.5];f、確定映射對應關系sk→tk;上述的數(shù)字圖像的具有選擇性骨骼面積算法如下
設定圖像用I表示,其面積用S表示,圖像高和寬分別為m和n,將圖像等面積劃分成九份,其劃分方法和各部分標號如圖1所示。則圖像的四個角和中心區(qū)域的五個面積特征可分別計算如下S(1)=∑(∑I((m0∶m1,n0∶n1)));S(2)=∑(∑I((m0∶m1,n2∶n3)));S(3)=∑(∑I((m2∶m3,n2∶n3)));S(4)=∑(∑I((m2∶m3,n0∶n1)));S(5)=∑(∑I((m1∶m2,n1∶n2)));此處,m0,m1,m2,m3,n0,n1,n2,和n3由如下計算所得m0=1;m1=round(m3/3);m2=round(m3*2/3);n0=1;n1=round(n3/3);n2=round(n3*2/3);圖3給出理想數(shù)字圖像。表1給出理想數(shù)字圖像的特征。
表1理想數(shù)字圖像的利用本發(fā)明提取的特征數(shù)值。
圖1為本發(fā)明的數(shù)字圖像及其需要提取面積的區(qū)域劃分圖。
圖2為本發(fā)明的數(shù)字識別的流程圖。
圖3為本發(fā)明的理想數(shù)字圖像。
圖4為本發(fā)明進行數(shù)字圖像骨架提取的①②③處理之后的數(shù)字圖像。
圖5為本發(fā)明進行骨骼化后的數(shù)字圖像。
圖6為本發(fā)明的目標數(shù)字圖像。
具體實施例方式本發(fā)明的一個優(yōu)選實施例結合附圖詳述如下(1)數(shù)字圖像的骨架提?、倩叶染饣缭O定有一待識別的數(shù)字圖像,其灰度級分為8個等級(0,1,2,3,4,5,6,7,8);該數(shù)字圖像經統(tǒng)計后原始直方圖的各個灰度級像素個數(shù)分別為790,1023,850,656,329,245,122,81;計算各個灰度級的原始直方圖分別為0.19,0.25,0.21,0.16,0.08,0.06,0.03,0.02;計算累計直方圖分別為0.19,0.44,0.65,0.81,0.89,0.95,0.98,1.00;用公式tk=int[L-1)tk+0.5]取整擴展得1,3,5,6,6,7,7,7;確定映射對應關系;0→1,1→3,2→5,3,4→6,5,6,7→7。
②二值化設置域值為0.3,將數(shù)字圖像經灰度均衡化處理之后像素表示值在區(qū)域
的像素表示值均置為0,其余的像素表示值均置為1;③去除噪聲;如利用3*3的Gauss濾波器進行濾波;④骨骼化;利用細化技術以得到區(qū)域的骨架,從而把一個平面區(qū)域簡化成圖。如經過步驟①②③之后的數(shù)字圖像“6”如圖4所示,經骨骼化處理之后,其數(shù)字圖像如圖5所示;⑤提取目標;提取可以充滿數(shù)字的最小的矩形。如數(shù)字圖像“6”在提取目標步驟之前如圖5所示,而提取目標之后,其圖像如圖6所示;(2)理想數(shù)字圖像(一套24*16的數(shù)字圖像)的具有選擇性的骨骼面積算法將經骨架提取后的數(shù)字圖像等面積劃分為九份(如圖1所示),并將計算所得的四個角和中心區(qū)域的面積作為整個理想數(shù)字的特征,即每一個理想數(shù)字各有五個數(shù)字特征值。0至9的各個理想數(shù)字的特征值詳見表1;(3)待識別數(shù)字圖像的具有選擇性的骨骼面積算法;將經骨架提取后的待識別的數(shù)字圖像等面積劃分為九份(如圖1所示),并將計算所得的四個角和中心區(qū)域的面積作為整個數(shù)字的特征,即每一個待識別數(shù)字有五個數(shù)字特征值。如待識別數(shù)字圖像的各個特征經計算為5、2、5、5、3;
(4)數(shù)字圖像識別利用相關系數(shù)方法分別計算待識別數(shù)字圖像和0至9的理想數(shù)字圖像的匹配程度。如以步驟(2)中的理想數(shù)字和步驟(3)中的待識別數(shù)字為例,其相關系數(shù)分別為0.3953、-0.3227、-0.3227、-0.3227、-0.2712、0.6455、0.9682、-0.1409、0.3953、0;(5)得出識別結果找出步驟(4)中和待識別數(shù)字的匹配程度最高的理想數(shù)字,該數(shù)字即為識別結果。如依步驟(4)的舉例結果,其識別結果為待識別的數(shù)字為6。
權利要求
1.一種基于計算提取數(shù)字圖像選擇性骨骼面積特征的數(shù)字識別方法,其特征在于提取數(shù)字圖像的骨架后,利用數(shù)字在數(shù)字圖像中不同位置區(qū)域黑白面積不同的特性,提取從數(shù)字圖像的四角和中心位置五個區(qū)域的面積作為數(shù)字特征,而后根據(jù)該數(shù)字特征進行數(shù)字識別。其具體操作步驟如下(1)數(shù)字圖像的骨架提?。?2)計算理想數(shù)字圖像的特征利用數(shù)字圖像選擇性骨骼面積算法,計算出經過數(shù)字圖像骨架提取后的0至9的理想數(shù)字圖像的選擇性骨骼面積,并將其提取為理想的數(shù)字特征;(3)計算待識別數(shù)字圖像的特征采用數(shù)字圖像選擇性骨骼面積算法,計算出經過數(shù)字圖像骨架提取后的待識別數(shù)字圖像的選擇性骨骼面積,并將其提取為待識別數(shù)字的特征;(4)數(shù)字圖像識別計算所得到的待識別數(shù)字特征與0至9的理想數(shù)字特征的匹配程度;(5)得出識別結果找出步驟(4)中和待識別數(shù)字的匹配程度最高的理想數(shù)字,該數(shù)字即為識別結果。
2.根據(jù)權利要求1所述的基于計算提取數(shù)字圖像選擇性骨骼面積特征的數(shù)字識別方法,其特征在于所述的步驟(1)中的數(shù)字圖像的骨架提取,其具體操作步驟為①灰度均衡化;②二值化假設域值為σ,將數(shù)字圖像經灰度均衡化處理之后像素表示值在區(qū)域
的像素表示值均置為0,其余的像素表示值均置為1;③去除噪聲利用Gauss濾波器濾波;④骨骼化利用細化技術以得到區(qū)域的骨架,從而把一個平面區(qū)域簡化成圖。⑤提取目標;提取可以充滿數(shù)字的最小的矩形。
3.根據(jù)權利要求2所述的基于計算提取數(shù)字圖像選擇性骨骼面積特征的數(shù)字識別方法,具體特征在于所述的步驟①中的灰度均衡化的步驟的計算步驟如下a、列出原始數(shù)字圖灰度級Sk,k=0,1,...,L-1,L為表示單個灰度圖像像素的比特數(shù)目;b、統(tǒng)計原始直方圖各個灰度級像素個數(shù)nk;c、計算原始直方圖p(Sk)=nk/n(k=0,1,...,N-1),n是原始數(shù)字圖像中像素的總個數(shù);d、計算累計直方圖tk=Σi=0knin;]]>e、取整擴展tk=int[(L-1)tk+0.5];f、確定映射對應關系Sk→tk。
4.根據(jù)權利要求1所述的基于計算提取數(shù)字圖像選擇性骨骼面積特征的數(shù)字識別方法,其特征在于所述的步驟(2)和(3)中采用的數(shù)字圖像選擇性骨骼面積算法如下設定圖像用I表示,其面積用S表示,圖像高和寬分別為m和n,將圖像等面積劃分成九份。則圖像的四個角和中心區(qū)域的五個面積特征可分別計算如下S(1)=∑(∑I((m0∶m1,n0∶n1)));S(2)=∑(∑I((m0∶m1,n2∶n3)));S(3)=∑(∑I((m2∶m3,n2∶n3)));S(4)=∑(∑I((m2∶m3,n0∶n1)));S(5)=∑(∑I((m1∶m2,n1∶n2)));此處,m0,m1,m2,m3,n0,n1,n2,和n3由如下計算所得m0=1;m1=round(m3/3);m2=round(m3*2/3);n0=1;n1=round(n3/3);n2=round(n3*2/3)。
全文摘要
本發(fā)明涉及一種基于計算提取數(shù)字圖像選擇性骨骼面積特征的數(shù)字識別方法。提取數(shù)字圖像的骨架后,利用不同數(shù)字在數(shù)字圖像中不同位置區(qū)域的黑白面積不同的特征,提取數(shù)字圖像的四角和中心位置五個區(qū)域的面積作為數(shù)字特征,而后根據(jù)該數(shù)字的特征進行數(shù)字識別。該方法可靠性高,識別速度快,且易操作,適用于進行實時數(shù)字識別。
文檔編號G06K9/46GK101025789SQ20071003879
公開日2007年8月29日 申請日期2007年3月29日 優(yōu)先權日2007年3月29日
發(fā)明者李國正, 李丹 申請人:上海大學