專利名稱:一種有限符號集的局部擇優(yōu)匹配法的制作方法
技術領域:
本發(fā)明涉及一種模式識別方法,具體說是一種在計算機中對掃描儀或攝像頭獲取的靜態(tài)圖像按像素塊分割,并提取符號塊的結構信息,與有限符號集的特征進行匹配的方法。
對于文字識別,目前傳統(tǒng)的方法是對大數(shù)量的字模作廣度優(yōu)先搜索。在這種方法中,先從初始字模開始,按規(guī)則G(x)逐步逼近下一個字模,順序檢查是否出現(xiàn)目標字模Sg,在全部范圍中沿廣度進行″橫向″掃描,運用評價函數(shù)E(x)=d(x),得出與字模的相似度。這種方法在字模數(shù)量多的情況下具有實用性。但是,為了保證匹配速度,其匹配特征太簡化,有效識別率不高。
本發(fā)明的目的是提供一種應用于需要匹配的符號數(shù)量有限,但識別準確率要求較高、識別速度較快的方法,從而實現(xiàn)有限符號集的快速和準確識別的圖象/文本轉換。
本發(fā)明所采取的技術措施是在符號數(shù)量有限的前提下對每個符號的左上、右上、左下和右下四塊圖象進行局部分析,分別找出直線子特征橫、豎、撇、捺和拐角子特征左上勾、右上勾、左下勾、右下勾的數(shù)量、位置和長度,與標準符號的相應子特征進行比較,其中數(shù)量作為主特征,位置和長度作為輔特征,當單從主特征可以把其中一個符號辨析出來時,該符號只做主特征辨析;兩個以上的符號主特征重合時,對這些符號加做位置和長度輔特征辨析;有限集合內兩個符號相似即其大部分特征相同時,針對不同的特征加強辨析權重,用整體和局部最優(yōu)的方法按權重取相似度的方法搜索出最近似符號。
本發(fā)明所述的搜索的過程就是在樣本集空間中找出到最相似目標狀態(tài)的路徑集合,從樹根的一個初始狀態(tài)開始,構造一棵為可能解的動作序列樹,明顯不匹配的分支被忽略,然后找出與根結點匹配的所有分支,建立新的狀態(tài)結點,從而生成下一層樹,取上層樹生成的每一結點,再找出與其匹配的結點并又生成下一層樹,繼續(xù)此過程直至匹配目標狀態(tài)的構型生成為止,最后取加權重后相似度最高的樣本為最優(yōu)解。
本發(fā)明所述的采用整體和局部最優(yōu)的方法使用函數(shù)來對單個符號塊特征作出估計,以確定其與樣本的近似程度,該函數(shù)把相似描述映射成成功度并用數(shù)值表示,采用生長點擴張法勾勒出圖象的局部輪廓,把線條單值化,由象素粘連角度判斷橫、豎、撇、捺和四種方向拐角的矢量特征;由象素投影面積得到筆畫的長度特征;由象素段的起點和終點得到相對位置特征。
局部擇優(yōu)匹配法是廣度優(yōu)先匹配法的一種改進,同時也是一種層次遞進的快速匹配方法。該方法在特征匹配策略中引入了層次結構,使匹配過程的相似函數(shù)E(x)反映下層次信息,當上層特征不足以判斷時,選取最有希望逼近目標樣本的方向,逐級沿縱向深度進行細節(jié)匹配,以便加快匹配過程,提高匹配效率。
本發(fā)明的優(yōu)點是針對性強、匹配信息量大,配合圖形掃描儀或攝象機用于防偽稅控發(fā)票符號,現(xiàn)金支票符號,汽車牌照符號的識別等,具有識別率高,識別時間短的特點。
下面結合實施例對本發(fā)明作進一步的詳述。
首先,對待識別對象的全部集合進行分析。分別找出標準樣版左上、右上、左下和右下四部分圖象的直線子特征橫、豎、撇、捺和拐角子特征左上勾、右上勾、左下勾、右下勾的數(shù)量、長度和相對位置,建立樣本記錄集。對于沒有明顯拐角的曲線,當成首尾相連的直線,由于在單字分辨率為24*16象素的樣本中,取四個象素為直線特征的最小描述,所以曲線被近似為長度為四的折線段。在特定系統(tǒng)中,例如字符集合只有“6”和“9”,那么只要記錄兩個字模子特征的數(shù)量就可以完成辯識,但當字符集是“6”和“8”,它們的子特征在數(shù)量上相同,就需要增加長度或位置辨析,特征為完整的數(shù)量、長度和位置信息。同時建立單從數(shù)量不能辨析的符號數(shù)量矩陣E,其中包含候選符號序列E(x)。再建立符號子特征權重表,記錄需要仔細辨析的各個符號的細節(jié)權重。在匹配時權重值表現(xiàn)了該細節(jié)相對于其他細節(jié)的重要性。本方法是辨析信息不定長的彈性匹配,這也是符合整體信息快速匹配,容易混淆的符號再用細節(jié)區(qū)分的效率原則。
待識別對象的預處理,按實現(xiàn)順序包括傾斜矯正、去干擾、定位、單符號切割和尺寸換算。傾斜矯正是根據(jù)圖象中的明顯水平線或垂直線如表格外框的傾斜角度為基準,把圖象逆向旋轉該基準角度實現(xiàn)的。先在圖象中長水平或長垂直線的可能位置用相臨點延伸的方法找到直線,用直線上兩點坐標求出傾斜角度a,取圖象左上角0點為初試旋轉原點,然后每個象素k(i,j)在X,Y方向上分別平移O_k(i,j)*Sin(a)*tg(a)和-O_k(i,j)sin(a),其中O_k(i,j)為k(i,j)到O點的直線距離,為
,得到矯正后的圖象。
干擾包括網(wǎng)格、離散點、粘連點和成片污跡。本方法先用檢測相臨點,并在有象素的方向上遞歸,找到長直線,并記錄與該直線相交的所有線段的交點坐標。刪去該直線除交點外的所有點,實現(xiàn)去除網(wǎng)格。在這個步驟中,記錄了圖象所有點的粘連象素數(shù)和該粘連群與其他粘連群的最小距離,判斷粘連數(shù)不大并且距離過大的粘連群為孤立群,即離散點。附著在符號上粘連點,超出符號大小邊界的,在符號分割時切除,粘連的小塊象素,在對子特征的大小,方向判斷時,對識別結果幾乎沒有影響。孤立的成片污跡,根據(jù)粘連數(shù)過大的特征實現(xiàn)剔除。覆蓋在符號上的大片污跡,將對符號塊定位和符號切割產(chǎn)生影響。對策是利用污跡邊界非直線而符號塊的邊界特性尖銳的特征,對符號塊的上、下、左和右同時尋找有效邊界,只要有一個邊界有效,就可以根據(jù)已知的符號塊大小切割出整個符號塊。如果四個邊界都被污跡覆蓋,意味著這個符號塊已經(jīng)被整塊污損,已經(jīng)失去識別價值。
單符號切割的實現(xiàn)是根據(jù)已知符號塊中符號的行數(shù)和列數(shù)并且符號塊中符號大小一致,間隔相等的原理,根據(jù)符號塊邊界進行分割。為了適用于識別對象大小不一的場合,需要對待識別對象的尺寸進行標準換算。先得到符號與標準模板的比例,在進行子特征長度和相對位置匹配時,再進行相應補償。
最后,對每個分割出來的單符號進行線段單值化。這樣可以減小圖象對比度和識別對象油墨濃淡的影響。先對單符號的左上、右上、左下和右下四塊圖象區(qū)域逐點掃描,讓象素在單方向生長,記錄粘連象素的坐標,再分別于水平方向和豎直方向找出線條邊界,生成單值化點的坐標((X1+X2)/2,(Y1+Y2)/2)。然后記錄出直線子特征橫、豎、撇、捺和拐角子特征左上勾、右上勾、左下勾、右下勾的數(shù)量、相對換算長度和起點終點的相對換算坐標并與標準符號的相應子特征進行比較。在實現(xiàn)時遵守先從數(shù)量信息進行辨別,當數(shù)量特征符合“不能從數(shù)量匹配矩陣”E時,再對該數(shù)量匹配符號的E(X)候補序列中的每一個符號進行長度和位置細節(jié)匹配。具體的實現(xiàn)是把識別對象和模板的每一個相應子特征的折合坐標兩兩相減,取距離最小的兩個配成子特征對,再把每對子特征的折合長度兩兩相減,乘以權重,得到子特征的“不相似度”。取所有子特征“不相似度”之和為最小的符號為識別結果。并根據(jù)“不相似度”的大小得到該符號識別“確信”“可疑”和“失敗”的信息。
關于本方法在劃分左上、右上、左下和右下四塊圖象時的邊界問題處理。例如“1”,可能這個豎被劃分為左上和左下,也可能被劃到左下和右下。所以在建模時對于在劃分十字線旁邊的每一個特征的個數(shù)是兩邊都定為0.5個。再記錄這些邊界特征的個數(shù)n。在匹配時允許有n/2的個數(shù)偏差,但匹配成功的附加條件是偏差能在對應側正負配平。還以“1”為例,其豎線特征的個數(shù)在左上、右上、左下和右下四個區(qū)域分別都是0.5。在匹配是如果“1”偏左,那么待匹配對象的豎線特征的個數(shù)在左上、右上分別是1,在左下和右下兩個區(qū)域都為0。特征個數(shù)允許偏差為n/2=0.5,待測對象的四個區(qū)域豎線個數(shù)“1、1、0、0”與樣本的四個區(qū)域豎線個數(shù)“0.5、0.5、0.5、0.5”不超過偏差范圍,并且左右總數(shù)能配平,匹配成功。
權利要求
1.一種有限符號集的局部擇優(yōu)匹配法,其特征在于在符號數(shù)量有限的前提下對每個符號的左上、右上、左下和右下四塊圖象進行局部分析,分別找出直線子特征橫、豎、撇、捺和拐角子特征左上勾、右上勾、左下勾、右下勾的數(shù)量、位置和長度,與標準符號的相應子特征進行比較,其中數(shù)量作為主特征,位置和長度作為輔特征,當單從主特征可以把其中一個符號辨析出來時,該符號只做主特征辨析;兩個以上的符號主特征重合時,對這些符號加做位置和長度輔特征辨析;有限集合內兩個符號相似即其大部分特征相同時,針對不同的特征加強辨析權重,采用整體和局部最優(yōu)的方法按權重取相似度的方法搜索出最近似符號。
2.如權利要求1所述的有限符號集的局部擇優(yōu)匹配法,其特征在于所述的搜索的過程就是在樣本集空間中找出到最相似目標狀態(tài)的路徑集合,從樹根的一個初始狀態(tài)開始,構造一棵為可能解的動作序列樹,明顯不匹配的分支被忽略,然后找出與根結點匹配的所有分支,建立新的狀態(tài)結點,從而生成下一層樹,取上層樹生成的每一結點,再找出與其匹配的結點并又生成下一層樹,繼續(xù)此過程直至匹配目標狀態(tài)的構型生成為止,最后取加權重后相似度最高的樣本為最優(yōu)解。
3.如權利要求1所述的有限符號集的局部擇優(yōu)匹配法,其特征在于所述的采用整體和局部最優(yōu)的方法使用函數(shù)來對單個符號塊特征作出估計,以確定其與樣本的近似程度,該函數(shù)把相似描述映射成成功度并用數(shù)值表示,采用生長點擴張法勾勒出圖象的局部輪廓,把線條單值化,由象素粘連角度判斷橫、豎、撇、捺和四種方向拐角的矢量特征;由象素投影面積得到筆畫的長度特征;由象素段的起點和終點得到相對位置特征。
全文摘要
本發(fā)明公開了一種有限符號集的局部擇優(yōu)匹配法,在符號數(shù)量有限的前提下對每個符號的左上、右上、左下和右下四塊圖象進行局部分析,分別找出直線子特征橫、豎、撇、捺和拐角子特征左上勾、右上勾、左下勾、右下勾的數(shù)量、位置和長度,與標準符號的相應子特征進行比較。本發(fā)明的優(yōu)點是針對性強、匹配信息量大,配合圖形掃描儀或攝象機用于防偽稅控發(fā)票符號,現(xiàn)金支票符號、汽車牌照符號的識別等,具有識別率高,識別時間短的特點。
文檔編號G06K9/18GK1252585SQ9911719
公開日2000年5月10日 申請日期1999年11月8日 優(yōu)先權日1999年11月8日
發(fā)明者皮佑國, 胡道明, 吳效明 申請人:廣東省科學院自動化工程研制中心