專利名稱:識別七筆段手寫數(shù)字的非點陣方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種機器識別阿拉伯數(shù)字字符的方法。特別是一種識別基于七筆劃的手寫或其它方式產(chǎn)生的阿拉伯數(shù)字字符的方法。
現(xiàn)有的機器識別手寫阿拉伯數(shù)字的方法種類較多。最常見的是點陣掃描特征抽取法。由于手寫阿拉伯數(shù)字的隨意性很大,給機器識別帶來很大困難。并且,這類方法的識別開銷也較大。因而,人們提出了各種各樣的受限制的手寫字符的識別問題。
《圖象識別與自動化》90年2期“七段碼有限制手寫體數(shù)字的識別”一文,提出了識別基于七筆劃手寫體數(shù)字字符的方法。除掉濾除燥聲等予處理手段外,該法大體上仍是由點陣掃描、抽取點陣的特征、按統(tǒng)計模式識別與按結(jié)構(gòu)模式識別相結(jié)合的一種方式識別判斷等幾個步驟來識別字符的。因而仍然有一個方法復雜、識別代價大的缺點。
在不使用點陣掃描方式識別阿拉伯數(shù)字的方法中,比較成熟的是已進入實用階段的OCR法。該方法的識別對象為“ISO1073/1-1976”中規(guī)定的字符集。其具體實現(xiàn)是通過掃描字符,將一個字符的掃描區(qū)從垂直方向一分為二,從水平方向等分成五份,形成十個掃描部位。分別檢測這十個部位的邏輯值(是否有筆劃),從而識別字符的。識別率較高,開銷也較低。但是這種方法識別對象的形狀要素要求嚴格,而且很不符合人們的書寫習慣。就是其中的阿拉伯數(shù)字要手工書寫,形成推廣的局面是很困難的。
本發(fā)明的目的是要提供一種方法。它能以較低的識別開銷,較高的識別率識別七筆劃阿拉伯數(shù)字。識別對象的集合為“零”至“玖”十個字符以及小數(shù)點、負號等字符。根據(jù)需要,其識別對象還可以增加。比如空格,抹字符等。
本發(fā)明是這樣實現(xiàn)的在七筆劃字符的下部水平方向設(shè)置2個輔助掃描標識(6),(7)。識別字符的器件的掃描束,在保證水平方向定位的前提下,以一定速度從左到右掃過整個字符及字符外部的輔助掃描標識??梢愿鶕?jù)字符外形尺寸、掃描器件具體構(gòu)成等,進行設(shè)計,使整個字符掃描區(qū)水平地割分出4個彼此平行,相互獨立的掃描道(1),(2),(3),(4),以及一個輔助標識掃描道(5)。在外部輔助掃描標識(6),(7)的作用下,掃描一個字符,實際上是分成三個連續(xù)的掃描階段完成的。而每個階段都檢測這4個掃描道(1),(2),(3),(4)掃過的信息。
下面結(jié)合附圖
進一步說明。
設(shè)立一個2位的輔助存貯器(8)及一個5位的筆劃信息存貯器(9)。還設(shè)立一個2位的掃描階段計數(shù)器。
在掃描束掃到(6)之前,為初始階段。這時(8),(9)均置為初值(全為二進制0)。而且掃描階段計數(shù)器的值為2進制“00”。
(6)有三個作用。首先它表示對該字符的掃描開始,其次,有一個屏蔽及選通作用。即通過對控制線路的設(shè)計,使掃描束掃過它時,對(1),(3)的掃描信息作屏蔽,而對(2),(4)的掃描信息作選通,并將其送入(9)的第1,第2位之中。(6)的寬度可以控制信息采集的幾何范圍。從某種意義上說,對于筆劃的粗細,傾斜等誤差因素,起到一個控制作用。在整個第一階段掃描過程中階段計數(shù)器的值為“01”。
在掃完(6),而(7)未掃到的第二階段??刂凭€路對(1),(2),(3),(4),的掃描信息均作選通處理。將(1),(3)的采集信息送入(9)的第3,第4位。并將(2),(4)采集信息送入(8)中,以判別本字符是否被抹掉。(1)、(3)的寬度,(6)、(7)之間的距離,決定了信息采取的幾何范圍,起到誤差控制作用。在本階段掃描過程中階段計數(shù)器的值為“10”。
(7)的作用與(6)基本上相同。這個階段表示字符掃描將結(jié)束。在這個階段,控制線路僅選通(2),并將采集到的信息送入(9)的第5位。而對(1),(3),(4)不作理會。在本階段;階段計數(shù)器的值為“11”。本階段僅選通(2),是因為識別我們前面述及的字符集只需取5個筆段信息即已足夠。這可以從全部字符集的五筆劃邏輯真值表中看出。
掃描束一旦掃完(7),表示一個字符的掃描結(jié)束。這時觸發(fā)控制線路對前三個階段采集到的貯存在(9)中的信息,通過識別線路作出識別判斷。并在輸出端產(chǎn)生數(shù)字字符的二進制編碼值或者給出一個字符已抹除的信息。此時階段計數(shù)器的值又變?yōu)槎M制“00”了。它為識別下一個字符作出了準備。
本方法的輔助掃描標識起到重要的作用。它們不但可設(shè)在字符的下部,也可以設(shè)在上部,還可以上、下部同時設(shè)置。甚至還可以與字符形成某種“疊加”。如果能夠嚴格控制掃描速度為勻速,也可以取消標識,而用內(nèi)部的電子器件產(chǎn)生同步的讀取控制信號,同樣也可以采用本方法原理。標識的個數(shù)也不一定是每個方向2個,可以更多。只要能形成三段掃描。
本方法只需作一點工作也可以實現(xiàn)從右到左的掃描。
可以看出,本方法檢測字符信息是基于筆劃邏輯的。不存在點陣掃描法中的燥聲濾除,抽取特征,樣本核對等復雜的處理過程。因而識別率高,識別開銷很小。且配套的譯碼及其它控制線路邏輯上特別簡單。初期投資也很小。
隨著數(shù)顯電子鐘表等各種采用七筆劃字符的顯示設(shè)備的普及,本方法所識別的七筆劃阿拉伯數(shù)字在世界上具有很廣的普及性,已被大家普遍接受。事實上,中央電視臺的報時也采用七筆劃數(shù)字。足見其普遍程度。七筆劃數(shù)字的筆劃都是橫平豎直,在一定的輔助約束及示范樣本的幫助下,手工書寫毫不困難,并且比較規(guī)范。因而引起誤識別或無法識別的概率很低。
當然,由于本方法的特點所致,其適應(yīng)性受到一定限制。首先,針對一種尺寸的識別對象的識別器件,一般不能識別其它尺寸的字符。其次,輔助掃描標識及字符書寫約束框要事先制好,且要有一定的相對幾何尺寸及絕對幾何精度的要求。
郵電部郵政總局早已在全國推行郵政編碼,其目的就是為了能夠采用機器識別郵碼,進而實現(xiàn)郵件的自動分揀處理。但由于郵政的社會廣泛性,郵碼書寫的極不規(guī)范等種種原因。目前機器識別一直無法進入實用階段。本發(fā)明可以用于郵碼的機器識別。
如附圖2,可以在信封的固定位置,事先印刷好基于七筆劃字段的書寫約束框,并在框外水平方向印刷好輔助掃描標識。用戶使用信封時,只需按七筆劃字段方式將郵碼寫上去即可。
郵局掃描郵碼時,可以利用信封的上部水平邊緣定現(xiàn)水平掃描定位。進而按本發(fā)明所提出的方法識別出郵碼來??紤]到郵政信封的尺寸及上面印刷的各種圖形的位置及相互關(guān)系,可以由國家標準加以確定。因而推廣也是不困難的。光掃描器件可根據(jù)實際情況加以選擇。如光電二極管或CCD元件等。
本方法還可以用到郵電系統(tǒng)的電話撥號的改進方面。可以為撥號電話機動加接一個讀出設(shè)備及相應(yīng)的接口線路。打電話時,用戶只需將掃描裝置在自己的電話號碼本的號碼部位或電子電話號碼存貯卡的顯字屏上一劃,即可實現(xiàn)自動撥號。當然,這種電話號碼本,也必須依本發(fā)明提出的方法按照掃描裝置的尺寸,事先印刷好書寫約束及輔助掃描標識。而電子電話號碼存貯卡的顯示屏也應(yīng)加上輔助的掃描標識。
權(quán)利要求
1.一種識別受限制的基于七筆段的手寫的或其它規(guī)范方法產(chǎn)生的阿拉伯數(shù)字字符的方法。其特征是a).通過(1)、(2)、(3)、(4)共四個水平掃描道,從左到右掃描字符的一部分。b).通過字符以外的帶有控制作用的輔助掃描標識,使整個掃描過程形成三個掃描階段。c).識別字符是掃描字符的筆段存在與否來實現(xiàn)的。
2.根據(jù)權(quán)利要求1所述的方法,其特征是通過(1)、(2)、(3)、(4)共四個水平掃描道,從右到左掃描字符的一部分。
3.根據(jù)權(quán)利要求1所述的方法,其特征是字符的上部、下部或上下部同時設(shè)有帶控制作用的輔助掃描標識。
4.根據(jù)權(quán)利要求1或3所述的方法,其特征是每方設(shè)有2個輔助掃描標識。
5.根據(jù)權(quán)利要求4所述的方法,其特征是每方設(shè)有2個以上的輔助掃描標識。
全文摘要
本發(fā)明提出了一種識別手寫的七筆段阿拉伯數(shù)字的方法,其特征是在字符的水平方向設(shè)立四個平行掃描道,另外同時設(shè)立輔助掃描標識,掃描束沿掃描道掃描字符時,也掃到輔助標識,在輔助標識的作用下,一個掃描字符的過程形成三個連續(xù)的階段,通過各個階段對筆段信息的選通或屏蔽,可以識別一個七筆段數(shù)字。
文檔編號G06K9/00GK1064959SQ92108089
公開日1992年9月30日 申請日期1992年4月10日 優(yōu)先權(quán)日1992年4月10日
發(fā)明者戴二蓉 申請人:戴二蓉