專利名稱:可手寫的數(shù)字圖形編碼及其識別方法
數(shù)字,是人類使用最多的一種信息。許多民族都創(chuàng)造了數(shù)字符號,如阿拉伯數(shù)字0、1、2、3、4、5、6、7、8、9,中文一、二、三、四、五、六、七、八、九,中文壹、貳、叁、肆、伍、陸、柒、捌、玖等。數(shù)字符號的出現(xiàn),對人類社會進步起了極其重要的作用。
隨著社會的高速發(fā)展,尤其是有了電子計算機以后,原有的數(shù)字符號不能滿足人們的需要了。商業(yè)、物流、工業(yè)生產(chǎn)、辦公自動化……大量的數(shù)據(jù)需要及時處理,這就必須對數(shù)據(jù)進行自動采集和識別。阿拉伯數(shù)字容易書寫,可讀性好,是世界上使用最廣泛的數(shù)字符號,人們發(fā)明了多種光電字符閱讀機(OCR)識別它。然而由于手寫阿拉伯數(shù)字的不規(guī)范性及復雜性,加上干擾等影響,實施自動識別的成本高而識別率低,可靠性差,因而使得很多領(lǐng)域不能使用自動識別技術(shù)。條碼是為自動識別而發(fā)明的一種圖形碼,這種已經(jīng)公開的專利技術(shù),由于方法簡便,成本低,可靠性高,現(xiàn)在已被大量使用,獲得了極大的經(jīng)濟效益。不過條碼的應用也有其局限性。它只能使用在數(shù)字固定不變的場合,如商品的標簽。它必須由激光或噴墨印字機印制,而不能由人即時書寫。這使得它不能在大量隨機產(chǎn)生數(shù)據(jù)的場合使用,如各種財務報表等。由于條碼還有其不足之處,條碼是由寬窄不一,黑白相間的線條組成,對印刷質(zhì)量要求嚴格,污染和干擾容易影響其識別的正確率。加之它不直觀,可讀性差,這也進一步影響了它的使用范圍。
為了實現(xiàn)機器自動讀取數(shù)據(jù)的需要,能不能有一種數(shù)字符號,它即簡單,人人都可以手寫,而且又直觀、規(guī)范、可讀性好,并且抗干擾能力強,適宜于自動識別,有很高的可靠性呢?本發(fā)明正是為了滿足這些要求,創(chuàng)造了Guo-數(shù)字圖形編碼及其識別方法。
Guo-數(shù)字圖形編碼,簡稱Guo-數(shù)字符號,由骨架和筆畫二部分組成。骨架形如h,是Guo-數(shù)字符號的固定組成部分。它的左側(cè)是一垂直線段,由該線段的中點向右是一水平線段,水平線段的右端點向下是一垂直線段,長度等于左側(cè)垂直線段的一半。筆畫是一垂直線段。它的長度等于左側(cè)骨架垂直線段的一半,或者與左側(cè)骨架垂直線段相等。h型骨架決定了字符的大小,其中水平線段將字符圖形分為上區(qū)和下區(qū)兩部分,若把兩條垂線間的距離分為四等分,在水平線段上得到三個等分點,從垂直線段長的一邊到垂直線段短的一邊依次為D1、D2、D3點,以D1、D2、D3點為中,將兩垂線間分為3個區(qū)域。點D1、D2、D3上面和下面的6個區(qū)域是筆畫的特定區(qū)域。Guo-數(shù)字符號的骨架和3個區(qū)域如圖1所示。
Guo-數(shù)字圖形編碼是按如下方法進行編碼的。1-9的9個字符都由一個垂直筆畫和骨架組成,其中D1、D2、D3的上面區(qū)域有筆畫分別為數(shù)字1、2、3的圖形編碼,D1、D2、D3的下面區(qū)域有筆畫分別為數(shù)字4、5、6的圖形編碼,D1、D2、D3區(qū)有貫穿上下區(qū)域的筆畫分別為數(shù)字7、8、9的圖形編碼,只有骨架而無筆畫是數(shù)字0的圖形編碼。0-9的數(shù)字圖形編碼如圖2所示。
從圖2可以看出,本發(fā)明Guo-數(shù)字圖形編碼的一個顯著特點是直觀、規(guī)范、可讀性好,人人都可以書寫。除0以外,每個數(shù)字都只有一個筆畫,按照″先上后下,從左到右″的規(guī)則,依次為數(shù)字1、2、3、4、5、6、7、8、9,即使一個不會寫甚至不認識阿拉伯數(shù)字的人,也很容易學會識別Guo-數(shù)字符號,并能書寫它,因為它們簡單到只需畫一直筆。
本發(fā)明Guo-數(shù)字符號的另一個顯著特點是容易自動識別,抗干擾能力強,有很高的可靠性,機器自動識別可以達到100%的正確率。一般供機器自動讀取的Guo-數(shù)字符號的骨架由印字機印出。為了進一步增加可靠性,可以采取把書寫筆畫的地方用光電閱讀機不能感知的其它顏色印刷,或者在應該書寫筆畫的外端加印標志點,這樣書寫時會更加規(guī)范。圖3是印有筆畫標志點及手寫的0-9Guo-數(shù)字符號。對書寫的要求不高,筆畫粗細不限,允許用斜筆,只要不出其所在的區(qū)域即可。Guo-數(shù)字符號只所以抗干擾能力強,是因為它與筆畫的粗細無關(guān),在它的上下半?yún)^(qū)都最多只能有一筆。如果有干擾點,只要干擾點的面積大小不超過筆畫的面積,識別就不會發(fā)生錯誤。Guo-數(shù)字符號的識別很簡單,識別時首先根據(jù)h型骨架計算各區(qū)域,然后逐個區(qū)域判定有無筆畫存在,只要確定了筆畫的位置,數(shù)字即可得到確認。Guo-數(shù)字符號的識別框圖如圖4所示。
Guo-數(shù)字符號的另一個顯著特點是它不僅有上面所說的抗干擾能力,而且即使將符號旋轉(zhuǎn)一個任意角度,甚至以鏡象出現(xiàn),也能獲得正確的識別。這是因為h型骨架具有定向作用,識別時可以先找到骨架,旋轉(zhuǎn)使它成為垂直,然后從骨架垂線長的一側(cè)向短的一側(cè)分D1、D2、D3區(qū),上下區(qū)的確定是根據(jù)兩側(cè)的垂線,上區(qū)只有一側(cè)有垂線,而下區(qū)的兩側(cè)都有垂線,顯然,識別可以絕對正確。
上面介紹的Guo-數(shù)字符號筆畫是垂直的,我們把它稱為垂直型Guo-數(shù)字符號。由于各民族書寫習慣的不同,或應用環(huán)境的不同,Guo-數(shù)字符號也可以使用水平筆畫,為此設計了水平型Guo-數(shù)字符號。水平型0-9的數(shù)字圖形編碼如圖5所示。實際上,它是由垂直型Guo-數(shù)字符號的鏡象再旋轉(zhuǎn)一個角度后得到的。
有些時候,并不需要用到0-9的全部數(shù)字符號。這時可以使用以下簡易的Guo-數(shù)字符號,使得編碼圖形更簡單,自動識別更快速。將h型骨架兩垂線間作為一個區(qū)域或分為二個區(qū)域,按照上面所述相同的編碼方法,可以組成0-3共4個數(shù)字,或0-6共7個數(shù)字的圖形編碼。分別稱為簡易4數(shù)字Guo-數(shù)字符號和簡易7數(shù)字Guo-數(shù)字符號。這些簡易Guo-數(shù)字圖形編碼如圖6所示。某些從幾種事件中選擇其一的統(tǒng)計報表常會用到這種簡易的Guo-數(shù)字符號,如考卷中的單選題等。
如下圖1是本發(fā)明Guo-數(shù)字圖形編碼的骨架和3個筆畫區(qū)域。
圖2是本發(fā)明0-9數(shù)字的圖形編碼。
圖3是本發(fā)明印有筆畫標志點及手寫的0-9Guo-數(shù)字符號。
圖4是本發(fā)明Guo-數(shù)字符號的識別框圖。
圖5是本發(fā)明水平型0-9數(shù)字的圖形編碼。
圖6是本發(fā)明簡易4數(shù)字和7數(shù)字Guo-數(shù)字圖形編碼。
下面是本發(fā)明的一個實施例。這是一個財務自動核查系統(tǒng)。財務表中有用Guo-數(shù)字符號逐項填寫的單項金額,同時在表格的最下一欄有用Guo-數(shù)字符號填寫的總金額。自動核查系統(tǒng)通過掃描獲取圖象,圖象經(jīng)過處理、切分后得到每個數(shù)據(jù)的一組Guo-數(shù)字符號圖象,然后利用上述的識別方法識別每一個Guo-數(shù)字符號,得到一個個單項數(shù)據(jù)。系統(tǒng)累加單項金額數(shù)據(jù),并與表中的總金額數(shù)據(jù)進行對比,如果相同則通過,如果發(fā)現(xiàn)不相同,則說明該報表有問題。所有這一切都是自動進行的。該系統(tǒng)速度快,可靠性高,可排除人工輸入時精神不集中造成的差錯,大大降低腦力勞動強度。
權(quán)利要求
1.一種數(shù)字圖形編碼及其自動識別方法,其特征在于數(shù)字圖形編碼是由骨架和在骨架特定位置上的一個筆畫組成,自動識別時只要判別出筆畫及其位置,即可得到其數(shù)字。
2.根據(jù)權(quán)利要求1所述的骨架,其特征在于該數(shù)字圖形編碼有一個形如h的固定組成部分,其左側(cè)是一垂直線段,由該線段的中點向右是一水平線段,水平線段的右端點向下是一垂直線段,長度等于左側(cè)垂直線段的一半。
3.根據(jù)權(quán)利要求1所述的骨架的特定位置,其特征是指h型骨架的水平線段將編碼圖形分為上區(qū)和下區(qū)兩部分,若把兩條垂線間的距離分為四等分,在水平線段上得到三個等分點,從垂直線段長的一邊到垂直線段短的一邊依次為D1、D2、D3點,以D1、D2、D3點為中,將兩垂線間分為3個區(qū)域,點D1、D2、D3上面和下面的6個區(qū)域便是骨架的特定位置。
4.根據(jù)權(quán)利要求1所述的筆畫,其特征是指權(quán)利要求3中D1、D2、D3區(qū)域中的線段,它的長度等于左側(cè)骨架垂直線段的一半,或者與左側(cè)骨架垂直線段相等,筆畫的寬度只要不超過各自區(qū)域的邊界,不加其他限制。
5.根據(jù)權(quán)利要求1所述的數(shù)字圖形編碼是由骨架和在骨架特定位置上的一個筆畫組成,其特征在于是按照″先上后下,從左到右″的規(guī)則,由骨架和D1上面區(qū)域中的筆畫組成數(shù)字1的圖形編碼,依次,骨架和D2、D3上面區(qū)域中的筆畫分別組成數(shù)字2和3的圖形編碼,骨架和D1、D2、D3下面區(qū)域中的筆畫分別組成數(shù)字4、5和6的圖形編碼,骨架和貫穿D1、D2、D3上下區(qū)域中的筆畫分別組成數(shù)字7、8和9的圖形編碼,這時,其它的區(qū)域無筆畫,1-9每個數(shù)字的圖形編碼只有一個筆畫,只有骨架而無筆畫是數(shù)字0的圖形編碼。
6.根據(jù)權(quán)利要求1所述的判別出筆畫及其位置,即可得到其數(shù)字,其特征在于自動識別時,先按權(quán)利要求3中所述的方法確定h型骨架的6個區(qū)域,然后逐個區(qū)域判定有無筆畫,筆畫的位置確定后,即可判別出數(shù)字。
7.根據(jù)權(quán)利要求1所述的數(shù)字圖形編碼是由骨架和在骨架特定位置上的一個筆畫組成,其特征在于將權(quán)利要求2、3、4、5所述方法得到的數(shù)字圖形編碼旋轉(zhuǎn)任意一個角度,或者是其鏡象,它仍然屬于本發(fā)明的數(shù)字圖形編碼。
8.根據(jù)權(quán)利要求1所述的數(shù)字圖形編碼是由骨架和在骨架特定位置上的一個筆畫組成,其特征在于將h型骨架兩垂線間作為一個區(qū)域或分為二個區(qū)域,按照權(quán)利要求5所述規(guī)則,分別組成0-3共4個數(shù)字或0-6共7個數(shù)字的簡易圖形編碼。
全文摘要
本發(fā)明是一種數(shù)字圖形編碼,稱為Guo-數(shù)字符號,及其自動識別方法。Guo-數(shù)字符號書寫簡便,每個數(shù)字符號只需在其骨架的特定位置上畫一筆。它解決了條碼不直觀,可讀性差,不能人工書寫,必須印刷的問題,而是既直觀,又可讀性好,人人都可以書寫。它解決了手寫阿拉伯數(shù)字符號雖直觀,但機器自動識別正確率低,可靠性差的問題,而是算法簡單,識別時可以達到100%的正確率。這就為社會提供了一種人人都能使用,方法簡便,成本低廉,可靠性高,適宜于自動輸入的獨特的數(shù)字符號及識別方法。它可以廣泛地應用于票據(jù)處理、商業(yè)、物流、工業(yè)生產(chǎn)、辦公自動化等領(lǐng)域。
文檔編號G06F3/023GK1172981SQ9711258
公開日1998年2月11日 申請日期1997年6月27日 優(yōu)先權(quán)日1997年6月27日
發(fā)明者郭熙凡 申請人:郭熙凡