可手寫的數(shù)字圖形編碼及其識別方法

文檔序號：6412083閱讀：1163來源：國知局

專利名稱：可手寫的數(shù)字圖形編碼及其識別方法
數(shù)字，是人類使用最多的一種信息。許多民族都創(chuàng)造了數(shù)字符號，如阿拉伯數(shù)字0、1、2、3、4、5、6、7、8、9，中文一、二、三、四、五、六、七、八、九，中文壹、貳、叁、肆、伍、陸、柒、捌、玖等。數(shù)字符號的出現(xiàn)，對人類社會進步起了極其重要的作用。
隨著社會的高速發(fā)展，尤其是有了電子計算機以后，原有的數(shù)字符號不能滿足人們的需要了。商業(yè)、物流、工業(yè)生產(chǎn)、辦公自動化……大量的數(shù)據(jù)需要及時處理，這就必須對數(shù)據(jù)進行自動采集和識別。阿拉伯數(shù)字容易書寫，可讀性好，是世界上使用最廣泛的數(shù)字符號，人們發(fā)明了多種光電字符閱讀機(OCR)識別它。然而由于手寫阿拉伯數(shù)字的不規(guī)范性及復雜性，加上干擾等影響，實施自動識別的成本高而識別率低，可靠性差，因而使得很多領(lǐng)域不能使用自動識別技術(shù)。條碼是為自動識別而發(fā)明的一種圖形碼，這種已經(jīng)公開的專利技術(shù)，由于方法簡便，成本低，可靠性高，現(xiàn)在已被大量使用，獲得了極大的經(jīng)濟效益。不過條碼的應用也有其局限性。它只能使用在數(shù)字固定不變的場合，如商品的標簽。它必須由激光或噴墨印字機印制，而不能由人即時書寫。這使得它不能在大量隨機產(chǎn)生數(shù)據(jù)的場合使用，如各種財務報表等。由于條碼還有其不足之處，條碼是由寬窄不一，黑白相間的線條組成，對印刷質(zhì)量要求嚴格，污染和干擾容易影響其識別的正確率。加之它不直觀，可讀性差，這也進一步影響了它的使用范圍。
為了實現(xiàn)機器自動讀取數(shù)據(jù)的需要，能不能有一種數(shù)字符號，它即簡單，人人都可以手寫，而且又直觀、規(guī)范、可讀性好，并且抗干擾能力強，適宜于自動識別，有很高的可靠性呢？本發(fā)明正是為了滿足這些要求，創(chuàng)造了Guo-數(shù)字圖形編碼及其識別方法。
Guo-數(shù)字圖形編碼，簡稱Guo-數(shù)字符號，由骨架和筆畫二部分組成。骨架形如h，是Guo-數(shù)字符號的固定組成部分。它的左側(cè)是一垂直線段，由該線段的中點向右是一水平線段，水平線段的右端點向下是一垂直線段，長度等于左側(cè)垂直線段的一半。筆畫是一垂直線段。它的長度等于左側(cè)骨架垂直線段的一半，或者與左側(cè)骨架垂直線段相等。h型骨架決定了字符的大小，其中水平線段將字符圖形分為上區(qū)和下區(qū)兩部分，若把兩條垂線間的距離分為四等分，在水平線段上得到三個等分點，從垂直線段長的一邊到垂直線段短的一邊依次為D1、D2、D3點，以D1、D2、D3點為中，將兩垂線間分為3個區(qū)域。點D1、D2、D3上面和下面的6個區(qū)域是筆畫的特定區(qū)域。Guo-數(shù)字符號的骨架和3個區(qū)域如圖1所示。
Guo-數(shù)字圖形編碼是按如下方法進行編碼的。1-9的9個字符都由一個垂直筆畫和骨架組成，其中D1、D2、D3的上面區(qū)域有筆畫分別為數(shù)字1、2、3的圖形編碼，D1、D2、D3的下面區(qū)域有筆畫分別為數(shù)字4、5、6的圖形編碼，D1、D2、D3區(qū)有貫穿上下區(qū)域的筆畫分別為數(shù)字7、8、9的圖形編碼，只有骨架而無筆畫是數(shù)字0的圖形編碼。0-9的數(shù)字圖形編碼如圖2所示。
從圖2可以看出，本發(fā)明Guo-數(shù)字圖形編碼的一個顯著特點是直觀、規(guī)范、可讀性好，人人都可以書寫。除0以外，每個數(shù)字都只有一個筆畫，按照″先上后下，從左到右″的規(guī)則，依次為數(shù)字1、2、3、4、5、6、7、8、9，即使一個不會寫甚至不認識阿拉伯數(shù)字的人，也很容易學會識別Guo-數(shù)字符號，并能書寫它，因為它們簡單到只需畫一直筆。
本發(fā)明Guo-數(shù)字符號的另一個顯著特點是容易自動識別，抗干擾能力強，有很高的可靠性，機器自動識別可以達到100％的正確率。一般供機器自動讀取的Guo-數(shù)字符號的骨架由印字機印出。為了進一步增加可靠性，可以采取把書寫筆畫的地方用光電閱讀機不能感知的其它顏色印刷，或者在應該書寫筆畫的外端加印標志點，這樣書寫時會更加規(guī)范。圖3是印有筆畫標志點及手寫的0-9Guo-數(shù)字符號。對書寫的要求不高，筆畫粗細不限，允許用斜筆，只要不出其所在的區(qū)域即可。Guo-數(shù)字符號只所以抗干擾能力強，是因為它與筆畫的粗細無關(guān)，在它的上下半?yún)^(qū)都最多只能有一筆。如果有干擾點，只要干擾點的面積大小不超過筆畫的面積，識別就不會發(fā)生錯誤。Guo-數(shù)字符號的識別很簡單，識別時首先根據(jù)h型骨架計算各區(qū)域，然后逐個區(qū)域判定有無筆畫存在，只要確定了筆畫的位置，數(shù)字即可得到確認。Guo-數(shù)字符號的識別框圖如圖4所示。
Guo-數(shù)字符號的另一個顯著特點是它不僅有上面所說的抗干擾能力，而且即使將符號旋轉(zhuǎn)一個任意角度，甚至以鏡象出現(xiàn)，也能獲得正確的識別。這是因為h型骨架具有定向作用，識別時可以先找到骨架，旋轉(zhuǎn)使它成為垂直，然后從骨架垂線長的一側(cè)向短的一側(cè)分D1、D2、D3區(qū)，上下區(qū)的確定是根據(jù)兩側(cè)的垂線，上區(qū)只有一側(cè)有垂線，而下區(qū)的兩側(cè)都有垂線，顯然，識別可以絕對正確。
上面介紹的Guo-數(shù)字符號筆畫是垂直的，我們把它稱為垂直型Guo-數(shù)字符號。由于各民族書寫習慣的不同，或應用環(huán)境的不同，Guo-數(shù)字符號也可以使用水平筆畫，為此設計了水平型Guo-數(shù)字符號。水平型0-9的數(shù)字圖形編碼如圖5所示。實際上，它是由垂直型Guo-數(shù)字符號的鏡象再旋轉(zhuǎn)一個角度后得到的。
有些時候，并不需要用到0-9的全部數(shù)字符號。這時可以使用以下簡易的Guo-數(shù)字符號，使得編碼圖形更簡單，自動識別更快速。將h型骨架兩垂線間作為一個區(qū)域或分為二個區(qū)域，按照上面所述相同的編碼方法，可以組成0-3共4個數(shù)字，或0-6共7個數(shù)字的圖形編碼。分別稱為簡易4數(shù)字Guo-數(shù)字符號和簡易7數(shù)字Guo-數(shù)字符號。這些簡易Guo-數(shù)字圖形編碼如圖6所示。某些從幾種事件中選擇其一的統(tǒng)計報表常會用到這種簡易的Guo-數(shù)字符號，如考卷中的單選題等。

如下圖1是本發(fā)明Guo-數(shù)字圖形編碼的骨架和3個筆畫區(qū)域。
圖2是本發(fā)明0-9數(shù)字的圖形編碼。
圖3是本發(fā)明印有筆畫標志點及手寫的0-9Guo-數(shù)字符號。
圖4是本發(fā)明Guo-數(shù)字符號的識別框圖。
圖5是本發(fā)明水平型0-9數(shù)字的圖形編碼。
圖6是本發(fā)明簡易4數(shù)字和7數(shù)字Guo-數(shù)字圖形編碼。
下面是本發(fā)明的一個實施例。這是一個財務自動核查系統(tǒng)。財務表中有用Guo-數(shù)字符號逐項填寫的單項金額，同時在表格的最下一欄有用Guo-數(shù)字符號填寫的總金額。自動核查系統(tǒng)通過掃描獲取圖象，圖象經(jīng)過處理、切分后得到每個數(shù)據(jù)的一組Guo-數(shù)字符號圖象，然后利用上述的識別方法識別每一個Guo-數(shù)字符號，得到一個個單項數(shù)據(jù)。系統(tǒng)累加單項金額數(shù)據(jù)，并與表中的總金額數(shù)據(jù)進行對比，如果相同則通過，如果發(fā)現(xiàn)不相同，則說明該報表有問題。所有這一切都是自動進行的。該系統(tǒng)速度快，可靠性高，可排除人工輸入時精神不集中造成的差錯，大大降低腦力勞動強度。
權(quán)利要求
1.一種數(shù)字圖形編碼及其自動識別方法，其特征在于數(shù)字圖形編碼是由骨架和在骨架特定位置上的一個筆畫組成，自動識別時只要判別出筆畫及其位置，即可得到其數(shù)字。
2.根據(jù)權(quán)利要求1所述的骨架，其特征在于該數(shù)字圖形編碼有一個形如h的固定組成部分，其左側(cè)是一垂直線段，由該線段的中點向右是一水平線段，水平線段的右端點向下是一垂直線段，長度等于左側(cè)垂直線段的一半。
3.根據(jù)權(quán)利要求1所述的骨架的特定位置，其特征是指h型骨架的水平線段將編碼圖形分為上區(qū)和下區(qū)兩部分，若把兩條垂線間的距離分為四等分，在水平線段上得到三個等分點，從垂直線段長的一邊到垂直線段短的一邊依次為D1、D2、D3點，以D1、D2、D3點為中，將兩垂線間分為3個區(qū)域，點D1、D2、D3上面和下面的6個區(qū)域便是骨架的特定位置。
4.根據(jù)權(quán)利要求1所述的筆畫，其特征是指權(quán)利要求3中D1、D2、D3區(qū)域中的線段，它的長度等于左側(cè)骨架垂直線段的一半，或者與左側(cè)骨架垂直線段相等，筆畫的寬度只要不超過各自區(qū)域的邊界，不加其他限制。
5.根據(jù)權(quán)利要求1所述的數(shù)字圖形編碼是由骨架和在骨架特定位置上的一個筆畫組成，其特征在于是按照″先上后下，從左到右″的規(guī)則，由骨架和D1上面區(qū)域中的筆畫組成數(shù)字1的圖形編碼，依次，骨架和D2、D3上面區(qū)域中的筆畫分別組成數(shù)字2和3的圖形編碼，骨架和D1、D2、D3下面區(qū)域中的筆畫分別組成數(shù)字4、5和6的圖形編碼，骨架和貫穿D1、D2、D3上下區(qū)域中的筆畫分別組成數(shù)字7、8和9的圖形編碼，這時，其它的區(qū)域無筆畫，1-9每個數(shù)字的圖形編碼只有一個筆畫，只有骨架而無筆畫是數(shù)字0的圖形編碼。
6.根據(jù)權(quán)利要求1所述的判別出筆畫及其位置，即可得到其數(shù)字，其特征在于自動識別時，先按權(quán)利要求3中所述的方法確定h型骨架的6個區(qū)域，然后逐個區(qū)域判定有無筆畫，筆畫的位置確定后，即可判別出數(shù)字。
7.根據(jù)權(quán)利要求1所述的數(shù)字圖形編碼是由骨架和在骨架特定位置上的一個筆畫組成，其特征在于將權(quán)利要求2、3、4、5所述方法得到的數(shù)字圖形編碼旋轉(zhuǎn)任意一個角度，或者是其鏡象，它仍然屬于本發(fā)明的數(shù)字圖形編碼。
8.根據(jù)權(quán)利要求1所述的數(shù)字圖形編碼是由骨架和在骨架特定位置上的一個筆畫組成，其特征在于將h型骨架兩垂線間作為一個區(qū)域或分為二個區(qū)域，按照權(quán)利要求5所述規(guī)則，分別組成0-3共4個數(shù)字或0-6共7個數(shù)字的簡易圖形編碼。
全文摘要
本發(fā)明是一種數(shù)字圖形編碼,稱為Guo－數(shù)字符號,及其自動識別方法。Guo－數(shù)字符號書寫簡便,每個數(shù)字符號只需在其骨架的特定位置上畫一筆。它解決了條碼不直觀,可讀性差,不能人工書寫,必須印刷的問題,而是既直觀,又可讀性好,人人都可以書寫。它解決了手寫阿拉伯數(shù)字符號雖直觀,但機器自動識別正確率低,可靠性差的問題,而是算法簡單,識別時可以達到100%的正確率。這就為社會提供了一種人人都能使用,方法簡便,成本低廉,可靠性高,適宜于自動輸入的獨特的數(shù)字符號及識別方法。它可以廣泛地應用于票據(jù)處理、商業(yè)、物流、工業(yè)生產(chǎn)、辦公自動化等領(lǐng)域。
文檔編號G06F3/023GK1172981SQ9711258
公開日1998年2月11日申請日期1997年6月27日優(yōu)先權(quán)日1997年6月27日
發(fā)明者郭熙凡申請人:郭熙凡

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：郭熙凡
技術(shù)所有人：郭熙凡
我是此專利的發(fā)明人

上一篇：信息處理設備和信息處理方法
上一篇：具有掃描器之鍵盤結(jié)構(gòu)的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構(gòu)動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

可手寫的數(shù)字圖形編碼及其識別方法