專利名稱:一種漢字?jǐn)?shù)字化表達方法及其鍵盤的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于漢字信息處理技術(shù)領(lǐng)域,具體是一種利用0-9十個阿拉伯?dāng)?shù)字來表述漢字的方法。此方法可應(yīng)用于漢字檢索和漢字輸入系統(tǒng)。
本發(fā)明的技術(shù)要點是
一種漢字?jǐn)?shù)字化表達方法及其鍵盤,其五類基本單筆筆形橫、豎、撇、點、折依序采用阿拉伯?dāng)?shù)字1、2、3、4、5作代碼,其特征在于復(fù)筆的筆形代碼及其描述為代碼“6”表示呈方框形的部件;代碼“7”表示包含有橫或豎的相交部件;代碼“8”表示由兩筆撇開構(gòu)成“八”字形或“八”字變形的部件;代碼“9”表示“小”字形或“小”字變形的部件;代碼“0”表示由撇和捺構(gòu)成的交叉部件;將漢字劃分為獨體字和合體字兩類,對于獨體字,按漢字書寫順序取其前四筆代碼,不足四筆者,末位用“0”補齊四位;對于合體字,依次取漢字首部件的首碼和尾碼,次部件的首碼和末部件的尾碼;部件的首筆形或首筆形與其他筆形的結(jié)合為首碼;部件的末筆形或末筆形與其他筆形的結(jié)合為尾碼;獨體字定義為當(dāng)一漢字符合下述三種情況時,則該漢字為獨體字1、該漢字無法按左右、左中右、上下、上中下以及全包圍、半包圍等六種漢字結(jié)構(gòu)劃分;2、該漢字按部件拆分后,任何一個部件均非獨立漢字。
3、若一漢字由一獨體字加上一單筆組成,且符合上述第一種情況,則也將其視為獨體字;合體字的取碼原則1、確定首部件原則本編碼方案將漢字歸納為左右、左中右、上下、上中下及全包圍、半包圍等六種結(jié)構(gòu),依據(jù)這六種結(jié)構(gòu)對漢字進行拆分,將含有首筆畫的部分確定為首部件;2、復(fù)筆優(yōu)先原則在取碼時,應(yīng)盡可能的將部件的首末單筆結(jié)合成復(fù)筆取碼;3、筆畫不復(fù)取原則在取碼時,同一筆畫不得重復(fù)被首尾碼使用;
4、補“0”原則①當(dāng)要從一個不足兩碼或只有一種復(fù)筆的部件取首尾碼時,首碼不變,尾碼用“0”補齊;②當(dāng)部件的末筆畫已在首碼中使用時,則尾碼用“0”補齊;鍵盤上的數(shù)字鍵作數(shù)字代碼,操作時,啟動程序進入應(yīng)用狀態(tài),用數(shù)字鍵盤檢索錄入。
本發(fā)明的技術(shù)效果是規(guī)則簡單、定義明確、容易記憶、易于掌握和普及。符合當(dāng)今飛速發(fā)展的信息技術(shù)和“數(shù)字化地球“這一概念。漢字正在逐步走向世界,如何采用一個簡單明了的表達方法實現(xiàn)對漢字的數(shù)字化描述,來實現(xiàn)VCD、DVD、移動電話、電話機、傳真機及其它帶有數(shù)字按鍵的信息家電上的漢字輸入,是目前的發(fā)展方向和應(yīng)解決的技術(shù)關(guān)鍵。
五類單筆的筆形代碼及其描述為代碼“1”表示由左向右運筆的橫;代碼“2”表示由上向下運筆的豎及豎鉤;代碼“3”表示由右上向左下運筆的撇;代碼“4”表示由左上向右下運筆的點及捺;代碼“5”表示所有的折筆。
五類復(fù)筆的筆形代碼及其描述為代碼“6”表示呈方框形的部件;代碼“7”表示包含有橫或豎的相交部件;代碼“8”表示由兩筆撇開構(gòu)成“八”字形或“八”字變形的部件;代碼“9”表示“小”字形或“小”字變形的部件;代碼“0”表示由撇和捺構(gòu)成的交叉部件。
漢字筆形分類和代碼一覽表 對于獨體字,按漢字書寫順序取其前四筆代碼,不足四筆者,末位用“0”補齊四位;例如1、一畫字一=1000乙=50002、二畫字二=1100十=1200卜=24003、三畫字三=1110干=1120才=12304、四畫字豐=1112中=2512夫=11345、多畫字史=2513乖=3122我=3121對于合體字,依次取漢字首部件的首碼和尾碼,次部件的首碼和末部件的尾碼,當(dāng)一個漢字只有兩個部件時,則次部件也取首碼和尾碼。
例如教=7730 冰=8028壁=6771崔=2631弼=5515 湖=4171贏=4564暴=6178固=6076 囫=6033邊=5344句=3560合體字的取碼原則是
1、確定首部件原則本編碼方案將漢字歸納為左右、左中右、上下、上中下及全包圍、半包圍等六種結(jié)構(gòu),依據(jù)這六種結(jié)構(gòu)對漢字進行拆分,將含有首筆畫的部分確定為首部件。例如“治”(左右結(jié)構(gòu))的代碼為4156;“做”(左中右結(jié)構(gòu))的代碼為3270;“志”(上下結(jié)構(gòu))的代碼為7144;“高”(上中下結(jié)構(gòu))的代碼為4166;“國”(全包圍結(jié)構(gòu))的代碼為6014;“逐”(半包圍結(jié)構(gòu))的代碼為1844。
2、復(fù)筆優(yōu)先原則在取碼時,應(yīng)盡可能的將部件的首末單筆結(jié)合成復(fù)筆取碼。例如“將”的代碼為8234,“黨”的代碼為9565,“冰”的代碼為8028。
3、筆畫不復(fù)取原則在取碼時,同一筆畫不得重復(fù)被首尾碼使用;例如“因”的代碼為6078,“膚”的代碼為6174。
4、補“0”原則①當(dāng)要從一個不足兩碼或只有一種復(fù)筆的部件取首尾碼時,首碼不變,尾碼用“0”補齊;例如“博”的代碼為7074,“懷”的代碼為9014,“艾”的代碼為7200,“兇”的代碼為0060。
②當(dāng)部件的末筆畫已在首碼中使用時,則尾碼用“0”補齊;例如“偉”的代碼為3270,“偉”的代碼為3270,“純”的代碼為5170。
本方法無需掌握詞組編碼規(guī)則和多級簡碼輸入技術(shù),同時由于編碼科學(xué)合理,因此在短時間內(nèi)容易學(xué)習(xí)和掌握,易于推廣普及應(yīng)用,而且檢索錄入速度快。
以本編碼方案作為檢字法擬被中華書局收入最新編輯出版的中華字典電子版中,并作為中華字典紙本版的補輯出版發(fā)行,為漢字?jǐn)?shù)字化和漢字信息處理開辟了新路,并為其推廣普及打下基礎(chǔ)。
權(quán)利要求
1.一種漢字?jǐn)?shù)字化表達方法及其鍵盤,其五類基本單筆筆形橫、豎、撇、點、折依序采用阿拉伯?dāng)?shù)字1、2、3、4、5作代碼,其特征在于復(fù)筆的筆形代碼及其描述為代碼“6”表示呈方框形的部件;代碼“7”表示包含有橫或豎的相交部件;代碼“8”表示由兩筆撇開構(gòu)成“八”字形或“八”字變形的部件;代碼“9”表示“小”字形或“小”字變形的部件;代碼“0”表示由撇和捺構(gòu)成的交叉部件;將漢字劃分為獨體字和合體字兩類,對于獨體字,按漢字書寫順序取其前四筆代碼,不足四筆者,末位用“0”補齊四位;對于合體字,依次取漢字首部件的首碼和尾碼,次部件的首碼和末部件的尾碼;部件的首筆形或首筆形與其他筆形的結(jié)合為首碼;部件的末筆形或末筆形與其他筆形的結(jié)合為尾碼;獨體字定義為當(dāng)一漢字符合下述三種情況時,則該漢字為獨體字(1)該漢字無法按左右、左中右、上下、上中下以及全包圍、半包圍等六種漢字結(jié)構(gòu)劃分;(2)該漢字按部件拆分后,任何一個部件均非獨立漢字。(3)若一漢字由一獨體字加上一單筆組成,且符合上述第一種情況,則也將其視為獨體字;合體字的取碼原則(1)確定首部件原則本編碼方案將漢字歸納為左右、左中右、上下、上中下及全包圍、半包圍等六種結(jié)構(gòu),依據(jù)這六種結(jié)構(gòu)對漢字進行拆分,將含有首筆畫的部分確定為首部件;(2)復(fù)筆優(yōu)先原則在取碼時,應(yīng)盡可能的將部件的首末單筆結(jié)合成復(fù)筆取碼;(3)筆畫不復(fù)取原則在取碼時,同一筆畫不得重復(fù)被首尾碼使用;(4)補“0”原則①當(dāng)要從一個不足兩碼或只有一種復(fù)筆的部件取首尾碼時,首碼不變,尾碼用“0”補齊;②當(dāng)部件的末筆畫已在首碼中使用時,則尾碼用“0”補齊;鍵盤上的數(shù)字鍵作數(shù)字代碼,操作時,啟動程序進入應(yīng)用狀態(tài),用數(shù)字鍵盤檢索錄入。
全文摘要
本發(fā)明涉及一種漢字?jǐn)?shù)字化表達方法及其鍵盤,屬于漢字信息處理技術(shù)領(lǐng)域,采用0-9十個數(shù)字分別表示橫、豎、撇、點、折五類單筆,和方框形、含橫或豎的相交形、“八”字形、“小”字形和撇捺交叉形五類復(fù)筆,進而實現(xiàn)對漢字的數(shù)字化描述;對于獨體字,按漢字書寫順序取其前四筆代碼,不足四筆者,末位用“0”補齊四位;對于合體字,依次取漢字首部件的首碼和尾碼,次部件的首碼和末部件的尾碼;用確定首部件原則、復(fù)筆優(yōu)先原則、筆畫不復(fù)取原則及補“0”原則作為合體字的取碼原則。本發(fā)明具有規(guī)則簡單、定義明確、容易記憶、易于掌握和普及的優(yōu)點。為漢字?jǐn)?shù)字化和漢字信息處理開辟了新路,并為其推廣普及打下基礎(chǔ)。
文檔編號G06F3/023GK1445644SQ03130659
公開日2003年10月1日 申請日期2003年5月3日 優(yōu)先權(quán)日2003年5月3日
發(fā)明者孫亞國 申請人:孫亞國