專利名稱:音形碼漢字編碼方法及其鍵盤的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計算機中文信息處理技術(shù)領(lǐng)域,具體地說涉及一種音形碼漢字編碼方法及其輸入鍵盤。
漢字編碼方法一般以漢字的讀音和字形結(jié)構(gòu)為依據(jù),主要分為三大類一類是以漢字拼音或注音為編碼依據(jù)形成的表音碼,另一類是以漢字字形、筆劃結(jié)構(gòu)為編碼依據(jù)形成的表形碼,還有一類就是綜合前兩類編碼依據(jù)形成的音形碼。表音碼的優(yōu)點在于識字知音即可使用,沒有中間轉(zhuǎn)換環(huán)節(jié),容易掌握。它的主要缺點是重碼率高,輸入速度慢,加之受漢語方言的影響,在實際使用中受到很大的限制。表形碼的優(yōu)點是重碼率低、見字即可輸入,且速度較快。它的主要缺點是百余個字根記憶量大、不規(guī)范,對由幾個字根交叉構(gòu)成的漢字拆字不直觀,有的還要加上字型識別碼,不易掌握,因而影響了它的推廣普及。而以綜合兩者優(yōu)點設(shè)計的音形碼是目前較為理想的漢字輸入方式。但現(xiàn)有技術(shù)中的音形碼漢字輸入方法,同樣缺乏對前述缺點的理想的解決方案。
本發(fā)明的目的在于提供一種符合國家語言文字規(guī)范、反映漢字字音信息和字形信息內(nèi)在聯(lián)系的,克服現(xiàn)有技術(shù)上述缺點的,記憶量小、見字識碼、快速輸入、易學(xué)實用的漢字輸入編碼方案。本發(fā)明依據(jù)《漢語拼音方案》設(shè)計音碼,依據(jù)漢字字形結(jié)構(gòu)中五種基本筆形和組字率高的的五十六個偏旁字設(shè)計形碼,由兩者有機結(jié)合,構(gòu)成了本發(fā)明的音形碼漢字編碼方法,同時設(shè)計出本發(fā)明漢字編碼方法的計算機輸入鍵盤。
本發(fā)明的目的是這樣來實現(xiàn)的提供一種漢字計算機輸入的編碼方法,取字音與字形相結(jié)合的音碼加形碼結(jié)構(gòu)為編碼依據(jù),四位碼為二位音碼加二位形碼,三位碼為一音二形碼或二音一形碼,二位碼由定義鍵字母加首筆劃形碼組成,一位碼取高頻字所定義鍵字母。其中漢語詞(詞組)編碼三位碼為二音一形碼,四位碼為三音一形碼。
上述的編碼方法中音碼為漢字漢語拼音首字母加末字母為主的簡拼法;形碼采用漢字結(jié)構(gòu)中五種基本筆形一橫、丨豎、丿撇、丶點、乙折和組字率高的五十六個偏旁字構(gòu)成,按照規(guī)范的漢字書寫筆劃順序,依次取定義鍵字母代碼。
具體地,上述編碼方法采用標準四位編碼前兩位(音碼)采用漢字漢語拼音首字母加末字母的雙拼法編碼方法,由聲母字母(ZH、CH、SH只取Z、C、S)一碼加韻母字母一碼構(gòu)成,其中韻母為二個字母以上者取末尾字母、鼻韻母取定義鍵字母簡碼,此外,凡與聲母讀音相同和以di、ti、li、fu音節(jié)發(fā)音的字,只取聲母字母一位音碼;零聲母的韻母音節(jié)字取音節(jié)字母為音碼。其中er只取E一碼,鼻韻母音節(jié)取其前二碼,不用簡碼。后兩位(形碼)采用下述編碼方法不含鍵名偏旁字的字,取首筆劃加上次筆劃筆形定義鍵字母代碼二碼(一劃字只取一碼);含有鍵名偏旁字的字中首筆劃不是鍵名偏旁字的;先取首筆劃筆形代碼再加上偏旁字(含有兩個以上的取最末一個)定義鍵字母代碼二位碼構(gòu)成;首筆劃就是鍵名偏旁字、只含一個偏旁字的,取偏旁字代碼加上偏旁字后首筆劃筆形代碼二位碼構(gòu)成;含有兩個及兩個以上偏旁字的,取首末兩個偏旁字代碼二位碼構(gòu)成。
詞和詞組的取碼用單字詞,取漢語拼音首字母,加上首、末筆劃偏旁字或筆形代碼二碼,三位碼構(gòu)成;雙字詞,取每個字的漢語拼音首字母,再取末尾一個字起筆的筆形或偏旁字代碼,三位碼構(gòu)成;三字詞,取每個字漢語拼音的首字母三碼,再加上末尾一個字起筆的筆形或偏旁字代碼,四位碼構(gòu)成;多字詞,取前三個字的漢語拼音首字母,加上末尾一個字起筆的筆形或偏旁字代碼,四位碼構(gòu)成。
本發(fā)明同時提供了本發(fā)明的漢字計算機輸入編碼方法所用的鍵盤,以及其中音碼和形碼定義鍵位的鍵盤設(shè)置。
為了便于理解本發(fā)明的技術(shù)方案,下面詳細描述本發(fā)明的漢字編碼方案和鍵盤設(shè)置的原理和具體方法輸入鍵盤為標準ASCII鍵盤(小鍵盤);定義鍵位字母鍵(A--Z);空格鍵和“,”鍵用于碼長不足四位的字和詞(詞組)的輸入結(jié)束鍵。
漢碼編碼的音碼構(gòu)成,以首尾雙拼--漢語拼音首字母加末字母為主的簡拼法。
鍵盤設(shè)置為(1)普通定義字母鍵(A--Z)除V鍵定義為外,各鍵與漢語拼音字母一致。
(2)特殊定義所有鼻韻母都在基準鍵位上。
含a字母的,從A鍵右起依次定義為S鍵uan(灣)uang(汪)D鍵ian(煙)üian(冤)F鍵an(安) ang(昂) iang(央)其余按字母e、i、o、u(ü)依次定義為H鍵en(恩) eng(亨的韻母)J鍵in(因) ing(英)K健ong(轟的韻母) iong(雍)L鍵uen(溫)ün(暈)音碼的取碼規(guī)則為
(1)標準二位音碼,由聲母字母(zh、ch、sh只取z、c、s)一碼加韻母字母一碼(韻母為二個字母以上者取末尾字母韻母ia ua ao iao uo ie ue ai ei uai ui iu ou音碼A A O O O E E I I I I U U鼻韻母取定義鍵字母簡碼,其中“yan”取YD不取YF)構(gòu)成拼音例字音碼ba jia gua wo shao miao cuo che die把 佳 瓜 握 紹 妙 錯 徹 爹BA JA GA WO SO MO CO CE DExue bi tai fei kuai sui zu qiu hou學(xué) 筆 泰 費 快 隨 祖 球 厚XE BI TI FI KI SI ZU QU HUlu kan wang liang men weng pin bing yong旅 勘 旺亮悶 翁 品 冰 詠LV KF WFLFMH WH PJ BJ YKxiong run jun dian yan quan huan zhuang雄潤 俊 滇 研 泉 歡 壯XKRL JL DD YD QD HS ZS(2)凡與聲母讀音相同和以di、ti、fu、li音節(jié)發(fā)音的字,只取聲母字母一位音碼,不再取韻母代碼例字音碼播 婆 饃 佛 福 得 敵 特 題 訥 樂 立 鴿 克B P M F F D D T T N L L G K河 集 齊 喜 指 池 時 字 詞 寺 義 屋H J Q X Z C S Z C S Y W(3)零聲母的韻母音節(jié)字,取音節(jié)字母為音碼(其中er只取E一碼,鼻韻母音節(jié)取前二碼,不用簡碼)例字音碼阿 愛 岸 昂 傲 峨 爾 恩 哦 鷗A AI AN AN AO E E EN O OU本發(fā)明的編碼的形碼,采用漢字結(jié)構(gòu)中五種基本筆形一橫、丨豎、丿撇、丶點、乙折和組字率高的五十六個偏旁字構(gòu)成。這里所指的偏旁字,不限于認為只是一個字的偏旁,而是和五種基本筆形一起作為漢字形體結(jié)構(gòu)中的一個單元(字元)來對待的。
鍵盤設(shè)置為(1)五種基本筆形定義在基準鍵位上,依次為H鍵一(橫,含提,如刁的第二劃)G鍵丨(豎,含豎鉤,如丁、瓦的第二劃)J鍵丿(撇)F鍵丶(點,含捺,如人的第二劃)K鍵乙(折,含彎鉤,如了、戈的第二劃)(2)鍵名偏旁字(其簡化偏旁和附含偏旁不在鍵位上標出,另加注),基本上按字音的聲母,有規(guī)律地定義在字母鍵(A--Z)上,括號內(nèi)的偏旁字與其前邊的同型字定義在同一鍵位上Q鍵 金 田 W鍵 王 土(士) E鍵 耳 禾R鍵 人(入)日T鍵 手 Y鍵 頁 言 又U鍵 月 羽 I鍵 力 酉 魚 O鍵 口P鍵 雨 衣 示 A鍵 十 山 尸(戶) S鍵 石 四(皿)食D鍵 水 大 刀 F鍵 犭 攵 G鍵 革 弓H鍵火 J鍵 巾 K鍵 糸L鍵 木 Z鍵 足 舟 竺 X鍵 心C鍵 廠(廣)車蟲 V鍵 卄 B鍵 比 疒 宀N鍵 牛 島 女 M鍵 馬 門 米 目(見貝)*鍵名偏旁字的簡化偏旁和附含偏旁Q金(钅) E耳(阝卩) R人(亻)T手(扌)Y言(讠) P衣(衤)示(礻) S食(饣)D水(氵彡)刀(刂) H火(灬)K糸(纟)Z足( 、辶、廴) X心(忄、)V卄(廾卄)B宀(冖、穴) N牛(牛)*鍵名偏旁字及其簡化偏旁和附含偏旁取碼,一律按以上表列規(guī)范。對未列入者,只能取筆形代碼。
(3)高頻字定義在字母鍵(A--Z),每鍵一字。
本發(fā)明的編碼鍵盤定義鍵位參見11頁表一形碼的取碼規(guī)則為編碼的形碼,按照規(guī)范的漢字書寫筆劃順序,依次取定義鍵字母代碼。鍵名偏旁字字形如發(fā)生嵌套情形,取碼時以筆劃多的為準。
偏旁字的拆分原則是能連不交,即字的筆劃可以相接不得交叉。如發(fā)生交叉情形時,不再取該字,就只能取未交叉部分的字形代碼,或者是筆形代碼了。
例字果 里內(nèi)單 者 夫取筆形 丨乙 丨乙 丨乙 丶丶 十日 一一不取日木 日土 丨人 日或十 土日 大或人本發(fā)明的編碼方法為字音與字形相結(jié)合的音碼加形碼結(jié)構(gòu)。
(1)漢字1、四位碼(標準編碼),二位音碼加二位形碼;2、三位碼,一音二形或二音一形;3、二位碼,主要是鍵名偏旁字,由定義鍵字母加首筆劃形碼;4、一位碼,高頻字取所定義鍵字母。
(2)漢語詞(詞組)1、三位碼,單字詞,取一音二形碼;雙字詞,取二音一形碼;2、四位碼,三字詞和多字詞,取三音一形碼。
具體地說,(1)不含鍵名偏旁字的字,取首筆劃加次筆劃筆形定義鍵字母代碼二位碼(一劃字只取一嗎)例字 羊 虎 角 野 將 乙 禹編碼 YFFF HUGH JOJK YEGK JFGF YK YVJG凈 離 承 父 兼 身 錄JJFF LIFH XHKK FJF JDFF SHJG LUKH(2)含有鍵名偏旁字的字a.起筆不是鍵名偏旁字的,先取首筆劃筆形代碼再加上偏旁字(含有兩個或兩個以上偏旁字的取最未一個)定義鍵字母代碼二位碼構(gòu)成。
例字 形費蹙規(guī)剃君歐編碼 XJHD FIKM CUHZ GIHM TFD JLKO OUHR
亨行 鼻望 敲 迥 券JJFP JFKR BIJQ WFFW QOFY JKGZ QDFD益學(xué) 旅緊 刊 聾 師YFS XEFB LVFR JJGK KFHD LKHE SGJ贏威 巽 憨惑 頰 餐YJFM WUHN XEKV HFKX HOHX JAHY CFGSb.起筆就是鍵名偏旁字、只含一個偏旁字的,取偏旁字代碼加上偏旁字后首筆劃筆代碼二位碼構(gòu)成;含有兩個及兩個以上偏旁字的,取首末兩個偏旁字代碼,二位碼構(gòu)成。
例字 箏 舞 撞 飽 冠 碰 廉編碼 ZHZJ WRH ZSTF BOSJ GSDH PHSF LDCF鉞 瘥 稞 姊 褫 蛐 犰YEQG COBF KEG ZNJ CPJ QVCG QUFJ期 喔 遏 誤 卸 掰 勘QVU OOW ERZ WYD XERE BITF KFVI禚 南 扇 盤 恭 廨 窗ZOPH NFAA SFAU PFZS GKVX XECN CSBO(3)鍵名偏旁字,取定義鍵字母代碼加該字首筆劃筆形代碼(個別情形特殊定義加注下劃線)二位碼構(gòu)成。偏旁字 金 田 王 土 士 耳 禾 日 人 入 手 頁編碼QJ QG WW WH WG EH EJ RG RJ RF TJ YH-- -- --言 又 月 羽 力 酉 魚 口 雨 衣 示 十YF YK UJ UK IK IH IJ OG PG PF PH AH--山 尸 戶 石 四 皿 食 水 大 刀 革 弓AG AK AF SH SG SK SJ DG DH DK GH GK--
火 巾 糸 木 足 舟 心 廠 廣 車 蟲HF JG KK LH ZG ZJ XF CH CF CK CG--比 牛 鳥 女 馬 門 米 目 見 貝BH NH NJ NK MK MF MH MM MG MJ-- -- -- --(4)高頻字,取定義鍵字母去 我 著 頭 他 一 有 也 說 到 上 是 的 地Q W E R T Y U I O O A S D F個 和 就 來 了 在 小 這 子 不 你 們G H J K L Z X C V B N M*高頻字、鍵名偏旁字同樣可用常規(guī)方法取碼。
詞(詞組)的取碼規(guī)則1、單字詞,取漢語拼音首字母,加上首、末筆劃偏旁字或筆形代碼二碼,三位碼構(gòu)成例詞 行 好 誰 俺 時 走 滬 滇 高 矮編碼 XJG HNH SYH ARK SRF ZWF HDA DDF GFD ARN2、雙字詞,取每個字漢語拼音的首字母二碼,再加上末尾一個字起筆的筆形或偏旁字代碼,三位碼構(gòu)成例詞 安全 長城 氮肥 法律 勇敢 漢族 價格 玫瑰 銀行編碼 AQP CCW DFU FLJ YGK HZF JGL MGW YHJ3、三字詞,取每個字漢語拼音的首字母三碼,再加上末尾一個字起筆的筆形或偏旁字代碼,四位碼構(gòu)成例詞 迫擊炮 火車站 公務(wù)員 大學(xué)生 運動場 羽毛球編碼 PJPHHCZFGWYO DXSJ YDCWYMQW4、多字詞,取前三個字漢語拼音的首字母三碼,加上末尾一個字起筆的筆形或偏旁字代碼,四位碼構(gòu)成例詞 自力更生 北回歸線 高速公路 個人電腦 漢語拼音編碼ZLGJ BHGK GSGZ GRDU HYPF中華人民共和國中國人民解放軍珠穆朗瑪峰ZHROZGRBZMLA附圖
一為本發(fā)明的漢字編碼鍵盤定義鍵位圖。
由上述音形碼漢字編碼方法及其輸入鍵盤的原理和具體方案可知,本發(fā)明的設(shè)計達到了預(yù)期目的。在其編碼方法和取碼規(guī)則中,音碼的構(gòu)成采用漢字漢語拼音首尾雙拼為主的簡拼法,不但組碼方式簡捷規(guī)范,而且使不同方言區(qū)的使用者對漢語語音中舌尖音、鼻音和撮口呼等發(fā)音不一、影響拼音準確性的難題,得到了很好的解決,因而較之其它表音碼和音形碼,具有較突出的優(yōu)點。本發(fā)明的形碼構(gòu)成僅定義了五種基本筆形和組字率高的五十六個偏旁字,字形拆分規(guī)則直觀明確,按規(guī)范的漢字書寫筆劃順序取碼,容易掌握,在很大程度上克服了表形碼記憶量大、拆分困難的缺點。本發(fā)明的鍵盤整體設(shè)置合理,鍵位定義有序,全部編碼均在二十六個字母鍵上,便于操作。使用者無須死記規(guī)則,只要很短的時間進行學(xué)習(xí)和練習(xí),即可熟知編碼的內(nèi)在規(guī)律,使用起來自然而然、得心應(yīng)手。總之,本發(fā)明的音形碼編碼方案及其鍵盤,具有規(guī)律性強、易學(xué)實用的特點,實現(xiàn)了記憶量小、見字識碼、字詞兼容、重碼率低、快速輸入,為計算機中文信息處理提供了一種新的方法和技術(shù)。
表一、本發(fā)明的漢字編碼鍵盤定義鍵位表
權(quán)利要求
1.一種漢字計算機輸入的編碼方法,取字音與字形相結(jié)合的音形碼結(jié)構(gòu)為編碼依據(jù),其特征在于四位碼為二位音碼加二位形碼或三音一形碼,三位碼為一音二形碼或二音一形碼,二位碼由定義鍵字母加首筆劃形碼組成,一位碼取高頻字所定義鍵字母。
2.根據(jù)權(quán)利要求1所述的編碼方法,其特征在于所說音碼采用漢字漢語拼音首字母加末字母雙拼為主的簡拼法,由聲母字母(其中ZH、CH、SH只取Z、C、S)一碼加韻母字母一碼構(gòu)成,韻母為二個字母及以上者取末尾字母、鼻韻母取定義鍵字母簡碼,此外,凡與聲母讀音相同和以di、ti、li、fu音節(jié)發(fā)音的字,只取聲母字母一位音碼,而零聲母的韻母音節(jié)字取音節(jié)字母為音碼,其中er只取E一碼,鼻韻母音節(jié)取其前二碼,不用簡碼。
3.根據(jù)權(quán)利要求1所述的編碼方法,其特征在于所說形碼采用漢字結(jié)構(gòu)中五種基本筆形一橫、丨豎、丿撇、丶點、乙折和組字率高的五十六個偏旁字構(gòu)成,按照規(guī)范的漢字書寫筆劃順序,依次取定義鍵字母代碼。
4.根據(jù)權(quán)利要求1所述的編碼方法,其特征在于漢語詞和詞組編碼三位碼為二音一形碼,四位碼為三音一形碼。
5.根據(jù)權(quán)利要求1或2或3所述的編碼方法,其特征在于標準四位編碼前兩位采用權(quán)利要求2所述的編碼方法,后兩位采用下述5.1、5.2的編碼方法5.1不含鍵名偏旁字的字,取首筆劃加次筆劃筆形定義鍵字母代碼二位碼(一劃字只取一碼);5.2含有鍵名偏旁字的字5.2a首筆劃不是鍵名偏旁字的,先取首筆劃筆形代碼再加上偏旁字(含有兩個以上的取最末一個)定義鍵字母代碼,二位碼構(gòu)成;5.2b首筆劃就是鍵名偏旁字、只含一個偏旁字的,取偏旁字代碼加上偏旁字后首筆劃筆代碼,二位碼構(gòu)成;含有兩個及兩個以上偏旁字的,取首末兩個偏旁字代碼,二位碼構(gòu)成。
6.根據(jù)權(quán)利要求5所述的編碼方法,其特征在于鍵名偏旁字可采取常規(guī)方法或定義鍵字母代碼加該字首筆劃筆形代碼二碼取碼;高頻字編碼可采取常規(guī)方法或下述編碼方式取碼去 我 著 頭 他 一 有 也 說 到 上 是 的 地Q W E R T Y U I O O A S D F個 和 就 來 了 在 小 這 子 不 你 們G H J K L Z X C V B N M。
7.根據(jù)權(quán)利要求1或4所述的編碼方法,其特征在于7.1單字詞,取漢語拼音首字母,加上首、末筆劃偏旁字或筆形代碼二碼,三位碼構(gòu)成7.2雙字詞,取每個字的漢語拼音首字母,再取末尾一個字起筆的筆形或偏旁字代碼,三位碼構(gòu)成;7.3三字詞,取每個字漢語拼音的首字母三碼,再加上末尾一個字起筆的筆形或偏旁字代碼,四位碼構(gòu)成;7.4多字詞,取前三個字的漢語拼音首字母,加上末尾一個字起筆的筆形或偏旁字代碼,四位碼構(gòu)成。
8.權(quán)利要求1的一種漢字計算機輸入編碼方法所用的鍵盤,其特征在于(1)音碼的鍵盤設(shè)置為字母鍵(A--Z)除V鍵定義為外,各鍵與漢語拼音字母一致;此外所有鼻韻母都在基準鍵位上含A字母的,從A鍵右起依次定義為S鍵uan(灣) uang(汪)D鍵ian(煙) üan(冤)F鍵an(安)ang(昂) iang(央);其余按字母E、I、O、U依次定義為H鍵en(恩)eng(亨的韻母)J鍵ong(轟的韻母) iong(雍)L鍵uen(溫)ün(暈);(2)形碼的鍵盤設(shè)置為漢字結(jié)構(gòu)中五種基本筆形定義在基準鍵位上,依次為H鍵 一(橫,含提,如刁的第二劃);G鍵 丨(豎,含豎鉤,如丁、氏的第二劃);J鍵 丿(撇);F鍵 丶(點,含捺,如人的第二劃);K鍵 乙 (折,含彎鉤,如了的第二劃,戈的第二劃);此外,鍵名偏旁字(其簡化偏旁和附含偏旁,不在鍵位上標出,另加注)基本上按字音的聲母,有規(guī)律地定義在字母鍵(A--Z)上;高頻字定義在字母鍵(A--Z),每鍵一字。
全文摘要
一種漢字計算機輸入的編碼方法,取字音與字形相結(jié)合為編碼依據(jù)的音碼加形碼結(jié)構(gòu),四位碼為二位音碼加二位形碼,三位碼為一音二形碼或二音一形碼,二位碼由定義鍵字母加首筆劃形碼組成,一位碼取高頻字所定義鍵字母。依據(jù)《漢語拼音方案》、漢字結(jié)構(gòu)中五種基本筆形和組字率高的五十六個偏旁字構(gòu)成音形碼,綜合了表形碼、表音碼兩者的優(yōu)點,具有見字識碼、快速輸入、字詞兼容、重碼率低、易學(xué)易用特點。鍵盤設(shè)置結(jié)構(gòu)合理、排列有序,使用者不需死記規(guī)則,記憶量小、易學(xué)實用。
文檔編號G06F3/023GK1137647SQ96103838
公開日1996年12月11日 申請日期1996年4月18日 優(yōu)先權(quán)日1996年4月18日
發(fā)明者李宗漢 申請人:李宗漢