專利名稱:一種數(shù)碼漢字輸入法及其鍵盤的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種數(shù)碼漢字輸入法及鍵盤,屬于計算機中文信息處理技術(shù)領(lǐng)域。
在現(xiàn)有技術(shù)中,利用數(shù)字鍵盤進行漢字輸入的方法主要有以下幾種①筆劃輸入法在5個或10個數(shù)字鍵上定義若干種筆劃,依照書寫筆順,依次按鍵輸入漢字的每一筆劃。這一方法顯而易見的優(yōu)點是“不用學(xué)習(xí)”,只要會寫字便會輸入,其缺點是按鍵次數(shù)多,輸入速度慢,效率不高。
②拼音輸入法這是參考英文字母的數(shù)字輸入方法,通過按1至4次數(shù)字鍵逐個輸入漢語拼音的字母。其優(yōu)點是可以直接在數(shù)字鍵盤上打拼音,簡單易學(xué),其缺點是大量的同音字需要挑選,而且擊鍵次數(shù)多,同樣效率不高。
③九鍵六碼漢字輸入法這一輸入方法由五筆字型的發(fā)明人王永民先生提出,其中國發(fā)明專利申請為00103505.3號(公開號為CN1264859A)的《五筆數(shù)碼鍵盤漢字電腦輸入法及其鍵盤》,該輸入法利用1~9共九個數(shù)字鍵來輸入漢字,單字最大碼長為6碼。其優(yōu)點是重碼率低,缺點是單字編碼過長,影響了編碼方案的實用性。
另外,已有技術(shù)的各種漢字編碼方案,一直來都沿襲五筆字型輸入法的字詞編碼兼容技術(shù),其缺陷在于,詞組的容量不能太多,否則將產(chǎn)生大量地字、詞重碼,影響輸入速度。
本發(fā)明解決上述技術(shù)問題所采用的技術(shù)方案為該數(shù)碼漢字輸入法的鍵盤包括有0、1、2……9共10個數(shù)字鍵,其特征在于各鍵所對應(yīng)的漢字筆形及部件為“1”“橫”類,對應(yīng)“一”、 及部件“艸、、 “2”“豎”類,對應(yīng)“丨”、“亅”及部件“日”;“3”“撇”類,對應(yīng)“丿”及部件“月”;“4”“捺”類,對應(yīng)“丶”、“ㄟ”及部件“亠、讠”;“5”“折”類,對應(yīng)“乙”及部件“幺、纟”;“6”“交”類,對應(yīng)“十、ナ、七”、“乂、 ”及部件“木”;“7”“插”類,對應(yīng)“、、“豐、 韋、 聿、 及部件“扌”;“8”“八”類,對應(yīng)“八、 冫、丷、 ”、“人、亻、”;“9”“小”類,對應(yīng)“小、、 ”及部件“氵、灬、辶、心、”;“0”“口”類,對應(yīng)“口、囗、 并且,單個漢字按“前4末1”規(guī)則取碼,即按規(guī)范的書寫順序,取第一、二、三、四、末共五個筆形的代碼,不足五碼按實際碼長。
對于可按左右、上下或內(nèi)外分成首部和尾部二部分的漢字,取碼規(guī)則可以為首部或尾部只有一個或二個筆形的,則仍按所述的“前4末1”規(guī)則取碼;首部、尾部的筆形均在三個以上的,則按“首2尾3”規(guī)則取碼,即首部按書寫順序取第一、第二共二個筆形的代碼;尾部按書寫順序取第一、二、末共三個筆形的代碼,一共五碼。
或者,首部或尾部只有一個筆形的,則仍按前述的“前4末1”規(guī)則取碼;首部的筆形在二個及二個以上、尾部的筆形在三個及三個以上的,則按”首2尾3”規(guī)則取碼,即首部按書寫順序取第一、第二共二個筆形的代碼,尾部按書寫順序取第一、二、末共三個筆形的代碼,共五碼;首部的筆形在二個及二個以上、尾部的筆形為二個的,則按“首2尾2”規(guī)則取碼,即首部按書寫順序取第一、第二共二個筆形的代碼,尾部按書寫順序取第一、第二共二個筆形的代碼,共四碼。
而漢字詞組的編碼方法可以為二字詞分別取第1字的一、二、末三個筆形和第2字的一、二、末三個筆形,共六碼,其中如有漢字不足三個筆形的,則以“0”補齊;三字及三字以上的多字詞分別取第1、第2和最后一個漢字的前兩個筆形的代碼,共六碼,其中如有漢字不足二個筆形的,則以“0”補齊。
由于單字和詞組的碼長不等,因此當(dāng)漢字輸入系統(tǒng)有詞組編碼存在時,在輸完單字編碼后,可以鍵入數(shù)字鍵盤上的“非數(shù)字鍵”作為輸碼結(jié)束鍵。
與現(xiàn)有技術(shù)相比,本發(fā)明由于將漢字拆分筆形增加至10種,因而在單字碼長為5、詞組碼長為6的情形下,不僅可以適用于具有簡繁漢字的大字符集,而且重碼率低,并且由于各字形僅與10個數(shù)字鍵相關(guān)聯(lián),因而可以適用于手機、電話、電子字典、個人數(shù)字助理(PDA)、個人電腦(PC)等各種具有數(shù)字輸入設(shè)備的產(chǎn)品。
(一)筆形、部件及代碼本發(fā)明將構(gòu)成漢字的基本筆形分為5種單筆形和5種復(fù)筆形。
5種單筆形的劃分采用國家統(tǒng)一標(biāo)準(zhǔn),即分為“橫(含提)、豎(含左豎鉤)、撇、捺(含點)、折”,不再詳述。
5種復(fù)筆形為“交”——兩筆交叉且連續(xù)寫成,具體筆形為“十(ナ七)、乂( )”。
(括號前的筆形為代表性筆形,括號內(nèi)為形似筆形,下同)“插”——所有連續(xù)寫成的若干筆劃被隨后寫成的一筆劃縱穿的筆形。具體筆形為“()、豐( 韋 聿 )”。
“八”——“八、人”及其變形。即“八( 冫丷 )、人(亻)”。
“小”——“小”及其變形。即“小( )”。
“口”——四角整齊的方形。具體筆形為”口囗 上述10種筆形的代碼分別為“橫1、豎2、撇3、捺4、折5、交6、插7、八8、小9、口0”代碼助記記詞為“1、2、3、4、5,橫豎撇捺折;6、7、8、9、0,交插八小口?!睘殡x散重碼,本發(fā)明還優(yōu)選了10余個高頻部件,按照易記、便于聯(lián)想的原則定義在數(shù)字鍵上,具體如下
(1)艸( )因其首筆為“一”,故定義在數(shù)字鍵“1”上。
(2)日因其首筆為“丨”,故定義在數(shù)字鍵“2”上。
(3)月因其首筆為“丿”,故定義在數(shù)字鍵“3”上。
(4)讠、亠因其首筆為“丶”,故定義在數(shù)字鍵“4”上。
(5)幺、纟因其首筆為“乙”,故定義在數(shù)字鍵“5”上。
(6)木因其首筆形為“十”,故定義在數(shù)字鍵“6”上。
(7)扌因其筆形與“插”筆形相似,故定義在數(shù)字鍵“7”上。
(8)氵灬辶心()因筆形中有多個點,故定義在最大的數(shù)字鍵“9”上。
以上十個基本筆形及10余個優(yōu)選部件構(gòu)成了本發(fā)明的筆形體系,這是本發(fā)明的核心技術(shù)。需要說明的是上述筆形及部件是本發(fā)明人根據(jù)規(guī)范、易記、高效等原則優(yōu)選得到,在具體實施本發(fā)明時,允許作適當(dāng)增減。如在“交”筆形中,可增加“又、力”等部件;可將“丈、 ”等部件也定義為“插”筆形。
(二)單字取碼規(guī)則(1)獨體字(含對稱結(jié)構(gòu)、部分包圍結(jié)構(gòu)的漢字)獨體字按“前4末1”規(guī)則取碼。即按規(guī)范的書寫順序,取一、二、三、四、末共五個筆形的代碼,共為五碼。不足五碼按實際碼長輸入。如獨體結(jié)構(gòu) 我3764 重31261本61對稱結(jié)構(gòu) 乘36288 坐8861 爽16668包圍結(jié)構(gòu) 可102或10164匿11605(上述包圍結(jié)構(gòu)的漢字,因其包圍部分不是連續(xù)寫成,故按筆順取碼。)(2)合體字合體字,先從結(jié)構(gòu)上將其分成兩部分。具體是左右(左中右)結(jié)構(gòu)的合體字分成左、右(左、中右)兩部分;上下(上中下)結(jié)構(gòu)的合體字分成上、下(上、中下)兩部分;包圍結(jié)構(gòu)的合體字分為內(nèi)、外兩部分。
為便于敘述,下文中將合體字的第一部分稱為“首部”,第二部分稱為“尾部”。
合體字分成首、尾兩部分后,若首部、尾部只有一個或二個筆形,則該合體字仍按獨體字“前4末1”規(guī)則取碼。若首部、尾部的筆形均在三個以上,則按“首2尾3”規(guī)則取碼。即首部按書寫順序取一、二共兩個筆形的代碼;尾部按書寫順序取一、二、末共三個筆形的代碼,一共五碼。
合體字也可按如下規(guī)則取碼合體字分成首、尾兩部分后,若首部或尾部只有一個筆形,則該合體字仍按獨體字“前4末1”規(guī)則取碼。若首部、尾部的筆形均在二個以上,則按“首2尾3”規(guī)則取碼,尾部不足3碼按實際碼長輸入。
合體字結(jié)構(gòu)的劃分,以現(xiàn)行的教科書及規(guī)范的寫字字典為依據(jù)。
由于漢字間架結(jié)構(gòu)具有很強的直觀性,因此,只要略懂漢字結(jié)構(gòu)知識,對合體字都能很容易地切分,不會產(chǎn)生“二義性”。對少數(shù)幾個結(jié)構(gòu)不好切分的漢字,則可通過設(shè)置“容錯碼”加以解決。
合體字編碼舉例如下左右、左中右結(jié)構(gòu)村664 撬73737 情82713 鮑35355 鞭11816 辮48546上下、上中下結(jié)構(gòu)京409 贏45034 露14020 翼58068 登54101 英1274半包圍結(jié)構(gòu)磨43660 著81011 左6121 虛21221匈35652 氧81817 司510 灰688毯37888 起61215 彪21333 邂35329闥42649 同2510 兇652 函52882全包圍結(jié)構(gòu)國01614 圓00258本發(fā)明不僅可對國GB2312中的簡體字編碼,同樣可對GBK中的繁體字及其它漢字編碼,且簡、繁漢字編碼不同。如镕81440 詡41588 垚61611 頌85138 絞59486本發(fā)明還可對非成字部首、常用標(biāo)點、字母進行編碼輸入。如一177 丨277 宀44577 卩5277 氵977 疒43877,188 。288 、388 ;488其中,“77”、“88”、“99”為特殊符號的編碼后綴。
(三)詞組的取碼規(guī)則詞組按“二字詞”與“多字詞”兩種方式取碼。
二字詞取每字的一、二、末三個筆形的代碼,一共六碼。若某字取不足三個筆形,則以“0”補齊。如詞語450410不是190218多字詞(三字及三字以上)取第1、第2和最后一個漢字的前兩個筆形的代碼,一共六碼。若某字取不足二個筆形,則以“0”補齊。如計算機468463精益求精868186教育委員會664581中華人民共和國028301本發(fā)明的特征是采用字、詞編碼分離技術(shù)。這一技術(shù)的進步性在于實現(xiàn)了文字錄入以詞組輸入為主這一錄入方式。并且將詞組的編碼空間擴大到一百萬,基本實現(xiàn)詞組輸入無重碼。從而極大地提高漢字的錄入速度。
由于采用字、詞編碼分離技術(shù),因此當(dāng)輸完單字編碼(或簡碼)后,可以鍵入數(shù)字鍵盤上的某一“非數(shù)字鍵”作為輸碼結(jié)束鍵。如果沒有重碼,則該字直接上屏,如果有重碼,則用數(shù)字鍵進行選擇。對于詞組,當(dāng)輸完六碼后,如果無重碼,則該詞組直接上屏,如果有重碼,則用數(shù)字鍵進行選擇。
權(quán)利要求
1.一種數(shù)碼漢字輸入法及其鍵盤,其鍵盤包括有0、1、2……9共10個數(shù)字鍵,其特征在于各鍵所對應(yīng)的漢字筆形及部件為“1”“橫”類,對應(yīng)“一”、 及部件“艸、、 “2”“豎”類,對應(yīng)“丨”、“亅”及部件“日”;“3”“撇”類,對應(yīng)“丿”及部件“月”;“4”“捺”類,對應(yīng)“丶”、“ㄟ”及部件“亠、讠”;“5”“折”類,對應(yīng)“乙”及部件“幺、纟”;“6”“交”類,對應(yīng)“十、ナ、七”、“乂、 ”及部件“木”;“7”“插”類,對應(yīng)“、”、“豐、 韋、 聿、 及部件“扌”;“8”“八”類,對應(yīng)“八、 冫、丷、 、”人、亻、”;“9”“小”類,對應(yīng)“小、、 ”及部件“氵、灬、辶、心、”;“0”“口”類,對應(yīng)“口、囗、 并且,單個漢字按“前4末1”規(guī)則取碼,即按規(guī)范的書寫順序,取第一、二、三、四、末共五個筆形的代碼,不足五碼按實際碼長。
2.根據(jù)權(quán)利要求1所述的數(shù)碼漢字輸入法及其鍵盤,其特征在于對于可按左右、上下或內(nèi)外分成首部和尾部二部分的漢字,取碼規(guī)則為首部或尾部只有一個或二個筆形的,則仍按所述的“前4末1”規(guī)則取碼;首部、尾部的筆形均在三個以上的,則按“首2尾3”規(guī)則取碼,即首部按書寫順序取第一、第二共二個筆形的代碼;尾部按書寫順序取第一、二、末共三個筆形的代碼,一共五碼。
3.根據(jù)權(quán)利要求1所述的數(shù)碼漢字輸入法及其鍵盤,其特征在于對于可按左右、上下或內(nèi)外分成首部和尾部二部分的漢字,取碼規(guī)則為首部或尾部只有一個筆形的,則仍按前述的”前4末1”規(guī)則取碼;首部的筆形在二個及二個以上、尾部的筆形在三個及三個以上的,則按”首2尾3”規(guī)則取碼,即首部按書寫順序取第一、第二共二個筆形的代碼,尾部按書寫順序取第一、二、末共三個筆形的代碼,共五碼;首部的筆形在二個及二個以上、尾部的筆形為二個的,則按“首2尾2”規(guī)則取碼,即首部按書寫順序取第一、第二共二個筆形的代碼,尾部按書寫順序取第一、第二共二個筆形的代碼,共四碼。
4.根據(jù)權(quán)利要求1、2或3所述的數(shù)碼漢字輸入法及其鍵盤,其特征在于,漢字詞組的編碼方法為二字詞分別取第1字的一、二、末三個筆形和第2字的一、二、末三個筆形,共六碼,其中如有漢字不足三個筆形的,則以“0”補齊;三字及三字以上的多字詞分別取第1、第2和最后一個漢字的前兩個筆形的代碼,共六碼,其中如有漢字不足二個筆形的,則以“0”補齊。
5.根據(jù)權(quán)利要求4所述的數(shù)碼漢字輸入法及其鍵盤,其特征在于,在輸完單個漢字編碼后,再鍵入數(shù)字鍵盤上的“非數(shù)字鍵”作為輸碼結(jié)束鍵。
全文摘要
一種數(shù)碼漢字輸入法及其鍵盤,其鍵盤包括有0、1、2……9共10個數(shù)字鍵,其特征在于各鍵所對應(yīng)的漢字筆形及部件為“1”對應(yīng)“橫”類;“2”對應(yīng)“豎”類,“3”對應(yīng)“撇”類;“4”對應(yīng)“捺”類;“5”對應(yīng)“折”類;“6”對應(yīng)“交”類;“7”對應(yīng)“插”類;“8”對應(yīng)“八”類;“9”對應(yīng)“小”類;“0”對應(yīng)“口”類;并且,單個漢字按“前4末1”規(guī)則取碼,即;按規(guī)范的書寫順序,取第一、二、三、四、末共五個筆形的代碼,不足五碼按實際碼長。對于可按左右、上下或內(nèi)外分成首部和尾部二部分的漢字,取碼規(guī)則還可以變更為“首2尾3”或“首2尾2”;漢字詞組的編碼則可以為六碼。與現(xiàn)有技術(shù)相比,本發(fā)明不僅可以適用于具有簡繁漢字的大字符集,而且重碼率低,并且由于各字形僅與10個數(shù)字鍵相關(guān)聯(lián),因而可以適用于手機、電話、電子字典、個人數(shù)字助理(PDA)、個人電腦(PC)等各種具有數(shù)字輸入設(shè)備的產(chǎn)品。
文檔編號G06F3/023GK1460914SQ0312931
公開日2003年12月10日 申請日期2003年6月14日 優(yōu)先權(quán)日2003年6月14日
發(fā)明者羅康寧 申請人:羅康寧