專利名稱:一種數(shù)碼漢字輸入法及其鍵盤的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種數(shù)碼漢字輸入法及鍵盤,屬于計(jì)算機(jī)中文信息處理技術(shù)領(lǐng)域。
背景技術(shù):
目前,數(shù)字鍵盤的應(yīng)用十分廣泛。如手機(jī)、電話、電子字典、掌上電腦、PC機(jī)等設(shè)備都使用了數(shù)字鍵盤。利用數(shù)字鍵盤輸入漢字,已成為中文信息處理領(lǐng)域急待解決的課題。
在現(xiàn)有技術(shù)中,利用數(shù)字鍵盤進(jìn)行漢字輸入的方法主要有以下幾種①筆畫輸入法在5個(gè)或10個(gè)數(shù)字鍵上定義若干種筆畫,依照書寫筆順,依次按鍵輸入漢字的每一筆畫。這一方法顯而易見(jiàn)的優(yōu)點(diǎn)是“不用學(xué)習(xí)”,只要會(huì)寫字便會(huì)輸入,其缺點(diǎn)是按鍵次數(shù)多,輸入速度慢,效率不高。
②拼音輸入法這是參考英文字母的數(shù)字輸入方法,通過(guò)按1至4次數(shù)字鍵逐個(gè)輸入漢語(yǔ)拼音的字母。其優(yōu)點(diǎn)是可以直接在數(shù)字鍵盤上打拼音,簡(jiǎn)單易學(xué),其缺點(diǎn)是大量的同音字需要挑選,而且擊鍵次數(shù)多,同樣效率不高。
③九鍵六碼漢字輸入法這一輸入方法由五筆字型的發(fā)明人王永民先生提出,其中國(guó)發(fā)明專利申請(qǐng)為00103505.3號(hào)(公開號(hào)為CN1264859A)的《五筆數(shù)碼鍵盤漢字電腦輸入法及其鍵盤》,該輸入法利用1~9共九個(gè)數(shù)字鍵來(lái)輸入漢字,單字最大碼長(zhǎng)為6碼。具體方法是,將漢字中的合體字,從結(jié)構(gòu)上劃分為首部、余部?jī)蓚€(gè)部分,然后按照首部、余部的取碼規(guī)則進(jìn)行漢字輸入。其優(yōu)點(diǎn)是重碼率低。但其也存在缺點(diǎn)首部、余部劃分規(guī)則多,且與現(xiàn)行教科書漢字結(jié)構(gòu)的劃分不完全一致,不易掌握;取碼時(shí)過(guò)多采用“跳躍”技術(shù),降低了取碼時(shí)思維的流暢性;此外單字編碼過(guò)長(zhǎng),也影響了方案的實(shí)用性。
另外,已有技術(shù)的各種漢字編碼方案,一直來(lái)都采用字詞編碼等長(zhǎng)技術(shù),其缺陷性在于,詞組的容量不能太多,否則將產(chǎn)生大量地字、詞重碼,影響輸入速度。
發(fā)明內(nèi)容
本發(fā)明的目的是針對(duì)上述現(xiàn)有技術(shù)現(xiàn)狀而提供一種簡(jiǎn)單易學(xué)、科學(xué)規(guī)范的數(shù)碼漢字輸入法及其鍵盤。
本發(fā)明解決上述技術(shù)問(wèn)題所采用的技術(shù)方案為該數(shù)碼漢字輸入法的鍵盤包括有0、1、2……9共10個(gè)數(shù)字鍵,其特征在于各鍵所對(duì)應(yīng)的漢字筆形為“1”“橫”類,對(duì)應(yīng)“一 ”;“2”“豎”類,對(duì)應(yīng)“丨亅”;“3”“撇”類,對(duì)應(yīng)“丿”;“4”“捺”類,對(duì)應(yīng)“丶 ”;“5”“折”類,對(duì)應(yīng)“乙”;“6”“叉”類,對(duì)應(yīng)“十ナ ”、“乂 ”;“7”“穿”類,對(duì)應(yīng)“艸 艸廾卅”、“豐 韋肀 聿;“8”“八”類,對(duì)應(yīng)“八ン丷 ”、“人亻”;“9”“小”類,對(duì)應(yīng)“小 ”;“0”“方”類,對(duì)應(yīng)“口 ”;并且,單個(gè)漢字的取碼規(guī)則為(1)獨(dú)體字按“前4末1”規(guī)則取碼,即按規(guī)范的書寫順序,取第一、二、三、四、末共五個(gè)筆形的代碼,不足五碼的按實(shí)際碼長(zhǎng)取碼;(2)合體字即可按上下、左右或內(nèi)外分成首、尾兩部分的漢字,分為兩類一類是首部只能取到一個(gè)編碼的合體字、對(duì)稱結(jié)構(gòu)的合體字或包圍部分為非連續(xù)筆畫的包圍結(jié)構(gòu)合體字,按前述的“前4末1”規(guī)則取碼;另一類是首部能取到兩個(gè)及兩個(gè)以上編碼的合體字,按“首2尾3”規(guī)則取碼,即首部按書寫順序取第一、第二共兩個(gè)筆形的代碼,尾部按書寫順序取一、二、末共三個(gè)筆形的代碼,尾部不足三碼的,按實(shí)際碼長(zhǎng)取碼。
為了更直觀地取碼,同時(shí)也為了提高編碼效率,所述0~9十個(gè)數(shù)字鍵上還可安排有一些組字頻度高的漢字部件,具體是“1”對(duì)應(yīng)部件“扌”;“2”對(duì)應(yīng)部件“日”;“3”對(duì)應(yīng)部件“月”;“4”對(duì)應(yīng)部件“亠”;“5”對(duì)應(yīng)部件“纟”;“6”對(duì)應(yīng)部件“木”;“9”對(duì)應(yīng)部件“氵、灬、辶、心”。
為合理利用編碼空間,對(duì)于尾部只能取到一個(gè)編碼的合體字,也可仍按前述的“前4末1”規(guī)則取碼。
為了加快漢字錄入速度,還可對(duì)漢字詞組進(jìn)行編碼,編碼規(guī)則為二字詞取每字全碼的前三個(gè)編碼,共六碼,其中如有漢字不足三碼的,以該字末碼補(bǔ)齊;三字詞取每字全碼的前二個(gè)編碼,共六碼,其中如有漢字不足二碼的,以該字末碼補(bǔ)齊;四字及四字以上的多字詞取前三字的第一個(gè)編碼和最后一字的前三個(gè)編碼,共六碼,若最后一字不足三碼的,以該字末碼補(bǔ)齊。
對(duì)于單字、詞組編碼并存的漢字輸入系統(tǒng),由于兩者碼長(zhǎng)不等,可將數(shù)字鍵盤上的“*”、“/”、“+”、“-”、“.”、“#”、“Enter”等“非數(shù)字鍵”作為單個(gè)漢字編碼的輸碼結(jié)束鍵。
與現(xiàn)有技術(shù)相比,本發(fā)明由于將漢字筆形增加至10種,因而在單字碼長(zhǎng)為5、詞組碼長(zhǎng)為6的情形下,不僅可以適用于具有簡(jiǎn)繁漢字的大字符集,而且重碼率低,并且由于各筆形僅與10個(gè)數(shù)字鍵相關(guān)聯(lián),因而可以適用于手機(jī)、電話、電子字典、個(gè)人數(shù)字助理(PDA)、個(gè)人電腦(PC)等各種具有數(shù)字輸入設(shè)備的產(chǎn)品。
圖1為本發(fā)明實(shí)施例的筆形—鍵位分布圖。
具體實(shí)施例方式
以下結(jié)合附圖實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。
(一)筆形、部件及代碼本發(fā)明將構(gòu)成漢字的基本筆形分為5種單筆形和5種復(fù)筆形。
5種單筆形的劃分采用國(guó)家統(tǒng)一標(biāo)準(zhǔn),即分為“橫(含提)、豎(含豎鉤)、撇、捺(含點(diǎn))、折”,不再詳述。
五種復(fù)筆形為“叉”——兩筆交叉且連續(xù)寫成,兩筆畫中可以含折筆中的斜鉤或彎鉤。“叉”筆形可分“十字交叉”、“X型交叉”兩種,具體為“十ナ ”、“乂 ”;“穿”——先寫的一橫橫穿隨后寫成的若干連續(xù)筆畫或者若干連續(xù)筆畫都被隨后寫成的一筆畫縱穿?!按惫P形可分“橫穿”、“縱穿”兩種,具體為“艸 艸廾卅”、“豐 韋肀 聿;“八”——“八、人”及其變形。具體為“八ン丷 ”、“人亻”;“小”——“小”及其變形。具體為“小 ”;
“方”——四角齊整的方形。具體為“口 ”。
代碼助記詞為“橫1豎2撇為3,捺4折5交叉6;穿7八8小是9,口與方框零中查?!睘樘岣呔幋a效率,本發(fā)明還優(yōu)選了10個(gè)高頻部件,按照易記、便于聯(lián)想的原則安排在數(shù)字鍵上,具體如下(1)扌因其首筆為“一”,故定義在數(shù)字鍵“1”上。
(2)日因其首筆為“丨”,故定義在數(shù)字鍵“2”上。
(3)月因其首筆為“丿”,故定義在數(shù)字鍵“3”上。
(4)亠因其首筆為“丶”,故定義在數(shù)字鍵“4”上。
(5)纟因其首筆為“乙”,故定義在數(shù)字鍵“5”上。
(6)木因首筆形為“十”,故定義在數(shù)字鍵“6”上。
(7)氵灬辶心()因部件中有多個(gè)點(diǎn),故定義在最大的數(shù)字鍵“9”上。
以上十個(gè)部件是根據(jù)規(guī)范、易記、高效等原則優(yōu)選得到,在具體實(shí)施本發(fā)明時(shí),根據(jù)字符集的不同,允許作適當(dāng)增減及鍵位變動(dòng)。
(二)單字取碼規(guī)則(1)獨(dú)體字——按“前4末1”規(guī)則取碼,即按規(guī)范的書寫順序,取第一、二、三、四、末共五個(gè)筆形(部件)的代碼,不足五碼按實(shí)際碼長(zhǎng)輸入。如生371 片3215 冊(cè)35351 凹25251 成13564(2)合體字合體字,先從結(jié)構(gòu)上將其分成兩部分,具體是“左右”結(jié)構(gòu)的合體字分成左、右兩部分;“左中右”結(jié)構(gòu)的合體字分成左、中右兩部分;“上下”結(jié)構(gòu)的合體字分成上、下兩部分;“上中下”結(jié)構(gòu)的合體字分成上、中下兩部分;包圍結(jié)構(gòu)的合體字分為包圍、被包圍兩部分(或稱內(nèi)、外兩部分)。
合體字結(jié)構(gòu)的劃分,以現(xiàn)行的教科書及規(guī)范的寫字字典為依據(jù)。
為便于敘述,將合體字先寫的部分稱為“首部”,后寫的部分稱為“尾部”。
合體字一分為二后,分別按“前4末1”、“首2尾3”兩種規(guī)則取碼,具體是①首部只能取到一個(gè)編碼的合體字、特殊結(jié)構(gòu)的合體字(對(duì)稱結(jié)構(gòu)、包圍部分為非連續(xù)筆畫的包圍結(jié)構(gòu)),仍按前述的“前4末1”規(guī)則取碼,如嘲06263 巫12881 坐8861 區(qū)165 裁61434
②首部能取到兩個(gè)及兩個(gè)以上編碼的合體字,按“首2尾3”規(guī)則取碼,即首部按書寫順序取第一、第二共兩個(gè)筆形(部件)的代碼,尾部按書寫順序取一、二、末共三個(gè)筆形(部件)的代碼,尾部不足三碼的,按實(shí)際碼長(zhǎng)輸入,如露14020 斑16461 虛21221 氧81817 鄭8152為合理利用編碼空間,對(duì)于尾部只能取到一個(gè)編碼的合體字,仍可按前述的“前4末1”規(guī)則取碼,如禮45245 針81156 知8640本發(fā)明不僅可對(duì)GB2312中的簡(jiǎn)體字編碼,還適用于具有簡(jiǎn)繁漢字的大字符集,如镕81440 詡41588 垚61611 頌85138(三)詞組的取碼規(guī)則二字詞取每字全碼的前三個(gè)編碼,共六碼,其中如有漢字不足三碼的,以該字末碼補(bǔ)齊,如作業(yè)882228 一定111441三字詞取每字全碼的前二個(gè)編碼,共六碼,其中如有漢字不足二碼的,以該字末碼補(bǔ)齊,如計(jì)算機(jī)458463四字及四字以上的多字詞取前三字的第一個(gè)編碼和最后一字的前三個(gè)編碼,共六碼,若最后一字不足三碼的,以該字末碼補(bǔ)齊,如中華人民共和國(guó)088016由于單字和詞組的碼長(zhǎng)不等,因此當(dāng)漢字輸入系統(tǒng)有詞組編碼存在時(shí),在輸完單字編碼后,可以鍵入數(shù)字鍵盤上的“*”、“/”、“+”、“-”、“.”、“#”、“Enter”等“非數(shù)字鍵”作為輸碼結(jié)束鍵。
權(quán)利要求
1.一種數(shù)碼漢字輸入法及其鍵盤,該鍵盤包括有0、1、2……9共10個(gè)數(shù)字鍵,其特征在于各鍵所對(duì)應(yīng)的漢字筆形為“1”“橫”類,對(duì)應(yīng)“一”; “2”“豎”類,對(duì)應(yīng)“丨亅”;“3”“撇”類,對(duì)應(yīng)“丿”;“4”“捺”類,對(duì)應(yīng)“丶 ”;“5”“折”類,對(duì)應(yīng)“乙”;“6”“叉”類,對(duì)應(yīng)“十 ”、“ㄨ ”;“7”“穿”類,對(duì)應(yīng)“艸 廾卅”、“豐 韋肀 聿;“8”“八”類,對(duì)應(yīng)“八 冫丷 ”、“人 亻”;“9”“小”類,對(duì)應(yīng)“小 ”;“0”“方”類,對(duì)應(yīng)“口 ”;并且,單個(gè)漢字的取碼規(guī)則為(1)獨(dú)體字按“前4末1”規(guī)則取碼,即按規(guī)范的書寫順序,取第一、二、三、四、末共五個(gè)筆形的代碼,不足五碼的按實(shí)際碼長(zhǎng)取碼;(2)合體字即可按上下、左右或內(nèi)外分成首、尾兩部分的漢字,分為兩類一類是首部只能取到一個(gè)編碼的合體字、對(duì)稱結(jié)構(gòu)的合體字或包圍部分為非連續(xù)筆畫的包圍結(jié)構(gòu)合體字,按前述的“前4末1”規(guī)則取碼;另一類是首部能取到兩個(gè)及兩個(gè)以上編碼的合體字,按“首2尾3”規(guī)則取碼,即首部按書寫順序取第一、第二共兩個(gè)筆形的代碼,尾部按書寫順序取一、二、末共三個(gè)筆形的代碼,尾部不足三碼的,按實(shí)際碼長(zhǎng)取碼。
2.根據(jù)權(quán)利要求1所述的數(shù)碼漢字輸入法及其鍵盤,其特征在于,0~9十個(gè)數(shù)字鍵上還安排有一些組字頻度高的漢字部件,具體是“1”對(duì)應(yīng)部件“扌”;“2”對(duì)應(yīng)部件“日”;“3”對(duì)應(yīng)部件“月”;“4”對(duì)應(yīng)部件“亠”;“5”對(duì)應(yīng)部件“纟”;“6”對(duì)應(yīng)部件“木”;“9”對(duì)應(yīng)部件“氵、灬、辶、心”。
3.根據(jù)權(quán)利要求1所述的數(shù)碼漢字輸入法及其鍵盤,其特征在于,對(duì)于尾部只能取到一個(gè)編碼的合體字按所述的“前4末1”規(guī)則取碼。
4.根據(jù)權(quán)利要求1、2、3所述的數(shù)碼漢字輸入法及其鍵盤,其特征在于,漢字詞組的編碼規(guī)則為二字詞取每字全碼的前三個(gè)編碼,共六碼,其中如有漢字不足三碼的,以該字末碼補(bǔ)齊;三字詞取每字全碼的前二個(gè)編碼,共六碼,其中如有漢字不足二碼的,以該字末碼補(bǔ)齊;四字及四字以上的多字詞取前三字的第一個(gè)編碼和最后一字的前三個(gè)編碼,共六碼,若最后一字不足三碼的,以該字末碼補(bǔ)齊。
5.根據(jù)權(quán)利要求4所述的數(shù)碼漢字輸入法及其鍵盤,其特征在于,數(shù)字鍵盤上的“非數(shù)字鍵”在有詞組編碼的漢字輸入系統(tǒng)中作為單個(gè)漢字編碼的輸碼結(jié)束鍵。
全文摘要
一種數(shù)碼漢字輸入法及其鍵盤,該鍵盤包括有0、1、2……9共10個(gè)數(shù)字鍵,其特征在于各數(shù)字鍵所對(duì)應(yīng)的漢字筆形為“1”對(duì)應(yīng)“橫”類;“2”對(duì)應(yīng)“豎”類;“3”對(duì)應(yīng)“撇”類;“4”對(duì)應(yīng)“捺”類;“5”對(duì)應(yīng)“折”類;“6”對(duì)應(yīng)“叉”類;“7”對(duì)應(yīng)“穿”類;“8”對(duì)應(yīng)“八”類;“9”對(duì)應(yīng)“小”類;“0”對(duì)應(yīng)“方”類;并且,獨(dú)體字按“前4末1”規(guī)則取碼,合體字分別按“前4末1”、“首2尾3”兩種規(guī)則取碼,單字最大碼長(zhǎng)為5碼,詞組統(tǒng)一為6碼。所述的0~9十個(gè)數(shù)字鍵上還可以安排“扌、日、月、亠、纟、木、氵、灬、辶、心”等組字頻度高的漢字部件。與現(xiàn)有技術(shù)相比,本發(fā)明不僅可以適用于具有簡(jiǎn)繁漢字的大字符集,而且重碼率低,并且由于漢字筆形僅與10個(gè)數(shù)字鍵相關(guān)聯(lián),因而可以適用于手機(jī)、電話、電子字典、個(gè)人數(shù)字助理(PDA)、個(gè)人電腦(PC)等各種具有數(shù)字輸入設(shè)備的產(chǎn)品。
文檔編號(hào)G06F3/023GK1538278SQ200410032050
公開日2004年10月20日 申請(qǐng)日期2004年3月29日 優(yōu)先權(quán)日2003年6月14日
發(fā)明者羅康寧 申請(qǐng)人:羅康寧