專利名稱:一種數(shù)字鍵盤漢字輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字輸入方法,尤其是涉及一種主要用于手機(jī)、掌上電腦等電子設(shè)備的數(shù)字鍵盤漢字輸入法。
背景技術(shù):
漢字的輸入方法有很多種,其中應(yīng)用較為廣泛的主要有形碼、音形碼、拼音碼等輸入法。形碼、音形碼、主要用于利用通用鍵盤輸入漢字,形碼、音形碼輸入法速度較快,但較難掌握。拼音碼輸入法易學(xué),但重碼率較高,輸入速度慢,發(fā)音不準(zhǔn),也會影響輸入的速度。中國專利01104480.2號公開的《漢字的數(shù)字鍵盤輸入法》存在著以下缺陷(1)數(shù)字與其對應(yīng)的字根記憶量大,且容易混淆,難以掌握、記??;(2)重碼率高,且易錯碼,影響漢字的輸入速度。中國專利200410023295.0號公開的《數(shù)字鍵盤漢字輸入法》不僅存在著上述缺陷,而且因為其輸入方法既要根據(jù)輸入的漢字拼音首字母所對應(yīng)的數(shù)字鍵取碼,又要根據(jù)輸入的漢字快捷部首所對應(yīng)的數(shù)字鍵取碼,同時還要根據(jù)輸入的漢字去掉部首后的第一筆筆畫所對應(yīng)的數(shù)字鍵取碼,其取碼步驟相當(dāng)繁鎖,影響輸入的速度。中國專利200410027499.1號公開的《字根首筆劃漢字?jǐn)?shù)碼輸入法》是一種數(shù)碼類的漢字輸入法,雖然其拆字無需記大量的字根,漢字拆分原則比較簡單,但仍存在以下一些缺陷(1)三個字以上的詞組輸入編碼仍太長、輸入繁瑣、效率低,且重碼率高;(2)對于標(biāo)點符號的輸入及空格、空行等,數(shù)字鍵區(qū)并沒有一定的輸入方法,不便操作。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種容易記憶,重碼少,取碼直觀,輸入效率較高的數(shù)字鍵盤漢字輸入法。
本發(fā)明的目的是通過以下技術(shù)方案實現(xiàn)的 (一)字根選定規(guī)則(1)以五個基本筆畫“一”、“丨”、“丿”、“丶”、“乙”作為字根;(2)以組字能力≥300字的在首偏旁“艸”、“氵”、“亻”、“扌”、“口”、“木”等,以及出現(xiàn)在字中或字末≥100字的部首或筆畫構(gòu)件如“十”、“二”、“三”、“人”、“八”、“丷”、“冂”、“亠”、“日”、“_”等,以及組字能力≥100字的在末部首“大”、“小”、“又”、“乂”、“兒”等,作為字根;(3)組字能力≥100字,在首偏旁分拆字根有超過二個的,設(shè)定字根,如針對偏旁“_”設(shè)計字根
;針對偏旁“蟲”設(shè)計字根
等,目的是使其分拆只占兩碼;(4)以便于實現(xiàn)編碼字根最大化,漢字分拆難度較大的偏旁、部首、筆畫型,作為字根,如
、“矛”、“巫”、
“爪”、“求”、
“尸”、“卩”、
等;(5)將有兩種或多種“變形”的偏旁、部首或筆畫型,歸入同一個字根,如西(覀)、四(覀)、雨
月
、大
幾(_、
),如“微”字中)、又
、纟(纟,如“轡”字中)、小
亅(
如“豹”字中)、冂
人
、八
、火
(
“如偏旁“衤”中、如“飛”字中、如“鄹”字中)、_(“
”如“站”字中)、
(
,如“豢”字中)、木
,如“新”字中)、車
、足(_)、禾
、土(_)、竹(_)、牛
如“衛(wèi)”字中)、兒
,如“羌”字中;
,如“輝”字中;
,如“尬”字中)、尸(
,如“君”字中*)、求(
,如“裘”字中)、水(氺,如“錄”字中;氺,如“暴”字中;氺,如“犀”字中)匕
如“化”字中)、
(
,如“貫”字中)、王(
、王,如“全”字中,上“橫”比第二“橫”短); 但在編碼當(dāng)中,不能將“刀”類推為字根“_”,將“_”類推為字根“卩”;除以上情況外,還有一些在取碼筆畫最大化當(dāng)中,結(jié)構(gòu)形態(tài)相近的筆畫型,歸入結(jié)構(gòu)形態(tài)相近的字根如“殳”字中的“
”歸入字根“幾”,“凹”字中的“
”歸入字根“冂”,“身”字中的“
”歸入字根“月”,“即”字中的“
”歸入字根“厶”,“敝”字中的“
”歸入字根“_”,“臉”字中的“_”歸入字根“_”,“業(yè)”字中的“_”歸入字根“_”(“業(yè)”字中的筆畫型“_”,“點”、“撇”和“橫”之間有間隙),“良”字中的“
”歸入字根“
”;以上列出的字根,不能作類推,如不能以“
”字中“
”看作“尸”的“筆畫結(jié)構(gòu)變形”,“衛(wèi)”字中“
”看作“卩”的“筆畫結(jié)構(gòu)變形”而類推“烏”字中筆畫型“
”可看作“
”;不能以“貫”字中“
”看作“
”的“筆畫結(jié)構(gòu)變形”,而類推“緣”字中“
”也為字根“
”; 按照以上規(guī)則選定字根,數(shù)量宜為60-80個,優(yōu)選65-75個。
(二)字根鍵位布置規(guī)則(1)將五個基本筆畫字根“一”、“丨”、“丿”、“丶”、“乙”安排在五個不同鍵位里;(2)將“氵”、“艸”、“口”、“扌”、“亻”五個組字能力極強(qiáng)的在首偏旁字根安排在不同鍵位里,但可與五個基本筆畫同鍵位,因兩者不會發(fā)生因同部首而重碼;(3)將較多出現(xiàn)在字中或字末的部首或筆畫構(gòu)件字根如“十”、“人”、“冂”、“亠”、“日”、、“大”、“小”、“兒”等,安排在不同鍵位里,并兼顧重碼最少以及筆畫形態(tài)相近。
優(yōu)選方案由于《現(xiàn)代漢語詞典》(商務(wù)印書館2002年版)的部首檢字表按“一”、“丨”、“丿”、“丶”、“乙”的順序編排,且“一”的讀音與“1”相同,為便于記憶,本發(fā)明將字根“一”及含有“一”的部分字根安排在“1”鍵;將字根“丨”及含“亅”等的部分字根安排在“2”鍵;將字根“丿”及含“丿”的部分字根安排在“3”鍵;將字根“丶”及含“丶”的部分字根安排在“4”鍵;將字根“乙”及含“乙”的部分字根安排在“5”鍵;另外,將字根“十”及“二”、“三”安排在″6″鍵,是因為它們有“一”的筆畫;將字根“日”及含“_”筆畫的字根安排在“7”鍵,是因為筆畫“_”有點像“7”;將字根“八”及與“八”形狀相似的字根安排在“8”鍵,是因為“八”讀音與“8”相同;將字根“亠”及含“丶”的部分字根安排在“9”鍵;將字根″口″及形狀與“冂”相近的字根安排在“0”鍵,因為″口″形狀像“0”;以上所述可見,從“6”鍵到“0”鍵的字根鍵位安排,也基本符合“一”、“丨”、“丿”、“丶”、“乙”的順序安排。
(三)取碼編碼規(guī)則將分拆超過兩個字根的在首偏旁的字,用兩個碼位表示,也就是說,這種在首偏旁將有102+101=110個編碼容量來區(qū)別它們;取碼時,首先從在首偏旁中按照筆順以第一筆實行字的首碼字根最大化,接著在偏旁中用未取筆畫按筆順實行字的第二碼字根最大化,這之后,偏旁中多出的筆畫不參加字的編碼;然后用四個碼位表示它們的部首,也就是說,其部首將有104+103+102+101=11110個編碼容量來進(jìn)行區(qū)別;部首取碼時,先用部首按倒數(shù)順序以末筆實行字的末碼字根最大化;接著用部首未取筆畫按筆順實行字的第三碼字根最大化;再接著用部首未取筆畫按筆順實行字的第四碼字根最大化;然后用部首未取筆畫按筆順實行字的第五碼字根最大化。以上這種在首偏旁就稱之為舍筆畫取碼偏旁,并且只準(zhǔn)許它們占有兩個碼位,如在首偏旁“钅”、“魚”等。
對于非偏旁舍筆畫編碼字取碼時,首先按照筆順以字的在首筆畫實行首碼字根最大化;并用字的未取筆畫按倒數(shù)順序以末筆實行末碼字根最大化;接著用字的未取筆畫按筆順實行第二碼字根最大化;再接著用字的未取筆畫按筆順實行第三碼字根最大化;如此類推第四碼字根最大化,第五碼字根最大化。
在編碼過程中,編碼按順數(shù)碼位排列,而在實現(xiàn)字根最大化時,則按首碼、末碼、第二碼、第三碼、第四碼、第五碼的次序進(jìn)行,在發(fā)生被取碼筆畫相矛盾時,后者依次讓前者(偏旁舍筆畫取碼字字根取碼最大化次序應(yīng)分在首偏旁、在后部首兩部分對待,偏旁舍筆畫不參加部首編碼中字根最大化)。
偏旁作為整體字或在字末時,不舍筆畫取碼,如“齒”、“嚙”等。
字舍筆畫取兩碼在首偏旁如下“王”、“忄”、“石”、“犭”、“钅”、“魚”、“_”、
、“革”、“齒”、“骨”、“酉”、“雨”、“舟”。
如偏旁“_”在字首時,取碼為“_”、“丶”,編碼為“84”,多出的筆畫就不參加編碼;但如果不在字首,如“潷”字,部首“_”就不能舍筆畫,“潷”字分拆為“氵”、“_”、“丶”、“_”、“丶”、“乙”,編碼為“484845”。
只有一個或兩個字根的字,其編碼為字根所在鍵位加聲母編號組成編碼(字母編號G11F12D13S14A15H21J22K23L24T31R32E33W34Q35Y41U42I43O44P45B51V52C53X54Z55N61M62。字母右肩上的數(shù)字為該字母編號)。
詞組編碼 雙字組編碼取各字的首碼、第二碼和末碼按詞組組字順序構(gòu)成;三字詞組編碼取各字的首碼、末碼按詞組順序構(gòu)成;四字以上詞組編碼取第一字的首碼、末碼和第二字的首碼、末碼以及第三字、最后一字的首碼按詞組組字順序構(gòu)成。
本發(fā)明優(yōu)選方案還設(shè)置有第一重碼鍵、第二重碼鍵、第三重碼鍵。
本發(fā)明字根較少,取碼唯一、直觀、易記,實用性強(qiáng)。重碼方面,也主要表現(xiàn)為兩個字或詞重碼,三個字或詞重碼相對較少,重碼達(dá)四、五個或以上的字或詞更少。通過設(shè)計重碼鍵可使重碼字或詞直接快速輸入??芍饕栽~為單位進(jìn)行輸入來提高輸入速度,平均每字三碼位輸入,輸入快速、準(zhǔn)確、直觀。
圖1為本發(fā)明一實施例鍵名字根和重碼鍵在手機(jī)數(shù)字鍵盤上的鍵位布置圖。
圖2為圖1所示實施例鍵名字根和重碼鍵在通用鍵盤上的鍵位布置圖。
具體實施例方式 以下結(jié)合實施例對本發(fā)明作進(jìn)一步說明。
根據(jù)前述字根選定規(guī)則及字根鍵位布置規(guī)則,本實施例共設(shè)置68個字根;其鍵名字根和重碼鍵在手機(jī)數(shù)字鍵盤上的鍵位布置見圖1,在計算機(jī)通用鍵盤上的鍵位布置見圖2。全部68個字根在數(shù)字鍵盤上的鍵位設(shè)置如下表所示 注以上字根中,
為“家”字末筆畫型;
為偏旁“衤”(“捺”變“點”)及“聚”字末筆畫型。
取碼編碼方法 將組字能力較強(qiáng)的在首偏旁“王”、“忄”、“石”、“犭”、“钅”、“魚”、“_”,以及將字的在首偏旁分拆字根在四個以上的
、“革”、“齒”、“骨”、“酉”、“雨”、“舟”用兩個碼位表示,(如偏旁“_”在字首時,取碼為“_”、“丶”,編碼為“84”),對于以上在首偏旁組字,因為它們分拆超過兩個字根,編碼時,首先從在首偏旁中按照筆順以第一筆實行字的首碼字根最大化,接著在偏旁中用未取筆畫按筆順實行字的第二碼字根最大化,這之后,偏旁中多出的筆畫不參加字的編碼;然后用四個碼位表示它們的部首;部首取碼時,先用部首按倒數(shù)順序以末筆實行字的末碼字根最大化;接著用部首未取筆畫按筆順實行字的第三碼字根最大化;再接著用部首未取筆畫按筆順實行字的第四碼字根最大化;然后用部首未取筆畫按筆順實行字的第五碼字根最大化。以上這種在首偏旁就稱之為舍筆畫取碼偏旁,并且只準(zhǔn)許它們占有兩個碼位.如“鮮”字分拆為字根“_”、“日”、“_”、“_”,編碼為“3781”依次擊打“3”、“7”、“8”、“1”鍵即可;“勤”字分拆字根為“艸”、“一”、“二”、“力”,編碼為“1163”。
對于非偏旁舍筆畫編碼字取碼時,首先按照筆順以字的在首筆畫實行首碼字根最大化;并用字的未取筆畫按倒數(shù)順序以末筆實行末碼字根最大化;接著用字的未取筆畫按筆順實行第二碼字根最大化;再接著用字的未取筆畫按筆順實行第三碼字根最大化;如此類推第四碼字根最大化;第五碼字根最大化。如“根”字分拆為字根“十”、“八”、“_”、“一”、“乙”、
,編碼為“687158”。
在編碼過程中,編碼按順數(shù)碼位排列,而在實現(xiàn)字根最大化時,則按首碼、末碼、第二碼、第三碼、第四碼、第五碼的次序進(jìn)行,在發(fā)生被取碼筆畫相矛盾時,后者依次讓前者(偏旁舍筆畫取碼字字根取碼最大化次序應(yīng)分在首偏旁、在后部首兩部分對待,偏旁舍筆畫不參加部首編碼中字根最大化)。
偏旁作為整體字或在字末時,不舍筆畫取碼,如“齒”、“嚙”等。
只有一個或兩個字根的字,其編碼為字根所在鍵位加聲母編號組成編碼(字母編號G11F12D13S14A15H21J22K23L24T31R35E33W34Q35Y41U42I43O44P45B51V52C53X54Z55N61M62。字母右肩上的數(shù)字為該字母編號)。編碼舉例如“一”字只有一個字根“一”,“一”字的聲母為“Y”,“Y”的編號為“41”,因此“一”字的編碼為“141”;“六”字分拆為“亠”、“八”,“六”字的聲母為“L”,“L”的編號為“24”,因此“六”字的編碼為“9824”。
下面主要分析在首偏旁筆畫的情況 如果組字能力較強(qiáng)的在首偏旁在設(shè)計中本身就能以一個字根存在,就不存在偏旁舍筆畫取碼,如“艸”“氵”“口”“亻”等。
如果組字能力較強(qiáng),但在首偏旁只有兩個字根,就不存在偏旁舍筆畫,如“月”“目”等,也包括可為一些筆畫較多的在首偏旁設(shè)計字根后,偏旁只有兩個碼位的,如針對偏旁“_”可設(shè)計字根
;針對偏旁“蟲”可設(shè)計字根
等。
有一定的組字能力(在100個以下,主要看重碼情況),在首偏旁只有三個字根,不須偏旁舍筆畫取碼,如“車”“馬”“禾”等。
有一定的組字能力(約30個上下,主要看重碼情況),在首偏旁在四個字根以上,須偏旁舍筆畫取碼,如“酉”“革”“雨”“舟”等。
組字能力在10個以上(主要看重碼情況),在首偏旁在五個字根以上的,須偏旁舍筆畫取碼,如“骨”“齒”等。
組字能力在10個以下,視重碼情況而定,可不作考慮偏旁舍筆畫取碼,換句話說,也就是可以讓它們的部首只有一個碼位區(qū)別,如“鼻”“食”等。
詞組編碼 雙字詞組編碼取各字的首碼、第二碼和末碼按詞組組字順序構(gòu)成,如“學(xué)習(xí)”,取“學(xué)”首碼字根
、第二碼字根“冖”、末碼
,取“習(xí)”字首碼字根“乙”、第二碼字根“丶”、末碼字根“一”,編碼為“20254l”。
三字詞組編碼取各字的首碼、末碼按詞組順序構(gòu)成,如“湖南省”,取“湖”字首碼字根“氵”、末碼字根“二”、取“南”字首碼字根“十”、末碼字根“十”、取“省”字首碼字根“小”、末碼字根“日”,組成編碼為“466627”。
四字以上詞組編碼取第一字的首碼、末碼和第二字的首碼、末碼以及第三字、最后一字的首碼按詞組組字順序構(gòu)成,如“馬到成功”,取“馬”字首碼字根“乙”、末碼字根“一”,“到”字首碼字根“一”、末碼字根
,“成”字首碼字根“一”、“功”字首碼字根“一”,編碼為“511211”。
在雙字詞組編碼中,非偏旁舍筆畫字(包括偏旁整體字)只有兩碼時,按字的編碼方法取該字的字根和該字的聲母編號第一個數(shù)字,如“土地”的編碼為“613615”,(其中“3”為取“土”字讀音的聲母“T”的編號第一個數(shù)字);在三字詞及四字詞前三字中,只有一個字根的字按字的編碼方法取該字的字根和該字的聲母編號第一個數(shù)字,如“人盡其才”的編碼為“837411”,(其中“3”為“人”字讀音的聲母“R”的編號第一個數(shù)字)。
參照圖1,本實施例設(shè)有空格鍵,并在該鍵位上標(biāo)記草體“空”字樣;還設(shè)有三種重碼鍵,分別稱為“重甲”鍵、“重乙”鍵以及“重丙”鍵,并在該鍵上標(biāo)記“重甲”、“重乙”以及“重丙”草體字樣;重碼,多數(shù)為兩個字(詞)重碼,少數(shù)重碼為三個字(詞)或三個字以上,采用以下方法處理 (1)重碼為六個碼位,且只有兩個字(詞)重碼,以最常見字(詞)為本碼字(詞),在輸入編碼時,屏幕內(nèi)容同時顯示該字(詞)完成輸入;而需要輸入重碼字(詞)時,補(bǔ)擊“重甲”鍵,屏幕內(nèi)容顯示的本碼字(詞)切換成重碼字(詞),重碼字(詞)編號為“2”; (2)重碼為五個碼位以內(nèi),只有兩個字重碼,在輸入編碼后補(bǔ)擊空格鍵輸入本碼字,再補(bǔ)擊“重甲”鍵,本碼字切換成重碼字,也可在輸入編碼后只補(bǔ)擊“重甲”鍵便可輸入該字,重碼編號為“2”。
(3)有三個字(詞)以上重碼,這時,不管編碼有多少碼位,該編碼所有的字(詞)用阿拉伯?dāng)?shù)字“1”、“2”等給以編號,最常見編號為“1”,次常見編號為“2”,依次類推,在輸入該編碼中的字(詞)時,輸入編碼后補(bǔ)擊空格鍵完成對應(yīng)的編號為“1”的字(詞)輸入;輸入編碼后補(bǔ)“重甲”鍵即完成對應(yīng)的編號為“2”的字(詞)的輸入;輸入編碼后補(bǔ)“重乙”鍵即完成對應(yīng)的編號為“3”的字(詞)輸入;而要輸入編號為“4”以后的字(詞)時,先在輸入編碼后按住“重丙”鍵不放,然后同時選擇點擊編號為“4”以后的對應(yīng)的字(詞)編號完成輸入。
“重甲”鍵可設(shè)計為專門進(jìn)行重碼字(詞)切換輸入的鍵,但不能作為本碼字(詞)的切換輸入鍵(這些字、詞可利用空格鍵輸入)。
在給漢字編碼當(dāng)中,還存在筆順這一大問題需要解決。當(dāng)前“漢字規(guī)范筆順”不能較好地滿足漢字信息處理要求。通過大量的試編碼實踐,為了實現(xiàn)取碼字根最大化、唯一性,必須做到取碼時漢字筆畫順序唯一性、統(tǒng)一性;同時又能讓這種唯一性、統(tǒng)一性的筆畫順序大多數(shù)符合現(xiàn)行的《漢字筆順規(guī)范》,但當(dāng)給出一種規(guī)定時,就要求不能有例外,如給出“從左到中,至右”的規(guī)定,“非”字就不能以“丨”為先,而是以“三”為先,鑒此,本實施例對筆順作如下特別規(guī)定 (一)、從左到中,至右。如“非”字按如下順序依次拆分為“三”、“丨”、“丨”、“三”,編碼為“6226”;“步”字依次拆分為“丨”、“丨”、“二”、“丶”、“丨”、“丿”,編碼為“226423”;“臧”字依次拆分為“乚”、“一”、“丿”、“一”、“丿”、“丶”,編碼為“513134”;“將”字依次拆分為“丶”、“一”、“丨”、“_”、“丶”、“丶”,編碼為“412344”;在以“撇”、“捺”或“點”對稱排列在兩邊時,按兩種情況處理 (1)中間筆畫定位兩偏旁筆畫型,先中間,后兩邊。字和筆畫型如“水”、“氺”、“承”、
(“鰥”字中)、
(“巫”字中)、
(“幽”字中)、
(“率”字中)、
(“藥”字中)、
(“燮”字中)、
(“亦”字中)、
(“業(yè)”字中)“辦”、
(“梁”字中)等,按“先中間,后兩邊”順序,“水“字依次拆分為
,編碼為“2414”;“率”字依次拆分為“亠”、“纟”、“丶”、
、“十”,編碼為“95446”;“幽”字依次拆分為“丨”、“纟”、“丶”、“纟”、“丶”、“__”,編碼為“254545”;“業(yè)“字拆分為“丨”、“丨”、“_”,編碼為“228”;“辦”字依次拆分為“力”、“丶”、“丶”,編碼為“344”等。
(2)兩邊在上夾中交或夸筆畫型,先兩邊和“橫”(包括“橫折”、“豎折橫”等),后中間。字和筆畫型如
、“半”、“米”、
(“夾”字中)、“坐”、
(“敝”字中)、“兆”、
(“脊”字中)、
(“谷”字中)、
(“塽”字中)等,“米”字依次拆分為“_”、“小”,編碼為“8262”;“兆”字依次拆分為
、“兒”,編碼為“4355”;“坐”字依次拆分為“人”、“人”、“丨”、“二”,編碼為“8826”;“敝”字依次拆分為“_”、“冂”、“八”、“_”、“乂”,編碼為“20889”等。
(二)、從上到下,如“皮”字(在不設(shè)字根
時),依次拆分“乛”、“丨”、“丿”。
(三)、兩筆畫相交,先“橫”(包括“橫折”、“橫折豎”、“豎折橫”),后“豎”(包括“豎折”、“豎撇”)或“撇”。筆畫型如“十”、
(“降”字中)、
(“也”字中)、
(“五”字中)、“巾”、“子”、
(“庸”字中)、
(“勤”字中)、“_”(“澤”字中)、
(“隹”字中)、
(“青”字中)、
(“垂”字中)、“七”、
(“逆”字中)、
(“屯”字中)、“屮”(“蚩”字中)、
(“虐”字中)、“九”、“力”等,即如“五”字依次拆分為“一”、“_”、“丨”、“一”,編碼為“152l”;“子”字依次拆分為“乛”、“一”、
,編碼為“512”“青”字依次拆分為“三”、“丨”、“冂”、“二”,編碼為“6206”;“逆”字依次拆分為“_”、“_”、“丿”、“丶”“乙”、“丶”,編碼為“853454”;“虐”字依次拆分為“丨”、“一”、
“一”、“_”、“_”,編碼為“215155”;“九”字依次拆分為“乙”、“丿”,編碼為“5322”等;但在“冂”框、
框、“口”框、“口”字、
框與“橫”相交時有特例,以“冂”、
、“口“、“口”、
等結(jié)構(gòu)看成在上,為先,“橫”看成在下,為后,規(guī)定為從上到下。如“冊”字依次拆分為“冂”、“冂”、“一”,編碼為“001”;“尹”字依次拆分為“尸”、“一”,編碼為“7141”;“衰”字依次拆分為“亠”、“口”、“一”、“丿”、“_”、
,編碼為“901358”;“母”字依次拆分為
、“亠”、“丶”,編碼為“794”等。
(四)、兩筆畫相接,若有出頭時,出頭者為先,若無出頭成左上角時,看成先角上,后角下。如“卩”、
等,其左上角無筆畫出頭,因此象“氏”字依次拆分為“丿”、“_”、“一”、
,編碼為“3515”等,而象“及”、“乃”等字左上角有筆畫出頭,因此以出頭的筆畫“ㄋ”為先。
(五)、全包圍,左上右包圍、上左包圍、上右包圍字型,先外后里。如“國”、“母”、“同”、“問”、“廳”、“司”等。
(六)、左下右包圍,左下包圍,上左下包圍字型,先里后外。如“畫”、“運(yùn)”、
(“甚”字中)、
(“曷”字中)、“也”、“區(qū)”等,如“畫”字依次拆分為“一”“日”“丨”“__” ,編碼為“1725”;“運(yùn)”字依次拆分為“二”、“_”、“、”、“、”、‘‘_”、“、”,編碼為“654454”;“甚”字依次拆分為“艸”、“三”、“八”、“_”,編碼為“1685”;“也”字依次拆分為“_”、 “丨”、 “_”,編碼為“525”;“區(qū)”字依次拆分為“一”、“乂”、“_”,編碼為“195”等;而對于一些特殊的近于左下包圍的但卻難以認(rèn)定為左下包圍結(jié)構(gòu)的筆畫型如 (1)漢字組字中,把筆畫“_”右上的筆畫看作被筆畫“_”左下包圍筆畫型,以筆畫“_”右上的筆畫為先。如“與”、“丐”、“鳥”等字,以“鳥”字為例,依次拆分為“丿”、“_”、“、”、 “_”、“一”,編碼為“35451”,這樣可排除把“鳥”字的“丶”作為末筆(參見第“七”條); (2)象“比”字左部筆畫型
、以及“匕”字等,同樣看作左下包圍筆畫型,先里后外; (3)對于“鬼”“尬”、“氈”、“旭”、“飛”等字中有筆畫
或“乚”,否定為左下包圍筆畫型,把這些筆畫看作在左部分筆畫,以左部筆畫為先。如“尬”字依次拆分為“一”、“兒”、“人”、 “丿”、“丨”,編碼為“13832”; (4)由多筆畫組成的偏旁“辶”、“廴”等看作左下包圍,除此以外,象“處”字中筆畫型
、“昶”字中筆畫型
等由多筆畫組合的筆畫型不視為左下包圍筆畫型。
(七)“點”在上部或左上,筆順為先。如“衣”、“為”、“門”等;“點”在右上或字里,筆順為后。如“發(fā)”“瓦”等,以“為”字為例,依次拆分為“丶”、“力”、“丶”,編碼為“434”、“發(fā)”字依次拆分為
、“人”、“フ”、“丶”,編碼為“5854”;“門”字依次拆分為“丶”、“丨”
編碼為“425”等。
為便于實現(xiàn)取碼字根最大化,對于漢字的筆畫結(jié)構(gòu)的認(rèn)定,本實施例還有下列規(guī)定 (一)除字根“亅”之外,所有“折”均看作字根“乙”。
(二)、“提筆”為“橫”,如“刁”字,但“橫”不為“提筆”,如“事”字中的筆畫型
不為字根“扌”。
(三)、“亦”在字整體上部或部首上部時,筆畫型
均為兩“豎”。如“跡”字依次拆分取字根為“亠”、“丨”、“丨”、“八”、“、”、“、”,編碼為“922844”;“奕”字依次拆分取字根為“亠”、“丨”、“丨”、“大”,編碼為“9229”等。
(四)、方框內(nèi)包有一筆畫者即認(rèn)定為“囗”框,不為“囗”字。如“象”字中筆畫
為“囗”框;“柬”字中筆畫型
為“囗”框。(“囗”框作為部首在字末時,明確規(guī)定以“囗”框為末筆根最大化,但不類推
框)。
(五)部首“西”在字整體上部或部首上部時,“囗”框內(nèi)筆畫均為兩“豎”,如“迺”、“要”字中,但不包括部首“酉”、“酋”,即漢字構(gòu)字結(jié)構(gòu)“酉”、“酋”中有筆畫型“西”不看作部首“西”,把“酉”、“酋”看作整體構(gòu)字部件,而不是由“西“構(gòu)成。
(六)“二“、“三”、“_”等字根中的筆畫位置處在最底下的“橫”為不短于上面的“橫”長,并且對于字根“三”,上面第一“橫”長還須不短于處在中間位置的“橫”長,否則都不認(rèn)定為該字根。如“羋”字首筆畫型為
不為字根“三”,因其第一“橫”短于中間的“橫”長;“作”字末筆畫型
不為字根“三”,因其最底下的“橫”短于第一“橫”長;而“宜”字末筆畫型
卻為字根“三”,是因其最底下的“橫”為不短于上面的“橫”長。
又,筆畫型
(如“妻”字中)、
(如“捷”字中)以在筆畫型
中間位置的“橫”為最長;筆畫型
以底下位置的“橫”為最長,即“妻”字第一碼確定取字根為“_”等;“垂”字以筆畫型“艸”中的“橫”為最長,“垂”字第二碼確定取字根也為“_”等。
(七)漢字中存在多個“橫”的筆畫時,以最長的“橫”為被取字根“十”、“大”、“木”、“廾 ”、“_”(字根“_”針對底下的“橫”)的筆畫,因此“缽”字末筆字根最大化不認(rèn)為是“十”,而是“一”。
(八)、“豎鉤”(“亅”)變“豎”(“丨”)則依“豎”,“豎”變“豎鉤”則依“豎鉤”(不包括“亦”在上時)。如“犀”字中“_”依“丨”看作字根“_”,而不是把“丨”看作“亅”,并以此否定為字根“_”;“裘”字中的“十”依“丨”看作字根“十”,而不是把“丨”看作“亅”,并以此否定為字根“十”;又如在“新”字中并不因
可看作“木”的筆畫結(jié)構(gòu)變形而把筆畫型
看作字根“十”。
(九)、漢字中有許多以“橫撇”和“豎”筆畫相接,如“千”、“垂”、“幣”、“禾”等字中的筆畫型
,這種筆畫型在實現(xiàn)取碼字根最大化中如果認(rèn)定為字根“亻”(單人旁),就會有許多漢字被拆散;而象“裁”字中,若以第四碼取筆畫型
理解為字根“人”,以及“夜”字末碼取筆畫型
理解為字根“人”都存在反拆漢字,很難理解;又如若“庹”字來取末筆畫型
為字根“八”,“風(fēng)”字首碼若取筆畫型
為字根“八”,“諍”字首碼若取筆畫型“丷”為字根“丷”,同樣反拆漢字,很難理解;還有象“后”、“差”等字中若取其中的筆畫型“_”為字根“_”,都是不能支持的。因此特別規(guī)定只以筆畫結(jié)構(gòu)即偏旁“亻”、“人”、“八”、“丷”、“_”(如“矢”字首)、能夠理解為同一種筆畫型的
(如“家”字末筆畫型
)、以及能夠理解為同一種筆畫型的
,認(rèn)定為字根。
所述字根,一般為筆畫相連,或為筆畫相交,或為筆順相連,或為筆畫位置相連續(xù),不存在被中插筆畫隔分;如字根被中插筆畫隔分,應(yīng)是“撇”、“捺”或“點”對稱排列在中插筆畫兩邊,筆順相連,如
、“八”、“丷”等。舉例如下“宣”字末取字根“三”,筆順相連,不存在隔分;“辰”字首取字根“三”,筆畫不連,筆順不連,但位置相連續(xù),不存在隔分,認(rèn)定為字根;“水”字末取字根
,雖被中插隔分,但筆順相連且對稱在兩邊,認(rèn)定為字根;“于”字首取字根為“二”不為隔分;“工”字首取字根不為“二”,因“二”被“丨”中插隔分,筆畫不連不交,筆順不連,筆畫位置不連續(xù);“兼”字末筆畫型“忄”,筆順雖相連,但被左邊“丨”隔分,且不是以字根
(“小”的變形)中的“丨”對稱排列,而是以筆畫型
對稱排列,因此,“兼”字末取字根不為“小”,而為“八”。
漢字中,象“武”字中的
,筆畫位置處在上面的“一”偏向筆畫位置處在下面的“一”的一邊,這種“偏位移”現(xiàn)象有很多,如“我”字中的
,其筆畫型
就在與筆畫“一”相交就有“偏位移”;當(dāng)然,或許“尬”等字中的筆畫型
也要討論是否可看作有“偏位移”現(xiàn)象,這些偏旁或部首在漢字組字結(jié)構(gòu)中應(yīng)仍為原偏旁或部首,在編碼時仍須看作原字根。
筆畫結(jié)構(gòu)“亠”在漢字組字結(jié)構(gòu)中沒有出現(xiàn)“偏位移”,但當(dāng)它作為字根在實現(xiàn)取碼最大化時,就有“點”在筆畫“橫”上“偏位移”現(xiàn)象,如“伏”、“國”、“浦”、“試”等字末最大化筆畫型
,是否可以認(rèn)定為字根“亠”呢?如果認(rèn)定,這將拆散許多的類似漢字。
如果認(rèn)定“偏位移”,筆畫型
全被認(rèn)定為字根“亠”;如果不認(rèn)定“偏位移”,象“作”字末的
,上“橫”應(yīng)偏移一邊,也稍有類似現(xiàn)象,是否也要否定為字根“二”呢,這樣會使分拆取碼有違漢字本義上的筆畫結(jié)構(gòu)。
綜合以上考慮,特規(guī)定除字根“亠”外,承認(rèn)所有的“偏位移”,把字根“亠”稱作“不可偏位移性”。
在實際編碼中還會看到,還有某些“偏位移”并不能理解為漢字筆畫結(jié)構(gòu),如“臼”字末最大化筆畫型
“韭”字末筆畫型
,“凸”字末筆畫型
,“亟”字末筆畫型
等,但也可看作最大化字根“二”;又如“友”字在首最大化筆畫型
,也可看作最大化字根“大”。還有一個問題,象“豸”字中首筆畫型
(“點”和“撇”沒有間隙)是否要看作字根“爫”呢?為此,特規(guī)定由某偏旁、部首或說構(gòu)字部件確定為某字根的筆畫構(gòu)成,其筆畫原為與整體中某些筆畫相連或相隔的,而出現(xiàn)在漢字取碼字根最大化當(dāng)中,筆畫型有極似其形卻為該筆畫間相隔或相連的,不為該字根。
本實施例中,字母(小寫)編碼即為以下的字母編號,字母(小寫)為本碼字,補(bǔ)空格鍵,需要輸入多個字母組成的拼音時,在完成輸入每個拼音后再補(bǔ)一次空格鍵即可進(jìn)行了下一個拼音輸入。字母(大寫)編碼為重碼,補(bǔ)“重甲”鍵。字母編號如下G11F12D13S14A15H21J22K23L24T31R32E33W34Q35Y41U42I43O44P45B51V52C53X54Z55N61M62 本實施例中出現(xiàn)的重碼主要表現(xiàn)為兩個字或詞重碼,六水分碼設(shè)計了“重甲”鍵、“重乙”鍵以及“重丙”鍵。“重甲”鍵和“重乙”鍵都可看成是對重碼字或詞的進(jìn)一步區(qū)別,并能做到直接快速輸入。設(shè)計“重甲”鍵可對重碼字或詞進(jìn)行切換輸入,而“重丙”鍵不能。重碼鍵也是六水分碼解決重碼問題的重要特點。
本實施例中專門設(shè)計“,”(逗號)鍵和“。”(句號)鍵,本實施例中由于采用的數(shù)字鍵位有限,為了解決其它標(biāo)點符號的輸入問題,特設(shè)計“標(biāo)點符號”鍵,并在鍵位上標(biāo)記草體“標(biāo)”字。設(shè)計把標(biāo)點符號用一個碼位進(jìn)行編號,在需要輸入標(biāo)點符號時,先點擊“標(biāo)”鍵,屏幕出現(xiàn)標(biāo)點符號編號,每完成輸入一個標(biāo)點符號,屏幕顯示自動消除,由于標(biāo)點符號超過10個,因此也需要用到重碼,具體編號如下 左右雙引號“”(1)、左右單引號‘’(2)、問號?(3)、冒號(4)、頓號、(5)、左小括號((6)、右小括號)(7)、感嘆號!(8)、雙分隔線∥(9)、@(0),點擊“標(biāo)”鍵后,再點擊括號內(nèi)對應(yīng)的數(shù)字鍵即完成輸入,不必補(bǔ)空格鍵。
單分隔線/(1)、破折號——(2)、省略號……(3)、左中括號[(4)、右中括號](5)、左書名號《(6)、右書名號》(7)、實心點.(8)、加號+(9)、減號-(0),以上為點擊“標(biāo)”鍵后,再點擊括號內(nèi)對應(yīng)數(shù)字鍵并補(bǔ)“重甲”鍵。
乘號×(1)、除號÷(2)、#(3)、¥(4)、%(5)、=(6)、?(7)、*(8)、左小括號((9)、右小括號)(0),以上為點擊“標(biāo)”鍵后,再點擊括號內(nèi)對應(yīng)數(shù)字鍵補(bǔ)“重乙”鍵。
本實施例只有68個字根,取碼唯一、直觀、易記,實用性強(qiáng)。以《現(xiàn)代漢語詞典》為依據(jù),能對所有規(guī)范漢字進(jìn)行編碼,字的重碼僅有578個,詞的重碼率約為10%,可經(jīng)過對6個或8個詞以上重碼淘汰較偏僻的詞,以提高實用性。通過設(shè)計重碼鍵使重碼字或詞直接快速輸入??芍饕栽~為單位進(jìn)行輸入來提高輸入速度,平均每字三碼位輸入,輸入快速、準(zhǔn)確、直觀。
以上結(jié)合具體的實施方式對本發(fā)明作了較詳細(xì)的說明,不能認(rèn)為本發(fā)明的保護(hù)范圍只局限于上述的實施方式。對于發(fā)明所屬技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干簡單推演或替換,如果與本發(fā)明權(quán)力要求的技術(shù)方案沒有產(chǎn)生本質(zhì)上的區(qū)別,這些推演或替換仍然將被視為在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1,一種數(shù)字鍵盤漢字輸入法,其特征在于
(一)字根選定規(guī)則(1)以五個基本筆畫“一”、“丨”、“丿”、“丶”、“乙”作為字根;(2)以組字能力≥300字的在首偏旁,以及出現(xiàn)在字中或字末的部首或筆畫構(gòu)件作為字根;(3)組字能力≥100字,分拆字根超過二個的在首偏旁,分拆設(shè)置字根,目的是使其分拆只占兩碼;(4)以便于實現(xiàn)編碼字根最大化,漢字分拆難度較大的偏旁、部首、筆畫型,
“矛”、“巫”、
“爪”、“求”、
“尸”、“卩”、
作為字根;(5)將有兩種或多種“變形”的偏旁、部首或筆畫型,歸入同一個字根;
(二)字根鍵位布置規(guī)則(1)將五個基本筆畫字根“一”、“丨”、“丿”、“丶”、“乙”安排在五個不同鍵位里;(2)將
“艸”、“口”、“扌”、“亻”五個組字能力極強(qiáng)的在首偏旁字根安排在不同鍵位里,但可與五個基本筆畫同鍵位;(3) 將較多出現(xiàn)在字中或字末的部首或筆畫構(gòu)件字根如“十”、“二”、“三”、“人”、“八”、“丷”、“冂”、“亠”、“日”、“_”安排在不同鍵位里,并兼顧重碼最少以及筆畫形態(tài)相近;
(三)取碼編碼規(guī)則將分拆超過兩個字根的在首偏旁的字用兩個碼位表示,取碼時,首先從在首偏旁中按照筆順以第一筆實行字的首碼字根最大化,接著在偏旁中用未取筆畫按筆順實行字的第二碼字根最大化,這之后,偏旁中多出的筆畫不參加字的編碼;然后用四個碼位表示它們的部首;部首取碼時,先用部首按倒數(shù)順序以末筆實行字的末碼字根最大化;接著用部首未取筆畫按筆順實行字的第三碼字根最大化;再接著用部首未取筆畫按筆順實行字的第四碼字根最大化;然后用部首未取筆畫按筆順實行字的第五碼字根最大化,以上這種在首偏旁就稱之為舍筆畫取碼偏旁,并且只準(zhǔn)許它們占有兩個碼位;
對于非偏旁舍筆畫編碼字取碼時,首先按照筆順以字的在首筆畫實行首碼字根最大化;并用字的未取筆畫按倒數(shù)順序以末筆實行末碼字根最大化;接著用字的未取筆畫按筆順實行第二碼字根最大化;再接著用字的未取筆畫按筆順實行第三碼字根最大化;如此類推第四碼字根最大化,第五碼字根最大化;
在編碼過程中,編碼按順數(shù)碼位排列,而在實現(xiàn)字根最大化時,則按首碼、末碼、第二碼、第三碼、第四碼、第五碼的次序進(jìn)行,在發(fā)生被取碼筆畫相矛盾時,后者依次讓前者;
偏旁作為整體字或在字末時,不舍筆畫取碼;
字舍筆畫取兩碼在首偏旁如下“王”、“忄”、“石”、“犭”、“钅”、“魚”、“_”、
“革”、“齒”、“骨”、“酉”、“雨”、“舟”;
只有一個或兩個字根的字,其編碼為字根所在鍵位加聲母編號組成編碼。
2、如權(quán)利要求1所述的數(shù)字鍵盤漢字輸入法,其特征在于選定的字根數(shù)為60-80個。
3、如權(quán)利要求2所述的數(shù)字鍵盤漢字輸入法,其特征在于選定的字根數(shù)為65-75個。
4、如權(quán)利要求3所述的數(shù)字鍵盤漢字輸入法,其特征在于選定的字根為68個,所述字根在鍵盤上的位置如下表所示
5、如權(quán)利要求1-4之一所述的數(shù)字鍵盤漢字輸入法,其特征在于對編碼中漢字的筆順作如下規(guī)定對筆順作如下特別規(guī)定
(一)、從左到中,至右;在以“撇”、“捺”或“點”對稱排列在兩邊時,按兩種情況處理
(1)中間筆畫定位兩偏旁筆畫型,先中間,后兩邊;
(2)兩邊在上夾中交或夸筆畫型,先兩邊和“橫”,后中間;
(二)從上到下;
(三)兩筆畫相交,先“橫”后“豎”或“撇”;但在“冂”框、
框、“囗”框、“口”字、
框與“橫”相交時,“冂”、
“囗“、“口”、
結(jié)構(gòu)看成在上,為先,“橫”看成在下,為后,看成從上到下;
(四)兩筆畫相接,若有出頭時,出頭者為先,若無出頭成左上角時,看成先角上,后角下;
(五)、全包圍,左上右包圍、上左包圍、上右包圍字型,先外后里;
(六)、左下右包圍,左下包圍,上左下包圍字型,先里后外;而對于一些特殊的近于左下包圍的但卻難以認(rèn)定為左下包圍結(jié)構(gòu)的筆畫型如
(1)把筆畫
右上的筆畫看作被筆畫
左下包圍筆畫型,以筆畫
右上的筆畫為先;
(2)象“比”字左部筆畫型
、以及“匕”字等,同樣看作左下包圍筆畫型,先里后外;
(3)對于“鬼”“尬”、“氈”、“旭”、“飛”中的筆畫
或“乚”,不作為左下包圍筆畫型,把這些筆畫看作在左部分筆畫,以左部筆畫為先;
(4)由多筆畫組成的偏旁“辶”、“廴”看作左下包圍,除此以外,其它由多筆畫組合的類似筆畫型不視為左下包圍筆畫型;
(七)“點”在上部或左上,筆順為先。
6、如權(quán)利要求1-4之一所述的數(shù)字鍵盤漢字輸入法,其特征在于對漢字的筆畫結(jié)構(gòu)的認(rèn)定還有如下規(guī)定
(一)除字根“
”之外,所有“折”均看作字根“乙”;
(二)“提筆”為“橫”,如
字,但“橫”不為“提筆”;
(三)“亦”在字整體上部或部首上部時,筆畫型
均為兩“豎”;
(四)方框內(nèi)包有一筆畫者即認(rèn)定為“囗”框,不為“口”字;
(五)字根“二“、“三”、“_”中,筆畫位置處在最底下的“橫”為不短于上面的“橫”長,并且對于字根“三”,上面第一“橫”長還須不短于處在中間位置的“橫”長,否則都不認(rèn)定為該字根;
(六)漢字中存在多個“橫”的筆畫時,以最長的“橫”作為被取字根“十”、“大”、“木”、“廾”、“_”的筆畫;
(七)“豎鉤”變“豎”則依“豎”,“豎”變“豎鉤”則依“豎鉤”,但不包括“亦”在上時;
(八)部首“西”在字整體上部或部首上部時,“囗”框內(nèi)筆畫均為兩“豎”,但不包括部首“酉”、“酋”,即“酉”、“酋”中雖有筆畫型“西”,但不看作部首“西”,而把“酉”、“酋”看作整體構(gòu)字部件。
7、如權(quán)利要求1-4之一所述的數(shù)字鍵盤漢字輸入法,其特征在于所述字根,一般為筆畫相連,或為筆畫相交,或為筆順相連,或為筆畫位置相連續(xù),不存在被中插筆畫隔分;如字根被中插筆畫隔分,應(yīng)是“撇”、“捺”或“點”對稱排列在中插筆畫兩邊,筆順相連。
8、如權(quán)利要求1-4之一所述的數(shù)字鍵盤漢字輸入法,其特征在于還設(shè)置有第一重碼鍵、第二重碼鍵、第三重碼鍵和標(biāo)點符號鍵。
9、如權(quán)利要求1-4之一所述的數(shù)字鍵盤漢字輸入法,其特征在于雙字詞組編碼取各字的首碼、第二碼和末碼按詞組組字順序構(gòu)成;三字詞組編碼取各字的首碼、末碼按詞組順序構(gòu)成;四字以上詞組編碼取第一字的首碼、末碼和第二字的首碼、末碼以及第三字、最后一字的首碼按詞組組字順序構(gòu)成。
全文摘要
本發(fā)明公開了一種數(shù)字鍵盤漢字輸入法,選定字根數(shù)為60-80個,配置在10個數(shù)字鍵上;編碼規(guī)則將分拆超過兩個字根的在首偏旁的字首先從在首偏旁中按筆順以第一筆實行字的首碼字根最大化,接著在偏旁中用未取筆畫按筆順實行字的第二碼字根最大化,多出的筆畫不參加字的編碼;部首取碼時,先用部首按倒數(shù)順序以末筆實行字的末碼字根最大化;接著用部首未取筆畫按筆順依次實行字的第三、四、五碼字根最大化,以上這種在首偏旁就稱之為舍筆畫取碼偏旁;對于非偏旁舍筆畫編碼字取碼時,首先按照筆順以字的在首筆畫實行首碼字根最大化;并用字的未取筆畫按倒數(shù)順序以末筆實行末碼字根最大化;接著用字的未取筆畫按筆順依次實行第二、三、四、五碼字根最大化。
文檔編號G06F3/023GK101086686SQ20071003539
公開日2007年12月12日 申請日期2007年7月19日 優(yōu)先權(quán)日2007年7月19日
發(fā)明者劉飛林 申請人:劉飛林