專利名稱:一種用漢字及部首讀音編碼的漢字輸入方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字輸入方法,特別是用漢字及其拆分的部首等字根讀音編碼的漢字輸入方法。
背景技術(shù):
現(xiàn)有的漢字輸入技術(shù)很多,主要采用字形、字音及音形結(jié)合等方式編碼。字形碼以五筆字形為代表,優(yōu)點(diǎn)是速度較快、重碼少,缺點(diǎn)是字根拆分復(fù)雜,缺少規(guī)律性,難于記憶,難以學(xué)習(xí)掌握,給初學(xué)者帶來很大困難。字音碼以全拼音碼為代表,優(yōu)點(diǎn)是易學(xué)易記,缺點(diǎn)是重碼率高,效率低。音形碼以自然碼為代表,既兼有上述兩種碼的優(yōu)點(diǎn),又兼有它們的缺點(diǎn)。公開號(hào)為CN1262475A的專利文獻(xiàn)公開了一種漢字字音碼編碼方法,將漢字拆分為筆畫、成字元、常字元和異字元四種不同性質(zhì)的結(jié)構(gòu)成分,并以它們讀音的首字母歸入所對(duì)應(yīng)的英文字母鍵盤上。這種方法的優(yōu)點(diǎn)是利用了漢字字形結(jié)構(gòu)特征又兼顧其讀音,將漢字拆分單元和筆畫的讀音的音序作編碼,與鍵盤上的英文字母一一對(duì)應(yīng),易學(xué)易用;其缺點(diǎn)是字形單元拆分不科學(xué),缺乏規(guī)律生,不便記憶。
技術(shù)方案本發(fā)明的目的是提供一種形音結(jié)合以漢字及部首讀音編碼的漢字輸入方法。本發(fā)明的方案是將單個(gè)漢字拆分成部首、部首外的第一構(gòu)件和末構(gòu)件三個(gè)部分,部首及構(gòu)件取新華字典中規(guī)定的偏旁部首,取整字、部首、部首外的第一構(gòu)件和末構(gòu)件的讀音首字母對(duì)漢字編碼,并將該編碼對(duì)應(yīng)的漢字圖形信息存儲(chǔ)在計(jì)算機(jī)中,在標(biāo)有英文字母的鍵盤上按編碼順序輸入相對(duì)應(yīng)的字母,通過計(jì)算機(jī)處理顯示相應(yīng)的漢字。
為了減少重碼合理安排鍵位,部分偏旁部首安排在讀音首字母以外的其它鍵上。偏旁部首與鍵盤鍵位對(duì)應(yīng)如下丨丿彡
A魚(魚)水(氺)冫氵B比白貝(貝)鼻卜髟(BIAO)八(丷)宀冖 (包字頭)疒采(BIAN)C廠車(車)蟲赤齒(齒)辰臣寸艸廾D大斗(門)刀()豆歹丶亠灬刂E山肀聿屮彐(彑)二兒耳F方父缶風(fēng)(風(fēng))扌手G工廣革鬼骨瓜谷弓戈艮( )(GEN)H一戶火禾黑虍(虎字頭)I丨丬(PAN)爿(PAN)J幾見(見)己(巳已)斤巾角臼金钅(釒)K口囗匚冂凵L乙(也讀折)巛(俗讀三折)力立龍(龍)里老鹿鹵(鹵)耒(LEI)M木門(門)馬(馬)毛母(毋WU)米矛麻麥(麥)皿黽(黽)(MIN)N女牛( )鳥(鳥)O日月目曰P阝卩( )片皮攴(PO)疋( )(PI)Q其欠青氣犬犭R人入亻彳(俗讀雙站人)S四(罒)石示尸矢舌身食鼠礻饣纟(糸)厶(SI)殳(SHU)豕(SHI)T十士土田W王文瓦韋(韋)攵夂X心西(覀)血夕辛穴小()忄()
Y又用衣雨業(yè)頁(頁)言羊音羽幺(YAO)酉弋(YI)讠(言)衤尢(YOU)Z止自走足()子(孑JIE)竹()舟爪(爫)隹(ZHUI)豸(ZHI)辶( )廴括號(hào)中的字母是括號(hào)前部首的漢語拼音讀音,漢字為注釋。此外,八(丷)表示“八”和“丷”為一個(gè)部首,己(已巳)表示“己、已、巳”為一個(gè)部首,都依據(jù)《新華字典》。其中,按象形原則安排的和按首筆畫安排的情況如下丿彡它們象“/”安排在“/”鍵上山中聿中彐 它們象翻轉(zhuǎn)的“E”安排在E鍵上扌手它們象“f”安排在“F”鍵上丨丬爿 “丨”象“I”,“丬爿”含有“丨”,從“丨”安排,它們都安排在I鍵上乙巛它們象“L”安排在L鍵上日月目日“日月目”都是圓形的,象“O”,“日”從“日”安排在O鍵上阝卩它們象“P”安排在P鍵上十士它們象“t”安排在T鍵上亠 首筆畫為“丶”安排在D鍵上硬定的鍵位只有魚、水,它們一起放在A鍵上。
為了提高輸入速度,減少重碼率,上述構(gòu)件除取偏旁部首外,還增加一些擴(kuò)展件,擴(kuò)展件與鍵盤鍵位對(duì)應(yīng)如下B半匕不巴表北C才冊(cè)采長(長)镸(CHANG)產(chǎn)D丁電丹東(東)E爾F豐()非夫甫(FU)
G干古果甘J甲九竟擊井戔(JIAN)叚(JIA)疌(JIE)(卷字頭) K考開克L來吏M末N乃囊O Q七求S三申叟世Tナ天屯W無武五未午X乂(俗讀叉)孝先 (興字頭)Y由意于Z章專早中之丈在以上擴(kuò)展部件表中,“ナ、乂”按照象形原則安排、“ ”是“月”的變體從“月”安排,其它都以讀音首字母進(jìn)行安排的。
由于采用了以上方案,用漢字及偏旁部首讀音的首字母來取碼,既利用了漢字的結(jié)構(gòu)特點(diǎn),又兼顧其讀音,還避免了Z、C、S和ZH、CH、SH等發(fā)音不準(zhǔn)帶來的麻煩,凡是認(rèn)識(shí)漢字會(huì)用字典的人可以很方便地拆分取碼,具有易學(xué)易用易憶的特點(diǎn),入門非常方便,兼有五筆字型低重碼率的優(yōu)點(diǎn),可實(shí)現(xiàn)盲打。
具體實(shí)施例方式
本發(fā)明取整字、部首、部首外的第一構(gòu)件和末構(gòu)件的讀音首字母編碼,末構(gòu)件不存在時(shí)取字形識(shí)別碼,部首及構(gòu)件取新華字典中規(guī)定的189個(gè)偏旁部首,偏旁部首與鍵盤鍵位對(duì)應(yīng)如下/丿彡A魚(魚)水(氺)冫氵B比白貝(貝)鼻卜髟(BIAO)八(丷)宀冖 (包字頭)疒采(BIAN)C廠車(車)蟲赤齒(齒)辰臣寸艸廾D大斗(門)刀()豆歹丶亠灬刂E山肀聿中屮彐(彑)二兒耳F方父缶風(fēng)(凰)扌手G工廣革鬼骨瓜谷弓戈艮( )(GEN)H一戶火禾黑盧(虎字頭)I丨丬(PAN)爿(PAN)J幾見(見)己(巳已)斤巾角臼金钅(釒)K口囗匚凵L乙(也讀折)巛(俗讀三折)力立龍(龍)里老鹿鹵(鹵)耒(LEI)M木門(門)馬(馬)毛母(毋WU)米矛麻麥(麥)皿黽(黽)(MIN)N女牛( )鳥(烏)O目月目曰P阝卩( )片皮攴(PO)疋( )(PI)Q其欠青氣犬犭R人入亻彳(俗讀雙站人)S四(罒)石示尸矢占身食鼠礻饣纟(糸)厶(SI)殳(SHU)豕(SHI)T十士土田
W王文瓦韋(韋)攵夂X心西(面)血夕辛穴小()忄()Y又用衣雨業(yè)頁(頁)言羊音羽幺(YAO)酉弋(YI)讠(言)衤尢(YOU)Z止自走足()子(孑JIE)竹()舟爪(爫)隹(ZHUI)豸(ZHI)辶( )廴部首取碼按多優(yōu)先、大優(yōu)先、左優(yōu)先、上優(yōu)先、外優(yōu)先、整字部首優(yōu)先的原則,多優(yōu)先即單筆畫部首讓多筆畫部首,如“百”有“一”和“白”兩部首,取“白”為部首;大優(yōu)先即在同一位置有兩個(gè)部首時(shí),取大的為部首,如“衷”有“亠”和“衣”兩個(gè)部首,取“衣”為部首;左優(yōu)先即左面的比右面的部首優(yōu)先,如“劉”取左面的“文”作部首;上優(yōu)先即上面的比下面的部首優(yōu)先,如“盤”取上面的“舟”作部首;外優(yōu)先即外面的比里面的部首優(yōu)先,如“句”取外面的“勹”作部首;整字部首優(yōu)先即一個(gè)字能拆分成另一個(gè)字和部首時(shí),取這部首(稱為整字部首)而不取另一個(gè)字中的構(gòu)件為部首,如“麓”可以拆分成“林”和“鹿”,取“鹿”而不取“林”中的“木”為部首。
上述構(gòu)件除取偏旁部首外,還增加一些擴(kuò)展件,擴(kuò)展件與鍵盤鍵位對(duì)應(yīng)如下B半匕不巴表北C才冊(cè)采長(長)镸(CHANG)產(chǎn)D丁電丹東(東)E爾F豐()非夫甫(FU)G干古果甘J甲九竟擊井戔(JIAN)叚(JIA)疌(JIE) (卷字頭)K考開克L來吏M末
N乃囊O Q七求S三申叟世Tナ天屯W無武五未午X乂(俗讀叉)孝先 (興字頭)Y由意于Z章專早中之丈構(gòu)件取碼按大優(yōu)先原則,即部首與部首之間、部首與擴(kuò)展件之間筆畫多的優(yōu)先,如“辣”第一構(gòu)件取“木”而不是“一”或“十”,“蕪”第一構(gòu)件取擴(kuò)展件“無”而不取“一”或“二”。
字形結(jié)構(gòu)分上下型、左右型、內(nèi)外型和雜合型,分別對(duì)應(yīng)的識(shí)別碼為“I”、“U”、“N”、“/”。
漢字編碼舉例如下字 拆分 編碼字 拆分 編碼百 百+白+一+上下型 BBHI劉 劉+文+刂+左右型 LWDU盤 盤+舟+皿+上下型 PZMI束 束+木+口+雜合型 SMK/麓 麓+鹿+木+木 LLMM長 長+/+一+丶 C/HD蕪 蕪+艸+無+上下型 WCWI剩 剩+刂+禾+北 SDHB愿 愿+心+廠+小 YXCX辣 辣+辛+木+口 LXMK部首字的編碼在189個(gè)標(biāo)準(zhǔn)偏旁部首中有不少本身也是漢字,如“石”,可以取整字+部首兩碼來編碼即列入二組級(jí)簡碼?!笆睘镾S?;蛘甙凑G闆r編碼,部首為虛擬部首,如石=石(整字石)+口(虛擬部首)+一+/,編碼為SKH/。第一種編碼可免拆,第二種編碼可實(shí)現(xiàn)盲打。部首字比較難拆,為輸入方便安排雙碼。
生字難字等不知道讀音的漢字其讀音首字母用“丶”鍵作為生字替代碼由計(jì)算機(jī)進(jìn)行查找。如“檐”編碼為MDY,“詹”編碼為`DCY。GBK字符集中的組合字其讀音用“;”鍵作為組合字讀音替代碼,其它同正常字。如瓩(讀“千瓦”)、囍(讀“雙喜”),它們的編碼分別為;W/T、;TKK。
詞組的編碼雙字詞取每個(gè)字的前兩碼,如“現(xiàn)代”編碼為XWDR。雙字詞中的部首字,按第一種編碼取碼,如“革新”編碼為GGXJ,“用戶”為YYHH。三字詞取三個(gè)字的第一個(gè)碼+標(biāo)志符“;”,如“說明書”編碼為SMS;。四字或多字詞取前三字和末字的第一個(gè)碼,如“振興中華”編碼為ZXZH,“不到長城非好漢”編碼為BDCH。
重碼解決方案一是盡量將全碼重碼的字安排進(jìn)一級(jí)簡碼、二級(jí)簡碼和三級(jí)簡碼字;二是將“贏”、“嬴”等字安排了兩種編碼,一種是按上述正常編碼,如贏和嬴的編碼均為YDLD,另一種取特征位構(gòu)件編碼,如贏和嬴的區(qū)別特征位的構(gòu)件分別為“貝”和“女”,將特征位構(gòu)件代替部首碼,則“贏”的編碼為YBDD,“嬴”的編碼為YNDD。安排兩種編碼的益處在于如果使用者不知道是特征字,按正常編碼輸入,仍然可以找到此類字;另一種編碼是為了方便進(jìn)行無重碼輸入的。
本發(fā)明的編碼,一級(jí)簡碼字23個(gè)、二級(jí)簡碼字549個(gè)、三級(jí)簡碼字4270個(gè)。
本發(fā)明的編碼順序也可采用以下兩中形式①部首、部首外的第一構(gòu)件、末構(gòu)件和整字的讀音首字母編碼;②部首、部首外的第一構(gòu)件、整字和末構(gòu)件的讀音首字母編碼。
本發(fā)明在手機(jī)或數(shù)字鍵盤上用數(shù)字進(jìn)行漢字輸入時(shí),即為數(shù)碼。在手機(jī)上使用,其對(duì)應(yīng)關(guān)系同手機(jī),即2-ABC 3-DEF 4-GHI 5-JKL 6-MNO 7-PQRS 7-TUV 9-WXYZ;在微機(jī)和沒有標(biāo)記英文字母鍵的其它設(shè)備的數(shù)字鍵盤上,其數(shù)字鍵與字母鍵的對(duì)應(yīng)關(guān)系也可以為1-ABC 2-DEF 3-GHI 4-JKL 5-MNO 6-PQR 7-STU 8-VWX 9-YZ。單字取碼方法為整字、部首、第一構(gòu)件、末構(gòu)件的讀音首字母對(duì)應(yīng)的數(shù)字再加上漢字末兩筆筆畫對(duì)應(yīng)的數(shù)字。在手機(jī)中,其中部首和構(gòu)件中的“/”用“I”代替,其末兩筆筆畫,按“一、丨、/、丶、乙”的順序依次對(duì)應(yīng)的數(shù)字鍵為“2、3、4、5、6”五個(gè)鍵;在微機(jī)和其它無標(biāo)記的數(shù)字鍵盤上,末兩筆畫也可以依次對(duì)應(yīng)數(shù)字鍵“1、2、3、4、5”。下面以NOKIA3310手機(jī)為例單字編碼舉例如下單字 拆分 編碼 數(shù)碼簡碼壁壁+土+尸+辛+丨+一 B+T+S+X+3+2 287932 2879好好+女+子+左右型+乙+一 H+N+Z+U+6+2 469862 46情情+忄+青+左右型+一+一 Q+X+Q+U+2+2 797822 797午午+/+干+雜合型+一+丨 W+/+G+/+2+3 914123 91詞組編碼a.兩字詞取前字前兩碼+后字前兩碼+7,如希冀=希+巾+冀+八+7X J J B 7其數(shù)碼為95527b.三字詞取第一、第二、第三字的首字母+88,如革命家=革+命+家+88G M J 88其數(shù)碼為46588。
c.多字詞取一、二、三、末的首字母+9,如其實(shí)不然=其+實(shí)+不+然+9Q S B R 9其數(shù)碼為77279。
人才交流中心=人+才+交+心+9
R C J X 9其編碼為72599。
d.外來詞按碼直接輸入,不足5碼部分全以1補(bǔ)足。
有一部分詞語我們習(xí)慣以英文表示,如電子郵件、亞太經(jīng)合組織、世貿(mào)組織、中央電視臺(tái)等,分別以EMAI、APEC、WTO、CCTV等表示。在數(shù)碼中直接映射,不足部分補(bǔ)9。它們的編碼分別是36241、27321、98611、22881等。
由以上規(guī)定可知,字的編碼第5位、第6位只能是“2,3,4,5,6”,而詞的編碼的第5位則只能是“1、7、8、9”,所以字詞互不交叉。
標(biāo)點(diǎn)符號(hào)系統(tǒng)用1表示,它們是,。;“”‘’、!《》〈〉()……—該數(shù)碼一級(jí)簡碼字8個(gè),二級(jí)簡碼字72個(gè),三級(jí)簡碼字591個(gè),四級(jí)簡碼字2528個(gè),五級(jí)字3052個(gè)。
該數(shù)碼以“*”鍵為查詢鍵,當(dāng)不知道部首或部件的取碼時(shí),用“*”代替?!?”相當(dāng)于一般輸入法中“?”的作用。以“0”為翻頁鍵,以選擇相同編碼的詞組。
由于手機(jī)上的數(shù)字鍵直接刻上了英文26個(gè)字母,所以使用此數(shù)碼時(shí),不用思考,見字知碼。這樣手機(jī)就擁有了完全意義上的快速通信功能。手機(jī)持有者就會(huì)找到一種在電腦上輸入漢字的那種感覺。
權(quán)利要求
1.一種用漢字及偏旁部首讀音編碼的漢字輸入方法,其特征在于將單個(gè)漢字拆分成部首、部首外的第一構(gòu)件和末構(gòu)件三個(gè)部分,部首及構(gòu)件取新華字典中規(guī)定的偏旁部首,取整字、部首、部首外的第一構(gòu)件和末構(gòu)件的讀音首字母對(duì)漢字編碼,并將該編碼對(duì)應(yīng)的漢字圖形信息存儲(chǔ)在計(jì)算機(jī)中,在標(biāo)有英文字母的鍵盤上按編碼順序輸入相對(duì)應(yīng)的字母,通過計(jì)算機(jī)處理顯示相應(yīng)的漢字。
2.根據(jù)權(quán)利要求1所述的漢字輸入方法,其特征在于所述末構(gòu)件不存在時(shí)根據(jù)漢字的字形結(jié)構(gòu),將漢字分為上下型、左右型、內(nèi)外型和雜合型四種,并在鍵盤上取相應(yīng)的四個(gè)鍵作為識(shí)別碼。
3.根據(jù)權(quán)利要求2所述的漢字輸入方法,其特征在于所述偏旁部首與鍵盤鍵位對(duì)應(yīng)如下/丿彡A魚(魚)水(氺)冫氵B比白貝(貝)鼻卜髟(BIAO)八(丷)宀冖 (包字頭)疒采(BIAN)C廠車(車)蟲赤齒(齒)辰臣寸艸廾D大斗(門)刀()豆歹丶亠灬刂E山肀聿屮彐(彑)二兒耳F方父缶風(fēng)(風(fēng))扌手G工廣革鬼骨瓜谷弓戈艮( )(GEN)H一戶火禾黑虍(虎字頭)I丨丬(PAN)爿(PAN)J幾見(見)己(巳已)斤巾角臼金钅(釒)K口囗匚冂凵L乙(也讀折)巛(俗讀三折)力立龍(龍)里老鹿鹵(鹵)耒(LEI)M木門(門)馬(馬)毛母(毋WU)米矛麻麥(麥)皿黽(黽)(MIN)N女牛( )鳥(鳥)O日月目日P阝卩( )片皮攴(PO)疋 )(PI)Q其欠青氣犬犭R人入亻彳(俗讀雙站人)S四(罒)石示尸矢舌身食鼠礻饣纟(糸)厶(SI)殳(SHU)豕(SHI)T十士土田W王文瓦韋(韋)攵夂X心西(覀)血夕辛穴小()忄()Y又用衣雨業(yè)頁(頁)言羊音羽幺(YAO)酉弋(YI)讠(言)衤尢(YOU)Z止自走足()子(孑JIE)竹()舟爪(爫)隹(ZHUI)豸(ZHI)辶( )廴;構(gòu)件除取偏旁部首外,還增加了一些擴(kuò)展件,擴(kuò)展件與鍵盤鍵位對(duì)應(yīng)如下B半匕不巴表北C才冊(cè)采長(長)镸(CHANG)D丁電丹東(東)E爾F豐()非夫甫(FU)G干古果甘J甲九竟擊井戔(JIAN)叚(JIA)疌(JIE) (卷字頭)K考開克L來吏M末N乃囊O Q七求S三申叟世Tナ天屯W無武五未午X乂(俗讀叉)孝先 (興字頭)Y由意于Z章專早中之丈。
4.根據(jù)權(quán)利要求3所述的漢字輸入方法,其特征在于所述部首取碼按多優(yōu)先、左優(yōu)先、上優(yōu)先、外優(yōu)先的原則,即單筆畫部首讓多筆畫部首、上面的比下面的部首優(yōu)先、外面的比里面的部首優(yōu)先;所述構(gòu)件取碼按大優(yōu)先原則,即偏旁部首與偏旁部首之間、偏旁部首與擴(kuò)展件之間筆畫多的優(yōu)先。
5.根據(jù)權(quán)利要求2或3或4所述的漢字輸入方法,其特征在于上下型、左右型、內(nèi)外型和雜合型四種字形結(jié)構(gòu)對(duì)應(yīng)的識(shí)別碼分別為“I”、“U”、“N”、“/”;“丶”為生字替代碼;“;”為組合字讀音替代碼。
6.一種按權(quán)利要求1或2或3或4所述方法用于手機(jī)或數(shù)字鍵盤的漢字輸入方法,其特征在于將取碼涉及到的鍵盤鍵位分配給相應(yīng)的數(shù)字鍵,按其編碼順序取對(duì)應(yīng)的數(shù)字再加上漢字末筆筆畫對(duì)應(yīng)的數(shù)字對(duì)漢字編碼,其末筆畫分為“一、丨、/、丶、乙”五種,并在手機(jī)或數(shù)字鍵盤上取對(duì)應(yīng)的數(shù)字鍵。
7.根據(jù)權(quán)利要求6所述的漢字輸入方法,其特征在于還取漢字倒數(shù)二筆筆畫對(duì)漢字編碼,其筆畫種類及對(duì)應(yīng)的數(shù)字鍵與上述末筆畫相同。
8.根據(jù)權(quán)利要求7所述的漢字輸入方法,其特征在于數(shù)字鍵與字母對(duì)應(yīng)如下1-/、2-ABC、3-DEF、4-GHI、5-JKL、6-MNO、7-PQRS、8-TUV、9-WXYZ;在數(shù)字鍵盤上數(shù)字鍵與字母也可以對(duì)應(yīng)如下1-/ABC、2-DEF、3-GHI、4-JKL、5-MNO、6-POR、7-STU、8-VWX、9-YZ。
9.根據(jù)權(quán)利要求8所述的漢字輸入方法,其特征在于五種末筆畫按上述順序?qū)?yīng)的數(shù)字鍵在手機(jī)上為2、3、4、5、6;在數(shù)字鍵盤上也可以為1、2、3、4、5。
10.根據(jù)權(quán)利要求9所述的漢字輸入方法,其特征在于兩字詞組按每字的前兩碼加上7取碼;三字詞組按每字的第一碼加上88取碼;多字詞組按前三字及末位字的首碼加上9取碼。
全文摘要
本發(fā)明一種形音結(jié)合以漢字及部首讀音編碼的漢字輸入方法,將單個(gè)漢字拆分成部首、部首外的第一構(gòu)件和末構(gòu)件三個(gè)部分,部首及構(gòu)件取新華字典中規(guī)定的偏旁部首,取整字、部首、部首外的第一構(gòu)件和末構(gòu)件的讀音首字母對(duì)漢字編碼,并將該編碼對(duì)應(yīng)的漢字圖形信息存儲(chǔ)在計(jì)算機(jī)中,在標(biāo)有英文字母的鍵盤上按編碼順序輸入相對(duì)應(yīng)的字母,通過計(jì)算機(jī)處理顯示相應(yīng)的漢字。用漢字及偏旁部首讀音取碼,兼顧漢字的結(jié)構(gòu)和讀音,避免了Z、C、S和ZH、CH、SH等發(fā)音不準(zhǔn)帶來的麻煩,拆分取碼方便,易學(xué)易用易記,入門方便,可盲打。
文檔編號(hào)G06F3/023GK1420424SQ02106359
公開日2003年5月28日 申請(qǐng)日期2002年3月1日 優(yōu)先權(quán)日2002年3月1日
發(fā)明者詹龍忠 申請(qǐng)人:詹龍忠