專利名稱:新音形編碼漢字輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于漢字編碼輸入法,特別涉及一種適用于移動(dòng)通信設(shè)備小鍵盤的音形編碼漢字輸入法。
背景技術(shù):
近幾年來,漢字的輸入技術(shù)層出不窮,五花八門,一般可將其分為以音為主、以形為主和音形結(jié)合三大類。這些輸入法,各有各的特點(diǎn)及應(yīng)用的范圍。眾多的漢字輸入法中,能獲得廣泛應(yīng)用并不多,特別是適用于移動(dòng)通信設(shè)備的數(shù)字鍵盤或單獨(dú)用標(biāo)準(zhǔn)鍵盤的數(shù)字小鍵盤輸入漢字的就更少。本人在中國(guó)專利ZL200710030925. 0中提出一種音形編碼漢字輸入法,其特征在于按照先取漢字首拼音I個(gè)音碼,后按筆順次序取該漢字的前3形碼及末I形碼,音碼形碼加在一起對(duì)漢字進(jìn)行編碼;當(dāng)漢字形碼不足4碼時(shí),有幾碼就取幾碼;音碼形碼分別用數(shù)字代表,分別對(duì)應(yīng)鍵盤數(shù)字鍵,然后擊鍵輸入漢字;
音碼,即漢字首拼音字母代碼ab、C、def、gh、jkl、mno、pqr、st、wxy分別用I至9作為其代碼,即I代表a或b,2代表c,依此類推,9代表w或X或y,z用0作為其代碼;形碼,即漢字的筆畫代碼將漢字的所有筆畫按特征分為8類,并分別用I至8作為其代碼,即用I代表“橫”(一),用2代表“豎”(丨),用3代表“撇” (J ),用4代表“點(diǎn)”(、),用5代表“捺”(\),用6代表“橫折”,泛指所有起筆為橫而隨后又折彎的,不論其向什么方向折彎,以及怎么折彎,都?xì)w入“橫折”這一類,如I、、、巧、乙、I等,用7代表“豎折”,泛指所有起筆為豎而隨后又折彎的,不論其向什么方向折彎,以及怎么折彎,都?xì)w入“豎折”這一類,如J、L山、L等,用8代表所有其它筆畫,如人“撇折”、〈“撇點(diǎn)”、“提”、“斜鉤”、“彎鉤”、“臥鉤”等。本發(fā)明形碼也指漢字的高頻部件代碼,即將構(gòu)成漢字的高頻部件“?、*、#、木”分別用5、6、7、8作為其代碼,將構(gòu)成漢字的高頻部件“ 口”及“日、目、田”用9作為其代碼;在漢字取形碼時(shí),若有上述部件,則用部件代碼,否則,仍用筆畫代碼。上述發(fā)明具有易學(xué)易用、見字識(shí)碼、重碼率低、無論常用字和偏僻字都能輕松輸入,結(jié)合計(jì)算機(jī)智能界面軟件的實(shí)現(xiàn),可顯著減少擊鍵次數(shù),從而比其它輸入法快幾倍高效輸入等諸多優(yōu)點(diǎn)。然而,考慮到目前大多數(shù)人仍習(xí)慣用拼音輸入法,盡管拼音輸入法存在重碼率高、擊鍵次數(shù)多、拼音不準(zhǔn)及許多偏僻字讀音困難無法輸入等缺點(diǎn),但它對(duì)常用字想音打字、取碼自然的優(yōu)點(diǎn),正適合對(duì)輸入速度要求不高的大多數(shù)人群。發(fā)明人在深入研究和實(shí)踐基礎(chǔ)上發(fā)現(xiàn),原來在電腦大鍵盤上的雙拼輸入法之所以不能取代全拼輸入法,與其需要記憶韻母與其相應(yīng)代碼的對(duì)應(yīng)關(guān)系有關(guān)。而現(xiàn)在智能手機(jī)可以實(shí)現(xiàn)將韻母與軟鍵盤的對(duì)應(yīng)關(guān)系動(dòng)態(tài)刻畫在軟鍵盤面板上,既直觀又可以讓用戶不必記憶韻母相對(duì)應(yīng)的代碼,從而達(dá)到零難度上手!因此,發(fā)明人在統(tǒng)計(jì)分析基礎(chǔ)上,發(fā)明改進(jìn)了一種既發(fā)揮上述音形編碼輸入法和雙拼輸入法高效輸入優(yōu)點(diǎn),又能適合更廣泛拼音用戶群體的新音形編碼漢字輸入法。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種易學(xué)、易用、重碼率更少又能適合更廣泛用戶群體的漢字輸入法,該漢字輸入法特別適用于移動(dòng)通信設(shè)備的數(shù)字鍵盤及標(biāo)準(zhǔn)鍵盤的數(shù)字小鍵盤輸入漢字。本發(fā)明是這樣實(shí)現(xiàn)的一種新音形編碼漢字輸入法,其特征在于按照先取漢字兩個(gè)音碼,分別為漢字首拼音和韻母代碼,后按筆順次序取該漢字的前3形碼,音碼形碼加在一起對(duì)漢字進(jìn)行編碼;當(dāng)漢字形碼不足3碼時(shí),有幾碼就取幾碼。為敘述方便,音碼形碼分別用數(shù)字代表,分別對(duì)應(yīng)鍵盤數(shù)字鍵,然后擊鍵輸入漢字。音碼分為兩部分,首先是漢字首拼音字母代碼ab、C、def、gh、jkl、mno、pqr、st、wxy分別用數(shù)字I至9作為其代碼,即I代表a或b,2代表c,依此類推,9代表w或x或y,z用0作為其代碼;接著是韻母代碼,分別為1代表i,2代表a、ao或ai,3代表e、er或ei,
4代表 ia、ian、iao 或 iang, 5 代表 an 或 ang, 6 代表 en 或 eng, 7 代表 ie、in、ing、iong 或iu, 8 代表 U、ii, 9 代表 ua、uan、uang、ui、un 或 ue, 0 代表 O、ou、ong 或 uoD形碼將漢字的所有筆畫按特征分為8類,并分別用數(shù)字I至8作為其代碼,即用I代表“橫”(一),用2代表“豎”(丨),用3代表“撇” (J ),用4代表“點(diǎn)”(、),用5代表“捺”(\),用6代表“橫折”,泛指所有起筆為橫而隨后又折彎的,不論其向什么方向折彎,以及怎么折彎,都?xì)w入“橫折”這一類,如I、、、乙、I等,用7代表“豎折”,泛指所有起筆為豎而隨后又折彎的,不論其向什么方向折彎,以及怎么折彎,都?xì)w入“豎折”這一類,如J、匕山、L等,用8代表所有其它筆畫,如人“撇折”、< “撇點(diǎn)”、“提”、“斜鉤”、“彎鉤”、“臥鉤”等。本發(fā)明所述的新音形編碼漢字輸入法,其中形碼也指漢字的高頻部件代碼,即將構(gòu)成漢字的高頻部件、*、子、木”分別用數(shù)字5、6、7、8作為其代碼,將構(gòu)成漢字的高頻部件“口”及“日、目、田”用數(shù)字9作為其代碼;在漢字取形碼時(shí),若有上述部件,則用部件代碼,否則,仍用筆畫代碼。本發(fā)明輸入法可用于漢語詞組,對(duì)每個(gè)詞組仍取音形共5碼代表之,其取碼規(guī)則如下
(1)對(duì)2字詞組,先取首字前兩碼,后取末字前三碼,即先取首字兩音碼,后取末字兩音碼及首形碼;
(2)對(duì)3字詞組,先取首字首碼,后取第二、三字前兩碼,即先取首字的首拼音碼,次取次字兩音碼,后取末字兩音碼;
(3)對(duì)4字詞組,依次取各字首碼,即首拼音音碼,及末字第二碼即韻母代碼,
(4)對(duì)5字及以上的多字詞組,依次取前4字及末字的首碼,即前4字及末字的首拼音碼。
本發(fā)明所述的新音形編碼漢字輸入法,對(duì)于不懂讀音無法取音碼或取某一形碼有困難的漢字,該代碼用數(shù)字鍵盤上的“ * ”鍵代替,其余代碼仍按次序輸入。本發(fā)明新音形編碼漢字輸入法,其中韻母組合是按照其發(fā)音特點(diǎn)和漢字韻母頻率分布組合而來的,其數(shù)字代碼則是根據(jù)其鍵盤物理布局和韻母的音形特點(diǎn)等因素綜合考慮設(shè)計(jì)出來的。它將很多用戶難以區(qū)分的韻母及介音組合放置在同一個(gè)按鍵上,極大地解決了很多用戶拼音拼不準(zhǔn)的問題,真正做到了好記好用。本發(fā)明采用音形結(jié)合的輸入方法,具有輸入速度快、易學(xué)、易用、重碼率更少的特點(diǎn)。該輸入法還采用字詞合一輸入技術(shù),可進(jìn)一步減少擊鍵次數(shù)和切換次數(shù),提高輸入速率2至5倍,達(dá)到比聯(lián)想輸入法快I至4倍,比手寫筆輸入法快I至5倍且更易學(xué)易用又更方便,比語句輸入法更實(shí)用、快速的效果。
具體實(shí)施方 式本發(fā)明按照漢字先取首拼音和韻母共兩個(gè)音碼,后按筆順次序取該漢字的前3形碼,音碼形碼加在一起對(duì)漢字進(jìn)行編碼;當(dāng)漢字形碼不足3碼時(shí),有幾碼就取幾碼;音碼形碼分別用數(shù)字代表,分別對(duì)應(yīng)鍵盤數(shù)字I 一 9及0鍵,然后擊鍵輸入漢字;
本發(fā)明在首拼音取碼方面自動(dòng)解決了讀音不準(zhǔn)的困難,不必區(qū)分z、Zh, C、Ch, S、Sh等讓人頭痛的問題,即聲母z、zh等首拼音相同,用同一鍵標(biāo)識(shí)而不必區(qū)分。在首拼音標(biāo)識(shí)方面,由于其與目前手機(jī)數(shù)字鍵盤上的英文字母標(biāo)識(shí)大多數(shù)相同,且次序一致,只有三個(gè)用的最多的z、c、s作了適當(dāng)調(diào)整z用0即“zero”的首字母標(biāo)識(shí)、c單獨(dú)用2標(biāo)識(shí)而將原ab調(diào)整到I標(biāo)識(shí)、s轉(zhuǎn)移到用8標(biāo)識(shí)。這樣,在方便記憶的同時(shí),卻帶來了降低重碼率的好處。在韻母取碼方面,通過分析韻母發(fā)音規(guī)律和對(duì)GB2312-80字庫(kù)及其一級(jí)字庫(kù)、前128,256,512,1000和2000高頻字/常用字的韻母分布詳細(xì)統(tǒng)計(jì),將韻母(含介音)32種(不區(qū)分u/il)組合,根據(jù)常使用的頻率均勻分成10類,分布在10個(gè)數(shù)字按鍵之上,使得各鍵上韻母方便記憶。按發(fā)音特點(diǎn),本輸入法將an與ang、en與eng、in與ing分別分布在同一按鍵位置上,用戶便可不再糾結(jié)于判斷漢字的前鼻音后鼻音;將以ia開頭的韻母放到4鍵上,將以a開頭的韻母放到2鍵上,將以e開頭的韻母放到3鍵上,將u與U放在8鍵上,這些開頭的字母與在傳統(tǒng)T9手機(jī)鍵盤上的位置相同;將與數(shù)字0外形相似的字母O開頭的韻母安排在0鍵上,將同音且形似的韻母i安排在I鍵上,極大地方便了用戶對(duì)代碼的記憶。用戶只需要知道某個(gè)按鍵上對(duì)應(yīng)的是哪個(gè)字母開頭的韻母就可以了,而不必再細(xì)細(xì)記憶某個(gè)韻母到底在哪個(gè)按鍵上。這些設(shè)計(jì)有效地克服了傳統(tǒng)拼音輸入法的不足,極大提高了輸入效率。目前本輸入法可以在當(dāng)下最流行的智能手機(jī)系統(tǒng)平臺(tái)Android上,實(shí)現(xiàn)屏幕軟鍵盤面板上動(dòng)態(tài)顯示各個(gè)代碼的首拼音、韻母及筆畫和高頻部件,用戶不再需要主動(dòng)記憶各個(gè)按鍵分布便可以直觀使用。真正做到了易學(xué)易用,零難度上手!
從上面的介紹可以看出,本漢字輸入法,符合人們的拼讀及書寫習(xí)慣,即輸入漢字時(shí),想到其讀音,所以先取音碼,然后聯(lián)想到其書寫,所以取形碼。本漢字輸入法在輸入漢字過程中,只用到“I” “9”以及“0”十個(gè)數(shù)字鍵,且很少會(huì)出現(xiàn)模棱兩可的歧義讀音及筆畫和部件;其次,在取碼過程中,對(duì)筆畫的分類反應(yīng)速度快,且按筆順次序取碼反應(yīng)速度也快;本編碼方案的附加規(guī)則少,容易學(xué),容易記;還有,有了“容錯(cuò)碼”,用戶不必再為書寫習(xí)慣和拼音不標(biāo)準(zhǔn)而發(fā)愁了!而使用“模糊”查找功能,不再有難字!最后,本編碼方案的重碼率很低,尤其在加入了少數(shù)幾個(gè)高頻部件以后,完全符合高效輸入的要求。目前手機(jī)上拼音輸入法的使用比較廣泛,拼音輸入法雖然比較容易上手,但是它是以發(fā)音為基礎(chǔ)進(jìn)行編碼的。目前很多用戶特別是南方的和年齡比較大的用戶拼音都拼不準(zhǔn),勉強(qiáng)能發(fā)音,又很難區(qū)分平舌音與翹舌音、前鼻音與后鼻音,這樣使用傳統(tǒng)的拼音輸入法對(duì)他們來說就 非常不方便。另外,因?yàn)闈h字是按字形來構(gòu)造的,而拼音是按發(fā)音來編碼而且無法區(qū)分音調(diào),這樣就會(huì)造成拼音輸入法的重碼率比較高,輸入同樣的拼音對(duì)應(yīng)的漢字會(huì)相當(dāng)多,常常需要翻頁導(dǎo)致輸入效率不高。而筆畫輸入法雖然重碼率低,但是要求用戶記住漢字的筆畫順序,用戶體驗(yàn)不好。本發(fā)明極好地解決了以上各種不足,拼音方面易記易用,幫助用戶解決拼音拼不準(zhǔn)的問題;形碼取漢字容易記憶的前三筆畫,方便自然,有效地降低了重碼率,讓翻頁不再頻繁,充分集成拼音和筆畫輸入法的優(yōu)點(diǎn)。目前使用拼音輸入法的用戶人數(shù)最多,本輸入法切合這些用戶的使用習(xí)慣,加入簡(jiǎn)單的筆畫輸入有效地降低了輸入的重碼率,提高了輸入效率,特別適用于拼音拼不準(zhǔn)的南方和大齡用戶。
實(shí)施例欽其首拼音是q代碼為7、韻母是in代碼為7、前3筆畫是“撇”(j)、“橫”(一)、“橫”(一),那么整個(gè)編碼是77311。訂其首拼音是d代碼為3、韻母是ing代碼為7、前3筆畫是“點(diǎn)”、“橫折”、“橫”,所以整個(gè)編碼是37461。陳26代32七711五9812坤59128。大學(xué)這是2字詞組,按取碼規(guī)則應(yīng)取首字的前2代碼d、a及后字的前3代碼X、ue、“點(diǎn)”(、),共5碼組成,所以整個(gè)詞的編碼是32994。梧前2代碼mi是98,用高效編碼,前3筆畫或部件分別為“木”代碼是8,“一”代碼是1,“ I ”代碼是2,合起來編碼是98812;若用簡(jiǎn)易編碼,前3筆畫分別為“一”,“[”,“ J ”,所以簡(jiǎn)易編碼是98123。計(jì)算機(jī)編碼是58951。車23181;受行草書影響,容錯(cuò)碼是23182或23171。必標(biāo)準(zhǔn)11484;容錯(cuò)11474。
權(quán)利要求
1.一種新音形編碼漢字輸入法,其特征在于按照先取漢字兩個(gè)音碼,分別為漢字首拼音和韻母代碼,后按筆順次序取該漢字的前3形碼,音碼形碼加在一起對(duì)漢字進(jìn)行編碼;當(dāng)漢字形碼不足3碼時(shí),有幾碼就取幾碼;音碼、形碼分別用數(shù)字代表,并對(duì)應(yīng)鍵盤數(shù)字鍵,然后擊鍵輸入漢字; 音碼分為兩部分,其中漢字首拼音字母ab、C、def、gh、jkl、mno、pqr、st、wxy、z分別用數(shù)字I至9、0作為其代碼,即I代表a或b,2代表c,依此類推,z用0作為其代碼;韻母代碼分別為1代表i,2代表a、ao或ai, 3代表e、er或ei, 4代表ia、ian、iao或iang,5代表an或ang, 6代表en或eng, 7代表ie、in、ing、iong或iu, 8代表u或ii, 9代表ua、uan> uang> ui、uri 或 ue, 0 代表 O、ou、ong 或 uo ; 形碼將漢字的所有筆畫按特征分為8類,并分別用數(shù)字I至8作為其代碼,即用I代表“橫”(一),用2代表“豎”([),用3代表“撇” (J ),用4代表“點(diǎn)”(、),用5代表“捺”(乂),用6代表“橫折”(I、、、3、乙等),泛指所有起筆為橫而隨后又折彎的筆畫,用7代表“豎折”(J、L山、L等),泛指所有起筆為豎而隨后又折彎的筆畫,用8代表所有其它筆畫,如“撇折”(ZJ、“撇點(diǎn)”(<)、“提”、“斜鉤”、“彎鉤”、“臥鉤”等。
2.根據(jù)權(quán)利要求I所述的音形編碼漢字輸入法,其特征在于形碼也指漢字的高頻部件代碼,即將構(gòu)成漢字的高頻部件“?”、“木”分別用數(shù)字5、6、7、8作為其代碼,將“ 口 ”、“日”、“目”、“田”用數(shù)字9作為其代碼;在漢字取形碼時(shí),若有上述部件,則用部件代碼,否則,仍用筆畫代碼。
3.根據(jù)權(quán)利要求I或2所述的音形編碼漢字輸入法,其特征在于本輸入法輸入漢語詞組時(shí),對(duì)每個(gè)詞組仍取音形共5碼代表之,其編碼規(guī)則如下 (1)對(duì)2字詞組,先取首字前兩碼,后取末字前三碼,即先取首字兩音碼,后取末字兩音碼及首形碼; (2)對(duì)3字詞組,先取首字首碼,后取第二、三字前兩碼,即先取首字的首拼音代碼,次取次字兩音碼,后取末字兩音碼; (3)對(duì)4字詞組,依次取各字首碼,即首拼音代碼,及末字第二碼即韻母代碼, (4)對(duì)5字及以上的多字詞組,依次取前4字及末字的首碼,即前4字及末字的首拼音碼。
4.根據(jù)權(quán)利要求3所述的音形編碼漢字輸入法,其特征在于對(duì)于不懂讀音無法取音碼或取某一形碼有困難的漢字,該代碼用數(shù)字鍵盤上的“ * ”鍵代替,其余代碼仍按次序輸入。
全文摘要
本發(fā)明涉及一種適用于移動(dòng)信息設(shè)備小鍵盤的新音形編碼漢字輸入法。按照先取漢字兩個(gè)音碼,分別為漢字首拼音和韻母代碼,后按筆順次序取該漢字的前3形碼,音碼形碼加在一起對(duì)漢字進(jìn)行編碼;還增加了“容錯(cuò)碼”,提供了“模糊”輸入功能。本輸入法還可用于詞組及短語的輸入。本發(fā)明具有輸入速度快、易學(xué)、易用、直觀、高效和重碼率更少的特點(diǎn),其單字輸入速率比其它輸入法可提高一倍以上;而采用字詞合一輸入,可進(jìn)一步提高輸入速率2至5倍,具有廣泛的應(yīng)用前景。
文檔編號(hào)G06F3/023GK102622098SQ201210018390
公開日2012年8月1日 申請(qǐng)日期2012年1月20日 優(yōu)先權(quán)日2012年1月20日
發(fā)明者余威, 陳欽梧 申請(qǐng)人:汕頭大學(xué)