專利名稱:數(shù)字式三擊形音漢字輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字輸入法。
背景技術(shù):
漢字為方塊結(jié)構(gòu),音形分離,輸入操作比字母、外語單詞復(fù)雜得多。經(jīng)過多年的研究與發(fā)展,現(xiàn)在已出現(xiàn)了各種各樣的漢字輸入法,主要有以五筆法為代表的筆畫輸入法;以漢語拼音為代表的拼音輸入法;以蒙恬筆為代表的手寫輸入法。這些方法各有優(yōu)勢,適于不同的人群,但都存在其不足之處。如拼音輸入法,易學(xué)易用,只要拼音拼準(zhǔn)了,就可以掌握這種輸入法了。但是由于漢語拼音的同音字很多,對應(yīng)于每一個(gè)發(fā)音,會(huì)敲擊出多個(gè)甚至上百個(gè)字相同的字母組合。如yi音,就《新華字典》所查得的漢字就達(dá)到131個(gè)。又如fu音,在常用的3500個(gè)漢字中就有44個(gè)。據(jù)統(tǒng)計(jì),在3500個(gè)常用漢字中,一組拼音字母組合以10個(gè)至30個(gè)字居多。從一大推字中把需要的字找出來,確實(shí)不容易,因此拼音輸入法存在輸入速度慢,輸入不便的缺點(diǎn)。另外,有些漢字的拼音輸入法的點(diǎn)擊次數(shù)過多,如“莊”字,拼音為zhuang,需敲擊6個(gè)字母鍵。對于一些地方語系與普通話差別較大的地方,如廣東、福建等地,當(dāng)?shù)厝说钠匆羲捷^低,用拼音輸入法對于他們來說是十分困難的。廣東人的zh、ch、sh與z、c、s難以區(qū)分,許多常用字的發(fā)音也與普通話相去甚遠(yuǎn)。如,“賃”,粵語為“任”音,而普通話為lin;如,“僧”,粵語為“真”,國語為seng.......在此,不再一一列舉。
五筆輸入法輸入速度快,字重復(fù)率低,常常可以“盲打”,不需要抬頭看屏幕進(jìn)行選字。但五筆輸入法非常難學(xué),需要記憶大量的偏旁部首組,令人望而生畏,因此其普及性較低。
手寫輸入法,如蒙恬筆,不需要特別學(xué)習(xí)就可以掌握,因此受到年紀(jì)大的人群的歡迎。但手寫輸入法需要外置設(shè)備,成本較高,價(jià)格貴,且容易與原電腦配置不兼容,更存在識辯能力差等各種問題。因此,手寫輸入法也不易推廣。
因此,對于年紀(jì)大、記憶力較差又苦于國語發(fā)音不準(zhǔn)的人群來說,漢字的輸入仍然是學(xué)習(xí)、使用電腦的一大障礙,阻礙了他們與現(xiàn)代資訊社會(huì)、網(wǎng)絡(luò)時(shí)代的接觸。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種易學(xué)易記、輸入方便、輸入速度快、重字率低的漢字輸入法。
為了達(dá)到上述發(fā)明目的,本發(fā)明采用了以下技術(shù)方案把漢字的筆畫和部首分為10組,分別對應(yīng)10個(gè)數(shù)字鍵,以筆畫輸入加拼音輸入的方式通過鍵盤三擊輸入漢字,所述筆畫輸入是指按照漢字書寫順序,分別輸入漢字首部所對應(yīng)的數(shù)字鍵和漢字末部所對應(yīng)的數(shù)字鍵;所述拼音輸入是指輸入漢字讀音的第一個(gè)字母所對應(yīng)的字母鍵。
進(jìn)一步地,所述三擊輸入的順序?yàn)榈谝粨?,輸入漢字首部所對應(yīng)的數(shù)字鍵;第二擊,輸入漢字末部所對應(yīng)的數(shù)字鍵;第三擊,輸入漢字讀音的首字母鍵。
更進(jìn)一步地來說,漢字按筆畫分成橫、豎、撇、點(diǎn)、折、捺六個(gè)筆畫組,部首分成日月與五行、植物與動(dòng)物、身體與器官、手足與言行、物品與計(jì)量五個(gè)部首組,其中一個(gè)筆畫組與其中一個(gè)部首組共同對應(yīng)一個(gè)數(shù)字鍵,其余各組與其余9個(gè)數(shù)字鍵對應(yīng)。
本發(fā)明從漢字部首的形體結(jié)構(gòu)及代表的含義的角度考慮,對筆畫及部首進(jìn)行分組,每一組對應(yīng)一個(gè)數(shù)字鍵,分類方法非常直觀、簡單,易學(xué)易操作。操作人在輸入每一漢字前,對該字的字形結(jié)構(gòu)、筆順及發(fā)音都有了大致的印象,能把該印象迅速地反映到筆畫及部首的分組上,從而輸出該漢字的首部首/筆畫及末部首/筆畫,然后再輸入該漢字拼音的第一個(gè)字母。在輸入3500個(gè)常用漢字時(shí),本輸入法只需敲擊2個(gè)數(shù)字鍵及1個(gè)字母鍵,共3擊,即可出字,敲擊次數(shù)少,且10個(gè)數(shù)字鍵的輸入遠(yuǎn)快于26個(gè)英文字母鍵。
本發(fā)明的另一優(yōu)點(diǎn)在于分布合理。第一擊及第二擊分別是0~9的10個(gè)數(shù)字鍵,而第三擊是23個(gè)拼音字母(為首字母的拼音只分布于23個(gè)鍵),現(xiàn)在最大的編碼組合數(shù)目為2300個(gè)。以3504個(gè)常用漢字為例,加上其中同形不同音不同義的32,共3536個(gè)字,在理想狀態(tài)下平均分布在2300個(gè)編碼中,則每個(gè)編碼對應(yīng)1.54個(gè)漢字。由于字形與發(fā)音的差別,加上A、E、O為首字母的字比較少,上述理想的分布情況是不可能的。在本輸入法中,3536個(gè)字分布在1322個(gè)編碼中,每個(gè)碼的平均分布率為2.67個(gè)字,編碼組合利用率達(dá)57.8%,沒有字的空碼只占42%,筆畫的分配高效、合理。
合理的分布使本輸入法的重碼率低,編碼的字?jǐn)?shù)分布如下表1
從上表可見,1~5個(gè)字的編碼占全部編碼的91%,也就是說敲擊1個(gè)3位的編碼,出現(xiàn)單字的機(jī)率為35.7%,而5個(gè)字以內(nèi)的機(jī)率為91%,5個(gè)字以上的編碼只有9%,而最多字?jǐn)?shù)的是12個(gè)字,重碼率遠(yuǎn)遠(yuǎn)低于拼音或其它的一般輸入法。
本發(fā)明易學(xué)易記。因?yàn)闈h字的筆畫和部首結(jié)構(gòu)以及漢語拼音都是小學(xué)的教學(xué)內(nèi)容,是人人都熟練掌握的基本知識。本輸入法的筆畫和部首分類只有10類,又是按常識進(jìn)行歸類,對學(xué)習(xí)者的文化水平、記憶水平均要求不高,一學(xué)即會(huì),且牢記于心。對于記憶力較差、反應(yīng)較慢、方言根深蒂固的中老年人,同樣容易掌握。
具體實(shí)施例方式
本輸入法把《新華字典》所收入的11000多個(gè)漢字按照使用頻率分為常用字、次常用字和不常用字三類。其中,常用字3500個(gè),次常用字3500個(gè),其余為不常用字。常用字和次常用字共有7000個(gè),是由國家語言文字工作委員會(huì)漢字處編寫的《現(xiàn)代漢語通用字表》中所列出的7000個(gè)漢字。常用字的選擇參照了《3500常用漢字的筆畫和筆順》,萬學(xué)仁主編,電子工業(yè)出版社1993年9月出版。
漢字的形體可以很復(fù)雜,但都是由橫豎撇點(diǎn)折五種筆畫及這些筆畫組成的偏旁部首構(gòu)成。相同的部首組成的形音字往往發(fā)出相同或近似的讀音,表達(dá)同一范疇或相關(guān)事物的含義。在此,漢字的基本筆畫,即橫、豎、撇、點(diǎn)、折則分別對應(yīng)5、6、7、8、9五個(gè)數(shù)字鍵。
字典中的部首約有200個(gè),其中有些是獨(dú)體字,如土、木、蟲、身、弓、女等;有些則意義不大明顯,如勹、彡等;有些雖是獨(dú)體字,也有明顯意義,但多作偏旁部首使用,單獨(dú)使用的極少,也不為普通人所認(rèn)識,如殳(古代一種竹制兵器)。而古人創(chuàng)造和改進(jìn)漢字是建立于對自然現(xiàn)象及人類活動(dòng)的觀察和認(rèn)識的基礎(chǔ)的。受此啟發(fā),本發(fā)明將漢字的部首的含義大約可以分為五大類日月與五行、植物與動(dòng)物、身體與器官、手足與言行、物品與計(jì)量,具體地來說,就是1、天體及其基本元素,并以石取代木,即為金、石、水、火、土;2、生物,如草木竹鳥獸蟲魚等;3、身體及臟器,身體分男(子)和女,器官有口耳皮毛血骨等;4、人體的各種活動(dòng),這些活動(dòng)大多通過手和足完成;5、人類在生產(chǎn)活動(dòng)中制造或種養(yǎng)出各種物品,并對這些物品進(jìn)行計(jì)量,如米谷衣革刀車舟等物品,和斤寸斗里等計(jì)量單位。這五大類實(shí)際反映了自然及歷史的發(fā)展規(guī)律即先有物質(zhì)組成的天體,然后出現(xiàn)生物、并進(jìn)化到人類,人類由各種器官構(gòu)成,具有各種生理、心理和體力活動(dòng)的特征及能力,并通過人類生產(chǎn)活動(dòng)創(chuàng)造社會(huì),生產(chǎn)出各種物品,制定了物品的量器及計(jì)量方法。這五類分別對應(yīng)0、1、2、3、4五個(gè)數(shù)字鍵。同時(shí),把筆畫捺從點(diǎn)從分劃出來,對應(yīng)1號數(shù)字鍵,以降低重字率。這一分類方法具有更強(qiáng)的聯(lián)想性,非常直觀。
代碼詳見下表2鍵盤偏旁部首0日月與五行日、曰、月、冃、金、钅、石、水( 氵)、火(灬)、土1植物與動(dòng)物(包括末筆捺)艸、、巧、豸、豕、木 禾、馬、牛(牜)、鳥、蟲、魚、犬、龍、羊、鹿、鼠、及末筆乀2身體與器官子、女、身、口、心(忄、)、毛、爪(爫)、目、皮、舌、耳、血、羽、角、齒、骨、鼻3手足與言行手、扌、足、、言、讠、食(饣)、示(礻)、見、走、廴、辶4物品與計(jì)量米、麥、谷、瓜、豆、貝、纟、衣(衤)、巾、革、缶、皿、瓦、臼、門、刀()、矛、戈、矢、弓、車、舟、寸、斤、里、片、頁、斗5筆畫橫,包括橫勾及提筆一、乛、 6筆畫豎丨、亅7筆畫撇丿8筆畫點(diǎn)丶9筆畫折(包括橫豎撇點(diǎn)以外的其它所有折曲的筆畫) 、乚、ㄑ、、 乙、ㄥ、ㄅ本輸入法由三擊組成,第一擊為輸入字的首筆畫(或部首)的代碼,第二擊為末筆畫(或部首)的代碼,第三擊為該字發(fā)音的首字母。
如“平”字,首筆是橫,代碼5;末筆是豎,代碼6,拼音首字母是P,本字的編碼是56P。敲擊56P后出現(xiàn)“平”和“霹”2個(gè)字,選“平”字鍵入即可。
又如“杜”字,首部首為“木”,代碼1,末部首為“土”,代碼0,拼音首字母是D,本字的編碼是10D,敲擊10D后,只有“杜”一個(gè)字,不用選字。
如要輸入的是部首字,則第1擊為部首字的代碼,第2擊*號,第3擊同樣是拼音首字母,如“金”字的編碼是0*J。
以上3擊共生成3504個(gè)常用字,如按規(guī)則3擊后未出現(xiàn)所需的字,可以再點(diǎn)擊一輔助鍵“;”,即可顯示3500個(gè)次常用字,或再點(diǎn)擊輔助鍵“/”顯示不常用字,在這些字庫中再選擇所需的字鍵入。
本發(fā)明把漢字按偏旁部首或筆畫分別分成上述的10組,并與10個(gè)數(shù)字鍵一一對應(yīng),但本發(fā)明不局限于每一分類組所對應(yīng)的數(shù)字鍵。
本發(fā)明的筆畫、部首等以商務(wù)印書館出版的《新華字典》及《新編小學(xué)生字典》為依據(jù)。拼音可以是漢語拼音,也可以是根據(jù)地方方言所編寫的方言拼音,在此不作限制。
在輸入操作時(shí),還要注意以下原則一、正確確定首筆部首、末筆部首以及拼音首字母。本輸入法不要求全字準(zhǔn)確完整的筆畫與拼音,但必須點(diǎn)擊規(guī)范的首筆(部首)和末筆(部首)的代碼和首字母,才能顯示出要輸入的字。如“肅”字,首筆是折,末筆是點(diǎn),編碼是98S。有些字的末筆改點(diǎn),則按點(diǎn)編碼,如“瀾”字的末筆改點(diǎn),編碼是08L。如果末筆是部首字,雖然末筆改點(diǎn),仍按部首字編碼。如“秦”字的末筆改點(diǎn),但按“禾”作末部首編碼,“秦”字編碼是51Q。
二、先部首后筆畫原則、先大部首后小部首原則。如“時(shí)”字,首筆是豎,首部是“日”,按“日”字編碼;末筆是點(diǎn),末部首是“寸”,按“寸”字編碼,因此“時(shí)”字編碼為04S。又是“理”字,末筆取“里”,不取橫,編碼是54L。“警”字末部首可以是“口”,也可以是“言”,按大部首取編碼,“警”字編碼是13J?!澳ァ弊帜┎渴兹 笆辈蝗 翱凇保幋a是80M。
三、最易辨認(rèn)原則。本輸入法決定筆畫(部首)不完全按字典的編排,而是直觀觀察、最易辨認(rèn)為原則作取舍。如字典的部首有些不易辨認(rèn)或變了形的,本方法均不取作部首用于編碼。如“著”字和“羔”字都列于“羊”部,但都變了形不易辨認(rèn),因此皆改用點(diǎn)作首筆,兩字編碼分別為82Z和80G?!坝馈弊謱偎浚兞诵?,末筆采用捺,編碼是81Y?!白弊质峭敛?,但“土”字不易一眼看出,末筆取橫,編碼是75Z。“告”字屬牛部,但該部變了形,首筆取撇,編碼是72G。同樣,“然”字和“祭”字首筆取撇,兩字的編碼分別是70R和73J。
四、可接觸不交叉原則。如“自”由撇和“目”構(gòu)成,“白”由撇和“日”字構(gòu)成,撇筆分別與“目”及“日”相接觸,但仍以“目”和“日”作末部首,兩字的編碼分別是72Z和70B。又如“赤”字取“土”作首部,編碼為08C?!袄稀弊衷谧值渲辛性凇巴痢辈?,但第4筆撇與“土”相交叉,故不取“土”作首部,而以橫作首筆畫,“老”字的編碼是59L。同理,“孝”字的編碼是52X?!皫煛弊趾汀笆小弊纸匀 敖怼弊髂┎渴?,兩字的編碼分別是64S和84S。
在本實(shí)施例中,漢字首部對應(yīng)的數(shù)字鍵、漢字末部對應(yīng)的數(shù)字鍵和拼音輸入字母鍵是按順序依次輸入的。但本發(fā)明不局限于這三鍵的輸入順序,這三鍵更換順序后的輸入也應(yīng)認(rèn)為是落入了本發(fā)明的保護(hù)范圍。
權(quán)利要求
1.數(shù)字式三擊形音漢字輸入法,其特征在于把漢字的筆畫和部首分為10組,分別對應(yīng)10個(gè)數(shù)字鍵,以筆畫輸入加拼音輸入的方式通過鍵盤三擊輸入漢字,所述筆畫輸入是指按照漢字書寫順序,分別輸入漢字首部所對應(yīng)的數(shù)字鍵和漢字末部所對應(yīng)的數(shù)字鍵;所述拼音輸入是指輸入漢字讀音的第一個(gè)字母所對應(yīng)的字母鍵。
2.根據(jù)權(quán)利要求1所述的輸入法,其特征在于所述三擊輸入的順序?yàn)榈谝粨?,輸入漢字首部所對應(yīng)的數(shù)字鍵;第二擊,輸入漢字末部所對應(yīng)的數(shù)字鍵;第三擊,輸入漢字讀音的首字母鍵。
3.根據(jù)權(quán)利要求1所述的輸入法,其特征在于漢字按筆畫分成橫、豎、撇、點(diǎn)、折五個(gè)筆畫組,部首分成日月與五行、植物與動(dòng)物、身體與器官、手足與言行、物品與計(jì)量五個(gè)部首組,分別與10個(gè)數(shù)字鍵一一對應(yīng)。
4.根據(jù)權(quán)利要求1所述的輸入法,其特征在于漢字筆畫捺從筆畫點(diǎn)中分類出來,并與其中一個(gè)部首組對應(yīng)于同一數(shù)字鍵。
5.根據(jù)權(quán)利要求3或4所述的輸入法,其特征在于;所述筆畫組與部首組與數(shù)字鍵一一對應(yīng)如下鍵盤 偏旁部首0 日月與五行日、曰、月、冃、金、钅、石、水( 氵)、火(灬)、土1植物與動(dòng)物(包括末筆捺)艸、、犭、豸、豕、木(朩)、禾、馬、牛(牜)、鳥、蟲、魚、犬、龍、羊、鹿、鼠、及末筆乀2身體與器官子、女、身、口、心(忄、)、毛、爪(爫)、目、皮、舌、耳、血、羽、角、齒、骨、鼻3手足與言行手、扌、足、、言、讠、食(饣)、示(礻)、見、走、廴、辶4物品與計(jì)量米、麥、谷、瓜、豆、貝、纟、衣(衤)、巾、革、缶、皿、瓦、臼、門、刀()、矛、戈、矢、弓、車、舟、寸、斤、里、片、頁、斗5筆畫橫,包括橫勾及提筆一、乛、 6筆畫豎丨、亅7筆畫撇丿8筆畫點(diǎn)丶9筆畫折(包括橫豎撇點(diǎn)以外的其它所有折曲的筆畫) フ、乚、ㄑ、、 乙、ㄥ、ㄅ。
全文摘要
本發(fā)明公開了一種數(shù)字式三擊形音漢字輸入法,把漢字的筆畫和部首分為10組,分別對應(yīng)10個(gè)數(shù)字鍵,以筆畫輸入加拼音輸入的方式通過鍵盤三擊輸入漢字,所述筆畫輸入是指按照漢字書寫順序,分別輸入漢字首部所對應(yīng)的數(shù)字鍵和漢字末部所對應(yīng)的數(shù)字鍵;所述拼音輸入是指輸入漢字讀音的第一個(gè)字母所對應(yīng)的字母鍵。本發(fā)明漢字的筆畫和部首分組合理,直觀性強(qiáng),易學(xué)易記、輸入方便、輸入速度快、重字率低。
文檔編號G06F3/023GK1770071SQ20051003694
公開日2006年5月10日 申請日期2005年9月1日 優(yōu)先權(quán)日2005年9月1日
發(fā)明者劉卓梁 申請人:劉卓梁