專利名稱:雙混碼漢字輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種雙混碼漢字輸入法,更具體地說,涉及一種由拼音碼和字根碼兩種編碼各兩碼相結(jié)合作碼元的漢字輸入法。
背景技術(shù):
在現(xiàn)有技術(shù)中,已有以音定碼的由拼音碼和字根碼相結(jié)合作碼元的漢字輸入法,由于拆字的步驟較多,大多存在輸入速度慢、重碼率高和難學(xué)難記等缺陷。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種拆字步驟少、輸入速度快、重碼率低且能與全拼方法兼容的雙混碼漢字輸入法。
為了達(dá)到上述目的,本發(fā)明提供了如下的技術(shù)方案提供一種雙混碼漢字輸入法,按以音定碼為原則,由拼音碼和字根碼兩種編碼相結(jié)合作碼元部件,使用通用鍵盤上的英文字母鍵位,該方法的單個(gè)字的全碼由四個(gè)字母組成,前兩碼為該字漢語拼音的前兩個(gè)字母,后兩碼由該字拆開后形成的字或固定字根組成,確定后兩碼碼元部件的具體方法如下(1)將筆劃為兩筆或兩筆以上的漢字按照書寫筆順拆分,以盡量拆大為原則,選擇特定字根作為編碼碼元部件,包括如下步驟A、漢字由上下、左右、上中下、左中右和半包圍結(jié)構(gòu)的部件組成時(shí),從前往后拆或從后往前拆,拆開至完整的漢字即成字字根和字根表中的字根即固定字根,以成字字根優(yōu)先于固定字根為拆分原則,拆分時(shí)中間有剩余部分則舍去;B、不能拆分為成字字根的取其筆劃作為碼元部件或先后以第一筆和最后一筆作為碼元部件;C、單筆字按字根表確定相同的兩個(gè)碼元部件;D、全包圍結(jié)構(gòu)的漢字拆分為外部和內(nèi)部兩部分作為碼元部件;E、成字字根為多音字時(shí),取其任意一種讀音的漢語拼音的首位字母作為碼元部件;F、雙字詞組的編碼碼元按詞組中兩個(gè)漢字的漢語拼音第一個(gè)字母和按前述方法將各自拆分后所得之字根的第一個(gè)字母確定四個(gè)碼元部件;G、四字詞組的編碼碼元按詞組各漢字的漢語拼音第一個(gè)字母字根確定四個(gè)碼元部件;(2)將上述編碼碼元指定到鍵盤相應(yīng)鍵位上的具體步驟為A、將筆劃為兩筆或兩筆以上的單個(gè)漢字前兩碼的漢語拼音的前兩個(gè)字母,后兩碼的成字字根的首拼字母及按表一字根集里的固定字根碼元,按順序?qū)⑵渌膫€(gè)碼元部件指定到相應(yīng)的鍵位上;B、不能拆分為成字字根的,按表一字根集里的固定字根碼元,將漢字整體的四個(gè)碼元部件指定到相應(yīng)的鍵位上;或C、取其筆劃作為碼元部件或先后以第一筆和最后一筆作為碼元部件,按筆劃“點(diǎn)、橫、撇、捺和折”筆劃名的漢語拼音分別為d、h、p、n和z五種指定到相應(yīng)的鍵位上;D、全包圍結(jié)構(gòu)的漢字拆分后按先外后內(nèi)的順序分別取其兩部分漢語拼音的第一個(gè)字母作為碼元部件并指定到相應(yīng)的鍵位上;E、成字字根為多音字時(shí),取其任意一種讀音的漢語拼音的首位字母作為碼元部件并指定到相應(yīng)的鍵位上;F、單筆字取其讀音的前兩個(gè)字母后按C步驟中的筆劃名的漢語拼音兩次指定到同一鍵位上;G、雙字詞組的編碼碼元按詞組中兩個(gè)漢字的先后,取各自漢語拼音第一個(gè)字母,再按前述方法將各自拆分后的第一個(gè)碼元的首拼字母確定四個(gè)碼元部件并指定到相應(yīng)的鍵位上;H、四字詞組按順序?qū)⒏鳚h字的漢語拼音第一個(gè)字母指定到相應(yīng)的鍵位上;(3)按照前述的方法,使用指定的鍵位,輸入相應(yīng)的漢字。
本發(fā)明的具體輸入方法說明如下單個(gè)字的全碼由四個(gè)字母組成,前兩碼為該字的拼音的前兩個(gè)字母,如“贏”字,其漢語拼音為ying,取其前兩個(gè)字母即“yi”,其后兩碼由該字拆開后形成的字和固定字根組成,以整字做字根的叫成字字根,是指3500個(gè)常用字,不包括如袞、豕、乂少數(shù)非常用字,字根表上的字根叫固定字根,以成字字根優(yōu)先于固定字根為原則來拆分的;所述的“以盡量拆大為原則”,是指一個(gè)字如果能拆分成整字,最大可以拆到只剩下最后一筆,如“查”字可以拆成“杳”和“一”,一般不拆分成“木”和“旦”,再如“章”字,按照盡量拆大原則就該拆成“音”和“十”,為了符合一般人的認(rèn)識習(xí)慣,本發(fā)明對一些字設(shè)計(jì)了兼容的拆法,如“章”字可以分拆為“立”和“早”,以便符合于人們的“立早章”習(xí)慣。在可以拆完和符合人們認(rèn)識習(xí)慣的情況下,都允許兼拆,“查”字拆成“木”和“旦”時(shí),中間沒有剩余部分,即可間拆;在具體的拆字過程中,除全包圍結(jié)構(gòu)的漢字外,以該字的書寫筆順從前往后拆或從后往前拆,拆開的部分盡量組成完整的漢字或雙碼的字根,從前往后只要能拆成一個(gè)完整的字,最大可以拆到最后一筆為止,如“斥”字,前部識別字根是“斤”,后部為字根即一點(diǎn);所述的“舍去中間拆剩下的部分”即如果中間有拆剩下的部分不管它,如“贏”字從前往后拆是″亡″,加一個(gè)″口″字無法組成一個(gè)字,再加一個(gè)月字,仍不是一個(gè)字,再加一個(gè)貝字,還不是一個(gè)字,拆到剩下最后一點(diǎn)又不是一個(gè)字,所以拆到″亡″就為止了,從最往后拆是″凡″原理同前,它的識別字根就是″亡″和″凡″,中間拆剩下的部分“口”“月”“貝”不管它即“舍去”;所述的“不能拆分為成字字根的取其筆劃作為碼元部件或先后以第一筆和最后一筆作為碼元部件”,如“文”字和“斤”字,不能拆成完整的字和字根,“文”字就取筆畫即一點(diǎn)和“乂”,而“斤”字就取筆畫即一撇和一豎,再如“十”字,不能拆成字就以第一筆作為先,最后一筆為后,即拆成一橫和一豎;所述的“全包圍結(jié)構(gòu)的漢字拆分為外部和內(nèi)部兩部分作為碼元部件”,如“園”字拆成“囗”和“元”,后一部分為“元”,而不是“園”字最后一筆即一橫。所述的“成字字根為多音字時(shí),取其任意一種讀音的漢語拼音的首位字母作為碼元部件并指定到相應(yīng)的鍵位上”,如“董”字拆成一個(gè)草字頭和“重”字,“重”字即可讀為zhong,又讀為chong,所有“董”字的碼元部件可以是docz或docc;所述的“單筆字取其讀音的前兩個(gè)字母后按C步驟中的筆劃名的漢語拼音兩次指定到同一鍵位上”,如“一”,其碼元部件為yihh,其中“hh”即為“橫”,輸入兩次;本發(fā)明輸入方法對“橫”的處理,一橫就視為“橫”,如“大”字拆成一橫和“人”,全碼就是“dahr”;兩橫即可以視橫,又可以視為“二”字,如“夫”字,可拆成“二”和“人”,全碼即為fuhr或fuer);三橫即可以視為橫,又可以視為“三”,如“春”字可拆成“三”橫和“日”全碼即chhr或chsr。
本發(fā)明的字根參見如下表表一 雙混碼字根表B 匕 卜疒 C 艸 廾 丌 乂E阝 卩 G戈 戔 艮 D灬 丬 氵冫 丷丶刀刂J钅 幾 K匚 冂 凵口 冖 M木 N牜 ㄟP彡Q犭R亻 彳 纟S罒 礻 饣 十 T扌W攵 X 忄 Y衤 讠 弋 夭 幺Z廴 辶 乛 乛 ㄍ巛表中提供了所述的固定字根。
本發(fā)明所述的雙字詞組的編碼碼元,按詞組中兩個(gè)漢字的漢語拼音第一個(gè)字母和按前述方法將各自拆分后所得之字根的第一個(gè)字母確定四個(gè)碼元部件,如“文件”兩個(gè)字的拼音第一個(gè)字母是“wj”,然后再打它們拆開后的前一部分的對應(yīng)的拼音,如“文件”拆開后的第一部分是一點(diǎn)和“亻”,一點(diǎn)字根表所對應(yīng)的拼音的第一個(gè)字母即“d”,“亻”字根表所對應(yīng)的拼音的第一個(gè)字母即“r”?!拔募钡娜a即為“wjdr”;另外,四字詞組的編碼碼元按詞組各漢字的漢語拼音第一個(gè)字母字根確定四個(gè)碼元部件,如一馬當(dāng)先ymdx,按順序分別取組成該詞組的四個(gè)字漢語拼音的第一個(gè)字母即可。
本發(fā)明較好的技術(shù)方案是輸入漢字時(shí)兼容全拼輸入法。換句話說,本發(fā)明雙混碼輸入法無需切換即可使用全拼,因?yàn)樗慕∫蛔趾竺鎯蓚€(gè)字母都的聲母,而全拼后面是跟的韻母,所以兩者互不干擾。四健一字只針對常用字,而直接打全拼可以輸入所有字庫的字,可以減少重碼,提高速度。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下明顯的優(yōu)點(diǎn)1、易學(xué)本方法以拼音為基礎(chǔ),學(xué)過拼音的人使用本方法尤其容易掌握,拆字根的原理極為簡單、明確,字根量小,容易學(xué)會(huì);2、易記易記的關(guān)鍵在于它的字根與讀音緊密相連,比如一點(diǎn)[丶]、兩點(diǎn)〔冫〕、三點(diǎn)水〔氵〕、四點(diǎn)底〔灬〕都屬于″點(diǎn)″的范圍,″點(diǎn)″的拼音的第一個(gè)字母是″d″;不論上框、下框、左框、右框都屬于一種類型,即″k″〔″框″的拼音的第一個(gè)字母〕,不象有的輸入法把幾框徹底分開,記憶十分不便;3、輸入速度快〔1〕四健出一字,人稱代詞和常用的連詞都有一級簡碼,如你、我、他、你們、我們、他們、是、的、和、因?yàn)?、所以、不僅、而且等等;〔2〕把常用字和非常用字輸入方法分開,不搞″一刀切″,四健一字只針對常用字,而直接打全拼可以輸入所有字庫的字,可以減少重碼,提高速度4不易忘因?yàn)榍皟纱a已經(jīng)是拼音了,所有只需要記后兩碼。而后兩碼大量使用成字根,又和它的讀音緊密相連,字根也和它所歸類的讀音緊密相連。所以只要學(xué)會(huì)以后,即使很久不用,也不會(huì)忘記。
具體實(shí)施例方式
以下通過具體的實(shí)施方式對本發(fā)明的漢字編碼進(jìn)行更加具體的說明,實(shí)施例中包括了單字、兩字詞組及四字詞組的具體編碼aka啊aek阿aipy愛aits挨aisc礙aibs癌aicc艾aibj皚aiey隘aina嬡andn安ansg岸anam案anqa氨anym盎anre昂anyk骯aoyy襖aojh凹aohd熬aoby翱bapn八bafb爸baty拔batf撥basq罷bahb百bapr白batb擺baps拜bald辦bazy般bapf版babb癍babj幫basf磅bacf蚌baps包baty報(bào)bars暴bacc薄bald剝bold剝baps豹beyp被bedb北beby背bekr貝beqb狽bemh本bebc,bedh奔zhys,zhlz章bixp必bibb比bizm筆bibc鼻biws碧bihz逼bibs畢bibz避bihc,bihh扁bisn,bihn表bihp彪biqf飆bids稟bibb病bidk并
bosc博bosd卜busd卜buhb不cahp才casy裁capm采camc睬cacj蔡cacp彩cayc蠶cadg殘catc,cats摻cazp參sezp參caxz慚cabs餐care倉cazc艙cace蒼cacz草catm操cahr曹camz糙cakc嘈cazc艚cekh冊cerz側(cè)cezn策cedz測cecz廁cexz惻cerz側(cè)cedr曾cesy層cezc,cezz蹭catc擦chzd,chtc拆chmd,chyh查chtj插chyd叉chcm茶chdg差chfs岔chtc搽chdj察chcm柴chpc豺chjc釵chdc產(chǎn)chrl纏chtd攙chmd闡chdy顫chjc鏟chyd讒chcd蟬chhn長zhhn長chkc唱chxd常chtp場chhp廠chxy嘗chyp腸chsp暢chrr昌chxw敞chrc倡cjrc償chqc猖chnc嫦chsy朝zhsy朝chts抄chzk超chks吵chzg巢chhs炒chkc,chkz嘲chjs鈔chhs車chtz扯chzs掣chrq徹chsn尺chzp趁chhe稱chxt塵chdr沉ched陳chpd成chpn乘chcm盛chtc城chhc程chkw呈chyc誠chzc逞chmz騁chzn,chln承chkq吃chcz遲chdy池chzy翅chbz癡chtd赤chez恥chts持chjd斥chrd侈chgy弛chhz熾chdz沖chph重zhph重chkd蟲chdy充chdl寵chsz崇chty抽chqx愁chbq臭chrj仇chzt丑chhz稠chrz綢chyz酬chzs籌chzs躊chmq瞅chss出chwb處chyd初chjz鋤chey除cghc觸chln楚chsc礎(chǔ)chrz儲(chǔ)chxt畜chzz矗chcc廚chxy穿chzk船chrz傳chks串chps川chke喘chkq吹
chph垂chhq炊chhr,chsr春chck唇chrz純chcc蠢chyx醇cidq次cizb此ciys詞cicw瓷cidx慈chch雌cisy,cisd磁cisx辭cihd刺ciby賜cadg差corr從coch叢cocx蔥cohn,cohd匆coez聰coph囪cumq粗cuyx醋cuzc簇curz促cuqz猝cuxc竄curc催cuyw脆cuyz翠cush崔cumz粹cumc村cuhd寸cuhz存cujx錯(cuò)cutc搓cutz挫cutx措dahr大dazh答dadz達(dá)datd打dath搭dahj帶dary代dakm呆dasg戴dars待dady袋dalz逮dahx歹dadb貸dard但dazc蛋dagd彈tagd彈datd撣dayd膽dady淡darh旦daqy氮daxh當(dāng)daxx黨datd擋damd檔dazd到dasz道dard倒dazp刀daps島dacm盜dahj稻datd搗dasc導(dǎo)dazj蹈debs的dety地derc得derx德dezs等dehd燈daye鄧dezd登dizd點(diǎn)dirz電digz店disy殿didd淀dizy顛dizt墊disd碘diqd奠diqd靛dizd踮ditz掉dijs釣dikd叼dikj吊dizh雕diyz調(diào)disz碉didz凋difd爹dizs跌diyq疊dism碟dicm蝶diym諜dipm牒didy頂didn定dimd盯diyd訂dikd叮dihz丁dijd釘doyl動(dòng)dohx東doxd懂dody洞dodd凍dowd冬docz,docc董domd棟doze都dohh豆dodz逗doez陡dotd抖doke兜duym讀dugy度duhm,毒dudd渡dutz堵duqc獨(dú)duyt肚dujd鍍dubz賭dumz睹dumt杜duze都dunh妒dupy段dusd短dule端dury緞duyc對
duer隊(duì)duth堆dudx兌duxx多dujm朵dudc奪duzt舵dudd剁duzd跺e(cuò)sw餓eky額ewn鵝edw蛾eek阿eyx惡erhs而erhh二erpz兒erpx爾fazy發(fā)fadq法fasd罰fapz乏farg伐fazf筏fapy反fasf飯faqe犯fafz返fadf泛famx繁fahy煩fabf販face范fafw放fahf房faef防farf紡facf芳fayf訪fadw方farf仿fatf坊fanf妨fayf肪fehh非fezd飛feyb肥fefb費(fèi)feys肺fegf廢fekf匪feyf誹fenj妃febd分ferf份femf粉fetw墳fedt奮felh焚fekc風(fēng)fetc封fewz逢ferf縫fecf蜂fehs豐femf楓febf瘋fedm馮fehs奉feyf諷feky鳳fess峰fuhd副fujt幅futf扶fudz浮fudt富fust福fupb負(fù)furq伏furc付furw復(fù)fuyy服furf俯fufj斧fuhr夫fuzf符fugf府fimh婦futz撫fuy該gazw改gadm蓋gajz鈣gazg趕gahs干gaxx感g(shù)azw敢gayg肝gumg桿gagd剛gajg鋼garg綱gadx港gafg缸gasg崗gakc岡gadk高gatg搞gapk告gahg稿編輯bjrc格式gsmg幫助bzbq寫字xzkd輸入srcp一馬當(dāng)先ymdx 馬到成功mdcg 先入為主xrwz 心心相印xxxy一往情深ywqs 一相情愿yxqy
權(quán)利要求
1.一種雙混碼漢字輸入法,按以音定碼為原則,由拼音碼和字根碼兩種編碼相結(jié)合作碼元部件,使用通用鍵盤上的英文字母鍵位,其特征在于單個(gè)字的全碼由四個(gè)字母組成,前兩碼為該字漢語拼音的前兩個(gè)字母,后兩碼由該字拆開后形成的字或固定字根組成,確定后兩碼碼元部件的具體方法如下(1)將筆劃為兩筆或兩筆以上的漢字按照書寫筆順拆分,以盡量拆大為原則,選擇特定字根作為編碼碼元部件,包括如下步驟A、漢字由上下、左右、上中下、左中右和半包圍結(jié)構(gòu)的部件組成時(shí),從前往后拆或從后往前拆,拆開至完整的漢字即成字字根和字根表中的字根即固定字根,以成字字根優(yōu)先于固定字根為拆分原則,拆分時(shí)中間有剩余部分則舍去;B、不能拆分為成字字根的取其筆劃作為碼元部件或先后以第一筆和最后一筆作為碼元部件;C、單筆字按字根表確定相同的兩個(gè)碼元部件;D、全包圍結(jié)構(gòu)的漢字拆分為外部和內(nèi)部兩部分作為碼元部件;E、成字字根為多音字時(shí),取其任意一種讀音的漢語拼音的首位字母作為碼元部件;F、雙字詞組的編碼碼元按詞組中兩個(gè)漢字的漢語拼音第一個(gè)字母和按前述方法將各自拆分后所得之字根的第一個(gè)字母確定四個(gè)碼元部件;G、四字詞組的編碼碼元按詞組各漢字的漢語拼音第一個(gè)字母字根確定四個(gè)碼元部件;(2)將上述編碼碼元指定到鍵盤相應(yīng)鍵位上的具體步驟為A、將筆劃為兩筆或兩筆以上的單個(gè)漢字前兩碼的漢語拼音的前兩個(gè)字母,后兩碼的成字字根的首拼字母及按表一字根集里的固定字根碼元,按順序?qū)⑵渌膫€(gè)碼元部件指定到相應(yīng)的鍵位上;B、不能拆分為成字字根的,按表一字根集里的固定字根碼元,將漢字整體的四個(gè)碼元部件指定到相應(yīng)的鍵位上;或C、取其筆劃作為碼元部件或先后以第一筆和最后一筆作為碼元部件,按筆劃“點(diǎn)、橫、撇、捺和折”筆劃名的漢語拼音分別為d、h、p、n和z五種指定到相應(yīng)的鍵位上;D、全包圍結(jié)構(gòu)的漢字拆分后按先外后內(nèi)的順序分別取其兩部分漢語拼音的第一個(gè)字母作為碼元部件并指定到相應(yīng)的鍵位上;E、成字字根為多音字時(shí),取其任意一種讀音的漢語拼音的首位字母作為碼元部件并指定到相應(yīng)的鍵位上;F、單筆字取其讀音的前兩個(gè)字母后按C步驟中的筆劃名的漢語拼音兩次指定到同一鍵位上;G、雙字詞組的編碼碼元按詞組中兩個(gè)漢字的先后,取各自漢語拼音第一個(gè)字母,再按前述方法將各自拆分后的第一個(gè)碼元的首拼字母確定四個(gè)碼元部件并指定到相應(yīng)的鍵位上;H、四字詞組按順序?qū)⒏鳚h字的漢語拼音第一個(gè)字母指定到相應(yīng)的鍵位上;(3)按照前述的方法,使用指定的鍵位,輸入相應(yīng)的漢字。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于輸入漢字時(shí)兼容全拼輸入法。
全文摘要
本發(fā)明公開了一種雙混碼漢字輸入法,按以音定碼為原則,單個(gè)字的全碼由四個(gè)字母組成,前兩碼為該字漢語拼音的前兩個(gè)字母,后兩碼由該字拆開后形成的字或固定字根組成,確定后兩碼碼元部件時(shí),將筆劃為兩筆或兩筆以上的漢字按照書寫筆順拆分,以盡量拆大為原則,選擇特定字根作為編碼碼元部件,解決了輸入速度快和與全拼法的兼容問題,具有拆字簡單、易學(xué)易記、重碼率低,廣泛適合于輸入漢字尤其是輸入常用漢字時(shí)與全拼法兼容使用。
文檔編號G06F3/023GK1556461SQ20041001503
公開日2004年12月22日 申請日期2004年1月5日 優(yōu)先權(quán)日2004年1月5日
發(fā)明者龐熔, 龐 熔 申請人:龐熔, 龐 熔