一、技術(shù)領(lǐng)域:本發(fā)明的名稱為“一種有助于正確書寫漢字的形碼輸入法”,簡稱“易學(xué)高效形碼”,是一種按照漢字字形編碼的計算機(jī)鍵盤漢字輸入方法,屬于漢字信息處理技術(shù)研究領(lǐng)域。
二、
背景技術(shù):
:
信息時代要求對文字能夠進(jìn)行方便快捷的信息化應(yīng)用。英文可以直接輸入計算機(jī),轉(zhuǎn)換成數(shù)字碼能夠高效地用于手機(jī),而漢字計算機(jī)鍵盤輸入必須借助漢字編碼構(gòu)成輸入法才能進(jìn)行。我國研究計算機(jī)漢字輸入法已有三十多年的歷史,申請發(fā)明專利一千件以上,但至今不能全面滿足社會需求。
現(xiàn)在大多數(shù)人使用拼音輸入法。以漢語拼音作為漢字編碼使用,在gb2312-80漢字內(nèi)重碼率為99.8%,智能拼音雖然減少了現(xiàn)代漢語連續(xù)文本的重碼字挑選,但是整句輸入不能避免返回修改。例如,文匯報文章的句子“崇明島與上海橋隧相接,水清、氣潔、土凈”,用微軟智能拼音整句輸入,顯示為“重名島嶼上海橋隧相接,水情、氣節(jié)、途徑”,必須返回逐字挑選進(jìn)行修改。使用拼音輸入法,輸入不認(rèn)識的漢字必須先查字典,輸入非連續(xù)文本如人名、地名或古詩、古文等仍然需要在重碼字中查找,輸入效率不高。不能熟練使用拼音輸入法的計算機(jī)用戶不在少數(shù),包括沒有學(xué)過漢語拼音、因受方言影響拼讀有誤、我國少數(shù)民族及外國人學(xué)漢語發(fā)音不準(zhǔn)確等情況。區(qū)分平舌音和卷舌音是學(xué)習(xí)漢語拼音的難點(diǎn),師、獅是卷舌音,但螄是平舌音;寺是平舌音,但詩、侍、恃是卷舌音,必須用心學(xué)習(xí)和記憶。
使用拼音輸入法長期在同音字中挑選漢字,會導(dǎo)致書寫思維的荒疏,使?jié)h字的傳承和發(fā)展受到不利影響。人民日報2010年報導(dǎo):“最近一項(xiàng)調(diào)查顯示,兩千余名受訪者中有逾八成的人承認(rèn)寫字有困難。提筆忘字,頻寫錯別字,正成為一個令人憂心的文化現(xiàn)象?!蓖甑膬蓵希?名委員的提案呼吁重視“漢字書寫文化沒落現(xiàn)象”。但議論多年,呼吁頻頻,至今情況不見好轉(zhuǎn)。解放日報2015年12月5日刊登《瞿秋白最后的日子》一文,竟把魯迅寫給瞿秋白的對聯(lián)“人生得一知己足矣,斯世當(dāng)以同懷視之”錯為“世事當(dāng)以同懷視之”。在《中國語言文字網(wǎng)》對國家語委咨詢委員會第14次會議的報導(dǎo)中,說到“對當(dāng)前社會不規(guī)范的用語用字現(xiàn)象以及學(xué)生的語言文字修養(yǎng)擔(dān)憂”的同時,卻把咨詢委員會主任講話中“任何改革措施都要緊緊依靠法律”寫成“僅僅依靠法律”,幾個地方教育網(wǎng)站的報導(dǎo)也都寫為“僅僅依靠法律”。搞語言文字的人也是錯別字頻出,可見問題之嚴(yán)重。
怎樣才能讓漢字在信息化環(huán)境下更好的應(yīng)用呢?中國工程院院士許居衍指出:“形碼輸入法對漢字的傳承有重要作用。形碼是依形編碼,輸入時就相當(dāng)于直接輸入漢字,會寫就會輸入,會輸入就會寫。通過這種方式,人們就不會忘掉漢字的筆畫和結(jié)構(gòu),這是傳承漢字文化的上上之策?!?光明日報2013年9月28日《“漢字熱”中熱議漢字文化傳承》)在搜狗輸入法五周年慶典高峰論壇上,四通打字機(jī)發(fā)明人王輯志不忘提醒:字形輸入法有潛力,把搜狗輸入法的理念放到字形輸入法里面,有很大空間。(搜狐it,《高峰論壇:中文輸入法的前世、今生和未來》2011年06月14日)列入國家標(biāo)準(zhǔn)的漢字有幾萬個,國家語委2010年調(diào)查,當(dāng)年漢字使用的字種共有10613個,而多數(shù)用戶只認(rèn)識幾千字,只有使用形碼輸入法才能不依賴字典輸入字庫中的全部漢字。因此,能夠滿足社會需求的漢字形碼輸入法是不可或缺的。用26個字母編制漢字形碼有475254個編碼碼位,6763個gb2312-80漢字的編碼只占用1.4%;21003個gbk漢字的編碼也只占用碼位中的4.4%,故能夠設(shè)計出低重碼率的漢字形碼。由于重碼很少,編制智能化軟件比拼音輸入法難度小,重碼選擇要比智能拼音少得多,輸入性能會更好。
但是現(xiàn)在使用的形碼輸入法不能滿足規(guī)范、易學(xué)、高效、通用的要求,快速性好的產(chǎn)品需要死背口訣難學(xué)難記,拆分獨(dú)體字違反漢字規(guī)范;而易學(xué)性好的產(chǎn)品快速性不佳。如何研究新的形碼產(chǎn)品有各種不同觀點(diǎn):有人主張專門研發(fā)識字教學(xué)用形碼,將來再學(xué)打得快的形碼;有人說要區(qū)分“看打”還是“想打”,寫文章是“想打”,慢一點(diǎn)沒關(guān)系,等等。然而正如國家語委文件所指出:“語言文字信息處理的技術(shù)和使用水平,已經(jīng)成為衡量國家現(xiàn)代化水平的重要標(biāo)志?!?《關(guān)于進(jìn)一步做好語言文字信息化工作的若干意見》)北京語言大學(xué)黨委書記原語委副主任李宇明指出:“我們現(xiàn)在最大的任務(wù)是搶占漢字信息化的制高點(diǎn),讓漢字在信息化環(huán)境下更方便的應(yīng)用,并獲得信息化的話語權(quán)與語言紅利?!碑?dāng)前最需要的,是向社會廣大計算機(jī)用戶提供易學(xué)高效、有效防止提筆忘字頻寫錯別字的漢字形碼輸入法。
漢字形碼輸入法的研發(fā)包含漢字編碼技術(shù)和輸入法軟件技術(shù)兩個層次,由于軟件技術(shù)已經(jīng)成熟,因此研發(fā)的關(guān)鍵在于漢字形碼編碼技術(shù)的創(chuàng)新。
與此同時,使用漢字字典查生字很不方便,直接翻頁查字的愿望長期不能實(shí)現(xiàn),在信息時代用電子字典查生字仍然需要找部首、數(shù)筆劃,效率很低,不符合信息時代的需要。理想的解決方案,是編制適合漢字排序檢索的漢字形碼字典,并且與計算機(jī)漢字輸入使用同一種形碼,做到一次學(xué)習(xí),兩種收獲,使學(xué)編碼和學(xué)漢字相輔相成,這也需要通過漢字形碼編碼技術(shù)創(chuàng)新來解決。
本發(fā)明的內(nèi)容,主要體現(xiàn)在漢字形碼編碼技術(shù)創(chuàng)新方面。
三、
技術(shù)實(shí)現(xiàn)要素:
:
(一)“易學(xué)高效形碼”要解決的技術(shù)問題
①提高形碼輸入法的易學(xué)性,不背助記口訣,不學(xué)拆分規(guī)則,易記不忘,各類計算機(jī)用戶都能夠較快學(xué)會(小學(xué)生通過老師講解學(xué)習(xí)使用)。
②提高形碼輸入法的快速性,使輸入效率超過智能拼音輸入法和現(xiàn)有形碼輸入法,包括提高gb2312-80漢字的單個漢字輸入快速性和詞組輸入快速性,提高數(shù)學(xué)物理符號和數(shù)字序號輸入快速性,以及提高gbk漢字輸入的便捷性。
③提高形碼輸入法的規(guī)范性,編碼方法符合各種漢字規(guī)范。
④編碼方法與學(xué)校漢語教學(xué)保持一致,漢字編碼的思維過程與漢字書寫一致,有助于正確書寫漢字,從根源上防止提筆忘字頻寫錯別字。
⑤使?jié)h字形碼輸入法獲得良好的通用性,適合想打、看打、聽打;適合中小學(xué)生、普通用戶和專職錄入人員使用,一次學(xué)習(xí)終生適用。
⑥編碼方法適合編制直接翻頁查字的漢字字典和直接輸入的電子字典,漢字排序檢索與計算機(jī)漢字輸入使用同一種形碼。
⑦將“易學(xué)高效形碼”轉(zhuǎn)換成數(shù)字碼能夠高效地用于手機(jī)漢字輸入。
(二)“易學(xué)高效形碼”采用的技術(shù)方案
1.遵循新的漢字編碼思路
傳統(tǒng)的漢字形碼編碼技術(shù)沿襲“建立漢字鍵盤”、“拆分漢字拼形輸入”的編碼思路。“易學(xué)高效形碼”不采用這種思路,因?yàn)闈h字輸入的實(shí)質(zhì)是向計算機(jī)鍵入漢字的編碼,上述傳統(tǒng)思路只是一種比擬化表述,與書寫漢字的思維過程不一致,造成學(xué)習(xí)困難,并引起拆分方法的爭論,制約漢字編碼技術(shù)的發(fā)展。
“易學(xué)高效形碼”的編碼思路是:編碼部件從《信息處理用gb13000.1字符集漢字部件規(guī)范》“漢字基礎(chǔ)部件表”中選取,不制訂新的拆分規(guī)則,應(yīng)用編碼部件的音形特征,用26個字母代碼(鍵盤拉丁字母,即漢語拼音字母)對全部編碼部件進(jìn)行理據(jù)性表達(dá),按照編碼規(guī)則對漢字直接編碼輸入。
2.采用“編碼部件音形綜合表達(dá)方法”
形碼輸入法借助編碼部件的讀音或形狀編碼早已有之,但由于只有單項(xiàng)的不完整的編碼方法,不能達(dá)到易學(xué)高效的目標(biāo)。“易學(xué)高效形碼”采用的技術(shù)方案是整體配套的“編碼部件音形綜合表達(dá)方法”,包含以下內(nèi)容:
(1)編碼規(guī)則簡單易操作
①單碼成字部件編碼,在編碼部件的代碼后補(bǔ)加部件首筆筆形和末筆筆形的兩個代碼,如:木=mhn,其中,木-m,一-h,\-n(代碼關(guān)系用短橫-表示,編碼關(guān)系用等號=表示,下同)。
②兩碼合體字編碼,按照筆順先后取兩個編碼部件的代碼并補(bǔ)加部件末筆筆形的兩個代碼,如:爐=hhnp,其中,火-h,戶-h,丶-n,丿-p,輸入詞組時不加補(bǔ)碼,如:爐灶=hhht。
③三碼合體字編碼,按照筆順先后取三個編碼部件的代碼為其編碼,輸入時補(bǔ)空格鍵結(jié)束,如:甄=xtw,其中,西-x,土-t,瓦-w。
④四碼合體字編碼,按照筆順先后取四個編碼部件的代碼,如:躍=kzpd,其中,口-k,止-z,ノ-p,大-d。
⑤多于四碼的合體字編碼,依照筆順先后取編碼部件的前三個代碼及最后一個代碼,如:贛=liab,其中,立-l,日-i,十-s,貝-b;輸=csrd,其中,車-cs,人-r,刂-d。
(2)應(yīng)用讀音特征表達(dá)成字部件、有名稱的部首及半字部件,并實(shí)行字母代用
①編碼部件是漢字,代碼是拼音首字母,例如:
貝-b,立-l,口-k,賠=blk;木-m,又-y,寸-c,樹=myc;火-h,口-k,木-m,燥=hkkm。
②編碼部件是有名稱的部首,代碼是名稱實(shí)義字的拼音首字母:
左耳旁阝-e(耳),單人旁亻-r(人),走之兒辶-z(走),例字:附=erc,過=cz,陪=elk。
按上述方法,字母o、v沒有用處,字母a、i用處很小。實(shí)行字母代用,用字母o表達(dá)編碼部件水和氵(以o代s),用字母v表達(dá)編碼部件手和扌(以v代s),用字母a表達(dá)草字頭艸和乂(叉)(以a代c);用字母i表達(dá)日(以i代r);有效增大編碼空間,減少重碼。
③借用整字讀音表達(dá)半字編碼部件,例如:
刺字左部束-c,刺=cd,肺字右部市-f,肺=uf,
韓字左部
衣字下部-i,衣=ii,殷字左部
糾字右部丩-j,糾=lj,青字上部-q,青=qu,
④單筆畫,代碼是名稱的拼音首字母:
橫是h(一-h),撇是p(丿-p),提是t(/-t),點(diǎn)捺是n(丶-n,\-n),以o代s表示豎(丨);
例字:畫=htu,向=pnk,或=gkt,主=nw,舊=oi,木=mhn,昌=iihh。
(3)應(yīng)用形狀特征表達(dá)編碼部件
①編碼部件不是漢字、名稱不通用,代碼是與其形狀相近的字母:
如:丆,彐,,凵,冂,對應(yīng)的代碼是t,e,f,u,n,
例字:頁=tb,尋=ec,右=fk,畫=htu,周=ntk。
②各種折筆用與其形狀相近的字母表示:
用l表示l形折乚ㄥくしl等,如:吼=kzl,厶=vln,女=nlh,民=mzl,斷=mmlj;
用s表示s形折ㄅ等,如:巧=ghs,弓=gzs;
用z表示z形折和半z形折乙乛等,如:億=rz,虱=zpc,司=zhk,買=zed,也=y(tǒng)zl。
(4)雙碼部件整體表達(dá)法
對一部分編碼部件進(jìn)行雙碼整體表達(dá),兩個字母代碼即是雙碼成字部件的編碼,不拆分漢字基礎(chǔ)部件,應(yīng)用音形特征保持表達(dá)理據(jù)性,保持編碼規(guī)則最簡化,有效減少重碼,提高輸入效率。例如,獨(dú)體字止、重如果都用z表示,易學(xué)易記,但重碼不少:芷董、趾踵……,為解決重碼問題,很多形碼輸入法都把重字拆分,拆分方法難學(xué)難記,且違反漢字部件規(guī)范。
“易學(xué)高效形碼”不拆分重字,取為雙碼部件進(jìn)行整體表達(dá),有效減少了重碼:重=zt,z為重字拼音首字母,t為下部土字拼音首字母,與其他形碼的拆分方法比較如下:
一體化形碼:重=zt,止-z,踵=kzzt,趾=kzz
五筆字型:重=ノ一日土=tgjf,止-h,踵=khtf,趾=khhg
鄭碼:重=千日二=mekb
“雙碼部件整體表達(dá)法”易學(xué)易記,不拆分獨(dú)體字,符合漢字部件規(guī)范,仍按前述編碼規(guī)則編碼,不需要增加新的編碼規(guī)則。
例如雙碼部件車=cs,在合體字中是取兩個碼,還是只取前碼或后碼,由前三后一的規(guī)則來決定:
①在3碼、4碼字中車取雙碼cs:連=csz,輪=csrb,惲=xgcs(辶-z,匕-b,冖-g,忄-x),
②多于4碼的字,車之前已取了2碼,車取第3碼即前碼c:鰱=uhcz,最后取z(魚=uh),
③多于4碼的字,車之前已取了3碼,車取最后1碼即后碼s:輝=xwgs(光=xw)。
(5)詞組編碼簡單易學(xué)適合字詞混合輸入
在gb2312-80漢字字庫中編入25000多條常用詞組,重碼率低于4%,覆蓋率高,并編入多種數(shù)字序號和數(shù)學(xué)物理符號,與漢字等同輸入。編碼規(guī)則簡單易學(xué):
兩字詞組:[1首][1末][2首][2末],呈獻(xiàn)=kwsq(口-k,王-w,十-s,犬-q)
三字詞組:[1首][2首][3首][3末],計算機(jī)=y(tǒng)zmj(讠-y,-z,木-m,幾-j)
四字詞組:[1首][2首][3首][4首],望而卻步=wetz(亡-w,而-e,土-t,止-z)
多字詞組:[1首][2首][3首][末首],為人民服務(wù)=wrmw(為-w,人-r,民-m,夂-w)
詞組編碼取首末兩碼最方便,與雙碼部件取首末兩碼的規(guī)則一致,適合字詞混合輸入。
編入數(shù)字序號、數(shù)學(xué)物理符號,提供符號編碼表供使用,比插入符號更快速。
3.編碼方法繁簡兼容,gbk漢字編碼方法與gb2312-80漢字相同
gbk漢字有21003個字符,重碼更多,為減少重碼,有的形碼輸入法改用5碼(98王碼國際版:镕=qpwwk),增加了學(xué)習(xí)難度,降低了輸入效率?!耙讓W(xué)高效形碼”的編碼方法繁簡兼容,gbk漢字編碼方法與gb2312-80漢字相同,只需增加若干編碼部件,輸入gbk漢字重碼不超過10個,不需要翻頁查找,輸入gbk漢字不再難,能夠保證整個輸入法的高效率。
用于“通用規(guī)范漢字”編碼,不需要添加編碼部件。
4.一體化漢字輸入
(1)“易學(xué)高效形碼”適合編制直接翻頁查字的漢字字典
設(shè)計“易學(xué)高效形碼”編碼時,考慮到與部首檢字法有良好銜接,適合編字典之用:
①《漢字統(tǒng)一部首表》中有80%被劃入《漢字部件規(guī)范》之“漢字基礎(chǔ)部件表”,“易學(xué)高效形碼”將其選為編碼部件,并增選合體字部首魚、齒、骨、革等。
②編碼部件的歸并與部首檢字法一致,例如:蘭字頭(丷)歸入八,危字頭()歸入刂,危字的尾(,兩畫)歸入卩,四點(diǎn)(灬)歸入火,尋字頭(彐)與彝字頭(彑)同部等等。
③常用部首依據(jù)其音形特征表示,可與部首檢字法比照銜接,《易學(xué)高效形碼字典》漢字排序之片段如下(數(shù)字表示聲調(diào)):
漢字的字形用英文字母進(jìn)行有理據(jù)的表達(dá),如咐字由口人寸構(gòu)成,編碼是krc,口-k,亻-r,寸-c,易學(xué)易記,查字速度超過傳統(tǒng)方法許多倍?!兑讓W(xué)高效形碼字典》即是“易學(xué)高效形碼”的編碼輔助教材,學(xué)漢字與學(xué)編碼相輔相成。
(2)“易學(xué)高效形碼”轉(zhuǎn)換為數(shù)字碼用于手機(jī)漢字高效輸入
按照《gb/t18030-2000數(shù)字碼規(guī)范》將“易學(xué)高效形碼”轉(zhuǎn)換為數(shù)字碼(與英語的轉(zhuǎn)換規(guī)則相同),可用于手機(jī)漢字輸入,重碼數(shù)少于10,一鍵選中不需要翻頁查找,實(shí)現(xiàn)字母鍵盤和數(shù)字鍵盤漢字輸入一體化。轉(zhuǎn)換規(guī)則如下:
a、b、c-1,d、e、f-2,g、h、i-3,j、k-4,l、m-5,
n、p-6,o、q、r-7,s、t、u-8,v、w、x-9,y、z-o。
輸入實(shí)例:輸入“鋒”字,字母編碼jwf,轉(zhuǎn)換成數(shù)字碼492,鍵入鍵盤后顯示提示:鋒、鐺、吮、郢、咚,選定“鋒”字即可。
(三)使用“易學(xué)高效形碼”的有益效果
1.“易學(xué)高效形碼”具有良好的易學(xué)性,各類計算機(jī)用戶都能較快學(xué)會
①以“柬”字和“煉”字的編碼為例與現(xiàn)有技術(shù)進(jìn)行對照:
“易學(xué)高效形碼”是對漢字直接編碼:柬=j(luò)x,煉=hjx,j、h為柬和火的拼音首字母,x為柬下部小字的拼音首字母;煉字右部是柬的簡化,編碼仍為jx,易學(xué)易記。五筆字型的拆分與編碼為:柬=一四?。絞lii,煉=火七八=oanw,拆分出的部件與代碼的對應(yīng)關(guān)系是,一-g,四-l,小-i,火-h,七-a,-n,八-w,拆分規(guī)則難學(xué)難記,編碼部件與字母代碼之間沒有音形聯(lián)系,三碼字要編識別碼,柬與其簡化形式要學(xué)兩種拆分方法,因此要學(xué)拆分規(guī)則,背助記口訣,學(xué)識別碼的編法,學(xué)習(xí)難度極大,需要很長時間才能做到熟練編碼輸入。有人說,對獨(dú)體字進(jìn)行拆分可以減少編碼部件的數(shù)量,背口訣容易。這是一種誤導(dǎo),因?yàn)闈h字獨(dú)體字的數(shù)量是確定的,減少編碼部件就要多拆分獨(dú)體字,編碼部件減少一個“柬”,就要學(xué)會柬的拆分方法。拆分方法難學(xué)難記,編碼速度也要減慢;對獨(dú)體字不搞拆分,整體表達(dá),易學(xué)易記,編碼速度更快。對有理據(jù)的表達(dá)只要見到編碼部件能夠識別即可,并不需要背口訣記憶。
②折筆表達(dá)方法與現(xiàn)有技術(shù)對照
《漢字折筆規(guī)范》有25種折筆筆形,五筆字型統(tǒng)一用n表示,認(rèn)知碼統(tǒng)一用數(shù)字9表示,容易產(chǎn)生重碼,且代碼與筆形沒有音形聯(lián)系。鄭碼用x表示半z形折,用y表示z形和s形折,用z表示l形折,雖有利于減少重碼但缺少表達(dá)理據(jù),不利于記憶。只有表形碼用l表示l形折,用z表示z形折和半z形折比較合理?!耙讓W(xué)高效形碼”對25種折筆筆形依據(jù)形狀特征分為l形折、s形折、z形折和半z形折,既有利于減少重碼,又容易學(xué)習(xí)記憶,最為合理。
2.“易學(xué)高效形碼”具有良好的快速性
形碼輸入法的快速性與以下因素有關(guān):編碼速度,重碼多少,平均碼長的長短,符號輸入便捷性,gbk漢字輸入的便捷性等。
①“易學(xué)高效形碼”重碼字?jǐn)?shù)量最少
形碼輸入法重碼字?jǐn)?shù)量比較(gb2312-80)如下:
易學(xué)高效形碼:一級漢字重碼73字/1.1%,全部漢字重碼2.8%
五筆字型:一級漢字重碼134字/2%,全部漢字重碼8%
鄭碼:一級漢字重碼178字/2.6%
認(rèn)知碼:一級漢字重碼684字/10%
“易學(xué)高效形碼”和五筆字型數(shù)據(jù)由發(fā)明人統(tǒng)計得出,其他數(shù)據(jù)取自《計算機(jī)世界》“認(rèn)知碼不宜推廣”一文。
②“易學(xué)高效形碼”不拆分獨(dú)體字,編碼速度快,與現(xiàn)有技術(shù)對照如下:
易學(xué)高效形碼:垂=ch,我=wg,
五筆字型:垂=ノ一艸士=tgaf,我=ノ扌乚ノ=trnt,
鄭碼:垂=千艸二=meeb,我=ノ扌戈=mdhm
③“易學(xué)高效形碼”兩碼字和三碼字多,四碼字少,平均碼長小
易學(xué)高效形碼:門=mz,米=mm,石=shh,品=kkk,
五筆字型:門=uyhn,米=oyty,石=dgtg,品=kkkf。
④“易學(xué)高效形碼”編入數(shù)字序號和數(shù)學(xué)物理符號,提供符號對照表,比插入符號快速如:dva=①,dvb=②,dvc=③,dua=(1),dub=(2),duc=(3),dr=π,dra=α,drb=β,
dacz=⊥,daj=∠,∴=dasy,dalg=log,dajf=∫,dano=№,dacm=cm,dapm=m2。
⑤“易學(xué)高效形碼”在gb2312-80漢字字庫中編入詞組25000多條,重碼率低;用字詞混合輸入方便快速,并為編制智能化整句輸入軟件創(chuàng)造了良好條件。
輸入實(shí)例比較:《星光下,那一道轍痕》摘錄(2016年6月26日解放日報文章)
那是/1920/年/2/月/的/一個/凌辰,說/是/凌辰,還有/星光/依稀,但/路上/仍是/黑/得/瘆/人。北京/朝陽/門,此時/駛/出/一輛/舊式/帶/蓬/騾/車,在/通往/天津/的/土/路上/卷起/了/一路/行/塵?!闭屋斎霙]有重碼。
用微軟智能拼音整句輸入,顯示為:“那時1920年2月的一個凌晨,說是凌晨,還有星光議席,但路上仍是黑的神人。北京潮陽門,此時是處一輛舊時代碰落車,在通往天津的土路上卷起了一路星辰。”有多處需要返回逐字修改,在同音字中挑選。
⑥“易學(xué)高效形碼”gbk漢字編碼方法與gb2312-80漢字相同,兩個字庫能夠組成鏈接式軟件,gb2312-80漢字為常用檔,gbk漢字為備用檔,輸入gbk漢字重碼不超過10個,不需要翻頁查找,方便快捷,并能夠保證整個輸入法的高效率。以輸入“镕”字為例:
“易學(xué)高效形碼”:镕=j(luò)gbk,輸入常用檔無顯示,轉(zhuǎn)入備用檔,再輸入jgbk即顯示“镕”字;
五筆字型:因不能事先判斷“镕”是否為gb2312-80漢字,先編為4碼,镕=qpwk,輸入無顯示,再改用98王碼國際版,重新編為5碼,镕=钅宀八人口=qpwwk,輸入后方能顯示。
3.“易學(xué)高效形碼”具有良好的規(guī)范性
“易學(xué)高效形碼”符合漢字筆順規(guī)范、折筆規(guī)范、部件規(guī)范、內(nèi)碼規(guī)范等各種規(guī)范,與學(xué)校的漢語教學(xué)一致。對照現(xiàn)在使用的形碼,常有不符合漢字規(guī)范的情況,如五筆字型把戊、我等字的末筆丶改為ノ;鄭碼把達(dá)、建等字的辶、廴放在大、聿之前,違反筆順規(guī)范。
4.“易學(xué)高效形碼”編碼思維過程與漢字書寫思維過程一致,有效防止提筆忘字
小學(xué)生學(xué)漢字,獨(dú)體字學(xué)讀音和筆畫,合體字學(xué)讀音和漢字構(gòu)成;“易學(xué)高效形碼”編碼,獨(dú)體字由拼音首字母和首筆畫、末筆畫的代碼組成,合體字由構(gòu)成漢字的各部件拼音首字母組成,并列比較很容易看出相關(guān)性:
學(xué)漢字——石,shi,一ノ丨乛一,“易學(xué)高效形碼”——石=s+一一=shh,
世,shi,一丨丨一l,世=s+一l=shl,
木,mu,一丨ノ\,木=m+一\=mhn,
碟,die,石、世、木構(gòu)成,碟=ssm。
對照五筆字型:石=dgtg,世=anv,木=ssss,碟=dans,與漢字書寫缺少相關(guān)性。
使用“易學(xué)高效形碼”有助于正確書寫漢字,有很強(qiáng)的防止提筆忘字頻寫錯別字的功能。書寫漢字是同時思考字音、定義、字形而寫出,“易學(xué)高效形碼”編碼的思維過程也是想字、編碼、鍵入,如符合的符是竹字頭-z,符=zrc;附和的附是耳刀旁阝-e,附=erc,因此會寫就會打,會打就會寫。
再如翱字左下部是大十(ds),不是本,“易學(xué)高效形碼”翱字編碼bdsu——白大十羽,編碼與書寫一致。肺、沛等字的右半部分是市,不是城市的市,容易寫錯,而市在gbk漢字中是一個字,音fu;在“易學(xué)高效形碼”中,市-f,肺=uf,沛=of,會編碼就不會寫錯。
5.“易學(xué)高效形碼”具有良好的社會通用性。
良好的易學(xué)性和快速性,與漢語教學(xué)一致,使其適合中小學(xué)生、普通用戶和專職錄入人員等各類用戶,適合想打、看打、聽打;一次學(xué)習(xí)終生適用。而設(shè)想為小學(xué)生識字專門設(shè)計簡單易學(xué)的形碼,以后再學(xué)習(xí)快速性好的形碼,顯然其學(xué)習(xí)投入更大,能夠快速輸入的時間向后推遲很多。對于沒有學(xué)好漢語拼音和方言口音重的人,學(xué)習(xí)“易學(xué)高效形碼”更有到;對于用字范圍廣、要求輸入速度快的用戶,學(xué)習(xí)“易學(xué)高效形碼”能夠更早受益。
6.用《易學(xué)高效形碼》編制直接翻頁查字的漢字字典和直接輸入的電子字典,定位準(zhǔn)確,查字速度極高。如要查“賣官鬻爵”的鬻字,編碼為gmmt,(弓-g,米-mm,丅-t)直接查到鬻字讀音為yu4。而用《新華字典》部首檢字表,查弓部無此字,要查鬲部,數(shù)筆畫是10畫,查部首表,鬲部在105頁,再查,鬻字在正文637頁,翻到才能查出鬻字讀音為yu4。如果不知道有鬲部,要去查“難檢字筆畫索引”,數(shù)出筆畫是22畫才能翻到。
7.用《易學(xué)高效形碼》數(shù)字碼進(jìn)行手機(jī)漢字輸入效率高,輸入1-4個數(shù)字顯示所需漢字,重碼小于10,不需要翻頁查找。
四、具體實(shí)施方式
1.利用本專利提供的“易學(xué)高效形碼gb2312-80漢字及詞組計算機(jī)漢字輸入軟件”和“學(xué)習(xí)材料”進(jìn)行計算機(jī)漢字輸入,提供“《新華字典》易學(xué)高效形碼檢字表”作為輔助學(xué)習(xí)材料,并可以更便捷地用《新華字典》查生字。
2.利用本專利提供的“gb2312-80漢字碼表”(擴(kuò)展至《新華字典》簡體字收字范圍),編制直接翻頁查字的《易學(xué)高效形碼字典》和直接輸入查字的《易學(xué)高效形碼電子字典》。
3.利用本專利提供的“gb2312-80漢字及詞組碼表”以及“gbk漢字碼表”,研發(fā)鏈接式輸入軟件及智能化輸入軟件,為社會提供更優(yōu)秀的計算機(jī)漢字輸入法產(chǎn)品。
4.在計算機(jī)漢字輸入法推廣成功之后,利用本專利提供的“gb2312-80漢字?jǐn)?shù)字碼碼表”,研制嵌入式手機(jī)漢字輸入軟件。