專利名稱:五十字元多能電腦漢字輸入系統(tǒng)及其鍵盤的制作方法
本發(fā)明屬于一種新式漢字編碼技術(shù)在電腦中實(shí)現(xiàn)的方法和專用輸入裝置。
自從電子計(jì)算機(jī)普遍應(yīng)用以來(lái),漢字編碼方案及其在電腦中實(shí)現(xiàn)的方法和專用裝置即成為國(guó)內(nèi)外信息專家注目的課題。因?yàn)樗巧婕暗接?jì)算機(jī)在我國(guó)普及推廣的關(guān)鍵技術(shù)問(wèn)題。迄今為止,國(guó)內(nèi)外已經(jīng)提出數(shù)百個(gè)方案,總體分為形碼、音碼和形音碼三種。在眾多方案中拼音碼,重碼太多;電報(bào)碼、區(qū)位碼背記困難;形音碼復(fù)雜難學(xué)。其主要的問(wèn)題在于漢字結(jié)構(gòu)復(fù)雜。將漢字拆為字元時(shí)基本字元太多,在計(jì)算機(jī)鍵盤的一個(gè)鍵帽上往往要加上一堆字元。如國(guó)內(nèi)公認(rèn)的優(yōu)秀方案王永民的“五筆字型碼”實(shí)際上有227個(gè)字元四川的“大眾碼”有172個(gè)字元。從而使記憶困難成為普及的一大障礙。
本發(fā)明的目的在于將構(gòu)成漢字的基本單元簡(jiǎn)化到最低限度以實(shí)現(xiàn)多種類型編碼方案,且保證其最低的重碼率以實(shí)現(xiàn)好學(xué),易記輸入快速的優(yōu)點(diǎn),并配置成簡(jiǎn)明通用鍵盤以利于計(jì)算機(jī)漢字化的實(shí)現(xiàn)。
本發(fā)明的關(guān)鍵在于本系統(tǒng)是在漢字頻度和構(gòu)字字元頻度的統(tǒng)計(jì)基礎(chǔ)上通過(guò)反復(fù)組配將漢字編碼的基本字元減少到五十元。也就是說(shuō)精選出五十個(gè)帶漢字字形信息量最大的高頻字元做為本發(fā)明的基本單元。取其的習(xí)慣名稱或讀音的聲母做為系統(tǒng)的基本代碼去運(yùn)用在形音碼,全形碼,雙拼碼等類型的編碼方案之中,從而大大減少了組碼的工作量和應(yīng)用者的記憶量。從而形成一種占用內(nèi)存最少使用簡(jiǎn)便快速的電腦漢字編碼系統(tǒng)。由于基礎(chǔ)字元少,可非常方便地將國(guó)際標(biāo)準(zhǔn)計(jì)算機(jī)鍵盤改造為與編碼方案相對(duì)應(yīng)的專用鍵盤,也有利用計(jì)算機(jī)漢字化的推廣中對(duì)英文鍵盤的改造。
下面將結(jié)合附圖和有關(guān)表格進(jìn)一步論述本發(fā)明實(shí)現(xiàn)的具體方案。
本系統(tǒng)所采用的五十個(gè)字元可按其讀音聲母或習(xí)慣名稱聲音舊納為25組,組成一個(gè)字元表。圖1為五十字元多能漢字輸入系統(tǒng)字元表。其中P和Q兩個(gè)聲母各包有一個(gè)字元,其余二十四個(gè)聲母(包括Y.W.U.E.V)各包含二個(gè)字元。為便于運(yùn)用字元,表中個(gè)別字元例有參考?xì)w類字元。一般都是按傳統(tǒng)歸類法歸類,如“亻”歸在“人”等。
新式編碼系統(tǒng)在電腦中實(shí)現(xiàn)的關(guān)鍵在于找到一種方法,它既可以將漢字以簡(jiǎn)單的規(guī)則組碼又將重碼率減少到最低成度。本發(fā)明恰能達(dá)到這一目的。具體的組碼方法如下所有漢字均按照五十字元分析再按一定的原則由字元代碼組成漢字的形碼,這些形碼即是在電腦中實(shí)現(xiàn)漢字輸入的基本檢索要素。本發(fā)明所采取漢字拆元的方法基本按方塊字二維結(jié)構(gòu)和四角明碼的傳統(tǒng)習(xí)慣。按照漢字結(jié)構(gòu)的不同特點(diǎn)拆元取碼順序分別由以下六種(可參看圖2編碼取元模式圖“共A.B.C.D.E.F六種”,其中1.2.3.4為取碼順序)第一種結(jié)構(gòu),首取左上角、右上角、右下角,參看圖2(A)。第二種結(jié)構(gòu)首取上角、右下角、右下角鄰位(B),第三種結(jié)構(gòu)首取上位、下位、中位(C)。第四種結(jié)構(gòu)首取上位、下位、中位右下角(D)。第五種結(jié)構(gòu)首取外位、內(nèi)右下角、內(nèi)右下角鄰位(E),第六種結(jié)構(gòu)首取外位、內(nèi)下位、內(nèi)上位(F)。如果須取第四碼則按第三碼鄰位先左鄰,后上鄰,參見(jiàn)圖2中〔4〕,一般情況下取三碼足以。
按以上原則對(duì)常用漢字編碼不但簡(jiǎn)單明確好學(xué)易記,而且重碼率極低,以常用國(guó)際一二級(jí)漢字庫(kù)統(tǒng)計(jì)僅有少數(shù)漢字重碼。以上編碼原則可運(yùn)用于全形碼,形音碼,雙拼碼方案之中構(gòu)成實(shí)用的漢字編碼系統(tǒng)。下面將通過(guò)實(shí)施例進(jìn)一步說(shuō)明本發(fā)明的目的是如何實(shí)現(xiàn)的。
實(shí)施例一,五十字元全形碼漢字輸入系統(tǒng)在電腦中實(shí)現(xiàn)的方法及其鍵盤。利用五十字元多能電腦漢字編碼方法實(shí)現(xiàn)全形碼方案是極其方便的。三字元以上的漢字基本上分拆編碼方案不變。
如“鼓”,取土十又一 TIYH“企”,取人一一丨 RHHL“美”,取丷丶王 RDIW如遇見(jiàn)二字元漢字時(shí)按照先上后下,先左后右,先外后內(nèi)原則拆元取碼。如“明”,取日月 RV“吉”,取士口 TK“回”,取口口 KK如遇見(jiàn)單字元字首先考慮拆為兩字,如不能拆的即補(bǔ)上本字元讀音聲母組成雙碼或三碼,原則是編碼時(shí)不出現(xiàn)重碼為準(zhǔn)。如“禾”,取丿木 PM“木”,取十
丿 IDP如字元不可拆則補(bǔ)上該字元的讀音聲母,如“一”,取一一 HH以上方案即構(gòu)成五十字全形碼的完整方案,在編制軟件時(shí)可考慮加設(shè)無(wú)重碼空格輸入和重碼報(bào)警。重碼字按使用頻度降序排列提示并加注聲母選擇輸入等技術(shù)方案以形成一個(gè)完善的實(shí)用方案。與此相適配的專用鍵盤,可將五十字元分別標(biāo)在25個(gè)輸入鍵帽上形成全形碼鍵盤,圖5中(H)即為該專用鍵盤圖,則應(yīng)用起來(lái)更加便利。
實(shí)施例二,五十字元形音式漢字編案方案及其專用鍵盤。形音式編碼的基本方法是本字編碼由形碼加本字音碼組成。形碼拆取碼原則基本和全形碼相同,具體方法如下單字元或雙字元漢字按全形碼規(guī)則取一字兩碼加上本字讀音聲母組成一字三碼的形音碼;三字元以上字按全形碼規(guī)則取出一字三碼加上本字讀音組成一字四碼。
如“禾”取丿木和讀音聲母H PMH“雙”取又又和讀音聲母I yYI“企”取人一一和讀音聲母Q RHHQ如遇見(jiàn)本字不會(huì)讀的字其聲母碼參照提示行引導(dǎo)出的提示碼選用。對(duì)多讀音字按其實(shí)際讀音選音碼。在形成軟件系統(tǒng)時(shí)配合按高頻字降序排列提示及簡(jiǎn)碼詞碼可使本方案的實(shí)用化程度(包括簡(jiǎn)易和快速)提高到國(guó)際先進(jìn)水平。為配合其實(shí)際運(yùn)用可在全字形鍵盤的基礎(chǔ)上在鍵上加標(biāo)聲母形成專用五十字元形音碼漢字輸入鍵盤,圖5中的(G)即為該專用鍵盤圖。
實(shí)施例三,五十字元雙拼漢字輸入方案及其鍵盤。雙拼方案是以讀音為主,字形為輔的編碼方案。所謂雙拼系采取字元和本字讀音的聲母代碼和韻母代碼組成雙碼以完成漢字的編碼方案。本實(shí)施例采用位讀雙拼方案組碼。為組碼方便將漢語(yǔ)拼音的聲母和韻母組成雙拼方案的聲母表(見(jiàn)圖3中的K),韻母表(L),和變讀韻母表(M),將其標(biāo)注在鍵帽上就構(gòu)成了五十字元雙拼方案專用鍵盤,圖5中的(I)即為該專用鍵盤圖。具體的組碼方案如下其基本組碼方案是由字元聲母代碼加上本字讀音的雙拼碼。如單字元字取字元聲母碼加讀音雙拼代碼一字三碼,如“土”取字元“土”雙拼tu TTW“月”取字元“月”雙拼yu UYU如雙字元以上漢字按全形碼拆元規(guī)則取兩字元聲母加本字讀音雙拼代碼組成一字四碼。如“雙”取元“又又”雙拼shuang YYIN“設(shè)”取“讠,”字元,雙拼she YQIO五十字元雙拼編碼方案中,也可以將雙拼碼放前字元碼放后組成另一種雙拼編碼方案,如“雙” YNYY“土” WTT“設(shè)” IOYQ配合雙拼方案可以將雙拼韻母加五十字元的代碼標(biāo)注在鍵帽上形成五十字元雙拼方案專用鍵盤見(jiàn)圖5中(I)。
如將三種專用鍵盤(G),(H),(L)綜合在一起可制成五十字元通用鍵盤,圖5中的(J)即為該鍵盤圖。
為將以上三個(gè)實(shí)施例方案在電腦中實(shí)現(xiàn)并使其達(dá)到實(shí)用化程度,而且使?jié)h字輸入平均碼長(zhǎng)及輸入速度達(dá)到國(guó)內(nèi)外先進(jìn)水平,本發(fā)明還設(shè)置與每種方案相配套的高頻字簡(jiǎn)碼和詞碼。
高頻字的拆元取碼順序和全形碼相同,其中一級(jí)字26個(gè)每字一碼,以本字讀音聲母為簡(jiǎn)碼,二級(jí)常用字417個(gè)每字兩碼,其中有75個(gè)字為避免重碼可取一個(gè)字元加本字讀音聲母。這些字輸入時(shí)在碼后加空格鍵區(qū)別。
詞碼是利用本漢字輸入系統(tǒng)的基本組碼原則將常用高頻詞編制的簡(jiǎn)碼,以用來(lái)提高漢字輸入的速度。根據(jù)所用電腦系統(tǒng)允許的容量可以分別選取不同數(shù)量的詞條做成支撐軟件。通常可參照三個(gè)級(jí)別來(lái)選取詞條一級(jí),參照《信息處理用現(xiàn)代漢語(yǔ)五千詞表》,計(jì)五千六百余條;二級(jí),承德醫(yī)學(xué)院和中國(guó)人民大學(xué)聯(lián)合制定的《信息處理用三萬(wàn)詞語(yǔ)表》,計(jì)三萬(wàn)六千多條;三級(jí),中小學(xué)教材詞頻統(tǒng)計(jì)成果《六萬(wàn)詞語(yǔ)表》,計(jì)六萬(wàn)五千多條。
具體詞碼的編制方法如下與全形碼配套的詞碼分為兩字詞,三字詞,四字詞和五字以上詞四種編碼方式。雙字詞如為每字一元?jiǎng)t編為兩碼,如“工廠” GO如雙字詞有一個(gè)為兩元以上字則取三碼,如“月亮”取元月,丶,乚 VDQ“明月”取日,月,月 RVV如雙詞每字均為雙元以上字則可取一字四碼,如“成功”取元丿,戈,工,力 PVGJ如為三字詞條則取每字的首元組成一詞三碼,如“計(jì)算機(jī)”取元讠,,木 YAM
如四字詞條則取每字的首元組成一詞四碼,如“奮發(fā)圖強(qiáng)”取元
囗 IJKA如五字以上詞條原則上按雙音節(jié),三音節(jié)劃開詞語(yǔ)只取劃開的音節(jié)的前一個(gè)字的首元編碼,可分為三碼,四碼。甚至五碼,如“國(guó)家標(biāo)準(zhǔn)局”劃為“國(guó)家”和“標(biāo)準(zhǔn)局”兩個(gè)詞條“國(guó)家”取元“囗”“標(biāo)準(zhǔn)局”取元“木”組碼 KM圖6即為全形碼的詞語(yǔ)編碼模式圖。
與形音碼相配的詞碼編制與全形碼相似也分為四類,二字詞條取每字首元聲母代碼加本字讀音聲母計(jì)一詞四碼,如“月亮” UYDL三字詞條取每字讀音聲母一詞三碼,如“計(jì)算機(jī)” JSJ如一詞條四碼則取每字本字讀音聲母一詞四碼,如“奮發(fā)圖強(qiáng)” FFTQ如一詞五字以上則按雙音節(jié)式三音節(jié)劃分再取每音節(jié)頭字讀音聲母組碼,可以是兩碼或三碼或四碼,如“中華人民共和國(guó)”取“中”“人”“共” ARG圖7即為形音碼詞語(yǔ)碼的編碼模式。
至于雙拼方案相對(duì)應(yīng)的詞碼,雙音節(jié)詞全拼編碼,一詞四碼;三音節(jié)或四音節(jié)詞取本字聲母編碼,多音節(jié)詞,分詞取詞頭聲母編碼。圖8即為雙拼方案詞碼編制的參考圖。
按本發(fā)明的要求所編制的電腦漢字輸入系統(tǒng)經(jīng)實(shí)驗(yàn)好學(xué)易記,其輸入速度可與西文相比,現(xiàn)將實(shí)用形音碼的技術(shù)測(cè)試標(biāo)準(zhǔn)舉例如下1.專用鍵數(shù) K=26 適用國(guó)際通用鍵盤2.最長(zhǎng)碼長(zhǎng) L1=43.最短碼長(zhǎng) L2=2(包括空格鍵)4.使用400字簡(jiǎn)碼平均碼長(zhǎng) L3=2.65.用詞碼平均碼長(zhǎng) L4≈1.8-1.96.GB 2312-80字中重碼率 P≈0.449%7.學(xué)習(xí)速度,初中一年級(jí)學(xué)生兩小時(shí)。
權(quán)利要求
1.一種多能電腦漢字輸入系統(tǒng),其特征在于系統(tǒng)選取五十個(gè)高頻字元做構(gòu)字的基本單元,并以其習(xí)慣名稱或讀音的聲母做構(gòu)字的基本代碼從而組成形音碼,全形碼,雙拼音碼的三類漢字編碼方案,以及與方案相對(duì)應(yīng)的鍵盤。
2.如權(quán)利要求
1所說(shuō)的漢字輸入系統(tǒng),其特征在于所選取的五十個(gè)高頻字元及其對(duì)應(yīng)的音碼為B P M P D T N L G K H J Q X A宀 丿 木 扌 丶 土 牛 丨 廣 口 一 钅 乚 忄
八 皿 方 刀 田 女 立 工 口 禾 巾 小 O I R Z C S Y W U E V廠 尸 日 足 艸 厶 讠 王 阝 氵蟲 十 人 辶 寸 纟 又 文 月 二 戈結(jié)合歸類字元組成一個(gè)系統(tǒng)編碼字元總表(圖1)。
3.如權(quán)利要求
1所說(shuō)的漢字輸入系統(tǒng),其特征在于與系統(tǒng)相應(yīng)的鍵盤可參照編碼方案特制成形音碼鍵盤(G)。全形碼鍵盤(H)。雙拼碼鍵盤(I),或五十字元通用鍵盤(J)。
4.如權(quán)利要求
1所說(shuō)的漢字輸入系統(tǒng),其特征在于漢字編碼按五十字元分拆形碼,并遵守以下方法組成全形碼a.三字元以上的字拆取字元根據(jù)漢字結(jié)構(gòu)的不同形式分別有左上角、右上角、右下角(A),上角、右下角、右下角鄰位(B),上位、下位、中位(C),上位、下位、中位右下角(D),外位、內(nèi)右下角、內(nèi)右下角鄰位(E),外、內(nèi)下、內(nèi)上(F)六種順序,b.雙字元字拆取字元按先上后下,先左后右,先外后內(nèi)的順序,c.單字元字須拆成兩碼順序同b,不可拆者補(bǔ)上該字元讀音聲母。
5.如權(quán)利要求
1所說(shuō)的漢字輸入系統(tǒng),其特征在于形音碼按以下方法組成a.單或雙字元字取二元聲母碼,再加上一個(gè)本字讀音聲母,一字三碼,b.三字元字取三字元聲母碼再加上一個(gè)本字讀音聲母,一字四碼,c.不會(huì)讀的字聲母碼參照屏幕上引導(dǎo)出的提示選碼,d.多讀音字聲母碼可按實(shí)讀音選碼。
6.如權(quán)利要求
1所說(shuō)的漢字輸入系統(tǒng),其特征在于雙拼碼可按以下方法組成a.由字元聲母加本字讀音雙拼音節(jié)組成,b.單字元字取字元聲母加雙拼音節(jié)代碼,一字三碼,c.兩字元以上字取字元聲母加本字雙拼音節(jié)代碼,一字四碼,d.雙拼音節(jié)代碼可放在前,也可放在后。
7.如權(quán)利要求
1或4或5或6所說(shuō)的漢字輸入系統(tǒng),其特征在于可配有高頻字簡(jiǎn)碼,其編碼方法同全形式字元碼方案,一級(jí)常用字26個(gè)每字一碼,二級(jí)常用字417字,每字兩碼。
8.如權(quán)利要求
1或4或5或6所說(shuō)的漢字輸入系統(tǒng),其特征在于還可配置詞碼,詞碼分三級(jí),一級(jí)詞碼五千六百條,其參照《信息處理現(xiàn)代漢語(yǔ)五千詞表》,二級(jí)詞碼三萬(wàn)六千條,參照《信息處理用三萬(wàn)詞語(yǔ)表》,三級(jí)詞碼六萬(wàn)五千條,參照《六萬(wàn)詞語(yǔ)表》,其詞碼編制方法可分,全形式方案(圖6),形音方案(圖7),雙拼方案(圖8)三種。
9.如權(quán)利要求
1所說(shuō)的漢字輸入系統(tǒng),其特征在于三種方案中的重碼字按使用頻度降序排列并顯示在計(jì)算機(jī)屏幕的提示行上。
專利摘要
一種多能電腦漢字輸入系統(tǒng)及其專用鍵盤設(shè)計(jì), 其關(guān)鍵在于本系統(tǒng)精選了五十個(gè)高頻字元為漢字編 碼的基礎(chǔ),運(yùn)用于全形碼,形音碼,雙拼碼各類漢字編 碼系統(tǒng)。結(jié)合與各類方案配套的簡(jiǎn)碼和詞碼得以在 電腦中方便地加以實(shí)現(xiàn)快速輸入。由于字元少且采 取傳統(tǒng)習(xí)慣名稱的讀音聲母為字元代碼,好學(xué)易記, 便于推廣。配套詞碼后本漢字輸入指標(biāo)可達(dá)平均 1.8—1.9鍵/字,輸入速度大于150字/分鐘。
文檔編號(hào)G06F3/023GK87100844SQ87100844
公開日1987年8月12日 申請(qǐng)日期1987年2月11日
發(fā)明者張國(guó)防 申請(qǐng)人:張國(guó)防導(dǎo)出引文BiBTeX, EndNote, RefMan