專利名稱:聲韻形特漢語(yǔ)字詞編碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種電子計(jì)算機(jī)及通訊信息處理技術(shù),更具體地說(shuō),本發(fā)明涉及一種使電子計(jì)算機(jī)和通訊設(shè)備的輸入設(shè)備能輸入圖形文字字符集編碼的方法。
在本說(shuō)明書中,以《中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)字符集基本集》作為圖形文字字符集的字集的代表。
眾所周知,漢字?jǐn)?shù)目龐大,字形復(fù)雜,如何使計(jì)算機(jī)和通訊設(shè)備能處理漢字,已成為計(jì)算機(jī)和通訊技術(shù)在我國(guó)推廣普及的關(guān)鍵,由此產(chǎn)生了眾多的漢字輸入編碼方案。較著名的如王永民的《五筆字型》,周志農(nóng)的《自然碼》,有關(guān)資料可見《中文信息》期刊,已申請(qǐng)專利的可檢索專利文獻(xiàn)的GO6F。
現(xiàn)有的編碼方案可分為形碼,音碼和音形混合碼三種,形碼拆漢字取出字根編碼,不受漢語(yǔ)語(yǔ)音影響,但規(guī)則復(fù)雜,音碼使用漢語(yǔ)拼音方案編碼,易學(xué)且腦力負(fù)擔(dān)小,但重碼多,效率低,音形混合碼兼有兩者特點(diǎn),如果編碼恰當(dāng),則可具有兩者的最多優(yōu)點(diǎn),最少缺點(diǎn)。
本發(fā)明是音形混合碼,研究的目的就是找到較佳點(diǎn),使?jié)h語(yǔ)字詞輸入易學(xué)易用,即只需少量學(xué)習(xí)就可高速輸入漢字。為了達(dá)到易學(xué)的目的,采用漢語(yǔ)拼音方案作音碼,常見的67個(gè)部首及7種字形結(jié)構(gòu)作形碼,并輔以屏幕提示。為了達(dá)到易用的目的,采用特征碼以唯一確定字詞編碼,實(shí)現(xiàn)高速盲打,并輔以簡(jiǎn)碼。
漢字和詞匯的第一鍵位是聲碼,可見鍵位圖鍵位左上角,其中E為零聲母,用于無(wú)聲母的音(如ai愛)。第二鍵位是韻碼,可見鍵位圖鍵位右上角,與同鍵的聲碼相拼,可得如下記憶口訣‘樊虹劍想領(lǐng)別扭贈(zèng)票,為全國(guó)人民跨躍唐村賽道’漢字的第三碼是形碼,67個(gè)部首可見鍵位圖鍵位下部,當(dāng)某漢字無(wú)這些部首時(shí),用P、Q、L、A、B、M、G分別表示字形的上下、獨(dú)體、左右、下角包圍(如‘匙’)、上包圍(如‘謄’)、三面包圍和上角包圍(如‘病’)結(jié)構(gòu)。詞匯的第三碼是第二字的聲碼。字詞的第四碼是特征碼,用來(lái)使編碼無(wú)重碼。取碼規(guī)則是漢字取除部首外的最顯著字根讀音聲碼,如‘斑’取‘文’的W。雙音節(jié)詞取尾字韻碼。多音節(jié)詞取尾字聲碼。遇有重碼時(shí),頻率大的不變其它的另選未用的鍵位。字詞的頻率參照《現(xiàn)代漢語(yǔ)頻率詞典》(北京語(yǔ)言學(xué)院出版社)。
在鍵入前三位后,屏幕提示同碼字及其特征碼,按特征碼選字,可避免易學(xué)性上的損失。
26個(gè)鍵位可有676種雙鍵組合,漢語(yǔ)拼音方案只用了400種,剩下的276種中,本發(fā)明使用270種作簡(jiǎn)碼,分配給最高頻的字詞。雙鍵組合EG作轉(zhuǎn)義符,用于改變輸入設(shè)備的狀態(tài),使輸入設(shè)備下一個(gè)輸入為國(guó)標(biāo)碼。
與現(xiàn)有的漢字編碼方案比較,本發(fā)明有易學(xué)易用的優(yōu)點(diǎn)。只需掌握漢語(yǔ)拼音,字詞的前三碼馬上能學(xué)會(huì),再照屏幕提示按特征碼選字詞,邊用邊學(xué),很快就能盲打。再掌握簡(jiǎn)碼,就能達(dá)到高速盲打。現(xiàn)有的漢字編碼方案常另配一幾萬(wàn)詞的詞庫(kù),占用大量的編碼和內(nèi)存空間,增大了重碼率,本方法選用1690個(gè)高頻詞與漢字統(tǒng)一編碼能覆蓋全部應(yīng)用的87.8%且無(wú)重碼,提高了編碼效率,減小了平均碼長(zhǎng)。
本發(fā)明的實(shí)現(xiàn)方法是建立一張編碼表,內(nèi)容是輸入設(shè)備的四個(gè)鍵位及其對(duì)應(yīng)的圖形文字字符集編碼。輸入設(shè)備接收到輸入后查表即可。
權(quán)利要求
1.一種使輸入設(shè)備能完成圖形文字字符集編碼輸入的方法,這種方法使得輸入設(shè)備的鍵位和圖形文字字符集編碼建立起對(duì)應(yīng)關(guān)系,并通過(guò)人機(jī)交互輸入漢字和詞匯。本發(fā)明的特征是它使圖形文字字符集內(nèi)漢字與詞匯統(tǒng)一編碼,由輸入設(shè)備的四個(gè)鍵位對(duì)應(yīng),漢字全碼的前三個(gè)鍵位表示漢字的聲母,韻母,部首或字形結(jié)構(gòu),詞匯全碼的前三個(gè)鍵位表示組成該詞的漢字聲韻母,最后一鍵位字詞統(tǒng)一編碼,取碼規(guī)則是漢字取字根讀音聲母,雙音詞取尾字韻母,多音詞取尾字聲母,遇有重碼,保持一字詞不變,其它的取另一未用鍵位。
2.據(jù)權(quán)利要求1所述方法,其特征是將漢語(yǔ)拼音方案中無(wú)意義的聲韻組合構(gòu)成的二位鍵碼作為簡(jiǎn)碼,唯一對(duì)應(yīng)一漢字或詞。
3.據(jù)權(quán)利要求1所述方法,其特征是取二位鍵碼作轉(zhuǎn)義符,轉(zhuǎn)換輸入設(shè)備的狀態(tài)。
全文摘要
聲韻形特漢語(yǔ)字詞編碼屬于電子計(jì)算機(jī)和通訊技術(shù)領(lǐng)域,它解決了信息設(shè)備輸入漢語(yǔ)字詞的難題,它使字詞編碼相統(tǒng)一,易學(xué)易用相統(tǒng)一。采取漢語(yǔ)拼音為主,部首字形為輔,特征碼唯一確定的策略,稍學(xué)即會(huì),邊用邊學(xué),最后達(dá)到高速盲打。它采用了特征碼和字詞統(tǒng)一編碼的概念,使得平均碼長(zhǎng)降低的同時(shí),重碼率仍為零。
文檔編號(hào)G06F3/023GK1081524SQ93100910
公開日1994年2月2日 申請(qǐng)日期1993年1月10日 優(yōu)先權(quán)日1993年1月10日
發(fā)明者樊虹劍 申請(qǐng)人:樊虹劍