專利名稱:嵌套字素編碼法及其輸入鍵盤的制作方法
本發(fā)明稱之為“嵌套字素編碼法”,它是以滿足用戶需要和計(jì)算機(jī)要求為出發(fā)點(diǎn)的新穎的漢字字形編碼法且是一種準(zhǔn)確而快速的檢字法。以往的編碼法中有的每字擊鍵次數(shù)少,但鍵數(shù)多達(dá)三、四百;有的只用八鍵但擊鍵次數(shù)達(dá)6至8次,有二義性;有的鍵數(shù)不足32個(gè),但每個(gè)鍵上符號(hào)個(gè)數(shù)不均且擊鍵四次和需聯(lián)想;有的擊鍵次數(shù)只三次,但鍵數(shù)多于32個(gè)和鍵上符號(hào)多于四個(gè)且不均,符號(hào)總數(shù)多于170個(gè)。這些編碼方案對(duì)初學(xué)擊鍵者來說經(jīng)一月訓(xùn)練,其編碼速率(指單位時(shí)間里正確無誤地進(jìn)行編碼的平均字?jǐn)?shù))也不足50字/分,且大都無一套完整的編碼理論,不能直接形成最短的漢字代碼(16位)。
本編碼法的目的是克服現(xiàn)有絕大多數(shù)方案中存在的缺乏理論根據(jù)、有二義性、編碼速率低、代碼長(zhǎng)、唯一性差、需聯(lián)想、繁體簡(jiǎn)體不共用鍵盤表、每字擊鍵次數(shù)多于三次、不易盲打等缺點(diǎn),盡量保持書寫漢字的傳統(tǒng)習(xí)慣,建立一套科學(xué)的漢字編碼理論,推出一個(gè)簡(jiǎn)捷而易于掌握的編碼方法。
漢字由含位置信息的有序的字素集合而成,其結(jié)構(gòu)特點(diǎn)是嵌套式的。字素是經(jīng)對(duì)字的結(jié)構(gòu)進(jìn)行統(tǒng)計(jì)分析后優(yōu)選出來的能據(jù)以完整地組配出所有漢字的必不可少的元素。本編碼法以字素為編碼單位,把漢字分為單塊字(如“只”)和多塊字(如“叭”)。單塊字就是從書寫漢字的起筆開始,以字素及其集合為單位,沿字的水平方向往前,自上向下看,不能左右自然分開的字;能自然分開的字就是多塊字。其最左邊的一個(gè)叫首塊;緊接著的叫次塊,最右邊的為末塊。在每塊內(nèi),以字素及其集合為單位,沿垂直方向往下看(自左向右或從右往左),凡是能無阻礙地上下自然分開的部分稱為字層,最上邊的叫首層,緊接著是次層,最下邊為末層。在每層內(nèi),以字素及其集合為單位,沿水平方向往前從上向下看,能左右自然分開的筆形結(jié)構(gòu)稱為字片,最左者為首片,右邊緊挨著的為次片。首字素通常是首塊中頭一字素,它位于漢字左邊、頂上方或左上角。凡以傳統(tǒng)的“部首”為首字素的字,大都為單塊字、而以“偏旁”為首字素的字,幾乎全為多塊字。顯然,這種一環(huán)套一環(huán)的漢字結(jié)構(gòu)便是嵌套結(jié)構(gòu)。
本編碼法對(duì)字進(jìn)行編碼的基本規(guī)則是從漢字書寫的起筆開始,利用嵌套字素輸入鍵盤圖1,以形狀相同筆劃最多的字素為編碼單位去替換漢字的首字素,然后不重復(fù)地按塊、層、片首優(yōu)先順序原則去選取中間字素,最后以尾字素來結(jié)束整個(gè)漢字的編碼。尾字素系指書寫漢字時(shí)包含末筆在內(nèi)的筆劃最多的字素,它通常位于字的右邊,下邊或右下部。即,其規(guī)則簡(jiǎn)寫成漢字代碼=首→中→尾 (1)其首、中、尾之間彼此不應(yīng)重迭使用。
在以詞為主時(shí),漢字代碼=首→中→字鍵→尾 (2)(一)當(dāng)漢字至少由三字素組成時(shí)甲、當(dāng)漢字為單塊字時(shí)①若該字只二字層,且次層只一字素,則中間字素選首層中次片首(頭一字素),即次片首優(yōu)先于首片其余字素。如“壑、避、戇、熟”的“中”分別選“又、立、夂、九”。②若首層后有多個(gè)字素,則中間字素選次層首,即層首優(yōu)先于片首。如“毊、囂、攀”的“中”分別選“禾、頁、大”乙、當(dāng)漢字為多塊字時(shí)①若首塊后只一字素,則“中”選首塊中次層首,即,在首塊中“層首”優(yōu)先于“片首”,如“剿、鸚、顎、氍”的“中”分別選“果、女、二、隹”。②若首塊后不止一字素,則“中”選次塊首,即,“塊”優(yōu)先于“層首”,例如“碾、翰、
、耘、
、”的“中”分別選“尸、人、女、二、曰”。
(二)、漢字只由二字素組成時(shí),通常無中間字素為了使代碼等長(zhǎng)為16bit,應(yīng)把“尾”作“中”,和添加一位置鍵代碼作“尾”,目的是減少重碼。位置鍵代碼是“尾”所在鍵上位置所對(duì)應(yīng)的代碼。但當(dāng)此兩字素彼此鑲嵌或其“首”為“九、口、日”的單塊字時(shí),其“尾”分別選用鑲嵌鍵和“層”代碼。
(三)、漢字只由一字素組成時(shí),此時(shí)無“中”和“尾”,為了使其代碼等長(zhǎng),“中”用該字素所在鍵上位置所對(duì)應(yīng)的代碼,“尾”用一固定鍵代碼。由于字素本身是嵌套的,從而,可直接看鍵打字和使鍵上字素減到最少。
(四)、占全部漢字使用頻度五分之一的常用字和標(biāo)點(diǎn)符號(hào)的編碼=它們所在鍵代碼→SP (3) 這樣做的目的是提高編碼速率。
(五)、以字詞方式提供詞匯碼,目的是便于輸入和提高編碼速率。其編碼規(guī)則為令 詞匯=X1X2……Xn,其中Xi(i=1,2,…,n)為第i個(gè)漢字,令 X1首、X1中分別表示第1個(gè)字的“首”和“中”,Xn首表示第n個(gè)字之“首”。
X中=X1中+Xn首(X1僅一字素時(shí))X尾=Xn首+SP(X1僅一字素時(shí))甲、以字為主時(shí),詞匯代碼=X1首→X中→詞匯鍵→X尾 (4)如小心=小→心→詞匯鍵→SP計(jì)算機(jī)=言→十→詞匯鍵→木少壯不努力,老大徒傷悲=小→丿→詞匯鍵→非乙、以詞為主時(shí),只把上例中詞匯鍵去掉即可詞匯代碼=X1首→X中→X尾 (5)其輸入鍵盤至少含有32個(gè)鍵,這里只使用其中32個(gè)鍵,字素的鍵位安排是按其使用頻度高低進(jìn)行的,高頻字素放在鍵盤中央鍵位上,每鍵上最多四個(gè)字素,它可用任何技術(shù)措施表示在鍵上,以利于看鍵打字;整個(gè)鍵盤上字素安排是以減少重碼率為基準(zhǔn)的;編碼中小指使用頻度在10%以下。
編碼鍵數(shù)N與每字擊鍵次數(shù)X,代碼長(zhǎng)度L(bit)間滿足X=關(guān)系式。當(dāng)最短漢字代碼16bit時(shí),其最佳關(guān)系為 N=8 16 32允許每字平均擊鍵次數(shù) X=5 4 3
圖1中只有近30個(gè)異于辭書上偏旁部首的字素是為更多更好地解決計(jì)算機(jī)輸入編碼問題所創(chuàng)設(shè)的。
本編碼法跟其它同類方案相比較,其特點(diǎn)是有一套符合語言文字學(xué)、文獻(xiàn)檢索學(xué)、計(jì)算機(jī)科學(xué)的編碼理論作指導(dǎo),在最佳信息鍵 N=32時(shí),出現(xiàn)重碼率<0.1%,易盲打;以字為主時(shí)每字通常擊三次鍵,能直接形成最短的漢字代碼(16位),而詞須加擊一詞匯鍵;在以詞為主時(shí)則反之;使用頻度高的標(biāo)點(diǎn)符號(hào)及漢字只擊二次鍵;將一百廿來個(gè)字素均勻地置于31鍵上,另一鍵供詞匯或字、少數(shù)民族文字、外文字、科技符號(hào)及其它符號(hào)使用;編碼規(guī)則簡(jiǎn)明嚴(yán)謹(jǐn)而完備,不用聯(lián)想;兼容性好,擴(kuò)充性強(qiáng),已考慮了二萬二千個(gè)漢字的編碼;其編碼表適用于繁、簡(jiǎn)體和日本漢字;為機(jī)器識(shí)別漢字創(chuàng)造了條件;其代碼蘊(yùn)含了大量構(gòu)字信息,使得能產(chǎn)生出尺寸最小的漢字發(fā)生器。采用字詞方式進(jìn)行編碼,便于學(xué)習(xí)和提高鍵入速率。它可用于計(jì)算機(jī)、具有圖形功能的終端、打印機(jī)、繪圖儀及電子式打字機(jī)、通訊系統(tǒng)、辦公室自動(dòng)化和印刷自動(dòng)化中。
申請(qǐng)?zhí)? 86104174 申請(qǐng)日 1986年6月28日發(fā)明創(chuàng)造名稱 嵌套字素編碼法及其輸入鍵盤
權(quán)利要求
1.嵌套字素編碼法及其輸入鍵盤,其特征是采用嵌套字素編碼表進(jìn)行編碼。它以字素為編碼單位,在以字為主時(shí),按編碼規(guī)則“首→中→尾”的順序?qū)ψ诌M(jìn)行編碼,能直接形成16bit漢字代碼,并按“X1首→X中→詞匯鍵→X尾”規(guī)則對(duì)詞匯進(jìn)行編碼;在以詞為主時(shí)則反之。整個(gè)輸入鍵盤上字素安排以減小重碼率為基準(zhǔn),而字素的鍵位安排按使用頻度高低進(jìn)行,中央鍵位安放高頻字素。
2.按照權(quán)利要求
1.的嵌套字素編碼法,其特征是字素是嵌套的,有近30個(gè)異于辭書上偏旁部首的字素,將一百廿來個(gè)字素均勻地分配在31個(gè)信息鍵上;每鍵安排有四個(gè)字素,另一個(gè)鍵為詞匯或字、少數(shù)民族文字、外文字、科技符號(hào)及其它符號(hào)設(shè)置的。
3.按照權(quán)利要求
1.的嵌套字素編碼表,其特征是繁、簡(jiǎn)體及日本漢字共用,且該表可通過任何技術(shù)措施表示在鍵盤上,可看鍵打字。
4.按照權(quán)利要求
1.的嵌套字素編碼法,其特征是利用它可得到一種準(zhǔn)確而快速的漢字檢字法。
5.按照權(quán)利要求
1.的嵌套字素編碼法的編碼規(guī)則,其特征是每字通常擊三次鍵,而詞加擊一詞匯鍵;或每詞擊三次鍵而字加擊一字鍵。“首”是嚴(yán)格地按書寫漢字起筆開始的筆劃最多的字素;“尾”是包含書寫漢字末筆在內(nèi)的筆劃最多的字素;“中”是按塊、層、片首優(yōu)先順序選取的字素。
6.按照權(quán)利要求
1.的嵌套字素編碼法的編碼規(guī)則,其特征是占漢字使用頻度五分之一的標(biāo)點(diǎn)符號(hào)及漢字各只擊二次鍵。
7.按照權(quán)利要求
1.的嵌套字素編碼法,其特征是編碼規(guī)則中使用了位置鍵代碼和嵌套鍵及“層”鍵代碼,且同一鍵上字素位置是固定的。
專利摘要
本發(fā)明屬于中文信息科學(xué)領(lǐng)域。其特征是采用嵌套字素編碼,將一百二十來個(gè)字素均勻地置于輸入鍵盤的31個(gè)鍵上。以字詞或詞字方式按“首→中→尾”規(guī)則對(duì)漢字編碼,能直接形成16bit漢字代碼;最常用標(biāo)點(diǎn)和漢字(共31個(gè))只擊二次鍵(空格鍵在內(nèi)),出現(xiàn)重碼率<0.1%,易看鍵打字或盲打。字素安排以減少重碼率為基準(zhǔn),字素使用頻度高低決定了它在鍵盤上的位置。它可用在計(jì)算機(jī)、有圖形功能的終端、打印機(jī)、繪圖儀及電子式打字機(jī)中。
文檔編號(hào)G06F3/023GK86104174SQ86104174
公開日1988年1月13日 申請(qǐng)日期1986年6月28日
發(fā)明者蕭忠義, 余錦鳳 申請(qǐng)人:余錦鳳, 蕭忠義導(dǎo)出引文BiBTeX, EndNote, RefMan