專利名稱:漢字輸入碼的編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及漢字信息處理系統(tǒng),特別是漢字輸入碼的編碼方法。
現(xiàn)有的漢字輸入碼如王永民發(fā)明的《五筆字型碼》須經(jīng)專門的訓(xùn)練才能掌握使用而且須經(jīng)常操作才能保持技能。對于不經(jīng)常操作的非專業(yè)人員來說,使用該碼有困難。其他輸入性能好(操作方便、輸入速度快、重碼少、可以盲打)的漢字輸入碼也都有非專業(yè)操作人員不易掌握的缺憾?,F(xiàn)今計算機的使用在各個領(lǐng)域迅速普及,需要使用漢字輸入碼的人日益增多,單純依靠少數(shù)專業(yè)人員進行操作已遠遠不能滿足需要。因此要求漢字輸入碼不僅要輸入性能好而且要易于掌握(不須專門訓(xùn)練)、易于普及(普通人都能掌握)。但是現(xiàn)有的漢字輸入碼還不能圓滿地滿足這樣的需求。有些漢字輸入碼容易學(xué)會、便于普及,但輸入性能欠佳,例如音數(shù)碼只要有漢語拼音知識即可學(xué)會使用,但重碼多,輸入速度慢。
本發(fā)明的目的在于提供一種不但輸入性能好(操作方便、輸入速度快、重碼少、可以盲打)而且容易學(xué)會(不須專門訓(xùn)練、只要閱讀使用說明書即可自己學(xué)會使用)、容易普及(一般人都容易學(xué)會使用)的漢字輸入碼的編碼法。
本發(fā)明的目的可以通過以下措施達到(1)限定將漢字分解成3個以下的構(gòu)件而且每個構(gòu)件必須仍是漢字或部首。(2)按逆序取碼法則取每一構(gòu)件中若干筆畫為該構(gòu)件字形特征(注逆序取碼法則定義為將漢字筆畫歸納處理后大體上按筆畫在漢字中出現(xiàn)的頻率、由低到高依次排列,規(guī)定取同一構(gòu)件中筆畫表示該構(gòu)件的字形特征時必須按上述原則排定的次序依次優(yōu)先采取,因為上述筆畫排列次序大體上恰與現(xiàn)代漢語教科書中漢字筆畫名稱表所列筆畫次序相反,故命名為逆序取碼法則),取每個構(gòu)件的讀音的第1個字母為該構(gòu)件的語音特征,(3)規(guī)定1個字形特征稱為1個字形碼并與鍵盤上1個指定的鍵對應(yīng),1個語音特征稱為1個語音碼并與鍵盤上1個指定的鍵對應(yīng),字形碼與語音碼應(yīng)對應(yīng)不同的鍵,2至6個字形碼和語音碼混合編成1組輸入碼,可以代表1個漢字或1個詞、1個詞組,1組輸入碼內(nèi)字形碼的次序應(yīng)按其所在構(gòu)件的次序排列(構(gòu)件的次序按書寫順序排列),同一構(gòu)件中兩個以上的字形碼的次序按前文所述逆序取碼法則排列,同樣地1組輸入碼內(nèi)語音碼的次序亦應(yīng)按其所在構(gòu)件的次序排列,但是一組輸入碼中語音碼和字形碼的數(shù)目允許有多種不同的組成,并且語音碼與字形碼的序位也允許有多種不同的排列,(4)具有相同數(shù)目的語音碼和字形碼并且語音碼(或字形碼)的序位相同的輸入碼的集合定義為1個層,不同類型的漢字集(如字與詞)應(yīng)歸納到不同的層中。層這一概念是本發(fā)明首次提出的。使用它,不但可以將容納空間擴大許多倍而且可以將不同的漢字集比較有秩序地控制在不同的層中。其用途是多方面的可以有效地降低重碼率、可以容納規(guī)范碼和非規(guī)范碼(見下文),輸入字和詞間打時不必切換等。
前文已規(guī)定每個構(gòu)件必須仍是漢字或部首并規(guī)定取構(gòu)件讀音的第1個字母為該構(gòu)件的語音特征。若構(gòu)件是現(xiàn)代漢字,其讀音自然以國家語委頒布的標(biāo)準(zhǔn)讀音為準(zhǔn)。但若構(gòu)件是部首,情形便有所不同,因為有一部分部首在現(xiàn)代漢語中是只有名稱而無讀音的,故補充規(guī)定可以參照現(xiàn)代漢語中部首的名稱給部首以指定的讀音。
規(guī)定指定部首讀音應(yīng)參照部首名稱是因為大多數(shù)部首名稱是人們熟知的,以便于記憶。但是有少數(shù)部首的名稱是不為人熟知的(如厶、彡、髟)為便于記憶再補充規(guī)定可以將這類部首的讀音一概指定為(O)。
鑒于有許多人讀音不準(zhǔn)確,為使用方便起見,補充規(guī)定語音碼F與H兼容(意即按F鍵與按H鍵等效)、L與N兼容(意即按L鍵與按N鍵等效)。
本發(fā)明的漢字輸入碼包括規(guī)范碼和非規(guī)范碼,規(guī)范碼的編制不但應(yīng)遵守前述全部編碼規(guī)定而且還應(yīng)遵守一些附加規(guī)定如a、筆畫部首不作為構(gòu)件,b、凡能夠分解成3構(gòu)件的漢字均應(yīng)分解成3構(gòu)件處理,其輸入碼歸屬于相應(yīng)的指定的層中,凡不能分解成3構(gòu)件而能分解成2構(gòu)件的漢字均應(yīng)分解成2構(gòu)件處理,其輸入碼歸屬于相應(yīng)的指定的層中,凡不能分解的漢字均按單構(gòu)件字處理,其輸入碼歸屬于相應(yīng)的指定的層中,c、構(gòu)件的筆畫按國家語委頒布的標(biāo)準(zhǔn)正字表為準(zhǔn)。非規(guī)范碼定義為不完全遵守附加的規(guī)定(如前述a、b、c項規(guī)定)的漢字輸入碼。
規(guī)范碼和非規(guī)范碼的概念也是本發(fā)明首次提出的,其意義是什么呢?實際上以往的漢字輸入碼都是規(guī)范碼,因為它們都是按一定的規(guī)范編制的。如果不符合規(guī)范就是錯誤的。只有非規(guī)范碼才是本發(fā)明獨具的。為什么要有非規(guī)范碼呢?因為即使最基本的語文知識人們也往往沒有完全正確掌握,或者由于操作者習(xí)慣或疏忽編錯碼,這是常見的情形。本發(fā)明引入了數(shù)倍于規(guī)范碼的非規(guī)范碼,將操作者容易出現(xiàn)的錯誤盡可能包容在內(nèi)。這樣,即使操作者編碼不完全規(guī)范,只要在非規(guī)范碼的范圍內(nèi),仍可輸入,只是重碼率略高一點。
為了引入非規(guī)范碼而不增加規(guī)范碼的重碼率,補充規(guī)定如果非規(guī)范碼與規(guī)范碼出現(xiàn)重碼則保留規(guī)范碼,取消非規(guī)范碼。
本發(fā)明的漢字輸入碼可以適用于標(biāo)準(zhǔn)英文小鍵盤,也可以使用專門設(shè)計的鍵盤。語音碼的鍵名與英文鍵盤上相應(yīng)的英文字母鍵同名,字形碼鍵名以經(jīng)歸納處理后的筆劃命名并在鍵盤上依前述規(guī)定次序排列。
本發(fā)明具有以下優(yōu)點(1)容易學(xué)會、易于普及。容易學(xué)會的意思是指操作者只要具有小學(xué)畢業(yè)的文化水平,不須專門訓(xùn)練只要閱讀使用說明書即可自行學(xué)會使用。由于本發(fā)明的編碼方法所涉及到的構(gòu)件、語音特征、字形特征均來自漢字和漢語拼音的基礎(chǔ)知識,雖有一些人為的規(guī)定但所規(guī)定的內(nèi)容均順應(yīng)人們所熟知的語文知識,自然容易記得;規(guī)定以構(gòu)件讀音的第1個字母為構(gòu)件的語音特征并規(guī)定語音碼F與H、L與N兼容所以并不要求操作者漢語拼音正確無誤而只要求具有漢語拼音的基本知識;編碼規(guī)則簡單明了;引入大量非規(guī)范碼,即使操作者編碼不完全規(guī)范也能輸入。綜上所述可知本發(fā)明的編碼法不但規(guī)則簡明而且所須記憶的內(nèi)容很少,主要是筆畫的排列次序而這已按規(guī)定標(biāo)明在鍵上了(實際上是提示)所以操作者只要讀了使用說明書就可以明了編碼方法,進行操作了。
因為容易學(xué)會而且對操作者文化水平要求不高自然容易普及。此外,本發(fā)明的漢字輸入可以在現(xiàn)在普遍使用的標(biāo)準(zhǔn)英文小鍵盤上進行,也有利于本發(fā)明的普及推廣。特別應(yīng)提到的是由于本發(fā)明的內(nèi)容與小學(xué)語文教學(xué)可以相容,所以本發(fā)明的普及推廣工作可以容納到小學(xué)語文教學(xué)中。這一特點如付之實施,將對我國計算機使用普及推廣起到不可估量的作用。
(2)輸入性能好。指操作方便、輸入速度快、重碼少、可以盲打,茲分別說明之由前文所述可知本發(fā)明的漢字輸入碼不僅容易學(xué)會而且輸入方便。需要補充的是由于本發(fā)明使用了分層輸入,所以在字、詞、詞組間打時不必切換,十分方便。至于重碼少特別是在如此容易學(xué)會而又對操作者輸入操作要求如此寬松的條件之下仍能做到重碼率很低的根源存在于本發(fā)明的深層構(gòu)思之中。首先本發(fā)明的漢字輸入碼從形式上看是音、形結(jié)合碼但實質(zhì)上包涵了漢字、漢語語音全面的信息(字形、讀音、書寫順序、筆畫、筆畫順序[逆序])而且巧妙自然地利用了這些信息。唯其包涵信息多故而重碼率低,唯其順乎自然故而操作者需要掌握的基本上是小學(xué)已學(xué)會的知識,所以易學(xué)易用。特別是創(chuàng)造了逆序取碼法則優(yōu)先采取在漢字中出現(xiàn)頻率較低的筆畫為構(gòu)件的字形特征,排他性極強而且按此法則即使取在漢字中出現(xiàn)頻率較高的筆畫為構(gòu)件的字形特征時也說明該構(gòu)件中不存在出現(xiàn)頻率較低的筆畫,排他性同樣很強。以上是重碼率低的首要原因,其次由于本發(fā)明提出并使用了層的概念,使容納空間擴大了許多倍,并進一步將漢字較有秩序地歸納入不同的層中也有效地降低了重碼率。因重碼率低故可以盲打。輸入速度也許是衡量輸入性能優(yōu)劣最重要的指標(biāo),因為它直接反映了輸入性能的一個主要方面。但實際的輸入速度并不完全取決于輸入每字的擊鍵次數(shù),操作不方便、編碼易失誤,重碼率高都在相當(dāng)大的程度上影響實際的輸入速度。本發(fā)明的漢字輸入法輸入每字的擊鍵次數(shù)可以與現(xiàn)今實際應(yīng)用較廣的《五筆字型碼》相同即輸入每字擊鍵4次。而且前文已說明本發(fā)明的漢字輸入法操作方便、容許編碼不完全規(guī)范、重碼率低,可以盲打,因此本發(fā)明的實際輸入速度是較快的。特別要指出的是鑒于漢文中有很多詞和詞組,所以在實際應(yīng)用中字、詞、詞組間打?qū)⒋蟠蠹涌燧斎胨俣榷景l(fā)明的特點之一就是進行上述間打時不必切換,這將十分有利于加快輸入速度。
(3)由于本發(fā)明的漢字輸入碼容納空間大并實行分層歸納,可以容納眾多的字、詞、詞組包括繁體字、異體字。
附表的說明如下表1是《筆畫次序表》。
表2是《漢字部首讀音、語音碼表》。
表3是《輸入碼中語音碼和字形碼序位表》。
本發(fā)明將結(jié)合實施例做進一步詳述。
本文所述之若干編碼的規(guī)定可具體化如下(1)將漢字筆畫歸納處理并按逆序取碼法則,指定次序如表1。
(2)參照漢字部首名稱規(guī)定部首讀音如表2(名稱不為人熟知者規(guī)定為<O>)。
(3)規(guī)定3構(gòu)件字、2構(gòu)件字、單構(gòu)件字及雙音詞、3音詞、多音詞輸入碼的語音碼和字形碼的序位如表3。
作了上述具體化規(guī)定之后,并按本發(fā)明編碼法之其他規(guī)定即可對字、詞編碼。
例字1椅。
可分解為3構(gòu)件木、大、可。
由表3,3構(gòu)件字輸入碼的語音碼和字形碼的序位為音1形1音2音3按表1 形1為丿按表2 音1為M 音2為D 音3為K輸入碼為M丿DK如操作者出于習(xí)慣或疏忽將椅字分解成2構(gòu)件木、奇。
由表3,2構(gòu)件字輸入碼的語音碼和字形碼的序位為音1形1音2形2按表1、表2輸入碼為 M丿Q亅但因為分解時將本來可以分解成3構(gòu)件的字分解成2構(gòu)件處理不完全符合編碼規(guī)定故所編的輸入碼為非規(guī)范碼。
例字2好。
分解為2構(gòu)件女、子。
按表3,2構(gòu)件字輸入碼的語音碼和字形碼的序位為音1形1音2形2按表1、表2輸入碼為
NㄑZ亅因為前文已規(guī)定N與L兼容故輸入碼也可編為LㄑZ亅例字3其。
屬單構(gòu)件字,按表3單構(gòu)件字輸入碼的語音碼和字形碼的序位為全字音形1形2形3按表1、表2輸入碼為Q丷丨丨例4(雙音詞)南京按表3,雙音詞輸入碼的語音碼和字形碼的序位為形1音1形2音2按表1、表2輸入碼為N亅G例5(3音詞)拖拉機按表3,3音詞輸入碼的語音碼和字形碼的序位為音1音2音3空格鍵(代碼為凵)按表1、表2輸入碼為TLJ凵例6(多音詞)中華人民共和國按表3多音詞輸入碼的語音碼和字形碼的序位為音1音2音3音末按表1、表2輸入碼為ZHRG
權(quán)利要求
1.一種漢字輸入碼的音形混合編碼法,其特征是(1)限定將漢字分解為3個以下構(gòu)件而且每個構(gòu)件都必須仍是漢字或部首,(2)按逆序取碼法則取每一構(gòu)件中若干筆畫為該構(gòu)件的字形特征(注逆序取碼法則定義為將漢字筆畫歸納處理后大體上按筆畫在漢字中出現(xiàn)的頻率、由低到高依次排列,規(guī)定取同一構(gòu)件中筆畫表示該構(gòu)件的字型特征時必須按上述排定的次序依次優(yōu)先采取),取每個構(gòu)件讀音的第1個字母為該構(gòu)件的語音特征,(3)規(guī)定1個字形特征稱為1個字形碼并與鍵盤上1個指定的鍵對應(yīng)、1個語音特征稱為1個語音碼并與鍵盤上1個指定的鍵對應(yīng),字形碼與語音碼使用不同的鍵,2至6個字形碼和語音碼混合編成一組輸入碼可以代表1個漢字或1個詞或1個詞組,一組輸入碼內(nèi)字形碼的次序應(yīng)按其所在構(gòu)件的次序排列(構(gòu)件的次序按書寫順序排列),同一構(gòu)件中兩個以上字形碼的次序則按前述逆序取碼法則排列,同樣地語音碼的次序亦應(yīng)按其所在構(gòu)件的次序排列,但是一組輸入碼中語音碼與字形碼的數(shù)目允許有多種不同的組成,并且語音碼與字形碼的序位也允許有多種不同排列,(4)具有相同數(shù)目語音碼和字形碼并且語音碼(或字形碼)的序位相同的輸入碼的集合定義為層,不同類型的漢字集<如字與詞>應(yīng)歸納到不同的層中。
2.按權(quán)利要求1所述的漢字輸入碼的音形混合編碼法,其特征是漢字的構(gòu)件為部首時其讀音應(yīng)參照現(xiàn)代漢語中部首的名稱給予指定的讀音。
3.按權(quán)利要求2所述的漢字輸入碼的音形混合編碼法,其特征是在指定部首的讀音時對于一些名稱不為人所熟知的部首(如厶、彡、髟)可以一概指定讀<0>。
4.按權(quán)利要求1所述的漢字輸入碼的音形混合編碼法,其特征是語音碼F與H兼容(按F鍵與按H鍵等效)、L與N兼容(按L鍵與按N鍵等效)。
5.按權(quán)利要求1、2、3、4所述的漢字輸入碼的音形混合編碼法,其特征是輸入碼包括規(guī)范碼和非規(guī)范碼,規(guī)范碼的定義是不但符合前述編碼規(guī)定而且還須符合一些附加的規(guī)定如a、筆畫部首不作為構(gòu)件,b、凡能夠分解成3構(gòu)件的漢字均應(yīng)分解成3構(gòu)件進行處理,其輸入碼歸屬于相應(yīng)的指定的層中,凡不能分解成3構(gòu)件而能夠分解成2構(gòu)件的漢字均應(yīng)分解成2構(gòu)件進行處理,其輸入碼歸屬于相應(yīng)的指定的層中,凡不能分解的漢字均按單構(gòu)件字進行處理,其輸入碼亦歸屬于相應(yīng)的指定的層中,c、構(gòu)件的筆畫按國家語委頒布的標(biāo)準(zhǔn)正字表為準(zhǔn),非規(guī)范碼定義為不完全符合上述a、b、c項附加規(guī)定的輸入碼。
6.按權(quán)利要求5所述的漢字輸入碼的音形混合編碼法,其特征是當(dāng)規(guī)范碼與非規(guī)范碼出現(xiàn)重碼時,保留規(guī)范碼,非規(guī)范碼失效。
全文摘要
本發(fā)明提供了一種漢字輸入碼的編碼方法,其特征是通過按特定的規(guī)范對漢字分解構(gòu)件、取特征、編碼等方法將漢字固有的各種信息(字形、讀音、書寫順序、筆畫、筆畫排列次序)集中反映在音形混合輸入碼中。編碼方法涉及到的知識基本上都是小學(xué)語文教學(xué)中已有的內(nèi)容。本發(fā)明兼有輸入性能好(操作方便、輸入快、重碼少、可以盲打)和容易學(xué)會、易于普及兩方面的優(yōu)點。適于專業(yè)操作人員及非專業(yè)操作人員通用。
文檔編號G06F3/023GK1105463SQ9411183
公開日1995年7月19日 申請日期1994年7月15日 優(yōu)先權(quán)日1994年7月15日
發(fā)明者鄧仁 申請人:鄧仁