專利名稱:計(jì)算機(jī)音形漢字輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種計(jì)算機(jī)漢字輸入法。尤其與根據(jù)漢字構(gòu)件的音和形編碼輸入計(jì)算機(jī)的方法有關(guān)。
已有的計(jì)算機(jī)音形漢字輸入法,將漢字拆分成構(gòu)件單元,構(gòu)件可以是漢字或部首,一個(gè)漢字的構(gòu)件數(shù)目為3個(gè)以下(包括3個(gè))。由于漢字的構(gòu)成有既不是漢字,又不是部首的獨(dú)立完整部分,有的漢字難于拆分。
取碼規(guī)則是將漢字筆畫制成《筆畫次序表》,共有18種筆畫。筆畫的種類較多。
將漢字構(gòu)件取其讀音的第一個(gè)字母為該構(gòu)件的語音碼元,而部首構(gòu)件有讀音的則取其讀音的第1個(gè)字母為該構(gòu)件的語音碼元,有名稱無讀音的參照其名稱給其指定語音碼元,對于少部分名稱不為人熟知的部首則規(guī)定其語音碼元為特定同一字母。這樣制成的《漢字部首讀音、語音碼表》結(jié)構(gòu)復(fù)雜,碼元太多,記憶和使用較難。
編碼規(guī)則是漢字和詞編成四碼輸入。單構(gòu)件漢字的編碼依次為字的音碼,字的第一形碼,字的第二形碼,字的第三形碼,二構(gòu)件漢字的編碼依次為第一構(gòu)件的音碼,第一構(gòu)件的形碼,第二構(gòu)件的音碼,第二構(gòu)件的形碼。三構(gòu)件漢字的編碼依次為第一構(gòu)件的音碼,第一構(gòu)件的形碼,第二構(gòu)件的音碼,第三構(gòu)件的音碼。由于編碼數(shù)量較少,容易出現(xiàn)重碼。
本發(fā)明的目的是提供一種符合漢字造字規(guī)律,符合中國人使用漢字的習(xí)慣,方法簡單,便于普及,使用方便,而重碼少的計(jì)算機(jī)音形漢字輸入法。
本發(fā)明是這樣實(shí)現(xiàn)的本發(fā)明以漢語拼音的首字母(音碼)和漢字的筆畫(形碼),為基本單元,每一個(gè)基本單元被賦予一個(gè)輸入鍵,每個(gè)漢字可由三至五個(gè)代表首字母和筆畫的輸入鍵串組成,其方法如下a.將漢字按形拆分成構(gòu)件單元,其方法如下①構(gòu)件基本單元必須是漢字或部首或不定構(gòu)件(即不是漢字或部首的漢字中的一個(gè)獨(dú)立、完整的組成部分),一個(gè)字只允許取一個(gè)不定構(gòu)件,此外,凡一個(gè)字可以取現(xiàn)代漢字或部首為第一構(gòu)件和第三構(gòu)件者,其中間部份可作為一個(gè)不定構(gòu)件處理,②一個(gè)漢字只能完整地分成二個(gè)或三個(gè)構(gòu)件單元,漢字拆分后不能有多余的筆化,構(gòu)件之間筆畫不能交叉或共用一筆,也可以不拆分,為單構(gòu)件字。
③一個(gè)漢字的構(gòu)件拆分順序如下能否拆成不含不定構(gòu)件的三構(gòu)件字,否,則能否拆成不含不定構(gòu)件的二構(gòu)件字,否,則能否拆成含不定構(gòu)件的三構(gòu)件字或含不定構(gòu)件的二構(gòu)件字,否,則為單構(gòu)件字。
④按字的書寫順序分第一構(gòu)件、第二構(gòu)件,第三構(gòu)件,以每個(gè)構(gòu)件末筆為準(zhǔn)排列書寫順序。
b.取碼規(guī)則一、音碼規(guī)則①凡構(gòu)件是漢字或與現(xiàn)代漢字同形的部首者,取其讀音的首字母為該構(gòu)件的音碼。
②凡構(gòu)件是不與現(xiàn)代漢字同形的部首者,選取其中一部分常用部首,給定讀音首字母,作為該構(gòu)件的音碼。
③凡②中未選取的不與漢字同形的部首,則一律以同一拼音字母作為該構(gòu)件的音碼。
④不定構(gòu)件以待輸入漢字讀音的首字母為其音碼,二、形碼規(guī)則將漢字的筆畫按在漢字中出現(xiàn)的頻率不同,由低到高整理,歸納成筆畫序表。
構(gòu)件所有的筆畫中,其在筆畫序中列為最前者為該構(gòu)件的第一形碼,列于次前者為該構(gòu)件的第二形碼,依此類推,按此規(guī)則歸納的筆畫序表中筆畫的排列次序與漢語教科書中筆畫的排列次序恰相反所以這一規(guī)則又稱為逆序取碼法,c.編碼規(guī)則
一、單個(gè)漢字三至五碼鍵入。
①三構(gòu)件字編碼依次為第一構(gòu)件音碼,第一構(gòu)件的第一形碼,第二構(gòu)件音碼、第三構(gòu)件音碼、第二、三構(gòu)件的所有筆畫中在筆畫序表中列于最前者代表的形碼。
②二構(gòu)件字編碼依次為第一構(gòu)件音碼,第一構(gòu)件第一形碼,第二構(gòu)件音碼,第二構(gòu)件第一形碼,第二構(gòu)件第二形碼。
③單構(gòu)件字編碼依次為字的音碼、字的第一形碼、字的第二形碼,字的第三形碼,字的第四形碼,④如果一個(gè)字不足五碼則輸入該字的碼后,按一次空格鍵即表示該字輸入已完成。
⑤如果一個(gè)字雖有五碼但不需五碼即可確定,則可以輸入五碼也可以在輸入確定該字的碼后按一次空格鍵,完成輸入。
二、一字可對應(yīng)多組編碼鍵入,有利于同形不同讀音字的輸入,個(gè)別有兩種拆分形式的字的輸入,以及不同文化水平的使用者編碼可能有所不同的字的輸入,三、詞的輸入,以四碼或五碼鍵入,①二字詞的編碼依次為第一字的音碼,第二字的音碼,第一字的第一構(gòu)件音碼,(單構(gòu)件字用該字音碼)第二字的第一構(gòu)件音碼(單構(gòu)件字用該字音碼),空格鍵。
②三字詞的編碼依次為第一字音碼,第二字音碼,第三字音碼,空格鍵。
③多字詞的編碼依次為第一字音碼,第二字音碼,第三字音碼,最后一字音碼,N鍵。
本發(fā)明利用計(jì)算機(jī)英文鍵盤的鍵分別與音碼和形碼相對應(yīng)。
本發(fā)明的筆畫序表如下
本發(fā)明選取的不與漢字同形的部首給定讀音首字母如下表所示
凡上表中未注明的非現(xiàn)代漢字部首一律以字母O表示。本發(fā)明中計(jì)算機(jī)英文鍵盤的鍵位與對應(yīng)的首字母和筆畫的關(guān)系如下表
本發(fā)明規(guī)定如果構(gòu)件是九年制義務(wù)教育語文課本中未有的漢字,可以以字母a代替該構(gòu)件讀音的首字母編碼。
本發(fā)明的優(yōu)點(diǎn)如下所述(一)極易學(xué)會(huì)使用而且重碼率極低。這是由于(1)碼元極少而且是一般用戶所熟悉的漢字讀音和字形最基本的特征——首字母和筆畫。
(2)編碼基于最廣大的構(gòu)件基礎(chǔ)上卻完全不必記住構(gòu)件。構(gòu)件的認(rèn)定也很簡單明確,只要是現(xiàn)代漢字或部首就可以作為構(gòu)件。非限定構(gòu)件認(rèn)定是漢字(取構(gòu)件信息)編碼中一個(gè)難題,這一問題近于完善的解決得力于字的拆分規(guī)則和“不定構(gòu)件”的運(yùn)用。特別是“不定構(gòu)件”是本發(fā)明的一個(gè)有價(jià)值的創(chuàng)造。規(guī)定“不定構(gòu)件”所在漢字的讀音的首字母為“不定構(gòu)件”的音碼既方便用戶使用又有效地減少重碼。
(3)部首是組成漢字的常用的構(gòu)件。非字部首的讀音至今未有統(tǒng)一規(guī)范,一些部首讀音為許多人不熟悉。本發(fā)明只規(guī)定了一些最常見的非字部首如《氵》《扌》《亻》《》等的讀音。而且所規(guī)定的讀音是與這些部首的通俗名稱是一致的,如《氵》讀《shuǐ》《扌》讀shǒu《亻》讀《rèn》《》讀《zh ú》等,其余的非字部首的音碼一律規(guī)定為《0》使用戶學(xué)習(xí)和使用都不感到困難。
(4)使用筆畫作為碼元比使用字根作為碼元容易學(xué)習(xí)掌握。但眾所周知使用筆畫作碼元異化重碼能力低。提高筆畫作為碼元的異化重碼能力得力于本發(fā)明另一個(gè)有價(jià)值的創(chuàng)造——筆畫序表。它直接提取構(gòu)件中最有代表性筆畫作為形碼,有效地提高了異化重碼能力。
(二)普及面廣而且初中以上文化水平的用戶都能夠使用它不困難地輸入國家標(biāo)準(zhǔn)GB2312-80所規(guī)定的6763個(gè)漢字。這是由于(1)使用本發(fā)明所涉及的語文的知識包括漢語拼音首字母、漢字筆畫、常用漢字、部首都是有初等語文知識的用戶已熟悉知的。
(2)漢語拼音首字母f與h、l與n、c與ch、s與sh、z與zh兼容充分考慮了部分用戶地方口音及讀音不準(zhǔn)的語音缺憾。
(3)超過初中語文教本的漢字允許以《a》為音碼充分照顧到部分用戶的知識水平。
(4)一字對應(yīng)多組編碼充分兼顧了不同語文知識層次的用戶編碼可能產(chǎn)生的差異。如《?!纷直緫?yīng)是不含“不定構(gòu)件”的二構(gòu)件字。有的用戶不知《戔》是一個(gè)字,按“不定構(gòu)件”處理。以《?!纷忠舸a《Z》作為《戔》的音碼,仍可編碼輸入。如果用戶連《?!纷忠膊徽J(rèn)識可以《a》為《?!返囊舸a也可編碼輸入。
(三)規(guī)范性好(1)編碼方法符合漢字造字規(guī)律,符合中國人使用漢字的習(xí)慣,沒有生造的構(gòu)件。
(2)所涉及的字集、漢語拼音字母、漢字筆畫、部首都符合國家標(biāo)準(zhǔn)或國家語委的推薦使用標(biāo)準(zhǔn)。其中漢語拼音首字母、漢字筆畫、部首讀音都符合語文教本或語文教學(xué)參考材料。
如下是本發(fā)明的附圖
圖1為本發(fā)明的筆畫序表。
圖2為本發(fā)明的常用非漢字部首讀音首字母表。
圖3為本發(fā)明的計(jì)算機(jī)英文鍵盤的鍵名與筆畫序表中的筆劃和首字母對應(yīng)表。
如下是
具體實(shí)施例方式筆畫序表如圖1所示。
常用非漢字部首讀音首字母表如圖2所示。
計(jì)算機(jī)的鍵盤英文鍵名與筆畫和首字母的對應(yīng)表如圖3所示表2中的首字母21個(gè),表1中的筆畫16個(gè),共37個(gè)碼元,一碼元對應(yīng)一個(gè)鍵共用37個(gè)鍵。
(1)不含“不定構(gòu)件”的三構(gòu)件字輸入例字“碧”拆分為“王”“白”“石”,均為漢字構(gòu)件。音碼為其讀音首字母。形碼按圖(1)。
編碼W1bS對應(yīng)計(jì)算機(jī)鍵名串WHBS0(2)不含“不定構(gòu)件”的二構(gòu)件字輸入例字“杉”拆分為
“彡”,其中
為與漢字“木”同形的部首,下表是圖4的書寫單元圖與圖1鍵盤圖之間的鍵和筆劃的對應(yīng)關(guān)系。g-橫橫11,f-橫豎12,d-橫撇13,s-橫點(diǎn)14,a-橫折15;h-豎橫21,j-豎豎22,k-豎撇23,l-豎點(diǎn)24,m-豎折25;t-撇橫31,r-撇豎32,e-撇撇33,w-撇點(diǎn)34,q-撇折35;y-點(diǎn)橫41,u-點(diǎn)豎42,i-點(diǎn)撇43,o-點(diǎn)點(diǎn)44,p-點(diǎn)折45;n-折橫51,b-折豎52,v-折撇53,c-折點(diǎn)54,x-折折55。沿用當(dāng)前的習(xí)慣,以上的各鍵設(shè)定在小寫狀態(tài)時(shí)才是漢字輸入狀態(tài)。除了好記憶的原則之外,還有使用頻率的原則,將使用頻率高的書寫單元放在容易擊鍵的位置。如果簡單地按照筆劃順序敲書寫鍵,重碼必定會(huì)很多,有的漢字變旁已經(jīng)超過八劃,所以減少重碼的關(guān)鍵是合理地安排每一次書寫鍵。本漢字輸入編碼采用了優(yōu)先權(quán)規(guī)則。書寫鍵不是簡單地按書寫順序鍵入,而是將漢字分為“字塊”,按照大塊、小塊(孤小塊和連小塊)、補(bǔ)鍵三個(gè)層次設(shè)定每次輸入鍵的優(yōu)先權(quán)。孤小塊是與周圍的筆劃完全分離的小塊,如“磔”字右大塊中的三小塊,連小塊是與周圍筆劃有相連之處的小塊,如“磔”字石旁的“口”;減少重碼的另一條措施是將某些高頻部首如(口、木、扌、艸、钅)等單獨(dú)設(shè)特定鍵。設(shè)定優(yōu)先權(quán)和特定鍵的規(guī)定可以根據(jù)編碼者的想法變化,所以優(yōu)先權(quán)和特定鍵的規(guī)定可以有很多種。除了筆序碼的編碼方法外,可以在“一鍵等于書寫兩筆”的方法基礎(chǔ)上建立許多編碼法,無法窮舉。</claim><claim>2、根據(jù)權(quán)利要求1所述的漢字輸入編碼法,其進(jìn)一步的特征是“筆序碼”的編碼方法,在“一鍵等于書寫兩筆”的方法基礎(chǔ)上,筆序碼的優(yōu)先規(guī)則為大小、孤連、遠(yuǎn)近。優(yōu)先權(quán)層次為大塊、孤小塊、連小塊、補(bǔ)筆,層次相同判遠(yuǎn)近。第一個(gè)層次是按書寫順序每大塊書寫一鍵,書寫每大塊的頭兩筆(某些情況下一鍵只表示一筆,如用與“11”對應(yīng)的鍵書寫“西、酉、甫”等字塊的筆劃“一”)。對于大塊的規(guī)定是“寬字豎對齊,長字橫對齊”。如寬字“微”根據(jù)豎對齊的規(guī)則,可以分為左中右三個(gè)大塊,“微”字中的“
”作大塊處理;長字“蔡”可分為上中下三個(gè)大塊,
作大塊處理。第二個(gè)層次是書寫小塊,采用“先孤后連”和“就近”的原則,先孤后連的定義是孤小塊優(yōu)先于連小塊,如“磔”字的右大塊中的(木、夕、
)<p>編碼T丨丨對應(yīng)計(jì)算機(jī)鍵名串T00HH(6)一字五碼以下輸入例字“一”因?yàn)樵撟种挥袃纱a,所以后加按空格鍵“ㄩ”表示該字輸入完成。
編碼Y—對應(yīng)計(jì)算機(jī)鍵名串YVㄩ(ㄩ——空格鍵,下同)例字鑫編碼j丷JJ丷對應(yīng)計(jì)算機(jī)鍵名串J一JJ—因?yàn)檩斎肭叭aJ-J之后,提示行已提示該字已被唯一地確定,所以可以繼續(xù)鍵入其余二碼,也可以不鍵入其余二碼而按一下空格鍵《ㄩ》表示該字已完成輸入。
(7)二字詞輸入例“說明”編碼SMYR對應(yīng)計(jì)算機(jī)鍵名串SMYRㄩ(8)三字詞輸入例“說明書”編碼SMS對應(yīng)計(jì)算機(jī)鍵名串SMSㄩ(9)多字詞輸入例“權(quán)利要求書”編碼QLYSN-對應(yīng)計(jì)算機(jī)鍵名串QLYSN
權(quán)利要求
1.一種計(jì)算機(jī)音形漢字輸入法,其特征在于以漢語拼音的首字母(音碼)和漢字的筆畫(形碼)為基本單元,每一個(gè)基本單元被賦予一個(gè)輸入鍵,每個(gè)漢字可由三至五個(gè)代表首字母或筆畫的輸入鍵串組成,其方法如下a.將漢字按形拆分成構(gòu)件單元,其方法如下①構(gòu)件基本單元必須是漢字或部首或不定構(gòu)件(即不是漢字或部首的漢字中的一個(gè)獨(dú)立、完整的組成部分),一個(gè)字只允許取一個(gè)不定構(gòu)件,此外,凡一個(gè)字可以取現(xiàn)代漢字或部首為第一構(gòu)件和第三構(gòu)件者,其中間部份可作為一個(gè)不定構(gòu)件處理,②一個(gè)漢字只能完整地分成二個(gè)或三個(gè)構(gòu)件單元,漢字拆分后不能有多余的筆畫,構(gòu)件之間筆畫不能交叉或共用一筆,也可以不拆分,為單構(gòu)件字。③一個(gè)漢字的構(gòu)件拆分順序如下能否拆成不含不定構(gòu)件的三構(gòu)件字,否,則能否拆成不含不定構(gòu)件的二構(gòu)件字,否,則能否拆成含不定構(gòu)件的三構(gòu)件字或含不定構(gòu)件的二構(gòu)件字,否,則為單構(gòu)件字。④按字的書寫順序分第一構(gòu)件、第二構(gòu)件,第三構(gòu)件,以每個(gè)構(gòu)件末筆為準(zhǔn)排列書寫順序,b.取碼規(guī)則一、音碼規(guī)則①凡構(gòu)件是漢字或與現(xiàn)代漢字同形的部首者,取其讀音的首字母為該構(gòu)件的音碼。②凡構(gòu)件是不與漢字同形的部首者,選取其中一部分常用部首,給定讀音首字母,作為該構(gòu)件的音碼。③凡②中未選取的不與漢字同形的部首,則一律以同一拼音字母作為該構(gòu)件的音碼。④不定構(gòu)件以待輸入漢字讀音的首字母為其音碼,二、形碼規(guī)則將漢字的筆畫按在漢字中出現(xiàn)的頻率不同,由低到高整理,歸納成筆畫序表。構(gòu)件所有的筆畫中,其在筆畫序中列為最前者為該構(gòu)件的第一形碼,列于次前者為該構(gòu)件的第二形碼,依此類推,c.編碼規(guī)則一、單個(gè)漢字三至五碼鍵入。①三構(gòu)件字編碼依次為第一構(gòu)件音碼,第一構(gòu)件的第一形碼,第二構(gòu)件音碼、第三構(gòu)件音碼、第二、三構(gòu)件的所有筆畫中在筆畫序表中列于最前者代表的形碼。②二構(gòu)件字編碼依次為第一構(gòu)件音碼,第一構(gòu)件第一形碼,第二構(gòu)件音碼,第二構(gòu)件第一形碼,第二構(gòu)件第二形碼。③單構(gòu)件字編碼依次為字的音碼、字的第一形碼、字的第二形碼,字的第三形碼,字的第四形碼,④如果一個(gè)字沒有五碼則輸入該字的碼后,按一次空格鍵即表示該字輸入已完成。⑤如果一個(gè)字雖有五碼但不需五碼即可確定,則可以輸入五碼也可以在輸入確定該字的碼后按一次空格鍵,完成輸入。二、一字可對應(yīng)多組編碼鍵入,有利于同形不同讀音字的輸入,個(gè)別有兩種拆分形式的字的輸入,以及不同文化水平的使用者編碼可能有所不同的字的輸入,三、詞的輸入。以四碼或五碼鍵入,①二字詞的編碼依次為第一字的音碼,第二字的音碼,第一字的第一構(gòu)件音碼,(單構(gòu)件字用該字音碼),第二字的第一構(gòu)件音碼(單構(gòu)件字用該字音碼),空格鍵。②三字詞的編碼依次為第一字音碼,第二字音碼,第三字音碼,空格鍵。③多字詞的編碼依次為第一字音碼,第二字音碼,第三字音碼,最后一字音碼。N鍵
2.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)音形漢字輸入法,其特征在于利用計(jì)算機(jī)英文鍵盤的鍵分別與音碼和形碼相對應(yīng)。
3.根據(jù)權(quán)利要求2所述的計(jì)算機(jī)音形漢字輸入法,其特征在于所說的筆畫序表如下
4.根據(jù)權(quán)利要求2或3所述的計(jì)算機(jī)音形漢字輸入法,其特征在于所選取的不與漢字同形的部首給定讀音首字母如下表所示
凡上表中未注明的非現(xiàn)代漢字部首一律以字母O表示。
5.根據(jù)權(quán)利要求4所述的計(jì)算機(jī)音形漢字輸入法,其特征在于計(jì)算機(jī)英文鍵盤的鍵與對應(yīng)的首字母和筆畫的關(guān)系如下表
6.根據(jù)權(quán)利要求5所述的計(jì)算機(jī)音形漢字輸入法,其特征在于如果待輸入漢字構(gòu)件是九年制義務(wù)教育語文課本中未有的漢字,可以以字母a代替該字讀音的首字母編碼。
全文摘要
本發(fā)明為一種計(jì)算機(jī)音形漢字輸入法。以漢語拼音的首字母和漢字的筆畫為基本單元,一個(gè)基本單元被賦予一個(gè)輸入鍵,每個(gè)漢字可由三至五個(gè)代表首字母和筆畫的輸入鍵串組成,其方法是首先將漢字按形拆分成構(gòu)件單元。制定筆畫序表,常用部首讀音字母表,根據(jù)音碼規(guī)則取構(gòu)件的音碼。根據(jù)形碼規(guī)則取構(gòu)件的形碼,根據(jù)編碼規(guī)則將漢字用音碼、形碼表示,再用與音碼、形碼對應(yīng)的計(jì)算機(jī)鍵盤英文鍵名輸入計(jì)算機(jī)。
文檔編號G06F3/023GK1175724SQ9710739
公開日1998年3月11日 申請日期1997年3月17日 優(yōu)先權(quán)日1996年8月23日
發(fā)明者鄧仁 申請人:鄧仁