專利名稱:漢字編碼輸入方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字編碼輸入方法,尤其是涉及一種利用形碼和音碼相結(jié)合的方式對(duì)漢字進(jìn)行編碼地方法。
隨著計(jì)算機(jī)及計(jì)算機(jī)通信技術(shù)的發(fā)展和普及,越來越多的工作環(huán)境和家庭都具備了使用計(jì)算機(jī)進(jìn)行漢字文件編輯及通信的條件,而隨著社會(huì)經(jīng)濟(jì)文化的發(fā)展,計(jì)算機(jī)漢字文字編輯和通信將成為越來越多的所必須掌握的基本技能,以適應(yīng)工作、學(xué)習(xí)、娛樂的要求。漢字的輸入則是使用計(jì)算機(jī)漢字文件處理和通信所必須進(jìn)行的經(jīng)常性的操作。因而,能否將漢字快速正確地輸入計(jì)算機(jī),是影響計(jì)算機(jī)漢字文件編輯和計(jì)算機(jī)通信發(fā)展推廣和影響其工作效率的關(guān)鍵。為找到優(yōu)越的漢字輸入方案,有眾多的有志之士付出艱辛的努力,并發(fā)明了數(shù)以百計(jì)的計(jì)算機(jī)漢字輸入方案,有數(shù)種矯矯都以被廣泛運(yùn)用于計(jì)算機(jī)漢字文件編輯,例如五筆字型、太極碼、自然碼、鄭碼、栗碼、沈碼等等。
然而,縱觀這些漢字輸入方案,雖然各自的優(yōu)點(diǎn)無可質(zhì)疑,但也各有不足之處,無一達(dá)到快速、容易、準(zhǔn)確兼?zhèn)涞乃?。其不足之處可歸為如下兩點(diǎn)(1)重碼率高,(2)不易掌握。
本發(fā)明者在過去三年多的漢字編碼的探索中,找到了一種新的漢字編碼方案,為鑒別于其他漢字方案,將其命名為知音碼,根據(jù)我們運(yùn)用知音碼對(duì)漢字編碼的實(shí)踐體驗(yàn),我們認(rèn)為知音碼與目前計(jì)算機(jī)所采用的絕大多數(shù)漢字輸入方案相比更為優(yōu)越,作為本專利申請(qǐng)的一部分,如下將對(duì)知音碼的編碼原理,優(yōu)點(diǎn),編碼的各項(xiàng)規(guī)則加以詳細(xì)說明,并對(duì)某些漢字做示范性地編碼。然而這些僅為說明本發(fā)明,并不代表知音碼的全部?jī)?nèi)容,根據(jù)本發(fā)明的漢字編碼輸入方法的保護(hù)范疇?wèi)?yīng)由所附權(quán)利要求來加以限定。
知音碼的編碼是將漢字按自然構(gòu)成分解為兩部分,形成兩個(gè)完整的漢字或偏旁部首。每個(gè)漢字的知音碼由三至四個(gè)字母組成,第一個(gè)字母為被編碼漢字的聲母,第二三個(gè)字母分別為分解后第一和第二部分所成漢字或偏旁部首名字的聲母。如果分解出的第二部分仍可以分解,則對(duì)其第二部分再一分為二。知音碼的第四位則為第二次分解出的第二部分所成漢字或偏旁部首名稱的聲母。對(duì)于聲母由兩字母組成的漢字或偏旁部首名字,在知音碼中用單個(gè)字母來代表其聲母,這里我們采用未被用以聲母的字母I、U、和V分別代表雙字母聲母ZH、CH和SH。如第一次分解出的任一部分或第二次分解出的第二部分為非字結(jié)構(gòu)或無名字或非常用的偏旁部首,則在知音碼中用未被用以聲母或極少用以聲母的字母來代表,我們采用字母O來代表非字結(jié)構(gòu)或無名字或非常用的偏旁部首。少數(shù)漢字不由自然構(gòu)字的偏旁部首構(gòu)成,因而不可分成兩個(gè)自然構(gòu)字部分,這些不可分解的漢字,其知音碼由三個(gè)字母組成,其第一字母仍為字的聲母或雙字母聲母的代表字母,第二三位字母分別為該漢字的起始和結(jié)束筆畫名字的聲母或其雙字母聲母的代表字母。
根據(jù)本發(fā)明的漢字編碼輸入方法具有以下優(yōu)點(diǎn)
(1)重碼率低根據(jù)對(duì)《新華字典》和計(jì)算機(jī)漢字文件編碼軟件「中文之星2.0」?jié)h字字庫共同收編的所有的簡(jiǎn)化漢字(共計(jì)6700多)進(jìn)行編碼及統(tǒng)計(jì),重碼率約為16%,而在實(shí)際應(yīng)用中,可配合單詞聯(lián)想輸入,可以期望這會(huì)將重碼率更進(jìn)一步降到極低水平。
(2)容易掌握知音碼的編碼原則符合漢字的組成規(guī)律,符合人們對(duì)漢字的記憶規(guī)律,符合漢字的書寫規(guī)律。絕大多數(shù)漢字是由不同的部件組合而成,人們對(duì)漢字的記憶也是習(xí)慣地通過對(duì)組成漢字的組成部件的記憶來實(shí)現(xiàn)的。而且常用的偏旁部首多來源于漢字或是漢字的變形,因而它們大多都有名字,人們對(duì)這些偏旁部首的名字也比較熟悉,人們對(duì)漢字的書寫順序是根據(jù)組成漢字的偏旁部首的種類和位置,由左至右,由上至下,由外至內(nèi)。知音碼從最大程度上將這些規(guī)律融合于編碼中,知音碼對(duì)漢字的分解為一分為二,直觀快速,所有非字結(jié)構(gòu)或非常用無名偏旁部首只用一個(gè)字母代表,需要記憶的東西極少,因而知音碼與其它諸多方案相比更容易掌握。
(3)準(zhǔn)確率高漢字拼音中,韻母的運(yùn)用要比聲母困難的多,知音碼只用聲母或代表聲母的字母編碼,因而不易出錯(cuò)誤。對(duì)于有多個(gè)聲母的漢字,采用相應(yīng)的多個(gè)編碼,對(duì)于有多于一種符合編碼規(guī)則的分解方式的漢字,知音碼采用相應(yīng)的多種編碼。對(duì)于分解后所產(chǎn)生的多聲母漢字的漢字,除極不常用的音外,知音碼采用相應(yīng)多的編碼。對(duì)于有些難以確定為可分解或不可分解的漢字,知音碼采用針對(duì)可分解漢字和不可分解漢字的兩種編碼方法對(duì)其編碼。因而有一部分漢字有兩個(gè)或兩個(gè)以上的編碼,而每個(gè)符合或近似符合編碼規(guī)則的編碼一般均可將所要的漢字準(zhǔn)確地輸入計(jì)算機(jī),所以知音碼有高的輸入準(zhǔn)確率。
下面通過將知音碼與最接近的現(xiàn)有編碼方案作比較,來進(jìn)一步說明本發(fā)明的優(yōu)點(diǎn)。在我們所了解的已公開發(fā)表的漢字編碼方案中,栗碼和表音碼(沈碼)與知音碼比較接近,特別是編碼規(guī)則,而在字的分解方法上,以及構(gòu)字部件的字母代表方法上差異較大,知音碼有其顯著的優(yōu)越性。
栗碼的四筆聲形輸入法,對(duì)于常用字,編碼由三位字母組成,第一位為漢字的聲母,第二位為首部件的聲母,第三位為未部件的聲母,對(duì)非常用字則還有第四位,第四位為次部件的聲母。
表音碼(沈碼)由四位字母組成,第一位為漢字的聲母,第二位為首部件的聲母,第三位為第二部件的聲母,第四位件為第三部件的聲母,如漢字只有兩部件,則第四位為字母O,對(duì)于多于三個(gè)部件組成的字又有一些特殊分解方式。
栗碼和表音碼在漢字的分解上有很大的相似處,都將漢字分解為最基本的構(gòu)字部件,這些部件大多為單體漢字,而又有眾多的偏旁部首和非常用偏旁部首及非漢字的構(gòu)字部件,對(duì)于有名字的偏旁部首在編碼中由其名字的聲母代表,而對(duì)無名的非字結(jié)構(gòu)則指定由不同字母代表,或聯(lián)想到特定漢字,并由這些漢字的聲母代表。栗碼中運(yùn)用了40多個(gè)非漢字的偏旁部首,同時(shí)又用了42個(gè)聯(lián)想偏旁部首,另外還運(yùn)用了8個(gè)基本筆畫,因而使用栗碼就需要對(duì)這些結(jié)構(gòu)的字母代表方法進(jìn)行記憶。
表音碼(沈碼)中,有36個(gè)非字偏旁部首和12個(gè)需要強(qiáng)記的部件,因而也有許多東西需要記憶,才能正確運(yùn)用。
相比之下,知音碼需要記憶的東西要少得多,只有常用的有名字的偏旁部首才由其名字的聲母代表,而且對(duì)一些近似的部件歸類到一個(gè)字母上,只有極個(gè)別的偏旁部首由指定字母代表,而對(duì)于無名非常用非字結(jié)構(gòu)均用一個(gè)字母“O”來代表。另外知音碼編碼中,不論字的構(gòu)字部件有多少,對(duì)所有可分解漢字(除由三個(gè)相同部件構(gòu)成的字)都一分為二,然后如有必要,對(duì)分解出的第二部再一分為二,因而快速直觀。與栗碼和表音碼(沈碼)相比,知音碼中的第二、三、四位字母所代表的結(jié)構(gòu)多為完整漢字,而栗碼和表音碼(沈碼)的第二、三、四位則代表較多的非漢字的構(gòu)字部件。
對(duì)于不可分解漢字的編碼,知音碼第二位采用起始瞬間筆畫,第三位采用結(jié)束瞬間筆畫,相比下栗碼和表音碼(沈碼)對(duì)不可分解漢字的編碼規(guī)則很不易掌握。
基于上述的優(yōu)越性以及與其它目前所常用的漢字計(jì)算機(jī)輸入方案相比較,知音碼基本上達(dá)到了快速容易準(zhǔn)確,因而非常具有推廣使用價(jià)值。
通過以下結(jié)合附圖對(duì)本發(fā)明實(shí)施方式的描述,本發(fā)明的其他特征和優(yōu)點(diǎn)將會(huì)更加明顯。
圖1是根據(jù)本發(fā)明的第一實(shí)施例所選偏旁部首及筆畫在鍵盤上的分布圖。
(1)知音碼的組成規(guī)則
每個(gè)漢字的知音碼由三至四個(gè)字母組成,第一位字母為漢字的聲母或代表漢字聲母的字母,第二三位字母分別代表將漢字分解為兩部分后的第一和第二部分,知音碼的第四位字母代表將漢字第一次分解后的第二部分再一分為二后所產(chǎn)生的第二部分,其代表規(guī)則見(4)。不可分解的漢字的知音碼可由三位字母組成,其編碼第二三位字母的產(chǎn)生規(guī)則見(5)。(2)漢字的分解順序
(a)根據(jù)漢字的結(jié)構(gòu)和書寫順序,由左至右,由上至下,由外至內(nèi),將漢字一分為二。
(b)例外對(duì)于有結(jié)構(gòu)為辶或廴為分解后的第一部分,右上部為分解后的第二部分,對(duì)于包含有戈或近似于戈字結(jié)構(gòu)的漢字,其戈或近似于戈字的結(jié)構(gòu)為分解后的第一部分,漢字的左下部分為分解后的第二部分。
(c)如第一次分解后的第二部分由兩個(gè)或兩個(gè)以上自然分離的構(gòu)字結(jié)構(gòu)組成,或可再分解為兩部分,其中第一部分為完整漢字,則第一次分解出的第二部分應(yīng)按以上原則再一分為二。
(d)凡筆劃相交叉或重疊的構(gòu)字結(jié)構(gòu)不可分解。
(e)凡有兩個(gè)以上接觸點(diǎn)的兩個(gè)構(gòu)字結(jié)構(gòu)不可分解。
(f)偏旁部首不可分解。(3)漢字的分解優(yōu)先原則
(a)以分解出兩個(gè)自然分離的完整漢字為優(yōu)先。
(b)以分解出的第二部分為最大結(jié)構(gòu)的漢字為優(yōu)先。
(c)以在自然分離處分解為優(yōu)先。
(d)以分解出漢字或常用偏旁部首優(yōu)先于非字或非常用偏旁部首。
(e)如第一次分解所得均為非字或非常用無名字偏旁部首,也以第二部分最大為優(yōu)先。
(f)如漢字的構(gòu)成部分相接觸,第一或第二次分解所產(chǎn)生的第二部分所成的漢字必須由兩劃或兩劃以上,方可從相接觸的第一部分分解開。
(g)單筆劃一般不被分解為第二部分,除非此筆劃與分解出的第一部分對(duì)稱或近似對(duì)稱,因而字的結(jié)構(gòu)呈左右或上下構(gòu)型。
(h)第一和第二次分解的原則相同。(4)知音碼中漢字,偏旁部首,和非字結(jié)構(gòu)的字母代表規(guī)則
(a)單聲母漢字,由其單聲母字母代表。
(b)雙聲母漢字(聲母為ZH,CH,和SH),由非聲母字母(I,U,和V)分別代表。
(c)常用偏旁部首由其名字的聲母或代表聲母的字母來代表。
(d)個(gè)別偏旁部首由指定字母代表。
(e)非漢字結(jié)構(gòu)或無名字的偏旁部首,由不常用于聲母的字母O代表。(5)不可分解漢字的編碼規(guī)則
(a)不可分解漢字的范疇不由自然分離的兩部分或兩部分以上所組成的漢字,既所有筆劃相互交叉或相連的漢字,不能分解為一個(gè)漢字或有名字的偏旁部首和另一個(gè)構(gòu)字結(jié)構(gòu)的漢字。
(b)編碼規(guī)則不可分解漢字的編碼由三位字組組成,第一個(gè)字母的產(chǎn)生同于可分解漢字的編碼的一個(gè)字母,第二位字母為該漢字的起始筆畫名字的聲母字母或雙字母聲母的代表字母,第三位字母為該漢字的結(jié)束筆畫名字的聲母或雙字母聲母的代表字母。不可分解漢字的起始和結(jié)束筆畫是指按人們書寫習(xí)慣書寫漢字時(shí)的起始和結(jié)束筆畫。起始和結(jié)束筆畫及其名字(括號(hào)內(nèi)為其聲母字母)包括丶點(diǎn)(D),一橫(H),丨豎(V),丿撇(P),捺(N),亅鉤(G),
提(T)。例如‘乙’字的起始筆畫名為‘橫’,結(jié)束筆畫名為‘鉤’,其知音碼的編碼為YHG。(6)知音碼的特別規(guī)則
(a)由相同三個(gè)漢字所組成的漢字,知音碼的第二三四位字相同,為組成被編碼漢字的漢字的聲母或其代表字母。
(b)某些不易被劃分為可分解或不可分解的漢字,其編碼采用可分解漢字和不可分解漢字的編碼原則,因而這些漢字有兩個(gè)或兩個(gè)以上的編碼。
(c)對(duì)于某些極少使用的構(gòu)成其它漢字的漢字,在知音碼中,除按其聲母或代表雙聲母的字母進(jìn)行編碼外,也可以用代表非漢字結(jié)構(gòu)和無名字的偏旁部首的代表字母O來代表。因而,含有這些極少使用的漢字的漢字,可以有兩個(gè)或兩個(gè)以上的編碼。
(d)如果漢字的第二次分解出的兩部分分別為非字結(jié)構(gòu)和一個(gè)漢字,但其兩部分相連相接觸,在不與其它漢字的編碼相重的條件下,可省去編碼的第四位字母。
(e)某些漢字有兩種或兩種以上的符合編碼規(guī)則的分解形式,因而這些漢字可有兩個(gè)或兩個(gè)以上的編碼。
(f)某些漢字為多音字,它們有兩個(gè)或兩個(gè)以上的聲母,因而這些漢字可有兩個(gè)或兩個(gè)以上的編碼。
(g)某些漢字在分解后所成的漢字為多(聲)音漢字,除去不常用發(fā)音外,這些漢字可有相應(yīng)多的編碼。
圖1中給出了根據(jù)本發(fā)明的第一實(shí)施例所選偏部首及筆畫在鍵盤的分布圖。其中
鍵 偏旁部首及筆畫(相關(guān)字或注解)
b 勹(包),疒(病),丷(八)
c 艸(草)
ch(u) 巛
(川),乂(交叉)
d 冫氵灬丶
(點(diǎn))
e 卩
阝(耳朵形)
f扌(扶手旁)
g冖以及凡上部有其它結(jié)構(gòu)的冖統(tǒng)稱為冠蓋,由g代表
h(虎),一(橫)
j钅(金)
l 刂(立刀)
n(捺)
牜(牛)
p 彡丿(撇),疋
(疋),
q 犭(犬字旁)
r 亻(人)
s厶(厶),糸纟(絲)
sh(v)饣(食),礻(示),丨(豎),(手)
t
(提筆畫)
w口(圍,區(qū)別于口字)攵夂
x忄(心),
(小)
y衤(衣),讠(言),
(羊)
z辶(走),(足)
zh(i)(竹) 爫(爪)
凡未列出的非字結(jié)構(gòu)的偏旁部首,在知音碼中,均用字母O代表。偏旁部首(除系外)不可被分解。凡未列出的,由漢字(列于《新華字典》中)略加變形而成的偏旁部首,在知音碼中的代表方法,則同于其漢字的代表方法。知音碼編碼示范
(a)知音碼編碼實(shí)例詳解漢字(拼音) 第一分解(代表字母) 第二分解(代表字編碼
母)彬(bin) 木(m)+杉(v) 木+彡(p) bmvp礴(bo) 石(v)+薄(b) 艸+溥(p) bvbp薄(bo) 艸(c)+溥(p) 氵+
(o) bcpo溥(p)氵(d)+
(o) 甫+寸(c) pdoc蕆(chan) 艸(c)+
(o) 戊+貝(b) ucob迦(jia) 辶(z)+加(j) 力+口(k) jzjk病(bing) 疒(b)+丙(b) 一+內(nèi)(n) bbbn摧(cui) 扌(f)+崔(c) 山+隹(i) cfci崔(cui) 山(v)+隹(i) 亻+
(o)cvio隹(zhui) 亻(r)+
(o) iro查(cha) 木(m)+旦(d) 日+一(h) umdh杳(cha) 杳(y)+一(h) uyh竇(dou) 穴(x)+賣(m)
+頭(t) dxmt賣(mai)
(o)+頭(t)
+大(d) motd遁(dun) 辶(z)+盾(d)
+目(m)dzdm森(sen) 木(m)+林(l) 木+木(m) smlm森(sen) 木(m)+木(m) +木(m) smm
m誓(shi) 折(i)+言(y)
+口(k)viyk不可分解漢字 起始筆畫名 結(jié)束筆畫名編碼(拼音) (代表字母) (代表字母)電(dian) 豎(v) 鉤(g) dvg弗(fu)橫(h) 豎(v) fhv戈(ge)橫(h) 點(diǎn)(d) ghd戌(xu)橫(h) 點(diǎn)(d) xhd乙(yi)橫(h) 鉤(g) yhg重(zhong) 撇(p) 橫(h) iph(b)知音碼編碼舉例
浪 淘 沙
ldlgtdof vdv
劉 禹 錫
lwl ypdxjyw九曲黃 河萬里沙,jpg qvh hob hdkk whg lvh vdv浪 淘 風(fēng) 簸 自 天 涯。ldlg tdoffju biop zpm thdydyg如 今 直 上 銀 河 去,rnkjroojvq vvhyjg hdkk gts同 到 牽 牛 織 女 家。took dil qdonnpvisibnphjgv黃 鶴 樓 送 孟 浩 然 之 廣 陵hoob hon lmlnszgt mzm hdgk rod idngduleop
李 白
lmz bpr故 人 西 辭 黃 鶴 樓,ggprpn xhh cvxv hob honlmln煙 花 三 月 下 揚(yáng) 州。yhyd hchbshhhyphxhd yfoiooo孤 帆 遠(yuǎn) 影 碧 空 盡,gjgfjf yzywyjpbpvkkxgjud唯 見 長(zhǎng) 江 天 際 流。wkio joo upn jdgthd yevo ldou注“州”為難編碼字,其編碼也包括idv(按不可分解字編碼),
“三”的編碼也包括sheh
“之”的編碼也包括ido
“白”的編碼也包括bdr
“際”的編碼也包括jevx
“黃”的編碼也包括hob
“下”的編碼也包括xhb(C)知音碼與栗碼,表音碼(沈碼)編碼實(shí)例對(duì)照
知音碼 栗碼 表音碼
(四筆聲形) (沈碼)漢字拼音編碼結(jié)構(gòu)編碼 編碼結(jié)構(gòu)編碼 編碼結(jié)構(gòu) 編碼彎 wan 亦弓 wyg 亦弓 wyg 亠八弓 wwbg孕 yun 乃子 ynz 乃子 ynz (折)(撇)子 yzpz貴 gui 蟲貝人 gobr 中一貝gib 口(堅(jiān))貝 gksb惠 hui
心 hox 車心 hux (橫)日心 hhax第 di
dio
did 弓(堅(jiān)) dzgs敬 jing 茍攵 jgp 艸勹攵jcf 艸勹攵 jobf曾 zeng
日 zor 丷田日zbr 丷口日 zbkr糟 zao 米曹日 zmer 米
日 zmr 米(橫)日 zmhr落 luo 艸洛各 lclg 艸氵口lck 艸氵夂 loit撐 cheng扌掌手 ufiv 扌
手 ufvx 扌小手 cuxu餐 can
食良covl 卜夕食cbv 卜又食 cbys熟 shu 孰灬 vvd 亠口灬vws 亠(撇)灬 swpi顛 dian 真頁 diyb/r 十具頁dvyj 真頁 dzyo
貝/人搬 ban 扌般殳 bfbv 扌舟又bfyi 扌(撇)殳 bups逼 bi 辶畐田 bzot (橫)口辶 bhzk (橫)口辶 bhkz東 dong (橫)(捺) dhn 七小 dqx (橫)(折)小 dhzx耳 er (橫)(橫) ehh (橫)十ehv (橫)(豎) ehss
(豎)豐 feng (橫)(豎) fhv 三(豎)fsi 三(堅(jiān)) fss甫 fu (橫)(點(diǎn)) fhd (橫) hnd (橫)月(豎) fhys
(點(diǎn))月瓜 gua (撇)(捺) gpn
(捺) ghn (撇)(撇) gpps
(豎)
在以上的編碼實(shí)例中,知音碼對(duì)所有非字結(jié)構(gòu)均用字母O代表,編碼所利用的多為完整漢字。栗碼對(duì)非字結(jié)構(gòu)如
亠,則由不同字母代表,需要記憶,而對(duì)“曾”字中的
,“餐”字中的
,“惠”字中的
,則需要想象而分別轉(zhuǎn)化為田,卜、車,再進(jìn)行編碼。
表音碼(沈碼)對(duì)漢字的分解近似于栗碼,其編碼規(guī)則近似于栗碼的四筆聲形法。與知音碼相比,栗碼和表音碼(沈碼)利用較多得非字偏旁部首。
對(duì)于筆畫相交或不可分解的漢字,知音碼只取起始時(shí)的筆畫和結(jié)束時(shí)的筆畫名稱的聲母,而栗碼對(duì)這些字的編碼則不易掌握,例如將“車”分解為“七小”,將“耳”分解為“一十”,將“豐”分解為“三丨”,將“甫”分解為“一月”。表音碼(沈碼)對(duì)這些字的分解也同樣地不易掌握。
根據(jù)對(duì)6700多的漢字的編碼及統(tǒng)計(jì),知音碼的重碼率僅為約16%,因而知音碼是單字輸入的理想方法。知音碼中一個(gè)重碼所代表的平均字?jǐn)?shù)大約為3個(gè),因而絕大多數(shù)的重碼僅有少數(shù)選擇字,可一次全部出現(xiàn)在計(jì)算機(jī)屏幕上,對(duì)于重碼字,可根據(jù)漢字的使用頻率對(duì)可選擇字優(yōu)化排列,這樣使用更方便。
知音碼也可用于詞組的輸入,這樣可進(jìn)一步降低重碼率,在詞組輸入中,每個(gè)漢字的編碼可采用其實(shí)際編碼,或只采用編碼的前三位字母。漢字的知音碼中,有不小比例的漢字的編碼由三個(gè)字組成,一部分由四個(gè)字母組成的編碼,可減少至三個(gè)字母,而又不與其它三個(gè)字母的編碼相重,一部分由四個(gè)字母組成的編碼,可減少至三個(gè)字母,而又不與其它三個(gè)字母的編碼相重,因而有不少漢字可只用三位字母輸入計(jì)算機(jī),從而采用知音碼的前三位字母進(jìn)行詞組輸入,重碼率也應(yīng)該是很低的。
知音碼不僅適宜于對(duì)簡(jiǎn)化漢字進(jìn)行編碼,它也同樣且于對(duì)繁體漢字的編碼。知音碼不僅適宜于用普通話對(duì)漢字所發(fā)的聲母進(jìn)行編碼,它也同樣適宜于用其它方言發(fā)音對(duì)漢字進(jìn)行編碼,比如廣東話,福建話等。同樣地,知音碼也可適宜于其它語言中所使用的漢字的編碼,漢字在韓國(guó),日本等國(guó)都有普遍地使用,與中國(guó)人使用漢字的不同處在于,對(duì)漢字的發(fā)音不同,部分漢字所表示的意義有所不同,因而,知音碼的編碼原理也適宜于外語中的漢字的編碼。
由于知音碼有其快速、容易、準(zhǔn)確等優(yōu)點(diǎn),我們認(rèn)為它在漢字的文件編輯和計(jì)算機(jī)網(wǎng)絡(luò)漢字通訊領(lǐng)域有良好的應(yīng)用前景。
權(quán)利要求
1.一種對(duì)漢字進(jìn)行編碼并輸入到計(jì)算機(jī)中去的方法,其特征在于步驟
1)將組成漢字的若干常用偏旁部首及若干常用筆畫,根據(jù)其名稱的漢語拼音聲母的代表字母分配到鍵盤的相應(yīng)鍵上;
2)將漢字劃分為可分解、不可分解兩類;
3)對(duì)于可分解漢字,根據(jù)其結(jié)構(gòu)和書寫順序由左至右、由上至下、由外至內(nèi)分解成兩部分,并在鍵盤上依次輸入該漢字漢語拼音聲母的代表字母、及對(duì)該漢字進(jìn)行分解所得漢字或偏旁部首名稱的漢語拼音聲母的代表字母,作為該可分解漢字的編碼;
4)對(duì)于不可分解漢字,則在鍵盤上依次輸入該漢字漢語拼音聲母的代表字母,及組成該不可分解漢字若干筆畫名稱的漢語拼音聲母的代表字母,作為該不可分解漢字的編碼;
5)用鍵盤上的同一鍵來代表每個(gè)可分解漢字分解過程中產(chǎn)生的非字結(jié)構(gòu)或非指定常用的偏旁部首。
2.根據(jù)權(quán)利要求1的對(duì)漢字進(jìn)行編碼并輸入到計(jì)算機(jī)中的方法,其特征在于步驟2所述不可分解漢字是指
(a)凡筆劃相交叉或重疊的構(gòu)字結(jié)構(gòu)不可分解;
(b)凡有兩個(gè)以上接觸點(diǎn)的兩個(gè)構(gòu)字結(jié)構(gòu)不可分解;
(c)偏旁部首不可分解;
不屬于上述不可分解的漢字和非字結(jié)構(gòu)歸類于可分解漢字。
3.根據(jù)權(quán)利要求1的對(duì)漢字進(jìn)行編碼并輸入到計(jì)算機(jī)中的方法,其特征在于步驟2對(duì)可分解漢字分解的原則是
(a)根據(jù)漢字的結(jié)構(gòu)和書寫順序,由左至右,由上至下,由外至內(nèi),將漢字一分為二;
(b)例外對(duì)于有結(jié)構(gòu)為辶或廴的漢字,辶或廴為分解后的第一部分,右上部為分解后的第二部分,對(duì)于包含有戈或近似于戈字結(jié)構(gòu)的漢字,其戈或近似于戈字的結(jié)構(gòu)為分解后的第一部分,漢字的左下部分為分解后的第二部分;
(c)如第一次分解后的第二部分由兩個(gè)或兩個(gè)以上自然分離的構(gòu)字結(jié)構(gòu)組成,或可再分解為兩部分,其中第一部分為完整漢字,則第一次分解出的第二部分應(yīng)按以上原則再一分為二;
(d)以分解出兩個(gè)自然分離的完整漢字為優(yōu)先;
(e)以分解出的第二部分為最大結(jié)構(gòu)的漢字為優(yōu)先;
(f)以在自然分離處分解為優(yōu)先;
(g)以分解出漢字或常用偏旁部首優(yōu)先于非字或非常用偏旁部首;
(h)如第一次分解所得均為非字或非常用無名字偏旁部首,也以第二部分最大為優(yōu)先;
(i)如漢字的構(gòu)成部分相接觸,第一或第二次分解所產(chǎn)生的第二部分所成的漢字必須由兩劃或兩劃以上,方可從相接觸的第一部分分解開;
(j)單筆劃一般不被分解為第二部分,除非此筆劃與分解出的第一部分對(duì)稱或近似對(duì)稱,因而字的結(jié)構(gòu)呈左右或上下構(gòu)型。
4.根據(jù)權(quán)利要求1的對(duì)漢字進(jìn)行編碼并輸入到計(jì)算機(jī)中的方法,其特征在于
如果聲母只由一個(gè)字母組成,則其代表字母就是該聲母本身,而對(duì)于由兩個(gè)字母組成的聲母,就用非常用或不用于漢語拼音聲母的字母來代替。
5.根據(jù)權(quán)利要求1的對(duì)漢字進(jìn)行編碼并輸入到計(jì)算機(jī)中的方法,其特征在于常用偏旁部首及常用筆畫包括
勹 疒 丷 艸 巛
乂冫氵灬 丶
卩
阝扌冖以及
凡上部有其它結(jié)構(gòu)的冖-钅刂
丿彡疋
犭
亻厶糸纟饣礻
口攵夂忄
衤讠辶爫
丨亅
6.根據(jù)權(quán)利要求1的對(duì)漢字進(jìn)行編碼并輸入到計(jì)算機(jī)中的方法,其特征在于常用偏旁部首及常用筆畫在鍵盤上分布如下
勹 疒 丷B鍵 艸C鍵 巛
乂U鍵 冫氵灬丶D鍵
阝卩E鍵扌F鍵 H鍵刂L鍵 N鍵
冖以及凡上部有其它結(jié)構(gòu)的冖亅
G鍵
糸纟厶S鍵 丿彡疋P鍵 犭Q鍵 亻R鍵
饣礻
V鍵 口攵夂 W鍵小
忄X鍵 礻讠Y鍵
辶 Z鍵 爫I鍵钅J鍵T鍵
凡未列出的非字結(jié)構(gòu)的偏旁部首,均用字母O代表,凡未列出的,由漢字略加變形而成的偏旁部首,其代表方法,則同于其漢字的代表方法。
7.根據(jù)權(quán)利要求1的對(duì)漢字進(jìn)行編碼并輸入到計(jì)算機(jī)中的方法,其特征在于所述步驟2
每個(gè)可分解漢字,其編碼由三到四個(gè)英文字母組成;
a)在鍵盤上輸入該漢字漢語拼音聲母的代表字母,作為其編碼的第一位;
b)按所述分解方法將該漢字分解成第一、第二兩部分,在鍵盤上依次輸入分解后第一、第二部分所成漢字或偏旁部首名稱的漢語拼音聲母的代表字母,作為該漢字編碼的第二、三位;
c)如果在所述步驟b分解出的第二部分仍可再分解,則在鍵盤上輸入再次分解所產(chǎn)生的第二部分漢字或偏旁部首名稱的漢語拼音聲母的代表字母,作為該漢字編碼的第四位;
d)如果分解過程中產(chǎn)生了非字或無名稱偏旁部首,用非常用或不用于漢語拼音聲母的字母來代表。
8.根據(jù)權(quán)利要求1的對(duì)漢字進(jìn)行編碼并輸入到計(jì)算機(jī)中的方法,其特征在于所述步驟3
每個(gè)不可分解漢字,其編碼由三個(gè)英文字母組成;
a)在鍵盤上輸入該漢字漢語拼音聲母的代表字母,作為其編碼的第一位;
b)在鍵盤上輸入書寫該漢字時(shí)起始筆畫名稱的漢語拼音聲母的代表字母,作為其編碼的第二位;
c)在鍵盤上輸入書寫該漢字時(shí)結(jié)束筆畫名稱的漢語拼音聲母的代表字母,作為其編碼的第三位。
9.根據(jù)權(quán)利要求4的對(duì)漢字進(jìn)行編碼并輸入到計(jì)算機(jī)中的方法,其特征在于由兩個(gè)字母組成的聲母ZH、CH、SH分別由I、U、V來代替。
10.根據(jù)權(quán)利要求1對(duì)漢字進(jìn)行編碼并輸入到計(jì)算機(jī)中的方法,其特征在于將非字結(jié)構(gòu)或非指定常用偏旁部首分配到O鍵上。
全文摘要
一種將音碼和形碼結(jié)合起來對(duì)漢字進(jìn)行編碼并輸入到計(jì)算機(jī)中去的方法,該方法將漢字分為可分解和不可分解兩類。對(duì)可分解漢字采用一分為二的分解方式,并用鍵盤上的同一鍵代表每個(gè)可分解漢字分解過程中產(chǎn)的非字結(jié)構(gòu)或非指定常用的偏旁部首。該方法便于記憶,重碼率低,有利于提高漢字的輸入速度。
文檔編號(hào)G06F3/023GK1180185SQ9611274
公開日1998年4月29日 申請(qǐng)日期1996年10月11日 優(yōu)先權(quán)日1996年10月11日
發(fā)明者劉永彪, 胡敏 申請(qǐng)人:劉永彪