專利名稱:漢字起末筆編碼法的制作方法
本發(fā)明涉及的是一種極其簡捷的漢字編碼方法,特別適合非專職計算機操作人員向計算機及其它需對漢字進行信息處理的類似裝置快速輸入漢字用。
目前,國內外漢字編碼法大致可歸結為三類純音的、純形的、音形結合的。從現(xiàn)在使用情況可看出,直接用漢字拼音法,由于重碼多,速度低,卷舌音與非卷舌音難以區(qū)別而造成誤碼率高。純形編碼法,其碼長長(五筆字形,每字五碼),速度低,拆字難,易出錯,音形碼有的追求無重碼而提出規(guī)則,其規(guī)定繁瑣難以記意,不易推廣。有的規(guī)則雖簡單,但不夠嚴格,拆字方法有多義性而難以掌握。上述幾種編碼法,雖存在一定的缺點,可是在專職計算機操作人員中一般都是可用的。
本發(fā)明的目的是為了降低誤編率和重碼,提高輸入速度,其提出的編碼方法是完全建立在理解的基礎上,並符合漢字的書寫習慣,具有規(guī)則簡單,不用學,不用記,更無需專門訓練。掌握快,容易實行。其取碼嚴格,無多義性,重碼率和誤碼率都極低??芍苯釉跇藴舒I盤上使用。本發(fā)明已將國標GB 2312-80 Ⅰ、Ⅱ級漢字6763個全部硬化,儲存于軟盤中。
本發(fā)明提供的編碼方法為1.按照漢字的書寫筆劃的順序,取被編碼漢字的最初幾筆和最末幾筆構成的規(guī)范偏旁讀音的第一個拼音字母為該字的前兩碼,起筆為第一碼,末筆為第二碼,再取該漢字本字讀音的第一個拼音字母為第三碼,即得該漢字的編碼。
從習慣取規(guī)范偏旁的讀音為宀(寶)-B,疒(病)-B,艸(草)-C,刂(刀)-D,卩=阝(耳)-E,虍(虎)-H,纟(絞)-J,钅(金)-J,冫(兩)-L,
(牛)-N,冖(平)-P,犭(犬)-Q,亻(人)-R,饣(食)-S,礻(示)-S,氵(水)-S,扌(提)-T,
(王)-W,攵(文)-W,忄(心)-X,讠(言)-Y,衤(衣)-Y,(竹)-Z,廴=辶(走)-Z,(足)-Z。
編碼舉例漢字 第一碼 第二碼 第三碼 本字編碼起筆 碼元 末筆 碼元 本字讀音 碼元激 氵 S 攵 W Ji J SWJ溺 氵 S 冫 L Ni N SLN節(jié) 艸 C 卩 E Jie J CEJ2.如漢字的起末筆中的任一方或雙方並不構成規(guī)范偏旁,則取起末筆中的任一方或雙方構成的不與其它筆劃交叉的最簡漢字或獨立漢字讀音的第一個拼音字母作為被編碼漢字的碼元。
編碼舉例漢字 第一碼 第二碼 第三碼 本字編碼起筆 碼元 末筆 碼元 本字讀音 碼元拼 扌 T 開 K Pin P TKP折 扌 T 斤 J Zhc Z TJZ郵 由 Y 阝 E You Y YEY殿 尸 S 又 Y Dian D SYD
3.如漢字的起末筆中的任一方或雙方,既不構成規(guī)范偏旁也不構成最簡或獨立漢字,則取起筆的第一筆,末筆的最末一筆的筆劃,讀音的第一個拼音字母為碼元。
1)從習慣取筆劃的讀音為一(橫)-H,丨(豎)-S,丿(撇)-P,
(捺)-N,丶(點)-D,
(鉤)-G,
(挑)-T。
2)下列筆劃一律取作“
”(鉤),碼元為G。
3)下列筆劃,起筆時取轉筆前的筆劃,末筆時取轉筆后的筆劃。
編碼舉例漢字 第一碼 第二碼 第三碼 本字編碼起筆 碼元 末筆 碼元 本字讀音 碼元大一 H
N Da D HND旦 日 R 一 H Dan D RED學 丶 D 子 Z Xue X DZX旁 丶 D 萬 W Pang P DWP巴 一 H 乚 G Ba B HGB本發(fā)明提供起末筆時常遇十八個冷辟漢字及十四個近似漢字。其讀音如下十八個常遇冷辟漢字讀音如下彳(Chi斥)-C,芻(Chu雛)-C,缶(Fou否)-F,鬲(Ge隔)-G,艮(Gen)-G,袞(Gun滾)-G,曷(He喝)-H,奐(Huan換)-H,戔(Jian箋)-J,堇(Jin謹)-J,臼(Jiu舅)-J,僉(Qian簽)-Q,豕(Shi史)-S,厶(Si私)-S,忝(Tian添)-T,幺(Yao吆)-Y,聿(Yu玉)-Y,豸(Zhi制)-Z。
十四個常遇似漢字讀音如下
<p>按本發(fā)明編碼時,需注意1)漢字“一”在起末筆中讀作“橫”(H),獨立存在時其編碼取作“橫,橫,一”即“HHY”;
2)漢字“乙”在起末筆中讀原字音“Yi”(Y),獨立存在時其編碼取作“橫,鉤,一”即“HGY”;
3)漢字“國”的編碼先外后內,取作“囗,玉,國”即“KYG”其它類似字如“園”,“困”均按此法編碼。
4)漢字“匡”的編碼亦先外后內,取作“橫,土,匡”即“HTK”其它類似字如“區(qū)”,“匠”均按此法編碼。
權利要求
1.一種漢字起末筆編碼方法,特別適合于非專職計算機操作人員向計算機及其它需對漢字進行信息處理的類似裝置快速輸入漢字用。本發(fā)明的特征包括按規(guī)定的編碼方法為取被編碼漢字的起筆、末筆和該漢字本字,作為編碼的依據。
2.如權利要求
1所述的編碼方法,其特征在于按照漢字的書寫筆劃順序,取漢字最初幾筆和最末幾筆(簡稱起末筆)構成的規(guī)范偏旁讀音的第一個拼音字母為該漢字的前兩碼,起筆為第一碼,末筆為第二碼,再取該漢字本字讀音的第一個拼音字母為第三碼,即得該字的編碼。從習慣取規(guī)范偏旁讀音如下宀(寶)-B,疒(病)-B,艸(草)-C,刂(刀)-D,卩=阝(耳)-E,虍(虎)-H,纟(絞)-J,钅(金)-J,冫(兩)-L,
(牛)-N,冖(平)-P,犭(犬)-Q,亻(人)-R,饣(食)-S,礻(示)-S,氵(水)-S,扌(提)-T,
(王)-W,攵(文)-W,忄(心)-X,讠(言)-Y,衤(衣)-Y,(竹)-Z,廴=辶(走)-Z,(足)-Z
3.如權利要求
1所述的編碼方法,其特征在于按權利要求
2所述的方法,如果被編碼漢字的起末筆中的任一方或雙方并不構成規(guī)范偏旁,則取起末筆中的任一方或雙方構成的不與其它筆劃有交叉的最簡漢字或獨立漢字讀音的第一個拼音字母做為被編碼漢字的碼元。
4.如權利要求
3所述的編碼方法,其特征在于1)取起末筆時有常遇的十八個冷辟漢字,其讀音的第一個拼音字母為彳-C,芻-C,缶-F,鬲-G,艮-G,袞-G,曷-H,奐-H,戔-J,堇-J,臼-J,僉-Q,豕-S,厶-S,忝-T,幺-Y,聿-Y,豸-Z;2)取起末筆時,有常遇的十四個近似漢字,其讀音的第一個字母為丷=八-B,上=匕-B,镸=長-C,
=東-D,
=干-G,
=艮-G,隹=佳-J,耒=來-L,良=良-L,曰=日-R,
=豕-S,
=水-S,士=土-T,
=小-X;
5.如權利要求
1所述的編碼方法,其特征在于按權利要求
2和3所述的方法,如果被編碼漢字的起末筆中的任一方或雙方,既不構成規(guī)范偏旁亦不構成最簡或獨立漢字,則取起筆之第一筆,末筆之最末一筆的筆劃讀音的第一個拼音字母做碼元。從習慣取筆劃的讀音為一(橫)-H,丨(豎)-S,丿(撇)-P,
(捺)-N丶(點)-D,
(鉤)-G,
(挑)-T;
6.如權利要求
5所述的編碼方法,其特征在于1)漢字中的下列筆劃一律取作“
”(鉤),碼元為G,
2)下列筆劃,起筆時取轉筆前的筆劃,末筆時取轉筆后的筆劃
7.如權利要求
1所述的編碼方法,其特征在于1)漢字“一”在起末筆中讀作“橫”(H),獨立存在時其編碼取作“橫,橫,一”,即“HHY”;2)漢字“乙”在起末筆中讀原字音“Yi”(Y),獨立存在時其編碼取作“橫,鉤,乙”,即“HGY”;3)漢字“國”的編碼先外后內,取作“囗,玉,國”,即“KYG”,其它類似字如“園”、“困”均按此法編碼;4)漢字“匡”的編碼亦先外后內,取作“橫,土,匡”,即“HTK”,其它類似字如“區(qū)”,“匠”均按此法編碼。
專利摘要
一種漢字起末筆編碼法,特別適合非專職計算機操作人員向計算機及其它需對漢字進行信息處理的類似裝置快速輸入漢字用。其編碼方法的要點是取起末筆構成的規(guī)范偏旁(或最簡獨立漢字或最初筆劃最末筆劃)讀音的第一個拼音字母為前兩碼,漢字本字讀音的第一個拼音字母為第三碼,平均碼長小于3碼。此法嚴格,無多義性,重碼率和讀碼率均極低。無繁瑣規(guī)定,它符合漢字的書寫習慣,掌握快,容易實行。
文檔編號G06F3/023GK87100210SQ87100210
公開日1988年7月27日 申請日期1987年1月13日
發(fā)明者武震聲 申請人:電子工業(yè)部第二十一研究所導出引文BiBTeX, EndNote, RefMan