專利名稱::漢字全拼寫編碼及部首編碼方法
技術(shù)領(lǐng)域:
:本發(fā)明屬于計算機漢字文字處理技術(shù)中的輸入技術(shù),是一種對漢字的計算機鍵盤輸入編碼方法,這個方法也可用于編字典等。目前,通過計算機鍵盤輸入漢字的方法很多,大致可分為拼音法、字形法、音形法和電報碼法,其中有的拼音法在詞的輸入上效果較好,但在字的輸入上重碼率高,且受到使用者的發(fā)音水平限制;字形法有的在輸入速度上效果不錯,但學起來較難,只對專業(yè)人員比較合適;音形法兼有前二種方法的缺點;電報碼法則是專業(yè)性更強的一種方法,普通人不易掌握。本發(fā)明的目的是研究開發(fā)用計算機鍵盤輸入漢字的新的編碼方法,既適合于漢語水平較高的人,也適應(yīng)于識字不多的人,總之,既充分利用普通人已有的拼音基礎(chǔ)、書寫習慣和現(xiàn)有的部首結(jié)構(gòu)方案,同時又體現(xiàn)出重碼率低的優(yōu)點。按本發(fā)明的構(gòu)思,形成了二種相互聯(lián)系的漢字編碼方法一種是把漢語拼音和漢字的聲調(diào)、漢字的筆畫構(gòu)造三者綜合在一起,都用拉丁字母表示,也就是采用‘拼音碼’+‘聲調(diào)碼’+‘部首碼’的所謂全拼寫編碼法;另一種是完全根據(jù)漢字的筆畫構(gòu)造,按一定的規(guī)則進行編碼來輸入漢字的,稱部首編碼法。以下依次說明這二種編碼方法。一.全拼寫編碼法(1)拼音碼按我國現(xiàn)行的標準漢語拼音方案,但作如下改變1)現(xiàn)行的ian、yan改用y;2)現(xiàn)行的iang、yang改用yy;3)現(xiàn)行的ang、eng、ing、ong分別改用aa、ee、ii、oo;4)現(xiàn)行的weng(ueng)改用wn,而wang(uang)改用uu;5)現(xiàn)行的iao改用yo,而yo改用io;6)現(xiàn)行的wan和uan改用w;7)現(xiàn)行的ü和yu改用v;8)現(xiàn)行的字頭ya-、ye-、yi-、yin-、ying-、yo-、yong-、you-分別改用ia-、ie-、i-、in-、ii-、io-、ioo-、iu-;9)現(xiàn)行的字頭wa-、wai-、wei-、wen-、wo-、wu-分別改用ua-、ue-、ui-、un-、uo-、u-;10)現(xiàn)行的字頭jia-、jie-、jiong-、jiu-分別改用ja-、je-、joo-、ju-;現(xiàn)行的字頭qia-、qie-、qiong-、qiu-分別改用qa-、qe-、qoo-、qu-;現(xiàn)行的字頭xia-、xie-、xiong-、xiu-分別改用xa-、xe-、xoo-、xu-;(2)聲調(diào)碼漢字的聲調(diào)分別用緊跟在拼音碼之后的b,c,d,f,h表示第一聲、第二聲、第三聲、第四聲、輕聲;(3)部首碼漢字的筆畫構(gòu)造用拉丁字母表示的方法是1)將漢字分解為266個部首偏旁(簡稱部首),列于全拼寫部首表中;2)每個部首依托于一個特定的漢字,稱其關(guān)鍵字,全拼寫部首表中的‘部首名’一欄即是以其關(guān)鍵字來稱謂的;3)該關(guān)鍵字的拼音第一個字母稱為部首字母,以它表示該部首;4)按照每個漢字規(guī)范的書寫筆順,選取前2個或三個部首的部首字母,放在聲調(diào)碼之后,作為其部首碼;5)全拼寫部首表如下</tables>以b為部首字母,共9部以c為部首字母,共10部以d為部首字母,共8部以f為部首字母,共13部以g為部首字母,共14部以h為部首字母,共12部以j為部首字母,共15部以k為部首字母,共2部</tables>以l為部首字母,共17部以m為部首字母,共12部以n為部首字母,共9部以p為部首字母,共10部以q為部首字母,共16部以r為部首字母,共10部以s為部首字母,共21部以t為部首字母,共11部以v為部首字母,共14部以w為部首字母,共14部以x為部首字母,共14部以y為部首字母,共15部以z為部首字母,共20部二.部首編碼法完全根據(jù)漢字的筆畫構(gòu)造,共用四個字母表示一個漢字,方法如下(1)將漢字分解為266個部首偏旁(簡稱部首),列于部首表中;(2)每個部首依托于一個特定的漢字,稱其關(guān)鍵字,部首表中的‘部首名’一欄即是以其關(guān)鍵字來稱謂的;(3)該關(guān)鍵字的拼音第一個字母稱為部首字母,以它表示該部首;(4)部首表與全拼寫部首表一樣,但其中有16個部首其部首字母與全拼寫部首表不同,它們是①由以r為部首字母改為以e為部首字母,共6部②由以y為部首字母改為以i為部首字母,共3部③由以w為部首字母改為以u為部首字母,共7部(5)當漢字的部首超過4個時,部首碼的4個字母按照該漢字規(guī)范的書寫筆順,依次選取其第一、二兩個部首的部首字母,以及其最后兩個部首的部首字母;(6)當漢字的部首不足4個時,除去第一輪選取的部首字母外,按所缺之數(shù)再進行第二輪選取;第二輪是從第一輪已用過的各部首中分別拆細,從每部首中選一個更小的部首,直至總數(shù)補足4個部首碼為止;(7)當?shù)诙嗊x取后仍不足4個部首碼時,繼續(xù)按同樣的思路進行下一輪的選取,直至總數(shù)補足4個部首碼為止;(8)若一個漢字的筆畫用盡后仍不足4個部首碼時,其不足的碼可以用字母‘o’補在后面。與現(xiàn)有的編碼方案相比,全拼寫編碼法對每個漢字共用4-8個碼,但可以做到每碼一字,幾乎無重碼,而且普通人也能容易地學會使用;部首碼法則接近于一般人寫字的習慣,使用起來比較自然,同時重碼率也顯著降低,輸入效率提高,例如,對國標GB2312-80的一、二級字庫的近6730個漢字來說,一碼1字的約占88%,一碼2字的只10%,一碼3字的只1.5%,沒有一碼對應(yīng)于5個字以上的。下面舉例說明上述二個編碼方法例1.‘嚼’全拼寫編碼為jyockf其中拼音碼為jyo,聲調(diào)碼為c,部首碼為k(第一部首為口字部,部首字母是k)和f(第二個部首為孚字頭,部首字母是f);部首編碼為kfgc第一、二部首字母為k、f,第四、五部首,也就是最后二個部首為艮字框(部首字母為g)和寸字部(部首字母為c)。例2.‘怪’全拼寫編碼為guefxy其中拼音碼為gue,聲調(diào)碼為f,部首碼為x(第一部首為豎心旁,部首字母是x)和y(第二個部首為又字部,部首字母是y);部首編碼為xyts第一、二部首字母為x、y,剩下第三個部首為土字部(部首字母為t),第二輪選取第一個部首中的豎筆(部首字母為s)。例3.‘一’全拼寫寫編碼為ibh其中拼音碼為i,聲調(diào)碼為b,部首碼為h(唯一部首為橫筆,部首字母是h);部首編碼為hooo唯一部首為橫筆,部首字母是h,筆畫已用盡,用字母‘o’補足四個部首碼。權(quán)利要求1.一種通過計算機鍵盤輸入漢字的編碼方法,其特征在于每一個漢字不僅用拉丁字母拼音,而且還把其聲調(diào)、筆畫構(gòu)造分別用拉丁字母表示出來,稱全拼寫編碼,其編碼規(guī)則如下(1)拼音碼按我國現(xiàn)行的標準漢語拼音方案,但作如下改變1)現(xiàn)行的ian、yan改用y;2)現(xiàn)行的iang、yang改用yy;3)現(xiàn)行的ang、eng、ing、ong分別改用aa、ee、ii、oo;4)現(xiàn)行的weng(ueng)改用wn,而wang(uang)改用uu;5)現(xiàn)行的iao改用yo,而yo改用io;6)現(xiàn)行的wan和uan改用w;7)現(xiàn)行的ü和yu改用v;8)現(xiàn)行的字頭ya-、ye-、yi-、yin-、ying-、yo-、yong-、you-分別改用ia-、ie-、i-、in-、ii-、io-、ioo-、iu-;9)現(xiàn)行的字頭wa-、wai-、wei-、wen-、wo-、wu-分別改用ua-、ue-、ui-、un-、uo-、u-;10)現(xiàn)行的字頭jia-、jie-、jiong-、jiu-分別改用ja-、je-、joo-、ju-;現(xiàn)行的字頭qia-、qie-、qiong-、qiu-分別改用qa-、qe-、qoo-、qu-;現(xiàn)行的字頭xia-、xie-、xiong-、xiu-分別改用xa-、xe-、xoo-、xu-;(2)聲調(diào)碼漢字的聲調(diào)分別用緊跟在拼音碼之后的b,c,d,f,h表示第一聲、第二聲、第三聲、第四聲、輕聲;(3)部首碼漢字的筆畫構(gòu)造用拉丁字母表示的方法是1)將漢字分解為266個部首偏旁(簡稱部首),列于全拼寫部首表中;2)每個部首依托于一個特定的漢字,稱其關(guān)鍵字,全拼寫部首表中的‘部首名’一欄即是以其關(guān)鍵字來稱謂的;3)該關(guān)鍵字的拼音第一個字母稱為部首字母,以它表示該部首;4)按照每個漢字規(guī)范的書寫筆順,選取前2個部首的部首字母,放在聲調(diào)碼之后,作為其部首碼;5)全拼寫部首表如下以b為部首字母,共9部以c為部首字母,共10部以d為部首字母,共8部以f為部首字母,共13部以g為部首字母,共14部以h為部首字母,共12部以i為部首字母,共15部以k為部首字母,共2部</tables>以l為部首字母,共17部以m為部首字母,共12部以n為部首字母,共9部以p為部首字母,共10部以q為部首字母,共16部以r為部首字母,共10部以s為部首字母,共21部以t為部首字母,共11部以v為部首字母,共14部以w為部首字母,共14部以x為部首字母,共14部以y為部首字母,共15部以z為部首字母,共20部2.按權(quán)利要求1所述的輸入漢字的編碼方法,其特征在于部首碼按照每個漢字規(guī)范的書寫筆順,選取前3個部首的部首字母,放在聲調(diào)碼之后,作為其部首碼。3.一種通過計算機鍵盤輸入漢字的編碼方法,其特征在于每個漢字按其筆畫構(gòu)造用4個拉丁字母表示,稱部首編碼,其編碼方法如下(1)將漢字分解為266個部首偏旁(簡稱部首),列于后面部首表中(2)每個部首依托于一個特定的漢字,稱其關(guān)鍵字,后面部首表中的‘部首名’一欄即是以其關(guān)鍵字來稱謂的;(3)該關(guān)鍵字的拼音第一個字母稱為部首字母,以它表示該部首;(4)當漢字的部首超過4個時,部首碼的4個字母按照該漢字規(guī)范的書寫筆順,依次選取其第一、二兩個部首的部首字母,以及其最后兩個部首的部首字母;(5)當漢字的部首不足4個時,除去第一輪選取的部首字母外,按所缺之數(shù)再進行第二輪選??;第二輪是從第一輪已用過的各部首中分別拆細,從每部首中選一個更小的部首,直至總數(shù)補足4個部首碼為止;(6)當?shù)诙嗊x取后仍不足4個部首碼時,繼續(xù)按同樣的思路進行下一輪的選取,直至總數(shù)補足4個部首碼為止;(7)部首表如下以b為部首字母,共9部以c為部首字母,共10部以d為部首字母,共8部以e為部首字母,共6部以f為部首字母,共13部以g為部首字母,共14部以h為部首字母,共12部以i為部首字母,共3部以j為部首字母,共15部以k為部首字母,共2部以l為部首字母,共17部以m為部首字母,共12部以n為部首字母,共9部以p為部首字母,共10部以q為部首字母,共16部以r為部首字母,共4部以s為部首字母,共21部R5各自選自氫,C1-C6烷基和下面通式(II)的基團,前提條件是R2,R3,R4和R5中一個或兩個是通式(II)的基團;R6是C2-C4亞烷基;R7和R8各自是C1-C4亞烷基,a是1-100中的整數(shù),b是0-100中的整數(shù),a和b總和等于1-200,c是整數(shù)0或1,d是1和2之間的整數(shù),和e是1和2之間的整數(shù),d和e總和等于3;以及如果d等于1和e等于2則X1中一個是以下通式(III)的基團或C1-C30烴基和另一個是通式(III)的基團,和如果d等于2和e等于1則X1是通式(III)的基團;該通式(II)由以下結(jié)構(gòu)式表示其中R9和R10各自是氫,C1-C6烷基或C2-C6烷氧基烷基,R11是C2-C6亞烷基或C4-C8烷氧基烷基取代的亞乙基,R12是C1-C24烷基,和f是0-30中的整數(shù);該通式(III)由以下結(jié)構(gòu)式表示-R13-OH…(III)其中R13是C1-C4亞烷基。全文摘要本發(fā)明創(chuàng)造包括二種相互聯(lián)系的通過計算機鍵盤輸入漢字的編碼方法:一種是把漢語拼音和漢字的聲調(diào)、漢字的筆畫構(gòu)造三者綜合在一起,都用拉丁字母表示,也就是采用‘拼音碼’+‘聲調(diào)碼’+‘部首碼’的所謂全拼寫編碼法;另一種是完全根據(jù)漢字的筆畫構(gòu)造,按一定的規(guī)則進行編碼來輸入漢字的,稱部首編碼法。這二種編碼方法都比較易于掌握,前者易學,且能夠?qū)崿F(xiàn)一碼一字,而后者輸入速度快,重碼也低。本發(fā)明可用于編字典等。文檔編號G06F3/023GK1172982SQ9711283公開日1998年2月11日申請日期1997年6月24日優(yōu)先權(quán)日1997年6月24日發(fā)明者趙鴻本申請人:趙鴻本