專(zhuān)利名稱(chēng):成字優(yōu)先的漢字編碼輸入方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)漢字信息輸入處理領(lǐng)域,特別是一種成字優(yōu)先的漢字編碼輸入方法。
現(xiàn)有的漢字形音編碼輸入方法,如專(zhuān)利申請(qǐng)?zhí)枮椤?0102877.0”公開(kāi)號(hào)為“CN1049727A”所公開(kāi)的“形音漢字編碼”和專(zhuān)利申請(qǐng)?zhí)枮椤?3106596.8”、公開(kāi)號(hào)為“CN1077550A”的“左部?jī)?yōu)先漢字音形碼輸入方法”,是優(yōu)選出組字能力強(qiáng)或簡(jiǎn)單的漢字作為基本字根,再加上常用的偏旁部首和筆劃,作為部首(變形)字根和筆劃字根,如果把上述全部字根加起來(lái)則有150多個(gè)字根,記憶量大,而且把字分解出字根的規(guī)則不夠明確,增加了學(xué)習(xí)難度,限制了它們的普及。
本發(fā)明的目的是提出一種記憶量少,規(guī)則簡(jiǎn)單、入門(mén)容易的成字優(yōu)先的漢字編碼輸入方法。
本發(fā)明的目的是通過(guò)以下的技術(shù)方案來(lái)實(shí)現(xiàn)的成字優(yōu)先的漢字編碼方法,包括全部可組字的成字部件,由偏旁部首構(gòu)成的非成字部件、一筆筆劃部件,具有確定字義的成字包括單成字和含有一個(gè)或一個(gè)以上單成字的復(fù)合成字,各部件取其名稱(chēng)拼音的首位字母為其代碼,第一位編碼為該字拼音的首位字母,部件取碼在成字優(yōu)先規(guī)則為復(fù)合成字部件優(yōu)先于單成字部件,單成字部件優(yōu)先于非成字部件,非成字部件優(yōu)先于一筆筆劃部件,輸入第二位及以后的編碼時(shí),按成字優(yōu)先規(guī)則取兩個(gè)組字部件的代碼部件的代碼依書(shū)寫(xiě)順序排列。
輸入第二位及以后的編碼時(shí),還可先按成字優(yōu)先規(guī)則取兩個(gè)組字部件的代碼依書(shū)寫(xiě)順序排列,再接成字優(yōu)先規(guī)則及書(shū)寫(xiě)順序確定被解釋部件并在被解釋部件碼后加插構(gòu)成該部件的最后一筆部件代碼作為解釋碼。
詞組輸入時(shí),在首字確定后及后續(xù)字的拼音首字母輸入前,加插一位代表詞組長(zhǎng)度的數(shù)字碼。
所定義的非成字部件、一筆筆劃部件的代碼為A阝B衤D丶E二冫 丷G クH一彐J纟K匚口L忄刂N 钅O氵P 扌Q亻S|三彡 巛T W讠X 灬 彳Z 本發(fā)明具有如下優(yōu)點(diǎn)
1、由于將全部可組字的成字作為成字部件,成字部件的代碼不需記憶,非成字部件和一筆部件除為了減少重碼率而重新定義的部件外,其余也不需專(zhuān)門(mén)記憶,因而記憶量少。
2、字的部件分解取碼及被解釋部件的確定均統(tǒng)一采用成字優(yōu)先規(guī)則,規(guī)則簡(jiǎn)單,入門(mén)容易。
3、因漢字的末筆筆劃較分散,選用部件的末筆筆劃作為解釋部件,重碼率低。
下面通過(guò)一些字的編碼,對(duì)本發(fā)明作進(jìn)一步的說(shuō)明。
成字為具有確定字義的文字,例如耳,是指人或動(dòng)物的聽(tīng)覺(jué)器官;所有可組字的成字均為成字部件。
單成字是不能再分解出成字的文字,復(fù)合成字是含有一個(gè)或一個(gè)以上單成字的文字,例如“敏”字,含有一個(gè)單成字“母”;又如“刷”字,含有兩個(gè)單成字“尸”和“巾”。
非成字部件為偏旁部首,非成字部件及一筆筆劃部件除為減少重碼而重新定義的代碼外,其余均取其常用名稱(chēng)拼音的首位字母為其代碼。
為進(jìn)一步降低漢字編碼輸入的重碼率,增加了一個(gè)解釋碼,解釋碼是取被解釋部件的最后一筆筆劃的名稱(chēng)拼音的首位字母為其代碼,而解釋部件仍依照成字優(yōu)先的規(guī)則及書(shū)寫(xiě)順序來(lái)確定,解釋碼緊跟被解釋部件代碼之后。
例如,“漢”字,可分解為“”和“又”兩個(gè)部件,其中“又”為成字,故其編碼為“HOYN”。
又如,“禮”字,可分解為“”和“”兩個(gè)部件,無(wú)成字,“”為非成字部件,“”為一筆部件,其編碼為“LLDG”。
“荔”字,取兩個(gè)成字部件“力”、“力”,故其編碼為“LLPL”。
“瀛”字,取兩個(gè)部件“”和“贏”,其編碼為“YOYD”。
“癮”字,取兩個(gè)成字部件“廣”和“隱”,其中“隱”為復(fù)合成字,故其編碼為“YGYD”。
“證”字,可分解為“”和“正”兩個(gè)部件,其編碼為“ZWZH”。
詞組輸入時(shí),在確定了首字后,按詞組的字?jǐn)?shù)多少輸入一個(gè)代表詞組長(zhǎng)度的數(shù)字碼,以減少詞組輸入的重碼率,并且可以用此數(shù)字碼區(qū)分字的編碼輸入還是詞組的編碼輸入,同時(shí)可以在詞組庫(kù)沒(méi)有所需詞組時(shí)保留第一個(gè)漢字而不用重新輸入。
如輸入詞組“解放軍”,首先對(duì)“解”字進(jìn)行編碼輸入,“解”字為“JJSD”;接著輸入數(shù)字碼“3”,代表三字詞組;再在“3”后面輸入“FJ”,所以整個(gè)詞組的編碼應(yīng)為“JJSD3FJ”。
權(quán)利要求
1.一種成字優(yōu)先的漢字編碼輸入方法,包括全部可組字的成字部件、由編旁首構(gòu)成的非成字部件、一筆筆劃部件,具有確定字義的成字包括單成字和含有一個(gè)或一個(gè)以上單成字的復(fù)合成字,各部件取其名稱(chēng)拼音的首位字母為其代碼,第一位編碼為該字拼音的首位字母,其特征在于部件取碼的成字優(yōu)先規(guī)則為復(fù)合成字部件優(yōu)先于單成字部件,單成字部件優(yōu)先于非成字部件,非成字部件優(yōu)先于一筆筆劃部件,輸入第二位及以后的編碼時(shí),按成字優(yōu)先規(guī)則取兩個(gè)組字部件的代碼依書(shū)寫(xiě)順序排列。
2.如權(quán)利要求1所述的成字優(yōu)先的漢字編碼輸入方法,其特征是按成字優(yōu)先規(guī)則及書(shū)寫(xiě)順序確定被解釋部件并在被解釋部件碼后加括構(gòu)成該部件的最后一筆部件代碼作為解釋碼。
3.如權(quán)利要求1所述的成字優(yōu)先的漢字編碼輸入方法,其特征是詞組輸入時(shí),在首字確定后及后續(xù)字的拼音首字母輸入前,加插一位代表詞組長(zhǎng)度的數(shù)字碼。
全文摘要
一種成字優(yōu)先的漢字編碼輸入方法,編碼基本部件包括復(fù)合成字部件、單成字部件、由偏旁部首構(gòu)成的非成字部件及一筆筆劃部件,各部件取其名稱(chēng)拼音的首位字母為其代碼,部件取碼的成字優(yōu)先規(guī)則的先后順序依次為復(fù)合成字部件、單成字部件、非成字部件及一筆筆劃部件,第一位編碼為該字拼音的首位字母,后續(xù)編碼按成字優(yōu)先規(guī)則取組字部件的代碼依書(shū)寫(xiě)順序排列,本發(fā)明規(guī)則簡(jiǎn)單明了,記憶量少,入門(mén)容易,是適合于大多數(shù)人士使用的一種漢字編碼輸入方法。
文檔編號(hào)G06F3/023GK1127378SQ9510016
公開(kāi)日1996年7月24日 申請(qǐng)日期1995年1月21日 優(yōu)先權(quán)日1995年1月21日
發(fā)明者韓廣中 申請(qǐng)人:韓廣中