專利名稱:三優(yōu)碼漢字輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字編碼方法,尤其涉及三優(yōu)碼漢字輸入法,這種方案可使?jié)h字通過鍵控快速輸入電腦。
背景技術(shù):
目前漢字編碼計算機輸入方法有許多種,五筆輸入法難學(xué)易忘,不易被眾人所掌握。二筆輸入法過重依賴筆畫拆解,不易宏觀操作,且取碼要素利用率低。各種拼音輸入法,雖簡便易學(xué),但重碼率高,不能實現(xiàn)盲打,使用效率低。其它編碼方法有的不夠規(guī)范,有的缺乏規(guī)律性支持。漢字編碼有待實質(zhì)改進。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服上述已有技術(shù)的不足而提供一種編碼規(guī)范簡單、記憶量小、易學(xué)易記易用、便于普及的三優(yōu)碼漢字輸入法。
現(xiàn)設(shè)定幾個基本概念內(nèi)含字漢字中所包含的其它漢字稱為內(nèi)含字,其他漢字是指除該漢字以外的漢字,內(nèi)含字包括原形內(nèi)含字和蛻變內(nèi)含字。
原形內(nèi)含字字庫中已有的漢字,在其它漢字中又重新出現(xiàn),它保持了原形而未發(fā)生蛻變。如“體”中的“本”字,“華”中的“化”字,等等。
蛻變內(nèi)含字漢字中所包含的其它漢字,它發(fā)生了蛻變。如“工”字在“功”中發(fā)生了蛻變;“土”字在“地”中發(fā)生了蛻變;“刀”字在“割”中發(fā)生了蛻變,等等。
蛻變還原內(nèi)含字在編碼過程中,根據(jù)蛻變內(nèi)含字在字庫漢字中出現(xiàn)的頻率高低,出現(xiàn)頻率較高的蛻變內(nèi)含字要還原為原形內(nèi)含字,以便獲取其音節(jié)首字母進行編碼。出現(xiàn)頻率較低的蛻變內(nèi)含字則不予還原,而以筆畫部分對待。蛻變還原內(nèi)含字由蛻變內(nèi)含字還原表可查?!巴痢弊衷凇暗亍敝邪l(fā)生了蛻變,應(yīng)予以還原;“竹”字在“筑”中發(fā)生了蛻變,應(yīng)予以還原,等等。
蛻變內(nèi)含字還原表(僅列舉蛻變還原內(nèi)含字及其例字)小(尖);人(從);土(地);屯(頓);身(躺);可(哥);分(頒);牛(牧);西(栗);半(判);尺(遲);且(助);馬(騎);羽(翟);木(楊);奄(鵪);光(輝);耒(耙);軍(皸);止(歧);共(恭);元(頑);堇(覲);又(艱);七(切);大(達、參);立(端);竹(筑);手(拜);厄(顧);四(罪);九(鳩);亶(顫);求(裘);辰(唇);此(雌);王(理、金);魚(鮮);己(改);米(粉);僉(斂);辛(辣);火(炮);與(歟);丕(邳);豆(豇);爿(臧);車(輪);爪(采);足(跟);工(功);月(青);刀(割);久(灸);丘(邱);耳(恥);享(鶉);雨(露);山(峒);幾(朵);敖(遨);其(基);舟(般);豐(邦);艮(退);北(邶);孛(勃);用(甬);尚(堂);子(孜);口(國、臨);內(nèi)(肉);兒(四);羊(美、翔);日(冒、昌);穴(窗);且(直);毛(毳);爻(爽);丁(可);刖(前);十(戎);禾(乘);同音內(nèi)含字一個漢字與它所包含的原形內(nèi)含字或蛻變還原內(nèi)含字的音節(jié)相同,則該內(nèi)含字被稱為同音內(nèi)含字。例如,“編”的“扁”,“程”中的“呈”,“清”中的“青”,“達”中的“大”,“筑”中的“竹”,“灸”中的“久”等都屬于同音內(nèi)含字。
多音內(nèi)含字漢字中的內(nèi)含字有可能是多音字,為獲取內(nèi)含字的音節(jié)首字母帶來分歧。因而,必須對多音內(nèi)含字的拼音進行約定規(guī)范,以利于編碼。多音內(nèi)含字的音節(jié)以其最常用的音節(jié)為準(zhǔn)。這由多音內(nèi)含字拼音規(guī)范表可查。例如?!皬垺弊种械摹伴L”字音節(jié)定為“CHANG”;“組”字中的“且”字音節(jié)定為“QIE”,等等。
多音內(nèi)含字拼音規(guī)范表阿a;艾ai;薄bo;賁ben;辟pi;扁bian;屏ping;泊bo;卜bu;參can;曾ceng;差cha;查cha;單dan;長chang;朝zhao;車che;沓ta;臭chou;乘cheng;大da;的de;石shi;畜chu;家jia;翟di;都dou;度du;敦dun;番fan;合he;否fou;行xing;鬲ge;谷gu;夾jia;龜gui;會hui;和he;賈jia;強qiang;血xue;角jiao;亟j(luò)i;解jie;率shuai;革ge;系xi;卡ka;六liu;且qie;奇qi;牟mou;爪zhao;親qin;覃tan;殼ke;罩zhao;折zhe;樂le;了le;氏shi;數(shù)shu;屯tun;約yue;術(shù)shu;員yuan;便bian;闞han;區(qū)qu;孱chan;重zhong;契qi;塞se;翰han;頡xie;肋lei;屬shu;剡yan;弄nong;雋juan;句ju;宿su;卒zu;丁ding。
純筆畫字把不能從中分解提取原形內(nèi)含字、蛻變還原內(nèi)含字或設(shè)定部首的漢字,稱作純筆畫字。例如刀、中、也、重、既等。
可分解字把從中能夠分解提取設(shè)定部首、原形內(nèi)含字或蛻變還原內(nèi)含字的漢字,稱為可分解字。可分解字又分為整分解字和準(zhǔn)分解字。
整分解字是指漢字完全由設(shè)定部首、原形內(nèi)含字或蛻變還原內(nèi)含字組成,而不包括其它筆畫部分。整分解字按型式可分成二整分解字、三整分解字、四整分解字……,整分解字的型式數(shù)目是漢字所包括的設(shè)定部首、原形內(nèi)含字和蛻變還原內(nèi)含字的數(shù)目之和。比如,“呂、分、詳”為二整分解字;“品、嬰、輯”為三整分解字。
準(zhǔn)分解字是指漢字的組成除了設(shè)定部首、原形內(nèi)含字、蛻變還原內(nèi)含字之外,還有其它筆畫部分。準(zhǔn)分解字按型式可分為一準(zhǔn)分解字、二準(zhǔn)分解字、三準(zhǔn)分解字……,準(zhǔn)分解字的型式數(shù)目是指漢字所包含的設(shè)定部首、原形內(nèi)含字和蛻變還原內(nèi)含字的數(shù)目之和。比如,“為、自、千”為一準(zhǔn)分解字;“系、聲、壓”為二準(zhǔn)分解字;“游、深、高”為三準(zhǔn)分解字。
本發(fā)明的目的可以通過如下措施來達到三優(yōu)碼漢字輸入法,把組成漢字的筆畫確定為8種,對20個部首的代碼進行了設(shè)定,對漢字進行編碼時,首先對蛻變還原內(nèi)含字進行還原,然后根據(jù)各項基本原則進行優(yōu)先分解、按順序排列,最后采用筆畫代碼、設(shè)定部首代碼、漢字音節(jié)首字母依照取碼規(guī)則對漢字進行編碼,通過標(biāo)準(zhǔn)的英文輸入鍵盤,使?jié)h字實現(xiàn)鍵控輸入電腦。
所述的筆畫代碼共有8種筆畫橫HENG 豎SHU 撇PIE 捺NA 點DIAN 提TI 鉤GOU 折ZHE代碼 EU P N A T G Z注豎撇連寫以撇計,豎捺連寫以捺計。末筆是提的復(fù)筆畫,一律算鉤。例如,“月”字的第二筆畫算鉤,“認”字的第二筆畫算鉤,“九”字的第一筆畫算鉤,“乃”字的第一筆畫算鉤,“隊”字的第一筆畫算鉤,“水”字的第一筆畫算鉤,“家”字的第六筆畫算鉤,“民”字的第三筆畫算鉤,“巳”字的末筆畫算鉤,“弓”字的末筆畫算鉤,“武”字的第三筆畫算鉤,“心”字的第二筆畫算鉤。“云”字的第三筆畫算鉤?!敖z”字的第一筆畫算鉤。末筆不是提的復(fù)筆畫,一律算折。
每種筆畫有各種變形,為便于編碼方便,用統(tǒng)一符號進行標(biāo)記。筆畫橫用符號“一”標(biāo)記,筆畫豎用符號“丨”標(biāo)記,筆畫撇用符號“ノ”標(biāo)記,筆畫捺用符號“ヘ”標(biāo)記,筆畫點用符號“丶”標(biāo)記,筆畫提用符號“/”標(biāo)記,筆畫鉤用符號“し”,筆畫折用符號“”標(biāo)記。
對漢字進行編碼時,首先要分清漢字為純筆畫字還是可分解字,如果漢字是純筆畫字,則按照筆順對各種筆畫進行前后排列,然后按照規(guī)則取碼,如果漢字是可分解字里的整分字,則按照聯(lián)系狀態(tài)可分解則和部位排列優(yōu)先順序原則,把漢字所包含的設(shè)定部首、原形內(nèi)含字或蛻變還原內(nèi)含字進行前后排列,然后按照規(guī)則取碼;如果可分解字是準(zhǔn)分字,除了把設(shè)定部首、原形內(nèi)含字、蛻變還原內(nèi)含字進行排列外,還要把其它筆畫放在它們的后面并按照筆順進行前后排列,然后按照規(guī)則取碼;對漢字的組成結(jié)構(gòu)進行內(nèi)含字還原、分解、排列的過程中,若出現(xiàn)不同的分解型式,須以分解型式優(yōu)先順序原則為依據(jù);下面是對各規(guī)則的解釋一、基本原則1、聯(lián)系狀態(tài)可分解原則漢字中的設(shè)定部首、原形內(nèi)含字或蛻變還原內(nèi)含字與周圍部分的聯(lián)系狀態(tài)有三種,即間隔狀態(tài)、接觸狀態(tài)、交錯狀態(tài)。比如,“如”中的“女”和“口”為間隔狀態(tài),“田”中的“口”和“十”為接觸狀態(tài),“重”字整體為交錯狀態(tài)。根據(jù)聯(lián)系狀態(tài)可分解原則,在間隔狀態(tài)或接觸狀態(tài)下可分解出設(shè)定部首、原形內(nèi)含字或蛻變還原內(nèi)含字,在交錯狀態(tài)下不能分解出設(shè)定部首、原形內(nèi)含字或蛻變還原內(nèi)含字。比如,“革”字只能分解出“廿”字,其它只能劃入筆畫部分。“出”字是純筆畫字,不能從中提取“山”字。“木”字可以從中提取內(nèi)含字“十”。不能從“末”字提取“木”字??梢詮摹跋x”字提取內(nèi)含字“中”。不能從“秉”字中提取內(nèi)含字“禾”。不能從“重”字提取“日”或“土”。
2、部位排列優(yōu)先順序原則漢字分解后,產(chǎn)生的設(shè)定部首、原形內(nèi)含字和蛻變還原內(nèi)含字放在前,如果還有其它筆畫部份則放在它們的后面。分解出的設(shè)定部首、原形內(nèi)含字或蛻變還原內(nèi)含字依照其在漢字結(jié)構(gòu)中的部位也要進行前后排列。具體地講就是,上下結(jié)構(gòu)以上部在前,下部在后;左右結(jié)構(gòu)以左部在前,右部在后;內(nèi)外結(jié)構(gòu)以外部在前,內(nèi)部在后;對于結(jié)構(gòu)較復(fù)雜的漢字,要先總分后細分。劃入筆畫部分的各種筆畫依據(jù)其書寫先后順序進行前后排列。比如,“部”字分解后應(yīng)這樣排列“立口阝”;“游”字分解后應(yīng)這樣排列“氵方子;丿一”?!霸浴弊址纸夂髴?yīng)這樣排列“十戈木”。“臧”字分解后應(yīng)這樣排列“爿戈臣;”。
3、分解型式優(yōu)先順序原則在對漢字進行分解時,會出現(xiàn)不同的分解型式,總的來講有三大類,即整分解、準(zhǔn)分解和純筆畫分解。具體到整分解或準(zhǔn)分解,又有分解型式數(shù)目的不同。所以,對分解型式必須優(yōu)先規(guī)范,以利取碼。分解型式優(yōu)先順序是三整分解→四整分解→……高整分解→三準(zhǔn)分解→四準(zhǔn)分解→……高準(zhǔn)分解→二整分解→二準(zhǔn)分解→一準(zhǔn)分解→純筆畫分解。對于整分解,分解型式優(yōu)先順序原則確立了三整分解的最優(yōu)先地位;對于準(zhǔn)分解,分解型式優(yōu)先順序原則確立了三準(zhǔn)分解的最優(yōu)先地位;所以,這種編碼方案被稱作三優(yōu)碼。
下面舉例說明各種分解型式。
“詩”字應(yīng)分解成“讠土 寸”,這是三整分解。
“藏”字應(yīng)分解成“艸爿戈臣”,這是四整分解。
“搟”字應(yīng)分解成“扌十早人干”,這是五整分解。
“準(zhǔn)”字應(yīng)分解成“氵亻亠;一 一丨一”,這是三準(zhǔn)分解。
“澤”字應(yīng)分解成“氵又;一一丨”,這是二準(zhǔn)分解。
“節(jié)”字應(yīng)分解成“卄;レ丨”,這是一準(zhǔn)分解。
“重”字應(yīng)分解成“ノ一 ---- 一”,這是純筆畫分解。
“夫”字應(yīng)分解成“一一ノヘ”,這是純筆畫分解。
4、適宜后置原則在對漢字進行分解時,有的筆畫或部件既可以前置,也可以后置,應(yīng)本著后置的原則進行分解提取,此即適宜后置原則。依照此原則,“先”字宜分解為“十兀;丿”,不宜分解為“土兒;丿”。“壬”字宜分解成“士;丿”,而不宜分解成“千;一”。
5、準(zhǔn)分解字的純筆畫部分適宜縮小原則對于準(zhǔn)分解字,經(jīng)過分解,會產(chǎn)生純筆畫部分。對于有的漢字,純筆畫部分可多可少,應(yīng)本著純筆畫部分縮小的原則進行分解。例如,“成”字宜分解成“戊;レ”,而不宜分解成“戈;丿レ”?!昂獭弊忠朔纸獬伞澳?;丿”,而不宜分解成“千;丿 丨”?!傲睢弊忠朔纸獬伞敖瘢?、”,而不宜分解成“人;、、”。
6、筆畫“一”不能作為內(nèi)含字單獨提取原則在漢字中,“一”既可看作筆畫橫,又可看作內(nèi)含字“一yi”,為了編碼統(tǒng)一規(guī)范,“一”不能作為內(nèi)含字單獨提取。例如,“蘭”字可以提取內(nèi)含字“三”。“三”字可以提取內(nèi)含字“二”,“一”作為橫,劃入筆畫部分?!岸弊植豢蓮闹刑崛?nèi)含字“一yi”,而應(yīng)把“一”劃入筆畫部分。
二、取碼規(guī)則對于一個漢字,首先依據(jù)基本原則,完成漢字的分解、排列。漢字的分解形式已經(jīng)確定,就可設(shè)法采用筆畫代碼、設(shè)定部首代碼、漢字音節(jié)首字母對漢字進行編碼。針對不同的分解形式,采用不同的編碼方法。三優(yōu)碼的漢字編碼方法,漢字編碼既有二元碼,也有三元碼、四元碼。二元碼是指漢字編碼只有兩個字母組成,三元碼是指漢字編碼只有三個字母組成,四元碼是指漢字編碼有四個字母組成。每個漢字的漢字編碼,其第一碼均取自該漢字的音節(jié)首字母,第二碼、第三碼、第四碼則依據(jù)規(guī)則從漢字中獲取。下面對各種類型的漢字編碼進行說明。
純筆畫分解字漢字編碼的第一碼,取漢字的音節(jié)首字母;第二碼取第一個筆畫代碼;第三碼取第二個筆畫代碼;第四碼取最末筆畫代碼。筆畫數(shù)目不足者,取盡為止。例如,“乙”字的漢字編碼是YG,取自“乙YIレG”?!叭恕弊值臐h字編碼是RPN,取自“人RENノP ヘN”?!笆帧弊值臐h字編碼是SPEG,取自“手SHOUノP一E ---- レG”。
三整分解字、四整分解字及高整分解字漢字編碼的第一碼,取漢字的音節(jié)首字母;第二碼取第一個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;第三碼取第二個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;第四碼取最后一個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼。例如,“辟”字的漢字編碼是PSKX,取自“辟PI尸SHI 口KOU 辛XIN”。“蘊”字的漢字編碼是YVIM,取自“蘊YUN艸V 纟Q 日 皿MIN”。
三準(zhǔn)分解字、四準(zhǔn)分解字及多準(zhǔn)分解字漢字編碼的第一碼,取漢字的音節(jié)首字母;第二碼取第一個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;第三碼取第二個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;第四碼取最后一個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;純筆畫部分不參與取碼。例如,“浩”字的漢字編碼是HITK,取自“浩HAO氵I 土TU口KOU;ノ”?!敖馈弊值臐h字編碼是JKZC,取自“嚼JLAO口KOU 爪ZHAO 四 寸CUN;……”。
二準(zhǔn)分解字漢字編碼的笫一碼,取漢字的音節(jié)首字母;;第二碼取第一個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;第三碼取第二個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;第四碼取劃入純筆畫部分的第一個筆畫代碼。例如,“勁”字的漢字編碼是JGLZ,取自“勁JIN工GONG力LI;Z 丶”?!靶蕖弊值臐h字編碼是XOYU,取自“修XIU亻O 又YOU;丨U……”。
一準(zhǔn)分解字漢字編碼的第一碼,取漢字的音節(jié)首字母;第二碼取內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;第三碼取劃入純筆畫部分的第一個筆畫代碼;第四碼取劃入純筆畫部分的最后一個筆畫代碼。例如,“公”字的漢字編碼是GBGA,取自“公GONG八BA;レG 丶A”。
二整分解字如果沒有同音內(nèi)含字,則漢字編碼的第一碼,取漢字的音節(jié)首字母;第二碼取第一個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;第三碼取第二個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼。例如,“祁”字的漢字編碼是QRD,取自“祁QI礻R 阝D”?!皽啞弊值臐h字編碼是HIJ,取自“渾HUN氵I 軍JUN”。
如果二整分解字有同音內(nèi)含字,則首先要依據(jù)基本原則對同音內(nèi)含字進行再分解,以便從中獲取由兩個字母組成的代碼,即同音內(nèi)含字代碼。同音內(nèi)含字的再分解有一準(zhǔn)分解和純筆畫分解。對于一準(zhǔn)分解的同音內(nèi)含字,同音內(nèi)含字代碼的第一個字母取再分解的內(nèi)含字音節(jié)首字母或設(shè)定部首代碼,第二個字母取劃入純筆畫部分的首筆畫代碼。例如,“術(shù)”是“述”的一準(zhǔn)分解同音內(nèi)含字,其代碼是MA,取自“術(shù)——木MU;丶A”。對于純筆畫分解的同音內(nèi)含字,同音內(nèi)含字代碼的第一個字母取取劃入純筆畫部分的首筆畫代碼,第二個字母取取劃入純筆畫部分的末筆畫代碼,由此組成同音內(nèi)含字代碼。例如,“夫”是“膚”的純筆畫分解同音內(nèi)含字,其代碼是EN,取自“一E……ヘN”。對于有同音內(nèi)含字的二整分解漢字,漢字編碼的第一碼,取漢字的音節(jié)首字母;其它三碼依據(jù)漢字分解后的排列順序分別取碼,同音內(nèi)含字取同音內(nèi)含字代碼,非同音內(nèi)含字取音節(jié)首字母,設(shè)定部首取設(shè)定部首代碼。例如,“碼”字的漢字編碼是MSZE,取自“碼MA石SHI 馬——Z レ一E”?!百础弊值臐h字編碼是QOCT,取自“俅QIU亻O 求——寸CUN;/Tノ丶丶”。“貢”字的漢字編碼是GEEB,取自“貢GONG工—— 一E丨一E 貝BEI”。
簡碼輸入三優(yōu)碼漢字輸入法,實行簡碼輸入,這樣可以提高輸入速度。簡碼有一級簡碼、二級簡碼、三級簡碼。一級簡碼只有一個字母組成漢字代碼,二級簡碼只有兩個字母組成漢字代碼,三級簡碼只有三個字母組成漢字代碼。
一級簡碼字有26個,是使用頻率較高的字。除了“一、有、為”這三個字,其它二十三個簡碼字的代碼都是漢字拼音的音節(jié)首字母,即漢字編碼的第一個字母,很容易記住。這二十六個一級簡碼字是A(安);B(不);C(產(chǎn));D(的);E(而);F(發(fā));G(個);H(和);I(一);J(就);K(可);L(了);M(們);N(你);O(偶);P(平);Q(起);R(人);S(是);T(同);U(有);V(為);W(我);X(學(xué));Y(要);Z(這)。
二級簡碼,取漢字編碼的前兩個字母作代碼。二級簡碼字是些比較常用的字。
三級簡碼,取漢字編碼的前三個字母作代碼。三級簡碼字是些次常用的字。
詞組編碼為了提高漢字輸入速度,除了使用簡碼外,詞組的編碼使用更是關(guān)鍵。漢語的詞組是廣泛存在的??梢哉f,漢字及漢字編碼是基礎(chǔ),詞組及詞組編碼是關(guān)鍵。使用詞組編碼,可以大大提高輸入速度。詞組有二字詞組、三字詞組、四字詞組及多字詞組。詞組編碼實行四元碼制,即每個詞組編碼只有四個字母組成。實行詞組編碼,就要建立詞庫。
二字詞組的編碼,取每個字的漢字編碼的前兩個字母。例如,“群眾”的編碼是QYZR,取自“群QYKY、眾ZRRR”。
三字詞組的編碼,取前兩個字的漢字編碼的第一個字母和最后一個字的漢字編碼的前兩個字母。例如,“計算機”的編碼是JSJM,取自“計JFS、算SZME、機JMPG”。
四字詞組的編碼,取每個字的漢字編碼的第一個字母。例如,“共產(chǎn)主義”的編碼是GCZY,取自“共GVBE、產(chǎn)CWCA、主ZWT、義YAPN”。
多字詞組的編碼,取前三個字和最后一個字的漢字編碼的第一個字母。例如,“中華人民共和國”的編碼是ZHRG,取自“中ZUZU、華HOBS、入RPN、-----國GKY”。
本發(fā)明同已有技術(shù)相比可產(chǎn)生如下積極效果三優(yōu)碼漢字輸入法,記憶量小,規(guī)律性強,重碼率低,速度快,真正實現(xiàn)了既好學(xué)又好用,它是對漢字內(nèi)在結(jié)構(gòu)規(guī)律的有力探索。
具體實施例方式下面對本發(fā)明的具體實施方式
作詳細說明三優(yōu)碼漢字輸入法,其采用標(biāo)準(zhǔn)的英文輸入鍵盤,用代碼對應(yīng)英文字母鍵字母,其特征在于采用筆畫代碼、設(shè)定部首代碼、漢字音節(jié)首字母對漢字進行編碼。
下面為不同分解型式漢字的漢字編碼舉例漢字分解型式 分解內(nèi)容 漢字編碼綜ZONG 三整分解 纟Q宀X 示SHI ZQXS腦NAO 三整分解 月YUE亠W 兇XIONG NYWX插CHA 三整分解 扌U千QIAN 臼JIJ CUQJ說SHUO 三準(zhǔn)分解 讠F 口KOU 兒ER;……SFKE潦LIAO 四準(zhǔn)分解 氵I 大DA日 小XIAO;…… LIDX齡LING 三準(zhǔn)分解 止ZHI 人REN 令LING;……LZRL叢CONG 二準(zhǔn)分解人REN 人REN;一E------ CRRE危WEI 一準(zhǔn)分解 厄E;ノP Z WEPZ中ZHONG 純筆畫分解丨U Z 一丨U ZUZU我WO純筆畫分解ノP 一E---- 丶A WPEA優(yōu)YOU 二整分解 亻O 尤—— 一E----- 丶AYOEA(有同音內(nèi)含字)政ZHENG 整分解正—— 止ZHI;一E 攵V ZZEV(有同音內(nèi)含字)貶BIAN 二整分解 貝BEI 乏FA BBF付FU二整分解 亻O 寸CUN FOC
權(quán)利要求
1.三優(yōu)碼漢字輸入法,其采用標(biāo)準(zhǔn)的英文輸入鍵盤,所用代碼對應(yīng)英文字母鍵字母,其特征在于采用筆畫代碼、設(shè)定部首代碼、漢字音節(jié)首字母對漢字進行編碼,所述的筆畫代碼共有8種筆畫橫HENG 豎SHU 撇PIE 捺NA 點DIAN 提TI 鉤GOU 折ZHE代碼 E U PN AT G Z注豎撇連寫以撇計,豎捺連寫以捺計,末筆是提的復(fù)筆畫,一律算鉤,末筆不是提的復(fù)筆畫,一律算折。每種筆畫有各種變形,為便于編碼方便,用統(tǒng)一符號進行標(biāo)記。筆畫橫用符號“一”標(biāo)記,筆畫豎用符號“丨”標(biāo)記,筆畫撇用符號“丿”標(biāo)記,筆畫捺用符號“乀”標(biāo)記,筆畫點用符號“丶”標(biāo)記,筆畫提用符號“/”標(biāo)記,筆畫鉤用符號“レ”,筆畫折用符號“”標(biāo)記;所述的部首代碼共有20個氵(I);艸(V);扌(U);亻(O);钅(A);纟(Q);讠(F);忄(E);辶(P);疒(B);宀(X);犭(L);衤(J);阝(D);亠(W);饣(G);ネ(R);冫(N);灬(I);攵(V);所述的漢字音節(jié)首字母共有23個A;B;C;D;E;F;G;H;J;K;L;M;N;O;P;Q;R;S;T;W;X;Y;Z。
2.根據(jù)權(quán)利要求1所述的三優(yōu)碼漢字輸入法,其特征在于其編碼規(guī)則為首先要分清漢字為純筆畫字還是可分解字,如果漢字是純筆畫字,則按照筆順對各種筆畫進行前后排列,然后按照規(guī)則取碼,如果漢字是可分解字里的整分字,則按照聯(lián)系狀態(tài)可分解原則和部位排列優(yōu)先順序原則,把漢字所包含的設(shè)定部首、原形內(nèi)含字或蛻變還原內(nèi)含字進行前后排列,然后按照規(guī)則取碼;如果可分解字是準(zhǔn)分字,除了把設(shè)定部首、原形內(nèi)含字、蛻變還原內(nèi)含字進行排列外,還要把其它筆畫放在它們的后面并按照筆順進行前后排列,然后按照規(guī)則取碼;對漢字的組成結(jié)構(gòu)進行內(nèi)含字還原、分解、排列的過程中,若出現(xiàn)不同的分解型式,須以分解型式優(yōu)先順序原則為依據(jù);下面是對各規(guī)則的解釋一、基本原則(1)聯(lián)系狀態(tài)可分解原則漢字中的設(shè)定部首、原形內(nèi)含字或蛻變還原內(nèi)含字與周圍部分的聯(lián)系狀態(tài)有三種,即間隔狀態(tài)、接觸狀態(tài)、交錯狀態(tài),在間隔狀態(tài)或接觸狀態(tài)下可分解出設(shè)定部首、原形內(nèi)含字或蛻變還原內(nèi)含字,在交錯狀態(tài)下不能分解出設(shè)定部首、原形內(nèi)含字或蛻變還原內(nèi)含字;(2)部位排列優(yōu)先順序原則漢字分解后,產(chǎn)生的設(shè)定部首、原形內(nèi)含字和蛻變還原內(nèi)含字放在前,如果還有其它筆畫部份則放在它們的后面,分解出的設(shè)定部首、原形內(nèi)含字或蛻變還原內(nèi)含字依照其在漢字結(jié)構(gòu)中的部位也要進行前后排列,即上下結(jié)構(gòu)以上部在前,下部在后;左右結(jié)構(gòu)以左部在前,右部在后;內(nèi)外結(jié)構(gòu)以外部在前,內(nèi)部在后;對于結(jié)構(gòu)較復(fù)雜的母字,要先總分后細分,劃入筆畫部分的各種筆畫依據(jù)其書寫先后順序進行前后排列;(3)分解型式優(yōu)先順序原則在對漢字進行分解時,會出現(xiàn)不同的分解型式,分解型式優(yōu)先順序是三整分解→四整分解→……高整分解→三準(zhǔn)分解→四準(zhǔn)分解→……高準(zhǔn)分解→二整分解→二準(zhǔn)分解→一準(zhǔn)分解→純筆畫分解;(4)適宜后置原則在對漢字進行分解時,有的筆畫或部件既可以前置,也可以后置,應(yīng)本著后置的原則進行分解提取,此即適宜后置原則;(5)準(zhǔn)分解字的純筆畫部分適宜縮小原則對于準(zhǔn)分解字,經(jīng)過分解,會產(chǎn)生純筆畫部分,對于有的漢字,純筆畫部分可多可少,應(yīng)本著純筆畫部分縮小的原則進行分解;(6)筆畫“一”不能作為內(nèi)含字單獨提取原則在漢字中,“一”既可看作筆畫橫,又可看作內(nèi)含字“一yi”,為了編碼統(tǒng)一規(guī)范,“一”不能作為內(nèi)含字單獨提?。欢?、取碼規(guī)則對于一個漢字,首先依據(jù)基本原則,完成漢字的分解、排列,漢字的分解形式已經(jīng)確定,就可采用筆畫代碼、設(shè)定部首代碼、漢字音節(jié)首字母對漢字進行編碼,針對不同的分解形式,采用不同的編碼方法,每個漢字的漢字編碼,其第一碼均取該漢字的音節(jié)首字母,第二碼、第三碼、第四碼則依據(jù)規(guī)則從漢字中獲取,下面對各種類型的漢字編碼進行說明純筆畫分解字第一碼取漢字的音節(jié)首字母;第二碼取第一個筆畫代碼;第三碼取第二個筆畫代碼;第四碼取最末筆畫代碼;三整分解字、四整分解字及高整分解字第一碼取漢字的音節(jié)首字母;第二碼取第一個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;第三碼取第二個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;第四碼取最后一個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;三準(zhǔn)分解字、四準(zhǔn)分解字及多準(zhǔn)分解字第一碼取漢字的音節(jié)首字母;第二碼取第一個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;第三碼取第二個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;第四碼取最后一個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;純筆畫部分不參與取碼;二準(zhǔn)分解字笫一碼取漢字的音節(jié)首字母;第二碼取第一個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;第三碼取第二個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;第四碼取劃入純筆畫部分的第一個筆畫代碼;一準(zhǔn)分解字第一碼取漢字的音節(jié)首字母;第二碼取內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;笫三碼取劃入純筆畫部分的第一個筆畫代碼;第四碼取劃入純筆畫部分的最后一個筆畫代碼;二整分解字如果沒有同音內(nèi)含字,則第一碼取漢字的音節(jié)首字母;第二碼取第一個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;第三碼取第二個內(nèi)含字音節(jié)首字母或設(shè)定部首代碼;如果二整分解字有同音內(nèi)含字,則首先要依據(jù)基本原則對同音內(nèi)含字進行再分解,以便從中獲取由兩個字母組成的代碼,即同音內(nèi)含字代碼;同音內(nèi)含字的再分解有一準(zhǔn)分解和純筆畫分解,對于一準(zhǔn)分解的同音內(nèi)含字,同音內(nèi)含字代碼的第一個字母取再分解的內(nèi)含字音節(jié)首字母或設(shè)定部首代碼,第二個字母取劃入純筆畫部分的首筆畫代碼;對于純筆畫分解的同音內(nèi)含字,同音內(nèi)含字代碼的第一個字母取取劃入純筆畫部分的首筆畫代碼,第二個字母取取劃入純筆畫部分的末筆畫代碼,由此組成同音內(nèi)含字代碼;對于有同音內(nèi)含字的二整分解漢字,第一碼取漢字的音節(jié)首字母;其它三碼依據(jù)漢字分解后的排列順序分別取碼,同音內(nèi)含字取同音內(nèi)含字代碼,非同音內(nèi)含字取音節(jié)首字母,設(shè)定部首取設(shè)定部首代碼;
3.根據(jù)權(quán)利要求2所述的三優(yōu)碼漢字輸入法,其特征在于其詞組編碼規(guī)則為二字詞組的編碼,取每個字的漢字編碼的前兩個字母;三字詞組的編碼,取前兩個字的漢字編碼的第一個字母和最后一個字的漢字編碼的前兩個字母;四字詞組的編碼,取每個字的漢字編碼的第一個字母;多字詞組的編碼,取前三個字和最后一個字的漢字編碼的第一個字母。
全文摘要
本發(fā)明公開了三優(yōu)碼漢字輸入法,把組成漢字的筆畫確定為8種,對20個部首的代碼進行了設(shè)定,對漢字進行編碼時,首先對蛻變還原內(nèi)含字進行還原,然后根據(jù)各項基本原則進行優(yōu)先分解、按順序排列,最后采用筆畫代碼、設(shè)定部首代碼、漢字音節(jié)首字母依照取碼規(guī)則對漢字進行編碼,通過標(biāo)準(zhǔn)的英文輸入鍵盤,使?jié)h字實現(xiàn)鍵控輸入電腦,本發(fā)明編碼規(guī)范簡單、記憶量小、易學(xué)易記易用、便于普及。
文檔編號G06F3/023GK1749931SQ20051004495
公開日2006年3月22日 申請日期2005年10月22日 優(yōu)先權(quán)日2005年10月22日
發(fā)明者林寶忠 申請人:林寶忠