專利名稱::元碼漢字編碼輸入法的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種漢字編碼輸入法,尤其涉及一種元碼漢字編碼輸入法。
背景技術(shù):
:中國人經(jīng)過差不多三十年的研究,發(fā)明了很多很多的中文輸入法,典型的編碼思維有拼音、五筆、表形、筆畫、音首等等。這些輸入法各有各的長處,例如拼音易學(xué);五筆重碼處理較為理想,效率較高;表形思維可以不依賴于拼音,對(duì)眾多部件也不象五筆那樣需要很多記憶;筆畫編碼可以將部件數(shù)目降到幾個(gè)或幾十個(gè),因此,可以提高入門速度;取音首編碼思維易學(xué)方面象拼音,重碼也可以處理的較為理想。不過,中文的徹底信息化問題依然沒有徹底解決。本發(fā)明人認(rèn)為中文的信息化應(yīng)該以漢字的"音、形、義"為基礎(chǔ),可以將這些編碼元素在高階上統(tǒng)一于"音"和"類",在充分維護(hù)漢字的整體性和層次性的基礎(chǔ)上,可以實(shí)現(xiàn)字、詞和符號(hào)接近零重碼的輕松輸入。
發(fā)明內(nèi)容針對(duì)現(xiàn)有漢字編碼輸入法存在的問題和上述對(duì)漢字的認(rèn)識(shí)的基礎(chǔ)上,本發(fā)明的目的是提供一種元碼漢字編碼輸入法,實(shí)現(xiàn)漢字的字、詞和符號(hào)接近零重碼的計(jì)算機(jī)輸入。按照本發(fā)明的一種元碼漢字編碼輸入法,其特征在于取漢字的音首,作為該漢字的第一碼,輸入到計(jì)算機(jī);將漢字拆分成部件,按順序取各部件的音首,作為第2-4碼,輸入計(jì)算機(jī);所述的拆分采用二分原理漢字二分時(shí),以"一小一大"或"一大一小"進(jìn)行拆分,并且將含首畫部件放在前面,不含首畫部件放在后面;漢字二分后由細(xì)分規(guī)則判斷是否進(jìn)一步拆分,細(xì)分規(guī)則規(guī)定如下(1)上下或左右結(jié)構(gòu)字可分;(2)部首不分;(3)尾字音首與整字音首相同時(shí),尾字可分。按照上述的元碼漢字編碼輸入法,進(jìn)一步的特征在于單字全碼為4鍵,不足4鍵時(shí),不補(bǔ)足;當(dāng)漢字被拆分后形成的部件數(shù)目超過3個(gè)時(shí),則取前兩個(gè)部件和最后一個(gè)部件的編碼,作為該漢字的第2-4碼。按照上述的元碼漢字編碼輸入法,進(jìn)一步的特征在于采用移位技術(shù)將編碼從音首移位至韻首或移位至模糊鍵"V"和重字鍵"p"上。按照上述的元碼漢字編碼輸入法,進(jìn)一步的特征在于對(duì)于一部分漢字應(yīng)用二分、細(xì)分規(guī)則時(shí),不太直觀時(shí),應(yīng)用如下拆分規(guī)則(1)按書寫順序直觀地分為幾個(gè)部件,或(2)采用直接拆分為筆畫,或(3)不能拆分成兩個(gè)部件的漢字,取其音首和該筆畫的編碼作為該漢字的編碼。按照上述的元碼漢字編碼輸入法,進(jìn)一步的特征在于對(duì)于不能正常認(rèn)讀的部件歸為多個(gè)部件類。按照上述的元碼漢字編碼輸入法,進(jìn)一步的特征在于詞組取碼規(guī)則是:(l)二字詞,各取兩鍵編碼;(2)三字詞,各字先取一鍵,第四鍵補(bǔ)未字第二鍵;(3)四字和四字以上字,取前三字加尾字音首;(4)詞組中一鍵字的缺省編碼由"v"代替。按照上述的元碼漢字編碼輸入法,進(jìn)一步的特征在于定義空格為主上屏鍵,分號(hào)為輔上屏鍵;所說主上屏鍵指將候選窗口中排在第一位的字確認(rèn)上屏;所說輔上屏指將候選窗口中排在第二位的字確認(rèn)上屏。具體實(shí)施例方式元碼漢字編碼方法為元碼漢字編碼輸入法中的主要內(nèi)容,主要解決常見GB2312字符集中6763個(gè)漢字的接近零重碼的輕松高效輸入問題。其技術(shù)構(gòu)成如下一、單字編碼對(duì)于單字,采用如下編碼規(guī)則取漢字的音首,若要求移位時(shí),則取移位碼(韻首,模糊衝、",重字,p'0,作為該漢字的第一碼,并在標(biāo)準(zhǔn)的鍵盤上將該碼輸入到計(jì)算機(jī);按元碼拆分原則,將漢字拆分成部件,按順序取各部件的音首,若要求移位時(shí),則取移位碼(韻首,模糊鍵"v",重字鍵"p"),作為第2-4碼,輸入計(jì)算機(jī);單字全碼為4鍵,不足4鍵時(shí),無需補(bǔ)足4鍵。若部件數(shù)目超過3個(gè)時(shí),則取前兩個(gè)部件和最后一個(gè)部件編碼。1.1拆分漢字經(jīng)拆分過程形成部件。元碼中拆分漢字的基本原理是二分原理。1.1.1二分原理漢字二分時(shí),以"一小一大"或"一大一小"為美,并且將含首畫部件放在前面,不含首畫部件放在后面。例如矢—〗天—印t注如果將"矢"分為"—大",則"沒有比">!"小,"大"也沒有比"天"大。將"J"部件放在前面是因?yàn)椋?J"是"矢"字的首畫;將"天"放在后面,因?yàn)?天"中不含首畫。1.1.2細(xì)分規(guī)則漢字二分后由細(xì)分規(guī)則判斷是否進(jìn)一步拆分。細(xì)分規(guī)則規(guī)定如下(1)上下或左右結(jié)構(gòu)字可分;例如程—禾呈—禾口王—chkw盟一明皿—曰月皿—mrym(2)部首不分;例如集—隹木—jzm注"隹(zhfii)"為短尾巴鳥的總稱,是一個(gè)很常見的部首。要確定一個(gè)部件是否是部首可以參照《現(xiàn)代漢語字典》中的部首索引。(3)尾字音首與整字音首相同時(shí),尾字可分。例如姨一女夷一女大弓一yndg1.1.3補(bǔ)充規(guī)定大多數(shù)漢字都可以用以上規(guī)則將一個(gè)漢字拆分為二至三個(gè)部件,還有一部分漢字應(yīng)用二分、細(xì)分時(shí),不太直觀。因此,需要適當(dāng)說明如下(1)可以按書寫順序直觀地分為幾個(gè)部件。例如惠—亡口月貝凡一亡口凡—ywkf注編碼時(shí)一般只取4鍵。(2)可以適當(dāng)采用直接拆分為筆畫的策略。例如韋—一一乙I(3)不能拆分成兩個(gè)部件的漢字,比如一筆畫漢字"一"、"乙"等,取其音首和該筆畫的編碼作為該漢字的編碼。也可以將其作為一鍵字或準(zhǔn)一鍵字處理。1.2移位移位技術(shù)是元碼漢字編碼方法中分散重碼的核心技術(shù)。移位指將編碼從音首移位至韻首或移位至模糊鍵"V"和重字鍵"P"上。具體如下a上三(鄉(xiāng)〈《…)山曰互)長(縣)羊(,興...)u水(?氺…)豎(IJ)川與雨i地交(十乂L大…)示(凈)絲(纟糸)衣(凈...)o有鉤(勺門5刊尤無…)走OJ又手(矛,)e這折(乙^3L"飛h…)v為(^北非林卵卯^舛躬行圭爻兆卄車...)P重(聿禺夬朿市尤-...)見到"上三山長羊"類,就打"a",見到"水豎川與雨"類,就打"u",其余類推。現(xiàn)舉"山"字為例山—IU(開口框)—auk注"山"字的音首是"s",在編碼時(shí)移位至韻首"a";"I"也是從"s"移位至韻首"u";"U"為一個(gè)部件類,叫"開口框(k)"。1.3部件漢字經(jīng)拆分后形成的部件有如下幾種1.3.1筆畫筆畫指構(gòu)成楷書漢字字形的最小連筆單位。按習(xí)慣歸納為下列五種:<table>tableseeoriginaldocumentpage12</column></row><table>1.3.2部件一般情況下按約定俗成的習(xí)慣認(rèn)讀。例如:<table>tableseeoriginaldocumentpage12</column></row><table><table>tableseeoriginaldocumentpage13</column></row><table>注"久"叫折文,"夂"叫反文;"IS"叫雙耳朵,"P"叫單耳朵,"Q"叫彎耳朵;,叫寶蓋,"""叫秀寶蓋。另"興"并入"羊"。1.3.3部件類部件類指具有相同特征的一類部件的總稱。元碼中15個(gè)重要的部件類如下(1)模糊對(duì)稱(V):^卓外卄灘雙北……模糊對(duì)稱指左右或上下相似的一類結(jié)構(gòu)。例如鼎—目-->dmv街—行圭—jvv癸—^天一gvt(2)部件交重(p):聿禺夬朿巿尤夷......部件交重指兩部件交叉重疊的一類結(jié)構(gòu)。例如妻—女—qpn庸—廣--》ygp寨—^木—zbpm(3)有鉤組合(o):勺尤門刊無......有鉤組合指有筆畫鉤的一類結(jié)構(gòu),通常都沒有讀音。例如句—勺口—jok周—門吉—zoj既—艮無—jgo(4)一筆串兩筆(c):卄卄升……一筆串兩筆指一筆畫串兩筆畫的一類結(jié)構(gòu)。例如?!獏`—zcn戈—卄、—gen書—卄、—sen升—〗升—印c毛—J升—mpc手—J升—opc(5)兩筆相交(i):十乂大1_......兩筆相交指兩筆畫相交的一類結(jié)構(gòu)。例如丼—十升—hic艾—卄乂—aci建—聿1_—jpi左—大工—zig(6)—筆串三筆(f):豐韋卅......一筆串三筆指一筆畫串三筆畫,以"豐"字作代表。例如:帶—卅n巾~>dfbj艷—豐色—yfs戔—豐、—jfn(7)兩筆相連(1):丁卜〃4"......兩筆相連指兩筆畫相連的一類結(jié)構(gòu)。例如收—4夂—slw面—尸囬—mlh萬—萬乙—wle(8)有戈組合(g):戈弋戔1戊......有戈組合指有"弋"的一類部件。例如代—4弋—drg越—走戊—yog載—1車—zgc(9)有止組合(z):止疋棄正足......有止組合指有"止"的一類部件。例如捷4棄—joz疏—jE—>szu蛋—疋蟲—dzc鵬有戊組合(w):戊戍戌成咸臧......有戊組合指有"戊"的一類部件。例如盛—成皿—swm感—咸心—gwx威—戊一女—wwhn(U)土結(jié)構(gòu)(t):土士干千于乇土結(jié)構(gòu)指"土"變形或旋轉(zhuǎn)后的一類結(jié)構(gòu)。例如遷—千L—qto志—士心—ztx宅—^乇—zbt⑩米結(jié)構(gòu)(m):>|丌......米結(jié)構(gòu)指">1"部件旋轉(zhuǎn)后形成的四個(gè)部件。例如:將—>|夕寸—jmxc前—4月U—qmyd乍——-->zlm興—、"丌—xxm肪三橫三撇三折三點(diǎn)(a):三多(((......王—*三I—wau須—鄉(xiāng)頁—xay巢—《《果—cag心—匕—xae(M)二橫二撇二折二點(diǎn)(e):二〈〈……麥—朿-->zpe勿—勺^—>woe云~>二厶—yes粼—米舛〈<—linve腿"八,,旋轉(zhuǎn)(b):八?、/……冰—?水—bbu關(guān)—、/天—gbt飛—飛八—feb兵—丘八—bqb通過上述單字編碼規(guī)則進(jìn)行的漢字編碼,舉例如下:例一4歹lrdd如—女口—rnk第—m_^dvp二—--ehh至—一厶土—zhst四—口兒—sfe取—耳又—qeo部—立口P—bike件—/f牛—jrn芭—卄巳I—bcsu修—4I鄉(xiāng)—xrua二、詞組編碼(1)二字詞各取兩鍵編碼。例如幫助—幫豐助且一bfzq(2)三字詞各字先取一鍵,第四鍵補(bǔ)未字第二鍵。例如為什么—為什么J—vsmp(3)四字和四字以上字取前三字加尾字音首。例如愛屋及烏—awjw中國科學(xué)院—zgky(4)詞組中一鍵字的缺省編碼由"V"代替。例如:我們—我們4—wvmr三、鍵盤布局與定義3.1功能鍵3.1.1"v"鍵為符號(hào)鍵和常用詞鍵?!獀j......—VS---vp起來一vql3.1.2"o"為序數(shù)鍵(Order)(1)定義下列十一個(gè)字母為元碼數(shù)字鍵一"二—e三—a四一s五—w六—1七—q八—b九—j十一i〇—o.—d(2)序數(shù)字編碼舉例①—oyo②—oeo③—oao④—oso⑤—owo⑥一olo⑦—oqo—obo⑨一ojo⑩—oio3.1.3"e"為地理鍵(Earth)北京一eb中國一ez香港—ex天津一wtj3.1.4"u"為人名和稱呼鍵爸爸—ub媽媽一um爺爺—uy哥哥—ug教授—ujs3.1.5"i"為上下文連詞和時(shí)間鍵可以—ik因?yàn)橐籭yv所以一isy下午—ixw今天一ijt3.1.6符號(hào)中文中有大量的符號(hào),目前一般輸入法除直接定義了若干標(biāo)點(diǎn)符號(hào)外,其余的符號(hào)一般用軟鍵盤來輸入,這種方法費(fèi)時(shí)、費(fèi)力。元碼中符號(hào)輸入與漢字輸入一樣方便。3.1.6.1"v"鍵定義為符號(hào)鍵,接著輸入符號(hào)讀音的音首或韻首,就可以定義許多符號(hào)。例如?!獀j(句號(hào)):—vm(冒號(hào))!—vt(嘆號(hào))—vw(問號(hào)),~>vc(comma)-^vp(破折號(hào))..….—vs(省略號(hào))%—vb(百分)96o—vq(千分)W空—vno—vovk(空格)3.1.6.2利用e、u、o、v、i五個(gè)字母的兩兩組合來定義成組成對(duì)的常用符號(hào)。例如uiiuuo,—ouC—uu)—ii《~>eu》—ueev—ve3.1.6.3"o"鍵定義序數(shù)鍵,用于表示序數(shù)符號(hào)。例如:①—oyo②—oeo③—oao(1)一ooy(2)—ooe(3)~>ooal.—oyd12.—oiedI—oyl(羅馬)X—oil3.2上屏鍵<table>tableseeoriginaldocumentpage20</column></row><table>例如I,內(nèi)2.難3*4.人注"內(nèi)"字排在第一位,用空格上屏;"難"字排在第二位,用分號(hào)鍵上屏<table>tableseeoriginaldocumentpage20</column></row><table>注"善"字排在第一位,用空格上屏;"叔"字排在第二位,用分號(hào)鍵上屏。四、簡(jiǎn)碼輸入為了快速輸入常用字,可在只輸入一鍵或二鍵時(shí)將常用字排在首位,并通過按上屏鍵(主上屏鍵或輔上屏鍵)即可輸入該漢字。4.1一鍵字abcdefg,上不出的這發(fā)國,hijk1mn。和地經(jīng)開了民內(nèi)。pqr,stu;平氣人,是同水;vwx,yzo0為我小,一在有。4.2準(zhǔn)一鍵字abcdefg,凹本成當(dāng)非故,hijk1mn。乎今快兩面難。pqr,stu;片求肉,時(shí)凸;vwx,yzoo未想,意則。五、非成字部件的輸入非成字部件直接打部件的編碼査詢輸入。例如:十—X以上對(duì)元碼漢字編碼輸入法進(jìn)行了詳細(xì)說明,應(yīng)該注意的是本元碼漢字編碼輸入法的并不局限性于上述的描述,本專業(yè)內(nèi)的技術(shù)人員在不脫離本發(fā)明基本思想情況下很容易對(duì)其進(jìn)行改動(dòng)。因此,本發(fā)明的保護(hù)范圍應(yīng)由權(quán)利要求確定。權(quán)利要求1、一種元碼漢字編碼輸入法,其特征在于取漢字的音首,作為該漢字的第一碼,輸入到計(jì)算機(jī);將漢字拆分成部件,按順序取各部件的音首,作為第2-4碼,輸入計(jì)算機(jī);所述的拆分采用二分原理漢字二分時(shí),以“一小一大”或“一大一小”進(jìn)行拆分,并且將含首畫部件放在前面,不含首畫部件放在后面;漢字二分后由細(xì)分規(guī)則判斷是否進(jìn)一步拆分,細(xì)分規(guī)則規(guī)定如下(1)上下或左右結(jié)構(gòu)字可分;(2)部首不分;(3)尾字音首與整字音首相同時(shí),尾字可分。2、按照權(quán)利要求1的元碼漢字編碼輸入法,其特征在于單字全碼為4鍵,不足4鍵時(shí),不補(bǔ)足。3、按照權(quán)利要求1的元碼漢字編碼輸入法,其特征在于當(dāng)漢字被拆分后形成的部件數(shù)目超過3個(gè)時(shí),則取前兩個(gè)部件和最后一個(gè)部件的編碼,作為該漢字的第2-4碼。4、按照權(quán)利要求1的元碼漢字編碼輸入法,其特征在于采用如下移位技術(shù)將編碼從音首移位至韻首或移位至模糊鍵"V"和重字鍵"p"上,具體如下<formula>formulaseeoriginaldocumentpage2</formula>5、按照權(quán)利要求1-4的元碼漢字編碼輸入法,其特征在于對(duì)于一部分漢字應(yīng)用二分、細(xì)分規(guī)則時(shí),不太直觀時(shí),應(yīng)用如下拆分規(guī)則編碼((1)按書寫順序直觀地分為幾個(gè)部件,或(2)采用直接拆分為筆畫,或(3)不能拆分成兩個(gè)部件的漢字,取其音首和該筆畫的編碼作為該漢字的6、按照權(quán)利要求1-4的元碼漢字編碼輸入法,其特征在于對(duì)漢字的筆畫進(jìn)行如下編碼:<table>tableseeoriginaldocumentpage3</column></row><table>7、按照權(quán)利要求1-4的元碼漢字編碼輸入法,其特征在于:對(duì)漢字拆分后的部件進(jìn)行如下編碼<table>tableseeoriginaldocumentpage3</column></row><table><table>tableseeoriginaldocumentpage4</column></row><table>8、按照權(quán)利要求1-4的元碼漢字編碼輸入法,其特征在于對(duì)于不能正常認(rèn)讀的部件歸為15個(gè)部件類(1)模糊對(duì)稱(V):^阜^卄^B雙北......所說模糊對(duì)稱指左右或上下相似的一類結(jié)構(gòu);(2)部件交重(p):聿禺夬朿巿尤夷......所說部件交重指兩部件交叉重疊的一類結(jié)構(gòu);(3)有鉤組合(0):勺尤門刊無......所說有鉤組合指有筆畫鉤的一類結(jié)構(gòu),通常都沒有讀音;(4)一筆串兩筆(C):卄卄升......所說一筆串兩筆指一筆畫串兩筆畫的一類結(jié)構(gòu);(5)兩筆相交(i):十乂大1_......所說兩筆相交指兩筆畫相交的一類結(jié)構(gòu);(6)—筆串三筆(f):豐韋辨......所說一筆串三筆指一筆畫串三筆畫,以"豐"字作代表;(7)兩筆相連(1):丁卜1萬……所說兩筆相連指兩筆畫相連的一類結(jié)構(gòu);(8)有戈組合(g):戈弋戔l戊......所說有戈組合指有""t"的一類部件;(9)有止組合(z):止疋素5足......所說有止組合指有"止"的一類部件;卿有戊組合(w):戊戍戌成咸臧......所說有戊組合指有"戊"的一類部件;ai)土結(jié)構(gòu)(t):土士干千于乇所說土結(jié)構(gòu)指"土"變形或旋轉(zhuǎn)后的一類結(jié)構(gòu);⑩米結(jié)構(gòu)(m):4丌......所說米結(jié)構(gòu)指"4"部件旋轉(zhuǎn)后形成的四個(gè)部件;03)三橫三撇三折三點(diǎn)(a):三多《〈......所說三橫三撇三折三點(diǎn)指三個(gè)橫、撇、折和點(diǎn)的筆畫;(H)二橫二撇二折二點(diǎn)(e):二〈〈......所說二橫二撇二折二點(diǎn)指二個(gè)橫、撇、折和點(diǎn)的筆畫;05)八旋轉(zhuǎn)(b):八7、/......所說八旋轉(zhuǎn)指"八"旋轉(zhuǎn)后形成的四個(gè)方向的部件。9、按照權(quán)利要求1-4的元碼漢字編碼輸入法,其特征在于一般符號(hào)用符號(hào)鍵"v"按讀音編碼輸入;成對(duì)成組的符號(hào)用"e、v、u、o、i"五鍵兩兩組合編碼輸入;序數(shù)符號(hào)用序數(shù)鍵"o"按符號(hào)讀音的取音首輸入。10、按照權(quán)利要求1-4的元碼漢字編碼輸入法,其特征在于定義ll個(gè)鍵為元碼數(shù)字鍵一"-y二—e三—a四—s五—w六—1七—q八一b九—j十一i0—0.—d11、按照權(quán)利要求1-4的元碼漢字編碼輸入法,其特征在于詞組取碼規(guī)則是(1)二字詞,各取兩鍵編碼;(2)三字詞,各字先取一鍵,第四鍵補(bǔ)未字第二鍵;(3)四字和四字以上字,取前三字加尾字音首(4)詞組中一鍵字的缺省編碼由"v"代替。12、按照權(quán)利要求1-4的元碼漢字編碼輸入法,其特征在于定義5個(gè)功能鍵來簡(jiǎn)化詞組輸入的編碼"V"鍵為符號(hào)鍵和常用詞鍵"o"為序數(shù)鍵(Order)"e"為地理鍵(Earth)"u"為人名和稱呼鍵"i"為上下文連詞和時(shí)間鍵。13、按照權(quán)利要求1-4的元碼漢字編碼輸入法,其特征在于定義空格為主上屏鍵,分號(hào)為輔上屏鍵;所說主上屏鍵指將候選窗口中排在第一位的字確認(rèn)上屏;所說輔上屏指將候選窗口中排在第二位的字確認(rèn)上屏。14、按照權(quán)利要求1-4的元碼漢字編碼輸入法,其特征在于定義一鍵字共有26個(gè)abcdefg上不出的這發(fā)國hijk1mn和地經(jīng)開了民內(nèi)pqr,stu平氣人,是同水vwx,yzo為我小,一在有所說一鍵字指編碼只有一鍵,且用空格上屏的字。15、按照權(quán)利要求1-4的元碼漢字編碼輸入法,其特征在于定義準(zhǔn)一鍵字有22個(gè)abcdefg凹本成當(dāng)非故hijk1mn乎今快兩面難pqr,stu片求肉,時(shí)凸vwx,yzo未想,意則所說準(zhǔn)一鍵字指編碼只有一鍵,且用輔上屏鍵上屏的字。全文摘要一種元碼漢字編碼輸入法,其特征在于取漢字的音首或韻首(定義中的25個(gè)需要移位的字),作為該漢字的第一碼,輸入到計(jì)算機(jī);將漢字拆分成部件,按順序取前兩個(gè)部件和尾部件的音首或韻首(定義中的25個(gè)需要移位的字以及相關(guān)部件),作為第2-4碼,輸入計(jì)算機(jī);所述的拆分一般采用二分原理漢字二分時(shí),以“一小一大”或“一大一小”進(jìn)行拆分,并且將含首畫部件放在前面,不含首畫部件放在后面;漢字二分后由細(xì)分規(guī)則判斷是否進(jìn)一步拆分,細(xì)分規(guī)則規(guī)定如下(1)上下或左右結(jié)構(gòu)字可分;(2)部首不分;(3)尾字音首與整字音首相同時(shí),尾字可分。對(duì)于不能二分的漢字,基礎(chǔ)部件字允許拆分為筆畫,其余可以按書寫順序直接拆分為部件。文檔編號(hào)G06F3/023GK101187835SQ20061013848公開日2008年5月28日申請(qǐng)日期2006年11月17日優(yōu)先權(quán)日2006年11月17日發(fā)明者吳宗怡,健閆申請(qǐng)人:吳宗怡