專利名稱::優(yōu)先用于手機的英文字母及漢字的數(shù)字編碼的制作方法優(yōu)先用于手機的英文字母及漢字的數(shù)字編碼所屬發(fā)明領(lǐng)域本發(fā)明涉及一種優(yōu)先用于手機的中、英文字輸入的方法一個能夠抵消用手機鍵盤輸入中英文的先天性劣勢的英文字母的數(shù)字編碼。一組髙效易學(xué)的手機及電腦兼用的漢字的音碼、形碼及音形碼。
背景技術(shù):
:目前公認的以T9為代表的文字輸入法將十個數(shù)字轉(zhuǎn)換成26個英文字母,是一種粥少僧多的轉(zhuǎn)換方法,而不是真正意義上的英文字母數(shù)字編碼。在此基礎(chǔ)上的漢字音碼輸入,自然笨拙不堪。即使具有以3G為后盾的智能化支持,而使煩惱有所減少,但問題未見根本性的解決。因此也沒有很好克服用手機鍵盤輸入中英文的明顯劣勢。例如,在英文輸入中,對于較長的單詞,對于一些半年內(nèi)新流行的英文字母縮寫詞,特別是用到大寫字母時,是麻煩,也常有無奈。如今,隨著P鵬hMaa等手機業(yè)務(wù)的逐步普及力手機文字輸入的要求也愈來愈高,市場上越來越需要新的、具有創(chuàng)新性的解決方案。不少帶有qwert鍵盤的手機已經(jīng)問世,就是在這樣的背景下產(chǎn)生的。但是,qwert鍵盤的引進,與手機的概念,存在著不小的矛盾。另外,在手機數(shù)字鍵盤上,對漢字進行數(shù)字編碼,離不開對音碼、形碼或音形碼的選取。而現(xiàn)有的音形碼有著各自的瓶頸問題,隨著本碼對這些瓶頸問題的克服,將是qwert鍵盤的制勝對手。由于它的高效易學(xué),果然是為手機采用的首選,也將為電腦的漢字輸入的盲打,甚至于單手盲打做出貢獻。本發(fā)明解決其技術(shù)問題所采用的三個技術(shù)方案是英文字母的數(shù)字編碼、極三、極五漢字音、數(shù)碼及S+1形碼三個編碼方案。另有拼音碼在QWERT鍵盤上增加聲調(diào)而不增碼長的附加方法,5+l形碼在QWERT鍵盤上實現(xiàn)時,第二形碼的分步完成的附加方法。一,兩組英文字母的數(shù)字編碼方案。分別供專門輸送英文及兼有輸送中英文之用。見下表。1一1,ttil用于英文的字符的數(shù)字編碼方案的表<table>tableseeoriginaldocumentpage3</column></row><table><table>tableseeoriginaldocumentpage4</column></row><table>數(shù)字每個數(shù)字前添恥,例如062表2本方案在手機英文輸入中的有益效果是,以不超過兩個數(shù)字對字母及常用符號進行唯一性編碼,換得了一學(xué)就會的單手盲打。其便捷程度抵消了用手機鍵盤輸入英文文本的先天性劣勢。并以超過qwert鍵盤的流暢性來與其抗衡。2.1極三碼的組成。本碼取碼的極大個數(shù)為三個。聲母碼一個,韻母碼最多兩個。現(xiàn)有的拼音輸入法各存在著不同的問題。全拼輸入因其強大的智能化組詞功能,(例如兩鍵三鍵成兩字詞,多宇詞的輸入),克服了重碼太多的劣勢,在易學(xué)的北方地區(qū)得到了較好的推廣。但是,其韻母字母數(shù)最多可達4個,一個漢字的字母輸入數(shù)最多可達6個,畢竟影響了輸入速度,同時也為其轉(zhuǎn)換成數(shù)字的漢字編碼增加了困難。有一種雙拼法用一個字母為韻母編碼,正在淡出使用。究其原因,記憶有一定難度是一個因素。另一個因素是,由于它缺乏區(qū)分聲母、韻母的功能,上述強大的智能化組詞功能如用在雙拼法中,將會重碼太多,因而不可能做大。有鑒于此,提出拼音漢字的編碼及其數(shù)字編碼方法。2丄1巻舌聲母的簡化對雙字母聲母zh、ch、sh,有兩種簡化辦法。一種是簡化為i、o置于、u;—種是簡化為z、c、s,而用大寫Z、C、S相應(yīng)的替換非巻舌聲母(或者反過來用)。2丄2韻母的簡化我們把復(fù)合韻母分成前、尾兩部。尾部有7種情況a、e、i、o、u、n、ng,ng取碼為v。去了尾部就成前部。對前部的取碼也很簡單。ia取碼為e,ua取碼為o。其它為兩種省略-n表en,v表eng:—種兼用ev既表iang,也表uang;一種個案eu表示韻母迂。2.丄3拼音碼在QW1RT鍵盤上增加聲調(diào)而不增碼長的方法。不加聲調(diào)的拼音是不完整的。當(dāng)前大部分的全拼拼音輸入碼卻沒有聲調(diào)。究其原因,是受到增加碼長的壓力。這里提供一個增加聲調(diào)而不增碼長的方法。以極三碼為例,其第二碼有aevniou7個字母。它們所在位置的列有4個字符,分屬于四行。屬于Q療的是第一聲,數(shù)字行的是第二聲,A行的是第三聲,Z行的是第四聲。例如省字是第三聲,取v所在的列,在A行上的字母f為碼。即省字的碼是sf。2..2極五碼(數(shù)字)的組成本碼取碼的極大個數(shù)為五個。將上述的對拼音字母的數(shù)字編碼,用于極三碼,并將依次代表四聲的聲調(diào)碼O、1、2、9作為可選擇的尾鍵,就成了極五碼。另外,對于單韻母字如俄阿噢等,在輸入時前面要加o。本方案中的漢字音碼的有益效果是,1,對韻母的前部、尾部分解方法,是符合發(fā)聲規(guī)律的方法,自然地縮短碼長,其可讀性可與全拼碼等同,能對當(dāng)前的全iMft秀輸入法,起到更優(yōu)化的作用。也有利于南方人在使用中學(xué)習(xí)推廣漢字拼音。2,增加聲調(diào)而不增碼長的方法,大大提高輸入效率,本方案在用數(shù)字輸入漢字的有益效果,體現(xiàn)在手機上做到了使用流暢。由于其完全的可讀性,在適當(dāng)?shù)嘏湟钥崭穸禾柕乳g隔符后,有著巨大的手機拼音通訊開發(fā)前景。三,5+l數(shù)字形碼評定漢字編碼優(yōu)劣有三個標準,易學(xué)、易用和重碼少。其中有三大瓶頸問題。第一,為了使重碼減少,選入碼中的部件數(shù)應(yīng)該多取。但是部件數(shù)多取了,就出現(xiàn)了不易學(xué)不易記的問題。第二,為了使重碼減少,定出一些易學(xué)但不易用的、或者易用但不易記的取碼規(guī)則。第三是漢字的拆分問題。由于不少漢字的筆畫,處于犬牙交錯的狀態(tài),根本無法提出一個規(guī)則。例如,果、串、申、吏、耕這五字的拆分,就會難倒眾多的碼家軍師。本碼在易學(xué)易用的前提及計算機軟件的支持下,經(jīng)反復(fù)篩選,在保留傳統(tǒng)筆形入碼的同時,對所有相交、相接及錢筆形定義為粘連筆形,并采用了新創(chuàng)的宏觀分^^對其編定數(shù)碼;還將易學(xué)的漢字中fi^性指標,橫筆艦字型雜引入碼中??梢哉fSH大瓶頸問題得到了克服。本碼在一級國標漢字(375S個)中重碼只有l(wèi)22個。重碼率為3.12%。。而且三字重碼只有三組。(一、二級國標漢字6763個的重碼率為7.0%)在繁體中重碼字為l40個,加以本碼取碼基本上是首尾格局,而繁體字的繁復(fù)難取部分大多位于內(nèi)部,取碼時較少涉及,取碼的流暢性不在簡體字之下。所以本碼是簡繁通用。3.05+1形碼部件及其編碼漢字由五類單筆劃組成。這些單筆劃還組成了各種筆形。那些被賦予了碼的筆形稱之為部件。首先對十?dāng)?shù)碼部件表進行說明。3.01本碼取10個數(shù)字進行編碼.。表中漢字聯(lián)想一欄,對漢字數(shù)字賦予了相應(yīng)的數(shù)字碼。本欄的聯(lián)想數(shù)字所含筆形有著幫助記憶的作用。例如,立字去橫是六的聯(lián)想,其碼也為六等等o3.02單筆畫一欄,是五種筆劃中橫豎撇點折(彎)的編碼,但把逆時針折拿出來另定碼為73.3復(fù)筆畫粘連形之角框形一欄,定義了一類部件,是由兩筆畫、多筆畫的端相接而構(gòu)成的筆形。其碼以首筆劃的碼為準。也可以說這是"碼"首是瞻法。其各種筆形列于其所屬碼的行中。3.04復(fù)筆畫粘連形之簡單交形一欄,將交形分成三類,斜交、帶折交和十形交。九字本應(yīng)屬于帶折交類,因為數(shù)字聯(lián)想已取碼為9,只能與十形交同處。3.0S復(fù)筆畫離散形一欄,對小字形、三點水、立刀及點下橫、雙折、八字形、點下折六種離散筆形各賦予碼3、4、6、7、8、0。各類離散筆形還有其本身的近似聯(lián)想筆形列于表中。在表中的約90個部件,除小字形的碼是3,斜交形的碼是6、雙逆折形的碼是7,需要略作記憶外,其它均有聯(lián)想可依。例如在碼6這一行中,由漢字六聯(lián)想到立,由此可以聯(lián)想到立刀的碼是6。即使是點下折的碼是O,也可以從零字中含有它而得到聯(lián)想,而點下角是點下折的聯(lián)想。在介紹完表一中的部件以后,還要介紹至關(guān)重要的一類部件。3.06衍生筆形,由角框形及簡單交形交重而成??煞殖啥嘟恍?、交角框形、角框交形三類。帶交帶角框且首碼成交的稱為交角框形,帶交帶角框且首碼成角框的稱為角框交形。、這類筆形的碼以首筆劃的碼為準,下面將其各種筆形列于其所屬的數(shù)碼下。2巾中由甲申史曲,里字的首碼,更字的尾碼,離、禹等字中含。3叟字首碼。5子。6丈井升吏,舂夫丹在等字的首碼,匆孝姊等字的尾碼。7女尹車弗毋,母戈貫東等字的首碼,毛字的尾碼,淺字中含。9凈豐韋丸世,甫曹青等字的首碼,肺年等字的尾碼,我舞垂重等字的第二碼。以上所列51個幾乎已經(jīng)窮盡了所有的衍生筆形.,無論筆畫如何的犬牙交錯,也只是一個部件。交接筆形不拆分,這就為漢字拆分掃清了一大障礙。況兼毫無記憶其碼為何之苦,唯'碼,首是瞻可也。3.0.7漢字的橫挑筆數(shù)特征碼,簡稱橫+1碼。取字的橫筆、挑筆數(shù)為碼。若是左右形的字,則加1。取該碼時得數(shù)若超過8,取碼為8。橫+1碼為0時改取8。由于橫筆數(shù)為7、8的字,在一級碼中約占10%,所以記憶負擔(dān)不大。表一十?dāng)?shù)碼部件表<table>tableseeoriginaldocumentpage6</column></row><table>本方案在用數(shù)字輸入漢字的有益效果是,由于形碼的易學(xué)易用重碼又少,在有利于組詞功能的強大性的同時,不需要專門的學(xué)習(xí),越打越熟,極大地滿足了單手盲打的需求。3.l定長6碼的編碼方法。首先,第六碼是固定的橫數(shù)碼。所以正好5碼的字,不必說編碼方法了。3.11超過S碼的字。選定S碼的規(guī)則,分為兩種情況。先將字分成兩大類型。1,左右型;2,非左右型,凡不屬于l類就是非左右型的。A,非左右型字的取碼規(guī)則很簡單,首三末二即可。即對一個字從頭按筆顢連取三碼后,最后兩碼來自最后兩部件。B,左右型字的取碼規(guī)則。首先要提出部件單元的概念。不超過7筆畫的部首及不超過5筆畫的字,稱為部件單元。右部若僅由一個部件單元構(gòu)成,稱為簡單右部;否則稱為復(fù)雜部件。左右型字的取碼規(guī)則分兩種取碼情況1,簡單右部情況,左部連取三碼,右部取其首尾兩碼。簡稱為左三右首尾。2,復(fù)雜右部情況,左部取二碼,右部取首M三部件為碼。簡稱為左二右三。3.12四碼字,下面提出補成五碼的規(guī)則。第五碼的補碼稱為過濾筆畫數(shù)碼,簡稱筆數(shù)碼。取字的筆畫數(shù)為碼;當(dāng)字的筆畫數(shù)大于9,把位于前列的筆畫'過濾'掉,找出該字所含的一個留有末部件的筆形。這個筆形可以是字,可以是部首,也可以是末部件本身,但是筆畫數(shù)仍不能大于9。用其中的最大的筆畫數(shù)為碼。另外筆畫數(shù)等于8時,取0為碼。一般提到字的筆畫數(shù)就頭痛,因為它易學(xué)但不易記。但在本編碼的一級GB字符集中,第五碼需要補碼的只有1506個左右,而其中約l柳個字的筆畫數(shù)不超過7,約2柳個字的筆畫數(shù)是8,是易記的。而筆畫太多的字約l抑個,經(jīng)<過濾'后也好記??傆洃涁摀?dān)不大。3.13三碼字,第五碼的補碼同上.下面提出補第四碼的方法。第四碼的補碼稱為字型碼。先將字分成左右型及非左右型。字型碼的真體規(guī)定如表二。對于1碼的字,取字的末筆劃為第二碼,第三碼一律取0。例如九950世970。無第二筆劃的,重復(fù)第一筆劃取碼,例如乙5鄰。對于兩碼的字,可取末筆劃為第三碼。例如牛392。再按照上述第四第五碼的補碼取法,就完成了該字的編碼。表二字型碼表<table>tableseeoriginaldocumentpage7</column></row><table>3.2本碼在QWERT鍵盤上的實現(xiàn)~"三鍵半碼鍵盤的行列命名。鍵盤由四行、十列組成,行分別命名為z行、a行、q行及數(shù)字行,列分別命名為l列、2列、"*0列。用行列組合法將原來每字6碼分成三對組合,即第一、二碼,第三、四碼及第五、六碼三對。第一、三、五碼取的數(shù)對應(yīng)著鍵盤上1至9、0十個列,另外的碼對應(yīng)著三個或四個行,這樣,一對碼對應(yīng)著一個鍵,就可壓縮成三鍵。具體對每對取碼方法說明如下。第一、二碼對,這里的行列化方法有一個新穎特征是對第二個形碼作分步處理。第一步,第一形碼對應(yīng)著1至9、0十個列,當(dāng)?shù)诙未a取數(shù)為1、2、i時,它對應(yīng)著的是z、a、q列。其中x表示2以上的數(shù)及0。第二步將第二形碼作為可選的第四鍵。這可選的第四鍵可簡稱為半鍵,三鍵半碼由此得名。第三、四碼對,還是第三形碼對應(yīng)著1至0十個列,當(dāng)?shù)谒男未a取數(shù)為l、2、3、4(含9)時,它對應(yīng)著的是z、a、q列及數(shù)字列;取數(shù)為S、6、7、8(含0)時,它對應(yīng)著的是Z、A、Q列及數(shù)字列(按Sh敏〉。第五、六碼對,第三形碼對應(yīng)著1至0十個列,當(dāng)?shù)诹未a取數(shù)為l、2、3、4時,它對應(yīng)著的是z、a、q列及數(shù)字列;取數(shù)為S、6、7、8時,它對應(yīng)著的是Z、A、Q列及數(shù)字列(按SWft)。四,系列漢字數(shù)字音形碼。拼音輸入法的強大的智能化功能實際并未解決重碼問題。音形碼是解決重碼問題而又不影響音碼強大智能化功能的理想選擇。當(dāng)前音形碼大多還沒有專門面向手機,在前面音、形碼的基礎(chǔ)上,這里提供的系列漢字數(shù)字音形碼,有許多的搭配方式,其碼數(shù)最多為六。(括號內(nèi)為可選擇碼,沒有計入碼數(shù)。)每行后面列出的是其在G'B2312—級字符集的重碼數(shù)。3.1Y3+X1H,重碼數(shù)9963.2Y4+X1(H),(重碼數(shù)350)3.3Y3+X12(H),重碼數(shù)l155(322)3.4Y2+X12H,重碼數(shù)5153.5Y2+X12H(W),重碼數(shù)l053.6Y1+X12WH,重碼數(shù)313首數(shù)字表示音碼的個數(shù)。3是全取,4是全取加聲調(diào),2是取聲母及韻母的尾碼,l是取聲母。X之后的數(shù)字,表示取形碼的哪個碼,1、2表示取其第一第二碼,H表示取橫數(shù)碼,W表示取尾碼。本方案在用數(shù)字輸入漢字的有益效果是,在手機上基本上做到單手盲打。權(quán)利要求1,一種主要用于手機的數(shù)字編碼,包括對英文字母及漢字的數(shù)字編碼。前者與目前T9在手機數(shù)字鍵盤上,將十個數(shù)字轉(zhuǎn)換成26個英文字母不同的是,本發(fā)明的技術(shù)特征是兩位數(shù)字對英文字母的唯一性編碼。2,—種漢字音碼,其技術(shù)特征是將韻母分為首尾兩部取碼,從而自然地縮短碼長,其可讀性可與全拼碼等同。一種基于權(quán)利要求2的增加聲調(diào)而不增碼長的方法。,征是取,字韻#^鍵盤上同列的4個字符分別g該字的四聲。3,—種基于權(quán)利要求1及權(quán)利要求2的漢字數(shù)字音碼。其特ffiji最大,為S,且聲調(diào)碼可選擇。4,一種漢m字6鍵形碼。其,選取特征是,在保留傳統(tǒng)筆形的同時,對所有相交、相接及交重筆形定義為粘連筆形加以弓戰(zhàn);對此細了易記的分筋法編定數(shù)碼。并且將易學(xué)的漢字的《#性指標,橫筆數(shù)特征引入碼中。一種基于權(quán)利要求4的將漢字數(shù)字形碼轉(zhuǎn)變?yōu)樵赒WERT鍵盤上實現(xiàn)的行列化方法。其所含的一個新穎特征是對第二個形碼作分步處理。第一步第一形碼就對應(yīng)著1至9、0十個列,當(dāng)?shù)诙未a取數(shù)為1、2、X時,它對應(yīng)著的是z、a、q行。其中x表示2以上的數(shù)及0。第二步將第二形碼作為可選的第四鍵。5.一種基于權(quán)利要求2、權(quán)利要求3及權(quán)利要求4的漢字音,MC字音形碼。全文摘要本發(fā)明涉及一種優(yōu)先用于手機的中、英文字輸入的方法。一個能夠抵消用手機鍵盤輸入中英文的先天性劣勢的中、英文字編碼。諸如一種輸入英文字母等的數(shù)字編碼;一種完全符合韻部發(fā)音規(guī)律的最大碼長為三的漢字音碼;一種有可選擇的聲調(diào)碼的最大碼長為五的數(shù)字音碼;一種簡繁通用的數(shù)字形碼,篩選了約140個筆形成為部件,對所有交重筆形定義為粘連筆形,用易記性的分類方法對其編碼。在GB2312一級漢字中重碼數(shù)是120個。(繁體為150個)另有拼音碼在QWERT鍵盤上增加聲調(diào)而不增碼長的及數(shù)字形碼轉(zhuǎn)換成QWERT鍵盤上的三鍵半碼的附加方法。文檔編號H04M1/23GK101122823SQ20071005567公開日2008年2月13日申請日期2007年5月23日優(yōu)先權(quán)日2007年5月23日發(fā)明者胡錫全申請人:胡錫全