專利名稱:首部余部筆畫數(shù)字編碼漢字輸入法及其鍵盤的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于形碼漢字輸入法及其鍵盤,特別是“首部”“余部”漢字筆畫數(shù)字編碼輸入法和數(shù)字鍵盤。
現(xiàn)在社會(huì)已進(jìn)入數(shù)字化社會(huì),數(shù)字鍵盤應(yīng)用范圍十分廣泛。例如按鍵式電話、各種微型電腦、金融商業(yè)領(lǐng)域、國際網(wǎng)絡(luò)輸入文字信息和密碼的小鍵盤等等。漢字輸入的數(shù)字化,已成為通訊、網(wǎng)絡(luò)及金融商業(yè)領(lǐng)域的迫切需求。繼在標(biāo)準(zhǔn)鍵盤上用26個(gè)字母實(shí)現(xiàn)高效形碼輸入取得歷史性突破并獲廣泛應(yīng)用之后,使用數(shù)字小鍵盤實(shí)現(xiàn)漢字的數(shù)字輸入,已成為中文信息處理領(lǐng)域極待突破的重大課題。例如,使用電話,特別是使用手提式電話,以及上網(wǎng)傳遞信息,已經(jīng)提到日程上來。
現(xiàn)有技術(shù)中,解決漢字的數(shù)字鍵盤輸入,有以下幾種類型1.全筆畫輸入法在5個(gè)或10個(gè)數(shù)字鍵上定義若干種筆畫,依照書寫筆順,依次按鍵輸入漢字的每一個(gè)筆畫。例如(在用5種筆畫時(shí)),中2520,鍵3111551111254等,這一方法顯而易見的優(yōu)點(diǎn)是“不用學(xué)習(xí)”,只要會(huì)寫字便會(huì)輸入。但其突出的缺點(diǎn)是鍵入次數(shù)(碼長)太多,如遇到“戇”字,便需要輸入25下。因而,這一方法理論上雖然可行,重碼字雖然比較少,但卻沒有實(shí)用價(jià)值。
2.五筆字型輸入法五筆字型輸入法由于將字母鍵盤劃分為5個(gè)區(qū)共25個(gè)鍵,每一個(gè)字根都有一個(gè)區(qū)位碼,便利于將輸入碼數(shù)字化,所以,從1983年開始,發(fā)明人王永民就用2種方式來表達(dá)一個(gè)漢字(詞)的輸入碼,一種是字母方式,另一種是數(shù)字方式。例如“說”的字母碼YUKQ,其數(shù)字碼為41 42 23 35。雖然,用這種數(shù)字碼在數(shù)字小鍵盤上,完全可以輸入漢字和詞匯,而且只有2%左右的重碼。但對于沒有學(xué)會(huì)五筆字型的人,卻難以馬上使用這種方法。
3.五鍵五筆畫輸入法由王永民先生1985年發(fā)明的五鍵五筆畫輸入法,是一種使用5個(gè)數(shù)字鍵,用12345代表橫豎撇捺折五種筆畫,極為簡易的單字詞語筆畫輸入法。該方法及其鍵盤規(guī)定,任何一個(gè)漢字,依書寫順序取其前邊的4個(gè)單筆畫另加最后一個(gè)單筆畫,至多5個(gè)筆畫,不足5個(gè),補(bǔ)0鍵以示結(jié)束。這一方法易學(xué)易用,顯而易見。然而,極易學(xué)的“代價(jià)”卻是重碼非常之多。由于一些字?jǐn)?shù)較多的部首如“钅、蟲、扌、纟、日”等,僅“部首”就占用了前3個(gè)甚至前4個(gè)碼,其編碼的離散能力只靠最后1碼(5種可能性)做出貢獻(xiàn),所以重碼字就無法降低。以至于在國家標(biāo)準(zhǔn)6763個(gè)漢字中,30個(gè)漢字重碼的就有34組,其中,50個(gè)漢字重碼的有10組,最多的一組是88個(gè)字重碼。這樣,就使得這一方法的應(yīng)用效率不能提高,其推廣應(yīng)用也大受限制。
4.拼音數(shù)字輸入方式這一方式參考英文字母的數(shù)字輸入方式,按1至3次鍵來代表漢語拼音的字母。這一方法的優(yōu)點(diǎn)是可以直接在數(shù)字鍵上打拼音,方便易學(xué);缺點(diǎn)是讀音不準(zhǔn)或不認(rèn)識的字無法輸入,大量的同音字需要挑選,而且擊鍵次數(shù)多,效率不高。
5.其它用10個(gè)數(shù)字鍵的筆畫輸入法鑒于用5種筆畫的輸入法編碼基數(shù)(鍵數(shù))太少,容易重碼,所以,有人設(shè)計(jì)出用9種或10種筆畫的數(shù)字輸入法。這類方法將漢字的筆畫細(xì)分為9-10種,每個(gè)數(shù)字鍵上放上一組特征相似的筆畫,然后制定取碼規(guī)則。比如有一種取碼規(guī)則就是依書寫筆順,從首筆開始,對一個(gè)字先取了3個(gè)筆畫,最后,從末筆開始,再倒取3個(gè)筆畫,加在一起共6個(gè)筆畫。其優(yōu)點(diǎn)是由于鍵數(shù)增加一倍,編碼的離散性比5種筆畫要好得多,重碼自然要少得多,效率也會(huì)提高不少。但這類方法要細(xì)分筆畫為10組幾十種,人們是難以記憶和辯認(rèn)的。況且,筆畫取碼還要規(guī)定從末筆開始,“倒計(jì)數(shù)”,取3個(gè)筆畫,顯然違背了人們的認(rèn)知規(guī)律。通俗地說是,這等于拿著千百萬人現(xiàn)已掌握的筆順知識不用,讓人們重新建立一個(gè)“倒著數(shù)”的順序,這是人們難以接受的。
6.另外一些考慮漢字結(jié)構(gòu)特征的筆畫代碼輸入法例如,讓輸入者數(shù)清一個(gè)字的筆畫總數(shù)后,再執(zhí)行“取碼規(guī)則”,規(guī)定5個(gè)筆畫以內(nèi)的字如何取碼,6個(gè)以上筆畫的字又另按另一種規(guī)則取碼。
再如,一些方法規(guī)定不同的漢字字型,用不同的取碼規(guī)則;另一些方法則規(guī)定漢字分為二元字,三元字,四元字,不同的單元分配不同的編碼,等等。
這些煩瑣的規(guī)則在應(yīng)用實(shí)踐中,恐怕都難以行得通。因?yàn)槔碚撋系目尚行?,與現(xiàn)實(shí)中的實(shí)用性,有時(shí)候完全是兩回事。
本發(fā)明認(rèn)為這類方法取碼困難,唯一性差,不便推廣。
綜上所述,一種使用數(shù)字鍵盤,符合華人的文字書寫習(xí)慣、符合語言文字規(guī)范、重碼少、效率高、不受方言讀音影響,又易學(xué)易用的數(shù)字鍵盤漢字輸入法,仍是漢字輸入領(lǐng)域亟待突破的技術(shù)難題。
本發(fā)明的目的是提出一種全新的“首部余部筆畫數(shù)字編碼漢字輸入法及其鍵盤”技術(shù)方案,以克服現(xiàn)有技術(shù)在數(shù)字鍵盤上進(jìn)行漢字輸入時(shí)存在的上述不符合規(guī)范、難學(xué)難用、效率低、重碼多、效率不高等障礙。
本發(fā)明首創(chuàng)的一種“首部”“余部”筆畫數(shù)字編碼漢字輸入法及其鍵盤,所述的鍵盤是數(shù)字鍵盤,具有至少1、2、3、4、5五個(gè)數(shù)字鍵用以代表漢字的橫、豎,撇(點(diǎn))、捺、折五種筆畫;其特征在于將占漢字總數(shù)90%以上的每一個(gè)合體字,從結(jié)構(gòu)上劃分為“首部”和“余部”兩個(gè)部分,由包括“首部”的第一筆在內(nèi)的2個(gè)或3個(gè)筆畫的代碼構(gòu)成“首部”的數(shù)字編碼,由包括“余部”的第一筆和最末一筆在內(nèi)的3個(gè)、4個(gè)或5個(gè)筆畫的數(shù)字代碼構(gòu)成“余部”的數(shù)字編碼,“首部”編碼加“余部”編碼,構(gòu)成合體漢字的筆畫數(shù)字編碼,使用數(shù)字鍵盤向電腦或通訊設(shè)備輸入漢字和或漢字詞語。
本發(fā)明根據(jù)作者近年來在編碼學(xué)方面的研究成果,首次揭示了全部合體漢字一律從結(jié)構(gòu)上可以一分為二,即可以分為“首部”和“余部”兩個(gè)部分這一結(jié)構(gòu)規(guī)律。實(shí)際上,漢字中的絕大部分都是合體字,不管是形聲字或是會(huì)意字,以首筆為起始處,從結(jié)構(gòu)上大約都可以分為兩個(gè)部分。
從編碼學(xué)的角度來看,任何一個(gè)或一組筆畫結(jié)構(gòu),其周邊的筆畫,也即外露的筆畫,都比結(jié)構(gòu)內(nèi)的筆畫有更大的熵值,因而更便于被辯認(rèn),被識別,具有最佳的離散能力。當(dāng)把這一理論成果用于編碼實(shí)踐時(shí),本發(fā)明便首創(chuàng)了以取“首部”的第一筆加末筆或第二筆,取“余部”的第一筆和最末筆為核心技術(shù)的取碼方式,形成一個(gè)全新的編碼體系。
本發(fā)明提出的“首部”和傳統(tǒng)的“部首”,例如《新華字典》所用的200多個(gè)部首,不是一個(gè)概念。“首部”雖然多數(shù)都是第一筆寫成的“部首”,但“首部”并不都是“部首”,“部首”也不全等于“首部”。
“首部”是指按正確筆順書寫漢字時(shí),與第一筆交叉或與第一筆所在結(jié)構(gòu)緊密連接在一起,成為一個(gè)獨(dú)體,或成為一個(gè)含字?jǐn)?shù)較多的傳統(tǒng)部首的筆畫結(jié)構(gòu)。其特征是“包含首筆在內(nèi)的筆畫結(jié)構(gòu)部分”,故稱“首部”。因?yàn)槎鄶?shù)漢字的“部首”都包含有漢字的首筆,所以多數(shù)“部首”,同時(shí)也都是“首部”就不奇怪。
例如木、口、亻、禾、扌、纟、廣、讠、米、蟲、山、舟等,當(dāng)它們出現(xiàn)在漢字圖形的第一個(gè)方位(即包含首筆的那個(gè)結(jié)構(gòu))時(shí),它們既是“部首”,又是“首部”;再如甫、束、失、重、我、曲等,雖然它們不是部首,但當(dāng)一個(gè)漢字的第一筆“落”在其上時(shí),它們便是“首部”;另外,雖然,“首部”是指筆畫交叉或與第一筆所在結(jié)構(gòu)緊密相連的首筆所在的筆畫結(jié)構(gòu),但當(dāng)一些涵蓋漢字?jǐn)?shù)量比較多或作為部首,其自身筆畫較多時(shí),例如馬、氣、石、、走、足、食、饣、門、門、革、骨、鬼、魚、魚、齒等,出現(xiàn)在漢字的第一結(jié)構(gòu)位置(即首筆所在結(jié)構(gòu))時(shí),盡管它們后邊是幾個(gè)筆畫結(jié)構(gòu)的離散組合,在劃分漢字的首部余部時(shí),它們不能再被分開為兩個(gè)部分,它們整體被視為“首部”,而不能再“一分為二”,將它們分為“首部”和“余部”。
“首部”當(dāng)中,有時(shí)候只有一個(gè)筆畫,例如“畫”,它的“首部”就只有一個(gè)筆畫,編1個(gè)碼,不必用別的碼補(bǔ)足“首部”的碼長。
漢字結(jié)構(gòu)中孤立的點(diǎn),一般認(rèn)為是與其附近的筆畫粘連在一起,因而不能單獨(dú)作為首部。例如“辛”的第一筆點(diǎn),與橫粘在一起才成為首部。
合體漢字一般分為左右型、上下型和包圍型。在包圍型的漢字中,“首部”仍然是首筆所在的筆畫結(jié)構(gòu),例如“國”的“首部”為“口”,“咸”的“首部”是“戊”,“同”的“首部”是“冂”,“句”的“首部”是“勹”等,“首部”上的筆畫有時(shí)候并不是嚴(yán)格按筆順的結(jié)合,例如“國”,其最后一筆卻是首部“口”的第三個(gè)筆畫。
以下例字可以說明“首部”并不等于“部首”“進(jìn)”的“首部”是“井”,而“進(jìn)”的“部首”是“辶”;“想”的“首部”是“木”,而“想”的“部首”是“心”。
本發(fā)明的突出的實(shí)質(zhì)性技術(shù)特征在于,在本發(fā)明的取碼規(guī)則中,“首部”的首筆和最后一筆或第二筆是必須取碼的。
如果“首部”取碼長度為3,則依筆順加取前2筆,連同“首部”的末筆畫,共3個(gè)碼,如果“首部”是單筆畫,則只取1筆即可。
漢字的“首部”隨字集大小而不同?!笆撞俊彪m有數(shù)百個(gè)之多,但不必一一死記,這是會(huì)寫漢字的人,從結(jié)構(gòu)上即可一眼看出來的。
將合體漢字“一分為二”之后,與“首部”沒有交叉緊連,可以離開留有距離的?!坝嗖俊狈?,不管是字不是字,不管是不是一個(gè)傳統(tǒng)部首,不管是什么形狀和結(jié)構(gòu),不管剩下的是幾塊,幾個(gè)部件,幾個(gè)字根,不管?!坝嗖俊狈质呛象w或是獨(dú)體,一律叫做“余部”。
本發(fā)明突出的實(shí)質(zhì)性特點(diǎn)在于,對于合體漢字的“余部”,其所取的碼長不管是3,是4,是5,取碼時(shí),“余部”的首筆和最末一筆是必須包括在內(nèi)的。當(dāng)首、末筆不足以達(dá)到“余部”應(yīng)取的最大碼長時(shí),依書寫順序在首筆之后依次補(bǔ)取第2筆、第3筆,直到加上末筆之后,達(dá)到所要求的最大碼長為止。有時(shí),是把“余部”的筆畫取完了仍不夠最大碼長,應(yīng)補(bǔ)加結(jié)束標(biāo)志碼,例如“0”。
“首部”的嚴(yán)格劃分,可以根據(jù)編碼的設(shè)計(jì)小有靈活,例如,“穴”既可當(dāng)作一個(gè)整體視為“首部”,也可以認(rèn)為“首部”是“宀”,而“八”是“余部”。
作為本發(fā)明的實(shí)施例,取碼中,“首部”的碼長可以是2、是3,“余部”的碼長可以是3、4、5,這樣組合起來,當(dāng)“首部”取2個(gè)碼時(shí),可以有2+3=5和2+4=6,2+5=7三種最大碼長。一般來說,最大碼長的確定與字集相關(guān)。當(dāng)只處理3755個(gè)國標(biāo)一級漢字時(shí),可以用2+3=5方式,即“首部”取2碼,“余部”取3碼,最大碼長為5;當(dāng)處理國標(biāo)兩級漢字6763個(gè)漢字時(shí),可以用2+4=6,即“首部”取2碼,“余部”取3碼,最大碼長為6;或3+3=6,即“首部”取3碼,“余部”取3碼,最大碼長為6。當(dāng)處理GBK21003個(gè)漢字時(shí),可以用“首2余5”即2+5=7取碼法,也可以用“首3余4”3+4=7取碼法,最大碼長都是7。
在如上所述的取碼過程中,無論“首部”或“余部”的筆畫數(shù),當(dāng)不足所應(yīng)取的最大碼長時(shí),一律只取現(xiàn)有的筆畫,即有多少取多少,不作任何特別處理,也不用別的鍵來“補(bǔ)齊”。只要保證“首部”的首筆加末筆或第二筆、“余部”的首末筆一定被取上即可,這是本發(fā)明的編碼體系從漢字圖形中提取信息量最大而又極易辯識學(xué)習(xí)的筆畫作為編碼信息,極具創(chuàng)造性的實(shí)質(zhì)性特點(diǎn)。
當(dāng)用本發(fā)明取碼時(shí),如果一個(gè)合體字的“首部”和“余部”取碼之后,其總編碼長度達(dá)不到最大碼長時(shí),在編碼的后邊補(bǔ)加筆畫代碼以外的代碼,表示結(jié)束。這個(gè)代碼可以是6、7、8、9、0,也可以是數(shù)字鍵盤上任何可以鍵入的別種代碼,如*、#等。
本發(fā)明所述數(shù)字鍵盤上,可以將“0”鍵設(shè)置為空格鍵及翻頁鍵,當(dāng)漢字筆畫不足所述碼長時(shí),擊“0”鍵結(jié)束。當(dāng)漢字的輸入碼達(dá)到最大碼長或不足最大碼長且已擊過結(jié)束鍵時(shí),擊“0”鍵可以使重碼左右翻頁,在翻頁過程中,數(shù)字鍵可以用來挑選重碼字。
使用本發(fā)明的方法形成的首部余部取碼法,筆畫種類的劃分可以是橫豎撇捺折5種,也可以是6種或10種以內(nèi),可以用1個(gè)數(shù)字鍵代表1種筆畫。
本發(fā)明使用的數(shù)字鍵盤可以是至少具有1、2、3、4、5、6、7、8、9、0十個(gè)數(shù)字鍵的鍵盤,其中數(shù)字鍵6、7、8、9、0設(shè)置為功能鍵,功能鍵分別設(shè)置為“萬能鍵”,前、后翻頁功能鍵,詞語功能鍵,聯(lián)想功能鍵,其中“萬能鍵”的功能是替代難以確定的筆畫輸入;語詞功能鍵用于輸入漢語語詞;聯(lián)想功能鍵用于漢字語句聯(lián)想;當(dāng)出現(xiàn)重碼時(shí),每個(gè)數(shù)字鍵都可具有選擇鍵的功能,從屏幕上顯示的重碼漢字中選擇確認(rèn)的字。本發(fā)明使用的數(shù)字鍵盤也可以是12鍵位鍵盤,功能設(shè)置是6鍵為“萬能鍵”,7鍵為詞語鍵,8、9兩鍵分別為前后翻頁鍵,0鍵是空格鍵,另兩鍵是聯(lián)想鍵和轉(zhuǎn)換鍵。
各鍵的功能及檢索由軟件加以實(shí)現(xiàn)。本發(fā)明與現(xiàn)有技術(shù)的重要區(qū)別和突出的實(shí)質(zhì)性特點(diǎn)在于將合體漢字分為“首部”和“余部”各取首尾碼,一般情況下,只使用大眾已熟知的5種筆畫對漢字編碼,編碼時(shí)只使用數(shù)字12345,只使用數(shù)字鍵盤上的5個(gè)數(shù)字鍵,一般不再另外定義筆畫和筆畫鍵,從而大大降低了學(xué)習(xí)的難度,而便于大規(guī)模社會(huì)化應(yīng)用推廣。
以下以國標(biāo)字集中“木”部漢字為例說明本發(fā)明離散重碼、提高編碼唯一性、提高輸入效率的突出實(shí)質(zhì)性特點(diǎn)。
在限定每個(gè)漢字取5個(gè)碼的情況下,采用現(xiàn)有技術(shù)的前4末1五筆畫數(shù)字編碼時(shí)構(gòu)12344,樹12344,枚12344,梗12344,柩12344檜12344,校12344,根12344,板12344,杖12344其數(shù)字編碼完全相同,這些字都是同一個(gè)輸入碼;按照本發(fā)明方案,即“首部”取“首末”2個(gè)筆畫,“余部”取“首次末”3個(gè)筆畫時(shí),上述漢字的數(shù)字編碼是(在5種筆畫情況下)構(gòu)14354,樹14544,枚14314,梗14124,柩14154檜14344,校14414,根14524,梗14125,杖14134顯然,以上用本發(fā)明時(shí),其數(shù)字編碼都不相同,原來重碼的以上各字都不重了,在其它情況下,也使重碼平均減到五分之一。
以上實(shí)施例可以表現(xiàn)出本發(fā)明與現(xiàn)有技術(shù)相比具有突出的實(shí)質(zhì)性特點(diǎn)和顯著的進(jìn)步。
本發(fā)明對數(shù)字鍵盤實(shí)現(xiàn)漢字編碼的理論性貢獻(xiàn)在于,對于合體漢字,采用先將漢字拆分為“首部筆畫結(jié)構(gòu)”與“余部筆畫結(jié)構(gòu)”兩部分,再按本發(fā)明規(guī)則分別取其首尾筆畫構(gòu)成編碼;這樣就可以實(shí)現(xiàn)對漢字編碼空間的合理分配,極大地降低重碼率。以前面實(shí)施例的部首“木”部的漢字為例,“木”部共281個(gè)字,因?yàn)椤澳尽北旧碚剂?碼,現(xiàn)有技術(shù)中對該部首就使用了4個(gè)數(shù)字碼。當(dāng)限定每個(gè)漢字碼長為5時(shí),僅剩一個(gè)取碼位置。在現(xiàn)有技術(shù)中,按照五種筆畫的分配,平均重碼率為182/5=56。
然而,按照本發(fā)明方案,前兩碼相同為(橫)1、(捺)4,在漢字中前兩筆用五筆畫取碼為14的除“木”外還有40個(gè),總共是281+40=321個(gè);本方案用后三個(gè)碼離散其余筆畫結(jié)構(gòu),每個(gè)數(shù)碼位置都有五種筆畫的可能,共有5的3次方125種可能;其平均重碼率為321/125=2.568。本發(fā)明的重碼率僅是現(xiàn)有技術(shù)的1/22。
作為本發(fā)明的一種實(shí)施例,本發(fā)明可以采用5種筆畫5碼方式輸入漢字,即對每個(gè)合體漢字最多取5碼,其中先依書寫順序取“首部”的第一筆畫和末筆畫作為前2碼,再依書寫順序取“余部”的第一、第二和末筆畫,當(dāng)“首部”或“余部”的筆畫不足取碼時(shí),只取現(xiàn)有筆畫,總碼長不足5時(shí),加補(bǔ)一次“0”鍵以示結(jié)束。
例如在現(xiàn)有技術(shù)“五筆畫輸入法”中,月字旁末筆是捺(點(diǎn))的字,即其編碼均為35114的字,有25個(gè)服、膠、脈、膜、腿、脹、脅、腹、膚、膝、膩、膊、腺、肘、脯、腮、臆、腑、腋、膿、腆、膘、胰。
然而,在本發(fā)明中重碼情況如下股、脈、腿、脅、腺、腮、膿、腆、胰、服等10個(gè)字都不再重碼,有重碼的字,離散為以下4組31114膚膩31314脹腹31414膠臆腑腋31124膜肢膝脯肘膘可見,同樣都是用5種筆畫,同樣是用5個(gè)鍵,幾乎同樣易學(xué)易用,最大碼長同樣是5,可本發(fā)明的情況卻比現(xiàn)有技術(shù),實(shí)現(xiàn)了質(zhì)的突破,重碼數(shù)一般會(huì)降到現(xiàn)有技術(shù)的五分之一。
在5碼輸入的情況下,編碼的總?cè)萘繛?的5次方,即共計(jì)3125個(gè)編碼。當(dāng)處理6763個(gè)字時(shí),不但沒有編碼空間的冗余度,字?jǐn)?shù)是編碼可能性的2倍,重碼自然多得很。
為此,作為本發(fā)明實(shí)施例,除5碼方式外,本發(fā)明還可以采用6碼方式。在6碼方式下,編碼空間為5的6次方,即15625個(gè)編碼可能性,再對6763個(gè)漢字編碼,其重碼即可以大幅度下降。
例如在前邊5碼的例字中,最后的重碼字一共有4組,15個(gè)字。如用6碼編碼,原先的重碼字膚311134,膩311114,不重了;
脹313154,腹313124,不重了。
雖然增加了一個(gè)碼,但是在漢字“一分為二”后,對第二分部仍然直觀易辯,取“123末”十分容易,完全符合筆順習(xí)慣,所以,并不增加學(xué)習(xí)難度。
作為本發(fā)明的另一個(gè)實(shí)施例,本發(fā)明可以采用6碼方式輸入漢字,即對每個(gè)漢字最多取6碼,其中先依書寫順序取“首部”的第一筆畫加末筆畫或第二筆,作為前2碼,后4碼依書寫筆畫順序取“余部”的第一、第二、第三和末筆畫,當(dāng)“首部”或“余部”的筆畫不足取碼時(shí),只取現(xiàn)有筆畫,總碼長不足6時(shí),加補(bǔ)“0”鍵一次以示結(jié)束。
本發(fā)明還可以用另一種6碼方式輸入,即對每個(gè)漢字最多取6碼,其中先依書寫順序取“首部”的第一筆畫、第二筆畫和末筆畫作為前3碼,再依書寫順序取“余部”的第一、第二和末筆畫,當(dāng)“首部”或“余部”的筆畫不足取碼時(shí),只取現(xiàn)有筆畫,總碼長不足6時(shí),加補(bǔ)一次“0”鍵以示結(jié)束。
作為本發(fā)明的實(shí)施例,本發(fā)明還可以根據(jù)字符集大小的需要,比如在為GBK漢字集編碼時(shí),采用7碼方式輸入,即對每個(gè)漢字最多取7碼,前2碼是依書寫順序取“首部”的第一筆畫加上末筆畫或第二筆,后5碼依書寫筆畫順序取“余部”的第一、第二、第三、第四個(gè)筆畫和末筆畫,“首部”或“余部”的筆畫不足取碼時(shí),只取現(xiàn)有筆畫,總碼長不足7時(shí),補(bǔ)“0”鍵一次以示結(jié)束。
本發(fā)明還可以采用另外一種7碼方式輸入漢字,即對每個(gè)漢字最多取7碼,前3碼依書寫順序取“首部”的第一、第二和末筆畫,后4碼依書寫順序取“余部”的第一、第二、第三筆畫和末筆畫,“首部”“余部”的筆畫,不足取碼時(shí),只取現(xiàn)有的筆畫,總碼長不足7時(shí),加補(bǔ)“0”鍵一次。
在7碼方式下,編碼空間的總?cè)萘繛?8125,在這一空間中為GBK21003個(gè)漢字編碼,重碼問題會(huì)大為減輕。
由于以上實(shí)施例,本發(fā)明可以構(gòu)成若干個(gè)最大碼長不同的編碼體系使用同一鍵盤輸入漢字。
對于占漢字總數(shù)10%左右的單體字,或“部首”漢字,例如丙、夷、事、串、革、石、魚、門等,在本發(fā)明的各種碼長情況下,其編碼輸入的方法都是按規(guī)范的書寫順序,取必須包括第一筆畫和最末筆畫在內(nèi)、且達(dá)到規(guī)定碼長的筆畫數(shù),在第一筆之后依筆順?biāo)〉墓P畫數(shù)等于最大碼長數(shù)減2,不足最大碼長時(shí),補(bǔ)加“0”鍵作為結(jié)束?!耙?guī)定碼長”可以是最大碼長,也可以是比最大碼長少1位、少2位的碼長,視字集大小可另外規(guī)定單體漢字的最大碼長。
例如我5碼情況下,編碼為31214;6碼情況下,編碼為312154或31214;7碼情況下,編碼為3121534或312154。
中在3種碼長情況下,編碼都是25120。
本發(fā)明所述的“首部”、“余部”筆畫編碼輸入法及其鍵盤,其特征還在于一個(gè)詞匯標(biāo)志符號代碼之后,只輸入一條漢字詞匯中每一個(gè)單字的“首部”或全碼的部分編碼即可輸入詞語,詞語中漢字的個(gè)數(shù)可以是2個(gè),3個(gè),4個(gè)以上至幾十個(gè)。
以5種筆畫為例,本發(fā)明輸入詞匯的方法是,先用12345以外的一個(gè)數(shù)字或符號鍵作為詞匯“引導(dǎo)鍵”,在引導(dǎo)鍵之后,2字詞每字取全碼前邊的2-4個(gè)碼,3字詞取每字的全碼前邊的2-3個(gè)碼,4字以上的詞,取各字的全碼最前邊的2個(gè)碼,以此組成詞匯碼輸入;對于5字以上的多字詞,還可以只取前3-4個(gè)字的前2碼加最后一個(gè)字的前2碼輸入。詞匯輸入時(shí),重碼詞依頻度排列顯示待選。
當(dāng)用本發(fā)明的首部余部編碼法對合體漢字取碼時(shí),為了照顧已掌握了五筆字型輸入法的使用者并獲得很好的離散重碼能力,合體漢字的首部編碼,可以直接沿用該漢字的五筆字型編碼的區(qū)位碼形式,即5區(qū)25位五筆字型鍵盤上的字根數(shù)字代碼。例如,王11,木14,山25,女53等。此時(shí),并不限制所使用的五筆字型版本。
本發(fā)明所述的“首部余部筆畫編碼輸入法及其鍵盤”,其特征在于數(shù)字鍵盤至少具有1、2、3、4、5、6、7、8、9、0等10個(gè)數(shù)字鍵,其中數(shù)字鍵6、7、8、9、0設(shè)置為功能鍵,分別設(shè)置為“萬能鍵”,前、后翻頁功能鍵,詞語標(biāo)志鍵,其中“萬能鍵”的功能是替代難以確定的筆畫;當(dāng)出現(xiàn)重碼時(shí),0鍵可以作為翻頁鍵,0鍵之后緊接的數(shù)字鍵,即為挑選重碼鍵,從屏幕上顯示的重碼漢字中選擇所要的字。
當(dāng)字集擴(kuò)大,使用5碼或6碼方式為漢字編碼輸入時(shí),例如在“口”或“扌”作為“首部”之后,仍會(huì)有許多重碼。這時(shí),本發(fā)明還可以分別或分組在0、6、7、8、9等鍵上,安置出現(xiàn)頻度最高的少數(shù)幾個(gè)漢字組字部件???、日、扌、土、氵等。按“首部”“余部”的取碼規(guī)則和碼長要求取碼的過程中,當(dāng)遇到這幾個(gè)部件時(shí),對它們只取1個(gè)碼,而不再拆成單筆畫,這些高頻部件可以獨(dú)占1個(gè)鍵,當(dāng)它們是“首部”時(shí),或在“余部”中輪到取碼時(shí),都只取一個(gè)碼。以此仍按“首部”“余部”取碼形成的編碼體系,既可以作為一種獨(dú)立使用的編碼輸入方式,形成本發(fā)明的新實(shí)施例,也可以與“首部”“余部”的各種編碼體系兼?zhèn)渫ㄓ谩?br>
例如在本發(fā)明的5碼“2+3”(首部取2碼,余部取3碼)輸入法中,可以單把“口”放在某個(gè)鍵,如6鍵上,形成“12345+口”這樣的6個(gè)鍵輸入,這時(shí),原先重碼的字桔、棲,吐、晤等,就不再重碼了。
為了便于操作者學(xué)習(xí)使用,本發(fā)明所用的單筆畫,例如在5種筆畫情況下,可以把筆畫的代表橫一、豎丨、撇丿、捺、折乙,以及字根,印制或刻制在對應(yīng)的數(shù)字鍵上。
本發(fā)明還可以設(shè)計(jì)某些漢字的簡碼輸入。當(dāng)一個(gè)漢字的全碼,例如“我”——312154,在整個(gè)6碼的編碼空間中,全碼不必輸入完畢,該字即可唯一地顯示出來時(shí),這個(gè)比全碼為短的碼,即為該字的簡碼。因?yàn)檎麄€(gè)編碼體系中,存在相當(dāng)?shù)木幋a冗余度和離散性,所以,許多漢字都會(huì)有簡碼,還可以用簡碼輸入,以提高輸入速度。
在3755個(gè)國標(biāo)一級字內(nèi),本發(fā)明突出的實(shí)質(zhì)性特點(diǎn)和重大技術(shù)進(jìn)步,可從本發(fā)明與現(xiàn)有技術(shù)重碼情況的以下比較中看出<
可見,本發(fā)明6碼情況下,9重碼以內(nèi)的字?jǐn)?shù)占國標(biāo)一級字的96.4%,而現(xiàn)有技術(shù)的這個(gè)比例只有58.2%,編碼的唯一性提高了65.6%;其中,無重碼的漢字個(gè)數(shù)是現(xiàn)有技術(shù)的3.39倍。
本發(fā)明可在電腦和各種數(shù)據(jù)錄入、通訊系統(tǒng)、電話手機(jī)及網(wǎng)絡(luò)技術(shù)中加以實(shí)施,各鍵的定義和輔助功能,可由軟件加以實(shí)現(xiàn),漢字以外的字符及通訊用符號,可以根據(jù)需要另行約定,以此形成的應(yīng)用本發(fā)明的各類產(chǎn)品,可通用于應(yīng)用漢字的信息社會(huì)中。
權(quán)利要求
1.一種首部余部筆畫數(shù)字編碼漢字輸入法及其鍵盤,所述的鍵盤是數(shù)字鍵盤,具有至少1、2、3、4、5五個(gè)數(shù)字鍵用以代表漢字的橫、豎,撇(點(diǎn))、捺、折五種筆畫;其特征在于將占漢字總數(shù)90%以上的每一個(gè)合體字,從結(jié)構(gòu)上劃分為首部和余部兩個(gè)部分,由包括首部的第一筆在內(nèi)的2個(gè)或3個(gè)筆畫的代碼構(gòu)成首部的數(shù)字編碼,由包括余部的第一筆和最末一筆在內(nèi)的3個(gè)、4個(gè)或5個(gè)筆畫的數(shù)字編碼構(gòu)成余部的數(shù)字編碼,首部編碼加余部編碼構(gòu)成合體漢字的筆畫數(shù)字編碼,加上獨(dú)體漢字的筆畫編碼而形成首部余部編碼法及其編碼體系,使用數(shù)字鍵盤向電腦或通訊設(shè)備輸入漢字和或漢字詞語。
2.如權(quán)利要求1所述的首部余部筆畫編碼輸入法及其鍵盤,其特征在于對每個(gè)合體漢字最多取5碼,其中先依書寫順序取首部的第一筆畫加上末筆畫或者第二筆畫作為前2碼,再依書寫順序取余部的第一、第二和末筆畫作為余部的編碼,當(dāng)首部或余部的筆畫不足取碼時(shí),只取現(xiàn)有筆畫,總碼長不足5時(shí),加補(bǔ)一次“0”鍵以示結(jié)束。
3.如權(quán)利要求1所述的首部余部筆畫編碼輸入法及其鍵盤,其特征在于對每個(gè)漢字最多取6碼,其中先依書寫順序取首部的第一筆畫加上末筆畫或者第二筆畫作為前2碼,后4碼依書寫筆畫順序取余部的第一、第二、第三和末筆畫,當(dāng)首部或余部的筆畫不足取碼時(shí),只取現(xiàn)有筆畫,總碼長不足6時(shí),加補(bǔ)“0”鍵一次以示結(jié)束。
4.如權(quán)利要求1所述的首部余部筆畫編碼輸入法及其鍵盤,其特征在于對每個(gè)漢字最多取6碼,其中先依書寫順序取首部的第一筆畫、第二筆畫加上末筆畫或者第三筆畫作為前3碼,再依書寫順序取余部的第一、第二和末筆畫,當(dāng)首部或余部的筆畫不足取碼時(shí),只取現(xiàn)有筆畫,總碼長不足6時(shí),加補(bǔ)一次“0”鍵以示結(jié)束。
5.如權(quán)利要求1所述的首部余部筆畫編碼輸入法及其鍵盤,其特征在于對每個(gè)漢字最多取7碼。首部2碼,余部5碼,其中首部的第一筆和余部的首末筆畫必須取上;或者首部3碼,余部4碼,其中首部和余部的首末筆畫都必須取上。
6.如權(quán)利要求1所述的首部余部筆畫編碼輸入法及其鍵盤,其特征在于首部只取2個(gè)碼,且該2個(gè)碼是該漢字五筆字型輸入法中第一個(gè)字根在5區(qū)25位鍵盤上的區(qū)位碼。
7.如權(quán)利要求1或2或3或4或5或6或7所述的首部余部筆畫編碼輸入法及其鍵盤,其最大碼長可以另作規(guī)定為4或5或6或7,其特征在于對于占漢字總數(shù)10%左右的單體字或部首漢字,其編碼輸入方法是按規(guī)范的書寫順序,取必須包括第一筆畫和最末筆畫在內(nèi)且達(dá)到規(guī)定碼長的筆畫數(shù),不足規(guī)定碼長時(shí),補(bǔ)加“0”鍵作為結(jié)束。
8.如權(quán)利要求1所述的首部余部筆畫編碼輸入法及其鍵盤,其特征在于在一個(gè)詞匯標(biāo)志碼之后,只輸入一條漢字詞匯中每一個(gè)單字的前幾位編碼即可輸入詞語,詞語中漢字的個(gè)數(shù)可以是2個(gè),3個(gè),4個(gè)以上至幾十個(gè)。
9.如權(quán)利要求1或2或3或4或5或6所述的首部余部筆畫編碼輸入法及其鍵盤,其特征在于數(shù)字鍵盤至少具有1、2、3、4、5、6、7、8、9、0等10個(gè)數(shù)字鍵,其中數(shù)字鍵6、7、8、9、0設(shè)置為功能鍵,分別設(shè)置為“萬能鍵”,前、后翻頁功能鍵,詞語標(biāo)志鍵,其中“萬能鍵”的功能是替代難以確定的筆畫;當(dāng)出現(xiàn)重碼時(shí),0鍵可以作為翻頁鍵,0鍵之后緊接的數(shù)字鍵,即為挑選重碼鍵,可以從屏幕上顯示的重碼漢字中選擇所要的字。
10.如權(quán)利要求1或2或3或4或5或6或7或8或9所述的首部余部筆畫編碼輸入法及其鍵盤,其特征在于數(shù)字鍵6、7、8、9、0上,還可以分別或分組安置出現(xiàn)頻度最高的少數(shù)幾個(gè)漢字部件???、日、扌、土、氵等。按首部余部的取碼規(guī)則和碼長要求取碼的過程中,當(dāng)遇到這幾個(gè)部件時(shí),對它們只取1個(gè)碼而不再拆成單筆畫,這樣仍按本發(fā)明所述的首部余部取碼法形成的編碼體系,既可以作為一種獨(dú)立使用的編碼輸入方式,也可以與首部余部的各種編碼體系混合、兼容或兼?zhèn)渫ㄓ谩?br>
全文摘要
一種首部余部筆畫數(shù)字編碼漢字輸入法及其鍵盤,所述的鍵盤是數(shù)字鍵盤,具有至少1、2、3、4、5五個(gè)數(shù)字鍵用以代表漢字的橫、豎,撇(點(diǎn))、捺、折五種筆畫;其特征在于將漢字的每一個(gè)合體字,從結(jié)構(gòu)上劃分為首部和余部兩個(gè)部分,由包括首部的首筆畫和余部的首末筆畫在內(nèi)的5個(gè)、6個(gè)或7個(gè)筆畫的數(shù)字代碼構(gòu)成漢字的數(shù)字輸入編碼,使用數(shù)字鍵輸入漢字和詞語。本發(fā)明可廣泛實(shí)施應(yīng)用于電腦和各種數(shù)據(jù)錄入、通訊系統(tǒng)、電話手機(jī)及網(wǎng)絡(luò)技術(shù)中。
文檔編號G06F3/023GK1256446SQ0010000
公開日2000年6月14日 申請日期2000年1月3日 優(yōu)先權(quán)日2000年1月3日
發(fā)明者王永民 申請人:王永民