專利名稱:漢字全形碼輸入方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計算機漢字輸入技術(shù)領(lǐng)域。
目前計算機漢字輸入方案,都需要記憶相當多的規(guī)則和數(shù)碼,專業(yè)錄入人員經(jīng)培訓(xùn)后可以熟練地掌握,但對廣大使用電腦的非專業(yè)錄入人員,例如作家、電化教學(xué)工作者、家用電腦使用者、以及將電腦作為工具進行工作的生產(chǎn)管理人員,使用這些編碼方案就顯得力不從心了,一方面要對輸入的文稿內(nèi)容進行思考,一方面又要隨時恪守許多輸入規(guī)則和數(shù)碼,這二者很難融合起來。
本發(fā)明的目的是發(fā)明一種按照漢字本身的書寫習慣進行錄入的,不需要更多的記憶規(guī)則的漢字輸入方法,使其能克服現(xiàn)有技術(shù)的以上缺點,更快、更自然地進行漢字輸入。
本發(fā)明的方法是通過以下手段實現(xiàn)的。
采用由兩位阿拉伯數(shù)字為單元的拆分碼和鑒別碼對漢字進行全形編碼輸入。根據(jù)漢字書寫時起筆筆形(橫、豎、撇、點、折)將計算機的英文字母鍵盤劃分為五個輸入?yún)^(qū),給出相應(yīng)的筆形碼。每個輸入?yún)^(qū)由代表不同筆畫數(shù)(筆畫碼)的編號按鍵組成,漢字的字元以其起筆筆形的區(qū)碼和筆畫數(shù)的畫碼組成的兩位阿拉伯數(shù)字構(gòu)成的筆畫碼為基本輸入單元,對于多字元字,其各字元的輸入順序以漢字規(guī)范書寫順序為準。當漢字的字元的筆畫數(shù)多于該區(qū)的最大畫碼時,采用所謂筆形碼輸入兩位阿拉伯數(shù)字的高位代表其首筆筆形的區(qū)碼,低位代表其末筆筆形的區(qū)碼。筆畫碼和筆形碼構(gòu)成拆分碼。
鑒別碼僅用在三個碼長的拆分碼仍不能唯一確定被輸入漢字時使用。分為字形鑒別碼和筆形鑒別碼兩種,字形鑒別碼由兩位阿拉伯數(shù)字代表,其高位為該字末筆筆形的區(qū)碼,其低位為以五個阿拉伯數(shù)字之一代表的字形結(jié)構(gòu)碼“1”為獨體形字;“2“為左右形字;“3”為上下形字;“4”為包圍形字;“5”為內(nèi)外形字。筆形鑒別碼亦由兩位阿拉伯數(shù)字代表(1)左右形字以第一字元末筆筆形的區(qū)碼為高位,第二字元末筆筆形的區(qū)碼為低位鑒別筆形;(2)上下形字以第二字元末筆的區(qū)碼為高位,第三字元末筆筆形的區(qū)碼為低位鑒別筆形;(3)包圍形內(nèi)外形字把外元除開后,以其他兩個字元的末筆筆形的區(qū)碼鑒別筆形。
五個輸入?yún)^(qū)可這樣劃分一區(qū)(筆形碼為“一”),首筆為“橫”的輸入?yún)^(qū)二區(qū)(筆形碼為“丨”),首筆為“豎”的輸入?yún)^(qū)三區(qū)(筆形碼為“丿”),首筆為“撇”的輸入?yún)^(qū)四區(qū)(筆形碼為“丶”),首筆為“點捺”的輸入?yún)^(qū)五區(qū)(筆形碼為“乙”),首筆為“折”的輸入?yún)^(qū)在“橫區(qū)”中拆分碼為11(M);12(N);13(B)14(V);15(C);16(X);17(Z)鍵表示起筆為橫,筆畫數(shù)分別是1至7畫的字元;在“豎區(qū)”中拆分碼為21(G);22(F);23(D)24(S);25(A)鍵表示起筆為豎,筆畫數(shù)分別是1至5畫的字元;在“撇區(qū)”中拆分碼為31(T);32(R);33(E)34(W);35(Q)鍵表示起筆為撇,筆畫數(shù)分別是1至5畫的字元;
在“點區(qū)”中拆分碼為41(Y);42(U);43(I)44(O);45(P)鍵表示起筆為點,筆畫數(shù)分別是1至5畫的字元;在“折區(qū)“中拆分碼為51(H);52(J);53(K)54(L)鍵表示起筆為折,筆畫數(shù)分別是1至4畫的字元。
鍵盤的分布規(guī)律如鍵盤圖所示。
由于本發(fā)明方法從漢字的筆形、筆畫和字形入手,充分照顧到漢字的書寫習慣,從漢字的字形規(guī)范化角度來編制漢字的輸入方法,輸入方式自然,不需要人為地記憶更多的規(guī)則,熟悉后有較高的輸入速度,尤其適合于專業(yè)錄入人員進行“無記憶輸入”。另外,采用本發(fā)明方法,初學(xué)漢字的人既能自如地輸入漢字,又能逐步掌握漢字的規(guī)范書寫方法,為漢字電腦的初級教育帶來獨到的好處。
下面,結(jié)合輸入法中的一些規(guī)定,從拆分碼的使用、拆分中的有關(guān)規(guī)定、鑒別碼的使用、疑難字的處理四個方面,通過舉例,將本發(fā)明方法作一個系統(tǒng)的詳述。
拆分碼的使用一,筆形規(guī)定漢字較早有所謂“永”字筆形法,即把漢字規(guī)定為八種筆形。1936年就有人提出“五筆形”概念,這種主張逐漸被人們接受,特別是近代,幾乎所有的詞典字書都按“五筆形”排序。這種方法可稱作“札”字筆形法,即(1)橫(包括“提”);(2)豎;(3)撇;(4)捺(包括“點”);(5)折(包括所有帶鉤、帶彎的筆形)。“漢字全形輸入法”也按照習慣把筆形規(guī)定為橫、豎、撇、點、折五種,并且,把這五種筆形劃為五個區(qū),一區(qū)為“橫”;二區(qū)為“豎”;三區(qū)為“撇”;四區(qū)為“捺”;五區(qū)為“折”。
二,字形規(guī)定文字學(xué)上只有獨體字及合體字,因為合體字中的部件可按上下、左右、內(nèi)外等方式排列,所以,漢字字形一般有獨體字、上下字、左右字、內(nèi)外字四種字形?!皾h字全形輸入法”又把內(nèi)外形字中有兩邊包圍的字規(guī)定為包圍形字,如進、遠、趙、趨、魁、歷、壓、疼、癡、摩、鏖等,把三邊及四邊包圍的字規(guī)定為內(nèi)外形字,如區(qū)、同、閑、國等。因此,“漢字全形輸入法”的字形有(1)獨體形字;(2)左右形字;(3)上下形字;(4)包圍形字;(5)內(nèi)外形字五種。
三,筆畫碼及筆形碼一個特定的漢字是由筆形、字形、筆畫數(shù)構(gòu)成的,一旦這三種因素中有一種因素出錯就會使這個字發(fā)生音義差錯。發(fā)生筆形錯誤的如千干;夭天;王壬。發(fā)生字形錯誤的如員唄;標柰;吶咼。發(fā)生筆畫數(shù)錯誤的如免兔;氏氐;厄卮。因此,“漢字全形輸入法”要求使用者不要發(fā)生上述錯誤。
“漢字全形輸入法”規(guī)定一區(qū)輸入部件筆畫數(shù)最多為七畫,其含義是這個部件起筆是“橫”筆畫數(shù)在七畫以內(nèi)(包括七畫)如“碧”字中的“王”這個部件起筆是“橫”,屬一區(qū)部件,筆畫數(shù)是四畫,輸入碼是14。其中高位的“1”代表一區(qū)(“橫”筆畫區(qū));“4”表示“王”這部件是四畫。二區(qū)、三區(qū)、四區(qū)輸入部件筆畫數(shù)最多為五畫。五區(qū)輸入部件筆畫數(shù)最多為四畫。象上述“碧”字,它的拆分碼是“王14”、“白35”、“石15”,這些部件都沒有超過各區(qū)規(guī)定的筆畫數(shù),這樣形成的編碼稱作“筆畫碼”。但是,由于漢字筆畫多少極不一致,有不少部件都超過了各區(qū)規(guī)定的筆畫數(shù),對于這些部件我們使用它們起筆的筆形與它們的末筆筆形為輸入碼,如“解”字中的“角”這個部件它的輸入碼是“32”,其中高位的“3”及低位的“2”都代表筆形,“3”是撇,“2”是豎。象這樣形成的編碼就稱作“筆形碼”。
使用本發(fā)明方法對漢字的拆分原則,可概括為四句話二十個字按規(guī)定畫碼;依筆畫順序;拆最大字元;取中部對稱。按規(guī)定畫碼“畫”指的是漢字部件能夠取的最多筆畫數(shù)。一區(qū)(橫筆形區(qū))為7畫,二區(qū)(豎筆形區(qū))、三區(qū)(撇筆形區(qū))、四區(qū)(點筆形區(qū))各為5畫,五區(qū)(折筆形區(qū))為四畫?!按a”指的是“碼長”,即一字取多少碼。“全形法”的“碼”有兩種性質(zhì),一是拆分碼,二是鑒別碼?!安鸱执a”是拆分漢字形成的編碼?!叭畏ā币?guī)定拆分碼最多為三碼長,即一個字最多拆三次。“鑒別碼”是鑒別漢字的字形或筆形的編碼,它是編碼的最后的一位。因此,一個漢字的編碼是由“拆分碼”加“鑒別碼”形成的,總碼長是四位。注意,“全形法”中并不是所有字都要輸入“鑒別碼”,有四千多字只有“拆分碼”,也就是說有四千多字是三碼字,其中在三百六十個是二碼字。
依筆畫順序依寫字的先后順序拆分漢字部件。寫字的先后順序一般不會搞錯。這里再把漢字的先后順序重申一下先橫后豎(十);先撇后捺(人);從上到下(三);從外到內(nèi)(向);先中間后左右(小);先里頭后封口(國);先旁包后里頭(歷);先里頭后旁包(這);先主體后穿心(韋);先主體后點點(戈);先點點后主體(義)。
這些方法基本上概括了漢字寫字順序。對于極少數(shù)起筆有二義性的字,這里再重新定義一下(字末編號是該字的首尾筆形)匕九幾兆35;長及34;北25;女毋母51;以54;比15;非21;山22;出52;犭豸33;力刀乃53;敝44。
字的末筆這里也再說明一下。一個字(或一個部件)的末筆大多在字的最下面如王、里、魚、點、國、早、羊。在右下,如木、頭、最、這、建、數(shù)。這是最多的兩種末筆。末筆在右上的只有戈、求、犬、尤、甫等字,這些字的共同特點是末筆只有獨立的一點。末筆在左下的字有才、犭、豸、身等字,這些字的共同特點是末筆都是撇筆形。還有一種末筆在中間的字,如冊、舟、女、子、馬、母,這些字的共同特點是,末筆都是橫筆形。末筆在內(nèi)的字有內(nèi)、同、青、月、間、魁、起等字。歸納起末筆的位置有如下這些下、右下、右上、左下、中部、內(nèi)部。
拆最大字元更明確的說是拆最大字元字。一個字作為另一個字的部件使用時它只有兩種可能性。一是作一碼輸入,二是拆分為兩碼(因為,一個字拆分碼最多只有三碼長,所以,一個字作部件使用時最多只能拆分為二碼)。拆分為二碼時,有個怎樣取碼的問題,這里我們規(guī)定取最大字元字的原則。如“舍”拆分碼是“人32干13口23”,如果把它作為“啥”字的部件使用時,它就必需拆分為兩碼,怎樣把“舍”拆分為兩碼呢?這里就要使用“拆最大字元字”的方法。所謂“拆最大字元字”是指這個部件中包含有的一個筆畫最多的字?!吧帷弊种凶畲蟮牟考质恰肮拧弊?,它就是取“拆最大字元字”的標準?!吧帷弊职选肮拧弊衷∽吆?,余下的“人一”作為一個輸入碼,“人一”共三畫,起筆是撇,它的碼值是“33”,因此,“啥”字的拆分是“口23 33古15”。有時侯一個部件中沒有包含部件字如“?!弊?,右邊的部件沒有包含部件字,但是,它有三個有稱謂的部首“ 52八32夂33”,問題是如何把為三個部件編為兩個輸入碼,這里也要采取“拆最大字元字”法。在比較最大字元時,是把首字元與末字元比較,其他字元暫時不管,把最大字元確定后,再把未確定的其他字元結(jié)合成一個輸入碼(不管余下的是一個、兩個、還是更多)。象上面的“ 、八、夂”都是有稱謂的部首字元,首字元是兩畫,末字元是三畫,因此,末字元“夂”就是我們要確定的“最大字元”碼值是“33”把這個最大字元確定以后,余下的“ 、八”合起來作為一個輸入碼,碼值是“54”(合起來共計四畫,起筆是“折”所以碼值是“54”——起筆是第五區(qū),筆畫數(shù)是四畫),這樣,“?!弊值耐暾牟鸱执a就是“43 5434”。這里還要強調(diào),“拆最大字元字”一定是把首字元與末字元相比較,不要把所有的字元都拿來相比較。比如“離”作字元使用在“籬”字中時,就不能把“離”字中的“兇”作最大字元來處理,因為“兇”不是首字元,也不是末字元。離字共十畫由“亠42兇34”及最后一個“”四畫的符號相組成,這個符號字元與“亠”比較是一個最大字元,但是,我們并沒有把它作為標準的最大字元來提取,因為它是一個沒有稱謂的符號字元(在一般的字典中無法確定它),因此,我們把衣字頭“亠”這個常用的有稱謂的部首作為最大字元來處理,把“兇”及這個符號字元作為一個輸入碼,由于這兩個字元合起的筆畫數(shù)已超過三區(qū)規(guī)定的筆畫數(shù)(兩個字元加起來是八畫三區(qū)規(guī)定筆畫數(shù)是五畫),因此就用這個字元的首尾筆形作輸入碼,碼值是“34”,于是“籬”字的拆分碼就是“竹34亠42 34”,其中一、三碼是筆形碼,第二碼是筆畫碼。以上是上下形字元的取碼方法。
包圍形及內(nèi)外形字作字元使用時,又是怎樣取最大字元呢?這里我們舉例說明。“厥”字拆分碼為“廠12 43欠34”,當它用在“蕨”字中作部件時,它只能拆為兩個拆分碼,從表面上看是乎應(yīng)該是“廠1244”,如果這樣拆就違背了取最大字元字的方法,因為“厥”字中的第一碼“廠12”是一個兩畫字,而第三碼“欠34”卻是一個四畫字,因此“欠”是最大優(yōu)選字元,把“欠34”字元取了后,“厥”就只有“廠”及一個六畫的符號字元“43(六畫符號字元的筆形碼)”,所以,這個符號字元和“廠”字元應(yīng)結(jié)合為一個輸入碼,這個輸入碼是筆形碼,碼值是“13”。不難看出“蕨”字的拆分碼應(yīng)該是“艸1213欠34”。又如“堰”字中右邊的這個部件,一般字典也沒有這個字,它是由“匚日女”三個部件組成在一、三字元中“女”是多筆畫,所以要優(yōu)選,而把“匚日”作為一個輸入碼,它是一個筆畫碼,碼值是“16”,因此,“堰”字的拆分碼應(yīng)該是“土13 16女53”這三碼都是筆畫碼。這個問題在“取中部對稱”方法中還要論述。
取中部對稱有一些漢字部件(特別是一些獨體字),它們沒有層次感,如果按筆畫順序無法取出字元字,這時就要采用“取中部對稱”的辦法來處理。如“重”字的拆分碼是“千33日24二12”其中的“千33”就是采用取中部字元的方法?!吧洹弊值牟鸱执a是“34三13寸13”,其中的“三13”也是用取中部字元的方法。
“盤”字的拆分碼是“35一11皿25”,取中部字元是“一11”。
“屬”字的拆分碼是“尸53 34口23”,取中部字元是“口23”。
“盥”字的拆分碼是“31水54皿25”,其中符號字元“31”是取對稱字元,“水54”字元是取中部字元。符號字元“31”是筆形碼,其他是筆畫碼。
“取中部對稱”的方法應(yīng)遵循兩個原則1,采用“取中部對稱”時,另一個字元應(yīng)具備不可拆分性;2,字元本身按筆畫順序取不出字元字或有稱謂的符號字元(如“離”字不能取中部的“兇”,因為按筆畫順序可以取一個“亠”字頭)。
拆分中的有關(guān)規(guī)定一,一般情況一個字應(yīng)拆分為三碼,不能拆為三碼的應(yīng)符合二碼字的條件。
二,二碼字中兩個字元必須是筆畫碼的非拆分字元。兩碼字可以取單畫的中部字元,如“工”(二12丨21)。
三,1,三碼字不能取兩個單畫字元,如“成”不能拆為“戈14丿31乙51”,因此,“成”字是兩碼字(戊15乙51)。2,不能取不按筆畫順序的單畫碼(“戈”字類字元例外)如“配”不能拆為“西16一11己53”,因此,“配”是兩碼字,拆為“酉17己53”。但允許取按筆畫順序形成的單畫字元,如“許”可拆為“讠42丿31干13”。
四,留部首字元,拆非部首字元1,部首字元與非部首字元組合的字,一般情況拆非部首字元,如“頦”拆為“44人32頁16”。
2,一個字如果由兩個部首字元組成,應(yīng)本著拆右不拆左、拆下不拆上、拆內(nèi)不拆外的原則處理,如“靚”拆為“青11冂22兒32”;“類”拆為“米44一11人32”;“魁”拆為“鬼34冫42十12”。
3,部首字元與取中部字元組合的字,一般情況可拆部首字元(除非部首字是非拆分字元,才按取中部字元的辦法處理)如“蠻”拆為“亦44中24 12”;“彎”拆為“六44 22弓53”;“齲”拆為“止24兇34禹34”;“屬”拆為“尸53 34口23”。
五,詞匯輸入法詞匯輸入法中不存在“鑒別碼”,只有“拆分碼”,因此,使用詞匯輸入更能減少記憶量,提高輸入速度。
1,二字詞每個字輸入兩碼。如“中國”一詞的輸入碼是“23 21 23 15”它們都是“筆畫碼”?!耙话恪币辉~中的“一”因為是單筆畫字,輸入碼只有一個所以“一般”一詞只有三個輸入碼“11 31 34”,三碼輸入后如果提示行是唯一的一個詞,就用“空格鍵”輸入該詞,如果不是唯一的詞就使用模擬空格鍵“Z”輸入該詞。上述的“一般”這個詞,三個拆分碼輸入完了的時侯還與“搬”發(fā)生重碼這時就使用模擬空格鍵“Z”來輸入“一般”這個詞。“唯一”這個詞的輸入碼是“23 31 11”三碼輸入后,提示行只有“唯一”一個詞,因此,就使用空格鍵直接輸入它。
2,三字詞第一個字輸入二碼,二、三字各輸入一碼,如有單畫碼,處理方法同上。如“思想性25 44 14 41”其中一、二碼是筆畫碼,三、四碼是筆形碼。
3,四字詞每個字各輸入一碼。如“愚公移山”“2434 34 23”,其中一、三是筆形碼,二、四是筆畫碼。
4,五字以上的詞按一、二、三及末字各輸入一碼。如“中華人民共和國23 32 32 21”,其中一、三是筆畫碼,二、四是筆形碼。
鑒別碼的使用一,字形鑒別全形輸入法中最大的拆分碼只有三碼長,國標漢字中約有四千二百個只有拆分碼的字(包括二拆分碼,即二碼字)。有二千四百個字需輸入全碼(即四碼長的字),這個第四碼不是拆分漢字形成的,而是一個以識別字形為標準的編碼,因此,把它稱作“鑒別碼”。其方法是以該字最后一個筆畫的筆形為“高位”該字的字形為“低位”輸入一個編碼。如“慚”它的拆分碼是“忄43車14斤34”三拆分碼輸入完了的時侯,由于它不是唯一的一個字,因此,需要輸入一個鑒別碼,“慚”字最后的筆形是“丨豎”是第二筆形,字形是左右形屬第二字形,因此,它的鑒別碼是“22”高位的“2”代表第二筆形,低位的“2”代表第二字形(左右形字)。字形鑒別法中有三類字元不作字的末筆。它們是“口”字框;“戈”字類(戊弋);“辶”字框,如“進遠蓬”等。這三類字要把帶“框”的字元去掉后,把另外一個字元的末作為個字的末筆來處理。如“崮”的字形鑒別碼是用“古”字元的末筆“橫”作字形(13)鑒別碼;“栽”字是把“16”碼的“戈”類字元去掉后,用“八”字元的末筆“點”(44)作字形鑒別碼。
二,筆形鑒別拆分碼加字形鑒別碼構(gòu)成全形輸入法。它可以滿足絕大多數(shù)人的需要,對于專業(yè)打字員要求盡量作到無重碼字,而可適當增加一定的記憶量。為滿足這部分人的需要,全形輸入法在字形鑒別法的基礎(chǔ)上,增加了筆形鑒別法,筆形鑒別法有如下幾條規(guī)定1,左右型字以第一字元的末筆字形對第二字元末筆字形。如“淞”(氵43木14公34 44)其中“44”就是一個筆形鑒別碼,它是以第一字元“氵”的末筆筆形“點”對第二字元“木”的末筆筆形“點”形成的。
2,上下型字以第二字元的末筆筆形對第三字元末筆筆形。如“菖”(艸12日24日24 11),其中“11”就是一個筆形鑒別碼,它是以第二字元“日”的末筆筆形“橫”對第三字元“日”的末筆筆形“橫”形成的。
3,有一些字元不作筆形鑒別碼使用。它們是(1)單畫碼字元;(2)末筆筆形相交叉的字元。如“又車牛”等;(3)筆形碼字元;(4)包圍型字及內(nèi)外型的包圍碼(如辶廴勹凵匚冂囗廠廣疒戈戊),或是由兩個字元組成的包圍碼,如“馨”字中的“聲17殳34”組成“馨”字的包圍碼這兩個字元都不作“鑒別碼”使用。這里要說明一點,象“馨”字類的字,文字學(xué)上稱作上下型字,在“全形法”中我們把類字稱作“包圍型”字,因為,這類字上下界限不明顯,“香”有部分被包圍的特征。屬于這類字的還有“人”“八”“夂”“大”字頭的字,如“公分合各”等。注意,不要把“甕”這樣字當作“包圍型”字處理,它是“上下型”字。
4,一個字中如有一個非鑒別字元,就以另外兩個字元的末筆形作鑒別碼,如“貘”是左右型字,用筆形鑒別法應(yīng)“豸”的末筆形“撇”對第二字元的“橫”筆形,但“豸”是一個筆形碼不能作鑒別碼使用,因此就用第二字元的末筆筆形“橫”對第三字元的末筆筆形“點”,所以,“貘”字的筆形鑒別碼是“14”,它的全碼是“33 17 13 14”,第一碼是筆形碼,二、三碼是筆畫碼,最后是筆形鑒別碼。如果一個字中有兩個非鑒別碼,就用另一字元的首尾筆形作鑒別碼,如“軫”字中的“車”與“人”都是非鑒別碼,就用“彡”這個字元的首尾筆形“33”作“軫”字的筆形鑒別碼。
5,筆形鑒別法一般使用在有三個拆分碼的字中,只有6個二拆分碼的字使用了筆形鑒別法。這6個字是仉32 3225;圮13 53 15;叱23 32 21;叻23 52 21;儷32 17 24;溈43 44 44。使用筆形鑒別這種方法后,幾乎達到無重碼。
三,特殊識別除了上面講到的“字形鑒別法”、“筆形鑒別法”外,專業(yè)打字員還要記住17個特殊識別字,這樣就可以作到完全無重碼。這17個字中,有14個最后一碼是“Z”鍵,它們是“洛潑冉佑趾蕕岢岬廨淅潸轱飚綦”。有三個字最后一碼是“X”鍵,它們是“恪澌巳”。
這里需要說明的是,不管你使用哪種鑒別方法,拆分法是完全一致的。
鍵盤的規(guī)定 從鍵盤圖上可以看出“全形法鍵盤”分布得非常有規(guī)律。最下面的MNBVCXZ七個英文鍵對應(yīng)著“全形碼”一區(qū)的11、12、13、14、15、16、17。從一區(qū)順時針往上數(shù)是二區(qū)的21、22、23、24 25;三區(qū)的31、32、33、34、35;四區(qū)的41、42 43、44、45;五區(qū)的51、52、53、54。每個鍵位上有一個高頻鍵字,鍵字的起筆筆形完全與各區(qū)相對應(yīng)。
在筆畫碼和筆形碼的論述中,我們已經(jīng)了解“全形碼”的碼值含義。這里我們再作進一步說明?!叭未a”的碼值由兩位阿拉伯數(shù)字組成,高位代表筆形,低位代表1,筆畫數(shù);2,部件(字元)末筆筆形;3,代表字形。如“部”字的拆分碼為“45 23 52”?!?5”表示“立”這個部件起筆是“點筆形”,筆畫數(shù)是五畫;“23”表示“口”這個部件起筆是“豎筆形”,筆畫數(shù)是三畫;“52”表示“阝”這個部件起筆是“折筆形”,筆畫數(shù)是二畫。
又如“解”字的拆分碼是“32 52 34”。其中“32”中的“2”表示“角”這個部件的末筆筆形是“豎筆形”,“32”這個碼就稱作“角”字元的筆形碼?!?2 34”與上述例子相同,它們都是筆畫碼。
關(guān)于碼值低位代表字形的問題已在“鑒別法”中講述。
全形法鍵盤中有三個鍵負有一些特殊的使命,它們是16(X)鍵、17(Z)鍵、51(H)鍵。16、17鍵在拆分法中只有筆畫數(shù)單義(“橫”起筆區(qū)的六畫鍵及七畫鍵)16鍵兼作了如下功能1,在二拆分碼的字中,有一部分字需要輸入字形鑒別碼,而使這部分字成為“三輸入碼”字,如果這三個輸入碼的字與三個拆分碼的字有重碼時,我們就把“Z”當作“空格鍵”來使用,稱作“模擬空格鍵”。如“仇”字的拆分碼是“32 32”,由于這兩個碼不是唯一編碼,因此,需要輸入一個字形鑒別碼“52”(“仇”是左右型字,屬第二字形,末筆是第五筆形,因此字形鑒別碼是“52”)后還與“傷”發(fā)生重碼,這時我們就用“Z”作“模擬空格鍵”使用在“仇”字的最后一碼中?!癦”作“模擬空格鍵”只限于二拆分碼的字中。
2,在專業(yè)版的“全形輸入法”中,有11個三拆分碼的字使用了“Z”鍵,這種情況下使用的“Z”,把它稱作“重碼處理鍵”。這11個字是洛佑趾蕕岢岬淅潸轱飚綦。
“17”鍵的特殊功能1,詢問鍵。(1)詢問部首符號字元。如要詢問“43”鍵上有哪些符號字元,先輸入一個“43”,接著輸入“XX”,提示行有“忄丬氵宀辶”這些都是非拆分字元。(2)詢問非拆分字元。如要詢問“14”鍵上有哪些非拆分字元,先輸入“XX”,再輸入“14”,提示行上“王韋牙瓦戈;屯巨專丐”等字,分號前的字是部首字,分號后的字是非部首字。
2,在專業(yè)版的“全形輸入法”中,有三個字的第四碼使用了“X”鍵,在這里“X”也稱作“重碼處理鍵”。這三個字是“恪澌巳”。
“51”鍵的特殊功能由于五區(qū)只有四個鍵,它處理部件的筆畫數(shù)最多只有四畫。如果要在五區(qū)處理第五筆形和第五字形,也就是說如果要五區(qū)輸入“55”這個碼,我們就使用“51”鍵來代替“55”,從而使“51”鍵具有“51”與“55”雙重功能。如鼐(乃52目25 51)其中“51”是一個八畫的筆形碼,本來應(yīng)該是“55”碼,由于沒有“55”這個碼,因此輸入一個“51”雙功能鍵。旎(方44 32尼51),其中“51”碼與“鼐”字中的“51”碼屬于一種情況,都是筆形碼。園(口23二12兒32 51)其中“51”是字形鑒別碼,“園”字是第五字形,本來應(yīng)該輸入“55”字形鑒別碼,由于沒有“55”鍵,因此用“51”鍵代替?!岸凇?口23屯54 51)其中“51”是二拆分字“囤”的字形鑒別碼,情況同“園”字中的“51”,都是字形鑒別碼。
疑難字一,取中部字元的字1,作字元使用時的拆法束1423 更1324 雨1444 身3413 舟3511 母5411來1542 夾1442 衍3543 垂3315 重3321 乘3525聿5412 禹3423 巫1334 亦4422 吏1323 夷1353肅5434 非2424 兆3244 五1252 曲2422 金3142隸5354 事1751 函5242 發(fā)54412,整字的拆法亦423232 惠142444 軎162123 爽133434 盥315425柬112523 妻125353 秉335332 胤325324 淵433244脊443224 曲221311 喪134253 兜343532 赍143424轡511423 噩142121 懋145344 燮444152 蘅123534棘161422 函524452 承521353 丞515411 互125211隸535144 事145351 乎314212 身331331 舟334211二,取最大字元的字1,作字元使用時的拆法甫1324 皮5352 我3314 成1551 戊1431 兼4232州4333 延3452 廷3452 高4523 商4423 魚3221卑3533 者1335 老1432 考1333 言4423 黑2144衣4234 厥1334 弟4253 鹿4114 敝4434 茶1514余3314 黃1132 善4123 喜1641 兼42322,整字的拆法拾113323 啥233315 搽111514 荼123314 睦251513凌421335 悻431513 俊325433 稿354523 高452223商453223 熵444423 摘114515 洞432323 堰131653镢351334 鱟434231 覺434224 黌434214 窖453423澇431344 善424323 膳344241 兼421632 卸332452豕123332 廷331152 臣1422 瓦115341 牙1153雀233241 長3341 爿5321 弟425322 裁121444截121431 哉121423 栽161232 載161212 戴162516武111324 睫251632 敝422534 心4242 兼421632三,類似字元1,“捋”與“將”(注意右邊字頭)2,“家”與“啄”(“家”字中的“豕”字元無點,7畫)3,“肺”與“柿”(“肺”字右邊不是“市”字,拆為“一11巾23”)4,“假”與“鍛”(注意右邊字元)四,起筆難確定及筆形難確定的字1,起筆難確定的字匕九幾兆35;長及34;北25;女毋母51;以54;比14;非21;山22出52;犭豸33;力刀乃53;敝44。
2,筆形難確定的字2.1“冫”;“氵”“關(guān)”字頭;“學(xué)”字頭;“雨”字中的四點;“麗”字的兩點;“火”字中除“人”字元的兩點;“年”字中的一點;“兆”字中的四點都是第四筆形(即“點”筆形)。一般來說短撇(如“關(guān)”字中的第二筆)、短提(“氵”中的第三筆)和連續(xù)形成的點(如“點”字中的最后的四點)或者在字中間(如“年”第四筆“麗”字中的末筆“鼠”字中的第七、八及第十、十一筆)不太好確定的筆形,都可以認定為“點”筆形。
2.2豎撇(即以豎筆形為主收筆時略帶撇的筆形。如“齊”字中的最后兩筆)與豎筆形組成的兩畫字元,(豎撇與兩豎筆組成的字元起筆為撇,碼值為“33”如由“川”字組成“順”碼值為“331224”。)起筆定為“豎”筆形,碼值為“22”。如“齊”的拆分碼為“4422”加字鑒碼后“齊”字的全碼為“442224”。另外,“亦”字中的第三畫與第四畫不能定為“22”因為,第四畫不是“豎”筆,而是帶鉤的折筆形。所以,它的拆分碼是“423232”現(xiàn)代漢字中以“亦”為字元的字只有“跡、弈、奕”。(注意,不要把“戀”字頭當成了“亦”字,“戀”字頭是簡化了的偏傍,它帶有符號字元的性質(zhì)。)2.3“月”字是用得比較多的字元,它一般用在字的左(刖)、右(朝)、下(青、胃、背、骨),在下的“月”起筆為豎可以拆分為“2212”。左右“月”不能拆分碼值為“34”。因為,在下的“月”只是“月”意符,不能作字獨立使用。左右“月”是部首字元字。全形碼規(guī)定部首字元字如果拆不出一個相等(或多)筆畫數(shù)的部首字元字為非拆分字元。(注意一定是在規(guī)定的筆畫數(shù)范圍內(nèi)。)另外,左右“月”在仍何字中起筆都作“撇”。如“輸”為“143335”該字中的“月”,既可寫成豎筆也可寫成撇筆,都不會發(fā)生識字上的錯誤,為記意的原因,所以,左右“月”在仍何字中都作撇筆。
2.4“用”字作字元使用時,在仍何地方起筆都是撇。如“甭143421”“擁113421”。
權(quán)利要求
1.漢字全形碼輸入法,以漢字的筆形特征、筆畫特征以及字形特征進行編碼輸入計算機,其特征在于a)采用由兩位阿拉伯數(shù)字為單元的拆分碼和鑒別碼對漢字或字元進行編碼輸入;b)根據(jù)漢字書時的起筆筆形(橫、豎、撇、捺(點)、折),將計算機英文字母鍵盤劃分為五個輸入?yún)^(qū),給出相應(yīng)的區(qū)碼。每個輸入?yún)^(qū)中由代表不同筆畫數(shù)(畫碼)的編號按鍵組成;漢字的字元(或稱作部件)以其起筆筆形的區(qū)碼和其筆畫數(shù)的畫碼組成的兩位阿拉伯數(shù)字構(gòu)成的筆畫碼為基本輸入單元;當漢字或字元的筆畫數(shù)多于該區(qū)的最大畫碼時,采用所謂筆形碼輸入,兩位阿拉伯數(shù)字的高位代表其首筆筆形的區(qū)碼,低位代表其末筆筆形的區(qū)碼;筆畫碼和筆形碼構(gòu)成拆分碼;c)鑒別碼僅用在三個碼長的拆分碼仍不能唯一確定被輸入漢字時使用,鑒別碼分為字形鑒別碼和筆形鑒別碼兩種,字形鑒別碼以兩位阿拉伯數(shù)字代表,其高位為該字末筆筆形的區(qū)碼,其低位為以五個阿拉伯數(shù)字之一代表的字形結(jié)構(gòu)碼“1”為獨體形字;“2”為左右形字;“3”為上下形字;“4”為包圍形字;“5”為內(nèi)外形字;筆形鑒別碼亦由兩位阿拉伯數(shù)字組成(1)左右形字以第一字元末筆筆形的區(qū)碼為高位,第二字元末筆筆形的區(qū)碼為低位鑒別筆形;(2)上下形字以第二字元末筆的區(qū)碼為高位,第三字元末筆筆形的區(qū)碼為低位鑒別筆形;(3)包圍形內(nèi)外形字把外字元除開后,以其他兩個字元的末筆筆形的區(qū)碼鑒別筆形。
2.根據(jù)權(quán)利要求1所述之全形碼輸入法,其特征在于a)所述五個輸入?yún)^(qū)是這樣劃定的一區(qū)(筆形碼為“一”),首筆為“橫”的輸入?yún)^(qū)二區(qū)(筆形碼為“丨”),首筆為“豎”的輸入?yún)^(qū)三區(qū)(筆形碼為“丿”),首筆為“撇”的輸入?yún)^(qū)四區(qū)(筆形碼為“丶”),首筆為“點捺”的輸入?yún)^(qū)五區(qū)(筆形碼為“乙”),首筆為“折”的輸入?yún)^(qū)b)在“橫區(qū)”中拆分碼為11(M);12(N);13(B)14(V);15(C);16(X);17(Z)鍵表示起筆為橫,筆畫數(shù)分別是1至7畫的字元;在“豎區(qū)”中拆分碼為21(G);22(F);23(D)24(S);25(A)鍵表示起筆為豎,筆畫數(shù)分別是1至5畫的字元;在“撇區(qū)”中拆分碼為31(T);32(R);33(E)34(W);35(Q)鍵表示起筆為撇,筆畫數(shù)分別是1至5畫的字元;在“點區(qū)”中拆分碼為41(Y);42(U);43(I)44(O);45(P)鍵表示起筆為點,筆畫數(shù)分別是1至5畫的字元;在“折區(qū)“中拆分碼為51(H);52(J);53(K)54(L)鍵表示起筆為折,筆畫數(shù)分別是1至4畫的字元。
全文摘要
本發(fā)明公開了一種漢字全形碼輸入方法,根據(jù)漢字自然書寫時的筆形特征、筆畫特征及字形特征,在計算機鍵盤上劃分出“橫”、“豎”、“撇”、“捺(點)”、“折”五個首筆形輸入?yún)^(qū),在各區(qū)中又以筆畫數(shù)設(shè)置了若干鍵碼,使用拆分碼和鑒別碼進行輸入。本方法按照漢字本身的書寫習慣,從筆形、筆畫及字形入手,自然輸入,熟悉后有很高的輸入速度,尤其適合于非專業(yè)錄入人員進行無記憶輸入。
文檔編號G06F3/023GK1118086SQ94113050
公開日1996年3月6日 申請日期1994年12月28日 優(yōu)先權(quán)日1994年12月28日
發(fā)明者吳志全 申請人:吳志全