專利名稱:自成碼(梁碼)漢字輸入編碼方案的制作方法
一種以首音為主(不分平卷舌)、以形音為輔,最大碼長為四鍵的漢字輸入法(第一鍵為漢字首音,二鍵三鍵為首尾形音,四鍵為識別碼)。該碼根據(jù)漢字中形聲字占80%以上的事實對形聲字簡化取碼。該碼用26鍵位(含學(xué)習(xí)鍵),最大特點是完全符合漢字的語音、書寫規(guī)范,極少人為規(guī)則。25鍵形音對應(yīng)簡單自然,過目不忘,充分利用了人們的漢字知識,是一種友好易學(xué)、準確高效的漢字輸入法?!白猿纱a”含義有二1.由漢字的自然規(guī)律造就而成;2.自己就可學(xué)成,無需專門培訓(xùn)。
80年代以來,在計算機漢字編碼的發(fā)展道路上,無論是音碼、形碼還是音形碼都在朝著一個逐漸明朗的目標邁進即最大限度地減少人為規(guī)則,遵從漢字的語音、書寫規(guī)范,將人們的漢字知識自然滲透到輸入法當中,簡言之就是要向“無編碼”輸入法這一極限目標靠進。從最初追求高速度、無重碼,到今天的“智能拼音”和各種含有二次編碼的“拼音一漢字”整句輸入系統(tǒng),人們對輸入法理想境界的追求已經(jīng)十分迫切了。能否摒棄備種繁索規(guī)則,忘掉可惡的字根表,在簡易高效并舉的同時,又很好地兼顧“字”與“詞”這兩個方面,該碼的創(chuàng)新在于①首次打破了字根與非字根的界限,開創(chuàng)了“讀出音來即字根,首尾(指一鍵、三鍵)重音對半分”的起然境界;②該碼的第二個突破是實現(xiàn)了由形到形音的轉(zhuǎn)換(避免了多余的筆劃拆分)形音并舉,溶匯了人們最自然、最基本的語文知識,這是其它技術(shù)無法代替的社會優(yōu)勢,是‘知識遷移’的充分必要條件。
經(jīng)驗表明,在漢字的自然屬性中針對“形”的定性、定量通常是較難把握的,因而眾多形碼都有字根不統(tǒng)一,拆法不統(tǒng)一,排列無規(guī)律(自然規(guī)律)等弊端,甚至輸入一個極簡單的漢字也要大費周折,這是對人工創(chuàng)造規(guī)范的無言嘲弄。相反,以語音知識為背景(這里特指漢字的首音和形音面丟棄韻母、聲調(diào)等其它因素),加上最簡單的基本筆劃及部首相輔,它的簡明易學(xué)性是勿容質(zhì)疑的。正如人們識字,首先是記住它念什么,上邊是什么、下邊是什么(是盡可能大的分塊記憶而不是肢解成許多部件),只有那些筆形零散的漢字(如商、率、飛等)人們才進一步描述其筆劃??梢哉f,這是一種約定成俗的、最自然最流暢的思維方式,是每個社會成員既有知識體系的基礎(chǔ)。例如“李”、“國”、“章”三個漢字,按“木、子”,“口、玉”、“立、早”來拆分是最自然不過了。但能否每個漢字都這樣拆分呢?請看下面的漢字“拉、攏、掄、摟、拎、攔、攬、撈、擂、擄”,如果第一鍵用其聲母,再按成字取其音的方式組碼,則上面10個漢字的編碼都將是LTL”。問題的關(guān)鍵十分明顯形聲字所內(nèi)含的“聲源字”(本法特指某字的第二形碼本身是成字且與整個字首音相同)將帶來大量的重碼,而解決這一矛盾的最好方法是“聲源形碼不取全”,我們規(guī)定凡此種情況一律用“聲源字的后一半”(按成字拆分原則所得)代替“聲源字”(如再次重復(fù)可不必理會,即只回避一次)。如此做法既順應(yīng)了“首、尾取碼”的大趨勢(這樣取碼歧義最小),又巧妙地兼顧了既使有對“形聲字”的判斷模糊,也跑不出‘兩種認識,殊途同歸’的正確結(jié)果。例如,漢字“擄”,無論是否看由它是“形聲字”,其形碼均為‘扌、力’。本輸入法的核心正在于此。
以下按字、詞兩個部分敘述本方法主要內(nèi)容。
一、單字編碼單字最大碼長為四碼第一鍵(首)音碼,第二、三鍵形音碼,第四鍵為識別碼。(另有一、二級簡碼及三級碼)1、音碼部分本輸入法首音不必區(qū)分平卷舌。26個英文字母中,除了“U”、“I”兩鍵不用,“Z”鍵用作學(xué)習(xí)鍵(該鍵位靈敏度較差),其它鍵位安排如下用“V”代表首音“z”和“zh”;用“C”代表首音“c”和“ch”;用“S”代表首音“s”和“sh”,其它首音用原來字母。
2、形碼部分(1)非形聲字編碼“自然拆成兩部分,拆得成字取字音,拆不成字取部首,寧大勿小奔兩頭”。
所謂“自然拆分”即按漢字的書寫順序(從左至右,從上至下,先外后內(nèi))把漢字拆成兩半(單筆劃漢字重復(fù)取碼)。因有“取大為先”的原則,下面幾種情況我們做為規(guī)定①某些漢字的中間部分既可算作前一半,又可算作后一半(往上往下都能構(gòu)成成字)的,本法約定此種情況一律顧前不顧后。(比如,“天”字分為“二、人”,“卡”字分為“上、卜”,“舌”字分為“千、口”)。一種情況作為例外根據(jù)人們的認識習(xí)慣對左右結(jié)構(gòu)的漢字要按相反規(guī)則劃分,即左右結(jié)構(gòu)的漢字凡中間部分可前可后的一律前者讓后者。(比如,“樹”字分為‘木、對’,“做”字分為‘亻、故’)。②從直觀出發(fā),“口”字做為方框內(nèi)含其它筆劃的(本條專指那些內(nèi)含筆劃不沖出“口”字,只在“口”當中的),按筆順本應(yīng)是最后封口。我們約定方框“口”作為一個成字筆順在前,內(nèi)含的筆劃筆順在后(比如,“國”字分為“口、玉”)。僅此特例,其它一律按書寫順序。
所謂“拆得成字取字音”,是指自然拆分中遇到的成字我們?nèi)∑涫滓簟P枰獜娬{(diào)說明,本法所說的成字一律指內(nèi)含于某個漢字中的“簡單、常用”字——所說常用即比較生僻的成字(如茍、酉、缶、圭等)不在此列;所說簡單即以大多數(shù)小學(xué)生都可認得為準。反之,小學(xué)們不常用、不熟悉的字不在此列(如“妾”、“俞”、“厄”等)。另外,遇有多音字做內(nèi)含字的情況,我們均取其明顯常用的首音(如“會”取首音“h”,“參”取首音“c”)。以下五個漢字“長、重、朝、樂、辟”兩種讀音均較常用,故特殊規(guī)定這幾個字做內(nèi)含字由現(xiàn)時不視為成字(需進一步拆分)。
所謂“拆不成字取部首,寧大勿小奔兩頭”指若拆得的兩半(或其中某一半)構(gòu)不成字,則按前半靠前取,后半靠后取(兩頭奔)的方法取其字根或部首(取大為先)。如“疆”字分為“弓、一”,“兩”字分為“一、從”。
(2)形聲字編碼“形聲起源在后半,聲源形碼(聲源字)不取全;一分為二擇其后,順應(yīng)首尾聽自然”。
所謂“形聲字”這里定義為“某字其第二形碼(全碼的第三鍵)是成字且與整個字首音相同(如“紡”、“浪”等)。稱其為形聲字。
所謂“聲源字”即形聲字后一半所含的成字,(如前例的“方”和“良”)。
所謂“不取全”即把聲源字按整字的拆分原則再度分半并取其后半(如“理”分為“王、二”,“撈”分為“扌、力”)。
有些漢字按“不取全”規(guī)則回避之后,仍然出現(xiàn)首尾重音(指一鍵、三鍵相同)的情況,這時可不再理會,該是什么就是什么(即只回避一次)。例如“援”字的形碼初分是“扌、友”,回避后是“扌、又”,至此不用再分。
另外,以上所說回避均是針對形聲字的內(nèi)含成字所講,而那種雖有一鍵、三鍵相重(字母相同),但第三鍵不是成字[另及兩個單筆劃漢字‘一’(本法歸為橫即H)和‘乙’(本法歸為勾即G)],此種情況不屬回避之列,盡可照打。
3、識別碼首先需要闡明,按本法的取碼方式,一、二、三鍵之后大多數(shù)漢字可以唯一確準。若令其到位,最簡捷的方法是加補空格(按組碼的思維節(jié)奏這也是十分明顯的),我們把“一二三+空格”即可到位的漢字編碼稱為“三級碼”(換個說法也可叫‘空’識別),這是單字編碼最主要的部分。
除三級碼外,還有些單字三鍵之后會有重碼,需第四鍵進一步敲定,為此我們按以下五種基本筆劃將鍵盤分成五個區(qū),每個區(qū)又分成五個(或四個)鍵位,區(qū)位交叉確定末筆識別鍵。(詳見附圖
4)五種基本筆劃扭(含帶勾的彎或折,如本法定義的‘刀、勾’)橫、豎、撇、點(捺),數(shù)字代號依次為0,1,2,3,4。如此規(guī)定可讓雙手的一二三四指與各區(qū)的1234代碼基本對應(yīng)。
扭區(qū)B(扭扭)V(扭橫)C(扭豎)X(扭撇)N(扭點)橫區(qū)G(橫扭)F(橫橫)D(橫豎)S(橫撇)A(橫點)豎區(qū)H(豎扭)J(豎橫)K(豎豎)L(豎撇)M(豎點)撇區(qū)T(撇扭)R(撇橫)E(撇豎)W(撇撇)Q(撇點)點區(qū)Y(點扭)U(點橫、點豎)O(點撇)P(點點)用數(shù)字方式表示更加簡捷
0區(qū)B(00)V(01)C(02)X(03)N(04)1區(qū)G(10)F(11)D(12)S(13)A(14)2區(qū)H(20)J(21)K(22)L(23)M(24)3區(qū)T(30)R(31)E(32)W(33)Q(34)4區(qū)Y(40)U(41、42)O(43)P(44)識別方法概括如下“末筆識別不用背,末一是區(qū)末二位,”“單筆收口算例外,末一末二往前推。”所謂末筆是指編碼的第三鍵(或者說形碼第二鍵)即形碼的末筆。
末一末二是指打入的末筆筆形按書寫順序的第一筆和第二筆(每筆都有扭、橫、豎、撇、點、五種情況)。比如,漢字“撥、扳、播、扮”四個字的前三碼都是BTF,而三個字的末筆筆形分別是“發(fā)、反、番、分”,按照上面所述的方法“撥”字的末一和末二是“扭、撇”(其識別鍵為X),“扳”字的末一和末二是“撇、撇”(其識別鍵為W),“播、扮”兩字的末一和末二都是“撇、點”(其識別鍵為Q)。
所謂“單筆收口算例外,末一末二往前推”是指類似“太、疆”兩字的末筆形分別是“丶”和“一” (是單筆),所以它的末一、末二(不算最后的單筆)要往前推兩步即“撇、點”和“豎、橫”;另外,凡是以“口”字為末筆的(或日“收口”的),其末一、末二也要(不算口字)倒推兩筆。而不論那種情況,若退到頭即算第一筆。
當然,對于大字符集編碼,也可就末筆的識別規(guī)則細做規(guī)定,比如,“末一末二往前推”的范圍酌情加寬至‘辶、日、心、辛、又’等。
4、簡碼①一級簡碼在鍵盤上除Z鍵外的25個字母鍵上分別設(shè)置一個最常用的漢字,只需擊該鍵一次加空格便可。一級簡碼25個。
②二級簡碼二級簡碼的編碼方式是取全碼的前兩碼加上一個空格鍵即可。
5、容錯碼容錯碼的含義有兩個一個是針對那些由字形和筆順引起拆碼錯誤的,我們在條件許可的范圍內(nèi)盡量給出相容的編碼(即容納‘非故意’錯誤)。第二個含義是容納‘故意性’錯誤,有些漢字在打滿四鍵后仍然出現(xiàn)重碼,我們給重碼中的第二侯選字(第一字可不加選擇)提供一個“替補碼”。它的作用是輸入某個第二侯選字時,我們可憑經(jīng)驗直接用“替補碼”代替原來的識別碼,四鍵打出該字。如“播、扮”的四碼都是“BTFQ”,因為我們規(guī)定用“I”鍵做末筆容錯碼,所以按“BTFI”可直接打出“扮”字。
本法除了規(guī)定用“I”做單字的末筆容錯碼外(簡稱“末容”碼),還規(guī)定了用“U”鍵做詞組編碼的第三鍵容錯碼(簡稱“三容”碼)。其理由在于①“U”鍵與“I”鍵一樣有許多‘空閑時刻’比如兩者都與字音無緣;“I”鍵做第一形碼機會很少;另外“ U”做第三鍵時完全閑置(也屬故意安排)。②不同于其它編碼,為了充分擴展詞組的編碼空間,讓熟練者在多種情況下都能發(fā)揮效率四鍵選中,我們對重碼中的非首條詞組(第一條可不加選擇)提供了第三鍵的替補碼,即‘三容’碼。靈活運用,可使上萬個詞組“死里逃生”。比如“能力、努力”的編碼都是“NNLD”,熟練者可用“NNUD”直接打出排在后面的能力;再如“北京地區(qū)、邊疆地區(qū)”編碼都是“BJDQ”,為了不用選擇,可直接輸入“BJUQ”使“邊疆地區(qū)”到位。
上面兩類容錯碼,有心者可在輸入過程中憑提示窗口(對容錯碼有事前和事后預(yù)告)強化印象、逐步熟練,初學(xué)者也可不必理會。
6、學(xué)習(xí)鍵在輸入過程中,遇到某些未知的音、形或識別時,可用學(xué)習(xí)鍵查尋幫助。
(1)代替形碼或識別碼例如,對“舞”字的未筆及識別碼不清楚,可按WPZZ進行查尋。
(2)代替音碼本輸入法中,如果不知道某個字的首音,可用“U”(稱左音鍵)或“I”(右音鍵)來代替未知的首音。如此做法必要性在于形聲漢字的形碼部分在不知道首音的情況下將與原編碼不同。如“授”字,知道首音打STY,不知道首音時打?TS。如用“Z”鍵代表首音輸入ZTS將查不到原來編碼。所以我們規(guī)定用‘左音鍵’U代表“撇、點、扭”起筆的未知漢字首音,用‘右音鍵’I代表“橫、豎”起筆的未知漢字首音,后面的二、三、四碼照樣用Z代表。比如,我們不知道首音時查尋“鋰、冀”兩個字,輸入UJL和IBG即可。
二、詞組編碼1、雙字詞輸入雙字詞取每個字的前兩碼。
2、三字詞輸入三字詞取三個字的首音加第三字的第二碼。
3、多字詞輸入多字詞取前三字加上最后一字的首音。
※ 對說明書附圖的簡要說明一、說明書附圖(3)和摘要附圖中所提‘梁碼’系‘自成碼’簡稱。
二、有關(guān)說明書附圖(4)的具體說明見本說明書第4、第5頁。
三、有關(guān)說明書附圖(3)的具體說明見說明書附圖(1)和附圖(2)。
四、對說明書附圖(1)、附圖(2)的幾點說明1、以下三個成字“一”(歸作‘橫’)、“乙” (歸作‘勾’)“水”(歸作‘水’),因為這三個字按鍵不在本首音(分別是H、G、A)故型音對照表中特別列出。
2、以下三個成字“戈”、“爪”、“皿”雖然按鍵在本首音,但這三個成字不屬于本法定義的簡單常用字,故型音對照表中也特別列出。
3、除了1中所提“一、乙、水”三個字外,凡‘簡單常用字’作內(nèi)含字,形音一律用其首音代表,故型音對照表中,此類字不再列出。
4、成字按以下兩種方式產(chǎn)生的變形字,變形前后應(yīng)予同樣看待①橫變提如“王→
”、“?!鸂薄ⅰ白印荨钡?。
②彎勾變提如“九→
”、“幾→
”、“匕→
”等。
5、說明書附圖(1)、(2)中,“音形”一欄是對相應(yīng)按鍵所代表的字根(或部件)的具體說明。如“H”代表‘橫、提’等;“I”代表‘豎、豎勾’等。
權(quán)利要求
1.一種計算機漢字編碼方法,其特征在于(1)、是一種以首音為主(不分平卷舌)、以形音為輔,最大碼長為四鍵的漢字輸入法(第一鍵為漢字首音,二鍵三鍵為首尾形音,四鍵為識別碼)。(2)、關(guān)于音碼其特征是首音不區(qū)分平卷舌。26個英文字母中,除了“U”、“I”兩鍵不用,“Z”鍵用作學(xué)習(xí)鍵(該鍵位靈敏度較差),其它鍵位安排如下用“ V”代表首音“z”和“zh”;用“C”代表首音“c”和 ch”;用“S”代表首音“s”和“sh”,其它首音用原來字母。(3)、關(guān)于型碼其特征是①非形聲字編碼“自然拆成兩部分,拆得成字取字音,拆不成字取部首,寧大勿小奔兩頭”。所謂“自然拆分”即按漢字的書寫順序(從左至右,從上至下,先外后內(nèi))把漢字拆成兩半(單筆劃漢字重復(fù)取碼)。因有“取大為先”的原則,下面幾種情況我們做為規(guī)定(一)某些漢字的中間部分既可算作前一半,又可算作后一半(往上往下都能構(gòu)成成字)的,本法約定此種情況一律顧前不顧后。(比如,“天”字分為“二、人”,“卡”字分為“上、卜”,“舌”字分為“千、口”)。一種情況作為例外根據(jù)人們的認識習(xí)慣對左右結(jié)構(gòu)的漢字要按相反規(guī)則劃分,即左右結(jié)構(gòu)的漢字凡中間部分可前可后的一律前者讓后者。(比如,“樹”字分為‘木、對’,“做”字分為‘亻、故’)。(二)從直觀出發(fā),“口”字做為方框內(nèi)含其它筆劃的(本條專指那些內(nèi)含筆劃不沖出“口”字,只在“口”當中的),按筆順本應(yīng)是最后封口。我們約定方框“口”作為一個成字筆順在前,內(nèi)含的筆劃筆順在后(比如,“國”字分為“口、玉”)。僅此特例,其它一律按書寫順序。所謂“拆得成字取字音”,是指自然拆分中遇到的成字我們?nèi)∑涫滓簟P枰獜娬{(diào)說明,本法所說的成字一律指內(nèi)含于某個漢字中的“簡單、常用”字——所說常用即比較生僻的成字(如茍、酉、缶、圭等)不在此列;所說簡單即以大多數(shù)小學(xué)生都可認得為準。反之,小學(xué)們不常用、不熟悉的字不在此列(如“妾”、“俞”、“厄”等)另外,遇有多音字做內(nèi)含字的情況,我們均取其明顯常用的首音(如“會”取首音“h”,“參”取首音“c”)。以下五個漢字“長、重、朝、樂、辟”兩種讀音均較常用,故特殊規(guī)定這幾個字做內(nèi)含字出現(xiàn)時不視為成字(需進一步拆分)。所謂“拆不成字取部首,寧大勿小奔兩頭”指若拆得的兩半(或其中某一半)構(gòu)不成字,則按前半靠前取,后半靠后取(兩頭奔)的方法取其字根或部首(取大為先)。如“疆”字分為“弓、一”,“兩”字分為“一、從”。②形聲字編碼“形聲起源在后半,聲源形碼(聲源字)不取全;一分為二擇其后,順應(yīng)首尾聽自然”。所謂“形聲字”這里定義為“某字其第二形碼(全碼的第三鍵)是成字且與整個字首音相同(如“紡”、“浪”等)。稱其為形聲字。所謂“聲源字”即形聲字后一半所含的成字,(如前例的“方”和“良”)。所謂“不取全”即把聲源字按整字的拆分原則再度分半并取其后半(如“理”分為“王、二”,“撈”分為“扌、力”)。有些漢字按“不取全”規(guī)則回避之后,仍然出現(xiàn)首尾重音(指一鍵、三鍵相同)的情況,這時可不再理會,該是什么就是什么(即只回避一次)。例如“援”字的形碼初分是“扌、友”,回避后是“扌、又”,至此不用再分。以上所說回避均是針對形聲字的內(nèi)含成字所講,而那種雖有一鍵、三鍵相重(字母相同),但第三鍵不是成字[另及兩個單筆劃漢字‘一’(本法歸為橫即H)和‘乙’(本法歸為勾即G)],此種情況不屬回避之列,盡可照打。(4)、關(guān)于識別碼其特征是我們按以下五種基本筆劃將鍵盤分成五個區(qū),每個區(qū)又分成五個(或四個)鍵位,區(qū)位交叉確定末筆識別鍵。(詳見說明書附圖4)五種基本筆劃扭(含帶勾的彎或折,如本法定義的‘刀、勾’)橫、豎、撇、點(捺),數(shù)字代號依次為0,1,2,3,4。如此規(guī)定可讓雙手的一二三四指與各區(qū)的1234代碼基本對應(yīng)。扭區(qū)B(扭扭)V(扭橫)C(扭豎)X(扭撇)N(扭點)橫區(qū)G(橫扭)F(橫橫)D(橫豎)S(橫撇)A(橫點)豎區(qū)H(豎扭)J(豎橫)K(豎豎)L(豎撇)M(豎點)撇區(qū)T(撇扭)R(撇橫)E(撇豎)W(撇撇)Q(撇點)點區(qū)Y(點扭)U(點橫、點豎)O(點撇)P(點點)用數(shù)字方式表示更加簡捷0區(qū)B(00)V(01)C(02)X(03)N(04)1區(qū)G(10)F(11)D(12)S(13)A(14)2區(qū)H(20)J(21)K(22)L(23)M(24)3區(qū)T(30)R(31)E(32)W(33)Q(34)4區(qū)Y(40)U(41、42)O(43)P(44)識別方法概括如下“末筆識別不用背,末一是區(qū)末二位,”“單筆收口算例外,末一末二往前推?!彼^末筆是指編碼的第三鍵(或者說形碼第二鍵)即形碼的末筆。末一末二是指打入的末筆筆形按書寫順序的第一筆和第二筆(每筆都有扭、橫、豎、撇、點、五種情況)。比如,漢字“撥、扳、播、扮”四個字的前三碼都是BTF,而三個字的末筆筆形分別是“發(fā)、反、番、分”,按照上面所述的方法“撥”字的末一和末二是“扭、撇”(其識別鍵為X),“扳”字的末一和末二是“撇、撇”(其識別鍵為W),“播、扮”兩字的末一和末二都是“撇、點”(其識別鍵為Q)。所謂“單筆收口算例外,末一末二往前推”是指類似“太、疆”兩字的末筆形分別是“丶”和“一”(是單筆),所以它的末一、末二(不算最后的單筆)要往前推兩步即“撇、點”和“豎、橫”;另外,凡是以“口”字為末筆的(或日“收口”的),其末一、末二也要(不算口字)倒推兩筆。面不論那種情況,若退到頭即算第一筆。對于大字符集編碼,也可就末筆的識別規(guī)則細做規(guī)定,比如,“末一末二往前推”的范圍可酌情加寬至‘辶、日、心、辛、又’等。(5)、關(guān)于容錯碼其特征是容錯碼的含義有兩個一個是針對那些由字形和筆順引起拆碼錯誤的,我們在條件許可的范圍內(nèi)盡量給出相容的編碼(即容納‘非故意’錯誤)。第二個含義是容納‘故意性’錯誤,有些漢字在打滿四鍵后仍然出現(xiàn)重碼,我們給重碼中的第二候選字(第一字可不加選擇)提供一個“替補碼”。它的作用是輸入某個第二侯選字時,我們可憑經(jīng)驗直接用“替補碼”代替原來的識別碼,四鍵打出該字。如“播、扮”的四碼都是“BTFQ”,因為我們規(guī)定用“I”鍵做末筆容錯碼,所以按“ BTFI”可直接打出“扮”字。本法除了規(guī)定用“I”做單字的末筆容錯碼外(簡稱“末容”碼),還規(guī)定了用“U”鍵做詞組編碼的第三鍵容錯碼(簡稱“三容”碼)。其理由在于(一)“ U”鍵與“I”鍵一樣有許多‘空閑時刻’比如兩者都與字音無緣;“I”鍵做第一形碼機會很少;另外“U”做第三鍵時完全閑置(也屬故意安排)。(二)不同于其它編碼,為了充分擴展詞組的編碼空間,讓熟練者在多種情況下都能發(fā)揮效率四鍵選中,我們對重碼中的非首條詞組(第一條可不加選擇)提供了第三鍵的替補碼,即‘三容’碼。靈活運用,可使上萬個詞組“死里逃生”。比如“能力、努力”的編碼都是“NNLD”,熟練者可用“NNUD”點接打出排在后面的能力;再如“北京地區(qū)、邊疆地區(qū)”編碼都是“BJDQ”,為了不用選擇,可直接輸入“BJUQ”使“邊疆地區(qū)”到位。
2.如權(quán)利要求1所述漢字編碼方法的鍵盤音、形對應(yīng)關(guān)系及識別區(qū)位的對應(yīng)關(guān)系,其特征在于采用如說明書附圖(1)、(2)、(3)、(4)[或略做變動]進行漢字編碼。
3.如權(quán)利要求1所述的漢字編碼方法,其特征是按與權(quán)利要求1所述的形聲字簡化取碼方法相類似的方法對形聲字簡化取碼(包括(1)擴大或縮小形聲字的概念,如規(guī)定凡某字的內(nèi)含字與整個字首音相同即定義為形聲字;(2)擴大或縮小簡化范圍,如依據(jù)漢字結(jié)構(gòu)不同對形聲字進行簡化;(3)采取其它方法進行簡化,如靠前取碼等。)
4.采用如權(quán)利要求1所述的漢字編碼方法(將鍵盤上都首轉(zhuǎn)換成繁體部首或做局部改動)對繁體漢字進行編碼,其特征是采用說明書所述的形、音取碼方法(或僅是鍵盤對應(yīng)關(guān)系不同)對漢字進行編碼。
5.采用如權(quán)利要求1所述的漢字編碼方法對字典、詞典進行編碼,其特征是按權(quán)利要求1所述漢字編碼方法對字典、詞典進行編碼。
6.采用如權(quán)利要求1所述的漢字編碼方法對文字資料進行索引,其特征是按權(quán)利要求1所述漢字編碼方法對文字資料進行索引。
全文摘要
一種以首音為主(不分平卷舌)、以形音為輔(盡量取其內(nèi)含字音),最大碼長為四鍵的漢字輸入法(第一鍵為漢字首音,二鍵三鍵為首尾形音,四鍵為識別碼)。該碼根據(jù)漢字中形聲字占80%以上的事實對形聲字簡化取碼。該碼用26鍵(含學(xué)習(xí)鍵)最大特點是完全符合漢字的語音、書寫規(guī)范,極少人為規(guī)則。25鍵形音對應(yīng)簡單、自然,過目不忘,充分利用了人們的漢字知識,是一種友好易學(xué)、準確高效的漢字輸入法。
文檔編號G06F3/023GK1177132SQ9711286
公開日1998年3月25日 申請日期1997年7月20日 優(yōu)先權(quán)日1997年7月20日
發(fā)明者梁大石, 梁大成 申請人:梁大石