專利名稱:計算機漢字鍵位碼輸入方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于將要處理的數(shù)據(jù)轉(zhuǎn)變成為計算機能夠處理的形式的輸入裝置,更具體地涉及一種計算機漢字鍵位碼輸入方法。
現(xiàn)有漢字編碼方案按類別可主要分為音碼類、形碼類、音形混合類。
音碼類歸范易學(xué),與漢字識字教育保持一致,其鍵符安排借用英文鍵位、序性好、能與漢字檢索保持一致,能直接翻頁檢索,對讀得準(zhǔn)音的字輸入較方便。由于聲母與韻母組合實際使用號碼數(shù)口有幾百種,故重碼字較多,但能通過翻頁的方式逐字查找、碼長最多可達六位,雖能用縮位方向解決,實際輸入速度較慢,但初學(xué)者易上手。
形碼類一般按字根塊組合歸類、采用不等長碼,碼長取全為四位,無漢字鍵位系統(tǒng),故字根組合形式多變,且多為專門設(shè)計,不能對所選取的漢字要素進行嚴(yán)格的定性定量故規(guī)范性差,但重碼率較低,對專業(yè)人員或熟練掌握者輸入速度較快。對一般學(xué)習(xí)者而言,學(xué)習(xí)難度較大,且學(xué)后易忘。不易與漢字識字教育保持一致,屬難學(xué)易用型。
音形混合類是一類集音碼和形碼于一體的混合式的漢字編碼方法。此類編碼將音碼及形碼要素進行提煉歸類并加以壓縮,其用意既考慮音碼的規(guī)范,又顧及形碼的難學(xué),碼長一般取三至四位,重碼率較低。采用此類方案的目的是為了降低重碼率和減輕學(xué)習(xí)難度。這類編碼與形碼相比,學(xué)習(xí)難度有所降低,與音碼相比其規(guī)范性則受到了破壞,而對于普通學(xué)習(xí)者來說,學(xué)習(xí)難度仍然較大。
本發(fā)明的目的是針對上述諸種計算機輸入方法存在的缺點,提出一種計算機漢字鍵位碼輸入方法。
為了實現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案,該輸入方法包括以下步驟a,將計算機通用鍵盤分成六個區(qū),即上橫區(qū)、右豎區(qū)、左撇區(qū)、下點區(qū)、交折區(qū)、獨單區(qū),每個區(qū)包含有橫、豎、撇、點、折五個筆形位,上橫區(qū)與下點區(qū)、左撇區(qū)與右豎區(qū)、交折區(qū)與獨單區(qū)均為相互對應(yīng)區(qū),鍵盤上每個鍵位上包含英文字母或符號、筆形區(qū)間、位置區(qū)間、筆形位四個要素;b,將漢字用取部首的方法拆分成產(chǎn)首和非部首部分,根據(jù)每部分的頭部和尾部要素并按排列順序拆分成起筆碼、部首碼、結(jié)構(gòu)碼、補位碼四個碼,每一個碼由筆形區(qū)間或位置區(qū)間與筆形位兩個要素決定,每個碼相對應(yīng)于通用鍵盤上的一個鍵位,不足四碼的則可取起筆碼、部首碼、結(jié)構(gòu)碼、補位碼四碼中的任何一至三個碼;c,在計算機通用鍵盤上輸入與所要輸入漢字的相對應(yīng)的碼。
顯然,由于本發(fā)明將計算機通用鍵盤設(shè)計成六個區(qū),每個區(qū)包含有橫、豎、撇、點、折五個鍵位,將漢字用取部首的方法拆分成產(chǎn)首和非部首部分,根據(jù)每部分的頭部和尾部要素并按排列順序拆分成起筆碼、部首碼、結(jié)構(gòu)碼、補位碼四個碼,每一個碼由筆形區(qū)間或位置區(qū)間與筆形位兩個要素的有機組合,能對漢字要素定性定量,并使?jié)h字具有序性。不僅能對全部簡體字、詞編碼,用同樣方法,還能對全部繁體字或大字符集進行編碼,使?jié)h字在編碼、資料檢索,字、詞典編纂,教學(xué)等諸領(lǐng)域?qū)崿F(xiàn)應(yīng)用一體化,既能按鍵位的方向進行操作,也能用序性的方向直接翻頁進行檢索。此外,所采用的漢字信息要素、漢字的拆分均以拆部首的方式處理的,對筆形、筆順的處理國家已作了規(guī)范。所以非專業(yè)人員均能輕易掌握,一般具備小學(xué)三年級文化程度者經(jīng)短時間的學(xué)習(xí),便能基本掌握這一輸入方法。
下面結(jié)合附圖和實施例,對本發(fā)明作一較為詳細地說明
圖1為本發(fā)明鍵盤A至?共30個鍵位對照示意圖。
圖2為本發(fā)明簡碼鍵位對照示意圖。
圖3為利用本發(fā)明的方法進行單字漢字編碼示例表。
圖4為利用本發(fā)明的方法進行詞組漢字編碼示例表。
圖5為本發(fā)明數(shù)字鍵盤鍵位對照示意圖。
圖6為利用本發(fā)明的方法進行漢字檢索序性圖。
請參閱圖1所示,本發(fā)明首先將計算機通用鍵盤分成六個區(qū),即上橫區(qū)、右豎區(qū)、左撇區(qū)、下點區(qū)、交折區(qū)、獨單區(qū),每個區(qū)包含有橫、豎、撇、點、折五個筆形位,鍵盤上每個鍵位上包含英文字母或符號、筆形區(qū)間、位置區(qū)間、筆形位四個要素,左上角為英文字母或符號,右上角為筆形區(qū)間,左下角為位置區(qū)間,右下角為筆形位。所說的通用鍵盤的上橫區(qū)包括鍵位Q、W、E、R、T,下點區(qū)包括鍵位H、J、K、L、,左撇區(qū)包括鍵位A、S、D、F、G,右豎區(qū)包括鍵位Y、U、I、O、P,交折區(qū)包括鍵位Z、X、C、V、B,獨單區(qū)包括鍵位N、M、<、>、?。
所說的上橫區(qū)鍵位Q、W、E、R、T與筆形位“折、點、撇、豎、橫相對應(yīng),下點區(qū)鍵位H、J、K、L、與筆形位”橫、豎、撇、點、折相對應(yīng),左撇區(qū)鍵位A、S、D、F、G與筆形位“折、點、撇、豎、橫”相對應(yīng),右豎區(qū)鍵位Y、U、I、O、P與筆形位“橫、豎、撇、點、折”相對應(yīng),交折區(qū)鍵位Z、X、C、V、B與筆形位“折、點、撇、豎、橫”相對應(yīng),獨單區(qū)鍵位N、M、<、>、?與筆形位“橫、豎、撇、點、折”相對應(yīng)。
也就是說,每個區(qū)均由五個筆形位組成。五個筆形位分別由橫、豎、撇、點、折五種筆形。
筆形位排列的規(guī)律按橫、豎、撇、點、折順序從鍵位對照圖的中間向兩邊排列。位置區(qū)間按漢字的結(jié)構(gòu)特性和所在方位排列。分上區(qū)、下區(qū)、左區(qū)、右區(qū)、交圍區(qū)、獨區(qū)。六個位置區(qū)間用符號表示為左區(qū)“
”、右區(qū)“
”、上區(qū)“
”、下區(qū)“
、交(圍〕區(qū)“○”、獨區(qū)“●”。
筆形區(qū)間按筆形順序從左到右,從上到下排列,分橫區(qū)、豎區(qū)、撇區(qū)、點區(qū)、折區(qū)、單區(qū)(取單筆筆形時用)。六個筆形區(qū)間用符號表示為橫區(qū)(一)豎區(qū)(丨)、撇區(qū)(丿)、點區(qū)(、)、折區(qū)(フ)、單區(qū)(●)。
位置區(qū)間與筆形區(qū)間互為并列關(guān)系、即橫與上、豎與右、撇與左、點與下、折與交(圍)、單與獨。
當(dāng)結(jié)構(gòu)區(qū)間或筆形區(qū)間在取碼時被確定為筆形相交取對應(yīng)位時,其區(qū)間上橫與下點,左撇與右豎、交折與獨單便為互為對應(yīng)區(qū),其碼位應(yīng)從其對應(yīng)區(qū)間取筆形位(筆形區(qū)間按其所在位置區(qū)間的結(jié)構(gòu)關(guān)系分)。
關(guān)于漢字的拆分依如下原則,有國家標(biāo)準(zhǔn)的,按國家標(biāo)準(zhǔn)執(zhí)行,尚無國家標(biāo)準(zhǔn)的,按國家推行的規(guī)范化要求執(zhí)行,尚無歸范化要求的,按共識執(zhí)行,并使之與漢字識字教育保持一致。等將來國家對筆形、筆順、部首、結(jié)構(gòu)這些具有確定性的要素都有了國家標(biāo)準(zhǔn),則漢字鍵位碼可以完全按照國家標(biāo)準(zhǔn)規(guī)定的要求操作執(zhí)行。
筆形、筆順采用的依據(jù)是1988年3月25日國家語言文字工作委員會和國家新聞署發(fā)布的《現(xiàn)代漢語通用字表》。
部首采用的依據(jù)中國文字改革委員會、國家出版局(1983年)漢字統(tǒng)一部首表(草案)201部。
筆劃是由一個不斷連續(xù)寫成的線條構(gòu)成的。在本發(fā)明中,將筆劃分橫、豎、撇、點、折五種類型。其中,提作橫。捺作點、凡帶轉(zhuǎn)折的均作折。
漢字的結(jié)構(gòu)是基于對漢字整體輪廓的認識,指漢字中部件與部件之間排列的相互位置關(guān)系。一個字的結(jié)構(gòu)可以是由單個部件組成即為獨體結(jié)構(gòu),也可以由數(shù)個部件組成即為合體結(jié)構(gòu)。
把由單個部件構(gòu)成的結(jié)構(gòu)或字稱為獨體結(jié)構(gòu)或獨體字、其位置區(qū)間均歸入獨區(qū)。把由兩個或兩個以上部件構(gòu)成的結(jié)構(gòu)關(guān)系或字稱為合體結(jié)構(gòu)或合體字。我們將合體分為左右類、上下類、相交類。
我們將左右類分別歸入位置區(qū)間的左區(qū)和右區(qū),將上、下類分別歸入位置區(qū)間的上區(qū)和下區(qū)。將相交類歸入位置區(qū)間的交(圍)區(qū)。其中左中右結(jié)構(gòu)或能分出結(jié)構(gòu)的左右對稱均歸入左右類。上中下結(jié)構(gòu)或能分出結(jié)構(gòu)的上下對均歸入上下類。將包圍類結(jié)構(gòu)(全包圍、半包圍)及多部件構(gòu)成的特殊結(jié)構(gòu)或不能分出上下或左右結(jié)構(gòu)的對稱類均歸入相交類。
按傳統(tǒng)取部首的方法將漢字拆分成兩部分,按取先順序,將取先部分定為部首部分、剩余部分定為非部首部分,每一編碼的信息均取自字的部首部分的首部與尾部及非部首部分的首部與尾部。我們規(guī)定無論是單字還是詞語,根據(jù)取碼需要,均可能成為不等長碼,但一個字或詞語的一組碼長取全為四位,詞語中每字的碼長取全為兩碼。
由于漢字是由部首字和含部首字兩種類型組成,而部首字只有一個首部與一個尾部,故部首字每字取全為兩碼。所以在漢字鍵位碼中、漢字的拆分共分三種①部首字的拆分;②含部首字的拆分;③詞語字的拆分。
①部首字的拆分a.其起筆碼只要根據(jù)其筆形與筆順多少取單筆或雙筆筆形即可,所以取第一碼時可不需拆分。
b.取結(jié)構(gòu)碼時,按其輪廓和其部件之間排列的位置關(guān)系確定其結(jié)構(gòu)屬性,以供結(jié)構(gòu)碼確定其所在區(qū)間。
②含部首字的拆分a.拆出部首部分,以分清部首及非部首部分的首部與尾部,供起筆碼及補位碼如何取筆形及取單筆還是雙筆筆形用,同時供部首碼確定位置區(qū)間用。
b.將部首以外剩余部分進行結(jié)構(gòu)屬性拆分,供結(jié)構(gòu)碼確定所在區(qū)間。
③.詞語字的拆分a.拆出字的部首部分,以確定起筆碼取單筆還是雙筆筆形。
b.對該字進行結(jié)構(gòu)屬性拆分,以確定結(jié)構(gòu)碼所在位置區(qū)間。
單字的取碼規(guī)則每字取全為四碼,部首字每字取全兩碼。每碼均包含兩個信息要素即一個筆形區(qū)間或一個位置區(qū)間+一個筆形位。
其四碼的取碼排列順序依次為起筆碼、部首碼、結(jié)構(gòu)碼、補位碼。
上述的四碼構(gòu)成的基本原則如下①起筆碼--筆形區(qū)間(部首或非部首部分先寫第一筆)+筆形位(先寫部分連續(xù)第二筆)起筆碼取單筆筆形時為單區(qū)間+筆形位(先寫部分第一筆)。
②部首碼--部首所在位置區(qū)間+筆形位(部首未筆筆形)③結(jié)構(gòu)碼--結(jié)構(gòu)位置區(qū)間(去掉部首部分后的)+筆形位(非部首部分末筆筆形)④補位碼--筆形區(qū)間(部首或非部首部分后寫第一筆)+筆形位(后寫部分連續(xù)第二筆)。
補位碼取單筆筆形時,單區(qū)間+筆形位(后寫部分第一筆)。
在取碼時,當(dāng)結(jié)構(gòu)碼或補位碼的末筆筆形被確定為產(chǎn)生相交時,則該碼應(yīng)從其對應(yīng)區(qū)取筆形位。
多部件字.部首作為部件局部時,部首碼的位置區(qū)間取交區(qū)。
單一部件含部首字,部首碼位置區(qū)間取獨區(qū)。
當(dāng)部首部分被非部首分隔開呈兩部分時,則部首碼位置區(qū)間取交區(qū)。
當(dāng)部首為部件局部或無法占據(jù)結(jié)構(gòu)部分全部(占角)時,則該字的結(jié)構(gòu)碼仍按整字的結(jié)構(gòu)屬性關(guān)系取。
當(dāng)補位碼第一、二筆筆形為豎、橫折“”時,則該兩筆筆形不取,依次取補位部分的第三、四筆或第三筆筆形,如已無筆形可取時,則該碼不取。
為了提高取碼的準(zhǔn)確性,應(yīng)注意如下事項①在一碼中,筆形不能同時取得部首與非部首的兩部分,無法取全連續(xù)兩筆筆形時,則取單筆筆形,從單區(qū)中取筆形位,如已無筆形時則該碼不取。
②在取連續(xù)兩筆筆形時,第一筆為筆形區(qū),第二筆為筆形位。
③字的起筆部分為部首時,非部首部分起筆部分為補位碼,起筆部分為非部首部分時,則部首部分的起筆部分為補位碼。
④在取碼時,已經(jīng)用過的筆形不能再次取用,若取不出筆形時,則該碼不取。
⑤部首字的結(jié)構(gòu)關(guān)系為按整字的結(jié)構(gòu)關(guān)系分,含部首字的結(jié)構(gòu)關(guān)系為去掉字的部首部分的全部筆形后,字的剩余部分所存在的結(jié)構(gòu)關(guān)系。
本發(fā)明的漢字拆分方法可作如下歸納將漢字用取部首的方法拆分成產(chǎn)首和非部首部分,根據(jù)每部分的頭部和尾部要素并按排列順序拆分成起筆碼、部首碼、結(jié)構(gòu)碼、補位碼四個碼,每一個碼由筆形區(qū)間或位置區(qū)間與筆形位兩個要素決定,每個碼相對應(yīng)于通用鍵盤上的一個鍵位,不足四碼的則可取起筆碼、部首碼、結(jié)構(gòu)碼、補位碼四碼中的任何一至三個碼。
所說的起筆碼由筆形區(qū)間和筆形位決定、所述的部首碼由部首位置區(qū)間和筆形位決定、結(jié)構(gòu)碼由結(jié)構(gòu)位置區(qū)間和筆形位決定、補位碼由筆形區(qū)間和筆形位決定。
所說起筆碼的筆形區(qū)間由部首或非部首部分先寫第一筆決定區(qū),筆形位是先寫部分連續(xù)筆形的第二筆,當(dāng)起筆碼無法取連續(xù)筆形時,則為單區(qū)間和先寫部分的第一筆筆形;所說部首碼的區(qū)間由部首在該字中所在位置決定區(qū),筆形位由部首的末筆筆形決定;所說結(jié)構(gòu)碼的結(jié)構(gòu)位置區(qū)間由去除部首部分后的末筆筆形部分的結(jié)構(gòu)決定區(qū),筆形位由該結(jié)構(gòu)部分的末筆筆形決定;所說補位碼筆形區(qū)間由部首或非部首部分后寫第一筆決定區(qū),筆形位由該后寫部分的連續(xù)第二筆筆形決定,當(dāng)補位碼無法取連續(xù)筆形時,則為單區(qū)間和后寫部分的第一筆筆形。
所說的部首碼位置區(qū)間確定的順序為取大為先,依次以如下順序,部首字-全包圍-半包圍-占邊-被包圍-占角-整部件-部件局部-起筆,當(dāng)漢字均為部首且相等時,非成字部件為先、多部件的留字為先;均為成字部件或均為非成字部件的,先寫為先,每個漢字只能確定一個部首。
所說的結(jié)構(gòu)碼或補位碼的末筆筆形與其它筆形被判定產(chǎn)生相交時,則該碼應(yīng)在其相對應(yīng)區(qū)取筆形位。
在一碼中,筆形只能分別取得部首與非部首的單一部分,無法取全連續(xù)兩筆筆形時,則取單筆筆形,從單區(qū)中取筆形位,如已無筆形時則該碼不取;在取連續(xù)兩筆筆形時,第一筆為筆形區(qū),第二筆為筆形位;當(dāng)字的起筆部分為部首時,非部首部分的起筆部分為補位碼,起筆部分為非部首部分時,則部首部分的起筆部分為補位碼;在取碼時,已經(jīng)用過的筆形不能再次取用,若取不出筆形時,則該碼不?。徊渴鬃值慕Y(jié)構(gòu)碼關(guān)系為按整字的結(jié)構(gòu)關(guān)系分,含部首字的結(jié)構(gòu)碼關(guān)系為去掉字的部首部分的全部筆形后,漢字的剩余部分所存在的結(jié)構(gòu)關(guān)系。
在一碼中,筆形只能分別取得部首與非部首的單一部分,無法取全連續(xù)兩筆筆形時,則取單筆筆形,從單區(qū)中取筆形位,如已無筆形時則該碼不取;在取連續(xù)兩筆筆形時,第一筆為筆形區(qū),第二筆為筆形位;當(dāng)字的起筆部分為部首時,非部首部分的起筆部分為補位碼,起筆部分為非部首部分時,則部首部分的起筆部分為補位碼;在取碼時,已經(jīng)過的筆形不能再次取用,若取不出筆形時,則該碼不取;部首字的結(jié)構(gòu)碼關(guān)系為按整字的結(jié)構(gòu)關(guān)系分,含部首字的結(jié)構(gòu)碼關(guān)系為去掉字的部首部分的全部筆形后,漢字的剩余部分所存在的結(jié)構(gòu)關(guān)系。
當(dāng)所要輸入的漢字為兩個字的詞組時,則分別取第一個字的起筆碼、結(jié)構(gòu)碼和第二個字的起筆碼和結(jié)構(gòu)碼;當(dāng)所要輸入的漢字為三個字的詞組時,則分別取第一個字的起筆碼、結(jié)構(gòu)碼、第二個字的起筆碼、第三個字的起筆碼;當(dāng)所要輸入的漢字為四個字或四個以上字的詞組時,則分別取第一個字的起筆碼、第二個字的起筆碼、第三個字的起筆碼、末尾字的起筆碼。
以以下漢字和詞組為例進行如何拆分和編碼,漢字“成”部首部分為戈,橫筆與折筆在寫時不連續(xù),起筆碼取單區(qū)橫位,即鍵位“N”,
部首部分末筆為點,部首碼取獨區(qū)點位,即鍵位“>”,非部首部分為撇折,末筆為折,其結(jié)構(gòu)為獨,結(jié)構(gòu)碼取獨區(qū)折位,即鍵位” ”,非部首部分為撇折,因折筆在結(jié)構(gòu)碼中已用過,用過的筆形不能再次取用,故只能取單筆撇,區(qū)為單,即鍵位“<”,該字的相應(yīng)鍵位或編碼為“N>?<”。
漢字“器”部首部分為口,起筆碼為豎折,取豎區(qū)折位,即鍵位“P”,部首碼筆形位為橫,因左上角部首口既不能代表上,也不能代表左,只在位置與非部首部分產(chǎn)生相交作用,故部首碼區(qū)間為交,交區(qū)橫位,即鍵位“B”,結(jié)構(gòu)碼末筆筆形為橫,且在下部,為下區(qū)橫位,即鍵位“H”,補位碼開始二筆筆形為“”,根據(jù)規(guī)則補位碼第二筆筆形為“”,該二筆筆不取,取其接下去的連續(xù)筆形,為橫橫,因第二筆橫有筆形相交,故其橫區(qū)橫位改取點區(qū)橫位,即鍵位“H”,該字的相應(yīng)鍵位或編碼為“PBHH”。
詞組“十分”第一字起筆碼為橫區(qū)豎位,鍵位“R”,第一字結(jié)構(gòu)碼,因該碼已無筆形,故第一字無結(jié)構(gòu)碼,第二字起筆碼為撇區(qū)點位,鍵位為“S”,第二字結(jié)構(gòu)碼為下區(qū)撇位,鍵位為“K”,“十分”的相應(yīng)鍵位或編碼為“RSK”。詞組“拖拉機”將該三字分別拆成部首和非部首部分,第一字起筆碼取橫區(qū)折位,鍵位“Q”,第一字結(jié)構(gòu)碼取字的末筆折,右區(qū),因折筆相交,所以取左區(qū)折位,鍵位“A”,第二字起筆碼橫區(qū)折位,鍵位“Q”,第三字起筆碼取橫區(qū)豎位,鍵位R,該詞組的相應(yīng)鍵位或編碼為“QAQA”。
詞組“中華人民共和國”第一字的起筆碼取單區(qū)豎位,鍵位“M”,第二字的起筆碼取撇區(qū)豎位,鍵位“F”,第三字的起筆碼取撇區(qū)點位,鍵位“S”,
最后一字的起筆碼取豎區(qū)折位,鍵位“P”,該詞組的相應(yīng)鍵位或編碼為“MFSP”。
部首取先例a.非成字部件為先劉-取“刂”部。
b.留字為先案-取“木”部。
c.先寫為先相-取“木”部,祁-取“礻”部。
d.多部件為先章-取“音”部,衷-取“衣”部(因部首被隔開成兩部分,我們稱其為相交,部首碼取交區(qū)。
e.整部件為先武-取“止”部(弋為弋部件局部,在“弋”為部時,取碼時,筆順及位置關(guān)系易混淆,而取“止”部時,則取碼時筆順及位置關(guān)系較明了,當(dāng)然可將取“弋”部作容錯碼處理)。
請參閱圖3和圖4,在圖3和圖4中,分別列舉一些單字和詞組的相應(yīng)的鍵位和編碼。
以上,只要在計算機通用鍵盤上輸入與所要輸入漢字的相對應(yīng)的鍵位或編碼,就輸入了相應(yīng)的漢字。
圖2列出了本發(fā)明的漢字簡碼對照,只要按下相應(yīng)的鍵位,就輸入了相應(yīng)的漢字,如鍵位“Q”與“過”相對應(yīng),鍵位“I”與“少”相對應(yīng)。
在結(jié)構(gòu)碼相交的判斷中,要注意字的結(jié)構(gòu)碼相交的判斷和詞語字結(jié)構(gòu)碼相交的判斷在字的結(jié)構(gòu)碼相交的判斷中,去掉部首部分的全部筆形后,該字的剩余部分的末筆筆形和其它任一筆筆形,只要筆形產(chǎn)生相交叉(不包括相連筆形),我們便判定其為產(chǎn)生相交。
在詞語字結(jié)構(gòu)碼相交的判斷中,該詞語字的末筆筆形只要與該字中任一筆筆形產(chǎn)生相交叉(不包括相連筆形)、我們便判定其為產(chǎn)生相交。
部首字的結(jié)構(gòu)碼相交判歸入詞語字類。
在補位碼相交的判斷中,在補位碼的連續(xù)兩筆筆形或單筆筆形中,只要其中任一筆筆形與該部分(部首部分歸部首部分、非部首部分歸非部首部分)任一筆筆形產(chǎn)生筆形相交叉(不包括相連筆形)或該兩筆筆形自身產(chǎn)生相交叉,我們便判定其為產(chǎn)生相交。
字和詞語字的結(jié)構(gòu)碼的區(qū)別。
詞語字的結(jié)構(gòu)碼是指字的部件或部件之間形成的位置關(guān)系。
字的結(jié)構(gòu)碼是指去掉部首部分后,字的剩余部分的部件或部件與部件之間形成的位置關(guān)系。因部首字結(jié)構(gòu)碼不具備單字結(jié)構(gòu)碼特性,而符合詞語結(jié)構(gòu)碼的特性,故部首字結(jié)構(gòu)的取法與詞語字結(jié)構(gòu)碼取法相同。
請參閱圖6,用這種漢字鍵位碼編碼的方式用于對漢字的字、詞編碼,然后漢字鍵位檢字序性圖將編碼要素轉(zhuǎn)化成數(shù)字排列形式,接著按數(shù)字大小排列順序,直接翻頁查找所要的字、詞或資料。
在圖6中,鍵位中左上角的英文字母或符號用序性檢索位替代,筆形區(qū)間“一”用一、“丨”用二、“丿”用三、“丶”用四、“フ”用五、“●”用六表示。
位置區(qū)間“
”用一、“
”用二、“
”用三、“
”用四、“○”用五、“●”用六表示。
筆形位“一”用1、“丨”用2、“丿”用3、“丶”用4、“フ”用5表示。
本發(fā)明的方法也可在數(shù)字鍵盤中應(yīng)用,請參閱圖5所示,我們將數(shù)字鍵盤分為基本鍵和輔助鍵,基本鍵由1、2、3、4、5、6六個鍵組成,每鍵分別代表一個筆形區(qū)間一個位置區(qū)間和一個筆形位。
其筆形區(qū)間按1(一)、2(丨)、3(丿)、4(丶)、5(フ)、6(●)順序排列。其位置區(qū)間與筆形區(qū)間配對排列則與大鍵(英文鍵或符號鍵)相同。
筆形位按1(一)、2(丨)、3(丿)、4(丶)、5(フ)順序排列。
輔助鍵的設(shè)置主要是為了減少小鍵盤漢字輸入擊鍵次數(shù)。由7、8、9、0四鍵組成,每鍵由一個成字部件部件和一個非成字部件組成。
數(shù)字鍵字、詞編碼規(guī)則a.基本鍵輸入法其字、詞的取碼方法均與上述所描述的大鍵(英文鍵、符號鍵)相同、輸入時,先按大鍵的方式將字、詞編碼,然后將大鍵鍵位的每一鍵,按區(qū)與位分二鍵進行數(shù)字鍵輸入。
在基本鍵輸入中,每二鍵代表一碼,第一鍵為區(qū)、第二鍵為位。故基本鍵輸入中,碼位分別為二、四、六、八鍵。
b.輔助鍵輸入法。
在基本鍵操作基礎(chǔ)上,凡遇上起筆部分或末筆正好與該部件相符時,即可用輔助鍵位的形式,代替其在基本鍵中相關(guān)的碼位。
在輸入中,擊一次鍵即代表了該成字部件的全部筆形,連擊二次代表了該非成字部件的全部筆形?;蛘邽槎€與其相對應(yīng)的成字部件。
被輔助碼用過的部件,其筆形不得再用于其它碼中。
上述的幾種輸入方法及檢索序性的對應(yīng)關(guān)系,以“坤”字為例起筆碼為“橫豎”,部首碼為“左橫”,結(jié)構(gòu)碼為“獨豎”,因其豎筆為筆形相交,故取其對應(yīng)區(qū)“交豎”,補位碼第一、二筆筆形為“豎、橫折”“”根據(jù)取碼規(guī)則該兩筆筆形不取,取第三、四筆形為“橫、橫”因其有筆形相交,故取其對應(yīng)區(qū)“點、橫”。
該字相對應(yīng)的編碼為“RGVH”。
用鍵位符號形式表示為R、G、V、H。
用檢索序性形式表示為一2、三1、五2、四1。
用小鍵盤形式表示為12、31、52、41。
用小鍵盤輔助鍵形式表示為7、52、41。
根據(jù)編碼規(guī)則,漢字鍵位碼為不等長碼,字或詞語取全均為四碼。在編碼覆蓋示例(單字效果圖)詞語效果圖)中,每一碼均有概率覆蓋任一鍵位,根據(jù)排列組合公式得碼元M=30碼位幾分別為1、2、3、4號碼總數(shù)Σf=1kSi=m1n1+m2n2+m3n3+m4n4=301+302+303+304]]>=30+900+27000+810000=837930(組)從對可容納含碼總數(shù)來講,我們對國標(biāo)二級字庫(GB2312-80,6763字),國標(biāo)漢字鍵盤輸入用通用詞語集(GB/T 15732-1995 43540條,其中,一級最常用集12355條,二級常用級17930條、三級次常用級13255條)字詞總數(shù)相加為50303組,或單字用GB13000.1-93大字符20902字及再擴容,其總量也只占漢字鍵位碼號碼總?cè)菁{數(shù)的十分之一左右,仍有一個較理想的編碼容納空間,從而使其重碼概率在不增加繁鎖附加規(guī)則的前提下,仍處于較低的水平。
權(quán)利要求
1.一種計算機漢字鍵位碼輸入方法,其特征在于a,將計算機通用鍵盤分成六個區(qū),即上橫區(qū)、右豎區(qū)、左撇區(qū)、下點區(qū)、交折區(qū)、獨單區(qū),每個區(qū)包含有橫、豎、撇、點、折五個筆形位,上橫區(qū)與下點區(qū)、左撇區(qū)與右豎區(qū)、交折區(qū)與獨單區(qū)均為相互對應(yīng)區(qū),鍵盤上每個鍵位上包含英文字母或符號、筆形區(qū)間、位置區(qū)間、筆形位四個要素;b,將漢字用取部首的方法拆分成產(chǎn)首和非部首部分,根據(jù)每部分的頭部和尾部要素并按排列順序拆分成起筆碼、部首碼、結(jié)構(gòu)碼、補位碼四個碼,每一個碼由筆形區(qū)間或位置區(qū)間與筆形位兩個要素決定,每個碼相對應(yīng)于通用鍵盤上的一個鍵位,不足四碼的則可取起筆碼、部首碼、結(jié)構(gòu)碼、補位碼四碼中的任何一至三個碼;c,在計算機通用鍵盤上輸入與所要輸入漢字的相對應(yīng)的碼。
2.如權(quán)利要求1所述的計算機漢字鍵位碼輸入方法,其特征在于所說的通用鍵盤的上橫區(qū)包括鍵位Q、W、E、R、T,下點區(qū)包括鍵位H、J、K、L、,左撇區(qū)包括鍵位A、S、D、F、G,右點區(qū)包括鍵位Y、U、I、O、P,交折區(qū)包括鍵位Z、X、C、V、B,獨單區(qū)包括鍵位N、M、<、>、 ;所說的起筆碼由筆形區(qū)間和筆形位決定、所述的部首碼由部首位置區(qū)間和筆形位決定、結(jié)構(gòu)碼由結(jié)構(gòu)位置區(qū)間和筆形位決定、補位碼由筆形區(qū)間和筆形位決定。
3.如權(quán)利要求2所述的計算機漢字鍵位碼輸入方法,其特征在于所說的上橫區(qū)鍵位Q、W、E、R、T與筆形位“折、點、撇、豎、橫相對應(yīng),下點區(qū)鍵位H、J、K、L、與筆形位”橫、豎、撇、點、折相對應(yīng),左撇區(qū)鍵位A、S、D、F、G與筆形位“折、點、撇、豎、橫”相對應(yīng),右豎區(qū)鍵位Y、U、I、O、P與筆形位“橫、豎、撇、點、折”相對應(yīng),交折區(qū)鍵位Z、X、C、V、B與筆形位“折、點、撇、豎、橫”相對應(yīng),獨單區(qū)鍵位N、M、<、>、 與筆形位“橫、豎、撇、點、折”相對應(yīng);所說起筆碼的筆形區(qū)間由部首或非部首部分先寫第一筆決定區(qū),筆形位是先寫部分連續(xù)筆形的第二筆,當(dāng)起筆碼無法取連續(xù)筆形時,則為單區(qū)間和先寫部分的第一筆筆形;所說部首碼的區(qū)間由部首和非部首所在位置決定區(qū),筆形位由部首的末筆筆形決定;所說結(jié)構(gòu)碼的結(jié)構(gòu)位置區(qū)間由去除部首部分后的末筆筆形部分的結(jié)構(gòu)決定區(qū),筆形位由該結(jié)構(gòu)部分的末筆筆形決定;所說補位碼筆形區(qū)間由部首或非部首部分后寫第一筆決定區(qū),筆形位由該后寫部分的連續(xù)第二筆筆形決定,當(dāng)補位碼無法取連續(xù)筆形時,則為單區(qū)間和后寫部分的第一筆筆形。
4.如權(quán)利要求2或3所述的計算機漢字鍵位碼輸入方法,其特征在于所說的部首碼位置區(qū)間確定的順序為取大為先,依次以如下順序,部首字-全包圍-半包圍-占邊-被包圍-占角-整部件-部件局部-起筆,當(dāng)漢字均為部首且相等時,非成字部件為先、多部件的留字為先;均為成字部件或均為非成字部件的,先寫為先,每個漢字只能確定一個部首。
5.如權(quán)利要求2或3所述的計算機漢字鍵位碼輸入方法,其特征在于所說的結(jié)構(gòu)碼或補位碼的末筆筆形與其它筆劃產(chǎn)生相交時,則該碼應(yīng)在其相對應(yīng)區(qū)取筆形位。
6.如權(quán)利要求4所述的計算機漢字鍵位碼輸入方法,其特征在于在一碼中,筆形只能分別取得部首與非部首的單一部分,無法取全連續(xù)兩筆筆形時,則取單筆筆形,從單區(qū)中取筆形位,如已無筆形時則該碼不??;在取連續(xù)兩筆筆形時,第一筆為筆形區(qū),第二筆為筆形位;當(dāng)字的起筆部分為部首時,非部首部分的起筆部分為補位碼,起筆部分為非部首部分時,則部首部分的起筆部分為補位碼;在取碼時,已經(jīng)用過的筆形不能再次取用,若取不出筆形時,則該碼不取;部首字的結(jié)構(gòu)碼關(guān)系為按整字的結(jié)構(gòu)關(guān)系分,含部首字的結(jié)構(gòu)碼關(guān)系為去掉字的部首部分的全部筆形后,漢字的剩余部分所存在的結(jié)構(gòu)關(guān)系。
7.如權(quán)利要求5所述的計算機漢字鍵位碼輸入方法,其特征在于在一碼中,筆形只能分別取得部首與非部首的單一部分,無法取全連續(xù)兩筆筆形時,則取單筆筆形,從單區(qū)中取筆形位,如已無筆形時則該碼不取;在取連續(xù)兩筆筆形時,第一筆為筆形區(qū),第二筆為筆形位;當(dāng)字的起筆部分為部首時,非部首部分的起筆部分為補位碼,起筆部分為非部首部分時,則部首部分的起筆部分為補位碼;在取碼時,已經(jīng)過的筆形不能再次取用,若取不出筆形時,則該碼不??;部首字的結(jié)構(gòu)碼關(guān)系為按整字的結(jié)構(gòu)關(guān)系分,含部首字的結(jié)構(gòu)碼關(guān)系為去掉字的部首部分的全部筆形后,漢字的剩余部分所存在的結(jié)構(gòu)關(guān)系。
8.如權(quán)利要求1或2或3或6或7所述的計算機漢字鍵位碼輸入方法其特征在于當(dāng)所要輸入的漢字為兩個字的詞組時,則分別取第一個字的起筆碼、結(jié)構(gòu)碼和第二個字的起筆碼和結(jié)構(gòu)碼;當(dāng)所要輸入的漢字為三個字的詞組時,則分別取第一個字的起筆碼、結(jié)構(gòu)碼、第二個字的起筆碼、第三個字的起筆碼;當(dāng)所要輸入的漢字為四個字或四個以上字的詞組時,則分別取第一個字的起筆碼、第二個字的起筆碼、第三個字的起筆碼、末尾字的起筆碼。
全文摘要
本發(fā)明公開了一種計算機漢字鍵位碼輸入方法,該方法將鍵盤設(shè)計成六個區(qū),每個區(qū)包含有橫、豎、撇、點、折五個鍵位,將漢字用取部首的方法拆分成部首和非部首部分,根據(jù)每部分的頭部和尾部要素并按排列順序拆分成起筆碼、部首碼、結(jié)構(gòu)碼、補位碼四個碼,該方法能對漢字要素定性定量,并使?jié)h字具有序性。非專業(yè)人員均能輕易掌握,初學(xué)者經(jīng)短時間的學(xué)習(xí),便能基本掌握這一輸入方法。
文檔編號G06F3/023GK1223398SQ9812287
公開日1999年7月21日 申請日期1998年12月24日 優(yōu)先權(quán)日1998年12月24日
發(fā)明者張耀峰 申請人:張耀峰