專利名稱:廣宇碼編碼法及其鍵盤的制作方法
二十一世紀(jì),將是漢字走向世界大放光彩的世紀(jì)。在將來的計算機(jī)信息社會中,漢字要成為一種被世界范圍內(nèi)廣泛使用的文字,就必需象英文那樣使不同國度的人把漢字方便地輸入計算機(jī)里去,并且,隨著我國經(jīng)濟(jì)的發(fā)展,計算機(jī)漢字輸入在國內(nèi)必然得到廣泛地使用。因此發(fā)明一種能使國內(nèi)外的非計算機(jī)操作人員和非專職打字人員也能快速、準(zhǔn)確、簡便地把漢字輸入到計算機(jī)的漢字編碼法及鍵盤,則是一個亟待解決的難題。本發(fā)明屬于漢字編碼中的一種方法。
目前,漢字輸入法甚多,約有四、五百種,但實用的不多,國內(nèi)流行的漢字計算機(jī)編碼方式有下面幾類純讀音方式,我國幅員遼闊,方言多雜,人們不認(rèn)識或讀不準(zhǔn)的字很多,因而這種漢字輸入法使用范圍受到了限制。又因為漢字同音字太多,需要不斷地在計算機(jī)屏幕上選擇需要的字才能輸入,不可能實現(xiàn)快速盲打,因此純讀音輸入方式效率很低。由于有讀音因素,此類漢字輸入方式不能在國內(nèi)各地都得到推廣,更不能推向世界。
音形結(jié)合方式,需要掌握讀音與字形兩種因素,使得操作人員更難學(xué)習(xí)和使用。因讀音的影響,此類漢字輸入方式不能推向國際。
整字大鍵盤法,需要制做專門的設(shè)備,增加系統(tǒng)成本,而且?guī)浊€漢字?jǐn)[在面前,非專職人員找字困難,輸入漢字效率很低。
拼形輸入法,雖然操作人員掌握后能高速輸入和盲打,但是現(xiàn)行的漢字輸入法需要記憶大量字根,并且根據(jù)這些字根拆、拼漢字,很多漢字能拆分成不同的字根組合,使人們在編碼或輸入時猶豫不決,要想熟練掌握往往需要幾個月的時間,造成此類方法的推廣普及受到難記難掌握兩大缺點的阻礙。此類方法對非漢語國家基本不能使用。
目前,比較先進(jìn)的漢字編碼法是王永民發(fā)明的《優(yōu)化五筆字形編碼法及其鍵盤》,中國專利CN85100837.A,需要記憶217個字件,其中包括130種字根,這樣大量的字根集使人難以記憶。對于非專業(yè)人員要熟練掌握運用其所規(guī)定的字根集,去拆分漢字進(jìn)行編碼很困難,一般需要幾個月的學(xué)習(xí)才能掌握。在國內(nèi)五筆字形輸入法雖然占領(lǐng)了大量計算機(jī)市場,但是,非專職的操作人員和非專職的打字人員使用得不廣泛,主要原因就是這種輸入法要求操作者記憶大量的字根,不確定的字根組合阻礙了這種字根拼形的漢字輸入法的推廣應(yīng)用,限制了這種方法的使用范圍。而且這種方法不容易推向國際,原因是外國人相當(dāng)難記憶字意關(guān)連性不大的217個字件,更難運用它們拆分、編碼輸入漢字。這種編碼方法僅使用計算機(jī)標(biāo)準(zhǔn)鍵盤上A-Y的25個字母鍵為漢字輸入鍵,數(shù)量少,可提供組合漢字代碼的數(shù)量少。
為了解決優(yōu)化五筆字型編碼法有大量難以記憶的字根,非專職人員或不同語種的人員難學(xué)習(xí),難掌握的缺點,本發(fā)明提供一種有30個可供輸入漢字鍵位的編碼法,使人們將漢字輸入計算機(jī)時既不需要知道漢字的讀音,也不需要記憶大量的字根集,有一般漢字基礎(chǔ)知識的人,就能在兩個小時內(nèi)掌握并能方便地將漢字輸入計算機(jī),熟練后能夠達(dá)到高速盲打,實現(xiàn)每分鐘輸入150個左右漢字的輸入目標(biāo)。這樣能使專業(yè)和非專業(yè)計算機(jī)輸入人員和其他語種的人員都易于接受,容易掌握,能使?jié)h字推向世界,也能使計算機(jī)漢字輸入技術(shù)在中華大地得到更大面積的普及。
本發(fā)明的特征是把漢字按拆分字塊規(guī)則拆分成若干字塊,以每個字塊的第一筆五種筆劃和第二筆六種筆劃的三十種順序組合碼對應(yīng)標(biāo)準(zhǔn)計算機(jī)鍵盤的一個字符鍵上,另外有十-十五個定義字塊設(shè)定在字符鍵上,根據(jù)漢字所拆分字塊的前兩筆劃的順序組合碼、定義字塊對應(yīng)鍵位進(jìn)行編碼。達(dá)到或超過四個字塊的漢字,只取四碼。不足三個字塊的漢字需要補(bǔ)碼,取四種字型和六種角位筆劃結(jié)合成的二十四種識別補(bǔ)碼之一,進(jìn)行補(bǔ)碼的漢字編碼法。這就是本發(fā)明的整體夠思,一種完整的漢字編碼的方法。
字塊筆順第一筆有五種筆劃,橫(一)、豎(丨)、撇(丿)、捺(丶)、折(乙)。字塊筆順的第二筆有六種筆劃,橫(一)、豎(丨)、撇(丿)、捺(丶)、順折()、逆折(ㄥ)。如
圖1、圖2所示。字塊的每種前兩筆筆劃順序組合對應(yīng)一個順序組合碼。第一、第二筆劃的順序組合碼有三十種,把它們對應(yīng)定義到標(biāo)準(zhǔn)鍵盤的三十個字符鍵上,如圖5所示。
十三個定義字塊是“口、日、目、田、木、言、金、扌、糹、石、
、王、钅”定義到字符鍵上,如圖5所示。
二十四種識別補(bǔ)碼是由四種字型和六種角位筆劃組合而成。把它們定義到標(biāo)準(zhǔn)鍵盤的二十四個字符鍵上,如圖6所示。
這樣把一個標(biāo)準(zhǔn)鍵盤改造成為一個直觀易學(xué)、分布有規(guī)律的中文輸入鍵盤。在每個鍵盤帽上,可以粘貼一個印有該鍵位相對應(yīng)的筆劃順序組合的代碼和定義字塊,以及印有高頻漢字和印有計算機(jī)原鍵盤鍵位的字符的標(biāo)簽(圖7、圖8)。使用這樣的鍵盤,可以向計算機(jī)輸入一、二級漢字及其繁體字,總共上萬個漢字、四萬多條詞匯。
本發(fā)明的優(yōu)點是,把漢字拆分成若干個字塊,按本拆分字塊的規(guī)則進(jìn)行拆分,使拆出的結(jié)果是唯一的。以字塊的前兩筆的順序組合碼、十三個定義字塊結(jié)合二十四個識別補(bǔ)碼進(jìn)行編碼,這樣的編碼方法能使?jié)h字輸入人員不需要記憶大量的字根,在知道橫、豎、撇、捺、折(順折、逆折)幾種基本筆劃,懂得漢字字型,掌握本發(fā)明提出的簡單筆順規(guī)則和分字塊的規(guī)則,記住定義在鍵盤上的定義字塊,即使沒有操作過計算機(jī)的人學(xué)習(xí)兩個小時后,也能方便地進(jìn)行漢字輸入。本發(fā)明使?jié)h字輸入直觀易學(xué),操作簡便輸入速度快。由于采用標(biāo)準(zhǔn)鍵盤的30個鍵位輸入漢字,比25個鍵位輸入的重碼率低。經(jīng)本編碼法編排,每個字塊的前兩筆的筆順組合對應(yīng)一個計算機(jī)鍵位,三十種筆劃順序組合碼在鍵盤上的排列分布,規(guī)律性很強(qiáng),輸入漢字時使用頻度高的鍵位絕大部分處于靈活手指控制之下,方便操作,只要熟悉了這種規(guī)律,就可以根據(jù)筆劃的順序組合碼,馬上找到相應(yīng)的鍵位。由于使用30個鍵位輸入漢字,可以輸入一、二級漢字及其繁體字上萬個和四萬多條詞匯,一般人員熟練后,每分鐘可以輸入大約150個漢字,使?jié)h字快速輸入成為普通人員也能掌握的技術(shù)。
說明書附圖的說明圖1、字塊的第一筆筆劃代號2、字塊第二筆筆劃和識別補(bǔ)碼角位筆劃的代號3、漢字的四種字型代號和字例圖4、字塊拆分次序5、字塊前兩筆筆劃順序組合碼及定義字塊共容6、識別補(bǔ)碼7、GY1系統(tǒng)定義字塊、高頻漢字和順序組合碼共容的中文鍵盤圖8、GY2系統(tǒng)定義字塊、高頻漢字和順序組合碼共容的中文鍵盤下面具體說明順序組合碼和識別補(bǔ)碼的取法。
一、順序組合碼的取法字是由字塊所組成,把漢字拆分成若干字塊。按本發(fā)明的規(guī)則拆分具有唯一性。這種拆分方法對中、外的使用者很容易掌握。
拆分字塊的規(guī)則(以拆分第一字塊為例)1、漢字字塊是由兩筆或兩筆以上的筆劃組成的筆劃群體;
2、漢字中的筆劃關(guān)系有相交、相連和不交不連三種方式組合。筆劃之間相互交叉稱之為相交,例如“十”字的橫(一)和豎(丨)的相互關(guān)系為相交。筆劃相互接觸但不交叉稱之為相連,例如“上”字的豎(丨)和橫(一)的相互關(guān)系為相連。筆劃之間不相交也不相連的筆劃稱之為不交不連或獨立筆劃。例如“流”字的“氵”兩個點“丶”,“三”字各筆劃都為不交不連,是獨立筆劃。相交筆劃是不能拆分到兩個字塊中的,相連筆劃拆分到兩個字塊中是有原則的。
3、漢字所拆分成的字塊是有順序的,如圖4所示。例如“位”字是左右型漢字,字塊順序為1“亻”,2“亠”,3“
”;“府”字的字塊順序為“廣”第一字塊,“亻”第二字塊,“寸”第三字塊。
4、每一筆劃只能屬于一個字塊。
5、拆分字塊規(guī)則主則取第一個字塊位置的最高最左的一筆,再取比這一筆劃低的這一筆劃下方的所有筆劃(如果有筆劃和這一筆劃相交或相連,則所有筆劃是指和這一筆劃相交或相連的那些筆劃)中,位置最高最左的一筆筆劃。以這兩筆筆劃以及和這兩筆筆劃相交的筆劃的橫向總長度為寬,以這兩筆筆劃以及和這兩筆筆劃相交的筆劃的縱向總長度為長的長方形范圍內(nèi)的筆劃群體為第一字塊。
拆分字塊規(guī)則主則基本能確定字塊所占的范圍。下面副則規(guī)定了一些特殊情況的處理。
拆分字塊規(guī)則副則一符合下列情況之一的筆劃為第一字塊的筆劃。(1)、有一筆劃伸入第一字塊長方形范圍內(nèi)和長方形范圍內(nèi)的筆劃相連,而和其它筆劃不相交也不相連;(2)、有一筆劃絕大部分伸入第一字塊的范圍內(nèi);(3)、有一橫處于第一字塊長方形范圍的底線上和這一范圍內(nèi)的筆劃相連,而不和其它筆劃相交;(4)、獨立筆劃緊挨處于第一字塊下方,且不能和其它筆劃組成字塊。符合上述四種情況之一的筆劃以及和這一筆劃相交的筆劃,都屬于第一字塊的筆劃。但如果有一點“丶”處于第一字塊長方形范圍內(nèi)的底線上并能和其下方筆劃組合字塊則不屬于第一字塊的筆劃。例如“表”字第一字塊為“”,而不是“
”?!耙u”字第一字塊為“龍”?!凹彙弊值牡谝蛔謮K是“纟”,而不是“
”?!斑@”字的第一字塊為“辶”。
拆分字塊規(guī)則副則二喇叭口形狀字塊,如“大”、“八”、“人”、“父”、“亼”,喇叭口處看作上下字塊的分界處。例如“介”字是由“人”和“
”兩個字塊組成;“合”字是由“亼”、“口”兩個字塊組成。
拆分字塊規(guī)則副則三包型漢字及包型字塊取外層為次序靠前字塊,剩余部分按其結(jié)構(gòu)特點,依次分塊。
拆分字塊規(guī)則副則四十三個定義字塊是“口、日、目、田、木、扌、糹、金、王、言、
、石、钅”,被認(rèn)為是特定的筆劃群體,是一個整體。定義字塊獨立為一字塊,編碼輸入要鍵入定義字塊所對應(yīng)的字符鍵。有些字塊,如“里”、“
”、“果”,定義字塊位于這些字塊的頭部,編碼輸入要鍵入定義字塊所對應(yīng)的字符鍵。
分字塊規(guī)則副則五一個字塊不能被另一個字塊分隔開。
按照上述規(guī)則取完第一字塊后,對剩余筆劃按字塊順序以同樣方法取第二字塊,依次類推。按上述的主則、副則處理漢字,拆分出字塊的結(jié)果是唯一的。
漢字分字塊舉例“華”字由字塊“亻”、“七”、“十”組成;“北”是由字塊“
”、“匕”組成;“管”字由字塊“
”、“
”、“宀”、“コ”組成;“理”字由字塊“王”、“里”組成;“局”字由字塊“尸”、“
”組成;“第”字由字塊“
”、“
”、“
”組成;“二”字由字塊“二”組成;“中”字由字塊“中”組成;“學(xué)”字由字塊“
”、“冖”、“子”組成;“成”字由字塊“戈”、“
”組成;“兇”字由字塊“凵”、“乂”組成;“古”字由字塊“十”、“口”組成;“這”字由字塊“辶”、“亠”、“乂”組成;“芳”字由字塊“艸”、“亠”、“
”組成;“踐”字由字塊“口”、“止”、“戔”組成;“物”字由字塊“牜”、“勹”、“
”組成;“問”字由字塊“門”、“口”組成;“風(fēng)”字由字塊“幾”、“乂”組成;“病”字由字塊“疒”、“丙”組成或看成由“亠”、“
”、“丙”組成。
筆順規(guī)則為了編碼時便于取碼,使國內(nèi)外人員都能方便地使用,本發(fā)明按工程心理學(xué)的觀點,以“先上后下,先左后右,先折后它”筆順規(guī)則,使編碼時取前兩筆的順序組合形狀更加形象直觀。
1、“先上后下”是指字塊的筆劃群里,筆劃最高點位置高的筆劃次序排在筆劃最高點位置低的筆劃之前。例如“劃”字的“刂”字塊的筆劃次序為先折“丨”,后豎“丨”。
2、“先左后右”是字塊的筆劃群中,對同一高度的筆劃之間,筆劃的最左端位置靠左的筆劃次序在前。例如“芳”字的“艸”字塊的前兩筆的筆劃為先豎(丨),后還是豎(丨)。
3、“先折后它”是指字塊的筆劃群里,筆劃的最高點處于同一高度的若干筆劃中,折形筆劃的次序在前。例如“同”字的“冂”字塊,筆劃次序為先折()后豎(丨)。
字塊筆順的第一筆分五種橫(一)、豎(丨)、撇(丿)、捺(丶)、折(、ㄥ),并依次命以阿拉伯?dāng)?shù)字1、2、3、4、5為代碼。如圖1所示。記憶方法為橫1、豎2、3撇、4捺、5折。字塊筆順的第二筆分六種橫(一)、豎(丨)、撇(丿)、捺(丶)、順折()、逆折(ㄥ),并依次命以阿拉伯?dāng)?shù)字1、2、3、4、5、6為代碼。如圖2所示。記憶方法橫1、豎2、3撇、4捺、5順、6逆折。
筆劃點“丶”應(yīng)歸入捺(
)一類。順折是指書寫筆劃拐彎處全都是向順時針方向轉(zhuǎn)的折筆劃,其余的折筆劃為逆折。例如順折有“亅、
、
、”等,逆折有“
、
、乙、
、ㄥ”等。
每個字塊(除定義字塊)按筆順規(guī)則取前兩筆劃的順序組合碼設(shè)定在一個字符鍵上。這樣用三十個字符鍵完成漢字字塊的編碼。排列位置如圖5。
二、識別補(bǔ)碼的取法按規(guī)則拆分字塊,少于三個字塊的漢字,應(yīng)在其筆劃順序組合碼輸入完成后補(bǔ)上一個識別補(bǔ)碼,直到補(bǔ)足三碼為止。識別補(bǔ)碼是由該漢字的字型代號和最后一個字塊的右下角或左下角角位筆劃的代號組合而成。
1、字型代號漢字分四種字型,包型、單塊型、左右型、上下型。左右型漢字的特征是能被豎線分開。例如“擺、打、樹”上下型漢字的特征是能被橫線分開,不能被豎線分開。例如“型、品、貧”。單塊型漢字的特征是整個漢字為一個字塊,而且按規(guī)則不能把整個漢字分成兩個字塊。例如土、五、女、力、丸都是單塊型漢字。包型結(jié)構(gòu)的漢字的特征是筆劃群體可以分為兩個層次,一個包圍層,另一個是被包圍層,兩層的連接比較松散,包圍層占去整個漢字的三個角以上。例如問、風(fēng)、這、府、病、貳、屬、房、國、同、句、毯、建、問、厘、慮、戎、戚都屬于包型字,它們的包圍層分別是門、幾、辶、廣、疒、弋、尸、戶、囗、冂、勹、毛、廴、門、廠、
、戈、戊。依據(jù)包型、單塊型、左右型、上下型四種字型的使用頻度,依次命以阿拉伯?dāng)?shù)字1、2、3、4作為四種字型的代號。
2、漢字最后字塊的左下角或右下角的角位筆劃代號左下角或右下角筆劃可以分為橫(一)、豎(丨)、撇(丿)、捺(丶)、順折()、逆折(ㄥ)六種,并依次命以阿拉伯?dāng)?shù)字1、2、3、4、5、6為代碼,如圖2所示。如果有兩筆劃共角,取筆劃最低的一筆為角位筆劃。
這樣字型代號和角位筆劃代號組合成二十四種視別補(bǔ)碼,分別設(shè)定在二十四個鍵位上,如圖6所示。按漢字分塊規(guī)則少于三塊的,應(yīng)在其筆劃順序碼后邊,補(bǔ)上一個字型代號和最后字塊的右下角角位筆劃結(jié)合的識別補(bǔ)碼。若補(bǔ)上一個識別補(bǔ)碼后還不足三碼,則再補(bǔ)上一個字型代號和最后字塊的左下角角位筆劃結(jié)合的識別補(bǔ)碼,這樣對漢字編碼時,補(bǔ)足三碼后再加上一個空格鍵即完成編碼。例如“權(quán)”取木(14),又(54),34(字型代號3,角位筆劃代號4)“本”取本(21),24(字型代號2,角位筆劃代號4),23(字型代號2,角位筆劃代號3)本發(fā)明有兩套編碼體系,GY1系統(tǒng)和GY2系統(tǒng)。GY1系統(tǒng)能處理上萬個簡、繁體漢字和四萬多條簡體漢字的詞匯。GY1系統(tǒng)編碼碼長最長為四碼,編碼庫需要16位機(jī)1兆字節(jié),詞匯庫需要大約0.2兆字節(jié),字的選形庫采用國家標(biāo)準(zhǔn)的GB-2312(80)中字庫,再加上1000多個繁體字。GY2系統(tǒng)只能處理一、二級簡體漢字,適合低擋微型計算機(jī),GY2系統(tǒng)的編碼碼長為三碼,編碼庫為虛庫,不占內(nèi)存,漢字選形可采用磁盤存儲。這樣低擋微機(jī)采用GY2系統(tǒng),也能高速輸入漢字。
GY1系統(tǒng)的漢字、同編碼對所有的國標(biāo)一、二級漢字及其繁體漢字,按分塊規(guī)則分塊。取第一、二、三和最后一個字塊參加編碼。分塊少于三個字塊的漢字,按識別補(bǔ)碼的規(guī)則補(bǔ)足三碼為止。凡遇到十三個定義字塊取碼應(yīng)取定義字塊對應(yīng)的字符鍵。不足四碼的最后鍵入空格鍵。
高頻字的輸入在30個字符鍵的右上角都設(shè)有一個高頻字,如圖7所示。輸入高頻字時可先鍵入高頻字所對應(yīng)的字符鍵,再加打空格鍵。
次高頻字的輸入對容易以單個字出現(xiàn),且使用頻度較高的漢字,可以先打入編碼的前兩鍵,后加一個空格鍵。
對規(guī)定的十三個定義字塊,“口、日、目、田、木、扌、糹、言、金、王、石、
、钅”,“金、目”為鍵入三次對應(yīng)鍵加空格鍵,其余鍵入四次對應(yīng)鍵。如“目”鍵入“F、F、F、空格”;“口”鍵入“H、H、H、H”。
字符和空格的處理由于四個筆劃順序組合碼占用了標(biāo)點鍵,輸入字符和空格時,先鍵入空格鍵給計算機(jī)一個信號,再打需要輸入的字符鍵或空格鍵。
兩字詞的編碼取第一個字的前兩碼和第二個字的前兩碼。例如“先進(jìn)”依次取“
、兒、辶、井”四個字塊的前兩筆順序組合碼“23、36、46、32”其對應(yīng)鍵為“X”、“,”、“?!?、“D”。
三字詞匯的編碼取其第一、第二個漢字的第一碼和第三個漢字的前兩碼。例如“辦公室”取“辦、八、宀、
”四個字塊,其代碼為“K、I、L、W”(35、34、45、21)。又如“范圍廣”取“艸、囗、廣”三個字塊,其鍵位為“S、G、R、X”(22、52、41、23),其中“X”(23)為第三個字的識別補(bǔ)碼。
四字以上詞匯的編碼取其前三個字和最后一個字的第一碼。如“通用編碼”取“辶、冂、纟、石”四個字塊,鍵位“。、B、/、,”(46、53、56、36)。
GY2系統(tǒng)的漢字編碼類似于GY1系統(tǒng)的漢字編碼,但限定碼長為三碼,取字的第一、第二和最后字塊參加編碼。GY2系統(tǒng)的定義字塊和GY1的也有所不同,去掉了“言、糹、金”三個繁體定義字塊,增加了“禾、衤、辶”定義字塊,如圖8所示。輸入“目、魚”時鍵入三次對應(yīng)鍵,加打空格鍵,其余定義字塊輸入時,連打四次對應(yīng)鍵。補(bǔ)碼規(guī)則、高頻字輸入、次高頻字輸入、字符輸入如同GY1系統(tǒng)。
當(dāng)字編碼取碼模糊時,可以用“A”鍵代替;當(dāng)詞編碼取碼模糊時,可用“M”鍵代替。單筆劃字第一碼取筆劃對應(yīng)的識別補(bǔ)碼。例如“一”字取碼“W、W、W”(21、21、21)重碼的處理由于詞匯量大,重碼是不可能避免的。出現(xiàn)重碼時計算機(jī)發(fā)出一聲報警聲。有兩個萬能鍵“-”鍵和“0”鍵。系統(tǒng)程序可對所鍵入的編碼利用萬能鍵改造成新編碼,自動進(jìn)行查找并顯示在顯示行的正常編輯位置上。常用字在前,其余字詞在后。若繼續(xù)鍵入下文,第一個字便顯示在正常編輯位置上;若用其它字詞,只需鍵入與該字相對應(yīng)的數(shù)字鍵,所需的字、詞即可顯示在現(xiàn)行編輯位置上。若出現(xiàn)空碼,計算機(jī)將發(fā)出兩聲報警聲。
中文字、詞典編排查字法本發(fā)明為字、詞典提供了簡便、易行、快速的編排查字法。尤其是對大型詞典查閱詞條提供了快速簡便的查字法。以往,詞典的查找方法是先根據(jù)部首和筆劃數(shù)查到字,再據(jù)詞第二個字的筆劃數(shù)查到詞。查找起來不方便。對大型詞典來說,檢字表在其中一分冊上,這就更增加了不便。
本發(fā)明提出的編排查字法如下對字按本發(fā)明規(guī)則取前三個字塊參加編碼,詞取第一個字的前三碼和第二個字的前一碼或前兩碼。按這個編碼的字母順序為編排順序作為字、詞在字、詞典中的順序。前三碼印刷在書的左上角或右上角。這樣可根據(jù)編碼直接查找到字、詞,而且不認(rèn)識的字詞也可以直接查到,不需再用專門的檢字表。
為了快速輸入漢字,必需以詞組輸入為主。這就要求編碼系統(tǒng)提供大量詞匯,本發(fā)明在盡可能避免重碼的前提下,提供了四萬多條詞匯。并將所有簡、繁體漢字編碼和部分詞匯編碼匯編成冊。本發(fā)明還提供了詞匯擴(kuò)充功能。擴(kuò)充詞匯的編碼格式和編碼系統(tǒng)提供的詞匯相同。用戶可以手工或使用詞匯增刪軟件,完成詞匯擴(kuò)充和刪減,并把詞匯建立在編碼系統(tǒng)中。為了避免擴(kuò)充詞匯和原有的系統(tǒng)詞匯重碼,可按下列方法處理擴(kuò)充詞匯編碼加入“;”鍵(55)或“P”鍵于編碼的四個碼中,其中的第一、第二或第三個碼為“P”鍵或“;”鍵,其余三碼是按編碼系統(tǒng)詞匯的編碼規(guī)則進(jìn)行編碼。一般只需采用第一碼為“P”鍵或“;”鍵,再加詞匯的前三個編碼。形成的擴(kuò)充容量即可夠擴(kuò)充幾千條詞匯使用。
本發(fā)明提出的漢字編碼處理方法,本質(zhì)上是依字形對漢字進(jìn)行編碼的。它吸收了一些編碼方法的優(yōu)點,克服了以往拼形編碼法需要記憶大量字根的缺點,使?jié)h字編碼方式有了重大突破。具有相同的前兩筆順序組合的字塊,頭部具有相近的形狀,有利于記憶掌握,在使用本發(fā)明時提高輸入速度,例如“艸、廿、甘、
、業(yè)、止”等,這些字塊的頭部具有極為相近的形狀;又如“亻、千、禾、釆、重、壬”,也是如此。因此從工程心理學(xué)的觀點來看,本發(fā)明極容易掌握,能使?jié)h字輸入速度提高。本發(fā)明適用于一切大、中、小、微型計算機(jī)中文信息處理系統(tǒng),并將在中文終端、中文電傳、電腦打字和計算機(jī)漢字排版印刷、字詞典的編排查閱等方面獲得廣泛應(yīng)用。
權(quán)利要求
1.一種漢字編碼方法,其特征在于把漢字按拆分字塊規(guī)則拆分成若干字塊,把字塊的第一筆五種筆劃和第二筆六種筆劃的順序組合碼,對應(yīng)定義在標(biāo)準(zhǔn)計算機(jī)鍵盤的字符鍵上,共三十種筆順組合碼定義在三十個字符鍵上,另外設(shè)定十一十五個定義字塊在字符鍵上,依漢字所拆分字塊的順序?qū)ψ謮K按筆順規(guī)則取其前兩筆劃的順序組合碼和定義字塊對應(yīng)的鍵位進(jìn)行漢字編碼,達(dá)到或超過四個字塊的漢字只取四碼,不足三個字塊的漢字需要補(bǔ)碼,取漢字的四種字型和六種角位筆劃結(jié)合的二十四種識別補(bǔ)碼之一,進(jìn)行補(bǔ)碼,形成一套編碼體系。
2.漢字編碼法的鍵盤排列圖,其特征在于根據(jù)漢字字塊第一筆和第二筆劃的順序組合碼、十三個定義字塊、三十個高頻漢字設(shè)定在計算機(jī)標(biāo)準(zhǔn)鍵盤上。
3.如權(quán)利要求1所述的漢字編碼法,其特征在于字塊的第一筆劃有五種基本筆劃,即橫、豎、撇、捺、折,并分別命以代號1、2、3、4、5;字塊的第二筆劃有六種基本筆劃,即橫、豎、撇、捺、順折、逆折,并分別命以代號1、2、3、4、5、6,第一筆劃和第二筆劃的筆順組合碼共三十種。
4.如權(quán)利要求1、3、所述的漢字編碼法,其特征在于字塊的筆劃順序為“先上后下,先左后右,先折后它”。
5.如權(quán)利要求1、3所述的漢字編碼法,其特征在于漢字的四種字型為包型、單塊型、左右型、上下型四種,分別命以代號為1、2、3、4,六種角位筆劃是漢字最后一個字塊的角位筆劃,即橫、豎、撇、捺、順折、逆折,并分別命以代號為1、2、3、4、5、6,二十四種識別補(bǔ)碼就是由四種字型代號和六種角筆筆劃代號的組合而成。
6.如權(quán)利要求1所述的漢字編碼法,其特征在于在GY1系統(tǒng)中對一、二級漢字及其對應(yīng)的繁體漢字和詞組進(jìn)行同一形式編碼。
7.如權(quán)利要求1所述的漢字編碼法,其特征在于GY1系統(tǒng)有十三個定義字塊,輸入“金、目”兩個定義字塊時,連擊三次對應(yīng)鍵,加打一個空格鍵,輸入其余的定義字塊連擊四次對應(yīng)鍵。
8.如權(quán)利要求1所述的漢字編碼法,其特征在于三十個高頻漢字輸入時,先擊一次對應(yīng)鍵,加擊一次空格鍵。
9.如權(quán)利要求1所述的漢字編碼法,其特征在于在GY1系統(tǒng)中,對于超過三個字塊組成的漢字只取其第一、第二、第三和最后一個字塊參加編碼。
全文摘要
本發(fā)明屬于一種純字形的漢字編碼方法。提出了字塊的概念、新筆順規(guī)則、四種字型和六種筆劃、簡繁兼容和字詞兼容原理,將漢字按規(guī)則拆分成若干字塊,依字塊順序按新筆順規(guī)則取字塊的第一筆和第二筆劃的順序組合碼,結(jié)合定義字塊對應(yīng)鍵和識別補(bǔ)碼進(jìn)行漢字編碼。無記憶量、碼長短、重碼少、鍵位使用概率分布合理、輸入速度高。使?jié)h字輸入如同英文輸入一樣簡單。世界各國的使用者都能很容易掌握,使?jié)h字輸入技術(shù)走向國際。
文檔編號G06F3/023GK1063566SQ9110506
公開日1992年8月12日 申請日期1991年7月29日 優(yōu)先權(quán)日1991年7月29日
發(fā)明者祁淑悅, 袁守玲 申請人:祁淑悅, 袁守玲