專利名稱:三類五區(qū)輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于電腦漢字編碼輸入方法,也就是中文輸入法。它將漢字的各種部件分為單個基本筆畫、離散部件和交連部件三類部件,并將交連部件按基本筆畫分為五列五區(qū)排列,因此稱為三類五區(qū)輸入法。
背景技術(shù):
鍵盤輸入是目前漢字輸入法中使用最廣泛的輸入法??煞譃橐舸a、形碼、音形碼和序號碼四類輸入漢字。序號碼難以記憶,已幾乎無人使用。利用音碼輸入漢字,因為簡單易學,使用最為廣泛。可輸入速度不快,還有個弱點,那就是不認識的漢字無法輸入。為此,本人發(fā)明了漢字碼輸入法,它屬于音形碼,比音碼稍微復雜點,但因為重碼少,輸入速度卻要迅速得多,足以與任何輸入法相比。缺點是發(fā)音不準的漢字不能很快輸入。形碼雖然復雜難記,卻能輸入任何不認識的漢字,而且往往很快。形碼往往將漢字部件按象形、拼音和筆畫等方式歸類編碼,由于筆畫是有史以來最偉大的發(fā)明之一,因此按筆畫歸類的輸入法要勝過按拼音和象形歸類的輸入法,往往較為流行。五筆字型是其典型代表,其優(yōu)點是重碼少, 輸入速度快。但該輸入法僅僅利用25個字母鍵輸入漢字,還無視各漢字部件的組字頻率高低不一,硬將漢字部件按起筆分為五區(qū)五位,給組字頻率相當?shù)偷恼坶_頭的漢字部件也分了五個位,而組字頻率相當高的起筆為橫、豎、點的漢字部件也只分得了五區(qū),此舉浪費了個把鍵位,又造成了一定的重碼。為降低重碼,五筆字型不得不將起筆為橫的漢字部件中的孑并入到撇區(qū)中,將起筆為點的個和心插入到折區(qū)中。這完全是不能接受的,因為 、個和心的實際組字頻率已遠遠高于排在同一鍵上的其它部件的組字頻率之和,使得排 、個和心的鍵實際上應算作橫區(qū)和點區(qū),可五筆字型硬把它歸入到撇區(qū)和折區(qū)?!败嚒⒕?、幾”等漢字部件的歸類也不符合按區(qū)劃分的規(guī)律。五筆字型將每區(qū)又按第二筆分為橫、豎、撇、捺、折五位更是有點牽強,以豎區(qū)為例,第二筆通常是折,按理應集中安排在豎折這個區(qū)位鍵上, 這會帶來嚴重的重碼,因此不得不分散排列在各個鍵上。25個鍵名部件中竟有10來個部件不符合所謂的區(qū)位排列規(guī)律,這樣的規(guī)律實際上已不能算規(guī)律。還有,86版五筆字型只用了 25個鍵,白白浪費一個字母鍵,若能充分利用沈個鍵的話,則一、二、三級簡碼會更多, 輸入速度也會有所提高,也就是說應該還有比五筆字型更快的漢字輸入法。另外86版五筆字型還存在著若干漢字部件不符合語言文字規(guī)范、數(shù)量過多、拆分不便等問題。98版五筆字型雖然拆分時方便些,但漢字部件更多,技術(shù)上實為倒退。鄭碼對此有所改進,充分利用了沈鍵,部件符合規(guī)范,按起筆分區(qū)時考慮了漢字的組字頻率,較為合理,可也存在著橫區(qū)多了點、豎區(qū)少了點的缺點,更糟糕的是它將漢字部件分為主根、副根,除了第一主根外,其他第二主根、包根、雜根等漢字部件均用兩個字母作為代號編碼,盡管這有利于降低重碼, 可取碼規(guī)則相當繁雜,另外選取的漢字部件也較多,難學難記,拆分也較困難。為減少漢字部件,目前不少輸入法都通過五種基本筆畫兩兩組合的辦法,進行編碼。這種方法實際上是受五筆字型的影響,同樣沒有充分考慮到漢字筆畫特別是雙筆畫的組字頻率相差懸殊的情況,排列到鍵盤上后同樣表面顯得整齊劃一,實際上各字母鍵冷熱不均,容易產(chǎn)生重碼,另外還存在著不夠直觀,影響打字速度等問題。
發(fā)明內(nèi)容
這樣,目前形碼輸入法要么漢字部件過多或不規(guī)范、分區(qū)不合理,要么拆分困難, 不夠直觀、影響思維,要么沒能充分利用沈個鍵,都沒能做到較為方便快速地輸入漢字。本發(fā)明的目的是提供一種漢字部件比較規(guī)范、分區(qū)合理,拆分簡便直觀的,輸入漢字快速的計算機漢字輸入法即三類五區(qū)輸入法。為達到三類五區(qū)輸入法的目的,本發(fā)明在將漢字各種筆畫按國家語委的規(guī)定歸類橫、豎、撇、點、折后,又將漢字的各種部件分為單個基本筆畫部件、離散部件和交連部件三類,離散部件要求部件的筆畫離散并且對稱,分為兩個散筆、三個散筆,四個散筆、五個散筆,其中兩個散筆、三個散筆,四個散筆、分別用羅馬字母II、III、IV表示,五個散筆只有一個“立”,就直接用“立”表示。交連部件從《信息處理用GB13000. 1字符集漢字部件規(guī)范》 精選了 60來個組字頻率高的漢字部件,這些精選的漢字部件還可包含若干個組字頻率并不高,但屬于同類的漢字部件。將它們按起筆歸類到橫、豎、撇、點、折五個區(qū)中。再根據(jù)每個區(qū)中基本部件的組字頻率的高低來決定每個區(qū)包含的鍵位多少,經(jīng)科學測算,起筆為橫、 點、豎的基本部件組字頻率較高、數(shù)量也較多,各得六個鍵位,起筆為撇的漢字頻率次之,分得五個鍵位,折起筆的基本部件頻率最低,僅安排三個鍵位。各個基本部件在字母鍵上的分布見附圖1,該圖在標準鍵盤上以二列為一區(qū),將點區(qū)、橫區(qū)、豎區(qū)、撇區(qū)、折區(qū)從左到右以兩列為界依次排列,極具規(guī)律性,將漢字分為三類部件,并使得交連部件只有區(qū)區(qū)60個左右是本人十余年潛心研究的結(jié)果,是本發(fā)明的最大創(chuàng)造性所在。根據(jù)以兩列為界的將基本部件按起筆分區(qū)排列的方法,點區(qū)占兩列字母鍵,得六個字母鍵;橫區(qū)占兩列字母鍵,得六個字母鍵,豎區(qū)占兩列字母鍵,得六個字母鍵,撇區(qū)雖占五個字母鍵,卻也只得兩列,折區(qū)僅占三個字母鍵,卻也得兩列,從而達到了點、橫、豎、撇、折各區(qū)組字頻率不同,所占的字母鍵位數(shù)也因而不同,卻都占兩列的巧妙目的。這比將漢字部件分五區(qū)五列排列的輸入法來,無疑更有規(guī)律,是一種巨大進步。當然,由于豎區(qū)和撇區(qū)漢字部件的組字頻率相近,也可規(guī)定作豎區(qū)占五個字母鍵位,撇區(qū)占六個字母鍵位。另外還可將點區(qū)、橫區(qū)、豎區(qū)在鍵盤上的位置互換。這些都是對本發(fā)明的變形,還是以本發(fā)明所舉的實施例為最佳。另外本發(fā)明將點、橫、 豎、撇、折五種基本筆畫分別排在Q、Ε、T、U、0鍵上,用相應的字母編碼,由于都位于同一個區(qū)的上排,且僅隔一個字母鍵,也顯得極有規(guī)律,簡單易學。接著編碼,本身就是一個基本部件的漢字的編碼規(guī)則是成字基本部件的代碼+ 首筆畫代碼+次筆畫代碼+末筆畫代碼,基本部件不足三筆,按書寫順序取完該漢字的所有的筆畫的代碼為止。由多個基本部件組成的漢字的編碼規(guī)則是按書寫順序?qū)⒃摑h字拆分成基本部件,選取第一、二、三及最末一個基本部件,并用相應的代碼進行編碼,不足四個基本部件時,按書寫順序選取完該漢字的所有部件的代碼為止。單字的取碼規(guī)則都要遵循取大優(yōu)先原則,即要優(yōu)先按筆畫數(shù)多的基本部件編碼, 應保證按書寫順序每次拆分出盡可能筆畫數(shù)盡可能多的基本部件,不要把筆畫多的部件拆分成筆畫少的部件。根據(jù)這一規(guī)則可引申出一條規(guī)則,那就是多筆畫部件肯定比單筆畫部件即五種基本筆畫優(yōu)先編碼。另外還要兼顧直觀,避免把四邊封閉的方框形如“口”、“西”等基本部件按書寫順序拆開編碼,這條規(guī)則實際上也是取大優(yōu)先原則引申出來的。在拆分漢字時有個非常讓人頭疼的情況,那就是遇到幾個筆畫相交的基本部件時如何拆分,這時不同的輸入法往往有多種拆分方法。本人經(jīng)過長達十余年的潛心研究,終于成功解決了這一舉世難題。為方便漢字拆分,特別規(guī)定按書寫順序與前二筆及以上的筆畫相交的后寫筆畫必須單獨取出,按單個筆畫編碼,基本部件例外。例如“#”、“車”等基本部件在漢字中往往不與其它筆畫相交,因此從取大優(yōu)先的原則出發(fā),不宜將“#”、“車”等基本部件中的豎筆單獨取出編碼。有些漢字,它們包含的基本部件相同,只是基本部件的位置不同,為區(qū)分這些漢字的編碼,使其不發(fā)生重碼,必須增加字型信息,用區(qū)分碼加以區(qū)分。漢字的字型可分為獨體型和合體型二類,合體型約占漢字的96 %,它又可分為左右型、上下型、包圍型。在本輸入法中,將獨體型和包圍型合并為雜合型,在編碼中,左右型、上下型和雜合型這三類字型分別用三個互不相同的標點符號如“,”、“.”、“/”編碼。對于只有兩個或三個基本部件組成的漢字,編碼時可補上區(qū)分碼加以區(qū)分。方法是只有二個基本部件的漢字,需在這二個基本部件的代碼后補上其字型編碼,再補上其最末個基本筆畫的編碼。三個基本部件組成的漢字, 僅需在這三個基本部件的代碼后補上其字型編碼。本區(qū)分碼比起五筆字型的識別碼是一個巨大的改進,五筆字型將末筆與字型合并用一個鍵表示,給記憶帶來了嚴重的不便,影響頭腦反應,讓許多人頭疼不已。本輸入法則將字型與筆畫分開表示,并且只有兩個基本部件組成的漢字才需要補上漢字的末筆,三個基本部件組成的漢字則只需補上字型信息,無需補上末筆畫,從而大大方便了用戶操作。當然也可用拼音首字母作區(qū)分碼,甚至不考慮漢字的字型信息,不用區(qū)分碼參與編碼,只是那樣會增加重碼。利用輸入法軟件,在鍵盤上敲擊某個漢字相應的編碼所在的鍵就可輸入該漢字。 達到四碼且無重碼的自動上屏,不足四碼的必須補上一個空格鍵或用數(shù)字鍵選擇才能上屏。
圖1為三類五區(qū)輸入法基本部件鍵盤排列圖
具體實施例方式下面結(jié)合優(yōu)選的實施例和附圖作詳細說明。本發(fā)明在編碼時對漢字筆畫的認識完全科學。筆畫是構(gòu)成楷書漢字字形的最小連筆單位,是書寫漢字時一次連續(xù)寫成的一個線條。按國家語委的規(guī)定,在只考慮漢字的運筆方向而不計其輕重長短時,即只考慮其筆形時可分為橫、豎、撇、點、折五種基本筆畫,其中提并入橫,豎鉤并入豎,捺并入點,各種折筆都作折,也就是說其他各種帶轉(zhuǎn)折的筆畫都作折。國家語委稱五種基本筆畫為橫、豎、撇、點、折,而本人傾向于稱橫、豎、撇、捺、折。因為點的筆畫是很短的,不象其它筆畫那樣具有一定的長度,且有時運筆方向下垂,幾乎與撇相同。當然國家語委規(guī)定稱點可能是因為點成字,而且組字頻率高于捺。由于是國家語委的規(guī)定,只好遵守,其實國家語委還可規(guī)定稱捺也允許。將點、橫、豎、撇、折五種基本筆畫分別排在Q、Ε、T、U、0鍵上,用相應的字母編碼。接著將漢字分為合體字和獨體字二類,合體字是指具有上下、左右、里外即包圍結(jié)構(gòu)的漢字,它的二個部分往往具有明顯的界線。獨體字是指不具有上下、左右、里外結(jié)構(gòu)的漢字,它的全部筆畫往往交叉粘連、渾然一體,難以拆分。漢字部件是由幾個筆畫組成的具有組配漢字功能的構(gòu)字單位,漢字部件有多筆畫部件和單筆畫部件之分,單筆畫部件在本發(fā)明中即五種基本筆畫,多筆畫部件則分為離散部件和交連部件。同樣對離散部件做了優(yōu)化選擇,只有大致對稱的離散部件才得以入選,并按離散的筆畫數(shù)分為兩、三、四個散筆部件分別排列在點區(qū)的A、Z、W鍵上,用相應的字母編碼,由于排列有序,顯得十分簡單易記。兩個散筆的離散部件全部用II表示,包括二、八、兒、ν、 、U、丨丨、U、〈〈等為二個散筆,且大致離散對稱的筆畫。三個散筆的離散部件用III表示,包括三、小、W JIL、彡、川、〈〈〈,等為三個散筆,且大致離散對稱的筆畫,而?也屬于三個散筆,但因為十分常見,就單獨列出,它和其它幾個為三個散筆的部件也是用同一個字母編碼的。四個散筆的離散部件用IV表示,包括W、,、、、(火)漢字的交連部件更多,本發(fā)明只選用了近60個交連部件,做到了既簡單又高效。漢字部件的定義與國家語委的規(guī)定相同,它是由幾個筆畫構(gòu)成的相對不變的筆畫結(jié)構(gòu),組合后可構(gòu)成漢字。漢字部件按《信息處理用GB13000. 1字符集漢字部件規(guī)范》規(guī)定多達六百多個,這是規(guī)定交叉不拆的緣故。其實這樣規(guī)定是不怎么合理的,本人認為當某個筆畫與前二個及以上筆畫相交時,這個后寫的筆畫必須單獨拆出。若這么規(guī)定,則大量的所謂漢字部件實際上是由其它幾個漢字部件拼湊組成的,完全可以排除這些所謂的漢字部件。為減少記憶量,從《信息處理用GB13000. 1字符集漢字部件規(guī)范》中精選了 60來個組字頻率高的漢字部件,這些精選的漢字部件在本發(fā)明中稱為交連部件,特點是筆畫交連在一起,組成漢字部件。將它們按起筆歸類到橫、豎、撇、點、折五個區(qū)。再主要根據(jù)每個區(qū)中基本部件的組字頻率的高低,適當兼顧基本部件的多寡來決定每個區(qū)中包含的鍵位多少,經(jīng)科學測算,起筆為橫、點、豎的基本部件組字頻率較高、數(shù)量也較多,各得六個鍵位,起筆為撇的漢字頻率次之,分得五個鍵位,折起筆的基本部件組字頻率最低,僅安排三個鍵位。為便于記憶和兼顧指法操作,并參照新華字典部首排列規(guī)律,將點區(qū)、橫區(qū)、豎區(qū)、撇區(qū)、折區(qū)以二列為界從左到右依次排列。將點區(qū)部件分別排在標準鍵盤最左邊兩列的六個字母鍵位上,即排在Q、A、Z、W、S、X上,將橫區(qū)部件分別排在標準鍵盤中點區(qū)的右邊兩列六個字母鍵位上,即排在E、D、C、R、F、V上,將豎區(qū)部件分別排在標準鍵盤中橫區(qū)的右邊兩列六個字母鍵位上,即排在T、G、B、Y、H、N上,將撇區(qū)部件分別排在標準鍵盤中豎區(qū)的右邊兩列的五個字母鍵上,即排在U、J、M、I、K上,折區(qū)部件分別排在標準鍵盤最右邊的兩列的三個字母鍵上。各個基本部件在字母鍵上的分布見附圖1。具體講,點區(qū)中的ι、言、i、廣、方、文等部件排在Q鍵上,用Q作代碼;立、門、廣等部件排在A鍵上,用A作代碼;?、水、氺等部件排在Z鍵上,用Z作代碼;火部件排在W上,用W作代碼外、心、小、等部件排在S上,用S作代碼;“、 、1_、4 4等部件排在X上,用X作代碼;王、#、雨等部件排在E上,用E作代碼; 土、十等部件排在D上,用D作代碼;廠、大、車、石等部件排在C上,用C作代碼4、寸、豕、 等部件排在R上,用R作代碼;木、西等部件排在放F上,用F作代碼;工、戈、*、升等部件排在V上,用V作代碼;止、蟲等部件排在T上,用T作代碼;日等部件排在G上,用G作代
碼;田、山、ft等部件排在G上,用G作代碼;目、口等部件排在Y上,用Y作代碼;口等部件排在H上,用H作代碼;貝、四、m、皿等部件排在N上,用N作代碼;禾、竹、#、夂、夂等部件排在U上,用U作代碼;彳、人等部件排在J上,用J作代碼凍、金等部件排在M上,用M作代碼;月、t、匕等部件排在I上,用I作代碼;勺、〃、幾、鳥、備J、舟等部件排在K上,用 K作代碼;馬、耳、尸、卩等部件排在0鍵上,用0作代碼;女、刀、己、又等部件排在L上,用L 作代碼;鄉(xiāng)、弓、力、厶等部件排在P上,用P作代碼,鄉(xiāng)含$、糸、幺,也用P作代碼。為便于記憶和遵循習慣,個別組字頻率不高的部件也被排列到鍵上,它們并不一定按起筆歸類,而是按同源和近形歸類到組字頻率高的基本部件中。如?含水、氺、小含 、韋含金、止含/t 、IJ含U、夂含升、心含小、、#含竹、3含豕、勹含、四含M和皿、止含/t、夂含&和文、個含心和小、、?含水和氺、王含#、鄉(xiāng)含g、糸、么等部件,事實上,這些被包含的部件應視為同一個部件,因此本發(fā)明實際上的交連部件的數(shù)量僅為60來個。為減少重碼,便于用區(qū)分碼區(qū)分重碼,往往有意使各個鍵上的基本部件的末筆畫不同或字型不同。漢字的編碼是指用一組代碼表示一個漢字,本輸入法將漢字分為兩類一類是本身就是基本部件的漢字,另一類是由若干個基本部件組合而成的漢字。本身就是基本部件的漢字的輸入規(guī)則是該基本部件代碼+首筆代碼+次筆畫代碼+末筆畫代碼,當基本部件不足3筆時,按書寫順序取完所有的筆畫的代碼為止。不足四碼的還要補上一個空格鍵。例如“言”字,言的代碼為Q ;起筆為點,代碼為Q ;次筆為橫,代碼為E ;末筆為橫,代碼為E,言的編碼就為QQEE。又如“二”字,二的代碼為D,首筆和次筆都為橫,代碼分別為E、E,二的編碼就為DEE。由于本輸入法是將各基本部件按起筆排列的, 所以輸入規(guī)則中也可將首筆畫代碼略去,或?qū)⑤斎胍?guī)則改為基本部件代碼+第二筆畫代碼 +第三筆畫代碼+末筆畫代碼,還可將輸入規(guī)則改為該基本部件代碼+首筆代碼+次筆畫代碼+第三筆畫代碼。這些都是對本發(fā)明的變形。由若干個基本部件組合而成的漢字的輸入規(guī)則是按正確的書寫順序?qū)h字拆分成若干個基本部件,進行編碼。拆分時要把握的原則是按書寫順序,每次都拆分出筆畫數(shù)盡可能多的基本部件,并且還要兼顧直觀,不要把口等四周封閉的基本部件按書寫順序拆開編碼,各基本部件能按不相交拆分就按不相交拆分,能按離散拆分就不要按相連拆分。相連關(guān)系有時不容易分清,規(guī)定單筆畫基本部件與多筆畫基本部件組合,若即若離,沒有明顯間距時,視為相連,如“自,,字,視為基本部件“撇”與基本部件“目,,相連。但點的下面有橫時,視為離散,如“主”字,如基本部件“點”與“王”視為離散。特別規(guī)定當某個后寫的筆畫跟前二筆乃至更多的前幾個筆畫相交時,該后寫的筆畫必須單獨拆出編碼,但不宜將基本部件中的豎筆單獨取出編碼。漢字輸入法中最頭疼的是遇到相交的筆畫如何拆分,如“曹” 字的上半部分,不同的輸入法有不同的拆分方法,給初學者帶來了嚴重的不便。這條特別規(guī)定則解決了漢字輸入法中長期未能解決的難題,使“曹”字上半部分的中間的兩豎必須單獨拆分成兩個基本筆畫編碼。四個以及超過四個基本部件組成的漢字的編碼規(guī)則是取第一、第二、第三個及最末一個基本部件的代碼作為該漢字的編碼。如“編”字,按書寫順序,第一、二、三及最末一個基本部件分別為鄉(xiāng)、、、尸、卄,代碼分別為P、Q、0、V,編碼就為PQ0V。如“型”的編碼,第一、二、三及最末一個基本部件分別為橫、升、lj、土,代碼分別為E、V、G、D,編碼就為EVGD。二個或三個基本部件組成的漢字按書寫順序依次取各基本部件的代碼,再補上區(qū)分碼編碼。區(qū)分碼的編碼方法是將左右型、上下型和雜合型分別用三個互不相同的標點符號比如用“,”、“.”和“/”表示,只有二個基本部件的漢字,需在這二個基本部件的代碼后補上其字型編碼,再補上該漢字的最末筆的編碼。三個基本部件組成的漢字,僅需在這三個基本部件的代碼后補上其字型編碼。需要指出將左右型、上下型和雜合型分別用“,”、“.”和 “/”編碼也是一個創(chuàng)新,因為一來簡單易記,二來區(qū)分碼的位置不可能出現(xiàn)在漢字編碼的第一個位置,不影響標點符號輸入。如“男”字,前二個部件為“田”、“力”,代碼為B、P,不足四碼,需補上區(qū)分碼是上下結(jié)構(gòu),因此用“.”編碼,最末筆是撇,編碼是U,這樣“男”的編碼為 "BP. U”。又如“絡”字,前三個部件為“鄉(xiāng)”、“欠”、“口”,代碼分別為P、U、H,為左右結(jié)構(gòu),用 “,,,編碼,輪的編碼就為"PUH, ”。對于常用漢字若只取其完整編碼前邊的一個、二個、三個,再補上空格鍵,就構(gòu)成了一、二、三級簡碼。本輸入法中的一、二、三級簡碼的數(shù)量都多于25鍵的輸入法,重碼率又很低,因此輸入速度比25鍵的輸入法要快些。為提高輸入速度,目前各類輸入法都提供了詞語輸入的功能,本輸入法也如此,規(guī)定不論詞語的長短,其編碼長度都為4碼,并且字詞兼容。詞語的編碼規(guī)則是二字詞,分別取每個字的完整編碼的前2碼。如詞語“過程”的編碼,分別取“過”的前二個部件寸、1_的代碼R、X,“程”的前二個部件禾、口的代碼U、H,過程的編碼就為RXUH。三字詞,分別取前二個字的完整編碼的第1碼,取第三個字的完整編碼的前2碼。如詞語“計算機”的編碼, 分別取計的第一個部件i的代碼Q,算的第一個部件""的代碼U,機的前二個部件木、幾的代碼F、K,“計算機”的代碼就為QUH(。四個字及四個以上字的詞,分別取第1、第2、第3和最后一個字的完整編碼的第一碼。詞組輸入是提高輸入速度的重要方法。要盡量利用詞組輸入。如“中華人民共和國”的編碼,分別取中、華、人、國的第一個部件口 d、人、口的代碼 H、J、J、Y,“中華人民共和國”的編碼就為HJJY。三類五區(qū)輸入法的重碼率比較低,為最大限度減少重碼,在軟件設(shè)計中有意將發(fā)生重碼的兩個字中的某一個字列為二級簡碼,另一個字列為三級簡碼,從而實際上消除重碼。為了便于使用,還設(shè)置了容錯碼,對一些編碼容易出錯的漢字,在錯誤輸入時也能出現(xiàn)所要輸入的漢字。
權(quán)利要求
1.一種三類五區(qū)輸入法,在將漢字各種筆畫按國家語委的規(guī)定歸類為橫、豎、撇、點、折后,其特征是將點、橫、豎、撇、折五種基本筆畫分別排在Q、Ε、T、U、0鍵上,用相應的字母編碼;將漢字的各種部件分為單個基本筆畫部件、離散部件和交連部件三類,離散部件要求部件的筆畫離散并且對稱,兩個散筆的離散部件全部用II表示,包括二、八、兒、ν、々、7、IJ、丨丨、U、〈〈等為二個散筆,且大致離散對稱的筆畫;三個散筆的離散部件用III表示,包括三、小、]/、)丨[.、彡、川、〈〈〈,等為三個散筆,且大致離散對稱的筆畫,而?也屬于三個散筆,但因為十分常見,就單獨列出,它和其它幾個為三個散筆的部件也是用同一個字母編碼的;四個散筆的離散部件用IV表示,包括-、,、、、、火;精選了 60來個組字頻率高的交連部件,作為基本部件,將它們按起筆歸類到橫、豎、撇、點、折五個區(qū)中;再根據(jù)每個區(qū)中基本部件的組字頻率的高低來決定每個區(qū)包含的鍵位多少,經(jīng)測算,起筆為橫、點、豎的基本部件各得六個鍵位,起筆為撇的漢字頻率次之,分得五個鍵位,折起筆的基本部件頻率最低,僅安排三個鍵位;按點、橫、豎、撇、折的次序分區(qū)從左到右依次以每兩列為界排列;點區(qū)中的ι、言、 i、廣、方、文等部件排在Q鍵上,用Q作代碼;立、門、廣等部件排在A鍵上,用A作代碼;?、 水、氺等部件排在Z鍵上,用Z作代碼;火部件排在W上,用W作代碼;丨、心、小等部件排在 S上,用S作代碼;"、 、1_、4、卒等部件排在X上,用X作代碼;王、#、雨等部件排在E 上,用E作代碼;土、十等部件排在D上,用D作代碼;廠、大、車、石等部件排在C上,用C作代碼4、寸、豕、等部件排在R上,用R作代碼;木、西等部件排在放F上,用F作代碼;工、 戈、*、升等部件排在V上,用V作代碼;止、/t、蟲等部件排在T上,用T作代碼;日等部件排在G上,用G作代碼;田、山、ft等部件排在G上,用G作代碼;目、口等部件排在Y上,用 Y作代碼;口等部件排在H上,用H作代碼;貝、四、m、皿等部件排在N上,用N作代碼;禾、 竹、#、夂、夂等部件排在U上,用U作代碼;彳、人等部件排在J上,用J作代碼凍、金等部件排在M上,用M作代碼;月、農(nóng)、匕等部件排在I上,用I作代碼;勺、〃、幾、鳥、備、各、 舟等部件排在K上,用K作代碼;馬、耳、尸、卩等部件排在0鍵上,用0作代碼;女、刀、己、又等部件排在L上,用L作代碼;鄉(xiāng)、弓、力、厶等部件排在P上,用P作代碼,鄉(xiāng)含系、糸、幺,也用P作代碼;個別組字頻率不高的部件也被排列到鍵上,它們并不一定按起筆歸類,而是按同源和近形歸類到組字頻率高的基本部件中,如?含水、氺、小含 、韋含金、止含/t、U含 V、廿含升、心含小、、#含竹、3含豕、勹含〃、四含M和皿、止;t、夂含欠?卜含心和小、、?含水和氺、王含#、鄉(xiāng)含系、糸、幺等部件;接著編碼,本身就是一個基本部件的漢字的編碼規(guī)則是基本部件的代碼+首筆畫代碼+次筆畫代碼+末筆畫代碼;四個及超過四個基本部件組成的漢字的編碼規(guī)則是取第一、第二、第三及最末一個基本部件的代碼作為該漢字的編碼;二個或三個基本部件組成的漢字按書寫順序依次取各基本部件的代碼,還可補上區(qū)分碼參與編碼。
2.根據(jù)權(quán)利要求1所述的三類五區(qū)輸入法,其特征是區(qū)分碼的編碼方法是將左右型、 上下型和雜合型這三類字型分別用三個互不相同的標點符號比如“,”、“.”和“/”表示,只有二個基本部件的漢字,需在這二個基本部件的代碼后補上其字型編碼,再補上該漢字最末的筆畫的編碼;三個基本部件組成的漢字,僅需在這三個基本部件的代碼后補上該漢字字型編碼。
3.根據(jù)權(quán)利要求1所述的三類五區(qū)輸入法,其特征是單字取碼規(guī)則都要遵循取大優(yōu)先原則,即要優(yōu)先按筆畫數(shù)多的基本部件編碼,還要兼顧直觀,避免把四邊封閉的方框形的基本部件按書寫順序拆開編碼,特別規(guī)定按書寫順序與前二筆或更多的筆畫相交的后寫筆畫必須單獨取出,按單個基本筆畫編碼,但優(yōu)選的基本部件車、&等例外。
4.根據(jù)權(quán)利要求1所述的三類五區(qū)輸入法,其特征是詞組的編碼規(guī)則為二字詞,分別取每個字的完整編碼的前2碼;三字詞,分別取前二個字的完整編碼的第1碼,取第三個字的完整編碼的前2碼;四字詞及四個以上的多字詞,分別取第1、第2、第3和最后一個字的完整編碼的第一碼。
全文摘要
本發(fā)明三類五區(qū)輸入法屬于計算機漢字編碼輸入法,在將漢字各種筆畫按國家語委的規(guī)定歸類為橫、豎、撇、點、折后,并將多筆畫部件為離散部件、交連部件,再將漢字拆分成基本部件進行編碼,具有符合筆順規(guī)范、直觀、簡單易學、輸入漢字方便快捷等特點。
文檔編號G06F3/023GK102339139SQ20111034555
公開日2012年2月1日 申請日期2011年10月28日 優(yōu)先權(quán)日2011年10月28日
發(fā)明者王治陽 申請人:王治陽