專利名稱:雙分三碼輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于電腦漢字編碼輸入方法,也就是中文輸入法。它在將 漢字分為獨體字和合體字,將合體字按整體結(jié)構(gòu)一分為二,并且將漢 字部件根據(jù)起筆以每二列排列在字母鍵上,進行編碼輸入漢字,并且 單字碼長最多為三碼,因此稱為雙分三碼輸入法。
背景技術(shù):
鍵盤輸入是目前漢字輸入法中使用最廣泛的輸入法。漢字的編碼 是指用一組代碼表示一個漢字。主要分為音碼、形碼、音形碼三類輸 入漢字。利用音碼輸入漢字,因為簡單易學,使用最為廣泛??奢斎?速度不快,還有個弱點,那就是不認識的漢字無法輸入。形碼雖然復 雜難記,卻能輸入任何不認識的漢字,而且往往很快。形碼常將漢字 部件按象形、拼音和筆畫等方式歸類編碼,由于筆畫是有史以來最偉 大的發(fā)明之一,因此按筆畫歸類的輸入法要勝過按拼音和象形歸類的 輸入法,往往較為流行。
五筆字型是形碼的典型代表,優(yōu)點是重碼少,輸入速度快,但該
輸入法僅僅利用25個字母鍵輸入漢字,還無視各個漢字部件的組字 頻率高低不一,硬將漢字部件按起筆分為五區(qū)五位,給組字頻率相當 低的折開頭的漢字部件也分了五個位,而組字頻率相當高的起筆為 橫、豎、點的漢字部件也只分得了五區(qū),此舉浪費了個把鍵位,又會 造成一定的重碼。為降低重碼,五筆字型不得不將起筆為橫的漢字部件中的凈并入到撇區(qū)中,將起筆為點的十和心插入到折區(qū)中,這完全 是不能接受的,因為,、+和心的實際組字頻率已遠遠高于排在同一 鍵上的其它部件的組字頻率之和,使得排凈、+和心的鍵實際上應算 作橫區(qū)和點區(qū),可五筆字型硬把它歸入到撇區(qū)和折區(qū)。"車、九、幾" 等漢字部件的歸類也不符合按區(qū)劃分的規(guī)律。五筆字型將每區(qū)又按第 二筆分為橫、豎、撇、捺、折五位,更有點牽強,以豎區(qū)為例,第二 筆通常是折,按理應集中安排在豎折這個區(qū)位鍵上,這會帶來嚴重的 重碼,因此不得不分散排列在各個鍵上。25個鍵名部件中竟有10來 個部件不符合所謂的區(qū)位排列規(guī)律,這樣的規(guī)律實際上己不能算規(guī)
律。還有一點,五筆字型只用了25個鍵,白白浪費一個字母鍵,若 能充分利用26個鍵的話,則一、二、三級簡碼會更多,輸入速度也 會有所提高,也就是說應該還有比五筆字型更快的漢字輸入法。另外 86版五筆字型還存在著若干漢字部件不符合語言文字規(guī)范、數(shù)量過 多、拆分不便等問題。
鄭碼對此有所改進,充分利用了26鍵,部件符合規(guī)范,按起筆 分區(qū)時考慮了漢字的組字頻率,較為合理,可也存在著橫區(qū)多了點、 豎區(qū)少了點,在鍵盤上排列不夠有序的缺點,更糟糕的是它將漢字分 為主根、副根,除了第一主根外,其它第二主根、包根、雜根等漢字 部件均用兩個字母作為代號編碼,盡管這有利于降低重碼,可取碼規(guī) 則相當繁雜,另外選取的漢字部件也較多,難學難記。
為減少漢字部件,目前不少輸入法都通過五種基本筆畫兩兩組合 的辦法,進行編碼。這種方法實際上是受五筆字型的影響,同樣沒有充分考慮到漢字筆畫特別是雙筆畫的組字頻率相差懸殊的情況,排列 到鍵盤上后同樣表面顯得整齊劃一,實際上各字母鍵冷熱不均,容易 產(chǎn)生重碼,另外還存在著不夠直觀,影響思維等問題。
為此,本人發(fā)明了雙分三碼輸入法,它只用了 70來個漢字部件, 部件選取合理,分區(qū)規(guī)范,輸入漢字快速等優(yōu)點。但它單字碼長有四 碼,有時會造成字詞重碼,而目前最新的形碼輸入法,常用的中文字 僅取倉碼的首、次和后綴,即每字限取1至3碼。如倉頡輸入法已 將單字碼長改為三碼,常用的中文字僅取首、次和后綴,由于取碼規(guī) 則作了較大改進,重碼率仍然很低。有的三碼輸入法重碼率比四碼形 碼更低??梢娭灰O(shè)計合理,單字編碼時有三碼己夠了。取三碼的話, 拆分漢字就簡單得多。
發(fā)明內(nèi)容
這樣,目前形碼輸入法要么漢字部件過多或不規(guī)范、分區(qū)不合理,
要么拆分困難,不夠直觀、影響思維,要么沒能充分利用26個鍵, 要么碼長不止三碼,都沒能做到方便快速地輸入漢字。
本發(fā)明的目的是提供一種漢字部件比較規(guī)范、分區(qū)合理,拆分簡 單直觀的,單字碼長最多為三碼,輸入漢字快速的計算機漢字輸入法 即雙分三碼輸入法。
為了達到雙分三碼輸入法的目的,本發(fā)明在將漢字各種筆畫按國 家語委的規(guī)定歸類為橫、豎、撇、點、折后,又從《信息處理用GB13000. 1 字符集漢字部件規(guī)范》精選了 70來個組字頻率高的漢字部件,這些 精選的漢字部件還可包含若干個組字頻率并不高,但同源或同形的同類的漢字部件,通稱為基本部件。將它們按起筆歸類到橫、豎、撇、 點、折五個區(qū)中。再根據(jù)每個區(qū)中漢字部件的組字頻率的高低來決定 每個區(qū)所包含的鍵位多少,經(jīng)科學測算,起筆為橫、點、豎的漢字部 件組字頻率較高、數(shù)量也較多,各得六個鍵位,起筆為撇的漢字頻率 次之,分得五個鍵位,折起筆的漢字部件頻率最低,僅安排三個鍵位。 各個漢字部件均嚴格按起筆和相容關(guān)系排在字母鍵上,分布見附圖1, 該圖在標準鍵盤上以二列為一區(qū),將點區(qū)、橫區(qū)、豎區(qū)、撇區(qū)、折區(qū) 從左到右依次以兩列為界排列,極具規(guī)律性,是本人十余年潛心研究 的結(jié)果,是本發(fā)明的最大創(chuàng)造性所在。根據(jù)以兩列為界將漢字部件按 起筆分區(qū)排列的方法,點區(qū)占兩列字母鍵,得六個字母鍵;橫區(qū)占兩 列字母鍵,得六個字母鍵,豎區(qū)占兩列字母鍵,得六個字母鍵,撇區(qū) 雖占五個字母鍵,卻也只得兩列,折區(qū)僅占三個字母鍵,卻也得兩列, 從而達到了點、橫、豎、撇、折各區(qū)組字頻率不同,所占的字母鍵數(shù) 也因而不同,卻都占兩列的巧妙目的。比將漢字部件五區(qū)五列排列的 輸入法來,無疑更有規(guī)律,更符合指法習慣,是一種巨大進步。當然 由于豎區(qū)和撇區(qū)漢字部件的組字頻率相近,也可規(guī)定作豎區(qū)占五個字 母鍵位,撇區(qū)占六個字母鍵位。另外還可將點區(qū)、橫區(qū)、豎區(qū)在鍵盤 上的位置互換。這些都是對本發(fā)明的變形,還是以本發(fā)明所舉的實施 列為最佳。另外本發(fā)明將點、橫、豎、撇、折五種基本筆畫分別排在
Q、 E、 T、 U、 0鍵上,用相應的字母編碼,由于都位于上排,且僅隔 一個字母鍵,也顯得極有規(guī)律,簡單易學。
另外本發(fā)明采用了將一分為二的技術(shù),將合體字分為首部和剩部,再根據(jù)首部和剩部各自的結(jié)構(gòu),將首部或剩部的碼長作優(yōu)化規(guī)定。 這一來使得大量的偏旁部首,特別是筆畫過多或過少且不很常用的偏 旁無須再排在鍵上,從而使部件的數(shù)量大為減少。二來使得碼長縮短 為三碼,這也是本發(fā)明易學快速的原因。
又將漢字分為兩類 一類是獨體字, 一類是合體字。獨體字又分 兩類 一類是本身就是基本部件的漢字,它排列在字母鍵上,稱為鍵 內(nèi)獨體字,編碼規(guī)則是成字基本部件的代碼+首筆畫代碼+末筆畫代 碼,只有一筆的漢字就只取首筆畫的代碼。另一類是多個基本部件組 合而成的獨體字,它不出現(xiàn)在鍵上,稱為鍵外獨體字,編碼規(guī)則是按 書寫順序拆分成幾個基本部件,取第一個基本部件的代碼+第二個基 本部件的代碼+最末一個基本部件的代碼,進行編碼,拆分成基本部 件后,部件數(shù)量不到三個的,取完所有的部件的代碼為止。
合體字編碼時,要按書寫順序?qū)⒃摑h字按整體結(jié)構(gòu)一分為二,拆 分成二個部分,先寫的部分稱為第一部分,簡稱首部,后寫的部分稱 為第二部分,簡稱剩部。編碼規(guī)則是首部分別取第一個部件和最末 個基本部件的相應代號進行編碼,再取剩部的第一個部件的代號進行 編碼,當首部只有一個基本部件,最多只能取l碼,這時剩部最多可 取2碼,分別按書寫順序取剩部的第一個和最末個部件的相應代號進 行編碼,剩部只有一個部件就只取這個部件的代號進行編碼。
單字取碼規(guī)則都要遵循取大優(yōu)先原則,即要優(yōu)先按筆畫數(shù)多的漢 字部件編碼,應保證按書寫順序每次拆分出盡可能大的漢字部件,并 且拆分的次數(shù)要盡量少,不要把筆畫多的部件拆分成筆畫少的部件。根據(jù)這一規(guī)則可引申出一條規(guī)則那就是多筆畫部件肯定比單筆畫部 件即五種基本筆畫優(yōu)先編碼。另外還要兼顧直觀,避免把四邊封閉的 方框形如"方框口"等基本部件按書寫順序拆開編碼,這條規(guī)則實際 上也是取大優(yōu)先原則引申出來的。
在拆分漢字時有個非常讓人頭疼的情況,那就是遇到幾個基本部 件筆畫相交時該如何拆分,這時往往有多種拆分方法。本人經(jīng)過長達 十余年的潛心研究,終于成功解決了這一舉世難題。為方便漢字拆分, 特別規(guī)定按書寫順序與前三筆及以上的筆畫相交的后寫筆畫必須單 獨取出,按單個筆畫編碼,基本部件例外?;静考遣豢稍俨鸱值?, 不宜將基本部件中的與多個筆畫相交的后寫筆畫單獨拆出編碼。
有些漢字,它們包含的基本部件相同,只是基本部件的位置不同, 為區(qū)分這些漢字的編碼,使其不重碼,必須增加字型信息,用區(qū)分碼 加以區(qū)分。漢字的字型可分為獨體型和合體型二類,合體型約占漢字 的96%,合體型漢字不足三碼時需補上區(qū)分碼。合體型又可分為左右 型、上下型、包圍型,分別用","、"."、"/"表示。方法是只有 二碼的可補上其字型編碼。當然也可用拼音首字母作區(qū)分碼,甚至不 考慮漢字的字型信息,不用區(qū)分碼參與編碼。
利用輸入法軟件,在鍵盤上敲擊某個漢字相應的編碼所在的鍵就 可輸入該漢字。
圖l為雙分三碼輸入法基本部件鍵盤排列圖具體實施方式
下面結(jié)合優(yōu)選的實施例和附圖作詳細說明。
本發(fā)明在編碼時對漢字筆畫的認識完全科學。筆畫是構(gòu)成楷書漢 字字形的最小連筆單位,是書寫漢字時一次連續(xù)寫成的一個線條。按 國家語委的規(guī)定,在只考慮漢字的運筆方向而不計其輕重長短時,即 只考慮其筆形時可分為橫、豎、撇、點、折五種基本筆畫,其中提并 入橫,豎鉤并入豎,捺并入點,各種折筆都作折,也就是說其他各種 帶轉(zhuǎn)折的筆畫都作折。國家語委稱五種基本筆畫為橫、豎、撇、點、 折,而本人傾向于稱橫、豎、撇、捺、折。因為點的筆畫是很短的, 不象其它筆畫那樣具有一定的長度,且有時運筆方向下垂,幾乎與撇 相同。當然國家語委規(guī)定稱點可能是因為點成字,而且組字頻率高于 捺。由于是國家語委的規(guī)定,只好遵守,其實國家語委還可規(guī)定稱捺 也允許。漢字部件是由幾個筆畫組成的具有組配漢字功能的構(gòu)字單 位,漢字部件有多筆畫部件和單筆畫部件之分,單筆畫部件在本發(fā)明 中即為五種基本筆畫。
接著將漢字分為合體字和獨體字二類,合體字是指具有上下、左 右、里外即包圍結(jié)構(gòu)的漢字,它的二個部分往往具有明顯的界線。獨 體字是指不具有上下、左右、里外結(jié)構(gòu)的漢字,它的筆畫往往交叉粘 連、渾然一體。
漢字部件的定義與國家語委的規(guī)定相同,它是由幾個筆畫構(gòu)成的 相對不變的筆畫結(jié)構(gòu),組合后可構(gòu)成漢字。漢字部件按《信息處理用
GB13000. 1字符集漢字部件規(guī)范》規(guī)定多達六百多個,這是規(guī)定交叉 不拆的緣故。其實這樣規(guī)定是不怎么合理的,本人認為當某個筆畫與前三個及以上個筆畫相交時,這個后寫的筆畫必須單獨拆出。若這么 規(guī)定,則大量的所謂漢字部件實際上是由其它幾個漢字部件拼湊組成 的,完全可以排除這些所謂的漢字部件。為減少記憶量,從《信息處
理用GB13000. 1字符集漢字部件規(guī)范》中精選了 70來個組字頻率高
的漢字部件,這些精選的漢字部件在本發(fā)明中稱為基本部件,將它們 按起筆歸類到橫、豎、撇、點、折五個區(qū)。再主要根據(jù)每個區(qū)中基本 部件的組字頻率的高低,兼顧基本部件的多寡來決定每個區(qū)中包含的 鍵位多少,經(jīng)科學測算,起筆為橫、點、豎的漢字部件組字頻率較高、 數(shù)量也較多,各得六個鍵位,起筆為撇的漢字頻率次之,分得五個鍵 位,折起筆的漢字部件組字頻率最低,僅安排三個鍵位。為便于記憶 和兼顧指法操作,并參照新華字典部首排列規(guī)律,按點、橫、豎、撇、 折的次序分區(qū)從左到右依次排列。將點區(qū)部件分別排在標準鍵盤最左
邊兩列的六個字母鍵位上,即排在Q、 A、 Z、 W、 S、 X上,將橫區(qū)部 件分別排在標準鍵盤中點區(qū)的右邊兩列六個字母鍵位上,即排在E、 D、 C、 R、 F、 V上,將豎區(qū)部件分別排在標準鍵盤中橫區(qū)的右邊兩列 六個字母鍵位上,即排在T、 G、 B、 Y、 H、 N上,將撇區(qū)部件分別排 在標準鍵盤中豎區(qū)的右邊兩列的五個字母鍵上,即排在U、 J、 M、 I、 K上,折區(qū)部件分別排在標準鍵盤最右邊的兩列的三個字母鍵上。各 個基本部件在字母鍵上的分布見附圖1。具體講,點區(qū)中的、、i、 言、i 、廣等部件排在Q鍵上,用Q作代碼;立、廣、v、之、Z等 部件排在A鍵上,用A作代碼;?、水等部件排在Z鍵上,用Z作代 碼;火和,、、、等部件排在W上,用W作代碼;+ 、心等部件排在S上,用S作代碼;^、 ^、 i_、 *等部件排在X上,用X作代碼;王、一、 主等部件排在E上,用E作代碼;土等部件排在D上,用D作代碼; 大、石等部件排在C上,用C作代碼;凈、寸等部件排在R上,用R
作代碼;木等部件排在放F上,用F作代碼;工、七、^等部件排在
V上,用V作代碼;止、蟲、l等部件排在T上,用T作代碼;日、
iJ等部件排在G上,用G作代碼;小、山等部件排在G上,用G作代 碼;目、田等部件排在Y上,用Y作代碼;口等部件排在H上,用H 作代碼;貝、門等部件排在N上,用N作代碼;禾、竹、欣、夂、夂、
J等部件排在U上,用U作代碼;、人,乂等部件排在J上,用J
作代碼;八、,、金等部件排在M上,用M作代碼;月、兒、僅等部 件排在I上,用I作代碼;勺、々、幾等部件排在K上,用K作代碼; 乙、馬、尸、巳、P等部件排在0上,用0作代碼,乙代表所有的折 筆畫;女、己、又等部件排在L上,用L作代碼;厶、力、鄉(xiāng)等部件
排在L上,用L作代碼;為便于記憶和遵循習慣,個別組字頻率不高
的部件也被排列到鍵上,它們并不一定按起筆歸類,而是按同源和近 形歸類到組字頻率高的基本部件中。如?含水、韋含金、欣含竹等部 件。為減少重碼,以及便于用區(qū)分碼區(qū)分重碼,往往有意使各個鍵上 的基本部件的末筆畫不同。
取碼數(shù)目本無需特別規(guī)定,可從頭到尾取全。但是中文字大都形 狀復雜繁瑣, 一一取全,反而耗神費時,與手寫無異。最理想的取碼 數(shù),應是能分辨所有中文字,而重碼率合理者。經(jīng)深入研究,取三碼 是比較理想的。因為漢字的偏旁只有二百來個,常用的只有三十來個,這三十來個偏旁統(tǒng)帥著三分之二的合體字,其余170個偏旁只統(tǒng)帥著 三分之一的合體字。為減少重碼,三十來個常見偏旁部首,應當優(yōu)選 出來排列在字母鍵上,只取一碼,對其余不太常見的偏旁,由于其統(tǒng) 帥的漢字不多,往往不到二、三十個,因此這類偏旁可取二碼。
鍵內(nèi)獨體字的編碼規(guī)則是成字基本部件的代碼+首筆畫代碼+ 末筆畫代碼,只有一筆的就取第一筆的代碼。例如"言"字,言的代
碼為Q;起筆為點,代碼為Q;末筆為橫,代碼為E,言的編碼就為 QQE。又如"一"字, 一的代碼為E,首筆為橫,代碼為E,"一"的 編碼就為EE。
另一類是多個基本部件組合而成的獨體字,它不出現(xiàn)在鍵上,稱 為鍵外獨體字,編碼規(guī)則是按書寫順序拆分成幾個基本部件,取第一 個基本部件的代碼+第二個基本部件的代碼+最末個基本部件的代碼, 進行編碼,拆分成基本部件后,部件數(shù)量不到三個的,取完所有的部 件為止。也就是說鍵外獨體字取碼時依序取首、次和后綴。如"甫" 字,是獨體字,按書寫順序取橫、月、點的代碼E、 I、 Q,"甫"的 編碼就為EIQ。
由合體字的編碼時,要按書寫順序?qū)⒃摑h字按整體結(jié)構(gòu)一分為 二,拆分成二個部分,先寫的部分稱為第一部分,簡稱首部,即包含 按書寫順序第一筆的部分為首部,其余部分即后寫的部分稱為第二部
分,簡稱剩部。編碼規(guī)則是首部分別取第一個部件和最末個基本部
件的相應代號進行編碼,再取剩部的第一個部件的代號進行編碼,當
首部只有一個基本部件,最多只能取l碼,這時剩部最多可取2碼,分別按書寫順序取剩部的第一個和最末個部件的相應代號進行編碼, 剩部只有一個部件就只取這個部件的代號進行編碼。
一分為二時有個技巧,那就是在明顯間隙處進行一分為二,分成 二部分。若多筆畫基本部件的最末筆為橫,橫下面的中間有豎,也要 一分為二,將該多筆畫部件與其他部分區(qū)分,如"走"字,它的首部 應分為土,止,"足"也一樣,盡管兩部分無間隙,也要分為口、止 兩部分。單獨的點和撇盡管有時可能與其它部件有一定的間隙,但不 能進行一分為二。
拆分時要把握的原則是按書寫順序,每次都拆分出筆畫數(shù)盡可 能多的基本部件,并且還要兼顧直觀,各基本部件能按不相交拆分就 按不相交拆分,特別規(guī)定當遇到某個筆畫跟前三個筆畫或更多筆畫相 交的筆畫,該筆畫必須單獨拆出編碼,但基本部件除外。漢字輸入法 中最頭疼的是遇到相交的筆畫如何拆分,如"曹"字的上半部分,不 同的輸入法有不同的拆分方法,給初學者帶來了嚴重的不便。這條特 別規(guī)定則解決了漢字輸入法中長期未能解決的難題,使"曹"字上半 部分的中間的兩豎必須單獨拆分成兩個基本筆畫編碼。另外還規(guī)定, 基本部件必須完全符合書寫順序,不許插入其它筆畫,若書寫過程中 插入了其它筆畫,則不成為基本部件,但方框口部除外,因為"國"、 "因"等字按規(guī)定最后一筆橫必須最后寫。有的輸入法將"禹"等字 拆分成撇、蟲、門,這是違反書寫順序的,也增加了學習難度。
如"編"字,它的首部只有一個基本部件鄉(xiāng),代碼為P,這時剩 部可按書寫順序取第一個和最末個基本部件、、卄,代碼分別為Q、V,編碼就為PQV。
合體字若不足三碼,補上區(qū)分碼編碼。區(qū)分碼的編碼方法是將左 右型、上下型和雜合型分別用三個互不相同的標點符號比如用","、
"."和"/"表示,只有二碼的漢字,需在這二個基本部件的代碼后 補上其字型編碼。需要指出將左右型、上下型和雜合型分別用","、
"."和"/"編碼也是一個創(chuàng)新,因為一來簡單易記,二來區(qū)分碼的 位置不可能出現(xiàn)在漢字編碼的第一個位置,不影響標點符號輸入。如
"杜"字,前二個部件為"木"、"土",代碼為F、 D,不足四碼,需
補上區(qū)分碼是上下結(jié)構(gòu),因此用"."編碼,這樣"男"的編碼為
"FD."。獨體字不必補區(qū)分碼。
對于常用漢字,若只取其完整編碼的前邊一個、二個,再補上空 格鍵,就構(gòu)成了一、 二級簡碼。本輸入法中一、二級簡碼的數(shù)量都多 于25鍵的輸入法,重碼率又很低,因此單字輸入速度比25鍵的輸入 法要快些。本發(fā)明字詞兼容,由于字詞編碼長度不同,不會產(chǎn)生字詞 重碼問題。
本發(fā)明有少許重碼,但幾乎不影響輸入速度,對于過分追求無重 碼的人來說,編碼規(guī)則還可改為若首部為基本部件的合體字,取剩 部的第一、二及最末個部件的相應代號編碼,獨體字仍取第一、二和 最末個部件編碼,若首部為非整個基本部件的合體字,首部取第一個 和最末個部件編碼,剩部取第一個部件編碼,也就是說獨體字和首部 為非整個基本部件的合體字的編碼規(guī)則不變。
為提高輸入速度,目前各類輸入法都提供了詞語輸入的功能,本輸入法也如此,規(guī)定不論詞語的長短,其編碼長度都為4碼,并且字 詞兼容。詞語的編碼規(guī)則是二字詞,分別取每個字的完整編碼的前 2碼。如詞語"過程"的編碼,分別取"過"前二碼R、 X,"程"的
前二碼U、 H,過程的編碼就為RXUH。三字詞,分別取前二個字的完 整編碼的第1碼,取第三個字的完整編碼的前2碼。如詞語"計算機" 的編碼,分別取計的第一碼,部件i的代碼Q,算的第一碼即部件^ 的代碼U,機的前二碼即部件木、幾的代碼F、 K,"計算機"的代碼 就為QUFK。四個字及四個以上字的多字詞,分別取第l、第2、第3 和最后一個字的完整編碼的第一碼。詞組輸入是提高輸入速度的重要 方法。要盡量利用詞組輸入。
為了便于使用,還設(shè)置了容錯碼,對一些編碼容易出錯的漢字, 在錯誤輸入時也能出現(xiàn)所要輸入的漢字。
權(quán)利要求
1、一種計算機漢字輸入法即雙分三碼輸入法,在將漢字各種筆畫按國家語委的規(guī)定歸類為橫、豎、撇、點、折后,其特征是精選了100來個組字頻率高的漢字部件,作為基本部件,將它們按起筆歸類到橫、豎、撇、點、折五個區(qū)中;再根據(jù)每個區(qū)中基本部件的組字頻率的高低來決定每個區(qū)包含的鍵位多少,經(jīng)測算,起筆為橫、點、豎的基本部件各得六個鍵位,起筆為撇的漢字頻率次之,分得五個鍵位,折起筆的基本部件頻率最低,僅安排三個鍵位;按點、橫、豎、撇、折的次序分區(qū)從左到右依次以每兩列為界排列;點區(qū)中的丶、亠、言、讠、廣等部件排在Q鍵上,用Q作代碼;、疒、丷、、冫等部件排在A鍵上,用A作代碼;氵、水等部件排在Z鍵上,用Z作代碼;火和灬等部件排在W上,用W作代碼;忄、心等部件排在S上,用S作代碼;冖、宀、辶、衤等部件排在X上,用X作代碼;、一、主等部件排在E上,用E作代碼;土等部件排在D上,用D作代碼;大、石等部件排在C上,用C作代碼;扌、寸等部件排在R上,用R作代碼;等部件排在放F上,用F作代碼;工、七、艸等部件排在V上,用V作代碼;、蟲、|等部件排在T上,用T作代碼;日、刂等部件排在G上,用G作代碼;小、山等部件排在G上,用G作代碼;、田等部件排在Y上,用Y作代碼;口等部件排在H上,用H作代碼;、門等部件排在N上,用N作代碼;、竹、、攵、夂、丿等部件排在U上,用U作代碼;亻、人,等部件排在J上,用J作代碼;、钅、金等部件排在M上,用M作代碼;、兒、等部件排在I上,用I作代碼;勹、、幾等部件排在K上,用K作代碼;、馬、尸、巳、阝等部件排在0上,用O作代碼,乙代表所有的折筆畫;、己、又等部件排在L上,用L作代碼;厶、力、纟等部件排在L上,用L作代碼;用L作代碼;個別組字頻率不高的部件也被排列到鍵上,它們并不一定按起筆歸類,而是按同源和近形歸類到組字頻率高的基本部件中,如氵含水、小含、钅含金、含竹等部件;鍵內(nèi)獨體字的編碼規(guī)則是成字基本部件的代碼+首筆畫代碼+末筆畫代碼;鍵外獨體字的編碼規(guī)則是按書寫順序拆分成第一、二和最末個基本部件進行編碼,不足三個部件的取完所有的部件的代碼為止;合體字的編碼規(guī)則是首部分別取第一個部件和最末個基本部件的相應代號進行編碼,再取剩部的第一個部件的代號進行編碼,當首部只有一個基本部件,最多只能取1碼,這時剩部最多可取2碼,分別按書寫順序取剩部的第一個和最末個部件的相應代號進行編碼,剩部只有一個部件就只取這個部件的代號進行編碼;利用輸入法軟件,在鍵盤上敲擊某個漢字相應的編碼所在的鍵就可輸入該漢字。
2、根據(jù)權(quán)利要求1所述的雙分三碼輸入法,其特征是區(qū)分碼 的編碼方法是將左右型、上下型和包圍型這三類字型分別用三個互不 相同的標點符號比如","、"."和"/"表示,只有二碼的合體字,需 在這二碼后面先補上其字型編碼;獨體字不必補區(qū)分碼。
3、 根據(jù)權(quán)利要求1所述的雙分三碼輸入法,其特征是單字取碼規(guī)則都要遵循取大優(yōu)先原則,即要優(yōu)先按筆畫數(shù)多的基本部件編 碼,還要兼顧直觀,避免把四邊封閉的方框形的基本部件按書寫順序 拆開編碼,特別規(guī)定按書寫順序與前三筆或更多的筆畫相交的后寫筆 畫必須單獨取出,按單個基本筆畫編碼,基本部件例外。
4、 根據(jù)權(quán)利要求1所述的雙分三碼輸入法,其特征是詞組的編碼規(guī)則為二字詞,分別取每個字的完整編碼的前2碼;三字詞, 分別取前二個字的完整編碼的第1碼,取第三個字的完整編碼的前2碼;四字及多字詞,分別取第l、第2、第3和最后一個字的完整編碼的第一碼。
全文摘要
雙分三碼輸入法在將漢字各種筆畫歸類為橫、豎、撇、點、折后,精選了70來個組字頻率高的基本部件,將它們按起筆歸類到橫、豎、撇、點、折五個區(qū)中;起筆為橫、點、豎基本部件各得六個鍵位,起筆為撇的漢字分得五個鍵位,折起筆的基本部件安排三個鍵位;并從左到右依次以每兩列為界排列,再將漢字分為合體字和獨體字,合體字又一分為二進行編碼。編碼時對優(yōu)化規(guī)定單字碼長最多取三碼。
文檔編號G06F3/023GK101441517SQ200710192848
公開日2009年5月27日 申請日期2007年11月19日 優(yōu)先權(quán)日2007年11月19日
發(fā)明者王治陽 申請人:王治陽