專利名稱:三類五區(qū)音形碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于電腦漢字編碼輸入方法,也就是中文輸入法。它是一種組合三類五區(qū)輸入法和音碼的輸入法,因此稱為三類五區(qū)音形碼。
背景技術(shù):
鍵盤輸入是目前漢字輸入法中使用最廣泛的輸入法??煞譃橐舸a、形碼、音形碼和序號碼四類輸入漢字。序號碼的編碼與漢字之間幾乎沒什么規(guī)律,要花上一二年才能記住, 已幾乎無人使用。利用音碼輸入漢字,因?yàn)楹唵我讓W(xué),使用最為廣泛??奢斎胨俣炔豢?,還有個弱點(diǎn),那就是不認(rèn)識的漢字無法輸入。形碼將漢字部件按象形、拼音和筆畫等方式歸類編碼,經(jīng)合理搭配漢字部件,能做到重碼少,且能輸入任何不認(rèn)識的漢字,而且往往很快。但由于采用大量字根或稱部件,因此復(fù)雜難記,難學(xué)難記,拆分也較困難。為減少漢字部件,目前不少輸入法都通過五種基本筆畫兩兩組合的辦法,進(jìn)行編碼。這種方法實(shí)際上是受五筆字型的影響,同樣沒有充分考慮到漢字筆畫特別是雙筆畫的組字頻率相差懸殊的情況,排列到鍵盤上后同樣表面顯得整齊劃一,實(shí)際上各字母鍵冷熱不均,容易產(chǎn)生重碼,另外還存在著不夠直觀,影響打字速度等問題。本人在研究輸入法十多年基礎(chǔ)上,又花了近10個月時間發(fā)明的三類五區(qū)輸入法屬于形碼輸入法,該輸入法在將漢字的各種筆畫歸類為五種基本筆畫的基礎(chǔ)上,又將漢字的字根或稱部件分為離散部件和交連部件二類,離散部件按統(tǒng)一按部件的筆畫數(shù)編碼,簡單易記,交連部件只用了 60來個基本部件,因而漢字部件的數(shù)量較其它輸入法有了大幅度地減少,因而簡單易記。但由于漢字的固有構(gòu)造結(jié)構(gòu),據(jù)研究有3000多種結(jié)構(gòu),因此對于少數(shù)漢字難免拆分不便,如果采用音形碼的話,則不存在漢字拆分不便問題,另外漢字部件數(shù)量還可以在目前60個基本部件的基礎(chǔ)上進(jìn)一步削減,從而更加簡易。當(dāng)然音形碼也有缺點(diǎn),那就是不認(rèn)識的漢字打不出。
發(fā)明內(nèi)容
這樣,目前音碼輸入法存在輸入速度慢,不認(rèn)識的漢字沒法輸入等缺點(diǎn);形碼輸入法存在要么漢字部件數(shù)量過多,要么拆分困難,不夠直觀、影響思維,連本人發(fā)明的最最簡單的三類五區(qū)輸入法也有60來個基本部件,少數(shù)漢字還是拆分不便。本發(fā)明的目的是提供一種組合三類五區(qū)輸入法和音碼的計(jì)算機(jī)漢字輸入法,即三類五區(qū)音形碼,它具有漢字部件比較規(guī)范、數(shù)量少,拆分簡便直觀的,輸入漢字快速等優(yōu)點(diǎn)。為達(dá)到三類五區(qū)音形碼的目的,本發(fā)明規(guī)定三類五區(qū)音形碼由音碼和形部編碼兩部分組成,這兩部分可以音碼在先而形部編碼在后,也可形部編碼在先、音碼在后,一經(jīng)選定,不得改變。為便于輸入漢字,建議音碼在先,形部編碼在后,在實(shí)施例中就這么規(guī)定。音碼部分可以用全拼、簡拼、雙拼,建議采用本人設(shè)計(jì)的幾分鐘可以學(xué)會的雙拼即王治陽雙拼。王治陽雙拼以標(biāo)準(zhǔn)漢語拼音方案基礎(chǔ),采用26個英文字母和“;”鍵作代碼, 規(guī)定單個字母的聲母和韻母按標(biāo)準(zhǔn)漢語拼音方案規(guī)定的英文字母編碼,"U"用ν表示,沒有聲母只有韻母的要補(bǔ)上韻母的首字母作聲母的代碼,只有聲母沒有韻母的要在前面加ο 這樣有二個字母的聲母ch、sh、zh只能i、u、v表示(“;”鍵不宜作聲母,因?yàn)樽髀暷傅脑挘?在輸入“;”時就不方便。)將二個字母的聲母和i、U、V分別按沈個英文字母的次序即音序排列,再一一對應(yīng)。接著按雙拼規(guī)律,“110”被合并到“o”;“ui”被合并到"U" ;〃 Un" 被合并到“un”; “ Ue"被合并到“ue”; “ Uan"被合并到“uan” ;“ iong”被合并到“ong” ; “ ia”被合并到“皿” ;"iang"被合并到“uang” ;由于“er”的聲母代碼為“e”,所以就排到r 上,用e作零聲母的話,這樣就能做到韻母“er”的雙拼與全拼一致。這些多個字母的韻母合并規(guī)則具有一定的規(guī)律性,還可用諧音等方法記憶。單個字母的韻母鍵上除了可排列被合并的多個字母的韻母外不能再排其它多個字母的韻母。接著排列多個字母的韻母,被合并的多個字母的韻母就不再提及,排列時將開口呼a開頭的韻母列為一區(qū);0開頭的列為一區(qū);e開頭的列為一區(qū);齊齒呼i開頭的韻母列為一區(qū);合口呼u開頭的韻母列為一區(qū)。每區(qū)又規(guī)定二個字母的韻母排在鍵盤的左邊,三個字母的韻母排在二個字母的韻母之右,四個字母的韻母排在最右,每區(qū)的韻母的字母數(shù)相同的,則按a、o、e、i、U、n、g、r的次序排列, 一般自左至右。當(dāng)然每區(qū)完全按a、ο、e、i、u、η、g、r的次序排列也可以,我最初設(shè)計(jì)雙拼時就是這么考慮,只是估計(jì)別人早就想到,才將字母數(shù)考慮進(jìn)去。出于指法規(guī)則考慮,將組字頻率高的開口呼a區(qū)、ο區(qū)、e區(qū)依次排在中間一行,即排在“s”、“d”、“f”、“g”、“h”、“ j”、 “k”、T、“; ”。之所以ο區(qū)在e區(qū)之左是因?yàn)槟戏侥:鬳n與eng有時不分,將eng排在 ";”鍵上,采用南方模糊音就可以不擊“;”鍵。合并之后的合口呼u區(qū)組字頻率比齊齒呼 i區(qū)略多一些,大約多11%,按指法規(guī)則,宜將u區(qū)排在“q”所在的一行,將i區(qū)排在“ζ”所在的一行。這樣排當(dāng)然可以,可由于"U"用“V”表示,由于i區(qū)和u區(qū)的組字頻率又差別不大,若將所有以"U"開頭的撮口呼排在“V”鍵所在的行,更加直觀易記,這樣u區(qū)只好排在“V”鍵所在的行,自然,i區(qū)就排在“q”鍵所在的行了,在編碼實(shí)例采用這一方案。由此可見,王治陽雙拼遵循雙拼規(guī)律,將多個字母的韻母分為a區(qū)、ο區(qū)、e區(qū)、i區(qū)、u區(qū),每區(qū)又考慮了字母數(shù)及中文字母的音序,簡單易記,具有很強(qiáng)的規(guī)律性。一般人估計(jì)幾分鐘就能學(xué)會,且不易忘記,另外還在一定程度上考慮了指法規(guī)則,便于操作。(2)各韻母與字母映射關(guān)系設(shè)定為a-a b-uai c-un iind-aie-e f-an g-ang h-ou i-ij-ong iong k-ei 1-en m-uang iangη-uan iian ο-ο uo ρ-ingq-ie r-in er s-ao t-iaou-u ν-Uui w-iu χ-ue Uey-ian ζ-ua ia ; -eng見附圖1所示,這里翹舌音ch、sh、zh按英文音序分別用i、u、v表示,也符合指法規(guī)律。本人認(rèn)為這種雙拼鍵盤排列方式是比較理想的,因此在編碼實(shí)例中采用這種雙拼。形部編碼在編碼時,將漢字各種筆畫按國家語委的規(guī)定歸類橫、豎、撇、點(diǎn)、折后, 又將漢字的各種部件分為單個基本筆畫部件、離散部件和交連部件三類,這三類部件統(tǒng)稱漢字部件,離散部件要求部件的筆畫離散并且對稱,分為兩個散筆、三個散筆,四個散筆、五個散筆,其中兩個散筆、三個散筆,四個散筆、分別用羅馬字母II、III、IV表示,五個散筆只有一個“立”,就直接用“立”表示。交連部件從《信息處理用GB13000. 1字符集漢字部件規(guī)范》精選了 40來個組字頻率高的漢字部件,這些精選的漢字部件還可包含若干個組字頻率并不高,但屬于同類的漢字部件。將它們按起筆歸類到橫、豎、撇、點(diǎn)、折五個區(qū)中。再根據(jù)每個區(qū)中基本部件的組字頻率的高低來決定每個區(qū)包含的鍵位多少,經(jīng)科學(xué)測算,起筆為橫、 點(diǎn)、豎的基本部件組字頻率較高、數(shù)量也較多,各得六個鍵位,起筆為撇的漢字頻率次之,分得五個鍵位,折起筆的基本部件頻率最低,僅安排三個鍵位。各個基本部件在字母鍵上的分布見附圖2,該圖在標(biāo)準(zhǔn)鍵盤上以二列為一區(qū),將點(diǎn)區(qū)、橫區(qū)、豎區(qū)、撇區(qū)、折區(qū)從左到右以兩列為界依次排列,極具規(guī)律性,將漢字分為三類部件,并使得交連部件只有區(qū)區(qū)40來個,是本人10個月潛心研究的結(jié)果,是本發(fā)明的最大創(chuàng)造性所在。根據(jù)以兩列為界的將基本部件按起筆分區(qū)排列的方法,點(diǎn)區(qū)占兩列字母鍵,得六個字母鍵;橫區(qū)占兩列字母鍵,得六個字母鍵,豎區(qū)占兩列字母鍵,得六個字母鍵,撇區(qū)雖占五個字母鍵,卻也只得兩列,折區(qū)僅占三個字母鍵,卻也得兩列,從而達(dá)到了點(diǎn)、橫、豎、撇、折各區(qū)組字頻率不同,所占的字母鍵位數(shù)也因而不同,卻都占兩列的巧妙目的。這比將漢字部件五區(qū)五列排列的輸入法來,無疑更有規(guī)律,是一種巨大進(jìn)步。當(dāng)然,由于豎區(qū)和撇區(qū)漢字部件的組字頻率相近,也可規(guī)定作豎區(qū)占五個字母鍵位,撇區(qū)占六個字母鍵位。另外還可將點(diǎn)區(qū)、橫區(qū)、豎區(qū)在鍵盤上的位置互換。 這些都是對本發(fā)明的變形,還是以本發(fā)明所舉的實(shí)施例為最佳。另外本發(fā)明將點(diǎn)、橫、豎、 撇、折五種基本筆畫分別排在Q、E、T、U、0鍵上,用相應(yīng)的字母編碼,由于都位于一個區(qū)的上排,且僅隔一個字母鍵,也顯得極有規(guī)律,簡單易學(xué)。接著編碼,形部編碼規(guī)則是按書寫順序取該漢字的首尾二個基本部件編碼;當(dāng)某漢字只有一個基本部件時,就只取這個基本部件的代碼。在編碼實(shí)例中就采用這一規(guī)定。 當(dāng)然也可規(guī)定當(dāng)某漢字只有一個基本部件時,就取這個基本部件的代碼,在重復(fù)取這個基本部件的代碼作為第二碼,也可規(guī)定取這個基本部件的首筆或末筆的代碼編碼,在編碼實(shí)例中不這么規(guī)定。形部取碼規(guī)則都要遵循取大優(yōu)先原則,即要優(yōu)先按筆畫數(shù)多的基本部件編碼,應(yīng)保證按書寫順序每次拆分出盡可能筆畫數(shù)盡可能多的基本部件,不要把筆畫多的部件拆分成筆畫少的部件。根據(jù)這一規(guī)則可引申出一條規(guī)則,那就是多筆畫部件肯定比單筆畫部件即五種基本筆畫優(yōu)先編碼。另外還要兼顧直觀,避免把四邊封閉的方框形如“口”、“西”等基本部件按書寫順序拆開編碼,這條規(guī)則實(shí)際上也是取大優(yōu)先原則引申出來的。利用輸入法軟件,在鍵盤上敲擊某個漢字相應(yīng)的編碼所在的鍵就可輸入該漢字。 達(dá)到四碼且無重碼的自動上屏,不足四碼的必須補(bǔ)上一個空格鍵或用數(shù)字鍵選擇才能上屏。
圖1為王治陽雙拼鍵盤排列2為三類五區(qū)音形碼基本部件鍵盤排列圖
具體實(shí)施例方式下面結(jié)合優(yōu)選的實(shí)施例和附圖作詳細(xì)說明。音碼和形部編碼兩部分組成,這兩部分可以音碼在先而形部編碼在后,也可形部編碼在先、音碼在后,一經(jīng)選定,不得改變。為便于輸入漢字,建議音碼在先,形部編碼在后, 在實(shí)施例中就這么規(guī)定。音碼部分可以用全拼、簡拼、雙拼,建議采用本人設(shè)計(jì)的幾分鐘可以學(xué)會的雙拼即王治陽雙拼,見圖1。本發(fā)明的形部編碼在編碼時對漢字筆畫的認(rèn)識完全科學(xué)。筆畫是構(gòu)成楷書漢字字形的最小連筆單位,是書寫漢字時一次連續(xù)寫成的一個線條。按國家語委的規(guī)定,在只考慮漢字的運(yùn)筆方向而不計(jì)其輕重長短時,即只考慮其筆形時可分為橫、豎、撇、點(diǎn)、折五種基本筆畫,其中提并入橫,豎鉤并入豎,捺并入點(diǎn),各種折筆都作折,也就是說其他各種帶轉(zhuǎn)折的筆畫都作折。國家語委稱五種基本筆畫為橫、豎、撇、點(diǎn)、折,而本人傾向于稱橫、豎、撇、捺、 折。因?yàn)辄c(diǎn)的筆畫是很短的,不象其它筆畫那樣具有一定的長度,且有時運(yùn)筆方向下垂,幾乎與撇相同。當(dāng)然國家語委規(guī)定稱點(diǎn)可能是因?yàn)辄c(diǎn)成字,而且組字頻率高于捺。由于是國家語委的規(guī)定,只好遵守,其實(shí)國家語委還可規(guī)定稱捺也允許。將點(diǎn)、橫、豎、撇、折五種基本筆畫分別排在Q、Ε、T、U、0鍵上,用相應(yīng)的字母編碼。漢字部件是由幾個筆畫組成的具有組配漢字功能的構(gòu)字單位,漢字部件有多筆畫部件和單筆畫部件之分,單筆畫部件在本發(fā)明中即五種基本筆畫,多筆畫部件則分為離散部件和交連部件,單筆畫部件和多筆畫部件統(tǒng)稱基本部件。同樣對離散部件做了優(yōu)化選擇,只有大致對稱的離散部件才得以入選,并按離散的筆畫數(shù)分為兩、三、四個散筆部件分別排列在點(diǎn)區(qū)的A、Z、W鍵上,用相應(yīng)的字母編碼,由于排列有序,顯得十分簡單易記。兩個散筆的離散部件全部用II表示,包括二、八、兒、ν、 O、U、丨丨、彡、〈〈等為二個散筆,且大致離散對稱的筆畫。三個散筆的離散部件用III表示,包括三、小、、川,、鄉(xiāng)、川、〈〈〈,等為三個散筆,且大致離散對稱的筆畫,而?也屬于三個散筆,但因?yàn)槭殖R?,就單?dú)列出,它和其它幾個為三個散筆的部件也是用同一個字母編碼的。四個散筆的離散部件用IV表示,包括”、,、、、(火)漢字的交連部件更多,本發(fā)明只選用了近40多個交連部件,做到了既簡單又高效。漢字部件的定義與國家語委的規(guī)定相同,它是由幾個筆畫構(gòu)成的相對不變的筆畫結(jié)構(gòu),組合后可構(gòu)成漢字。漢字部件按《信息處理用GB13000. 1字符集漢字部件規(guī)范》規(guī)定多達(dá)六百多個,這是規(guī)定交叉不拆的緣故。其實(shí)這樣規(guī)定是不怎么合理的,本人認(rèn)為當(dāng)某個筆畫與前二個及以上筆畫相交時,這個后寫的筆畫必須單獨(dú)拆出。若這么規(guī)定,則大量的所謂漢字部件實(shí)際上是由其它幾個漢字部件拼湊組成的,完全可以排除這些所謂的漢字部件。為減少記憶量,從《信息處理用GB 13000. 1字符集漢字部件規(guī)范》中精選了 40來個組字頻率高的漢字部件,這些精選的漢字部件在本發(fā)明中稱為交連部件,特點(diǎn)是筆畫交連在一起,組成漢字部件。將它們按起筆歸類到橫、豎、撇、點(diǎn)、折五個區(qū)。再主要根據(jù)每個區(qū)中基本部件的組字頻率的高低,適當(dāng)兼顧基本部件的多寡來決定每個區(qū)中包含的鍵位多少,經(jīng)科學(xué)測算,起筆為橫、點(diǎn)、豎的基本部件組字頻率較高、數(shù)量也較多,各得六個鍵位,起筆為撇的漢字頻率次之,分得五個鍵位,折起筆的基本部件組字頻率最低,僅安排三個鍵位。為便于記憶和兼顧指法操作,并參照新華字典部首排列規(guī)律,將點(diǎn)區(qū)、橫區(qū)、豎區(qū)、撇區(qū)、折區(qū)以二列為界從左到右依次排列。將點(diǎn)區(qū)部件分別排在標(biāo)準(zhǔn)鍵盤最左邊兩列的六個字母鍵位上,即排在Q、A、Z、W、S、X上,將橫區(qū)部件分別排在標(biāo)準(zhǔn)鍵盤中點(diǎn)區(qū)的右邊兩列六個字母鍵位上,即排在E、D、C、R、F、V上,將豎區(qū)部件分別排在標(biāo)準(zhǔn)鍵盤中橫區(qū)的右邊兩列六個字母鍵位上,即排在T、G、B、Y、H、N上,將撇區(qū)部件分別排在標(biāo)準(zhǔn)鍵盤中豎區(qū)的右邊兩列的五個字母鍵上,即排在U、J、M、I、K上,折區(qū)部件分別排在標(biāo)準(zhǔn)鍵盤最右邊的兩列的三個字母鍵上。各個基本部件在字母鍵上的分布見附圖2。具體講,點(diǎn)區(qū)中的ι、言、i、廣等部件排在Q 鍵上,用Q作代碼;立、門、廣等部件排在A鍵上,用A作代碼;?、水、氺等部件排在Z鍵上, 用Z作代碼;火部件排在W上,用W作代碼;丨、心、等部件排在S上,用S作代碼;+、!_、 寺等部件排在X上,用X作代碼;王、雨等部件排在E上,用E作代碼;土、十等部件排在D上, 用D作代碼;大、車、石等部件排在C上,用C作代碼4等部件排在R上,用R作代碼;木、 西等部件排在放F上,用F作代碼;戈、*、升等部件排在V上,用V作代碼;蟲等部件排在T 上,用T作代碼;日、足等部件排在G上,用G作代碼;田、山等部件排在G上,用G作代碼; 目、口等部件排在Y上,用Y作代碼;口等部件排在H上,用H作代碼;貝等部件排在N上,用 N作代碼;禾、竹、、夂、夂等部件排在U上,用U作代碼;彳、人等部件排在J上,用J作代碼凍、金等部件排在M上,用M作代碼;月等部件排在I上,用I作代碼;鳥、魚、3、舟等部件排在K上,用K作代碼;馬、耳、尸、卩等部件排在0鍵上,用0作代碼;女、又等部件排在L 上,用L作代碼;鄉(xiāng)、弓等部件排在P上,用P作代碼,鄉(xiāng)含系、糸、幺,也用P作代碼。為便于記憶和遵循習(xí)慣,個別組字頻率不高的部件也被排列到鍵上,它們并不一定按起筆歸類,而是按同源和近形歸類到組字頻率高的基本部件中。如?含水、氺、小含、 含金、止含 、IJ含U、*含升、心含、含竹、3含豕、勹含、四含m和皿、止含Zt、夂含&和文、個含心和、?含水和氺、王含、鄉(xiāng)含$、糸、么等部件,事實(shí)上,這些被包含的部件應(yīng)視為同一個部件,因此本發(fā)明實(shí)際上的交連部件的數(shù)量僅為40來個。為減少重碼,便于用區(qū)分碼區(qū)分重碼,往往有意使各個鍵上的基本部件的末筆畫不同或字型不同。漢字的編碼是指用一組代碼表示一個漢字,形部編碼規(guī)則是按書寫順序取該漢字的首尾二個基本部件編碼;當(dāng)某漢字只有一個基本部件時,就只取這個基本部件的代碼。 在編碼實(shí)例中就采用這一規(guī)定。當(dāng)然也可規(guī)定當(dāng)某漢字只有一個基本部件時,就取這個基本部件的代碼,在重復(fù)取這個基本部件的代碼作為第二碼,也可規(guī)定取這個基本部件的首筆或末筆的代碼編碼,在編碼實(shí)例中不這么規(guī)定。形部取碼規(guī)則都要遵循取大優(yōu)先原則,即要優(yōu)先按筆畫數(shù)多的基本部件編碼,應(yīng)保證按書寫順序每次拆分出盡可能筆畫數(shù)盡可能多的基本部件,不要把筆畫多的部件拆分成筆畫少的部件。根據(jù)這一規(guī)則可引申出一條規(guī)則,那就是多筆畫部件肯定比單筆畫部件即五種基本筆畫優(yōu)先編碼。另外還要兼顧直觀,避免把四邊封閉的方框形如“口”、“西”等基本部件按書寫順序拆開編碼,這條規(guī)則實(shí)際上也是取大優(yōu)先原則引申出來的。編碼實(shí)例“王”的拼音為wang,雙拼為wg,該漢字只有一個漢字部件為“王”,代碼為E,王的編碼就為WGE。又如“拼”字,拼音為pin,雙拼為冊,取首尾二個漢字部件 、升的代碼分別為R、V, “拼”的編碼就為PRRV.對于常用漢字若只取其完整編碼前邊的一個、二個、三個,再補(bǔ)上空格鍵,就構(gòu)成了一、二、三級簡碼。本輸入法中的一、二、三級簡碼的數(shù)量都多于25鍵的輸入法,重碼率又很低,因此輸入速度比25鍵的輸入法要快些。為提高輸入速度,目前各類輸入法都提供了詞語輸入的功能,本輸入法也如此,規(guī)定不論詞語的長短,其編碼長度都為4碼,并且字詞兼容。詞語的編碼規(guī)則是二字詞,分別取每個字的完整編碼的前2碼,如“可以”,取“可”的前二個代碼ke,“以”的前二個代碼yi, “可以”的編碼就為KEYI。三字詞,分別取前二個字的完整編碼的第1碼,取第三個字的完整編碼的前2碼。如詞語“計(jì)算機(jī)”的編碼,分別取計(jì)的第一代碼J,算的第一個的代碼S, 機(jī)的前二個的代碼JI,“計(jì)算機(jī)”的代碼就為JSJ。四個字及四個以上字的詞,分別取第1、 第2、第3和最后一個字的完整編碼的第一碼。詞組輸入是提高輸入速度的重要方法。要盡量利用詞組輸入。如“中華人民共和國”的編碼,分別取中、華、人、國的第一個代碼V、H、R、 G,“中華人民共和國”的編碼就為VHRG。三類五區(qū)音形碼的重碼率比較低,為最大限度減少重碼,在軟件設(shè)計(jì)中有意將發(fā)生重碼的兩個字中的某一個字列為二級簡碼,另一個字列為三級簡碼,從而實(shí)際上消除重碼。為了便于使用,還設(shè)置了容錯碼,對一些編碼容易出錯的漢字,在錯誤輸入時也能出現(xiàn)所要輸入的漢字。需要指出的是,本發(fā)明說明書、權(quán)利要求書、說明書附圖中的字母不分大小寫。
權(quán)利要求
1. 一種計(jì)算機(jī)漢字編碼鍵盤輸入法即三列五區(qū)音形碼,將漢字的各種筆畫按國家語委的規(guī)定歸類為橫、豎、撇、點(diǎn)、折五種基本筆畫后,其特征是(1)、編碼由兩部分組成,一部分是音碼,即拼音,或稱拼音碼,另一部分是形部編碼,漢字碼的兩部分可前可后,一經(jīng)選定,不能改變;O)、拼音可采用全拼或雙拼或簡拼或不完整拼音;(3)、形部編碼時,將漢字的各種部件分為單個基本筆畫部件、離散部件和交連部件三類,這三類部件統(tǒng)稱基本部件;離散部件要求部件的筆畫離散并且對稱,分為兩個散筆、三個散筆,四個散筆、五個散筆,其中兩個散筆、三個散筆,四個散筆、分別用羅馬字母Π、ΙΙΙ、 IV表示,五個散筆只有一個“立”,就直接用“立”表示,將優(yōu)選的40多個交連部件按起筆歸類到橫、豎、撇、點(diǎn)、折五個區(qū);再主要根據(jù)每個區(qū)中基本部件的組字頻率的高低,適當(dāng)兼顧基本部件的多寡來決定每個區(qū)中包含的鍵位多少,點(diǎn)區(qū)、橫區(qū)、豎區(qū)、撇區(qū)、折區(qū)以二列為界從左到右依次排列;將點(diǎn)區(qū)部件分別排在標(biāo)準(zhǔn)鍵盤最左邊兩列的六個字母鍵位上,即排在 Q、A、Ζ、W、S、X上,將橫區(qū)部件分別排在標(biāo)準(zhǔn)鍵盤中點(diǎn)區(qū)的右邊兩列六個字母鍵位上,即排在E、D、C、R、F、V上,將豎區(qū)部件分別排在標(biāo)準(zhǔn)鍵盤中橫區(qū)的右邊兩列六個字母鍵位上,即排在T、G、B、Y、H、N上,將撇區(qū)部件分別排在標(biāo)準(zhǔn)鍵盤中豎區(qū)的右邊兩列的五個字母鍵上, 即排在U、J、M、I、K上,折區(qū)部件分別排在標(biāo)準(zhǔn)鍵盤最右邊的兩列的三個字母鍵上;具體講, 點(diǎn)區(qū)中的ι、言、i、廣等部件排在Q鍵上,用Q作代碼;立、門、廣等部件排在A鍵上,用A作代碼-J、水、氺等部件排在Z鍵上,用Z作代碼;火部件排在W上,用W作代碼;丨、心、等部件排在S上,用S作代碼; 、等部件排在X上,用X作代碼;王、雨等部件排在E上, 用E作代碼;土、十等部件排在D上,用D作代碼;大、車、石等部件排在C上,用C作代碼; 才等部件排在R上,用R作代碼;木、西等部件排在放F上,用F作代碼;戈、*、升等部件排在V上,用V作代碼;蟲等部件排在T上,用T作代碼;日、足等部件排在G上,用G作代碼; 田、山等部件排在G上,用G作代碼;目、口等部件排在Y上,用Y作代碼;口等部件排在H 上,用H作代碼;貝等部件排在N上,用N作代碼;禾、竹、、夂、&等部件排在U上,用U作代碼;彳、人等部件排在J上,用J作代碼凍、金等部件排在M上,用M作代碼;月等部件排在I上,用I作代碼;鳥、魚、3、舟等部件排在K上,用K作代碼;馬、耳、尸、卩等部件排在0 鍵上,用0作代碼;女、又等部件排在L上,用L作代碼;鄉(xiāng)、弓等部件排在P上,用P作代碼, 鄉(xiāng)含g、糸、么,也用P作代碼;個別組字頻率不高的部件也被排列到鍵上,它們并不一定按起筆歸類,而是按同源和近形歸類到組字頻率高的基本部件中如?含水、氺、小含、韋含金、止含At、U含U、*含升、心含、含竹、3含豕、勹含、四含M和皿、止含;t、夂含 &和文對含心和、?含水和氺、王含、鄉(xiāng)含$、糸、么等部件;形部編碼的取碼規(guī)則是形部編碼規(guī)則是按書寫順序取該漢字的首尾二個基本部件編碼;當(dāng)某漢字只有一個基本部件時,就只取這個基本部件的代碼;當(dāng)然也可規(guī)定當(dāng)某漢字只有一個基本部件時,就取這個基本部件的代碼,在重復(fù)取這個基本部件的代碼作為第二碼,也可規(guī)定取這個基本部件的首筆或末筆的代碼編碼;形部編碼在取碼時,都要遵循取大優(yōu)先原則,即要優(yōu)先按筆畫數(shù)多的基本部件編碼,應(yīng)保證按書寫順序每次拆分出盡可能筆畫數(shù)盡可能多的基本部件,不要把筆畫多的部件拆分成筆畫少的部件;另外還要兼顧直觀,避免把四邊封閉的方框形如“ 口”、“西”等基本部件按書寫順序拆開編碼。
2.根據(jù)權(quán)利要求1所述的三列五區(qū)音形碼,其特征是雙拼最好選用王治陽雙拼ch、 sh、zh按音序分別用i、U、ν表示,單韻母U用字母ν表示,各韻母與字母映射關(guān)系設(shè)定為a-a b-uai c-un iin d-aie-e f-an g-ang h-ou i-ij-ong iong k-ei 1-en m-uang iangη-uan Uan ο- uo ρ-ingq-ie r-in er s-ao t-iaou-u ν-Uui w-iu χ-ue Uey-an ζ-ua ia ; -eng只有韻母沒有聲母的,取e或ο或a作聲母,還可取韻母的第一個字母作聲母代碼,再補(bǔ)上韻母代碼,建議選用e作聲母代碼。
3.根據(jù)權(quán)利要求1所述的三列五區(qū)音形碼,其特征是詞語輸入的步驟是 二字詞語,取每個字的聲母、韻母的代碼依次輸入;三字詞語,取每個字的聲母的代碼依次輸入,再補(bǔ)空格輸入; 四字及以上詞語,取前三個字及最后一個字的聲母的代碼依次輸入。
全文摘要
本發(fā)明三類五區(qū)音形碼屬于計(jì)算機(jī)漢字編碼輸入法,在將漢字各種筆畫按國家語委的規(guī)定歸類為橫、豎、撇、點(diǎn)、折后,并將多筆畫部件為離散部件、交連部件,并結(jié)合漢字拼音進(jìn)行編碼,具有符合筆順規(guī)范、直觀、簡單易學(xué)、輸入漢字方便快捷等特點(diǎn)。
文檔編號G06F3/023GK102436312SQ20111034557
公開日2012年5月2日 申請日期2011年10月28日 優(yōu)先權(quán)日2011年10月28日
發(fā)明者王治陽 申請人:王治陽