亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

三五音碼及其鍵盤的制作方法

文檔序號:6362155閱讀:315來源:國知局
專利名稱:三五音碼及其鍵盤的制作方法
技術(shù)領(lǐng)域
本發(fā)明屬于電腦漢字編碼輸入方法,也就是中文輸入法,還涉及了為實(shí)現(xiàn)這一方法的鍵盤。它是對本人前一項發(fā)明五三音碼的改進(jìn)。當(dāng)時為了避專利申請的商業(yè)性宣傳之嫌,把三五音碼稱為五三音碼,后來發(fā)現(xiàn)稱三五也可以,所以這次就改稱三五音碼了。
背景技術(shù)
在五三音碼的專利申請中,音碼選用微軟雙拼,其實(shí)也可以選用其它雙拼,比如智能abc雙拼等雙拼,之所以選用微軟雙拼作編碼實(shí)例,原因有二一是微軟雙拼使用的人較多。二是向微軟拋出繡球,希望微軟的Windows操作系統(tǒng)能預(yù)裝五三音碼(又稱三五音碼)輸入法,使之盡快推廣,并成為標(biāo)準(zhǔn)的中文輸入法。豈料,當(dāng)去年五、六月份我把資料由前臺轉(zhuǎn)交微軟的中文部經(jīng)理,幾天后向微軟的中文部經(jīng)理提出預(yù)裝要求時,那中文部經(jīng)理以中文輸入法很多,再預(yù)裝一種會增加內(nèi)存為由一口拒絕。我也向聯(lián)想、方正、IBM、CA以及參加世界500強(qiáng)會議的公司遞交過資料,可都無結(jié)果。今年六月我又向同鄉(xiāng)求伯君先生遞交資料,可至今也杳無音訊。這使我想起了去年六月我向金洪恩軟件公司提出合作開發(fā)軟件時,那個接待我的經(jīng)理說三五音碼既要記形部編碼方案,又要記雙拼鍵位,有點(diǎn)繁。
類似抱怨雙拼鍵位難記的人也很多。的確目前市場上的雙拼鍵位方案五花八門,或要硬記什么助記口訣,或要動態(tài)鍵盤提示,適合專業(yè)人員使用,不便于大眾普及。因此有必要設(shè)計出鍵位排列極具規(guī)律性的雙拼方案來。為此在2002年遞交的三五音碼專利申請中,我發(fā)明了王治陽雙拼,這一雙拼主要是對韻母在鍵盤上的排列作了優(yōu)化規(guī)定??蓪χ挥许嵞笡]有聲母的零聲母音節(jié)卻只規(guī)定取其韻母的首字母作為聲母,這樣規(guī)定是為了對三字詞或四字詞的取碼時減少重碼,其實(shí)也可以按目前市場上某些雙拼輸入法那樣用某個字母比如o或e甚至a作為聲母代碼。這又會給好事者以繞過專利的機(jī)會。
在先申請五三音碼的形部編碼也存在二大問題一是實(shí)施例中漢字部件過多,有30來個,雖比其它輸入法字根少得多,可對某些懶得發(fā)抖的人來說,漢字部件仍然過多。事實(shí)上只用20來個漢字部件就能使全碼輸入時的重碼率很低,約為百分之一點(diǎn)五。而用30來個漢字部件時重碼率雖更低,約為千分之六,但卻只能降低重碼率千分之九,為降低千分之九,而增加10來個漢字部件可能是不明智的。另外有些漢字部件不合國家規(guī)范,還有些漢字部件包含形似的部件,這也給記憶帶來了難度。另外形部編碼規(guī)定只有對首三筆和末三筆編碼時遇到漢字部件,才可按漢字部件編碼,其實(shí)也可規(guī)定漢字部件出現(xiàn)在字首或字尾一律按漢字部件編碼。
二是可能給好事者繞過專利的機(jī)會。在以前的五三音碼專利申請中,附帶了橫、豎、撇、捺、折五種筆畫,并分別用1、2、3、4、5表示,還指出也可用五個標(biāo)點(diǎn)符號或字母表示??捎捎跊]有明確表示,可能會給好事者以“改進(jìn)”機(jī)會。其實(shí)當(dāng)剩下的筆畫不足三筆時也可以不對剩下的筆畫編碼,只用橫豎斜27種排列組合也可以的,這更會給人以繞過專利的機(jī)會。另外將提并入斜中也可以的,事實(shí)上在五三音碼的專利申請中有部分提是并入斜中的,當(dāng)時我以為這樣才符合情理,因?yàn)槠浴叭c(diǎn)水”和“二點(diǎn)水”中的“提”一般被認(rèn)為是點(diǎn)的,可現(xiàn)在想想,如果有人玩弄文字游戲,將提一律并入斜類筆畫中,也可能會給我?guī)砺闊?br> 另外我去專利檢索時,發(fā)現(xiàn)也有人將漢字的各種筆畫歸類三類筆畫,只不過歸類為橫、豎撇、點(diǎn)捺三類筆畫。這種歸類方法將橫、橫起的折類筆畫歸類在一起,將撇、豎以及豎起、撇起的折類筆畫合并歸類在一起,這樣歸類雖能使三類筆畫的頻率大致接近,卻是不科學(xué)的,因?yàn)椤捌病焙汀稗唷倍季哂袃A斜性和旋轉(zhuǎn)性,理應(yīng)歸類為同類筆畫。舉例說,將長撇并入豎中,似乎還有點(diǎn)道理,可將平撇并入豎類筆畫,比如將“和”字的第一筆并入豎類筆畫中就幾近荒唐了,因?yàn)樗c豎幾乎垂直。順便指出,如果有人將漢字的各種筆畫歸類為這三類筆畫后,套用五三筆碼、五三音碼、三五字碼的編碼方案,也可得出編碼,只是不利于頭腦反應(yīng)。
另外,我在檢索時發(fā)現(xiàn),也有人將漢字的各種筆畫歸類為橫、豎斜三類筆畫,其歸類方法是橫、橫起的折類筆畫歸類為橫;豎、不是橫起的折類筆畫歸類為豎;撇、點(diǎn)捺歸類為斜。其余取碼規(guī)則與本人發(fā)明的手機(jī)碼相同,這幾乎是為了占空子。它與本發(fā)明的區(qū)別僅僅是將各種斜起的筆畫比如撇點(diǎn)、撇橫、斜鉤等從斜類筆畫中抽出來并入到豎類筆畫中。既然將漢字的各種筆畫歸類為橫、豎、斜,卻將斜起的各種筆畫并入到豎中,這很不合理。如果有人將漢字的各種筆畫歸類為這三類筆畫后,套用五三筆碼、五三音碼、三五字碼、手機(jī)碼的編碼方案,也可得出編碼,只是不大合理。
技術(shù)方案本發(fā)明的目的是提供一種改進(jìn)補(bǔ)充了的電腦漢字編碼輸入方法三五音碼。它所推薦的王治陽雙拼簡單易記,鍵位排列特別是韻母鍵位的排列極具規(guī)律性,更便于三五音碼向大眾普及。另外音碼也可按習(xí)慣用全拼或采用注音符號,適應(yīng)面更廣。其優(yōu)選的形部編碼方案,具有漢字部件規(guī)范且數(shù)量減少等特點(diǎn),更簡單易學(xué),對遇到漢字部件時的取碼規(guī)則也作了優(yōu)化規(guī)定。所有這些都使三五音碼更簡單,適應(yīng)面更廣,更便于輸入,且能有效地防止他人繞過專利,從而使三五音碼輸入法更易學(xué)好用,解決了簡單的打不快,打得快的不簡單這一長期以來渴望解決,卻又沒能解決的技術(shù)難題,做到了既簡單又高速。
與其它發(fā)明相比,三五音碼在按國家規(guī)范歸類為五種基本筆畫的基礎(chǔ)上,將筆畫進(jìn)一步歸類橫、豎、斜三類根本筆畫,斜筆畫具有可旋轉(zhuǎn)性,旋轉(zhuǎn)后可與橫、豎構(gòu)成圓,與萬物由不可分割的唯一具有慣性的圓形質(zhì)量能量相同的物質(zhì)組成的科學(xué)原理不謀而合。編碼規(guī)則簡單客觀,一般人十幾分鐘可學(xué)會,全碼輸入時靜態(tài)重碼率時很低,既可輸入會讀不會寫的漢字也可輸入會寫不會讀的漢字,做到高速脫稿輸入,使得漢字無論是輸入速度還是調(diào)出速度都快于西文。
為達(dá)到改進(jìn)后的三五音碼的目的,本人設(shè)計了新的雙拼即王治陽雙拼。王治陽雙拼以標(biāo)準(zhǔn)漢語拼音方案基礎(chǔ),采用26個英文字母和“;”鍵作代碼。規(guī)定單個字母的聲母和韻母按標(biāo)準(zhǔn)漢語拼音方案規(guī)定的英文字母編碼,″ü″用v表示,沒有聲母只有韻母的要補(bǔ)上韻母的首字母作聲母的代碼,只有聲母沒有韻母的也可在前面加字母O,這樣有二個字母的聲母ch、sh、zh只能i、u、v表示。注意“;”不宜作為聲母,因?yàn)樽鳛槁暷傅脑?,在輸入“;”時就不方便。只有聲母沒有韻母的也可在前面加O。將二個字母的聲母和i、u、v分別按26個英文字母的次序即音序排列,再一一對應(yīng),用對應(yīng)的字母編碼。接著按雙拼規(guī)律,將某幾對特定的韻母合并,用一個字母或別的一個符號編碼,之所以可合并,是因?yàn)楹喜⒑髮㈦p拼轉(zhuǎn)換為全拼時,全拼的形式是唯一的。比如“uo”被合并到“o”,用“o”作韻母的代碼,當(dāng)“o”與任何一個聲母構(gòu)成雙拼,又將雙拼轉(zhuǎn)換為全拼時,全拼的形式都是唯一的,比如雙拼“go”,轉(zhuǎn)換為全拼后只能是“guo”,而不可能是“go”。這樣“uo”被合并到“o”;“ui被合并到“ü”;“ün”被合并到“un”;“üe”被合并到“ue”;“üan”被合并到“uan”;“iong”被合并到“ong”;“ia”被合并到“ua”;“iang”被合并到“uang”;由于“er”的聲母代碼為“e”,若排到r上,就能做到“er”的雙拼與全拼一致,所以將“er”排到“r”上。這些多個字母的韻母合并規(guī)則具有一定的規(guī)律性,還可用諧音等方法記憶。比“i”或“ü”開頭的往往被合并。如單個字母的韻母鍵上除了可排列被合并的多個字母的韻母外不能再排其它多個字母的韻母。接著排列多個字母的韻母,被合并的多個字母的韻母就不再提及,排列時將開口呼a開頭的韻母列為一區(qū);o開頭的列為一區(qū);e開頭的列為一區(qū);齊齒呼i開頭的韻母列為一區(qū);合口呼u開頭的韻母列為一區(qū)。每區(qū)又規(guī)定二個字母的韻母排在鍵盤的左邊,三個字母的韻母排在二個字母的韻母之右,四個字母的韻母排在最右,每區(qū)的韻母的字母數(shù)相同的,則按音序排列,一般自左至右排列。也可自右向左。當(dāng)然每區(qū)完全按音序排列也可以,我最初設(shè)計雙拼時就是這么考慮,只是估計別人早就想到,才將字母數(shù)考慮進(jìn)去。這更利于記憶。出于指法規(guī)則考慮,將組字頻率高的開口呼a區(qū)、o區(qū)、e區(qū)依次排在中間一行,即排在“s”、“d”、“f”、“g”、“h”、“j”、“k”、“l(fā)、“;”。之所以o區(qū)在e區(qū)之左是因?yàn)槟戏侥:鬳n與eng有時不分,將eng排在“;”鍵上,采用南方模糊音就可以不擊“;”鍵。合并之后的合口呼u區(qū)組字頻率比齊齒呼i區(qū)略多一些,大約多11%,按指法規(guī)則,宜將u區(qū)排在“q”所在的一行,將i區(qū)排在“z”所在的一行。這樣排當(dāng)然可以,可由于″ü″用“v”表示,由于i區(qū)和u區(qū)的組字頻率又差別不大,若將所有以″ü″開頭的排在“v”鍵所在的行,更加直觀易記,這樣u區(qū)只好排在“v”鍵所在的行,相應(yīng)地,i區(qū)就排在“q”鍵所在的行了,在編碼實(shí)例采用這一方案。具體說韻母的排列規(guī)律為a、o、e、i、u位置不變,ü用v代替,ie排在q,in排在w,iu、er排在r,ian排在t,iao排在y,ing排在p,ai排在s,an排在d,ao排在f,ang排在g,ou排在h,ong排在j,ei排在k,en排在l,eng排在“;”,ua排在z,ue排在x,un排在c,uai排在b,uan排在n,uang排在m,iong被合并在ong,ia被合并在ua,üe被合并在ue,ün被合并在un,üan被合并在uan,iang被合并在uang,uo被合并在o,ui被合并在ü。用這種方法把標(biāo)準(zhǔn)漢語拼音方案中的聲母和韻母排在標(biāo)準(zhǔn)鍵盤上,形成了王治陽雙拼鍵盤。由此可見,王治陽雙拼遵循雙拼規(guī)律,將多個字母的韻母分為a區(qū)o區(qū)e區(qū)i區(qū)u區(qū),每區(qū)又考慮了字母數(shù)及26個英文字母的音序,簡單易記,具有很強(qiáng)的規(guī)律性。一般入幾分鐘能學(xué)會,不易忘記,另外還在一定程度上考慮指法規(guī)則,便于操作。
形部編碼規(guī)則為了防止他人繞過專利,可規(guī)定“提”既可一律并入橫,也可一律視為斜,或者將部分提并入橫中,部分提并入點(diǎn)。當(dāng)對1至5筆的漢字在按書寫順序以每三筆編碼時,若不足三筆還剩下一筆時可將該筆歸類為橫或豎或斜,再接連補(bǔ)上二個同類橫或豎或斜筆畫,湊足三筆,用相應(yīng)的字母或其它符號編碼;當(dāng)還剩二筆時,也將剩下的每筆歸類為橫或豎或斜,并回頭取剩下的第一筆,當(dāng)然也可一律規(guī)定回頭取剩下的第二筆,湊足三筆,用相應(yīng)的字母或其它符號編碼。當(dāng)剩下二筆時也可以將剩下的每筆歸類為橫或豎或斜,再根據(jù)這二筆的空間位置關(guān)系,分為相離、相連、相交三類,用任意三個數(shù)字表示,一般分別用橫、豎、斜的代號1、2、3表示,這樣就可將相離、相連、相交轉(zhuǎn)換成橫、豎、斜了,再轉(zhuǎn)換成橫豎斜的27種排列組合即可。事實(shí)上將剩下的第一筆或最末筆歸類為五種基本筆畫,用五個能有效降低重碼的字母或別的符號來編碼是最簡單方便的,在實(shí)施例中選用這種方法。
為了降低重碼,最好將某些漢字部件(筆畫結(jié)構(gòu))排在鍵上,數(shù)量可多可少,可為1~200個,比如可為0或10或20或30或40或50或60或70或80或90或100個,基本漢字部件數(shù)最好與某種西文字母數(shù)相當(dāng),即接近24個到33個,這樣既便于記憶又能使重碼率低。對首三筆或末三筆編碼時若遇到排在鍵上的漢字部件要優(yōu)先按筆畫數(shù)最多的漢字部件編碼。也可規(guī)定對字首或字尾的漢字部件不管其是否有三筆,一律優(yōu)先按筆畫數(shù)最多的漢字部件編碼。


圖1、漢字的各種具體筆畫與橫、豎、斜三類根本筆畫的對應(yīng)關(guān)系圖。
圖2、在任意三個依次出現(xiàn)的筆畫中,橫、豎、斜27種排列組合在鍵盤上的優(yōu)選排列圖。
圖3、漢字部件數(shù)為20來個的優(yōu)化三五音碼形部編碼鍵盤排列圖。
圖4、漢字部件數(shù)為30來個三五音碼形部編碼鍵盤排列圖。
圖5、王治陽雙拼輸入鍵位排列圖。
圖1、圖2、圖3、圖4中的橫、豎、斜分別用1、2、3作代號,例如“123”就代表“橫豎斜”,321就代表斜豎橫。
具體實(shí)施例方式
下面結(jié)合附圖和優(yōu)選的實(shí)施例作詳細(xì)說明。
本發(fā)明在編碼時對漢字筆畫、部件的認(rèn)識完全科學(xué)。筆畫是構(gòu)成楷書漢字字形的最小連筆單位,是書寫漢字時一次連續(xù)寫成的一個線條。按國家語委的規(guī)定,在只考慮漢字的運(yùn)筆方向而不計其輕重長短時,即只考慮其筆形時可分為橫、豎、撇、點(diǎn)、折五種基本筆畫,其中提并入橫,豎鉤并入豎,捺并入點(diǎn),各種折筆都作折,也就是說其他各種帶轉(zhuǎn)折的筆畫都作折。國家語委稱五種基本筆畫為橫、豎、撇、點(diǎn)、折,而本人傾向于稱橫、豎、撇、捺、折。因?yàn)辄c(diǎn)的筆畫是很短的,不象其它基本筆畫那樣具有一定的長度,且有時運(yùn)筆方向下垂,甚至幾乎與撇相同。當(dāng)然國家語委規(guī)定稱點(diǎn)可能是因?yàn)辄c(diǎn)成字,而且組字頻率高于捺。其實(shí)國家語委還可規(guī)定也可稱五種基本筆畫為橫、豎、撇、捺、折,它與稱橫、豎、撇、點(diǎn)、折歸類相同,只是稱呼不同,完全等價。提一般并入橫中,在本實(shí)施例中如此。如果提不考慮筆畫的運(yùn)筆方向,只考慮其筆畫的傾斜角度的話,其傾斜角度與撇相同,因此也可約定并入撇中。在二點(diǎn)水、三點(diǎn)水中,提稱點(diǎn),因此也可將提并入點(diǎn)中。漢字部件是由筆畫組成的具有組配漢字功能的構(gòu)字單位。本人通過潛心研究發(fā)現(xiàn),撇、捺都由上向下傾斜,故可并入斜筆畫,而折根據(jù)其沒折、彎、鉤前的運(yùn)筆方向可分別并入橫、豎、斜三類筆畫中。所有的折類筆畫都有個折點(diǎn),稱折或彎或鉤,根據(jù)其第一個折點(diǎn)折或彎或鉤前運(yùn)筆方向就可將各種折類筆畫并入到橫、豎、斜三類筆畫中。說得通俗點(diǎn),各種橫起的折類筆畫都并入橫類筆畫中,各種豎起的折類筆畫都并入豎類筆畫中,各種斜起的折類筆畫都并入斜類筆畫中,這三類筆畫本發(fā)明人稱之為根本筆畫,它與漢字的各種具體筆畫的對應(yīng)關(guān)系見圖1所示。這一歸類的實(shí)質(zhì)是將撇與點(diǎn)捺合并歸類為斜筆畫,至于折如何歸類到橫、豎、斜三類筆畫中并不重要,因?yàn)檎鄣慕M字頻率在五種基本筆畫中最低。比如可將橫起的折并入到橫中,將其它的折類筆畫并入到豎中,或者將其它的折筆并入到斜中,也可將各種順時針折并入到橫中,其余并入豎中,甚至將所有的折都并入到豎中。這些都是該領(lǐng)域普通專業(yè)技術(shù)人員的變形,不影響本發(fā)明的實(shí)質(zhì)。
接著編碼。音碼在先,形部編碼在后,在本實(shí)施例中如此。當(dāng)然也可規(guī)定形部編碼在先,音碼在后。為提高輸入速度,音碼采用雙拼,即依據(jù)雙拼輸入鍵位表,每個漢字對應(yīng)兩鍵,第一鍵為聲母,第二鍵為韻母。漢語中有些音節(jié)只有韻母,沒有聲母,稱為零聲母音節(jié)。在輸入零聲母字時,可先輸入一個字母“o”,之后,在它后面輸入韻母,完成一個零聲母漢字的輸入。當(dāng)然為輸入詞組方便也可以用零聲母字的韻母的首字母作為聲母,在編碼實(shí)例中就這么規(guī)定。雙拼選用王治陽雙拼。王治陽雙拼作為一種雙拼輸入法,可獨(dú)立使用,也就是說可脫離三五音碼單獨(dú)使用。當(dāng)它與三五音碼形部編碼結(jié)合使用時如虎添翼。王治陽雙拼排列方法前面以作了說明,王治陽雙拼輸入鍵位表見圖5所示。該圖在標(biāo)準(zhǔn)鍵盤上標(biāo)識了漢語拼音方案的聲韻母,形成了王治陽雙拼鍵盤。其實(shí)也可以不用“;”號作代碼,只用26個英文字母作代碼。從雙拼規(guī)律看,韻母in或ing或ie中的任意一個韻母與韻母uai合并都可以,這樣就可以使一個鍵空出,把將鍵盤中間排的某個鍵上的韻母筆如eng移至空出的鍵即可,一種優(yōu)選的排列是將ing移至uai上,將eng移至p鍵。當(dāng)然也可將ing移至uai后,將o區(qū)的ou或ong移至p上,再將余下的o區(qū)和e區(qū)左移一位即可。
不愿使用雙拼的可用全拼,即完全按照標(biāo)準(zhǔn)的漢語拼音規(guī)則,逐個鍵入字詞的漢語拼音來輸入字詞,輸入過程和書寫漢語拼音的過程完全一致。必要時只輸入漢字的聲母。另外臺灣地區(qū)的人士,音碼部分還可使用注音方案輸入漢字。音碼是利用漢字的語音特征進(jìn)行的編碼,在我國一般以拼音為基礎(chǔ)。把三五音碼中的王治陽雙拼作為一種輸入法獨(dú)立使用時就是音碼碼。形碼是指利用漢字的字形特征進(jìn)行編碼。把三五音碼中的形部編碼作為一種輸入法獨(dú)立使用時就是形碼。而音形碼是利用漢字的語音特征和字形特征進(jìn)行編碼,三五音碼就是音形碼。
三五音碼形部編碼規(guī)則是(1)對1至5筆的漢字按書寫順序以每三筆編碼,當(dāng)取至字尾不足三筆時,將最末筆歸類為橫或豎或撇或捺或折,分別用“,”或“i”或“u”或“.”或“/”編碼,在編碼實(shí)例中這么編碼。當(dāng)然也可用別的五個字母或別的符號比如1、2、3、4、5分別編碼。還可將最末筆改為剩下的第一筆。
(2)6筆及以上的漢字取其首三筆和末三筆編碼。
(3)在任意三個按書寫順序依次排列的筆畫中,橫豎斜的三三組合不外乎27種,可與27個或不足27個互不相同的字母或別的符號一一對應(yīng)或大致一一對應(yīng),大致一一對應(yīng)時只要將某幾種組合合并,用一個字母或別的符號編碼,其余仍一一對應(yīng),比如可將組字頻率低的“豎斜橫”和“豎斜豎”合并排列,用一個字母或別的符號編碼。對任意三筆只需根據(jù)其橫豎斜的排列組合方式用對應(yīng)的字母或別的符號編碼。為方便起見,在實(shí)施例中利用26個英文字母和“;”鍵一一對應(yīng)編碼,見圖2所示。注意這里所指的橫、豎、斜都是歸類筆畫,并不是某種具體筆畫,無須考慮其具體的空間位置關(guān)系,只要將其按書寫順序依次排列,三三組合即可。比如“任”字,它的前三筆按書寫順序依次排列,為撇、豎、撇,分別歸類為斜、豎、斜,按書寫順序連接起來就是斜豎斜,它的末三筆按書寫順序?yàn)闄M、豎、橫,分別歸類為橫、豎、橫,按書寫順序連接起來就是橫豎橫?!靶必Q斜”和“橫豎橫”都是橫、豎、斜三類根本筆畫三三組合后的27種組合方式中的其中一種組合方式,圖中1、2、3分別是橫、豎、斜的代號,這樣圖中的“111”就表示“橫橫橫”,“123”就表示“橫豎斜”,其余類推。另外排列時注意分區(qū)排列,三個筆畫中,橫在先的為一區(qū),標(biāo)準(zhǔn)鍵盤上左三列就是橫區(qū)。豎在先的為一區(qū),斜在先的又為一區(qū)。每區(qū)又以三個字母為一組,橫向或縱向排列,極具規(guī)律性。圖3、圖4可按圖2類推。在標(biāo)準(zhǔn)鍵盤上標(biāo)識橫、豎、斜的三三組合后的27種方式和漢字部件,就構(gòu)成了形部編碼鍵盤。
按上述規(guī)則編碼,采用簡碼后能使大部分漢字免去同音字選擇,以有100多個同音字的shi和si(南方人和部分北方人分不清)為例,我粗略統(tǒng)計了一下,有67個字無重碼,重碼字不會超過3個,采用簡碼后有80多個字無重碼,這樣約有80%的字無重碼,音碼采用雙拼的話,碼長又不會超過4碼,從技術(shù)指標(biāo)看,其輸入速度據(jù)我估計每分鐘可突破100字大關(guān),比任何智能拼音輸入法快2~3倍,而學(xué)成時間為幾分鐘。智能拼音輸入法試圖通過智能處理來免去同音字選擇,會取得一定的成功,將來漢字中可能會引進(jìn)中文字母表示無意義的人名地名和嘆詞,有意義的詞匯仍用漢字表示,這樣更便于智能處理,但不可能完全免去同音字選擇,而選擇同音字會使?jié)h字輸入速度急劇減緩,快的輸入法甚至可打100個漢字,因此漢字輸入必須以字為基礎(chǔ)。
為了進(jìn)一步提高輸入速度,做到輸入國標(biāo)6763個漢字的完整編碼時靜態(tài)重碼率低,有必要將某些漢字部件排在鍵上,排列的方法已經(jīng)在公開的專利申請中提到,這里再簡要說明一下。排列時將某些組字頻率高的慣常出現(xiàn)在字首或字尾的漢字部件抽出排到在字首或字尾組字頻率低的字母或別的符號鍵上,避免組字頻率高、容易出現(xiàn)在形部編碼同一位置的漢字部件排在同一鍵上,另外還要根據(jù)同音字的實(shí)際構(gòu)成反復(fù)優(yōu)選。還要指出,漢字部件還可排在不屬于已排列27種橫豎斜排列組合方式的字母或標(biāo)點(diǎn)符號鍵上,即可排在除了26個字母和“;”鍵以外的標(biāo)點(diǎn)符號鍵上,比如去掉二個字母,改排在“?!薄ⅰ?”鍵上,其余類推。漢字部件可多可少,比如可為1至200個,可為10個或20個或30個或40個或50個或60個或70個或80個或90個或100個。其實(shí)漢字部件只要10多個就能使重碼率低,當(dāng)基本漢字部件為二、三十個與某種西文字母數(shù)相當(dāng)時就能做到全碼輸入國標(biāo)6763個漢字時靜態(tài)重碼率很低,克服了除三五音碼、三五字碼外其它任何編碼都未能同時克服的兩大缺陷或規(guī)則繁雜,難學(xué)難記;或重碼率高,輸速難以提高。
本發(fā)明人綜合比較反復(fù)優(yōu)選后的調(diào)整方案,見圖3所示。該圖也即優(yōu)化三五音碼鍵盤排列圖。順便指出該圖也適合五三筆碼。這次選用20余個全部規(guī)范的漢字部件,以便記憶。下面作具體解說(1)忄含、心,土含士,王含,讠含言,钅含金,扌含,攵含夂、文,氵含氺、水,纟含幺、 。這含的同類漢字部件與基本漢字部件或互相同源,或互為繁簡,或音或形或義基本相近,主要為形體直觀相似,僅有個別筆畫差異,甚至筆畫完全相同,僅僅空間位置不同或筆畫長短不同或筆畫不同。為減輕記憶負(fù)擔(dān),盡量不含形體直觀相似的漢字部件。
(2)亻變形后似W,i形似I,口形似O, 形似K,扌形似F,八倒立后似V,阝形似B,而土形似T且聲母為T,所以排在相應(yīng)的鍵上,用相應(yīng)的字母編碼。這八個漢字部件因?yàn)榕c英文字母形似,幾乎無須記憶,這樣實(shí)際只要記憶10多個漢字部件的鍵位。纟、攵因?yàn)樽质紫驦,排在L上,木因?yàn)槟┒P形似倒立的V,也用相應(yīng)的字母編碼,钅有三橫,所以排在Q上,用Q編碼,蟲的末三筆為豎橫斜,就排在Y上,用Y編碼。女的聲母為N,編碼就為N,另外氵用E編碼,“大”用R編碼,“王”用U編碼,忄用P編碼,“月”用D編碼,“日、足”用H編碼,疒用C編碼,約定艸下面為氵時,作為組合漢字部件編碼為G。將漢字部件按筆畫或拼音或象形排列,盡量按與西文字母相似排列。
(3)在對首三筆和末三筆編碼時若遇到排在鍵上的漢字部件(基本漢字部件和被包含的同類漢字部件),要優(yōu)先按筆畫數(shù)最多的漢字部件編碼。另外為利于頭腦反應(yīng),還可規(guī)定漢字部件出現(xiàn)在字首或字尾時一律按筆畫數(shù)最多的漢字部件編碼。也就是說當(dāng)漢字部件出現(xiàn)在字首時,形部編碼第一碼按該漢字部件編碼;當(dāng)漢字部件出現(xiàn)在字尾時,形部編碼第二碼按該漢字部件編碼。在本編碼實(shí)例中就這么規(guī)定。還可約定只有二筆的漢字部件讠、亻、阝可視為有三個筆畫。
編碼實(shí)例一種電腦漢字編碼方法三五音碼YI,VJJW DTH/NFDO HDE.ZIKZ BTLS MAXA FGM/FAEC SDQ WUA,YWMH MAXA以“一”為例,在取首三筆時,不足三筆,就取剩下的最末筆,為橫,形部編碼就為“,”,“一”的編碼就為“YI,”?!胺N”取首三筆斜橫豎,編碼為J,末三筆為橫橫豎,編碼為W,其王治陽雙拼為VJ,“種”的編碼就為“VJJW”。漢的雙拼為HD,字首為氵,編碼為E,取完三筆后還剩二筆,不足三筆,就取最末筆捺,編碼為“.”,這樣“漢”的編碼就為“HDE.”。音的首三筆為斜橫斜,形部編碼就為“M”,字尾遇到遇到“日”,編碼為“H”,形部編碼就為“ME”,“音”的雙拼為“YW”,音的全碼就為“YWMH”。在電腦上輸入相應(yīng)的字母或別的符號就可輸出該漢字,比如輸入ywmh,電腦上就可顯示出“音”字。
對1~5筆的漢字按書寫順序以每三筆編碼時,若不足三筆還剩下一筆時,也可歸類為橫或豎或斜,再接連補(bǔ)上二個同類筆畫。以“一”為例,可將其歸類為橫,再接連補(bǔ)上橫橫,橫橫橫排在Q,“一”的編碼就為“YIQ”;當(dāng)還剩下二筆時,分別歸類為橫或豎或斜,再回頭補(bǔ)上剩下的第一筆或第二筆,在下面的編碼實(shí)例中就約定補(bǔ)上第一筆。以“漢”字為例,其首三筆遇到“氵”,編碼為“X”,還剩二筆,為橫斜,再補(bǔ)上第一筆橫,橫斜橫編碼為Z,漢的編碼就為“HDEZ”。當(dāng)剩下二筆時也可不回頭不補(bǔ)上一筆,而是分析其位置關(guān)系,是相離還是相連還是相交,再分別轉(zhuǎn)化為橫或豎或斜,以“漢”字為例,其末二筆為橫斜,筆畫相交,轉(zhuǎn)化為斜,再連接即可。這樣根據(jù)對其末二筆的歸類和相交情況,就轉(zhuǎn)化為橫斜斜,編碼為C,漢的編碼就為“HDXC”。以上二種對剩下二筆的編碼方法或多或少會影響頭腦反應(yīng),所以還是歸類為五種基本筆畫為好。另外也可將折分為順時針折或逆時針折,用二個字母或別的符號編碼,比如“/”和“z”編碼。也可將剩下的筆畫歸類為橫、豎、斜,分別用“,”、“?!?、“/”編碼。
由于漢字在造字時并沒注意到應(yīng)當(dāng)避免同音字或近音字首尾相同,以利于識別。這樣有些同音字首尾就相同,這些字基本為重心字,具體包括與“贏”類似的字重心在“貝”處,與“載”類似的字重心在“車”處,上中下結(jié)構(gòu)或左中右結(jié)構(gòu),兩頭漢字部件又相同的漢字如“瓣”等字重心在中間,對重心字,形部編碼第二碼要按重心所在編碼,如“瓣”的雙拼為“BD”,首三筆為斜橫斜,編碼為“M”,末三筆要按重心所在“瓜”編碼,其末三筆為豎斜斜,編碼為“N”,“瓣”的編碼就為“BDMN”。
圖3采用了22個基本漢字部件,在輸入國標(biāo)6763個漢字時,全碼輸入時即輸入一個字的完整編碼時重碼率約為2%,簡碼后幾乎無重碼。若將犭、疒、西、禾、魚、艸、石、木、貝、小、月、目等漢字部件則每增加一個漢字部件會減少4、5對重碼,總共只有40余對重碼,見圖4。而如果不對“疒”和“竹”,“女”和“纟”,“月”和“钅”等慣常出現(xiàn)在字首或字尾的漢字部件加以區(qū)分,任其排列在一起用同個字母編碼的話,重碼會急劇增加。三五音碼輸入法存在繼續(xù)增加漢字部件,降低重碼率邊際遞減的現(xiàn)象。再增加漢字部件往往只能減少1、2對重碼,甚至不能減少重碼。22個漢字部件略低于西文字母數(shù),重碼又能做到很低,所以我傾向于這種方法。當(dāng)然究竟采用31個或26個或20個左右甚至10個的漢字部件由市場、用戶決定。
不足四碼的補(bǔ)上空格鍵結(jié)尾,達(dá)到四碼無重碼的自動上屏。“?”鍵為查詢鍵,當(dāng)某一碼難以確定時可以用“?”鍵代替查詢。單字輸入時沒有必要采用智能輸入,詞組輸入時,最好采用智能輸入。
對繁體字來說,有的漢字部件還可取其后三筆。在在先申請已有提及。不再贅述。
為提高輸入速度,還設(shè)置了簡碼和詞組輸入法。簡碼是指輸入其完整編碼的前一、二、三個編碼,因而有一、二、三級簡碼之分。詞組取碼規(guī)則是二字詞,取第一、二字的雙拼;三字詞,取每個字的聲母;四字及以上字取前三個字和最后一個字的聲母。比如“電腦”的編碼就為“DTNF”?!叭逡舸a”的編碼就為“SWYM”。
本發(fā)明可適用于一切大、中、小、微型計算機(jī)中文信息處理系統(tǒng)和通訊系統(tǒng),可廣泛應(yīng)用于中文終端、中文電傳、電腦打字和計算機(jī)排版印刷等各個方面。可以在互聯(lián)網(wǎng)環(huán)境下運(yùn)行。
本電腦漢字輸入法還提供了一種新的漢字修改方法,它使得漢字修改與西文差不多簡單方法是在電腦上選定該漢字,若該漢字與所要修改的漢字同音,雙擊改后的漢字的三五音碼形部編碼,改后的字即上屏。若不同音,只能刪除該漢字,本方法顯然適用于語音語句輸入后的修改,如果軟件允許,只需念改后漢字的讀音。改后的字就上屏。
本人在長達(dá)十年的編碼研究中,日益感到漢字存在漢字部件多,部件在漢字中的位置沒固定等缺點(diǎn),特別是漢字部首往往集中于字首,是造成重碼的重要根源。因此我認(rèn)為漢字部件應(yīng)當(dāng)精簡為五、六十個或七、八十個,部件一般要么只能在字首,要么只能在字中,要么只能在字尾。每個漢字的部件數(shù)一般不宜超過三個,出現(xiàn)在字首的漢字部件應(yīng)當(dāng)組字頻率極高,個數(shù)應(yīng)當(dāng)與西文字母數(shù)接近,即為26個左右,大部分在字首的漢字部件只能在字首,但也可允許少數(shù)部件出現(xiàn)在其它位置。出現(xiàn)在字中或字尾的部件的個數(shù)也應(yīng)當(dāng)在三十個左右,且出現(xiàn)在字中的漢字部件一般不能出現(xiàn)在字尾,出現(xiàn)在字尾的漢字部件一般不能出現(xiàn)在字中,部件間應(yīng)當(dāng)盡量不相交。如此則漢字輸入大為方便,甚至無重碼,不需要編碼。本發(fā)明重碼低,但也不是沒有,原因就在于漢字部首往往集中于字首。
權(quán)利要求
1.一種作了改進(jìn)補(bǔ)充的三五音碼電腦漢字輸入法及其鍵盤,其特征是音碼部分選用王治陽雙拼,也可選用全拼或簡拼或注音方案,對1至5筆的漢字按書寫順序以每三筆編碼,剩下不足三筆時的編碼規(guī)則和遇到漢字部件時的編碼規(guī)則也作了補(bǔ)充規(guī)定。
2.根據(jù)權(quán)利要求1所述的王治陽雙拼,其特征是聲母或韻母為單個英文字母時,編碼不變,沒有聲母只有韻母的,可補(bǔ)上韻母的首字母作為聲母,也可補(bǔ)上一個沒作為聲母的字母作為聲母,只有聲母沒有韻母的,前頭補(bǔ)上一個沒作為聲母的字母。
3.根據(jù)權(quán)利要求1所述的王治陽雙拼,其特征是在標(biāo)準(zhǔn)漢語拼音方案的基礎(chǔ)上,按照某些韻母可合并排列的原理,將某些韻母母合并到另外一些韻母上,再將另外一些韻母和余下的多個字母的韻母按韻母開頭字母分為a區(qū)、o區(qū)、e區(qū)、i區(qū)、u區(qū),對每區(qū)按韻母所含字母數(shù)的多少、26個英文字母的次序在鍵盤上排列,韻母為單個字母時除了可排被合并的韻母外,不能再排其他韻母,排列時還在一定程度上考慮了簡單易學(xué)和指法規(guī)則。
4.根據(jù)權(quán)利要求3所述的王治陽雙拼,其特征是將開口呼a區(qū)o區(qū)e區(qū)排在標(biāo)準(zhǔn)鍵盤中間一行即a所在一行,i區(qū)或u區(qū)排在q或z所在的一行。
5.根據(jù)權(quán)利要求3所述的王治陽雙拼,其特征是每區(qū)按韻母個數(shù)的多少自左至右排列,韻母數(shù)相同的按音序排列。
6.根據(jù)權(quán)利要求3、4、5所述的王治陽雙拼,其特征是韻母的排列規(guī)律為a、o、e、i、u位置不變,ü用v代替,ie排在q,in排在w,iu、er排在r,ian排在t,iao排在y,ing排在p,ai排在s,an排在d,ao排在f,ang排在g,ou排在h,ong排在j,ei排在k,en排在l,eng排在“;”,ua排在z,ue排在x,un排在c,uai排在b,uan排在n,uang排在m,iong被合并在ong,ia被合并在ua,üe被合并在ue,ün被合并在un,üan被合并在uan,iang被合并在uang,uo被合并在o,ui被合并在ü。
7.根據(jù)權(quán)利要求6所述的王治陽雙拼,其特征是也可將ie或in或ing與uai合并,再將eng移到被合并的鍵上。
8.根據(jù)權(quán)利要求2、3、4、5、7所述的王治陽雙拼,其特征是也可脫離三五音碼獨(dú)立使用。
9.根據(jù)權(quán)利要求1所述的三五音碼形部編碼,其特征是對1至5筆的漢字按書寫順序以每三筆編碼還剩下一筆時也可歸類為橫或豎或斜,再接連補(bǔ)上二個同類的橫或豎或斜,用對應(yīng)的字母或符號編碼,還剩下二筆時,也可分別歸類為橫或豎或斜,再回頭補(bǔ)上剩下的第一筆或第二筆橫或豎或斜,用對應(yīng)的字母或別的符號編碼,也可根據(jù)其空間位置關(guān)系,分為相離或相連或相交,分別用橫或豎或斜的代號1或2或3表示,再轉(zhuǎn)換成橫或豎或斜,根據(jù)前二筆和位置關(guān)系用對應(yīng)的字母或別的符號編碼。
10.根據(jù)權(quán)利要求1所述的三五音碼形部編碼,其特征是在對首三筆或末三筆編碼時,若遇到排在鍵上的漢字部件要優(yōu)先按筆畫數(shù)最多的漢字部件編碼,還可規(guī)定漢字部件出現(xiàn)在字首或字尾時一律按筆畫數(shù)最多的漢字部件編碼。
全文摘要
本發(fā)明提供一種既簡單又高速的電腦漢字編碼方法三五音碼輸入法。它由音碼和形部編碼二部分組成。音碼選用簡單易記的王治陽雙拼。形部編碼的編碼規(guī)則是按書寫順序以每三筆編碼,超過二碼取一個漢字的首三筆和末三筆,對首三筆和末三筆只需根據(jù)其橫豎斜的27種排列組合方式用對應(yīng)的字母或符號編碼。為降低重碼,提高輸入速度,還選用了20來個漢字部件參與編碼。
文檔編號G06F3/023GK1489029SQ0313290
公開日2004年4月14日 申請日期2003年7月18日 優(yōu)先權(quán)日2002年8月5日
發(fā)明者王治陽 申請人:王治陽
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1