專(zhuān)利名稱(chēng):五三碼及其鍵盤(pán)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于電腦漢字編碼輸入方法,還涉及了為實(shí)現(xiàn)這一方法的鍵盤(pán)。因根據(jù)橫、豎、撇、捺、折五種基本筆畫(huà),特別是主要根據(jù)橫、豎、斜三類(lèi)根本筆畫(huà)編碼。所以稱(chēng)之為五三碼,它包括五三筆碼和五三音碼兩種編碼。順便指出,稱(chēng)“五三”而不稱(chēng)“三五”是為了避免專(zhuān)利申請(qǐng)中的商業(yè)性宣傳之嫌,軟件上市時(shí)是稱(chēng)三五碼的。
在鍵盤(pán)上用音碼輸入漢字時(shí)只要掌握漢字拼音便可輸入,人們大都能使用,但由于漢字同音字眾多,造成重碼多,有時(shí)甚至不得不從數(shù)十個(gè)乃至上百個(gè)同音字中挑選一個(gè),故輸速較低。
為免去同音字選擇煩惱,目前所有問(wèn)世的優(yōu)秀漢字輸入法都主要向三個(gè)方向發(fā)展。一是智能語(yǔ)句語(yǔ)音輸入法,可仍然免不了同音字選擇,并且當(dāng)拼不出讀音時(shí)無(wú)法用它輸入;二是各種組字單元碼,特點(diǎn)是將眾多的組字單元按筆畫(huà)或拼音或象形(表形)等方式歸類(lèi),重碼低、輸速高。由于筆畫(huà)是一項(xiàng)足以與字母相提并論的有史以來(lái)最偉大發(fā)明之一,筆畫(huà)的發(fā)明使?jié)h字由象形文字飛躍成為筆畫(huà)文字,所以按筆畫(huà)歸類(lèi)的組字單元碼相對(duì)略勝一籌,較為流行??筛鞣N組字單元碼往往不是基于對(duì)古漢字特別是對(duì)甲骨文的研究基礎(chǔ)上,具有一定的主觀隨意性,并且有個(gè)通病,那就是組字單元數(shù)大大多于西文字母數(shù),記不勝記,讓一般人望而生畏,無(wú)法全民普及;三是各種組字單元與拼音結(jié)合的編碼,特點(diǎn)是要記憶的組字單元較少,有一定的區(qū)分同音字能力,輸速較快,但因?yàn)榻M字單元數(shù)較少,丟失的信息過(guò)多,重碼率相對(duì)較高,并不能真正有效地免去同音字選擇。
這樣,目前所有問(wèn)世的編碼都未能同時(shí)克服兩種主要缺陷或重碼率過(guò)高,人工干預(yù)過(guò)多,無(wú)法提高輸速;或規(guī)則繁雜,難學(xué)難記,不易推廣。僅僅依據(jù)漢字的音、形特征編碼似乎已山窮水盡,不可能發(fā)明出能同時(shí)克服兩種主要缺陷的理想的完善的編碼了,事實(shí)并不如此,五三筆碼的問(wèn)世為漢字輸入法最終解決打下了基礎(chǔ)。
本發(fā)明的目的是提供一種不用拼音,不用組字單元,不考慮結(jié)構(gòu),又基本不按單個(gè)筆畫(huà)編碼的電腦漢字編碼方法五三筆碼,它具有幾分種學(xué)會(huì)、重碼率低于拼音、比全拼音碼適應(yīng)面更廣的優(yōu)點(diǎn)。本發(fā)明的另一目的是提供一種組合五三筆碼和音碼的漢字編碼五三音碼,它是五三筆碼的延伸和重大改進(jìn)。它具有幾分種學(xué)會(huì)、大部分漢字不必選擇同音字、輸速快的優(yōu)點(diǎn)。采用調(diào)整方案的,也就是采用以碼長(zhǎng)最多為2碼的五三筆碼為基礎(chǔ),組字單元為配合,漢字結(jié)構(gòu)為補(bǔ)充并結(jié)合拼音的編碼,甚至可以幾乎不選同音字,從而實(shí)現(xiàn)高速脫稿輸入,而學(xué)成時(shí)間僅需10分鐘,同時(shí)克服了上述兩種主要缺陷。
為達(dá)到五三筆碼的目的,本發(fā)明將漢字各種筆畫(huà)歸類(lèi)為橫豎撇捺折五種基本筆畫(huà)后,進(jìn)一步歸類(lèi)為橫豎斜三類(lèi)根本筆畫(huà)。橫豎斜的排列組合不外乎27種,可一一對(duì)應(yīng)或大致一一對(duì)應(yīng)地排列在27個(gè)或不足27個(gè)互不相同的鍵上,接著不顧會(huì)拆散漢字組字單元和拼形結(jié)構(gòu)斷然對(duì)N筆及以上的漢字按書(shū)寫(xiě)順序以每M筆為一個(gè)字母或符號(hào)進(jìn)行編碼,N為正整數(shù),M>2,在M筆中不變位置地抽出三筆,歸類(lèi)為橫豎斜三類(lèi)筆畫(huà),根據(jù)這三筆的排列組合情況輸入對(duì)應(yīng)的字母或符號(hào)。當(dāng)取至最后不足M筆時(shí)將剩下的筆畫(huà)歸類(lèi)為幾種筆畫(huà),對(duì)剩下的第一筆或最末筆用若干鍵表示,為直觀起見(jiàn)一般用不屬于27個(gè)字母或符號(hào)的鍵,比如用數(shù)字鍵,也可用標(biāo)點(diǎn)符號(hào)鍵。
為達(dá)到五三音碼的目的,規(guī)定五三筆碼的最多碼長(zhǎng)為L(zhǎng),當(dāng)超過(guò)規(guī)定時(shí)改取最后一碼,也就是改取位于字尾的筆畫(huà)的編碼。當(dāng)規(guī)定L較短比如為2碼或3碼時(shí),補(bǔ)上該漢字的拼音,這一技術(shù)雖然簡(jiǎn)單,以至一般人幾分鐘可學(xué)會(huì),卻取得大部分漢字不必選擇同音字的意想不到的良效。當(dāng)規(guī)定五三筆碼的碼長(zhǎng)最多為2碼時(shí),以每三筆編碼,為大大降低重碼,對(duì)某些組字單元作了調(diào)整。調(diào)整時(shí)要避免容易出現(xiàn)在形部編碼同一位置的組字頻率高的組字單元和橫豎斜某種排列組合排在同一鍵上,還要根據(jù)同音字的實(shí)際構(gòu)成反復(fù)優(yōu)選。排列時(shí)還可酌情參考組字單元的筆畫(huà)數(shù),組字單元及橫豎斜的27種排列組合的實(shí)用頻率、鍵位壓縮、指法規(guī)則等因素。所選用的基本組字單元最好與西文字母數(shù)大體接近,在實(shí)施例中與俄文字母數(shù)相當(dāng)。有的基本組字單元還可以包含互為繁簡(jiǎn),互相同源,音或形或義基本接近,主要為形體直觀相似,還可以規(guī)定必須位于特定形體的漢字中才作調(diào)整。因基本組字單元數(shù)與西文字母數(shù)接近,且基本按筆畫(huà)或拼音或表形等方式排列,所以極為簡(jiǎn)單;其余用橫豎斜的27種排列組合離散,信息含量足,因此重碼率很低。這就克服了其它任何編碼都未能同時(shí)克服的2種主要缺陷。
由于漢字形體復(fù)雜,再加上鍵位壓縮,單純對(duì)首尾編碼,仍有點(diǎn)重碼。為此規(guī)定對(duì)少量組字單元取其后三筆,其后不足三筆時(shí)編碼不調(diào)整,遇有需要調(diào)整的組字單元,要優(yōu)先按最大的組字單元編碼。
個(gè)別漢字取首尾首次都不能區(qū)分同音字,這時(shí)可針對(duì)漢字的結(jié)構(gòu)作調(diào)整。對(duì)重心字,某一碼要按重心所在編碼;對(duì)夾字架去掉某一頭后編碼;對(duì)疊字架可優(yōu)選幾個(gè)字母或符號(hào)作識(shí)別碼;對(duì)組合組字單元優(yōu)選幾個(gè)字母或符號(hào)作識(shí)別碼。
下面結(jié)合實(shí)施例作詳細(xì)說(shuō)明。
本發(fā)明在編碼時(shí)對(duì)漢字筆畫(huà)的認(rèn)識(shí)完全科學(xué)。根據(jù)公認(rèn)的觀點(diǎn),楷書(shū)漢字由筆畫(huà)構(gòu)成,筆畫(huà)為書(shū)寫(xiě)漢字時(shí)不間斷地一次連續(xù)寫(xiě)成的一個(gè)線(xiàn)條。漢字的筆畫(huà)有多種,在只考慮筆畫(huà)的運(yùn)筆方向而不計(jì)其輕重長(zhǎng)短時(shí),可以將漢字的筆畫(huà)歸類(lèi)為五種基本筆畫(huà)橫、豎、撇、捺、折。其中點(diǎn)作捺,提作橫,但點(diǎn)提相連時(shí)提作點(diǎn)。本人通過(guò)潛心研究發(fā)現(xiàn)撇捺都由上向下傾斜,故可稱(chēng)為斜筆畫(huà),而折根據(jù)其沒(méi)折彎鉤前的運(yùn)筆方向,可分別并入上述三類(lèi)筆畫(huà)中,這三類(lèi)筆畫(huà)本發(fā)明人稱(chēng)之為根本筆畫(huà)。它與漢字各種筆畫(huà)的對(duì)應(yīng)關(guān)系,見(jiàn)圖一所示,順便指出所有圖中1、2、3均分別為橫、豎、斜的代號(hào)。
一、為減少重碼規(guī)定對(duì)1至4筆的漢字按書(shū)寫(xiě)順序根據(jù)基本筆畫(huà)的相交情況編碼,橫、豎、撇、捺、折當(dāng)沒(méi)與上一筆相交時(shí)編碼分別為1、2、3、4、5;當(dāng)只與上一筆相交時(shí)分別是6、7、8、9、0;當(dāng)不止與上一筆相交時(shí)分別取鍵盤(pán)左右上角的五個(gè)字母Q、W、E、R、T。
二、對(duì)5筆及以上的漢字按書(shū)寫(xiě)順序根據(jù)根本筆畫(huà)橫豎斜的排列組合次序?qū)γ咳P進(jìn)行編碼。在三個(gè)依次出現(xiàn)的筆畫(huà)中,橫豎斜的排列組合不外乎27種,可一一對(duì)應(yīng)地排列在27個(gè)互不相同的字母或符號(hào)鍵上,一般一一對(duì)應(yīng)地排列在26個(gè)英文字母及某個(gè)特定標(biāo)點(diǎn)符號(hào)鍵上。如果系統(tǒng)允許的話(huà)也可以排列在空格鍵、回車(chē)鍵上,甚至可以在標(biāo)準(zhǔn)鍵盤(pán)上新增一個(gè)鍵,但這會(huì)增加系統(tǒng)成本,為便于輸入漢字,本發(fā)明人利用26個(gè)字母的鍵位及“;”鍵進(jìn)行編碼,見(jiàn)圖二所示,當(dāng)取至最后不足三筆時(shí),若剩下一筆,最末筆為橫或豎或撇或捺或折其編碼分別為1或2或3或4或5;若還剩二筆,最末筆為橫或豎或撇或捺或折其編碼分別為6或7或8或9或0。當(dāng)然也可以將最末筆改為剩下的第一筆。
由于簡(jiǎn)化漢字很少超過(guò)18筆,因此可規(guī)定碼長(zhǎng)最多6碼,超過(guò)6碼時(shí),最后一碼改取末3筆。不過(guò)本發(fā)明人并不怎么贊成這種人為壓縮,因?yàn)殡S著漢字的科學(xué)簡(jiǎn)化,碼長(zhǎng)會(huì)自然而然縮短,碼長(zhǎng)還可壓縮得更短,當(dāng)規(guī)定碼長(zhǎng)最多為4碼或3碼時(shí)可補(bǔ)上該漢字拼音首字母或聲母作為識(shí)別碼。
為提高漢字輸入速度還設(shè)置了詞組輸入法詞組中每字最多取首尾兩碼,對(duì)6筆以下的漢字按單字編碼規(guī)則取其首尾兩碼,6筆及以上的漢字取其首三筆和末三筆,不足兩碼的可補(bǔ)上一個(gè)不屬于10個(gè)數(shù)字及27個(gè)字母或符號(hào)的特定符號(hào),比如可選用“,”。二字詞每字各取其首尾兩碼,三字詞前兩字各取第一碼,后一字取其首尾兩碼,四字及以上的詞取前3個(gè)字和最后一個(gè)字的第一碼。
實(shí)施例一種電腦漢字編碼方法五三筆碼1 JLA ROUO;9KE KSDW 45;C 11MD“?”鍵為萬(wàn)能查詢(xún)鍵,當(dāng)某一碼難以確定時(shí),可用“?”鍵代替,再利用提示行選擇,不足規(guī)定碼長(zhǎng)的以空格鍵結(jié)尾,當(dāng)然也可規(guī)定以回車(chē)鍵結(jié)尾。
應(yīng)當(dāng)指出對(duì)五筆及以上的漢字也可按書(shū)寫(xiě)順序根據(jù)橫豎斜的排列組合情況以每四筆為一個(gè)字母或符號(hào)進(jìn)行編碼。在依次出現(xiàn)的四個(gè)筆畫(huà)中不變位置地選出其中三筆,比如選首三筆或末三筆,根據(jù)這三筆的排列組合情況輸入對(duì)應(yīng)的字母或符號(hào),當(dāng)取至最后不足四筆時(shí),若只剩一筆,最末筆為橫或豎或斜,其編碼分別為1或2或3;若還剩二筆,最末筆為橫或豎或斜,其編碼分別為4或5或6;若還剩三筆,最末筆為橫或豎或斜,其編碼分別為7或8或9,為折時(shí)定為0。當(dāng)然也可以將最末筆改為剩下的第一筆。
五三筆碼將二維方塊的漢字按書(shū)寫(xiě)順序一維線(xiàn)性化,使得任何人只要懂得最基本的漢字書(shū)寫(xiě)順序即可在短短幾分種內(nèi)掌握它,快捷地輸入一個(gè)根本不認(rèn)識(shí)的漢字,真正做到了無(wú)須練習(xí),立即使用,而且學(xué)會(huì)后就能牢志不忘。隨著漢字的簡(jiǎn)化,這種電腦漢字編碼方法必將顯示出更大的優(yōu)越性。
應(yīng)當(dāng)指出某幾種橫豎斜排列組合方式組字頻率很低,可將之合并排列在同一鍵上,這樣27種橫豎斜排列組合可排列在不足27個(gè)字母或符號(hào)鍵上,但這記憶不甚方便,所以一般還是以一一對(duì)應(yīng)地排列好。上述規(guī)則是以4筆為界編碼的,其實(shí)也可以以N筆為界,還可以規(guī)定碼長(zhǎng)最多為L(zhǎng),超過(guò)規(guī)定時(shí)改取最后一碼,N、L均為正整數(shù)當(dāng)碼長(zhǎng)較短時(shí),補(bǔ)上該漢字的拼音,構(gòu)成五三音碼,音碼可前可后,一經(jīng)選定不得改變,下面是規(guī)定碼長(zhǎng)最多為2碼或3碼時(shí)的五三音碼的形部編碼具體規(guī)則(1)對(duì)只有1筆的漢字,橫、豎、撇、捺、折的編碼分別為1、2、3、4、5;(2)對(duì)2至5筆的漢字取其首一筆和末一筆,橫、豎、撇、捺、折當(dāng)沒(méi)與上一筆相交時(shí),其編碼分別為1、2、3、4、5;當(dāng)只與上一筆相交時(shí)其編碼分別為6、7、8、9、0;當(dāng)不止與上一筆相交時(shí),其編碼分別為位子鍵盤(pán)左上角的5個(gè)字母Q、W、E、R、T;(3)對(duì)6筆及以上的漢字取其首三筆和末三筆,對(duì)首三筆和末三筆只須根據(jù)其橫、豎、斜的排列組合情況輸入對(duì)應(yīng)的字母或符號(hào)鍵即可;
(4)、對(duì)1至5筆的漢字或者按書(shū)寫(xiě)順序?qū)γ咳P進(jìn)行編碼,對(duì)每三筆只需根據(jù)其橫豎斜的排列組合情況輸入對(duì)應(yīng)的字母或符號(hào)鍵即可,若還剩一筆,最末筆為橫或豎或撇或捺或折,其編碼分別為1或2或3或4或5;若還剩二筆,最末筆為橫或豎或撇或捺或折,其編碼分別為6或7或8或9或0;當(dāng)然也可將最末筆改為剩下的第一筆。也可根據(jù)最末筆編碼。
(5)對(duì)6筆及以上的漢字或者按書(shū)寫(xiě)順序先對(duì)頭三筆和次三筆編碼,若還剩一筆,最末筆為橫或豎或撇或捺或折,編碼分別為1或2或3或4或5;若還剩二筆,最末筆為橫或豎或撇或捺或折,編碼分別為6或7或8或9或0;若還剩三筆及以上,改取末三筆。對(duì)頭三筆、次三筆、末三筆只需根據(jù)其橫豎斜的排列組合情況輸入一一對(duì)應(yīng)的字母或符號(hào)即可。當(dāng)然也可將最末筆改為剩下的第一筆。
音碼可以為全拼或簡(jiǎn)拼或混拼或雙拼或該拼音的不完整拼音,采用拼音不完整拼音時(shí)因與全拼不一致,會(huì)增加重碼,一般不采用,為縮短碼長(zhǎng)提高輸速,一般用雙拼法,在實(shí)施例中選用微軟雙拼輸入法,還規(guī)定音碼在后,因規(guī)則(4)包含規(guī)則(1),規(guī)則(2)要區(qū)分筆畫(huà)數(shù),不甚方便,規(guī)則(5)碼長(zhǎng)稍長(zhǎng),會(huì)影響輸速,所以在實(shí)施例中按規(guī)則(3)、(4)編碼。
為提高漢字輸入速度還設(shè)置了簡(jiǎn)碼、詞組、語(yǔ)句輸入法。
一、簡(jiǎn)碼數(shù)字一至九只需擊一次相應(yīng)的數(shù)字鍵,字母簡(jiǎn)碼見(jiàn)圖三,該圖的特點(diǎn)是除A、O、E、I、U按拼音末字母,V按象形,“;”按筆畫(huà)定位外,其余都按拼音首字母定位。冒號(hào)前為一級(jí)簡(jiǎn)碼,冒號(hào)后為與它在句子中用法類(lèi)似的同類(lèi)高頻字。對(duì)同類(lèi)高頻字只需按該圖的左右順序在一級(jí)簡(jiǎn)碼后擊相應(yīng)的數(shù)字鍵1、2、3、4、5即可。
按規(guī)則(4)編碼時(shí),由于全碼輸入時(shí)擊數(shù)字鍵不甚方便,一般大部分1至5筆的漢字都可舍去數(shù)字鍵,擊其簡(jiǎn)碼。具體講對(duì)1至2筆的漢字可直接輸入其雙拼碼,對(duì)4至5筆的漢字可在輸入首三筆所對(duì)應(yīng)的字母或符號(hào)后再接著輸入其雙拼音碼,還應(yīng)當(dāng)指出,不要一味追求鍵位少,因?yàn)橛煤?jiǎn)碼輸入時(shí)利用數(shù)字鍵會(huì)大大增加簡(jiǎn)碼數(shù)量,有助于提高輸速。二級(jí)簡(jiǎn)碼按五三音碼形部編碼從理論上講有700多個(gè),若利用數(shù)字鍵可擴(kuò)充1000個(gè)左右,這會(huì)明顯提高輸速。三級(jí)簡(jiǎn)碼從理論上講可舍棄五三音碼4位編碼中的任意1位,考慮思維習(xí)慣一般舍棄形部編碼第二位碼。
二、詞組詞組輸入方法有兩種一種是聲韻雙拼法;另一種是按五三音碼形部編碼。雙字詞只需直接輸入每個(gè)漢字的形部編碼;三字詞輸入第一第二個(gè)漢字的形部第一位碼,再輸入第三個(gè)漢字的形部編碼;四字及以上的多字詞只需輸入第一、二、三和最后一個(gè)漢字形部第一位碼。
三、語(yǔ)句語(yǔ)句輸入時(shí)只需接連輸入句子中每個(gè)漢字的聲、韻母即可。
實(shí)施例一種電腦漢字編碼方法五三音碼1 JAVS DMNK HJZI BMMA FHFA WSYM若按規(guī)則(2)編碼,五的編碼為11WU,三的編碼為11SJ,若按規(guī)則(5)編碼,種的編碼為JLAVS,該實(shí)施例在詞組輸入時(shí)采用微軟雙拼輸入法。為盡可能消除重碼和避免編碼的二義性,單字輸入時(shí)不支持多音字輸入,詞組輸入時(shí)仍支持多音字輸入。
有些經(jīng)常出現(xiàn)在字首或字尾的漢字組字單元組字頻率高,若完全按規(guī)則(3)、(4)編碼,容易集中排列在某一字母或符號(hào)鍵上,這會(huì)造成一定數(shù)量的重碼,因此有必要作適當(dāng)調(diào)整。調(diào)整的方法是將這些組字單元從組字頻率高的某幾種橫豎斜排列組合鍵上抽出,排列到組字頻率低的橫豎斜排列組合鍵上,避免容易出現(xiàn)在編碼同一位置的組字頻率高的組字單元及橫豎斜某種排列組合排在同一鍵上,排列時(shí)還考慮了同音字因素,還可酌情參考組字單元和橫豎斜27種排列組合的實(shí)用頻率、鍵位壓縮、指法規(guī)則。本發(fā)明人綜合比較,反復(fù)優(yōu)選后調(diào)整方案見(jiàn)圖四,圖四還調(diào)整了橫、豎、斜三類(lèi)筆畫(huà)的排列次序,該圖也即優(yōu)化五三音碼形部編碼鍵盤(pán)排列圖。下面作具體解說(shuō)(1)目含且、罒、皿、臼,钅含金,日含 ,足含走,貝含見(jiàn),扌含 ,讠含言, 含 、已、巳、己、巴、尸、 ,土含士、 、牛,氵含水, 、 , 含 , 含心,阝含耳,饣含食字頭 ,亻含 ,メ含 ,特別指出廣不含疒,麻部,木不含未、口不得與其它筆畫(huà)相交,貝在字首時(shí),按其末三筆編碼,也就是為C,這些被含的組字單元與基本組字單元或互為繁簡(jiǎn),或互相同源,或音、形、義基本相同,可視為同種組字單元,就象字母有大小手寫(xiě)體一樣。
(2)以上組字單元嚴(yán)格按書(shū)寫(xiě)順序出現(xiàn)在字首或字尾,才排列在相應(yīng)的字母上,心的前三筆為豎斜斜時(shí),編碼為聲母X。艸下面為氵時(shí)慣常與去氵后的字發(fā)生重碼,編碼非改不可,編碼為改的聲母G,艸下面為扌,犭前為氵、讠,日、口上面與十相連時(shí)編碼改為G,口上面為八、冂,編碼也為G,一橫與二豎相交或相連,一般為H,但艸下面連一到二橫時(shí)以廿代表,編碼為聲母N。連三橫時(shí)編碼作為組合組字單元,編碼也為G,例如萍的編碼為“GJP;”,“故”的編碼為GKGU,車(chē)、禾應(yīng)位于字首,亻應(yīng)在字的左部,メ應(yīng)該在字尾。不在規(guī)定位置時(shí),編碼不作調(diào)整。女的書(shū)寫(xiě)順序?yàn)闄M折撇,忄的書(shū)寫(xiě)順序點(diǎn)豎點(diǎn),力刀的書(shū)寫(xiě)順序因人而異,約定在下部時(shí)為撇折,其余都為折撇。離散的筆畫(huà)“乙”形似豎的代號(hào)2,約定作豎,己上面為山時(shí)不作調(diào)整。
(3)木根據(jù)其首三筆編碼;目、禾分別根據(jù)末三筆編碼;饣為食的簡(jiǎn)體,其末三筆為N,日的左部,足的中部象E,亻變形后似W,貝象R,メ形似X,讠象I、口象O, 象P,扌形似F,艸象H,犭的形似反K,反文低象K, 象2個(gè)L連成;王形似手寫(xiě)體Z,大有撇有捺象倒立V,钅字頭形似V,所以將它們排列在相應(yīng)的字母鍵上; 的前三筆出現(xiàn)在字首時(shí),形如U, 出現(xiàn)在字尾時(shí),為倒立的 ,編碼為U,土、月、氵、廣按聲母編碼,竹按韻母編碼。車(chē)的第二筆視為撇折的話(huà),將它橫倒看,其首三筆就為豎斜豎,所以編碼為B,巾將其橫倒看,其筆畫(huà)為橫豎橫,所以排列在A上, 起筆形似L,且其三筆從右向左看為斜斜豎,所以將其排列在L上, 的第一三筆為豎斜,兼容在Y鍵上,小的第一三筆為豎斜,兼容在H鍵上, 的第一二筆為斜橫,下面又有二點(diǎn),所以排列在J上,米的上半部從左至右點(diǎn)豎點(diǎn)、所以排到在R鍵上,是一線(xiàn)連三橫,所以排在Q上,特別規(guī)定馬、彳、忄、田、耳、魚(yú)、雨出現(xiàn)在字首時(shí),第二碼取依書(shū)寫(xiě)順序出現(xiàn)在其后的次三筆。門(mén)、口部取其內(nèi)次三筆。如其后不足三筆時(shí),仍按原來(lái)規(guī)則編碼。在對(duì)首三筆、次三筆、末三筆編碼時(shí),遇到調(diào)整后的組字單元,則要優(yōu)先按最大的組字單元編碼,木、馬、蟲(chóng)在字下部時(shí)移至字首后編碼。另外,阝象B。例如驥的編碼為ARJI,固的編碼為RGGU,日的編碼為E1RI。
(4)由于每個(gè)鍵上最多只有2個(gè)基本組字單元,總共才30余個(gè)基本組字單元,與俄文字母相當(dāng),且主要按筆畫(huà)或拼音或象形(與西文字母或符號(hào)相似)等方式排列在鍵上,極便于記憶,當(dāng)然個(gè)別似乎有點(diǎn)聯(lián)想、無(wú)理。
有的漢字為左中右結(jié)構(gòu)或上中下結(jié)構(gòu),兩頭組字單元又完全相同,形似夾著一個(gè)組字單元,本發(fā)明人稱(chēng)之為夾字架。對(duì)夾字架可去掉其字首或字尾的組字單元,然后編碼,在實(shí)施例中去掉字尾的組字單元后編碼。
左中右結(jié)構(gòu),中間在三筆及以上,右邊為刂,上中下結(jié)構(gòu),上面為立,下面為兒也屬于廣義上的夾字架,對(duì)這些夾字架可同樣去掉字尾的組字單元后編碼。
赤部不屬于土部,齒、步部不屬于止部,所以應(yīng)按下半部的首三筆編碼。與載類(lèi)似結(jié)構(gòu)重心在車(chē)處,與贏類(lèi)似結(jié)構(gòu)重心在貝處,所以應(yīng)按重心所在編碼。另外約定組字單元玉、甫、戔右角的點(diǎn)忽略不計(jì)。
有的漢字為上下結(jié)構(gòu),并且至少有2個(gè)相同的組字單元依次出現(xiàn)在字尾,本發(fā)明人稱(chēng)之為疊字架,對(duì)疊字架若有2個(gè)相同的組字單元,則形部第2碼取英文第一個(gè)字母A,若有3個(gè)相同的組字單元,則取英文第二個(gè)字母B。左右結(jié)構(gòu),右面又為上下結(jié)構(gòu),并且至少有2個(gè)相同的組字單元依次出現(xiàn)在字尾,也屬于廣義上的疊字架,編碼為B。
實(shí)施例弼;WEBI贏JRY;輔BFFU 荔HBLI一種電腦漢字編碼方法五三音碼1 NWVS EODM YONK S9HJ KZZI LHBMXAMA M5FH SCFA 5 3 JEYN XAMA其中電的簡(jiǎn)碼EDM漢的簡(jiǎn)碼SHJ 字的簡(jiǎn)碼KZI 方的簡(jiǎn)碼MFH
作為五三音碼的一種變形,對(duì)6筆及以上的漢字形部編碼或者按筆畫(huà)或拼音或象形等方式先對(duì)義部編碼,一般當(dāng)義部在字首時(shí),第二碼取字尾三筆,在字尾時(shí)取字首三筆,在字中時(shí)約定取字首或字尾三筆。由于部首數(shù)量劃分不一,位置不易確定,相比之下以前一個(gè)方案為優(yōu)選。
本編碼字詞兼容,不必進(jìn)行換檔等附相操作,重碼字極少,重碼選擇方法和其它輸入法相同,另外還設(shè)置了去重鍵“?!币簿褪菍⑿尾烤幋a第二位碼改為“。”,這樣不影響指法,又可消除重碼,利于專(zhuān)職追求高速,“?”鍵為萬(wàn)能查詢(xún)鍵,當(dāng)某一位碼難以確定時(shí),可用“?”代替,再利用提示行選擇,不足規(guī)定碼長(zhǎng)的均以空格鍵結(jié)尾。
本編碼還提供了一種新的漢字修改方法,它使得漢字修改與西文差不多容易,方法是將光標(biāo)移至所需要修改的字下,若該字與改后的字同音,雙擊改后的字的五三音碼形部編碼,改后的字即上屏,當(dāng)然這需要強(qiáng)大的軟件支持。本方法顯然適用于語(yǔ)音語(yǔ)句輸入后的修改,軟件允許的話(huà),只需念形部編碼的讀音。
本發(fā)明適用于一切大、中、小、微型計(jì)算機(jī)中文信息處理系統(tǒng)和通訊系統(tǒng),可廣泛應(yīng)用于中文終端、中文電傳、電腦打字和計(jì)算機(jī)排版印刷等各個(gè)方面,可在互聯(lián)網(wǎng)環(huán)境下運(yùn)行。
本發(fā)明可以適用于繁體字的港、澳、臺(tái)地區(qū),也可以用于日文、韓文,只是日文、韓文漢字與普通話(huà)讀音不同,組字單元的排列不完全相同,排列方法仍然相同。
五三音碼編碼規(guī)則極為簡(jiǎn)單、客觀,音碼部份以雙拼法為最快,對(duì)于已經(jīng)掌握雙拼法的人來(lái)說(shuō),不出短短十分鐘就能學(xué)會(huì),而且學(xué)會(huì)后就能牢記不忘,沒(méi)掌握雙拼法的人可在練習(xí)雙拼法時(shí)同步學(xué)會(huì)。單字碼長(zhǎng)最長(zhǎng)不過(guò)四碼,重碼率幾乎為0,免去了同音字選擇煩惱,音碼部分選用南方模糊音幾乎不會(huì)增加重碼,南方模糊音的特點(diǎn)是c、s、z與ch、sh、zh,及in與ing不分,en、eng與清輔音b、p、m、f相拼時(shí)區(qū)分。支持語(yǔ)句輸入,不易疲勞。容量大,從理論上講可以容納全部6萬(wàn)多個(gè)漢字,做到高速脫稿輸入,也就是說(shuō)不僅適合于盲打,還適合于聽(tīng)打、想打,使得漢字無(wú)論是輸入速度還是調(diào)出速度都要快于西文。
權(quán)利要求
1.一種五三筆碼,將漢字的各種筆畫(huà)歸類(lèi)為橫、豎、撇、捺、折五種基本筆畫(huà),并進(jìn)一步歸類(lèi)為橫、豎、斜三類(lèi)根本筆畫(huà),接著編碼,其特征是對(duì)N筆及以上的漢字主要按書(shū)寫(xiě)順序以每M筆為一個(gè)字母或符號(hào)編碼,N為正整數(shù),M>2,在M筆中不變位置地選出其中3個(gè)筆畫(huà),由于在依次出現(xiàn)的3個(gè)筆畫(huà)中,橫、豎、斜的排列組合不外乎27種,可一一對(duì)應(yīng)或大致一一對(duì)應(yīng)地排列在27個(gè)或不足27個(gè)互不相同的字母或符號(hào)鍵上,因此對(duì)M筆只需按選出的三個(gè)筆畫(huà)的排列組合情況輸入對(duì)應(yīng)的字母或符號(hào)。
2.一種五三音碼,其特征是組合五三筆碼和音碼,并允許以橫豎斜的排列組合不外乎27種,一一對(duì)應(yīng)或大致一一對(duì)應(yīng)地排列在27個(gè)或不足27個(gè)互不相同的鍵上為基礎(chǔ),調(diào)整某些組字單元包括筆畫(huà)、若干特定結(jié)構(gòu)漢字的歸類(lèi)編排取碼方法的編碼。
3.一種五三音碼形部編碼鍵盤(pán)排列圖,其特征是橫豎斜的排列組合不外乎27種,一一對(duì)應(yīng)或大致一一對(duì)應(yīng)地排列在27個(gè)或不足27個(gè)互不相同的鍵上,并允許把某些組字單元排列在鍵上。
4.根據(jù)權(quán)利要求1所述的五三筆碼,其特征是編碼為(1)對(duì)不到N筆的漢字按書(shū)寫(xiě)順序歸類(lèi)為幾種筆畫(huà),逐筆編碼,N一般為3或4或5筆,一般歸類(lèi)為基本筆畫(huà)(2)對(duì)N筆及以上的漢字按書(shū)寫(xiě)順序根據(jù)橫豎斜的排列組合情況以每三筆為一個(gè)字母或符號(hào)進(jìn)行編碼,在依次出現(xiàn)的三個(gè)筆畫(huà)中,橫豎斜的排列組合不外乎27種,可與27個(gè)互不相同的字母或符號(hào)一一對(duì)應(yīng),對(duì)每3筆只需輸入對(duì)應(yīng)的字母或符號(hào),當(dāng)取至最后不足三筆時(shí),將余下的筆畫(huà)歸類(lèi)為幾種筆畫(huà)編碼,對(duì)第一筆或最末筆用若干鍵編碼,一般歸類(lèi)為基本筆畫(huà),用數(shù)字鍵編碼;(3)、對(duì)N筆及以上的漢字或者按書(shū)寫(xiě)順序根據(jù)橫豎斜的排列組合情況每四筆為一個(gè)字母或符號(hào)進(jìn)行編碼,在依次出現(xiàn)的四個(gè)筆畫(huà)中不變位置選出其中三筆,根據(jù)這三筆的排列組合情況輸入對(duì)應(yīng)的字母或符號(hào),當(dāng)取至最后不足四筆時(shí),將余下的筆畫(huà)歸類(lèi)為幾種筆畫(huà),對(duì)第一筆或最末筆用若干鍵編碼,一般歸類(lèi)為根本筆畫(huà),用數(shù)字鍵編碼。
5.根據(jù)權(quán)利要求4所述的五三筆碼,其特征是詞組編碼為詞組中每字最多取首尾兩碼,二字詞每字各取其首尾兩碼,三字詞前兩字各取第一碼,后一字取其首尾兩碼,四字及以上的詞取前3個(gè)字和最后一個(gè)字的第一碼,一般以每三筆編碼,對(duì)6筆以下的漢字按單字編碼規(guī)則取其首尾兩碼,6筆及以上的漢字取其首三筆和末三筆,不足兩碼的可補(bǔ)上一個(gè)不參與單字編碼的特定符號(hào)。
6.根據(jù)權(quán)利要求2所述的五三音碼,其特征是當(dāng)超過(guò)五三筆碼規(guī)定的最多碼長(zhǎng)時(shí),改取最后一碼,當(dāng)規(guī)定碼長(zhǎng)較短時(shí),補(bǔ)上該漢字的音碼,音碼可以為全拼或簡(jiǎn)拼或混拼或雙拼或不完整拼音。
7.根據(jù)權(quán)利要求3所述的優(yōu)化五三音碼形部編碼鍵盤(pán)排列圖,其特征是橫豎斜的排列組合不外乎27種,一一對(duì)應(yīng)地排列在鍵盤(pán)的鍵上,排列組字單元時(shí),一般要考慮兩點(diǎn)(1)避免容易出現(xiàn)在形部編碼同一位置的組字頻率高的組字單元及橫豎斜某種排列組合排列在同一鍵上;(2)漢字同音字因素。
8.根據(jù)權(quán)利要求7所述的優(yōu)化五三音碼形部編碼鍵盤(pán)排列圖,其特征是排列組字單元時(shí),還可以參考組字單元的筆畫(huà)數(shù)或鍵位壓縮或組字單元及橫豎斜排列組合的實(shí)用頻率或指法規(guī)則。
9.根據(jù)權(quán)利要求8所述的優(yōu)化五三音碼形部編碼鍵盤(pán)排列圖,其特征是將基本組字單元主要按筆畫(huà)或拼音或與西文字母或符號(hào)相似方式排列在鍵上。
10.根據(jù)權(quán)利要求8所述的優(yōu)化五三音碼形部編碼鍵盤(pán)排列圖,其特征是基本組字單元數(shù)與西文字母數(shù)大體接近。
11.根據(jù)權(quán)利要求9或10所述的優(yōu)化五三音碼形部編碼鍵盤(pán)排列圖,其特征是基本組字單元還可以包含要么互為繁簡(jiǎn)、要么互相同源、要么音或形或義基本相近一般為形體直觀相似的組字單元。
12.根據(jù)權(quán)利要求11所述的優(yōu)化五三音碼形部編碼鍵盤(pán)排列圖,其特征是有的組字單元甚至還可以規(guī)定必須位于漢字的特定位置,或者規(guī)定與某些近似的組字單元相區(qū)別。
13.根據(jù)權(quán)利要求6或12所述的優(yōu)化五三音碼,其特征是形部編碼一般為可以規(guī)定對(duì)1至5的漢字一般按書(shū)寫(xiě)順序根據(jù)每三筆的橫豎斜排列組合情況編碼,當(dāng)剩下的筆畫(huà)不足三筆時(shí)歸類(lèi)為幾種筆畫(huà),對(duì)剩下第一筆或最末筆用不屬于27個(gè)字母或符號(hào)的鍵編碼;
14.根據(jù)權(quán)利要求6或12所述的優(yōu)化五三音碼,其特征是形部編碼一般規(guī)定對(duì)6筆及以上的漢字根據(jù)其首三筆和末三筆的橫豎斜排列組合情況編碼。
15.根據(jù)權(quán)利要求6或12所述的優(yōu)化五三音碼,其特征是有的組字單元包括沒(méi)排列在鍵上的組字單元還可以規(guī)定取其后次三筆,其后不足三筆的仍取其末三筆,另外還可以移動(dòng)其在漢字中的位置后編碼。
16.根據(jù)權(quán)利要求6或12所述的優(yōu)化五三音碼,其特征是形部編碼時(shí),按書(shū)寫(xiě)順序遇到規(guī)定排列在鍵上的組字單元要優(yōu)先按筆畫(huà)數(shù)最多的組字單元編碼。
17.根據(jù)權(quán)利要求2述的優(yōu)化五三音碼,其特征是特定結(jié)構(gòu)的漢字的形部編碼主要為(1)對(duì)重心在漢字中某一位置的漢字,編碼某一碼可規(guī)定優(yōu)先按重心所在編碼;(2)對(duì)左中右結(jié)構(gòu)或上中下結(jié)構(gòu),兩頭組織單元又完全相同的漢字可規(guī)定去掉某一頭后編碼;(3)對(duì)上下結(jié)構(gòu)并且至少有2個(gè)相同的組字單元依次出現(xiàn)在字尾的漢字,形部第二碼可用幾個(gè)優(yōu)選的字母編碼;(4)對(duì)幾個(gè)組字單元按一定方式拼形構(gòu)造的組合組字單元可用幾個(gè)優(yōu)選的字母編碼。
18.根據(jù)權(quán)利要求2所述的五三音碼,其特征是對(duì)6筆及以上的漢字或者先對(duì)義部編碼,形部編碼第2碼一般當(dāng)義部在字首時(shí)取末三筆;義部在字尾時(shí)取其首三筆;義部在字中時(shí)可規(guī)定取漢字的首三筆或末三筆,對(duì)首三筆或末三筆根據(jù)其橫豎斜的排列組合情況編碼。
19.根據(jù)權(quán)利要求2所述的五三音碼,其特征是漢字修改方法為將光標(biāo)移至所要修改的漢字,若該漢字與改后的字同音,雙擊改后的字的五三音碼形部編碼,不足2碼的補(bǔ)上一個(gè)不參與單字編碼的鍵,一般為結(jié)尾鍵,改后的字即上屏。
20.根據(jù)權(quán)利要求2所述的五三音碼,其特征是對(duì)漢字三級(jí)簡(jiǎn)碼可舍棄五三音碼四位編碼中的任意一位;對(duì)漢字詞組按五三音碼形部編碼時(shí),編碼長(zhǎng)度均不超過(guò)四碼。
全文摘要
本發(fā)明屬于電腦漢字編碼輸入方法。
文檔編號(hào)G06F3/023GK1307267SQ00134210
公開(kāi)日2001年8月8日 申請(qǐng)日期2000年11月23日 優(yōu)先權(quán)日1999年12月25日
發(fā)明者王治陽(yáng) 申請(qǐng)人:王治陽(yáng)