專利名稱:無理序號數(shù)字綜合編碼法及其鍵盤的制作方法
技術(shù)領域:
本發(fā)明涉及到一種電子計算機漢字輸入方法及其鍵盤。
電子計算機漢字輸入方法,一直是在中國普及計算機的“瓶頸”問題。國內(nèi)外許多專家進行了大量的研究,提出了500多種漢字輸入方法。這些輸入方法可分為六大類一、音碼即根據(jù)漢字的讀音來編碼。如漢語拼音碼、山東省唐樊寬的《中文聲數(shù)碼》。音碼的優(yōu)點是容易學、直觀。缺點是碼長長,重碼率高,不會讀的字無法輸入。
二、形碼即根據(jù)漢字的字形來編碼。如河南省王永民的《五筆字型》、陳國斌的《層次四角》、江西省萬仁芳的《前三末一》。優(yōu)點是重碼率低,碼長短,不會念的字也能輸入。缺點是有一套拆分漢字進行編碼的規(guī)則,要記憶字根在鍵盤上的分布位置,難學。
三、音形碼即同時根據(jù)漢字的讀音和字型來編碼。如四川省陳代于的《大眾碼》、北京市郭淑珍的《聲韻聲聲》、扶良文的《智能碼》、周志農(nóng)的《自然碼》。根據(jù)漢字“同音不同形、形似不同音”的規(guī)律,音形碼的重碼率大為降低。但是仍然存在難學、不會念或念不準的字難輸入的問題。
四、數(shù)碼用數(shù)字進行編碼,如區(qū)位碼、電報碼。數(shù)字編碼的優(yōu)點是只用10數(shù)字編碼,容易操作、無重碼。缺點是用一般的學習方法極難記憶。
五、聲控輸入即讀出漢字的音,就可輸入漢字。如北京四達技術(shù)中心開發(fā)的聲控卡。優(yōu)點是不用對漢字編碼,缺點是錯誤率高,對同音字無法區(qū)分。
六、手寫輸入即寫出漢字的形,就可輸入漢字。如哈爾濱工業(yè)大學開發(fā)的手寫識別系統(tǒng)。優(yōu)點是不用鍵盤,適合文秘人員用筆的習慣。缺點是輸入速度慢,每字平均10畫,遠遠大于每個漢字擊鍵的次數(shù),錯誤率高,形相近的字難識別。
本發(fā)明的目的,在于向公眾提供一種把漢字音和形的信息轉(zhuǎn)化為數(shù)字,用數(shù)字對漢字進行編碼的無理序號數(shù)字綜合編碼法。
本發(fā)明具體結(jié)構(gòu)和細節(jié),從
和實施例中給出。
本發(fā)明的實施方案是鍵盤設計、中文信息數(shù)字化、漢字編碼、詞組編碼、中文輸入方法等具體內(nèi)容。
一、鍵盤設計本發(fā)明將標準英文鍵盤的英文字母、符號30個鍵設計成0.-9.、◎-⑨、(0)-(9)等30個帶符號的數(shù)字鍵。從鍵盤中部Y、H、N分開、右邊是雙數(shù),左邊是單數(shù),鍵盤中部數(shù)值小,邊部數(shù)值大。見附圖1。
二、中文信息數(shù)字化本發(fā)明將漢語拼音的聲母、韻母、漢字的字型筆畫、部首各分成10類,編碼0-9,分別叫聲母碼、韻母碼、字型筆畫碼、部首碼。見附圖2(一)、聲母碼漢語拼音包括23個聲母,見附圖3數(shù)字0、1、2、3、4、5、6、7、8、9有多種讀音,如1、按普通話正常讀音,如0零、1一、2二……2、電訊讀音,如0洞、1妖、7拐……3、音符讀音,如4發(fā)、6拉……在以上讀音的基礎上,我們把聲母作如下歸類(見附圖2)0-因為電訊讀音“洞”的聲母為d,t是與d成對的聲母,所以把d、t歸到0。
1-因為讀音“一”的聲母為y,r的讀音與y相近,所以把y、r歸到1。
2-因為讀音“二”無聲母,以韻母e開頭,能位于讀音首字母的韻母還有a、o,所以把e、a、o開頭的漢字稱為無聲母漢字,其聲母碼規(guī)定為2。
3-因為讀音“三”的聲母為s,sh、x的讀音與s相近,所以把s、sh、x歸到3。
4-因為音符“發(fā)”的聲母為f,h的讀音與f相近,所以把f、h歸到4。
5-因為讀音“五”的聲母為w,所以把w歸到5。
6-因為讀音“六”的聲母為l,n、m的讀音與l相近,所以把l、n、m歸到6。
7-因為讀音“七”的聲母為q,電訊讀音“拐”的聲母為g,k是與g成對的聲母,所以把q、g、k歸到7。
8-因為讀音“八”的聲母為b,p是與b成對的聲母,所以把b、p歸到8。
9-因為讀音“九”的聲母為j,所以把j歸到9。
還剩z、zh、c、ch沒有歸類,考慮到把漢字均勻地歸到0-9,本發(fā)明把z、zh歸到2,c、ch歸到5。
如果聲母歸類與數(shù)字讀音相抵觸,則以數(shù)字讀音為準,即零的聲母為l,四的聲母為s,但根據(jù)零、四的讀音,零歸到0,四歸到4。
(二)、韻母碼漢語拼音有37個韻母,包括6個單韻母,15個復韻母,16個鼻韻母。首先根據(jù)韻母首字母a、o、e、i、u(包括ü),把韻母分成5大類,每一類又分成單韻母、復韻母、鼻韻母。共分成15類,見附圖4。其中e、er、ei、en、eng、a、ai、ao、o、ou、ong的使用頻率很小,把使用頻率小的韻母合為一類,計有e、er、ei、en、eng合為一類,o、ou、ong合為一類,a、ai、ao合為一類。這樣共分成10類,按照數(shù)字0-9的韻母讀音,用0-9進行編碼,見附圖2。具體是0-因讀音“零”的韻母為ing,所以以i開頭的鼻韻母歸到0。
1-因讀音“一”的韻母為i,所以單韻母i歸到1。
2-因讀音“二”的韻母為er,所以以e開頭的韻母歸到2。
3-因讀音“三”的韻母為an,所以以a開頭的鼻韻母到3。
4-因音符讀音“發(fā)”的韻母為a,所以以a開頭的單韻母、復韻母歸到4。
5-因讀音“五”的韻母為u,所以單韻母u歸到5。
6-因讀音“六”的韻母為iou,所以以i開頭的復韻母歸到6。
7-因電訊讀音“拐”的韻母為uai,所以以u開頭的復韻母歸到7。
以o開頭的韻母和u開頭的鼻韻母沒有對應的數(shù)字讀音,數(shù)字8、9尚未編碼,故規(guī)定以o開頭的韻母歸到8,以u開頭的鼻韻母歸到9。
(三)、字型筆畫碼根據(jù)筆畫的讀音聲母碼和漢字字型結(jié)構(gòu),把字型和筆畫分成10類,編碼0-9,具體編碼是漢字的字型可分為左右型、其它型。漢字的筆畫可分成6個單筆,橫、豎、撇、捺、點、折,2個復筆,口、直交。字型分成兩類0-左右型、1-其它型,筆畫分成8類,取筆畫讀音的聲母碼(點例外),即2-折(包括鉤、折彎鉤)、3-豎、4-橫、5-點(包括提)、6-捺、7-口、8-撇、9-直交。見附圖2。
(四)、部首碼采用新華字典規(guī)定的部首和取部首原則,根據(jù)部首的筆畫數(shù)和部首的使用頻率,把部首分成10類,編碼0-9。具體編碼是取部首的筆畫數(shù)為部首碼,7畫以上的部首歸到7。分不清部首的字歸入單筆部首,取1,例-1、冫-2、廣-3、王-4、目-5、耳-6、赤-7。數(shù)字0、8、9尚未編碼,一些部首的使用頻率很大,構(gòu)字能力很強,為了離散重碼,選出33個構(gòu)字能力很強的部首分配到0、8、9。例氵-0、扌-8、土-9。見附圖2,三、漢字的編碼按照無理序號越小、即越常用的字擊鍵次數(shù)越少,擊鍵越容易的原則,對漢字編碼。分為音形碼和形碼兩類(一)音形碼1.常用字三位聲母碼+韻母碼+字型碼,例是-411(shi其它型)、們-620(men左右型)。
2.次常用字四位聲母碼+韻母碼+首筆筆畫碼+字型碼。例理-6140(li-左右型)、齊-7151(qi、其它型)。
3.稀用字五位聲母碼+韻母碼+首筆筆畫碼+尾筆筆畫碼+字型碼。例揖-11440(yi-左右型)、字-15521(yu、乙其它型)。
4.罕用字五位聲母碼+韻母碼+首筆筆畫碼+尾筆筆畫碼+部首碼。例徘-84843(pai丿-彳)、疸-03548(dan、-疒)。
(二)、形碼1.常用字三位首筆筆畫碼+尾筆筆畫碼+字型碼。例時-350(丨、左右型)、會-851(丿、其它型)。
2.次常用字四位首筆筆畫碼+尾筆筆畫碼+余部第一筆筆畫碼+字型碼。例宮-5771(丶口口其它型)、控-4450(-、左右型)。
3.稀用字五位首筆筆畫碼+尾筆筆畫碼+余部第一筆筆畫碼+余部第二筆筆畫碼+字型碼。例屠-24941(乙-十-其它型)、沼-57280(丶口乙丿左右型)。
4.罕用字五位首筆筆畫碼+尾筆筆畫碼+余部第一筆筆畫碼+余部第二筆筆畫碼+部首碼。例檐-97820(十口丿乙木)、奢-44948(-十-大)。
當部首位于起筆時,余部第一筆、第二筆指除部首外的第一筆、第二筆,當部首不在起筆時,余部第一筆、第二筆指整個字的第二筆、第三筆。
四、詞組編碼分二字詞、三字以上詞。
(一)、二字詞1.音形碼首字聲母碼+首字韻母碼+首字首筆筆畫碼+二字首筆筆畫碼+二字聲母碼。例提高-01457(ti-、g)、他們-04886(ta丿丿m)。
2.形碼首字首筆筆畫碼+首字尾筆筆畫碼+二字首筆筆畫碼+二字尾筆筆畫碼+二字部首碼。例方法-52550(、乙、、氵)、已經(jīng)-22240(乙乙乙-纟)。
(二)三字以上詞1.音形碼首字聲母碼+二字聲母碼+二字首筆筆畫碼+未字首筆筆畫碼+未字聲母碼。例北京市-89554(bj、、s)、為什么-53886(ws丿丿m)。
2.形碼首字首筆筆畫碼+二字首筆筆畫碼+未字首筆筆畫碼+未字尾筆筆畫碼+未字部首碼。例桂林市-44532(-、丨亠)、郵政編碼-34445(丨-石)。
按詞的使用頻率從大到小排列,二字詞、三字以上詞依次取前一位、二位、三位、四位簡碼。
五、圖形符號編碼圖形符號碼長五位。編碼方法是根據(jù)圖形符號的讀音、意義,挑選兩個關(guān)鍵字作為圖形符號的名稱,根據(jù)圖形符號的名稱對圖形符號編碼。在音形碼狀態(tài)下為首字聲母碼+首字韻母碼+首字首筆筆畫碼+二字首筆筆畫碼+二字聲母碼。如▲-41543(實三si、-s)、≠-85480(不等bu一丿d)。
在形碼狀態(tài)下為首字首筆筆畫碼+首字尾筆筆畫碼+二字首筆筆畫碼+二字尾筆筆畫碼+二字部首碼。例△-54441(空三、-),%-44888(百分-丿丿八)。
六、中文輸入法由于本發(fā)明把中文信息轉(zhuǎn)化為了0-9十個數(shù)字,輸入3-5數(shù)字,就可以輸入一個字或詞組、圖形符號。計算機識別10個數(shù)字遠比識別幾千個漢字容易得多,也比識別26個英文字母容易,因此本發(fā)明可廣泛應用于計算機鍵盤輸入、聲控輸入、手寫輸入,還可以用于中文信息有線、無線電數(shù)字通信,字典、詞典的編碼排序等。
1.計算機鍵盤輸入計算機標準英文鍵盤可分為左邊英文鍵盤和右邊數(shù)字鍵盤。本發(fā)明提出的3-5位字編碼,5位詞編碼和圖形符號編碼,1-4位詞簡碼用于右邊10個數(shù)字鍵輸入。輸入2-4位數(shù)字后,以0結(jié)束左右型漢字上屏,以1結(jié)束其它型漢字上屏,輸入1-4位數(shù)字后,以回車結(jié)束,左右型漢字打頭的二字詞上屏,以“·”結(jié)束,其它型漢字打頭的二字詞上屏,以“+”號結(jié)束,三字以上詞上屏,輸入5位數(shù)字,字、詞、圖形符號上屏。
3-5位字編碼,5位詞編碼和圖形符號編碼,1-4位詞簡碼用于左邊30個鍵輸入,基本鍵位為中排鍵,輸入中排2-4位數(shù)字后,以0結(jié)束左右型字上屏,以1結(jié)束其它型字上屏,擊滿5鍵字、圖形符號上屏。輸入中排1-4位數(shù)字,以上排鍵結(jié)束,左右型漢字打頭的二字詞上屏,以下排鍵結(jié)束,其它型漢字打頭的二字詞上屏,以空格結(jié)束三字以上詞上屏。
左右兩邊共用一套字、詞庫,可采用左中文右數(shù)字,左英文右中文,左中文右中文的輸入方式,輸入純中文和中英文混合輸入。
2.計算機小鍵盤輸入對于只有10個數(shù)字鍵,沒有英文鍵的計算機,可用3-5位字編碼,5位詞及圖形編碼輸入中文。
3.聲控輸入可用3-5位字編碼,5位詞及圖形符號編碼輸入中文,只要讀出0-9中3-5位數(shù)字的讀音,就可輸入一個漢字或詞組、圖形符號。
4.手寫輸入使用3-5位字編碼,5位詞及圖形符號編碼輸入中文,只要寫出0-9中3-5個數(shù)字,就可輸入一個漢字或詞組、圖形符號。
5.手指接觸輸入一雙電子手套,10個手指代表10個數(shù)字,一個手指按任何一物體,就可輸入一個數(shù)字,用手指按物體輸入字、詞組、圖形符號的數(shù)字編碼,就可輸入中文。
6.有線、無線電通信應用3-5位字編碼,5位詞及圖形符號編碼,實現(xiàn)有線、無線電中文傳送,可取代中國現(xiàn)行的4位數(shù)字電報碼。
7.應用3-5位數(shù)字編碼,5位詞及圖形符號編碼,作為計算機的內(nèi)碼和交換碼,使內(nèi)碼和外碼統(tǒng)一起來,可降低計算機的成本。
8.應用3-5位字編碼,5位詞及圖形符號編碼對字典、詞典、圖書資料、人名、地名、物品進行編碼排序。
圖13×10鍵盤2中文信息數(shù)字轉(zhuǎn)化表圖3漢語拼音聲母表圖4漢語拼音韻母分類表本發(fā)明的優(yōu)點1.英文鍵盤數(shù)字化,把30個英文、字符鍵盤設計成3套0-9數(shù)字鍵盤;
2.中文信息數(shù)字化,把中文音、形信息轉(zhuǎn)化為0-9數(shù)字;
3.在使用31個鍵位,一萬條常用詞的條件下,平均碼長每字1.5鍵。在使用13個鍵位,一萬條常用詞的條件下,平均碼長每字2.2鍵,字、詞均無重碼,中文輸入速度快;
4.充分利用國民知識漢語拼音和部首、筆畫,易學、易用;
5.能快速輸入圖形符號,方便地制作表格;
6.可用音形碼、形碼輸入中文,適應不同用戶的需要;
7.在同一輸入狀態(tài)下,實現(xiàn)中英文、數(shù)字混合輸入;
8.占用計算機內(nèi)存少,在無硬盤,只有512K內(nèi)存的普及型微機中都能運行本方法。
權(quán)利要求
1.一種漢字編碼方法,本發(fā)明的特征是,根據(jù)數(shù)字0-9的讀音,把漢語拼音的聲母分成10類,編碼0-9,韻母分成10類,編碼0-9,根據(jù)部首的筆畫數(shù)和使用頻率,把部首分成10類,編碼0-9,根據(jù)筆畫的讀音和字型結(jié)構(gòu),把筆畫和字型分成10類,編碼0-9。
2.根據(jù)權(quán)利要求1所述,其特征是,按照越常用的字、詞,擊鍵次數(shù)越少、擊鍵越容易,用0-9十個數(shù)字對漢字、詞組和圖形符號編碼。
3.根據(jù)權(quán)利要求2所述,其特征是,用10個數(shù)字鍵,實現(xiàn)中文輸入,擊入字、詞組、圖形符號的數(shù)字編碼,就可輸入中文。
4.根據(jù)權(quán)利要求2所述,其特征是,用10個數(shù)字鍵和3個字、詞識別鍵,實現(xiàn)中文輸入,擊入字、詞組、圖形符號的數(shù)字編碼,再擊一鍵字、詞識別鍵,就可輸入中文。
5.根據(jù)權(quán)利要求2所述,其特征是,用聲控方法輸入中文,讀入字、詞組、圖形符號的數(shù)字編碼,就可輸入中文。
6.根據(jù)權(quán)利要求2所述,其特征是,用手寫方式輸入中文,寫出字、詞組、圖形符號的數(shù)字編碼,就可輸入中文。
7.根據(jù)權(quán)利要求2所述,其特征是,用手指接觸方法輸入中文,一雙電子手套,10個手指代表10個數(shù)字,一個手指按任何一物體,即可輸入一個數(shù)字,用手指按物體輸入字、詞組、圖形符號的數(shù)字編碼,就可輸入中文。
8.根據(jù)權(quán)利要求2所述,其特征是,用字、詞組、圖形符號的數(shù)字編碼、實現(xiàn)中文信息的有線、無線電通信。
9.根據(jù)權(quán)利要求2所述,其特征是,用字、詞組、圖形符號的數(shù)字編碼、作為計算機的內(nèi)碼、交換碼,使內(nèi)碼和外碼統(tǒng)一起來,降低計算機的成本。
10.根據(jù)權(quán)利要求2所述,其特征是,用字、詞組、圖形符號的數(shù)字編碼,實現(xiàn)字典、詞典、圖書資料、人名、地名、物品的編碼排序。
11.根據(jù)權(quán)利要求1所述,其特征是,將標準英文鍵盤的30個鍵按鍵盤中部數(shù)字小、邊部數(shù)字大,組成3套0-9數(shù)字鍵。
12.根據(jù)權(quán)利要求11所述,其特征是按照越常用的字、詞,擊鍵次數(shù)越少、擊鍵越容易,用30個數(shù)字對漢字、詞組、圖形符號編碼。
13.根據(jù)權(quán)利要求12所述,其特征是,在普通計算機鍵盤上用30個數(shù)字鍵加一個空格鍵實現(xiàn)中文輸入,擊入字、詞組、圖形符號的數(shù)字編碼,就可輸入中文。
全文摘要
一種電子計算機漢字輸入方法和鍵盤設計,利用標準鍵盤可輸入國標基本字符集和擴充字符集,共2萬多個漢字和30萬條詞組。按照越常用的字,擊鍵次數(shù)越少,擊鍵越容易的原則對字、詞編碼。字、詞平均碼長1.5鍵,把漢字音、形信息轉(zhuǎn)化為數(shù)字,利用10個數(shù)字編碼,輸入或讀入、寫入1—5個數(shù)字,就可輸入一個字、詞組。字詞均無重碼。充分利用國民知識漢語拼音和部首、筆畫,易學易用。占用計算機內(nèi)存小,在無硬盤,只有512K內(nèi)存的低檔計算機上也能運行本方法。
文檔編號G06F3/023GK1072785SQ9111131
公開日1993年6月2日 申請日期1991年11月30日 優(yōu)先權(quán)日1991年11月30日
發(fā)明者肖水清 申請人:肖水清