專利名稱:音聲系列編碼法及鍵盤的制作方法
本發(fā)明涉及一種漢字輸入方法及輸入鍵盤,適用于計算機、打字機、通訊機及中文信息處理的其它領(lǐng)域。
在小鍵盤上進行中文信息處理,需要對漢字進行編碼,但不同用戶對編碼方案的要求各有不同。從漢字本身特性來看,用戶需求可分為以音為主的編碼和以形為主的編碼,音形結(jié)合碼可按所使用音、形信息的多少不同歸入上述二類。從方案的性能來看,用戶的要求可按編碼學習時間和漢字輸入速度的不同分為三種一是初學者或偶然輸入漢字的用戶,他們把方案的易學性放在第一位,對漢字的輸入速度并無苛求,編碼學習時間越少越好,通??捎谩胺帧弊鰹橛嬃繂挝?,我們把針對這些用戶的方案稱為簡易層方案。二是以輸入漢字為職業(yè)的專職操作員,他們要求漢字的平均碼長短,輸入速度高,學習時間倒是次要的,一般可用“天”做為計量單位,我們把針對這些用戶的方案稱為提高層方案。三是介于這二者之間的各類用戶,他們需要經(jīng)常輸入漢字,對編碼學習時間和漢字輸入速度都有所要求。一般地說,漢字輸入速度應(yīng)達到手寫漢字速度的程度,即20字/分左右。而編碼學習時間應(yīng)較短,可用“小時”做為計量單位,針對這些用戶的方案稱為普及層方案。
目前編碼方案已有數(shù)百種,以音為主的方案和以形為主的編碼方案都有不少,但絕大多數(shù)編碼方案屬于簡易層或提高層,屬于普及層的方案還沒查到。例如,簡易層方案有“拼音一提示”(見《電子計算機動態(tài)》,1980,7),提高層方案有“WBZX”(見《中文信息處理國際研討會論文集(2)》1983,10)。
本發(fā)明提出一種初學者或偶然用戶,專職操作員及兩者之間各類用戶都能適用的完整編碼體系。即可按簡易層、普及層、提高層分為若干彼此兼容的輸入方式以適應(yīng)不同用戶的要求,又可把各方式合為一個整體,使用戶能隨意改換、混用各種輸入方式而不引起歧義,鍵盤上不必設(shè)方式轉(zhuǎn)換鍵。由于各種輸入方式相互支持,取長補短,本發(fā)明能適應(yīng)最廣泛的用戶并且具有極高的靈活性。例如,可適用于在偶然用戶、經(jīng)常用戶、專職操作員之間上下變化的用戶。
本發(fā)明的基本構(gòu)思是把漢字編碼分為以音為主和以形為主的兩個系列,每個系列分為簡易層、普及層、提高層等,每個層次分別提供一個或多個輸入方式以適應(yīng)不同用戶,重要的是保證本系列內(nèi)各個輸入方式彼此兼容、互相支持,以形成一個完整的編碼體系。
本發(fā)明的基本構(gòu)思已在以音為主的編碼系統(tǒng)中(包括音碼、音數(shù)碼、音形碼)實現(xiàn)。
下面是本發(fā)明的具體內(nèi)容通常漢字輸入系統(tǒng)上除鍵盤外,還有屏幕顯示裝置,可用于提示。簡易層方案的基本特點是采用人機對話方式,在提示區(qū)顯示若干漢字和相應(yīng)代碼,讓用戶選擇所需漢字的對應(yīng)代碼輸入。這樣可免去或降低用戶記憶編碼的難度。而提高層方案的基本特點是盡量減少平均碼長,并做到盲打。位于兩者之間的普及層方案應(yīng)該是大多數(shù)漢字做到盲打,而少數(shù)漢字用人機對話方式。
音聲系列編碼法為不定長編碼,可分為字碼和詞組碼兩類,字碼由音碼、聲調(diào)碼、形碼、提示碼組成,下面分別說明。
1、提示碼分為二種,當出現(xiàn)在音碼中、音碼后、聲調(diào)碼后,提示漢字及對應(yīng)代碼,用戶需選擇代碼輸入所需漢字,這種提示碼稱為提示多字碼。若出現(xiàn)在形碼后,只按頻度順序換了一個同碼字,而不顯示對應(yīng)字符,這種提示碼稱為提示換字碼。在本發(fā)明中提示多字碼和提示換字碼共用一個提示鍵。提示采用循環(huán)提示,當所有需提示的漢字或代碼提示完后又回到起點重新提示,用戶要更新提示區(qū)內(nèi)容時可按一下提示鍵,故提示碼的碼長沒有限制,可為0或任意自然數(shù)。
本發(fā)明的一重要特征是利用提示碼在編碼中出現(xiàn)的位置的變化以形成不同的輸入方式。
當提示碼完全不出現(xiàn)時,為提高層輸入方式,用戶處于盲打狀態(tài)。
當提示碼出現(xiàn)在少數(shù)漢字的形碼后,為普及層輸入方式,用戶只需按規(guī)則碼輸入漢字,當少數(shù)漢字用規(guī)則碼無法區(qū)分時,系統(tǒng)響鈴或顯示告訴用戶需在形碼后加上若干提示碼,通過附加不同長度的提示碼即可區(qū)分具有相同形碼規(guī)則碼的同音調(diào)字。
當提示碼出現(xiàn)在音碼中,音碼后、聲調(diào)碼后,即構(gòu)成不同檔次的簡易層方案。
為保證各檔方式間容,按提示方式輸入漢字時,在所輸入的漢字的編碼字符中去掉提示多字碼得到的字符排列仍是該漢字的編碼。其優(yōu)點是隨著實踐的增多,用戶會自然地逐步去掉提示符,過渡到盲打的水平。
2、形碼是為了區(qū)別同音同調(diào)字提出的。編碼的基本規(guī)則是取漢字盡可能大的部件的讀音的聲母或準聲母,該部件應(yīng)包含起筆或等于起筆,起筆分為5類點、橫、撇、直、彎。形碼除用26字母表示外,還可由6個非字母字符表示,構(gòu)成32碼元以增加區(qū)分同音調(diào)字的能力和便于計算機處理。非規(guī)則碼取這6個非字母字符或規(guī)則碼不用的其它字母。形碼的碼長為1。
這樣選取形碼的優(yōu)點是規(guī)則簡便易行,而且有利于適應(yīng)漢字輸入技術(shù)的發(fā)展。由于可在計算機內(nèi)裝有按上下文自動處理重碼字的功能模塊,多字一碼的歧義問題可由計算機解決或減少,這樣就不必為減少非規(guī)則碼增添規(guī)則或增加碼長了。
3、聲調(diào)碼的基本聲調(diào)取四聲,輕聲可歸入第一聲,由于國標一二級字中同音字有超過32個的,但均少于64個,所以可另設(shè)四個聲調(diào)鍵,稱為輔助四聲鍵。對于聲調(diào)拿不準的用戶可另設(shè)一個零聲調(diào)鍵,作用只是作為漢字之間的區(qū)分符。這樣聲調(diào)碼的碼元可為1(零聲)或4(四聲)或5(四聲加零聲)或8(四聲加輔四聲)或9(四聲加輔四聲加零聲)五種。
設(shè)立聲調(diào)碼的優(yōu)點是即有助于區(qū)分同音字,又是漢字之間的區(qū)分字符。
4、音碼的表示有4種拼音字母表示法(如新華字典所示),碼長為1至6;三拼,由聲、介、韻母組成,碼長為1至3;雙拼,由聲、韻母組成,碼長為2,對于無聲母的韻母音節(jié)前面要加上拼音的首字母;簡拼,由聲、韻母構(gòu)成,碼長為1至2,韻母音節(jié)前不必加字母,每個單字母也可表示一個音節(jié)。拼音字母表示法的優(yōu)點是國家標準,不必死記,簡拼、雙拼的優(yōu)點是平均碼長短,三拼是介于它們之間的一種折衷。
為適應(yīng)最廣泛的用戶,本發(fā)明給出一種能包含上述四種音碼表示法的統(tǒng)一表達形式,融合了它們的優(yōu)點,使用戶可以分別或混合使用這些表示法,而不必用任何狀態(tài)轉(zhuǎn)換鍵。
實現(xiàn)方法是先分別把聲或韻母擴展或壓縮為26組。新華字典中音節(jié)為400多個,聲母21個,加上y、w和韻母音節(jié)的首字母a、e、o則為26個(后5個字母稱為準字母)。因為i、u、v不出現(xiàn)在拼音字母表示法的聲母中,所以可代表ch、sh、zh雙字符聲母,記憶方法是按字母順序依次對應(yīng)。韻母有近40個,根據(jù)不同聲母后接不同韻母的規(guī)律,可用一字母表示多個韻母而不會引起歧義。這樣,所有韻母都可以用26個字母或簡碼表示。這種表示法是不唯一的,但為了容易記憶,本發(fā)明采用下述方法,一是單字符韻母a、e、i、o、u、ü由字母a、e、i、o、u、v依次表示,字母o、v也用來表示多字符韻母的簡碼。二是使除a、e、i、o、u、v外的其它簡碼字母(即聲母)至少和一個所表示的多字符韻母組成拼音的合法音節(jié)。比如x代表iang或uang,xiang是拼音的合法音節(jié),該音節(jié)含有“想”等多個漢字,我們可從中選出一字作用聯(lián)想字以幫助記憶。
確認上述四種音碼表達方式混用時為哪一方式時的方法要點是根據(jù)音碼的長度及字母的不同組合。例如音碼碼長為1是簡拼,碼長為2時是雙拼,……。
5、詞組碼在一定條件下可用來加快輸入速度。本發(fā)明采用漢字的聲母或準聲母來表示詞組碼。為提高詞組碼輸入的靈活性,我們引入了替換字符和省略字符,前者可用來替換任一漢字的聲母或準聲母。后者相當于0至多個替換字符。為區(qū)分詞組碼和字碼、詞組和詞組之間的編碼,詞組碼還應(yīng)含有詞組區(qū)分符。本發(fā)明令省略字符、詞組區(qū)分符、詞組提示符合為一個字符。這樣詞組碼必須包括詞組中排在前面的漢字的聲母或準聲母或替換字符。而對應(yīng)后面漢字的字符可以省略。例如若用“;”表示詞組區(qū)分符,則“北京大學”不能用“bd;”表示,而需用“b;”或“bj;”或“bjd;”或“bjdx;”表示。共用同一詞組碼的多個詞組需后面加數(shù)字或詞組提示符加以區(qū)分,在這種情況下,系統(tǒng)響鈴并顯示數(shù)字及對應(yīng)詞組。詞組的排序按詞長和頻度排序。具有最少漢字數(shù)中的最常用的詞組不用后加數(shù)字。
本發(fā)明的詞組表示法的優(yōu)點是詞組碼定義規(guī)范,不必死記,替換字符和省略字符的引入使詞組的檢索和輸入極為靈活方便,且在一定條件下,可使去鍵數(shù)少于詞組含有的漢字數(shù)。
本發(fā)明的主要優(yōu)點可概括為可包含以音為主的編碼(音碼、音數(shù)碼、音形碼)中各種編碼方案的功能,融合它們的優(yōu)點,能適應(yīng)最廣泛的用戶,為他們提供極大的方便和高度的靈活性,并有助于初學者和其它用戶順利過渡到專職操作員的漢字輸入水平。
下面是本發(fā)明的最佳實施例。
附圖是適用于各種輸入方式的一種鍵盤盤面的示意圖,盤面上同一鍵位上單字母(即簡碼)和其它字母串(即聲、韻母)可互相代替,為能用于標準小鍵盤和便于用戶記憶,除聲母ch、sh、zh用i、u、v依次表示外,并注意到iu=iou,un=uen,uei=ui,v=ü,uan=üan,ue=üe,則其余簡碼與字母串的對應(yīng)關(guān)系用下列四句口訣表示。其中,雙韻母對應(yīng)一字母的復(fù)詞形式,后一韻母前加一連字符“-”表示;句中漢字稱為聯(lián)想字,字母JKQV(讀做街克秋威)和英文字母JKQV讀音相似,稱為聯(lián)想字母。
白 雕 芳 草 屯 云 灣,bai diao fang cao tun -ün wan平 民 耕 作 溶 涌 漣。
ping min geng zuo rong -iong lian“J K Q V”O(jiān) 蛙 吼,jie kei qiu -uei o -ua hou想 望 月 外 嫩 牙 酸。
xiang -uang yue -uai nen -ia suan由混用原則可知用戶可記住上述口訣使用全部簡碼,也可只記住口訣中若干聯(lián)想字或聯(lián)想字母使用部分簡碼,還可不用簡碼。此外,簡碼還代表所對應(yīng)的第一個韻母的讀音。例如x對應(yīng)的第一個韻母為iang,讀音為yang,則x可表示yang的簡拼形式。
下面給出音碼四種表示法的例子“昂”的字母形式為ang,雙拼為af,簡拼和三拼為f。
“香”的字母形式為xiang,三拼為xif,雙拼和簡拼為xx。
“楊”的字母形式為yang,三拼和雙拼為yf,簡拼為x。
聲調(diào)碼的四聲選數(shù)字1,2,3,4表示。另外,對少數(shù)幾個超過32個同音調(diào)字的音調(diào)節(jié),增設(shè)5、6、7、8作為輔四聲以表示少數(shù)幾個罕見字。數(shù)字O表示空聲調(diào)。
形碼用26個字母和數(shù)字1至6表示,起筆點、橫、撇、直、彎的代碼為d、h、p、v(zh)、w。例如繁的形碼為m(敏),告為p(撇),意為y(音),譯為6(非規(guī)則碼)或y(規(guī)則碼,當機器具有根據(jù)上下文選字的功能時不需附加提示換字碼,沒有該功能時,還應(yīng)附加提示換字碼以便和“意”區(qū)分)。
提示碼用/表示,下面以輸入漢字“堡”為例結(jié)合一些輸入方式說明/的使用1、拼音提示方式。用戶輸入bao/或bc/,提示區(qū)顯示“1c苞 1y胞 1p包……”,若沒見堡字,用戶還須輸入/,直到“…3t堡…”出現(xiàn),用戶輸入3t即可。
2、音調(diào)提示方式。用戶輸入bao3/或bc3/,提示區(qū)顯示“r保 t堡…”,用戶輸入t即可。
3、音聲碼方式。(1)用戶按規(guī)則碼輸入bao3b或bc3b,則提示區(qū)顯示“寶”,并響鈴?fù)ㄖ脩暨€有同音調(diào)形字,用戶再輸入/,這時提示區(qū)顯示“堡”,輸入完畢。(2)用戶按形碼非規(guī)則碼直接輸入bao3t或bc3t。
4、首字母提示方式。用戶輸入b/,提示區(qū)顯示“1埃 a芭 b白 w班 c苞…”用戶輸入c,以后可按前三種方式輸入。
首字母方式提示單字符簡拼和雙拼表達式中以該字母為首音節(jié)的韻母簡碼及代表漢字,可幫助用戶熟悉拼音或簡碼的表達形式。
上述四種方式中有的提示符/還可以省略。例如由系統(tǒng)判斷鍵盤是否有輸入字符,無則提示,有則處理該字符。
權(quán)利要求
1.一種漢字輸入方法,具有基于小鍵盤或小鍵盤和提示屏幕的若干種編碼輸入方式,其特征在于即可按簡易層、普及層、提高層分為若干彼此兼容的輸入方式,以便適用于初學者或偶然用戶、專職操作員以及兩者之間的各類用戶,又可把各方式合為一體,使用戶能夠隨意改換、混用各輸入方式而不產(chǎn)生歧義。
2.根據(jù)權(quán)利要求
1所述的漢字輸入方法,其特征在于漢字編碼分為以音為主和以形為主的兩個系列,以音為主的編碼由字碼和詞組碼構(gòu)成,字碼由音碼、聲調(diào)碼、形碼和提示碼組成,音碼碼長為1至6字母,聲調(diào)碼碼長為1字符,形碼碼長為1字符,提示碼碼長為0至多個字符。
3.根據(jù)權(quán)利要求
2所述的漢字輸入方法,其特征在于聲調(diào)碼碼元在為國標一級字編碼時至少為4,為國標一二級字編碼時至少為8。
4.根據(jù)權(quán)利要求
2所述的漢字輸入方法,其特征在于漢字的編碼順序為音碼、聲調(diào)碼和形碼,提示碼在編碼中的位置和作用可變,若出現(xiàn)在音碼中或音碼后或聲調(diào)碼后,則為提示多字碼,若出現(xiàn)在形碼后,則為提示換字碼。
5.根據(jù)權(quán)利要求
1或2或4所述的漢字輸入方法,其特征在于按提示方式輸入漢字時,在所輸入的字符中去掉提示多字碼后得到的字符排列仍是該漢字的編碼。
6.根據(jù)權(quán)利要求
1或2或4所述的漢字輸入方法,其特征在于形碼的規(guī)則碼取漢字盡可能大的部件的讀音的聲母或準聲母,該部件應(yīng)包含起筆或等于起筆,用音碼、聲調(diào)碼、形碼規(guī)則碼和提示換字碼組成的編碼至少可輸入國標一級字中的所有漢字。
7.根據(jù)權(quán)利要求
1或2所述的漢字輸入方法,其特征在于詞組碼由漢字的聲母或準聲母,替換字符,區(qū)分字符和數(shù)字組成,省略字符和區(qū)分字符以及詞組提示字符為同一字符,替換字符或數(shù)字的碼長可以為0,詞組碼中的聲母或準聲母和替換字符依次對應(yīng)著詞組從頭往后排列的漢字。
8.一種適于上述漢字輸入方法的鍵盤,其特征在于可同時適用于拼音字母、三拼、雙拼和簡拼的輸入方式以及它們的混用方式,漢字的雙字符聲母和多字符韻母均可與它們所對應(yīng)的簡碼字母相互代替、任意混用而不產(chǎn)生歧義。
9.根據(jù)權(quán)利要求
8所述的鍵盤,其特征是漢字的聲母ch、sh、zh的簡碼依次為i、u、v,單字符韻母a、e、i、o、u、ü由字母a、e、i、o、u、v依次表示,o、v也用做多字符韻母的簡碼。
10.根據(jù)權(quán)利要求
8所述的鍵盤,其特征是多字符韻母的簡碼為除a、e、i、o、u、v的其它字母時,其簡碼字母至少和一個所表示的多字符韻母組成拼音的合法音節(jié),并可在新華字典中至少找到一個屬于該音節(jié)的聯(lián)想字。
專利摘要
音聲系列編碼法及鍵盤。音聲系列編碼是一個包含簡易層、普及層、提高層多種輸入方式的上下全兼容漢字編碼體系,具有音碼、音數(shù)碼、音形碼諸方案的各種優(yōu)點,可同時滿足從初學者到專職操作員以及處于兩者之間各類用戶的不同需要。各種輸入方式(包括目前易學性最好的方式以及快速輸入的簡碼、詞組碼方式)互相支持,可任意混用。采用口訣或聯(lián)想字使簡碼易于記憶,允許拼音、三拼、雙拼、簡拼的獨立使用或混用。鍵盤上不設(shè)方式轉(zhuǎn)換鍵。
文檔編號G06F3/023GK87106019SQ87106019
公開日1988年6月1日 申請日期1987年8月28日
發(fā)明者王曉龍 申請人:王曉龍導出引文BiBTeX, EndNote, RefMan