專利名稱:詞字二元編碼輸入漢字系統(tǒng)及鍵盤的制作方法
詞字二元編碼輸入漢字系統(tǒng)屬于電腦中文信息處理技術(shù)領(lǐng)域:
,鍵盤是實(shí)施該技術(shù)的專用設(shè)備。
當(dāng)今世界,已進(jìn)入一個(gè)信息化迅速發(fā)展的時(shí)代,信息工程成為現(xiàn)代科學(xué)的三大支柱之一。根據(jù)我國國情,在紛繁浩瀚的信息中,主要是中文信息。我們要進(jìn)行四個(gè)現(xiàn)代化建設(shè),要實(shí)現(xiàn)辦公室自動(dòng)化、印刷排版現(xiàn)代化、圖書情報(bào)檢索自動(dòng)化、生產(chǎn)和企業(yè)管理現(xiàn)代化,無不涉及中文信息。因而,解決中文信息處理技術(shù)問題已成為當(dāng)務(wù)之急。
所謂中文信息處理,應(yīng)當(dāng)包括我國各民族的語言信息處理。不過,在各民族語言中,應(yīng)用最廣泛的是漢語,所以這里所謂中文信息處理主要是指漢語信息處理,更確切些講主要是漢字信息處理。
由于漢字?jǐn)?shù)量繁多,結(jié)構(gòu)復(fù)雜,所以在漢字信息處理技術(shù)中,關(guān)鍵是漢字的輸入技術(shù)問題。將漢字輸入到計(jì)算機(jī)(或稱電腦)有三種方式。即語音識別。圖形識別和鍵盤三種輸入方式。根據(jù)目前情況,語音識別和圖形識別輸入僅處于試驗(yàn)研制階段,還談不上推廣應(yīng)用,主要靠鍵盤方式輸入。鍵盤雖有大、中、小三種型號,由于大鍵盤和中鍵盤設(shè)備大,投資多,所以也不便于推廣。于是,目前解決漢字輸入的途徑,主要就靠小鍵盤編碼輸入這條狹窄的通道了。近年來國內(nèi)外不言而喻地把“瓶頸”約定為“漢字編碼”的代名詞,形象而確切地說明了漢字編碼在漢字信息處理技術(shù)中的重要地位和作用。
關(guān)于漢字編碼學(xué)術(shù)研究,我國起步較遲,但發(fā)展迅速。近幾年來已經(jīng)研制出400多個(gè)方案,上機(jī)運(yùn)行的已有50多種。影響較大的有河南省計(jì)算中心王永民工程師發(fā)明的“五筆字型”方案;北京師大李金鎧講師發(fā)明的“筆形編碼法”;上海工業(yè)大學(xué)錢偉長教授主持研制的“宏觀字形”方案和北京水電部科研所李慧勤工程師發(fā)明的“HPX漢字拼形”方案。其中,“五筆字型”方案的主要技術(shù)指標(biāo)平均碼長L=2.8鍵/字;輸入速度Sj=130字/分。其輸入速度要比外文輸入還快,鑒定會(huì)上專家一致認(rèn)為已經(jīng)達(dá)到了國際先進(jìn)水平。但是,也還有不足之處,那就是這一方案不容易掌握,而且掌握后過一段又容易回生。
本發(fā)明的目的是搞出一個(gè)大眾易于接受、好學(xué)易記、平均碼長鍵數(shù)少、輸入速度快而且準(zhǔn)確的漢字鍵盤編碼輸入方案。
本發(fā)明的目的是這樣達(dá)到的提出一種采用詞和字兩種碼元編碼,由兩種輸入法構(gòu)成的電腦中文信息處理漢字系統(tǒng)以及為實(shí)現(xiàn)該系統(tǒng)而設(shè)計(jì)的以聲代形、聲形兼容、便于聯(lián)想的二元輸入鍵盤。
該系統(tǒng)具體是這樣構(gòu)成的使用GB2312-80區(qū)位碼和GB1988-80國際碼作機(jī)內(nèi)信息交換碼,由開發(fā)的詞字二元聲形編碼輸入法(簡稱“CZ-Ⅲ)和字元形聲編碼輸入法(簡稱“字元”)兩種輸入法構(gòu)成一個(gè)完整的自成體系的漢字鍵盤編碼輸入系統(tǒng),具體結(jié)構(gòu)見圖1,其有關(guān)程序連接見圖2。
漢字編碼的難點(diǎn)之一是對字元(亦稱字根或部件)的記憶。以前眾多方案均采用硬性定義,缺乏內(nèi)在的聯(lián)系,其機(jī)械記憶量很大。為了減輕對字元的機(jī)械記憶量,本發(fā)明的鍵盤是采用如下方法設(shè)計(jì)的
1.將有獨(dú)立名稱的基本字元,按照聲母定義圖(即圖3)定義在其名稱第一音節(jié)聲母所在的鍵位上;
2.將沒有獨(dú)立名稱的基本字元,先給它定義一個(gè)便于聯(lián)想的名稱,然后按照字元名稱聯(lián)想圖(即圖4)定義在聯(lián)想名稱第一音節(jié)聲母所在的鍵位上;
3.為了減少一些字母的信息量,將某些有傳統(tǒng)名稱的基本字元例如“雨”(雨字頭兒)、“門”(門字框兒)等重新定義為“雨”(靄字頭兒)、“門”(問字框兒),然后分別定義在“A”和“W”鍵上;
4.將基本字元以外的非成字字元(如“
)按照起筆筆形代碼定義圖(即圖5),定義在其起筆筆形代碼(“I”)鍵上。
從而構(gòu)成了以聲代形、聲形兼容、便于聯(lián)想的二元輸入鍵盤,即圖6。
關(guān)于漢字的結(jié)構(gòu)類型,是漢字編碼的難點(diǎn)之二?!拔骞P字型”方案把漢字的結(jié)構(gòu)拓樸圖形歸納為四種字型。漢字結(jié)構(gòu)如此之復(fù)雜,結(jié)構(gòu)類型歸納得越少,每一類所包孕的實(shí)用字型就越多,應(yīng)用起來就越困難。本發(fā)明適中地歸納為十類,每一類又包孕幾種,計(jì)21種模圖,每種模圖接部位結(jié)構(gòu)區(qū)域標(biāo)了順序號(即圖7)。本系統(tǒng)的兩種輸入法,對于單字的編碼,形碼都是按結(jié)構(gòu)部位取碼,每一部位限取一碼,且規(guī)定首、次部位取碼從高從左,末一部位(包括二字元單字)取碼從低從右。
在輸入程式方面,本系統(tǒng)采用引導(dǎo)輸入。所謂引導(dǎo)輸入,就是擊引導(dǎo)碼后,僅在提示行先顯示同碼的字或詞,再擊選擇碼,才完成輸入。對于單字的引導(dǎo),已是“拼音”、“筆形”多種輸入法早已應(yīng)用的技術(shù),本系統(tǒng)的特征是字詞都是引導(dǎo)輸入。引導(dǎo)碼用字母鍵實(shí)現(xiàn),選擇碼用數(shù)字鍵實(shí)現(xiàn)。其中“O”用“空格”鍵實(shí)現(xiàn)。引導(dǎo)出來的同碼詞按降頻排列,同碼單字按起筆筆形數(shù)字代碼排列。也就是說選擇碼既是單字碼的結(jié)束符,又按起筆筆形代碼定義圖(圖7)代表筆形信息。
漢字編碼的最大難點(diǎn)在于編碼原理,要研制出一種大眾易于接受的編碼原理,需要從大眾約定俗成的描述漢語字詞的程式中去汲取。我們欣慰地看到火車上印有“YZ”的車廂,即“硬座”車廂;印有“RZ”的車廂即“軟座”車廂;印有“RW”的車廂即“軟臥”車廂;印有“XL”的車廂即“行李”車廂。河北石家莊生產(chǎn)的客車上印有“HB”即代表“河北”。國家標(biāo)準(zhǔn)書籍封面上印有“GB”即代表“國標(biāo)”;河北電視臺用“HBXW”表示“河北新聞”。從上述這些例子中悟出一條詞組編碼的規(guī)則,叫做“詞組聲序編碼法”,就是把詞組各音節(jié)的聲母順序排列編碼即是人民大眾易于接受的可讀性很強(qiáng)的最佳詞組編碼。
對于一些較長的機(jī)關(guān)名稱,大眾也有一條約定俗成的簡略規(guī)則,例如國務(wù)院“電子振興辦公室”,簡稱為“電振辦”?!柏?cái)務(wù)會(huì)計(jì)”簡稱為“財(cái)會(huì)”?!拔逯v四美三熱愛”簡稱為“五四三”;“中文秘書專業(yè)”簡稱為“中秘專業(yè)”;“企業(yè)管理專業(yè)”簡稱為“企管專業(yè)”等等。從這些例子中我們又悟出一條詞組簡略規(guī)則,叫做“詞組聲序省略編碼法”。也就是把詞組一部分音節(jié)的聲母省略后,再順序編碼。
上述約定俗成的規(guī)律,成為本發(fā)明的理論依據(jù)。本發(fā)明關(guān)于詞和字輸入的切換,不用功能鍵,而直接用引導(dǎo)碼的位數(shù)控制一位碼或三位碼為單字,二位碼與四位碼為詞組。編碼規(guī)則如下
一、詞組編碼規(guī)則1.二位編碼對于二音節(jié)高頻詞,用二位字母編碼。第一位字母為第一音節(jié)的聲母(或零聲母音節(jié)的第一字母,以下同)。第二位字母為第二音節(jié)的聲母。每一組引導(dǎo)碼,可以引導(dǎo)10組二音節(jié)同聲序詞組。被引導(dǎo)出來的同聲序詞組按降頻排列。用對應(yīng)的數(shù)字鍵選擇輸入。包括選擇鍵在內(nèi)這類詞組平均碼長為1.5鍵/字。例如
(注在屏幕上顯示的引導(dǎo)碼是小寫字母,被引導(dǎo)的二音節(jié)詞組等于小于10組)。
2.四位編碼2.1二音節(jié)一般詞組的編碼二音節(jié)一般詞組用兩個(gè)音節(jié)的聲母再加上兩個(gè)音節(jié)的首字元代碼四位字母順序編碼作引導(dǎo)碼。這樣,先擊兩音節(jié)的聲母,引導(dǎo)出二音節(jié)高頻詞組。如果其中沒有所要輸入的詞組,接著擊兩個(gè)音節(jié)的首字元代碼,即出現(xiàn)一般二音節(jié)詞組,平均碼長2鍵/字。例如引導(dǎo)碼 被引導(dǎo)的詞組i g 0中國 1這個(gè) 2照顧 3中共 5直觀6主管 7壯觀 8正規(guī) 9珍貴igdu 0主觀
2.2、三音節(jié)詞組的編碼三音節(jié)詞組用一、二、三音節(jié)的聲母加上一個(gè)字母“O”補(bǔ)足四位,順序編碼。因?yàn)橛谩癘”作聲母的字不多,將它用在編碼尾部,既使它符合詞組碼型,又是“三音節(jié)詞組”的標(biāo)識符。平均碼長1.33鍵/字。例如引導(dǎo)碼 被引導(dǎo)的詞組g u d o O 共產(chǎn)黨g M d o O 國民黨V u l O O 生產(chǎn)率1生產(chǎn)力┆ ┆ ┆ ┆第節(jié)第節(jié)第節(jié)補(bǔ)一聲二聲三聲加音母音母音母“O”(注引導(dǎo)碼如果滿足四位并且無同聲序詞組,則不用擊選擇鍵自動(dòng)“跳”上屏幕,完成輸入。)2.3、四音節(jié)詞組的編碼四音節(jié)詞組用各音節(jié)的聲母順序編碼。平均碼長1鍵/字。例如引導(dǎo)碼 被引導(dǎo)的詞組i g r m O 中國人民J v w m O 精神文明1舉世聞名┆ ┆ ┆ ┆第節(jié)第節(jié)第節(jié)第節(jié)一聲二聲三聲四聲音母音母音母音母2.4、五音節(jié)詞組的編碼五音節(jié)以上詞組由于其音節(jié)數(shù)超過了規(guī)定的詞組碼型位數(shù),故采用“詞組音序省略編碼法”,省去第二音節(jié)的聲母,用一、三、四、五音節(jié)的聲母順序編碼。平均碼長0.8鍵/字。例如引導(dǎo)碼 被引導(dǎo)的詞組i g u d O 中國共產(chǎn)黨w m f w O 為人民服務(wù)
s x d h O 四個(gè)現(xiàn)代化┆ ┆ ┆ ┆第節(jié) 第節(jié) 第節(jié) 第節(jié)一聲 三聲 四聲 五聲音母 音母 音母 音母2.5、六音節(jié)詞組的編碼六音節(jié)詞組省去二.四音節(jié)的聲母,用一、三、五、六音節(jié)的聲母順序編碼作引導(dǎo)碼。平均碼長0.67鍵/字。例如引導(dǎo)碼 被引導(dǎo)的詞組i r y h O 中國人民銀行i n y h O 中國農(nóng)業(yè)銀行i g y h O 中國銀行 1中國工商銀行┆ ┆ ┆ ┆第節(jié) 第節(jié) 第節(jié) 第節(jié)一聲 三聲 五聲 六聲音母 音母 音母 音母2.6、七音節(jié)詞組的編碼七音節(jié)詞組省去二.四.六音節(jié)的聲母,用一、三、五、七音節(jié)的聲母順序編碼作引導(dǎo)碼,平均碼長0.57鍵/行。例如引導(dǎo)碼 被引導(dǎo)的詞組i r g g O 中華人民共和國i r j j O 中國人民解放軍w s c a O 五講四美三熱愛┆ ┆ ┆ ┆第節(jié) 第節(jié) 第節(jié) 第節(jié)一聲 三聲 五聲 七聲音母 音母 音母 音母2.7、多音節(jié)詞組的編碼七音節(jié)以上詞組為多音節(jié)詞組,對于多音節(jié)詞組一律用一、三、五、末音節(jié)的聲母編碼,其平均碼長小于0.5鍵/字。例如
引導(dǎo)碼 被引導(dǎo)詞組i i x h O 中國中文信息研究會(huì)i g i t O 中國共產(chǎn)主義青年團(tuán)i g m h O 中國國際貿(mào)易促進(jìn)委員會(huì)關(guān)于詞組聲形編碼詳見圖8。
二.單字編碼本發(fā)明對于單字的編碼原理,也是汲取人民大眾約定俗成的描述單字的程式制定的。比如當(dāng)人們描述姓張的“張”字,其程式為“弓-長-張”;當(dāng)描述合格的“合”字,其程式為“人-一-口-合”。根據(jù)這樣的程式,本發(fā)明開發(fā)了兩種編碼法。一種是從聲開始,加上字的字形信息編碼,叫做“聲形編碼法”;另一種是從形開始,用各部位的字形信息編碼,字形不足三位者以本字的聲母補(bǔ)齊,叫做“形聲編碼法”。
1、聲形編碼法聲形編碼法的基本程式為“本字聲母-首字元代碼-尾字元代碼”。具體分為兩檔1.1、高頻字應(yīng)用頻度高的單字稱為高頻字。對于高頻字,僅用“本字”的聲母一位碼作引導(dǎo)碼。每一引導(dǎo)碼可引導(dǎo)出10個(gè)高頻字。不過,其中用字母“O”引導(dǎo)的不是高頻字,而是10個(gè)較常用的標(biāo)點(diǎn)符號。同碼高頻字按其起筆筆形數(shù)字代碼排列,同時(shí)用其代碼作選擇碼,此類單字,平均碼長為2鍵/字。例如引導(dǎo)碼 被引導(dǎo)單字i 0這 1正 2占 3重 4趙 5中 6只 7張 8著 9掌b 0被 1不 2北 3白 4邊 5捌 6吧 7比 8八 9半
1.2、一般獨(dú)體字對于一般獨(dú)體字用“本字”聲母,字首筆形代碼和字尾筆形代碼三位編碼作引導(dǎo)碼。加上選擇碼,平均碼長4鍵/字。例如引導(dǎo)碼 被引導(dǎo)的單字b p X 3秉u t o 5成┆ ┆ ┆ ┆本聲 字形 字形 選字 首代 尾代 擇的母 筆碼 筆碼 碼1.3、一般合體字對于一般合體字用“本字”的聲母。首字元代碼。尾字元代碼三位編碼作引導(dǎo)碼,用字首筆形代碼作選擇碼。平均碼長4鍵/字。例如引導(dǎo)碼 被引導(dǎo)的單字v v g 4聲x k c 1形┆ ┆ ┆ ┆本聲 首代 尾代 ┆字 字 字的母 元碼 元碼 選擇碼關(guān)于單字的聲形編碼,詳見圖8。
2、形聲編碼法形聲編碼法從漢字的字形信息開始,選取各結(jié)構(gòu)部位的字形代碼,不足三位者加上“本字”的聲母,補(bǔ)足三位。具體分三檔。
2.1 高頻字這里所說的高頻字是從形分析應(yīng)用頻度較高的字。對于高頻字僅用首字元代碼(獨(dú)體字僅用字首筆形代碼)作引導(dǎo)碼。也用字首筆形代碼選擇,平均碼長2鍵/字,例如
引導(dǎo)碼 被引導(dǎo)的單字b 3的t 5中o 6國┆ ┆首字元代碼 字首筆形代碼(對應(yīng)的數(shù)字碼)2.2 次高頻字對于次高頻字用第一、二兩個(gè)字元的代碼(或獨(dú)體字字首和字尾筆形的代碼)作引導(dǎo)碼,用字首筆形代碼作選擇碼。例如引導(dǎo)碼 被引導(dǎo)的單字n z 4好h h 3秋t x 5朱┆ ┆ ┆首代 次代 對數(shù)字 字 應(yīng)字元碼 元碼 的鍵2.3、一般二字元合體字對于一般二字元合體字,用兩個(gè)字元代碼再加上“本字”的聲母編碼作引導(dǎo)碼,用字首筆形代碼選擇。平均碼長4鍵/字。例如引導(dǎo)碼 被引導(dǎo)的單字n v x 4 姓x v x 9 性┆ ┆ ┆首代 尾代 本 對數(shù)字 字 字聲 應(yīng)字元碼 元碼 母的鍵2.4、一般多字元合體字三字元以上稱為多字元合體字。對于多字元合體字,根據(jù)漢字結(jié)構(gòu)模圖(圖7)所標(biāo)部位,從每一部位各取一字元代碼。前兩個(gè)部位取碼從高從左,最后一個(gè)部位取碼從低從右。例如引導(dǎo)碼 被引導(dǎo)的合體字l k e 0部m n f 9數(shù)r f x 3繁關(guān)于單字形聲編碼詳見圖9。
三.模糊輸入法對于上述兩種輸入法,系統(tǒng)軟件支持,都可采用“模糊輸入”。所謂“模糊”,即對某些信息搞不清楚。本系統(tǒng)設(shè)計(jì)的“模糊輸入”必須知道第一位碼,即“本字”聲母或首字元代碼。如果知道“本字”聲母,就采用聲形模糊輸入;如果知道首字元代碼就采用形聲模糊輸入。各有三種模糊形式。
1.聲形模糊輸入形式聲=VVG(正常聲形編碼)聲=V?G(第二位碼模糊)聲=VV?(第三位碼模糊)聲=V??(第二.三位碼模糊)2.形聲模糊輸入形式形=KCX(正常形編碼)形=K?X(對第二位碼模糊)形=KC?(對第三位碼模糊)形=K??(對第二.三位碼模糊)
四.重碼處理本系統(tǒng)開發(fā)的兩種輸入法,都有重碼,雖然重碼率不高,但總得處理。系統(tǒng)軟件支持,擊選擇碼后,如果有重碼,不輸入,而是按頻度在提示窗再次顯示,并報(bào)警。再擊選擇鍵,才完成輸入。
綜合上述四種輸入法,構(gòu)成一個(gè)獨(dú)具特色的完整的漢字輸入系統(tǒng)。參照系統(tǒng)操作流程圖(即圖10)可完成綜合應(yīng)用。在輸入過程中,如果認(rèn)識所要輸入的字或詞,就采用“二元”輸入;如果不認(rèn)識所要輸入的字,則可改用“字元”輸入;倘若對兩種輸入法中某些信息有模糊,只要知道“本字”的聲母或者首字元代碼,即可用“模糊輸入法”輸入。下面結(jié)合十二屆六中全會(huì)公報(bào)結(jié)尾一段文字,進(jìn)行編碼模擬試驗(yàn)。
原文新華社 北京 九 月 二 十二元 編碼 XHVOBJOJ4Y7E1V4八 日 訊 中國共產(chǎn)黨第 十 二 屆 中央委B8R6YZUOI GUDD8V4E1VYJ7I W員會(huì)第 六 次 全體 會(huì)議 公報(bào) 指出YHD8L0LQCOQT2HY3GB7IUO全會(huì) 號召 全黨 全軍 和 全國 各族 人民“QH4HI1QD7QJRPH3QG0GZ6RM,認(rèn)真 學(xué)習(xí) 和 貫徹 落實(shí) 《中共中央關(guān)于 社會(huì)O,RI0XX0H3GU4LV5《IGIYGYOVH
主義 精神文明 建設(shè) 指導(dǎo) 方針 的 決議 》 堅(jiān)IYJVWMOJVUYID1FI1D3JYLY》,J持 社會(huì)主義 物質(zhì)文明 和 精神文明 建設(shè) 一起 抓U1.VHIYWIWMH3JVWM0JVUYAQ1VII,以 現(xiàn)代化 建設(shè) 和 全面 改革 的 優(yōu)異I5,Y2XDH0JVUYH3QM1GG0D3YY8成績 迎接 黨 的 第 十 三 次 全國UJI,YJ6DKE0D3D8V4C1LQC0QG0代表 大會(huì) 的 召開?!盌B0DH0D3IK1。”以上計(jì)137字,其中五音節(jié)詞組出現(xiàn)兩次,四音節(jié)詞組出現(xiàn)六次,三音節(jié)詞組出現(xiàn)兩次,二音節(jié)詞組出現(xiàn)三十三次,高頻單字出現(xiàn)二十次,一般單字僅出現(xiàn)六次。充分體現(xiàn)了以詞組輸入為主。包括選擇鍵在內(nèi),共用219鍵,平均碼長為1.6鍵/字。較系統(tǒng)平均碼長2.3鍵/字要低一些。
該系統(tǒng)適用于各種型號的電字計(jì)算機(jī).智能中英文打字機(jī)、電傳打字機(jī).漢字終端和電視、電影制作使用的電子字幕機(jī)。
本發(fā)明與現(xiàn)有技術(shù)相比,具有以下優(yōu)點(diǎn)1、采用以聲代形,聲形兼容和聯(lián)想的方法設(shè)計(jì)的詞字二元編碼輸入鍵盤,便于聯(lián)想,減輕了對字元的機(jī)械記憶量。
2、采用人民大眾約定俗成的描述漢語字詞的程式編碼,易于接受,好學(xué)易記。
3、采用以詞組編碼輸入為主,單字編碼輸入為輔,二元輸入,兩條腿走路的措施,使平均碼長達(dá)到L=2.3鍵/字,使輸入速度達(dá)到Sj=150字/分。
4、采用引導(dǎo)輸入,用字首筆形代碼作選擇鍵,既是單字的結(jié)束符,又代表筆形信息。專業(yè)操作員可按規(guī)律盲打,一般操作員可依靠引導(dǎo)擊鍵選擇輸入,兼顧普及與提高,一舉兩得。
5、本發(fā)明的新穎性在于所提出的詞字二元編碼理論是國內(nèi)外第一次提出,填補(bǔ)了中外中文信息處理研究詞字二元編碼輸入這項(xiàng)空白;其創(chuàng)造性在于詞字二元輸入的切換應(yīng)用特定的字詞引導(dǎo)碼型控制一位或三位為單字。二位或四位為詞組;其實(shí)用性在于以詞組編碼輸入為主的措施符合現(xiàn)代漢語語言應(yīng)用實(shí)際。
本系統(tǒng)的缺點(diǎn)是占用內(nèi)存多,約占300K。所以,實(shí)現(xiàn)本發(fā)明的最好方式是制作漢卡,那樣可騰出更多的內(nèi)存運(yùn)行其它軟件,使系統(tǒng)發(fā)揮漢字處理的特殊效益。
圖1-系統(tǒng)結(jié)構(gòu)框圖圖2-系統(tǒng)有關(guān)程序連接圖KD-鍵盤輸入驅(qū)動(dòng)程序CIP1-區(qū)位碼輸入程序CIP2-國標(biāo)碼輸入程序CIP3-字元碼輸入程序CIP4-CZ-Ⅱ碼輸入程序TE-編輯程序DD-顯示驅(qū)動(dòng)程序圖3-聲母定義圖圖4-字元名稱聯(lián)想圖圖5-筆形代碼圖圖6-二元輸入鍵盤圖圖7-漢字部位結(jié)構(gòu)模圖圖8-詞字二元聲形編碼-覽表圖9-字元形聲編碼一覽表圖10-系統(tǒng)操作流程圖④文件名稱 頁 行 補(bǔ)正前 補(bǔ)正后說明書 2 17 (簡稱“CZ-Ⅱ) (簡稱“CZ-Ⅱ”)7 19 0.57鍵/行 0.57鍵/字13 7 成績 成績8 UJI UJ113 16 電字計(jì)算機(jī) 電子計(jì)算機(jī)
權(quán)利要求
1.一種電腦漢字系統(tǒng)及其鍵盤,其特征在于采用詞字兩種碼元編碼輸入法構(gòu)成的電腦中文信息處理漢字系統(tǒng)和為實(shí)現(xiàn)該系統(tǒng)而設(shè)計(jì)的以聲代形,聲形兼容的二元輸入鍵盤。
2.根據(jù)權(quán)利要求
1所述的漢字系統(tǒng),其特征在于應(yīng)用GB2312-80區(qū)位碼和GB1988-80國標(biāo)碼作機(jī)內(nèi)信息交換碼,由開發(fā)的詞字二元聲形編碼輸入法(簡稱“二元”)和字元形聲編碼輸入法(簡稱“字元”)兩種輸入法構(gòu)成的完整的漢字系統(tǒng),其軟件結(jié)構(gòu)見圖1,其有關(guān)程序連接見圖2。
3.根據(jù)權(quán)利要求
1所述的漢字系統(tǒng)及其鍵盤,其特征在于將有獨(dú)立名稱的基本字元按照聲母定義圖(即圖3),將沒有獨(dú)立名稱的基本字元按照字元名稱聯(lián)想圖(即圖4),將基本字元以外的非成字字元按照起筆筆形式代碼定義圖(即圖5),應(yīng)用以聲代形和聯(lián)想的方法,分別定義在26個(gè)鍵上,構(gòu)成一個(gè)實(shí)現(xiàn)詞字二元編碼輸入漢字系統(tǒng)方案的二元輸入鍵盤,即圖6。
4.根據(jù)權(quán)利要求
1或2所述的漢字系統(tǒng),其特征在于將漢字按照部位結(jié)構(gòu)歸納為十類模圖并標(biāo)注了部位順序號(即圖7),本系統(tǒng)的兩種編碼法都是按照部位結(jié)構(gòu)取碼,每一結(jié)構(gòu)部位限取一位字元,前兩個(gè)部位取碼從高從左,末尾部尾取碼從低從右。
5.根據(jù)權(quán)利要求
1或2所述的漢字系統(tǒng),其特征在于詞字二元輸入的切換由引導(dǎo)碼的位數(shù)控制,引導(dǎo)碼是二位或四位為詞組,采用以詞組編碼輸入為主,單字編碼輸入為輔的二元輸入。
6.根據(jù)權(quán)利要求
1或2所述的漢字系統(tǒng),其特征在于采用引導(dǎo)輸入,擊引導(dǎo)碼后,在提示行顯示同碼字詞,擊選擇碼后,才完成輸入,引導(dǎo)碼用字母鍵實(shí)現(xiàn),選擇碼用數(shù)字鍵實(shí)現(xiàn),其中,“O”用“空格”鍵實(shí)現(xiàn),同碼單字和同聲序詞組按降頻提示,在單字輸入中,選擇碼即是結(jié)束符。
7.根據(jù)權(quán)利要求
1或2所述的漢字系統(tǒng),其特征在于詞字二元聲形編碼輸入法對詞組采用聲序編碼,即用各音節(jié)的聲母(零聲母音節(jié)用其第一字母代替,以下同)順序編碼,對多音節(jié)(五音節(jié)以上)詞組采用省略聲序編碼,即省略部分音節(jié)的聲母后再順序編碼,概括講,詞組編碼分二位和四位兩檔,二音節(jié)詞用兩個(gè)音節(jié)的聲母順序編碼,三音節(jié)詞組用一、二、三音節(jié)的聲母再補(bǔ)上一個(gè)“0”湊齊四位字母順序編碼,四音節(jié)詞組用一、二、三、四、音節(jié)的聲母順序編碼,五音節(jié)詞組用一、三、四、五音節(jié)的聲母順序編碼,六音節(jié)以上詞組用一、三、五、末音節(jié)的聲母順序編碼,詞字二元聲形編碼一覽圖,見圖8。
8.根據(jù)權(quán)利要求
1或2所述的漢字系統(tǒng),其特征在于詞字二元聲形編碼輸入法對單字采用聲形編碼,單字聲形編碼也分兩檔,用一位引導(dǎo)的為高頻字,用三位碼引導(dǎo)的為一般字,高頻字用“本字”的聲母作引導(dǎo)碼,用數(shù)字鍵作選擇碼,其中,用字母“O”引導(dǎo)十個(gè)常用標(biāo)點(diǎn)符號,一般字用“本字”的聲母加上首字元代碼。尾字元代碼三位字母編作引導(dǎo)碼,一般獨(dú)體字用“本字”的聲母再加上字首筆形代碼和字尾筆形代碼三位字母編碼,見圖8。
9.根據(jù)權(quán)利要求
1或2所述的漢字系統(tǒng),其特征在于字元形聲編碼輸入法對單字采用形聲編碼,分三檔五個(gè)層次,高頻字用首字元(獨(dú)體字用本字聲母)代碼作引導(dǎo)碼,用作選擇碼,二字元高頻字用兩個(gè)字元的代碼作引導(dǎo)碼,用數(shù)字鍵作選擇碼,一般獨(dú)體字用“本字”聲母、字首筆形代碼、字尾筆形代碼三位字元編碼作引導(dǎo)碼,用數(shù)字作選擇碼,一般二字元合體字用兩個(gè)字元的代碼加上“本字”聲母作引導(dǎo)碼,用數(shù)字鍵選擇,三個(gè)結(jié)構(gòu)部位的合體字,從三個(gè)部位中分別取三個(gè)字元的代碼作引導(dǎo)碼,詳見圖9。
10.根據(jù)權(quán)利要求
1或2所述的漢字系統(tǒng),其特征在于具體操作可按系統(tǒng)操作流程圖(即圖10)實(shí)現(xiàn),可適用于大、中、小及微型電子計(jì)算機(jī)(或稱電腦),也適用于智能中英文打字機(jī)、電傳打字機(jī)、漢字終端以及電視、電影制作中應(yīng)用的電子字幕機(jī)。
專利摘要
詞字二元編碼輸入漢字系統(tǒng)及其鍵盤屬于電腦中文信息處理技術(shù)領(lǐng)域:
,鍵盤是實(shí)施該技術(shù)的專用設(shè)備。中文信息處理的技術(shù)關(guān)鍵在于漢字輸入,而漢字編碼又是漢字輸入的“瓶頸”。本發(fā)明采用以聲代形和聯(lián)想的方法,將基本字元定義在鍵盤上,減少了對字元的機(jī)械記憶。采用約定俗成的程式編碼,好學(xué)易記。大量采用詞組編碼輸入,平均碼長為2.3鍵/字,輸入速度可達(dá)150字/分。因而成為一種理想的實(shí)用的中文信息處理技術(shù)方案。
文檔編號G06F3/023GK86107235SQ86107235
公開日1988年4月27日 申請日期1986年10月19日
發(fā)明者栗興民 申請人:中國民主促進(jìn)會(huì)邯鄲市委員會(huì)導(dǎo)出引文BiBTeX, EndNote, RefMan