專利名稱:二部拼形計(jì)算機(jī)中文輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字編碼的計(jì)算機(jī)輸入方法。
計(jì)算機(jī)中文輸入是中文信息處理的基礎(chǔ),是在我國(guó)普及推廣使用計(jì)算機(jī)的關(guān)鍵。目前國(guó)內(nèi)外有近千種漢字輸入編碼方案,其中已有幾十種得到推廣使用,為我國(guó)計(jì)算機(jī)產(chǎn)業(yè)的發(fā)展起到了積極的推動(dòng)作用。但是,包括五筆字型、雙拼雙音、自然碼等優(yōu)秀編碼在內(nèi)的現(xiàn)有各種方案,都還沒(méi)有解決這樣的一個(gè)矛盾就是一種編碼既要簡(jiǎn)單易學(xué)、適應(yīng)廣大華人的客觀需要,又能高效實(shí)用、反映中文輸入的客觀規(guī)律。
例如以王永明《五筆字型》為代表的純拼形碼,適應(yīng)了大多數(shù)華人懂得拼形、不懂拼音的實(shí)際情況,因而應(yīng)用比較廣泛。但它有兩個(gè)主要缺點(diǎn)一是字根過(guò)多,規(guī)則復(fù)雜,記憶量大,難于掌握;二是輸入以字為主、以詞為輔,與一般中文以詞為主、以字為輔的特征相脫節(jié),不夠高效實(shí)用。
又如以劉衛(wèi)民《雙拼雙音》為代表的純拼音碼,反映了中文輸入以詞為主的特點(diǎn),但它的兩個(gè)主要缺點(diǎn)一是目前大多數(shù)華人難以正確掌握漢語(yǔ)拼音,因而普及性差;二是單字處理水平太低,詞匯的重碼率又很高,因而實(shí)用性也差。
再如以周志農(nóng)《自然碼》為代表的各種音形、形音結(jié)合碼,比較全面地描述了漢字的各種信息特征,因而理論意義相對(duì)較高。但它也有兩個(gè)主要缺點(diǎn)一是把音與形結(jié)合起來(lái)編碼,就意味著輸入者既要掌握音、又要掌握形,因此使?jié)h字輸入更加繁瑣復(fù)雜化,實(shí)用價(jià)值也就相對(duì)較低;二是此類編碼雖然使單字得到不同程度的處理,但詞匯重碼率太高的問(wèn)題并不能因此解決,而只能依賴方案以外的系統(tǒng)功能來(lái)作聯(lián)想或智能化處理,方案本身并不能很好反映中文輸入的客觀要求。
本發(fā)明的目的就是為了解決上述漢字編碼存在的問(wèn)題,提出這樣一種兼具實(shí)用性、易學(xué)性、普及性與直觀化、規(guī)范化、高速化的純拼形漢字編碼,為研制各種漢卡、漢字系統(tǒng)提供一個(gè)最佳輸入方案。
本發(fā)明的技術(shù)解決方案一種二部拼形計(jì)算機(jī)中文輸入鍵盤,其特征在于利用普通英文小鍵盤的26個(gè)字母鍵,分別賦予特定的復(fù)筆碼和部件碼,構(gòu)成以復(fù)筆為基本單元、以部件為主體單元、復(fù)筆與部件相結(jié)合的鍵盤結(jié)構(gòu)
所謂復(fù)筆,即漢字有一丨丿_∠五種單筆,由兩個(gè)單筆組成的復(fù)合筆畫即為復(fù)筆,漢字的復(fù)筆理論上有5×5=25個(gè),本鍵盤實(shí)際采用26個(gè),其中丨_和丨∠合并為一個(gè)復(fù)筆(L鍵),而將丿一和丿∠,依據(jù)它們是否與其它筆畫相交叉,各分為兩個(gè)復(fù)筆(Z、X鍵和N、M鍵);所謂部件,是考慮漢字分布的均衡合理性和漢字取碼的直觀、整體性,而把26個(gè)漢字常用構(gòu)件定義為部件。
二部拼形的復(fù)筆碼、部件碼與鍵位的對(duì)應(yīng)關(guān)系如
圖1。
由圖看出,26個(gè)復(fù)筆碼按順序、有規(guī)律地在英文小鍵盤上排列,部件碼則一般依照各自的使用頻率來(lái)排列,以體現(xiàn)計(jì)算機(jī)輸入的工效原則。
一種二部拼形計(jì)算機(jī)中文輸入法,其特征在于以漢字,的筆畫(復(fù)筆與部件)作為取碼單元,而以漢字的結(jié)構(gòu)(前部與后部)確定取碼部位,構(gòu)成了以單字輸入為基礎(chǔ)、以詞匯輸入為主體的中文輸入體系漢字一般分為左右、上下、包圍、連體四種基本結(jié)構(gòu),本發(fā)明將左右結(jié)構(gòu)的左部、上下結(jié)構(gòu)的上部、內(nèi)起式包圍結(jié)構(gòu)的內(nèi)部、外超式包圍結(jié)構(gòu)的外部稱為前部,而將右部、下部、內(nèi)起式的外部、外起式的內(nèi)部稱為后部,可分為前后二部的漢字結(jié)構(gòu)統(tǒng)稱為二部結(jié)構(gòu);連體結(jié)構(gòu)的字根據(jù)有無(wú)成字來(lái)分類,成字是指一個(gè)字的前部始筆(全字第一個(gè)復(fù)筆或部件)或者后部末筆(全字最后一個(gè)復(fù)筆或部件)所在部分可以獨(dú)立成字的筆劃組合,有成字的連體字視為二部結(jié)構(gòu)(成字為一部、其余為另一部),無(wú)成字的連體字視為一部結(jié)構(gòu);按二部結(jié)構(gòu)取碼的基本形式是a、對(duì)于一般但單字前部始筆+后部始筆+后部末尾,其中前部始筆為首碼、后部始筆為中碼、后部末尾為尾碼,為三碼輸入;b、對(duì)于一般詞匯(二字詞)依次取第一、二字的前部始筆與后部始筆,為四碼輸入。
本發(fā)明的特征;是以漢字筆劃(復(fù)筆與部件)作為取碼單元,而以漢字結(jié)構(gòu)(前部與后部)確定取碼部位。本發(fā)明不以單字為唯一研究對(duì)象,而是以中文為整體研究對(duì)象,出發(fā)點(diǎn)是以三碼定義字、四碼定義詞的科學(xué)合成編碼方式,來(lái)體現(xiàn)中文以單字為基礎(chǔ)、詞匯為主體的客觀規(guī)律。因此,二部拼形不是一般的漢字輸入法,而應(yīng)準(zhǔn)確地稱之為中文輸入法。與目前所有的編碼方案相比,它具有六個(gè)主要特點(diǎn)一是構(gòu)件最少。由于采用以筆形為基礎(chǔ)、以構(gòu)件為主導(dǎo)的輸入方式,因此只用了26個(gè)構(gòu)件。
二是分布最勻。反映漢字分布均衡程度的二碼實(shí)位率高達(dá)99.41%,二級(jí)簡(jiǎn)碼達(dá)到672個(gè),比五筆字型多14.3%比自然碼等各種音碼、形音碼多70%;單字全部以三碼輸入,非選擇率達(dá)85%,是所有以三碼制式輸入漢字的各種方案中最高的。
三是詞量最大。全部詞匯均以四鍵編碼共有2.4萬(wàn)個(gè),是五筆字型的10倍,是自然碼、雙拼雙音的2倍,而它的非選擇率高達(dá)95%,是其它所有方案無(wú)法比擬的。
四是判讀最快。它既不象拼音碼、形音碼那樣有漢字識(shí)讀的障礙,又不象五筆字型那樣有漢字拆分的困難,規(guī)則簡(jiǎn)單、科學(xué)、規(guī)范,判讀具有很高的一義性。
五是碼長(zhǎng)最短。在不借助自造詞、聯(lián)想方式的情況下,平均碼長(zhǎng)只有2.2鍵/字(包括空格鍵)六是結(jié)構(gòu)最巧。利用僅有的4個(gè)二碼空位分別設(shè)計(jì)了中文數(shù)字、中文日期、常用序詞、常用標(biāo)點(diǎn)符號(hào),并利用’鍵引導(dǎo)自造詞,這樣一般文章不需換擋,只需在30個(gè)左右的鍵位上即可完成輸入。
圖1是本發(fā)明的英文小鍵盤示意圖;圖2是本發(fā)明一、二級(jí)簡(jiǎn)碼表圖1中,對(duì)應(yīng)同一英文字母的復(fù)筆與部件,其代碼也相同,該圖的英文字母是按標(biāo)準(zhǔn)英文鍵盤排列的,在計(jì)算機(jī)上按編碼輸入漢字時(shí),則擊該代碼所對(duì)應(yīng)的英文字母鍵。
圖2是本發(fā)明由二部拼形產(chǎn)生的漢字集中使用頻率較高的單字表,其中26個(gè)特高頻字由一碼確定,672個(gè)常用字由二碼確定。
漢字筆畫歸納起來(lái)有橫(一)、豎(丨)、撇(丿)、點(diǎn)(_)、折(∠)五種基本筆劃,也就是單筆。其中,橫包括提,點(diǎn)包括捺,折包括各種鉤。由兩個(gè)單筆組成的復(fù)合筆畫,本發(fā)明稱之為復(fù)筆。如“經(jīng)濟(jì)”的“經(jīng)”字的第一個(gè)復(fù)筆(簡(jiǎn)稱為始筆)是∠∠,最后的復(fù)筆(簡(jiǎn)稱為末筆)是丨一;“濟(jì)”字的始筆是__,末筆是丿丨。
本發(fā)明將這些復(fù)筆分別安排在26個(gè)字母鍵上,其中丨_和丨∠合并為一個(gè)復(fù)筆(L鍵),而將丿一和丿∠,依據(jù)是否與以外筆畫相交叉,各分為兩個(gè)復(fù)筆(Z、X鍵和N、M鍵)。如“禾”字旁的始筆丿一,與其它筆畫相交叉,因此定在Z鍵;而“钅”字旁的始筆同樣為丿一,但不與其它筆畫相交叉,因此定在X健。再如“攵”字頭和“夕”字頭,前者的始筆與其它筆畫相交叉,因此定在N?。缓笳叩氖脊P不與其它筆畫相交叉,因此定在M健。始筆如此,其它復(fù)筆的定位也如此。
本發(fā)明共有26個(gè)復(fù)筆,成為取碼的基本單元??紤]到漢字分布的均衡性和漢字的整體性,特別把26個(gè)漢字常用構(gòu)件定義為部件,作為取碼的主體單元。
在一個(gè)字取碼時(shí),有部件的要用部件取碼,沒(méi)有部件的則用復(fù)筆取碼。要注意的是,部件與其它筆畫之間可以是斷開、連接或插入的關(guān)系,但不能是交叉關(guān)系,這一點(diǎn)與五筆字型的字根是不相同的。如“間接”二字,構(gòu)件日、扌與其它筆畫為斷開關(guān)系;“占領(lǐng)”二字,構(gòu)件口、貝與其它筆畫為連接關(guān)系;“辦”字的構(gòu)件八,與其它筆畫是插入關(guān)系;“其”字的構(gòu)件艸、“平”字的構(gòu)件十,與其它筆畫是既連接、又插入的關(guān)系,這一規(guī)定使大量漢字無(wú)需拆分,不僅提高了漢字判讀速度,而且保證了漢字編碼的唯一性。這些構(gòu)件,都是被認(rèn)定的部件。如果一個(gè)構(gòu)件獨(dú)立使用時(shí)是一個(gè)部件,但一旦與其它筆畫相交叉,便不再成為我們所說(shuō)的部件。如“中”字,始筆不是部件“口”,而是丨∠;“里”字的始筆不是部件“日”而是復(fù)筆丨∠;末筆不是部件“土”而是復(fù)筆丨一。
再有一點(diǎn),就是雖說(shuō)認(rèn)定了26個(gè)部件,但還有一些與部件形似的構(gòu)件被同時(shí)認(rèn)同,共有7個(gè)士認(rèn)同為土,曰認(rèn)定為日 認(rèn)同為小、木認(rèn)同為木、 認(rèn)同為月、七認(rèn)為匕、卄認(rèn)同為艸。除此以外,其它構(gòu)件不予認(rèn)同。
漢字結(jié)構(gòu)一般分為左右、上下、包圍、連體四種基本結(jié)構(gòu)??梢钥吹剑叭N結(jié)構(gòu)都分別存在左與右、上與下、包圍與被包圍兩個(gè)斷開部分,因此本發(fā)明統(tǒng)稱為二部結(jié)構(gòu)。如“經(jīng)濟(jì)”二字均為左右結(jié)構(gòu),“希望”二字均為上下結(jié)構(gòu),“圍困”、“趨向”皆為包圍結(jié)構(gòu)。其中包圍結(jié)構(gòu)依據(jù)起筆位置,分為內(nèi)起式和外起式?!敖ā薄ⅰ斑叀睘閮?nèi)起式,“趙”、“裁”為外起式。
為了取碼方法的統(tǒng)一,本發(fā)明將左右結(jié)構(gòu)的左部、上下結(jié)構(gòu)的上部、內(nèi)起式包圍結(jié)構(gòu)的內(nèi)部、外起式包圍結(jié)構(gòu)的外部,統(tǒng)稱為前部;而將右部、下部、內(nèi)起式的外部、外起式的內(nèi)部,統(tǒng)稱為后部。
連體字從整體上看沒(méi)有斷開部分,這樣要根據(jù)有無(wú)成字來(lái)分析。所謂成字,就是始筆或末筆所在部分可以獨(dú)立成字的筆畫組合。可以單獨(dú)成字的部件,也看作為成字。
獨(dú)立成字必須具備五個(gè)要件一是成字必須是國(guó)標(biāo)字的標(biāo)準(zhǔn)字形;二是成字部分與非成字部分互不交叉;三是成字以外部分至少要有一個(gè)復(fù)筆;四是成字部分如只有一個(gè)復(fù)筆,必須在整個(gè)字的四邊中,至少獨(dú)立占有完整的一邊象“發(fā)”中的“又”、“本”中的“八”不占有完整的一邊,因而不看作為成字;五是成字部分至多只能被非成字部分一次插入象“來(lái)”中的“未”、“平”中的“干”均被“丷”二次插入,因而也不被看作為成字。凡不具備以上五個(gè)要件的連體字,均要依自然筆畫順序來(lái)取碼。
根據(jù)有無(wú)成字,連體字分為兩種一是有成字連體字屬于二部結(jié)構(gòu)。在這種結(jié)構(gòu)中,成字分為一部,其余部分為另一部。如“卓”的始筆丨一為前部,“早”為后部;“舌” 字中的“千”為前部,“口”為后部。二是無(wú)成字連體字屬于一部結(jié)構(gòu),如“本”、“表”等字。
一要強(qiáng)調(diào)的一點(diǎn),本發(fā)明講的漢字結(jié)構(gòu)是指現(xiàn)行漢字的靜態(tài)結(jié)構(gòu),而不涉及漢字紛繁錯(cuò)亂的動(dòng)態(tài)演變。因此,二部拼形的分部也好、取碼也好,均是從國(guó)標(biāo)簡(jiǎn)化字的字形與結(jié)構(gòu)來(lái)作分析的。丶如 與“羊”、 與“牛”本來(lái)都一致,但現(xiàn)在各自的字形與筆畫順序不同,因而取碼就不一樣。當(dāng)然少數(shù)漢字的筆畫,也客觀存在著書寫順序不統(tǒng)一的現(xiàn)實(shí)問(wèn)題。為解決這一問(wèn)題,提高輸入的準(zhǔn)確率。本發(fā)明主要根據(jù)中文工具書的通行規(guī)范和中小學(xué)語(yǔ)文教學(xué)規(guī)范,制定了以下疑難漢字構(gòu)件筆畫規(guī)范表,其中一至六畫以數(shù)字表示(1-5分別代表一丨丿_∠),七畫以上則以編碼表示二畫 三畫 四畫 五畫 六畫 七畫以上七15 萬(wàn)135專1154 11534 121121 甚BYG九35 與151廿 1221 世12215 考121315 CAH阝52 犭353車1512 北21135 亞122431 囪CNR力53 丸354丹1514 出25252 再125121 虍HET乃53 忄424比1535 生31121 臣152512 冒LLY義434瓦1554 瓜33544 舟335144 里L(fēng)YH氵441長(zhǎng)3154 主41121 兆413534 禺LY0也525片3215 必45443 州434242 肅QDC女531火4334 皮52354 聿515112 雨UWF及534灬4444 母55144 羽541541 垂ZUH本發(fā)明規(guī)定將二部結(jié)構(gòu)的單字合理分部,其分部取碼規(guī)則是二部相斷,一筆相連,部件整取,成字整算。
二部相斷就是非連體二部結(jié)構(gòu)的字,前后二部應(yīng)處于可以斷開的狀態(tài)。就大多數(shù)漢字而言,左右結(jié)構(gòu)多為一個(gè)縱斷層、上下結(jié)構(gòu)多為一個(gè)橫斷層、包圍結(jié)構(gòu)多為一個(gè)曲斷層。這類只有一個(gè)斷層的字,就是現(xiàn)成的二部結(jié)構(gòu)。如果屬于不止一個(gè)斷層的多重結(jié)構(gòu),那就根據(jù)能否整合成字來(lái)區(qū)別處理。所謂整合,就是以一個(gè)字的始筆或末筆為基礎(chǔ),將靠近的幾個(gè)筆畫整理、合并成一個(gè)成字,目的是使全字可以分為二部。
(1)能夠整合成字一個(gè)字的第一個(gè)復(fù)筆與后續(xù)筆劃可整合成字,或最后一個(gè)復(fù)筆與前接筆劃可整合成字,這樣成字部分為全字的一部,非成字部分為另外一部。整合成字有兩項(xiàng)要求一是能大不小,就是盡量整合為相對(duì)筆畫較多的字,只要保證另外一部不少于一個(gè)復(fù)筆;二是能前不后,就是一個(gè)字的中間部分,既可以作前部整合、有可以作后部整合的,要作前部整合。
在一個(gè)多重結(jié)構(gòu)的字中,有部件的,不管是可成字部件,還是非成字部件,均與成字一樣看待,能與部件以外筆畫整合的也要盡量整合。
(2)不能整合成字一個(gè)字既不止一個(gè)斷層、又無(wú)法整合的,就按其第一斷層來(lái)分部取碼。
一筆相連就是掛單的筆畫,要依照就近掛靠的原則視作連筆。所謂就近掛靠,就是按照書寫順序,將一個(gè)單筆與前一單筆或后一單筆相連接,以構(gòu)成一個(gè)復(fù)筆。一筆相連有兩種情況(1)一個(gè)單筆占有一部位置,如“乏”、“舊”的前部單筆、“藝”“引”的后部單筆,要按此規(guī)則處理,即不再成為二部結(jié)構(gòu),而一般作為連體結(jié)構(gòu)來(lái)取碼。
(2)一個(gè)單筆不占有一部位置,如“副”字的最前一個(gè)單筆一,要就近掛靠到“口”上;“修”字的中間一個(gè)單筆丨,要就近掛靠到前部。如果一個(gè)單筆介于兩個(gè)部件之間,則一般往前掛靠,如“共”、“合”兩字中間的一。
部件整取就是一個(gè)字里帶有部件的,不以其筆畫來(lái)取碼,而以部件為整體來(lái)取碼。如“素材”的“素”的尾碼,不是丿_,而是“小”; “材”的首碼不是一丨,而是“木”。就部件與筆畫的關(guān)系而言,部件整取分兩類1、一個(gè)部件本身就是一個(gè)復(fù)筆,如“十”,這時(shí)不在復(fù)筆一丨所在鍵U上取碼,而應(yīng)在部件“十”所在鍵I上取碼。
2、一個(gè)部件超過(guò)一個(gè)復(fù)筆,有兩種情況(1)一個(gè)復(fù)筆的兩個(gè)單筆都在一個(gè)部件上,就整取這個(gè)部件。如“日”、“大”等部件,要作為一個(gè)整體來(lái)取碼。
(2)一個(gè)復(fù)筆的前一單筆在一個(gè)部件上,而后一單筆與部件以外筆畫相連接,也整取這個(gè)部件。如“可”的末筆不按習(xí)慣取一∠,而是取“口”。如果后一單筆與其它筆畫不相連接,就按一筆相連的規(guī)則處理。如“但”是末筆不是取“日”,而是取一一。
在特定情況下,部件整取意味著要先取后舍。就是有些字的部件不是連續(xù)筆畫,此時(shí)除了部件整取外,部件上的筆畫一般不予重復(fù),除非部件以外只有一個(gè)單筆。如“成”字,先取“戈”并以此為始筆,末筆則是其余部分的一個(gè)復(fù)筆丿∠,而不是“成”字原來(lái)的末筆丿_。而“戊”字,在整取了“戈”以后,其余部分只有一個(gè)單筆丿,此時(shí)就要按照就近掛靠的原則,從“戈”上借取一個(gè)單筆一,以構(gòu)成一個(gè)復(fù)筆。
成字整算就是一個(gè)字里有成字,分部時(shí)要作為一個(gè)整體算作一部,這一點(diǎn)已在二部相斷的規(guī)則里作了說(shuō)明。歸納起來(lái),確定成字整算的規(guī)則有兩點(diǎn)意義一是可將多重結(jié)構(gòu)整合成二部結(jié)構(gòu),二是可將有成字連體字分析成二部結(jié)構(gòu)。
部件整取與成字整算這兩項(xiàng)規(guī)則,雖然都是把部件和成字看作為整體,但有著三個(gè)方面的不同(1)部件可以在一個(gè)字的任何位置,成字則只能在前部始筆或后部末筆所在的位置;(2)部件整取的目的是考慮部件的整體性,成字整算的目的則是考慮分部的需要;(3)部件可以向部件以外的部分借出筆畫,成字由于自成一部則不能做到這一點(diǎn)。
本發(fā)明的單字輸入,由首碼、中碼、尾碼三碼構(gòu)成。二部結(jié)構(gòu)單字的一般取碼形式為前部始筆+后部始筆+后部末筆如“經(jīng)濟(jì)”的“經(jīng)”,首碼為前部始筆∠∠(T),中碼為后部始筆∠_(R),尾碼為后部末筆丨一(H),即以TRH輸入;“濟(jì)”的首碼為__(F),中碼為_一(A),尾碼為丿丨(C),即以FAC輸入。
上面是二部結(jié)構(gòu)的一般取碼形式。還有少數(shù)二部結(jié)構(gòu)的單字,因后部筆畫不足,而采取了特殊取碼形式1、后部只有三個(gè)單筆的,中碼和尾碼作單筆重合取碼,即中碼的后一單筆同時(shí)是尾碼的前一單筆。如“材”的首碼取“木”,中碼取一∠,尾碼則取∠丿,即JPE。
2、有些字后部雖然不止三個(gè)單筆,但由于部件整取的需要,剩下一個(gè)單筆,這時(shí)中碼和尾碼也作單筆重合取碼。如“汰”的中碼取“大”,尾碼則取__;而“沃”的中碼取丿一,尾碼取“大”;“柏”的中碼取丿丨,尾碼取“日”。
3、后部只有兩個(gè)單筆(即一個(gè)復(fù)筆或部件)的,又分兩種情況(1)一個(gè)字的前部不止一個(gè)復(fù)筆(部件),那么這個(gè)字的中碼不在后部取,而向前部借位取碼,就是把前部末筆作為中碼。如“利”的首碼取丿一,中碼依此形式取部件“木”,尾碼取丨∠;“春”的首碼取一一,中碼則取丿_,尾碼取部件“日”。
(2)一個(gè)字不僅后部只有一個(gè)復(fù)筆(部件),而且前部也只有一個(gè)復(fù)筆(部件),這時(shí)中碼不再向前部借位取碼,而是中碼與尾碼作復(fù)筆重合取碼,即取相同的碼。如“機(jī)”的首碼取“木”,中碼、尾碼均取丿∠,即J MM;“尖”的首碼取“小”,中碼、尾碼均取“大”,即SXX。
一部結(jié)構(gòu)單字的取碼形式為始筆+次筆+末筆,次筆就是始筆之后的第二個(gè)復(fù)筆或部件。如“本”的始筆為一丨,次筆為部件“八”,末筆為丿一,即UDA;“來(lái)”的始筆為一\,次筆為丿一,末筆為部件“八”,即OZD。
另外,不管屬于什么結(jié)構(gòu),單筆只有1-3個(gè)的漢字,本發(fā)明稱之為簡(jiǎn)筆字。其取碼形式是,先將每個(gè)單筆都作復(fù)筆處理,再按一部結(jié)構(gòu)形式取碼。如“才”以YTV輸入,“億”以VJT輸入,“兒”以VTT輸入,“乙”以TTT輸入。
26個(gè)部件無(wú)論是成字還是部首,取碼形式都是連按三次所在鍵后再加空格鍵。如“土”以O(shè)OO輸入,“蟲”以QQQ輸入?!笆俊薄ⅰ霸弧边@兩個(gè)形似部件,則以一般形式輸入,即YJY、LYY。其它無(wú)讀音、非部件的部首則以簡(jiǎn)筆字或一般單字的取碼形式輸入。
本發(fā)明少數(shù)單字的重碼,依據(jù)各字的一般使用頻率,高的以非選擇形式用空格鍵(代碼0)直接輸入,低的則以選擇形式用數(shù)字鍵輸入(代碼1等)。如“倉(cāng)”與“侖” 均為WTT,“倉(cāng)”以WTT輸入,“侖”則以WTT0輸入。
與不少漢字輸入方案一樣,本發(fā)明也用簡(jiǎn)碼形式來(lái)輸入單字。事實(shí)上,本發(fā)明的單字輸入,就相當(dāng)于一般漢字輸入法的三級(jí)簡(jiǎn)碼,即三個(gè)字母鍵加一個(gè)空格鍵。
本發(fā)明的一級(jí)簡(jiǎn)碼有26個(gè),全部為特高頻字,輸入形式是一個(gè)字母鍵加一個(gè)空格鍵。如“這”的輸入,先按A鍵,再加空格;“是”的輸入,先按P鍵,再加空格。
本發(fā)明的二級(jí)簡(jiǎn)碼有672個(gè),基本為國(guó)標(biāo)一級(jí)字,輸入形式為兩個(gè)字母鍵加一個(gè)空格鍵。如“周”以MO加空格輸入,“年”以XU加空格輸入,如圖2本發(fā)明以單字輸入為基礎(chǔ),而以詞匯輸入為主體。這一點(diǎn),正好與漢語(yǔ)文章中詞匯占絕大部分的特點(diǎn)相吻合。本發(fā)明的詞匯輸入形式有以下幾種二字詞 依次取第一、二字的前部始筆和后部始筆。如“經(jīng)濟(jì)”以TRFA輸入,“希望”以AI AY輸入。
三字詞 取第一字的前部始筆、后部始筆和第二、三字的前部始筆。如“國(guó)務(wù)院”以LYNW輸入,“辦公室”以EDDE輸入。
四字詞 依次取第一、二、三、四字的前部始筆。如“取長(zhǎng)補(bǔ)短”以UZGX輸入,“特此通知”以ZHRX輸入。
多字詞 依次取第一、二、三字和最后一字的前部始筆。如“中華人民共和國(guó)”以LCWL輸入,“烏茲別克斯坦”以MDKO輸入。
本發(fā)明的詞匯除兩萬(wàn)條通用語(yǔ)匯外,還有一千條常用成語(yǔ)一千條常用專業(yè)術(shù)語(yǔ)、一千條中外地名、一千條中外組織與人名。
本發(fā)明的詞匯輸入,絕大多數(shù)不用選擇,有重碼的則以處理單字重碼的同樣方式輸入,頻率高的用空格鍵輸入,頻率低的用數(shù)字鍵輸入。與單字重碼不同的是,詞匯重碼需要蜂鳴器提示。
本發(fā)明的二碼實(shí)位率很高,僅有的OJ、NF、VG、EV4個(gè)空位,也用來(lái)作特定輸入。所謂特定輸入,就是以一個(gè)空位二碼作引導(dǎo),將中文數(shù)字等項(xiàng)在英文字母鍵上有規(guī)律、按順序地排列,而特別規(guī)定的輸入形式。
中文數(shù)字以O(shè)J為引導(dǎo)鍵,它在字母鍵上的排列情況如下QWERTYUIOP一 二 三 四 五 六 七 八 九 ○ASDFGHJKL十 二十 三十 四十 五十 六十 七十 八十 九十ZXCVBNM百 千 萬(wàn) 十萬(wàn) 百萬(wàn) 千萬(wàn) 億中文數(shù)字的輸入形式是先按OJ二鍵,然后按一個(gè)特定的字母鍵。如“六”以O(shè)JY輸入,“千萬(wàn)”以O(shè)JN輸入。
兩個(gè)中文數(shù)字之間可以進(jìn)行各種可能的組合。如果輸入OJKI,將得到兩項(xiàng)數(shù)字的組合“八十八”;輸入OJRB,則為“四百萬(wàn)”;輸入OJII,則為“八八”。
中文日期以EV為引導(dǎo)鍵,它的排列情況如下QWER TYUIOP一日二日 三日 四日 五日 六日 七日 八日 九日 十日十一日 十二日 十三日 十四日 十五日 十六日 十七日 十八日 十九日 二十日ASDFGHJKL一月 二月 三月四月 五月 六月 七月 八月 九月二十一日 二十二日 二十三日 二十四日 二十五日 二十六日 二十七日 二十八日 二十九日Z(yǔ)XCV BNM星期一 星期三 星期五星期日十二月 十一月十月星期二 星期四 星期六星期天三十一日 三十日中文日期的輸入形式是,先按EV二鍵,然后按特定的字母鍵。如“六日”以EVY輸入,“星期一”以EVZ輸入。
在這一特定輸入形式下,一次可以組合一年中的任何一個(gè)日期。它的組合形式分同鍵組合與異鍵組合兩個(gè)類型(加號(hào)前為上行日期,加號(hào)后為下行日期)(1)同鍵組合又分兩種情況①日+日(或星期+星期),得到的是下行日期如EVWW為“十二日”,EVCC為“星期六”;②月+日,則得到同一鍵上的×月×日如EVAA為“一月二十一日”,EVKK為“八月十八日”。
(2)異鍵組合則分為三種情況
①月+日,得到×月×日如EVGD為“五月二十三日”,EVHP為“六月二十日”;②日+月,同樣得到×月×日如EVED為“三月三日”,EVQM為“十月一日”;③月+B,作為一種特殊情況,得到的并不是×月,而是×月下面的×日如EVFB為“二十四日”,EVMB為“三十日”。
常用序號(hào)以NF為引導(dǎo)鍵,它的排列情況如下Q W ERTYUIOP第一 第二 第三 第四 第五 第六 第七 第八 第九 第十1. 2. 3. 4. 5. 6. 7. 8. 9. 10.ASDFGHJKL(1) (2) (3) (4) (5) (6) (7) (8) (9)① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨ZXCVBNMIIII VVII IX XI (10)II IV VI VIII XXII ⑩
常用標(biāo)點(diǎn)符號(hào)以VG為引導(dǎo)鍵,它的排列情況如下QW E R T Y U IOP… ☆ < ~< 《丿 .-…… ★ > ≈>》
_ ∶ ——A S D F G H JKL= △ ≤ ;‘ “ ? ([≠ ▲ ≥ ‘ “ ! )]Z X C V B N M+ × ℃ ’ %# ¥- ÷ * ″‰№$常用序號(hào)和常用標(biāo)點(diǎn)符號(hào)的輸入形式一樣,上行字符按一次,下行字符按兩次。這兩種特定輸入均不作任何組合。
權(quán)利要求
1.一種二部拼形計(jì)算機(jī)中文輸入鍵盤,其特征在于利用普通英文小鍵盤的26個(gè)字母鍵,分別賦予特定的復(fù)筆碼和部件碼,構(gòu)成以復(fù)筆為基本單元、以部件為主體單元、復(fù)筆與部件相結(jié)合的鍵盤結(jié)構(gòu)所謂復(fù)筆,即漢字有一丨丿_∠五種單筆,由兩個(gè)單筆組成的復(fù)合筆畫即為復(fù)筆,漢字的復(fù)筆理論上有5×5=25個(gè),本鍵盤實(shí)際采用26個(gè),其中丨_和丨∠合并為一個(gè)復(fù)筆(L鍵),而將丿一和丿∠依據(jù)它們是否與其它筆畫相交叉,各分為兩個(gè)復(fù)筆(Z、X鍵和N、M鍵);所謂部件,是考慮漢字分布的均衡合理性和漢字取碼的直觀、整體性,而把26個(gè)漢字常用構(gòu)件定義為部件。二部拼形的復(fù)筆碼、部件碼與鍵位的對(duì)應(yīng)關(guān)系為 由上看出,26個(gè)復(fù)筆碼按順序、有規(guī)律地在英文小鍵盤上排列,部件碼則一般依照各自的使用頻率來(lái)排列,以體現(xiàn)計(jì)算機(jī)輸入的工效原則。
2.一種二部拼形計(jì)算機(jī)中文輸入法,其特征在于以漢字的筆畫(復(fù)筆與部件)作為取碼單元,而以漢字的結(jié)構(gòu)(前部與后部)確定取碼部位,構(gòu)成了以單字輸入為基礎(chǔ)、以詞匯輸入為主體的中文輸入體系漢字一般分為左右、上下、包圍、連體四種基本結(jié)構(gòu),本發(fā)明將左右結(jié)構(gòu)的左部、上下結(jié)構(gòu)的上部、內(nèi)起式包圍結(jié)構(gòu)的內(nèi)部、外超式包圍結(jié)構(gòu)的外部稱為前部,而將右部、下部、內(nèi)起式的外部、外起式的內(nèi)部稱為后部,可分為前后二部的漢字結(jié)構(gòu)統(tǒng)稱為二部結(jié)構(gòu);連體結(jié)構(gòu)的字根據(jù)有無(wú)成字來(lái)分類,成字是指一個(gè)字的前部始筆(全字第一個(gè)復(fù)筆或部件)或者后部末筆(全字最后一個(gè)復(fù)筆或部件)所在部分可以獨(dú)立成字的筆劃組合,有成字的連體字視為二部結(jié)構(gòu)(成字為一部、其余為另一部),無(wú)成字的連體字視為一部結(jié)構(gòu);按二部結(jié)構(gòu)取碼的基本形式是a、對(duì)于一般但單字前部始筆+后部始筆+后部末尾,其中前部始筆為首碼、后部始筆為中碼、后部末尾為尾碼,為三碼輸入;b、對(duì)于一般詞匯(二字詞);依次取第一、二字的前部始筆與后部始筆,為四碼輸入。
3.按權(quán)利要求2所述的中文輸入法,其特征在于對(duì)復(fù)筆、部件、成字的相互關(guān)系、使用層次與范圍作了規(guī)定a、在確定取碼單元時(shí),有部件的要用部件,無(wú)部件的則用復(fù)筆;b、在確定取碼部位時(shí),前部始筆或后部末筆能與其它筆畫整合成字的,應(yīng)按能大不小、能前不后的規(guī)則進(jìn)行整合;c、成字、部件與其它筆畫之間,可以是斷開、連接、插入的關(guān)系,但不能是交叉關(guān)系;d、部件可以出現(xiàn)在一個(gè)字的任意位置上,成字則只能出現(xiàn)在一個(gè)字的前部始筆或后部末筆所在位置上;e、非連體的二部結(jié)構(gòu)單字,必須按照二部相斷、一筆相連、部件整取、成字整算的規(guī)則來(lái)整合、分部、取碼。
4.按權(quán)利要求2所述的中文輸入法,其特征在于對(duì)某些分部后筆畫不足的單字,規(guī)定了特殊的取碼形式a、在一般取碼形式下,二部結(jié)構(gòu)單字的滿足條件前部至少要有一個(gè)復(fù)筆或部件,后部至少要有兩個(gè)復(fù)筆或部件;b、后部只有一個(gè)復(fù)筆(部件)和一個(gè)單筆的,中碼和尾碼作單筆重合取碼c、后部只有一個(gè)復(fù)筆(部件)的,而前部不止一個(gè)復(fù)筆(部件),中碼由后部向前部借位取碼;d、前后二部均只有一個(gè)復(fù)筆(部件)的,中碼和尾碼作復(fù)筆重合取碼;e、前部或后部只有一個(gè)單筆的,依照一筆相連的規(guī)則處理,即一般作為一部結(jié)構(gòu)單字來(lái)取碼。
5.按權(quán)利要求2所述中文輸入法,其特征在于對(duì)二部結(jié)構(gòu)以外的國(guó)標(biāo)字規(guī)定了簡(jiǎn)易的取碼形式a、一部結(jié)構(gòu)單字的取碼形式為始筆+次筆+末筆,次筆就是始筆之后的第二個(gè)復(fù)筆或部件;b、只有1-3個(gè)單筆的簡(jiǎn)筆字,取碼形式是先將每個(gè)單筆都作復(fù)筆處理,再按一部結(jié)構(gòu)單字取碼;c、26個(gè)部件無(wú)論是成字或部首,取碼形式都是按三次所在字母鍵;d、國(guó)標(biāo)二級(jí)字中非成字、非部件的部首,以簡(jiǎn)筆字或一般單字的取碼形式輸入。
6.按權(quán)利要求2所述的中文輸入法,其特征在于使用了最為多數(shù)的簡(jiǎn)碼a、對(duì)26個(gè)特高頻字規(guī)定了一級(jí)簡(jiǎn)碼,即省去了這些字的中碼、尾碼;b、對(duì)672個(gè)常用字規(guī)定了二級(jí)簡(jiǎn)碼,即省去了這些字的尾碼。
7.按權(quán)利要求2所述的中碼輸入法,其特征在于絕大多數(shù)詞匯不需提示性選擇a、二字詞已如前述;b、對(duì)三字詞依次取第一字的前部始筆、后部始筆和第二、三字的前部始筆;c、對(duì)四字詞依次取第一、二、三、四字的前部始筆;d、對(duì)多字詞依次取第一、二、三字和最后一字的前部始筆。
8.按權(quán)利要求2所述的中文輸入法,其特征在于利用4個(gè)二碼空位,來(lái)作中文數(shù)字(及其各種組合)、中文日期(及其各種組合)、常用序號(hào)、常用標(biāo)點(diǎn)符號(hào)的特定輸入。
全文摘要
本發(fā)明涉及一種漢字編碼的計(jì)算機(jī)輸入方法。它利用普通英文小鍵盤的字母鍵,賦予特定的復(fù)筆碼和部件碼,構(gòu)成以復(fù)筆為基本單元、以部件為主體單元、復(fù)筆與部件相結(jié)合的鍵盤結(jié)構(gòu)。本發(fā)明的輸入方法以漢字的筆畫作為取碼單元,而以漢字的結(jié)構(gòu)確定取碼部位,構(gòu)成了以單字輸入為基礎(chǔ)、以詞匯輸入為主體的中文輸入體系。
文檔編號(hào)G06F3/023GK1109184SQ9411137
公開日1995年9月27日 申請(qǐng)日期1994年6月29日 優(yōu)先權(quán)日1994年6月29日
發(fā)明者王廣華 申請(qǐng)人:王廣華