專利名稱:漢字陰陽雙極形碼輸入系統(tǒng)的制作方法
技術(shù)領域:
本發(fā)明為專利申請92111818.x的同類分案申請,同屬于計算機漢字編碼輸入系統(tǒng)。
本發(fā)明涉及計算機漢字編碼輸入系統(tǒng)。
衡量漢字編碼的兩個重要標準是輸入速度和編碼規(guī)則,這是兩個相互制約的參數(shù)。編碼碼長和重碼率從一定程度上可以反映編碼的輸入速度,最初的漢字編碼,以提高輸入速度為主,如倉頡碼,五筆字型等,它們?yōu)榫幋a碼長,減少重碼率和合理安排鍵擊頻率,人為地編造了一大套規(guī)則,而且為了進一步減少重碼,還有許多字無任何規(guī)則地硬性規(guī)定其一個特定輸入碼。這些都大大影響了編碼的易學性,隨著簡碼和詞匯碼的出現(xiàn),一些原先編碼碼長較長和重碼率較高的編碼都可以快速輸入漢字。
簡碼可以使凡是利用標準英文鍵盤輸入的編碼,都能用三鍵(包括斷碼鍵)輸入占總字頻近80%的500多個高頻字。詞匯碼能使詞匯的輸入達到2鍵/字以下。五筆字型的單字輸入速度為3.89鍵/字,若采用了一、二、三簡碼和詞匯碼后,其流動文本的平均鍵入速度達2.9鍵/字。拼音被公認為重碼率太高,輸入太慢,然而目前出現(xiàn)一些編碼,如聲數(shù)碼、自然碼等都是以拼音碼為主體的,但其輸入速度卻有超過五筆字型的趨勢。近幾年更有句輸入、智能輸入等手段,使得能夠直接用拼音無重碼地快速輸入。由此可見,目前編碼研究的重點,應是編碼規(guī)則簡單化。
何種編碼才算作簡單?為了使得拆解編碼不過份集中在漢字的某個部位,通常都要將漢字拆分成幾個形體單元進行編碼,這些單元被稱作部首、字元、字根等等,為了敘述方便,下文將這些通稱為部件。目前出現(xiàn)的大量所謂簡單編碼,都是以部件來劃分的,或取其形,或取其音,說是不需要記憶任何口訣,只要按部件取音,取筆畫即可。然而,作為部件,卻是一個完完全全的不確定概念首先從形體上,許多部件與其它部件的分界線并不明顯,既可以看為是一個單獨部件,也可以看成是其它部件的一部分;其次從部件名稱上,除了一些常用部首有習慣稱呼外,并無一統(tǒng)一的名稱。也就是說,無論以部件是來取音還是取形,都是不確定的。為了提高輸入速度,編碼度明者們便選一些可以減少編碼碼長和重碼率的部件作為其編碼單元,并對用戶聲稱無需記憶任何口訣,只需取部件的筆畫或其名稱即可。其實用戶必需對這些部件的形狀、名稱都相當熟悉方可正常輸入。漢字的組字部件至少達400個以上,用作編碼的部件少則100以上,多則500-600。即使編碼的部件是參照某某文件或某某字典而來,但絕大部分的人,是不會對某一文件或字典上的部件種類、名稱了如指掌的。
可見,部件分解編碼法不能算是一種很簡單的編碼法。
目前,最簡單的編碼音碼為拼音碼,形碼為筆畫碼。但拼音碼輸入者必須熟悉英文打字。目前筆畫碼的一種為鴻鐘碼,但該碼將基本筆畫細分為37種,分在12個按鍵上,并且沒有易記的鍵-筆畫對應規(guī)則。每個字需按順序依次每鍵一筆畫地輸入所有筆畫,極不實用。使其達到實用的速度的手段是組合筆畫,該碼安排了88個組合筆畫,用戶要記住方可,且組合筆畫的存在有時并不直觀。
可見當前還缺少一種極簡單的實用編碼方法。
本發(fā)明的目的在于設計一種極其簡單的編碼方法,使其碼長和重碼率不致過高,并且能夠兼顧專業(yè)輸入,能夠充分發(fā)揮現(xiàn)有的各種編碼快速輸入手段。
本發(fā)明的核心在于,利用漢字公認的明確信息作為編碼基礎,共有三個拼音、筆畫、分部。小學二年級以上的人都會拼音,漢語拼音方案于58年即已標準化,因此,拼音是明確化的信息。本發(fā)明采用的筆畫類型為明確化,采用目前公認的簡易分法橫、豎、撇、捺、折。
分部的含義為,除結(jié)構(gòu)相當緊密的獨體字外,其它所有字均分為陰部和陽部兩大部分。上下,左右、里外、上中下和左中右結(jié)構(gòu),都將其上、左、里作為一個整體,而將剩下部分作為另一整體(中下和中右作為一個整體)。其中以首筆筆畫寫到的那一個整體稱為陰部,另一個整體稱為陽部。陰部和陽部是按字形界限劃分的,對于界線不明顯的,一律作為獨體字處理。對于一些難以分辨的,可按個人習慣當作獨體字或陰陽部進行編碼都可以,即允許一字多碼。
因為本發(fā)明采用的都是相當明確的編碼信息,非黑則白,因此稱本發(fā)明為陰陽雙極編碼或太極編碼。
以下為本發(fā)明結(jié)合分部、筆畫的編碼實施方案將25個雙筆畫組合和5個單筆畫結(jié)合鍵位座標安排到最靠近手指的30個接鍵中,見圖1。
獨體字編碼取頭5筆筆畫。頭2筆筆畫按雙筆畫組合對應按鍵,其后3筆筆畫均按單筆畫對應按鍵。如“王”字,拆成11,2,1,共3鍵。
合體字,拆成陰部和陽部進行編碼各部取頭4筆筆畫。取足4筆筆畫的,按2個雙筆畫組合對應按鍵。只取足3筆,按“單筆畫+雙筆畫”對應按鍵,只取足2筆的,按2個單筆畫,對應按鍵。如“對”字,拆成5,4,1,24,共4鍵;“辨”字,拆成41、43、43、41,共4鍵。
對于不易分清是獨體字還是合體字的,可按個人習慣,按獨體字或合體字輸入,系統(tǒng)中允許一字多碼。
對獨體字、陰部和陽部的取筆畫,也可以不按順序,而按首尾取筆畫。如獨體字取“頭三畫筆畫+末二畫筆畫”,陰部和陽部取“頭二畫筆畫+末二畫筆畫”。
為了進一步減少重碼率,特設“日、月、人(亻)、口、扌(手),钅(金)、木、氵(灬)、土、艸(辶)”10個部件安排到鍵盤上,當拆分筆畫時遇到這些部件,優(yōu)先按其對應鍵,然后接著該部件之后繼續(xù)拆分筆畫。若陰部中只包含一個特設部件,沒有其它筆畫,則陰部此時應取足6畫。如“鏗”字,應拆成钅,22,54,12,共4鍵。
當出現(xiàn)重碼時,可用數(shù)字鍵進行選擇。其中1、2、3、4、5、6分別代表橫、豎、撇、捺、折、零畫,當出現(xiàn)重碼時,可按重碼的最后一筆筆畫或形碼中未采用的一筆筆畫進行選擇,如有與1、2、3、4、5、6相重的重碼字,則按其使用頻序高低排在7、8、9、0數(shù)字鍵上。
本發(fā)明的優(yōu)點是陰陽雙極形碼是一種比目前任何編碼都更簡單、更易學習的一種編碼,它以漢字公認的、最明確、最簡單的信息拆解編碼,并且其輸入按鍵直接與座標位置對應,不用熟悉英文鍵盤,即可快速輸入漢字,且該編碼重碼率也遠低于拼音碼、筆畫碼等其它各類簡易碼。未接觸計算機者,學習編碼10分鐘,即可不用手冊,快速輸入任意漢字。陰陽雙極聲形碼適于熟悉英文鍵盤的操作員進行漢字輸入。它的重碼率比形碼低,學習難度與形碼一樣,一點即會。陰陽雙極聲韻形碼重碼率極低,只需記住韻母與鍵盤的對應關系即可輸入,它適于聽打和看打。
本發(fā)明的單手鍵輸入的筆畫鍵盤,聲母鍵盤,韻母鍵盤經(jīng)過精心設計,使得能用單手高速輸入漢字,編碼碼長為4鍵。
本發(fā)明將漢字字形分為獨體字和合體字,將合體字分為陰部和陽部兩大部分,能夠快速、明確地分解漢字,恰當?shù)胤峙淙〈a密度。而且這樣的取碼方法,能夠使絕大多數(shù)的部件在字形中的取碼相同,使用較長一段時間后,輸入者的識碼按鍵過程由“整字——分解成獨體字或陰部和陽部——分解出筆畫——轉(zhuǎn)換成座標——按鍵”逐漸過渡成“整字——部件——按鍵”,達到與字根編碼同樣快的見字按鍵反應速度?;蛘邚牧硪粋€角度上說,本編碼是將漢字的部件按其筆畫歸納到相應的鍵位上??傊?,采用陰、陽兩大部的分法,使得筆畫編碼法也能達到與字根編碼法一樣快的輸入速度。
實施實例編碼表(其中12345分別表示橫豎撇捺折)例編碼分解 陰陽形碼字漢 441 54H AN .Y/.字 445 51Z I.P/N編 551 4513 B IAN /HPE碼 1325 551 M AEG/H輸 1512 3412 SH UTWVW入 3 4 R U,.速 1251 454 SH UWH.L度 413 1221 D U.EWA
圖125個雙筆畫組合和5個單筆畫以及10個常用部首與英文鍵盤對應圖。
(圖中12345分別表示橫豎撇捺折)
權(quán)利要求
一種漢字形碼輸入系統(tǒng),利用經(jīng)過重新定義的英文標準鍵盤進行漢字計算機輸入,其特征包括(1)將合體字接其字形結(jié)構(gòu)一次性分成陰、陽兩部分,且只分一次,先寫到的那一部分為陰部;(2)將獨體字、準獨體字作為一個整體,不拆分;(3)取漢字筆畫的傳統(tǒng)分法將漢字筆畫分成橫、豎、撇、捺、折5大類,這5種單筆畫再兩兩組合成25種雙筆畫;(4)將單筆畫與雙筆畫分開定義在英文標準鍵盤上,并一一對應在英文標準鍵盤中離母鍵位置最近的30個按鍵上;(5)25種雙筆畫按起筆筆畫分成5個雙筆畫區(qū),5種單筆畫組成1個單筆畫區(qū);區(qū)中的次筆畫依橫、豎、撇、捺、折的自然順序按幾何坐標位置在鍵盤中自左向右排列;6個區(qū)的排列也依橫、豎、撇、捺、折、單筆畫的順序與鍵盤按鍵的幾何坐標位置相關;(6)各筆畫在鍵盤上的定義如下橫區(qū)Q--一一 W--一丨 E--一丿 R--一丶 T--一乙豎區(qū)A--丨一 S--丨丨 D--丨丿 F--丨丶 G--丨乙撇區(qū)Z--丿一 X--丿丨 C--丿丿 V--丿丶 B--丿乙捺區(qū)Y--丶一 U--丶丨 I--丶丿 O--丶丶 P--、乙折區(qū)H--乙一 J--乙丨 K--乙丿 L--乙丶 ;--乙乙單筆畫區(qū)N-- 一 M-- 丨 ,-- 丿 。-- 丶 /-- 乙(7)另定義“钅、木、氵、土、艸、日、月、人(亻)、口、扌”10個常用偏旁部首,作為比筆畫優(yōu)先的編碼元素;(8)“钅、木、氵、土、艸、日、月、人(亻)、口、扌”10個常用偏旁部首定義到“橫、豎、撇、捺、折、豎豎、豎撇、豎點、橫點、點豎”10個筆畫元素對應的鍵位中;(9)對于合體字輸入取該字陰部2鍵(一二筆畫1鍵、三四筆畫1鍵)、陽部2鍵(一二筆1鍵、三四筆1鍵)利用鍵盤相應鍵位輸入一個漢字;對于獨體字輸入取該字前4-6筆畫(一二筆畫1鍵、三四筆畫1鍵、五一六筆1鍵)利用鍵盤相應鍵位輸入一個漢字;(10)在輸入過程中,如取不足規(guī)則中所要求的筆畫數(shù),直接斷碼,末尾不加識別碼。
全文摘要
本發(fā)明采用漢字最明確的分部和筆畫信息進行編碼,使得本發(fā)明編碼的易學性遠遠超過現(xiàn)有任何拼音、筆畫之類的簡易碼,并且輸入速度不低于字根編碼。未接觸計算機、不熟悉英文鍵盤者學10分鐘即可較快地輸入任意漢字。
文檔編號G06F3/023GK1191340SQ96103708
公開日1998年8月26日 申請日期1996年3月24日 優(yōu)先權(quán)日1996年3月24日
發(fā)明者陳勁松 申請人:陳勁松