專利名稱:一種計(jì)算機(jī)漢字和漢字部件的輸入方法及其鍵盤的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字輸入方法,特別是指一種計(jì)算機(jī)漢字和漢字部件輸入方法及其鍵盤。
背景技術(shù):
目前的計(jì)算機(jī)漢字輸入方法,主要分為形碼、音碼和結(jié)合音形信息的音形碼或形音碼。 音碼是一種以字音信息為基礎(chǔ)的漢字編碼,目前大陸流行的音碼是"拼音輸入法", 拼音輸入法的優(yōu)點(diǎn)是容易學(xué)習(xí)、上手快,缺點(diǎn)是重碼率高,對(duì)于非常用的字詞和不懂發(fā)音 的漢字輸入較為困難。形碼是一種以字形信息為基礎(chǔ)的漢字編碼,多數(shù)以字根為編碼基礎(chǔ), 如五筆字型、鄭碼等,它們的優(yōu)點(diǎn)是重碼率比拼音碼大大降低,輸入速度較快,但缺點(diǎn)是 學(xué)習(xí)掌握的難度較大,需要記憶的東西太多, 一段時(shí)間不用就很容易忘記,而且多數(shù)的部 件拆分不符合字源字理,不利于漢字文化的傳承、教育和發(fā)展。另外也有一些結(jié)合音形或 者筆畫信息的漢字編碼,但基本上都一樣無法兼顧易學(xué)、高效、科學(xué)的矛盾。
我們大家知道,漢字最早是一些象形符號(hào),隨著社會(huì)的不斷發(fā)展,這些符號(hào)按照一些 規(guī)則組合成更加復(fù)雜的形體,代表更加復(fù)雜的意義。這些規(guī)則就是我們常說的六書。古代 把那些象形符號(hào)稱為"文",而合成出來的符號(hào)稱為"字",就是所謂的"獨(dú)體為文,合體 為字"之說。六書包含了漢字的造字法和用字法象形、指事、會(huì)意、形聲、假借、轉(zhuǎn)注。 漢代的許慎著述的《說文解字》對(duì)漢字的字源、字構(gòu)、意義,有著較科學(xué)全面的整理和記 述。漢字雖然經(jīng)過了幾千年的演變,但是這些基本的構(gòu)造原則一直沒有變化,也正是因?yàn)?漢字的這種巧妙的設(shè)計(jì),使得它成為如今世上僅存的一種表意文字?,F(xiàn)代漢字的獨(dú)體字, 就相當(dāng)于古代的"文",是負(fù)載有一定文化含義的基本元素。而現(xiàn)代漢字的合體字,就相 當(dāng)于古代的"字"。除了少量的指事、會(huì)意字外,約80%以上的合體字屬于形聲字。由于 經(jīng)過漫長(zhǎng)的演變,漢字產(chǎn)生了較大的形體改變,部分甚至出現(xiàn)了訛誤。從造字用字的角度 看,出現(xiàn)了大量用字分化、假借、弓l申、繁化、簡(jiǎn)化、變異等形態(tài),從而出現(xiàn)了大量的新 漢字和異體字,使得漢字這個(gè)家族的成員日趨龐大。但統(tǒng)計(jì)表明,在同一個(gè)時(shí)代里的實(shí)際
使用漢字?jǐn)?shù)量并不是很多,大約在5千 1萬左右。特別是常用的漢字,非常集中。因?yàn)?漢字的使用不是均等的,不同漢字具有不同的使用頻度,它們符合一定的分布規(guī)律。
既然漢字本來就是通過一些基本字形元素,通過一些原則組合起來的,那么就一定可 以分解還原出這些基本元素來。并對(duì)這些元素進(jìn)行序列化和編碼,從而得到漢字的完全信 息編碼。按照信息理論,不難證明這樣的方法是最佳的編碼方法。因?yàn)榛驹乇旧硎切?息的高度聚合體,它不是隨機(jī)的筆畫組合,而是具有穩(wěn)定形體的、負(fù)荷一定內(nèi)涵的筆畫組
合o
發(fā)明內(nèi)容
本發(fā)明的主要目的在于克服現(xiàn)有技術(shù)中計(jì)算機(jī)漢字輸入方法難學(xué)、不科學(xué)的缺點(diǎn),提 供一種易學(xué)、高效、科學(xué)的計(jì)算機(jī)漢字、漢字部件輸入方法及其鍵盤。
在對(duì)本發(fā)明的技術(shù)方案進(jìn)行詳細(xì)描述之前,對(duì)一些基本術(shù)語(yǔ)定義如下
構(gòu)件由一組筆畫組成,是組成漢字或部件的字形元素(零件)。
子字是組成漢字的一組具有穩(wěn)定形體和含義的筆畫組合。它是負(fù)荷有一定含義 的構(gòu)件,是組建復(fù)雜漢字的元素。也可稱為"偏旁"、"字塊"、"合成部件"等。
部件即不能繼續(xù)拆分的子字,是具備一定含義的最小漢字構(gòu)造單位,又稱為"字 根"、"基元"、"基礎(chǔ)部件"等。在本說明書中"部件"主要用來描述漢字的基本編碼元素, "字根"主要用來表述原始的拆分構(gòu)件。
義件漢字結(jié)構(gòu)中和漢字意義關(guān)聯(lián)的部件。合體字一般都有一個(gè)或一個(gè)以上的"義 件",不過經(jīng)過長(zhǎng)期演變,部分漢字"義件"的含義關(guān)聯(lián)己經(jīng)不明顯或者完全丟失。
部首統(tǒng)領(lǐng)一組漢字意義歸屬的基礎(chǔ)部件,它代表一族漢字的意義特征或共性歸 納,也是一般字典歸部的依據(jù)。
部首層次拆分首先拆出漢字的部首,剩下相應(yīng)的子字,再用同樣的方法拆出該 子字的部首,如此重復(fù)直到不可再拆為止,于是產(chǎn)生了一個(gè)部首序列。此過程即稱為部首 層次拆分。
義并是根據(jù)字根的字源、含義進(jìn)行歸并,凡是屬于"同源"的字根,雖然形體 產(chǎn)生了較大的演變,但他們的含義是一致的,所以看作是"等價(jià)字根",歸并為一個(gè)部件,
比如"水?氺"、"火"、、"、"心十"、"艸卄"等,它們的篆書字形其實(shí)是完全一樣的,含 義也是完全一樣的。
形并將一些形體接近,容易造成書寫、識(shí)認(rèn)錯(cuò)誤的字根進(jìn)行歸并,如"日曰口"、 "人入"、"*、卄"等,它們的本身雖然含義不同,形體也可以區(qū)分,但是他們?cè)跇?gòu)字過 程中經(jīng)常發(fā)生混淆、訛變。比如"最曾喝慢替"里面實(shí)際存在的是"曰"部件,但我們 很難和"日"區(qū)分。再比如"內(nèi)全"里面的"入"如今已經(jīng)訛變成了 "人"。為了不給大 眾造成太大的困擾,我們也將他們編碼歸并。但對(duì)于含義有別的成字部件一般都單獨(dú)設(shè)立 了自己的專用小類碼,以便區(qū)別。
部件認(rèn)同原則有一些字根雖然形狀不同但字源相同,含義也相同,我們把它視 作等價(jià)部件;還有一些字根可能字源和含義未必相同,但字形幾乎一樣,那么我們也將之 視作等價(jià)部件;在我們的編碼系統(tǒng)里它們被視作相同的元素,這就是部件認(rèn)同原則。
本發(fā)明是一種計(jì)算機(jī)漢字輸入方法,采用具有26個(gè)英文字母鍵的計(jì)算機(jī)鍵盤,其特 征在于包括如下步驟
(1)首先將漢字按照字源及構(gòu)字機(jī)理拆分為字根序列,并把這些字根(約400多個(gè)) 按照部件認(rèn)同原則整理歸納為300個(gè)左右的部件,作為漢字的基本編碼元素。
注這里之所以給出300個(gè)左右的部件這個(gè)約數(shù),是考慮到由于受到漢字集大小的影 響,當(dāng)我們分別考慮國(guó)標(biāo)GB2312-80字集的6763個(gè)漢字和大字符集7萬多個(gè)漢字時(shí),部 件的數(shù)量可能會(huì)略有增減,但相差極少。 一般一些極罕用的部件都已經(jīng)根據(jù)形并或者義并 的原則加以歸并??赡艿牟考?shù)目范圍為280 310。
然后,再將這些部件按照字源文化內(nèi)涵或者形似特征的原則進(jìn)行歸類,主要是采用義 并和形并的原則以及含義關(guān)聯(lián)程度進(jìn)行歸納,形成下面所示的28個(gè)大類。對(duì)于組字時(shí)容 易混淆或者難以區(qū)分的形似部件按照形似依附處理,比如"日、曰"組字時(shí)一般難以區(qū)分, 所以讓"曰"依附于"日",并入"日"類,不必理會(huì)"曰"含義是否和"日"有關(guān),在組 字時(shí)它們使用同樣代碼B。對(duì)于一些含義不明確的部件也采取形似認(rèn)定或依據(jù)它在組字中 的多數(shù)字源傾向進(jìn)行認(rèn)定和歸并,盡量做到最合理的分類,并保持編碼的一致性。
每個(gè)大類均按照形狀或讀音的聯(lián)想對(duì)應(yīng)到一個(gè)英文字母上,形成部件的大類碼,即是
部件的簡(jiǎn)易碼
自然日月金木水火土 B D J M S W T; 生命蟲草人體心口手K C R E Q 0 F; 民生民言衣食住行財(cái)N I Y U A L G;
字形八叉橫豎撇點(diǎn)折V X H S P D Z;
其中,"月"、"點(diǎn)"均對(duì)應(yīng)到D字母,"水"、"豎"均對(duì)應(yīng)到"S"字母。
上述的28大類的編碼映射,主要是根據(jù)象形和諧音來設(shè)計(jì),以便幫助學(xué)習(xí)和記憶。 部分還二者兼?zhèn)?,這使得學(xué)習(xí)起來非常容易,列舉如下-
象形日B月D金(刀J)木M水S火W 土t蟲(動(dòng)物K)人R <M r)體(耳E) 心Q口O手F言(ii)衣Y食U住A行L財(cái)G;
諧音草C民(女N)金J木M水S 土T人R體(耳E)。
(2) 部件的編碼和輸入每個(gè)部件由1 2個(gè)字母組成編碼,少數(shù)還允許由3個(gè)字母 組成。第一個(gè)字母即該部件的大類碼。第二、三個(gè)字母稱為部件的小類碼(或稱小碼、子 碼)。小類碼是按照部件的音形信息對(duì)應(yīng)到26個(gè)字母,即部件編碼=部件大類碼+部件小 類碼,部分部件僅有大類碼,而小類碼為空。
在實(shí)際運(yùn)用時(shí),部件的小類碼是可以任意省略的,這時(shí)部件編碼就是部件的簡(jiǎn)易碼。 部件的編碼就是部件的計(jì)算機(jī)表示方式,是本發(fā)明的核心內(nèi)容,通過部件編碼就可以把部 件輸入到計(jì)算機(jī)中,也可以由它拼裝出眾多的漢字或詞語(yǔ),此外還可以結(jié)合拼音、筆畫等 其他信息得到更多的運(yùn)用。
(3) 單字的編碼和輸入將漢字拆分成部件序列,并按照書寫順序或者部首層次拆
分順序排列,然后把部件替換為相應(yīng)的部件編碼,形成漢字的編碼,將之輸入計(jì)算機(jī),即
可得到相應(yīng)漢字。
使用不省略小類碼的部件碼構(gòu)成的漢字碼,稱為漢字的全息碼。 如果部分或全部部件省略了小類碼,那么構(gòu)成的編碼稱為該字的簡(jiǎn)易碼。
少數(shù)復(fù)雜的漢字還可以使用"子字組合法"來編碼,就是把漢字拆成2-4塊,看作一 個(gè)詞語(yǔ),然后進(jìn)行輸入。比如"警"也可以看作"敬言"或者"茍夂言"這個(gè)詞語(yǔ),再運(yùn)
用詞語(yǔ)編碼規(guī)則進(jìn)行輸入,此法同樣適用于拼音輸入法(稱為子字拼音法)。
(注本發(fā)明所說的單字或漢字,為廣義的漢字字符,包括UnJcode有編碼的各種象 形或表意符號(hào)、偏旁部首、部件等。)
(4) 少數(shù)部件在單獨(dú)輸入或者屬于漢字最末尾部件時(shí),允許設(shè)立有專用的小類碼。 所謂專用小碼,就是該小碼并不參與該部件的其他組字場(chǎng)合的編碼,也就是說僅僅當(dāng)它處 于單獨(dú)狀態(tài)或者字的末部件狀態(tài)時(shí)才使用。
(5) 詞語(yǔ)的編碼和輸入順序輸入組成詞語(yǔ)的各個(gè)漢字的編碼(全息碼或簡(jiǎn)易碼) 即可。其中每個(gè)漢字的編碼可以不必完整輸入,僅輸入其前面兩個(gè)或更多的字母即可;當(dāng) 詞語(yǔ)為髙頻詞語(yǔ)或者總碼長(zhǎng)達(dá)到4個(gè)字母以上時(shí),每個(gè)漢字的編碼可以省略為一個(gè)或更多 的字母。 一般對(duì)普通的雙字詞可以要求每個(gè)字輸入2碼,以減少重碼的幾率。
(注本發(fā)明所說的詞語(yǔ)為廣義的詞語(yǔ),包括詞組、短語(yǔ)等漢字串。)
前面所述的部件,具體的編碼映射安排如下,并附上簡(jiǎn)單的設(shè)計(jì)理由和助記特征
日B日、顏色。B是日的象形符號(hào)。 日B(r)曰B(v) 冒B(m)白By黑Bw黃Bx。
月D月。D是月亮的象形符號(hào)。 月D(v)夕D(x)丹D(a)且Dh。
金J金屬、兵器。J是金的拼音符號(hào),也是刀的象形符號(hào)。
刀J金Jr戈Jg斤Jn弓Jg戊Jp殳Jx矢Js弋Jy _介J干Jg 臨J矛Jm ~ 歸J %臧Ja。
木M木。M是木的拼音符號(hào)。 木M未Mv。
水S水。S是"水"的象形符號(hào),也是"水"的拼音符號(hào)。 水S 7 S(b) 當(dāng)S川S(c)。
火W火、天象、小字形。W是火的象形符號(hào),也是"多筆對(duì)稱體"的表征符號(hào)。 小W(x)火W(u)云Wy _亦講不Wb雨Wv尚Wa風(fēng)Wf氣Wq光Wr。土T土、 土山、石頭、懸崖、山谷。T是土的拼音符號(hào)。
土T [5 Te廠T(c)山Ta石Ti 士T(h)谷Tv阜Tf邑Ty。
蟲K動(dòng)物。K是動(dòng)物的象形符號(hào)。蟲是古代對(duì)動(dòng)物的總稱。 牛Kn犬Kq隹Kz羊Ky蟲Kc馬Km魚Kv豕Ks鳥Ki巴Kb盧Kh亥Kr ^ K j 象Kx龍Kl兔Kt鹿Kl秀Kz鼠Ks烏Kw雖Ki龜Kg。
草C草、十、植物。C是草的拼音符號(hào)。
廿(T禍C—六Cv升Cg十C(s)生C豐C(f)屮C生Cp廿Ch井Cj冊(cè)C(x)丌C 卅C(s)。
人R人形。R是人的拼音符號(hào),也是人的象形符號(hào)。 人R兒R(e) ARj個(gè)Rj入R(u) " R。
體E軀體、器官。E是"目eye、耳ear"的英文符號(hào),是"耳、而"的拼音符號(hào), 也是"耳"的象形符號(hào)。
目E尸Ei老El耳Ee見Er頁(yè)Ey自Ez欠Eq廣Eb而Eh舌Eo歹Ed皮Ep羽 Ev角Ej身Es面Ea毛Em骨Eg牙Ey髟Eb齒Ec飛Ef血Ex ft Eg囟Ex鼻Eb肉 Er卵El。
心Q心理、鬼神。Q是心的象形符號(hào),也是情的拼音符號(hào)。 心Q卜Q(b) 〃 Q示Qs —乍Q非Qv _才Q鬼Qg丄Q。
口 0口。 O是口的象形符號(hào)。 PI 0。
手F手、手部動(dòng)作。F是手的象形符號(hào)。 手F寸Fd力Fl工Fg _于F _舉F。
民N人類繁衍、人際。N是女的拼音符號(hào)。 大N(r)女Nv子Nz夫Nf母Nm氏Ns民Ni臣Nc毋Nw。
言I文化、i頭。I是"i "的象形符號(hào)。
言I工I方If六Iv ~享Io文Ix音lb高Io亡Iz冊(cè)Ic齊Ij直Iz曲Iq 熏 la龠Iv。衣Y衣飾。Y是衣的拼音符號(hào),也是衣的象形符號(hào)。
糸Y(s)衣Yi巾Yj也Y鄉(xiāng)Y幺Y(a)縣Yc革Yg韋Yw麻Ym -故Yb鄉(xiāng)Yx。食U食物、食器、器具。U是食器的象形符號(hào)。
匕U(b)禾U(h)竹Uz米Um甘Ug U U食Us酉Uy _化Uh皿Um兩Ul臼Uj豆 Ud斗Ud辛Ux北Uv吿Uf瓦Uw耒Ul鬲Ul瓜Ug香Ub麥Um卣Ul鼎Ud韭U j鬯 Uc。
住A居住A是房子的象形符號(hào)。
A^門A 口 Ak門Am廣Ag TO As戶Ah穴Av面Ax爿Aq -罕Av片Ap西Ax四 As肉Ac鬥Am wAx。
行L腳部動(dòng)作、出行。L是的象形符號(hào)。
i_L夂L止Lz立Li車Lc 4 L疋L(s)足Lu走Lt行Lx舟Lz之L LL—年L ^ L內(nèi)La丼L —條L亍L(c)。
財(cái)G財(cái)寶。G是"厶"和玉佩的象形符號(hào)。 厶G(s)田G(a)王G(w)貝Gb由Gy玉Gd壬Gr。
八V二、八字形。V是"、/"的象形符號(hào),也是"雙筆對(duì)稱體"的表征符號(hào)。 八V(b) 二V(e)。
叉X叉形、手、爪。X是"叉形"的象形符號(hào)。 又X 乂 X大X夂Xq 3 Xj爪Xz聿Xv支Xc _丈X釆Xm %臼Xx。
橫H橫筆、橫起筆部件。H是橫的拼音符號(hào)。 一H可Ho尤Hy匚Hk 丁 Hd七Hz五Hu甫Hp無H j辰Hc。
豎S豎筆。S是豎的拼音符號(hào)。
I S。
撇P撇筆、撇起筆部件。P是撇的拼音符號(hào)。
J P勺Pk幾P用Pv千Pq及Px九Pj丸Pd凡Pd 樂Pz 卬Pz。
點(diǎn)D點(diǎn)捺筆。D是點(diǎn)的拼音符號(hào)。
、Dc
折Z折筆、折起筆部件。Z是折的拼音符號(hào)和象形符號(hào)。
"Z L Z厶Z "] Zk卩Zj艮Zg 7 zj己Zj巳Z(s)乙Zy 已Z 發(fā)Z Lj Zs丑Zt。 注
1. 以上帶括號(hào)的小類碼代表專用小碼,僅僅限于該部件單獨(dú)運(yùn)用或?qū)儆跐h字的末部件 時(shí)使用,不參與其他組字情況的編碼。
2. 由于一些部件無法輸入電腦,本文采取了變通表示法,用前綴下劃線"—"、波浪號(hào) " "、百分號(hào)等符號(hào)來分別表示截取該字的前部件、后部件、或字架結(jié)構(gòu)。" "則
表示取其前一個(gè)部件,如"~歸"表示去掉右邊"日"后的字形,"~已"表示去掉后面的 "L"以后的形狀;"_"表示取后面字的后一個(gè)部件,如"一介"表示去掉"人"后的形 狀,"_六"表示去掉"、"后的形狀;"%"表示字架部件,如"%臧"表示去掉臣后的框 架,"%臼"臼分開為兩邊的框架。
所有用這樣方法表示的部件如下-
%臧%臼;
一丈—舉—乍_于—亦 一介—六—化—年—才—條;
~發(fā)~臨~樂 享 冒~北~卬 己 歸 當(dāng)~留 前~稟 敝~罕。
3. 一般一個(gè)大類里安排有一個(gè)或幾個(gè)代表性部件,稱為主根,通常設(shè)為單字母編碼, 而其余的字根則稱為副根。同一個(gè)大類的部件(字根)亦稱為同族字根。
小類碼的編碼是根據(jù)拼音或特征小部件來編碼,這些設(shè)計(jì)原則可以幫助初學(xué)者學(xué)習(xí)和 記憶
a)對(duì)于形體上可以進(jìn)一步分解的部件,我們一般取末尾構(gòu)件的類別作為小類碼,如 "見"可以細(xì)分為"目?jī)?所以小類碼為"R"(兒);但盡量避開同類的構(gòu)件,如行走類 的"走"可細(xì)分為土 + —足,但不取"一足"而取"土",因?yàn)?_足"也屬于"行走" 類。
說明這里所謂的可以細(xì)分,只是形體上的拆分,而不是"部件拆分",因?yàn)槲覀兙?碼的對(duì)象已經(jīng)是"部件","部件"的定義我們給出了它是最小的不可以拆分的部件了,所
以為了避免混亂,這里細(xì)分的元素暫且稱之為"構(gòu)件"。某種意義上,有些部件確實(shí)也算 是可以拆分的,理應(yīng)屬于合成部件,但由于這些"合成部件"多數(shù)是長(zhǎng)期穩(wěn)定使用的傳統(tǒng) 部首,它們已經(jīng)形成了自己的獨(dú)立意義,所以我們依然把它看作不可拆分的部件。
比如鼻=自畀(從自畀聲),殳=幾又(從又持幾),支=口又(從又持 卜),都可以進(jìn)一步拆開解釋,但它們整體的含義已經(jīng)相對(duì)地獨(dú)立了。
此外有些形體雖然可拆,但拆開的構(gòu)件已經(jīng)發(fā)生了訛變。
比如"香"小篆應(yīng)該拆解為黍甘,但楷書訛變?yōu)?b>禾日,而且"香"本身已經(jīng)有 了特定的含義了,所以我們把它作為基礎(chǔ)部件。
這就好比詞語(yǔ)是可以獨(dú)立運(yùn)用的最小語(yǔ)法單位。 一些詞語(yǔ)必須看作一個(gè)整體,不能 拆開為單字道理一樣,比如"馬上"不能理解為"馬的上面","馬上"從"詞語(yǔ)"層次來
說是不能拆分的,但從"字"級(jí)別看自然可以分解為"馬"和"上"。同理,部件"見" 從部件層次說,是最小不可分的元素。但從構(gòu)件一級(jí)看,可以再分解為"目?jī)?。
但本發(fā)明的編碼方法的最小編碼元素是"部件",雖然對(duì)于小類碼的編碼借助了一些 更細(xì)致的"構(gòu)件分解",但僅限于"小類碼"編碼設(shè)計(jì)這個(gè)環(huán)節(jié)的討論。
b)對(duì)于字形較為復(fù)雜,或者獨(dú)體的不易分解的基礎(chǔ)部件,我們多數(shù)使用聲母首字母 來作為小碼,少數(shù)使用韻母首字母。比如動(dòng)物類的"馬ma"用m,"虎hu"用h。 一般 遇到"yu"或其開頭的音,我們用"v"作為小碼,比如"魚Kv"、"聿Xv"、"羽Ev"、"月 Dv"等,這些都是很容易學(xué)習(xí)的。少部分用的是韻母首字母,比如"尸shi"小類碼i、 "石shi"小類碼i、"山shan"小類碼a。
為了保持編碼的一致性,類似動(dòng)物類這樣元素較多的類別基本上都統(tǒng)一用拼音來做小 碼。 一般同類型的部件小碼設(shè)計(jì)方法盡量保持一致,比如""見=目?jī)?、"光=火兒"都是 符合字源的拆法,它們的小碼都是"兒r"。
當(dāng)然也有少數(shù)小類碼需要稍多點(diǎn)的記憶。比如"面"用的是用"口"的類碼A做小 類碼,"金"用的是"人"的類碼R做小類碼。"且"細(xì)分為"月一",大類碼歸"月D", 小類碼取"一h"。
每個(gè)大類的代表部件或者頻度很高的部件設(shè)計(jì)為單碼部件(沒有小類碼)。
前述一種計(jì)算機(jī)漢字、漢字部件輸入方法,在進(jìn)行中英文模式切換時(shí),采用計(jì)算機(jī)鍵 盤上的Caps Lock鍵。
前述一種計(jì)算機(jī)漢字、漢字部件輸入方法,在計(jì)算機(jī)鍵盤上設(shè)有異體鍵,用于顯 示目前候選字的異體字、形近字、關(guān)聯(lián)字、訛誤字等密切有關(guān)的字,具體鍵位可自定義。
前述一種計(jì)算機(jī)漢字、漢字部件輸入方法,在計(jì)算機(jī)鍵盤上設(shè)有罕字鍵,用于顯 示罕用字的候選,具體鍵位可自定義。
前述一種計(jì)算機(jī)漢字、漢字部件輸入方法,在計(jì)算機(jī)鍵盤上設(shè)有簡(jiǎn)繁鍵,用于簡(jiǎn) 繁字的轉(zhuǎn)換,具體鍵位可自定義。按下該功能鍵時(shí),如果已經(jīng)處在輸入過程中,當(dāng)前候選 立即產(chǎn)生轉(zhuǎn)換。
前述一種計(jì)算機(jī)漢字、漢字部件輸入方法,在計(jì)算機(jī)鍵盤上設(shè)有詞語(yǔ)鍵,用于對(duì) 第一個(gè)候選的"詞語(yǔ)"進(jìn)行自動(dòng)上屏,具體鍵位可自定義,缺省為;。
前述一種計(jì)算機(jī)漢字、漢字部件輸入方法,在計(jì)算機(jī)鍵盤上設(shè)有單字鍵,用于過 濾掉詞語(yǔ)候選,只剩下單字候選,具體鍵位可以自定義,缺省為'或-,'除了 是拼音的音節(jié)分隔符外,在部件碼中也可以作為詞語(yǔ)中各個(gè)單字的分隔符,當(dāng)它位于編碼 末尾時(shí),則具有單字過濾功能,將把前面的編碼或從上一個(gè)分隔符起的編碼,僅看作單字 編碼,不會(huì)進(jìn)行智能切割。
前述一種計(jì)算機(jī)漢字、漢字部件輸入方法,在計(jì)算機(jī)鍵盤上設(shè)有精確鍵,按下時(shí), 則只匹配全部部件都已經(jīng)輸入的字詞,其余一律屏蔽,具體鍵位可自定義。
前述一種計(jì)算機(jī)漢字、漢字部件輸入方法,在計(jì)算機(jī)鍵盤上設(shè)有切詞鍵將自動(dòng)把 候選中的詞語(yǔ)全部拆散為單字,供選取,具體鍵位可以自定義。
前述一種計(jì)算機(jī)漢字、漢字部件輸入方法,在計(jì)算機(jī)鍵盤上設(shè)有幫助鍵,激活幫 助索引,導(dǎo)引初學(xué)者了解常用功能,或者進(jìn)入幫助文檔,具體鍵位可以自定義,缺省為?
鍵。
前述一種計(jì)算機(jī)漢字、漢字部件輸入方法,在計(jì)算機(jī)鍵盤上設(shè)有通配鍵,允許用 來替代某個(gè)不會(huì)輸入的編碼,具體鍵位可以自定義,缺省為?,模糊通配符為*。 由于經(jīng)過精心設(shè)計(jì),我們有了一份完美、科學(xué)的"部件"表。這些部件確保了我們對(duì)
漢字的拆分是容易的、直觀的、和自然的,同時(shí)拆分結(jié)果也是符合漢字字源字理,能夠很 好地傳承漢字的文化內(nèi)涵。
由于漢字結(jié)構(gòu)的復(fù)雜性,在實(shí)際的部件拆分中也有少數(shù)需要注意的規(guī)范和特殊規(guī)則。 基本規(guī)則
(1) 盡量按照書寫筆順拆分,盡量讓部件數(shù)量最少,常見部件優(yōu)先于罕見部件。 例如章拆為音十,不拆為立日十。
例如"辛、殳、羽、音、香、鼻、欠"均為基本部件,不再拆開。
(2) 在滿足(1)的前提下,能拆分離的就不拆相接的;能拆相接的就不拆交叉的。 例如"主"拆為、王分離,不拆為工土相接。
例如"半"拆為分離,不拆為D十交叉。 例如"朱"拆為j未相接,不拆為〃木交叉。
(3) 在滿足(1)、 (2)前提下,盡量避免單筆畫部件。 例如"午"拆為〃十,不拆為J干。
特例規(guī)則
(4) 字架結(jié)構(gòu)有些部件由于與其他部件重疊或交錯(cuò)的緣故,導(dǎo)致書寫時(shí)并非一次 性寫完,稱為"字架"部件。其部件間的順序以其首筆次序?yàn)闇?zhǔn)。
字架部件主要有"□、匚、戈(弋戊臧)、衣、木、禾、大、工、戈",例如 "衷"=衣+中
"束"=木+口
"哉"=十+戈+口。 "秉"=禾+3
"乘"=禾+北
(5) 共享結(jié)構(gòu)兩個(gè)部件由于組字時(shí)某個(gè)筆畫發(fā)生"串接"(連筆)或者"重疊"(疊 筆),導(dǎo)致了該筆畫變成"共享筆畫"。對(duì)此情景應(yīng)該把該共享筆畫復(fù)制一份看待。以下是 一些判定原則和舉例
(5.1)若不共享會(huì)讓部件數(shù)增多,而共享了部件數(shù)會(huì)減少,那么就共享。
連筆舉例
"我"=j凈戈,橫筆連在一起了,應(yīng)剪斷處理。
"制"=牛巾u,豎筆連在一起了,應(yīng)剪斷處理。 "里"=田土
"重"=千田土
"垂"=千卄士
"養(yǎng)戠戢"等,同理處理。
"果"=田木,豎筆連在一起了,應(yīng)剪斷處理。(未穿透的筆畫,有用則留)
疊筆舉例
"彖"=互豕
(5.2) 能簡(jiǎn)單拆開的則盡量不使用共享法則。例如 "哉"=十+戈+口,不拆為土+口+戈。
"卸"="一止,因?yàn)?午"不是字根。
(5.3) 穿插筆畫如非必要,則不共享。
若居后的某部件的一個(gè)筆畫,貫穿了前面的部件時(shí),而且抽離該筆對(duì)其不產(chǎn)生壞作用 (比如令部件數(shù)增多或使拆分復(fù)雜化),則抽離。
"棄"=一 曰—足","—足"的豎筆上伸入"一3",均為穿透,而且抽離后也不
影響那兩個(gè)部件。所以抽離處理。以下同理。 "事"=一口中
"史"=口乂
"串"=口口 I
"曳"=日< J
"兼"=n曰 一亦
"隸"=曰氺
"妻"=一中女
"禹"=J 口內(nèi)
(5.4)如果該筆為非穿透狀態(tài),并對(duì)前面部件的構(gòu)成有作用,則剪斷處理。例如 "果"=田木。木的豎筆并未穿透上個(gè)部件,所以上個(gè)部件保留該筆,視作"田"。 "制"=牛巾U。"巾"的豎筆延伸到上面部件,構(gòu)成了 "牛"部件,抽離則不成 部件,故共享。
(6)以下幾個(gè)漢字的下部的六"一八字形,從字源來看一般是"升"或"丌" 的變體,是"用雙手捧著"或"基腳"的意思。拆分時(shí)需把它拆開如下 共=* —六
其=甘_六
具=目_六,"真"字類推。 興=7 _六
兵=斤—六
典=冊(cè)—六
輿=n車—六,"興與舉"類推。
本發(fā)明還可以派生出一種漢字部件鍵盤,把部件或者大類標(biāo)識(shí)直接印在英文字母鍵盤 的相應(yīng)的鍵帽上,形成漢字部件鍵盤。
和現(xiàn)有技術(shù)相比,本發(fā)明的計(jì)算機(jī)漢字、漢字部件輸入方法具有如下特征及優(yōu)點(diǎn)
(1) 基于漢字的字源和構(gòu)字原理進(jìn)行拆分,以傳統(tǒng)的部首為基礎(chǔ),符合語(yǔ)文規(guī)范,
很好地實(shí)現(xiàn)漢字文化的傳承;
(2) 包含漢字形體結(jié)構(gòu)的全部信息,是一種全息編碼。不僅能見字識(shí)碼,而且能見 碼識(shí)字,這是現(xiàn)有的所有編碼做不到的;
(3) 所有的部件幾乎都有唯一的編碼(1-2字母),所以幾乎不丟失漢字的信息;
(4) 將部件科學(xué)地歸納為28個(gè)大類,初學(xué)者只需要記住這28大類就可以開始打字, 幾乎沒有學(xué)習(xí)難度;
(5) 編碼擷取了全部的漢字部件信息,不做類似"前三末一"的殘缺選擇,不做碼 長(zhǎng)的限制,漢字的編碼是由它的全部部件的編碼羅列而成,而部件本身編碼幾乎是唯一的,
所以漢字信息幾乎不丟失;
(6) 母字和子字的編碼機(jī)理一致,漢字子字的編碼, 一定包含在母字編碼之中,而 且彼此編碼原理完全一樣,比如"菇"包含了子字"姑",那么"菇"的編碼CNC0, 一 定包含"姑"的編碼NC0;同理"姑"包含了子字"古",那么"姑"的編碼NCO, —定
包含"古"的編碼C0;
(7) 詞語(yǔ)和單字編碼機(jī)理一致,"詞語(yǔ)是由一組漢字組成",和"漢字是由一組部件
組成",可以類比看待,也就是說,詞語(yǔ)編碼和漢字編碼原理是統(tǒng)一的,所以不需要另外
學(xué)習(xí)詞語(yǔ)規(guī)則比如"日月"這個(gè)詞的編碼是BD,"明"這個(gè)字的編碼也是BD,因?yàn)樗麄?的部件序列是一致的,你可以把"樹"字假想成"木又寸"這個(gè)"詞語(yǔ)",進(jìn)行編碼。所 以,本編碼方法是一種真正的全息編碼。
和現(xiàn)有技術(shù)相比,本發(fā)明的計(jì)算機(jī)漢字、漢字部件輸入方法還具有如下優(yōu)點(diǎn)
1,部件拆分符合字源字理,漢字的拆分是根據(jù)漢字造字的原理進(jìn)行的,300個(gè)左右 的部件幾乎都是傳統(tǒng)漢字部首;
2,按照部件的文化內(nèi)涵進(jìn)行分類,把部件歸納為28個(gè)大類,符合漢字造字的科學(xué)性;
3, 幾乎不受新舊字形和簡(jiǎn)繁字形的干擾,換句話說, 一般同一個(gè)字,我們?cè)趺摧斎? 港臺(tái)人士也可以怎么輸入,不需要分為兩套編碼,比如"鮮、鮮"是KvKy,"說、説、說" 都是IV0V;
4, 幾乎不受筆順爭(zhēng)議的影響,這是許多基于筆畫信息的編碼無法做到的;
5, 可以適應(yīng)已經(jīng)收入到Unicode中的全部7萬多個(gè)漢字的輸入,并且可以無限擴(kuò)展;
6, 沒有碼長(zhǎng)限制,沒有人為的部件取舍,有多少部件就取多少部件,確保漢字信息 不損耗。
總之,本發(fā)明的一種計(jì)算機(jī)漢字、漢字部件輸入方法易學(xué)、高效、科學(xué),對(duì)于繼承中 華民族幾千年的漢字文化具有重大意義,值得大力推廣使用。
圖1為本發(fā)明的漢字部件鍵盤的部分結(jié)構(gòu)示意圖。
具體實(shí)施例方式
本發(fā)明的計(jì)算機(jī)漢字、漢字部件輸入方法,首先將組成漢字的所有字根按照義并和形 并的原則歸納為300個(gè)左右的部件(見前面的列表),
再將這些部件按照含義接近、互相關(guān)聯(lián)、形體類似的原則歸類,形成28個(gè)大類(見 前面的列表)。
并給每個(gè)部件定義了 l-2個(gè)字母的編碼(見前面列表)。
在將部件編碼完成后,將漢字或詞語(yǔ)拆分成部件,進(jìn)行編碼,按照編碼順序由計(jì)算機(jī) 鍵盤上的26個(gè)英文字母鍵輸入計(jì)算機(jī)。
當(dāng)我們打開本輸入法,并處于"部件輸入模式"時(shí),我們敲入一個(gè)漢字的的全息編碼 或者簡(jiǎn)易碼,就可以輸入相應(yīng)的漢字。全息編碼和任意省略小類碼的簡(jiǎn)易碼,均可以無切 換地輸入,它們統(tǒng)稱為"部件碼"。
在實(shí)際輸入時(shí),只需要輸入編碼的前面部分,軟件就會(huì)把部分匹配字詞顯示出來,供 選擇。如果需要的漢字已經(jīng)處于首選位置,那么直接敲入空格就可以上屏。如果處在其他 序號(hào)位置,那么需要敲入相應(yīng)的序號(hào)進(jìn)行輸入。如果第一頁(yè)沒有看到,也可以用翻頁(yè)鍵進(jìn) 行翻頁(yè),直到看到需要的漢字,再輸入相應(yīng)的序號(hào)。 一般地,對(duì)于初學(xué)者,只需要輸入一 個(gè)漢字的前面兩三個(gè)部件的簡(jiǎn)易碼就可以了,常用漢字一定會(huì)出現(xiàn)在首選或者首頁(yè),罕用 漢字則需要進(jìn)行翻頁(yè)。對(duì)于詞語(yǔ), 一般也是輸入4個(gè)字母左右就可以得到該詞語(yǔ)。對(duì)于熟 練的盲打者,最好輸入較完整的編碼,也就是對(duì)于單、雙部件的漢字盡量輸入全息碼,多 部件漢字則多數(shù)可以輸入為3至4碼的簡(jiǎn)易碼,少數(shù)較罕用的漢字有可能需要輸入5碼或 更多碼。
由于全息碼的精心設(shè)計(jì),實(shí)際上只要熟練掌握一些常用漢字的輸入,基本上就解決了 全部漢字的輸入。因?yàn)?,本方案的全息特征確保了任何一個(gè)"子字"的編碼和母字保持相 包容的關(guān)系。
比如
你會(huì)輸入"姑NCO"就一定會(huì)輸入"菇CNCO",因?yàn)橹灰懊嬖黾?*C",其后面則 完全照打。你會(huì)輸入"寺TFd",就會(huì)輸入"等UTF"、"特KTF"、"持FTF"、"待LTF"、"詩(shī) ITF"等等。你會(huì)輸入"青CD",就會(huì)輸入"情QCD"、"請(qǐng)ICD"、"清SCD"、"精UCD"、"靜
CDR"等等。哪怕是從來不認(rèn)識(shí)的字,如"錆JCD"、"戠CDW",也是一瞬間輸入,因?yàn)槎?包含"青CD"這個(gè)"子字的編碼"。熟練后,幾乎就會(huì)變成下意識(shí)的習(xí)慣動(dòng)作。不像其他 的編碼,需要類似"前三末一"這樣的取碼規(guī)則,那樣將造成以上特征不一定成立。這就 是"全息"的好處。 實(shí)施例一漢字全息編碼輸入
按照漢字的書寫順序得到的部件序列,稱為漢字的全息部件序列。把部件替換成相應(yīng) 的字母編碼后,得到的字母序列,我們稱之為漢字的全息字母編碼,簡(jiǎn)稱為漢字全息部件 碼(或全息碼),在不會(huì)和后述的"簡(jiǎn)易碼"產(chǎn)生混淆時(shí)也可以直接簡(jiǎn)稱為部件碼。部件 序列不限制長(zhǎng)度,必須包括全部的漢字部件,同樣轉(zhuǎn)譯成字母也是。所以稱之為全息碼。
全息碼示例
漢=?又=S X;
字=A子=A Nz;編=纟戶冊(cè)=Y Ah Ic;碼=石馬=Ti Km;示=示=Qs;例=4歹iJ=R Ed J。
我們使用大寫字母表示大類碼,小寫字母表示小類碼,這樣容易區(qū)分,并確保編碼連 寫的時(shí)候可以區(qū)隔部件邊界,但是在本編碼用于本發(fā)明的計(jì)算機(jī)漢字輸入時(shí),則可以不區(qū) 分大小寫。
實(shí)施例二漢字簡(jiǎn)易碼輸入
編碼方案給出了全息碼的簡(jiǎn)易編碼形式。簡(jiǎn)易碼也就是全息部件編碼省略了全部或 部分小類碼的編碼。
簡(jiǎn)易碼設(shè)計(jì)的目的是
(1) 給初學(xué)者很低的門檻,只需要懂28個(gè)大類就可以打字。
(2) 縮短復(fù)雜漢字的碼長(zhǎng), 一般3個(gè)部件以上的漢字,鼓勵(lì)使用簡(jiǎn)易碼輸入。
由于經(jīng)過精心的互斥設(shè)計(jì),同一大類的部件互斥度很高,小類碼負(fù)荷的信息量不高, 省略它造成的信息損失不多,僅僅在雙部件漢字中重碼較為明顯。如果一個(gè)漢字由三個(gè)部 件或以上組成時(shí),實(shí)際上簡(jiǎn)易碼已經(jīng)很少會(huì)重碼。所以即便是"熟練的盲打者",只要遇 到三個(gè)部件或更多部件的漢字,大可以直接輸入簡(jiǎn)易碼。
但對(duì)于單部件或者雙部件漢字來說,簡(jiǎn)易碼重碼會(huì)比較多,所以除了常用字以外,可 能需要進(jìn)行重碼選擇。不過重碼還是比拼音少得非常多,而且對(duì)于多數(shù)常用字來說由于髙 頻先見的排列,基本上屬于首選,直接空格就可以。
對(duì)于初學(xué)者來說,簡(jiǎn)易碼大大降低了學(xué)習(xí)的難度,幾乎介紹完28個(gè)大類,及各自包 含的部件后,就可以上機(jī)打字了。而且對(duì)于復(fù)雜構(gòu)造的漢字,簡(jiǎn)易碼避免的冗長(zhǎng)的全息編 碼輸入,大大提高輸入效率。
對(duì)于全部省略小類碼的部件碼,我們稱為"純簡(jiǎn)易碼",簡(jiǎn)稱簡(jiǎn)易碼,或簡(jiǎn)碼。對(duì)于 省略部分小類碼的部件碼,我們也泛稱之為"簡(jiǎn)易碼"或"簡(jiǎn)略碼"。如果拿目前流行的 "全拼、簡(jiǎn)拼、混拼"來類比,那么這里的"全息部件碼、純簡(jiǎn)易碼、簡(jiǎn)略碼"就可以稱 為"全形、簡(jiǎn)形、混形"了。
一般情況下,對(duì)二部件漢字,建議至少對(duì)其中一個(gè)部件增加小類碼,做成3個(gè)字母的 編碼,這樣就幾乎沒有了重碼。
簡(jiǎn)易碼示例
部=立口|5=全息Li 0 Te=簡(jiǎn)易LiOT=純簡(jiǎn)易L 0 T;輸=車A月ij=全息Lc Rj D J=簡(jiǎn)易LRjDJ=純簡(jiǎn)易L R D J。 實(shí)施例三詞語(yǔ)簡(jiǎn)易碼輸入
詞語(yǔ)也有相應(yīng)的"簡(jiǎn)易編碼",除了擷取單字的簡(jiǎn)易編碼組成的詞語(yǔ)簡(jiǎn)易碼外,我們
還允許對(duì)每個(gè)單字的編碼進(jìn)行省略(允許縮短到前2個(gè)字母或更多),由此構(gòu)成詞語(yǔ)的簡(jiǎn) 易編碼。而且,對(duì)于常用詞語(yǔ),只要總碼長(zhǎng)達(dá)到4個(gè)字母或者詞語(yǔ)屬于高頻詞語(yǔ)時(shí),那么 也允許每個(gè)漢字碼縮短為第一個(gè)字母。如果一個(gè)漢字本身的全息碼就比允許省略的長(zhǎng)度還 短,那么就用全碼即可。 比如
計(jì)算機(jī)=i十竹目升木幾=全息I~C Uz-M-P=簡(jiǎn)易ICUECMP=簡(jiǎn)
略ICUEMP=最簡(jiǎn)略IUMP=最簡(jiǎn)略ICUM。
人家=人a豕=全息碼R AKs=簡(jiǎn)易碼RAK。
我們=j孑戈4門=全息PFJg RAm=簡(jiǎn)易PFJRA=簡(jiǎn)易PFRA。
中國(guó)人民=全息0S AkGd R Ni=省略小碼OS AG R N=部分省略字尾OS Ak
R N=最簡(jiǎn)略0ARN。
(碼長(zhǎng)夠4個(gè)字符,所以每個(gè)漢字可以簡(jiǎn)省到l個(gè)字符就夠了)
實(shí)施例四部首碼
對(duì)于漢字的編碼, 一般按照書寫順序排列拆分出來的部件,遇到某個(gè)部件不是一次性 書寫時(shí),只要考慮第一筆即可,即第一筆寫了就等同該部件寫了。這是最自然和常用的編 碼方式。
此外,漢字的編碼還可以設(shè)計(jì)成以"部首層次拆分"順序來排列部件,通常應(yīng)用于字 典正文的編排。這樣的話,總是各層次的部首優(yōu)先在前面,優(yōu)點(diǎn)是(1)相同部首的漢字 會(huì)排列在一起,有利于字典按義部編排。(2)—般部首是比較醒目的部件,也是漢字的"義 件",有利于迅速抓住漢字特征。當(dāng)然,部首優(yōu)先也有其弊端,因?yàn)橛性S多漢字部首位置 并不容易確定,在實(shí)際應(yīng)用時(shí)可根據(jù)需要選擇。 以下是部首全息碼的例子
運(yùn)=1_云=LWy
動(dòng)=力云=FlWy;
例=< I』歹=RJEd。 實(shí)施例五部件的編碼和輸入方法-
部件是構(gòu)成漢字和詞語(yǔ)的基本元素,根據(jù)本發(fā)明設(shè)計(jì)的部件編碼,很容易對(duì)各種部件進(jìn)行 編碼表示和計(jì)算機(jī)輸入,如
"口"=0,"木,,=M,""=S、"羊"=Ky,"馬"=Km,"卑"=Yi
實(shí)施例六 一種漢字部件鍵盤
參照?qǐng)Dl,為本發(fā)明的一種漢字部件鍵盤的部分結(jié)構(gòu)示意圖,把大類標(biāo)識(shí)直接印在英
文字母鍵盤的相應(yīng)的鍵帽上,形成漢字部件鍵盤,鍵盤的其他部分結(jié)構(gòu)同普通的PC鍵盤
相同。
上述僅為本發(fā)明的幾個(gè)具體實(shí)施例,但本發(fā)明的設(shè)計(jì)構(gòu)思并不局限于此,凡利用此構(gòu) 思對(duì)本發(fā)明進(jìn)行非實(shí)質(zhì)性的改動(dòng),均應(yīng)屬于侵犯本發(fā)明保護(hù)范圍的行為。 附錄 一些字根變體清單
一些字根由于屬于同源、同形、簡(jiǎn)繁體、新舊字形等關(guān)系而被看作等價(jià)部件或變體部 件,在本說明書中它們視作同一個(gè)編碼元素,一般使用其代表性的主形字根來表達(dá),如"水" 就可以代表"?氺"等。以下是一些常見的變體
門( 周)、囪囪、戶戶戸 所、門門、4爿、^兩、黑黒、黃黃、
廿艸卄(++)、豐舉、月冃、丹円、面靣、齒齒、歹步、飛飛、骨fl、老少、
身D 、見見、頁(yè)頁(yè)、手凈、工-、無先、匚匸、尤尤、言i 、冊(cè)冊(cè)、齊齊斉、 高髙、聿中*—爭(zhēng)、刀IJ勿U 州、戈~堯、金韋、龜龜亀、虎產(chǎn)、鳥鳥( 島)、 黽黽、互~錄、龍龍、馬馬、牛年&、犬3 、兔兎、魚魚、烏烏、羊^圭、疋正、
夂夂夕、;L定、內(nèi)(—禺)、車車、足足、止(—足)、木本、毋毋、卜 占、
心十小、、示灃、々夕、水?氺_豕—眾~益、川(〈U〈—巟、7 、、、 I J 、廠廠、
兩0両兩、鹵鹵鹵卣、麥麥、食個(gè)食、酉菲、竹"、八v、—亦 業(yè)(業(yè)_亞 一亜—虛)、
小、"、火,、、、、尚a、風(fēng)風(fēng)、乂、又^、 3(~隸)、夂支、爪^、糸纟糸、縣長(zhǎng)長(zhǎng)、
衣卑、韋韋、~已(-)、 h勺、< 〈口厶、~即艮、卩卩卩。
權(quán)利要求
1、一種計(jì)算機(jī)漢字輸入方法,采用具有26個(gè)英文字母鍵的計(jì)算機(jī)鍵盤,其特征在于包括如下步驟(1)首先將全部漢字按照字源及構(gòu)字機(jī)理拆分為字根序列,并把這些字根按照部件認(rèn)同原則歸納為280~310個(gè)部件,即編碼元素,再將這些部件按照字源文化內(nèi)涵或者形似特征的關(guān)聯(lián)性原則進(jìn)行歸類,形成如下所示的28個(gè)大類日月金木水火土;蟲草人體心口手;民言衣食住行財(cái);八叉橫豎撇點(diǎn)折;每個(gè)大類按照形狀或讀音的聯(lián)想對(duì)應(yīng)到一個(gè)英文字母上,形成部件的大類碼;(2)每個(gè)部件由1~2個(gè)字母組成編碼,個(gè)別的允許為3個(gè)字母,第一個(gè)字母為該部件的大類碼,第二、三個(gè)字母稱為部件的小類碼,即部件編碼=部件大類碼+部件小類碼,部分高頻部件僅有大類碼,而小類碼為空;小類碼是按照部件的音形信息對(duì)應(yīng)到26個(gè)英文字母;部件編碼在實(shí)際應(yīng)用時(shí)其小類碼允許任意省略;(3)單字的編碼和輸入將漢字拆分成部件序列,并按照書寫順序或者部首層次拆分順序排列,然后把部件替換為相應(yīng)的部件編碼,形成漢字的編碼,將之輸入計(jì)算機(jī),即可得到相應(yīng)漢字;在輸入計(jì)算機(jī)時(shí)可采用由完整的部件編碼構(gòu)成的漢字編碼來輸入,即全息碼輸入;也可采用部分或全部部件省略了小類碼的漢字編碼輸入,即簡(jiǎn)易碼輸入。
2、 如權(quán)利要求1所述的一種計(jì)算機(jī)漢字輸入方法,其特征在于(1) 少數(shù)部件在單獨(dú)編碼或者屬于漢字最末尾部件時(shí),允許設(shè)立其專用的小類碼;(2) 詞語(yǔ)的編碼和輸入順序輸入組成詞語(yǔ)的各個(gè)漢字的編碼(全息碼或簡(jiǎn)易碼) 即可,其中每個(gè)漢字的編碼可以省略為前面兩個(gè)或更多的字母;當(dāng)詞語(yǔ)為髙頻詞語(yǔ)或者總 碼長(zhǎng)達(dá)到4個(gè)字母以上時(shí),每個(gè)漢字的編碼可以省略為一個(gè)或更多的字母。
3、 一種計(jì)算機(jī)漢字部件輸入方法,采用具有26個(gè)英文字母鍵的計(jì)算機(jī)鍵盤,其特征 在于 (1) 首先將全部漢字按照字源及構(gòu)字機(jī)理拆分為字根序列,并把這些字根按照部件 認(rèn)同原則歸納為280 310個(gè)部件,即編碼元素,再將這些部件按照字源文化內(nèi)涵或者形 似特征的關(guān)聯(lián)性原則進(jìn)行歸類,形成如下所示的28個(gè)大類日月金木水火土; 蟲草人體心口手;民言衣食住行財(cái); 八叉橫豎撇點(diǎn)折;每個(gè)大類按照形狀或讀音的聯(lián)想對(duì)應(yīng)到一個(gè)英文字母上,形成部件的大類碼;(2) 每個(gè)部件由1 2個(gè)字母組成編碼,個(gè)別的允許為3個(gè)字母,第一個(gè)字母為部件 的大類碼,第二、三個(gè)字母為部件的小類碼,即部件編碼=部件大類碼+部件小類碼,部 分高頻部件僅有大類碼,而小類碼為空;小類碼是按照部件的音形信息對(duì)應(yīng)到26個(gè)英文 字母;(3) 部件本身的輸入以及它在包含部件的各種編碼應(yīng)用時(shí),均可按照上述編碼方法 輸入計(jì)算機(jī),在輸入過程中小類碼允許任意省略。
4、 如權(quán)利要求3所述的一種計(jì)算機(jī)漢字部件輸入方法,其特征在于部分典型的大 類編碼設(shè)置如下金J木M水S火W土T蟲K草C人R心Q 口O手F言I衣Y。
5、 如權(quán)利要求3所述的一種計(jì)算機(jī)漢字部件輸入方法,其特征在于所述28個(gè)部件 大類與26個(gè)英文字母的映射關(guān)系如下日月金木水火土 B D J M S W T; 蟲草人體心口手K C R E Q 0 F; 民言衣食住行財(cái)N I Y U A L G; 八叉橫豎撇點(diǎn)折V X H S P D Z。
6、 如權(quán)利要求3所述的一種計(jì)算機(jī)漢字部件輸入方法,其特征在于所述部件的小 類碼的編碼按照以下原則制定(1)對(duì)于形體上可以進(jìn)一步分解的部件,取其末尾構(gòu)件的大類碼作為小類碼,當(dāng)末 尾構(gòu)件的大類碼與部件的大類碼相同時(shí),則取除末尾構(gòu)件外的其他構(gòu)件的大類碼作為小類 碼;(2) 對(duì)于獨(dú)體的或者字形較為復(fù)雜不易分解的部件,使用聲母首字母或韻母首字母 作為小類碼;(3) 每個(gè)大類的代表部件或者頻度很髙的部件設(shè)計(jì)為單碼部件(沒有小類碼);(4) 盡量保持同類編碼的一致性;少數(shù)部件為了避免小類碼沖突時(shí),可采取特殊指 定的小類碼。
7、如權(quán)利要求3所述的一種計(jì)算機(jī)漢字部件輸入方法,其特征在于部分典型的部 件編碼設(shè)置如下曰日B(r);月月D(V);金刀J金Jr;木木M未Mv;水水S;火小W(X)—亦W;土土T山Ta石Ti;蟲犬Kq羊Ky蟲Kc馬Km魚Kv產(chǎn)Kh象Kx兔Kt;草卄C 承C豐C(f)屮C廿Ch井Cj;人人R入R(u);體目E自Ez舌Eo歹Ed皮Ep羽Ev角Ej;心心Q示Qs鬼Qg;□no;手手F;民女Nv子Nz夫Nf母Nm氏Ns;言言I工I六IV 享l0文IX;衣糸Y(s)衣Yi巾Yj縣Yc韋Yw; 食禾U(h)竹Uz UU食Us酉Uy擊Uf;住A^門A穴Av面Ax西Ax;行i_L車Lc《L i_L;財(cái)王G(w)貝Gb;八八V(b);叉乂X大X;橫一H可Ho尤Hy;豎I S;撇〗P幾P;點(diǎn)、D;折"z Lz Z_Z。
8、如權(quán)利要求3所述的一種計(jì)算機(jī)漢字部件輸入方法,其特征在于所述部件的編 碼安排如下日日B(r)曰B(v) 冒B(m)白By黑Bw黃Bx;月月D(v)夕D(x)丹D(a)且Dh;金刀J金Jr戈Jg斤Jn弓Jg戊Jp殳Jx矢Js弋Jy _介J干Jg 臨J矛 Jm ~歸J %臧Ja;木木M未Mv;水水S 7 S(b) &'S川S(C);火小W(x)火W(u)云Wy 一亦W不Wb雨Wv尚Wa風(fēng)Wf氣Wq光Wr;土土T |5 Te廠T(c)山Ta石Ti 士T(h)谷Tv阜Tf邑Ty;蟲牛Kn犬Kq隹Kz羊Ky蟲Kc馬Km魚Kv豕Ks鳥Ki巴Kb產(chǎn)Kh亥Kr互 Kj象Kx龍Kl兔Kt鹿Kl豸Kz鼠Ks烏Kw黽Ki龜Kg;草廿C tSH六Cv升Cg十C(s)主C豐C(f)屮C生Cp廿Ch井Cj冊(cè)C(x) 丌C卅C(s);人人R兒R(e) ARj^Rj入R(u)々R;體目E尸Ei老El耳Ee見Er頁(yè)Ey自Ez欠Eq廣Eb而Eh舌Eo歹Ed皮 Ep羽Ev角Ej身Es面Ea毛Em骨Eg牙Ey髟Eb齒Ec飛Ef血Ex ft Eg囟Ex鼻 Eb肉Er;心心Q卜Q(b) 〃Q示Qs _乍(3非Qv 一才Q鬼Qg丄Q;□no;手手F寸Fd力Fl工Fg _于F _舉F;民大N(r)女Nv子Nz夫Nf母Nm氏Ns民Ni臣Nc毋Nw;言言I工I方If六Iv 享Io文Ix音lb高Io亡Iz冊(cè)Ic齊Ij直Iz曲 Iq -豕la龠Iv;衣糸Y(s)衣Yi巾Yj也Y鄉(xiāng)Y幺Y(a)縣Yc革Yg韋Yw麻Ym -故Yb鄉(xiāng)Yx;食匕U(b)禾U(h)竹Uz米Um甘Ug U U食Us酉Uy —化Uh皿Um兩Ul臼 Uj豆Ud斗Ud辛Ux北Uv缶Uf瓦Uw耒Ul鬲Ul瓜Ug香Ub麥Um卣Ul鼎Ud韭 Uj鬯Uc;住A^門A 口 Ak門Am廣Ag TO As戶Ah穴Av面Ax爿Aq ~罕Av片Ap西 Ax四As閨Ac鬥Am岡Ax;行LL夂L止Lz立Li車Lc ^ L疋L(s)足Lu走Lt行Lx舟Lz之L J_ L _年L ^ L內(nèi)La丼L _條L亍L(c);財(cái)厶G(s)田G(a)王G(w)貝Gb由Gy玉Gd壬Gr;八八V(b) 二V(e);叉又X 乂 X大X夂Xq 3 Xj爪Xz聿Xv支Xc _丈X釆Xm %臼Xx;橫一H可Ho尤Hy匚Hk 丁Hd七Hz五Hu甫Hp先H j辰Hc;豎I S;撇j P勺Pk幾P用Pv千Pq及Px九Pj丸Pd凡Pd 樂Pz 卬Pz;點(diǎn)、D;折"Z L Z厶Z "1 Zk P Zj艮Zg 7 Zj己Zj巳z(s)乙Zy 已Z 發(fā)Z 4 Zs丑Zt;(括號(hào)中的小類碼表示專用小類碼)。
9、 一種漢字編碼鍵盤,其特征在于根據(jù)權(quán)利要求1或3所述的漢字部件分類和編 碼方案,把代表性部件或者大類名稱直接印在英文字母鍵盤的相應(yīng)的鍵位上,形成漢字編 碼鍵盤。
全文摘要
本發(fā)明描述了一種漢字和漢字部件的計(jì)算機(jī)輸入方法,將組成漢字的部件,按照字源含義和形似特征劃分成28個(gè)大類,對(duì)應(yīng)到計(jì)算機(jī)鍵盤上的26個(gè)英文字母,形成部件的大類碼。此外,多數(shù)部件還根據(jù)其音形信息配置了一個(gè)實(shí)際使用時(shí)可以省略的小類碼,使得每個(gè)部件被表達(dá)為1~2個(gè)字母的編碼。而后將漢字按照書寫順序或者部首拆分順序拆分成部件序列,并代之以部件編碼,從而實(shí)現(xiàn)漢字和詞語(yǔ)的編碼表達(dá)及其計(jì)算機(jī)輸入。本輸入法易學(xué)難忘、合理高效,值得推廣。其編碼方案符合漢字的構(gòu)造機(jī)理,有利于漢字文化的繼承,還可適用于字典編纂、文字教學(xué)、漢字排序和檢索等領(lǐng)域。
文檔編號(hào)G06F3/023GK101393482SQ20081017472
公開日2009年3月25日 申請(qǐng)日期2008年10月24日 優(yōu)先權(quán)日2008年7月18日
發(fā)明者謝振斌 申請(qǐng)人:謝振斌