專利名稱:漢字形態(tài)數(shù)字編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字的編碼方法,適用于電腦輸入與查字典。
漢字編碼方法已有幾百種,各有所長(zhǎng),也各有其短。常見的有字形編碼(如五筆字型),首尾碼,拼音碼,區(qū)位碼,自然碼等等。拼音碼易學(xué)易掌握,但重碼太多,翻頁(yè)選字相當(dāng)麻煩。區(qū)位碼無(wú)重碼,但不便記憶。五筆字型輸入速度快,效率高,容易實(shí)現(xiàn)盲打,但掌握比較困難,基本字根130個(gè),拆字往往搞不準(zhǔn),特別是末筆識(shí)別碼帶來(lái)許多麻煩。
本發(fā)明的目的是提供一種易學(xué)易記,電腦輸入速度較快,重碼選擇基本不翻頁(yè)的漢字編碼方法,同時(shí)將編碼應(yīng)用于查字典,使?jié)h字電腦輸入與查字典融為一體。
本發(fā)明的目的是這樣實(shí)現(xiàn)的根據(jù)漢字的基本結(jié)構(gòu)和筆順將漢字編成4碼,用4個(gè)數(shù)字表示。將漢字依據(jù)結(jié)構(gòu)形態(tài)分成獨(dú)點(diǎn)、獨(dú)線、縱離、單折、單交、口形、人形、雙折、橫離、雙交10類字基,依次用0~9數(shù)字表示,另有金、王、竹分別用10,11,12表示。根據(jù)漢字書寫筆順和字基出現(xiàn)的先后順序編成4碼。復(fù)雜漢字,取首尾各2碼;簡(jiǎn)單漢字不足4碼,后面可以添0湊4碼;漢字首筆獨(dú)點(diǎn)不記碼。字基辨別原則是多筆從離、離連從人、線折從口、一切從交。漢字后面標(biāo)上《新華詞典》上的頁(yè)數(shù)。
下面對(duì)本發(fā)明作詳細(xì)說(shuō)明一、漢字字基名稱、編碼及說(shuō)明編碼 名稱 形態(tài)(舉例) 字例 說(shuō)明0 獨(dú)點(diǎn) 丶 私勁夕不 單獨(dú)一點(diǎn)1 獨(dú)線一丨丿 干舊自瓜刁單獨(dú)一線,無(wú)鉤.
2 縱離二三冫氵 彡 云具北漢習(xí)母點(diǎn)與點(diǎn)(線與線)從上到下相離排列,不連.
3 單折 買公丫習(xí)飛單獨(dú)一折,可帶小鉤,(含兩筆 庫(kù)后心相連成折.)4 單交乂十又力 父古麥辦奐丙筆劃交叉,有一個(gè)交點(diǎn).
5 國(guó)戶且骨臼四面包圍( 已未全封)6 合仁衣百蟲一線的端點(diǎn)接另線中間或大內(nèi)頭(見5頁(yè)) 一點(diǎn)沾在一線上.
7 雙折冖冂(含勹) 空區(qū)同凡兇陽(yáng) 一筆或二筆連成2個(gè)折, 萬(wàn)象可帶鉤.
達(dá)與鼎計(jì)識(shí)8 父關(guān)元門劃木點(diǎn)、線及單折從左到右相川忄小巛灬 學(xué)怕示巡恭熱 離排列,不連,互不包含.
9 共蕓打戈鹿毛連續(xù)2交,有2個(gè)交點(diǎn).
10 金字 金钅 淦針 金字及钅旁11 王字 王壬 主廷 王字及壬字12 竹字 竹 笑竹 竹字及字頭補(bǔ)充說(shuō)明①單折、雙折均可帶一小鉤,但獨(dú)線不帶鉤,線可有弧度。
② 從兩個(gè)單折,記作33, 從兩個(gè)雙折,記作77, 從兩個(gè)單折,記作33,但阝仍算一個(gè)雙折從7,不看作多個(gè)單折。已從73。
③連續(xù)相接成人形,如“止”,按接點(diǎn)記碼,止從666,工從66,下66,等。(在詞典里“下”的一點(diǎn)沾在豎上,但“不”的一點(diǎn)未沾在豎上)
④多個(gè)交點(diǎn)連續(xù)出現(xiàn)記碼法若有三個(gè)交點(diǎn)的,記作49,如豐韋車尹史申 等。有四個(gè)以上(含四個(gè))交點(diǎn)的,記作99,如南吏 弗聿事串曲母冊(cè)井冉等。
⑤金、王、竹都是雙碼字基,分別從10,11,12,不受它筆影響。如毋從丿王不從十一。
⑥縱離限于點(diǎn)與點(diǎn)或線與線之間,而橫離范圍較廣,點(diǎn)、線,單折皆可參與組成。但它們排列整齊,在同一層次,互不包含。如“心”,3點(diǎn)從8, 在下,心從83,必從84。水左邊兩筆構(gòu)成8,水從86。門的丨和 在同一層次,門從08。 有三個(gè)字基,按書寫順序記作亅 322。有時(shí)縱離、橫離的兩筆可被其他字基隔開,記在該字基后邊,如木48;辦48;舟192,母492;業(yè)881;肅肀八、 ,9988;有時(shí)縱離,橫離難以辨別,如豕和 均有 。前者在勹下邊,有從左到右趨勢(shì),從8;后者在直線左旁,有從上到下趨勢(shì),從2。
⑦雙折必須有兩個(gè)角,而工不是雙折,工從31,刀從31。彐從71,而 從32,不從71。
二、字基構(gòu)成原則(一)多筆從離若有多筆相離排列,在同一層次,互不包含,不要看作多個(gè)單一的字基,而應(yīng)看成一個(gè)整體(縱離或橫離)如氵從2,不從000;亍從23,不從113,歸從871,不從1171。
(二)離連從人若相離筆劃中有一筆與它筆相連成人形,則服從人形字基,如彳從16,不從21。但是,另外規(guī)定,如果相離各部分同一方向端點(diǎn)共接一線,則相離字基(2或8)不受影響,如“兀”,兒的兩筆上方端點(diǎn)共接一線,兒仍從8,兀從18,不從63,故相離字基接線原則是“全或無(wú)”式的。又如光818,非282等。復(fù)雜情況要分清楚,如止,兩豎下邊共接一橫,看似從8,但后面一豎另接了一短橫,故這兩豎不從8,止從666(前已述)。
(三)線折從口,如果線或折構(gòu)成口形字基,則從口形,而線折不計(jì)。如“且”中的 從5,不從71,“骨”中的 從53,不從737,巨從5,不從77(注 同巨不同, 從匚丿口丿)局從535,不從775。
(四)一切從交各種字基形態(tài)被它筆穿過(guò),則服從相交字基(4或9),其中點(diǎn)、線、單折、雙折、口形被它筆穿過(guò)后,一律只按交點(diǎn)記碼,如力從4,不從31;中從9,不從51;耳從 二十,624,不從52;又如奐,從746,為7,下面 從4,不從74。(這是因?yàn)?從5[口形],再?gòu)慕唬?從4) 從46,故奐從746。但是,人形、橫離、縱離以及未相交的部分應(yīng)另記碼,如土41,大46,手19,但戊從9,不從19,這是因?yàn)閺S是單折,不可分離,單折從交,故從9,如成從309,不從709,冬記為142。
三、記碼順序同漢字書寫筆順,按字基出現(xiàn)的先后次序記碼。
(一)從左到右如乃133,及134,扎93,非282,兆282。
(二)從上到下如匕13,寸40,刀31,歹170,饣73,出47,包75,木48,貝78,五141,月72,單849,柬4988,禹1496,倉(cāng)633;相交字基號(hào)碼按交點(diǎn)位置記,交點(diǎn)上面的字基應(yīng)先記,如叉04,丹09,戈09,戔049,臾846,黑8918。雙交被“八”隔開,先記相交基。如本98,來(lái)988,夾986。一個(gè)字往往是既有從上到下又有從左到右等順序,如壯2141,可153。
(三)由外到內(nèi)如日51,田54,皿58,臼58,圖5142,面6582等。
(四)先中間后兩邊如齋的順序是文非一刂,辦48,肅9988等。
(五)先兩邊后中間如火86,脊從 人月,拳從丷夫手等,都有從上到下趨勢(shì)。
(六)之、廴在字的最后,如達(dá)4607,建9934等。
(七)右上角點(diǎn)記在右下角之前,如戈09,戊09,咸1509,龍404, 4024,術(shù)408,甫099,武1604,弋和戈在右旁一律記作字的末2基,如鳶從鳥弋。
(八)從相交字基非端點(diǎn)引出的點(diǎn)或線從6,如大46,內(nèi)46,夫96,頭246等,但若引出的是折,則仍從3,如尢43,它們記在相交基前面或后面,又如長(zhǎng),記作646。
四、查字方法(一)復(fù)雜漢字,取首2碼和末2碼依次組成4位碼,即為該字號(hào)碼,如私丿,十,ㄥ,丶,1430,鉉钅,ㄥ,丶,1030,魚,口,十一7541。殷丿尸幾又1574,藏艸ㄥ丶 9309,作亻 二6662。繁 、小6408( 從49,只取4),梅十八 4892( 從49,只取9)鼻囊丿口レ 1536,鳶勹丶、 7004,撳扌钅ク人9176(钅從10,只取1);李4834,豕1786,兩1966,雨1422, 3260。
(二)不足四個(gè)字基的漢字,則依次記上已有碼位,并在后面添0,湊足4位,如波氵 又2440,打9130,成3090,丸9000,夕7000,電4900,人6000,可1530,員5780,次2760,酉1910,事9900,三2000,七4000,金1000,王1100,竹1200等,(若省去后面添的0即成簡(jiǎn)碼)。
(三)不管復(fù)雜漢字還是簡(jiǎn)單漢字,字首獨(dú)占一律不計(jì)。如,廣3000,丫3000,病3246,禮3630,鬮8790( 從9,不是電)衷1936,鄽3417( 從49,)瘦3244,計(jì)7400,安7900,但是,不在整個(gè)漢字的字首,依次照記,如廓3047。
為便于記憶,茲將字基號(hào)碼及成基原則編成歌訣,記之于下(一)零點(diǎn)一線二八遙, (二)多筆從離連從人,三七含折四九交, 線折從口概從交,一零一二金王竹, 多折多接多交異,六人五口用零調(diào)。
前點(diǎn)不計(jì)架金橋。
漢字編碼舉例如下銘1005 玉1100 符1240 致1364 刻1368 稠1415就1503 京1580 行1623 邁1707 巖1765 產(chǎn)1830生1910 濟(jì)2048 河2153 動(dòng)2304 波2440 言2500汽2613 沒(méi)2740 沙2810 油2900 廣3000 邵3157病3246 結(jié)3315 迅3407 麻3448 禮3630 馬3710席3914 為4000 塔4115 農(nóng)4360 圣4410 故4564大4600 狼4616 有4720 械4809 車4900 咳5016旺5111 盼5231 叫5310 町5413 咽5546 跟5616嗚5771 置5852 雖5960 依6036 氣6130 聯(lián)6246創(chuàng)6338 伏6406 礦6503 攻6664 虜6744 份6831訪7017 餃7384 魷7503 論7613 險(xiǎn)7681 憶8300秈8417 灶8641 接9019 萃9064發(fā)明人已將《新華字典》上的漢字及國(guó)標(biāo)區(qū)位碼的漢字全部編碼,共9800多字。從編碼來(lái)看,漢字重碼雖有70%,但一般為3~5個(gè),重碼字按由簡(jiǎn)到繁依次排列,標(biāo)上序號(hào),電腦輸入時(shí)99.5%的字不需翻頁(yè)選字。
由于采用數(shù)字編碼,不但可簡(jiǎn)化鍵盤,制成筆記本式的袖珍電腦,而且操作輸入簡(jiǎn)便,記住數(shù)字鍵就行,因此可提高輸入速度。本編碼只有10類字基和三個(gè)雙碼字基,且界限清楚,不易混淆,便于記憶。
本編碼方案在漢字后標(biāo)記《新華詞典》上的頁(yè)次,可作為檢字表查新華字典用,較四角號(hào)碼查字法快捷,同碼字少,號(hào)碼容易確定》。
權(quán)利要求
1.一種漢字編碼方法,根據(jù)漢字的基本結(jié)構(gòu)和筆順編碼,本發(fā)明的特征在于將漢字基本結(jié)構(gòu)依據(jù)形態(tài)分成獨(dú)點(diǎn)、獨(dú)線、縱離、單折、單交、口形、人形、雙折、橫離、雙交10類字基,依次用0,1……9數(shù)字表示,另有金、玉、竹3字與偏旁分別用10,11,12表示;根據(jù)漢字書寫筆順和字基出現(xiàn)的先后順序編成4碼,復(fù)雜漢字,取首、末各2碼;簡(jiǎn)單漢字不足4碼,后面可以添0湊4碼;漢字首筆獨(dú)點(diǎn)不記碼。
2.根據(jù)權(quán)利要求1所述的編碼方法,其特征是獨(dú)點(diǎn)(0)即單獨(dú)一點(diǎn);獨(dú)線(1)包括 ,獨(dú)線無(wú)折無(wú)鉤;縱離(2)包括 ,即點(diǎn)與點(diǎn)(或線與線)從上到下相離排列;單折(3)包括 ,即筆劃有一折或兩筆連成一折;單交(4)包括 。即一筆與一筆相交,只有一個(gè)交點(diǎn);口形(5)包括 ,即四面封閉或包圍;人形(6)包括 ,即一線的端點(diǎn)接另線的中間,或一點(diǎn)沾在一線上,有一接點(diǎn);雙折(7)包括 ,即一筆有2折或2筆連成2折,有兩個(gè)角;橫離(8)包括 ,即點(diǎn)、線,單折從左到右橫向相離排列,互不包含;雙交(9)包括 ,即連續(xù)2交,有兩個(gè)交點(diǎn);有3個(gè)交點(diǎn)記為49,如韋,車、 、有4個(gè)交點(diǎn)記作99,如甫,吏,聿,串,井。
3.根據(jù)權(quán)利要求1所述的漢字編碼方法,其特征是字基辨別有以下原則a,多筆從離凡多筆相離排列的不能拆散,應(yīng)視為縱離2或橫離8;b,離連從人相離排列的筆劃有一筆與它筆相連成人形,則服從人形6;c,線折從口如果線或折組成口形字基,則從口形5,不從單折或雙折;d,一切從交各種字基形態(tài)被它筆穿過(guò),則從相交字基4或9。
全文摘要
一種漢字編碼方法,根據(jù)漢字的基本結(jié)構(gòu)和筆順編碼,其特征是將漢字基本結(jié)構(gòu)依據(jù)形態(tài)分成點(diǎn)、線、折、交、離、口形、人形等10類字基,分別用數(shù)字0,1……9表示,另有金、王、竹3偏旁(字)分別用10、11、12,表示,根據(jù)漢字書寫筆順和字基出現(xiàn)先后順序編成4碼,復(fù)雜漢字,只取首、尾各2碼,漢字首筆獨(dú)點(diǎn)不記碼,字基辨別原則是多筆從離、離連從人、線折從口、一切從交。本編碼方案易學(xué)易記,電腦輸入速度較快,重碼選擇基本不翻頁(yè),同時(shí)可應(yīng)用于查字典,將漢字電腦輸入與查字典融為一體。
文檔編號(hào)G06F3/023GK1102894SQ94111108
公開日1995年5月24日 申請(qǐng)日期1994年8月5日 優(yōu)先權(quán)日1994年8月5日
發(fā)明者李善成 申請(qǐng)人:李善成