專利名稱:漢字簡(jiǎn)明碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及漢字編碼。
目前,公布于眾的漢字編碼方法已達(dá)400多種,在這當(dāng)中,專家們認(rèn)為最先進(jìn)的編碼方法是上海市杜冰蟾發(fā)明的漢字全息碼。其特征是以部首、筆順、用拼音或筆畫分類集約化定漢字區(qū)位的編碼。其優(yōu)點(diǎn)在于只要知道100個(gè)部首的拼音的第一個(gè)字母,不需專門培訓(xùn),就能編碼上機(jī)。但是該發(fā)明有以下不足之處1、雖然千百年來,人們書寫漢字都遵守筆順的七條規(guī)則,但是由于漢字形體的復(fù)雜性,有時(shí)實(shí)難統(tǒng)一筆順。例如“區(qū)”全息碼認(rèn)為筆順是“一、丿、 、 ”,而《兒童圖解字典》(江蘇少年兒童出版社,1988年2月第2版)認(rèn)為筆順是“一、 、丿、 ”(見第157頁(yè)“醫(yī)”字)。
2、該發(fā)明以筆順分解部首,每一步分解以最多筆畫的部首為原則。這種分解部首的方法比較復(fù)雜,缺乏直觀性,要達(dá)到見字得碼的熟練程度,需要長(zhǎng)時(shí)間的訓(xùn)練。例如“餼”的接尾部首是“一”還是“二”呢?需要考慮續(xù)筆部首,而在編碼時(shí)又用不上續(xù)筆部首。
3、編碼方案復(fù)雜。編碼分部首字、兩個(gè)部首的復(fù)合字、三個(gè)部首的復(fù)合字、四個(gè)以上部首的復(fù)合字四種情況,還要考慮是否是鍵名部首,連發(fā)明人也沒有真正掌握,例如“民”應(yīng)該是“GHHG”而發(fā)明人編成“GGHG”,“族”應(yīng)該是“THRQ”而發(fā)明人編成“TBRQ”。
4、部首不盡合理。變體、繁體太多,最多一個(gè)部首有七個(gè)變形碼;該分的不分,例如把“犬”作為“大、豸”的本體,不符合漢字的形、音、義;該合的不合,例如把“日”和“曰”分開,在編碼過程中,實(shí)難區(qū)分這兩個(gè)部首。
5、重碼多。由于部首少,造成了許多重碼,例如《新華字典》(87年12月第四版)中,起筆部首是“蟲”部的字有167個(gè),其中有32個(gè)碼有兩個(gè)以上的字,最多一碼有6個(gè)字,并不象發(fā)明人所說的小于千分之一。
有鑒于此,本發(fā)明的目的在于提供一種更簡(jiǎn)單易學(xué),能見字得碼,重碼少的漢字簡(jiǎn)明碼。
本發(fā)明的漢字簡(jiǎn)明碼是依照先上后下、先左后右、先外后內(nèi)的規(guī)則,將漢字分解成部首,用拼音或筆畫分類高度集約化定漢字區(qū)位的編碼。同時(shí)規(guī)定夾在中間的部首不取,部首與部首的筆畫不相交,盡量不取單筆部首。本發(fā)明的部首字可以按其漢語(yǔ)拼音聲母的第一個(gè)字母或韻母的第一個(gè)字母排列,也可以按二位數(shù)字碼排列。本發(fā)明優(yōu)先采用組字能力最強(qiáng)的、最容易識(shí)別的178個(gè)部首并編排成部首表1和部首表2,由此編出“簡(jiǎn)明1碼”和“簡(jiǎn)明Ⅱ碼”,針對(duì)不同的用戶,在通用機(jī)上操作。
與全息碼相比,本發(fā)明的優(yōu)點(diǎn)和效果是顯著的本發(fā)明按照一定的規(guī)則分解部首,不破壞漢字的整體結(jié)構(gòu),見字得碼,想字得碼。
本發(fā)明按照一條規(guī)則對(duì)復(fù)合字進(jìn)行編碼,簡(jiǎn)化了編碼方案。
本發(fā)明采用178個(gè)部首,變體、繁體少,容易掌握和識(shí)別。
本發(fā)明充分發(fā)揮26個(gè)字母的作用,部首安排得非常合理,重碼比全息碼少得多。
采用本發(fā)明,大約只要化一、兩個(gè)小時(shí)就能編碼上機(jī)。
以上將結(jié)合實(shí)施例對(duì)本發(fā)明作更詳細(xì)的敘述實(shí)施例1簡(jiǎn)明Ⅰ碼1、部首表(Ⅰ)(附于后-表1)按照178部首字漢語(yǔ)拼音的聲母的第一個(gè)字母或韻母的第一個(gè)字母順序排列,u作u和ü使用,V沒有相應(yīng)的部首字,留作功能鍵使用。編碼方案中要使用部首的部首,為了便于使用者掌握,表中各部首下面列出了部首的部首代碼(這里筆畫允許相交),沒有部首代碼的部首稱整體部首,不能再分解部首,用部首的部首,大大增加了區(qū)分重碼的離散度。
2、分解部首規(guī)則本發(fā)明采用從漢字的整體結(jié)構(gòu)出發(fā),按先上后下、先左后右、先外后內(nèi),夾在中間的部首不取,部首與部首的筆畫不相交(戈除外),盡量不取單筆部首的原則將漢字分解成部首。即先取上面的多筆部首,再取下面的多筆部首,先取左邊的多筆部首,再取右邊的多筆部首,先取外面包著的多筆部首,再取里面的多筆部首;上面不是多筆部首,則取下面的,左邊的不是多筆部首,則取右邊的,外面的沒有多筆部首,則取里面的;上、下都不是多筆部首,則先取上邊部分的多筆部首,再取下邊部分的多筆部首,其余類推。若均不是多筆部首字,則依筆順分解成“橫、豎、撇、點(diǎn)、折”五種單筆部首。每一步分解以筆畫最多為原則。例第一部首 第二部首 第三部首 第四部首率 亠 十 冫 幺鬲
丷冂 口通辶 冂
到 刂 土 厶 一夾 夫 丷韶 立 刀 日 口決 冫 大豪亠 豕口
這樣分解部首,顯然比全息碼直觀得多。
3、編碼實(shí)例(1)單字編碼①部首字,用拼音代碼、各部首代碼、第二、三部首代碼,不足四碼擊V鍵。例
風(fēng)FIPD 弓GNHN 口KVVV②復(fù)合字用第一部首、第一部首的部首、第二部首、第三部首的代碼進(jìn)行編碼。若第一部首沒有部首,則補(bǔ)用第四部首代碼;若不足四碼,則補(bǔ)用最后一個(gè)部首的部首代碼;仍不足四碼擊V鍵。例鞋GCTT 賞XBEB 物NRWA如NKVV 棕MBXH 棋MQCV抬PSKV 呢KIIP 新JALM存ZNHR 怒XNYN2、詞語(yǔ)文獻(xiàn)快速碼①四個(gè)以上字的詞語(yǔ)取一、二、三及末字的第一部首的代碼。例如中華人民共和國(guó)ZIRQ;有目共睹YMCM;五花八門HCBM;八一建軍節(jié)BHFC。
②不足四個(gè)字的詞語(yǔ),取第一字的第一部首、第二部首(部首字改為部首的部首),第二字的第一部首、第三字的第一部首(如果是三字詞)的代碼進(jìn)行編碼。不足四碼補(bǔ)用最后一個(gè)字的第二部首(或部首的部首)的代碼;仍不足四碼擊V鍵。例國(guó)慶節(jié)QWGC 自來水MPWS 人民幣RMJP金剛石JDSV 國(guó)家QWBI 人民RMNV火山HAVV 敵人EWRV實(shí)施例2,簡(jiǎn)明Ⅱ碼1、部首表(Ⅱ)(附于后-表Ⅱ)簡(jiǎn)明Ⅱ碼是用“部首表(Ⅱ)”代“部首表(Ⅰ)”,用二位數(shù)碼代拼音字母,其他編碼順序則都似簡(jiǎn)明Ⅰ碼。
“部首表(Ⅱ)”按組字能力最強(qiáng)的22個(gè)部首和另156個(gè)部首,按筆畫、筆畫數(shù)排列,容易記憶,重碼少。
2、編碼實(shí)例
“簡(jiǎn)明Ⅱ碼”規(guī)則基本上同“簡(jiǎn)明Ⅰ碼”,只是Ⅱ碼不用部首的部首,用起筆筆畫的編號(hào)補(bǔ)充不足之碼,重碼字用*號(hào)并移動(dòng)它來區(qū)分。
(一)單字編碼(1)單部首字在6位數(shù)中,第一、第二位擊其編號(hào),第三-第六位擊起、續(xù)筆畫的編號(hào)。
例風(fēng)982527 弓682723 口072427(2)多部首復(fù)合字,在6位數(shù)中,第一到第六位擊其第一、第二、第三部首的編號(hào),不足六位數(shù)擊起筆筆畫的編號(hào)。
例鞋940404 賞738940 物912325 口120727(二)詞語(yǔ)文獻(xiàn)快速碼(1)雙字詞取第一字的第一、第二部首、第二字的第一部首的編號(hào)進(jìn)行編碼。若第一字為部首字,則改用第二字的第一、第二部首的編號(hào);不足六位數(shù),補(bǔ)用第二字的起筆筆畫的編號(hào)。
例國(guó)家571465 人民015727 火山180824(2)三字以上詞取第一、二、末字第一部首。例中華人民共和國(guó)872857 有目共睹174040五花八門230564 國(guó)慶節(jié)576305人民幣015758 金剛石203419本發(fā)明可作如下調(diào)整(1)調(diào)整部首部首可以調(diào)整,“Ⅰ碼”和“Ⅱ碼”均可增減部首,可用數(shù)百個(gè)常用偏旁字;可用數(shù)十個(gè)部首;可用100個(gè)部首;可用56個(gè)部首;也可去掉乍、齒、風(fēng)、斤、方、欠、殳、穴、頁(yè)、赤、亦等用167個(gè)部首。“Ⅰ碼”和“Ⅱ碼)的部首也可不同,但用178部首為好,易識(shí)別。
(2)部首代碼,編號(hào)調(diào)整部首表Ⅰ中各部首的字母代碼和各部首的部首代碼均可調(diào)整;部首表Ⅱ中各部首的數(shù)字編號(hào)也可調(diào)整,部首可編成三位數(shù),也可用一個(gè)數(shù)碼表示幾個(gè)部首,也可部分用兩位數(shù)碼,部分用三位數(shù)碼。
(3)分解部首調(diào)整可以去掉“部首和部首的筆畫不相交,夾在中間的部首不取,盡量不取單筆部首”的規(guī)定??稍黾酉戎虚g后兩邊的規(guī)定。
(4)編碼調(diào)整“Ⅰ碼”中,復(fù)合字編碼的第二碼可不用部首的部首,而改用部首的起筆筆畫或收筆筆畫;部首字的第二、三、四碼不用部首而用筆畫。為了減少重碼,三部首復(fù)合字的編碼,若第一、第三部首均沒有部首時(shí),可用第一部首、第二部首、第二部首的部首、第三部首的代碼進(jìn)行編碼,或用第一、第二、第三部首和第二部首的部首代碼進(jìn)行編碼。如“抬”PSNK或PSKN,三字詞亦如此,如“金剛石”JDGS或JDSG?!阿虼a”中,若部首用三位數(shù)表示,可取二個(gè)部首編成6位數(shù)碼,也可取三個(gè)部首編成9位數(shù)碼。若部首用二位數(shù)表示,可取四個(gè)部首編成8位數(shù)碼,其余類推。若一個(gè)數(shù)表示幾個(gè)部首,則編碼時(shí),可用起筆筆畫(或收筆筆畫)的編號(hào)的個(gè)位數(shù),編成七位數(shù)碼或九位數(shù)碼。
去重碼“Ⅰ碼”可用擊V鍵并移動(dòng)其位置或擊1、2、……、9、0數(shù)字鍵去重碼?!阿虼a”可用*鍵去重碼,去重碼的讓碼以詞頻為序。
功能鍵提示、改錯(cuò)、分簡(jiǎn)繁體、正字、異體、訛體、中西文夾排等,都可使用多余的鍵。
本發(fā)明的用途除了全息碼所列十條可供開發(fā)應(yīng)用外,它分解部首的規(guī)則,可用來編字典的檢字表,這對(duì)人們方便查字,培養(yǎng)中小學(xué)生的系統(tǒng)觀念,提高民族素質(zhì)都有重大的意義。
部首表(Ⅱ)
權(quán)利要求
1.一種漢字簡(jiǎn)明碼,其特征在于所說的簡(jiǎn)明碼是依照先上后下、先左后右、先外后內(nèi)的規(guī)則將漢字分解部首,用拼音或筆畫分類高度集約化定漢字區(qū)位的編碼。
2.根據(jù)權(quán)利要求1所述的漢字簡(jiǎn)明碼,其特征在于部首與部首的筆畫不相交。
3.根據(jù)權(quán)利要求1所述的漢字簡(jiǎn)明碼,其特征在于盡量不取單筆部首。
4.根據(jù)權(quán)利要求1所述的漢字簡(jiǎn)明碼,其特征在于每一步分解取最多筆畫的部首。
5.根據(jù)權(quán)利要求1所述的漢字簡(jiǎn)明碼,其特征在于夾在中間的部首不取。
6.根據(jù)權(quán)利要求1、2、3、4或5所述的漢字簡(jiǎn)明碼,其特征在于所說的部首字的代碼是用其漢語(yǔ)拼音的聲母的第一個(gè)字母或韻母的第一個(gè)字母表示的。
7.根據(jù)權(quán)利要求1、2、3、4或5所述的漢字簡(jiǎn)明碼,其特征在于所說的部首字的編號(hào)是用二位數(shù)碼表示的。
8.根據(jù)權(quán)利要求1、2、3、4、5、6或7所述的漢字簡(jiǎn)明碼,其特征在于所說的部首最好采用178部首或167部首。
9.根據(jù)權(quán)利要求1、2、3、4、5、6或8所述的漢字簡(jiǎn)明碼,其特征在于對(duì)部首字,用拼音代碼、部首代碼、第二、三部首代碼進(jìn)行編碼,不足四碼用Ⅴ碼。
10.根據(jù)權(quán)利要求1、2、3、4、5、6或8所述的漢字簡(jiǎn)明碼,其特征在于對(duì)復(fù)合字,用第一部首、第一部首的部首、第二部首、第三部首代碼進(jìn)行編碼。若第一部首沒有部首代碼,則補(bǔ)用第四部首代碼;若不足四碼,補(bǔ)用最后一個(gè)部首的部首代碼;仍不足四碼用Ⅴ碼。
11.根據(jù)權(quán)利要求1、2、3、4、5、6或8所述的漢字簡(jiǎn)明碼,其特征在于對(duì)四個(gè)以上字的詞語(yǔ),用第一、第二、第三及末字的第一部首的代碼進(jìn)行編碼。
12.根據(jù)權(quán)利要求1、2、3、4、5、6或8所述的漢字簡(jiǎn)明碼,其特征在于對(duì)不足四個(gè)字的詞語(yǔ),用第一字的第一、第二部首(部首字改為部首的部首)、第二字的第一部首、第三字的第一部首(如果是三字詞)的代碼進(jìn)行編碼。不足四碼,補(bǔ)用最后一字的第二部首(或部首的部首)的代碼;仍不足四碼用Ⅴ碼。
13.根據(jù)權(quán)利要求1、2、3、4、5、7或8所述的漢字簡(jiǎn)明碼,其特征是對(duì)單部首字,在6位數(shù)碼中,第一、二位用其編號(hào),第三、四、五、六用起、續(xù)筆畫的編號(hào)進(jìn)行編碼。
14.根據(jù)權(quán)利要求1、2、3、4、5、7或8所述的漢字簡(jiǎn)明碼,其特征在于對(duì)復(fù)合字在6位數(shù)中用其第一、第二、第三部首的編號(hào),不足6位數(shù)用起筆筆畫的編碼。
15.根據(jù)權(quán)利要求1、2、3、4、5、7或8所述的漢字簡(jiǎn)明碼,其特征在于對(duì)雙字詞,用第一字的第一、第二部首、第二字的第一部首。若首字為部首字,則改為第二字的第一、第二部首的編號(hào)進(jìn)行編碼。不足六位數(shù),補(bǔ)用第二字的起筆筆畫的編號(hào)。
16.根據(jù)權(quán)利要求1、2、3、4、5、7或8所述的漢字簡(jiǎn)明碼,其特征在于對(duì)三字以上詞語(yǔ),用第一、二及末字的第一部首的編號(hào)進(jìn)行編碼。
17.根據(jù)權(quán)利要求1、2、3、4或5所述的漢字簡(jiǎn)明碼,其特征在于部首是用三位數(shù)碼排列的。
全文摘要
漢字簡(jiǎn)明碼涉及漢字編碼,其主要特征是依照先上后下、先左后右、先外后內(nèi)、夾在上、下之間的部首不取,部首與部首的筆畫不相交,盡量不取單筆部首的規(guī)則,將漢字分解成部首,用拼音或筆畫分類高度集約化定漢字區(qū)位的編碼。本發(fā)明遵循人們分解漢字部首的習(xí)慣,不破壞漢字的整體結(jié)構(gòu),直觀性極強(qiáng),見字得碼,想字得碼,本發(fā)明的178個(gè)部首安排合理,重碼極少,采用本發(fā)明,大約只要花一、兩個(gè)小時(shí)就能編碼,在通用機(jī)上操作。
文檔編號(hào)G06F3/023GK1060163SQ9110703
公開日1992年4月8日 申請(qǐng)日期1991年5月8日 優(yōu)先權(quán)日1991年5月8日
發(fā)明者陳光耀 申請(qǐng)人:陳光耀