專利名稱:一種計(jì)算機(jī)輸入系統(tǒng)——漢字兼容碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于漢字計(jì)算機(jī)輸入系統(tǒng),具體涉及一種音形兼容的漢字編碼。
最近報(bào)載,計(jì)算機(jī)將成為中小學(xué)基礎(chǔ)課,和語文、數(shù)學(xué)、外語一樣,是青少年必須掌握的五個(gè)基本工具之一。國(guó)家教委已正式立項(xiàng),把全國(guó)中小學(xué)教學(xué)用漢字編碼規(guī)范及計(jì)算機(jī)輸入系統(tǒng)列為重點(diǎn)攻關(guān)項(xiàng)目。
縱觀目前國(guó)內(nèi)外數(shù)百種漢字輸入方案,可以歸納為二大類,一類是拼音輸入法,一類是字形輸入法。拼音輸入法雖然方便易學(xué),但由于漢字中同音字太多造成大量重碼,嚴(yán)重影響了輸入速度。況且我國(guó)方言繁雜,不少人會(huì)寫會(huì)用卻讀不準(zhǔn)音,讓這些人來使用拼音輸入法,必然會(huì)一籌莫展。
字形輸入法的設(shè)計(jì)者大多將漢字分成許多個(gè)字根,然后分別給其貼上標(biāo)簽。這樣做難免要添加一些規(guī)則,生造一些字根,違背了漢字演化規(guī)律和結(jié)構(gòu)規(guī)律,而且這么多的標(biāo)簽需要強(qiáng)記硬背,讓人望而生畏。特別是廣大的科技工作者、作家學(xué)者、編輯記者、教師和學(xué)生,他們僅把漢字輸入作為一種工具來使用,不可能要求他們強(qiáng)記這么多條條框框。正如眾多學(xué)者所要求,必須找到一種真正易學(xué)好用的漢字輸入方法,使得無論是專職輸入員還是專家學(xué)者,都可以輕松輸快地學(xué)習(xí)掌握。只有這樣,計(jì)算機(jī)在我國(guó)的應(yīng)用才可能得到真正的普及。
本發(fā)明的目的在于將表音表形有機(jī)地結(jié)合起來,強(qiáng)化了表音碼簡(jiǎn)易便捷,表形碼快速準(zhǔn)確的優(yōu)點(diǎn),努力克服兩者固有的缺陷,盡可能地減少輸入規(guī)則,減少記憶負(fù)擔(dān),特別注重實(shí)用性、普及性和規(guī)范化,從而提供一種便于學(xué)習(xí)掌握、適宜于在中小學(xué)推廣使用的計(jì)算機(jī)輸入系統(tǒng)漢字編碼。
本發(fā)明的目的是這樣實(shí)現(xiàn)的一、漢字兼容碼為計(jì)算機(jī)輸入系統(tǒng)漢字編碼之一種。單字輸入和詞匯輸入均四碼取字。碼符由26個(gè)拉丁字母組成。采用國(guó)際標(biāo)準(zhǔn)鍵盤。
二、一個(gè)漢字一般代表一個(gè)音節(jié),大部分音節(jié)由聲母和韻母構(gòu)成。現(xiàn)代漢語沒有復(fù)輔音,音節(jié)的結(jié)構(gòu)整齊,界線分明。本方案第Ⅰ、Ⅱ兩碼為表音碼,即代表該漢字的音節(jié)。
三、漢字兼容碼第Ⅰ碼代表該漢字的聲母。
共使用20鍵(其中A,E,I,O,U,V六鍵不用)。聲母b,p,m,f,d,t,n,l,g,k,h,j,q,x,r分別用相應(yīng)的鍵位作代碼,z,zh合用Z碼,c,ch合用C碼,s,sh合用S碼,半元音w,y亦分別用對(duì)應(yīng)的鍵位作代碼。
在我國(guó),有半數(shù)以上的方言(如吳語、閩語、粵語、客家語等),對(duì)舌尖前音z,c,s和舌尖后音zh,ch,sh分不清楚,甚至不分。這些地方的人,在學(xué)習(xí)普通話時(shí)很難辨別和掌握。為此,我們將兩者并在一起,解決了這一難題,使他們都能得心應(yīng)手地上機(jī)操作。
四、漢字兼容碼第Ⅱ碼代表該漢字的韻母。
共使用13鍵(A,B,C,E,F(xiàn),I,K,M,N,O,U,V,W)。
中國(guó)地大人多,方言也多,有些方言的韻母跟普通話韻母不甚相同。
漢語中的鼻韻母頗具特色,它由元音和鼻輔音韻尾構(gòu)成。在鼻韻母中又分帶舌尖鼻音n和帶舌根鼻音ng兩類。對(duì)大部分中國(guó)人來說,分不清n,ng是一大通病,但對(duì)鼻韻母卻還是很敏感的。
為此,漢字兼容碼先把35個(gè)韻母按頭韻分成五大類,再將各類中的鼻韻母分列開來,并參照各韻母出現(xiàn)頻率的高低歸成十三類,各設(shè)代碼如下
這一分類法是按照漢語發(fā)音規(guī)律,進(jìn)行切塊組合,故符合規(guī)范。而且采用模糊分類的辦法,既可回避使用者因發(fā)音不準(zhǔn)而出錯(cuò),而且又能通過多渠道的分流,降低重碼概率,故切實(shí)可行。
本方案韻母代碼表需加記憶,但由于它是遵循“先單韻母,次復(fù)韻母,后鼻韻母”的規(guī)律,故掌握起來并不費(fèi)勁。
第Ⅰ、Ⅱ碼取碼舉例如下亞(ya)→YA沈(shen)→SF將(jiang)→JM虹(hong)→HO注漢字中有少數(shù)零聲母音節(jié),第Ⅰ碼取X。如愛(ai)→XB歐(ou)→XO鵝(e)→XE五、漢字由各種字根組成,其中一些出現(xiàn)頻率較高、結(jié)構(gòu)較穩(wěn)定的字根演化成部首,大部分漢字都包含一兩個(gè)甚至多個(gè)部首。因而從部首入手,便能較全面較完整地剖析該漢字的結(jié)構(gòu)特征,收到以簡(jiǎn)馭繁的效果。本漢字兼容碼第Ⅲ、Ⅳ碼為表形碼,即代表該漢字的部首、偏旁或字根。
漢字兼容碼以《現(xiàn)代漢語詞典》、《新華字典》為模本,共分188個(gè)部首,每個(gè)部首設(shè)定一個(gè)代碼,設(shè)定原則如下(一)凡部首本身是漢字的,以該漢字的聲母為代碼。如王--W角--J小--X竹--Z土--T山--S(二)凡部首是從某字演變過來的,以該字的聲母為代碼。如钅-金-J忄-心-X犭-犬-Q饣-食-S衤-衣-Y礻-示-S(三)凡部首系某漢字的偏旁冠蓋,以該漢字的聲母為代碼。如宀(寶蓋頭)--寶--B亠(文字頭)--文--W疒(病殼兒)--病--B辶(走之旁)--之--Z(四)一些較大的部首,專門設(shè)定代碼,需記憶。
(五)部首代碼總表一畫一橫H丨豎S丿撇P丶(
) 點(diǎn)(捺) D 乙(乛刁)折 O二畫亠 (文字頭)W冫 (兩點(diǎn)水)I冖 (平寶蓋)B讠 (言字旁)Y二 erE十 shiS廠 chan C 匚 (區(qū)字框) Q 卜(
) bu B刂 (立刀旁)D冂 (同字框)K八(丷)baB人(入)R亻 (單立人)R勹 (包字頭)B兒 E 幾(
) (風(fēng)字殼) F 厶 si S又(
) Y 廴 (建字旁) J 卩 ()(單耳朵) P阝 (左)(左耳朵)P阝(右)(右耳朵)P凵 (兇字框)K刀() daoD力 liL三畫氵 (三點(diǎn)水)I忄 ()(豎心旁)X宀 (寶蓋頭)B丬 (爿)(壯字旁)Z廣 (廣字頭)G門 menM辶 (走之旁)Z工 gongG土 tuT士 shiS艸 (草字頭)O大 daD廾(在下) gongG尢 youY寸 cunC弋 yiY扌 (提手旁)U小() xiaoX口 kouK囗 (圍字圍)W巾 jinJ山 shanS彳 chiC彡 (三撇兒)S夕 xiX夂 (條字頭)T犭 (反犬旁)Q饣(食字旁) S 彐 (
)(靈字頭) L 尸 shi S己(巳) jiJ弓 gongG屮 cheC女 nuN幺 yaoY子(孑) ziZ纟(糸)A馬 maM巛 (川字頭)C四畫灬 (四點(diǎn)水)I斗 douD文 wenW方 fangF火 huoH心 xinX戶 huH礻 (示字旁)S王 wangW韋 weiW木 muV犬 quanQ歹 daiD車 cheC戈 geG比 biB瓦 waW止 zhiZ攴 puP日A曰 yueY貝 beiB見J父 fuF牛 niuN手U毛 maoM
氣 qiQ夊 (反文旁)F片 pianP斤 jin J 爪 zhao Z 月(
) yue L欠 qianQ風(fēng) fengF殳 shuS肀(
聿) Y 母 (毋)mu M 水 I五畫穴 xueX立 liL疒 (病字殼)B衤 (衣字旁)Y石 shiQ龍 longL業(yè) yeY目 muM田 tianT罒 (橫目?jī)?M皿 minM钅(金) jinJ矢 shiS禾 heH白 baiB瓜 guaG鳥 niaoN用 yongY矛 maoM疋() piP皮 piP六畫衣 yi Y 羊(
羊) yang Y 米 mi M耒 leiL老 laoL耳 erE臣 chenC西 xiX頁 yeY虍 huH蟲 chongC缶 fouF舌 sheS竹() zhuZ臼 jiuJ自 ziZ血 xueX舟 zhouZ羽 yu Y 艮(
) gen G七畫辛 xinX麥 maiM走 zouZ赤 chiC豆 douD酉 youY辰 chenC豕 (古豬字)Z鹵 luL里 liL足() zuZ豸 zhiZ谷 guG采 bianB身 shenS角 jiaoJ八畫青Q其qiQ雨 yuY齒 chiC黽 mengM隹 zhuiZ魚 yuY九畫音 yinY革 geG骨 guG鬼 guiG十畫以上門 douD髟 biaoB麻 maM鹿 luL黑 heH鼠 shuS鼻 biB注劃線的代碼需稍加記憶。
(六)部首代碼索引A日纟(糸)B冖卜八宀比貝疒白采髟鼻C廠寸彳屮巛車臣蟲赤辰齒D丶(點(diǎn))刂刀(ク)大斗歹豆E二兒耳F方父攵幾(幾)風(fēng)缶G廣工廾弓戈瓜艮谷革骨鬼H 一(橫)火戶禾
黑I冫氵灬水J廴巾已見斤钅(金)臼角K冂凵口L力彐月立龍耒老鹵里鹿M門馬毛母目罒皿矛米麥黽麻N女牛鳥O乙(折)艸P丿(撇)卩()阝(左)阝(右)攴片疋皮Q匚犭犬氣欠石青其R亻人S丨(豎)十厶士山彡饣尸礻示殳矢舌身鼠T土夂田U扌手V木W(wǎng)口亠文王韋瓦X忄小夕心穴西血辛Y讠又尢幺曰肀衤業(yè)用衣羊頁羽酉雨魚音Z丬辶子止爪竹自舟走足豸豕隹六、漢字結(jié)構(gòu)復(fù)雜,根據(jù)字形可分為合體字和獨(dú)體字(亦稱單體字、聚體字)。合體字又分左右結(jié)構(gòu)、上下結(jié)構(gòu)、內(nèi)外結(jié)構(gòu)。
(一)合體字取碼1.該漢字如為左右結(jié)構(gòu),則從左右部分各取一獨(dú)立的部首代碼作Ⅲ、Ⅳ碼。分體部分如有兩個(gè)或兩個(gè)以上部首,按先上后下、先復(fù)筆后單筆、先遠(yuǎn)后近的原則取碼,如沒有部首,按起筆筆形取碼。如(1)左右各取一部首虹→蟲+工HOCG吐→口+土TUKT(2)先取上后取下輯→車+口JICK部→立+阝BULP(3)先取復(fù)筆后取單筆糧→米+艮LMMG仟→亻+十QMRS(4)如無獨(dú)立部首取起筆卵→丿+卩LYPP死→歹+丿SIDP(5)先取遠(yuǎn)后取近樹→木+寸SUVC膨→月+彡P(guān)ELS2.該漢字如為上下分體結(jié)構(gòu),則從上下部分各取一部首代碼作Ⅲ、Ⅳ碼。分體部分如有兩個(gè)或兩個(gè)以上部首,按先左后右、先復(fù)筆后單筆、先遠(yuǎn)后近的原則取碼,如沒有部首,按起筆筆形取碼。如(1)上下各取一部首泉→白+水QYBI章→音+十ZCYS(2)先取左后取右資→冫+貝ZIBB落→艸+氵LWOI(3)先取復(fù)筆后取單筆奏→大+大ZODD堅(jiān)→又+土JMYT(4)如無獨(dú)立部首取起筆寧→宀+一NNBH譽(yù)→丶+言YUDY(5)先取遠(yuǎn)后取近復(fù)→丿+夂FUPT總→八+心ZOBX(二)獨(dú)體字取碼1.該漢字如為獨(dú)體字,取該字的部首為第Ⅲ碼,取另一輔助部首或分立的部首為第Ⅳ碼。如巫→工+人WUGR吏→一+口LIKH2.該漢字的部首被第Ⅲ碼取后,剩余部分如找不出部首,則取起筆作第Ⅳ碼。如牙→一+乙YAHO央→大+丨YCDS
3.該漢字如剛好為一部首,則從中找一筆劃最多的部首作第Ⅳ碼,如找不出則以起筆作第Ⅳ碼。如角→角+用JKJY音→音+立YNYL力→力+刁LILO心→心+丶XNXD漢字是表意體系的文字,不是直接表示音位或音節(jié),而是用表意符號(hào)來記錄詞匯和語素。漢字雖屬于象形字,但從幾千年的演化過程中可以看出,漢字的構(gòu)造正由表意向表音發(fā)展。形聲字大量增加,已成為漢字發(fā)展的主流。據(jù)統(tǒng)計(jì),在現(xiàn)代漢字中,形聲字已占到80%以上。形聲字中含有形符,也含有聲符。人們?cè)诮徽務(wù)f話時(shí)離不開發(fā)聲,即使在閱讀寫字時(shí)哪怕嘴巴沒有出聲,心中卻在默誦,這是因?yàn)槁犛X形象和視覺形象是相輔相成的。因此在研究分析漢字時(shí),不能僅停留在漢字的形體結(jié)構(gòu)分析上,更重要的是要注意漢字形符與聲符的形態(tài)結(jié)構(gòu),從中找出規(guī)律來。漢字兼容碼中兩個(gè)表形碼正是掇取漢字中的兩個(gè)偏旁部首(即形符與聲符),并以其偏旁部首的發(fā)音來歸類的。可以說,漢字兼容碼音形兼取,側(cè)重在音。
七、詞匯編碼(一)雙字詞先分別取兩個(gè)單字的聲母碼作第Ⅰ、Ⅱ碼,再分別取兩個(gè)單字的部首碼作Ⅲ、Ⅳ碼,如機(jī)器JQVK經(jīng)濟(jì)JJAI(二)三字詞分別取三個(gè)單字的聲母碼作Ⅰ、Ⅱ、Ⅲ碼,第Ⅳ碼一律用U,如計(jì)算機(jī)JSJU解放軍JFJU(三)四字詞各取每字聲母碼,依次排列,如漢字編碼HZBM溫州日?qǐng)?bào)WZRB(四)多字詞取第一、第二、第三及最未一字的聲母碼依次排列,如電子計(jì)算機(jī)DZJJ中華人民共和國(guó)ZHRG任何一種漢字輸入方案,一般都針對(duì)漢字而言,然而嚴(yán)格來說,漢語詞組輸入方案,也是不可忽視的重要組成部分。判斷一種方案的優(yōu)劣,主要看其能否做到易學(xué)易記,快速準(zhǔn)確,同樣,詞組輸入能否做到便捷準(zhǔn)確也是評(píng)測(cè)的重要標(biāo)準(zhǔn)之一。詞組編碼會(huì)不會(huì)跟漢字編碼出現(xiàn)重碼?各類詞組間會(huì)不會(huì)出現(xiàn)重碼?這都是非常重要的問題。
漢字兼容碼的最大優(yōu)點(diǎn)之一是,漢字編碼和詞組編碼共存共容,互不干涉,不會(huì)混淆。這是因?yàn)?一)漢字編碼的第Ⅱ碼為韻母碼,而詞組編碼的第Ⅱ碼為第二字的聲母碼。韻母碼和聲母碼兩者涇渭分明,各行其道,不會(huì)出現(xiàn)合流。
(二)二字詞匯的第Ⅳ碼為第二字的部首碼,幾乎不出現(xiàn)代碼U,而三字詞匯的第Ⅳ碼設(shè)定為代碼U,這樣就避開了重碼的可能。
(三)二字詞匯的Ⅲ、Ⅳ碼為表形碼;四字詞匯及多字詞匯的Ⅲ、Ⅳ碼為表音碼,由于兩種類型的代碼實(shí)質(zhì)組合不同,故出現(xiàn)重合的概率極低。
詞匯碼的輸入和單字碼的輸入可混合進(jìn)行,不需任何切換。在輸入過程中,盡量輸入詞匯以求其快,如逢個(gè)別專業(yè)或生僻詞匯則輸入單字以求其準(zhǔn)。
六、檢索鍵碼(一)音碼檢索鍵V當(dāng)你對(duì)某漢字的讀音沒有把握時(shí),可以用V鍵來檢索。例如“檢”字聲母為j,韻母為ian。代碼應(yīng)為JMVR。如你不知它的聲母,則鍵入VMVR,此時(shí)顯示屏的提示行里就會(huì)出現(xiàn)“檢”字及它的代碼JVVR。這樣既可檢索到所輸?shù)臐h字,又可領(lǐng)會(huì)取碼的要領(lǐng),學(xué)習(xí)到編碼知識(shí)。如果你不知它的韻母,則鍵JVVR即可。
(二)形碼檢索鍵?當(dāng)你對(duì)某漢字的部首或輔助部首確定感到困難時(shí),可以用?鍵來檢索。如“檢”字為左右二分體結(jié)構(gòu),其部首應(yīng)取木、人,其代碼為JMVR,如你鍵入JM?R或JMV?,提示行里同樣可出現(xiàn)“檢”字。
綜上所述,本發(fā)明體現(xiàn)了“快準(zhǔn)全”的設(shè)計(jì)思想。所謂快就是讓大家能很快熟悉,很快掌握,很快上機(jī);所謂準(zhǔn),就是嚴(yán)格符合漢語規(guī)范,符合演化規(guī)律;所謂全就是能適應(yīng)不同層次不同素質(zhì)的人員使用,既考慮電腦應(yīng)用的普及化和大眾化,又考慮電腦工作者使用的專業(yè)化;既考慮輸入時(shí)減化程序提高速度,又考慮輸入的準(zhǔn)確性。
本發(fā)明具有以下五個(gè)優(yōu)點(diǎn)一、易學(xué)易用。凡是掌握漢語拼音基本知識(shí),具備部首檢字基本知識(shí)的人都能一學(xué)就會(huì),立即上機(jī)。
二、合乎規(guī)范。任何一條規(guī)則都符合漢字規(guī)律,均有據(jù)可依,有本可查。特別適合于標(biāo)準(zhǔn)化教學(xué),適宜在中小學(xué)推廣使用,并能引導(dǎo)學(xué)生正確書寫漢字,增加漢字知識(shí)。
三、普及型、專業(yè)型功能兼具,各種人員使用皆宜。
四、單字編碼與詞匯編碼可以共存共容,而且詞匯編碼容量大,可使中文輸入技術(shù)向“以詞為主,以字為輔”的方向發(fā)展,大大加快了輸入速度,提高了工作效率。
五、適用于繁體字。只需重新設(shè)置部首代碼,即可用于繁體字輸入,故亦可適用于港臺(tái)地區(qū)。
權(quán)利要求
1.一種計(jì)算機(jī)輸入系統(tǒng)漢字兼容碼,其特征在于表音表形兼容,以漢字的音形取碼,四碼取字,以26個(gè)拉丁字母作代碼,采用國(guó)際標(biāo)準(zhǔn)鍵盤。
2.根據(jù)權(quán)利要求一所述的漢字兼容碼,其特征在于Ⅰ、Ⅱ兩碼為表音碼,分別代表該漢字的聲母和韻母,Ⅲ、Ⅳ兩碼為表形碼,分別代表該漢字的形符和聲符(偏旁部首)。
3.根據(jù)權(quán)利要求一、二所述的漢字兼容碼,其特征在于聲母碼中,將舌尖前音z,c,s和舌尖后音zh,ch,sh合用代碼,零聲母用代碼X。
4.根據(jù)權(quán)利要求一、二所述的漢字兼容碼,其特征在于韻母碼中,先把35個(gè)韻母按頭韻a,e,i,o,u分成五大類,再將各類中的鼻韻母分列開來,并參照各韻母出現(xiàn)頻率的高低分成十三類,按漢語發(fā)音規(guī)律進(jìn)行切塊組合。
5.根據(jù)權(quán)利要求一、二所述的漢字兼容碼,其特征在于Ⅲ、Ⅳ兩碼分取漢字中的兩個(gè)偏旁,取碼方法規(guī)定如下左右結(jié)構(gòu)合體字左右各取一部首;上下結(jié)構(gòu)合體字上下各取一部首;包圍結(jié)構(gòu)合體字Ⅲ碼取包圍部分,Ⅳ碼取中間部分;獨(dú)體字Ⅲ碼取部首,Ⅳ碼取輔助部首或起筆。
6.根據(jù)權(quán)利要求一、二、五所述的漢字兼容碼,其特征在于凡分體結(jié)構(gòu)的漢字,Ⅲ、Ⅳ兩碼均按先左后右,先上后下,先遠(yuǎn)后近,先復(fù)筆后單筆的原則取碼。
7.根據(jù)權(quán)利要求一、二、五、六所述的漢字兼容碼,其特征在于部首設(shè)置以《現(xiàn)代漢語詞典》為模本,以部首讀音聲母或習(xí)慣稱呼聲母為代碼,個(gè)別部首給予擬定代碼。
8.根據(jù)權(quán)利要求一至七所述的漢字兼容碼,其特征在于單字編碼為漢字聲母+漢字韻母+漢字部首+漢字輔助部首;二字詞組編碼為第一字聲母+第二字聲母+第一字部首+第二字部首。
9.根據(jù)權(quán)利要求一至八所述的漢字兼容碼,其特征在于分設(shè)音碼檢索鍵Ⅴ和形碼檢索鍵?。
全文摘要
本發(fā)明系一種計(jì)算機(jī)輸入系統(tǒng)漢字兼容碼,它吸取純形碼與純音碼之所長(zhǎng),克服兩者各自固有的缺陷。兩音碼各取漢字的聲、韻母、采用切塊組合,模糊歸類,有利于方言區(qū)人員使用;兩形碼各取漢字的聲符與形符,嚴(yán)格遵從漢字構(gòu)字規(guī)律,合乎漢語規(guī)范,且易學(xué)易記,尤適宜于非專業(yè)人員使用,可在中小學(xué)推廣。漢字兼容碼的單字編碼與詞組編碼能共存共容,以詞為主,以字為輔,從而大大提高了輸入效率。
文檔編號(hào)G06F3/023GK1085670SQ9211160
公開日1994年4月20日 申請(qǐng)日期1992年10月11日 優(yōu)先權(quán)日1992年10月11日
發(fā)明者沈迦, 沈克成 申請(qǐng)人:沈迦, 沈克成