專利名稱:聲母拆字碼漢字輸入編碼方案的制作方法
本方案屬于計算機(jī)漢字輸入編碼領(lǐng)域。
計算機(jī)漢字輸入編碼方案種類繁多,目前使用的編碼方案可歸納為四類一類為數(shù)字碼。使用阿拉伯?dāng)?shù)字,不考慮漢字的發(fā)音和書寫規(guī)律,為每個漢字規(guī)定一組數(shù)字代碼。如國標(biāo)區(qū)位碼,電報碼等。優(yōu)點(diǎn)是不重碼,輸入速度快。缺點(diǎn)是記憶量巨大,很少有人能夠掌握。二類為拼音碼。以漢字發(fā)音為依據(jù),輸入每個漢字的拼音,在同音字中尋找所需漢字。如全拼碼,雙拼碼等。優(yōu)點(diǎn)是不用專門學(xué)習(xí),會拼音方案即可操作。缺點(diǎn)是重碼字太多,輸入速度慢;卷平舌發(fā)音不易做到準(zhǔn)確無誤;不會讀的字無法輸入。三類是字型碼。不考慮漢字的發(fā)音,以字的構(gòu)造形態(tài)為基礎(chǔ),規(guī)定若干拆分部件和它們在鍵盤上的位置。如五筆字型等。優(yōu)點(diǎn)是重碼率低,輸入速度快。缺點(diǎn)是拆分部件較多,與已有文字知識聯(lián)系不夠緊密,需專門學(xué)習(xí),負(fù)擔(dān)一定的記憶量,非專職操作人員不易牢固掌握。四類是混合碼。拼音和字型并用。如自然碼等。這類編碼吸收了拼音碼和字型碼的優(yōu)點(diǎn),同時也保留了它們的缺點(diǎn)。
聲母拆字碼是以不用死記硬背,無需專門訓(xùn)練,符合書寫習(xí)慣,一天即可學(xué)會為目的的漢字輸入編碼方案。
為了實(shí)現(xiàn)上述目的,本發(fā)明是采取如下技術(shù)方案來實(shí)現(xiàn)的1、本方案將漢字分成“筆劃、部首、單字”三種基本要素。
筆劃分“點(diǎn)、橫、豎、撇、捺、折、提、鉤、彎”9種。
部首選自新華字典部首目錄,共50種(主要是非字部首)。這些部首在取碼時不再拆分,如“氵、扌、艸、讠”等。每個部首取一個表義字作為它的要素名稱,如氵(水),扌(手),艸(草),讠(言)等。
單字即字中字。如“努”中的“女、又、力”,“語”中的“五、口”等。字中字大小隨機(jī)而定,數(shù)量不限,認(rèn)識即可,字本身就是要素名稱。
2、每個漢字,不論筆劃多少,均取四碼。第一碼是分類碼,為該字拼音方案的第一個字母(以下稱聲母)。如前—Q,知—Z,安—A等。第二碼至第四碼為拆字碼,每碼均取所拆要素名稱的聲母。如大(橫、撇、捺),拆字碼為HPN,全碼為DHPN;描(手、草、田),拆字碼為SCT,全碼為MSCT;喘(口、山、而),拆字碼為KSE,全碼為CKSE。以此類推。拆字碼的取碼順序是先左后右,先上后下,先外后內(nèi),先橫后豎。如樹(木、又、寸),莫(草、日、大),國(口、王、點(diǎn)),長(橫、鉤、捺)等。
一個字以三碼拆光為首選。如辭(舌、立、十),不能拆成兩碼“舌,辛”和四碼“千、口、立、十”;活(水、千、口),不能拆成兩碼“水、舌”和四碼“水、撇、十、口”;王(橫、十、橫),不能拆成兩碼“橫、土”和四碼“橫、橫、豎、橫”。
在拆分過程中,要遵循“先大后小,取字優(yōu)先”的原則。如辭(舌、立、十)不能拆成“千、口、辛”;兢(克、古、兒)不能拆成“十、兄、克”、“古、兒、克”和“克、十、兄”;活(水、千、口),不能拆成“水、撇、古”等。
一個字如果不能正好三碼拆光,就選擇兩碼拆光,這時需再取一個復(fù)碼,即再取末碼中的末字(取大優(yōu)先)、末部首或末筆,補(bǔ)夠三碼。如坡(土、皮),末碼“皮”中的末字為“又”,其拆字碼為TPY(土、皮、又),全碼為PTPY;碩(石、頁),全碼為SSYB(石、頁、貝);櫻(木、嬰),全碼為YMYN(木、嬰、女)。如果末碼中無末字可取,就取末部首或末筆。如喻(口,俞),末部首為“刀”,全碼為YKYD(口,俞,刀);呂(口、口,,末筆為“橫”,全碼為LKKH;佛(人、弗),末筆為“豎”,全碼為FRFS。以此類推。
在拆分過程中,要堅持“先拆散、后拆連、不拆交”的原則。如“楂”,首選方案拆分為“木、杳、一”(先拆散),次選方案為“木、木、旦”(后拆連)。這類字,兩種拆法均可?!爸臁?撇、未),再取復(fù)碼“捺”,全碼為ZPWN(撇、未、捺),不能拆成“撇、橫、木”(不拆交);好(女、子),再取復(fù)碼“橫”,全碼為HNZH(女、子、橫),不能拆成“女、了、橫”(不拆交)。
如果一個字只能拆成四碼以上(含四碼)時,按“前二末一”取碼,剩余的放棄。如囂(口、口、口),拆字碼為KKK;游(水、方、子),拆字碼為SFZ;發(fā)(折、撇、點(diǎn)),拆字碼為ZPD。按“前二末一”取碼也遵循“取大優(yōu)先”的原則。
3、在四筆以上的字中含有兩筆的單字時,兩筆單字不拆,如果拆字碼不夠三碼,加打復(fù)碼。如樸(木、卜、點(diǎn)),拆字碼為MBD;公(八、厶、點(diǎn)),拆字碼為BSD;古(十、口、橫),拆字碼為SKH。但不成字的可以拆,如叫(口、折、豎),拆字碼為KZS;石(橫、撇、口),拆字碼為HPK。
4、三筆以內(nèi)的字,一律按筆劃取碼。如土(橫、豎、橫),拆字碼為HSH;下(橫、豎、點(diǎn)),拆字碼為HSD。二筆的字,末筆打兩次。如人(撇、捺、捺),拆字碼為PNN;十(橫、豎、豎),拆字碼為HSS;一筆的字,連打三次,如一(橫、橫、橫),拆字碼為HHH。
5、四筆以上的字,不能在散和連的條件下兩碼拆光,稱獨(dú)體字。獨(dú)體字可以拆相交的要素。這類字的拆法是按書寫順序依次拆出編碼要素,規(guī)則同前。如長(橫、鉤、捺),手(撇、二、鉤),東(橫、折、小),井(二、撇、豎)。
6、多音字、允許打錯拆字碼的字和既可這樣打也可那樣打的字設(shè)置了多碼。如“長”有“CHGN”和“ZHGN”兩個編碼;“張”有“ZGCN”和“ZGZN”兩個編碼,輸入哪個編碼都能打出該字。如“櫻”的標(biāo)準(zhǔn)編碼為“YMYN”(木、嬰、女),誤打成“YMBN”(木、貝、女);將“楂”的標(biāo)準(zhǔn)編碼“ZMYY”(木、杳、一)打成“ZMMD”(木、木、旦);再如“禁”,按規(guī)則既可打成JMMS(木、木、示),也可打成JLEX(林、二、小)等等。多碼字打哪個編碼都能輸入該字,可以減少錯打次數(shù),提高輸入效率。
7、詞匯的編碼以字的編碼為基礎(chǔ)。兩字詞匯的編碼,依次取每個字全碼的前兩碼,共四碼。如森林—SMLM,動員—DEYK,筆記—BZJY,工人—GHRP。其余類推。
三字詞匯的編碼,依次取每個字的分類碼加空格鍵。如國務(wù)院—GWY,不得不—BDB,了不起—LBQ,等等。
四字詞匯的編碼,依次取每個字的分類碼。如計劃經(jīng)濟(jì)—JHJJ,改革開放—GGKF,調(diào)查研究—DCYJ,等等。
五字和六字詞匯的編碼,依次取一、二、三、末字的分類碼。如電子工業(yè)部—DZGB,據(jù)不完全統(tǒng)計—JBWJ,計劃委員會—JHWH。以此類推。
七字以上詞匯的編碼,依次取一、三、五、末字的分類碼。如中華人民共和國—ZRGG,計劃生育委員會——JSWH,全國人民代表大會—QRDH。依此類推。
8、為方便使用,設(shè)置了一部分簡碼。字母鍵“I”加鍵盤上排的阿拉伯?dāng)?shù)字(“0”代表“10”)鍵為該數(shù)字的小寫;字母鍵“U”加鍵盤上排的阿拉伯?dāng)?shù)字(“0”代表“10”)鍵為該數(shù)字的大寫。鍵盤上的26個字母鍵加空格鍵,分別代表一個通用高頻字。如;L—了,Z—在,D—的,等等。在兩字詞匯中挑選676個通用高頻詞,以兩碼加空格鍵輸入。其編碼是依次輸入每個字的分類碼加空格鍵。如;因?yàn)椤猋W,所以—SY,只有—ZY,才能—CN。等等。
9、為滿足實(shí)際操作的需要,設(shè)置了萬能鍵“V”。在取碼時,不知道四碼中的任何一碼(或更多時),均可用“V”代替,這時,已知碼相同的字,依次在提示行顯示,供選擇。如;“歿”,不知道該字讀什么,分類碼可以打“V”鍵,然后鍵入拆字碼“DJY”(歹、幾、又),全碼為“VDJY”此時,拆字碼相同的字在提示行依次全部顯示,供選擇;如“吮”(口、厶、兒),既不知該字讀什么,也不知拆字碼的第二碼“厶”讀什么,此時鍵入“VKVE”,這時,2、4碼相同的字在提示行依次顯示,供選擇。其余類推。
10、上述編碼所用拼音字母與鍵盤英文字母完全一致。為合理利用鍵盤,便于操作,降低重碼率,在鍵盤上規(guī)定了三個例外鍵來代表出現(xiàn)頻率較高的筆劃和部首。它們的替代關(guān)系是字母鍵“O”代表“冫、氵”,字母鍵“I”代表“丨、扌”,字母鍵“U”代表“艸”。如“莫”的編碼為“MURD”,“河流”的編碼為“HOLO”,“推廣”的編碼為“TIGD”,等等。
本編碼方案中,無論輸入單個漢字還是詞匯都是四碼輸入,中間沒有換檔操作。當(dāng)出現(xiàn)重碼時,響笛提醒,提示行顯示順序?yàn)閱巫衷谇埃~匯在后(依字?jǐn)?shù)多少順次排列)。重碼單字在兩個以上時,常用字在前(詞匯同理)。本編碼方案中,每組編碼的重碼單字一般只有2—3個,最多不超過5個,如果所需要的漢字(或詞)是提示行的第一個字(或詞),繼續(xù)輸入下面的字(或詞),使該字(或詞)自動輸入即可。
本方案與現(xiàn)有編碼方案相比較,具有如下優(yōu)點(diǎn)與數(shù)字碼相比較,避免了巨大的記憶負(fù)擔(dān),不經(jīng)常使用也不會忘記,并可輸入詞匯。
與拼音碼相比較,可以避免大量的重碼字選擇,提高輸入速度。發(fā)音不需要準(zhǔn)確無誤,能知道每個要素名稱的第一個字母就行(不知道的可以用“V”鍵代替)。沒學(xué)過拼音的人,只要認(rèn)識26個拼音字母,了解拼音的一般知識即可。
與字型碼相比較,不需學(xué)習(xí)拆字部件,不用記住部件與鍵盤字母的對應(yīng)關(guān)系,不必對字進(jìn)行分型識別,僅靠小學(xué)程度的文字知識就能操作,編碼方法與書寫漢字關(guān)系密切,有利于加深理解漢字的構(gòu)造,容易學(xué)會,不易忘記。
與混合碼相比較,規(guī)則簡單,規(guī)律性強(qiáng),沒有例外。無需對字進(jìn)行表音、表義和分型判斷,無需輸入拼音方案,操作失誤率極低。
本編碼方案無重碼輸入率可達(dá)90%,易學(xué)難忘,適合各種文化程度、各種年齡、各類操作人員使用,具有更高的推廣價值。
實(shí)現(xiàn)本方案的方式與實(shí)現(xiàn)其它方案的方式相同。
權(quán)利要求
聲母拆字碼漢字輸入編碼方案,與已有的各種編碼方案一樣,是由現(xiàn)有的計算機(jī)鍵盤和擊鍵時字母的某種排列組合而組成的,鍵盤上鍵入的是計算機(jī)漢字的外碼,通過鍵入外碼,調(diào)出所需要的字或詞匯。聲母拆字碼的技術(shù)特征是1.將“筆劃、部首、單字”作為構(gòu)成漢字的三種基本要素。筆劃分“點(diǎn)、橫、豎、撇、捺、折、提、鉤、彎”9種。部首共50個(主要是非字部首),取每個部首名稱的一個表義字作為該部首的要素名稱。單字,即字中字,大小隨機(jī)而定,認(rèn)識即可,字本身就是要素名稱;
2.每個漢字,不論筆劃多少,均取四碼。第1碼是分類碼,為該字拼音方案的第一個字母。第2、3、4碼為拆字碼,按三種基本要素拆分(單一或混合),每碼均取要素名稱的聲母;
3.每個字的拆分,都以三碼分光為首選,三碼不能分光就兩碼分光。兩碼分光的字,須再補(bǔ)一個復(fù)碼,即在末碼要素中再取一個末字(取大優(yōu)先)、未部首或末筆劃,補(bǔ)足三碼。如果一個字只能拆成四碼以上(含四碼)時,按前二末一取碼(取大優(yōu)先,剩余的放棄);
4.三筆以內(nèi)的字,一律按筆劃取碼。兩筆的字,末筆取兩次。一筆的字,連取三次。四筆以上的字中含有兩筆的單字時,兩筆的單字一律不拆,拆字碼不夠三碼時,用復(fù)碼補(bǔ)夠;
5.多碼。多音字、允許拆錯的字和既可這樣拆也可那樣拆的字,設(shè)置了多碼。打多碼同樣可以輸入該字;
6.兩字詞匯依次取每字全碼的前兩碼,合為四碼。三字詞匯依次取每字的分類碼加空格鍵。四字詞匯依次取每字的分類碼。五字和六字詞匯依次取一、二、三、末字的分類碼。七字以上詞匯依次取一、三、五、末字的分類碼;
7.簡碼。字母鍵“I”加鍵盤上排的阿拉伯?dāng)?shù)字鍵(“0”代表“10”)為相應(yīng)的小寫。字母鍵“U”加鍵盤上排的阿拉伯?dāng)?shù)字鍵為相應(yīng)的大寫。在雙字詞匯中挑選676個常用詞匯,以兩個單字的分類碼加空格輸入;
8.萬能鍵“V”代表單字編碼中的任何一個未知碼,使其余已知碼相同的字在提示行顯示,供選擇。
全文摘要
聲母拆字碼漢字輸入編碼方案屬計算機(jī)漢字輸入編碼領(lǐng)域。本發(fā)明的特征在于以鍵入聲母代替寫字,每字四碼。第一碼是分類碼,為該字拼音的第一個字母,第二至第四碼為拆字碼,拆字碼取自構(gòu)成漢字三要素的“筆劃、部首、單字”(單一或混合),每個要素名稱的聲母為其代碼。拆字時,每字三碼拆光為首選,不能三碼拆光就兩碼拆光,加復(fù)碼(末碼中的末字或末筆)打夠三碼,四碼以上的字取前二末一(取大優(yōu)先)。
文檔編號G06F3/023GK1124851SQ9410243
公開日1996年6月19日 申請日期1994年3月26日 優(yōu)先權(quán)日1994年3月26日
發(fā)明者鄧兆林 申請人:鄧兆林