專利名稱:數(shù)碼字典查字方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字查字方法,尤其是涉及一種數(shù)碼字典查字方法。
背景技術(shù):
傳統(tǒng)的查字方法首先是查找所查字的偏旁部首,然后在檢字表中找到該部首,再依據(jù)余部的筆畫查找該字及頁碼。這種查字方法,步驟較多,查找速度慢,且不能很好地適應(yīng)計算機和信息通訊的需要。如申請?zhí)枮?2128784,申請日為2002年8月17日,發(fā)明名稱為漢字首部件檢字法的專利申請,它是將漢字拆分為首部件及余部,首部件是指按照規(guī)范的漢字書寫筆順,首先書寫的那個漢字字頭或偏旁,它可以是一個多筆畫的漢字結(jié)構(gòu)件,也可以是一個單筆畫;首部件目錄將首部件按筆畫數(shù)多少的順序進(jìn)行排列,并在每個首部件旁列有該首部件在首部件檢字表中的頁碼;余部是指將漢字首部件拆除后的剩余筆畫部分;在首部件檢字表中在每個首部件下按拆除漢字首部件后的余部筆畫特征的數(shù)字編碼順序排列漢字,在每個漢字旁列有該漢字余部筆畫特征的數(shù)字編碼及該漢字在字典正文上的頁碼;檢字時將要檢索的字依據(jù)首部件拆分規(guī)則,首先確定該漢字的首部件,并在首部件目錄中查得該首部件在首部件檢字表中的頁碼,再在首部件檢字表中相應(yīng)頁碼處的首部件下按該漢字余部筆畫特征的數(shù)字編碼的大小依序查得該漢字及其在字典正文上的頁碼,按這個頁碼就可在字典正文對應(yīng)頁上查到所需的漢字。該輸入法查找起來速度較慢,不能和計算機輸入法很好的相適應(yīng),不能很好的滿足現(xiàn)時代電腦和數(shù)字化通訊發(fā)展的需要。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種比傳統(tǒng)查字方法速度快,易學(xué)易記,且適應(yīng)現(xiàn)時代電腦化和數(shù)字化通訊發(fā)展的需要的,可以進(jìn)一步生成輸入法的利用數(shù)碼進(jìn)行查字的數(shù)碼字典查字方法。
本發(fā)明是通過下述技術(shù)方案來實現(xiàn)上述目的的本發(fā)明依據(jù)國家頒布的《漢字統(tǒng)一部首表(草案)》和《新華字典》所選用的常用部首做為漢字部首信息,將漢字拆分為主部首和輔部首,再通過一定的對應(yīng)規(guī)則將這些部首轉(zhuǎn)化為數(shù)字編碼即部首字典碼,這些數(shù)字代碼主要是依據(jù)所代表的部首的筆畫數(shù)和該部首的起筆筆畫進(jìn)行編碼的。
所述漢字部首的拆分規(guī)則為部首若是分離形的,按照字體自然形狀進(jìn)行拆分即可,如果部首是膠合形或是嵌套形的,按如下規(guī)則拆分a、取大不取小,即當(dāng)取一個膠合或是嵌套形的漢字部首時,如有多個部首組合形式可拆分,則優(yōu)先取筆畫數(shù)多的部首組合形式,即所謂信息最大化原則。b、取先不取后,即當(dāng)取一個膠合或是嵌套形的漢字部首時,如筆畫數(shù)相同,則取先筆畫的部首,即所謂信息快捷優(yōu)先原則;c、取過的筆畫不再重復(fù)提取,即所謂信息唯一性原則;部首字典碼的取碼規(guī)則為對于單部首字,部首字典碼由一個數(shù)字代碼組成;對于二部首漢字,部首字典碼由二個數(shù)字代碼組成,第一數(shù)字代碼所代表的部首取自漢字的主部首,第二數(shù)字代碼所代表的部首是漢字的輔部首;對于三部首或三部首以上漢字,部首字典碼由三個數(shù)字代碼組成,第一數(shù)字代碼所代表的部首取自漢字的主部首,第二、三數(shù)字代碼所代表的部首分別是漢字的第一、二輔部首;輔部首碼的取碼原則仍遵循信息最大化原則,即6筆畫和6筆畫以上的部首先取,然后依次是5筆畫,4筆畫,3筆畫,2筆畫和單筆畫,在筆畫數(shù)相同的情況下,則遵循信息快捷優(yōu)先原則,按書寫順序,先出現(xiàn)筆劃的,不論其是否全部寫完,均優(yōu)先選取。
部首字典碼中的數(shù)字代碼與所代表的部首之間的對應(yīng)規(guī)則為a、二筆畫部首的數(shù)字代碼用二個數(shù)字表示,分別為數(shù)字“1”和數(shù)字“2”,其中以橫筆、點筆(包括捺筆)、折筆起頭的部首數(shù)字代碼為數(shù)字“1”,以豎筆(包括豎鉤)、撇筆起頭的部首數(shù)字代碼為數(shù)字“2”;b、三筆畫部首的數(shù)字代碼用四個數(shù)字表示,分別為數(shù)字“0”、數(shù)字“3”、數(shù)字“7”和數(shù)字“9”,其中以橫筆起頭的部首數(shù)字代碼為數(shù)字“0”,以豎筆(包括豎鉤)起頭的部首字代碼為數(shù)字“3”,以點筆(包括捺筆)起頭的部首數(shù)字代碼為數(shù)字“7”,以撇筆和折筆起頭的部首字代碼為數(shù)字“9”;c、四筆畫部首的數(shù)字代碼用二個數(shù)字表示,分別為數(shù)字“4”、數(shù)字“8”,其中以橫筆、點筆(包括捺筆)和折筆起頭的部首代碼為數(shù)字“4”,以豎筆(包括豎鉤)和撇筆起頭的部首數(shù)字代碼為數(shù)字“8”;d、五筆畫部首的數(shù)字代碼為數(shù)字“5”;e、六筆畫和六筆畫以上部首的數(shù)字代碼為數(shù)字“6”;f、單筆畫部首,如橫、豎(包括豎鉤)、撇、點(包括捺筆)、折,分別用數(shù)字“5”、“6”、“7”、“8”、“9”表示。
本發(fā)明優(yōu)點在于數(shù)碼字典更適合于現(xiàn)代科學(xué)發(fā)展的需要,它將漢字查字方法數(shù)字化,便于漢字大規(guī)模地應(yīng)用于計算機和信息通訊;由于它選取的漢字部首是依據(jù)國家頒布的《漢字統(tǒng)一部首表(草案)》和《新華字典》所選用的常用部首,因此在查字時具有很好的規(guī)范性,在和以往的查字方法銜接時具有很好的承接性;中、小學(xué)生使用這種漢字查字方法,可以鞏固對漢字結(jié)構(gòu)的記憶和掌握。數(shù)碼字典在收錄漢字時,以《新華字典》為標(biāo)準(zhǔn),將簡體字、異形體字和繁體字混排,滿足一般漢字查字的需要;且數(shù)碼字典的查字速度較以往的筆畫查字速度更換。
以下結(jié)合附圖和具體實施例對本發(fā)明作進(jìn)一步說明
圖1為本發(fā)明部首筆畫編碼表。
具體實施例本發(fā)明通過一定的拆分和取碼規(guī)則選取漢字部首信息,再通過一定的對應(yīng)規(guī)則將這些部首轉(zhuǎn)化為數(shù)字編碼即部首字典碼;將漢字依照部首字典碼的順序排列在檢字表中,部首字典碼旁列有該字在字典中的頁數(shù),按照該頁數(shù)即可查到該字;部首字典碼最多由三個數(shù)字代碼組成,這些數(shù)字代碼主要是依據(jù)所代表的部首的筆畫數(shù)和該部首的起筆筆畫進(jìn)行編碼的。
漢字部首的拆分規(guī)則為部首若是分離形的,按照字體自然形狀進(jìn)行拆分即可,如“技、榮、造、晶”“技”拆分為“扌、十、又”,“榮”拆分為“艸、冖、木”,“造”拆分為“ 口、辶”,“晶”拆分為“日、日、日”。
如果部首是膠合形或是嵌套形的,則按照取大不取小,取先不取后,取過的筆畫不重復(fù)提取三原則進(jìn)行拆分,如“產(chǎn)、成、昔、錘”“產(chǎn)”拆分為“立、丿”,“成”拆分成“戈、丿、 ”,“昔”拆分成“艸、一、日”,“錘”拆分成“钅、丿、 艸”。
漢字部首的選取依據(jù)國家頒布的《漢字統(tǒng)一部首表(草案)》,并參閱各種版本的《新華字典》所選用的常用部首,另根據(jù)漢字輸入法的特點做少量的增減。
部首字典碼中的數(shù)字代碼與所代表的部首之間的對應(yīng)規(guī)則為a、二筆畫部首的數(shù)字代碼用二個數(shù)字表示,分別為數(shù)字“1”和數(shù)字“2”,其中以橫筆、點筆(包括捺筆)、折筆起頭的部首數(shù)字代碼為數(shù)字“1”,以豎筆(包括豎鉤)、撇筆起頭的部首數(shù)字代碼為數(shù)字“2”;b、三筆畫部首的數(shù)字代碼用四個數(shù)字表示,分別為數(shù)字“0”、數(shù)字“3”、數(shù)字“7”和數(shù)字“9”,其中以橫筆起頭的部首數(shù)字代碼為數(shù)字“0”,以豎筆(包括豎鉤)起頭的部首字代碼為數(shù)字“3”,以點筆(包括捺筆)起頭的部首數(shù)字代碼為數(shù)字“7”以撇筆和折筆起頭的部首字代碼為數(shù)字“9”;c、四筆畫部首的數(shù)字代碼用二個數(shù)字表示,分別為數(shù)字“4”、數(shù)字“8”,其中以橫筆、點筆(包括捺筆)和折筆起頭的部首代碼為數(shù)字“4”,以豎筆(包括豎鉤)和撇筆起頭的部首數(shù)字代碼為數(shù)字“8”;d、五筆畫部首的數(shù)字代碼為數(shù)字“5”;e、六筆畫和六筆畫以上部首的數(shù)字代碼為數(shù)字“6”;f、單筆畫部首,如橫、豎(包括豎鉤)、撇、點(包括捺筆)、折,分別用數(shù)字“5”、“6”、“7”、“8”、“9”表示。
部首字典碼中的數(shù)字代碼與部首的詳細(xì)對應(yīng)關(guān)系參見附圖1中的“部首筆畫編碼表”。
部首字典碼的取碼規(guī)則為對于單部首字,部首字典碼由一個數(shù)字代碼組成;對于二部首漢字,部首字典碼由二個數(shù)字代碼組成,第一數(shù)字代碼所代表的部首取自漢字的主部首,第二數(shù)字代碼所代表的部首是漢字的輔部首;對于三部首或三部首以上漢字,部首字典碼由三個數(shù)字代碼組成,第一數(shù)字代碼所代表的部首取自漢字的主部首,第二、三數(shù)字代碼所代表的部首分別是漢字的第一、二輔部首;輔部首碼的取碼原則仍遵循信息最大化原則,即6筆畫和6筆畫以上的部首先取,然后依次是5筆畫,4筆畫,3筆畫,2筆畫和單筆畫,在筆畫數(shù)相同的情況下,則遵循信息快捷優(yōu)先原則,按書寫順序,先出現(xiàn)筆劃的,不論其是否全部寫完,均優(yōu)先選取。
舉例如下“木”的代碼為“4”,“革”的代碼為“6”,“洋”的代碼為“76”,“現(xiàn)”的代碼為“48”,“學(xué)”的代碼為“918”,“部”的代碼為“153”,“都”的代碼為“180”,“縫”的代碼為“949”,“蹇”的代碼為“765”,“鍾”的代碼為“548”,“她”的代碼為“996”。
具體應(yīng)用時,先根據(jù)上述規(guī)則得到所查字的部首字典碼,然后在檢字表中找到該部首字典碼,即可得該字在字典中對應(yīng)的頁碼,翻到該頁即查到該字。
權(quán)利要求
1.一種數(shù)碼字典查字方法,其特征在于通過一定的拆分和取碼規(guī)則選取漢字部首信息,將漢字拆分為主部首和輔部首,再通過一定的對應(yīng)規(guī)則將這些部首轉(zhuǎn)化為數(shù)字編碼即部首字典碼;將漢字依照其部首字典碼的順序排列在字典檢字表中,部首字典碼旁列有該字在字典中的正文頁數(shù),按照該頁數(shù)即可查到該字;部首字典碼最多由三個數(shù)字代碼組成,這些數(shù)字代碼主要是依據(jù)所代表的部首的筆畫數(shù)和該部首的起筆筆畫進(jìn)行編碼的。
2.根據(jù)權(quán)利要求1所述的數(shù)碼字典查字方法,其特征在于所述漢字部首的拆分規(guī)則為部首若是分離形的,按照字體自然形狀進(jìn)行拆分即可,如果部首是膠合形或是嵌套形的,按如下規(guī)則拆分a、取大不取小,即當(dāng)取一個膠合或是嵌套形的漢字部首時,如有多個部首組合形式可拆分,則優(yōu)先取筆畫數(shù)多的部首組合形式,即所謂信息最大化原則。b、取先不取后,即當(dāng)取一個膠合或是嵌套形的漢字部首時,如筆畫數(shù)相同,則取先筆畫的部首,即所謂信息快捷優(yōu)先原則;c、取過的筆畫不再重復(fù)提取,即所謂信息唯一性原則;部首字典碼的取碼規(guī)則為對于單部首字,部首字典碼由一個數(shù)字代碼組成;對于二部首漢字,部首字典碼由二個數(shù)字代碼組成,第一數(shù)字代碼所代表的部首取自漢字的主部首,第二數(shù)字代碼所代表的部首是漢字的輔部首;對于三部首或三部首以上漢字,部首字典碼由三個數(shù)字代碼組成,第一數(shù)字代碼所代表的部首取自漢字的主部首,第二、三數(shù)字代碼所代表的部首分別是漢字的第一、二輔部首;輔部首碼的取碼原則仍遵循信息最大化原則,即6筆畫和6筆畫以上的部首先取,然后依次是5筆畫,4筆畫,3筆畫,2筆畫和單筆畫,在筆畫數(shù)相同的情況下,則遵循信息快捷優(yōu)先原則,按書寫順序,先出現(xiàn)筆劃的,不論其是否全部寫完,均優(yōu)先選取。
3.根據(jù)權(quán)利要求1所述的數(shù)碼字典查字方法,其特征在于部首字典碼中的數(shù)字代碼與所代表的部首之間的對應(yīng)規(guī)則為a、二筆畫部首的數(shù)字代碼用二個數(shù)字表示,分別為數(shù)字“1”和數(shù)字“2”,其中以橫筆、點筆(包括捺筆)、折筆起頭的部首數(shù)字代碼為數(shù)字“1”,以豎筆(包括豎鉤)、撇筆起頭的部首數(shù)字代碼為數(shù)字“2”;b、三筆畫部首的數(shù)字代碼用四個數(shù)字表示,分別為數(shù)字“0”、數(shù)字“3”、數(shù)字“7”和數(shù)字“9”,其中以橫筆起頭的部首數(shù)字代碼為數(shù)字“0”,以豎筆(包括豎鉤)起頭的部首字代碼為數(shù)字“3”,以點筆(包括捺筆)起頭的部首數(shù)字代碼為數(shù)字“7”以撇筆和折筆起頭的部首字代碼為數(shù)字“9”;c、四筆畫部首的數(shù)字代碼用二個數(shù)字表示,分別為數(shù)字“4”、數(shù)字“8”,其中以橫筆、點筆(包括捺筆)和折筆起頭的部首代碼為數(shù)字“4”,以豎筆(包括豎鉤)和撇筆起頭的部首數(shù)字代碼為數(shù)字“8”;d、五筆畫部首的數(shù)字代碼為數(shù)字“5”;e、六筆畫和六筆畫以上部首的數(shù)字代碼為數(shù)字“6”;f、單筆畫部首,如橫、豎(包括豎鉤)、撇、點(包括捺筆)、折,分別用數(shù)字“5”、“6”、“7”、“8”、“9”表示。
全文摘要
本發(fā)明公開了一種數(shù)碼字典查字方法,依據(jù)國家頒布的《漢字統(tǒng)一部首表(草案)》和《新華字典》所選用的常用部首做為漢字部首信息,將漢字拆分為主部首和輔部首,再通過一定的對應(yīng)規(guī)則將這些部首轉(zhuǎn)化為數(shù)字編碼即部首字典碼;將漢字依照部首字典碼的順序排列在檢字表中,部首字典碼旁列有該字在字典中的頁數(shù),按照該頁數(shù)即可查到該字;部首字典碼最多由三個數(shù)字代碼組成,這些數(shù)字代碼主要是依據(jù)所代表的部首的筆畫數(shù)和該部首的起筆筆畫進(jìn)行編碼的。本發(fā)明易學(xué)易記,查找速度快;和以往的查字方法銜接時具有很好的承接性;將簡體字、異形體字和繁體字混排,滿足一般漢字查字的需要;便于漢字大規(guī)模地應(yīng)用于計算機和信息通訊。
文檔編號G06F17/28GK1588353SQ20041005132
公開日2005年3月2日 申請日期2004年9月3日 優(yōu)先權(quán)日2004年9月3日
發(fā)明者張東 申請人:張東