專利名稱:新部首檢字法的制作方法
技術(shù)領域:
本發(fā)明屬中文信息處理技術(shù),適用于一切需要進行漢字檢索的領域。如辭書的編撰、電子計算機漢字輸入。
近幾十年來,人們?yōu)槭節(jié)h字適應現(xiàn)代化的需要,對漢字的檢索提出了幾百種的方案,除目前市場上比較多見的拼音碼、區(qū)位碼、五筆字形,前三末一,雙拼雙音等方法外,一九九三年,中國專利局又公告了不少于四十個的漢字檢索(電子計算機漢字輸入)方案。如公告號為1074297A的《漢字筆畫編碼方法》、公告號為1074298A的《漢字編碼方法及其輸入鍵盤》及公告號為1072519A的《漢字部首筆畫輸入法》……這眾多的漢字編碼方案,對漢語言文字的發(fā)展作出了可喜的貢獻,但仍沒有使?jié)h字檢索技術(shù)完善,主要表現(xiàn)為輸入速度快的、難學難記,好學好記的,輸入速度又慢;有些能用于電腦漢字輸入,卻不能便于編辭書,有些編碼不能獨立地使用,(各種音碼,道理很簡單,誰都有不認識的字和讀不準音的字),有些只能供專業(yè)人員使用。并在與傳統(tǒng)檢字法的結(jié)合上做得不夠,使人感受不到是傳統(tǒng)檢字法的電子版與擴展。這里所講的傳統(tǒng)檢字法主要指《部首檢字法》與《筆畫檢字法》)。
本發(fā)明就是要創(chuàng)造出一種記憶量極少,極易學習使用,又有一定的輸入電腦速度,并能同傳統(tǒng)檢字法較緊結(jié)合的檢字方法。我把她命名為《新部首檢字法》或《姜氏漢字檢字法》本法將漢字的五種基本筆形橫、豎、撇、點/捺、折用阿拉伯數(shù)字1至5代表(在電腦鍵盤上也可用字母等鍵代表)。需要說明的是挑( )筆形作橫處理,如“刁”字中的第二筆挑點( )作點處理如冫、氵、丬三部首中第二、第三、第二筆。短撇作撇處理,如“羊、火”兩字第二筆,所有帶鉤與帶折的筆形都按折類筆處理。
當需要檢索(輸入)一個漢字時,依該字部首書寫筆順的第一筆與第二筆組碼。例“偵”字,其部首為“亻”傍,第一筆與第二筆為撇和豎。代碼是“32”。但起筆為撇和豎的部首不只一個,如“白、血、自、臼、佳、鬼、鼠、鼻”都是起筆為撇和豎的部首。為了使“亻”傍與其它部首有所區(qū)別,也是為了減少同碼字,我在此設定一個部首確定符。這個部首確定符也就是阿拉伯數(shù)字0至7,其使用規(guī)則如下1.一畫的部首不要使用部首確定符,直接依該字的書寫筆順取前五位筆畫組碼。(其含義包括一畫的部首位于一個字的最右、最后、最下不取,而依該字的書寫筆順取其前五筆)。
2.二畫的部首除右耳朵傍用1作部首確定符外,其它都以0作部首確定符。
3.三畫的部首以該部首的第三筆的筆形代碼作部首確定符。
4.四畫的部首以4作部首確定符。
5.五畫的部首以5作部首確定符。
6.六畫的部首以6作部首確定符。
7.七畫及其以上的筆畫全部以7作部首確定符。
按照以上的方法可以得出部首檢索表(1)部首檢索表(1)
按照以上規(guī)則,“亻”部首的代碼是320;“白”部首是325;“血、自”部首是326;“刂”是258。
以上部首確定符還可以擴展,如除了用數(shù)字處,還可以用字母,及利用部首的聲、韻母來確定。
以上講的是利用有理編碼的方法規(guī)定部首確定符,下面講用無理的方法對部首進行確定,所謂無理,指的是每個部首確定符是硬性規(guī)定的。這里用數(shù)字0至9(同樣可以擴展用字母及利用部首的聲、韻母等)。請看部首檢索表(2)
根據(jù)部首檢索表二“亻”部首的部首代碼是320;“白”部首的代碼是322;“血、自”部首代碼是324。
為了減少記憶量,在電腦上采用上述方法時可以作這樣一種設計,當你輸入了一個字部首的頭兩筆,電腦提示行便自動顯示所有起筆是你輸入的頭兩筆的部首。例當你輸入一橫一撇,既代碼13,此時起筆為一橫一撇的部首全部躍上提示行,它們是“0廠”2廾4大4尤4犬4歹5龍6頁7辰7豕”。此時,你再按你需要的部首前的數(shù)字,該部首就檢索到了。
確定了部首,也就是說確定了前碼,下面就要對整字進行編碼檢索了。
本法規(guī)定后碼取除去部首后該字書寫筆順的開頭一筆與最后一筆。仍以“偵”字為例,除去部首后,該字書寫筆順的頭一筆是豎,最后一筆是捺,代碼為24,同前碼聯(lián)系起來,“偵”字編碼是32024。
部首確定后,也可以采用除去部首后,按該字書寫筆順的開頭二筆,或該字的最后兩筆或開頭一筆最后兩筆,甚至是開頭二筆最后一筆,采用上述方法,“偵”將有下面幾種編碼偵=32021(后碼采用除去部首后的開頭兩筆,筆形分別是豎和橫。
偵=32034(后碼采用除去部首后該字的最后兩筆,筆形是撇和捺);
偵=320214(后碼采用除去部首后,該字的開頭兩筆與最后一筆,筆形分別是豎橫和捺);
偵=32024(后碼采用除去部首后,該字的開頭一筆和最后兩筆,筆形分別是豎和撇捺。
采用何種方法編后碼,應全文統(tǒng)一。本文示例除另有說明外,采用《部首檢索表(1)》的部首確定符,及除去部首后該字書寫筆順的第一筆與最后一筆編碼。
對分不清部首的字,按該字的書寫筆順取其前五筆編碼。例民=51515;夾=14313;
對有幾個部首的字,以起筆部首為準。例古=12021;思=25544;對=54014有些字分收在幾個部首里。例畫=12512(按一畫部首取前五位筆畫編碼);
畫=52811(取下部首凵及該字去除部首后書寫筆順的開頭一筆和最后一筆);
對四筆及其以下的字按其書寫筆順取其實際筆畫數(shù)編碼。例之=454豐=1112九=35乙=5對除去部首后,只有一筆的字,后碼就取其一筆,并加數(shù)字0補齊五碼。例旦=125410玉=11440如果你要輸入的是部首本身,按完部首確定符之后,擊一下空格鍵即可。
對同碼字處理的規(guī)則是當你要輸入的字排在第一位不用選擇,若排在其他位,以該字前的數(shù)碼為選擇碼,是5就按5是6就按6,若同碼字多可按“<”鍵翻頁。
對高頻字,除編入部首外,可另用鍵安排。
本法同樣適用繁體字的檢索(輸入)。
附背景材料兩份1.對近兩年漢字編碼方案的管窺2.新部首檢字法與其它一些檢字法之比較。
權(quán)利要求
1.一種適用于一切需要進行漢字檢索領域的新部首檢字法,其特征是將漢字的基本筆形橫、豎、撇、點/捺、折用阿拉伯數(shù)字1至5代表,在電腦鍵盤上也可用字母等鍵代表,當需檢索(輸入)一個漢字時,依該字部首書寫筆順的第一筆與第二筆組碼,然后再用設定的部首確定符對部首進行確定,再取除去部首后該字書寫筆順的第一筆與最后一筆編碼。
2.根據(jù)權(quán)利要求1的新部首檢字法,其特征是對部首的確定采用有理和無理兩種方法確定,有理編碼用阿拉伯數(shù)字0至7確定,規(guī)則如下(1).一畫的部首不要使用部首確定符,直接依該字書寫筆順取前五位筆畫組碼;(2).二畫的部首除右耳朵傍用作1作部首確定符外,其它都以0作部首確定符;(3).三畫的部首以該部首最后一筆的筆形代碼作部首確定符;(4).四畫的部首以4作部首確定符;(5).五畫的部首以5作部首確定符;(6).六畫的部首以6作部首確定符;(7).七畫及其以上的部首以7作部首確定符;無理編碼用阿拉伯數(shù)字0至9對部首進行確定。
3.根據(jù)權(quán)利要求1和2的新部首檢字法,其特征是有部首檢索表(1)和部首檢索表(2)如下
4.根據(jù)權(quán)利要求1的新部首檢字法,其特征是后碼還可以取除去部首后該字書寫筆順的開頭兩筆或最后兩筆,或開頭兩筆最后一筆甚至是開頭一筆最后兩筆。
5.根據(jù)權(quán)利要求1和2的新部首檢字法其特征是部首確定符還可以擴展,除了用數(shù)字外,還可以用字母及利用部首的聲、韻母來確定。
全文摘要
新部首檢字法屬中文信息處理技術(shù),適用于一切需要進行漢字檢索的領域。其特征是將漢字的五種基本筆形橫、豎、撇、點/捺、折用阿拉伯數(shù)字1至5代表,取一個字部首書寫筆順的開頭兩筆編碼,然后再用設定的部首確定符對部首進行確定,再取該字除去部首后的開頭一筆和最后一筆編碼。
文檔編號G06F3/023GK1096603SQ9410299
公開日1994年12月21日 申請日期1994年3月31日 優(yōu)先權(quán)日1994年3月31日
發(fā)明者姜平泉 申請人:姜平泉