專利名稱:漢字數(shù)據(jù)庫首筆組合編碼法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明是一種漢字數(shù)據(jù)庫首筆組合編碼法,屬于計算機漢字信息輸入領(lǐng)域。
隨著科學(xué)的發(fā)展和計算機的性能/價格比升值,微機的應(yīng)用迅速普及,漢字數(shù)據(jù)庫的編碼成為當(dāng)前迫切需要解決的難題之一。在醫(yī)療衛(wèi)生部門目前所用的數(shù)據(jù)編碼僅起著貸號的作用,微機操作人員很難記憶,手中離不開編碼本,怠機現(xiàn)象嚴重,限制了工作效率。
本發(fā)明針對上述問題,設(shè)計一種只在微機小字盤區(qū)數(shù)字鍵操作的漢字首筆組合的編碼法,它將數(shù)據(jù)庫中的漢字信息直按轉(zhuǎn)化為2-8位數(shù)的純數(shù)字碼。
本發(fā)明是這樣實現(xiàn)的一種漢字數(shù)據(jù)庫首筆組合編碼法,是給予漢字的偏旁(部首)一相應(yīng)代碼,其技術(shù)要點是利用其代碼對數(shù)據(jù)庫中漢字信息的關(guān)鍵進行編碼,每一編碼即相應(yīng)一條漢字信息,該編碼法遵循以下幾個規(guī)則(1)根據(jù)專業(yè)名詞、詞匯的使用情況,統(tǒng)計出漢字偏旁(部門)出現(xiàn)的頻率,按其頻率從高到低依次排序,然后分別賦予相應(yīng)數(shù)字代碼;
(2)使用頻率低的偏旁(部首),可與使用頻率高的使用同一代碼;
(3)起始碼是由最大的代碼縮小10倍之后,其整數(shù)部分加1,即a=INT(Max/10)+1其中a-起始碼,INT-取整函數(shù),Max-最大的代碼。
以下對其它技術(shù)特點進行展開說明規(guī)則(3)是一個避免重碼的重要的規(guī)則,除此之外還有兩點降低重碼率的規(guī)則(1)對使用頻率高,且易造成重碼的偏旁(部首)代碼,可將該偏旁(部首)用標(biāo)記框起來,在編碼時,取該偏旁(部首)之后的第二筆結(jié)構(gòu)的代碼。如“钅”的代碼是17,在編氯化鉀、氯化鈉、氯化鎂、氯化鈣時,其編碼分別是51916、51923、5194、51925,其中帶下劃線標(biāo)記部分為上列名詞中第三個漢字的第二筆結(jié)構(gòu)的代碼。
(2)當(dāng)同一藥物有多種劑型時,除片劑省略劑型代碼外,其他劑型在其編碼不足8位數(shù)時,可補加劑型碼加以區(qū)別。
劑型代碼如下眼膏0,膠囊1,注射劑2,散劑,粉劑3,溶液劑4,霜劑、膏、糊5,氣霧劑、栓劑6,貼劑、膜劑7,耳、鼻用滴劑8,眼藥水9。
根據(jù)規(guī)則,本法在西藥藥品數(shù)據(jù)庫編碼中使用的漢字偏旁(部首)與代碼之間的對應(yīng)關(guān)系如下所示
代碼 代表字母 偏旁(部首) 代碼 代表字母偏旁(部首)3 a 一王主 17 O 钅(金)勹夕 4 b 二冫丷雨十 18 P 扌(手)白斤5 c 丿竹夂 19 q 人亻八癶 6 d 木艸弋 20 r 乙(習(xí))乛7 e 禾西(酉)忄心 21 s 厶 又8 f 氵水 小() 22 t 子阝耳疒9 g 宀冖 彳 23 u 蟲 (己已巳)10 h 三石古 24 v 女彐 臼11 i 幺七弓七 25 w 丨 卜 刂12 j 亠讠廣 26 x 山由 幾13 k 匚( )丁工廠 27 y 灬米14 l 月爫(爪) 28 z 火車力兒丶15 m 口土士干川 29 乂 (乃)16 n 囗日曰田四目 30 馬本法主要優(yōu)點(1)操作速度快,主要是純數(shù)字碼,且直接由漢字結(jié)構(gòu)轉(zhuǎn)換,不是通過其他途徑間接轉(zhuǎn)換,其二,是純數(shù)字碼只用小鍵盤區(qū)的數(shù)字鍵,單手操作,擊鍵頻率高。
(2)準(zhǔn)確、易掌握利用漢語拼音聲母轉(zhuǎn)換、或四角號碼轉(zhuǎn)換的所謂“見名釋碼”法,有些漢字的讀音掌握不準(zhǔn)、或有些漢字的角碼莫棱兩可使其準(zhǔn)確率不高。本法,只要記熟其偏旁(部首)代碼,準(zhǔn)確率較高、且易掌握。
(3)重碼率低本法在實踐應(yīng)用中其重碼率比漢語拼音聲母轉(zhuǎn)換法低10倍,比角碼法低20多倍。
(4)用途廣泛,易于推廣,適用于各行業(yè)的微機漢字數(shù)據(jù)庫編碼。
權(quán)利要求
1.一種漢字數(shù)據(jù)庫首筆組合編碼法,是給予漢字的偏旁(部首)一相應(yīng)代碼,其特征在于利用其代碼對數(shù)據(jù)庫中漢字信息的關(guān)鍵字進行編碼,每一編碼即對應(yīng)一條漢字信息,該編碼法遵循以下幾個規(guī)則(1)根據(jù)專業(yè)名詞、詞匯的使用情況,統(tǒng)計出漢字偏旁(部首)出現(xiàn)的頻率,按其頻率從高到低依次排序,然后分別賦予相應(yīng)數(shù)字代碼;(2)使用頻率低的偏旁(部首),可與使用頻率高的使用同一代碼;(3)起始碼是由最大的代碼縮小10倍之后,其整數(shù)部分加1,即起始碼=INT(最大的代碼/10)+1。
2.按照權(quán)利要求1所述的編碼法,其特征在于它的降低重碼率的規(guī)則為(1)對使用頻率高,且易造成重碼的偏旁(部首)代碼,可將該偏旁(部首)用標(biāo)記框起來,在編碼時,取該偏旁(部首)之后的第二筆結(jié)構(gòu)的代碼。(2)當(dāng)同一藥物有多種劑型時,除片劑省略劑型代碼外,其他劑型在其編碼不足8位數(shù)時,可補加劑型碼加以區(qū)別。
3.按照權(quán)利要求2所述的編碼法,其特征在于劑型代碼為眼膏0,膠囊1,注射劑2,散劑、粉劑3,溶液劑4,霜劑、膏、糊5,氣霧劑、栓劑6,貼劑、膜劑7,耳、鼻用滴劑8,眼藥水9。
4.按照權(quán)利要求1所述的編碼法,其特征在于漢字偏旁(部首)與代碼之間的對應(yīng)關(guān)系為代碼 代表字母 偏旁(部首) 代碼 代表字母偏旁(部首)3 a 一王主 17 O 钅(金)勹夕 4 b 二冫丷雨十 18 P 扌(手)白斤5 c 丿竹夂 19 q 人亻八癶 6 d 木艸弋 20 r 乙(習(xí))乛7 e 禾西(酉)忄心 21 s 厶 又8 f 氵水 小() 22 t 子阝耳疒9 g 宀冖 彳 23 u 蟲 (己已巳)10 h 三石古 24 v 女彐 臼11 i 幺七弓七 25 w 丨 卜 刂12 j 亠讠廣 26 x 山由 幾13 k 匚( )丁工廠 27 y 灬米14 l 月爫(爪) 28 z 火車力兒丶15 m 口土士干川 29 乂 (乃)16 n 囗日曰田四目 30 馬
全文摘要
漢字數(shù)據(jù)庫首筆組合編碼法屬于計算機漢字信息輸入領(lǐng)域。它是給予漢字偏旁(部首)一相應(yīng)代碼,其要點是對數(shù)據(jù)庫中漢字信息的關(guān)鍵字進行編碼,該編碼法規(guī)則如下根據(jù)專業(yè)名詞、詞匯漢字偏旁(部首)出現(xiàn)的頻率,從高到低依次排序,分別賦予相應(yīng)數(shù)字代碼;使用頻率低的偏旁(部首)可與頻率高的用同一代碼;起始碼=INT(最大的代碼/10)+1。它有見名釋碼、重碼率極低,易掌握的優(yōu)點,本法尤適用于醫(yī)藥等行業(yè)。
文檔編號G06F3/023GK1102262SQ93115190
公開日1995年5月3日 申請日期1993年11月2日 優(yōu)先權(quán)日1993年11月2日
發(fā)明者于佳臣, 劉麗娟, 魏愛英, 周愛華, 蘇德民 申請人:山東省立醫(yī)院