專利名稱:漢字屬性分類碼輸入法的制作方法
本中發(fā)明屬于計算機應用領域,涉及一種適用于各種漢字信息處理技術軟件、硬件系統(tǒng)中(包括電腦系統(tǒng)、漢字電傳機、漢字電腦打印機、漢字終端機和通訊系統(tǒng))提供快捷的編碼和輸入方法的漢字屬性分類碼輸入法。
多年來,人們養(yǎng)成一套用音、形、意、性各種屬性來標識漢字的習慣。
例如,詢問“尊姓大名”?最符合習慣的回答是“吳美一,口天吳,美麗的美,一二三的一”。此處,“口天吳”是字形、字音標識,“美麗的美”是詞意標識,“一二三的一”是詞性(數(shù))標識,規(guī)則簡單、明了、直接、富有成效。
目前,漢字編碼大體分為形碼、音碼和音形碼三種類型。音碼雖易學,但同音字多,重碼率高;形碼大多有各異的復雜的編碼規(guī)則,未經專門訓練很難推廣應用;音形碼又需要掌握讀音與字形兩種因素,操作不便。
例如,《拼音輸入法》(包括全拼、簡拼、雙拼碼)分辨率低,重碼字多,如“bi”音漢字有60個、“fu”音漢字有80多個、“ji”音漢字有110多個,需要逐屏選擇,影響輸入速度?!段骞P字形輸入法》拆字取碼方法不符合常人的漢字識別規(guī)則,130種字根的編碼方案過于復雜,難學難用?!蹲匀淮a》以音為主的輸入方法,但另配一套雙音編碼的方案,對原用拼音的用戶甚為不便,對構成漢字的二、三百個部件用象音、象形、變體方法編碼,規(guī)則復雜,缺少統(tǒng)一記憶方法?!镀胀ùa》“音”和“形”結合的的方法,對部首既有見“形”取碼,也有按“音”取碼,有的代碼需特別強記,缺乏統(tǒng)一規(guī)則。
僅以“吳”姓為例,《音碼》要從60多個“wu”音字中選擇;《五筆字形輸入法》的回答是“口一大吳”;《自然碼》、《普通碼》的回答是“口大吳”;這些顯然不符合人們識別漢字的思維方法和習慣。
因而以上備現(xiàn)有方法,或重碼多、或規(guī)則復雜,不符合人們對漢字的思維和識別習慣,都不甚理想。
本發(fā)明的目的是改進現(xiàn)有技術的上述缺陷,設計一種重碼少、規(guī)則簡單易學無需特別強記、符合漢字常規(guī)標識思維和習慣的,改進的漢字快捷編碼和輸入方法,即漢字屬性分類碼輸入法。
本發(fā)明的構思是通過如下技術方案實施的提供一種漢字屬性分類碼輸入法,其特征是根據(jù)漢字的音、形、意、性進行分類標識的鍵盤編碼系統(tǒng),主要由(1)以“音”標“形”的部首音碼代碼系統(tǒng),(2)以“意”、“性”的屬性分類代碼標識系統(tǒng),(3)漢字、詞組的編碼方法和(4)改進的標準鍵盤構成。
1.上述的漢字屬性分類碼輸入法,其特征是所述的以“音”標“形”的部首音碼代碼系統(tǒng),是指對漢字取兩個標識單位。
(1)本發(fā)明所述的“標識單位”,既有字典部首也有非字典部首。
①字典部首包括成字部首如“口、馬、木、月、八、弓、蟲…”等,和非成字部首如“丨、丿、刂、亻、讠、廴、艸、彡、犭、彳…”等;②非字典部首如嗷——第一標識單位“口(部首)”,第二標識單位“敖”(字)。
(2)字的部首,取大不取小,凡能分成兩個單位的,不分成更多單位,如藹——取“艸、謁”,不分“艸、讠、曷”,吳——取“口、天”,不分“口、一、大”,蓓——取“艸、倍”,不分“艸、亻、立、口”。
(3)對于不能以兩個部首表示的字,則以首、末兩部首為第一、第二標識單位,如倍——第一標識單位是“亻”(首部首),第二標識單位是“口”(末部首),凹——第一標識單位是“丨”(首部首),第二標識單位是“一”(末部首),岸——第一標識單位是“山”(首部首),第二標識單位是“干”(末部首)。
(4)根據(jù)字型規(guī)則,對漢字以其構成部分的上下、左右、外內為序分別取部首,如幫——第一標識單位是“邦”,第二標識單位是“巾”(上下型),杯——第一標識單位是“木”,第二標識單位是“不”(左右型),閉——第一標識單位是“門”,第二標識單位是“才”(外內型)。
(5)對字或部首標記時用部首音碼或第一音碼標記。
①音碼指漢字或部首的讀音編碼,含聲母和韻母(如張zhang,聲母zh+韻母ang),不含聲母的只取韻母(如阿a),不含韻母的只取聲母(如嗯n)。
②第一音碼指漢字(部首)整個音碼的首位碼(如王wang的首位碼w)。
(6)標記時分別用全拼法、簡拼法和雙拼法標注,以適應使用拼音碼中全拼、簡拼或雙拼的不同習慣。如部首巛(讀“川”)——全拼音碼chuan,第一音碼c;
簡拼音碼iuj,第一音碼i;雙拼音碼uuf,第一音碼u。
2.本發(fā)明創(chuàng)建了部首代碼系統(tǒng)和屬性代碼系統(tǒng)(1)部首代碼系統(tǒng)(簡稱部首音碼),取部首讀聲的第一音碼為代碼,采用以“音”表“形”的統(tǒng)一編碼規(guī)則,簡單好記,無須背誦王碼的字根口訣表、自然碼的部件代碼表、普通碼的字根鍵位表,打破了各種形碼不規(guī)則編碼的束縛,較好地解決了難學難用問題。
①部首代碼中成字部首取其第一音碼為代碼,如口——代碼取“k”,馬——代碼取“m”;②非成字部首取其習慣讀音的第一音碼為代碼,如亻——代碼取“r”(人旁),忄——代碼取“x”(心旁);宀——代碼取“b”(寶頭)。
本發(fā)明創(chuàng)建的部首代碼鍵盤分布見附表2~4;本發(fā)明創(chuàng)建的分類代碼鍵盤分布見附表5。
(2)以“意”、“性”的屬性分類代碼識別系統(tǒng)(分類碼),漢字、詞組具備詞意和詞性,用詞意和詞性的屬性分類碼識別漢字和詞組,簡單明了,直接達意,也是減少重碼的有效方法。
(3)根據(jù)漢字或詞組的“詞意”和“詞性”分別納入根據(jù)①學科分類,如政治,經濟,文化,歷史,地理,天文,氣象,物理,化學,生物,農業(yè),醫(yī)藥,科技,工業(yè),交通,軍事等;②語法分類,如代詞,數(shù)詞,量詞,副詞,介詞,連詞,象聲詞,表色詞,表形態(tài),表情,感詞等;③實用分類,如姓氏,機構,稱謂,食用,衣著等識別劃分的屬性分類代碼識別系統(tǒng)。
(4)分類時取分類名稱的讀音作為代碼,標記時分別用全拼法、簡拼法和雙拼法標注。如生物——sw或s(全拼代碼);uw或u(簡拼代碼);iw或i(雙拼代碼)。
3.上述的漢字屬性分類碼輸入法,其特征是所述的漢字、詞組的編碼方法是(1)單個漢字取其第一標識單位、第二標識單位的部首音碼+該漢字的音碼構成的部首音碼法;(2)或取該字的音碼+該字的兩位屬性代碼構成的分類碼法。
(3)對不知讀音的生僻字取生僻字專用代碼鍵+該字的第一標識單位、第二標識單位的部首音碼,
(4)對部首字取部首字專用代碼鍵+該字的音碼或部首字專用代碼鍵+該部首的筆畫代碼,(5)雙字詞組用分別取兩個漢字的第一標識單位、第二標識單位的部首音碼相加構成的部首音碼法;或對可按屬性分類的詞組,取兩字的第一音碼+詞組的兩位屬性分類代碼構成的分類碼法。
(6)三字詞組用分別取三個漢字的第一標識單位的部首音碼+詞組一位屬性分類代碼;或對可按屬性分類的詞組,取三字的第一音碼+詞組的一位屬性分類代碼。
(7)四字及四字以上詞組用分別取前三個漢字和末字的第一標識單位的部首音碼相加構成的部首音碼法;或用分別取前三個漢字和末字的第一音碼相加構成的音碼法,都不加分類代碼。
4.上述的漢字屬性分類碼輸入法,其特征是所述的改進的標準鍵盤是指根據(jù)前述規(guī)則,分別制備正面標記有部首讀音代碼,漢語拼音的聲母、韻母和標準鍵盤原位置的英語字母的標簽,粘貼在原英語字母鍵處,成為漢字屬性分類碼輸入法的鍵盤。鍵盤上特別設置了生僻字專用代碼鍵和部首字專用代碼鍵,方便地解決了生僻字和部首字的輸入問題。
本發(fā)明的應用效果令人滿意,達到了預期的發(fā)明目的。
1.觀測指標(1)分辨率 指編碼系統(tǒng)對兩級字庫中漢字的分辨能力。
計算公式分辨率=編碼分類數(shù)/漢字數(shù)×100(2)重碼率 指重碼字數(shù)與總字數(shù)的比例。
(3)單碼率 指無重碼字數(shù)與漢字總字數(shù)的比例。
計算公式單碼率=(100-重碼率)×1002.觀測結果
以下結合實例和附表對本發(fā)明作進一步闡述例一有的漢字用部首音碼標識舉例單個漢字取其第一標識單位、第二標識單位的部首音碼+該漢字的音碼構成的部首音碼法,如安、按、案、氨、胺、鞍、桉、銨諸重碼同音字,因取得的不同部音碼而得到完全分辨,如
安——b(宀)+n(女)+an bnan(全拼),bnj(簡拼),bnf(雙拼);按——t(扌)+a(安)+an taan(全拼),tjj(簡拼),tff(雙拼);案——a(安)+m(木)+an aman(全拼),jmj(簡拼),fmf(雙拼);氨——q(氣)+a(安)+an qaan(全拼),qjj(簡拼),qff(雙拼);胺——y(月)+a(安)+an yaan(全拼),yjj(簡拼),yff(雙拼);鞍——g(革)+a(安)+an gaan(全拼),gjj(簡拼),gff(雙拼);桉——m(木)+a(安)+an maan(全拼),mjj(簡拼),mff(雙拼);銨——j(钅)+a(安)+an jaan(全拼),jjj(簡拼),jff(雙拼)。
例二有的漢字用屬性分類碼標識舉例單個漢字取該字的音碼+該字的兩位屬性代碼構成的分類碼法,如馮——全拼fengxs 取馮的全拼音碼“feng”+分類碼“xs”(姓氏);簡拼fgxu取馮的簡拼音碼“fg” +分類碼“xu”(姓氏);雙拼ftxi取馮的雙拼音碼“ft” +分類碼“xi”(姓氏)。
滬——全拼hudl取滬的全拼音碼“hu” +分類碼“dl”(地理);簡拼hudl取滬的簡拼音碼“hu” +分類碼“dl”(地理);雙拼hudl取滬的雙拼音碼“hu” +分類碼“dl”(地理)。
苯——全拼benhx 取苯的全拼音碼“ben” +分類碼“hx”(化學);簡拼bfhx取苯的簡拼音碼“bf” +分類碼“hx”(化學);雙拼brhx取苯的雙拼音碼“br” +分類碼“hx”(化學)。
不再考慮字形拆分取碼,對于方便輸入,加快速度,減少重碼,收到良好效果。
例三生僻字標識舉例生僻字讀音較難掌握,本發(fā)明特設生僻字專用代碼鍵“v”。標識時,取生僻字專用代碼鍵+該字的第一標識單位、第二標識單位的部首音碼,如鞔(音man)——vgm取生僻字專用代碼鍵“v”+該字的第一標識單位的部首音碼“g(革)”+該字的第二標識單位的部首音碼“m(免)”;黠(音xia)——vhj取生僻字專用代碼鍵“v”+該字的第一標識單位的部首音碼“h(黑)”+該字的第二標識單位的部首音碼“j(吉)”。
例四部首字標識舉例有的部首字除用區(qū)位碼外,很難有其他方法輸入,本發(fā)明另辟蹊徑,特設部首字專用代碼鍵“o”。標識時,取部首字專用代碼鍵+該字的音碼或部首字專用代碼鍵+該部首的筆畫代碼,如丿(音撇)——opie取部首字專用代碼鍵“o”+部首字的音碼“pie(撇的音碼pie)”;或丿(音撇)——oa取部首字專用代碼鍵“o”+該部首的筆畫代碼“a(一畫的代碼)”,此時提示行顯示“一、丨、丿、乙”供選擇。
附表1 筆畫代碼鍵舉例
……。
例五雙音詞組用部首音碼標識舉例雙音詞組分別取兩個漢字的拆分單位作第一標識單位、第二標識單位,它們的部首音碼相加,使在拼音法編碼同為“zhishi”的重碼詞組“只是、指使、支使、致使、知事、指示、知識”,按本發(fā)明的部首音碼標識,得到完全分辨,如只是——kbrp兩字的拆分單位k(口)+b(八)+r(日)+p(丿);指使——tzrl兩字的拆分單位t(扌)+z(旨)+r(亻)+l(吏);支使——syrl兩字的拆分單位s(十)+y(又)+r(亻)+l(吏);致使——zwrl兩字的拆分單位z(至)+w(文)+r(亻)+l(吏);知事——ukhs兩字的拆分單位s(矢)+k(口)+h(一)+s(丨);指示——tzex兩字的拆分單位t(扌)+z(旨)+e(二)+x(小);知識——skyz兩字的拆分單位s(矢)+k(口)+y(讠)+z(只)。
例六雙音詞組用屬性分類碼標識舉例雙音詞組取兩字的第一音碼+詞組的兩位屬性代碼構成的分類碼法,如上?!猻hdl上海兩字的第一音碼“sh”+分類碼“dl”(地理);一個——yglc一個兩字的第一音碼“yg”+分類碼“l(fā)c”(量詞);愛情——aqqg愛情兩字的第一音碼“aq”+分類碼“qg”(情感詞)。
例七三字詞組舉例三字詞組分別取三個漢字的第一標識單位的部首音碼+一位分類代碼,如計算機——yzmk三字的部首碼y(讠)+z(竹)+m(木)+一位分類碼“k(科技)”;或分別取三個漢字的第一音碼+一位分類代碼,如計算機——jsjk計算機三字的聲碼“jsj”+一位分類碼“k(科技)”;共產黨——gcdz共產黨三字的聲碼“gcd”+一位分類碼“z(政治)”。
例八四字及四字以上詞組舉例四字及四字以上詞組,分別取四個漢字的第一標識單位的部首音碼,如中華民族——khzf四字的部首碼k(口)+h(化)+z(乙——讀折zhe)+f(方);中央委員會——kphr前三字和末字的部首碼k(口)+p(丿)+h(禾)+r(人);或取前三個和末位漢字的第一音碼,如中華民族——zhmz“中華民族”四字的聲母;中央委員會——zywh前三字“中央委”和末字“會”的聲母。
例九改進的標準鍵盤,在原鍵位增加部首鍵名,鍵位仍按原標準鍵盤次序排列。
附表2~4分別按全拼、簡拼、雙拼提供了三種部首代碼鍵盤舉例。
附表5提供了分類代碼鍵盤舉例。
B 卜八勹宀比貝疒白
鼻 O [部首字專用代碼鍵]C 寸艸采隹廠彳屮巛車臣蟲赤辰 P 丿攴片爿疋皮D 丶刂刀大斗歹豆 Q 犭犬氣欠青其E 二卩阝廾耳兒R 人亻日F 方父風缶S 厶氵彡纟四
丨十士山饣尸水手殳礻示石矢舌豕G 亠冖廣工弓戈瓜艮谷革骨鬼 身食鼠H 一灬火戶禾黑T 冂扌土田夂J 幾巾己見斤钅臼戔角金V [生擗字專用代碼鍵]K 匚凵口 W 囗文王韋瓦攵L 冫力立龍來老囟里鹿X 小夕彐心忄肀穴西血辛M 門馬木毛母目皿矛米麥黽麻皿毛麥木目母Y 讠又尢弋幺礻示日月衤業(yè)用衣羊頁羽言酉西魚音N 女牛鳥 Z 廴辶子自走足乙爪竹舟豸齒止附表2
全拼法部首代碼鍵盤分布
A(zh) Z爪竹舟豸齒止 O [部首字專用代碼健]B 卜八勹宀比貝疒白
鼻P 丿攴片爿疋皮C 寸艸采隹 Q 犭犬氣欠青其D 丶刂刀大斗歹豆R 人亻日E 二卩 阝廾耳兒 S 厶氵彡纟四
F 方父風缶 T 冂扌土田夂G 亠冖廣工弓戈瓜艮谷革骨鬼 U(sh) 丨十士山饣尸水手殳礻示石矢舌豕身食鼠H 一灬火戶禾黑 V [生擗字專用代碼鍵]I(ch) 廠彳屮巛車臣蟲赤辰W 囗文王韋瓦攵J 幾巾己見斤钅臼戔角金 X 小夕彐心忄肀穴西血辛K 匚 凵口 Y 讠又尢弋幺礻示日月衤業(yè)用衣羊頁羽言酉L 冫力立龍來老囟里鹿西魚音M 門馬木毛母目皿矛米麥黽麻皿毛麥木目母 Z 廴辶子自走足N 女牛鳥附表3簡拼法部首代碼鍵盤分布
A(zh) Z爪竹舟豸齒止 O [部首字專用代碼鍵]B 卜八勹宀比貝疒白
鼻 P 丿攴片爿疋皮C 寸艸采隹Q 犭犬氣欠青其D 丶刂刀大斗歹豆 R 人亻日E 二卩 阝廾耳兒 S 厶氵彡纟四
F 方父風缶T 冂扌土田夂G 亠冖廣工弓戈瓜艮谷革骨鬼U(ch) 廠彳屮巛車臣蟲赤辰H 一灬火戶禾黑V [生擗字專用代碼健]I(sb) 丨十士山饣尸水手殳礻示石矢舌豕身食鼠W 囗文王韋瓦攵J 幾巾己見斤钅臼戔角金X 小夕彐心忄肀穴西血辛K 匚凵口 Y 讠又尢弋幺礻示日月衤業(yè)用衣羊頁L 冫力立龍來老囟里鹿 羽言酉西魚音M 門馬術毛母目皿矛米麥黽麻皿毛麥木目母Z 廴辶子自走足N 女牛鳥附表4雙拼法部首代碼鍵盤分布
A 政治類、[表]狀態(tài)詞、助詞、指示代詞、[表]重復詞 M (草)木類、[表]命令詞B 部門機構類 N 農業(yè)類、鳥類C 財經類、[表]存在變化詞 P [表]判斷詞D 地理類、[表]動作詞、大(寫數(shù))字 Q 氣象類、[表]趨向詞、[表]情感、心理活動詞F 房建類、[表]方位詞、[表]范圍詞、[表]否定詞 R 人名類、人稱代詞G 工礦類 S [表]色詞H 化學類、花類、[表}環(huán)境詞 T 天文類、體育運動類、嘆詞、特殊代詞I 蟲類、稱謂類、[表]程度詞 U 數(shù)學類、(飲)食類、數(shù)(序)詞、[表]時間詞J 軍事類、計算機類、交通運輸類、介詞 W 文教類、物理類K 科學技術類、[表]可能、意愿詞、[表]肯定詞 X 姓氏類、虛詞、[表]行為動作詞、[表]性質詞L 歷史類、量詞、連詞 Y 醫(yī)藥類、魚類、衣著類、疑問代詞附表5
分類代碼鍵盤分布
權利要求
1.一種漢字屬性分類碼輸入法,其特征是根據(jù)漢字的音、形、意、性進行分類標識的鍵盤代碼系統(tǒng),主要由(1)以“音”標“形”的部首音碼代碼系統(tǒng),(2)以“意”、“性”的屬性分類代碼標識系統(tǒng),(3)漢字、詞組的編碼方法,和(4)改進的標準鍵盤構成。
2.按照權利要求1所述的漢字屬性分類碼輸入法,其特征是所述的以“音”標“形”的部首音碼代碼系統(tǒng),是指對漢字取兩個標識單位,以其部首音碼或第一音碼為標記,字的部首,取大不取小,凡能分成兩個單位的,不分成更多單位,對于不能以兩個部首表示的字,則以首、末兩部首為第一、第二標識單位,用部首音碼或第一音碼標記,標記時分別用全拼法、簡拼法和雙拼法標注。
3.按照權利要求1所述的漢字屬性分類碼輸入法,其特征是所述的以“意”、“性”的屬性分類代碼識別系統(tǒng),是指根據(jù)漢字或詞組的“詞意”和“詞性”分別納入根據(jù)學科分類、語法分類和實用分類劃分的屬性分類代碼識別系統(tǒng),分類時取分類名稱的音碼作為代碼,標記時分別用全拼法、簡拼法和雙拼法標注。
4.按照權利要求1所述的漢字屬性分類碼輸入法,其特征是所述的漢字、詞組的編碼方法是指對GB-23l2(80)中全部漢字和常用詞組的編碼方法,其中單個漢字取其第一標識單位、第二標識單位的部首音碼+該漢字的音碼構成的部首音碼法,或取該字的音碼+該字的屬性代碼構成的分類碼法,生僻字取生僻字專用代碼鍵+該字的第一標識單位、第二標識單位的部首音碼,部首字取部首字專用代碼鍵+該字的音碼或部首字專用代碼鍵+該部首的筆畫代碼,雙字詞組用分別取兩個漢字的第一標識單位、第二標識單位的部首音碼相加構成的部首音碼法,或對可按屬性分類的詞組,取兩字的第一音碼+詞組的兩位屬性分類代碼構成的分類碼法,三字詞組用分別取三個漢字的第一標識單位的部首音碼+詞組一位屬性分類代碼,或對可按屬性分類的詞組,取三字的第一音碼+詞組的一位屬性分類代碼構成的分類碼法,四字及四字以上詞組用分別取前三個漢字和末字的第一標識單位的部首音碼相加構成的部首音碼法,或用分別取前三個漢字和末字的第一音碼相加構成的音碼法,都不加分類代碼。
5.按照權利要求1所述的漢字屬性分類碼輸入法,其特征是所述的改進的標準鍵盤是指根據(jù)前述規(guī)則,分別制備正面標記有部首讀音代碼,漢語拼音的聲母、韻母和標準鍵盤原位置的英語字母的標簽,粘貼在原英語字母鍵處,成為漢字屬性分類碼輸入法的鍵盤。
全文摘要
一種漢字屬性分類碼輸入法,根據(jù)漢字的音、形、意、性進行分類標識的鍵盤代碼系統(tǒng),系由以“音”標“形”的部首音碼代碼系統(tǒng),以“意”、“性”的屬性分類代碼識別系統(tǒng),漢字、詞組的編碼方法和改進的標準鍵盤構成。尤其在鍵盤中設立生僻字專用代碼鍵和部首專用代碼鍵,方便地解決了生僻字和部首字的輸入。適用于各類中文信息處理系統(tǒng)。提供的快捷編碼和輸入方法,重碼少、規(guī)則簡易無需特別強記、符合漢字常規(guī)標識思維和習慣。
文檔編號G06F3/023GK1229206SQ9811010
公開日1999年9月22日 申請日期1998年3月15日 優(yōu)先權日1998年3月15日
發(fā)明者潘承榮 申請人:潘承榮