專利名稱:漢語字根系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明所述方法為通過計算機技術(shù)對漢字進行編碼排序;從而將漢字五千多年的發(fā)展、傳承、派生關(guān)系,漢字與漢字字根之間讀音關(guān)系直觀清楚的展現(xiàn)出來;同時將這種方法用于編撰漢語字典、漢語與其它外國語構(gòu)成的雙語字典;用于漢字字符顯示、打印輸出程序及中文OCR程序的研制的方法。其所處的技術(shù)領(lǐng)域為漢字的計算機編碼排序技術(shù)及漢語字典編撰科學技術(shù)領(lǐng)域。
背景技術(shù):
就漢字編碼而言主要用于字典的編撰及計算機中文輸入。漢字編碼最早大概出現(xiàn)在電報進入中國后的一百多年前,最典型的代表是漢字的四角編碼,即《四角號碼》。它主要用于電信及出版等非常狹窄的行業(yè)里,由于其自生的缺陷始終未能全面推廣。盡管如此,‘四角號碼字典’卻是漢字編碼技術(shù)用于漢語字典編撰的典型代表。
自從上個世紀80年代CCDOS面世以后,漢字編碼的作用主要是解決漢字的計算機輸入問題。其用于解決漢語字典的編撰的作用早已被人遺忘。其用于漢字字符顯示打印輸出的作用也是很邊緣的,大概在向量字庫的輸出中曾有應用,但是對漢字根據(jù)其本身的屬性進行全面編碼并將其用于漢字字符的顯示打印輸出上確未曾有過。相應的OCR程序的研制問題同樣未曾有過。
對字典的編撰,還得回顧漢字過去的歷史。
漢語自出現(xiàn)文字以來,以歷經(jīng)近五千年。在這數(shù)千年漫長的歲月里,漢字也由幾個簡單的像形文字發(fā)展衍變?yōu)楝F(xiàn)在的五萬多個形態(tài)各異,千姿百態(tài)的漢字。華夏子孫,在面對這祖宗留下的珍貴遺產(chǎn)時,無不望洋興嘆……。
從十九世紀末直至今天,當西方文明伴隨著先進的工業(yè)、發(fā)達的經(jīng)濟,一次次撞擊華夏文明時,我們顯得那么無奈、無助。其文字的簡練使我們瞠目,其先進的科技、強大的國力又自然地放大了其語言文字的先進性。再反觀自己的文字時,有時竟然會產(chǎn)生敬畏甚至恐懼的心理。似乎我們的文字是落后的?為了學習西方先進的經(jīng)驗,我們用漢語拼音排序;為了降低學習的難度,減少學習漢語的成本我們對漢字進行簡化。但漢字無休止的簡化無異于自我毀滅。加之在全球一體化的今天,就全球大中華文明的統(tǒng)一及國際間的交流而言,穩(wěn)定的漢字字符是必須的。
如今漢字的簡化已經(jīng)停止了,但漢字相對于西方文字存在的規(guī)律性差、檢索查找難、字形與讀音的相關(guān)性不穩(wěn)定、字與字之間的相關(guān)性差、難學難記等問題依然存在。
正如西方某漢學家所言就語言文字的學習而言,中國學生的腦力成本是西方學生的三倍。
隨著英語學習的不斷普及,講英語的人不斷增多,英語或外語相對于漢語在學習上的比較優(yōu)勢將更加突出。雖然計算機的普及以及互聯(lián)網(wǎng)的發(fā)展,同時也有利于漢語的普及,但漢語面臨的形勢依然是非常嚴峻的。
在這樣嚴峻的形勢下,要使?jié)h語純正地得以發(fā)展推廣;使?jié)h語成為國際上真正通用的語言文字;使華夏文明得以發(fā)揚光大;從根本上降低漢語的學習成本,使?jié)h語的學生在語言的學習上與英語、法語或其它西方語言的學生站在同一條起跑線上,必須從基礎上對漢語的學習方法進行改革。
具體地講,解決漢語字典排序不科學的問題是關(guān)健。漢語字典的編撰排序方式應該與國際接軌,即采用西方語言的排序方法。
表面看漢字拼音排序字典不正是解決這一問題的最好辦法嗎。
其實并非如此。漢字拼音排序字典只做到了形似,而非神似。因為,這種字典割裂了漢字與漢字之間的傳承關(guān)系。讀音相同的文字并非都具有相同的屬性或傳承派生關(guān)系;漢語是如此,英語同樣如此。
西方語言字典或辭典的編排方式不同于現(xiàn)行漢語字典的特征大至有以下幾點1沒有字的檢索表。
2以書寫的形式排序。
3單字與單字之間的關(guān)系比較清晰。
4單字的衍變、傳承關(guān)系比較明確。
5單字的構(gòu)成模式穩(wěn)定。基本為‘前綴+字根+后綴’這大概也是印歐語系字典的典型特征。也是現(xiàn)在國際上通行的標準。當然也是科學的標準。
除去第一特征外,這些特征可以科學地概括一個語言的發(fā)展衍變。
漢語雖是象形文字,但它同樣具有文字的基本特征。
漢語字典只有具有了所有這些特征,徹底或盡量擺脫結(jié)繩記事時代的筆畫計數(shù)檢索方式,才能稱之為達到了科學的標準。
漢語與國際接軌這一目標,可能是所有漢學家夢寐以求的心愿。一百多年過去了,漢語字典的排序基本上分為拼音、部首、筆畫三種。
現(xiàn)行漢字拼音排序字典象征性地消滅了檢字表,其拼音檢字表基本上是個擺設,但這僅限于‘按音尋字’。就‘以字尋字’而言,其完全喪失了檢字功能,它必須依賴原始的檢字方式;即部首筆畫檢字表。因此,以科學的標準評價,拼音排序字典第一特征不完整,幾乎不具有其它應有的所有特征。這也是漢語學習難的主要原因。
以傳統(tǒng)的部首筆畫排序的字典如《康熙》、《辭源》、《辭海》、《漢語大字典》等,完全離不開檢字表,不能‘按音尋字’。其部首排序只可以簡單地將具有相同屬性的漢字排在一起。對漢語學習而言,這種字典使用起來更難。以科學的標準評價,傳統(tǒng)的部首筆畫排序字典1、4特征沒有,3、5特征不明顯。
純筆畫排序的字典不多見。雖然這種字典具有完整的第一特征,但面對數(shù)百個相同筆畫的漢字,以及對每個漢字都需數(shù)筆畫而言,這種原始的結(jié)繩記事式的檢字方法,任何人都難以忍受。
實際上漢語字典的排序還有第四種方法,即以漢字的韻排序。具體的代表如《廣韻》、《集韻》。對于這些著作筆者也只是從《康熙》、《辭源》、《辭?!贰ⅰ稘h語大字典》等書中間接地有所了解。但以科學的觀點分析,可以感覺到其可能具有2、3、4、5四種特征。
對以上漢字排序方法進行簡單分析比較,說明中國歷史上至始至終并未出現(xiàn)過科學、先進的排序方法。
過去沒有計算機處理技術(shù),在計算機上不能比較完整的表示數(shù)量驚人的漢字字符應該是造成上述結(jié)果更客觀的原因,計算機上GBK字符集的出現(xiàn)畢竟只有四、五年的歷史。
發(fā)明內(nèi)容
本發(fā)明要解決的是現(xiàn)行漢語字典檢索難、學習難、排序不科學、漢字與漢字之間傳承派生關(guān)系不清楚以及漢字字符顯示打印輸出程序、OCR程序字模庫太大等的技術(shù)問題。
本發(fā)明是參照《漢語大字典》用計算機對漢字進行編碼處理分析論證完成的。
從1989年至今通過歷時十多年的研究探索,申請人認為漢字可以用以下定理予以定義漢字第一定理任何漢字由一個字根和一個部首兩部分組成。部首為零是真字,部首非零為復字。漢字既可以是字根,也可以是部首。
Z=G.B漢字第二定理任何漢字只要和部首構(gòu)成新的漢字,則該漢字是所構(gòu)新漢字的字根。新構(gòu)漢字是該字根的后繼。后繼非零的字根稱為真字根,后繼為零的字根稱為偽字根。真字根又叫做復字,偽字根又叫做真字。
字根在漢字中主要起定音作用,即所構(gòu)新漢字與該字根之間一般存在著韻或聲(主要為韻)的相似性。字根不能為零。字根又分祖字根和父字根;祖字根一般原于象形文字,父字根就是所構(gòu)漢字的真字根。
G=Z(簡而言之字根即除部首外的剩余部分)漢字第三定理在漢字中除字根外的剩余部分被稱為部首。部首在漢字中主要起字義的分類作用。漢字字義一般屬于其部首字義定義的范疇。部首可以為零。
B=Z|nul字根傳承定理(排序定理)任何人類語言文字均遵循先定音后定型的思維邏輯。漢語的傳承派生邏輯是以字根為主干,以部首為裝飾。漢字字根是主排序因子。部首是次排序因子。
注Z表示漢字,G表示字根,B表示部首。
根據(jù)字根傳承定理漢字字根為主排序因子;根據(jù)漢字第二定理字根具有定音作用;因此,本發(fā)明提供的方法是以中國人的陰陽思維邏輯、即二值思維邏輯、或者說漢人與生俱來的計算機思維邏輯,將任何漢字看作字根及部首兩部分。以字根為主排序因子,以部首為次排序因子對眾多的漢字進行編碼排序進而編撰漢語及漢語相關(guān)字典的方法。
由于漢語拼音在中國大陸已經(jīng)通行了半個世紀,字典的漢字拼音排序也是現(xiàn)今最成功的經(jīng)驗;因此,本發(fā)明的具體實施方案漢語字根系統(tǒng)之漢字字根拼音對照總表一、二均是以字根的拼音作為主排序因子對字根進行層層編碼完成的。
說明書中后面提供的漢字字根拼音對照總表一、二是申請人歷時近十年研究編撰完成的,其中涵蓋了GBK全部漢字。這里提供的只是其中的節(jié)選。
綜觀總表一,其傳承關(guān)系非常明確,漢字五千多年的衍變發(fā)展情況一目了然。就檢字而言,只要記住少數(shù)祖字根的讀音,順藤摸瓜便可以找到需要的漢字。方法簡單,腦力開銷少?;旧厦馊チ藬?shù)筆畫的繁重勞動。
如果以總表二編撰字典,由于只是根據(jù)漢字字根的讀音進行排序,其傳承關(guān)系可能不及總表一,但就檢字而言,大大擴展了拼音的檢字范圍。對于絕大多數(shù)人而言,某個漢字可能不認識,但它的字根是認識的。因此,以總表二的方法編制字典,檢字速度更快,更簡單。
將總表一與二兩相結(jié)合,以總表二對字典進行排序,以總表一對字根進行排序構(gòu)造字根目錄則將產(chǎn)生現(xiàn)今最科學的的漢語相關(guān)字典。
對比西方語言字典的排序,漢語字根系統(tǒng)絲毫不遜色。無論是總表一,還是總表二,字典所應有的標準特征,全部具有。由于漢語的思維邏輯是獨一無二的、典型的二值邏輯、計算機邏輯。因此,漢字按‘漢字四定理’用計算機排序后比西方語言字典更加簡潔明了、舒適自然,傳承派生關(guān)系更加清楚,構(gòu)字邏輯更加嚴謹,學習使用更加簡單。上下五千多年一覽無余,僅此一點沒有其它任何語言可以比擬。
雖然根據(jù)漢語字根定理,用拼音對字根進行編碼更科學;但用筆畫及筆形結(jié)構(gòu)根據(jù)漢語字根定律對字根進行編碼同樣會產(chǎn)生發(fā)明的有利效果。
漢語字根系統(tǒng)還帶來另一項技術(shù)進步。按照‘漢字四定理’構(gòu)造漢字字符顯示輸出模塊,速度會更快,存儲空間會更小。按照‘漢字定理’的逆邏輯構(gòu)造中文OCR,效果一定驚人。
綜上所述,漢語字根系統(tǒng)的建立標志著漢語在世界文化的歷史上將翻開嶄新的一頁;漢語的教學與學習的基本方法將完全趕上、并且超過任何西方語言;漢語將成為國際性語言已經(jīng)不再僅僅是愿望,將很快成為現(xiàn)實。
漢字字根拼音對照總表一(GBK祖字根拼音排序)記錄號 SGBK 漢字 部首聲 部首韻 祖字根聲 祖字根韻 父字根聲父字根韻字聲母 字韻母 字調(diào) 多1 34158 卬 Aang Aang Y ang32 38539 枊 M uAang Aang A ang43 45242 昂 R iAang Aang A ang24 38254 昻 R iAang Aang A ang25 36076 岇 Sh an Aang Aang A ang26 53750 仰 R en Aang Aang Y ang37 53974 抑 Sh ou Aang Aang Y i 48 54189 迎 Z ou Aang Aang Y ing29 45991 廠 An An Ch ang310 34177 厑 C iAn An A n 111 63560 鳫 N iao An An Y an 412 63589 鴈 N iao An An Y an 413 34171 厈 An An H an 414 45238 岸 An An A n 415 58690 錌 J in An An A n 416 35654 婩 N vAn An A n 417 35037 堓 T uAn An A n 418 45974 硸 Sh iAn An N ue 419 36063 屵 Sh an An An A n 420 34898 圧 T uAn An Y a 121 53731 雁 An Yan Y an 422 55501 贗 B ei An Yan Y an 423 55710 贋 B ei An Yan Y an 424 55881 贋 B ei An Yan Y an 425 56450 軅 Sh en An Yan Y an 426 45244 凹 Ao Ao A o 127 34945 垇 T uAo Ao A o 128 35415 奧 Ao Ao A o 429 45250 奧 Ao Ao A o 430 36435 嶴 Sh an Ao Ao A o 431 37885 擙 Sh ou Ao Ao A o 432 45252 澳 Sh ui Ao Ao A o 433 35237 墺 T uAo Ao A o 434 45251 懊 X in Ao Ao A o 435 53852 襖 Y iAo Ao A o 336 57566 噢 K ou Ao Ao Sh o 137 51872 薁 C ao Ao Ao Y v 238 60244 隩 F uAo Ao Y v 439 60635 燠 H uo Ao Ao Y v 440 59295 鐭 J in Ao Ao Y v 441 46235 礇 Sh iAo Ao Y v 442 45261 巴 Ba Ba B a 143 45260 疤 B in Ba Ba B a 144 45253 芭 C ao Ba Ba B a 1
漢字字根拼音對照總表一(GBK祖字根拼音排序)記錄號 SGBK 漢字 部首聲 部首韻 祖字根聲 祖字根韻 父字根聲 父字根韻 字聲母 字韻母 字調(diào)多45 36487 巼C iB a B a B a 146 52557 蚆Ch ong B a B a B a 147 35394 夿D aB a B a B a 148 45270 爸F uB a B a B a 449 45264 靶G eB a B a B a 350 36729 弝G ong B a B a B a 451 57946 鈀J in B a B a B a 252 61145 鈀J in B a B a B a 353 45257 吧K ou B a B a B a 154 45266 耙L ei B a B a B a 455 62670 粑M iB a B a B a 156 59595 杷M uB a B a B a 457 48275 紦S iB a B a B a 158 57777 岜Sh an B a B a B a 159 55390 豝Sh iB a B a B a 160 49514 羓Y ang B a B a B a 161 63364 鲃Y vB a B a B a 162 55957 跁Z uB a B a B a 463 45258 笆Zh uB a B a B a 164 47050 肥Y ue B a B a F ei 265 36078 岊Sh an B a B a J ie 266 45169 皅B ai B a B a P a 167 36493 帊J in B a B a P a 468 35442 妑N vB a B a P a 169 50627 琶Y vB a B a P a 270 50624 爬Zh ao B a B a P a 271 50549 舥Zh ou B a B a P a 172 56802 葩C ao B a P a P a 173 51627 色 B a S e S e 474 50041 脃Y ue B a S e C ui 475 48888 絕S iB a S e J ue 276 48478 絕S iB a S e J ue 277 61348 銫J in B a S e S e 478 58435 銫J in B a S e S e 479 38632 栬M uB a S e Z ui 480 51845 蕝C ao B a J ueJ ue 281 37854 撧Sh ou B a J ueJ ue 182 48510 絶 B a S e J ue 283 40335 潖Sh ui B a P a P a 284 53976 邑 B a Y i Y i 485 34410 唈K ou B a Y i Y i 486 33368 俋R en B a Y i Y i 487 57050 挹Sh ou B a Y i Y i 488 39877 浥Sh ui B a Y i Y i 4
漢字字根拼音對照總表一(GBK祖字根拼音排序)記錄號 SGBK 漢字 部首聲 部首韻 祖字根聲 祖字根韻 父字根聲 父字根韻 字聲母 字韻母 字調(diào) 多89 58280 悒X inB a Y iY i 490 53600 裛Y i B a Y iY i 491 59359 邕 B a Y iY ong192 64846 齆B i B a Y ong W eng493 34526 嗈K ouB a Y ong Y ong194 60276 雝 B a Y ong Y ong195 45154 癰B ing B a Y ong Y ong196 36706 廱G uang B a Y ong Y ong197 40604 灉Sh uiB a Y ong Y ong198 45265 把 B a B aB a 399 62433 筢Zh u B a B aP a 210051281 萉C aoB a F ei F ei 210152814 蜰Ch ong B a F ei F ei 210233390 俷R enB a F ei F ei 410358567 淝Sh uiB a F ei F ei 210452306 蘎C aoB a J iJ i 410533106 丷 B a B aB a 110645259 八 B a B aB a 110757754 釟J inB a B aB a 110845256 叭K ouB a B aB a 110938491 朳M u B a B aB a 111033172 仈R enB a B aB a 111145255 扒Sh ouB a B aB a 111243864 玐Y v B a B aB a 111339665 汃Sh uiB a B aB in 111450623 趴Z u B a B aP a 111545291 半 B a B an B an 411660551 靽G e B a B an B an 411746708 秚H e B a B an B an 411858203 鉡J inB a B an B an 411938574 柈M u B a B an B an 412035476 姅N v B a B an B an 412145289 伴R enB a B an B an 412245293 絆S i B a B an B an 412348463 絆S i B a B an B an 412445288 拌Sh ouB a B an B an 412534925 坢T u B a B an B an 412636933 怑X inB a B an B an 412756129 跘Z u B a B an B an 412833771 冸B ing B a B an P an 412950640 判D aoB a B an P an 413050641 叛F anB a B an P an 413145438 眫M u B a B an P an 413241118 牉P ian B a B an P an 4
漢字字根拼音對照總表一(GBK祖字根拼音排序)記錄號 SGBK 漢字 部首聲 部首韻 祖字根聲 祖字根韻 父字根聲 父字根韻 字聲母 字韻母 字調(diào) 多133 58362 泮Sh ui BaB an P an 4134 54378 詊Y an BaB an P an 4135 60999 頖Y eBaB an P an 4136 61896 袢Y iBaB an P an 4137 50646 胖Y ue BaB an P ang4138 53446 釁X ie BaB an X in 4139 63842 鵥N iao BaP an P an 4140 50639 畔T ian BaB an P an 4141 40163 溿Sh ui BaP an P an 4142 45292 辦 BaB aB an 4143 53421 協(xié)Sh iBaB an X ie 2144 53426 脅Y ue BaB an X ie 2145 52181 蘇C ao BaB an X u 1146 45271 白 Bai B ai B ai 2147 45272 柏M uBai B ai B ai 3148 50804 苩C ao Bai B ai B o 2149 45740 鉑J in Bai B ai B o 2150 58187 鉑J in Bai B ai B o 2151 41214 狛Q uan Bai B ai B o 2152 45742 伯R en Bai B ai B o 2153 50016 胉Y ue Bai B ai B o 2154 63368 鲌Y vBai B ai B o 2155 62798 鮊Y vBai B ai B o 2156 45744 舶Zh ou Bai B ai B o 2157 33977 劰L iBai B ai M o 4158 48465 絈S iBai B ai M o 4159 55419 貃Zh iBai B ai M o 4160 50625 帕J in Bai B ai P a 4161 50626 怕X in Bai B ai P a 4162 53394 袙Y iBai B ai P a 4163 50628 拍Sh ou Bai B ai P ai 1164 50887 魄G ui Bai B ai P o 4165 50889 粕M iBai B ai P o 4166 36166 岶Sh an Bai B ai P o 4167 45931 砶Sh iBai B ai P o 4168 38034 敀W en Bai B ai P o 4169 36711 廹Y in Bai B ai P o 4170 50888 迫Z ou Bai B ai P o 4171 45182 皛B ai Bai B ai X iao3172 45195 皨T uBai X iao X ing1173 33731 兠 Bai D ou D ou 1174 39256 橷M uBai D ou D ou 1175 46773 兜 Bai D ou D ou 1176 56826 蔸C ao Bai D ou D ou 1
漢字字根拼音對照總表一(GBK祖字根拼音排序)記錄號 SGBK 漢字 部首聲 部首韻 祖字根聲 祖字根韻 父字根聲 父字根韻 字聲母 字韻母 字調(diào) 多17762459 篼Zh u B aiD ouD ou 117845743 帛B aiB o B o 217940031 淿Sh ui B aiB o B o 218050567 艊Zh ou B aiB o B o 218158716 錦J in B aiB o J in 318248629 錦J in B aiB o J in 318350142 棉M u B aiB o M ian218435557 婂N v B aiB o M ian218550144 綿S i B aiB o M ian218648740 綿S i B aiB o M ian218748770 緜S i B aiB o M ian218850370 穆H e B aiM u M u 418939302 檰M u B aiM ian M ian219045708 矊M u B aiM ian M ian219135822 嬵N v B aiM ian M ian219245553 癟B in B aiB ieB ie 319340084 湐Sh ui B aiB aiB o 219445748 泊B aiB aiB o 219551296 萡C ao B aiB o B o 219645741 箔Zh u B aiB o B o 219750622 啪K ou B aiP aiP a 119845273 百B aiB aiB ai 319959370 珀B aiB aiP o 420047217 竡L i B aiB aiB ai 320148019 粨M i B aiB aiB ai 320238624 栢M u B aiB aiB ai 320345275 佰R en B aiB aiB ai 320448477 絔S i B aiB aiB ai 320545178 皕B ai B aiB aiB i 420658870 弼G ong B aiB aiB i 420753578 袹Y i B aiB aiB o 220834300 咟K ou B aiB aiH uo 420952616 蛨Ch ong B aiB aiM o 421050352 陌F u B aiB aiM o 421136500 帞J in B aiB aiM o 421258240 銆J in B aiB aiM o 421362966 貊Zh i B aiB aiM o 421439848 洦Sh ui B aiB aiP o 421545516 碧Sh i B aiP o B i 421635421 奭D a B aiB i Shi 421753870 襫Y i B aiS i Shi 421852190 宿B aiS u S u 421939106 樎M u B aiS u S u 422049011 縮S i B aiS u S u 4
漢字字根拼音對照總表一(GBK祖字根拼音排序)記錄號 SGBK 漢字 部首聲 部首韻 祖字根聲 祖字根韻 父字根聲 父字根韻 字聲母 字韻母 字調(diào) 多22156209 蹜Z u B aiS u S u 422252213 縮S i B aiS u S uo 122337785 摍Sh ou B aiS u S uo 122459222 鏥J in B aiS u X iu 422556995 蓿C ao B aiS u X v 522645277 拜B aiB ai B ai 422750632 湃Sh ui B aiB ai P ai 422837509 拝Sh ou B aiB ai B ai 422955784 勹B aoB ao B ao 123034036 勽R en B aoB ao B ao 423134037 匁Y i B aoB ao M ao 123234040 匄W ang B aoG ai G ai 423334034 勻B aoY un Y un 223454472 勻B aoY un Y un 223552563 蚐Ch ong B aoY un J un 123648891 鈞J in B aoY un J un 123757976 鈞J in B aoY un J un 123834253 呁K ou B aoY un J un 423939754 汮Sh ui B aoY un J un 124048889 均T u B aoY un J un 124153378 袀Y i B aoY un J un 124245405 盷M u B aoY un T ian224360096 昀R i B aoY un Y un 224437484 抣Sh ou B aoY un Y un 224544659 畇T ian B aoY un Y un 224654479 韻Y in B aoY un Y un 424762430 筠Zh u B aoJ un J un 124851036 荺C ao B aoJ un Y un 224958461 鋆J in B aoJ un Y un 225051671 勺B aoSh ao Sh ao 225162912 趵Z u B aoSh ao B ao 425245482 豹Zh i B aoSh ao B ao 425344435 瓝G ua B aoSh ao B o 225433181 仢R en B aoSh ao B o 225560539 靮G e B aoSh ao D i 225661782 馰M a B aoSh ao D i 225738209 旳R i B aoSh ao D i 425849994 肑Y ue B aoSh ao D i 225943866 玓Y v B aoSh ao D i 426046582 釣J in B aoSh ao D iao426157758 釣J in B aoSh ao D iao426237446 扚Sh ou B aoSh ao D iao326354158 訋Y an B aoSh ao D iao426462598 魡Y v B aoSh ao D iao4
漢字字根拼音對照總表一(GBK祖字根拼音排序)記錄號 SGBK 漢字 部首聲 部首韻 祖字根聲 祖字根韻 父字根聲 父字根韻 字聲母 字韻母 字調(diào) 多26552548 虳Ch ong B aoShaoJ ue 226636019 尦E r B aoShaoL iao 426757037 尥J iu B aoShaoL iao 426851670 芍C ao B aoShaoSh ao 226959580 杓M u B aoShaoSh ao 227058873 妁N v B aoShaoSh uo 427146442 礿Sh i B aoShaoY ue 427255238 灼H uo B aoShaoZh uo 227340783 烵H uo B aoShaoZh uo 227441190 犳Q uan B aoShaoZh uo 227536784 彴R en B aoShaoZh uo 227639669 汋Sh ui B aoShaoZh uo 227734902 圴T u B aoShaoZh uo 227855235 酌Y ou B aoShaoZh uo 227951077 菂C ao B aoD i D i 428034476 啲K ou B aoD i D i 128146532 的B aoShaoD e 528244954 瘹B ing B aoD iao D iao 428348243 約S i B aoShaoY ao 128451353 葯C ao B aoY ueY ao 428534513 喲K ou B aoY ueY o 128647510 箹Zh u B aoY ueY ue 128754460 約S i B aoShaoY ao 128853929 藥C ao B aoY ueY ao 428954196 喲K ou B aoY ueY o 129048868 句B aoJ v J v 429164873 齣Ch i B aoJ v Ch u 129244889 痀B ing B aoJ v G ou 129352589 蚼Ch ong B aoJ v G ou 329447547 夠D uo B aoJ v G ou 429535314 夠D uo B aoJ v G ou 429658206 鉤J in B aoJ v G ou 129749748 耇L ao B aoJ v G ou 329849750L ao B aoJ v G ou 329949749 耈L ao B aoJ v G ou 330059611 枸M u B aoJ v G ou 130147543 狗Q uan B aoJ v G ou 330255550 佝R en B aoJ v G ou 130357784 岣Sh an B aoJ v G ou 330434936 坸T u B aoJ v G ou 430554367 訽Y an B aoJ v G ou 430653405 袧Y i B aoJ v G ou 1
漢字字根拼音對照總表二(GBK父字根拼音排序)記錄號 SGBK 漢字 部首聲 部首韻 祖字根聲 祖字根酶 父字根聲父字根韻 字聲母 宇韻母 字調(diào) 多音標識1 61369 錒J in K e A a A a 12 58696 錒J in K e A a A a 13 45217 啊K ou K e A a A a 14 44922 痾B ing K e A a E e 1t5 35555 娿N v K e A a E e 16 59065 婀N v K e A a E e 17 5886l 屙Sh i K e A a E e 18 34158 卬 A ang A ang Y ang3t9 38539 枊M u A ang A ang A ang41045242 昂R i A ang A ang A ang21138254 昻R i A ang A ang A ang21236076 岇Sh an A ang A ang A ang21353750 仰R en A ang A ang Y ang3t1453074 抑Sh ou A ang A ang Y i 41554189 迎Z ou A ang A ang Y ing21637083 愛 Zh ong A i A i 41745194 皧B ai Zh ong A i A i 41852034 薆C ao Zh ong A i A i 41959472 鑀J in Zh ong A i A i 42034694 曖K ou Zh ong A i A i 12145693 曖M u Zh ong A i A i 42235804 嬡N v Zh ong A i A i 42333654 僾R en Zh ong A i A i 42438369 曖R i Zh ong A i A i 42537296 懓X in Zh ong A i A i 42660513 靉Y un Zh ong A i A i 42744385 璦Y v Zh ong A i A i 42863343 鱫Y v Zh ong A i A i 42941046 燰H uo Zh ong A i W ei 13047188 窽X ue Sh i A i K uan3t3165096 C ao H e A i A i 33245228 艾 Y i A i A i 4t3358439 銰J in Y i A i A i 4344522l 哎K ou Y i A i A i 13563631 鴱N iao Y i A i A i 43660865 砹Sh i Y i A i A i 43761337 Sh i Y i A i H ai 43845230 愛 Y ouA i A i 43957544 噯K ou Y ouA i A i 14059080 嬡N v Y ouA i A i 44160115 曖R i Y ouA i A i 44234213 叆Y un Y ouA i A i 4t4359560 璦Y v Y ouA i A i 44461389 锿J in Y i A i A i 1
漢字字根拼音對照總表二(GBK父字根拼音排序)記錄號 SGBK 漢字 部首聲 部首韻 祖字根聲 祖字根韻 父字根聲 父字根韻 字聲母 字韻母 字調(diào) 多音標識45 58968 鎄J in Y i AiAi146 33475 偯R en Y i AiYi347 63847 鵪N iaoD ian AnAn148 51598 蓭C ao D ian AnAn149 45991 廠 A n AnChang 3 t50 34177 厑C i A n AnAn151 63560 鳫N iaoA n AnYan 452 63589 鴈N iaoA n AnYan 453 34171 厈 A n AnHan 4 t54 45238 岸 A n AnAn455 58690 錌J in A n AnAn456 35654 婩N v A n AnAn4 t57 35037 堓T u A n AnAn458 45974 硸Sh i A n AnNue 459 36063 屵Sh an A n AnAn460 45234 安 N v AnAn161 51017 荌C ao N v AnAn462 60564 鞌G e N v AnAn163 45232 鞍G e N v AnAn164 61351 銨J in N v AnAn365 58432 銨J in N v AnAn366 34376 咹K ou N v AnAn4 t67 59633 桉M u N v AnAn168 45240 案M u N v AnAn469 45233 氨Q i N v AnAn170 33267 侒R en N v AnAn171 36190 峖Sh an N v AnAn172 45236 按Sh ou N v AnAn473 39841 洝Sh ui N v AnAn4 t74 34973 垵T u N v AnAn375 45239 胺Y ue N v AnAn4 t76 62819 鮟Y v N v AnAn177 61007 頞Y e N v AnEe278 63633 鴳N iaoN v AnYan 4 t79 35504 姲N v N v AnYan 480 60108 晏 N v AnYan 481 34898 圧T u A n AnYa182 45245 敖 F ang AoAo283 51796 蔜C ao F ang AoAo284 34192 厫Ch angF ang AoAo285 62204 螯Ch ongF ang AoAo286 61946 聱E r F ang AoAo287 60234 隞F u F ang AoAo288 58074 廒G uang F ang AoAo2
漢字字根拼音對照總表二(GBK父字根拼音排序)記錄號 SGBK 漢字 部首聲 部首韻 祖字根聲 祖字根韻 父字根聲 父字根韻 字聲母 字韻母 字調(diào) 多音標識89 45246 熬H uo F ang AoA o190 63179 鏊J in F ang AoA o491 34549 嗸K ou F ang AoA o292 57531 嗷K ou F ang AoA o293 59121 驁M a F ang AoA o494 62088 驁M a F ang AoA o495 64641 鼇M in F ang AoA o296 64113 鷔N iao F ang AoA o297 35758 嫯N v F ang AoA o498 59873 獒Q uan F ang AoA o299 43655 獓Q uan F ang AoA o210045249 傲R en F ang AoA o410136325 嶅Sh an F ang AoA o210246200 磝Sh i F ang AoA o2 t10337811 擎Sh ou F ang AoA o2 t10440261 滶Sh ui F ang AoA o210537202 慠X in F ang AoA o4 t10654930 警Y an F ang AoA o210754931 謸Y an F ang AoA o210844360 璈Y v F ang AoA o210963393 鰲Y v F ang AoA o211063127 鰲Y v F ang AoA o211158843 遨Z ou F ang AoA o211255224 贅B ei F ang AoZh ui 411355704 贅B ei F ang AoZh ui 411445244 凹 A o AoA o1 t11534945 垇T u A o AoA o111635415 奧 A o AoA o4 t11745250 奧 A o AoA o4 t11836435 嶴Sh an A o AoA o411937885 擙Sh ou A o AoA o412045252 澳Sh ui A o AoA o412135237 墺T u A o AoA o412245251 懊X in A o AoA o412353852 襖Y i A o AoA o312457566 噢K ou A o AoSh o112551872 薁C ao A o AoY v212660244 隩F u A o AoY v4 t12760635 燠H uo A o AoY v412859295 鐭J in A o AoY v412946235 礇Sh i A o AoY v413045269 罷 Q v BaB a4 t13145274 擺Sh ou Q v BaB ai 313245894 矲Sh i N eng BaB a4
漢字字根拼音對照總表二(GBK父字根拼音排序)記錄號 SGBK 漢字 部首聲 部首韻 祖字根聲 祖字根韻 父字根聲 父字根韻 字聲母 字韻母 字調(diào) 多音標識13337979 擺Sh ou N eng Ba B ai313453871 襬Y i N eng Ba B ai313541179 犤N iu N eng Ba P ai213645268 霸 G e Ba B a 4 t13739409 欛M u G e Ba B a 413858801 灞Sh ui G e Ba B a 413935278 壩T u G e Ba B a 414053894 覇X i G e Ba B a 414145261 巴 B a Ba B a 114245260 疤B in B a Ba B a 114345253 芭C ao B a Ba B a 114436487 巼C i B a Ba B a 114552557 蚆Ch ong B a Ba B a 114635394 夿D a B a Ba B a 114745270 爸F u B a Ba B a 414845264 靶G e B a Ba B a 314936729 弝G ong B a Ba B a 415057946 鈀J in B a Ba B a 215161145 鈀J in B a Ba B a 3 t15245257 吧K ou B a Ba B a 115345266 耙L ei B a Ba B a 4 t15462670 粑M i B a Ba B a 115559595 杷M u B a Ba B a 4 t15648275 紦S i B a Ba B a 115757777 岜Sh an B a Ba B a 115855390 豝Sh i B a Ba B a 115949514 羓Y ang B a Ba B a 116063364 鲃Y v B a Ba B a 116155957 跁Z u B a Ba B a 4 t16245258 笆Zh u B a Ba B a 116347050 肥Y ue B a Ba F ei216436078 岊Sh an B a Ba J ie216545169 皅B ai B a Ba P a 1 t16636493 帊J in B a Ba P a 416735442 妑N v B a Ba P a 116850627 琶Y v B a Ba P a 216950624 爬Zh ao B a Ba P a 217050549 舥Zh ou B a Ba P a 117145265 把 B a Ba B a 317262433 筢Zh u B a Ba P a 217341187 犮 Y ouBa B a 2 t17456536 茇C ao Y ouBa B a 2 t17556658 軷Ch e Y ouBa B a 217661268 颰F eng Y ouBa B a 2 t
漢字字根拼音對照總表二(GBK父字根拼音排序)記錄號 SGBK 漢字 部首聲 部首韻 祖字根聲 祖字根韻 父字根聲 父字根韻 字聲母 字韻母 字調(diào) 多音標識177 63433 魃 G ui Y otB a B a 2178 40671 炦Huo Y ouB a B a 2179 38594 柭Mu Y ouB a B a 1t180 35458 妭Nv Y ouB a B a 2181 45262 拔Sh ou Y ouB a B a 2182 64662 鼥Sh u Y ouB a B a 2183 34938 坺Tu Y ouB a B a 2184 54393 詙Yan Y ouB a B a 2t185 50015 胈Yue Y ouB a B a 2186 63185 鲅Yv Y ouB a B a 4187 62789 鮁Yv Y ouB a B a 4188 45263 跋Zu Y ouB a B a 2189 52594 蛂Ch ong Y ouB a B ie 2190 46714 秡He Y ouB a B o 2191 61152 鈸Jin Y ouB a B o 2192 58003 鈸Jin Y ouB a B o 2193 45379 盋Min Y ouB a B o 1194 61763 馛XiangY ouB a B o 2195 53395 祓Yi Y ouB a B o 1t196 62348 髪Biao Y ouB a F a 4197 45656 瞂Dun Y ouB a F a 2198 39791 沷Sh ui Y ouB a F a 1199 33772 冹Bing Y ouB a F u 2200 36499 帗Jin Y ouB a F u 2201 59302 紱Si Y ouB a F u 2202 48283 紱Si Y ouB a F u 2203 60656 祓Sh i Y ouB a F u 2204 60802 韨Wei Y ouB a F u 2205 60776Wei Y ouB a F u 2206 49549 翇Yv Y ouB a F u 2207 60906 黻Zh i Y ouB a F u 2208 56771 菝Cao Y ouB a B a 2209 47010 發(fā) Y ouB a F a 1t210 45162 癹Sh u B o B a B a 2211 33106 丷 B a B a B a 1212 45259 八 B a B a B a 1213 57754 釟Jin B a B a B a 1214 45256 叭Kou B a B a B a 1t215 38491 朳Mu B a B a B a 1216 33172 仈Ren B a B a B a 1217 45255 扒Sh ou B a B a B a 1t218 43864 玐Yv B a B a B a 1219 39665 汃Sh ui B a B a B in 1t220 50623 趴Zu B a B a P a 1
漢字字根拼音對照總表二(GBK父字根拼音排序)記錄號 SGBK 漢字 部首聲 部首韻 祖字根聲 祖字根韻 父字根聲 父字根韻 字聲母 字韻母 字調(diào) 多音標識22145292 辦 Ba Ba B an 422252066 薭C ao JiaBai B ai 422347718 篺Zh u JiaBai P i 222445271 白 BaiBai B ai 222545272 柏M u BaiBai B ai 3 t22650804 苩C ao BaiBai B o 2 t22745740 鉑J in BaiBai B o 222858187 鉑J in BaiBai B o 222941214 狛Q uan BaiBai B o 223045742 伯R en BaiBai B o 2 t23150016 胉Y ue BaiBai B o 223263368 鲌Y v BaiBai B o 2 t23362798 鮊Y v BaiBai B o 2 t23445744 舶Zh ou BaiBai B o 223533977 劰L i BaiBai M o 4 t23648465 絈S i BaiBai M o 423755419 貃Zh i BaiBai M o 423850625 帕J in BaiBai P a 423950626 怕X in BaiBai P a 424053394 袙Y i BaiBai P a 424150628 拍Sh ou BaiBai P ai 124250887 魄G ui BaiBai P o 424350889 粕M i BaiBai P o 424436166 岶Sh an BaiBai P o 424545931 砶Sh i BaiBai P o 424638034 敀W en BaiBai P o 424736711 廹Y in BaiBai P o 4 t24850888 迫Z ou BaiBai P o 4 t24945182 皛B ai BaiBai X iao325040084 湐Sh ui BaiBai B o 225145748 泊 BaiBai B o 2 t25245273 百 BaiBai B ai 325359370 珀 BaiBai P o 425447217 竡L i BaiBai B ai 325548019 粨M i BaiBai B ai 325638624 栢M u BaiBai B ai 325745275 佰R en BaiBai B ai 325848477 絔S i BaiBai B ai 3 t25945178 皕B ai BaiBai B i 426058870 弼G ong BaiBai B i 426153578 袹Y i BaiBai B o 2 t26234300 咟K ou BaiBai H uo 426352616 蛨Ch ong BaiBai M o 權(quán)利要求
1.一種漢字的排序編碼排序方法,其特征是a將任何漢字分作字根及部首兩部分;b以字根為第一排序因子,以部首為次排序因子;
2.根據(jù)權(quán)利要求1所述方法,其特征是a對漢字的字根及部首分別進行編碼;b根據(jù)編碼對漢字進行排序。
3.根據(jù)權(quán)利要求1、2所述方法,其特征是a對漢字的字根用拼音及字形結(jié)構(gòu)進行復式編碼,對漢字的部首用拼音進行編碼;或者b對漢字的字根用筆畫及字形結(jié)構(gòu)進行復式編碼,對漢字的部首用筆畫進行編碼。
4.根據(jù)權(quán)利要求3所述方法,其特征是對漢字中字根的字根進行遞歸式編碼。
5.根據(jù)權(quán)利要求1至4中所述的部分或全部方法,其特征是用于編撰漢語及漢語與其它外國語構(gòu)成的雙語字典。
6.根據(jù)權(quán)力要求1至4中任一權(quán)利要求所述的方法,其特征是用于漢字字符輸出程序的研制。
7.根據(jù)權(quán)力要求1至4中任一權(quán)利要求所述的方法,其特征是用該方法的逆邏輯研制漢字的OCR程序。
全文摘要
本發(fā)明所述的漢字編碼排序技術(shù)方法主要用于漢語及漢語相關(guān)字典的編撰技術(shù)領(lǐng)域。本發(fā)明要解決的是現(xiàn)行漢語字典存在的規(guī)律性差、檢索查找難、字形與讀音的相關(guān)性不穩(wěn)定、字與字之間的相關(guān)性差、難學難記等技術(shù)問題。具體地講,即解決漢語字典排序不科學的問題。本發(fā)明是以中國人的陰陽思維邏輯、即二值思維邏輯、或者說漢人與生俱來的計算機思維邏輯,將任何漢字看作字根及部首兩部分;以字根為主排序因子,以部首為次排序因子對眾多的漢字進行編碼排序進而編撰漢語及漢語相關(guān)字典及相應I/O軟件的方法。
文檔編號G06F3/023GK1356621SQ0113552
公開日2002年7月3日 申請日期2001年10月9日 優(yōu)先權(quán)日2001年10月9日
發(fā)明者彭宇軸 申請人:彭宇軸