亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

二十四部首漢字排序編碼法及其鍵盤的制作方法

文檔序號:6606020閱讀:851來源:國知局
專利名稱:二十四部首漢字排序編碼法及其鍵盤的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種用于計算機漢字輸入的編碼及其鍵盤,也可以用于漢字排序和漢字字典檢索。
目前國內(nèi)外公布的漢字輸入編碼法已逾千種,總的情況是輸入速度快的不好學,容易學的輸入速度慢,專業(yè)型方案與普及型方案難以統(tǒng)一。同時,漢字編碼也沒有和漢字排序、字典檢索查字很好地結(jié)合起來。至今還沒有一種公認的易學、快速、規(guī)范、適合在各類人員中普及推廣的較理想的漢字編碼方案。
“五筆字型”是以字形編碼,優(yōu)點是重碼少,輸入速度較快,對專職打字員是一個較實用的方案;缺點是難學難記,編碼字根多,優(yōu)選的125種字根實際有190多個,大多數(shù)非成字字根有形狀而無統(tǒng)一的名稱和讀音,有的字根和漢字拆分不規(guī)范;一般需經(jīng)專門訓(xùn)練并經(jīng)常使用,方能熟練掌握,在廣大非專職打字員和中小學生中難以普及。自然碼以音為主,以形為輔,輸入時以詞為主導(dǎo),字詞混合編碼,高頻先見,選擇同音詞時利用軟件智能處理,在輸入詞語時有一定優(yōu)勢;缺點是輸入單字時需熟練掌握雙拼代碼及168個部首,記憶量仍偏大,同時用戶需熟練掌握漢字拼音和讀音標準,雖有南方音輸入方式,但不能從根本上解決問題,難以在方言地區(qū)及中老年用戶中普及。國內(nèi)應(yīng)用比較廣泛、影響較大的其它漢字編碼法雖各有特色,但都有改進而無突破,也都還存在著類似的一些不盡人意之處,如字詞重碼、字詞混編、用戶自定義詞組不方便、不適應(yīng)大字庫漢字編碼和繁體字編碼等等,也沒有做到把漢字排序與查字有機地結(jié)合起來,影響了進一步普及推廣,而眾多初學者和廣大中小學生面臨一個“選碼難”的問題。
本發(fā)明的目的在于提供一種具有理論支持、系統(tǒng)規(guī)范、簡明易學、高效好用、字詞分流、適合面廣的計算機漢字輸入編碼法及其鍵盤,用戶在其同一編碼體系中不用切換,即可兼容形音碼、全形碼等碼式和繁體字編碼,適合配置大字庫及大詞庫,可預(yù)留用戶詞庫專用編碼空間,并與一種新式快速查字法高度統(tǒng)一,其編碼本身具有相對獨立性。本發(fā)明適合各種不同知識背景、各種不同輸入方式(如看打、聽打、想打)及方言地區(qū)的專職與非專職的用戶,尤其適合中小學生學習使用。
本發(fā)明的技術(shù)方案如下本發(fā)明包括形音四碼、形音五碼和全形碼,形音四碼編碼模式是本發(fā)明的首選方式和基礎(chǔ)模式,該模式包括了形音碼簡體單字、形音碼繁體單字、全形碼簡體或繁體單字、形音碼詞組輸入等內(nèi)容。形音四碼漢字編碼根據(jù)漢字字形進行編碼,將漢字筆畫分為橫、豎、撇、點、折五類并以數(shù)碼1~5對應(yīng)編碼;采用特選的二十四個漢字常用部首并分布在鍵盤鍵位上作為編碼,再將一些常用漢字字根歸類于這些特選部首之中,歸類字根與對應(yīng)的特選部首取同一編碼;漢字編碼以筆畫和特選部首為筆形編碼單元,加上漢字拼音碼,所組成的形音四碼編碼包括(第一筆形碼)+(字型碼)+(第二筆形碼)+(首音碼)(1)、將漢字分為獨體字和合體字,獨體字的第一筆形碼取該字的首筆畫加次筆畫編碼,第二筆形碼取該字的末筆畫編碼;(2)、合體字拆分為前偏、后旁二個部分,前偏取字的左、上、外部分,后旁取字的右、下、內(nèi)部分;當前偏為特選部首或歸類字根時,第一筆形碼取該特選部首或歸類字根之編碼,否則第一筆形碼取該前偏的首、次筆畫;當后旁為特選部首或歸類字根時,第二筆形碼取該特選部首或歸類字根之編碼,否則第二筆形碼取后旁的首、次筆畫編碼;對上下結(jié)構(gòu)漢字,則第二筆形碼取該字最下面第一個字根的首、次筆畫編碼,該字根為特選部首或歸類字根則取相應(yīng)編碼;取筆形碼時,若漢字筆畫不足則以自定義的零碼補足;本發(fā)明將特選部首和歸類字根統(tǒng)稱為模塊;(3)、首音碼取漢字拼音的第一個字母;(4)、將漢字結(jié)構(gòu)分為獨體型、左右型、外內(nèi)型、上下型并定義相應(yīng)的編碼,作為漢字的字型碼。
本發(fā)明將漢字字形分為整字、前偏后旁、字根、筆畫四個層次,筆形碼根據(jù)這四個層次進行拆分取碼。
本發(fā)明為避免傳統(tǒng)字形碼的編碼字根過多的缺陷,提出漢字形式化部首的概念,將漢字部首大幅度精簡到24個,部首位置一律固定在合體字的左、上位置。本發(fā)明的特選部首包括王、艸、石、酉、車(車)、蟲、忄、口、貝(貝)、日、禾、亻、、钅(金)、月、讠(言)、火、氵、衤、土、木、女、扌、纟(糹)歸類字根包括古、莫、丁、立、產(chǎn)、、山、辶、門、田、口、目、日、氣、術(shù)、分、主、麻、鹿、士本發(fā)明將漢字左半部為特選部首或漢字上半部為“艸、”且不帶其它附加成分的漢字稱為部首字,否則為非部首字;除部首為“艸、”的字外,其它部首字都為左右結(jié)構(gòu)字。如″桂、呼″是部首字,″杰、郢″為非部首字。
本發(fā)明漢字編碼所組成的全形碼包括(第一筆形碼)+(字型碼)+(第二筆形碼)+(第三筆形碼)其中的第三筆形碼的取碼規(guī)則如下(1)、獨體字的第三筆形碼取該字的第三、四筆畫編碼,對不足三畫的獨體字取零碼補齊;如十F8ZZ,三G8GZ,開G8HR,重T8GM,白R8GN,由M8GF,大D8YZ(2)、合體字的第三筆形碼取后旁第二個字根為特選部首或歸類字根時則取相應(yīng)編碼,否則取該后旁第二字根的首、次筆畫編碼;(3)、若合體字的后旁只有一個字根、前偏由兩個或兩個以上字根組成,前偏第二個字根為特選部首或歸類字根時則第三筆形碼取其相應(yīng)編碼,否則第三筆形碼取該前偏第二字根的首、次筆畫編碼;(4)、若按上述取碼規(guī)則仍無第三筆形碼,則用零碼補齊。
全形碼主要是針對追求高速盲打以“看打”為主要工作方式的專職打字員,其特點是不論字詞,其常規(guī)編碼不用音碼,使打字員避免大腦在字形和字音之間來回的“軟切換”;從文字序列視覺輸入的方塊漢字平面圖形直接指揮空間腦(大腦右半球)動作,把與該動作對應(yīng)的手指運動系列當作輸出響應(yīng),而無需把此作業(yè)介入語言腦(大腦左半球)中。全形碼對“看打”方式,由于思維單一,降低了腦思維活動,強化了手本能動作,大腦負擔輕,容易訓(xùn)練成反射式擊鍵,速度較快。而由于全形碼與形音碼之間的轉(zhuǎn)換無需用戶按鍵切換,用戶可隨心所欲進行編碼輸入。
本發(fā)明漢字編碼所組成的形音五碼編碼包括(第一筆形碼)+(字型碼)+(第二筆形碼)+(首音碼)+(韻母碼)其中的首音碼和韻母碼組成完整的拼音碼,在鍵盤上均設(shè)有對應(yīng)的鍵碼作為編碼。形音五碼向下兼容全形碼、形音四碼各種碼式,包括簡碼、定碼、特碼等,不足五碼者以空格鍵結(jié)束。形音五碼是為了更適合“想打”方式,為大字庫(如收字6萬左右的古今全漢字集)、大詞庫(如十萬以上的詞庫)拓展編碼空間,也為了使?jié)h字編碼準文字化能達到或接近實用水平。形音五碼重碼少,編碼空間可達1000萬以上,可裝大字庫和特大詞庫(十萬條以上),特別適合從事古籍整理及應(yīng)用古文較多的用戶。
為給漢字更好地合理排序,減少重碼,本發(fā)明將部首字分出單列,在獨體型、左右型、上下型、外內(nèi)型四種基本字型中,將其中的左右型漢字又進一步細分為三種,一種是前偏為特選部首而后旁為上下型結(jié)構(gòu),簡稱為部上型字;一種是前偏為特選部首而后旁為非上下型結(jié)構(gòu),簡稱為部非型字;其它的左右結(jié)構(gòu)漢字歸為一種,簡稱為次左型字;則字型分為四類共六種,字型碼包括六個碼元;為避免編碼方式的切換,在用于形音碼簡體字編碼、形音碼繁體字編碼、全形碼時分別采用鍵盤上不同的六個鍵碼,具體對應(yīng)關(guān)系如下部上型 部非型 次左型 上下型 外內(nèi)型 獨體型形音碼簡體字字型碼 U IO L V A形音碼繁體字字型碼 1 23 4 5 6全形碼漢字字型碼 , ./ ; 〔 8全形碼漢字字型碼符號 f1 f2 f3 f4 f5 f6六種字型的字例鉛桂鐵湖很部船 古杏夯 國區(qū)為 天井重本發(fā)明的字型碼元在鍵盤上用三組不同的鍵符(字母、數(shù)字、符號)表示,使編碼具有更大的靈活性。形音四碼、形音五碼的字型碼采用U、I、O、L、V、A六字母,就與代表首音字母的19個鍵碼劃清了界限,互不混淆,使字詞分流成為可能。而字型碼采用數(shù)碼1~6,即成為形音碼繁體字輸入方式,用戶可非常方便地按簡體或繁體字形輸入,而輸出的都是繁體字。例如″黨″字既可按簡體編碼L4ED輸入,又可按繁體″
″輸入,輸出皆為″
″。從而做到簡繁兼容,簡繁分流,簡繁混排,更為靈活方便有效。全形碼的字型碼則充分利用鍵盤上的符號鍵,以f1~f6表示符號。形音四碼簡體或繁體字編碼、全形碼均為四碼,第二碼的字型碼分別采用三組不同的鍵符,使各碼式明顯區(qū)別開來,因此這三種碼式可互相混用,無需切換,不會相互重碼,使?jié)h字輸入具有極大的靈活性。對專職錄入員,為進一步減少重碼,使高速盲打更加得心應(yīng)手,本發(fā)明采用獨創(chuàng)的無切換雙碼式共容互補技術(shù),對所剩不多的重碼字一法處理,即按形音碼編碼方式產(chǎn)生的一級漢字重碼單獨列出,改用全形碼編碼方式輸入(反之亦然),則專職錄入員不用增加太多的記憶量,可輕松地實現(xiàn)一級漢字零重碼,單字動態(tài)重碼率降至萬分之一左右。
按上述單字編碼法,都有一定數(shù)量的重碼,若出現(xiàn)兩字重碼(三字重碼的極少,亦可按下述方法處理,無四字以上重碼),按字的使用頻率,最常用的字分別選作一、二、三級簡碼字,較不常用的按正常編碼,并排在選擇行首位,可不用選擇數(shù)字鍵直接上屏;有簡碼的高頻字亦可按正常編碼輸入,但排在選擇行第二或第三位,需用數(shù)字鍵選擇,這樣既能減少重碼,又減輕了初學者的記憶負擔,用多了自然就能記住哪些字要用簡碼輸入,其動態(tài)重碼率可降至1%以下。
本發(fā)明上述的特選部首、歸類字根、五類筆畫、筆形碼的數(shù)字筆畫碼、首音碼、韻母碼在鍵盤上的分布如下鍵碼 特選部首 歸類字根 筆畫 筆形數(shù)碼 首音字母韻母Q 33 qiuW 钅(金) 分34 wia,uaE 月35 ze,eiR 亻32 r,a,e,o uan,üanT 禾 氣 丿(撇) 31 tue,üeY 讠(言) 主麻 丶(點) 41 yuaiU (空碼)42I 火 鹿43 iO 氵44 uo,oP 衤45 pun,ünA 車(車)15 aS 酉 丁 14 song,iongD 石13 duang,iangF 艸 古莫 12 fen,engG 王一(橫) 11 guH 蟲 立產(chǎn) 丨(豎) 21 hangJ 忄 山辶 22 janK 口 門 23 kaoL 貝(貝) 田口 24 aiZ (零碼)00X 纟(糹)55 xieC 扌54 ciaoV 女53 uiB 木 術(shù) 52 bouN 土 士 乙(折) 51 n,l in,ingM 日 曰目 25 mian
其中的空碼U除在單字編碼第二碼表示字型碼外,處于其它位置時為空碼。
本發(fā)明考慮到廣大方言地區(qū)的人普通話讀音不準,不僅對聲母Z、C、S與ZH、CH、SH未加區(qū)分,對聲母L與N也作了合并處理,統(tǒng)一于聲母N,又將零聲母字的首音A、E、O統(tǒng)統(tǒng)歸于聲母R(因為以R為聲母的漢字較少),聲母Z與ZH的首音Z改用字母E,鍵位Z作為零碼。這樣處理后,首音碼被壓縮到19個,使?jié)h字集按首音碼分布的頻率大體上平均;而將騰出來的六個字母U、I、O、L、V、A分別對應(yīng)數(shù)碼1~6,作為字型碼代表六種不同的字型,字母Z作為零碼。正是由于19個首音碼與6個字型碼之間的巧妙分工,共容互補,為字詞分流、簡繁兼容、雙碼式共容(即在同一編碼模式中,無需切換和加轉(zhuǎn)換鍵,可任意用形音碼或全形碼輸入同一個漢字而不致引起與其它編碼混淆和重碼)和一級漢字零重碼創(chuàng)造了條件,也是本發(fā)明的特色。
在本發(fā)明中,筆畫碼可采用一位或兩位數(shù)碼,而特選部首、歸類字根、首音字母、韻母等都與二位的筆形數(shù)碼有著對應(yīng)關(guān)系,因此本發(fā)明的三種漢字編碼都可采用純數(shù)字編碼。如全形碼將各筆形碼及字型碼取其數(shù)碼作編碼,構(gòu)成七位數(shù)的全形數(shù)字碼。這種純數(shù)字編碼適用于各種帶有數(shù)字鍵的計算機設(shè)備,如計算器、電話、快譯通、手機等體積小、只有數(shù)字鍵的設(shè)備??衫迷~碼、簡碼等,使數(shù)字碼更為簡潔實用。
本發(fā)明漢字編碼設(shè)置了三級簡碼,其中(1)、一級簡碼共48個,其中24個最高頻字取其首音碼加空格鍵,另外24個次高頻字取首音碼加右單引號’鍵碼;(2)、二級簡碼編碼取漢字的第一筆形碼加首音碼,再加空格鍵結(jié)束;以二級簡碼輸入漢字二字詞時,采用前定碼和后定碼前定碼為(首字第一筆形碼)+(首字首音碼)+(末字首音碼)后定碼為(首字首音碼)+(零碼Z)+(末字第一筆形碼)+(末字首音碼)二級簡碼字不但考慮了字的使用頻度,更兼顧了字的構(gòu)詞能力,多是構(gòu)詞能力很強的常用字,具有以字定詞的功能,進而做到見碼知字詞。前定碼和后定碼可以一字確定二字詞的前一字或后一字,這不但增加了二級簡碼字的實用性和趣味性,又豐富了二字詞的構(gòu)詞編碼方式,使編碼方式更加靈活,為大詞庫二字詞無重碼創(chuàng)造了條件;只要記住了為數(shù)不多的一、二級簡碼字,通過以字定詞滾雪球式的方式,使?jié)h字編碼向準文字化方向前進了一大步。
(3)、三級簡碼編碼包括(第一筆形碼)+(字型碼)+(第二筆形碼)+(空格鍵)。
三級簡碼字主要作為一級漢字中的多音字、重碼字和少數(shù)容易讀錯音的字的編碼,雖與二字詞前定碼同為三碼,但第二碼分別是首音碼、字型碼,不會混淆。
本發(fā)明根據(jù)全形碼還可擴展出另一種漢字編碼,稱為全形半音碼,它包括(漢字全形碼)+(后旁首音碼)其中的后旁首音碼為漢字后旁之成字字根的漢語拼音首音碼;若后旁不成字,取后旁中第一個成字字根的拼音首音碼;若后旁中無成字字根,則后旁首音碼取零碼Z補齊。后旁首音碼稱為半音碼。對于收字20902個漢字的國際標準漢字集和有六萬多字的全漢字集等大字庫集,全形半音碼能使重碼大大減少,又使拆字選碼大為簡化,更有利于大字集非常用字的盲打輸入。例如酩S1EKM,舫Q3YVF,螅H1RPX,胗E1WQZ形音五碼和全形半音碼單字輸入向下兼容四碼方式全形碼、形音碼及簡碼,不足五碼者以空格鍵結(jié)束??捎萌N不同碼式自由混合使用,不用切換,互不重碼;無切換雙碼式共容互補更發(fā)展到無切換三碼式共容互補。
本發(fā)明對應(yīng)各種類型編碼設(shè)有詞組輸入法,分別以形音四碼、全形碼、形音五碼為基礎(chǔ)形成三種漢字詞組輸入法(1)、形音四碼的詞組輸入規(guī)則為1A、二字詞編碼為(首字第一筆形碼)+(首字首音碼)+(末字首音碼)+(末字第一筆形碼)該碼式將兩字首音碼放在中間連在一起,有利于編碼時減少思維在音與形之間來回反復(fù)的“軟切換”,可提高輸入速度,減輕大腦負擔,更有利于“想打”方式。例如漢字OHEO,編碼XBMD,筆記QBJY,程度TCDY,印刷EYSN。
二字詞簡碼編碼為(首字首音碼)+(末字首音碼)+(右單引號’鍵碼)二字詞特碼編碼為(首字首音碼)+(末字首音碼)+(空碼U)+(末字第一筆形碼)由于二字詞特碼的第三碼為空碼,不會與其它任何字詞編碼相混,特碼的作用是使二字詞編碼方式多元化,消除二字詞重碼,使詞組輸入更加簡便快捷。二字詞編碼由于有常規(guī)編碼、簡碼、特碼、前定碼、后定碼等多種碼式,互不混淆,字詞也無重碼,從而可使超過三萬以上的二字詞詞庫重碼率為零,使字詞總重碼率接近零,使高速盲打速度達到最大。
1B、三字詞編碼為(第一字首音碼)+(第二字首音碼)+(第三字首筆畫碼)+(第三字首音碼)其中的筆畫碼分別以鍵盤上的“,. / ;〔 ”五鍵代表五類基本筆畫“橫、豎、撇、點、折”的筆畫碼,對應(yīng)符號為f1~f5,但在編碼書寫形式中,仍用數(shù)字1~5表示;例如共產(chǎn)黨GC2D,解放軍JF4J,研究生YJ3S,有機酸YJ1S。
1C、四字詞編碼按順序分別取四字首音碼加數(shù)碼8,數(shù)碼8為四字詞詞型識別碼;四字詞定碼編碼則按順序分別取四字的首音碼加右單引號’鍵碼;四字詞編碼的平均碼長只有五,由于四字詞專用編碼空間達12萬以上,不但可容納所有常用四字詞和成語,還可將常用的兩個連續(xù)的二字詞改用四字詞編碼方式表示,大大提高輸入速度。例如一見如故YJRG8,中國地理EGDN8,銀行帳號YHEH8,努力工作NNGE8。四字詞定碼方式既可分化四字詞可能產(chǎn)生的重碼,又可使編碼本身具有一定的可識別性(結(jié)合上下文及首音提示,一般都可以確認或猜出)。
1D、多字詞編碼按順序分別取第一、二、三、末字的首音碼加數(shù)碼9,數(shù)碼9為多字詞詞型識別碼;如國家標準局GJBJ9,中華人民共和國EHRG9。
(2)、全形碼的詞組輸入規(guī)則為2A、二字詞編碼為(首字第一筆形碼、第二筆形碼)+(末字第一筆形碼、第二筆形碼)該編碼方式可同時兼容形音碼的二字詞簡碼、定碼與特碼,用戶可自由混合使用,互不重碼。
2B、三字詞編碼為(第一字、第二字、第三字的第一筆形碼)+(第三字第二筆形碼)2C、四字詞編碼為按順序取各字的第一筆形碼;2D、多字詞編碼按順序分別取第一、二、三、末字的第一筆形碼;上述全形碼可分別兼容形音碼三字詞、四字詞、多字詞輸入方式,可自由混合使用,無需切換,互不重碼。
(3)、形音五碼的詞組輸入規(guī)則為3A、二字詞編碼為(首字第一筆形碼)+(首字首音碼、韻母碼)+(末字首音碼、韻母碼)二字詞簡碼編碼為(首字首音碼)+(末字首音碼)+(右單引號’)二字詞前定碼編碼為(首字第一筆形碼、首音碼)+(空碼U)+(末字首音碼、韻母碼)見碼既能確定首字,又可知末字讀音;例如人口WRUKB二字詞后定碼編碼為(首字首音碼)+(零碼Z)+(首字韻母碼)+(末字第一筆形碼、首音碼)此碼式首字可知讀音,末字可以確定;例如青春QZNGC3B、三字詞編碼為(第一字首音碼)+(第二字首音碼)+(第三字首音碼、韻母碼)+(空碼U)3C、四字詞編碼為按順序取各字的首音碼加數(shù)碼8;3D、多字詞編碼為取第一、二、三、末字的首音碼加數(shù)碼9。
本發(fā)明的詞組編碼實現(xiàn)了字詞分流,字詞無重碼,詞與詞之間接近零重碼。
為消除用戶自定義詞與詞庫中詞的重碼,使個人詞庫的拓展不受限制,本發(fā)明利用獨有的零碼和空碼,為用戶自定義詞組設(shè)置專用編碼,為個人詞庫預(yù)留了足夠的專用編碼空間,使自造詞不會與字庫、詞庫中原有的字詞重碼。其編碼方式為(1)、二字詞編碼為(空碼U)+(首字首音碼)+(末字首音碼)+(末字第一筆形碼)(2)、三字詞編碼為(零碼Z)+(第一、二、三字的首音碼)(3)、四字詞和多字詞的編碼為(零碼Z)+(第一、三、末字的首音碼)。
由于第一碼采用零碼或空碼,既與字庫詞庫中原有的字詞劃清了界限,互不重碼,又可作為個人詞庫的提示碼。
本發(fā)明將漢字排序與字典查字有機地結(jié)合起來,定義5位數(shù)字和1個字母組成漢字檢索簡碼,取碼直觀快捷,易學好用,查字一步到位,直接翻頁。編碼規(guī)則為(1)、獨體字先取首筆畫與次筆畫之數(shù)字碼共二位數(shù)字,若只有一個筆畫的字,則取該筆畫的二位數(shù)字碼。如″乙″字為51。次取獨體字字型數(shù)字碼6,再取末筆畫二位數(shù)字碼,共計五位數(shù)字。若字的筆畫數(shù)不超過兩筆,末筆畫為零碼,用數(shù)字00補齊五位數(shù)字。最后加上該字首音碼字母,即為獨體字檢索簡碼。例如一11600Y,乙51600Y,二11600R,干11621G,重31611E,秉31641B,吏14641N在檢索簡碼中,除24個特選部首和20個歸類字根以外的所有獨體字、不成字獨體結(jié)構(gòu)(字根)都只取首、次、末三個筆畫編碼,不再拆為其它字根。這種拆分原則簡明方便,筆順完全符合漢字書寫規(guī)范,徹底避免了漢字拆分的不確定性。
(2)、合體字部首字先取部首的二位數(shù)字代碼,非部首字先取前偏的首筆畫與次筆畫的數(shù)字碼(前偏首字根為歸類字根時則取該字根的二位數(shù)碼);其次是取該字字型數(shù)字碼,再取后旁的首筆畫與次筆畫的數(shù)字碼(后旁取碼位置為歸類字根時職該字根的二位數(shù)碼,上下型漢字后旁按最下面一個字根取碼),共計5位數(shù)字,最后再加上該字首音碼,即為該合體字的檢索簡碼。例如鋁34123N,鐵34231T,湘44252X,桂52151G,苦12123K,筆33231B,筑33214E部首之檢索簡碼首碼取該部首之二位數(shù)字碼,加100A,即為該部首之檢索簡碼,如王11100A,女53100A。
歸類字根之檢索簡碼首碼取所在鍵位之二位數(shù)字碼,再加110,若歸類字根成字,其末碼為該字之首音碼,若歸類字根不成字,其末碼為字母V。如立21110N,21110V,辶22100V特選部首與歸類字根形音碼編碼亦按上述原則處理,將其檢索簡碼前五位數(shù)字改為相應(yīng)的三個字母即可。如″王″的檢索簡碼為11100A,形音碼為GUZA;″辶″的檢索簡碼為22100V,形音碼為JUZV。
按檢索簡碼查字,簡明易學,快速好用,部首及取碼位置固定,不用思量,不數(shù)筆畫,一步到位,直接翻頁,比查英文字典還快還好用。獨體字只需按首、次、末三筆查字,無難檢字,不認識的字按字形五位數(shù)字直接翻頁查字,在同數(shù)碼字中查找,即使不加首音碼,檢索簡碼同數(shù)碼字也很少,一般不超過十個,都排在一起,極容易找到所要查的字,同部首的字也排在一起,使檢索非常方便,其查字速度比傳統(tǒng)部首法快五到十倍,比四角號碼法簡明易學,無難字,重碼少。更為重要的是,該查字法與計算機漢字輸入法高度統(tǒng)一,略加變通,即成為形音碼,可見字知碼,在鍵盤上按碼輸入漢字;漢字以數(shù)字為主排序,比按英文字母排序更符合中國國情和中國人的心理習慣,更富有中國特色。
以七位的全形數(shù)字碼組成檢索全碼,用于漢字排序檢索及字典查字(同碼者按筆畫數(shù)和橫、豎、撇、點、折的五筆順序排序)。檢索簡碼適用與小型辭書,例如《新華字典》,檢索全碼適用于大型辭書,如《康熙字典》。任何入只要學會了本發(fā)明的查字法(只要有一本編碼字典,無需上機,方便易行),也就學會了計算機漢字編碼;由于該查字法簡單,易學,實用,規(guī)律性好,記憶量少,符合文字規(guī)范,尤其適合中小學生學習。
綜上所述,本發(fā)明以對漢字規(guī)律的深刻認識為基礎(chǔ),考慮中國的國情和現(xiàn)實需要,從漢字排序、檢索、編碼的特定角度,全面系統(tǒng)地分析研究與整體把握漢字的本質(zhì)特征,首次提出了“漢字是形音互補的平面文字、漢字字形分解四層次理論、前偏后旁、形式化部首、拼音首音歸類合并、零碼和空碼、大腦軟切換”等一系列全新的概念和理論,巧妙利用六個字型碼的三組不同鍵符安排,與19個首音碼互不干擾,獨創(chuàng)了“漢字24部首排序查字、字詞分流、詞型分流、元切換雙碼式共容互補、個人詞庫專用編碼空間、以字定詞、以詞定詞”等全新技術(shù),不但字詞之間絕無重碼(字的第二碼為字型碼,詞的第二碼是首音碼),詞與詞之間的重碼也極少。本發(fā)明具有深厚的理論支持,漢字編碼系統(tǒng)規(guī)范,重碼率極低,簡明易學,高效好用,字詞分流,適合面廣;用戶在其同一編碼體系中不用切換,即可兼容形音碼、全形碼等碼式和繁體字編碼,適合配置大字庫及大詞庫,可預(yù)留用戶詞庫專用編碼空間,并與一種新式快速查字法高度統(tǒng)一,其編碼本身具有相對獨立性;鍵位布局充分考慮指法的諧調(diào)性,符合人機工程學原理本發(fā)明適合各種不同知識背景、各種不同輸入方式(如看打、聽打、想打)及方言地區(qū)的專職與非專職的用戶,尤其適合中小學生學習使用。
權(quán)利要求
1.一種用于計算機漢字輸入的編碼法及其鍵盤,根據(jù)漢字字形進行編碼,其特征在于將漢字筆畫分為橫、豎、撇、點、折五類并以數(shù)碼1~5對應(yīng)編碼;采用特選的二十四個漢字常用部首并分布在鍵盤鍵位上作為編碼,再將一些常用漢字字根歸類于這些特選部首之中,歸類字根與對應(yīng)的特選部首取同一編碼;漢字編碼以筆畫和特選部首為筆形編碼單元,加上漢字拼音碼,所組成的形音四碼編碼包括(第一筆形碼)+(字型碼)+(第二筆形碼)+(首音碼)(1)、將漢字分為獨體字和合體字,獨體字的第一筆形碼取該字的首筆畫加次筆畫編碼,第二筆形碼取該字的末筆畫編碼;(2)、合體字拆分為前偏、后旁二個部分,前偏取字的左、上、外部分,后旁取字的右、下、內(nèi)部分;當前偏為特選部首或歸類字根時,第一筆形碼取該特選部首或歸類字根之編碼,否則第一筆形碼取該前偏的首、次筆畫;當后旁為特選部首或歸類字根時,第二筆形碼取該特選部首或歸類字根之編碼,否則第二筆形碼取后旁的首、次筆畫編碼;對上下結(jié)構(gòu)漢字,則第二筆形碼取該字最下面第一個字根的首、次筆畫編碼,該字根為特選部首或歸類字根則取相應(yīng)編碼;取筆形碼時,若漢字筆畫不足則以自定義的零碼補足;(3)、首音碼取漢字拼音的第一個字母;(4)、將漢字結(jié)構(gòu)分為獨體型、左右型、外內(nèi)型、上下型并定義相應(yīng)的編碼,作為漢字的字型碼。
2.根據(jù)權(quán)利要求1所述的編碼法及其鍵盤,其特征在于特選部首包括王、艸、石、酉、車(車)、蟲、忄、口、貝(貝)、日、禾、亻、、钅(金)、月、讠(言)、火、氵、衤、土、木、女、扌、纟(糹)歸類字根包括古、莫、丁、立、產(chǎn)、、山、辶、門、田、口、目、日、氣、術(shù)、分、主、麻、鹿、士
3.根據(jù)權(quán)利要求1所述的編碼法及其鍵盤,其特征在于漢字編碼所組成的全形碼包括(第一筆形碼)+(字型碼)+(第二筆形碼)+(第三筆形碼)其中的第三筆形碼的取碼規(guī)則如下(1)、獨體字的第三筆形碼取該字的第三、四筆畫編碼,對不足三畫的獨體字取零碼補齊;(2)、合體字的第三筆形碼取后旁第二個字根為特選部首或歸類字根時則取其相應(yīng)編碼,否則取該后旁第二字根的首、次筆畫編碼;(3)、若合體字的后旁只有一個字根、前偏由兩個或兩個以上字根組成,前偏第二個字根為特選部首或歸類字根時則第三筆形碼取其相應(yīng)編碼,否則第三筆形碼取該前偏第二字根的首、次筆畫編碼;(4)、若按上述取碼規(guī)則仍無第三筆形碼,則用零碼補齊。
4.根據(jù)權(quán)利要求1所述的編碼法及其鍵盤,其特征在于漢字編碼所組成的形音五碼編碼包括(第一筆形碼)+(字型碼)+(第二筆形碼)+(首音碼)+(韻母碼)其中的首音碼和韻母碼組成完整的拼音碼,在鍵盤上均設(shè)有對應(yīng)的鍵碼作為編碼。
5.根據(jù)權(quán)利要求1或2或3或4所述的編碼法及其鍵盤,其特征在于在獨體型、左右型、上下型、外內(nèi)型四種基本字型中,將其中的左右型漢字又分為三種,一種是前偏為特選部首而后旁為上下型結(jié)構(gòu),簡稱為部上型字;一種是前偏為特選部首而后旁為非上下型結(jié)構(gòu),簡稱為部非型字;其它的左右結(jié)構(gòu)漢字歸為一種,簡稱為次左型字;則字型分為四類共六種,字型碼包括六個碼元;為避免編碼方式的切換,在用于形音碼簡體字編碼、形音碼繁體字編碼、全形碼時分別采用鍵盤上不同的六個鍵碼,具體對應(yīng)關(guān)系如下部上型 部非型 次左型 上下型 外內(nèi)型 獨體型形音碼簡體字字型碼 U I OL V A形音碼繁體字字型碼 1 2 34 5 6全形碼漢字字型碼, . /;〔 8全形碼漢字字型碼代碼f1 f2 f3 f4 f5 f6
6.根據(jù)權(quán)利要求1或2或3或4所述的編碼法及其鍵盤,其特征在于特選部首、歸類字根、五類筆畫、筆形碼的數(shù)字筆畫碼、首音碼、韻母碼在鍵盤上的分布如下鍵碼 特選部首 歸類字根 筆畫 筆形數(shù)碼 首音字母 韻母Q 33qiuW 钅(金)分 34wia,uaE 月35ze,eiR 亻32r,a,e,o uan,üanT 禾氣丿(撇)31tue,üeY 讠(言)主麻 丶(點)41yuaiU (空碼)42I 火鹿 43 iO 氵44 uo,oP 衤45pun,ünA 車(車)15 aS 酉丁 14song,iongD 石13duang,iangF 艸古莫12fen,engG 王 一(橫)11guH 蟲立產(chǎn)丨(豎)21hangJ 忄山辶22janK 口門 23kaoL 貝(貝)田囗24 aiZ (零碼)00X 纟(糹)55xieC 扌54ciaoV 女53 uiB 木術(shù) 52bouN 土士 乙(折) 51n,l in,ingM 日曰目25mian其中的筆形數(shù)碼既可作為筆形碼代表特選部首、筆畫或歸類字根,也可作為拼音碼代表相應(yīng)的首音碼或韻母碼。
7.根據(jù)權(quán)利要求1所述的編碼法及其鍵盤,其特征在于漢字編碼設(shè)置了三級簡碼,其中(1)、一級簡碼共48個,其中24個最高頻字取其首音碼加空格鍵,另外24個次高頻字取首音碼加右單引號’鍵碼;(2)、二級簡碼編碼取漢字的第一筆形碼加首音碼,再加空格鍵結(jié)束;以二級簡碼輸入漢字二字詞時,采用前定碼和后定碼前定碼為(首字第一筆形碼)+(首字首音碼)+(末字首音碼)后定碼為(首字首音碼)+(零碼Z)+(末字第一筆形碼)+(末字首音碼)(3)、三級簡碼編碼包括(第一筆形碼)+(字型碼)+(第二筆形碼)+(空格鍵)。
8.根據(jù)權(quán)利要求1或3所述的編碼法及其鍵盤,其特征在于漢字編碼包括(漢字全形碼)+(后旁首音碼)其中的后旁首音碼為漢字后旁之成字根的漢語拼音首音碼;若后旁不成字,取后旁中第一個成字字根的拼音首音碼;若后旁中無成字字根,則后旁首音碼取零碼Z補齊。
9.根據(jù)權(quán)利要求1或3或4所述的編碼法及其鍵盤,其特征在于分別以形音四碼、全形碼、形音五碼為基礎(chǔ)形成三種漢字詞組輸入法(1)、形音四碼的詞組輸入規(guī)則為1A、二字詞編碼為(首字第一筆形碼)+(首字首音碼)+(末字首音碼)+(末字第一筆形碼)二字詞簡碼編碼為(首字首音碼)+(末字首音碼)+(右單引號’鍵碼)二字詞特碼編碼為(首字首音碼)+(末字首音碼)+(空碼U)+(末字第一筆形碼)1B、三字詞編碼為(第一字首音碼)+(第二字首音碼)+(第三字首筆畫碼)+(第三字首音碼)其中的筆畫碼分別以鍵盤上的“,. / ;〔 ”五鍵代表五類基本筆畫“橫、豎、撇、點、折”的筆畫碼;1C、四字詞編碼按順序分別取四字首音碼加數(shù)碼8,數(shù)碼8為四字詞詞型識別碼;四字詞定碼編碼則按順序分別取四字的首音碼加右單引號’鍵碼;1D、多字詞編碼按順序分別取第一、二、三、末字的首音碼加數(shù)碼9,數(shù)碼9為多字詞詞型識別碼;(2)、全形碼的詞組輸入規(guī)則為2A、二字詞編碼為(首字第一筆形碼、第二筆形碼)+(末字第一筆形碼、第二筆形碼)2B、三字詞編碼為(第一字、第二字、第三字的第一筆形碼)+(第三字第二筆形碼)2C、四字詞編碼為按順序取各字的第一筆形碼;2D、多字詞編碼按順序分別取第一、二、三、末字的第一筆形碼;(3)、形音五碼的詞組輸入規(guī)則為3A、二字詞編碼為(首字第一筆形碼)+(首字首音碼、韻母碼)+(末字首音碼、韻母碼)二字詞簡碼編碼為(首字首音碼)+(末字首音碼)+(右單引號’)二字詞前定碼編碼為(首字第一筆形碼、首音碼)+(空碼U)+(末字首音碼、韻母碼)二字詞后定碼編碼為(首字首音碼)+(零碼Z)+(首字韻母碼)+(末字第一筆形碼、首音碼)3B、三字詞編碼為(第一字首音碼)+(第二字首音碼)+(第三字首音碼、韻母碼)+(空碼U)3C、四字詞編碼為按順序取各字的首音碼加數(shù)碼8;3D、多字詞編碼為取第一、二、三、末字的首音碼加數(shù)碼9。
10.根據(jù)權(quán)利要求1所述的編碼法及其鍵盤,其特征在于為用戶自定義詞組設(shè)置專用編碼,其中(1)、二字詞編碼為(空碼U)+(首字首音碼)+(末字首音碼)+(末字第一筆形碼)(2)、三字詞編碼為(零碼Z)+(第一、二、三字的首音碼)(3)、四字詞和多字詞的編碼為(零碼Z)+(第一、三、末字的首音碼)。
全文摘要
一種計算機漢字輸入編碼法及其鍵盤,根據(jù)漢字字形進行編碼,將漢字筆畫分為橫、豎、撇、點、折五類并以數(shù)碼1至5對應(yīng)編碼;采用特選的24個漢字常用部首并分布在鍵位上作為編碼,再將一些常用漢字字根歸類于這些特選部首,歸類字根與對應(yīng)的特選部首取同一編碼;漢字編碼以筆畫和特選部首為筆形編碼單元,加上漢字拼音碼,可分別組成的形音四碼、形音五碼和全形碼且無需切換。本發(fā)明系統(tǒng)規(guī)范,簡明易學,高效好用,重碼率極低,字詞分流,適合面廣。
文檔編號G06F3/023GK1262474SQ9911522
公開日2000年8月9日 申請日期1999年1月22日 優(yōu)先權(quán)日1999年1月22日
發(fā)明者曾昭化 申請人:曾昭化
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1