亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

多輸入方式的計(jì)算機(jī)漢字編碼輸入技術(shù)的制作方法

文檔序號(hào):6330725閱讀:244來源:國知局
專利名稱:多輸入方式的計(jì)算機(jī)漢字編碼輸入技術(shù)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種用于中文信息處理的漢字編碼技術(shù),特別是使用鍵盤往微型計(jì)算機(jī)及其它電子設(shè)備輸入漢字以進(jìn)行信息處理、存儲(chǔ)和傳輸?shù)木幋a方法。
計(jì)算機(jī)信息處理的漢字輸入方式,一般有光電掃描、手寫輸入、語音錄入以及鍵盤編碼輸入等幾種。前三種方式由于對(duì)計(jì)算機(jī)硬件配置的要求較高以及適應(yīng)性問題而不易推廣普及。目前成本低、應(yīng)用廣泛的仍是鍵盤編碼輸入方式,其中具有代表性且使用較多的有拼音、自然碼、錢碼、五筆字型以及最近由北京大學(xué)權(quán)威專家組成課題組通過的《中國二筆輸入法社會(huì)經(jīng)濟(jì)效益研究》報(bào)告所推薦的二筆碼等多種漢字輸入方法。這些輸入方法尚存在著這樣的問題,即易學(xué)易用與重碼率高的矛盾,重碼率的高低又直接關(guān)系到漢字錄入的速度,如拼音輸入法易學(xué),但重碼字多,須頻繁翻頁尋找再選字輸入,錄入很慢。為了減少重碼以達(dá)到快速往計(jì)算機(jī)輸入漢字的目的,就必須把漢字按一定的規(guī)則拆分為多個(gè)部首和字根,由于漢字?jǐn)?shù)量多,且結(jié)構(gòu)復(fù)雜,拆分出的部首和字根多達(dá)數(shù)百個(gè)才能滿足漢字編碼的要求,而這種拆分為了滿足編碼的需要,往往因字而異,規(guī)則繁瑣,給漢字輸入人員增加了很大的記憶負(fù)擔(dān)。這種字根多、又不規(guī)范的拆分方法破壞了漢字內(nèi)在結(jié)構(gòu)的整體性,成為計(jì)算機(jī)漢字輸入難以掌握的主要原因。
為了解決這個(gè)問題,通常的辦法是將拆分后的部首和字根按形、音、義分類整理,然后按一定的規(guī)則有序地進(jìn)行排列組合,使人們便于記憶,如申請(qǐng)中國專利的錢碼、天然碼以及二筆輸入法,即采用了按形、音、義分類安排鍵位,高頻字預(yù)示等便于記憶的方法,但其拆分的編碼字根高達(dá)200-300個(gè),占用鍵位多達(dá)30余個(gè),碼元安排與鍵位字母之間缺乏有機(jī)的聯(lián)系,所需的記憶量并未減少,仍是人們學(xué)習(xí)漢字輸入技術(shù)的沉重負(fù)擔(dān)和障礙,難以為一般人在短時(shí)間內(nèi)掌握,因此推廣和普及計(jì)算機(jī)應(yīng)用的瓶頸仍是漢字的輸入問題。
本發(fā)明的目的是要提供一種改進(jìn)的漢字編碼技術(shù)。首先,它基于一般人均已具有的知識(shí)儲(chǔ)備,通過科學(xué)地選取漢字的基本碼元和引入漢字字首偏旁與字末偏旁的概念,將聲形與形聲兩種輸入法合為一體,進(jìn)一步解決不認(rèn)識(shí)的漢字的輸入問題,在降低重碼率,達(dá)到計(jì)算機(jī)漢字編碼技術(shù)指標(biāo)的同時(shí),實(shí)現(xiàn)漢字編碼的規(guī)范化。其次,運(yùn)用我國古代象形、會(huì)意的“六書”造字方法,建立基本碼元與鍵位字母之間的有機(jī)聯(lián)系,從而使所需的記憶量降到最低限度,減輕漢字輸入的勞動(dòng)強(qiáng)度,進(jìn)而有效地解決計(jì)算機(jī)信息處理過程中漢字錄入難學(xué)易忘的問題,給人們提供一種既規(guī)范、又簡易便捷、能即學(xué)即用的計(jì)算機(jī)漢字快速輸入方法。
本發(fā)明的漢字規(guī)范編碼方法是這樣實(shí)現(xiàn)的借助計(jì)算機(jī)鍵盤的26個(gè)字母鍵,一個(gè)漢字取四鍵作為編碼。其編碼思想是漢字的編碼由聲碼和形碼兩部分組成,聲碼部分取漢字的聲母編碼,形碼部分取漢字的首、尾、補(bǔ)編碼。漢字的聲母編碼與鍵盤的英文字母相對(duì)應(yīng)(無聲母的漢字取韻母的首字母為編碼)。漢字規(guī)范編碼對(duì)首、尾、補(bǔ)編碼的約定意義是以漢字左上角的起筆為首形碼,右下角末筆為尾形碼,最后以漢字右上角最高的筆形為補(bǔ)形碼,一個(gè)漢字的全碼為四碼,即最多四鍵輸入一個(gè)漢字。
一、漢字聲母的編碼漢字聲母的編碼是指選取漢字漢語拼音的首字母進(jìn)行編碼。一般情況下首字母即是該漢字的聲母,若遇卷舌音如ZH、CH、SH或無聲母的漢字則取其拼音或韻母的第一個(gè)首字母編碼。聲母的編碼與鍵位上的英文字母一一對(duì)應(yīng)。
二、漢字字形的編碼形碼部分的字形編碼元素分為十九種,分別用十九個(gè)字母鍵表示E-一橫C-右彎鉤(含橫上鉤和斜右鉤)I-︱豎 (含豎左鉤)P-丿 撇U-丶 點(diǎn)R- 捺H-十艸正叉(兩筆垂直交叉)X-乂 斜叉 (兩筆斜向交叉)M- 正插(一筆縱向垂直穿兩筆或兩筆以上)W-扌 斜插(一筆縱向斜穿兩筆或兩筆以上)O-口 (四角整齊內(nèi)無筆劃的方形)Q-日 (四角整齊內(nèi)含筆劃的方形)L- 正角 (一筆向下轉(zhuǎn)折或兩筆筆頭相接所形成的直角)K- 斜角 (一筆向下轉(zhuǎn)折或兩筆筆頭相接所形成的銳角或鈍角)B- 八(八字形和八字形的變形)T- (撇與橫筆組成的復(fù)筆)V- 小(小字和小字的變形)F-忄 (豎心旁)A-亠 點(diǎn)下有一橫 (點(diǎn)與橫筆組成的復(fù)筆)編碼元素按國家現(xiàn)行出版的《新華字典》、《辭?!穼?duì)漢字筆形的分類進(jìn)行了取舍,同時(shí)引入了筆劃形態(tài)、方向及其相互關(guān)系的概念,按象形、會(huì)意、形聲的關(guān)系使之與相應(yīng)的鍵位字母自然地關(guān)聯(lián),無須強(qiáng)記,達(dá)到心領(lǐng)神會(huì)、一目了然的效果。
由于同聲母的一些漢字可能具有相似的首尾結(jié)構(gòu),會(huì)出現(xiàn)多個(gè)漢字編碼相同的重碼問題,為了進(jìn)一步降低重碼率,分散較為集中的重碼字,達(dá)到易學(xué)好用的目的,本發(fā)明采用了一種“路徑”的編碼方法,將全碼相同的多個(gè)不同漢字,按其使用的頻度分散到全碼所路經(jīng)的上級(jí)簡碼,即任何一個(gè)全碼漢字,均可根據(jù)編碼需要占用其“路徑”上的一級(jí)、二級(jí)、三級(jí)簡碼資源。例如有三個(gè)漢字的編碼均為JALE,則按漢字的使用頻度以JA為一個(gè)高頻字簡碼,JAL為一個(gè)常用字簡碼,JALE為一個(gè)非常用字的編碼。因此只要知道一個(gè)字的全碼,就可以在鍵入全碼的“路徑”上錄入該漢字,從而使重碼率大為降低,為計(jì)算機(jī)的漢字快速輸入創(chuàng)造了條件。
本發(fā)明的單個(gè)漢字可同時(shí)采用聲形輸入和形聲輸入兩種方式輸入漢字,其編碼規(guī)則分述如下。
三、單字的聲形輸入方式單字的聲形輸入方式是按照人們書寫漢字的習(xí)慣思維方式,即先根據(jù)字的讀音考慮寫首筆劃,最后以末筆劃結(jié)束的過程。因此編碼的規(guī)則是先輸入漢字讀音的聲母,然后是首形碼、尾形碼,最后加補(bǔ)形碼,也就是聲碼+首形碼+尾形碼+補(bǔ)形碼。例如“金”字的編碼JBE;“石”字的編碼SEO;“教”字的編碼JHX;“新”字的編碼XAIP。
四、單字的形聲輸入方式為適應(yīng)文化層次不同的人員,允許對(duì)那些不會(huì)讀或不會(huì)寫的漢字采用下述形聲方式輸入漢字。
在一般的聲形輸入方式下,應(yīng)當(dāng)先輸入漢字的聲碼,然后再輸入該字的三個(gè)形碼。對(duì)于不認(rèn)識(shí)的字,難以確定聲母的編碼,也可以采用形聲方式輸入,即先輸入該字的首形碼,尾形碼、補(bǔ)形碼,第四鍵取組成該漢字的字首成字偏旁或字末成字偏旁的聲母編碼,也就是首形碼+尾形碼+補(bǔ)形碼+偏旁聲碼。在這里需要注意無論是字首成字偏旁或是字末成字偏旁,均須取最大成字偏旁的聲母編碼。具體規(guī)定如下1、本發(fā)明所指的“成字偏旁”是指組成該字的偏旁有明確的讀音,而且不需要修正筆形即可獨(dú)立作為漢字使用的偏旁。例如蟲、石、貝、牛、又、皮、俞、扁等均為有讀音、可獨(dú)立成字的偏旁;而多、亻、攵、钅、、扌、宀等則不作成字偏旁處理。
2、本發(fā)明所指的“字首成字偏旁”是由漢字首筆與其后續(xù)筆劃組成的最大成字偏旁。例如“彰”有字首成字偏旁“章”,而無字末成字偏旁。
“郇”郇有字首成字偏旁“旬”,而無字末成字偏旁。
3、本發(fā)明所指的“字末成字偏旁”是由漢字末筆與其前續(xù)筆劃組成的最大成字偏旁。例如“讀”有字末成字偏旁“賣”,而無字首成字偏旁。
“鞭”既有字首成字偏旁“革”,也有字末成字偏旁“便”。
4、漢字偏旁的取碼按位置先取字末成字偏旁的聲母編碼,如沒有字末成字偏旁則改取字首成字偏旁的聲母編碼。
例如“彬”的聲碼取字末成字偏旁“杉”的聲母S。
“統(tǒng)”的聲碼取字末成字偏旁“充”的聲母C。
“謐”的聲碼取字末成字偏旁“皿”的聲母M。
“邡”的聲碼取字首成字偏旁“方”的聲母F。
5、沒有字首、字末成字偏旁的漢字,聲碼一律取V。
例如單、事、卮、其聲碼均取V。
以下是用形聲輸入方式輸入漢字的例子例1、輸入漢字“盛”。
假如不認(rèn)識(shí)“盛”字,難以確定其聲母的編碼,可敲入形碼LEU后再敲入“皿”字的聲母M,即可輸入“盛”字。
例2、輸入漢字“垣”先敲入形碼HEE,該字僅有字末成字偏旁“亙”,繼續(xù)敲入聲母G即可輸入“垣”字。
例3、輸入漢字“浚”。
先敲入形碼UXU,因該字首、末均無成字偏旁,應(yīng)敲入V,若無重碼,則自動(dòng)輸入漢字“浚”,有重碼可用數(shù)字鍵選擇輸入。
由此可見,一個(gè)漢字可以同時(shí)具有“聲形碼”和“形聲碼”兩個(gè)編碼,二者相互兼容,互不干擾,使用人員勿需按轉(zhuǎn)換鍵,就可以隨意交替使用另一種輸入法錄入漢字。
五、萬能鍵查字輸入本發(fā)明提供了聲碼、形碼的模糊編碼方法,鍵盤右下角的“/”(可視為?)鍵為萬能鍵,無論是單字聲形方式或形聲方式,還是輸入詞匯,它均可替代編碼中任何一位不能確定的編碼。
例1、輸入漢字“餾”。
假如我們難以判斷“餾”字的首形碼,可用模糊編碼代替首形碼,輸入L/QL,便可從提示行查出“餾”字的編碼為LIQL,這時(shí)可用數(shù)字鍵選擇輸入。
例2、輸入漢字“嗇”。
假如不認(rèn)識(shí)“嗇”字,則不能確定“嗇”字的聲母編碼,可以敲入/HQH,提示行即顯示“嗇”的編碼SHQH,可用數(shù)字鍵選擇輸入。
六、詞匯與整句的編碼詞匯編碼按“聲母優(yōu)先、形碼后補(bǔ)”的原則編碼,即按順序鍵入詞匯中每個(gè)漢字的聲母,最多只取四個(gè)聲母,不足四個(gè)聲母的可繼續(xù)取形碼補(bǔ)足。根據(jù)詞匯的字?jǐn)?shù)不同有以下三種編碼方法。
(一)雙字詞編碼首字聲碼+末字聲碼+首字首形碼+末字尾形碼(二)三字詞編碼依序輸入每個(gè)字的聲碼和末字的尾形碼。
即聲碼1+聲碼2+聲碼3+末字尾形碼(三)多字詞與整句編碼依序輸入前三個(gè)字的聲碼和末字的聲碼。
即聲碼1+聲碼2+聲碼3+末字聲碼基于快速輸入的思想,詞匯的編碼與漢字的編碼一樣,采用了“路徑”的編碼方法,全碼詞可以占用“路徑”上的二級(jí)簡碼、三級(jí)簡碼資源。如“北京”的簡碼為BJ;“計(jì)算機(jī)”的簡碼為JSJ;“技術(shù)創(chuàng)新”的全碼為JSCX;“滿園春色”的全碼為MYCS;“中華人民共和國”的全碼為ZHRG,均無需輸入形碼。漢字規(guī)范編碼收集了國標(biāo)GB2312-80的一、二級(jí)漢字和國家新頒布的GB18030《信息交換漢字編碼字符集》的漢字以及五萬余條常用詞匯。此外,囊括了商務(wù)印書館1996年版《漢語成語小詞典》中的全部成語,只需直接敲入聲母就可進(jìn)行成語的錄入而不會(huì)與漢字發(fā)生重碼。
多輸入方式的漢字規(guī)范編碼與現(xiàn)行漢字編碼方法相比,其特點(diǎn)是編碼的規(guī)范性和確定性。本發(fā)明是基于國家確定了的漢語拼音和對(duì)漢字筆形分類的確定性條件下構(gòu)建的規(guī)范編碼,其中任何一個(gè)漢字也都具有規(guī)范確定的編碼,因而最大限度地減少了漢字編碼的模糊性和二義性。
多輸入方式的漢字規(guī)范編碼兼容了聲形輸入和形聲輸入兩種漢字錄入方式。由于字首成字偏旁和字末成字偏旁概念的引入,本發(fā)明兼有音碼輸入法的簡便和形碼輸入法的快捷等優(yōu)點(diǎn),解決了拼音和聲形輸入法對(duì)不認(rèn)識(shí)的漢字的鍵盤錄入問題。
編碼規(guī)則特別簡單,充分利用了人們已有的知識(shí)儲(chǔ)備,沒有特殊要求記憶的附加內(nèi)容。由于用聲母作首碼,與鍵盤的英文字母完全一致,形碼的基本碼元與其對(duì)應(yīng)鍵位的字母有“形似”和“神似”的聯(lián)系,如巧妙地用E表示橫筆,I表示豎筆,O表示口,L表示直角的折筆,X表示兩筆交叉,W表示多筆交叉,都極為形象自然、順理成章,擴(kuò)展的異形碼元也僅13個(gè),因而無須強(qiáng)記。在漢字輸入過程中,使用者取碼的視線只需集中在漢字的首、尾及右上角固定位置的筆劃上,操作規(guī)范,不存在對(duì)漢字進(jìn)行部件拆分的問題,只要知道漢字的大概輪廓便可錄入,不必細(xì)究漢字的內(nèi)部筆劃,因此學(xué)習(xí)掌握特別容易。一個(gè)具有小學(xué)文化程度的人,已經(jīng)初步學(xué)習(xí)了漢語拼音和查字典的基礎(chǔ)知識(shí),只要了解一下編碼的基本規(guī)則就可以使用鍵盤進(jìn)行漢字輸入,容易做到即學(xué)即用。
本發(fā)明實(shí)現(xiàn)了單字和詞匯的自然區(qū)分。由于編碼中選用了不同的字母鍵分別表示聲碼和形碼,根據(jù)I、O、U、V、E、A等僅表示形碼的字母在編碼中出現(xiàn)的位置,即可區(qū)分是單字還是詞匯,減少了單字和詞匯同時(shí)出現(xiàn)的重碼問題,這種使單字和詞匯涇渭分明,各行其道的措施,進(jìn)一步提高了編碼素質(zhì)。
詞匯和整句錄入是提高輸入速度的關(guān)鍵,詞匯的編碼以聲母編碼為主,形碼為輔,先“聲”后“形”,形碼則先首碼而后尾碼,符合人們書寫的思維過程,詞的簡碼只需連續(xù)鍵入兩個(gè)或兩個(gè)以上的聲母,省去形碼后,進(jìn)一步提高了詞匯的輸入速度,三字以上的詞組只需根據(jù)聲母就可以快速錄入,無須考慮該詞組具體怎么寫,因而給人一種親切自然的感受。
聲母的ZH、CH、SH和Z、C、S不分,適應(yīng)南方方言不分卷舌音的特點(diǎn)。
本發(fā)明可以軟件的形式制作成中文信息處理的漢字輸入系統(tǒng),安裝于UCDOS、以及WINDOWS3.X、WINDOWS95、WINDOWS98、WINDOWS NT等計(jì)算機(jī)操作平臺(tái)上,為計(jì)算機(jī)提供一種簡便的漢字輸入方式;也可固化于只讀存儲(chǔ)器中作為中文信息處理的漢字輸入技術(shù),供掌上型移動(dòng)通信設(shè)備輸入漢字進(jìn)行中文信息的傳輸和交換。
權(quán)利要求
一、中文信息處理的漢字編碼輸入技術(shù),一種使用鍵盤將漢字輸入到計(jì)算機(jī)和電子設(shè)備以進(jìn)行信息處理、存儲(chǔ)和傳輸?shù)臐h字規(guī)范編碼方法,該方法的漢字編碼由聲碼和形碼兩部分組成,其特征是(1)所述聲碼部分為漢語拼音的聲母或韻母的首字母,且與鍵盤上的英文字母一一相對(duì)應(yīng)。(2)所述形碼部分的基本編碼元素取自《新華字典》以及《辭?!穼?duì)漢字筆形的十九種筆劃分類,同時(shí)引入了筆劃形態(tài)、方向及其相互關(guān)系的概念,按象形、會(huì)意、形聲的關(guān)系使之與相應(yīng)的鍵位字母自然關(guān)聯(lián),每個(gè)鍵位字母所代表的筆劃如下E-一橫C-右彎鉤(含橫上鉤和斜右鉤)I-︱豎(含豎左鉤)P-丿撇U-丶點(diǎn)R- 捺H-十艸正叉 (兩筆垂直交叉)X-乂ナ斜叉 (兩筆斜向交叉)M- 正插(一筆縱向垂直穿兩筆或兩筆以上)W-扌 斜插(一筆縱向斜穿兩筆或兩筆以上)O-口 空口(四角整齊內(nèi)無筆劃的方形)Q-日 實(shí)口(四角整齊內(nèi)含筆劃的方形)L- 正角(一筆向下轉(zhuǎn)折或兩筆筆頭相接所形成的直角)K- 斜角(一筆向下轉(zhuǎn)折或兩筆筆頭相接所形成的銳角或鈍角)B- 八(八字形和八字形的變形)T- (撇與橫筆組成的復(fù)筆)V- 小(小字和小字的變形)F-忄(豎心旁)A-亠點(diǎn)下有一橫(點(diǎn)與橫筆組成的復(fù)筆)
二、根據(jù)權(quán)利要求一所述的漢字編碼有聲形輸入方式和形聲輸入方式兩種,二者相互兼容、共同存在,從而構(gòu)成多輸入方式的計(jì)算機(jī)漢字編碼輸入技術(shù),其特征是(1)聲形輸入方式聲碼+首形碼+尾形碼+補(bǔ)形碼。(2)形聲輸入方式首形碼+尾形碼+補(bǔ)形碼+偏旁聲碼。(3)所述聲形輸入方式與形聲輸入方式兩者是相互兼容、共同存在的,其特征是無需作任何轉(zhuǎn)換便可交替使用聲形方式和形聲方式直接輸入漢字。(4)根據(jù)權(quán)利要求(2)所述的偏旁聲碼是指組成該漢字的字首成字偏旁或字末成字偏旁的聲母編碼,其特征是(a)所述“成字偏旁”是指組成該字的偏旁有明確的讀音、而且不需要修正筆形即可獨(dú)立作為漢字使用的偏旁。(b)所述“字首成字偏旁”是由漢字首筆與其后續(xù)筆劃組成的最大成字偏旁。(c)所述“字末成字偏旁”是由漢字末筆與其前續(xù)筆劃組成的最大成字偏旁。(d)漢字偏旁的取碼按位置先取字末成字偏旁的聲碼,如沒有字末成字偏旁則改取字首成字偏旁的聲碼。(e)沒有字首、字末成字偏旁的漢字,聲碼一律取V。
三、根據(jù)權(quán)利要求一所述的漢字編碼輸入技術(shù)以“路徑”的編碼方法分散較為集中的重碼字到沿“路徑”的二級(jí)、三級(jí)簡碼上,輸入漢字和詞匯時(shí),可在輸入全碼的過程中錄入“路徑”中的相應(yīng)漢字。
四、詞匯的編碼采用“聲碼優(yōu)先,形碼后補(bǔ)”的編碼方案,即按順序鍵入詞匯中每個(gè)漢字的聲母,不足四個(gè)聲母的可繼續(xù)取形碼補(bǔ)足。其編碼規(guī)則根據(jù)詞匯的字?jǐn)?shù)不同有以下編碼方法,其特征在于(1)雙字詞編碼首字聲碼+末字聲碼+首字首形碼+末字尾形碼(2)三字詞編碼依序輸入每個(gè)字的聲碼和末字的尾形碼。即聲碼1+聲碼2+聲碼3+末字尾形碼(3)多字詞與整句編碼依序輸入前三個(gè)字的聲碼和末字的聲碼。即聲碼1+聲碼2+聲碼3+末字聲碼
全文摘要
本發(fā)明是一種用于計(jì)算機(jī)和電子通訊設(shè)備的中文信息處理漢字編碼輸入技術(shù)。該技術(shù)提供了一種新穎高效的漢字規(guī)范編碼輸入方法。它借助計(jì)算機(jī)鍵盤的26個(gè)字母鍵,通過引入漢字筆劃形態(tài)、方向及其相互關(guān)系的概念,科學(xué)選取漢字的基本碼元和偏旁,同時(shí)根據(jù)古代“六書”的造字方法使之與鍵位字母形成自然關(guān)聯(lián),并將多種輸入法合為一體,進(jìn)一步解決生僻字、繁難字的鍵盤輸入問題,從而最大限度地減少記憶量,減輕漢字輸入的勞動(dòng)強(qiáng)度,給人們提供一種既規(guī)范、又簡易便捷、能即學(xué)即用的漢字快速輸入技術(shù)。
文檔編號(hào)G06F3/023GK1300976SQ0013133
公開日2001年6月27日 申請(qǐng)日期2000年10月28日 優(yōu)先權(quán)日2000年10月28日
發(fā)明者劉君度, 陳昌英, 劉冰彬 申請(qǐng)人:劉君度, 陳昌英, 劉冰彬
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1