擴展拼音碼計算機漢字輸入方法

文檔序號：6602689閱讀：510來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：：擴展拼音碼計算機漢字輸入方法
技術(shù)領(lǐng)域：
：本發(fā)明屬計算機漢字輸入
技術(shù)領(lǐng)域：
，是一種以擴展拼音碼為基礎(chǔ)的計算機漢字輸入方法。漢語拼音是目前使用最為廣泛的一種計算機漢字輸入方法。一個好的漢字輸入法應(yīng)該符合國家文字規(guī)范，與文化基礎(chǔ)教育相一致，漢字輸入編碼應(yīng)該和字典查詢碼相一致，這是人們對漢字輸入編碼的普遍期望，漢語拼音符合這些條件。但是，普通的漢語拼音輸入存在三大缺點1.不認識的漢字就不知道它的讀音，無法用普通拼音方法輸入，2.讀音不準的漢字(如平舌音、卷舌音、前鼻音、后鼻音分不清)很難用普通拼音方法輸入。3.相同讀音的漢字在普通拼音中實在太多，因此造成重碼多，不能盲打，影響輸入速度。本發(fā)明的目的在于提供一種對不認識或讀音不準的漢字也能輸入，而且重碼率低、輸入速度快的計算機漢字輸入方法。本發(fā)明提出的計算機漢字輸入方法以擴展拼音碼為基礎(chǔ)。該輸入系統(tǒng)的編碼方法如下對于單個漢字，按該漢字的聲(聲母)、韻(韻母)、型(字型)、調(diào)(音調(diào))的次序編碼輸入。其中，聲碼是必須碼，輸入時，在計算機鍵盤上輸入相應(yīng)的聲母字母。為了對不認識的漢字也能輸入，本輸入系統(tǒng)設(shè)置了萬能聲母碼“/”，即對應(yīng)于鍵盤上的“/”符號鍵。對于零聲母A、E、O開頭的漢字，前面加偽聲母V。對于卷舌音聲母SH、CH、ZH，可以省去H，即SH、CH、ZH可分別用S、C、Z代替，避免發(fā)不準對輸入帶來的困難。對于韻母碼，在鍵盤上輸入相應(yīng)的韻母字母，對于后鼻音韻母中的g可以省略，即ANG、ENG、ING可用AN、EN、IN代替。對于型碼，用鍵盤上的0-9個數(shù)字表示漢字的10種字型。本輸入系統(tǒng)中，將單個漢字按一分為二的形式折分，可歸納為如下幾種形狀類型符號數(shù)字碼說明左右型1即可拆分為左右兩個部分，例如組、林、把等。上下型2即可拆分為上下兩個部分，例如尖、汞、型等。外內(nèi)型3即可拆分為內(nèi)外兩個部分，例如，國、周、回等。對角型4即可拆分為對角兩個部分，例如，過、這、遇等。獨體型5渾然一體沒有自然間隙的獨體漢字，或雖有間隙，但不宜繼續(xù)折分的組字部件，如犬、人、又等。附著型6即可拆分為一個字和一個組字部件，例如犬字。交叉型7即該字為獨體字，且筆劃有交叉，例如大字。粘連型8即該字為獨體字，且筆劃粘連在一起，例如人字。聚合型9即不能獨立成字，有筆劃間隙但不應(yīng)拆分的偏旁部首。上述類型中，附著型、交叉型、粘連型、聚合型4種字型均可作為獨體型處理，輸入時可用數(shù)字碼5。另外，數(shù)字碼0表示任意字型。對于音調(diào)碼，本系統(tǒng)用鍵盤上的“—”、“＝”、“＇”、“＼”4個符號鍵分別表示漢字的4個音調(diào)陰平、陽平、上聲、去聲。為了便于快速輸入，本系統(tǒng)的輸入編碼中，可將韻母碼，字型碼，音調(diào)碼分別省去或全部省去，組成簡拼。例如，日RI，得DE＝，的D，低DI—。為了進一步減少重碼率，本系統(tǒng)提出“組字詞組”的概念，即將能夠一分為二的漢字分為兩個部分，這兩個部分可以是獨立的漢字，也可以是某一種偏旁。例“種”分為“禾”、“中”兩個字，“花”分為“艸”、“化”兩個部分。再按先左后右，先上后下，先外后內(nèi)，先大后小的次序排列在原來漢字的后面，成為一個詞組，我們稱其“組字詞組”。例如，種字的組字詞組為“種禾中”，多字組字詞組為“多夕夕”。然后將該詞組按字序依次編碼輸入。本系統(tǒng)中“組字詞組”中后二個字是用來修飾第一個漢字的。因此，雖然輸入了二個或三個漢字的拼音，但是最終轉(zhuǎn)換成一個漢字，不像后面將要提到的輸入常用詞組時對應(yīng)的是該詞組。對于“組字詞組”中三個漢字的擴展拼音編碼，通過壓縮省略，一般只需三個漢字的聲母碼即可。例如，碼→碼石馬→MAIMA(MASHM，MASM，MSM)→碼；輸→輸車俞→SUCEYU(SHUCY，SHCHY，SCY)→輸。對于不認識的漢字，也可以利用組字詞組和萬能聲母編碼輸入，例如魑→魑鬼離→/GUILI→魑，骱→骱骨介→/GUJIE→骱。即編碼時，第一個字用萬能聲母碼“/”，第二，第三字一般可取聲母和韻母即可。要熟練地使用“組字詞組”來輸入漢字，需要熟悉它們的“組字詞”，以及常用偏旁的讀音，這些都可以在系統(tǒng)編碼表里方便地查到。我們知道，普通拼音對每個漢字一般只能輸入聲母和韻母二個信息(聲調(diào)一般不用)。在漢語中，聲母和韻母的各種組合不包括聲調(diào)的話，總共不過四百種左右，而常用的漢字一般有二、三千個，這樣，重碼自然就多了。而在擴展拼音里，一個漢字可以用它的組字詞組來編碼，這時輸入的信息量就大大增加，自然就不會有重碼了，但另一方面，如果輸入的信息量太多，編碼長度就太長了。因此，我們在用擴展拼音編碼時，一方面要利用它的組字詞組信息量大的優(yōu)勢，增加輸入的信息量；但另一方面又要利用擴展拼音可以省略韻、型、調(diào)的規(guī)則，來縮短編碼長度。一般我們可以按照“聲、韻、聲、聲”的規(guī)則來進行編碼，即在組字詞組里，取第一個字的聲母碼和韻母碼，取第二，第三個字的聲母碼，甚至是取這個4個碼的第一個字母進行編碼，這就是本輸入系統(tǒng)的一種推存碼。我們知道，不同的漢字在使用中出現(xiàn)的頻率是很不一樣的。一般的漢字輸入系統(tǒng)都將最常用的漢字放在提示行的最前面，以提高輸入速度。但在實際使用中，某些原先并不常用的漢字有可能在某篇文章中變得常用起來，這就需要臨時將這些漢字作為常用字來處理。本系統(tǒng)設(shè)置有常用字動態(tài)定義功能，常用字的定義是非常方便的，用戶只需在第一次輸入這個漢字的編碼時，不要省略該字的字型編碼，則以后該漢字就被定義成常用漢字了。比如，當(dāng)我們發(fā)現(xiàn)《字》應(yīng)該定義成常用字時，只需在第一次碰到該字時，在編碼中包含它的字型信息，即用編碼ZI②來輸入它，其中②表示該漢字是上下型漢字，以后當(dāng)你輸入《字》這個字時，只要鍵入ZI，則《字》字就出現(xiàn)在提示行的第一個了。為了提高輸入速度，本系統(tǒng)還設(shè)置了常用詞詞庫，對于常用詞，只要輸入前面幾個字的少量編碼信息即可，例如輸入該常用詞組前幾個字的聲碼。對于同一篇文章中有重復(fù)次數(shù)較多的詞組輸入，而此詞組又非系統(tǒng)常用詞詞庫里的詞，本系統(tǒng)設(shè)置了常用詞動態(tài)定義功能，即可定義該詞組為常用詞，并記錄在系統(tǒng)的動態(tài)詞組表里。其方法為，第一次輸入時，依該詞組字的次序按單個漢字編碼的方式一個一個地輸入編碼。這樣就自動地記錄在系統(tǒng)的動態(tài)詞組表里，以后遇到這些詞組時，就只要方便地按擴展拼音碼中最簡短的編碼法(即每一個漢字只輸入一個聲母)來輸入他們就行了。由于本系統(tǒng)允許以多字詞(包括常用詞和“組字詞組”)為手段進行漢字編碼，其中每一個單字可以按聲、韻、型、調(diào)的次序順序輸入，也可將“韻”、“型”、“調(diào)”分別省略，或者全部省略，因此，本系統(tǒng)編碼使用非常靈活。以輸入“改”字例，其編碼GAI＇(＇為改字的聲調(diào))GAI1＇GAI18GAI185G185……(為改字的字型編碼)GAIJIFANGAIJIFG＇JIFGAIJIGAIJF…GJF(改字的組字詞組“改已文”的編碼)。GAIGEGAI＇GGAIGG＇GG＇GE…GG(常用詞，改革)以上都是“改”字的合法擴展拼音輸入編碼，其中GAI是標準的拼音編碼，GAI1＇是擴展了字型信息的拼音碼，GJF是利用組字詞組的簡短編碼。而GG是利用常用詞組來定字。由于‘組字詞組’存在于待輸入漢字的本身字形之中，所以這是輸入不認識的單字或不常用單字的最有用手段。由上可見，本系統(tǒng)中一個漢字的擴展拼音碼是很多的，即使將碼控制在4鍵左右，編碼數(shù)也不少。因此，擴展拼音碼輸入系統(tǒng)為用戶提供了一個以拼音為基礎(chǔ)的漢字編碼框架，至于每個漢字的具體編碼可由用戶根據(jù)規(guī)則自己選定。由于本系統(tǒng)使用了“組字詞組”的概念，涉及到對漢字一分二的拆分下面具體介紹拆分，方法，以便能確定少數(shù)疑難字的“組字詞組”及其前后次序。一、合體字的拆分方法因為在擴展拼音中，漢字的拆分過程僅限于一拆為二，故有可能產(chǎn)生既非獨立漢字又非偏旁部首的組字部件，如‘咅’等。對于這些在拆分過程中產(chǎn)生的沒有讀音的部件組合(以國標二級字庫為標準)，一律將其命名為’LENG(倆)，取其意為’還可一拆為倆’。記號為“＝”。比如，培—>培土二(PEITL)，溫—>溫水二(WENSL)等。為了減少LENG的出現(xiàn)次數(shù)，我們把由多個相同字根組成的部件用單個字根來代替。比如嬰—>嬰貝女，爽—>爽大叉，囂—>囂口頁，等。那么，由一拆為二而產(chǎn)生的兩個偏旁字中，究竟哪一個在前，哪個在后呢？決定前后次序的原則對應(yīng)于左右，上下，內(nèi)外，附著這四種結(jié)構(gòu)的合體字分別是’先左后右，先上后下，先外后內(nèi)，先大后小’。對角型的漢字則一般按上下型處理。更直觀些講就是先寫的部分在前，后寫的部分在后。在判斷漢字的字型結(jié)構(gòu)，以決定兩個字根的前后次序時，還可參考偏旁字的名稱來決定，在偏旁部首表中，每個偏旁都有一個名稱。凡是名稱為‘字旁’的一般都是左右型結(jié)構(gòu)，而名稱中稱為‘字頭’或‘字底’的則大多是上下型結(jié)構(gòu)，稱為某某框的偏旁一般構(gòu)成內(nèi)外型結(jié)構(gòu)。附著型的漢字不多，其中很多又是由‘點’組合而成的，故先大后小的原則是指主干字根在前，依附著的字根在后，下面我們舉一些具體的字例來說明這些拆分原則。1.左右型漢字應(yīng)先左后右左右型的漢字所占比例最大，具體例子如，由—>郵由阝，鈾—>鈾钅由，扭—>扭扌丑，濃—>濃氵農(nóng)，輸—>輸車俞，陪—>陪阝二…等。這兒‘陪’字的‘組字詞組’中的‘二’就是因為國際二級字庫中沒有此字，它也不是偏旁部首的緣故。2.上下型漢字應(yīng)先上后下上下型的漢字也不少，比如，變—>變亦又，罵—>罵口馬，畢—>畢比十，晉—>晉亞日。注意，這兒‘罵’‘的組字詞組’中，一個‘口’代替了兩個口，這是我們?yōu)榱藴p少‘倆’字出現(xiàn)在組字詞組中的次數(shù)而作的特殊規(guī)定，又如，磊—>磊石石。另外，對于那些在結(jié)構(gòu)上是‘三行式’，或‘三列式’的漢字，如‘寨’，‘緲’等，則在一拆為二時就有兩種拆法。此時我們應(yīng)該遵循，‘獨立漢字優(yōu)先’和‘常用漢字優(yōu)先’的原則。比如，‘寨’字可拆為‘宀+二’，也可拆為‘二+木’。因為第二處拆法的‘木’字是個獨立漢字，而不僅僅是一個偏旁部首。因此，根據(jù)獨立漢字優(yōu)先的原則，‘寨’字應(yīng)拆為‘二+木’。3.對角型漢字先上左，后下右。一般也把角型漢字看成是上下型。如果還要細分的話，對角型漢字包括很多種類。如邊、疤、彪，石，栽…等。但不論什么情況，只要是組成漢字的二個偏旁字分別占據(jù)了方框的二個對角，那么它就是對角型漢字了。對角型漢字的組字詞組的前后次序也是很容易確定的。根據(jù)對角型漢字的定義，我們知道，組成對角型漢字的二個偏旁字中，一個偏旁字占據(jù)了整個漢字方框的三個角，而另一個偏旁字只占據(jù)了一個角，顯然，占據(jù)了三個角的那個偏旁字應(yīng)在前，占據(jù)一個角的那個偏旁字應(yīng)在后。雖然這個規(guī)定是十分自然而又正確的，但它和我們的習(xí)慣書寫順序卻并不是絕對一致的。如，‘邊’的組字詞應(yīng)該是‘邊辶力’而不是‘邊力辶’。4.內(nèi)外型漢字應(yīng)先外后內(nèi)內(nèi)外型的漢字如，國—>國口玉，閉—>閉門才，鳳—>鳳幾又，裹—>裹衣果，衍—>衍行氵。歸納為內(nèi)外形漢字的要點是呈四面包圍或三面包圍的字型，以及在一個漢字的中間或兩個相同的漢字中間夾入某個字根。較特殊的情況是呈二面半包圍的部首‘勹’，我們稱之為‘包字頭’，一般將它們歸納為對角形字的部首。如，匍—>匍勹甫。當(dāng)然，在‘包’字中它是作為上下形的，因為它只占據(jù)了整個字的上半部分的二個角。另外，對于那些如‘班，辯，弼’等，在兩個相同字根中夾著一個字根的情況，我們也都將它們歸納為內(nèi)外形漢字，并將這兩個相同的字根用一個來代替。如，辮—>辮辛纟等。5.附著型漢字應(yīng)先大后小對于那些由一個主干字根再附上點或?qū)ΨQ的小部件而組成的漢字，則一律稱為附著型漢字。要注意的是，先大后小的原則和書寫的先后次序有時并不統(tǒng)一。比如‘斗’字的組字詞是‘斗十冫’而不是‘斗冫十’。當(dāng)然，一般情況下它們是一致的。如，乘—>乘禾北，玉—>玉王＇，犬—>犬大＇。二、獨體字的拆分方法對于那些混然一體，不存在自然分割空隙的漢字，我們稱之為‘獨體字’。擴展拼音碼把獨體字又分為二類交叉型，粘連型。要注意的是，在我們這個系統(tǒng)里，作為具有‘音，形，義’三個要素的獨立漢字，都被認為是可以一拆為二的。當(dāng)然這是人為的規(guī)定，目的是為了方便輸入，因此在拆分獨體字時應(yīng)盡量將其拆分為兩個能獨立成字的漢字或通用字根。1.單筆劃漢字‘一’和‘乙’的拆分方法對于‘一’，我們規(guī)定它的組字詞組為‘一一一’。也即‘一’的輸入編碼可以是‘YIHH’，值得提起的是，我們規(guī)定所有的偏旁部首的組字詞組是’..獨體’。對于另一個單筆劃漢字‘乙’，則規(guī)定它是由‘折’和‘鉤’粘連而成的。也即在輸入‘乙’字時，其輸入編碼可以是‘YIZG’。2.交叉型獨體字的拆分方法交叉型獨體字一般按先大后小的原則拆分為‘組字詞組’，如，子—>子了一，秉—>秉禾彐，等。3.粘連型獨體字的拆分方法粘連型漢字拆分出來的兩個偏旁漢字，哪個在前，哪個在后，可參照上面合體字的四個原則，如粘連型獨體字，廠—>廠一ノ(上下)，人—>人ノ捺(左右)，日—>日口一(先外后內(nèi))，等。這兒必須說明的是，我們所指的獨立漢字是以國標二極字庫為標準的。有許多一拆為二而得到的字根作為獨立漢字，在大字典里是查得到的，但因為沒有收入國標二級字庫，故當(dāng)它們出現(xiàn)在‘組字詞組’里時只能以LENG來代替了。本發(fā)明提出的擴展編碼計算機漢字輸入方法，編碼設(shè)計直觀合理，方法簡便，易學(xué)易懂，而且能輸入不認識或讀音不準的漢字，重碼率極低，便于盲打，能夠提高漢字輸入速度。權(quán)利要求1.一種擴展拼音碼計算機漢字輸入方法，單個漢字按該字的聲母、韻母、字型、音調(diào)的次序編碼輸入，其特征在于(1)聲母碼是必須碼，在鍵盤上輸入對應(yīng)的聲母字母，其中——不知讀音的漢字用萬能聲母“/”表示，對應(yīng)于鍵盤上的“/”鍵。——零聲母A、E、O開頭的漢字，前面加偽聲母V?！砩嘁袈暷竤h、ch、zh可省去H。(2)韻母碼，在鍵盤上輸入相應(yīng)的韻母字母，其中后鼻音韻母可省略g。(3)字型碼，用鍵盤上0-9個數(shù)字表示，數(shù)字與字型的對應(yīng)關(guān)系為</tables>其中，附著型、交叉型、粘連型、聚合型均可作為獨體型字用數(shù)碼5表示。(4)音調(diào)碼，采用鍵盤上的“—”、“＝”、“＇”、“＼”4個符號鍵分別表示漢字的4個聲調(diào)陰平、陽平、上聲、去聲。2.根據(jù)權(quán)利要求1所述的擴展拼音碼計算機漢字輸入方法，其特征在于將一個漢字分為包括偏旁在內(nèi)的二個部分，連同該漢字本身組成“組字詞組”，其排列順序為一分為二的兩個部分按先左后右，先上后下，先外后內(nèi)，先大后小的次序排列在原漢字的后面，然后依次編碼輸入。3.根據(jù)權(quán)利要求1或2所述的擴展拼音碼計算機漢字輸入方法，其特征在于上述的韻母碼、字型碼、聲調(diào)碼省略一種或幾種，組成簡拼。4.根據(jù)權(quán)利要求3所述的擴展拼音碼計算機漢字輸入方法，其特征在于輸入系統(tǒng)中設(shè)置有常用詞詞庫。5.根據(jù)權(quán)利要求3所述的擴展拼音碼計算機漢字輸入方法，其特征在于對于漢字輸入系統(tǒng)中非常用詞，按單個漢字編碼方法逐個輸入，即將該非常用詞定義為常用詞，記錄在系統(tǒng)的動態(tài)詞組表里，以后，輸入該詞組就只要按一個漢字輸入一個聲母的最簡短的編碼法來輸入該詞組。全文摘要本發(fā)明是一種以擴展拼音碼為基礎(chǔ)的計算機漢字輸入方法。其中單個漢字按該字的聲、韻、型、調(diào)的次序編碼輸入，聲母碼是必須碼，不認識的漢字可用萬能聲母碼表示。字型碼用0-9的數(shù)字表示，對應(yīng)于10種字型，音調(diào)碼用4個特殊鍵表示。還可將漢字分成二個部分，連同該字組成“組字詞組”，然后對該詞組依次編碼輸入。上述編碼可以省略韻、型、調(diào)的一種或幾種，組成簡拼。也可以定義常用詞組。本發(fā)明編碼設(shè)計合理，輸入方法簡便，易學(xué)易懂，而且重碼率極低，便于盲打，提高漢字輸入速度。文檔編號G06F3/023GK1153942SQ96116240公開日1997年7月9日申請日期1996年1月30日優(yōu)先權(quán)日1996年1月30日發(fā)明者湯南華申請人:湯南華

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：湯南華
技術(shù)所有人：湯南華
我是此專利的發(fā)明人

上一篇：漢字輸入法的制作方法
上一篇：名優(yōu)商品柒碼識別保護方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

不是漢字輸入碼的是相關(guān)技術(shù)

自然碼漢字輸入系統(tǒng)相關(guān)技術(shù)

漢字輸入編碼相關(guān)技術(shù)

漢字輸入編碼方法相關(guān)技術(shù)

復(fù)制擴展僅計算機相關(guān)技術(shù)

計算機文件擴展名相關(guān)技術(shù)

計算機擴展名相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

擴展拼音碼計算機漢字輸入方法