專利名稱:四元音漢字編碼輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及漢字編碼的一種新輸入方法。具體地說是一種將漢字視為由四種基本單元所組成,利用這四種組成漢字基本單元讀音的第一個(gè)字母和規(guī)定字母所構(gòu)成的極其易學(xué)、易掌握的漢字編碼輸入法。應(yīng)用于電子計(jì)算機(jī)漢字輸入,解決專業(yè)和非專業(yè)人員計(jì)算機(jī)漢字快速輸入的問題。
背景技術(shù):
隨著科學(xué)技術(shù)的飛速發(fā)展,計(jì)算機(jī)的應(yīng)用日益普及,能否熟練掌握計(jì)算機(jī)漢字的輸入是人們關(guān)注的問題?,F(xiàn)在各種漢字編碼及其輸入法超過數(shù)百種,真正使用的編碼及其輸入法不過十余種,這些編碼及其輸入法無非為三種基本方式1、音碼,如各種拼音碼輸入法;2、形碼,如五筆字形輸入法;3、音形或形音相結(jié)合的編碼,目前還沒有一種音形或形音的輸入法普及應(yīng)用。
在音碼和形碼這兩大類的漢字編碼中,各種編碼都有各自的優(yōu)缺點(diǎn)。音碼的缺點(diǎn)除了重碼多,影響輸入效率這一公認(rèn)的缺點(diǎn)外,自身有難以克服的問題,就是對使用者的漢字認(rèn)讀要求很高,讀不準(zhǔn)的字很難輸入,不認(rèn)識的字根本就不能輸入。音碼的優(yōu)點(diǎn)是會認(rèn)的字就會輸入,音碼一般分有兩類,一類是全拼,即需輸入某漢字的全部拼音字母,一類是雙拼,雙拼是將拼音的聲母和韻母進(jìn)行了一定的排列,這種輸入法也需要一定的記憶。鑒于音碼的這些特點(diǎn),它不適合拼音水平有限和經(jīng)常輸入不認(rèn)識的字的人員使用。
形碼的優(yōu)點(diǎn)是使用者在輸入漢字時(shí)不管是否認(rèn)識需輸入的字,只要看字形按相應(yīng)的規(guī)則就能輸入。以五筆字形為例,五筆字形是人們公認(rèn)的較成熟且已廣泛使用的一種輸入法,這種輸入法將組成漢字的基本結(jié)構(gòu)稱為“字根”,對每個(gè)“字根”都人為地命名了相對應(yīng)的英語字母,由此而構(gòu)成五筆字形的編碼。五筆字形的“字根”中,許多是發(fā)明者自己分類創(chuàng)立的,學(xué)習(xí)五筆字形先要學(xué)會如何以字根拆字,而且要記住所有字根的相對應(yīng)的英語字母,對有些字又還有識別碼,這些東西對需要學(xué)習(xí)輸入法的人都是要學(xué)習(xí)和掌握的,這就導(dǎo)致了五筆字形輸入法難學(xué)和難掌握。
發(fā)明內(nèi)容
本發(fā)明的目的是為了克服音碼重碼多、讀不準(zhǔn)的字很難輸入、不認(rèn)識的字不能輸入和形碼如五筆字形輸入法難學(xué)、難掌握的缺點(diǎn),提供一種易學(xué)、易掌握、重碼率低的四元音漢字編碼輸入法。
本發(fā)明的解決方案
一種四元音漢字編碼輸入法,將漢字讀音中第一個(gè)字母,包括聲母和韻母分布在對應(yīng)的二十二個(gè)英文字母的鍵位上,沒有對應(yīng)的字母o、i、u、v的鍵位上安排了特殊的用途,本輸入法是以基本筆劃、偏旁部首、簡單字和“讀不出的組合”作為拆字的四種基本單元,其中基本筆劃、偏旁部首和簡單字以本身讀音的第一個(gè)字母輸入,“讀不出的組合”以字母“a”輸入,每個(gè)單字或詞組的最長碼為四碼,單字以漢字書寫順序按基本單元拆字,每一個(gè)單元為一碼,超過四碼的字以最后一個(gè)單元為第四碼,并包含了一些常用的特殊符號。
拆字的四個(gè)基本單元中的基本筆劃、偏旁部首、簡單字是人們所熟悉的,“讀不出的組合”是一個(gè)新概念?!白x不出的組合”有三種情況一是一些常見而又沒有統(tǒng)一名稱的組合,例如“主at”、“負(fù)ab”等字的上部,“家bha”“哀aka”“去ta”等字的下部等;二是結(jié)構(gòu)復(fù)雜又不好拆的組合,如“鬯akpg”“虎aqj”的上部、“髫appk”的上左部;三是比較少用的偏旁部首,一般人讀不出來,如“貂”的左邊部分和“燕”字的上部等情況。
四元音漢字輸入法使用時(shí)很簡單,只需按所拆出的基本單元讀音的第一個(gè)字母或韻母輸入即可。因?yàn)橹灰獙h字有最基本知識的人對前三種基本單元都會讀,對于“讀不出的組合”以字母“a”輸入,所以學(xué)習(xí)四元音漢字輸入法沒有多少需要記憶的東西,是一種易學(xué)易掌握的漢字輸入法。
從中文讀音特點(diǎn)來看,漢字讀音的第一個(gè)字母不包含i、o、u、v這四個(gè)英文字母。為了充分發(fā)揮鍵盤上26個(gè)字母的作用,將i、o、u、v給予特殊定義,以減少重碼和提高輸入效率。
利用i、o、u以減少重碼。以i代替冫、氵和水字中水shui的“s”;以o代替扌和手字中手shou的“s”;以u代替木字旁和木字中木mu的“m”。
將v用于重碼選字,提高輸入效率。本發(fā)明對重碼的選字設(shè)計(jì)了三種處理方式,出現(xiàn)重碼現(xiàn)象時(shí),最基本的方法是用數(shù)字鍵輸入,即出現(xiàn)重碼時(shí),通過輸入漢字前的數(shù)字。為提高輸入速度,第二種是將“空格鍵”和字母“v”用于重碼的選字,第三種方式是利用重碼漢字的讀音聲母選字,具體方法如下1、兩字重碼按空格鍵輸入左邊的字,加“v”選擇右邊的字。例如在輸入字母“hhh”后,出現(xiàn)“1.三2.焱”,此時(shí)按空格鍵輸入“三”,按“v”或“y”選擇“焱”。
2、多字重碼按空格鍵輸入左邊的字,加中間字讀音的第一個(gè)字母選擇中間字,加“v”選擇最右邊的字。例如在輸入字母“hh”后,“l(fā)”“q”分別選擇“滅”“炎”“爐”“秋”,按“v”選擇“秋”。
如達(dá)到四碼時(shí)出現(xiàn)重碼,或少于四碼但不屬常見的漢字,只能用數(shù)字鍵輸入。
本輸入法重碼排序方式是先單字后詞組,因而加“v”輸入最右邊的字是指最右邊的單字,不包括詞組。
本發(fā)明同時(shí)支持詞組的輸入,詞組的輸入可大大提高漢字的輸入速度,詞組的編碼是在單字編碼的基礎(chǔ)上按一定規(guī)則進(jìn)行編碼,其規(guī)則為雙字詞組按每個(gè)漢字的前二個(gè)碼輸入,如“中ks國kwd”為kskw;三字詞組按第一、二個(gè)漢字的第一碼加上第三個(gè)漢字的前兩碼輸入,如“專ezd利hd法ita”為ehit;四字詞組按每個(gè)漢字的第一碼輸入,如“社st會ry主at義dpn”為srad;四字以上的詞組按前三個(gè)漢字和最后一個(gè)漢字的第一碼輸入,如“中ks華rpgs人r民共和國kwd”為krrk。
詞組編碼時(shí),如屬一級碼的漢字,使用一級碼進(jìn)行詞組編碼,如“學(xué)”字是一級碼,但也有正常碼xblh,詞組“學(xué)習(xí)”為xgd而不是xbgd;如一字有多碼時(shí),以漢字編碼字母排序靠前的編碼進(jìn)行編碼,如“字”的編碼有blh和bz兩種,詞組“漢字”為iybl而不是iybz。
在漢字輸入中經(jīng)常需要用到一些特殊符號,所有的輸入法都沒有將其納入到輸入法中,本發(fā)明包括了一部分特殊符號,因?yàn)楸揪幋a中不可能出現(xiàn)兩個(gè)字母“v”以上編碼組合,本發(fā)明設(shè)計(jì)通過輸入“vvv+其他單字母”,如vvva構(gòu)成各種特殊符號的編碼,通過這些編碼進(jìn)行各種標(biāo)點(diǎn)符號,單位符號、數(shù)字序號等特殊符號。
由于本發(fā)明是以形拆字,解決了對不識的字無法輸入的問題,同時(shí)具有重碼率低的特點(diǎn);又由于拆字的基本單元是人們所熟悉的,而不是生造的,既會認(rèn)又會讀,構(gòu)成了易拆易輸入的特點(diǎn),這就解決了一些單純以漢字字形編碼及其輸入法由于記憶或想象的東西多而難學(xué)的問題,成為專業(yè)和非專業(yè)人員掌握計(jì)算機(jī)漢字輸入的最好方法。
具體實(shí)施例方式
在本發(fā)明的漢字編碼的基礎(chǔ)上開發(fā)出“四元音輸入法”軟件,使用者安裝該軟件后便可實(shí)現(xiàn)漢字輸入。
四元音漢字編碼輸入法的每個(gè)單字最長碼為四碼,以漢字書寫順序按基本單元拆字,每一個(gè)單元為一碼,超過四碼的字以最后一個(gè)單元為第四碼。
四元音輸入法屬于形音類,首先第一步是拆字,拆字規(guī)則為字繁從整,字簡從零,拆后留整,先整后零。整是指的“偏旁部首”、“簡單字”和“讀不出的組合”,零指的“基本筆劃”?!白址睆恼笔侵缸煮w繁的則從整體的簡單字著眼,如“繁”字為“每mei文wen幺yao小xiao”,即mwyx?!白趾啅牧恪笔钦f字簡單的按筆劃來拆,如“工”字為“橫heng豎shu橫heng”,即hsh,對“乙”這種一筆的特殊字,按hzg輸入,即“橫heng折zhe鉤gou”?!安鸷罅粽笔侵府?dāng)有幾種拆字可能時(shí),采用拆了該碼后,剩余部分為整的為優(yōu)選方案,如“方”是dw“點(diǎn)dian萬wan”而不是apg“讀不出的組合a撇pie鉤gou”?!跋日罅恪笔侵改苋≌麆t取整,不能取整則取零,如“零”為yrdd“雨yu人ren點(diǎn)dian點(diǎn)dian”。
由于每個(gè)人對字的審視角度不同,初使用時(shí)可能會出現(xiàn)拆字不準(zhǔn)的問題,但使用多了就能熟能生巧,例如“主”是at“讀不出的組合a土tu”而不是dw“點(diǎn)dian王wang”;“維”是nrdh“紐絲旁niu人ren點(diǎn)dian橫heng”而不是jrah“鉸絲旁jiao人ren點(diǎn)讀不出的組合a橫heng”。
在拆字中,本發(fā)明按模糊方式對編碼進(jìn)行設(shè)計(jì),如“日”與“曰”均按“日”處理;“冫氵”都為水i;“亻彳”都為人“ren”;“宀冖”都為寶蓋頭“bao”;“文、反文及與文相似的夂”都為文“wen”等等。
有些常用字在不造成過多重碼時(shí),編排了幾種拆法,因而有幾種輸入碼,在輸入由這些字所成的詞組時(shí),詞組的編碼是按該字多種編碼中編碼排序靠前的字所組成。
四元音編碼及其輸入法圓滿地解決了各種形碼類輸入法難學(xué)的問題。下面以“輸”字為例,說明本發(fā)明與五筆字形的區(qū)別。當(dāng)初學(xué)者學(xué)習(xí)五筆字形輸入“輸”這個(gè)漢字時(shí),首先是拆字,然后靠記憶輸入每個(gè)字根相對應(yīng)的英語字母,其過程是,第一個(gè)字根是“車”,“車”的代碼是l,第二個(gè)字根是“人”,“人”的代碼是w,第三個(gè)字根是“橫”,“橫”的代碼是g,最后一個(gè)是“立刀”,“立刀”的代碼是j,所以“輸”字的編碼為lwgj。本發(fā)明在輸入“輸”字時(shí),用四個(gè)基本單元的方式拆字,同樣是上述的四個(gè)部分,但根本就不需要記憶什么特殊的東西,只需根據(jù)這四個(gè)基本單元讀音的聲母輸入,而這些基本單元都會讀,即“車che”,“人ren”,“橫heng”,“立刀dao”,所以“輸”的編碼為crhd。相比之下,本發(fā)明利用“四種基本單元”拆字,用其聲母輸入所構(gòu)成的“四元音”漢字編碼和輸入法,在學(xué)習(xí)和使用時(shí),少了一個(gè)想代碼的過程,構(gòu)成了本發(fā)明易學(xué)易掌握的特點(diǎn)。
本發(fā)明對鍵盤上的26個(gè)字母都設(shè)定了一級碼,每個(gè)字母的一級碼和常用的基本單元情況見下表。
鍵盤上26個(gè)英語字母的一級碼及常用單元對應(yīng)表
注帶*號的字母為有特殊定義的字母
權(quán)利要求
1.一種四元音漢字編碼輸入法,將漢字讀音中第一個(gè)字母,包括聲母或韻母分布在對應(yīng)的二十二個(gè)英文字母的鍵位上,沒有對應(yīng)的字母o、i、u、v的鍵位上安排了特殊的用途,本輸入法是以基本筆劃、偏旁部首、簡單字和“讀不出的組合”作為拆字的四種基本單元,其中基本筆劃、偏旁部首和簡單字以本身讀音的第一個(gè)字母輸入,“讀不出的組合”以字母“a”輸入,每個(gè)單字或詞組的最長碼為四碼,單字以漢字書寫順序按基本單元拆字,每一個(gè)單元為一碼,超過四碼的字以最后一個(gè)單元為第四碼,并包含了一些常用的特殊符號。
2.根據(jù)權(quán)利要求1所述輸入法,其特征在于“讀不出的組合”有三種情況一是一些常見而又沒有統(tǒng)一名稱的組合;二是結(jié)構(gòu)復(fù)雜又不好拆的組合;三是比較少用的偏旁部首,一般人讀不出來;都以字母“a”輸入。
3.根據(jù)權(quán)利要求1所述輸入法,其特征在于將i、o、u給予特殊定義,以減少重碼,以i代替冫、氵和水字中水shui的“s”;以o代替扌和手字中手shou的“s”;以u代替木字旁和木字中木mu的“m”。
4.根據(jù)權(quán)利要求1所述輸入法,其特征在于對重碼的選字設(shè)計(jì)了三種處理方式(1)用數(shù)字鍵輸入,即出現(xiàn)重碼時(shí),通過輸入漢字前的數(shù)字;(2)將“空格鍵”和字母“v”用于重碼的選字,按空格鍵輸入最左邊的字,加“v”選擇最右邊的單字;(3)是利用重碼漢字讀音的第一個(gè)字母選字。
5.根據(jù)權(quán)利要求1所述輸入法,其特征在于所述輸入法還包括雙字詞組的輸入,詞組的編碼是在單字編碼的基礎(chǔ)上按一定規(guī)則進(jìn)行編碼,按每個(gè)漢字的前二個(gè)碼輸入。
6.根據(jù)權(quán)利要求1所述輸入法,其特征在于所述輸入法還包括三字詞組的輸入,詞組的編碼是在單字編碼的基礎(chǔ)上按一定規(guī)則進(jìn)行編碼,按第一、二個(gè)漢字的第一碼加上第三個(gè)漢字的前兩碼輸入。
7.根據(jù)權(quán)利要求1所述輸入法,其特征在于所述輸入法還包括四字詞組的輸入,詞組的編碼是在單字編碼的基礎(chǔ)上按一定規(guī)則進(jìn)行編碼,按每個(gè)漢字的第一碼輸入。
8.根據(jù)權(quán)利要求1所述輸入法,其特征在于所述輸入法還包括四字以上詞組的輸入,詞組的編碼是在單字編碼的基礎(chǔ)上按一定規(guī)則進(jìn)行編碼,按前三個(gè)漢字和最后一個(gè)漢字的第一碼輸入。
9.根據(jù)權(quán)利要求1所述輸入法,其特征在于本輸入法設(shè)計(jì)通過輸入“vvv+其他單字母”,構(gòu)成各種特殊符號的編碼。
全文摘要
本發(fā)明涉及漢字編碼輸入的一種新方法。本發(fā)明是以基本筆劃、偏旁部首、簡單字和“讀不出的組合”作為拆字的四種基本單元,以前三種基本單元本身讀音的第一個(gè)字母以及“讀不出的組合”的特定字母“a”組合成字或詞的編碼進(jìn)行輸入,是一種將形與音有機(jī)結(jié)合起來的新型漢字編碼輸入法。由于本發(fā)明是以形拆字,解決了對不認(rèn)識的字無法輸入的問題,同時(shí)具有重碼率低的特點(diǎn);又由于拆字的基本單元是人們所熟悉的,而不是生造的,既會認(rèn)又會讀,構(gòu)成了易拆易輸入的特點(diǎn),這就解決了一些單純以漢字字形編碼及其輸入法由于記憶或想象的東西多而難學(xué)的問題,成為專業(yè)和非專業(yè)人員掌握計(jì)算機(jī)漢字輸入的最好方法。
文檔編號G06F3/023GK1379314SQ0211588
公開日2002年11月13日 申請日期2002年5月23日 優(yōu)先權(quán)日2002年5月23日
發(fā)明者李濱江 申請人:李濱江