專利名稱::漢字拼音文字碼輸入法的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種基于聲碼加形碼的中文輸入法,屬于漢字編碼及計算機漢字輸入方法領(lǐng)域。
背景技術(shù):
:目前世界各國所用文字多為拼音文字,作為漢語信息載體的漢字,屬于一種非拼音文字,這使得漢語在走向國際化的過程中,遇到障礙。漢語拼音的普及與推廣很大程度上拉近了漢字與拼音文字的距離。然而,由于漢語拼音只標(biāo)注了漢字的讀音及聲調(diào),而沒有將區(qū)別漢字字形、字意的字符包括在內(nèi),使得人們在區(qū)別讀音、聲調(diào)相同,但意義不同的漢字時,僅僅通過漢語拼音是行不通的。這種現(xiàn)象體現(xiàn)在常見的以漢語拼音為基礎(chǔ)的漢字輸入法中,就是相同讀音漢字重碼率過多的問題。以主流的輸入法為例,不論是智能ABC輸入法、微軟拼音輸入法還是中文全拼、中文雙拼輸入法,在輸入同音字多的音節(jié)的漢字時,需要翻頁,尤其在輸入ji、yi、yu這些同音字最多的幾個音節(jié)的漢字時相當(dāng)不便。CN94117853.6以及CN00119308.2公開了“HLV漢字拼音輸入方法”和“改進(jìn)的HLV漢字拼音輸入方法”。其中HLV漢字拼音輸入方法在漢字的拼音中加入了聲調(diào)代碼,改進(jìn)的HLV漢字拼音輸入法為解決同音節(jié)漢字輸入的重碼問題,在已有的HLV漢字拼音輸入法基礎(chǔ)上增加了一個漢字部首碼。這確實在很大程度上減少了重碼現(xiàn)象,但也存在以下問題首先,聲調(diào)代碼位置的多樣性問題部分漢字的聲調(diào)代碼標(biāo)注在漢語拼音音節(jié)之后,部分漢字的聲調(diào)代碼標(biāo)注在漢語拼音音節(jié)之間。標(biāo)注在漢語拼音音節(jié)之間的聲調(diào)代碼破壞了漢語拼音音節(jié)的連續(xù)性。其次,聲調(diào)代碼鍵種類的多樣性問題對于以不同韻母結(jié)尾的漢字,表示其聲調(diào)代碼的鍵也各不相同,無形中增加了輸入法的復(fù)雜性。
發(fā)明內(nèi)容本發(fā)明的目的是為了在漢語拼音的基礎(chǔ)上,提供一種能進(jìn)一步把漢字轉(zhuǎn)化為具有拼音文字特點的重碼率低的編碼,并以此編碼為基礎(chǔ)提供一種簡單易懂、有利于漢語普及推廣的中文輸入法。本發(fā)明以中華人民共和國推行的《漢語拼音方案》為基礎(chǔ),采用如下技術(shù)方案1,將構(gòu)成漢字字形的最小單位定義為母字根,從中篩選出十一個造字能力最強的母字根作為本發(fā)明所涉及的輸入法使用的母字根,并將其編碼,編碼與鍵盤上各鍵位對應(yīng)位置見附表1。2,將漢字構(gòu)成中出現(xiàn)頻率較多的、造字能力較強的、由若干母字根構(gòu)成的字形單位定義為子字根。從中篩選出二百零四個這樣的子字根作為本發(fā)明所涉及的輸入法使用的子字根,并將其編碼,編碼與鍵盤上各鍵位對應(yīng)位置見附表2。3,使用本輸入法輸入單個漢字時包括以下步驟(1)通過鍵入表示該漢字漢語拼音音節(jié)的鍵,輸入漢字的漢語拼音音節(jié)作為其聲音代碼;(2)通過鍵入表示該漢字聲調(diào)的鍵,在聲音代碼后輸入漢字的聲調(diào)代碼(聲調(diào)為輕聲的漢字省略此步驟);(3)通過鍵入表示該漢字字根的鍵,在聲調(diào)代碼后輸入漢字的字根代碼(母字根代碼或子字根代碼,包含子字根的漢字輸入子字根代碼,不包含子字根的漢字輸入母字根代碼;子字根獨立成字時,在此步驟輸入該子字根的起筆母字根代碼,母字根獨立成字時省略此步驟)。<table>tableseeoriginaldocumentpage5</column></row><table>步驟(3)中,漢字的母字根代碼表示為該母字根的漢語拼音的聲母字母(零聲母的音節(jié)表示為該音節(jié)首字母);子字根代碼表示為構(gòu)成該子字根的起筆母字根代碼+該子字根的漢語拼音的聲母字母(音節(jié)yu表示為yu,音節(jié)er表示為r,其他零聲母的音節(jié)表示為該音節(jié)首字母)。4,字根的確定a)漢字子字根的確定次序i上、下都有子字根的,取上,不取下;左、右都有子字根的,取左,不取右;iii內(nèi)、外都有子字根的,取外,不取內(nèi);iv中坐、左上角都有子字根的,取中坐,不取左上角;b)子字根無從確定時,編碼時取該字起筆母字根。5,特殊音節(jié)漢字的快捷輸入a)輸入下列漢字時,可省略步驟(2)、(3)倆、佛、能、您、暖、森、僧、嗲、耨、咯;b)輸入下列漢字時,可省略步驟(2)及步驟(3)中構(gòu)成該字的子字根的起筆母字根代碼阿、啊、錒、腌;c)輸入下列漢字時,可省略步驟(3)骯、昂、盎。6,兩個字以上(含兩個字)的詞或詞組的快捷輸入a)省略單個字的字根代碼;b)輸入疊音詞時,構(gòu)成該疊音詞的單個漢字的前字省略字根代碼,后字只輸入該字漢語拼音的聲母字母(零聲母的音節(jié)輸入該音節(jié)首字母)。前后字代碼用連字符相連;c)輸入四字成語時省略單個字的字根代碼,且單個字的代碼之間使用連字符“_”相連。7,整句的輸入(1)整句的快捷輸入a)句中出現(xiàn)下列漢字表示方位,輸入該字時省略字根代碼上、下、前、后、左、右、東、西、南、北、里、外、內(nèi)、中、間、旁;b)句中出現(xiàn)下列單字基數(shù)詞,輸入該字時省略字根代碼一、二、三、四、五、六、七、八、九、零、百、千、萬、億、半;C)句中出現(xiàn)單字的量詞、副詞、嘆詞、介詞、連詞、助詞、語氣詞、擬聲詞時省略字根代碼。(2)輸入整句時關(guān)于大寫字母的規(guī)定d)“我”字在句中任何位置的代碼都為“W0”,即分別鍵入大寫字母“W”與“0”;e)句中出現(xiàn)涉及國家、民族、語言的詞匯時,構(gòu)成該詞的每個單字的編碼的首字母大寫;f)句中出現(xiàn)涉及姓名的詞匯時,構(gòu)成姓和名的每個單字的編碼的首字母大寫;g)句中出現(xiàn)涉及職務(wù)、職稱等頭銜的詞匯時,構(gòu)成該頭銜的每個單字的編碼的首字母大寫;h)句中出現(xiàn)涉及地理名稱的詞匯時,構(gòu)成該地理名稱的每個單字的編碼的首字母大寫;i)句中出現(xiàn)涉及學(xué)校、團(tuán)體、組織名稱的詞匯時,構(gòu)成該名稱的每個單字的編碼的首寫字母大寫;j)句中出現(xiàn)涉及報刊、雜志及文學(xué)作品名稱的詞匯時,構(gòu)成該名稱的每個單字的編碼的首字母大寫。8,本輸入法在輸入漢字聲音代碼的過程中用“l(fā)yU”、“nyU”分別表示音節(jié)“111”、“nil”。具體實施例方式本發(fā)明針對漢字拼音輸入法中由于漢字同音字過多而產(chǎn)生的重碼率高的問題,采用一種聲音代碼+聲調(diào)代碼+字根代碼的方式,使絕大多數(shù)漢字能在音、調(diào)、形上有相應(yīng)的具備拼音文字特點的西文字符與之一一對應(yīng)。使用本發(fā)明的輸入法不僅方便漢字的輸入,更有利于漢語教學(xué)、漢語推廣,是在漢語教育領(lǐng)域,尤其在漢語國際教育領(lǐng)域的創(chuàng)造性成果。本發(fā)明的具體實施方式分為以下幾個方面1,漢字單字的輸入使用本輸入法輸入單個漢字時包括以下步驟(1)通過鍵入表示該漢字漢語拼音音節(jié)的鍵,輸入漢字的漢語拼音音節(jié)作為其聲音代碼;(2)通過鍵入表示該漢字聲調(diào)的鍵,在聲音代碼后輸入漢字的聲調(diào)代碼(聲調(diào)為輕聲的漢字省略此步驟);(3)通過鍵入表示該漢字字根的鍵,在聲調(diào)代碼后輸入漢字的字根代碼(母字根代碼或子字根代碼。包含子字根的漢字輸入子字根代碼,不包含子字根的漢字輸入起筆母字根代碼;子字根獨立成字時,在此步驟輸入該子字根的起筆母字根代碼,母字根獨立成字時省略此步驟)。例如壩(bdO字編碼為baqyt,其中ba為該字的聲音代碼,q為聲調(diào)代碼,yt為字根代碼[子字根“土”的代碼,即起筆母字根為“一”(y)的子字根“土”(t)];七(ql)字編碼為qipy,其中qi為該字的聲音代碼,P為聲調(diào)代碼,y為字根代碼(起筆母字根“一”的代碼);牛(ι)字編碼為niuyp,其中niu為該字的聲音代碼,y為聲調(diào)代碼,ρ字根代碼(“?!睘樽幼指毩⒊勺謺r字根代碼為該字的起筆母字根“)”的代碼P);的(de)字編碼為cbpb,其中de為該字的聲音代碼,pb為字根代碼[子字根“白”的代碼,即起筆母字根為“i,,(P)的子字根“白”(b)];—(yi)字編碼為yip,其中yi為該字的聲音代碼,P為聲調(diào)代碼。(“一”為母字根,獨立成字時省略字根代碼)。關(guān)于字根的確定遵循下列原則a)漢字子字根的確定次序i上、下都有子字根的,取上,不取下;例如巖,取山,不取石;ii左、右都有子字根的,取左,不取右;例如好,取女,不取子;iii內(nèi)、外都有子字根的,取外,不取內(nèi);例如因,取口,不取大;iv中坐、左上角都有子字根的,取中坐,不取左上角;例如坐,取土,不取人;b)子字根無從確定時,編碼時取該字起筆母字根;例如習(xí),??;部分音節(jié)對應(yīng)的漢字非常少,有的音節(jié)只對應(yīng)一個常見的漢字,在輸入這些音節(jié)的漢字時,可省略步驟(2)、(3),達(dá)到快捷輸入的目的。例如佛(f0)字編碼為foypr,其中fo為該字的聲音代碼,y為聲調(diào)代碼,pr為字根代碼。由于漢語拼音音節(jié)fo下對應(yīng)的常見漢字只有“佛”字,因此輸入該字時直接輸入“fo”即可。其他類似漢字包括倆、能、您、暖、森、僧、嗲、耨、咯。部分漢字音節(jié)相同、聲調(diào)相同,但含有的子字根不同,在輸入這些漢字時,可省略步驟(2)及步驟(3)中構(gòu)成該字的子字根的起筆母字根代碼,達(dá)到快捷輸入的目的。例如阿(α)、啊(α)、錒(α)、腌(α)四字編碼分別為apjf、apgk、appj、appr,輸入這些漢字時,分別鍵入af、ak、aj、ar即可;部分音節(jié)某聲調(diào)下只對應(yīng)一個漢字,在輸入這些漢字時,可省略步驟(3),以達(dá)到快捷輸入的目的。例如音節(jié)ang各聲調(diào)下對應(yīng)漢字骯(0ng)、昂(ang)、盎(tog),這三字的編碼分另1J》angppr>angygr>angqgm,^ASiSiXfWAangp、angy、angq艮口胃02,兩個字以上(含兩個字)的詞或詞組的快捷輸入輸入兩個字以上(含兩個字)的詞或詞組時,在單字輸入的基礎(chǔ)上,遵循下列原則可以達(dá)到快捷輸入的目的a)省略單個字的字根代碼;例如“卡車”,直接輸入“kasch印”即可,而不必分別輸入“卡”字和“車”字各自完整的單字編碼。b)輸入疊音詞時,構(gòu)成該疊音詞的單個漢字的前字省略字根代碼,后字只輸入該字漢語拼音的聲母字母(零聲母的音節(jié)輸入該音節(jié)首字母),前后字代碼用連字符相連;例如“爸爸”,輸入“baq-b”;“爺爺”,輸入“yey-y,,;c)輸入四字成語時省略單個字的字根代碼,且單個字的代碼之間使用連字符“_”相連;例如“龍飛鳳舞”,輸入“l(fā)ongy-feip-fengq-wus”。3,整句的輸入(1)整句的快捷輸入輸入整句時,在單字輸入及兩個字以上(含兩個字)的詞或詞組的快捷輸入基礎(chǔ)上,遵循下列原則可達(dá)到快捷輸入的目的a)句中出現(xiàn)下列漢字表示方位,輸入該字時省略字根代碼上、下、前、后、左、右、東、西、南、北、里、外、內(nèi)、中、間、旁;b)句中出現(xiàn)下列單字基數(shù)詞,輸入該字時省略字根代碼一、二、三、四、五、六、七、八、九、零、百、千、萬、億、半;c)句中出現(xiàn)單字的量詞、副詞、嘆詞、介詞、連詞、助詞、語氣詞、擬聲詞時省略字根代碼;例如“操場上,三個學(xué)生在奔跑。”鍵入“caopchangsshangq,sanpgeqxueyshengpzaiqbenppaos.”此句中“上”、“三”、“個”、“在”分別滿足上述a)、b)、c)中快捷輸入的條件,在輸入本句時均可省略字根代碼。(2)輸入整句時關(guān)于大寫字母的規(guī)定d)“我”字在句中任何位置的代碼都為“W0”,即分別鍵入大寫字母“W”與“0”;e)句中出現(xiàn)涉及國家、民族、語言的詞匯時,構(gòu)成該詞的每個單字的編碼的首字母大寫;例如“中國”,鍵入“ZhongpGuoy”;“英語”,鍵入“YingpYus,,;f)句中出現(xiàn)涉及姓名的詞匯時,構(gòu)成姓和名的每個單字的編碼的首字母大寫;例如“李明”,鍵入“LisMingy”;“王小三”,鍵入“WangyXiaosSanp”;g)句中出現(xiàn)涉及職務(wù)、職稱等頭銜的詞匯時,構(gòu)成該頭銜的每個單字的編碼的首字母大寫;例如“張博士”,鍵入“ZhangpBoyShiq”;“溫總理”,鍵入“WenpZongsLis,,;h)句中出現(xiàn)涉及地理名稱的詞匯時,構(gòu)成該地理名稱的每個單字的編碼的首字母大寫;例如“華盛頓”,鍵入“HuayShengqDunq”;“亞洲”,鍵入“YaqZhoup,,;i)句中出現(xiàn)涉及學(xué)校、團(tuán)體、組織名稱的詞匯時,構(gòu)成該名稱的每個單字的編碼的首寫字母大寫。例如“首都師范大學(xué)”,鍵入“ShousDupShipFanqDaqXuey”;“中國文字改革委員會,,,鍵入“ZhongpGuoyffenyZiqGaisGeyffeisYuanyHuiq“;j)句中出現(xiàn)涉及報刊、雜志及文學(xué)作品名稱的詞匯時,構(gòu)成該名稱的每個單字的編碼的首字母大寫;例如“人民日報”,鍵入“RenyMinyRiqBaoq”;“新聞周刊”,鍵入"XinpWenyZhoupKanp,,。4,本輸入法在輸入漢字聲音代碼的過程中用“l(fā)yU”、“nyU”分別表示音節(jié)“111”、“nil”;例如旅(Ι)字編碼為Iyuszhf;女(η)字編碼為nyus。附表1<table>tableseeoriginaldocumentpage9</column></row><table>注釋一,《説文》“一,唯初太始,道立于一,造分天地,化成萬物。弍,古文一?!倍斡癫米ⅰ耙恢戊读鶗鵀橹甘??!毙鞛{“造字之初,先有數(shù)而后有文。一二三三,書如其數(shù),是為指事,亦為象事也?!卑垂盼淖忠恢了臋M劃表示一至四,是原始計數(shù)符號。yi《廣韻》於悉切,入質(zhì)影。質(zhì)部?!稘h語大字典》第一頁。丨,gun《廣韻》古本切,上混見。諄部。上下相通也?!墩h文·[部》“丨,上下通也。”《廣韻混韻》“[,上下相通。”《漢語大字典》第二十八頁。J,jue《廣韻》其月切,入月羣。月部。倒須鈎?!墩h文·J部》“j,鈎逆者謂之J。”王筠句讀“謂之逆者,蓋倒鬚鈎也,釣魚用之?!薄稘h語大字典》第二十八頁。(姹),jue《廣韻》居月切,入月見。月部。用作標(biāo)記的符號。《説文姹部》“煉,鈎識也?!薄稘h語大字典》四十八頁。J,pie《廣韻》普蔑切,入屑謗。月部?!墩h文·j部》j,右戻也。象左引之形?!倍斡癫米ⅰ坝覒?,自右而曲於左也。故其字象自左方引之。j音義略同擎,書家八法謂之掠。”《漢語大字典》第三十一頁。、,zhu《廣韻》知庾切,上麇知。侯部。同“主”?!读鶗F·麇韻》“、,古主字,鐙中火主乙,《説文》,“乙,象春艸木冤曲而出,陰氣尚彊,其出乙乙也。與I同意,乙承甲,象人頸?!鞍匆以诩祝鹞闹杏脼樘旄傻牡诙?。yi《廣韻》於筆切,入質(zhì)影。質(zhì)部。《漢語大字典》第四十七頁。坨,《説文》坨,匿也。象遲曲隱蔽形。讀若隱。yin《廣韻》於謹(jǐn)切,上隱影。諄部?!稘h語大字典》第四十七頁。謫,quto《廣韻》姑泫切,上銑見。元部。同“畎”。田間小溝?!墩h文謫》“謫,水小流也。畎,篆文。《漢語大字典》第四十七頁。憐,gdng同“肱”。《説文又部》:“憐,古文玄?!倍斡癫米ⅰ跋笄??!薄都嵉琼崱贰靶抛鲬z。或作肱?!薄稘h語大字典》第四十八頁。,gun《集韻》古本切,上混見。鈎的倒尖?!都崱贰?,鈎逆鋩?!薄稘h語大字典》第四十八頁??荆铅耐澳恕?。《玉篇乃部》“烤”,“乃”的古文?!稘h語大字典》第四十九頁。附表2<table>tableseeoriginaldocumentpage10</column></row><table><table>tableseeoriginaldocumentpage11</column></row><table>[0019]<table>tableseeoriginaldocumentpage12</column></row><table><table>tableseeoriginaldocumentpage13</column></row><table><table>tableseeoriginaldocumentpage14</column></row><table><table>tableseeoriginaldocumentpage15</column></row><table><table>tableseeoriginaldocumentpage16</column></row><table><table>tableseeoriginaldocumentpage17</column></row><table><table>tableseeoriginaldocumentpage18</column></row><table><table>tableseeoriginaldocumentpage19</column></row><table>權(quán)利要求一種基于聲碼加形碼的中文輸入法,其特征在于A,使用該輸入法輸入單個漢字時包括以下步驟(1)通過鍵入表示該漢字漢語拼音音節(jié)的鍵,輸入漢字的漢語拼音音節(jié)作為其聲音代碼;(2)通過鍵入表示該漢字聲調(diào)的鍵,在聲音代碼后輸入漢字的聲調(diào)代碼(聲調(diào)為輕聲的漢字省略此步驟);(3)通過鍵入表示該漢字字根的鍵,在聲調(diào)代碼后輸入漢字的字根代碼(母字根代碼或子字根代碼,包含子字根的漢字輸入子字根代碼,不包含子字根的漢字輸入起筆母字根代碼;子字根獨立成字時,在此步驟輸入該子字根的代碼,母字根獨立成字時省略此步驟)。B,步驟(2)中,漢字的聲調(diào)代碼與西文鍵盤對應(yīng)關(guān)系為聲調(diào)陰平陽平上聲去聲漢語拼音yīnpíngyángpíngshǎngshēngqùshēng聲調(diào)代碼對應(yīng)鍵位pysq步驟(3)中,漢字的母字根代碼表示為該母字根的漢語拼音的聲母字母(零聲母的音節(jié)表示為該音節(jié)首字母);子字根代碼表示為構(gòu)成該子字根的起筆母字根代碼+該子字根的漢語拼音的聲母字母(音節(jié)yu表示為yu,音節(jié)er表示為r,其他零聲母的音節(jié)表示為該音節(jié)首字母)。C,特殊音節(jié)漢字的快捷輸入a)輸入下列漢字時,可省略步驟(2)、(3)倆、佛、能、您、暖、森、僧、嗲、耨、咯;b)輸入下列漢字時,可省略步驟(2)及步驟(3)中構(gòu)成該字的子字根的起筆母字根代碼阿、啊、錒、腌;c)輸入下列漢字時,可省略步驟(3)骯、昂、盎。D,兩個字以上(含兩個字)的詞或詞組的快捷輸入a)省略單個字的字根代碼;b)輸入疊音詞時,構(gòu)成該疊音詞的單個漢字的前字省略字根代碼,后字只輸入該字漢語拼音的聲母字母(零聲母的音節(jié)輸入該音節(jié)首字母),前后字代碼用連字符“-”相連;c)輸入四字成語時省略單個字的字根代碼,且單個字的代碼之間使用連字符“-”相連。E,整句的快捷輸入及輸入整句時關(guān)于大寫字母的規(guī)定a)句中出現(xiàn)下列漢字表示方位,輸入該字時省略字根代碼上、下、前、后、左、右、東、西、南、北、里、外、內(nèi)、中、間、旁;b)句中出現(xiàn)下列單字基數(shù)詞,輸入該字時省略字根代碼一、二、三、四、五、六、七、八、九、零、百、千、萬、億、半;c)句中出現(xiàn)單字的量詞、副詞、嘆詞、介詞、連詞、助詞、語氣詞、擬聲詞時省略字根代碼;d)“我”字在句中任何位置的代碼都為“WO”,即分別鍵入大寫字母“W”與“O”;e)句中出現(xiàn)涉及國家、民族、語言的詞匯時,構(gòu)成該詞的每個單字的編碼的首字母大寫;f)句中出現(xiàn)涉及姓名的詞匯時,構(gòu)成姓和名的每個單字的編碼的首字母大寫;g)句中出現(xiàn)涉及職務(wù)、職稱等頭銜的詞匯時,構(gòu)成該頭銜的每個單字的編碼的首字母大寫;h)句中出現(xiàn)涉及地理名稱的詞匯時,構(gòu)成該地理名稱的每個單字的編碼的首字母大寫;i)句中出現(xiàn)學(xué)涉及校、團(tuán)體、組織名稱的詞匯時,構(gòu)成該名稱的每個單字的編碼的首寫字母大寫;j)句中出現(xiàn)涉及報刊、雜志及文學(xué)作品名稱的詞匯時,構(gòu)成該名稱的每個單字的編碼的首字母大寫。2.如權(quán)利要求1所述的一種基于聲碼加形碼的中文輸入法,其特征在于在輸入漢字聲音代碼的過程中用“l(fā)yu”、“nyu”分別表示音節(jié)“1”、“η1”。全文摘要本發(fā)明涉及一種基于聲(聲音、聲調(diào))碼加形(字根)碼的中文輸入法,屬于漢字編碼及計算機漢字輸入方法領(lǐng)域。該方法可在標(biāo)準(zhǔn)西文鍵盤下使用,其鍵位用作或兼作聲母鍵、韻母鍵、聲調(diào)鍵、字根鍵。單字輸入步驟包括a,輸入漢字的漢語拼音音節(jié)作為聲音代碼;b,輸入漢字的聲調(diào)代碼;c,輸入漢字字根代碼。本發(fā)明特點在于很大程度上減少了因漢字同音字多而產(chǎn)生的重碼問題,以一種符合拼音文字特征的編碼表示漢字,規(guī)律性強,易于掌握,不僅可用于計算機及各種移動設(shè)備的漢字輸入,也適用于漢語的國際推廣及漢語教學(xué)。文檔編號G06F3/023GK101813979SQ20091007823公開日2010年8月25日申請日期2009年2月23日優(yōu)先權(quán)日2009年2月23日發(fā)明者張華進(jìn),張守智申請人:張守智;張華進(jìn)