專(zhuān)利名稱(chēng):漢字聲韻調(diào)三拼音形編碼法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字編碼方案,屬計(jì)算機(jī)漢字輸入技術(shù)。
現(xiàn)有的漢字編碼法中的音、形編碼法,一般存在以下幾個(gè)問(wèn)題一、全拼音碼碼鍵長(zhǎng),同音字多、重碼多;二、有些定了聲調(diào)的全拼音碼,一般都是用數(shù)字或其它符號(hào)代替,降低了輸速度;三、音形碼中有代表性的自然碼雖然濃縮了漢語(yǔ)拼音,實(shí)現(xiàn)了聲韻雙拼,它在濃縮35個(gè)韻母時(shí),找到了部分拼音規(guī)律,但沒(méi)有找到全部拼音規(guī)律,因而沒(méi)有實(shí)現(xiàn)規(guī)范的拼讀,同時(shí)自然碼沒(méi)有用拉丁字母定聲調(diào),拼音化程度不高,重碼依然多;四、五筆字形編碼是專(zhuān)業(yè)打字員的好工具,但它是形碼,沒(méi)有實(shí)現(xiàn)漢語(yǔ)拼音化,在學(xué)習(xí)上要先學(xué)漢字、再學(xué)習(xí)拆分漢字的兩段學(xué)習(xí)過(guò)程,在普及上與國(guó)家教委推廣普通話不相適應(yīng),不利于推廣應(yīng)用。五筆字字根與鍵盤(pán)學(xué)習(xí)的關(guān)系,只是機(jī)械的代入關(guān)系,記憶量非常大。
表發(fā)明的目的是提供一種漢字聲韻調(diào)三拼音形編碼法,在這種碼中,反映了漢字聲韻調(diào)語(yǔ)音等全部信息,并且結(jié)合了漢字的形狀,只用四個(gè)拉丁字母確定一個(gè)漢字。
采發(fā)明是這樣實(shí)現(xiàn)的,它的單字的編碼由四部分組成,其第一部分為聲母碼,取碼必須滿足以下四條規(guī)則①漢語(yǔ)拼音中的b、p、m、f、d、t、n、l、g、k、h、j、q、x、r、z、c、s、y、w20個(gè)聲母與現(xiàn)有的計(jì)算機(jī)鍵盤(pán)上的拉丁字母一一對(duì)應(yīng),拉丁字母即為聲母碼,其中把j、q、x作為是ji、qi、xi的合成聲母碼,②zh、ch、sh三個(gè)聲母用聲母碼中已用過(guò)的20個(gè)以外的三個(gè)拉丁字母作聲母碼,這三個(gè)聲母碼字母不與韻母″i″字母相同,③韻母a、o、e、ai、ei、ao、ou、an、en、ang、eng前面沒(méi)有聲母配合時(shí),用聲母中未用到的并且不與韻母″i″字母相同的一個(gè)拉丁字母作不發(fā)聲的形式上的聲母碼,④韻母″e(cuò)r″沒(méi)有聲母配合,也用一個(gè)上述聲母碼中未用到的拉丁字母作不發(fā)聲的形式上的聲母碼,第二部分為韻母碼,必須滿足以下十條規(guī)則①韻母a、o、e、i、u五個(gè)字母直接作韻母碼,②ai、ei、ao、ou、an、en、ang、eng、ong、ie、iao、iou、ian、ian、ing、ua、uai、uei、uan、uen、uang二十一個(gè)韻母分別用a、o、e、i、u五個(gè)字母以外的一個(gè)拉丁字母作韻母碼,③韻母i、ia、ie、iao、iou、ian、in、iang、ing、iong、ü、üe、üan、üen前面沒(méi)有聲母配合或前面有聲母j、q、x配合時(shí)其韻母碼分別是i、a、eao、ou、an、en、ang、 eng、ong、u、uei、uan、uen韻母的韻母碼,④u、ua、uo、uai、uei、uan、uen、uang、ueng九個(gè)韻母前面沒(méi)有聲母配合時(shí),w為聲母碼,韻母碼分別是u、a、o、ai、ei、an、en、ang、eng韻母的韻母碼,⑤韻母ü在同聲母n、l配合時(shí)其韻母碼借用uai韻母的韻母碼字母,⑥韻母üe同聲母j、q、x、n、l配合時(shí)其韻母碼借用uei韻母的韻母碼字母,⑦韻母ia在同聲母d、l配合時(shí)其韻母碼借用ua韻母碼字母,⑧韻母iang在同聲母n、l配合時(shí)其韻母碼借用uang韻母的韻母碼字母,⑨韻母uo的韻母碼借用o韻母的韻母碼字母,⑩韻母er不與聲母配合其韻母碼是形式上聲母碼的同一字母,并且與上述韻母碼中的其中一個(gè)韻母碼相同,第三部分為調(diào)形碼,取碼必須滿足以下三條規(guī)則①用24個(gè)拉丁字母分別表示漢字的四聲聲調(diào)和漢字左上角的點(diǎn)″、″、橫″一″、豎″丨″、撇″丿″、折“乙”(含串“”)、叉“十”的漢字六個(gè)筆形的24個(gè)組合,②用上述24個(gè)拉丁字母以外的一個(gè)拉丁字母代表輕聲聲調(diào),③用上述25個(gè)拉丁字母以外的一個(gè)拉丁字母表示學(xué)習(xí)碼,
第四部分為形碼取碼必須滿足以下四條規(guī)則①把漢字中的偏旁部首劃分為一畫(huà)(含六畫(huà)以上)、二畫(huà)(含土、扌旁)、三畫(huà)、四畫(huà)、五畫(huà)(含艸辶部首)五個(gè)類(lèi)形,②把去掉上述這些部首后的漢字的右上角筆形分成,點(diǎn)(口)、橫(串)、豎(叉)、撇(撇橫、撇折)、折的五種筆形,③用25個(gè)字母分別代表漢字的偏旁部首中的5個(gè)類(lèi)型和去掉部首后的漢字右上角的五種筆形的25個(gè)組合,④用一個(gè)字母代表學(xué)習(xí)碼。
漢字聲韻調(diào)三拼音形編碼法,其簡(jiǎn)碼規(guī)則是①一級(jí)簡(jiǎn)碼為26個(gè)拉丁字母加空格鍵,制作成聲母(韻母)所對(duì)應(yīng)的高頻漢字,②二級(jí)簡(jiǎn)碼有三種情況一種是聲母配合韻母加空格鍵取其對(duì)應(yīng)的高頻字或同一聲調(diào)中的常用字,二種情況是韻母″i″在沒(méi)有聲母配合時(shí),省略其聲母碼″y″直接用i韻母碼配調(diào)形碼取其對(duì)應(yīng)的常用字;三種情況是″e(cuò)r″在應(yīng)用時(shí),省去形式聲母直接用韻母″e(cuò)r″的替代字母配調(diào)形碼取其相對(duì)應(yīng)的高頻漢字或常用字;③三級(jí)簡(jiǎn)碼為聲、韻、調(diào)加空格鍵,取其相對(duì)應(yīng)的常用字。
漢字聲韻調(diào)三拼音形編碼法,其詞組編碼方法為①二字詞組編碼規(guī)則,一是簡(jiǎn)碼規(guī)則有兩種一種是第一字和第二字各取一個(gè)聲母再加空格鍵為兩鍵取詞;另一種是取第一字的聲母、韻母和第二字的聲母加空格鍵為三鍵取詞的簡(jiǎn)碼方法;二是全碼規(guī)則為取第一字的聲母、韻母和第二字的聲母、韻母成為四鍵取詞;②三字詞組編碼規(guī)則,取第一、二、三字的聲母和第三字的韻母成為四鍵取詞的方法;③多字詞組編碼規(guī)則,取前三字的聲母和最未一字的聲母共四碼取詞。
由于本發(fā)明所編的碼前二部分確定了漢字的聲韻,第三部分確定漢字的四個(gè)聲調(diào)和漢字左上角六個(gè)不同筆畫(huà)的各個(gè)組合,使本發(fā)明在完全使用拉丁字母的情況下,充分而完整地反映了每一漢字的聲、韻、調(diào)等全部語(yǔ)音信息,并且濃縮一部分字形信息,在加入第四碼——形碼的情況下,消除了重碼現(xiàn)象。
漢字三拼編碼它根據(jù)中國(guó)語(yǔ)言特色,吸收了自然碼,五筆字形及其它音形碼的優(yōu)點(diǎn),實(shí)現(xiàn)了漢字編碼規(guī)范化、拼音化、拉丁化的編碼規(guī)則。一是它以語(yǔ)音為主,形碼輔助的一種音形碼;二是全面實(shí)現(xiàn)聲母一個(gè)字母,韻母一個(gè)字母,聲調(diào)加筆形一個(gè)字母的三拼,通過(guò)第四碼形碼的介入,使?jié)h字無(wú)重碼。這種碼中反映了漢字聲韻調(diào)語(yǔ)音全息信息,并結(jié)合了漢字的形狀只用四個(gè)拉丁字母確定一個(gè)漢字。在制作時(shí)較好地把常用字制作成簡(jiǎn)碼,不影響拼讀;三是不需見(jiàn)字打字,只需讀音就可實(shí)現(xiàn)直接操縱電腦輸入漢字;四是記憶量小,由于三拼是音碼讀音與拉丁字母有著機(jī)的聯(lián)系,而五筆字型的字母和字根只是機(jī)械代入。因而易懂、易學(xué)、易普及,同時(shí)也迎合于推廣普通話教學(xué),實(shí)現(xiàn)了漢語(yǔ),漢字與電腦語(yǔ)言相統(tǒng)一,做到讀字知碼,見(jiàn)碼知字的互相可逆,對(duì)譯的編碼,比其它編碼有碼鍵短、重碼少、易學(xué)習(xí)、易推廣等四大優(yōu)點(diǎn)。它也是漢字改革的一種漢字改革的方案。
下面結(jié)合實(shí)施例對(duì)本發(fā)明作進(jìn)一步闡述。實(shí)施例1一聲母碼①聲母b、p、m、f、d、t、n、l、g、k、h、j、q、x、r、z、c、s、y、w、20個(gè)字母不作變動(dòng)作聲母碼。而把j、q、x三個(gè)的聲母改為是ji、qi、xi的合成聲母碼;②聲母zh、ch、sh用a、o、u字母作聲母碼;③韻母a、o、e、ai、ei、ao、ou、an、en、ang、eng前面沒(méi)有聲母配合時(shí),用v字母作不發(fā)聲的形式聲母碼;④韻母″e(cuò)r″沒(méi)有聲母配合,用e字母作不發(fā)聲的形式聲母碼。
二韻母碼①韻母a、o、e、i、u直接作韻母碼。
②其它韻母的韻母碼與韻母的對(duì)應(yīng)關(guān)系見(jiàn)下表
③韻母i、ia、ie、iao、iou、ian、in、iang、ing、iong、ü、üe、üan、üen的前面沒(méi)有聲母或前面有j、q、x三個(gè)聲母配合時(shí),其韻母碼分別是i、a、e、ao、ou、an、en、ang、eng、ong、u、uei*、uan、uen韻母的韻母碼;④韻母u、ua、ue、uai、uei、uan、uen、uang、ueng前面沒(méi)有聲母配合時(shí),其聲母碼為″w″其韻母碼分別是u、a、e、ai、ei、an、en、ang、eng韻母的韻母碼;⑤韻母ü在同聲母n、l配合時(shí),其韻母碼借用uai韻母碼y字母;⑥韻母üe同聲母j、q、x、n、l配合時(shí),韻母碼借用uei韻母的韻母碼″v″字母;⑦韻母ia同聲母d、l配合時(shí),其韻母碼借用ua韻母的韻母碼″l″字母;⑧韻母iang同聲母n、l配合時(shí),其韻母碼借用uang韻母的韻母碼″k″字母;⑨韻母uo的韻母碼借用韻母o的韻母碼″o″字母;⑩韻母er的韻母碼是形式上的聲母碼的″e(cuò)″字母;
以上有″*″符號(hào)的字母表示與別的韻母字母重復(fù)使用,但在讀音上是有區(qū)別的。聲母碼與韻母碼配合見(jiàn)總表。
三、聲調(diào)碼①用24個(gè)拉丁字母分別表示漢字的陰平、陽(yáng)平、上聲、去聲的四個(gè)聲調(diào)和漢字左上角起筆的點(diǎn)″丶″、橫″一″、豎″丨″、撇″丿″、折″乙″(串″″)、叉″十″的24個(gè)組合見(jiàn)調(diào)型碼表。
例如“點(diǎn)”字的聲調(diào)碼,取該字讀音中的上聲聲調(diào)和該字的左上角的起筆豎,其對(duì)應(yīng)的字母“o”即為聲調(diào)碼。
②用y字母表示漢字的輕聲聲調(diào)。
③用z字母表示學(xué)習(xí)碼。
四、形碼①漢語(yǔ)拼音三拼取字還是不能完全實(shí)現(xiàn)無(wú)重碼的,因此要通過(guò)形碼的介入,實(shí)現(xiàn)四鍵無(wú)重碼,從而實(shí)現(xiàn)拼音文字化的方法。這種方法可以是這樣實(shí)現(xiàn)把漢字中的編旁部首分為五個(gè)筆畫(huà)和去掉這些偏旁部首后右上角的五種筆形,組成25個(gè)組漢語(yǔ)拼音聲碼韻碼配合總表
合,并分別用25個(gè)拉丁字母表示具體見(jiàn)下表。
如“平”字的形碼取部首“一”為一畫(huà)和去掉部首“一”的以后右上角筆形“點(diǎn)”所對(duì)應(yīng)的字母“a”即為形碼,又如“點(diǎn)”字的形碼取其部首“灬”四畫(huà)和右上角筆形“橫”所對(duì)應(yīng)的字母“q”即為韻母碼;②用z字母表示學(xué)習(xí)碼;③全碼取字方法為取其聲、韻、調(diào)、形四碼。如″把″字的編碼為baqj,b為聲母,a為韻母,q為左上角筆型土和上聲聲調(diào),j為扌和去掉″扌″旁后的右上角筆形“折”;又如″替″字的編碼為tiwl,t為聲母,i韻母,w為去聲與右上角起筆土,l為日字底四畫(huà)和右上角的筆形“土”。
五、簡(jiǎn)碼字制作方法1、一級(jí)簡(jiǎn)碼用26個(gè)字母加空格鍵取這些字母所替代的聲(韻)母對(duì)應(yīng)的高頻字見(jiàn)下表
26個(gè)字母對(duì)應(yīng)的高頻字
2、二級(jí)簡(jiǎn)碼二級(jí)簡(jiǎn)碼通過(guò)三種途徑來(lái)實(shí)現(xiàn)①聲母與韻母配合加空格鍵取去聲聲調(diào)中的常用字見(jiàn)附表②韻母″i″當(dāng)前面沒(méi)有聲母配合時(shí),省略其形式聲母″y″使″i″韻母字母,配合聲調(diào)字母,加空格鍵取相對(duì)應(yīng)的常用字。
i韻母配合聲調(diào)取相對(duì)應(yīng)常用字
③韻母碼″e(cuò)″省略形式聲母后配聲調(diào)字母加空格鍵取其相對(duì)應(yīng)的常用字。
e韻母配合聲調(diào)取相對(duì)應(yīng)常用字
聲母碼韻母碼加空格鍵相對(duì)應(yīng)的高頻字
3、三級(jí)簡(jiǎn)碼通過(guò)兩種途徑來(lái)實(shí)現(xiàn)①取漢字的聲母、韻母、調(diào)形加空格鍵取字的方法,如″黨″的拼音碼為″dmm″,″d″是聲母,″m″為韻母,″m″為上聲和右上角起筆點(diǎn)。
②韻母″i″″e(cuò)r″省略形式聲母后,配調(diào)形碼再配形碼加空格鍵取字的方法如議的編碼為″isf″i為韻母,d為形調(diào)碼,″f″為″讠″字旁二畫(huà)和去掉″讠″字旁后的右上角起筆點(diǎn)。
六、詞組編碼方法在詞組編碼中,全部采用拉丁字母四鍵取字,當(dāng)在出現(xiàn)重碼時(shí),再用提示碼取詞的方式。
1、兩字詞組編碼規(guī)則①簡(jiǎn)碼規(guī)則簡(jiǎn)碼詞編碼有兩種一是取第一字的聲母和第二字聲母加空格鍵,為二鍵取詞的特殊簡(jiǎn)碼。如“科技″只要取“kj”。“瘋狂”只要取“fk”。二是把第一字的聲母、韻母和第二字的聲母再加空格鍵取字的三鍵取字方法。如“中國(guó)”取字母為″axg”等。
②全碼規(guī)則將兩個(gè)字的聲母、韻母全部拼合起來(lái),編成四碼取詞的方法。如“實(shí)際”取字母為“uiji”。
2、三字詞組編碼規(guī)則取第一二三的聲母和第三字的韻母形成四碼取詞的方法,如計(jì)算機(jī)取字母為“jsji”。
3、多字詞組編碼規(guī)則取前三字的聲母和最末一字的聲母。如“社會(huì)主義”編碼為“uhai”又如“中華人民共和國(guó)”編碼為“ahrg”。實(shí)施例2一聲母碼①聲母b、p、m、f、d、t、n、l、g、k、h、j、q、x、r、z、c、s、y、w、20個(gè)字母不作變動(dòng)作聲母碼。而把j、q、x三個(gè)的聲母改為是ji、qi、xi的合成聲母碼;②聲母zh、ch、sh用u、v、a字母作聲母碼;③韻母a、o、e、ai、ei、ao、ou、an、en、ang、eng前面沒(méi)有聲母配合時(shí),用v字母作不發(fā)聲的形式聲母碼;④韻母″e(cuò)r″沒(méi)有聲母配合,用e字母作不發(fā)聲的形式聲母碼。
二韻母碼①韻母a、o、e、i、u直接作韻母碼。
②其它韻母的韻母碼與韻母的對(duì)應(yīng)關(guān)系見(jiàn)下表
③韻母i、ia、ie、iao、iou、ian、in、iang、ing、iong、ü、üe、üan、üen的前面沒(méi)有聲母或前面有j、q、x三個(gè)聲母配合時(shí),其韻母碼分別是i、a、e、ao、ou、an、en、ang、eng、ong、u、uei*、uan、uen韻母的韻母碼;④韻母u、ua、ue、uai、uei、uan、uen、uang、ueng前面沒(méi)有聲母配合時(shí),其聲母碼為″w″其韻母碼分別是u、a、e、ai、ei、an、en、ang、eng韻母的韻母碼;
⑤韻母ü在同聲母n、l配合時(shí),其韻母碼借用uai韻母碼y字母;⑥韻母üe同聲母j、q、x、n、l配合時(shí),韻母碼借用uei韻母的韻母碼″v″字母;⑦韻母ia同聲母d、l配合時(shí),其韻母碼借用ua韻母的韻母碼″t″字母;⑧韻母iang同聲母n、l配合時(shí),其韻母碼借用uang韻母的韻母碼″g″字母;⑨韻母uo的韻母碼借用韻母o的韻母碼″o″字母;⑩韻母er的韻母碼是形式上的聲母碼的″e(cuò)″字母;以上有″*″符號(hào)的字母表示與別的韻母字母重復(fù)使用,但在讀音上是有區(qū)別的。聲母碼與韻母碼配合見(jiàn)總表。
三、聲調(diào)碼①用24個(gè)拉丁字母分別表示漢字的陰平、陽(yáng)平、上聲、去聲的四個(gè)聲調(diào)和漢字左上角起筆的點(diǎn)″丶″、橫″一″、豎″丨″、撇″丿″、折″乙″(串″土″)、叉″十″的24個(gè)組合見(jiàn)調(diào)型碼表。
漢語(yǔ)拼音聲碼韻碼配合總表
例如“點(diǎn)”字的聲調(diào)碼,取該字讀音中的上聲聲調(diào)和該字的左上角的起筆豎,其對(duì)應(yīng)的字母“k”即為聲調(diào)碼。
②用y字母表示漢字的輕聲聲調(diào)。
③用z字母表示學(xué)習(xí)碼。
四、形碼①漢語(yǔ)拼音三拼取字還是不能完全實(shí)現(xiàn)無(wú)重碼的,因此要通過(guò)形碼的介入,實(shí)現(xiàn)四鍵無(wú)重碼,從而實(shí)現(xiàn)拼音文字化的方法。這種方法可以是這樣實(shí)現(xiàn)把漢字中的編旁部首分為五個(gè)筆畫(huà)和去掉這些偏旁部首后右上角的五種筆形,組成25個(gè)組合,并分別用25個(gè)拉丁字母表示具體見(jiàn)下表。
如“平”字的形碼取部首“一”為一畫(huà)和去掉部首“一”的以后右上角筆形“點(diǎn)”所對(duì)應(yīng)的字母“a”即為形碼,又如“點(diǎn)”字的形碼取其部首“灬”四畫(huà)和右上角筆形“橫”所對(duì)應(yīng)的字母“n”即為韻母碼。
②用z字母表示學(xué)習(xí)碼;③全碼取字方法為取其聲、韻、調(diào)、形四碼。如″把″字的編碼為basv,b為聲母,a為韻母,s為左上角筆型土和上聲聲調(diào),v為扌和去掉″扌″旁后的右上角筆形“折”;又如″替″字的編碼為titi,t為聲母,i韻母,t為去聲與右上角起筆土,i為日字底四畫(huà)和右上角的筆形“土”。
五、簡(jiǎn)碼字制作方法1、一級(jí)簡(jiǎn)碼用26個(gè)字母加空格鍵取這些字母所替代的聲(韻)母對(duì)應(yīng)的高頻字見(jiàn)下表26個(gè)字母對(duì)應(yīng)的高頻字
2、二級(jí)簡(jiǎn)碼二級(jí)簡(jiǎn)碼通過(guò)三種途徑來(lái)實(shí)現(xiàn)①聲母與韻母配合加空格鍵取去聲聲調(diào)中的常用字見(jiàn)附表③韻母″i″當(dāng)前面沒(méi)有聲母配合時(shí),省略其形式聲母″y″使″i″韻母字母,配合聲調(diào)字母,加空格鍵取相對(duì)應(yīng)的常用字。
i韻母配合聲調(diào)取相對(duì)應(yīng)常用字
③韻母碼″e(cuò)″省略形式聲母后配聲調(diào)字母加空格鍵取其相對(duì)應(yīng)的常用字。
聲母碼韻母碼加空格鍵取去聲聲調(diào)常用字
e韻母配合聲調(diào)取相對(duì)應(yīng)常用字
3、三級(jí)簡(jiǎn)碼通過(guò)三種途徑來(lái)實(shí)現(xiàn)①取漢字的聲母、韻母、調(diào)形加空格鍵取字的方法, 如″黨″的拼音碼為″dmc″,″d″是聲母,″m″為韻母,″c″為上聲中點(diǎn)起筆的字。
②韻母″i″″e(cuò)r″省略形式聲母后,配調(diào)形碼再配形碼加空格鍵取字的方法如議的編碼為″isf″i為韻母,d為形調(diào)碼,″f″為″讠″字旁二畫(huà)和去掉″讠″字旁后的右上角起筆點(diǎn)。
六、詞組編碼方法在詞組編碼中,全部采用拉丁字母四鍵取字,當(dāng)在出現(xiàn)重碼時(shí),再用提示碼取詞的方式。
1、兩字詞組編碼規(guī)則①簡(jiǎn)碼規(guī)則簡(jiǎn)碼詞編碼有兩種一是取第一字的聲母和第二字聲母加空格鍵,為二鍵取詞的特殊簡(jiǎn)碼。如“愛(ài)情”只要取“vq”“方法”只要取“ff?!倍前训谝蛔值穆暷?、韻母和第二字的聲母再加空格鍵取字的三鍵取字方法。如“中國(guó)”取字母為″uxg”等。
②全碼規(guī)則將兩個(gè)字的聲母、韻母全部拼合起來(lái),編成四碼取詞的方法。如“實(shí)際”取字母為“aiji”。
2、三字詞組編碼規(guī)則取第一二三的聲母和第三字的韻母形成四碼取詞的方法,如計(jì)算機(jī)取字母為“jsji”。
3、多字詞組編碼規(guī)則取前三字的聲母和最未一字的聲母。如“社會(huì)主義”編碼為“ahui”又如“中華人民共和國(guó)”編碼為“uhrg”。
權(quán)利要求
1.一種漢字聲韻調(diào)三拼音形編碼法,它的單字編碼由聲、韻、調(diào)、形四部分組成,第一部分為聲母碼,取碼必須滿足以下四條規(guī)則①漢語(yǔ)拼音中的b、p、m、f、d、t、n、l、g、k、h、j、q、x、r、z、c、s、y、w20個(gè)聲母與現(xiàn)有的計(jì)算機(jī)鍵盤(pán)上的拉丁字母一一對(duì)應(yīng),拉丁字母即為聲母碼,其中把j、q、x作為是ji、qi、xi的合成聲母碼,②zh、ch、sh三個(gè)聲母用聲母碼中已用過(guò)的20個(gè)以外的三個(gè)拉丁字母作聲母碼,這三個(gè)聲母碼字母不與韻母″i″字母相同,③韻母a、o、e、ai、ei、ao、ou、an、en、ang、eng前面沒(méi)有聲母配合時(shí),用聲母中未用到的并且不與韻母″i″字母相同的一個(gè)拉丁字母作不發(fā)聲的形式上的聲母碼,④韻母″e(cuò)r″沒(méi)有聲母配合,也用一個(gè)上述聲母碼中未用到的拉丁字母作不發(fā)聲的形式上的聲母碼,第二部分為韻母碼,必須滿足以下十條規(guī)則①韻母a、o、e、i、u.五個(gè)字母直接作韻母碼,②ai、ei、ao、ou、an、en、ang、eng、ong、ie、iao、iou、ian、in、ing、ua、uai、uei、uan、uen、uang二十一個(gè)韻母分別用a、o、e、i、u五個(gè)字母以外的一個(gè)拉丁字母作韻母碼,③韻母i、ia、ie、iao、iou、ian、in、iang、ing、iong、ü、üe、üan、üen前面沒(méi)有聲母配合或前面有聲母j、q、x配合時(shí)其韻母碼分別是i、a、eao、ou、an、en、ang、eng、ong、u、uei、uan、uen韻母的韻母碼,④u、ua、uo、uai、uei、uan、uen、uang、ueng九個(gè)韻母前面沒(méi)有聲母配合時(shí),w為聲母碼,韻母碼分別是u、a、o、ai、ei、an、en、ang、eng韻母的韻母碼,⑤韻母ü在同聲母n、l配合時(shí)其韻母碼借用uai韻母的韻母碼字母,⑥韻母üe同聲母j、q、x、n、l配合時(shí)其韻母碼借用uei韻母的韻母碼字母,⑦韻母ia在同聲母d、l配合時(shí)其韻母碼借用ua韻母碼字母,⑧韻母iang在同聲母n、l配合時(shí)其韻母碼借用uang韻母的韻母碼字母,⑨韻母uo的韻母碼借用o韻母的韻母碼字母,⑩韻母er不與聲母配合其韻母碼是形式上聲母碼的同一字母,并且與上述韻母碼中的其中一個(gè)韻母碼相同,第三部分為調(diào)形碼,取碼必須滿足以下三條規(guī)則①用24個(gè)拉丁字母分別表示漢字的四聲聲調(diào)和漢字左上角的點(diǎn)″丶″、橫″一″、豎″丨″、撇″丿″、折“乙”(含串“”)、叉“十”的漢字六個(gè)筆形的24個(gè)組合,②用上述24個(gè)拉丁字母以外的一個(gè)拉丁字母代表輕聲聲調(diào),③用上述25個(gè)拉丁字母以外的一個(gè)拉丁字母表示學(xué)習(xí)碼,第四部分為形碼取碼必須滿足以下四條規(guī)則①把漢字中的偏旁部首劃分為一畫(huà)(含六畫(huà)以上)、二畫(huà)(含土、扌旁)、三畫(huà)、四畫(huà)、五畫(huà)(含艸辶部首)五個(gè)類(lèi)形,②把去掉上述這些部首后的漢字的右上角筆形分成,點(diǎn)(口)、橫(串)、豎(叉)、撇(撇橫、撇折)、折的五種筆形,③用25個(gè)字母分別代表漢字的偏旁部首中的5個(gè)類(lèi)型和去掉部首后的漢字右上角的五種筆形的25個(gè)組合,④用一個(gè)字母代表學(xué)習(xí)碼。
2.如權(quán)利要求書(shū)1所述的漢字聲韻調(diào)三拼音形編碼法,其簡(jiǎn)碼規(guī)則是①一級(jí)簡(jiǎn)碼為26個(gè)拉丁字母加空格鍵,制作成聲母(韻母)所對(duì)應(yīng)的高頻漢字,③二級(jí)簡(jiǎn)碼有三種情況一種是聲母配合韻母加空格鍵取其對(duì)應(yīng)的高頻字或同一聲調(diào)中的常用字,二種情況是韻母“i”在沒(méi)有聲母配合時(shí),省略其聲母碼″y″直接用i韻母碼配調(diào)形碼取其對(duì)應(yīng)的常用字;三種情況是″e(cuò)r″在應(yīng)用時(shí),省去形式聲母直接用韻母″e(cuò)r″的替代字母配調(diào)形碼取其相對(duì)應(yīng)的高頻漢字或常用字;③三級(jí)簡(jiǎn)碼為聲、韻、調(diào)加空格鍵,取其相對(duì)應(yīng)的常用字。
3.如權(quán)利要求書(shū)1所述的漢字聲韻調(diào)三拼音形編碼法,其詞組編碼方法為①二字詞組編碼規(guī)則,一是簡(jiǎn)碼規(guī)則有兩種一種是第一字和第二字各取一個(gè)聲母再加空格鍵為兩鍵取詞;另一種是取第一字的聲母、韻母和第二字的聲母加空格鍵為三鍵取詞的簡(jiǎn)碼方法;二是全碼規(guī)則為取第一字的聲母、韻母和第二字的聲母、韻母成為四鍵取詞;②三字詞組編碼規(guī)則,取第一、二、三字的聲母和第三字的韻母成為四鍵取詞的方法;③多字詞組編碼規(guī)則,取前三字的聲母和最未一字的聲母共四碼取詞。
全文摘要
本發(fā)明涉及一種漢字編碼方案,屬計(jì)算機(jī)漢字輸入技術(shù)。它的單字編碼由聲、韻、調(diào)、形四部分組成。第一部分為聲母碼,第二部分為韻母碼,第三部分為調(diào)形碼,調(diào)形碼部分把漢字的聲調(diào)與漢字的形狀有機(jī)結(jié)合在一起,第四部分為形碼。本發(fā)明在完全使用拉丁字母的情況下,充分而完整地反映了每一漢字的聲、韻、調(diào)等全部語(yǔ)音信息。
文檔編號(hào)G06F3/023GK1190758SQ97101759
公開(kāi)日1998年8月19日 申請(qǐng)日期1997年2月15日 優(yōu)先權(quán)日1997年2月15日
發(fā)明者李小劍 申請(qǐng)人:李小劍