專利名稱:拼音漢字變換方法及其系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種將拼音變換成漢字的方法,還涉及一種實(shí)現(xiàn)這種方法的系統(tǒng)。
漢字輸入是在計(jì)算機(jī)中應(yīng)用漢字所必不可少的技術(shù)。因此,人們研究開(kāi)發(fā)了各種漢字輸入方法,至今已有不下千種。然而,實(shí)際應(yīng)用的卻不多。拼音輸入法是目前計(jì)算機(jī)中使用較為廣泛的一種輸入法,雖然拼音輸入法存在著輸入速度慢,重碼率高的缺點(diǎn),但它在眾多的輸入法中能占一席之地有其特點(diǎn),即,拼音輸入法不象其它某些輸入法要記憶許多規(guī)則,它容易學(xué)習(xí),只要會(huì)讀會(huì)拼,一般都能用這種方法進(jìn)行輸入,因此適合于非漢字輸入專業(yè)人員使用。但由于漢字中同音字很多,除去聲調(diào),漢字中的發(fā)音只有四百多個(gè),而常用的漢字就有四五千個(gè),因此,拼音輸入法的重碼率很高,輸入者輸入時(shí)要從多個(gè)同音字中進(jìn)行選擇,這大大限制了輸入速度。
在本申請(qǐng)人于1996年5月13日提出的名稱為“漢字拼音輸入系統(tǒng)”、申請(qǐng)?zhí)枮?6106240.1的發(fā)明專利中,公開(kāi)了這樣一種輸入系統(tǒng),這種系統(tǒng)根據(jù)前次輸入的漢字,利用漢字關(guān)系表來(lái)判別當(dāng)前輸入的拼音碼為何漢字,從而減少用戶的選擇次數(shù),提高輸入速度。這種輸入系統(tǒng)利用了漢字的字與字之間的連接關(guān)系。但對(duì)于輸入的句子中,還存在著詞與詞之間的關(guān)系,僅利用字與字之間的連接關(guān)系,就不能正確判斷出詞與詞之間的連接關(guān)系。例如,我們要輸入的詞組為“漢字拼音輸入系統(tǒng)”,在輸入了“漢”之后,當(dāng)輸入拼音“zhi”時(shí),利用該申請(qǐng)中的漢字關(guān)系表可以判斷出這一拼音對(duì)應(yīng)的漢字應(yīng)為“字”,而不是其它發(fā)“zhi”音的漢字,例如“自、之、紙”等,因?yàn)?,在漢字關(guān)系表中只有“漢”與“字”的連接,沒(méi)有“漢”與“自”或與“之”或與“紙”的連接。但當(dāng)輸入后一漢字的拼音“ping”時(shí),由于在漢字關(guān)系表中,“字”與發(fā)“ping”音的漢字之間的連接關(guān)系為“字頻”,與實(shí)際要求輸入的內(nèi)容不一致,而且這往往總是不能一致的,因?yàn)椤皾h”與“字”之間的連接關(guān)系是字與字之間的連接關(guān)系,所以可以利用漢字關(guān)系表,而“字”與“拼”之間實(shí)際上是“漢字”與“拼音”之間的連接關(guān)系,是詞與詞之間的連接關(guān)系,所以僅利用字與字之間連接關(guān)系的漢字關(guān)系表就不能進(jìn)行正確的變換。
根據(jù)上述已有技術(shù)存在的不足,本發(fā)明的目的在于提供一種利用漢語(yǔ)中詞與詞之間的關(guān)系,把拼音變換成漢字的方法。
本發(fā)明的另一個(gè)目的在于提供一種利用上述方法的拼音漢字變換系統(tǒng)。
根據(jù)本發(fā)明的構(gòu)思,本發(fā)明提供的拼音漢字變換方法包括以下步驟(1)輸入拼音碼;(2)判別是否輸入了開(kāi)始變換標(biāo)記;如有則繼續(xù)下一步,否則返回第(1)步驟;(3)根據(jù)輸入的拼音碼,查找拼音字詞關(guān)系表,獲得對(duì)應(yīng)于這些拼音碼的第一組候選字或第一組候選詞;所述拼音字詞關(guān)系表存儲(chǔ)了拼音與所對(duì)應(yīng)字和詞的映射關(guān)系,以及這些對(duì)應(yīng)的字和詞的使用頻度;(4)根據(jù)前次已變換的詞與上述步驟(3)中所獲得的每個(gè)候選字或候選詞,查找詞間關(guān)系表,對(duì)所述第一組候選字或第一組候選詞進(jìn)行刪選,獲得能與前次已變換詞連接的第二組候選字或候選詞;所述詞間關(guān)系表存儲(chǔ)了兩個(gè)詞之間的連接關(guān)系;如果在本步驟中,沒(méi)有前次已變換的詞,則根據(jù)所述拼音字詞關(guān)系表中存儲(chǔ)的使用頻度確定變換的字或詞;(5)計(jì)算所述第二候選字或第二候選詞中每個(gè)候選字或候選詞的評(píng)價(jià)值,并根據(jù)所述評(píng)價(jià)值從所述第二候選字或第二候選詞中確定變換的字或詞;(6)判斷是否出現(xiàn)已到末尾;如果沒(méi)有出現(xiàn),對(duì)下一拼音碼重復(fù)步驟(3)-(5),否則結(jié)束或返回步驟(1)。
本發(fā)明還提供了一種實(shí)現(xiàn)上述方法的拼音漢字變換系統(tǒng),該系統(tǒng)包含輸入部分,用于輸入拼音碼;拼音字詞關(guān)系表,存儲(chǔ)拼音與所對(duì)應(yīng)字和詞的映射關(guān)系,以及這些對(duì)應(yīng)的字和詞的使用頻度;查找部分,與所述輸入部分相連,接收拼音碼,并與所述字詞關(guān)系表相聯(lián),用于根據(jù)所述拼音字詞關(guān)系表,查找對(duì)應(yīng)于所述拼音碼的字或詞;已變換詞集,存放已變換詞第一組候選字詞集,與所述查找部分相連,存放所述查找部分查找所述拼音字詞關(guān)系表獲得的對(duì)應(yīng)于所述拼音碼的字或詞;詞間關(guān)系表,與所述查找部分相連,所述查找部分根據(jù)所述已變換詞集中前次已變換的詞與所述第一組候選字詞集中的所述候選字詞,查找所述詞間關(guān)系表,對(duì)所述第一組候選字詞進(jìn)行刪選,獲得能與前次已變換詞連接的第二組候選字詞;第二組候選字詞集,用于存放所述查找部分查找所述詞間關(guān)系表獲得的第二組候選字詞;評(píng)價(jià)值計(jì)算部分,與所述第二組候選字詞集相連,用于計(jì)算所述第二組候選字詞集中每個(gè)候選字詞的評(píng)價(jià)值;選詞部分,與所述第二組候選字詞集和所述評(píng)價(jià)值計(jì)算部分相連,用于根據(jù)所述評(píng)價(jià)值計(jì)算部分計(jì)算得到的第二組候選字詞的評(píng)價(jià)值確定變換的字或詞,并放入到所述已變換詞集中。
由于在本發(fā)明的方法和系統(tǒng)中增加并利用了詞間關(guān)系表,將該詞間關(guān)系表與拼音字詞關(guān)系表相結(jié)合,不僅能根據(jù)字與字之間的連接關(guān)系來(lái)變換拼音,而且還能根據(jù)詞與詞之間的關(guān)系來(lái)變換拼音,從而提高了輸入速度。
下面結(jié)合附圖詳細(xì)描述本發(fā)明的實(shí)施例。
圖1是本發(fā)明的拼音漢字變換方法的流程圖;圖2是拼音字詞關(guān)系表的結(jié)構(gòu)圖;圖3是詞間關(guān)系表的結(jié)構(gòu)圖;圖4是改進(jìn)的詞間關(guān)系表的結(jié)構(gòu)圖;圖5是本發(fā)明拼音漢字變換系統(tǒng)的結(jié)構(gòu)框圖。
現(xiàn)在先參見(jiàn)圖1來(lái)描述本發(fā)明的拼音漢字變換方法。如圖1所示,首先在步驟S1通過(guò)輸入裝置輸入拼音碼,輸入裝置可以是普通的鍵盤、鼠標(biāo)或者專用輸入設(shè)備等。這里我們以輸入“二十一世紀(jì)是一個(gè)實(shí)際的世紀(jì)”為例來(lái)進(jìn)行說(shuō)明。為了輸入這一句子,應(yīng)輸入其拼音碼“er shi yi shi ji shi yi ge shi ji de shi ji”(在實(shí)際輸入時(shí),可以不輸入空格,連續(xù)輸入,這里留出空格僅是為了方便辨認(rèn))。當(dāng)輸入上述拼音碼時(shí),在步驟S2隨時(shí)判別是否輸入了開(kāi)始變換標(biāo)記。本發(fā)明涉及的是一種整句拼音音漢字變換方法和裝置,因此,在本實(shí)施例中,開(kāi)始變換標(biāo)記可以采用例如逗號(hào)、句號(hào)、問(wèn)號(hào)、感嘆號(hào)、分號(hào)等表示停頓的標(biāo)點(diǎn)符號(hào),也可以規(guī)定的一個(gè)符號(hào),例如空格等。如果在S2沒(méi)有判別出有開(kāi)始變換標(biāo)記,則流程返回到步驟S1,繼續(xù)輸入拼音碼。如果判別出有開(kāi)始變換標(biāo)記,則流程進(jìn)入到下一步驟S3,根據(jù)輸入的拼音碼查找拼音音字詞關(guān)系表。拼音字詞關(guān)系表存儲(chǔ)了拼音與所對(duì)應(yīng)字和詞的映射關(guān)系,以及這些對(duì)應(yīng)的字和詞的使用頻度。圖2示出了這種拼音字詞關(guān)系表的結(jié)構(gòu)。如圖2所示,對(duì)應(yīng)于拼音碼“er”根據(jù)其映射關(guān)系可以查到漢字“爾”、“二”、“而”等,對(duì)應(yīng)于拼音碼“ershi”根據(jù)其映射關(guān)系可以查到詞“二十”、“而是”、“兒時(shí)”等,對(duì)應(yīng)于拼音碼“ershiyi”根據(jù)其映射關(guān)系可以查到詞“二十一”、等。同時(shí)也可以得到這些字和詞的使用頻度。對(duì)于上述的例子來(lái)說(shuō),對(duì)于拼音碼可以查找到一組候選字或候選詞(我們把它稱為第一候選字或第一候選詞)(步驟S4)。可以把獲得的第一組候選字、詞存放在第一組候選字、詞集中。然后,流程進(jìn)入到步驟S5,在步驟S5中,判斷是否有前次已變換的詞。如果沒(méi)有流程進(jìn)入到步驟S6,在步驟S6,根據(jù)第一候選字、詞的使用步驟來(lái)確定變換的字或詞。即,哪個(gè)候選字或詞的使用頻度高,就選那個(gè)字或詞作為變換詞,在本例子中,上述候選字、詞“爾”、“二”、“而”、“二十”、“二十一”等中,“二十一”的使用頻度最大,所以就把“二十一”確定為拼音碼“ershiyi”的變換詞。
然后流程進(jìn)入到步驟S11。判斷是否已變換到拼音碼末尾,即是否到了句子的停頓處,如果沒(méi)有到,流程返回到步驟S3對(duì)后續(xù)的拼音碼重復(fù)上述步驟S3至S5,查找對(duì)應(yīng)于后續(xù)拼音碼的第一候選字、詞。對(duì)于本例來(lái)說(shuō),已變換的拼音碼“ershiyi”后續(xù)的拼音碼為“shi ji shi…”,對(duì)于步驟S3和S4,將獲得“市”、“室”、“式”、“世”…“石”、“世紀(jì)“、“試劑”、“司機(jī)”等第一組候選字、詞。隨后,在步驟S5,判斷是否有前次已變換詞。由于在本例中,前次已變換出“二十一”這一變換詞,所以判斷的結(jié)果為“有”,流程進(jìn)入到步驟S7,在步驟S7,根據(jù)前次已變換詞(在本例中為“二十一”)以及上述的第一候選字、詞,查找詞間關(guān)系表。詞間關(guān)系表存儲(chǔ)了兩詞之間的連接關(guān)系。圖3示出了詞間關(guān)系表的結(jié)構(gòu)。如圖3所示,詞間關(guān)系表是二維矩陣,矩陣的行為一詞,列為另一詞的拼音碼,行列相交處為對(duì)應(yīng)于拼音碼的且可與行上的詞相聯(lián)的詞。如果行列上的兩個(gè)詞在句子中沒(méi)有連接關(guān)系,則在交叉點(diǎn)上作一沒(méi)有連接關(guān)系的標(biāo)記,例如標(biāo)為“0”。例如,在句子中經(jīng)常會(huì)出現(xiàn)“我們需要…”這種句子。在這一句子中,詞“我們”與詞“需要”之間可以連接關(guān)系,即存在一種連接關(guān)系。在詞間關(guān)系表中,就存儲(chǔ)了這樣一種連接關(guān)系,即,在矩陣的行上為“我們”,在矩陣的列上為“需要”的拼音碼“xuyao”,它們的交叉點(diǎn)上為該拼音碼對(duì)應(yīng)的“需要”。但詞“我們”與詞“世紀(jì)”之間不可能連接,所以在詞“我們”與拼音“shiji”的交叉點(diǎn)上作一標(biāo)記“0”,表示它們之間沒(méi)有連接關(guān)系,不能連接。所以在步驟S7中,前一已變換詞為“二十一”,把它對(duì)應(yīng)于詞間關(guān)系表的行,后續(xù)的拼音碼為“shi”、“shiji”、“shijishi”等,查找如圖3所示的詞間關(guān)系表的結(jié)果是與前一已變換詞“二十一”可以連接的詞有“世紀(jì)”、“是”、“室”、“世”等,而與第一候選字、詞中的其它候選字、詞,例如“石”、“市”、“試劑”、“司機(jī)”等不能連接。所以在步驟S8獲得了第二組候選字、詞。為了在第二組候選字、詞中確定對(duì)應(yīng)于拼音碼的變換詞,在步驟S9計(jì)算第二候選字、詞中每個(gè)候選字、詞的評(píng)價(jià)值。然后,在步驟S10中根據(jù)每個(gè)候選字、詞的評(píng)價(jià)值確定變換詞,即把評(píng)價(jià)值大的那個(gè)候選字、詞作為變換詞。在本例中,候選詞“世紀(jì)”的評(píng)價(jià)值最大,所以把“世紀(jì)”選為變換詞。然后,流程進(jìn)入到步驟S11。判斷是否已變換到拼音碼末尾,如果沒(méi)有到,流程返回到步驟S3,對(duì)后續(xù)的拼音碼重復(fù)上述步驟S3至S10。如果到了末尾,流程在步驟S12結(jié)束,可以輸入另一整句的拼音碼。
下面,描述在上述步驟S9中進(jìn)行的計(jì)算候選字、詞評(píng)價(jià)值的情況。由于在步驟S8中已獲得了第二組候選字、詞,這組候選字、詞都可以與前一變換詞連接,所以計(jì)算候選字的評(píng)價(jià)值的目的是根據(jù)該評(píng)價(jià)值從候選字、詞中選出最適合的字、詞作為變換詞。在一實(shí)施例中,可以選用每個(gè)候選字、詞的使用頻度作為評(píng)價(jià)值。但,這種評(píng)價(jià)值存在的不足之處是,單字詞的使用頻度往往大于多字詞。例如在上例中,第二組候選字、詞中,“是”、“室”、“式”等單字詞的使用頻度大于多字詞“世紀(jì)”、“試劑”的使用頻度。為了消除這種情況,在另一實(shí)施例中,可以利用以下公式來(lái)計(jì)算候選字、詞的評(píng)價(jià)值候選詞的評(píng)價(jià)值=候選詞的使用頻度×候選詞詞長(zhǎng)×詞優(yōu)先系數(shù)在該公式中,單字詞的詞優(yōu)先系數(shù)為1,兩字以上詞的優(yōu)先系數(shù)為2。這評(píng)價(jià)值計(jì)算公式的作用是提高了多字詞的評(píng)價(jià)值。即,對(duì)于單字詞來(lái)說(shuō),其評(píng)價(jià)值就等于其使用頻度,而對(duì)于多字詞來(lái)說(shuō),其評(píng)價(jià)值有所增加,這大大提高了多字詞的競(jìng)爭(zhēng)力。
在本發(fā)明的另一實(shí)施例中,對(duì)圖3所示的詞間關(guān)系表作了改進(jìn)。在圖3所示的詞間關(guān)系表中,矩陣的行存儲(chǔ)了一個(gè)完整的詞,如“我們”、“二十一”等,列存儲(chǔ)了完整的詞的拼音碼,例如“xuyao”、“shiji”等,在行列的交叉點(diǎn)上,存儲(chǔ)了對(duì)應(yīng)于拼音碼的完整的詞,例如“需要”、“世紀(jì)”等。為了縮小詞間關(guān)系表的容量,在本實(shí)施例中,使用如圖4所示的結(jié)構(gòu)的詞間關(guān)系表。如圖4所示,在該關(guān)系表中,矩陣的行存儲(chǔ)了前一詞的最后一個(gè)漢字,例如“我們”的“們”;矩陣的列存儲(chǔ)了后一連接詞的最前一個(gè)漢字的拼音碼,例如“xuyao”的“xu”;在行列的交叉點(diǎn)上存儲(chǔ)了列上的拼音碼所對(duì)應(yīng)的漢字,例如“需”。這種結(jié)構(gòu)的詞間關(guān)系表同樣能起到圖3的詞間關(guān)系表的作用。
下面詳細(xì)描述本發(fā)明提供的利用上述拼音漢字變換方法的系統(tǒng)。圖5是拼音漢字變換系統(tǒng)的方框圖。如圖5所示,該系統(tǒng)由這些部分組成輸入部分1、查找部分2、拼音字詞關(guān)系表3、詞間關(guān)系表4、第一組候選字詞集5、第二組候選字詞集6、選詞部分7、評(píng)價(jià)值計(jì)算部分8以及已變換詞集9。輸入部分1可以是普通的鍵盤、鼠標(biāo)或者專用輸入設(shè)備等。漢語(yǔ)句子的拼音碼通過(guò)該輸入部分1輸入。拼音字詞關(guān)系表3存儲(chǔ)了與所對(duì)應(yīng)的字和詞的映射關(guān)系。其結(jié)構(gòu)如圖2所示,在上面已經(jīng)作了詳細(xì)的描述,因此,這里不再重復(fù)。查找部分2與輸入部分1相連,用于接收通過(guò)輸入部分1輸入的拼音碼。當(dāng)輸入部分1的輸入中出現(xiàn)開(kāi)始變換標(biāo)記時(shí),查找部分2到拼音字詞關(guān)系表中查找輸入的拼音碼所對(duì)應(yīng)的字和詞。在本實(shí)施例中所用的開(kāi)始變換標(biāo)記可采用我們?nèi)杂蒙厦娴摹岸皇兰o(jì)是一個(gè)實(shí)際的世紀(jì)”為例。首先查找部分2根據(jù)輸入的拼音碼從拼音字詞關(guān)系表3中查找到對(duì)應(yīng)的漢字“爾”、“二”、“而”和詞“二十”、“而是”、“兒時(shí)”以及“二十一”等,并把這些存放到第一組候選字詞集5中。然后,查找部分2從已變換詞集9中取得前次已變換詞。對(duì)于本例來(lái)說(shuō),目前尚無(wú)前次變換詞,所以選詞部分7把第一組候選字詞集5中的使用頻度最高的候選詞選出,放入到已變換詞集9中,作為已變換詞。在本例中,把“二十一”選為變換詞。
然后,查找部分2根據(jù)后續(xù)的拼音碼“shijishi…”查找拼音字詞關(guān)系表3獲得“市”、“室”、“式”、“世”…“石”、“世紀(jì)“、“試劑”、“司機(jī)”等候選字、詞,同樣放入到第一組候選字詞集5中。接著,查找部分2從已變換詞集9中取得前次已變換詞“二十一”,并根據(jù)該前次已變換詞(在本例中為“二十一”)以及上述的第一候選字、詞,查找詞間關(guān)系表4。詞間關(guān)系表4存儲(chǔ)了兩詞之間的連接關(guān)系。其結(jié)構(gòu)如圖3所示,在上面已經(jīng)作了詳細(xì)的描述,因此,這里不再重復(fù)。通過(guò)查找,從第一候選字詞集5中選出了與前一已變換詞“二十一”可以連接的詞“世紀(jì)”、“是”、“室”、“世”等,把它們放入到第二組候選字詞集6中。由于已獲得了第二組候選字、詞集6中的這組候選字、詞都可以與前一變換詞連接,所以評(píng)價(jià)值計(jì)算部分6計(jì)算每個(gè)候選字的評(píng)價(jià)值,由選詞部分7根據(jù)該評(píng)價(jià)值從候選字、詞中選出最適合的字、詞作為變換詞。在一實(shí)施例中,可以選用每個(gè)候選字、詞的使用頻度作為評(píng)價(jià)值。但,這種評(píng)價(jià)值存在的不足之處是,單字詞的使用頻度往往大于多字詞。例如在上例中,第二組候選字、詞中,“是”、“室”、“式”等單字詞的使用頻度大于多字詞“世紀(jì)”、“試劑”的使用頻度。為了消除這種情況,在另一實(shí)施例中,可以利用以下公式來(lái)計(jì)算候選字、詞的評(píng)價(jià)值候選詞的評(píng)價(jià)值=候選詞的使用頻度×候選詞詞長(zhǎng)×詞優(yōu)先系數(shù)在該公式中,單字詞的詞優(yōu)先系數(shù)為1,兩字以上詞的優(yōu)先系數(shù)為2。這評(píng)價(jià)值計(jì)算公式的作用是提高了多字詞的評(píng)價(jià)值。即,對(duì)于單字詞來(lái)說(shuō),其評(píng)價(jià)值就等于其使用頻度,而對(duì)于多字詞來(lái)說(shuō),其評(píng)價(jià)值有所增加,這大大提高了多字詞的競(jìng)爭(zhēng)力。
對(duì)于本實(shí)施例來(lái)說(shuō),候選詞“世紀(jì)”的評(píng)價(jià)值最大,所以把“世紀(jì)”作為變換詞放入到已變換詞集9中。
上面已通過(guò)實(shí)施例對(duì)本發(fā)明作了詳細(xì)的描述,本技術(shù)領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,上述的方法和系統(tǒng)可以利用軟件或硬件來(lái)實(shí)現(xiàn),也可以利用軟、硬件相結(jié)合的方式來(lái)實(shí)現(xiàn)。
權(quán)利要求
1.一種拼音漢字變換方法包括以下步驟(1)輸入拼音碼;(2)判別是否輸入了開(kāi)始變換標(biāo)記;如有則繼續(xù)下一步,否則返回第(1)步驟;(3)根據(jù)輸入的拼音碼,查找拼音字詞關(guān)系表,獲得對(duì)應(yīng)于這些拼音碼的第一組候選字或第一組候選詞;所述拼音字詞關(guān)系表存儲(chǔ)了拼音與所對(duì)應(yīng)字和詞的映射關(guān)系,以及這些對(duì)應(yīng)的字和詞的使用頻度;(4)根據(jù)前次已變換的詞與上述步驟(3)中所獲得的每個(gè)候選字或候選詞,查找詞間關(guān)系表,對(duì)所述第一組候選字或第一組候選詞進(jìn)行刪選,獲得能與前次已變換詞連接的第二組候選字或候選詞;所述詞間關(guān)系表存儲(chǔ)了兩個(gè)詞之間的連接關(guān)系;如果在本步驟中,沒(méi)有前次已變換的詞,則根據(jù)所述拼音字詞關(guān)系表中存儲(chǔ)的使用頻度確定變換的字或詞;(5)計(jì)算所述第二候選字或第二候選詞中每個(gè)候選字或候選詞的評(píng)價(jià)值,并根據(jù)所述評(píng)價(jià)值從所述第二候選字或第二候選詞中確定變換的字或詞;(6)判斷是否出現(xiàn)已到末尾;如果沒(méi)有出現(xiàn),對(duì)下一拼音碼重復(fù)步驟(3)-(5),否則結(jié)束或返回步驟(1)。
2.如權(quán)利要求1所述的拼音漢字變換方法,其特征在于,所述開(kāi)始變換標(biāo)記為漢語(yǔ)中表示句子停頓的標(biāo)點(diǎn)符號(hào)。
3.如權(quán)利要求2所述的拼音漢字變換方法,其特征在于,所述開(kāi)始變換標(biāo)記為逗號(hào)、句號(hào)、問(wèn)號(hào)、感嘆號(hào)、分號(hào)。
4.如權(quán)利要求1所述的拼音漢字變換方法,其特征在于,所述步驟(4)為根據(jù)前次已確定的最后一個(gè)漢字與上述步驟(3)中所獲得的每個(gè)候選字或候選詞的第一個(gè)漢字,查找詞間關(guān)系表。
5.如權(quán)利要求1所述的拼音漢字變換方法,其特征在于,所述步驟(5)中的評(píng)價(jià)值為候選詞的使用頻度。
6.如權(quán)利要求1所述的拼音漢字變換方法,其特征在于,所述步驟(5)中的評(píng)價(jià)值根據(jù)下列公式計(jì)算候選詞的評(píng)價(jià)值=候選詞的使用頻度×候選詞詞長(zhǎng)×詞優(yōu)先系數(shù)式中,單字詞的詞優(yōu)先系數(shù)為1,兩字以上詞的優(yōu)先系數(shù)為2。
7.如權(quán)利要求1所述的拼音漢字變換方法,其特征在于,所述詞間關(guān)系表是兩維矩陣,矩陣的行存儲(chǔ)了前一詞的最后一個(gè)漢字,矩陣的列存儲(chǔ)了后一連接詞最前一個(gè)漢字的拼音碼,在矩陣行列的交叉點(diǎn)上存儲(chǔ)了列上的拼音碼所對(duì)應(yīng)的漢字。
8.一種利用權(quán)利要求1至7所述方法的拼音漢字變換系統(tǒng),該系統(tǒng)包含輸入部分,用于輸入拼音碼;拼音字詞關(guān)系表,存儲(chǔ)拼音與所對(duì)應(yīng)字和詞的映射關(guān)系,以及這些對(duì)應(yīng)的字和詞的使用頻度;查找部分,與所述輸入部分相連,接收拼音碼,并與所述字詞關(guān)系表相聯(lián),用于根據(jù)所述拼音字詞關(guān)系表,查找對(duì)應(yīng)于所述拼音碼的字或詞;和已變換詞集,存放已變換詞其特征在于,所述系統(tǒng)還包含第一組候選字詞集,與所述查找部分相連,存放所述查找部分查找所述拼音字詞關(guān)系表獲得的對(duì)應(yīng)于所述拼音碼的字或詞;詞間關(guān)系表,與所述查找部分相連,所述查找部分根據(jù)所述已變換詞集中前次已變換的詞與所述第一組候選字詞集中的所述候選字詞,查找所述詞間關(guān)系表,對(duì)所述第一組候選字詞進(jìn)行刪選,獲得能與前次已變換詞連接的第二組候選字詞;第二組候選字詞集,用于存放所述查找部分查找所述詞間關(guān)系表獲得的第二組候選字詞;評(píng)價(jià)值計(jì)算部分,與所述第二組候選字詞集相連,用于計(jì)算所述第二組候選字詞集中每個(gè)候選字詞的評(píng)價(jià)值;選詞部分,與所述第二組候選字詞集和所述評(píng)價(jià)值計(jì)算部分相連,用于根據(jù)所述評(píng)價(jià)值計(jì)算部分計(jì)算得到的第二組候選字詞的評(píng)價(jià)值確定變換的字或詞,并放入到所述已變換詞集中。
9.如權(quán)利要求8所述的拼音漢字變換系統(tǒng),其特征在于,所述選詞部分還與所述第一組候選字詞集相連,當(dāng)尚無(wú)前次變換詞時(shí),把所述第一組候選字詞集中的使用頻度最高的候選詞選出,放入到已所述變換詞集中。
10.如權(quán)利要求8所述的拼音漢字變換系統(tǒng),其特征在于,所述評(píng)價(jià)值計(jì)算部分根據(jù)下列公式計(jì)算評(píng)價(jià)值候選詞的評(píng)價(jià)值=候選詞的使用頻度×候選詞詞長(zhǎng)×詞優(yōu)先系數(shù)式中,單字詞的詞優(yōu)先系數(shù)為1,兩字以上詞的優(yōu)先系數(shù)為2。
11.如權(quán)利要求8所述的拼音漢字變換系統(tǒng),其特征在于,所述詞間關(guān)系表是兩維矩陣,矩陣的行存儲(chǔ)了前一詞的最后一個(gè)漢字,矩陣的列存儲(chǔ)了后一連接詞最前一個(gè)漢字的拼音碼,在矩陣行列的交叉點(diǎn)上存儲(chǔ)了列上的拼音碼所對(duì)應(yīng)的漢字。
全文摘要
本發(fā)明提供了一種拼音漢字變換方法和系統(tǒng)。傳統(tǒng)的漢字拼音輸入系統(tǒng)一般只能判別詞的輸入而不能利用詞間的連接關(guān)系。本發(fā)明的方法包括:輸入拼音碼;查找拼音字詞關(guān)系表,獲得第一組候選字詞;根據(jù)已變換詞與每個(gè)候選字詞,查找詞間關(guān)系表,獲得能與前次已變換詞連接的第二組候選字詞;詞間關(guān)系表存儲(chǔ)了兩個(gè)詞之間的連接關(guān)系;計(jì)算第二候選字詞中每個(gè)候選字或候選詞的評(píng)價(jià)值,根據(jù)所述評(píng)價(jià)值從第二候選字詞中確定變換字詞。還提供了實(shí)現(xiàn)這種方法的系統(tǒng)。
文檔編號(hào)G06F17/28GK1206882SQ9711558
公開(kāi)日1999年2月3日 申請(qǐng)日期1997年7月25日 優(yōu)先權(quán)日1997年7月25日
發(fā)明者陳奕秋 申請(qǐng)人:上海歐姆龍計(jì)算機(jī)有限公司