專利名稱:一種基于混輸字符串進(jìn)行字符轉(zhuǎn)換的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及輸入法技術(shù)領(lǐng)域,特別是一種基于混輸字符串進(jìn)行字符轉(zhuǎn)換的方法和裝置,以及一種文字輸入方法和輸入法系統(tǒng)。
背景技術(shù):
中國人在記憶英文單詞時普遍存在難以拼寫、不會發(fā)音的問題,例如,會發(fā)音但不記得確切的完整拼寫,或者,知道拼寫但發(fā)音不準(zhǔn)確或不會發(fā)音;針對上述問題,現(xiàn)有的輸入法系統(tǒng)可以提供一些翻譯功能,例如,提供以詞條為粒度的,類似詞典查詞的服務(wù)。例如,公開號為200910039910. X的中國專利公開文件,就公開了一種文字輸入方法的技術(shù)方案,該技術(shù)方案的翻譯步驟主要分兩步完成第一步,通常的音字轉(zhuǎn)換;第二步,對用戶選中的候選項(xiàng)進(jìn)行翻譯。該專利能夠根據(jù)用戶輸入完成翻譯功能,但是,在翻譯過程需要用戶參與,影響用戶體驗(yàn);而且,所述翻譯主要以詞條為粒度,而對于用戶輸入整句的翻譯過程細(xì)節(jié),則沒有詳細(xì)描述。并且,現(xiàn)有的各種技術(shù)方案沒有考慮到用戶進(jìn)行混輸?shù)那闆r,例如,在用戶輸入中英混輸字符串“bri特尼”時,現(xiàn)有技術(shù)既無法將其轉(zhuǎn)換翻譯為中文,也無法將其轉(zhuǎn)換翻譯為英文??傊?,需要本領(lǐng)域技術(shù)人員迫切解決的一個技術(shù)問題就是如何能夠創(chuàng)新性的提供針對混輸字符串的翻譯轉(zhuǎn)換功能。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種基于混輸字符串進(jìn)行字符轉(zhuǎn)換的方法和裝置,能夠基于用戶輸入的混輸字符串進(jìn)行字符轉(zhuǎn)換,得到用戶所需的轉(zhuǎn)換結(jié)果(例如,翻譯)。相應(yīng)的,本發(fā)明還提供了一種文字輸入方法和輸入法系統(tǒng),用以基于混輸字符串進(jìn)行字符轉(zhuǎn)換,并可以實(shí)現(xiàn)所述字符轉(zhuǎn)換結(jié)果的展現(xiàn)、用戶選擇和輸出,可以實(shí)現(xiàn)用戶在混輸字符串的情況下而直接得到所需轉(zhuǎn)換結(jié)果上屏輸出。為了解決上述問題,本發(fā)明公開了一種基于混輸字符串進(jìn)行字符轉(zhuǎn)換的方法,包括獲取混輸字符串;區(qū)分混輸字符串中不同類型的混輸片段;基于所有不同類型的混輸片段,并按照預(yù)置處理規(guī)則得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述不同類型的混輸片段包括發(fā)音片段和目標(biāo)語言片段,所述獲得轉(zhuǎn)換結(jié)果的步驟包括獲取所述混輸字符串中的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述不同類型的混輸片段包括目標(biāo)語言的發(fā)音片段和非目標(biāo)語言的發(fā)音片段,所述獲得轉(zhuǎn)換結(jié)果的步驟包括獲取所述混輸字符串中的目標(biāo)語言的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;獲取所述混輸字符串中的非目標(biāo)語言的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;基于在目標(biāo)語言下的發(fā)音單元序列,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段得到轉(zhuǎn)換結(jié)果的步驟,包括獲取目標(biāo)語言片段在目標(biāo)語言下的發(fā)音單元序列;基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段在目標(biāo)語言下的發(fā)音單元序列,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段得到轉(zhuǎn)換結(jié)果的步驟,包括基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,得到相應(yīng)的目標(biāo)語言字符序列;將所得到的目標(biāo)語言字符序列和所述目標(biāo)語言片段連接,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段得到轉(zhuǎn)換結(jié)果的步驟,包括基于所述目標(biāo)語言片段,在詞庫中匹配查詢得到相應(yīng)的字詞集合;利用發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,在所述字詞集合中搜索得到匹配項(xiàng),作為該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,將所述混輸字符串中的第一片段作為發(fā)音片段,第二片段作為目標(biāo)語言片段,得到第一目標(biāo)語言下的轉(zhuǎn)換結(jié)果;以及,將所述混輸字符串中的第二片段作為發(fā)音片段,第一片段作為目標(biāo)片段,得到第二目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,將所述混輸字符串中的第一片段作為目標(biāo)語言的發(fā)音片段,第二片段作為非目標(biāo)語言的發(fā)音片段,得到第一目標(biāo)語言下的轉(zhuǎn)換結(jié)果;以及,將所述混輸字符串中的第二片段作為目標(biāo)語言的發(fā)音片段,第一片段作為非目標(biāo)語言的發(fā)音片段,得到第二目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,可以通過字符類型、大小寫字母、分隔符或者狀態(tài)切換點(diǎn)等信息,區(qū)分混輸字符串中不同類型的混輸片段。優(yōu)選的,所述的方法還可以包括將所述混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果翻譯為另一語言字詞進(jìn)行展示。優(yōu)選的,當(dāng)用戶輸入長句或詞組時,所述的方法還可以包括通過分隔符或者分詞的方式,從用戶所輸入的長句或詞組中得到所需的混輸字符串?;诒景l(fā)明的另一實(shí)施例,還公開了一種基于混輸字符串進(jìn)行字符轉(zhuǎn)換的裝置, 包括接口單元,用于獲取混輸字符串;區(qū)分單元,用于區(qū)分混輸字符串中不同類型的混輸片段;轉(zhuǎn)換單元,用于基于所有不同類型的混輸片段,并按照預(yù)置處理規(guī)則得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述不同類型的混輸片段包括發(fā)音片段和目標(biāo)語言片段,所述轉(zhuǎn)換單元包括第一音節(jié)獲取模塊,用于獲取所述混輸字符串中的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;第一轉(zhuǎn)換結(jié)果獲取模塊,用于基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述不同類型的混輸片段包括目標(biāo)語言的發(fā)音片段和非目標(biāo)語言的發(fā)音片段,所述轉(zhuǎn)換單元包括
8
第二音節(jié)獲取模塊,用于獲取所述混輸字符串中的目標(biāo)語言的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;第三音節(jié)獲取模塊,用于獲取所述混輸字符串中的非目標(biāo)語言的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;第二轉(zhuǎn)換結(jié)果獲取模塊,用于基于在目標(biāo)語言下的發(fā)音單元序列,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述轉(zhuǎn)換結(jié)果獲取模塊具體用于基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段在目標(biāo)語言下的發(fā)音單元序列,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述轉(zhuǎn)換結(jié)果獲取模塊包括發(fā)音片段字符獲取子模塊,用于基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,得到相應(yīng)的目標(biāo)語言字符序列;拼接子模塊,用于將所得到的目標(biāo)語言字符序列和所述目標(biāo)語言片段連接,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述轉(zhuǎn)換結(jié)果獲取模塊包括詞庫查詢子模塊,用于基于所述目標(biāo)語言片段,在詞庫中匹配查詢得到相應(yīng)的字詞集合;音節(jié)搜索子模塊,用于利用發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,在所述字詞集合中搜索得到匹配項(xiàng),作為該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述裝置還可以包括語言翻譯單元,用于將所述混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果翻譯為另一語言字詞。優(yōu)選的,所述裝置還可以包括切分單元,用于當(dāng)用戶輸入長句或詞組時,通過分隔符或者分詞的方式,從用戶所輸入的長句或詞組中得到所需的混輸字符串。基于本發(fā)明的另一實(shí)施例,還公開了一種文字輸入方法,包括接收用戶輸入的混輸字符串;區(qū)分混輸字符串中不同類型的混輸片段;基于所有不同類型的混輸片段,并按照預(yù)置處理規(guī)則得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果,并加以展示;依據(jù)用戶指示, 輸出指定的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述不同類型的混輸片段包括發(fā)音片段和目標(biāo)語言片段,所述獲得轉(zhuǎn)換結(jié)果的步驟包括獲取所述混輸字符串中的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述不同類型的混輸片段包括目標(biāo)語言的發(fā)音片段和非目標(biāo)語言的發(fā)音片段,所述獲得轉(zhuǎn)換結(jié)果的步驟包括獲取所述混輸字符串中的目標(biāo)語言的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;獲取所述混輸字符串中的非目標(biāo)語言的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;基于在目標(biāo)語言下的發(fā)音單元序列,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段得到轉(zhuǎn)換結(jié)果的步驟,包括獲取目標(biāo)語言片段在目標(biāo)語言下的發(fā)音單元序列;基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段在目標(biāo)語言下的發(fā)音單元序列,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段得到轉(zhuǎn)換結(jié)果的步驟,包括基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,得到相應(yīng)的目標(biāo)語言字符序列;將所得到的目標(biāo)語言字符序列和所述目標(biāo)語言片段連接,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段得到轉(zhuǎn)換結(jié)果的步驟,包括基于所述目標(biāo)語言片段,在詞庫中匹配查詢得到相應(yīng)的字詞集合;利用發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,在所述字詞集合中搜索得到匹配項(xiàng),作為該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,將所述混輸字符串中的第一片段作為發(fā)音片段;第二片段作為目標(biāo)片段, 得到第一目標(biāo)語言下的轉(zhuǎn)換結(jié)果;以及,將所述混輸字符串中的第二片段作為發(fā)音片段,第一片段作為目標(biāo)片段,得到第二目標(biāo)語言下的轉(zhuǎn)換結(jié)果;展示上述得到的兩種目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,將所述混輸字符串中的第一片段作為目標(biāo)語言的發(fā)音片段,第二片段作為非目標(biāo)語言的發(fā)音片段,得到第一目標(biāo)語言下的轉(zhuǎn)換結(jié)果;以及,將所述混輸字符串中的第二片段作為目標(biāo)語言的發(fā)音片段,第一片段作為非目標(biāo)語言的發(fā)音片段,得到第二目標(biāo)語言下的轉(zhuǎn)換結(jié)果;展示上述得到的兩種目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述的方法還包括將所述混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果翻譯為
另一語言字詞進(jìn)行展示。優(yōu)選的,當(dāng)用戶輸入長句或詞組時,所述的方法還包括通過分隔符或者分詞的方式,從用戶所輸入的長句或詞組中得到所需的混輸字符串。依據(jù)本發(fā)明的另一實(shí)施例,還公開了一種輸入法系統(tǒng),包括接口單元,用于接收用戶輸入的混輸字符串;區(qū)分單元,用于區(qū)分混輸字符串中不同類型的混輸片段;轉(zhuǎn)換單元,用于基于所有不同類型的混輸片段,并按照預(yù)置處理規(guī)則得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果;展示單元,用于展示轉(zhuǎn)換結(jié)果;輸出單元,用于依據(jù)用戶指示,輸出指定的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述不同類型的混輸片段包括發(fā)音片段和目標(biāo)語言片段,所述轉(zhuǎn)換單元包括第一音節(jié)獲取模塊,用于獲取所述混輸字符串中的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;第一轉(zhuǎn)換結(jié)果獲取模塊,用于基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述不同類型的混輸片段包括目標(biāo)語言的發(fā)音片段和非目標(biāo)語言的發(fā)音片段,所述轉(zhuǎn)換單元包括第二音節(jié)獲取模塊,用于獲取所述混輸字符串中的目標(biāo)語言的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;第三音節(jié)獲取模塊,用于獲取所述混輸字符串中的非目標(biāo)語言的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;第二轉(zhuǎn)換結(jié)果獲取模塊,用于基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述轉(zhuǎn)換結(jié)果獲取模塊具體用于基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段在目標(biāo)語言下的發(fā)音單元序列,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述轉(zhuǎn)換結(jié)果獲取模塊包括發(fā)音片段字符獲取子模塊,用于基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,得到相應(yīng)的目標(biāo)語言字符序列;拼接子模塊,用于將所得到的目標(biāo)語言字符序列和所述目標(biāo)語言片段連接,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述轉(zhuǎn)換結(jié)果獲取模塊包括詞庫查詢子模塊,用于基于所述目標(biāo)語言片段,在詞庫中匹配查詢得到相應(yīng)的字詞集合;音節(jié)搜索子模塊,用于利用發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,在所述字詞集合中搜索得到匹配項(xiàng),作為該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。優(yōu)選的,所述輸入法系統(tǒng)還可以包括語言翻譯單元,用于將所述混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果翻譯為另一語言字詞,由所述展示單元進(jìn)行展示。優(yōu)選的,所述輸入法系統(tǒng)還可以包括切分單元,用于當(dāng)用戶輸入長句或詞組時, 通過分隔符或者分詞的方式,從用戶所輸入的長句或詞組中得到所需的混輸字符串。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)在用戶忘記單詞某個部分的拼寫但記得該部分發(fā)音,或者,用戶在忘記單詞某個部分的翻譯結(jié)果單記得該部分拼寫時,就可能使用混輸字符串來表示自己所需的輸入字詞。在用戶的混輸字符串中,通常會采用發(fā)音片段表示所忘記的那部分,目標(biāo)語言片段表示其它部分。針對這樣的特性,本發(fā)明可以同時依據(jù)所述發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,以及目標(biāo)語言片段,來獲取該混輸字符串在目標(biāo)語言下單詞全拼、完整翻譯結(jié)果等轉(zhuǎn)換結(jié)果。例如,中文用戶在不記得外文拼寫的情況下,就可能采用混輸字符串(一部分外文拼寫,一部分外文發(fā)音)來表示,則應(yīng)用本發(fā)明就可以將該混輸字符串轉(zhuǎn)換成用戶所需的外文結(jié)果?;蛘?,在用戶忘記整個單詞的拼寫時,還會采用兩種語言的發(fā)音片段來表示該單詞,也即,所述混輸字符串包括兩種語言的發(fā)音片段;針對此特性,本發(fā)明可以首先獲取所述兩種語言的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,然后,基于該發(fā)音單元序列,來獲取該混輸字符串在目標(biāo)語言下單詞全拼、完整翻譯結(jié)果等轉(zhuǎn)換結(jié)果。
圖1是本發(fā)明一種基于混輸字符串進(jìn)行字符轉(zhuǎn)換的方法實(shí)施例的流程圖;圖2是本發(fā)明一種對長句中混輸字符串進(jìn)行字符轉(zhuǎn)換的示例;
圖3是本發(fā)明一種基于混輸字符串進(jìn)行字符轉(zhuǎn)換的裝置實(shí)施例的結(jié)構(gòu)圖;圖4是本發(fā)明一種文字輸入方法實(shí)施例的流程圖;圖5是本發(fā)明第一種輸入過程中候選項(xiàng)的展現(xiàn)界面示意圖;圖6是本發(fā)明第二種輸入過程中候選項(xiàng)的展現(xiàn)界面示意圖;圖7是本發(fā)明第三種輸入過程中候選項(xiàng)的展現(xiàn)界面示意圖;圖8是本發(fā)明第四種輸入過程中候選項(xiàng)的展現(xiàn)界面示意圖;圖9是本發(fā)明一種輸入法系統(tǒng)實(shí)施例的結(jié)構(gòu)圖。
具體實(shí)施例方式為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式
對本發(fā)明作進(jìn)一步詳細(xì)的說明。本發(fā)明的混輸字符串可以為任何兩種語言的混輸字符串;例如,中文和英文、漢字和德文、日文和英文、日文和阿拉伯文等等,下面主要以中英混輸字符串為例進(jìn)行說明,其他混輸字符串請參照即可。需要說明的是,本發(fā)明所基于的混輸字符串包括發(fā)音片段,或者,發(fā)音片段和目標(biāo)語言片段,其中,在該混輸字符串中,發(fā)音片段是用來表示發(fā)音的(目標(biāo)語言和/或非目標(biāo)語言),另一部分為目標(biāo)語言的片段,基于該混輸字符串,本發(fā)明可以得到目標(biāo)語言下的轉(zhuǎn)換結(jié)果(目標(biāo)語言字詞)。下面先對本發(fā)明可能的各種應(yīng)用場景作簡單的舉例說明,并不以此為限,僅僅為了更好的描述本發(fā)明。應(yīng)用場景1用戶希望得到外文全拼,卻不知道其中一部分的拼寫,僅僅記得外文發(fā)音,則應(yīng)用本發(fā)明,可以使用音譯的本國文字或者本國發(fā)音表示該部分,從而獲得所需的外文全拼。例如,用戶欲輸入美國影星施瓦辛格的全名,當(dāng)輸入到“schwar”時,卻發(fā)現(xiàn)后面的部分記不清了,故選擇用該中文漢字“辛格”或中文拼音“xin’ ge”表示該部分,由本發(fā)明依據(jù)所述混輸字符串“sctiwar’辛格”或“sctiwar’ xin’ ge”,得到轉(zhuǎn)換結(jié)果“ktiwarzenegger”。又如,本發(fā)明可以將依據(jù)混輸字符串“斯庫ool”得到“school”,依據(jù)“由你玩 city” 得到"university “,依據(jù)"misc 雷涅斯”得到 “miscellaneous”,等等。應(yīng)用場景2用戶希望得到外文的中文譯名,卻不知道其中一部分的翻譯,僅僅記得英文拼寫, 則應(yīng)用本發(fā)明,可以使用外文字符表示該部分,從而獲得所需的中文譯名。例如,用戶欲知道美國影星Brittany (布里特妮)的中文譯名,卻不知道前一部分“bri”的翻譯,故將“bri 特尼”作為混輸字符串,由本發(fā)明得到轉(zhuǎn)換結(jié)果“布里特尼”或者“布里特妮”。應(yīng)用場景3用戶欲知道中外合成詞的外文全拼,則應(yīng)用本發(fā)明,可以得到“卡拉0K”、“多啦A 夢”等中外合成詞的轉(zhuǎn)換結(jié)果“Karaoke”、"Doraemon”。參照圖1,示出了本發(fā)明一種基于混輸字符串進(jìn)行字符轉(zhuǎn)換的方法實(shí)施例的流程圖,具體可以包括步驟101、獲取混輸字符串;本實(shí)施例可以應(yīng)用于各種翻譯場合,例如,可以是具有翻譯功能的各種軟件,或者,提供翻譯服務(wù)的各種網(wǎng)站等,用于基于混輸字符串進(jìn)行字符轉(zhuǎn)換,得到所述混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。在實(shí)際中,可以依據(jù)用戶輸入獲取所述混輸字符串,例如,直接將用戶在某翻譯網(wǎng)站的輸入“bri特尼”作為混輸字符串;或者,可以通過右鍵選定來獲取所述混輸字符串,例如,可以將某軟件的翻譯功能集成在右鍵菜單中,這樣,在用戶選中“bri特尼”字符串、且觸發(fā)該右鍵菜單的翻譯功能時,即可將“bri特尼”作為本實(shí)施例的混輸字符串。步驟102、區(qū)分混輸字符串中不同類型的混輸片段;以中英混輸字符串為例,其組成主要有如下情形情形1、發(fā)音片段和目標(biāo)語言片段;一般而言,中英混輸字符串是中文漢字和英文的混輸,此時,只需確定該中英混輸字符串的目標(biāo)語言,即可容易地從該中英混輸字符串中獲取發(fā)音片段和目標(biāo)語言片段;其中,所述目標(biāo)語言可由用戶指定,或者,從混輸字符串所包含的兩個不同語言的片段中任意確定一個語言片段作為目標(biāo)語言即可。以“bri特尼”為例,“bri特尼”字符串中包括了英文片段和中文片段,假設(shè)用戶指定的目標(biāo)語言為英文,那么,其中的目標(biāo)語言片段即是“bri”,而中文發(fā)音片段則是“特尼”。 或者,在用戶沒有指定的情況下,可以確定英文為目標(biāo)語言,也可以確定中文為目標(biāo)語言; 在將漢字作為目標(biāo)語言時,其中的目標(biāo)語言片段即是“特尼”,而英文發(fā)音片段則是“bri”; 在將英文作為目標(biāo)語言時,其中的目標(biāo)語言片段即是“bri”,而中文發(fā)音片段則是“特尼”。但在某些情形下,中英混輸字符串還可以是中文拼音和英文的混輸,例如,用戶欲輸入美國影星施瓦辛格的全名,當(dāng)輸入到“schwar”時,卻發(fā)現(xiàn)后面的部分記不清了,故選擇用該部分“辛格”的中文拼音“xinge”。此時,所述混輸字符串可以采用分隔符“’ ”來連接所述中文拼音和英文,例如,。此時,可通過如下方式來區(qū)分所述中文發(fā)音片段“xinge”和英文片段“schwar”的內(nèi)容例如,將大寫字母作為英文片段,非大寫字母作為中文發(fā)音片段,此時,所述混輸串可以是“SCHWARxinge” ;或者,按shift切換英文輸入的文字作為英文片段,中文輸入模式下輸入的文字作為中文發(fā)音片段;或者,首先利用特殊符號將所述英文片段和中文發(fā)音片段分割開來,然后,確定所述兩個片段所屬的語言;例如,對于“schwar’ xinge”混輸串, 可首先利用分隔符“ ’ ”將所述兩個片段區(qū)分開來。由于中文拼音和英文均為字母拼寫,在實(shí)際中,可根據(jù)拼寫習(xí)慣,確定某一片段所屬的語言。例如,漢字共有415個基本音節(jié)(不含聲調(diào)的音節(jié)),可據(jù)此得知“xinge”屬于中文發(fā)音片段;又如,英文單詞具有固定的拼寫習(xí)慣,比如字母片段“qw”、“qd”、“bd”、“000” 非法,而“ps”、“tr”可以出現(xiàn)在單詞開頭,據(jù)此可以得到“sctwar”屬于英文。這樣,對于一個混輸字符串的片段,可根據(jù)所述英文單詞的拼寫習(xí)慣和中文音節(jié)的情況,對該混輸字符串所包含的片段計(jì)算其屬于英文單詞的概率和其屬于中文音節(jié)的概率,以確定其中的某個字母片段是中文拼音還是英文??梢岳斫?,所述發(fā)音片段可以是中文發(fā)音片段、英文發(fā)音片段中的任一種,或者二者組合,甚至也可以為其他類型的發(fā)音表示,本發(fā)明對此不加以限制。例如,ν 5之師==威武之師,其中發(fā)音片段就是由英文字母“V”的發(fā)音和數(shù)字符號“5”的中文發(fā)音組成的。再例如,8錯==不錯,其中,發(fā)音片段就是數(shù)字符號“8”,但是其正式中文發(fā)音為 “ba”,而不是“bu”,而在本發(fā)明中可以將其識別為“bu”。即在本發(fā)明的具體實(shí)現(xiàn)中,可以依據(jù)用戶使用習(xí)慣,形成數(shù)字符號“8”到“ba”和“bu”的映射;并不局限與其正式的發(fā)音標(biāo)準(zhǔn),可以進(jìn)行變形。情形2、目標(biāo)語言的發(fā)音片段和非目標(biāo)語言的發(fā)音片段。例如,對于中英混輸串“卡拉0K”,可以將其中的“卡拉”區(qū)分為中文發(fā)音片段,“0K” 區(qū)分為英文發(fā)音片段。步驟103、基于所有不同類型的混輸片段,并按照預(yù)置處理規(guī)則得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。例如,在所述不同類型的混輸片段包括發(fā)音片段和目標(biāo)語言片段時,所述步驟103 可以包括子步驟P1、獲取所述混輸字符串中的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;子步驟P2、基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。又如,在所述不同類型的混輸片段包括目標(biāo)語言的發(fā)音片段和非目標(biāo)語言的發(fā)音片段時,所述步驟103可以包括子步驟Ql、獲取所述混輸字符串中的目標(biāo)語言的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;子步驟Q2、獲取所述混輸字符串中的非目標(biāo)語言的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;子步驟Q3、基于在目標(biāo)語言下的發(fā)音單元序列,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。其中,所述發(fā)音單元序列可以理解為某種語言下的發(fā)音單元的組合。例如,對于中文而言,所述發(fā)音單元就是拼音音節(jié)(如,/chen/, /ya/、/da/等), 這樣,英文發(fā)音片段在中文下的發(fā)音單元序列即是中文拼音。對于英文而言,所述發(fā)音單元就是英文音標(biāo)(如,元音/i/、/ai/,輔音/b/、/ts/ 等),這樣,中文發(fā)音片段在英文下的發(fā)音單元序列即是英文音標(biāo)。在具體實(shí)現(xiàn)中,可以通過兩種語言間發(fā)音上的映射關(guān)系,采用各種方式獲取各種發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列。例如,對于中文漢字和英文的混輸字符串,如果目標(biāo)語言是英文,那么,獲取該中文漢字在英文下的發(fā)音單元序列的過程可以包括中文漢字一中文拼音一英文音標(biāo),其中, “一”表示轉(zhuǎn)化或映射關(guān)系。對于中文拼音和英文的混輸字符串,如果目標(biāo)語言是英文,那么,獲取該中文拼音在英文下的發(fā)音單元序列的過程可以包括中文拼音一英文音標(biāo)。如果目標(biāo)語言是中文,則獲取英文片段在中文下的發(fā)音單元序列的過程可以包括英文一英文音標(biāo)一中文拼音。再例如,對于英文和德文或者法文等語言的混合字符串;英文片段一英文音標(biāo)一德文或者法文音標(biāo)。
以下對子步驟P1-P2的執(zhí)行過程進(jìn)行詳細(xì)說明,其針對混輸字符串,可以同時依據(jù)其中的發(fā)音片段和目標(biāo)語言片段,來獲取該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。具體而言,首先將其中的發(fā)音片段映射為在目標(biāo)語言下的發(fā)音單元序列,然后,利用所述發(fā)音單元序列和目標(biāo)語言片段的聯(lián)系,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。例如,對于中英混輸字符串,子步驟P2可以是依據(jù)英文發(fā)音片段在中文下的中文拼音,以及中文片段(中文漢字或者中文拼音),得到中文漢字;或者,依據(jù)中文發(fā)音片段在英文下的英文音標(biāo),以及英文片段,得到英文單詞。本發(fā)明可以提供如下子步驟P2獲取轉(zhuǎn)換結(jié)果的方案方案一、本方案的思想在于,利用發(fā)音片段和目標(biāo)語言片段在發(fā)音上的聯(lián)系,對所述兩個片段的發(fā)音單元序列進(jìn)行整合;此時,所述子步驟P2可以包括子步驟Al、獲取目標(biāo)語言片段在目標(biāo)語言下的發(fā)音單元序列;子步驟A2、基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段在目標(biāo)語言下的發(fā)音單元序列,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。以“bri特尼”為例,假設(shè)其中的目標(biāo)語言片段是“bri”,發(fā)音片段“特尼”。則通過子步驟P2,得到發(fā)音片段“特尼”在目標(biāo)語言(英文)下的發(fā)音單元序列,也即英文音標(biāo)是 /tni/,那么,再通過子步驟Al可以獲取“bri ”的英文音標(biāo)/bri八而子步驟A2可以首先對所述兩個英文音標(biāo)進(jìn)行可能的整合,例如其中的一個整合結(jié)果為[britni],然后,根據(jù)該整合結(jié)果[britni],通過檢索詞庫等方式映射得到轉(zhuǎn)換結(jié)果“Britney”。另外,上述示例中的發(fā)音片段“特尼”還可以對應(yīng)其它英文音標(biāo),如t/t9ni/,這樣,子步驟A2得到的整合結(jié)果中可以包栝[’ briteni],通過檢索詞庫等方式進(jìn)而得到的轉(zhuǎn)換結(jié)果為 “Brittany”??傊?,本方案通過整合得到該混輸字符串在目標(biāo)語言下的發(fā)音單元序列,然后映射得到相應(yīng)的轉(zhuǎn)換結(jié)果。方案二、本方案的思想在于,利用發(fā)音片段和目標(biāo)語言片段在字符上的聯(lián)系,對所述兩個片段的字符序列進(jìn)行連接;此時,所述子步驟P2可以包括子步驟Bi、基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,得到相應(yīng)的目標(biāo)語言字符序列;子步驟B2、將所得到的目標(biāo)語言字符序列和所述目標(biāo)語言片段連接,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。以“bri特尼”為例,假設(shè)其中的目標(biāo)語言片段是“bri”,則通過子步驟P1,得到發(fā)音片段“特尼”對應(yīng)的英文音標(biāo)是/tni/或/tsni/,那么,再通過子步驟Bl可以得到/tni/的英文字符序列teny,或者,/tani/的英文字符序列taney。這樣,子步驟B2將目標(biāo)語言片段是“bri”與子步驟Bl得到的英文字符序列進(jìn)行連接,得到的轉(zhuǎn)換結(jié)果可以為“Briteny”,或者,“Brittany”。對于目標(biāo)語言為中文的情形,“bri特尼”中的中文片段為“特尼”,假設(shè)其通過步驟102,發(fā)音片段“bri”對應(yīng)的中文拼音為/buli/,那么,子步驟Bl可以得到/buli/的中文字符序列,也即漢字,假設(shè)為“布里”,那么,子步驟B2可以將所述“布里”和“特尼”連接,
15得到轉(zhuǎn)換結(jié)果可以為“布里特尼”。無論目標(biāo)語言是英文還是中文,字符都可以作為該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果的基本組成單位,進(jìn)一步,目標(biāo)語言片段又可以作為該轉(zhuǎn)換結(jié)果中的一種字符序列, 這樣,只需獲取發(fā)音字段的目標(biāo)語言字符序列,然后連接所述兩種字符序列,即可得到所述轉(zhuǎn)換結(jié)果。方案三、上述兩個方案利用部分一整合的思想,通過建立發(fā)音片段和目標(biāo)語言片段在發(fā)音或字符上的聯(lián)系,來獲取所述轉(zhuǎn)換結(jié)果。下面給出本發(fā)明的另一個實(shí)現(xiàn)方案所述子步驟P2可以通過以下子步驟來實(shí)現(xiàn)本方案子步驟Cl、基于所述目標(biāo)語言片段,在詞庫中匹配查詢得到相應(yīng)的字詞集合;子步驟C2、利用發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,在所述字詞集合中搜索得到匹配項(xiàng),作為該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。以“chau弗”為例,假設(shè)其中的目標(biāo)語言片段是“chau”,則通過子步驟Pl得到發(fā)音片段“弗”對應(yīng)的英文音標(biāo)是./&/,那么,通過子步驟Cl可以在詞庫中匹配查詢得到以“chau”開頭的單詞集合(例如,此時可以將發(fā)音片段以通配符的方式進(jìn)行替代),例如 {chauffeur, chauvinism,. . .,chauvinist};子步驟C2則可以利用音標(biāo)/fs/,在所述單詞集合中為搜索匹配項(xiàng)chauffeur,也即本發(fā)明的轉(zhuǎn)換結(jié)果。對于混輸字符串“chau弗”,要求其在目標(biāo)語言下的轉(zhuǎn)換結(jié)果以目標(biāo)語言片段 “chau”開頭,同時后面的字符序列與發(fā)音片段“弗”的發(fā)音相近;由于目標(biāo)語言片段作為轉(zhuǎn)換結(jié)果的組成字符序列,而發(fā)音片段能夠限定轉(zhuǎn)換結(jié)果中除目標(biāo)語言片段外其它部分的發(fā)音,因此,本方案能夠?qū)崿F(xiàn)一種限定范圍的字詞匹配,縮小匹配范圍,提升混輸字符串到轉(zhuǎn)換結(jié)果的效率??梢岳斫?,本方案的詞庫可以用其它具有字詞存儲功能的數(shù)據(jù)結(jié)構(gòu)來代替,本發(fā)明并不需要對此加以限制;例如,所述數(shù)據(jù)結(jié)構(gòu)可以位于本地或遠(yuǎn)程服務(wù)器上。以上對獲取轉(zhuǎn)換結(jié)果的幾種方案進(jìn)行了詳細(xì)介紹,所述幾種方案能夠針對多種場景下的混輸字符串,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果,能夠滿足用戶需求;可以理解,本領(lǐng)域技術(shù)人員可以根據(jù)需要聯(lián)合使用所述幾種方案,或者,使用其中任一種方案, 本發(fā)明對此不加以限制。為使本領(lǐng)域技術(shù)人員更好地理解本發(fā)明,下面給出一個中英混輸字符串的轉(zhuǎn)換過程的具體實(shí)施例,可以包括步驟Si、獲取中英混輸字符串;所述中英混輸字符串可以包括發(fā)音片段和目標(biāo)語言片段;步驟S2、獲取所述發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,具體可以包括子步驟S21、針對所述發(fā)音片段,切分得到對應(yīng)的源語言音節(jié)單元;本步驟是將發(fā)音片段,切分成細(xì)粒度的源語言音節(jié)單元slsk3. . . sn。對于英文發(fā)音片段,切分依據(jù)可以是輔音驅(qū)動,基本上當(dāng)前輔音(組合)到下一個輔音之前為一個音節(jié)(如果元音開頭,則自成一個音節(jié)),但需要考慮輔音連讀(雙寫η、雙寫1等)、或者特殊發(fā)音組合(比如“-er”、“-er-”、“wh-”)的情況。例如,可以針對“sctiwar”切分得到3個英文音節(jié)單元sch,wa和r ;針對bri切分得到2個英文音節(jié)單元b和ri。對于中文發(fā)音片段,如果是中文漢字,則首先將漢字轉(zhuǎn)化為中文拼音,如“特尼”一“teni”,然后,將該中文拼音切分為拼音音節(jié)單元,例如,“teni”的切分結(jié)果可以為 te 禾口 ni0當(dāng)然,對于本發(fā)明而言,如果所述發(fā)音片段包括多個音節(jié)單元,則可以對其切分, 如果所述發(fā)音片段僅僅包括一個音節(jié)單元,則本發(fā)明也可以不進(jìn)行切分步驟,直接識別該音節(jié)單元即可。例如,“chau”只用到一個輔音,故僅僅包括一個音節(jié)單元。子步驟S22、將所述源語言音節(jié)單元轉(zhuǎn)化為源語言發(fā)音單元;所述轉(zhuǎn)化可以是一個多對多的映射。表1給出了英文音節(jié)單元到英文音標(biāo)單元的映射表示例,其中“_”表示音節(jié)在單詞中的前后位置;這樣,通過查閱表1,可以為發(fā)音片段中的源語言音節(jié)單元找到對應(yīng)的源語言發(fā)音單元,例如,對于“ schwar 所述查閱過程可以為:sch — / / /, war — /va/。表權(quán)利要求
1.一種基于混輸字符串進(jìn)行字符轉(zhuǎn)換的方法,其特征在于,包括 獲取混輸字符串;區(qū)分混輸字符串中不同類型的混輸片段;基于所有不同類型的混輸片段,并按照預(yù)置處理規(guī)則得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
2.如權(quán)利要求1所述的方法,其特征在于,所述不同類型的混輸片段包括發(fā)音片段和目標(biāo)語言片段,所述獲得轉(zhuǎn)換結(jié)果的步驟包括獲取所述混輸字符串中的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列; 基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
3.如權(quán)利要求1所述的方法,其特征在于,所述不同類型的混輸片段包括目標(biāo)語言的發(fā)音片段和非目標(biāo)語言的發(fā)音片段,所述獲得轉(zhuǎn)換結(jié)果的步驟包括獲取所述混輸字符串中的目標(biāo)語言的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列; 獲取所述混輸字符串中的非目標(biāo)語言的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列; 基于在目標(biāo)語言下的發(fā)音單元序列,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
4.如權(quán)利要求2所述的方法,其特征在于,所述基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段得到轉(zhuǎn)換結(jié)果的步驟,包括獲取目標(biāo)語言片段在目標(biāo)語言下的發(fā)音單元序列;基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段在目標(biāo)語言下的發(fā)音單元序列,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
5.如權(quán)利要求2所述的方法,其特征在于,所述基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段得到轉(zhuǎn)換結(jié)果的步驟,包括基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,得到相應(yīng)的目標(biāo)語言字符序列; 將所得到的目標(biāo)語言字符序列和所述目標(biāo)語言片段連接,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
6.如權(quán)利要求2所述的方法,其特征在于,所述基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段得到轉(zhuǎn)換結(jié)果的步驟,包括基于所述目標(biāo)語言片段,在詞庫中匹配查詢得到相應(yīng)的字詞集合; 利用發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,在所述字詞集合中搜索得到匹配項(xiàng),作為該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
7.如權(quán)利要求2所述的方法,其特征在于,將所述混輸字符串中的第一片段作為發(fā)音片段,第二片段作為目標(biāo)語言片段,得到第一目標(biāo)語言下的轉(zhuǎn)換結(jié)果;以及,將所述混輸字符串中的第二片段作為發(fā)音片段,第一片段作為目標(biāo)片段,得到第二目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
8.如權(quán)利要求3所述的方法,其特征在于,將所述混輸字符串中的第一片段作為目標(biāo)語言的發(fā)音片段,第二片段作為非目標(biāo)語言的發(fā)音片段,得到第一目標(biāo)語言下的轉(zhuǎn)換結(jié)果;以及,將所述混輸字符串中的第二片段作為目標(biāo)語言的發(fā)音片段,第一片段作為非目標(biāo)語言的發(fā)音片段,得到第二目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
9.如權(quán)利要求1所述的方法,其特征在于,通過字符類型、大小寫字母、分隔符或者狀態(tài)切換點(diǎn)等信息,區(qū)分混輸字符串中不同類型的混輸片段。
10.如權(quán)利要求1所述的方法,其特征在于,還包括將所述混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果翻譯為另一語言字詞進(jìn)行展示。
11.如權(quán)利要求1所述的方法,其特征在于,當(dāng)用戶輸入長句或詞組時,還包括通過分隔符或者分詞的方式,從用戶所輸入的長句或詞組中得到所需的混輸字符串。
12.一種基于混輸字符串進(jìn)行字符轉(zhuǎn)換的裝置,其特征在于,包括接口單元,用于獲取混輸字符串;區(qū)分單元,用于區(qū)分混輸字符串中不同類型的混輸片段;轉(zhuǎn)換單元,用于基于所有不同類型的混輸片段,并按照預(yù)置處理規(guī)則得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
13.如權(quán)利要求12所述的裝置,其特征在于,所述不同類型的混輸片段包括發(fā)音片段和目標(biāo)語言片段,所述轉(zhuǎn)換單元包括第一音節(jié)獲取模塊,用于獲取所述混輸字符串中的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;第一轉(zhuǎn)換結(jié)果獲取模塊,用于基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
14.如權(quán)利要求12所述的裝置,其特征在于,所述不同類型的混輸片段包括目標(biāo)語言的發(fā)音片段和非目標(biāo)語言的發(fā)音片段,所述轉(zhuǎn)換單元包括第二音節(jié)獲取模塊,用于獲取所述混輸字符串中的目標(biāo)語言的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;第三音節(jié)獲取模塊,用于獲取所述混輸字符串中的非目標(biāo)語言的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;第二轉(zhuǎn)換結(jié)果獲取模塊,用于基于在目標(biāo)語言下的發(fā)音單元序列,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
15.如權(quán)利要求13所述的裝置,其特征在于,所述轉(zhuǎn)換結(jié)果獲取模塊具體用于基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段在目標(biāo)語言下的發(fā)音單元序列,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
16.如權(quán)利要求13所述的裝置,其特征在于,所述轉(zhuǎn)換結(jié)果獲取模塊包括發(fā)音片段字符獲取子模塊,用于基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,得到相應(yīng)的目標(biāo)語言字符序列;拼接子模塊,用于將所得到的目標(biāo)語言字符序列和所述目標(biāo)語言片段連接,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
17.如權(quán)利要求13所述的裝置,其特征在于,所述轉(zhuǎn)換結(jié)果獲取模塊包括詞庫查詢子模塊,用于基于所述目標(biāo)語言片段,在詞庫中匹配查詢得到相應(yīng)的字詞集合;音節(jié)搜索子模塊,用于利用發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,在所述字詞集合中搜索得到匹配項(xiàng),作為該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
18.如權(quán)利要求12所述的裝置,其特征在于,還包括語言翻譯單元,用于將所述混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果翻譯為另一語言字詞。
19.如權(quán)利要求12所述的裝置,其特征在于,還包括切分單元,用于當(dāng)用戶輸入長句或詞組時,通過分隔符或者分詞的方式,從用戶所輸入的長句或詞組中得到所需的混輸字符串。
20.一種文字輸入方法,其特征在于,包括 接收用戶輸入的混輸字符串;區(qū)分混輸字符串中不同類型的混輸片段;基于所有不同類型的混輸片段,并按照預(yù)置處理規(guī)則得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果,并加以展示;依據(jù)用戶指示,輸出指定的轉(zhuǎn)換結(jié)果。
21.如權(quán)利要求20所述的方法,其特征在于,所述不同類型的混輸片段包括發(fā)音片段和目標(biāo)語言片段,所述獲得轉(zhuǎn)換結(jié)果的步驟包括獲取所述混輸字符串中的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列; 基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
22.如權(quán)利要求20所述的方法,其特征在于,所述不同類型的混輸片段包括目標(biāo)語言的發(fā)音片段和非目標(biāo)語言的發(fā)音片段,所述獲得轉(zhuǎn)換結(jié)果的步驟包括獲取所述混輸字符串中的目標(biāo)語言的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列; 獲取所述混輸字符串中的非目標(biāo)語言的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列; 基于在目標(biāo)語言下的發(fā)音單元序列,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
23.如權(quán)利要求21所述的方法,其特征在于,所述基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段得到轉(zhuǎn)換結(jié)果的步驟,包括獲取目標(biāo)語言片段在目標(biāo)語言下的發(fā)音單元序列;基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段在目標(biāo)語言下的發(fā)音單元序列,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
24.如權(quán)利要求21所述的方法,其特征在于,所述基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段得到轉(zhuǎn)換結(jié)果的步驟,包括基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,得到相應(yīng)的目標(biāo)語言字符序列; 將所得到的目標(biāo)語言字符序列和所述目標(biāo)語言片段連接,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
25.如權(quán)利要求21所述的方法,其特征在于,所述基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段得到轉(zhuǎn)換結(jié)果的步驟,包括基于所述目標(biāo)語言片段,在詞庫中匹配查詢得到相應(yīng)的字詞集合; 利用發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,在所述字詞集合中搜索得到匹配項(xiàng),作為該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
26.如權(quán)利要求21所述的方法,其特征在于,將所述混輸字符串中的第一片段作為發(fā)音片段,第二片段作為目標(biāo)片段,得到第一目標(biāo)語言下的轉(zhuǎn)換結(jié)果;以及,將所述混輸字符串中的第二片段作為發(fā)音片段,第一片段作為目標(biāo)片段,得到第二目標(biāo)語言下的轉(zhuǎn)換結(jié)果;展示上述得到的兩種目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
27.如權(quán)利要求22所述的方法,其特征在于,將所述混輸字符串中的第一片段作為目標(biāo)語言的發(fā)音片段,第二片段作為非目標(biāo)語言的發(fā)音片段,得到第一目標(biāo)語言下的轉(zhuǎn)換結(jié)果;以及,將所述混輸字符串中的第二片段作為目標(biāo)語言的發(fā)音片段,第一片段作為非目標(biāo)語言的發(fā)音片段,得到第二目標(biāo)語言下的轉(zhuǎn)換結(jié)果; 展示上述得到的兩種目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
28.如權(quán)利要求20所述的方法,其特征在于,還包括將所述混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果翻譯為另一語言字詞進(jìn)行展示。
29.如權(quán)利要求20所述的方法,其特征在于,當(dāng)用戶輸入長句或詞組時,還包括通過分隔符或者分詞的方式,從用戶所輸入的長句或詞組中得到所需的混輸字符串。
30.一種輸入法系統(tǒng),其特征在于,包括接口單元,用于接收用戶輸入的混輸字符串; 區(qū)分單元,用于區(qū)分混輸字符串中不同類型的混輸片段;轉(zhuǎn)換單元,用于基于所有不同類型的混輸片段,并按照預(yù)置處理規(guī)則得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果;展示單元,用于展示轉(zhuǎn)換結(jié)果;輸出單元,用于依據(jù)用戶指示,輸出指定的轉(zhuǎn)換結(jié)果。
31.如權(quán)利要求30所述的輸入法系統(tǒng),其特征在于,所述不同類型的混輸片段包括發(fā)音片段和目標(biāo)語言片段,所述轉(zhuǎn)換單元包括第一音節(jié)獲取模塊,用于獲取所述混輸字符串中的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;第一轉(zhuǎn)換結(jié)果獲取模塊,用于基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
32.如權(quán)利要求30所述的輸入法系統(tǒng),其特征在于,所述不同類型的混輸片段包括目標(biāo)語言的發(fā)音片段和非目標(biāo)語言的發(fā)音片段;所述轉(zhuǎn)換單元包括第二音節(jié)獲取模塊,用于獲取所述混輸字符串中的目標(biāo)語言的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;第三音節(jié)獲取模塊,用于獲取所述混輸字符串中的非目標(biāo)語言的發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列;第二轉(zhuǎn)換結(jié)果獲取模塊,用于基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
33.如權(quán)利要求31所述的輸入法系統(tǒng),其特征在于,所述轉(zhuǎn)換結(jié)果獲取模塊具體用于 基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列和目標(biāo)語言片段在目標(biāo)語言下的發(fā)音單元序列,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
34.如權(quán)利要求31所述的輸入法系統(tǒng),其特征在于,所述轉(zhuǎn)換結(jié)果獲取模塊包括發(fā)音片段字符獲取子模塊,用于基于發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,得到相應(yīng)的目標(biāo)語言字符序列;拼接子模塊,用于將所得到的目標(biāo)語言字符序列和所述目標(biāo)語言片段連接,得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
35.如權(quán)利要求31所述的輸入法系統(tǒng),其特征在于,所述轉(zhuǎn)換結(jié)果獲取模塊包括詞庫查詢子模塊,用于基于所述目標(biāo)語言片段,在詞庫中匹配查詢得到相應(yīng)的字詞集合;音節(jié)搜索子模塊,用于利用發(fā)音片段在目標(biāo)語言下的發(fā)音單元序列,在所述字詞集合中搜索得到匹配項(xiàng),作為該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。
36.如權(quán)利要求30所述的輸入法系統(tǒng),其特征在于,還包括語言翻譯單元,用于將所述混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果翻譯為另一語言字詞,由所述展示單元進(jìn)行展示。
37.如權(quán)利要求30所述的輸入法系統(tǒng),其特征在于,還包括切分單元,用于當(dāng)用戶輸入長句或詞組時,通過分隔符或者分詞的方式,從用戶所輸入的長句或詞組中得到所需的混輸字符串。
全文摘要
本發(fā)明提供了一種基于混輸字符串進(jìn)行字符轉(zhuǎn)換的方法和裝置,以及一種文字輸入方法和輸入法系統(tǒng),其中,所述基于混輸字符串進(jìn)行字符轉(zhuǎn)換的方法包括獲取混輸字符串;區(qū)分混輸字符串中不同類型的混輸片段;基于所有不同類型的混輸片段,并按照預(yù)置處理規(guī)則得到該混輸字符串在目標(biāo)語言下的轉(zhuǎn)換結(jié)果。本發(fā)明可以在用戶采用混輸字符串進(jìn)行輸入時,也能夠得到用戶所需的輸入結(jié)果。
文檔編號G06F3/023GK102262450SQ20101019316
公開日2011年11月30日 申請日期2010年5月27日 優(yōu)先權(quán)日2010年5月27日
發(fā)明者張揚(yáng), 曹鎮(zhèn) 申請人:北京搜狗科技發(fā)展有限公司