語音翻譯設(shè)備和語音翻譯方法
【專利摘要】本公開涉及一種語音翻譯設(shè)備和一種語音翻譯方法。根據(jù)一個(gè)實(shí)施例,使用用以識(shí)別第一語言和第二語言的語音識(shí)別詞典來識(shí)別第一語言的語音,并且生成所述第一語言的源句子。將所述源句子翻譯成第二語言,并且生成所述第二語言的翻譯句子。檢測(cè)所述翻譯句子中包括的未知詞。所述未知詞沒有被存儲(chǔ)在所述語音識(shí)別詞典中。依據(jù)所述未知詞的表達(dá),評(píng)估所述未知詞的第一發(fā)音候選。依據(jù)對(duì)應(yīng)于所述未知詞的、包括在所述源句子中的原始詞的發(fā)音,評(píng)估所述未知詞的第二發(fā)音候選。將所述未知詞、所述第一發(fā)音候選和所述第二發(fā)音候選相應(yīng)地登記到所述語音識(shí)別詞典中。
【專利說明】語音翻譯設(shè)備和語音翻譯方法
【技術(shù)領(lǐng)域】
[0001]這里描述的實(shí)施例總體上涉及語音翻譯設(shè)備和語音翻譯方法。
【背景技術(shù)】
[0002]存在有機(jī)器翻譯裝置,該機(jī)器翻譯裝置用以接受以第一語言描述的源語言的字符串的輸入,并且將字符串翻譯成用第二語言(用戶希望的語言)描述的另一字符串。此外,通過語音語言處理技術(shù)的最近發(fā)展,實(shí)現(xiàn)了用以將一個(gè)用戶(第一說話者)說出的第一語言的語音翻譯成第二語言并且輸出至另一用戶(第二說話者)的語音翻譯裝置。
[0003]在語音翻譯裝置目前使用的語音識(shí)別詞典和翻譯詞典中,僅存儲(chǔ)由開發(fā)者提供的在一個(gè)范圍內(nèi)的詞匯。尤其地,在語音翻譯裝置中,通過基于使用該裝置的場(chǎng)景或者情況來限制或者轉(zhuǎn)換可識(shí)別的詞匯和可翻譯的詞匯,性能得以提高??梢酝ㄟ^這樣的事實(shí)來想象這個(gè)原因,即與不具有前提了解相比,如果用戶具有一些程度的前提了解而聽談話,對(duì)于用戶來說,理解談話是更容易的。
[0004]在另一方面,在PCT國(guó)際公開WO 2009/129315中公開了用以將第一語言的新詞翻譯成第二語言并且將此翻譯結(jié)果登記到用于第二語言的語音識(shí)別詞典中的技術(shù)。
[0005]在通過語音i全釋(interpretat1n)裝置的實(shí)際會(huì)話中,通過聽相互發(fā)聲并且通過在第一和第二說話者之間確認(rèn)各自的詮釋結(jié)果,會(huì)話得以推進(jìn)。對(duì)于在另一方的語言(第二說話者的語言)中不存在的詞,例如,在從日語到漢語的翻譯中,或者從日語到英語的翻譯中,該詞被音譯為以拉丁字母方式的表達(dá)。此外,在將英語翻譯成日語中,以字母方式的表達(dá)將該詞原樣輸出,或者將該詞音譯成以日語字音表(假名)方式的表達(dá)。
[0006]在這種情況下,當(dāng)另一方(第二說話者)不可以依據(jù)翻譯結(jié)果的表達(dá)評(píng)估語音時(shí),另一方常?;诘谝徽f話者的發(fā)聲而發(fā)聲。相應(yīng)地,如果語音識(shí)別詞典根據(jù)傳統(tǒng)技術(shù)僅通過詞的表達(dá)而更新,用與語音識(shí)別詞典所不同的發(fā)音說出該詞,該詞不能被正確地識(shí)別。
[0007]例如,考慮日語詞“納豆(Nattou) ”(發(fā)酵的大豆)。該詞被翻譯成漢語“納豆”(拼音(漢語拼音系統(tǒng)):na4dou4)和英語詞“Natto”。當(dāng)外國(guó)人觀看此翻譯結(jié)果并且嘗試在接下來的語音中說出此詞時(shí),除了通過觀看他/她的母語的表達(dá)的發(fā)聲之外,外國(guó)人通常通過模仿日語發(fā)音“Nattou”而說出。該日語發(fā)音“Nattou”沒有直接關(guān)聯(lián)到漢語詞“納豆”和英語詞“Natto”。相應(yīng)地,在用以識(shí)別外國(guó)人的發(fā)聲的傳統(tǒng)技術(shù)中,該傳統(tǒng)技術(shù)僅使用依據(jù)翻譯結(jié)果的字符串而評(píng)估的發(fā)音,外國(guó)人的發(fā)聲的語音識(shí)別是失敗的。
[0008]此外,為了提高翻譯準(zhǔn)確性,考慮將所有可翻譯的詞和所有作為翻譯結(jié)果而獲得的詞事先登記到語音識(shí)別詞典中。然而,如果可識(shí)別的詞的數(shù)目無序地增加,生成具有類似于正確詞的發(fā)聲的非正確詞的可能性被提高。于是,詮釋準(zhǔn)確性并不總是被改善。
【發(fā)明內(nèi)容】
[0009]實(shí)施例提供一種語音識(shí)別設(shè)備和語音識(shí)別方法,所述設(shè)備和方法能夠識(shí)別這樣的詞,該詞對(duì)應(yīng)的發(fā)音具有很高的可能性由說話者在流暢會(huì)話中說出。
[0010]根據(jù)一個(gè)實(shí)施例,一種語音翻譯設(shè)備包括語音識(shí)別單元、翻譯單元、未知詞檢測(cè)單元、發(fā)音評(píng)估單元和詞典更新單元。所述語音識(shí)別單元被配置為,通過使用用以識(shí)別第一語言和第二語言的語音識(shí)別詞典識(shí)別語音,將第一語言的語音轉(zhuǎn)換成第一語言的源句子。所述翻譯單元被配置為將所述源句子轉(zhuǎn)換成所述第二語言的翻譯句子。所述未知詞檢測(cè)單位被配置為檢測(cè)包括在所述翻譯句子中的未知詞。所述未知詞沒有被存儲(chǔ)在所述語音識(shí)別詞典中。所述發(fā)音評(píng)估單元被配置為依據(jù)所述未知詞的表達(dá),來評(píng)估所述未知詞的第一發(fā)音候選,并且依據(jù)對(duì)應(yīng)于所述未知詞的、所述源句子中包括的原始詞的發(fā)音,來評(píng)估所述未知詞的第二發(fā)音候選。詞典更新單元被配置為將所述未知詞、所述第一發(fā)音候選和所述第二發(fā)音候選相應(yīng)地登記到所述語音識(shí)別詞典中。
[0011]根據(jù)實(shí)施例,可以提供一種語音識(shí)別設(shè)備和一種語音識(shí)別方法,所述設(shè)備和方法能夠識(shí)別這樣的詞,該詞對(duì)應(yīng)的發(fā)音具有很高的可能性由說話者在流暢會(huì)話中說出。
【專利附圖】
【附圖說明】
[0012]圖1為根據(jù)各種實(shí)施例的語音翻譯設(shè)備的框圖。
[0013]圖2為根據(jù)第一實(shí)施例的語音翻譯設(shè)備的處理的流程圖。
[0014]圖3為對(duì)應(yīng)于源語言發(fā)音的語音識(shí)別結(jié)果和翻譯結(jié)果的一個(gè)實(shí)例。
[0015]圖4為從圖3的翻譯結(jié)果檢測(cè)到的未知詞A和B。
[0016]圖5為根據(jù)第一實(shí)施例的發(fā)音對(duì)應(yīng)表的一個(gè)實(shí)例。
[0017]圖6為根據(jù)第一實(shí)施例的登記到語音識(shí)別詞典中的發(fā)音候選的一個(gè)實(shí)例。
[0018]圖7為根據(jù)第二實(shí)施例的語音翻譯設(shè)備的處理的流程圖。
[0019]圖8為根據(jù)第二實(shí)施例的語際發(fā)音對(duì)應(yīng)表的一個(gè)實(shí)例。
[0020]圖9A、9B和9C為根據(jù)第二實(shí)施例的用以提取未知詞的發(fā)音候選的處理的一個(gè)實(shí)例。
[0021]圖10為根據(jù)第三實(shí)施例的語音翻譯設(shè)備的處理的流程圖。
[0022]圖11為根據(jù)第三實(shí)施例的登記到語音識(shí)別詞典中的優(yōu)選詞的一個(gè)實(shí)例。
[0023]圖12為根據(jù)第三實(shí)施例的優(yōu)選語音識(shí)別的一個(gè)實(shí)例。
【具體實(shí)施方式】
[0024]在下面的實(shí)施例中,作為假設(shè),將解釋第一語言到第二語言的語音翻譯。然而,翻譯方向可是逆向的。此外,即使語音翻譯設(shè)備應(yīng)用一種機(jī)制以同時(shí)地處理多種語言,顯然可以以類似方式處理翻譯方向。
[0025]圖1為根據(jù)各種實(shí)施例的語音翻譯設(shè)備的內(nèi)部部件的框圖。如圖1中所示,語音翻譯設(shè)備包括語音識(shí)別單元100、翻譯單元120、未知詞檢測(cè)單元130、發(fā)音評(píng)估單元140和詞典更新單元150。語音識(shí)別單元100內(nèi)部或者外部連接語音識(shí)別詞典110。
[0026]語音識(shí)別單元100接受用戶(說話者)的發(fā)聲作為語音信號(hào)。例如,該語音信號(hào)可以通過麥克風(fēng)而收集并且通過模擬/數(shù)字轉(zhuǎn)換器(Α/D轉(zhuǎn)換器)而獲得。此外,可通過用記錄介質(zhì)讀取語音(事先記錄的)來接受該語音信號(hào)。通過參考語音識(shí)別詞典110,使用語音識(shí)別技術(shù),語音識(shí)別單元100將接受的語音信號(hào)轉(zhuǎn)換成對(duì)應(yīng)的文本字符串。作為語音識(shí)別單元100使用的語音識(shí)別技術(shù)(自動(dòng)語音識(shí)別),采用了諸如隱馬爾科夫模型法(HiddenMarkov Model Method)的廣泛知道的傳統(tǒng)技術(shù)。這里,省略了其解釋。
[0027]翻譯單元120通過參考翻譯詞典(圖1中未示出)將第一語言的源語言句子(由語音識(shí)別單元100輸出)翻譯成第二語言的目標(biāo)語言句子,并且將該目標(biāo)語言句子輸出。作為翻譯單元120的翻譯處理,可以應(yīng)用在傳統(tǒng)機(jī)器翻譯技術(shù)中所使用的各種方法,例如,一般傳遞方法(general transfer method)、基于實(shí)例方法(example-based method)、統(tǒng)計(jì)方法、語際方法。
[0028]未知詞檢測(cè)單元130從作為翻譯單元120的翻譯結(jié)果的目標(biāo)語言句子檢測(cè)語音識(shí)別單元100的未知詞,以識(shí)別第二語言。例如,如果至少一個(gè)詞未被登記在被參考用以識(shí)別第二語言的語音識(shí)別詞典中,該詞被檢測(cè)為未知詞。
[0029]發(fā)音評(píng)估單元140評(píng)估一組未知詞(由未知詞檢測(cè)單元130輸出)中的每個(gè)未知詞的發(fā)音。作為評(píng)估方法,可以使用語音合成(文本-至-語音)技術(shù)。省略了其解釋。
[0030]此外,發(fā)音評(píng)估單元140基于對(duì)應(yīng)于第二語言的未知詞的第一語言的詞,來評(píng)估發(fā)音。此后,用以評(píng)估發(fā)音的該過程被稱為“依據(jù)源語言的發(fā)音評(píng)估”。這里,可依據(jù)與第二語言的未知詞對(duì)應(yīng)的詞在源語言句子中的表達(dá)來評(píng)估第一語言的發(fā)音。此外,該發(fā)音的評(píng)估可基于與對(duì)應(yīng)于未知詞的源語言句子中的詞等效的、第一語言的發(fā)聲聲音的波形信息。
[0031]例如,通過產(chǎn)生在第一語言和第二語言之間的規(guī)則或者聲音對(duì)應(yīng)表,使用“依據(jù)源語言的發(fā)音評(píng)估”。此外,通過大規(guī)模地收集第一語言和第二語言的發(fā)音對(duì),并且通過使用機(jī)器學(xué)習(xí)在其之間建模變化規(guī)律,可以應(yīng)用用于統(tǒng)計(jì)地評(píng)估新未知詞的發(fā)音的方法。
[0032]詞典更新單元150將未知詞(由未知詞檢測(cè)單元130所檢測(cè))與由發(fā)音評(píng)估單元140所評(píng)估的發(fā)音相對(duì)應(yīng),并且將未知詞登記到被語音識(shí)別單元100所參考的詞典110中。
[0033]此外,詞典更新單元150更新未知詞和(新登記的)發(fā)音對(duì),以便在語音識(shí)別處理中被語音識(shí)別單元100優(yōu)先選擇。例如,當(dāng)操作語音識(shí)別單元100時(shí),如果未知詞(被登記以便被優(yōu)先選擇)被包括在候選中,語音識(shí)別單元100優(yōu)先選擇該未知詞。該未知詞可被登記,使得優(yōu)先級(jí)隨著時(shí)間的推移而降低,或者在完成一系列對(duì)話之后從登記中刪除。
[0034]以下,將解釋各種實(shí)施例的語音翻譯設(shè)備的操作。在下列解釋中,第一語言為日語,并且第二語言為漢語。然而,可以將本原理應(yīng)用到兩種不同的語言。
[0035](第一實(shí)施例)
[0036]圖2為根據(jù)第一實(shí)施例的語音翻譯設(shè)備的處理的流程圖。以下,將通過示出具體實(shí)例結(jié)合圖2的流程圖,解釋每一處理。
[0037]現(xiàn)在,如圖3的上面一行中所示,作為源語言發(fā)聲S,將“MIT0DENATT0UW0TABETAK0T0GAARIMASUKA”輸入到語音識(shí)別單元100。接著,如圖3的中間行中所示,語音識(shí)別單元100輸出語音識(shí)別結(jié)果R “水戸T納豆&食X t C i # A >9 t t力、? ”(你是否曾經(jīng)在水戶吃過發(fā)酵的大豆?)接著,如圖3的下面一行中所示,翻譯單元120獲得漢語翻譯結(jié)果T(S200)。
[0038]然后,在用以獲得漢語翻譯結(jié)果T的過程中,如圖4中所示,通過未知詞檢測(cè)單元130,檢測(cè)到包括兩個(gè)未知詞A和B的未知詞組U,因?yàn)樗鼈兾丛跐h語的語音識(shí)別詞典110中登記。未知詞組U被輸出到發(fā)音評(píng)估單元140 (S210)。此后,對(duì)于兩個(gè)漢語詞“水戸”和“納豆”,這些詞表示下列漢語表達(dá)。
[0039]「水戶」「納豆」
[0040]接著,對(duì)于作為未知詞組U的元素的每個(gè)未知詞,發(fā)音評(píng)估單元140評(píng)估發(fā)音。這里,在第一實(shí)施例的語音翻譯設(shè)備中,首先,依據(jù)每個(gè)未知詞的在第二語言(漢語)中的未登記詞的表達(dá)評(píng)估發(fā)音。例如,對(duì)于漢語詞“水戸”,獲得發(fā)音候選“shui3hu4”。對(duì)于漢語詞“納豆”,獲得發(fā)音候選“na4dou4”。
[0041]此外,發(fā)音評(píng)估單元140依據(jù)每個(gè)未知詞的源語言詞在第一語言中的發(fā)音來評(píng)估發(fā)音候選,即,“ΜΙΤ0”對(duì)應(yīng)于“水戸”,并且“NATTOU”對(duì)應(yīng)于“納豆”。在此評(píng)估中,通過使用語際發(fā)音對(duì)應(yīng)表,轉(zhuǎn)換發(fā)音候選。于是,對(duì)于漢語詞“水戸”,獲得“miltou”。對(duì)于漢語詞“納豆”,獲得 “na4tuo2”。
[0042]通過上述兩個(gè)發(fā)音候選的評(píng)估處理,如圖6中所示,作為漢語詞“水戸”的發(fā)音候選,獲得“shui3hu4”和“miltou”。作為漢語詞“納豆”的發(fā)音候選,獲得“na4dou4”和“na4tuo2”。以這種方式,獲得發(fā)音候選組P (S220)。
[0043]詞典更新單元150將每個(gè)未知詞(包括在未知詞組U中的)與發(fā)音候選組P (由詞典更新單元150評(píng)估)相對(duì)應(yīng),并且將其登記到漢語的語音識(shí)別詞典110中(S230)。
[0044]通過上述處理,基于日語的了解,可以將漢語說話者很高可能性說出的發(fā)音登記到語音識(shí)別詞典110中。相應(yīng)地,對(duì)于漢語說話者很高可能性在流暢會(huì)話中使用的發(fā)音,可以將對(duì)應(yīng)于該發(fā)音的詞識(shí)別為語音。于是,改善在語音會(huì)話中的語音識(shí)別的識(shí)別準(zhǔn)確性,并且改善語音翻譯設(shè)備的詮釋。
[0045]通過這種方式,在第一實(shí)施例中,語音輸入并不總為必需的。這個(gè)原因從這樣的事實(shí)而顯而易見,即,漢語發(fā)音的評(píng)估并不參考日語的原始發(fā)聲的信息。作為語音輸入的替代,可以通過觸摸屏、鼠標(biāo)、鍵盤和手寫,輸入作為翻譯目標(biāo)的源語言句子。
[0046]接著,例如,基于漢語說話者的日語了解,漢語說話者不是以漢語發(fā)音“na4dou4”、而是以類似的漢語發(fā)音“na2tuo2”說出漢語詞“納豆”。這里,在第一實(shí)施例中,對(duì)于漢語詞“納豆”,發(fā)音候選“na2tuo2”沒有被包括。相應(yīng)地,沒有獲得漢語說話者所希望的語音識(shí)別結(jié)果。在第二實(shí)施例中,此問題得以解決。
[0047](第二實(shí)施例)
[0048]將解釋第二實(shí)施例。圖7為根據(jù)第二實(shí)施例的語音翻譯設(shè)備的處理的流程圖。圖8為在第二實(shí)施例中使用的語際發(fā)音對(duì)應(yīng)表。圖9A、9B和9C為示出根據(jù)第二實(shí)施例的用以提取未知詞的發(fā)音候選的過程的示意圖。
[0049]首先,圖4中的處理S400?S420分別對(duì)應(yīng)于圖2中的處理S200?S220。相應(yīng)地,省略其解釋。
[0050]在S430,對(duì)于未知詞組U的每個(gè)元素,發(fā)音評(píng)估單元140通過從語音識(shí)別結(jié)果R收集對(duì)應(yīng)的語音聲音獲得語音聲音組W。簡(jiǎn)要地,對(duì)于作為由未知詞檢測(cè)單元130所輸出的未知詞組U的元素的每個(gè)未知詞,發(fā)音評(píng)估單元140提取對(duì)應(yīng)于未知詞的第一語言的語音聲音。例如,如圖9A中所示,通過提取對(duì)應(yīng)于未知詞“水戸”的語音聲音“ΜΙΤ0”,并且通過提取對(duì)應(yīng)于未知詞“納豆”的語音聲音“NATT0U”,獲得語音聲音組W。
[0051]接著,在S440,語音評(píng)估單元140依據(jù)對(duì)應(yīng)于未知詞的語音聲音評(píng)估發(fā)音候選,并且將發(fā)音候選添加到發(fā)音候選組P。在第二實(shí)施例中,通過使用圖8中所示的語際發(fā)音對(duì)應(yīng)表,轉(zhuǎn)換發(fā)音候選。于是,如圖9B中所示,對(duì)于漢語詞“水戸”,評(píng)估“miltou”。對(duì)于漢語詞“納豆”,評(píng)估“na2tou2”。這些評(píng)估的候選被添加到發(fā)音候選組P。
[0052]最后,在S440,詞典更新單元150將每個(gè)未知詞(被包括在未知詞組U中)與由發(fā)音評(píng)估單元140評(píng)估的發(fā)音候選組P相對(duì)應(yīng),并且將這些對(duì)登記到漢語的語音識(shí)別詞典110中。在這種情況下,這些對(duì)被收集,以便不與在S400?S420獲得的發(fā)音候選重疊。如圖9C中所示,作為漢語詞“水戸”的發(fā)音候選,獲得包括“shui3hu4”和“miltou”的發(fā)音候選組P。此外,作為漢語詞“納豆”的發(fā)音候選,獲得包括“na4d0U4”、“na4tU02”和“na2tou2”的發(fā)音候選組P。詞典更新單元150將每個(gè)未知詞(被包括在未知詞組U中)與發(fā)音候選組P相對(duì)應(yīng),并且將這些對(duì)登記到漢語的語音識(shí)別詞典110中。
[0053]于是,例如,當(dāng)日語說話者通過利用此系統(tǒng)實(shí)際上發(fā)聲時(shí),漢語說話者所實(shí)際上聽到的類似于該發(fā)聲的發(fā)音可以被登記到語音識(shí)別詞典110中。相應(yīng)地,作為對(duì)一方(日語說話者)在流暢會(huì)話中實(shí)際使用的發(fā)聲的響應(yīng),由另一方(漢語說話者)說出的發(fā)音的詞可以被識(shí)別為語音。于是,可以呈現(xiàn)具有更高翻譯準(zhǔn)確性的語音翻譯設(shè)備。
[0054]例如,在漢語說話者聽到在他們的會(huì)話中日語說話者的發(fā)聲“NATTOU”后,漢語說話者不是以漢語發(fā)音“na4dou4”、而是以類似的漢語發(fā)音“na2tou2”發(fā)出漢語詞“納豆”。在這種情況下,通過使用上述更新的語音識(shí)別詞典100,可以正確地識(shí)別漢語詞“納豆”。
[0055](第三實(shí)施例)
[0056]接著,將解釋根據(jù)第三實(shí)施例的優(yōu)選詞的登記。圖10為根據(jù)第三實(shí)施例的語音翻譯設(shè)備的處理的流程圖。圖11為到語音識(shí)別詞典110中的優(yōu)先登記的一個(gè)實(shí)例。圖12為優(yōu)先語音識(shí)別的一個(gè)實(shí)例。
[0057]在圖10中,S500?S520的處理分別對(duì)應(yīng)于圖2中的S200?S220的處理。此外,S530和S540的處理分別對(duì)應(yīng)于圖7中的S430和S440的處理。相應(yīng)地,省略其解釋。
[0058]在S550,詞典更新單元150將每個(gè)未知詞(被包括在未知詞組U中)與由詞典更新單元150評(píng)估的發(fā)音候選相對(duì)應(yīng)。此外,該未知詞被登記到漢語的語音識(shí)別詞典110中,作為相對(duì)于與未知詞具有相同發(fā)音的其它(已經(jīng)登記的)詞的優(yōu)選詞。
[0059]圖11示出被優(yōu)先登記到語音識(shí)別詞典110中的詞的一個(gè)實(shí)例。這里,對(duì)于發(fā)音“na4tuo2”,具有此相同發(fā)音的兩個(gè)候選被登記如下。
[0060]納豆那頭
[0061]在這兩個(gè)候選之中,下面的詞被登記為優(yōu)先I (更優(yōu)選的詞)。
[0062]納豆
[0063]在這種情況下,如圖12的上面一行中所示,對(duì)于漢語發(fā)聲“wo3xiang3mai3na4tou2”,提取如圖12的中間行中所示的四種語音識(shí)別候選。如果漢語詞“納豆”被設(shè)置為優(yōu)選1,那么通過在四種語音識(shí)別候選之中評(píng)估優(yōu)選順序或者評(píng)估通過參考語言模型而計(jì)算的似然性,選擇如圖12的下面一行中所示的一個(gè)語音識(shí)別結(jié)果。相應(yīng)地,在語音識(shí)別中優(yōu)先選擇與主題匹配的詞。于是,可以沿著主題實(shí)現(xiàn)語音翻譯,并且改善語音詮釋的準(zhǔn)確性。
[0064]在上述實(shí)施例中,可以基于作為軟件的程序,執(zhí)行在處理步驟中示出的指示。通過事先將該程序存儲(chǔ)到通用計(jì)算機(jī)中并且通過從中讀取程序,可以獲得與上述機(jī)器翻譯設(shè)備相同的效果。將上述實(shí)施例中描述的指示記錄到磁盤(例如軟盤、硬盤)、光盤(例如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD±R、DVD土RW、藍(lán)光(被登記為商標(biāo))碟)、半導(dǎo)體存儲(chǔ)器或者與其相似的記錄介質(zhì)中,作為計(jì)算機(jī)可執(zhí)行的程序。如果記錄介質(zhì)為嵌入式系統(tǒng)或者計(jì)算機(jī)可讀的,記錄格式可為任何形式。當(dāng)計(jì)算機(jī)從該記錄介質(zhì)讀取該程序并且通過CPU執(zhí)行在程序中描述的指示時(shí),可以實(shí)現(xiàn)與上述實(shí)施例的機(jī)器翻譯設(shè)備相同的操作。當(dāng)然,計(jì)算機(jī)可通過網(wǎng)絡(luò)獲得或者讀取程序。
[0065]此外,基于從記錄介質(zhì)安裝到計(jì)算機(jī)或者嵌入式系統(tǒng)中的程序的指示,在計(jì)算機(jī)上操作的OS (操作系統(tǒng))、數(shù)據(jù)庫(kù)管理軟件或者諸如網(wǎng)絡(luò)的MW(中間件),可執(zhí)行每個(gè)處理的一部分,以實(shí)現(xiàn)本實(shí)施例。
[0066]此外,在本實(shí)施例中,記錄介質(zhì)不限于與計(jì)算機(jī)或者嵌入式系統(tǒng)獨(dú)立的介質(zhì)。通過下載通過LAN或者因特網(wǎng)傳輸?shù)某绦?,存?chǔ)或者暫時(shí)存儲(chǔ)程序的記錄介質(zhì)被包括在內(nèi)。
[0067]此外,記錄介質(zhì)不限于一個(gè)/ 一種。如果使用多個(gè)介質(zhì)執(zhí)行本實(shí)施例的處理,它們被包括在本實(shí)施例的記錄介質(zhì)中。介質(zhì)可具有任何部件。
[0068]此外,在本實(shí)施例中,基于在記錄介質(zhì)中所存儲(chǔ)的程序,使用計(jì)算機(jī)或者嵌入式系統(tǒng)用于執(zhí)行本實(shí)施例的每個(gè)處理。它可以具有一個(gè)設(shè)備(例如個(gè)人計(jì)算機(jī)、微型計(jì)算機(jī))或者系統(tǒng)的任何部件,該系統(tǒng)包括通過網(wǎng)絡(luò)而連接的多個(gè)設(shè)備。
[0069]此外,在本實(shí)施例中,計(jì)算機(jī)不限于個(gè)人計(jì)算機(jī)。計(jì)算機(jī)包括操作處理設(shè)備(被包括在信息處理裝置中)、微型計(jì)算機(jī)等等。簡(jiǎn)要地,計(jì)算機(jī)被一般地命名為能夠通過程序執(zhí)行本發(fā)實(shí)施例的功能的裝置或者設(shè)備。
[0070]盡管已經(jīng)描述某些實(shí)施例,但這些實(shí)施例僅通過舉例的方式呈現(xiàn),并且不旨在限制本發(fā)明的范圍。事實(shí)上,本文所描述的新穎實(shí)施例可以以各種其它形式來實(shí)施;此外,可在不脫離本發(fā)明的精神下,對(duì)本文所描述的實(shí)施例的形式做出各種省略、替代和改變。所附權(quán)利要求以及它們的等價(jià)物旨在將此類形式或者修改覆蓋落在本發(fā)明范圍和精神內(nèi)。
【權(quán)利要求】
1.一種語音翻譯設(shè)備,包括: 語音識(shí)別單元,所述語音識(shí)別單元被配置為,通過使用用以識(shí)別第一語言和第二語言的語音識(shí)別詞典來識(shí)別語音,將第一語言的語音轉(zhuǎn)換成第一語言的源句子; 翻譯單元,所述翻譯單元被配置為將所述源句子轉(zhuǎn)換成所述第二語言的翻譯句子; 未知詞檢測(cè)單元,所述未知詞檢測(cè)單元被配置為檢測(cè)所述翻譯句子中包括的未知詞,所述未知詞沒有被存儲(chǔ)在所述語音識(shí)別詞典中; 發(fā)音評(píng)估單元,所述發(fā)音評(píng)估單元被配置為依據(jù)所述未知詞的表達(dá),評(píng)估所述未知詞的第一發(fā)音候選,并且依據(jù)對(duì)應(yīng)于所述未知詞的、包括在所述源句子中的原始詞的發(fā)音,評(píng)估所述未知詞的第二發(fā)音候選;以及 詞典更新單元,所述詞典更新單元被配置為將所述未知詞、所述第一發(fā)音候選和所述第二發(fā)音候選相應(yīng)地登記到所述語音識(shí)別詞典中。
2.根據(jù)權(quán)利要求1的設(shè)備,其中, 所述發(fā)音評(píng)估單元依據(jù)對(duì)應(yīng)于所述原始詞的、包括在所述語音中的語音聲音來評(píng)估第三發(fā)音候選。
3.根據(jù)權(quán)利要求1的設(shè)備,其中, 所述詞典更新單元登記所述未知詞,使得所述未知詞與已經(jīng)被登記到所述語音識(shí)別詞典中的其它詞相比更為優(yōu)先地被選擇,所述其它詞對(duì)應(yīng)于在所述語音識(shí)別詞典中的所述第一發(fā)音候選或者所述第二發(fā)音候選。
4.一種語音翻譯方法,包括: 通過使用用以識(shí)別第一語言和第二語言的語音識(shí)別詞典來識(shí)別語音,將第一語言的語音轉(zhuǎn)換成所述第一語言的源句子; 將所述源句子轉(zhuǎn)換成所述第二語言的翻譯句子; 檢測(cè)所述翻譯句子中包括的未知詞,所述未知詞沒有被存儲(chǔ)在所述語音識(shí)別詞典中; 依據(jù)所述未知詞的表達(dá),評(píng)估所述未知詞的第一發(fā)音候選; 依據(jù)對(duì)應(yīng)于所述未知詞的、包括在所述源句子中的原始詞的發(fā)音,評(píng)估所述未知詞的第二發(fā)音候選;以及 將所述未知詞、所述第一發(fā)音候選和所述第二發(fā)音候選相應(yīng)地登記到所述語音識(shí)別詞典中。
5.根據(jù)權(quán)利要求4的方法,其中, 評(píng)估第二發(fā)音候選包括 依據(jù)對(duì)應(yīng)于所述原始詞的、包括在所述語音中的語音聲音,來評(píng)估第三發(fā)音候選。
6.根據(jù)權(quán)利要求5的方法,其中, 所述登記包括 將所述未知詞、所述第一發(fā)音候選、所述第二發(fā)音候選和所述第三發(fā)音候選相應(yīng)地登記到所述語音識(shí)別詞典中。
【文檔編號(hào)】G10L15/26GK104462071SQ201410472159
【公開日】2015年3月25日 申請(qǐng)日期:2014年9月16日 優(yōu)先權(quán)日:2013年9月19日
【發(fā)明者】釜谷聰史, 住田一男, 河村聰?shù)? 申請(qǐng)人:株式會(huì)社 東芝