專利名稱:用于機(jī)器翻譯的方法、裝置和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于對例如會議資料或演講資料這樣的文檔進(jìn)行機(jī) 器翻譯的方法、裝置和系統(tǒng)。
背景技術(shù):
近來,信息技術(shù)(IT)普遍用于會議或演講時的演示。例如,電子 資料被分發(fā)給參加者或通過使用投影儀顯示在屏幕上。同樣,隨著全 球化的發(fā)展,頻繁地進(jìn)行使用不同的語言的人之間的國際交流。此外, 隨著例如電視電話和網(wǎng)際協(xié)議(IP)網(wǎng)絡(luò)這樣的各種通信網(wǎng)絡(luò)的發(fā)展, 可以預(yù)料,未來使用電子資料在使用不同語言的人之間溝通的國際交 流將不斷增多。另一方面,隨著自然語言處理技術(shù)的發(fā)展,已經(jīng)實現(xiàn)了將以第一 語言書寫的文本翻譯為第二語言的機(jī)器翻譯裝置的實際使用。因此, 在會議中,即使用說話者的本國語言書寫會議資料,說話者也可以通 過使用機(jī)器翻譯裝置來提供被譯成聽者的本國語言的會議資料。此外,隨著語音處理技術(shù)的發(fā)展,已經(jīng)實現(xiàn)了語音合成器和語音 輸入設(shè)備的實際使用,所述語音合成器將作為電子數(shù)據(jù)的自然語言字 符串轉(zhuǎn)換為語音輸出,所述語音輸入設(shè)備將來自用戶的語音輸入轉(zhuǎn)換 為字符串并且輸出表示語音的自然語言字符串。此外,利用自然語言處理技術(shù)和語音處理技術(shù)的集成,正在改進(jìn) 解釋通信支持裝置的實際使用,其用于支持使用不同語言的人之間的 交流。具體來講,解釋通信支持裝置不僅可以翻譯會議資料,并且可 以將非本國的陳述語音翻譯為聽者的本國語言。因此,解釋通信支持裝置可以用于克服使用不同本國語言的人之間的語言障礙。如上所述,在例如國際會議或演講這樣的國際交流中,那些翻譯 技術(shù)對于使用不同本國語言的人之間的相互了解是非常有用的。
然而,大多數(shù)會議資料或演講資料僅包含最少量的信息,因為所 述資料是根據(jù)陳述語音和參加者的背景知識而創(chuàng)建的。因此,即使在 翻譯資料的過程中出現(xiàn)解釋的多義性,也難以從資料獲取充足的信息 來消除多義性。即,機(jī)器翻譯裝置在翻譯這種會議資料或演講資料時 仍然有困難,特別是在翻譯最近幾年中的演示中頻繁使用的幻燈片 時。此外,因為在其中存在自然語言所有的多義性,所以用機(jī)器翻譯 資料的困難是固有的。為了解決該問題,JP-A 2002-222189(KOKAI)公開了一種技術(shù), 其中,與在利用會議資料的情況中一樣,英文報紙中的文章的大標(biāo)題 具有很少的上下文,通過參照文章的內(nèi)容,它們被精確地譯成目標(biāo)語曰o然而,甚至在上述文檔所公開的技術(shù)中,也很難提供高度精確的 翻譯,因為考慮到講述了詳細(xì)信息的口頭陳述以及參加者的背景知 識,會議資料的說明是概括性的。發(fā)明內(nèi)容根據(jù)本發(fā)明的一個方面, 一種機(jī)器翻譯裝置,包括文檔接收單 元,用于接收以源語言描述的源語言文檔的輸入;翻譯單元,用于將所述源語言文檔翻譯為以目標(biāo)語言描述的翻譯后的文檔,并且創(chuàng)建多義性部分,該多義性部分是在翻譯期間出現(xiàn)多義性的詞或句子;存儲 單元,用于存儲所述翻譯后的文檔以及所述多義性部分;語音接收單 元,用于接收源語言的語音;識別單元,用于識別由所述語音接收單 元接收的語音,并且創(chuàng)建源語言語音句子作為識別結(jié)果;翻譯更新單 元,用于當(dāng)所述源語言文檔包含所述多義性部分時,通過重新翻譯所 述源語言語音句子中的、與所述多義性部分對應(yīng)的一部分語音內(nèi)容來 更新存儲在所述存儲單元中的翻譯后語言文檔;以及顯示控制單元, 用于將由所述翻譯更新單元更新的翻譯后的文檔顯示在顯示單元上。 根據(jù)本發(fā)明的另一個方面, 一種機(jī)器翻譯系統(tǒng),包括顯示裝置, 用于顯示以源語言描述的源語言文檔;以及機(jī)器翻譯裝置,用于將所 述源語言文檔翻譯為以目標(biāo)語言描述的翻譯后的文檔,作為翻譯結(jié)
果,并且所述機(jī)器翻譯裝置經(jīng)由網(wǎng)絡(luò)連接到所述顯示裝置,其中,所 述機(jī)器翻譯裝置包含文檔接收單元,用于接收所述源語言文檔的輸 入;翻譯單元,用于將所述源語言文檔翻譯為所述翻譯后的文檔,并且創(chuàng)建多義性部分,所述多義性部分是具有在翻譯期間出現(xiàn)的多義性的詞或句子;存儲單元,用于存儲所述翻譯后的文檔以及所述多義性 部分;語音接收單元,用于接收源語言的語音;識別單元,用于識別 由所述語音接收單元接收的語音,并且創(chuàng)建源語言語音句子作為識別 結(jié)果;翻譯更新單元,用于當(dāng)所述源語言文檔包含所述多義性部分時, 通過重新翻譯所述源語言語音句子中的、與所述多義性部分對應(yīng)的一 部分語音內(nèi)容來更新存儲在所述存儲單元中的翻譯后語言文檔;第一 顯示控制單元,用于將由所述翻譯更新單元更新的翻譯后的文檔顯示 在第一顯示單元上;以及發(fā)送單元,用于將存儲在所述存儲單元中的 所述多義性部分發(fā)送給所述顯示裝置,并且所述顯示裝置包括接收 單元,用于從所述機(jī)器翻譯裝置接收所述多義性部分;以及第二顯示 控制單元,用于在第二顯示單元上顯示所述源語言文檔,所述源語言 文檔包括基于由所述接收單元接收的所述多義性部分的、用于指示存 在出現(xiàn)多義性的多義性部分的信息。根據(jù)本發(fā)明的另一個方面, 一種機(jī)器翻譯方法,包括接收以源 語言描述的源語言文檔的輸入;將所述源語言文檔翻譯為以目標(biāo)語言 描述的翻譯后的文檔,并且創(chuàng)建多義性部分,所述多義性部分是具有 在翻譯期間出現(xiàn)的多義性的詞或句子;將所述翻譯后的文檔以及所述 多義性部分存儲在存儲單元中;接收源語言的語音;識別所述語音并 且創(chuàng)建源語言語音句子作為識別結(jié)果;當(dāng)所述源語言文檔包括多義性 部分時,通過重新翻譯所述源語言語音句子中的、與所述多義性部分 對應(yīng)的一部分語音內(nèi)容來更新存儲在所述存儲單元中的翻譯后語言 文檔;以及將在更新中更新的所述翻譯后的文檔顯示在顯示單元上。
圖1是根據(jù)本發(fā)明第一實施例的機(jī)器翻譯裝置的框圖; 圖2是顯示翻譯結(jié)果表的例子的說明性的示圖3是顯示多義性表的例子的說明性的示圖; 圖4是顯示用于說明解釋依賴多義性的例子的說明性的示圖; 圖5是用于說明圖1所示的翻譯更新單元的框圖; 圖6是由根據(jù)第一實施例的機(jī)器翻譯裝置執(zhí)行的機(jī)器翻譯處理 的流程圖;圖7是由根據(jù)第一實施例的機(jī)器翻譯裝置執(zhí)行的靜態(tài)翻譯處理 的流程圖;圖8是由根據(jù)第一實施例的機(jī)器翻譯裝置執(zhí)行的動態(tài)翻譯處理 的流程圖;圖9是顯示源語言句子和源語言語音句子之間的對應(yīng)的例子的 說明性的示圖;圖10是顯示源語言句子和源語言語音句子之間的對應(yīng)的另一個例子的說明性的示圖;圖11是由根據(jù)第一實施例的機(jī)器翻譯裝置執(zhí)行的翻譯后文檔顯示處理的流程圖;圖12是顯示顯示在翻譯后文檔顯示屏幕上的翻譯后的文檔的例子的說明性的示圖;圖13是根據(jù)本發(fā)明第二實施例的機(jī)器翻譯系統(tǒng)的框圖;圖14是顯示多義性管理表的例子的說明性的示圖;圖15是由根據(jù)第二實施例的機(jī)器翻譯裝置執(zhí)行的靜態(tài)翻譯處理的流程圖;圖16是由根據(jù)第二實施例的機(jī)器翻譯裝置執(zhí)行的動態(tài)翻譯處理 的流程圖;圖17是由根據(jù)第二實施例的機(jī)器翻譯系統(tǒng)執(zhí)行的源語言文檔顯 示處理的流程圖;圖18是顯示顯示在源語言文檔顯示屏幕上的源語言文檔的例子 的說明性的示圖;圖19是顯示顯示在源語言文檔顯示屏幕上的源語言文檔的另一 個例子的說明性的示圖;圖20是顯示多義性表的例子的說明性的示圖; 圖21是顯示顯示在翻譯后文檔顯示屏幕上的翻譯后的文檔的例子的說明性的示圖;圖22是顯示多義性表的例子的說明性的示圖;圖23是顯示顯示在翻譯后文檔顯示屏幕上的翻譯后的文檔的另一個例子的說明性的示圖;圖24是顯示用于說明依賴結(jié)構(gòu)的例子的說明性的示圖;圖25是顯示顯示在翻譯后文檔顯示屏幕上的翻譯后的文檔的另一個例子的說明性的示圖;圖26是顯示翻譯后的文檔的顯示內(nèi)容的例子的說明性的示圖; 圖27是顯示多義性管理表的例子的說明性的示圖; 圖28是顯示源語言文檔的顯示內(nèi)容的例子的說明性的示圖; 圖29是顯示源語言文檔的顯示內(nèi)容的另一個例子的說明性的示圖;以及圖30是用于說明根據(jù)第一或第二實施例的機(jī)器翻譯裝置的硬件 結(jié)構(gòu)的框圖。
具體實施方式
以下參照附圖詳細(xì)地說明本發(fā)明的示例性的實施例。雖然在實施 例中將日語-英語翻譯以及英語-日語翻譯作為例子進(jìn)行說明,但是本 發(fā)明可以被用于所有語言,包括但不局限于日語和英語作為翻譯目標(biāo)根據(jù)第一實施例的機(jī)器翻譯裝置ioo通過參考用于說明會議資料、演示資料等等的語音內(nèi)容,可以消除在翻譯例如會議資料這樣的 文檔時的多義性。由例如句號、問號或感嘆號而分開的字符串單位被稱為句子,包 括至少一個句子的、其中表達(dá)了 一個主題或題目的字符串的單位稱為 文檔。如圖1所示,機(jī)器翻譯裝置100包括存儲單元120、文檔接收單 元101、翻譯單元102、語音接收單元103、語音識別單元104、翻譯 更新單元105、顯示控制單元106以及語音輸出控制單元107。
存儲單元120是例如硬盤驅(qū)動器(HDD)、光盤、存儲卡或隨機(jī)存 取存儲器(RAM)這樣的存儲介質(zhì),并且在其中存儲翻譯結(jié)果表121和 多義性表122。翻譯結(jié)果表121在其中存儲包含在文檔(即,資料)中的句子的翻 譯結(jié)果。如圖2所示,被分配給每一個句子以唯一標(biāo)識句子的句子標(biāo) 識符(ID)和翻譯結(jié)果相對應(yīng)地存儲在翻譯結(jié)果表121中。另外,在該 例子中,用英語寫的資料被譯成日語。根據(jù)本實施例,假設(shè)文檔中的每個單獨的行包括一個句子,因此 順序地分配給每一行的行號稱為句子ID。然而,如果假定每一行包 括兩個或更多句子,則句子ID被分配給每一個句子,以使得可以唯 一地標(biāo)識句子。多義性表122在其中存儲關(guān)于在翻譯過程中出現(xiàn)的多義性的信 息。具體來講,如圖3所示,句子ID以及多義性信息被相應(yīng)地存儲 在多義性表122中,所述多義性信息包括多義性的類型以及出現(xiàn)多義 性的部分的位置信息。能夠指定影響翻譯結(jié)果的多義性的類型。多義性的類型包括,例 如,"譯文選擇",其指示當(dāng)選擇包含在句子中的詞的譯文時出現(xiàn)的多 義性,以及"依賴"(dependency),其指示當(dāng)識別到包含在句子中的 詞之間的依賴性時出現(xiàn)的多義性。其中出現(xiàn)多義性的部分的位置信息由"(k,l), (m,n)"指示,其中, "k"和"1"分別表示源語言句子中的、在翻譯過程中出現(xiàn)多義性的 部分的開始詞位置和結(jié)束詞位置。例如,如果(k,l)是(2,5),那么當(dāng)源 語言句子中的從第二個詞到第五個詞的部分被譯成目標(biāo)語言時,出現(xiàn) 多義性。類似地,"m"和"n"分別表示翻譯后的句子中的、在譯文 過程中出現(xiàn)多義性的部分的開始詞位置和結(jié)束詞位置。文檔接收單元101接收文本格式的文檔的輸入,例如演示資料或 會議資料。任何常規(guī)方法都可以用于將文檔輸入到文檔接收單元101 。 例如,文檔接收單元101可以經(jīng)由計算機(jī)可讀記錄介質(zhì)接收電子文檔 的輸入,所述計算機(jī)可讀記錄介質(zhì)例如磁帶、磁盤和光盤,或者可以 經(jīng)由例如因特網(wǎng)這樣的網(wǎng)絡(luò)來下載電子文檔。此外,如果文檔是不能
由文檔接收單元101接收的格式,例如紙質(zhì)文檔,那么通過光字符閱 讀機(jī)(OCR)等等將該文檔轉(zhuǎn)換為電子格式,從而文檔接收單元101可 以接收該文檔的輸入。以下,由文檔接收單元101接收的文檔稱為源語言文檔,并且包 含在源語言文檔中的每一個句子稱為源語言句子。翻譯單元102將由文檔接收單元101接收的源語言文檔翻譯為目 標(biāo)語言的翻譯后的文檔。然后,翻譯單元102將翻譯后的文檔作為翻 譯結(jié)果存儲在翻譯結(jié)果表121中,并且將關(guān)于在翻譯過程中出現(xiàn)的多 義性的多義性信息存儲在多義性表122中。具體來講,翻譯單元102從源語言文檔取得每一個源語言句子, 并且順次地將所取得的源語言句子翻譯為目標(biāo)語言,然后存儲翻譯后 的句子作為翻譯結(jié)果,并且將關(guān)于在句子的翻譯處理中出現(xiàn)的多義性 的多義性信息存儲在多義性表122中。如上所述,多義性信息包括在翻譯處理中出現(xiàn)的多義性的類型,源語言句子中出現(xiàn)多義性的部分的 位置以及翻譯后的句子中的出現(xiàn)多義性的部分的位置。例如,當(dāng)英語句子"Difficulties of processing SL"被譯成日語時, 假設(shè)詞"SL"的翻譯是表示"source language"、 "spoken-language"、 "salvage loss"、 "sea level"以及"symbolic language"的五個日語詞 中的任何一個。在這種情況下,翻譯單元102輸出"source language" 的日語翻譯,它是作為默認(rèn)值的第一個引用的詞。然后,由于詞"SL"的日語翻譯的多個選擇出現(xiàn)多義性,因此, 翻譯單元102指定"譯文選擇"為多義性的類型,并且輸出"(譯文 選擇,(4,4),(1,1)),,作為多義性信息,其指示詞"SL"的開始位置和 結(jié)束位置都是英語句子中的第四個詞,并且表示詞"SL"的日語譯 文的開始位置和結(jié)束位置也都是翻譯后的句子中的第一個詞。在英語句子"It requires special mechanisms for a recognizer."被譯 成日語的情況中,假設(shè)兩個模式的解釋依賴多義性出現(xiàn)在翻譯處理中 C參見圖4)。在解釋401中,如箭頭所指,其被解釋為"arecognizer"依賴于 "special mechanism"。另夕卜,詞語之間的依賴關(guān)系由箭頭指示,如圖4所示。在解釋402中,如箭頭所指,其被解釋為"a recognizer"依賴于 "requires 在這種情況下,翻譯單元102選擇解釋401,它是作為默認(rèn)值的 第一個引用的解釋,并且指定"依賴"為多義性的類型,并且輸出"(依 賴,(1,7),(1,8》"作為多義性信息,其指示在英語句子中出現(xiàn)多義性 的部分的開始位置和結(jié)束位置分別是第一個詞和第七個詞,并且對應(yīng) 于所述部分的日語譯文的開始位置和結(jié)束位置分別是翻譯后的句子 中的第一個詞和第八個詞。任何在機(jī)器翻譯系統(tǒng)中使用的方法都可以被用于由翻譯單元102 執(zhí)行的翻譯處理。例如,轉(zhuǎn)換法、基于例子的方法、基于統(tǒng)計的方法 以及中間語言方法都可用于翻譯處理。此外,為了檢測多義性,能夠 使用一般的方法,例如,使用A+算法的形態(tài)分析,例如Earley分析 方法的語法分析,圖表分析方法以及通用LR分析方法,或者上下文 分析以及話語分析,它們基于Shank的腳本或話語表示理論。語音接收單元103經(jīng)由話筒(未顯示)從用戶接收語音輸入,并且 采樣輸入語音的模擬信號,將所采樣的模擬信號轉(zhuǎn)換為立體聲數(shù)字信 號,然后輸出該立體聲數(shù)字信號。例如,傳統(tǒng)的模擬到數(shù)字(A/D)轉(zhuǎn) 換技術(shù)可以被用于由語音接收單元103執(zhí)行的上述處理。語音識別單元104對于由語音接收單元103接收的語音執(zhí)行語音 識別處理,并且輸出文本格式的語音。另外,語音識別單元104可以 使用例如線性預(yù)測編碼(LPC)分析或隱馬爾可夫模型(HMM),通過通 用的語音識別方法來執(zhí)行語音識別處理。以下,由語音識別單元104 輸出的文本稱為源語言語音句子。在該實施例中,通過語音接收單元103和語音識別單元104將語 音轉(zhuǎn)換為文本格式。或者,經(jīng)由鍵盤或鼠標(biāo),語音的內(nèi)容(源語言語 音句子)可以被直接輸入到機(jī)器翻譯裝置,或者還能夠按照與文檔接 收單元101相同的方式將語音的內(nèi)容轉(zhuǎn)換源語言語音句子,并且將轉(zhuǎn) 換后的源語言語音句子輸入到機(jī)器翻譯裝置。翻譯更新單元105將源語言語音句子翻譯為以目標(biāo)語言寫的翻
譯后的句子,并且參照翻譯后的句子和存儲在多義性表122中的多義 性信息消除在將源語言語音句子翻譯為翻譯后的文檔的過程中出現(xiàn) 的多義性,然后利用其中消除了多義性的翻譯后的文檔更新翻譯結(jié)果 表121。具體來講,翻譯更新單元105翻譯由語音接收單元103接收的源 語言語音句子,并且通過將源語言語音句子與由文檔接收單元101接 收的源語言文檔中的源語言句子相對應(yīng)來消除翻譯過程中出現(xiàn)的多 義性。然后,翻譯更新單元105將所消除的多義性反映到由翻譯單元 102輸出的翻譯后的文檔,并且更新多義性表122。如圖5所示,翻譯更新單元105包括提取單元501和翻譯結(jié)果選 擇單元502。提取單元501從由文檔接收單元101接收的源語言文檔中提取源 語言句子中的、與由語音接收單元103接收的源語言語音句子最類似 的源語言句子。具體來講,提取單元501執(zhí)行第一定位處理,其估計源語言文檔 的哪個范圍對應(yīng)于所接收的源語言語音句子。在幻燈片作為演示資料 的情況中,范圍的單位例如是每一個幻燈片,在包括多章的會議資料 的情況中,范圍的單位例如是每一個章或每一個子句。提取單位501將用于檢測源語言句子的范圍縮小到當(dāng)前由說話 者說明的語音內(nèi)容的部分的范圍,作為提取單元501的最終輸出,其 與源語言語音句子最類似。因此,提取單元501可以高速地和高精度 地將源語言句子與源語言語音句子相對應(yīng)。在第一定位處理中,當(dāng)將幻燈片或主題移動到下一個時使用的短 語被預(yù)先存儲在存儲單元沐顯示)中作為關(guān)鍵字,例如,"next"、"well" 以及"next showing",因此,通過所存儲的短語與包含在說話者的語 音中的短語之間的關(guān)鍵字匹配,可以容易地檢測到到下一個幻燈片或 主題的移動。同樣,傳統(tǒng)的對應(yīng)技術(shù)可以被用于第一定位處理。例如, 計算語音和文本之間的相似性,從而通過使用動態(tài)規(guī)劃等可以動態(tài)地 檢測具有最高相似度的對應(yīng)關(guān)系。此外,還能夠?qū)⒃谳斎胝f話者的語 音時所顯示的幻燈片或位置設(shè)置為對應(yīng)位置。200710146966.6說明書第10/29頁此外,通過添加例如頁碼這樣的位置信息以及通過從語音檢測指示位置的關(guān)鍵字,例如,"I'll talk about section 3 in chapter 3.",可以改進(jìn)第一定位處理的精度,其中,所述頁碼由說話者的語音或指針(未 顯示)指示給聽者。具體來講,提取單元501通過與預(yù)先存儲在存儲單元(未顯示)中 的關(guān)鍵字匹配的關(guān)鍵字,從源語言語音句子中檢測表示關(guān)于文檔的范 圍的信息的關(guān)鍵字,例如頁、章節(jié)、子句以及段落,并且指定對應(yīng)于 所檢測的關(guān)鍵字的源語言文檔的范圍。然后,提取單元501從所指定 的范圍中提取源語言句子。接下來,提取單元501執(zhí)行第二定位處理,其中,源語言語音句 子對應(yīng)于包含在第一定位處理所估計的范圍中的源語言句子中的、與 所述源語言語音句子最類似的一個源語言句子。在本實施例中,相對于包含在第一定位處理所估計的范圍中的每 一個源語言句子,通過下列等式(l)計算包含在每一個源語言句子中 的詞與包含在源語言語音句子中的詞之間的所有相似度,并且輸出具 有最高句子相似度SIMs的一個源語言句子。5ZMy(M, TV) = f arg max(5/脅0,., w》) (1)然而,如果句子相似度SIMs低于閾值,那么確定不存在對應(yīng)于 源語言語音句子的源語言句子。因此,以失敗結(jié)束第二定位處理。另外,在等式(l)中,參考符號"M"表示源語言語音句子,"N" 表示包含在第一定位處理所估計的范圍中的源語言句子,"wi"表示 包含在M中的第i個短語,"wj"表示包含在N中的第j個短語,并 且"m"表示包含在M中的短語的數(shù)量。參考符號"SIMw(wi,wj)" 表示用于計算詞之間的相似度的函數(shù)。可以通過任何計算詞語之間的 相似度的常規(guī)方法來獲得詞語之間的相似度,例如,計算按類屬詞典 排列的概念之間的距離的方法。通過上述處理,源語言語音句子對應(yīng)于包含所接收的源語言文檔 中的源語言句子中的、與所述源語言語音句子最類似的一個源語言句 子,并且根據(jù)包含在源語言句子中的詞與包含在源語言語音句子中的
詞之間的相似度來獲得源語言句子和源語言語音句子之間的對應(yīng)關(guān) 系。翻譯結(jié)果選擇單元502根據(jù)由提取單元501獲得的定位結(jié)果重新 選擇翻譯結(jié)果,從而消除存儲在多義性表122中的多義性。例如,當(dāng) 多義性的類型是"譯文選擇"時,翻譯結(jié)果選擇單元502根據(jù)由提取 單元501獲得的定位結(jié)果優(yōu)先地重選擇包含在與源語言句子對應(yīng)的 源語言語音句子中的詞的譯文。另一方面,當(dāng)多義性的類型是"依賴" 時,翻譯結(jié)果選擇單元優(yōu)先考慮在源語言語音句子的分析中使用的依 賴關(guān)系,并且選擇源語言句子的分析結(jié)果。顯示控制單元106在顯示屏幕(未顯示)上顯示源語言文檔的翻譯 結(jié)果,同時參考源語言句子的翻譯后的句子以及存儲在存儲單元120 中的多義性表122,指出出現(xiàn)翻譯多義性的部分。具體來講,顯示控 制單元106通過將其中出現(xiàn)多義性的部分包含在角括號"<"和">" 中,從而指示所述部分。語音輸出控制單元107將作為源語言語音句子的翻譯結(jié)果的翻 譯后的語音句子合成為語音,并且輸出合成的語音。語音輸出控制單 元107可以通過使用任何常規(guī)方法來執(zhí)行語音合成處理,例如,通過 語音段的匯編的語音合成,基于共振峰的語音合成,基于全集的語音 合成以及文本到語音的合成。語音輸出控制單元107可以與任何傳統(tǒng)的輸出方法相結(jié)合來進(jìn) 行輸出,例如,將被譯成目標(biāo)語言的文本輸出到顯示單元(例如顯示 屏幕)的方法,以及通過文本打印將被譯成目標(biāo)語言的句子輸出到打 印機(jī)等等的方法。這些輸出方法可以用于代替語音輸出控制單元107。以下參考圖6描述由根據(jù)第一實施例的機(jī)器翻譯裝置100執(zhí)行的 機(jī)器翻譯處理。首先,執(zhí)行靜態(tài)翻譯處理以翻譯所接收的文本格式的源語言文檔 (步驟S601)。然后,執(zhí)行動態(tài)翻譯處理,以參考用于說明源語言文檔 的源語言語音句子來消除靜態(tài)翻譯處理中出現(xiàn)的多義性(步驟S602)。以下詳細(xì)地描述靜態(tài)翻譯處理和動態(tài)翻譯處理。以下參考圖7詳細(xì)地描述由機(jī)器翻譯裝置IOO執(zhí)行的靜態(tài)翻譯處 理。文檔接收單元101接收源語言文檔Ds的輸入(步驟S701)。翻譯 單元102從源語言文檔Ds取得一行信息Ws(步驟S702)。也就是說, 翻譯單元102在步驟S702取得一源語言句子,這是因為在本實施例 中,假設(shè)文檔中的每一行僅包括一個句子。翻譯單元102翻譯所述一行信息Ws,并且輸出所述一行信息 Ws的多義性信息Wa以及翻譯后的句子Wt(步驟S703)。如果在步驟 S703的翻譯的過程中沒有出現(xiàn)多義性,那么不輸出多義性信息Wa。翻譯單元102將所述翻譯后的句子Wt反映到翻譯后的文檔 Dt(步驟S704)。也就是說,翻譯后的文檔Dt中的翻譯后的句子Wt 被輸出作為對應(yīng)于一行信息Ws的部分。翻譯單元102確定是否輸出了多義性信息Wa(步驟S705)。如果 未輸出多義性信息Wa(步驟S705:否),那么翻譯單元102取得下一 行的一行信息Ws(步驟S702),并且系統(tǒng)控制進(jìn)行到步驟S703。如果輸出了多義性信息Wa(步驟S705:是),那么翻譯單元102 將所述多義性信息Wa存儲在多義性表122中(步驟S706)。翻譯單元102確定是否處理了源語言文檔Ds中的所有行(步驟 S707)。如果還未處理所有行(步驟S707:否),那么翻譯單元102從 源語言文檔Ds取得下一行的一行信息Ws(步驟S702)。系統(tǒng)控制進(jìn) 行到步驟S703。如果所有行都處理了(步驟S707:是),那么顯示控制單元106執(zhí) 行翻譯后文檔顯示處理,B卩,將翻譯后的文檔Dt顯示在顯示單元(未 顯示)上(步驟S708)。然后,結(jié)束靜態(tài)翻譯處理。以下參考圖8詳細(xì)地描述由機(jī)器翻譯裝置IOO執(zhí)行的動態(tài)翻譯處理。翻譯更新單元105從翻譯結(jié)果表121取得翻譯后的文檔Dt(步驟 S801)。語音接收單元103接收源語言語音句子Ss的輸入(步驟S802)。翻譯更新單元105輸出翻譯后的語音句子Ts,作為源語言語音 句子Ss的翻譯結(jié)果(步驟S803)。提取單元501執(zhí)行第一定位處理, 其估計源語言文檔Ds的哪個范圍對應(yīng)于源語言語音句子(步驟 S804)。提取單元501執(zhí)行第二定位處理,其從在第一定位處理中估計的 范圍中提取對應(yīng)于翻譯后的語音句子Ts的源語言句子Sa(步驟S805)。 具體來講,提取單元501從在第一定位處理中通過利用等式(l)進(jìn)行 計算而估計的范圍中提取最類似于翻譯后的語音句子Ts的源語言句 子Sa。通過所述處理,確定了包含在源語言句子Sa中的詞與包含在 源語言語音句子Ss中的詞之間的對應(yīng)關(guān)系。例如,如圖9所示,作為源語言句子Sa的"Difficulties of processing SL"對應(yīng)于作為源語言語音句子Ss的"Today, I'll talked about Difficulties of processing spoken畫language"。通過實線指示包含在源語 言句子Sa中的詞與包含在源語言語音句子Ss中的詞之間的對應(yīng)。在 這種情況下,包含在源語言句子Sa中的、出現(xiàn)多義性的詞901("SL") 對應(yīng)于包含在源語言語音句子Ss中的詞902,如實線903所指。如圖10所示,作為源語言句子Sa的"It requires special mechanisms for a recognizer."對應(yīng)于作為源語言語音句子Ss的"So, It requires arecognizer with special mechanisms."。翻譯更新單元105確定是否提取了源語言句子Sa(步驟S806)。 如上所述,如果句子相似度SIMs低于閾值,則不可以提取源語言句 子Sa。如果提取了源語言句子Sa(步驟S806:是),則翻譯更新單元105 確定是否在多義性表122中存儲了任何記錄(以下,與源語言句子Sa 有關(guān)的"多義性記錄"被存儲在多義性表122中)(步驟S807)。具體 來講,翻譯更新單元105確定在多義性表122中是否存儲有一多義性 記錄,其具有對應(yīng)于源語言句子Sa的句子ID(行號)的句子ID。如果有任何與源語言句子Sa有關(guān)的多義性記錄存儲在多義性表 122中(步驟S807:是),則翻譯結(jié)果選擇單元502參考源語言語音句 子Ss的翻譯結(jié)果重新翻譯源語言句子Sa,并且輸出翻譯后的句子 Ta(步驟S808)。例如,假設(shè)在翻譯源語言句子Sa中包含的詞"SL"時出現(xiàn)多義 性,并且詞"SL"的五個翻譯候選存儲在多義性表122中。當(dāng)根據(jù)
源語言語音句子Ss的譯文確定"SL"是"spoken-language"的縮寫 時,翻譯結(jié)果選擇單元502執(zhí)行重譯處理并且選擇"spoken-language" 作為詞"SL"的譯文。如果在源語言文檔Ds的多個部分中出現(xiàn)相同的多義性,那么當(dāng) 出現(xiàn)在一個部分中的多義性被消除時,也可以自動地同樣消除其它部 分中出現(xiàn)的多義性。翻譯更新單元105從多義性表122中刪除對應(yīng)于所消除的多義性 的多義性記錄(步驟S809)。然后,翻譯更新單元105用翻譯后的句子 Ta替換源語言句子Sa的翻譯后的句子,并且更新翻譯結(jié)果表121(步 驟S810)。顯示控制單元106執(zhí)行翻譯后文檔顯示處理,即,在顯示單元(未 顯示)上顯示更新后的翻譯后的文檔(步驟S811)。如果在步驟S806確定未提取源語言句子Sa(步驟S806:否),或 者如果在步驟S807確定沒有與源語言句子Sa有關(guān)的多義性記錄存儲 在多義性表122中(步驟S807:否),或者在顯示控制單元106在顯示 單元上顯示了翻譯后的文檔Dt之后(步驟SSll),語音輸出控制單元 107向例如揚聲器這樣的語音輸出單元(未顯示)輸出翻譯后的語音句 子Ts的合成的語音(步驟S812)。翻譯更新單元105確定源語言語音句子Ss是否結(jié)束,即,例如 幻燈片這樣的資料的說明是否完成(步驟S813)。如果源語言語音句子 Ss未結(jié)束(步驟S813:否),則系統(tǒng)控制進(jìn)行到步驟S802。如果源語 言語音句子Ss結(jié)束(步驟S813:是),則結(jié)束動態(tài)翻譯處理。以下參考圖11詳細(xì)地描述步驟S708和S811中的翻譯后文檔顯 示處理。顯示控制單元106從翻譯結(jié)果表121取得翻譯后的文檔Dt(步驟 SllOl)。然后,顯示控制單元106從多義性表122取得一個多義性記 錄(步驟S1102)。顯示控制單元106根據(jù)所取得的多義性記錄編輯翻譯后的句子, 以指示存在多義性,并且顯示在翻譯后文檔顯示屏幕上(步驟S1103)。 具體來講,顯示控制單元106參考包含在多義性記錄中的、其中出現(xiàn)
多義性的部分的位置信息,將翻譯后的句子的、其中出現(xiàn)多義性的部 分包括在角括號"<"和">"中,并且顯示在翻譯后文檔顯示屏幕上,如圖12所示。在圖12所示的日語的翻譯后的文檔中,多義性出現(xiàn)在角括號"<" 和">"所包含的日語詞1201的部分。同樣,依賴多義性出現(xiàn)在角括 號"<"和">"所包含的日語句子1202的部分。通過這種方式,通過使用標(biāo)記可以指示在翻譯過程中出現(xiàn)多義性 的部分。因此,能夠引起聽者的注意。另外,標(biāo)記不局限于角括號"<" 和">"。替換地,可以通過其它的標(biāo)記、下劃線或者改變字體顏色來 指示所述部分。此外,還能夠根據(jù)多義性的類型使用不同的標(biāo)記。此外,能夠向 通過使用標(biāo)記指示的部分添加關(guān)于多義性的詳細(xì)信息,例如,多義性 的內(nèi)容或者其它的翻譯候選。在翻譯后的句子被顯示在翻譯后文檔顯示屏幕上之后(步驟51103) ,顯示控制單元106確定是否處理了所有的多義性記錄(步驟51104) 。如果還未處理所有的多義性記錄(步驟S1104:否),則系統(tǒng) 控制進(jìn)行到步驟S1102。如上所述,根據(jù)第一實施例的機(jī)器翻譯裝置100通過參考用于說 明會議資料、演示資料等等的語音內(nèi)容,可以消除在翻譯例如會議資 料時出現(xiàn)的多義性。因此,即使會議資料包括最少量的內(nèi)容,機(jī)器翻 譯裝置100也可以以高精度來翻譯會議資料。此外,機(jī)器翻譯裝置IOO可以根據(jù)語音的進(jìn)程動態(tài)地將語音內(nèi)容 對應(yīng)到包含在資料中的內(nèi)容,并且與動態(tài)對應(yīng)同步地更新翻譯后的內(nèi) 容。因此,機(jī)器翻譯裝置100可以獲取最新的翻譯結(jié)果,因此可以支 持聽者正確地理解說話者的意圖。通常,說話者僅僅將會議資料分發(fā)給參加者,并且很少將他的語 音翻譯為所有聽者(即,參加者)的本國語言。在大多數(shù)情況下,參加 者分別準(zhǔn)備翻譯裝置以獨立地翻譯會議資料。因此,說話者通常不認(rèn) 識會議資料的翻譯結(jié)果。即使當(dāng)說話者向聽者提供了會議資料的翻譯 時,也不能總是保證翻譯的質(zhì)量,因為說話者可能不具有聽者的本國 語言的充足的知識。因此,難以糾正或填充說話者的意圖與聽者的理 解或資料的翻譯之間的差異缺口 。在JP-A2002-222189(KOKAI)中公開的機(jī)器翻譯裝置中,說話者不能認(rèn)識被譯成聽者的本國語言的資料的翻譯結(jié)果,因此,說話者不 能提供用于填充聽者的知識的缺口的適當(dāng)?shù)恼f明。因此,根據(jù)傳統(tǒng)技 術(shù)的機(jī)器翻譯裝置不能實現(xiàn)說話者和聽者之間的相互了解。根據(jù)第二實施例的機(jī)器翻譯系統(tǒng)可以顯示在翻譯會議資料等等 的處理中出現(xiàn)多義性的部分,因此說話者可以認(rèn)識到存在多義性。因 此,說話者可以提供用于填充說話者的意圖的差異缺口的適當(dāng)?shù)恼f 明。如圖13所示,根據(jù)第二實施例的機(jī)器翻譯系統(tǒng)包括機(jī)器翻譯裝 置1300和顯示裝置200。僅僅一個機(jī)器翻譯裝置1300包含在圖13 所示的機(jī)器翻譯系統(tǒng)中,但是多個機(jī)器翻譯裝置可以被連接到顯示裝 置200。由用戶,即說話者使用顯示裝置200,并且在其上顯示源語言文 檔本身而不是源語言文檔的翻譯結(jié)果,以向說話者顯示源語言文檔。 包括顯示單元的普通的計算機(jī),例如個人電腦,可以用作顯示裝置200。如圖13所示,顯示裝置200包括存儲單元220、文檔接收單元201、 顯示控制單元202以及接收單元203。存儲單元220是例如HDD、光盤、存儲卡或RAM這樣的存儲 介質(zhì),并且在其中存儲相對于連接到顯示裝置200的每一個機(jī)器翻譯 裝置的多義性管理表222。多義性管理表222包括關(guān)于在翻譯過程中出現(xiàn)的多義性的多義 性信息。如圖14所示,唯一標(biāo)識連接到顯示裝置200的每一個機(jī)器 翻譯裝置的終端ID、句子ID以及多義性信息被對應(yīng)地存儲在多義性 管理表222中。也就是說,多義性管理表222在其中存儲多個記錄(以下稱為"多 義性管理記錄"),在所述記錄中對應(yīng)地存儲終端ID以及存儲在多義 性表122中的每一個多義性記錄,所述多義性表122包含在機(jī)器翻譯 裝置1300中。即使當(dāng)多個聽者的終端(機(jī)器翻譯裝置)連接到顯示裝置200時, 也可以按照多義性的類型來管理多義性管理記錄,這是因為終端ID 以及多義性記錄被對應(yīng)地存儲在多義性管理表222中。即,如果消除 了在一個聽者的終端中出現(xiàn)的多義性,并且如果未消除出現(xiàn)在其它的 聽者的終端中的相同的多義性,那么可以在不刪除信息的情況下適當(dāng) 地管理關(guān)于多義性的信息,以防錯誤地確定消除了多義性。文檔接收單元201接收關(guān)于文本格式的文檔的信息,例如演示資 料或會議資料。文檔接收單元201與包含在機(jī)器翻譯裝置1300中的 文檔接收單元101具有相同的功能。顯示控制單元202參考由文檔接收單元201接收的源語言文檔以 及存儲在存儲單元220中的多義性管理表222,在其上顯示指示了出 現(xiàn)翻譯多義性的部分的源語言文檔。顯示控制單元202按照與根據(jù)第 一實施例的顯示控制單元106相同的方式,通過將其中出現(xiàn)翻譯多義 性的部分包含在角括號"<"和">"中來指示所述部分。接收單元203接收從機(jī)器翻譯裝置1300中的發(fā)送單元1308發(fā)送 的多義性記錄。接收單元203和發(fā)送單元1308之間的通信可以通過 任何種類的通信方法來進(jìn)行,例如有線局域網(wǎng)(LAN),無線wireless LAN或因特網(wǎng)。當(dāng)接收到多義性記錄時,接收單元203將多義性記錄和終端ID 存儲在多義性管理表222中,所述終端ID唯一屬于作為發(fā)送源的機(jī) 器翻譯裝置1300。另外,終端ID被從機(jī)器翻譯裝置1300發(fā)送到接 收單元203。機(jī)器翻譯裝置1300包括存儲單元120、文檔接收單元101、翻譯 單元102、語音接收單元103、語音識別單元104、翻譯更新單元105、 顯示控制單元106、語音輸出控制單元107以及發(fā)送單元1308。機(jī)器翻譯裝置1300與機(jī)器翻譯裝置100之間的區(qū)別在于機(jī)器翻 譯裝置1300還包括發(fā)送單元1308。利用相同的參考標(biāo)記表示與圖1 中相同的部分,并且省略那些部分的說明。當(dāng)源語言文檔被譯成翻譯后的文檔時,發(fā)送單元1308將存儲在
多義性表122中的多義性記錄發(fā)送到顯示裝置200中的接收單元203 。 以下描述由機(jī)器翻譯裝置1300執(zhí)行的機(jī)器翻譯處理。另外,由機(jī)器翻譯裝置1300執(zhí)行的整個機(jī)器翻譯處理與由如圖6所示的機(jī)器翻譯裝置100執(zhí)行的相同,因此省略其說明。以下參考圖15詳細(xì)地描述由機(jī)器翻譯裝置1300執(zhí)行的靜態(tài)翻譯處理。步驟S1501到S1507的部分與圖7所示的步驟S701到S707的 部分相同,省略對這些部分的說明。如果確定所有行都已處理(步驟S1507:是),則發(fā)送單元1308將 存儲在多義性表122中的多義性記錄發(fā)送到源語言說話者的顯示裝 置200(步驟S1508)。顯示控制單元106執(zhí)行翻譯后文檔顯示處理,即,在顯示單元(未 顯示)上顯示翻譯后的文檔Dt(步驟S1509),然后結(jié)束靜態(tài)翻譯處理。以下參考圖16詳細(xì)地描述由機(jī)器翻譯裝置1300執(zhí)行的動態(tài)翻譯 處理。步驟S1601到S1610的部分與圖8所示的步驟S801到S810的 部分相同,省略對這些部分的說明。在翻譯更新單元105替換了翻譯后的句子之后(步驟S1610),發(fā) 送單元1308將存儲在多義性表122中的多義性記錄發(fā)送到源語言說 話者的顯示裝置200(步驟S1611)。步驟S1612到S1614的部分與圖8所示的步驟S811到S813的 部分相同,省略對這些部分的說明。在第二實施例中,如上所述,無論何時執(zhí)行翻譯處理以及在動態(tài) 翻譯處理中更新多義性表122,都將存儲在多義性表122中的多義性 記錄發(fā)送到顯示裝置200。因此,能夠通知顯示裝置200存在多義性。 因此,顯示裝置200可以參考通知內(nèi)容自動地編輯顯示內(nèi)容。以下參考圖17描述由顯示裝置200執(zhí)行的源語言文檔顯示處理。 在源語言文檔顯示處理中,顯示裝置200在其上顯示源語言文檔,其 中,參考存儲在多義性管理表222中的多義性信息編輯了顯示內(nèi)容。接收單元203從機(jī)器翻譯裝置1300接收終端ID和多義性表 122(步驟S1701)。文檔接收單元201接收源語言文檔Ds的輸入(步驟 S1702)。顯示控制單元202從多義性管理表222中刪除不必要的多義性管 理記錄(步驟S17(B)。具體來講,顯示控制單元202從多義性管理表 222中刪除與所接收的終端ID具有相同的終端ID、并且具有不對應(yīng) 于多義性表122中所存儲的內(nèi)容的內(nèi)容的多義性管理記錄。如果作為發(fā)送源的機(jī)器翻譯裝置1300消除了多義性,則從多義 性表122刪除對應(yīng)于所述多義性的多義性記錄。然后,多義性表122 被發(fā)送給顯示裝置200。在這種情況下,對應(yīng)于所刪除的多義性記錄 的多義性管理記錄仍然存儲在顯示裝置200中的多義性管理表222 中,因此通過獲取多義性記錄和多義性管理記錄之間的區(qū)別檢測到多 義性管理記錄,然后從多義性管理表222刪除所檢測到的多義性管理 記錄。顯示控制單元202從多義性表122中刪除已經(jīng)存儲在多義性管理 表222中的多義性記錄(步驟S1704)。因此,能夠防止多義性管理表 222存儲重疊的多義性記錄。具體來講,顯示控制單元202從多義性 管理表222刪除具有相同的終端ID和相同的多義性信息的多義性記 錄。顯示控制單元202在多義性管理表222中對應(yīng)地存儲多義性記錄 和終端ID(步驟S1705)。通過這種方式,可以創(chuàng)建多義性管理表222,在其中存儲反映了 所接收的多義性記錄的最新的多義性信息。顯示控制單元202從多義性管理表222中取得一個多義性管理記 錄(步驟S1706)。然后,顯示控制單元202確定是否已經(jīng)編輯了對應(yīng) 于包含在所取得的多義性管理記錄中的、關(guān)于出現(xiàn)多義性的位置的位 置信息的部分(步驟S1707)。如果還未編輯所述部分(步驟S1707:否),則顯示控制單元202 編輯包含在源語言文檔Ds中的、對應(yīng)于所述部分的源語言句子,以 指示存在多義性,然后在源語言文檔顯示屏幕上顯示編輯后的源語言 文檔Ds(步驟S1708)。具體來講,顯示控制單元202參考多義性管理 記錄中的對應(yīng)于所述部分的位置信息,將所述部分包含在角括號"<" 和">"中,并且在源語言文檔顯示屏幕上顯示編輯后的源語言文檔Ds,如圖18所示。在圖18所示的源語言文檔Ds的情況中,在翻譯角括號"<"和 ">"所包含的英語詞1801時出現(xiàn)多義性,并且依賴多義性出現(xiàn)在角 括號"<"和">"所包含的英語句子1802中。因此,不僅聽者,而且作為源語言說話者的說話者也可以認(rèn)出在 翻譯過程中出現(xiàn)多義性的部分。因此,說話者可以說明該部分以消除 多義性。因此。能夠減少引起說話者的意圖和聽者的理解之間的差異 的可能性。如果確定對應(yīng)于位置信息的部分已經(jīng)編輯(步驟S1707:是),或 者在編輯后的源語言文檔Ds顯示在源語言文檔顯示屏幕上之后(步 驟S1708),顯示控制單元202確定是否處理了所有的多義性管理記錄 (步驟S1709)。如果還未處理所有的多義性管理記錄(步驟S1709:否),則系統(tǒng) 控制進(jìn)行到步驟S1706。如果處理了所有的多義性管理記錄(步驟 S1709:是),則結(jié)束源語言文檔顯示處理。以下參考圖19到29詳細(xì)地描述由機(jī)器翻譯裝置1300執(zhí)行的動 態(tài)翻譯處理。假設(shè)作為會議資料的幻燈片被以電子方式分給參加者。此外,假 設(shè)說話者是英語說話者并且使用分配了作為終端ID的"Eng001"的說話者終端(顯示裝置200),并且聽者是日語說話者并且使用分配了 作為終端ID的"Jpn001"的聽者終端(機(jī)器翻譯裝置1300)。當(dāng)如圖19所示的幻燈片被輸入聽者的終端Jpn001時,執(zhí)行靜態(tài) 翻譯處理(步驟S601)。也就是說,幻燈片被靜態(tài)地譯成由終端Jpn 001 的用戶(聽者)設(shè)置的預(yù)定語言,即,在這種情況下被譯成日語。在靜態(tài)翻譯處理中,處理作為源語言文檔Ds的所輸入的幻燈片 (步驟S1501)。關(guān)于源語言文檔Ds的第一行的信息"Difficulties of processing SL"被讀出作為源語言文檔Ds的一行信息Ws(步驟 SI 502)。
作為翻譯一行信息Ws的結(jié)果,翻譯單元102輸出作為多義性信 息的"(譯文選擇,(4,4),(U))",以及作為翻譯后的句子Wt的表示 "Difficulties of processing a source language" 的日語譯文(步驟 S1503)。翻譯單元102將所述翻譯后的句子Wt的內(nèi)容反映到翻譯后的文 檔Dt(步驟S1504)。多義性出現(xiàn)在翻譯過程中(步驟S1505:是),因 此,翻譯單元102將關(guān)于行號的信息以及多義性信息Wa對應(yīng)地存儲 在多義性表122,所述關(guān)于行號的信息指定包含在源語言文檔Ds中 的、出現(xiàn)多義性的句子(步驟S1506)。圖20是顯示執(zhí)行上述處理之后 的多義性表122的例子的說明性的示圖。然后,翻譯單元102讀取關(guān)于源語言文檔Ds的第二行的信息 "Differ w他WL in vocabularies",作為一行信息Ws(步驟S1502)。作為一行信息Ws的翻譯結(jié)果,假設(shè)翻譯單元102輸出表示 "Differ with a written language in vocabularies"的曰語i睪文,作為崔S 譯后的句子Wt(步驟S1503)。在這種情況下,翻譯單元102不輸出多 義性信息,因為在翻譯第二行時未出現(xiàn)多義性。翻譯單元102將翻譯后句子Wt的內(nèi)容反映到翻譯后的文檔 Dt(步驟S1504),因為在翻譯過程中未出現(xiàn)多義性(步驟S1505:否), 系統(tǒng)控制進(jìn)行到步驟S1502。通過這種方式,系統(tǒng)控制反復(fù)地進(jìn)行那些步驟直到由翻譯單元 102翻譯關(guān)于源語言文檔Ds的最后一行的信息"It requires special mechanisms for a recognizer"。在執(zhí)行上述處理之后,多義性表122在 例如如圖3所示的狀態(tài)。當(dāng)源語言文檔Ds的翻譯處理結(jié)束時,多義性表122被發(fā)送到說 話者的終端,其中完全存儲了關(guān)于在翻譯過程中出現(xiàn)的多義性的多義 性信息(步驟S1508)。這時的狀態(tài)稱為中間狀態(tài)l。顯示控制單元106執(zhí)行翻譯后文檔顯示處理(步驟S1509)。顯示 控制單元106從翻譯結(jié)果表121取得在靜態(tài)翻譯處理中創(chuàng)建的翻譯后 的文檔Dt(步驟SllOl)。然后,顯示控制單元106從圖3所示的多義 性表122取得第一個多義性記錄。g卩,顯示控制單元106從多義性表122取得第一多義性記錄"句子ID=1,多義性信息=(譯文選擇, (4,4),(1,1))"(步驟S1102)。根據(jù)第一多義性記錄,多義性出現(xiàn)在源語言文檔Ds的首行中, 并且多義性影響翻譯后的句子的第一個詞。因此,顯示控制單元106 將其中出現(xiàn)多義性的部分包含在角括號"<"和">"中(步驟S1103)。 圖21是顯示在執(zhí)行上述處理之后的翻譯后的文檔Dt的顯示內(nèi)容的例 子的說明性的示圖。用與第一多義性記錄同樣的方法處理多義性表122中包含的其 它的多義性記錄。在處理了包含在多義性表122中的所有多義性記錄 之后,顯示翻譯后的文檔Dt,例如如圖12所示。根據(jù)本實施例的機(jī)器翻譯系統(tǒng)可以向聽者指示在翻譯過程中出 現(xiàn)多義性的部分,例如,圖12所示的表示"〈source language,的日 語詞1201或者表示"〈It requires special mechanisms for a recognizer.>" 的日語詞1202。因此,能夠引起聽者的注意。在結(jié)束靜態(tài)翻譯處理之后,執(zhí)行動態(tài)翻譯處理(步驟S602)。從翻譯結(jié)果表121取得由翻譯單元102輸出的翻譯后的文檔 Dt(步驟S1601)。假設(shè)語音接收單元103接收"Today, I'll talk about difficulties of processing spoken-language."作為源語言語音句子Ss(步 驟S1602)。此外,假設(shè)翻譯更新單元105將源語言語音句子Ss翻譯 為日語并且輸出表示"Today, I'll talk about difficulties of processing spoken-language."的日語翻譯作為翻譯后的語音句子Ts。然后,提取單元501執(zhí)行定位處理,以將源語言語音句子Ss對 應(yīng)到包含在源語言文檔Ds中的源語言句子(步驟S1604和S1605)。假 設(shè)作為圖19所示的源語言文檔的首行的句子的"Difficulties of processing SL"被提取作為對應(yīng)的源語言句子Sa。圖9描述了這時的 定位結(jié)果的例子。因為源語言句子Sa被獲得(步驟S1606:是),所以確定定位處理 成功,因此系統(tǒng)控制進(jìn)行到步驟S1607。作為定位目標(biāo)的所獲得的源 語言句子Sa包含在源語言文檔Ds的首行中,此外,與源語言句子 Sa對應(yīng)的關(guān)于多義性的第一個多義性記錄存儲在圖3所示的多義性
表122中(步驟S1607:是)。因此,系統(tǒng)控制進(jìn)行到步驟S1608。在這種情況下,作為圖9所示的定位結(jié)果,包含在源語言句子 Sa中的詞901 "SL"對應(yīng)于包含在源語言語音句子Ss中的詞902"spoken-language"。出現(xiàn)在源語言句子Sa中的多義性的類型是"SL" 的譯文選擇。假設(shè)表示"source language"、" spoken-language"、"salvage loss"、 "sea level"以及"symbolic language"的五個日語譯文被獲得 作為詞"SL"的譯文候選。假設(shè)唯一確定了通過定位處理對應(yīng)于"SL"的"spoken-language", 因此翻譯結(jié)果選擇單元502從譯文候選中唯一選擇表示"spoken-language"的日語譯文,因此彼此對應(yīng)的兩個詞可以被譯成 相同的譯文。因此,能夠消除在翻譯源語言句子Sa的過程中出現(xiàn)的譯文選擇 中的多義性,還可以獲取反映了唯一選擇的譯文的新的翻譯后的句子 Ta(步驟S1608)。當(dāng)如上所述消除了多義性時,從多義性表122刪除對應(yīng)于所消除 的多義性的第一多義性記錄(參見圖3)(步驟S1609)。同時,將新獲得 的翻譯后的句子Ta反映到翻譯后的文檔Dt(步驟S1610)。圖22是顯 示更新后的多義性表122的例子的說明性的示圖。更新后的多義性表122被發(fā)送到說話者的終端(步驟S1611)。這 時的狀態(tài)稱為中間狀態(tài)2。執(zhí)行翻譯后文檔顯示處理。圖23是顯示在翻譯后文檔顯示處理 中的翻譯后文檔顯示屏幕的顯示內(nèi)容的例子的說明性的示圖。在靜態(tài)翻譯處理執(zhí)行之后的翻譯后文檔顯示屏幕上,指示了多義 性出現(xiàn)在詞1201(參見圖12)。另一方面,如圖23所示,具有正確的 表示"spoken-language"的日語譯文的、對應(yīng)于詞1201的詞2301顯 示在翻譯后文檔顯示屏幕上。B卩,說話者的意圖正確地反映到日語譯 文,并且還指示在聽者的終端側(cè)消除了在翻譯過程中出現(xiàn)的多義性。如上所述,根據(jù)本實施例的機(jī)器翻譯系統(tǒng)可以正確地消除在翻譯 過程中出現(xiàn)的多義性,并且還可以消除說話者的意圖與聽者的理解之 間的差異。
在執(zhí)行翻譯后文檔顯示處理之后,語音輸出控制單元107輸出翻 譯后的語音句子Ts的合成的語音(步驟S16D),然后系統(tǒng)控制進(jìn)行到 步驟S1614。假設(shè)還輸入一語音到語音接收單元103(步驟S1614),并且語音 接收單元 103接收"Of course, as you know, there are several difficulties."作為源語言語音句子Ss(步驟S1602)。假設(shè)翻譯更新單元105將源語言語音句子Ss翻譯為日語并且輸 出表示"Of course, as you know, there are several difficulties."的日語 翻譯作為翻譯后的語音句子Ts(步驟S1603)。然后,提取單元501執(zhí)行定位處理,以將源語言語音句子Ss對 應(yīng)到包含在源語言文檔Ds中的源語言句子(步驟S1604和S1605)。如 果未從源語言文檔Ds獲得對應(yīng)的源語言句子,那么假設(shè)不存在源語 言句子Sa。因此,確定定位處理失敗(步驟S1606:否),并且執(zhí)行語 音合成輸出處理(步驟S1613)。如上所述,即使當(dāng)獲得新的語音時,如果該語音的輸入對消除多 義性沒有幫助,就不執(zhí)行消除多義性的處理。因此,能夠防止翻譯后 的文檔Dt被錯誤的更新。假設(shè)還輸入一語音到語音接收單元103(步驟S1614:否),并且 語音接收單元103接收"It requires a recognizer with special mechanisms."作為源語言語音句子Ss(步驟S1602)。假設(shè)翻譯更新單元105將源語言語音句子Ss翻譯為日語并且輸 出表示"It requires a recognizer with special mechanisms."的日語翻譯 作為翻譯后的語音句子Ts(步驟S1603)。然后,提取單元501執(zhí)行定位處理,以將源語言語音句子Ss對 應(yīng)到包含在源語言文檔Ds中的源語言句子(步驟S1604和S1605)。假 設(shè)作為圖19所示的源語言文檔的第十行的句子的"It requires special mechanisms for a recognizer"被提取作為對應(yīng)的源語言句子Sa。這時, 定位結(jié)果如圖10所示。因為源語言句子Sa被獲得(步驟S1606:是),所以確定定位處理 成功,因此系統(tǒng)控制進(jìn)行到步驟S1607。作為定位目標(biāo)的所獲得的源
語言句子Sa包含在源語言文檔Ds的第十行中,此外,與源語言句子 Sa對應(yīng)的關(guān)于多義性的多義性記錄存儲在圖22所示的多義性表122 中(步驟S1607:是)。因此,系統(tǒng)控制進(jìn)行到步驟S1608。根據(jù)圖22所示的多義性記錄,在翻譯過程中,依賴多義性出現(xiàn) 在源語言句子Sa中。假設(shè)多義性可以被解釋為兩種方式,如圖4所 示的解釋401和402所指示的。在解釋401中,"a recognizer"被解釋為依賴于"special mechanism"。在解釋402中,"a recognizer"被解釋為依賴于"requires"。 在靜態(tài)翻譯處理中,選擇解釋401。另一方面,假設(shè)當(dāng)翻譯更新單元105將源語言語音句子Ss翻譯 為日語時,依賴結(jié)構(gòu)被唯一地確定。圖24是顯示唯一確定的依賴結(jié) 構(gòu)的例子的說明性的示圖。該例子指示解釋402將被優(yōu)先選擇。因此, 確定源語言句子Sa被優(yōu)先地像解釋402 —樣進(jìn)行解釋。因此,能夠消除在翻譯過程中出現(xiàn)的依賴解釋中的多義性,還可 以獲取反映了唯一確定的依賴解釋的新的翻譯后的句子Ta(步驟 S1608)。如上所述消除了多義性,因此從多義性表122刪除關(guān)于所消除的 多義性的多義性記錄(參見圖22)(步驟S1609)。同時,將新獲得的翻 譯后的句子Ta反映到翻譯后的文檔Dt(步驟S1610)。這時,消除了 所有在靜態(tài)翻譯處理中出!L在源語言文檔Ds中的多義性,因此存儲 在聽者的終端的多義性表122的狀態(tài)返回空集。其狀態(tài)返回空集的多義性表122被發(fā)送給說話者終端(步驟 S1611)。這時的狀態(tài)稱為中間狀態(tài)3。執(zhí)行翻譯后文檔顯示處理。圖25是顯示在翻譯后文檔顯示處理 中,顯示在翻譯后文檔顯示屏幕上的顯示內(nèi)容的例子的說明性的示 圖。在圖23所示的顯示內(nèi)容的情況下,指示了其中出現(xiàn)多義性的句 子2302。另一方面,在圖25所示的顯示內(nèi)容的例子中,指示了其中 依賴關(guān)系被正確地解釋的句子2501。也就是說,說話者的意圖被正 確地反映到句子2501。伺樣,聽者可以知道消除了在翻譯過程中出
現(xiàn)的多義性。以下利用有形的例子描述翻譯后文檔顯示處理。無論何時從聽者的終端發(fā)送了多義性表122,都執(zhí)行翻譯后文檔顯示處理。首先,描述一處理,其中,在中間狀態(tài)l,圖3所示的多義性表 122被從聽者的終端發(fā)送到說話者的終端。然而,假設(shè)存儲在說話者 的終端中的多義性管理表222的狀態(tài)始終是空集,直到說話者的終端 接收到如圖3所示的多義性表122。說話者的終端首先接收作為發(fā)送源的終端ID的"Jpn001"以及 如圖3所示的多義性表122(步驟S1701)。然后,說話者的終端接收 源語言文檔Ds的輸入(步驟S1702)。這時,沒有多義性管理記錄存儲在多義性管理表222中,因此, 包含在所接收的多義性表122中的所有的多義性記錄與對應(yīng)的終端 ID —起被存儲在多義性管理表222中(步驟S1703到S1705)。如圖14所示,多義性管理表222在其中存儲兩個多義性管理記 錄。因此,從多義性管理表222取得第一個多義性管理記錄"終端 ID-JpnOOl,句子ID-1,多義性信息氣譯文選擇,(4,4),(U))"。第一多義性管理記錄指示多義性出現(xiàn)在源語言文檔Ds的首行 中,并且多義性影響源語言句子的第四個詞。因此,顯示控制單元 106將其中出現(xiàn)多義性的部分包含在角括號"<"和">"中。圖26 是顯示在執(zhí)行上述處理之后的翻譯后的文檔Dt的顯示內(nèi)容的例子的 說明性的示圖。用與第一多義性管理記錄同樣的方法處理其它的多義性管理記 錄。在處理了包含在多義性管理表222中的所有多義性管理記錄之 后,顯示翻譯后的文檔Dt,例如如圖18所示。如上所述,根據(jù)本實施例的機(jī)器翻譯系統(tǒng)可以向說話者指示在翻 譯過程中出現(xiàn)多義性的部分。例如,說話者可以知道多義性出現(xiàn)在圖 18所示的詞1801"〈SL〉"和句子1802"〈Itr叫uires special mechanisms forarecognizer.>"中。因此,能夠引起說話者的注意。描述一處理,其中,在中間狀態(tài)2,圖22所示的多義性表122 被從聽者的終端發(fā)送到說話者的終端。假設(shè)多義性管理表222在其中 存儲如圖14所示的多義性管理記錄。說話者的終端首先接收作為發(fā)送源的聽者的終端的終端ID "Jpn 001"以及如圖22所示的多義性表122(步驟S1701)。然后,說話者 的終端接收源語言文檔Ds的輸入(步驟S1702)。從在圖14所示的多義性管理表222中存儲的具有終端ID "Jpn 001"的多義性管理記錄中刪除第一個多義性管理記錄,這是因為第 一個多義性管理記錄不對應(yīng)于所接收的多義性表122中的任何多義 性記錄(步驟S1703)。然后,從多義性表122刪除圖22所示的多義性記錄,其對應(yīng)于 存儲在多義性管理表222中的多義性管理記錄(步驟S1704)。因此, 所接收的多義性表122的狀態(tài)返回空集,因此,沒有將添加到多義性 管理表222中的多義性記錄(步驟S1705)。圖27是顯示多義性管理表 222的例子的說明性的示圖。反復(fù)執(zhí)行上述處理,結(jié)果如圖28所示,顯示指示了出現(xiàn)多義性 的部分的源語言文檔Ds。在圖18所示的顯示內(nèi)容的例子中,指示多義性出現(xiàn)在詞1801 "〈SL,'中。另一方面,在圖28所示的顯示內(nèi)容的例子中,從詞1801 "<SL>"除去了角括號"<"和">"。即,詞1801 "<SL>"被動態(tài) 地更新為詞2801 "SL"。因此,說話者可以動態(tài)地知道在翻譯過程中 出現(xiàn)在聽者的終端的多義性。因此,說話者可以通過說明其中出現(xiàn)多 義性的部分從而平滑地消除多義性。在中間狀態(tài)3中,說話者的終端接收其狀態(tài)是空集的多義性表 122,因此,多義性管理表222的狀態(tài)同樣返回空集(步驟S1703到 S1705)。因此,不必編輯包含在源語言文檔Ds中的源語言句子以指 示多義性的存在。其中未出現(xiàn)多義性的源語言文檔Ds被顯示在說話 者的終端的顯示屏幕上。圖29是顯示源語言文檔Ds的顯示內(nèi)容的例子的說明性的示圖。 在中間狀態(tài)3,如圖29所示,顯示了沒有任何指示存在多義性的標(biāo) 記的源語言文檔Ds。在圖28所示的顯示內(nèi)容的例子中,多義性出現(xiàn)在句子2802 "<It requires special mechanisms for a recognizer,",如角括號"<"禾口 "〉" 所指示的。另一方面,在圖29所示的顯示內(nèi)容的例子中,從句子2802 除去了角括號"<"和">"。即,句子2802被動態(tài)地更新為句子2901 "It requires special mechanisms for a recognizer."。因此,說話者可以 動態(tài)地知道在翻譯過程中出現(xiàn)在聽者的終端的多義性被說話者的語 音消除。如上所述,當(dāng)翻譯多義性出現(xiàn)在會議資料中時,根據(jù)第二實施例 的機(jī)器翻譯裝置1300可以指示其中出現(xiàn)多義性的部分,從而說話者 可以知道將說明的部分。因此,說話者可以分享在聽者所參考的翻譯 后的資料中出現(xiàn)的解釋問題,因此說話者可以說明該部分以消除多義 性。此外,當(dāng)由說話者的語音消除了多義性時,關(guān)于語音的信息可以 動態(tài)地更新,因此,能夠消除說話者的意圖和聽者的理解之間的差異。在第一和第二實施例中,源語言文檔或者翻譯后的文檔被顯示在 機(jī)器翻譯裝置的顯示屏幕上?;蛘?,機(jī)器翻譯裝置可以將源語言文檔 或者翻譯后的文檔轉(zhuǎn)換為合成的語音并且輸出該合成的語音。在這種 情況下,通過改變語音屬性來輸出出現(xiàn)多義性的部分,例如通過改變 為不同的音調(diào)或音量,從而用戶可以知道多義性出現(xiàn)在該部分。以下參考圖30描述根據(jù)第一或第二實施例的機(jī)器翻譯裝置的硬 件結(jié)構(gòu)。如圖30所示,機(jī)器翻譯裝置包括作為控制設(shè)備的中央處理單元 (CPU)51,作為存儲設(shè)備的只讀存儲器(ROM)52和隨機(jī)存取存儲器 (RAM)53,通信接口(I/F)54和總線61。 CPU 51、 ROM 52、 RAM 53 和通信I/F54連接到總線61 。通信I/F54還連接到網(wǎng)絡(luò)并且通過網(wǎng)絡(luò) 通信。由機(jī)器翻譯裝置執(zhí)行的機(jī)器翻譯程序?qū)㈩A(yù)先存儲在例如ROM 52上。或者,機(jī)器翻譯程序可以以可安裝或可執(zhí)行的格式記錄在計算機(jī) 可讀記錄介質(zhì)上,例如光盤只讀存儲器(CD-ROM),軟磁盤(FD),可 記錄光盤(CD-R)以及數(shù)字多用途盤(DVD)。還能夠?qū)C(jī)器翻譯程序存儲在連接到網(wǎng)絡(luò)(例如因特網(wǎng))的計算
機(jī)中,并且經(jīng)由網(wǎng)絡(luò)下載該機(jī)器翻譯程序。能夠經(jīng)由網(wǎng)絡(luò)提供或分發(fā) 機(jī)器翻譯程序。機(jī)器翻譯程序被構(gòu)造為包括文檔接收單元、翻譯控制單元、翻譯 單元、更新單元、語音識別單元、語音接收單元、顯示控制單元、語音輸出控制單元,它們構(gòu)成模塊組件。在實際的硬件中,CPU 51從 ROM 52讀出機(jī)器翻譯程序并且執(zhí)行機(jī)器翻譯程序,然后將每一個上 述單元加載到主存儲設(shè)備上。對于本領(lǐng)域技術(shù)人員來講,其他的優(yōu)點和變形是顯而易見的。因 此,本發(fā)明不局限于在這里顯示和描述的具體細(xì)節(jié)以及代表性實施 例。因此,在不脫離由附加的權(quán)利要求以及它們的等價物所定義的一 般的發(fā)明構(gòu)思的精神或范圍的情況下,可以作出各種變形。
權(quán)利要求
1.一種機(jī)器翻譯裝置,包括文檔接收單元,用于接收以源語言描述的源語言文檔的輸入;翻譯單元,用于將所述源語言文檔翻譯為以目標(biāo)語言描述的翻譯后的文檔,并且創(chuàng)建多義性部分,該多義性部分是在翻譯期間出現(xiàn)多義性的詞或句子;存儲單元,用于存儲所述翻譯后的文檔以及所述多義性部分;語音接收單元,用于接收所述源語言的語音;識別單元,用于識別由所述語音接收單元接收的語音,并且創(chuàng)建源語言語音句子作為識別結(jié)果;翻譯更新單元,用于當(dāng)所述源語言文檔包括多義性部分時,通過重新翻譯所述源語言語音句子中的、與所述多義性部分對應(yīng)的一部分語音內(nèi)容,來更新存儲在所述存儲單元中的翻譯后語言文檔;以及顯示控制單元,用于將由所述翻譯更新單元更新的翻譯后的文檔顯示在顯示單元上。
2. 根據(jù)權(quán)利要求l所述的裝置,其中,所述翻譯更新單元包括 提取單元,用于從所述源語言文檔提取與所述源語言語音句子有關(guān)的源語言句子;以及選擇單元,用于當(dāng)由所述提取單元提取的所述源語言句子包括多 義性部分時,選擇與所述多義性部分對應(yīng)的一部分語音內(nèi)容的翻譯結(jié) 果,作為所述多義性部分的翻譯結(jié)果。
3. 根據(jù)權(quán)利要求2所述的裝置,其中,所述提取單元將所述源 語言文檔分割為特定范圍的多個部分,所述多個部分分別包括至少一 個句子,計算所述特定范圍的多個部分中的每一個中包含的每一個句 子與所述源語言語音句子之間的相似度,取得所述特定范圍的多個部 分中的、包括與所述源語言語音句子具有最大相似度的句子的一個部 分,并且從所述特定范圍的多個部分中的、所取得的一個部分提取所 述源語言句子。
4. 根據(jù)權(quán)利要求3所述的裝置,其中,所述提取單元計算所述 特定范圍的多個部分中包含的每一個句子中包含的詞與所述源語言 語音句子中包含的詞之間的相似度,并且提取包含與所述源語言語音 句子中包含的詞具有最大相似度的詞的一個源語言句子。
5. 根據(jù)權(quán)利要求2所述的裝置,其中,所述提取單元從所述源 語言語音句子取得關(guān)于所述源語言文檔中的、至少包含一頁、 一章、 一句或一段的特定范圍的部分的信息,并且從所述源語言文檔的所述 特定范圍的部分提取所述源語言句子。
6. 根據(jù)權(quán)利要求5所述的裝置,其中,所述提取單元計算所述 特定范圍的部分中包含的每一個句子中包含的詞與所述源語言語音 句子中包含的詞之間的相似度,并且提取包含與所述源語言語音句子 中包含的詞具有最大相似度的詞的一個句子。
7. 根據(jù)權(quán)利要求2所述的裝置,其中,所述翻譯單元創(chuàng)建在翻譯后的詞的選擇期間出現(xiàn)多義性的多義 性部分,以及當(dāng)所述源語言句子包含在選擇翻譯后的詞時出現(xiàn)多義性的多義 性部分時,所述選擇單元根據(jù)與所述多義性部分對應(yīng)的一部分語音內(nèi) 容選擇翻譯后的詞,作為所述多義性部分的譯文。
8. 根據(jù)權(quán)利要求2所述的裝置,其中,所述翻譯單元創(chuàng)建在詞的依賴關(guān)系的選擇期間出現(xiàn)多義性的多 義性部分,以及當(dāng)所述源語言句子包含在依賴關(guān)系的選擇期間出現(xiàn)多義性的多 義性部分時,所述選擇單元選擇與所述多義性部分對應(yīng)的一部分語音 內(nèi)容中的依賴關(guān)系,作為所述多義性部分中的依賴關(guān)系。
9. 根據(jù)權(quán)利要求l所述的裝置,其中,所述存儲單元存儲所述翻譯后的文檔以及所述源語言文檔中的 詞或句子中的、出現(xiàn)多義性的多義性部分,以及所述顯示控制單元對應(yīng)地顯示所述翻譯后的文檔以及用于指示 出現(xiàn)多義性的部分的信息。
10. 根據(jù)權(quán)利要求9所述的裝置,其中,所述存儲單元存儲所述翻譯后的文檔、所述多義性部分以及多義 性的類型,以及所述顯示控制單元還對應(yīng)地顯示所述翻譯后的文檔以及關(guān)于所 述翻譯后的文檔的多義性部分的多義性的類型。
11. 一種機(jī)器翻譯系統(tǒng),包括-顯示裝置,用于顯示以源語言描述的源語言文檔;以及 機(jī)器翻譯裝置,用于將所述源語言文檔翻譯為以目標(biāo)語言描述的翻譯后的文檔,作為翻譯結(jié)果,并且所述機(jī)器翻譯裝置經(jīng)由網(wǎng)絡(luò)連接到所述顯示裝置,其中所述機(jī)器翻譯裝置包括文檔接收單元,用于接收所述源語言文檔的輸入;翻譯單元,用于將所述源語言文檔翻譯為所述翻譯后的文檔,并且創(chuàng)建多義性部分,所述多義性部分是具有在翻譯期間出現(xiàn)的多義性 的詞或句子;存儲單元,用于存儲所述翻譯后的文檔以及所述多義性部分;語音接收單元,用于接收所述源語言的語音;識別單元,用于識別由所述語音接收單元接收的語音,并且創(chuàng)建 源語言語音句子作為識別結(jié)果;翻譯更新單元,用于當(dāng)所述源語言文檔包含所述多義性部分時, 通過重新翻譯所述源語言語音句子中的、與所述多義性部分對應(yīng)的一 部分語音內(nèi)容,來更新存儲在所述存儲單元中的翻譯后語言文檔; 第一顯示控制單元,用于將由所述翻譯更新單元更新的翻譯后的 文檔顯示在第一顯示單元上;以及發(fā)送單元,用于將存儲在所述存儲單元中的所述多義性部分發(fā)送 給所述顯示裝置,以及所述顯示裝置包括接收單元,用于從所述機(jī)器翻譯裝置接收所述多義性部分;以及 第二顯示控制單元,用于在第二顯示單元上顯示所述源語言文 檔,所述源語言文檔包括基于由所述接收單元接收的所述多義性部分 的、用于指示存在出現(xiàn)多義性的多義性部分的信息。
12. —種機(jī)器翻譯方法,包括接收以源語言描述的源語言文檔的輸入;將所述源語言文檔翻譯為以目標(biāo)語言描述的翻譯后的文檔,并且 創(chuàng)建多義性部分,所述多義性部分是具有在翻譯期間出現(xiàn)的多義性的 詞或句子;將所述翻譯后的文檔以及所述多義性部分存儲在存儲單元中; 接收所述源語言的語音;識別所述語音,并且創(chuàng)建源語言語音句子作為識別結(jié)果; 當(dāng)所述源語言文檔包括多義性部分時,通過重新翻譯所述源語言語音句子中的、與所述多義性部分對應(yīng)的一部分語音內(nèi)容,來更新存儲在所述存儲單元中的翻譯后語言文檔;以及將在更新中更新的所述翻譯后的文檔顯示在顯示單元上。
全文摘要
一種機(jī)器翻譯裝置,包括翻譯單元,用于將源語言文檔翻譯為以目標(biāo)語言描述的翻譯后的文檔,并且創(chuàng)建多義性部分,該多義性部分是具有在翻譯期間出現(xiàn)的多義性的詞或句子;存儲單元,用于存儲所述翻譯后的文檔以及所述多義性部分;語音接收單元,用于接收源語言的語音;識別單元,用于識別所接收的語音,并且創(chuàng)建源語言語音句子作為識別結(jié)果;翻譯更新單元,用于當(dāng)所述源語言文檔包括多義性部分時,通過重新翻譯所述源語言語音句子中的、與所述多義性部分對應(yīng)的一部分語音內(nèi)容來更新翻譯后語言文檔;以及顯示控制單元,用于將更新后的翻譯后的文檔顯示在顯示單元上。
文檔編號G06F17/28GK101154219SQ20071014696
公開日2008年4月2日 申請日期2007年9月3日 優(yōu)先權(quán)日2006年9月26日
發(fā)明者知野哲朗, 釜谷聰史, 降幡建太郎 申請人:株式會社東芝