專利名稱:用于改良機(jī)器翻譯之翻譯知識(shí)的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于使用翻譯規(guī)則等翻譯知識(shí)的機(jī)器翻譯裝置的翻譯知識(shí)生成裝置,特別涉及用于通過從包含如從訓(xùn)練文集中自動(dòng)構(gòu)筑翻譯知識(shí)那樣的錯(cuò)誤或者冗余的信息中取舍選擇必需知識(shí)和不需知識(shí)并進(jìn)行改良來自動(dòng)地生成準(zhǔn)確翻譯知識(shí)的集合的裝置和方法。
背景技術(shù):
根據(jù)美國專利法第119條(a)的規(guī)定,本申請(qǐng)主張基于2003年6月4日在日本申請(qǐng)的專利申請(qǐng)2003-159662號(hào)申請(qǐng)的優(yōu)先權(quán),在這里通過參考該申請(qǐng)的全文而進(jìn)行引用。
作為機(jī)器翻譯的一種方法,已經(jīng)知道句子結(jié)構(gòu)轉(zhuǎn)換方式。在句子結(jié)構(gòu)轉(zhuǎn)換方式中,預(yù)先準(zhǔn)備了從原語言的單詞或者句子到目的語言的單詞或者句子等的映射規(guī)則(變換規(guī)則)和單詞對(duì)譯等。然后,在分析原語言的輸入文之后,通過應(yīng)用該映射規(guī)則和單詞對(duì)譯,獲得目的語言的翻譯文。句子結(jié)構(gòu)轉(zhuǎn)換方式機(jī)器翻譯系統(tǒng)的體系中最費(fèi)功夫的工作是生成像翻譯規(guī)則和單詞對(duì)譯那樣的翻譯知識(shí)。
過去,翻譯規(guī)則是通過人工準(zhǔn)備的。但是,隨著作為原語言和目的語言之間對(duì)譯文章之集合的對(duì)譯文集的充實(shí),已經(jīng)提出了從對(duì)譯文集中自動(dòng)獲得翻譯規(guī)則的方法。如果能夠自動(dòng)獲得翻譯規(guī)則,則用于構(gòu)筑翻譯機(jī)器系統(tǒng)的工作量將大大縮減。
作為從對(duì)譯文集中自動(dòng)獲得翻譯規(guī)則的方法,已經(jīng)提出了多種方法。但是,在這種自動(dòng)獲得的規(guī)則中存在下述問題。
例如,現(xiàn)有翻譯規(guī)則的自動(dòng)構(gòu)筑方法是不完善的,在所構(gòu)筑的翻譯規(guī)則中無論如何也避免不了包含錯(cuò)誤。例如,Imamura在“Hierarchical phrasealignment harmonized with parsing,”Proceedings of the 6thNatural LanguageProcessing Pacific Rim Symposium(NLPRS2001),pp.377-384,2001中報(bào)告說盡管從對(duì)譯文集中自動(dòng)取出成為翻譯規(guī)則基礎(chǔ)的句子對(duì)應(yīng)關(guān)系,但大約8%的對(duì)應(yīng)關(guān)系出錯(cuò)。在翻譯時(shí)使用包含錯(cuò)誤的規(guī)則將產(chǎn)生錯(cuò)誤翻譯。
通常,有可能對(duì)一個(gè)原文會(huì)進(jìn)行多種翻譯。當(dāng)在對(duì)譯文集中包含這種對(duì)譯群時(shí),由于這種多樣性而獲得多個(gè)冗余的規(guī)則。結(jié)果,獲得了相互競爭的多個(gè)規(guī)則。
例如當(dāng)存在替換語表達(dá)時(shí),對(duì)這些每一個(gè)表達(dá)都產(chǎn)生不同的翻譯規(guī)則。結(jié)果,當(dāng)進(jìn)行機(jī)器翻譯時(shí)曖昧性就增大。如果曖昧性增大,則產(chǎn)生合適的翻譯就變得困難。就是說,由于對(duì)譯文集中替換語的表達(dá),使機(jī)器翻譯的精度下降了。
在對(duì)譯文集中,當(dāng)包含依賴于文理的翻譯或者依賴于境況的翻譯時(shí),就會(huì)得到一會(huì)兒進(jìn)行過量省略一會(huì)兒產(chǎn)生添加語(原文中沒有而在譯文中產(chǎn)生的用語)的翻譯規(guī)則。此種翻譯規(guī)則構(gòu)成誤譯的原因。
現(xiàn)在,作為用于處理這種冗余/競爭規(guī)則的途徑,已經(jīng)提出了下面的兩種方法。第一種途徑是在翻譯時(shí)通過選擇合適的規(guī)則來消除曖昧性的方法。第二種途徑是在自動(dòng)獲得了翻譯規(guī)則之后,取舍選擇競爭規(guī)則作為后處理,由此使翻譯規(guī)則更加準(zhǔn)確的方法。
Menezes和Richardson在“A best first alignment algorithm for automaticextraction of transfer mappings from bilingual corpora,”in Proceedings of the“Workshop on Example-based Machine Translation”in MT Summit VIII,pp.35-42,2001中以及Imamura在“Application of translation knowledgeacquired by hierarchical phrase alignment for pattern-based MT,”inProceedings of the 9thConference on Theoretical and Methodological Issues inMachine Translation(TMI-2002),pp.74-84,2002中公開了根據(jù)該第二種途徑進(jìn)行的競爭規(guī)則的整理和最優(yōu)化(以后稱為“翻譯規(guī)則的清理(cleaning)”或者簡單稱為“清理”)。
根據(jù)Menezes等人提出的方法,在自動(dòng)獲得的翻譯規(guī)則中,只采用相同模式(pattern)的出現(xiàn)頻度為規(guī)定值(例如2)或者以上的規(guī)則。該方法以規(guī)則的出現(xiàn)頻度為基礎(chǔ)。根據(jù)Imamura(2002)提出的方法,通過根據(jù)x二乘檢查法進(jìn)行假設(shè)檢查,只從出現(xiàn)特別多的模式中選取在統(tǒng)計(jì)上可靠性高的翻譯規(guī)則。
在Menezes等人提出的方法中,報(bào)告了規(guī)則數(shù)變成清理前的1/9且翻譯質(zhì)量出現(xiàn)若干改善的例子。但是,雖然冗余規(guī)則被大幅度消減了,但不能夠獲得與此相應(yīng)的那種翻譯質(zhì)量的提高。
在Imamura(2002)提出的方法中,作為統(tǒng)計(jì)上能夠信賴的規(guī)則的數(shù)目與文集大小相比很小。因此,在為了獲得足夠數(shù)目的翻譯規(guī)則中存在必須有超大規(guī)模文集的問題。可以生成在統(tǒng)計(jì)上能夠信賴并且在機(jī)器翻譯上數(shù)目足夠的規(guī)則的超大規(guī)模文集在現(xiàn)在是不存在的。
發(fā)明內(nèi)容
因此,本發(fā)明的目的是提供一種用于改良翻譯知識(shí)的方法和裝置,其通過改良從對(duì)譯文集中自動(dòng)獲得的翻譯規(guī)則,能夠進(jìn)一步提高翻譯質(zhì)量。
本發(fā)明的另一目的是提供一種用于改良翻譯知識(shí)的方法和裝置,其通過改良從通常規(guī)模的對(duì)譯文集中自動(dòng)獲得的翻譯規(guī)則,能夠進(jìn)一步提高翻譯質(zhì)量。
本發(fā)明的又一目的是提供一種用于改良翻譯知識(shí)的方法和裝置,其通過在比較短的時(shí)間上清理從通常規(guī)模的對(duì)譯文集中自動(dòng)獲得的翻譯規(guī)則,能夠進(jìn)一步提高翻譯質(zhì)量。
本發(fā)明第一方案的方法是用于改良使用計(jì)算機(jī)從第一語言機(jī)器翻譯到第二語言之翻譯知識(shí)的方法。該方法包括在存儲(chǔ)裝置內(nèi)準(zhǔn)備計(jì)算機(jī)可讀取翻譯知識(shí)之集合的步驟;在存儲(chǔ)裝置內(nèi)準(zhǔn)備在第一語言和第二語言之間的對(duì)譯文集的步驟,該對(duì)譯文集包含多個(gè)計(jì)算機(jī)可讀取的對(duì)譯句子;利用翻譯知識(shí)的集合,將對(duì)譯文集中的第一語言的各個(gè)句子機(jī)器翻譯到第二語言的步驟;通過根據(jù)給定評(píng)價(jià)基準(zhǔn)一邊參考對(duì)譯文集一邊自動(dòng)地評(píng)價(jià)前述機(jī)器翻譯步驟的結(jié)果所得的第二語言的翻譯質(zhì)量來算出評(píng)價(jià)值的步驟;針對(duì)翻譯知識(shí)集合的部分集合,通過使用與在機(jī)器翻譯步驟下各個(gè)句子翻譯時(shí)所使用的翻譯知識(shí)相關(guān)的記錄和評(píng)價(jià)值,算出該部分集合對(duì)于翻譯質(zhì)量的貢獻(xiàn)度的步驟;當(dāng)通過計(jì)算貢獻(xiàn)度步驟所算出的貢獻(xiàn)度滿足預(yù)定的條件時(shí),從翻譯知識(shí)的集合中刪除與部分集合具有規(guī)定關(guān)系的翻譯知識(shí)的步驟。
選擇翻譯知識(shí)的部分集合,通過分別使用包含該翻譯知識(shí)的翻譯知識(shí)和不包含該翻譯知識(shí)的翻譯知識(shí)來進(jìn)行機(jī)器翻譯。通過比較其結(jié)果的翻譯質(zhì)量,對(duì)機(jī)器翻譯的翻譯質(zhì)量算出該翻譯知識(shí)的貢獻(xiàn)度。根據(jù)該貢獻(xiàn)度,刪除翻譯知識(shí)。結(jié)果,在減少了例如過多包含了自動(dòng)構(gòu)筑翻譯知識(shí)那樣的翻譯質(zhì)量下降的原因造成的不需要知識(shí)和錯(cuò)誤知識(shí)的翻譯知識(shí)量的同時(shí),還能夠提高翻譯質(zhì)量。
計(jì)算貢獻(xiàn)度的步驟也可以包括算出在用于計(jì)算評(píng)價(jià)值的步驟中所算出的評(píng)價(jià)值和當(dāng)使用與翻譯知識(shí)集合相關(guān)的部分集合的補(bǔ)集合來翻譯對(duì)譯文集中第一語言的各個(gè)句子時(shí)其翻譯質(zhì)量的評(píng)價(jià)值之間的差分的步驟。
作為優(yōu)選,機(jī)器翻譯步驟還包括通過利用翻譯知識(shí)集合將對(duì)譯文集中第一語言的各個(gè)句子一邊生成各個(gè)句子翻譯時(shí)所使用的翻譯知識(shí)的記錄一邊翻譯成第二語言的步驟。計(jì)算差分的步驟包括基于在機(jī)器翻譯步驟中生成的在各個(gè)句子翻譯時(shí)使用的翻譯知識(shí)的記錄,特定在機(jī)器翻譯步驟中通過部分集合中所包含的翻譯知識(shí)翻譯的第一語言的句子和在機(jī)器翻譯步驟中翻譯的其譯文的步驟;對(duì)于在特定步驟中被特定的第一語言的各個(gè)句子,通過使用與翻譯知識(shí)集合相關(guān)的部分集合的補(bǔ)集合中所包含的翻譯知識(shí)的機(jī)器翻譯來進(jìn)行重新翻譯的步驟;在機(jī)器翻譯步驟所得譯文的集合中,對(duì)于用重新翻譯步驟所得譯文置換在特定步驟特定的第一語言句子譯文所獲得的集合,根據(jù)給定評(píng)價(jià)基準(zhǔn)來進(jìn)行自動(dòng)評(píng)價(jià)并算出新評(píng)價(jià)值的步驟;算出在計(jì)算評(píng)價(jià)值步驟所算出的評(píng)價(jià)值和計(jì)算新評(píng)價(jià)值步驟所算出的新評(píng)價(jià)值之間的差分的步驟。
可以通過去掉某個(gè)翻譯知識(shí)再次進(jìn)行翻譯而算出其結(jié)果的評(píng)價(jià)值,但是,此時(shí)的計(jì)算量變大。如上述,最初翻譯時(shí),當(dāng)記錄了各個(gè)句子翻譯時(shí)使用的翻譯知識(shí),能夠特定當(dāng)刪除某個(gè)翻譯知識(shí)時(shí)翻譯結(jié)果不同的句子。只再次翻譯這種句子,并通過與最初譯文置換,能夠獲得與在重新翻譯全文時(shí)同樣的評(píng)價(jià)結(jié)果。結(jié)果,用小的計(jì)算量就能夠?qū)崿F(xiàn)翻譯知識(shí)的改良。
該方法也可以進(jìn)一步包括從預(yù)先準(zhǔn)備的、由第一語言和第二語言之間的對(duì)譯文構(gòu)成的、計(jì)算機(jī)可讀取的訓(xùn)練文集中生成分別包括訓(xùn)練子文集和評(píng)價(jià)子文集的多個(gè)子文集對(duì)的步驟;根據(jù)預(yù)定的翻譯規(guī)則的構(gòu)筑方式,從多個(gè)子文集對(duì)的每一個(gè)中自動(dòng)構(gòu)筑翻譯規(guī)則的步驟;將通過構(gòu)筑步驟對(duì)多個(gè)子文集構(gòu)筑的翻譯規(guī)則的多個(gè)集合作為對(duì)多個(gè)子文集的基本翻譯知識(shí)存儲(chǔ)在存儲(chǔ)裝置中的步驟;將多個(gè)子文集對(duì)的每一個(gè)作為對(duì)譯文集且將通過構(gòu)筑步驟從該子文集中所得的翻譯規(guī)則集合作為翻譯知識(shí),通過對(duì)多個(gè)子文集對(duì)的每一個(gè)執(zhí)行上述準(zhǔn)備步驟、上述機(jī)器翻譯步驟、上述算出評(píng)價(jià)值的步驟、上述算出貢獻(xiàn)度的步驟以及上述刪除步驟來改良翻譯知識(shí)的步驟;將通過改良翻譯知識(shí)的步驟改良的、對(duì)多個(gè)子文集對(duì)的每一個(gè)所獲得的翻譯知識(shí)的集合集中成一個(gè)翻譯知識(shí)集合的步驟。
將用于改良這種翻譯知識(shí)的方式稱為交叉清理。通過交叉清理,能夠使錯(cuò)誤翻譯知識(shí)殘余的可能性更小。
本發(fā)明第二方案的存儲(chǔ)介質(zhì)是用于存儲(chǔ)用于控制計(jì)算機(jī)的計(jì)算機(jī)程序的存儲(chǔ)介質(zhì),其使得通過計(jì)算機(jī)執(zhí)行后,執(zhí)行上述各個(gè)方法的全部步驟。
本發(fā)明第三方案的裝置是用于改良機(jī)器翻譯之翻譯知識(shí)的翻譯知識(shí)改良裝置。該裝置包括翻譯知識(shí)存儲(chǔ)部,用于存儲(chǔ)翻譯知識(shí)的集合;用于存儲(chǔ)可機(jī)器讀取的對(duì)譯文集的文集存儲(chǔ)部,其包含多個(gè)在原語言和目的語言之間的對(duì)譯文;機(jī)器翻譯引擎,用于利用在翻譯知識(shí)存儲(chǔ)部中存儲(chǔ)的翻譯知識(shí)的集合來將對(duì)譯文集中的原語言的句子機(jī)器翻譯成目的語言;翻譯質(zhì)量自動(dòng)評(píng)價(jià)部,用于通過參考對(duì)譯文集來自動(dòng)評(píng)價(jià)通過機(jī)器翻譯單元產(chǎn)生的翻譯結(jié)果的翻譯質(zhì)量并輸出評(píng)價(jià)值;改良部,用于進(jìn)行翻譯知識(shí)集合的改良,使得翻譯質(zhì)量自動(dòng)評(píng)價(jià)部輸出的評(píng)價(jià)值展示出希望的變化。
自動(dòng)評(píng)價(jià)使用翻譯知識(shí)之機(jī)器翻譯結(jié)果的翻譯質(zhì)量。進(jìn)行翻譯知識(shí)集合的改良,使得該評(píng)價(jià)值展示希望的變化。能夠改良翻譯知識(shí)的結(jié)合使得翻譯結(jié)果的翻譯質(zhì)量變得更高。
結(jié)合附圖進(jìn)行本發(fā)明的詳細(xì)說明,上述本發(fā)明的目的、特征和優(yōu)點(diǎn)將變得清楚。
圖1是有關(guān)本發(fā)明第一實(shí)施例的翻譯規(guī)則提取裝置20的功能框圖。
圖2是表示翻譯規(guī)則例子的示意圖。
圖3是用于實(shí)現(xiàn)翻譯規(guī)則提取裝置20的計(jì)算機(jī)的外視圖。
圖4是概略表示圖3所示計(jì)算機(jī)的電路構(gòu)成的示意圖。
圖5是表示用于通過計(jì)算機(jī)實(shí)現(xiàn)第一實(shí)施例之翻譯規(guī)則提取裝置20的程序控制結(jié)構(gòu)的流程圖。
圖6是用于概略說明本發(fā)明第二實(shí)施例中的交叉清理法的示意圖。
圖7是本發(fā)明第二實(shí)施例的翻譯規(guī)則提取裝置180的功能框圖。
圖8是表示用于實(shí)現(xiàn)翻譯規(guī)則提取裝置180的程序控制結(jié)構(gòu)的流程圖。
具體實(shí)施例方式
下面,說明本發(fā)明的實(shí)施例。在下面的說明中,相同部件上采用相同的標(biāo)記,其功能也相同。因此,對(duì)這些部件不重復(fù)進(jìn)行詳細(xì)說明。而且,為了記載簡單,在實(shí)施例說明的最后給出了參考文獻(xiàn)清單,在本記載中,當(dāng)述及這些參考文獻(xiàn)時(shí)使用其序號(hào)。
在下面的說明中,說明第一和第二實(shí)施例。成為這些實(shí)施例的基礎(chǔ)的考慮方法如下。就是說,本發(fā)明的實(shí)施例通過使用前述的第二途徑來處理冗余/競爭規(guī)則。為了這個(gè)目的,通過使用自動(dòng)構(gòu)筑的翻譯規(guī)則來機(jī)器翻譯評(píng)價(jià)文集中的原語言的句子。對(duì)于機(jī)器翻譯的結(jié)果,通過使用參考文獻(xiàn)1記載的那種工具來進(jìn)行翻譯質(zhì)量的自動(dòng)評(píng)價(jià),并獲得自動(dòng)評(píng)價(jià)值。通過進(jìn)行翻譯規(guī)則的取舍選擇以便提高該自動(dòng)評(píng)價(jià)值,獲得最合適的翻譯規(guī)則的組合(最合適的翻譯規(guī)則集合)。
在以下實(shí)施例中,在最合適翻譯規(guī)則的組合中使用登山法。此時(shí),將對(duì)每個(gè)組合所獲得的自動(dòng)評(píng)價(jià)值當(dāng)作評(píng)價(jià)函數(shù)輸出。
在以下實(shí)施例中,特別地,通過進(jìn)行只對(duì)自動(dòng)構(gòu)筑的翻譯規(guī)則集合之規(guī)則的刪除來進(jìn)行翻譯規(guī)則集合的最佳化。通過限定于這種規(guī)則刪除,具有加快用于清理的處理的效果。
在下面的實(shí)施例中,對(duì)從英語翻譯到日語時(shí)最佳化翻譯規(guī)則集合的情況進(jìn)行說明。但是,本發(fā)明不局限于這種語言的組合。如果是通過適用翻譯規(guī)則而能夠翻譯的語言組合,即使對(duì)哪一種組合也都能夠適用。
第一實(shí)施例結(jié)構(gòu)圖1是表示本發(fā)明第一實(shí)施例的翻譯規(guī)則提取裝置20的功能構(gòu)成的框圖。參考圖1,翻譯規(guī)則提取裝置20包括訓(xùn)練文集30,其包含很多在原語言(英語)和目的語言(日語)之間的對(duì)譯文章;規(guī)則構(gòu)筑部32,其用于從訓(xùn)練文集30中自動(dòng)構(gòu)筑機(jī)器翻譯規(guī)則;反饋清理部34,其用于對(duì)規(guī)則構(gòu)筑部32構(gòu)筑的翻譯規(guī)則集合,進(jìn)行后述那樣的反饋清理處理;評(píng)價(jià)文集36,在反饋清理部34進(jìn)行反饋清理時(shí),其用于翻譯質(zhì)量評(píng)價(jià)的參考。評(píng)價(jià)文集36中的對(duì)譯文章由英語原文和由人將原文翻譯成日語的結(jié)果(稱為參考譯文)構(gòu)成。
反饋清理部34包括翻譯規(guī)則集合存儲(chǔ)部40,其用于存儲(chǔ)通過規(guī)則構(gòu)筑部32從訓(xùn)練文集30中自動(dòng)構(gòu)筑的翻譯規(guī)則的集合;機(jī)器翻譯引擎42,其用于通過使用在翻譯規(guī)則集合存儲(chǔ)部40存儲(chǔ)的翻譯規(guī)則將評(píng)價(jià)文集36中的全部英語原文翻譯到目的語言的句子。機(jī)器翻譯引擎42是句子結(jié)構(gòu)轉(zhuǎn)換方式。
反饋清理部34還包括翻譯結(jié)果存儲(chǔ)部43,其存儲(chǔ)在各個(gè)句子翻譯時(shí)所使用翻譯規(guī)則的特定信息和通過機(jī)器翻譯引擎42產(chǎn)生的翻譯結(jié)果。
不僅包括這些,反饋清理部34還包括翻譯質(zhì)量自動(dòng)評(píng)價(jià)部44,其用于通過使用評(píng)價(jià)文集36來自動(dòng)地評(píng)價(jià)在翻譯結(jié)果存儲(chǔ)部43所存儲(chǔ)的日語句子(翻譯文)的翻譯質(zhì)量;規(guī)則貢獻(xiàn)度計(jì)算部46,其用于對(duì)翻譯規(guī)則集合存儲(chǔ)部40包含的每個(gè)規(guī)則,算出該規(guī)則刪除后的自動(dòng)評(píng)價(jià)值和算出其與刪除前的自動(dòng)評(píng)價(jià)值之間的差分(該差分在這里被稱為該規(guī)則的“規(guī)則貢獻(xiàn)度”)。規(guī)則貢獻(xiàn)度計(jì)算部46在計(jì)算貢獻(xiàn)度時(shí)使用通過翻譯質(zhì)量自動(dòng)評(píng)價(jià)部44產(chǎn)生的評(píng)價(jià)值和在翻譯結(jié)果存儲(chǔ)部43存儲(chǔ)的在翻譯時(shí)使用的翻譯規(guī)則的特定信息。
反饋清理部34還包括翻譯規(guī)則刪除部48,其用于從翻譯規(guī)則集合存儲(chǔ)部40的翻譯規(guī)則集合中刪除貢獻(xiàn)度計(jì)算部46算出的規(guī)則貢獻(xiàn)度滿足規(guī)定條件的翻譯規(guī)則(在本實(shí)施例中為規(guī)則貢獻(xiàn)度是負(fù)值的翻譯規(guī)則)。
在本實(shí)施例中,在通過規(guī)則構(gòu)筑部32進(jìn)行的翻譯規(guī)則自動(dòng)構(gòu)筑中使用由前述Imamura(2002)提出的方法。
在本實(shí)施例中,作為句子結(jié)構(gòu)轉(zhuǎn)換方式,機(jī)器翻譯引擎42使用后面參考文獻(xiàn)2記載的方式。機(jī)器翻譯引擎42使用將英語句子結(jié)構(gòu)變換到日語句子結(jié)構(gòu)的翻譯規(guī)則。圖2表示了機(jī)器翻譯引擎42使用的翻譯規(guī)則的例子。在該例子中,一個(gè)規(guī)則包含句子結(jié)構(gòu)種類、原語言模式、目的語言模式和例句。
句子結(jié)構(gòu)種類表示適用該規(guī)則的英語句子結(jié)構(gòu)節(jié)點(diǎn)的種類。
原語言模式表示使用該規(guī)則的英語句子結(jié)構(gòu)的模式。原語言模式是諸如X,Y的非結(jié)束符號(hào)(變量)和諸如單詞或者標(biāo)記(marker)的結(jié)束符號(hào)之間的隊(duì)列。
目的語言模式表示使用該規(guī)則時(shí)產(chǎn)生的日語句子結(jié)構(gòu)的模式。其是與原語言模式對(duì)應(yīng)的變量(諸如X‘,Y‘等)和用單詞表達(dá)的結(jié)束符號(hào)之間的隊(duì)列。
例句是在訓(xùn)練文集中出現(xiàn)的變量的實(shí)例。是與變量數(shù)一致的主辭單詞組。在本實(shí)施例中,翻譯規(guī)則集合存儲(chǔ)部40中各個(gè)規(guī)則的例句是在訓(xùn)練文集30中的出現(xiàn)例子。
翻譯規(guī)則集合存儲(chǔ)部40存儲(chǔ)的翻譯規(guī)則是根據(jù)機(jī)器翻譯引擎42所使用翻譯規(guī)則之格式的翻譯規(guī)則。
圖2所示規(guī)則中,例如規(guī)則序號(hào)1的規(guī)則被應(yīng)用于英語present at theconference之類的句子,其表示產(chǎn)生“在會(huì)議(“conference”的翻譯)上發(fā)表(“present”的翻譯)”之類的翻譯。
翻譯質(zhì)量自動(dòng)評(píng)價(jià)部44使用后面參考文獻(xiàn)1記載的BLEU。對(duì)于BLEU這種機(jī)器翻譯的自動(dòng)評(píng)價(jià)法,在其它地方也提出了若干。這些是在開發(fā)機(jī)器翻譯系統(tǒng)時(shí)通過置換過去用于進(jìn)行主觀評(píng)價(jià)的部分而將加速開發(fā)周期作為目標(biāo)的內(nèi)容。這些由于在全自動(dòng)下進(jìn)行的,因此其不僅能夠適用于過去考慮的那種開發(fā)支援,而且還能夠應(yīng)用于本實(shí)施例這種翻譯系統(tǒng)的自動(dòng)調(diào)整(tuning)中。
根據(jù)本實(shí)施例,翻譯質(zhì)量自動(dòng)評(píng)價(jià)使用的BLEU計(jì)算在評(píng)價(jià)文集的原文通過機(jī)器翻譯引擎42而機(jī)器翻譯的結(jié)果和評(píng)價(jià)文集36的參考翻譯之間的類似度,并將翻譯質(zhì)量作為得分(BLEU得分)輸出。類似度是通過兩者的N-gram的一致數(shù)測量的。盡管N是可變的,但在本實(shí)施例中,使用了1-gram到4-gram。
這里應(yīng)該注意的是,為了將BLEU得分使用于本實(shí)施例這種機(jī)器翻譯規(guī)則集合的評(píng)價(jià)中,必需使用具有某種程度大小的句子集合。對(duì)于每一個(gè)句子可算出BLEU得分,但與根據(jù)其原樣的主觀評(píng)價(jià)的差異很大。通過對(duì)翻譯結(jié)果集合所包含的整個(gè)翻譯文計(jì)算各自的類似度并取得總和,能夠抵消各自的誤差。
按下述,規(guī)則貢獻(xiàn)度計(jì)算部46對(duì)每個(gè)規(guī)則計(jì)算規(guī)則貢獻(xiàn)度。首先,使用對(duì)于通過機(jī)器翻譯引擎42獲得的評(píng)價(jià)文集36原語言的全文的翻譯結(jié)果由翻譯質(zhì)量自動(dòng)評(píng)價(jià)部44算出的得分,并獲得構(gòu)成基準(zhǔn)的自動(dòng)評(píng)價(jià)值。將該值稱為刪除前自動(dòng)評(píng)價(jià)值。通過該翻譯,也得到對(duì)哪一種文章的翻譯使用哪一種規(guī)則之類的信息。
接著,對(duì)翻譯規(guī)則集合存儲(chǔ)部40內(nèi)的每個(gè)翻譯規(guī)則,通過使用從翻譯規(guī)則集合存儲(chǔ)部40中刪除該規(guī)則所得到的部分集合來計(jì)算當(dāng)進(jìn)行評(píng)價(jià)文集36原語言的全文翻譯時(shí)的得分。該得分和刪除前自動(dòng)評(píng)價(jià)值的差是規(guī)則貢獻(xiàn)度。在本實(shí)施例中,根據(jù)下面的考慮方法進(jìn)行刪除后得分的計(jì)算。而且,在本例中,盡管是當(dāng)然的事,但由刪除了一個(gè)翻譯規(guī)則構(gòu)成的集合和通過刪除該翻譯規(guī)則而形成的部分集合具有互補(bǔ)集合的關(guān)系。
根據(jù)基本的考慮,在理論上也考慮對(duì)翻譯規(guī)則集合存儲(chǔ)部40內(nèi)規(guī)則的每個(gè)組合(部分集合)完全翻譯評(píng)價(jià)文集36。但是,在這種情況下,翻譯次數(shù)變得非常多。不能夠充分利用計(jì)算機(jī)資源和在合理的時(shí)間內(nèi)獲得結(jié)果。因此,按下述,計(jì)算量將少。
在通過機(jī)器翻譯引擎42的機(jī)器翻譯中,在翻譯一句后能夠特定該翻譯所使用的翻譯規(guī)則。該信息被存儲(chǔ)到翻譯結(jié)果存儲(chǔ)部43上。相反,當(dāng)翻譯了整個(gè)評(píng)價(jià)文集36時(shí),能夠特定使用了各個(gè)規(guī)則的句子。
當(dāng)通過使用從翻譯規(guī)則集合中刪除某個(gè)規(guī)則所獲得的部分集合來由機(jī)器翻譯引擎42進(jìn)行翻譯時(shí),根據(jù)這而改變的翻譯句子只是在該某個(gè)規(guī)則刪除前通過使用該規(guī)則而翻譯的翻譯句子。由于其它的句子通過使用別的規(guī)則翻譯,即使使用在作為刪除對(duì)象的規(guī)則被刪除之后的翻譯規(guī)則集合來進(jìn)行翻譯,也不會(huì)改變翻譯結(jié)果。
因此,當(dāng)從翻譯規(guī)則集合中刪除某個(gè)規(guī)則時(shí),如果通過使用刪除后的翻譯規(guī)則集合來只翻譯在刪除前通過使用該規(guī)則所翻譯的句子并同時(shí)求得其它譯文和參考翻譯之間的類似度,能夠獲得刪除后的BLEU得分。因此,翻譯整個(gè)句子是不必要的。
根據(jù)上述,通過只進(jìn)行翻譯規(guī)則的刪除,能夠在合理的時(shí)間內(nèi)獲得結(jié)果。
就是說,規(guī)則貢獻(xiàn)度計(jì)算部46涉及了通過翻譯質(zhì)量自動(dòng)評(píng)價(jià)部44產(chǎn)生的刪除前自動(dòng)評(píng)價(jià)值和翻譯時(shí)使用哪一個(gè)規(guī)則(哪一個(gè)規(guī)則被使用于哪一個(gè)句子的翻譯),并在翻譯結(jié)果存儲(chǔ)部43中獲得存儲(chǔ)的信息。對(duì)每個(gè)規(guī)則,算出當(dāng)通過使用除該規(guī)則之外的規(guī)則重新翻譯使用該規(guī)則翻譯的句子時(shí)的整個(gè)譯文的自動(dòng)評(píng)價(jià)值。算出該評(píng)價(jià)值和刪除前自動(dòng)評(píng)價(jià)值之間的差分(刪除前自動(dòng)評(píng)價(jià)值一刪除后的評(píng)價(jià)值),并將其作為該規(guī)則的規(guī)則貢獻(xiàn)度。規(guī)則貢獻(xiàn)度計(jì)算部46還保存將這樣算出的規(guī)則貢獻(xiàn)度為負(fù)(即通過刪除,自動(dòng)評(píng)價(jià)值變大)的規(guī)則的規(guī)則序號(hào)提供給翻譯規(guī)則刪除部48的功能。而且,在規(guī)則貢獻(xiàn)度計(jì)算部46中,為了加快該處理的結(jié)束,假定被刪除的規(guī)則之間是相互獨(dú)立的,通過一次重復(fù),全部確定應(yīng)該刪除的規(guī)則并刪除。
更具體地,規(guī)則貢獻(xiàn)度計(jì)算部46按下述算出規(guī)則貢獻(xiàn)度。在翻譯規(guī)則集合中,關(guān)于在通過機(jī)器翻譯引擎42翻譯時(shí)所使用的每一個(gè)翻譯規(guī)則,求得翻譯時(shí)使用該規(guī)則的句子的集合。如果該句子的集合不是空集,通過使用從基本規(guī)則集合中去掉該翻譯規(guī)則所獲得的部分集合,對(duì)該句子集合內(nèi)的各個(gè)句子通過機(jī)器翻譯引擎42再度進(jìn)行翻譯。在翻譯結(jié)果存儲(chǔ)部43存儲(chǔ)的翻譯結(jié)果中,將使用該翻譯規(guī)則所翻譯的句子與重新翻譯的句子替換。然后再度通過翻譯質(zhì)量自動(dòng)評(píng)價(jià)部44進(jìn)行翻譯質(zhì)量的自動(dòng)評(píng)價(jià)。這樣獲得的刪除后的評(píng)價(jià)值和刪除前的自動(dòng)評(píng)價(jià)值之間的差分構(gòu)成該翻譯規(guī)則的規(guī)則貢獻(xiàn)度。
通過在翻譯規(guī)則集合存儲(chǔ)部40的全部翻譯規(guī)則上進(jìn)行這種處理并且特定規(guī)則貢獻(xiàn)度為負(fù)的規(guī)則,確定了應(yīng)該刪除的翻譯規(guī)則。
翻譯規(guī)則刪除部48具有在翻譯規(guī)則集合存儲(chǔ)部40的規(guī)則中刪除與從規(guī)則貢獻(xiàn)度計(jì)算部46提供的信息相對(duì)應(yīng)的翻譯規(guī)則的功能。
操作第一實(shí)施例的翻譯規(guī)則提取裝置20按下述操作。訓(xùn)練文集30和評(píng)價(jià)文集36作為預(yù)先準(zhǔn)備的文集。規(guī)則構(gòu)筑部32從訓(xùn)練文集30內(nèi)的各個(gè)對(duì)譯句子中自動(dòng)構(gòu)筑翻譯規(guī)則,并存儲(chǔ)到翻譯規(guī)則集合存儲(chǔ)部40中。
機(jī)器翻譯引擎42通過使用翻譯規(guī)則集合存儲(chǔ)部40存儲(chǔ)的翻譯規(guī)則翻譯在評(píng)價(jià)文集36包含的對(duì)譯句子之中的全部原文。翻譯結(jié)果與在翻譯時(shí)使用的用于特定翻譯規(guī)則的信息一起被存儲(chǔ)到翻譯結(jié)果存儲(chǔ)部43。
翻譯質(zhì)量自動(dòng)評(píng)價(jià)部44通過使用評(píng)價(jià)文集36所存儲(chǔ)的參考譯文將在翻譯結(jié)果存儲(chǔ)部43上存儲(chǔ)的翻譯文的翻譯質(zhì)量自動(dòng)地評(píng)價(jià)作為BLEU得分,并將該結(jié)果提供給規(guī)則貢獻(xiàn)度計(jì)算部46。
規(guī)則貢獻(xiàn)度計(jì)算部46將從翻譯質(zhì)量自動(dòng)評(píng)價(jià)部44提供的BLEU得分作為刪除前的自動(dòng)評(píng)價(jià)值。接著,規(guī)則貢獻(xiàn)度計(jì)算部46根據(jù)上述方法算出關(guān)于翻譯規(guī)則集合存儲(chǔ)部40內(nèi)各個(gè)翻譯規(guī)則的規(guī)則貢獻(xiàn)度。然后,確定規(guī)則貢獻(xiàn)度成為負(fù)的規(guī)則,并將該信息提供給翻譯規(guī)則刪除部48。
翻譯規(guī)則刪除部48根據(jù)該信息刪除在翻譯規(guī)則集合存儲(chǔ)部40中存儲(chǔ)的翻譯規(guī)則集合內(nèi)的規(guī)則。刪除處理之后在翻譯規(guī)則集合存儲(chǔ)部40上存儲(chǔ)的翻譯規(guī)則集合成為被清理的最佳化集合。
具體例下面表示翻譯例和計(jì)算規(guī)則貢獻(xiàn)度的具體例。刪除前自動(dòng)評(píng)價(jià)值假設(shè)為0.233363。
翻譯例1圖2的規(guī)則5是從根據(jù)文理翻譯生成的錯(cuò)誤規(guī)則的例子。作為由“thenearest subway station”和“最近的地鐵”構(gòu)成的規(guī)則,原文“station”的翻譯在日語中省略了。
當(dāng)翻譯英語“Please tell me where the nearest railroad station is.”時(shí),使用該規(guī)則5,翻譯成日語為“請(qǐng)問最近的鐵路在哪里?!?。
如果刪除規(guī)則5,該翻譯變?yōu)椤罢?qǐng)問最近的鐵路站在哪里?!?。刪除后自動(dòng)評(píng)價(jià)值成為0.233549。
規(guī)則5的規(guī)則貢獻(xiàn)度成為0.233363-0.233549=-0.000186。因此規(guī)則5被刪除。刪除結(jié)果,“the nearest railroad station”將被正確翻譯為“最近的鐵路站”。
翻譯例2圖2的規(guī)則6是通過翻譯規(guī)則自動(dòng)構(gòu)筑錯(cuò)誤生成的錯(cuò)誤規(guī)則的例子。自動(dòng)構(gòu)筑時(shí),分析“rent two bicycles”的結(jié)果,其是“rent two”成為動(dòng)詞、“bicycles”成為名詞的例子。正確為“rent”是動(dòng)詞、“two bicycles”是名詞,但在翻譯規(guī)則的自動(dòng)構(gòu)筑時(shí)不能夠完全防止這種錯(cuò)誤的發(fā)生。
當(dāng)翻譯英語“I want to rent two rackets”時(shí),通過使用規(guī)則6翻譯成“想借2球拍”。刪除規(guī)則6后,該翻譯變成“想借2個(gè)球拍”。這樣,規(guī)則6刪除后的自動(dòng)評(píng)價(jià)值變?yōu)?.233529。規(guī)則6的規(guī)則貢獻(xiàn)度變?yōu)?0.000166,規(guī)則6被刪除。
翻譯例3圖2的規(guī)則7和規(guī)則8是由替換語表達(dá)產(chǎn)生的規(guī)則的例子。盡管哪一個(gè)都是正確的規(guī)則,但卻是相互競爭的規(guī)則。
當(dāng)翻譯英語“Please cash this traveler’s check.”時(shí),使用規(guī)則7或者規(guī)則8的任何一個(gè)。這次假設(shè)選擇規(guī)則7。翻譯結(jié)果成為“將該旅行者的支票變成現(xiàn)金”。
當(dāng)刪除規(guī)則7后,該翻譯成為“請(qǐng)將該旅行者的支票變成現(xiàn)金”。這樣,刪除后自動(dòng)評(píng)價(jià)值成為0.233585。這表示出在評(píng)價(jià)文集36中,與規(guī)則8一致的對(duì)譯句子比與規(guī)則7一致的對(duì)譯句子包含更多的內(nèi)容。
規(guī)則7的規(guī)則貢獻(xiàn)度在此種情況下成為-0.000222。結(jié)果,規(guī)則7被刪除,變成采用在評(píng)價(jià)文集36中與更多出現(xiàn)的表達(dá)一致的翻譯。
第一實(shí)施例的效果在上述第一實(shí)施例翻譯規(guī)則提取裝置20中,根據(jù)反饋清理部34的功能,通過使用翻譯質(zhì)量自動(dòng)評(píng)價(jià)部,能夠自動(dòng)地清理由對(duì)譯文集自動(dòng)構(gòu)筑的翻譯規(guī)則群。結(jié)果,由于排除了對(duì)機(jī)器翻譯結(jié)果產(chǎn)生壞影響的翻譯規(guī)則,因此獲得改善使用了被自動(dòng)構(gòu)筑翻譯規(guī)則之翻譯系統(tǒng)翻譯結(jié)果質(zhì)量的效果。實(shí)際上,對(duì)于使用清理后的翻譯規(guī)則來進(jìn)行翻譯的結(jié)果獲得了比使用未清理的翻譯規(guī)則的翻譯結(jié)果更好的評(píng)價(jià)。
通過計(jì)算機(jī)實(shí)現(xiàn)上述第一實(shí)施例的翻譯規(guī)則提取裝置20通過計(jì)算機(jī)和在其上執(zhí)行的軟件也可實(shí)現(xiàn)。圖3表示用于構(gòu)成翻譯規(guī)則提取裝置20的計(jì)算機(jī)的外視圖,圖4表示其框圖。
參考圖3,構(gòu)成翻譯規(guī)則提取裝置20的計(jì)算機(jī)系統(tǒng)包括具有CD-ROM(只讀存儲(chǔ)器光盤)驅(qū)動(dòng)器和FD(柔性盤)驅(qū)動(dòng)器72的計(jì)算機(jī)60;均與計(jì)算機(jī)60連接的監(jiān)視器62、鍵盤66和鼠標(biāo)68。
參考圖4,計(jì)算機(jī)60還包括CPU(中央處理單元)76;連接到CPU76的總線86;通過總線86與CPU76相互連接的RAM78、ROM80以及硬盤74。總線86上還連接了CD-ROM驅(qū)動(dòng)器70和FD驅(qū)動(dòng)器72。在CD-ROM驅(qū)動(dòng)器70上安裝CD-ROM82和在FD驅(qū)動(dòng)器72上安裝FD 84,其能夠在CPU76之間進(jìn)行數(shù)據(jù)的輸入輸出。
圖3和圖4所示計(jì)算機(jī)通過執(zhí)行具有下述這種控制結(jié)構(gòu)的計(jì)算機(jī)程序(以后簡單稱為“程序”)而操作作為圖1所示的翻譯規(guī)則提取裝置20。該程序作為計(jì)算機(jī)可讀取數(shù)據(jù)被記錄在例如CD-ROM82上而通用。將該CD-ROM82安裝在CD-ROM驅(qū)動(dòng)器70上,通過讀出程序并存儲(chǔ)到硬盤74上,計(jì)算機(jī)60能夠在任何時(shí)候執(zhí)行該程序。而且,訓(xùn)練文集30、評(píng)價(jià)文集36等存儲(chǔ)到硬盤74上。CPU76還將必要的數(shù)據(jù)從硬盤74讀出而存儲(chǔ)到RAM78上。
在執(zhí)行程序時(shí),將硬盤74上存儲(chǔ)的程序裝入ROM80。CPU76從ROM80中讀出并執(zhí)行通過未圖示的程序計(jì)數(shù)器表示的地址命令。CPU76將執(zhí)行結(jié)果輸出到規(guī)定的地址,并根據(jù)執(zhí)行結(jié)果同時(shí)更新程序計(jì)數(shù)器的內(nèi)容。
通過重復(fù)進(jìn)行這種處理而獲得最終的翻譯規(guī)則集合。所得結(jié)果在本實(shí)施例中被最終存儲(chǔ)到硬盤74。
由于計(jì)算機(jī)60本身的工作是周知的,在這里不重復(fù)其細(xì)節(jié)。
程序的控制結(jié)構(gòu)參考圖5,用于實(shí)現(xiàn)反饋清理部34的程序具有下面的控制結(jié)構(gòu)。首先,該程序在被啟動(dòng)和步驟100使刪除規(guī)則集合Rremove成為空集。在步驟102,使用機(jī)器翻譯引擎42通過參考翻譯規(guī)則集合存儲(chǔ)部40的翻譯規(guī)則來翻譯評(píng)價(jià)文集36的全部原文,并獲得翻譯結(jié)果集合Doc。與此同時(shí),記錄用于翻譯所使用的哪一個(gè)規(guī)則?;谠撚涗?,求得通過使用某個(gè)規(guī)則所翻譯的原文集合。將該原文集合假定為對(duì)于規(guī)則r的S[r]。接著在步驟104,通過使用翻譯質(zhì)量自動(dòng)評(píng)價(jià)部44從該翻譯結(jié)果集合Doc中算出初始(刪除前)自動(dòng)評(píng)價(jià)值SCORE。
接著,對(duì)于翻譯規(guī)則集合存儲(chǔ)部40內(nèi)的全部翻譯規(guī)則r,重復(fù)下述的步驟108~步驟120的處理。首先,在步驟108,判定使用規(guī)則r的原文集合S[r]是否是空集。當(dāng)為空集時(shí),對(duì)該規(guī)則r不進(jìn)行任何處理。當(dāng)S[r]不是空集時(shí),控制進(jìn)入到步驟110。
在步驟110,使用從翻譯規(guī)則集合中去掉了規(guī)則r的規(guī)則集合由機(jī)器翻譯引擎42對(duì)在原文集合S[r]中包含的整個(gè)原文進(jìn)行翻譯。結(jié)果,將所得譯文的集合假定為T[r]。接著在步驟112,將在步驟102求得的翻譯結(jié)果集合Doc中的使用規(guī)則r翻譯的譯文集合用集合T[r]置換,求得新的翻譯結(jié)果集合Doc[r]。在步驟114,對(duì)于該翻譯結(jié)果集合Doc[r],通過翻譯質(zhì)量自動(dòng)評(píng)價(jià)部44算出自動(dòng)評(píng)價(jià)值SCORE[r]。該自動(dòng)評(píng)價(jià)值SCORE[r]是刪除后自動(dòng)評(píng)價(jià)值。在步驟116,從初始自動(dòng)評(píng)價(jià)值SCORE中減去該刪除后自動(dòng)評(píng)價(jià)值SCORE[r],并將該結(jié)果代入規(guī)則貢獻(xiàn)度CONTRIB[r]。
在步驟118,判定規(guī)則貢獻(xiàn)度CONTRIB[r]是否為負(fù)。如果規(guī)則貢獻(xiàn)度CONTRIB[r]為負(fù),控制進(jìn)入到步驟120,將該規(guī)則r補(bǔ)充到刪除規(guī)則集合Rremove中。如果規(guī)則貢獻(xiàn)度CONTRIB[r]不為負(fù),則對(duì)該規(guī)則不做任何處理。
當(dāng)對(duì)全部規(guī)則r重復(fù)進(jìn)行了上述步驟108~120的處理之后,控制進(jìn)入到步驟124。在步驟124,判定刪除規(guī)則集合Rremove是不是空集。如果刪除規(guī)則集合Rremove是空集,則結(jié)束該程序的執(zhí)行。當(dāng)刪除規(guī)則集合Rremove不是空集時(shí),在步驟126,從翻譯規(guī)則集合存儲(chǔ)部40含有的翻譯規(guī)則集合中刪除該刪除規(guī)則集合Rremove中含有的規(guī)則。之后,控制返回到開始的步驟100,并重復(fù)上述處理,直到在步驟124判定出刪除規(guī)則集合Rremove是空集為止。
通過由圖3和圖4所示計(jì)算機(jī)執(zhí)行具有上述那種控制結(jié)構(gòu)的程序,能夠?qū)崿F(xiàn)圖1所示第一實(shí)施例的翻譯規(guī)則提取裝置20。
變形例在上述第一實(shí)施例中,判定是否對(duì)整個(gè)翻譯規(guī)則計(jì)算并刪除該規(guī)則貢獻(xiàn)度。但是,不必要對(duì)整個(gè)翻譯規(guī)則進(jìn)行這種處理,即使只對(duì)一部分規(guī)則進(jìn)行處理也能獲得相應(yīng)的效果。但是,判定是否對(duì)整個(gè)翻譯規(guī)則計(jì)算并刪除規(guī)則貢獻(xiàn)度顯然使在最終獲得的翻譯規(guī)則中包含錯(cuò)誤規(guī)則或者冗余規(guī)則的可能性變低了。因此,優(yōu)選的是,進(jìn)行針對(duì)整個(gè)翻譯規(guī)則的上述處理。
在上述實(shí)施例中,一次對(duì)一個(gè)一個(gè)翻譯規(guī)則計(jì)算其規(guī)則貢獻(xiàn)度。這樣,由于針對(duì)每一個(gè)翻譯規(guī)則都能夠判定其是否應(yīng)該刪除,因此其在將翻譯規(guī)則最佳化作為目標(biāo)方面是優(yōu)選的。但是,針對(duì)一個(gè)一個(gè)翻譯規(guī)則進(jìn)行該判定并不是必須的。原理上也可考慮有可能假定一次刪除多個(gè)翻譯規(guī)則時(shí)算出其貢獻(xiàn)度,并根據(jù)其結(jié)果集中刪除這些多個(gè)翻譯規(guī)則,通過這種辦法在某種程度上獲得與上述實(shí)施例相同的效果。
確定是否應(yīng)該刪除的翻譯規(guī)則數(shù)在上述實(shí)施例中被固定為“1”。由于通過固定這樣的數(shù)而使處理變得簡單,但實(shí)際上在以這種形式實(shí)施本發(fā)明要考慮很多的事情。但是,該數(shù)也不需要始終是相同的數(shù)。例如,根據(jù)某種基準(zhǔn)將每次確定數(shù)的翻譯規(guī)則作為處理對(duì)象并算出該規(guī)則貢獻(xiàn)度也是可以的。
在本發(fā)明中,將這類想法作為基本框架取出翻譯規(guī)則集合的任意部分集合(最初翻譯規(guī)則內(nèi)翻譯規(guī)則的任意組合),如果進(jìn)行機(jī)器翻譯確認(rèn)使用哪一種部分集合來獲得最佳評(píng)價(jià)值作為翻譯結(jié)果的翻譯質(zhì)量,并且根據(jù)該結(jié)果確定最終的翻譯規(guī)則集合。在該基本框架中,有關(guān)節(jié)約計(jì)算機(jī)資源和按照哪一種方式獲得某種程度上效率最優(yōu)的基本規(guī)則集合的一個(gè)實(shí)施例是上述的第一實(shí)施例。在該基本框架中,能夠具有其它與第一實(shí)施例在細(xì)節(jié)上不同的實(shí)施例以及基于上述第一實(shí)施例的詳細(xì)說明來容易實(shí)施這種實(shí)施例,這對(duì)于本領(lǐng)域技術(shù)人員是能夠容易理解的。
第二實(shí)施例概述通過使用由第一實(shí)施例裝置清理的翻譯規(guī)則集合,極大地改善了翻譯質(zhì)量。但是,認(rèn)為還有改善的余地。在第一實(shí)施例中,需要另外準(zhǔn)備不同于訓(xùn)練文集的評(píng)價(jià)文集。對(duì)于評(píng)價(jià)文集,由于對(duì)原文的參考譯文成為必要的,如果可能,希望不需要專門準(zhǔn)備評(píng)價(jià)文集。
一般地,與訓(xùn)練文集相比,評(píng)價(jià)文集規(guī)模(size)小的情況很多。因此,即使能夠發(fā)現(xiàn)最合適的解,也不能夠測試評(píng)價(jià)文集中的全部規(guī)則,發(fā)生清理遺漏。希望能夠防止這種清理遺漏。
因此,在第二實(shí)施例裝置中,對(duì)通過在第一實(shí)施例裝置中使用的反饋清理部34產(chǎn)生的清理結(jié)果,使用與交叉檢查同樣的考慮方法,來進(jìn)行用于獲得更接近最合適解的清理。在本說明書中,這種清理的方式稱為“交叉清理”。
N分交叉檢查是這種方法,一般地,其將數(shù)據(jù)集幾乎等分為N個(gè)子數(shù)據(jù)集,將一個(gè)用于某個(gè)模型的參數(shù)推斷中,針對(duì)N個(gè)子數(shù)據(jù)集的全體進(jìn)行用剩余數(shù)據(jù)集來評(píng)價(jià)被推斷模型的適用妙處。根據(jù)該交叉清理,能夠防止上述那種清理遺漏。
圖6表示在本實(shí)施例進(jìn)行的交叉清理的概要。下面,說明該處理的概要。
步驟1,將訓(xùn)練文集140分割成N個(gè)。
步驟2,將通過分割獲得的N個(gè)子文集作為評(píng)價(jià)子文集162A,162B,...。將從原來的訓(xùn)練文集140中去掉一個(gè)評(píng)價(jià)子文集(例如評(píng)價(jià)子文集162A)后的N-1個(gè)子文集(當(dāng)是評(píng)價(jià)子文集162A時(shí)其為評(píng)價(jià)子文集162B,162C,...)整理為一個(gè),生成訓(xùn)練子文集160A。評(píng)價(jià)子文集162A和訓(xùn)練子文集160A成對(duì)。
同樣,對(duì)于各個(gè)評(píng)價(jià)子文集162B,162C,...,生成訓(xùn)練子文集160B,160C,...,這些與原來的評(píng)價(jià)子文集162B,162C,...成對(duì)。
以上處理的結(jié)果,形成了N個(gè)子文集對(duì)150A,150B,...。從這N個(gè)子文集對(duì)150A,150B,...所包含的訓(xùn)練子文集160A,160B,...的每一個(gè)中通過與第一實(shí)施例相同進(jìn)行翻譯規(guī)則的自動(dòng)構(gòu)筑151A,151B。結(jié)果,獲得了N個(gè)自動(dòng)構(gòu)筑翻譯規(guī)則集合152A,152B,...。
步驟3,對(duì)于這些自動(dòng)構(gòu)筑翻譯規(guī)則集合152A,152B,...,通過分別使用評(píng)價(jià)子文集162A,162B,...,進(jìn)行與第一實(shí)施例相同的反饋清理153。結(jié)果,獲得了N個(gè)清理后的規(guī)則集合154A,154B,...。
步驟4,最后,對(duì)N個(gè)清理后的規(guī)則集合154A,154B,...進(jìn)行用于匯總機(jī)器翻譯規(guī)則的處理156,生成最終的交叉清理后的翻譯規(guī)則集合158。
通常交叉檢查之間的不同點(diǎn)是步驟4。本實(shí)施例中,對(duì)每個(gè)規(guī)則算出規(guī)則貢獻(xiàn)度的總和,當(dāng)其等于或者大于0時(shí)將該規(guī)則輸出到最終翻譯規(guī)則集合中。相反,從翻譯規(guī)則集合中刪除規(guī)則貢獻(xiàn)度總和不足0的規(guī)則。
結(jié)構(gòu)圖7表示了第二實(shí)施例翻譯規(guī)則提取裝置180的功能框圖。參考圖7,該翻譯規(guī)則提取裝置180包括訓(xùn)練文集140;規(guī)則構(gòu)筑部198,其用于從訓(xùn)練文集140中自動(dòng)構(gòu)筑翻譯規(guī)則;基本規(guī)則集合存儲(chǔ)部196,其用于存儲(chǔ)通過規(guī)則構(gòu)筑部198自動(dòng)構(gòu)筑的翻譯規(guī)則的集合(將其稱為“基本翻譯規(guī)則集合”)。規(guī)則構(gòu)筑部198具有與在第一實(shí)施例中使用的規(guī)則構(gòu)筑部32完全相同的功能。
翻譯規(guī)則提取裝置180還包括評(píng)價(jià)子文集162,其由將訓(xùn)練文集140分成N個(gè)子文集的一個(gè)子文集構(gòu)成;訓(xùn)練文集分割部190,其具有分割由其它N-1個(gè)子文集構(gòu)成的一個(gè)訓(xùn)練子文集160的功能;規(guī)則構(gòu)筑部32,用于從訓(xùn)練子文集160自動(dòng)構(gòu)筑翻譯規(guī)則;反饋清理部34,用于通過使用評(píng)價(jià)子文集162與第一實(shí)施例相同來反饋清理規(guī)則構(gòu)筑部32輸出的翻譯規(guī)則集合。反饋清理部34及其各個(gè)部分的功能是與第一實(shí)施例反饋清理部34及其各個(gè)部分的功能相同。因此,在這里不重復(fù)它們的詳細(xì)說明。
翻譯規(guī)則提取裝置180還包括重復(fù)控制部192,其用于控制訓(xùn)練文集分割部190、規(guī)則構(gòu)筑部32和反饋清理部34,使得N次重復(fù)進(jìn)行通過規(guī)則構(gòu)筑部32的翻譯規(guī)則自動(dòng)構(gòu)筑和通過反饋清理部34的翻譯規(guī)則反饋清理。通過重復(fù)控制部192進(jìn)行的重復(fù)是一邊替換一個(gè)由訓(xùn)練文集分割部190選擇的評(píng)價(jià)子文集162一邊進(jìn)行的。
翻譯規(guī)則提取裝置180不僅包括這些,還包括規(guī)則貢獻(xiàn)度存儲(chǔ)部202,用于對(duì)每個(gè)規(guī)則和每次重復(fù)存儲(chǔ)通過反饋清理部34的規(guī)則貢獻(xiàn)度計(jì)算部46算出的規(guī)則貢獻(xiàn)度;翻譯規(guī)則集中部194,用于集中由規(guī)則構(gòu)筑部32和反饋清理部34生成的N個(gè)反饋清理結(jié)束的翻譯規(guī)則集合以及在基本規(guī)則集合存儲(chǔ)部196內(nèi)生成最后一個(gè)交叉清理之后的翻譯規(guī)則集合。翻譯規(guī)則集中部194通過使用規(guī)則貢獻(xiàn)度存儲(chǔ)部202存儲(chǔ)的每個(gè)規(guī)則和每次重復(fù)的規(guī)則貢獻(xiàn)度,通過從基本規(guī)則集合存儲(chǔ)部196存儲(chǔ)的基本翻譯規(guī)則集合中刪除不需要的規(guī)則來進(jìn)行規(guī)則的集中。
規(guī)則構(gòu)筑部32和反饋清理部34的功能是分別與在第一實(shí)施例中說明的相同。
訓(xùn)練文集分割部190按下述方式以每次重復(fù)都不同的形式來分割訓(xùn)練文集140。首先,如前述那樣的訓(xùn)練文集140幾乎等分地被分割成N個(gè)子文集。這些被分別稱為第一子文集、第二子文集、...第N子文集。
在第一次重復(fù)中,訓(xùn)練文集分割部190將第一子文集作為評(píng)價(jià)子文集162,將從第二子文集到第N子文集匯總作為訓(xùn)練子文集160。在第二次重復(fù)中,訓(xùn)練文集分割部190將第二子文集作為評(píng)價(jià)子文集162,將第一子文集和從第三子文集到第N子文集匯總作為訓(xùn)練子文集160。在第三次重復(fù)中,訓(xùn)練文集分割部190將第三子文集作為評(píng)價(jià)子文集162,將第一子文集、第二子文集和從第四子文集到第N子文集匯總作為訓(xùn)練子文集160。以下同樣,在第N次重復(fù)中,訓(xùn)練文集分割部190將第N子文集作為評(píng)價(jià)子文集162,將從第一子文集到第N-1子文集匯總作為訓(xùn)練子文集160。
以上是訓(xùn)練文集分割部190的功能。
翻譯規(guī)則集中部194按照下面將反饋清理后的翻譯規(guī)則進(jìn)行集中。通過規(guī)則構(gòu)筑部198從整個(gè)訓(xùn)練文集140中自動(dòng)構(gòu)筑基本翻譯規(guī)則集合。該基本翻譯規(guī)則集合被存儲(chǔ)到基本規(guī)則集合存儲(chǔ)部196中。
接著,通過由重復(fù)控制部192產(chǎn)生的N次反饋清理從訓(xùn)練文集140的N個(gè)訓(xùn)練文集160中獲得N個(gè)翻譯規(guī)則集合。將這些稱為第一翻譯規(guī)則集合、第二翻譯規(guī)則集合、...第N翻譯規(guī)則集合。然后,當(dāng)生成這些翻譯規(guī)則集合時(shí),在每次重復(fù)時(shí),分別將由規(guī)則貢獻(xiàn)度計(jì)算部46計(jì)算的各個(gè)規(guī)則的規(guī)則貢獻(xiàn)度存儲(chǔ)到規(guī)則貢獻(xiàn)度存儲(chǔ)部202。在針對(duì)規(guī)則r的第i次重復(fù)時(shí)將所計(jì)算的規(guī)則貢獻(xiàn)度表示為CONTRIB[i][r](1≤i≤N,1≤r≤基本規(guī)則數(shù))。
翻譯規(guī)則集中部194在全部反饋清理結(jié)束時(shí),通過參考規(guī)則貢獻(xiàn)度存儲(chǔ)部202,對(duì)每個(gè)翻譯規(guī)則,計(jì)算規(guī)則貢獻(xiàn)度存儲(chǔ)部202存儲(chǔ)的規(guī)則貢獻(xiàn)度的總和CONTRIB[r]=∑iCONTRIB[i][r]。如果總和CONTRIB[r]為負(fù),則從基本規(guī)則集合存儲(chǔ)部196存儲(chǔ)的基本規(guī)則集合中刪除該規(guī)則r。通過對(duì)所有規(guī)則r進(jìn)行這個(gè)處理,進(jìn)行對(duì)基本規(guī)則集合存儲(chǔ)部196存儲(chǔ)的基本規(guī)則集合的清理,獲得最終的交叉反饋清理后的翻譯規(guī)則集合。
操作第二實(shí)施例的翻譯規(guī)則提取裝置180按下述操作。訓(xùn)練文集140在最初準(zhǔn)備。將訓(xùn)練文集140大致等分為N個(gè)的方法也預(yù)先確定。首先,規(guī)則構(gòu)筑部198從訓(xùn)練文集140中自動(dòng)構(gòu)筑翻譯規(guī)則。被構(gòu)筑的翻譯規(guī)則集合(基本規(guī)則集合)被存儲(chǔ)到基本規(guī)則集合存儲(chǔ)部196。
在重復(fù)控制部192進(jìn)行的控制之下執(zhí)行以下的重復(fù)處理。首先,訓(xùn)練文集分割部190從訓(xùn)練文集140中選擇第一子文集,并將其作為評(píng)價(jià)子文集162。訓(xùn)練文集分割部190還將剩余的N-1個(gè)子文集匯總作為訓(xùn)練子文集160。規(guī)則構(gòu)筑部32從訓(xùn)練子文集160中自動(dòng)構(gòu)筑翻譯規(guī)則。被構(gòu)筑的翻譯規(guī)則集合被存儲(chǔ)到翻譯規(guī)則集合存儲(chǔ)部40。
機(jī)器翻譯引擎42通過使用在翻譯規(guī)則集合存儲(chǔ)部40存儲(chǔ)的翻譯規(guī)則對(duì)評(píng)價(jià)子文集162中的原文集合進(jìn)行翻譯。翻譯質(zhì)量自動(dòng)評(píng)價(jià)部44自動(dòng)評(píng)價(jià)由機(jī)器翻譯引擎44產(chǎn)生的翻譯結(jié)果的翻譯質(zhì)量,并作為得分提供給規(guī)則貢獻(xiàn)度計(jì)算部46。
規(guī)則貢獻(xiàn)度計(jì)算部46與在第一實(shí)施例中說明的相同,針對(duì)在翻譯規(guī)則集合存儲(chǔ)部40存儲(chǔ)的各個(gè)規(guī)則而算出規(guī)則貢獻(xiàn)度。對(duì)每個(gè)規(guī)則每次重復(fù),所算出的規(guī)則貢獻(xiàn)度作為CONTRIB[i][r]被存儲(chǔ)到規(guī)則貢獻(xiàn)度存儲(chǔ)部202中。
通過N次重復(fù)上述處理,規(guī)則貢獻(xiàn)度CONTRIB[i][r](1≤i≤N,1≤r≤基本翻譯規(guī)則數(shù))被存儲(chǔ)到規(guī)則貢獻(xiàn)度存儲(chǔ)部202。
翻譯規(guī)則集中部194針對(duì)基本規(guī)則集合存儲(chǔ)部196存儲(chǔ)的各個(gè)規(guī)則,計(jì)算出如上述的規(guī)則貢獻(xiàn)度總和CONTRIB[r]=∑iCONTRIB[i][r]。當(dāng)CONTRIB[r]為負(fù)時(shí),從基本規(guī)則集合存儲(chǔ)部196內(nèi)的基本規(guī)則集合中刪除該規(guī)則。
翻譯規(guī)則集中部194通過對(duì)基本規(guī)則集合存儲(chǔ)部196存儲(chǔ)的全部翻譯規(guī)則進(jìn)行上述處理,最終在基本規(guī)則集合存儲(chǔ)部196上獲得交叉清理后的基本規(guī)則集合。
第二實(shí)施例的效果當(dāng)通過第二實(shí)施例的翻譯規(guī)則提取裝置180使用交叉清理后的翻譯規(guī)則集合來進(jìn)行機(jī)器翻譯時(shí),獲得比通過第一實(shí)施例所得結(jié)果更好的結(jié)果。而且,在第一實(shí)施例的翻譯規(guī)則提取裝置20中,除了訓(xùn)練文集之外,還必需準(zhǔn)備評(píng)價(jià)文集。與此相反,在第二實(shí)施例的翻譯規(guī)則提取裝置180中,只使用訓(xùn)練文集,除此之外不需要考慮評(píng)價(jià)文集。因此,翻譯規(guī)則的清理通過使用限定的對(duì)譯文集進(jìn)行,結(jié)果,通過使用所獲得的翻譯規(guī)則集合,能夠進(jìn)行高精度的機(jī)器翻譯。
通過計(jì)算機(jī)實(shí)現(xiàn)第二實(shí)施例的翻譯規(guī)則提取裝置180還是可以通過圖3和圖4所示的計(jì)算機(jī)和在其上執(zhí)行的程序?qū)崿F(xiàn)的。圖8以流程圖形式表示出用于實(shí)現(xiàn)第二實(shí)施例翻譯規(guī)則提取裝置180的程序控制結(jié)構(gòu)。
參考圖8,該程序包括從訓(xùn)練文集140自動(dòng)構(gòu)筑基本規(guī)則集合的步驟210和將訓(xùn)練文集140均等地分類為N個(gè)子文集的步驟212。將這N個(gè)子文集假定為EC[i](1≤i≤N)。
該程序還包括一邊將變量i從1到N一次增加一個(gè)一邊重復(fù)下述步驟216到步驟220的步驟。首先,在步驟216,從訓(xùn)練文集140中去掉子文集EC[i],生成訓(xùn)練子文集160。將該訓(xùn)練子文集假定為TC[i]。
接著在步驟218,從訓(xùn)練子文集TC[i]自動(dòng)構(gòu)筑翻譯規(guī)則集合R[i]。在步驟220,將子文集EC[i]看著評(píng)價(jià)文集以及反饋清理翻譯規(guī)則集合R[i]。該反饋清理處理的內(nèi)容是與圖5所示第一實(shí)施例的相同。但是此時(shí),必需注意的是,在圖5步驟116算出的規(guī)則貢獻(xiàn)度CONTRIB[r]作為CONTRIB[i][r]存儲(chǔ)的。
在將步驟216到步驟220的處理N次重復(fù)之后,這次針對(duì)在步驟210被自動(dòng)構(gòu)筑的基本規(guī)則集合內(nèi)的全部規(guī)則r重復(fù)進(jìn)行在下面說明的步驟226到步驟232的處理(1≤r≤基本規(guī)則集合內(nèi)的規(guī)則數(shù))。
在步驟226,從翻譯規(guī)則集合R[i](1≤i≤N)中取得規(guī)則r的規(guī)則貢獻(xiàn)度CONTRIB[i][r]。具體地,從存儲(chǔ)區(qū)域取出如前述在圖5的步驟116中存儲(chǔ)的規(guī)則貢獻(xiàn)度。在步驟228,算出基本規(guī)則r的貢獻(xiàn)度CONTRIB[r]=∑icontib[i][r]。
在后續(xù)步驟230中,判定在步驟228算出的貢獻(xiàn)度CONTRIB[r]是否為負(fù)。如果為負(fù),則在步驟232從基本規(guī)則集合中去除該規(guī)則r。當(dāng)不是負(fù)時(shí)不進(jìn)行任何處理。
通過對(duì)基本規(guī)則集合內(nèi)的全部規(guī)則進(jìn)行上述從步驟226到步驟232的處理,與前述相同,最終獲得進(jìn)行了反饋清理的翻譯規(guī)則。通過該交叉清理,能夠防止在第二實(shí)施例說明開始中說明那樣的清理遺漏。
第二實(shí)施例的變形例在上述第二實(shí)施例的裝置中,另外設(shè)置了不同于規(guī)則構(gòu)筑部32的規(guī)則構(gòu)筑部198。但是,這些未必需要另外設(shè)置。也可以通過使用相同的規(guī)則構(gòu)筑部來切換其輸入和輸出的連接方。
在上述實(shí)施例的裝置中,通過將訓(xùn)練文集140幾乎等分成N個(gè)子文集,生成訓(xùn)練子文集和評(píng)價(jià)子文集。但是,本發(fā)明不限定于這樣的實(shí)施例。例如,訓(xùn)練文集140未必要等分。實(shí)際上也可以分割成大小不同的文集、然后進(jìn)行與上述相同的處理。但是,在這種情況下,當(dāng)在翻譯規(guī)則集中部194中對(duì)規(guī)則進(jìn)行集中時(shí)規(guī)則貢獻(xiàn)度的總和計(jì)算中,希望將根據(jù)文集大小的權(quán)重乘以各個(gè)貢獻(xiàn)度后相加。
共同變形例在上述兩個(gè)實(shí)施例中,使用參考文獻(xiàn)02中記載的作為機(jī)器翻譯引擎42。但是,本發(fā)明不限定于這樣的實(shí)施例。只要是使用翻譯規(guī)則的句子結(jié)構(gòu)轉(zhuǎn)換方式的機(jī)器翻譯引擎,使用何種都是可以的。
在上述兩個(gè)實(shí)施例中,在由翻譯質(zhì)量自動(dòng)評(píng)價(jià)部44進(jìn)行的翻譯質(zhì)量的自動(dòng)評(píng)價(jià)中采用了BLEU。但是,在翻譯質(zhì)量的自動(dòng)評(píng)價(jià)中可以不只是使用BLEU。例如,可以使用在后面參考文獻(xiàn)3或者參考文獻(xiàn)4記載的BLEU。
作為自動(dòng)評(píng)價(jià)值,在本實(shí)施例中,當(dāng)與評(píng)價(jià)文集內(nèi)的譯文之間的類似度高時(shí),使用評(píng)價(jià)值變高的。但是,作為自動(dòng)評(píng)價(jià)值不限定于這樣的。當(dāng)類似度高時(shí)用評(píng)價(jià)值變低的也是可以的。與評(píng)價(jià)文集內(nèi)的譯文之間的類似度變得愈高,使用更靠近特定值的評(píng)價(jià)值也是可以的。
在上述實(shí)施例中,將翻譯規(guī)則作為翻譯知識(shí),并對(duì)一個(gè)翻譯規(guī)則計(jì)算其規(guī)則貢獻(xiàn)度。但是,本發(fā)明不限定于這樣的實(shí)施例。例如,一次集中選擇多個(gè)翻譯規(guī)則,將該部分集合中包含的翻譯規(guī)則集中作為上述清理對(duì)象也是可以的。
在上述實(shí)施例中,選擇由一個(gè)翻譯規(guī)則構(gòu)成的集合,并當(dāng)該規(guī)則貢獻(xiàn)度為負(fù)時(shí)刪除該翻譯規(guī)則。但是,本發(fā)明不限定于這樣的實(shí)施例。例如,同樣,對(duì)于由去掉一個(gè)翻譯規(guī)則的剩余翻譯規(guī)則構(gòu)成的集合算出其規(guī)則貢獻(xiàn)度,并且當(dāng)其值為正時(shí),刪除該集合的補(bǔ)集合所屬的翻譯規(guī)則。
軟件的流通形式不局限于上述那樣固定于記錄介質(zhì)的形式。例如,也能夠具有從通過網(wǎng)絡(luò)連接的其它計(jì)算機(jī)上獲取數(shù)據(jù)的形式下的流通形式。也能夠存在這種形式的通用形式,其將軟件的一部分預(yù)先存儲(chǔ)于硬盤54中,將軟件的剩余部分在經(jīng)由網(wǎng)絡(luò)被取入硬盤54執(zhí)行時(shí)集中。
一般地,現(xiàn)代程序利用通過計(jì)算機(jī)的操作系統(tǒng)(OS)提供的通用功能并通過根據(jù)希望目的所組織的形式執(zhí)行這些功能來達(dá)到前述希望的目的。因此,在上述本實(shí)施例的各個(gè)功能中,不包含OS或者第三方(third party)提供的通用功能,即使是用于只指定這些通用功能之執(zhí)行順序的組合的程序(組),只要是具有利用這些功能而在整體上實(shí)現(xiàn)希望目的的控制結(jié)構(gòu)的程序(組),顯然這些也被包含在本發(fā)明的技術(shù)范圍內(nèi)。
這里公開的實(shí)施形式是簡單地例示,但本發(fā)明并不僅僅局限于上述實(shí)施形式。本發(fā)明的范圍在參考本發(fā)明之詳細(xì)說明的基礎(chǔ)上,由權(quán)利要求書的各權(quán)利要求中表示,包含在其上記載的文語和等同意義及范圍內(nèi)的全部變更。
參考文獻(xiàn)清單參考文獻(xiàn)1Paineni,K.,Roukos,S.,Ward,T.,and Zhu,W.-J.(2002)Bleua method for automatic evaluation of machine translation.In Proceedingsof the 40thAnnual Meeting of the Association for Computational Linguistics(ACL),pp.311-318。
參考文獻(xiàn)2古瀨藏、山本和英、山田節(jié)夫(1999)。使用構(gòu)成素境界分析的多語言口語翻譯。自然言語處理,6(5)63-91。
參考文獻(xiàn)3,Yasuda,K,sugaya,F(xiàn),Takezawa,T.,Yamamoto,S.,andYanagida,M.,(2001).An automatic evaluation method of translation qualityusing translation answer candidates queried from a parallel corpus.Inproceedings of Machine Translation Summit VIII,pp.373-378.
參考文獻(xiàn)4Akiba,Y.,Imamura,K.,and Sumita,E.,(2001).Usingmultiple edit distances to automatically rank machine translation output.InProceeding of Machine Translation Summit VIII,pp.15-20.
權(quán)利要求
1.一種改良翻譯知識(shí)的方法,其使用計(jì)算機(jī)對(duì)從第一語言機(jī)器翻譯成第二語言時(shí)的翻譯知識(shí)進(jìn)行改良,包括在存儲(chǔ)裝置內(nèi)準(zhǔn)備計(jì)算機(jī)可讀取的翻譯知識(shí)之集合的步驟;在存儲(chǔ)裝置內(nèi)準(zhǔn)備在所述第一語言和所述第二語言之間的對(duì)譯文集的步驟,該對(duì)譯文集包含多個(gè)計(jì)算機(jī)可讀取的對(duì)譯句子;利用所述翻譯知識(shí)的集合,將所述對(duì)譯文集中的所述第一語言的各個(gè)句子機(jī)器翻譯成所述第二語言的步驟;根據(jù)給定評(píng)價(jià)基準(zhǔn)一邊參考所述對(duì)譯文集一邊自動(dòng)評(píng)價(jià)所述機(jī)器翻譯步驟的結(jié)果所得到的所述第二語言的翻譯質(zhì)量,并算出評(píng)價(jià)值的步驟;針對(duì)所述翻譯知識(shí)集合的部分集合,采用與在所述機(jī)器翻譯步驟下各個(gè)句子翻譯時(shí)所使用的翻譯知識(shí)相關(guān)的記錄、和所述評(píng)價(jià)值,算出該部分集合對(duì)于翻譯質(zhì)量的貢獻(xiàn)度的步驟;和當(dāng)由計(jì)算所述貢獻(xiàn)度步驟所算出的貢獻(xiàn)度滿足預(yù)定的條件時(shí),從所述翻譯知識(shí)的集合中刪除與所述部分集合具有給定關(guān)系的翻譯知識(shí)的步驟。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,計(jì)算所述貢獻(xiàn)度的步驟包括算出在所述用于計(jì)算評(píng)價(jià)值的步驟中所算出的評(píng)價(jià)值、和采用有關(guān)所述翻譯知識(shí)集合的所述部分集合的補(bǔ)集合來翻譯所述對(duì)譯文集中所述第一語言的各個(gè)句子時(shí)的翻譯質(zhì)量的評(píng)價(jià)值之間的差分的步驟。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述機(jī)器翻譯步驟還包括利用所述翻譯知識(shí)集合將所述對(duì)譯文集中所述第一語言的各個(gè)句子在生成各個(gè)句子翻譯時(shí)所使用的翻譯知識(shí)的記錄的同時(shí)翻譯成所述第二語言的步驟;計(jì)算所述差分的步驟包括根據(jù)在所述機(jī)器翻譯步驟中生成的在各個(gè)句子翻譯時(shí)使用的翻譯知識(shí)的記錄,特定在所述機(jī)器翻譯步驟中采用所述部分集合中所包含的翻譯知識(shí)翻譯所翻譯的所述第一語言的句子、和在所述機(jī)器翻譯步驟中所翻譯的其譯文的步驟;對(duì)于在所述特定步驟中被特定的所述第一語言的各個(gè)句子,通過使用與所述翻譯知識(shí)集合相關(guān)的所述部分集合的補(bǔ)集合中所包含的翻譯知識(shí)的機(jī)器翻譯來進(jìn)行重新翻譯的步驟;在所述機(jī)器翻譯步驟所得譯文的集合中,對(duì)于用所述重新翻譯步驟所得譯文置換在所述特定步驟特定的所述第一語言句子譯文所獲得的集合,根據(jù)所述給定評(píng)價(jià)基準(zhǔn)來進(jìn)行自動(dòng)評(píng)價(jià)并算出新評(píng)價(jià)值的步驟;和算出在計(jì)算所述評(píng)價(jià)值步驟所算出的評(píng)價(jià)值和計(jì)算所述新評(píng)價(jià)值步驟所算出的新評(píng)價(jià)值之間的差分的步驟。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,刪除所述翻譯規(guī)則的步驟包括當(dāng)通過計(jì)算所述貢獻(xiàn)度的步驟所算出的貢獻(xiàn)度是負(fù)值時(shí),從所述翻譯知識(shí)集合中刪除在所述部分集合中所包含的翻譯知識(shí)的步驟。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括改變?cè)谒龇g知識(shí)集合中的所述部分集合,在規(guī)定結(jié)束條件滿足之前重復(fù)進(jìn)行算出所述貢獻(xiàn)度的步驟和所述刪除步驟的步驟。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述部分集合只包含一個(gè)翻譯知識(shí)。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述翻譯知識(shí)包括從所述第一語言的句子結(jié)構(gòu)模式到所述第二語言的句子結(jié)構(gòu)模式的句子結(jié)構(gòu)變換規(guī)則。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,算出所述貢獻(xiàn)度的步驟包括根據(jù)預(yù)定的方法,從所述翻譯知識(shí)集合生成多個(gè)部分集合的步驟;使用與在使用所述多個(gè)部分集合的每一個(gè)來進(jìn)行所述機(jī)器翻譯的步驟中所使用的引擎相同的機(jī)器翻譯引擎來重新翻譯所述對(duì)譯文集的所述第一語言的句子,并且根據(jù)所述規(guī)定的評(píng)價(jià)基準(zhǔn)來算出所述重新翻譯結(jié)果之翻譯質(zhì)量的新評(píng)價(jià)值的步驟;和對(duì)于所述多個(gè)部分集合的每一個(gè),算出在計(jì)算所述評(píng)價(jià)值的步驟所算出的評(píng)價(jià)值和在、根據(jù)權(quán)利要求1所述的方法,算出所述新評(píng)價(jià)值的步驟所算出的新評(píng)價(jià)值之間的差分的步驟。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述刪除步驟包括對(duì)于所述多個(gè)部分集合的每一個(gè),判定通過算出所述貢獻(xiàn)度的步驟所算出的貢獻(xiàn)度是否為負(fù)值的步驟;和對(duì)于通過所述判定步驟判定所述貢獻(xiàn)度為負(fù)值的部分集合的每一個(gè),從所述翻譯知識(shí)集合中刪除該部分集合所屬的翻譯知識(shí)的步驟。
10.根據(jù)權(quán)利要求9述的方法,其特征在于,所述機(jī)器翻譯步驟還包括通過利用所述翻譯知識(shí)集合將所述對(duì)譯文集中所述第一語言的各個(gè)句子在成各個(gè)句子翻譯時(shí)所使用的翻譯知識(shí)的記錄的同時(shí)翻譯成所述第二語言的步驟;計(jì)算所述差分的步驟包括根據(jù)在所述機(jī)器翻譯步驟中生成的在各個(gè)句子翻譯時(shí)使用的翻譯知識(shí)的記錄,特定在所述機(jī)器翻譯步驟中通過所述部分集合中所包含的翻譯知識(shí)所翻譯的所述第一語言的句子、和在所述機(jī)器翻譯步驟中所翻譯的其譯文的步驟;對(duì)于在所述特定步驟中被特定的所述第一語言的各個(gè)句子,通過使用所述部分集合中所包含的翻譯知識(shí)來進(jìn)行重新翻譯的步驟;在所述機(jī)器翻譯步驟所得譯文的集合中,對(duì)于用所述重新翻譯步驟所得譯文置換在所述特定步驟特定的所述第一語言句子譯文后所獲得的集合,根據(jù)所述給定評(píng)價(jià)基準(zhǔn)來進(jìn)行自動(dòng)評(píng)價(jià)并算出新評(píng)價(jià)值的步驟;和算出在計(jì)算所述評(píng)價(jià)值步驟所算出的評(píng)價(jià)值、和計(jì)算所述新評(píng)價(jià)值步驟所算出的新評(píng)價(jià)值之間的差分的步驟。
11.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述刪除步驟包括對(duì)于所述多個(gè)部分集合的每一個(gè),判定通過算出所述差分的步驟所算出的差分是否為正值的步驟;和對(duì)于通過所述判定步驟判定所述差分為正值的部分集合的每一個(gè),從所述翻譯知識(shí)集合中刪除其補(bǔ)集合所屬的翻譯知識(shí)的步驟。
12.根據(jù)權(quán)利要求9所述的方法,其特征在于,生成所述部分集合的步驟包括從所述翻譯知識(shí)集合中,生成多個(gè)通過去掉預(yù)定數(shù)目的翻譯知識(shí)所獲得的部分集合的步驟。
13.根據(jù)權(quán)利要求12所述的方法,其特征在于,生成多個(gè)所述部分集合的步驟包括從所述翻譯知識(shí)集合中,生成多個(gè)通過去掉一個(gè)翻譯知識(shí)所獲得的部分集合的步驟。
14.根據(jù)權(quán)利要求9所述的方法,其特征在于,生成所述部分集合的步驟包括從所述翻譯知識(shí)集合中,生成通過去掉預(yù)定數(shù)目的翻譯知識(shí)而能夠獲得的全部部分集合的步驟。
15.根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括從預(yù)先準(zhǔn)備的、由所述第一語言和所述第二語言之間的對(duì)譯文構(gòu)成的、計(jì)算機(jī)可讀取的訓(xùn)練文集中生成分別包括訓(xùn)練子文集和評(píng)價(jià)子文集的多個(gè)子文集對(duì)的步驟;根據(jù)預(yù)定的翻譯規(guī)則的構(gòu)筑方式,從所述多個(gè)子文集對(duì)的每一個(gè)中自動(dòng)構(gòu)筑翻譯規(guī)則的步驟;將通過所述構(gòu)筑步驟對(duì)所述多個(gè)子文集構(gòu)筑的翻譯規(guī)則的多個(gè)集合作為對(duì)所述多個(gè)子文集的基本翻譯知識(shí)存儲(chǔ)在存儲(chǔ)裝置中的步驟;將所述多個(gè)子文集對(duì)的每一個(gè)作為所述對(duì)譯文集并且將通過所述構(gòu)筑步驟從該子文集中所得的翻譯規(guī)則集合作為所述翻譯知識(shí),通過執(zhí)行對(duì)所述多個(gè)子文集對(duì)的每一個(gè)的所述準(zhǔn)備步驟、所述機(jī)器翻譯步驟、算出所述評(píng)價(jià)值的步驟、算出所述貢獻(xiàn)度的步驟以及所述刪除步驟來改良所述翻譯知識(shí)的步驟;和將通過改良所述翻譯知識(shí)的步驟改良的、對(duì)所述多個(gè)子文集對(duì)的每一個(gè)所獲得的翻譯知識(shí)的集合集中成一個(gè)翻譯知識(shí)集合的步驟。
16.根據(jù)權(quán)利要求15所述的方法,其特征在于,所述集中步驟包括對(duì)于所述存儲(chǔ)裝置存儲(chǔ)的所述基本翻譯知識(shí)中包含的每一個(gè)翻譯規(guī)則,在所述多個(gè)子文集對(duì)的全體中合計(jì)通過算出所述貢獻(xiàn)度的步驟所算出的貢獻(xiàn)度的步驟;和更新在所述存儲(chǔ)裝置中存儲(chǔ)的所述基本翻譯知識(shí)的步驟,使得刪除通過所述合計(jì)步驟合計(jì)的貢獻(xiàn)度滿足規(guī)定條件的翻譯規(guī)則。
17.根據(jù)權(quán)利要求16所述的方法,其特征在于,更新所述基本翻譯知識(shí)的步驟包括更新在所述存儲(chǔ)裝置中存儲(chǔ)的所述基本翻譯知識(shí)的步驟,使得刪除通過所述合計(jì)步驟合計(jì)的貢獻(xiàn)度為負(fù)的翻譯知識(shí)。
18.一種存儲(chǔ)介質(zhì),用于存儲(chǔ)控制計(jì)算機(jī)的計(jì)算機(jī)程序,其使得通過計(jì)算機(jī)執(zhí)行后,執(zhí)行權(quán)利要求1記載的全部步驟。
19.一種翻譯知識(shí)改良裝置,用于改良機(jī)器翻譯之翻譯知識(shí),其特征在于,包括翻譯知識(shí)存儲(chǔ)單元,用于存儲(chǔ)翻譯知識(shí)的集合;對(duì)譯文集存儲(chǔ)單元,用于存儲(chǔ)包含多個(gè)在原語言和目的語言之間的對(duì)譯文的可機(jī)器讀取的對(duì)譯文集;機(jī)器翻譯單元,用于利用在所述翻譯知識(shí)存儲(chǔ)單元中存儲(chǔ)的所述翻譯知識(shí)的集合來將所述對(duì)譯文集中的所述原語言的句子機(jī)器翻譯成所述目的語言;翻譯質(zhì)量自動(dòng)評(píng)價(jià)單元,用于通過參考所述對(duì)譯文集來自動(dòng)評(píng)價(jià)通過所述機(jī)器翻譯單元產(chǎn)生的翻譯結(jié)果的翻譯質(zhì)量并輸出評(píng)價(jià)值;和改良單元,用于進(jìn)行所述翻譯知識(shí)集合的改良,使得所述翻譯質(zhì)量自動(dòng)評(píng)價(jià)單元輸出的評(píng)價(jià)值展示出希望的變化。
20.根據(jù)權(quán)利要求19所述的翻譯知識(shí)改良裝置,其特征在于,所述翻譯知識(shí)包括從所述原語言的句子結(jié)構(gòu)模式到所述目的語言的句子結(jié)構(gòu)模式的句子結(jié)構(gòu)變換規(guī)則。
21.根據(jù)權(quán)利要求19所述的翻譯知識(shí)改良裝置,其特征在于,所述改良單元包括規(guī)則貢獻(xiàn)度計(jì)算單元,對(duì)于所述翻譯知識(shí)集合包含的翻譯知識(shí)的每一個(gè),算出其規(guī)則貢獻(xiàn)度;和刪除單元,用于從所述翻譯知識(shí)集合中刪除所述規(guī)則貢獻(xiàn)度滿足預(yù)定條件的翻譯知識(shí)。
22.根據(jù)權(quán)利要求21所述的翻譯知識(shí)改良裝置,其特征在于,所述規(guī)則貢獻(xiàn)度計(jì)算單元包括用于使用所述翻譯知識(shí)集合的全體來進(jìn)行通過所述機(jī)器翻譯單元的翻譯和該翻譯結(jié)果通過所述翻譯質(zhì)量自動(dòng)評(píng)價(jià)單元的翻譯質(zhì)量評(píng)價(jià)而獲得初始評(píng)價(jià)值的;對(duì)所述翻譯知識(shí)集合中的每個(gè)翻譯知識(shí),使用從所述翻譯知識(shí)集合中刪除該翻譯知識(shí)所獲得的部分集合,來進(jìn)行通過所述機(jī)器翻譯的翻譯和該翻譯結(jié)果通過所述翻譯質(zhì)量自動(dòng)評(píng)價(jià)單元的翻譯質(zhì)量評(píng)價(jià)而獲得刪除后評(píng)價(jià)值的單元;和用于算出所述刪除后評(píng)價(jià)值和所述初始評(píng)價(jià)值之間的差分作為所述某個(gè)翻譯知識(shí)的所述規(guī)則貢獻(xiàn)度的單元。
23.根據(jù)權(quán)利要求19所述的翻譯知識(shí)改良裝置,其特征在于,所述改良單元包括用于使用所述翻譯知識(shí)集合的全體來進(jìn)行通過所述機(jī)器翻譯單元的翻譯和該翻譯結(jié)果通過所述翻譯質(zhì)量自動(dòng)評(píng)價(jià)單元的翻譯質(zhì)量評(píng)價(jià)而獲得初始評(píng)價(jià)值的單元;用于根據(jù)預(yù)定方法,從所述翻譯知識(shí)集合中生成多個(gè)部分集合的單元;判定單元,用于使用所述多個(gè)部分集合的每一個(gè)來進(jìn)行通過所述機(jī)器翻譯單元的翻譯和該翻譯結(jié)果通過所述翻譯質(zhì)量自動(dòng)評(píng)價(jià)單元的翻譯質(zhì)量評(píng)價(jià),并判定該評(píng)價(jià)值對(duì)于所述初始評(píng)價(jià)值是否滿足規(guī)定的條件;和對(duì)于通過所述判定單元而判定出所述評(píng)價(jià)值滿足所述規(guī)定條件的部分集合的每一個(gè),用于從所述翻譯知識(shí)集合中刪除其補(bǔ)集合所屬翻譯知識(shí)的單元。
24.根據(jù)權(quán)利要求23所述的翻譯知識(shí)改良裝置,其特征在于,生成所述部分集合的單元包括用于生成多個(gè)從所述翻譯知識(shí)集合中去掉預(yù)定數(shù)的翻譯知識(shí)而獲得的部分集合的單元。
25.根據(jù)權(quán)利要求24所述的翻譯知識(shí)改良裝置,其特征在于,生成多個(gè)所述部分集合的單元包括用于生成多個(gè)從所述翻譯知識(shí)集合中去掉一個(gè)翻譯知識(shí)而獲得的部分集合的單元。
26.根據(jù)權(quán)利要求23所述的翻譯知識(shí)改良裝置,其特征在于,生成所述部分集合的單元包括從所述翻譯知識(shí)集合中,生成通過去掉預(yù)定數(shù)目的翻譯知識(shí)而能夠獲得的全部部分集合的單元。
27.根據(jù)權(quán)利要求23所述的翻譯知識(shí)改良裝置,其特征在于,所述機(jī)器翻譯單元在機(jī)器翻譯原語言的句子時(shí)具有輸出所述翻譯知識(shí)集合內(nèi)有關(guān)使用哪一個(gè)翻譯知識(shí)的信息的功能;所述翻譯知識(shí)改良裝置還包括對(duì)在得到所述初始評(píng)價(jià)值時(shí)所翻譯的每個(gè)句子,用于存儲(chǔ)從所述機(jī)器翻譯單元輸出的用于特定在翻譯時(shí)使用的翻譯知識(shí)之信息的單元;所述判定單元包括通過參考在所述存儲(chǔ)單元中存儲(chǔ)的用于特定所述翻譯知識(shí)的信息,對(duì)于所述多個(gè)部分集合的每一個(gè),用于特定通過使用該部分集合的補(bǔ)集合中包含的翻譯知識(shí)所翻譯的所述原語言句子的集合的單元;使用所述部分集合的每一個(gè),用于通過所述機(jī)器翻譯單元重新機(jī)器翻譯通過使用該部分集合的補(bǔ)集合中包含的翻譯知識(shí)所翻譯的所述原語言句子的集合的單元;對(duì)所述部分集合的每一個(gè),在所述初期翻譯結(jié)果中,用通過所述重新機(jī)器翻譯的單元得到的翻譯結(jié)果置換通過使用在該部分集合的補(bǔ)集合中所包含翻譯知識(shí)所翻譯的翻譯結(jié)果,通過所述翻譯質(zhì)量自動(dòng)評(píng)價(jià)單元對(duì)該置換之后的初期翻譯結(jié)果進(jìn)行翻譯質(zhì)量評(píng)價(jià)而獲得通過該部分集合所產(chǎn)生的翻譯結(jié)果的評(píng)價(jià)值的單元;對(duì)所述部分集合的每一個(gè),用于判定通過該部分集合所產(chǎn)生的翻譯結(jié)果的評(píng)價(jià)值相對(duì)所述初始評(píng)價(jià)值是否滿足所述規(guī)定條件的單元。
28.根據(jù)權(quán)利要求27所述的翻譯知識(shí)改良裝置,其特征在于,所述用于判定的單元包括對(duì)所述部分集合的每一個(gè)用于判定通過該部分集合產(chǎn)生的翻譯結(jié)果的評(píng)價(jià)值是否超過所述初始評(píng)價(jià)值的單元。
29.根據(jù)權(quán)利要求19所述的翻譯知識(shí)改良裝置,其特征在于,還包括從預(yù)先準(zhǔn)備的、由所述原語言和所述目的語言之間的對(duì)譯文構(gòu)成的訓(xùn)練文集中生成分別包括訓(xùn)練子文集和評(píng)價(jià)子文集的多個(gè)子文集對(duì)的單元;根據(jù)預(yù)定的翻譯知識(shí)的構(gòu)筑方式,從所提供的對(duì)譯文集中自動(dòng)構(gòu)筑翻譯知識(shí)的翻譯知識(shí)自動(dòng)構(gòu)筑單元;通過使用所述翻譯知識(shí)自動(dòng)構(gòu)筑單元從所述訓(xùn)練文集中自動(dòng)構(gòu)筑翻譯知識(shí)并作為基本翻譯知識(shí)存儲(chǔ)的基本翻譯知識(shí)存儲(chǔ)單元;對(duì)所述多個(gè)子文集對(duì)的每一個(gè),通過使用所述翻譯知識(shí)自動(dòng)構(gòu)筑單元從所述訓(xùn)練子文集中自動(dòng)構(gòu)筑翻譯知識(shí),并且對(duì)該翻譯知識(shí)的集合,將所述評(píng)價(jià)子文集作為所述可機(jī)器讀取的對(duì)譯文集,通過所述翻譯知識(shí)存儲(chǔ)單元、用于存儲(chǔ)所述可機(jī)器讀取的對(duì)譯文集的單元、所述機(jī)器翻譯單元、所述翻譯質(zhì)量自動(dòng)評(píng)價(jià)單元、以及所述改良單元來進(jìn)行改良的單元;和將通過用于進(jìn)行所述改良的單元所改良的、對(duì)所述多個(gè)子文集對(duì)的每一個(gè)所獲得的翻譯知識(shí)的集合集中成一個(gè)翻譯知識(shí)集合的單元。
30.根據(jù)權(quán)利要求29所述的翻譯知識(shí)改良裝置,其特征在于,所述用于集中的單元包括對(duì)于所述基本翻譯知識(shí)存儲(chǔ)單元中存儲(chǔ)的所述基本翻譯知識(shí)中包含的每一個(gè)翻譯知識(shí),在所述多個(gè)子文集對(duì)的全體中合計(jì)通過所述改良單元算出的差分的差分合計(jì)單元;和用于更新在所述基本翻譯知識(shí)存儲(chǔ)單元中存儲(chǔ)的所述基本翻譯知識(shí)的單元,使得刪除通過所述差分合計(jì)單元合計(jì)的差分滿足規(guī)定條件的翻譯知識(shí)。
31.根據(jù)權(quán)利要求30所述的翻譯知識(shí)改良裝置,其特征在于,用于更新所述基本翻譯知識(shí)的單元包括用于更新在所述基本翻譯知識(shí)存儲(chǔ)單元中存儲(chǔ)的所述基本翻譯知識(shí)的單元,使得刪除通過所述差分合計(jì)單元合計(jì)的差分為負(fù)的翻譯知識(shí)。
32.根據(jù)權(quán)利要求29所述的翻譯知識(shí)改良裝置,其特征在于,用于生成所述多個(gè)子文集對(duì)的單元包括用于通過將所述訓(xùn)練文集實(shí)質(zhì)上等分為預(yù)定的個(gè)數(shù)來生成所述預(yù)定個(gè)數(shù)的評(píng)價(jià)子文集的單元;和用于對(duì)所述預(yù)定個(gè)數(shù)的評(píng)價(jià)子文集的每一個(gè),生成從所述訓(xùn)練文集中去掉該評(píng)價(jià)子文集的文集和生成與該評(píng)價(jià)子文集成對(duì)的訓(xùn)練子文集的單元。
全文摘要
本發(fā)明提供一種改良翻譯知識(shí)的方法,包括準(zhǔn)備翻譯知識(shí)之集合的步驟;準(zhǔn)備原語言和目的語言的對(duì)譯文集的步驟;利用翻譯知識(shí)的集合將對(duì)譯文集中的原語言句子機(jī)器翻譯成目的語言的步驟;根據(jù)規(guī)定的評(píng)價(jià)基準(zhǔn)來評(píng)價(jià)其結(jié)果所得譯文的翻譯質(zhì)量的步驟;針對(duì)翻譯知識(shí)的一部分而算出有關(guān)翻譯質(zhì)量的貢獻(xiàn)度的步驟;當(dāng)算出的貢獻(xiàn)度為負(fù)時(shí)刪除該翻譯知識(shí)的步驟。
文檔編號(hào)G06F17/28GK1573739SQ20041004525
公開日2005年2月2日 申請(qǐng)日期2004年6月4日 優(yōu)先權(quán)日2003年6月4日
發(fā)明者今村賢治, 隅田英一郎 申請(qǐng)人:株式會(huì)社國際電氣通信基礎(chǔ)技術(shù)研究所