學(xué)習(xí)裝置、翻譯裝置、學(xué)習(xí)方法以及翻譯方法【專利摘要】以往,無(wú)法進(jìn)行高精度的翻譯。通過(guò)如下的學(xué)習(xí)裝置,學(xué)習(xí)可進(jìn)行高精度的翻譯的模型,該學(xué)習(xí)裝置具備:句法解析部,對(duì)一個(gè)以上的各對(duì)譯句所具有的目標(biāo)語(yǔ)言句進(jìn)行句法解析,從而取得具有一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)的目標(biāo)語(yǔ)言句的二叉樹(shù);源語(yǔ)言要素取得部,取得源語(yǔ)言的一個(gè)以上的要素;源語(yǔ)言部分結(jié)構(gòu)取得部,使用由目標(biāo)語(yǔ)言句的二叉樹(shù)所具有的一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)表示的結(jié)構(gòu),取得一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu),所述一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)包含具有短語(yǔ)標(biāo)注的父節(jié)點(diǎn)以及具有短語(yǔ)標(biāo)注或者源語(yǔ)言的要素的兩個(gè)子節(jié)點(diǎn);標(biāo)注賦予部,將排序標(biāo)注賦予給一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu);模型構(gòu)建部,使用一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),構(gòu)建一個(gè)以上的句法解析模型,所述一個(gè)以上的句法解析模型具有附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)出現(xiàn)的概率信息;以及保存部,保存具有一個(gè)以上的句法解析模型的源語(yǔ)言句的二叉樹(shù)?!緦@f(shuō)明】學(xué)習(xí)裝置、翻譯裝置、學(xué)習(xí)方法以及翻譯方法
技術(shù)領(lǐng)域:
[0001]本發(fā)明涉及學(xué)習(xí)在機(jī)器翻譯中利用的模型的學(xué)習(xí)裝置等?!?br>背景技術(shù):
】[0002]以往,在機(jī)器翻譯中,作為對(duì)語(yǔ)序進(jìn)行排序的方法之一,存在一種稱為預(yù)排序(pre-ordering)的方法,其在譯詞選擇之前對(duì)語(yǔ)序進(jìn)行排序。[0003]在現(xiàn)有的預(yù)排序方法中,提出了許多運(yùn)用源語(yǔ)言的句法解析器的方法(例如參見(jiàn)非專利文獻(xiàn)1)。[0004]另外,還提出了完全不使用句法解析器的方法(例如參見(jiàn)非專利文獻(xiàn)2)。[0005]在先技術(shù)文獻(xiàn)[0006]非專利文獻(xiàn)[0007]非專利文南犬I:HidekiIsozaki,KatsuhitoSudoh,HajimeTsukada,andKevinDuh.2010.HeadFinalization:ASimpleReorderingRuleforSOVLanguages.InProceedingsoftheJointFifthWorkshoponStatisticalMachineTranslationandMetricsMATR,Uppsala,Sweden,244-251.[0008]非專利文獻(xiàn)2:GrahamNeubig,TaroWatanabe,andShinsukeMori.2012.Inducingadiscriminativeparsertooptimizemachinetranslationreordering.InProceedingsofthe2012JointConferenceonEmpiricalMethodsinNaturalLanguageProcessingandComputationalNaturalLanguageLearning,pages843-853,JejuIslandjKoreajJuly-AssociationforComputationalLinguistics.【
發(fā)明內(nèi)容】[0009]發(fā)明所要解決的技術(shù)問(wèn)題[0010]然而,在沒(méi)有源語(yǔ)言的句法解析器的情況下,無(wú)法利用非專利文獻(xiàn)1所采用的運(yùn)用源語(yǔ)言的句法解析器的預(yù)排序方法。另外,在源語(yǔ)言的句法解析器的性能較低的情況下,語(yǔ)序排序的性能也會(huì)降低。[0011]另外,在非專利文獻(xiàn)2所采用的完全不需要句法解析器的預(yù)排序方法中,為了不運(yùn)用句法解析器,在語(yǔ)序排序的性能方面存在問(wèn)題。[0012]其結(jié)果是,在以往的機(jī)器翻譯技術(shù)中無(wú)法進(jìn)行高精度的翻譯。[0013]用于解決技術(shù)問(wèn)題的方案[0014]本申請(qǐng)的第一項(xiàng)發(fā)明的學(xué)習(xí)裝置具備:對(duì)譯語(yǔ)料庫(kù),可存儲(chǔ)具有源語(yǔ)言句和源語(yǔ)言句的翻譯結(jié)果即目標(biāo)語(yǔ)言句的一個(gè)以上的對(duì)譯句;要素對(duì)存儲(chǔ)部,可存儲(chǔ)一個(gè)以上的要素對(duì),所述一個(gè)以上的要素對(duì)是源語(yǔ)言的要素與目標(biāo)語(yǔ)言的要素的對(duì);句法解析部,取得目標(biāo)語(yǔ)言句的二叉樹(shù),所述目標(biāo)語(yǔ)言句的二叉樹(shù)是對(duì)一個(gè)以上的各對(duì)譯句所具有的目標(biāo)語(yǔ)言句進(jìn)行句法解析的結(jié)果,并具有一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu),所述一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)表示構(gòu)成目標(biāo)語(yǔ)言句的兩個(gè)以上的要素的順序,并且包含具有短語(yǔ)標(biāo)注(Iable)的父節(jié)點(diǎn)以及兩個(gè)子節(jié)點(diǎn),所述兩個(gè)子節(jié)點(diǎn)是父節(jié)點(diǎn)的子節(jié)點(diǎn),且具有目標(biāo)語(yǔ)言的短語(yǔ)標(biāo)注或者源語(yǔ)言的POS標(biāo)簽(tag)或者源語(yǔ)言的要素;源語(yǔ)言要素取得部,從要素對(duì)存儲(chǔ)部的一個(gè)以上的要素對(duì)中取得源語(yǔ)言的一個(gè)以上的要素,所述源語(yǔ)言的一個(gè)以上的要素是構(gòu)成與目標(biāo)語(yǔ)言句相對(duì)應(yīng)的源語(yǔ)言句的一個(gè)以上的要素,且與目標(biāo)語(yǔ)言句的二叉樹(shù)所具有的一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)的終端子節(jié)點(diǎn)即目標(biāo)語(yǔ)言的要素相對(duì)應(yīng);源語(yǔ)言部分結(jié)構(gòu)取得部,對(duì)構(gòu)成源語(yǔ)言句的源語(yǔ)言的一個(gè)以上的要素應(yīng)用由目標(biāo)語(yǔ)言句的二叉樹(shù)所具有的一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)表示的結(jié)構(gòu),從而取得一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu),所述一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)表示構(gòu)成源語(yǔ)言句的兩個(gè)以上的要素的順序,并包含具有短語(yǔ)標(biāo)注的父節(jié)點(diǎn)以及兩個(gè)子節(jié)點(diǎn),所述兩個(gè)子節(jié)點(diǎn)是父節(jié)點(diǎn)的子節(jié)點(diǎn),且具有短語(yǔ)標(biāo)注或者源語(yǔ)言的POS標(biāo)簽;標(biāo)注賦予部,將排序標(biāo)注賦予給一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu),從而取得一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),所述排序標(biāo)注是能夠區(qū)別如下源語(yǔ)言部分結(jié)構(gòu)的標(biāo)注,即,目標(biāo)語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序與對(duì)應(yīng)的源語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序不同的源語(yǔ)言部分結(jié)構(gòu)、以及目標(biāo)語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序與對(duì)應(yīng)的源語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序相同的源語(yǔ)言部分結(jié)構(gòu);模型構(gòu)建部,使用一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),構(gòu)建一個(gè)以上的句法解析模型,所述一個(gè)以上的句法解析模型具有表示附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)的出現(xiàn)容易度的概率信息;以及保存部,保存由模型構(gòu)建部構(gòu)建的一個(gè)以上的句法解析模型。[0015]根據(jù)該結(jié)構(gòu),能夠?qū)W習(xí)可進(jìn)行高精度的翻譯的模型。[0016]另外,相對(duì)于第一項(xiàng)發(fā)明,本申請(qǐng)的第二項(xiàng)發(fā)明的學(xué)習(xí)裝置進(jìn)一步具備排序部,所述排序部取得進(jìn)行了如下排序的一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu),即,使用表示構(gòu)成源語(yǔ)言句的兩個(gè)以上的要素的順序的、一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu),以相對(duì)于目標(biāo)語(yǔ)言句的要素的順序形成接近滿足預(yù)定條件的順序的方式,對(duì)構(gòu)成源語(yǔ)言句的兩個(gè)以上的要素的順序進(jìn)行排序;標(biāo)注賦予部對(duì)排序部排序的一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)賦予排序用的標(biāo)注。[0017]根據(jù)該結(jié)構(gòu),能夠?qū)W習(xí)可進(jìn)行更高精度的翻譯的模型。[0018]另外,相對(duì)于第一項(xiàng)或者第二項(xiàng)發(fā)明,本申請(qǐng)的第三項(xiàng)發(fā)明的學(xué)習(xí)裝置進(jìn)一步具備統(tǒng)計(jì)模型存儲(chǔ)部,可存儲(chǔ)CFG規(guī)則的統(tǒng)計(jì)模型,所述CFG規(guī)則的統(tǒng)計(jì)模型包含具有短語(yǔ)標(biāo)注的父節(jié)點(diǎn)以及兩個(gè)子節(jié)點(diǎn),所述兩個(gè)子節(jié)點(diǎn)是父節(jié)點(diǎn)的子節(jié)點(diǎn),且具有短語(yǔ)標(biāo)注或者源語(yǔ)言的POS標(biāo)簽;源語(yǔ)言部分結(jié)構(gòu)取得部具備:源語(yǔ)言部分結(jié)構(gòu)取得單元,對(duì)構(gòu)成源語(yǔ)言句的源語(yǔ)言的一個(gè)以上的要素應(yīng)用由目標(biāo)語(yǔ)言句的二叉樹(shù)所具有的一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)表示的結(jié)構(gòu),從而取得一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu),所述一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)表示構(gòu)成源語(yǔ)言句的兩個(gè)以上的要素的順序,并包含具有短語(yǔ)標(biāo)注的父節(jié)點(diǎn)以及兩個(gè)子節(jié)點(diǎn),所述兩個(gè)子節(jié)點(diǎn)是父節(jié)點(diǎn)的子節(jié)點(diǎn),且具有短語(yǔ)標(biāo)注或者源語(yǔ)言的要素;以及部分結(jié)構(gòu)補(bǔ)充單元,當(dāng)在源語(yǔ)言部分結(jié)構(gòu)取得單元取得的一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)中存在不完整的源語(yǔ)言部分結(jié)構(gòu)時(shí),對(duì)源語(yǔ)言部分結(jié)構(gòu)應(yīng)用統(tǒng)計(jì)模型,從而取得完整的源語(yǔ)言部分結(jié)構(gòu)。[0019]根據(jù)該結(jié)構(gòu),能夠?qū)W習(xí)可進(jìn)行更高精度的翻譯的模型。[0020]另外,相對(duì)于第一項(xiàng)至第三項(xiàng)中的任意一項(xiàng)發(fā)明,本申請(qǐng)的第四項(xiàng)發(fā)明的翻譯裝置具備:二叉樹(shù)存儲(chǔ)部,存儲(chǔ)有學(xué)習(xí)裝置保存的一個(gè)以上的句法解析模型;要素對(duì)存儲(chǔ)部,可存儲(chǔ)源語(yǔ)言的要素與目標(biāo)語(yǔ)言的要素的對(duì)即兩個(gè)以上的要素對(duì);受理部,受理源語(yǔ)言句;附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)取得部,使用一個(gè)以上的句法解析模型,基于受理部受理的源語(yǔ)言句所具有的兩個(gè)以上的各要素,取得一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu);翻譯排序部,當(dāng)一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)所具有的排序標(biāo)注是表示目標(biāo)語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序與源語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序不同的排序標(biāo)注時(shí),執(zhí)行對(duì)與排序標(biāo)注相對(duì)應(yīng)的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)所具有的兩個(gè)子節(jié)點(diǎn)的順序進(jìn)行排序的處理,從而取得排序后的源語(yǔ)言的兩個(gè)以上的要素;檢索部,從要素對(duì)存儲(chǔ)部中取得與翻譯排序部取得的源語(yǔ)言的兩個(gè)以上的各要素相對(duì)應(yīng)的目標(biāo)語(yǔ)言的兩個(gè)以上的要素;以及輸出部,輸出由檢索部取得的兩個(gè)以上的要素組成的目標(biāo)語(yǔ)言句。[0021]根據(jù)該結(jié)構(gòu),能夠進(jìn)行高精度的翻譯。[0022]另外,相對(duì)于第四項(xiàng)發(fā)明,本申請(qǐng)的第五項(xiàng)發(fā)明的翻譯裝置為如下的翻譯裝置:構(gòu)成一個(gè)以上的源語(yǔ)言句的二叉樹(shù)的、一個(gè)以上的各附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)所具有的源語(yǔ)言的要素與POS標(biāo)簽相互對(duì)應(yīng);并進(jìn)一步具備詞素解析部,所述詞素解析部對(duì)受理部受理的源語(yǔ)言句進(jìn)行詞素解析,取得與POS標(biāo)簽相互對(duì)應(yīng)的兩個(gè)以上的要素;附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)取得部使用一個(gè)以上的源語(yǔ)言句的二叉樹(shù),基于與POS標(biāo)簽相互對(duì)應(yīng)的兩個(gè)以上的要素,取得一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)。[0023]根據(jù)該結(jié)構(gòu),能夠進(jìn)行更高精度的翻譯。[0024]發(fā)明效果[0025]根據(jù)基于本發(fā)明的學(xué)習(xí)裝置,能夠?qū)W習(xí)可進(jìn)行高精度的翻譯的模型。【附圖說(shuō)明】[0026]圖1是本發(fā)明的第一實(shí)施方式中的學(xué)習(xí)裝置1的框圖。[0027]圖2是對(duì)本發(fā)明的第一實(shí)施方式中的學(xué)習(xí)裝置1的動(dòng)作進(jìn)行說(shuō)明的流程圖。[0028]圖3是對(duì)本發(fā)明的第一實(shí)施方式中的學(xué)習(xí)裝置1的動(dòng)作進(jìn)行說(shuō)明的流程圖。[0029]圖4是示出本發(fā)明的第一實(shí)施方式中的句法解析部14取得的二叉樹(shù)的圖。[0030]圖5是示出本發(fā)明的第一實(shí)施方式中的源語(yǔ)言要素取得部15取得的源語(yǔ)言的要素的圖。[0031]圖6是示出本發(fā)明的第一實(shí)施方式中的源語(yǔ)言部分結(jié)構(gòu)的概念的圖。[0032]圖7是示出本發(fā)明的第一實(shí)施方式中的源語(yǔ)言部分結(jié)構(gòu)的圖。[0033]圖8是示出本發(fā)明的第一實(shí)施方式中的具有一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)的二叉樹(shù)的圖。[0034]圖9是示出本發(fā)明的第一實(shí)施方式中的具有一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)的二叉樹(shù)的圖。[0035]圖10是示出本發(fā)明的第一實(shí)施方式中的具有一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)的二叉樹(shù)的圖。[0036]圖11是本發(fā)明的第二實(shí)施方式中的翻譯裝置2的框圖。[0037]圖12是對(duì)本發(fā)明的第二實(shí)施方式中的翻譯裝置2的動(dòng)作進(jìn)行說(shuō)明的流程圖。[0038]圖13是示出本發(fā)明第二實(shí)施方式中的具有一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)的二叉樹(shù)的圖。[0039]圖14是示出本發(fā)明第二實(shí)施方式中的將源語(yǔ)言句的單詞排序成目標(biāo)語(yǔ)言的語(yǔ)序的結(jié)果的圖。[0040]圖15是示出本發(fā)明第二實(shí)施方式的翻譯質(zhì)量的評(píng)價(jià)結(jié)果的圖。[0041]圖16是上述實(shí)施方式中的計(jì)算機(jī)系統(tǒng)的概觀圖。[0042]圖17是上述實(shí)施方式中的計(jì)算機(jī)系統(tǒng)的框圖?!揪唧w實(shí)施方式】[0043]下面,參照附圖,對(duì)學(xué)習(xí)裝置等的實(shí)施方式進(jìn)行說(shuō)明。此外,在實(shí)施方式中,附有相同附圖標(biāo)記的構(gòu)成要素進(jìn)行相同的動(dòng)作,因而有時(shí)對(duì)其省略重復(fù)說(shuō)明。[0044](本發(fā)明的第一實(shí)施方式)[0045]在本實(shí)施方式中,對(duì)學(xué)習(xí)預(yù)排序的模型的學(xué)習(xí)裝置進(jìn)行說(shuō)明。另外,在本實(shí)施方式中,對(duì)如下的學(xué)習(xí)裝置進(jìn)行說(shuō)明,即該學(xué)習(xí)裝置根據(jù)使翻譯時(shí)形成一定程度以內(nèi)的語(yǔ)序變更的限制,學(xué)習(xí)預(yù)排序的模型。進(jìn)一步,在本實(shí)施方式中,對(duì)利用統(tǒng)計(jì)模型的學(xué)習(xí)裝置進(jìn)行說(shuō)明。[0046]圖1是本實(shí)施方式中的學(xué)習(xí)裝置1的框圖。[0047]學(xué)習(xí)裝置1具備存儲(chǔ)介質(zhì)10、對(duì)譯語(yǔ)料庫(kù)11、要素對(duì)存儲(chǔ)部12、統(tǒng)計(jì)模型存儲(chǔ)部13、句法解析部14、源語(yǔ)言要素取得部15、源語(yǔ)言部分結(jié)構(gòu)取得部16、排序部17、標(biāo)注賦予部18、模型構(gòu)建部19以及保存部20。[0048]源語(yǔ)言部分結(jié)構(gòu)取得部16具備源語(yǔ)言部分結(jié)構(gòu)取得單元161以及部分結(jié)構(gòu)補(bǔ)充單元162〇[0049]存儲(chǔ)介質(zhì)10能夠存儲(chǔ)預(yù)排序的模型(以下,適當(dāng)?shù)胤Q為"預(yù)排序模型")。預(yù)排序模型是保存部20保存的一個(gè)以上的句法解析模型。句法解析模型是源語(yǔ)言句的二叉樹(shù)。源語(yǔ)言句的二叉樹(shù)是可由源語(yǔ)言句構(gòu)成的二叉樹(shù)。該二叉樹(shù)具有一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)。句法解析模型通常具有表示附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)的出現(xiàn)容易度的概率信息。附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)包含父節(jié)點(diǎn)和兩個(gè)子節(jié)點(diǎn)。父節(jié)點(diǎn)具有短語(yǔ)標(biāo)注。父節(jié)點(diǎn)例如可以是短語(yǔ)標(biāo)注本身,也可以具有用于識(shí)別父節(jié)點(diǎn)的ID和短語(yǔ)標(biāo)注。另外,父節(jié)點(diǎn)可以具有用于識(shí)別自身的下位的子節(jié)點(diǎn)的信息。另外,父節(jié)點(diǎn)通常具有排序標(biāo)注。另外,兩個(gè)子節(jié)點(diǎn)是對(duì)應(yīng)的父節(jié)點(diǎn)的下位的節(jié)點(diǎn),也稱為兄弟節(jié)點(diǎn)。子節(jié)點(diǎn)具有短語(yǔ)標(biāo)注或者源語(yǔ)言的要素。子節(jié)點(diǎn)可以是短語(yǔ)標(biāo)注或者源語(yǔ)言的要素本身,也可以具有用于識(shí)別子節(jié)點(diǎn)的ID和短語(yǔ)標(biāo)注或者源語(yǔ)言的要素。對(duì)父節(jié)點(diǎn)與子節(jié)點(diǎn)的數(shù)據(jù)結(jié)構(gòu)沒(méi)有限制。此外,短語(yǔ)標(biāo)注是表示詞性的信息,例如是POS標(biāo)簽。此外,POS標(biāo)簽是表示詞性的信息。另外,父節(jié)點(diǎn)和子節(jié)點(diǎn)也可以具有對(duì)應(yīng)的要素(單詞等)的隱藏等級(jí)。隱藏等級(jí)是使要素分組化時(shí)的分組識(shí)別符。句法解析的模型的例子為"〇.〇is_st->np_stvp_sw"、"〇.ooss+si^onp+si^vp+sw4"。此外,添加在標(biāo)注的右側(cè)的數(shù)字表示隱藏等級(jí)。隱藏等級(jí)是使要素(單詞等)分組化時(shí)的分組識(shí)別符。[0050]短語(yǔ)標(biāo)注是識(shí)別短語(yǔ)的種類(lèi)的信息,例如是"S"(表示是語(yǔ)句)、"VP"(表示是動(dòng)詞短句)、"NP"(表示是名詞短句)等。[0051]另外,排序標(biāo)注是能夠區(qū)別第一種源語(yǔ)言部分結(jié)構(gòu)與第二種源語(yǔ)言部分結(jié)構(gòu)的標(biāo)注。在此,第一種源語(yǔ)言部分結(jié)構(gòu)是指,目標(biāo)語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序和與該目標(biāo)語(yǔ)言部分結(jié)構(gòu)相對(duì)應(yīng)的源語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序不同的源語(yǔ)言部分結(jié)構(gòu)。另外,第二種源語(yǔ)言部分結(jié)構(gòu)是指,目標(biāo)語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序和與該目標(biāo)語(yǔ)言部分結(jié)構(gòu)相對(duì)應(yīng)的源語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序相同的源語(yǔ)言部分結(jié)構(gòu)。[0052]排序標(biāo)注是例如表示進(jìn)行排序的標(biāo)注即"_SW"、表示不進(jìn)行排序的標(biāo)注即"_ST"等。另外,既可以對(duì)第一種源語(yǔ)言部分結(jié)構(gòu)與第二種源語(yǔ)言部分結(jié)構(gòu)雙方附加排序標(biāo)注,也可以對(duì)某一方的源語(yǔ)言部分結(jié)構(gòu)附加排序標(biāo)注。此外,通常由源語(yǔ)言部分結(jié)構(gòu)的父節(jié)點(diǎn)保持排序標(biāo)注。此外,"ST"是"straight"的縮寫(xiě)、"SW"是"switch"的縮寫(xiě)。[0053]另外,也可以一起表現(xiàn)短語(yǔ)標(biāo)注與排序標(biāo)注。在該情況下,短語(yǔ)標(biāo)注與排序標(biāo)注被表示為例如"短語(yǔ)標(biāo)注_排序標(biāo)注",例如"S_ST"、"VP_SW"、"NP_ST"等。此外,"S_ST"是構(gòu)成語(yǔ)句的源語(yǔ)言部分結(jié)構(gòu),表示不進(jìn)行排序。另外,"VP_SW"是構(gòu)成動(dòng)詞短句的源語(yǔ)言部分結(jié)構(gòu),表示進(jìn)行排序。進(jìn)一步,"NP_ST"是構(gòu)成名詞短句的源語(yǔ)言部分結(jié)構(gòu),表示不進(jìn)行排序。[0054]此外,預(yù)排序模型例如以使用具有概率信息的CFG(context-freegrammer,不依賴上下文的語(yǔ)法)解析和ITG(inversiontransductiongrammar,反向傳導(dǎo)語(yǔ)法)(參見(jiàn)uDekaiWu.1997.Stochasticinversiontransductiongrammarsandbilingualparsingofparallelcorpora.ComputationalLinguistics,23(3):377-403·'')的基本架構(gòu)為基礎(chǔ)。該預(yù)排序模型也稱為ITG解析(Parsing)模型。[0055]對(duì)譯語(yǔ)料庫(kù)11可存儲(chǔ)一個(gè)以上的對(duì)譯句。對(duì)譯句具有源語(yǔ)言句和目標(biāo)語(yǔ)言句。該目標(biāo)語(yǔ)言句是源語(yǔ)言句的翻譯結(jié)果。只要源語(yǔ)言句和目標(biāo)語(yǔ)言是不同的語(yǔ)言即可,對(duì)語(yǔ)言沒(méi)有限制。但是,在此,源語(yǔ)言句和目標(biāo)語(yǔ)言優(yōu)選為日語(yǔ)和英語(yǔ)等語(yǔ)序存在較大差異的語(yǔ)言。[0056]要素對(duì)存儲(chǔ)部12可存儲(chǔ)一個(gè)或者兩個(gè)以上的要素對(duì)。要素對(duì)是源語(yǔ)言的要素與目標(biāo)語(yǔ)言的要素的對(duì)。要素是指單詞、詞素、短句等構(gòu)成語(yǔ)句的部分。要素可以是兩個(gè)以上的用語(yǔ)隊(duì)列和語(yǔ)句。另外,要素對(duì)可以保持有關(guān)于源語(yǔ)言的要素與目標(biāo)語(yǔ)言的要素對(duì)應(yīng)的概率的信息。另外,要素對(duì)存儲(chǔ)部12也可以稱為所謂的用語(yǔ)詞典。[0057]統(tǒng)計(jì)模型存儲(chǔ)部13可存儲(chǔ)CFG規(guī)則的統(tǒng)計(jì)模型。CFG規(guī)則包含父節(jié)點(diǎn)和兩個(gè)子節(jié)點(diǎn)。此處的父節(jié)點(diǎn)具有短語(yǔ)標(biāo)注。另外,子節(jié)點(diǎn)具有短語(yǔ)標(biāo)注或者源語(yǔ)言的POS標(biāo)簽。[0058]統(tǒng)計(jì)模型是例如具有概率信息的CFG模型。而且,作為構(gòu)建本CFG模型的單元,使用例如皮特曼-尤爾(Pitman-Yor,以下適當(dāng)?shù)胤Q作"PY")過(guò)程。PY過(guò)程是公知技術(shù),因此省略詳細(xì)說(shuō)明。關(guān)于PY過(guò)程,參見(jiàn)"JimPitmanandMarcYor.1997.Thetwo-parameterpoisson-dirichletdistributionderivedfromastablesubordinator.TheAnnalsofProbability,25(2):855-900."[0059]另外,將CFG規(guī)則的集合(set)設(shè)為R,將目標(biāo)語(yǔ)言的句法的短語(yǔ)標(biāo)注的集合設(shè)為L(zhǎng),將源語(yǔ)言的POS標(biāo)簽的集合設(shè)為T(mén)。在該情況下,推導(dǎo)樹(shù)t的概率"P(t)"如以下的數(shù)學(xué)式1所示。此外,推導(dǎo)樹(shù)t為源語(yǔ)言的樹(shù)形結(jié)構(gòu)的句法結(jié)構(gòu)。[0060][數(shù)學(xué)式1][0061][0062]在數(shù)學(xué)式1中,"χ-α"為CFG規(guī)則,"C(X-a,t)"為在推導(dǎo)樹(shù)t中使用的"χ-α"的數(shù),"xEL"為CFG規(guī)則的父節(jié)點(diǎn)的短語(yǔ)標(biāo)注,"P(aIX)"為當(dāng)賦予了父節(jié)點(diǎn)的短語(yǔ)標(biāo)注"X"時(shí)生成α的概率。被指定的短語(yǔ)標(biāo)注被用作推導(dǎo)樹(shù)t的父節(jié)點(diǎn)的短語(yǔ)標(biāo)注。[0063]另外,PY模型是CFG規(guī)則的分布,如數(shù)學(xué)式2所示。[0064][數(shù)學(xué)式2][0065]P(aIX)~PYx(d,Θ,Pbase(aIX))[0066]在數(shù)學(xué)式2中,"d"、"Θ"為PY模型的超參數(shù)(hyperparameter)。[0067]另外,回退(backoff)概率"Pbase(aIX)"例如能夠如數(shù)學(xué)式3所示那樣使用常數(shù)?;赝烁怕适侵高M(jìn)行回退平滑(backoffsmoothing)時(shí)使用的概率。[0068][數(shù)學(xué)式3][0069][0070]此外,在數(shù)學(xué)式3中,"IL為目標(biāo)語(yǔ)言的句法的短語(yǔ)標(biāo)注的種類(lèi)的數(shù)量,"IT為源語(yǔ)言的POS標(biāo)簽的種類(lèi)的數(shù)量。在此,CFG規(guī)則具有兩個(gè)子節(jié)點(diǎn),子節(jié)點(diǎn)為短語(yǔ)標(biāo)注或者POS標(biāo)簽,因此成對(duì)的子節(jié)點(diǎn)的種類(lèi)的數(shù)量為"(ILI+1TI)2"。[0071]句法解析部14取得目標(biāo)語(yǔ)言句的一個(gè)以上的二叉樹(shù)。該二叉樹(shù)具有一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)。句法解析部14通常對(duì)一個(gè)以上的各對(duì)譯句所具有的目標(biāo)語(yǔ)言句進(jìn)行句法解析,從而取得目標(biāo)語(yǔ)言句的一個(gè)以上的二叉樹(shù)。但是,句法解析部14也可以構(gòu)成為,向外部的裝置發(fā)送一個(gè)以上的各對(duì)譯句所具有的目標(biāo)語(yǔ)言句,并從該外部的裝置接收目標(biāo)語(yǔ)言句的一個(gè)以上的二叉樹(shù)。此外,句法解析部14例如可通過(guò)伯克利解析器(Berkeleyparser)(SlavPetrov,LeonBarrett,RomainThibaux,andDanKlein.2006.Learningaccurate,compact,andinterpretabletreeannotation,InProceedingsofCOLING-ACL2006.pages433-440,Sydney,Australia,July.AssociationforComputationalLinguistics.)等句法解析器來(lái)實(shí)現(xiàn)。此外,目標(biāo)語(yǔ)言部分結(jié)構(gòu)表示構(gòu)成目標(biāo)語(yǔ)言句的兩個(gè)以上的要素的順序,并且具有短語(yǔ)標(biāo)注的父節(jié)點(diǎn)以及兩個(gè)子節(jié)點(diǎn),所述兩個(gè)子節(jié)點(diǎn)是該父節(jié)點(diǎn)的子節(jié)點(diǎn),且具有目標(biāo)語(yǔ)言的短語(yǔ)標(biāo)注或者源語(yǔ)言POS標(biāo)簽或者源語(yǔ)言的要素。[0072]另外,目標(biāo)語(yǔ)言句的二叉樹(shù)為,對(duì)目標(biāo)語(yǔ)言句進(jìn)行句法解析而得到的以短句結(jié)構(gòu)語(yǔ)法為基礎(chǔ)的語(yǔ)法樹(shù),是分支最大為2的樹(shù)形結(jié)構(gòu)。以短句結(jié)構(gòu)語(yǔ)法為基礎(chǔ)的語(yǔ)法樹(shù)由表示短句的范圍的子樹(shù)和該短句標(biāo)注(短語(yǔ)標(biāo)注)構(gòu)成。[0073]目標(biāo)語(yǔ)言句的二叉樹(shù)具有一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)。目標(biāo)語(yǔ)言部分結(jié)構(gòu)包含父節(jié)點(diǎn)以及該父節(jié)點(diǎn)的兩個(gè)子節(jié)點(diǎn)。此處的父節(jié)點(diǎn)具有短語(yǔ)標(biāo)注。子節(jié)點(diǎn)具有短語(yǔ)標(biāo)注或者目標(biāo)語(yǔ)言的要素。此外,也可以使目標(biāo)語(yǔ)言的要素對(duì)應(yīng)表示詞性的信息即POS標(biāo)簽。[0074]源語(yǔ)言要素取得部15從要素對(duì)存儲(chǔ)部12中取得與目標(biāo)語(yǔ)言句所具有的目標(biāo)語(yǔ)言的一個(gè)以上的各要素相對(duì)應(yīng)的源語(yǔ)言的一個(gè)以上的要素。源語(yǔ)言要素取得部15從要素對(duì)存儲(chǔ)部12的一個(gè)以上的要素對(duì)中取得源語(yǔ)言的一個(gè)以上的要素,所述源語(yǔ)言的一個(gè)以上的要素是構(gòu)成與目標(biāo)語(yǔ)言句相對(duì)應(yīng)的源語(yǔ)言句的一個(gè)以上的要素,且與目標(biāo)語(yǔ)言句的二叉樹(shù)所具有的一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)的終端子節(jié)點(diǎn)即目標(biāo)語(yǔ)言的要素相對(duì)應(yīng)。[0075]源語(yǔ)言部分結(jié)構(gòu)取得部16取得一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)。具體而言,源語(yǔ)言部分結(jié)構(gòu)取得部16對(duì)構(gòu)成源語(yǔ)言句的源語(yǔ)言的一個(gè)以上的要素應(yīng)用由目標(biāo)語(yǔ)言句的二叉樹(shù)所具有的一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)表示的結(jié)構(gòu),從而取得一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)。源語(yǔ)言部分結(jié)構(gòu)取得部16取得的源語(yǔ)言部分結(jié)構(gòu)是表示構(gòu)成源語(yǔ)言句的兩個(gè)以上的要素的順序的信息。另外,該源語(yǔ)言部分結(jié)構(gòu)包含父節(jié)點(diǎn)和兩個(gè)子節(jié)點(diǎn)。該父節(jié)點(diǎn)具有短語(yǔ)標(biāo)注。另外,子節(jié)點(diǎn)具有短語(yǔ)標(biāo)注或者源語(yǔ)言的要素。此外,源語(yǔ)言部分結(jié)構(gòu)表示構(gòu)成源語(yǔ)言句的兩個(gè)以上的要素的順序,并包含具有短語(yǔ)標(biāo)注的父節(jié)點(diǎn)以及兩個(gè)子節(jié)點(diǎn),所述兩個(gè)子節(jié)點(diǎn)是該父節(jié)點(diǎn)的子節(jié)點(diǎn),且具有短語(yǔ)標(biāo)注或者源語(yǔ)言的POS標(biāo)簽。[0076]更具體而言,源語(yǔ)言部分結(jié)構(gòu)取得部16使用要素對(duì)存儲(chǔ)部12的一個(gè)以上的要素對(duì),對(duì)每個(gè)源語(yǔ)言部分結(jié)構(gòu)確定與目標(biāo)語(yǔ)言句的二叉樹(shù)所具有的一個(gè)以上的各目標(biāo)語(yǔ)言部分結(jié)構(gòu)的跨度(span)相對(duì)應(yīng)的跨度。在此,跨度表示兩個(gè)單詞位置的范圍。而且,作為與各跨度相對(duì)應(yīng)的各源語(yǔ)言部分結(jié)構(gòu)的父節(jié)點(diǎn)的短語(yǔ)標(biāo)注,源語(yǔ)言部分結(jié)構(gòu)取得部16寫(xiě)入對(duì)應(yīng)的目標(biāo)語(yǔ)言部分結(jié)構(gòu)的父節(jié)點(diǎn)的短語(yǔ)標(biāo)注。此外,源語(yǔ)言部分結(jié)構(gòu)的跨度為,從與對(duì)應(yīng)的目標(biāo)語(yǔ)言部分結(jié)構(gòu)中的最左側(cè)的要素相對(duì)應(yīng)的位置到與對(duì)應(yīng)的目標(biāo)語(yǔ)言部分結(jié)構(gòu)中的最右側(cè)的要素相對(duì)應(yīng)的位置為止的跨度。[0077]此外,源語(yǔ)言部分結(jié)構(gòu)取得部16有時(shí)無(wú)法取得具有完整的結(jié)構(gòu)的源語(yǔ)言部分結(jié)構(gòu)。具有不完整的結(jié)構(gòu)的源語(yǔ)言部分結(jié)構(gòu)是指,例如跨度不明或者不明確的源語(yǔ)言部分結(jié)構(gòu)、含有無(wú)法決定短語(yǔ)標(biāo)注的父節(jié)點(diǎn)的源語(yǔ)言部分結(jié)構(gòu)等??缍炔幻骰蛘卟幻鞔_的情況例如是存在未與構(gòu)成目標(biāo)語(yǔ)言句的要素相互對(duì)應(yīng)的源語(yǔ)言句的要素的情況、產(chǎn)生沖突(conflict)而未保持跨度的情況等。另外,當(dāng)與目標(biāo)語(yǔ)言句相比,源語(yǔ)言句的單詞數(shù)量更多時(shí),通常也會(huì)產(chǎn)生不明位置。[0078]在使用要素對(duì)存儲(chǔ)部12的一個(gè)以上的要素對(duì)而存在未與構(gòu)成目標(biāo)語(yǔ)言句的要素相互對(duì)應(yīng)的源語(yǔ)言句的要素時(shí),源語(yǔ)言部分結(jié)構(gòu)取得部16使用統(tǒng)計(jì)模型存儲(chǔ)部13的統(tǒng)計(jì)模型,以使該未相互對(duì)應(yīng)的要素包含在相鄰的跨度中的方式來(lái)確定跨度。然后,源語(yǔ)言部分結(jié)構(gòu)取得部16使用統(tǒng)計(jì)模型存儲(chǔ)部13的統(tǒng)計(jì)模型,確定與包含未相互對(duì)應(yīng)的要素的跨度相對(duì)應(yīng)的源語(yǔ)言部分結(jié)構(gòu)的父節(jié)點(diǎn)的短語(yǔ)標(biāo)注。[0079]此外,源語(yǔ)言部分結(jié)構(gòu)取得部16通常僅在源語(yǔ)言部分結(jié)構(gòu)之間不產(chǎn)生沖突的情況下才保持源語(yǔ)言部分結(jié)構(gòu)的跨度。也就是說(shuō),源語(yǔ)言部分結(jié)構(gòu)取得部16通常不保持產(chǎn)生沖突的跨度。在此,沖突是指兩個(gè)以上的源語(yǔ)言的跨度彼此部分重復(fù)的狀態(tài)。也就是說(shuō),沖突并不是所謂的套疊(nest),而是交叉(cross)的狀態(tài)。但是,未與構(gòu)成目標(biāo)語(yǔ)言句的要素相互對(duì)應(yīng)的源語(yǔ)言句的要素部分能夠以不產(chǎn)生沖突的方式消除模糊性,因此作為不產(chǎn)生沖突的情形進(jìn)行處理。[0080]另外,當(dāng)源語(yǔ)言部分結(jié)構(gòu)的跨度比較模糊時(shí),源語(yǔ)言部分結(jié)構(gòu)取得部16對(duì)各推導(dǎo)樹(shù)應(yīng)用最寬松的限制。應(yīng)用最寬松的限制是指,基于限制的模糊性而存在因限制的方式會(huì)產(chǎn)生沖突的情況以及不會(huì)產(chǎn)生沖突的情況時(shí),總是應(yīng)用不會(huì)產(chǎn)生沖突的限制。[0081]當(dāng)存在推導(dǎo)樹(shù)的跨度的子樹(shù)的短語(yǔ)標(biāo)注時(shí),源語(yǔ)言部分結(jié)構(gòu)取得部16提取該短語(yǔ)標(biāo)注。在該提取中使用例如"語(yǔ)句級(jí)阻斷吉布斯采樣(sentence-levelblockedGibbssampler)(參見(jiàn)TrevorCohn,PhiIBlunsom,andSharonGoldwater.2010.InducingTree-SubstitutionGrammars.JournalofMachineLearningResearch,11:3053-3096.)"。本采樣(sampler)對(duì)于各語(yǔ)句執(zhí)行以下的兩個(gè)步驟。(I)以自下而上的方式計(jì)算內(nèi)部概率。(2)以自上而下的方式對(duì)樹(shù)進(jìn)行采樣。[0082]構(gòu)成PY模型的分布之后,例如源語(yǔ)言部分結(jié)構(gòu)取得部16使用包含概率信息的CFG以及CYK算法(參見(jiàn)DanielH.Younger(1967).Recognitionandparsingofcontext-freelanguagesintimen3.InformationandControl10(2):189-208·),取得最佳的一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)。此外,CYK算法從滿足源語(yǔ)言部分結(jié)構(gòu)的跨度和短語(yǔ)標(biāo)注的限制的句法結(jié)構(gòu)中搜索出最優(yōu)的句法構(gòu)造。該限制與用于構(gòu)成包含概率信息的CFG而使用的限制相同。[0083]構(gòu)成源語(yǔ)言部分結(jié)構(gòu)取得部16的源語(yǔ)言部分結(jié)構(gòu)取得單元161取得一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)。此外,源語(yǔ)言部分結(jié)構(gòu)取得單元161有時(shí)無(wú)法取得完整的源語(yǔ)言部分結(jié)構(gòu)。[0084]當(dāng)在源語(yǔ)言部分結(jié)構(gòu)取得單元161取得的一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)中存在不完整的源語(yǔ)言部分結(jié)構(gòu)時(shí),部分結(jié)構(gòu)補(bǔ)充單元162對(duì)該源語(yǔ)言部分結(jié)構(gòu)應(yīng)用統(tǒng)計(jì)模型存儲(chǔ)部13的統(tǒng)計(jì)模型,從而取得完整的源語(yǔ)言部分結(jié)構(gòu)。此外,不完整的源語(yǔ)言部分結(jié)構(gòu)如上所述。[0085]當(dāng)源語(yǔ)言部分結(jié)構(gòu)取得單元161取得了包含有無(wú)法確定短語(yǔ)標(biāo)注的父節(jié)點(diǎn)的源語(yǔ)言部分結(jié)構(gòu)時(shí),部分結(jié)構(gòu)補(bǔ)充單元162對(duì)該源語(yǔ)言部分結(jié)構(gòu)應(yīng)用統(tǒng)計(jì)模型,從而確定源語(yǔ)言部分結(jié)構(gòu)的父節(jié)點(diǎn)的短語(yǔ)標(biāo)注。此外,確定短語(yǔ)標(biāo)注也可以是如下方式,即,作為該源語(yǔ)言部分結(jié)構(gòu)的父節(jié)點(diǎn)所具有的短語(yǔ)標(biāo)注而寫(xiě)入已確定的短語(yǔ)標(biāo)注。另外,此處的統(tǒng)計(jì)模型通常是指CFG規(guī)則的統(tǒng)計(jì)模型。[0086]排序部17使用表示構(gòu)成源語(yǔ)言句的兩個(gè)以上的要素的順序的、一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu),對(duì)構(gòu)成源語(yǔ)言句的兩個(gè)以上的要素的順序進(jìn)行排序。然后,排序部17取得一個(gè)以上的作為排序的結(jié)果的源語(yǔ)言部分結(jié)構(gòu)。另外,排序部17通常以相對(duì)于目標(biāo)語(yǔ)言句的要素的順序形成接近滿足預(yù)定條件的順序的方式,對(duì)構(gòu)成源語(yǔ)言句的兩個(gè)以上的要素的順序進(jìn)行排序。在此,接近的順序是指,目標(biāo)語(yǔ)言句的要素的順序與源語(yǔ)言句的要素的順序接近。[0087]此外,排序部17例如以使排序處理后的源語(yǔ)言部分結(jié)構(gòu)與目標(biāo)語(yǔ)言部分結(jié)構(gòu)之間的"KendallT"變?yōu)樽畲蟮姆绞?,?duì)源語(yǔ)言部分結(jié)構(gòu)的兄弟節(jié)點(diǎn)進(jìn)行排列,或者不進(jìn)行排序。在此,"Kendal1τ"是一種順位相關(guān)系數(shù)。[0088]標(biāo)注賦予部18將排序標(biāo)注賦予給一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu),從而取得一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)。標(biāo)注賦予部18通常對(duì)排序部17排序的一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)賦予排序用的標(biāo)注,從而取得一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)。[0089]標(biāo)注賦予部18例如僅對(duì)第一種源語(yǔ)言部分結(jié)構(gòu)附加排序標(biāo)注。該排序標(biāo)注是表示進(jìn)行排序的標(biāo)注。另外,標(biāo)注賦予部18例如僅對(duì)第二種源語(yǔ)言部分結(jié)構(gòu)附加排序標(biāo)注。該排序標(biāo)注是表示不進(jìn)行排序的標(biāo)注。另外,標(biāo)注賦予部18例如也可以對(duì)第一種源語(yǔ)言部分結(jié)構(gòu)附加表示進(jìn)行排序的排序標(biāo)注(例如"_SW"),而對(duì)第二種源語(yǔ)言部分結(jié)構(gòu)附加表示不進(jìn)行排序的排序標(biāo)注(例如"_ST")。[0090]模型構(gòu)建部19使用標(biāo)注賦予部18取得的一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),構(gòu)建一個(gè)以上的句法解析模型(例如ITG解析模型)。模型構(gòu)建部19例如可通過(guò)伯克利解析器的模型學(xué)習(xí)功能來(lái)實(shí)現(xiàn)。[0091]保存部20保存模型構(gòu)建部19取得一個(gè)以上的句法解析模型。保存部20通常將一個(gè)以上的句法解析模型保存到存儲(chǔ)介質(zhì)10中。[0092]存儲(chǔ)介質(zhì)10、對(duì)譯語(yǔ)料庫(kù)11、要素對(duì)存儲(chǔ)部12以及統(tǒng)計(jì)模型存儲(chǔ)部13優(yōu)選為非易失性的存儲(chǔ)介質(zhì),但是也可以通過(guò)易失性的存儲(chǔ)介質(zhì)來(lái)實(shí)現(xiàn)。[0093]向?qū)ψg語(yǔ)料庫(kù)11等中存儲(chǔ)對(duì)譯句等的過(guò)程沒(méi)有限制。例如,可以借助存儲(chǔ)介質(zhì)將對(duì)譯句等存儲(chǔ)在對(duì)譯語(yǔ)料庫(kù)11等中,也可以將經(jīng)由通信線路等發(fā)送過(guò)來(lái)的對(duì)譯句等存儲(chǔ)在對(duì)譯語(yǔ)料庫(kù)11等中,或者還可以借助輸入設(shè)備將輸入的對(duì)譯句等存儲(chǔ)在對(duì)譯語(yǔ)料庫(kù)11等中。[0094]句法解析部14、源語(yǔ)言要素取得部15、源語(yǔ)言部分結(jié)構(gòu)取得部16、排序部17、標(biāo)注賦予部18、模型構(gòu)建部19、保存部20、源語(yǔ)言部分結(jié)構(gòu)取得單元161以及部分結(jié)構(gòu)補(bǔ)充單元162通??捎蒑PU和存儲(chǔ)器等來(lái)實(shí)現(xiàn)。句法解析部14等的處理順序通常由軟件來(lái)實(shí)現(xiàn),該軟件被存儲(chǔ)在ROM等存儲(chǔ)介質(zhì)中。但是,也可以由硬件(專用電路)來(lái)實(shí)現(xiàn)。[0095]接下來(lái),使用圖2、圖3的流程圖,對(duì)學(xué)習(xí)裝置1的動(dòng)作進(jìn)行說(shuō)明。[0096](步驟S201)句法解析部14將1代入計(jì)數(shù)器i。[0097](步驟S202)句法解析部14對(duì)在對(duì)譯語(yǔ)料庫(kù)11中是否存在第i個(gè)對(duì)譯句進(jìn)行判斷。如果存在第i個(gè)對(duì)譯句,則前進(jìn)到步驟S203,如果不存在第i個(gè)對(duì)譯句,則結(jié)束處理。[0098](步驟S203)句法解析部14從對(duì)譯語(yǔ)料庫(kù)11中讀出第i個(gè)對(duì)譯句所具有的第i個(gè)目標(biāo)語(yǔ)言句。[0099](步驟S204)句法解析部14對(duì)在步驟S203中讀出的目標(biāo)語(yǔ)言句進(jìn)行句法解析。然后,句法解析部14取得與第i個(gè)目標(biāo)語(yǔ)言句相對(duì)應(yīng)的目標(biāo)語(yǔ)言的二叉樹(shù)。此外,目標(biāo)語(yǔ)言的二叉樹(shù)具有一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)。[0100](步驟S205)源語(yǔ)言要素取得部15從對(duì)譯語(yǔ)料庫(kù)11中讀出第i個(gè)對(duì)譯句所具有的第i個(gè)源語(yǔ)言句。[0101](步驟S206)源語(yǔ)言要素取得部15將1代入計(jì)數(shù)器j。[0102](步驟S207)源語(yǔ)言要素取得部15對(duì)在通過(guò)步驟S204取得的目標(biāo)語(yǔ)言的二叉樹(shù)中是否存在第j個(gè)終端子節(jié)點(diǎn)進(jìn)行判斷。如果存在第j個(gè)終端子節(jié)點(diǎn),則前進(jìn)到步驟S208,如果不存在第j個(gè)終端子節(jié)點(diǎn),則前進(jìn)到步驟S210。此外,終端子節(jié)點(diǎn)是目標(biāo)語(yǔ)言的單詞等的要素。[0103](步驟S208)源語(yǔ)言要素取得部15從要素對(duì)存儲(chǔ)部12中取得與第j個(gè)終端子節(jié)點(diǎn)(目標(biāo)語(yǔ)言的要素)相對(duì)應(yīng)的源語(yǔ)言的單詞等的要素、即第i個(gè)源語(yǔ)言句中包含的要素。[0104](步驟S209)源語(yǔ)言要素取得部15使計(jì)數(shù)器j遞增1,并返回步驟S207。[0105](步驟S210)構(gòu)成源語(yǔ)言部分結(jié)構(gòu)取得部16的源語(yǔ)言部分結(jié)構(gòu)取得單元161將1代入計(jì)數(shù)器j。[0106](步驟S211)源語(yǔ)言部分結(jié)構(gòu)取得單元161對(duì)在通過(guò)步驟S204取得的目標(biāo)語(yǔ)言的二叉樹(shù)中是否存在第j個(gè)目標(biāo)語(yǔ)言部分結(jié)構(gòu)進(jìn)行判斷。如果存在第j個(gè)目標(biāo)語(yǔ)言部分結(jié)構(gòu),則前進(jìn)到步驟S212,如果不存在第j個(gè)目標(biāo)語(yǔ)言部分結(jié)構(gòu),則前進(jìn)到步驟S214。[0107](步驟S212)源語(yǔ)言部分結(jié)構(gòu)取得單元161構(gòu)建與第j個(gè)目標(biāo)語(yǔ)言部分結(jié)構(gòu)相對(duì)應(yīng)的源語(yǔ)言部分結(jié)構(gòu)。[0108](步驟S213)源語(yǔ)言部分結(jié)構(gòu)取得單元161使計(jì)數(shù)器j遞增1,并返回步驟S211。[0109](步驟S214)部分結(jié)構(gòu)補(bǔ)充單元162將1代入計(jì)數(shù)器j。[0110](步驟S215)部分結(jié)構(gòu)補(bǔ)充單元162對(duì)是否存在第j個(gè)源語(yǔ)言部分結(jié)構(gòu)進(jìn)行判斷。如果存在第j個(gè)源語(yǔ)言部分結(jié)構(gòu),則前進(jìn)到步驟S216,如果不存在第j個(gè)源語(yǔ)言部分結(jié)構(gòu),則前進(jìn)到步驟S219。[0111](步驟S216)部分結(jié)構(gòu)補(bǔ)充單元162對(duì)第j個(gè)源語(yǔ)言部分結(jié)構(gòu)是否是不完整的源語(yǔ)言部分結(jié)構(gòu)進(jìn)行判斷。如果是不完整的源語(yǔ)言部分結(jié)構(gòu),則前進(jìn)到步驟S217,如果不是不完整的源語(yǔ)言部分結(jié)構(gòu),則前進(jìn)到步驟S218。[0112](步驟S217)部分結(jié)構(gòu)補(bǔ)充單元162使用統(tǒng)計(jì)模型,將第j個(gè)源語(yǔ)言部分結(jié)構(gòu)變更為完整的源語(yǔ)言部分結(jié)構(gòu)。[0113](步驟S218)部分結(jié)構(gòu)補(bǔ)充單元162使計(jì)數(shù)器j遞增1,并返回步驟S215。[0114](步驟S219)排序部17將1代入計(jì)數(shù)器j。[0115](步驟S220)排序部17對(duì)是否存在第j個(gè)源語(yǔ)言部分結(jié)構(gòu)進(jìn)行判斷。如果存在第j個(gè)源語(yǔ)言部分結(jié)構(gòu),則前進(jìn)到步驟S221,如果不存在第j個(gè)源語(yǔ)言部分結(jié)構(gòu),則前進(jìn)到步驟S224〇[0116](步驟S221)排序部17對(duì)第j個(gè)源語(yǔ)言部分結(jié)構(gòu)是否是需要排序的源語(yǔ)言部分結(jié)構(gòu)進(jìn)行判斷。當(dāng)判斷為需要排序時(shí),則前進(jìn)到步驟S222,當(dāng)判斷為不需要排序時(shí),則前進(jìn)到步驟S223〇[0117](步驟S222)排序部17對(duì)第j個(gè)源語(yǔ)言部分結(jié)構(gòu)所具有的兄弟節(jié)點(diǎn)進(jìn)行排序。[0118](步驟S223)排序部17使計(jì)數(shù)器j遞增1,并返回步驟S220。[0119](步驟S224)標(biāo)注賦予部18將1代入計(jì)數(shù)器j。[0120](步驟S225)標(biāo)注賦予部18對(duì)是否存在第j個(gè)源語(yǔ)言部分結(jié)構(gòu)進(jìn)行判斷。如果存在第j個(gè)源語(yǔ)言部分結(jié)構(gòu),則前進(jìn)到步驟S226,如果不存在第j個(gè)源語(yǔ)言部分結(jié)構(gòu),則前進(jìn)到步驟S230。[0121](步驟S226)標(biāo)注賦予部18對(duì)第j個(gè)源語(yǔ)言部分結(jié)構(gòu)是否發(fā)生了排序進(jìn)行判斷。如果發(fā)生了排序,則前進(jìn)到步驟S227,如果未發(fā)生排序,則前進(jìn)到步驟S228。[0122](步驟S227)標(biāo)注賦予部18將表示進(jìn)行排序的標(biāo)注(例如"_SW")附加給第j個(gè)源語(yǔ)言部分結(jié)構(gòu)。[0123](步驟S228)標(biāo)注賦予部18將表示不進(jìn)行排序的標(biāo)注(例如"_ST")附加給第j個(gè)源語(yǔ)言部分結(jié)構(gòu)。[0124](步驟S229)標(biāo)注賦予部18使計(jì)數(shù)器j遞增1,并返回步驟S225。[0125](步驟S230)模型構(gòu)建部19使用標(biāo)注賦予部18取得的一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),構(gòu)建一個(gè)以上的句法解析模型。然后,保存部20將模型構(gòu)建部19取得的一個(gè)以上的句法解析模型保存到存儲(chǔ)介質(zhì)10中。[0126](步驟S231)句法解析部14使計(jì)數(shù)器i遞增1,并返回步驟S202。[0127]此外,本流程圖中的各個(gè)步驟的順序等僅是示例。[0128]另外,標(biāo)注賦予部18對(duì)源語(yǔ)言部分結(jié)構(gòu)附加了表示進(jìn)行排序的標(biāo)注(例如"_SW")或者表示不進(jìn)行排序的標(biāo)注(例如"_ST")。但是,標(biāo)注賦予部18也可以對(duì)一部分的源語(yǔ)言部分結(jié)構(gòu)附加排序標(biāo)注。即使是附加有排序標(biāo)注的一部分的源語(yǔ)言部分結(jié)構(gòu),也能夠區(qū)分某個(gè)源語(yǔ)言部分結(jié)構(gòu)是否是排序?qū)ο蟮脑凑Z(yǔ)言部分結(jié)構(gòu)。[0129]進(jìn)一步,在圖2、圖3的流程圖中,通過(guò)切斷電源或處理結(jié)束的中斷來(lái)結(jié)束處理。[0130]下面,對(duì)本實(shí)施方式中的學(xué)習(xí)裝置1的具體動(dòng)作進(jìn)行說(shuō)明。[0131]現(xiàn)在,例如設(shè)源語(yǔ)言為日語(yǔ),目標(biāo)語(yǔ)言為英語(yǔ)。而且,設(shè)對(duì)譯語(yǔ)料庫(kù)11存儲(chǔ)有"日語(yǔ)句:彼《昨日新刊仍本旮買(mǎi)ofc(日語(yǔ),意為'他昨天購(gòu)買(mǎi)了新的書(shū)',其中,'彼'意為'他'ft'為助詞,用于提示主題,無(wú)實(shí)際意義;'昨日'意為'昨天';'新刊'意為'新(新發(fā)行)';'仍'為助詞,用于提示定語(yǔ),意為'的';'本'意為'書(shū)';'旮'為助詞,用于提示賓語(yǔ),無(wú)實(shí)際意義;'買(mǎi)意為'購(gòu)買(mǎi)了'),英語(yǔ)句:heboughtnewbooksyesterday(英語(yǔ),意為'他昨天購(gòu)買(mǎi)了新的書(shū)',其中,'he'意為'他'bought'意為'購(gòu)買(mǎi)了'new'意為'新的';'books'意為'書(shū)';'yesterday'意為'昨天')"。[0132]另外,設(shè)要素對(duì)存儲(chǔ)部12存儲(chǔ)有包含具有日語(yǔ)單詞和英語(yǔ)單詞的大量要素對(duì)的日英單詞詞典的數(shù)據(jù)。要素對(duì)例如為(彼,he)、(昨日,yesterday)等。[0133]進(jìn)一步,設(shè)統(tǒng)計(jì)模型存儲(chǔ)部13儲(chǔ)存有上述的CFG規(guī)則的統(tǒng)計(jì)模型。[0134]在這種狀況下,學(xué)習(xí)裝置1如下地進(jìn)行動(dòng)作。[0135]首先,學(xué)習(xí)裝置1的句法解析部14讀出對(duì)譯語(yǔ)料庫(kù)11的目標(biāo)語(yǔ)言句"heboughtnewbooksyesterday"。[0136]接下來(lái),句法解析部14對(duì)讀出的目標(biāo)語(yǔ)言句進(jìn)行句法解析。然后,句法解析部14取得與目標(biāo)語(yǔ)言句相對(duì)應(yīng)的目標(biāo)語(yǔ)言的二叉樹(shù)。該二叉樹(shù)如圖4所示。該二叉樹(shù)包含:具有父節(jié)點(diǎn)"S"以及子節(jié)點(diǎn)"he"、"VP"的目標(biāo)語(yǔ)言部分結(jié)構(gòu),具有父節(jié)點(diǎn)"VP"以及子節(jié)點(diǎn)"VP"、"yesterday"的目標(biāo)語(yǔ)言部分結(jié)構(gòu),具有父節(jié)點(diǎn)"VP"以及子節(jié)點(diǎn)"bought"、"NP"的目標(biāo)語(yǔ)言部分結(jié)構(gòu),具有父節(jié)點(diǎn)"NP"以及子節(jié)點(diǎn)"new"、"books"的目標(biāo)語(yǔ)言部分結(jié)構(gòu)。此外,句法解析部14例如為伯克利解析器。[0137]接下來(lái),源語(yǔ)言要素取得部15從對(duì)譯語(yǔ)料庫(kù)11中讀出"日語(yǔ)句:彼《昨日新刊(7)本旮買(mǎi)〇化"。[0138]接下來(lái),源語(yǔ)言要素取得部15使用要素對(duì)存儲(chǔ)部12,取得與目標(biāo)語(yǔ)言的二叉樹(shù)中的終端子節(jié)點(diǎn)(目標(biāo)語(yǔ)言的單詞)相對(duì)應(yīng)的源語(yǔ)言的單詞、即源語(yǔ)言句中包含的單詞。也就是說(shuō),如圖5所示,源語(yǔ)言要素取得部15與"he"相互對(duì)應(yīng)地取得"彼"、與"bought"對(duì)應(yīng)地取得"買(mǎi)〇化",與"new"相互對(duì)應(yīng)地取得"新刊",與"books"相互對(duì)應(yīng)地取得"本",與"yesterday"相互對(duì)應(yīng)地取得"昨日"。[0139]接下來(lái),源語(yǔ)言部分結(jié)構(gòu)取得單元161對(duì)構(gòu)成源語(yǔ)言句的源語(yǔ)言的一個(gè)以上的要素應(yīng)用由一個(gè)以上的各個(gè)目標(biāo)語(yǔ)言部分結(jié)構(gòu)表示的結(jié)構(gòu),從而取得一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)。圖6中示出了該一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)的概念。[0140]接下來(lái),部分結(jié)構(gòu)補(bǔ)充單元162對(duì)不完整的源語(yǔ)言部分結(jié)構(gòu)使用統(tǒng)計(jì)模型,變更為完整的源語(yǔ)言部分結(jié)構(gòu)。部分結(jié)構(gòu)補(bǔ)充單元162例如使未與目標(biāo)語(yǔ)言的單詞相互對(duì)應(yīng)的"tt"包含到相鄰的跨度("彼"的跨度)中。然后,部分結(jié)構(gòu)補(bǔ)充單元162使用統(tǒng)計(jì)模型,取得與子節(jié)點(diǎn)"彼"和子節(jié)點(diǎn)"tt"相對(duì)應(yīng)的父節(jié)點(diǎn)的短語(yǔ)標(biāo)注"NP"。然后,獲得圖7所示的源語(yǔ)言部分結(jié)構(gòu)(部分樹(shù))。[0141]另外,部分結(jié)構(gòu)補(bǔ)充單元162例如使未與目標(biāo)語(yǔ)言的單詞相互對(duì)應(yīng)的"(7)"包含到相鄰的跨度("新刊"的跨度)中。然后,部分結(jié)構(gòu)補(bǔ)充單元162使用統(tǒng)計(jì)模型,取得與子節(jié)點(diǎn)"新刊"和子節(jié)點(diǎn)相對(duì)應(yīng)的父節(jié)點(diǎn)的短語(yǔ)標(biāo)注"PP"。[0142]進(jìn)一步,部分結(jié)構(gòu)補(bǔ)充單元162例如使未與目標(biāo)語(yǔ)言的單詞相互對(duì)應(yīng)的"旮"包含到相鄰的跨度("新刊仍本"的跨度)中。然后,部分結(jié)構(gòu)補(bǔ)充單元162使用統(tǒng)計(jì)模型,取得以對(duì)應(yīng)于"新刊本"的父節(jié)點(diǎn)"NP"和節(jié)點(diǎn)"全"為子節(jié)點(diǎn)的父節(jié)點(diǎn)的短語(yǔ)標(biāo)注"NP"。[0143]通過(guò)以上的處理,源語(yǔ)言部分結(jié)構(gòu)取得部16獲得圖8所示的具有一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)的二叉樹(shù)。該二叉樹(shù)包含:具有父節(jié)點(diǎn)"S"以及子節(jié)點(diǎn)"NP"、"VP"的源語(yǔ)言部分結(jié)構(gòu),具有父節(jié)點(diǎn)"NP"以及子節(jié)點(diǎn)"彼"、"比'的源語(yǔ)言部分結(jié)構(gòu),具有父節(jié)點(diǎn)"VP"以及子節(jié)點(diǎn)"昨日"、"VP"的源語(yǔ)言部分結(jié)構(gòu),具有父節(jié)點(diǎn)"VP"以及子節(jié)點(diǎn)"NP"、"VP"的源語(yǔ)言部分結(jié)構(gòu),具有父節(jié)點(diǎn)"NP"以及子節(jié)點(diǎn)"NP"、"全"的源語(yǔ)言部分結(jié)構(gòu),具有父節(jié)點(diǎn)"NP"以及子節(jié)點(diǎn)"PP"、"本"的源語(yǔ)言部分結(jié)構(gòu),具有父節(jié)點(diǎn)"PP"以及子節(jié)點(diǎn)"新刊"、的源語(yǔ)言部分結(jié)構(gòu),具有父節(jié)點(diǎn)"VP"以及子節(jié)點(diǎn)"買(mǎi)〇"、"化"的源語(yǔ)言部分結(jié)構(gòu)。[0144]接下來(lái),對(duì)于一個(gè)以上的各源語(yǔ)言部分結(jié)構(gòu),排序部17以接近目標(biāo)語(yǔ)言的語(yǔ)序的方式,檢查是否需要進(jìn)行兄弟節(jié)點(diǎn)的排序。在此,排序部17判斷需要對(duì)以"昨日"和"新刊(7)本旮買(mǎi)ofc"為跨度的源語(yǔ)言部分結(jié)構(gòu)進(jìn)行排序,并進(jìn)行排序。另外,排序部17判斷需要對(duì)以"新刊〇本全"和"買(mǎi)為跨度的源語(yǔ)言部分結(jié)構(gòu)進(jìn)行排序,并進(jìn)行排序。然后,排序部17獲得圖9所示的具有源語(yǔ)言部分結(jié)構(gòu)的二叉樹(shù)。此處的二叉樹(shù)在排序后的源語(yǔ)言部分結(jié)構(gòu)所具有的父節(jié)點(diǎn)表現(xiàn)出了"一"(81、82)。[0145]接下來(lái),標(biāo)注賦予部18對(duì)一個(gè)以上的各源語(yǔ)言部分結(jié)構(gòu)是否發(fā)生了排序進(jìn)行判斷。然后,標(biāo)注賦予部18對(duì)發(fā)生了排序的源語(yǔ)言部分結(jié)構(gòu)附加表示進(jìn)行排序的標(biāo)注(在此為"_SW")。另外,標(biāo)注賦予部18對(duì)未發(fā)生排序的源語(yǔ)言部分結(jié)構(gòu)附加表示不進(jìn)行排序的標(biāo)注(在此為"_ST")。然后,標(biāo)注賦予部18獲得圖10所示的一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)。圖10中含有的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)包含:具有父節(jié)點(diǎn)"S_ST"以及子節(jié)點(diǎn)"NP_ST"、"VP_SW"的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),具有父節(jié)點(diǎn)"NP_ST"以及子節(jié)點(diǎn)"彼"、"tt"的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),具有父節(jié)點(diǎn)"VP_SW"以及子節(jié)點(diǎn)"昨日"、"VP_SW"的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),具有父節(jié)點(diǎn)"VP_SW"以及子節(jié)點(diǎn)"NP_ST"、"VP_ST"的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),具有父節(jié)點(diǎn)"NP_ST"以及子節(jié)點(diǎn)"NP_ST"、"全"的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),具有父節(jié)點(diǎn)"NP_ST"以及子節(jié)點(diǎn)"PP_ST"、"本"的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),具有父節(jié)點(diǎn)"PP_ST"以及子節(jié)點(diǎn)"新刊"、"(7)"的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),具有父節(jié)點(diǎn)"VP_ST"以及子節(jié)點(diǎn)"買(mǎi)〇"、"fc"的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)。[0146]接下來(lái),保存部20保存具有由標(biāo)注賦予部18取得的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)的源語(yǔ)言句的二叉樹(shù)(參見(jiàn)圖10)。[0147]對(duì)于對(duì)譯語(yǔ)料庫(kù)11的全部對(duì)譯句執(zhí)行以上的處理。進(jìn)而,學(xué)習(xí)裝置1能夠?qū)W習(xí)預(yù)排序模型。[0148]如上所述,根據(jù)本實(shí)施方式,能夠?qū)W習(xí)可進(jìn)行高精度的翻譯的預(yù)排序模型。[0149]另外,根據(jù)本實(shí)施方式,通過(guò)以相對(duì)于目標(biāo)語(yǔ)言句的要素的順序形成接近滿足預(yù)定條件的順序的方式,對(duì)構(gòu)成源語(yǔ)言句的兩個(gè)以上的要素的順序進(jìn)行排序,由此能夠?qū)W習(xí)可進(jìn)行更高精度的翻譯的預(yù)排序模型。[0150]此外,本實(shí)施方式中的處理可以由軟件來(lái)實(shí)現(xiàn)。而且,可以通過(guò)軟件下載等方式來(lái)發(fā)布該軟件。另外,也可以將該軟件存儲(chǔ)在CD-ROM等存儲(chǔ)介質(zhì)中進(jìn)行傳播。此外,這一點(diǎn)在本說(shuō)明書(shū)的其他實(shí)施方式中也適用。此外,實(shí)現(xiàn)本實(shí)施方式中的學(xué)習(xí)裝置1的軟件是如下的程序。即,該程序?yàn)?,?jì)算機(jī)可訪問(wèn)的存儲(chǔ)介質(zhì)具備:對(duì)譯語(yǔ)料庫(kù),可存儲(chǔ)具有源語(yǔ)言句和該源語(yǔ)言句的翻譯結(jié)果即目標(biāo)語(yǔ)言句的一個(gè)以上的對(duì)譯句;以及要素對(duì)存儲(chǔ)部,可存儲(chǔ)一個(gè)以上的要素對(duì),所述一個(gè)以上的要素對(duì)是源語(yǔ)言的要素與目標(biāo)語(yǔ)言的要素的對(duì);該程序用于使計(jì)算機(jī)發(fā)揮如下部件的功能:句法解析部,取得目標(biāo)語(yǔ)言句的二叉樹(shù),所述目標(biāo)語(yǔ)言句的二叉樹(shù)是對(duì)所述一個(gè)以上的各對(duì)譯句所具有的目標(biāo)語(yǔ)言句進(jìn)行句法解析的結(jié)果,并具有一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu),所述一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)表示構(gòu)成目標(biāo)語(yǔ)言句的兩個(gè)以上的要素的順序,并且包含具有短語(yǔ)標(biāo)注的父節(jié)點(diǎn)以及兩個(gè)子節(jié)點(diǎn),所述兩個(gè)子節(jié)點(diǎn)是該父節(jié)點(diǎn)的子節(jié)點(diǎn),且具有目標(biāo)語(yǔ)言的短語(yǔ)標(biāo)注或者源語(yǔ)言的POS標(biāo)簽或者源語(yǔ)言的要素;源語(yǔ)言要素取得部,從所述要素對(duì)存儲(chǔ)部的一個(gè)以上的要素對(duì)中取得源語(yǔ)言的一個(gè)以上的要素,所述源語(yǔ)言的一個(gè)以上的要素是構(gòu)成與所述目標(biāo)語(yǔ)言句相對(duì)應(yīng)的源語(yǔ)言句的一個(gè)以上的要素,且與所述目標(biāo)語(yǔ)言句的二叉樹(shù)所具有的一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)的終端子節(jié)點(diǎn)即目標(biāo)語(yǔ)言的要素相對(duì)應(yīng);源語(yǔ)言部分結(jié)構(gòu)取得部,對(duì)構(gòu)成所述源語(yǔ)言句的源語(yǔ)言的一個(gè)以上的要素應(yīng)用由所述目標(biāo)語(yǔ)言句的二叉樹(shù)所具有的一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)表示的結(jié)構(gòu),從而取得一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu),所述一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)表示構(gòu)成所述源語(yǔ)言句的兩個(gè)以上的要素的順序,并包含具有短語(yǔ)標(biāo)注的父節(jié)點(diǎn)以及兩個(gè)子節(jié)點(diǎn),所述兩個(gè)子節(jié)點(diǎn)是該父節(jié)點(diǎn)的子節(jié)點(diǎn),且具有短語(yǔ)標(biāo)注或者源語(yǔ)言的POS標(biāo)簽;標(biāo)注賦予部,將排序標(biāo)注賦予給所述一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu),從而取得一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),所述排序標(biāo)注是能夠區(qū)別如下源語(yǔ)言部分結(jié)構(gòu)的標(biāo)注,即,目標(biāo)語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序與對(duì)應(yīng)的源語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序不同的源語(yǔ)言部分結(jié)構(gòu)、以及目標(biāo)語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序與對(duì)應(yīng)的源語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序相同的源語(yǔ)言部分結(jié)構(gòu);模型構(gòu)建部,使用所述一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),構(gòu)建一個(gè)以上的句法解析模型,所述一個(gè)以上的句法解析模型具有表示附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)的出現(xiàn)容易度的概率信息;以及保存部,保存模型構(gòu)建部構(gòu)建的一個(gè)以上的句法解析模型。[0151]在上述程序中,優(yōu)選使計(jì)算機(jī)發(fā)揮如下功能:使計(jì)算機(jī)進(jìn)一步發(fā)揮作為排序部的功能,所述排序部取得進(jìn)行了如下排序的一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu),即,使用表示構(gòu)成所述源語(yǔ)言句的兩個(gè)以上的要素的順序的、所述一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu),以相對(duì)于所述目標(biāo)語(yǔ)言句的要素的順序形成接近滿足預(yù)定條件的順序的方式,對(duì)構(gòu)成所述源語(yǔ)言句的兩個(gè)以上的要素的順序進(jìn)行排序;所述標(biāo)注賦予部對(duì)所述排序部排序的一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)賦予所述排序用的標(biāo)注。[0152]在上述程序中,優(yōu)選為,存儲(chǔ)介質(zhì)進(jìn)一步具備統(tǒng)計(jì)模型存儲(chǔ)部,可存儲(chǔ)CFG規(guī)則的統(tǒng)計(jì)模型,所述CFG規(guī)則的統(tǒng)計(jì)模型包含具有短語(yǔ)標(biāo)注的父節(jié)點(diǎn)以及兩個(gè)子節(jié)點(diǎn),所述兩個(gè)子節(jié)點(diǎn)是該父節(jié)點(diǎn)的子節(jié)點(diǎn),且具有短語(yǔ)標(biāo)注或者源語(yǔ)言的POS標(biāo)簽;使計(jì)算機(jī)發(fā)揮如下功能:所述源語(yǔ)言部分結(jié)構(gòu)取得部具備源語(yǔ)言部分結(jié)構(gòu)取得單元以及部分結(jié)構(gòu)補(bǔ)充單元,所述源語(yǔ)言部分結(jié)構(gòu)取得單元對(duì)構(gòu)成所述源語(yǔ)言句的源語(yǔ)言的一個(gè)以上的要素應(yīng)用由所述目標(biāo)語(yǔ)言句的二叉樹(shù)所具有的一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)表示的結(jié)構(gòu),從而取得一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu),所述一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)表示構(gòu)成源語(yǔ)言句的兩個(gè)以上的要素的順序,并包含具有短語(yǔ)標(biāo)注的父節(jié)點(diǎn)以及兩個(gè)子節(jié)點(diǎn),所述兩個(gè)子節(jié)點(diǎn)是該父節(jié)點(diǎn)的子節(jié)點(diǎn),且具有短語(yǔ)標(biāo)注或者源語(yǔ)言的要素,所述部分結(jié)構(gòu)補(bǔ)充單元在所述源語(yǔ)言部分結(jié)構(gòu)取得單元取得的一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)中存在不完整的源語(yǔ)言部分結(jié)構(gòu)時(shí),對(duì)該源語(yǔ)言部分結(jié)構(gòu)應(yīng)用所述統(tǒng)計(jì)模型,從而取得完整的源語(yǔ)言部分結(jié)構(gòu)。[0153](本發(fā)明的第二實(shí)施方式)[0154]在本實(shí)施方式中,對(duì)利用預(yù)排序模型進(jìn)行機(jī)器翻譯的翻譯裝置進(jìn)行說(shuō)明,該預(yù)排序模型通過(guò)在第一實(shí)施方式中說(shuō)明的學(xué)習(xí)裝置1進(jìn)行了學(xué)習(xí)。[0155]另外,在本實(shí)施方式中,對(duì)利用源語(yǔ)言的句法解析器的翻譯裝置進(jìn)行說(shuō)明。[0156]圖11是本實(shí)施方式中的翻譯裝置2的框圖。翻譯裝置2具備二叉樹(shù)存儲(chǔ)部21、要素對(duì)存儲(chǔ)部22、受理部23、詞素解析部24、附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)取得部25、翻譯排序部26、檢索部27以及輸出部28。[0157]二叉樹(shù)存儲(chǔ)部21存儲(chǔ)有一個(gè)以上的句法解析模型。句法解析模型具有一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)。另外,該一個(gè)以上的句法解析模型是在第一實(shí)施方式中說(shuō)明過(guò)的學(xué)習(xí)裝置1保存的一個(gè)以上的句法解析模型。二叉樹(shù)存儲(chǔ)部21可以與存儲(chǔ)介質(zhì)10相同。[0158]要素對(duì)存儲(chǔ)部22可存儲(chǔ)源語(yǔ)言的要素與目標(biāo)語(yǔ)言的要素的對(duì)即一個(gè)或者兩個(gè)以上的要素對(duì)。[0159]受理部23受理源語(yǔ)言句。源語(yǔ)言句是翻譯對(duì)象的源語(yǔ)言的語(yǔ)句。另外,在此,受理包括如下概念:受理從鍵盤(pán)、鼠標(biāo)、觸摸面板等輸入設(shè)備輸入的信息,受理作為聲音識(shí)別結(jié)果的源語(yǔ)言句、受理經(jīng)由有線或者無(wú)線的通信線路發(fā)送過(guò)來(lái)的信息、受理從光盤(pán)、磁盤(pán)、半導(dǎo)體存儲(chǔ)器等存儲(chǔ)介質(zhì)中讀出的信息等。源語(yǔ)言句的輸入單元可以是鍵盤(pán)、鼠標(biāo)、觸摸面板、菜單畫(huà)面等任意的輸入單元。受理部23可通過(guò)鍵盤(pán)等輸入單元的設(shè)備驅(qū)動(dòng)程序、菜單畫(huà)面的控制軟件等來(lái)實(shí)現(xiàn)。[0160]詞素解析部24對(duì)受理部23受理的源語(yǔ)言句進(jìn)行詞素解析,取得與POS標(biāo)簽相互對(duì)應(yīng)的兩個(gè)以上的要素。此外,POS標(biāo)簽是表示詞性的信息。[0161]詞素解析部24是例如〇1&8611(參見(jiàn)1]此:111^口://(311&8611.&丨81:-的1&.&(3.]_卩/index.php?cmd=read&page=ProjectPractice2005&word=%A3%C3%A3%E8%A3%El%A3%F3%A3%E5%A3%EE)、MeCab(參見(jiàn)URL:http://mecab·sou;rceforge·net/)等。此外,詞素解析技術(shù)為公知技術(shù),因此省略詳細(xì)的說(shuō)明。[0162]附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)取得部25使用一個(gè)以上的句法解析模型,從受理部23受理的源語(yǔ)言句所具有的兩個(gè)以上的各要素中取得一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)。[0163]通常,附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)取得部25使用ITG解析模型,通過(guò)現(xiàn)有的句法解析的算法(例如Berkeleyparser(Improvedinferenceforunlexicalizedparsing.InNAACL-HLT,pages404-411,Rochester,NewYork1April.AssociationforComputationalLinguistics.),對(duì)源語(yǔ)言句進(jìn)行句法解析,從而取得源語(yǔ)言句法結(jié)構(gòu)。此外,使用一個(gè)以上的句法解析模型,根據(jù)詞素解析部24取得的POS標(biāo)簽和單詞的排列,學(xué)習(xí)并構(gòu)建ITG解析模型。[0164]當(dāng)附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)取得部25取得的一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)所具有的排序標(biāo)注是表示目標(biāo)語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序與源語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序不同的排序標(biāo)注時(shí),翻譯排序部26執(zhí)行如下的排序處理,從而取得排序后的源語(yǔ)言的兩個(gè)以上的要素,即,所述排序處理為,對(duì)與該排序標(biāo)注相對(duì)應(yīng)的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)所具有的兩個(gè)子節(jié)點(diǎn)的順序進(jìn)行排序。當(dāng)然,翻譯排序部26并不是對(duì)全部的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)所具有的兩個(gè)子節(jié)點(diǎn)的順序進(jìn)行排序。也就是說(shuō),當(dāng)標(biāo)注是表示不進(jìn)行排序的標(biāo)注時(shí),翻譯排序部26并不對(duì)與該標(biāo)注相對(duì)應(yīng)的源語(yǔ)言部分結(jié)構(gòu)所具有的兩個(gè)子節(jié)點(diǎn)的順序進(jìn)行排序。上述排序后的源語(yǔ)言的兩個(gè)以上的要素也可以包含未進(jìn)行排序的要素。另外,上述源語(yǔ)言的兩個(gè)以上的要素是與二叉樹(shù)的終端節(jié)點(diǎn)相對(duì)應(yīng)的要素。[0165]檢索部27從要素對(duì)存儲(chǔ)部22中取得與翻譯排序部取得的源語(yǔ)言的兩個(gè)以上的各要素相對(duì)應(yīng)的目標(biāo)語(yǔ)言的兩個(gè)以上的要素。在此,目標(biāo)語(yǔ)言的兩個(gè)以上的要素是指,按照如下的順序排列的目標(biāo)語(yǔ)言的兩個(gè)以上的要素,即,與構(gòu)成由翻譯排序部26排序后的源語(yǔ)言句的兩個(gè)以上的要素的順序相對(duì)應(yīng)的順序。[0166]輸出部28輸出由檢索部27取得的兩個(gè)以上的要素組成的目標(biāo)語(yǔ)言句。在此,輸出包括如下概念:顯示到顯示器上、使用投影儀進(jìn)行投影、通過(guò)打印機(jī)進(jìn)行打印、輸出聲音、發(fā)送到外部裝置、保存到存儲(chǔ)介質(zhì)中、將處理結(jié)果傳遞到其他處理裝置或其他程序等。[0167]二叉樹(shù)存儲(chǔ)部21、要素對(duì)存儲(chǔ)部22優(yōu)選為非易失性的存儲(chǔ)介質(zhì),但是也可由易失性的存儲(chǔ)介質(zhì)來(lái)實(shí)現(xiàn)。向二叉樹(shù)存儲(chǔ)部21等中存儲(chǔ)二叉樹(shù)等的過(guò)程沒(méi)有限制。例如,可以借助存儲(chǔ)介質(zhì)將二叉樹(shù)等存儲(chǔ)在二叉樹(shù)存儲(chǔ)部21等中,也可以將經(jīng)由通信線路等發(fā)送過(guò)來(lái)的二叉樹(shù)等存儲(chǔ)在二叉樹(shù)存儲(chǔ)部21等中,或者還可以將借助輸入設(shè)備輸入的二叉樹(shù)等存儲(chǔ)在二叉樹(shù)存儲(chǔ)部21等中。[0168]詞素解析部24、附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)取得部25、翻譯排序部26、檢索部27通??捎蒑PU和存儲(chǔ)器等來(lái)實(shí)現(xiàn)。詞素解析部24等的處理順序通常由軟件來(lái)實(shí)現(xiàn),該軟件被存儲(chǔ)在ROM等存儲(chǔ)介質(zhì)中。但是,也可以由硬件(專用電路)來(lái)實(shí)現(xiàn)。[0169]既可以認(rèn)為輸出部28包括顯示器、揚(yáng)聲器等的輸出設(shè)備,也可以認(rèn)為不包括它們。輸出部28可通過(guò)輸出設(shè)備的驅(qū)動(dòng)程序軟件、或者輸出設(shè)備的驅(qū)動(dòng)程序軟件與輸出設(shè)備等來(lái)實(shí)現(xiàn)。[0170]接下來(lái),使用圖12的流程圖,對(duì)翻譯裝置2的動(dòng)作進(jìn)行說(shuō)明。[0171](步驟S1201)受理部23對(duì)是否受理了源語(yǔ)言句進(jìn)行判斷。如果受理了源語(yǔ)言句,則前進(jìn)到步驟S1202,如果未受理源語(yǔ)言句,則返回步驟S1201。[0172](步驟S1202)詞素解析部24對(duì)受理部23受理的源語(yǔ)言句進(jìn)行詞素解析,從而取得與POS標(biāo)簽相互對(duì)應(yīng)的兩個(gè)以上的要素。[0173](步驟S1203)附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)取得部25使用源語(yǔ)言句的一個(gè)以上的句法解析模型,基于詞素解析部24取得的與POS標(biāo)簽相互對(duì)應(yīng)的兩個(gè)以上的要素,取得一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)。[0174](步驟S1204)翻譯排序部26將1代入計(jì)數(shù)器i。[0175](步驟S1205)翻譯排序部26對(duì)是否存在第i個(gè)附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)進(jìn)行判斷。如果存在第i個(gè)附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),則前進(jìn)到步驟S1206,如果不存在第i個(gè)附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),則前進(jìn)到步驟S1209。[0176](步驟S1206)翻譯排序部26對(duì)第i個(gè)附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)所具有的排序標(biāo)注是否是表示對(duì)兄弟節(jié)點(diǎn)進(jìn)行排序的標(biāo)注進(jìn)行判斷。當(dāng)是表示進(jìn)行排序的標(biāo)注時(shí),前進(jìn)到步驟S1207,當(dāng)不是表示進(jìn)行排序的標(biāo)注時(shí),前進(jìn)到步驟S1208。[0177](步驟S1207)翻譯排序部26對(duì)第i個(gè)附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)所具有的兄弟節(jié)點(diǎn)進(jìn)行排序。[0178](步驟Sl208)翻譯排序部26使計(jì)數(shù)器i遞增,并返回步驟Sl205。[0179](步驟S1209)將1代入計(jì)數(shù)器i。[0180](步驟S1210)檢索部27對(duì)是否存在由翻譯排序部26處理完畢的一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)構(gòu)成的二叉樹(shù)的、第i個(gè)終端節(jié)點(diǎn)(第i個(gè)要素)進(jìn)行判斷。當(dāng)存在第i個(gè)要素時(shí),前進(jìn)到步驟S1211,當(dāng)不存在第i個(gè)要素時(shí),前進(jìn)到步驟S1213。[0181](步驟S1211)檢索部27從要素對(duì)存儲(chǔ)部22中取得與第i個(gè)要素相對(duì)應(yīng)的目標(biāo)語(yǔ)言的要素。此外,設(shè)為以構(gòu)成語(yǔ)句的要素的順序來(lái)執(zhí)行此處的目標(biāo)語(yǔ)言的要素的取得。[0182](步驟S1212)檢索部27使計(jì)數(shù)器i遞增,并返回步驟S1210。[0183](步驟S1213)輸出部28輸出由在步驟S1211中檢索部27取得的兩個(gè)以上的要素組成的目標(biāo)語(yǔ)言句,并返回步驟S1201。此外,目標(biāo)語(yǔ)言句是要素按照檢索部27取得的順序排列的語(yǔ)句。[0184]此外,在圖12的流程圖中,通過(guò)切斷電源或處理結(jié)束的中斷來(lái)結(jié)束處理。[0185]下面,對(duì)本實(shí)施方式中的翻譯裝置2的具體動(dòng)作進(jìn)行說(shuō)明。[0186]現(xiàn)在,設(shè)為翻譯裝置2進(jìn)行日英翻譯。另外,設(shè)為翻譯裝置2例如是進(jìn)行統(tǒng)計(jì)翻譯的機(jī)器翻譯裝置。此外,翻譯裝置2優(yōu)選為進(jìn)行統(tǒng)計(jì)翻譯,但是也可以是進(jìn)行基于其他方法的機(jī)器翻譯的裝置。[0187]另外,設(shè)為二叉樹(shù)存儲(chǔ)部21存儲(chǔ)有大量的如圖10所示的二叉樹(shù)。此外,該二叉樹(shù)是具有一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)的源語(yǔ)言句的二叉樹(shù)。[0188]在此,設(shè)用戶對(duì)翻譯裝置2輸入了源語(yǔ)言句?昨日新刊本旮買(mǎi)ofc(日語(yǔ),意為'你昨天購(gòu)買(mǎi)了新的書(shū)',其中,意為'你為助詞,用于提示主題,無(wú)實(shí)際意義;'昨日'意為'昨天'新刊'意為'新(新發(fā)行為助詞,用于提示定語(yǔ),意為'的'本'意為'書(shū)';'旮'為助詞,用于提示賓語(yǔ),無(wú)實(shí)際意義;'買(mǎi)〇化'意為'購(gòu)買(mǎi)了'。)"。[0189]接下來(lái),詞素解析部24對(duì)受理部23受理的源語(yǔ)言句?昨日新刊本旮買(mǎi)進(jìn)行詞素解析,從而取得與POS標(biāo)簽相互對(duì)應(yīng)的兩個(gè)以上的要素。[0190]接下來(lái),附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)取得部25使用源語(yǔ)言句的一個(gè)以上的二叉樹(shù),基于與詞素解析部24取得的POS標(biāo)簽相互對(duì)應(yīng)的兩個(gè)以上的要素,取得一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)。而且,具有由附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)取得部25取得的一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)的二叉樹(shù)是如圖13所示的二叉樹(shù)。[0191]接下來(lái),對(duì)于如圖13所示的二叉樹(shù)所具有的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)之中的如下的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),翻譯排序部26更換其兄弟節(jié)點(diǎn),即,附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)所具有的排序標(biāo)注是表示對(duì)兄弟節(jié)點(diǎn)進(jìn)行排序的標(biāo)注。然后,如圖14所示,獲得二叉樹(shù)的終端要素的排列(源語(yǔ)言的要素的排列)?買(mǎi)ofc新刊本旮昨日"。[0192]檢索部27從要素對(duì)存儲(chǔ)部22中取得與圖14的141的各要素相對(duì)應(yīng)的目標(biāo)語(yǔ)言的要素。然后,檢索部27獲得目標(biāo)語(yǔ)言句"youboughtnewbooksyesterday(英語(yǔ),意為'你昨天購(gòu)買(mǎi)了新的書(shū)',其中,'you'意為'你'bought'意為'購(gòu)買(mǎi)了';'new'意為'新的';'books'意為'書(shū)';'yesterday'意為'昨天'。)"(圖14的142)。[0193]接下來(lái),輸出部28輸出由檢索部27取得的兩個(gè)以上的要素組成的目標(biāo)語(yǔ)言句"youboughtnewbooksyesterday"。[0194]下面,對(duì)本翻譯裝置2的實(shí)驗(yàn)結(jié)果進(jìn)行說(shuō)明。[0195](實(shí)驗(yàn)結(jié)果)[0196]在本實(shí)驗(yàn)中,通過(guò)日英翻譯對(duì)翻譯裝置2的性能進(jìn)行了評(píng)價(jià)。而且,在本實(shí)驗(yàn)中,使用了NTCIR-9(參見(jiàn)"IsaoGoto,BinLu,KaPoChow,EiichiroSumita,andBenjaminK.Tsou.2011.OverviewofthepatentmachinetranslationtaskattheNTCIR-9workshop·InProceedingsofNTCIR_9,pages559-578·")和NTCIR-IO(參見(jiàn)"IsaoGotojKaPoChowjBinLujEiichiroSumita,andBenjaminK.Tsou.2013a.OverviewofthepatentmachinetranslationtaskattheNTCIR-lOworkshop.InProceedingsofNTCIR-IO,pages260-286.")專利機(jī)器翻譯任務(wù)的數(shù)據(jù)。NTCIR-9與NTCIR-IO中的學(xué)習(xí)數(shù)據(jù)與開(kāi)發(fā)數(shù)據(jù)相同,而測(cè)試數(shù)據(jù)是不同的。學(xué)習(xí)數(shù)據(jù)是約318萬(wàn)條對(duì)話句,開(kāi)發(fā)數(shù)據(jù)是約2000條對(duì)譯句。而且,關(guān)于測(cè)試數(shù)據(jù),在NTCIR-9中是2000句,在NTCIR-IO中是2300句。[0197]而且,在本實(shí)驗(yàn)中,為了對(duì)學(xué)習(xí)數(shù)據(jù)的英文進(jìn)行句法解析,使用了Enju(參見(jiàn)aYusukeMiyaoandJun'ichiTsujii.2008.FeatureforestmodelsforprobabilisticHPSGparsing.InComputationalLinguistics,Volume34,Number1,pages81-88·")。[0198]另外,在本實(shí)驗(yàn)中,應(yīng)用了用于進(jìn)行專利語(yǔ)句解析的定制(參見(jiàn)"HidekiIsozaki,KatsuhitoSudohjHajimeTsukada,andKevinDuh.2012.HPSG-basedpreprocessingforEnglish-to-Japanesetranslation.ACMTransac-tionsonAsianLanguageInformationProcessing,11(3):8:1-8:16,September·',)。[0199]另外,作為日語(yǔ)的詞素解析器利用了MeCab。另外,與英語(yǔ)的情形同樣地,在日語(yǔ)中應(yīng)用了英語(yǔ)和數(shù)字的符號(hào)化。[0200]另外,作為翻譯模型,使用了利用英文為四十個(gè)詞(word)以下的長(zhǎng)度的對(duì)譯句進(jìn)行了學(xué)習(xí)的模型。其結(jié)果是,為了翻譯模型的學(xué)習(xí)而使用了約206萬(wàn)條對(duì)譯句。另外,在本實(shí)驗(yàn)中,為了構(gòu)建單詞對(duì)齊(alignment)(上述的要素對(duì)存儲(chǔ)部12),使用了GIZA++和growdiag-final-andheuristics。另外,在本實(shí)驗(yàn)中,為了減少單詞對(duì)齊的錯(cuò)誤,在進(jìn)行單詞對(duì)齊之前,刪除了英語(yǔ)的冠詞(a、an、the)、日語(yǔ)的助詞(私、旮、炫)。在本實(shí)驗(yàn)中,在單詞對(duì)齊之后,將去除的上述詞存儲(chǔ)到原來(lái)的位置。[0201]而且,在本實(shí)驗(yàn)中,使用了根據(jù)學(xué)習(xí)數(shù)據(jù)利用英語(yǔ)語(yǔ)句進(jìn)行了學(xué)習(xí)的5-gram語(yǔ)言模型。[0202]另外,通過(guò)使用開(kāi)發(fā)數(shù)據(jù)的MERT(MinimumErrorRateTraining:最小錯(cuò)誤率訓(xùn)練)(參見(jiàn)"FranzJosef0ch.2003.Minimumerrorratetraininginstatisticalmachinetranslation.InProceedingsofthe41stAnnualMeetingoftheAssociationforComputationalLinguistics,pages160-167)對(duì)SMT(StatisticalMachineTranslation:統(tǒng)計(jì)機(jī)器翻譯)的權(quán)重參數(shù)進(jìn)行了優(yōu)化。具體而言,在本實(shí)驗(yàn)中,為了使MERT的結(jié)果穩(wěn)定,通過(guò)使用了開(kāi)發(fā)數(shù)據(jù)中的前半部分的MERT進(jìn)行了三次權(quán)重參數(shù)的優(yōu)化。然后,通過(guò)使用了開(kāi)發(fā)數(shù)據(jù)中的后半部分的BLEU分?jǐn)?shù),從三次的權(quán)重參數(shù)集中選擇出了分?jǐn)?shù)最高的SMT權(quán)重參數(shù)集。[0203]本方法(翻譯裝置2的方法)也稱為"PROPOSED"。作為本方法的預(yù)排序的學(xué)習(xí)數(shù)據(jù)的源語(yǔ)言的滿二叉樹(shù)結(jié)構(gòu)由20萬(wàn)條源語(yǔ)言句構(gòu)成。該20萬(wàn)條源語(yǔ)言句是通過(guò)下面的流程選擇出來(lái)的。首先,根據(jù)通過(guò)單詞對(duì)齊從目標(biāo)語(yǔ)言的句法結(jié)構(gòu)中獲得的源語(yǔ)言的跨度的覆蓋率,對(duì)源語(yǔ)言的學(xué)習(xí)語(yǔ)句進(jìn)行歸類(lèi)(sort)。接下來(lái),選擇出上位20萬(wàn)條特有的源語(yǔ)言句。為了構(gòu)建滿二叉樹(shù)結(jié)構(gòu),利用吉布斯采樣(Gibbssampler)反復(fù)進(jìn)行了20次處理。此外,在此,通過(guò)"投影跨度數(shù)/(語(yǔ)句中的單詞數(shù)-1)"計(jì)算出覆蓋率。[0204]另外,為了進(jìn)行本方法中的預(yù)排序模型的學(xué)習(xí),使用了伯克利解析器。另外,為了從F'(將源語(yǔ)言句排序成目標(biāo)語(yǔ)言句的語(yǔ)序的語(yǔ)句(例如參見(jiàn)圖14的141))翻譯成E(目標(biāo)語(yǔ)言句),使用了基于短語(yǔ)的SMT系統(tǒng)"Moses(參見(jiàn)'PhilippKoehn,HieuHoang,AlexandraBirchjChrisCallison-BurchjMarcelloFederico,NicolaBertoldi,BrookeCowan,WadeShen,ChristineMoran,RichardZens,ChrisDyerjOndrejBojar,AlexandraConstantin,andEvanHerbst.2007.Moses:Opensourcetoolkitforstatisticalmachinetranslation.InProceedingsoftheACLDemoandPosterSessions,pages177-180.在這種情況下,將扭曲(distortion)的閾值設(shè)為6。此外,扭曲的閾值用于在從左側(cè)連續(xù)地生成目標(biāo)語(yǔ)言的語(yǔ)句時(shí),在輸入語(yǔ)句中限制最后翻譯的短語(yǔ)與下一個(gè)要翻譯的短語(yǔ)之間的相對(duì)位置,是對(duì)翻譯進(jìn)行限制時(shí)所使用的閾值,其使得"下一個(gè)要翻譯的短語(yǔ)的左端的單詞位置-最后翻譯的短語(yǔ)的右端的短語(yǔ)位置-Γ的絕對(duì)值小于等于閾值。當(dāng)該值較小(例如為"6")時(shí),翻譯時(shí)不進(jìn)行長(zhǎng)距離的語(yǔ)序排序。[0205]在本實(shí)驗(yàn)中,將本方法與以下的五種方法進(jìn)行了對(duì)比。[0206](1)使用了單詞排序模型的基于短語(yǔ)的SMT(PBMTl)(參見(jiàn)"PhilippKoehn,HieuHoangjAlexandraBirchjChrisCallisonBurch,MarcelloFederico,NicolaBertoldi,BrookeCowanjWadeShenjChristineMoranjRichardZensjChrisDyerjOndrejBojar,AlexandraConstantin,andEvanHerbst.2007.Moses:Opensourcetoolkitforstatisticalmachinetranslation·',)。[0207](2)基于階層短語(yǔ)的SMT(HPBMT)(參見(jiàn)"DavidChiang.2007.Hierarchicalphrase-basedtranslation.ComputationalLinguistics,33(2):201-228·',)。[0208](3)基于String-to-tree語(yǔ)法的SMT(SBMT)(參見(jiàn)"HieuHoang,PhilippKoehn,andAdamLopez.2009.AUnifiedFrameworkforPhraseBasedjHierarchical,andSyntaxBasedStatisticalMachineTranslation.InProceedingsofIffSLT2009,pages152-159·")。[0209](4)使用了扭曲模型的基于短語(yǔ)的SMT(PBMTd)(參見(jiàn)"IsaoGoto,MasaoUtiyama,EiichiroSumita,AkihiroTamura,andSadaoKurohashi.2013b.Distortionmodelconsideringrichcontextforstatisticalmachinetranslation.InProceedingsofthe51thAnnualMeetingoftheAssociationforComputationalLinguistics,SofiajBulgariajAugust-AssociationforComputationalLinguistics·',)。[0210](5)未使用句法解析器的預(yù)排序方法(LADER)(參見(jiàn)"GrahamNeubig,Taroffatanabe,andShinsukeMori.2012.Inducingadiscriminativeparsertooptimizemachinetranslationreordering.InProceedingsofthe2012JointConferenceonEmpiricalMethodsinNaturalLanguageProcessingandComputationalNaturalLanguageLearning,pages843-853,JejuIslandjKoreajJuly-AssociationforComputationalLinguistics·',)。[0211]對(duì)PBMTL、HPBMT、SBMT以及LADER使用了Moses。另外,對(duì)PBMTd使用了具有扭曲模型的Moses解碼器以及兼容性的內(nèi)部的標(biāo)準(zhǔn)的基于短語(yǔ)的SMT。[0212]使用全部的數(shù)據(jù)構(gòu)建了MSD雙方向單詞排序模型,并將其用于翻譯模型的構(gòu)建。此外,關(guān)于MSD雙方向單詞排序模型,參見(jiàn)Moses解碼器的說(shuō)明書(shū)。[0213]為了PBMTd的扭曲模型的學(xué)習(xí)數(shù)據(jù),使用了構(gòu)建翻譯模型所使用的數(shù)據(jù)中的最后的20萬(wàn)條源語(yǔ)言句。[0214]另外,為了LADER的預(yù)排序系統(tǒng),使用了Iader(參見(jiàn)"http://www·phontron·com/lader/")實(shí)裝。LADER的預(yù)排序模型的學(xué)習(xí)數(shù)據(jù)是與用于本方法的預(yù)排序模型的學(xué)習(xí)數(shù)據(jù)相同的20萬(wàn)條源語(yǔ)言句。日語(yǔ)的POS標(biāo)簽是通過(guò)MeCab生成的。在LADER的預(yù)排序模型的學(xué)習(xí)中,反復(fù)進(jìn)行了100次重復(fù)學(xué)習(xí)。[0215]將PBMTl的扭曲閾值設(shè)為20。對(duì)用于HPBMT和SBMT的最大圖跨度(chartspan)沒(méi)有限制。關(guān)于最大圖跨度,參見(jiàn)Moses解碼器的說(shuō)明書(shū)。另外,將LADER的扭曲閾值設(shè)為6。將默認(rèn)值設(shè)為在其他系統(tǒng)中使用的參數(shù)。[0216]在以上條件的基礎(chǔ)上,區(qū)分大寫(xiě)字母和小寫(xiě)字母,并使用BLEU_4(參見(jiàn)"KishorePapineni,SalimRoukos,Toddffard,andWeiJingZhu·2002·Bleu:aMethodforAutomaticEvaluationofMachineTranslation.InProceedingsofACL2002,pages311-318·")和RIBESvl.01(參見(jiàn)"HidekiIsozaki,TsutomuHirao,KevinDuh,KatsuhitoSudoh,andHajimeTsukada.2010.AutomaticEvaluationofTranslationQualityforDistantLanguagePairs.InProceedingsofthe2010ConferenceonEmpiricalMethodsinNaturalLanguageProcessing,pages944-952·")對(duì)翻譯質(zhì)量進(jìn)行了評(píng)價(jià)。圖15中示出了該翻譯質(zhì)量的評(píng)價(jià)結(jié)果。[0217]在圖15中,對(duì)使用解析器的方法進(jìn)行了檢查。另外,對(duì)預(yù)排序的方法進(jìn)行了檢查。另外,圖15中記載了使用NTCIR-9以及NTCIR-IO的各數(shù)據(jù)時(shí)的、各方法中的RIBES的分?jǐn)?shù)和BLEU的分?jǐn)?shù)。[0218]根據(jù)圖15可知,與其他方法相比,在提案的本方法(翻譯裝置2的方法)中記錄了最好的分?jǐn)?shù),比較優(yōu)異。[0219]此外,RIBES對(duì)全局的單詞順序敏感,BLEU對(duì)局部的單詞順序敏感。而且,通過(guò)本實(shí)驗(yàn)確認(rèn)到,本方法對(duì)全局的單詞順序以及局部的單詞順序有效。[0220]在本實(shí)驗(yàn)中,將本方法(PROPOSED)與不使用解析器而同時(shí)進(jìn)行單詞選擇和排序的其他三個(gè)方法(PBMTl、HPBMT、PBMTd)進(jìn)行了比較。其結(jié)果是,如圖15所示,在NTCIR-9和NTCIR-IO二者的數(shù)據(jù)中,以及在RIBES和BLEU二者的分?jǐn)?shù)中,本方法高于其他三個(gè)方法。這些結(jié)果表明,與不使用句法解析器而同時(shí)進(jìn)行單詞選擇和排序的方法相比,預(yù)排序更有效。[0221]接下來(lái),在本實(shí)驗(yàn)中,將本方法(PROPOSED)與使用目標(biāo)語(yǔ)言的句法解析器的方法(SBMT)進(jìn)行了比較。其結(jié)果是,如圖15所示,在NTCIR-9和NTCIR-IO二者的數(shù)據(jù)中,以及在RIBES和BLEU二者的分?jǐn)?shù)中,本方法高于SBMT的方法。這些結(jié)果表明,與使用目標(biāo)語(yǔ)言的句法解析器同時(shí)進(jìn)行單詞選擇和排序的方法相比,預(yù)排序更有效。[0222]最后,在本實(shí)驗(yàn)中,將本方法(PROPOSED)與未使用句法解析器的預(yù)排序的方法(LADER)進(jìn)行了比較。其結(jié)果是,如圖15所示,在NTCIR-9和NTCIR-IO二者的數(shù)據(jù)中,以及在RIBES和BLEU二者的分?jǐn)?shù)中,本方法高于LADER的方法。這些結(jié)果表明,為了預(yù)排序,使用句法解析器比不使用句法解析器更有效。[0223]如上所述,根據(jù)本實(shí)施方式,通過(guò)基于使用目標(biāo)語(yǔ)言的句法解析器的預(yù)排序的機(jī)器翻譯,能夠進(jìn)行高精度的翻譯。[0224]此外,實(shí)現(xiàn)本實(shí)施方式中的翻譯裝置2的軟件是如下的程序。即,該程序?yàn)?,?jì)算機(jī)可訪問(wèn)的存儲(chǔ)介質(zhì)具備:二叉樹(shù)存儲(chǔ)部,存儲(chǔ)有如權(quán)利要求1至權(quán)利要求3中任一項(xiàng)所述的學(xué)習(xí)裝置保存的、具有的一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)的源語(yǔ)言句的一個(gè)以上的二叉樹(shù);以及要素對(duì)存儲(chǔ)部,可存儲(chǔ)一個(gè)以上的要素對(duì),所述一個(gè)以上的要素對(duì)是源語(yǔ)言的要素與目標(biāo)語(yǔ)言的要素的對(duì);該程序使計(jì)算機(jī)發(fā)揮如下部件的功能:受理部,受理源語(yǔ)言句;附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)取得部,使用所述源語(yǔ)言句的一個(gè)以上的二叉樹(shù),基于所述受理部受理的源語(yǔ)言句所具有的兩個(gè)以上的各要素,取得一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu);翻譯排序部,當(dāng)所述一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)所具有的排序標(biāo)注是表示目標(biāo)語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序與源語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序不同的排序標(biāo)注時(shí),執(zhí)行對(duì)與該排序標(biāo)注相對(duì)應(yīng)的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)所具有的兩個(gè)子節(jié)點(diǎn)的順序進(jìn)行排序的處理,從而取得排序后的源語(yǔ)言的兩個(gè)以上的要素;檢索部,從所述要素對(duì)存儲(chǔ)部中取得與所述翻譯排序部取得的源語(yǔ)言的兩個(gè)以上的各要素相對(duì)應(yīng)的目標(biāo)語(yǔ)言的兩個(gè)以上的要素;以及輸出部,輸出由所述檢索部取得的兩個(gè)以上的要素組成的目標(biāo)語(yǔ)言句。[0225]在上述程序中,優(yōu)選為,構(gòu)成所述一個(gè)以上的源語(yǔ)言句的二叉樹(shù)的、一個(gè)以上的各附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)所具有的源語(yǔ)言的要素與POS標(biāo)簽相互對(duì)應(yīng);并使計(jì)算機(jī)進(jìn)一步發(fā)揮作為詞素解析部的功能,所述詞素解析部對(duì)所述受理部受理的源語(yǔ)言句進(jìn)行詞素解析,從而取得與POS標(biāo)簽相互對(duì)應(yīng)的兩個(gè)以上的要素;所述附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)取得部使用所述一個(gè)以上的源語(yǔ)言句的二叉樹(shù),基于與所述POS標(biāo)簽相互對(duì)應(yīng)的兩個(gè)以上的要素,取得一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)。[0226]另外,圖16示出了執(zhí)行在本發(fā)明中描述的程序并實(shí)現(xiàn)上述各種實(shí)施方式的學(xué)習(xí)裝置1或者翻譯裝置2的計(jì)算機(jī)的外觀。上述實(shí)施方式可通過(guò)計(jì)算機(jī)硬件以及在該計(jì)算機(jī)硬件上執(zhí)行的計(jì)算機(jī)程序來(lái)實(shí)現(xiàn)。圖16是該計(jì)算機(jī)系統(tǒng)300的概觀圖,圖17是系統(tǒng)300的框圖。[0227]在圖16中,計(jì)算機(jī)系統(tǒng)300具備包括CD-ROM驅(qū)動(dòng)器的計(jì)算機(jī)301、鍵盤(pán)302、鼠標(biāo)303以及顯示器304。[0228]在圖17中,計(jì)算機(jī)301除了包括CD-ROM驅(qū)動(dòng)器3012以外,還包括:MHJ3013;總線3014,與1〇^3013、00-1?01驅(qū)動(dòng)器3012連接;冊(cè)13015,用于存儲(chǔ)開(kāi)機(jī)引導(dǎo)程序等程序;RAM3016,與MPU3013連接,用于臨時(shí)存儲(chǔ)應(yīng)用程序的指令并提供臨時(shí)存儲(chǔ)空間;以及硬盤(pán)3017,用于存儲(chǔ)應(yīng)用程序、系統(tǒng)程序以及數(shù)據(jù)。在此,雖未圖示,但是計(jì)算機(jī)301還可以進(jìn)一步包括提供用于與LAN連接的網(wǎng)卡。[0229]使計(jì)算機(jī)系統(tǒng)300執(zhí)行上述實(shí)施方式的學(xué)習(xí)裝置等的功能的程序可以存儲(chǔ)在CD-R0M3101中,將其插入到⑶-ROM驅(qū)動(dòng)器3012中,并進(jìn)一步傳送到硬盤(pán)3017中。取而代之地,程序也可以經(jīng)由未圖示的網(wǎng)絡(luò)被發(fā)送給計(jì)算機(jī)301,并被存儲(chǔ)到硬盤(pán)3017中。程序在執(zhí)行時(shí)被加載到RAM3016中。也可以從⑶-R0M3101或者網(wǎng)絡(luò)直接加載程序。[0230]程序可以不必包含使計(jì)算機(jī)301執(zhí)行上述實(shí)施方式的學(xué)習(xí)裝置等的功能的操作系統(tǒng)(OS)或者第三方程序等。程序也可以只包含在被控制的狀態(tài)下調(diào)用適當(dāng)?shù)墓δ?模塊)以獲得期望結(jié)果的指令部分。計(jì)算機(jī)系統(tǒng)300如何工作是眾所周知的,因而省略詳細(xì)說(shuō)明。[0231]另外,執(zhí)行上述程序的計(jì)算機(jī)可以是一個(gè),也可以是多個(gè)。即,可以進(jìn)行集中處理,或者也可以進(jìn)行分散處理。[0232]另外,在上述各實(shí)施方式中,各處理和各功能可以通過(guò)由單一的裝置或者單一的系統(tǒng)進(jìn)行集中處理來(lái)實(shí)現(xiàn),或者也可以通過(guò)由多個(gè)裝置進(jìn)行分散處理來(lái)實(shí)現(xiàn)。[0233]此外,本發(fā)明并不限定于上述實(shí)施方式,在實(shí)施階段,在不脫離其宗旨的范圍內(nèi),能夠進(jìn)行各種變形,這些變形當(dāng)然也包含在本發(fā)明的保護(hù)范圍內(nèi)。[0234]進(jìn)一步,在所述實(shí)施方式中包含各種階段的發(fā)明,通過(guò)適當(dāng)組合公開(kāi)的多個(gè)構(gòu)成要素,能夠提取出各種發(fā)明。例如,在即使從實(shí)施方式所示的全部構(gòu)成要素中刪除若干個(gè)構(gòu)成要素,也能夠解決記載于"發(fā)明所要解決的技術(shù)問(wèn)題"章節(jié)中的技術(shù)問(wèn)題,并能夠獲得記載于"發(fā)明效果"章節(jié)中的效果的情況下,刪除了該構(gòu)成要素的結(jié)構(gòu)能夠作為發(fā)明被提取出來(lái)。[0235]產(chǎn)業(yè)上的利用可能性[0236]如上所述,本發(fā)明所涉及的學(xué)習(xí)裝置具有能夠進(jìn)行高精度的翻譯的效果,作為機(jī)器翻譯裝置等是有用的。[0237]附圖標(biāo)記說(shuō)明[0238]1:學(xué)習(xí)裝置[0239]2:翻譯裝置[0240]10:存儲(chǔ)介質(zhì)[0241]11:對(duì)譯語(yǔ)料庫(kù)[0242]12、22:要素對(duì)存儲(chǔ)部[0243]13:統(tǒng)計(jì)模型存儲(chǔ)部[0244]14:句法解析部[0245]15:源語(yǔ)言要素取得部[0246]16、25:源語(yǔ)言部分結(jié)構(gòu)取得部[0247]17:排序部[0248]18:標(biāo)注賦予部[0249]19:模型構(gòu)建部[0250]20:保存部[0251]21:二叉樹(shù)存儲(chǔ)部[0252]23:受理部[0253]24:詞素解析部[0254]26:翻譯排序部[0255]27:檢索部[0256]28:輸出部[0257]161:源語(yǔ)言部分結(jié)構(gòu)取得單元[0258]162:部分結(jié)構(gòu)補(bǔ)充單元【主權(quán)項(xiàng)】1.一種學(xué)習(xí)裝置,具備:對(duì)譯語(yǔ)料庫(kù),可存儲(chǔ)具有源語(yǔ)言句和該源語(yǔ)言句的翻譯結(jié)果即目標(biāo)語(yǔ)言句的一個(gè)以上的對(duì)譯句;要素對(duì)存儲(chǔ)部,可存儲(chǔ)一個(gè)以上的要素對(duì),所述一個(gè)以上的要素對(duì)是源語(yǔ)言的要素與目標(biāo)語(yǔ)言的要素的對(duì);句法解析部,取得目標(biāo)語(yǔ)言句的二叉樹(shù),所述目標(biāo)語(yǔ)言句的二叉樹(shù)是對(duì)所述一個(gè)以上的各對(duì)譯句所具有的目標(biāo)語(yǔ)言句進(jìn)行句法解析的結(jié)果,并具有一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu),所述一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)表示構(gòu)成目標(biāo)語(yǔ)言句的兩個(gè)以上的要素的順序,并且包含具有短語(yǔ)標(biāo)注的父節(jié)點(diǎn)以及兩個(gè)子節(jié)點(diǎn),所述兩個(gè)子節(jié)點(diǎn)是該父節(jié)點(diǎn)的子節(jié)點(diǎn),且具有目標(biāo)語(yǔ)言的短語(yǔ)標(biāo)注或者源語(yǔ)言的POS標(biāo)簽或者源語(yǔ)言的要素;源語(yǔ)言要素取得部,從所述要素對(duì)存儲(chǔ)部的一個(gè)以上的要素對(duì)中取得源語(yǔ)言的一個(gè)以上的要素,所述源語(yǔ)言的一個(gè)以上的要素是構(gòu)成與所述目標(biāo)語(yǔ)言句相對(duì)應(yīng)的源語(yǔ)言句的一個(gè)以上的要素,且與所述目標(biāo)語(yǔ)言句的二叉樹(shù)所具有的一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)的終端子節(jié)點(diǎn)即目標(biāo)語(yǔ)言的要素相對(duì)應(yīng);源語(yǔ)言部分結(jié)構(gòu)取得部,對(duì)構(gòu)成所述源語(yǔ)言句的源語(yǔ)言的一個(gè)以上的要素應(yīng)用由所述目標(biāo)語(yǔ)言句的二叉樹(shù)所具有的一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)表示的結(jié)構(gòu),從而取得一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu),所述一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)表示構(gòu)成所述源語(yǔ)言句的兩個(gè)以上的要素的順序,并包含具有短語(yǔ)標(biāo)注的父節(jié)點(diǎn)以及兩個(gè)子節(jié)點(diǎn),所述兩個(gè)子節(jié)點(diǎn)是該父節(jié)點(diǎn)的子節(jié)點(diǎn),且具有短語(yǔ)標(biāo)注或者源語(yǔ)言的POS標(biāo)簽;標(biāo)注賦予部,將排序標(biāo)注賦予給所述一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu),從而取得一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),所述排序標(biāo)注是能夠區(qū)別如下源語(yǔ)言部分結(jié)構(gòu)的標(biāo)注,即,目標(biāo)語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序與對(duì)應(yīng)的源語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序不同的源語(yǔ)言部分結(jié)構(gòu)、以及目標(biāo)語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序與對(duì)應(yīng)的源語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序相同的源語(yǔ)言部分結(jié)構(gòu);模型構(gòu)建部,使用所述一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),構(gòu)建一個(gè)以上的句法解析模型,所述一個(gè)以上的句法解析模型具有表示附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)的出現(xiàn)容易度的概率信息;以及保存部,保存所述模型構(gòu)建部構(gòu)建的一個(gè)以上的句法解析模型。2.-種翻譯裝置,具備:二叉樹(shù)存儲(chǔ)部,存儲(chǔ)有如權(quán)利要求1所述的學(xué)習(xí)裝置保存的一個(gè)以上的句法解析模型;要素對(duì)存儲(chǔ)部,可存儲(chǔ)一個(gè)以上的要素對(duì),所述一個(gè)以上的要素對(duì)是源語(yǔ)言的要素與目標(biāo)語(yǔ)言的要素的對(duì);受理部,受理源語(yǔ)言句;附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)取得部,使用所述一個(gè)以上的句法解析模型,基于所述受理部受理的源語(yǔ)言句所具有的兩個(gè)以上的各要素,取得一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu);翻譯排序部,當(dāng)所述一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)所具有的排序標(biāo)注是表示目標(biāo)語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序與源語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序不同的排序標(biāo)注時(shí),執(zhí)行對(duì)與該排序標(biāo)注相對(duì)應(yīng)的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)所具有的兩個(gè)子節(jié)點(diǎn)的順序進(jìn)行排序的處理,從而取得排序后的源語(yǔ)言的兩個(gè)以上的要素;檢索部,從所述要素對(duì)存儲(chǔ)部中取得與所述排序后的源語(yǔ)言的兩個(gè)以上的各要素相對(duì)應(yīng)的目標(biāo)語(yǔ)言的兩個(gè)以上的要素;以及輸出部,輸出所述排序后的源語(yǔ)言的兩個(gè)以上的要素的順序與對(duì)應(yīng)的目標(biāo)語(yǔ)言的兩個(gè)以上的要素排列成相同順序的、由所述檢索部取得的目標(biāo)語(yǔ)言的兩個(gè)以上的要素組成的目標(biāo)語(yǔ)言句。3.-種學(xué)習(xí)方法,該學(xué)習(xí)方法通過(guò)句法解析部、源語(yǔ)言要素取得部、源語(yǔ)言部分結(jié)構(gòu)取得部、標(biāo)注賦予部、模型構(gòu)建部以及保存部實(shí)現(xiàn),在存儲(chǔ)介質(zhì)中具備:對(duì)譯語(yǔ)料庫(kù),可存儲(chǔ)具有源語(yǔ)言句和該源語(yǔ)言句的翻譯結(jié)果即目標(biāo)語(yǔ)言句的一個(gè)以上的對(duì)譯句;以及要素對(duì)存儲(chǔ)部,可存儲(chǔ)一個(gè)以上的要素對(duì),所述一個(gè)以上的要素對(duì)是源語(yǔ)言的要素與目標(biāo)語(yǔ)言的要素的對(duì),該學(xué)習(xí)方法具備:句法解析步驟,由所述句法解析部取得目標(biāo)語(yǔ)言句的二叉樹(shù),所述目標(biāo)語(yǔ)言句的二叉樹(shù)是對(duì)所述一個(gè)以上的各對(duì)譯句所具有的目標(biāo)語(yǔ)言句進(jìn)行句法解析的結(jié)果,并具有一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu),所述一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)表示構(gòu)成目標(biāo)語(yǔ)言句的兩個(gè)以上的要素的順序,并且包含具有短語(yǔ)標(biāo)注的父節(jié)點(diǎn)以及兩個(gè)子節(jié)點(diǎn),所述兩個(gè)子節(jié)點(diǎn)是該父節(jié)點(diǎn)的子節(jié)點(diǎn),且具有短語(yǔ)標(biāo)注或者目標(biāo)語(yǔ)言的要素;源語(yǔ)言要素取得步驟,由所述源語(yǔ)言要素取得部從所述要素對(duì)存儲(chǔ)部的一個(gè)以上的要素對(duì)中取得源語(yǔ)言的一個(gè)以上的要素,所述源語(yǔ)言的一個(gè)以上的要素是構(gòu)成與所述目標(biāo)語(yǔ)言句相對(duì)應(yīng)的源語(yǔ)言句的一個(gè)以上的要素,且與所述目標(biāo)語(yǔ)言句的二叉樹(shù)所具有的一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)的終端子節(jié)點(diǎn)即目標(biāo)語(yǔ)言的要素相對(duì)應(yīng);源語(yǔ)言部分結(jié)構(gòu)取得步驟,由所述源語(yǔ)言部分結(jié)構(gòu)取得部對(duì)構(gòu)成所述源語(yǔ)言句的源語(yǔ)言的一個(gè)以上的要素應(yīng)用由所述目標(biāo)語(yǔ)言句的二叉樹(shù)所具有的一個(gè)以上的目標(biāo)語(yǔ)言部分結(jié)構(gòu)表示的結(jié)構(gòu),從而取得一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu),所述一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu)表示構(gòu)成所述源語(yǔ)言句的兩個(gè)以上的要素的順序,并包含具有短語(yǔ)標(biāo)注的父節(jié)點(diǎn)以及兩個(gè)子節(jié)點(diǎn),所述兩個(gè)子節(jié)點(diǎn)是該父節(jié)點(diǎn)的子節(jié)點(diǎn),且具有短語(yǔ)標(biāo)注或者源語(yǔ)言的要素;標(biāo)注賦予步驟,由所述標(biāo)注賦予部將排序標(biāo)注賦予給所述一個(gè)以上的源語(yǔ)言部分結(jié)構(gòu),從而取得一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),所述排序標(biāo)注是能夠區(qū)別如下源語(yǔ)言部分結(jié)構(gòu)的標(biāo)注,即,目標(biāo)語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序與對(duì)應(yīng)的源語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序不同的源語(yǔ)言部分結(jié)構(gòu)、以及目標(biāo)語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序與對(duì)應(yīng)的源語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序相同的源語(yǔ)言部分結(jié)構(gòu);模型構(gòu)建步驟,由所述模型構(gòu)建部使用所述一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu),構(gòu)建一個(gè)以上的句法解析模型,所述一個(gè)以上的句法解析模型具有表示附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)的出現(xiàn)容易度的概率信息;以及保存步驟,由所述保存部保存在所述模型構(gòu)建步驟中構(gòu)建的一個(gè)以上的句法解析模型。4.一種翻譯方法,該翻譯方法通過(guò)受理部、附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)取得部、翻譯排序部、檢索部以及輸出部實(shí)現(xiàn),在存儲(chǔ)介質(zhì)中具備:二叉樹(shù)存儲(chǔ)部,存儲(chǔ)有如權(quán)利要求1所述的學(xué)習(xí)裝置保存的一個(gè)以上的句法解析模型;以及要素對(duì)存儲(chǔ)部,可存儲(chǔ)一個(gè)以上的要素對(duì),所述一個(gè)以上的要素對(duì)是源語(yǔ)言的要素與目標(biāo)語(yǔ)言的要素的對(duì),該翻譯方法具備:受理步驟,由所述受理部受理源語(yǔ)言句;附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)取得步驟,由所述附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)取得部使用所述句法解析模型,基于在所述受理步驟中受理的源語(yǔ)言句所具有的兩個(gè)以上的各要素,取得一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu);翻譯排序步驟,當(dāng)所述一個(gè)以上的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)所具有的排序標(biāo)注是表示目標(biāo)語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序與源語(yǔ)言部分結(jié)構(gòu)中包含的兩個(gè)子節(jié)點(diǎn)的順序不同的排序標(biāo)注時(shí),由所述翻譯排序部執(zhí)行對(duì)與該排序標(biāo)注相對(duì)應(yīng)的附標(biāo)注源語(yǔ)言部分結(jié)構(gòu)所具有的兩個(gè)子節(jié)點(diǎn)的順序進(jìn)行排序的處理,從而取得排序后的源語(yǔ)言的兩個(gè)以上的要素;檢索步驟,由所述檢索部從所述要素對(duì)存儲(chǔ)部中取得與在所述翻譯排序步驟中取得的源語(yǔ)言的兩個(gè)以上的各要素相對(duì)應(yīng)的目標(biāo)語(yǔ)言的兩個(gè)以上的要素;以及輸出步驟,由所述輸出部輸出由在所述檢索步驟中取得的兩個(gè)以上的要素組成的目標(biāo)語(yǔ)言句?!疚臋n編號(hào)】G06F17/27GK105849718SQ201480064778【公開(kāi)日】2016年8月10日【申請(qǐng)日】2014年12月4日【發(fā)明人】后藤功雄【申請(qǐng)人】國(guó)立研究開(kāi)發(fā)法人情報(bào)通信研究機(jī)構(gòu)