1.一種實(shí)現(xiàn)領(lǐng)域自適應(yīng)的統(tǒng)計(jì)機(jī)器翻譯方法,其特征是:包括以下步驟,
a、將所有的中英對照的名詞及名詞短語依照現(xiàn)有的知識體系,建立電腦可識別的知識體系樹狀結(jié)構(gòu)圖,所述的知識體系樹狀結(jié)構(gòu)圖包括若干依次排列且逐層細(xì)分的層級,層級的標(biāo)號從1開始直至n;所述的中英對照的名詞及名詞短語分為通用名詞和行業(yè)名詞,通用名詞屬于第1層,行業(yè)名詞從第2層開始按領(lǐng)域逐層細(xì)分;
所述的知識體系樹狀結(jié)構(gòu)圖包括所有的由大及小的領(lǐng)域名稱以及該領(lǐng)域內(nèi)的名詞及名詞短語,該領(lǐng)域內(nèi)的名詞及名詞短語設(shè)置在該領(lǐng)域名稱的下屬層級內(nèi),領(lǐng)域名稱形成領(lǐng)域位置點(diǎn);由此得到所有的中英對照的名詞及名詞短語具有它對應(yīng)的知識樹層級;
b、建立電腦可識別的中英對照的名詞及名詞短語數(shù)據(jù)庫,數(shù)據(jù)庫如下:
由此得到所有的中英對照的名詞及名詞短語具有它對應(yīng)的領(lǐng)域影響權(quán)重;
c、計(jì)算每個領(lǐng)域位置點(diǎn)的領(lǐng)域影響權(quán)重之和;
d、比較各個領(lǐng)域位置點(diǎn)的領(lǐng)域影響權(quán)重之和,得出最高領(lǐng)域影響權(quán)重之和的領(lǐng)域位置點(diǎn),即該段文字所相關(guān)的知識領(lǐng)域;
e、在該知識領(lǐng)域內(nèi),根據(jù)名詞詞典,確定對應(yīng)的翻譯詞匯。
2.根據(jù)權(quán)利要求1所述的實(shí)現(xiàn)領(lǐng)域自適應(yīng)的統(tǒng)計(jì)機(jī)器翻譯方法,其特征是:在步驟b中,針對一詞多義的名詞,則將該名詞分布在不同意義所針對的領(lǐng)域位置點(diǎn)上,且該名詞在每個領(lǐng)域位置點(diǎn)的領(lǐng)域影響權(quán)重為(n+k)/x,x為該名詞涉及的領(lǐng)域數(shù)量。
3.根據(jù)權(quán)利要求1所述的實(shí)現(xiàn)領(lǐng)域自適應(yīng)的統(tǒng)計(jì)機(jī)器翻譯方法,其特征是:所述的k=-0.5。