1.一種多語(yǔ)言自動(dòng)文摘方法,其特征在于,包括以下步驟:
步驟101,獲取多個(gè)目標(biāo)語(yǔ)言文檔中的多個(gè)謂詞論元結(jié)構(gòu);
步驟102,對(duì)所述多個(gè)謂詞論元結(jié)構(gòu)中的每一個(gè)謂詞論元進(jìn)行重要性打分;
步驟103,根據(jù)所述每一個(gè)謂詞論元的重要性得分,生成目標(biāo)語(yǔ)言摘要。
2.根據(jù)權(quán)利要求1所述的多語(yǔ)言自動(dòng)文摘方法,其特征在于,對(duì)所述謂多個(gè)詞論元結(jié)構(gòu)中的每一個(gè)謂詞論元進(jìn)行重要性打分,包括如下步驟:
步驟201,計(jì)算組成所述謂詞論元的詞向量的加權(quán)平均數(shù),得到所述謂詞論元的短語(yǔ)向量;
步驟202,根據(jù)所述謂詞論元的短語(yǔ)向量計(jì)算所述謂詞論元結(jié)構(gòu)中謂詞論元的相似度;
步驟203,利用所述相似度獲取語(yǔ)義相同的謂詞論元;
步驟204,根據(jù)所述相似度計(jì)算謂詞論元的重要性得分。
3.根據(jù)權(quán)利要求2所述的多語(yǔ)言自動(dòng)文摘方法,其特征在于,所述根據(jù)所述謂詞論元的短語(yǔ)向量計(jì)算所述謂詞論元結(jié)構(gòu)中謂詞論元的相似度,具體包括:
在每一目標(biāo)語(yǔ)言文檔中分別任選一個(gè)謂詞論元,每?jī)蓚€(gè)謂詞論元根據(jù)各自的短語(yǔ)向量計(jì)算該兩個(gè)間的相似度,直至所有目標(biāo)語(yǔ)言文檔中的所有個(gè)謂詞論元均任意兩個(gè)匹配計(jì)算完相似度為止。
4.根據(jù)權(quán)利要求2或3所述的多語(yǔ)言自動(dòng)文摘方法,其特征在于,所述利用所述相似度獲取語(yǔ)義相同的謂詞論元,具體包括:
當(dāng)所述相似度大于預(yù)設(shè)閾值時(shí),確認(rèn)所述相似度所屬的謂詞論元語(yǔ)義相同。
5.根據(jù)權(quán)利要求2所述的多語(yǔ)言自動(dòng)文摘方法,其特征在于,在根據(jù)所述相似度計(jì)算謂詞論元的重要性得分時(shí),通過(guò)如下計(jì)算公式:
利用上述兩個(gè)公式分別進(jìn)行迭代計(jì)算,直到迭代計(jì)算結(jié)果穩(wěn)定時(shí)得到各謂詞論元的重要性得分;
其中,ci和cj為任意兩個(gè)謂詞論元,u(ci)為ci的重要性得分,u(cj)為cj的重要性得分,μ是平滑因子,Mij表示ci與cj的相似度,N為謂詞論元總數(shù)。
6.根據(jù)權(quán)利要求1所述的多語(yǔ)言自動(dòng)文摘方法,其特征在于,所述根據(jù)所述每一個(gè)謂詞論元的重要性得分,生成目標(biāo)語(yǔ)言摘要,具體包括:
根據(jù)每一個(gè)謂詞論元的重要性得分、謂詞論元生成目標(biāo)語(yǔ)言摘要的目標(biāo)函數(shù)以及約束集合,選取符合的謂詞論元集合;
將所述謂詞論元集合中的各個(gè)謂詞論元構(gòu)成所述目標(biāo)語(yǔ)言摘要。
7.根據(jù)權(quán)利要求1所述的多語(yǔ)言自動(dòng)文摘方法,其特征在于,所述步驟101之前還包括:
對(duì)多個(gè)請(qǐng)求語(yǔ)言文檔進(jìn)行翻譯,得到多個(gè)統(tǒng)一為目標(biāo)語(yǔ)言的目標(biāo)語(yǔ)言文檔。