1.一種基于人工智能的翻譯方法,其特征在于,包括以下步驟:
獲取用戶輸入的從源語言翻譯至目標語言的待翻譯文本,所述待翻譯文本中包括目標語言詞語,以及源語言詞語;
將所述待翻譯文本輸入預(yù)先訓練的目標語言和源語言的翻譯模型,確定翻譯所述源語言詞語的各候選詞語,以及所述各候選詞語的置信度;
利用所述各候選詞語分別替換所述待翻譯文本中對應(yīng)的源語言詞語,與所述目標語言詞語組合,得到各候選譯文;
將所述候選譯文輸入預(yù)先訓練的所述目標語言的語言模型,預(yù)測所述候選譯文采用所述候選詞語翻譯后,形成通順文本的語言概率;
根據(jù)采用候選詞語翻譯得到的候選譯文的語言概率,以及候選詞語的置信度,從各候選詞語中選擇目標詞語進行推薦。
2.根據(jù)權(quán)利要求1所述的基于人工智能的翻譯方法,其特征在于,所述根據(jù)采用候選詞語翻譯得到的候選譯文的語言概率,以及候選詞語的置信度,從各候選詞語中選擇目標詞語進行推薦,包括:
針對每一個候選詞語,將所述候選詞語翻譯得到的候選譯文的語言概率和所述候選詞語的置信度進行加權(quán)求和,得到所述候選詞語的總概率;
依據(jù)所述總概率對各候選詞語進行排序,從各候選詞語中選擇目標詞語進行推薦。
3.根據(jù)權(quán)利要求2所述的基于人工智能的翻譯方法,其特征在于,所述目標詞語的個數(shù)為至少兩個;所述選擇目標詞語進行推薦,包括:
將所選擇的至少兩個目標詞語,按照所述總概率由大到小的順序依次顯示在對應(yīng)源語言詞語的下方;其中,在每一個目標詞語旁,以進度條形式指示所述目標詞語的總概率。
4.根據(jù)權(quán)利要求1-3任一項所述的基于人工智能的翻譯方法,其特征在于,所述將所述待翻譯文本輸入預(yù)先訓練的目標語言和源語言的翻譯模型,確定翻譯所述源語言詞語的各候選詞語,以及所述各候選詞語的置信度之前,還包括:
利用所述目標語言和所述源語言的雙語料庫,對所述翻譯模型進行訓練,以確定具有語義對應(yīng)關(guān)系的源語言詞語和目標語言詞語,以及所述目標語言詞語準確翻譯所述源語言詞語的置信度。
5.根據(jù)權(quán)利要求4所述的基于人工智能的翻譯方法,其特征在于,所述置信度是根據(jù)在所述雙語料庫中,采用所述目標語言詞語翻譯所述源語言詞語的次數(shù),占翻譯所述源語言詞語的總次數(shù)之比。
6.根據(jù)權(quán)利要求1-3任一項所述的基于人工智能的翻譯方法,其特征在于,所述將所述候選譯文輸入預(yù)先訓練的所述目標語言的語言模型,預(yù)測所述候選譯文采用所述候選詞語翻譯后,形成通順文本的語言概率之前,還包括:
利用所述目標語言的語料庫,對所述目標語言的語言模型進行訓練;所述語料庫是根據(jù)所述目標語言的學術(shù)會議、期刊和/或論文進行構(gòu)建的。
7.根據(jù)權(quán)利要求6所述的基于人工智能的翻譯方法,其特征在于,所述語言模型為n-gram語言模型或神經(jīng)網(wǎng)絡(luò)語言模型。
8.一種基于人工智能的翻譯裝置,其特征在于,包括:
獲取模塊,用于獲取用戶輸入的從源語言翻譯至目標語言的待翻譯文本,所述待翻譯文本中包括目標語言詞語,以及源語言詞語;
翻譯模塊,用于將所述待翻譯文本輸入預(yù)先訓練的目標語言和源語言的翻譯模型,確定翻譯所述源語言詞語的各候選詞語,以及所述各候選詞語的置信度;
組合模塊,用于利用所述各候選詞語分別替換所述待翻譯文本中對應(yīng)的源語言詞語,與所述目標語言詞語組合,得到各候選譯文;
預(yù)測模塊,用于將所述候選譯文輸入預(yù)先訓練的所述目標語言的語言模型,預(yù)測所述候選譯文采用所述候選詞語翻譯后,形成通順文本的語言概率;
推薦模塊,用于根據(jù)采用候選詞語翻譯得到的候選譯文的語言概率,以及候選詞語的置信度,從各候選詞語中選擇目標詞語進行推薦。
9.根據(jù)權(quán)利要求8所述的基于人工智能的翻譯裝置,其特征在于,所述推薦模塊,包括:
計算單元,用于針對每一個候選詞語,將所述候選詞語翻譯得到的候選譯文的語言概率和所述候選詞語的置信度進行加權(quán)求和,得到所述候選詞語的總概率;
推薦單元,用于依據(jù)所述總概率對各候選詞語進行排序,從各候選詞語中選擇目標詞語進行推薦。
10.根據(jù)權(quán)利要求9所述的基于人工智能的翻譯裝置,其特征在于,所述目標詞語的個數(shù)為至少兩個;所述推薦單元,具體用于:
將所選擇的至少兩個目標詞語,按照所述總概率由大到小的順序依次顯示在對應(yīng)源語言詞語的下方;其中,在每一個目標詞語旁,以進度條形式指示所述目標詞語的總概率。
11.根據(jù)權(quán)利要求8-10任一項所述的基于人工智能的翻譯裝置,其特征在于,所述裝置,還包括:
翻譯模型訓練模塊,用于利用所述目標語言和所述源語言的雙語料庫,對所述翻譯模型進行訓練,以確定具有語義對應(yīng)關(guān)系的源語言詞語和目標語言詞語,以及所述目標語言詞語準確翻譯所述源語言詞語的置信度。
12.根據(jù)權(quán)利要求11所述的基于人工智能的翻譯裝置,其特征在于,所述置信度是根據(jù)在所述雙語料庫中,采用所述目標語言詞語翻譯所述源語言詞語的次數(shù),占翻譯所述源語言詞語的總次數(shù)之比。
13.根據(jù)權(quán)利要求8-10任一項所述的基于人工智能的翻譯裝置,其特征在于,所述裝置,還包括:
語言模型訓練模塊,用于利用所述目標語言的語料庫,對所述目標語言的語言模型進行訓練;所述語料庫是根據(jù)所述目標語言的學術(shù)會議、期刊和/或論文進行構(gòu)建的。
14.根據(jù)權(quán)利要求13所述的基于人工智能的翻譯裝置,其特征在于,所述語言模型為n-gram語言模型或神經(jīng)網(wǎng)絡(luò)語言模型。