本發(fā)明涉及語言處理技術(shù)領(lǐng)域,尤其涉及一種基于人工智能的翻譯方法和裝置。
背景技術(shù):
人工智能(Artificial Intelligence),英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括機(jī)器人、語音識別、圖像識別、自然語言處理和專家系統(tǒng)等。
在現(xiàn)有技術(shù)中對,語言進(jìn)行翻譯時,只能由翻譯軟件將整個句子從源語言翻譯為目標(biāo)語言。但由于目前的翻譯軟件還不能夠做到完全準(zhǔn)確的翻譯,因此,需要用戶針對翻譯軟件所翻譯的文本進(jìn)行改動,尤其是在翻譯軟件所翻譯的文本采用的句式與用戶所需要的句式不同時,用戶所需進(jìn)行的改動就更多。同時,整句翻譯的方式,還可能會損失掉用戶想要由目標(biāo)語言表達(dá)的內(nèi)容,翻譯的準(zhǔn)確度也不高,因此,現(xiàn)有技術(shù)中的翻譯方法,不僅翻譯方式不夠靈活,不能夠滿足用戶的翻譯需求,而且翻譯的準(zhǔn)確度也不高。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
為此,本發(fā)明的第一個目的在于提出一種基于人工智能的翻譯方法和裝置,以實(shí)現(xiàn)提高翻譯準(zhǔn)確度,增加翻譯方式的靈活性,以滿足用戶的翻譯需求。
本發(fā)明的第二個目的在于提出一種基于人工智能的翻譯裝置。
本發(fā)明的第三個目的在于提出另一種基于人工智能的翻譯裝置。
本發(fā)明的第四個目的在于提出一種非臨時性計(jì)算機(jī)可讀存儲介質(zhì)。
本發(fā)明的第五個目的在于提出一種計(jì)算機(jī)程序產(chǎn)品。
為達(dá)上述目的,本發(fā)明第一方面實(shí)施例提出了一種基于人工智能的翻譯方法,包括:
獲取用戶輸入的從源語言翻譯至目標(biāo)語言的待翻譯文本,所述待翻譯文本中包括目標(biāo)語言詞語,以及源語言詞語;
將所述待翻譯文本輸入預(yù)先訓(xùn)練的目標(biāo)語言和源語言的翻譯模型,確定翻譯所述源語言詞語的各候選詞語,以及所述各候選詞語的置信度;
利用所述各候選詞語分別替換所述待翻譯文本中對應(yīng)的源語言詞語,與所述目標(biāo)語言詞語組合,得到各候選譯文;
將所述候選譯文輸入預(yù)先訓(xùn)練的所述目標(biāo)語言的語言模型,預(yù)測所述候選譯文采用所述候選詞語翻譯后,形成通順文本的語言概率;
根據(jù)采用候選詞語翻譯得到的候選譯文的語言概率,以及候選詞語的置信度,從各候選詞語中選擇目標(biāo)詞語進(jìn)行推薦。
本發(fā)明實(shí)施例的基于人工智能的翻譯方法,通過獲取用戶輸入的從源語言翻譯至目標(biāo)語言的待翻譯文本,其中,待翻譯文本中包括目標(biāo)語言詞語,以及源語言詞語,將待翻譯文本輸入預(yù)先訓(xùn)練的目標(biāo)語言和源語言的翻譯模型,確定翻譯源語言詞語的各候選詞語,以及各候選詞語的置信度,將各候選詞語分別與目標(biāo)語言詞語組合,得到各候選譯文,進(jìn)而將候選譯文輸入預(yù)先訓(xùn)練的目標(biāo)語言的語言模型,預(yù)測候選譯文采用該候選詞語后,形成通順文本的語言概率,根據(jù)采用候選詞語翻譯得到的候選譯文的語言概率,以及候選詞語的置信度,從各候選詞語中選擇目標(biāo)詞語進(jìn)行推薦。由于用戶可以在不確定翻譯是否準(zhǔn)確時,通過輸入確定準(zhǔn)確的目標(biāo)語言詞語,以及輸入一部分不確定翻譯是否準(zhǔn)確的源語言詞語,解決現(xiàn)有技術(shù)中翻譯方式不靈活的技術(shù)問題。
為達(dá)上述目的,本發(fā)明第二方面實(shí)施例提出了一種基于人工智能的翻譯裝置,包括:
獲取模塊,用于獲取用戶輸入的從源語言翻譯至目標(biāo)語言的待翻譯文本,所述待翻譯文本中包括目標(biāo)語言詞語,以及源語言詞語;
翻譯模塊,用于將所述待翻譯文本輸入預(yù)先訓(xùn)練的目標(biāo)語言和源語言的翻譯模型,確定翻譯所述源語言詞語的各候選詞語,以及所述各候選詞語的置信度;
組合模塊,用于利用所述各候選詞語分別替換所述待翻譯文本中對應(yīng)的源語言詞語,與所述目標(biāo)語言詞語組合,得到各候選譯文;
預(yù)測模塊,用于將所述候選譯文輸入預(yù)先訓(xùn)練的所述目標(biāo)語言的語言模型,預(yù)測所述候選譯文采用所述候選詞語翻譯后,形成通順文本的語言概率;
推薦模塊,用于根據(jù)采用候選詞語翻譯得到的候選譯文的語言概率,以及候選詞語的置信度,從各候選詞語中選擇目標(biāo)詞語進(jìn)行推薦。
本發(fā)明實(shí)施例的基于人工智能的翻譯裝置,通過獲取用戶輸入的從源語言翻譯至目標(biāo)語言的待翻譯文本,其中,待翻譯文本中包括目標(biāo)語言詞語,以及源語言詞語,將待翻譯文本輸入預(yù)先訓(xùn)練的目標(biāo)語言和源語言的翻譯模型,確定翻譯源語言詞語的各候選詞語,以及各候選詞語的置信度,將各候選詞語分別與目標(biāo)語言詞語組合,得到各候選譯文,進(jìn)而將候選譯文輸入預(yù)先訓(xùn)練的目標(biāo)語言的語言模型,預(yù)測候選譯文采用該候選詞語后,形成通順文本的語言概率,根據(jù)采用候選詞語翻譯得到的候選譯文的語言概率,以及候選詞語的置信度,從各候選詞語中選擇目標(biāo)詞語進(jìn)行推薦。由于用戶可以在不確定翻譯是否準(zhǔn)確時,通過輸入確定準(zhǔn)確的目標(biāo)語言詞語,以及輸入一部分不確定翻譯是否準(zhǔn)確的源語言詞語,解決現(xiàn)有技術(shù)中翻譯方式不靈活的技術(shù)問題。
為達(dá)上述目的,本發(fā)明第三方面實(shí)施例提出了另一種基于人工智能的翻譯裝置,包括:處理器;用于存儲所述處理器可執(zhí)行指令的存儲器;其中,所述處理器被配置為:
獲取用戶輸入的從源語言翻譯至目標(biāo)語言的待翻譯文本,所述待翻譯文本中包括目標(biāo)語言詞語,以及源語言詞語;
將所述待翻譯文本輸入預(yù)先訓(xùn)練的目標(biāo)語言和源語言的翻譯模型,確定翻譯所述源語言詞語的各候選詞語,以及所述各候選詞語的置信度;
利用所述各候選詞語分別替換所述待翻譯文本中對應(yīng)的源語言詞語,與所述目標(biāo)語言詞語組合,得到各候選譯文;
將所述候選譯文輸入預(yù)先訓(xùn)練的所述目標(biāo)語言的語言模型,預(yù)測所述候選譯文采用所述候選詞語翻譯后,形成通順文本的語言概率;
根據(jù)采用候選詞語翻譯得到的候選譯文的語言概率,以及候選詞語的置信度,從各候選詞語中選擇目標(biāo)詞語進(jìn)行推薦。
為了實(shí)現(xiàn)上述目的,本發(fā)明第四方面實(shí)施例提出了一種非臨時性計(jì)算機(jī)可讀存儲介質(zhì),當(dāng)所述存儲介質(zhì)中的指令由服務(wù)器的處理器被執(zhí)行時,使得服務(wù)器能夠執(zhí)行一種基于人工智能的翻譯方法,所述方法包括:
獲取用戶輸入的從源語言翻譯至目標(biāo)語言的待翻譯文本,所述待翻譯文本中包括目標(biāo)語言詞語,以及源語言詞語;
將所述待翻譯文本輸入預(yù)先訓(xùn)練的目標(biāo)語言和源語言的翻譯模型,確定翻譯所述源語言詞語的各候選詞語,以及所述各候選詞語的置信度;
利用所述各候選詞語分別替換所述待翻譯文本中對應(yīng)的源語言詞語,與所述目標(biāo)語言詞語組合,得到各候選譯文;
將所述候選譯文輸入預(yù)先訓(xùn)練的所述目標(biāo)語言的語言模型,預(yù)測所述候選譯文采用所述候選詞語翻譯后,形成通順文本的語言概率;
根據(jù)采用候選詞語翻譯得到的候選譯文的語言概率,以及候選詞語的置信度,從各候選詞語中選擇目標(biāo)詞語進(jìn)行推薦。
為了實(shí)現(xiàn)上述目的,本發(fā)明第五方面實(shí)施例提出了一種計(jì)算機(jī)程序產(chǎn)品,當(dāng)所述計(jì)算機(jī)程序產(chǎn)品中的指令處理器執(zhí)行時,執(zhí)行一種基于人工智能的翻譯方法,所述方法包括:
獲取用戶輸入的從源語言翻譯至目標(biāo)語言的待翻譯文本,所述待翻譯文本中包括目標(biāo)語言詞語,以及源語言詞語;
將所述待翻譯文本輸入預(yù)先訓(xùn)練的目標(biāo)語言和源語言的翻譯模型,確定翻譯所述源語言詞語的各候選詞語,以及所述各候選詞語的置信度;
利用所述各候選詞語分別替換所述待翻譯文本中對應(yīng)的源語言詞語,與所述目標(biāo)語言詞語組合,得到各候選譯文;
將所述候選譯文輸入預(yù)先訓(xùn)練的所述目標(biāo)語言的語言模型,預(yù)測所述候選譯文采用所述候選詞語翻譯后,形成通順文本的語言概率;
根據(jù)采用候選詞語翻譯得到的候選譯文的語言概率,以及候選詞語的置信度,從各候選詞語中選擇目標(biāo)詞語進(jìn)行推薦。
本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。
附圖說明
本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對實(shí)施例的描述中將變得明顯和容易理解,其中:
圖1為本發(fā)明實(shí)施例所提供的一種基于人工智能的翻譯方法的流程示意圖;
圖2為本發(fā)明實(shí)施例提供的另一種基于人工智能的翻譯方法的流程示意圖;
圖3為中英語料的示意圖;
圖4為目標(biāo)詞語的顯示示意圖之一;
圖5為目標(biāo)詞語的顯示示意圖之二;
圖6為本發(fā)明實(shí)施例提供的一種基于人工智能的翻譯裝置的結(jié)構(gòu)示意圖;
圖7為本發(fā)明實(shí)施例提供的另一種基于人工智能的翻譯裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。
下面參考附圖描述本發(fā)明實(shí)施例的基于人工智能的翻譯方法和裝置。
圖1為本發(fā)明實(shí)施例所提供的一種基于人工智能的翻譯方法的流程示意圖。
如圖1所示,該基于人工智能的翻譯方法包括以下步驟:
步驟101,獲取用戶輸入的從源語言翻譯至目標(biāo)語言的待翻譯文本。
其中,待翻譯文本中包括目標(biāo)語言詞語,以及源語言詞語。
從源語言翻譯至目標(biāo)語言的過程中,用戶在不確定譯文的情況下,可以輸入包括至少一段目標(biāo)語言詞語以及至少一段源語言詞語的待翻譯文本,其中,源語言詞語是用戶不確定如何進(jìn)行翻譯,等待推薦目標(biāo)詞語的詞語;目標(biāo)語言詞語是用戶已確定翻譯方式,無需進(jìn)行推薦的詞語。
步驟102,將待翻譯文本輸入預(yù)先訓(xùn)練的目標(biāo)語言和源語言的翻譯模型,確定翻譯源語言詞語的各候選詞語,以及各候選詞語的置信度。
具體地,預(yù)先利用所述目標(biāo)語言和所述源語言的雙語料庫,對所述翻譯模型進(jìn)行訓(xùn)練,以確定具有語義對應(yīng)關(guān)系的源語言詞語和目標(biāo)語言詞語,以及所述目標(biāo)語言詞語準(zhǔn)確翻譯所述源語言詞語的置信度。從而將待翻譯文本輸入預(yù)先訓(xùn)練的目標(biāo)語言和源語言的翻譯模型之后,便可以確定用于翻譯源語言詞語的各候選詞語,以及各候選詞語的置信度。
其中,置信度是根據(jù)在雙語料庫中,采用該目標(biāo)語言詞語翻譯該源語言詞語的次數(shù),占翻譯源語言詞語的總次數(shù)之比。
步驟103,利用各候選詞語分別替換待翻譯文本中對應(yīng)的源語言詞語,與目標(biāo)語言詞語組合,得到各候選譯文。
一般來說,候選詞語為多個,針對每一個候選詞語,替換待翻譯文本中對應(yīng)的源語言詞語,從而使得該候選詞語與目標(biāo)語言詞語進(jìn)行組合,構(gòu)成一段候選譯文。這段候選譯文中僅包含目標(biāo)語言。
步驟104,將候選譯文輸入預(yù)先訓(xùn)練的目標(biāo)語言的語言模型,預(yù)測候選譯文采用候選詞語翻譯后,形成通順文本的語言概率。
具體地,預(yù)先利用所述目標(biāo)語言的語料庫,對所述目標(biāo)語言的語言模型進(jìn)行訓(xùn)練,其中,這里的目標(biāo)語言的語料庫是根據(jù)所述目標(biāo)語言的學(xué)術(shù)會議、期刊和/或論文進(jìn)行構(gòu)建的。從而,使得語言模型學(xué)習(xí)到目標(biāo)語言的語料,將各候選譯文分別輸入預(yù)先訓(xùn)練的所述目標(biāo)語言的語言模型之后,便可以預(yù)測出候選譯文采用該候選詞語翻譯后,形成通順文本的語言概率。
其中,語言模型為n-gram語言模型,n-gram語言模型是大詞語連續(xù)語音識別中常用的一種語言模型,另外本實(shí)施例中所采用的語言模型還可以是神經(jīng)網(wǎng)絡(luò)語言模型RNN-LM(Recurrent Neural Network Language Model)。
步驟105,根據(jù)采用候選詞語翻譯得到的候選譯文的語言概率,以及候選詞語的置信度,從各候選詞語中選擇目標(biāo)詞語進(jìn)行推薦。
具體地,針對每一個候選詞語,將采用候選詞語進(jìn)行翻譯的候選譯文的語言概率,和該候選詞語的置信度進(jìn)行加權(quán)求和,得到所述候選詞語的總概率,依據(jù)所述總概率對各候選詞語進(jìn)行排序,從各候選詞語中選擇目標(biāo)詞語進(jìn)行推薦。
一般來說,所推薦的目標(biāo)詞語的個數(shù)為至少兩個,可以將所選擇的至少兩個目標(biāo)詞語,按照總概率由大到小的順序依次顯示在對應(yīng)源語言詞語的下方,并且,在每一個目標(biāo)詞語旁以進(jìn)度條形式指示目標(biāo)詞語的總概率。
本實(shí)施例中,通過獲取用戶輸入的從源語言翻譯至目標(biāo)語言的待翻譯文本,其中,待翻譯文本中包括目標(biāo)語言詞語,以及源語言詞語,將待翻譯文本輸入預(yù)先訓(xùn)練的目標(biāo)語言和源語言的翻譯模型,確定翻譯源語言詞語的各候選詞語,以及各候選詞語的置信度,將各候選詞語分別與目標(biāo)語言詞語組合,得到各候選譯文,進(jìn)而將候選譯文輸入預(yù)先訓(xùn)練的目標(biāo)語言的語言模型,預(yù)測候選譯文采用該候選詞語后,形成通順文本的語言概率,根據(jù)采用候選詞語翻譯得到的候選譯文的語言概率,以及候選詞語的置信度,從各候選詞語中選擇目標(biāo)詞語進(jìn)行推薦。由于用戶可以在不確定翻譯是否準(zhǔn)確時,通過輸入確定準(zhǔn)確的目標(biāo)語言詞語,以及輸入一部分不確定翻譯是否準(zhǔn)確的源語言詞語,解決現(xiàn)有技術(shù)中翻譯方式不靈活的技術(shù)問題。
為了清楚說明上一實(shí)施例,本實(shí)施例提供了另一種基于人工智能的翻譯方法,用于在英語和中文之間進(jìn)行翻譯的應(yīng)用場景中,也就是說,本實(shí)施例中的源語言具體為中文,目標(biāo)語言具體為英語,圖2為本發(fā)明實(shí)施例提供的另一種基于人工智能的翻譯方法的流程示意圖,如圖2所示,該基于人工智能的翻譯方法可以包括以下步驟:
步驟201,獲取用戶輸入的待翻譯文本。
用戶采用英文進(jìn)行寫作的過程中,若存在不確定用法的單詞時,可以在多段英文詞語中插入中文詞語,從而待翻譯文本中不僅包括多段英文詞語,還會包含中文詞語。
例如:“提出”這個詞在英文中具有多種表達(dá)方式,若在一句話中,用戶不確定具體采用哪一種表達(dá)方式,用戶可以輸入“This paper提出an optimized algorithm”,從而尋求“提出”這個詞的最佳譯文。
步驟202,將待翻譯文本輸入預(yù)先訓(xùn)練的中英的翻譯模型,確定英文的各候選詞語,以及各候選詞語的置信度。
具體地,翻譯模型預(yù)先經(jīng)過了訓(xùn)練,在訓(xùn)練過程中,通過對雙語語料進(jìn)行分詞處理,以及對齊之后,可以從中抽取出每一個中文詞語對應(yīng)翻譯至的英文詞語,圖3為中英語料的示意圖,在圖3中,通過連線確定中文詞語對應(yīng)的英文詞語,由于在雙語語料庫中存在大量的這種雙語語料,從而針對一個中文詞語,可以查詢到對應(yīng)的多個英文詞語,將這多個英文詞語作為候選詞語,并由此可以計(jì)算出每一個英文詞語用于翻譯這個中文詞語的概率,即每一個候選詞語的置信度。
例如:在公式中,O(e,f)表示英文詞語e用于翻譯中文詞語f的次數(shù),e’表示用于翻譯中文詞語f的英文詞語集合,表示英文詞語集合中的各詞語e’翻譯中文詞語f的總次數(shù)。在前述公式中,P(e|f)表示英文詞語e用于翻譯中文詞語f的置信度。
步驟203,將英文的候選詞語結(jié)合待翻譯文本中的英文上下文,生成候選譯文,利用預(yù)先訓(xùn)練的所述目標(biāo)語言的語言模型,預(yù)測候選譯文采用候選詞語后形成通順文本的語言概率。
其中,語言模型的作用是預(yù)測一個句子符合語言表達(dá)習(xí)慣的流利程度。
例如:針對待翻譯文本“This paper提出an optimized algorithm”,上一步驟中,可以獲得“提出”的候選詞語為“describes”和“introduces”,從而生成的候選譯文可以是“This paper introduces”,以及“This paper describes”。將生成的候選譯文利用語言模型進(jìn)行預(yù)測,其中,ei表示候選譯文中的第i個詞語,e1,e2,……,ei-1表示ei的英文上下文,具體為候選譯文中的ei之前出現(xiàn)的英文詞語。
利用這個語言模型計(jì)算出P(introduces|This paper)和P(describes|This paper),作為一種可能的結(jié)果,P(introduces|This paper)>P(describes|This paper),表示“This paper”后面是“introduces”的概率要大于“describes”。
步驟204,根據(jù)采用候選詞語翻譯得到的候選譯文的語言概率,以及候選詞語的置信度,從各候選詞語中選擇出目標(biāo)詞語。
具體地,根據(jù)公式S(E)=α×LM(E)+β×P(e|f),計(jì)算候選詞語的總概率,其中,權(quán)重參數(shù)α和β,可以根據(jù)實(shí)際需要在滿足α+β=1的條件下,參考最小錯誤率的方式進(jìn)行調(diào)節(jié)。
步驟205,向用戶端推薦目標(biāo)詞語。
具體地,可以在用戶端顯示如圖4所示的樣式,將所選擇的至少兩個目標(biāo)詞語,按照所述總概率由大到小的順序依次顯示在對應(yīng)源語言詞語的下方;其中,在每一個目標(biāo)詞語旁以進(jìn)度條形式指示所述目標(biāo)詞語的總概率,從而便于用戶參考。
本實(shí)施例中僅列舉了待翻譯文本中包含一段源語言詞語的情況,作為一種可能的應(yīng)用場景,用戶所輸入的待翻譯文本中可以包括多段源語言詞語,從而需要針對每一個源語言詞語執(zhí)行輸入翻譯模型,確定候選詞語及其置信度,并計(jì)算全部源語言詞語的候選詞語組合所得到的候選詞語組合的總置信度其中,i’表示源語言詞語的排序,ei’表示第i’個源語言詞語fi’對應(yīng)的目標(biāo)語言詞語。進(jìn)而,將候選詞語組合結(jié)合上下文生成候選譯文預(yù)測候選譯文的語言概率,最終根據(jù)總置信度和語言概率計(jì)算總概率,并依據(jù)總概率,推薦總概率排序在前的若干個候選詞語組合中的各目標(biāo)詞語。
例如:用戶輸入“This paper提出a新方法”,包含兩段源語言詞語,分別為“提出”和“新方法”,參考前述方法得到總概率如下:
S(This paper proposes a novel method)=α×LM(This paper proposes a novel method)+β×(P(proposes|提出)+P(novel method|新方法));
其中,P(proposes|提出)和P(novel method|新方法)表示分別對應(yīng)兩段源語言詞語的候選詞語“proposes”、“novel method”及其置信度,LM(This paper proposes a novel method)表示“proposes”、“novel method”構(gòu)成的候選詞語組合翻譯的候選譯文的語言概率,S(This paper proposes a novel method)為候選詞語組合的總概率。依據(jù)總概率排序,選擇出若干個候選詞語組合中的各目標(biāo)詞語,采用圖5所提供的方式進(jìn)行推薦。
本實(shí)施例中,通過獲取用戶輸入的從源語言翻譯至目標(biāo)語言的待翻譯文本,其中,待翻譯文本中包括目標(biāo)語言詞語,以及源語言詞語,將待翻譯文本輸入預(yù)先訓(xùn)練的目標(biāo)語言和源語言的翻譯模型,確定翻譯源語言詞語的各候選詞語,以及各候選詞語的置信度,將各候選詞語分別與目標(biāo)語言詞語組合,得到各候選譯文,進(jìn)而將候選譯文輸入預(yù)先訓(xùn)練的目標(biāo)語言的語言模型,預(yù)測候選譯文采用該候選詞語后,形成通順文本的語言概率,根據(jù)采用候選詞語翻譯得到的候選譯文的語言概率,以及候選詞語的置信度,從各候選詞語中選擇目標(biāo)詞語進(jìn)行推薦。由于用戶可以在不確定翻譯是否準(zhǔn)確時,通過輸入確定準(zhǔn)確的目標(biāo)語言詞語,以及輸入一部分不確定翻譯是否準(zhǔn)確的源語言詞語,解決現(xiàn)有技術(shù)中翻譯方式不靈活的技術(shù)問題。
為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出一種基于人工智能的翻譯裝置,圖6為本發(fā)明實(shí)施例提供的一種基于人工智能的翻譯裝置的結(jié)構(gòu)示意圖。
如圖6所示,該基于人工智能的翻譯裝置包括:獲取模塊51、翻譯模塊52、組合模塊53、預(yù)測模塊54和推薦模塊55。
獲取模塊51,用于獲取用戶輸入的從源語言翻譯至目標(biāo)語言的待翻譯文本,所述待翻譯文本中包括目標(biāo)語言詞語,以及源語言詞語。
翻譯模塊52,用于將所述待翻譯文本輸入預(yù)先訓(xùn)練的目標(biāo)語言和源語言的翻譯模型,確定翻譯所述源語言詞語的各候選詞語,以及所述各候選詞語的置信度。
組合模塊53,用于利用所述各候選詞語分別替換所述待翻譯文本中對應(yīng)的源語言詞語,與所述目標(biāo)語言詞語組合,得到各候選譯文。
預(yù)測模塊54,用于將所述候選譯文輸入預(yù)先訓(xùn)練的所述目標(biāo)語言的語言模型,預(yù)測所述候選譯文采用所述候選詞語翻譯后,形成通順文本的語言概率。
推薦模塊55,用于根據(jù)采用候選詞語翻譯得到的候選譯文的語言概率,以及候選詞語的置信度,從各候選詞語中選擇目標(biāo)詞語進(jìn)行推薦。
需要說明的是,前述對方法實(shí)施例的解釋說明也適用于該實(shí)施例的裝置,此處不再贅述。
基于上述實(shí)施例,本發(fā)明實(shí)施例還提供了另一種基于人工智能的翻譯裝置的可能的實(shí)現(xiàn)方式,圖7為本發(fā)明實(shí)施例提供的另一種基于人工智能的翻譯裝置的結(jié)構(gòu)示意圖,在上一實(shí)施例的基礎(chǔ)上,推薦模塊55,包括:計(jì)算單元551和推薦單元552。
計(jì)算單元551,用于針對每一個候選詞語,將所述候選詞語翻譯得到的候選譯文的語言概率和所述候選詞語的置信度進(jìn)行加權(quán)求和,得到所述候選詞語的總概率。
推薦單元552,用于依據(jù)所述總概率對各候選詞語進(jìn)行排序,從各候選詞語中選擇目標(biāo)詞語進(jìn)行推薦。
進(jìn)一步地,在本發(fā)明實(shí)施例的一種可能的實(shí)現(xiàn)方式中,目標(biāo)詞語的個數(shù)為至少兩個。
基于此,推薦單元552,具體用于:將所選擇的至少兩個目標(biāo)詞語,按照所述總概率由大到小的順序依次顯示在對應(yīng)源語言詞語的下方;其中,在每一個目標(biāo)詞語旁以進(jìn)度條形式指示所述目標(biāo)詞語的總概率。
進(jìn)一步地,在本發(fā)明實(shí)施例的一種可能的實(shí)現(xiàn)方式中,基于人工智能的翻譯裝置還包括:翻譯模型訓(xùn)練模塊56和語言模型訓(xùn)練模塊57。
翻譯模型訓(xùn)練模塊56,用于利用所述目標(biāo)語言和所述源語言的雙語料庫,對所述翻譯模型進(jìn)行訓(xùn)練,以確定具有語義對應(yīng)關(guān)系的源語言詞語和目標(biāo)語言詞語,以及所述目標(biāo)語言詞語準(zhǔn)確翻譯所述源語言詞語的置信度。其中,置信度是根據(jù)在所述雙語料庫中,采用所述目標(biāo)語言詞語翻譯所述源語言詞語的次數(shù),占翻譯所述源語言詞語的總次數(shù)之比。
語言模型訓(xùn)練模塊57,用于利用所述目標(biāo)語言的語料庫,對所述目標(biāo)語言的語言模型進(jìn)行訓(xùn)練;所述語料庫是根據(jù)所述目標(biāo)語言的學(xué)術(shù)會議、期刊和/或論文進(jìn)行構(gòu)建的。
其中,語言模型為n-gram語言模型或神經(jīng)網(wǎng)絡(luò)語言模型。
本發(fā)明實(shí)施例中,通過獲取用戶輸入的從源語言翻譯至目標(biāo)語言的待翻譯文本,其中,待翻譯文本中包括目標(biāo)語言詞語,以及源語言詞語,將待翻譯文本輸入預(yù)先訓(xùn)練的目標(biāo)語言和源語言的翻譯模型,確定翻譯源語言詞語的各候選詞語,以及各候選詞語的置信度,將各候選詞語分別與目標(biāo)語言詞語組合,得到各候選譯文,進(jìn)而將候選譯文輸入預(yù)先訓(xùn)練的目標(biāo)語言的語言模型,預(yù)測候選譯文采用該候選詞語后,形成通順文本的語言概率,根據(jù)采用候選詞語翻譯得到的候選譯文的語言概率,以及候選詞語的置信度,從各候選詞語中選擇目標(biāo)詞語進(jìn)行推薦。由于用戶可以在不確定翻譯是否準(zhǔn)確時,通過輸入確定準(zhǔn)確的目標(biāo)語言詞語,以及輸入一部分不確定翻譯是否準(zhǔn)確的源語言詞語,解決現(xiàn)有技術(shù)中翻譯方式不靈活的技術(shù)問題。
為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出另一種基于人工智能的翻譯裝置,包括:處理器,以及用于存儲所述處理器可執(zhí)行指令的存儲器。
其中,處理器被配置為:
獲取用戶輸入的從源語言翻譯至目標(biāo)語言的待翻譯文本,所述待翻譯文本中包括目標(biāo)語言詞語,以及源語言詞語;
將所述待翻譯文本輸入預(yù)先訓(xùn)練的目標(biāo)語言和源語言的翻譯模型,確定翻譯所述源語言詞語的各候選詞語,以及所述各候選詞語的置信度;
利用所述各候選詞語分別替換所述待翻譯文本中對應(yīng)的源語言詞語,與所述目標(biāo)語言詞語組合,得到各候選譯文;
將所述候選譯文輸入預(yù)先訓(xùn)練的所述目標(biāo)語言的語言模型,預(yù)測所述候選譯文采用所述候選詞語翻譯后,形成通順文本的語言概率;
根據(jù)采用候選詞語翻譯得到的候選譯文的語言概率,以及候選詞語的置信度,從各候選詞語中選擇目標(biāo)詞語進(jìn)行推薦。
為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出一種非臨時性計(jì)算機(jī)可讀存儲介質(zhì),當(dāng)所述存儲介質(zhì)中的指令由服務(wù)器的處理器被執(zhí)行時,使得服務(wù)器能夠執(zhí)行一種基于人工智能的翻譯方法,所述方法包括:獲取用戶輸入的從源語言翻譯至目標(biāo)語言的待翻譯文本,所述待翻譯文本中包括目標(biāo)語言詞語,以及源語言詞語;
將所述待翻譯文本輸入預(yù)先訓(xùn)練的目標(biāo)語言和源語言的翻譯模型,確定翻譯所述源語言詞語的各候選詞語,以及所述各候選詞語的置信度;
利用所述各候選詞語分別替換所述待翻譯文本中對應(yīng)的源語言詞語,與所述目標(biāo)語言詞語組合,得到各候選譯文;
將所述候選譯文輸入預(yù)先訓(xùn)練的所述目標(biāo)語言的語言模型,預(yù)測所述候選譯文采用所述候選詞語翻譯后,形成通順文本的語言概率;
根據(jù)采用候選詞語翻譯得到的候選譯文的語言概率,以及候選詞語的置信度,從各候選詞語中選擇目標(biāo)詞語進(jìn)行推薦。
為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出一種計(jì)算機(jī)程序產(chǎn)品,當(dāng)所述計(jì)算機(jī)程序產(chǎn)品中的指令處理器執(zhí)行時,執(zhí)行一種基于人工智能的翻譯方法,所述方法包括:
獲取用戶輸入的從源語言翻譯至目標(biāo)語言的待翻譯文本,所述待翻譯文本中包括目標(biāo)語言詞語,以及源語言詞語;
將所述待翻譯文本輸入預(yù)先訓(xùn)練的目標(biāo)語言和源語言的翻譯模型,確定翻譯所述源語言詞語的各候選詞語,以及所述各候選詞語的置信度;
利用所述各候選詞語分別替換所述待翻譯文本中對應(yīng)的源語言詞語,與所述目標(biāo)語言詞語組合,得到各候選譯文;
將所述候選譯文輸入預(yù)先訓(xùn)練的所述目標(biāo)語言的語言模型,預(yù)測所述候選譯文采用所述候選詞語翻譯后,形成通順文本的語言概率;
根據(jù)采用候選詞語翻譯得到的候選譯文的語言概率,以及候選詞語的置信度,從各候選詞語中選擇目標(biāo)詞語進(jìn)行推薦。
在本說明書的描述中,參考術(shù)語“一個實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個實(shí)施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不必須針對的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任一個或多個實(shí)施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說明書中描述的不同實(shí)施例或示例以及不同實(shí)施例或示例的特征進(jìn)行結(jié)合和組合。
此外,術(shù)語“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括至少一個該特征。在本發(fā)明的描述中,“多個”的含義是至少兩個,例如兩個,三個等,除非另有明確具體的限定。
流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個或更多個用于實(shí)現(xiàn)定制邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本發(fā)明的實(shí)施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。
在流程圖中表示或在此以其他方式描述的邏輯和/或步驟,例如,可以被認(rèn)為是用于實(shí)現(xiàn)邏輯功能的可執(zhí)行指令的定序列表,可以具體實(shí)現(xiàn)在任何計(jì)算機(jī)可讀介質(zhì)中,以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備(如基于計(jì)算機(jī)的系統(tǒng)、包括處理器的系統(tǒng)或其他可以從指令執(zhí)行系統(tǒng)、裝置或設(shè)備取指令并執(zhí)行指令的系統(tǒng))使用,或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用。就本說明書而言,"計(jì)算機(jī)可讀介質(zhì)"可以是任何可以包含、存儲、通信、傳播或傳輸程序以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用的裝置。計(jì)算機(jī)可讀介質(zhì)的更具體的示例(非窮盡性列表)包括以下:具有一個或多個布線的電連接部(電子裝置),便攜式計(jì)算機(jī)盤盒(磁裝置),隨機(jī)存取存儲器(RAM),只讀存儲器(ROM),可擦除可編輯只讀存儲器(EPROM或閃速存儲器),光纖裝置,以及便攜式光盤只讀存儲器(CDROM)。另外,計(jì)算機(jī)可讀介質(zhì)甚至可以是可在其上打印所述程序的紙或其他合適的介質(zhì),因?yàn)榭梢岳缤ㄟ^對紙或其他介質(zhì)進(jìn)行光學(xué)掃描,接著進(jìn)行編輯、解譯或必要時以其他合適方式進(jìn)行處理來以電子方式獲得所述程序,然后將其存儲在計(jì)算機(jī)存儲器中。
應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述實(shí)施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實(shí)現(xiàn)。如,如果用硬件來實(shí)現(xiàn)和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn):具有用于對數(shù)據(jù)信號實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場可編程門陣列(FPGA)等。
本技術(shù)領(lǐng)域的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計(jì)算機(jī)可讀存儲介質(zhì)中,該程序在執(zhí)行時,包括方法實(shí)施例的步驟之一或其組合。
此外,在本發(fā)明各個實(shí)施例中的各功能單元可以集成在一個處理模塊中,也可以是各個單元單獨(dú)物理存在,也可以兩個或兩個以上單元集成在一個模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時,也可以存儲在一個計(jì)算機(jī)可讀取存儲介質(zhì)中。
上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對上述實(shí)施例進(jìn)行變化、修改、替換和變型。