翻譯錯(cuò)誤的定位方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及翻譯技術(shù)領(lǐng)域,具體涉及一種翻譯錯(cuò)誤的定位方法和裝置。
【背景技術(shù)】
[0002] 文檔翻譯完成后即進(jìn)入審校環(huán)節(jié),審校人員會(huì)對(duì)譯文中的錯(cuò)譯、漏譯等翻譯錯(cuò)誤 點(diǎn)出,如何將這些點(diǎn)出的錯(cuò)誤所在的譯句和其在原文中的語(yǔ)句相對(duì)應(yīng),是一項(xiàng)基礎(chǔ)工作。譯 句和原句對(duì)應(yīng)后,即可通過(guò)原句在平行語(yǔ)料庫(kù)中對(duì)包含錯(cuò)譯、漏譯等錯(cuò)誤的譯文語(yǔ)句進(jìn)行 相似性比較,從而較為客觀的判斷譯句的錯(cuò)誤類(lèi)型和錯(cuò)誤程度。
[0003] 所以將原文和譯文進(jìn)行按句對(duì)齊是一項(xiàng)基礎(chǔ)性的工作,一般按段落對(duì)齊,可以將 原文和譯文按照順序進(jìn)行對(duì)齊即可。但在段落內(nèi)將原文和譯文按句進(jìn)行對(duì)齊則無(wú)法這樣簡(jiǎn) 單處理,由于源語(yǔ)言風(fēng)格、目標(biāo)語(yǔ)言風(fēng)格、翻譯文風(fēng)、內(nèi)容調(diào)整等各種原因,段落內(nèi)的原文語(yǔ) 句和譯文語(yǔ)句若是簡(jiǎn)單的按順序來(lái)進(jìn)行對(duì)齊往往會(huì)造成大量錯(cuò)配的情況。所以往這種基于 句子的原譯文對(duì)齊工作往往需要人工來(lái)處理,既費(fèi)時(shí)費(fèi)力,效率也很低。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明實(shí)施例的目的在于克服現(xiàn)有技術(shù)的上述不足,提供一種翻譯錯(cuò)誤的定位方 法,該方法基于實(shí)義詞的相似度,解決了原文和譯文對(duì)齊的問(wèn)題。
[0005] 本發(fā)明實(shí)施例的另一目的在于克服現(xiàn)有技術(shù)的上述不足,提供一種翻譯錯(cuò)誤的定 位裝置,該裝置基于實(shí)義詞的相似度,解決了原文和譯文對(duì)齊的問(wèn)題。
[0006] 為了實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明實(shí)施例的技術(shù)方案如下:
[0007] -種翻譯錯(cuò)誤的定位方法,包括:對(duì)原文和譯文中的網(wǎng)頁(yè)標(biāo)簽進(jìn)行標(biāo)記;對(duì)標(biāo)記 后的所述原文中的所有原文語(yǔ)句分詞,去除其中的停用詞,獲得實(shí)義詞;獲取所述原文語(yǔ)句 的每個(gè)實(shí)義詞的所有譯項(xiàng);將每個(gè)所述原文語(yǔ)句的每個(gè)實(shí)義詞的所有譯項(xiàng)在標(biāo)記后的所述 譯文中的所有譯文語(yǔ)句中進(jìn)行匹配,獲得每個(gè)所述原文語(yǔ)句的每個(gè)實(shí)義詞和所述譯文語(yǔ)句 的相似度;根據(jù)每個(gè)所述原文語(yǔ)句的所有實(shí)義詞和所述譯文語(yǔ)句的相似度,將每個(gè)所述原 文語(yǔ)句和所述譯文語(yǔ)句進(jìn)行匹配,獲得每個(gè)所述原文語(yǔ)句和所述譯文語(yǔ)句的相似度;將與 所述原文語(yǔ)句相似度最高的所述譯文語(yǔ)句和所述原文語(yǔ)句匹配并對(duì)齊。
[0008] 進(jìn)一步,所述將每個(gè)所述原文語(yǔ)句的每個(gè)實(shí)義詞的所有譯項(xiàng)在所有所述譯文語(yǔ)句 中進(jìn)行匹配,獲得每個(gè)所述原文語(yǔ)句的每個(gè)實(shí)義詞和所述譯文語(yǔ)句的相似度的過(guò)程包括: 根據(jù)8;[111(購(gòu)1,11^歷 10 = 17((1丨8(購(gòu)1,11^斷)+0獲得原文語(yǔ)句01?的第」個(gè)實(shí)義詞的第1個(gè)譯 項(xiàng)n w j i與第i個(gè)譯文語(yǔ)句T R i的第r個(gè)實(shí)義詞T R i n w r的相似度;根據(jù) 咖心川·" R"%))獲得所述原文語(yǔ)句0R的第j個(gè)實(shí)義詞的第丨個(gè)譯 項(xiàng)nWjl與所述譯文語(yǔ)句TRi的相似度;根據(jù)胃/,77? = J7?,·))獲 述原文語(yǔ)句OR的第j個(gè)實(shí)義詞nwj和第i個(gè)所述譯文語(yǔ)句TRi的相似度;其中,所述原文語(yǔ)句OR 具有m個(gè)實(shí)義詞,所述譯文中共有η個(gè)所述譯文語(yǔ)句,所述譯文語(yǔ)句TRi具有p個(gè)實(shí)義詞,第j 個(gè)實(shí)義詞具有k個(gè)譯項(xiàng),L表示調(diào)節(jié)參數(shù),dis(nwji,TRmwr)表示所述原文語(yǔ)句OR的第j個(gè)實(shí) 義詞的第1個(gè)譯項(xiàng)nw^和第i個(gè)所述譯文語(yǔ)句TRi的第r個(gè)實(shí)義詞TRmWr在詞典中的代碼的距 離,i = l,2,.",n,j = l,2,.",m,l = l,2,.",k,r = l,2,.",p0
[0009] 進(jìn)一步,所述根據(jù)每個(gè)所述原文語(yǔ)句的所有實(shí)義詞和所述譯文語(yǔ)句的相似度,將 每個(gè)所述原文語(yǔ)句和所述譯文語(yǔ)句進(jìn)行匹配,獲得每個(gè)所述原文語(yǔ)句和所述譯文語(yǔ)句的相 似度的過(guò)程包括:根據(jù)^^^卜.U 獲得所述原文語(yǔ)句0瞞所述譯 i-\."2. ··.tn 文語(yǔ)句TRi的相似度。
[0010] 進(jìn)一步,所述將與所述原文語(yǔ)句相似度最高的所述譯文語(yǔ)句和所述原文語(yǔ)句匹 配并對(duì)齊的過(guò)程包括:根據(jù),.1^"('_0^7< ))=,.1^.,,(11_(/711;.'_, 77?''))獲得與 所述原文語(yǔ)句OR的相似度最高的所述譯文語(yǔ)句;將與所述原文語(yǔ)句OR的相似度最高的所述 譯文語(yǔ)句和所述原文語(yǔ)句0R匹配,并對(duì)齊所述原文語(yǔ)句0R和所述譯文語(yǔ)句。
[0011]進(jìn)一步,還包括:對(duì)標(biāo)記后的所述原文中的所述原文語(yǔ)句按順序進(jìn)行編號(hào);對(duì)標(biāo)記 后的所述譯文中的所述譯文語(yǔ)句按順序進(jìn)行編號(hào);如果同一所述譯文語(yǔ)句和多個(gè)所述原文 語(yǔ)句的相似度均為最高,則獲取多個(gè)所述原文語(yǔ)句在所述原文中的所述編號(hào),以及所述譯 文語(yǔ)句在所述譯文中的所述編號(hào);如果多個(gè)所述原文語(yǔ)句中的一個(gè)所述原文語(yǔ)句在所述原 文中的所述編號(hào)和所述譯文語(yǔ)句在所述譯文中的所述編號(hào)最接近,則將該一個(gè)所述原文語(yǔ) 句與所述譯文語(yǔ)句匹配并對(duì)齊;如果多個(gè)所述原文語(yǔ)句中的兩個(gè)所述原文語(yǔ)句在所述原文 中的所述編號(hào)和所述譯文語(yǔ)句在所述譯文中的所述編號(hào)均為最接近,則將所述編號(hào)較小的 所述原文語(yǔ)句與所述譯文語(yǔ)句匹配并對(duì)齊;比較兩個(gè)所述原文語(yǔ)句中所述編號(hào)較大的所述 原文語(yǔ)句與剩余所述譯文語(yǔ)句的相似度的高低,將剩余所述譯文語(yǔ)句中與所述編號(hào)較大的 所述原文語(yǔ)句的相似度最高的所述譯文語(yǔ)句和所述編號(hào)較大的所述原文語(yǔ)句匹配并對(duì)齊; 重復(fù)上述過(guò)程,直到每個(gè)所述原文語(yǔ)句均與每個(gè)所述譯文語(yǔ)句匹配并對(duì)齊。
[0012] 進(jìn)一步:所述詞典為按樹(shù)形結(jié)構(gòu)編碼的同義詞分類(lèi)詞典,所述按樹(shù)形結(jié)構(gòu)編碼的 同義詞分類(lèi)詞典的每個(gè)節(jié)點(diǎn)具有唯一的所述代碼。
[0013] 進(jìn)一步:所述調(diào)節(jié)參數(shù)L為所述按所述樹(shù)形結(jié)構(gòu)編碼的同義詞分類(lèi)詞典的層數(shù)。
[0014] 進(jìn)一步,所述對(duì)原文和譯文中的網(wǎng)頁(yè)標(biāo)簽進(jìn)行標(biāo)記的過(guò)程包括:使用網(wǎng)頁(yè)標(biāo)簽識(shí) 別規(guī)則檢查所有所述原文語(yǔ)句和所述譯文語(yǔ)句中是否包含所述網(wǎng)頁(yè)標(biāo)簽;如果所述原文語(yǔ) 句中包含所述網(wǎng)頁(yè)標(biāo)簽,則遍歷所述原文,依次獲得所述網(wǎng)頁(yè)標(biāo)簽在所述原文中的起始索 引和所述網(wǎng)頁(yè)標(biāo)簽的長(zhǎng)度;根據(jù)所述網(wǎng)頁(yè)標(biāo)簽在所述原文中的起始索引和所述網(wǎng)頁(yè)標(biāo)簽的 長(zhǎng)度,將所述原文中的所述網(wǎng)頁(yè)標(biāo)簽標(biāo)記為不能修改;如果所述譯文語(yǔ)句中包含所述網(wǎng)頁(yè) 標(biāo)簽,則遍歷所述譯文,依次獲得所述網(wǎng)頁(yè)標(biāo)簽在所述譯文中的起始索引和所述網(wǎng)頁(yè)標(biāo)簽 的長(zhǎng)度;根據(jù)所述網(wǎng)頁(yè)標(biāo)簽在所述譯文中的起始索引和所述網(wǎng)頁(yè)標(biāo)簽的長(zhǎng)度,將所述譯文 中的所述網(wǎng)頁(yè)標(biāo)簽標(biāo)記為不能修改。
[0015] 進(jìn)一步,所述實(shí)義詞包括:名詞、動(dòng)詞、形容詞和副詞。
[0016] 以及,一種翻譯錯(cuò)誤的定位裝置,包括:第一單元,用于對(duì)原文和譯文中的網(wǎng)頁(yè)標(biāo) 簽進(jìn)行標(biāo)記;第二單元,用于對(duì)標(biāo)記后的所述原文中的所有原文語(yǔ)句分詞,去除其中的停用 詞,獲得實(shí)義詞;第三單元,用于獲取所述原文語(yǔ)句的每個(gè)實(shí)義詞的所有譯項(xiàng);第四單元,用 于將每個(gè)所述原文語(yǔ)句的每個(gè)實(shí)義詞的所有譯項(xiàng)在標(biāo)記后的所述譯文中的所有譯文語(yǔ)句 中進(jìn)行匹配,獲得每個(gè)所述原文語(yǔ)句的每個(gè)實(shí)義詞和所述譯文語(yǔ)句的相似度;第五單元,用 于根據(jù)每個(gè)所述原文語(yǔ)句的所有實(shí)義詞和所述譯文語(yǔ)句的相似度,將每個(gè)所述原文語(yǔ)句和 所述譯文語(yǔ)句進(jìn)行匹配,獲得每個(gè)所述原文語(yǔ)句和所述譯文語(yǔ)句的相似度;第六單元,用于 將與所述原文語(yǔ)句相似度最高的所述譯文語(yǔ)句和所述原文語(yǔ)句匹配并對(duì)齊。
[0017] 本發(fā)明實(shí)施例的有益效果如下:
[0018] 1、本發(fā)明實(shí)施例的翻譯錯(cuò)誤的定位方法,基于實(shí)義詞的相似度,解決了譯后處理 的原譯文對(duì)齊問(wèn)題。
[0019] 2、本發(fā)明實(shí)施例的翻譯錯(cuò)誤的定位方法,不需要通過(guò)人工處理,節(jié)省了時(shí)間,提高 了效率。
[0020] 3、本發(fā)明實(shí)施例的翻譯錯(cuò)誤的定位方法,通過(guò)對(duì)原文和譯文中的網(wǎng)頁(yè)標(biāo)簽進(jìn)行預(yù) 先標(biāo)記,將網(wǎng)頁(yè)標(biāo)簽保護(hù)起來(lái),使網(wǎng)頁(yè)標(biāo)簽的代碼無(wú)法修改,不對(duì)網(wǎng)頁(yè)標(biāo)簽進(jìn)行對(duì)齊處理。
[0021] 4、本發(fā)明實(shí)施例的翻譯錯(cuò)誤的定位裝置,基于實(shí)義詞的相似度,解決了譯后處理 的原譯文對(duì)齊問(wèn)題。
[0022] 5、本發(fā)明實(shí)施例的翻譯錯(cuò)誤的定位裝置,實(shí)現(xiàn)了自動(dòng)化,節(jié)省了時(shí)間,提高了效 率。
[0023] 6、本發(fā)明實(shí)施例的翻譯錯(cuò)誤的定位裝置,通過(guò)對(duì)原文和譯文中的網(wǎng)頁(yè)標(biāo)簽進(jìn)行預(yù) 先標(biāo)記,將網(wǎng)頁(yè)標(biāo)簽保護(hù)起來(lái),使網(wǎng)頁(yè)標(biāo)簽的代碼無(wú)法修改,不對(duì)網(wǎng)頁(yè)標(biāo)簽進(jìn)行對(duì)齊處理。
【附圖說(shuō)明】
[0024] 圖1是本發(fā)明實(shí)施例的翻譯錯(cuò)誤的定位方法的流程圖;
[0025]圖2是本發(fā)明實(shí)施例的翻譯錯(cuò)誤的定位裝置的流程圖。
【具體實(shí)施方式】
[0026] 為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖和實(shí)施例,對(duì) 本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并 不用于限定本發(fā)明。
[0027] 本發(fā)明實(shí)施例提供了一種翻譯錯(cuò)誤的定位方法。如圖1所示,為本發(fā)明實(shí)施例的翻 譯錯(cuò)誤的定位方法的流程圖。該翻譯