大小,以生成比對(duì)應(yīng)標(biāo)簽的待處理文字的字體大一號(hào)、相同和小一號(hào)的待選翻譯字體文字;翻譯文字選取模塊用于從字體大小調(diào)整模塊中生成的字號(hào)不同的翻譯文字中選取一組占的空間小于或等于該標(biāo)簽的文字顯示區(qū)域的大小且最接近該標(biāo)簽的文字顯示區(qū)域的大小的待選翻譯字體文字作為翻譯文字。
[0078]本實(shí)施例中,文字翻譯模塊包括分詞模塊、元素詞翻譯模塊和元素詞處理模塊。其中,分詞模塊用于采用分詞算法分解所述待處理文字,以生成若干個(gè)待翻譯元素詞;元素詞翻譯模塊用于在翻譯歷史詞庫(kù)中查找每個(gè)待翻譯元素詞匹配的目標(biāo)元素詞,若找不到,則調(diào)用第三方翻譯引擎進(jìn)行翻譯,以得到目標(biāo)元素詞,并將翻譯結(jié)果增加到翻譯歷史詞庫(kù)中,翻譯歷史詞庫(kù)用于存放所有的歷史翻譯結(jié)果;元素詞處理模塊,用于以元素詞翻譯模塊中的目標(biāo)元素詞將待處理文字翻譯生成翻譯文字。
[0079]本實(shí)施例中,分詞模塊包括第一分詞模塊、第二分詞模塊和分詞結(jié)果獲取模塊。其中,第一分詞模塊用于以歷史分詞詞庫(kù)為基礎(chǔ)對(duì)待處理文字進(jìn)行分詞;第二分詞模塊用于以常用傳統(tǒng)分詞詞庫(kù)為基礎(chǔ)對(duì)第一分詞模塊中未分解成功的待處理文字的剩余部分進(jìn)行分詞,并將分詞結(jié)果增加到歷史分詞詞庫(kù)中,歷史分詞詞庫(kù)用于存放所有的歷史待翻譯元素詞;分詞結(jié)果獲取模塊用于以第一分詞模塊的分詞結(jié)果和第二分詞模塊的分詞結(jié)果共同生成待翻譯元素詞。
[0080]雖然以上描述了本發(fā)明的【具體實(shí)施方式】,但是本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,這些僅是舉例說(shuō)明,本發(fā)明的保護(hù)范圍是由所附權(quán)利要求書(shū)限定的。本領(lǐng)域的技術(shù)人員在不背離本發(fā)明的原理和實(shí)質(zhì)的前提下,可以對(duì)這些實(shí)施方式做出多種變更或修改,但這些變更和修改均落入本發(fā)明的保護(hù)范圍。
【主權(quán)項(xiàng)】
1.一種網(wǎng)頁(yè)翻譯方法,其特征在于,包括以下步驟: 51、獲取待翻譯網(wǎng)頁(yè)的每一標(biāo)簽的文字顯示區(qū)域,提取標(biāo)簽中的待處理文字; 52、獲取每一標(biāo)簽的文字顯示區(qū)域的大??; 53、按每一標(biāo)簽翻譯所述待處理文字,以生成目標(biāo)語(yǔ)言的翻譯文字,每一標(biāo)簽的翻譯文字所占的空間小于或等于該標(biāo)簽的文字顯示區(qū)域的大?。? 54、生成目標(biāo)語(yǔ)言網(wǎng)頁(yè),所述目標(biāo)語(yǔ)言網(wǎng)頁(yè)的標(biāo)簽的布局同所述待翻譯網(wǎng)頁(yè)一致,所述目標(biāo)語(yǔ)言網(wǎng)頁(yè)中每一標(biāo)簽的文字均采用對(duì)應(yīng)的所述翻譯文字。2.如權(quán)利要求1所述的網(wǎng)頁(yè)翻譯方法,其特征在于,S3包括以下步驟: 531、按每一標(biāo)簽翻譯所述待處理文字,生成若干組字符長(zhǎng)度不同的待選翻譯文字; 532、從所述若干組待選翻譯文字中選取一組所占的空間小于或等于該標(biāo)簽的文字顯示區(qū)域的大小的待選翻譯文字作為所述翻譯文字。3.如權(quán)利要求2所述的網(wǎng)頁(yè)翻譯方法,其特征在于,S32包括以下步驟: 5321、逐一調(diào)整所述待選翻譯文字的字體大小,以生成比對(duì)應(yīng)標(biāo)簽的待處理文字的字體大一號(hào)、相同和小一號(hào)的待選翻譯字體文字; 5322、從S321中生成的字號(hào)不同的所述待選翻譯字體文字中選取一組占的空間小于或等于該標(biāo)簽的文字顯示區(qū)域的大小且最接近該標(biāo)簽的文字顯示區(qū)域的大小的所述待選翻譯字體文字作為所述翻譯文字。4.如權(quán)利要求1至3中任一項(xiàng)所述的網(wǎng)頁(yè)翻譯方法,其特征在于,S3包括以下步驟: S31,、采用分詞算法分解所述待處理文字,以生成若干個(gè)待翻譯元素詞; S32,、在翻譯歷史詞庫(kù)中查找每個(gè)待翻譯元素詞匹配的目標(biāo)元素詞,若找不到,則調(diào)用第三方翻譯引擎進(jìn)行翻譯,以得到目標(biāo)元素詞,并將翻譯結(jié)果增加到所述翻譯歷史詞庫(kù)中,所述翻譯歷史詞庫(kù)用于存放所有的歷史翻譯結(jié)果; S33,、以S32.中的目標(biāo)元素詞將所述待處理文字翻譯生成所述翻譯文字。5.如權(quán)利要求4所述的網(wǎng)頁(yè)翻譯方法,其特征在于,S31,包括以下步驟: S31,1、以歷史分詞詞庫(kù)為基礎(chǔ)對(duì)所述待處理文字進(jìn)行分詞; 531.2、以常用傳統(tǒng)分詞詞庫(kù)為基礎(chǔ)對(duì)s31,未分解成功的所述待處理文字的剩余部分進(jìn)行分詞,并將分詞結(jié)果增加到所述歷史分詞詞庫(kù)中,所述歷史分詞詞庫(kù)用于存放所有的歷史待翻譯元素詞; 531.3、以S31,i的分詞結(jié)果和S 31,2的分詞結(jié)果共同生成待翻譯元素詞。6.如權(quán)利要求4所述的網(wǎng)頁(yè)翻譯方法,其特征在于,S31,中所述分詞算法為正向最大匹配算法、歧義消除規(guī)則算法或雙向最大匹配算法。7.—種網(wǎng)頁(yè)翻譯系統(tǒng),其特征在于,包括: 文字提取模塊,用于獲取待翻譯網(wǎng)頁(yè)的每一標(biāo)簽的文字顯示區(qū)域,提取標(biāo)簽中的待處理文字; 區(qū)域大小獲取模塊,用于獲取每一標(biāo)簽的文字顯示區(qū)域的大?。? 文字翻譯模塊,用于按每一標(biāo)簽翻譯所述待處理文字,以生成目標(biāo)語(yǔ)言的翻譯文字,每一標(biāo)簽的翻譯文字所占的空間小于或等于該標(biāo)簽的文字顯示區(qū)域的大?。? 網(wǎng)頁(yè)生成模塊,用于生成目標(biāo)語(yǔ)言網(wǎng)頁(yè),所述目標(biāo)語(yǔ)言網(wǎng)頁(yè)的標(biāo)簽的布局同所述待翻譯網(wǎng)頁(yè)一致,所述目標(biāo)語(yǔ)言網(wǎng)頁(yè)中每一標(biāo)簽的文字均采用對(duì)應(yīng)的所述翻譯文字。8.如權(quán)利要求7所述的網(wǎng)頁(yè)翻譯系統(tǒng),其特征在于,所述文字翻譯模塊包括: 待選翻譯文字生成模塊,用于按每一標(biāo)簽翻譯所述待處理文字,生成若干組字符長(zhǎng)度不同的待選翻譯文字; 文字選取模塊,用于從所述若干組待選翻譯文字中選取一組所占的空間小于或等于該標(biāo)簽的文字顯示區(qū)域的大小的待選翻譯文字作為所述翻譯文字。9.如權(quán)利要求8所述的網(wǎng)頁(yè)翻譯系統(tǒng),其特征在于,所述文字選取模塊包括: 字體大小調(diào)整模塊,用于逐一調(diào)整所述待選翻譯文字的字體大小,以生成比對(duì)應(yīng)標(biāo)簽的待處理文字的字體大一號(hào)、相同和小一號(hào)的待選翻譯字體文字; 翻譯文字選取模塊,用于從所述字體大小調(diào)整模塊中生成的字號(hào)不同的翻譯文字中選取一組占的空間小于或等于該標(biāo)簽的文字顯示區(qū)域的大小且最接近該標(biāo)簽的文字顯示區(qū)域的大小的所述待選翻譯字體文字作為所述翻譯文字。10.如權(quán)利要求7至9中任一項(xiàng)所述的網(wǎng)頁(yè)翻譯系統(tǒng),其特征在于,所述文字翻譯模塊包括: 分詞模塊,用于采用分詞算法分解所述待處理文字,以生成若干個(gè)待翻譯元素詞; 元素詞翻譯模塊,用于在翻譯歷史詞庫(kù)中查找每個(gè)待翻譯元素詞匹配的目標(biāo)元素詞,若找不到,則調(diào)用第三方翻譯引擎進(jìn)行翻譯,以得到目標(biāo)元素詞,并將翻譯結(jié)果增加到所述翻譯歷史詞庫(kù)中,所述翻譯歷史詞庫(kù)用于存放所有的歷史翻譯結(jié)果; 元素詞處理模塊,用于以所述元素詞翻譯模塊中的目標(biāo)元素詞將所述待處理文字翻譯生成所述翻譯文字。11.如權(quán)利要求10所述的網(wǎng)頁(yè)翻譯系統(tǒng),其特征在于,所述分詞模塊包括: 第一分詞模塊,用于以歷史分詞詞庫(kù)為基礎(chǔ)對(duì)所述待處理文字進(jìn)行分詞; 第二分詞模塊,用于以常用傳統(tǒng)分詞詞庫(kù)為基礎(chǔ)對(duì)所述第一分詞模塊中未分解成功的所述待處理文字的剩余部分進(jìn)行分詞,并將分詞結(jié)果增加到所述歷史分詞詞庫(kù)中,所述歷史分詞詞庫(kù)用于存放所有的歷史待翻譯元素詞; 分詞結(jié)果獲取模塊,用于以所述第一分詞模塊的分詞結(jié)果和所述第二分詞模塊的分詞結(jié)果共同生成待翻譯元素詞。
【專利摘要】本發(fā)明公開(kāi)了網(wǎng)頁(yè)翻譯方法和系統(tǒng),其中方法包括:獲取待翻譯網(wǎng)頁(yè)的每一標(biāo)簽的文字顯示區(qū)域,提取標(biāo)簽中的待處理文字;獲取每一標(biāo)簽的文字顯示區(qū)域的大??;按每一標(biāo)簽翻譯所述待處理文字,以生成目標(biāo)語(yǔ)言的翻譯文字,每一標(biāo)簽的翻譯文字所占的空間小于或等于該標(biāo)簽的文字顯示區(qū)域的大?。簧赡繕?biāo)語(yǔ)言網(wǎng)頁(yè),所述目標(biāo)語(yǔ)言網(wǎng)頁(yè)的標(biāo)簽的布局同所述待翻譯網(wǎng)頁(yè)一致,所述目標(biāo)語(yǔ)言網(wǎng)頁(yè)中每一標(biāo)簽的文字均采用對(duì)應(yīng)的所述翻譯文字。本發(fā)明的網(wǎng)頁(yè)翻譯方法和系統(tǒng)保證了翻譯后網(wǎng)頁(yè)同待翻譯網(wǎng)頁(yè)的布局的高契合度,提高了翻譯的準(zhǔn)確性和一致性,重復(fù)利用歷史數(shù)據(jù)提高了翻譯效率,減少人工參與的工作量,從而降低了人工成本。
【IPC分類】G06F17/28, G06F17/30
【公開(kāi)號(hào)】CN104881406
【申請(qǐng)?zhí)枴緾N201510330503
【發(fā)明人】李錫銘, 韓子成, 祁勱, 劉帥
【申請(qǐng)人】攜程計(jì)算機(jī)技術(shù)(上海)有限公司
【公開(kāi)日】2015年9月2日
【申請(qǐng)日】2015年6月15日