專利名稱:一種計算機在線翻譯方法及其翻譯系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計算機輔助人工翻譯領(lǐng)域。
背景技術(shù):
目前的計算機輔助翻譯工具都是基于“翻譯記憶”的工作原理,即將翻譯好的文章以雙語對應(yīng)的平行語料庫的形式存儲起來,下次翻譯同類文章時,計算機先將原文與平行語料庫里的原文進行對比,若有完全相同或部分相同的句子,計算機就將這個句子和譯文一起顯示給譯員,譯員可以直接拷貝或修改使用,以達到省時省力的效果,降低翻譯成本。 但是因為現(xiàn)有的計算機輔助翻譯工具不提供翻譯記憶庫,而譯者或翻譯公司自行建庫速度慢、難度大,加上大家都不想無償貢獻自己的勞動,所以一般翻譯記憶都是譯員自己使用或公司內(nèi)部分享,不但浪費了很好的語言資產(chǎn),也使得實現(xiàn)計算機輔助翻譯工具的省時省力功能變得很困難。
發(fā)明內(nèi)容
本發(fā)明的目的是針對現(xiàn)有技術(shù)的不足,提供一種將源語文章分割為句子或更小單位,通過網(wǎng)絡(luò)發(fā)布到譯者群,并通過對句子在文章中的順序及譯者著作權(quán)標記,根據(jù)譯者工作量或翻譯記憶被引用的數(shù)量給譯者支付報酬,從而能使資源利用最大化、省時省力、翻譯效率高、成本低的計算機在線翻譯方法及其翻譯系統(tǒng)。本發(fā)明采用如下技術(shù)方案一種計算機在線翻譯方法,其特征在于需要翻譯的源文文本在上傳后被分割成句子單元;根據(jù)其在文章中的順序這些句子單元被打上身份和順序標簽;譯者選擇適當?shù)木渥訂卧g后,該句子單元被打上譯者身份標簽;然后按照源語文本中的位置重新組合成完整的譯文;同時將翻譯好的句子單元放入在線翻譯記憶庫里供自動匹配器搜索,被匹配的句子單元記錄在譯者著作權(quán)統(tǒng)計信息里,以此支付每次被使用的稿酬。本發(fā)明可以根據(jù)標點符號判斷等預(yù)定規(guī)則將源文分割成為句子單元,句子單元可以包括自然句子、詞組、單詞等。根據(jù)上述方法,本發(fā)明提供了計算機在線翻譯系統(tǒng),其特征在于包括文本上傳器、文本切割器、句子身份和順序標記器、在線翻譯記憶庫、譯文輸入編輯器、翻譯記憶匹配器、譯文重組器,同時還帶有報酬結(jié)算器、譯文下載器,其中文本上傳器用于上傳需要翻譯的文本;文本切割器根據(jù)預(yù)定的規(guī)則按標點符號等判斷將源文分割成為句子單元;句子身份和順序標記器將每個句子標記上它在文章中的順序標簽;在線翻譯記憶庫記錄了所有譯員在本系統(tǒng)里翻譯過或另外提交的翻譯記憶;譯文輸入編輯器供譯員輸入與源語對應(yīng)的譯文;翻譯記憶匹配器,它將譯員輸入的譯文與在線翻譯記憶庫里存儲的句子或詞組進行匹配對應(yīng),有完全匹配或部分匹配的,顯示給譯員進行選用;譯文重組器重新將譯文根據(jù)源語文本的順序組合成完整的譯文;譯員選用了他人的翻譯記憶,由譯者著作權(quán)統(tǒng)計器統(tǒng)計,報酬結(jié)算器里向翻譯記憶著作權(quán)所有人支付報酬;譯文下載器供下載完成的目標語譯文。
本系統(tǒng)還可帶有句子發(fā)布器和翻譯記憶質(zhì)量評價裝置,句子發(fā)布器根據(jù)句子的復(fù)雜程度和難度將其分類,供不同的譯員選擇;翻譯記憶質(zhì)量評價裝置反饋每個句子或譯者的翻譯質(zhì)量,為以后譯者引用翻譯記憶作參考。本發(fā)明由于譯者不但得到第一次翻譯該句子的稿酬,還能得到后續(xù)一次或多次翻譯記憶使用的稿酬。這種激勵機制會促使譯員或翻譯公司將其翻譯記憶放到在線翻譯記憶庫里與他人分享,使計算機輔助翻譯工具的效率大大提高;本系統(tǒng)通過以句子為單位登記譯者著作權(quán),使譯員或翻譯公司將翻譯記憶拿出來有償分享,不但能從翻譯新句子時拿到稿酬,還可以從后續(xù)的翻譯記憶出售拿到多次稿酬,同時因為一篇文章可以拆散向整個譯者群發(fā)布,可以讓眾多譯員同時翻譯一篇文章,大大縮短交稿時間,等系統(tǒng)積累到大量的翻譯記憶后有望實現(xiàn)所有文章的自動翻譯,到那時,本系統(tǒng)即同時可以有機器翻譯的速度以及人工翻譯的質(zhì)量,達到計算機輔助翻譯系統(tǒng)效率最大化。
圖I為本發(fā)明在線翻譯系統(tǒng)示意圖。
具體實施例方式一種計算機在線翻譯方法,包括如下步驟A、輸入要翻譯的源文;B、根據(jù)標點符號判斷將源文分割成為自然句子;C、將每個句子標記上其在源文中的順序發(fā)布給不同的譯者;D、譯者將句子翻譯成目標語后,句子被標記上譯者身份信息;E、按照源語文本中句子的順序?qū)⒛繕苏Z組成完整譯文;F、將翻譯好的句子單元放入在線翻譯記憶庫里供自動匹配器搜索,被匹配的句子單元記錄在譯者著作權(quán)統(tǒng)計信息里,以此支付每次被使用的稿酬。本發(fā)明譯者可以查看句子的上下文,以更好地翻譯句子。如圖I所示,本發(fā)明提供了計算機在線翻譯系統(tǒng),翻譯客戶登錄客戶端后通過源語文本上傳器I上傳需要翻譯的文章,該文章由文本切割器2將文章根據(jù)標點符號判斷等預(yù)定規(guī)則將源文分割成為自然句子或詞組,句子身份和順序標記器3給每個句子標記上它在文章中的順序編號。編號后的句子通過句子發(fā)布器4向譯者用戶群發(fā)布。譯者用戶可以根據(jù)自己的翻譯水平和速度選擇適合自己翻譯的句子,在譯文輸入編輯器5輸入與源語句子對應(yīng)的譯文。譯文輸入編輯器5里可以顯示句子所在的整片文章,供譯者更好地了解整篇文章的文體、風格和上下文結(jié)構(gòu)。輸入的譯文通過翻譯記憶匹配器7在在線翻譯記憶庫6里尋找匹配,在線翻譯記憶庫6里存儲了其他譯者和譯者本人以前的翻譯記憶。找到和源語匹配的句子后在譯文輸入編輯器5里顯示其對應(yīng)的目標語譯文翻譯記憶,供譯者選用。通過譯者著作權(quán)標記器8,譯者自己翻譯的句子被打上譯者著作權(quán)標簽,引用他人在在線翻譯記憶庫6里的句子則繼承原譯者的著作權(quán)標簽。各個譯者提交的譯文句子在譯文重組器9里根據(jù)源語的句子順序編號進行排列,獲得順序正確的完整譯文。譯者新翻譯的、在線翻譯記憶庫6里沒有的句子被當作翻譯記憶存儲到在線翻譯記憶庫里,為以后匹配的翻譯記憶源。譯者的工作量通過譯者著作權(quán)標記器8記錄,綜合計算新翻譯句子的字數(shù)和被引用的翻譯記憶的字數(shù)得出,通過報酬結(jié)算器10付費。付費后,客戶可以通過譯文下載器11下載完成的譯文??蛻艉鸵梅g記憶的譯者可以通過翻譯記憶質(zhì)量評價裝置12反饋 每個句子或譯者的翻譯質(zhì)量,為以后譯者引用翻譯記憶作參考。評價高的句子和譯者會被更多引用,達到激勵提高翻譯質(zhì)量的目的。
權(quán)利要求
1.一種計算機在線翻譯方法,其特征在于需要翻譯的源文文本在上傳后被分割成句子單元;根據(jù)其在文章中的順序這些句子單元被打上順序標簽;譯者選擇適當?shù)木渥訂卧g后,該句子單元被打上譯者身份標簽;然后按照源語文本中的位置重新組合成完整的譯文;同時將翻譯好的句子單元放入在線翻譯記憶庫里供自動匹配器搜索,被匹配的句子單元記錄在譯者著作權(quán)統(tǒng)計信息里,以此支付每次被使用的稿酬。
2.根據(jù)權(quán)利要求I所述的計算機在線翻譯方法,其特征在于源文文本在上傳后根據(jù)標點符號判斷將源文分割成為句子單元。
3.根據(jù)權(quán)利要求I或2所述的計算機在線翻譯方法,其特征在于句子單元包括自然句子、詞組、單詞。
4.一種計算機在線翻譯系統(tǒng),其特征在于包括文本上傳器、文本切割器、一句子身份和順序標記器、一句子發(fā)布器、在線翻譯記憶庫、譯文輸入編輯器、翻譯記憶匹配器、譯文重組器,其中文本上傳器用于上傳需要翻譯的文本;文本切割器根據(jù)預(yù)定的規(guī)則按標點符號等判斷將源文分割成為句子單元;句子身份和順序標記器將每個句子標記上它在文章中的順序標簽;在線翻譯記憶庫庫記錄了所有譯員在本系統(tǒng)里翻譯過或另外提交的翻譯記憶;譯文輸入編輯器供譯員輸入與源語對應(yīng)的譯文;一翻譯記憶匹配器,它將譯員輸入的譯文與在線翻譯記憶庫里存儲的句子或詞組進行匹配對應(yīng),有完全匹配或部分匹配的,顯示給譯員進行選用;譯文重組器重新將譯文根據(jù)源語文本的順序組合成完整的譯文;譯員選用了他人的翻譯記憶,由譯者著作權(quán)統(tǒng)計器統(tǒng)計,在報酬結(jié)算器里向翻譯記憶著作權(quán)所有人支付報酬;譯文下載器供下載完成的目標語譯文。
5.根據(jù)權(quán)利要求4所述的計算機在線翻譯系統(tǒng),其特征在于該系統(tǒng)帶有句子發(fā)布器,根據(jù)句子的復(fù)雜程度和難度將其分類,供不同的譯員選擇。
6.根據(jù)權(quán)利要求4或5所述的計算機在線翻譯系統(tǒng),其特征在于該系統(tǒng)帶有一翻譯記憶質(zhì)量評價裝置。
全文摘要
本發(fā)明屬于計算機輔助人工翻譯領(lǐng)域類,具體是一種計算機在線翻譯方法及其翻譯系統(tǒng),其特征在于需要翻譯的源文文本在上傳后被分割成句子單元,根據(jù)其在文章中的順序這些句子單元被打上身份和順序標簽,譯者選擇適當?shù)木渥訂卧g后,該句子單元被打上譯者身份標簽,然后按照源語文本中的位置重新組合成完整的譯文;同時將翻譯好的句子單元放入在線翻譯記憶庫里供自動匹配器搜索,被匹配的句子單元記錄在譯者著作權(quán)統(tǒng)計信息里,以此支付每次被使用的稿酬。本發(fā)明能使資源利用最大化、省時省力、翻譯效率高、成本低的計算機在線翻譯方法及其翻譯系統(tǒng)。
文檔編號G06F17/28GK102708097SQ20121012850
公開日2012年10月3日 申請日期2012年4月27日 優(yōu)先權(quán)日2012年4月27日
發(fā)明者曾立人 申請人:曾立人