翻譯系統(tǒng)中使用語料等級評價方法

文檔序號：9579246閱讀：408來源：國知局

翻譯系統(tǒng)中使用語料等級評價方法
【技術領域】
[0001]本發(fā)明涉及翻譯系統(tǒng)領域，具體地，涉及翻譯系統(tǒng)中使用語料等級評價方法。
【背景技術】
[0002]翻譯軟件，將一種語言翻譯為另一種語言的軟件，分為在線翻譯軟件和本地翻譯軟件，無論是我們平時瀏覽網(wǎng)頁還是閱讀文獻都會或多或少遇到幾個難懂的英文詞匯，這時我們就不免要翻詞典了，且單位、公司、企業(yè)對于外文的翻譯都有需求，無論是何種語言之間的轉換，都關系到其切身利益。
[0003]網(wǎng)上的詞典工具大概可以分為兩種:離線詞典，就是可以不用聯(lián)網(wǎng)，只要下載安裝并運行就可以方便取詞在線翻譯；另外一種是在線翻譯詞典，它需要我們訪問一個網(wǎng)站，而后輸入要查找的詞匯等。
[0004]從上世紀80年代中期開始，基于語料和多引擎機譯方法的廣泛運用，翻譯軟件的性能和效率有了明顯提高，各式各樣的翻譯軟件如雨后春筍般問世。翻譯軟件消除了不同文字和語言間的隔閡，堪稱高科技造福人類之舉，但其譯文質量長期以來一直是個問題，離理想目標仍相差甚遠，原因在于機器翻譯具有一些特殊的困難，制約譯文質量的瓶頸所在。
[0005]在現(xiàn)有翻譯系統(tǒng)中使用語料的排序情況是固定不變的，無法根據(jù)使用者后期的使用情況的變化而進行相應的調(diào)整，缺乏自我優(yōu)化能力，使用不靈活，已無法滿足現(xiàn)有用戶的需要。

【發(fā)明內(nèi)容】

[0006]本發(fā)明所要解決的技術問題是提供翻譯系統(tǒng)中使用語料等級評價方法，當用戶使用語料的情況發(fā)生變化時，能夠對使用語料排序進行動態(tài)調(diào)整，不斷進行自我優(yōu)化，實時得出任意時點所對應的語料和語料提供者排序，使用靈活，用戶借鑒性強。
[0007]本發(fā)明解決上述問題所采用的技術方案是:翻譯系統(tǒng)中使用語料等級評價方法，包括如下步驟:
A)上傳需要翻譯的語料到翻譯系統(tǒng)中；
B)在翻譯系統(tǒng)中的已有語料中查找是否有重復的需要翻譯的語料，對于已重復的語料則在該語料總得分上加0.1倍語料重復得分，在語料提供者得分上減0.3倍重復得分；
C)在使用語料的過程中，采用pagerank思想，針對提供者和語料本身計算各自得分，每當有語料被展示一次，在該語料總得分上減0.1倍語料展示得分，該語料被采用一次，則在語料總得分上加上0.8倍語料采用得分且在語料提供者得分上加0.7倍采用得分；
D)基于步驟C)算出語料總得分和語料提供者得分，根據(jù)得分得出語料和語料提供者的等級。
[0008]在本方法中語料重復得分=上傳人數(shù)個數(shù)/語料被上傳次數(shù)，語料采用得分=sum(本語料被某一用戶使用次數(shù)/某一用戶總共使用語料數(shù))，語料展示得分=sum(本語料展示給某一用戶的次數(shù)/該用戶總查看語料數(shù))，采用得分=sum (該語料提供者的某一語料被使用的次數(shù)/該語料被展示次數(shù))，重復得分=sum (重復語料的上傳人數(shù)個數(shù)/被上傳次數(shù))，語料總得分=語料重復得分*0.1+語料采用得分*0.8-語料展示得分*0.1，語料提供者得分=采用得分*0.7-重復得分*0.3，前面涉及到的sum代表的是求和函數(shù)，前面涉及到的系數(shù)均是通過多次試驗后得到的最優(yōu)系數(shù)用于統(tǒng)計分數(shù)，語料代表的是需要翻譯的詞語或者是句段，通過該方法能夠對語料總得分和語料提供者得分進行實時的統(tǒng)計，并對最終的統(tǒng)計結果進行分數(shù)由高到低的排序，從而得出精確的實時排序情況提供給使用者使用，借鑒性更強，隨著使用時間的推移，還能不斷的進行自我優(yōu)化，提高翻譯的準確度和效率。而原有的翻譯系統(tǒng)中只能對語料進行固定排序，當使用者常用語料發(fā)生變化時，翻譯系統(tǒng)中語料和語料提供者的排序無法不斷的進行自我優(yōu)化，在準確性和效率方面均存在缺陷，與以往的翻譯系統(tǒng)的方法相比，該方法優(yōu)勢明顯。
[0009]進一步的，步驟C)中語料總得分的計算公式為:語料總得分=語料重復得分*0.1+語料采用得分*0.8-語料展示得分*0.1+語料初始值，其中的語料重復得分=上傳人數(shù)個數(shù)/語料被上傳次數(shù)，其中的語料采用得分=sum (本語料被某一用戶使用次數(shù)/某一用戶總共使用語料數(shù))，其中的語料展示得分=sum (本語料展示給某一用戶的次數(shù)/該用戶總查看語料數(shù))，其中的語料初始值為人為設定。
[0010]進一步的，步驟C)中語料提供者得分的計算公式為:語料提供者得分=采用得分*0.7-重復得分*0.3+上傳得分*0.2+語料提供者初始值，其中的采用得分=sum (該語料提供者的某一語料被使用的次數(shù)/該語料被展示次數(shù))，其中的重復得分=sum (重復語料的上傳人數(shù)個數(shù)/被上傳次數(shù))，其中的上傳得分=log (上傳語料數(shù))。前面提到的log為10為底數(shù)的指數(shù)函數(shù)，其中的語料提供初始值為人為設定。在語料總得分的基礎上加上語料初始值，在語料提供者得分的基礎上加上語料提供者初始值，是為了避免語料總得分和語料提供者得分最后出現(xiàn)負數(shù)，不方便后面對語料總得分和語料提供者得分進行排序，通過設置初始值則避免出現(xiàn)總分為負數(shù)的情況，最后的排序結果更準確，后期的參考價值更高。而在語料提供者得分中還加入了 0.2倍上傳得分，對語料提供者得分進行進一步優(yōu)化，使最后的得分情況更加的合理。
[0011]進一步的，步驟D)中語料和語料提供者的等級單獨評定，當語料總得分或語料提供者得分小于等于1萬且得分排名小于等于10%為A級，當語料總得分或語料提供者得分小于等于1萬且10% <得分排名5 30%為B級，當語料總得分或語料提供者得分小于等于1萬且30% <得分排名5 40%為C級；當語料總得分或語料提供者得分大于1萬且得分排名小于等于1%為SSS級，當語料總得分或語料提供者得分大于1萬且1% <得分排名5 5%為SS級，當語料總得分或語料提供者得分大于1萬且5% <得分排名5 10%為S級。該種等級評價方式僅是根據(jù)得分得出語料和語料提供者的等級的一種形式，也可以采用其他形式對語料和語料提供者進行等級區(qū)分，但該種形式的等級形式已經(jīng)能夠滿足后期用戶使用的需要。
[0012]綜上，本發(fā)明的有益效果是:
本方法能夠對語料總得分和語料提供者得分進行實時的統(tǒng)計，對使用語料排序進行動態(tài)調(diào)整，不斷進行自我優(yōu)化，實時得出任意時點所對應的語料和語料提供者排序，將語料和語料提供者分為多個等級，從而得出精確的等級情況提供給使用者使用，借鑒性更強，提高翻譯的準確度和效率。
【具體實施方式】
[0013]下面結合實施例對本發(fā)明作進一步地的詳細說明，但本發(fā)明的實施方式不限于此。
[0014]實施例1:
本發(fā)明公開了翻譯系統(tǒng)中使用語料等級評價方法，包括如下步驟:
A)上傳需要翻譯的語料到翻譯系統(tǒng)中；
B)在翻譯系統(tǒng)中的已有語料中查找是否有重復的需要翻譯的語料，對于已重復的語料則在該語料總得分上加0.1倍語料重復得分，在語料提供者得分上減0.3倍重復得分；
C)在使用語料的過程中，采用pagerank思想，針對提供者和語料本身計算各自得分，每當有語料被展示一次，在該語料總得分上減0.1倍語料展示得分，該語料被采用一次，則在語料總得分上加上0.8倍語料采用得分且在語料提供者得分上加0.7倍采用得分；
D)基于步驟C)算出語料總得分和語料提供者得分，根據(jù)得分得出語料和語料提供者的等級。
[0015]在本方

完整全部詳細技術資料下載

當前第1頁1 2

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：張馬成;王興強;屈耕;熊易;
技術所有人：成都優(yōu)譯信息技術有限公司;
我是此專利的發(fā)明人

上一篇：用于翻譯教學系統(tǒng)的術語萃取方法
上一篇：翻譯系統(tǒng)中語料推薦方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

ccl語料庫檢索系統(tǒng)相關技術

王陸語料庫使用方法相關技術

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

翻譯系統(tǒng)中使用語料等級評價方法