翻譯系統(tǒng)中使用語料等級評價方法
【技術領域】
[0001]本發(fā)明涉及翻譯系統(tǒng)領域,具體地,涉及翻譯系統(tǒng)中使用語料等級評價方法。
【背景技術】
[0002]翻譯軟件,將一種語言翻譯為另一種語言的軟件,分為在線翻譯軟件和本地翻譯軟件,無論是我們平時瀏覽網(wǎng)頁還是閱讀文獻都會或多或少遇到幾個難懂的英文詞匯,這時我們就不免要翻詞典了,且單位、公司、企業(yè)對于外文的翻譯都有需求,無論是何種語言之間的轉換,都關系到其切身利益。
[0003]網(wǎng)上的詞典工具大概可以分為兩種:離線詞典,就是可以不用聯(lián)網(wǎng),只要下載安裝并運行就可以方便取詞在線翻譯;另外一種是在線翻譯詞典,它需要我們訪問一個網(wǎng)站,而后輸入要查找的詞匯等。
[0004]從上世紀80年代中期開始,基于語料和多引擎機譯方法的廣泛運用,翻譯軟件的性能和效率有了明顯提高,各式各樣的翻譯軟件如雨后春筍般問世。翻譯軟件消除了不同文字和語言間的隔閡,堪稱高科技造福人類之舉,但其譯文質量長期以來一直是個問題,離理想目標仍相差甚遠,原因在于機器翻譯具有一些特殊的困難,制約譯文質量的瓶頸所在。
[0005]在現(xiàn)有翻譯系統(tǒng)中使用語料的排序情況是固定不變的,無法根據(jù)使用者后期的使用情況的變化而進行相應的調(diào)整,缺乏自我優(yōu)化能力,使用不靈活,已無法滿足現(xiàn)有用戶的需要。
【發(fā)明內(nèi)容】
[0006]本發(fā)明所要解決的技術問題是提供翻譯系統(tǒng)中使用語料等級評價方法,當用戶使用語料的情況發(fā)生變化時,能夠對使用語料排序進行動態(tài)調(diào)整,不斷進行自我優(yōu)化,實時得出任意時點所對應的語料和語料提供者排序,使用靈活,用戶借鑒性強。
[0007]本發(fā)明解決上述問題所采用的技術方案是:翻譯系統(tǒng)中使用語料等級評價方法,包括如下步驟:
A)上傳需要翻譯的語料到翻譯系統(tǒng)中;
B)在翻譯系統(tǒng)中的已有語料中查找是否有重復的需要翻譯的語料,對于已重復的語料則在該語料總得分上加0.1倍語料重復得分,在語料提供者得分上減0.3倍重復得分;
C)在使用語料的過程中,采用pagerank思想,針對提供者和語料本身計算各自得分,每當有語料被展示一次,在該語料總得分上減0.1倍語料展示得分,該語料被采用一次,則在語料總得分上加上0.8倍語料采用得分且在語料提供者得分上加0.7倍采用得分;
D)基于步驟C)算出語料總得分和語料提供者得分,根據(jù)得分得出語料和語料提供者的等級。
[0008]在本方法中語料重復得分=上傳人數(shù)個數(shù)/語料被上傳次數(shù),語料采用得分=sum(本語料被某一用戶使用次數(shù)/某一用戶總共使用語料數(shù)),語料展示得分=sum(本語料展示給某一用戶的次數(shù)/該用戶總查看語料數(shù)),采用得分=sum (該語料提供者的某一語料被使用的次數(shù)/該語料被展示次數(shù)),重復得分=sum (重復語料的上傳人數(shù)個數(shù)/被上傳次數(shù)),語料總得分=語料重復得分*0.1+語料采用得分*0.8-語料展示得分*0.1,語料提供者得分=采用得分*0.7-重復得分*0.3,前面涉及到的sum代表的是求和函數(shù),前面涉及到的系數(shù)均是通過多次試驗后得到的最優(yōu)系數(shù)用于統(tǒng)計分數(shù),語料代表的是需要翻譯的詞語或者是句段,通過該方法能夠對語料總得分和語料提供者得分進行實時的統(tǒng)計,并對最終的統(tǒng)計結果進行分數(shù)由高到低的排序,從而得出精確的實時排序情況提供給使用者使用,借鑒性更強,隨著使用時間的推移,還能不斷的進行自我優(yōu)化,提高翻譯的準確度和效率。而原有的翻譯系統(tǒng)中只能對語料進行固定排序,當使用者常用語料發(fā)生變化時,翻譯系統(tǒng)中語料和語料提供者的排序無法不斷的進行自我優(yōu)化,在準確性和效率方面均存在缺陷,與以往的翻譯系統(tǒng)的方法相比,該方法優(yōu)勢明顯。
[0009]進一步的,步驟C)中語料總得分的計算公式為:語料總得分=語料重復得分*0.1+語料采用得分*0.8-語料展示得分*0.1+語料初始值,其中的語料重復得分=上傳人數(shù)個數(shù)/語料被上傳次數(shù),其中的語料采用得分=sum (本語料被某一用戶使用次數(shù)/某一用戶總共使用語料數(shù)),其中的語料展示得分=sum (本語料展示給某一用戶的次數(shù)/該用戶總查看語料數(shù)),其中的語料初始值為人為設定。
[0010]進一步的,步驟C)中語料提供者得分的計算公式為:語料提供者得分=采用得分*0.7-重復得分*0.3+上傳得分*0.2+語料提供者初始值,其中的采用得分=sum (該語料提供者的某一語料被使用的次數(shù)/該語料被展示次數(shù)),其中的重復得分=sum (重復語料的上傳人數(shù)個數(shù)/被上傳次數(shù)),其中的上傳得分=log (上傳語料數(shù))。前面提到的log為10為底數(shù)的指數(shù)函數(shù),其中的語料提供初始值為人為設定。在語料總得分的基礎上加上語料初始值,在語料提供者得分的基礎上加上語料提供者初始值,是為了避免語料總得分和語料提供者得分最后出現(xiàn)負數(shù),不方便后面對語料總得分和語料提供者得分進行排序,通過設置初始值則避免出現(xiàn)總分為負數(shù)的情況,最后的排序結果更準確,后期的參考價值更高。而在語料提供者得分中還加入了 0.2倍上傳得分,對語料提供者得分進行進一步優(yōu)化,使最后的得分情況更加的合理。
[0011]進一步的,步驟D)中語料和語料提供者的等級單獨評定,當語料總得分或語料提供者得分小于等于1萬且得分排名小于等于10%為A級,當語料總得分或語料提供者得分小于等于1萬且10% <得分排名5 30%為B級,當語料總得分或語料提供者得分小于等于1萬且30% <得分排名5 40%為C級;當語料總得分或語料提供者得分大于1萬且得分排名小于等于1%為SSS級,當語料總得分或語料提供者得分大于1萬且1% <得分排名5 5%為SS級,當語料總得分或語料提供者得分大于1萬且5% <得分排名5 10%為S級。該種等級評價方式僅是根據(jù)得分得出語料和語料提供者的等級的一種形式,也可以采用其他形式對語料和語料提供者進行等級區(qū)分,但該種形式的等級形式已經(jīng)能夠滿足后期用戶使用的需要。
[0012]綜上,本發(fā)明的有益效果是:
本方法能夠對語料總得分和語料提供者得分進行實時的統(tǒng)計,對使用語料排序進行動態(tài)調(diào)整,不斷進行自我優(yōu)化,實時得出任意時點所對應的語料和語料提供者排序,將語料和語料提供者分為多個等級,從而得出精確的等級情況提供給使用者使用,借鑒性更強,提高翻譯的準確度和效率。
【具體實施方式】
[0013]下面結合實施例對本發(fā)明作進一步地的詳細說明,但本發(fā)明的實施方式不限于此。
[0014]實施例1:
本發(fā)明公開了翻譯系統(tǒng)中使用語料等級評價方法,包括如下步驟:
A)上傳需要翻譯的語料到翻譯系統(tǒng)中;
B)在翻譯系統(tǒng)中的已有語料中查找是否有重復的需要翻譯的語料,對于已重復的語料則在該語料總得分上加0.1倍語料重復得分,在語料提供者得分上減0.3倍重復得分;
C)在使用語料的過程中,采用pagerank思想,針對提供者和語料本身計算各自得分,每當有語料被展示一次,在該語料總得分上減0.1倍語料展示得分,該語料被采用一次,則在語料總得分上加上0.8倍語料采用得分且在語料提供者得分上加0.7倍采用得分;
D)基于步驟C)算出語料總得分和語料提供者得分,根據(jù)得分得出語料和語料提供者的等級。
[0015]在本方