帶有跨語言閱讀向導的計算機輔助閱讀系統(tǒng)和方法

文檔序號：6468099閱讀：369來源：國知局

專利名稱：帶有跨語言閱讀向導的計算機輔助閱讀系統(tǒng)和方法
技術領域：
本發(fā)明涉及機器輔助閱讀系統(tǒng)和方法，更具體地說，本發(fā)明涉及有助于用戶閱讀非母語的一種用戶界面和基礎體系結構。
背景技術：
隨著因特網的快速發(fā)展，遍布全世界的計算機用戶正在越來越多地面對非母語寫成的文字材料。許多用戶對非母語完全不懂。即使用戶進行了一些非母語培訓，該用戶也往往難以閱讀和理解非母語。
考慮某個中國用戶訪問以英語寫成的網頁或其它電子文檔的情況。這個中國用戶在校期間可能接受過某些正規(guī)的英語培訓，但是這種培訓往往不足以使他完全地閱讀和理解以英語寫成的、特定的單詞、短語或者語句。這種漢語-英語的情況僅僅是用于說明這一點的一個例子而已。這個問題在跨越其它語言邊界時也是存在的。
所以，本發(fā)明起源于提供機器輔助閱讀系統(tǒng)和方法有關的問題，這些系統(tǒng)和方法幫助計算機用戶閱讀和理解非母語表達的文字材料。

發(fā)明內容
某個用戶正在以非母語進行閱讀，當他需要幫助時，計算機輔助閱讀系統(tǒng)為他提供幫助，而無需該用戶從文本上轉移注意力。
在一個實施例中，閱讀系統(tǒng)的實現(xiàn)形式為瀏覽程序的閱讀向導。這種閱讀向導通過某個圖形用戶界面(UI)而顯現(xiàn)，該用戶界面允許用戶在非母語的文本中選擇某個單詞、短語、語句或者單詞的其它組合，并查看選定文本在該用戶自己母語中的譯文。該譯文在選定文本附近的窗口或彈出框中出現(xiàn)，以便使分心最小。
一方面，閱讀向導的核心包括淺層分析器、統(tǒng)計單詞譯文選擇器和譯文生成器。淺層分析器把用戶選定的非母語文本中的短語或語句分解成單獨的翻譯單位(例如短語、單詞)。在一個實施例中，淺層分析器將選定文本中的單詞劃分成片段，并從詞態(tài)學的角度對其進行分析，以獲得每個單詞的詞態(tài)學詞根。為了進一步選擇譯文，淺層分析器采用語句部分(POS)標簽和基本名詞短語(baseNP)標識，按照特征劃分單詞和短語。例如，POS標簽和baseNP標識可以由某個統(tǒng)計模型來實現(xiàn)。淺層分析器對這些單詞應用基于規(guī)則的短語擴展和模式匹配，以產生樹列表。
對于從非母語文本剖析中得出的翻譯單位，統(tǒng)計單詞譯文選擇器選擇最優(yōu)的候選單詞譯文。單詞譯文選擇器產生所有可能的譯文模式，并使用統(tǒng)計翻譯和語言模型對該翻譯單位進行翻譯。輸出的是最優(yōu)的候選譯文。
譯文生成器將候選單詞譯文轉換成母語中對應的短語。譯文生成器部分地使用母語模型，以幫助確定適當?shù)淖g文。然后，母語單詞和短語就通過鄰近選定文本的UI顯示出來。
附圖簡要說明

圖1是一個計算機系統(tǒng)的框圖，它實現(xiàn)了帶有跨語言閱讀向導的閱讀系統(tǒng)。
圖2是一個實施例中示范淺層分析器的框圖。
圖3是一張示意圖，用于理解一個實施例中進行的處理。
圖4是一張示意圖，用于理解圖3中的示意圖。
圖5是一張流程圖，介紹一個實施例中方法的步驟。
圖6是一張示意圖，用于理解一個實施例中進行的處理。
圖7是一張流程圖，介紹一個實施例中方法的步驟。
圖8是一個實施例中示范譯文生成器的框圖。
圖9至圖13顯示了一個實施例中多種示范用戶界面。
具體實施例方式
概述計算機輔助閱讀系統(tǒng)幫助用戶閱讀非母語。為了進行討論，在一般的瀏覽程序范圍內介紹計算機輔助閱讀系統(tǒng)，該程序在通用計算機上運行。不過，計算機輔助閱讀系統(tǒng)也可以在許多不同的非瀏覽環(huán)境中實現(xiàn)(例如電子郵件系統(tǒng)、字處理等)，并且可以在許多各式各樣類型的設備上實行。
下面介紹的實施例，允許更樂于使用母語交流的用戶快捷方便地廣泛閱讀非母語的電子文檔，而且其方式促進了集中精力和快速消化有關內容。在要翻譯文本的近旁提供帶有譯文窗口的用戶界面，可以增加用戶的便利。譯文窗口中包含著文本翻譯后的譯文。將譯文窗口放在要翻譯文本的近旁，用戶的雙眼不必移動很遠即可確定要翻譯的文本。這又減少了用戶可察覺的分心，舉例來說，假若為了查看要翻譯的文本，用戶的目光需要掃視一段距離，這種分心就很難避免。
在某些實施例中，光標翻譯處理的優(yōu)點使得用戶交互進一步增強。利用鼠標移動來選擇文本的位置，用戶能夠進行快速選擇，系統(tǒng)據(jù)此自動執(zhí)行翻譯并將翻譯后的文本向用戶顯示。
示范系統(tǒng)體系結構圖1顯示了示范計算機系統(tǒng)100，它具有中央處理器(CPU)102、存儲器104和輸入/輸出(I/O)接口106。CPU102與存儲器104和I/O接口106通信。存儲器104既代表易失性存儲器(例如RAM)，又代表非易失性存儲器(例如ROM、硬盤等)。程序和數(shù)據(jù)文件可以存放在存儲器104中，并在CUP102上執(zhí)行。
計算機系統(tǒng)100通過I/O接口106連接著一臺或多臺外圍設備。示范外圍設備包括鼠標110、鍵盤112(例如字母數(shù)字QWERTY鍵盤、電話鍵盤等)、顯示監(jiān)視器114、打印機116、外部存儲設備118和話筒120。例如，該計算機系統(tǒng)可以作為通用計算機。所以，計算機系統(tǒng)100執(zhí)行一種計算機操作系統(tǒng)(未顯示)，該操作系統(tǒng)在存儲器104中存放，在CUP102上執(zhí)行。該操作系統(tǒng)最好是一種支持窗口環(huán)境的多任務操作系統(tǒng)。適宜的操作系統(tǒng)的一個實例是微軟公司的Windows品牌操作系統(tǒng)。
應當注意，也可以使用其它計算機系統(tǒng)配置，比如手持設備、多處理器系統(tǒng)、基于微處理器的或者可編程的消費電子產品、網絡PC、小型計算機、大型計算機等等。此外，盡管圖1中展示的是一種獨立的計算機，語言輸入系統(tǒng)也可以在分布式計算環(huán)境中實現(xiàn)，通過通信網絡(例如LAN、因特網等)連接的遠程處理設備完成其中的任務。在分布式計算環(huán)境中，程序模塊既可以位于本機的存儲設備中，也可以位于遠程存儲設備中。
示范閱讀系統(tǒng)計算機系統(tǒng)100實現(xiàn)了閱讀系統(tǒng)130，它幫助用戶閱讀非母語。該閱讀系統(tǒng)可以在單詞、短語或者語句的級別提供幫助。在圖1中實現(xiàn)的閱讀系統(tǒng)是作為瀏覽程序132，它在存儲器104中存放，在CUP102上執(zhí)行。應當重視和理解，下面介紹的閱讀系統(tǒng)也可以在瀏覽器范圍以外的氛圍中實現(xiàn)。
閱讀系統(tǒng)130具有用戶界面134和跨語言閱讀向導136。UI134展現(xiàn)跨語言閱讀向導136。除了閱讀系統(tǒng)之外，瀏覽器程序132還可以包括其它組件，但是這類組件對于瀏覽器程序被視為標準的，因此將不進行詳細顯示和介紹。
閱讀向導136包括淺層分析器140、統(tǒng)計單詞譯文選擇器142和譯文生成器144。
示范淺層分析器淺層分析器140把選定的非母語文本中的短語或語句分解成單獨的翻譯單位(例如短語、單詞)。
圖2稍微詳細地顯示了一個實施例中的淺層分析器。在任何適當?shù)挠布?、軟件、固件或者它們的組合中，都可以實現(xiàn)該淺層分析器。在這個展示和介紹的實施例中，淺層分析器是在軟件中實現(xiàn)的。
如圖所示，淺層分析器140包括單詞片段模塊200、詞態(tài)學分析器202、語句部分(POS)標簽/基本名詞短語標識模塊204、短語擴展模塊206和模式或模板匹配模塊208。雖然這些組件顯示為獨立的組件，但是應當重視和理解，這些組件也可以互相結合或者與其它組件結合。
依據(jù)所介紹的實施例，淺層分析器140把用戶已經選定的文本中的單詞劃分為片段。它使用單詞片段模塊來做到這一點。然后淺層分析器使用詞態(tài)學分析器202從詞態(tài)學的觀點處理單詞，以獲得每個單詞的詞態(tài)學詞根。為了發(fā)現(xiàn)每個單詞的詞態(tài)學詞根，詞態(tài)學分析器能夠對單詞應用多種詞態(tài)學規(guī)則。詞態(tài)學分析器202使用的規(guī)則可以由熟練于被分析的具體語言的人制定。例如，英語中的一個規(guī)則為，以“ed”結尾的單詞，或者通過去除“d”或者通過去除“ed”來形成其詞態(tài)學詞根。
為了進一步選擇譯文，淺層分析器140采用語句部分(POS)標簽/基本名詞短語(baseNP)標識模塊204，按照特征劃分單詞和短語。例如，POS標簽和baseNP標識可以由某個統(tǒng)計模型來實現(xiàn)，下面緊接著的標題為“POS標簽和baseNP標識”的一節(jié)介紹了它的一個實例。淺層分析器140使用短語擴展模塊206，對POS標簽/基本名詞短語標識模塊204按照特征劃分的這些單詞，應用基于規(guī)則的短語擴展。短語擴展模塊的一個目標，是把一個基本名詞短語擴展到一個更復雜的名詞短語。例如，“baseNP的baseNP”是“baseNP”短語的更復雜的名詞短語。淺層分析器140也使用模式或模板匹配模塊208來產生樹列表。模式或模板匹配模塊用于翻譯，并認識某些短語翻譯是取決于模式的，而不是直接與短語中的單詞有關。例如，短語“對baseNP感興趣”包含一種模式(即“baseNP”)，它用于形成一個更復雜的翻譯單位，用于翻譯。單詞“感興趣”并不直接涉及用于形成更復雜翻譯單位的這種模式。
POS標簽和baseNP標識以下的討論介紹了用于自動識別英語的baseNP(名詞短語)的一種統(tǒng)計模型，并構成了處理選定的文本以產生樹列表的方式之一。所介紹的方法使用兩個步驟N個最佳語句部分(POS)標簽和給予N個最佳POS序列的baseNP標識。所介紹的模型也集成了詞法的信息。最后，應用Viterbi算法在整個序列中進行全局搜索，它使得在整個過程中能夠獲得線性的復雜度。
發(fā)現(xiàn)簡單的和非遞歸的基本名詞短語(baseNP)，是許多自然語言處理應用程序(比如部分剖析、信息檢索和機器翻譯)的一個重要的子任務。baseNP是簡單的名詞短語，并不遞歸地包含其它的名詞短語。例如，在以下實例中[…]之內的元素是baseNP，其中NNS、IN、VBG等為語句部分(POS)標簽。Marcus et al.，Building a LargeAnnotated Corpus of Englishthe Penn Treebamk，ComputationalLinguistics，19(2)313-330，1993中介紹了POS標簽，使其為世人所知。[Measures/NNS] of/IN[manufacturing/VBG activity/NN]fell/VBD more/RBR than/IN[the/DT overall/JJ measures/NNS]./.
統(tǒng)計方法在本節(jié)中介紹兩步法統(tǒng)計模型、參數(shù)訓練和Viterbi算法，用于搜索POS標簽和baseNP標識最佳序列。在介紹該算法之前，引入貫穿討論的某些記號。
讓我們把輸入語句E分別表示為下列單詞序列和POS序列E＝w1w2…wn-1wnT＝t1t2…tn-1tn其中n為語句中的單詞數(shù)目，ti為單詞wi的POS標簽。
給定E后，假設baseNP標識的結果是一個序列，其中某些單詞組合成baseNP如下…wi-1[wiwi+1…wj]wj+1…對應的標簽序列如下(a)B＝…ti-1[titi+1…tj]tj+1…＝…ti-1bi，jtj+1…＝n1n2…nm其中bi，j對應于某個baseNP的標簽序列[titi+1…tj]。bi，j也可以被認為是一種baseNP規(guī)則。所以，序列B既包含POS標簽，又包含baseNP規(guī)則。因此1≤m≤n，ni∈(POS標簽集∪baseNP規(guī)則集)。這是某個語句帶有baseNP記號的第一表達式。有時我們也使用以下等效形式(b)Q＝…(ti-1，bmi-1)(ti，bmi)(ti+1，bmi+1)…(tj，bmj)(tj+1，bmj+1)…＝q1q2…qn其中每個POS標簽ti與其相對于baseNP的位置信息bmi相關聯(lián)。位置信息為{F，I，E，O，S}之一。F、E和I分別表示該單詞在某個baseNP的左邊界、右邊界，或者某個baseNP內部的另一個位置。O表示該單詞在某個baseNP之外。S標注某個單一單詞的baseNP。
例如，上面給定實例的兩種表達式如下(a)B＝[NNS]IN[VBG NN]VBD RBR IN[DT JJ NNS](b)Q＝(NNS S)(IN O)(VBG F)(NN E)(VBD O)(RBR O)(IN O)(JJ I)(NNS E)(.O)
集成的’兩步法過程所介紹方法的原理如下。最可能的baseNP序列B*可以一般地表示如下B*=argmaxB(p(B|E))]]>我們把整個過程分成兩步，也就是B*≈argmaxB(P(T|E)×P(B|T,E))--(1)]]>為了減少搜索空間和計算復雜度，我們僅僅考慮N個最佳POS標簽，也就是T(N-best)=argmaxT=T1,...,TN(P(T|E))--(2)]]>所以，我們有B*≈argmaxB,T=T1,...,TN(P(T|E)×P(B|T,E))--(3)]]>相應地，算法也由兩步組成使用(2)式確定N個最佳POS標簽，然后使用(3)式從這些POS序列確定最佳baseNP序列。這兩步集成在一起，而不是像在其它方法中那樣分開?，F(xiàn)在讓我們更密切地查看這兩步。
確定N個最佳POS序列在第一步中算法的目標是在搜索空間(POS網格)之內搜索N個最佳POS序列。根據(jù)貝葉斯法則，我們有P(T|E)=P(E|T)×P(T)P(E)]]>由于P(E)不影響P(T|E)的最小化過程，(2)式變?yōu)門(N-best)=argmaxT=T1,...,TN(P(T|E))=argmaxT=T1,...,TN(P(E|T))×P(T))--(4)]]>我們現(xiàn)在假設，E中的單詞是獨立的。因此P(E|T)≈Πi=1nP(wi|ti)--(5)]]>然后我們使用三字模型作為P(T)的一種近似，也就是P(T)≈Πi=1nP(ti|ti-2,ti-1)--(6)]]>最后我們有(N-bset)argmaxT=T1,...,TN(P(T|E))=argmaxT=T1,...,TN(Πi=1nP(wi|ti)×P(ti|ti-2,ti-1))--(7)]]>在搜索N個最佳的Viterbi算法中，P(wi|ti)被稱為詞法生成(或輸出)概率，P(ti|ti-2，ti-1)被稱為隱藏馬爾可夫模型中的躍進概率。Viterbi，Error Bounds for Convolution Codes and Asymptotically OptimumDecoding Algorithm，IEEE Transactions on Information TheoryIT-13(2)pp.260-269，April，1967中介紹了Viterbi算法。
確定baseNP如上所述，給定N個最佳POS序列后，第二步的目標是搜索最佳baseNP序列。
把E、T和B視為隨機變量，根據(jù)貝葉斯法則，我們有P(B|T,E)=P(B|T)×P(E|B,T)P(E|T)]]>由于P(B|T)=P(T|B)×P(B)P(T)]]>，我們有，P(B|T,E)=P(E|B,T)×P(T|B)×P(B)P(E|T)×P(T)--(8)]]>因為我們對給定語句E中每個可能的POS序列搜索最佳baseNP序列，P(E|T)×P(T)＝P(E∩T)＝常數(shù)。不僅如此，從B的定義，在每個搜索過程期間，我們有P(T|B)=Πi=1nP(ti,...,tj|bi,j)=1.]]>所以，(3)式變?yōu)锽*=argmaxB,T=T1,...,TN(P(T|E)×P(B|T,E))]]>=argmaxB,T=T1,...,TN(P(T|E)×P(E|B,T)×P(B))---(9)]]>使用獨立假設，我們有P(E|B,T)≈Πi=1nP(wi|ti,bmi).--(10)]]>
利用P(B)的三字近似，我們有P(B)≈Πi=1mP(ni|ni-2,ni-1)--(11)]]>最后，我們得到B*=argmaxB,T=T1,...,TN(P(T|E)×Πi=1nP(wi|bmi,ti)×Πi=1,mP(ni|ni-2,ni-1))--(12)]]>總而言之，在第一步中，在POS標簽過程中應用搜索N個最佳的Viterbi算法，對于計算的每個POS序列確定路徑概率ft如下ft=Πi=1,np(wi|ti)×p(ti|ti-2,ti-1).]]>在第二步中，對于每個可能的POS標簽結果，再一次應用Viterbi算法搜索最佳baseNP序列。在這一步所找到的每個baseNP序列還與路徑概率fb=Πi=1np(wi|ti,bmi)×Πi=1,mp(ni|ni-2,ni-1)]]>相關。某個baseNP序列的總概率由fta×fb確定，其中α為均衡系數(shù)(在我們的實驗中α＝2.4)。對于給定的語句E，當我們確定最佳baseNP序列時，我們也確定了E的最佳POS序列，它對應于E的最佳baseNP。
作為這個過程如何起作用的一個實例，考慮以下文本“stockwas down 9.1 points yesterday morning.”在第一步中，該句的N個最佳POS標簽結果之一是T＝NN VBD RB CD NNS NN NN。
對于這個POS序列，第二步將試圖確定baseNP，如圖3所示。虛線中路徑的細節(jié)在圖4中給出。在第二步中計算出它的概率如下(Φ為虛變量)P(B|T，E)＝p(stock|NN，S)×p(was|VBD，O)×p(down|RB，O)×p(NU-MBER|CD，B)×p(points|NNS，E)×p(yesterday|NN，B)×p(morning|NN，E)×p(.|.，O)×p([NN]|Φ，Φ)×p(VBD|Φ，[NN])×p(RB|[NN]，VBD)×p([CD NNS]|VBD，RB)×p([NN NN]|RB，[CD NNS])×P(.|[CD NNS]，[NN NN])
統(tǒng)計參數(shù)訓練在這項工作中，訓練和試驗的數(shù)據(jù)是取自Penn Treebank的25個部分。我們把整個Penn Treebank數(shù)據(jù)分成兩部分，一部分用于訓練，另一部分用于試驗。
在我們的統(tǒng)計模型中，我們計算以下四種概率(1)P(ti|ti-2，ti-1)，(2)P(wi|ti)，(3)P(ni|ni-2ni-1)和(4)P(wi|ti，bmi)。第一種和第三種參數(shù)分別是T和B的三字概率。第二種和第四種是詞法生成概率。利用下列公式可以從有POS標簽的數(shù)據(jù)計算概率(1)和(2)(ti|ti-2,ti-1)count(ti-2ti-2ti)Σjcount(ti-2ti-1tj)(13)]]>p(wi|ti)=count(wiwith tag ti)count(ti)--(14)]]>由于訓練集中的每個語句既有POS標簽，又有baseNP邊界標簽，它可以轉換為兩個序列，如上節(jié)中介紹的B(a)和Q(b)。使用這些序列，利用分別類似于(13)和(14)式的計算公式，可以計算出參數(shù)(3)和(4)。
在訓練三字模型(3)之前，應當從訓練全集提取所有可能的baseNP規(guī)則。例如，提取的baseNP規(guī)則包括以下三個序列。
(1)DT CD CD CD NNPS(2)RB JJ NNS NNS(3)NN NN POS NN……在Penn Treebank中有超過6000種baseNP規(guī)則。訓練三字模型(3)時，我們以兩種方式對待這些baseNP規(guī)則。首先，給每個baseNP規(guī)則分配一個唯一標識(UID)。這表明，該算法考慮了每個baseNP規(guī)則對應的結構。其次，給所有這些規(guī)則分配相同標識(SID)。在這種情況下，這些規(guī)則組合成同一類。然而，baseNP規(guī)則的標識仍然與分配給POS標簽的標識不同。
為了使參數(shù)平滑，使用了Katz，Estimation of Probabilities fromsparse Data for Languguage Model Component of Speech Recognize，IEEE Transaction on Acoustics，Speech，and Signal Processing，Volume ASSP-35，pp.400-401，March 1987中介紹的一種方法。為了預測參數(shù)(1)和(3)的概率，建立了一個三字模型。在識別baseNP期間遇到未知單詞的情況下，以下列方式計算參數(shù)(2)和(4)p(wi|bmi,ti)=count(bmi,ti)maxj(count(bmj,ti))2--(15)]]>p(wi|ti)=count(ti)maxj(count(tj))2--(16)]]>這里，bmi表示附著在ti上所有可能的baseNP標號，tj是為未知單詞wi猜測的一個POS標簽。
圖5是一張流程圖，介紹一個實施例中方法的步驟。這些步驟可以在任何適當?shù)挠布④浖?、固件或者它們的組合中實現(xiàn)。在展示的實例中，這些步驟是在軟件中實現(xiàn)的。在上述跨語言的閱讀向導136——它形成了瀏覽器程序132的一部分(見圖1)——中，可以發(fā)現(xiàn)這種軟件的一個具體實施例。更確切地說，將要介紹的方法可以由某個淺層分析器來實現(xiàn)，比如圖2中顯示和介紹的分析器。
步驟500接收選定的文本。實現(xiàn)這個步驟與某個用戶選擇文本中要翻譯的一個部分有關。通常，用戶通過使用一種輸入設備比如鼠標等來選擇文本。步驟502把選定文本中的單詞劃分成片段。將會受到本領域的技術人員重視的任何適當?shù)膭澐痔幚矶伎梢允褂?。步驟504獲得每個單詞的詞態(tài)學詞根。在展示和介紹的實施例中，這一步是由詞態(tài)學分析器實現(xiàn)的，比如圖2中顯示的詞態(tài)學分析器。在展示的實例中，詞態(tài)學分析器配置為處理以英語寫成的單詞。不過應當重視和理解，任何適當?shù)恼Z言都可以提供一個基礎，在其上可以建立一個詞態(tài)學分析器。
步驟506使用語句部分(POS)標簽和基本名詞短語標識來劃分單詞的特征。任何適當?shù)募夹g都可以使用。在上面的“POS標簽和baseNP標識”一節(jié)中，詳細介紹了一種示范技術。步驟508對按照特征劃分的單詞應用基于規(guī)則的短語擴展和模式匹配，以產生樹列表。在上面的實例中，這一步是使用短語擴展模塊206和模式或模板匹配模塊208來實現(xiàn)的。步驟510輸出樹列表，以便進一步處理。
作為樹列表的一個實例，考慮圖6。其中已經以上面介紹的方法，處理了語句“The Natural Language Computing Group at MicrosoftResearch China is exploring research in advanced natural languagetechnologies”。確切地說，樹列表展示了語句中已經使用上面介紹的POS標簽和baseNP技術，經過分段、詞態(tài)學處理和特征劃分的各個單詞。例如，考慮元素600。其中，單詞“Natural”已經從語句中和從父元素“natural language”中劃分出來。元素600也已經按特征劃分為帶有POS標簽“JJ”。樹上的其它元素也經過類似的處理。
示范單詞譯文選擇器單詞譯文選擇器142接收樹列表并產生所有可能的譯文模式。選擇器142使用統(tǒng)計翻譯和語言模型對剖析后的翻譯單位進行翻譯，得出母語文本中最優(yōu)的候選單詞譯文。輸出的是最優(yōu)的候選譯文。
圖7是一張流程圖，介紹一個實施例中方法的步驟。該方法可以在任何適當?shù)挠布?、軟件、固件或者它們的組合中實現(xiàn)。在展示和介紹的實施例中，該方法是在軟件中實現(xiàn)的。這種軟件的一個實施例可以包括單詞譯文選擇器142(見圖1)。
按照上面介紹的處理產生的樹列表在步驟700接收。步驟702從樹列表產生譯文模式。在一個實施例中，產生所有可能的譯文模式。例如，對于英語到漢語的翻譯，英語名詞短語“NP1 of NP2”可能有兩種可能的譯文(1)T(NP1)+T(NP2)和(2)T(NP2)+T(NP1)。在短語譯文中，翻譯的短語是一棵句法樹，在一個實施例中，所有可能的譯文順序都受到考慮。步驟704使用翻譯模型和語言模型來翻譯剖析后的翻譯單位。翻譯單位可以包括單詞和短語。然后步驟706輸出最優(yōu)的N個候選單詞譯文。可以使用統(tǒng)計模型來選擇最優(yōu)的N個候選單詞譯文。
示范譯文生成器譯文生成器144把最優(yōu)的N個候選單詞譯文轉換為母語中對應的短語。然后母語的單詞和短語通過UI出現(xiàn)在選定的文本附近。
圖8稍微詳細地顯示了一個實施例中的譯文生成器144。為了翻譯最優(yōu)的候選單詞，譯文生成器可以利用許多不同的資源。例如，譯文生成器可以包括它在翻譯過程中使用的詞典模塊800。詞典模塊800可以包括單詞詞典、短語詞典、不規(guī)則詞形詞典或者通常在自然語言翻譯處理中使用的任何其它詞典，這對本領域的技術人員是顯而易見的。本領域的技術人員將會理解這類詞典的操作和功能，為簡便起見此處不再更詳細地介紹。
譯文生成器144可以包括模板模塊802，它包含用于翻譯處理中的多個模板。任何適當?shù)哪０宥伎梢允褂?。例如，可以使用所謂的大短語模板來協(xié)助翻譯過程。在自然語言翻譯中使用的模板，其操作已知，此處不再更詳細地介紹。
譯文生成器144可以包括規(guī)則模塊804，它包含用于使翻譯過程便利的多個規(guī)則。規(guī)則可以是手工制定的規(guī)則，制定它們的人員熟悉被翻譯的特定語言?？梢灾贫ㄒ?guī)則來涉及屬于翻譯、剖析、翻譯模式中的統(tǒng)計錯誤。本領域的技術人員將會理解基于規(guī)則翻譯的原理。
譯文生成器144可以包括用于翻譯過程中的一個或多個統(tǒng)計模型806。這些可以使用的統(tǒng)計模型可以變化范圍很廣，尤其是對與所需翻譯有關的、給定數(shù)目的可能的非母語和母語。這些統(tǒng)計模型可以基于上面介紹的POS和baseNP統(tǒng)計參數(shù)。在需要從英語翻譯成漢語的一個特定實施例中，可以使用以下模型漢語三字語言模型和漢語交互信息模型。當然，也可以使用其它模型。
上面介紹的模塊和模型可以分別使用，也可以按多種相互組合使用。
在處理過程中，至此用戶已經選擇了非母語文本的一部分，要翻譯成母語。選定的文本已經按照上面的介紹進行了處理。在下面緊接著的討論中，要介紹的方法和系統(tǒng)以對用戶方便和高效的方式把翻譯后的文本呈現(xiàn)給用戶。
閱讀向導的用戶界面剩余的討論是針對閱讀向導中用戶界面134的特性。具體地說，閱讀向導的用戶界面134允許用戶選擇不能確定如何閱讀和解釋的、以非母語寫成的文本。選定的內容可以是各個單詞、短語或者語句。
圖9至圖13顯示了閱讀向導的若干示范用戶界面，以圖形UI(GUI)實現(xiàn)，作為瀏覽器程序或者其它計算機輔助閱讀系統(tǒng)的一部分呈現(xiàn)給用戶。展示的實例顯示了設計為幫助中國用戶閱讀英語文本的閱讀系統(tǒng)。英語文本顯示在窗口中。用戶可以選擇英語文本的某些部分。為了響應用戶的選擇，閱讀向導把選定的內容翻譯成漢語文本，并把漢語文本呈現(xiàn)在彈出式譯文窗口或滾動框中。
圖9顯示了用戶界面900，它包括“非母語”文本中已經突出顯示的一部分。突出顯示的文本顯示在用戶界面的第一區(qū)域中。用戶界面的第二區(qū)域的形式為譯文窗口902，配置為以母語顯示至少某些文本內容翻譯后的部分。在這個實例中，突出顯示的文本包括短語“research in advanced natural language technologies”。在這個實例中，用戶已經突出顯示了單詞“advanced”，閱讀系統(tǒng)已經自動確定該單詞組成被突出顯示短語的一部分。然后閱讀系統(tǒng)在譯文窗口902中自動顯示被突出顯示短語的最佳譯文。通過自動確定包含用戶選定單詞的短語然后提供該短語的至少一種譯文，不僅向讀者提供了該單詞的譯文，而且提供了該單詞在其中使用的、翻譯后的上下文。這樣做的優(yōu)點在于，它給予讀者更多翻譯后的信息，這又有助于他們理解正在閱讀的材料。
注意，譯文窗口902位于突出顯示文本的至少一個部分的附近。以這種方式定位譯文窗口，為了看見翻譯后的文本，用戶就不必使其注意力從突出顯示的文本轉移很遠。這樣做的優(yōu)點在于，它不會令用戶的閱讀過程減慢到不期望的程度。也要注意，譯文窗口包含一個下拉箭頭904，它可以用于顯示選定文本的其它翻譯結果。作為一個實例，考慮圖10。其中譯文窗口902已經下拉，以顯示突出顯示短語的所有譯文。
圖11顯示了用戶界面1100，它帶有譯文窗口1102。注意，閱讀系統(tǒng)自動探測出單詞“generated”不在某個短語中，并且只翻譯單詞“generated”。閱讀系統(tǒng)也能夠在譯文窗口1102中提供多種最可能的譯文。例如，顯示了三種可能的示范譯文。在展示的實例中，顯示的譯文是與上下文有關的，并按照上下文來排序。所以，在這個實例中，閱讀系統(tǒng)僅僅可以顯示該單詞最佳的n個譯文，而不是該單詞所有可能的譯文。圖12顯示了用戶界面1100，其中單詞“generated”的所有可能的譯文都在譯文窗口1102中呈現(xiàn)給用戶。
圖13顯示了用戶界面1300，它帶有譯文窗口1302，展示了所介紹實施例的一種特性。具體地說，可以給用戶一種選擇，他們是需要翻譯包含選定單詞的整個短語，還是只需要翻譯選定的單詞。在這個實例中，用戶已經使其鼠標放置在選擇單詞“advanced”進行翻譯的位置。由于單詞“advanced”組成某個較長短語的一部分，閱讀系統(tǒng)會自動翻譯包含著選定單詞的短語，然后向用戶呈現(xiàn)各種選擇，如上所述。不過在這種情況下，用戶已經指示閱讀系統(tǒng)，他們僅僅需要翻譯選定的單詞。他們能夠以任何適當?shù)姆绞阶龅竭@一點，比如舉例來說，當選定單詞時按下“Ctrl”鍵。
結論上面介紹的若干實施例幫助用戶閱讀非母語，并能夠允許更樂于使用母語交流的用戶快捷方便地廣泛閱讀非母語的電子文檔，而且其方式促進了集中精力和快速消化有關內容。提供的用戶界面在要翻譯文本的近旁具有譯文窗口，包含著文本翻譯后的譯文，可以增加用戶的便利。將譯文窗口放在要翻譯文本的近旁，用戶的雙眼不必移動很遠即可確定要翻譯的文本。這又減少了用戶可察覺的分心，舉例來說，假若為了查看要翻譯的文本，用戶的目光需要掃視一段距離，這種分心就很難避免。在某些實施例中，光標翻譯處理的優(yōu)點使得用戶交互進一步增強。利用鼠標移動來選擇文本的位置，用戶能夠進行快速選擇，系統(tǒng)據(jù)此自動執(zhí)行翻譯并將翻譯后的文本向用戶顯示。
盡管是以結構特性和/或詞態(tài)學步驟的特定語言來介紹了本發(fā)明，還是應當理解，在附帶的權利要求書中規(guī)定的本發(fā)明不必局限于所介紹的特定特性或步驟。相反，公開這些特定的特性和步驟，是作為實現(xiàn)要求權利的本發(fā)明的優(yōu)選形式。
權利要求
1.一種閱讀系統(tǒng)，包括一種用戶界面，配置為允許用戶選擇非母語的文本并查看選定文本在母語中的譯文；以及一種跨語言的閱讀向導，包括一種分析器，把選定的文本分解為各個翻譯單位，一種單詞譯文選擇器，對若干翻譯單位選擇候選單詞譯文，以及一種譯文生成器，把候選單詞譯文轉換為母語中對應的單詞和短語，它們可以通過用戶界面呈現(xiàn)給用戶。
2.根據(jù)權利要求1的閱讀系統(tǒng)，其特征在于，該分析器包括一種詞態(tài)學分析器，從詞態(tài)學的角度處理各個單詞，以獲得每個單詞的詞態(tài)學詞根。
3.根據(jù)權利要求1的閱讀系統(tǒng)，其特征在于，該分析器包括一種語句部分/基本名詞短語標識模塊，用于給各個單詞加上標簽標識。
4.根據(jù)權利要求3的閱讀系統(tǒng)，其特征在于，該語句部分/基本名詞短語標識模塊包括一種統(tǒng)計模型。
5.根據(jù)權利要求1的閱讀系統(tǒng)，其特征在于，該分析器包括一種短語擴展模塊，對各個單詞應用短語擴展規(guī)則。
6.根據(jù)權利要求1的閱讀系統(tǒng)，其特征在于，該譯文生成器包括一種詞典模塊，把候選單詞譯文轉換為對應的單詞和短語。
7.根據(jù)權利要求6的閱讀系統(tǒng)，其特征在于，該詞典模塊包括一種單詞詞典。
8.根據(jù)權利要求6的閱讀系統(tǒng)，其特征在于，該詞典模塊包括一種短語詞典。
9.根據(jù)權利要求6的閱讀系統(tǒng)，其特征在于，該詞典模塊包括一種不規(guī)則詞形詞典。
10.根據(jù)權利要求1的閱讀系統(tǒng)，其特征在于，該譯文生成器包括一種模板模塊，它包括一個或多個模板，用于把候選單詞譯文轉換為對應的單詞和短語。
11.根據(jù)權利要求1的閱讀系統(tǒng)，其特征在于，該譯文生成器包括一種規(guī)則模塊，它包含多個規(guī)則，用于把非母語單詞翻譯為母語單詞。
12.根據(jù)權利要求1的閱讀系統(tǒng)，其特征在于，該譯文生成器包括一個或多個統(tǒng)計模型。
13.根據(jù)權利要求1的閱讀系統(tǒng)，實施為一個瀏覽器。
14.一種閱讀系統(tǒng)，包括一種用戶界面，配置為允許用戶選擇英語的文本并查看選定文本的漢語譯文；以及一種跨語言的閱讀向導，包括一種分析器，把選定的文本分解為各個翻譯單位，一種單詞譯文選擇器，對若干翻譯單位選擇候選單詞譯文，以及一種譯文生成器，把候選單詞譯文轉換為漢語中對應的短語，它們可以通過用戶界面呈現(xiàn)給用戶。
15.根據(jù)權利要求14的閱讀系統(tǒng)，實施為一個瀏覽器。
16.一種閱讀系統(tǒng)，包括一種用戶界面，配置為允許用戶選擇非母語的文本并查看選定文本的母語譯文，該用戶界面包括彈出式窗口，用戶可在其中查看母語文本；以及一種跨語言的閱讀向導，配置為接收用戶已經選定的非母語文本，以及自動地把非母語文本翻譯成母語文本。
17.根據(jù)權利要求16的閱讀系統(tǒng)，其特征在于，該彈出式窗口顯示在用戶已經選定的文本附近。
18.根據(jù)權利要求16的閱讀系統(tǒng)，其特征在于，該彈出式窗口是可滾動的，以顯示多種譯文，并顯示在用戶已經選定的文本附近。
19.根據(jù)權利要求16的閱讀系統(tǒng)，實現(xiàn)為一個瀏覽器。
20.一種計算機輔助閱讀方法，包括通過用戶界面向用戶呈現(xiàn)非母語文本；接收用戶選定的文本；處理用戶選定的文本，以提供已經從非母語翻譯成母語的文本；以及通過用戶界面向用戶呈現(xiàn)翻譯后的文本。
21.根據(jù)權利要求20的計算機輔助閱讀方法，其特征在于，所述處理包括把文本分解為翻譯單位；以及對于一個或多個翻譯單位，獲得詞態(tài)學詞根。
22.根據(jù)權利要求20的計算機輔助閱讀方法，其特征在于，所述處理包括把文本分解為翻譯單位；以及使用語句部分標簽和基本名詞短語標識，按特征劃分翻譯單位。
23.根據(jù)權利要求20的計算機輔助閱讀方法，其特征在于，所述處理包括把文本分解為翻譯單位；使用語句部分標簽和基本名詞短語標識，按特征劃分翻譯單位；以及對按特征劃分的翻譯單位應用基于規(guī)則的短語擴展和模式匹配，以提供樹列表。
24.根據(jù)權利要求23的計算機輔助閱讀方法，其特征在于，所述處理進一步包括根據(jù)樹列表產生母語的候選單詞譯文。
25.根據(jù)權利要求24的計算機輔助閱讀方法，其特征在于，所述處理進一步包括把候選單詞譯文轉換為母語中對應的單詞和/或短語。
26.一種或多種計算機可讀的介質，其中具有計算機可讀的指令，當某個處理器執(zhí)行這些指令時，它們指示計算機實現(xiàn)權利要求20的方法。
27.根據(jù)權利要求20的計算機輔助閱讀方法，其特征在于，所列舉的動作由某個瀏覽器來實現(xiàn)。
28.一種閱讀系統(tǒng)，包括一種或多種計算機可讀的介質；以及記錄在該介質上的代碼，配置為實現(xiàn)某個瀏覽器，該瀏覽器配置為通過用戶界面向用戶呈現(xiàn)英語文本；接收用戶選定的文本；處理用戶選定的文本，以提供已經從英語翻譯成漢語的文本；以及通過用戶界面向用戶呈現(xiàn)翻譯后的文本。
29.根據(jù)權利要求28的閱讀系統(tǒng)，其特征在于，該瀏覽器配置為向用戶呈現(xiàn)同一英語文本的多種譯文。
30.根據(jù)權利要求28的閱讀系統(tǒng)，其特征在于，該瀏覽器配置為在用戶選定的英語文本附近的譯文窗口中呈現(xiàn)翻譯后的文本。
31.根據(jù)權利要求28的閱讀系統(tǒng)，其特征在于，該瀏覽器配置為在用戶選定的英語文本附近的譯文窗口中呈現(xiàn)同一英語文本的多種譯文，該譯文窗口具有下拉的特性，以顯示多種譯文的至少某一些。
32.一種計算機輔助閱讀方法，包括通過用戶界面向用戶呈現(xiàn)英語文本；接收用戶選定的文本；處理用戶選定的文本，以提供已經從英語翻譯成漢語的文本；以及通過用戶界面向用戶呈現(xiàn)翻譯后的文本。
33.根據(jù)權利要求32的計算機輔助閱讀方法，其特征在于，所述處理包括把文本分解為翻譯單位；以及對于一個或多個翻譯單位，獲得詞態(tài)學詞根。
34.根據(jù)權利要求32的計算機輔助閱讀方法，其特征在于，所述處理包括把文本分解為翻譯單位；以及使用語句部分標簽和基本名詞短語標識，按特征劃分翻譯單位。
35.根據(jù)權利要求32的計算機輔助閱讀方法，其特征在于，所述處理包括把文本分解為翻譯單位；使用語句部分標簽和基本名詞短語標識，按特征劃分翻譯單位；以及對按特征劃分的翻譯單位應用基于規(guī)則的短語擴展和模式匹配，以提供樹列表。
36.根據(jù)權利要求35的計算機輔助閱讀方法，其特征在于，所述處理進一步包括根據(jù)樹列表產生漢語的候選單詞譯文。
37.根據(jù)權利要求36的計算機輔助閱讀方法，其特征在于，所述處理進一步包括把候選單詞譯文轉換為漢語中對應的單詞和/或短語。
38.一種或多種計算機可讀的介質，其中具有計算機可讀的指令，當某個處理器執(zhí)行這些指令時，它們指示計算機實現(xiàn)權利要求32的方法。
39.一種計算機輔助閱讀方法，包括通過用戶界面向用戶呈現(xiàn)非母語文本，使得用戶能夠選取至少一個單詞；自動確定是否有對應的短語與選定的一個單詞相關聯(lián)；以及以母語呈現(xiàn)至少選定單詞的一種或多種譯文，或者如果有對應的短語與選定的單詞相關聯(lián)，以母語呈現(xiàn)對應短語的至少一種譯文。
40.根據(jù)權利要求39的計算機輔助閱讀方法，其特征在于，所述呈現(xiàn)包括在譯文窗口中呈現(xiàn)譯文，該窗口鄰近對應的、選定的至少一個單詞。
41.根據(jù)權利要求40的計算機輔助閱讀方法，其特征在于，所述譯文窗口是可滾動的，以便呈現(xiàn)多種不同的譯文。
42.根據(jù)權利要求39的計算機輔助閱讀方法，其特征在于，所述呈現(xiàn)包括呈現(xiàn)多種最可能的譯文。
43.根據(jù)權利要求42的計算機輔助閱讀方法，其特征在于，所述呈現(xiàn)進一步包括根據(jù)上下文分選最可能的譯文。
44.根據(jù)權利要求39的計算機輔助閱讀方法，進一步包括接收用戶輸入，該輸入表示用戶僅僅需要翻譯組成短語一部分的、某個選定的單詞；以及僅僅呈現(xiàn)選定單詞的一種或多種譯文。
45.一種或多種計算機可讀的介質，其中具有計算機可讀的指令，當某個處理器執(zhí)行這些指令時，它們指示計算機實現(xiàn)權利要求39的方法。
46.一種閱讀系統(tǒng)，包括一種或多種計算機可讀的介質；以及記錄在該介質上的代碼，配置為實現(xiàn)某個瀏覽器，該瀏覽器配置為使得用戶能夠選取通過用戶界面呈現(xiàn)的至少一個英語單詞；自動確定是否有對應的短語與選定的至少一個英語單詞相關聯(lián)；以及以漢語呈現(xiàn)選定的至少一個英語單詞的一種或多種譯文，或者如果有對應的短語與選定的至少一個英語單詞相關聯(lián)，以漢語呈現(xiàn)對應短語的至少一種譯文。
47.一種跨語言的用戶界面，包括第一區(qū)域，配置為顯示非母語文本；以及第二區(qū)域，配置為以母語顯示文本中至少一部分的譯文。
48.根據(jù)權利要求47的跨語言用戶界面，其特征在于，第二區(qū)域安排在用戶選定來翻譯的至少某些文本附近。
49.根據(jù)權利要求47的跨語言用戶界面，其特征在于，非母語包括英語，母語包括漢語。
50.根據(jù)權利要求47的跨語言用戶界面，其特征在于，第二區(qū)域包括彈出式窗口。
51.根據(jù)權利要求50的跨語言用戶界面，其特征在于，彈出式窗口包括下拉特性，以顯示另外的譯文。
52.根據(jù)權利要求47的跨語言用戶界面，其特征在于，第二區(qū)域顯示同一文本的多種不同的譯文。
53.一種跨語言的用戶界面，包括第一區(qū)域，其中可以顯示文本以便用戶選擇，該文本以第一語言顯示；以及第二區(qū)域，鄰近用戶選定的文本，該第二區(qū)域配置為顯示已經翻譯成第二語言的文本，翻譯后的文本對應于用戶已經選定的文本。
54.根據(jù)權利要求53的跨語言用戶界面，其特征在于，第一語言包括英語，第二語言包括漢語。
55.根據(jù)權利要求53的跨語言用戶界面，其特征在于，第二區(qū)域包括彈出式窗口。
56.根據(jù)權利要求53的跨語言用戶界面，其特征在于，第二區(qū)域包括彈出式窗口，它具有下拉特性，以顯示多種譯文。
57.根據(jù)權利要求53的跨語言用戶界面，其特征在于，第二區(qū)域顯示同一文本的多種不同的譯文。
58.一種閱讀系統(tǒng)，包括一種跨語言的閱讀向導，包括一種分析器，把選定的文本分解為各個翻譯單位，該分析器包括包括一種語句部分/基本名詞短語標識模塊，用于給各個舉詞加上標簽標識，一種單詞譯文選擇器，對若干翻譯單位選擇候選單詞譯文，以及一種譯文生成器，把候選單詞譯文轉換為母語中對應的單詞或短語，它們可以通過用戶界面呈現(xiàn)給用戶。
59.根據(jù)權利要求58的閱讀系統(tǒng)，其特征在于，該分析器包括一種詞態(tài)學分析器，從詞態(tài)學的角度處理各個單詞，以獲得每個單詞的詞態(tài)學詞根。
60.根據(jù)權利要求58的閱讀系統(tǒng)，其特征在于，該分析器包括一種短語擴展模塊，對各個單詞應用短語擴展規(guī)則。
61.一種或多種計算機可讀的介質，其中具有計算機可讀的指令，當一個或多個處理器執(zhí)行這些指令時，使這一個或多個處理器實現(xiàn)一種跨語言的閱讀向導，包括一種分析器，把選定的文本分解為各個翻譯單位，該分析器包括包括一種語句部分/基本名詞短語標識模塊，用于給各個單詞加上標簽標識，一種單詞譯文選擇器，對若干翻譯單位選擇候選單詞譯文，以及一種譯文生成器，把候選單詞譯文轉換為母語中對應的單詞或短語，它們可以通過用戶界面呈現(xiàn)給用戶。
62.一種或多種計算機可讀的介質，其中具有計算機可讀的指令，當一個或多個處理器執(zhí)行這些指令時，使這一個或多個處理器通過用戶界面向用戶呈現(xiàn)非母語文本；接收用戶選定的文本；處理選定的文本，步驟包括把選定的文本分解為翻譯單位，使用語句部分標簽和基本名詞短語標識，按照特征劃分翻譯單位，對按特征劃分的翻譯單位應用基于規(guī)則的短語擴展和模式匹配，以提供樹列表，根據(jù)樹列表產生母語的候選單詞譯文，把候選單詞譯文轉換為母語中對應的單詞和/或短語，以提供已經從非母語翻譯成母語的文本；以及通過用戶界面向用戶呈現(xiàn)翻譯后的文本。
全文摘要
某個用戶正在以非母語進行閱讀，當他需要幫助時，計算機輔助閱讀系統(tǒng)為他提供幫助，而無需該用戶從文本上轉移注意力。在一個實施例中，閱讀系統(tǒng)的實現(xiàn)形式為瀏覽程序的閱讀向導。這種閱讀向導通過某個圖形用戶界面(UI)而顯現(xiàn)，該用戶界面允許用戶在非母語的文本中選擇某個單詞、短語、語句或者單詞的其它組合，并查看選定文本在該用戶自己母語中的譯文。該譯文在選定文本附近的窗口或彈出框中出現(xiàn)，以便使分心最小。
文檔編號G06F17/27GK1426561SQ01808510
公開日2003年6月25日申請日期2001年4月23日優(yōu)先權日2000年4月24日
發(fā)明者徐恩東申請人:微軟公司

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：徐恩東
技術所有人：微軟公司
我是此專利的發(fā)明人

上一篇：產品輸送系統(tǒng)的制作方法
上一篇：在包括觸摸屏的圖形用戶界面中提供信息的設備及方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網絡及物聯(lián)網
4、王老師：1.計算機網絡安全 2.計算機仿真技術
5、王老師：1.網絡安全；物聯(lián)網安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

計算機輔助語言教學相關技術

計算機語言相關技術

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

帶有跨語言閱讀向導的計算機輔助閱讀系統(tǒng)和方法