亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語言輸入用戶界面的制作方法

文檔序號:6546138閱讀:294來源:國知局
專利名稱:語言輸入用戶界面的制作方法
技術領域
本發(fā)明涉及語言輸入用戶界面。更具體地說,本發(fā)明涉及可供輸入語音文本并將其轉換成語言文本的語言專用或多種語言字處理系統(tǒng)、電子郵件系統(tǒng)、瀏覽器等使用的語言輸入用戶界面。
背景技術
使用字母數(shù)字鍵盤(例如英語QWERTY鍵盤)的語言專用字處理系統(tǒng)已存在許多年了。字母數(shù)字鍵盤適用于采用小字母表,例如羅馬字符集的語言。但是不是所有的語言都具有較小的字符庫。例如,諸如中文、日文、韓文之類基于字的語言(也稱為符號語言)可能具有數(shù)千個字。并不存在用于基于字的語言的語言專用鍵盤,因為實際上不能制造支持如此多的不同字的單獨按鍵的鍵盤。
語言專用字處理系統(tǒng)允許用戶從小的字符集鍵盤(例如QWERTY鍵盤)輸入語音文本并把語音文本轉換成基于字的語言的語言文本,而不是設計昂貴的語言和方言專用鍵盤。“語音文本”代表說指定語言時發(fā)出的語音,而“語言文本”代表當指定語言以文本形式出現(xiàn)時實際書寫的字。例如就中文來說,拼音是語音文本的一個例子,漢字是語言文本的一個例子。一般,表述語音文本所需的字符集遠遠小于用于表述語言文本的字符集。通過把語音文本轉換成語言文本,使用常規(guī)的計算機和標準的QWERTY鍵盤,可借助語言專用字處理器處理多種不同的語言。
為了便于用戶輸入語音文本,語言專用字處理系統(tǒng)通常采用語言輸入用戶界面(UI)。但是現(xiàn)有的語言輸入界面的用戶友好性不是很好,因為這些輸入界面不易掌握并且不適應快速的擊鍵速度。作為這種不友善性的一個例子,一些傳統(tǒng)的語言輸入用戶界面使語音文本輸入和轉換后的語言文本輸出分離。例如,用戶可能在可視顯示屏幕的一個位置輸入語音文本,在該屏幕上的一個單獨并且截然不同的位置呈現(xiàn)語言文本的轉換字符。這兩個位置甚至可能具有它們自己的本地光標。這種雙重呈現(xiàn)會使用戶弄錯實際進行輸入的地方。此外,用戶必須在屏幕上的位置間不斷掃視。
從而,現(xiàn)有的語言輸入UI通常只由專業(yè)打字員使用,不被普通的個人計算機(PC)用戶使用。在基于字符語言的國家中,這些利害關系顯著影響PC應用的普及性。
一般,存在兩種語言輸入用戶界面(1)基于代碼的用戶界面和(2)基于模式的用戶界面。就基于代碼的用戶界面來說,用戶記憶與語言單字相關的代碼。代碼由輸入裝置輸入,并且被轉換成所需的語言文本。一旦用戶記住代碼,則這種用戶界面允許用戶很快地輸入文本。但是,這些代碼通常不易于記憶,相反易于遺忘。
就基于模式的用戶界面來說,輸入語音文本并將其轉換成所需的語言文本。基于模式的用戶界面不需要用戶記憶代碼,但是一般要求用戶在輸入語言文本和編輯語言文本之間轉換模式。在微軟的通過利用語音-語言轉換適合于外文,例如中文的“Word”商標字處理程序中采用了基于模式的用戶界面的一個例子。當在“Word”程序中輸入語音文本時,向用戶呈現(xiàn)一個定域工具條,所述定域工具條使用戶能夠在用戶輸入語音字符(例如中文拼音)的輸入模式和用戶校正由于識別和轉換程序的結果偶爾產(chǎn)生的不可避免的錯誤的編輯模式之間轉換。
這些常規(guī)界面的一個缺陷在于用戶必須了解當前的模式-輸入模式或編輯模式-并且采取與文本輸入無關的附加步驟(例如點擊工具條控制按鍵)在模式之間進行轉換。因此這種界面導致額外的用戶工作,并且把用戶的注意力從文本輸入轉向其它外圍控制方面,從而顯著降低輸入速度。
從用戶界面觀點來看,基于模式的用戶界面的另一問題涉及如何處理不可避免的轉換錯誤。當識別和轉換引擎把語音文本轉換成不正確的語言字符時,產(chǎn)生轉換錯誤。由于指定語言的本質和語音文本可用于預測預期字符的精度的緣故,產(chǎn)生轉換錯誤是相當常見的。在用戶轉換到編輯模式之后,用戶界面一般向用戶提供糾正字符的一些方式。例如在微軟的用于中國的“Word”商標字處理程序中,向用戶提供包含可能的備選字符的方框。如果列表較長,則該方框提供滾動可能字符列表的控件。
傳統(tǒng)的基于模式的用戶界面的另一缺陷在于它們需要用于輸入不同語言的模式轉換。當用戶正在輸入語音文本并且想要輸入第二種語言的文本時,用戶必須轉換模式以便輸入第二種語言。例如,在微軟的“Word”環(huán)境下,定域工具條提供使用戶能夠在輸入第一種語言(例如中文拼音)和輸入第二種語言(例如英文)之間切換的控制按鍵。用戶必須有意識地啟動該控制按鍵,以便通知預期語言的字識別引擎。
涉及語言輸入UI的另一利害關系,尤其是從非專業(yè)打字員的觀點來看,是打字錯誤。語音文本輸入UI的一般用戶尤其易于輸入打字上的輸入錯誤。打字錯誤的原因之一在于來自不同地區(qū)的用戶通常使用基于字的語言的不同方言。由于他們的本地方言的緣故,用戶拼錯語音文本。語音文本方面微小的偏差會導致完全錯誤的字符文本。
因此需要一種改進的語音輸入用戶界面。

發(fā)明內(nèi)容
本發(fā)明涉及一種智能地把用戶輸入的語音文本和從語音文本轉換而來的語言文本結合到相同的屏幕區(qū)中的語言輸入用戶界面。該用戶界面是無模式的,因為它不要求用戶在輸入和編輯模式之間轉換。無模式的用戶界面還適應多種語言的輸入,而不要求在這些語言間進行明確的模式轉換。從而對用戶來說,該用戶界面直觀、易學并且友好。
在一種實現(xiàn)中,語言輸入用戶界面(UI)包括把語音文本和轉換的語言文本結合起來的成行輸入特征。具體地說,同時在和先前輸入的語音文本及先前轉換的語言文本相同的一行中顯示用戶正在輸入的語音文本。在和先前轉換的語言文本相同的一行中顯示輸入的語音文本使用戶能夠把他們的注意力集中到同一行中,從而產(chǎn)生更直觀和更自然的用戶界面。
語言輸入UI支持語言文本編輯操作,包括1)添加語言文本;2)刪除語言文本;3)用一個或多個候選替換語言文本替換選擇的語言文本。用戶界面使用戶能夠通過手動鍵入稍后能夠被轉換成新的語言文本的新的語音文本,選擇語言文本并替換它。另一方面,用戶界面提供候選語言文本的一個或多個列表。首先和選擇的要改變的語言文本一起提供一個浮動列表。按照這種方式,在句子結構中原位提供候選語言文本,使用戶能夠使上下文語法關系方面的糾正形象化。按照根據(jù)候選文本的選擇實際上是用戶最初的預期選擇的概率等級或者概率分數(shù)的分類順序,提供候選文本列表。該層次結構可以概率、字的筆劃或者其它量度為基礎。最前面的候選文本是給予該句子最高分數(shù)的候選文本,之后是給予該句子次高分數(shù)的第二候選文本,依次類推。
當用戶滾動該列表時,在語境菜單內(nèi)更新該列表。另外,沿滾動操作的方向以動畫移動的形式表示當前的視覺選擇。動畫顯示有助于用戶確定正被滾動的列表有多長或者有多快。一旦用戶選擇替換文本,則在句子內(nèi)語言文本的位置插入選擇的替換文本,從而使用戶能夠把注意力集中于正被編輯的一行。
語言輸入UI的另一特征在于使用戶能夠針對正被編輯的語言文本查看先前輸入的語音文本。用戶可選擇先前輸入的語音文本,并且當選擇時,在語言文本的位置顯示先前輸入的語音文本。隨后可編輯該語音文本并將其轉換成新的語言文本。
語言輸入用戶界面的另一特征是基于句子的自動轉換特征。就基于句子的自動轉換而論,在輸入后續(xù)的語音文本之后,句子內(nèi)先前轉換的語言文本還可被自動轉換成不同的語言文本。一旦結束句子,例如由句號指示,則該句子中的語言文本就被固定,不能因為輸入后一句子中的輸入文本而被進一步自動轉換成不同的語言文本。要認識到在備選實施例中可使用基于短語的自動轉換或者類似的自動轉換。
語言輸入用戶界面的另一特征是具有語言文本確認的基于句子的自動轉換。在語音文本被轉換成語言文本之后,用戶可確認剛剛轉換的語言文本,從而不再由于句子語境的緣故進一步自動轉換剛剛轉換的語言文本。
語言輸入界面的另一特征是能夠在不轉換模式的情況下處理多種語言。當和語音文本互混時,第二種語言的字詞或符號被看作是特殊的語言輸入文本并且被顯示為第二語言文本。從而,當輸入不同的語言時,不要求用戶轉換模式。
根據(jù)下述具體說明并且參考相關附圖,表征本發(fā)明的這些及其它各種特征和優(yōu)點將是顯而易見的。


在附圖中,相同的數(shù)字用于表示相同的組件和功能元件。
圖1是具有實現(xiàn)語言輸入體系結構的語言專用字處理器的計算機系統(tǒng)的方框圖。語言輸入體系結構包括語言輸入用戶界面(UI)。
圖2是語言輸入用戶界面的一種實現(xiàn)的屏幕顯示的示意圖。圖2圖解說明語言輸入UI的成行輸入特征。
圖3是語言輸入UI的屏幕顯示的示意圖,它表示了自動轉換特征。
圖4是語言輸入UI的屏幕顯示的示意圖,它表示基于句子的自動轉換特征。
圖5是語言輸入UI的屏幕顯示的示意圖,它表示原位糾錯特征和語音文本提示特征。
圖6是語言輸入UI的屏幕顯示的示意圖,它表示第二候選文本列表特征。
圖7是語言輸入UI的屏幕顯示的示意圖,它表示原位語音文本糾正特征。
圖8是語言輸入UI的屏幕顯示的示意圖,它表示圖7的原位語音文本糾正的后續(xù)屏幕。
圖9是語言輸入UI的屏幕顯示的示意圖,它表示圖7和8的原位語音文本糾正的后續(xù)屏幕。
圖10是語言輸入UI的屏幕顯示的示意圖,它表示包含多種不同語言的混合文本的輸入。
圖11是利用語言輸入用戶界面輸入文本的方法的流程圖。
圖12是成行輸入子過程的流程圖。
圖13是自動轉換子過程的流程圖。
圖14是具有確認的字符文本的自動轉換子過程的流程圖。
圖15是原位糾錯子過程的流程圖。
圖16是具有第二候選文本列表的原位糾錯子過程的流程圖。
圖17是語音文本提示子過程的流程圖。
圖18是原位語音文本糾正子過程的流程圖。
圖19是成行輸入混合語言文本子過程的流程圖。
圖20圖解說明例證的用戶輸入和所得到的例證的中文輸入用戶界面的屏幕鏡頭,它表示了成行輸入特征的一個例子。
圖21圖解說明例證的中文輸入用戶界面的例證屏幕顯示,它表示拼音文本提示特征的一個例子。
圖22圖解說明例證的用戶輸入和所得到的例證的中文輸入用戶界面的屏幕鏡頭,它表示了原位糾錯特征的一個例子。
圖23圖解說明例證的用戶輸入和所得到的例證的中文輸入用戶界面的屏幕鏡頭,它表示了原位拼音文本糾正特征的一個例子。
圖24圖解說明例證的用戶輸入和所得到的例證的中文輸入用戶界面的屏幕鏡頭,它表示了英文/中文的混合輸入特征的一個例子。
圖25圖解說明例證的用戶輸入和所得到的例證的中文輸入用戶界面的屏幕鏡頭,它表示了第二候選文本列表的一個例子。
圖26圖解說明例證的用戶輸入和所得到的例證的中文輸入用戶界面的屏幕鏡頭,它表示了具有字符確認的基于句子的自動轉換特征的一個例子。
圖27圖解說明了語音文本(例如中文拼音文本)及其相應的字文本(例如中文字文本)的定義,以及非語音文本(例如字母數(shù)字文本)的定義。
具體實施例方式
本發(fā)明涉及簡化語音文本輸入和到語言文本的轉換的語言輸入用戶界面。為了便于說明,在由通用計算機執(zhí)行的字處理程序的一般環(huán)境下說明本發(fā)明。但是,本發(fā)明可在除字處理之外的許多不同環(huán)境(例如電子郵件系統(tǒng)、瀏覽器等)中實現(xiàn),并且可在許多不同類型的裝置上實施。
系統(tǒng)結構圖1表示具有中央處理器(CPU)102、存儲器104和輸入/輸出(I/O)接口106的例證計算機系統(tǒng)100。CPU102與存儲器104和I/O接口106通信。存儲器104代表易失性存儲器(例如RAM)和非易失性存儲器(例如ROM、硬盤等)。
計算機系統(tǒng)100具有通過I/O接口106連接的一個或多個外圍設備。例證的外圍設備包括鼠標110、鍵盤112(例如字母數(shù)字QWERTY鍵盤、速寫鍵盤等)、顯示監(jiān)視器114、打印機116、外圍存儲器118和麥克風120。該計算機系統(tǒng)可實現(xiàn)為例如通用計算機。因此,計算機系統(tǒng)100實現(xiàn)存儲在存儲器104中并在CPU102上執(zhí)行的計算機操作系統(tǒng)(圖中未示出)。操作系統(tǒng)最好是支持窗口環(huán)境的多任務操作系統(tǒng)。一種適宜的操作系統(tǒng)是來自微軟公司的Windows操作系統(tǒng)。
注意也可使用其它計算機系統(tǒng)結構,例如手持式設備、多處理器系統(tǒng)、基于微處理器或者可編程的消費電子裝置、網(wǎng)絡PC、迷你計算機、大型計算機等等。另外,雖然圖1中圖解說明了獨立的計算機,不過語言輸入UI可在分布式計算環(huán)境中實現(xiàn),在分布式計算環(huán)境中由通過通信網(wǎng)絡(例如LAN、因特網(wǎng)等)鏈接的遠程處理設備執(zhí)行任務。在分布式計算環(huán)境中,程序模塊既可位于本地存儲器中又可位于遠程存儲器中。
數(shù)據(jù)或字處理程序130保存在存儲器104中并在CPU102上執(zhí)行。其它程序、數(shù)據(jù)、文件等也可保存到存儲器104中,不過為了便于說明沒有表示出。字處理程序130被配置成接收語音文本并且自動將其轉換成語言文本。更具體地說,字處理程序130實現(xiàn)語言輸入體系結構131,為了便于說明,所述語言輸入體系結構131被實現(xiàn)為存儲在存儲器中并且可在處理器上執(zhí)行的計算機軟件。除了體系結構131之外,字處理程序130還可包括其它組件,但是對于字處理程序來說,這些組件被認為是標準化的,因此將不具體表示或說明這些組件。
字處理程序130的語言輸入體系結構131具有用戶界面(UI)132、搜索引擎134、語言模型136和打字模型137。體系結構與語言無關。UI132和搜索引擎134是通用的,可用于任何語言。通過改變語言模型136和打字模型137,體系結構131適合于特定的語言。體系結構的更詳細說明參見同時待審的申請序列號No.__,“Language Input ArchitectureFor Converting One Text Form To Another Text Form With ToleranceTo Spelling,Typographical,And Conversion Errors”和序列號No._,“Language Input Architecture For Converting One Text Form toAnother Text Form With Modeless Entry”,這兩件同時待審的申請作為參考包含于此。
搜索引擎134、語言模塊136和打字模型137一起構成語音文本-語言文本轉換器138。對于本公開文獻來說,“文本”意味一個或多個字符和/或非字符符號?!罢Z音文本”一般指的是代表當說指定語言時發(fā)出的聲音的字母數(shù)字文本。“語言文本”是表示書面語言的字符和非字符符號。“非語音文本”是不代表當說指定語言時發(fā)出的聲音的字母數(shù)字文本。非語音文本可包括除語言文本之外代表書面語言的標點符號、特殊符號和字母數(shù)字文本。
圖27表示語音文本、轉換后的語言文本和非語音文本的一個例子。該例中,語音文本是可被翻譯成“hello”的中文拼音文本。例證的字符文本是同樣可被翻譯成“hello”的中文漢字文本。例證的非語音文本是一串字母數(shù)字符號文本“@3m”。為了便于說明,在基于中文的字處理器的方面說明字處理器130,語言輸入體系結構131被配置成把拼音轉換成漢字。即,語音文本是拼音,語言文本是漢字。
但是,語言輸入體系結構與語言無關,并且可用于其它語言。例如,語音文本可以是日語口語,而語言文本代表日文書面語言,例如日本漢字。存在許多其它例子,包括(但不局限于)阿拉伯語、朝鮮語、印度語、其它亞洲語言等等。
更一般地說,語音文本可以是以基于羅馬字的字符集(例如英文字母表)表示的任意字母數(shù)字文本,所述基于羅馬字的字符集表示當說指定語言時發(fā)出的聲音,而當被書寫時,所述指定語言并不采用基于羅馬字的字符集。
通過一個或多個外圍輸入設備,例如鼠標110、鍵盤112或麥克風120輸入語音文本。按照這種方式,允許用戶利用鍵盤輸入或者口頭語言輸入語音文本。在口語輸入的情況下,計算機系統(tǒng)還可實現(xiàn)語音識別模塊(圖中未示出),以便接收口語單詞并將其轉換成語音文本。下面的討論假定在實際大小的標準字母數(shù)字QWERTY鍵盤上進行借助鍵盤112的文本輸入。
當輸入語音文本時,UI132顯示該語音文本。UI最好是圖形用戶界面。用戶界面132把語音文本(P)傳遞給搜索引擎134,搜索引擎134再把語音文本傳遞給打字模型137。打字模型137產(chǎn)生可能是用戶預期的語音文本的適宜版本的各種打字候選文本(TC1,…TCN),假定語音文本可能包括錯誤。打字模型137把打字候選文本返回給搜索引擎13,搜索引擎13再將其傳遞給語言模型136。語言模型136產(chǎn)生以語言文本書寫的可能代表用戶預期的語音文本的轉換形式的各種轉換候選文本(CC1,…CCN)。轉換候選文本與打字候選文本相關。從語音文本到語言文本的轉換不是一對一的轉換。相同或相似的語音文本可能代表語言文本中的若干字符或符號。從而,在轉換成語言文本之前,解釋語音文本的上下文。另一方面,非語音文本的轉換一般是直接的一對一轉換,其中顯示的字母數(shù)字文本和字母數(shù)字輸入一樣。
轉換候選文本(CC1,…CCN)傳回給搜索引擎134,搜索引擎134進行統(tǒng)計分析,確定哪一個打字候選文本和轉換候選文本最有可能成為用戶預期的打字文本和轉換文本。一旦計算出概率,則搜索引擎134選擇概率最大的候選文本,并把轉換文本的語言文本返回給UI132。UI132隨后在顯示畫面的同一行中用轉換候選文本的語言文本替換語音文本。同時在新插入的語言文本的前一行中繼續(xù)顯示新輸入的語音文本。
如果用戶希望改變搜索引擎134選擇的語言文本,則用戶界面132提供按照抉擇實際是預期回答的似然性排序的第一其它高概率候選文本列表。如果用戶仍然對可能的候選文本不滿意,則UI132提供第二列表,所述第二列表提供所有可能的選擇。第二列表可按照概率或者其它量度(例如中文字符的筆劃數(shù)或者復雜性)排序。
語言輸入用戶界面剩下的說明將特別針對用戶界面132的特征。具體地說,用戶界面132在視覺上把輸入的語音文本的顯示和轉換后的語言文本的顯示集合到屏幕上的同一行中。在語音文本和轉換后的語言文本如何可視地出現(xiàn)在顯示屏幕上這方面說明許多特征,例如窗口或菜單或光標的出現(xiàn)和定位。注意這些特征由用戶界面132單獨支持或者由用戶界面132和操作系統(tǒng)一起支持。
圖2-10圖解說明語言輸入用戶界面132的一個例證實現(xiàn)的各種屏幕顯示。在圖2-10中使用符號“P”表示已輸入并且已顯示在UI中,但是還未被轉換成語言文本的語音文本。符號“C”表示從輸入的語音文本P轉換來的已轉換語言文本。對各個語音文本P使用下標,例如P1,P2,…PN及對各個已轉換語言文本C使用下標,例如C1,C2…CN,以表示單個的語音文本和轉換后的語言文本。
集合的成行(In-Line)文本輸入/輸出圖2表示由語言輸入UI132單獨或者結合操作系統(tǒng)給出的屏幕顯示200。在該圖中,屏幕顯示200類似于通常的圖形窗口,例如由微軟的Windows操作系統(tǒng)產(chǎn)生的那些窗口。圖形窗口適合于供語言輸入使用,并且給出成行輸入?yún)^(qū)202,在成行輸入?yún)^(qū)202中輸入語音文本并且隨后將其轉換成語言文本。圖2中由平行的虛線形象地表示成行區(qū)202。
輸入光標204標記當前位置,在所述當前位置將輸入下一語音文本。圖形UI還可包括若干工具條,例如工具條206、208、210、212,或者依賴于應用程序的其它功能特征,例如字處理器、數(shù)據(jù)處理器、電子數(shù)據(jù)表、因特網(wǎng)瀏覽器、電子郵件、操作系統(tǒng)等等。在字或數(shù)據(jù)處理領域中工具條為人們熟知,不進行詳細說明。
成行輸入?yún)^(qū)202集合語音文本P的輸入和轉換后的語言文本C的輸出。這使用戶能夠把注意力集中在單一屏幕區(qū)上。當用戶輸入語音文本(借助鍵盤輸入或者語音輸入)時,沿第一方向(例如橫越屏幕的水平方向)成行顯示語音文本P。依據(jù)轉換后的語言文本C1C2和輸入的語音文本P1P2P3決定輸入光標204的位置,或者輸入光標204與轉換后的語言文本C1C2和輸入的語音文本P1P2P3成一直線。圖2中,輸入序列從左到右,輸入光標204位于先前輸入的語音文本P1P2P3的右側。將認識到沿閱讀指定語言的相同方向輸入文本在本發(fā)明的范圍之內(nèi),本實現(xiàn)中說明的“從左到右”輸入序列只是一個例子。此外,要認識到語言輸入UI事實上能夠沿任意方向,包括(但不局限于)垂直方向、對角線方向等成行輸入。其它成行格式也是可能的,包括其中在用戶看來成行輸入功能似乎遠離或接近用戶的各種三維格式。
自動轉換當用戶輸入語音文本P時,轉換器138自動把語音文本轉換成轉換后的語言文本C。一般來說,在語音文本P被轉換成語言文本C之前,會輸入一些語音文本元素P(例如1到6個語音文本元素P)。
當進行轉換時,在如同由成行區(qū)202所示的和語音文本P相同的行中呈現(xiàn)轉換后的語言文本C。當用戶繼續(xù)輸入語音文本時,和先前轉換的語言文本C成一行地顯示最新輸入的語音文本P。例如在圖2中,和最近轉換的語言文本C1C2成一行地顯示語音文本P1P2P3。和先前轉換的語言文本C成一行地顯示輸入的語音文本P使用戶能夠使他們的注意力集中到同一行上,從而使輸入過程更直觀和自然,另外還允許更快的輸入。
當用戶繼續(xù)輸入語音文本P時,用戶界面實時地自動把語音文本P轉換成語言文本C,用戶不必轉換模式。如圖3的例子中所示,一旦用戶輸入語音文本P4,先前的語音文本P1P2P3就被自動轉換成語言文本C3。用戶繼續(xù)輸入語音文本P4P5P6P7,而不必轉換模式或者躊躇。
從語音文本到語言文本的轉換是由語言模型136控制的自動過程。語言文本C3被選擇為所有可能語言文本中概率最高的語言文本,并且這樣被用在自動轉換中。但是用戶鍵入越多,所考慮的上下文越大。因此,當進一步輸入諸如P4P5P6P7之類的語音文本時,語言文本C3可能被改變成不同的語言文本。
語言輸入體系結構131可被配置成使根據(jù)另外的輸入文本的輸入對轉換后的語言文本進行改變的次數(shù)降至最低。在某些情況下,有可能轉換后的語言文本隨輸入文本的各個輸入字改變,實質是在兩個或者更多的可能解釋間翻轉,在指定上下文關系中,所述兩個或者更多的可能解釋具有成為用戶預期文本的近似相同可能性。語言文本的持續(xù)翻轉在視覺上可能分散用戶的注意力。
為了使文本翻轉降至最少,轉換器138可實現(xiàn)一個或多個基于概率的規(guī)則,所述規(guī)則規(guī)定保持當前的語言文本,除非存在指定另一上下文的更大可能性。這樣,當從統(tǒng)計觀點來看,第二語言文本只是稍好時,轉換器138不愿意把轉換后的語言文本改變成第二語言文本。重要程度隨著上下文而變化。例如,轉換器138可被配置成只有當修改的語言文本的似然性比它將要替換的語言文本大至少5個百分點時,才修改語言文本。
基于句子的自動轉換和確認的自動轉換如果對很長的一串文本(例如文本段落)進行轉換,用戶可能會覺得不舒適。就用戶界面的一種實現(xiàn)而論,從語音文本P到語言文本C的自動轉換是基于句子的自動轉換。換句話說,一旦完成一個句子,則當在后一句子中輸入語音文本P時,該句子中的的語言文本C將不再被自動轉換成不同的語言文本C?;诰渥拥淖詣愚D換特征顯著降低了用戶的打字錯誤,并且防止先前的句子持續(xù)不斷地自動轉換。
應理解,可以其它多種方式確定句子。例如,句子可被定義為某一預定標點符號內(nèi)的一串文本,例如兩個句點之間的一串文本,各種預定標點符號之間的一串文本,包含某些文本元素的一串文本等等。一旦用戶輸入標點符號,則在該標點符號和前一標點符號(如果有的話)之間輸入的一串文本被看作為一個句子。當用戶在后續(xù)句子中輸入語音文本時,該句子中的一串轉換后的語言文本C不再被自動轉換。本領域中的技術人員將認識到如果需要,自動轉換可基于兩個或多個句子。
圖4圖解說明借助標點符號確認句子時的屏幕顯示200。除了確認句子之外,標點符號的輸入一般會使句子尾部的語音文本P被自動轉換成語言文本C。例如如圖4中所示,一旦輸入逗號400,語音文本P4P5P6P7被轉換成語言文本C4。該串語言文本C1C2C3C4現(xiàn)在被看作句子。轉換后的語言文本C1C2C3C4將不再自動轉換。
除了基于句子的自動轉換之外,用戶可在從輸入的語音文本P進行轉換之后明確確認一個或多個轉換的語言文本C。用戶可通過在鍵盤輸入用戶命令(例如空格鍵輸入)確認剛剛轉換的語言文本C,從而剛剛轉換的語言文本C將不再由于句子的上下文關系而被自動轉換。后面參考圖20和24說明這一特征的一個詳細例子。
延遲轉換就多種語言而論,和語音文本相比,用戶通常更習慣于閱讀和糾正語言文本。當輸入語音文本時,在試圖確定輸入的文本是否正確之前,用戶通常等待轉換。對于與拼音字符相比更喜歡閱讀并糾正中文漢字字符的中文用戶來說更是如此。
考慮到這種用戶特性,語言輸入體系結構131被設計成仔細考慮何時把語音文本轉換成語言文本。一般來說,當轉換器確信轉換后的語言文本是用戶預期的文本時進行轉換。就UI環(huán)境來說,該問題變成在任意時刻應顯示語音文本的多少字符,以致最后的轉換產(chǎn)生當用戶輸入更多的語音文本時不可能被修改的語言文本。轉換過快會在轉換后的語言文本中產(chǎn)生更多的錯誤,從而迫使用戶更頻繁地糾正轉換后的語言文本。轉換太慢會產(chǎn)生向用戶呈現(xiàn)長串的語音文本,而不是所需的語言文本的煩擾。
作為轉換過早和轉換過遲之間的折衷,語言輸入體系結構可被配置成延遲轉換,直到輸入最佳數(shù)目的語音字符,從而確保高的轉換精度為止。實踐中,該體系結構被設計成延遲選擇轉換后的文本和在語音文本的位置顯示轉換后的語言文本,直到輸入最小數(shù)目的字符之后和輸入最大數(shù)目的字符之前為止。例如,適合于中文的語言輸入體系結構可被配置成當輸入并在UI中顯示至少一個拼音字符和最多六個拼音字符時,把拼音文本轉換成漢字文本。
根據(jù)一種實現(xiàn),語言輸入體系結構執(zhí)行一組規(guī)則,以便相對于指定的上下文關系,確定在選擇并顯示轉換后的語言文本之前,可輸入的語音字符的最佳數(shù)目。這些規(guī)則可如下總結為規(guī)則1總是顯示最后(即最近輸入的)輸入字符。
規(guī)則2在輸入和顯示多個輸入字符之后,評估可能匹配的候選文本中一個或多個字符的頭N個轉換候選文本。如果對于所有N個轉換候選文本,至少一個轉換后字符相同,則把構成輸入文本一部分的至少一個輸入字符轉換成輸出文本中的匹配轉換字符。
規(guī)則3如果第一個最可能的轉換候選文本得分顯著高于第二個最可能的轉換候選文本,則把至少一個輸入字符轉換成第一轉換候選文本的字符。
無模式編輯圖5-9圖解說明該體系結構支持的無模式編輯特征的例證實現(xiàn)。用戶界面使用戶能夠從輸入模式無縫地轉變到編輯模式,而不需要明顯的模式轉換操作。此外,編輯模式支持傳統(tǒng)的編輯功能,例如語言文本的添加、刪除和替換。本發(fā)明允許通過輸入新的語音文本或者從至少一個候選替換語言文本列表中選擇替換語言文本,來替換語言文本。
原位錯誤糾正圖5表示具有各種編輯特征的屏幕顯示200。為了便于說明,假定用戶通過輸入標點符號400已確認語言文本C1C2C3C4(圖4之前),現(xiàn)在希望編輯確認的語言文本C1C2C3C4。用戶把光標204的位置改變到確認的語言文本C1C2C3C4內(nèi)的所需位置??梢远喾N不同方式完成光標定位,包括(但不局限于)方向鍵、鼠標點擊或口頭命令。圖5圖解說明重新定位到語言文本C3前,以便選擇該字符進行編輯的光標204。
一旦光標204被定位到語言文本C3前,則用戶輸入一個或多個用戶命令,調用編輯窗口或者編輯框500,所述編輯窗口或編輯框500在包含要編輯字符的文本處疊加在成行區(qū)202上或者附近。可以本領域中眾所周知的幾種方式中的任意方式實現(xiàn)用戶命令,包括(但不局限于)按下鍵盤112上的換碼鍵“ESC”。
在圖解說明的實現(xiàn)中,編輯窗口或編輯框500沿垂直于成行文本的第一方向(例如水平方向)的第二方向(例如垂直方向)在語言文本C3附近彈出。彈出式編輯窗口500具有兩個部分輸入文本提示窗口502和可滾動的候選文本窗口504。這些部分最好由共同的用戶命令同時調用。用戶先前輸入的字符C3的對應語音文本P1P2P3直接出現(xiàn)在輸入文本提示窗口502上方,并且與正被編輯的語言文本C3垂直成一直線。顯示輸入的語音文本P1P2P3允許用戶查看先前他們關于語言文本C3輸入的是什么,并且如果需要的話對其進行編輯。輸入文本提示窗口502具有布置在頂部的向上滾動條506。激活該向上滾動條506導致語音文本P1P2P3進入句子中,并且替換語言文本字符C3。
候選文本窗口504包含具有和語言文本C3相同或相似語音文本的至少一個候選替換語言文本C3a,C3b,C3c,C3d的可滾動列表。候選文本窗口504被布置成垂直于包含語言文本C1C2C3C4的成行輸入?yún)^(qū)202,直接位于語言字符C3下方,并與語言字符C3垂直成一直線。上標被用于表示不同的語言文本字符,例如C3a,C3b,C3c和C3d。當存在比候選文本窗口504中能夠顯示的更多的候選文本時,在候選文本窗口504的底部呈現(xiàn)向下滾動條508。用戶可選擇(例如點擊)向下滾動條508查看另外的替換語言文本。原位窗口502和504的一個特征是可動畫顯示滾動操作,從而展示向上或向下移動的候選文本。這向用戶提供每次滾動該列表一個條目的視覺反饋。
如圖所示,輸入文本提示窗口502中的語音文本P1P2P3和候選文本窗口504中的候選替換語言文本C3a,C3b,C3c,C3d另外有數(shù)字0、1、2、3、4作為引用編號??梢圆煌姆绞綄崿F(xiàn)替換語言文本的編號方法和候選文本窗口504的大小。就一種實現(xiàn)而論,候選文本窗口504的尺寸有限,并且只列出概率最大的頭四個替換語言文本。
最好按照某一順序或者等級排列候選文本窗口504中的候選語言文本C3a,C3b,C3c,C3d。例如,順序可以候選文本實際上是用戶最初預期的文本的概率或者可能性為基礎。該概率由搜索引擎134結合由語言模型136返回的候選文本計算得到。如果指定上下文中某一替換語言文本的概率高于指定上下文中另一替換語言文本的概率,則在靠近于要編輯的語言文本處用較低引用編號顯示具有較高概率的替換語言文本。
用戶可隨意地選擇語音文本P1P2P3或者通過輸入適當?shù)囊镁幪栠x擇替換語言文本C3a,C3b,C3c,C3d之一替換字符文本C3,或者通過其它常見的技術(指向并點擊選擇的選項)替換字符文本C3。選擇的替換文本隨后代替成行文本中的字符C3。一旦用戶選擇某一候選文本,則彈出式編輯窗口500可被配置成自動消失,留下糾正后的文本。另一方面,用戶可利用常規(guī)方法,例如用鼠標點擊窗口502和504外面,明確關閉文本提示窗口502和候選文本窗口504。
由原位窗口502和504實現(xiàn)的文本替換特征被稱為原位糾錯特征。在要替換的語言文本C3的原位顯示選擇的語音文本P1P2P3或者從替換語言文本C3a,C3b,C3c,C3d中選擇的一個語言文本。原位糾錯特征使用戶能夠把注意力集中于最接近于包含要編輯的語言文本的一串語言文本。
第二候選文本列表圖6圖解說明類似于圖5中所示的屏幕顯示200,不過還表示了與第一候選文本窗口504分離并且鄰近第一候選文本窗口504的第二候選文本窗口600。第二候選文本窗口600列舉和要編輯的字符文本C3的相應語音文本P1P2P3具有相同或相似的語音文本的替換語音文本的更大或者有可能完整的列表。輸入文本提示窗口502中的語音文本P1P2P3和候選文本窗口504中的替換語言文本C3a,C3b,C3c,C3d同樣列舉在第二候選文本窗口600中。在備選實施例中,在第二候選文本窗口600中只列舉另外的替換候選文本。
為了打開第二候選文本窗口600,用戶輸入命令,例如在候選文本窗口504中有效的同時,按下鍵盤上的右箭頭鍵。用戶隨后可借助適當?shù)拿?,例如鼠標點擊或者鍵盤輸入,選擇所需的替換語言文本。用戶可在文本字符之間移動中心點602。
第二候選文本窗口600中的候選文本也可按照某一順序排列,不過不必按照用于第一候選文本窗口504的相同的排隊技術。如處理第一候選文本窗口504中的候選文本那樣依據(jù)概率分數(shù)進行分類一般不適用于全部候選文本窗口600,因為許多候選文本之間的變化較小,并且沒有意義。對于在該環(huán)境中確定特定候選文本的位置,用戶可能沒有直觀感受。因此,第二候選窗口600嘗試按照能夠直觀發(fā)現(xiàn)所需候選文本的其它一些方式對候選文本排隊。
可用于把第二候選文本窗口600中的候選文本(尤其是在日語和漢語的情況下)的一種量度是字符或符號的復雜程度。例如,對于一系列中文候選文本來說,可按照構成該候選文本所需的筆劃數(shù)列舉候選文本。筆劃順序為搜尋所需語言文本的用戶施加一些切實感受。用戶可快速掃視窗口600中含有復雜程度看起來相似的字符的特定區(qū)域。這種排隊量度并不是用來使用戶計數(shù)或者知道準確的筆劃數(shù),而只是產(chǎn)生有效、始終一致并且視覺上可識別的分類順序。
要關閉窗口600,用戶輸入一個命令,例如在鍵盤上進行鍵盤輸入或者在窗口600外點擊鼠標。要認識到在本領域中窗口的開/關,窗口中的向上/向下滾動和向左/向右滾動,以及窗口中的向上/向下滾動的控制為人們熟知,不作詳細說明。
原位語音文本糾正圖7-9表示各種情況下的一系列屏幕顯示200,從而圖解說明圖5中所示的語音文本P1P2P3的原位語音文本糾正。本例中,用戶確定輸入文本提示窗口502中的語音文本P1P2P3不正確。正確的語音文本應為P1aP2P3。為了糾正該語音文本,用戶首先從輸入文本提示窗口502中選擇語音文本P1P2P3。
圖7表示在正被編輯的文本字符C3的位置顯示選擇的語音文本P1P2P3。用戶隨后可通過把P1改變?yōu)镻1a編輯該語音文本。
圖8表示語音文本被改變成P1a后的UI。文本提示窗口502同樣被更新以反映這種變化。作為編輯操作的結果,在候選文本窗口504中顯示具有相同或相似編輯語音文本P1aP2P3的至少一個新的替換語言文本C3j。用戶隨后可在候選文本窗口504中選擇替換語言文本(例如C3j)。
圖9表示選擇的代替編輯的語音文本P1aP2P3的替換文本C3j。在備選實施例中,編輯的語音文本可被自動轉換成最可能的新的替換語言文本。
混合語言輸入語言輸入體系結構還被進一步配置成區(qū)分兩種或多種語言。第一種語言被檢測為語音文本,并被轉換成語言文本,而第二種語言被檢測為非語音文本并被原樣保持。當用戶輸入文本時,UI132在同一行中同時呈現(xiàn)兩種語言。該技術有益于消除當輸入多語言文本時,在兩種輸入模式之間轉換的需要。就用戶而論,該用戶界面是無模式的。
圖10圖解說明該用戶界面的屏幕顯示200,并且示范兩種不同語言的混合文本的組合處理和呈現(xiàn)。符號“A”代表第二語言文本的字符。第二語言A是非語音語言,其中第二語言文本A被顯示為用戶的輸入。例如,第一語言是中文漢字,第二語言是英語。要認識到多種語言可以是任意數(shù)目的不同語言。
在一種實現(xiàn)中,用戶可輸入混合語言文本,其中之一中是可轉換為語言文本C(例如漢字)的語音文本(例如拼音)?;谧址恼Z言的語音文本P和語言文本A成行顯示,直到語音文本P被自動轉換成語言文本C為止,語言文本C和第二種語言的語言文本A成行顯示。圖10圖解說明在相同成行區(qū)域202內(nèi)的輸入語音文本P、轉換后的語言文本C和第二語言文本A。
不同的字體或顏色可用于區(qū)分語音文本P和非語音文本A。例如,以第一種字體或顏色顯示語音文本P,而以不同于第一種字體或顏色的第二種字體或顏色顯示非語音文本A。除了字體或顏色之外,其它技術可用于在視覺上區(qū)分語音文本P和非語音文本A。
一般的UI操作圖11-19圖解說明由語言輸入體系結構實現(xiàn)的方法。這些方法被實現(xiàn)為語言輸入用戶界面的一部分,以方便語音文本的輸入和編輯,以及轉換后的語言文本的編輯。圖11圖解說明一般過程,而圖12-19更詳細地圖解說明某些操作。輔助參考圖2-10的屏幕顯示說明這些方法。
圖11表示通過語言輸入用戶界面輸入文本的方法1100。在操作1102,用戶界面使用戶能夠在公共成行區(qū)202內(nèi)輸入文本。在所描述的實現(xiàn)中,輸入文本是語音文本,例如中文拼音。該輸入文本被自動轉換成基于字的語言的語言文本,例如中文漢字(操作1104)。前面參考圖1說明了這種轉換的一種例證實現(xiàn)。如果讀者感興趣,可在所包含的同時待審的申請,序列號No.__,“Language Input Architecture For ConvertingOne Text Form to Another Text Form With Tolerance To Spelling,Typographical,And Conversion Errors”和序列號No.__,“LanguageInput Architecture For Converting One Text Form to Another Text FormWith Modeless Entry”中找到更詳細的說明。
操作1106確定用戶是否想要在轉換后編輯語言文本,由光標重新定位或者明確的命令指出。如果是(即,來自操作1106的“是”分支),則UI接收最接近要編輯字符的光標的用戶重新定位(操作1108)。如圖5中所示,光標可被重新放置到語言文本字符的前面。
在步驟1110,如圖5中所示,UI響應用戶命令打開編輯窗口500。編輯窗口500包括用于替換語言文本的第一候選文本列表504。如果在候選文本列表504中不存在適當?shù)暮蜻x替換文本,則用戶可決定調用如圖6中所示的第二候選文本列表窗口600。操作1112確定用戶是否已請求第二候選文本窗口600。如果在第一候選文本窗口504中可獲得適當?shù)暮蜻x文本,從而用戶決定不打開第二候選文本列表窗口(即來自操作1112的“否”分支),則用戶可從第一候選文本列表窗口中選擇替換語言文本,替換要編輯的語言文本(操作1114)。
另一方面,如果用戶調用第二候選文本窗口(即來自操作1112的“是”分支),則UI打開第二候選文本列表窗口,并且允許用戶選擇用于替換被編輯的語言文本的替換語言文本(操作1116)。隨后代替成行區(qū)202中的語言文本顯示選自第一候選文本列表窗口504或者第二候選文本列表窗口600的替換語言文本(操作1118)。在操作1106繼續(xù)該操作流程。
如果用戶不想編輯文本(即來自操作1106的“否”分支),則UI確定用戶是否繼續(xù)輸入文本,由用戶改變光標位置并且繼續(xù)輸入字符指出(操作1120)。如果用戶的操作傾向于暗示繼續(xù)輸入文本,則光標被移回位于當前部分末端的輸入位置(操作1122),并且在輸入成行操作1102中繼續(xù)操作流程。如果用戶不想繼續(xù),則終止該過程。
成行輸入操作1102和1104圖12圖解說明成行輸入子過程1200,它是圖11的操作1102和1104的例證實現(xiàn)。圖2和3中圖解說明了描繪該子過程的例證屏幕顯示。
在操作1202,UI接收來自輸入裝置(例如鍵盤、語音識別)的輸入語音文本串(例如拼音)。語言輸入UI在和先前轉換的語言文本相同的成行區(qū)202內(nèi)顯示該語音文本(操作1204)。語音文本-語言文本轉換器138在操作1206中把該串語音文本轉換成語言文本(例如漢字)。語言輸入UI用轉換后的語言文本串替換該語音文本串,并在成行區(qū)202中顯示該語言文本(操作1208)。隨后退出子過程1200。
基于句子的轉換操作1104圖13圖解說明自動轉換子過程1300,它是操作1104的另一例證實現(xiàn)。圖3和4中圖解說明了描繪該子過程的例證屏幕顯示。
在操作1302,語言輸入體系結構接收用戶通過輸入裝置輸入的一串語音文本。語言輸入UI在成行區(qū)202中顯示輸入的語音文本(操作1304)。在操作1306,語言輸入體系結構確定該語音文本是屬于已有的句子還是屬于新的句子。這種確定可以用戶是否已輸入某些形式的標點符號,例如句號或逗號為基礎。
如果輸入的語音文本屬于新的句子(即來自操作1306的“新句子”分支),則輸入的語音文本被自動轉換成語言文本,而不考慮前一句子中前一文本的內(nèi)容(如果有的話)(操作1308)。相反,如果輸入的語音文本不屬于新的句子(即來自操作1306的“現(xiàn)有句子”分支),則在該句子的上下文關系內(nèi)自動轉換該句子中的語音文本(操作1310)。作為這種轉換的一部分,當其它文本持續(xù)不斷地改變整個句子的預期含義時,以前轉換的語言文本可被進一步修改。在轉換操作1308和1310之后退出該操作流程。
確認轉換操作1104圖14圖解說明其中用戶確認轉換后的語言文本的自動轉換子過程1400。子過程1400是操作1104的另一例證實現(xiàn)。
在操作1402,語言輸入體系結構接收用戶通過輸入裝置輸入的一串語音文本。語言輸入UI在成行區(qū)202中顯示輸入的語音文本(操作1404)。相應的未確認的語言文本的語音文本被自動轉換成基于字的語言的語言文本(操作1406)。
在操作1408,語言輸入UI確定用戶是否已確認轉換后的語言文本。如果否,則退出該子過程。否則,如果用戶已確認該語言文本(即來自操作1408的“是”分支),則UI確認轉換后的語言文本,并且當輸入其它語音文本時,不在進一步的前后關系中考慮該語言文本(操作1410)。隨后退出該操作流程。
原位糾錯操作1108-1118圖15-18圖解說明原位糾錯子過程的不同實現(xiàn),它是圖11的操作1108-1118的例證實現(xiàn)。圖15和16的子過程涉及使用第一和第二候選文本列表糾正語言文本。圖17和18的子過程目標在于使用語音文本提示窗口糾正語音文本。
圖15圖解說明通過在彈出式候選文本窗口中提供備選的語言文本糾正轉換后的語言文本的原位糾錯子過程1500。圖5中圖解說明了描繪該子過程1500的例證屏幕顯示。
在操作1502,響應用戶把光標移動到緊鄰先前輸入的語言文本(例如在字之前)的操作,語言輸入UI選擇或識別要編輯的語言文本。UI打開編輯窗口500(包括直接位于要編輯的語言文本下方的第一候選文本窗口504),顯示選擇的語言文本的替換候選文本列表(操作1504)。
在操作1506,UI接收用戶選自第一候選文本窗口504的候選替換文本。語言輸入UI在相同成行區(qū)202內(nèi)顯示代替選擇的語言文本的選擇的候選替換語言文本(操作1508)。隨后退出該操作流程。
圖16圖解說明通過在第二個更大的彈出式候選文本窗口中提供完整的備選語言文本列表,糾正轉換后的語言文本的原位糾錯子過程1600。圖6中圖解說明了描繪該子過程1600的例證屏幕顯示。
在操作1602,響應用戶把光標移動到緊鄰先前輸入的語言文本(例如在字之前)的操作,語言輸入UI選擇或識別要編輯的語言文本。UI打開編輯窗口500(包括直接位于要編輯的語言文本下方的第一候選文本窗口504),顯示選擇的語言文本的替換候選文本列表(操作1604)。如果用戶找不到恰當?shù)奶鎿Q候選文本,則用戶可調用候選的替換語言文本的第二候選文本窗口600(操作1606)。和第一候選文本窗口相比,第二候選文本列表包含更大或更完整的候選替換語言文本列表。
在操作1608,UI接收用戶選自第二候選文本窗口600的替換候選文本。語言輸入UI在相同成行區(qū)202內(nèi)顯示代替選擇的語言文本的選擇的候選替換語言文本(操作1610)。隨后退出該操作流程。
圖17圖解說明通過借助彈出式提示窗口編輯先前輸入的語音文本,糾正轉換后的語言文本的原位糾錯子過程1700。圖7中圖解說明了描繪該子過程1700的例證屏幕顯示。
在操作1702,響應用戶把光標移動到緊鄰先前輸入的語言文本(例如在字之前)的操作,語言輸入UI選擇或識別要編輯的語言文本。UI打開編輯窗口500(包括直接位于要編輯的語言文本上方,顯示用戶輸入的語音文本的語音文本提示窗口502)(操作1704)。
一旦用戶在提示窗口502中選擇語音文本(即來自操作1706的“是”分支),UI顯示代替正被編輯的語言文本的語音文本(操作1708)。這使得用戶能夠糾正成行區(qū)202內(nèi)的語音文本。隨后退出該操作流程。
圖18圖解說明通過編輯先前輸入的語音文本,并查看編輯后的一組新候選文本,糾正轉換后的語言文本的原位糾錯子過程1800。圖8和9中圖解說明了描繪該子過程1800的例證屏幕顯示。
在操作1802,響應用戶把光標移動到緊鄰先前輸入的語言文本(例如在字之前)的操作,語言輸入UI選擇或識別要編輯的語言文本。UI打開編輯窗口500(包括直接位于選擇的語言文本上方的語音文本提示窗口502和直接位于該語言文本下方的第一候選文本窗口504)(操作1804)。
一旦用戶在提示窗口502中選擇語音文本(即來自操作1806的“是”分支),UI顯示代替正被編輯的語言文本的語音文本(操作1808)。UI接收并在成行編輯區(qū)202中顯示語音文本的用戶編輯(操作1810)。響應該編輯,UI在第一候選文本窗口504中顯示新的候選替換語言文本列表(操作1812)。如果需要,用戶可進一步調用第二候選文本窗口600。
在操作1814,UI接收用戶從第一候選文本窗口504的新列表中選擇的候選替換文本。語言輸入UI在相同的成行區(qū)202內(nèi)顯示選擇候選替換語言文本用于代替選擇的語言文本(操作1816)。隨后退出該操作流程。
多種語言輸入圖19圖解說明其中利用成行輸入UI輸入兩種或更多種不同語言的多種語言輸入子過程1900。圖10中圖解說明了描繪該子過程1900的例證屏幕顯示。
在操作1902,語言輸入體系結構接收用戶借助輸入裝置輸入的語音文本和非語音文本的一串混合文本。語言輸入UI在和先前轉換的語言文本相同的成行區(qū)202內(nèi)顯示該混合文本(操作1904)。
在操作1906,語言輸入體系結構確定輸入文本是否是和非語音文本(例如英語)相反的語音文本(例如拼音)。如果輸入文本是語音文本(即來自操作1906的“是”分支),則語言輸入體系結構把該語音文本轉換成語言文本(操作1908)。UI在輸入的語音文本的位置和先前的文本成行地顯示該語言文本(操作1910)。另一方面,如果輸入文本是非語音文本(即來自操作1906的“否”分支),則語言輸入體系結構不對其進行轉換,UI顯示該非語音文本,使之與先前的文本成行(操作1912)。隨后退出該操作流程。
例證的基于中文的實現(xiàn)圖20-26圖解說明中文環(huán)境下語言輸入體系結構和UI的例證實現(xiàn)。在這種情況下,語音文本是中文拼音,語言文本是中文漢字字符。
圖20圖解說明表示成行輸入特征的一個例子的中文輸入用戶界面的一種實現(xiàn)。表2000包含用戶輸入的兩串拼音文本2002和2004,以及當其出現(xiàn)在成行輸入?yún)^(qū)中時對應的轉換后的漢字文本2006和2008。例證的顯示屏幕2010顯示在表2000下方,并且包含轉換后的漢字文本2008。注意與轉換后的中文文字同行地顯示在光標2012輸入的拼音文本。在字處理領域中,屏幕2010中所示的其它特征為人們熟知。
圖21圖解說明其中當前在成行輸入?yún)^(qū)202中顯示轉換后的漢字文本的中文UI屏幕2100。用戶已移動光標選擇供編輯的中文文本2104,并已調用由拼音文本提示窗口2108和第一漢字候選文本窗口2110組成的彈出式編輯窗口2106。在拼音文本提示窗口2108中顯示與選擇的中文文本2104相關的拼音文本2112。
圖22圖解說明表示原位糾錯特征的一個例子的中文輸入用戶界面的一種實現(xiàn)。表2200在左欄中描述兩種用戶操作-打開包含語音提示和候選文本列表的編輯窗口的操作2202和從候選文本列表中選擇條目“1”的操作2204。響應左欄中的用戶操作,表2200中的右欄圖解說明了相應的例證屏幕鏡頭2206和2208。
就屏幕鏡頭2206來說,用戶通過把光標移動到字符文本2210之前,選擇供編輯的中文文本2210。用戶輸入命令,打開包含拼音文本提示窗口2212和第一候選文本列表窗口2214的編輯窗口。隨后,用戶從候選文本列表2214中選擇條目“1”,與條目“1”相關的第一候選文本2216代替初始的選擇文本2210。另外注意列表2208中的候選文本被更新(即向上滾動一位),以反映選擇的候選文本2216被轉移到成行輸入?yún)^(qū)中。這種更新可以是動畫式的,從而在視覺上說明選擇的候選文本2216被轉移到成行區(qū)中。
圖23表示圖解說明拼音文本的原位糾正的中文輸入用戶界面的另一種實現(xiàn)。表2300中的左欄包含一系列的用戶操作2302-2310,右欄表示由這些用戶操作產(chǎn)生的相應例證屏幕鏡頭2312-2320。
當用戶決定編輯字符文本時,用戶把光標移動到要編輯的字符文本之前(操作2302)。假定用戶選擇要編輯的中文文本2330(UI屏幕鏡頭2312)。在把光標移動到字符文本2330前面之后,用戶輸入命令(例如按下“ESC”鍵)調用編輯窗口(操作2304)。從而,如UI屏幕鏡頭2314中所示,打開拼音文本提示窗口2332和第一候選文本列表窗口2334。
隨后用戶輸入“0”(操作2306)選擇拼音文本提示窗口2332中的拼音文本2336。選擇的拼音文本2336替換選擇的字符文本2330,如UI屏幕鏡頭2316中所示。此時,用戶可以自由編輯初始的拼音文本。
假定用戶在拼音文本2336中添加輔助撇號(操作2308),產(chǎn)生如UI屏幕鏡頭2318中所示的文本2336′。編輯的拼音文本2336′既顯示在成行區(qū)中又顯示在拼音文本提示窗口2332中。在該編輯之后,利用新的候選字符文本列表更新第一候選文本窗口2334。本例中,在第一候選文本列表窗口2334中顯示對應于編輯的拼音文本2336′的新的候選字符文本2338。
最后,用戶通過例如輸入“1”在第一候選文本列表窗口2334中選擇所需的字符文本2338(操作2310)。從而,如UI屏幕鏡頭2320中所示,顯示選擇的字符文本2338代替編輯的拼音文本2336′。按照這種方式,新的字符文本2338有效替換初始的語言文本2330。
圖24表示圖解說明混合語言,例如中文和英語的輸入的中文輸入用戶界面的另一實現(xiàn)。表2400中的左欄包含兩個用戶操作2402和2404,右欄表示由這些用戶操作產(chǎn)生的對應例證屏幕鏡頭2406和2408。
假定如操作2402所示,用戶輸入混合的拼音文本2410和英文文本2412。用戶可把混合文本輸入語言輸入UI,而不必在中文輸入和英文輸入之間改變模式。即,用戶不停頓地在同一行中簡單輸入拼音文本和英文文本。拼音文本2410被轉換成中文文本2414,并顯示在相同的成行區(qū)內(nèi),如UI屏幕鏡頭2406中所示。英文文本2412不被語言輸入體系結構轉換,而是按照輸入被顯示。
隨后,用戶輸入混合的拼音文本2416、英文文本2418和拼音文本2420,而不必改變模式(操作2404)。如UI屏幕鏡頭2408中所示,拼音文本2416和2420分別被轉換成中文文本2422和2424。英文文本2418保持不變,并且與轉換后的中文文本成行地被顯示。
按照一種實現(xiàn),可不同地顯示語音文本和非語音文本以區(qū)分它們。例如,比較圖20的表2000中的混合文本和圖24的表2400中的混合文本。以收縮的粗體字顯示拼音文本(例如圖20中的2012),而以稀疏的courier字體顯示英文文本(例如圖24中的2412和2418)。
圖25表示圖解說明原位編輯的第一和第二候選文本列表的中文輸入用戶界面的另一種實現(xiàn)。表2500中的左欄包含兩個操作2502和2504,右欄表示由這些用戶操作產(chǎn)生的對應例證屏幕鏡頭2506和2508。
在操作2502,用戶選擇要編輯的中文文本,并輸入命令以打開拼音文本提示窗口2510和第一候選字符文本列表2512。如UI屏幕鏡頭2506中所示,窗口2510和2512分別出現(xiàn)在成行輸入?yún)^(qū)的上方和下方。
隨后在操作2504中,用戶輸入命令打開第二候選字符文本列表。如UI屏幕鏡頭2508中所示,緊跟在第一候選文本列表2512之后彈出打開第二候選字符文本窗口2514。用戶隨后可從第二候選字符文本列表窗口2514中選擇候選字符文本。
圖26表示圖解說明具有確認的字符文本的基于句子的自動轉換的中文輸入用戶界面的另一種實現(xiàn)。表2600中的左欄包含一系列的五個操作2602-2610,右欄表示由這些用戶操作產(chǎn)生的對應例證屏幕鏡頭2612-2620。
在操作2602,用戶輸入拼音文本2622和2624。如UI屏幕鏡頭2612所示,拼音文本2622被自動轉換成字符文本2626,拼音文本2624保持不變,直到用戶進一步輸入其它文本為止。在操作2604,用戶隨后輸入拼音文本2628。由于拼音文本2628的增加導致上下文關系的改變,先前轉換的字符文本現(xiàn)在被轉換成不同的中文字符文本2630。在UI屏幕鏡頭2614中圖解說明了轉換后的字符文本的這種修改。此時拼音文本2624和2628保持不變,并且繼續(xù)被表示為和修改的語言文本排成一行。
隨后在步驟2606,用戶輸入確認命令(例如按下空格鍵),確認剛剛轉換的字符文本2630。同時,根據(jù)迄今句子中的上下文關系,拼音文本2624和2628分別被自動轉換成中文文本2632和2634。屏幕鏡頭2616中對此進行了圖解說明。
隨后,在操作2608,用戶輸入同一句子中的其它拼音文本(圖中未示出),該拼音文本被轉換成字符文本2636,如UI屏幕鏡頭2618中所示。注意確認的字符文本2630不會因拼音文本的后續(xù)輸入而被改變。
為了便于比較,假定字符文本2630未被用戶操作2606確認(例如用戶未按下空格鍵)。相反,用戶在沒有確認字符文本2630的情況下輸入另外的拼音文本。這種情況下,字符文本2626保持不變并且不被修改成文本2630,如UI屏幕鏡頭2620所示。這是因為從拼音文本到字符文本的自動轉換是以句子為基礎的,并且字符文本2626是句子的一部分。只要句子有效(即沒有任何標點符號終止該句子或者還沒有開始任何新句子),就會對當前句子中先前轉換的字符文本進行進一步的修改,除非用戶確認轉換后的字符文本。
結論雖然上面的說明使用特定于結構特征和/或方法動作的語言,但是要明白在所屬的權利要求中限定的本發(fā)明并不局限于說明的具體特征或動作。相反,只是作為實現(xiàn)本發(fā)明的例證形式公開這些具體特征和動作。
權利要求
1.一種方法,包括接收用戶輸入的輸入文本;把輸入文本轉換成輸出文本;和在共同的輸入行內(nèi)顯示輸入文本和輸出文本。
2.按照權利要求1所述的方法,其中輸入文本包括語音文本,輸出文本包括基于字的語言文本。
3.按照權利要求1所述的方法,其中輸入文本包括中文拼音,輸出文本包括中文漢字。
4.按照權利要求1所述的方法,其中顯示包括在共同的水平行內(nèi)顯示輸入文本和輸出文本。
5.按照權利要求1所述的方法,其中顯示包括在輸入文本的位置顯示輸出文本,所述輸出文本由所述輸入文本轉換而來。
6.按照權利要求1所述的方法,還包括當輸入另外的輸入文本時,修改輸出文本。
7.按照權利要求6所述的方法,還包括響應標點符號的用戶輸入,當輸入另外的輸入文本時,停止進一步修改輸出文本。
8.按照權利要求6所述的方法,還包括響應輸出文本的用戶確認,當輸入另外的輸入文本時,停止進一步修改輸出文本。
9.按照權利要求6所述的方法,還包括響應輸出文本的用戶確認,停止修改輸出文本,同時使未轉換的輸入文本保持可修改狀態(tài)。
10.按照權利要求1所述的方法,還包括當輸入另外的輸入文本時,有選擇地修改輸出文本,以致如果這種修改僅僅產(chǎn)生較小的改進時就不進行任何修改。
11.按照權利要求1所述的方法,還包括在不從輸入模式轉換到編輯模式的情況下,使用戶能夠在共同的輸入行內(nèi)編輯輸出文本。
12.按照權利要求1所述的方法,還包括響應供編輯的輸出文本的用戶選擇,鄰近輸入行中選擇的輸出文本顯示一個編輯窗口。
13.按照權利要求12所述的方法,其中輸入行沿第一方向定向,并且還包括沿垂直于第一方向的第二方向為編輯窗口定向。
14.按照權利要求1所述的方法,還包括響應供編輯的輸出文本的用戶選擇,鄰近輸入行中選擇的輸出文本顯示輸入文本提示窗口,輸入文本提示窗口包括輸入文本,選擇的輸出文本由所述輸入文本轉換而來。
15.按照權利要求1所述的方法,還包括響應供編輯的輸出文本的用戶選擇,鄰近輸入行中選擇的輸出文本顯示第一候選文本列表,第一候選文本列表包含可替換選擇的輸出文本的一個或多個預備的候選輸出文本。
16.按照權利要求15所述的方法,還包括按照順序對第一候選文本列表內(nèi)的候選輸出文本排序。
17.按照權利要求15所述的方法,其中第一候選文本列表可滾動,并且還包括當滾動該列表時,動畫移動候選輸出文本。
18.按照權利要求15所述的方法,還包括顯示包含與第一候選文本列表相比更完整的一組候選輸出文本的第二候選文本列表。
19.按照權利要求18所述的方法,還包括按照字結構的復雜性排列第二候選文本列表中的候選輸出文本。
20.按照權利要求18所述的方法,還包括按照第一量度對第一候選文本列表中的候選輸出文本排序;和按照不同于第一量度的第二量度,對第二候選文本列表中的候選輸出文本排序。
21.按照權利要求1所述的方法,其中沿第一方向對輸入行定向,并且還包括響應供編輯的輸出文本的用戶選擇沿垂直于第一方向的第二方向在選擇的輸出文本上方顯示輸入文本提示窗口,輸入文本提示窗口包含輸入文本,選擇的輸出文本由所述輸入文本轉換而來;和沿第二方向在選擇的輸出文本下方顯示第一候選文本窗口,所述第一候選文本窗口包含可替換選擇的輸出文本的一個或多個預備的候選輸出文本。
22.按照權利要求1所述的方法,其中輸入文本包括語音文本和非語音文本,該方法還包括把語音文本轉換成語言文本;和在共同的輸入行內(nèi)顯示語言文本、非語音文本和新輸入的語音文本。
23.按照權利要求1所述的方法,還包括使用戶能夠在不在用于第一種語言的第一輸入模式和用于第二種語言的第二輸入模式之間進行轉換的情況下,輸入包含至少兩種語言的輸入文本。
24.按照權利要求1所述的方法,其中輸入文本包括單個的輸入字符,該方法還包括當至少顯示一個輸入字符,并且最多顯示六個輸入字符時,把輸入字符中的至少一個字符轉換成輸出文本。
25.按照權利要求1所述的方法,其中輸入文本包括單個的輸入字符,該方法還包括評估用于匹配字符的至少兩個候選轉換字符;和如果兩個候選轉換字符中的至少一個字符匹配,把至少一個輸入字符轉換成匹配的字符。
26.按照權利要求1所述的方法,其中輸入文本包括單個的輸入字符,該方法還包括總是顯示最近輸入的輸入字符。
27.按照權利要求1所述的方法,其中輸入文本包括單個的輸入字符,該方法還包括如果第一最可能的候選轉換字符的得分明顯高于第二可能的候選轉換字符的得分,則把至少一個輸入字符轉換成第一最可能的候選轉換字符的輸出文本。
28.一種或多種計算機可讀的媒介,所述媒介具有計算機可讀的指令,所述指令當在處理器上執(zhí)行時,指令計算機執(zhí)行按照權利要求1所述的方法。
29.一種方法,包括當用戶輸入語音文本時顯示該語音文本;和顯示由語音文本轉換來的語言文本,在由其轉換得到語言文本的語音文本的位置呈現(xiàn)語言文本,從而一起顯示語言文本和未被轉換的語音文本。
30.按照權利要求29所述的方法,其中語音文本包括中文拼音,語言文本包括中文漢字。
31.按照權利要求29所述的方法,還包括在共同的水平行內(nèi)一起顯示未轉換的語音文本和語言文本。
32.按照權利要求29所述的方法,還包括當輸入另外的語音文本時,修改語言文本。
33.按照權利要求32所述的方法,還包括響應標點符號的用戶輸入,當輸入另外的語音文本時,停止進一步修改語言文本。
34.按照權利要求32所述的方法,還包括響應語言文本的用戶確認,當輸入另外的語音文本時,停止進一步修改語言文本。
35.按照權利要求32所述的方法,還包括響應語言文本的用戶確認,停止修改語言文本,同時使未轉換的語音文本保持可修改狀態(tài)。
36.按照權利要求29所述的方法,還包括隨著輸入另外的語音文本,如果第二語言文本更可能是預期的語言文本,則把語言文本修改為第二語言文本。
37.按照權利要求29所述的方法,還包括在不從輸入模式轉換到編輯模式的情況下,使用戶能夠編輯語言文本。
38.按照權利要求29所述的方法,還包括響應供編輯的語言文本的用戶選擇,鄰近選擇的語言文本顯示編輯窗口。
39.按照權利要求29所述的方法,還包括響應供編輯的語言文本的用戶選擇最接近于選擇的語言文本顯示語音文本提示,語音文本提示包含語音文本,選擇的語言文本由所述語音文本轉換而來;和最接近于選擇的語言文本顯示減少的一組候選文本列表,候選文本列表包含一組減少的可替換選擇的語言文本的一個或多個預備的候選語言文本。
40.按照權利要求39所述的方法,還包括按照順序對候選文本列表內(nèi)的候選語言文本排序。
41.按照權利要求39所述的方法,其中候選文本列表可滾動,并且還包括當滾動該列表時,動畫移動候選語言文本。
42.按照權利要求39所述的方法,還包括顯示不同于減少的一組候選文本列表的一組完整的候選文本列表,完整的候選文本列表包含完整的一組候選語言文本。
43.按照權利要求42所述的方法,還包括按照字結構的復雜性,排列完整的一組候選文本列表內(nèi)的候選語言文本。
44.按照權利要求42所述的方法,還包括按照第一量度排列減少的一組候選文本列表中的候選語言文本;和按照不同于第一量度的第二量度,排列完整的一組候選文本列表中的候選語言文本。
45.按照權利要求29所述的方法,其中語音文本包含單個的字符,該方法還包括當顯示至少一個語音字符,并且最多顯示六個語音字符時,至少把語音字符之一轉換成語言文本。
46.一種或多種計算機可讀的媒介,所述媒介具有計算機可讀的指令,所述指令當在處理器上被執(zhí)行時,指令計算機執(zhí)行按照權利要求29所述的方法。
47.一種方法,包括提供接收用戶輸入的語音文本和非語音文本的用戶界面;把語音文本轉換成語言文本;和一起顯示語言文本、非語音文本和未被轉換的語音文本。
48.按照權利要求47所述的方法,還包括在共同的水平行內(nèi)成行地顯示語言文本、非語音文本和未被轉換的語音文本。
49.按照權利要求47所述的方法,還包括與顯示未被轉換的語音文本不同地顯示非語音文本,以致非語音文本看起來不同于未被轉換的語音文本。
50.按照權利要求47所述的方法,還包括以第一種字體顯示非語音文本,以不同于第一種字體的第二種字體顯示未被轉換的語音文本。
51.按照權利要求47所述的方法,還包括以第一種顏色顯示非語音文本,以不同于第一種顏色的第二種顏色顯示未被轉換的語音文本。
52.一種或多種計算機可讀的媒介,所述媒介具有計算機可讀的指令,所述指令當在處理器上被執(zhí)行時,指令計算機執(zhí)行按照權利要求47所述的方法。
53.一種語言輸入用戶界面,包括基于行的輸入?yún)^(qū);在基于行的輸入?yún)^(qū)內(nèi)顯示的輸入文本;和在基于行的輸入?yún)^(qū)內(nèi)和未被轉換的輸入文本一起顯示的由輸入文本轉換而來的輸出文本。
54.按照權利要求53所述的語言輸入用戶界面,其中輸入文本包括語音文本,輸出文本包括基于字的語言文本。
55.按照權利要求53所述的語言輸入用戶界面,其中輸入文本包括中文拼音,輸出文本包括中文漢字。
56.按照權利要求53所述的語言輸入用戶界面,其中基于行的輸入?yún)^(qū)采取水平方向。
57.按照權利要求53所述的語言輸入用戶界面,其中輸出文本替換輸入文本,輸出文本由所述輸入文本轉換而來。
58.按照權利要求53所述的語言輸入用戶界面,其中當輸入另外的輸入文本時,進一步修改輸出文本。
59.按照權利要求53所述的語言輸入用戶界面,其中響應標點符號的用戶輸入,使輸出文本固定不變。
60.按照權利要求53所述的語言輸入用戶界面,其中響應輸出文本的用戶確認,使輸出文本固定不變。
61.按照權利要求53所述的語言輸入用戶界面,還包括在不從輸入模式轉換到編輯模式的情況下,在基于行的輸入?yún)^(qū)內(nèi)編輯輸出文本的編輯裝置。
62.按照權利要求53所述的語言輸入用戶界面,還包括用戶調用的布置在要編輯的特定輸出文本附近的編輯窗口。
63.按照權利要求53所述的語言輸入用戶界面,其中沿第一方向給基于行的輸入?yún)^(qū)定向,并且還包括鄰近基于行的輸入?yún)^(qū)布置的,并且沿垂直于第一方向的第二方向定向的編輯窗口。
64.按照權利要求53所述的語言輸入用戶界面,還包括由用戶調用的、接近選擇的要編輯的輸出文本布置在基于行的輸入?yún)^(qū)附近的輸入文本提示,該輸入文本提示窗口包含輸入文本,所選擇的輸出文本由所述輸出文本轉換而來。
65.按照權利要求53所述的語言輸入用戶界面,還包括用戶調用的接近選擇的要編輯的輸出文本布置在基于行的輸入?yún)^(qū)附近的候選文本列表,候選文本列表包含可替換選擇的輸出文本的一個或多個預備的候選輸出文本。
66.按照權利要求65所述的語言輸入用戶界面,其中按照順序在候選文本列表內(nèi)對候選輸出文本排序。
67.按照權利要求65所述的語言輸入用戶界面,其中候選文本列表可滾動,并且在滾動過程中,候選輸出文本被動畫顯示。
68.按照權利要求53所述的語言輸入用戶界面,還包括可被用戶調用的第一和第二候選文本列表;第一候選文本列表包含可替換選擇的輸出文本的一個或多個預備的候選輸出文本;和和第一候選文本列表相比,包含完整的一組候選輸出文本的第二候選文本列表。
69.按照權利要求68所述的語言輸入用戶界面,其中按照字結構的復雜性排列第二候選文本列表中的候選輸出文本。
70.按照權利要求68所述的語言輸入用戶界面,其中按照第一量度對第一候選文本列表內(nèi)的候選輸出文本排序,按照不同于第一量度的第二量度排列第二候選文本列表中的候選輸出文本。
71.按照權利要求53所述的語言輸入用戶界面,其中基于行的輸入?yún)^(qū)沿第一方向被定向,并且還包括接近選擇的要編輯的輸出文本布置在基于行的輸入?yún)^(qū)上方,并且沿垂直于第一方向的第二方向定向的輸入文本提示,所述輸入文本提示包含輸入文本,選擇的輸出文本由所述輸入文本轉換而來;和接近選擇的要編輯的輸入文本布置在基于行的輸入?yún)^(qū)下方的候選文本列表,所述候選文本列表包含可替換選擇的輸出文本的一個或多個預備的候選輸出文本。
72.按照權利要求53所述的語言輸入用戶界面,其中輸入文本包含語音文本和非語音文本,輸出文本、語音輸入文本和非語音輸入文本一起顯示在基于行的輸入?yún)^(qū)內(nèi)。
73.一種包含按照權利要求53所述的語言輸入用戶界面的字處理器。
74.一種語言輸入體系結構,包括使用戶能夠輸入輸入文本的用戶界面;把輸入文本轉換成輸出文本的語言轉換器;并且所述用戶界面被配置成與未轉換的輸入文本成行地顯示轉換后的輸出文本。
75.按照權利要求74所述的語言輸入體系結構,其中輸入文本包括語音文本,輸出文本包括基于字的語言文本。
76.按照權利要求74所述的語言輸入體系結構,其中輸入文本包括中文拼音,輸出文本包括中文漢字。
77.按照權利要求74所述的語言輸入體系結構,其中用戶界面在共同的水平行內(nèi)呈現(xiàn)輸出文本和未轉換的輸入文本。
78.按照權利要求74所述的語言輸入體系結構,其中當輸入另外的輸入文本時,語言轉換器繼續(xù)修改輸出文本,當輸出文本被修改時,用戶界面不斷改變輸出文本。
79.按照權利要求74所述的語言輸入體系結構,其中用戶界面使用戶能夠在不從輸入模式轉換到編輯模式的情況下編輯輸出文本。
80.按照權利要求74所述的語言輸入體系結構,其中用戶界面在沿第一方向定向的公用行內(nèi)呈現(xiàn)輸出文本和未轉換的輸入文本,并在選擇的要編輯的輸出文本附近呈現(xiàn)編輯窗口,所述編輯窗口沿垂直于第一方向的第二方向定向。
81.按照權利要求74所述的語言輸入體系結構,其中用戶界面給出包含輸入文本的輸入文本提示,選擇的輸出文本由所述輸入文本轉換而來。
82.按照權利要求74所述的語言輸入體系結構,其中用戶界面給出包含可替換選擇的輸出文本的一個或多個預備的候選輸出文本的候選文本列表。
83.按照權利要求74所述的語言輸入體系結構,其中用戶界面給出第一和第二候選文本列表,第一候選文本列表包含可替換選擇的輸出文本的一個或多個預備的候選輸出文本,第二候選文本列表包含比第一候選列表完整的一組候選輸出文本。
84.按照權利要求74所述的語言輸入體系結構,其中輸入文本包含語音文本和非語音文本,并且還包括語言轉換器被配置成把語音文本轉換成語言文本,同時使非語音文本保持不被轉換;和用戶界面被配置成成行地顯示語言文本、未轉換的語音文本和非語音文本。
85.一種包含按照權利要求74所述的語言輸入體系結構的字處理器。
86.一種語言輸入體系結構,包括接收以語音文本書寫的輸入串,并確定候選串作為輸入串被不正確輸入的打字錯誤概率有多大的打字模型;確定以語言文本書寫的串代表候選串的語言文本概率有多大的語言模型;根據(jù)打字錯誤概率和語言文本概率,有選擇地把輸入的語音文本串轉換成語言文本串的搜索引擎;和在公用行內(nèi)顯示語音文本和語言文本的用戶界面。
87.具有計算機可讀指令的一種或多種計算機可讀媒介,所述計算機可讀指令當在處理器上被執(zhí)行時,指令計算機接收輸入的語音文本串;把輸入的語音文本串轉換成輸出的語言文本串;和在基于行的輸入?yún)^(qū)內(nèi)成行地一起顯示語言文本和未轉換的語音文本。
88.具有計算機可讀指令的一種或多種計算機可讀媒介,所述計算機可讀指令當在處理器上被執(zhí)行時,指令計算機接收語音文本和非語音文本的輸入串;把語音文本轉換成語言文本;在基于行的輸入?yún)^(qū)內(nèi)成行地一起顯示語言文本、非語音文本和未轉換的語音文本。
全文摘要
語言輸入體系結構接收用戶從輸入裝置(例如鍵盤、語音識別)輸入的輸入文本(例如基于字的語言的語音文本)。輸入文本被轉換成輸出文本(例如基于字的語言的書面語言文本)。語言輸入體系結構具有成行地顯示輸出文本和未轉換的輸入文本的用戶界面。當輸入文本被轉換時,在UI中利用轉換后的輸出文本替換所述輸入文本。除了這種成行輸入特征之外,UI還能夠在不要求用戶從輸入模式轉換到編輯模式的情況下,實現(xiàn)原位編輯或糾錯。為了幫助這種原位編輯,UI提供彈出式窗口,所述彈出式窗口包含語音文本以及第一和第二候選文本列表,輸出文本由所述語音文本轉換而來,所述第一和第二候選文本列表分別包含可用于替換當前的輸出文本的較小一組預備候選文本和較大一組預備候選文本。語言輸入用戶界面還允許用戶輸入不同語言的混合文本。
文檔編號G06F17/28GK1387639SQ00815295
公開日2002年12月25日 申請日期2000年11月3日 優(yōu)先權日1999年11月5日
發(fā)明者王建, 張高, 韓建, 陳征, 令顯寧, 李凱夫 申請人:微軟公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1