語音輸入的字詞級糾正的制作方法
【專利說明】語音輸入的字詞級糾正
[0001]分案串請說明
[0002]本申請是于2011年I月5日提交的、于2012年8月9日進入中國國家階段的、申請?zhí)枮?01180008973.4、名稱為“語音輸入的字詞級糾正”的中國發(fā)明專利申請的分案申請。
_3] 相關(guān)串請的交叉引用
[0004]本申請要求對通過引用將內(nèi)容結(jié)合于此、于2010年I月5日提交并且標題為“Word-Level Correct1n of Speech Input” 的第 61/292,440 號美國臨時申請以及于2010 年 10 月 27 日提交并且標題為“Word-Level Correct1n of Speech Input” 的第12/913,407號美國申請的優(yōu)先權(quán)。
技術(shù)領域
[0005]本說明書涉及糾正從向計算設備的語音輸入轉(zhuǎn)錄的文字中的一個或者多個字詞。
【背景技術(shù)】
[0006]語音輸入的轉(zhuǎn)錄是一種越來越流行的向計算設備中輸入信息的方式。對于移動計算設備(比如移動電話和智能電話)而言甚至更是如此,其中可用于容用戶進行用戶輸入的接口不如桌面型計算機中的用戶接口(比如全尺寸鍵盤)那樣易于操縱。例如一些移動計算設備使用最小硬件鍵盤(例如完全QWERTY鍵盤的子集)、虛擬/軟件鍵盤(例如觸屏鍵盤)或者甚至十二個鍵的電話鍵區(qū)(例如ITU-T文字錄入)。通常,這些用戶輸入接口比傳統(tǒng)桌面型用戶接口更小,并且用戶經(jīng)常使用他們的拇指來鍵入或者在鍵入之時看一個鍵打一個字。這可以至少部分說明越來越多地使用向移動計算設備的語音輸入。
【發(fā)明內(nèi)容】
[0007]總體上,本文獻描述糾正從向計算設備的語音輸入轉(zhuǎn)錄的文字中的一個或者多個字詞。在一些實施方式中,計算設備是無線移動設備(比如移動電話或者智能電話)。計算設備例如從用戶接收語音輸入并且向與計算設備分離的轉(zhuǎn)錄系統(tǒng)發(fā)送語音輸入。轉(zhuǎn)錄系統(tǒng)轉(zhuǎn)錄語音輸入并且向計算設備提供對應字詞網(wǎng)格。計算設備允許用戶使用來自字詞網(wǎng)格的替代字詞和/或短語對轉(zhuǎn)錄的文字中的一個或者多個字詞進行糾正。
[0008]在第一方面中,一種用于糾正轉(zhuǎn)錄的文字中的字詞的計算機實施的方法包括從移動計算設備中的麥克風接收語音音頻數(shù)據(jù)。該方法還包括向轉(zhuǎn)錄系統(tǒng)發(fā)送來自移動計算設備的語音音頻數(shù)據(jù)。該方法還包括在移動計算設備接收轉(zhuǎn)錄系統(tǒng)從語音音頻數(shù)據(jù)轉(zhuǎn)錄的字詞網(wǎng)格。該方法還包括在移動計算設備的顯示器屏幕上呈現(xiàn)來自字詞網(wǎng)格的一個或者多個轉(zhuǎn)錄的字詞。該方法還包括在移動計算設備接收呈現(xiàn)的轉(zhuǎn)錄的字詞中的至少一個轉(zhuǎn)錄的字詞的用戶選擇。該方法還包括響應于接收轉(zhuǎn)錄的字詞的用戶選擇,在顯示器屏幕上呈現(xiàn)來自字詞網(wǎng)格的用于所選轉(zhuǎn)錄的字詞的一個或者多個替代字詞。該方法還包括在移動計算設備接收替代字詞中的至少一個替代字詞的用戶選擇。該方法還包括響應于接收替代字詞的用戶選擇,用所選替代字詞取代呈現(xiàn)的轉(zhuǎn)錄的字詞中的所選轉(zhuǎn)錄的字詞。
[0009]實施方式可以包括以下特征中的任何、所有或者零個特征。該方法可以包括:響應于接收轉(zhuǎn)錄的字詞的用戶選擇,在顯示器屏幕上呈現(xiàn)用于所選轉(zhuǎn)錄的字詞的去除命令;在移動計算設備接收去除命令的用戶選擇;并且響應于接收去除命令的用戶選擇,從呈現(xiàn)的轉(zhuǎn)錄的字詞去除所選轉(zhuǎn)錄的字詞。該方法可以包括:在顯示器屏幕上呈現(xiàn)來自字詞網(wǎng)格的用于呈現(xiàn)的轉(zhuǎn)錄的字詞的至少一個替代短語;在移動計算設備接收替代短語的用戶選擇;并且響應于接收替代短語的用戶選擇,用所選替代短語取代呈現(xiàn)的轉(zhuǎn)錄的字詞。該方法可以包括:響應于接收去除命令或者替代字詞的用戶選擇,自動基于所選替代字詞或者去除的轉(zhuǎn)錄的字詞從字詞網(wǎng)格選擇至少一個新的替代短語;并且用新的替代短語取代呈現(xiàn)的替代短語。接收呈現(xiàn)的字詞的用戶選擇和替代字詞的用戶選擇可以包括通過移動計算設備的觸屏接口接收呈現(xiàn)的字詞的用戶選擇和替代字詞的用戶選擇。字詞網(wǎng)格可以包括與轉(zhuǎn)錄的字詞和替代字詞對應的節(jié)點、在節(jié)點之間的邊,邊標識經(jīng)過字詞網(wǎng)格的可能路徑,并且每個路徑可以具有路徑正確的關(guān)聯(lián)概率。該方法可以包括從字詞網(wǎng)格中所選轉(zhuǎn)錄的字詞的開始節(jié)點與結(jié)束節(jié)點之間的一個或者多個替代路徑識別用于所選轉(zhuǎn)錄的字詞的替代字詞。該方法可以包括從字詞網(wǎng)格中呈現(xiàn)的轉(zhuǎn)錄的字詞的開始節(jié)點與結(jié)束節(jié)點之間的至少一個替代路徑識別用于呈現(xiàn)的轉(zhuǎn)錄的字詞的替代短語。
[0010]在第二方面中,一種在計算機可讀介質(zhì)上編碼的計算機程序產(chǎn)品,可操作用于使一個或者多個處理器執(zhí)行用于糾正轉(zhuǎn)錄的文字中的字詞的操作,操作包括從移動計算設備中的麥克風接收語音音頻數(shù)據(jù)。操作還包括向轉(zhuǎn)錄系統(tǒng)發(fā)送來自移動計算設備的語音音頻數(shù)據(jù)。操作還包括在移動計算設備接收轉(zhuǎn)錄系統(tǒng)從語音音頻數(shù)據(jù)轉(zhuǎn)錄的字詞網(wǎng)格。操作還包括在移動計算設備的顯示器屏幕上呈現(xiàn)來自字詞網(wǎng)格的一個或者多個轉(zhuǎn)錄的字詞。操作還包括在移動計算設備接收呈現(xiàn)的轉(zhuǎn)錄的字詞中的至少一個轉(zhuǎn)錄的字詞的用戶選擇。操作還包括響應于接收轉(zhuǎn)錄的字詞的用戶選擇,在顯示器屏幕上呈現(xiàn)來自字詞網(wǎng)格的用于所選轉(zhuǎn)錄的字詞的一個或者多個替代字詞。操作還包括在移動計算設備接收替代字詞中的至少一個替代字詞的用戶選擇。操作還包括響應于接收替代字詞的用戶選擇,用所選替代字詞取代呈現(xiàn)的轉(zhuǎn)錄的字詞中的所選轉(zhuǎn)錄的字詞。
[0011]實施方式可以包括以下特征中的任何、所有或者零個特征。操作可以包括:響應于接收轉(zhuǎn)錄的字詞的用戶選擇,在顯示器屏幕上呈現(xiàn)用于所選轉(zhuǎn)錄的字詞的去除命令;在移動計算設備接收去除命令的用戶選擇;并且響應于接收去除命令的用戶選擇,從呈現(xiàn)的轉(zhuǎn)錄的字詞去除所選轉(zhuǎn)錄的字詞。操作可以包括:在顯示器屏幕上呈現(xiàn)來自字詞網(wǎng)格的用于呈現(xiàn)的轉(zhuǎn)錄的字詞的至少一個替代短語;在移動計算設備接收替代短語的用戶選擇;并且響應于接收替代短語的用戶選擇,用所選替代短語取代呈現(xiàn)的轉(zhuǎn)錄的字詞。操作可以包括:響應于接收去除命令或者替代字詞的用戶選擇,自動基于所選替代字詞或者去除的轉(zhuǎn)錄的字詞從字詞網(wǎng)格選擇至少一個新的替代短語;并且用新的替代短語取代呈現(xiàn)的替代短語。接收呈現(xiàn)的字詞的用戶選擇和替代字詞的用戶選擇可以包括通過移動計算設備的觸屏接口接收呈現(xiàn)的字詞的用戶選擇和替代字詞的用戶選擇。字詞網(wǎng)格可以包括與轉(zhuǎn)錄的字詞和替代字詞對應的節(jié)點、在節(jié)點之間的邊,邊標識經(jīng)過字詞網(wǎng)格的可能路徑,并且每個路徑可以具有路徑正確的關(guān)聯(lián)概率。操作可以包括從字詞網(wǎng)格中所選轉(zhuǎn)錄的字詞的開始節(jié)點與結(jié)束節(jié)點之間的一個或者多個替代路徑識別用于所選轉(zhuǎn)錄的字詞的替代字詞。操作可以包括從字詞網(wǎng)格中呈現(xiàn)的轉(zhuǎn)錄的字詞的開始節(jié)點與結(jié)束節(jié)點之間的至少一個替代路徑識別用于呈現(xiàn)的轉(zhuǎn)錄的字詞的替代短語。
[0012]在第三方面中,一種用于糾正轉(zhuǎn)錄的文字中的字詞的計算機實施的系統(tǒng)包括??轉(zhuǎn)錄系統(tǒng),可操作用于接收語音音頻數(shù)據(jù)并且作為響應將語音音頻數(shù)據(jù)轉(zhuǎn)錄成字詞網(wǎng)格。該系統(tǒng)還包括移動計算設備,移動計算設備包括:麥克風,可操作用于接收語音音頻并且生成語音音頻數(shù)據(jù),網(wǎng)絡接口,可操作用于向轉(zhuǎn)錄系統(tǒng)發(fā)送語音音頻數(shù)據(jù)并且作為響應從轉(zhuǎn)錄系統(tǒng)接收字詞網(wǎng)格,顯示器屏幕,可操作用于呈現(xiàn)來自字詞網(wǎng)格的一個或者多個轉(zhuǎn)錄的字詞,用戶接口,可操作用于接收轉(zhuǎn)錄的字詞中的至少一個轉(zhuǎn)錄的字詞的用戶選擇,一個或者多個處理器和存儲指令的存儲器,指令在由處理器執(zhí)行時執(zhí)行以下操作:在顯示器屏幕上呈現(xiàn)來自字詞網(wǎng)格的用于所選轉(zhuǎn)錄的字詞的一個或者多個替代字詞;接收替代字詞中的至少一個替代字詞的用戶選擇;并且用所選替代字詞取代呈現(xiàn)的轉(zhuǎn)錄的字詞中的所選轉(zhuǎn)錄的字詞。
[0013]這里描述的系統(tǒng)和技術(shù)可以提供以下優(yōu)點中的一個或者多個優(yōu)點。首先,系統(tǒng)可以用最少用戶輸入(比如一個、兩個或者三個用戶輸入)對轉(zhuǎn)錄的文字中的一個或者多個字詞進行糾正。第二,系統(tǒng)可以提供在遠程轉(zhuǎn)錄系統(tǒng)的對語音輸入向文字的轉(zhuǎn)錄而在糾正轉(zhuǎn)錄的文字中的一個或者多個字詞期間無或者最少的與遠程轉(zhuǎn)錄系統(tǒng)的附加通信。第三,系統(tǒng)可以在具有有限輸入接口(比如小型觸屏)的計算設備中提供對轉(zhuǎn)錄的文字的糾正的高效用戶選擇。
[0014]在附圖和下文描述中闡述一個或者多個實施方式的細節(jié)。根據(jù)說明書和附圖并且根據(jù)權(quán)利要求書將清楚其它特征和優(yōu)點。
【附圖說明】
[0015]圖1是示出了用于糾正轉(zhuǎn)錄的文字中的一個或者多個字詞的系統(tǒng)的例子的示意圖。
[0016]圖2是示出了用于糾正轉(zhuǎn)錄的文字中的一個或者多個字詞的移動計算設備的例子的框圖。
[0017]圖3A-B是用于糾正轉(zhuǎn)錄的文字中的一個或者多個字詞的字詞網(wǎng)格的例子。
[0018]圖4A-D是用于糾正轉(zhuǎn)錄的文字中的一個或者多個字詞的圖形用戶接口的例子。
[0019]圖5是示出了用于糾正轉(zhuǎn)錄的文字中的一個或者多個字詞的過程的例子的流程圖。
[0020]圖6示出了可以與在本文中描述的計算機實施的方法和系統(tǒng)結(jié)合使用的計算設備和移動計算設備的例子。
[0021]在各圖中的相似標號指示相似要素。
【具體實施方式】
[0022]圖1是示出了用于糾正轉(zhuǎn)錄的文字中的一個或者多個字詞