實(shí)例中,可以替代以其他文件類型或者格式。例如,一個(gè)HTML文件可以被替代為XML、JS0N、一般文本或者其他類型的文件。而且,在提及表或者哈希表的情況下,可以使用其他數(shù)據(jù)結(jié)構(gòu)(諸如表單、關(guān)系數(shù)據(jù)庫(kù)或者結(jié)構(gòu)化文件)。
[0073]由此,已經(jīng)描述了特定的實(shí)施例。其他實(shí)施例也在所附權(quán)利要求的范圍內(nèi)。例如,在權(quán)利要求中記載的動(dòng)作可以按照不同順序執(zhí)行并且仍然實(shí)現(xiàn)期望的結(jié)果。
【主權(quán)項(xiàng)】
1.一種系統(tǒng),包括: 一個(gè)或多個(gè)計(jì)算機(jī);以及 耦合至所述一個(gè)或多個(gè)計(jì)算機(jī)的計(jì)算機(jī)可讀介質(zhì),具有存儲(chǔ)于其上的指令,當(dāng)所述執(zhí)行由所述一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行時(shí)使所述一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行操作,包括: 向狀態(tài)數(shù)據(jù)和傳感器數(shù)據(jù)應(yīng)用規(guī)則或者概率模型,所述狀態(tài)數(shù)據(jù)指示移動(dòng)設(shè)備的狀態(tài),所述傳感器數(shù)據(jù)由所述移動(dòng)設(shè)備的一個(gè)或多個(gè)傳感器感測(cè); 基于向所述狀態(tài)數(shù)據(jù)和所述傳感器數(shù)據(jù)應(yīng)用所述規(guī)則或者所述概率模型,推斷所述移動(dòng)設(shè)備的用戶可能發(fā)起話音輸入; 響應(yīng)于推斷所述用戶可能發(fā)起話音輸入而啟動(dòng)背景錄音;以及傳送(i)編碼所述背景錄音和所說(shuō)的話的音頻信號(hào),以及(ii)指示所述音頻信號(hào)中編碼的所述背景錄音的持續(xù)時(shí)間的持續(xù)時(shí)間數(shù)據(jù)。2.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述狀態(tài)數(shù)據(jù)包括:指示所述移動(dòng)設(shè)備的顯示器是打開(kāi)還是關(guān)閉的數(shù)據(jù)、指示所述移動(dòng)設(shè)備正在鎖定模式還是未鎖定模式運(yùn)行的數(shù)據(jù)、指示正在所述移動(dòng)設(shè)備上執(zhí)行的一個(gè)或多個(gè)應(yīng)用的數(shù)據(jù)、指示話音搜索應(yīng)用是否正在所述移動(dòng)設(shè)備上執(zhí)行的數(shù)據(jù)、指示所述用戶所選擇的字段是否被允許話音文本輸入的數(shù)據(jù)或者指示所述用戶是否正在操作所述移動(dòng)設(shè)備的輸入機(jī)制的數(shù)據(jù)。3.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述狀態(tài)數(shù)據(jù)包括:指示所述移動(dòng)設(shè)備的當(dāng)前狀態(tài)或者近期狀態(tài)的數(shù)據(jù)。4.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述傳感器數(shù)據(jù)包括:由所述移動(dòng)設(shè)備的小鍵盤(pán)傳感器感測(cè)到的數(shù)據(jù)、由所述移動(dòng)設(shè)備的位置確定傳感器感測(cè)到的數(shù)據(jù)、由所述移動(dòng)設(shè)備的加速計(jì)感測(cè)到的數(shù)據(jù)、由所述移動(dòng)設(shè)備的磁力計(jì)感測(cè)到的數(shù)據(jù)、由所述移動(dòng)設(shè)備的光傳感器感測(cè)到的數(shù)據(jù)、由所述移動(dòng)設(shè)備的近距離傳感器感測(cè)到的數(shù)據(jù)、由所述移動(dòng)設(shè)備的電容傳感器感測(cè)到的數(shù)據(jù)或者由所述移動(dòng)設(shè)備的觸摸傳感器感測(cè)到的數(shù)據(jù)。5.根據(jù)權(quán)利要求1所述的系統(tǒng),其中: 向所述傳感器數(shù)據(jù)應(yīng)用所述規(guī)則或者所述概率模型進(jìn)一步包括:向由所述移動(dòng)設(shè)備的第一傳感器感測(cè)到的數(shù)據(jù)應(yīng)用所述規(guī)則或者所述概率模型; 啟動(dòng)所述背景錄音進(jìn)一步包括:響應(yīng)于推斷所述用戶可能發(fā)起話音輸入而激活所述移動(dòng)設(shè)備的第二傳感器。6.根據(jù)權(quán)利要求5所述的系統(tǒng),其中所述操作進(jìn)一步包括: 向由所述移動(dòng)設(shè)備的所述第一傳感器感測(cè)到的所述數(shù)據(jù)以及由所述移動(dòng)設(shè)備的所述第二傳感器感測(cè)到的附加數(shù)據(jù)應(yīng)用附加規(guī)則或者附加概率模型; 基于向所述數(shù)據(jù)和所述附加數(shù)據(jù)應(yīng)用所述附加規(guī)則或者所述附加概率模型,推斷所述用戶仍然可能發(fā)起話音輸入;以及 響應(yīng)于推斷所述用戶仍然可能發(fā)起話音輸入而啟動(dòng)所述背景錄音。7.根據(jù)權(quán)利要求1所述的系統(tǒng),其中: 向所述狀態(tài)數(shù)據(jù)和所述傳感器數(shù)據(jù)應(yīng)用所述規(guī)則或者所述概率模型進(jìn)一步包括:確定與所述狀態(tài)數(shù)據(jù)和所述傳感器數(shù)據(jù)相關(guān)聯(lián)的得分;以及 推斷所述用戶可能發(fā)起話音輸入進(jìn)一步包括:確定與所述狀態(tài)數(shù)據(jù)和所述傳感器數(shù)據(jù)相關(guān)聯(lián)的所述得分滿足預(yù)定閾值。8.根據(jù)權(quán)利要求1所述的系統(tǒng),其中向所述狀態(tài)數(shù)據(jù)和所述傳感器數(shù)據(jù)應(yīng)用所述規(guī)則或者所述概率模型進(jìn)一步包括:向所述狀態(tài)數(shù)據(jù)和所述傳感器數(shù)據(jù)應(yīng)用規(guī)則。9.根據(jù)權(quán)利要求1所述的系統(tǒng),其中向所述狀態(tài)數(shù)據(jù)和所述傳感器數(shù)據(jù)應(yīng)用所述規(guī)則或者所述概率模型進(jìn)一步包括:向所述狀態(tài)數(shù)據(jù)和所述傳感器數(shù)據(jù)應(yīng)用概率模型。10.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述操作進(jìn)一步包括: 基于向所述狀態(tài)數(shù)據(jù)和所述傳感器數(shù)據(jù)應(yīng)用所述規(guī)則或者所述概率模型,推斷不清楚用戶是否可能發(fā)起話音輸入; 響應(yīng)于推斷不清楚所述用戶是否可能發(fā)起話音輸入,指示所述移動(dòng)設(shè)備收集附加狀態(tài)數(shù)據(jù)或者附加傳感器數(shù)據(jù);以及 向所述狀態(tài)數(shù)據(jù)、所述傳感器數(shù)據(jù)以及所述附加狀態(tài)數(shù)據(jù)或者所述附加傳感器數(shù)據(jù)應(yīng)用所述規(guī)則或者所述概率模型, 其中推斷所述用戶可能發(fā)起話音輸入進(jìn)一步基于向所述狀態(tài)數(shù)據(jù)、所述傳感器數(shù)據(jù)以及所述附加狀態(tài)數(shù)據(jù)或所述附加傳感器數(shù)據(jù)應(yīng)用所述規(guī)則或者所述概率模型。11.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述操作進(jìn)一步包括:使用歷史狀態(tài)數(shù)據(jù)或者歷史傳感器數(shù)據(jù)生成所述規(guī)則或者訓(xùn)練所述概率模型。12.根據(jù)權(quán)利要求1所述的系統(tǒng),其中推斷所述用戶可能發(fā)起話音輸入進(jìn)一步包括:由所述移動(dòng)設(shè)備推斷所述用戶可能發(fā)起話音輸入。13.根據(jù)權(quán)利要求1所述的系統(tǒng),其中推斷所述用戶可能發(fā)起話音輸入進(jìn)一步包括:由服務(wù)器推斷所述用戶可能發(fā)起話音輸入。14.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述操作進(jìn)一步包括: 在所述移動(dòng)設(shè)備與服務(wù)器之間傳送所述音頻信號(hào)和所述持續(xù)時(shí)間數(shù)據(jù),其中所述持續(xù)時(shí)間數(shù)據(jù)指示所述音頻信號(hào)中編碼的在所述用戶開(kāi)始說(shuō)話之前錄制的所述背景錄音。15.一種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括: 由移動(dòng)設(shè)備向狀態(tài)數(shù)據(jù)和傳感器數(shù)據(jù)應(yīng)用規(guī)則或者概率模型,所述狀態(tài)數(shù)據(jù)指示所述移動(dòng)設(shè)備的狀態(tài),所述傳感器數(shù)據(jù)由所述移動(dòng)設(shè)備的一個(gè)或多個(gè)傳感器感測(cè); 基于向所述狀態(tài)數(shù)據(jù)和所述傳感器數(shù)據(jù)應(yīng)用所述規(guī)則或者所述概率模型,推斷所述移動(dòng)設(shè)備的用戶可能發(fā)起話音輸入; 由所述移動(dòng)設(shè)備響應(yīng)于推斷所述用戶可能發(fā)起話音輸入而啟動(dòng)背景錄音;以及由所述移動(dòng)設(shè)備傳送(i)編碼所述背景錄音和所說(shuō)的話的音頻信號(hào),以及(ii)指示所述音頻信號(hào)中編碼的所述背景錄音的持續(xù)時(shí)間的持續(xù)時(shí)間數(shù)據(jù)。16.根據(jù)權(quán)利要求15所述的方法,其中: 向所述傳感器數(shù)據(jù)應(yīng)用所述規(guī)則或者所述概率模型進(jìn)一步包括:向由所述移動(dòng)設(shè)備的第一傳感器感測(cè)到的數(shù)據(jù)應(yīng)用所述規(guī)則或者所述概率模型,以及 啟動(dòng)所述背景錄音進(jìn)一步包括:響應(yīng)于推斷所述用戶可能發(fā)起話音輸入而激活所述移動(dòng)設(shè)備的第二傳感器。17.根據(jù)權(quán)利要求16所述的方法,進(jìn)一步包括: 向由所述移動(dòng)設(shè)備的所述第一傳感器感測(cè)到的所述數(shù)據(jù)以及由所述移動(dòng)設(shè)備的所述第二傳感器感測(cè)到的附加數(shù)據(jù)應(yīng)用附加規(guī)則或者附加概率模型; 基于向所述數(shù)據(jù)和所述附加數(shù)據(jù)應(yīng)用所述附加規(guī)則或者所述附加概率模型,推斷所述用戶仍然可能發(fā)起話音輸入;以及 響應(yīng)于推斷所述用戶仍然可能發(fā)起話音輸入而啟動(dòng)所述背景錄音。18.根據(jù)權(quán)利要求15所述的方法,其中: 向所述狀態(tài)數(shù)據(jù)和所述傳感器數(shù)據(jù)應(yīng)用所述規(guī)則或者所述概率模型進(jìn)一步包括:確定與所述狀態(tài)數(shù)據(jù)和所述傳感器數(shù)據(jù)相關(guān)聯(lián)的得分;以及 推斷所述用戶可能發(fā)起話音輸入進(jìn)一步包括:確定與所述狀態(tài)數(shù)據(jù)和所述傳感器數(shù)據(jù)相關(guān)聯(lián)的所述得分滿足預(yù)定閾值。19.一種編碼有計(jì)算機(jī)程序的計(jì)算機(jī)存儲(chǔ)介質(zhì),所述程序包括指令,當(dāng)所述指令由一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行時(shí)使所述一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行操作,所述操作包括: 向狀態(tài)數(shù)據(jù)和傳感器數(shù)據(jù)應(yīng)用規(guī)則或者概率模型,所述狀態(tài)數(shù)據(jù)指示所述移動(dòng)設(shè)備的狀態(tài),所述傳感器數(shù)據(jù)由所述移動(dòng)設(shè)備的一個(gè)或多個(gè)傳感器感測(cè); 基于向所述狀態(tài)數(shù)據(jù)和所述傳感器數(shù)據(jù)應(yīng)用所述規(guī)則或者所述概率模型,推斷所述移動(dòng)設(shè)備的用戶可能發(fā)起話音輸入; 響應(yīng)于推斷所述用戶可能發(fā)起話音輸入而啟動(dòng)背景錄音;以及傳送(i)編碼所述背景錄音和所說(shuō)的話的音頻信號(hào),以及(ii)指示所述音頻信號(hào)中編碼的所述背景錄音的持續(xù)時(shí)間的持續(xù)時(shí)間數(shù)據(jù)。
【專利摘要】用于提供對(duì)話音輸入的預(yù)測(cè)性音頻預(yù)錄制的方法、系統(tǒng)和設(shè)備,包括編碼在計(jì)算機(jī)存儲(chǔ)介質(zhì)上的計(jì)算機(jī)程序。在一方面,一種方法包括:建立指示移動(dòng)設(shè)備狀態(tài)的狀態(tài)數(shù)據(jù)以及由移動(dòng)設(shè)備的一個(gè)或多個(gè)傳感器感測(cè)到的傳感器數(shù)據(jù)以作為輸入數(shù)據(jù);向輸入數(shù)據(jù)應(yīng)用規(guī)則或者概率模型;基于向輸入數(shù)據(jù)應(yīng)用規(guī)則或者概率模型而推斷移動(dòng)設(shè)備的用戶可能發(fā)起話音輸入;以及響應(yīng)于推斷用戶可能發(fā)起話音輸入而調(diào)用移動(dòng)設(shè)備的一個(gè)或多個(gè)功能。
【IPC分類】G10L15/22, G06F1/16, G06F3/16
【公開(kāi)號(hào)】CN105573436
【申請(qǐng)?zhí)枴緾N201511032215
【發(fā)明人】T·克里斯特詹森, M·I·勞埃德
【申請(qǐng)人】谷歌公司
【公開(kāi)日】2016年5月11日
【申請(qǐng)日】2011年3月18日
【公告號(hào)】CN102918493A, CN102918493B, EP2553563A1, US8195319, US8428759, US8504185, US20110238191, US20120022675, US20120296655, WO2011119431A1