本說明書通常涉及語音識(shí)別。
背景技術(shù):
自然語言處理系統(tǒng)通常使用端點(diǎn)器來確定用戶何時(shí)開始以及結(jié)束講話。一些傳統(tǒng)的端點(diǎn)器在確定話語何時(shí)開始或結(jié)束時(shí)對(duì)詞之間的停頓的持續(xù)時(shí)間進(jìn)行評(píng)估。例如,如果用戶說“whatis<長(zhǎng)停頓>fordinner”,則傳統(tǒng)的端點(diǎn)器可以在長(zhǎng)停頓處對(duì)話音輸入進(jìn)行分段,并且可以指示自然語言處理系統(tǒng)嘗試處理不完整的短語“whatis”,而不是處理完整的短語“whatisfordinner”。如果端點(diǎn)器為話音輸入指定了錯(cuò)誤的開始點(diǎn)或結(jié)束點(diǎn),則使用自然語言處理系統(tǒng)處理話音輸入的結(jié)果可能是不準(zhǔn)確的或者不符合需要的。
技術(shù)實(shí)現(xiàn)要素:
在本說明書中所描述的主題的創(chuàng)新方面是使用所提供的場(chǎng)境數(shù)據(jù)來改善語音端點(diǎn)確定,這實(shí)現(xiàn)了降低的語音識(shí)別時(shí)延以及改善的語音識(shí)別的準(zhǔn)確性。客戶端所提供的場(chǎng)境數(shù)據(jù)可以用于確定表示話語的特定音頻數(shù)據(jù)的預(yù)期語音識(shí)別結(jié)果。中間語音識(shí)別結(jié)果可以由語音識(shí)別器返回。當(dāng)返回了中間語音識(shí)別結(jié)果時(shí),可以將該中間語音識(shí)別結(jié)果與指示預(yù)期語音識(shí)別結(jié)果的場(chǎng)境數(shù)據(jù)進(jìn)行比較。
如果確定中間語音識(shí)別結(jié)果與場(chǎng)境數(shù)據(jù)之間匹配或有足夠的相似性,則語音端點(diǎn)器可以對(duì)與該音頻數(shù)據(jù)相對(duì)應(yīng)的話語進(jìn)行端點(diǎn)確定并返回最終語音識(shí)別結(jié)果。如果確定中間語音識(shí)別結(jié)果與場(chǎng)境數(shù)據(jù)之間不匹配或者確定中間語音識(shí)別結(jié)果與場(chǎng)境數(shù)據(jù)之間部分匹配,則語音端點(diǎn)器可以動(dòng)態(tài)地確定語音結(jié)束(eos)超時(shí)以例如允許輸入附加音頻數(shù)據(jù)。
在本說明書中所描述的主題的一個(gè)創(chuàng)新方面體現(xiàn)在可以包括下述動(dòng)作的方法中,所述動(dòng)作包括:接收包括話語的音頻數(shù)據(jù);獲取指示一個(gè)或多個(gè)預(yù)期語音識(shí)別結(jié)果的場(chǎng)境數(shù)據(jù);以及基于場(chǎng)境數(shù)據(jù)確定音頻數(shù)據(jù)的預(yù)期語音識(shí)別結(jié)果。該方法可以包括動(dòng)作:接收由語音識(shí)別引擎所生成的中間語音識(shí)別結(jié)果;基于場(chǎng)境數(shù)據(jù)對(duì)中間語音識(shí)別結(jié)果與音頻數(shù)據(jù)的預(yù)期語音識(shí)別結(jié)果進(jìn)行比較;以及基于場(chǎng)境數(shù)據(jù)來確定中間語音識(shí)別結(jié)果是否與音頻數(shù)據(jù)的預(yù)期語音識(shí)別結(jié)果相對(duì)應(yīng)。該方法可以包括動(dòng)作:響應(yīng)于基于場(chǎng)境數(shù)據(jù)確定中間語音識(shí)別結(jié)果與預(yù)期語音識(shí)別結(jié)果匹配或足夠相似而設(shè)置語音結(jié)束條件并且提供最終語音識(shí)別結(jié)果,該最終語音識(shí)別結(jié)果包括由場(chǎng)境數(shù)據(jù)所指示的一個(gè)或多個(gè)預(yù)期語音識(shí)別結(jié)果。
通常,在本說明書中所描述的主題的另一方面可以體現(xiàn)在包括下述動(dòng)作的方法中,所述動(dòng)作包括:響應(yīng)于基于場(chǎng)境數(shù)據(jù)確定中間語音識(shí)別結(jié)果包括與音頻數(shù)據(jù)的預(yù)期語音識(shí)別結(jié)果的部分匹配或不包括與音頻數(shù)據(jù)的預(yù)期語音識(shí)別結(jié)果的匹配而確定用于接收附加音頻數(shù)據(jù)的語音結(jié)束條件的時(shí)間段。在本說明書中所描述的主題的另一方面可以體現(xiàn)在包括下述動(dòng)作的方法中,所述動(dòng)作包括:響應(yīng)于所述時(shí)間段滿足閾值時(shí)間而設(shè)置語音結(jié)束條件。
在本說明書中所描述的主題的另一方面可以體現(xiàn)在包括下述動(dòng)作的方法中,所述動(dòng)作包括:響應(yīng)于基于場(chǎng)境數(shù)據(jù)確定中間語音識(shí)別結(jié)果包括與音頻數(shù)據(jù)的預(yù)期語音識(shí)別結(jié)果的部分匹配或不包括與音頻數(shù)據(jù)的預(yù)期語音識(shí)別結(jié)果的匹配而確定用于接收附加音頻數(shù)據(jù)的語音結(jié)束條件的時(shí)間段,其中響應(yīng)于基于場(chǎng)境數(shù)據(jù)確定中間語音識(shí)別結(jié)果包括與音頻數(shù)據(jù)的預(yù)期語音識(shí)別結(jié)果的部分匹配而將語音結(jié)束條件的時(shí)間段確定為第一時(shí)間量,并且響應(yīng)于基于場(chǎng)境數(shù)據(jù)確定中間語音識(shí)別結(jié)果不包括與音頻數(shù)據(jù)的預(yù)期語音識(shí)別結(jié)果的匹配而將該時(shí)間段確定為第二時(shí)間量,所述第一時(shí)間量與所述第二時(shí)間量不同。
這些和其它實(shí)施例可以各自可選地包括以下特征中的一個(gè)或多個(gè)。例如,獲取場(chǎng)境數(shù)據(jù)可以包括在接收包括話語的音頻數(shù)據(jù)之前獲取場(chǎng)境數(shù)據(jù)并將所述場(chǎng)境數(shù)據(jù)存儲(chǔ)在存儲(chǔ)器中。此外,獲取場(chǎng)境數(shù)據(jù)可以包括與接收包括話語的音頻數(shù)據(jù)同時(shí)地獲取場(chǎng)境數(shù)據(jù)。此外,場(chǎng)境數(shù)據(jù)可以是從客戶端設(shè)備獲取的并且與存儲(chǔ)在客戶端設(shè)備中或顯示在客戶端設(shè)備上的數(shù)據(jù)相對(duì)應(yīng)。另外,語音結(jié)束條件可以包括關(guān)閉話語被發(fā)出到的音頻輸入設(shè)備。
這些方面的其它實(shí)施例包括被配置為執(zhí)行編碼在計(jì)算機(jī)存儲(chǔ)設(shè)備上的方法的動(dòng)作的對(duì)應(yīng)系統(tǒng)、裝置、以及計(jì)算機(jī)程序。例如,一種系統(tǒng)包括一個(gè)或多個(gè)計(jì)算機(jī)以及用于存儲(chǔ)指令的一個(gè)或多個(gè)存儲(chǔ)設(shè)備,所述指令在被一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行時(shí)可操作為使得一個(gè)或多個(gè)計(jì)算機(jī)執(zhí)行包括所述方法的動(dòng)作的操作。本文所描述的方法、系統(tǒng)、裝置、以及計(jì)算機(jī)程序可以導(dǎo)致更高的語音識(shí)別準(zhǔn)確性,如上所述。換句話說,與先前系統(tǒng)相比,實(shí)現(xiàn)所述方法的系統(tǒng)或裝置可以產(chǎn)生具有較少語音識(shí)別錯(cuò)誤的更可靠的語音識(shí)別結(jié)果。語音識(shí)別結(jié)果的高可靠性可具有二次效應(yīng)(secondaryeffect)。例如,如果語音識(shí)別結(jié)果用于識(shí)別話語是否與口令或者特定系統(tǒng)的任何其它類型的訪問短語相對(duì)應(yīng),則語音識(shí)別的高可靠性可能意味著實(shí)現(xiàn)該方法的系統(tǒng)或裝置比先前系統(tǒng)更安全。實(shí)現(xiàn)該方法的系統(tǒng)或裝置更可能正確地識(shí)別相對(duì)于口令而言的話語并且從而可靠地容許其話語與口令相匹配的用戶訪問系統(tǒng),同時(shí)正確地不容許其話語與口令不匹配的用戶。將理解的是,除了口令識(shí)別之外實(shí)現(xiàn)該方法的系統(tǒng)和裝置還可以增加場(chǎng)境中的安全性。語音識(shí)別的高可靠性以及從而的較少語音識(shí)別錯(cuò)誤的另一影響是需要更少的糾錯(cuò)實(shí)例。糾錯(cuò)可能需要附加的時(shí)間以及附加的計(jì)算資源。通過減少對(duì)糾錯(cuò)的需要,系統(tǒng)可以在整體運(yùn)行速度方面得到改善,因?yàn)榧m錯(cuò)所花費(fèi)的時(shí)間較短。此外,通過較少糾錯(cuò)所節(jié)省的計(jì)算資源可被指派給系統(tǒng)中的其它任務(wù),這進(jìn)一步提高了系統(tǒng)的運(yùn)行速度。語音識(shí)別的高可靠性的另一效果可以是改善機(jī)器控制。例如,如果使用語音輸入來控制諸如車輛這樣的機(jī)器(或其它系統(tǒng)或裝置),則語音識(shí)別的高可靠性可能導(dǎo)致改進(jìn)的機(jī)器操作。在車輛的場(chǎng)境中,這樣的改進(jìn)操作的一個(gè)效果可以是提高安全性和/或提高效率。具體地,包括實(shí)現(xiàn)本文所述的方法的計(jì)算裝置的車輛更可能正確地識(shí)別用于控制車輛的講話并且從而更可能按照車輛使用者的指示。
本發(fā)明的一個(gè)或多個(gè)實(shí)施例的細(xì)節(jié)在附圖和下面的描述中闡述。從描述、附圖、以及權(quán)利要求可顯而易見地得知本發(fā)明的其它特征和優(yōu)點(diǎn)。
附圖說明
圖1是根據(jù)本發(fā)明的實(shí)施例的示例系統(tǒng)的示意圖。
圖2是用于對(duì)根據(jù)本發(fā)明的實(shí)施例的在語音識(shí)別和端點(diǎn)確定中所使用的示例話語以及示例性信號(hào)進(jìn)行說明的示意圖。
圖3是用于對(duì)根據(jù)本發(fā)明的實(shí)施例的用于端點(diǎn)確定的示例過程進(jìn)行圖示的流程圖。
各個(gè)附圖中的相同附圖標(biāo)記和標(biāo)號(hào)指示相同元素。
具體實(shí)施方式
圖1是根據(jù)本發(fā)明的實(shí)施例的示例系統(tǒng)的示意圖。系統(tǒng)100包括語音端點(diǎn)器110、存儲(chǔ)介質(zhì)120、以及語音識(shí)別器130。該圖示出了可能或可能不以特定順序圖示的各種輸入和輸出。
通常,在語音識(shí)別系統(tǒng)中,語音端點(diǎn)確定是通過確定話語的開始和結(jié)束來確定傳入音頻的哪個(gè)部分包含語音的過程。將傳入音頻中與語音相對(duì)應(yīng)的部分發(fā)送到語音識(shí)別器以獲取語音識(shí)別結(jié)果或音頻的轉(zhuǎn)錄(transcript)。
不準(zhǔn)確的語音端點(diǎn)確定可能會(huì)導(dǎo)致識(shí)別錯(cuò)誤的顯著增加并對(duì)用戶體驗(yàn)產(chǎn)生負(fù)面影響。不準(zhǔn)確的語音端點(diǎn)確定的影響在嘈雜情況下更有害,其中端點(diǎn)確定的問題變得更加困難。用戶感知到的語音識(shí)別的時(shí)延是從用戶停止講話一直到接收到語音識(shí)別結(jié)果或轉(zhuǎn)錄的時(shí)間。不準(zhǔn)確的語音端點(diǎn)確定可能導(dǎo)致用戶感知到的語音識(shí)別的時(shí)延的增加。因而,本公開的優(yōu)點(diǎn)包括改善語音識(shí)別時(shí)延并且改善語音識(shí)別準(zhǔn)確度。
為了改善語音端點(diǎn)確定,本文描述了利用由客戶端設(shè)備在語音識(shí)別請(qǐng)求之前、之后、或者之時(shí)提供的場(chǎng)境的各種方式,從而改善語音識(shí)別準(zhǔn)確度并降低語音識(shí)別時(shí)延。
在語音識(shí)別期間,隨著識(shí)別系統(tǒng)接收到語音音頻數(shù)據(jù),一旦中間語音識(shí)別結(jié)果可用就可以將所述中間語音識(shí)別結(jié)果發(fā)回到語音端點(diǎn)確定模塊和客戶端。在語音端點(diǎn)確定中,用戶感知到的時(shí)延與語音結(jié)束(eos)超時(shí)高度相關(guān),所述語音結(jié)束(eos)超時(shí)表示在看起來用戶已經(jīng)停止說話之后系統(tǒng)將等待用戶繼續(xù)說話的時(shí)間。系統(tǒng)等待是因?yàn)閷?duì)于用戶是已經(jīng)完成說話還是只是短暫的停頓存在不確定性。如果用戶不繼續(xù)說話,即在預(yù)定eos超時(shí)之后未檢測(cè)到進(jìn)一步的語音,則可以返回最終識(shí)別結(jié)果并且可以終止當(dāng)前識(shí)別會(huì)話(例如,可以關(guān)掉或關(guān)閉麥克風(fēng))。如果用戶在eos超時(shí)過期之前繼續(xù)說話,則系統(tǒng)可能會(huì)繼續(xù)消耗音頻并且對(duì)該音頻執(zhí)行語音識(shí)別。因而,對(duì)eos超時(shí)的選擇可顯著地影響語音識(shí)別結(jié)果的準(zhǔn)確性和時(shí)延兩者。
為了動(dòng)態(tài)地調(diào)節(jié)eos超時(shí),可以使用如本文所述的客戶端提供的場(chǎng)境,這導(dǎo)致語音識(shí)別時(shí)延降低并且語音識(shí)別結(jié)果的準(zhǔn)確性得到改善。
參考圖1,可以從客戶端設(shè)備接收與話語相對(duì)應(yīng)的音頻數(shù)據(jù)并將其輸入到語音端點(diǎn)器110內(nèi)。同時(shí),即在接收到音頻數(shù)據(jù)之前、期間、和/或之后,可以從客戶端設(shè)備接收?qǐng)鼍硵?shù)據(jù)并將其輸入到語音端點(diǎn)器110內(nèi)。在替選實(shí)施例中,可以在接收音頻數(shù)據(jù)之前接收?qǐng)鼍硵?shù)據(jù),并且場(chǎng)境數(shù)據(jù)可以與預(yù)定客戶端場(chǎng)境id相關(guān)聯(lián)??梢詫⑺邮盏降膱?chǎng)境數(shù)據(jù)和相關(guān)客戶端場(chǎng)境id存儲(chǔ)在存儲(chǔ)介質(zhì)120中以作為所存儲(chǔ)的客戶端場(chǎng)境。因而,可以在接收音頻數(shù)據(jù)之前將場(chǎng)境數(shù)據(jù)和場(chǎng)境id彼此相關(guān)聯(lián)地存儲(chǔ),并且可以與接收音頻數(shù)據(jù)同時(shí)地接收?qǐng)鼍砳d??梢詮拇鎯?chǔ)介質(zhì)120檢索與所接收到的場(chǎng)境id相關(guān)聯(lián)的場(chǎng)境數(shù)據(jù)。
可以將所接收到的音頻數(shù)據(jù)輸入到語音識(shí)別器130中。語音識(shí)別器130可以對(duì)音頻數(shù)據(jù)進(jìn)行處理,并且在處理時(shí)返回音頻數(shù)據(jù)的中間語音識(shí)別結(jié)果。語音端點(diǎn)確定模塊可以基于與接收音頻數(shù)據(jù)所同時(shí)接收到的場(chǎng)境id對(duì)從語音識(shí)別器130所返回的音頻數(shù)據(jù)的中間語音識(shí)別結(jié)果與下述場(chǎng)境數(shù)據(jù)進(jìn)行比較,所述場(chǎng)境數(shù)據(jù)是與接收音頻數(shù)據(jù)同時(shí)接收到的或者是從存儲(chǔ)介質(zhì)120檢索到的。隨著音頻數(shù)據(jù)被輸入到語音識(shí)別器130,它繼續(xù)對(duì)音頻數(shù)據(jù)進(jìn)行處理并返回音頻數(shù)據(jù)的識(shí)別結(jié)果。
如果確定中間語音識(shí)別結(jié)果與場(chǎng)境數(shù)據(jù)之間匹配或足夠相似,則語音端點(diǎn)器110可以對(duì)與音頻數(shù)據(jù)相對(duì)應(yīng)的話語進(jìn)行端點(diǎn)確定并且返回最終語音識(shí)別結(jié)果。返回的語音識(shí)別結(jié)果可以被傳送到客戶端設(shè)備。最終語音識(shí)別結(jié)果可以包括場(chǎng)境數(shù)據(jù)。例如,場(chǎng)境數(shù)據(jù)可以包括一個(gè)或多個(gè)姓名并且最終識(shí)別結(jié)果可以包括包含在場(chǎng)境數(shù)據(jù)之中的一個(gè)或多個(gè)姓名。
如果確定中間語音識(shí)別結(jié)果與場(chǎng)境數(shù)據(jù)之間不匹配或者確定中間語音識(shí)別結(jié)果與場(chǎng)境數(shù)據(jù)之間部分匹配,則語音端點(diǎn)器110可以動(dòng)態(tài)地調(diào)節(jié)eos超時(shí)。例如,可以使eos超時(shí)延長(zhǎng)與期望語音識(shí)別結(jié)果相關(guān)聯(lián)的預(yù)定時(shí)間量。響應(yīng)于確定中間語音識(shí)別結(jié)果與場(chǎng)境數(shù)據(jù)之間部分匹配,可以使eos超時(shí)延長(zhǎng)預(yù)定時(shí)間量。此外,響應(yīng)于確定中間語音識(shí)別結(jié)果與場(chǎng)境數(shù)據(jù)之間不匹配,可以使eos超時(shí)延長(zhǎng)預(yù)定時(shí)間量。替選地,響應(yīng)于確定中間語音識(shí)別結(jié)果與場(chǎng)境數(shù)據(jù)之間不匹配,eos超時(shí)可以恢復(fù)到默認(rèn)的時(shí)間段。
場(chǎng)境數(shù)據(jù)可以與呈現(xiàn)給用戶的查詢相關(guān)聯(lián)。替選地,場(chǎng)境數(shù)據(jù)可以是從在屏幕上顯示的信息(諸如文本、圖像、視頻、音頻等等)得到的。場(chǎng)境數(shù)據(jù)可以替選地基于客戶端設(shè)備的當(dāng)前操作狀態(tài)或狀況。例如,場(chǎng)境數(shù)據(jù)可以與在客戶端設(shè)備上執(zhí)行的應(yīng)用的給定操作狀態(tài)或狀況相關(guān)聯(lián)。例如,應(yīng)用可以處于以下狀態(tài):要進(jìn)行選擇或輸入特定信息。因而,可以以多種方式得到或生成場(chǎng)境數(shù)據(jù),其包括基于與客戶端設(shè)備的當(dāng)前狀態(tài)相關(guān)聯(lián)的預(yù)期話語。
例如,可以顯示選項(xiàng),用戶將選擇其中一個(gè)選項(xiàng)。所顯示的選項(xiàng)可以作為場(chǎng)境數(shù)據(jù)而被接收。當(dāng)接收到話語并且語音識(shí)別器開始對(duì)與話語相關(guān)聯(lián)的音頻數(shù)據(jù)進(jìn)行處理時(shí),只要語音識(shí)別器對(duì)作為場(chǎng)境數(shù)據(jù)輸入的那些顯示的選項(xiàng)中的一個(gè)確定匹配(例如足夠相似),則可以立即啟動(dòng)語音結(jié)束條件并且可以返回語音識(shí)別結(jié)果。因而,一旦基于場(chǎng)境數(shù)據(jù)對(duì)話語確定匹配,則可以通過返回語音識(shí)別結(jié)果來降低語音識(shí)別時(shí)延,而不是等待完整的eos超時(shí)以使端點(diǎn)確定到期。
端點(diǎn)確定可以附加地基于預(yù)期話語或?qū)Σ樵兊捻憫?yīng)。例如,利用作為與消息要傳送到的接收者的輸入相關(guān)聯(lián)的場(chǎng)境數(shù)據(jù)的聯(lián)系人列表,端點(diǎn)器可以允許輸入不止一個(gè)聯(lián)系人姓名。因而,例如,端點(diǎn)器不會(huì)僅返回第一姓名輸入的語音識(shí)別結(jié)果并且響應(yīng)于確定該第一姓名與場(chǎng)境數(shù)據(jù)匹配并且語音識(shí)別器返回第一姓名輸入而停止對(duì)音頻數(shù)據(jù)的輸入。例如,可以向用戶呈現(xiàn)諸如“whodoyouwanttosendthismessageto?(您要將此消息發(fā)送給誰?)”這樣的查詢,并且用戶可以回應(yīng)“john、bill、以及joe”。在“john”是作為場(chǎng)境數(shù)據(jù)的聯(lián)系人列表的一部分的情況下,系統(tǒng)不會(huì)在確定john的輸入話語與場(chǎng)境數(shù)據(jù)匹配之后結(jié)束處理(即對(duì)話語進(jìn)行端點(diǎn)確定),而是允許對(duì)“john、bill、以及joe”的完整話語的處理。在這種情況下,預(yù)期輸入可以包含不止一個(gè)姓名,并且基于預(yù)期輸入,該系統(tǒng)可以延長(zhǎng)eos超時(shí)以允許不止一個(gè)姓名的話語。然而,基于更快地確定與從語音識(shí)別器所返回的中間語音識(shí)別結(jié)果的場(chǎng)境數(shù)據(jù)匹配,仍可以降低語音識(shí)別時(shí)延。
如果對(duì)話語確定與場(chǎng)境數(shù)據(jù)部分匹配,則可以使eos超時(shí)延長(zhǎng)以允許輸入附加的音頻數(shù)據(jù)。例如,根據(jù)場(chǎng)境數(shù)據(jù),期望輸入出生年份,并且用戶說“19”后跟停頓。在這種情況下,語音識(shí)別器可以返回“19”的識(shí)別結(jié)果并且該系統(tǒng)可以確定與場(chǎng)境數(shù)據(jù)部分匹配。響應(yīng)于該確定,使eos超時(shí)延長(zhǎng)以說出年的剩余部分。然而,如果用戶沒有說任何附加輸入,則端點(diǎn)器可以根據(jù)預(yù)定的默認(rèn)eos超時(shí)來發(fā)起語音結(jié)束條件。
特定示例是客戶端作為下述應(yīng)用,所述應(yīng)用在特定狀態(tài)下請(qǐng)求用戶選擇在屏幕上所顯示的三種顏色中的一個(gè)以作為對(duì)例如“pleasesayred,greenorblue(請(qǐng)說出紅色、綠色、或藍(lán)色)”的提示。當(dāng)用戶響應(yīng)于提示而開始講話時(shí),該應(yīng)用可以與音頻數(shù)據(jù)一起發(fā)送應(yīng)用或客戶端場(chǎng)境數(shù)據(jù),在這種情況下所述客戶端場(chǎng)境數(shù)據(jù)可以是短語“紅色”、“綠色”、“藍(lán)色”。如上所述,這些短語可以由語音端點(diǎn)確定系統(tǒng)使用以降低語音識(shí)別結(jié)果的時(shí)延。語音端點(diǎn)確定模塊(例如語音端點(diǎn)器110)可以接收并保存該場(chǎng)境數(shù)據(jù)。當(dāng)開始從語音識(shí)別器130接收中間(即不是最終的)識(shí)別結(jié)果時(shí),可以對(duì)中間語音識(shí)別結(jié)果與所提供的場(chǎng)境數(shù)據(jù)進(jìn)行比較。一旦確定語音識(shí)別器130所返回的識(shí)別結(jié)果與在客戶端提供的場(chǎng)境數(shù)據(jù)中所呈現(xiàn)的短語相匹配,則語音端點(diǎn)器110不需要再等待eos超時(shí)到期。而是可以返回最終識(shí)別結(jié)果并將其傳送給客戶端,這節(jié)省了時(shí)間并且降低了語音識(shí)別時(shí)延。
另一特定示例是在特定狀態(tài)或功能下執(zhí)行飛行調(diào)度的應(yīng)用。用戶可以被提示以說出諸如短語“from[origin_airport]to[destination_airport]”這樣的特定查詢短語。所有機(jī)場(chǎng)的列表可以作為場(chǎng)境數(shù)據(jù)在語音端點(diǎn)確定模塊(例如語音端點(diǎn)器110)處接收。替選地,可以將包括所有機(jī)場(chǎng)的列表的場(chǎng)境數(shù)據(jù)與場(chǎng)境id相關(guān)聯(lián)地存儲(chǔ)在存儲(chǔ)介質(zhì)120中并且可以接收?qǐng)鼍砳d,并且與場(chǎng)境數(shù)據(jù)id相關(guān)聯(lián)的場(chǎng)境數(shù)據(jù)可以是從存儲(chǔ)介質(zhì)120檢索到的。
響應(yīng)于用戶說話,例如“fromjfkto”并且此后在試圖想到目的地機(jī)場(chǎng)名稱的同時(shí)停頓,如果停頓時(shí)間長(zhǎng)于默認(rèn)eos超時(shí),則語音識(shí)別系統(tǒng)可能會(huì)終止識(shí)別會(huì)話。這將導(dǎo)致僅生成部分識(shí)別結(jié)果,這是不期望的用戶體驗(yàn),因?yàn)橛脩舯仨氈貜?fù)整個(gè)短語以獲取適當(dāng)輸出。然而,通過使用客戶端提供的信息作為場(chǎng)境數(shù)據(jù),期望該音頻與短語“from[origin_airport]to[destination_airport]”相對(duì)應(yīng),并且如果僅接收到與預(yù)期短語部分匹配,則eos超時(shí)可以被延長(zhǎng)。因而,在上述場(chǎng)景下,響應(yīng)于語音端點(diǎn)器模塊(例如語音端點(diǎn)器110)僅接收“fromjfk”以作為中間結(jié)果的示例,系統(tǒng)等待用戶以在超出默認(rèn)eos超時(shí)已到期時(shí)的延長(zhǎng)時(shí)間量?jī)?nèi)完成說出預(yù)期短語,從而使時(shí)間延長(zhǎng)以使用戶說出短語。當(dāng)接收到“from[origin_airport]to[destination_airport]”這種預(yù)期短語格式的結(jié)果時(shí),語音端點(diǎn)器110將終止識(shí)別會(huì)話。替選地,可以使用更復(fù)雜的語法以適應(yīng)用戶可能會(huì)傳達(dá)信息的各種短語,諸如“i'dliketogoto[destination_airport],leavingfrom[origin_airport]”。
在一些實(shí)施方式中,將場(chǎng)境數(shù)據(jù)存儲(chǔ)在存儲(chǔ)介質(zhì)120中,這對(duì)于場(chǎng)境不太可能改變的場(chǎng)景特別有用。上面所述的與機(jī)場(chǎng)有關(guān)的示例是一個(gè)示例場(chǎng)景,因?yàn)榭梢蕴崆敖邮兆鳛閳?chǎng)境數(shù)據(jù)的機(jī)場(chǎng)列表,因?yàn)樵摿斜聿粫?huì)頻繁變化。作為另一示例,在填寫表格的場(chǎng)景下(例如用戶需要說出生日期或年份),場(chǎng)境數(shù)據(jù)還可以被提前接收并存儲(chǔ)。
通常,如圖2所示,圖200圖示了當(dāng)計(jì)算設(shè)備210正在處理傳入的音頻輸入202時(shí)計(jì)算設(shè)備210可以生成或檢測(cè)的信號(hào)202-206。計(jì)算設(shè)備210可以通過計(jì)算設(shè)備210的麥克風(fēng)或其它音頻輸入設(shè)備接收音頻輸入202。計(jì)算設(shè)備210接收音頻輸入202并且以預(yù)先指定的頻率和分辨率對(duì)音頻輸入202進(jìn)行采樣。例如,計(jì)算設(shè)備210可以8khz、16khz、44.1khz或者任何其它采樣率對(duì)音頻輸入202進(jìn)行采樣,并且分辨率可以是16位、22位或任何其它分辨率。音頻輸入202圖示了基于來自用戶214的示例話語212的已采樣的模擬數(shù)據(jù)。計(jì)算設(shè)備210可以記錄并存儲(chǔ)與話語212相對(duì)應(yīng)的音頻輸入202。
計(jì)算設(shè)備210可以對(duì)用戶214所說的話語212進(jìn)行轉(zhuǎn)錄?;蛘?,可以在遠(yuǎn)程服務(wù)器上生成對(duì)話語212的轉(zhuǎn)錄。在一些實(shí)現(xiàn)中,計(jì)算設(shè)備210使用運(yùn)行自動(dòng)語音識(shí)別(asr)軟件的計(jì)算設(shè)備210的處理器來對(duì)話語212的詞進(jìn)行轉(zhuǎn)錄。例如,計(jì)算設(shè)備210可以在計(jì)算設(shè)備210上本地地確定初始部分音頻輸入202包含詞項(xiàng)220“from”。隨著計(jì)算設(shè)備210接收到來自用戶的話語212,asr軟件可以接收音頻輸入202。當(dāng)asr軟件識(shí)別出音頻輸入202中的詞項(xiàng)時(shí),asr軟件提供該詞項(xiàng)以輸出到計(jì)算設(shè)備210。計(jì)算設(shè)備210可以記錄asr軟件所識(shí)別出的asr軟件返回詞項(xiàng)之間的時(shí)間量。
在一些實(shí)施方式中,通過網(wǎng)絡(luò)可訪問的服務(wù)器可以運(yùn)行asr軟件。在這種情況下,計(jì)算設(shè)備可以通過網(wǎng)絡(luò)將音頻輸入202傳送到服務(wù)器,接收來自服務(wù)器的詞項(xiàng),并記錄服務(wù)器返回詞項(xiàng)之間的時(shí)間量。另外,語音端點(diǎn)確定模塊(例如語音端點(diǎn)器110)還可以在可通過網(wǎng)絡(luò)訪問的服務(wù)器上。
如圖2所圖示的,例如,響應(yīng)于對(duì)航班搜索的提示,用戶可以在完成短語“tojfk”之前說出話語“fromjfk”后跟停頓。在這種情況下,默認(rèn)或一般端點(diǎn)204可以僅捕獲詞項(xiàng)220“from”和詞項(xiàng)222“jfk”。默認(rèn)eos超時(shí)發(fā)生在話語212中的短語之間的停頓期間,并且其結(jié)果是語音結(jié)束條件可能啟動(dòng)。因而,對(duì)響應(yīng)于該提示所發(fā)出的話語212可能僅轉(zhuǎn)錄詞項(xiàng)220“from”和詞項(xiàng)222“jfk”,這生成了“fromjfk”的最終識(shí)別結(jié)果230。然而,根據(jù)本公開的實(shí)施例,基于場(chǎng)境數(shù)據(jù),可以確定具有出發(fā)機(jī)場(chǎng)和目的地機(jī)場(chǎng)的查詢被輸入作為話語212并且可以動(dòng)態(tài)地調(diào)節(jié)eos超時(shí)以使時(shí)間延長(zhǎng)來使用戶完成說出該查詢。在這種情況下,調(diào)節(jié)后的端點(diǎn)206可以捕獲話語212中的所有詞項(xiàng)220-226,并且從而將查詢的轉(zhuǎn)錄235生成為“fromjfk,tolax”。
圖3是用于對(duì)話語進(jìn)行端點(diǎn)確定的示例過程的示意圖。過程300可以是由諸如圖2的計(jì)算設(shè)備210這樣的計(jì)算設(shè)備或者諸如圖1所示的服務(wù)器或服務(wù)器網(wǎng)絡(luò)來執(zhí)行的。過程300對(duì)音頻數(shù)據(jù)和場(chǎng)境數(shù)據(jù)進(jìn)行分析以基于場(chǎng)境數(shù)據(jù)對(duì)中間語音識(shí)別結(jié)果與音頻數(shù)據(jù)的預(yù)期語音識(shí)別結(jié)果進(jìn)行比較,并且根據(jù)確定中間語音識(shí)別結(jié)果與預(yù)期語音識(shí)別結(jié)果之間是否匹配或不匹配或部分匹配來動(dòng)態(tài)地調(diào)節(jié)eos超時(shí)以對(duì)話語進(jìn)行端點(diǎn)確定。
該系統(tǒng)接收包括話語的音頻數(shù)據(jù)(310)。該話語可以是從下述用戶接收到的,所述用戶講話到計(jì)算設(shè)備的麥克風(fēng)以及用于接收與用戶說話相對(duì)應(yīng)的音頻信號(hào)的設(shè)備之中。該設(shè)備可以對(duì)音頻信號(hào)進(jìn)行處理并且將其傳送到服務(wù)器。包括話語的音頻數(shù)據(jù)可以是由服務(wù)器來接收的。在一些實(shí)施方式中,可以不將音頻數(shù)據(jù)傳送到服務(wù)器,并且語音識(shí)別可以發(fā)生在計(jì)算設(shè)備而不是服務(wù)器處。
系統(tǒng)獲取指示一個(gè)或多個(gè)預(yù)期語音識(shí)別結(jié)果的場(chǎng)境數(shù)據(jù)(320)。如上所述,可以與接收音頻數(shù)據(jù)同時(shí)地接收?qǐng)鼍硵?shù)據(jù)。在替選實(shí)施例中,可以在接收音頻數(shù)據(jù)之前接收?qǐng)鼍硵?shù)據(jù),并且可以使其與預(yù)定客戶端場(chǎng)境id相關(guān)聯(lián)并將其存儲(chǔ)在存儲(chǔ)設(shè)備中。在這種情況下,系統(tǒng)可以與接收音頻數(shù)據(jù)同時(shí)地接收客戶端場(chǎng)境id并且從存儲(chǔ)設(shè)備檢索與客戶端場(chǎng)境id相關(guān)聯(lián)的場(chǎng)境數(shù)據(jù)。場(chǎng)境數(shù)據(jù)可以與呈現(xiàn)給用戶的查詢相關(guān)聯(lián),并且例如場(chǎng)境數(shù)據(jù)可以包括與查詢相關(guān)聯(lián)的一個(gè)或多個(gè)預(yù)期語音識(shí)別結(jié)果。替選地,場(chǎng)境數(shù)據(jù)可以是從在屏幕上顯示的信息(諸如文本、圖像、視頻、音頻等等)得到的。場(chǎng)境數(shù)據(jù)可以替選地基于客戶端設(shè)備的當(dāng)前運(yùn)行狀態(tài)或條件。
該系統(tǒng)基于場(chǎng)境數(shù)據(jù)來確定音頻數(shù)據(jù)的預(yù)期語音識(shí)別結(jié)果(330)。例如,如果利用諸如“whodoyouwanttocall?”或者“whodoyouwanttoplaythegamewith?”這樣的查詢向用戶提示姓名,則場(chǎng)境數(shù)據(jù)可以是與用戶相關(guān)聯(lián)的聯(lián)系人列表。因而,預(yù)期語音識(shí)別結(jié)果可以是與用戶相關(guān)聯(lián)的聯(lián)系人列表中的一個(gè)或多個(gè)姓名。作為另一示例,如果高亮顯示或選擇出生年份的輸入域,則場(chǎng)境數(shù)據(jù)可以是年的列表并且預(yù)期語音識(shí)別結(jié)果可以是這些年中的一個(gè)。
系統(tǒng)接收由語音識(shí)別引擎所生成的中間語音識(shí)別結(jié)果(340)。隨著音頻數(shù)據(jù)被接收并被傳送到語音識(shí)別引擎,語音識(shí)別引擎對(duì)音頻數(shù)據(jù)進(jìn)行處理并且開始生成并返回中間語音識(shí)別結(jié)果。例如,中間語音識(shí)別結(jié)果可以包括詞的第一音節(jié)或詞的第一音標(biāo)聲音?;蛘?,中間語音識(shí)別結(jié)果可以包括詞的多個(gè)音節(jié)、多個(gè)音標(biāo)聲音、或者短語的一個(gè)或多個(gè)詞。
該系統(tǒng)基于場(chǎng)境數(shù)據(jù)對(duì)音頻數(shù)據(jù)的中間語音識(shí)別結(jié)果與預(yù)期語音識(shí)別結(jié)果進(jìn)行比較(350)。隨著語音識(shí)別引擎產(chǎn)生并返回中間語音識(shí)別結(jié)果,可以對(duì)中間語音識(shí)別結(jié)果與基于場(chǎng)境數(shù)據(jù)所確定的預(yù)期語音識(shí)別結(jié)果進(jìn)行比較。返回如上所述的場(chǎng)境數(shù)據(jù)是聯(lián)系人列表的示例,預(yù)期語音識(shí)別結(jié)果可以是聯(lián)系人列表中的一個(gè)或多個(gè)姓名。對(duì)中間語音識(shí)別結(jié)果與聯(lián)系人列表中的一個(gè)或多個(gè)姓名的預(yù)期語音識(shí)別結(jié)果進(jìn)行比較。例如,如果聯(lián)系人列表包含姓名“bill”、“charlie”、以及“hillary”,則系統(tǒng)將中間語音識(shí)別結(jié)果與這些姓名中的每一個(gè)進(jìn)行比較。
系統(tǒng)基于場(chǎng)境數(shù)據(jù)來確定中間語音識(shí)別結(jié)果是否與音頻數(shù)據(jù)的預(yù)期語音識(shí)別結(jié)果相對(duì)應(yīng)(360)。再次返回到場(chǎng)境數(shù)據(jù)指示姓名“bill”、“charlie”、以及“hillary”的聯(lián)系人列表的上述示例,如果中間語音識(shí)別結(jié)果例如是“cha-”,則基于場(chǎng)境數(shù)據(jù)指示預(yù)期語音識(shí)別結(jié)果是“bill”、“charlie”、以及“hillary”中的一個(gè),可確定中間語音識(shí)別結(jié)果與“charlie”而不是“bill”或“hillar”的預(yù)期語音識(shí)別結(jié)果相對(duì)應(yīng)。另外,中間語音識(shí)別結(jié)果可以具有與語音識(shí)別引擎所生成的中間語音識(shí)別結(jié)果相關(guān)聯(lián)地特定置信度水平。該置信度水平可以與語音識(shí)別結(jié)果的準(zhǔn)確性的置信度相對(duì)應(yīng)。該置信度可能有助于確定中間語音識(shí)別結(jié)果是否與預(yù)期語音識(shí)別結(jié)果相對(duì)應(yīng)。
系統(tǒng)響應(yīng)于基于場(chǎng)境數(shù)據(jù)確定中間語音識(shí)別結(jié)果與音頻數(shù)據(jù)的預(yù)期語音識(shí)別結(jié)果相匹配而對(duì)語音結(jié)束條件進(jìn)行初始化并且提供最終語音識(shí)別結(jié)果(370)。最終語音識(shí)別結(jié)果可以包括由場(chǎng)境數(shù)據(jù)所指示的一個(gè)或多個(gè)預(yù)期的語音識(shí)別結(jié)果。因而,一旦確定中間語音識(shí)別結(jié)果與預(yù)期語音識(shí)別結(jié)果相匹配,則端點(diǎn)捕獲器不需要繼續(xù)等待eos超時(shí)到期。相反,可以將最終語音識(shí)別結(jié)果輸出到客戶端設(shè)備或用戶,從而降低語音識(shí)別時(shí)延。
響應(yīng)于基于場(chǎng)境數(shù)據(jù)確定中間語音識(shí)別結(jié)果包括與音頻數(shù)據(jù)的預(yù)期語音識(shí)別結(jié)果的部分匹配或不包括與音頻數(shù)據(jù)的預(yù)期語音識(shí)別結(jié)果的匹配,系統(tǒng)使語音結(jié)束條件的時(shí)間段延長(zhǎng)以接收附加音頻數(shù)據(jù)(380)。如果確定中間語音識(shí)別結(jié)果與場(chǎng)境數(shù)據(jù)之間不匹配或者中間語音識(shí)別結(jié)果與場(chǎng)境數(shù)據(jù)之間部分匹配,則可以動(dòng)態(tài)調(diào)節(jié)eos超時(shí)。可以使eos超時(shí)與特定預(yù)期語音識(shí)別結(jié)果相關(guān)聯(lián)地延長(zhǎng)預(yù)定時(shí)間量。例如,如果預(yù)期語音識(shí)別結(jié)果是若干三詞短語中的一個(gè)并且中間語音識(shí)別結(jié)果僅包含兩個(gè)詞,則可以使eos延長(zhǎng)預(yù)定時(shí)間量以允許附加時(shí)間來輸入第三個(gè)詞的音頻。
響應(yīng)于確定中間語音識(shí)別結(jié)果與場(chǎng)境數(shù)據(jù)之間部分匹配而使eos超時(shí)延長(zhǎng)預(yù)定時(shí)間量。例如,如果場(chǎng)境數(shù)據(jù)指示預(yù)期語音識(shí)別結(jié)果是101與200之間的數(shù)字并且用戶所說的話語是“100”,然后是停頓,并且此后“25”,則如果停頓超過超時(shí),則默認(rèn)eos超時(shí)可能會(huì)導(dǎo)致語音識(shí)別系統(tǒng)終止識(shí)別會(huì)話,并且僅生成對(duì)“100”的轉(zhuǎn)錄,這導(dǎo)致用戶必須重復(fù)整個(gè)短語。然而,根據(jù)本公開的實(shí)施例,如果中間語音識(shí)別結(jié)果是“100”,則可以基于指示預(yù)期語音識(shí)別結(jié)果是101與200之間的數(shù)字的場(chǎng)境數(shù)據(jù)而使eos超時(shí)延長(zhǎng)預(yù)定時(shí)間量以允許附加時(shí)間來用于輸入剩余數(shù)字的音頻。因而,可以生成對(duì)完整話語“125”的轉(zhuǎn)錄,這提高了語音識(shí)別系統(tǒng)的準(zhǔn)確性并防止用戶被迫重復(fù)整個(gè)短語。
此外,可以響應(yīng)于確定中間語音識(shí)別結(jié)果與場(chǎng)境數(shù)據(jù)之間不匹配而使eos超時(shí)延長(zhǎng)預(yù)定時(shí)間量。例如,如果正在顯示文件夾并且呈現(xiàn)諸如“你想打開文件嗎?”的提示,則場(chǎng)境數(shù)據(jù)可以是所打開文件夾中的文件列表?;谠搱?chǎng)境數(shù)據(jù),預(yù)期中間語音識(shí)別結(jié)果可以是文件名中的一個(gè)或多個(gè)。如果用戶所說的話語是“打開”,后面是停頓,并且此后是“文件a”,并且中間語音識(shí)別結(jié)果是“打開”,則中間語音識(shí)別結(jié)果與場(chǎng)境數(shù)據(jù)不匹配。在這種情況下,可以使eos超時(shí)延長(zhǎng)預(yù)定時(shí)間量以允許附加時(shí)間來輸入要打開的文件名的音頻。因而,可以產(chǎn)生對(duì)完整話語“打開文件a”的轉(zhuǎn)錄,而不是用戶不希望體驗(yàn)的對(duì)話語的部分轉(zhuǎn)錄并且例如向用戶指示沒有名為“open”的文件。替選地,響應(yīng)于確定中間語音識(shí)別結(jié)果與場(chǎng)境數(shù)據(jù)之間不匹配,則eos超時(shí)可能會(huì)恢復(fù)到作為默認(rèn)eos超時(shí)的默認(rèn)時(shí)間段。
本文所描述的實(shí)體的實(shí)施例可包括除此處所描述的模塊之外的其它和/或與此處所描述的模塊不同的模塊。另外,歸屬這些模塊的功能可由其它實(shí)施例中的其它或不同模塊來實(shí)現(xiàn)的。此外,為了清楚和方便起見,本說明書有時(shí)省略詞語“模塊”。
已經(jīng)描述了許多實(shí)施方式。然而,應(yīng)當(dāng)理解的是在不脫離本公開的精神和范圍的情況下可以進(jìn)行各種修改。例如,可以使用上面所示的各種形式的流程,其中步驟可被重排、添加、或刪除。
本說明書中所描述的主題和操作的實(shí)施例可以是在數(shù)字電子電路中實(shí)現(xiàn)的、或者在包括在該說明書中所公開的結(jié)構(gòu)及其結(jié)構(gòu)等效體的計(jì)算機(jī)軟件、固件、或者硬件中實(shí)現(xiàn)的、或者在它們中的一個(gè)或多個(gè)的組合中實(shí)現(xiàn)的。該說明書中所描述的主題的實(shí)施例可以是作為編碼在計(jì)算機(jī)存儲(chǔ)介質(zhì)上的以由數(shù)據(jù)處理裝置來執(zhí)行的或者用于控制數(shù)據(jù)處理裝置的操作的一個(gè)或多個(gè)計(jì)算機(jī)程序(即計(jì)算機(jī)程序指令的一個(gè)或多個(gè)模塊)來實(shí)現(xiàn)的。替選地或另外,程序指令可被編碼在非人工產(chǎn)生的傳播信號(hào)上,所述信號(hào)例如是被生成以對(duì)傳輸?shù)竭m當(dāng)接收器裝置來由數(shù)據(jù)處理裝置執(zhí)行的信息進(jìn)行編碼的機(jī)器產(chǎn)生的電、光、或電磁信號(hào)。
計(jì)算機(jī)存儲(chǔ)介質(zhì)可以是下述或包含在下述之中:計(jì)算機(jī)可讀存儲(chǔ)設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)基片、隨機(jī)或串行存取存儲(chǔ)器陣列或設(shè)備,或者它們中的一個(gè)或多個(gè)的組合。此外,在計(jì)算機(jī)存儲(chǔ)介質(zhì)不是傳播信號(hào)的情況下,計(jì)算機(jī)存儲(chǔ)介質(zhì)可以是編碼在非人工生成的傳播信號(hào)中的計(jì)算機(jī)程序指令的源或目的地。計(jì)算機(jī)存儲(chǔ)介質(zhì)還可以是一個(gè)或多個(gè)單獨(dú)的物理組件或介質(zhì)(例如多個(gè)cd、盤片、或者其它存儲(chǔ)設(shè)備)或者包含在其之中。
該說明書中所描述的操作可以被實(shí)現(xiàn)為數(shù)據(jù)處理裝置對(duì)存儲(chǔ)在一個(gè)或多個(gè)計(jì)算機(jī)可讀存儲(chǔ)設(shè)備上的或從其它源所接收到的數(shù)據(jù)所執(zhí)行的操作。
詞語“數(shù)據(jù)處理裝置”包含用于處理數(shù)據(jù)的所有類型的裝置、設(shè)備、以及機(jī)器,其包括例如可編程處理器、計(jì)算機(jī)、片上系統(tǒng)、或多個(gè)那些、或前述的組合。裝置可包括例如現(xiàn)場(chǎng)可編程門陣列(fpga)或?qū)S眉呻娐?asic)的專用邏輯電路。除了硬件之外,裝置還可包括為討論中的計(jì)算機(jī)程序創(chuàng)建執(zhí)行環(huán)境的代碼(例如,構(gòu)成處理器固件、協(xié)議堆棧、數(shù)據(jù)庫管理系統(tǒng)、操作系統(tǒng)、跨平臺(tái)運(yùn)行時(shí)間環(huán)境、虛擬機(jī)、或者以上一個(gè)或多個(gè)的組合的代碼)。裝置和執(zhí)行環(huán)境可實(shí)現(xiàn)諸如web服務(wù)、分布式計(jì)算、以及網(wǎng)格計(jì)算基礎(chǔ)設(shè)施這樣的各種不同的計(jì)算模型基礎(chǔ)設(shè)施,。
計(jì)算機(jī)程序(也稱作程序、軟件、軟件應(yīng)用、腳本或代碼)可以是以包括編譯或解釋型語言的任何形式的編程語言來編寫的,并且它可以是以包括作為獨(dú)立程序或作為模塊、組件、子例程、或適于在計(jì)算環(huán)境中使用的其它單元的任何形式部署的。計(jì)算機(jī)程序不是必需與文件系統(tǒng)中的文件相對(duì)應(yīng)??蓪⒊绦虼鎯?chǔ)在用于保持其它程序或數(shù)據(jù)的文件(例如存儲(chǔ)在標(biāo)記語言文檔中的一個(gè)或多個(gè)腳本)的一部分、專用于討論中的程序的單個(gè)文件、或者多個(gè)協(xié)同文件(例如存儲(chǔ)一個(gè)或多個(gè)模塊、子程序、或者部分代碼的文件)之中。可將計(jì)算機(jī)程序部署為在一個(gè)計(jì)算機(jī)上或者在位于一個(gè)地點(diǎn)或跨多個(gè)地點(diǎn)分布且通過通信網(wǎng)絡(luò)互連的多個(gè)計(jì)算機(jī)上執(zhí)行。
在本說明書中所描述的過程和邏輯流程可以是由執(zhí)行一個(gè)或多個(gè)計(jì)算機(jī)程序的一個(gè)或多個(gè)可編程處理器來執(zhí)行的以通過對(duì)輸入數(shù)據(jù)進(jìn)行操作并產(chǎn)生輸出來執(zhí)行功能。所述過程和邏輯流程還可由專用邏輯電路(例如fpga或asic)來執(zhí)行的,并且裝置還可以是作為所述專用邏輯電路實(shí)現(xiàn)的。
適于執(zhí)行計(jì)算機(jī)程序的處理器包括例如通用和專用微處理器這樣兩者以及任何類型的數(shù)字計(jì)算機(jī)中的任何一個(gè)或多個(gè)處理器。通常,處理器將接收來自只讀存儲(chǔ)器或隨機(jī)存取存儲(chǔ)器或這兩者的指令和數(shù)據(jù)。
計(jì)算機(jī)的主要元件是用于根據(jù)指令執(zhí)行動(dòng)作的處理器以及用于存儲(chǔ)指令和數(shù)據(jù)的一個(gè)或多個(gè)存儲(chǔ)器設(shè)備。通常,計(jì)算機(jī)還將包括用于存儲(chǔ)數(shù)據(jù)的一個(gè)或多個(gè)海量存儲(chǔ)設(shè)備(例如磁盤、磁光盤、或光盤)或者可操作地與所述一個(gè)或多個(gè)海量存儲(chǔ)設(shè)備耦合以接收來自所述一個(gè)或多個(gè)海量存儲(chǔ)設(shè)備的數(shù)據(jù)或?qū)?shù)據(jù)傳送到所述一個(gè)或多個(gè)海量存儲(chǔ)設(shè)備或者這兩者。然而,計(jì)算機(jī)不是必須具有這樣的設(shè)備。
此外,可以將計(jì)算機(jī)嵌入到另一設(shè)備中,所述另一設(shè)備例如是移動(dòng)電話、個(gè)人數(shù)字助理(pda)、移動(dòng)音頻或視頻播放器、游戲機(jī)、全球定位系統(tǒng)(gps)接收器、或者例如通用串行總線(usb)閃存驅(qū)動(dòng)這樣的便攜式存儲(chǔ)設(shè)備,僅舉幾例。適于存儲(chǔ)計(jì)算機(jī)程序指令和數(shù)據(jù)的設(shè)備包括所有形式的非易失性存儲(chǔ)器、介質(zhì)、以及存儲(chǔ)器設(shè)備,其包括例如:半導(dǎo)體存儲(chǔ)器設(shè)備(例如eprom、eeprom、以及閃速存儲(chǔ)器設(shè)備);磁盤(例如內(nèi)部硬盤或可移動(dòng)盤);磁光盤;以及cd-rom和dvd-rom盤。處理器和存儲(chǔ)器可以由專用邏輯電路補(bǔ)充或合并入專用邏輯電路中。
為了提供與用戶的交互,在本說明書中所描述的主題的實(shí)施例可以是在具有下述的計(jì)算機(jī)上實(shí)現(xiàn)的:例如crt(陰極射線管)或lcd(液晶顯示)監(jiān)視器這樣的用于向用戶顯示信息的顯示設(shè)備;以及例如鼠標(biāo)或軌跡球這樣的用戶通過其可向計(jì)算機(jī)提供輸入的鍵盤和指針設(shè)備。其它類型的設(shè)備可用于提供與用戶的交互;例如,提供給用戶的反饋可以是例如視覺反饋、聽覺反饋、或觸覺反饋這樣的任何形式的感覺反饋;以及來自用戶的輸入可以是以包括聲學(xué)的、語音的、或觸覺的輸入的任何形式接收的。另外,計(jì)算機(jī)可通過將文檔發(fā)送給用戶所使用的設(shè)備以及從用戶所使用的設(shè)備接收文檔來與用戶交互;例如,通過響應(yīng)于從web瀏覽器所接收到請(qǐng)求而將網(wǎng)頁發(fā)送給用戶客戶端設(shè)備上的web瀏覽器。
在本說明書中所描述的主題的實(shí)施例可以是在下述計(jì)算系統(tǒng)中實(shí)現(xiàn)的,所述計(jì)算系統(tǒng)包括:后端組件,例如作為數(shù)據(jù)服務(wù)器;或者中間件組件,例如應(yīng)用服務(wù)器;或者前端組件,例如具有用戶通過其可與在本說明書中所描述的主題的實(shí)現(xiàn)相交互的圖形用戶界面或web瀏覽器的客戶端計(jì)算機(jī);或者一個(gè)或多個(gè)這樣的后端、中間件、或前端組件的任何組合。系統(tǒng)的組件可通過例如通信網(wǎng)絡(luò)這樣的任何形式或介質(zhì)的數(shù)字?jǐn)?shù)據(jù)通信互連。通信網(wǎng)絡(luò)的示例包括局域網(wǎng)(“l(fā)an”)和廣域網(wǎng)(“wan”)、互聯(lián)網(wǎng)絡(luò)(例如互聯(lián)網(wǎng))、以及對(duì)等網(wǎng)絡(luò)(例如對(duì)等點(diǎn)對(duì)點(diǎn)網(wǎng)絡(luò))。
一個(gè)或多個(gè)計(jì)算機(jī)的系統(tǒng)可被配置為通過使安裝在系統(tǒng)上的軟件、固件、硬件、或它們的組合在操作中使得該系統(tǒng)執(zhí)行動(dòng)作來執(zhí)行特定操作或動(dòng)作。一個(gè)或更多計(jì)算機(jī)程序可被配置為通過包括下述指令來執(zhí)行特定操作或動(dòng)作,所述指令當(dāng)由數(shù)據(jù)處理裝置執(zhí)行時(shí)使得該裝置執(zhí)行動(dòng)作。
計(jì)算系統(tǒng)可包括客戶端和服務(wù)器??蛻舳撕头?wù)器通常彼此遠(yuǎn)離并且典型地通過通信網(wǎng)絡(luò)交互??蛻舳伺c服務(wù)器的關(guān)系借助于在相應(yīng)計(jì)算機(jī)上運(yùn)行的并且彼此具有客戶端-服務(wù)器關(guān)系的計(jì)算機(jī)程序而產(chǎn)生。在一些實(shí)施例中,服務(wù)器將數(shù)據(jù)(例如html頁面)傳送到客戶端設(shè)備(例如為了向與客戶端設(shè)備相交互的用戶顯示數(shù)據(jù)并且接收來自所述用戶的用戶輸入)??稍诜?wù)器處接收來自客戶端設(shè)備的在客戶端設(shè)備處所生成的數(shù)據(jù)(例如用戶交互的結(jié)果)。
雖然本說明書包含許多具體實(shí)施方式細(xì)節(jié),但是這些細(xì)節(jié)不應(yīng)當(dāng)被解釋為對(duì)任何創(chuàng)新或可以要求保護(hù)的內(nèi)容的范圍的限制,而應(yīng)當(dāng)被解釋為對(duì)專用于特定發(fā)明的特定實(shí)施例的特征的描述。在本說明書中在分離的實(shí)施例的場(chǎng)境中所描述的某些特征還可以是在單個(gè)實(shí)施例中組合地實(shí)現(xiàn)的。相反地,在單個(gè)實(shí)施例的場(chǎng)境中所描述的各種特征還可分離地在多個(gè)實(shí)施例中實(shí)現(xiàn)或者在任何適當(dāng)?shù)淖咏M合中實(shí)現(xiàn)。此外,盡管可能在上面將特征描述為在某些組合中起作用,并且甚至最初要求保護(hù)的就是如此,但是在一些情況下可將來自所要求保護(hù)的組合的一個(gè)或多個(gè)特征從該組合中刪去,并且所要求保護(hù)的組合可以針對(duì)子組合或者子組合的變型。
類似地,雖然在附圖中以特定順序描繪了操作,但是不應(yīng)當(dāng)將這理解為需要以所示的特定順序或者以連續(xù)順序執(zhí)行這樣的操作或者需要執(zhí)行所有圖示的操作以實(shí)現(xiàn)期望結(jié)果。在某些情況下,多任務(wù)以及并行處理可能是有利的。此外,不應(yīng)當(dāng)將在上述實(shí)施例中的各種系統(tǒng)組件的分離理解為在所有實(shí)施例中均需要這樣的分離,而應(yīng)當(dāng)理解的是通??蓪⑺龀绦蚪M件和系統(tǒng)一起集成在單個(gè)軟件產(chǎn)品中或者封裝成多個(gè)軟件產(chǎn)品。
在提到html文件的每個(gè)實(shí)例中,可以用其它文件類型或來代替。例如,html文件可以由xml、json、純文本、或者其它類型的文件替代。此外,在提到表或散列表的情況下,可以使用諸如電子表格、關(guān)系數(shù)據(jù)庫、結(jié)構(gòu)化文件等這樣的其它數(shù)據(jù)結(jié)構(gòu)。
因而,已經(jīng)描述了主題的特定實(shí)施例。其它實(shí)施例在所附權(quán)利要求的范圍之內(nèi)。在一些情況下,權(quán)利要求中所記載的動(dòng)作可以以不同的順序執(zhí)行并且仍然實(shí)現(xiàn)期望結(jié)果。另外,在附圖中所描繪的過程不一定需要所示的特定順序或相繼順序以實(shí)現(xiàn)期望的結(jié)果。在某些實(shí)現(xiàn)中,多任務(wù)和并行處理可能是有利的。