專利名稱:使用重新識別和統(tǒng)計分類的識別的制作方法
使用重新識別和統(tǒng)計分類的識別背景當(dāng)涉及到大的語法搜索空間時,諸如覆蓋大量企業(yè)名稱、web搜索查詢、語音撥號請求等的語音搜索任務(wù),語音識別性能有時是次優(yōu)的。經(jīng)常顯現(xiàn)的三種主要的次優(yōu)性包括 長的識別等待時間、差的識別準(zhǔn)確性、以及不充足的語法覆蓋。一種現(xiàn)有的移動語音搜索應(yīng)用在第一階段使用全國性的企業(yè)目錄語法加上地區(qū)語法,然后在第二階段使用地區(qū)專用的企業(yè)目錄語法來重新識別同一個發(fā)言(其中地區(qū)在第一階段中確定)。這種方法不解決等待時間問題,但是能在非常具體的情況下改進覆蓋和準(zhǔn)確性.另一種方法嘗試通過在子發(fā)言級對不同識別器的輸出進行投票來減小單詞錯誤率。該方法及其擴展一般假定每個識別器用對整個任務(wù)而言完整的語法來嘗試識別。
發(fā)明內(nèi)容
下面提供了簡化的發(fā)明內(nèi)容,以便提供對此處所描述的一些新穎實施例的基本理解。本發(fā)明內(nèi)容不是詳盡的概述,并且它不旨在標(biāo)識關(guān)鍵/重要元素或描繪本發(fā)明的范圍。 其唯一目的是以簡化形式呈現(xiàn)一些概念,作為稍后呈現(xiàn)的更具體實施例的序言。所公開的體系結(jié)構(gòu)獲得用于識別的輸入,并且對用于識別處理的輸入應(yīng)用環(huán)境專用的限制條件的不同實例。單獨的約束條件實例合起來提供了對給定輸入的總體環(huán)境域。 通過例如針對這些約束條件并行地進行識別,改進了識別等待時間、識別準(zhǔn)確性和識別域覆蓋。此外,通過對系統(tǒng)等待產(chǎn)生一結(jié)果將花費多久加以時間限制,可以對單獨的識別通道的識別處理進行管理。在語音識別的環(huán)境中,體系結(jié)構(gòu)采用一總體語法,該總體語法的形式是用于識別發(fā)言輸入的較小單獨環(huán)境專用語法的邏輯和,每個較小單獨環(huán)境專用語法負(fù)責(zé)一個特定的環(huán)境,諸如子任務(wù)類別、地理區(qū)域等等。這些語法一起覆蓋了整個域。此外,對于同一個輸入可以并行地運行多個識別,其中每個識別通道使用環(huán)境專用語法中的一個或多個。通過使用基于多個識別結(jié)果以及可能其它域知識的動態(tài)合成語法、或者使用對從多個識別結(jié)果及其他域知識提取的分類特征進行操作的統(tǒng)計分類器來選擇獲勝者,來自不同識別器語法通道的多個中間識別結(jié)果得以被協(xié)調(diào)。為了為實現(xiàn)上述及相關(guān)目的,本文結(jié)合下面的描述和附圖來描述某些說明性方面。這些方面指示了可以實踐本文所公開的原理的各種方式,并且所有方面及其等效方面旨在落入所要求保護的主題的范圍內(nèi)。結(jié)合附圖閱讀下面的詳細(xì)描述,其他優(yōu)點和新穎特征將變得顯而易見。
圖1示出根據(jù)所公開的體系結(jié)構(gòu)的計算機實現(xiàn)的識別系統(tǒng)。圖2示出采用規(guī)則來確定單個識別結(jié)果的系統(tǒng)的替代實施例。圖3示出一環(huán)境專用約束條件識別系統(tǒng),該系統(tǒng)采用重新識別且約束條件是用于語音識別的語法。
圖4示出一環(huán)境專用約束條件識別系統(tǒng),該系統(tǒng)采用統(tǒng)計分類且約束條件是用于并行語音識別的語法。圖5示出計算機實現(xiàn)的識別方法。圖6示出圖5的方法的其它方面。圖7示出圖5的方法的其它方面。圖8示出可用于根據(jù)所公開的體系結(jié)構(gòu)執(zhí)行識別的計算系統(tǒng)的框圖。圖9示出了根據(jù)所公開的體系結(jié)構(gòu)提供并行識別的計算環(huán)境的示意性框圖。
具體實施例方式所公開的體系結(jié)構(gòu)是首先使用環(huán)境專用約束條件來執(zhí)行同一輸入(例如發(fā)言)的獨立識別的識別系統(tǒng)。這些獨立識別或者串行執(zhí)行,或者并行執(zhí)行。每個環(huán)境專用約束條件都小于嘗試統(tǒng)一所有域知識的約束條件。多個識別結(jié)果的協(xié)調(diào)可以使用后續(xù)識別(重新識別)和/或通過統(tǒng)計分類來完成。該體系結(jié)構(gòu)解決了與傳統(tǒng)的單語法、單識別方法相關(guān)聯(lián)的識別等待時間、識別準(zhǔn)確性和不充足語法覆蓋的問題。關(guān)于識別等待時間,并行識別中的每個識別實例都針對比能覆蓋相同任務(wù)的單個大語法要小的語法。而且,重新識別步驟是針對小動態(tài)語法。特別是在非流化情況下,和具有單個大語法的識別相比,并行識別的最大等待時間加上重新識別的等待時間的兩個組合的識別階段可能具有較小的等待時間。對于單個識別,識別準(zhǔn)確性有時由于假設(shè)搜索期間的修剪而丟失。具有多個識別能減輕這一限制,因為可以保持大得多的假設(shè)集。此外,和覆蓋許多環(huán)境的單個、通用語法相比,諸如語法這樣的環(huán)境專用約束條件更可能具有關(guān)于來自例如目標(biāo)環(huán)境的發(fā)言的較佳準(zhǔn)確性。因此,來自多個識別的結(jié)果更有可能包含正確的結(jié)果,和單語法、單識別方法相比, 用重新識別或分類器來協(xié)調(diào)多個識別結(jié)果更可能產(chǎn)生正確的結(jié)果。關(guān)于不充足的語法覆蓋,例如,對于單個語法能有多大和/或單個識別中語法能有多大通常有實際的限制(例如,硬件、軟件)。并行地運行多個識別能顯著地提高總的語法覆蓋,因此每個識別可能在不同的軟件進程和/或硬件資源上運行??紤]所公開的體系結(jié)構(gòu)在大規(guī)模語音識別任務(wù)中的應(yīng)用。以下例子通過使用語音搜索任務(wù)作為例子來說明概念,語音搜索任務(wù)可以包括web、本地企業(yè)、個人聯(lián)系人等的開放式搜索。改變和提高對于該解決方案的各部分是可能的。提供了識別語法作為多個較小的且可能重疊的環(huán)境專用語法,每個環(huán)境專用語法覆蓋原始任務(wù)空間的一個特定子集。用于分隔的環(huán)境可以基于子任務(wù)類別(例如企業(yè)名稱相對于電影標(biāo)題)、地理位置(例如,加利福尼亞州的企業(yè)相對于紐約州的企業(yè))、人口發(fā)源地(面向青年的內(nèi)容相對于成年人內(nèi)容)、等等。每個內(nèi)容專用語法可以單獨地構(gòu)建,利用關(guān)于每個環(huán)境的知識、結(jié)構(gòu)和其它可用信息來使來自每個環(huán)境的預(yù)期用戶輸入的成功率最大化?,F(xiàn)在將參考附圖,全部附圖中相同的附圖標(biāo)記用于表示相同的元件。在下面的描述中,為了進行說明,闡述了很多具體細(xì)節(jié)以便提供對本發(fā)明的全面理解。然而,顯而易見, 可以沒有這些具體細(xì)節(jié)的情況下實施各新穎實施例。在其它情況下,以框圖形式示出了公知的結(jié)構(gòu)和設(shè)備以便于描述它們。本發(fā)明將涵蓋落入所要求保護的主題的精神和范圍內(nèi)的所有修改、等效方案和替換方案。圖1示出根據(jù)所公開的體系結(jié)構(gòu)的計算機實現(xiàn)的識別系統(tǒng)100。系統(tǒng)100包括協(xié)調(diào)組件110和環(huán)境專用約束條件104的約束條件組件102,約束條件組件102用于將輸入 106識別處理成識別結(jié)果108,協(xié)調(diào)組件110用于將識別結(jié)果108協(xié)調(diào)到單個識別結(jié)果112中。系統(tǒng)100還可以包括識別組件114,用于在并行路徑中和/或串行地對相應(yīng)的環(huán)境專用約束條件104進行分開的識別處理。例如,環(huán)境專用約束條件104可以包括用于在并行路徑和/或串行路徑中對針對輸入106的語法進行識別處理的語法。環(huán)境專用約束條件104的單獨集合可以包括不連續(xù)的和相交的環(huán)境覆蓋。換言之,一個約束條件集合可以與另一約束條件集合的約束條件有某些重疊。也存在某些約束條件集合不與其它約束條件集合的約束條件相重疊的情況。通過采用基于識別結(jié)果108的動態(tài)合成的語法,協(xié)調(diào)組件110可以使用重新識別來協(xié)調(diào)識別結(jié)果108以生成單個識別結(jié)果112?;蛘?,協(xié)調(diào)組件110可以使用對從識別結(jié)果108提取的分類特征進行操作的統(tǒng)計分類器來協(xié)調(diào)結(jié)果108,以生成單個識別結(jié)果112。協(xié)調(diào)處理還可以處理相關(guān)任務(wù)數(shù)據(jù)以得到單個識別結(jié)果112。相關(guān)任務(wù)數(shù)據(jù)可以包括以下中的至少一個所識別的字符串、發(fā)言級別和子發(fā)言級別置信分?jǐn)?shù)、語音覆蓋、并發(fā)識別間的相對等待時間、環(huán)境的先驗概率、每個識別的相對難度、或者識別結(jié)果間的一致同意。此外,反映任務(wù)的特定要求的多個手工導(dǎo)出的和/或自動導(dǎo)出的規(guī)則可以影響多個識別假設(shè)的協(xié)調(diào)過程。圖2示出采用規(guī)則來確定單個識別結(jié)果112的系統(tǒng)200的替代實施例。系統(tǒng)200 包括環(huán)境專用約束條件104的約束條件組件102、協(xié)調(diào)組件110和識別組件114,其中約束條件組件102用于將輸入106識別處理成識別結(jié)果108、協(xié)調(diào)組件110用于將識別結(jié)果108 協(xié)調(diào)成單個識別結(jié)果112,識別組件114用于在并行路徑中和/或串行地對相應(yīng)的環(huán)境專用約束條件104進行分開的識別處理。提供了規(guī)則組件202來應(yīng)用用于宣告識別結(jié)果108和/或單個識別結(jié)果112(例如最終結(jié)果)中的一個或多個的規(guī)則(例如優(yōu)先級)。例如,可以創(chuàng)建和應(yīng)用一規(guī)則,該規(guī)則確定特定的識別器是否返回具有足夠高置信分?jǐn)?shù)的特定結(jié)果,然后確定該結(jié)果可以被接受作為該相應(yīng)識別器過程或甚至對于單個識別結(jié)果112來說的最終結(jié)果。圖3示出一環(huán)境專用約束條件識別系統(tǒng)300,該系統(tǒng)300采用重新識別且約束條件是用于語音識別的語法。系統(tǒng)300包括并行操作的N個識別一語法對,其中每個對包括一個或多個環(huán)境專用語法和識別器(表示為識別N)。如圖所示,語法是不同的;然而,一個語法和另一個語法間可能有一定重疊,然而這不是必然的。如在現(xiàn)有的識別系統(tǒng)中,系統(tǒng)300 保留單獨的語法(而不是合并到一個大語法中),而不是創(chuàng)建和使用一個大語法,并且對每個語法運行語音發(fā)言輸入302的識別。換言之,發(fā)言輸入302通過產(chǎn)生第一結(jié)果308的第一識別器304和相關(guān)聯(lián)的第一環(huán)境專用語法306來處理,以及通過產(chǎn)生第二結(jié)果314的第二識別器310和相關(guān)聯(lián)的第二環(huán)境專用語法312來處理,依此類推,直到產(chǎn)生N個結(jié)果的期望數(shù)量N個識別器和語法。使用結(jié)果來生成動態(tài)語法316,動態(tài)語法316然后可用于重新識別318以輸出最終識別結(jié)果320。換言之,對于用戶發(fā)言輸入302,針對每一個環(huán)境專用語法來運行單獨識別。這被示出為同時或近似同時地以并行方式出現(xiàn)。每一個并行識別可以采用同種或不同種類的識別器(例如,嵌入式識別器相對網(wǎng)絡(luò)識別器、具有不同聲學(xué)模型的網(wǎng)絡(luò)識別器、等),并且使用相同或不同的識別參數(shù)。一直到最大等待周期,系統(tǒng)300收集所有可用的識別結(jié)果(例如結(jié)果308、結(jié)果314、等),并且通過重新識別來確定最終識別結(jié)果320。構(gòu)造動態(tài)語法316以包括從所有識別結(jié)果導(dǎo)出的競爭項,包括N個最佳識別結(jié)果的識別字符串、解釋和置信分?jǐn)?shù)、和/或識別結(jié)構(gòu)(如果可用)。對于該動態(tài)語法316執(zhí)行原始發(fā)言輸入302的重新識別。重新識別318的結(jié)果,包括置信分?jǐn)?shù),被作為最終識別結(jié)果 320。任選地,規(guī)則組件202可以包括特定優(yōu)先級規(guī)則以便在完成所有識別之前宣布最終識別結(jié)果320,諸如如果特定的識別器返回具有足夠高的置信分?jǐn)?shù)的特定結(jié)果,該結(jié)果可被接受作為最終結(jié)果。任選地,可以提供與任務(wù)相關(guān)的其它域知識322作為到動態(tài)語法的輸入,以便提供更聚集的識別過程。這一知識322可以包括用戶偏好、與發(fā)言中正在說的內(nèi)容相關(guān)的內(nèi)容、硬件/軟件考慮因素、地區(qū)性等等。圖4示出一環(huán)境專用約束條件識別系統(tǒng)400,該系統(tǒng)采用統(tǒng)計分類且約束條件是用于并行語音識別的語法??梢詮乃凶R別結(jié)果(例如結(jié)果308、結(jié)果314等)且可能從和識別任務(wù)相關(guān)的其他域知識322導(dǎo)出多個數(shù)字的和/或分類的特征402。使用統(tǒng)計分類器來確定每個結(jié)果有多少可能反映實際的用戶輸入??梢赃x擇具有最高分類分?jǐn)?shù)的結(jié)果作為最終識別結(jié)果320,分類分?jǐn)?shù)可以被標(biāo)準(zhǔn)化為最終識別置信。系統(tǒng)400包括并行操作的N個識別一語法對,其中每個對包括環(huán)境專用語法(表示為環(huán)境專用語法N)和識別器(表示為識別N)。如前所述,語法是不同的;然而,一個語法和另一個語法間可能有一定重疊,然而這不是必然的。如在現(xiàn)有的識別系統(tǒng)中,系統(tǒng)400 保留單獨的語法(而不是合并到一個大語法中),而不是創(chuàng)建和使用一個大語法,并且對每個語法運行語音發(fā)言輸入302的識別。換言之,發(fā)言輸入302通過產(chǎn)生第一結(jié)果308的第一識別器304和相關(guān)聯(lián)的第一環(huán)境專用語法306來處理,以及通過產(chǎn)生第二結(jié)果314的第二識別器310和相關(guān)聯(lián)的第二環(huán)境專用語法312來處理,依此類推,直到產(chǎn)生N個結(jié)果的期望數(shù)量N個識別器和語法。使用結(jié)果(結(jié)果308、結(jié)果314、...結(jié)果N)來生成特征402,特征402然后被傳遞至用于最終識別結(jié)果320的統(tǒng)計分類404。如前所示和如圖3所述,任選地,規(guī)則組件202可以包括特定優(yōu)先級規(guī)則以便在完成所有識別之前宣布最終識別結(jié)果320,諸如如果特定的識別器返回具有足夠高的置信分?jǐn)?shù)的特定結(jié)果,該結(jié)果可被接受作為最終結(jié)果。任選地,可以提供與任務(wù)相關(guān)的其它域知識 322作為到動態(tài)語法的輸入,以便提供更聚集的識別過程。這一知識322可以包括用戶偏好、與發(fā)言中正在說的內(nèi)容相關(guān)的內(nèi)容、硬件/軟件考慮因素、地區(qū)性等等。注意到這里的描述涵蓋了體系結(jié)構(gòu)在在線接收用戶輸入發(fā)言時如何工作。該解決方案的另一方面是選擇由系統(tǒng)特別是在多個識別結(jié)果的協(xié)調(diào)期間使用的適當(dāng)?shù)脑O(shè)置、特征等等。對于重新識別和統(tǒng)計分類器方法兩者而言,可以使用訓(xùn)練數(shù)據(jù),并且可以采用離線訓(xùn)練過程來選擇最優(yōu)的配置和參數(shù)。
對于重新識別方法而言,也可能任選地執(zhí)行諸如回歸這樣的統(tǒng)計分析,以便向重新識別動態(tài)語法中的路徑分配相對權(quán)重??梢钥刂破渌蛑R322的輸出來影響每一個重新識別過程的動態(tài)語法316。在任一種方法中,可以采用以下特征402中的一個或多個,其中一些特征直接從并行識別結(jié)果獲得,而其它特征從相關(guān)任務(wù)知識導(dǎo)出。特征402可以包括但不限于所識別的字符串、發(fā)言級別和子發(fā)言級別置信分?jǐn)?shù)、語音覆蓋(例如,被假設(shè)為語音的發(fā)言的部分)、識別間的相對等待時間(例如,并行)、環(huán)境的先驗概率(例如,用戶請求企業(yè)名稱相對體育分?jǐn)?shù)的頻繁程度)、每個環(huán)境專用識別的相對難度(例如,在環(huán)境識別準(zhǔn)確性內(nèi),環(huán)境專用語法的混亂)、每個語法的容許性(例如,web搜索語法可以接受各種各樣的查詢)、 以及識別結(jié)果間的一致同意。注意到,單獨的識別過程可以跨諸如服務(wù)器、客戶機或服務(wù)器客戶機的組合這樣的不同的機器而分布。這在分類和重新識別兩種情況下應(yīng)用于并行識別以及串行識別。換言之,所公開的體系結(jié)構(gòu)是一種計算機實現(xiàn)的識別系統(tǒng),該系統(tǒng)包括環(huán)境專用語法的約束條件組件、識別組件和協(xié)調(diào)組件,所述約束條件組件用于將發(fā)言輸入識別處理成識別結(jié)果,識別組件使用環(huán)境專用語法在并行的路徑中使用相應(yīng)的環(huán)境專用語法對發(fā)言輸入進行單獨的識別處理,協(xié)調(diào)組件用于將識別結(jié)果協(xié)調(diào)到最終識別結(jié)果中。協(xié)調(diào)組件采用識別結(jié)果的動態(tài)合成語法,并且使用重新協(xié)調(diào)來協(xié)調(diào)識別結(jié)果以產(chǎn)生最終識別結(jié)果。任選地,協(xié)調(diào)組件通過在重新識別前采用諸如回歸這樣的統(tǒng)計分析來協(xié)調(diào)識別結(jié)果,以確定最終識別結(jié)果?;蛘撸瑓f(xié)調(diào)組件使用對從識別結(jié)果提取的特征進行操作的統(tǒng)計分類來協(xié)調(diào)識別結(jié)果,以產(chǎn)生最終的識別結(jié)果。此外,規(guī)則組件施加了定義最終識別結(jié)果的確定的一個或多個規(guī)則,其它域知識可以影響統(tǒng)計分類協(xié)調(diào)的特征以及用于重新識別協(xié)調(diào)的動態(tài)語法。此處所包括的是一組代表用于執(zhí)行所公開的體系結(jié)構(gòu)的新穎方面的示例性方法的流程圖。盡管出于解釋簡明的目的,此處例如以流圖或流程圖形式示出的一個或多個方法被示出并描述為一系列動作,但是可以理解和明白,各方法不受動作的次序的限制,因為根據(jù)本發(fā)明,某些動作可以按與此處所示并描述的不同的次序和/或與其它動作同時發(fā)生。例如,本領(lǐng)域技術(shù)人員將會明白并理解,方法可被替換地表示為一系列相互關(guān)聯(lián)的狀態(tài)或事件,諸如以狀態(tài)圖的形式。此外,并非在一方法中示出的所有動作都是新穎實現(xiàn)所必需的。圖5示出一種計算機實現(xiàn)的識別方法。在500,接收到用于處理發(fā)言輸入的單獨的環(huán)境專用語法。在502,使用每個路徑的相應(yīng)環(huán)境專用語法在并行路徑中識別發(fā)言輸入。 在504,從每個路徑產(chǎn)生中間識別結(jié)果。在506,將中間識別結(jié)果協(xié)調(diào)至最終識別結(jié)果。圖6示出了圖5的方法的其他方面。在600,使用從識別結(jié)果產(chǎn)生的動態(tài)語法的重新識別來協(xié)調(diào)中間識別結(jié)果。在602,在重新識別對中間識別結(jié)果的協(xié)調(diào)期間輸入其它域知識。在604,施加一個或多個規(guī)則以產(chǎn)生最終識別結(jié)果。在606,在統(tǒng)計分類對中間識別結(jié)果的協(xié)調(diào)期間輸入其它域知識。在608,施加一個或多個規(guī)則以產(chǎn)生最終識別結(jié)果。圖7示出圖5的方法的其它方面。在700,執(zhí)行諸如回歸這樣的統(tǒng)計分析。在所有路徑上并行地實現(xiàn)該分析。在702,在重新識別動態(tài)語法中向每個路徑分配相對權(quán)重。在 704,等待一預(yù)定量的時間,用于產(chǎn)生路徑的中間識別結(jié)果。在706,基于在該時間量內(nèi)產(chǎn)生的中間識別結(jié)果來產(chǎn)生最終識別結(jié)果。如在本申請中所使用的,術(shù)語“組件”和“系統(tǒng)”旨在表示計算機相關(guān)的實體,其可以是硬件、硬件和軟件的組合、軟件、或者執(zhí)行中的軟件。例如,組件可以是,但不僅限于,在處理器上運行的進程、處理器、硬盤驅(qū)動器、多個存儲驅(qū)動器(光學(xué)的、固態(tài)和/或磁存儲介質(zhì))、對象、可執(zhí)行件、運行的線程、程序,和/或計算機。作為說明,在服務(wù)器上運行的應(yīng)用程序和該服務(wù)器兩者都可以是組件。一個或多個組件可以駐留在進程和/或執(zhí)行的線程內(nèi),并且組件可以位于一個計算機上和/或分布在兩個或更多的計算機之間。詞語“示例性”此處可用于表示用作示例、實例或說明。在此被描述為“示例性”的任何方面或設(shè)計并不一定要被解釋為相比其它方面或設(shè)計更優(yōu)選或有利。現(xiàn)在參考圖8,所示是根據(jù)所公開的體系結(jié)構(gòu)的可用于執(zhí)行識別的計算系統(tǒng)800 的框圖。為了提供用于其各方面的附加上下文,圖8及以下討論旨在提供對其中可實現(xiàn)各方面的合適的計算系統(tǒng)800的簡要概括描述。盡管以上描述是在可在一個或多個計算機上運行的計算機可執(zhí)行指令的一般上下文中進行的,但是本領(lǐng)域的技術(shù)人員將認(rèn)識到,新穎實施例也可結(jié)合其它程序模塊和/或作為硬件和軟件的組合來實現(xiàn)。用于實現(xiàn)各方面的計算系統(tǒng)800包括計算機802,其具有處理單元804、系統(tǒng)存儲器806、以及系統(tǒng)總線808。處理單元804可以是各種市場上可買到的處理器中的任一種,諸如單處理器、多處理器、單核單元以及多核單元等。此外,本領(lǐng)域的技術(shù)人員將明白,各新穎方法可用其它計算機系統(tǒng)配置來實施,包括小型計算機、大型計算機、以及個人計算機(例如、臺式、膝上型等)、手持式計算設(shè)備、基于微處理器的或可編程消費電子產(chǎn)品等,其每一個都可在操作上耦合到一個或多個相關(guān)聯(lián)的設(shè)備。系統(tǒng)存儲器806可以包括易失性(VOL)存儲器810 (例如,隨機存取存儲器(RAM)) 和非易失性存儲器(NON-VOL)812(例如ROM、EPROM、EEPROM等)?;据斎?輸出系統(tǒng) (BIOS)可以被存儲在非易失性存儲器812中,并且包括諸如在啟動期間便于在計算機802 內(nèi)的組件之間傳遞數(shù)據(jù)和信號的基本例程。易失性存儲器810還可以包括諸如靜態(tài)RAM等高速RAM來用于高速緩存數(shù)據(jù)。系統(tǒng)總線808提供了用于包括,但不限于存儲器子系統(tǒng)806的系統(tǒng)組件到處理單元804的接口。系統(tǒng)總線808可以是若干種總線結(jié)構(gòu)中的任一種,這些總線結(jié)構(gòu)還可使用各類可購買到的總線體系結(jié)構(gòu)中的任一種互連到存儲器總線(帶有或沒有存儲器控制器) 以及外圍總線(例如,PCI, PCIe, AGP, LPC等)。計算機802還包括存儲子系統(tǒng)814以及用于將存儲子系統(tǒng)814接口到系統(tǒng)總線 808和其它所需計算機組件的存儲接口 816。存儲子系統(tǒng)814可以包括例如硬盤驅(qū)動器 (HDD)、磁軟盤驅(qū)動器(FDD)和/或光盤存儲驅(qū)動器(例如,⑶-ROM驅(qū)動器、DVD驅(qū)動器)中的一種或多種。存儲接口 816可以包括諸如例如EIDE、ATA、SATA和IEEE 1394等接口技術(shù)。—個或多個程序和數(shù)據(jù)可以被存儲在存儲器子系統(tǒng)806、可移動存儲器子系統(tǒng) 818(例如,閃存驅(qū)動器形狀因子技術(shù))和/或存儲子系統(tǒng)814(例如,光、磁、固態(tài))中,包括操作系統(tǒng)820、一個或多個應(yīng)用程序822、其它程序模塊824以及程序數(shù)據(jù)826。一個或多個應(yīng)用程序822、其他程序模塊擬4以及程序數(shù)據(jù)擬6可包括例如圖1的系統(tǒng)100的組件、實體和結(jié)果、圖2的系統(tǒng)200的組件、實體和結(jié)果、圖3的系統(tǒng)300的組件、實體和結(jié)果、圖4的系統(tǒng)400的組件、實體和結(jié)果、以及圖5-7的方法和附加方法。一般而言,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、方法、數(shù)據(jù)結(jié)構(gòu)、其它軟件組件等。操作系統(tǒng)820、應(yīng)用程序822、模塊擬4和/或數(shù)據(jù)826的全部或部分也可以被高速緩存在諸如易失性存儲器810等存儲器中。應(yīng)當(dāng)明白,所公開的體系結(jié)構(gòu)可以用各種市場上可購得的操作系統(tǒng)或操作系統(tǒng)的組合(例如,作為虛擬機)來實現(xiàn)。存儲子系統(tǒng)814和存儲器子系統(tǒng)(806和818)用作用于數(shù)據(jù)、數(shù)據(jù)結(jié)構(gòu)、計算機可執(zhí)行指令等的易失性和非易失性存儲的計算機可讀介質(zhì)。計算機可讀介質(zhì)可以是可由計算機802訪問的任何可用介質(zhì),且包括易失性和非易失性介質(zhì)、可移動和不可移動介質(zhì)。對于計算機802,介質(zhì)容納任何適當(dāng)?shù)臄?shù)字格式的數(shù)據(jù)的存儲。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)明白,可以使用其它類型的計算機可讀介質(zhì),諸如zip驅(qū)動器、磁帶、閃存卡、磁帶盒等,來存儲用于執(zhí)行所公開的體系結(jié)構(gòu)的新穎方法的計算機可執(zhí)行指令。用戶可以使用諸如鍵盤和鼠標(biāo)等外部用戶輸入設(shè)備828來與計算機802、程序和數(shù)據(jù)交互。其它外部用戶輸入設(shè)備擬8可以包括話筒、IR(紅外)遙控器、操縱桿、游戲手柄、照相機識別系統(tǒng)、指示筆、觸摸屏、姿勢系統(tǒng)(例如,眼移動、頭移動等)和/或類似物。 在計算機802是例如便攜式計算機的情況下,用戶可以使用諸如觸摸墊、話筒、鍵盤等板載用戶輸入設(shè)備830來與計算機802、程序和數(shù)據(jù)交互。這些和其它輸入設(shè)備通過輸入/輸出 (I/O)設(shè)備接口 832經(jīng)由系統(tǒng)總線808連接到處理單元804,但也可通過其它接口連接,如并行端口、IEEE 1394串行端口、游戲端口、USB端口、IR接口等。I/O設(shè)備接口 832也便于輸出外圍設(shè)備834的使用,如打印機、音頻設(shè)備、攝像設(shè)備等,如聲卡和/或板載音頻處理能力。一個或多個圖形接口 836(通常也稱為圖形處理單元(GPU))提供計算機802和外部顯示器838(例如,LCD、等離子)和/或板載顯示器840(例如,對于便攜式計算機)之間的圖形和視頻信號。圖形接口 836也可作為計算機系統(tǒng)板的一部分來制造。計算機802可以使用經(jīng)由有線/無線通信子系統(tǒng)842到一個或多個網(wǎng)絡(luò)和/或其它計算機的邏輯連接在聯(lián)網(wǎng)環(huán)境(例如,IP)中操作。其它計算機可以包括工作站、服務(wù)器、 路由器、個人計算機、基于微處理器的娛樂設(shè)備、對等設(shè)備或其它常見的網(wǎng)絡(luò)節(jié)點,并且通常包括以上相對于計算機802描述的許多或所有元素。邏輯連接可以包括到局域網(wǎng)(LAN)、 廣域網(wǎng)(WAN)、熱點等的有線/無線連接。LAN和WAN聯(lián)網(wǎng)環(huán)境常見于辦公室和公司,并且方便了諸如內(nèi)聯(lián)網(wǎng)等企業(yè)范圍計算機網(wǎng)絡(luò),所有這些都可連接到諸如因特網(wǎng)等全球通信網(wǎng)絡(luò)。當(dāng)在聯(lián)網(wǎng)環(huán)境中使用時,計算機802經(jīng)由有線/無線通信子系統(tǒng)842(例如,網(wǎng)絡(luò)接口適配器、板載收發(fā)機子系統(tǒng)等)連接到網(wǎng)絡(luò)來與有線/無線網(wǎng)絡(luò)、有線/無線打印機、 有線/無線輸入設(shè)備844等通信。計算機802可以包括用于通過網(wǎng)絡(luò)建立通信的調(diào)制解調(diào)器或其它裝置。在聯(lián)網(wǎng)環(huán)境中,相對于計算機802的程序和數(shù)據(jù)可以被存儲在遠(yuǎn)程存儲器/ 存儲設(shè)備中,如與分布式系統(tǒng)相關(guān)聯(lián)。應(yīng)當(dāng)明白,所示網(wǎng)絡(luò)連接是說明性的,并且可以使用在計算機之間建立通信鏈路的其它手段。計算機802可以用于使用諸如IEEE 802. xx標(biāo)準(zhǔn)家族等無線電技術(shù)來與有線/ 無線設(shè)備或?qū)嶓w通信,例如在操作上安置在與例如打印機、掃描儀、臺式和/或便攜式計算機、個人數(shù)字助理(PDA)、通信衛(wèi)星、任何一件與無線可檢測標(biāo)簽相關(guān)聯(lián)的設(shè)備或位置(例如,電話亭、報亭、休息室)以及電話的無線通信(例如,IEEE 802. 11空中調(diào)制技術(shù))中的無線設(shè)備。這至少包括用于熱點的Wi-Fi (即無線保真)、WiMax和藍(lán)牙 無線技術(shù)。由此,通信可以是如對于常規(guī)網(wǎng)絡(luò)那樣的預(yù)定義結(jié)構(gòu),或者僅僅是至少兩個設(shè)備之間的自組織(ad hoc)通信。Wi-Fi網(wǎng)絡(luò)使用稱為IEEE 802. llx(a、b、g等等)的無線電技術(shù)來提供安全、可靠、快速的無線連接。Wi-Fi網(wǎng)絡(luò)可以用于將計算機彼此連接、連接到因特網(wǎng)以及連接到有線網(wǎng)絡(luò)(使用IEEE 802. 3相關(guān)介質(zhì)和功能)?,F(xiàn)在參考圖9,示出了根據(jù)所公開的體系結(jié)構(gòu)提供并行識別的計算環(huán)境900的示意性框圖。環(huán)境900包括一個或多個客戶機902??蛻魴C902可以是硬件和/或軟件(例如,線程、進程、計算設(shè)備)。例如,客戶機902可以容納cookie和/或相關(guān)聯(lián)的上下文信肩、ο環(huán)境900還包括一個或多個服務(wù)器904。服務(wù)器904也可以是硬件和/或軟件(例如,線程、進程、計算設(shè)備)。服務(wù)器904可以例如通過使用本體系結(jié)構(gòu)來容納線程以執(zhí)行變換??蛻魴C902和服務(wù)器904之間的一種可能的通信可以是以適用于在兩個或更多計算機進程之間傳輸?shù)臄?shù)據(jù)包的形式。例如,數(shù)據(jù)包可以包括cookie和/或相關(guān)聯(lián)的上下文信息。環(huán)境900包括可以用來促進客戶機902和服務(wù)器904之間通信的通信框架906 (例如, 諸如因特網(wǎng)等全球通信網(wǎng)絡(luò))。通信可以經(jīng)由有線(包括光纖)和/或無線技術(shù)來促進??蛻魴C902可操作地連接到一個或多個客戶機數(shù)據(jù)存儲908,可以使用這些客戶機數(shù)據(jù)存儲來存儲客戶機902本地的信息(例如,cookie和/或相關(guān)聯(lián)的上下文信息)。同樣地,服務(wù)器904可以在操作上連接到可以用來存儲服務(wù)器904本地的信息的一個或多個服務(wù)器數(shù)據(jù)存儲910??蛻魴C902可以包括一個客戶機,經(jīng)由該客戶機接收到語音信號,用于由服務(wù)器 904或其它客戶機902進行識別處理。語法可以被存儲在客戶機數(shù)據(jù)存儲908和/或服務(wù)器數(shù)據(jù)存儲910中。以上描述的包括所公開的體系結(jié)構(gòu)的各示例。當(dāng)然,描述每一個可以想到的組件和/或方法的組合是不可能的,但本領(lǐng)域內(nèi)的普通技術(shù)人員可以認(rèn)識到,許多其它組合和排列都是可能的。因此,該新穎體系結(jié)構(gòu)旨在涵蓋所有這些落入所附權(quán)利要求書的精神和范圍內(nèi)的更改、修改和變化。此外,就在詳細(xì)描述或權(quán)利要求書中使用術(shù)語“包括”而言,這一術(shù)語旨在以與術(shù)語“包含”在被用作權(quán)利要求書中的過渡詞時所解釋的相似的方式為包含性的。
權(quán)利要求
1.一種計算機實現(xiàn)的識別系統(tǒng)(100),包括環(huán)境專用約束條件的約束條件組件(102),用于將輸入識別處理成識別結(jié)果;以及協(xié)調(diào)組件(110),用于將所述識別結(jié)果協(xié)調(diào)成單個識別結(jié)果。
2.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述約束條件包括用于在并行路徑中對輸入進行識別處理的語法。
3.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述協(xié)調(diào)組件使用重新識別來協(xié)調(diào)所述結(jié)果以產(chǎn)生單個識別結(jié)果。
4.如權(quán)利要求3所述的系統(tǒng),其特征在于,所述重新識別采用基于識別結(jié)果的動態(tài)合成的語法。
5.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述協(xié)調(diào)組件使用統(tǒng)計分類器來協(xié)調(diào)所述結(jié)果,所述統(tǒng)計分類器對從識別結(jié)果提取的分類特征進行操作以產(chǎn)生單個識別結(jié)果。
6.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述環(huán)境專用約束條件包括不連續(xù)的和相交的環(huán)境覆蓋。
7.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述識別處理處理相關(guān)的任務(wù)數(shù)據(jù)以得到單個識別結(jié)果,所述相關(guān)任務(wù)數(shù)據(jù)包括以下中的至少一個所識別的字符串、發(fā)言級別和子發(fā)言級別置信分?jǐn)?shù)、語音覆蓋、并行識別間的相對等待時間、環(huán)境的先驗概率、每個識別的相對難度、或識別結(jié)果間的一致同意。
8.如權(quán)利要求1所述的系統(tǒng),還包括一識別組件,用于在每一個并行路徑中使用相應(yīng)的環(huán)境專用約束條件來對輸入進行單獨的識別處理。
9.如權(quán)利要求1所述的系統(tǒng),還包括一規(guī)則組件,用于施加定義了單個識別結(jié)果的確定的一個或多個規(guī)則。
10.一種計算機實現(xiàn)的識別方法,包括接收用于處理發(fā)言輸入的單獨的環(huán)境專用語法(500); 使用每個路徑的相應(yīng)環(huán)境專用語法在各并行路徑中識別發(fā)言輸入(502); 從每個路徑產(chǎn)生中間識別結(jié)果(504);以及將中間識別結(jié)果協(xié)調(diào)成最終識別結(jié)果(506)。
11.如權(quán)利要求10所述的方法,還包括使用從識別結(jié)果產(chǎn)生的動態(tài)語法的重新識別來協(xié)調(diào)中間識別結(jié)果。
12.根據(jù)權(quán)利要求10所述的方法,其特征在于,還包括在由重新識別對中間識別結(jié)果的協(xié)調(diào)期間輸入其它域知識;以及施加一個或多個規(guī)則以產(chǎn)生最終識別結(jié)果。
13.根據(jù)權(quán)利要求10所述的方法,其特征在于,還包括在由統(tǒng)計分類對中間識別結(jié)果的協(xié)調(diào)期間輸入其它域知識;以及施加一個或多個規(guī)則以產(chǎn)生最終識別結(jié)果。
14.根據(jù)權(quán)利要求10所述的方法,其特征在于,還包括 執(zhí)行統(tǒng)計分析;以及在重新識別動態(tài)語法中向每個路徑分配相對權(quán)重。
15.根據(jù)權(quán)利要求10所述的方法,其特征在于,還包括 等待一預(yù)定量的時間,用于產(chǎn)生路徑的中間識別結(jié)果;以及基于在該時間量內(nèi)產(chǎn)生的中間識別結(jié)果來產(chǎn)生最終識別結(jié)果。
全文摘要
描述了采用總體語法作為用于識別輸入的一組環(huán)境專用語法的體系結(jié)構(gòu),每個環(huán)境專用語法負(fù)責(zé)一個特定的環(huán)境,諸如子任務(wù)類別、地理區(qū)域等等。這些語法一起覆蓋了整個域。此外,對于同一個輸入可以并行地運行多個識別,其中每個識別使用環(huán)境專用語法中的一個或多個。通過使用基于多個識別結(jié)果以及可能其它域知識的動態(tài)合成語法、或者使用對從多個識別結(jié)果及其他域知識提取的分類特征進行操作的統(tǒng)計分類器來選擇獲勝者,來自不同識別器語法的多個中間識別結(jié)果得以被協(xié)調(diào)。
文檔編號G06F17/27GK102460423SQ201080025833
公開日2012年5月16日 申請日期2010年6月1日 優(yōu)先權(quán)日2009年6月4日
發(fā)明者B·邦休, M·萊維特, 常雙羽 申請人:微軟公司