本技術(shù)領(lǐng)域大體上涉及語(yǔ)音系統(tǒng),并且更具體地涉及用于對(duì)接語(yǔ)音系統(tǒng)的語(yǔ)音對(duì)話框與新應(yīng)用程序的方法和系統(tǒng)。
背景技術(shù):
通常,語(yǔ)音系統(tǒng)執(zhí)行對(duì)用戶或多個(gè)用戶發(fā)聲的語(yǔ)音的語(yǔ)音識(shí)別或理解。語(yǔ)音發(fā)聲通常包括與關(guān)聯(lián)于語(yǔ)音識(shí)別系統(tǒng)的系統(tǒng)或多個(gè)系統(tǒng)通信或控制該系統(tǒng)或多個(gè)系統(tǒng)的一或多個(gè)特征的命令。響應(yīng)于語(yǔ)音發(fā)聲,語(yǔ)音系統(tǒng)通常提供對(duì)話框。對(duì)話框可以包括基于系統(tǒng)和/或系統(tǒng)的應(yīng)用程序預(yù)定義的響應(yīng),該應(yīng)用程序與語(yǔ)音發(fā)聲相關(guān)聯(lián)。
在某些實(shí)例中,與語(yǔ)音識(shí)別系統(tǒng)相關(guān)聯(lián)的系統(tǒng)可以包括語(yǔ)音系統(tǒng)未知的一個(gè)或多個(gè)應(yīng)用程序。在這樣的情況中,常規(guī)的語(yǔ)音系統(tǒng)無法對(duì)這樣的未知應(yīng)用程序提供對(duì)話框,因?yàn)檫@些應(yīng)用程序的內(nèi)容是未知的。
因此,期望提供用于使語(yǔ)音系統(tǒng)與對(duì)于語(yǔ)音系統(tǒng)而言較新的應(yīng)用程序?qū)拥姆椒ê拖到y(tǒng)。另外,從結(jié)合附圖和前文技術(shù)領(lǐng)域和背景技術(shù)取得的后續(xù)詳細(xì)描述和所附權(quán)利要求中將更清楚地明白本發(fā)明的其它期望特征和特性。
技術(shù)實(shí)現(xiàn)要素:
提供了對(duì)接語(yǔ)音系統(tǒng)與新應(yīng)用程序的方法和系統(tǒng)。在一個(gè)實(shí)施例中,一種方法包括:維護(hù)注冊(cè)數(shù)據(jù)數(shù)據(jù)庫(kù),其存儲(chǔ)來自新應(yīng)用程序和一個(gè)或多個(gè)其它應(yīng)用程序的注冊(cè)數(shù)據(jù);在與語(yǔ)音系統(tǒng)相關(guān)聯(lián)的路由器模塊處接收來自語(yǔ)音識(shí)別模塊的結(jié)果;由路由器模塊處理該結(jié)果和注冊(cè)數(shù)據(jù)以確定可能的新應(yīng)用程序;以及提供可能的新應(yīng)用程序至語(yǔ)音系統(tǒng)。
在一個(gè)實(shí)施例中,語(yǔ)音系統(tǒng)包括注冊(cè)模塊,其接收來自新應(yīng)用程序和車輛的一個(gè)或多個(gè)子系統(tǒng)的一個(gè)或多個(gè)其它應(yīng)用程序的注冊(cè)數(shù)據(jù)并且將該注冊(cè)數(shù)據(jù)存儲(chǔ)在注冊(cè)數(shù)據(jù)數(shù)據(jù)庫(kù)中。語(yǔ)音系統(tǒng)進(jìn)一步包括路由器模塊,該路由器模塊由處理器處理語(yǔ)音識(shí)別的結(jié)果和注冊(cè)數(shù)據(jù)數(shù)據(jù)庫(kù)的注冊(cè)數(shù)據(jù)以確定可能的新應(yīng)用程序并且由處理器提供可能的新應(yīng)用程序至語(yǔ)音系統(tǒng)。
附圖說明
下文將結(jié)合以下附圖描述示例性實(shí)施例,其中相同標(biāo)號(hào)標(biāo)示相同元件,且其中:
圖1是根據(jù)各種示例性實(shí)施例的包括語(yǔ)音系統(tǒng)的車輛的功能框圖;
圖2是根據(jù)各種示例性實(shí)施例的說明語(yǔ)音系統(tǒng)的路由器模塊的數(shù)據(jù)流圖;以及
圖3至5是根據(jù)各種示例性實(shí)施例的說明可以由語(yǔ)音系統(tǒng)執(zhí)行的語(yǔ)音方法的序列圖。
具體實(shí)施方式
以下詳述的本質(zhì)僅僅是示例性的并且不旨在限制應(yīng)用和用途。另外,不存在被任何前述的技術(shù)領(lǐng)域、背景、發(fā)明內(nèi)容或者以下詳描中呈現(xiàn)的任何表述的或暗示的理論約束的意圖。如本文所使用,術(shù)語(yǔ)模塊是指專用集成電路(ASIC)、電子電路、處理器(共享、專用或分組)和執(zhí)行一個(gè)或多個(gè)軟件或固件程序的存儲(chǔ)器、組合邏輯電路和/或提供所述功能性的其它合適部件。
現(xiàn)在參考圖1,根據(jù)本發(fā)明的示例性實(shí)施例,示出了包括車輛12內(nèi)的語(yǔ)音系統(tǒng)10。語(yǔ)音系統(tǒng)10提供用于車輛12的各種子系統(tǒng)或與車輛12相關(guān)聯(lián)的系統(tǒng)的語(yǔ)音識(shí)別能力。如可明白的是,車輛12僅僅是示例性系統(tǒng),因?yàn)楸景l(fā)明的語(yǔ)音系統(tǒng)10可與任何語(yǔ)音相依系統(tǒng)相關(guān)聯(lián)并且不限于當(dāng)前車輛實(shí)例。
在圖1的實(shí)例中,語(yǔ)音系統(tǒng)10提供由用戶(例如,駕駛員或其它用戶)發(fā)聲的語(yǔ)音發(fā)聲13的語(yǔ)音識(shí)別和/或通過人機(jī)接口(HMI)模塊14提供語(yǔ)音對(duì)話框15至用戶。語(yǔ)音系統(tǒng)10與一個(gè)或多個(gè)子系統(tǒng)通信,該子系統(tǒng)是車輛12的部分或通過HMI模塊14與車輛12相關(guān)聯(lián)。這樣的子系統(tǒng)可以包括(例如但不限于)電話系統(tǒng)16、導(dǎo)航系統(tǒng)18、媒體系統(tǒng)20、遠(yuǎn)程信息處理系統(tǒng)22、網(wǎng)絡(luò)系統(tǒng)24或可以是車輛12的部分或與車輛12相關(guān)聯(lián)的任何其它系統(tǒng)。
子系統(tǒng)16至24可以各自包括一個(gè)或多個(gè)應(yīng)用程序25。應(yīng)用程序25可以為語(yǔ)音系統(tǒng)10所已知或未知。應(yīng)用程序25包括設(shè)計(jì)成允許用戶或系統(tǒng)執(zhí)行一組協(xié)調(diào)功能、任務(wù)或活動(dòng)的軟件。在某些實(shí)例中,該功能、任務(wù)或活動(dòng)與子系統(tǒng)16至24有關(guān);且在某些實(shí)例中,該功能、任務(wù)或活動(dòng)與其它子系統(tǒng)有關(guān)。例如,電話系統(tǒng)16可以包括由電話系統(tǒng)16的電話提供的各種應(yīng)用程序;且導(dǎo)航系統(tǒng)18可以包括由導(dǎo)航系統(tǒng)提供的各種導(dǎo)航應(yīng)用程序;等等。
在各種實(shí)施例中,語(yǔ)音系統(tǒng)10通過通信總線和/或其它通信裝置26(例如,有線、短程無線或遠(yuǎn)程無線)與HMI模塊14和/或多個(gè)子系統(tǒng)16至24通信。通信總線可為(例如但不限于)控制器區(qū)域網(wǎng)(CAN)總線、本地互聯(lián)網(wǎng)絡(luò)(LIN)總線或任何其它類型的總線。
在各種實(shí)施例中,語(yǔ)音系統(tǒng)10包括語(yǔ)音識(shí)別模塊32、對(duì)話框管理器模塊34、注冊(cè)模塊36、路由器模塊38和注冊(cè)數(shù)據(jù)數(shù)據(jù)庫(kù)40。如可明白,如所示,語(yǔ)音識(shí)別模塊32、對(duì)話框管理器模塊34、注冊(cè)模塊36和路由器模塊38可以實(shí)施為單獨(dú)系統(tǒng)、組合系統(tǒng)和/或單個(gè)系統(tǒng)。一般來說,語(yǔ)音識(shí)別模塊32接收來自HMI模塊14的語(yǔ)音發(fā)聲13并且使用一種或多種語(yǔ)音識(shí)別技術(shù)和一種或多種定義語(yǔ)法來處理語(yǔ)音發(fā)聲13。語(yǔ)音識(shí)別模塊32基于處理產(chǎn)生可能識(shí)別的語(yǔ)音的結(jié)果。對(duì)話框管理器模塊34管理交互序列和基于識(shí)別結(jié)果對(duì)通過對(duì)話框15呈現(xiàn)于用戶的語(yǔ)音提示的選擇。
注冊(cè)模塊36收集來自子系統(tǒng)16至24的各種應(yīng)用程序25的注冊(cè)數(shù)據(jù)并且將注冊(cè)數(shù)據(jù)存儲(chǔ)在注冊(cè)數(shù)據(jù)數(shù)據(jù)庫(kù)40(例如,臨時(shí)或永久數(shù)據(jù)庫(kù))中。注冊(cè)數(shù)據(jù)包括(但不限于)應(yīng)用程序的名稱、由應(yīng)用程序支持的概念和與概念相關(guān)聯(lián)的值。如可明白,注冊(cè)程序可發(fā)生在已調(diào)度事件(例如,車輛12的通電、每隔多天或其它事件)和/或引入新應(yīng)用程序至車輛12的任何時(shí)間處。
路由器模塊38收集來自注冊(cè)數(shù)據(jù)數(shù)據(jù)庫(kù)40的注冊(cè)數(shù)據(jù)并且利用信息選擇性地更新語(yǔ)音識(shí)別模塊32和/或?qū)υ捒蚬芾砥髂K34使得可對(duì)全部應(yīng)用程序25執(zhí)行語(yǔ)音識(shí)別和對(duì)話框管理。信息可包括(例如但不限于)語(yǔ)法或時(shí)隙、一個(gè)或多個(gè)應(yīng)用程序、一個(gè)或多個(gè)子系統(tǒng)和/或一個(gè)或多個(gè)對(duì)話框提示。通過結(jié)合注冊(cè)模塊36和路由器模塊38至語(yǔ)音系統(tǒng)10中,語(yǔ)音系統(tǒng)10能夠容納任何未知的應(yīng)用程序(例如,最近添加的應(yīng)用程序或啟動(dòng)時(shí)未知的應(yīng)用程序)。
現(xiàn)在參考圖2且繼續(xù)參考圖1,數(shù)據(jù)流圖更詳細(xì)地說明根據(jù)各種示例性實(shí)施例的路由器模塊38。如可明白,根據(jù)本發(fā)明的路由器模塊38的各種示例性實(shí)施例可以包括任何數(shù)量的子模塊。如可進(jìn)一步明白,圖2中所示的子模塊可以組合和/或進(jìn)一步分割以類似地提供用于使應(yīng)用程序25對(duì)接至語(yǔ)音系統(tǒng)10的接口。在各種示例性實(shí)施例中,路由器模塊38包括接口模塊44、分類器模塊46、用戶模型模塊48和系統(tǒng)狀態(tài)模塊50。
接口模塊44根據(jù)定義的通信系統(tǒng)以與語(yǔ)音識(shí)別模塊32和對(duì)話框管理器模塊34對(duì)接。例如,接口模塊44傳送時(shí)隙52至對(duì)話框管理器模塊34或語(yǔ)音識(shí)別模塊32。時(shí)隙52是可由系統(tǒng)識(shí)別的概念或值。語(yǔ)音識(shí)別模塊32和/或?qū)υ捒蚬芾砥髂K34可標(biāo)記時(shí)隙52。
在另一個(gè)實(shí)例中,接口模塊44接收來自對(duì)話框管理器模塊34的第一佳結(jié)果54(或一個(gè)或多個(gè)識(shí)別結(jié)果的列表)。第一佳結(jié)果54指示語(yǔ)音識(shí)別的第一佳結(jié)果。第一佳結(jié)果54(或一個(gè)或多個(gè)識(shí)別結(jié)果的列表)包括基于時(shí)隙52標(biāo)記的已標(biāo)記時(shí)隙。對(duì)話框管理器模塊34基于已標(biāo)記時(shí)隙的識(shí)別傳輸?shù)谝患呀Y(jié)果54。
在又另一個(gè)實(shí)例中,接口模塊44將可能的應(yīng)用程序或多個(gè)應(yīng)用程序56、與應(yīng)用程序相關(guān)聯(lián)的子系統(tǒng)58以及語(yǔ)音提示60返回提供至對(duì)話框管理器模塊34?;诘谝患呀Y(jié)果54中的已標(biāo)記時(shí)隙以及如下文將更詳細(xì)討論的注冊(cè)數(shù)據(jù)來確定可能的應(yīng)用程序或多個(gè)應(yīng)用程序56、與應(yīng)用程序相關(guān)聯(lián)的子系統(tǒng)58以及語(yǔ)音提示60。
系統(tǒng)狀態(tài)模塊50接收來自各種子系統(tǒng)16至24或車輛12的其它子系統(tǒng)的系統(tǒng)數(shù)據(jù)62作為輸入。系統(tǒng)數(shù)據(jù)62可以指示子系統(tǒng)的狀態(tài)和/或車輛12的狀態(tài)。系統(tǒng)狀態(tài)模塊50處理系統(tǒng)數(shù)據(jù)62以確定系統(tǒng)狀態(tài)63并且將系統(tǒng)狀態(tài)63存儲(chǔ)在系統(tǒng)數(shù)據(jù)庫(kù)43中。例如,系統(tǒng)數(shù)據(jù)62可指示系統(tǒng)在線或當(dāng)前位置、當(dāng)前時(shí)間等,且系統(tǒng)狀態(tài)63可為與一個(gè)或多個(gè)數(shù)據(jù)相關(guān)聯(lián)的狀態(tài)。系統(tǒng)狀態(tài)模塊50提供系統(tǒng)狀態(tài)63至分類器模塊46。
分類器模塊46接收來自接口模塊44的第一佳結(jié)果54作為輸入。分類器模塊46處理第一佳結(jié)果54以處理可能的應(yīng)用程序或多個(gè)應(yīng)用程序56、與應(yīng)用程序56相關(guān)聯(lián)的子系統(tǒng)58以及語(yǔ)音提示60。例如,分類器模塊46接收系統(tǒng)狀態(tài)63并且檢索與存儲(chǔ)在注冊(cè)數(shù)據(jù)數(shù)據(jù)庫(kù)40中的已注冊(cè)應(yīng)用程序相關(guān)聯(lián)的注冊(cè)數(shù)據(jù)64。分類器模塊46的概念基于注冊(cè)數(shù)據(jù)64的概念和/或值計(jì)算第一佳結(jié)果54的已標(biāo)記時(shí)隙中的最大似然概率。分類器模塊46接著從用戶模型數(shù)據(jù)庫(kù)42(如果可用)中檢索用戶模型并且計(jì)算先驗(yàn)概率。分類器模塊46接著使用最大似然概率和先驗(yàn)概率(例如通過將它們相乘)計(jì)算最終概率。此后,分類器模塊46基于最終概率計(jì)算可能的應(yīng)用程序或多個(gè)應(yīng)用程序56、與應(yīng)用程序56相關(guān)聯(lián)的子系統(tǒng)58以及語(yǔ)音提示60。例如,選擇具有最高概率的應(yīng)用程序和相關(guān)子系統(tǒng)且從該應(yīng)用程序的注冊(cè)數(shù)據(jù)確定語(yǔ)音提示。
用戶模型模塊48接收用戶選擇數(shù)據(jù)66作為輸入。用戶選擇數(shù)據(jù)66指示由用戶通過對(duì)話框選擇的應(yīng)用程序25和/或子系統(tǒng)16至24。用戶模型模塊48基于用戶選擇數(shù)據(jù)66更新存儲(chǔ)在用戶模型數(shù)據(jù)庫(kù)42中的用戶模型。用戶模型可以與車輛12的特定用戶或一般地車輛12的任何用戶相關(guān)聯(lián)。
現(xiàn)在參考圖3、4和5且繼續(xù)參考圖1和2,序列圖說明根據(jù)各種示例性實(shí)施例的可以由語(yǔ)音系統(tǒng)10執(zhí)行的方法。如可根據(jù)本發(fā)明而明白,方法內(nèi)的操作次序不限于如圖3、4和5中所說明的循序執(zhí)行,反而可以適用且根據(jù)本發(fā)明的一個(gè)或多個(gè)不同次序執(zhí)行。如可進(jìn)一步明白,在不更改該方法的精神的情況下可以添加或刪除系統(tǒng)的一個(gè)或多個(gè)步驟。
圖3和4說明了由語(yǔ)音系統(tǒng)10與應(yīng)用程序25對(duì)接的方法。例如,圖3說明可以由語(yǔ)音系統(tǒng)10執(zhí)行的初始化方法99;且圖4說明可以由語(yǔ)音系統(tǒng)10執(zhí)行的執(zhí)行方法114。
如圖3中所示,在各種實(shí)施例中,初始化方法可以開始于100處,其中系統(tǒng)10將路由器模塊38初始化。作為響應(yīng),路由器模塊38在102處發(fā)送數(shù)據(jù)請(qǐng)求至系統(tǒng)10。作為響應(yīng),系統(tǒng)10在104處提供由路由器模塊38存儲(chǔ)的系統(tǒng)數(shù)據(jù)。路由器模塊38在106處產(chǎn)生對(duì)新應(yīng)用程序25的數(shù)據(jù)請(qǐng)求。作為響應(yīng),新應(yīng)用程序25在108處產(chǎn)生由注冊(cè)模塊36接收并且存儲(chǔ)的注冊(cè)數(shù)據(jù)?;谧?cè)數(shù)據(jù)(例如,概念和概念的值),路由器模塊38在110處產(chǎn)生包括要標(biāo)記的時(shí)隙的語(yǔ)法并且發(fā)送語(yǔ)法和時(shí)隙至語(yǔ)音識(shí)別模塊32(和/或?qū)υ捒蚬芾砥髂K34)。語(yǔ)音識(shí)別模塊32在112處接受并且存儲(chǔ)語(yǔ)法和時(shí)隙并且對(duì)系統(tǒng)10給出控制。此后,完成初始化。
如圖4中所示,在115處,用戶70通過啟動(dòng)系統(tǒng)10(例如,通過按下對(duì)話按鈕或其它特征)激活語(yǔ)音。作為響應(yīng),系統(tǒng)10在116處通知對(duì)話框管理器模塊34啟動(dòng)對(duì)話框。在118處,對(duì)話框管理器模塊34產(chǎn)生呈現(xiàn)于用戶70的提示。作為響應(yīng),用戶70在120處發(fā)聲,且語(yǔ)音識(shí)別模塊32接收到發(fā)聲。在122處,對(duì)語(yǔ)音執(zhí)行語(yǔ)音識(shí)別且提供第N佳列表至對(duì)話框管理器模塊34。在124處,從第N佳列表(第一佳結(jié)果54)中選擇一個(gè)(或多個(gè))結(jié)果,且基于已標(biāo)記的時(shí)隙向路由器模塊38呈現(xiàn)該一個(gè)(或多個(gè))結(jié)果。在126處,路由器模塊38基于已標(biāo)記的時(shí)隙評(píng)估第一佳結(jié)果54并且將可能的應(yīng)用程序或多個(gè)應(yīng)用程序56、與應(yīng)用程序56相關(guān)聯(lián)的子系統(tǒng)58以及語(yǔ)音提示60返回提供至對(duì)話框管理器模塊34。在128處向用戶70呈現(xiàn)語(yǔ)音提示,且在用戶70與對(duì)話框管理器模塊34之間執(zhí)行任何歧義消除。選用地,如果拒絕第一佳結(jié)果54,那么該方法可以返回至130處繼續(xù)進(jìn)行,其中由對(duì)話框管理器模塊34產(chǎn)生新提示。
然而,如果選擇第一佳結(jié)果54,那么在132處發(fā)送更新用戶模型的通知至路由器模塊38。此后,控制在134處返回至系統(tǒng)10。
現(xiàn)在參考圖5,時(shí)序圖說明處理如由路由器模塊38執(zhí)行的新應(yīng)用程序54的方法200。在各種實(shí)施例中,例如,一旦接收到來自系統(tǒng)10的系統(tǒng)數(shù)據(jù),該方法可以立即開始。在201處,接口模塊44提供系統(tǒng)數(shù)據(jù)62至系統(tǒng)狀態(tài)數(shù)據(jù)庫(kù)43。在202處,接收注冊(cè)數(shù)據(jù)并且將其存儲(chǔ)在注冊(cè)數(shù)據(jù)庫(kù)中。在204處,基于語(yǔ)音識(shí)別提供時(shí)隙至分類器模塊46。在206至212處,分類器模塊46接著檢索來自系統(tǒng)狀態(tài)數(shù)據(jù)庫(kù)43的系統(tǒng)狀態(tài)63和來自注冊(cè)數(shù)據(jù)庫(kù)的注冊(cè)數(shù)據(jù)。在214處,計(jì)算最大似然概率。在216處,從用戶模型數(shù)據(jù)庫(kù)請(qǐng)求數(shù)據(jù)。在218處,提供用戶模型。在220處計(jì)算先驗(yàn)概率且在222處計(jì)算最終概率。此后,在224處,評(píng)估最終概率且將可能的應(yīng)用程序或多個(gè)應(yīng)用程序56、與應(yīng)用程序56相關(guān)聯(lián)的子系統(tǒng)58以及語(yǔ)音提示60返回提供至對(duì)接口模塊44。選用地,在226處基于歧義消除更新用戶模型。此后,該方法可結(jié)束。
雖然至少一個(gè)示例性實(shí)施例已在前文詳述中加以呈現(xiàn),但是應(yīng)當(dāng)明白存在大量變動(dòng)。還應(yīng)當(dāng)明白的是,示例性實(shí)施例或多個(gè)示例性實(shí)施例只是實(shí)例并且不旨在以任何方式限制本發(fā)明的范圍、實(shí)用性或配置。實(shí)情是,前文詳述將給本領(lǐng)域技術(shù)人員提供用于實(shí)施示例性實(shí)施例或多個(gè)示例性實(shí)施例的指引。應(yīng)當(dāng)明白的是,在不脫離如隨附權(quán)利要求書和其合法等同物中闡述的本發(fā)明的范圍的情況下,可對(duì)元件的功能和設(shè)置作出各種改變。