亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于口頭對話服務(wù)仲裁的系統(tǒng)和方法

文檔序號:7808648閱讀:163來源:國知局
用于口頭對話服務(wù)仲裁的系統(tǒng)和方法
【專利摘要】本發(fā)明涉及用于口頭對話服務(wù)仲裁的系統(tǒng)和方法。用于仲裁口頭對話服務(wù)的系統(tǒng)和方法包括:確定與環(huán)境中可通達的多個裝置相關(guān)聯(lián)的能力目錄。該能力目錄包括映射到由所述多個裝置中的每個所提供的口頭對話服務(wù)列表上的所述多個裝置的列表。所述系統(tǒng)在能力目錄中的多個裝置和口頭對話服務(wù)之間仲裁以便確定所選裝置和所選對話服務(wù)。
【專利說明】用于口頭對話服務(wù)仲裁的系統(tǒng)和方法
[0001]相關(guān)申請的交叉引用
本申請要求于2013年7月10日提交的美國臨時專利申請序列號61/844,646的權(quán)益,其全部內(nèi)容在此并入本文以供參考。

【技術(shù)領(lǐng)域】
[0002]本【技術(shù)領(lǐng)域】大體涉及語音系統(tǒng),并且更具體地涉及用于在可用口頭對話服務(wù)之間進行選擇的方法和系統(tǒng)。

【背景技術(shù)】
[0003]車輛口頭對話系統(tǒng)(或者〃語音系統(tǒng)")基于由車輛乘客發(fā)出的語音執(zhí)行語音識別等等。語音話語通常包括與車輛的一個或更多個特征以及車輛可通達的其他系統(tǒng)通信或控制所述車輛的一個或更多個特征以及車輛可通達的其他系統(tǒng)的命令。語音系統(tǒng)響應(yīng)于語音話語產(chǎn)生口頭命令,并且在一些情況下,響應(yīng)于需要進一步信息來執(zhí)行語音識別的語音系統(tǒng)來產(chǎn)生口頭命令。
[0004]逐漸地,這樣的口頭對話服務(wù)可以由用戶環(huán)境中的多種裝置和/或應(yīng)用來提供。在車輛口頭對話系統(tǒng)的背景中,例如,這種服務(wù)通常從用戶的移動裝置(經(jīng)由貯存在移動裝置上的一個或更多個應(yīng)用)、車輛的機載語音系統(tǒng)、以及外部第三方服務(wù)器(其經(jīng)由網(wǎng)絡(luò)被聯(lián)接到機載通信網(wǎng)絡(luò))是同時可用的。
[0005]在這樣的情況下,口頭對話服務(wù)中的兩個或者更多個會是用于處理給定語音話語和/或用于執(zhí)行請求任務(wù)的候選,同時可能僅其中一個服務(wù)是用戶的具體需求所最佳或甚至適用的。例如,導(dǎo)航信息的請求可能由機載導(dǎo)航系統(tǒng)或者貯存在用戶的智能電話上的導(dǎo)航應(yīng)用來處理,這兩種系統(tǒng)在具體背景下具有相應(yīng)的優(yōu)點和弱點。在公知系統(tǒng)中,這個問題通過使用多個按鈕或其他用戶界面技術(shù)(例如,基于哪個應(yīng)用“聚焦”在觸摸屏上)來解決,其每個都對應(yīng)于一個具體的口頭對話服務(wù)。這樣的方法能夠?qū)е聭舴中暮?或其他的不能令人滿意的結(jié)果。
[0006]因此,需要的是提供一種用于選擇語音系統(tǒng)中的口頭對話服務(wù)的改進方法和系統(tǒng)。此外,從后續(xù)具體描述和所附權(quán)利要求結(jié)合附圖和前述【技術(shù)領(lǐng)域】和【背景技術(shù)】將顯而易見到本發(fā)明的其他理想特征和特點。


【發(fā)明內(nèi)容】

[0007]提供用于仲裁口頭對話服務(wù)的方法和系統(tǒng)。根據(jù)各種實施例,確定與環(huán)境(例如,車輛)中可通達的多個裝置相關(guān)聯(lián)的能力目錄。能力目錄包括映射到由多個裝置中的每個所提供的口頭對話服務(wù)列表上的裝置列表。系統(tǒng)在能力目錄中的多個裝置和口頭對話服務(wù)之間仲裁以便確定所選裝置和所選對話服務(wù)。然后系統(tǒng)將口頭話語發(fā)送到所選裝置上的所選口頭對話服務(wù)。
[0008]在一種實施例中,系統(tǒng)接收來自環(huán)境中的用戶的口頭話語,基于能力目錄來分類口頭話語以便確定一組候選裝置和一組口頭對話服務(wù),以及基于驗證標(biāo)準(zhǔn)從該組候選裝置確定所選裝置并從該組候選口頭對話服務(wù)確定所選口頭對話服務(wù)。
[0009]本發(fā)明還可包括下列方案。
[0010]1.一種用于仲裁口頭對話服務(wù)的方法,該方法包括:
確定與環(huán)境中可通達的多個裝置相關(guān)聯(lián)的能力目錄,該能力目錄包括映射到由所述多個裝置中的每個所提供的口頭對話服務(wù)列表上的所述多個裝置的列表;
從環(huán)境中的用戶接收口頭話語;
在所述能力目錄中的所述多個裝置和所述口頭對話服務(wù)之間仲裁以便確定所選裝置和所選對話服務(wù);以及
使用所述所選裝置上的所述所選口頭對話服務(wù)來處理所述口頭話語。
[0011]2.根據(jù)方案I所述的方法,其中所述仲裁包括:
基于所述能力目錄來分類所述口頭話語以便從所述多個裝置確定一組候選裝置并且確定一組口頭對話服務(wù);以及
基于驗證標(biāo)準(zhǔn)從該組候選裝置確定所述所選裝置并且從候選口頭對話服務(wù)列表確定所述所選口頭對話服務(wù)。
[0012]3.根據(jù)方案2所述的方法,其中所述驗證標(biāo)準(zhǔn)包括與所述口頭話語的分類相關(guān)聯(lián)的置信度水平。
[0013]4.根據(jù)方案2所述的方法,進一步包括:結(jié)合與過去的分類動作和用戶行為相關(guān)聯(lián)的至少一個訓(xùn)練數(shù)據(jù)來執(zhí)行對所述口頭對話服務(wù)的分類。
[0014]5.根據(jù)方案I所述的方法,進一步包括:基于從所述用戶請求的補充信息來確定所述所選裝置和所述所選口頭對話服務(wù)。
[0015]6.根據(jù)方案I所述的方法,其中所述環(huán)境是車輛環(huán)境,并且所述多個裝置包括如下中的至少一者:可移除地位于所述車輛環(huán)境中的移動裝置;結(jié)合到所述車輛環(huán)境中的裝置;以及包括遠離所述車輛環(huán)境的網(wǎng)絡(luò)服務(wù)器的裝置。
[0016]7.根據(jù)方案2所述的方法,進一步包括:
將所述口頭話語發(fā)送到所述能力目錄中的第一口頭對話服務(wù)和第二口頭對話服務(wù);
從所述第一口頭對話服務(wù)接收與該口頭話語的識別相關(guān)聯(lián)的第一置信度分?jǐn)?shù);
從所述第二口頭對話服務(wù)接收與該口頭話語的識別相關(guān)聯(lián)的第二置信度分?jǐn)?shù);以及至少部分地基于所述第一置信度分?jǐn)?shù)和第二置信度分?jǐn)?shù)來確定所述驗證標(biāo)準(zhǔn)。
[0017]8.根據(jù)方案I所述的方法,進一步包括:
規(guī)定與所述多個裝置和所述口頭對話服務(wù)相關(guān)聯(lián)的默認設(shè)定;以及基于用戶行為來修改所述默認設(shè)定。
[0018]9.一種用于口頭對話仲裁的系統(tǒng),該系統(tǒng)包括:
語音理解模塊,其被構(gòu)造成處理從環(huán)境中的用戶接收的語音話語;
仲裁模塊,其通信地聯(lián)接到所述語音理解模塊,所述仲裁模塊被構(gòu)造成:確定與環(huán)境中可通達的多個裝置相關(guān)聯(lián)的能力目錄,該能力目錄包括映射到由所述多個裝置中的每個所提供的口頭對話服務(wù)列表上的所述多個裝置的列表;接收所述口頭話語;在所述能力目錄中的所述多個裝置和所述口頭對話服務(wù)之間仲裁以便確定所選裝置和所選對話服務(wù);以及使用所述所選裝置上的所述所選口頭對話服務(wù)來處理所述口頭話語。
[0019]10.根據(jù)方案9所述的系統(tǒng),其中所述仲裁模塊被構(gòu)造成:
基于所述能力目錄來分類所述口頭話語以便從所述多個裝置確定一組候選裝置并且確定一組口頭對話服務(wù);以及
基于驗證標(biāo)準(zhǔn)從該組候選裝置確定所述所選裝置并且從候選口頭對話服務(wù)列表確定所述所選口頭對話服務(wù)。
[0020]11.根據(jù)方案10所述的系統(tǒng),其中所述驗證標(biāo)準(zhǔn)包括與所述口頭話語的分類相關(guān)聯(lián)的置信度水平。
[0021]12.根據(jù)方案10所述的系統(tǒng),其中所述仲裁模塊結(jié)合與過去的分類動作和用戶行為相關(guān)聯(lián)的至少一個訓(xùn)練數(shù)據(jù)來執(zhí)行對所述口頭對話服務(wù)的分類。
[0022]13.根據(jù)方案10所述的系統(tǒng),其中所述仲裁模塊被構(gòu)造成:
將所述口頭話語發(fā)送到所述能力目錄中的第一口頭對話服務(wù)和第二口頭對話服務(wù);
從所述第一口頭對話服務(wù)接收與該口頭話語的識別相關(guān)聯(lián)的第一置信度分?jǐn)?shù);
從所述第二口頭對話服務(wù)接收與該口頭話語的識別相關(guān)聯(lián)的第二置信度分?jǐn)?shù);以及至少部分地基于所述第一置信度分?jǐn)?shù)和第二置信度分?jǐn)?shù)來確定所述驗證標(biāo)準(zhǔn)。
[0023]14.根據(jù)方案9所述的系統(tǒng),其中所述仲裁模塊被構(gòu)造成:
規(guī)定與所述多個裝置和所述口頭對話服務(wù)相關(guān)聯(lián)的默認設(shè)定;以及基于用戶行為來修改所述默認設(shè)定。
[0024]15.根據(jù)方案9所述的系統(tǒng),其中所述仲裁模塊包括裝置分類器、服務(wù)分類器和驗證模塊。
[0025]16.—種仲裁方法,包括:
確定與車輛中可通達的多個裝置相關(guān)聯(lián)的能力目錄,該能力目錄包括映射到由所述多個裝置中的每個所提供的口頭對話服務(wù)列表上的所述多個裝置的列表;
接收所述口頭話語;
在所述能力目錄中的所述多個裝置和所述口頭對話服務(wù)之間仲裁以便確定所選裝置和所選對話服務(wù),其中所述仲裁包括基于所述能力目錄來分類所述口頭話語以便從所述多個裝置確定一組候選裝置并且確定一組口頭對話服務(wù)、以及基于驗證標(biāo)準(zhǔn)從該組候選裝置確定所述所選裝置并且從候選口頭對話服務(wù)列表確定所述所選口頭對話服務(wù);以及使用所述所選裝置上的所述所選口頭對話服務(wù)來處理所述口頭話語。
[0026]16.根據(jù)方案15所述的方法,其中所述驗證標(biāo)準(zhǔn)包括與所述口頭話語的分類相關(guān)聯(lián)的置信度水平。
[0027]17.根據(jù)方案15所述的方法,進一步包括:結(jié)合與過去的分類動作和用戶行為相關(guān)聯(lián)的至少一個訓(xùn)練數(shù)據(jù)來執(zhí)行對所述口頭對話服務(wù)的分類。
[0028]18.根據(jù)方案15所述的方法,進一步包括:
規(guī)定與所述多個裝置和所述口頭對話服務(wù)相關(guān)聯(lián)的默認設(shè)定;以及基于用戶行為來修改所述默認設(shè)定。
[0029]19.根據(jù)方案15所述的方法,進一步包括:
將所述口頭話語發(fā)送到所述能力目錄中的第一口頭對話服務(wù)和第二口頭對話服務(wù);
從所述第一口頭對話服務(wù)接收與該口頭話語的識別相關(guān)聯(lián)的第一置信度分?jǐn)?shù);
從所述第二口頭對話服務(wù)接收與該口頭話語的識別相關(guān)聯(lián)的第二置信度分?jǐn)?shù);以及至少部分地基于所述第一置信度分?jǐn)?shù)和第二置信度分?jǐn)?shù)來確定所述驗證標(biāo)準(zhǔn)。
[0030]20.根據(jù)方案19所述的方法,其中在從所述第一口頭對話服務(wù)接收所述第一置信度分?jǐn)?shù)和從所述第二口頭對話服務(wù)接收所述第二置信度分?jǐn)?shù)的步驟之后是如下的一個或更多個步驟:向所述用戶提示附加輸入并同時提供所述附加用戶話語到兩個服務(wù);以及當(dāng)所述服務(wù)中的一個服務(wù)所返回的置信度充分大于另一服務(wù)所返回的置信度時選擇所述一個服務(wù)。

【專利附圖】

【附圖說明】
[0031]在下文將結(jié)合所附附圖來描述示例性實施例,其中類似附圖標(biāo)記指代類似元件,并且附圖中:
圖1是根據(jù)各種示例性實施例的包括語音系統(tǒng)的車輛的功能框圖;
圖2是根據(jù)各種示例性實施例的示出仲裁模塊的功能框圖;
圖3是根據(jù)示例性實施例的示出與一個或更多個裝置通信的仲裁模塊的功能框圖;
圖4是根據(jù)各種示例性實施例的示出仲裁模塊的功能框圖;
圖5是示出根據(jù)圖3所示的示例性實施例的口頭對話服務(wù)仲裁方法的流程圖;以及圖6是示出根據(jù)圖4所示的示例性實施例的口頭對話服務(wù)仲裁方法的流程圖。

【具體實施方式】
[0032]下列詳細描述實質(zhì)上僅僅是示例性的并且不試圖限制應(yīng)用和使用。此外,不試圖受在前述【技術(shù)領(lǐng)域】、【背景技術(shù)】、
【發(fā)明內(nèi)容】
或下文的【具體實施方式】中呈現(xiàn)的任意明確或暗含的理論約束。如本文所用的,術(shù)語“模塊”指的是專用集成電路(ASIC)、電子電路、處理器(共享的、專用的或成組的)以及執(zhí)行一個或更多個軟件或固件程序的存儲器、組合邏輯電路和/或提供所述功能的其他適當(dāng)部件。
[0033]現(xiàn)在參考圖1,根據(jù)本文描述的主題的示例性實施例,在車輛12內(nèi)提供口頭對話系統(tǒng)(或者簡稱為〃語音系統(tǒng)〃)10。大體而言,語音系統(tǒng)10通過人機界面模塊(HMI)模塊14來提供用于一個或更多個車輛系統(tǒng)的語音識別、對話管理和語音生成,其中該HMI模塊14被構(gòu)造成由一個或更多個用戶40 (例如駕駛員、乘客等)操作(或以其他方式交互)。這樣的車輛系統(tǒng)可以包括例如電話系統(tǒng)16、導(dǎo)航系統(tǒng)18、媒體系統(tǒng)20、遠程信息處理技術(shù)系統(tǒng)22、網(wǎng)絡(luò)系統(tǒng)24和可以包括依賴語音的應(yīng)用的任意其他的車輛系統(tǒng)。在一些實施例中,一個或更多個車輛系統(tǒng)被通信地聯(lián)接到網(wǎng)絡(luò)(例如,專用網(wǎng)絡(luò)、4G網(wǎng)絡(luò)等),從而提供與一個或更多個后端服務(wù)器26的數(shù)據(jù)通信。
[0034]一個或更多個移動裝置50也可以存在于車輛12中,所述移動裝置包括一個或更多個智能電話、平板電腦、功能電話等。移動裝置50也可以通過適當(dāng)?shù)臒o線連接(例如藍牙或WiFi)通信地聯(lián)接到HMI 14,以便用戶40經(jīng)由HMI 14可訪問貯存在移動裝置50上的一個或更多個應(yīng)用。因此,用戶40將通常訪問在如下三個不同平臺上運行的應(yīng)用:在車輛系統(tǒng)本身內(nèi)執(zhí)行的應(yīng)用;在移動裝置50上部署的應(yīng)用;以及貯存在后端服務(wù)器26上的應(yīng)用。此外,一個或更多個這些應(yīng)用可以根據(jù)其自身的相應(yīng)口頭對話系統(tǒng)來操作,并且因此多個裝置可以能夠不同程度地響應(yīng)于用戶40說出的請求。
[0035]語音系統(tǒng)10通過通信總線和/或其他的數(shù)據(jù)通信網(wǎng)絡(luò)29 (例如,有線、短程無線或長程無線)與車輛系統(tǒng)14、16、18、20、22、24和26通信。通信總線可以是例如控制器局域網(wǎng)(CAN)總線、本地互連網(wǎng)絡(luò)(LIN)總線等等。將意識到,語音系統(tǒng)10可以結(jié)合基于車輛的環(huán)境和不基于車輛的環(huán)境二者被使用,所述環(huán)境包括一個或更多個依賴語音的應(yīng)用,并且在不失通用性的前提下闡述本文提供的基于車輛的示例。
[0036]如所示的,語音系統(tǒng)10包括語音理解模塊32、對話管理模塊34和語音生成模塊35。這些功能模塊可以被實現(xiàn)為單獨系統(tǒng)或者作為組合的集成系統(tǒng)。大體而言,HMI模塊14接收來自用戶40的聲學(xué)信號(或者〃語音話語〃)41,其被提供給語音理解模塊32。
[0037]語音理解模塊32包括硬件和/或軟件的任意組合,其被構(gòu)造成通過使用合適語音識別技術(shù)來處理(經(jīng)由一個或更多個麥克風(fēng)52接收的)來自HMI模塊14的語音話語,所述語音識別技術(shù)例如包括自動語音識別和語義解碼(或者口頭語言理解(SLU))。通過使用這樣的技術(shù),語音理解模塊32從語音話語生成可能結(jié)果的一個(或更多個)列表33。在一種實施例中,列表33包括一個或更多個句子假設(shè),其代表用戶40可能說出的一組話語(即,話語41)的可能性分布。列表33可能例如采取N-最優(yōu)列表的形式。在各種實施例中,語音理解模塊32通過使用存儲在數(shù)據(jù)庫中的預(yù)定義可能性來生成列表33。例如,預(yù)定義可能性可以是存儲在電話薄里的姓名或號碼、存儲在地址簿中的姓名或地址、存儲在音樂目錄中的歌曲名、專輯或藝術(shù)家等。在一種實施例中,語音理解模塊32采用前端特征提取,之后采用隱馬爾科夫模型和評分機制。
[0038]對話管理模塊34包括被構(gòu)造成基于列表33來管理交互序列和要講給用戶的語音提示42的選擇的硬件和/或軟件的任意組合。當(dāng)列表33包含一個以上的可能結(jié)果時,對話管理模塊34使用消歧策略來管理與用戶40的提示對話,以便能夠確定被識別結(jié)果。根據(jù)示例性實施例,對話管理模塊34能夠管理對話上下文,如下文進一步具體描述的。
[0039]語音生成模塊35包括被構(gòu)造成基于對話管理模塊34確定的對話生成給用戶40的口頭提示42的硬件和/或軟件的任意組合。在此方面,語音生成模塊35將大體提供自然語言生成(NLG)和語音綜合或者文本至語音(TTS )。
[0040]列表33包括代表可能結(jié)果的一個或更多個元素。在各種實施例中,列表33的每個元素包括均根據(jù)應(yīng)用而關(guān)聯(lián)于槽類型的一個或更多個“槽”。例如,如果應(yīng)用支持給電話薄聯(lián)系人打電話(例如“呼叫John Doe”),則每個元素可以包括具有名、中間名和/或姓的槽類型的槽。在另一示例中,如果應(yīng)用支持導(dǎo)航(例如,“去1111陽光林蔭大道”),則每個元素可以包括具有門牌號和街道名等槽類型的槽。在各種實施例中,槽和槽類型可以被存儲在數(shù)據(jù)庫中并且被任意所示系統(tǒng)訪問。列表33的每個元素或槽關(guān)聯(lián)于置信度分?jǐn)?shù)。
[0041]除了口頭對話之外,用戶40還可以通過各種按鈕、開關(guān)、觸摸屏用戶界面元件、姿態(tài)(例如通過在車輛12中提供的一個或更多個攝像機識別的手勢)等等與HMI 14交互。在一種實施例中,按鈕54 (例如,〃按下以通話〃按鈕或者簡單地〃通話按鈕〃)被提供在一個或更多個用戶40的易觸范圍內(nèi)。例如,按鈕54可以被嵌入方向盤56中。
[0042]現(xiàn)在參考圖2,根據(jù)各種示例性實施例,HMI模塊14包括仲裁模塊202,其通過適當(dāng)?shù)耐ㄐ磐ǖ?有線或無線的)被通信地聯(lián)接到一個或更多個裝置201。在所示實施例中,例如,如下三個裝置201被通信地聯(lián)接到仲裁模塊202:裝置210、裝置220和裝置230。裝置201可以對應(yīng)于圖1中所示的各種部件或部件的組合。例如,裝置210可以對應(yīng)于圖1中的移動裝置50,裝置220可以對應(yīng)于圖1中的后端服務(wù)器26,并且裝置230可以對應(yīng)于與一個或更多個車輛裝置16、18、20等結(jié)合工作的HMI模塊14。
[0043]每個裝置201可以包括被構(gòu)造成執(zhí)行一個或多個口頭對話服務(wù)的一個或更多個應(yīng)用,如上所述。例如,如所示的,裝置210包括應(yīng)用211,裝置220包括應(yīng)用221和222,并且裝置230包括應(yīng)用231和232。此外,各應(yīng)用(211、222等等)可以能夠執(zhí)行一個以上的口頭對話服務(wù)。例如,單個應(yīng)用可以被構(gòu)造成識別口頭對話并且基于該口頭對話提供導(dǎo)航服務(wù)以及媒體服務(wù)二者。在圖2中,示例性口頭對話服務(wù)由每個應(yīng)用中的方形區(qū)域標(biāo)示,例如應(yīng)用211的服務(wù)213和214。
[0044]已知各種應(yīng)用能夠執(zhí)行口頭對話服務(wù),并且更多的應(yīng)用將在未來被研發(fā)。這種應(yīng)用的當(dāng)前不例包括但不限于 Pandora? Internet Rad1、iGo ?導(dǎo)航、Google Maps ?、GoogleNow?、Stitcher 及本領(lǐng)域公知的各種車輛導(dǎo)航系統(tǒng)應(yīng)用。
[0045]現(xiàn)在參考圖3,現(xiàn)在將結(jié)合圖5中所示示例性仲裁方法500來描述根據(jù)一種實施例的仲裁模塊302。如圖3所示,仲裁模塊302包括裝置分類模塊303、服務(wù)分類模塊304、驗證模塊305、裝置門模塊306和能力目錄307 (有時也被稱為〃能力映射〃)。
[0046]最初,在圖5中的502處確定能力目錄307。參考圖3,能力目錄307包括用于存儲與裝置201的能力(例如應(yīng)用功能、硬件限制等等)相關(guān)聯(lián)的數(shù)據(jù)的一個或更多個任意合適的數(shù)據(jù)結(jié)構(gòu)。在一種實施例中,能力目錄307包括映射到由多個裝置中的每個所提供的口頭對話服務(wù)列表的可用裝置列表(例如210、220、230)。因此,例如能力目錄307可以反映出:相對于具有口頭對話服務(wù)的應(yīng)用來說,裝置210能夠執(zhí)行導(dǎo)航服務(wù)和媒體服務(wù),裝置220能夠僅執(zhí)行導(dǎo)航服務(wù)(其可以與裝置210所執(zhí)行的服務(wù)相同或不同),并且裝置230能夠僅執(zhí)行流媒體廣播服務(wù)。
[0047]能力目錄307可以根據(jù)各種公知技術(shù)而被填充。例如,當(dāng)每個裝置201被加電或者其他方式通信地聯(lián)接到仲裁模塊302時,可以執(zhí)行登記程序。藍牙和/或WiFi相關(guān)技術(shù)可以被用于問詢每個裝置201以確定每個裝置201所提供的相應(yīng)口頭對話服務(wù)。
[0048]在圖5中504處,一旦接收到口頭話語41,則裝置分類模塊303基于能力目錄來分類該話語以便確定一組候選裝置。即,返回參考圖3,通過使用能力目錄307所存儲的裝置和服務(wù)列表,裝置分類模塊303確定被構(gòu)造成執(zhí)行所請求功能的一組(例如N-最優(yōu)列表)裝置201。該組可以包括所有裝置201、裝置201的適當(dāng)子集、或者沒有裝置201。根據(jù)一種實施例,裝置分類模塊303被構(gòu)造成產(chǎn)生與該組中列出的每個裝置相關(guān)聯(lián)的置信度水平。例如,裝置分類模塊303可以確定裝置210和220均能夠執(zhí)行導(dǎo)航功能,但是基于一個或更多個因素(例如硬件能力、歷史訓(xùn)練數(shù)據(jù)等等),裝置210的置信度水平高于裝置220的。歷史訓(xùn)練數(shù)據(jù)包括與針對具體口頭對話或表明用戶偏好、系統(tǒng)性能等的任意其他非口頭交互的由系統(tǒng)先前使用的裝置和/或服務(wù)相關(guān)的任意信息。裝置分類模塊303之后可以將一個或更多個學(xué)習(xí)算法施加于歷史訓(xùn)練數(shù)據(jù),以便分類口頭話語。
[0049]類似地,在圖5中的506處,一旦接收到口頭話語41,則服務(wù)分類模塊304基于能力目錄來分類該口頭話語41以便確定一組候選服務(wù)。返回參考圖3,在使用裝置分類模塊303的情況下,這個模塊使用能力目錄307所存儲的裝置和服務(wù)列表來確定被構(gòu)造成執(zhí)行所請求任務(wù)的一組(例如N-最優(yōu)列表)服務(wù)。根據(jù)一種實施例,服務(wù)分類模塊304被構(gòu)造成產(chǎn)生與該組中列出的每個服務(wù)相關(guān)聯(lián)的置信度水平。例如,裝置分類模塊303可以確定裝置210和220中的服務(wù)均能夠執(zhí)行導(dǎo)航功能,但是基于一個或更多個因素(例如軟件限制和/或歷史訓(xùn)練數(shù)據(jù)),裝置220的置信度水平高于裝置210的。
[0050]在圖5中的508處,通信地聯(lián)接到模塊303和304 二者的驗證模塊305調(diào)解由裝置分類模塊303和服務(wù)分類模塊304所提供的(可能相沖突的)候選。即,驗證模塊305被構(gòu)造成從該組候選裝置來選擇一個或更多個裝置并且從該組候選口頭對話服務(wù)來選擇對應(yīng)的口頭對話服務(wù),以便產(chǎn)生一個或更多個裝置/服務(wù)對的有序列表。在一種實施例中,這種選擇基于驗證標(biāo)準(zhǔn)而定,如下文更具體描述的。驗證標(biāo)準(zhǔn)可以基于如下中的至少一者而定:每個候選裝置的硬件能力、每個候選口頭對話服務(wù)的貨幣成本、每個候選口頭對話服務(wù)的功能。
[0051]參考圖3,驗證模塊305被構(gòu)造成與對話管理器34 (單向)通信。這允許與用戶進行附加對話以便澄清所需任務(wù)中的可能歧義(510)。例如,可以要求用戶(經(jīng)由口頭對話或其他方式)明確地選擇針對該任務(wù)應(yīng)當(dāng)使用哪個裝置201和/或哪個服務(wù)。
[0052]在確定所選裝置201和所選服務(wù)之后,該信息被對話管理器34提供給裝置門模塊306,由此該裝置門模塊306使用所選裝置上的所選口頭對話服務(wù)來處理口頭話語。S卩,來自該服務(wù)的結(jié)果被用來完成用戶所請求的任務(wù)。例如,裝置門模塊306可以使用貯存在裝置210上的導(dǎo)航服務(wù)來處理口頭話語41。
[0053]因為仲裁模塊302將每個裝置201有效地處理為“黑盒”并且以開環(huán)操作從而將語音話語遞送到所選裝置,所以圖3所示的實施例可以被稱為"路由器模式"仲裁模塊。
[0054]現(xiàn)在參考圖4,現(xiàn)在將結(jié)合圖6中所示的示例性仲裁方法600來描述根據(jù)另一種實施例的仲裁模塊402。如所示的,仲裁模塊402包括裝置分類模塊403、服務(wù)分類模塊404、驗證模塊405、裝置應(yīng)用程序界面(API)模塊406和能力目錄407。因此,圖4中所示的實施例類似于圖3中所示的實施例,不同之處在于,圖4中所示的實施例包括裝置API模塊406(能夠更緊密地與每個裝置201的內(nèi)部口頭對話功能交互)。此外,如由互連各種模塊的箭頭所指出的,從模塊406到對話管理器34的通信是雙向的,并且從裝置API模塊406到裝置201的通信以及從驗證模塊305到裝置API模塊406的通信也都是雙向的。在正常操作期間,圖4中所示實施例可以以與圖3和圖5方式一致的方式(即,以〃路由器模式")執(zhí)行。然而,如果確定口頭話語的驗證和/或分類是失敗或者未定的,則可以執(zhí)行圖6所示的程序。更具體地,在圖6的602處,口頭話語41經(jīng)由裝置API 406被發(fā)送到兩個或更多個裝置201,并且之后那些裝置發(fā)送回與口頭話語41的識別相關(guān)聯(lián)的置信度分?jǐn)?shù)。裝置將通常也發(fā)送回一個響應(yīng)(例如,提示)。
[0055]之后基于從裝置201接收到的置信度分?jǐn)?shù)在604經(jīng)由驗證模塊305執(zhí)行驗證。系統(tǒng)在605確定是否存在歧義。如果否,則系統(tǒng)在606利用所選裝置和所選口頭對話服務(wù)(并且如果有提示的話,則使用接收到的提示對用戶進行響應(yīng))。如果存在歧義,則仲裁模塊可以(通對話管理器34)請求來自用戶的附加信息(610),并且然后在608繼續(xù),直到完全解決歧義為止。因為仲裁模塊402使用對話管理器34和API 406來與裝置201交互且直接地操作,所以圖4所示的實施例可以被稱為“集成模式”仲裁模塊。
[0056]在一種實施例中,提供用于選擇口頭對話服務(wù)和相關(guān)裝置的默認設(shè)定。之后,基于用戶行為來修改那些默認偏好設(shè)定(即,針對某些任務(wù)的用戶偏好)。例如,基于用戶通過使用具體口頭對話服務(wù)來執(zhí)行某任務(wù),系統(tǒng)可能修改偏好。之后,用戶可以被提示保存該偏好(例如“你希望總是發(fā)送地址請求至Google Maps嗎? ”)。
[0057]例如,下列對話示出了各種使用情況。在每種情況下,仲裁器模塊確定響應(yīng)于用戶的口頭話語而使用哪個裝置和哪個對話服務(wù)(例如內(nèi)置裝置或智能電話裝置)。
用戶:“我希望聽到比利.喬爾的電臺?!?br> 仲裁器:將聲音導(dǎo)向至車輛的內(nèi)置裝置。
(內(nèi)置裝置提供電臺服務(wù))。
用戶:“我希望聽到比利.喬爾的電臺?!?br> 仲裁器:“使用內(nèi)置裝置還是使用你的智能電話的音樂應(yīng)用?”
(對話管理器通過提示用戶來解決該歧義)。
用戶:“我希望聽到比利.喬爾的電臺?!?br> 仲裁器:將話語同時發(fā)送到外部應(yīng)用和內(nèi)置裝置。內(nèi)置裝置返回積極響應(yīng)而外部應(yīng)用不具有適當(dāng)信道。仲裁器利用內(nèi)置裝置。
(基于裝置/服務(wù)響應(yīng)選擇的對話服務(wù))。
用戶:“我希望聽到Stitcher上的比利.喬爾的電臺?!?br> (用戶明確地選擇裝置和對話服務(wù)(例如,Stitcher或者現(xiàn)在已知或之后被研發(fā)的一些其他類似的服務(wù))。
用戶:“我希望聽到比利.喬爾的電臺。”
仲裁器:選擇內(nèi)置裝置,因為所述內(nèi)置裝置提供最便宜的服務(wù)。
(基于成本的選擇)。
用戶:“帶我到特洛伊的中餐館”
仲裁器:將聲音引導(dǎo)到智能電話上的而不是嵌入式導(dǎo)航系統(tǒng)上的Google Maps[或者現(xiàn)在公知或之后被研發(fā)的類似的地圖服務(wù)],因為嵌入式導(dǎo)航系統(tǒng)不支持搜索而僅能導(dǎo)航到地址。
(基于搜索服務(wù)的可用性的選擇)。
用戶:“呼叫 Paul Mazoyevsky”
仲裁器:將聲音發(fā)送到內(nèi)置裝置和后端聯(lián)系簿識別。選擇后端是由于該后端所返回的較高置信度。
(基于置信度水平的選擇)。
用戶:“下一個?!?br> 仲裁器:將話語引導(dǎo)到音樂播放器來跳過歌曲并且不選擇“下一個”屏幕頁。
(基于上下文的選擇)。
[0058]大體而言,可以通過使用任意所需自動化水平來實施上述方法。即,例如,仲裁可以被(a)自動地(無用戶輸入)地被完成、(b)自動地但給用戶機會進行改變地被完成、或者(C)自動地但允許用戶確認地被完成。
[0059]雖然在前述詳細描述中已經(jīng)提出了至少一種示例性實施例,但是應(yīng)該意識到存在大量變型。還應(yīng)該意識到,一個或更多個示例性實施例僅是示例,并且不試圖以任何方式限制本公開的范圍、適用性或構(gòu)造。而是,上述【具體實施方式】將向本領(lǐng)域技術(shù)人員提供實施一個或更多個示例性實施例的便捷路線圖。應(yīng)該理解的是,在不背離如所附權(quán)利要求及其法律等價物所列出的本公開的范圍的情況下,能夠?qū)υ墓δ芎驮O(shè)置進行各種修改。
【權(quán)利要求】
1.一種用于仲裁口頭對話服務(wù)的方法,該方法包括: 確定與環(huán)境中可通達的多個裝置相關(guān)聯(lián)的能力目錄,該能力目錄包括映射到由所述多個裝置中的每個所提供的口頭對話服務(wù)列表上的所述多個裝置的列表; 從環(huán)境中的用戶接收口頭話語; 在所述能力目錄中的所述多個裝置和所述口頭對話服務(wù)之間仲裁以便確定所選裝置和所選對話服務(wù);以及 使用所述所選裝置上的所述所選口頭對話服務(wù)來處理所述口頭話語。
2.根據(jù)權(quán)利要求1所述的方法,其中所述仲裁包括: 基于所述能力目錄來分類所述口頭話語以便從所述多個裝置確定一組候選裝置并且確定一組口頭對話服務(wù);以及 基于驗證標(biāo)準(zhǔn)從該組候選裝置確定所述所選裝置并且從候選口頭對話服務(wù)列表確定所述所選口頭對話服務(wù)。
3.根據(jù)權(quán)利要求2所述的方法,其中所述驗證標(biāo)準(zhǔn)包括與所述口頭話語的分類相關(guān)聯(lián)的置信度水平。
4.根據(jù)權(quán)利要求2所述的方法,進一步包括:結(jié)合與過去的分類動作和用戶行為相關(guān)聯(lián)的至少一個訓(xùn)練數(shù)據(jù)來執(zhí)行對所述口頭對話服務(wù)的分類。
5.根據(jù)權(quán)利要求1所述的方法,進一步包括:基于從所述用戶請求的補充信息來確定所述所選裝置和所述所選口頭對話服務(wù)。
6.根據(jù)權(quán)利要求1所述的方法,其中所述環(huán)境是車輛環(huán)境,并且所述多個裝置包括如下中的至少一者:可移除地位于所述車輛環(huán)境中的移動裝置;結(jié)合到所述車輛環(huán)境中的裝置;以及包括遠離所述車輛環(huán)境的網(wǎng)絡(luò)服務(wù)器的裝置。
7.根據(jù)權(quán)利要求2所述的方法,進一步包括: 將所述口頭話語發(fā)送到所述能力目錄中的第一口頭對話服務(wù)和第二口頭對話服務(wù); 從所述第一口頭對話服務(wù)接收與該口頭話語的識別相關(guān)聯(lián)的第一置信度分?jǐn)?shù); 從所述第二口頭對話服務(wù)接收與該口頭話語的識別相關(guān)聯(lián)的第二置信度分?jǐn)?shù);以及 至少部分地基于所述第一置信度分?jǐn)?shù)和第二置信度分?jǐn)?shù)來確定所述驗證標(biāo)準(zhǔn)。
8.根據(jù)權(quán)利要求1所述的方法,進一步包括: 規(guī)定與所述多個裝置和所述口頭對話服務(wù)相關(guān)聯(lián)的默認設(shè)定;以及 基于用戶行為來修改所述默認設(shè)定。
9.一種用于口頭對話仲裁的系統(tǒng),該系統(tǒng)包括: 語音理解模塊,其被構(gòu)造成處理從環(huán)境中的用戶接收的語音話語; 仲裁模塊,其通信地聯(lián)接到所述語音理解模塊,所述仲裁模塊被構(gòu)造成:確定與環(huán)境中可通達的多個裝置相關(guān)聯(lián)的能力目錄,該能力目錄包括映射到由所述多個裝置中的每個所提供的口頭對話服務(wù)列表上的所述多個裝置的列表;接收所述口頭話語;在所述能力目錄中的所述多個裝置和所述口頭對話服務(wù)之間仲裁以便確定所選裝置和所選對話服務(wù);以及使用所述所選裝置上的所述所選口頭對話服務(wù)來處理所述口頭話語。
10.一種仲裁方法,包括: 確定與車輛中可通達的多個裝置相關(guān)聯(lián)的能力目錄,該能力目錄包括映射到由所述多個裝置中的每個所提供的口頭對話服務(wù)列表上的所述多個裝置的列表; 接收所述口頭話語; 在所述能力目錄中的所述多個裝置和所述口頭對話服務(wù)之間仲裁以便確定所選裝置和所選對話服務(wù),其中所述仲裁包括基于所述能力目錄來分類所述口頭話語以便從所述多個裝置確定一組候選裝置并且確定一組口頭對話服務(wù)、以及基于驗證標(biāo)準(zhǔn)從該組候選裝置確定所述所選裝置并且從候選口頭對話服務(wù)列表確定所述所選口頭對話服務(wù);以及使用所述所選裝置上的所述所選口頭對話服務(wù)來處理所述口頭話語。
【文檔編號】H04Q5/24GK104284257SQ201410328542
【公開日】2015年1月14日 申請日期:2014年7月10日 優(yōu)先權(quán)日:2013年7月10日
【發(fā)明者】E.茨爾克爾-漢科克, G.T.林德曼, R.D.辛斯三世, O.尖霍尼 申請人:通用汽車環(huán)球科技運作有限責(zé)任公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1