用于管理語音系統(tǒng)的對話的方法和系統(tǒng)的制作方法

文檔序號：6623452閱讀：236來源：國知局

用于管理語音系統(tǒng)的對話的方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種用于管理語音系統(tǒng)的語音對話的方法與系統(tǒng)。在實施例中，一種方法包括：接收來自語音系統(tǒng)的用戶的至少一個第一話語；基于所述至少一個第一話語來確定用戶交互樣式；并基于該交互樣式生成對用戶的反饋。
【專利說明】用于管理語音系統(tǒng)的對話的方法和系統(tǒng)
[0001]相關申請
[0002]本申請要求2013年5月15日提交的美國臨時申請?zhí)?1/823，761的權益。

【技術領域】
[0003]該【技術領域】總地涉及語音系統(tǒng)，更具體地，涉及基于用戶交互樣式來管理語音系統(tǒng)內的對話的方法和系統(tǒng)。

【背景技術】
[0004]車輛語音識別系統(tǒng)執(zhí)行由車輛乘客所說出的語音的語音識別或理解。語音話語通常包括命令，該命令與所述車輛或可由車輛訪問的其它系統(tǒng)通信或控制所述車輛或可由車輛訪問的其它系統(tǒng)的一個或多個特征。語音對話系統(tǒng)響應于語音話語生成口頭命令。在一些示例中，所述口頭命令響應于語音識別需要其他信息以便執(zhí)行語音識別而生成。在其它示例中，所述口頭命令作為對識別出的命令的確認而生成。通常，所述口頭命令基于特定的交互樣式。可以在語音識別系統(tǒng)的生成過程中設置該交互樣式，或可以在使用語音識別系統(tǒng)之前由用戶來預配置該交互樣式。預先選擇的交互樣式可能不能令所有用戶滿意。
[0005]因而，需要提供用于管理語音對話的改進的方法和系統(tǒng)。因而，還需要提供基于用戶交互樣式來調整語音對話的方法和系統(tǒng)。此外，基于隨后的詳細描述和所附權利要求書，并結合附圖和前述的【技術領域】與【背景技術】，本發(fā)明的其它所需的特征和特性將會變得顯而易見。

【發(fā)明內容】

[0006]提供了用于管理語音系統(tǒng)的語音對話的方法和系統(tǒng)。在一實施例中，一種方法包括:接收來自語音系統(tǒng)的用戶的至少一個第一話語；基于該至少一個第一話語來確定用戶交互樣式；并基于該交互樣式生成對用戶的反饋。
[0007]在另一實施例中，一種系統(tǒng)包括，第一模塊，其接收來自語音系統(tǒng)的用戶的至少一個第一話語并基于該至少一個第一話語來確定用戶交互樣式。該系統(tǒng)還包括第二模塊，其基于該交互樣式生成對用戶的反饋。
[0008]本發(fā)明還包括以下技術方案:
[0009]1.一種用于管理語音系統(tǒng)的語音對話的方法，包括:
[0010]接收來自語音系統(tǒng)的用戶的至少一個第一話語；
[0011]基于所述至少一個第一話語來確定用戶交互樣式；以及
[0012]基于所述交互樣式生成對用戶的反饋。
[0013]2.如技術方案I所述的方法，還包括:
[0014]基于所述第一話語確定下一個語音提示；以及
[0015]基于所述用戶交互樣式調整下一個語音提示，其中，所述生成所述反饋是基于調整后的語音提示的。
[0016]3.如技術方案2所述的方法，其中，所述確定用戶交互樣式包括確定多個用戶交互樣式，并且其中，所述調整包括基于所述多個用戶交互樣式來調整所述反饋。
[0017]4.如技術方案I所述的方法，其中，所述確定所述用戶交互樣式是基于樣式處理方法的，所述樣式處理方法包括與相互作用式樣式相關聯(lián)的參數(shù)。
[0018]5.如技術方案3所述的方法，其中，所述參數(shù)是預先定義的。
[0019]6.如技術方案3所述的方法，其中，所述參數(shù)是從其它語音話語獲悉的。
[0020]7.如技術方案I所述的方法，其中，所述用戶交互樣式是高效的交互樣式和相互作用式的交互樣式中的至少一個。
[0021]8.如技術方案I所述的方法，其中，所述用戶交互樣式是老年人的交互樣式和年輕人的交互樣式中的至少一個。
[0022]9.如技術方案I所述的方法，其中，所述用戶交互樣式是規(guī)范交互樣式和非規(guī)范的交互樣式中的至少一個。
[0023]10.如技術方案I所述的方法,還包括:
[0024]接收用戶數(shù)據(jù)，所述用戶數(shù)據(jù)指示用戶的姿勢、措辭和人口統(tǒng)計學特征中的至少一個；并且
[0025]其中，所述確定所述用戶交互樣式還基于所述用戶數(shù)據(jù)。
[0026]11.如技術方案I所述的方法，還包括基于所述交互樣式來調整非語音系統(tǒng)反饋。
[0027]12.如技術方案I所述的方法，其中，所述接收所述第一話語是通過車輛的人機交互模塊的。
[0028]13.一種用于管理語音系統(tǒng)的語音對話的系統(tǒng)，包括:
[0029]第一模塊，其接收來自所述語音系統(tǒng)的用戶的至少一個第一話語，并基于所述至少一個第一話語來確定用戶交互樣式；以及
[0030]第二模塊，其基于所述交互樣式生成對用戶的反饋。
[0031]14.如技術方案13所述的系統(tǒng)，還包括:
[0032]第三模塊，其基于所述第一話語確定下一個語音提示，并且其中，第二模塊基于所述用戶交互樣式調整下一個語音提示，并基于調整后的語音提示生成反饋。
[0033]15.如技術方案14所述的系統(tǒng)，其中，第一模塊確定多個用戶交互樣式，并且其中，第二模塊基于所述多個用戶交互樣式來調整所述反饋。
[0034]16.如技術方案13所述的系統(tǒng),其中,第一模塊基于樣式處理方法來確定所述用戶交互樣式，所述樣式處理方法包括與相互作用式樣式相關聯(lián)的參數(shù)。
[0035]17.如技術方案16所述的系統(tǒng)，其中，所述參數(shù)是下列項中的至少一項:預定義的和從其它語音話語中獲悉的。
[0036]18.如技術方案13所述的系統(tǒng)，其中，所述用戶交互樣式是下列項中的至少一項:高效的交互樣式、相互作用式的交互樣式、老年人的交互樣式、年輕人的交互樣式、規(guī)范的交互樣式和非規(guī)范的交互樣式。
[0037]19.如技術方案13所述的系統(tǒng)，其中，第一模塊接收用戶數(shù)據(jù)，所述用戶數(shù)據(jù)指示用戶的姿勢、措辭和人口統(tǒng)計學特征中的至少一個，并還基于所述用戶數(shù)據(jù)確定所述用戶交互樣式。
[0038]20.如技術方案13所述的系統(tǒng)，其中，第二模塊基于所述交互樣式來調整非語音系統(tǒng)反饋。

【專利附圖】

【附圖說明】
[0039]下面結合以下附圖描述示例性實施例，其中相似的標記表示相似的部件，在附圖中:
[0040]圖1是依據(jù)各種示例性實施例的包括語音系統(tǒng)的車輛的功能性方框圖；
[0041]圖2是示出了根據(jù)各種示例性實施例的語音系統(tǒng)的數(shù)據(jù)流圖；
[0042]圖3是示出了根據(jù)各種示例性實施例的可由語音系統(tǒng)執(zhí)行的語音方法的流程圖。

【具體實施方式】
[0043]以下的詳細描述本質上僅僅是示例性的，并不意圖限制應用和用途。此外，沒有意圖由在前面的【技術領域】、【背景技術】、
【發(fā)明內容】
或以下的詳細說明中給出的任何已表述的或暗示的理論所約束。如這里所使用的，術語模塊指專用集成電路(ASIC)，電子電路，執(zhí)行一個或多個軟件或固件程序的處理器(共享的，專用的，或成組的)和存儲器，組合邏輯電路，和/或能夠提供所描述功能的其它合適組件。
[0044]根據(jù)本公開的示例性實施例，示出了包括在車輛12內的語音系統(tǒng)10。在各種示例性實施例中，語音系統(tǒng)10提供語音識別或理解，以及用于通過人機交互模塊(HMI)模塊14的一個或多個車輛系統(tǒng)的對話。這些車輛系統(tǒng)可以包括，比如，但不限制于，電話系統(tǒng)16，導航系統(tǒng)18，媒體系統(tǒng)20，信息通信系統(tǒng)22，網絡系統(tǒng)24，或能夠包括依賴語音應用的其它任何車輛系統(tǒng)。如能夠理解的，語音系統(tǒng)10的一個或多個實施例可以被應用到具有依賴語音應用的其它非車輛系統(tǒng)，并因此，并不限于當前的車輛示例。
[0045]語音系統(tǒng)10和/或HMI模塊14通過通信總線和/或其它通信裝置26 (比如，有線的，短距離無線的，或長距離無線的)與多個車輛系統(tǒng)14-24通信。通信總線可以是(比如，但不限制于)控制器區(qū)域網(CAN)總線，局部互連網絡(LIN)總線，或任何其它類型的總線。
[0046]語音系統(tǒng)10包括語音識別模塊32、對話管理模塊34和語音生成模塊35。應當理解，語音識別模塊32、對話管理模塊34和語音生成模塊35可以被實現(xiàn)為分開系統(tǒng)和/或實現(xiàn)為所示的組合系統(tǒng)。通常，語音識別模塊32使用依靠語義解釋和/或自然語言理解的一個或多個語音識別技術來接收和處理來自HMI模塊14的語音話語。語音識別模塊32根據(jù)語音話語(比如，基于置信度閾值)將一個或多個可能的結果生成到對話管理模塊34。
[0047]對話管理模塊34基于結果管理交互次序和要說給用戶的語音提示的選擇。在各種實施例中，對話管理模塊34響應于用戶的語音話語，確定由系統(tǒng)生成的下一個語音提示。之后，對話管理模塊34在語音話語中檢測用戶的特定的交互樣式，并且基于交互樣式選擇性地調整(adapt)下一個語音提示。該調整后的語音提示被語音生成模塊35轉換為口頭提示，并通過HMI模塊14呈現(xiàn)給用戶。如所能理解的，這些調整方法可以被實現(xiàn)為語音系統(tǒng)10的其它模塊的一部分(比如，作為分開模塊或另一模塊的一部分)。為達到示范的目的，將在實現(xiàn)調整方法的對話管理模塊34的背景下討論本公開。
[0048]作為示例，如果來自用戶的語音話語識別為:
[0049]用戶John Smith,他的手機?！?(“John Simth on his mobile.”)
[0050]該對話管理模塊34檢測到用戶“高效的”交互樣式，并將對用戶的下一個語音提示(prompt)調整成為直入主題的(高效的)，比如:
[0051]系統(tǒng):“呼叫John Smith 的手機?！?(“Calling John Simth on his mobile.，，)
[0052]作為另一示例，如果來自用戶的語音話語被識別為:
[0053]用戶我想要呼叫John Smith 的手機?！?“I would like to call John Simthon his mobile.”)
[0054]該對話管理模塊34檢測到用戶“相互作用式的”(更加多話的；更少程度地指向主題)交互樣式，并將對用戶的下一個語音提示調整成為相似的樣式一相互作用式的，比如:
[0055]系統(tǒng):“收到！我將呼叫John Smith 的手機?！?“Got it ! I’m calling JohnSimth on his mobile.，，)
[0056]如下面將會更加詳細地討論的，對話管理模塊34能夠檢測各種交互樣式，并且“相互作用式的”樣式和“高效的”樣式僅僅是因示范性目的被提供。在各種實施例中，對話管理模塊34能夠基于交互樣式另外地調整對用戶的其它非語音相關反饋(比如，觸覺的或視覺的)。這些非語音相關反饋可以與車輛系統(tǒng)14-24的控制特征或其它特征相關聯(lián)。
[0057]現(xiàn)在參考圖2并繼續(xù)參考圖1，數(shù)據(jù)流圖示出了根據(jù)各種示例性實施例的對話管理模塊34。如能夠理解的那樣，根據(jù)本公開，對話管理模塊34的各種示例性實施例可以包括任意數(shù)量的子模塊。在各種示例性實施例中，圖2示出的子模塊可以組合和/或被另外地拆分以便類似地管理語音對話和/或其它反饋。在各種示例性實施例中，對話管理模塊34包括樣式分類模塊40、反饋管理模塊42和調整模塊44。
[0058]樣式分類模塊40接收語音話語46作為輸入，語音話語46或者是由用戶通過HMI模塊14提供的，或者是語音識別模塊32的結果。應當理解，語音話語46可以是語音話語的任何部分的或全部的數(shù)據(jù)表征。樣式分類模塊40使用一個或多個樣式處理方法來處理語音話語46以確定語音話語46的一個或多個交互樣式48。
[0059]比如，樣式分類模塊40可以包括一個或多個預先定義的交互樣式，比如，但不限于，高效的樣式，相互作用式(interactive)的樣式,老年人的樣式,年輕人的樣式,非規(guī)范(informal)的樣式，規(guī)范(formal)的樣式，或者可以或可以不基于用戶人口統(tǒng)計學特征(demographics)定義的任何其他交互樣式。在另一示例中，交互樣式可以通過用戶與系統(tǒng)的反復交互獲悉。不管交互樣式是獲悉的還是預先被定義的，樣式處理方法都是基于與交互樣式相關聯(lián)的參數(shù)(比如，獲悉的或者是預先定義的)來處理語音話語46的。比如，與高效的樣式相關聯(lián)的預先定義的參數(shù)可以包括，但不限于，對話的輪數(shù)，交互時間，命令長度和單詞中的變化。在另一示例中，與相互作用式的樣式相關聯(lián)的預先定義參數(shù)可以包括，但不限于，單詞中的變化、命令長度、某些類型的單詞的使用以及對系統(tǒng)名字使用的指標。
[0060]在各種實施例中，樣式分類模塊40可另外地將指示用戶姿勢(gesture)、措辭或人口統(tǒng)計學特征的用戶數(shù)據(jù)50接收作為輸入。如所能理解的那樣，用戶數(shù)據(jù)50可以通過車輛12的一個或多個傳感器系統(tǒng)從用戶那里直接感測到(比如，當用戶主動或被動地與系統(tǒng)交互時)或者可以由用戶通過使用車輛的12的一個或多個配置系統(tǒng)配置。樣式分類模塊40除了語音話語46外還處理用戶數(shù)據(jù)50以確定一個或多個交互樣式48。比如，樣式處理方法的參數(shù)可以基于用戶姿勢、措辭或人口統(tǒng)計學特征來設置，并且樣式處理方法使用這些參數(shù)來處理用戶數(shù)據(jù)50。
[0061]反饋管理模塊42將語音話語52接收作為輸入。在這種情況下，語音話語52是來自語音識別模塊32的結果，或是語音話語的任何其它部分地或全部地被處理的數(shù)據(jù)表征。反饋管理模塊42基于語音話語52選擇語音提示54。例如，如果結果指示未識別出語音話語52的一個或多個部分，反饋管理模塊42可以選擇從用戶那里要求更多信息的語音提示54。在另一示例中，如果結果指示識別具有一定置信度，那么反饋管理模塊42可選擇確認語音話語中信息的語音提示54。
[0062]調整模塊44將語音提示54和交互樣式48接收作為輸入。調整模塊44基于所檢測的交互樣式48在語音提示54上執(zhí)行一個或多個調整方法。調整方法修改語音提示54以使它與交互樣式48—致或回應(reciprocate)交互樣式48。調整方法可以基于與交互樣式48的檢測和/或其它預定義的或獲悉的參數(shù)相關聯(lián)的相同或相似的參數(shù)來修改語音提示54。比如，如果交互樣式48是高效的并且語音提示54是確認提示，那么確認提示基于能夠使提示變得有效、具有簡短和簡明語言的參數(shù)而修改。在另一示例中，如果交互樣式48是相互作用式的并且語音提示54是確認提示，那么確認提示基于能夠使提示變得更加交互、具有更詳細語言的參數(shù)而修改。在各種實施例中，語音提示54可以基于從用戶獲悉的參數(shù)和語言，和/或基于預先定義的參數(shù)和語言而修改。
[0063]一旦語音提示54已調整，則調節(jié)模塊44就會生成調整的語音提示56以供語音生成模塊35使用。
[0064]在各種實施例中，調整模塊44基于交互樣式48還調整其它非語音反饋58。比如，調整模塊44基于交互樣式48調整觸覺反饋、嗓音(voice)反饋、聲音(sound)反饋和/或視覺反饋。非語音反饋58可以(比如)與其中對話正在發(fā)生的車輛系統(tǒng)14-24的特征相關聯(lián)。
[0065]現(xiàn)在參見圖3，流程圖示出了依據(jù)各種示例性實施例由語音系統(tǒng)10所執(zhí)行的語音方法。如根據(jù)本公開所能理解的那樣，該方法中的操作次序并不限于如附圖3所示出的順序執(zhí)行，而是可以以一個或多個改變的順序執(zhí)行(作為可應用的并根據(jù)本公開)。如能另外地理解的，在不改變本方法精神的情況下，可以增加或去除該方法的一個或多個步驟。
[0066]如所示出的，該方法可在100處開始。在110處，接收語音話語46。在120處，對語音話語46執(zhí)行一個或多個語音識別方法以確定結果?？蛇x地，在130處，接收用戶數(shù)據(jù)50。在140處，該結果和(可選地)用戶數(shù)據(jù)50基于一個或多個樣式處理方法來處理以確定交互樣式48。在150處，基于語音話語52的結果來確定語音提示54。在160處，基于交互樣式48調整150處的語音提示54?？蛇x地，在170處，基于交互樣式48調整其它反饋。之后，在180處，調整后的語音提示56被轉換為語音，并生成給用戶，并且可選地，在190處，將調整后的其他反饋58生成給用戶。該方法可在200處結束。
[0067]如能夠理解的，在各種實施例中，該方法對于由用戶所提供的任意數(shù)量的語音話語可以重復，或者該方法可以將特定的交互樣式維持達設定的時間段(比如，在車輛的當前操作期間)或達由用戶所說的語音話語的X數(shù)量。
[0068]盡管在前面的詳細描述中已介紹了至少一個示例性實施例，然而應該能夠理解存在非常多的變形。還應該理解，示例性實施例或多個示例性實施例僅僅是示例，并無論如何不意圖限制本公開的范圍，適用性或配置。相反，前面的詳細描述將會為本領域技術人員提供實施示例性實施例或多個示例性實施例的便捷的路線圖。應該理解，在不背離本公開的范圍的情況下，元件的功能和布置中可以做出各種改變，如在所附權利要求及其合法等效物中闡述的。
【權利要求】
1.一種用于管理語音系統(tǒng)的語音對話的方法，包括: 接收來自語音系統(tǒng)的用戶的至少一個第一話語；基于所述至少一個第一話語來確定用戶交互樣式；以及基于所述交互樣式生成對用戶的反饋。
2.如權利要求1所述的方法，還包括: 基于所述第一話語確定下一個語音提示；以及基于所述用戶交互樣式調整下一個語音提示，其中，所述生成所述反饋是基于調整后的語音提示的。
3.如權利要求2所述的方法，其中，所述確定用戶交互樣式包括確定多個用戶交互樣式，并且其中，所述調整包括基于所述多個用戶交互樣式來調整所述反饋。
4.如權利要求1所述的方法，其中，所述確定所述用戶交互樣式是基于樣式處理方法的，所述樣式處理方法包括與相互作用式樣式相關聯(lián)的參數(shù)。
5.如權利要求3所述的方法，其中，所述參數(shù)是預先定義的。
6.如權利要求3所述的方法，其中，所述參數(shù)是從其它語音話語獲悉的。
7.如權利要求1所述的方法，其中，所述用戶交互樣式是高效的交互樣式和相互作用式的交互樣式中的至少一個。
8.如權利要求1所述的方法，其中，所述用戶交互樣式是老年人的交互樣式和年輕人的交互樣式中的至少一個。
9.如權利要求1所述的方法,其中,所述用戶交互樣式是規(guī)范交互樣式和非規(guī)范的交互樣式中的至少一個。
10.一種用于管理語音系統(tǒng)的語音對話的系統(tǒng)，包括: 第一模塊，其接收來自所述語音系統(tǒng)的用戶的至少一個第一話語，并基于所述至少一個第一話語來確定用戶交互樣式；以及第二模塊，其基于所述交互樣式生成對用戶的反饋。
【文檔編號】G06F3/01GK104166459SQ201410399680
【公開日】2014年11月26日申請日期:2014年5月15日優(yōu)先權日:2013年5月15日
【發(fā)明者】U·溫特, T·格羅斯特申請人:通用汽車環(huán)球科技運作有限責任公司

完整全部詳細技術資料下載