使用web數(shù)據(jù)訓(xùn)練口述對話系統(tǒng)中的統(tǒng)計(jì)對話管理器的制造方法

文檔序號：2825640閱讀：247來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

使用web數(shù)據(jù)訓(xùn)練口述對話系統(tǒng)中的統(tǒng)計(jì)對話管理器的制造方法
【專利摘要】可以提供統(tǒng)計(jì)對話管理器的訓(xùn)練。可以接收與目的相關(guān)聯(lián)的多個(gè)日志數(shù)據(jù)，并且可以識(shí)別出根據(jù)所述多個(gè)日志數(shù)據(jù)的與完成所述目的相關(guān)聯(lián)的至少一個(gè)措施?？梢詣?chuàng)建與所述目的相關(guān)聯(lián)的理解模型，其包括映射到所述目的的多個(gè)查詢。響應(yīng)于接收到來自用戶的與所述目的相關(guān)聯(lián)的自然語言查詢，可以根據(jù)所述理解模型提供針對所述用戶的響應(yīng)。
【專利說明】使用web數(shù)據(jù)訓(xùn)練口述對話系統(tǒng)中的統(tǒng)計(jì)對話管理器
【背景技術(shù)】
[0001]可以挖掘web數(shù)據(jù)為口語理解(SLU)應(yīng)用提供訓(xùn)練。限制統(tǒng)計(jì)對話管理器(SDM)大規(guī)模部署的重大障礙是訓(xùn)練SDM模型所需的帶注釋對話的數(shù)量。對大訓(xùn)練語料庫的需求起因于口語理解系統(tǒng)的所有可能輸出上的連同信念空間(belief space)的狀態(tài)變量的大量組合。在常規(guī)系統(tǒng)中，處理成千上萬的模擬對話的縮放SDM方法是一個(gè)關(guān)鍵字重新搜索問題，特別在已知的部分可觀察馬爾可夫決策過程(partially observable Markov decisionprocess，POMDP)方法中。例如，解決這個(gè)問題的常規(guī)方法依賴于單調(diào)的初始化；如果使用該系統(tǒng)，則從真實(shí)用戶獲得訓(xùn)練數(shù)據(jù)，并且對其注釋以訓(xùn)練更好的模型。但是對于真實(shí)世界的SDM來說，這種自展統(tǒng)計(jì)模型不是所希望的，因?yàn)槌跏嫉挠脩趔w驗(yàn)是匱乏而有限的。另外，后來的學(xué)習(xí)偏向于簡化的交互，因?yàn)檫@些是對于用戶而言得到成功的僅有的對話。

【發(fā)明內(nèi)容】

[0002]提供本
【發(fā)明內(nèi)容】
以簡化形式介紹概念的選擇，以下在【具體實(shí)施方式】中將進(jìn)一步描述這些概念。本
【發(fā)明內(nèi)容】
并非旨在標(biāo)識(shí)所要求保護(hù)主題的關(guān)鍵特征或必要特征。本
【發(fā)明內(nèi)容】
也不旨在用于限制所要求保護(hù)主題的范圍。
[0003]可以提供統(tǒng)計(jì)對話管理器的訓(xùn)練?？梢越邮张c目的相關(guān)聯(lián)的多個(gè)日志數(shù)據(jù)，并且可以識(shí)別出根據(jù)所述多個(gè)日志數(shù)據(jù)的與完成該目的相關(guān)聯(lián)的至少一個(gè)措施?？梢詣?chuàng)建與該目的相關(guān)聯(lián)的理解模型，其包括映射到該目的的多個(gè)查詢。響應(yīng)于接收到來自用戶的與該目的相關(guān)聯(lián)的自然語言查詢，可以根據(jù)該理解模型提供針對用戶的響應(yīng)。
[0004]前述概括描述及以下詳細(xì)描述二者提供了實(shí)例，并且僅是說明性的。因此，前述概括描述及以下詳細(xì)描述不應(yīng)當(dāng)被認(rèn)為是限制性的。此外，除了本文中所闡述的那些特征或變體之外，還可以提供特征或變體。例如，實(shí)施例可以涉及【具體實(shí)施方式】中描述的各種特征組合和子組合。
【專利附圖】

【附圖說明】
[0005]合并在本公開中且構(gòu)成本公開的一部分的附圖圖示了本發(fā)明的各種實(shí)施例。在圖中:
圖1是操作環(huán)境的方塊圖；
圖2是一種用于提供統(tǒng)計(jì)對話管理器訓(xùn)練的方法的流程圖；
圖3是一種用于與統(tǒng)計(jì)對話管理器進(jìn)行交互的方法的流程圖；以及圖4是計(jì)算裝置的方塊圖。
【具體實(shí)施方式】
[0006]以下詳細(xì)描述參考附圖。只要可能，就在附圖及以下描述中使用相同的附圖標(biāo)記來指示相同或相似的元素。雖然可能描述了本發(fā)明的實(shí)施例，但是修改、改編及其它實(shí)現(xiàn)方式也是可能的。例如，可對附圖中所圖示的元素進(jìn)行置換、添加或者修改，并且可以通過對所公開的方法進(jìn)行置換、重新排序或添加步驟來修改本文中描述的方法。因此，以下詳細(xì)描述并不限制本發(fā)明。
[0007]本發(fā)明的實(shí)施例可以提供一種使用web數(shù)據(jù)訓(xùn)練口述對話系統(tǒng)(SDS)中的統(tǒng)計(jì)對話管理器(SDM)的系統(tǒng)和/或方法?？梢岳么嬖谟谥醒胪泄艿膚eb搜索引擎和瀏覽器中的大量記入日志的用戶交互，以為對話管理器提供訓(xùn)練數(shù)據(jù)。用戶使用搜索和瀏覽的組合，在web上完成日常任務(wù)。搜索數(shù)據(jù)的數(shù)量可能超出數(shù)億用戶上的每天100M查詢，而且任務(wù)的廣度極大，因而造成了 “長尾(long tail)”web搜索。這些任務(wù)的范圍可以從簡單任務(wù)(天氣、找出方向、本地事件)到更復(fù)雜任務(wù)(購物、計(jì)劃旅行、計(jì)劃外面過夜)。在完成這些任務(wù)的過程中，用戶可以參加與他們的搜索引擎和瀏覽器的有限的對話。例如，用戶可以表達(dá)表示其打算的特定目標(biāo)或目的的查詢，將其輸入搜索引擎，并且然后基于來自搜索引擎的結(jié)果，用重新表達(dá)的查詢作出響應(yīng)。對于另一實(shí)例，一系列導(dǎo)航選擇可以用來推斷用戶的目的而不用接收明確的查詢，比如其中，用戶在購物站點(diǎn)上開始并且通過逐漸縮小的標(biāo)準(zhǔn)進(jìn)行瀏覽(例如，電子設(shè)備_>攝像機(jī)_>數(shù)字的_>SLR)。
[0008]按照本發(fā)明的實(shí)施例，可以從文本/點(diǎn)擊搜索和瀏覽器交互映射口述對話。不管是采用web瀏覽器還是經(jīng)由口述對話系統(tǒng)來完成，目標(biāo)/任務(wù)和完成該目標(biāo)/任務(wù)而采取的步驟的次序可以是相似的，盡管用戶所希望的動(dòng)作的表現(xiàn)形式是不同的。為了解決這種失配，對話建模問題可以分為兩部分:(1)從《必日志學(xué)習(xí)在瀏覽器和基于SDS的交互之間是共同的目標(biāo)/任務(wù)完成的基本處理，以及(2)學(xué)習(xí)用戶的web交互(搜索查詢，點(diǎn)擊)到自然口述會(huì)話的轉(zhuǎn)換。
[0009]可以將任務(wù)完成的主要元素分類為理解用戶如何導(dǎo)航任務(wù)、確定用戶是否對系統(tǒng)交互感到滿意、以及基于任務(wù)中的進(jìn)展預(yù)測系統(tǒng)響應(yīng)。可以從大規(guī)模的搜索/瀏覽器交互學(xué)習(xí)這些方面，并且這些方面可以被轉(zhuǎn)化到SDS中。例如，大多數(shù)當(dāng)前的對話系統(tǒng)對較簡單的任務(wù)進(jìn)行建模，并且沒有打算任務(wù)中斷或者任務(wù)間的切換。然而，在諸如計(jì)劃外面過夜之類的較復(fù)雜的任務(wù)中，我們觀察到用戶在具有“室外的美好野餐”之后“找個(gè)電影看”的子任務(wù)之間跳轉(zhuǎn)。類似地，可以基于web數(shù)據(jù)學(xué)習(xí)任務(wù)內(nèi)的行為的次序和/或定序，諸如其中，核對賓館通常跟著登記航班。
[0010]從web交互學(xué)習(xí)的任務(wù)完成的特征也可以從頭到尾作為統(tǒng)計(jì)對話建模系統(tǒng)的特征而持有(port)。例如，用戶在搜索結(jié)果后點(diǎn)擊或點(diǎn)擊持續(xù)時(shí)間上花費(fèi)的時(shí)間可以被認(rèn)為是用戶已經(jīng)找到感興趣的結(jié)果的好信號。在口述對話或多模態(tài)系統(tǒng)交互中，用戶花費(fèi)的研究由該系統(tǒng)傳遞的飯店地圖的時(shí)間可以被認(rèn)為是該系統(tǒng)已經(jīng)向用戶傳遞了感興趣結(jié)果的好信號。在web搜索中，重新鍵入或者重新表達(dá)查詢典型地表示用戶沒有為第一查詢找到滿意的答案。對于對話系統(tǒng)，向系統(tǒng)重新陳述問題或者簡化請求類似地可以被認(rèn)為是與該系統(tǒng)的用戶交互是不順利的指示物。
[0011 ] 對于口述對話系統(tǒng)，可以通過自動(dòng)地加入可計(jì)算因素，來對統(tǒng)計(jì)對話管理(SDM)的用戶滿意度評分。在學(xué)習(xí)對話管理器的機(jī)器動(dòng)作中，用戶滿意度分?jǐn)?shù)可以用作對加強(qiáng)學(xué)習(xí)的獎(jiǎng)賞。還可以通過利用來自用戶web搜索和瀏覽活動(dòng)的數(shù)據(jù)來對用戶滿意度評分?？梢詫ⅠR爾可夫模型分類方法應(yīng)用于SDM，并且通過計(jì)算以下四種類型的特征對其進(jìn)行擴(kuò)展以確定會(huì)話成功:與轉(zhuǎn)變(turn)有關(guān)的特征、與整個(gè)會(huì)話有關(guān)的特征、與查詢有關(guān)的特征、以及與用戶點(diǎn)擊的統(tǒng)一資源定位符(URL)有關(guān)的特征。[0012]轉(zhuǎn)變可以包括用戶動(dòng)作，例如點(diǎn)擊搜索結(jié)果或付費(fèi)廣告、點(diǎn)擊后退按鈕、輸入新查詢等。轉(zhuǎn)變特征可能與用戶已經(jīng)遵循的具有相關(guān)聯(lián)的時(shí)間信息的狀態(tài)序列有關(guān)。例如，所采取的狀態(tài)的馬爾可夫模型可以包括基于使用43種可能的用戶動(dòng)作(狀態(tài))的第一次序的馬爾可夫模型的特征。使用如以下等式I描述的最大似然估計(jì)，可以利用滿意(MMs)和不滿
意(MMd)會(huì)話來訓(xùn)練兩個(gè)MM。N 包括從狀態(tài)&.到&的轉(zhuǎn)換數(shù)量，并且iV^可以包括
狀態(tài)被訪問的次數(shù)的數(shù)目。
【權(quán)利要求】
1.一種用于提供統(tǒng)計(jì)對話管理器訓(xùn)練的方法，所述方法包括: 接收來自用戶的口述查詢；根據(jù)所述口述查詢創(chuàng)建信念狀態(tài)，其中，所述信念狀態(tài)包括所估計(jì)的用戶目的；確定多個(gè)日志數(shù)據(jù)中的至少一個(gè)是否與所估計(jì)的目的相關(guān)聯(lián)；以及響應(yīng)于確定所述多個(gè)日志數(shù)據(jù)中的所述至少一個(gè)與所估計(jì)的目的相關(guān)聯(lián): 根據(jù)所述多個(gè)日志數(shù)據(jù)中的所述至少一個(gè)的至少一個(gè)元素更新所述信念狀態(tài)，以及根據(jù)所更新的信念狀態(tài)向所述用戶提供響應(yīng)。
2.如權(quán)利要求1所述的方法，還包括: 響應(yīng)于確定所述多個(gè)日志數(shù)據(jù)中的所述至少一個(gè)沒有與所估計(jì)的目的相關(guān)聯(lián): 向所述用戶查詢至少一個(gè)附加提示，從用戶接收針對所述查詢的響應(yīng)，以及根據(jù)所接收的響應(yīng)更新所述信念狀態(tài)。
3.如權(quán)利要求1所述的方法，還包括使用所提供的響應(yīng)來更新所述信念狀態(tài)。
4.如權(quán)利要求3所述的方法，還包括: 接收來自所述用戶的第二口述查詢；確定所述第二口述查詢是否與所估計(jì)的目的相關(guān)聯(lián)；以及響應(yīng)于確定所述第二口述查詢與所估計(jì)的目的相關(guān)聯(lián): 根據(jù)所述第二口述查詢更新所述信念狀態(tài)，以及根據(jù)所更新的信念狀態(tài)，向所述用戶提供第二響應(yīng)。
5.如權(quán)利要求4所述的方法，還包括: 確定所述第二口述查詢是否與到第二目的的轉(zhuǎn)換相關(guān)聯(lián)；以及響應(yīng)于確定所述第二口述查詢與所述轉(zhuǎn)換相關(guān)聯(lián): 根據(jù)所述第二口述查詢創(chuàng)建第二信念狀態(tài)，根據(jù)先前創(chuàng)建的信念狀態(tài)填充所述第二信念狀態(tài)的至少一個(gè)元素，以及根據(jù)所述第二信念狀態(tài)向所述用戶提供第三響應(yīng)。
6.一種用于提供統(tǒng)計(jì)對話管理器訓(xùn)練的系統(tǒng)，所述系統(tǒng)包括: 存儲(chǔ)器存儲(chǔ)裝置；以及耦合到所述存儲(chǔ)器存儲(chǔ)裝置的處理單元，其中，所述處理單元能夠操作來: 接收與目的相關(guān)聯(lián)的多個(gè)日志數(shù)據(jù)，根據(jù)所述多個(gè)日志數(shù)據(jù)，識(shí)別出與完成所述目的相關(guān)聯(lián)的至少一個(gè)措施，創(chuàng)建與所述目的相關(guān)聯(lián)的理解模型，將多個(gè)查詢映射到所述目的，響應(yīng)于接收到來自用戶的自然語言查詢，確定所述自然語言查詢是否與所述目的相關(guān)聯(lián)，以及響應(yīng)于確定所述自然語言查詢與所述目的相關(guān)聯(lián)，根據(jù)所述理解模型向所述用戶提供響應(yīng)。
7.如權(quán)利要求6所述的系統(tǒng)，其中，所述處理單元還操作來: 根據(jù)所述多個(gè)日志數(shù)據(jù)識(shí)別至少一個(gè)轉(zhuǎn)換提示；以及將所述至少一個(gè)轉(zhuǎn)換提示并入所述理解模型。
8.如權(quán)利要求6所述的系統(tǒng)，其中，所述處理單元還操作來針對所述多個(gè)日志數(shù)據(jù)中的每一個(gè)，確定所述目的是否已被成功完成。
9.如權(quán)利要求6所述的系統(tǒng)，其中，所述處理單元還操作來響應(yīng)于接收到來自所述用戶的至少一個(gè)附加的自然語言查詢，改進(jìn)與所述目的相關(guān)聯(lián)的信念狀態(tài)。
10.一種存儲(chǔ)指令集的計(jì)算機(jī)可讀介質(zhì)，當(dāng)執(zhí)行所述指令集時(shí)執(zhí)行一種用于提供統(tǒng)計(jì)對話管理器的訓(xùn)練的方法，由所述指令集執(zhí)行的所述方法包括: 選擇多個(gè)日志數(shù)據(jù)的與目的相關(guān)聯(lián)的子集，其中，所述多個(gè)日志數(shù)據(jù)的所述子集中的每一個(gè)包括與以下項(xiàng)中的至少一個(gè)相關(guān)聯(lián)的會(huì)話日志:關(guān)鍵詞和網(wǎng)站；確定所述日志數(shù)據(jù)的子集中的至少一個(gè)是否與所述目的的成功完成相關(guān)聯(lián)；響應(yīng)于確定所述日志數(shù)據(jù)的子集中的所述至少一個(gè)不與所述目的的成功完成相關(guān)聯(lián)，丟棄所述日志數(shù)據(jù)的子集中的所述至少一個(gè)；識(shí)別所述日志數(shù)據(jù)的子集內(nèi)的多個(gè)轉(zhuǎn)換提示，其中，所述轉(zhuǎn)換提示中的每一個(gè)都與以下項(xiàng)中的至少一個(gè)相關(guān)聯(lián):與完成所述目的相關(guān)聯(lián)的新任務(wù)和第二目的；根據(jù)所述日志數(shù)據(jù)的子集，將多個(gè)查詢術(shù)語映射到所述目的；根據(jù)所述日志數(shù)據(jù)的子集，創(chuàng)建與完成所述目的相關(guān)聯(lián)的理解模型；接收來自用戶的自然語言查詢；根據(jù)所映射的多個(gè)查詢術(shù)語，確定所述自然語言查詢是否與所述目的相關(guān)聯(lián)；以及響應(yīng)于確定所述自然語言查詢與所述目的相關(guān)聯(lián): 建立與所述自然語言查詢相關(guān)聯(lián)的信念狀態(tài)，根據(jù)所述理解模型填充所述信念狀態(tài)，以及根據(jù)所述信念狀態(tài)向所述用戶提供響應(yīng)。
【文檔編號】G10L15/08GK103534697SQ201280023617
【公開日】2014年1月22日申請日期:2012年5月11日優(yōu)先權(quán)日:2011年5月13日
【發(fā)明者】L.P.赫克, D.哈卡尼-圖爾, R.葉爾, G.圖爾申請人:微軟公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：L.P.赫克;D.哈卡尼-圖爾;R.葉爾;G.圖爾
技術(shù)所有人：微軟公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

使用web數(shù)據(jù)訓(xùn)練口述對話系統(tǒng)中的統(tǒng)計(jì)對話管理器的制造方法