使用web數(shù)據(jù)訓(xùn)練口述對話系統(tǒng)中的統(tǒng)計(jì)對話管理器的制造方法
【專利摘要】可以提供統(tǒng)計(jì)對話管理器的訓(xùn)練。可以接收與目的相關(guān)聯(lián)的多個(gè)日志數(shù)據(jù),并且可以識(shí)別出根據(jù)所述多個(gè)日志數(shù)據(jù)的與完成所述目的相關(guān)聯(lián)的至少一個(gè)措施??梢詣?chuàng)建與所述目的相關(guān)聯(lián)的理解模型,其包括映射到所述目的的多個(gè)查詢。響應(yīng)于接收到來自用戶的與所述目的相關(guān)聯(lián)的自然語言查詢,可以根據(jù)所述理解模型提供針對所述用戶的響應(yīng)。
【專利說明】使用web數(shù)據(jù)訓(xùn)練口述對話系統(tǒng)中的統(tǒng)計(jì)對話管理器
【背景技術(shù)】
[0001]可以挖掘web數(shù)據(jù)為口語理解(SLU)應(yīng)用提供訓(xùn)練。限制統(tǒng)計(jì)對話管理器(SDM)大規(guī)模部署的重大障礙是訓(xùn)練SDM模型所需的帶注釋對話的數(shù)量。對大訓(xùn)練語料庫的需求起因于口語理解系統(tǒng)的所有可能輸出上的連同信念空間(belief space)的狀態(tài)變量的大量組合。在常規(guī)系統(tǒng)中,處理成千上萬的模擬對話的縮放SDM方法是一個(gè)關(guān)鍵字重新搜索問題,特別在已知的部分可觀察馬爾可夫決策過程(partially observable Markov decisionprocess,POMDP)方法中。例如,解決這個(gè)問題的常規(guī)方法依賴于單調(diào)的初始化;如果使用該系統(tǒng),則從真實(shí)用戶獲得訓(xùn)練數(shù)據(jù),并且對其注釋以訓(xùn)練更好的模型。但是對于真實(shí)世界的SDM來說,這種自展統(tǒng)計(jì)模型不是所希望的,因?yàn)槌跏嫉挠脩趔w驗(yàn)是匱乏而有限的。另外,后來的學(xué)習(xí)偏向于簡化的交互,因?yàn)檫@些是對于用戶而言得到成功的僅有的對話。
【發(fā)明內(nèi)容】
[0002]提供本
【發(fā)明內(nèi)容】
以簡化形式介紹概念的選擇,以下在【具體實(shí)施方式】中將進(jìn)一步描述這些概念。本
【發(fā)明內(nèi)容】
并非旨在標(biāo)識(shí)所要求保護(hù)主題的關(guān)鍵特征或必要特征。本
【發(fā)明內(nèi)容】
也不旨在用于限制所要求保護(hù)主題的范圍。
[0003]可以提供統(tǒng)計(jì)對話管理器的訓(xùn)練??梢越邮张c目的相關(guān)聯(lián)的多個(gè)日志數(shù)據(jù),并且可以識(shí)別出根據(jù)所述多個(gè)日志數(shù)據(jù)的與完成該目的相關(guān)聯(lián)的至少一個(gè)措施??梢詣?chuàng)建與該目的相關(guān)聯(lián)的理解模型,其包括映射到該目的的多個(gè)查詢。響應(yīng)于接收到來自用戶的與該目的相關(guān)聯(lián)的自然語言查詢,可以根據(jù)該理解模型提供針對用戶的響應(yīng)。
[0004]前述概括描述及以下詳細(xì)描述二者提供了實(shí)例,并且僅是說明性的。因此,前述概括描述及以下詳細(xì)描述不應(yīng)當(dāng)被認(rèn)為是限制性的。此外,除了本文中所闡述的那些特征或變體之外,還可以提供特征或變體。例如,實(shí)施例可以涉及【具體實(shí)施方式】中描述的各種特征組合和子組合。
【專利附圖】
【附圖說明】
[0005]合并在本公開中且構(gòu)成本公開的一部分的附圖圖示了本發(fā)明的各種實(shí)施例。在圖中:
圖1是操作環(huán)境的方塊圖;
圖2是一種用于提供統(tǒng)計(jì)對話管理器訓(xùn)練的方法的流程圖;
圖3是一種用于與統(tǒng)計(jì)對話管理器進(jìn)行交互的方法的流程圖;以及 圖4是計(jì)算裝置的方塊圖。
【具體實(shí)施方式】
[0006]以下詳細(xì)描述參考附圖。只要可能,就在附圖及以下描述中使用相同的附圖標(biāo)記來指示相同或相似的元素。雖然可能描述了本發(fā)明的實(shí)施例,但是修改、改編及其它實(shí)現(xiàn)方式也是可能的。例如,可對附圖中所圖示的元素進(jìn)行置換、添加或者修改,并且可以通過對所公開的方法進(jìn)行置換、重新排序或添加步驟來修改本文中描述的方法。因此,以下詳細(xì)描述并不限制本發(fā)明。
[0007]本發(fā)明的實(shí)施例可以提供一種使用web數(shù)據(jù)訓(xùn)練口述對話系統(tǒng)(SDS)中的統(tǒng)計(jì)對話管理器(SDM)的系統(tǒng)和/或方法??梢岳么嬖谟谥醒胪泄艿膚eb搜索引擎和瀏覽器中的大量記入日志的用戶交互,以為對話管理器提供訓(xùn)練數(shù)據(jù)。用戶使用搜索和瀏覽的組合,在web上完成日常任務(wù)。搜索數(shù)據(jù)的數(shù)量可能超出數(shù)億用戶上的每天100M查詢,而且任務(wù)的廣度極大,因而造成了 “長尾(long tail)”web搜索。這些任務(wù)的范圍可以從簡單任務(wù)(天氣、找出方向、本地事件)到更復(fù)雜任務(wù)(購物、計(jì)劃旅行、計(jì)劃外面過夜)。在完成這些任務(wù)的過程中,用戶可以參加與他們的搜索引擎和瀏覽器的有限的對話。例如,用戶可以表達(dá)表示其打算的特定目標(biāo)或目的的查詢,將其輸入搜索引擎,并且然后基于來自搜索引擎的結(jié)果,用重新表達(dá)的查詢作出響應(yīng)。對于另一實(shí)例,一系列導(dǎo)航選擇可以用來推斷用戶的目的而不用接收明確的查詢,比如其中,用戶在購物站點(diǎn)上開始并且通過逐漸縮小的標(biāo)準(zhǔn)進(jìn)行瀏覽(例如,電子設(shè)備_>攝像機(jī)_>數(shù)字的_>SLR)。
[0008]按照本發(fā)明的實(shí)施例,可以從文本/點(diǎn)擊搜索和瀏覽器交互映射口述對話。不管是采用web瀏覽器還是經(jīng)由口述對話系統(tǒng)來完成,目標(biāo)/任務(wù)和完成該目標(biāo)/任務(wù)而采取的步驟的次序可以是相似的,盡管用戶所希望的動(dòng)作的表現(xiàn)形式是不同的。為了解決這種失配,對話建模問題可以分為兩部分:(1)從《必日志學(xué)習(xí)在瀏覽器和基于SDS的交互之間是共同的目標(biāo)/任務(wù)完成的基本處理,以及(2)學(xué)習(xí)用戶的web交互(搜索查詢,點(diǎn)擊)到自然口述會(huì)話的轉(zhuǎn)換。
[0009]可以將任務(wù)完成的主要元素分類為理解用戶如何導(dǎo)航任務(wù)、確定用戶是否對系統(tǒng)交互感到滿意、以及基于任務(wù)中的進(jìn)展預(yù)測系統(tǒng)響應(yīng)。可以從大規(guī)模的搜索/瀏覽器交互學(xué)習(xí)這些方面,并且這些方面可以被轉(zhuǎn)化到SDS中。例如,大多數(shù)當(dāng)前的對話系統(tǒng)對較簡單的任務(wù)進(jìn)行建模,并且沒有打算任務(wù)中斷或者任務(wù)間的切換。然而,在諸如計(jì)劃外面過夜之類的較復(fù)雜的任務(wù)中,我們觀察到用戶在具有“室外的美好野餐”之后“找個(gè)電影看”的子任務(wù)之間跳轉(zhuǎn)。類似地,可以基于web數(shù)據(jù)學(xué)習(xí)任務(wù)內(nèi)的行為的次序和/或定序,諸如其中,核對賓館通常跟著登記航班。
[0010]從web交互學(xué)習(xí)的任務(wù)完成的特征也可以從頭到尾作為統(tǒng)計(jì)對話建模系統(tǒng)的特征而持有(port)。例如,用戶在搜索結(jié)果后點(diǎn)擊或點(diǎn)擊持續(xù)時(shí)間上花費(fèi)的時(shí)間可以被認(rèn)為是用戶已經(jīng)找到感興趣的結(jié)果的好信號。在口述對話或多模態(tài)系統(tǒng)交互中,用戶花費(fèi)的研究由該系統(tǒng)傳遞的飯店地圖的時(shí)間可以被認(rèn)為是該系統(tǒng)已經(jīng)向用戶傳遞了感興趣結(jié)果的好信號。在web搜索中,重新鍵入或者重新表達(dá)查詢典型地表示用戶沒有為第一查詢找到滿意的答案。對于對話系統(tǒng),向系統(tǒng)重新陳述問題或者簡化請求類似地可以被認(rèn)為是與該系統(tǒng)的用戶交互是不順利的指示物。
[0011 ] 對于口述對話系統(tǒng),可以通過自動(dòng)地加入可計(jì)算因素,來對統(tǒng)計(jì)對話管理(SDM)的用戶滿意度評分。在學(xué)習(xí)對話管理器的機(jī)器動(dòng)作中,用戶滿意度分?jǐn)?shù)可以用作對加強(qiáng)學(xué)習(xí)的獎(jiǎng)賞。還可以通過利用來自用戶web搜索和瀏覽活動(dòng)的數(shù)據(jù)來對用戶滿意度評分??梢詫ⅠR爾可夫模型分類方法應(yīng)用于SDM,并且通過計(jì)算以下四種類型的特征對其進(jìn)行擴(kuò)展以確定會(huì)話成功:與轉(zhuǎn)變(turn)有關(guān)的特征、與整個(gè)會(huì)話有關(guān)的特征、與查詢有關(guān)的特征、以及與用戶點(diǎn)擊的統(tǒng)一資源定位符(URL)有關(guān)的特征。[0012]轉(zhuǎn)變可以包括用戶動(dòng)作,例如點(diǎn)擊搜索結(jié)果或付費(fèi)廣告、點(diǎn)擊后退按鈕、輸入新查詢等。轉(zhuǎn)變特征可能與用戶已經(jīng)遵循的具有相關(guān)聯(lián)的時(shí)間信息的狀態(tài)序列有關(guān)。例如,所采取的狀態(tài)的馬爾可夫模型可以包括基于使用43種可能的用戶動(dòng)作(狀態(tài))的第一次序的馬爾可夫模型的特征。使用如以下等式I描述的最大似然估計(jì),可以利用滿意(MMs)和不滿
意(MMd)會(huì)話來訓(xùn)練兩個(gè)MM。N 包括從狀態(tài)&.到&的轉(zhuǎn)換數(shù)量,并且iV^可以包括
狀態(tài)被訪問的次數(shù)的數(shù)目。
【權(quán)利要求】
1.一種用于提供統(tǒng)計(jì)對話管理器訓(xùn)練的方法,所述方法包括: 接收來自用戶的口述查詢; 根據(jù)所述口述查詢創(chuàng)建信念狀態(tài),其中,所述信念狀態(tài)包括所估計(jì)的用戶目的; 確定多個(gè)日志數(shù)據(jù)中的至少一個(gè)是否與所估計(jì)的目的相關(guān)聯(lián);以及 響應(yīng)于確定所述多個(gè)日志數(shù)據(jù)中的所述至少一個(gè)與所估計(jì)的目的相關(guān)聯(lián): 根據(jù)所述多個(gè)日志數(shù)據(jù)中的所述至少一個(gè)的至少一個(gè)元素更新所述信念狀態(tài),以及 根據(jù)所更新的信念狀態(tài)向所述用戶提供響應(yīng)。
2.如權(quán)利要求1所述的方法,還包括: 響應(yīng)于確定所述多個(gè)日志數(shù)據(jù)中的所述至少一個(gè)沒有與所估計(jì)的目的相關(guān)聯(lián): 向所述用戶查詢至少一個(gè)附加提示, 從用戶接收針對所述查詢的響應(yīng),以及 根據(jù)所接收的響應(yīng)更新所述信念狀態(tài)。
3.如權(quán)利要求1所述的方法,還包括使用所提供的響應(yīng)來更新所述信念狀態(tài)。
4.如權(quán)利要求3所述的方法,還包括: 接收來自所述用戶的第二口述查詢; 確定所述第二口述查詢是否與所估計(jì)的目的相關(guān)聯(lián);以及 響應(yīng)于確定所述第二口述查詢與所估計(jì)的目的相關(guān)聯(lián): 根據(jù)所述第二口述查詢更新所述信念狀態(tài),以及 根據(jù)所更新的信念狀態(tài),向所述用戶提供第二響應(yīng)。
5.如權(quán)利要求4所述的方法,還包括: 確定所述第二口述查詢是否與到第二目的的轉(zhuǎn)換相關(guān)聯(lián);以及 響應(yīng)于確定所述第二口述查詢與所述轉(zhuǎn)換相關(guān)聯(lián): 根據(jù)所述第二口述查詢創(chuàng)建第二信念狀態(tài), 根據(jù)先前創(chuàng)建的信念狀態(tài)填充所述第二信念狀態(tài)的至少一個(gè)元素,以及 根據(jù)所述第二信念狀態(tài)向所述用戶提供第三響應(yīng)。
6.一種用于提供統(tǒng)計(jì)對話管理器訓(xùn)練的系統(tǒng),所述系統(tǒng)包括: 存儲(chǔ)器存儲(chǔ)裝置;以及 耦合到所述存儲(chǔ)器存儲(chǔ)裝置的處理單元,其中,所述處理單元能夠操作來: 接收與目的相關(guān)聯(lián)的多個(gè)日志數(shù)據(jù), 根據(jù)所述多個(gè)日志數(shù)據(jù),識(shí)別出與完成所述目的相關(guān)聯(lián)的至少一個(gè)措施, 創(chuàng)建與所述目的相關(guān)聯(lián)的理解模型, 將多個(gè)查詢映射到所述目的, 響應(yīng)于接收到來自用戶的自然語言查詢,確定所述自然語言查詢是否與所述目的相關(guān)聯(lián),以及 響應(yīng)于確定所述自然語言查詢與所述目的相關(guān)聯(lián),根據(jù)所述理解模型向所述用戶提供響應(yīng)。
7.如權(quán)利要求6所述的系統(tǒng),其中,所述處理單元還操作來: 根據(jù)所述多個(gè)日志數(shù)據(jù)識(shí)別至少一個(gè)轉(zhuǎn)換提示;以及 將所述至少一個(gè)轉(zhuǎn)換提示并入所述理解模型。
8.如權(quán)利要求6所述的系統(tǒng),其中,所述處理單元還操作來針對所述多個(gè)日志數(shù)據(jù)中的每一個(gè),確定所述目的是否已被成功完成。
9.如權(quán)利要求6所述的系統(tǒng),其中,所述處理單元還操作來響應(yīng)于接收到來自所述用戶的至少一個(gè)附加的自然語言查詢,改進(jìn)與所述目的相關(guān)聯(lián)的信念狀態(tài)。
10.一種存儲(chǔ)指令集的計(jì)算機(jī)可讀介質(zhì),當(dāng)執(zhí)行所述指令集時(shí)執(zhí)行一種用于提供統(tǒng)計(jì)對話管理器的訓(xùn)練的方法,由所述指令集執(zhí)行的所述方法包括: 選擇多個(gè)日志數(shù)據(jù)的與目的相關(guān)聯(lián)的子集,其中,所述多個(gè)日志數(shù)據(jù)的所述子集中的每一個(gè)包括與以下項(xiàng)中的至少一個(gè)相關(guān)聯(lián)的會(huì)話日志:關(guān)鍵詞和網(wǎng)站; 確定所述日志數(shù)據(jù)的子集中的至少一個(gè)是否與所述目的的成功完成相關(guān)聯(lián); 響應(yīng)于確定所述日志數(shù)據(jù)的子集中的所述至少一個(gè)不與所述目的的成功完成相關(guān)聯(lián),丟棄所述日志數(shù)據(jù)的子集中的所述至少一個(gè); 識(shí)別所述日志數(shù)據(jù)的子集內(nèi)的多個(gè)轉(zhuǎn)換提示,其中,所述轉(zhuǎn)換提示中的每一個(gè)都與以下項(xiàng)中的至少一個(gè)相關(guān)聯(lián):與完成所述目的相關(guān)聯(lián)的新任務(wù)和第二目的; 根據(jù)所述日志數(shù)據(jù)的子集,將多個(gè)查詢術(shù)語映射到所述目的; 根據(jù)所述日志數(shù)據(jù)的子集,創(chuàng)建與完成所述目的相關(guān)聯(lián)的理解模型; 接收來自用戶的自然語言查詢; 根據(jù)所映射的多個(gè)查詢術(shù)語,確定所述自然語言查詢是否與所述目的相關(guān)聯(lián);以及 響應(yīng)于確定所述自然語言查詢與所述目的相關(guān)聯(lián): 建立與所述自然語言查詢相關(guān)聯(lián)的信念狀態(tài), 根據(jù)所述理解模型填充所述信念狀態(tài),以及 根據(jù)所述信念狀態(tài)向所述用戶提供響應(yīng)。
【文檔編號】G10L15/08GK103534697SQ201280023617
【公開日】2014年1月22日 申請日期:2012年5月11日 優(yōu)先權(quán)日:2011年5月13日
【發(fā)明者】L.P.赫克, D.哈卡尼-圖爾, R.葉爾, G.圖爾 申請人:微軟公司