專利名稱:信息處理設(shè)備、信息處理方法和計(jì)算機(jī)程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息處理設(shè)備、信息處理方法和計(jì)算機(jī)程序,具體地,涉及應(yīng)用于用于 通過例如用戶與信息處理設(shè)備(例如電視機(jī))之間的通信來執(zhí)行處理的配置的信息處理方 法及計(jì)算機(jī)程序,更具體地,涉及其中信息處理設(shè)備分析來自用戶的話語(Utterance)并 執(zhí)行用戶所請求的任務(wù)的配置。此外,本發(fā)明涉及執(zhí)行基礎(chǔ)處理(grounding process)以使系統(tǒng)使用POMDP (部分 可觀察馬爾可夫決策過程)來正確地識別用戶的意圖的信息處理設(shè)備、信息處理方法和計(jì) 算機(jī)程序。
背景技術(shù):
例如,對于其中諸如電視機(jī)等的系統(tǒng)識別從用戶輸出的話語并在不使用遙控器的 情況下進(jìn)行處理的配置,已經(jīng)進(jìn)行了各種研究。為了使系統(tǒng)理解用戶的話語并進(jìn)行正確的 處理,需要用戶與系統(tǒng)之間的共識。例如,如果系統(tǒng)不能理解用戶請求,則系統(tǒng)需要通過詢問用戶問題并使用來自用 戶的回答正確理解用戶的意圖來解決該問題。為了與用戶進(jìn)行通信,系統(tǒng)主要進(jìn)行以下兩個(gè)處理響應(yīng)于用戶請求在系統(tǒng)內(nèi)部進(jìn)行的處理(例如,在系統(tǒng)為電視機(jī)的情況下,響應(yīng) 于用戶請求在系統(tǒng)內(nèi)部進(jìn)行的用于改變頻道的處理)(稱為“域任務(wù)”);以及用于通過會話實(shí)現(xiàn)系統(tǒng)和用戶之間的相互理解的處理,其中在該會話中,如果系 統(tǒng)不能理解用戶請求,則系統(tǒng)詢問用戶問題并使用回答(稱為“會話任務(wù)”)。例如,在多人間的會談中,將為使這多人相互理解所進(jìn)行的處理稱為“基礎(chǔ)”。在該 基礎(chǔ)中,需要進(jìn)行下面的處理(1)用于確認(rèn)是否已實(shí)現(xiàn)了相互理解的處理;以及(2)為了實(shí)現(xiàn)相互理解所進(jìn)行的處理。(1)為了確認(rèn)是否已實(shí)現(xiàn)了相互理解,需要用于確定是否已實(shí)現(xiàn)了理解的標(biāo)準(zhǔn)。例 如,需要理解的確信度或用于測量滿意度的指標(biāo)。另外,對于說話者和傾聽者,標(biāo)準(zhǔn)的水平 需要相同。(2)在用于實(shí)現(xiàn)相互理解的處理中,也就是說,在基礎(chǔ)處理中,重要的是對用于測 量用戶和基礎(chǔ)動作之間的會談或通信的有效性的指標(biāo)進(jìn)行標(biāo)準(zhǔn)化。非專利文獻(xiàn) 1 (作者為 David R. Traum 禾口 James F. Allen.的 A speechacts approach to grounding in conversation. In proceedings 2ndIηternational Conference on Spoken Langrage Processing(ICSLP-92), pages 137—40,1992 年 10 月) 說明了一種與用于實(shí)現(xiàn)相互理解的處理(即,基礎(chǔ)處理)相關(guān)的現(xiàn)有技術(shù)。參考圖1和2說明該非專利文獻(xiàn)中所示的配置。如圖1所示,例如,該非專利文獻(xiàn) 說明了一種應(yīng)用于在多人間進(jìn)行的通信處理的狀態(tài)變換結(jié)構(gòu)。在通信處理中,如圖1所示, 出現(xiàn)下面七個(gè)狀態(tài)
S.初始狀態(tài);
1.緊接在開始之后的狀態(tài)
2.系統(tǒng)混亂狀態(tài);
3.需要確認(rèn)狀態(tài);
4.用戶混亂狀態(tài);
F.基礎(chǔ)狀態(tài);以及
D.取消狀態(tài)。在通信處理中,發(fā)生這七個(gè)狀態(tài)間的變換。在非專利文獻(xiàn)1中,如圖2的表所示,定義與狀態(tài)變換相對應(yīng)的當(dāng)前狀態(tài)與使得發(fā) 生狀態(tài)變換的動作之間的對應(yīng)關(guān)系。圖2表示當(dāng)在當(dāng)前狀態(tài)下進(jìn)行該表所示的下個(gè)動作時(shí) (即,開始(I)到取消(R))可以變換成下個(gè)狀態(tài)(S到D)。例如,在初始狀態(tài)(S)下,動作發(fā)起者(發(fā)起人)進(jìn)行某一動作。例如,第一用戶 變成動作發(fā)起者,并且第一用戶發(fā)出話語。在這種情況下,狀態(tài)從(S)改變成“1”。此外,當(dāng) 動作發(fā)起者(發(fā)起人)在狀態(tài)(1)下繼續(xù)發(fā)出話語時(shí),狀態(tài)持續(xù)為(1)或者從狀態(tài)(1)改 變成狀態(tài)⑷。如果狀態(tài)改變成基礎(chǔ)狀態(tài)“F”,則確定正進(jìn)行會談的多人達(dá)到了相互理解狀態(tài)。取 消“D”是這些用戶未能達(dá)到相互理解的狀態(tài)。在非專利文獻(xiàn)1中,主要說明在通信中多人相互理解的處理,即,基礎(chǔ)處理。對于 人和系統(tǒng)間的通信,這種相互理解處理(基礎(chǔ)處理)也是必需的。也就是說,當(dāng)用戶請求系 統(tǒng)(例如電視機(jī))進(jìn)行處理時(shí),用戶和系統(tǒng)必須達(dá)到相互理解,以進(jìn)行正確的處理。非專禾丨J文獻(xiàn) 1 :David R. Traum 禾口 James F. Allen.的 A speech actsapproach to grounding in conversation. In proceedings 2nd InternationalConference on Spoken Langrage Processing(ICSLP-92),第 137-40 頁,1992 年 10 月
發(fā)明內(nèi)容
技術(shù)問題為解決上述問題,本發(fā)明的目的是提供一種使得系統(tǒng)在與用戶的通信中實(shí)現(xiàn)相互 理解并有效進(jìn)行正確處理的信息處理設(shè)備、信息處理方法和計(jì)算機(jī)程序。本發(fā)明的另一目的是提供一種使得解釋來自用戶的話語的諸如電視機(jī)等的系統(tǒng) 使用POMDP (部分可觀察馬爾可夫決策過程)來正確地識別用戶的意圖并進(jìn)行處理的信息 處理設(shè)備、信息處理方法和計(jì)算機(jī)程序。技術(shù)方案根據(jù)本發(fā)明的第一方面,提供一種用于接收來自用戶的話語并分析該話語的信息 處理設(shè)備。該信息處理設(shè)備的特征在于包括用戶接口,該用戶接口接收來自用戶的話語并 進(jìn)行語言分析;會話管理器,該會話管理器接收與通過用戶接口輸入的用戶話語相關(guān)的信 息的識別結(jié)果,并通過使用部分可觀察馬爾可夫決策過程(POMDP)進(jìn)行用于理解用戶請求 的基礎(chǔ)處理;以及任務(wù)管理器,該任務(wù)管理器基于與會話管理器所進(jìn)行的基礎(chǔ)處理的結(jié)果 相關(guān)的信息而執(zhí)行任務(wù)。根據(jù)本發(fā)明的實(shí)施例,該信息處理設(shè)備的特征在于還包括顯示器,其中,在由會話
6管理器進(jìn)行的基礎(chǔ)處理期間,顯示器為用戶顯示系統(tǒng)動作。根據(jù)本發(fā)明的另一實(shí)施例,該信息處理設(shè)備的特征在于,會話管理器具有配置以 使用POMDP進(jìn)行基礎(chǔ)處理,其中,將根據(jù)來自用戶的話語生成的語義信息和基于包括由任 務(wù)管理器進(jìn)行的任務(wù)的可行性的信息生成的實(shí)體信息設(shè)置為觀察空間。根據(jù)本發(fā)明的另一實(shí)施例,該信息處理設(shè)備的特征在于,會話管理器具有配置以 使用POMDP進(jìn)行基礎(chǔ)處理,其中,將使用用作觀察空間的語義信息計(jì)算出的狀態(tài)值和使用 用作觀察空間的實(shí)體信息計(jì)算出的狀態(tài)值設(shè)置為狀態(tài)空間。根據(jù)本發(fā)明的另一實(shí)施例,該信息處理設(shè)備的特征在于,會話管理器具有配置以 使用POMDP進(jìn)行基礎(chǔ)處理,其中,將使用用作觀察空間的語義信息計(jì)算出的狀態(tài)值、使用用 作觀察空間的實(shí)體信息計(jì)算出的狀態(tài)值、以及使用其它觀察空間計(jì)算出的狀態(tài)值設(shè)置為狀 態(tài)空間。根據(jù)本發(fā)明的另一實(shí)施例,該信息處理設(shè)備的特征在于,會話管理器具有配置以 使用POMDP進(jìn)行基礎(chǔ)處理,其中POMDP具有以下配置其中基于包括使用用作觀察空間的語 義信息計(jì)算出的狀態(tài)值和使用用作觀察空間的實(shí)體信息計(jì)算出的狀態(tài)值的狀態(tài)空間來計(jì) 算成本。根據(jù)本發(fā)明的另一實(shí)施例,該信息處理設(shè)備的特征在于,會話管理器具有配置以 使用POMDP進(jìn)行基礎(chǔ)處理,其中,將包括來自用戶的話語的用戶動作設(shè)置為觀察空間。根據(jù)本發(fā)明的另一實(shí)施例,該信息處理設(shè)備的特征在于,會話管理器具有配置以 使用POMDP進(jìn)行基礎(chǔ)處理,其中,將使用用作觀察空間的用戶動作計(jì)算出的狀態(tài)值設(shè)置為 狀態(tài)空間。此外,根據(jù)本發(fā)明的第二方面,提供一種信息處理設(shè)備中使用的信息處理方法,其 中,該信息處理設(shè)備用于接收來自用戶的話語并且分析該話語,該信息處理方法的特征在 于包括以下步驟語言輸入和分析步驟,該語言輸入和分析步驟通過使用用戶接口接收來 自用戶的話語并進(jìn)行語言分析;會話管理步驟,該會話管理步驟通過使用會話管理器,接收 與通過用戶接口輸入的用戶話語相關(guān)的信息的識別結(jié)果,并使用部分可觀察馬爾可夫決策 過程(POMDP)進(jìn)行用于理解用戶請求的基礎(chǔ)處理;以及任務(wù)管理步驟,該任務(wù)管理步驟通 過使用任務(wù)管理器來基于與在會話管理步驟中進(jìn)行的基礎(chǔ)處理的結(jié)果相關(guān)的信息而執(zhí)行 任務(wù)。根據(jù)本發(fā)明的另一實(shí)施例,該信息處理方法的特征在于還包括用于通過使用顯示 器在會話管理步驟所進(jìn)行的基礎(chǔ)處理期間為用戶顯示系統(tǒng)動作的步驟。根據(jù)本發(fā)明的另一實(shí)施例,該信息處理方法的特征在于,會話管理步驟是使用 POMDP進(jìn)行基礎(chǔ)處理的步驟,其中,將響應(yīng)于來自用戶的話語生成的語義信息和基于包括由 任務(wù)管理器進(jìn)行的任務(wù)的可行性的信息所生成的實(shí)體信息設(shè)置為觀察空間。根據(jù)本發(fā)明的另一實(shí)施例,該信息處理方法的特征在于,會話管理步驟是使用 POMDP進(jìn)行基礎(chǔ)處理的步驟,其中,將使用用作觀察空間的語義信息計(jì)算出的狀態(tài)值和使用 用作觀察空間的實(shí)體信息計(jì)算出的狀態(tài)值設(shè)置為狀態(tài)空間。根據(jù)本發(fā)明的另一實(shí)施例,該信息處理方法的特征在于,會話管理步驟是使用 POMDP進(jìn)行基礎(chǔ)處理的步驟,其中,將使用用作觀察空間的語義信息計(jì)算出的狀態(tài)值、使用 用作觀察空間的實(shí)體信息計(jì)算出的狀態(tài)值、以及使用其它觀察空間計(jì)算出的狀態(tài)值設(shè)置為狀態(tài)空間。根據(jù)本發(fā)明的另一實(shí)施例,該信息處理方法的特征在于,會話管理步驟是使用 POMDP進(jìn)行基礎(chǔ)處理的步驟,其中,POMDP具有以下配置其中基于包括使用用作觀察空間 的語義信息計(jì)算出的狀態(tài)值和使用用作觀察空間的實(shí)體信息計(jì)算出的狀態(tài)值的狀態(tài)空間 來計(jì)算成本。根據(jù)本發(fā)明的另一實(shí)施例,該信息處理方法的特征在于,會話管理步驟是使用 POMDP進(jìn)行基礎(chǔ)處理的步驟,其中,將包括來自用戶的話語的用戶動作設(shè)置為觀察空間。根據(jù)本發(fā)明的另一實(shí)施例,該信息處理方法的特征在于,會話管理步驟是使用 POMDP進(jìn)行基礎(chǔ)處理的步驟,其中,將使用用作觀察空間的用戶動作計(jì)算出的狀態(tài)值設(shè)置為 狀態(tài)空間。根據(jù)本發(fā)明的另一實(shí)施例,該信息處理方法的特征在于,會話管理步驟是使用 POMDP進(jìn)行基礎(chǔ)處理的步驟,其中POMDP具有以下配置其中基于包括使用用作觀察空間的 用戶動作計(jì)算出的狀態(tài)值的狀態(tài)空間來計(jì)算成本。根據(jù)本發(fā)明的另一實(shí)施例,該信息處理方法的特征在于,會話管理步驟是使用基 礎(chǔ)模型進(jìn)行處理的步驟,其中,將開始處理、繼續(xù)處理、確認(rèn)處理、確認(rèn)請求處理、確認(rèn)應(yīng)答 處理、確認(rèn)應(yīng)答請求處理和取消處理定義為基礎(chǔ)處理的執(zhí)行動作。根據(jù)本發(fā)明的另一實(shí)施例,該信息處理方法的特征在于,會話管理步驟是使用基 礎(chǔ)模型進(jìn)行處理的步驟,其中,將開始處理、確認(rèn)應(yīng)答處理和取消處理定義為基礎(chǔ)處理的執(zhí) 行動作。此外,根據(jù)本發(fā)明的第三方面,提供一種計(jì)算機(jī)程序,該計(jì)算機(jī)程序使信息處理設(shè) 備進(jìn)行用于接收來自用戶的話語并分析該話語的信息處理。該計(jì)算機(jī)程序的特征在于包 括以下步驟語言輸入和分析步驟,該語言輸入和分析步驟通過使用用戶接口接收來自用 戶的話語并進(jìn)行語言分析;會話管理步驟,該會話管理步驟通過使用會話管理器,接收與通 過用戶接口輸入的用戶話語相關(guān)的信息的識別結(jié)果,并使用部分可觀察馬爾可夫決策過程 (POMDP)進(jìn)行用于理解用戶請求的基礎(chǔ)處理;以及任務(wù)管理步驟,該任務(wù)管理步驟通過使 用任務(wù)管理器來基于與在會話管理步驟中進(jìn)行的基礎(chǔ)處理的結(jié)果相關(guān)的信息而執(zhí)行任務(wù)。應(yīng)該注意,根據(jù)本發(fā)明的計(jì)算機(jī)程序是可提供給例如可以使用計(jì)算機(jī)可讀記錄介 質(zhì)或通信介質(zhì)來執(zhí)行各種程序代碼的通用計(jì)算機(jī)的計(jì)算機(jī)程序。通過以計(jì)算機(jī)可讀格式提 供這種程序,在計(jì)算機(jī)系統(tǒng)中可以實(shí)現(xiàn)根據(jù)該程序的處理。通過以下參考附圖對示例性實(shí)施例的詳細(xì)說明,本發(fā)明的其它特征和優(yōu)點(diǎn)將顯而 易見。另外,應(yīng)該注意,在本說明書中,術(shù)語“系統(tǒng)”是指多個(gè)裝置的邏輯組合;這多個(gè)裝置 不是必須包括在一個(gè)主體中。有益效果根據(jù)本發(fā)明的實(shí)施例,設(shè)計(jì)了如下的配置為了通過來自用戶的話語來理解來自 用戶的請求,使用POMDP (部分可觀察馬爾可夫決策過程)執(zhí)行基礎(chǔ)處理,其中,將從接收用 戶的話語并進(jìn)行語言分析的語言分析單元獲取的分析信息以及包括從執(zhí)行任務(wù)的任務(wù)管 理器獲取的任務(wù)可行性信息的實(shí)體信息(pragmatic information)設(shè)置為觀察信息。因此, 可以有效實(shí)現(xiàn)理解,并且可以提供對用戶請求的高速準(zhǔn)確的識別以及基于用戶請求的任務(wù) 執(zhí)行。
圖1是示出基礎(chǔ)處理中的狀態(tài)變換的例子的圖;圖2是示出基礎(chǔ)處理中動作和狀態(tài)變換之間的對應(yīng)關(guān)系的例子的圖;圖3是示出應(yīng)用POMDP (部分可觀察馬爾可夫決策過程)的處理的例子的圖;圖4是示出根據(jù)本發(fā)明實(shí)施例的信息處理設(shè)備的配置和該信息處理設(shè)備進(jìn)行的 處理的圖;圖5是示出根據(jù)本發(fā)明實(shí)施例的信息處理設(shè)備的會話管理器所進(jìn)行的處理的流 程圖;圖6是示出根據(jù)本發(fā)明實(shí)施例的信息處理設(shè)備的會話管理器所進(jìn)行的處理的流 程圖;圖7是示出根據(jù)本發(fā)明實(shí)施例的信息處理設(shè)備的會話管理器的POMDP執(zhí)行單元所 進(jìn)行的處理的流程圖;圖8是示出根據(jù)本發(fā)明實(shí)施例的信息處理設(shè)備的會話管理器所進(jìn)行的POMDP應(yīng)用 處理的圖;圖9是示出貝葉斯網(wǎng)絡(luò)和條件概率表(CPT)的圖;圖10是示出狀態(tài)值數(shù)據(jù)隨著時(shí)間過去根據(jù)POMDP中設(shè)置的狀態(tài)空間(State space)的改變而變換的例子的圖;圖11是示出狀態(tài)值數(shù)據(jù)隨著時(shí)間過去根據(jù)POMDP中設(shè)置的狀態(tài)空間的改變而變 換的例子的圖;圖12是示出根據(jù)本發(fā)明的信息處理設(shè)備所進(jìn)行的POMDP應(yīng)用處理中的基礎(chǔ)處理 和其它處理的比較結(jié)果的圖;圖13是示出根據(jù)本發(fā)明的信息處理設(shè)備所進(jìn)行的POMDP應(yīng)用處理中的基礎(chǔ)處理 和其它處理的比較結(jié)果的圖;圖14是示出根據(jù)本發(fā)明的信息處理設(shè)備所進(jìn)行的使用POMDP的基礎(chǔ)處理的例子 的圖;圖15是示出根據(jù)本發(fā)明的信息處理設(shè)備所進(jìn)行的使用POMDP的基礎(chǔ)處理的例子 的圖;圖16是示出根據(jù)本發(fā)明的信息處理設(shè)備所進(jìn)行的使用POMDP的基礎(chǔ)處理的例子 的圖;圖17是示出根據(jù)本發(fā)明的信息處理設(shè)備所進(jìn)行的使用POMDP的基礎(chǔ)處理的例子 的圖;圖18是示出根據(jù)本發(fā)明的信息處理設(shè)備的示例性配置的圖;圖19是示出根據(jù)本發(fā)明的信息處理設(shè)備的示例性硬件配置的圖。
具體實(shí)施例方式下面參考附圖詳細(xì)說明根據(jù)本發(fā)明實(shí)施例的信息處理設(shè)備、信息處理方法和計(jì)算 機(jī)程序。注意,以下面的順序進(jìn)行說明(1)根據(jù)本發(fā)明的信息處理設(shè)備所進(jìn)行的處理的概況
9
(2)根據(jù)本發(fā)明的信息處理設(shè)備的示例性配置和詳細(xì)處理(3)會話管理器所進(jìn)行的詳細(xì)基礎(chǔ)處理(4)使用POMDP的示例性基礎(chǔ)處理(5)信息處理設(shè)備的示例性硬件配置(1)根據(jù)本發(fā)明的信息處理設(shè)備所進(jìn)行的處理的概況根據(jù)本發(fā)明,信息處理設(shè)備的例子是根據(jù)來自用戶的話語進(jìn)行各種處理(例如頻 道選擇)的諸如電視機(jī)等的系統(tǒng)。也就是說,通過系統(tǒng)和用戶通信,信息處理設(shè)備進(jìn)行用戶 想要的處理。為了正確理解用戶的意圖,信息處理設(shè)備進(jìn)行用于實(shí)現(xiàn)與用戶之間的相互理 解的處理,即,基礎(chǔ)處理。根據(jù)本發(fā)明的實(shí)施例,在基礎(chǔ)處理中,信息處理設(shè)備應(yīng)用下面的技術(shù)(1)BN(貝葉斯網(wǎng)絡(luò));以及(2) POMDP (部分可觀察馬爾可夫決策過程)。BN(貝葉斯網(wǎng)絡(luò))包括多個(gè)節(jié)點(diǎn),并且定義節(jié)點(diǎn)間的關(guān)系。例如,在美國專利申請 公開2004/0220892和2002/0103793中說明了用于生成貝葉斯網(wǎng)絡(luò)的處理和用于使用貝葉 斯網(wǎng)絡(luò)的處理。這些文獻(xiàn)說明了用于生成其中正確定義節(jié)點(diǎn)間的關(guān)系的可靠的貝葉斯紋路 的處理。根據(jù)本發(fā)明,為了估計(jì)相互理解的水平和進(jìn)行跟蹤,信息處理設(shè)備使用貝葉斯網(wǎng) 絡(luò)。例如,信息處理設(shè)備進(jìn)行使用通過對來自用戶的話語的語音識別、語言處理、詞義分析 和對言語的理解所獲取的數(shù)據(jù)的處理。POMDP(部分可觀察馬爾可夫決策過程)已知為用于狀態(tài)預(yù)測或動作判定的技術(shù) 之一。下面接著示意性說明部分可觀察馬爾可夫決策過程(以下稱為“P0MDP”)。POMDP是用于通過使用下面的信息的狀態(tài)預(yù)測或動作判定的技術(shù)。(a)狀態(tài)空間(S);(b)動作空間(action space) (A);(c)觀察空間(observation space) (0);以及(d)回報(bào)空間(reward space) (R)。這種信息隨著時(shí)間(t)過去而改變。例如,定義計(jì)算狀態(tài)變換概率的函數(shù)、計(jì)算回 報(bào)的函數(shù)和計(jì)算發(fā)生觀察狀態(tài)的概率的函數(shù)。此后,使用可獲得的信息和所定義的函數(shù)進(jìn) 行狀態(tài)預(yù)測或動作判定。定義的函數(shù)的例子包括下面的函數(shù)當(dāng)在時(shí)間T= (t-Ι)時(shí)狀態(tài)S = st_i且動作A = ^v1時(shí),用于計(jì)算在下個(gè)時(shí)間 T = (t)時(shí)向狀態(tài)S = St的狀態(tài)變換的概率的狀態(tài)變換概率計(jì)算函數(shù)T(st,at_i; st_i)= P (st Iat+ Sh);在時(shí)間T= (t)時(shí)用于使用狀態(tài)S = st和動作A = at計(jì)算回報(bào)的回報(bào)函數(shù)R(st, at);以及用于使用時(shí)間T = (t-Ι)時(shí)的動作A = Bt^1和時(shí)間T = (t)時(shí)的狀態(tài)S = St計(jì)算 在時(shí)間T= (t)時(shí)發(fā)生觀察狀態(tài)(observation state)的概率的觀察狀態(tài)概率函數(shù)0(st, at-i' Oh) = P(ot|at_i; st)。POMDP是一種用于通過使用上述各種信息和函數(shù)的狀態(tài)預(yù)測或動作判定的技術(shù)。 例如,POMDP應(yīng)用于用于根據(jù)少量可獲得的信息判定最佳動作的處理。更具體地,POMDP可應(yīng)用于諸如用于確定機(jī)器人的動作的處理、使用計(jì)算機(jī)的模擬、數(shù)據(jù)處理和用于確定事務(wù) 中的最佳的人的動作的處理等的各種動作判定處理。接著參考圖3說明通過使用POMDP和上述各種信息的狀態(tài)預(yù)測或動作判定。圖3 示出時(shí)間T= (t-D時(shí)的狀態(tài)Sh、動作ah、回報(bào)Rh和觀察Oh、以及下個(gè)時(shí)間T= (t)時(shí) 的狀態(tài)st、動作at、回報(bào)Rt和觀察ot。連接塊的箭頭表示塊之間的影響。也就是說,與箭頭 的源(父)相關(guān)的信息可能改變箭頭的目的地(子)的狀態(tài)或信息。例如,如上所述,在時(shí)間τ = t-i時(shí),可以使用時(shí)間t = t-i時(shí)的狀態(tài)st_i和動作 at_!以及回報(bào)函數(shù)R(St^iv1)獲得回報(bào)Rt_lt)另外,觀察信息CV1是例如隨著狀態(tài)st_i改變而改變的可觀察信息。該關(guān)系還適用于任何時(shí)間T = t_l、t、t+l、……。而且,在不同時(shí)間,通過上述狀態(tài)變換概率計(jì)算函數(shù)T(st,at_i; st_i) = P(st|at_i; StJ定義時(shí)間T = t時(shí)的狀態(tài)st與時(shí)間T = t-Ι時(shí)的狀態(tài)Sh和動作 、的組合之間的關(guān) 系。也就是說,可以使用先前時(shí)間T = t-Ι時(shí)的狀態(tài)、和動作^v1計(jì)算時(shí)間T = t時(shí)的狀 態(tài)^的發(fā)生概率。該關(guān)系可應(yīng)用于連續(xù)證據(jù)觀察時(shí)間的整個(gè)期間。這樣,根據(jù)POMDP,在包括不確定性的對象區(qū)域中,定義各種信息項(xiàng)(狀態(tài)、動作、 回報(bào)和觀察)。此后,使用信息項(xiàng)之間的關(guān)系,在包括不確定性的對象區(qū)域中,估計(jì)狀態(tài)變換 或者判定人的動作。例如,在動作判定處理中,認(rèn)為回報(bào)最大化的動作是最佳動作。注意,在用于構(gòu)建POMDP的處理中,重要的是適當(dāng)設(shè)置信息項(xiàng)(狀態(tài)、動作、回報(bào)和 觀察)之間的關(guān)系。在這種處理中,可以采用貝葉斯網(wǎng)絡(luò)(BN)。根據(jù)本發(fā)明的實(shí)施例,信息處理設(shè)備采用POMDP,以做出基礎(chǔ)處理的模型并進(jìn)行在 用戶和設(shè)備之間進(jìn)行的會話的跟蹤處理,即,以構(gòu)建特定基礎(chǔ)處理。另外,根據(jù)本發(fā)明的實(shí)施例,信息處理設(shè)備采用用于執(zhí)行會話中的基礎(chǔ)的規(guī)則。例 如,采用用于生成問題以實(shí)現(xiàn)對從用戶接收到的指令的清晰理解的規(guī)則。例如,進(jìn)行以下處理用戶我需要飛往倫敦在接收到這種請求時(shí),系統(tǒng)進(jìn)行下面的確認(rèn)處理,以實(shí)現(xiàn)相互理解系統(tǒng)你是說“到倫敦”嗎?系統(tǒng)詢問這種問題以進(jìn)行確認(rèn)。用戶如下回答該問題用戶是的。通過獲取這種回答,可以增大理解的置信度P。這樣,根據(jù)用戶應(yīng)答(是的)可以增大倫敦作為目的地的[置信度(P)]。在這種情況下,如下表示置信度P :P(目的地=倫敦I證據(jù)=是)。(2)根據(jù)本發(fā)明的信息處理設(shè)備的示例性配置和詳細(xì)處理圖4示出根據(jù)本發(fā)明的信息處理設(shè)備的示例性配置。在圖4中,作為例子,示出進(jìn) 行諸如頻道選擇等的處理的電視系統(tǒng)。電視機(jī)包括與用戶進(jìn)行通信的數(shù)據(jù)處理單元。數(shù)據(jù) 處理單元使用POMDP和貝葉斯網(wǎng)絡(luò)進(jìn)行相互理解處理,即,基礎(chǔ)處理。如圖4所示,信息處理設(shè)備100包括會話管理器101、顯示器102、任務(wù)管理器103 和用戶接口(GUI前端)104。用戶接口(GUI前端)104包括語義解析仿真器105和基礎(chǔ)動
11作仿真器106。會話管理器101包括POMDP執(zhí)行單元200。POMDP執(zhí)行單元200使用部分可 觀察馬爾可夫決策過程(POMDP)執(zhí)行基礎(chǔ)處理。在用戶接口(⑶I前端)104的語義解析仿真器105中,對從用戶20輸出的話語進(jìn) 行現(xiàn)有的語音識別和語義分析。這樣識別話語的含義。將識別的言語輸出給會話管理器 101。另外,在進(jìn)行基礎(chǔ)處理時(shí),將從用戶輸出的話語輸入到基礎(chǔ)動作仿真器106。提取 在基礎(chǔ)處理中(即,在用戶20和信息處理設(shè)備100之間的相互理解處理中)處理的用戶的 動作和話語信息作為基礎(chǔ)動作。此后,將基礎(chǔ)動作連同用戶話語信息一起輸出給會話管理 器 101。如果通過語義解析仿真器105充分識別了用戶的言語的含義,則會話管理器101 向任務(wù)管理器103輸出任務(wù)執(zhí)行請求。更具體地,會話管理器101輸出諸如與頻道改變指 令相關(guān)的信息或用于顯示節(jié)目列表(EPG)的請求等的語義要素。任務(wù)管理器103進(jìn)行與從 會話管理器101輸入的請求相對應(yīng)的任務(wù)。將任務(wù)執(zhí)行的結(jié)果輸出到例如顯示器102。注意,任務(wù)管理器103發(fā)送與會話管理器101可允許的任務(wù)信息相關(guān)的任務(wù)信息。然而,如果通過語義解析仿真器105沒有充分識別用戶的言語的含義,則以下面 的方式進(jìn)行基礎(chǔ)處理?;A(chǔ)動作仿真器106提取用戶的動作和話語信息作為基礎(chǔ)動作,然 后將該基礎(chǔ)動作連同用戶話語信息一起輸出給會話管理器101。會話管理器101響應(yīng)于來自基礎(chǔ)動作仿真器106的信息的輸入而進(jìn)行基礎(chǔ)處理。 也就是說,會話管理器101進(jìn)行用于實(shí)現(xiàn)與用戶之間的相互理解的基礎(chǔ)處理。在該基礎(chǔ)處 理中,使用POMDP。例如,在基礎(chǔ)處理中,在顯示器102上顯示問題。用戶20通過用戶接口(⑶I前 端)104輸入對該問題的回答。語義解析仿真器105進(jìn)行包括語音識別和語義分析的語言 分析,并且基礎(chǔ)動作仿真器106提取基礎(chǔ)動作。將處理的結(jié)果輸入到會話管理器101。在該 基礎(chǔ)處理中,重復(fù)這種處理。如果通過會話管理器101使用POMDP所進(jìn)行的基礎(chǔ)處理最終識別了從用戶輸出的 言語的含義,則會話管理器101向任務(wù)管理器103輸出任務(wù)執(zhí)行請求。更具體地,例如,會話 管理器101輸出諸如頻道改變指令信息或用于顯示節(jié)目指南(EPG)的請求等的語義要素。 任務(wù)管理器103執(zhí)行與從會話管理器101輸入的請求相對應(yīng)的任務(wù)。將任務(wù)執(zhí)行的結(jié)果輸 出到顯示器102。(3)會話管理器所進(jìn)行的詳細(xì)基礎(chǔ)處理下面參考圖5至7所示的流程圖詳細(xì)說明會話管理器101進(jìn)行的基礎(chǔ)處理的序 列。圖5是會話管理器101進(jìn)行的基礎(chǔ)處理的全部序列的流程圖。圖6是圖5所示的步驟S102中進(jìn)行的處理的流程圖,即,用于基于用戶話語生成 應(yīng)用于POMDP的觀察值(觀察ID)的處理的詳細(xì)序列。圖7是圖5所示的步驟S104中進(jìn)行的處理的流程圖,即,POMDP執(zhí)行單元200進(jìn)行 的基礎(chǔ)處理的詳細(xì)序列。POMDP執(zhí)行單元200使用部分可觀察馬爾可夫決策過程(POMDP) 進(jìn)行基礎(chǔ)處理。接著說明圖5所示的流程圖的步驟中進(jìn)行的處理。
首先,在步驟SlOl中產(chǎn)生用戶話語。通過圖4所示的用戶接口(⑶I前端)104將 用戶話語信息輸入給會話管理器101。隨后,在步驟S102中,會話管理器101基于用戶話語生成觀察ID。下面參考圖6所示的流程圖詳細(xì)說明步驟S102中進(jìn)行的處理。在步驟S201中,會話管理器101計(jì)算對通過圖4所示的用戶接口 104輸入的用戶 話語的理解的確信度。此時(shí),僅使用基于語言分析處理的信息(語義信息)計(jì)算理解的確 信度。如下計(jì)算僅使用基于語言分析的信息(語義信息)所獲得的通過語言處理的語義置 信度[SemConf]SemConf = f (通過語言處理的語義置信度)其中,f ()表示計(jì)算存儲在會話管理器101中的通過語言處理的語義置信度 [SemConf]的函數(shù)。隨后,在步驟S202中,會話管理器101向任務(wù)管理器103詢問對通過用戶接口 (GUI前端)104輸入的用戶話語的語言分析的結(jié)果的適當(dāng)性(relevance)是否存在。任務(wù) 管理器103向會話管理器101回答對用戶話語的語言分析的結(jié)果的適當(dāng)性是否存在。例如,當(dāng)通過電視系統(tǒng)進(jìn)行該處理時(shí)且如果識別出諸如頻道改變等的與電視系統(tǒng) 的操作相關(guān)的用戶話語,則任務(wù)管理器103返回表示存在適當(dāng)性的確定結(jié)果。然而,如果識 別出與電視系統(tǒng)的操作無關(guān)的用戶話語(例如話語“我累了”),則任務(wù)管理器103返回表 示不存在適當(dāng)性的確定結(jié)果。注意,任務(wù)管理器103具有用于進(jìn)行這種確定的程序并且使 用該程序進(jìn)行確定。隨后,在步驟S203中,會話管理器101詢問任務(wù)管理器103是否存在通過用戶接 口 104輸入的用戶話語的一致性(consistency)。任務(wù)管理器103向會話管理器101回答 是否存在用戶話語的一致性。例如,如果任務(wù)管理器103已正在處理來自用戶的請求,則任務(wù)管理器103確定表 示下個(gè)指令的用戶話語是否與當(dāng)前處理具有一致性。注意,任務(wù)管理器103具有用于確定 用戶話語的語言分析的結(jié)果的適當(dāng)性和一致性的程序,并且使用該程序進(jìn)行確定。隨后,在步驟S204中,會話管理器101使用從任務(wù)管理器103接收到的信息(即, 實(shí)體意見(pragmatic opinion))計(jì)算對實(shí)體意見的理解的置信度。如下給出用于計(jì)算表 示對實(shí)體意見的理解的置信度的實(shí)體置信度[PragConf]的表達(dá)式PragConf = g (適當(dāng)性,一致性)其中,g()表示計(jì)算存儲在會話管理器101中的實(shí)體置信度[PragConf]的函數(shù)。隨后,在步驟S205中,會話管理器101通過對以下兩者進(jìn)行求和來計(jì)算總體置信 度[OveralIConf]僅使用基于在步驟S201中進(jìn)行的語言分析的信息(語義信息)而獲得 的通過語言處理的語義置信度[SemConf],以及在步驟S204中使用實(shí)體信息計(jì)算出的表示 理解的置信度的實(shí)體置信度[PragConf]。如下給出用于計(jì)算總體置信度的表達(dá)式OverallConf = h (語義,實(shí)體)其中,h()表示計(jì)算存儲在會話管理器101中的總體置信度[OverallConf]的函數(shù)。隨后,在步驟S206中,會話管理器101詢問任務(wù)管理器103通過用戶接口 104輸 入的用戶話語的基礎(chǔ)動作的類型(種類)。也就是說,會話管理器101詢問任務(wù)管理器103用戶話語屬于圖2所示的種類開始(I)到取消(R)中的哪一個(gè)。任務(wù)管理器103使用預(yù)先 存儲的程序分析用戶話語的動作,并且將用戶話語是基礎(chǔ)動作中的哪一個(gè)作為分析的結(jié)果 而通知給會話管理器101。在步驟S207中,會話管理器101生成要應(yīng)用于POMDP的觀察ID。觀察ID對應(yīng)于 輸入的用戶話語。使用下面的值計(jì)算觀察ID (a)在步驟S201中計(jì)算出的且僅根據(jù)基于語言分析處理的信息所獲得的語義置 信度[SemConf];(b)在步驟S204中使用實(shí)體信息計(jì)算出的實(shí)體置信度[PragConf];(c)在步驟S205中計(jì)算出的總體置信度;以及(d)在步驟S206中從任務(wù)管理器103獲取的與用戶話語相關(guān)的基礎(chǔ)動作信息。會話管理器101使用這些值和預(yù)定的計(jì)算程序確定觀察ID。如下給出用于確定觀察ID的表達(dá)式觀察ID = ζ (語義,實(shí)體,總體,基礎(chǔ)動作)其中,z()表示計(jì)算存儲在會話管理器101中的觀察ID的函數(shù)。例如,將語義置信度[SemConf]、實(shí)體置信度[PragConf]和總體置信度 [OveralIConf]中的每個(gè)設(shè)置為以下三個(gè)值之一高置信度值[H(高)]、低置信度值 [L(低)]和中置信度值[A(不確定)]。另外,用戶話語的基礎(chǔ)動作是圖2所示的開始⑴到取消(R)(在圖2所示的例子 中的十三種類型)中的一個(gè)。作為結(jié)果,出現(xiàn)3 X 3 X 3 X 13個(gè)不同的組合模式。會話管理器101存儲這些組合模式中的每個(gè)的觀察ID和對應(yīng)的數(shù)據(jù),并且基于對 應(yīng)的數(shù)據(jù)計(jì)算觀察ID。這樣,通過圖6所示的流程的步驟S201至S207中所進(jìn)行的處理,會話管理器101 生成應(yīng)用于POMDP的觀察ID。觀察ID對應(yīng)于輸入的用戶話語?;氐絽⒖紙D5,繼續(xù)說明會話管理器101的處理的序列。在步驟S102中,會話管理 器101進(jìn)行圖6所示的流程的步驟S201至S207中的處理,并且生成與用戶話語相對應(yīng)的 觀察ID。隨后,在步驟S103中,會話管理器101將與用戶話語相對應(yīng)的觀察ID輸出至 POMDP執(zhí)行單元200。在接著的步驟S104中,通過POMDP執(zhí)行單元200進(jìn)行基礎(chǔ)處理。下 面參考圖7所示的流程圖更詳細(xì)地說明POMDP執(zhí)行單元200所進(jìn)行的基礎(chǔ)處理。在步驟S301中,POMDP執(zhí)行單元200接收到與用戶話語相對應(yīng)的觀察ID。隨后, 在步驟S302中,POMDP執(zhí)行單元200進(jìn)行基于與用戶話語相對應(yīng)的觀察ID來更新確信度 狀況的處理。如上所述,在POMDP中,基于觀察ID來更新確信度狀況。例如,如上所述,通過下 面的處理,置信度P被增大。用戶我需要飛往倫敦。在接收到這種請求時(shí),系統(tǒng)進(jìn)行下面的確認(rèn)處理,以實(shí)現(xiàn)相互理解。系統(tǒng)你是說“到倫敦”嗎?用戶如下回答該問題。
用戶是的。因此,根據(jù)來自用戶的應(yīng)答(是的),可以增大目的地作為倫敦的[置信度(P)]。在這種情況下,如下表示置信度P :P(目的地=倫敦I證據(jù)=是)在步驟S302中,進(jìn)行與上述處理相類似的處理。因此,基于與用戶話語相對應(yīng)的 觀察ID來更新確信度狀況。隨后,在步驟S303中,確定設(shè)備對用戶所進(jìn)行的下個(gè)動作。例如,該動作是圖2所 示的開始(I)到取消(R)(圖2所示的例子中的十三個(gè)動作)中的一個(gè)。如上所述,POMDP是用于通過使用下面的信息的狀態(tài)預(yù)測或動作判定的技術(shù)(a)狀態(tài)空間(S);(b)動作空間(A);(c)觀察空間(0);以及(d)回報(bào)空間(R)。這種信息隨著時(shí)間(t)過去而改變。例如,定義計(jì)算狀態(tài)變換的概率的函數(shù)、計(jì)算 回報(bào)的函數(shù)、以及計(jì)算觀察狀態(tài)的發(fā)生的概率的函數(shù)。此后,使用可獲得的信息和所定義的 函數(shù)進(jìn)行狀態(tài)預(yù)測或動作判定。這里,在步驟S301中,獲取與用戶話語相對應(yīng)的新的觀察ID。此后,使用觀察ID 和預(yù)先定義的算法確定下個(gè)動作。例如,計(jì)算在圖2所示的開始(I)到取消(R)中的每個(gè) 時(shí)所獲得的回報(bào)。注意,在這種情況下,例如,回報(bào)對應(yīng)于理解的確信度。在步驟S304中,將在步驟S303中針對動作計(jì)算出的回報(bào)(=理解的確信度)進(jìn) 行相互比較,并且選擇具有最高值的動作作為要進(jìn)行的動作。此后,POMDP執(zhí)行單元200執(zhí) 行該動作,作為設(shè)備所進(jìn)行的動作。隨后,在步驟S305中,POMDP執(zhí)行單元200將用作執(zhí)行的動作的標(biāo)識的動作ID發(fā) 送到會話管理器101?;氐絽⒖紙D5,繼續(xù)說明會話管理器101的處理的序列。在步驟S104中,POMDP執(zhí) 行單元200通過進(jìn)行圖7所示的流程的步驟S301至S307中的處理來進(jìn)行基礎(chǔ)處理。也就 是說,POMDP執(zhí)行單元200確定設(shè)備要進(jìn)行的動作并進(jìn)行所確定的動作。此后,將設(shè)備所進(jìn) 行的動作的動作ID發(fā)送給會話管理器101。在步驟S105中,會話管理器101使用設(shè)備所進(jìn)行的動作的動作ID來分析基礎(chǔ)的 進(jìn)度(progress),S卩,相互理解的進(jìn)度。更具體地,如果設(shè)備所進(jìn)行的動作是下面的動作之(a) [Ack],表示理解的肯定回答;以及(b)[發(fā)送到TM],表示發(fā)送對任務(wù)管理器要進(jìn)行的處理的請求,確定實(shí)現(xiàn)了基礎(chǔ) (打好了基礎(chǔ)),即,實(shí)現(xiàn)了相互理解。然而,如果設(shè)備所進(jìn)行的動作是除了(a) [Ack]和(b)[發(fā)送到TM]以外的動作,則 確定未實(shí)現(xiàn)基礎(chǔ)(未打好基礎(chǔ)),即,未相互理解。如果確定實(shí)現(xiàn)了基礎(chǔ)(打好了基礎(chǔ)),即,實(shí)現(xiàn)了相互理解,則步驟S106中的確定 結(jié)果為“是”。此時(shí),處理進(jìn)行到步驟S108。在步驟S108中,重新設(shè)置基礎(chǔ)動作。在步驟S109中,將消息(任務(wù)請求)發(fā)送到
15任務(wù)管理器(TM)。然而,如果確定未實(shí)現(xiàn)基礎(chǔ)(未打好基礎(chǔ)),即,未實(shí)現(xiàn)相互理解,則步驟S106的確 定結(jié)果為“否”。此時(shí),處理進(jìn)行到步驟S107。在步驟S107中,例如,在設(shè)備的顯示器上顯示基礎(chǔ)動作的結(jié)果,即,表示未實(shí)現(xiàn)相 互理解的信息,以使得用戶獲知該結(jié)果。此后,繼續(xù)進(jìn)行基礎(chǔ)處理。注意,在例如執(zhí)行基礎(chǔ)處理直到在步驟S106中實(shí)現(xiàn)相互理解或完成基礎(chǔ)階段為 止的期間,持續(xù)地重復(fù)地進(jìn)行圖5所示的處理。接著參考圖8說明會話管理器101的POMDP執(zhí)行單元200所進(jìn)行的處理,即,使用 部分可觀察馬爾可夫決策過程(POMDP)的處理。POMDP執(zhí)行單元200執(zhí)行包括下面的兩個(gè)處理的使用POMDP的處理(A)用于確定是否對用戶話語打好了基礎(chǔ)(理解了用戶話語)的管理處理;以及(B)基礎(chǔ)階段變換的管理處理。圖8示出了這兩個(gè)處理㈧和⑶的POMDP管理信息項(xiàng),S卩,圖3所示的以下信息 項(xiàng)(a)狀態(tài)空間(S);(b)動作空間(A);(C)觀察空間(0);以及(d)回報(bào)空間(R)。注意,通過具有表示觀察信息(Observation)的終端節(jié)點(diǎn)的貝葉斯網(wǎng)絡(luò)構(gòu)建 POMDP0貝葉斯網(wǎng)絡(luò)是以有向圖的形式表示概率變量之間的依賴性的網(wǎng)絡(luò)。例如,有向圖包 括表示證據(jù)的節(jié)點(diǎn)和表示證據(jù)之間的因果關(guān)系的鏈接。通過使用樣本學(xué)習(xí)數(shù)據(jù)的學(xué)習(xí),可 以生成表示基于特定條件的貝葉斯網(wǎng)絡(luò)的節(jié)點(diǎn)的發(fā)生的概率的條件概率表(CPT)。接著參考圖9說明貝葉斯網(wǎng)絡(luò)和條件概率表(CPT)。對于隨機(jī)推理采用貝葉斯網(wǎng) 絡(luò)。特別地,通過使用貝葉斯網(wǎng)絡(luò),在僅觀察到一些證據(jù)的包括不確定性的區(qū)域中,定量地 處理預(yù)測或決策?;旧?,在該算法中,將多個(gè)證據(jù)定義為節(jié)點(diǎn),并且對節(jié)點(diǎn)之間的依賴性 進(jìn)行模型化。在圖9所示的例子中,將四個(gè)證據(jù)節(jié)點(diǎn)[Cloudy (云)]、[Sprinkler (噴水)]、 [Rain(雨)]和[WetGlass (濕草)]定義為節(jié)點(diǎn)。鏈接節(jié)點(diǎn)的箭頭表示箭頭的源(父節(jié)點(diǎn)) 具有對箭頭的目的地(子節(jié)點(diǎn))的影響。在圖9所示的例子中,節(jié)點(diǎn)[Cloudy]具有真(True) = 0. 5的概率和假(False) =0. 5的概率。在這種情況下,對于父節(jié)點(diǎn)[Cloudy]的子節(jié)點(diǎn)[Sprinkler],根據(jù)父節(jié)點(diǎn) [Cloudy]的狀態(tài),可以以CPT(條件概率表)的形式獲得Sprinkler開啟(真)的概率和 Sprinkler關(guān)閉(假)的概率。也就是說,可以獲得圖9所示的CPT 301。CPT 301 表示當(dāng)父節(jié)點(diǎn)[Cloudy] = F(假)時(shí),子節(jié)點(diǎn)[Sprinkler]關(guān)閉(假)的概率=0. 5 ;并且子節(jié)點(diǎn)[Sprinklerl開啟(真)的概率=0. 5 ;以及當(dāng)父節(jié)點(diǎn)[Cloudy]= T(真)時(shí),子節(jié)點(diǎn)[Sprinkler]關(guān)閉(假)的概率=0. 9 ;并且
子節(jié)點(diǎn)[Sprinkler]開啟(真)的概率=0. 1。在CPT 301中,P(S = F)表示子節(jié)點(diǎn)[Sprinkler]為假的概率(可行性),并且 P(S = T)表示子節(jié)點(diǎn)[Sprinkler]為真的概率(可行性)。另外,對于父節(jié)點(diǎn)[Cloudy]的子節(jié)點(diǎn)[Rain],根據(jù)父節(jié)點(diǎn)[Cloudy]的狀態(tài),可以 以CPT (條件概率表)的形式獲得下雨(真)的概率和不下雨(假)的概率。也就是說,可 以獲得圖9所示的CPT 302。CPT 302 表示當(dāng)父節(jié)點(diǎn)[Cloudy] = F(假)時(shí),子節(jié)點(diǎn)[Rain]為不下雨(假)的概率=0. 8 ;并且子節(jié)點(diǎn)[Rain]為下雨(真)的概率=0. 2 ;以及當(dāng)父節(jié)點(diǎn)[Cloudy]= T(真)時(shí),子節(jié)點(diǎn)[Rain]為不下雨(假)的概率=0. 2 ;并且子節(jié)點(diǎn)[Rain]為下雨(真)的概率=0. 8。此外,對于父節(jié)點(diǎn)[Sprinkler]和[Rain]的子節(jié)點(diǎn)[WetGlass],根據(jù)父節(jié)點(diǎn) [Sprinkler]和[Rain]的狀態(tài),可以以CPT的形式獲得草是濕的(真)的概率和草不是濕 的(假)的概率。也就是說,可以獲得圖9所示的CPT303。CPT 303表示當(dāng)父節(jié)點(diǎn)[Sprinkler] = F(假)且父節(jié)點(diǎn)[Rain] = F(假)時(shí),子節(jié)點(diǎn)[WetGlass]不是濕的(假)的概率為1. 0 ;并且子節(jié)點(diǎn)[WetGlass]是濕的(真)的概率為0. 0 ;以及當(dāng)父節(jié)點(diǎn)[Sprinkler] = T(真)且父節(jié)點(diǎn)[Rain] = F(假)時(shí),子節(jié)點(diǎn)[WetGlass]不是濕的(假)的概率為0. 1 ;并且子節(jié)點(diǎn)[WetGlass]是濕的(真)的概率為0. 9 ;以及當(dāng)父節(jié)點(diǎn)[Sprinkler] = F(假)且父節(jié)點(diǎn)[Rain] = T(真)時(shí),子節(jié)點(diǎn)[WetGlass]不是濕的(假)的概率為0. 1 ;并且子節(jié)點(diǎn)[WetGlass]是濕的(真)的概率為0. 9 ;以及當(dāng)父節(jié)點(diǎn)[Sprinkler] = T(真)且父節(jié)點(diǎn)[Rain] = T(真)時(shí),子節(jié)點(diǎn)[WetGlass]不是濕的(假)的概率為0. 01 ;并且子節(jié)點(diǎn)[WetGlass]是濕的(真)的概率為0. 99。這樣,條件概率表(CPT)以表的形式表示子節(jié)點(diǎn)的結(jié)果發(fā)生的概率,其中,該表表 示依賴于父節(jié)點(diǎn)的條件的概率的概率分布。通過以這種方式采用貝葉斯網(wǎng)絡(luò),可以獲得表 示在原因出現(xiàn)的情況下獲得結(jié)果的條件概率的表的CPT。在根據(jù)本發(fā)明的配置中,使用貝葉斯網(wǎng)絡(luò)表示圖3所示的下面的信息項(xiàng)中所包括 的要素之間的依賴性(a)狀態(tài)空間(S);(b)動作空間(A);(C)觀察空間(0);以及(d)回報(bào)空間(R)。此后,設(shè)置圖8所示的POMDP。POMDP執(zhí)行單元200執(zhí)行包括下面的兩個(gè)處理的使 用POMDP的處理(A)用于確定是否對用戶話語打好了基礎(chǔ)(理解了用戶話語)的管理處理;以及
(B)基礎(chǔ)階段變換的管理處理。下面說明圖8所示的節(jié)點(diǎn)信息項(xiàng)。在用于確定是否對用戶話語打好了基礎(chǔ) (理解了用戶話語)的管理處理㈧中,觀察空間包括以下三個(gè)觀察空間實(shí)體證據(jù) (pragmatic evidence) 221、;總、體3||角軍(overallunderstanding) 222 禾口語義iiE據(jù)(semantic evidence)223。狀態(tài)空間包括下面三種狀態(tài)空間實(shí)體231、語義232和打好基礎(chǔ)(Grounded) 233。此外,將基礎(chǔ)成本(Grounding Cost) 241設(shè)置為回報(bào)空間。例如,可以基于通過圖6所示的流程的步驟S202和S203中的處理從任務(wù)管理器 103獲得的任務(wù)的可行性來獲得觀察空間中所包括的實(shí)體證據(jù)221。例如,如上所述,可以 獲得高置信度[H(高)]、低置信度[L(低)]或中置信度[A(不確定)]。注意,可以獲得各 種類型的信息。例如,可以根據(jù)任務(wù)的可行性設(shè)置兩種類型的觀察空間(是,否)。另外,觀察空間中所包括的總體理解222除了包括從觀察空間241和243所獲得 的觀察空間以外還包括各種信息。例如,總體理解222包括與和輸出話語的用戶之間的會 談的狀態(tài)相關(guān)的觀察空間、表示用戶是否回答了從系統(tǒng)輸出的問題的狀態(tài)、以及與是否存 在用戶相關(guān)的信息。根據(jù)觀察空間,可以獲得諸如[H(高)]、[L(低)]、[A(不確定)]或(是,否)等 的上述觀察空間。此外,觀察空間中所包括的語義證據(jù)223表示對用戶話語進(jìn)行的語音識別和語義 分析的結(jié)果。例如,可以獲得表示根據(jù)語義分析是否成功的[H (高)]、[L (低)]、[A (不確定)] 或(是,否)的觀察空間。對于被包括在狀態(tài)空間中的、包括任務(wù)可行性的實(shí)體231,設(shè)置基于觀察空間中包 括的實(shí)體證據(jù)221中的分析信息的狀態(tài)值。例如,設(shè)置狀態(tài)[H(高)]、[L(低)]或[A(不確定)],或者根據(jù)是否存在任務(wù)的 可行性而使用概率值來設(shè)置(是,否)。當(dāng)使用諸如(是,否)之類的兩種狀態(tài)時(shí),例如,設(shè) 置概率值數(shù)據(jù)(“是”的概率(0. 8)和“否”的概率(0. 2))。圖10(1)示出隨著時(shí)間過去的實(shí)體231的狀態(tài)值數(shù)據(jù)的變換的例子。隨著時(shí)間過 去,“是”的概率值和“否”的概率值根據(jù)實(shí)體證據(jù)221的輸入而改變。此外,對于狀態(tài)空間中包括的語義232,設(shè)置基于包括在觀察空間中的語義證據(jù) 223中的分析信息的狀態(tài)值。例如,根據(jù)表示語義分析是否成功的觀察空間而使用概率值來設(shè)置兩種狀態(tài) (是,否)。例如,設(shè)置“是”的概率(0. 9)和“否”的概率(0. 1)。圖10⑵示出隨著過去語義232的狀態(tài)值數(shù)據(jù)的變換的例子。隨著時(shí)間過去,“是” 的概率值和“否”的概率值根據(jù)觀察信息(語義證據(jù)223)的輸入而改變。此外,對于狀態(tài)空間中所包括的打好基礎(chǔ)233,設(shè)置從包括任務(wù)空間中所包括的任 務(wù)的可行性的實(shí)體231、與語義232相關(guān)的信息以及總體理解222所獲得的觀察信息。例如, 設(shè)置基于輸出話語的用戶的會談狀態(tài)、與對從用戶輸出的問題進(jìn)行應(yīng)答的用戶相關(guān)的信息 以及與是否存在用戶相關(guān)的信息的綜合狀態(tài)值。例如,使用概率值設(shè)置表示是否實(shí)現(xiàn)理解的兩種狀態(tài)(是,否)。例如,設(shè)置“是”
18的概率(0. 7)和“否”的概率(0. 3)。圖10(3)示出隨著時(shí)間過去的打好基礎(chǔ)233的狀態(tài)值數(shù)據(jù)的變換的例子。隨著時(shí) 間過去,“是”的概率值和“否”的概率值根據(jù)使用任務(wù)可行性信息而生成的實(shí)體231、與語 義232相關(guān)的信息以及總體理解222的輸入而改變。被設(shè)置為回報(bào)空間的基礎(chǔ)成本241對應(yīng)于用于執(zhí)行包括在狀態(tài)空間中的打好基 礎(chǔ)233的成本。例如,當(dāng)通過基礎(chǔ)處理獲得充分理解并且可以進(jìn)行正確處理時(shí),或者當(dāng)最終 沒有獲得充分理解并且浪費(fèi)了時(shí)間時(shí),成本發(fā)生變化。另外,在用于管理基礎(chǔ)階段變換的管理處理(B)中,觀察空間包括用戶基礎(chǔ)動作 (User Grounding Act)251。狀態(tài)空間包括下面兩種狀態(tài)空間處理前狀態(tài)261和處理262。動作空間包括信息處理設(shè)備所進(jìn)行的系統(tǒng)基礎(chǔ)動作(SystemGroimding Action)271 ο此外,作為回報(bào)空間,設(shè)置以下兩個(gè)回報(bào)空間處理成本281和動作成本282。觀察空間中所包括的用戶基礎(chǔ)動作251表示與基礎(chǔ)處理中所進(jìn)行的用戶動作相 關(guān)的信息。更具體地,例如,在圖1和2所示的基礎(chǔ)模型(Grounding model)中,可以獲得 下面的觀察空間作為用戶動作話語開始處理(Initiate),繼續(xù)處理(continue),確認(rèn)處理(impair),確認(rèn)請求處理(ReqR印air),確認(rèn)應(yīng)答(ack),對確認(rèn)應(yīng)答的請求(Reqack),以及取消(cancel)。狀態(tài)空間中所包括的處理前狀態(tài)261和處理262對應(yīng)于基礎(chǔ)動作中的兩個(gè)時(shí)間序 列執(zhí)行處理狀態(tài)。例如,在圖1和2所示的基礎(chǔ)模型中,作為處理前狀態(tài)261和處理262的 狀態(tài)值,設(shè)置S、1、2、3、4、D和F七個(gè)狀態(tài)的概率值,其中,S 初始狀態(tài);1 緊接在開始之后的狀態(tài);2 系統(tǒng)混亂;3 需要確認(rèn);4 用戶混亂;D 取消;F:基礎(chǔ)完成。此時(shí),設(shè)置七個(gè)狀態(tài)S至F的概率值,以使得狀態(tài)S至F的概率值的和為[1]。圖11示出了隨著時(shí)間過去的處理262的狀態(tài)值數(shù)據(jù)的變換的例子。隨著時(shí)間過 去,與狀態(tài)S至F相對應(yīng)的概率值根據(jù)用戶基礎(chǔ)動作251的輸入而改變。動作空間中所包括的系統(tǒng)基礎(chǔ)動作271表示為了相互理解而由信息處理設(shè)備進(jìn) 行的基礎(chǔ)動作。系統(tǒng)基礎(chǔ)動作271是系統(tǒng)中進(jìn)行的處理。在圖1和2所示的基礎(chǔ)模型中, 系統(tǒng)執(zhí)行下面的動作
話語開始處理(Initiate),繼續(xù)處理(continue),確認(rèn)處理(impair),確認(rèn)請求處理(ReqR印air),確認(rèn)應(yīng)答(ack),對確認(rèn)應(yīng)答的請求(Reqack),以及取消(cancel)。被設(shè)置為回報(bào)空間的處理成本281對應(yīng)于狀態(tài)空間中所包括的處理262的執(zhí)行成 本。例如,設(shè)置該成本,以使該成本根據(jù)處理所需時(shí)間和處理負(fù)荷而改變。被設(shè)置為回報(bào)空間的動作成本282對應(yīng)于動作空間中所包括的系統(tǒng)基礎(chǔ)動作271 的執(zhí)行成本。例如,設(shè)置動作成本282,以使動作成本282根據(jù)處理所需時(shí)間和處理負(fù)荷而改變。圖8所示的系統(tǒng)基礎(chǔ)動作271對應(yīng)于POMDP中的動作空間。系統(tǒng)基礎(chǔ)動作271表 示為了相互理解而由信息處理設(shè)備進(jìn)行的基礎(chǔ)動作。在圖1和2所示的基礎(chǔ)模型中,系統(tǒng)執(zhí)行以下動作之一話語開始處理(Initiate),繼續(xù)處理(continue),確認(rèn)處理(impair),確認(rèn)請求處理(ReqR印air),確認(rèn)應(yīng)答(ack),確認(rèn)應(yīng)答的請求(Reqack),以及取消(cancel)。根據(jù)使用POMDP中所設(shè)置的成本計(jì)算算法計(jì)算出的成本來確定要執(zhí)行該動作中 的哪一個(gè)動作。在圖1和2所示的基礎(chǔ)模型中,系統(tǒng)所執(zhí)行的動作是上述七個(gè)動作(Initiate至 Cancel)中的一個(gè)。然而,如上所述,圖1和2所示的基礎(chǔ)模型僅是例子。因此,可以使用具 有不同配置的基礎(chǔ)模型。例如,可以使用僅具有三個(gè)動作的簡化基礎(chǔ)模型話語開始處理(Initiate)、確 認(rèn)應(yīng)答(ack)和取消(cancel)。例如,可以使用通過從圖1所示的基礎(chǔ)模型中去除除了下面的三個(gè)動作以外的動 作而生成的基礎(chǔ)模型話語開始處理(Initiate)、確認(rèn)應(yīng)答(ack)和取消(cancel)。另外, 可以去除圖1所示的階段S、l、2、3、4、F和D中的一些階段。下面說明使用簡化基礎(chǔ)模型的處理的例子,其中,在簡化基礎(chǔ)模型中,僅定義三個(gè) 動作話語開始處理(Initiate)、確認(rèn)應(yīng)答(ack)和取消(cancel)。接著說明這樣的例子,在該例子中,使用POMDP執(zhí)行基礎(chǔ)處理的設(shè)備是包括電視 機(jī)的設(shè)備,并且用戶請求該設(shè)備改變電視頻道。當(dāng)用戶使用話語“將電視頻道改變成1”向設(shè)備進(jìn)行請求時(shí),圖4所示的語義解析 仿真器105分析該話語的含義。例如,如果語義解析仿真器105沒有充分識別用戶話語,則進(jìn)行基礎(chǔ)處理。在這種情況下,基礎(chǔ)動作仿真器106提取用戶動作和話語信息作為基礎(chǔ)動作,并且將其連同用戶 話語信息一起輸出給會話管理器101。在接收到來自基礎(chǔ)動作仿真器106的信息時(shí),會話管理器101進(jìn)行基礎(chǔ)處理,即, 用于實(shí)現(xiàn)與用戶的相互理解的基礎(chǔ)處理。在基礎(chǔ)處理中,采用P0MDP。在基礎(chǔ)處理中,例如,將問題顯示在顯示器102上。用戶20通過用戶接口(⑶I前 端)104輸入對問題的回答。語義解析仿真器105進(jìn)行包括語音識別和語義分析的語言分 析。基礎(chǔ)動作仿真器106提取基礎(chǔ)動作。將與結(jié)果相關(guān)的信息輸入至?xí)捁芾砥?01。在 基礎(chǔ)處理中,重復(fù)這種處理。當(dāng)用戶向設(shè)備發(fā)送請求“將電視頻道改變成1”時(shí),會話管理器101通過在顯示器 102上顯示消息“頻道1 ? ”來詢問問題。來自用戶的可能的回答是以下三個(gè)之一(a)是;(b)不是;以及(c)其它。會話管理器101根據(jù)三個(gè)回答之一來確定要進(jìn)行的動作。例如,如果㈧來自用 戶的回答是“是”,則要進(jìn)行的動作(基礎(chǔ)動作)=確認(rèn)應(yīng)答(ack)。然而,如果⑶來自用 戶的回答是“否”,則要進(jìn)行的動作(基礎(chǔ)動作)=取消(cancel)。如果(c)來自用戶的回 答是“其它”,則要進(jìn)行的動作(基礎(chǔ)動作)=開始(Initiate)。用于確定要進(jìn)行的動作(基礎(chǔ)動作)的算法被表示如下If Answer is YesNoAnswer (如果回答是 YesNoAnswer)If Answer is Negative (如果回答是 Negative)GroundingAct = Cancel (GroundingAct =IXffI )Else (否則)GroundingAct = Ack (GroundingAct =確認(rèn))Else (否則)GroundingAct = Initiate (GroundingAct =Jf女臺)注意,如果要進(jìn)行的動作(GroundingAct)=開始動作(Initiate),則再次接收用 戶話語,隨后開始新的基礎(chǔ)處理。這樣,可以限制動作的數(shù)量(該例子中為3),并且可以將 簡化基礎(chǔ)模型應(yīng)用于該處理。如上所述,根據(jù)本發(fā)明,在基礎(chǔ)處理中,可以采用多種基礎(chǔ)模型。另外,可以進(jìn)行使 用POMDP的處理。因此,可以有效實(shí)現(xiàn)用戶和信息處理設(shè)備之間的相互理解。(4)使用POMDP的示例性基礎(chǔ)處理接著參考圖12和隨后的
與根據(jù)本發(fā)明的使用POMDP的基礎(chǔ)處理相關(guān)的 評估數(shù)據(jù)。圖12和13是示出了根據(jù)本發(fā)明的使用POMDP的基礎(chǔ)處理的結(jié)果與不使用POMDP 的基礎(chǔ)處理的結(jié)果的比較的圖。首先,作為任務(wù),用戶請求系統(tǒng)(電視機(jī),即,信息處理設(shè)備)顯示電視節(jié)目。例 如,用戶進(jìn)行請求“我想要觀看體育節(jié)目”,并且開始會話。最終,顯示用戶想要觀看的體育 節(jié)目。使用這種處理來進(jìn)行該比較。比較下面的處理
(1)相信其中系統(tǒng)信任從用戶接收到的所有話語的處理;(2)確認(rèn)其中每當(dāng)系統(tǒng)接收到用戶話語時(shí)系統(tǒng)確認(rèn)用戶話語的處理;以及(3)POMDP 根據(jù)本發(fā)明的使用POMDP的處理。使用下面兩個(gè)指標(biāo)進(jìn)行評估(A)任務(wù)實(shí)現(xiàn)率對要選擇的節(jié)目的成功選擇的比率;以及(B)次數(shù)直到選擇了要選擇的節(jié)目為止所需的用戶話語的數(shù)量。四個(gè)用戶中的每一個(gè)都進(jìn)行用于選擇10個(gè)節(jié)目的處理。圖12和13示出通過處 理(1)至(3)從總共40個(gè)處理獲得的評估(A)和(B)的結(jié)果。注意,示出了當(dāng)采用具有高 精度的語言處理和低精度的語言處理的兩個(gè)系統(tǒng)時(shí)所獲得的處理的結(jié)果。圖12示出下面的處理的㈧任務(wù)實(shí)現(xiàn)率(對要選擇的節(jié)目的成功選擇的比率)(1)相信(其中系統(tǒng)信任所有用戶話語的處理);(2)確認(rèn)(其中系統(tǒng)始終要求確認(rèn)用戶話語的處理);以及(3) POMDP (使用上述 POMDP 的處理)。通過圖12可知,對于使用POMDP的處理來說任務(wù)實(shí)現(xiàn)率最高。也就是說,與其它 結(jié)果相比獲得良好的結(jié)果。圖13示出下面的處理的(B)次數(shù)(直到選擇了要選擇的節(jié)目為止所需的用戶話 語的數(shù)量)(1)相信(其中系統(tǒng)信任所有用戶話語的處理);(2)確認(rèn)(其中系統(tǒng)始終要求確認(rèn)用戶話語的處理);以及(3) POMDP (使用上述 POMDP 的處理)。從圖13可以看出,對于[相信](即,其中系統(tǒng)信任所有用戶話語的處理)而言, 次數(shù)最低。然而,可以以與對于[相信]而言的次數(shù)相同的次數(shù)來完成使用POMDP的處理。對于[相信](即,其中系統(tǒng)信任所有用戶話語的處理)而言,圖12所示的任務(wù)實(shí) 現(xiàn)率低。結(jié)果,在任務(wù)實(shí)現(xiàn)率和次數(shù)方面,根據(jù)本發(fā)明的使用POMDP的處理優(yōu)于其它處理。接著參考圖14至17說明使用POMDP的基礎(chǔ)場所的例子。圖14至17分別示出下 面的情況(1)用戶與系統(tǒng)充分通信的情況(圖14);(2)用戶的請求模糊(請求具有低可靠性)的情況(圖15);(3)系統(tǒng)不正確地理解來自用戶的請求的情況(圖16);以及(4)用戶和系統(tǒng)之間的通信長的情況(圖17)。在圖14至17中,作為用戶話語的變換數(shù)據(jù),示出用戶和系統(tǒng)(信息處理設(shè)備)之 間的問題的序列以及變換數(shù)據(jù)㈧基礎(chǔ)狀態(tài)的變換和⑶打好基礎(chǔ)狀態(tài)的變換?;A(chǔ)變換狀態(tài)(grounding transition state) (A)對應(yīng)于圖8所示的POMDP中 的處理262,并且打好基礎(chǔ)變換狀態(tài)(grounded transitionstate) (A)對應(yīng)于圖8所示的 POMDP中的打好基礎(chǔ)233、使用諸如任務(wù)可行性等的信息生成的實(shí)體231、以及語義232的 “是”的概率值。下面說明圖14至17中的每一個(gè)。(1)用戶與系統(tǒng)充分通信的情況圖14示出用戶與系統(tǒng)充分通信的情況。在這種情況下,例如,基礎(chǔ)變換狀態(tài)㈧通過1(緊接在開始之后的狀態(tài))從S (初始狀態(tài))成功地改變成F(基礎(chǔ))。因此,實(shí)現(xiàn)基 礎(chǔ),即,用戶和系統(tǒng)之間的相互理解。在打好基礎(chǔ)狀態(tài)⑶的變換中,打好基礎(chǔ)233、實(shí)體231和語義232各自的“是”的 概率值高于第二次輸入話語時(shí)的概率值。因此,出現(xiàn)其中差不多理解來自用戶的請求的狀 態(tài)。(2)用戶的請求模糊(請求具有低可靠性)的情況圖15示出用戶的請求模糊(請求具有低可靠性)的情況。在該情況下,出現(xiàn)下面 的問題系統(tǒng)未能清晰地聽到第二次輸入的用戶的話語“我想要觀看體育節(jié)目”。然后,系統(tǒng) 詢問確認(rèn)問題“你真要觀看動畫片嗎? ”。在這種情況下,基礎(chǔ)狀態(tài)變換(A)如下S(初始狀態(tài))一1(緊接在開始之后的狀態(tài))一(1(緊接在開始之后的狀 態(tài))竺0.6,2(系統(tǒng)混亂)竺0. 1,4(用戶混亂)竺0.3) — F(基礎(chǔ))。在用戶話語2和3中,用戶基礎(chǔ)(即,用戶和系統(tǒng)之間的理解)進(jìn)入混亂狀態(tài)。對于(B)打好基礎(chǔ)狀態(tài)變換,打好基礎(chǔ)233、實(shí)體231和語義232的“是”的置信度 水平在輸入第二個(gè)話語時(shí)暫時(shí)降低。此后,在輸入第三個(gè)話語時(shí),“是”的置信度水平降低。 因此,出現(xiàn)其中幾乎始終相信來自用戶的請求被理解的狀態(tài)。(3)系統(tǒng)不正確地理解來自用戶的請求的情況圖16示出系統(tǒng)不正確地理解來自用戶的請求的情況。在這種情況下,發(fā)生系統(tǒng)未 能清晰聽到用戶的第二個(gè)話語的輸入“我想要觀看體育節(jié)目”這一問題。系統(tǒng)詢問用戶“你 真要觀看動畫片嗎? ”,以確認(rèn)話語。此外,用戶未能聽到該問題并產(chǎn)生輸入話語“你說什 么?”。另外,響應(yīng)于該話語,系統(tǒng)詢問用戶“你想要觀看動畫片嗎?”。響應(yīng)于該問題,用戶 做出否定回答“否”。在這種情況下,基礎(chǔ)狀態(tài)變換㈧如下S (初始狀態(tài))一1(緊接在開始之后的狀態(tài))一(2 (系統(tǒng)混亂)主0.2,4 (用戶混 亂)蘭0.8) — (3 (需要確認(rèn))蘭0.2,D (取消)蘭0.8)。因此,未實(shí)現(xiàn)用戶基礎(chǔ)(即,用戶和系統(tǒng)之間的理解),并且到達(dá)取消狀態(tài)。對于(B)打好基礎(chǔ)狀態(tài)變換,在輸入第二個(gè)話語時(shí),打好基礎(chǔ)233、實(shí)體231和語義 232的“是”的置信度水平降低。此后,置信度水平恢復(fù),因此,不會出現(xiàn)與分析信息相關(guān)的 明顯問題。(4)用戶和系統(tǒng)之間的通信長的情況圖17示出用戶和系統(tǒng)之間的通信長的情況。通過從用戶輸入話語1至5來實(shí)現(xiàn)
■石出。在這種情況下,例如,㈧基礎(chǔ)狀態(tài)變換如下S (初始狀態(tài))一1 (緊接在開始之后的狀態(tài))一……一F(基礎(chǔ))。也就是說,通過根據(jù)用戶的話語的數(shù)量的多個(gè)狀態(tài),到達(dá)基礎(chǔ)狀態(tài)。最終,實(shí)現(xiàn)用 戶基礎(chǔ),即,用戶和系統(tǒng)之間的理解。對于⑶打好基礎(chǔ)狀態(tài)變換,在輸入第二個(gè)話語時(shí),打好基礎(chǔ)233、實(shí)體231和語義 232的“是”的置信度水平增大。因此,不會出現(xiàn)與分析信息相關(guān)的明顯問題。(5)信息處理設(shè)備的示例性硬件配置
接著參考圖18說明使用上述POMDP進(jìn)行基礎(chǔ)處理的信息處理設(shè)備的示例性硬件 配置。通過諸如具有用作程序執(zhí)行單元的CPU的廣泛使用的PC或電視機(jī)等的具有程序執(zhí) 行功能的各種信息處理設(shè)備實(shí)現(xiàn)信息處理設(shè)備450。注意,下面說明硬件配置的特定例子。信息處理設(shè)備450包括用戶接口 451、使用POMDP進(jìn)行基礎(chǔ)處理的會話管理器 452、任務(wù)管理器453、顯示器454、存儲單元455和數(shù)據(jù)庫456。用戶接口 451、會話管理器 452、任務(wù)管理器453和顯示器454具有圖4所示的配置。例如,當(dāng)通過用戶接口 451從用戶輸入話語時(shí),由會話管理器452進(jìn)行使用POMDP 的基礎(chǔ)處理。會話管理器452進(jìn)行圖4至8所示的使用POMDP的基礎(chǔ)處理。任務(wù)管理器 452管理在信息處理設(shè)備450中所進(jìn)行的任務(wù)。詳細(xì)的處理與圖4所示的處理相同。注意,數(shù)據(jù)庫456存儲應(yīng)用于POMDP的程序、應(yīng)用于POMDP的用于生成成本計(jì)算算 法并計(jì)算狀態(tài)變換概率的計(jì)算函數(shù)、回報(bào)的計(jì)算函數(shù)、用于計(jì)算發(fā)生特定觀察狀態(tài)的概率 的函數(shù)、以及用于問題規(guī)則的數(shù)據(jù)。存儲單元454由用作各種數(shù)據(jù)處理和程序的參數(shù)的存 儲區(qū)域以及工作區(qū)域的存儲器構(gòu)成。最后,參考圖19說明進(jìn)行上述處理的信息處理設(shè)備的硬件配置的例子。CPU (中央 處理單元)501用作上述實(shí)施例中所述的數(shù)據(jù)處理單元的主要部分,并且進(jìn)行與OS (操作系 統(tǒng))相對應(yīng)的處理。更具體地,CPTOOl進(jìn)行使用POMDP的基礎(chǔ)處理和任務(wù)管理處理。根據(jù) 存儲在諸如各信息處理設(shè)備的ROM和硬盤等的數(shù)據(jù)存儲單元中的計(jì)算機(jī)程序來進(jìn)行這些處理。R0M(只讀存儲器)502存儲CPU 501使用的程序、POMDP生成程序和計(jì)算參數(shù)。 RAM(隨機(jī)存儲器)503根據(jù)需要而存儲CPU 501所執(zhí)行的程序和在執(zhí)行程序中改變的參數(shù)。 使用由例如CPU總線構(gòu)成的主機(jī)總線將它們相互連接。主機(jī)總線504通過橋505與外部總線506 (例如,PCI (外圍組件互連/接口總線)連接。音頻輸入單元508接收用戶的話語。輸入單元509由被用戶操作的輸入裝置構(gòu)成。 顯示器510由液晶顯示器裝置或CRT (陰極射線管)構(gòu)成。HDD (硬盤驅(qū)動器)511包括硬盤。HDD 511驅(qū)動硬盤以記錄或再現(xiàn)要由CPU 501 執(zhí)行的程序和信息。硬盤用作用于存儲應(yīng)用于POMDP生成的規(guī)則的存儲部件。此外,硬盤 存儲諸如數(shù)據(jù)處理程序等的各種計(jì)算機(jī)程序。驅(qū)動器512讀取存儲在可拆卸記錄介質(zhì)521 (例如,安裝的磁盤、光盤、磁光盤或半 導(dǎo)體存儲器)中的數(shù)據(jù)或程序。此后,驅(qū)動器512將該數(shù)據(jù)或程序提供給經(jīng)由接口 507、外 部總線506、橋505和主機(jī)總線504而與驅(qū)動器512相連接的RAM 503。連接端口 514用作外部連接的設(shè)備522所連接至的端口。連接端口 514包括諸如 USB或IEEE 1394等的連接單元。通過接口 507、外部總線506、橋505和主機(jī)總線504將連 接端口 514與例如CPU 501相連接。通信單元515與網(wǎng)絡(luò)相連接。注意,使用PC形成圖19所示的信息處理設(shè)備的硬件配置的例子。然而,該配置不 局限于圖19所示的配置。例如,可以使用可以進(jìn)行上述實(shí)施例中所述的處理的各種設(shè)備。盡管參考本發(fā)明的特定實(shí)施例說明了本發(fā)明,但是,在本發(fā)明的范圍內(nèi),對于本技 術(shù)領(lǐng)域的技術(shù)人員來說,顯然可以進(jìn)行其它的替代、變型或改變。因此,上述公開不是旨在 限定性的,而是應(yīng)當(dāng)根據(jù)所附權(quán)利要求及其合法等同內(nèi)容來確定本發(fā)明的范圍。
另外,可以通過硬件、軟件或其組合配置來執(zhí)行上述的系列處理。當(dāng)通過軟件執(zhí)行 上述的系列處理時(shí),可以將記錄該處理序列的程序安裝在專用硬件中包含的計(jì)算機(jī)的存儲 器中,并且可以執(zhí)行該程序。替代性地,可以將該程序安裝在可執(zhí)行各種功能的通用計(jì)算機(jī) 中,并且可以執(zhí)行該程序。例如,可以將該程序預(yù)先記錄在記錄介質(zhì)中??梢詮挠涗浗橘|(zhì)將 該程序安裝在計(jì)算機(jī)中。另外,可以通過諸如LAN(局域網(wǎng))或因特網(wǎng)等的網(wǎng)絡(luò)接收該程序, 并且可以將該程序安裝在計(jì)算機(jī)所包含的諸如硬盤等的記錄介質(zhì)中。在本說明書中,按照上述順序進(jìn)行各種處理。然而,可以根據(jù)進(jìn)行該處理的設(shè)備的 處理能力或處理性能或者根據(jù)需要而并行地或獨(dú)立地執(zhí)行該處理。另外,如同在本說明書 中所使用的那樣,術(shù)語“系統(tǒng)”是指多個(gè)裝置的邏輯組合,該多個(gè)裝置不是必須包括在一個(gè) 主體中。工業(yè)適用性如上所述,根據(jù)本發(fā)明的實(shí)施例設(shè)計(jì)該配置,以使得為了通過來自用戶的話語而 理解來自用戶的請求,使用POMDP (部分可觀察馬爾可夫決策過程)進(jìn)行基礎(chǔ)處理,其中,將 從接收用戶的話語并進(jìn)行語言分析的語言分析單元獲取的分析信息和包括從進(jìn)行任務(wù)的 任務(wù)管理器獲取的任務(wù)可行性信息的實(shí)體信息設(shè)置為觀察信息。因此,可以有效地實(shí)現(xiàn)理 解,并且可以提供對用戶請求的高速準(zhǔn)確的識別以及基于用戶請求的任務(wù)執(zhí)行。
2權(quán)利要求
一種信息處理設(shè)備,所述信息處理設(shè)備用于接收來自用戶的話語并分析所述話語,其特征在于包括用戶接口,所述用戶接口接收來自用戶的話語并進(jìn)行語言分析;會話管理器,所述會話管理器接收與經(jīng)由所述用戶接口輸入的用戶話語相關(guān)的信息的識別結(jié)果,并通過使用部分可觀察馬爾可夫決策過程(POMDP)進(jìn)行用于理解用戶請求的基礎(chǔ)處理;以及任務(wù)管理器,所述任務(wù)管理器基于與由所述會話管理器進(jìn)行的所述基礎(chǔ)處理的結(jié)果相關(guān)的信息來執(zhí)行任務(wù)。
2.根據(jù)權(quán)利要求1所述的信息處理設(shè)備,其特征在于,還包括顯示器,所述顯示器在由所述會話管理器進(jìn)行的所述基礎(chǔ)處理期間為所述用戶顯示系 統(tǒng)動作。
3.根據(jù)權(quán)利要求1所述的信息處理設(shè)備,其特征在于,所述會話管理器具有配置以使 用部分可觀察馬爾可夫決策過程進(jìn)行基礎(chǔ)處理,其中,將根據(jù)來自所述用戶的話語而生成 的語義信息以及基于包括由所述任務(wù)管理器進(jìn)行的任務(wù)的可行性的信息而生成的實(shí)體信 息設(shè)置為觀察空間。
4.根據(jù)權(quán)利要求3所述的信息處理設(shè)備,其特征在于,所述會話管理器具有配置以使 用部分可觀察馬爾可夫決策過程進(jìn)行基礎(chǔ)處理,其中,將使用用作所述觀察空間的所述語 義信息而計(jì)算出的狀態(tài)值以及使用用作所述觀察空間的所述實(shí)體信息而計(jì)算出的狀態(tài)值 設(shè)置為狀態(tài)空間。
5.根據(jù)權(quán)利要求3所述的信息處理設(shè)備,其特征在于,所述會話管理器具有配置以使 用部分可觀察馬爾可夫決策過程進(jìn)行基礎(chǔ)處理,其中,將使用用作所述觀察空間的所述語 義信息而計(jì)算出的狀態(tài)值、使用用作所述觀察空間的所述實(shí)體信息而計(jì)算出的狀態(tài)值、以 及使用其它觀察空間而計(jì)算出的狀態(tài)值設(shè)置為狀態(tài)空間。
6.根據(jù)權(quán)利要求3所述的信息處理設(shè)備,其特征在于,所述會話管理器具有配置以使 用部分可觀察馬爾可夫決策過程進(jìn)行基礎(chǔ)處理,其中,所述部分可觀察馬爾可夫決策過程 具有以下配置其中基于包括使用用作所述觀察空間的所述語義信息而計(jì)算出的狀態(tài)值和 使用用作所述觀察空間的所述實(shí)體信息而計(jì)算出的狀態(tài)值的狀態(tài)空間來計(jì)算成本。
7.根據(jù)權(quán)利要求1所述的信息處理設(shè)備,其特征在于,所述會話管理器具有配置以使 用部分可觀察馬爾可夫決策過程進(jìn)行基礎(chǔ)處理,其中,將包括來自所述用戶的話語的用戶 動作設(shè)置為觀察空間。
8.根據(jù)權(quán)利要求7所述的信息處理設(shè)備,其特征在于,所述會話管理器具有配置以使 用部分可觀察馬爾可夫決策過程進(jìn)行基礎(chǔ)處理,其中,將使用用作觀察空間的所述用戶動 作而計(jì)算出的狀態(tài)值設(shè)置為狀態(tài)空間。
9.一種用于在信息處理設(shè)備中使用的信息處理方法,其中所述信息處理設(shè)備用于接收 來自用戶的話語并分析所述話語,所述信息處理方法的特征在于包括語言輸入和分析步驟,所述語言輸入和分析步驟通過使用用戶接口來接收來自用戶的 話語并進(jìn)行語言分析;會話管理步驟,所述會話管理步驟通過使用會話管理器,接收與經(jīng)由所述用戶接口輸 入的用戶話語相關(guān)的信息的識別結(jié)果,并使用部分可觀察馬爾可夫決策過程(POMDP)進(jìn)行用于理解用戶請求的基礎(chǔ)處理;以及任務(wù)管理步驟,所述任務(wù)管理步驟通過使用任務(wù)管理器來基于與在所述會話管理步驟 中進(jìn)行的所述基礎(chǔ)處理的結(jié)果相關(guān)的信息而執(zhí)行任務(wù)。
10.根據(jù)權(quán)利要求9所述的信息處理方法,其特征在于,還包括通過使用顯示器在所述會話管理步驟中進(jìn)行的基礎(chǔ)處理期間為所述用戶顯示系統(tǒng)動 作的步驟。
11.根據(jù)權(quán)利要求9所述的信息處理方法,其特征在于,所述會話管理步驟是使用部分 可觀察馬爾可夫決策過程進(jìn)行基礎(chǔ)處理的步驟,其中,將響應(yīng)于來自所述用戶的話語而生 成的語義信息和基于包括由所述任務(wù)管理器進(jìn)行的任務(wù)的可行性的信息而生成的實(shí)體信 息設(shè)置為觀察空間。
12.根據(jù)權(quán)利要求11所述的信息處理方法,其特征在于,所述會話管理步驟是使用部 分可觀察馬爾可夫決策過程進(jìn)行基礎(chǔ)處理的步驟,其中,將使用用作所述觀察空間的所述 語義信息而計(jì)算出的狀態(tài)值和使用用作所述觀察空間的所述實(shí)體信息而計(jì)算出的狀態(tài)值 設(shè)置為狀態(tài)空間。
13.根據(jù)權(quán)利要求11所述的信息處理方法,其特征在于,所述會話管理步驟是使用部 分可觀察馬爾可夫決策過程進(jìn)行基礎(chǔ)處理的步驟,其中,將使用用作所述觀察空間的所述 語義信息而計(jì)算出的狀態(tài)值、使用用作所述觀察空間的所述實(shí)體信息而計(jì)算出的狀態(tài)值、 以及使用其它觀察空間而計(jì)算出的狀態(tài)值設(shè)置為狀態(tài)空間。
14.根據(jù)權(quán)利要求11所述的信息處理方法,其特征在于,所述會話管理步驟是使用部 分可觀察馬爾可夫決策過程進(jìn)行基礎(chǔ)處理的步驟,其中,部分可觀察馬爾可夫決策過程具 有以下配置其中基于包括使用用作所述觀察空間的所述語義信息而計(jì)算出的狀態(tài)值和使 用用作所述觀察空間的所述實(shí)體信息計(jì)算出的狀態(tài)值的狀態(tài)空間來計(jì)算成本。
15.根據(jù)權(quán)利要求9所述的信息處理方法,其特征在于,所述會話管理步驟是使用部分 可觀察馬爾可夫決策過程進(jìn)行基礎(chǔ)處理的步驟,其中,將包括來自所述用戶的話語的用戶 動作設(shè)置為觀察空間。
16.根據(jù)權(quán)利要求15所述的信息處理方法,其特征在于,所述會話管理步驟是使用部 分可觀察馬爾可夫決策過程進(jìn)行基礎(chǔ)處理的步驟,其中,將使用用作觀察空間的所述用戶 動作計(jì)算出的狀態(tài)值設(shè)置為狀態(tài)空間。
17.根據(jù)權(quán)利要求15所述的信息處理方法,其特征在于,所述會話管理步驟是使用部 分可觀察馬爾可夫決策過程進(jìn)行基礎(chǔ)處理的步驟,其中,部分可觀察馬爾可夫決策過程具 有以下配置其中基于包括使用用作所述觀察空間的所述用戶動作計(jì)算出的狀態(tài)值的狀態(tài) 空間來計(jì)算成本。
18.根據(jù)權(quán)利要求9所述的信息處理方法,其特征在于,所述會話管理步驟是使用基礎(chǔ) 模型進(jìn)行處理的步驟,其中,將開始處理、繼續(xù)處理、確認(rèn)處理、確認(rèn)請求處理、確認(rèn)應(yīng)答處 理、確認(rèn)應(yīng)答請求處理和取消處理定義為所述基礎(chǔ)處理的執(zhí)行動作。
19.根據(jù)權(quán)利要求9所述的信息處理方法,其特征在于,所述會話管理步驟是使用基礎(chǔ) 模型進(jìn)行處理的步驟,其中,將開始處理、確認(rèn)應(yīng)答處理和取消處理定義為所述基礎(chǔ)處理的 執(zhí)行動作。
20.一種計(jì)算機(jī)程序,所述計(jì)算機(jī)程序使信息處理設(shè)備進(jìn)行用于接收來自用戶的話語并分析所述話語的信息處理,其特征在于包括語言輸入和分析步驟,所述語言輸入和分析步驟通過使用用戶接口接收來自用戶的話 語并進(jìn)行語言分析;會話管理步驟,所述會話管理步驟通過使用會話管理器,接收與通過所述用戶接口輸 入的用戶話語相關(guān)的信息的識別結(jié)果,并使用部分可觀察馬爾可夫決策過程(POMDP)進(jìn)行 用于理解用戶請求的基礎(chǔ)處理;以及任務(wù)管理步驟,所述任務(wù)管理步驟通過使用任務(wù)管理器來基于與在所述會 話管理步驟 中進(jìn)行的所述基礎(chǔ)處理的結(jié)果相關(guān)的信息而執(zhí)行任務(wù)。
全文摘要
本發(fā)明公開了信息處理設(shè)備、信息處理方法和計(jì)算機(jī)程序。提供了一種用于使用POMDP進(jìn)行基礎(chǔ)處理的設(shè)備和方法。設(shè)計(jì)配置以使得為了通過來自用戶的話語理解來自用戶的請求而使用POMDP(部分可觀察馬爾可夫決策過程)進(jìn)行基礎(chǔ)處理,其中,將從接收用戶的話語并進(jìn)行語言分析的語言分析單元獲取的分析信息以及包括從進(jìn)行任務(wù)的任務(wù)管理器獲取的任務(wù)可行性信息的實(shí)體信息設(shè)置為觀察信息。因此,可以有效地實(shí)現(xiàn)理解,并且可以提供對用戶請求的高速準(zhǔn)確的識別以及基于用戶請求的任務(wù)執(zhí)行。
文檔編號G10L15/22GK101884064SQ200880118510
公開日2010年11月10日 申請日期2008年12月4日 優(yōu)先權(quán)日2007年12月7日
發(fā)明者迪·普羅菲奧·烏戈 申請人:索尼公司