專利名稱:一種預(yù)測(cè)行為規(guī)劃的期望效用的方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計(jì)算機(jī)科學(xué)技術(shù)領(lǐng)域,可基于規(guī)劃知識(shí)自動(dòng)進(jìn)行概率推理,井根據(jù)個(gè)體或組織的行為或狀態(tài)觀察給出對(duì)其最可能采取的行為及行為意圖的分析結(jié)果,以預(yù)測(cè)行為規(guī)劃的期望效用。
背景技術(shù):
行為分析方法在國(guó)家與社會(huì)公共安全、商業(yè)管理、決策評(píng)估等領(lǐng)域都具有十分重要的應(yīng)用。以往的行為分析方法主要基于Markov或Bayesian模型,這些模型方法存在計(jì)算空間和條件概率表的賦值等ー些固有的弱點(diǎn),使得其應(yīng)用受到較大的局限。而且,基于Markov和Bayesian方法只能提供行為分析結(jié)果,在行為的深層分析和結(jié)果的解釋方面都存在較大欠缺。相對(duì)于這些傳統(tǒng)的行為分析方法,基于規(guī)劃知識(shí)的行為分析方法由于米用了明晰的行為知識(shí)表示,且不但可以提供行為分析結(jié)果,還可以分析個(gè)體或組織采取行 為的意圖和目標(biāo),因此在行為分析結(jié)果的可解釋性和豐富程度上較以往方法具有明顯的優(yōu)勢(shì)。近年來(lái),基于規(guī)劃知識(shí)的行為意圖分析方法以概率方法為代表。Charniak和Goldman (Artificial Intelligence, 1993)采用貝葉斯推理方法建立了第一個(gè)基于規(guī)劃知識(shí)、用于意圖分析的概率模型。Panadath和WeIIman(UAI,2000)提出一種基于PSDGs文法的概率意圖分析方法。Avrahami-Zilberbrand和Kaminka(AAAI, 2007)提出一種結(jié)合符號(hào)規(guī)劃識(shí)別和觀察者自身偏見的混合意圖分析方法。Geib和Goldman (ArtificialIntelligenCe,2009)提出一種基于規(guī)劃執(zhí)行模型的概率意圖分析算法。盡管所采用的具體方法各不相同,目前提出的行為意圖分析方法存在著以下不足I、以往行為意圖分析方法中均未考慮規(guī)劃表示的行為知識(shí)間固有的因果聯(lián)系,特別是行為與行為前提、行為與行為結(jié)果以及行為與行為間的內(nèi)在關(guān)聯(lián),因而所提出的方法中均未結(jié)合這些類行為知識(shí)進(jìn)行因果推理;2、行為意圖分析的過(guò)程可以看作是識(shí)別被觀察者(個(gè)體或組織)的行為決策策略,即通過(guò)模擬被觀察者的行為決策策略達(dá)到分析識(shí)別行為意圖的目的,而以往方法中均未考慮結(jié)合行為決策理論進(jìn)行意圖分析與識(shí)別。
發(fā)明內(nèi)容
(一 )要解決的技術(shù)問(wèn)題本發(fā)明要解決的技術(shù)問(wèn)題是給定當(dāng)前行為或狀態(tài)觀察,基于個(gè)體或組織行為的規(guī)劃知識(shí)描述,分析識(shí)別被觀察者(個(gè)體或組織)最可能采取的行為及其行為意圖。( ニ )技術(shù)方案為解決上述技術(shù)問(wèn)題,本發(fā)明提出一種預(yù)測(cè)行為規(guī)劃的期望效用的方法,所述行為規(guī)劃是指為達(dá)到ー個(gè)目標(biāo)的行為的集合,該方法根據(jù)所觀察到的證據(jù)獲得行為規(guī)劃的期望效用值,所述方法包括步驟Si、根據(jù)證據(jù)計(jì)算狀態(tài)出現(xiàn)的概率,所述證據(jù)指的是對(duì)行為和狀態(tài)的觀察結(jié)果,所述狀態(tài)指的是行為的前提和結(jié)果的出現(xiàn)情況;步驟S2、根據(jù)狀態(tài)出現(xiàn)的概率計(jì)算行為發(fā)生的概率;步驟S3、根據(jù)行為出現(xiàn)的概率計(jì)算行為結(jié)果出現(xiàn)的概率和行為的期望效用值;步驟S4、根據(jù)行為結(jié)果出現(xiàn)的概率和行為的期望效用值計(jì)算行為規(guī)劃結(jié)果出現(xiàn)的概率和行為規(guī)劃的期望效用值。根據(jù)本發(fā)明的ー種具體實(shí)施方式
,在所述步驟SI中,當(dāng)證據(jù)E給定,如果觀察到狀態(tài)X,則狀態(tài)X出現(xiàn)的概率P(x|E)為I ;如果觀察到正在執(zhí)行或已經(jīng)執(zhí)行行為A,則行為A的姆個(gè)行為前提的狀態(tài)出現(xiàn)的概率為I ;如果觀察到正在執(zhí)行行為A,則行為A的行為結(jié)果e出現(xiàn)的概率為其執(zhí)行概率Pexecution (A | precondition (A))與該行為的行為結(jié)果出現(xiàn)的概率Peffeet (e IA)的乘積,precondition (A)表示行為A的前提狀態(tài);如果行為A已經(jīng)執(zhí)行完畢,則行為A的行為結(jié)果e出現(xiàn)的概率為Prffert (e IA)。 根據(jù)本發(fā)明的ー種具體實(shí)施方式
,在步驟S2中,當(dāng)證據(jù)E給定,如果觀察到已經(jīng)執(zhí)行行為A,則行為A發(fā)生的概率P (A|E)為I ;如果觀察到正在執(zhí)行A,則行為A發(fā)生 的概率P (AIE)等于行為 A 的執(zhí)行概率 Pexeeutim (A| precondition (A)), precondition (A)表示行為A的前提狀態(tài);如果沒(méi)有觀察到行為A被執(zhí)行,則行為A出現(xiàn)的概率等于行為A的執(zhí)行概率與它的每個(gè)行為前提(狀態(tài))出現(xiàn)的概率的乘積。根據(jù)本發(fā)明的ー種具體實(shí)施方式
,在步驟S3中,行為結(jié)果出現(xiàn)的概率等于行為發(fā)生的概率與當(dāng)行為發(fā)生時(shí)的行為結(jié)果出現(xiàn)的概率的乘積;行為的期望效用值等于由該行為的每個(gè)行為結(jié)果出現(xiàn)的概率及其效用值的乘積的加權(quán)。根據(jù)本發(fā)明的ー種具體實(shí)施方式
,在步驟S4中,每個(gè)行為規(guī)劃結(jié)果出現(xiàn)的概率等于該行為規(guī)劃中每個(gè)導(dǎo)致行為規(guī)劃結(jié)果的行為發(fā)生的概率和當(dāng)該行為發(fā)生時(shí)的的規(guī)劃的發(fā)生概率的累乘乘積。根據(jù)本發(fā)明的ー種具體實(shí)施方式
,在步驟S4中,行為規(guī)劃的期望效用值由行為規(guī)劃中每個(gè)行為規(guī)劃結(jié)果出現(xiàn)的概率及其效用值的乘積的加權(quán)計(jì)算得到。(三)有益效果本發(fā)明相比于傳統(tǒng)的行為意圖分析識(shí)別方法,主要具有以下幾方面優(yōu)點(diǎn)(I)本發(fā)明明確采用狀態(tài)信息,特別是被觀察者對(duì)狀態(tài)的偏好信息進(jìn)行行為意圖分析;(2)本發(fā)明基于決策理論,分析識(shí)別行為意圖所依據(jù)的原則與人的決策策略相符;(3)本發(fā)明利用關(guān)于行為的因果知識(shí)參與推理計(jì)算過(guò)程;(4)本發(fā)明對(duì)狀態(tài)和行為觀察以及增量行為意圖分析均采用一致的解決方法。
圖I是本發(fā)明的預(yù)測(cè)行為規(guī)劃的期望效用方法的原理示意圖;圖2是說(shuō)明本發(fā)明的預(yù)測(cè)行為規(guī)劃的期望效用方法具體實(shí)施所用的規(guī)劃知識(shí)庫(kù)中兩個(gè)規(guī)劃的示例圖。
具體實(shí)施例方式基于上述背景技術(shù)和其存在的問(wèn)題,本發(fā)明結(jié)合行為因果推理和決策理論中的“期望效用最大化”原則,提出一種新的基于概率規(guī)劃推理的預(yù)測(cè)行為規(guī)劃的期望效用方法。圖I是本發(fā)明的行為意圖分析方法的原理示意圖。如圖I所示,對(duì)行為意圖的分析識(shí)別基于決策理論中的“期望效用最大化”原則,即同時(shí)考慮行為目標(biāo)的合意性和目標(biāo)實(shí)現(xiàn)的可能性。因此,我們?cè)谟?jì)算行為規(guī)劃PL的期望效益值EU (PL)時(shí)考慮兩方面重要因素即規(guī)劃結(jié)果的效用值Utility (表示該結(jié)果對(duì)被觀察者的合意性)和規(guī)劃結(jié)果出現(xiàn)的概率Prob (表示被觀察者實(shí)現(xiàn)該結(jié)果的可能性)。推斷規(guī)劃結(jié)果出現(xiàn)的概率時(shí),綜合考慮三類導(dǎo)致不確定性的因素行為前提的不確定性(即狀態(tài)的出現(xiàn)概率P(state),state表示狀態(tài))、行為執(zhí)行的不確定性(即執(zhí)行概率Pex_tim(A|preC0nditi0n㈧),表示當(dāng)行為A的所有前提成立時(shí),該行為成功執(zhí)行的概率,precondition (A)表示行為A的所有前提)、行為結(jié)果的不確定性(即結(jié)果概率PeffM (e IA),表示當(dāng)行為A成功執(zhí)行吋,該行為結(jié)果e出現(xiàn)的概率)。本發(fā)明的基于概率規(guī)劃推理的行為意圖分析方法可用于預(yù)測(cè)行為規(guī)劃的期望效 用。即依據(jù)所觀察到的行為或狀態(tài)證據(jù),利用行為與狀態(tài)(包括行為前提和結(jié)果)及行為之間的因果關(guān)聯(lián)進(jìn)行推理計(jì)算,得到行為規(guī)劃的期望效用值,進(jìn)而結(jié)合決策原則判斷被觀察者最可能采取的行為及其意圖。以下我們逐一說(shuō)明基于概率規(guī)劃推理的行為意圖分析過(guò)程。狀態(tài)出現(xiàn)概率的推理計(jì)算相對(duì)于行為本身,行為的前提和結(jié)果的出現(xiàn)情況屬于狀態(tài)。設(shè)關(guān)于行為和狀態(tài)證據(jù)為E,所謂證據(jù)指的是對(duì)行為和狀態(tài)的觀察結(jié)果。給定證據(jù)E,如果觀察到狀態(tài)X,則狀態(tài)χ出現(xiàn)的概率P(x|E)為I。所觀察到的行為會(huì)改變與其關(guān)聯(lián)的狀態(tài)出現(xiàn)的概率。如果觀察到正在執(zhí)行或已經(jīng)執(zhí)行行為A,則行為A的每個(gè)行為前提狀態(tài)出現(xiàn)的概率為I。如果觀察到正在執(zhí)行行為A,則行為A的行為結(jié)果e出現(xiàn)的概率為其執(zhí)行概率Pexecuti0n(aI Precondition (A))與其結(jié)果概率 Peffeet (e | A)的乘積,precondition (A)表示行為A的前提狀態(tài);行為結(jié)果e可以不止ー個(gè)。如果行為A已經(jīng)執(zhí)行完畢,則行為A的行為結(jié)果e出現(xiàn)的概率為PeffM (e IA)。如果沒(méi)有觀察到狀態(tài)X,則狀態(tài)χ出現(xiàn)的概率等于狀態(tài)χ的先驗(yàn)概率P(x)。行為發(fā)生的概率的推理計(jì)算行為發(fā)生的概率是指行為被成功執(zhí)行的概率。設(shè)觀察到的行為和狀態(tài)證據(jù)為E。給定證據(jù)E,如果觀察到已經(jīng)執(zhí)行行為A,則行為A發(fā)生的概率P (AIE)為I ;如果觀察到正在執(zhí)行A,則行為A發(fā)生的概率P (AIE)等于行為A的執(zhí)行概率Pexeeutim(A | precondition (A)),precondition⑷表示行為A的前提狀態(tài)。如果沒(méi)有觀察到行為A被執(zhí)行,則行為A出現(xiàn)的概率等于行為A的執(zhí)行概率與它的每個(gè)行為前提(狀態(tài))出現(xiàn)的概率的乘積,即P(A I E) = P, xecvtion (A \ precondition{A)) χ Π廣剛c
ee precondition (A)行為結(jié)果出現(xiàn)的概率與行為的期望效用值計(jì)算行為發(fā)生的概率變化會(huì)影響該行為結(jié)果出現(xiàn)的概率,即行為結(jié)果出現(xiàn)的概率等于行為發(fā)生的概率與當(dāng)行為發(fā)生時(shí)的行為結(jié)果出現(xiàn)的概率的乘積P (e IE) = P (A | E) X Peffect (e | A)。
行為A的行為結(jié)果集由行為A的效用值非零那些行為結(jié)果構(gòu)成。行為結(jié)果出現(xiàn)的概率會(huì)影響行為的期望效益值。令Oa為行為A的行為結(jié)果集合,且每個(gè)行為結(jié)果Oi e 0A, i為自然數(shù),則行為A的期望效用值EU (AIE)由行為A的每個(gè)行為結(jié)果Oi出現(xiàn)的概率P (ο, | E)及其效用值Utility (Oi)的乘積的加權(quán)計(jì)算得到
權(quán)利要求
1.一種預(yù)測(cè)行為規(guī)劃的期望效用的方法,所述行為規(guī)劃是指為達(dá)到一個(gè)目標(biāo)的行為的集合,該方法根據(jù)所觀察到的證據(jù)獲得行為規(guī)劃的期望效用值,其特征在于,所述方法包括 步驟Si、根據(jù)證據(jù)計(jì)算狀態(tài)出現(xiàn)的概率,所述證據(jù)指的是對(duì)行為和狀態(tài)的觀察結(jié)果,所述狀態(tài)指的是行為的前提和結(jié)果的出現(xiàn)情況; 步驟S2、根據(jù)狀態(tài)出現(xiàn)的概率計(jì)算行為發(fā)生的概率; 步驟S3、根據(jù)行為出現(xiàn)的概率計(jì)算行為結(jié)果出現(xiàn)的概率和行為的期望效用值; 步驟S4、根據(jù)行為結(jié)果出現(xiàn)的概率和行為的期望效用值計(jì)算行為規(guī)劃結(jié)果出現(xiàn)的概率和行為規(guī)劃的期望效用值。
2.如權(quán)利要求I所述的預(yù)測(cè)行為規(guī)劃的期望效用的方法,其特征在于,在所述步驟SI中,當(dāng)證據(jù)E給定, 如果觀察到狀態(tài)X,則狀態(tài)χ出現(xiàn)的概率P (χ IE)為I ; 如果觀察到正在執(zhí)行或已經(jīng)執(zhí)行行為A,則行為A的每個(gè)行為前提的狀態(tài)出現(xiàn)的概率為I ; 如果觀察到正在執(zhí)行行為A,則行為A的行為結(jié)果e出現(xiàn)的概率為其執(zhí)行概率Pexecution (AI precondition (A))與該行為的行為結(jié)果出現(xiàn)的概率Peffect (e IA)的乘積,precondition (A)表示行為A的前提狀態(tài); 如果行為A已經(jīng)執(zhí)行完畢,則行為A的行為結(jié)果e出現(xiàn)的概率為PrffK;t (e IA)。
3.如權(quán)利要求2所述的預(yù)測(cè)行為規(guī)劃的期望效用的方法,其特征在于,在步驟S2中,當(dāng)證據(jù)E給定, 如果觀察到已經(jīng)執(zhí)行行為A,則行為A發(fā)生的概率P (A|E)為I ; 如果觀察到正在執(zhí)行A,則行為A發(fā)生的概率P(A|E)等于行為A的執(zhí)行概率PexecUtim(aI Precondition (A)),precondition (A)表示行為 A 的前提狀態(tài); 如果沒(méi)有觀察到行為A被執(zhí)行,則行為A出現(xiàn)的概率等于行為A的執(zhí)行概率與它的每個(gè)行為前提(狀態(tài))出現(xiàn)的概率的乘積。
4.如權(quán)利要求3所述的預(yù)測(cè)行為規(guī)劃的期望效用的方法,其特征在于,在步驟S3中, 行為結(jié)果出現(xiàn)的概率等于行為發(fā)生的概率與當(dāng)行為發(fā)生時(shí)的行為結(jié)果出現(xiàn)的概率的乘積; 行為的期望效用值等于由該行為的每個(gè)行為結(jié)果出現(xiàn)的概率及其效用值的乘積的加權(quán)。
5.如權(quán)利要求4所述的預(yù)測(cè)行為規(guī)劃的期望效用的方法,其特征在于,在步驟S4中, 每個(gè)行為規(guī)劃結(jié)果出現(xiàn)的概率等于該行為規(guī)劃中每個(gè)導(dǎo)致行為規(guī)劃結(jié)果的行為發(fā)生的概率和當(dāng)該行為發(fā)生時(shí)的規(guī)劃的發(fā)生概率的累乘乘積。
6.如權(quán)利要求5所述的預(yù)測(cè)行為規(guī)劃的期望效用的方法,其特征在于,在步驟S4中, 行為規(guī)劃的期望效用值由行為規(guī)劃中每個(gè)行為規(guī)劃結(jié)果出現(xiàn)的概率及其效用值的乘積的加權(quán)計(jì)算得到。
全文摘要
本發(fā)明公開了一種預(yù)測(cè)行為規(guī)劃的期望效用的方法,所述規(guī)劃是指為達(dá)到一個(gè)目標(biāo)的行為的集合,該方法根據(jù)所觀察到的證據(jù)獲得行為規(guī)劃的期望效用值,所述方法包括步驟S1.根據(jù)證據(jù)計(jì)算狀態(tài)出現(xiàn)的概率,所述證據(jù)指的是對(duì)行為和狀態(tài)的觀察結(jié)果,所述狀態(tài)指的是行為的前提和結(jié)果的出現(xiàn)情況;步驟S2.根據(jù)狀態(tài)出現(xiàn)的概率計(jì)算行為發(fā)生的概率;步驟S3.根據(jù)行為出現(xiàn)的概率計(jì)算行為結(jié)果出現(xiàn)的概率和行為的期望效用值;步驟S4.根據(jù)行為結(jié)果出現(xiàn)的概率和行為的期望效用值計(jì)算行為規(guī)劃結(jié)果本。出現(xiàn)的概率和行為規(guī)劃的期望效用值。本發(fā)明能夠用于分析行為意圖。
文檔編號(hào)G06Q10/04GK102867224SQ20121032264
公開日2013年1月9日 申請(qǐng)日期2012年9月3日 優(yōu)先權(quán)日2012年9月3日
發(fā)明者毛文吉, 王飛躍, 曾大軍, 李曉晨 申請(qǐng)人:中國(guó)科學(xué)院自動(dòng)化研究所