一種影響圖的期望效用的并行計算方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于人工智能,涉及影響圖的期望效用的一種并行計算方法。
【背景技術(shù)】
[0002] 影響圖是不確定決策表示和分析的重要工具,已經(jīng)廣泛應(yīng)用到不確定性決 策分析領(lǐng)域。影響圖是聯(lián)合效用函數(shù)的一種直觀、緊湊的表示形式,形式化地表示為
。簡單地說,一個影響圖是由隨機(jī)結(jié)點(diǎn)集 G決策結(jié)點(diǎn)集m效用結(jié)點(diǎn)集合幽成的有向無環(huán)圖仏蘆川pa〇4)) I Je 6}是一組 每個隨機(jī)結(jié)點(diǎn)J在父節(jié)點(diǎn)pa(冶條件下的條件概率,爐{y(pa(0) I G.e 是一組與每個效 用結(jié)點(diǎn)^在父節(jié)點(diǎn)pa( 0條件下的效用函數(shù)。按照最大期望效用的原則,基于影響圖的 決策就是計算最大期望效用_|__|||喊賴顯和最優(yōu)策略,其中策略空間Λ是所 有可能策略S=P1, δ 2,···,δ J的集合,δ ^是每一個決策節(jié)點(diǎn)仏在其父節(jié)點(diǎn)pa(j,)條 件下的一個決策行為。計算最大期望效用的核心就是計算所有策略的期望效用。傳統(tǒng)的 求解方法通過規(guī)范、非遺忘以及單效用結(jié)點(diǎn)限制影響圖的結(jié)構(gòu)進(jìn)而限制策略空間,僅考慮 局部最優(yōu)決策組合,并且迭代地計算期望效用。運(yùn)行在Hadoop分布式文件系統(tǒng)HDFS可以 為基于MapReduce并行計算影響圖的期望效用提供基礎(chǔ)。針對影響圖中的每個隨機(jī)節(jié)點(diǎn) 為,以〈key,value〉的形式作為一行存儲到HDFS的F id中,key為a, pa (?),value為/7(? Ipa(W),對于(?中的效用節(jié)點(diǎn)K以〈key,value〉的形式作為一行存儲到Hbase的表Fid 中,key為pa⑶,value為動_::__纖說:。
【發(fā)明內(nèi)容】
[0003] 針對影響圖決策的核心問題,本發(fā)明提出一種基于分布式文件系統(tǒng)HDFS和 MapReduce并行地計算影響圖期望效用的方法,為大規(guī)模影響圖的求解以及非規(guī)范影響圖 求解全局最優(yōu)策略提供一種有效的方法,為影響圖的決策和應(yīng)用提供一種新的技術(shù)基礎(chǔ)。
[0004] 本發(fā)明基于分布式文件系統(tǒng)HDFS和MapReduce,提出一種并行地計算影響圖的最 大期望效用的方法,該方法包括以下步驟: 步驟1 :并行地計算影響圖的聯(lián)合效用函數(shù); 步驟2 :對影響圖的所有策略,并行地計算它們的期望效用; 步驟1中,通過以下步驟完成影響圖的聯(lián)合效用函數(shù)的并行計算: 步驟I. 1 :將影響圖的隨機(jī)節(jié)點(diǎn)和決策節(jié)點(diǎn)的所有可能的組合以Ft存儲到分布式文件 系統(tǒng)HDFS中,每個組合為-行; 步驟1. 2 :使用Map函數(shù)并行查詢Fid每一行,并與?1進(jìn)行比較,結(jié)果以〈key,value〉的 形式作為一行存儲到HDFS的Ft; 步驟1. 3 :使用Reduce函數(shù)對文件Ft中相同key的value相乘,得到聯(lián)合效用 步驟2中,通過以下步驟完成期望效用的并行計算: 步驟2. 1 :將所有的策略以Fstrategy存儲到HDFS中,每個策略為一行; 步驟2. 2 :對步驟1. 3結(jié)果使用Map函數(shù)并行查詢每一行,并與Fstrategy進(jìn)行比較,結(jié)果 以〈key,value〉的形式作為一行存儲到Fstrategy中; 步驟2. 3 :使用Reduce函數(shù)對Fstrategy中相同key的value相加,得到每一個策略的期 望效用。
【附圖說明】
[0005] 圖1"石油投機(jī)分子問題"景多響圖,節(jié)點(diǎn)S表示探測結(jié)果S1=Cliffuse, s2=open,s3=close, 〇某個地點(diǎn)地下石油蘊(yùn)藏情況O1=Clry, O2= wet, O3= soaking,T是探測行為且tl=yes, t2 =no, D是開采行為且dl=yes, d2=no。
【具體實(shí)施方式】
[0006] 以下結(jié)合附圖"石油投機(jī)分子問題"影響圖,對依據(jù)本發(fā)明提供的【具體實(shí)施方式】, 詳細(xì)說明如下。
[0007] 表1存儲"石油投機(jī)分子問題"影響圖的Fid CN 105138677 A m ~P 3/6 頁
步驟I.針對影響圖"石油投機(jī)分子問題"的分布式存儲Fid,并行地計算影響圖的聯(lián)合 效用函數(shù); 將影響圖的隨機(jī)節(jié)點(diǎn)和決策節(jié)點(diǎn)的所有可能的組合以FT#儲到分布式文件系統(tǒng)HDFS 中,每個組合為-行; 取出Icey=O1,可知Ft中包含o i的行有o (^如山,......,等12行,將它們分別 作為key,將Fid中當(dāng)前行的值0· 5,作為value,以〈key, value〉的形式將〈〇 W1Sit1, 0· 5>, 〈〇1dlSlt2,0.5>,···..,12行存儲下來,以同樣的方法,對于表1中其它行,將相應(yīng)的 〈key, value〉存儲到 Ft中, 使用Reduce函數(shù)對文件Ft中相同key的value相乘,從而得到聯(lián)合效用函數(shù): EU =-24, EU (0^^^2) =-35/3,...... 步驟2.針對影響圖"石油投機(jī)分子問題",并行地計算影響圖的期望效用函數(shù); 將所有的策略以Fstrategy存儲到HDFS中,每個策略為一行; 使用Map函數(shù)并行查詢步驟1結(jié)果的每一行,并與Fstratagy進(jìn)行比較,對結(jié)果的第一行 OidAt!,將(I1Sit1作為key,將F τ中當(dāng)前行的值-24,作為value,以〈key, value〉的開多式將 〈(^山,_24>,以同樣的方法,對于表1中其它行,將相應(yīng)的〈key, value〉存儲到Fsttategy中, 使用Reduce函數(shù)對文件Fsttategy中相同key的value相加,從而得到每一個策 略的期望效用,ElKdAtphSO/% ElKc^Sj^hS, EU (d1s3t1) =18. 6, EU (d1s3t2) =20/3, EU ((I2Sit1) =-4. I, EU ((I2Sit2) =0, EU (d2s2t1) =-3. 5, EU (d2s2t2) =0, EU (d2s3t1) =-2. 4, EU (d2s3t2) =0, 表2存儲所有可能組合的文件Ft CN 105138677 A ^ b/6 貝
表3存儲所有策略的文件Fstrategy
【主權(quán)項(xiàng)】
1. 一種影響圖的期望效用的并行計算方法,在將影響圖的結(jié)構(gòu)和定量信息以Fid存儲 到分布式文件系統(tǒng)HDFS的基礎(chǔ)上,該方法的特征在于包括以下步驟: 步驟1 :并行地計算影響圖的聯(lián)合效用函數(shù); 步驟2 :對影響圖的所有策略,并行地計算它們的期望效用。2. 根據(jù)權(quán)利要求1所述的影響圖的最大期望效用的并行計算方法,其特征在于步驟1 中通過如下的步驟完成并行地計算影響圖的聯(lián)合效用函數(shù); 步驟I. 1 :將影響圖的隨機(jī)節(jié)點(diǎn)和決策節(jié)點(diǎn)的所有可能的組合以Ft存儲到分布式文件 系統(tǒng)HDFS中,每個組合為-行; 步驟1. 2 :使用Map函數(shù)并行查詢Fid每一行,并與?7進(jìn)行比較,結(jié)果以〈key,value〉的 形式作為-行存儲到分布式文件系統(tǒng)HDFS ; 步驟1. 3 :使用Reduce函數(shù)對文件Ft中相同key的value相乘,得到聯(lián)合效用函數(shù)。3. 根據(jù)權(quán)利要求1所述的影響圖的期望效用的并行計算方法,其特征在于步驟2中通 過如下的步驟完成并行地計算影響圖的所有策略的期望效用; 步驟2. 1 :將所有的策略以Fstrategy存儲到HDFS中,每個策略為一行; 步驟2. 2 :對步驟1. 3結(jié)果使用Map函數(shù)并行查詢每一行,并與Fstrategy進(jìn)行比較,結(jié)果 以〈key,value〉的形式作為一行存儲到Fstrategy中; 步驟2. 3 :使用Reduce函數(shù)對Fstrategy中相同key的value相加,得到每一個策略的期 望效用。
【專利摘要】本發(fā)明屬于人工智能領(lǐng)域,公開了一種影響圖的期望效用的并行計算方法?;谟绊憟D在分布式文件系統(tǒng)HDFS上的存儲,首先利用MapReduce并行地計算影響圖的聯(lián)合效用函數(shù),再并行計算所有策略的期望效用。與現(xiàn)有技術(shù)相比,本發(fā)明的方法對大規(guī)模影響圖,以及非規(guī)范的影響圖的全局最大期望效用以及最優(yōu)策略提供有效的支持,對影響圖的應(yīng)用提供可擴(kuò)展的支撐技術(shù)。
【IPC分類】G06F9/50, G06F17/30, G06N5/04
【公開號】CN105138677
【申請?zhí)枴緾N201510568841
【發(fā)明人】李維華, 王順芳
【申請人】云南大學(xué)
【公開日】2015年12月9日
【申請日】2015年9月9日