亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種自主融合先驗(yàn)知識(shí)的貝葉斯網(wǎng)絡(luò)方法

文檔序號(hào):6426335閱讀:243來源:國(guó)知局
專利名稱:一種自主融合先驗(yàn)知識(shí)的貝葉斯網(wǎng)絡(luò)方法
技術(shù)領(lǐng)域
本發(fā)明涉及知識(shí)發(fā)現(xiàn)中的貝葉斯網(wǎng)絡(luò)領(lǐng)域,特別涉及一種自主融合先驗(yàn)知識(shí)的貝葉斯網(wǎng)絡(luò)方法。
背景技術(shù)
貝葉斯網(wǎng)絡(luò)是一種描述變量之間不確定性關(guān)系的圖形化表示,由結(jié)構(gòu)模型和條件概率分布兩部分構(gòu)成結(jié)構(gòu)模型是一個(gè)DAG(DireCted Acyclic Graph,有向無(wú)環(huán)圖), 圖中的節(jié)點(diǎn)表示隨機(jī)變量,是對(duì)過程、事件和狀態(tài)等實(shí)體某一特征的描述,圖中的邊則表示該邊連接的兩個(gè)變量之間具有直接的條件依賴關(guān)系。而這種依賴的程度則是由附在每個(gè)節(jié)點(diǎn)上的概率分布來描述的,其中,根節(jié)點(diǎn)X所附的是它的邊緣概率分布P(X),而非根節(jié)點(diǎn)X所附的是條件概率分布P(X| (X))。一個(gè)完整的貝葉斯網(wǎng)絡(luò)如圖1所示,根據(jù)定義,一個(gè)η元變量的貝葉斯網(wǎng)絡(luò)可以形式化的描述為B= (Bs, Bp), Bs= (X,Ε)為結(jié)構(gòu)模
型,X= (xl,......xn)為節(jié)點(diǎn)集,E為有向邊的集合。Bp為條件概率分布的集合,當(dāng)各
節(jié)點(diǎn)取離散值時(shí),Bp為一組CPT(Conditional Probability Table,條件概率表)??梢詮亩ㄐ院投?jī)蓚€(gè)層面來理解貝葉斯網(wǎng)絡(luò)。在定性層面,它用一個(gè)有向無(wú)環(huán)圖描述了不同變量之間的依賴和獨(dú)立關(guān)系。在定量層面,它使用條件概率分布刻畫了變量對(duì)其父節(jié)點(diǎn)的依賴程度強(qiáng)弱。在語(yǔ)義上,貝葉斯網(wǎng)絡(luò)是聯(lián)合概率分布的一種分解表示。具體地講, 假設(shè)網(wǎng)絡(luò)中的變量為XI,...,紐,那么把各變量所附的概率分布相乘就得到聯(lián)合分布,即
PiXl,...,X^ = YlP(XMXl)) ^
·.…-….ZF1......作為分析數(shù)據(jù)的一種方法,貝葉斯網(wǎng)絡(luò)能夠直觀地顯示和反映數(shù)據(jù)中各變量屬性直接的依賴關(guān)系。所謂貝葉斯網(wǎng)絡(luò)學(xué)習(xí)(Bayesian Network learning)即是通過數(shù)據(jù)分析獲得貝葉斯網(wǎng)絡(luò)的過程。因而貝葉斯網(wǎng)絡(luò)的學(xué)習(xí)也就是找出一個(gè)能夠真實(shí)地反映現(xiàn)有數(shù)據(jù)間關(guān)系的模型。當(dāng)數(shù)據(jù)的屬性字段變多時(shí),網(wǎng)絡(luò)的結(jié)構(gòu)成倍增加,不可能對(duì)所有的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行計(jì)算,因此必須在現(xiàn)有的知識(shí)下進(jìn)行網(wǎng)絡(luò)選擇,這在很大程度上依賴于專家知識(shí)。K2方法是由Cooper和Herskovits于1991年提出的貝葉斯網(wǎng)絡(luò)學(xué)習(xí)方法,K2方法所產(chǎn)生的貝葉斯網(wǎng)絡(luò)對(duì)初始節(jié)點(diǎn)順序的依賴非常大,根據(jù)不同的節(jié)點(diǎn)順序完全可以構(gòu)造出不同的網(wǎng)絡(luò),所花費(fèi)的時(shí)間和空間自然也不同。因此,根據(jù)先驗(yàn)知識(shí)獲得初始節(jié)點(diǎn)順序?qū)?K2方法有著舉足輕重的影響。但是,由于缺乏醫(yī)學(xué)方面的專業(yè)背景和持續(xù)的專家指導(dǎo),本發(fā)明實(shí)施例所掌握的
先驗(yàn)知識(shí)十分有限,對(duì)于μ式,+++,式)= ρ(式ι(式))個(gè)變量的節(jié)點(diǎn)集可供選擇的先驗(yàn)知識(shí)
.........i=l .
節(jié)點(diǎn)序接近η!種。如果直接使用Κ2方法,通過窮舉法產(chǎn)生節(jié)點(diǎn)序來構(gòu)造貝葉斯網(wǎng)絡(luò),在時(shí)間上無(wú)法滿足本發(fā)明實(shí)施例的需要。而如何從η !個(gè)組合中選出一個(gè)與數(shù)據(jù)最吻合的節(jié)點(diǎn)序,根據(jù)目前掌握的先驗(yàn)知識(shí),在技術(shù)上是難以實(shí)現(xiàn)的。發(fā)明人在實(shí)現(xiàn)本發(fā)明的過程中發(fā)現(xiàn),現(xiàn)有技術(shù)中至少存在以下缺點(diǎn)
現(xiàn)有的貝葉斯網(wǎng)絡(luò)方法對(duì)先驗(yàn)知識(shí)的融合效率低下,不能很好的滿足實(shí)際應(yīng)用中的需要。

發(fā)明內(nèi)容
為了提高貝葉斯網(wǎng)絡(luò)方法對(duì)先驗(yàn)知識(shí)的融合效率,本發(fā)明提供了一種自主融合先驗(yàn)知識(shí)的貝葉斯網(wǎng)絡(luò)方法,詳見下文描述一種自主融合先驗(yàn)知識(shí)的貝葉斯網(wǎng)絡(luò)方法,所述方法包括以下步驟(1)從領(lǐng)域?qū)<耀@取先驗(yàn)知識(shí),將所述先驗(yàn)知識(shí)轉(zhuǎn)化為規(guī)則格式,同時(shí)將所述規(guī)則格式轉(zhuǎn)化為m階方陣,將所述m階方陣存儲(chǔ)到先驗(yàn)知識(shí)表中;(2)初始化當(dāng)前貝葉斯網(wǎng)絡(luò)評(píng)分為0,對(duì)m個(gè)節(jié)點(diǎn)進(jìn)行隨機(jī)排序得到一個(gè)隨機(jī)序例 P ;(3)對(duì)m個(gè)節(jié)點(diǎn)中每個(gè)節(jié)點(diǎn)\的父節(jié)點(diǎn)數(shù)量設(shè)置一個(gè)閾值μ,初始化當(dāng)前貝葉斯網(wǎng)絡(luò)為一個(gè)空?qǐng)D;(4)獲取所述隨機(jī)序列P中任一節(jié)點(diǎn)&的父節(jié)點(diǎn)集合獲取所述隨機(jī)序列P 中在Xj之前,且不是Xj的父節(jié)點(diǎn)的變量\ ;(5)判斷是否I < μ,如果是,執(zhí)行步驟(6);如果否,執(zhí)行步驟⑷;(6)在所述先驗(yàn)知識(shí)表中查找\和Xj之間是否一定不可以有邊,如果是,執(zhí)行步驟(7);如果否,執(zhí)行步驟⑶;(7)直接舍棄\和Xj之間的邊;(8)根據(jù)所述\和Xj之間的邊獲取新的貝葉斯網(wǎng)絡(luò)及其新的貝葉斯網(wǎng)絡(luò)評(píng)分,判斷所述新的貝葉斯網(wǎng)絡(luò)評(píng)分是否大于所述當(dāng)前貝葉斯網(wǎng)絡(luò)評(píng)分,如果是,將所述新的貝葉斯網(wǎng)絡(luò)作為所述當(dāng)前貝葉斯網(wǎng)絡(luò),當(dāng)所述隨機(jī)序列P中所有節(jié)點(diǎn)執(zhí)行完畢,返回所述當(dāng)前貝葉斯網(wǎng)絡(luò),作為最終貝葉斯網(wǎng)絡(luò)模型,流程結(jié)束;如果否,重新執(zhí)行步驟G)。本發(fā)明提供的技術(shù)方案的有益效果是本發(fā)明提供了一種自主融合先驗(yàn)知識(shí)的貝葉斯網(wǎng)絡(luò)方法,和Κ2方法相比本發(fā)明具有以下的有益效果1、Κ2方法起始于一個(gè)空?qǐng)D,需要通過計(jì)算來確定根節(jié)點(diǎn)與其他所有非根節(jié)點(diǎn)之間是否有邊,難以保證最終獲得的貝葉斯網(wǎng)絡(luò)是一個(gè)完整的圖形結(jié)構(gòu),容易出現(xiàn)與其他所有節(jié)點(diǎn)均無(wú)依賴關(guān)系的孤立節(jié)點(diǎn);本發(fā)明起始于樸素貝葉斯網(wǎng)絡(luò),無(wú)需計(jì)算根節(jié)點(diǎn)與非根節(jié)點(diǎn)之間的邊,減少了計(jì)算量,同時(shí)確保了貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)完整性,不存在孤立節(jié)點(diǎn);2、Κ2方法要求在開始前明確知道節(jié)點(diǎn)的排序,要求研究人員針對(duì)問題域掌握非常豐富的先驗(yàn)知識(shí);本發(fā)明在開始后自主生成一個(gè)隨機(jī)節(jié)點(diǎn)序,實(shí)現(xiàn)較簡(jiǎn)單,不要求先驗(yàn)知識(shí),但是這種隨機(jī)并不是完全的隨機(jī),在貝葉斯網(wǎng)絡(luò)構(gòu)建過程中另附加有其它約束條件,即 “有條件的隨機(jī)”;3、先驗(yàn)知識(shí)是否充足對(duì)Κ2方法具有極大的影響,但對(duì)本發(fā)明的影響較小,本發(fā)明掌握的先驗(yàn)知識(shí)還不足以明確某一個(gè)節(jié)點(diǎn)能否成為另一個(gè)節(jié)點(diǎn)的父節(jié)點(diǎn),但結(jié)合研究的需要可以確定哪一些節(jié)點(diǎn)之間不可以是父子關(guān)系,例如出院科別outSection與主治醫(yī)師 docCharge屬性,在醫(yī)院中每一個(gè)醫(yī)生都隸屬于某一個(gè)科室,而每個(gè)科室都有自己科別的醫(yī)生,二者之間存在著必然的關(guān)系,從使用K2方法構(gòu)建的貝葉斯網(wǎng)絡(luò)中亦能體現(xiàn)出該點(diǎn),但這種顯而易見的聯(lián)系并不是本發(fā)明所需要的;同時(shí),由于此類關(guān)系出現(xiàn)頻率較大,在貝葉斯網(wǎng)絡(luò)構(gòu)建過程中能夠獲得更高的評(píng)分,使得其他潛在關(guān)系被舍棄,而這些潛在關(guān)系極大的可能與醫(yī)療質(zhì)量有關(guān),因此通過刪除部分不需要的邊,能夠在一定程度上降低貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)復(fù)雜性;4、本發(fā)明采用“有條件的隨機(jī)”方式利用先驗(yàn)知識(shí),雖然有一定的優(yōu)勢(shì),但一次隨機(jī)節(jié)點(diǎn)序并不能完全反映出數(shù)據(jù)之間可能的因果關(guān)系。為了彌補(bǔ)這一缺憾,本發(fā)明采用多次運(yùn)行的方式,根據(jù)不同的隨機(jī)節(jié)點(diǎn)序構(gòu)建多個(gè)貝葉斯網(wǎng)絡(luò),并從中選擇與數(shù)據(jù)擬合程度最好的一個(gè)作為最終的貝葉斯網(wǎng)絡(luò)模型。


圖1為本發(fā)明提供的一種自主融合先驗(yàn)知識(shí)的貝葉斯網(wǎng)絡(luò)方法的流程圖。
具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述。為了提高貝葉斯網(wǎng)絡(luò)方法對(duì)先驗(yàn)知識(shí)的融合效率,本發(fā)明實(shí)施例提供了一種自主融合先驗(yàn)知識(shí)的貝葉斯網(wǎng)絡(luò)方法,參見圖1,詳見下文描述常見的兩種表示領(lǐng)域知識(shí)拓?fù)浣Y(jié)構(gòu)的方法規(guī)則格式和矩陣格式。對(duì)于領(lǐng)域知識(shí)來說規(guī)則格式能夠很好的從領(lǐng)域?qū)<耀@得,然后再將這些規(guī)則格式轉(zhuǎn)換為矩陣格式,使之能夠更容易的轉(zhuǎn)化為網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。貝葉斯網(wǎng)絡(luò)學(xué)習(xí)是找出一個(gè)能夠最真實(shí)地反映現(xiàn)有數(shù)據(jù)中各個(gè)數(shù)據(jù)變量之間依賴關(guān)系的貝葉斯網(wǎng)絡(luò)模型。因而,提高貝葉斯網(wǎng)絡(luò)方法的效率要求能夠根據(jù)一定的先驗(yàn)知識(shí)有指導(dǎo)的構(gòu)建貝葉斯網(wǎng)絡(luò)模型。本發(fā)明實(shí)施例選擇采用“有條件的隨機(jī)”方式獲得先驗(yàn)知識(shí)節(jié)點(diǎn)序,本發(fā)明實(shí)施例提出了一種自主融合先驗(yàn)知識(shí)的貝葉斯網(wǎng)絡(luò)方法,該方法更適合進(jìn)行醫(yī)療數(shù)據(jù)挖掘,詳見下文描述101 從領(lǐng)域?qū)<耀@取先驗(yàn)知識(shí),將先驗(yàn)知識(shí)轉(zhuǎn)化為規(guī)則格式,同時(shí)將規(guī)則格式轉(zhuǎn)化為m階方陣,將m階方陣存儲(chǔ)到先驗(yàn)知識(shí)表中;例如選擇的數(shù)據(jù)是病案首頁(yè),則從相關(guān)的醫(yī)院中找醫(yī)院中的專家提供先驗(yàn)知識(shí), 具體實(shí)現(xiàn)時(shí),本發(fā)明實(shí)施例對(duì)此不做限制。102 初始化當(dāng)前貝葉斯網(wǎng)絡(luò)的評(píng)分為0,對(duì)m個(gè)節(jié)點(diǎn)進(jìn)行隨機(jī)排序得到一個(gè)隨機(jī)序例P ;103 對(duì)m個(gè)節(jié)點(diǎn)中每個(gè)節(jié)點(diǎn)Xj的父節(jié)點(diǎn)的數(shù)量設(shè)置一個(gè)閾值μ,初始化貝葉斯網(wǎng)絡(luò)為一個(gè)空?qǐng)D;104:獲取隨機(jī)序列P中任一節(jié)點(diǎn)Xj的父節(jié)點(diǎn)集合η」,獲取隨機(jī)序列P中在Xj 之前,且不是Xj的父節(jié)點(diǎn)的變量\ ;105 判斷是否I π」| < μ,如果是,執(zhí)行步驟106 ;如果否,執(zhí)行步驟104 ;106 在先驗(yàn)知識(shí)表中查找&和Xj之間是否一定不可以有邊,如果是,執(zhí)行步驟 107;如果否,執(zhí)行步驟108;
107 直接舍棄&和Xj之間的邊;108:根據(jù)&和乂」之間的邊獲取新的貝葉斯網(wǎng)絡(luò)及其新的貝葉斯網(wǎng)絡(luò)評(píng)分,判斷新的貝葉斯網(wǎng)絡(luò)評(píng)分是否大于當(dāng)前貝葉斯網(wǎng)絡(luò)評(píng)分,如果是,將新的貝葉斯網(wǎng)絡(luò)作為當(dāng)前貝葉斯網(wǎng)絡(luò),當(dāng)隨機(jī)序列P中所有節(jié)點(diǎn)執(zhí)行完畢,返回當(dāng)前貝葉斯網(wǎng)絡(luò),作為最終貝葉斯網(wǎng)絡(luò)模型,流程結(jié)束;如果否,重新執(zhí)行步驟104。下面以一個(gè)簡(jiǎn)單的試驗(yàn)來驗(yàn)證本發(fā)明實(shí)施例提供的一種自主融合先驗(yàn)知識(shí)的貝葉斯網(wǎng)絡(luò)方法的可行性,詳見下文描述選擇的數(shù)據(jù)是病案首頁(yè),數(shù)據(jù)屬性包括如下字段出院科別、病人性別、病人家庭地區(qū)和icdlO (病癥編碼)。對(duì)于上面的數(shù)據(jù),從領(lǐng)域?qū)<铱傻玫讲∪说男詣e與病人的家庭地區(qū)之間的關(guān)系不是想得到的關(guān)系,因此可以很方便在m階方陣中設(shè)置NotparentchilcK病人性別,病人家庭地區(qū))和NotParentChiId (病人家庭地區(qū),病人性別)的值為1禁止病人性別和病人家庭地區(qū)中出院關(guān)聯(lián)的邊。通過上述試驗(yàn),避免了融合先驗(yàn)知識(shí)的繁瑣,本發(fā)明實(shí)施例提供的方法可以將計(jì)算過程復(fù)雜度由4階縮短為3階,滿足了實(shí)際應(yīng)用中的需要。綜上所述,本發(fā)明實(shí)施例提供了一種自主融合先驗(yàn)知識(shí)的貝葉斯網(wǎng)絡(luò)方法,本發(fā)明實(shí)施例起始于樸素貝葉斯網(wǎng)絡(luò),無(wú)需計(jì)算根節(jié)點(diǎn)與非根節(jié)點(diǎn)之間的邊,減少了計(jì)算量,同時(shí)確保了貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)完整性,不存在孤立節(jié)點(diǎn);本發(fā)明實(shí)施例自主生成一個(gè)隨機(jī)節(jié)點(diǎn)序,實(shí)現(xiàn)較簡(jiǎn)單,不要求先驗(yàn)知識(shí),但是這種隨機(jī)并不是完全的隨機(jī),在貝葉斯網(wǎng)絡(luò)構(gòu)建過程中另附加有其它約束條件,即“有條件的隨機(jī)”;本發(fā)明實(shí)施例通過刪除部分不需要的邊,能夠在一定程度上降低貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)復(fù)雜性;本發(fā)明實(shí)施例采用多次運(yùn)行的方式, 根據(jù)不同的隨機(jī)節(jié)點(diǎn)序構(gòu)建多個(gè)貝葉斯網(wǎng)絡(luò),并從中選擇與數(shù)據(jù)擬合程度最好的一個(gè)作為最終的貝葉斯網(wǎng)絡(luò)模型。本領(lǐng)域技術(shù)人員可以理解附圖只是一個(gè)優(yōu)選實(shí)施例的示意圖,上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1. 一種自主融合先驗(yàn)知識(shí)的貝葉斯網(wǎng)絡(luò)方法,其特征在于,所述方法包括以下步驟(1)從領(lǐng)域?qū)<耀@取先驗(yàn)知識(shí),將所述先驗(yàn)知識(shí)轉(zhuǎn)化為規(guī)則格式,同時(shí)將所述規(guī)則格式轉(zhuǎn)化為m階方陣,將所述m階方陣存儲(chǔ)到先驗(yàn)知識(shí)表中;(2)初始化當(dāng)前貝葉斯網(wǎng)絡(luò)評(píng)分為0,對(duì)m個(gè)節(jié)點(diǎn)進(jìn)行隨機(jī)排序得到一個(gè)隨機(jī)序例P;(3)對(duì)m個(gè)節(jié)點(diǎn)中每個(gè)節(jié)點(diǎn)Xj的父節(jié)點(diǎn)數(shù)量設(shè)置一個(gè)閾值μ,初始化當(dāng)前貝葉斯網(wǎng)絡(luò)為一個(gè)空?qǐng)D;(4)獲取所述隨機(jī)序列P中任一節(jié)點(diǎn)&的父節(jié)點(diǎn)集合獲取所述隨機(jī)序列P中在 Xj之前,且不是Xj的父節(jié)點(diǎn)的變量\ ;(5)判斷是否I< μ,如果是,執(zhí)行步驟(6);如果否,執(zhí)行步驟⑷;(6)在所述先驗(yàn)知識(shí)表中查找\和Xj之間是否一定不可以有邊,如果是,執(zhí)行步驟 (7);如果否,執(zhí)行步驟⑶;(7)直接舍棄\和Xj之間的邊;(8)根據(jù)所述&和Xj之間的邊獲取新的貝葉斯網(wǎng)絡(luò)及其新的貝葉斯網(wǎng)絡(luò)評(píng)分,判斷所述新的貝葉斯網(wǎng)絡(luò)評(píng)分是否大于所述當(dāng)前貝葉斯網(wǎng)絡(luò)評(píng)分,如果是,將所述新的貝葉斯網(wǎng)絡(luò)作為所述當(dāng)前貝葉斯網(wǎng)絡(luò),當(dāng)所述隨機(jī)序列P中所有節(jié)點(diǎn)執(zhí)行完畢,返回所述當(dāng)前貝葉斯網(wǎng)絡(luò),作為最終貝葉斯網(wǎng)絡(luò)模型,流程結(jié)束;如果否,重新執(zhí)行步驟G)。
全文摘要
本發(fā)明公開了一種自主融合先驗(yàn)知識(shí)的貝葉斯網(wǎng)絡(luò)方法,涉及貝葉斯網(wǎng)絡(luò)領(lǐng)域,本發(fā)明起始于樸素貝葉斯網(wǎng)絡(luò),自主生成一個(gè)隨機(jī)節(jié)點(diǎn)序,在貝葉斯網(wǎng)絡(luò)構(gòu)建過程中另附加有其它約束條件,即“有條件的隨機(jī)”;通過刪除部分不需要的邊,能夠在一定程度上降低貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)復(fù)雜性;本發(fā)明采用多次運(yùn)行的方式,根據(jù)不同的隨機(jī)節(jié)點(diǎn)序構(gòu)建多個(gè)貝葉斯網(wǎng)絡(luò),并從中選擇與數(shù)據(jù)擬合程度最好的一個(gè)作為最終的貝葉斯網(wǎng)絡(luò)模型,本發(fā)明提高了貝葉斯網(wǎng)絡(luò)方法對(duì)先驗(yàn)知識(shí)的融合效率,滿足了實(shí)際應(yīng)用中的需要。
文檔編號(hào)G06N7/00GK102194145SQ20111016053
公開日2011年9月21日 申請(qǐng)日期2011年6月15日 優(yōu)先權(quán)日2011年6月15日
發(fā)明者韓志朋 申請(qǐng)人:天津大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1