本發(fā)明涉及一種具有自學(xué)習(xí)功能的貝葉斯網(wǎng)絡(luò)平臺,包括處理樣本數(shù)據(jù)集,運(yùn)用netica基礎(chǔ)函數(shù)開發(fā)結(jié)構(gòu)學(xué)習(xí)模塊和參數(shù)學(xué)習(xí)模塊,構(gòu)建自學(xué)習(xí)樣本數(shù)據(jù)集的貝葉斯網(wǎng)絡(luò)。同時,開發(fā)概率推理模塊和證據(jù)敏感性分析模塊評估所建網(wǎng)絡(luò)的有效性。屬于工程應(yīng)用領(lǐng)域。
背景技術(shù):
貝葉斯網(wǎng)絡(luò)是表示變量間概率相關(guān)性關(guān)系的圖模型,是不確定知識表達(dá)和推理領(lǐng)域最有效的理論模型之一,已被廣泛地用于診斷、預(yù)測、風(fēng)險管理、模擬生態(tài)系統(tǒng)、傳感器融合等領(lǐng)域,效果良好。目前有很多軟件平臺可以構(gòu)建貝葉斯網(wǎng)絡(luò),常用的是基于matlab語言開發(fā)的貝葉斯網(wǎng)絡(luò)工具箱bntoolbox。該工具箱提供了許多貝葉斯網(wǎng)絡(luò)學(xué)習(xí)的底層基礎(chǔ)函數(shù)庫,但是沒有將貝葉斯網(wǎng)絡(luò)學(xué)習(xí)的基本函數(shù)集成為系統(tǒng)。同時,bntoolbox沒有圖形用戶界面(gui),使用不方便,不利于推廣。
netica是用java開發(fā)的貝葉斯網(wǎng)絡(luò)學(xué)習(xí)軟件。但是基于netica采用專家知識方法構(gòu)建的貝葉斯網(wǎng)絡(luò),要求使用者具有較強(qiáng)的專業(yè)背景,采用netica軟件擬合樣本數(shù)據(jù),得到貝葉斯網(wǎng)絡(luò)模型各個節(jié)點(diǎn)間的條件概率分布,是針對特定目標(biāo)設(shè)定的,不能滿足不同研究的需求。本發(fā)明采用相關(guān)領(lǐng)域的樣本數(shù)據(jù),基于netica軟件開發(fā)貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí)模塊,給出通用的自學(xué)習(xí)貝葉斯網(wǎng)絡(luò)構(gòu)建方法,并通過概率推理和證據(jù)敏感性分析進(jìn)行驗(yàn)證,拓寬了貝葉斯網(wǎng)絡(luò)的應(yīng)用普適性。
技術(shù)實(shí)現(xiàn)要素:
針對上述問題,本發(fā)明的目的是提供具有自學(xué)習(xí)功能的貝葉斯網(wǎng)絡(luò)平臺。包括處理樣本數(shù)據(jù)集,運(yùn)用netica基礎(chǔ)函數(shù)開發(fā)結(jié)構(gòu)學(xué)習(xí)模塊和參數(shù)學(xué)習(xí)模塊,構(gòu)建自學(xué)習(xí)樣本數(shù)據(jù)集的貝葉斯網(wǎng)絡(luò)。同時,開發(fā)概率推理模塊和證據(jù)敏感性分析模塊以評估所建網(wǎng)絡(luò)的有效性??朔素惾~斯網(wǎng)絡(luò)構(gòu)建時參數(shù)與結(jié)構(gòu)的難以自適應(yīng)調(diào)整的問題,實(shí)現(xiàn)了不確定性推理,滿足不同研究的需求,拓寬了應(yīng)用普適性。
為實(shí)現(xiàn)上述目的,本發(fā)明采取以下工程應(yīng)用平臺:
(1)自學(xué)習(xí)貝葉斯網(wǎng)絡(luò)是在netica提供的函數(shù)基礎(chǔ)上構(gòu)建,包括:數(shù)據(jù)處理、定義節(jié)點(diǎn)變量、網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)、網(wǎng)絡(luò)參數(shù)學(xué)習(xí),其中學(xué)習(xí)過程為交叉進(jìn)行。其中樣本數(shù)據(jù)預(yù)處理包括狀態(tài)變量的定義、連續(xù)變量的離散化、格式化處理等。貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)方法分為基于打分--搜索的學(xué)習(xí)方法和基于依賴分析的學(xué)習(xí)方法,以及以上兩種方法的結(jié)合。參數(shù)學(xué)習(xí)方法是在已知網(wǎng)絡(luò)結(jié)構(gòu)的條件下,用樣本數(shù)據(jù)集來學(xué)習(xí)節(jié)點(diǎn)的cpt。
(2)概率推理是在貝葉斯網(wǎng)絡(luò)模型給定的情況下,根據(jù)已知證據(jù)節(jié)點(diǎn)變量的概率分布,利用條件概率的計算方法,計算出所感興趣的查詢結(jié)點(diǎn)變量發(fā)生的概率。
(3)證據(jù)敏感性分析是分析貝葉斯網(wǎng)絡(luò)中查詢節(jié)點(diǎn)概率對證據(jù)節(jié)點(diǎn)概率變化的敏感程度。
本發(fā)明由于采取以上工程應(yīng)用平臺,其具有以下優(yōu)點(diǎn):
1、操作方便靈活:具有友好的gui視窗界面,支持?jǐn)?shù)據(jù)庫鏈接,可以直接鏈接到windows、unix等大多數(shù)的數(shù)據(jù)庫軟件;
2、應(yīng)用普適性:系統(tǒng)開放,可以嵌入新算法來進(jìn)行各種不確定性推理;
3、高效:使用嚴(yán)格的數(shù)學(xué)方式來模型化研究對象,具有很高的計算效率和很強(qiáng)的適應(yīng)性。
附圖說明
圖1是電網(wǎng)短路故障診斷的貝葉斯網(wǎng)絡(luò)學(xué)習(xí)結(jié)構(gòu)。
圖2是電網(wǎng)短路故障診斷的貝葉斯網(wǎng)絡(luò)參數(shù)學(xué)習(xí)結(jié)構(gòu)。
圖3是證據(jù)變量為“l(fā)inebreakage”的短路故障預(yù)測。
圖4是證據(jù)變量為“l(fā)inebreakage”和“insulatorbreakdown”的短路故障預(yù)測。
圖5是證據(jù)變量為“短路故障”時的后驗(yàn)概率。
圖6是證據(jù)變量為“短路故障”和“單相接地短路”時的后驗(yàn)概率
具體實(shí)施方式
為了更好地介紹本發(fā)明的工程應(yīng)用平臺及所要實(shí)現(xiàn)的功能,下面結(jié)合具體圖表,進(jìn)一步闡述本發(fā)明。
一種具有自學(xué)習(xí)功能的貝葉斯網(wǎng)絡(luò)平臺,工程應(yīng)用平臺包括數(shù)據(jù)預(yù)處理模塊(1)、網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)學(xué)習(xí)模塊(2)、網(wǎng)絡(luò)參數(shù)學(xué)習(xí)模塊(3)、概率推理模塊(4)和證據(jù)敏感性分析模塊(5);所述數(shù)據(jù)預(yù)處理模塊(1)包括選定節(jié)點(diǎn)變量,確定節(jié)點(diǎn)狀態(tài);所述結(jié)構(gòu)學(xué)習(xí)模塊(2)包括新建貝葉斯網(wǎng)絡(luò)窗口,調(diào)用樣本數(shù)據(jù)集,執(zhí)行結(jié)構(gòu)學(xué)習(xí)模塊,創(chuàng)建網(wǎng)絡(luò)結(jié)構(gòu);所述參數(shù)學(xué)習(xí)模塊(3)包括調(diào)用樣本數(shù)據(jù),執(zhí)行參數(shù)學(xué)習(xí)功能;所述概率推理模塊(4)包括因果推理,診斷推理和支持推理;所述證據(jù)敏感性分析模塊(5)包括以測試敏感性的證據(jù)節(jié)點(diǎn)為條件,計算查詢節(jié)點(diǎn)的指標(biāo);其中數(shù)據(jù)預(yù)處理模塊、網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)學(xué)習(xí)模塊和網(wǎng)絡(luò)參數(shù)學(xué)習(xí)模塊構(gòu)建自學(xué)習(xí)樣本數(shù)據(jù)集的貝葉斯網(wǎng)絡(luò),概率推理模塊和證據(jù)敏感性分析模塊評估所建網(wǎng)絡(luò)的有效性。
實(shí)施例一:
電網(wǎng)三相交流線路發(fā)生的各種短路中,單相接地短路所占的比例最高,約為65%;兩相接地短路約占20%;兩相短路約占10%,三相短路最小,約占5%。單相接地短路故障中,導(dǎo)線斷線、絕緣子擊穿和樹木短接三種原因占總故障原因的80%,分別約為30%、30%、20%,其它原因只占20%。
圖1為網(wǎng)絡(luò)結(jié)構(gòu)。調(diào)用表1的樣本數(shù)據(jù)集,執(zhí)行網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)模塊功能,創(chuàng)建網(wǎng)絡(luò)結(jié)構(gòu),然后進(jìn)一步定義節(jié)點(diǎn)屬性,包括:名稱,標(biāo)題,類型,離散和連續(xù)屬性,狀態(tài)數(shù),狀態(tài)值和相關(guān)說明等。
表1樣本數(shù)據(jù)集
圖2為定義了cpt的貝葉斯網(wǎng)絡(luò)。調(diào)用表1樣本數(shù)據(jù),執(zhí)行參數(shù)學(xué)習(xí)功能,學(xué)習(xí)后且賦予cpt的貝葉斯網(wǎng)絡(luò),其信度柵變化。
實(shí)施例二:
圖3為預(yù)測分析,在貝葉斯網(wǎng)絡(luò)中將“l(fā)inebreakage”變量狀態(tài)設(shè)置成present=100%狀態(tài),表示證據(jù)變量的已知狀態(tài),自動更新功能自動更新整個網(wǎng)絡(luò)的概率。此時單相接地短路(1-phaseground)出現(xiàn)(present)的概率由50.7%變成64.2%,發(fā)生短路故障(shortcircuit)出現(xiàn)(present)的概率由52.9%變成61.7%,可見導(dǎo)線斷線后,發(fā)生短路故障概率提高了。
圖4為導(dǎo)線斷線和絕緣子擊穿(insulatorbreakdown)同時發(fā)生,將證據(jù)節(jié)點(diǎn)“insulatorbreakdown”變量狀態(tài)設(shè)置成present=100%狀態(tài),利用自動更新功能更新整個網(wǎng)絡(luò)的概率。此時單相接地短路(1-phaseground)出現(xiàn)(present)的概率由64.2%變成82.3%,發(fā)生短路故障(shortcircuit)出現(xiàn)(present)的概率由61.7%變成73.5%,發(fā)生短路故障的概率更高了。
圖5為以短路故障為例的原因診斷,證據(jù)變量“shortcircuit”的狀態(tài)概率為present=100%。輸入證據(jù)之后,通過概率自動更新,則“1-phaseground”present的概率由50.7%提高至81.7%,“2-phaseground”present的概率由52.4%提高至62.7%,“2-pshortcircuit”present的概率由51.2%提高至59.2%,“3-pshortcircuit”present的概率由55%提高至58%。
圖6為支持解釋,在圖5中,如果有證據(jù)表明,單相接地短路“1-phaseground”發(fā)生,則在圖6中兩相接地短路“2-phaseground”present的概率由62.7%下降至58.8%,兩相短路“2-pshortcircuit”、三相短路“3-pshortcircuit”的概率也降低了。導(dǎo)致結(jié)果的原因已經(jīng)被證據(jù)“1-phase-ground”所解釋,其他原因的可能性自然會降低。
實(shí)施例三:
表2所示,根據(jù)圖2所示的貝葉斯網(wǎng)絡(luò)為平臺,以“短路故障”為查詢節(jié)點(diǎn)的敏感性分析。
表2以“短路故障”為查詢節(jié)點(diǎn)的證據(jù)敏感性分析
表2中每一行表示,如果得到第1列中的節(jié)點(diǎn)證據(jù),那么第3列、第4列和第5列是short-c=present情況下的最小、當(dāng)前和最大后驗(yàn)概率;第6列和第7列是熵減的絕對值和百分比;第8列是方差。
由表2可知,對短路故障有影響力的節(jié)點(diǎn)是其父節(jié)點(diǎn)和子節(jié)點(diǎn)。而且,最有可能對短路故障信度產(chǎn)生最大影響的證據(jù)列在最前面。