亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于貝葉斯模型的輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法與流程

文檔序號:11323891閱讀:467來源:國知局
基于貝葉斯模型的輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法與流程

本發(fā)明涉及一種輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法,尤其涉及一種基于貝葉斯模型的輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法。



背景技術:

隨著國民經(jīng)濟的高速發(fā)展,社會用電需求日益增大,電力短缺已經(jīng)成為了一個經(jīng)濟發(fā)展的限制因素,在經(jīng)濟發(fā)達的長三角、珠三角地區(qū)尤為突出。目前,電網(wǎng)的發(fā)展明顯落后于經(jīng)濟的發(fā)展,落后于電源的建設,使得電網(wǎng)輸電能力的不足顯得更為突出。加之電網(wǎng)建設受到環(huán)境、成本等因素的制約,使得建設周期長、發(fā)展速度有限,往往不能滿足輸電的需求。因此,在加快電網(wǎng)規(guī)劃建設之外,通過技術改造和升級,挖掘電網(wǎng)輸送能力潛力、提高輸電效率成為了一個研究的方向。

輸電線路的運行狀態(tài)受到氣象條件、負載情況以及導線規(guī)格等多方面條件的影響。通過選取合適的預測模型,并對關鍵影響因素進行分析和預測,可以對輸電線路運行狀態(tài)進行更加合理的評估,對實際生產(chǎn)運行中提升效率有很大的意義。利用大量歷史數(shù)據(jù)進行分析,挖掘并預測某參量的變化趨勢是大數(shù)據(jù)分析的一個關鍵內(nèi)容?,F(xiàn)有的輸電線運行狀態(tài)預測方法大多局限于對單一參量的分析,并沒有考慮到多參量之間的相關性。此外,由于輸電線路運行環(huán)境的復雜性和動態(tài)性,對連續(xù)時間段上的系統(tǒng)參數(shù)分析預測并不能準確反應出線路的狀態(tài)變化。

因此,期望得到一種輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法,該方法可以將與輸電線路運行狀態(tài)相關的各參量之間的關聯(lián)規(guī)則應用到輸電線路狀態(tài)預測分析評估中,從而有利于提高預測的精度。此外,該方法可以對多系統(tǒng)參數(shù)、環(huán)境參數(shù)的關聯(lián)規(guī)則挖掘,從而提高對輸電線路狀態(tài)預測的準確性。



技術實現(xiàn)要素:

本發(fā)明的目的是提供一種基于貝葉斯模型的輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法,該方法可以將與輸電線路運行狀態(tài)相關的各參量之間的關聯(lián)規(guī)則應用到輸電線路狀態(tài)預測中,從而有利于提高預測的精度和準確性。

根據(jù)上述發(fā)明目的,本發(fā)明提出了一種基于貝葉斯模型的輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法,其特征在于,包括以下步驟:

(1)基于與輸電線路運行狀態(tài)相關的項集i生成頻繁1-項集l1,兩兩連接頻繁1-項集l1以生成候選2-項集c2,基于該候選2-項集c2生成頻繁2-項集l2;

(2)基于頻繁2-項集l2構造貝葉斯網(wǎng)絡;

(3)根據(jù)所述貝葉斯網(wǎng)絡生成關聯(lián)規(guī)則r;

(4)計算所述關聯(lián)規(guī)則r對應的支持度和置信度,得到關聯(lián)規(guī)則r的強關聯(lián)規(guī)則;

(5)結合所述關聯(lián)規(guī)則r的強關聯(lián)規(guī)則及其對應的置信度預測輸電線路運行狀態(tài)。

為便于理解,首先對本發(fā)明涉及的原理進行闡述:

貝葉斯網(wǎng)絡(bayesiannetwork,bn)為關聯(lián)規(guī)則挖掘提供了一個對不確定性知識表示和推理的框架,具備以任意結點出發(fā)推理其余各結點狀態(tài)的能力。

貝葉斯網(wǎng)絡是概率統(tǒng)計和圖論結合的模型,表示隨機變量間依賴性和獨立性的網(wǎng)絡模型,為不確定問題和復雜問題提供了直觀的表示方法。貝葉斯網(wǎng)絡是有向無環(huán)圖,用弧來表示各變量之間的依賴關系,概率分布表表示變量之間依賴關系的強弱,且基于后驗概率的貝葉斯定理,能夠進行嚴密的推理計算。本發(fā)明應用貝葉斯網(wǎng)絡對輸電線路與輸電線路運行狀態(tài)相關的各參量之間關聯(lián)關系的挖掘。

貝葉斯網(wǎng)絡主要由兩部分構成,分別為描述依賴關系結構的有向無環(huán)圖與描述依賴關系強弱的條件概率表,有向無環(huán)圖由節(jié)點與向邊構成。每一個節(jié)點對應于一個隨機變量,在本發(fā)明中用于描述與輸電線路運行狀態(tài)相關的各參量;每一條向邊對應隨機變量間的依賴關系,箭頭體現(xiàn)出因果的方向性,條件概率表則描述了節(jié)點之間的依賴關系強弱。

貝葉斯網(wǎng)絡的鏈式規(guī)則依據(jù)條件概率給出,以隨機變量集x={x1,x2,…,xn}為例,聯(lián)合概率為:

貝葉斯網(wǎng)絡具有一條重要性質(zhì),節(jié)點在其父節(jié)點確定時,該節(jié)點條件獨立于所有非父節(jié)點。基于此性質(zhì)。聯(lián)合概率可以化簡為:

其中,parents(xi)表示節(jié)點xi的父節(jié)點聯(lián)合,概率值從條件概率表中可以查出。

關聯(lián)規(guī)則挖掘可以發(fā)現(xiàn)數(shù)據(jù)庫中數(shù)據(jù)之間的聯(lián)系,而這些聯(lián)系是預先未知的,不能通過邏輯操作和統(tǒng)計方法得到,不是數(shù)據(jù)本身的自有屬性,而是基于數(shù)據(jù)間同時出現(xiàn)的特征。

關聯(lián)規(guī)則挖掘問題可以形式化描述如下:

事務:設i={i1,i2,…,im}是m個不同項目組成的集合,ik(k=1,2,…,m)稱為項目(item)。db為針對i的事務數(shù)據(jù)庫,每個事務t是i中一組屬性的集合,即并有一個唯一的標識符tid。

項集x的支持度support(x):項集x的支持度表示x的重要性,x可以為已知的頻繁項集。事務數(shù)據(jù)庫中支持項集x的事務數(shù)稱作項集x的支持數(shù),記為x.count。設|db|為事務數(shù)據(jù)庫的總數(shù),則項集x的支持度記為:

support(x)=x.count/|db|(3)

最小支持度:發(fā)現(xiàn)任務的最小支持度,滿足最小支持度的項集才會在關聯(lián)規(guī)則中出現(xiàn),稱為頻繁項集,否則稱為弱項集。

規(guī)則置信度:規(guī)則置信度表示規(guī)則的可靠性程度。對于關聯(lián)規(guī)則:

記x為前項,y為后項,則r關聯(lián)規(guī)則的置信度為:

confidence(r)=support(x∪y)/support(x)(5)

若r的置信度大于最小置信度,則稱為強關聯(lián)規(guī)則,若小于最小置信度,則稱為弱關聯(lián)規(guī)則。

目前常用的關聯(lián)規(guī)則挖掘算法有apriori、aprioritid和apriorihybrid算法。其中apriori算法通過掃描數(shù)據(jù)庫尋找頻繁項集,循環(huán)計算直至沒有新的頻繁項集產(chǎn)生,但由于數(shù)據(jù)庫通常規(guī)模龐大,每一次迭代計算支持度消耗大量資源。aprioritid法使用逐漸減少的候選數(shù)據(jù)庫來計算候選強項集的支持數(shù),提升了計算效率。apriorihybrid算法是前兩者的結合,在候選數(shù)據(jù)庫能夠裝入內(nèi)存時使用aprioritid算法,否則采用apriori算法。

apriori關聯(lián)規(guī)則挖掘的步驟主要分為兩部分:

1)識別目標數(shù)據(jù)集中的所有頻繁項集,即支持度不低于設定最小支持度的項集;

2)從上述頻繁項集中構造所有置信度不低于設定最小置信度的關聯(lián)規(guī)則。

apriori算法在產(chǎn)生維度更高的頻繁項集(例如頻繁2-項集)之后,需要再次掃描數(shù)據(jù)庫以計算支持度,而基于貝葉斯網(wǎng)絡的關聯(lián)規(guī)則挖掘方法可以避免該再次掃描,以貝葉斯網(wǎng)絡的形式表示一次掃描數(shù)據(jù)庫產(chǎn)生的頻繁2-項集,并據(jù)此找出關聯(lián)規(guī)則。

基于貝葉斯網(wǎng)絡的關聯(lián)規(guī)則挖掘方法假設得到的貝葉斯網(wǎng)絡由n個節(jié)點與l條邊構成,遍歷該有向無環(huán)圖復雜度為o(n+n2+l)。由于數(shù)據(jù)量遠遠大于節(jié)點數(shù),因此,通過該方法生成關聯(lián)規(guī)則的方法效率高于由apriori算法直接得到關聯(lián)規(guī)則的方法。

將關聯(lián)規(guī)則引入預測輸電線路運行狀態(tài)的神經(jīng)網(wǎng)絡,使得更加關注數(shù)據(jù)間的關聯(lián)性,從而提升預測精度和準確度。

本發(fā)明所述的基于貝葉斯模型的輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法中,所述項集i的項目包括與輸電線路運行狀態(tài)相關的各參量。從以上原理可知,頻繁1-項集l1表征重要的參量。頻繁2-項集l2表征重要的參量兩兩間的重要的聯(lián)系,因此可以基于頻繁2-項集l2構造貝葉斯網(wǎng)絡。本發(fā)明采用挖掘算法挖掘所有頻繁項集,利用貝葉斯網(wǎng)絡找到所有關聯(lián)規(guī)則,并計算每條關聯(lián)規(guī)則的支持度和置信度,從而避免了頻繁項集維數(shù)增加后仍需要掃描數(shù)據(jù)庫帶來的巨大計算量。本發(fā)明在傳統(tǒng)關聯(lián)規(guī)則挖掘方法的基礎上引入貝葉斯網(wǎng)絡,將與輸電線路運行狀態(tài)相關的各參量之間的關聯(lián)規(guī)則應用到輸電線路狀態(tài)預測中,從而有利于提高預測的精度和準確性。

進一步地,本發(fā)明所述的基于貝葉斯模型的輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法中,所述步驟(1)和步驟(2)之間還包括步驟:篩選頻繁2-項集l2。

上述方案中,篩選頻繁2-項集l2的方法可以是:當項集x、y存在以下關系

support(x∪y)≈support(x)·support(y)(6)

則認為項集x、y是相互獨立的,關聯(lián)規(guī)則并沒有意義,應從頻繁2-項集中剔除。

進一步地,本發(fā)明所述的基于貝葉斯模型的輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法中,所述步驟(1)中,采用apriori算法、aprioritid算法以及apriorihybrid算法的其中之一通過掃描項集i生成頻繁1-項集l1。

進一步地,本發(fā)明所述的基于貝葉斯模型的輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法中,所述步驟(1)中,采用apriori算法、aprioritid算法以及apriorihybrid算法的其中之一通過掃描候選2-項集c2生成頻繁2-項集l2。

進一步地,本發(fā)明所述的基于貝葉斯模型的輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法中,所述步驟(5)中,將關聯(lián)規(guī)則r及其對應的支持度和置信度應用于神經(jīng)網(wǎng)絡預測輸電線路運行狀態(tài)。

更進一步地,上述基于貝葉斯模型的輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法中,所述神經(jīng)網(wǎng)絡為小波神經(jīng)網(wǎng)絡。

小波神經(jīng)網(wǎng)絡是神經(jīng)網(wǎng)絡與小波分析兩者技術相結合的產(chǎn)物。神經(jīng)網(wǎng)絡是模仿大腦神經(jīng)系統(tǒng)的一個模型,將大量神經(jīng)元相互連接、組合形成的一類自適應非線性動態(tài)系統(tǒng)。小波則是時間-頻率分析領域的新技術。小波神經(jīng)網(wǎng)絡具有時頻域特性,結合神經(jīng)網(wǎng)絡,使用小波函數(shù)替代神經(jīng)網(wǎng)絡隱含層的激勵函數(shù),構成了小波基函數(shù)與整個網(wǎng)絡的連接,小波函數(shù)的多樣性也使得預測不同質(zhì)的數(shù)據(jù)時可以根據(jù)不同的小波特性進行選擇。小波神經(jīng)網(wǎng)絡的平移因子、伸縮因子都能提前確定,避免了網(wǎng)絡陷入局部最小值,整體上也表現(xiàn)出了更強的學習能力、函數(shù)逼近能力、模式分類能力及網(wǎng)絡泛化能力,增加了預測精度。

進一步地,本發(fā)明所述的基于貝葉斯模型的輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法中,所述與輸電線路運行狀態(tài)相關的項集i中的項目包括環(huán)境溫度、線路負荷、風速、耐張段線路平均溫度、耐張段代表檔距弧垂以及耐張段張力中的若干項。

更進一步地,上述基于貝葉斯模型的輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法中,所述與輸電線路運行狀態(tài)相關的項集i中的項目還包括環(huán)境溫度、線路負荷、風速、耐張段線路平均溫度、耐張段代表檔距弧垂以及耐張段張力中的若干項的變化率。

本發(fā)明所述的基于貝葉斯模型的輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法,其優(yōu)點和有益效果包括:

(1)將與輸電線路運行狀態(tài)相關的各參量之間的關聯(lián)規(guī)則應用到輸電線路狀態(tài)預測分析評估中,從而有利于提高預測的精度。

(2)對多系統(tǒng)參數(shù)、環(huán)境參數(shù)的關聯(lián)規(guī)則挖掘,從而提高對輸電線路狀態(tài)預測的準確性。

(3)利用貝葉斯網(wǎng)絡找到所有關聯(lián)規(guī)則,從而避免了頻繁項集維數(shù)增加后仍需要掃描數(shù)據(jù)庫帶來的巨大計算量。

附圖說明

圖1為本發(fā)明所述的基于貝葉斯模型的輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法在一種實施方式下的流程示意圖。

圖2為圖1對應的方法實施例中的環(huán)境溫度數(shù)據(jù)。

圖3為圖1對應的方法實施例中的線路負荷數(shù)據(jù)。

圖4為圖1對應的方法實施例中的風速數(shù)據(jù)。

圖5為圖1對應的方法實施例中的耐張段線路平均溫度數(shù)據(jù)。

圖6為圖1對應的方法實施例中的耐張段代表檔距弧垂數(shù)據(jù)。

圖7為圖1對應的方法實施例中的耐張段張力數(shù)據(jù)。

圖8為圖1對應的方法實施例中的貝葉斯網(wǎng)絡示意圖。

圖9為圖1對應的方法實施例中的耐張段檔距弧垂預測誤差對比數(shù)據(jù)。

圖10為圖1對應的方法實施例中的耐張段線路平均溫度預測誤差對比數(shù)據(jù)。

具體實施方式

下面將結合說明書附圖和具體的實施例對本發(fā)明所述的基于貝葉斯模型的輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法做進一步的詳細說明。

圖1示意了本發(fā)明所述的基于貝葉斯模型的輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法在一種實施方式下的流程。

如圖1所示,該實施方式下的基于貝葉斯模型的輸電線路運行狀態(tài)關聯(lián)規(guī)則挖掘及預測方法,其包括以下步驟:

步驟110:在數(shù)據(jù)庫中,基于與輸電線路運行狀態(tài)相關的項集i生成頻繁1-項集l1,兩兩連接頻繁1-項集l1以生成候選2-項集c2,基于該候選2-項集c2生成頻繁2-項集l2。

該步驟中,項集i中的項目包括環(huán)境溫度i1、線路負荷i2、風速i3、耐張段線路平均溫度i4、耐張段代表檔距弧垂i5以及耐張段張力i6。此外,還包括環(huán)境溫度變化率i7、線路負荷變化率i8、風速變化率i9、耐張段線路平均溫度變化率i10、耐張段代表檔距弧垂變化率i11以及耐張段張力變化率i12。上述變化率為單位時間內(nèi)的變化率,本實施例中單位時間為h(小時)。上述項目i1-i6具體數(shù)據(jù)分別如圖2-圖7所示,包括某500kv輸電線路運行的1118個數(shù)據(jù)點。

該步驟中,采用apriori算法通過多次掃描數(shù)據(jù)庫來發(fā)現(xiàn)所有頻繁項集。設定最小支持度為0.35。在第一次掃描中,掃描項集i,計算所有單個項目的支持度,取其中支持度不小于最小支持度的項集構成頻繁1-項集l1。在第二次掃描中,再次遍歷數(shù)據(jù)庫,計算候選2-項集c2中各元素的支持度,取其中支持度不小于最小支持度的項集構造頻繁2-項集l2。

上述計算支持度的方法為:以項集x為例按下式計算其支持度support(x):

support(x)=x.count/|db|

其中,支持項集x的事務數(shù)稱作項集x的支持數(shù),記為x.count,|db|為事務數(shù)據(jù)庫的總數(shù)。

步驟120:在數(shù)據(jù)庫中,篩選頻繁2-項集l2。

該步驟中,篩選頻繁2-項集l2的方法是:當項集x、y存在以下關系

support(x∪y)≈support(x)·support(y)(6)

則認為項集x、y是相互獨立的,關聯(lián)規(guī)則并沒有意義,應從頻繁2-項集中剔除。

步驟130:基于頻繁2-項集l2構造貝葉斯網(wǎng)絡。

該步驟中,以步驟120篩選之后的頻繁2-項集l2為基礎,以頻繁2-項集l2的項目為節(jié)點,l2為邊,構成貝葉斯網(wǎng)絡。該貝葉斯網(wǎng)絡如圖8所示。

步驟140:根據(jù)圖8所示貝葉斯網(wǎng)絡生成關聯(lián)規(guī)則r。

該步驟中,關聯(lián)規(guī)則r表示為

步驟150:計算所述關聯(lián)規(guī)則r對應的支持度和置信度,得到關聯(lián)規(guī)則r的強關聯(lián)規(guī)則。

該步驟中,對于關聯(lián)規(guī)則r,記x為前項,y為后項,則關聯(lián)規(guī)則r的置信度confidence(r)的計算方法為:

confidence(r)=support(x∪y)/support(x)

若confidence(r)大于最小置信度(本實施例中設定最小置信度為0.7),則判定為關聯(lián)規(guī)則r的強關聯(lián)規(guī)則。

本實施例中,風速i3、風速變化率i9與耐張段代表檔距弧垂i5之間,環(huán)境溫度i1、線路負荷i2與耐張段線路平均溫度i4之間存在強關聯(lián)性,為關聯(lián)規(guī)則r的強關聯(lián)規(guī)則,如表1所示。

表1.關聯(lián)規(guī)則r的強關聯(lián)規(guī)則

步驟160:結合上述關聯(lián)規(guī)則r的強關聯(lián)規(guī)則及其對應的置信度預測輸電線路運行狀態(tài)。

該步驟中,將關聯(lián)規(guī)則r及其對應的支持度和置信度應用于小波神經(jīng)網(wǎng)絡預測輸電線路運行狀態(tài)。

分別將風速i3、風速變化率i9、耐張段代表檔距弧垂i5作為小波神經(jīng)網(wǎng)絡輸入,耐張段代表檔距弧垂i5作為神經(jīng)網(wǎng)絡輸出,分別將環(huán)境溫度i1、線路負荷i2和耐張段線路平均溫度i4作為神經(jīng)網(wǎng)絡輸入,耐張段線路平均溫度i4作為輸出,加入得到的關聯(lián)規(guī)則概率(即置信度)矩陣為神經(jīng)網(wǎng)絡隱含層,取前1000點作為網(wǎng)絡訓練數(shù)據(jù),并預測未來4天共計96個數(shù)據(jù)點耐張段代表檔距弧垂i5與耐張段線路平均溫度i4,神經(jīng)網(wǎng)絡每12個小時即12數(shù)據(jù)點更新一次,并計算其相對誤差。

圖9顯示了耐張段代表檔距弧垂i5預測誤差對比數(shù)據(jù),圖10顯示了耐張段線路平均溫度i4預測誤差對比數(shù)據(jù)。

如圖9所示,使用歷史數(shù)據(jù)采取神經(jīng)網(wǎng)絡預測耐張段代表檔距弧垂i5得到的預測誤差b在7.8%至16%之間,而引入關聯(lián)規(guī)則后,預測耐張段代表檔距弧垂i5得到的預測誤差a下降到1.5%-10.3%之間。同樣,如圖10所示,引入關聯(lián)規(guī)則后的耐張段線路平均溫度i4的預測結果c與使用歷史數(shù)據(jù)采取神經(jīng)網(wǎng)絡預測耐張段線路平均溫度i4得到的預測誤差d相比有明顯降低,最大相對誤差不超過13%。因此,引入關聯(lián)規(guī)則顯著地提高了預測精度,驗證了關聯(lián)規(guī)則挖掘在輸電線路運行狀態(tài)預測上的有效性。

要注意的是,以上列舉的僅為本發(fā)明的具體實施例,顯然本發(fā)明不限于以上實施例,隨之有著許多的類似變化。本領域的技術人員如果從本發(fā)明公開的內(nèi)容直接導出或聯(lián)想到的所有變形,均應屬于本發(fā)明的保護范圍。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1