本發(fā)明屬于配電網(wǎng)故障恢復(fù),具體涉及一種基于深度強(qiáng)化學(xué)習(xí)的配電網(wǎng)故障恢復(fù)方法。
背景技術(shù):
1、近年來(lái),人們對(duì)于能源尤其是電力能源的需求日益增長(zhǎng),一次能源的短缺以及其燃燒造成的環(huán)境問(wèn)題越發(fā)引起公眾的廣泛關(guān)注。隨著分布式電源(distributedgeneration,dg)并網(wǎng)比例的逐漸增加,改變了傳統(tǒng)配電網(wǎng)的初始拓?fù)浣Y(jié)構(gòu),對(duì)配電網(wǎng)產(chǎn)生了一定程度的影響。配電網(wǎng)處于電力系統(tǒng)末端,是直接面向用戶的關(guān)鍵環(huán)節(jié),承擔(dān)著向用戶負(fù)荷供配電的重要責(zé)任。不僅需要保障正常狀態(tài)下的穩(wěn)定運(yùn)行,更應(yīng)該在發(fā)生故障時(shí)具有較強(qiáng)的應(yīng)對(duì)能力。電力保供事關(guān)國(guó)計(jì)民生,故障恢復(fù)是保障供電的重要支撐之一。因此,配電網(wǎng)故障恢復(fù)研究具有十分重要的意義。
2、配電網(wǎng)具有“閉環(huán)設(shè)計(jì),開(kāi)環(huán)運(yùn)行”的特點(diǎn),網(wǎng)絡(luò)重構(gòu)是配電網(wǎng)故障恢復(fù)的重要手段。在配電網(wǎng)正常運(yùn)行時(shí),分段開(kāi)關(guān)閉合而聯(lián)絡(luò)開(kāi)關(guān)斷開(kāi),以保持輻射狀結(jié)構(gòu)。配電網(wǎng)出現(xiàn)故障時(shí),立即斷開(kāi)故障兩端分段開(kāi)關(guān)以隔離故障,再將故障下游的非故障失電負(fù)荷轉(zhuǎn)到其他線路進(jìn)行短時(shí)應(yīng)急供電,減小失電損失并防止故障擴(kuò)散,實(shí)現(xiàn)配電網(wǎng)故障恢復(fù)。
3、在配電網(wǎng)故障恢復(fù)的研究中已對(duì)不同類型的算法進(jìn)行了應(yīng)用,主要有傳統(tǒng)數(shù)學(xué)規(guī)劃算法、啟發(fā)式算法和深度強(qiáng)化學(xué)習(xí)算法。數(shù)學(xué)規(guī)劃算法和啟發(fā)式算法針對(duì)大規(guī)模的配電網(wǎng)對(duì)象時(shí),對(duì)硬件計(jì)算能力的要求較高,且耗費(fèi)時(shí)間過(guò)長(zhǎng),很難滿足故障恢復(fù)的實(shí)時(shí)性要求。深度強(qiáng)化學(xué)習(xí)方法可以提前進(jìn)行離線訓(xùn)練得到學(xué)習(xí)好的網(wǎng)絡(luò)模型,在恢復(fù)時(shí)可直接調(diào)用模型進(jìn)行快速?zèng)Q策,相對(duì)于傳統(tǒng)方法在求解效率上有很大提升。隨著配電網(wǎng)絡(luò)規(guī)模擴(kuò)大,dg大量并網(wǎng),深度強(qiáng)化學(xué)習(xí)方法能夠更好地適應(yīng)故障恢復(fù)需求。因此,研究基于深度強(qiáng)化學(xué)習(xí)的配電網(wǎng)故障恢復(fù)策略具有重要的理論和現(xiàn)實(shí)意義。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于深度強(qiáng)化學(xué)習(xí)的配電網(wǎng)故障恢復(fù)方法,其可以解決含分布式電源的配電網(wǎng)在出現(xiàn)線路故障的情況下,無(wú)法快速有效進(jìn)行負(fù)荷恢復(fù)的問(wèn)題,提高了配電網(wǎng)故障恢復(fù)的效率,同時(shí)可以保障潮流的安全性。
2、為實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
3、本發(fā)明提出了一種基于深度強(qiáng)化學(xué)習(xí)的配電網(wǎng)故障恢復(fù)方法,該方法,包括以下步驟:
4、步驟1、基于含分布式電源的配電網(wǎng)系統(tǒng),構(gòu)造目標(biāo)函數(shù)和約束條件,建立配電網(wǎng)故障恢復(fù)模型;
5、步驟2、設(shè)計(jì)基于環(huán)路-開(kāi)關(guān)編碼的動(dòng)作空間,并基于輻射狀約束進(jìn)行不可行解篩選;
6、步驟3、搭建配電網(wǎng)故障恢復(fù)的強(qiáng)化學(xué)習(xí)框架,提出基于近端策略優(yōu)化算法的故障恢復(fù)策略,對(duì)智能體進(jìn)行訓(xùn)練,并將訓(xùn)練好的決策網(wǎng)絡(luò)應(yīng)用于配電網(wǎng)故障恢復(fù),可根據(jù)系統(tǒng)狀態(tài)進(jìn)行開(kāi)關(guān)通斷選擇,實(shí)現(xiàn)負(fù)荷轉(zhuǎn)供及潮流優(yōu)化。
7、另外,根據(jù)本發(fā)明上述實(shí)施例的一種基于深度強(qiáng)化學(xué)習(xí)的配電網(wǎng)故障恢復(fù)方法,還可以具有如下附加的技術(shù)特征:
8、在本發(fā)明的一些實(shí)施例中,所述步驟1中,配電網(wǎng)故障恢復(fù)模型的參數(shù)包括節(jié)點(diǎn)參數(shù)、支路參數(shù)、分布式電源參數(shù),應(yīng)用強(qiáng)化學(xué)習(xí)進(jìn)行配電網(wǎng)故障恢復(fù),需要構(gòu)建包含負(fù)荷需求數(shù)據(jù)、分布式新能源出力數(shù)據(jù)和故障線路數(shù)據(jù)的訓(xùn)練集、驗(yàn)證集和測(cè)試集。
9、在本發(fā)明的一些實(shí)施例中,所述步驟1中,配電網(wǎng)系統(tǒng)模型采用ieee33節(jié)點(diǎn)配電網(wǎng)模型,該模型提供詳細(xì)的節(jié)點(diǎn)和支路數(shù)據(jù),方便進(jìn)行系統(tǒng)分析和優(yōu)化。同時(shí)為適應(yīng)當(dāng)前配電網(wǎng)的發(fā)展需求和實(shí)際應(yīng)用,在標(biāo)準(zhǔn)模型的基礎(chǔ)上,加入兩臺(tái)風(fēng)電、兩臺(tái)光伏分布式電源,為負(fù)荷恢復(fù)和潮流優(yōu)化提供了更多的支撐手段。
10、分布式發(fā)電能夠充分利用環(huán)境資源且污染極小,有效減少了周圍負(fù)荷對(duì)電網(wǎng)供電的依賴。一方面,在電力系統(tǒng)運(yùn)行過(guò)程中,dg的存在給了系統(tǒng)一定程度的緩沖能力,在用電高峰時(shí)作為備用能源給電網(wǎng)以支撐,減小系統(tǒng)電壓的波動(dòng),尤其在極端情況下可以保障關(guān)鍵負(fù)荷的短時(shí)應(yīng)急供電,提高系統(tǒng)供電可靠性。另一方面,dg分布在負(fù)荷附近,可以直接為附近的用電負(fù)荷進(jìn)行供電,省去了架設(shè)輸電線路和建設(shè)變電站的成本,也使得電能傳輸中的網(wǎng)損明顯減小。
11、在本發(fā)明的一些實(shí)施例中,所述步驟1中,在配電網(wǎng)發(fā)生故障時(shí),在配電網(wǎng)發(fā)生故障時(shí),應(yīng)盡可能使損失最小,將停電對(duì)用戶的影響降到最低。在恢復(fù)過(guò)程中保障節(jié)點(diǎn)電壓、支路潮流等參數(shù)在允許的范圍內(nèi),確保配電網(wǎng)安全穩(wěn)定地恢復(fù)供電。因此,需由此構(gòu)造目標(biāo)函數(shù)和約束條件,建立配電網(wǎng)故障恢復(fù)模型。
12、步驟1.1:建立配電網(wǎng)故障恢復(fù)模型的目標(biāo)函數(shù):
13、min:f=ωblackoutcblackout+ωlosscloss
14、式中,ωblackout為失負(fù)荷對(duì)應(yīng)的權(quán)重系數(shù),ωloss為網(wǎng)損對(duì)應(yīng)的權(quán)重系數(shù);cblackout為失負(fù)荷代價(jià),closs為網(wǎng)損代價(jià)。
15、
16、式中,n為節(jié)點(diǎn)集合;ui為節(jié)點(diǎn)i的接入狀態(tài),為0-1變量,0為未接入,1為接入;piload為節(jié)點(diǎn)i的有功負(fù)荷需求。
17、
18、式中,xij為i-j支路的通斷狀態(tài),為0-1變量,0為斷開(kāi),1為連通;為i-j支路的網(wǎng)損。
19、步驟1.2:建立配電網(wǎng)故障恢復(fù)模型約束條件:
20、所述約束條件主要包括功率平衡約束、線路傳輸功率約束、節(jié)點(diǎn)電壓約束、網(wǎng)絡(luò)輻射狀約束,如下所示:
21、所述功率平衡約束:
22、
23、式中,δpiline、分別為與節(jié)點(diǎn)i連接的線路凈流入節(jié)點(diǎn)i的有功功率和無(wú)功功率,pipv和分別為節(jié)點(diǎn)i處分布式光伏的有功和無(wú)功輸出,piwt和分別為節(jié)點(diǎn)i處風(fēng)電機(jī)組的有功、無(wú)功輸出,piload和為節(jié)點(diǎn)i的有功和無(wú)功負(fù)荷需求。
24、所述線路傳輸功率約束:
25、
26、式中,和分別為流經(jīng)i-j支路的有功功率上、下限;和分別為流經(jīng)i-j支路的無(wú)功功率上、下限;pij、qij分別為流經(jīng)i-j支路的有功功率和無(wú)功功率。
27、所述節(jié)點(diǎn)電壓約束:
28、1-ζ≤ui≤1+ζ
29、式中,ui為節(jié)點(diǎn)i處的電壓標(biāo)幺值,ζ為節(jié)點(diǎn)電壓最大偏差。
30、所述網(wǎng)絡(luò)輻射狀約束:
31、
32、式中,bi,j和bj,i為輔助變量,若j為i的父節(jié)點(diǎn),則bi,j=1,否則bi,j=0,反之,若i為j的父節(jié)點(diǎn),則bj,i=1,否則bj,i=0;ωi為與節(jié)點(diǎn)i連接的節(jié)點(diǎn)集合,rg表示根節(jié)點(diǎn)集合。在輻射狀網(wǎng)絡(luò)中,除根節(jié)點(diǎn)外每個(gè)節(jié)點(diǎn)有且只有一個(gè)父節(jié)點(diǎn),而根節(jié)點(diǎn)沒(méi)有父節(jié)點(diǎn)。
33、在本發(fā)明的一些實(shí)施例中,所述步驟2中,為了減小配電網(wǎng)重構(gòu)的動(dòng)作空間,并篩除部分不可行解,將配電網(wǎng)系統(tǒng)分解成m個(gè)基本環(huán)路,每個(gè)基本環(huán)路包含一個(gè)聯(lián)絡(luò)開(kāi)關(guān)和若干個(gè)分段開(kāi)關(guān),基于基本環(huán)路理論,將基本環(huán)路編號(hào)和開(kāi)關(guān)結(jié)合在一起,構(gòu)建基于環(huán)路-開(kāi)關(guān)編碼的動(dòng)作空間;每個(gè)動(dòng)作包含要決策的基本環(huán)路lp,p=1,2,...,m和環(huán)路內(nèi)斷開(kāi)的開(kāi)關(guān)其中p為基本環(huán)路序號(hào),為基本環(huán)路lp包含的開(kāi)關(guān)集合,q為開(kāi)關(guān)序號(hào),hp為基本環(huán)路lp包含的開(kāi)關(guān)數(shù)量。通過(guò)單步?jīng)Q策實(shí)現(xiàn)重構(gòu)的合環(huán)解環(huán)決策步驟,簡(jiǎn)化了強(qiáng)化學(xué)習(xí)探索的流程;
34、進(jìn)行動(dòng)作選擇時(shí),決策到的基本環(huán)路lp只可以選擇一個(gè)開(kāi)關(guān)斷開(kāi),通過(guò)保存已選動(dòng)作序列進(jìn)行回溯,主要可分為兩種情況:
35、(1)若首次對(duì)基本環(huán)路lp進(jìn)行決策,即已保存的動(dòng)作序列中不包含環(huán)路lp,則先將環(huán)路內(nèi)的聯(lián)絡(luò)開(kāi)關(guān)閉合,然后斷開(kāi)當(dāng)前決策到的開(kāi)關(guān)
36、(2)若非首次對(duì)基本環(huán)路lp決策,即已保存的動(dòng)作序列中包含環(huán)路lp,則需要先將此基本環(huán)路上一次所決策的斷開(kāi)開(kāi)關(guān)重新閉合,再斷開(kāi)當(dāng)前所選開(kāi)關(guān)
37、動(dòng)作空間定義為:
38、
39、這樣操作不需要分兩步進(jìn)行合環(huán)解環(huán)的開(kāi)關(guān)選擇,簡(jiǎn)化了繁瑣的決策步驟,也能屏蔽掉大部分可能造成環(huán)內(nèi)非公共支路上孤島的開(kāi)關(guān)組合方案,提高了決策效率。
40、在本發(fā)明的一些實(shí)施例中,所述步驟2中,配電網(wǎng)可以看作由節(jié)點(diǎn)和支路組成的圖,由圖論可知,樹(shù)是一個(gè)沒(méi)有環(huán)路的連通圖,因此可以將配電網(wǎng)的輻射狀結(jié)構(gòu)與樹(shù)進(jìn)行比較。一個(gè)節(jié)點(diǎn)數(shù)量為n、電源(主網(wǎng)供電電源)數(shù)量為1的配電網(wǎng),若為輻射狀結(jié)構(gòu)需要滿足以下兩個(gè)條件:
41、(1)網(wǎng)絡(luò)是連通的;
42、(2)網(wǎng)絡(luò)中有n-1條閉合的支路。
43、在對(duì)其輻射狀條件進(jìn)行分析時(shí),首先檢測(cè)閉合支路數(shù)量是否滿足,其次還要檢測(cè)其連通性,即不存在孤島。
44、在本發(fā)明的一些實(shí)施例中,所述步驟3中,需要將配電網(wǎng)優(yōu)化重構(gòu)問(wèn)題轉(zhuǎn)化為典型的馬爾可夫決策過(guò)程,其狀態(tài)st、動(dòng)作at、獎(jiǎng)勵(lì)rt定義如下:
45、(1)狀態(tài)st:狀態(tài)需要考慮所有會(huì)對(duì)決策造成影響的因素,對(duì)于配電網(wǎng)故障恢復(fù)問(wèn)題,故障產(chǎn)生時(shí)刻的配電網(wǎng)運(yùn)行狀態(tài)、故障位置信息是關(guān)鍵的分析數(shù)據(jù)。因此,觀測(cè)狀態(tài)st包括配電網(wǎng)的dg出力數(shù)據(jù)、負(fù)荷需求數(shù)據(jù)和線路通斷狀態(tài)數(shù)據(jù),其中線路通斷數(shù)據(jù)隱含了故障線路位置信息。此外,設(shè)置了環(huán)路狀態(tài)標(biāo)志位以區(qū)分負(fù)荷轉(zhuǎn)供和優(yōu)化重構(gòu)兩部分決策,將故障線路歸屬的環(huán)路狀態(tài)置1,作為屏蔽環(huán)路的依據(jù)。
46、
47、其中,ptload、分別為t決策步節(jié)點(diǎn)負(fù)荷有功和無(wú)功需求集合;ptpv、分別為t步光伏有功、無(wú)功功率輸出集合;ptwt、分別為風(fēng)電有功、無(wú)功功率輸出集合;為線路狀態(tài)集合,相比于優(yōu)化重構(gòu)的線路狀態(tài),多了一個(gè)故障線路標(biāo)志位,狀態(tài)0為斷開(kāi),1為閉合,2為故障;為t步的環(huán)路屏蔽掩碼標(biāo)志,位數(shù)與基本環(huán)路個(gè)數(shù)相等,初始狀態(tài)值都為0,當(dāng)選擇到故障所在線路斷開(kāi)時(shí),將其對(duì)應(yīng)的環(huán)路狀態(tài)置1,表示后續(xù)不再對(duì)此環(huán)路進(jìn)行決策。
48、(2)動(dòng)作at:動(dòng)作的定義是基于基本環(huán)路進(jìn)行編碼的,包含決策的環(huán)路和開(kāi)關(guān)編號(hào)。
49、at∈aloop_swi
50、其中,aloop_swi為基于環(huán)路-開(kāi)關(guān)編碼的動(dòng)作空間,每個(gè)動(dòng)作包含了決策的基本環(huán)路和此環(huán)路內(nèi)要斷開(kāi)的開(kāi)關(guān)。
51、(3)獎(jiǎng)勵(lì)rt:訓(xùn)練時(shí)代價(jià)主要包括失負(fù)荷代價(jià)、網(wǎng)損代價(jià)和安全約束代價(jià)三部分,獎(jiǎng)勵(lì)由三部分加權(quán)取反得到。其中,失負(fù)荷代價(jià)和網(wǎng)損代價(jià)即為權(quán)利要求4所述的目標(biāo)函數(shù),安全約束代價(jià)為系統(tǒng)節(jié)點(diǎn)電壓或支路潮流越限懲罰,即電力系統(tǒng)節(jié)點(diǎn)電壓或支路潮流超過(guò)了安全范圍,可表示為:
52、
53、其中,為t步的安全約束代價(jià);ωa為支路潮流越限懲罰系數(shù),ωu為節(jié)點(diǎn)電壓越限懲罰系數(shù);μij,t為支路潮流越限標(biāo)志,為0-1變量,代表i-j支路是否越限,μij,t=1表示支路潮流越限,μij,t=0表示支路潮流未越限;ηi,t為節(jié)點(diǎn)電壓越限標(biāo)志,為0-1變量,代表i節(jié)點(diǎn)是否越限,ηi,t=1表示節(jié)點(diǎn)電壓越限,ηi,t=0表示節(jié)點(diǎn)電壓未越限。
54、因此,獎(jiǎng)勵(lì)rt可以表示為:
55、
56、式中,為t步的失負(fù)荷代價(jià),為t步的網(wǎng)損代價(jià);ωpf為安全約束代價(jià)權(quán)重。
57、在本發(fā)明的一些實(shí)施例中,所述步驟3中,近端策略優(yōu)化算法(proximal?policyoptimization,ppo),是一種基于策略(policy-based)的強(qiáng)化學(xué)習(xí)算法。ppo算法是基于ac架構(gòu)的,從組成上來(lái)看共包含三個(gè)深度神經(jīng)網(wǎng)絡(luò),即actor_old、actor和critic網(wǎng)絡(luò),actor網(wǎng)絡(luò)用于選擇動(dòng)作,輸入系統(tǒng)狀態(tài)信息,輸出當(dāng)前狀態(tài)下動(dòng)作選擇概率,需要訓(xùn)練更新、梯度反向傳播;actor_old網(wǎng)絡(luò)用于存儲(chǔ)更新actor網(wǎng)絡(luò)前的網(wǎng)絡(luò)參數(shù),在優(yōu)化過(guò)程中使用,避免策略更新幅度過(guò)大;critic網(wǎng)絡(luò)用于計(jì)算狀態(tài)價(jià)值,輸入系統(tǒng)狀態(tài)信息,輸出當(dāng)前狀態(tài)的值函數(shù),需要訓(xùn)練更新、梯度反向傳播。
58、在本發(fā)明的一些實(shí)施例中,所述步驟3中,訓(xùn)練方式具體包括以下步驟:
59、步驟3.1初始化actor_old、actor和critic網(wǎng)絡(luò),其中actor_old與actor網(wǎng)絡(luò)結(jié)構(gòu)相同;
60、步驟3.2設(shè)定總迭代次數(shù)為e,當(dāng)前迭代次數(shù)記為epoch,初始化epoch=1,初始化經(jīng)驗(yàn)池;
61、步驟3.3設(shè)定一次迭代最大步數(shù)為t,當(dāng)前動(dòng)作步數(shù)為t,策略更新次數(shù)為m;
62、步驟3.4初始化t=1;
63、步驟3.5讀取源荷數(shù)據(jù)與故障位置數(shù)據(jù),對(duì)狀態(tài)進(jìn)行初始化;
64、步驟3.6在決策時(shí)刻,首先根據(jù)故障位置和環(huán)路掩碼標(biāo)志位,進(jìn)行動(dòng)作篩選,得到可執(zhí)行動(dòng)作集,進(jìn)而選擇可執(zhí)行動(dòng)作;
65、步驟3.7執(zhí)行動(dòng)作at,進(jìn)行潮流計(jì)算,計(jì)算執(zhí)行動(dòng)作后的失負(fù)荷量、網(wǎng)損以及電壓偏差等,從而得到獎(jiǎng)勵(lì)rt;
66、步驟3.8將過(guò)往經(jīng)驗(yàn)序列存儲(chǔ)到經(jīng)驗(yàn)池;
67、步驟3.9若滿足回合數(shù)t<t,則t+1賦值給t,跳轉(zhuǎn)至步驟3.6,否則,表示第epoch次迭代完成;
68、步驟3.10在對(duì)經(jīng)驗(yàn)池?cái)?shù)據(jù)進(jìn)行學(xué)習(xí)時(shí),首先將獲得這一批數(shù)據(jù)的actor網(wǎng)絡(luò)中的參數(shù)復(fù)制給actor_old網(wǎng)絡(luò);
69、步驟3.11首先將這批數(shù)據(jù)的狀態(tài)輸入到critic網(wǎng)絡(luò),得到對(duì)應(yīng)的估計(jì)值函數(shù)。然后,使用獎(jiǎng)勵(lì)和估計(jì)值函數(shù)來(lái)計(jì)算每個(gè)時(shí)間步的目標(biāo)值函數(shù)和優(yōu)勢(shì)函數(shù);
70、步驟3.12利用這批數(shù)據(jù)的優(yōu)勢(shì)函數(shù)和目標(biāo)值函數(shù),計(jì)算ppo的損失函數(shù),對(duì)actor網(wǎng)絡(luò)和critic網(wǎng)絡(luò)的參數(shù)進(jìn)行m次策略梯度更新,清空經(jīng)驗(yàn)池;
71、步驟3.13若滿足迭代次數(shù)epoch<e,則epoch+1賦值給epoch,跳轉(zhuǎn)至步驟3.4,否則,表示迭代完成,網(wǎng)絡(luò)訓(xùn)練結(jié)束。
72、在本發(fā)明的一些實(shí)施例中,所述步驟3.6中,動(dòng)作篩選過(guò)程具體為:在負(fù)荷轉(zhuǎn)供階段,設(shè)置僅可決策故障線路的開(kāi)關(guān)斷開(kāi)。此時(shí),根據(jù)狀態(tài)st中的故障位置信息,將動(dòng)作空間中不包含故障線路開(kāi)關(guān)的動(dòng)作加入mask序列,決策網(wǎng)絡(luò)只會(huì)選擇故障線路開(kāi)關(guān)進(jìn)行斷開(kāi),同時(shí)根據(jù)所選動(dòng)作的環(huán)路信息,閉合故障線路所屬基本環(huán)路的聯(lián)絡(luò)開(kāi)關(guān),并將對(duì)應(yīng)環(huán)路的標(biāo)志位置1,這樣就完成了一次負(fù)荷轉(zhuǎn)供。在完成負(fù)荷轉(zhuǎn)供后,進(jìn)入潮流優(yōu)化階段,此時(shí)根據(jù)狀態(tài)中的信息,得到需要屏蔽的基本環(huán)路,將包含此基本環(huán)路的動(dòng)作加入mask序列,不再對(duì)故障所在環(huán)路進(jìn)行更改。此外,潮流優(yōu)化階段也應(yīng)用了輻射狀約束檢測(cè)篩除不可行解,并進(jìn)行動(dòng)作屏蔽。
73、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
74、(1)本發(fā)明提出了轉(zhuǎn)供-優(yōu)化兩階段故障恢復(fù)策略,在負(fù)荷轉(zhuǎn)供的基礎(chǔ)上,進(jìn)一步優(yōu)化了系統(tǒng)潮流分布,避免了僅負(fù)荷轉(zhuǎn)供可能造成的潮流越限問(wèn)題,保證故障恢復(fù)后系統(tǒng)安全、穩(wěn)定地進(jìn)行供電。
75、(2)本發(fā)明更好地適應(yīng)含dg配電網(wǎng)的故障恢復(fù),相比于數(shù)學(xué)規(guī)劃和啟發(fā)式算法等傳統(tǒng)優(yōu)化方法,在處理大規(guī)模配電網(wǎng)故障恢復(fù)問(wèn)題時(shí)效率較低的情況,采用基于ppo的故障恢復(fù)算法有效提高了決策求解速度,滿足問(wèn)題的實(shí)時(shí)性要求。
76、(3)本發(fā)明對(duì)動(dòng)作集做出了一定改進(jìn),基于環(huán)路-開(kāi)關(guān)的編碼方式,簡(jiǎn)化了重構(gòu)時(shí)合環(huán)解環(huán)操作決策的繁瑣步驟,又通過(guò)不可行解篩選和動(dòng)作掩碼方式,進(jìn)一步縮減了動(dòng)作空間,在實(shí)現(xiàn)配電網(wǎng)故障恢復(fù)目標(biāo)的同時(shí),有效提升了算法的訓(xùn)練效率。