1.一種基于深度強(qiáng)化學(xué)習(xí)的配電網(wǎng)故障恢復(fù)方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的配電網(wǎng)故障恢復(fù)方法,其特征在于:所述步驟1中配電網(wǎng)故障恢復(fù)模型的參數(shù)包括節(jié)點(diǎn)參數(shù)、支路參數(shù)、分布式電源參數(shù),應(yīng)用強(qiáng)化學(xué)習(xí)進(jìn)行配電網(wǎng)故障恢復(fù),需要構(gòu)建包含負(fù)荷需求數(shù)據(jù)、分布式新能源出力數(shù)據(jù)和故障線路數(shù)據(jù)的訓(xùn)練集、驗(yàn)證集和測(cè)試集。
3.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的配電網(wǎng)故障恢復(fù)方法,其特征在于:所述步驟1中采用ieee33節(jié)點(diǎn)配電網(wǎng)系統(tǒng)模型,該模型提供詳細(xì)的節(jié)點(diǎn)和支路數(shù)據(jù),方便進(jìn)行系統(tǒng)分析與優(yōu)化;同時(shí)為適應(yīng)當(dāng)前配電網(wǎng)的發(fā)展需求與實(shí)際應(yīng)用,在標(biāo)準(zhǔn)模型的基礎(chǔ)上,加入兩臺(tái)風(fēng)電、兩臺(tái)光伏分布式電源,為負(fù)荷恢復(fù)和潮流優(yōu)化提供了更多的支撐手段。
4.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的配電網(wǎng)故障恢復(fù)方法,其特征在于,所述步驟1中:
5.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的配電網(wǎng)故障恢復(fù)方法,其特征在于,所述步驟2中基于環(huán)路-開(kāi)關(guān)編碼的動(dòng)作空間設(shè)計(jì)如下:
6.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的配電網(wǎng)故障恢復(fù)方法,其特征在于,所述步驟2中基于輻射狀約束的不可行解篩選:配電網(wǎng)優(yōu)化重構(gòu)模型一個(gè)基本的約束條件為配電網(wǎng)應(yīng)該時(shí)刻保持開(kāi)環(huán)運(yùn)行的狀態(tài),即維持輻射狀網(wǎng)絡(luò)結(jié)構(gòu),因此,智能體進(jìn)行決策后,需要檢測(cè)所選動(dòng)作是否違反了此約束;
7.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的配電網(wǎng)故障恢復(fù)方法,其特征在于,所述步驟3中:
8.根據(jù)權(quán)利要求1所述的一種基于深度強(qiáng)化學(xué)習(xí)的配電網(wǎng)故障恢復(fù)方法,其特征在于,所述步驟3中,近端策略?xún)?yōu)化算法的訓(xùn)練方式具體包括以下步驟:
9.根據(jù)權(quán)利要求8所述的一種基于深度強(qiáng)化學(xué)習(xí)的配電網(wǎng)故障恢復(fù)方法,其特征在于,所述步驟3.6中: