一種基于多智能體的源荷雙側(cè)儲能協(xié)同調(diào)度方法

文檔序號：40387621發(fā)布日期：2024-12-20 12:10閱讀：5來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及電力調(diào)度，具體為一種基于多智能體的源荷雙側(cè)儲能協(xié)同調(diào)度方法。

背景技術(shù)：

1、隨著新型電力系統(tǒng)（下稱系統(tǒng)）建設(shè)的快速推進，新能源發(fā)電比例迅速提升，但其不確定性對系統(tǒng)運行構(gòu)成了巨大挑戰(zhàn)。儲能憑借其高度靈活性支持新能源的消納，增強了電力系統(tǒng)的調(diào)節(jié)能力。然而，由于儲能資源分布不均、調(diào)用方式單一，部分儲能未能得到充分利用，導(dǎo)致資源浪費。在電力系統(tǒng)中，源荷雙側(cè)均建有儲能設(shè)備。電源側(cè)受儲能容量限制存在新能源消納不足的現(xiàn)象，使得系統(tǒng)運行性能有限。

2、另一方面，用戶側(cè)供應(yīng)商整合分布式和集中式儲能后通過對外出租共享從而獲利，未出租部分儲能可以利用電價差進行充放電套利。但該模式的充放電策略比較單一，所獲收益較低，無法最大化儲能效率。

技術(shù)實現(xiàn)思路

1、為解決現(xiàn)有技術(shù)中存在的上述技術(shù)問題，本發(fā)明提供了一種基于多智能體的源荷雙側(cè)儲能協(xié)同調(diào)度方法，具體技術(shù)方案包括以下步驟：

2、步驟s1：基于多智能體的源荷雙側(cè)儲能系統(tǒng)構(gòu)建目標(biāo)函數(shù)，并設(shè)置約束條件；

3、步驟s2：基于目標(biāo)函數(shù)及約束條件，構(gòu)建馬爾可夫決策模型；

4、步驟s3：基于馬爾可夫決策模型，對每一個馬爾科夫決策周期，獲取源荷雙側(cè)儲能系統(tǒng)對應(yīng)的狀態(tài)空間；

5、步驟s4：將狀態(tài)空間代入馬爾可夫決策模型進行q值擬合，得到對應(yīng)的動作空間并執(zhí)行。

6、優(yōu)選地，步驟s1具體包括：

7、步驟s11：以棄風(fēng)量最小以及儲能利用率最大為目標(biāo)構(gòu)建目標(biāo)函數(shù)，公式如下：

8、；

9、式中，為調(diào)度時段序數(shù)，為單日總調(diào)度時段數(shù)，為棄風(fēng)懲罰系數(shù)，為時段內(nèi)新能源機組的實際出力，為時段內(nèi)新能源機組的最大可調(diào)用出力，為儲能的臺序數(shù)，為第臺儲能時段內(nèi)的實際功率，為第臺儲能時段內(nèi)的功率最大值；

10、步驟s12：設(shè)置約束條件，公式如下：

11、；

12、；

13、；

14、式中，為時段內(nèi)發(fā)電機組注入節(jié)點的有功功率，為時段內(nèi)儲能注入節(jié)點的有功功率，為時段內(nèi)節(jié)點的有功功率，、分別為時段內(nèi)節(jié)點、節(jié)點的電壓，、分別為節(jié)點導(dǎo)納矩陣的實部、虛部，為時段內(nèi)線路上的電壓相角差，為發(fā)電機組的臺序數(shù)，為時段內(nèi)第臺發(fā)電機組有功功率的出力值，、分別為第臺發(fā)電機組有功功率的最小出力值、最大出力值，為時段內(nèi)時段第臺發(fā)電機組無功功率的出力值，、分別為第臺發(fā)電機組無功功率的最小出力值、最大出力值，為第臺儲能時段內(nèi)的功率最小值。

15、優(yōu)選地，步驟s2具體包括：基于目標(biāo)函數(shù)及約束條件，構(gòu)建馬爾可夫決策模型（，，，，）；其中，

16、為狀態(tài)空間，公式如下：

17、；

18、式中，為功率信息，為電網(wǎng)電壓，為儲能的荷電狀態(tài)，為時間；

19、為動作空間，公式如下：

20、；

21、式中，為共享儲能的充放電功率，為廠站儲能的充放電功率；

22、為狀態(tài)轉(zhuǎn)移概率；為獎勵函數(shù)，具體為，公式如下：

23、；

24、式中，為時段內(nèi)智能體與環(huán)境交互獲得的獎勵，為越限動作懲罰；

25、為折扣因子，0≦≦1；

26、對每一個馬爾科夫決策周期，獲取對應(yīng)的狀態(tài)空間；

27、將狀態(tài)空間代入馬爾可夫決策模型進行q值擬合，得到對應(yīng)的動作空間并執(zhí)行。

28、優(yōu)選地，步驟s4具體為：

29、在actor-critic框架中，將注意力網(wǎng)絡(luò)引入critic網(wǎng)絡(luò)，并通過maan-td3算法（multi-agent?attention?noisy?twin?delayed?deep?deterministic?policy?gradient，多智能體含噪注意力雙延遲策略梯度算法）擬合q值；

30、步驟s41：將全局的狀態(tài)動作對（ s， a）輸入多層感知機，按智能體順序堆疊向量后得到向量；其中， s∈， a∈；

31、步驟s42：將向量輸入多頭注意力網(wǎng)絡(luò)提取特征，得到特征輸出；

32、步驟s43：層歸一化處理特征輸出，得到結(jié)果 x；將結(jié)果 x輸入殘差網(wǎng)絡(luò)結(jié)合向量，再輸入全連接層，并將全連接層的輸出 out作為q值。

33、進一步，步驟s41之前，還包括：為狀態(tài) s添加隨機噪聲擾動，構(gòu)成探索狀態(tài)，公式如下：

34、?。

35、進一步，使用神經(jīng)網(wǎng)絡(luò)參數(shù)化actor網(wǎng)絡(luò)，并通過梯度下降法更新actor網(wǎng)絡(luò)。

36、優(yōu)選地，殘差網(wǎng)絡(luò)為bellman殘差網(wǎng)絡(luò)。

37、優(yōu)選地，通過最小化損失函數(shù)更新critic網(wǎng)絡(luò)的參數(shù)，公式如下：

38、；

39、；

40、式中，為網(wǎng)絡(luò)參數(shù)，為第個智能體的critic網(wǎng)絡(luò)的損失函數(shù)，為經(jīng)驗池中儲存的第二觀測數(shù)據(jù)，為對應(yīng)的獎勵值，為更新后儲存的第二觀測數(shù)據(jù)，為損失函數(shù)的期望值，為價值函數(shù)的目標(biāo)策略，表示第個智能體的actor網(wǎng)絡(luò)得到的q值，為目標(biāo)q值，為第個智能體獲得的獎勵值，為更新后價值函數(shù)的目標(biāo)策略，表示更新actor網(wǎng)絡(luò)得到的q值，為智能體的數(shù)量，為第個智能體對應(yīng)的動作，為更新后第個智能體對應(yīng)的動作，為第個智能體的觀測；其中，＝1，2，…，。

41、與現(xiàn)有技術(shù)相比，本發(fā)明的有益效果：本發(fā)明所提供的技術(shù)方案可通過協(xié)同調(diào)度源荷雙側(cè)儲能提升儲能的利用效率、電源側(cè)的新能源消納能力和系統(tǒng)運行性能。另一方面，可在棄風(fēng)量減少的基礎(chǔ)上提升整體經(jīng)濟效益。

技術(shù)特征：

1.一種基于多智能體的源荷雙側(cè)儲能協(xié)同調(diào)度方法，其特征在于，包括以下步驟：

2.如權(quán)利要求1所述的一種基于多智能體的源荷雙側(cè)儲能協(xié)同調(diào)度方法，其特征在于，步驟s1具體包括：

3.如權(quán)利要求2所述的一種基于多智能體的源荷雙側(cè)儲能協(xié)同調(diào)度方法，其特征在于，步驟s2具體包括：基于目標(biāo)函數(shù)及約束條件，構(gòu)建馬爾可夫決策模型（，，，，）；其中，

4.如權(quán)利要求1所述的一種基于多智能體的源荷雙側(cè)儲能協(xié)同調(diào)度方法，其特征在于，步驟s4具體為：

5.如權(quán)利要求4所述的一種基于多智能體的源荷雙側(cè)儲能協(xié)同調(diào)度方法，其特征在于，步驟s41之前，還包括：為狀態(tài)s添加隨機噪聲擾動，構(gòu)成探索狀態(tài)，公式如下：

6.如權(quán)利要求4所述的一種基于多智能體的源荷雙側(cè)儲能協(xié)同調(diào)度方法，其特征在于，使用神經(jīng)網(wǎng)絡(luò)參數(shù)化actor網(wǎng)絡(luò)，并通過梯度下降法更新actor網(wǎng)絡(luò)。

7.如權(quán)利要求4所述的一種基于多智能體的源荷雙側(cè)儲能協(xié)同調(diào)度方法，其特征在于，殘差網(wǎng)絡(luò)為bellman殘差網(wǎng)絡(luò)。

8.如權(quán)利要求4所述的一種基于多智能體的源荷雙側(cè)儲能協(xié)同調(diào)度方法，其特征在于，還包括，通過最小化損失函數(shù)更新critic網(wǎng)絡(luò)的參數(shù)，公式如下：

技術(shù)總結(jié)
本發(fā)明涉及電力調(diào)度技術(shù)領(lǐng)域，公開了一種基于多智能體的源荷雙側(cè)儲能協(xié)同調(diào)度方法。該方法包括：基于多智能體的源荷雙側(cè)儲能系統(tǒng)構(gòu)建目標(biāo)函數(shù)和約束條件；根據(jù)目標(biāo)函數(shù)和約束條件構(gòu)建馬爾可夫決策模型，并引入注意力機制，通過MAAN?TD3算法求解馬爾可夫決策模型，得到源荷雙側(cè)儲能系統(tǒng)對應(yīng)的動作空間并執(zhí)行。該方法可通過協(xié)同調(diào)度荷源雙側(cè)儲能提升儲能的利用效率、電源側(cè)的新能源消納能力和系統(tǒng)運行性能。另一方面，可在棄風(fēng)量減少的基礎(chǔ)上提升整體經(jīng)濟效益。

技術(shù)研發(fā)人員：陳實,朱鈺杰,劉藝洪,唐國登,王舒灝,陳江平,晏紅平
受保護的技術(shù)使用者：四川大學(xué)
技術(shù)研發(fā)日：
技術(shù)公布日：2024/12/19

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：陳實,朱鈺杰,劉藝洪,唐國登,王舒灝,陳江平,晏紅平
技術(shù)所有人：四川大學(xué)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于多智能體的源荷雙側(cè)儲能協(xié)同調(diào)度方法