本發(fā)明屬于多能互補微網(wǎng)技術(shù)領(lǐng)域,涉及多能互補微網(wǎng)實時調(diào)度方法,尤其是一種基于Rollout算法的多能互補微網(wǎng)實時調(diào)度方法。
背景技術(shù):
隨著智能電網(wǎng)技術(shù)的發(fā)展,含新能源和儲能的多能互補微網(wǎng)系統(tǒng)引起了研究人員廣泛的關(guān)注。作為能夠?qū)崿F(xiàn)自我控制、保護和管理的自治系統(tǒng),多能互補微網(wǎng)可以促進分布式能源的就地消納,以一種更加經(jīng)濟友好的方式,實現(xiàn)對負荷多種能源形式的高可靠供給,使傳統(tǒng)電網(wǎng)向智能電網(wǎng)過渡。
新能源出力的波動性和間歇性給多能互補微網(wǎng)的實時調(diào)度帶來了很大的挑戰(zhàn),并且由于實時調(diào)度是一個滾動時域過程,當前調(diào)度區(qū)間內(nèi)的控制行為不僅對當前周期產(chǎn)生影響,還會影響到下一個調(diào)度區(qū)間的狀態(tài)。馬爾科夫決策模型為解決這種包含不確定性變量的滾動調(diào)度問題提供了一種好的思路,但是大量的變量數(shù)目帶來了維數(shù)災(zāi)難,模型的求解成為難題,如何找到一個行之有效的方法解決上述難題成為實時調(diào)度的關(guān)鍵。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種設(shè)計合理、簡易可行、實用性強且高效快速的基于Rollout算法的多能互補微網(wǎng)實時調(diào)度方法。
本發(fā)明解決其技術(shù)問題是采取以下技術(shù)方案實現(xiàn)的:
一種基于Rollout算法的多能互補微網(wǎng)實時調(diào)度方法,包括以下步驟:
步驟1、建立包含新能源出力隨機性的多能互補微網(wǎng)實時調(diào)度的滾動時域馬爾科夫決策過程模型,確立實時調(diào)度的約束條件;
步驟2、以滾動時域馬爾科夫決策周期內(nèi)微網(wǎng)系統(tǒng)的運行費用最低為目標,確立包含新能源出力隨機性的多能互補微網(wǎng)實時調(diào)度的滾動時域馬爾科夫決策過程模型的實時調(diào)度的目標函數(shù);
步驟3、將單個完整調(diào)度周期劃分成若干個調(diào)度區(qū)間,基于貪心算法得到滿足實時調(diào)度約束條件的一個基礎(chǔ)可行解;
步驟4、基于步驟3所述的基礎(chǔ)可行解,運用Rollout算法求解該多能互補微網(wǎng)實時調(diào)度的滾動時域馬爾科夫決策過程模型。
而且,所述步驟1的確立實時調(diào)度的約束條件包括:微網(wǎng)的電平衡約束、蓄電池的運行約束、微網(wǎng)與主網(wǎng)的交易電功率約束和熱電聯(lián)產(chǎn)設(shè)備的電功率出力約束;
所述微網(wǎng)的電平衡約束如下:
上式中,t是時間參數(shù);pG(t)是t時刻微網(wǎng)與主網(wǎng)的交換電功率,向主網(wǎng)購電為正,向主網(wǎng)售電為負;N是熱電聯(lián)產(chǎn)設(shè)備的數(shù)目;是t時刻第i臺熱電聯(lián)產(chǎn)設(shè)備輸出電功率;pB(t)是t時刻蓄電池的充放電功率,充電為負,放電為正;pw(t)是t時刻風(fēng)電發(fā)電出力;pD(t)是t時刻的電負荷需求;
所述蓄電池的運行約束如下:
上式中,E(t)與E(t+1)分別是t時刻和t+1時刻蓄電池的儲能水平;E與分別是蓄電池容量的下邊界和上邊界;ΔT是從t時刻至t+1時刻的時間間隔;αc與αd分別為蓄電池的充放電效率;pB(t)是t時刻蓄電池的充放電功率,充電為負,放電為正;為蓄電池充放電功率的上限值;
所述微網(wǎng)與主網(wǎng)的交易電功率約束如下:
上式中,pG(t)與pG(t-1)分別是t時刻和t-1微網(wǎng)與主網(wǎng)的交換電功率,向主網(wǎng)購電為正,向主網(wǎng)售電為負;為微網(wǎng)與主網(wǎng)的交換電功率的上限值,δ是微網(wǎng)與主網(wǎng)的交換電功率的波動上限;
所述熱電聯(lián)產(chǎn)設(shè)備的電功率出力約束如下:
上式中,是t時刻第i臺熱電聯(lián)產(chǎn)設(shè)備輸出電功率;是第i臺熱電聯(lián)產(chǎn)設(shè)備輸出電功率的上限;Hi(t)是t時刻需要由第i臺熱電聯(lián)產(chǎn)設(shè)備供給的熱功率;vi與分別是第i臺熱電聯(lián)產(chǎn)設(shè)備電、熱功率轉(zhuǎn)換效率的下限和上限。
而且,所述步驟2的確立包含新能源出力隨機性的多能互補微網(wǎng)實時調(diào)度的滾動時域馬爾科夫決策過程模型的實時調(diào)度的目標函數(shù)的具體方法為:首先以微網(wǎng)系統(tǒng)在單個調(diào)度區(qū)間內(nèi)的運行費用最低為目標,建立微網(wǎng)系統(tǒng)在單個調(diào)度區(qū)間內(nèi)的運行費用函數(shù),然后以微網(wǎng)系統(tǒng)在滾動時域馬爾科夫決策周期內(nèi)的運行費用最低為目標,確立實時調(diào)度的目標函數(shù);
所述微網(wǎng)系統(tǒng)在單個調(diào)度區(qū)間內(nèi)的運行費用函數(shù)如下:
其中,
上式中,X(t)是t時刻微網(wǎng)系統(tǒng)的狀態(tài)變量;A(t)是t時刻微網(wǎng)系統(tǒng)的控制變量;ct(X(t),A(t))是單個調(diào)度區(qū)間內(nèi)系統(tǒng)運行費用的函數(shù);λ(t)是t時刻電網(wǎng)電價;c是天然氣的價格;Fic(t)是第i臺熱電聯(lián)產(chǎn)設(shè)備耗氣量與電出力之間的線性函數(shù);ai與bi第i臺熱電聯(lián)產(chǎn)設(shè)備耗氣量與電出力之間的線性函數(shù)的系數(shù);
所述實時調(diào)度的目標函數(shù)如下:
上式中,Jt(X(t),A(t))為滾動時域馬爾科夫決策周期內(nèi)微網(wǎng)系統(tǒng)的運行費用的函數(shù);
而且,所述步驟3的具體方法為:將一個完整調(diào)度周期劃分成若干個調(diào)度區(qū)間,基于貪心算法分別針對每個調(diào)度區(qū)間內(nèi)的優(yōu)化調(diào)度問題進行求解,最后把每個調(diào)度區(qū)間的局部最優(yōu)解合成為整個調(diào)度區(qū)間上的一個基礎(chǔ)可行解。
而且,所述步驟3的基于貪心算法分別針對每個調(diào)度區(qū)間內(nèi)的優(yōu)化調(diào)度問題進行求解的具體步驟包括:
(1)根據(jù)步驟2所述的微網(wǎng)系統(tǒng)在單個調(diào)度區(qū)間內(nèi)的運行費用函數(shù),列出目標函數(shù)和約束條件如下:
約束條件如下:
其中:
上式中,pb(t)與分別是構(gòu)建基礎(chǔ)可行解的過程中蓄電池充放電功率的新的下限和上限;pg(t)與分別是構(gòu)建基礎(chǔ)可行解的過程中微網(wǎng)與主網(wǎng)交換功率的新的下限和上限;pci(t)與分別是構(gòu)建基礎(chǔ)可行解的過程中第i臺熱電聯(lián)產(chǎn)設(shè)備電出力的新的下限和上限;
(2)為了得到在一個調(diào)度區(qū)間內(nèi)的優(yōu)化結(jié)果,將上述目標函數(shù)的N+2個系數(shù)按從小到大的順序進行排列,得到各個決策變量調(diào)度順序,其中N+2個系數(shù)即為λ(t)·ΔT,0,c·ai(i=1,2,…,N),出現(xiàn)系數(shù)0是因為目標函數(shù)中不包含pB(t);再令負荷差值d(t)=pD(t)-pw(t);根據(jù)d(t)的值和各個決策變量的調(diào)度順序即可求得最終的優(yōu)化結(jié)果;
(3)對其他調(diào)度區(qū)間依次求解,最后得到滿足微網(wǎng)運行需求的一個基礎(chǔ)可行解。
而且,所述步驟4的具體方法為:
(1)設(shè)步驟3求得的基礎(chǔ)可行解為πb=(Ab,t+1,Ab,t+2,…,Ab,t+T-1),則得到一個實時調(diào)度從t到t+T-1時刻運行費用最低這個目標函數(shù)的近似值:
上式中,為用Rollout算法求得的微網(wǎng)系統(tǒng)在滾動時域馬爾科夫決策周期內(nèi)微網(wǎng)系統(tǒng)的運行費用的函數(shù)。
(2)通過Rollout算法使得上述近似值趨于最?。?/p>
(3)根據(jù)當前一個調(diào)度區(qū)間內(nèi)的X(t),結(jié)合t時刻的風(fēng)力發(fā)電出力值,求得下一個調(diào)度區(qū)間內(nèi)的X(t+1),同時得到t+1時刻的風(fēng)力發(fā)電出力值,然后計算下一個調(diào)度區(qū)間的X(t+2),重復(fù)此過程,直到整個調(diào)度周期結(jié)束。
本發(fā)明的優(yōu)點和積極效果是:
1、本發(fā)明提供了一種基于Rollout算法的多能互補微網(wǎng)實時調(diào)度方法,首先,建立多能互補微網(wǎng)實時調(diào)度的滾動時域馬爾科夫決策過程模型,確立實時調(diào)度的約束條件和目標函數(shù);然后,將一個完整調(diào)度周期劃分成若干個調(diào)度區(qū)間,基于貪心算法得到滿足實時調(diào)度約束的一個基礎(chǔ)可行解;最后,基于上述基礎(chǔ)可行解,運用Rollout算法求解該多能互補微網(wǎng)滾動時域馬爾科夫決策問題。本發(fā)明建立了多能互補微網(wǎng)的滾動時域模型,并運用Rollout算法進行求解,簡易有效,實用性強。
2、本發(fā)明運用Rollout算法求解滾動時域的馬爾科夫決策模型問題,先建立一個包含新能源出力隨機性的馬爾科夫決策模型,運用貪心算法找到一個基礎(chǔ)可行解,并在此基礎(chǔ)上接近目標,將新能源出力波動性考慮在內(nèi),同時解決了傳統(tǒng)算法求解速度慢、效率低的問題,實現(xiàn)了高效快速的多能互補微網(wǎng)實時調(diào)度。
附圖說明
圖1是本發(fā)明的處理流程圖。
具體實施方式
以下結(jié)合附圖對本發(fā)明實施例作進一步詳述:
本發(fā)明提出一種基于Rollout算法的多能互補微網(wǎng)實時調(diào)度方法,不僅把新能源出力的波動性考慮在內(nèi),而且更有效地求解多能互補微網(wǎng)的滾動時域調(diào)度問題,運用Rollout算法求解滾動時域的馬爾科夫決策模型問題,首先建立一個包含新能源出力隨機性的多能互補微網(wǎng)實時調(diào)度的滾動時域馬爾科夫決策過程模型,確立實時調(diào)度的約束條件和目標函數(shù);接著將一個完整調(diào)度周期劃分成若干個調(diào)度區(qū)間,基于貪心算法得到滿足實時調(diào)度約束的一個基礎(chǔ)可行解;最后基于上述基礎(chǔ)可行解,運用Rollout算法求解該多能互補微網(wǎng)滾動時域馬爾科夫決策過程模型。
一種基于Rollout算法的多能互補微網(wǎng)實時調(diào)度方法,如圖1所示,包括以下步驟:
步驟1、建立包含新能源出力隨機性的多能互補微網(wǎng)實時調(diào)度的滾動時域馬爾科夫決策過程模型,確立實時調(diào)度的約束條件;
所述步驟1的確立實時調(diào)度的約束條件包括:微網(wǎng)的電平衡約束、蓄電池的運行約束、微網(wǎng)與主網(wǎng)的交易電功率約束和熱電聯(lián)產(chǎn)設(shè)備的電功率出力約束;
所述微網(wǎng)的電平衡約束如下:
上式中,t是時間參數(shù);pG(t)是t時刻微網(wǎng)與主網(wǎng)的交換電功率,向主網(wǎng)購電為正,向主網(wǎng)售電為負;N是熱電聯(lián)產(chǎn)設(shè)備的數(shù)目;是t時刻第i臺熱電聯(lián)產(chǎn)設(shè)備輸出電功率;pB(t)是t時刻蓄電池的充放電功率,充電為負,放電為正;pw(t)是t時刻風(fēng)電發(fā)電出力;pD(t)是t時刻的電負荷需求;
所述蓄電池的運行約束如下:
上式中,E(t)與E(t+1)分別是t時刻和t+1時刻蓄電池的儲能水平;E與分別是蓄電池容量的下邊界和上邊界;ΔT是從t時刻至t+1時刻的時間間隔;αc與αd分別為蓄電池的充放電效率;pB(t)是t時刻蓄電池的充放電功率,充電為負,放電為正;為蓄電池充放電功率的上限值;
所述微網(wǎng)與主網(wǎng)的交易電功率約束如下:
上式中,pG(t)與pG(t-1)分別是t時刻和t-1微網(wǎng)與主網(wǎng)的交換電功率,向主網(wǎng)購電為正,向主網(wǎng)售電為負;為微網(wǎng)與主網(wǎng)的交換電功率的上限值,δ是微網(wǎng)與主網(wǎng)的交換電功率的波動上限;
所述熱電聯(lián)產(chǎn)設(shè)備的電功率出力約束如下:
上式中,是t時刻第i臺熱電聯(lián)產(chǎn)設(shè)備輸出電功率;是第i臺熱電聯(lián)產(chǎn)設(shè)備輸出電功率的上限;Hi(t)是t時刻需要由第i臺熱電聯(lián)產(chǎn)設(shè)備供給的熱功率;vi與分別是第i臺熱電聯(lián)產(chǎn)設(shè)備電、熱功率轉(zhuǎn)換效率的下限和上限。
步驟2、以滾動時域馬爾科夫決策周期內(nèi)微網(wǎng)系統(tǒng)的運行費用最低為目標,確立包含新能源出力隨機性的多能互補微網(wǎng)實時調(diào)度的滾動時域馬爾科夫決策過程模型的實時調(diào)度的目標函數(shù);
所述多能互補微網(wǎng)與主網(wǎng)處于并網(wǎng)狀態(tài),可與主網(wǎng)交易電量,其供能設(shè)備包括風(fēng)力發(fā)電機、熱電聯(lián)產(chǎn)設(shè)備(CHP)、蓄電池;所述實時調(diào)度的目標函數(shù)是為了實現(xiàn)微網(wǎng)系統(tǒng)的運行費用最低,包括系統(tǒng)購電成本與熱電聯(lián)產(chǎn)設(shè)備燃料費用兩部分。
所述確立包含新能源出力隨機性的多能互補微網(wǎng)實時調(diào)度的滾動時域馬爾科夫決策過程模型的實時調(diào)度的目標函數(shù)的具體方法為:首先以微網(wǎng)系統(tǒng)在單個調(diào)度區(qū)間內(nèi)的運行費用最低為目標,建立微網(wǎng)系統(tǒng)在單個調(diào)度區(qū)間內(nèi)的運行費用函數(shù),然后以微網(wǎng)系統(tǒng)在滾動時域馬爾科夫決策周期內(nèi)的運行費用最低為目標,確立實時調(diào)度的目標函數(shù);
所述微網(wǎng)系統(tǒng)在單個調(diào)度區(qū)間內(nèi)的運行費用函數(shù)如下:
其中,
上式中,X(t)是t時刻微網(wǎng)系統(tǒng)的狀態(tài)變量;A(t)是t時刻微網(wǎng)系統(tǒng)的控制變量;ct(X(t),A(t))是單個調(diào)度區(qū)間內(nèi)系統(tǒng)運行費用的函數(shù);λ(t)是t時刻電網(wǎng)電價;c是天然氣的價格;Fic(t)是第i臺熱電聯(lián)產(chǎn)設(shè)備耗氣量與電出力之間的線性函數(shù);ai與bi第i臺熱電聯(lián)產(chǎn)設(shè)備耗氣量與電出力之間的線性函數(shù)的系數(shù);
所述實時調(diào)度的目標函數(shù)如下:
上式中,Jt(X(t),A(t))為滾動時域馬爾科夫決策周期內(nèi)微網(wǎng)系統(tǒng)的運行費用的函數(shù);
步驟3、將單個完整調(diào)度周期劃分成若干個調(diào)度區(qū)間,基于貪心算法得到滿足實時調(diào)度約束條件的一個基礎(chǔ)可行解;
所述步驟3的具體方法為:將一個完整調(diào)度周期劃分成若干個調(diào)度區(qū)間,基于貪心算法分別針對每個調(diào)度區(qū)間內(nèi)的優(yōu)化調(diào)度問題進行求解,最后把每個調(diào)度區(qū)間的局部最優(yōu)解合成為整個調(diào)度區(qū)間上的一個基礎(chǔ)可行解。
所述步驟3的基于貪心算法分別針對每個調(diào)度區(qū)間內(nèi)的優(yōu)化調(diào)度問題進行求解的具體步驟包括:
(1)根據(jù)步驟2所述的微網(wǎng)系統(tǒng)在單個調(diào)度區(qū)間內(nèi)的運行費用函數(shù),列出目標函數(shù)和約束條件如下:
約束條件如下:
其中:
上式中,pb(t)與分別是構(gòu)建基礎(chǔ)可行解的過程中蓄電池充放電功率的新的下限和上限;pg(t)與分別是構(gòu)建基礎(chǔ)可行解的過程中微網(wǎng)與主網(wǎng)交換功率的新的下限和上限;pci(t)與分別是構(gòu)建基礎(chǔ)可行解的過程中第i臺熱電聯(lián)產(chǎn)設(shè)備電出力的新的下限和上限;
(2)為了得到在一個調(diào)度區(qū)間內(nèi)的優(yōu)化結(jié)果,將上述目標函數(shù)的N+2個系數(shù)按從小到大的順序進行排列,得到各個決策變量調(diào)度順序,其中N+2個系數(shù)即為λ(t)·ΔT,0,c·ai(i=1,2,…,N),出現(xiàn)系數(shù)0是因為目標函數(shù)中不包含pB(t);再令負荷差值d(t)=pD(t)-pw(t);根據(jù)d(t)的值和各個決策變量的調(diào)度順序即可求得最終的優(yōu)化結(jié)果;
(3)對其他調(diào)度區(qū)間依次求解,最后得到滿足微網(wǎng)運行需求的一個基礎(chǔ)可行解。
步驟4、基于步驟3所述的基礎(chǔ)可行解,運用Rollout算法求解該多能互補微網(wǎng)實時調(diào)度的滾動時域馬爾科夫決策過程模型。
所述步驟4的具體方法為:
(1)設(shè)步驟3求得的基礎(chǔ)可行解為πb=(Ab,t+1,Ab,t+2,…,Ab,t+T-1),那么我們得到了一個實時調(diào)度從t到t+T-1時刻運行費用最低這個目標函數(shù)的近似值:
上式中,為用Rollout算法求得的微網(wǎng)系統(tǒng)在滾動時域馬爾科夫決策周期內(nèi)微網(wǎng)系統(tǒng)的運行費用的函數(shù)。
(2)通過Rollout算法使得上述近似值趨于最?。?/p>
(3)根據(jù)當前一個調(diào)度區(qū)間內(nèi)的X(t),結(jié)合t時刻的風(fēng)力發(fā)電出力值,求得下一個調(diào)度區(qū)間內(nèi)的X(t+1),同時得到t+1時刻的風(fēng)力發(fā)電出力值,然后計算下一個調(diào)度區(qū)間的X(t+2),重復(fù)此過程,直到整個調(diào)度周期結(jié)束。
需要強調(diào)的是,本發(fā)明所述的實施例是說明性的,而不是限定性的,因此本發(fā)明包括并不限于具體實施方式中所述的實施例,凡是由本領(lǐng)域技術(shù)人員根據(jù)本發(fā)明的技術(shù)方案得出的其他實施方式,同樣屬于本發(fā)明保護的范圍。