本發(fā)明涉及電力能源,具體涉及一種分布式光伏發(fā)電功率缺失數(shù)據(jù)插補(bǔ)方法及裝置。
背景技術(shù):
1、近年來(lái),越來(lái)越多的工商業(yè)園區(qū)開(kāi)始配備分布式光伏設(shè)施。工商業(yè)園區(qū)在電力能源系統(tǒng)中的角色,逐漸由單向的電力消費(fèi)者,轉(zhuǎn)向產(chǎn)消一體的能源管理者。其中,分布式光伏站點(diǎn)作為園區(qū)內(nèi)主要的電源側(cè)資源,其發(fā)電功率數(shù)據(jù)的質(zhì)量與規(guī)模,直接影響著園區(qū)綜合能源管理的信息化與智能化水平。然而,現(xiàn)實(shí)場(chǎng)景下,采集設(shè)備故障、傳感器失靈、數(shù)據(jù)傳輸受阻等諸多不確定性干擾因素,均會(huì)導(dǎo)致采集到的園區(qū)分布式光伏發(fā)電功率數(shù)據(jù)中包含較多的缺失值。這一問(wèn)題會(huì)對(duì)基于功率數(shù)據(jù)的出力分析、功率預(yù)測(cè)、能量?jī)?yōu)化調(diào)度等一系列下游任務(wù)產(chǎn)生了較大的負(fù)面影響。因此,充分考慮園區(qū)分布式光伏發(fā)電功率數(shù)據(jù)的特點(diǎn)與現(xiàn)狀,針對(duì)性地提出可靠的功率缺失值插補(bǔ)方法,對(duì)于提升園區(qū)綜合能源管理水平有著重要的實(shí)際意義和應(yīng)用價(jià)值。
2、目前常用的分布式光伏發(fā)電功率數(shù)據(jù)插補(bǔ)方法,主要可以分為傳統(tǒng)的統(tǒng)計(jì)插值方法與基于氣象信息的多變量時(shí)序相關(guān)性建模方法。前者包括線性插值、樣條插值、移動(dòng)平均、指數(shù)平滑等方法,雖然較為簡(jiǎn)便易行且對(duì)數(shù)據(jù)量要求較低,但通常無(wú)法有效捕捉光伏發(fā)電功率數(shù)據(jù)的高波動(dòng)性與復(fù)雜的非線性時(shí)變特征。后者通常依靠光伏發(fā)電功率與輻照強(qiáng)度、云層分布變化情況等氣象信息之間的相關(guān)性進(jìn)行建模,此類方法在氣象信息與光伏發(fā)電功率數(shù)據(jù)均較為完備充足的場(chǎng)景下比較有效,但對(duì)于大量處于建設(shè)初期的園區(qū)分布式光伏站點(diǎn)而言,一方面,光伏發(fā)電功率本身的數(shù)據(jù)量難以保證;另一方面,園區(qū)部署分布式光伏站點(diǎn)時(shí),并不一定會(huì)配套部署專門的氣象監(jiān)測(cè)裝置,因此無(wú)法保證能夠獲取到實(shí)時(shí)、準(zhǔn)確且充分的氣象信息。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明提供了一種分布式光伏發(fā)電功率缺失數(shù)據(jù)插補(bǔ)方法及裝置,以解決如何對(duì)功率缺失數(shù)據(jù)插補(bǔ)的問(wèn)題。
2、第一方面,本發(fā)明提供了一種分布式光伏發(fā)電功率缺失數(shù)據(jù)插補(bǔ)方法,包括:
3、選取分布式光伏歷史數(shù)據(jù)中無(wú)缺失值的序列片段,以滑動(dòng)窗口的形式將無(wú)缺失值的序列片段分割為多個(gè)等長(zhǎng)的時(shí)序樣本,構(gòu)成時(shí)序樣本集;
4、基于掩碼建模技術(shù),利用時(shí)序樣本集生成掩碼樣本,每個(gè)掩碼樣本與其對(duì)應(yīng)的原始時(shí)序樣本形成“輸入-輸出”樣本對(duì),所有樣本對(duì)的集合形成用于自監(jiān)督學(xué)習(xí)的樣本集;
5、在自監(jiān)督學(xué)習(xí)樣本集上,對(duì)以patchtst模型為主干的自監(jiān)督模型進(jìn)行訓(xùn)練,得到能夠?qū)⒀诖a樣本還原為對(duì)應(yīng)原始序列樣本的自監(jiān)督表征學(xué)習(xí)模型;
6、截取存在數(shù)據(jù)缺失的序列片段作為待插補(bǔ)時(shí)序樣本,對(duì)其中的缺失片段進(jìn)行掩碼處理后,輸入到自監(jiān)督表征學(xué)習(xí)模型中進(jìn)行計(jì)算,得到的輸出結(jié)果中與缺失值時(shí)點(diǎn)位置對(duì)應(yīng)的值即為該時(shí)點(diǎn)的發(fā)電功率插補(bǔ)數(shù)據(jù)。
7、本發(fā)明提出的插補(bǔ)方法基于自監(jiān)督表征學(xué)習(xí)中的掩碼建模技術(shù),克服了單個(gè)園區(qū)的分布式光伏發(fā)電功率數(shù)據(jù)波動(dòng)性高、建設(shè)前期數(shù)據(jù)量受限、氣象相關(guān)信息不足等問(wèn)題,能夠針對(duì)缺失片段生成較為可靠的插補(bǔ)結(jié)果,從而為一系列以歷史功率數(shù)據(jù)為支撐的下游計(jì)算任務(wù)(如光伏功率預(yù)測(cè)等)奠定了高質(zhì)量的數(shù)據(jù)基礎(chǔ)。
8、在一種可選的實(shí)施方式中,以滑動(dòng)窗口的形式將無(wú)缺失值的序列片段分割為多個(gè)等長(zhǎng)的時(shí)序樣本的過(guò)程,包括:
9、從0時(shí)刻起,以采樣時(shí)間間隔采集分布式光伏發(fā)電功率數(shù)據(jù),得到每天多個(gè)時(shí)點(diǎn)的分布式光伏出力曲線,累積預(yù)設(shè)天數(shù)后形成分布式光伏發(fā)電功率的歷史觀測(cè)序列;
10、判斷歷史觀測(cè)序列中,每天的出力數(shù)據(jù)是否存在缺失值,若有,則將該天的出力曲線標(biāo)記為待插補(bǔ)的時(shí)序樣本,并從歷史觀測(cè)序列中剔除;
11、剔除所有含缺失值的時(shí)序樣本后,以滑動(dòng)時(shí)間窗的形式,將無(wú)缺失的歷史觀測(cè)序列片段劃分為多個(gè)等長(zhǎng)的時(shí)序樣本,構(gòu)造用于模型訓(xùn)練的時(shí)序樣本集。
12、在一種可選的實(shí)施方式中,基于掩碼建模技術(shù),利用時(shí)序樣本集生成掩碼樣本的過(guò)程,包括:
13、根據(jù)待插補(bǔ)時(shí)序樣本中缺失值數(shù)量占樣本時(shí)點(diǎn)總數(shù)的比例分布情況,確定一組掩碼比例集合,掩碼比例用于模擬待插補(bǔ)樣本中不同程度的數(shù)據(jù)缺失情況;
14、對(duì)于時(shí)序樣本集中的每一個(gè)時(shí)序樣本,根據(jù)每一種掩碼比例,在時(shí)序樣本中多次隨機(jī)選擇相應(yīng)比例的原始數(shù)據(jù)進(jìn)行掩碼處理,得到多個(gè)掩碼樣本。
15、在一種可選的實(shí)施方式中,得到多個(gè)掩碼樣本的過(guò)程,包括:
16、利用程序模擬生成服從正態(tài)分布、均值為0、標(biāo)準(zhǔn)差為1的隨機(jī)數(shù),作為用于掩碼的白噪聲;
17、對(duì)于時(shí)序樣本集中的每一個(gè)時(shí)序樣本,分別以掩碼比例集合中每個(gè)比例值為比例,隨機(jī)在每個(gè)時(shí)序樣本中選擇多個(gè)時(shí)點(diǎn);
18、將被選中的時(shí)點(diǎn)對(duì)應(yīng)的光伏功率數(shù)值替換為白噪聲;
19、重復(fù)上述隨機(jī)選擇的操作m次,最終得到的掩碼樣本總數(shù)量為:
20、nmask=n*k*m
21、其中,nmask為掩碼樣本總數(shù)量;n為時(shí)序樣本集中的時(shí)序樣本數(shù)量;k為比例值的數(shù)量;nmask、n、k均為正整數(shù)。
22、在一種可選的實(shí)施方式中,對(duì)以patchtst模型為主干的自監(jiān)督模型進(jìn)行訓(xùn)練的過(guò)程,包括:
23、將自監(jiān)督學(xué)習(xí)樣本集按指定比例劃分為訓(xùn)練集、驗(yàn)證集與測(cè)試集;
24、將訓(xùn)練集數(shù)據(jù)劃分為多個(gè)批次;
25、采用python程序語(yǔ)言與pytorch深度學(xué)習(xí)框架搭建patchtst深度時(shí)序模型的網(wǎng)絡(luò)結(jié)構(gòu);
26、利用梯度下降方法,依次在多個(gè)批次的訓(xùn)練樣本集上對(duì)模型進(jìn)行訓(xùn)練,訓(xùn)練重復(fù)迭代多個(gè)輪次;
27、將每個(gè)輪次訓(xùn)練得到的模型用于驗(yàn)證集,記錄驗(yàn)證集上模型輸出結(jié)果與其對(duì)應(yīng)原始功率數(shù)值之間的評(píng)估值變化;當(dāng)驗(yàn)證集上評(píng)估值不再下降的次數(shù)超過(guò)指定輪次,或模型的訓(xùn)練輪次達(dá)到最大指定輪次時(shí),停止訓(xùn)練,保存訓(xùn)練得到的模型參數(shù);
28、在測(cè)試集上評(píng)估自監(jiān)督模型對(duì)于時(shí)序樣本的還原準(zhǔn)確程度,若準(zhǔn)確程度不滿足要求,則對(duì)模型結(jié)構(gòu)及模型超參數(shù)進(jìn)行調(diào)整,并返回“將自監(jiān)督學(xué)習(xí)樣本集按指定比例劃分為訓(xùn)練集、驗(yàn)證集與測(cè)試集”的步驟,直至模型準(zhǔn)確度達(dá)標(biāo)。
29、在一種可選的實(shí)施方式中,對(duì)以patchtst模型為主干的自監(jiān)督模型進(jìn)行訓(xùn)練的過(guò)程,包括:
30、模型的訓(xùn)練目標(biāo)為最小化mse損失函數(shù),即:
31、
32、其中pt為時(shí)序樣本序列在t時(shí)點(diǎn)的原始功率數(shù)值;為模型輸出序列在t時(shí)點(diǎn)的對(duì)應(yīng)數(shù)值;l為時(shí)間窗長(zhǎng)度。
33、在一種可選的實(shí)施方式中,輸入到自監(jiān)督表征學(xué)習(xí)模型中進(jìn)行計(jì)算的過(guò)程,包括:
34、利用白噪聲,對(duì)待插補(bǔ)時(shí)序樣本中的缺失時(shí)點(diǎn)進(jìn)行賦值;
35、對(duì)賦值后的待插補(bǔ)樣本,采用minmax方法及歸一化參數(shù)進(jìn)行歸一化處理;
36、將歸一化處理后的待插補(bǔ)樣本輸入到自監(jiān)督模型中進(jìn)行計(jì)算,得到輸出序列;
37、對(duì)輸出序列進(jìn)行反歸一化處理,將其還原到與光伏發(fā)電功率數(shù)據(jù)相匹配的原始數(shù)值尺度,待插補(bǔ)樣本中每個(gè)缺失值時(shí)點(diǎn)在輸出序列中對(duì)應(yīng)位置的數(shù)值,即為該時(shí)點(diǎn)的數(shù)據(jù)插補(bǔ)結(jié)果。
38、第二方面,本發(fā)明提供一種分布式光伏發(fā)電功率缺失數(shù)據(jù)插補(bǔ)裝置,包括:
39、時(shí)序樣本集模塊,用于選取分布式光伏歷史數(shù)據(jù)中無(wú)缺失值的序列片段,以滑動(dòng)窗口的形式將無(wú)缺失值的序列片段分割為多個(gè)等長(zhǎng)的時(shí)序樣本,構(gòu)成時(shí)序樣本集;
40、自監(jiān)督學(xué)習(xí)的樣本集模塊,用于基于掩碼建模技術(shù),利用時(shí)序樣本集生成掩碼樣本,每個(gè)掩碼樣本與其對(duì)應(yīng)的原始時(shí)序樣本形成“輸入-輸出”樣本對(duì),所有樣本對(duì)的集合形成用于自監(jiān)督學(xué)習(xí)的樣本集;
41、訓(xùn)練模塊,用于在自監(jiān)督學(xué)習(xí)樣本集上,對(duì)以patchtst模型為主干的自監(jiān)督模型進(jìn)行訓(xùn)練,得到能夠?qū)⒀诖a樣本還原為對(duì)應(yīng)原始序列樣本的自監(jiān)督表征學(xué)習(xí)模型;
42、插補(bǔ)模塊,用于截取存在數(shù)據(jù)缺失的序列片段作為待插補(bǔ)時(shí)序樣本,對(duì)其中的缺失片段進(jìn)行掩碼處理后,輸入到自監(jiān)督表征學(xué)習(xí)模型中進(jìn)行計(jì)算,得到的輸出結(jié)果中與缺失值時(shí)點(diǎn)位置對(duì)應(yīng)的值即為該時(shí)點(diǎn)的發(fā)電功率插補(bǔ)數(shù)據(jù)。
43、第三方面,本發(fā)明提供了一種計(jì)算機(jī)設(shè)備,包括:存儲(chǔ)器和處理器,存儲(chǔ)器和處理器之間互相通信連接,存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)指令,處理器通過(guò)執(zhí)行計(jì)算機(jī)指令,從而執(zhí)行上述第一方面或其對(duì)應(yīng)的任一實(shí)施方式的分布式光伏發(fā)電功率缺失數(shù)據(jù)插補(bǔ)方法。
44、第四方面,本發(fā)明提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)指令,計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行上述第一方面或其對(duì)應(yīng)的任一實(shí)施方式的分布式光伏發(fā)電功率缺失數(shù)據(jù)插補(bǔ)方法。