用于月度用電預(yù)測(cè)模型的溫度指數(shù)構(gòu)建方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及用電預(yù)測(cè)領(lǐng)域,特別涉及一種用于月度用電預(yù)測(cè)模型的溫度指數(shù)構(gòu)建 方法。
【背景技術(shù)】
[0002] 現(xiàn)有的用電預(yù)測(cè)模型有GM灰色預(yù)測(cè)模型、ARB1A模型、回歸模型等。
[0003] 1、GM灰色預(yù)測(cè)模型
[0004] 基于用電數(shù)據(jù)本身的趨勢(shì),通過實(shí)際數(shù)據(jù)的累加生成灰色系統(tǒng),得到規(guī)律較強(qiáng)的 曲線之后,用指數(shù)曲線擬合生成模型,再利用生成模型得到的數(shù)據(jù)通過累加逆運(yùn)算一一累 減生成得到還原模型,由還原模型作為預(yù)測(cè)模型。
[0005] 2、電力彈性系數(shù)
[0006] -種系數(shù)計(jì)算法,把影響用電的因素(如氣溫)和用電量?jī)烧咧g計(jì)算彈性系數(shù), 即氣溫每增加1%,帶來用電量變量百分之多少。根據(jù)歷史數(shù)據(jù)對(duì)彈性進(jìn)行估算,把得到的 彈性系數(shù)和新的氣溫變化結(jié)合,從而對(duì)新的用電量的變化進(jìn)行估計(jì)和預(yù)測(cè)。
[0007] 3、ARB1A 模型
[0008] 自回歸移動(dòng)平均模型(ARMA)是基于用電量本身的自身規(guī)律進(jìn)行刻畫的模型。如 果用電序列{yt}的當(dāng)前值不僅與自身過去值有關(guān),而且還與其以前進(jìn)入系統(tǒng)的外部沖擊e 存在一定依存關(guān)系,則在用模型刻畫這種動(dòng)態(tài)特征時(shí),模型中既包括自身的滯后項(xiàng),也包括 過去的外部沖擊。一般模型表達(dá)為厶1?^\(?,(1,(1),其中,?為用電序列^}的滯后階數(shù),(1為 外部沖擊e的滯后階數(shù),d為差分次數(shù)。其一般結(jié)構(gòu)為:
[0009] yt= Φ iyt-1+ Φ 2yt-2+···+ Φ pyt-p+et+9iet-i+02et-2+···q
[0010] 利用滯后算子,此模型可寫為:
[0011] Φ(Β)γ?= Θ (B)et
[0012] 實(shí)際中,為了保證數(shù)據(jù)的平穩(wěn)性,常常先對(duì)數(shù)據(jù)進(jìn)行差分,然后建立模型,即:Φ (B)Bdyt= Θ (B)et,這就是ARIMA模型。
[0013] 若序列的當(dāng)前值還受到其他變量的影響,則需要建立AR頂A-X模型,即:
[0015] 其中{yt},{Xt}為平穩(wěn)序列,或者經(jīng)過差分后的平穩(wěn)序列,{yt}為用電量,{ Xt}為影 響用電的因素。
[0016] 4、多元線性回歸
[0017] 為了刻畫多個(gè)因素對(duì)用電的線性影響,線性回歸模型可對(duì)用電量先估計(jì)系數(shù)后, 在使用擬合的模型進(jìn)行預(yù)測(cè)。其基本回歸表達(dá)式為:
[0018] yt = b〇+bixit+b2X2t+· · .+bqXqt+et
[0019] 其中q個(gè)x為影響用電的因素,y為用電量。通過最小二乘估計(jì)法,估計(jì)系數(shù)b,然后 利用估計(jì)的系數(shù)和X的取值,以及方程式表達(dá)的關(guān)系,求得y的預(yù)測(cè)值。
[0020] 5、隨機(jī)森林模型
[0021] 隨機(jī)森林回歸模型,由很多決策樹回歸組成的組合回歸模型,且參數(shù)集是獨(dú)立同 分布的隨機(jī)向量,在給定自變量X下,每個(gè)決策樹回歸模型都有一票投票權(quán)來選擇最優(yōu)的回 歸結(jié)果,最后輸出所有的投票判別結(jié)果或是得到估計(jì)的平均值。
[0022] 隨機(jī)森林回歸的基本方法是:首先利用自助法從原始訓(xùn)練集抽取k個(gè)樣本,然后對(duì) k個(gè)樣本分別建立k個(gè)決策樹模型,得到k種回歸結(jié)果;最后根據(jù)k種回歸結(jié)果對(duì)每個(gè)記錄進(jìn) 行投票表決決定其最終回歸。不僅有效抑制訓(xùn)練樣本噪音和解決屬性缺失,還不容易出現(xiàn) 過度擬合。在構(gòu)建隨機(jī)森林的過程中生成一個(gè)泛化誤差的內(nèi)部無偏估計(jì),使預(yù)測(cè)結(jié)果更加 精確。
[0023] 上述所有模型除GM灰色模型和ARMA模型以外,都需加入用電影響因素作為模型 預(yù)測(cè)的輸入量。其中,對(duì)于商業(yè)和居民用電來講,最重要的影響因素就是氣溫。通常,氣象局 發(fā)布各個(gè)城市或行政區(qū)域的平均溫度。當(dāng)某區(qū)域面積大,其自然地理因素差異顯著,比如, 該區(qū)域有高原山區(qū),也有平原盆地,多樣性的地理環(huán)境氣候差異很顯著。這時(shí),氣象局會(huì)將 該區(qū)域劃分為不同的氣候區(qū),并按氣候區(qū)公布該區(qū)域的平均氣溫,而不再發(fā)布該區(qū)域的總 體氣溫。因此,對(duì)于存在多個(gè)氣候區(qū)的區(qū)域來講,就缺乏統(tǒng)一的,能夠反映總體情況的綜合 氣溫指數(shù)。
[0024] 為了彌補(bǔ)這一缺陷,傳統(tǒng)的做法一般會(huì)按照區(qū)域分別進(jìn)行預(yù)測(cè),更進(jìn)一步會(huì)按照 氣候區(qū)的劃分,把各個(gè)氣候區(qū)的平均溫度匯總,得到反映氣溫總體狀況的均溫值,作為預(yù)測(cè) 反映總體氣溫的輸入量。如果總體氣溫為T,第i個(gè)氣候區(qū)的氣溫為ti,存在η個(gè)不同的氣候 區(qū),那么總體氣溫可以表示為:
[0026]其中,fi是第i個(gè)區(qū)域的氣溫權(quán)重。
[0027] 這時(shí),把總體氣溫T放入模型中作為輸入量,對(duì)用電預(yù)測(cè)模型先估計(jì),得到參數(shù)以 后,再把新的氣溫值輸入模型,得到對(duì)用電的預(yù)測(cè)值。
[0028] 從上述氣溫?cái)?shù)據(jù)的使用中可以看到:首先,研究氣溫對(duì)用電影響的前提是必須有 實(shí)際可使用的氣溫?cái)?shù)據(jù)。一旦研究某個(gè)區(qū)域存在多個(gè)氣候區(qū),而氣溫僅僅按照氣候區(qū)來發(fā) 布,那么在研究多個(gè)氣候區(qū)總體的用電情況時(shí),就缺乏總體氣溫指標(biāo),模型預(yù)測(cè)受限于總體 氣溫?cái)?shù)據(jù)的獲得。其次,現(xiàn)有預(yù)測(cè)方法直接把氣溫的平均值作為模型的輸入量寫進(jìn)線性模 型里,沒有考慮氣溫對(duì)用電的非線性影響。氣溫并非每增加一度,用電就會(huì)增加相應(yīng)的幅 度。實(shí)際情況是,氣溫只有高于一定程度,或者低于一定程度時(shí),用電負(fù)荷才會(huì)啟動(dòng),也就是 說,氣溫對(duì)用電的影響有階梯效應(yīng),一定閾值下不存在用電影響,超過這個(gè)取值影響才顯 著。再者,現(xiàn)有直接使用氣溫?cái)?shù)據(jù)預(yù)測(cè)的方式,沒有捕捉高低溫天氣的累積影響?,F(xiàn)實(shí)情況 是,高低溫天氣持續(xù)期加長(zhǎng),用電負(fù)荷有明顯的不同?,F(xiàn)有的氣溫?cái)?shù)據(jù)以及預(yù)測(cè)方法,不能 捕捉這個(gè)累積性特點(diǎn)。最后,氣溫對(duì)用電的影響也隨著地區(qū)經(jīng)濟(jì)社會(huì)發(fā)展程度不同而存在 差異,直接使用氣溫?cái)?shù)據(jù),不能刻畫氣候地域差異和用電地域差異。因此,對(duì)于用電預(yù)測(cè),我 們需要得到一個(gè)能夠反映氣溫用電的非線性影響、累積效應(yīng)以及地區(qū)差異的總體指標(biāo)。
【發(fā)明內(nèi)容】
[0029] 本發(fā)明所要解決的技術(shù)問題是提供一種用于月度用電預(yù)測(cè)模型的溫度指數(shù)構(gòu)建 方法,構(gòu)建能夠反映全區(qū)域氣溫的綜合指數(shù),指數(shù)需要刻畫用電的階梯型影響,高低溫帶來 的累積效應(yīng),以及反映氣溫影響的區(qū)域性差異,從而提高模型對(duì)月度用電的預(yù)測(cè)能力。
[0030] 為解決上述技術(shù)問題,本發(fā)明采用的技術(shù)方案是:
[0031] 一種用于月度用電預(yù)測(cè)模型的溫度指數(shù)構(gòu)建方法,包括以下步驟:
[0032] 設(shè)定用來區(qū)分用電負(fù)荷啟動(dòng)范圍的氣溫閾值,取每年6月的平均氣溫為高溫基準(zhǔn) 溫度Th,12月的平均氣溫為低溫基準(zhǔn)溫度?Υ,在高溫或低溫基準(zhǔn)溫度的基礎(chǔ)上,設(shè)置溫度帶 寬t,那么,高溫的最大值取為T H+t,最小值取為TH-t,即是高溫閾值區(qū)間為[TH-t,TH+t],高 溫閾值為upt;低溫的最大值取為T L+t,最小值取為TL-t,即是低溫閾值區(qū)間為[TL-t,TL+t], 低溫閾值為dpt;
[0033] 在高低溫各自的閾值區(qū)間,按照確定的步長(zhǎng)進(jìn)行網(wǎng)格搜索,確定所有的網(wǎng)格點(diǎn),這 些網(wǎng)格點(diǎn)作為初選點(diǎn)集;
[0034] 根據(jù)確定的高溫閾值區(qū)間,以及高溫區(qū)間內(nèi)所有閾值網(wǎng)格點(diǎn),各分區(qū)域第i個(gè)月的 高溫指數(shù)為第i月j日的平均氣溫與高溫閾值的差值,再通過氣溫影響函數(shù)映射出一個(gè)取 值,加和第i月的所有統(tǒng)計(jì)天數(shù),從而得到第i月的高溫指數(shù);根據(jù)確定的低溫閾值區(qū)間,以 及低溫區(qū)間內(nèi)所有閾值網(wǎng)格點(diǎn),各分區(qū)域第i個(gè)月的低溫指數(shù)為第i月j日的平均氣溫與低 溫閾值的差值,再通過氣溫影響函數(shù)映射出一個(gè)取值,加和第i月的所有統(tǒng)計(jì)天數(shù),從而得 到為第i月的低溫指數(shù);
[0035] 按照各分區(qū)域占全區(qū)域的權(quán)重加權(quán)合成全區(qū)域氣溫指數(shù),設(shè)某個(gè)分區(qū)域?yàn)閐,則
[0038]根據(jù)網(wǎng)格點(diǎn)形成的所有高溫/低溫指數(shù),作為用電預(yù)測(cè)模的輸入數(shù)據(jù),然后根據(jù)用 電預(yù)測(cè)模型對(duì)用電量進(jìn)行預(yù)測(cè),并得到模型的預(yù)測(cè)誤差;
[0039]根據(jù)得到的相對(duì)誤差和總平均相對(duì)誤差,選擇具有最小預(yù)測(cè)誤差的高溫/