本發(fā)明涉及一種基于模糊C均值聚類和分步網(wǎng)格搜索支持向量回歸的電動(dòng)汽車充電負(fù)荷預(yù)測(cè)方法。
背景技術(shù):
:隨著經(jīng)濟(jì)發(fā)展和工業(yè)化程度的不斷提高,大氣污染、節(jié)能減排問(wèn)題日益突出。燃油汽車排放的尾氣已成為空氣污染的主要因素之一。由于燃油汽車在使用過(guò)程中會(huì)產(chǎn)生大量的有毒氣體,給空氣環(huán)境帶來(lái)沉重負(fù)擔(dān),因此我國(guó)車輛排放法規(guī)也日益嚴(yán)格,交通運(yùn)輸設(shè)備轉(zhuǎn)型發(fā)展迫在眉睫。以節(jié)能、低噪聲、零排放為特點(diǎn)的電動(dòng)汽車逐漸受到人們的青睞和政府的支持,充換電配套設(shè)施也已初具規(guī)模。與之相伴的是,電動(dòng)汽車使用比例的提高加將帶來(lái)大規(guī)模的階段性電力需求,對(duì)電網(wǎng)系統(tǒng)的負(fù)荷承載能力乃至安全穩(wěn)定運(yùn)行產(chǎn)生負(fù)面影響。目前,電動(dòng)汽車充電負(fù)荷預(yù)測(cè)的方法主要分為三大類。一是傳統(tǒng)電力負(fù)荷的預(yù)測(cè)方法,主要有:回歸法、時(shí)間序列,小波分析、基于灰色模型以及神經(jīng)網(wǎng)絡(luò)等方法,由于這些方法都需要豐富的樣本數(shù)據(jù),電動(dòng)汽車又是剛剛興起,因此數(shù)據(jù)的缺乏導(dǎo)致預(yù)測(cè)結(jié)果出現(xiàn)較大偏差。二是基于統(tǒng)計(jì)學(xué)理論的用戶行為建模法,主要是運(yùn)用蒙特卡洛模擬用戶充電行為來(lái)預(yù)測(cè)電動(dòng)汽車充電需求,這類方法需要以傳統(tǒng)汽車的駕駛規(guī)律為參考依據(jù),如果行為分析出現(xiàn)偏差導(dǎo)致擬合估計(jì)不準(zhǔn)確,就會(huì)導(dǎo)致預(yù)測(cè)的系統(tǒng)性誤差。三是基于統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)(SVM)預(yù)測(cè)方法,該方法能夠在模型的經(jīng)驗(yàn)風(fēng)險(xiǎn)和泛化風(fēng)險(xiǎn)之間尋求最佳平衡,同時(shí)解決小樣本問(wèn)題,能夠取得較好的效果,但目前相關(guān)研究還處在初期階段。劉文霞,徐曉波,周樨結(jié)合遺傳算法(GA)和支持向量機(jī)對(duì)電動(dòng)汽車充電負(fù)荷進(jìn)行預(yù)測(cè),取得了較好的預(yù)測(cè)效果,但GA算法程序比較復(fù)雜,對(duì)初始種群的選擇有一定的依賴性,且容易陷入局部?jī)?yōu)化解而無(wú)法達(dá)到全局最優(yōu)。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的是提供一種基于模糊C均值聚類和分步網(wǎng)格搜索支持向量回歸的電動(dòng)汽車充電負(fù)荷預(yù)測(cè)方法。該方法克服了電動(dòng)汽車充電樣本有限的約束,避免了支持向量機(jī)參數(shù)尋優(yōu)陷入局部最優(yōu)解,在縮短預(yù)測(cè)時(shí)間的同時(shí)提高了預(yù)測(cè)精度。為實(shí)現(xiàn)上述目的,本發(fā)明采用下述技術(shù)方案:一種基于模糊C均值聚類和分步網(wǎng)格搜索支持向量回歸的電動(dòng)汽車充電負(fù)荷預(yù)測(cè)方法,包括以下步驟:1)選取某個(gè)時(shí)間段內(nèi)充換電站的日充電負(fù)荷作為樣本數(shù)據(jù),對(duì)一天的24個(gè)小時(shí)按照每4個(gè)小時(shí)為一份,等分成6份,記為6個(gè)關(guān)鍵的時(shí)間點(diǎn),每個(gè)時(shí)間點(diǎn)的負(fù)荷數(shù)據(jù)為該4個(gè)小時(shí)內(nèi)的最高負(fù)荷,則某一日的負(fù)荷狀態(tài)可由當(dāng)日的6個(gè)時(shí)間點(diǎn)的負(fù)荷來(lái)標(biāo)記,記為:ft={f1t,f2t,f3t,f4t,f5t,f6t},其中:t表示日期數(shù);2)分析影響電動(dòng)汽車充電負(fù)荷的特征變量,主要有最高氣溫、天氣狀態(tài)以及日期類型,運(yùn)用模糊C均值聚類分析法對(duì)樣本和預(yù)測(cè)日數(shù)據(jù)進(jìn)行聚類,選取與預(yù)測(cè)日相似度最高的負(fù)荷數(shù)據(jù)作為ε-SVR的訓(xùn)練集;3)在訓(xùn)練集中,按照時(shí)間進(jìn)行排序,選取初始3日的負(fù)荷數(shù)據(jù)作為輸入量,第4日的負(fù)荷數(shù)據(jù)作為輸出量,運(yùn)用分步網(wǎng)格搜索法訓(xùn)練ε-SVR的松弛變量參數(shù)C和RBF核函數(shù)中的寬度參數(shù)σ;4)以距離目標(biāo)預(yù)測(cè)日最近的3日的負(fù)荷數(shù)據(jù)作為輸入變量代入訓(xùn)練完成的ε-SVR,計(jì)算得出預(yù)測(cè)日的充電負(fù)荷,這里由于每日的完整負(fù)荷都是由當(dāng)日的6個(gè)負(fù)荷值來(lái)描述的,因此以上過(guò)程要重復(fù)進(jìn)行6遍,以最終形成預(yù)測(cè)日完整的負(fù)荷分布情況。進(jìn)一步地,步驟2)中的天氣狀態(tài)包括晴、小雨、中雨和大雨;日期類型包括工作日和節(jié)假日。進(jìn)一步地,步驟3)具體步驟如下:對(duì)選取出的樣本按照時(shí)間先后進(jìn)行排序,以前3日的負(fù)荷數(shù)據(jù)為輸入量,第4日的負(fù)荷數(shù)據(jù)為輸出量,運(yùn)用分步K-CV網(wǎng)格搜索法優(yōu)化ε-SVR的冗余參數(shù)C和RBF參數(shù)σ,其中:第一步優(yōu)化選擇K=5,選取相對(duì)較大的步長(zhǎng)Cstep=1和σstep=1;第二步優(yōu)化選擇K=3,選取相對(duì)較小的步長(zhǎng)Cstep=0.5和σstep=0.5,在優(yōu)化和訓(xùn)練過(guò)程中,ε取0.01。本發(fā)明的有益效果是,本發(fā)明將模糊C均值聚類法和分步網(wǎng)格搜索支持向量回歸(ε-SVR)模型應(yīng)用于電動(dòng)汽車充電負(fù)荷預(yù)測(cè),具有如下優(yōu)勢(shì):1、通過(guò)模糊C均值聚類法提取與預(yù)測(cè)目標(biāo)日同類的樣本,能夠縮小取樣范圍,提高取樣的針對(duì)性,有助于提高預(yù)測(cè)效率。2、運(yùn)用分步網(wǎng)格搜索法能夠有效平衡搜索時(shí)間和搜索精度。通過(guò)初始粗搜索,在節(jié)省搜索時(shí)間的同時(shí),還能夠覆蓋整個(gè)解空間;第二步精細(xì)化搜索則可以再初始化搜索解的局部區(qū)域提高搜索精度,使搜索結(jié)果得到進(jìn)一步細(xì)化和優(yōu)化。3、ε-SVR對(duì)樣本數(shù)量的要求不高,同時(shí)能夠在模型的經(jīng)驗(yàn)風(fēng)險(xiǎn)(模型在樣本上的預(yù)測(cè)結(jié)果與樣本真實(shí)結(jié)果之間的差值)和泛化風(fēng)險(xiǎn)(樣本以外的外推風(fēng)險(xiǎn))之間尋求最佳平衡,提高了電動(dòng)汽車充電負(fù)荷預(yù)測(cè)的準(zhǔn)確性。附圖說(shuō)明圖1是本發(fā)明示意圖。具體實(shí)施方式如圖1所示,一種基于模糊C均值聚類和分步網(wǎng)格搜索支持向量回歸的電動(dòng)汽車充電負(fù)荷預(yù)測(cè)方法,包括以下步驟:步驟1:選取30日內(nèi)的電動(dòng)汽車充換電站每日的24個(gè)整點(diǎn)時(shí)刻充電負(fù)荷數(shù)據(jù),對(duì)每日的24個(gè)整點(diǎn)時(shí)刻負(fù)荷數(shù)據(jù)進(jìn)行6等分,以等分時(shí)段內(nèi)最高負(fù)荷作為該時(shí)段的特征負(fù)荷,則每日的負(fù)荷樣本可以表述為:ft={f1t,f2t,f3t,f4t,f5t,f6t},t表示樣本的時(shí)期數(shù)t=1,2,…30;fit表示該日某個(gè)時(shí)間段的負(fù)荷數(shù)值。步驟2:以Xt={x1t,x2t,x3t}表示樣本日特征向量,其中:x1t表示當(dāng)日最高氣溫,x2t表示天氣狀態(tài)(晴、小雨、中雨、大雨),x3t表示日期類型(工作日、節(jié)假日)。步驟3:以X0表示預(yù)測(cè)日特征向量,對(duì){X0,Xt}數(shù)據(jù)進(jìn)行歸一化,運(yùn)用FCM法進(jìn)行分類,提取與X0同類的樣本作為訓(xùn)練集。傳統(tǒng)聚類方法通常是要么完全屬于某個(gè)類,要么完全不屬于某個(gè)類,樣本對(duì)各個(gè)子類的隸屬度取成確定的0和1兩種值,即樣本只能屬于所有類別中的某一類別。在很多分類問(wèn)題中,分類對(duì)象之間并沒(méi)有明確的界限,模糊聚類分析法應(yīng)運(yùn)而生。給定待分類數(shù)據(jù)矩陣Xn×m={(xij)n×m,i=1,2,....,n;j=1,2,...m},其中i表示的數(shù)量,j表示單個(gè)樣本的特征變量數(shù)量。FCM就是用隸屬度約定每個(gè)數(shù)據(jù)點(diǎn)屬于某個(gè)類的程度的一種聚類方法。FCM首先把n個(gè)樣本劃分成k類(1≤k≤n),記V={v1,...,vk}為k個(gè)類的中心,其中vi={vi1,...,vim}(i=1,...,k)。令uik表示第k個(gè)樣本屬于第i類樣本的隸屬度,這里FCM算法求每個(gè)聚類中心vi={vi1,...,vim}(i=1,...,k)使價(jià)值函數(shù)J達(dá)到最小。其中U為隸屬度矩陣,dig=||xg-vi||表示第g個(gè)樣本到第i個(gè)類中心的距離。J(U,V)表示所有樣本到各類中心的加權(quán)距離之和,權(quán)重是隸屬度的p次冪。FCM的目標(biāo)在約束條件下,求J(U,V)的最小值。步驟4:對(duì)選取出的樣本按照時(shí)間先后進(jìn)行排序,以前3日的負(fù)荷數(shù)據(jù)為輸入量,第4日的負(fù)荷數(shù)據(jù)為輸出量,運(yùn)用分步K-CV網(wǎng)格搜索法優(yōu)化ε-SVR的冗余參數(shù)C和RBF參數(shù)σ,其中:第一步優(yōu)化選擇K=5,選取相對(duì)較大的步長(zhǎng)Cstep=1和σstep=1;第二步優(yōu)化選擇K=3,選取相對(duì)較小的步長(zhǎng)Cstep=0.5和σstep=0.5。在優(yōu)化和訓(xùn)練過(guò)程中,ε取0.01。ε-SVR通過(guò)映射δ(x)將數(shù)據(jù)的非線性預(yù)測(cè)問(wèn)題轉(zhuǎn)換成高維空間中的線性預(yù)測(cè)問(wèn)題,設(shè)樣本集X={(xi,fi),i=1,2,....,m,xi∈Rd,fi∈R,d≥1},ε-SVR的目標(biāo)就是把非線性的預(yù)測(cè)問(wèn)題轉(zhuǎn)換為預(yù)測(cè)問(wèn)題,同時(shí)在約束條件下最小化損失函數(shù),即求解以下最優(yōu)化問(wèn)題:min12||w||2+CΣi=1k(ξi+ξi*)]]>s.t.wTδ(xi)+b-zi≤ϵ+ξizi-wTδ(xi)-b≤ϵ+ξi*ξi,ξi*≥0,i=1,....,m.]]>其中:為函數(shù)間隔,它表示樣本點(diǎn)與超平面的距離;為松弛變量,主要是為了消除數(shù)據(jù)結(jié)構(gòu)中的噪音點(diǎn)。求解以上最優(yōu)化問(wèn)題的對(duì)偶優(yōu)化問(wèn)題:min12(α-α*)Tδ(xi)Tδ(xj)(α-α*)+ϵΣi=1m(αi+αi*)+Σi=1mzi(αi-αi*)]]>s.t.Σi=1m(αi-αi*)=0,0≤αi,αi*≤C,i=1,....,m.]]>得出預(yù)測(cè)函數(shù)為:其中,K(xi,xj)表SVM的核函數(shù),在本提案中,選用了RBF函數(shù)作為ε-SVR的核函數(shù),表達(dá)式為:K(xi,xj)=exp(-||xi-xj||22σ2).]]>網(wǎng)格搜索法本質(zhì)上是一種交叉驗(yàn)證方法,其思想是將原始數(shù)據(jù)按照某種規(guī)則進(jìn)行分組,一部分作為訓(xùn)練集,另一部分作為驗(yàn)證集。在驗(yàn)證的過(guò)程中,首先用訓(xùn)練集對(duì)分類器進(jìn)行訓(xùn)練得出需要優(yōu)化的參數(shù)后,再利用驗(yàn)證集來(lái)測(cè)試訓(xùn)練得到的模型,以數(shù)據(jù)擬合的效果來(lái)作為評(píng)價(jià)分類器的性能指標(biāo)。常見(jiàn)交叉驗(yàn)證的方法有Hold-OutMethod、K-foldCrossValidation、Leave-One-OutCrossValidation。在本提案中采用了K-foldCrossValidation(K-CV)法,即將帶優(yōu)化參數(shù)均分成K組,然后把每個(gè)子集數(shù)據(jù)分別做一次驗(yàn)證集,其余的K-1組子集數(shù)據(jù)作為訓(xùn)練集,這樣會(huì)得到K個(gè)模型,用這K個(gè)模型最終的驗(yàn)證集的分類準(zhǔn)確率的平均數(shù)作為此K-CV下分類器的性能指標(biāo)。K一般大于等于2,實(shí)際操作時(shí)一般從3開(kāi)始取,只有在原始數(shù)據(jù)集合數(shù)據(jù)量小的時(shí)候才會(huì)嘗試取2。分步網(wǎng)格搜索的思想是分2次使用網(wǎng)格搜索進(jìn)行參數(shù)優(yōu)化。這里,初次的網(wǎng)格搜索選擇較少的組進(jìn)行交叉驗(yàn)證,這里選取K=5,同時(shí)選取相對(duì)較大的步長(zhǎng)(Cstep=1和σstep=1),最終選擇分類準(zhǔn)確率較大的一組C和σ,作為粗優(yōu)化的結(jié)果。然后,以粗優(yōu)化選擇出的C和σ為基礎(chǔ),再在這組參數(shù)附近選擇一個(gè)小區(qū)間,采用傳統(tǒng)方法中的小步距進(jìn)行,這是驗(yàn)證組數(shù)可以適當(dāng)減少(一般選K=3),從而找到最終的最優(yōu)參數(shù)。步驟6:在優(yōu)化的參數(shù)基礎(chǔ)上,繼續(xù)運(yùn)用訓(xùn)練集計(jì)算得出ε-SVR的αi和b。步驟7:輸入距離預(yù)測(cè)日最近3日的特定時(shí)段負(fù)荷{fi28,fi29,fi30}(i=1,2,..,6)作為輸入變量,代入訓(xùn)練好的ε-SVR計(jì)算得出該特地時(shí)段預(yù)測(cè)日的充電負(fù)荷。整個(gè)過(guò)程重復(fù)進(jìn)行6次后,預(yù)測(cè)工作完畢。上述雖然結(jié)合附圖對(duì)本發(fā)明的具體實(shí)施方式進(jìn)行了描述,但并非對(duì)本發(fā)明保護(hù)范圍的限制,所屬領(lǐng)域技術(shù)人員應(yīng)該明白,在本發(fā)明的技術(shù)方案的基礎(chǔ)上,本領(lǐng)域技術(shù)人員不需要付出創(chuàng)造性勞動(dòng)即可做出的各種修改或變形仍在本發(fā)明的保護(hù)范圍以內(nèi)。當(dāng)前第1頁(yè)1 2 3