本發(fā)明屬于電力系統(tǒng)配電網(wǎng)
技術(shù)領(lǐng)域:
,具體涉及一種基于大數(shù)據(jù)相關(guān)性分析的配電網(wǎng)供電可靠性預(yù)測方法。
背景技術(shù):
:供電可靠性是指供電系統(tǒng)對用戶持續(xù)供電的能力。一旦出現(xiàn)供電中斷,不僅會造成巨大的經(jīng)濟(jì)損失,也會嚴(yán)重影響人們的生活和社會的安定。據(jù)電力公司不完全的統(tǒng)計(jì),80%的用戶停電事故是由配電系統(tǒng)故障引起的,因此,準(zhǔn)確快速的進(jìn)行配電網(wǎng)可靠性評估十分重要。隨著智能配電網(wǎng)信息化、自動化、互動化水平的提高以及與物聯(lián)網(wǎng)的相互滲透與融合,電力企業(yè)量測體系內(nèi)部積累了大量數(shù)據(jù),如用戶用電數(shù)據(jù)、調(diào)度運(yùn)行數(shù)據(jù)、GIS數(shù)據(jù)等等,在量測體系之外,電力企業(yè)還積累了大量運(yùn)營數(shù)據(jù)(參見圖1),除卻電力企業(yè)內(nèi)部數(shù)據(jù)外還有許多潛在的外部數(shù)據(jù)源,分布式電源的大量接入以及電動汽車的快速發(fā)展,必將會為配電網(wǎng)的大數(shù)據(jù)資源池注入更多的數(shù)據(jù)流。在工程中,配電網(wǎng)供電可靠性評估常用的方法有解析法、模擬法和混合法,這些方法都是以準(zhǔn)確的配電網(wǎng)結(jié)構(gòu)和多年的元件可靠性指標(biāo)歷史數(shù)據(jù)為基礎(chǔ)進(jìn)行預(yù)測評估的,而面對如今愈加復(fù)雜的配網(wǎng)結(jié)構(gòu)和不斷增大的數(shù)據(jù)量,以上方法很難發(fā)揮作用。因此有必要尋求契合智能配電網(wǎng)數(shù)據(jù)特征的大數(shù)據(jù)應(yīng)用技術(shù)。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的是克服現(xiàn)有技術(shù)存在的傳統(tǒng)供電可靠性評估方法無法適用于大數(shù)據(jù)處理的問題,提供一種準(zhǔn)確、快速的基于大數(shù)據(jù)相關(guān)性分析的配電網(wǎng)供電可靠性預(yù)測方法。為實(shí)現(xiàn)以上目的,本發(fā)明的技術(shù)方案如下:一種基于大數(shù)據(jù)相關(guān)性分析的配電網(wǎng)供電可靠性預(yù)測方法,依次包括以下步驟:步驟1、收集電力企業(yè)的配電網(wǎng)大數(shù)據(jù),該配電網(wǎng)大數(shù)據(jù)包括量測數(shù)據(jù)、運(yùn)營數(shù)據(jù)以及外部數(shù)據(jù);步驟2、采用粗糙集理論從收集到的配電網(wǎng)大數(shù)據(jù)中提取出與配網(wǎng)供電可靠性的相關(guān)性較強(qiáng)的條件因素;步驟3、利用提取出的條件因素搭建BP神經(jīng)網(wǎng)絡(luò)進(jìn)行配網(wǎng)供電可靠性評估預(yù)測。所述步驟2依次包括以下步驟:步驟2-1、按照所有的條件屬性和決策屬性供電可靠率RS-3對所述配電網(wǎng)大數(shù)據(jù)進(jìn)行分類,以形成知識庫;步驟2-2、根據(jù)所有條件屬性對所述知識庫中的樣本進(jìn)行劃分,得到整體的不可分辨關(guān)系U/R,同時,按照決策屬性供電可靠率RS-3對知識庫中的樣本進(jìn)行劃分,得到一個不可分辨關(guān)系X,根據(jù)式1判斷出全局U/R肯定屬于供電可靠率RS-3的集合,這些集合的并集即為X的正域POS全局(X);步驟2-3、先按順序依次判斷刪減某個條件屬性后計(jì)算得到的POS刪減(X)與POS全局(X)是否相等,若相等即判定刪減的條件屬性為非核心條件屬性,不相等則判定其為核心條件屬性,再將所有的核心條件屬性放入集合Core中;步驟2-4、判斷POSCore(X)=POS全局(X)是否成立,若成立,則得到的集合Core即為全局屬性的最小屬性約簡集合,若不成立,則再計(jì)算每個非核心條件屬性的重要性,按照重要性由大到小的順序依次加入到集合Core中,直至POSCore(X)=POS全局(X)。所述步驟3依次包括以下步驟:步驟3-1、先根據(jù)提取出的條件因素的歷史數(shù)據(jù)生成輸入向量,并以其所對應(yīng)的供電可靠率RS-3的歷史數(shù)據(jù)作為輸出向量,再根據(jù)式2將以上輸入向量和輸出向量進(jìn)行歸一化處理,使處理后的數(shù)據(jù)均勻分布在[-1,1]內(nèi),同時,將處理后的數(shù)據(jù)隨機(jī)選取70%作為訓(xùn)練數(shù)據(jù),剩余的30%作為測試數(shù)據(jù);式中,x、y分別為輸入向量、輸出向量;步驟3-2、選用三層的BP神經(jīng)網(wǎng)絡(luò),以提取出的條件因素的個數(shù)n作為神經(jīng)網(wǎng)絡(luò)的輸入層神經(jīng)元個數(shù),隱含層神經(jīng)元個數(shù)m取2n+1,預(yù)測值選用供電可靠率RS-3,即輸出層神經(jīng)元個數(shù)k為1,通過式3、4、5、6計(jì)算神經(jīng)網(wǎng)絡(luò)的預(yù)測輸出與期望輸出的誤差,若該誤差不滿足精度要求,則從輸出層反向傳播該誤差以調(diào)整連接權(quán)值和閾值,使神經(jīng)網(wǎng)絡(luò)的預(yù)測輸出和期望輸出的誤差逐漸減小,直至滿足精度要求;上式中,H為隱含層的輸出,wij為輸入層與隱含層的連接權(quán)值,aj為隱含層閾值,O為輸出層的預(yù)測輸出,wjk為隱含層與輸出層的連接權(quán)值,bk為輸出層閾值,zk為期望輸出,e為輸出層的預(yù)測輸出與期望輸出的誤差;步驟3-3、在[-εinit,εinit]內(nèi)隨機(jī)取值來初始化BP神經(jīng)網(wǎng)絡(luò)的權(quán)重和閾值賦值,其中,n和m分別為輸入層和輸出層神經(jīng)元個數(shù);步驟3-4、將所述訓(xùn)練數(shù)據(jù)輸入BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)生成預(yù)測模型,所述測試數(shù)據(jù)則經(jīng)過預(yù)測模型進(jìn)行供電可靠率RS-3的預(yù)測,并與測試數(shù)據(jù)的實(shí)際供電可靠率RS-3進(jìn)行對比分析,調(diào)整參數(shù)直至得出能滿足要求精度的模型。所述步驟3-3中,初始化BP神經(jīng)網(wǎng)絡(luò)的權(quán)重和閾值賦值后,采用遺傳算法優(yōu)化出最佳的初始權(quán)重和閾值。所述步驟1中,電力企業(yè)的外部數(shù)據(jù)采用網(wǎng)絡(luò)爬蟲技術(shù)從互聯(lián)網(wǎng)中搜集得到。與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果為:1、本發(fā)明一種基于大數(shù)據(jù)相關(guān)性分析的配電網(wǎng)供電可靠性預(yù)測方法先采用粗糙集理論從搜集到的配電網(wǎng)大數(shù)據(jù)中提取出與配電網(wǎng)可靠性相關(guān)性較強(qiáng)的條件因素,去除冗余條件因素,避免其對后期神經(jīng)網(wǎng)絡(luò)的訓(xùn)練造成干擾,然后利用提取出的相關(guān)性較強(qiáng)的條件因素搭建BP神經(jīng)網(wǎng)絡(luò)進(jìn)行配網(wǎng)供電可靠性評估預(yù)測,該法不僅能夠?qū)崿F(xiàn)配電網(wǎng)大數(shù)據(jù)的有效處理,而且利用BP神經(jīng)網(wǎng)絡(luò)良好的非線性函數(shù)逼近能力,可顯著改善預(yù)測模型的精度和泛化能力。因此,本發(fā)明方法適用于配電網(wǎng)大數(shù)據(jù)的處理。2、本發(fā)明一種基于大數(shù)據(jù)相關(guān)性分析的配電網(wǎng)供電可靠性預(yù)測方法采用全局搜索能力較強(qiáng)的遺傳算法來優(yōu)化出BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)重和閾值,可解決BP神經(jīng)網(wǎng)絡(luò)易陷入局部極小值的問題,提高供電可靠性預(yù)測的準(zhǔn)確性。因此,本發(fā)明提高了預(yù)測的準(zhǔn)確性。附圖說明圖1為配電網(wǎng)大數(shù)據(jù)的數(shù)據(jù)源。圖2為本發(fā)明的總體流程圖。具體實(shí)施方式下面結(jié)合具體實(shí)施方式對本發(fā)明作進(jìn)一步詳細(xì)的說明。參見圖2,一種基于大數(shù)據(jù)相關(guān)性分析的配電網(wǎng)供電可靠性預(yù)測方法,依次包括以下步驟:步驟1、收集電力企業(yè)的配電網(wǎng)大數(shù)據(jù),該配電網(wǎng)大數(shù)據(jù)包括量測數(shù)據(jù)、運(yùn)營數(shù)據(jù)以及外部數(shù)據(jù);步驟2、采用粗糙集理論從收集到的配電網(wǎng)大數(shù)據(jù)中提取出與配網(wǎng)供電可靠性的相關(guān)性較強(qiáng)的條件因素;步驟3、利用提取出的條件因素搭建BP神經(jīng)網(wǎng)絡(luò)進(jìn)行配網(wǎng)供電可靠性評估預(yù)測。所述步驟2依次包括以下步驟:步驟2-1、按照所有的條件屬性和決策屬性供電可靠率RS-3對所述配電網(wǎng)大數(shù)據(jù)進(jìn)行分類,以形成知識庫;步驟2-2、根據(jù)所有條件屬性對所述知識庫中的樣本進(jìn)行劃分,得到整體的不可分辨關(guān)系U/R,同時,按照決策屬性供電可靠率RS-3對知識庫中的樣本進(jìn)行劃分,得到一個不可分辨關(guān)系X,根據(jù)式1判斷出全局U/R肯定屬于供電可靠率RS-3的集合,這些集合的并集即為X的正域POS全局(X);步驟2-3、先按順序依次判斷刪減某個條件屬性后計(jì)算得到的POS刪減(X)與POS全局(X)是否相等,若相等即判定刪減的條件屬性為非核心條件屬性,不相等則判定其為核心條件屬性,再將所有的核心條件屬性放入集合Core中;步驟2-4、判斷POSCore(X)=POS全局(X)是否成立,若成立,則得到的集合Core即為全局屬性的最小屬性約簡集合,若不成立,則再計(jì)算每個非核心條件屬性的重要性,按照重要性由大到小的順序依次加入到集合Core中,直至POSCore(X)=POS全局(X)。所述步驟3依次包括以下步驟:步驟3-1、先根據(jù)提取出的條件因素的歷史數(shù)據(jù)生成輸入向量,并以其所對應(yīng)的供電可靠率RS-3的歷史數(shù)據(jù)作為輸出向量,再根據(jù)式2將以上輸入向量和輸出向量進(jìn)行歸一化處理,使處理后的數(shù)據(jù)均勻分布在[-1,1]內(nèi),同時,將處理后的數(shù)據(jù)隨機(jī)選取70%作為訓(xùn)練數(shù)據(jù),剩余的30%作為測試數(shù)據(jù);式中,x、y分別為輸入向量、輸出向量;步驟3-2、選用三層的BP神經(jīng)網(wǎng)絡(luò),以提取出的條件因素的個數(shù)n作為神經(jīng)網(wǎng)絡(luò)的輸入層神經(jīng)元個數(shù),隱含層神經(jīng)元個數(shù)m取2n+1,預(yù)測值選用供電可靠率RS-3,即輸出層神經(jīng)元個數(shù)k為1,通過式3、4、5、6計(jì)算神經(jīng)網(wǎng)絡(luò)的預(yù)測輸出與期望輸出的誤差,若該誤差不滿足精度要求,則從輸出層反向傳播該誤差以調(diào)整連接權(quán)值和閾值,使神經(jīng)網(wǎng)絡(luò)的預(yù)測輸出和期望輸出的誤差逐漸減小,直至滿足精度要求;上式中,H為隱含層的輸出,wij為輸入層與隱含層的連接權(quán)值,aj為隱含層閾值,O為輸出層的預(yù)測輸出,wjk為隱含層與輸出層的連接權(quán)值,bk為輸出層閾值,zk為期望輸出,e為輸出層的預(yù)測輸出與期望輸出的誤差;步驟3-3、在[-εinit,εinit]內(nèi)隨機(jī)取值來初始化BP神經(jīng)網(wǎng)絡(luò)的權(quán)重和閾值賦值,其中,n和m分別為輸入層和輸出層神經(jīng)元個數(shù);步驟3-4、將所述訓(xùn)練數(shù)據(jù)輸入BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)生成預(yù)測模型,所述測試數(shù)據(jù)則經(jīng)過預(yù)測模型進(jìn)行供電可靠率RS-3的預(yù)測,并與測試數(shù)據(jù)的實(shí)際供電可靠率RS-3進(jìn)行對比分析,調(diào)整參數(shù)直至得出能滿足要求精度的模型。所述步驟3-3中,初始化BP神經(jīng)網(wǎng)絡(luò)的權(quán)重和閾值賦值后,采用遺傳算法優(yōu)化出最佳的初始權(quán)重和閾值。所述步驟1中,電力企業(yè)的外部數(shù)據(jù)采用網(wǎng)絡(luò)爬蟲技術(shù)從互聯(lián)網(wǎng)中搜集得到。本發(fā)明的原理說明如下:由附圖1中能夠看出,電力企業(yè)的內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)量是非常巨大的,其中的條件因素是否與配電網(wǎng)供電可靠性存在關(guān)聯(lián)不一定能通過經(jīng)驗(yàn)判斷,為此,本發(fā)明提出了一種基于大數(shù)據(jù)相關(guān)性分析的配電網(wǎng)供電可靠性預(yù)測方法,其利用粗糙集理論從收集到的配電網(wǎng)大數(shù)據(jù)中挖掘出與配電網(wǎng)可靠性相關(guān)性較強(qiáng)的條件因素,然后利用提取出的條件因素和地區(qū)配電網(wǎng)可靠性指標(biāo)的歷史統(tǒng)計(jì)數(shù)據(jù),通過搭建好的GA-BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練學(xué)習(xí)生成預(yù)測模型,實(shí)現(xiàn)對目標(biāo)年的配電網(wǎng)供電可靠性準(zhǔn)確、快速的評估,保證電網(wǎng)運(yùn)行的安全性和可靠性。實(shí)施例1:參見圖2,一種基于大數(shù)據(jù)相關(guān)性分析的配電網(wǎng)供電可靠性預(yù)測方法,依次按照以下步驟進(jìn)行:1、從電力行業(yè)相關(guān)部門盡量多的收集電力企業(yè)相關(guān)量測數(shù)據(jù)和運(yùn)營數(shù)據(jù),并使用python語言、利用html5lib、beautifulSoup4等第三方庫編寫網(wǎng)絡(luò)爬蟲程序從互聯(lián)網(wǎng)上搜集電力企業(yè)外部數(shù)據(jù);2、將上述數(shù)據(jù)按照所有的條件屬性和決策屬性供電可靠率RS-3進(jìn)行分類,形成知識庫,具體見下表:3、根據(jù)所有條件屬性對上述知識庫中的樣本進(jìn)行劃分,得到整體的不可分辨關(guān)系U/R,如按照氣象預(yù)報(bào)系統(tǒng)中的濕度進(jìn)行劃分,得到的一個不可分辨關(guān)系U/濕度:{(1),(2,N),(N-2,N-1)},按照氣象預(yù)報(bào)系統(tǒng)中的惡劣天氣日數(shù)進(jìn)行劃分,得到的一個不可分辨關(guān)系U/惡劣天氣日數(shù):{(1,2),(N-2,N),(N-1)},同時,按照決策屬性供電可靠率RS-3對知識庫中的樣本進(jìn)行劃分,得到一個不可分辨關(guān)系X:{(1,2),(N-2,N),(N-1)};根據(jù)式1判斷出全局U/R肯定屬于供電可靠率RS-3的集合,這些集合的并集(1,2,N-2,N-1,N)即為X的正域POS全局(X);4、先按順序依次判斷刪減某個條件屬性后計(jì)算得到的POS刪減(X)與POS全局(X)是否相等,若相等即判定刪減的條件屬性為非核心條件屬性,不相等則判定其為核心條件屬性,如刪減濕度屬性后,U/(R刪去濕度屬性):{(1),(2),(N-2,N),(N-1)},則POS全局刪去濕度(X)=(1,2,N-2,N-1,N)=POS全局(X),判定濕度屬性為非核心條件屬性,刪減惡劣天氣日數(shù)屬性后,U/(R刪去惡劣天氣日數(shù)屬性):{(1),(2,N),(N-2,N-1)},X:{(1,2),(N-2,N),(N-1)},則POS全局刪去惡劣天氣日數(shù)(X)=(N-1)≠POS全局(X),判定惡劣天氣日數(shù)屬性為核心條件屬性,再將所有的核心條件屬性放入集合Core中;5、判斷POSCore(X)=POS全局(X)是否成立,若成立,則得到的集合Core即為全局屬性的最小屬性約簡集合,若不成立,則再計(jì)算每個非核心條件屬性的重要性,按照重要性由大到小的順序依次加入到集合Core中,直至POSCore(X)=POS全局(X);6、先根據(jù)集合Core中的條件因素的歷史數(shù)據(jù)生成輸入向量,并以其所對應(yīng)的供電可靠率RS-3的歷史數(shù)據(jù)作為輸出向量,再根據(jù)式2將以上輸入向量和輸出向量進(jìn)行歸一化處理,使處理后的數(shù)據(jù)均勻分布在[-1,1]內(nèi),同時,將處理后的數(shù)據(jù)隨機(jī)選取70%作為訓(xùn)練數(shù)據(jù),剩余的30%作為測試數(shù)據(jù);式中,x、y分別為輸入向量、輸出向量;7、選用三層的BP神經(jīng)網(wǎng)絡(luò),以提取出的條件因素的個數(shù)n作為神經(jīng)網(wǎng)絡(luò)的輸入層神經(jīng)元個數(shù),隱含層神經(jīng)元個數(shù)m取2n+1,預(yù)測值選用供電可靠率RS-3,即輸出層神經(jīng)元個數(shù)k為1,通過式3、4、5、6計(jì)算神經(jīng)網(wǎng)絡(luò)的預(yù)測輸出與期望輸出的誤差,若該誤差不滿足精度要求,則從輸出層反向傳播該誤差以調(diào)整連接權(quán)值和閾值,使神經(jīng)網(wǎng)絡(luò)的預(yù)測輸出和期望輸出的誤差逐漸減小,直至滿足精度要求;上式中,H為隱含層的輸出,wij為輸入層與隱含層的連接權(quán)值,aj為隱含層閾值,O為輸出層的預(yù)測輸出,wjk為隱含層與輸出層的連接權(quán)值,bk為輸出層閾值,zk為期望輸出,e為輸出層的預(yù)測輸出與期望輸出的誤差;8、在小范圍[-εinit,εinit]內(nèi)隨機(jī)取值來初始化BP神經(jīng)網(wǎng)絡(luò)的權(quán)重和閾值賦值,其中,n和m分別為輸入層和輸出層神經(jīng)元個數(shù);9、采用遺傳算法優(yōu)化出最佳的初始權(quán)重和閾值,此時,BP神經(jīng)網(wǎng)絡(luò)搭建完成,其中,遺傳算法的參數(shù)設(shè)定參考下表:種群大小最大遺傳代數(shù)交叉概率變異概率代溝401000.70.010.9510、將所述訓(xùn)練數(shù)據(jù)輸入BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)生成預(yù)測模型,所述測試數(shù)據(jù)則經(jīng)過預(yù)測模型進(jìn)行供電可靠率RS-3的預(yù)測,并與測試數(shù)據(jù)的實(shí)際供電可靠率RS-3進(jìn)行對比分析,調(diào)整參數(shù)直至得出能滿足要求精度的模型。為驗(yàn)證本發(fā)明方法的有效性,現(xiàn)分別收集2014年度、2015年度電力企業(yè)的配電網(wǎng)大數(shù)據(jù),采用實(shí)施例1所述方法對各年度的配電網(wǎng)供電可靠性進(jìn)行預(yù)測,結(jié)果如下:年份實(shí)際值預(yù)測值標(biāo)準(zhǔn)誤差201499.955099.95480.0002201599.938099.93780.0002由以上結(jié)果可以看出,采用本實(shí)施例所述預(yù)測模型得到的預(yù)測值與實(shí)際值的標(biāo)準(zhǔn)誤差僅為0.0002,本發(fā)明方法的準(zhǔn)確度和精度均較高。當(dāng)前第1頁1 2 3