基于數據挖掘技術的電力需求流向分析方法
【專利摘要】本發(fā)明提供了一種基于數據挖掘技術的電力需求流向分析方法,依次包括以下步驟:對原始數據集進行過濾,建立完整的區(qū)域用電密度模型;對區(qū)域用電密度模型進行克里格插值計算,得到所有未知點;利用三維曲面曲峰、曲谷方法得出數據增加最大點和減少最大點,進而得出增加區(qū)域中心和減少區(qū)域中心;對所有曲峰和曲谷兩兩組成有向線段,進而得到簡化的流向梯度圖;對所有有向線段進行匹配一致性計算,有匹配成功的有向線段組成數據的需求流向線段。本發(fā)明能夠將區(qū)域用電負荷流向數據與城市人口短期遷徙進行映射分析,從而為城市與電力設施規(guī)劃提供有效的決策支持。
【專利說明】
基于數據挖掘技術的電力需求流向分析方法
技術領域
[0001] 本發(fā)明涉及智能電網領域,尤其涉及一種基于數據挖掘技術的電力需求流向分析 方法。
【背景技術】
[0002] 數據挖掘是為了發(fā)現事先未知的規(guī)則和聯(lián)系而對大量數據進行選擇、探索和建模 的過程,目的在于得到對數據庫的擁有者來說清晰而有用的結果,其實質是在數據預處理 的基礎上,選擇合適算法,提取規(guī)則,進行評價和解釋,從而獲取隱藏在數據背后的知識。數 據挖掘是人們長期對數據庫技術進行研究和開發(fā)的結果。
[0003] 現代電力系統(tǒng)是一個非線性、復雜的巨型系統(tǒng),面對電力系統(tǒng)迅速膨脹的數據信 息量,數據挖掘的應用無疑具有重要的研究價值。區(qū)域性用電數據與用電負荷流向具有緊 密的需求聯(lián)系,應用數據挖掘技術可以深度剖析電力數據與片區(qū)用電負荷需求的多方面對 應關系,并最終建立數學模型進行數據挖掘計算。
【發(fā)明內容】
[0004] 本發(fā)明的目的在于提供一種基于數據挖掘技術的電力需求流向分析方法,能夠將 區(qū)域用電負荷流向數據與城市人口短期迀徙進行映射分析,從而為城市與電力設施規(guī)劃提 供有效的決策支持。
[0005] 為實現上述目的,本發(fā)明采用如下技術方案:
[0006] -種基于數據挖掘技術的電力需求流向分析及可視化方法,依次包括以下步驟:
[0007] (1)依次采集離散區(qū)域內的用電負荷密度數據,作為原始數據集,并將此原始數 據集進行過濾;
[0008] (2)組合各個離散區(qū)域用電負荷密度數據,建立完整的區(qū)域用電密度模型;
[0009] (3)對區(qū)域用電密度模型進行克里格插值計算,得到所有未知點;
[0010] ⑷對步驟⑶計算出的所有未知點按照時間順序兩兩做差,得出差值矩陣;
[0011] (5)利用三維曲面曲峰、曲谷方法得出數據增加最大點和減少最大點,進而得出增 加區(qū)域中心和減少區(qū)域中心;
[0012] (6)在步驟(5)中得到的三維峰谷矩陣中,對所有曲峰和曲谷兩兩組成有向線段, 進而得到簡化的流向梯度圖;
[0013] (7)對所有有向線段進行匹配一致性計算,其匹配原則如下:
[0014] a-pp|^ji/4
[0015] 其中,a表示有向線段的角度,β#示有向線段上p點的最大梯度流向角度;
[0016] 當有向線段上的所有點都滿足以上匹配原則則保留,否則舍棄。所有匹配成功的 有向線段組成數據的需求流向線段。
[0017] 所述步驟(5)中,三維峰谷計算的過程如下:
[0018]①首先進行二維波峰與波谷計算;
[0019] a、假投影曲線表示為V=[vl,v2,···,vn],n = l,2,......,n;
[0020] b、計算V的一階差分向量Diffv,
[0021] 01打彳1)=丫(1+1)1(〇,其中1£1,2,".,^1,01打表示差分向量;
[0022] C、對差分向量進行取符號函數運算Trend(i) = sign(Diffv),Trend表示位移向 量;
[0024] d、從尾部遍歷Trend向量,并進行如下操作:
[0025] if (Trend( i) =0&Trend( i+1 )^0) ,Trend( i) = 1
[0026] if (Trend(i) =0&Trend( i+1 )<0) ,Trend(i) =-1
[0027] e、對Trend向量進行一階差分運算,如步驟b,得到差分向量R = diff(Trend);
[0028] f、遍歷得到的差分向量R,如果R (i) = -2則i+1為曲線波峰位,對應的峰值為v (i+ 1);如果R( i) = 2,則i+1為投影向量V的一個波谷位,對應的波谷為v( i+1)。
[0029] ②對于一個方程為z = F(x,y)的三維曲面,若z在點(XQ,yQ)處具有偏導數,且在點 (xo,y 〇)處有極值,貝方程在該點的偏導數必然為零,即Fx (XQ,y 0) = 0,Fy (XQ,y 0) = 0。
[0030] 若z在點(XQ,yo)處連續(xù)且有一階及二階連續(xù)偏導數,且Fx(XQ,yo) = 0,Fy(XQ,yQ)= 0,令2在該點的二階偏導?^(叉。,7。)=厶,?燈(叉。,7。)=13而丫(叉。,7。)=(:〇
[0031]則z在(XQ,yQ)處是否取得極值的條件如下:
[0032] 1)AC-2B>0時具有極值,且當A〈0時有極大值,當A>0時有極小值;
[0033] 2)AC_2B〈0 時沒有極值;
[0034] 3)AC_2B = 0時可能有極值,也可能沒有極值,還需另作討論。
[0035]對于克里格插值計算的三維曲面,其峰谷值點的插值數值對應實際數據值,其所 對應的峰谷點對應的二階偏導數條件AC-2B>0,故峰谷的充分必要條件為:
[0039]③利用上述方法對所有采樣點進行三維峰谷計算,將所有曲峰值組成行矩陣,所 有曲谷值組成列矩陣,并對行矩陣和列矩陣進行疊加,得到三維峰谷矩陣,其中坐標為4的 位置即為曲峰,坐標為-4的位置即為曲谷。
[0040]④在三維峰谷矩陣中找出數據增加最大點和數據減少最大點,進而得出增加區(qū)域 中心和減少區(qū)域中心。
[0041 ]所述有向線段的方向為由減少區(qū)域中心指向增加區(qū)域中心,所述需求流向線段的 方向為由谷點指向峰點。
[0042] 本發(fā)明具有以下有益效果:
[0043] (1)可以實時記錄本區(qū)域用電量的變化,建立一定區(qū)域內負荷分布流向圖,從而建 立人口、交通迀徙圖,以便優(yōu)化公共交通、停車場及電動汽車充換電站的布局圖;
[0044] (2)可以將區(qū)域內用電負荷流向數據與城市人口短期迀徙進行映射分析,從而實 現通過區(qū)域用電負荷變化預測人口流動。
[0045] (3)能夠有效提尚電力調配的智能可靠性,提尚城市用電效率。
【附圖說明】
[0046] 圖1為本發(fā)明的流程圖。
【具體實施方式】
[0047] 如圖1所示,本發(fā)明所述的一種基于數據挖掘技術的電力需求流向分析及可視化 方法,具體包括以下步驟:
[0048] (1)依次采集離散區(qū)域內的用電負荷密度數據,作為原始數據集,并將此原始數據 集進行過濾;
[0049] (2)組合各個離散區(qū)域用電負荷密度數據,建立完整的區(qū)域用電密度模型;
[0050] (3)對區(qū)域用電密度模型進行克里格插值計算,得到所有未知點;
[0051 ]克里格插值法的通用公式為:
[0053]其中,Z(Xd表示已測得的第i個采樣點的測量值,Xi表示第i個采樣點,λ,表示第i 個采樣點處的測量值的權重,X〇表示預測點,表示預測點的估計值,N表示已知點的 數目,i = l,2,......,:?〇
[0054]克里格插值的關鍵在于權重的確定,權重不僅取決于測量點之間的距離、預測位 置,還取決于基于測量點的整體空間排列。在本實施例中,假設測量點滿足無偏性和有效 性,根據克里格插值法的通用公式可得到下述克里格方程組:
[0056]其中,λΗΧ取決于一直點與預測位置的距離;γ (XhXj表示以ΧηΧ」兩點間的距離 作為間距h時,的測量值的半方差值;γ (XuXo)表示以ΧηΧο兩點間的距離作為間距h 時,Xi和Xo的測量值的半方差值,j = 1,2,……,j。由上式可知,只要有未知點的半方差γ (h) 的參數方程,便可求得各個半方差值。本實施例采用的半方差γ (h)的參數方程如下:
[0058]其中CAZ(Xi)的方差,Co為初始方差,〇) = 0.1&。
[0059] 由上式得出各個測量點之間的半方差及權重系數,代入權重方程,即可估算處所 有未知點的估計值。
[0060] 克里格插值計算為現有技術,不再贅述。
[0061] (4)對步驟(3)計算出的所有未知點按照時間順序兩兩做差,得出差值矩陣;
[0062] (5)利用三維峰谷計算得出數據增加最大點和減少最大點,進而得出增加區(qū)域中 心和減少區(qū)域中心;
[0063]需求流向的一個潛在假設在于整個區(qū)域的整體電力需求基本不變,此時電力需求 增加的區(qū)域所需的部分由臨近需求減少的區(qū)域提供,由減少區(qū)域中心指向增加區(qū)域中心的 方向線被稱為流向線。
[0064]三維峰谷計算的方法如下:
[0065]①首先進行二維波峰與波谷計算;
[0066] a、假投影曲線表示為V=[vl,v2,···,vn],n = l,2,......,n;
[0067] b、計算V的一階差分向量Diffv,
[0068] 01打彳1)=¥(1+1)1(〇,其中1£1,2,".,11,01打表示差分向量;
[0069] C、對差分向量進行取符號函數運算Trend(i) = sign(Diffv),Trend表示位移向 量;
[0071] d、從尾部遍歷Trend向量,并進行如下操作:
[0072] if (Trend( i) =0&Trend( i+1 )^0) ,Trend( i) = 1
[0073] if (Trend(i) =0&Trend( i+1 )<0) ,Trend(i) =-1
[0074] e、對Trend向量進行一階差分運算,如步驟b,得到差分向量R = diff(Trend);
[0075] f、遍歷得到的差分向量R,如果R (i) = -2則i+1為曲線波峰位,對應的峰值為v (i+ 1);如果R( i) = 2,則i+1為投影向量V的一個波谷位,對應的波谷為v( i+1)。
[0076]②對于一個方程為z = F(x,y)的三維曲面,若z在點(XQ,yo)處具有偏導數,且在點 (xo,yo)處有極值,貝方程在該點的偏導數必然為零,即Fx(xq,yo) = 0,Fy(xq,yo) = 0。
[0077]若z在點(XQ,yo)處連續(xù)且有一階及二階連續(xù)偏導數,且Fx(XQ,yo)=0,Fy(X(),y()) = 0,令2在該點的二階偏導?^(叉。,7。)=厶,?燈(叉。,7。)=13而丫(叉。,7。)=(:〇
[0078]貝ijz在(XQ,yQ)處是否取得極值的條件如下:
[0079] 1)AC_2B>0時具有極值,且當A〈0時有極大值,當A>0時有極小值;
[0080] 2)AC-2B〈0 時沒有極值;
[0081 ] 3)AC-2B = 0時可能有極值,也可能沒有極值,還需另作討論。
[0082]對于克里格插值計算的三維曲面,其峰谷值點的插值數值對應實際數據值,其所 對應的峰谷點對應的二階偏導數條件AC-2B>0,故峰谷的充分必要條件為:
[0086] ③利用上述方法對所有采樣點進行三維峰谷計算,將所有曲峰值組成行矩陣,所 有曲谷值組成列矩陣,并對行矩陣和列矩陣進行疊加,得到三維峰谷矩陣,其中坐標為4的 位置即為曲峰,坐標為-4的位置即為曲谷。
[0087] ④在三維峰谷矩陣中找出數據增加最大點和數據減少最大點,進而得出增加區(qū)域 中心和減少區(qū)域中心。
[0088] (6)在步驟(5)中得到的三維峰谷矩陣中,對所有曲峰和曲谷兩兩組成有向線段, 有向線段的方向為由減少區(qū)域中心指向增加區(qū)域中心,進而得到簡化的流向梯度圖;
[0089] (7)對所有有向線段進行匹配一致性計算,其匹配原則如下:
[0090] a-Pp|^Ji/4
[0091] 其中,a表示有向線段與水平線的角度,6表示有向線段上任一點P的最大梯度流 向角度;
[0092] 當有向線段上的所有點都滿足以上匹配原則則保留,否則舍棄。所有匹配成功的 有向線段組成數據的需求流向線段,其方向為由谷點指向峰點。
[0093] 根據此需求流向線段,可以預測人口流動情況,建立人口、交通迀徙圖,以便優(yōu)化 公共交通、停車場及電動汽車充換電站的布局圖,有效地提高電力調配的智能可靠性,提高 城市用電效率。
[0094] 實施例一
[0095] 在本實施例中,使用一個樣本數據集A,對樣本數據集A進行插值計算,并對插值計 算后的數據集A進行峰谷計算;逐一處理各個數據點,得出簡化的流向梯度矩陣,按照梯度 簡化原則對數據集計算,得出整體的流向圖。
[0096] 本發(fā)明能夠將區(qū)域用電負荷流向數據與城市人口短期迀徙進行映射分析,從而為 城市與電力設施規(guī)劃提供有效的決策支持。
【主權項】
1. 一種基于數據挖掘技術的電力需求流向分析方法,其特征在于,依次包括W下步驟: (1) 依次采集離散區(qū)域內的用電負荷密度數據,作為原始數據集,并將此原始數據集進 行過濾; (2) 組合各個離散區(qū)域用電負荷密度數據,建立完整的區(qū)域用電密度模型; (3) 對區(qū)域用電密度模型進行克里格插值計算,得到所有未知點; (4) 對步驟(3)計算出的所有未知點按照時間順序兩兩做差,得出差值矩陣; (5) 利用Ξ維曲面曲峰、曲谷方法得出數據增加最大點和減少最大點,進而得出增加區(qū) 域中屯、和減少區(qū)域中屯、; (6) 在步驟(5)中得到的Ξ維峰谷矩陣中,對所有曲峰和曲谷兩兩組成有向線段,進而 得到簡化的流向梯度圖; (7) 對所有有向線段進行匹配一致性計算,其匹配原則如下: 曰-βρ I《ji/4 其中,α表示有向線段的角度,0Ρ表示有向線段上P點的最大梯度流向角度; 當有向線段上的所有點都滿足W上匹配原則則保留,否則舍棄。所有匹配成功的有向 線段組成數據的需求流向線段。2. 如權利要求1所述的一種基于數據挖掘技術的電力需求流向分析方法,其特征在于, 所述步驟(5)中,Ξ維峰谷計算的過程如下: ① 首先進行二維波峰與波谷計算; a、 假投影曲線表示為 V=[vl ,v2,··· ,νη],n=l,2,......,n; b、 計算V的一階差分向量Diffv, DiffV(i)=v(i+l)-v(i),其中iel,2,…,N-l,Diff表示差分向量; c、 對差分向量進行取符號函數運算化end(i) = sign化iffv),化end表示位移向量;d、 從尾部遍歷Trend向量,并進行如下操作: if (Trend (i) = O&Trend (i+l)^0), Trend (i) = 1 if (Trend(i) = 0&Trend(i+l )<0) ,Trend(i) = -1 e、 對Trend向量進行一階差分運算,如步驟b,得到差分向量R=diff (Trend); f、 遍歷得到的差分向量R,如果R(i)=-2則i+1為曲線波峰位,對應的峰值為v(i+l);如 果R(i)=2,則i+1為投影向量V的一個波谷位,對應的波谷為v(i+l)。 ② 對于一個方程為z = F(x,y)的Ξ維曲面,若Z在點(xo,yo)處具有偏導數,且在點(X0, yo)處有極值,則方程在該點的偏導數必然為零,即Fx (X0,yo) = 0,Fy (X0,yo) = 0。 若z在點(xo,yo)處連續(xù)且有一階及二階連續(xù)偏導數,且Fx(xo,yo) =0,Fy(xo,yo) = 0,令z 在該點的二階偏導片義(又〇,7〇)=4,尸巧(又〇,7〇)=8,尸巧(》),7〇)=(:。 則z在(xo,yo)處是否取得極值的條件如下: 1 )AC-2B〉0時具有極值,且當A<0時有極大值,當A〉0時有極小值; 2. AC-2B<0時沒有極值; 3. AC-2B = 0時可能有極值,也可能沒有極值,還需另作討論。 對于克里格插值計算的Ξ維曲面,其峰谷值點的插值數值對應實際數據值,其所對應 的峰谷點對應的二階偏導數條件AC-2B〉0,故峰谷的充分必要條件為:③ 利用上述方法對所有采樣點進行Ξ維峰谷計算,將所有曲峰值組成行矩陣,所有曲 谷值組成列矩陣,并對行矩陣和列矩陣進行疊加,得到Ξ維峰谷矩陣,其中坐標為4的位置 即為曲峰,坐標為-4的位置即為曲谷。 ④ 在Ξ維峰谷矩陣中找出數據增加最大點和數據減少最大點,進而得出增加區(qū)域中屯、 和減少區(qū)域中屯、。3.如權利要求1所述的一種基于數據挖掘技術的電力需求流向分析方法,其特征在于: 所述有向線段的方向為由減少區(qū)域中屯、指向增加區(qū)域中屯、,所述需求流向線段的方向為由 谷點指向峰點。
【文檔編號】G06Q10/04GK106096768SQ201610401753
【公開日】2016年11月9日
【申請日】2016年6月8日
【發(fā)明人】孫芊, 馬建偉, 李強, 張景超, 荊驍睿, 徐恒博, 徐銘銘, 牛榮澤, 肖寒, 趙理
【申請人】國網河南省電力公司電力科學研究院, 國網河南省電力公司, 國家電網公司