一種基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法,尤其是涉及一種基于 密度的改進(jìn)kieans聚類(lèi)(Modified Density K-means Clustering,MDKC)和Fr6chet距離 判別分析(Frgchet Distance Discriminant Analysis,F(xiàn)DDA)算法的電價(jià)執(zhí)行稽查方法, 屬于電價(jià)執(zhí)行稽查方法的創(chuàng)新技術(shù)。
【背景技術(shù)】
[0002] 電費(fèi)收入是供電企業(yè)最主要的經(jīng)營(yíng)收入來(lái)源,按期按量回收電費(fèi)是供電企業(yè)的重 要經(jīng)濟(jì)指標(biāo)之一。隨著智能電網(wǎng)大數(shù)據(jù)的發(fā)展,配用電環(huán)節(jié)產(chǎn)生的數(shù)據(jù)量大、多維度、處理 邏輯復(fù)雜、存儲(chǔ)周期長(zhǎng)、計(jì)算頻度高等大數(shù)據(jù)特征,傳統(tǒng)的營(yíng)銷(xiāo)稽查方法已無(wú)法滿(mǎn)足智能電 網(wǎng)大數(shù)據(jù)分析的需求。
[0003] 目前的電價(jià)執(zhí)行營(yíng)銷(xiāo)稽查主要依靠定期巡檢、隨機(jī)抽樣等方法,工作方式被動(dòng)且 稽查目標(biāo)很不明確,無(wú)法及時(shí)發(fā)現(xiàn)并取締電價(jià)執(zhí)行異常用戶(hù)。
[0004] 近年來(lái),隨著數(shù)據(jù)挖掘技術(shù)和智能算法的發(fā)展,k均值(kmeans)算法逐步被運(yùn)用到 電力營(yíng)銷(xiāo)中來(lái),如智能客戶(hù)分群等。但是kmeans算法也存在許多不足,如初始聚類(lèi)中心隨機(jī) 選取,聚類(lèi)結(jié)果不穩(wěn)定;容易陷入聚類(lèi)結(jié)果的局部最優(yōu)解等。此外,判別分析方法也在電力 系統(tǒng)領(lǐng)域分析得到一定的應(yīng)用。然而,利用數(shù)據(jù)挖掘技術(shù)和智能算法等方法實(shí)現(xiàn)電價(jià)執(zhí)行 在線稽查的研究尚屬空白。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于提供一種基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法,本發(fā)明以 充分利用及分析智能電網(wǎng)中海量計(jì)量營(yíng)銷(xiāo)系統(tǒng)中的實(shí)時(shí)數(shù)據(jù),實(shí)現(xiàn)電價(jià)執(zhí)行營(yíng)銷(xiāo)稽查的智 能化和精確化。
[0006] 本發(fā)明采用的技術(shù)方案是:
[0007] 本發(fā)明基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法,包括以下步驟:
[0008] 1)利用數(shù)據(jù)預(yù)處理模塊對(duì)電力用戶(hù)用電數(shù)據(jù)進(jìn)行處理;
[0009] 2)利用聚類(lèi)算法構(gòu)建電力用戶(hù)典型用電軌跡專(zhuān)家?guī)欤?br>[0010] 3)利用距離判別分析算法實(shí)現(xiàn)對(duì)電力用戶(hù)電價(jià)執(zhí)行稽查。
[0011] 上述步驟1)中,數(shù)據(jù)預(yù)處理模塊包括數(shù)據(jù)獲取,數(shù)據(jù)缺失值處理,數(shù)據(jù)"去噪"處 理;
[0012] 數(shù)據(jù)缺失值處理采用三次樣條插值法,其利用的公式為:
[0014]其中,電力用戶(hù)用電特性曲線滿(mǎn)足71 = 5(11),11為5(11)在1 = 11出的二階導(dǎo)數(shù),111 = Xi-Xi-1為增量;
[0015]數(shù)據(jù)"去噪"處理采用高斯濾波對(duì)電力用戶(hù)用電特性曲線進(jìn)行曲線平滑處理,公式 如下:
[0017] 式中,ie[l,n],n為樣本個(gè)數(shù),σ為樣本方差。
[0018] 上述步驟2)中,聚類(lèi)算法構(gòu)建電力用戶(hù)典型用電軌跡專(zhuān)家?guī)斓木唧w步驟為:
[0019] 21)初始化最大聚類(lèi)數(shù)kmax,最大和最小的密度參數(shù)調(diào)整系數(shù)amax,a min,收斂判決 ξ,初始迭代標(biāo)志I ter;
[0020] 22)計(jì)算每個(gè)樣本點(diǎn)的密度參數(shù)值,其計(jì)算公式如下:
[0021 ] Density(Pi,ε)=|Neighbor(Pi, ε)
[0022] 其中,Pi為樣本點(diǎn),i e [ 1,η],ε為半徑;
[0023] 23)根據(jù)步驟22)求出所有點(diǎn)的密度參數(shù)值,形成密度參數(shù)集合Den并按降冪排序, 利用高密度閾值〇_也,取出其中的部分高密度參數(shù)AH_Den作為初始聚類(lèi)中心的選擇對(duì)象; [0024] 24)在HiDen中選取最大密度參數(shù)值所對(duì)應(yīng)的數(shù)據(jù)對(duì)象作為第1個(gè)聚類(lèi)中心C!,并 將&的密度參數(shù)值從高密度集合&中刪除;
[0025] 25)選取HiDen中距離&最遠(yuǎn)的數(shù)據(jù)對(duì)象作為第2個(gè)聚類(lèi)中心C2,并將C2所對(duì)應(yīng)的密 度參數(shù)值從高密度集合HiDen中刪除;
[0026] 26)計(jì)算HiDen所對(duì)應(yīng)的數(shù)據(jù)對(duì)象與&,&的距離(ΚΧ,&)和(1(乂,(:2)4已3,(: 3為滿(mǎn)足 1^奴(101(:1),(1〇1(:2))所對(duì)應(yīng)的數(shù)據(jù)對(duì)象,并將(:3從高密度集合把〇 611中刪除;
[0027] 27)重復(fù)步驟25),直到產(chǎn)生個(gè)聚類(lèi)中心為止,k為聚類(lèi)數(shù);
[0028] 28)根據(jù)樣本集與聚類(lèi)中心的最小歐式距離來(lái)分配類(lèi)簇,計(jì)算公式如下
[0029] Dist(xt,Ck( Iter)) =min{Dist(xt,C(j)( Iter) ),j = l,2,…,k}
[0030] 其中xt為第j的樣本,CW (I ter)為第I ter次迭代的聚類(lèi)中心;
[0031] 29)計(jì)算誤差準(zhǔn)則函數(shù)
[0033] 其中〗e (7?.你,CG)(Iter)和如分別是第Iter次迭代中第j類(lèi)的聚類(lèi)中心和 該類(lèi)的樣本個(gè)數(shù);
[0034] 30)重復(fù)步驟23)和步驟24),直到滿(mǎn)足|j(Iter)-J(Iter-l)|<|停止;
[0035] 31)利用組合聚類(lèi)評(píng)價(jià)指標(biāo)DBI和得分評(píng)價(jià)指標(biāo)SCORE,結(jié)合高密度閾值0_他對(duì)聚 類(lèi)結(jié)果進(jìn)行評(píng)價(jià),相應(yīng)的公式如下:
[0037]
表示類(lèi)間距離,Xl,m,Cl分別表示第i的數(shù)據(jù)對(duì)象,個(gè)數(shù)以及 對(duì)應(yīng)的聚類(lèi)中心;dij表示聚類(lèi)中心Ci和Cj的歐式距離;
[0040]表示當(dāng)前聚類(lèi)結(jié)果中各個(gè)類(lèi)簇內(nèi)對(duì)象與類(lèi)簇中心的最大距離之和的平均值,即聚 類(lèi)平均半徑;
[0042]表示當(dāng)前聚類(lèi)結(jié)果中各個(gè)類(lèi)簇內(nèi)所有對(duì)象與其余對(duì)象之間最小距離之和的平均 值,即聚類(lèi)平均最小間距;特別地,當(dāng)聚類(lèi)數(shù)為1時(shí),聚類(lèi)平均最小間距為〇;
[0043] 32)選取最大得分評(píng)價(jià)指標(biāo)值S0CRE所對(duì)應(yīng)的k做為最佳聚類(lèi)數(shù),形成電力用戶(hù)典 型用電軌跡。
[0044] 上述步驟3)中,電力用戶(hù)電價(jià)執(zhí)行稽查判別具體步驟如下:
[0045] 41)利用MDKC聚類(lèi)算法構(gòu)建每種電價(jià)類(lèi)別的典型用電軌跡,形成典型用電軌跡專(zhuān) 家?guī)欤?br>[0046] 42)計(jì)算待判定用戶(hù)與其典型用電軌跡的Fr6chet距離,其計(jì)算
[0047] 公式如下:
[0050]其中A,B為兩條用電軌跡曲線;
[0051] 43)設(shè)置異常判別閾值fre_th,根據(jù)樣本與典型軌跡的距離是否在允許范圍內(nèi),得 出異常嫌疑客戶(hù);
[0052 ] 44)結(jié)合指標(biāo)嫌疑系數(shù)閾值ab_rat i o_th,確定用戶(hù)異常名單;
[0053] 45)計(jì)算嫌疑異常用戶(hù)與典型用電軌跡專(zhuān)家?guī)熘忻糠N用電軌跡的歐式距離,距離 最小的典型用電軌跡即為嫌疑異常用戶(hù)實(shí)際執(zhí)行的電價(jià)類(lèi)別;
[0054] 46)形成最終的電價(jià)執(zhí)行異常用戶(hù)名單。
[0055] 與現(xiàn)有技術(shù)相比,本發(fā)明具有如下顯著的效果:
[0056] (1)本發(fā)明提出的一種基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法原理簡(jiǎn)單明了, 穩(wěn)定性高,稽查精度高;
[0057] (2)本發(fā)明提出的一種基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法,采用基于密度 的改進(jìn)kmeans (MDKC)算法,有效地利用數(shù)據(jù)樣本的密度來(lái)選取初始聚類(lèi)中心。至于最佳聚 類(lèi)數(shù)的確定,貝>1采用了綜合〇3¥16 8-8〇111(1;[11111(161(081)指標(biāo)和一種新的評(píng)價(jià)指標(biāo)(即 SCORE指標(biāo))的組合聚類(lèi)評(píng)價(jià)指標(biāo)擇優(yōu)方法;在新用戶(hù)的判別分析方面,采用了一種更為高 級(jí)的Frgchet距離判別方法(FDDA),從而極大地提高了判別結(jié)果的精度。
[0058] (3)本發(fā)明提出的一種基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法能夠?qū)崟r(shí)獲取 計(jì)量營(yíng)銷(xiāo)系統(tǒng)中的客戶(hù)用電數(shù)據(jù)進(jìn)行分析,從而實(shí)現(xiàn)電價(jià)執(zhí)行稽查的在線運(yùn)作,提高了營(yíng) 銷(xiāo)稽查工作的智能性。
[0059] 本發(fā)明能夠?qū)崿F(xiàn)用電行為軌跡的智能分析和辨識(shí);實(shí)現(xiàn)客戶(hù)電價(jià)執(zhí)行的遠(yuǎn)程在線 診斷,提高營(yíng)銷(xiāo)稽查的針對(duì)性、準(zhǔn)確性和時(shí)效性。
【附圖說(shuō)明】
[0060] 圖1為本發(fā)明的一種基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法的總體框圖;
[0061] 圖2為本發(fā)明的一種基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法之MDKC算子的流程 圖;
[0062] 圖3為本發(fā)明的一種基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法之H)DA算子的流程 圖。
【具體實(shí)施方式】
[0063]如圖2所示為本發(fā)明的一種基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法MDKC算子在 某電網(wǎng)的應(yīng)用流程圖,包括以下步驟:
[0064] 步驟1,結(jié)合數(shù)據(jù)集的特點(diǎn),初始化最大聚類(lèi)數(shù)kmax= 15,最大和最小的密度參數(shù) 調(diào)整系數(shù)amax = 0.8,amin = 〇. 5,收斂判據(jù)ξ = 0.0001,初始迭代標(biāo)志I ter = 1;
[0065] 步驟2,根據(jù)密度參數(shù)值來(lái)確定初始聚類(lèi)中心,具體步驟如下:
[0066] ⑴根據(jù)公式
[0067] Density(Pi,e)= |Neighbor(Pi,e) |,其中,Pi為樣本點(diǎn),ie[l,n],e為半徑;
[0068] 求出所有點(diǎn)的密度參數(shù)值,形成密度參數(shù)集合Den并按降冪排序,利用高密度閾值 D_th,取出其中的部分高密度參數(shù)AH_Den作為初始聚類(lèi)中心的選擇對(duì)象;
[0069]⑵在HiDen中選取最大密度參數(shù)值所對(duì)應(yīng)的數(shù)據(jù)對(duì)象作為第1個(gè)聚類(lèi)中心&,并將 &的密度參數(shù)值從高密度集合&中刪除;
[0070] ⑶在HiDen中選取最大密度參數(shù)值所對(duì)應(yīng)的數(shù)據(jù)對(duì)象作為第1個(gè)聚類(lèi)中心a,并將 &的密度參數(shù)值從高密度集合&中刪除;
[0071] ⑷選取HiDen中距離&最遠(yuǎn)的數(shù)據(jù)對(duì)象作為第2個(gè)聚類(lèi)中心C2,并將C2所對(duì)應(yīng)的密 度參數(shù)值從高密度集合HiDen中刪除;
[0072] (5)計(jì)算HiDen所對(duì)應(yīng)的數(shù)據(jù)對(duì)象與&,(:2