的距離(ΚΧ,&)和(1(乂,(: 2)4三3,(:3為滿足 1^奴(101(:1),(1〇1(: 2))所對(duì)應(yīng)的數(shù)據(jù)對(duì)象,并將(:3從高密度集合把〇611中刪除;
[0073] (6)重復(fù)步驟(5),直到產(chǎn)生個(gè)聚類中心為止,k為聚類數(shù);
[0074]步驟3,根據(jù)樣本集與聚類中心的最小距離來(lái)分配類簇,
[0075] Dist(xt,Ck( Iter)) =min{Dist(xt,C(j)( Iter) ),j = l,2,…,k}
[0076] 其中xt為第j的樣本,CW(Iter)為第Iter次迭代的聚類中心;
[0077] 步驟4,計(jì)算誤差準(zhǔn)則函數(shù)
[0079] 其中xj/> e C&減,c(j > (11er)和n j分別是第11er次迭代中第j類的聚類中心和 該類的樣本個(gè)數(shù)。
[0080] 步驟5,重復(fù)步驟3和步驟4,直到滿足I J(Iter)-J(Iter-l) I <ξ停止;
[0081 ] 步驟6,利用組合聚類評(píng)價(jià)指標(biāo)Davies-Bouldin Index(DBI)指標(biāo)和得分評(píng)價(jià)指標(biāo) (SCORE指標(biāo)),結(jié)合高密度閾值0_也對(duì)聚類結(jié)果進(jìn)行評(píng)價(jià),相應(yīng)的公式如下:
[0083]
表示類間距離,Xl,m,Cl分別表示第i的數(shù)據(jù)對(duì)象,個(gè)數(shù)以及 對(duì)應(yīng)的聚類中心;dij表示聚類中心Ci和Cj的歐式距離;
[0086]表示當(dāng)前聚類結(jié)果中各個(gè)類簇內(nèi)對(duì)象與類簇中心的最大距離之和的平均值,即聚 類平均半徑;
[0088]表示當(dāng)前聚類結(jié)果中各個(gè)類簇內(nèi)所有對(duì)象與其余對(duì)象之間最小距離之和的平均 值,即聚類平均最小間距;特別地,當(dāng)聚類數(shù)為1時(shí),聚類平均最小間距為〇。
[0089]步驟7,選取最大得分評(píng)價(jià)指標(biāo)值S0CRE所對(duì)應(yīng)的k= 10為最佳聚類數(shù),得到10類電 力用戶典型用電軌跡;
[0090] 如圖3所示為本發(fā)明的一種基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法H)DA算子在 某電網(wǎng)的應(yīng)用流程圖,包括以下步驟:
[0091] 步驟1,利用MDKC聚類算法構(gòu)建每種電價(jià)類別的典型用電軌跡,形成典型用電軌跡 專家?guī)欤?br>[0092] 步驟2,計(jì)算待判定用戶與其典型用電軌跡的Fr6chet距離,其計(jì)算公式如下
[0095]其中A,B為兩條用電軌跡曲線;
[0096]步驟3,設(shè)置異常判別閾值fre_th = l,根據(jù)樣本與典型軌跡的距離是否在允許范 圍內(nèi),得出異常嫌疑客戶;
[0097 ]步驟4,結(jié)合指標(biāo)嫌疑系數(shù)閾值ab_rat i o_th = 1.5,確定用戶異常名單;
[0098]步驟5,計(jì)算嫌疑異常用戶與典型用電軌跡專家?guī)熘忻糠N用電軌跡的歐式距離,距 離最小的典型用電軌跡即為嫌疑異常用戶實(shí)際執(zhí)行的電價(jià)類別。
[0099]步驟6,形成最終的電價(jià)執(zhí)行異常用戶名單。
[0100]本發(fā)明的一種基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法從MDKC算子的普通居民 聚類結(jié)果可以看出,該算子能夠準(zhǔn)確的區(qū)分電力用戶,使得具有相似用電特征的用戶歸在 一起。
[0101]表1所示為一種基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法的異常用戶稽查結(jié)果, 從表1可以看出,在距離閾值fre_th=l的情況下,稽查精度分別為90.99%,稽查結(jié)果是可 觀的。
[0102]表1
[0104] 稽查準(zhǔn)確率=(診斷結(jié)果中實(shí)際異常的用戶數(shù)/實(shí)際異常的用戶數(shù))X 100%;
[0105] 稽查不匹配率=(嫌疑用戶在異常庫(kù)中沒(méi)有出現(xiàn)的個(gè)數(shù)/診斷為嫌疑異常用戶數(shù)) X100%〇
【主權(quán)項(xiàng)】
1. 一種基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法,其特征在于包括W下步驟: 1) 利用數(shù)據(jù)預(yù)處理模塊對(duì)電力用戶用電數(shù)據(jù)進(jìn)行處理; 2) 利用聚類算法構(gòu)建電力用戶典型用電軌跡專家?guī)欤? 3) 利用距離判別分析算法實(shí)現(xiàn)對(duì)電力用戶電價(jià)執(zhí)行稽查。2. 根據(jù)權(quán)利要求1所述的基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法,其特征在于上述 步驟1)中,數(shù)據(jù)預(yù)處理模塊包括數(shù)據(jù)獲取,數(shù)據(jù)缺失值處理,數(shù)據(jù)"去噪"處理; 數(shù)據(jù)缺失值處理采用Ξ次樣條插值法,其利用的公式為:其中,電力用戶用電特性曲線滿足yi = S(Xi),Mi為S(Xi)在X = Xi出的二階導(dǎo)數(shù),hi = X廣 Xi-l為增量; 數(shù)據(jù)"去噪"處理采用高斯濾波對(duì)電力用戶用電特性曲線進(jìn)行曲線平滑處理,公式如 下:式中,i e [ 1,η ],η為樣本個(gè)數(shù),0為樣本方差。3. 根據(jù)權(quán)利要求1所述的基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法,其特征在于上述 步驟2)中,聚類算法構(gòu)建電力用戶典型用電軌跡專家?guī)斓木唧w步驟為: 21) 初始化最大聚類數(shù)kmaX,最大和最小的密度參數(shù)調(diào)整系數(shù)amax,amin,收斂判決ξ,初 始迭代標(biāo)志Iter; 22) 計(jì)算每個(gè)樣本點(diǎn)的密度參數(shù)值,其計(jì)算公式如下: Density(Pi, ε)=INei邑hbor(Pi, ε) 其中,P功樣本點(diǎn),1引1,11],6為半徑; 23) 根據(jù)步驟22)求出所有點(diǎn)的密度參數(shù)值,形成密度參數(shù)集合Den并按降幕排序,利用 高密度闊值D_th,取出其中的部分高密度參數(shù)點(diǎn)山〇611作為初始聚類中屯、的選擇對(duì)象; 24) 在化Den中選取最大密度參數(shù)值所對(duì)應(yīng)的數(shù)據(jù)對(duì)象作為第1個(gè)聚類中屯、Ci,并將Cl的 密度參數(shù)值從高密度集合Cl中刪除; 25) 選取化Den中距離Cl最遠(yuǎn)的數(shù)據(jù)對(duì)象作為第2個(gè)聚類中屯、C2,并將C2所對(duì)應(yīng)的密度參 數(shù)值從高密度集合化Den中刪除; 26) 計(jì)算HiDen所對(duì)應(yīng)的數(shù)據(jù)對(duì)象與Ci,C2的距離d(X,Ci)和d(X,C2),XeS,C3為滿足max ((1(乂1,&),(1村1,〔2))所對(duì)應(yīng)的數(shù)據(jù)對(duì)象,并將〔3從高密度集合化〇611中刪除; 27) 重復(fù)步驟25 ),直到產(chǎn)生個(gè)聚類中屯、為止,k為聚類數(shù); 28) 根據(jù)樣本集與聚類中屯、的最小歐式距離來(lái)分配類簇,計(jì)算公式如下 Dist(xt,Ck(Ite;r))=min{Dist(xt,C(j)(Ite;r)), j = l ,2,…,k} 其中xt為第j的樣本,cW(Iter)為第Iter次迭代的聚類中屯、; 29) 計(jì)算誤差準(zhǔn)則函數(shù)其中eC&汾份},cW(iter)和η功作Ij是第Iter次迭代中第j類的聚類中屯、和該類的 樣本個(gè)數(shù); 30) 重復(fù)步驟23)和步驟24),直到滿足I jater)-J(Iter-l) I <ξ停止; 31) 利用組合聚類評(píng)價(jià)指標(biāo)DBI和得分評(píng)價(jià)指標(biāo)SCORE,結(jié)合高密度闊值0_*}1對(duì)聚類結(jié) 果進(jìn)行評(píng)價(jià),相應(yīng)的公式如下:其中表示類間距離,xi,ru,ci分別表示第i的數(shù)據(jù)對(duì)象,個(gè)數(shù)W及對(duì)應(yīng) 的聚類中屯、;di康示聚類中屯、Cl和C撕歐式距離;其中表示當(dāng)前聚類結(jié)果中各個(gè)類簇內(nèi)對(duì)象與類簇中屯、的最大距離之和的平均值,即聚類平 均半徑;表示當(dāng)前聚類結(jié)果中各個(gè)類簇內(nèi)所有對(duì)象與其余對(duì)象之間最小距離之和的平均值,即 聚類平均最小間距;特別地,當(dāng)聚類數(shù)為1時(shí),聚類平均最小間距為0; 32) 選取最大得分評(píng)價(jià)指標(biāo)值S0CRE所對(duì)應(yīng)的k做為最佳聚類數(shù),形成電力用戶典型用 電軌跡。4.根據(jù)權(quán)利要求1所述的基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法,其特征在于上述 步驟3)中,電力用戶電價(jià)執(zhí)行稽查判別具體步驟如下: 41) 利用MDKC聚類算法構(gòu)建每種電價(jià)類別的典型用電軌跡,形成典型用電軌跡專家?guī)欤? 42) 計(jì)算待判定用戶與其典型用電軌跡的化自Chet距離,其計(jì)算 公式如下:其中A,B為兩條用電軌跡曲線; 43) 設(shè)置異常判別闊值fre_th,根據(jù)樣本與典型軌跡的距離是否在允許范圍內(nèi),得出異 常嫌疑客戶; 44) 結(jié)合指標(biāo)嫌疑系數(shù)闊值ab_r at i o_th,確定用戶異常名單; 45) 計(jì)算嫌疑異常用戶與典型用電軌跡專家?guī)熘忻糠N用電軌跡的歐式距離,距離最小 的典型用電軌跡即為嫌疑異常用戶實(shí)際執(zhí)行的電價(jià)類別; 46) 形成最終的電價(jià)執(zhí)行異常用戶名單。5. 根據(jù)權(quán)利要求1所述的基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法,其特征在于上述 步驟 2)中,利用基于密度的改進(jìn) k-means 聚類(Modified Density K-means Clustering, MDKC)聚類算法構(gòu)建電力用戶典型用電軌跡專家?guī)臁?. 根據(jù)權(quán)利要求1所述的基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法,其特征在于上述 步驟3)中,利用基于Fr自chet距離判別分析(Fr自chet Distance Discriminant Analysis, F孤A)算法實(shí)現(xiàn)對(duì)電力用戶電價(jià)執(zhí)行稽查。7. 根據(jù)權(quán)利要求1所述的基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法,其特征在于上述 數(shù)據(jù)獲取通過(guò)提取計(jì)量營(yíng)銷系統(tǒng)中的數(shù)據(jù)。8. 根據(jù)權(quán)利要求7所述的基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法,其特征在于上述 數(shù)據(jù)獲取通過(guò)S化語(yǔ)言提取ORACLE數(shù)據(jù)庫(kù)。
【專利摘要】本發(fā)明是一種基于智能電網(wǎng)大數(shù)據(jù)的電價(jià)執(zhí)行稽查方法。包括以下步驟:?1)利用數(shù)據(jù)預(yù)處理模塊對(duì)電力用戶用電數(shù)據(jù)進(jìn)行處理;2)利用聚類算法構(gòu)建電力用戶典型用電軌跡專家?guī)欤?)利用距離判別分析算法實(shí)現(xiàn)對(duì)電力用戶電價(jià)執(zhí)行稽查。本發(fā)明聚類算法通過(guò)樣本點(diǎn)的密度參數(shù)來(lái)確定初始聚類中心;利用組合聚類評(píng)價(jià)指標(biāo)和得分評(píng)價(jià)指標(biāo)相結(jié)合的方法來(lái)確定最佳聚類數(shù),從而形成電力用戶典型用電軌跡曲線;距離判別算法則是對(duì)新的電力用戶進(jìn)行電價(jià)執(zhí)行稽查判別,通過(guò)計(jì)算電價(jià)異常嫌疑系數(shù),確定最終的電價(jià)執(zhí)行異??蛻裘麊?。本發(fā)明能夠?qū)崿F(xiàn)用電行為軌跡的智能分析和辨識(shí);實(shí)現(xiàn)客戶電價(jià)執(zhí)行的遠(yuǎn)程在線診斷,提高營(yíng)銷稽查的針對(duì)性、準(zhǔn)確性和時(shí)效性。
【IPC分類】G06Q10/06, G06Q50/06
【公開(kāi)號(hào)】CN105574642
【申請(qǐng)?zhí)枴緾N201510756491
【發(fā)明人】彭顯剛, 鄭偉欽, 林利祥, 劉藝
【申請(qǐng)人】廣東工業(yè)大學(xué)
【公開(kāi)日】2016年5月11日
【申請(qǐng)日】2015年11月6日