本發(fā)明屬于電網(wǎng)維護(hù)
技術(shù)領(lǐng)域:
,更具體地說,涉及一種基于決策樹算法的竊電診斷系統(tǒng)及方法。
背景技術(shù):
:長期以來,竊電現(xiàn)象層出不窮,竊電手段形形色色,嚴(yán)重擾亂了正常的供用電秩序,給用電安全造成威脅,影響了電網(wǎng)的穩(wěn)定、經(jīng)濟(jì)運行,困擾電力企業(yè)的發(fā)展,使電力企業(yè)及國家蒙受巨大的經(jīng)濟(jì)損失。將決策樹等數(shù)據(jù)挖掘技術(shù)應(yīng)用到電力行業(yè)的竊電診斷中,就是利用該技術(shù)對電力信息流進(jìn)行分析,挖掘數(shù)據(jù)規(guī)律,為判別用戶竊電行為提供科學(xué)的依據(jù),而且不受竊電方式的影響。本發(fā)明基于決策樹算法的竊電診斷系統(tǒng),可有力提高電力企業(yè)的經(jīng)濟(jì)效益,降低配電網(wǎng)的管理線損,為電網(wǎng)正常運營提供技術(shù)支持,增強(qiáng)電力企業(yè)競爭力。技術(shù)實現(xiàn)要素:為克服現(xiàn)有技術(shù)存在的缺陷,本發(fā)明提供一種基于決策樹算法的竊電診斷系統(tǒng)及方法。本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:設(shè)計一種基于決策樹算法的竊電診斷系統(tǒng),包括數(shù)據(jù)接口模塊、竊電診斷決策樹模塊、診斷結(jié)果輸出模塊、存儲設(shè)備、人機(jī)接口,其特征在于,從電網(wǎng)數(shù)據(jù)庫提取用戶的歷史數(shù)據(jù),用戶的歷史數(shù)據(jù)傳輸?shù)剿鰯?shù)據(jù)接口模塊后進(jìn)入竊電診斷決策樹模塊并形成推理結(jié)果,所述診斷結(jié)果輸出模塊將推理結(jié)果保存至存儲設(shè)備并輸出至人機(jī)接口。本發(fā)明還提供一種基于決策樹算法的竊電診斷方法,包括以下步驟,1)提取電網(wǎng)數(shù)據(jù)庫的特征屬性數(shù)據(jù)集合,形成訓(xùn)練集;2)基于訓(xùn)練集構(gòu)建決策樹;3)由決策樹生成分類規(guī)則集,利用分類規(guī)則形成竊電診斷數(shù)據(jù)庫;4)輸入用戶的歷史數(shù)據(jù),進(jìn)行竊電診斷。在上述步驟(1)中,所述特征屬性數(shù)據(jù)集合是一個從用戶統(tǒng)計線損數(shù)據(jù)庫、電壓實時統(tǒng)計數(shù)據(jù)庫、電流實時統(tǒng)計數(shù)據(jù)庫中獲取包含N個樣本的樣本集。在上述步驟(2)中,決策樹的構(gòu)建采用ID3算法,其過程包括:2.1)選取用戶最大線損值、三相電壓不平衡率、合同容量比、同期用電量比作為非分類類別屬性;2.2)計算分類類別的熵E0及非分類類別屬性用戶最大線損值的熵E1、三相電壓不平衡率的熵E2、合同容量比的熵E3、同期用電量比的熵E4;2.3)從上述四個非分類類別屬性中選擇熵值最大且熵值大于E0的屬性作為分類點,創(chuàng)建節(jié)點N;2.4)重復(fù)步驟2.1)至步驟2.3)尋找下一個分類點;2.5)若樣本都在同一非分類類別,則該節(jié)點成為樹葉,并用該非分類類別標(biāo)記,否則使用基于熵的度量信息增益作為啟發(fā)信息,選擇將樣本分裂的最優(yōu)屬性作為該節(jié)點的分裂屬性;2.6)對分裂屬性的每一個值創(chuàng)建一個分枝,并根據(jù)分枝來劃分樣本;2.7)重復(fù)步驟2.5)至步驟2.6)對每個節(jié)點運行決策樹算法。實施本發(fā)明基于決策樹算法的竊電診斷系統(tǒng)及方法,具有以下有益效果:本發(fā)明利用決策樹算法,通過分析用戶歷史數(shù)據(jù),檢測出竊電用戶。附圖說明下面將結(jié)合附圖及實施例對本發(fā)明作進(jìn)一步說明,附圖中:圖1為本發(fā)明一種基于決策樹算法的竊電診斷系統(tǒng)的示意圖;圖2為本發(fā)明竊電診斷系統(tǒng)中決策樹建樹的流程示意圖。具體實施方式為了對本發(fā)明的技術(shù)特征、目的和效果有更加清楚的理解,現(xiàn)對照附圖詳細(xì)說明本發(fā)明的具體實施方式。如圖1所示,本發(fā)明基于決策樹算法的竊電診斷系統(tǒng),包括數(shù)據(jù)接口模塊、竊電診斷決策樹模塊、診斷結(jié)果輸出模塊、存儲設(shè)備、人機(jī)接口,其特征在于,從電網(wǎng)數(shù)據(jù)庫提取用戶的歷史數(shù)據(jù),用戶的歷史數(shù)據(jù)傳輸?shù)綌?shù)據(jù)接口模塊后進(jìn)入竊電診斷決策樹模塊并形成推理結(jié)果,診斷結(jié)果輸出模塊將推理結(jié)果保存至存儲設(shè)備并輸出至人機(jī)接口。如圖2所示,本發(fā)明還提供一種基于決策樹算法的竊電診斷方法,包括以下步驟,1)提取電網(wǎng)數(shù)據(jù)庫的特征屬性數(shù)據(jù)集合,形成訓(xùn)練集,其中,特征屬性數(shù)據(jù)集合是一個從用戶統(tǒng)計線損數(shù)據(jù)庫、電壓實時統(tǒng)計數(shù)據(jù)庫、電流實時統(tǒng)計數(shù)據(jù)庫中獲取包含N個樣本的樣本集。2)基于訓(xùn)練集構(gòu)建決策樹,其中,決策樹的構(gòu)建采用ID3算法,其過程包括:2.1)選取用戶最大線損值、三相電壓不平衡率、合同容量比、同期用電量比作為非分類類別屬性,其中這4個非分類類別屬性的取值參照下表:非分類類別屬性取值用戶最大線損值(L)統(tǒng)計線損值W1<L<統(tǒng)計線損值W2三相電壓不平衡率(U)大(U1)、小(U2)合同容量比(C)大(C1)、小(C2)功率因數(shù)(P)穩(wěn)定(P1)、突變(P2)同期用電量比(E)大(E1)、小(E2)分類類別竊電(S)、未竊電(N)2.2)計算分類類別的熵E0及非分類類別屬性用戶最大線損值的熵E1、三相電壓不平衡率的熵E2、合同容量比的熵E3、同期用電量比的熵E4:分類類別的熵E0:E0=-pSlog2pS-pNlog2pN,]]>其中pS為竊電樣本數(shù)量占總樣本數(shù)量的比,pN為未竊電樣本數(shù)量占總樣本數(shù)量的比。用戶最大線損值的熵:設(shè)大于統(tǒng)計線損值的樣本為W個,則小于統(tǒng)計線損值的樣本為(N-W)個,取屬性大于統(tǒng)計線損值的正例為A1個,反例為(W-A1)個,取屬性小于統(tǒng)計線損值的正例為B1個,反例為(N-W-B1)個,用戶最大線損值的熵E1為E1=WN(-A1Wlog2A1/W-W-A1Wlog2W-A1/W)+N-WN(-B1N-Wlog2B1/W-N-W-B1N-Wlog2W-B1/W)]]>三相電壓不平衡率的熵:設(shè)三相電壓不平衡率取大的樣本為X個,則三相電壓不平衡率取小的樣本為(N-X)個,取屬性為大的正例為A2個,反例為(X-A2)個,取屬性為小的正例為B2個,反例為(N-X-B2)個,三相電壓不平衡率的熵E2為E2=XN(-A2Xlog2A2/X-X-A2Xlog2X-A2/X)+N-XN(-B2N-Xlog2B2/X-N-X-B2N-Xlog2X-B2/X)]]>合同容量比的熵:設(shè)合同容量比取大的樣本為Y個,則合同容量比取小的樣本(N-Y)為個,取屬性為大的正例為A3個,反例為(Y-A3)個,取屬性為小的正例為B3個,反例為(N-Y-B3)個,合同容量比的熵E3為E3=YN(-A3Ylog2A3/Y-Y-A3Ylog2Y-A3/Y)+N-YN(-B3N-Ylog2B3/Y-N-Y-B3N-Ylog2Y-B3/Y)]]>同期用電量比的熵:設(shè)同期用電量比取大的樣本為Z個,則同期用電量比取小的樣本為(N-Z)個,取屬性為大的正例為A4個,反例為(Z-A4)個,取屬性為小的正例為B4個,反例為(N-Z-B4)個,同期用電量比的熵E4為E4=ZN(-A4Zlog2A4/Z-Z-A4Zlog2Z-A4/Z)+N-ZN(-B4N-Zlog2B4/Z-N-Z-B4N-Zlog2Z-B4/Z)]]>2.3)從上述四個非分類類別屬性中選擇熵值最大且熵值大于E0的屬性作為分類點,創(chuàng)建節(jié)點N;2.4)重復(fù)步驟2.1)至步驟2.3)尋找下一個分類點;2.5)若樣本都在同一非分類類別,則該節(jié)點成為樹葉,并用該非分類類別標(biāo)記,否則使用基于熵的度量信息增益作為啟發(fā)信息,選擇將樣本分裂的最優(yōu)屬性作為該節(jié)點的分裂屬性;2.6)對分裂屬性的每一個值創(chuàng)建一個分枝,并根據(jù)分枝來劃分樣本;2.7)重復(fù)步驟2.5)至步驟2.6)對每個節(jié)點運行決策樹算法。3)由決策樹生成分類規(guī)則集,利用分類規(guī)則形成竊電診斷數(shù)據(jù)庫;4)輸入用戶的歷史數(shù)據(jù),進(jìn)行竊電診斷。上面結(jié)合附圖對本發(fā)明的實施例進(jìn)行了描述,但是本發(fā)明并不局限于上述的具體實施方式,上述的具體實施方式僅僅是示意性的,而不是限制性的,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的啟示下,在不脫離本發(fā)明宗旨和權(quán)利要求所保護(hù)的范圍情況下,還可做出很多形式,這些均屬于本發(fā)明的保護(hù)之內(nèi)。當(dāng)前第1頁1 2 3