本發(fā)明涉及電網(wǎng)領(lǐng)域的一種數(shù)據(jù)驅(qū)動的防竊電實時診斷方法。
背景技術(shù):
隨著我國用電量的大幅增加,竊電的手段也發(fā)生了大的變化。一方面,竊電越來越隱蔽,另一方面,近年來采用高科技智能型等竊電手段也不斷出現(xiàn),這些竊電方式很難發(fā)現(xiàn)。傳統(tǒng)的方法主要通過定期巡檢、定期校驗電表、用戶舉報竊電等手段來發(fā)現(xiàn)竊電或計量裝置故障。面對這些新型的竊電手段,傳統(tǒng)的防竊電方式面臨著較大挑戰(zhàn)。
我國是用電大國,電能資源對我國來說非常寶貴。因此,電網(wǎng)系統(tǒng)的建設是至關(guān)重要的。改革開放以來,科技不斷發(fā)展,電網(wǎng)系統(tǒng)也不斷地升級。現(xiàn)在的電網(wǎng)系統(tǒng)都安裝了自動化遠程監(jiān)控功能,通過監(jiān)控功能,檢查到簡單的可疑用電行為,再派遣相關(guān)人員到現(xiàn)場詳細調(diào)查。該系統(tǒng)可以采集各類用電指標,如負荷數(shù)據(jù),異常數(shù)據(jù)、主站報警、線損信息等,這些信息這些年得到大量的積累。
電網(wǎng)系統(tǒng)的自動化遠程監(jiān)控功能雖然可以獲取到用電異常的信息,但是,電網(wǎng)目前所采用的終端誤報率太高,無用的信息也很多,很難快速精準地鎖定竊電用戶,這往往令電力公司的檢測人員無從下手,實施起來難度較大,反竊電效果不是很理想。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是為了克服現(xiàn)有技術(shù)的不足,提供一種數(shù)據(jù)驅(qū)動的防竊電實時診斷方法,其不僅可以有效降低竊電診斷的誤報率和漏報率,提高診斷的準確率,而且增加了自適應性和穩(wěn)定性。
實現(xiàn)上述目的的一種技術(shù)方案是:一種數(shù)據(jù)驅(qū)動的防竊電實時診斷方法,包括下列步驟:
原始數(shù)據(jù)讀取步驟:從用戶數(shù)據(jù)庫中讀取用戶的日用電量、日用電量的移動平均、日用電量的移動平均差分、線損以及線損的移動平均的實時數(shù)據(jù),作為實時診斷數(shù)據(jù);從用戶數(shù)據(jù)庫中讀取用戶的日用電量、日用電量的移動平均、日用電量的移動平均差分、線損以及線損的移動平均的歷史數(shù)據(jù),作為建模歷史數(shù)據(jù);
智能診斷模型構(gòu)建步驟:依據(jù)建模歷史數(shù)據(jù)建立專家數(shù)據(jù)庫,作為專家樣本數(shù)據(jù),并根據(jù)專家樣本數(shù)據(jù)構(gòu)建智能診斷模型;
竊電診斷步驟:將實時診斷數(shù)據(jù)導入智能診斷模型,運行智能診斷模型,進行竊電診斷。
進一步的,所述原始數(shù)據(jù)讀取步驟中還導入的天氣類指標的實時數(shù)據(jù)和歷史數(shù)據(jù)、報警類指標的實時數(shù)據(jù)和歷史數(shù)據(jù),以及特定類指標的實時數(shù)據(jù)和歷史數(shù)據(jù),對應作為實施診斷數(shù)據(jù)和建模歷史數(shù)據(jù)。
進一步的,原始數(shù)據(jù)讀取步驟后,構(gòu)建智能診斷模型步驟前,還有原始數(shù)據(jù)預處理步驟,對建模歷史數(shù)據(jù)和實施診斷數(shù)據(jù)中缺失值和異常值進行預處理。
再進一步的,原始數(shù)據(jù)預處理步驟中,采用最小二乘法回歸模型對缺失值進行填充。
再進一步的,原始數(shù)據(jù)預處理步驟中,進行異常值審查,建模歷史數(shù)據(jù)和實時診斷數(shù)據(jù)中時間屬性的時間是否合理;審查建模歷史數(shù)據(jù)和實時診斷數(shù)據(jù)中的峰電量和谷電量之和,與日用電量之間的偏差是否超出閾值。
再進一步的,原始數(shù)據(jù)預處理步驟中將異常值分為normal類型,change類型、complex類型和離群點異常。
進一步的,智能診斷模型構(gòu)建步驟中,采用神經(jīng)網(wǎng)絡構(gòu)建智能診斷模型。
再進一步的,智能診斷模型構(gòu)建步驟中,對構(gòu)建完成的智能診斷模型進行訓練、參數(shù)優(yōu)化和評價。
再進一步的,竊電診斷步驟中,將實時診斷數(shù)據(jù)導入智能診斷模型,運行智能診斷模型,進行竊電診斷,若進行竊電診斷的結(jié)果有誤,則對智能診斷模型進行重構(gòu),生成新的智能診斷模型,并運行新的智能診斷模型,直到結(jié)果正確為止。
進一步的,智能診斷模型構(gòu)建步驟中,采用專家樣本數(shù)據(jù)是可更新。
采用了本發(fā)明的一種數(shù)據(jù)驅(qū)動的防竊電實時診斷方法的技術(shù)方案,包括下列步驟:原始數(shù)據(jù)讀取步驟:從用戶數(shù)據(jù)庫中讀取用戶的日用電量、日用電量的移動平均、日用電量的移動平均差分、線損以及線損的移動平均的實時數(shù)據(jù),作為實時診斷數(shù)據(jù);從用戶數(shù)據(jù)庫中讀取用戶的日用電量、日用電量的移動平均、日用電量的移動平均差分、線損以及線損的移動平均的歷史數(shù)據(jù),作為建模歷史數(shù)據(jù);智能診斷模型構(gòu)建步驟:依據(jù)建模歷史數(shù)據(jù)建立專家數(shù)據(jù)庫,作為專家樣本數(shù)據(jù),并根據(jù)專家樣本數(shù)據(jù)構(gòu)建智能診斷模型;竊電診斷步驟:將實時診斷數(shù)據(jù)導入智能診斷模型,運行智能診斷模型,進行竊電診斷。其技術(shù)效果是:不僅可以有效降低竊電診斷的誤報率和漏報率,提高診斷的準確率,而且增加了自適應性和穩(wěn)定性,提高了竊電診斷的準確性和魯棒性,也為電力公司減少了檢查竊電行為的額外成本,從而為未來智能化的防竊電工作及用電的精細化工作打下了堅實基礎(chǔ)。
附圖說明
圖1為本發(fā)明的一種數(shù)據(jù)驅(qū)動的防竊電實時診斷方法的流程示意圖。
圖2為本發(fā)明的一種數(shù)據(jù)驅(qū)動的防竊電實時診斷方法導入數(shù)據(jù)的示意圖
圖3本發(fā)明的一種數(shù)據(jù)驅(qū)動的防竊電實時診斷方法中智能模型構(gòu)建步驟的流程圖。
圖4為本發(fā)明的一種數(shù)據(jù)驅(qū)動的防竊電實時診斷方法中竊電診斷步驟的流程圖。
具體實施方式
請參閱圖1,本發(fā)明的發(fā)明人為了能更好地對本發(fā)明的技術(shù)方案進行理解,下面通過具體地實施例,并結(jié)合附圖進行詳細地說明:
分析日用電量的特征,通過計算n日的日用電量移動平均,即連續(xù)n天的用電量平均值,計算式如下:
其中avg_en為n日的日用電量移動平均,ei為第i日的日用電量;
接下來再計算日用電量的移動平均差分dif,即,連續(xù)n天的用電量的移動平均的累計變化值,在本項目中,以0.02作為差分閾值:
利用日用電量的移動平均、移動平均差分和線損,將竊電用戶分為:
第一類竊電用戶,即每天選擇不同的時間段進行竊電,或者每月選擇任意幾天進行竊電的竊電用戶,其每月的日用電量曲線是一個循序漸進的下降曲線,計算日用電量的移動平均和日用電量的移動平均差分,進行擬合。日用電量的移動平均是下降趨勢的曲線,日用電量的移動平均差分出現(xiàn)多個絕對值超過差分閾值的點。用戶的線損不斷升高,這就是第一類竊電者開始竊電時所表現(xiàn)出來的重要特征。
第二類竊電用戶,即每天24小時都在竊電的竊電用戶,其日用電量中存在突然下降的點,然后保持平穩(wěn)。日用電量的移動平均和日用電量的移動平均差分是上升趨勢的曲線然后平穩(wěn),線損剛好相反。
請參閱圖1和圖2,本發(fā)明的一種數(shù)據(jù)驅(qū)動的防竊電實時診斷方法,包括下列步驟:
原始數(shù)據(jù)讀取步驟:從用戶數(shù)據(jù)庫中讀取用戶的日用電量、日用電量的移動平均、日用電量的移動平均差分、線損以及線損的移動平均的實時數(shù)據(jù),用戶的日用電量、日用電量的移動平均、日用電量的移動平均差分、線損以及線損的移動平均的歷史數(shù)據(jù),其中用戶的日用電量、日用電量的移動平均、日用電量的移動平均差分、線損以及線損的移動平均的實時數(shù)據(jù)用于竊電診斷,作為實時診斷數(shù)據(jù),用戶的日用電量、日用電量的移動平均、日用電量的移動平均差分、線損以及線損的移動平均的歷史數(shù)據(jù)用于建模,作為建模歷史數(shù)據(jù)。
因為天氣對用電量的影響很大。原始數(shù)據(jù)導入步驟中還可導入天氣類指標的實時數(shù)據(jù)和歷史數(shù)據(jù),即每天的最高溫度、最高溫度、天氣狀況、濕度等。其中天氣類指標的實時數(shù)據(jù)用于竊電診斷,作為實時診斷數(shù)據(jù),天氣類指標的歷史數(shù)據(jù)用于建模,作為建模歷史數(shù)據(jù)。
報警類指標的實時數(shù)據(jù)和歷史數(shù)據(jù),原始數(shù)據(jù)導入步驟中還可導入與竊電相關(guān)的報警,比如計量故障的次數(shù),比如日用電量的移動平均差分的絕對值超過差分閾值的次數(shù),主要判斷電表是否有異常情況。其中報警類指標的實時數(shù)據(jù)用于竊電診斷,作為實時診斷數(shù)據(jù),報警類指標的歷史數(shù)據(jù)用于建模,作為建模歷史數(shù)據(jù)。
特定類指標的實時數(shù)據(jù)和歷史數(shù)據(jù),包括上一日是否竊電等,因為用戶竊電是一個連續(xù)的過程。其中特定類指標的實時數(shù)據(jù)用于竊電診斷,作為實時診斷數(shù)據(jù),特定類指標的歷史數(shù)據(jù)用于建模,作為建模歷史數(shù)據(jù)。
原始數(shù)據(jù)預處理步驟:
從用戶數(shù)據(jù)庫中讀取用戶用電量的實時數(shù)據(jù)和歷史數(shù)據(jù)中往往包含大量的噪聲,有時候還是不完整的,甚至是不一致的。因此必須要進行數(shù)據(jù)預處理。數(shù)據(jù)預處理步驟包括:
缺失值處理:
原始數(shù)據(jù)讀取步驟中所讀取的用戶用電的實時數(shù)據(jù)和歷史數(shù)據(jù)內(nèi)經(jīng)常存在缺失值,在大多數(shù)情況下,數(shù)據(jù)分析前需要對缺失數(shù)據(jù)進行處理。比如應用決策樹算法的時候,該算法本身允許數(shù)據(jù)缺失值直接進入數(shù)據(jù)分析,因為在這種情況下缺失值本身已經(jīng)被看作是一種特定的屬性類別。
采用回歸建模法對缺失值進行處理,通過回歸建模,填充相應的值?;貧w建模法可通過諸如回歸模型、決策樹模型、貝葉斯定理等去預測缺失值的最近替代值,并將缺失值的最近替代值代替缺失值所對應的變量,也就是把缺失數(shù)據(jù)所對應的變量當作目標變量。本發(fā)明的一種數(shù)據(jù)驅(qū)動的防竊電實時診斷方法,所選的回歸模型是最小二乘法回歸模型,通過最小二乘法回歸函數(shù),去填充缺失值所對應的變量。
異常值處理:
原始數(shù)據(jù)讀取步驟中所讀取的用戶用電的實時數(shù)據(jù)和歷史數(shù)據(jù)內(nèi)經(jīng)常存在異常值,很可能會干擾模型系數(shù)的計算和評估,從而嚴重降低模型的穩(wěn)定性。
異常值審查:
1.在用戶用電的實時數(shù)據(jù)和歷史數(shù)據(jù)中時間屬性的時間是否合理。比如,4月份是否出現(xiàn)了31號。
2用戶用電的實時數(shù)據(jù)和歷史數(shù)據(jù)中的峰電量和谷電量之和,與日用電量之間的偏差是否超出閾值,該閾值通常為0.3度。
3,用戶實時數(shù)據(jù)中的總用電量是否合法,數(shù)據(jù)集中的電表讀數(shù)是電表自動抄送返回的日用電量累加數(shù)值。日用電量通過后一天的數(shù)據(jù)值減去前一天的數(shù)據(jù)值作為前一天的用電量。在遇到月份的邊界時,讀入下一個月的數(shù)據(jù)記錄文件來計算最后一天的用電量。
異常值種類的種類包括:
normal類型,即用戶的月用電量曲線有一個或多個毛刺,毛刺的寬度一般為一至兩日,其修正方法為分箱法。
change類型,即用戶的月用電量曲線中,有零至三個毛刺,用戶的月用電量曲線會存在一個或者多個日用電量大幅下降的拐點,用戶的月用電量曲線整體呈階梯形,其通過將日用電量加上一個向上的位移段來修正。
complex類型,用戶的月用電量曲線是雜亂的,不規(guī)則的,存在兩個以上的毛刺,部分毛刺寬度大于兩日。其通過分箱法或回歸法來修正,優(yōu)選最小二乘法回歸法修正。
離群點異常,用戶的月用電量大于6000kwh為離群點異常下界,直接刪除。
智能診斷模型構(gòu)建步驟:
在數(shù)據(jù)準備完成后,即可進行模型構(gòu)建,即利用建模歷史數(shù)據(jù)中竊電用戶的數(shù)據(jù)建立一個專家數(shù)據(jù)庫作為專家樣本數(shù)據(jù);專家樣本數(shù)據(jù)又稱建模數(shù)據(jù)。
再將專家數(shù)據(jù)庫中的專家樣本數(shù)據(jù),導入訓練數(shù)據(jù)庫,作為訓練樣本數(shù)據(jù)。
利用深度學習技術(shù),根據(jù)專家樣本數(shù)據(jù)構(gòu)建智能診斷模型,簡稱構(gòu)建模型,實現(xiàn)了高效的智能診斷,由于竊電的診斷,涉及復雜的現(xiàn)象和大量的因素之間的相互作用,而深度神經(jīng)網(wǎng)絡結(jié)合了模糊評價法與神經(jīng)網(wǎng)絡評價法的優(yōu)點,在解決這類問題時有明顯的優(yōu)勢。
通過訓練樣本數(shù)據(jù)對構(gòu)建的智能診斷模型進行訓練;簡稱模型訓練。
根據(jù)對構(gòu)建的智能診斷模型進行訓練的訓練結(jié)果對智能診斷模型中的參數(shù)進行優(yōu)化;又稱模型驗證。
對專家數(shù)據(jù)庫中的專家樣本數(shù)據(jù)導入測試數(shù)據(jù)庫,作為測試樣本數(shù)據(jù),對優(yōu)化后的智能診斷模型進行評價;
導出對智能診斷模型進行評價的評價結(jié)果,在評價結(jié)果確認通過后,完成智能診斷模型構(gòu)建步驟。
參見圖3。
竊電診斷步驟:
在所述智能診斷模型構(gòu)建完成后,就可以基于實時采集的用戶的實時數(shù)據(jù),即診斷數(shù)據(jù),調(diào)用訓練好的智能診斷模型實現(xiàn)對用戶的竊電診斷。
從計量主站系統(tǒng)每日實時抽取所有計量點的用戶的日用電量、日用電量的移動平均、日用電量的移動平均差分、線損以及線損的移動平均的實時數(shù)據(jù),并從氣象臺調(diào)取當天的天氣類指標,包括,一天中最高氣溫,一天中最低氣溫以及當天的天氣情況等;
對實時抽取的戶的日用電量、日用電量的移動平均、日用電量的移動平均差分、線損以及線損的移動平均的實時數(shù)據(jù)進行數(shù)據(jù)預處理,包括:缺失值的處理、四類異常值,即normal類型,change類型、complex類型和離群點異常的處理、節(jié)假日數(shù)據(jù)修正等預處理。
計算得到經(jīng)過處理的實時診斷數(shù)據(jù),即用電量指標、天氣指標、報警指標、節(jié)假日指標、線損指標和特定指標。并且將這些指標,整合一個向量矩陣,作為智能診斷模型的輸入變量。
運行智能診斷模型構(gòu)建步驟中所構(gòu)建的智能診斷模型。
運行智能診斷模型的結(jié)果有誤,則重新對智能診斷模型的參數(shù)進行優(yōu)化,即重構(gòu),生成新的智能診斷模型,并運行新的智能診斷模型,直到結(jié)果正確為止。
參見圖4。
必須說明的是:
第一,智能診斷模型構(gòu)建步驟和竊電診斷步驟中,對智能診斷模型進行優(yōu)化的結(jié)果需要人工進行。
第二,智能診斷模型構(gòu)建步驟中的專家樣本數(shù)據(jù),以及專家樣本數(shù)據(jù)中的欄目是可更新的。
第三,智能診斷模型是可以重新進行訓練的。
本發(fā)明的一種數(shù)據(jù)驅(qū)動的防竊電實時診斷方法、處理用戶數(shù)大于等于15000戶,診斷誤報率小于0.5%,診斷漏報率小于等于10%。
本發(fā)明的一種數(shù)據(jù)驅(qū)動的防竊電實時診斷方法基于深度學習構(gòu)建的竊電智能診斷模型不僅可以有效降低竊電診斷的誤報率和漏報率,提高診斷的準確率,而且增加了自適應性和穩(wěn)定性,不僅提高了竊電診斷的準確性和魯棒性,而且也為電力公司減少了檢查竊電行為的額外成本,從而為未來智能化的防竊電工作及用電的精細化工作打下了堅實基礎(chǔ)。供電企業(yè)及時發(fā)現(xiàn)并阻止竊電行為,有效地打擊竊電者,給電力公司減少損失,同時也有力保障居民用電的合法利益。
本發(fā)明的一種數(shù)據(jù)驅(qū)動的防竊電實時診斷方法還基于sparknet,對智能診斷模型進行了實驗,并進行了參數(shù)調(diào)優(yōu)。與傳統(tǒng)的神經(jīng)網(wǎng)絡相比較,本發(fā)明的一種數(shù)據(jù)驅(qū)動的防竊電實時診斷方法所基于深度學習的智能診斷模型性的能有比較明顯的提高。
本發(fā)明的一種數(shù)據(jù)驅(qū)動的防竊電實時診斷方法所構(gòu)建的智能診斷模型具有自學習特性,通過對電力用戶的用電數(shù)據(jù)進行學習建模,并通過已經(jīng)形成的用電規(guī)律來診斷新數(shù)據(jù)的合理性和正確性,能夠有效提高竊電監(jiān)控診斷的準確性。
本技術(shù)領(lǐng)域中的普通技術(shù)人員應當認識到,以上的實施例僅是用來說明本發(fā)明,而并非用作為對本發(fā)明的限定,只要在本發(fā)明的實質(zhì)精神范圍內(nèi),對以上所述實施例的變化、變型都將落在本發(fā)明的權(quán)利要求書范圍內(nèi)。