本發(fā)明屬于人工智能反竊電領域,具體涉及一種基于wgan數(shù)據(jù)擴充的cnn-lstm異常用電行為辨識方法及系統(tǒng)。
背景技術:
1、異常用電行為包括竊電、電表故障、計費錯誤等,其主要來源是竊電現(xiàn)象。隨著我國用電需求的增加,異常用電行為也時有發(fā)生,這不僅給電力公司造成了經(jīng)濟損失,還對居民的人身安全和正常用電產(chǎn)生威脅。
2、傳統(tǒng)的用電異常行為識別方法重在防范,僅憑經(jīng)驗和用戶舉報很難進行有效識別,且隨著科技的發(fā)展,異常用電行為的方式與手段呈現(xiàn)為科技化、信息化等特性,極大地增加了其隱蔽性。隨著用采系統(tǒng)和營銷系統(tǒng)的深入應用,可通過利用電力大數(shù)據(jù)和人工智能的方法進行用電異常辨識。現(xiàn)有的基于機器學習和深度學習的方法特征僅通過使用一維用電數(shù)據(jù)進行特征提取,難以捕捉到潛在特征和周期性,且沒有考慮到數(shù)據(jù)集不平衡的問題,從而導致模型的泛化能力差,檢測精度低。
技術實現(xiàn)思路
1、針對現(xiàn)有技術的不足,本發(fā)明的目的在于提供一種基于wgan數(shù)據(jù)擴充的cnn-lstm異常用電行為辨識方法及系統(tǒng),解決了現(xiàn)有技術中的問題。
2、本發(fā)明的目的可以通過以下技術方案實現(xiàn):
3、一種基于wgan數(shù)據(jù)擴充的cnn-lstm異常用電行為辨識方法,包括以下步驟:
4、獲取用電數(shù)據(jù),并對用電數(shù)據(jù)進行預處理;
5、將預處理后的用電數(shù)據(jù)進行分類,并使用wgan網(wǎng)絡對異常用電樣本進行擴充;
6、將擴充后的一維用電量數(shù)據(jù)輸入到bi-lstm模型中提取用電數(shù)據(jù)長期趨勢特征;并將一維數(shù)據(jù)按周形式轉(zhuǎn)化為二維數(shù)據(jù)輸入到cnn模型中提取用電數(shù)據(jù)潛在特征;
7、將所述長期趨勢特征和所述潛在特征合并后輸入到全連接神經(jīng)網(wǎng)絡中進行檢測,輸出檢測結(jié)果。
8、進一步地,所述用電數(shù)據(jù)預處理過程包括:采用線性插值法填補用電數(shù)據(jù)缺失值、利用3σ準則處理用電數(shù)據(jù)異常值以及對用電數(shù)據(jù)進行歸一化處理。
9、進一步地,異常用電樣本擴充的步驟包括:
10、s21,將預處理后的用電數(shù)據(jù)分為訓練集、驗證集和測試集,設訓練集異常用電用戶樣本為x,其分布為pr;
11、s22,設潛在噪聲z滿足高斯分布pz,生成器g通過對噪聲z進行映射,使映射后的樣本滿足pr的分布;生成器g的目標函數(shù)定義為:
12、
13、θg和θd分別為生成器g和判別器d的參數(shù);
14、s23,判別器d的目標是判斷生成異常用電樣本的真實性,判斷最大化生成樣本與真實樣本之間的差距,d的目標函數(shù)定義如下:
15、
16、生成器g和判別器d相互博弈,以達到輸出高相似度異常用電樣本;
17、s24,采用wasserstain距離替代gan網(wǎng)絡中的js散度損失函數(shù),wasserstain距離公式為:
18、
19、其中,γ∈π(px,pz)為以px和pz為邊緣分布組合起來的聯(lián)合分布的集合;可從γ中采樣真實分布x和生成樣本z,x與z距離期望的最小值即為wasserstain距離。
20、進一步地,提取用電數(shù)據(jù)潛在特征的過程包括:先將二維周用電數(shù)據(jù)輸入cnn模型的卷積層中進行卷積操作,輸出特征圖yi;然后經(jīng)過池化層對特征圖yi進行池化操作,輸出最大池降維后的特征圖ym;之后經(jīng)過dropout和批正則化層以防止模型過擬合和神經(jīng)網(wǎng)絡訓練過程中的內(nèi)部協(xié)變量偏移現(xiàn)象,然后經(jīng)過flatten層將特征圖ym展平成一維向量輸入到全連接層,最終輸出潛在特征。
21、進一步地,bi-lstm是lstm模型的擴展,在同一個t時刻同時從正向和反向訓練兩個子lstm模型;lstm模型由輸入門、遺忘門和輸出門三個記憶門組成,輸入門決定保留的輸入數(shù)據(jù),遺忘門篩選重要信息進入細胞狀態(tài),輸出門決定傳遞給下一個隱藏層的信息。
22、進一步地,所述bi-lstm模型公式表示為:
23、ht=f(wxt+uht-1+b)
24、htreverse=f(wreversext+ureverseht+1+breverse)
25、yt=g(vht+vreversehtreverse)+c
26、其中,ht為t時刻隱層狀態(tài),htreverse為t時刻反向隱層狀態(tài),w、u為輸入層到隱層的權重矩陣,wreverse、ureverse為輸入層到隱層的反向權重矩陣,v、vreverse分別為隱層到輸出層的權重和反向權重,f、g為激活函數(shù),yt為t時刻的輸出,b,c均為偏置。
27、進一步地,所述全連接神經(jīng)網(wǎng)絡的檢測模型為:
28、ntldet=σ(wnn[hcnn,hbi-lstm]+bnn)?(19)
29、式中,ntldet為竊電檢測結(jié)果,σ為sigmoid激活函數(shù),wnn和bnn分別為全連接神經(jīng)網(wǎng)絡的權重和偏置。
30、一種基于wgan數(shù)據(jù)擴充的cnn-lstm異常用電行為辨識系統(tǒng),包括:
31、數(shù)據(jù)預處理模塊:獲取用電數(shù)據(jù),并對用電數(shù)據(jù)進行預處理;
32、樣本擴充模塊:將預處理后的用電數(shù)據(jù)進行分類,并使用wgan網(wǎng)絡對異常用電樣本進行擴充;
33、特征提取模塊:將擴充后的一維用電量數(shù)據(jù)輸入到bi-lstm模型中提取用電數(shù)據(jù)長期趨勢特征;并將一維數(shù)據(jù)按周形式轉(zhuǎn)化為二維數(shù)據(jù)輸入到cnn模型中提取用電數(shù)據(jù)潛在特征;
34、以及,檢測辨識模塊:將所述長期趨勢特征和所述潛在特征合并后輸入到全連接神經(jīng)網(wǎng)絡中進行檢測,輸出檢測結(jié)果。
35、一種計算機存儲介質(zhì),存儲有可讀程序,其特征在于,當程序運行時,能夠執(zhí)行上述的一種基于wgan數(shù)據(jù)擴充的cnn-lstm異常用電行為辨識方法。
36、一種電子設備,包括:處理器、存儲器、通信接口和通信總線,所述處理器、所述存儲器和所述通信接口通過所述通信總線完成相互間的通信;
37、所述存儲器用于存放至少一可執(zhí)行指令,所述可執(zhí)行指令使所述處理器執(zhí)行上述的一種基于wgan數(shù)據(jù)擴充的cnn-lstm異常用電行為辨識方法對應的操作。
38、本發(fā)明的有益效果:
39、本發(fā)明的有益效果在于:本發(fā)明提出了一種基于wgan的數(shù)據(jù)擴充算法,通過編碼器模塊可以合成可信的異常用電數(shù)據(jù)樣本進行訓練,同時將用電數(shù)據(jù)分別重構成一維和二維形式分別輸入到lstm和cnn模型中,以捕獲用電數(shù)據(jù)潛在周期用電特征和時序用電特征,提高泛化能力。
1.一種基于wgan數(shù)據(jù)擴充的cnn-lstm異常用電行為辨識方法,其特征在于,包括以下步驟:
2.根據(jù)權利要求1所述的一種基于wgan數(shù)據(jù)擴充的cnn-lstm異常用電行為辨識方法,其特征在于,所述用電數(shù)據(jù)預處理過程包括:采用線性插值法填補用電數(shù)據(jù)缺失值、利用3σ準則處理用電數(shù)據(jù)異常值以及對用電數(shù)據(jù)進行歸一化處理。
3.根據(jù)權利要求1所述的一種基于wgan數(shù)據(jù)擴充的cnn-lstm異常用電行為辨識方法,其特征在于,異常用電樣本擴充的步驟包括:
4.根據(jù)權利要求1所述的一種基于wgan數(shù)據(jù)擴充的cnn-lstm異常用電行為辨識方法,其特征在于,提取用電數(shù)據(jù)潛在特征的過程包括:先將二維周用電數(shù)據(jù)輸入cnn模型的卷積層中進行卷積操作,輸出特征圖yi;然后經(jīng)過池化層對特征圖yi進行池化操作,輸出最大池降維后的特征圖ym;之后經(jīng)過dropout和批正則化層以防止模型過擬合和神經(jīng)網(wǎng)絡訓練過程中的內(nèi)部協(xié)變量偏移現(xiàn)象,然后經(jīng)過flatten層將特征圖ym展平成一維向量輸入到全連接層,最終輸出潛在特征。
5.根據(jù)權利要求1所述的一種基于wgan數(shù)據(jù)擴充的cnn-lstm異常用電行為辨識方法,其特征在于,bi-lstm是lstm模型的擴展,在同一個t時刻同時從正向和反向訓練兩個子lstm模型;lstm模型由輸入門、遺忘門和輸出門三個記憶門組成,輸入門決定保留的輸入數(shù)據(jù),遺忘門篩選重要信息進入細胞狀態(tài),輸出門決定傳遞給下一個隱藏層的信息。
6.根據(jù)權利要求5所述的一種基于wgan數(shù)據(jù)擴充的cnn-lstm異常用電行為辨識方法,其特征在于,所述bi-lstm模型公式表示為:
7.根據(jù)權利要求1所述的一種基于wgan數(shù)據(jù)擴充的cnn-lstm異常用電行為辨識方法,其特征在于,所述全連接神經(jīng)網(wǎng)絡的檢測模型為:
8.一種基于wgan數(shù)據(jù)擴充的cnn-lstm異常用電行為辨識系統(tǒng),其特征在于,包括:
9.一種計算機存儲介質(zhì),存儲有可讀程序,其特征在于,當程序運行時,能夠執(zhí)行權利要求1-7任一項所述的一種基于wgan數(shù)據(jù)擴充的cnn-lstm異常用電行為辨識方法。
10.一種電子設備,包括:處理器、存儲器、通信接口和通信總線,所述處理器、所述存儲器和所述通信接口通過所述通信總線完成相互間的通信;