本發(fā)明屬于監(jiān)測領(lǐng)域,尤其涉及一種用于電網(wǎng)用戶用電數(shù)量異常的原因確定方法。
背景技術(shù):
臺區(qū)線損率為臺區(qū)總供電量與臺區(qū)總售電量的差值除以臺區(qū)總供電量,它是供電公司一項非常重要的考核指標(biāo),直接影響著公司的經(jīng)濟效益。
目前,大多數(shù)供電公司要求臺區(qū)線損率在10%以內(nèi)。然而,由于受人員、設(shè)備、竊電等因素的影響,導(dǎo)致用電出現(xiàn)異常,從而使得臺區(qū)線損率較高,需要進行排查和消缺。以往大多通過現(xiàn)場巡檢或基于用戶每月電量、月度線損情況,憑經(jīng)驗來確定電能計量異常用戶,這些傳統(tǒng)的方法時效性差、準(zhǔn)確率低。因此如何有效的處理用電異常問題引起了現(xiàn)場運維人員的廣泛關(guān)注。
用電信息采集系統(tǒng)能夠?qū)τ秒娦畔⑦M行實時監(jiān)控、分析和處理。隨著用電采集系統(tǒng)的推廣應(yīng)用,采集覆蓋范圍從專變用戶逐步擴大到居民用戶、一般工商業(yè)用戶等,每日獲取的用電數(shù)據(jù)量也越來越全面。這些用電數(shù)據(jù)之間存在著關(guān)聯(lián)性,潛藏著用電行為等大量有價值的信息,能夠為用電異常分析提供依據(jù)。
目前已有學(xué)者基于用電采集系統(tǒng),提出了相關(guān)的分析方法。例如,“基于離群點算法和用電信息采集系統(tǒng)的反竊電研究”(《電力系統(tǒng)保護與控制》,程超,張漢敬,景志敏等,2015,43(17):p69-74.)中,分析了竊電手段及原理,進而基于電壓電流值的規(guī)律,結(jié)合離群點檢測法確定了竊電判定算法。“基于密度聚類和frechet判別分析的電價執(zhí)行稽查方法”(《電網(wǎng)技術(shù)》,彭顯剛,鄭偉欽,林利祥等.2015,39(11):p3195-3201.)以數(shù)據(jù)挖掘技術(shù)為基礎(chǔ),提出了一種基于密度聚類分析和frechet距離判別的異常用戶甄別方法?!盎跀?shù)據(jù)挖掘的計量裝置在線監(jiān)測與智能診斷系統(tǒng)的設(shè)計與實現(xiàn)”(《電測與儀表》,肖堅紅,嚴(yán)小文,周永真,等.2014,51(14):p1-5.)中提出和研制了一套計量裝置在線檢測和智能診斷系統(tǒng),能夠分析出用戶竊電和計量裝置故障等情況。
上述研究取得了一定進展,然而這些文獻僅對某一種方法進行了分析,而這些方法有各自的適用范圍,能夠處理的異常情況也有限制。
因此,如何在用戶電量海量數(shù)據(jù)的基礎(chǔ)上,對數(shù)據(jù)和方法進行歸類和預(yù)處理,分析出各種方法的適用情況,使其能夠推廣應(yīng)用,輔助工作人員進行電能計量異常排查還需要進一步的研究。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是提供一種基于用電采集系統(tǒng)的多時間尺度用電異常分析方法。其基于用電信息采集系統(tǒng),按照時間尺度長短,對用電信息采集系統(tǒng)采集的數(shù)據(jù)進行分類,將用電采集系統(tǒng)獲取的數(shù)據(jù)梳理成了短期用電數(shù)據(jù)和中長期用電數(shù)據(jù);針對短期用電數(shù)據(jù),利用電流電壓等電氣信息,結(jié)合相關(guān)的限值判定方法,辨識用電異常用戶;針對中長期用電數(shù)據(jù),利用日用電量和月用電量等電氣信息,結(jié)合聚類算法和相關(guān)系數(shù)法,查找用電異常情況,進而實現(xiàn)了多時間尺度用電異常的分析,可從不同的時間尺度角度搜索到異常用電嫌疑用戶。
本發(fā)明的技術(shù)方案是:提供一種基于用電采集系統(tǒng)的多時間尺度用電異常分析方法,包括通過用電信息采集系統(tǒng)采集用戶用電的數(shù)據(jù),其特征是:
首先按照時間尺度,對用電信息采集系統(tǒng)采集的數(shù)據(jù)進行分類;
所述的時間尺度分為短期時間尺度數(shù)據(jù)和中長期時間尺度數(shù)據(jù);
所述的短期時間尺度數(shù)據(jù)包括每時刻電流電壓集合和每日24小時電流電壓集合;
所述的中長期時間尺度數(shù)據(jù)包括月度每日用電量集合和年度每月用電量集合;
對短期時間尺度數(shù)據(jù),采用電流電壓判定算法進行用戶用電異常辨識;
對中長期時間尺度數(shù)據(jù),采用聚類算法和相關(guān)系數(shù)法進行用戶用電異常辨識;
所述的基于用電采集系統(tǒng)的多時間尺度用電異常分析方法,按照時間尺度,將用電采集系統(tǒng)獲取的數(shù)據(jù),梳理成了短期用電數(shù)據(jù)和中長期用電數(shù)據(jù),從而從不同的時間尺度角度搜索到異常用電嫌疑用戶。
具體的,在進行短期時間尺度的用電異常分析時,所述的電流電壓判定算法用電壓偏移系數(shù)βu和三相電流不平衡率βi作為用電異常的判斷元素,電壓偏移系數(shù)βu和三相電流不平衡率βi的具體計算方式如下:
式中u為電壓;ue為額定電壓;imax為三相中最大的相電流;iav為三相電流平均值;
根據(jù)電壓偏移系數(shù)βu和三相電流不平衡率βi計算用戶a相、b相和c相的電壓偏移系數(shù)βau、βbu、βcu以及電流不平衡率βi,并做以下判斷:
式中:
當(dāng)各相的電壓偏移系數(shù)βu、三相電流不平衡率βi與電壓偏移系數(shù)的限值
具體的,在進行中長期時間尺度的用電異常分析時,所述的聚類算法首先通過聚類分析得到該用電類別的典型用電負(fù)荷曲線,進而將需要排查的用戶與典型用電負(fù)荷曲線進行比較,進而找出用電異常嫌疑用戶。
其所述的聚類算法為k-means算法。
具體的,在進行中長期時間尺度的用電異常分析時,所述的相關(guān)系數(shù)法計算臺區(qū)線損和用戶電表顯示電量之間的相關(guān)系數(shù),若相關(guān)性高,則該用戶存在異常嫌疑。
具體的,在計算臺區(qū)線損和用戶電表顯示電量之間的相關(guān)系數(shù)時,對于臺區(qū)線損δw和用戶電量wo,i,所述相關(guān)系數(shù)ri的計算公式如下:
式中:wo,i為用戶電表顯示電量,δwi為計量誤差,δw為臺區(qū)線損,e(·)為期望值函數(shù);
若相關(guān)系數(shù)ri大于其閾值
本發(fā)明的技術(shù)方案,在基于月度每日用電量集合對中長期數(shù)據(jù)進行用戶用電異常辨識時,按照下列步驟進行:
步驟1:選取臺區(qū)線損合理的用戶最近的一個月30天日用電量數(shù)據(jù)作為樣本數(shù)據(jù),提取待分析的臺區(qū)用戶最近一個月30天日用電量數(shù)據(jù)做為分析數(shù)據(jù);
步驟2:針對樣本數(shù)據(jù)和分析數(shù)據(jù)中缺失部分,利用三次樣條插值結(jié)合線性插值的方法補充缺失數(shù)據(jù),其中滿足三次樣條插值條件的采用三次樣條插值,不滿足時,采用線性插值處理;
步驟3:在補全所有用電量數(shù)據(jù)后,為了消除不同量綱的影響,更好的體現(xiàn)用電變化規(guī)律,需要對原始數(shù)據(jù)進行歸一化處理,把數(shù)據(jù)壓縮在區(qū)間[0,1]之間。具體處理公式如下:
式中:w、w′分別為用戶日用電量的原始數(shù)據(jù)和變換后的數(shù)據(jù);wmin和wmax分別為用戶在一個月內(nèi)的日用電量最小值和最大值;
步驟4:對歸一化后的樣本數(shù)據(jù)按照用電性質(zhì)進行分類,并利用聚類分析查找出用電異常嫌疑用戶;
步驟5:根據(jù)待分析臺區(qū)的關(guān)口總表數(shù)據(jù)和用戶日用電量數(shù)據(jù),計算出臺區(qū)日線損量,進而利用相關(guān)系數(shù)法計算臺區(qū)日線損量和用戶日用電量之間的皮爾遜相關(guān)系數(shù),查找出用電異常嫌疑用戶;
步驟6:對步驟4和步驟5中發(fā)現(xiàn)的用電異常嫌疑用戶進行現(xiàn)場核查,找出用電異常用戶。
本發(fā)明的技術(shù)方案,在基于年度每月用電量集合對中長期數(shù)據(jù)進行用戶用電異常辨識時,所分析的數(shù)據(jù)從一個月30日的日用電量數(shù)據(jù)變成一年12月的月用電量數(shù)據(jù),其它計算過程與基于月度每日用電量集合對中長期數(shù)據(jù)進行用戶用電異常辨識是的步驟相同。
與現(xiàn)有技術(shù)比較,本發(fā)明的優(yōu)點是:
1.按照時間尺度,將用電采集系統(tǒng)獲取的數(shù)據(jù)梳理成了短期用電數(shù)據(jù)和中長期用電數(shù)據(jù),進而提出了一種多時間尺度用電異常分析方法來辨識用電異常情況;
2.基于電流電壓判定算法的短期異常用電分析方法具有較高的準(zhǔn)確性,適用于辨識專變終端用戶異常情況;
3.聚類算法和相關(guān)系數(shù)法具有不同的適用范圍,都能夠有效的查找用電異常用戶;
4.基于月度數(shù)據(jù)的異常分析方法較基于年度數(shù)據(jù)的方法實時性好,但年度數(shù)據(jù)真實性好,都有一定的分析價值。
附圖說明
圖1是本發(fā)明用電異常分析方法總體框架示意圖;
圖2是本發(fā)明k-means算法的計算流程示意圖;
圖3是基于月度用電數(shù)據(jù)得到居民用戶30日的典型負(fù)荷曲線;
圖4是基于月度用電數(shù)據(jù)得到商業(yè)用戶30日的典型負(fù)荷曲線。
具體實施方式
下面結(jié)合附圖和實施例對本發(fā)明做進一步說明。
本發(fā)明的技術(shù)方案,基于用電信息采集系統(tǒng),按照時間尺度長短,將用電數(shù)據(jù)劃分為短期用電數(shù)據(jù)和中長期用電數(shù)據(jù),進而提出了多時間尺度用電異常分析方法。該方法針對短期時間尺度,利用電流電壓等電氣信息,結(jié)合相關(guān)的限值判定方法,辨識用電異常用戶;針對中長期時間尺度,利用日用電量和月用電量等電氣信息,結(jié)合聚類算法和相關(guān)系數(shù)法,查找用電異常情況。
考慮到用電信息采集系統(tǒng)獲取的數(shù)據(jù)量較大,包含的信息量較多,因此按照時間尺度對數(shù)據(jù)進行分類,進而提出了相關(guān)的分析方法來識別用戶異常的嫌疑用戶?;谟秒娦畔⒉杉到y(tǒng)的多時間尺度用電異常分析方法總體框架如圖1所示。
具體過程如下:首先按照時間尺度,對系統(tǒng)采集的數(shù)據(jù)進行分類,短期數(shù)據(jù)可分為每時刻電流電壓集合和每日24小時電流電壓集合,中長期數(shù)據(jù)可分為月度每日用電量集合和年度每月用電量集合,針對短期數(shù)據(jù)可采用電流電壓判定算法進行異常辨識,針對中長期數(shù)據(jù)可采用聚類算法和相關(guān)系數(shù)法進行異常辨識,從而從不同的時間尺度角度搜索到異常用電嫌疑用戶。
本發(fā)明所述的方法針對不同用戶,具體操作存在一定的差別。目前用來采集用電信息的裝置主要有兩種,一種是專變終端,另一種是集中器。其中專變終端能夠獲取用戶的電流電壓和用電量等信息,對于這部分用戶,可采用短期和中長期時間尺度的異常用電分析方法進行綜合判斷;而集中器一般沒有開通獲取電流電壓信息的通道,只能獲取用戶用電量信息,對于這部分用戶可采用中長期時間尺度的異常用電分析方法進行異常辨識。
1、短期時間尺度的用電異常分析方法
1.1、電壓電流判定算法
專變終端主要是對三相用戶采集信息,正常情況下,對于三相用戶而言,電壓會維持在額定值附近,同時電流不平衡率也較小。當(dāng)出現(xiàn)明顯的電壓偏移或存在較大的不平衡電流時,表明此用戶可能用電異常,需要排查。因此本文選用電壓偏移系數(shù)βu和三相電流不平衡率βi作為用電異常的判斷元素,具體計算公式如下:
式中:u為電壓;ue為額定電壓;imax為三相中最大的相電流;iav為三相電流平均值。
1.2基于實時用電數(shù)據(jù)的分析方法
專變終端可以實時獲取用戶的電壓、電流數(shù)據(jù),進而基于這些數(shù)據(jù),根據(jù)式(1)和式(2)計算用戶a相、b相和c相的電壓偏移系數(shù)βau、βbu、βcu以及電流不平衡率βi,并做以下判斷:
式中:
1.3基于日用電數(shù)據(jù)的分析方法
專變終端會按照15min的時間間隔,對用戶的電壓和電流數(shù)據(jù)進行采樣,繪制日電壓和電流曲線??紤]到異常用電通常會維持幾個小時以上,因此從中選取各整點時刻的電壓、電流數(shù)據(jù)作為分析的依據(jù)即可說明問題。每日24小時的三相最大電壓偏移系數(shù)歐式距離du和三相電流不平衡率歐式距離di計算公式分別如下:
若du值超過其限值
2、中長期時間尺度的異常用電分析方法
2.1聚類算法
對于相同用電類別的用戶,相互之間的用電行為特征具有一定的相似性。基于這一特征,首先可以通過聚類分析得到該用電類別的典型用電負(fù)荷曲線,進而將需要排查的用戶與典型用電負(fù)荷曲線進行比較,找出用電異常嫌疑用戶。
在各種聚類方法中,k-means聚類算法具有收斂速度快、易于實現(xiàn)等優(yōu)點,被廣泛應(yīng)用于用電負(fù)荷分析中,因此本技術(shù)方案選用該方法。
k-means算法的具體計算流程如圖2所示。
基于k-means算法可以得到聚類中心集合,即典型用電負(fù)荷集合q={q1,q2,…,qk}。進而將需要排查的用電負(fù)荷數(shù)據(jù)w與q對比,計算最小歐式距離dw:
dw=min[dist(w,q1),dist(w,q2),...,dist(w,qk)](6)
式中:dist(·)為歐式距離函數(shù)。若dw值超過其限值
2.2相關(guān)系數(shù)法
表計計量誤差的計算公式如下:
式中:
因此式(7)可以轉(zhuǎn)化成:
從上式可以看出,當(dāng)用戶電表顯示電量wo,i越大,計量誤差δwi就越大,臺區(qū)線損δw也就越大,wo,i與臺區(qū)線損之間具有明顯的相關(guān)性。因此可以利用相關(guān)系數(shù)法計算臺區(qū)線損和用戶電表顯示電量之間的相關(guān)系數(shù),若相關(guān)性高,則該用戶存在異常嫌疑。在常用的相關(guān)系數(shù)中,皮爾遜相關(guān)系數(shù)能夠有效的衡量兩個變量之間線性相關(guān)程度,因此可選用該方法進行用電異常分析。對于臺區(qū)線損δw和用戶電量wo,i,皮爾遜相關(guān)系數(shù)計算公式如下:
式中:e(·)為期望值函數(shù)。若ri大于其閾值
2.3基于月度用電數(shù)據(jù)的分析方法
基于月度用電數(shù)據(jù)的分析方法計算過程如下:
步驟1:選取臺區(qū)線損合理的用戶最近的一個月30天日用電量數(shù)據(jù)作為樣本數(shù)據(jù),提取待分析的臺區(qū)用戶最近一個月30天日用電量數(shù)據(jù)做為分析數(shù)據(jù);
步驟2:針對樣本數(shù)據(jù)和分析數(shù)據(jù)中缺失部分,利用三次樣條插值[11]結(jié)合線性插值的方法補充缺失數(shù)據(jù),其中滿足三次樣條插值條件的采用三次樣條插值,不滿足時,采用線性插值處理;
步驟3:在補全所有用電量數(shù)據(jù)后,為了消除不同量綱的影響,更好的體現(xiàn)用電變化規(guī)律,需要對原始數(shù)據(jù)進行歸一化處理,把數(shù)據(jù)壓縮在區(qū)間[0,1]之間。具體處理公式如下:
式中:w、w′分別為用戶日用電量的原始數(shù)據(jù)和變換后的數(shù)據(jù);wmin和wmax分別為用戶在一個月內(nèi)的日用電量最小值和最大值。
步驟4:對歸一化后的樣本數(shù)據(jù)按照用電性質(zhì)進行分類,并利用聚類分析查找出用電異常嫌疑用戶;
步驟5:根據(jù)待分析臺區(qū)的關(guān)口總表數(shù)據(jù)和用戶日用電量數(shù)據(jù),計算出臺區(qū)日線損量,進而利用相關(guān)系數(shù)法計算臺區(qū)日線損量和用戶日用電量之間的皮爾遜相關(guān)系數(shù),查找出用電異常嫌疑用戶;
步驟6:對步驟4和步驟5中發(fā)現(xiàn)的用電異常嫌疑用戶進行現(xiàn)場核查,找出用電異常用戶。
2.4基于年度用電數(shù)據(jù)的分析方法
基于年度用電數(shù)據(jù)的分析方法和基于月度用電數(shù)據(jù)的分析方法類似,只是將所分析的數(shù)據(jù)從一個月30日的日用電量數(shù)據(jù)變成一年12月的月用電量數(shù)據(jù),其它步驟和計算過程相同。
實施例:
3.1短期時間尺度的異常用電實例分析
以某地區(qū)線損較高的5個臺區(qū)139個專變終端用戶為分析對象,驗證短期時間尺度的異常用電分析方法的有效性。
設(shè)
表1基于實時數(shù)據(jù)的分析結(jié)果
設(shè)
由此可見,基于電流電壓判定算法的短期異常用電分析方法具有較高的準(zhǔn)確性。
表2基于日用電數(shù)據(jù)的分析結(jié)果
3.2中長期時間尺度的異常用電實例分析
為了驗證聚類算法的有效性,首先選取臺區(qū)線損合理的5789戶居民用戶和1951戶商業(yè)用戶作為樣本數(shù)據(jù)進行聚類分析,得出典型負(fù)荷曲線,然后將某個包含62戶居民用戶和7戶商業(yè)用戶的臺區(qū)作為分析對象,與典型負(fù)荷曲線進行對比,判斷出嫌疑用戶。
在聚類分析中,居民用戶和商業(yè)用戶的聚類數(shù)分別設(shè)置為15個和10個,基于月度用電數(shù)據(jù)得到30日的典型負(fù)荷曲線如圖3和圖4所示。
將分析對象與典型負(fù)荷曲線進行對比,距離限值
表3基于聚類算法的分析結(jié)果
為了驗證相關(guān)系數(shù)法的有效性,計算62戶居民用戶和7戶商業(yè)用戶與臺區(qū)線損的相關(guān)系數(shù),并選取相關(guān)系數(shù)大于0.9的作為嫌疑用戶,具體計算結(jié)果如表4所示,共包含4戶居民和1戶商業(yè)用戶,經(jīng)現(xiàn)場排查發(fā)現(xiàn),2戶居民用戶和1戶商業(yè)用戶存在用電異常,準(zhǔn)確率為60%。
對比聚類算法和相關(guān)系數(shù)法可以發(fā)現(xiàn):聚類算法查找到的居民用戶異常數(shù)量和準(zhǔn)確率都高于相關(guān)系數(shù)法,而相關(guān)系數(shù)法比聚類算法多查出了一戶商業(yè)用戶用電異常,由此可見兩種算法具有不同的適用性。
表4基于相關(guān)系數(shù)法的分析結(jié)果
基于年度數(shù)據(jù),利用聚類分析算法查出用電異常嫌疑用戶7戶,查實4戶,準(zhǔn)確率為57.14%;利用相關(guān)系數(shù)法查出用電異常嫌疑用戶6戶,查實3戶,準(zhǔn)確率為50%。
相比于月度數(shù)據(jù),基于年度數(shù)據(jù)的用電異常排查方法準(zhǔn)確率都要略低一點,經(jīng)分析,主要包括以下兩個原因:(1)月度數(shù)據(jù)包括30個時段,而年度數(shù)據(jù)包含12個時段,月度數(shù)據(jù)樣本量大,能夠更好的反映用電變化的規(guī)律;(2)月度數(shù)據(jù)采樣周期短,而年度數(shù)據(jù)采樣周期長,月度數(shù)據(jù)能夠更好的反映用電變化的實時性。但是由于采集通道問題,日用電量數(shù)據(jù)會存在一定程度缺失,即使利用插值方法彌補,也會存在部分失真現(xiàn)象,而對于月用電量數(shù)據(jù),由于有人工補抄環(huán)節(jié),所以數(shù)據(jù)較為完整,體現(xiàn)的信息更為真實,因此基于年度數(shù)據(jù)的用電異常排查方法也有一定的價值。
3.3多時間尺度的異常用電實例分析
利用所提出的多時間尺度用電異常分析方法,對21個臺區(qū)2079個用戶進行分析,共排查用電異常嫌疑用戶97戶,查實用戶62戶,此21個臺區(qū)平均月線損率下降了8.23%,由此可見所提方法能夠有效的輔助監(jiān)控人員及時甄別用戶異常用電情況。
由于本發(fā)明的技術(shù)方案按照時間尺度,將用電采集系統(tǒng)獲取的數(shù)據(jù)梳理成了短期用電數(shù)據(jù)和中長期用電數(shù)據(jù),進而提出了一種多時間尺度用電異常分析方法來辨識用電異常情況,通過實例分析可以得出以下結(jié)論:
(1)基于電流電壓判定算法的短期異常用電分析方法具有較高的準(zhǔn)確性,適用于辨識專變終端用戶異常情況。
(2)聚類算法和相關(guān)系數(shù)法具有不同的適用范圍,都能夠有效的查找用電異常用戶。
(3)基于月度數(shù)據(jù)的異常分析方法較基于年度數(shù)據(jù)的方法實時性好,但年度數(shù)據(jù)真實性好,都有一定的分析價值。
本發(fā)明可廣泛用于供電公司用電管理和用戶用電異常情況辨識領(lǐng)域。