本發(fā)明涉及電能計量異常識別領(lǐng)域,尤其涉及一種基于特征分組的電能計量異常診斷方法及系統(tǒng)。
背景技術(shù):
:電力系統(tǒng)智能化是現(xiàn)階段電力行業(yè)發(fā)展的共同方向,而用電信息采集系統(tǒng)是保證這一工作內(nèi)容得以順利進行的重要基石。用電數(shù)據(jù)是由電能計量裝置將電力能源輸送過程中產(chǎn)生的數(shù)據(jù)采集得來。隨著該計量裝置的不斷應(yīng)用,受到器件老化、人為破壞等各種因素的影響,常常使得裝置出現(xiàn)不同程度的異常情況。這些計量異常的情況或大或小都會對電力企業(yè)帶來一定的經(jīng)濟損失,嚴重的話還會影響到電力管理工作。電能計量異常的情況種類繁多,一般包括計量表異常、互感器異常、接線盒異常等。每種設(shè)備又可以具體細分出異常子類,如:電壓斷相、電壓缺相、電流過負荷等等。然而,目前對于電能計量設(shè)備的故障異常類型的判斷主要是依靠現(xiàn)場維護處理的技術(shù)人員的經(jīng)驗來辨別確定,其判斷結(jié)果容易受主觀影響,且缺乏理論性依據(jù),判斷識別時間也較長,大大影響了現(xiàn)場事故處理的效率。技術(shù)實現(xiàn)要素:本發(fā)明實施例提供了一種基于特征分組的電能計量異常診斷方法及系統(tǒng),解決了目前對于電能計量設(shè)備的故障異常類型的判斷主要是依靠現(xiàn)場維護處理的技術(shù)人員的經(jīng)驗來辨別確定,其判斷結(jié)果容易受主觀影響,且缺乏理論性依據(jù),判斷識別時間也較長,大大影響了現(xiàn)場事故處理的效率。本發(fā)明實施例提供的一種基于特征分組的電能計量異常診斷方法,包括:根據(jù)獲取到的電能計量異常類型及電能計量異常類型的判據(jù),形成電能異常數(shù)據(jù)集,并根據(jù)電能計量異常類型的判據(jù)對應(yīng)的數(shù)據(jù)源和電能異常數(shù)據(jù)集構(gòu)建初始數(shù)據(jù)庫;對初始數(shù)據(jù)庫的數(shù)據(jù)源數(shù)據(jù)按照電能計量異常類型的判據(jù)進行數(shù)據(jù)變換,形成初始計量異常指標集;對初始計量異常指標集進行指標特征分組,形成多個指標組別;對指標組別進行多分類器訓練,得到若干個不同的分類模型;將若干個不同的分類模型進行融合,得到電能計量異常識別結(jié)果。優(yōu)選地,對初始數(shù)據(jù)庫的數(shù)據(jù)源數(shù)據(jù)按照電能計量異常類型的判據(jù)進行數(shù)據(jù)變換,形成初始計量異常指標集包括:對初始數(shù)據(jù)庫的數(shù)據(jù)源數(shù)據(jù)進行數(shù)據(jù)預處理并按照電能計量異常類型的判據(jù)進行數(shù)據(jù)變換,形成初始計量異常指標集,數(shù)據(jù)預處理包括糾正或刪除異常數(shù)據(jù)、插補缺失數(shù)據(jù)。優(yōu)選地,對初始計量異常指標集進行指標特征分組,形成多個指標組別包括:對初始計量異常指標集中的每種電能計量異常類型和每種電能計量異常類型對應(yīng)的指標進行匹配整理;根據(jù)指標與電能計量異常類型之間的特征關(guān)系進行指標特征分組,形成多個指標組別。優(yōu)選地,對指標組別進行多分類器訓練,得到若干個不同的分類模型包括:根據(jù)不同的電能計量異常類型,對每個指標組別的指標集選擇多個分類器進行訓練,得到若干個不同的訓練好的分類器模型,訓練好的分類器模型可固定識別對應(yīng)的電能計量異常類型。優(yōu)選地,將若干個不同的分類模型進行融合,得到電能計量異常識別結(jié)果包括:將訓練好的分類模型對應(yīng)識別的電能計量異常類型進行匯總,實現(xiàn)對所有電能計量異常類型的判別。本發(fā)明實施例提供的一種基于特征分組的電能計量異常診斷系統(tǒng),包括:構(gòu)建模塊,用于根據(jù)獲取到的電能計量異常類型及電能計量異常類型的判據(jù),形成電能異常數(shù)據(jù)集,并根據(jù)電能計量異常類型的判據(jù)對應(yīng)的數(shù)據(jù)源和電能異常數(shù)據(jù)集構(gòu)建初始數(shù)據(jù)庫;變換模塊,用于對初始數(shù)據(jù)庫的數(shù)據(jù)源數(shù)據(jù)按照電能計量異常類型的判據(jù)進行數(shù)據(jù)變換,形成初始計量異常指標集;分組模塊,用于對初始計量異常指標集進行指標特征分組,形成多個指標組別;訓練模塊,用于對指標組別進行多分類器訓練,得到若干個不同的分類模型;融合模塊,用于將若干個不同的分類模型進行融合,得到電能計量異常識別結(jié)果。優(yōu)選地,變換模塊包括:數(shù)據(jù)變化單元,用于對初始數(shù)據(jù)庫的數(shù)據(jù)源數(shù)據(jù)進行數(shù)據(jù)預處理并按照電能計量異常類型的判據(jù)進行數(shù)據(jù)變換,形成初始計量異常指標集,數(shù)據(jù)預處理包括糾正或刪除異常數(shù)據(jù)、插補缺失數(shù)據(jù)。優(yōu)選地,分組模塊包括:匹配單元,用于對初始計量異常指標集中的每種電能計量異常類型和每種電能計量異常類型對應(yīng)的指標進行匹配整理;分組單元,用于根據(jù)指標與電能計量異常類型之間的特征關(guān)系進行指標特征分組,形成多個指標組別。優(yōu)選地,訓練模塊包括:訓練單元,用于根據(jù)不同的電能計量異常類型,對每個指標組別的指標集選擇多個分類器進行訓練,得到若干個不同的訓練好的分類器模型,訓練好的分類器模型可固定識別對應(yīng)的電能計量異常類型。優(yōu)選地,融合模塊包括:匯總單元,用于將訓練好的分類模型對應(yīng)識別的電能計量異常類型進行匯總,實現(xiàn)對所有電能計量異常類型的判別。從以上技術(shù)方案可以看出,本發(fā)明實施例具有以下優(yōu)點:本發(fā)明實施例提供了一種基于特征分組的電能計量異常診斷方法及系統(tǒng),包括:根據(jù)獲取到的電能計量異常類型及電能計量異常類型的判據(jù),形成電能異常數(shù)據(jù)集,并根據(jù)電能計量異常類型的判據(jù)對應(yīng)的數(shù)據(jù)源和電能異常數(shù)據(jù)集構(gòu)建初始數(shù)據(jù)庫;對初始數(shù)據(jù)庫的數(shù)據(jù)源數(shù)據(jù)按照電能計量異常類型的判據(jù)進行數(shù)據(jù)變換,形成初始計量異常指標集;對初始計量異常指標集進行指標特征分組,形成多個指標組別;對指標組別進行多分類器訓練,得到若干個不同的分類模型;將若干個不同的分類模型進行融合,得到電能計量異常識別結(jié)果,本發(fā)明實施例中通過將供電企業(yè)實際供電應(yīng)用過程中發(fā)生的電能計量異常的各種類型以及判斷依據(jù)進行整合,提出基于特征分組的多分類器集成模型,該應(yīng)用不僅可以全方位智能化地“考量”研究對象是否發(fā)生計量異常,準確判斷異常類型;同時,基于特征分組的方法,還可以極大地降低數(shù)據(jù)重復率,實現(xiàn)模型性能的優(yōu)化,保證了模型識別的準確性,解決了目前對于電能計量設(shè)備的故障異常類型的判斷主要是依靠現(xiàn)場維護處理的技術(shù)人員的經(jīng)驗來辨別確定,其判斷結(jié)果容易受主觀影響,且缺乏理論性依據(jù),判斷識別時間也較長,大大影響了現(xiàn)場事故處理的效率的技術(shù)問題。附圖說明為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其它的附圖。圖1為本發(fā)明實施例提供的一種基于特征分組的電能計量異常診斷方法的一個實施例的流程示意圖;圖2為本發(fā)明實施例提供的一種基于特征分組的電能計量異常診斷方法的另一個實施例的流程示意圖;圖3為本發(fā)明實施例提供的一種基于特征分組的電能計量異常診斷系統(tǒng)的結(jié)構(gòu)示意圖。具體實施方式本發(fā)明實施例提供了一種基于特征分組的電能計量異常診斷方法及系統(tǒng),用于解決目前對于電能計量設(shè)備的故障異常類型的判斷主要是依靠現(xiàn)場維護處理的技術(shù)人員的經(jīng)驗來辨別確定,其判斷結(jié)果容易受主觀影響,且缺乏理論性依據(jù),判斷識別時間也較長,大大影響了現(xiàn)場事故處理的效率的技術(shù)問題。為使得本發(fā)明的發(fā)明目的、特征、優(yōu)點能夠更加的明顯和易懂,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,下面所描述的實施例僅僅是本發(fā)明一部分實施例,而非全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其它實施例,都屬于本發(fā)明保護的范圍。請參閱圖1,本發(fā)明實施例提供的一種基于特征分組的電能計量異常診斷方法包括:101、根據(jù)獲取到的電能計量異常類型及電能計量異常類型的判據(jù),形成電能異常數(shù)據(jù)集,并根據(jù)電能計量異常類型的判據(jù)對應(yīng)的數(shù)據(jù)源和電能異常數(shù)據(jù)集構(gòu)建初始數(shù)據(jù)庫;首先,對截止到目前發(fā)生的電能計量異常類型以及基于經(jīng)驗或者相關(guān)文獻資料所整理好的各種計量異常類型的判斷依據(jù)進行收集。根據(jù)獲取到的電能計量異常類型及電能計量異常類型的判據(jù),形成電能異常數(shù)據(jù)集,并根據(jù)電能計量異常類型的判據(jù)對應(yīng)的數(shù)據(jù)源和電能異常數(shù)據(jù)集構(gòu)建初始數(shù)據(jù)庫。102、對初始數(shù)據(jù)庫的數(shù)據(jù)源數(shù)據(jù)按照電能計量異常類型的判據(jù)進行數(shù)據(jù)變換,形成初始計量異常指標集;在根據(jù)獲取到的電能計量異常類型及電能計量異常類型的判據(jù),形成電能異常數(shù)據(jù)集,并根據(jù)電能計量異常類型的判據(jù)對應(yīng)的數(shù)據(jù)源和電能異常數(shù)據(jù)集構(gòu)建初始數(shù)據(jù)庫之后,對初始數(shù)據(jù)庫的數(shù)據(jù)源數(shù)據(jù)按照電能計量異常類型的判據(jù)進行數(shù)據(jù)變換,形成初始計量異常指標集。103、對初始計量異常指標集進行指標特征分組,形成多個指標組別;在對初始數(shù)據(jù)庫的數(shù)據(jù)源數(shù)據(jù)按照電能計量異常類型的判據(jù)進行數(shù)據(jù)變換,形成初始計量異常指標集之后,對初始計量異常指標集進行指標特征分組,形成多個指標組別。104、對指標組別進行多分類器訓練,得到若干個不同的分類模型;在對初始計量異常指標集進行指標特征分組,形成多個指標組別之后,對指標組別進行多分類器訓練,得到若干個不同的分類模型。105、將若干個不同的分類模型進行融合,得到電能計量異常識別結(jié)果。在對指標組別進行多分類器訓練,得到若干個不同的分類模型之后,需要將若干個不同的分類模型進行融合,得到電能計量異常識別結(jié)果。以上為對本發(fā)明實施例提供的一種基于特征分組的電能計量異常診斷方法的一個實施例的詳細描述,以下將對本發(fā)明實施例提供的一種基于特征分組的電能計量異常診斷方法的另一個實施例進行詳細的描述。請參閱圖2,本發(fā)明實施例提供的一種基于特征分組的電能計量異常診斷方法的另一個實施例,包括:201、根據(jù)獲取到的電能計量異常類型及電能計量異常類型的判據(jù),形成電能異常數(shù)據(jù)集,并根據(jù)電能計量異常類型的判據(jù)對應(yīng)的數(shù)據(jù)源和電能異常數(shù)據(jù)集構(gòu)建初始數(shù)據(jù)庫;首先,對截止到目前發(fā)生的電能計量異常類型以及基于經(jīng)驗或者相關(guān)文獻資料所整理好的各種計量異常類型的判斷依據(jù)進行收集。根據(jù)獲取到的電能計量異常類型及電能計量異常類型的判據(jù),形成電能異常數(shù)據(jù)集,并根據(jù)電能計量異常類型的判據(jù)對應(yīng)的數(shù)據(jù)源和電能異常數(shù)據(jù)集構(gòu)建初始數(shù)據(jù)庫。202、對初始數(shù)據(jù)庫的數(shù)據(jù)源數(shù)據(jù)進行數(shù)據(jù)預處理并按照電能計量異常類型的判據(jù)進行數(shù)據(jù)變換,形成初始計量異常指標集,數(shù)據(jù)預處理包括糾正或刪除異常數(shù)據(jù)、插補缺失數(shù)據(jù);然后,對初始數(shù)據(jù)庫的數(shù)據(jù)源數(shù)據(jù)進行數(shù)據(jù)預處理并按照電能計量異常類型的判據(jù)進行數(shù)據(jù)變換,并且遵循電能計量異常判斷中提及的判據(jù),對變換后的數(shù)據(jù)用映射或者變換的方法形成初始計量異常指標集,其中,數(shù)據(jù)預處理包括糾正或刪除異常數(shù)據(jù)、插補缺失數(shù)據(jù)。203、對初始計量異常指標集中的每種電能計量異常類型和每種電能計量異常類型對應(yīng)的指標進行匹配整理;在對初始數(shù)據(jù)庫的數(shù)據(jù)源數(shù)據(jù)進行數(shù)據(jù)預處理并按照電能計量異常類型的判據(jù)進行數(shù)據(jù)變換,形成初始計量異常指標集之后,對初始計量異常指標集中的每種電能計量異常類型和每種電能計量異常類型對應(yīng)的指標進行匹配整理。其中,一種電能計量異常類型包含一個或多個指標;兩種不同的計量異常類型所涉及的指標之間會存在獨立、交叉、包含中的一種關(guān)系。204、根據(jù)指標與電能計量異常類型之間的特征關(guān)系進行指標特征分組,形成多個指標組別;在對初始計量異常指標集中的每種電能計量異常類型和每種電能計量異常類型對應(yīng)的指標進行匹配整理之后,需要根據(jù)指標與電能計量異常類型之間的特征關(guān)系進行指標特征分組,形成多個指標組別。以每種計量異常類型涉及的指標作為研究對象,當出現(xiàn)以下3種情形中的任意一種時,都可以將其對應(yīng)的異常類型和指標歸成單獨的一組,對于重合的指標只取一次;否則,每種異常類型及其指標獨立成一組。上述三種情形中,Ua、Ub、Uc表示分別代表著電能計量異常類型a、b、c所涉及的指標集。在指標分組完成后,每組指標至少包含一種計量異常類型對應(yīng)的所有指標。205、根據(jù)不同的電能計量異常類型,對每個指標組別的指標集選擇多個分類器進行訓練,得到若干個不同的訓練好的分類器模型,訓練好的分類器模型可固定識別對應(yīng)的電能計量異常類型;在根據(jù)指標與電能計量異常類型之間的特征關(guān)系進行指標特征分組,形成多個指標組別之后,根據(jù)不同的計量異常類型,對每個組別的指標集選擇多個分類器進行訓練,得到若干個分類器模型,其中,分類器選擇有監(jiān)督的分類器模型。所得到的若干個分類器模型中,每個指標組別訓練好的分類器模型可以固定地識別其所對應(yīng)的計量異常類型。206、將訓練好的分類模型對應(yīng)識別的電能計量異常類型進行匯總,實現(xiàn)對所有電能計量異常類型的判別。在訓練好的若干個分類器模型中,已經(jīng)囊括了當前涉及的所有計量異常類型。最后則將每個分類器模型識別的計量異常類型進行匯總,實現(xiàn)每個研究對象所有故障類型的判別。以上為對本發(fā)明實施例提供的一種基于特征分組的電能計量異常診斷方法的另一個實施例的詳細描述,為便于理解,以下將以具體的例子對本發(fā)明實施例所提供的一種基于特征分組的電能計量異常診斷方法進行詳細的說明。第一步,根據(jù)電力項目的具體需求,獲取電能計量異常類型的相關(guān)信息并整理出相關(guān)的數(shù)據(jù)源。表1電能計量異常類型信息如表1所示,計量異常類型包含了常見且亟待解決的計量異常類型及其對應(yīng)的判據(jù)兩個字段。鑒于該電力項目涉及的數(shù)據(jù)過大,這里簡單列舉了電壓缺相、電壓不平衡、電壓斷相、電流過負荷、電流反極性、電流不平衡、失流7種計量異常情況進行梳理。電壓缺相的判據(jù)主要有三個:1、本相電壓<80%Un;2、本相電流>1%In;3、持續(xù)時間大于1小時。根據(jù)這三個判據(jù)所提到的數(shù)據(jù)源應(yīng)該包括:三相三(三相四)電壓、額定電壓、三相三(三相四)電流、額定電流、時間數(shù)據(jù)。以此類推,即可找到所有計量異常類型判據(jù)的數(shù)據(jù)源。該數(shù)據(jù)源來自電力公司主網(wǎng)數(shù)據(jù)的負荷數(shù)據(jù)、行度數(shù)據(jù)、檔案信息。第二步,對初始數(shù)據(jù)庫的數(shù)據(jù)源數(shù)據(jù)按照電能計量異常類型的判據(jù)進行數(shù)據(jù)變換,形成初始計量異常指標集。本步驟的主要目標是實現(xiàn)指標集的構(gòu)造,主要依據(jù)為計量異常的判據(jù)。之所以不直接使用計量異常的判據(jù)直接判斷是否發(fā)生計量異常的原因是,判據(jù)的確定由專家給定,很多閾值的確定太過人為主觀,更容易出現(xiàn)漏判誤判的情況。因而需要構(gòu)造指標,通過機器學習去識別規(guī)則。現(xiàn)實的數(shù)據(jù)往往會出現(xiàn)大量不合理的數(shù)據(jù),在做指標構(gòu)造之前首先需對源數(shù)據(jù)進行預處理,包括對異常數(shù)據(jù)的糾正或刪除,缺失數(shù)據(jù)選擇適當?shù)姆椒ú逖a,從而獲得糾正數(shù)據(jù)。在數(shù)據(jù)預處理之后,遵循電能計量異常判斷中提及的判據(jù),對糾正數(shù)據(jù)用映射或者變換的方法構(gòu)造初始計量異常指標集。表2指標集構(gòu)造以電壓缺相為例,電壓缺相的三個判據(jù)中有兩個判據(jù)涉及到兩個數(shù)據(jù)的比較,這樣的數(shù)據(jù)通常以比值的方式轉(zhuǎn)換成指標。所以電壓缺相構(gòu)造的指標為電壓額定比(某相電壓Ux/額定電壓Un*100)、電流額定比(某相電流Ix/額定電流In*100)、狀態(tài)持續(xù)時間(小時)。以電壓缺相為例,持續(xù)時間指標構(gòu)建:不難理解判據(jù)中提到的“持續(xù)時間大于1小時”,指的是在同時滿足“本相電壓<80%Un”和“本相電流>1%In”狀態(tài)下持續(xù)的時間大于1小時。構(gòu)造該指標時,首先需計算出除時間指標外其它指標的獨立狀態(tài)持續(xù)時間,分別有電壓額定比狀態(tài)持續(xù)時間、電流額定比狀態(tài)持續(xù)時間。電壓額定比狀態(tài)持續(xù)時間:記電壓額定比指標值為α,判據(jù)“本相電壓<80%Un”,這里需要記錄的持續(xù)時間應(yīng)該是前后相鄰記錄落入[0,α]時的時間跨度。電流額定比狀態(tài)持續(xù)時間:記電流額定比指標值為β,判據(jù)“本相電流>1%In”,這里需要記錄的持續(xù)時間應(yīng)該是前后相鄰記錄落入[β,100]時的時間跨度。那么電壓缺相的狀態(tài)持續(xù)時間為:min(電壓額定比狀態(tài)持續(xù)時間,電流額定比狀態(tài)持續(xù)時間)。以此類推,完成電能計量異常類型所涉及的指標集構(gòu)造。第四步,對初始計量異常指標集進行指標特征分組,形成多個指標組別。對初始計量故障指標集的特征分組包含以下子步驟:S3.1:整合計量異常及對應(yīng)指標清單。將每種計量異常類型所涉及的指標進行歸納整理。如表3所示,電壓缺相、電壓不平衡、電壓斷相、電流過負荷、電流反極性、電流不平衡、失流分別涉及的指標集在指標字段中均可找到。表3異常類型指標集以上每個計量異常類型都涉及到2~3個指標。在本項目中,劃分不同計量異常對應(yīng)的指標集之間的關(guān)系時,先將狀態(tài)持續(xù)時間忽略再劃分,比如除指標狀態(tài)持續(xù)時間以外,電壓缺相和電壓斷相的對應(yīng)的指標集之間屬于包含(重合)關(guān)系,即或同理劃分其它不同計量異常類型對應(yīng)指標集之間的關(guān)系。S3.2:指標特征分組。以每種計量異常類型涉及的指標作為研究對象,當出現(xiàn)以下3種情形中的任意一種時,都可以將其對應(yīng)的異常類型和指標歸成單獨的一組,對于重合的指標只取一次;否則,每種異常類型及其指標獨立成一組。上式中,Ua、Ub、Uc表示分別代表著電能計量異常類型a、b、c所涉及的指標集。按照上述準則得到的指標集分組如表4所示。表4分組指標電壓缺相、電壓斷相、電流過負荷對應(yīng)的指標集被劃分到了第一組,對應(yīng)的新指標集為:電壓額定比、電流額定比、狀態(tài)持續(xù)時間1、狀態(tài)持續(xù)時間3、狀態(tài)持續(xù)時間4。第一組指標集可以通過模型訓練同時完成電壓缺相、電壓斷相、電流過負荷三種計量異常類型的診斷,減少了診斷模型的同時,又可以很好地降低指標冗余。其它異常類型的指標集都為相互獨立的關(guān)系,故單獨成為一組。第四步,對多個指標組別進行多分類器訓練,得出不同分類模型。根據(jù)不同的計量異常類型,對每個組別的指標集選擇多個分類器進行訓練,得到若干個分類器模型。本發(fā)明實施例用于訓練的分類器模型使用了神經(jīng)網(wǎng)絡(luò)、決策樹、樸素貝葉斯、支持向量機。本發(fā)明實施例的測試小樣本庫里有12147位用戶,其中包含正常用戶、單個計量問題用戶、多個計量異常問題客戶。隨機選擇20%作為測試樣本,剩下的作為訓練樣本。在訓練模型之前先對每組指標做消除量綱處理,采用的方法為極差標準化。表5訓練集各組指標模型準確率(%)表5為訓練集各組指標的四個分類器模型訓練準確率,準確率越高,說明模型訓練效果越好。通過該表選擇每組指標對應(yīng)準確率最高的分類器見表6。表6準確率最高的分類器組別分類器第一組神經(jīng)網(wǎng)絡(luò)第二組神經(jīng)網(wǎng)絡(luò)第三組支持向量機第四組支持向量機第五組樸素貝葉斯同時結(jié)合模型的另兩個評價結(jié)果,可以得到表7正常用戶誤判為異常用戶的比例、表8異常用戶誤判為正常用戶的比例,表7和表8具體如下:表7正常用戶誤判為異常用戶的比例(%)神經(jīng)網(wǎng)絡(luò)決策樹樸素貝葉斯支持向量機第一組1.955.855.051.89第二組0.634.461.357.40第三組6.855.057.344.77第四組3.646.808.232.90第五組5.993.711.345.49表8異常用戶誤判為正常用戶的比例(%)神經(jīng)網(wǎng)絡(luò)決策樹樸素貝葉斯支持向量機第一組28.622.8638.9023.77第二組19.4132.2526.3120.00第三組27.1629.5335.3124.80第四組20.0722.9827.3825.77第五組30.1228.7329.0127.96第一組指標的神經(jīng)網(wǎng)絡(luò)分類器訓練結(jié)果顯示,其準確率最高、正常用戶錯判比例最低,雖然異常用戶漏判比例不是最低,但與22.86%相差不大,綜合考慮,將第一組指標的分類器模型選定為神經(jīng)網(wǎng)絡(luò)。同理確定其它組別的分類器,第二組:神經(jīng)網(wǎng)絡(luò);第三組:支持向量機;第四組:支持向量機;第五組:樸素貝葉斯。第五步,將多分類器訓練結(jié)果進行融合,得到最終電能計量異常識別結(jié)果。確定好多分類器后,將20%的測試樣本代入五個分類器模型中測跑,五個指標組別的準確率如下:表9測試數(shù)據(jù)分類器準確率組別準確率(%)第一組92.04第二組96.50第三組93.02第四組98.73第五組95.77表9顯示分類器的測跑效果很好,準確率都在90%以上,最高可以達到98.73%。最后一步是實現(xiàn)用戶各種計量異常診斷結(jié)果的匯總,效果如下:表10用戶計量異常診斷結(jié)果用戶ID計量異常時間點09297無2016-12-0700:00:0011532電壓缺相2016-12-0104:00:0021200失流、電流不平衡2016-12-0512:00:0009349無2016-12-0706:00:0097008失流2016-12-0421:00:00如表10所示,該基于特征分組的多分類器集成模型可以識別同一時刻發(fā)生的多種計量異常,并將多個計量異常一起輸出。以上為對本發(fā)明實施例提供的一種基于特征分組的電能計量異常診斷方法的具體例子的詳細說明,以下將對本發(fā)明實施例提供的一種基于特征分組的電能計量異常診斷系統(tǒng)進行詳細的描述。請參閱圖3,本發(fā)明實施例提供的一種基于特征分組的電能計量異常診斷系統(tǒng)包括:構(gòu)建模塊301,用于根據(jù)獲取到的電能計量異常類型及電能計量異常類型的判據(jù),形成電能異常數(shù)據(jù)集,并根據(jù)電能計量異常類型的判據(jù)對應(yīng)的數(shù)據(jù)源和電能異常數(shù)據(jù)集構(gòu)建初始數(shù)據(jù)庫;變換模塊302,用于對初始數(shù)據(jù)庫的數(shù)據(jù)源數(shù)據(jù)按照電能計量異常類型的判據(jù)進行數(shù)據(jù)變換,形成初始計量異常指標集;變換模塊302包括:數(shù)據(jù)變化單元3021,用于對初始數(shù)據(jù)庫的數(shù)據(jù)源數(shù)據(jù)進行數(shù)據(jù)預處理并按照電能計量異常類型的判據(jù)進行數(shù)據(jù)變換,形成初始計量異常指標集,數(shù)據(jù)預處理包括糾正或刪除異常數(shù)據(jù)、插補缺失數(shù)據(jù)。分組模塊303,用于對初始計量異常指標集進行指標特征分組,形成多個指標組別;分組模塊303包括:匹配單元3031,用于對初始計量異常指標集中的每種電能計量異常類型和每種電能計量異常類型對應(yīng)的指標進行匹配整理;分組單元3032,用于根據(jù)指標與電能計量異常類型之間的特征關(guān)系進行指標特征分組,形成多個指標組別。訓練模塊304,用于對指標組別進行多分類器訓練,得到若干個不同的分類模型;訓練模塊304包括:訓練單元3041,用于根據(jù)不同的電能計量異常類型,對每個指標組別的指標集選擇多個分類器進行訓練,得到若干個不同的訓練好的分類器模型,訓練好的分類器模型可固定識別對應(yīng)的電能計量異常類型。融合模塊305,用于將若干個不同的分類模型進行融合,得到電能計量異常識別結(jié)果;融合模塊305包括:匯總單元3051,用于將訓練好的分類模型對應(yīng)識別的電能計量異常類型進行匯總,實現(xiàn)對所有電能計量異常類型的判別。所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng),裝置和單元的具體工作過程,可以參考前述方法實施例中的對應(yīng)過程,在此不再贅述。在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的系統(tǒng),裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機械或其它的形式。所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。所述集成的單元如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(ROM,Read-OnlyMemory)、隨機存取存儲器(RAM,RandomAccessMemory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。以上所述,以上實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實施例對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當理解:其依然可以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的精神和范圍。當前第1頁1 2 3