本發(fā)明屬于采集終端故障定位技術(shù)領(lǐng)域,尤其是一種基于聚類(lèi)分析的計(jì)量采集終端故障診斷和可視化定位方法。
背景技術(shù):
隨著智能電網(wǎng)技術(shù)在國(guó)內(nèi)的快速發(fā)展與應(yīng)用,計(jì)量采集終端的使用規(guī)模不斷擴(kuò)大,其發(fā)生故障的數(shù)量和概率越來(lái)越高。目前,天津地區(qū)有專(zhuān)變采集終端6萬(wàn),低壓集中器3.9萬(wàn),每天產(chǎn)生將近2億余條數(shù)據(jù)。采用有效的手段清洗、過(guò)濾無(wú)效、無(wú)序的數(shù)據(jù),并對(duì)海量數(shù)據(jù)進(jìn)行分析歸類(lèi),及時(shí)篩選和定位終端故障信息點(diǎn),對(duì)輔助采集運(yùn)行維護(hù)人員在其管理區(qū)域內(nèi)有針對(duì)性地開(kāi)展現(xiàn)場(chǎng)終端運(yùn)維工作具有重要意義。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足之處,提供一種基于聚類(lèi)分析的計(jì)量采集終端故障診斷和可視化定位方法,提高計(jì)量自動(dòng)化終端故障定位準(zhǔn)確率,
本發(fā)明解決其技術(shù)問(wèn)題是采取以下技術(shù)方案實(shí)現(xiàn)的:
一種基于聚類(lèi)分析的計(jì)量采集終端故障診斷和可視化定位方法,其特征在于:順序執(zhí)行以下步驟:
步驟⑴:獲取相關(guān)數(shù)據(jù),構(gòu)建采集終端特性指標(biāo)樣本矩陣b,對(duì)轄區(qū)內(nèi)所有大客戶(hù)專(zhuān)變計(jì)量點(diǎn)的采集終端進(jìn)行實(shí)時(shí)動(dòng)態(tài)數(shù)據(jù)采集、過(guò)濾和檢測(cè),將用戶(hù)信息及用電性質(zhì)、設(shè)備廠(chǎng)家及編號(hào)、設(shè)備所在地址及地理坐標(biāo)、報(bào)裝時(shí)間等基礎(chǔ)檔案和歷史采集數(shù)據(jù)分別錄入數(shù)據(jù)庫(kù);
步驟⑵:對(duì)采集終端特性矩陣b和b0進(jìn)行歸一化預(yù)處理;
步驟⑶:采用馬氏距離法對(duì)數(shù)據(jù)集中的各元素進(jìn)行相似度分析;
步驟⑷:通過(guò)聚類(lèi)分析得到采集終端故障診斷分類(lèi)結(jié)果;
步驟⑸:根據(jù)分類(lèi)結(jié)果,將相似程度接近0的樣本逐類(lèi)對(duì)比數(shù)據(jù)庫(kù)中的用戶(hù)基礎(chǔ)檔案和歷史采集數(shù)據(jù),篩選出終端故障信息點(diǎn);
步驟⑹:根據(jù)采集終端故障信息點(diǎn)的地理坐標(biāo),運(yùn)用地理空間信息數(shù)據(jù)進(jìn)行故障定位,在gis地圖上實(shí)現(xiàn)終端故障信息點(diǎn)跟蹤和可視化展示。
而且,所述步驟⑴中,采集終端特性指標(biāo)樣本矩陣b={b1,b2…bn}(i=1,2,…,n),假定每個(gè)樣本bi都具有m個(gè)特性指標(biāo)分類(lèi),可表示為bi=(bi1,bi2…bij,bim)(j=1,2,…,m),同時(shí),定義采集終端的標(biāo)準(zhǔn)特性指標(biāo)矩陣為b0=(b01,b02…b0j,b0m),其中b0j為采集終端數(shù)據(jù)第j個(gè)特征值的標(biāo)準(zhǔn)參考值。
而且,所述步驟⑵中的歸一化預(yù)處理是使每個(gè)特性指標(biāo)值都分布在[0,1]區(qū)間上,具體公式為:
式中:bi′j為bij歸一化后的值,bimax和bimin分別是bi的最大、最小值。
而且,所述步驟⑶中,相似度分析規(guī)則為:特性值與標(biāo)準(zhǔn)特性指標(biāo)越越相似的樣本,相似系數(shù)絕對(duì)值就越接近1,而關(guān)系疏遠(yuǎn)的樣本的相似系數(shù)就越接近0;
相似系數(shù)相同的樣本歸為一類(lèi),先計(jì)算出各個(gè)分類(lèi)樣本與標(biāo)準(zhǔn)值之間的相似性統(tǒng)計(jì)量d(b0,bj),從而確定特性指標(biāo)矩陣b中各樣本與標(biāo)準(zhǔn)值b0之間模糊等價(jià)關(guān)系矩陣d;
采用樣本向量bj與標(biāo)準(zhǔn)參考向量b0的馬氏距離為:
d(b0,bj)=(b0-bj)t∑-1(b0-bj)
經(jīng)過(guò)馬氏距離函數(shù)計(jì)算得到矩陣b的模糊等價(jià)關(guān)系矩陣d為:
而且,所述步驟⑷中的聚類(lèi)分析是動(dòng)態(tài)調(diào)整找到選擇適當(dāng)?shù)拈y值λ對(duì)模糊等價(jià)關(guān)系矩陣d進(jìn)行截割,從而得到所有樣本的分類(lèi),閥值λ值調(diào)整公式為:
式中:i≥2,表示λ從1到0降低排列的聚類(lèi)次數(shù);λi-1和ni-1分別表示第i-1次聚類(lèi)的元素個(gè)數(shù)和閥值;λi和ni分別表示第i次聚類(lèi)的元素個(gè)數(shù)和閥值;若存在
本發(fā)明的優(yōu)點(diǎn)和積極效果是:
1、本發(fā)明方法對(duì)計(jì)量終端的采集數(shù)據(jù)和歷史檔案信息采用聚類(lèi)分析歸類(lèi),有效篩選出終端故障信息點(diǎn)。根據(jù)采集終端故障信息點(diǎn)的地理坐標(biāo),運(yùn)用地理空間信息數(shù)據(jù)進(jìn)行故障定位和可視化展示,從而實(shí)現(xiàn)對(duì)采集終端的實(shí)時(shí)數(shù)據(jù)監(jiān)測(cè)、故障診斷和可視化定位。
2、本發(fā)明為采集終端故障運(yùn)維提供一種技術(shù)手段,能大量節(jié)約采集設(shè)備運(yùn)維成本,且診斷故障種類(lèi)的準(zhǔn)確率明顯高于人工經(jīng)驗(yàn)和傳統(tǒng)的統(tǒng)計(jì)分析法。采集系統(tǒng)運(yùn)行維護(hù)人員通過(guò)直觀(guān)、可視的方式,發(fā)現(xiàn)所管轄區(qū)域內(nèi)的終端運(yùn)行的狀態(tài)。
附圖說(shuō)明
圖1為本方法流程圖。
具體實(shí)施方式
下面結(jié)合附圖并通過(guò)具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳述,以下實(shí)施例只是描述性的,不是限定性的,不能以此限定本發(fā)明的保護(hù)范圍。
一種基于聚類(lèi)分析的計(jì)量采集終端故障診斷和可視化定位方法,順序執(zhí)行以下步驟:
步驟1:獲取相關(guān)數(shù)據(jù),構(gòu)建采集終端特性指標(biāo)樣本矩陣b,對(duì)轄區(qū)內(nèi)所有大客戶(hù)專(zhuān)變計(jì)量點(diǎn)的采集終端進(jìn)行實(shí)時(shí)動(dòng)態(tài)數(shù)據(jù)采集、過(guò)濾和檢測(cè),將用戶(hù)信息及用電性質(zhì)、設(shè)備廠(chǎng)家及編號(hào)、設(shè)備所在地址及地理坐標(biāo)、報(bào)裝時(shí)間等基礎(chǔ)檔案和歷史采集數(shù)據(jù)分別錄入數(shù)據(jù)庫(kù);
其中,采集終端特性指標(biāo)樣本矩陣b={b1,b2…bn}(i=1,2,…,n),假定每個(gè)樣本bi都具有m個(gè)特性指標(biāo)分類(lèi),可表示為bi=(bi1,bi2…bij,bim)(j=1,2,…,m)。同時(shí)定義采集終端的標(biāo)準(zhǔn)特性指標(biāo)矩陣為b0=(b01,b02…b0j,b0m),其中b0j為采集終端數(shù)據(jù)第j個(gè)特征值的標(biāo)準(zhǔn)參考值;
步驟2:對(duì)采集終端特性矩陣b和b0進(jìn)行歸一化預(yù)處理;
所述的歸一化預(yù)處理是使每個(gè)特性指標(biāo)值都分布在[0,1]區(qū)間上,方便各特性指標(biāo)數(shù)值在同一維度上進(jìn)行比較分析,具體公式為:
式中:bi′j為bij歸一化后的值,bimax和bimin分別是bi的最大、最小值。
步驟3:,采用馬氏距離法對(duì)數(shù)據(jù)集中的各元素進(jìn)行相似度分析;
所述的相似度分析規(guī)則為:特性值與標(biāo)準(zhǔn)特性指標(biāo)越越相似的樣本,相似系數(shù)絕對(duì)值就越接近1,而關(guān)系疏遠(yuǎn)的樣本的相似系數(shù)就越接近0。比較相似的樣本可以歸為一類(lèi)。先計(jì)算出各個(gè)分類(lèi)樣本與標(biāo)準(zhǔn)值之間的相似性統(tǒng)計(jì)量d(b0,bj),從而確定特性指標(biāo)矩陣b中各樣本與標(biāo)準(zhǔn)值b0之間模糊等價(jià)關(guān)系矩陣d。
采用樣本向量bj與標(biāo)準(zhǔn)參考向量b0的馬氏距離為:
d(b0,bj)=(b0-bj)t∑-1(b0-bj)
經(jīng)過(guò)馬氏距離函數(shù)計(jì)算得到矩陣b的模糊等價(jià)關(guān)系矩陣d為:
步驟4:通過(guò)聚類(lèi)分析得到采集終端故障診斷分類(lèi)結(jié)果;
其中,聚類(lèi)分析是動(dòng)態(tài)調(diào)整找到選擇適當(dāng)?shù)拈y值λ對(duì)模糊等價(jià)關(guān)系矩陣d進(jìn)行截割,從而得到所有樣本的分類(lèi)。閥值λ值調(diào)整公式為:
式中:i≥2,表示λ從1到0降低排列的聚類(lèi)次數(shù);λi-1和ni-1分別表示第i-1次聚類(lèi)的元素個(gè)數(shù)和閥值;λi和ni分別表示第i次聚類(lèi)的元素個(gè)數(shù)和閥值;若存在
步驟5:根據(jù)分類(lèi)結(jié)果,將相似程度接近0的樣本逐類(lèi)對(duì)比數(shù)據(jù)庫(kù)中的用戶(hù)基礎(chǔ)檔案和歷史采集數(shù)據(jù),篩選出終端故障信息點(diǎn);
步驟6:根據(jù)采集終端故障信息點(diǎn)的地理坐標(biāo),運(yùn)用地理空間信息數(shù)據(jù)進(jìn)行故障定位,在gis地圖上實(shí)現(xiàn)終端故障信息點(diǎn)跟蹤和可視化展示。
本方法在廣泛抽取過(guò)濾用電信息采集系統(tǒng)數(shù)據(jù)基礎(chǔ)上,對(duì)計(jì)量終端的采集數(shù)據(jù)和歷史檔案信息采用聚類(lèi)分析歸類(lèi),形成采集終端故障診斷分類(lèi)結(jié)果,篩選出終端故障信息點(diǎn),根據(jù)采集終端故障信息點(diǎn)的地理坐標(biāo),運(yùn)用地理空間信息數(shù)據(jù)進(jìn)行故障定位,在gis地圖上實(shí)現(xiàn)終端故障信息點(diǎn)跟蹤和可視化展示,從而實(shí)現(xiàn)對(duì)采集終端的實(shí)時(shí)數(shù)據(jù)監(jiān)測(cè)、故障診斷和可視化定位,有效提高計(jì)量自動(dòng)化終端故障定位的準(zhǔn)確率。
盡管為說(shuō)明目的公開(kāi)了本發(fā)明的實(shí)施例和附圖,但是本領(lǐng)域的技術(shù)人員可以理解:在不脫離本發(fā)明及所附權(quán)利要求的精神和范圍內(nèi),各種替換、變化和修改都是可能的,因此,本發(fā)明的范圍不局限于實(shí)施例和附圖所公開(kāi)的內(nèi)容。