本發(fā)明涉及油浸式變壓器故障指標(biāo)篩選領(lǐng)域,具體地說是一種基于頻率統(tǒng)計和非參數(shù)檢驗的油浸式變壓器故障相關(guān)指標(biāo)篩選方法。
背景技術(shù):
油浸式變壓器油內(nèi)溶解特征氣體含量的各種指標(biāo)與油浸式變壓器的故障息息相關(guān)。這些指標(biāo)可以大致分為四類,分別是單種特征氣體濃度,單種特征氣體增長率、兩種特征氣體比值和多種特征氣體的相對濃度。然而目前油浸式變壓器行業(yè)內(nèi),正在使用的各種判斷變壓器故障的方法中,利用的都是幾種固定類型的特征氣體比值或相對濃度。我國的變壓器故障診斷方法主要依靠國家能源局2014年發(fā)布的《中華人民共和國電力行業(yè)標(biāo)準(zhǔn)--變壓器油中溶解氣體分析與判斷導(dǎo)則》(dl/t722-2014)中所提及的特征氣體含量三比值法。使用的是c2h2/c2h4、ch4/h2和c2h4/c2h6三組特征氣體濃度比值。國際上存在一些類似與特征氣體三比值的方法,比如duval法、rogers法和doernenburg法。duval法使用的是ch4、c2h4和c2h2的相對濃度;rogers法使用了c2h2/c2h4、ch4/h2和c2h4/c2h6三種比值。doernenburg使用了ch4/h2、c2h2/c2h4、c2h2/ch4和c2h6/c2h2四種比值。因而上述方法并不能全面的對變壓器運行過程中產(chǎn)生的運行狀態(tài)信息進(jìn)行利用,更不能針對不同的故障類型進(jìn)行特定的指標(biāo)選取。
目前現(xiàn)有的指標(biāo)選取方法中,主要分為兩類。一類是利用指標(biāo)之間的某種相關(guān)性,從而去掉反映信息重復(fù)的一部分指標(biāo);另一類是利用指標(biāo)自己的取值上產(chǎn)生的變異性,從而去掉那些區(qū)分度不明顯或者對評價的結(jié)果影響相對較弱的指標(biāo)。使用較多的是第一類方法,比如運用person相關(guān)系數(shù)或偏相關(guān)系數(shù)來去除指標(biāo)中反映信息有重疊的指標(biāo);使用互信息剔除的方法來去除反應(yīng)信息有重疊的指標(biāo);運用聚類分析的方法間接的來剔除指標(biāo)間有重疊信息的指標(biāo)等。
但上述的方法均有明顯的不足之處,person相關(guān)系數(shù)法只能分析各指標(biāo)間的線性相關(guān)性,因而不能過濾掉非線性相關(guān)的指標(biāo);基于互信息剔除法和基于聚類分析的方法在指標(biāo)篩選時,只是在一個數(shù)據(jù)類型(比如故障變壓器數(shù)據(jù))中剔除具有重復(fù)信息的指標(biāo),而不能在兩個不同的數(shù)據(jù)類型(比如故障變壓器數(shù)據(jù)和正常變壓器數(shù)據(jù))中剔除掉與故障不相關(guān)的指標(biāo)。因此在實際的操作過程中,油浸式變壓器行業(yè)迫切的需要一種新的故障指標(biāo)選取方法。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是克服上述現(xiàn)有技術(shù)存在的缺陷,提供一種基于頻率統(tǒng)計和非參數(shù)檢驗的油浸式變壓器故障相關(guān)指標(biāo)篩選方法,其經(jīng)過對故障變壓器指標(biāo)和非故障變壓器指標(biāo)概率密度函數(shù)是否相同的非參數(shù)檢驗,通過拒絕原假設(shè)置信度的大小來衡量各種指標(biāo)與故障的相關(guān)程度。
為此,本發(fā)明采用如下的技術(shù)方案:一種油浸式變壓器故障相關(guān)指標(biāo)篩選方法,其特征在于,通過非參數(shù)的秩和檢驗全面考慮各種與油浸式變壓器故障相關(guān)的特征氣體指標(biāo),包括:
步驟1),頻率統(tǒng)計
11)選取故障變壓器和正常變壓器的帶電檢測數(shù)據(jù)作為樣本總體數(shù)據(jù),記故障變壓器故障帶電檢測數(shù)據(jù)為第一部分?jǐn)?shù)據(jù),正常變壓器故障帶電檢測數(shù)據(jù)為第二部分?jǐn)?shù)據(jù);
12)選取單種氣體濃度、單種氣體濃度的月標(biāo)準(zhǔn)增長率、兩種氣體比值和多種氣體相對濃度指標(biāo);
13)以橫軸為統(tǒng)計指標(biāo)的值,以縱軸為統(tǒng)計指標(biāo)在某值域內(nèi)出現(xiàn)的次數(shù),將每種指標(biāo)的取值范圍等分為100份,然后用直方圖進(jìn)行頻率統(tǒng)計,得頻率分布直方圖;
14)將頻率分布直方圖的走勢近似的視為變壓器該指標(biāo)的概率密度分布函數(shù)的走勢;
步驟2),非參數(shù)檢驗
對兩部分?jǐn)?shù)據(jù)每個指標(biāo)的概率密度分布函數(shù)是否相同進(jìn)行非參數(shù)的秩和檢驗(即曼-惠特尼-威爾克克森檢驗,mann-whitney-wilcoxontest,簡稱mww),檢驗的兩個對立假設(shè)是:
h0:兩部分?jǐn)?shù)據(jù)的概率密度分布函數(shù)是相同的;
h1:兩部分?jǐn)?shù)據(jù)的概率密度分布函數(shù)是不同的。
本發(fā)明基于頻率統(tǒng)計和非參數(shù)檢驗,可以廣泛地利用現(xiàn)有比值方法未利用的特征氣體指標(biāo),在故障變壓器和正常變壓器兩種數(shù)據(jù)的指標(biāo)中,篩選出與故障相關(guān)的指標(biāo)。
進(jìn)一步地,所述的單種氣體濃度為特征氣體在油浸式變壓器絕緣油內(nèi)的溶解含量濃度。
進(jìn)一步地,帶電檢測數(shù)據(jù)的第k個點的單種氣體濃度的月標(biāo)準(zhǔn)增長率λk為:
其中,
進(jìn)一步地,所述的兩種氣體比值為兩種特征氣體在油浸式變壓器絕緣油內(nèi)的溶解含量濃度的比。
進(jìn)一步地,所述的氣體相對濃度為某種特征氣體在油浸式變壓器絕緣油內(nèi)的溶解含量濃度占多種特征氣體(大于等于3種且包含前面的特征氣體)在油浸式變壓器絕緣油內(nèi)的溶解含量濃度和的比例;
其中,θk為特征氣體k的相對濃度,pk為特征氣體k在油浸式變壓器絕緣油內(nèi)的溶解含量濃度。
進(jìn)一步地,所述非參數(shù)的秩和的檢驗步驟如下:
21)對于某一指標(biāo),將該指標(biāo)的兩部分?jǐn)?shù)據(jù)合并成一個整體,該指標(biāo)每臺變壓器每個時間點上的帶電檢測數(shù)據(jù)為一條數(shù)據(jù),假設(shè)第一部分?jǐn)?shù)據(jù)有n1條,第二部分?jǐn)?shù)據(jù)有n2條,然后從小到大排序,從最小到最大依次標(biāo)號為1,2,…n1+n2,這個標(biāo)號稱為秩,如果多個數(shù)相等,那么這多個相等數(shù)的秩定義為其原秩和的均值;
22)分別求出待檢驗的兩部分?jǐn)?shù)據(jù)的秩的和,假如兩部分?jǐn)?shù)據(jù)概率密度函數(shù)相同,可以得到所求出的秩和的概率密度分布;
23)根據(jù)樣本計算出的秩和得出雙側(cè)檢驗的p值,得到拒絕h0的置信度;
24)選取故障相關(guān)指標(biāo)。
更進(jìn)一步地,步驟22)中,當(dāng)樣本數(shù)據(jù)量較大時,即滿足n1≥7,n2≥7時,在兩部分?jǐn)?shù)據(jù)的概率密度函數(shù)相同的前提下,要求得樣本秩和的概率密度分布函數(shù)較為復(fù)雜,這時可以用均值為n1(n1+n2+1)/2、標(biāo)準(zhǔn)差為
更進(jìn)一步地,步驟23)中,拒絕原假設(shè)的置信度越高表明兩部分?jǐn)?shù)據(jù)越不相同,用兩部分?jǐn)?shù)據(jù)檢驗所得拒絕原假設(shè)的置信度的大小來衡量指標(biāo)與故障的相關(guān)性,拒絕原假設(shè)的置信度越大證明該指標(biāo)與故障越相關(guān);因拒絕原假設(shè)的置信度均比較高,用樣本秩和偏離秩和正態(tài)分布的均值標(biāo)準(zhǔn)差的倍數(shù)來表示指標(biāo)與故障的相關(guān)性。
更進(jìn)一步地,步驟24)中,依據(jù)每個指標(biāo)拒絕原假設(shè)的置信度從大到小選取前若干個指標(biāo)作為故障相關(guān)指標(biāo)。
更進(jìn)一步地,步驟24)中,提前設(shè)定一個置信度,當(dāng)拒絕原假設(shè)的置信度大于設(shè)定置信度時,選取其為故障相關(guān)指標(biāo)。
相對于現(xiàn)有的方法,本發(fā)明具有以下優(yōu)點:
本發(fā)明基于故障和正常變壓器兩部分?jǐn)?shù)據(jù)多種指標(biāo)的頻率分布統(tǒng)計,對故障和正常變壓器兩部分?jǐn)?shù)據(jù)是否具有相同的概率密度分布進(jìn)行了非參數(shù)的mww檢驗,因而本發(fā)明可以針對不同的變壓器故障,從更廣闊的指標(biāo)中選取故障相關(guān)指標(biāo),而不是油浸式變壓器行業(yè)內(nèi)現(xiàn)在使用的幾種固定指標(biāo);并且相對于其他指標(biāo)選取方法,本發(fā)明的方法簡單實用,易于操作。
具體實施方式
下面結(jié)合具體實施方式對本發(fā)明作進(jìn)一步說明。
實施例1
1.頻率統(tǒng)計
1.1選取故障變壓器和正常變壓器兩部分帶電檢測數(shù)據(jù)作為樣本總體,第一部分的數(shù)據(jù)取自浙江電網(wǎng)的中高溫過熱故障變壓器的帶電檢測數(shù)據(jù),共14臺899條數(shù)據(jù);第二部分的數(shù)據(jù)取自浙江電網(wǎng)的正常變壓器帶電檢測數(shù)據(jù),選取了24臺共531條數(shù)據(jù)。
1.2選取單種氣體濃度、單種氣體濃度的月標(biāo)準(zhǔn)增長率、兩種氣體比值和多種氣體相對濃度共62個指標(biāo)。分別為:
單種氣體濃度:h2濃度,ch4濃度,c2h6濃度,c2h4濃度,c2h2濃度,co濃度,co2濃度,總烴濃度。
單種氣體濃度的月標(biāo)準(zhǔn)增長率:h2月標(biāo)準(zhǔn)增長率,ch4月標(biāo)準(zhǔn)增長率,c2h6月標(biāo)準(zhǔn)增長率,c2h4月標(biāo)準(zhǔn)增長率,c2h2月標(biāo)準(zhǔn)增長率,co月標(biāo)準(zhǔn)增長率,co2月標(biāo)準(zhǔn)增長率,總烴月標(biāo)準(zhǔn)增長率。
式中,ρtk為第k個測量點的氣體濃度,ρ0為氣體的濃度限值,tk為第k個測量點的時間。
兩種氣體比值:
c2h2/c2h4,ch4/h2,c2h4/c2h6,c2h2/ch4,c2h2/c2h6,ch4/c2h4,ch4/c2h6,c2h2/h2,c2h4/h2,c2h6/h2,co/co2。
多種氣體相對濃度:
ch4/(ch4+c2h2+c2h4),c2h4/(ch4+c2h2+c2h4),c2h2/(ch4+c2h2+c2h4);
c2h6/(c2h6+c2h4+c2h2),c2h4/(c2h6+c2h4+c2h2),c2h2/(c2h6+c2h4+c2h2);
ch4/(ch4+c2h6+c2h2),c2h6/(ch4+c2h6+c2h2),c2h2/(ch4+c2h6+c2h2);
ch4/(ch4+c2h6+c2h4),c2h6/(ch4+c2h6+c2h4),c2h4/(ch4+c2h6+c2h4);
h2/(h2+ch4+c2h6),ch4/(h2+ch4+c2h6),c2h6/(h2+ch4+c2h6);
h2/(h2+c2h6+c2h4),c2h6/(h2+c2h6+c2h4),c2h4/(h2+c2h6+c2h4);
h2/(h2+ch4+c2h4),ch4/(h2+ch4+c2h4),c2h4/(h2+ch4+c2h4);
h2/(h2+ch4+c2h2),ch4/(h2+ch4+c2h2),c2h2/(h2+ch4+c2h2);
h2/(h2+c2h6+c2h2),c2h6/(h2+c2h6+c2h2),c2h2/(h2+c2h6+c2h2);
h2/(h2+c2h4+c2h2),c2h4/(h2+c2h4+c2h2),c2h2/(h2+c2h4+c2h2);
h2/(h2+ch4+c2h6+c2h4+c2h2),ch4/(h2+ch4+c2h6+c2h4+c2h2),
c2h6/(h2+ch4+c2h6+c2h4+c2h2),c2h4/(h2+ch4+c2h6+c2h4+c2h2),
c2h2/(h2+ch4+c2h6+c2h4+c2h2)。
1.3以橫軸為統(tǒng)計指標(biāo)的值,以縱軸為統(tǒng)計指標(biāo)在某值域內(nèi)出現(xiàn)的次數(shù),將指標(biāo)分布的范圍等分為100份,然后用直方圖進(jìn)行了頻率統(tǒng)計。
1.4將頻率分布直方圖的走勢近似的視為該指標(biāo)變壓器的概率密度分布走勢。
2.非參數(shù)檢驗
2.1對兩部分?jǐn)?shù)據(jù)的頻率分布進(jìn)行了非參數(shù)的mann-whitney-wilcoxon(mww)檢驗檢。首先是對兩部分?jǐn)?shù)據(jù)合并成一個整體,第一部分?jǐn)?shù)據(jù)有899個,第二部分?jǐn)?shù)據(jù)有531個,然后從小到大排序,從最小到最大依次標(biāo)號為1,2,…n1+n2,這個標(biāo)號稱為秩。如果多個數(shù)相等,那么這多個相等的數(shù)的秩定義為其原秩和的均值。
2.2然后分別求出待檢驗的兩部分?jǐn)?shù)據(jù)的秩的和,假如兩部分?jǐn)?shù)據(jù)概率密度函數(shù)相同,那么可以得到所求出的秩的和的概率密度分布,從而可以用求出的秩和得到否定h0的置信度。因為樣本數(shù)據(jù)量較大(899≥7,531≥7),用均值為899(899+531+1)/2,標(biāo)準(zhǔn)差為
2.3最后根據(jù)樣本計算出的秩和可以得出雙側(cè)檢驗的p值(用以衡量置信度)。拒絕原假設(shè)的置信度越高表明兩部分?jǐn)?shù)據(jù)越不相同。因此本發(fā)明用兩部分?jǐn)?shù)據(jù)檢驗所得拒絕原假設(shè)的置信度的大小來衡量指標(biāo)與故障的相關(guān)性,拒絕原假設(shè)的置信度越大證明該指標(biāo)與故障越相關(guān)。因為拒絕原假設(shè)的置信度均比較高,所以本發(fā)明用秩和偏離均值的標(biāo)準(zhǔn)差的倍數(shù)來表示,結(jié)果如表1所示:
表162種指標(biāo)的非參數(shù)檢驗結(jié)果
2.4選取故障相關(guān)指標(biāo)
此處有兩種方法選取,第一種是依據(jù)每個指標(biāo)拒絕原假設(shè)的置信度從大到小選取前若干個指標(biāo)作為故障相關(guān)指標(biāo);第二種是提前設(shè)定一個置信度,當(dāng)拒絕原假設(shè)的置信度大于設(shè)定置信度時,選取其為故障相關(guān)指標(biāo)。
本實施例選用第一種方法,選取前15個指標(biāo)。結(jié)果如表2所示。
表2與故障相關(guān)度高的前15個指標(biāo)
以上所述,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護(hù)范圍并不局限于此,熟悉該領(lǐng)域的技術(shù)人員應(yīng)該明白本發(fā)明包括但不限于上面具體實施方式中描述的內(nèi)容。任何不偏離本發(fā)明原理的修改都將包括在權(quán)利要求的范圍中。