本發(fā)明涉及特征處理,尤其涉及一種用于變壓器狀態(tài)評估的多源融合特征生成方法和裝置。
背景技術(shù):
1、在當(dāng)今的電力系統(tǒng)中,變壓器作為關(guān)鍵設(shè)備,其運行狀態(tài)對電力系統(tǒng)的正常運行影響起到至關(guān)重要的影響。然而,現(xiàn)有的變壓器評估體系存在著一些明顯的不足之處。
2、現(xiàn)有對變壓器狀態(tài)評估體系特征參量輸入,一般只考慮采取電氣試驗數(shù)據(jù)和油色譜數(shù)據(jù)。同時在數(shù)據(jù)預(yù)處理階段對于缺失數(shù)據(jù),一般只采用一種數(shù)據(jù)填充方式,對于數(shù)據(jù)降維,一般采用粗糙集,深度置信網(wǎng)絡(luò)進行數(shù)據(jù)稀疏降維。對于數(shù)據(jù)清洗,采用的是自編碼器進行清洗。
3、上述單一數(shù)據(jù)源選擇具有很大的局限性,無法全面地反映變壓器在整體運行工況下的實際狀態(tài),只考慮單一填充方法無法從整個數(shù)據(jù)層面的角度進行填充,可能導(dǎo)致訓(xùn)練過擬合,現(xiàn)有降維方法沒有考慮時序歷史數(shù)據(jù)的影響,采用自編碼器的數(shù)據(jù)清洗對于計算資源要求較高,難以及時對變壓器數(shù)據(jù)進行有效的數(shù)據(jù)預(yù)處理,容易導(dǎo)致變壓器評估的準(zhǔn)確性和可靠性降低。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供了一種用于變壓器狀態(tài)評估的多源融合特征生成方法和裝置,解決了在現(xiàn)有的變壓器狀態(tài)評估過程中,單一數(shù)據(jù)源選擇具有很大的局限性,無法全面地反映變壓器在整體運行工況下的實際狀態(tài),只考慮單一填充方法無法從整個數(shù)據(jù)層面的角度進行填充,可能導(dǎo)致訓(xùn)練過擬合,現(xiàn)有降維方法沒有考慮時序歷史數(shù)據(jù)的影響,采用自編碼器的數(shù)據(jù)清洗對于計算資源要求較高,難以及時對變壓器數(shù)據(jù)進行有效的數(shù)據(jù)預(yù)處理,容易導(dǎo)致變壓器評估的準(zhǔn)確性和可靠性降低的技術(shù)問題。
2、本發(fā)明提供的一種用于變壓器狀態(tài)評估的多源融合特征生成方法,包括:
3、按照預(yù)設(shè)的獲取周期,從變壓器關(guān)聯(lián)的多種數(shù)據(jù)采集組件分別獲取狀態(tài)數(shù)據(jù);
4、基于構(gòu)建的雙稀疏字典模型對各所述狀態(tài)數(shù)據(jù)進行降維,得到降維數(shù)據(jù);
5、按照多種填充方式對所述降維數(shù)據(jù)進行加權(quán)填充,得到填充數(shù)據(jù);
6、根據(jù)所述填充數(shù)據(jù)與所述狀態(tài)數(shù)據(jù)之間的重構(gòu)誤差情況,對所述填充數(shù)據(jù)進行數(shù)據(jù)清洗,生成多源融合特征。
7、可選地,所述按照預(yù)設(shè)的獲取周期,從變壓器關(guān)聯(lián)的多種數(shù)據(jù)采集組件分別獲取狀態(tài)數(shù)據(jù),包括:
8、調(diào)用變壓器關(guān)聯(lián)的多種數(shù)據(jù)采集組件實時采集特征數(shù)據(jù);其中,所述特征數(shù)據(jù)包括聲音信號、光信號、超聲波信號和振動信號;
9、當(dāng)采集時間滿足預(yù)設(shè)的獲取周期時,從各所述數(shù)據(jù)采集組件分別獲取所述聲音信號、所述光信號、所述超聲波信號和所述振動信號;
10、按照采集時間對所述聲音信號、所述光信號、所述超聲波信號和所述振動信號進行排序,分別構(gòu)建序列形式的狀態(tài)數(shù)據(jù)。
11、可選地,所述基于構(gòu)建的雙稀疏字典模型對各所述狀態(tài)數(shù)據(jù)進行降維,得到降維數(shù)據(jù),包括:
12、以固定字典模型為基礎(chǔ)層疊加學(xué)習(xí)型字典模型,構(gòu)建雙稀疏字典模型;
13、將各所述狀態(tài)數(shù)據(jù)投影至所述雙稀疏字典模型;
14、采用正交匹配追蹤算法求解各所述狀態(tài)數(shù)據(jù)在所述雙稀疏字典模型下的稀疏表示,得到降維數(shù)據(jù);
15、所述雙稀疏字典模型為:
16、
17、其中,是系數(shù)矩陣中第個字典元素對應(yīng)的系數(shù)列矢量,是狀態(tài)數(shù)據(jù)在學(xué)習(xí)型字典模型下的稀疏表示系數(shù)矩陣,是學(xué)習(xí)型字典模型經(jīng)稀疏表示后的系數(shù)矩陣,是每一個字典元素均預(yù)定義的固定字典模型,是狀態(tài)數(shù)據(jù)中的第i個樣本,是稀疏系數(shù)向量,是狀態(tài)數(shù)據(jù)的稀疏表示,即降維數(shù)據(jù),表示稀疏系數(shù)向量中非零元素的個數(shù)。
18、可選地,所述按照多種填充方式對所述降維數(shù)據(jù)進行加權(quán)填充,得到填充數(shù)據(jù),包括:
19、按照多種填充方式分別計算所述降維數(shù)據(jù)對應(yīng)的模擬填充值;
20、分別采用各所述模擬填充值與所述降維數(shù)據(jù)中的已知值,計算各種所述填充方式對應(yīng)的誤差系數(shù);
21、按照各所述誤差系數(shù)設(shè)置各種所述填充方式的填充權(quán)重;
22、按照所述填充權(quán)重對各所述填充方式的填充值進行加權(quán)平均,得到實際填充值;
23、按照所述實際填充值對所述降維數(shù)據(jù)的缺失值進行填充,得到填充數(shù)據(jù)。
24、可選地,所述根據(jù)所述填充數(shù)據(jù)與所述狀態(tài)數(shù)據(jù)之間的重構(gòu)誤差情況,對所述填充數(shù)據(jù)進行數(shù)據(jù)清洗,生成多源融合特征,包括:
25、計算所述填充數(shù)據(jù)與所述狀態(tài)數(shù)據(jù)在所述獲取周期內(nèi)的損失誤差;
26、若所述損失誤差均未超過預(yù)設(shè)損失閾值,則將所述填充數(shù)據(jù)確定為無損特征;
27、若所述損失誤差超過預(yù)設(shè)損失閾值,則統(tǒng)計誤差時長;
28、若所述誤差時長未超過預(yù)設(shè)時長閾值,則將所述填充數(shù)據(jù)確定為波動特征;
29、若所述誤差時長超過預(yù)設(shè)時長閾值,則調(diào)用預(yù)設(shè)的堆疊去噪自編碼器模型對所述填充數(shù)據(jù)進行數(shù)據(jù)重構(gòu),得到重構(gòu)特征;
30、采用所述無損特征、所述波動特征和/或所述重構(gòu)特征,生成多源融合特征。
31、本發(fā)明還提供了一種用于變壓器狀態(tài)評估的多源融合特征生成裝置,包括:
32、狀態(tài)數(shù)據(jù)獲取模塊,用于按照預(yù)設(shè)的獲取周期,從變壓器關(guān)聯(lián)的多種數(shù)據(jù)采集組件分別獲取狀態(tài)數(shù)據(jù);
33、數(shù)據(jù)降維模塊,用于基于構(gòu)建的雙稀疏字典模型對各所述狀態(tài)數(shù)據(jù)進行降維,得到降維數(shù)據(jù);
34、數(shù)據(jù)填充模塊,用于按照多種填充方式對所述降維數(shù)據(jù)進行加權(quán)填充,得到填充數(shù)據(jù);
35、數(shù)據(jù)清洗模塊,用于根據(jù)所述填充數(shù)據(jù)與所述狀態(tài)數(shù)據(jù)之間的重構(gòu)誤差情況,對所述填充數(shù)據(jù)進行數(shù)據(jù)清洗,生成多源融合特征。
36、可選地,所述狀態(tài)數(shù)據(jù)獲取模塊具體用于:
37、調(diào)用變壓器關(guān)聯(lián)的多種數(shù)據(jù)采集組件實時采集特征數(shù)據(jù);其中,所述特征數(shù)據(jù)包括聲音信號、光信號、超聲波信號和振動信號;
38、當(dāng)采集時間滿足預(yù)設(shè)的獲取周期時,從各所述數(shù)據(jù)采集組件分別獲取所述聲音信號、所述光信號、所述超聲波信號和所述振動信號;
39、按照采集時間對所述聲音信號、所述光信號、所述超聲波信號和所述振動信號進行排序,分別構(gòu)建序列形式的狀態(tài)數(shù)據(jù)。
40、可選地,所述數(shù)據(jù)降維模塊具體用于:
41、以固定字典模型為基礎(chǔ)層疊加學(xué)習(xí)型字典模型,構(gòu)建雙稀疏字典模型;
42、將各所述狀態(tài)數(shù)據(jù)投影至所述雙稀疏字典模型;
43、采用正交匹配追蹤算法求解各所述狀態(tài)數(shù)據(jù)在所述雙稀疏字典模型下的稀疏表示,得到降維數(shù)據(jù);
44、所述雙稀疏字典模型為:
45、
46、其中,是系數(shù)矩陣中第個字典元素對應(yīng)的系數(shù)列矢量,是狀態(tài)數(shù)據(jù)在學(xué)習(xí)型字典模型下的稀疏表示系數(shù)矩陣,是學(xué)習(xí)型字典模型經(jīng)稀疏表示后的系數(shù)矩陣,是每一個字典元素均預(yù)定義的固定字典模型,是狀態(tài)數(shù)據(jù)中的第i個樣本,是稀疏系數(shù)向量,是狀態(tài)數(shù)據(jù)的稀疏表示,即降維數(shù)據(jù),表示稀疏系數(shù)向量中非零元素的個數(shù)。
47、可選地,所述數(shù)據(jù)填充模塊具體用于:
48、按照多種填充方式分別計算所述降維數(shù)據(jù)對應(yīng)的模擬填充值;
49、分別采用各所述模擬填充值與所述降維數(shù)據(jù)中的已知值,計算各種所述填充方式對應(yīng)的誤差系數(shù);
50、按照各所述誤差系數(shù)設(shè)置各種所述填充方式的填充權(quán)重;
51、按照所述填充權(quán)重對各所述填充方式的填充值進行加權(quán)平均,得到實際填充值;
52、按照所述實際填充值對所述降維數(shù)據(jù)的缺失值進行填充,得到填充數(shù)據(jù)。
53、可選地,所述數(shù)據(jù)清洗模塊具體用于:
54、計算所述填充數(shù)據(jù)與所述狀態(tài)數(shù)據(jù)在所述獲取周期內(nèi)的損失誤差;
55、若所述損失誤差均未超過預(yù)設(shè)損失閾值,則將所述填充數(shù)據(jù)確定為無損特征;
56、若所述損失誤差超過預(yù)設(shè)損失閾值,則統(tǒng)計誤差時長;
57、若所述誤差時長未超過預(yù)設(shè)時長閾值,則將所述填充數(shù)據(jù)確定為波動特征;
58、若所述誤差時長超過預(yù)設(shè)時長閾值,則調(diào)用預(yù)設(shè)的堆疊去噪自編碼器模型對所述填充數(shù)據(jù)進行數(shù)據(jù)重構(gòu),得到重構(gòu)特征;
59、采用所述無損特征、所述波動特征和/或所述重構(gòu)特征,生成多源融合特征。
60、從以上技術(shù)方案可以看出,本發(fā)明具有以下優(yōu)點:
61、本發(fā)明通過按照預(yù)設(shè)的獲取周期,從變壓器關(guān)聯(lián)的多種數(shù)據(jù)采集組件分別獲取狀態(tài)數(shù)據(jù);基于構(gòu)建的雙稀疏字典模型對各所述狀態(tài)數(shù)據(jù)進行降維,得到降維數(shù)據(jù);按照多種填充方式對所述降維數(shù)據(jù)進行加權(quán)填充,得到填充數(shù)據(jù);根據(jù)所述填充數(shù)據(jù)與所述狀態(tài)數(shù)據(jù)之間的重構(gòu)誤差情況,對所述填充數(shù)據(jù)進行數(shù)據(jù)清洗,生成多源融合特征,從而及時對變壓器數(shù)據(jù)進行有效的數(shù)據(jù)預(yù)處理,有效提高變壓器評估的準(zhǔn)確性和可靠性。