本發(fā)明涉及水電機組故障診斷,具體而言,涉及基于tcn網(wǎng)絡(luò)和深度聚類的半監(jiān)督故障診斷系統(tǒng)。
背景技術(shù):
1、水電站作為一種清潔、可再生的能源生產(chǎn)設(shè)施,其作用日益顯著。水輪機作為水電站的核心設(shè)備,是實現(xiàn)水能向電能轉(zhuǎn)換的重要環(huán)節(jié)。然而,由于設(shè)備的復雜性和運行環(huán)境的不斷變化,水輪機可能面臨各種潛在故障,這些故障不僅可能降低設(shè)備的運行性能,增加運行成本,更有可能引發(fā)嚴重的安全事故。因此,對水輪機的故障進行及時、準確的診斷就顯得尤為重要。現(xiàn)有的基于深度學習的方法表現(xiàn)良好,然而這類方法屬于一種有監(jiān)督的學習方法仍有一些問題值得考慮。為了訓練具有良好泛化能力的深度學習模型,需預(yù)先對機組運行數(shù)據(jù)進行故障標簽或正常標簽標注,這涉及到大量的人力投入和先驗知識,會導致在實際訓練過程中,故障診斷模型常常面臨完整標注訓練數(shù)據(jù)不足的問題,從而使得訓練所得模型在泛化能力和魯棒性方面表現(xiàn)不盡如人意。
2、針對這一問題,現(xiàn)有技術(shù)中將無監(jiān)督的聚類算法應(yīng)用在水電機組振動故障診斷中。無監(jiān)督的聚類算法能夠依據(jù)樣本自身的屬性自動地將屬性相似的樣本聚類,在診斷的學習階段無需事先知道樣本的類別標簽,且可以將新發(fā)生的故障根據(jù)其屬性重新聚類。因此,從診斷方法的實用性角度來看更符合工程實際。
3、因此需要考慮如何利用有限的先驗知識(小樣本)指導聚類的過程,提高故障診斷模型的精度?;谝陨峡紤],本發(fā)明提出了一種新的深度度量聚類框架,具體而言,使用tcn網(wǎng)絡(luò)用于提取水電機組在時間及空間的深度特征表示。然后,偽標簽?zāi)K通過使用最近鄰居選擇進行標記數(shù)據(jù)聚類,為未標記數(shù)據(jù)生成可靠的偽標簽。最后,網(wǎng)絡(luò)微調(diào)模塊使用真標簽和偽標簽最小化雙重損失(softmax損失和分布對齊損失)來微調(diào)輕量級tcn,迭代協(xié)同訓練,即比較待診斷樣本與各個聚類中心的歐式距離,將樣本劃分到特征空間中距離其最近的聚類中心所代表的類別中,更新聚類中心,以便在后續(xù)訓練中生成更好的偽標簽,進一步完善診斷模型。如此,隨著診斷工作的進展,診斷模型將不斷地被添加新的樣本,即診斷模型不斷地學習新的“知識”,從而調(diào)整聚類中心,使得診斷模型不斷完善。
4、但,現(xiàn)有的基于深度學習和基于無監(jiān)督聚類的方法在水電機組故障診斷中表現(xiàn)良好,但仍存在以下缺陷:
5、1.基于深度學習方法的缺陷:深度學習方法屬于有監(jiān)督學習,需要大量標注數(shù)據(jù)來訓練模型。獲取高質(zhì)量的故障標簽和正常標簽需要大量的專家知識和人力投入,導致標注成本高昂。但在實際應(yīng)用中,水電機組的故障數(shù)據(jù)往往稀缺且不平衡,導致訓練數(shù)據(jù)不足。這使得深度學習模型在泛化能力和魯棒性方面表現(xiàn)不佳,容易出現(xiàn)過擬合現(xiàn)象。
6、2.基于無監(jiān)督聚類方法的缺陷:無監(jiān)督的聚類算法依據(jù)樣本自身的屬性進行分類,但無法充分利用有價值的先驗知識,導致診斷精度和可靠性不足。在聚類過程中,無監(jiān)督方法不依賴于任何標簽信息,無法利用已經(jīng)獲得的部分標注數(shù)據(jù),這種完全無監(jiān)督的方法難以達到有監(jiān)督方法的高診斷精度,同時會受到初始條件和參數(shù)設(shè)置的影響,導致聚類結(jié)果的不穩(wěn)定性和一致性較差。此外,無監(jiān)督聚類方法在面對新的故障類型時,無法自動進行有效的識別和分類,影響診斷系統(tǒng)的適應(yīng)能力和擴展性。
技術(shù)實現(xiàn)思路
1、為了解決上述問題,本發(fā)明的目的是提供一種基于tcn網(wǎng)絡(luò)和k-means聚類的應(yīng)用于水電機組的半監(jiān)督故障診斷系統(tǒng),用于水電機組故障診斷,旨在充分利用先驗知識,降低標注成本,同時提高診斷精度,并增強新數(shù)據(jù)的適應(yīng)性。
2、為了實現(xiàn)上述技術(shù)目的,本技術(shù)提供了基于tcn網(wǎng)絡(luò)和深度聚類的半監(jiān)督故障診斷系統(tǒng),應(yīng)用于水電機組的故障診斷,包括:
3、數(shù)據(jù)處理模塊,用于獲取水電機組的穩(wěn)定性測點振動信號峰峰值以及機組越報警故障報警信號,構(gòu)建數(shù)據(jù)集并進行標注,將訓練數(shù)據(jù)分為有標簽數(shù)據(jù)和無標簽數(shù)據(jù);
4、模型訓練模塊,用于基于經(jīng)過降噪處理的有標簽數(shù)據(jù)和無標簽數(shù)據(jù),通過tcn度量網(wǎng)絡(luò)進行半監(jiān)督模型訓練,提取時間和空間上的深度特征,并依據(jù)k-means聚類算法,生成偽標簽;
5、模型優(yōu)化與故障診斷模塊,用于基于偽標簽,根據(jù)被標注的真標簽,采用聚類損失和分布對齊損失作為雙重損失函數(shù),對模型進行優(yōu)化,構(gòu)建故障診斷模型,用于對水電機組進行故障診斷。
6、優(yōu)選地,數(shù)據(jù)處理模塊,還用于通過iceemdan算法對獲取的水電機組的信號進行降噪處理。
7、優(yōu)選地,數(shù)據(jù)處理模塊,還用于基于降噪處理后的數(shù)據(jù)集,提取有效的報警信號子序列,作為先驗知識,并標注為故障數(shù)據(jù),同樣,選取機組穩(wěn)定運行時的序列信號,標記為正常數(shù)據(jù)。
8、優(yōu)選地,模型訓練模塊,還用于將標記數(shù)據(jù)分為類內(nèi)數(shù)據(jù)和類間數(shù)據(jù),用于通過最大化類間數(shù)據(jù)之間的分布差異和最小化類內(nèi)數(shù)據(jù)之間的分布差異構(gòu)造分布對準損失。
9、優(yōu)選地,tcn度量網(wǎng)絡(luò)的損失函數(shù)表示為:
10、,
11、式中,和表示第k個故障類的子集中的樣本,表示第k個正常類的子集中的樣本,表示來自同一類的數(shù)據(jù)集,表示來自不同類的數(shù)據(jù)集,m為網(wǎng)絡(luò)層數(shù),表示控制將第?k?類樣本拉近的程度的權(quán)衡參數(shù),表示控制第k類樣本遠離其他類樣本程度的權(quán)衡參數(shù),表示矩陣a的frobenius范數(shù),λ為正則化參數(shù),和分別是深度度量網(wǎng)絡(luò)的權(quán)重矩陣和偏差項,加權(quán)參數(shù)和是設(shè)計的加權(quán)參數(shù)來平衡損失函數(shù)中不均衡類的影響。
12、優(yōu)選地,模型訓練模塊,還用于使用k-means聚類算法,將標記特征和未標記特征進行聚類,通過最近鄰選擇nns為未標記數(shù)據(jù)生成偽標簽,用于將特征中心的標簽分配給與特征中心距離最小的無標簽樣本。
13、優(yōu)選地,模型優(yōu)化與故障診斷模塊,還用于通過分布損失cl和分布對齊損失da來優(yōu)化有標簽樣本和無標簽樣本,用于防止偽標簽?zāi)K生成的標簽偏向于大多數(shù)類。
14、優(yōu)選地,模型優(yōu)化與故障診斷模塊,還用于根據(jù)未標記樣本和原始樣本特征分布之間的kullback-leibler散度,獲取分布對齊損失da。
15、優(yōu)選地,模型優(yōu)化與故障診斷模塊,還用于基于偽標簽和真標簽,在深度度量學習模塊中使用ml損失優(yōu)化深度度量網(wǎng)絡(luò)后,使用cl損失和da損失細化網(wǎng)絡(luò)參數(shù),完成對模型的優(yōu)化。
16、本發(fā)明公開了以下技術(shù)效果:
17、本發(fā)明通過利用少量的標注數(shù)據(jù)(先驗知識)和大量的無標簽數(shù)據(jù),減少對大量人工標注的依賴,從而降低標注成本。結(jié)合半監(jiān)督學習方法,利用已有的部分標注數(shù)據(jù)來提高模型性能。在聚類過程中引入先驗知識,通過偽標簽生成和協(xié)同訓練,不斷更新和優(yōu)化聚類中心,使診斷模型能夠?qū)W習新的“知識”,提升診斷性能。這樣既能利用先驗知識,又能自動適應(yīng)數(shù)據(jù)的變化;
18、本發(fā)明結(jié)合深度學習和無監(jiān)督聚類的方法,利用tcn算法充分提取數(shù)據(jù)在時間和空間上的深度特征,對數(shù)據(jù)進行特征提取與分類;使用聚類算法對深度特征進行聚類,利用先驗知識不斷提高聚類的精度,從而提高水電機組故障診斷的精度和效率。
19、本發(fā)明不僅提高了水電機組故障診斷的精度和效率,還降低了實際應(yīng)用中的成本和資源需求,具有廣泛的工程應(yīng)用前景。這種協(xié)作學習框架將為水電機組的智能運維提供強有力的技術(shù)支持,有助于保障水電站的安全穩(wěn)定運行。