本發(fā)明屬于深度學(xué)習(xí)、故障檢測(cè)、風(fēng)力發(fā)電和數(shù)據(jù)特征融合領(lǐng)域,具體涉及一種基于多元數(shù)據(jù)和深度學(xué)習(xí)的風(fēng)力發(fā)電機(jī)故障檢測(cè)方法。
背景技術(shù):
1、風(fēng)能作為一種可再生、清潔的能源,在世界范圍內(nèi)得到了廣泛的應(yīng)用。風(fēng)力發(fā)電是一種清潔無公害的可再生能源利用方式,具有清潔環(huán)保、可再生性、基建周期短、裝機(jī)規(guī)模靈活、運(yùn)行和維護(hù)成本低等特點(diǎn)。近幾年,隨著國(guó)家政策對(duì)可再生能源發(fā)展的大力扶持,風(fēng)力發(fā)電裝機(jī)容量也呈現(xiàn)平穩(wěn)增長(zhǎng)的態(tài)勢(shì)。2023年,全國(guó)風(fēng)力發(fā)電累計(jì)裝機(jī)容量44134萬千瓦,同比增長(zhǎng)20.7%。國(guó)家能源局最新數(shù)據(jù)顯示,2024年1-2月,全國(guó)風(fēng)力發(fā)電累計(jì)裝機(jī)容量45035萬千瓦,同比增長(zhǎng)21.3%。為了實(shí)現(xiàn)風(fēng)電機(jī)組運(yùn)行的可靠性和穩(wěn)定性,必須建立風(fēng)電機(jī)組的狀態(tài)監(jiān)測(cè)和故障診斷系統(tǒng),以減少故障的影響。監(jiān)控與數(shù)據(jù)采集系統(tǒng)采集風(fēng)力發(fā)電機(jī)組的運(yùn)行數(shù)據(jù)和工況,如風(fēng)速、溫度、轉(zhuǎn)速等,這些數(shù)據(jù)已廣泛應(yīng)用于風(fēng)力發(fā)電機(jī)組的故障診斷。風(fēng)力渦輪機(jī)故障診斷的方法有很多種,主要分為基于物理學(xué)的方法和數(shù)據(jù)驅(qū)動(dòng)的方法。cambron(p.cambron,a.tahan,c.masson,f.pelletier,bearing?temperaturemonitoring?of?a?wind?turbine?using?physics-based?model,j.qual.mainten.eng.23(4)(2017)479e488.)等人提出了一種動(dòng)態(tài)模型,該模型基于測(cè)量溫度和估計(jì)溫度之間的差異,用于監(jiān)測(cè)風(fēng)力渦輪機(jī)的主軸承。但這需要特定的風(fēng)力電機(jī)信息,不具有泛化性。隨著深度學(xué)習(xí)的興起,基于數(shù)據(jù)驅(qū)動(dòng)的方法展現(xiàn)出強(qiáng)大活力。yang等人(yang?l,zhang?z.windturbine?gearbox?failure?detection?based?on?scadadata:a?deep?learning-basedapproach[j].ieee?transactions?on?instrumentation?and?measurement,2020,70:1-11.)提取了scada系統(tǒng)中的振動(dòng)信號(hào)變量作為數(shù)據(jù)集,訓(xùn)練了一個(gè)深度學(xué)習(xí)模型進(jìn)行二分類來判斷齒輪箱是否有故障。但是目前這些方法對(duì)于scada的數(shù)據(jù)運(yùn)用不充分,模型也不能解決數(shù)據(jù)分布不平衡的問題。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是提出一種基于數(shù)據(jù)融合重構(gòu)和深度學(xué)習(xí)的風(fēng)力發(fā)電機(jī)故障檢測(cè)方法,針對(duì)風(fēng)力發(fā)電機(jī)組常用的scada系統(tǒng)所獲取的大量多元時(shí)序數(shù)據(jù),采用vae模型進(jìn)行數(shù)據(jù)特征融合與重構(gòu);建立選擇狀態(tài)空間深度學(xué)習(xí)模型作為識(shí)別模型,以構(gòu)造一個(gè)適用該融合數(shù)據(jù)的深度學(xué)習(xí)模型,在完成訓(xùn)練之后,可以進(jìn)行風(fēng)力發(fā)電機(jī)的故障檢測(cè)。
2、本發(fā)明至少通過如下技術(shù)方案之一實(shí)現(xiàn)。
3、一種基于多元數(shù)據(jù)和深度學(xué)習(xí)的風(fēng)力發(fā)電機(jī)故障檢測(cè)方法,包括以下步驟:
4、s1、scada系統(tǒng)采集多種不同變量的數(shù)據(jù);
5、s2、將采集的數(shù)據(jù)預(yù)處理;
6、s3、基于變分自編碼器(auto-encoding?variational,vae)的數(shù)據(jù)融合與特征融合的方法,構(gòu)建變分自編碼器模型,通過數(shù)據(jù)融合和特征融合,獲得可供深度學(xué)習(xí)網(wǎng)絡(luò)學(xué)習(xí)的數(shù)據(jù)集,并提高后續(xù)模型的識(shí)別效果;
7、s4、構(gòu)建基于狀態(tài)空間選擇(ssm)的深度學(xué)習(xí)模型,采用步驟s3獲得的數(shù)據(jù)集進(jìn)行訓(xùn)練,使用訓(xùn)練好的深度學(xué)習(xí)模型進(jìn)行故障檢測(cè)。
8、進(jìn)一步地,scada采集的數(shù)據(jù)包括以下五類:
9、1)、風(fēng)電變量,包括瞬時(shí)風(fēng)速、平均風(fēng)速、平均風(fēng)速、風(fēng)角;
10、2)、溫度變量,包括機(jī)艙溫度、變速箱冷卻水、變速箱油、發(fā)電機(jī)定子、高速軸承、低速軸承、驅(qū)動(dòng)端軸承、自由端軸承、冷卻風(fēng)扇、塔頂、塔底溫度;
11、3)、電氣變量,包括相電壓、相電流、相頻率、功率因數(shù);
12、4)、工況變量,包括艙位、液壓系統(tǒng)壓力、艙室振動(dòng)、葉片轉(zhuǎn)速、發(fā)電機(jī)轉(zhuǎn)速等、葉片角度;
13、5)、統(tǒng)計(jì)變量,包括日發(fā)電量、月發(fā)電量、年發(fā)電量。
14、進(jìn)一步地,所述數(shù)據(jù)預(yù)處理包括數(shù)據(jù)清洗、數(shù)據(jù)對(duì)齊、數(shù)據(jù)歸一化,具體包括以下內(nèi)容:
15、數(shù)據(jù)清洗:scada中的數(shù)據(jù)按照固定時(shí)間間隔采集一次,將缺省值、異常值過濾,并且根據(jù)過濾后的數(shù)據(jù)的時(shí)間戳來得到當(dāng)前時(shí)間戳下電機(jī)運(yùn)行狀態(tài);
16、數(shù)據(jù)對(duì)齊與數(shù)據(jù)歸一化:將清洗過后的數(shù)據(jù)按照運(yùn)行狀態(tài)進(jìn)行標(biāo)簽處理,注意將異常運(yùn)行狀態(tài)前h個(gè)數(shù)據(jù)都標(biāo)記為相同異常,將每個(gè)變量的數(shù)據(jù)進(jìn)行歸一化處理,按照標(biāo)簽將數(shù)據(jù)進(jìn)行分離。
17、進(jìn)一步地,所述變分自編碼器模型,包括:
18、編碼器:不同來源和類型的預(yù)處理后的數(shù)據(jù)輸入到編碼器中,編碼器由若干層神經(jīng)網(wǎng)絡(luò)組成,分別處理不同類型的數(shù)據(jù),并將其映射到隱空間;
19、隱空間:將輸入的數(shù)據(jù)映射到隱空間,生成隱變量,隱變量不會(huì)直接作為模型輸出,而是作為解碼器的輸入。
20、解碼器:將隱變量表示解碼為目標(biāo)格式的數(shù)據(jù),解碼器由多層神經(jīng)網(wǎng)絡(luò)組成,確保輸出的維度正確。
21、進(jìn)一步地,訓(xùn)練vae模型訓(xùn)練,包括以下內(nèi)容:
22、確定優(yōu)化目標(biāo),vae模型的目的是將數(shù)據(jù)集x通過編碼器和解碼器得到數(shù)據(jù)其優(yōu)化目標(biāo)為最大化其似然函數(shù)logpθ(x);
23、根據(jù)全概率公式:
24、logpθ(x)=∫zqφ(z∣x)logpθ(x)dz????(1)
25、其中pθ(x)為樣本x的概率密度函數(shù),z表示隱變量,qφ(z∣x)表示近似后驗(yàn)分布;
26、由貝葉斯定理:
27、
28、其中pθ(x,z)表示樣本x和隱變量z的聯(lián)合概率分布密度,qφ(z∣x)是編碼器的近似后驗(yàn)分布,pθ(z∣x)是解碼器的分布;變形后得到:
29、
30、將記作e(pθ,qφ),對(duì)于根據(jù)kl散度的定義;
31、若p、q為兩個(gè)分布,則其dkl(p,q)散度公式如下:
32、
33、其中,p(x)是分布p在樣本x處的概率密度或概率質(zhì)量,q(x)是分布q在x處的概率密度或概率質(zhì)量;
34、故可得:
35、logpθ(x)==l(pθ,qφ)+dkl(qφ,pθ)????(5)
36、kl散度dkl(qφ,pθ)>0,優(yōu)化目標(biāo)即為最大化e(pθ,qφ);
37、根據(jù)貝葉斯定理:
38、
39、變形后可得:
40、
41、其中為期望,p(z)是分布p在樣本z處的概率密度或概率質(zhì)量,從qφ(z∣x)中進(jìn)行m次采樣zj來逼近可得:
42、
43、其中n表示樣本的數(shù)量,pθ(xi∣zj)為某次采樣時(shí)的概率;將公式(8)作為損失函數(shù)項(xiàng),對(duì)vae模型進(jìn)行訓(xùn)練。
44、進(jìn)一步地,步驟s3中,獲得可供深度學(xué)習(xí)網(wǎng)絡(luò)學(xué)習(xí)的數(shù)據(jù)集包括:
45、將不同標(biāo)簽的數(shù)據(jù)分別輸入到vae模型中進(jìn)行訓(xùn)練,通過編碼器與解碼器將數(shù)據(jù)重構(gòu)為(batch,feture,length)格式的數(shù)據(jù),作為后續(xù)模型的輸入,其中其中batch表示批次大小,feture表示特征的數(shù)量,length表示生成的數(shù)據(jù)長(zhǎng)度;
46、根據(jù)具體的故障類型或檢測(cè)目標(biāo),為每個(gè)時(shí)間序列片段打上相應(yīng)的標(biāo)簽;
47、將打上標(biāo)簽的數(shù)據(jù)劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,用于后續(xù)模型訓(xùn)練。
48、進(jìn)一步地,構(gòu)建基于狀態(tài)空間選擇的深度學(xué)習(xí)模型包括:
49、連續(xù)時(shí)間條件下的經(jīng)典狀態(tài)空間方程為:
50、h′(t)=ah(t)+bx(t)??????????(9)
51、y(t)=ch(t)??????????(10)
52、其中h′(t)為連續(xù)時(shí)間t系統(tǒng)的狀態(tài)變化,h(t)為系統(tǒng)的狀態(tài)向量,a為狀態(tài)矩陣,b為輸入矩陣,c為輸出矩陣,x(t)、y(t)分別為輸入和輸出向量;
53、離散化:
54、
55、yt=cht??(12)
56、其中由連續(xù)系統(tǒng)下的a,b計(jì)算出;
57、采用卷積形式:
58、
59、其中,為卷積形式的狀態(tài)向量;a、b、c都是固定的參數(shù),加入選擇機(jī)制,使b、c矩陣隨輸入變換,是增加b,c矩陣的維度,將序列長(zhǎng)度納入b,c中,用linear層進(jìn)行選擇,使每次不同輸入時(shí),實(shí)際上的b、c矩陣式動(dòng)態(tài)變換的。
60、進(jìn)一步地,基于狀態(tài)空間選擇的深度學(xué)習(xí)模型是在門控注意力架構(gòu)的主回路中加入選擇機(jī)制的狀態(tài)空間算法,將狀態(tài)空間算法視作一個(gè)深度學(xué)習(xí)層,在其之前加入卷積層,使建立不同詞向量間依賴關(guān)系,在深度神經(jīng)網(wǎng)絡(luò)添加線性層、歸一化層、激活層、記作選擇機(jī)制ssm塊。
61、進(jìn)一步地,基于狀態(tài)空間選擇的深度學(xué)習(xí)模型在選擇機(jī)制ssm塊增加殘差連接,并在每次輸入前進(jìn)行歸一化,使模型深度變得更大,將ssm塊進(jìn)行堆疊,堆疊次數(shù)由執(zhí)行訓(xùn)練的設(shè)備性能決定,在最后一個(gè)塊后增加歸一化層、線性層、softmax層,以用于故障分類識(shí)別。
62、進(jìn)一步地,將訓(xùn)練好的深度學(xué)習(xí)模型部署至本地或云端,包括:
63、選擇一套可用于部署vae模型和選擇機(jī)制ssm模型的本地或者云端設(shè)備,將訓(xùn)練好的模型部署至相關(guān)設(shè)備,進(jìn)行實(shí)時(shí)的風(fēng)力發(fā)電機(jī)組故障檢測(cè)。
64、與現(xiàn)有的技術(shù)相比,本發(fā)明的優(yōu)點(diǎn)及有益效果為:
65、本發(fā)明提出了一套完整的風(fēng)力發(fā)電機(jī)故障檢測(cè)方法,針對(duì)實(shí)際的scada系統(tǒng)中存在的大量缺省值,異常值,并且難以手動(dòng)選擇特征的問題,采用vae模型,結(jié)合resnet殘差網(wǎng)絡(luò),不僅完成了數(shù)據(jù)特征的自選擇,還對(duì)數(shù)據(jù)特征進(jìn)行了融合和對(duì)齊。該方法不僅極大的簡(jiǎn)化了數(shù)據(jù)集的制作,同樣還完成了數(shù)據(jù)的初步特征融合和提取,提升了之后判別模型的準(zhǔn)確率。由于vae是生成式的模型,所以還可以解決故障數(shù)據(jù)遠(yuǎn)少于正常數(shù)據(jù)這樣的數(shù)據(jù)不平衡問題。而選擇基于狀態(tài)空間選擇的深度學(xué)習(xí)模型作為進(jìn)行故障檢測(cè)的模型,除了其識(shí)別準(zhǔn)確率高之外還具有以下兩方面的好處:
66、不同于cnn(卷積神經(jīng)網(wǎng)絡(luò))以及rnn(循環(huán)神經(jīng)網(wǎng)絡(luò)),狀態(tài)空間模型兼具快速訓(xùn)練的能力和快速推理的能力,即它能充分利用cnn的高效并行處理能力,又能保持rnn在序列數(shù)據(jù)處理上的靈活性。
67、不同于狀態(tài)空間模型,增加了選擇機(jī)制的狀態(tài)空間模型的參數(shù)依賴于輸入,模型可以根據(jù)不同的輸入動(dòng)態(tài)調(diào)整其行為,模型的泛化能力得到了增強(qiáng)。