本發(fā)明涉及數(shù)據(jù)增強,尤其涉及一種不平衡數(shù)據(jù)集的擴充方法、裝置及存儲介質(zhì)。
背景技術:
1、在對機械設備進行軸承故障診斷之前,需要采集軸承數(shù)據(jù)來訓練故障診斷模型,但是,因為軸承在大部分時間里是正常運行的,因此采集到的軸承數(shù)據(jù)中異常數(shù)據(jù)遠遠少于正常數(shù)據(jù),也即采集到的軸承數(shù)據(jù)集是不平衡數(shù)據(jù)集,這會導致后續(xù)訓練得到的故障診斷模型偏向多數(shù)類數(shù)據(jù)(正常類數(shù)據(jù)),進而導致故障診斷結果的準確率低,因此,有必要對采集到的不平衡數(shù)據(jù)集進行數(shù)據(jù)增強。
2、現(xiàn)有的數(shù)據(jù)增強技術中,最常見的是過采樣技術和欠采樣技術。過采樣技術通過復制少數(shù)類樣本或通過插值方法來實現(xiàn)數(shù)據(jù)增強。而欠采樣技術則通過隨機刪除多數(shù)類樣本來降低數(shù)據(jù)集的不平衡性。但是,過采樣技術和欠采樣技術都存在明顯的缺陷:過采樣技術可能造成過擬合,從而導致故障診斷模型學習到這些重復或相似樣本的特定噪聲而非真實的、廣泛的數(shù)據(jù)特征,進而限制了故障診斷模型的泛化能力;而欠采樣技術在刪除多數(shù)類樣本時則可能會移除一些關鍵信息,導致故障診斷模型訓練不充分,進而降低故障診斷結果的準確性。
技術實現(xiàn)思路
1、本發(fā)明實施例的目的是提供一種不平衡數(shù)據(jù)集的擴充方法、裝置及存儲介質(zhì),能夠生成更加多樣化、且具備實際故障特征的故障數(shù)據(jù),從而實現(xiàn)對不平衡數(shù)據(jù)集的數(shù)據(jù)增強。
2、為實現(xiàn)上述目的,本發(fā)明實施例提供了一種不平衡數(shù)據(jù)集的擴充方法,包括:
3、將故障數(shù)據(jù)輸入基于vae-gan的改進網(wǎng)絡,得到若干新生成的故障數(shù)據(jù);
4、將所述若干新生成的故障數(shù)據(jù)加入不平衡數(shù)據(jù)集,得到平衡數(shù)據(jù)集;
5、其中,所述基于vae-gan的改進網(wǎng)絡包括一個生成器、一個時域鑒別器和一個頻域鑒別器,并且,所述生成器是類傅里葉變換的變分自編碼器。
6、作為上述方案的改進,所述類傅里葉變換的變分自編碼器包括編碼器和解碼器,所述編碼器包括標簽嵌入層、第一全連接層和第二全連接層,則,所述將故障數(shù)據(jù)輸入基于vae-gan的改進網(wǎng)絡,得到若干新生成的故障數(shù)據(jù),包括:
7、采用所述標簽嵌入層對所述故障數(shù)據(jù)的類別標簽進行轉(zhuǎn)換,得到嵌入向量;
8、將所述嵌入向量和所述故障數(shù)據(jù)合并后分別輸入所述第一全連接層和所述第二全連接層,以通過所述第一全連接層得到實部的均值和實部的對數(shù)方差,通過所述第二全連接層得到虛部的均值和虛部的對數(shù)方差;
9、對所述實部的均值和實部的標準差進行重參數(shù)化,得到若干實部潛在變量,對所述虛部的均值和虛部的標準差進行重參數(shù)化,得到若干虛部潛在變量;
10、所述解碼器根據(jù)余弦變量、正弦變量、所述實部潛在變量和所述虛部潛在變量進行數(shù)據(jù)重構,得到新生成的故障數(shù)據(jù)。
11、作為上述方案的改進,在所述將故障數(shù)據(jù)輸入基于vae-gan的改進網(wǎng)絡之前,還包括采用交替訓練的方式對所述生成器、所述時域鑒別器和所述頻域鑒別器進行訓練,具體包括:
12、固定所述生成器,采用時域鑒別器損失函數(shù)和頻域鑒別器損失函數(shù)對所述時域鑒別器和所述頻域鑒別器進行迭代訓練,得到中間時域鑒別器和中間頻域鑒別器;
13、固定所述中間時域鑒別器和所述中間頻域鑒別器,采用生成器損失函數(shù)對所述生成器進行迭代訓練,得到中間生成器,返回上述固定所述生成器步驟以重復交替訓練的過程,直至得到滿足要求的基于vae-gan的改進網(wǎng)絡。
14、作為上述方案的改進,所述生成器損失函數(shù)如下式所示:
15、
16、其中,表示生成器損失函數(shù);表示重建損失函數(shù);表示kl散度函數(shù);表示對抗性損失函數(shù);表示輸入數(shù)據(jù);表示重構數(shù)據(jù);和表示超參數(shù);表示均值;表示標準差;
17、所述對抗性損失函數(shù)如下式所示:
18、
19、其中,表示二進制交叉熵損失函數(shù);表示時域鑒別器;表示頻域鑒別器;表示短時傅里葉變換。
20、作為上述方案的改進,所述時域鑒別器損失函數(shù)和所述頻域鑒別器損失函數(shù)分別如下式所示:
21、
22、
23、其中,表示時域鑒別器損失函數(shù);表示頻域鑒別器損失函數(shù);表示二進制交叉熵損失函數(shù);表示時域鑒別器;表示真實數(shù)據(jù);表示生成數(shù)據(jù);表示頻域鑒別器;表示短時傅里葉變換。
24、作為上述方案的改進,所述時域鑒別器對待鑒別數(shù)據(jù)的鑒別過程包括:
25、通過時域鑒別器嵌入層對所述待鑒別數(shù)據(jù)及其標簽進行融合,得到第一融合數(shù)據(jù);其中,所述待鑒別數(shù)據(jù)是真實數(shù)據(jù)或生成數(shù)據(jù);
26、將所述第一融合數(shù)據(jù)輸入三層時域鑒別器全連接層進行逐步降維,并通過時域鑒別器激活函數(shù)輸出時域判別值,所述時域判別值用于表征所述待鑒別數(shù)據(jù)是否為真實數(shù)據(jù);
27、所述頻域鑒別器對所述待鑒別數(shù)據(jù)的鑒別過程包括:
28、將所述待鑒別數(shù)據(jù)進行傅里葉變換,得到頻域數(shù)據(jù);
29、通過頻域鑒別器嵌入層對所述頻域數(shù)據(jù)和所述標簽進行融合,得到第二融合數(shù)據(jù);
30、將所述第二融合數(shù)據(jù)輸入三層頻域鑒別器全連接層進行逐步降維,并通過頻域鑒別器激活函數(shù)輸出頻域判別值,所述頻域判別值用于表征所述待鑒別數(shù)據(jù)是否為真實數(shù)據(jù)。
31、作為上述方案的改進,在所述得到平衡數(shù)據(jù)集后,還包括采用所述平衡數(shù)據(jù)集對預先構建的cnn-lstm網(wǎng)絡進行訓練,以得到訓練好的軸承故障診斷模型。
32、作為上述方案的改進,所述cnn-lstm網(wǎng)絡包括卷積層、最大池化層、lstm層和輸出層,則,所述cnn-lstm網(wǎng)絡的故障診斷過程包括:
33、采用所述卷積層提取軸承數(shù)據(jù)的局部時空特征;
34、采用所述最大池化層對所述局部時空特征進行降維處理,得到降維特征;
35、采用所述lstm層對所述降維特征進行時序信息處理,得到高維特征;
36、采用所述輸出層將所述高維特征映射為概率分布,并輸出軸承故障類型。
37、為實現(xiàn)上述目的,本發(fā)明實施例還提供了一種不平衡數(shù)據(jù)集的擴充裝置,包括:
38、故障數(shù)據(jù)生成模塊,用于將故障數(shù)據(jù)輸入基于vae-gan的改進網(wǎng)絡,得到若干新生成的故障數(shù)據(jù);
39、數(shù)據(jù)集構建模塊,用于將所述若干新生成的故障數(shù)據(jù)加入不平衡數(shù)據(jù)集,得到平衡數(shù)據(jù)集;其中,所述基于vae-gan的改進網(wǎng)絡包括一個生成器、一個時域鑒別器和一個頻域鑒別器,并且,所述生成器是類傅里葉變換的變分自編碼器。
40、為實現(xiàn)上述目的,本發(fā)明實施例還提供了一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)包括存儲的計算機程序,其中,在所述計算機程序運行時控制所述計算機可讀存儲介質(zhì)所在設備執(zhí)行如上述任一實施例所述的不平衡數(shù)據(jù)集的擴充方法。
41、與現(xiàn)有技術相比,本發(fā)明實施例提供的不平衡數(shù)據(jù)集的擴充方法、裝置及存儲介質(zhì),將故障數(shù)據(jù)輸入基于vae-gan的改進網(wǎng)絡,得到若干新生成的故障數(shù)據(jù);將所述若干新生成的故障數(shù)據(jù)加入不平衡數(shù)據(jù)集,得到平衡數(shù)據(jù)集;其中,所述基于vae-gan的改進網(wǎng)絡包括一個生成器、一個時域鑒別器和一個頻域鑒別器,并且,所述生成器是類傅里葉變換的變分自編碼器。本發(fā)明實施例提供的生成器能夠在潛在空間中同時捕捉時域和頻域的特征,從而使得生成的故障數(shù)據(jù)具備實際故障特征,并且,本發(fā)明實施例的時域鑒別器和頻域鑒別器能夠?qū)ι蓴?shù)據(jù)進行雙重鑒定,確保生成數(shù)據(jù)在多個層面上與實際數(shù)據(jù)相匹配,進一步確保了生成數(shù)據(jù)的質(zhì)量。