本發(fā)明公開了一種基于聚類算法的裝備質(zhì)量狀態(tài)等級劃分方法及系統(tǒng),屬于裝備質(zhì)量狀態(tài)等級劃分。
背景技術(shù):
1、傳統(tǒng)的裝備狀態(tài)監(jiān)測與故障診斷方法主要依賴于單一傳感器數(shù)據(jù)的分析,如振動(dòng)監(jiān)測、溫度控制等,但這些方法在面對復(fù)雜工況和多元故障模式時(shí)顯得力不從心。近年來,多源信息融合與先進(jìn)算法的集成應(yīng)用逐漸成為提升裝備健康管理能力的關(guān)鍵路徑。其中,聚類算法作為一種無監(jiān)督學(xué)習(xí)方法,在處理大規(guī)模、多維度數(shù)據(jù)中展現(xiàn)出了強(qiáng)大的模式識別和異常檢測能力,廣泛應(yīng)用于狀態(tài)監(jiān)測與故障預(yù)警領(lǐng)域。然而,如何高效整合多模態(tài)數(shù)據(jù)并準(zhǔn)確劃分裝備運(yùn)行狀態(tài)等級,仍是一個(gè)亟待解決的技術(shù)挑戰(zhàn)。
2、當(dāng)前,盡管已有研究嘗試結(jié)合多種傳感器數(shù)據(jù)進(jìn)行裝備狀態(tài)評估,但大多集中在單一算法的應(yīng)用,如k-means聚類,這些方法在處理高維度、非線性數(shù)據(jù)時(shí)易受初始條件影響,且難以有效融合不同類型的數(shù)據(jù)特征。此外,多數(shù)研究未能充分利用裝備運(yùn)行數(shù)據(jù)的時(shí)空特性,缺乏對裝備狀態(tài)進(jìn)行多層次、精細(xì)化劃分的系統(tǒng)性策略,導(dǎo)致預(yù)警準(zhǔn)確性和故障診斷的及時(shí)性受限。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供了一種基于聚類算法的裝備質(zhì)量狀態(tài)等級劃分方法及系統(tǒng)解決現(xiàn)有技術(shù)在在面對復(fù)雜工況和多元故障模式時(shí)顯得力不從心,處理復(fù)雜裝備狀態(tài)監(jiān)測與故障預(yù)警方面不足的問題。
2、為解決上述技術(shù)問題,本發(fā)明提供如下技術(shù)方案:
3、本發(fā)明的一種基于聚類算法的裝備質(zhì)量狀態(tài)等級劃分方法,其特殊之處在于包括以下步驟:
4、步驟1:收集裝備的多源數(shù)據(jù),對收集的多源數(shù)據(jù)進(jìn)行預(yù)處理;
5、步驟2:基于預(yù)處理后的多源數(shù)據(jù),構(gòu)建多模態(tài)特征融合網(wǎng)絡(luò),實(shí)現(xiàn)多模態(tài)特征映射;
6、步驟3:基于多模態(tài)特征的映射,采用譜聚類算法,構(gòu)建加權(quán)相似度矩陣及拉普拉斯矩陣,通過第二大特征值對應(yīng)的特征向量獲得聚類標(biāo)簽;
7、步驟4:依據(jù)聚類標(biāo)簽,構(gòu)建多層次的聚類結(jié)構(gòu),建立狀態(tài)等級映射規(guī)則,劃分裝備狀態(tài)等級。
8、作為本發(fā)明所述基于聚類算法的裝備質(zhì)量狀態(tài)等級劃分方法的一種優(yōu)選方案,其中:步驟1中所述收集裝備的多源數(shù)據(jù)包括以下步驟:
9、部署高精度傳感器、高清工業(yè)攝像頭和高靈敏度麥克風(fēng)陣列均勻分布在關(guān)鍵部件和潛在故障區(qū)域;
10、部署高精度傳感器包括三軸加速度計(jì)和熱電偶,其中,三軸加速度計(jì)用于振動(dòng)檢測,收集振動(dòng)信號,熱電偶用于監(jiān)測溫度變化,收集溫度數(shù)據(jù);
11、高清工業(yè)攝像頭用于圖像采集,對設(shè)備表面裂紋、磨損的視覺異常進(jìn)行實(shí)時(shí)識別,得到圖像數(shù)據(jù);
12、高靈敏度麥克風(fēng)陣列用于聲音錄制,收集語音信號;
13、根據(jù)裝備運(yùn)行周期和故障發(fā)生頻次,設(shè)置合理的數(shù)據(jù)采集頻率,利用時(shí)間戳同步技術(shù),確保所有傳感器數(shù)據(jù)的時(shí)間精確對齊。
14、作為本發(fā)明所述基于聚類算法的裝備質(zhì)量狀態(tài)等級劃分方法的一種優(yōu)選方案,其中:步驟2中所述預(yù)處理包括以下步驟:
15、識別并剔除傳感器數(shù)據(jù)中的離群點(diǎn),使用z-score標(biāo)準(zhǔn)化對連續(xù)數(shù)值數(shù)據(jù)進(jìn)行處理;
16、采用中值濾波對圖像數(shù)據(jù)去除椒鹽噪聲,應(yīng)用opencv進(jìn)行亮度調(diào)整、對比度增強(qiáng)、旋轉(zhuǎn)和平移的圖像增強(qiáng)操作,使用預(yù)訓(xùn)練的vgg16模型的前幾層作為特征提取器,輸入尺寸調(diào)整為224x224像素,提取4096維特征向量;
17、通過譜減法對語音信號去除背景噪音,通過librosa提取13維mfcc特征,加上一階和二階導(dǎo)數(shù),共39維特征。
18、作為本發(fā)明所述基于聚類算法的裝備質(zhì)量狀態(tài)等級劃分方法的一種優(yōu)選方案,其中:步驟2中所述構(gòu)建多模態(tài)特征融合網(wǎng)絡(luò)包括以下步驟:
19、多模態(tài)特征融合網(wǎng)絡(luò)包括圖像分支、語音分支和數(shù)值數(shù)據(jù)分支;
20、定義圖像分支,使用resnet50作為骨干網(wǎng)絡(luò),移除頂部分類層,輸出2048維特征向量;
21、定義語音分支,lstm層接受mfcc特征,通過多層lstm結(jié)構(gòu)提取時(shí)序特征,展平為固定長度向量;
22、定義數(shù)值數(shù)據(jù)分支,直接將振動(dòng)和溫度數(shù)據(jù)通過全連接層處理,轉(zhuǎn)換成高維特征向量;
23、將圖像分支、語音分支和數(shù)值數(shù)據(jù)分支的輸出向量使用全連接層映射到同一維度,設(shè)置為1024維。
24、作為本發(fā)明所述基于聚類算法的裝備質(zhì)量狀態(tài)等級劃分方法的一種優(yōu)選方案,其中:步驟3中所述采用譜聚類算法包括以下步驟:
25、定義一個(gè)數(shù)據(jù)集x,包含n個(gè)樣本,每個(gè)樣本有m個(gè)特征,表示為,
26、x={x1,x2,…,xi,...,xj,...,xn}
27、其中,每個(gè)樣本xi(i=1,2,……,n)是一個(gè)m維向量,進(jìn)一步表達(dá)為:
28、xi=[xi1,xi2,...,xik,...,xim]t
29、其中,xik表示第i個(gè)樣本在第k個(gè)特征上的值;
30、其中,每個(gè)樣本xj(j=1,2,……,n)是一個(gè)m維向量,進(jìn)一步表達(dá)為:
31、xj=[xj1,xj2,...,xjk,...,xjm]t
32、其中,xjk表示第j個(gè)樣本在第k個(gè)特征上的值;
33、對特征向量進(jìn)行加權(quán),構(gòu)建加權(quán)相似度矩陣w,用于表示數(shù)據(jù)集中所有樣本兩兩之間加權(quán)相似度的矩陣,表示為,
34、
35、其中,每個(gè)元素wij(i=1,2,……,n;j=1,2,……,n)用來量化第i個(gè)樣本與第j個(gè)樣本經(jīng)過特征權(quán)重w調(diào)整后的特征向量之間的相似度,表達(dá)式為,
36、
37、其中,表示第i個(gè)樣本經(jīng)過特征權(quán)重w加權(quán)后的特征向量,表示第j個(gè)樣本經(jīng)過特征權(quán)重w加權(quán)后的特征向量,表示第i個(gè)樣本與第j個(gè)樣本經(jīng)過特征權(quán)重w加權(quán)處理后的特征向量之間的歐氏距離的平方,b為高斯核寬度,用來控制相似度隨距離增加而衰減的速度;
38、構(gòu)建度矩陣d,dii是度矩陣d的對角線元素,表示第i個(gè)樣本的度,即所有與其相鄰樣本的相似度之和,表達(dá)式為,
39、
40、其中,n是樣本數(shù)量,wij是加權(quán)相似度矩陣中的元素,表示樣本i和j之間的相似度;
41、基于加權(quán)相似度矩陣w,構(gòu)建拉普拉斯矩陣l,表達(dá)式為,
42、l=d-w
43、其中,l是拉普拉斯矩陣,w是加權(quán)相似度矩陣,d是度矩陣;
44、利用拉普拉斯矩陣的特征向量進(jìn)行聚類,找到與聚類數(shù)相等的特征向量,即第二大特征值對應(yīng)的特征向量,將其作為聚類標(biāo)簽的初步表示;
45、指定要找的聚類數(shù)量為3個(gè),聚類標(biāo)簽0對應(yīng)表示的是“正?!保垲悩?biāo)簽1對應(yīng)表示的是“預(yù)警”,聚類標(biāo)簽2對應(yīng)表示的是“故障”。
46、作為本發(fā)明所述基于聚類算法的裝備質(zhì)量狀態(tài)等級劃分方法的一種優(yōu)選方案,其中:步驟4中所述構(gòu)建多層次的聚類結(jié)構(gòu)包括以下步驟:
47、定義數(shù)據(jù)集x中任意兩個(gè)樣本xi和xj之間的歐氏距離dij,表達(dá)式為,
48、
49、其中,m是特征的維度數(shù),xik表示第i個(gè)樣本在第k個(gè)特征上的值,xjk表示第j個(gè)樣本在第k個(gè)特征上的值;
50、計(jì)算所有樣本間的歐氏距離dij(i≠j),每對樣本被計(jì)算一次,得出平均值averagedistance,表達(dá)式為,
51、
52、以平均值average?distance乘以0.5作為層次聚類的初始距離閾值initialthreshold,表達(dá)式為,
53、initial?threshold=0.5×average?d?istance
54、采用ward最小方差法作為聚類準(zhǔn)則,通過最小化每次合并簇時(shí)的總方差增量來決定合并順序的合并策略,以初始距離閾值開始,凝聚層次聚類;
55、每次迭代增加5%的閾值,合并距離最近的兩個(gè)簇,直到達(dá)到或超過初始閾值,形成多層次的聚類結(jié)構(gòu)。
56、作為本發(fā)明所述基于聚類算法的裝備質(zhì)量狀態(tài)等級劃分方法的一種優(yōu)選方案,其中:步驟4中所述建立狀態(tài)等級映射規(guī)則包括以下步驟:
57、提取每個(gè)簇的質(zhì)心作為代表性特征向量,質(zhì)心是簇內(nèi)所有樣本的特征均值,在計(jì)算簇間距離時(shí),將每個(gè)簇的質(zhì)心視為多維空間中的點(diǎn),則兩個(gè)簇中心之間的歐氏距離計(jì)算公式為:
58、
59、其中,分別代表兩個(gè)簇的質(zhì)心向量,m是特征的維度數(shù),c1k和c2k分別表示兩個(gè)質(zhì)心在第k個(gè)特征上的值;
60、基于簇間距離,以“正?!贝氐馁|(zhì)心為參照點(diǎn),對所有簇按照與參照點(diǎn)的距離進(jìn)行排序,距離最遠(yuǎn)的簇排在首位,距離最近的簇排在末尾;
61、計(jì)算均值μ,表達(dá)式為,
62、
63、其中,di表示每個(gè)簇質(zhì)心與參照點(diǎn)的距離,n是簇質(zhì)心的數(shù)量;
64、計(jì)算標(biāo)準(zhǔn)差σ,表達(dá)式為,
65、
66、其中,di表示每個(gè)簇質(zhì)心與參照點(diǎn)的距離,n是簇質(zhì)心的數(shù)量,μ為均值;
67、基于均值和標(biāo)準(zhǔn)差,根據(jù)排序結(jié)果,按照以下原則定義狀態(tài)等級:
68、當(dāng)di>μ+2σ時(shí),排序列表中最上方的簇,為距離最遠(yuǎn)簇,這些裝備的運(yùn)行參數(shù)遠(yuǎn)離故障特征,表明運(yùn)行狀態(tài)最為健康,最接近理想狀態(tài),標(biāo)記為“正?!睜顟B(tài);
69、當(dāng)μ+2σ>di>μ-σ時(shí),排序列表中居中的簇,為中間距離簇,這些裝備雖然尚未達(dá)到故障水平,但已顯示出潛在的問題跡象,標(biāo)記為“預(yù)警”狀態(tài);
70、當(dāng)di<μ-σ時(shí),排序列表中最下方的簇,為最近距離簇,這些設(shè)備的特征與已知故障模式最為接近,標(biāo)記為“故障”狀態(tài)。
71、本發(fā)明提供了一種基于聚類算法的裝備質(zhì)量狀態(tài)等級劃分系統(tǒng),其特殊之處在于包括:數(shù)據(jù)收集模塊、多模態(tài)特征融合網(wǎng)絡(luò)構(gòu)建模塊、譜聚類應(yīng)用模塊和裝備狀態(tài)等級劃分模塊。
72、所述數(shù)據(jù)收集模塊用于收集裝備的多源數(shù)據(jù),對收集的多源數(shù)據(jù)進(jìn)行預(yù)處理;
73、所述多模態(tài)特征融合網(wǎng)絡(luò)構(gòu)建模塊用于基于預(yù)處理后的多源數(shù)據(jù),構(gòu)建多模態(tài)特征融合網(wǎng)絡(luò),實(shí)現(xiàn)多模態(tài)特征映射;
74、所述譜聚類應(yīng)用模塊用于基于多模態(tài)特征的映射,采用譜聚類算法,構(gòu)建加權(quán)相似度矩陣及拉普拉斯矩陣,通過第二大特征值對應(yīng)的特征向量獲得聚類標(biāo)簽;
75、所述裝備狀態(tài)等級劃分模塊用于依據(jù)聚類標(biāo)簽,構(gòu)建多層次的聚類結(jié)構(gòu),建立狀態(tài)等級映射規(guī)則,劃分裝備狀態(tài)等級。
76、本發(fā)明提供了一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,其中:所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如本發(fā)明第一方面所述的基于聚類算法的裝備質(zhì)量狀態(tài)等級劃分方法的任一步驟。
77、本發(fā)明實(shí)施例提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其中:所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如本發(fā)明第一方面所述的基于聚類算法的裝備質(zhì)量狀態(tài)等級劃分方法的任一步驟。
78、本發(fā)明有益效果為:本發(fā)明通過集成多模態(tài)數(shù)據(jù)處理、深度學(xué)習(xí)與先進(jìn)聚類技術(shù),提供了一套全面、精準(zhǔn)的裝備狀態(tài)等級劃分解決方案,為實(shí)現(xiàn)裝備健康管理的智能化、精細(xì)化提供了強(qiáng)有力的技術(shù)支撐。