本技術(shù)涉及網(wǎng)絡(luò)運維領(lǐng)域,具體而言,涉及一種電信網(wǎng)絡(luò)的故障定位方法及系統(tǒng)。
背景技術(shù):
1、目前,電信網(wǎng)絡(luò)是指通過無線通信技術(shù),實現(xiàn)移動設(shè)備之間或移動設(shè)備與固定網(wǎng)絡(luò)之間的數(shù)據(jù)和語音傳輸?shù)南到y(tǒng)。它包括基站、移動交換中心、路由器等各種網(wǎng)絡(luò)設(shè)備,通過物理鏈路和無線電波相互連接,為用戶提供廣泛的通信服務。在電信網(wǎng)絡(luò)中,網(wǎng)絡(luò)設(shè)備通過物理鏈路相互連接。當某個設(shè)備出現(xiàn)故障時,可能會影響到與之相連的其他設(shè)備,觸發(fā)告警,甚至在嚴重情況下導致服務中斷。隨著網(wǎng)絡(luò)規(guī)模的擴展和復雜度的指數(shù)級增長,網(wǎng)絡(luò)故障的頻率也急劇上升,嚴重影響網(wǎng)絡(luò)質(zhì)量和用戶體驗。因此,如何有效地檢測、診斷和修復網(wǎng)絡(luò)故障,成為確保電信網(wǎng)絡(luò)穩(wěn)定運行的關(guān)鍵。
2、電信網(wǎng)絡(luò)的故障定位通常通過告警來識別。一個網(wǎng)絡(luò)中的故障事件序列由連續(xù)時間下的離散事件組成,常以異常告警的形式出現(xiàn)在通信網(wǎng)絡(luò)場景中?;跉v史故障事件序列,我們可以發(fā)現(xiàn)網(wǎng)絡(luò)告警類型之間的因果關(guān)系,這樣有助于高效準確地定位告警根因,從而提高運維效率并降低運維成本。然而,無線網(wǎng)絡(luò)告警信息會中存在大量的冗余告警,這給根因的準確定位帶來了挑戰(zhàn)。由于移動通信基站內(nèi)各設(shè)備在物理或邏輯上存在聯(lián)系,當一個設(shè)備出現(xiàn)故障時,會產(chǎn)生大量與該故障直接相關(guān)的告警信息。同時與該設(shè)備相關(guān)聯(lián)的其它設(shè)備也可能會受到影響,產(chǎn)生大量與該故障沒有直接關(guān)聯(lián)的冗余告警信息。此外,告警事件序列的數(shù)據(jù)稀疏、信息量少、時間精度低等特點,對現(xiàn)有的根因定位方法提出了諸多挑戰(zhàn)。
技術(shù)實現(xiàn)思路
1、本技術(shù)的主要目的在于提供一種電信網(wǎng)絡(luò)的故障定位方法及系統(tǒng),以實現(xiàn)通過因果關(guān)系圖來展示告警信息,進而快速找到故障根源。
2、為了實現(xiàn)上述目的,本技術(shù)提供了:一種電信網(wǎng)絡(luò)的故障定位方法,所述方法包括:
3、基于事件序列的拓撲結(jié)構(gòu)和時間步驟初始化拓撲時間因果圖;
4、將拓撲域和時域的卷積運算組合成拓撲時域的聯(lián)合卷積運算,并生成拓撲時間因果圖;
5、基于gcn(圖卷積網(wǎng)絡(luò))定義自適應嵌入,將事件類型和物理節(jié)點拓撲的初始因果結(jié)構(gòu)信息注入到事件序列嵌入中;
6、構(gòu)建拓撲時間因果變壓器模型,并捕獲全局依賴性;
7、通過最大化對數(shù)似然函數(shù)優(yōu)化所述拓撲時間因果變壓器模型參數(shù);
8、迭代更新因果權(quán)重,最終保存為事件類型之間的因果圖,并實現(xiàn)故障的定位。
9、進一步,所述將拓撲域和時域的卷積運算組合成拓撲時域的聯(lián)合卷積運算,并生成拓撲時間因果圖的方法包括:
10、令b∈rn×n為加權(quán)因果矩陣,給定事件類型n,n′∈n,bn,n′表征從類型n到類型n′的因果強度,設(shè)(n,v,t)和(n′,v′,t′)是在事件序列e中觀察到的事件,其中計算bn,n′對所述拓撲時間因果圖進行卷積定義,定義公式如下:
11、
12、其中,φ(v,t),(v′,t′)為所述拓撲域的卷積核,為所述時域的卷積核,n,n′為給定事件類型,gv表示網(wǎng)絡(luò)中的拓撲結(jié)構(gòu),t表示時間的維度。
13、進一步,所述基于gcn(圖卷積網(wǎng)絡(luò))定義自適應嵌入,將事件類型和物理節(jié)點拓撲的初始因果結(jié)構(gòu)信息注入到事件序列嵌入中的方法包括:
14、基于gcn構(gòu)建嵌入層,并注入事件觀察的拓撲、因果和時間信息;
15、基于gcn進行自適應編碼,具體的:
16、物理節(jié)點編碼,令表示報警事件的頂點子序列,初始化物理節(jié)點嵌入矩陣dv∈rm×|v|,其中dv的第j列表示頂點vj的m維嵌入,假設(shè)是gcn第k層的輸入,其中此時拓撲圖卷積被定義為將物理節(jié)點的拓撲關(guān)系輸入到節(jié)點嵌入中,此時,拓撲圖卷積為:
17、
18、其中wv為參數(shù)矩陣,矩陣a為固定拓撲圖結(jié)構(gòu),為通過參數(shù)化a動態(tài)學習的圖結(jié)構(gòu);
19、將事件頂點子序列的嵌入修改為:
20、
21、其中是事件頂點子序列的獨熱編碼矩,是頂點vj的一個獨熱編碼,j∈v;
22、事件類型編碼,令表示報警事件的類型子序列,用可訓練的線性投影將n中的事件類型映射到高維特征,事件類型的嵌入矩陣表示為dn∈rm×|n|,其中m是嵌入維數(shù),矩陣dn的第j列對應事件類型nj的m維嵌入,嵌入矩陣dn將離散的事件類型轉(zhuǎn)換為連續(xù)的實值向量;
23、構(gòu)建因果圖卷積,將因果語義信息融合到事件類型嵌入矩陣中,獲得因果級別的事件類型的特征表示,表示gcn第k層的輸入,其中將語義圖卷積定義為捕捉因果圖的模式:
24、
25、其中為可訓練矩陣b的參數(shù)化表示,σ是激活函數(shù),wn是參數(shù)矩陣語義圖卷積被定義為捕捉因果圖的內(nèi)在模式;在訓練穩(wěn)定后,推斷出事件類型最合適的因果圖結(jié)構(gòu),重塑事件類型子序列的嵌入為:
26、
27、其中是事件類型子序列的獨熱編碼矩陣,向量是事件類型nj的一個獨熱編碼,j∈n;
28、時間編碼,令為報警事件的時間子序列,初始化可學習的時間嵌入矩陣dt∈rm×|t|,其中dt的第j列表示時間步長tj的m維嵌入。報警事件的時間子序列et被編碼成m×|t|維矩陣xt′。
29、進一步,所述構(gòu)建拓撲時間因果變壓器模型,并捕獲全局依賴性的方法包括:
30、構(gòu)建拓撲變壓器模型,包括多頭自注意力層(mhsa)和全連接前饋層(ffn),將節(jié)點嵌入特征輸入到拓撲變壓器中,使用多頭自注意力層(mhsa)和全連接前饋層(ffn)按順序整合所有報警時間的信息;
31、構(gòu)建因果變壓器模型,融合所述拓撲變壓器模型的輸出和事件類型嵌入,為每個時間編碼高維特征;
32、構(gòu)建時間變壓器模型,對報警的時間信息進行編碼,捕獲全局上下文關(guān)系。
33、進一步,在所述構(gòu)建拓撲時間因果變壓器模型,并捕獲全局依賴性之后,所述方法還包括:
34、根據(jù)所述拓撲時間因果變壓器模型的輸出構(gòu)建連續(xù)時間條件強度函數(shù);
35、通過連續(xù)時間條件強度函數(shù)構(gòu)建最大化對數(shù)似然函數(shù)。
36、本發(fā)明進一步公開了一種電信網(wǎng)絡(luò)的故障定位系統(tǒng),包括:
37、初始化模塊,用于基于事件序列的拓撲結(jié)構(gòu)和時間步驟初始化拓撲時間因果圖;
38、聯(lián)合運算模塊,用于將拓撲域和時域的卷積運算組合成拓撲時域的聯(lián)合卷積運算,并生成拓撲時間因果圖;
39、信息注入模塊,用于基于gcn(圖卷積網(wǎng)絡(luò))定義自適應嵌入,將事件類型和物理節(jié)點拓撲的初始因果結(jié)構(gòu)信息注入到事件序列嵌入中;
40、模型構(gòu)建模塊,用于構(gòu)建拓撲時間因果變壓器模型,并捕獲全局依賴性;還用于,
41、通過最大化對數(shù)似然函數(shù)優(yōu)化所述拓撲時間因果變壓器模型參數(shù);還用于,
42、迭代更新因果權(quán)重,最終保存為事件類型之間的因果圖,并實現(xiàn)故障的定位。
43、進一步,所述模型構(gòu)建模塊還用于,
44、根據(jù)所述拓撲時間因果變壓器模型的輸出構(gòu)建連續(xù)時間條件強度函數(shù);
45、通過連續(xù)時間條件強度函數(shù)構(gòu)建最大化對數(shù)似然函數(shù)。
46、本發(fā)明進一步公開了一種計算機可讀存儲介質(zhì),所述存儲介質(zhì)存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)上述的電信網(wǎng)絡(luò)的故障定位方法。
47、本發(fā)明進一步公開了一種電子設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述程序時實現(xiàn)上述的電信網(wǎng)絡(luò)的故障定位方法。
48、本發(fā)明進一步公開了一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序在被處理器執(zhí)行時實現(xiàn)上述的電信網(wǎng)絡(luò)的故障定位方法。
49、本發(fā)明提供的一種電信網(wǎng)絡(luò)的故障定位方法及系統(tǒng),與現(xiàn)有技術(shù)相比,其有益效果為:通過將網(wǎng)絡(luò)告警時間抽象為告警事件類型、事件所屬的物理節(jié)點和事件發(fā)生時間表示的事件序列,可以發(fā)現(xiàn)多個告警類型之間的最佳因果關(guān)系結(jié)構(gòu),同時構(gòu)建對應的拓撲時間因果變壓器模型,可以捕獲全局的依賴性,最終保存為事件類型之間的因果圖,進而實現(xiàn)根因定位。