亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種鏈路故障定位方法及相關(guān)設備與流程

文檔序號:40393375發(fā)布日期:2024-12-20 12:16閱讀:來源:國知局

技術(shù)特征:

1.一種鏈路故障定位方法,其特征在于,所述方法包括:

2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述訓練結(jié)果包括鏈路故障定位模型;

3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述硬件系統(tǒng)中fru的故障概率,確定fru粒度的故障位置,包括:

4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述鏈路故障定位模型通過如下方式構(gòu)建:

5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述訓練結(jié)果包括鏈路故障定位規(guī)則庫,所述鏈路故障定位規(guī)則庫包括至少一條鏈路故障定位規(guī)則;

6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述訓練結(jié)果包括鏈路故障定位模型和鏈路故障定位規(guī)則庫,所述鏈路故障定位規(guī)則庫包括至少一條鏈路故障定位規(guī)則;

7.根據(jù)權(quán)利要求1至6任一項所述的方法,其特征在于,所述方法還包括:

8.根據(jù)權(quán)利要求1至7任一項所述的方法,其特征在于,所述故障監(jiān)測參數(shù)包括溫度、電流、電壓或在位狀態(tài)、插穩(wěn)狀態(tài)中的一種或多種,所述異常事件包括邊帶檢測異常、點燈異常、可靠性可用性可服務性ras異常中的一種或多種,所述ras異常包括芯片、控制器、總線或輸入輸出io外設運行過程中的數(shù)據(jù)訪問異常。

9.根據(jù)權(quán)利要求1至8任一項所述的方法,其特征在于,所述根據(jù)所述故障日志和所述硬件系統(tǒng)的故障監(jiān)測參數(shù)的當前數(shù)據(jù)提取所述硬件系統(tǒng)的故障特征序列,包括:

10.一種鏈路故障定位系統(tǒng),其特征在于,所述系統(tǒng)包括:

11.根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于,所述訓練結(jié)果包括鏈路故障定位模型;

12.根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于,所述鏈路故障定位模塊具體用于:

13.根據(jù)權(quán)利要求11或12所述的系統(tǒng),其特征在于,所述鏈路故障定位系統(tǒng)還包括:

14.根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于,所述訓練結(jié)果包括鏈路故障定位規(guī)則庫,所述鏈路故障定位規(guī)則庫包括至少一條鏈路故障定位規(guī)則;

15.根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于,所述訓練結(jié)果包括鏈路故障定位模型和鏈路故障定位規(guī)則庫,所述鏈路故障定位規(guī)則庫包括至少一條鏈路故障定位規(guī)則;

16.根據(jù)權(quán)利要求10至15任一項所述的系統(tǒng),其特征在于,所述預處理模塊還用于:

17.根據(jù)權(quán)利要求10至16任一項所述的系統(tǒng),其特征在于,所述故障監(jiān)測參數(shù)包括溫度、電流、電壓或在位狀態(tài)、插穩(wěn)狀態(tài)中的一種或多種,所述異常事件包括邊帶檢測異常、點燈異常、可靠性可用性可服務性ras異常中的一種或多種,所述ras異常包括芯片、控制器、總線或輸入輸出io外設運行過程中的數(shù)據(jù)訪問異常。

18.根據(jù)權(quán)利要求10至17任一項所述的系統(tǒng),其特征在于,所述預處理模塊具體用于:

19.一種基板管理控制器,其特征在于,所述基板管理控制器包括處理器和存儲器,所述存儲器中存儲有計算機可讀指令;所述處理器執(zhí)行所述計算機可讀指令,以使得所述基板管理控制器執(zhí)行如權(quán)利要求1至9中任一項所述的方法。

20.一種計算設備集群,其特征在于,所述計算設備集群包括至少一臺計算設備,所述至少一臺計算設備包括至少一個處理器和至少一個存儲器,所述至少一個存儲器中存儲有計算機可讀指令;所述至少一個處理器執(zhí)行所述計算機可讀指令,以使得所述計算設備集群執(zhí)行如權(quán)利要求1至9中任一項所述的方法。

21.一種計算機可讀存儲介質(zhì),其特征在于,包括計算機可讀指令;所述計算機可讀指令用于實現(xiàn)權(quán)利要求1至9任一項所述的方法。


技術(shù)總結(jié)
一種鏈路故障定位方法,包括:獲取待檢測的計算系統(tǒng)中硬件系統(tǒng)的故障日志,故障日志記錄硬件系統(tǒng)的故障監(jiān)測參數(shù)的歷史數(shù)據(jù)、異常事件和所述硬件系統(tǒng)中現(xiàn)場可替換單元FRU的更換記錄,以及獲取硬件系統(tǒng)的故障監(jiān)測參數(shù)的當前數(shù)據(jù),然后根據(jù)故障日志和硬件系統(tǒng)的故障監(jiān)測參數(shù)的當前數(shù)據(jù)提取硬件系統(tǒng)的故障特征序列,根據(jù)硬件系統(tǒng)的故障特征序列預測FRU粒度的故障位置。該方法通過從故障發(fā)生時的故障日志以及故障監(jiān)測參數(shù)的當前數(shù)據(jù)中提取故障特征序列,推理出當前故障的故障特征序列對應的FRU,實現(xiàn)FRU級別的鏈路故障定位,提高了定位準確率。而且,該方法不局限于PCIe鏈路故障的定位,能夠?qū)崿F(xiàn)通用的鏈路故障定位,提高鏈路故障定位的覆蓋率。

技術(shù)研發(fā)人員:沈振凱,鄧校成,吳東民,周超超
受保護的技術(shù)使用者:華為技術(shù)有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2024/12/19
當前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1