1.一種鏈路故障定位方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述訓練結(jié)果包括鏈路故障定位模型;
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述硬件系統(tǒng)中fru的故障概率,確定fru粒度的故障位置,包括:
4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述鏈路故障定位模型通過如下方式構(gòu)建:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述訓練結(jié)果包括鏈路故障定位規(guī)則庫,所述鏈路故障定位規(guī)則庫包括至少一條鏈路故障定位規(guī)則;
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述訓練結(jié)果包括鏈路故障定位模型和鏈路故障定位規(guī)則庫,所述鏈路故障定位規(guī)則庫包括至少一條鏈路故障定位規(guī)則;
7.根據(jù)權(quán)利要求1至6任一項所述的方法,其特征在于,所述方法還包括:
8.根據(jù)權(quán)利要求1至7任一項所述的方法,其特征在于,所述故障監(jiān)測參數(shù)包括溫度、電流、電壓或在位狀態(tài)、插穩(wěn)狀態(tài)中的一種或多種,所述異常事件包括邊帶檢測異常、點燈異常、可靠性可用性可服務性ras異常中的一種或多種,所述ras異常包括芯片、控制器、總線或輸入輸出io外設運行過程中的數(shù)據(jù)訪問異常。
9.根據(jù)權(quán)利要求1至8任一項所述的方法,其特征在于,所述根據(jù)所述故障日志和所述硬件系統(tǒng)的故障監(jiān)測參數(shù)的當前數(shù)據(jù)提取所述硬件系統(tǒng)的故障特征序列,包括:
10.一種鏈路故障定位系統(tǒng),其特征在于,所述系統(tǒng)包括:
11.根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于,所述訓練結(jié)果包括鏈路故障定位模型;
12.根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于,所述鏈路故障定位模塊具體用于:
13.根據(jù)權(quán)利要求11或12所述的系統(tǒng),其特征在于,所述鏈路故障定位系統(tǒng)還包括:
14.根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于,所述訓練結(jié)果包括鏈路故障定位規(guī)則庫,所述鏈路故障定位規(guī)則庫包括至少一條鏈路故障定位規(guī)則;
15.根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于,所述訓練結(jié)果包括鏈路故障定位模型和鏈路故障定位規(guī)則庫,所述鏈路故障定位規(guī)則庫包括至少一條鏈路故障定位規(guī)則;
16.根據(jù)權(quán)利要求10至15任一項所述的系統(tǒng),其特征在于,所述預處理模塊還用于:
17.根據(jù)權(quán)利要求10至16任一項所述的系統(tǒng),其特征在于,所述故障監(jiān)測參數(shù)包括溫度、電流、電壓或在位狀態(tài)、插穩(wěn)狀態(tài)中的一種或多種,所述異常事件包括邊帶檢測異常、點燈異常、可靠性可用性可服務性ras異常中的一種或多種,所述ras異常包括芯片、控制器、總線或輸入輸出io外設運行過程中的數(shù)據(jù)訪問異常。
18.根據(jù)權(quán)利要求10至17任一項所述的系統(tǒng),其特征在于,所述預處理模塊具體用于:
19.一種基板管理控制器,其特征在于,所述基板管理控制器包括處理器和存儲器,所述存儲器中存儲有計算機可讀指令;所述處理器執(zhí)行所述計算機可讀指令,以使得所述基板管理控制器執(zhí)行如權(quán)利要求1至9中任一項所述的方法。
20.一種計算設備集群,其特征在于,所述計算設備集群包括至少一臺計算設備,所述至少一臺計算設備包括至少一個處理器和至少一個存儲器,所述至少一個存儲器中存儲有計算機可讀指令;所述至少一個處理器執(zhí)行所述計算機可讀指令,以使得所述計算設備集群執(zhí)行如權(quán)利要求1至9中任一項所述的方法。
21.一種計算機可讀存儲介質(zhì),其特征在于,包括計算機可讀指令;所述計算機可讀指令用于實現(xiàn)權(quán)利要求1至9任一項所述的方法。