本發(fā)明涉及存儲,具體涉及故障修復(fù)方法、裝置、計(jì)算機(jī)設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、隨著信息技術(shù)的快速發(fā)展和網(wǎng)絡(luò)規(guī)模的不斷擴(kuò)大,網(wǎng)絡(luò)設(shè)備的穩(wěn)定運(yùn)行對于整個網(wǎng)絡(luò)的穩(wěn)定性起著至關(guān)重要的作用。然而,在實(shí)際的網(wǎng)絡(luò)環(huán)境中,網(wǎng)路設(shè)備可能會出現(xiàn)各種故障,例如,物理連接問題、設(shè)備老化、配置錯誤或外部干擾等。這些故障如果不及時發(fā)現(xiàn)和處理,可能會導(dǎo)致網(wǎng)絡(luò)服務(wù)中斷,嚴(yán)重影響企業(yè)和個人的正常業(yè)務(wù)活動。
2、當(dāng)前的網(wǎng)絡(luò)監(jiān)控主要依賴于簡單網(wǎng)絡(luò)管理協(xié)議(simple?network?managementprotocol,snmp)。snmp主要可以監(jiān)測網(wǎng)絡(luò)鏈路狀態(tài)和基本性能指標(biāo),在檢測到網(wǎng)絡(luò)鏈路狀態(tài)異常,或性能指標(biāo)異常時,通知技術(shù)人員,由技術(shù)人員進(jìn)行分析和故障排除。
3、這樣,故障修復(fù)操作的效率較低。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明提供了一種故障修復(fù)方法、裝置、計(jì)算機(jī)設(shè)備、存儲介質(zhì)及程序產(chǎn)品,以解決故障修復(fù)操作效率較低的問題。
2、第一方面,本發(fā)明提供了一種故障修復(fù)方法,所述方法應(yīng)用于網(wǎng)絡(luò)故障檢測系統(tǒng),所述網(wǎng)絡(luò)故障檢測系統(tǒng)中包括服務(wù)器和至少一個網(wǎng)絡(luò)設(shè)備,所述方法由所述服務(wù)器執(zhí)行,所述方法包括:
3、當(dāng)獲取到檢測指令時,根據(jù)所述檢測指令,對每一個所述網(wǎng)絡(luò)設(shè)備執(zhí)行故障檢測操作,其中,所述檢測指令中包括目標(biāo)故障類型;
4、接收所述故障檢測操作的過程中任一網(wǎng)絡(luò)設(shè)備生成的目標(biāo)日志,其中,所述目標(biāo)日志中包括目標(biāo)事件類型、目標(biāo)網(wǎng)絡(luò)層級和目標(biāo)通信地址;
5、確定所述目標(biāo)事件類型是否為所述目標(biāo)故障類型;
6、當(dāng)確定所述目標(biāo)事件類型為所述目標(biāo)故障類型時,獲取與所述目標(biāo)故障類型對應(yīng)的目標(biāo)修復(fù)策略表;
7、根據(jù)所述目標(biāo)網(wǎng)絡(luò)層級和所述目標(biāo)修復(fù)策略表,對與所述目標(biāo)通信地址對應(yīng)的目標(biāo)網(wǎng)絡(luò)設(shè)備執(zhí)行修復(fù)操作。
8、本發(fā)明提供的一種故障修復(fù)方法,具有如下優(yōu)點(diǎn):
9、服務(wù)器可以在獲取到檢測指令時,根據(jù)檢測指令中攜帶的目標(biāo)故障類型執(zhí)行故障檢測操作,并收集到故障檢測操的過程中的目標(biāo)日志,在確定目標(biāo)日志中的目標(biāo)事件類型為目標(biāo)故障類型時,通過與目標(biāo)故障類型對應(yīng)的目標(biāo)修復(fù)策略表和目標(biāo)網(wǎng)絡(luò)層級,對目標(biāo)網(wǎng)絡(luò)設(shè)備執(zhí)行修復(fù)操作。在整個檢測過程中,服務(wù)器可以自動執(zhí)行故障修復(fù)操作,無需技術(shù)人員進(jìn)行復(fù)雜地分析和故障排除操作,可以提高故障修復(fù)操作的效率。
10、在一種可選的實(shí)施方式中,所述目標(biāo)修復(fù)策略表中包括至少一種網(wǎng)絡(luò)層級、與每一種所述網(wǎng)絡(luò)層級對應(yīng)的至少一種修復(fù)策略,以及與每一種所述修復(fù)策略對應(yīng)的權(quán)重指標(biāo)值;
11、所述根據(jù)所述目標(biāo)網(wǎng)絡(luò)層級和所述目標(biāo)修復(fù)策略表,對與所述目標(biāo)通信地址對應(yīng)的目標(biāo)網(wǎng)絡(luò)設(shè)備執(zhí)行修復(fù)操作,包括:
12、根據(jù)所述目標(biāo)網(wǎng)絡(luò)層級,在所述目標(biāo)修復(fù)策略表中確定與所述目標(biāo)網(wǎng)絡(luò)層級對應(yīng)的至少一種目標(biāo)修復(fù)策略;
13、根據(jù)每一種所述目標(biāo)修復(fù)策略對應(yīng)的權(quán)重指標(biāo)值,在至少一種所述目標(biāo)修復(fù)策略中選取權(quán)重指標(biāo)值最大的第一修復(fù)策略;
14、根據(jù)所述第一修復(fù)策略,獲取與所述第一修復(fù)策略對應(yīng)的第一修復(fù)腳本;
15、根據(jù)所述第一修復(fù)腳本,對所述目標(biāo)網(wǎng)絡(luò)設(shè)備執(zhí)行第一修復(fù)操作。
16、具體地,由于對于不同的網(wǎng)絡(luò)層級來說,盡管遇到同一種故障,其對應(yīng)的原因可能存在不同,因此,在目標(biāo)修復(fù)策略表中對每一種網(wǎng)絡(luò)層級都設(shè)置有相應(yīng)的修復(fù)策略,可以滿足不同的網(wǎng)絡(luò)層級對故障修復(fù)的需求,更加全面。并且,權(quán)重指標(biāo)值指示了每一種目標(biāo)修復(fù)策略的修復(fù)成功概率,因此,在首次修復(fù)時,使用權(quán)重指標(biāo)值最大的第一修復(fù)策略,可以使得修復(fù)成功的概率較大,也即可以提高修復(fù)操作的效率。
17、在一種可選的實(shí)施方式中,所述根據(jù)所述第一修復(fù)腳本,對所述目標(biāo)網(wǎng)絡(luò)設(shè)備執(zhí)行第一修復(fù)操作之后,所述方法還包括:
18、獲取完成所述第一修復(fù)操作的目標(biāo)時間點(diǎn);
19、獲取所述目標(biāo)時間點(diǎn)之后所述目標(biāo)網(wǎng)絡(luò)設(shè)備生成的至少一條日志;
20、確定至少一條所述日志中是否存在所述目標(biāo)故障類型的日志;
21、當(dāng)確定至少一條所述日志中不存在所述目標(biāo)故障類型的日志時,確定所述目標(biāo)網(wǎng)絡(luò)設(shè)備中與所述目標(biāo)故障類型對應(yīng)的故障已被修復(fù);
22、或者,
23、當(dāng)確定至少一條所述日志中存在所述目標(biāo)故障類型的日志時,根據(jù)每一種所述修復(fù)策略對應(yīng)的權(quán)重指標(biāo)值,在至少一種所述目標(biāo)修復(fù)策略中選取第二修復(fù)策略,其中,所述第二修復(fù)策略的權(quán)重指標(biāo)值小于所述第一修復(fù)策略的權(quán)重指標(biāo)值,且大于所述目標(biāo)修復(fù)策略表中除所述第一修復(fù)策略之外的其他修復(fù)策略的權(quán)重指標(biāo)值;
24、將所述第二修復(fù)策略的權(quán)重指標(biāo)值調(diào)整為大于所述第一修復(fù)策略的權(quán)重指標(biāo)值的數(shù)值,使得所述第二修復(fù)策略的權(quán)重指標(biāo)值為至少一種所述修復(fù)策略中權(quán)重指標(biāo)值最大的調(diào)整策略;
25、根據(jù)所述第二修復(fù)策略,獲取與所述第二修復(fù)策略對應(yīng)的第二修復(fù)腳本;
26、根據(jù)所述第二修復(fù)腳本,對所述目標(biāo)網(wǎng)絡(luò)設(shè)備執(zhí)行第二修復(fù)操作。
27、具體地,在完成修復(fù)操作后,可以先根據(jù)日志獲知修復(fù)操作的結(jié)果,并在修復(fù)失敗的情況下,采用備選的其他修復(fù)策略,可以更進(jìn)一步地提高修復(fù)成功的概率,也即提高修復(fù)操作的效率。
28、在一種可選的實(shí)施方式中,所述方法還包括:
29、獲取與所述目標(biāo)故障類型和所述目標(biāo)網(wǎng)絡(luò)層級均對應(yīng)的歷史修復(fù)數(shù)據(jù),其中,所述歷史修復(fù)數(shù)據(jù)中包括至少一種修復(fù)策略,以及與每一種所述修復(fù)策略的成功修復(fù)次數(shù);
30、確定第三修復(fù)策略是否為所述歷史修復(fù)數(shù)據(jù)包括的至少一種所述修復(fù)策略中的一種修復(fù)策略,其中,所述第三修復(fù)策略為對所述目標(biāo)網(wǎng)絡(luò)設(shè)備修復(fù)成功的策略;
31、當(dāng)確定所述第三修復(fù)策略為所述歷史修復(fù)數(shù)據(jù)包括的至少一種所述修復(fù)策略中的一種修復(fù)策略時,對所述第三修復(fù)策略對應(yīng)的成功修復(fù)次數(shù)進(jìn)行更新;
32、根據(jù)所述歷史修復(fù)數(shù)據(jù)中每一種所述修復(fù)策略對應(yīng)的成功修復(fù)次數(shù),確定所述歷史修復(fù)數(shù)據(jù)中每一種所述修復(fù)策略的權(quán)重指標(biāo)值;
33、根據(jù)所述歷史修復(fù)數(shù)據(jù)中每一種所述修復(fù)策略的權(quán)重指標(biāo)值,對所述目標(biāo)修復(fù)策略表進(jìn)行更新。
34、具體地,在每次修復(fù)成功后,通過對目標(biāo)修復(fù)策略表進(jìn)行更新,可以使得下次在對目標(biāo)網(wǎng)絡(luò)層級出現(xiàn)目標(biāo)故障類型的故障進(jìn)行處理時,可以根據(jù)最新的修復(fù)情況選取修復(fù)策略。這樣,根據(jù)實(shí)時的修復(fù)情況對目標(biāo)修復(fù)策略表進(jìn)行實(shí)時調(diào)整,可以使得后續(xù)在發(fā)生同樣的故障情況下,使用成功概率最高的修復(fù)策略執(zhí)行修復(fù)策略,可以提高修復(fù)效率。
35、在一種可選的實(shí)施方式中,當(dāng)確定所述第三修復(fù)策略并非為所述歷史修復(fù)數(shù)據(jù)包括的至少一種所述修復(fù)策略中的任一種修復(fù)策略時,所述方法還包括:
36、將所述第三修復(fù)策略添加到所述歷史修復(fù)數(shù)據(jù)中,并將所述第三修復(fù)策略對應(yīng)的成功修復(fù)次數(shù)設(shè)置為一。
37、具體地,由于技術(shù)人員可能會根據(jù)實(shí)際的情況,增加新的修復(fù)策略,相應(yīng)地,技術(shù)人員可以將新的修復(fù)策略添加到歷史修復(fù)數(shù)據(jù)中,便于后續(xù)進(jìn)行統(tǒng)計(jì),為其調(diào)整權(quán)重指標(biāo)值,使得目標(biāo)修復(fù)策略表與實(shí)際情況更加符合,更加準(zhǔn)確。
38、在一種可選的實(shí)施方式中,所述方法還包括:
39、當(dāng)檢測到目標(biāo)觸發(fā)指令時,獲取每一個所述網(wǎng)絡(luò)設(shè)備的當(dāng)前配置信息和預(yù)設(shè)配置信息;
40、確定所述目標(biāo)網(wǎng)絡(luò)設(shè)備的當(dāng)前配置信息和預(yù)設(shè)配置信息是否一致;
41、當(dāng)確定所述目標(biāo)網(wǎng)絡(luò)設(shè)備的當(dāng)前配置信息和預(yù)設(shè)配置信息不一致時,根據(jù)所述目標(biāo)網(wǎng)絡(luò)設(shè)備的通信地址,生成告警通知。
42、具體地,通過及時對網(wǎng)絡(luò)設(shè)備的當(dāng)前配置信息和預(yù)設(shè)配置信息進(jìn)行比對,可以發(fā)現(xiàn)網(wǎng)絡(luò)設(shè)備的配置信息是否被錯誤修改,便于技術(shù)人員及時修正,避免更嚴(yán)重的故障發(fā)生。
43、在一種可選的實(shí)施方式中,當(dāng)所述目標(biāo)修復(fù)策略表為執(zhí)行與所述目標(biāo)故障類型對應(yīng)的初次檢測操作時使用的初始修復(fù)策略表、所述目標(biāo)故障類型為環(huán)路故障、且所述目標(biāo)網(wǎng)絡(luò)層級為接入層時,所述第一修復(fù)策略為重啟端口,所述第二修復(fù)策略為關(guān)閉端口。
44、具體地,由于環(huán)路故障很有可能是接入層自身導(dǎo)致的,因此,在接入層發(fā)生環(huán)路故障時,可以對目標(biāo)網(wǎng)絡(luò)設(shè)備進(jìn)行重啟端口,以便在重啟端口后確定相應(yīng)問題是否解決,如果不能解決,則可以關(guān)閉端口,可以避免更嚴(yán)重的故障發(fā)生。
45、第二方面,本發(fā)明提供了一種故障修復(fù)裝置,所述裝置應(yīng)用于網(wǎng)絡(luò)故障檢測系統(tǒng),所述網(wǎng)絡(luò)故障檢測系統(tǒng)中包括服務(wù)器和至少一個網(wǎng)絡(luò)設(shè)備,所述裝置包括:
46、檢測模塊,用于當(dāng)獲取到檢測指令時,根據(jù)所述檢測指令,對每一個所述網(wǎng)絡(luò)設(shè)備執(zhí)行故障檢測操作,其中,所述檢測指令中包括目標(biāo)故障類型;
47、接收模塊,用于接收所述故障檢測操作的過程中任一網(wǎng)絡(luò)設(shè)備生成的目標(biāo)日志,其中,所述目標(biāo)日志中包括目標(biāo)事件類型、目標(biāo)網(wǎng)絡(luò)層級和目標(biāo)通信地址;
48、確定模塊,用于確定所述目標(biāo)事件類型是否為所述目標(biāo)故障類型;
49、獲取模塊,用于當(dāng)確定所述目標(biāo)事件類型為所述目標(biāo)故障類型時,獲取與所述目標(biāo)故障類型對應(yīng)的目標(biāo)修復(fù)策略表;
50、修復(fù)模塊,用于根據(jù)所述目標(biāo)網(wǎng)絡(luò)層級和所述目標(biāo)修復(fù)策略表,對與所述目標(biāo)通信地址對應(yīng)的目標(biāo)網(wǎng)絡(luò)設(shè)備執(zhí)行修復(fù)操作。
51、第三方面,本發(fā)明提供了一種計(jì)算機(jī)設(shè)備,包括:存儲器和處理器,存儲器和處理器之間互相通信連接,存儲器中存儲有計(jì)算機(jī)指令,處理器通過執(zhí)行計(jì)算機(jī)指令,從而執(zhí)行上述第一方面或其對應(yīng)的任一實(shí)施方式的故障修復(fù)方法。
52、第四方面,本發(fā)明提供了一種計(jì)算機(jī)可讀存儲介質(zhì),該計(jì)算機(jī)可讀存儲介質(zhì)上存儲有計(jì)算機(jī)指令,計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行上述第一方面或其對應(yīng)的任一實(shí)施方式的故障修復(fù)方法。
53、第五方面,本發(fā)明提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)指令,計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行上述第一方面或其對應(yīng)的任一實(shí)施方式的故障修復(fù)方法。