本技術(shù)涉及數(shù)據(jù)處理的,尤其是涉及一種數(shù)據(jù)中心的故障排查方法、系統(tǒng)、終端及存儲介質(zhì)。
背景技術(shù):
1、數(shù)據(jù)中心是用于集中存儲、管理和分發(fā)數(shù)據(jù)的設(shè)施,通常包括大量的服務(wù)器、存儲設(shè)備和網(wǎng)絡(luò)設(shè)備。它們在現(xiàn)代信息技術(shù)架構(gòu)中扮演著至關(guān)重要的角色,廣泛應(yīng)用于云計算、網(wǎng)站托管、企業(yè)數(shù)據(jù)管理等領(lǐng)域。
2、相關(guān)技術(shù)中,對于數(shù)據(jù)中心的監(jiān)控技術(shù)也是越發(fā)成熟,通過設(shè)備使用數(shù)據(jù)、工況數(shù)據(jù)、主機(jī)及配件性能數(shù)據(jù)、配件更換數(shù)據(jù)等設(shè)備與服務(wù)數(shù)據(jù),進(jìn)行設(shè)備故障、服務(wù)、配件需求的預(yù)測,為主動服務(wù)提供技術(shù)支撐,延長設(shè)備使用壽命,降低故障率。
3、但是由于目前大多都是對于設(shè)備內(nèi)部數(shù)據(jù)進(jìn)行監(jiān)控,無法對設(shè)備外部進(jìn)行監(jiān)控,因此若是由于設(shè)備外部因素導(dǎo)致數(shù)據(jù)中心異常,則很容易出現(xiàn)發(fā)現(xiàn)不及時的情況,從而無法及時對故障處進(jìn)行檢修。
技術(shù)實現(xiàn)思路
1、為了提高對數(shù)據(jù)中心監(jiān)控的全面性以及及時定位故障處,本技術(shù)提供一種數(shù)據(jù)中心的故障排查方法、系統(tǒng)、終端及存儲介質(zhì)。
2、第一方面,本技術(shù)提供一種數(shù)據(jù)中心的故障排查方法,采用如下技術(shù)方案:
3、一種數(shù)據(jù)中心的故障排查方法,包括:
4、根據(jù)數(shù)據(jù)中心內(nèi)設(shè)備的數(shù)量及位置,構(gòu)建故障巡視軌跡;
5、控制巡視攝像頭按照所述故障巡視軌跡對數(shù)據(jù)中心進(jìn)行周期性巡視;
6、獲取巡視過程中所述巡視攝像頭采集的巡視視頻流;
7、根據(jù)所述巡視視頻流,判斷數(shù)據(jù)中心是否存在異常;
8、若是,則定位異常位置,并發(fā)送報警信息。
9、通過采用上述技術(shù)方案,除了對設(shè)備內(nèi)運(yùn)行數(shù)據(jù)的監(jiān)控,還可以通過構(gòu)建故障巡視軌跡,從而控制巡視攝像頭按照故障巡視軌跡進(jìn)行周期性巡視,從而根據(jù)獲獲取的巡視視頻流,判斷數(shù)據(jù)中心是否存在異常,進(jìn)而定位異常位置,并發(fā)送報警信息,以實現(xiàn)對設(shè)備外部的監(jiān)控,從而提高數(shù)據(jù)中心監(jiān)控的全面性以及能夠及時定位故障處。
10、可選的,所述發(fā)送報警信息之后,包括:
11、調(diào)取預(yù)建立的故障影響因素表,所述故障影響因素表能夠?qū)崟r更新;
12、從所述故障影響因素表中查找與所述異常位置關(guān)聯(lián)的設(shè)備信息,所述設(shè)備信息包括設(shè)備所處環(huán)境數(shù)據(jù)、運(yùn)行時間及維護(hù)時間;
13、根據(jù)所述設(shè)備信息,分析故障原因。
14、通過采用上述技術(shù)方案,建立故障影響因素表,故障影響因素表內(nèi)的環(huán)境數(shù)據(jù)、運(yùn)行時間實時更新,維護(hù)人員對設(shè)備維護(hù)后,維護(hù)時間進(jìn)行更新;在設(shè)備故障后,可以通過設(shè)備當(dāng)前關(guān)聯(lián)的環(huán)境數(shù)據(jù)、運(yùn)行時間及維護(hù)時間分析故障原因,從而提高故障原因分析效率。
15、可選的,所述故障排查方法還包括:
16、根據(jù)所述故障影響因素表,獲取故障頻發(fā)處的重點位置;
17、獲取巡視攝像頭的實時位置;
18、獲取所述實時位置與所述巡視攝像頭當(dāng)前軌跡前進(jìn)方向上的所述重點位置之間的區(qū)域間距;
19、判斷所述區(qū)域間距是否在間距閾值內(nèi);
20、若是,則降低所述巡視攝像頭的移動速度;
21、在所述巡視攝像頭經(jīng)過所述重點位置,且所述區(qū)域間距脫離所述間距閾值后,恢復(fù)所述巡視攝像頭的移動速度。
22、通過采用上述技術(shù)方案,當(dāng)巡視攝像頭靠近重點位置后,說明此時巡視攝像頭正在向故障頻發(fā)處移動,因此,可以通過降低巡視攝像頭的移動速度,從而間接延長巡視攝像頭采集故障頻發(fā)處巡視視頻流的時長,從而提高故障排查的準(zhǔn)確性。
23、可選的,所述降低所述巡視攝像頭的移動速度的步驟包括:
24、構(gòu)建速度變化模型;其中,v表示巡視攝像頭的移動速度,d表示區(qū)域間距,d0表示間距閾值,k表示正常數(shù),表征速度的最大可能值,a表示正常數(shù),表征模型曲線陡峭的程度;
25、根據(jù)所述速度變化模型,降低所述移動速度。
26、可選的,所述獲取故障頻發(fā)處的重點位置的步驟包括:
27、通過所述故障影響因素表,確定故障設(shè)備關(guān)聯(lián)的故障次數(shù);
28、篩選所述故障次數(shù)大于預(yù)設(shè)次數(shù)閾值的設(shè)備,篩選出的設(shè)備對應(yīng)所在位置即為重點位置。
29、通過采用上述技術(shù)方案,故障發(fā)生次數(shù)大于次數(shù)閾值的設(shè)備所在位置即為故障頻發(fā)處的重點位置。
30、可選的,所述獲取故障頻發(fā)處的重點位置之后的步驟包括:
31、確定所述重點位置關(guān)聯(lián)的故障排查等級;
32、根據(jù)所述故障排查等級,賦予所述重點位置對應(yīng)的間距閾值;所述故障排查等級越高,對應(yīng)的所述間距閾值越大。
33、通過采用上述技術(shù)方案,可以根據(jù)故障排查等級,自適應(yīng)調(diào)整對應(yīng)的間距閾值,從而進(jìn)一步提高故障排查的準(zhǔn)確性。
34、可選的,所述根據(jù)所述巡視視頻流,判斷數(shù)據(jù)中心是否存在異常的步驟包括:
35、將所述巡視視頻流逐幀轉(zhuǎn)換成巡視圖片;
36、剔除多余相似性高的巡視圖片,以生成巡視圖片集;
37、將所述巡視圖片集輸入至預(yù)先訓(xùn)練完成的神經(jīng)網(wǎng)絡(luò)模型中,以獲得判斷結(jié)果;
38、根據(jù)所述判斷結(jié)果,確定所述數(shù)據(jù)中心是否異常。
39、通過采用上述技術(shù)方案,剔除多余相似性高的巡視圖片,以實現(xiàn)圖片數(shù)據(jù)噪聲清洗,從而可以降低對圖片判斷的干擾,從而提高判斷效率。
40、第二方面,本技術(shù)提供了一種數(shù)據(jù)中心的故障排查系統(tǒng),采用如下技術(shù)方案:
41、一種數(shù)據(jù)中心的故障排查系統(tǒng),包括:
42、軌跡構(gòu)建模塊,用于根據(jù)數(shù)據(jù)中心內(nèi)設(shè)備的數(shù)據(jù)及位置,構(gòu)建故障巡視軌跡;
43、控制模塊,用于控制巡視攝像頭按照所述故障巡視軌跡對設(shè)備進(jìn)行周期性巡視;
44、視頻獲取模塊,用于獲取巡視過程中所述巡視攝像頭采集的巡視視頻流;
45、判斷模塊,用于根據(jù)所述巡視視頻流,判斷數(shù)據(jù)中心是否存在異常;
46、異常定位報警模塊,用于在數(shù)據(jù)中心異常時,定位異常位置,并發(fā)送報警信息。
47、通過采用上述技術(shù)方案,除了對設(shè)備內(nèi)運(yùn)行數(shù)據(jù)的監(jiān)控,還可以通過構(gòu)建故障巡視軌跡,從而控制巡視攝像頭按照故障巡視軌跡進(jìn)行周期性巡視,從而根據(jù)獲獲取的巡視視頻流,判斷數(shù)據(jù)中心是否存在異常,進(jìn)而定位異常位置,并發(fā)送報警信息,以實現(xiàn)對設(shè)備外部的監(jiān)控,從而提高數(shù)據(jù)中心監(jiān)控的全面性以及能夠及時定位故障處。
48、第三方面,本技術(shù)提供了一種終端,采用如下技術(shù)方案:
49、一種終端,包括:
50、存儲器,存儲有數(shù)據(jù)中心的故障排查質(zhì)程序;
51、處理器,用于執(zhí)行所述存儲器上存儲的程序,以實現(xiàn)上述數(shù)據(jù)中心的故障排查方法的步驟。
52、第四方面,本技術(shù)提供了一種計算機(jī)可讀存儲介質(zhì),采用如下技術(shù)方案:
53、一種計算機(jī)可讀存儲介質(zhì),存儲有能夠被處理器加載并執(zhí)行上述數(shù)據(jù)中心的故障排查方法的計算機(jī)程序。
54、綜上所述,本技術(shù)存在至少以下有益效果:
55、1、構(gòu)建故障巡視軌跡,并控制巡視攝像頭按照故障巡視軌跡對設(shè)備進(jìn)行周期性巡視的目的是,除了對設(shè)備內(nèi)運(yùn)行數(shù)據(jù)的監(jiān)控,還可以根據(jù)獲獲取的巡視視頻流,判斷數(shù)據(jù)中心是否存在異常,進(jìn)而定位異常位置,并發(fā)送報警信息,以實現(xiàn)對設(shè)備外部的監(jiān)控,從而提高數(shù)據(jù)中心監(jiān)控的全面性以及能夠及時定位故障處。
56、2、獲取巡視攝像頭的實時位置與巡視攝像頭當(dāng)前軌跡前進(jìn)方向上的故障頻發(fā)處的重點位置之間的區(qū)域間距,并判斷區(qū)域間距是否在間距閾值內(nèi)的目的是,當(dāng)巡視攝像頭靠近重點位置后,說明此時巡視攝像頭正在向故障頻發(fā)處移動,因此,可以通過降低巡視攝像頭的移動速度,從而間接延長巡視攝像頭采集故障頻發(fā)處巡視視頻流的時長,從而提高故障排查的準(zhǔn)確性。
57、3、確定重點位置關(guān)聯(lián)的故障排查等級,并根據(jù)故障排查等級,賦予重點位置對應(yīng)的間距閾值的目的是,自適應(yīng)調(diào)整故障頻發(fā)處對應(yīng)的間距閾值,從而進(jìn)一步提高故障排查的準(zhǔn)確性。