1.一種RRD數(shù)據(jù)庫的檢測的方法,其特征在于,包括:
按照預(yù)定周期輪詢檢測各RRD數(shù)據(jù)庫的更新時間,確定未按時更新的異常RRD數(shù)據(jù)庫,將所述異常RRD數(shù)據(jù)庫記錄到更新異常文件中;
利用異常分析程序分析所述更新異常文件中的異常RRD數(shù)據(jù)庫,確定第一異常RRD數(shù)據(jù)庫的異常原因,并執(zhí)行異常原因?qū)?yīng)的異常處理操作;
確定所述更新異常文件未有異常原因的異常RRD數(shù)據(jù)庫,查找監(jiān)控插件中對應(yīng)異常RRD數(shù)據(jù)庫的日志信息,并根據(jù)所述日志信息進(jìn)行分析,確定第二異常RRD數(shù)據(jù)庫的異常原因,并執(zhí)行異常原因?qū)?yīng)的異常處理操作;
確定所述更新異常文件未有異常原因的異常RRD數(shù)據(jù)庫,并將未有異常原因的異常RRD數(shù)據(jù)庫發(fā)送給用戶。
2.根據(jù)權(quán)利要求1所述的RRD數(shù)據(jù)庫的檢測的方法,其特征在于,按照預(yù)定周期輪詢檢測各RRD數(shù)據(jù)庫的更新時間,確定未按時更新的異常RRD數(shù)據(jù)庫,將所述異常RRD數(shù)據(jù)庫記錄到更新異常文件中,包括:
按照預(yù)定周期輪詢檢測各RRD數(shù)據(jù)庫的更新時間,確定未按時更新的異常RRD數(shù)據(jù)庫的名稱,將所述名稱和對應(yīng)的輪詢時間作為一個事件條目記錄到更新異常文件中。
3.根據(jù)權(quán)利要求2所述的RRD數(shù)據(jù)庫的檢測的方法,其特征在于,利用異常分析程序分析所述更新異常文件中的異常RRD數(shù)據(jù)庫,確定第一異常RRD數(shù)據(jù)庫的異常原因,并執(zhí)行異常原因?qū)?yīng)的異常處理操作,包括:
依次利用異常分析程序分析所述更新異常文件中的事件條目,判斷所述事件條目對應(yīng)的資源是否刪除,若刪除,則刪除所述事件條目對應(yīng)的異常RRD數(shù)據(jù)庫,并刪除所述事件條目;
若未刪除,則判斷所述事件條目對應(yīng)的監(jiān)控插件是否停止工作;若停止工作,則重啟對應(yīng)的監(jiān)控插件,并記錄所述事件條目對應(yīng)的異常原因和異常處理時間;
若未停止工作,則判斷所述事件條目對應(yīng)的資源是否停止監(jiān)控;若停止監(jiān)控,則記錄所述事件條目對應(yīng)的異常原因和異常處理時間;
若未停止監(jiān)控,則判斷所述事件條目對應(yīng)的資源是否斷開連接;若斷開連接,則掃描并連接對應(yīng)的資源,并對該資源進(jìn)行監(jiān)控,記錄所述事件條目對應(yīng)的異常原因和異常處理時間。
4.根據(jù)權(quán)利要求3所述的RRD數(shù)據(jù)庫的檢測的方法,其特征在于,確定所述更新異常文件未有異常原因的異常RRD數(shù)據(jù)庫,查找監(jiān)控插件中對應(yīng)異常RRD數(shù)據(jù)庫的日志信息,并根據(jù)所述日志信息進(jìn)行分析,確定第二異常RRD數(shù)據(jù)庫的異常原因,并執(zhí)行異常原因?qū)?yīng)的異常處理操作,包括:
確定所述更新異常文件中未記錄異常原因的異常RRD數(shù)據(jù)庫;
查找監(jiān)控插件中對應(yīng)異常RRD數(shù)據(jù)庫的日志信息,并根據(jù)所述日志信息進(jìn)行分析,確定第二異常RRD數(shù)據(jù)庫的異常原因,并記錄所述事件條目對應(yīng)的異常原因;
查找異常處理文件中是否存在所述異常原因?qū)?yīng)的解決方法,若存在,則根據(jù)所述解決方法進(jìn)行異常處理操作,并記錄所述事件條目對應(yīng)的異常處理時間。
5.根據(jù)權(quán)利要求4所述的RRD數(shù)據(jù)庫的檢測的方法,其特征在于,確定所述更新異常文件未有異常原因的異常RRD數(shù)據(jù)庫,并將未有異常原因的異常RRD數(shù)據(jù)庫發(fā)送給用戶,包括:
確定所述更新異常文件未記錄異常原因的異常RRD數(shù)據(jù)庫;
將未記錄異常原因的異常RRD數(shù)據(jù)庫對應(yīng)的事件條目作為錯誤信息發(fā)送給用戶;
將已記錄異常原因且未記錄異常處理時間的異常RRD數(shù)據(jù)庫對應(yīng)的事件條目作為告警信息發(fā)送給用戶;
將所述更新異常文件中整個異常原因和異常處理時間作為通知信息發(fā)送給用戶。
6.根據(jù)權(quán)利要求5所述的RRD數(shù)據(jù)庫的檢測的方法,其特征在于,將未有異常原因的異常RRD數(shù)據(jù)庫發(fā)送給用戶之后,還包括:
將用戶確認(rèn)的未有異常原因的異常RRD數(shù)據(jù)庫對應(yīng)的異常原因及異常處理時間記錄到事件條目對應(yīng)的異常原因和異常處理時間中;
將用戶確認(rèn)的未有異常原因的異常RRD數(shù)據(jù)庫對應(yīng)的解決方法記錄到所述異常處理文件中,并注明對應(yīng)的異常原因。
7.一種RRD數(shù)據(jù)庫的檢測的系統(tǒng),其特征在于,包括:
輪詢檢測模塊,用于按照預(yù)定周期輪詢檢測各RRD數(shù)據(jù)庫的更新時間,確定未按時更新的異常RRD數(shù)據(jù)庫,將所述異常RRD數(shù)據(jù)庫記錄到更新異常文件中;
原因分析模塊,用于利用異常分析程序分析所述更新異常文件中的異常RRD數(shù)據(jù)庫,確定第一異常RRD數(shù)據(jù)庫的異常原因,并執(zhí)行異常原因?qū)?yīng)的異常處理操作;
智能修復(fù)模塊,用于確定所述更新異常文件未有異常原因的異常RRD數(shù)據(jù)庫,查找監(jiān)控插件中對應(yīng)異常RRD數(shù)據(jù)庫的日志信息,并根據(jù)所述日志信息進(jìn)行分析,確定第二異常RRD數(shù)據(jù)庫的異常原因,并執(zhí)行異常原因?qū)?yīng)的異常處理操作;
通知告警模塊,用于確定所述更新異常文件未有異常原因的異常RRD數(shù)據(jù)庫,并將未有異常原因的異常RRD數(shù)據(jù)庫發(fā)送給用戶。
8.根據(jù)權(quán)利要求7所述的RRD數(shù)據(jù)庫的檢測的系統(tǒng),其特征在于,所述輪詢檢測模塊具體為按照預(yù)定周期輪詢檢測各RRD數(shù)據(jù)庫的更新時間,確定未按時更新的異常RRD數(shù)據(jù)庫的名稱,將所述名稱和對應(yīng)的輪詢時間作為一個事件條目記錄到更新異常文件中的模塊。
9.根據(jù)權(quán)利要求8所述的RRD數(shù)據(jù)庫的檢測的系統(tǒng),其特征在于,所述通知告警模塊包括:
錯誤信息發(fā)送單元,用于確定所述更新異常文件未記錄異常原因的異常RRD數(shù)據(jù)庫;將未記錄異常原因的異常RRD數(shù)據(jù)庫對應(yīng)的事件條目作為錯誤信息發(fā)送給用戶;
告警信息發(fā)送單元,用于確定所述更新異常文件已記錄異常原因且未記錄異常處理時間的異常RRD數(shù)據(jù)庫作為告警信息發(fā)送給用戶;
通知信息發(fā)送單元,用于將所述更新異常文件中整個異常原因和異常處理時間作為通知信息發(fā)送給用戶。
10.根據(jù)權(quán)利要求9所述的RRD數(shù)據(jù)庫的檢測的系統(tǒng),其特征在于,所述通知告警模塊還包括:
更新單元,用于將用戶確認(rèn)的未有異常原因的異常RRD數(shù)據(jù)庫對應(yīng)的異常原因及異常處理時間記錄到事件條目對應(yīng)的異常原因和異常處理時間中;將用戶確認(rèn)的未有異常原因的異常RRD數(shù)據(jù)庫對應(yīng)的解決方法記錄到所述異常處理文件中,并注明對應(yīng)的異常原因。