本發(fā)明涉及分布式監(jiān)控領(lǐng)域,特別涉及一種數(shù)據(jù)中心監(jiān)控方法及系統(tǒng)。
背景技術(shù):
隨著互聯(lián)網(wǎng)的飛速發(fā)展,大規(guī)模的數(shù)據(jù)中心成為現(xiàn)代社會(huì)發(fā)展的需要。這就為數(shù)據(jù)中心的監(jiān)控管理帶來巨大挑戰(zhàn),一個(gè)擁有幾萬資源的數(shù)據(jù)中心的監(jiān)控難度已非常大,更何況目前的發(fā)展趨勢(shì)下幾十萬資源、甚至幾百萬資源的數(shù)據(jù)中心正在逐步產(chǎn)生。例如,一個(gè)具有十萬資源的數(shù)據(jù)中心的監(jiān)控,用傳統(tǒng)的分布式監(jiān)控方式已經(jīng)無法滿足,即使傳統(tǒng)的分布式監(jiān)控方式能夠滿足的幾千資源規(guī)模的監(jiān)控,也無法實(shí)現(xiàn)對(duì)監(jiān)控所耗費(fèi)資源的充分高效利用,往往造成某些分布式受控端資源空閑、而另一些分布式受控端資源耗費(fèi)貽盡,也進(jìn)一步影響監(jiān)控?cái)?shù)據(jù)的實(shí)時(shí)性,即監(jiān)控的性能受到影響,使整個(gè)分布式監(jiān)控?cái)?shù)據(jù)采集系統(tǒng)無法真正達(dá)到最理想的效果。
以上挑戰(zhàn)為大規(guī)模數(shù)據(jù)中心的監(jiān)控?cái)?shù)據(jù)采集、監(jiān)控?cái)?shù)據(jù)采集時(shí)的性能壓力均帶了極大的局限性,嚴(yán)重影響大規(guī)模數(shù)據(jù)中心監(jiān)控的發(fā)展,因此,如何使各分布服務(wù)器的監(jiān)控采集壓力合理均衡,有效解決監(jiān)控?cái)?shù)據(jù)相互分離、各分布服務(wù)器各自運(yùn)維等問題,是本領(lǐng)域技術(shù)人員需要解決的技術(shù)問題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是提供一種數(shù)據(jù)中心監(jiān)控系統(tǒng)及方法,大大提升大規(guī)模數(shù)據(jù)中心監(jiān)控時(shí)的可監(jiān)控容量,保證各分布服務(wù)器的統(tǒng)一調(diào)配和管理,避免各分布服務(wù)器各自為政、監(jiān)控壓力分配不均、監(jiān)控?cái)?shù)據(jù)相互分離不能統(tǒng)一分析的問題。
為解決上述技術(shù)問題,本發(fā)明提供一種數(shù)據(jù)中心監(jiān)控系統(tǒng),包括:主控端服務(wù)器、各分布服務(wù)器及數(shù)據(jù)庫服務(wù)器;其中,
所述主控端服務(wù)器包括:
監(jiān)控任務(wù)分發(fā)管理模塊,用于根據(jù)選擇的監(jiān)控任務(wù)分發(fā)策略將監(jiān)控任務(wù)的分發(fā)到對(duì)應(yīng)的分布服務(wù)器;
調(diào)度管理模塊,用于將分發(fā)的監(jiān)控任務(wù)調(diào)配到對(duì)應(yīng)的分布服務(wù)器的監(jiān)控采集器,并對(duì)接收到監(jiān)控?cái)?shù)據(jù)進(jìn)行處理;
分布服務(wù)器管理模塊,用于通過心跳連接的方式對(duì)各分布服務(wù)器進(jìn)行監(jiān)管;
所述分布服務(wù)器包括:
監(jiān)控采集器,用于將接收到的監(jiān)控任務(wù)加入輪詢隊(duì)列,按照所述輪詢隊(duì)列的順序依次啟動(dòng)對(duì)應(yīng)監(jiān)控任務(wù)的監(jiān)測(cè)進(jìn)程進(jìn)行數(shù)據(jù)采集,并將采集到的數(shù)據(jù)進(jìn)行分析處理和告警狀態(tài)判斷后得到監(jiān)控?cái)?shù)據(jù),將所述監(jiān)控?cái)?shù)據(jù)發(fā)送到所述數(shù)據(jù)庫服務(wù)器及所述調(diào)度管理模塊;
所述數(shù)據(jù)庫服務(wù)器,用于接收監(jiān)控采集器發(fā)送的數(shù)據(jù)。
其中,所述監(jiān)控任務(wù)分發(fā)管理模塊包括:
分發(fā)策略單元,用于選擇監(jiān)控任務(wù)分發(fā)策略;
可監(jiān)控?cái)?shù)量配置表單元,用于根據(jù)所述監(jiān)控任務(wù)分發(fā)策略配置可監(jiān)控?cái)?shù)量配置表,根據(jù)所述可監(jiān)控?cái)?shù)量配置表將監(jiān)控任務(wù)的分發(fā)到對(duì)應(yīng)的分布服務(wù)器。
其中,所述監(jiān)控任務(wù)分發(fā)策略包括按照機(jī)房位置區(qū)域分發(fā)、自適應(yīng)智能分發(fā)、按照被監(jiān)控資源類型分發(fā)、按照被監(jiān)控資源的關(guān)鍵性分發(fā)。
其中,所述可監(jiān)控?cái)?shù)量配置表單元具體為根據(jù)所述監(jiān)控任務(wù)分發(fā)策略及各分布服務(wù)器的配置進(jìn)行可監(jiān)控?cái)?shù)量配置表的配置,并根據(jù)所述可監(jiān)控?cái)?shù)量配置表將監(jiān)控任務(wù)的分發(fā)到對(duì)應(yīng)的分布服務(wù)器。
其中,所述分布服務(wù)器管理模塊包括:
連接單元,用于將所述主控端服務(wù)器與各所述分布服務(wù)器建立心跳連接,通過心跳連接確認(rèn)各所述分布服務(wù)器是否正常運(yùn)行,并根據(jù)確認(rèn)結(jié)果對(duì)分布服務(wù)器執(zhí)行對(duì)應(yīng)操作;
管理單元,用于根據(jù)可監(jiān)控?cái)?shù)量配置表控制各分布服務(wù)器的增加、刪除、可監(jiān)控?cái)?shù)量修改、及對(duì)分布服務(wù)器進(jìn)行開啟、關(guān)閉和重新啟動(dòng)操作。
其中,所述調(diào)度管理模塊具體用于將分發(fā)的監(jiān)控任務(wù)調(diào)配到對(duì)應(yīng)的分布服務(wù)器的監(jiān)控采集器,并對(duì)接收到監(jiān)控?cái)?shù)據(jù)進(jìn)行分析,根據(jù)分析結(jié)果進(jìn)行對(duì)應(yīng)的通知發(fā)送和故障處理。
本發(fā)明還提供一種數(shù)據(jù)中心監(jiān)控方法,包括:
主控端服務(wù)器根據(jù)選擇的監(jiān)控任務(wù)分發(fā)策略將分發(fā)的監(jiān)控任務(wù)調(diào)配到對(duì)應(yīng)的分布服務(wù)器的監(jiān)控采集器;其中,所述主控端服務(wù)器與各分布服務(wù)器通過心跳連接的方式進(jìn)行連接;
各分布服務(wù)器將接收到的監(jiān)控任務(wù)加入輪詢隊(duì)列,按照所述輪詢隊(duì)列的順序依次啟動(dòng)對(duì)應(yīng)監(jiān)控任務(wù)的監(jiān)測(cè)進(jìn)程進(jìn)行數(shù)據(jù)采集,并將采集到的數(shù)據(jù)進(jìn)行分析處理和告警狀態(tài)判斷后得到監(jiān)控?cái)?shù)據(jù),將所述監(jiān)控?cái)?shù)據(jù)發(fā)送到數(shù)據(jù)庫服務(wù)器及所述主控端服務(wù)器;
所述主控端服務(wù)器對(duì)接收到監(jiān)控?cái)?shù)據(jù)進(jìn)行處理。
其中,根據(jù)選擇的監(jiān)控任務(wù)分發(fā)策略將分發(fā)的監(jiān)控任務(wù)調(diào)配到對(duì)應(yīng)的分布服務(wù)器的監(jiān)控采集器,包括:
根據(jù)選擇的所述監(jiān)控任務(wù)分發(fā)策略配置可監(jiān)控?cái)?shù)量配置表,根據(jù)所述可監(jiān)控?cái)?shù)量配置表將監(jiān)控任務(wù)的分發(fā)到對(duì)應(yīng)的分布服務(wù)器。
其中,該方法還包括:
主控端服務(wù)器根據(jù)可監(jiān)控?cái)?shù)量配置表控制各分布服務(wù)器的增加、刪除、可監(jiān)控?cái)?shù)量修改、及對(duì)分布服務(wù)器進(jìn)行開啟、關(guān)閉和重新啟動(dòng)操作。
本發(fā)明所提供的數(shù)據(jù)中心監(jiān)控系統(tǒng),考慮分布式監(jiān)控?cái)?shù)據(jù)采集可降低主控端性能壓力的特點(diǎn),采用一個(gè)主控端服務(wù)器加多個(gè)分布服務(wù)器,以及各分布服務(wù)器端監(jiān)控采集器的可伸縮性,結(jié)合單數(shù)據(jù)源的監(jiān)控?cái)?shù)據(jù)庫設(shè)計(jì),實(shí)現(xiàn)主控端服務(wù)器中的監(jiān)控任務(wù)分發(fā)管理模塊根據(jù)不同分發(fā)策略進(jìn)行監(jiān)控任務(wù)的分發(fā),分布服務(wù)器管理模塊通過心跳連接的方式進(jìn)行各分布服務(wù)器的監(jiān)管,調(diào)度管理模塊將分發(fā)的監(jiān)控任務(wù)調(diào)配到各分布服務(wù)器端的監(jiān)測(cè)采集器,監(jiān)控采集器依據(jù)下發(fā)和監(jiān)控任務(wù)規(guī)模自動(dòng)進(jìn)行動(dòng)態(tài)伸縮,在接收到監(jiān)控任務(wù)后將其加入輪詢隊(duì)列,排到隊(duì)時(shí)啟動(dòng)監(jiān)測(cè)進(jìn)程進(jìn)行數(shù)據(jù)采集,采集到的數(shù)據(jù)經(jīng)過分析處理和告警狀態(tài)判斷后的監(jiān)控?cái)?shù)據(jù)儲(chǔ)存到數(shù)據(jù)庫服務(wù)器中,并同時(shí)反饋到調(diào)度管理模塊,供其處理,從而大大提升了大規(guī)模數(shù)據(jù)中心監(jiān)控時(shí)的可監(jiān)控容量,保證了各分布服務(wù)器的統(tǒng)一調(diào)配和管理,避免了各分布服務(wù)器各自為政、監(jiān)控壓力分配不均、監(jiān)控?cái)?shù)據(jù)相互分離不能統(tǒng)一分析的問題;本發(fā)明還提供數(shù)據(jù)中心監(jiān)控方法,具有上述有益效果,在此不再贅述。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例所提供的數(shù)據(jù)中心監(jiān)控系統(tǒng)的結(jié)構(gòu)框圖;
圖2為本發(fā)明實(shí)施例所提供的監(jiān)控任務(wù)分發(fā)管理模塊的分發(fā)過程示意圖;
圖3為本發(fā)明實(shí)施例所提供的監(jiān)控采集器工作過程的示意圖;
圖4為本發(fā)明實(shí)施例所提供的數(shù)據(jù)中心監(jiān)控系統(tǒng)的監(jiān)控原理示意圖。
具體實(shí)施方式
本發(fā)明的核心是提供一種數(shù)據(jù)中心監(jiān)控系統(tǒng)及方法,大大提升大規(guī)模數(shù)據(jù)中心監(jiān)控時(shí)的可監(jiān)控容量,保證各分布服務(wù)器的統(tǒng)一調(diào)配和管理,避免各分布服務(wù)器各自為政、監(jiān)控壓力分配不均、監(jiān)控?cái)?shù)據(jù)相互分離不能統(tǒng)一分析的問題。
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
請(qǐng)參考圖1,圖1為本發(fā)明實(shí)施例所提供的數(shù)據(jù)中心監(jiān)控系統(tǒng)的結(jié)構(gòu)框圖;該系統(tǒng)可以包括:主控端服務(wù)器100、各分布服務(wù)器200及數(shù)據(jù)庫服務(wù)器300;其中,
所述主控端服務(wù)器100包括:
監(jiān)控任務(wù)分發(fā)管理模塊110,用于根據(jù)選擇的監(jiān)控任務(wù)分發(fā)策略將監(jiān)控任務(wù)的分發(fā)到對(duì)應(yīng)的分布服務(wù)器;
具體的,監(jiān)控任務(wù)分發(fā)管理模塊110采用基于策略分發(fā)的思路,設(shè)計(jì)豐富的監(jiān)控任務(wù)分發(fā)策略,這里的監(jiān)控任務(wù)分發(fā)策略可以按照機(jī)房位置區(qū)域分發(fā)、自適應(yīng)智能分發(fā)、按照被監(jiān)控資源類型分發(fā)、按照被監(jiān)控資源的關(guān)鍵性分發(fā)。這里并不對(duì)具體的策略內(nèi)容進(jìn)行限定,只要用戶有適合其分布式系統(tǒng)的分發(fā)策略即可。請(qǐng)參考圖2以5000各被監(jiān)控資源為例說明上述分發(fā)過程。具體的,監(jiān)控任務(wù)分發(fā)管理模塊包括:
分發(fā)策略單元,用于選擇監(jiān)控任務(wù)分發(fā)策略;
可監(jiān)控?cái)?shù)量配置表單元,用于根據(jù)所述監(jiān)控任務(wù)分發(fā)策略配置可監(jiān)控?cái)?shù)量配置表,根據(jù)所述可監(jiān)控?cái)?shù)量配置表將監(jiān)控任務(wù)的分發(fā)到對(duì)應(yīng)的分布服務(wù)器。
具體的可監(jiān)控?cái)?shù)量配置表單元在進(jìn)行配置可監(jiān)控?cái)?shù)量配置表時(shí)還需要考慮各分布服務(wù)器的配置例如cpu、內(nèi)存、硬盤等。
即監(jiān)控任務(wù)分發(fā)管理模塊110的工作過程為通過維護(hù)分布服務(wù)器的可監(jiān)控?cái)?shù)量配置表,實(shí)現(xiàn)監(jiān)控任務(wù)的靈活按需分發(fā)。其中,各分布服務(wù)器的可監(jiān)控?cái)?shù)量是結(jié)合各分布服務(wù)器的配置(如cpu、內(nèi)存、硬盤等)和實(shí)際監(jiān)控需求經(jīng)過分析后確定;監(jiān)控任務(wù)分發(fā)策略可以按所在機(jī)房位置分發(fā)、自適應(yīng)智能分發(fā)、按被監(jiān)控資源類型分發(fā)、按被監(jiān)控資源的關(guān)鍵性分發(fā)等,通過不同的策略分發(fā)達(dá)到各分布服務(wù)器上的監(jiān)控任務(wù)、監(jiān)測(cè)壓力合理分布的目的。
這里的監(jiān)控任務(wù)分發(fā)管理模塊110可以將可監(jiān)控?cái)?shù)量配置表分別發(fā)送到調(diào)度管理模塊120、分布服務(wù)器管理模塊130及數(shù)據(jù)庫服務(wù)器300;分別使它們完成監(jiān)控任務(wù)的調(diào)配,對(duì)分布服務(wù)器的管理,使接收到數(shù)據(jù)按照可監(jiān)控?cái)?shù)量配置表存儲(chǔ)到對(duì)應(yīng)位置。
調(diào)度管理模塊120,用于將分發(fā)的監(jiān)控任務(wù)調(diào)配到對(duì)應(yīng)的分布服務(wù)器的監(jiān)控采集器,并對(duì)接收到監(jiān)控?cái)?shù)據(jù)進(jìn)行處理;處理過程即對(duì)接收到監(jiān)控?cái)?shù)據(jù)進(jìn)行分析,根據(jù)分析結(jié)果進(jìn)行對(duì)應(yīng)的通知發(fā)送和故障處理。
具體的,調(diào)度管理模塊120統(tǒng)一對(duì)各分布服務(wù)器端監(jiān)測(cè)采集器進(jìn)行調(diào)配,將各自分發(fā)的監(jiān)控任務(wù)下發(fā)到監(jiān)測(cè)采集器,并完成各分布服務(wù)器端監(jiān)測(cè)采集器反饋的監(jiān)控?cái)?shù)據(jù)統(tǒng)一接收和統(tǒng)一處理,繼續(xù)完成后續(xù)的通知發(fā)送或故障處理等。
分布服務(wù)器管理模塊130,用于通過心跳連接的方式對(duì)各分布服務(wù)器及所述數(shù)據(jù)庫服務(wù)器進(jìn)行監(jiān)管;
具體的,所述分布服務(wù)器管理模塊包括:
連接單元,用于將所述主控端服務(wù)器與各所述分布服務(wù)器建立心跳連接,通過心跳連接確認(rèn)各所述分布服務(wù)器是否正常運(yùn)行,并根據(jù)確認(rèn)結(jié)果對(duì)分布服務(wù)器執(zhí)行對(duì)應(yīng)操作;
管理單元,用于根據(jù)可監(jiān)控?cái)?shù)量配置表控制各分布服務(wù)器的增加、刪除、可監(jiān)控?cái)?shù)量修改、及對(duì)分布服務(wù)器進(jìn)行開啟、關(guān)閉和重新啟動(dòng)操作。
即完成全方位的分布服務(wù)器管理,使主控端服務(wù)器與各分布服務(wù)器在某種意義上融為一體,共同完成大規(guī)模數(shù)據(jù)中心監(jiān)控的統(tǒng)一調(diào)度和分布采集。
所述分布服務(wù)器200包括:
監(jiān)控采集器210,用于將接收到的監(jiān)控任務(wù)加入輪詢隊(duì)列,按照所述輪詢隊(duì)列的順序依次啟動(dòng)對(duì)應(yīng)監(jiān)控任務(wù)的監(jiān)測(cè)進(jìn)程進(jìn)行數(shù)據(jù)采集,并將采集到的數(shù)據(jù)進(jìn)行分析處理和告警狀態(tài)判斷后得到監(jiān)控?cái)?shù)據(jù),將所述監(jiān)控?cái)?shù)據(jù)發(fā)送到所述數(shù)據(jù)庫服務(wù)器及所述調(diào)度管理模塊;
具體的,將監(jiān)控任務(wù)加入輪詢隊(duì)列,當(dāng)排隊(duì)完成時(shí)啟動(dòng)監(jiān)測(cè)進(jìn)程進(jìn)行數(shù)據(jù)采集,并將收集到的數(shù)據(jù)進(jìn)行分析處理和告警狀態(tài)判斷后得到監(jiān)控?cái)?shù)據(jù),最后,在將監(jiān)控?cái)?shù)據(jù)推送到監(jiān)控?cái)?shù)據(jù)庫儲(chǔ)存的同時(shí),也反饋到調(diào)度管理模塊。為了更加完整的了解分布式系統(tǒng)的狀態(tài),還可以將采集到的數(shù)據(jù)一起發(fā)送到數(shù)據(jù)庫服務(wù)器中的監(jiān)控?cái)?shù)據(jù)庫。請(qǐng)參考圖3,
所述數(shù)據(jù)庫服務(wù)器300,用于接收監(jiān)控采集器發(fā)送的數(shù)據(jù),可以將接收到的數(shù)據(jù)存儲(chǔ)于數(shù)據(jù)庫服務(wù)器中的監(jiān)控?cái)?shù)據(jù)庫中。
下面以具體例子說明上述過程,請(qǐng)參考圖4,以5000個(gè)各類資源的大規(guī)模數(shù)據(jù)中心監(jiān)控為例,采用1臺(tái)主控端服務(wù)器、3臺(tái)分布服務(wù)器和1臺(tái)數(shù)據(jù)庫服務(wù)器的方式來描述這一設(shè)計(jì)方法的實(shí)現(xiàn)過程。
監(jiān)控任務(wù)分發(fā)管理模塊根據(jù)自適應(yīng)智能分發(fā)策略,將5000個(gè)資源的監(jiān)控任務(wù)通過調(diào)度管理模塊分配到3個(gè)分布服務(wù)器上運(yùn)行的共7個(gè)監(jiān)測(cè)采集器上,分別為分布服務(wù)器1啟用2個(gè)監(jiān)測(cè)采集器負(fù)責(zé)1500個(gè)、分布服務(wù)器2啟用2個(gè)監(jiān)測(cè)采集器負(fù)責(zé)1500個(gè)、分布服務(wù)器3啟用3個(gè)監(jiān)測(cè)采集器承擔(dān)2000個(gè),這些監(jiān)控任務(wù)首先由調(diào)度管理模塊統(tǒng)一對(duì)各分布服務(wù)器端監(jiān)測(cè)采集器進(jìn)行調(diào)配,將各自分發(fā)的監(jiān)控任務(wù)下發(fā)到監(jiān)測(cè)采集器;分布服務(wù)器的監(jiān)控采集器將監(jiān)控任務(wù)加入輪詢隊(duì)列,當(dāng)排隊(duì)完成時(shí)啟動(dòng)監(jiān)測(cè)進(jìn)程進(jìn)行數(shù)據(jù)采集,并將收集到的數(shù)據(jù)進(jìn)行分析處理和告警狀態(tài)判斷后得到監(jiān)控?cái)?shù)據(jù),再將監(jiān)控?cái)?shù)據(jù)推送到監(jiān)控?cái)?shù)據(jù)庫儲(chǔ)存的同時(shí),也反饋到調(diào)度管理模塊,繼續(xù)完成后續(xù)的通知發(fā)送或故障處理等。分布服務(wù)器管理模塊將主控端服務(wù)器與各分布服務(wù)器建立心跳連接,以及對(duì)分布服務(wù)器的控制,完成全方位的分布服務(wù)器管理,使主控端服務(wù)器與各分布服務(wù)器在某種意義上融為一體,共同完成大規(guī)模數(shù)據(jù)中心監(jiān)控的統(tǒng)一調(diào)度和分布采集。
基于上述技術(shù)方案,本發(fā)明實(shí)施例提的數(shù)據(jù)中心監(jiān)控系統(tǒng),該系統(tǒng)大大提升大規(guī)模數(shù)據(jù)中心監(jiān)控時(shí)的可監(jiān)控容量,保證各分布服務(wù)器的統(tǒng)一調(diào)配和管理,避免各分布服務(wù)器各自為政、監(jiān)控壓力分配不均、監(jiān)控?cái)?shù)據(jù)相互分離不能統(tǒng)一分析的問題。
下面對(duì)本發(fā)明實(shí)施例提供的數(shù)據(jù)中心監(jiān)控方法進(jìn)行介紹,下文描述的數(shù)據(jù)中心監(jiān)控方法與上文描述的數(shù)據(jù)中心監(jiān)控系統(tǒng)可相互對(duì)應(yīng)參照。
本發(fā)明還提供一種數(shù)據(jù)中心監(jiān)控方法,包括:
主控端服務(wù)器根據(jù)選擇的監(jiān)控任務(wù)分發(fā)策略將分發(fā)的監(jiān)控任務(wù)調(diào)配到對(duì)應(yīng)的分布服務(wù)器的監(jiān)控采集器;其中,所述主控端服務(wù)器與各分布服務(wù)器通過心跳連接的方式進(jìn)行連接;
各分布服務(wù)器將接收到的監(jiān)控任務(wù)加入輪詢隊(duì)列,按照所述輪詢隊(duì)列的順序依次啟動(dòng)對(duì)應(yīng)監(jiān)控任務(wù)的監(jiān)測(cè)進(jìn)程進(jìn)行數(shù)據(jù)采集,并將采集到的數(shù)據(jù)進(jìn)行分析處理和告警狀態(tài)判斷后得到監(jiān)控?cái)?shù)據(jù),將所述監(jiān)控?cái)?shù)據(jù)發(fā)送到數(shù)據(jù)庫服務(wù)器及所述主控端服務(wù)器;
所述主控端服務(wù)器對(duì)接收到監(jiān)控?cái)?shù)據(jù)進(jìn)行處理。
基于上述實(shí)施例,根據(jù)選擇的監(jiān)控任務(wù)分發(fā)策略將分發(fā)的監(jiān)控任務(wù)調(diào)配到對(duì)應(yīng)的分布服務(wù)器的監(jiān)控采集器,包括:
根據(jù)選擇的所述監(jiān)控任務(wù)分發(fā)策略配置可監(jiān)控?cái)?shù)量配置表,根據(jù)所述可監(jiān)控?cái)?shù)量配置表將監(jiān)控任務(wù)的分發(fā)到對(duì)應(yīng)的分布服務(wù)器。
基于上述實(shí)施例,該方法還包括:
主控端服務(wù)器根據(jù)可監(jiān)控?cái)?shù)量配置表控制各分布服務(wù)器的增加、刪除、可監(jiān)控?cái)?shù)量修改、及對(duì)分布服務(wù)器進(jìn)行開啟、關(guān)閉和重新啟動(dòng)操作。
說明書中各個(gè)實(shí)施例采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似部分互相參見即可。對(duì)于實(shí)施例公開的裝置而言,由于其與實(shí)施例公開的方法相對(duì)應(yīng),所以描述的比較簡(jiǎn)單,相關(guān)之處參見方法部分說明即可。
以上對(duì)本發(fā)明所提供的數(shù)據(jù)中心監(jiān)控系統(tǒng)及方法進(jìn)行了詳細(xì)介紹。本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想。應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以對(duì)本發(fā)明進(jìn)行若干改進(jìn)和修飾,這些改進(jìn)和修飾也落入本發(fā)明權(quán)利要求的保護(hù)范圍內(nèi)。