基于云計(jì)算的監(jiān)控管理系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了基于云計(jì)算的監(jiān)控管理系統(tǒng),包括數(shù)據(jù)采集單元,其包括:用以實(shí)時(shí)采集大規(guī)模集群服務(wù)器中的節(jié)點(diǎn)數(shù)據(jù)的監(jiān)控客戶端,以及三個(gè)用于存儲(chǔ)所述節(jié)點(diǎn)數(shù)據(jù)的監(jiān)控?cái)?shù)據(jù)庫(kù);以及故障特征庫(kù)、故障處理單元;所述故障特征庫(kù),用于定義并存儲(chǔ)故障特征項(xiàng),監(jiān)控客戶端將實(shí)時(shí)采集到的節(jié)點(diǎn)數(shù)據(jù)與故障特征庫(kù)中的故障特征項(xiàng)作驗(yàn)證,以判斷是否為故障,若是,則發(fā)送故障指令至故障處理單元;所述故障處理單元,用于響應(yīng)由監(jiān)控客戶端發(fā)送的故障指令,并生成故障處理策略,并發(fā)送至大規(guī)模集群服務(wù)器。通過(guò)本發(fā)明,可對(duì)基于云計(jì)算中的大規(guī)模集群服務(wù)器進(jìn)行中各節(jié)點(diǎn)故障自動(dòng)地進(jìn)行數(shù)據(jù)采集、預(yù)警和故障解決,提高了大規(guī)模集群服務(wù)器的穩(wěn)定性和可用性。
【專利說(shuō)明】基于云計(jì)算的監(jiān)控管理系統(tǒng)【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及云計(jì)算【技術(shù)領(lǐng)域】,尤其涉及一種云計(jì)算大規(guī)模集群服務(wù)器進(jìn)行中各數(shù)據(jù)節(jié)點(diǎn)故障進(jìn)行故障數(shù)據(jù)采集、故障監(jiān)控、故障預(yù)警和故障恢復(fù)的一種基于云計(jì)算的監(jiān)控管理系統(tǒng)。
【背景技術(shù)】
[0002]在云計(jì)算系統(tǒng)中,需要對(duì)數(shù)據(jù)節(jié)點(diǎn)的運(yùn)行狀態(tài)進(jìn)行監(jiān)控并在發(fā)生故障時(shí)進(jìn)行故障恢復(fù)操作。
[0003]現(xiàn)有技術(shù)中,通過(guò)在云服務(wù)器中安裝監(jiān)控客戶端,通過(guò)該監(jiān)控客戶端的關(guān)閉或者開(kāi)啟,并通過(guò)多并發(fā)信息采集上報(bào)、消息挖掘和自動(dòng)處理技術(shù)以實(shí)現(xiàn)動(dòng)態(tài)采集并上報(bào)數(shù)據(jù)節(jié)點(diǎn)的運(yùn)行狀態(tài)。當(dāng)發(fā)現(xiàn)云服務(wù)器故障時(shí),在健康的物理服務(wù)器上動(dòng)態(tài)地創(chuàng)建新節(jié)點(diǎn)。但是這種技術(shù)由于對(duì)各個(gè)云節(jié)點(diǎn)的監(jiān)控的廣度和深度比較單一,因此不適用于大規(guī)模集群的云計(jì)算系統(tǒng)中。
[0004]為適應(yīng)大規(guī)模集群的云計(jì)算系統(tǒng)的需求,目前國(guó)內(nèi)外主要云服務(wù)商所提供的云計(jì)算服務(wù)平臺(tái)基本上采用開(kāi)源架構(gòu)。例如,
【發(fā)明者】許廣彬, 郭曉, 張銀濱, 李德才 申請(qǐng)人:無(wú)錫華云數(shù)據(jù)技術(shù)服務(wù)有限公司