專利名稱:一種基于Nagios的分布式監(jiān)控系統(tǒng)的設(shè)計方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種計算機(jī)應(yīng)用技術(shù)領(lǐng)域,具體地說是一種基于Nagios的分布式監(jiān)控系統(tǒng)的設(shè)計方法。
背景技術(shù):
隨著云計算時代的到來,網(wǎng)絡(luò)中的資源被集中起來充分利用資源以提供更高的性能,從而出現(xiàn)了大量的數(shù)據(jù)中心,隨之出現(xiàn)的還有大量的服務(wù)器運維工作,然而這給網(wǎng)絡(luò)中成千上萬的服務(wù)器設(shè)備運行狀態(tài)的監(jiān)控及管理帶來了巨大的挑戰(zhàn),面對如此多需要監(jiān)控的設(shè)備以及復(fù)雜的網(wǎng)絡(luò)環(huán)境,對這些大量的設(shè)備進(jìn)行實時準(zhǔn)確的性能監(jiān)控顯得尤為必要。目前業(yè)界采用的普遍方式是通過部署Nagios的分布式監(jiān)控系統(tǒng)完成這個巨大的工作量。具體來說,該系統(tǒng)分為主控節(jié)點和分布式節(jié)點兩部分,首先,各分布式節(jié)點需要配置Nagios監(jiān)控所必需的配置信息(主機(jī)、主機(jī)組、監(jiān)測器、監(jiān)測器閥值、聯(lián)系人等),各分布式節(jié)點監(jiān)控的實時數(shù)據(jù)通過nsca_client進(jìn)程實時的上報給主控節(jié)點,在主控節(jié)點中同樣需要配置Nagios的監(jiān)控所必需的配置信息,而主控節(jié)點的的守護(hù)進(jìn)程nsca則負(fù)責(zé)接收客戶端發(fā)送的數(shù)據(jù),這樣就完成了監(jiān)控數(shù)據(jù)上報的過程。上述過程實現(xiàn)了基于Nagios的分布式監(jiān)控功能,相比與沒有采用分布式監(jiān)控的Nagios系統(tǒng)來說性能得到了極大的提升,但是,經(jīng)過仔細(xì)的研究與分析,這種分布式監(jiān)控方式也有其不足的地方。首先,主控機(jī)需要和各分布式監(jiān)控節(jié)點保持設(shè)備、設(shè)備組、監(jiān)測器、聯(lián)系人、閥值等參數(shù)完全一致才能正確解析分布式節(jié)點上報的數(shù)據(jù),這就要求主控節(jié)點和各個分布式節(jié)點要進(jìn)行數(shù)據(jù)庫的同步工作,在復(fù)雜的網(wǎng)絡(luò)環(huán)境中這種同步操作的代價非常大,同時需要在主控端和分布式節(jié)點分別進(jìn)行激活配置的操作,也導(dǎo)致管理員的進(jìn)行重復(fù)性的工作。其次,各個分布式節(jié)點采集到的數(shù)據(jù)都會實時上報到主控節(jié)點,這就給主控節(jié)點的服務(wù)器帶來巨大的壓力,也是導(dǎo)致該分布式監(jiān)控系統(tǒng)性能的最大瓶頸之一?;谝陨戏治?,我設(shè)計了一種基于Nagios的分布式監(jiān)控系統(tǒng)設(shè)計方法。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有的技術(shù)的不足,提供一種基于Nagios的以共享數(shù)據(jù)庫為特征的分布式監(jiān)控系統(tǒng)設(shè)計方法。本發(fā)明的目的是按以下方式實現(xiàn)的,設(shè)計一種分布式監(jiān)控系統(tǒng),分為主控節(jié)點、分布式節(jié)點及共享數(shù)據(jù)庫三部分,各分布式節(jié)點實現(xiàn)定時采集數(shù)據(jù)并將實時數(shù)據(jù)存入共享數(shù)據(jù)庫,歷史數(shù)據(jù)則以rrd文件的形式存在各個分布式節(jié)點中,主控節(jié)點負(fù)責(zé)添加及查看所監(jiān)控的設(shè)備及監(jiān)測器信息,共享數(shù)據(jù)庫位于主控節(jié)點中,也就是說此共享數(shù)據(jù)庫是主控節(jié)點的本地數(shù)據(jù)庫,從而提高主控節(jié)點查看監(jiān)控狀態(tài)的效率。本發(fā)明是通過以下技術(shù)方案實現(xiàn)的:設(shè)計步驟如下:
(I)提供若干裝有NagiOS的系統(tǒng),隨機(jī)選定其中一個為主控節(jié)點,其余為分布式節(jié)點,分布式節(jié)點需要安裝rrdtool、PNP4Nagios插件; (2)在主控節(jié)點中提供一個本地數(shù)據(jù)庫,同時可被各個分布式節(jié)點共享的共享數(shù)據(jù)
庫;
(3)所有分布式節(jié)點添加監(jiān)控設(shè)備組、設(shè)備、監(jiān)測器以及復(fù)雜的配置信息時均在主控節(jié)點上添加,也即主控節(jié)點上存儲的是系統(tǒng)中所有被監(jiān)控的節(jié)點信息;
(4)主控節(jié)點的數(shù)據(jù)庫表記錄通過添加新的字段來記錄該設(shè)備組、設(shè)備屬于某個分布式節(jié)點;
(5)各分布式節(jié)點建立一個永久的數(shù)據(jù)庫連接讀取共享數(shù)據(jù)庫中屬于本分布式節(jié)點的信息,進(jìn)而生成配置文件,進(jìn)行監(jiān)控;
(6)各個分布式節(jié)點Nagios插件采集到的數(shù)據(jù)直接存在共享數(shù)據(jù)庫中,歷史數(shù)據(jù)則存儲在分布式節(jié)點本地;
(7)主控節(jié)點查看監(jiān)控信息時直接查詢本地數(shù)據(jù)庫即可,查看歷史曲線圖數(shù)據(jù)時,可通過訪問PNP4Nagios提供的URL查看;
本發(fā)明的有益效果是:本發(fā)明提供了一種基于Nagios的以共享數(shù)據(jù)庫為特征的分布式監(jiān)控方法和系統(tǒng)。應(yīng)用在大型及超大型的數(shù)據(jù)中心,可以實現(xiàn)高可靠性低延時的全方位監(jiān)控,有效減少了數(shù)據(jù)處理的代價。因此,本發(fā)明具有以下優(yōu)點:
1、配置操作只需要在主控機(jī)端進(jìn)行,各個分布式節(jié)點無需配置,大大簡化了管理員的操作,降低了因配置不當(dāng)造成監(jiān)控信息錯誤的概率;
2、對于主控節(jié)點來說僅僅是數(shù)據(jù)的存取操作,沒有類似nsca之類的守護(hù)進(jìn)程,提高了查看監(jiān)控狀態(tài)的有效性與實時性,也沒有nsca存在的單點故障隱患;
3、由于不存在數(shù)據(jù)同步的問題,相比傳統(tǒng)的基于nsca的分布式設(shè)計,本系統(tǒng)支持的監(jiān)控節(jié)點更多,同時,采用本系統(tǒng)也會大大減少用于監(jiān)控的主機(jī)數(shù)量,達(dá)到節(jié)約成本的目地;
4、本系統(tǒng)消耗資源少,執(zhí)行效率較高,可靠性強(qiáng),可移植性較強(qiáng)。
圖1是傳統(tǒng)Nagios分布式監(jiān)控系統(tǒng)結(jié)構(gòu)示意 圖2是Nagios分布式監(jiān)控系統(tǒng)結(jié)構(gòu)圖。
具體實施例方式參照說明書附圖對本發(fā)明的方法作以下詳細(xì)地說明。一種基于Nagios的分布式監(jiān)控系統(tǒng)設(shè)計方法,系統(tǒng)包括:主控節(jié)點、分布式節(jié)點及共享數(shù)據(jù)庫三部分,各分布式節(jié)點實現(xiàn)定時采集數(shù)據(jù)并將實時數(shù)據(jù)存入遠(yuǎn)程數(shù)據(jù)庫,歷史數(shù)據(jù)則以rrd文件的形式存在本地數(shù)據(jù)庫中,主控節(jié)點負(fù)責(zé)添加及查看所監(jiān)控的設(shè)備及監(jiān)測器信息,共享數(shù)據(jù)庫位于主控節(jié)點中,即共享數(shù)據(jù)庫是主控節(jié)點的本地數(shù)據(jù)庫,從而提高主控節(jié)點查看監(jiān)控狀態(tài)的效率,
具體設(shè)計步驟為:
1)提供若干裝有Nagios的系統(tǒng),隨機(jī)選定其中一個為主控節(jié)點,其余為分布式節(jié)點,分布式節(jié)點需要安裝rrdtool、PNP4Nagios插件;
2)在主控節(jié)點中提供一個同時可被各個分布式節(jié)點共享的共享數(shù)據(jù)庫;
3)所有分布式節(jié)點在添加監(jiān)控設(shè)備、監(jiān)測器以及配置信息時,均同時在主控節(jié)點上添力口,即主控節(jié)點上存儲的是系統(tǒng)中所有被監(jiān)控的節(jié)點信息;
4)主控節(jié)點的數(shù)據(jù)庫表記錄,是通過添加新的字段來記錄該設(shè)備屬于某個分布式節(jié)
占.5)各分布式節(jié)點建立一個永久的數(shù)據(jù)庫,連接讀取共享數(shù)據(jù)庫中屬于本分布式節(jié)點的信息,進(jìn)而生成配置文件,進(jìn)行監(jiān)控;
6)各個分布式節(jié)點Nagios插件采集到的數(shù)據(jù)直接存在共享數(shù)據(jù)庫中,歷史數(shù)據(jù)則存儲在分布式節(jié)點本地;
7)主控節(jié)點查看監(jiān)控信息時,直接查詢本地數(shù)據(jù)庫,查看歷史曲線圖數(shù)據(jù)時,通過訪問PNP4Nagios提供的URL查看。
實施例下面詳細(xì)描述本發(fā)明內(nèi)容的運行及實施過程,主要分為3個大的步驟:
S1:安裝主控節(jié)點和各個分布式節(jié)點,提供若干裝有Nagios的系統(tǒng),隨機(jī)選定其中一個為主控節(jié)點,其余為分布式節(jié)點,分布式節(jié)點需要安裝rrdtool、PNP4Nagios插件;
S2:創(chuàng)建共享數(shù)據(jù)庫在主控節(jié)點中提供一個本地數(shù)據(jù)庫,此數(shù)據(jù)庫是同時可被各個分布式節(jié)點共享的共享數(shù)據(jù)庫;
S3:添加設(shè)備組、設(shè)備及監(jiān)測器信息,所有分布式節(jié)點添加監(jiān)控設(shè)備組、設(shè)備、監(jiān)測器以及復(fù)雜的配置信息時均在主控節(jié)點上添加,也即主控節(jié)點上存儲的是系統(tǒng)中所有被監(jiān)控的節(jié)點信息;主控節(jié)點的數(shù)據(jù)庫表記錄通過添加新的字段來記錄該設(shè)備組、設(shè)備屬于某個分布式節(jié)點;
S4:各個分布式節(jié)點讀取共享數(shù)據(jù)庫,生成配置文件,各分布式節(jié)點建立一個永久的數(shù)據(jù)庫連接讀取共享數(shù)據(jù)庫中屬于本分布式節(jié)點的信息,進(jìn)而生成配置文件,進(jìn)行監(jiān)控;各個分布式節(jié)點Nagios插件采集到的數(shù)據(jù)直接存在共享數(shù)據(jù)庫中,歷史數(shù)據(jù)則存儲在分布式節(jié)點本地;
S5:主控節(jié)點查看監(jiān)控狀態(tài)主控節(jié)點查看監(jiān)控信息時直接查詢本地數(shù)據(jù)庫即可,查看歷史曲線圖數(shù)據(jù)時,可通過訪問PNP4Nagios提供的URL查看。除說明書所述的技術(shù)特征外,均為本專業(yè)技術(shù)人員的已知技術(shù)。
權(quán)利要求
1.一種基于NagiOS的分布式監(jiān)控系統(tǒng)的設(shè)計方法,其特征在于系統(tǒng)包括:主控節(jié)點、分布式節(jié)點及共享數(shù)據(jù)庫三部分,各分布式節(jié)點實現(xiàn)定時采集數(shù)據(jù)并將實時數(shù)據(jù)存入遠(yuǎn)程數(shù)據(jù)庫,歷史數(shù)據(jù)則以rrd文件的形式存在本地數(shù)據(jù)庫中,主控節(jié)點負(fù)責(zé)添加及查看所監(jiān)控的設(shè)備及監(jiān)測器信息,共享數(shù)據(jù)庫位于主控節(jié)點中,即共享數(shù)據(jù)庫是主控節(jié)點的本地數(shù)據(jù)庫,從而提高主控節(jié)點查看監(jiān)控狀態(tài)的效率, 具體設(shè)計步驟為: (1)提供若干裝有Nagios的系統(tǒng),隨機(jī)選定其中一個為主控節(jié)點,其余為分布式節(jié)點,分布式節(jié)點需要安裝rrdtool、PNP4Nagios插件; (2)在主控節(jié)點中提供一個同時可被各個分布式節(jié)點共享的共享數(shù)據(jù)庫; (3)所有分布式節(jié)點在添加監(jiān)控設(shè)備、監(jiān)測器以及配置信息時,均同時在主控節(jié)點上添力口,即主控節(jié)點上存儲的是系統(tǒng)中所有被監(jiān)控的節(jié)點信息; (4)主控節(jié)點的數(shù)據(jù)庫表記錄,是通過添加新的字段來記錄該設(shè)備屬于某個分布式節(jié)占.(5)各分布式節(jié)點建立一個永久的數(shù)據(jù)庫,連接讀取共享數(shù)據(jù)庫中屬于本分布式節(jié)點的信息,進(jìn)而生成配置文件,進(jìn)行監(jiān)控; (6)各個分布式節(jié)點Nagios插件采集到的數(shù)據(jù)直接存在共享數(shù)據(jù)庫中,歷史數(shù)據(jù)則存儲在分布式節(jié)點本地; (7)主控節(jié)點查看監(jiān)控信息時,直接查詢本地數(shù)據(jù)庫,查看歷史曲線圖數(shù)據(jù)時,通過訪問PNP4Nagios提供的URL查看。
全文摘要
本發(fā)明提供一種基于Nagios的分布式監(jiān)控系統(tǒng)的設(shè)計方法,系統(tǒng)包括主控節(jié)點、分布式節(jié)點及共享數(shù)據(jù)庫三部分,各分布式節(jié)點實現(xiàn)定時采集數(shù)據(jù)并將實時數(shù)據(jù)存入遠(yuǎn)程數(shù)據(jù)庫,歷史數(shù)據(jù)則以rrd文件的形式存在本地數(shù)據(jù)庫中,主控節(jié)點負(fù)責(zé)添加及查看所監(jiān)控的設(shè)備及監(jiān)測器信息,共享數(shù)據(jù)庫位于主控節(jié)點中,即共享數(shù)據(jù)庫是主控節(jié)點的本地數(shù)據(jù)庫,從而提高主控節(jié)點查看監(jiān)控狀態(tài)的效率。
文檔編號H04L12/24GK103117878SQ20131003497
公開日2013年5月22日 申請日期2013年1月30日 優(yōu)先權(quán)日2013年1月30日
發(fā)明者付正全, 劉成平, 李鋒 申請人:浪潮電子信息產(chǎn)業(yè)股份有限公司