本發(fā)明涉及IT、網(wǎng)絡(luò)管理技術(shù)領(lǐng)域,尤其涉及一種基于NGINX服務(wù)器集群的監(jiān)控系統(tǒng)及方法。
背景技術(shù):
目前,基于NGINX+Keepalived組建高可用WEB被廣泛使用,其中一種系統(tǒng)部署架構(gòu)是通過NGINX的反向代理實(shí)現(xiàn)WEB服務(wù)器的負(fù)載均衡,通過Keepalived保障NGINX的雙機(jī)主備。在實(shí)際運(yùn)作中,需要對網(wǎng)管系統(tǒng)的WEB應(yīng)用進(jìn)行監(jiān)控,及時發(fā)現(xiàn)故障進(jìn)行處理,保障網(wǎng)管系統(tǒng)穩(wěn)步運(yùn)行。當(dāng)前已有方案主要針對單臺應(yīng)用服務(wù)器設(shè)備和單個軟件進(jìn)行監(jiān)控,通過對硬件性能、網(wǎng)絡(luò)和軟件運(yùn)行狀態(tài)等反映業(yè)務(wù)運(yùn)行情況的指標(biāo)采集,并設(shè)定閥值,超過閥值區(qū)間產(chǎn)生告警來判斷單臺服務(wù)器、單個軟件是否正常運(yùn)行。
當(dāng)前技術(shù)主要對單臺應(yīng)用服務(wù)器的CPU、內(nèi)存、磁盤、ping不通,以及單個軟件的運(yùn)行狀態(tài)進(jìn)行告警監(jiān)控。但缺乏對關(guān)聯(lián)應(yīng)用服務(wù)器、關(guān)聯(lián)軟件的聯(lián)合分析。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于,解決現(xiàn)有的NGINX服務(wù)器集群的監(jiān)控方案存在的上述問題,提供了一種基于NGINX服務(wù)器集群的監(jiān)控系統(tǒng)及方法,通過告警關(guān)聯(lián)分析、關(guān)聯(lián)告警影響分析,在WEB應(yīng)用的可用性受影響時生成關(guān)聯(lián)告警,提升用戶感知,便于用戶及時發(fā)現(xiàn)故障進(jìn)行處理。
為了實(shí)現(xiàn)上述目的,一方面,本發(fā)明提供了一種基于NGINX服務(wù)器集群的監(jiān)控方法,該方法包括以下步驟:
采集WEB應(yīng)用配置項(xiàng)的指標(biāo)數(shù)據(jù),WEB應(yīng)用配置項(xiàng)的指標(biāo)數(shù)據(jù)包括性能指標(biāo);根據(jù)WEB應(yīng)用配置項(xiàng)的指標(biāo)數(shù)據(jù)、告警策略以及關(guān)聯(lián)分析規(guī)則,生成WEB應(yīng)用配置項(xiàng)的監(jiān)控信息;接收監(jiān)控信息,監(jiān)控者通過監(jiān)控信息查看WEB應(yīng)用的架構(gòu)拓?fù)涞目傮w情況,以及根據(jù)需求對所述WEB應(yīng)用配置項(xiàng)的運(yùn)行情況進(jìn)行查詢。
另一方面,本發(fā)明提供一種基于NGINX服務(wù)器集群的監(jiān)控系統(tǒng),具體包括:
數(shù)據(jù)采集模塊,用于采集WEB應(yīng)用配置項(xiàng)的指標(biāo)數(shù)據(jù),WEB應(yīng)用配置項(xiàng)的指標(biāo)數(shù)據(jù)包括性能指標(biāo);
數(shù)據(jù)處理模塊,用于根據(jù)WEB應(yīng)用配置項(xiàng)的指標(biāo)數(shù)據(jù)、告警策略以及關(guān)聯(lián)分析規(guī)則,生成WEB應(yīng)用配置項(xiàng)的監(jiān)控信息;
IT網(wǎng)管應(yīng)用:用于接收監(jiān)控信息,監(jiān)控者通過監(jiān)控信息查看WEB應(yīng)用的架構(gòu)拓?fù)涞目傮w情況,以及根據(jù)需求對所述WEB應(yīng)用配置項(xiàng)的運(yùn)行情況進(jìn)行查詢。
進(jìn)一步地,該監(jiān)控系統(tǒng)還包括告警處理模塊,用于根據(jù)WEB應(yīng)用配置項(xiàng)及配置項(xiàng)的關(guān)聯(lián)關(guān)系,制定告警策略以及關(guān)聯(lián)分析規(guī)則,告警策略為將監(jiān)控指標(biāo)數(shù)據(jù)與設(shè)定的閥值區(qū)間進(jìn)行比較,超出閥值時產(chǎn)生警告。
進(jìn)一步地,該系統(tǒng)還包括配置項(xiàng)管理模塊,配置項(xiàng)管理模塊用于定義WEB應(yīng)用配置項(xiàng)及配置項(xiàng)的關(guān)聯(lián)關(guān)系。
進(jìn)一步地,WEB應(yīng)用配置項(xiàng)的監(jiān)控信息包括關(guān)聯(lián)分析的監(jiān)控信息和單個配置項(xiàng)的監(jiān)控信息。
進(jìn)一步地,WEB應(yīng)用配置項(xiàng)包括應(yīng)用服務(wù)器、應(yīng)用軟件和中間件。
本發(fā)明提供的一種基于NGINX服務(wù)器集群的監(jiān)控系統(tǒng)及方法,通過告警關(guān)聯(lián)分析、關(guān)聯(lián)告警影響分析,在WEB應(yīng)用的可用性受影響時生成關(guān)聯(lián)告警,提升用戶感知,便于用戶及時發(fā)現(xiàn)故障進(jìn)行處理。
附圖說明
圖1為本發(fā)明實(shí)施例提供的一種基于NGINX服務(wù)器集群的監(jiān)控系結(jié)構(gòu)示意圖;
圖2為本發(fā)明實(shí)施例提供的一種基于NGINX服務(wù)器集群的監(jiān)控方法流程示意圖。
具體實(shí)施方式
下面通過附圖和實(shí)施例,對本發(fā)明的技術(shù)方案作進(jìn)一步的詳細(xì)描述。
圖1為本發(fā)明實(shí)施例提供的一種基于NGINX服務(wù)器集群的監(jiān)控系結(jié)構(gòu)示意圖。如圖1所示,該系統(tǒng)包括:數(shù)據(jù)采集模塊31、數(shù)據(jù)處理模塊32和IT網(wǎng)管應(yīng)用33。其中,數(shù)據(jù)采集模塊31用于采集WEB應(yīng)用配置項(xiàng)的指標(biāo)數(shù)據(jù),WEB應(yīng)用配置項(xiàng)的指標(biāo)數(shù)據(jù)包括性能指標(biāo)。數(shù)據(jù)處理模塊32根據(jù)WEB應(yīng)用配置項(xiàng)的指標(biāo)數(shù)據(jù)、告警策略以及關(guān)聯(lián)分析規(guī)則,生成WEB應(yīng)用配置項(xiàng)的監(jiān)控信息,WEB應(yīng)用配置項(xiàng)的監(jiān)控信息包括關(guān)聯(lián)分析的監(jiān)控信息和單個配置項(xiàng)的監(jiān)控信息。IT網(wǎng)管應(yīng)用33接收監(jiān)控信息,監(jiān)控者通過監(jiān)控信息查看WEB應(yīng)用的架構(gòu)拓?fù)涞目傮w情況,以及根據(jù)需求對所述WEB應(yīng)用配置項(xiàng)的運(yùn)行情況進(jìn)行查詢。
優(yōu)選地,該系統(tǒng)還包括告警處理模塊34,告警處理模塊34用于根據(jù)WEB應(yīng)用配置項(xiàng)及配置項(xiàng)的關(guān)聯(lián)關(guān)系,制定告警策略以及關(guān)聯(lián)分析規(guī)則,告警策略為將所述監(jiān)控指標(biāo)數(shù)據(jù)與設(shè)定的閥值區(qū)間進(jìn)行比較,超出閥值時產(chǎn)生警告。
優(yōu)選地,該系統(tǒng)還包括配置項(xiàng)管理模塊35,配置項(xiàng)管理模塊35用于定義所述WEB應(yīng)用配置項(xiàng)及配置項(xiàng)的關(guān)聯(lián)關(guān)系。
WEB應(yīng)用配置項(xiàng)的監(jiān)控信息包括關(guān)聯(lián)分析的監(jiān)控信息和單個配置項(xiàng)的監(jiān)控信息。WEB應(yīng)用配置項(xiàng)包括應(yīng)用服務(wù)器、應(yīng)用軟件和中間件。
監(jiān)控者通過配置項(xiàng)管理模塊35定義WEB應(yīng)用配置項(xiàng)及配置項(xiàng)的關(guān)聯(lián)關(guān)系;數(shù)據(jù)處理模塊32通過配置項(xiàng)管理模塊35加載WEB應(yīng)用配置項(xiàng)及配置項(xiàng)的關(guān)聯(lián)關(guān)系。其中,WEB應(yīng)用配置項(xiàng)包括應(yīng)用服務(wù)器、應(yīng)用軟件和中間件。
監(jiān)控者通過告警處理模塊34制定告警策略以及關(guān)聯(lián)分析規(guī)則;數(shù)據(jù)處理模塊32通過告警處理模塊34加載告警策略以及關(guān)聯(lián)分析規(guī)則。其中,告警策略為將監(jiān)控指標(biāo)數(shù)據(jù)與設(shè)定的閥值區(qū)間進(jìn)行比較,超出閥值時產(chǎn)生警告。
關(guān)聯(lián)分析規(guī)則包括:①同個配置項(xiàng)不同事件分析,比如NGINX每秒請求數(shù)突變、NGINX服務(wù)器錯誤率突變;②同類配置項(xiàng)相關(guān)事件分析,比如主備Keepalived進(jìn)程狀態(tài)同時異常;③關(guān)聯(lián)配置項(xiàng)相關(guān)事件分析,比如集群主備切換;④影響業(yè)務(wù)的事件關(guān)聯(lián)分析,比如ping不通VIP地址則表明WEB應(yīng)用不可達(dá),主用Keepalived、備用NGINX進(jìn)程狀態(tài)同時異常時WEB應(yīng)用不可用。
圖2為本發(fā)明實(shí)施例提供的一種基于NGINX服務(wù)器集群的監(jiān)控方法流程示意圖。如圖2所示,該方法包括步驟201-203:
步驟201,采集WEB應(yīng)用配置項(xiàng)的指標(biāo)數(shù)據(jù),WEB應(yīng)用配置項(xiàng)的指標(biāo)數(shù)據(jù)包括性能指標(biāo)。
步驟202,根據(jù)WEB應(yīng)用配置項(xiàng)的指標(biāo)數(shù)據(jù)、告警策略以及關(guān)聯(lián)分析規(guī)則,生成WEB應(yīng)用配置項(xiàng)的監(jiān)控信息。其中,WEB應(yīng)用配置項(xiàng)的監(jiān)控信息包括關(guān)聯(lián)分析的監(jiān)控信息和單個配置項(xiàng)的監(jiān)控信息。
步驟203,接收監(jiān)控信息,監(jiān)控者通過監(jiān)控信息查看WEB應(yīng)用的架構(gòu)拓?fù)涞目傮w情況,以及根據(jù)需求對所述WEB應(yīng)用配置項(xiàng)的運(yùn)行情況進(jìn)行查詢。
優(yōu)選地,步驟201之前,還可以包括步驟101和/或步驟102。
步驟101,監(jiān)控者通過配置項(xiàng)管理模塊35定義WEB應(yīng)用配置項(xiàng)及配置項(xiàng)的關(guān)聯(lián)關(guān)系;數(shù)據(jù)處理模塊32通過配置項(xiàng)管理模塊35加載WEB應(yīng)用配置項(xiàng)及配置項(xiàng)的關(guān)聯(lián)關(guān)系。其中,WEB應(yīng)用配置項(xiàng)包括應(yīng)用服務(wù)器、應(yīng)用軟件和中間件。
步驟102,監(jiān)控者通過告警處理模塊34制定告警策略以及關(guān)聯(lián)分析規(guī)則;數(shù)據(jù)處理模塊32通過告警處理模塊34加載告警策略以及關(guān)聯(lián)分析規(guī)則。其中,告警策略為將監(jiān)控指標(biāo)數(shù)據(jù)與設(shè)定的閥值區(qū)間進(jìn)行比較,超出閥值時產(chǎn)生警告。
關(guān)聯(lián)分析規(guī)則包括:①同個配置項(xiàng)不同事件分析,比如NGINX每秒請求數(shù)突變、NGINX服務(wù)器錯誤率突變;②同類配置項(xiàng)相關(guān)事件分析,比如主備Keepalived進(jìn)程狀態(tài)同時異常;③關(guān)聯(lián)配置項(xiàng)相關(guān)事件分析,比如集群主備切換;④影響業(yè)務(wù)的事件關(guān)聯(lián)分析,比如ping不通VIP地址則表明WEB應(yīng)用不可達(dá),主用Keepalived、備用NGINX進(jìn)程狀態(tài)同時異常時WEB應(yīng)用不可用。
本發(fā)明實(shí)施例提供的一種基于NGINX服務(wù)器集群的監(jiān)控系統(tǒng)及方法,通過告警關(guān)聯(lián)分析、關(guān)聯(lián)告警影響分析,在WEB應(yīng)用的可用性受影響時生成關(guān)聯(lián)告警,提升用戶感知,便于用戶及時發(fā)現(xiàn)故障進(jìn)行處理。
以上的具體實(shí)施方式,對本發(fā)明的目的、技術(shù)方案和有益效果進(jìn)行了進(jìn)一步詳細(xì)說明,所應(yīng)理解的是,以上僅為本發(fā)明的具體實(shí)施方式而已,并不用于限定本發(fā)明的保護(hù)范圍,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。