本發(fā)明涉及信息技術(shù)領(lǐng)域,尤其涉及一種監(jiān)控系統(tǒng)及監(jiān)控方法。
背景技術(shù):
隨著信息技術(shù)的發(fā)展,有一臺或多臺服務(wù)器及一個或多個數(shù)據(jù)庫組成的信息系統(tǒng)。為了保證信息系統(tǒng)的安全,通常會設(shè)置保證該信息系統(tǒng)安全的監(jiān)控系統(tǒng)。該監(jiān)控系統(tǒng)一般監(jiān)控信息系統(tǒng)的運行狀態(tài),一旦監(jiān)測到異常的指標(biāo),就給管理人員發(fā)送郵件或短息。
現(xiàn)在發(fā)現(xiàn),一方面監(jiān)控系統(tǒng)一旦發(fā)現(xiàn)異常就給監(jiān)管人員的郵箱或電子設(shè)備發(fā)送郵件或短信,會導(dǎo)致管理人員頻繁的收到短信和/或郵件;這樣就導(dǎo)致了對管理人員的信息騷擾。另一方面由于這些短信和/或郵件大多的時候提示的小問題。長此以往管理人員收到預(yù)警短信和/或郵件之后,就習(xí)慣性的認(rèn)為是不著急的小預(yù)警,從而不重視。這樣的話,管理人員就有很高的概率漏掉嚴(yán)重的預(yù)警短信和/或郵件,導(dǎo)致監(jiān)控系統(tǒng)不能正常的發(fā)揮監(jiān)控作用。
技術(shù)實現(xiàn)要素:
有鑒于此,本發(fā)明實施例提一種監(jiān)控系統(tǒng)及監(jiān)控方法,以解決上述問題。
本發(fā)明實施例的技術(shù)方案是這樣實現(xiàn)的:
本發(fā)明實施例第一方面提供一種監(jiān)控系統(tǒng),包括:
后臺管理子系統(tǒng),用于配置監(jiān)控對象的監(jiān)控規(guī)則及預(yù)警規(guī)則;其中,所述預(yù)警規(guī)則至少包括:預(yù)警級別以及與預(yù)警級別對應(yīng)的預(yù)警方式;
數(shù)據(jù)采集子系統(tǒng),用于根據(jù)所述監(jiān)控規(guī)則對所述監(jiān)控對象進行數(shù)據(jù)采集,以獲取監(jiān)控數(shù)據(jù);
預(yù)警子系統(tǒng),用于根據(jù)所述預(yù)警規(guī)則,確定所述監(jiān)控數(shù)據(jù)是否觸發(fā)了預(yù)警及所述預(yù)警的預(yù)警參數(shù),并當(dāng)所述監(jiān)控數(shù)據(jù)觸發(fā)了預(yù)警時,采用與所述預(yù)警級別對應(yīng)的預(yù)警方式發(fā)送預(yù)警信息,其中,所述預(yù)警參數(shù)包括所述預(yù)警級別及所述預(yù)警方式。
基于上述方案,所述預(yù)警規(guī)則還包括:預(yù)警調(diào)整條件;
所述預(yù)警子系統(tǒng),還用于根據(jù)所述預(yù)警規(guī)則及所述監(jiān)控數(shù)據(jù),確定所述監(jiān)控對象的當(dāng)前運行狀況是否滿足所述預(yù)警調(diào)整條件,當(dāng)滿足所述預(yù)警調(diào)整條件時,修正所述監(jiān)控數(shù)據(jù)觸發(fā)的預(yù)警的預(yù)警參數(shù)。
基于上述方案,所述預(yù)警子系統(tǒng),具體用于根據(jù)所述預(yù)警規(guī)則及所述監(jiān)控數(shù)據(jù),確定所述監(jiān)控對象是否處于數(shù)據(jù)備份狀態(tài)和/或設(shè)備重新部署狀態(tài),當(dāng)所述監(jiān)控對象處于所述數(shù)據(jù)備份狀態(tài)和/或所述設(shè)備重新部署狀態(tài),則確定所述監(jiān)控對象滿足所述預(yù)警調(diào)整條件,降低所述監(jiān)控數(shù)據(jù)觸發(fā)的預(yù)警的所述預(yù)警級別,或,屏蔽所述監(jiān)控數(shù)據(jù)觸發(fā)的預(yù)警。
基于上述方案,所述后臺管理子系統(tǒng),用于管理信息系統(tǒng)的節(jié)點樹并根據(jù)所述節(jié)點樹配置所述監(jiān)控對象的監(jiān)控規(guī)則及預(yù)警規(guī)則,其中,所述節(jié)點樹中一個節(jié)點定于一個所述監(jiān)控對象,并存儲有所述監(jiān)控對象的監(jiān)控規(guī)則和/或預(yù)警規(guī)則;
所述數(shù)據(jù)采集子系統(tǒng),還用于監(jiān)控所述信息系統(tǒng)中的所述節(jié)點樹是否發(fā)生了預(yù)設(shè)變化;若發(fā)生了預(yù)設(shè)變化,則重新獲取所述監(jiān)控對象的監(jiān)控規(guī)則;和/或,所述預(yù)警子系統(tǒng),還用于當(dāng)所述節(jié)點樹發(fā)生了所述預(yù)設(shè)變化,重新獲取預(yù)警規(guī)則。
基于上述方案,所述數(shù)據(jù)采集子系統(tǒng),具體用于根據(jù)所述監(jiān)控規(guī)則,采集獲得監(jiān)控數(shù)據(jù),將所述監(jiān)控數(shù)據(jù)存儲預(yù)定數(shù)據(jù)庫,將所述監(jiān)控對象的設(shè)備信息發(fā)送給預(yù)定消息隊列;
所述預(yù)警子系統(tǒng),具體用于從所述預(yù)定消息隊列接收所述設(shè)備信息,根據(jù)所述設(shè)備信息從所述預(yù)定數(shù)據(jù)庫讀取所述監(jiān)控對象的監(jiān)控數(shù)據(jù)。
本發(fā)明實施例第二方面提供一種監(jiān)控方法,包括:
配置監(jiān)控對象的監(jiān)控規(guī)則及預(yù)警規(guī)則;其中,所述預(yù)警規(guī)則至少包括:預(yù)警級別以及與預(yù)警級別對應(yīng)的預(yù)警方式;
根據(jù)所述監(jiān)控規(guī)則對所述監(jiān)控對象進行數(shù)據(jù)采集,以獲取監(jiān)控數(shù)據(jù);
根據(jù)所述預(yù)警規(guī)則,確定所述監(jiān)控數(shù)據(jù)是否觸發(fā)了預(yù)警及所述預(yù)警的預(yù)警參數(shù),其中,所述預(yù)警參數(shù)包括所述預(yù)警級別及所述預(yù)警方式;
當(dāng)所述監(jiān)控數(shù)據(jù)觸發(fā)了預(yù)警時,采用與所述預(yù)警級別對應(yīng)的預(yù)警方式發(fā)送預(yù)警信息。
基于上述方案,所述預(yù)警規(guī)則還包括:預(yù)警調(diào)整條件;
所述方法還包括:
根據(jù)所述預(yù)警規(guī)則及所述監(jiān)控數(shù)據(jù),確定所述監(jiān)控對象的當(dāng)前運行狀況是否滿足所述預(yù)警調(diào)整條件;
當(dāng)滿足所述預(yù)警調(diào)整條件時,修正所述監(jiān)控數(shù)據(jù)觸發(fā)的預(yù)警的預(yù)警參數(shù)。
基于上述方案,所述根據(jù)所述預(yù)警規(guī)則及所述監(jiān)控數(shù)據(jù),確定所述監(jiān)控對象的當(dāng)前運行狀況是否滿足所述預(yù)警調(diào)整條件,包括:
根據(jù)所述預(yù)警規(guī)則及所述監(jiān)控數(shù)據(jù),確定所述監(jiān)控對象是否處于數(shù)據(jù)備份狀態(tài)和/或設(shè)備重新部署狀態(tài);
所述當(dāng)滿足所述預(yù)警調(diào)整條件時,修正所述監(jiān)控數(shù)據(jù)觸發(fā)的預(yù)警的預(yù)警參數(shù),包括:
當(dāng)所述監(jiān)控對象處于所述數(shù)據(jù)備份狀態(tài)和/或所述設(shè)備重新部署狀態(tài),則確定所述監(jiān)控對象滿足所述預(yù)警調(diào)整條件,降低所述監(jiān)控數(shù)據(jù)觸發(fā)的預(yù)警的所述預(yù)警級別,或,屏蔽所述監(jiān)控數(shù)據(jù)觸發(fā)的預(yù)警。
基于上述方案,所述方法還包括:
管理信息系統(tǒng)的節(jié)點樹并根據(jù)所述節(jié)點樹配置所述監(jiān)控對象的監(jiān)控規(guī)則及預(yù)警規(guī)則,其中,所述節(jié)點樹中一個節(jié)點定于一個所述監(jiān)控對象,并存儲有所述監(jiān)控對象的監(jiān)控規(guī)則和/或預(yù)警規(guī)則;
監(jiān)控所述信息系統(tǒng)中的所述節(jié)點樹是否發(fā)生了預(yù)設(shè)變化;
若發(fā)生了預(yù)設(shè)變化,則數(shù)據(jù)采集子系統(tǒng)重新獲取所述監(jiān)控對象的監(jiān)控規(guī)則,和/或,預(yù)警子系統(tǒng)新獲取預(yù)警規(guī)則。
基于上述方案,所述根據(jù)所述監(jiān)控規(guī)則對所述監(jiān)控對象進行數(shù)據(jù)采集,以獲取監(jiān)控數(shù)據(jù),包括:
根據(jù)所述監(jiān)控規(guī)則,采集獲得監(jiān)控數(shù)據(jù);
將所述監(jiān)控數(shù)據(jù)存儲預(yù)定數(shù)據(jù)庫;
將所述監(jiān)控對象的設(shè)備信息發(fā)送給預(yù)定消息隊列;
所述根據(jù)所述預(yù)警規(guī)則,確定所述監(jiān)控數(shù)據(jù)是否觸發(fā)了預(yù)警及所述預(yù)警的預(yù)警參數(shù),包括:
從所述預(yù)定消息隊列接收所述設(shè)備信息,根據(jù)所述設(shè)備信息從所述預(yù)定數(shù)據(jù)庫讀取所述監(jiān)控對象的監(jiān)控數(shù)據(jù)。
本發(fā)明實施例中提供的監(jiān)控系統(tǒng)及監(jiān)控方法,后臺管理子系統(tǒng)內(nèi)配置的預(yù)警規(guī)則,包括預(yù)警級別及與預(yù)警級別對應(yīng)的預(yù)警方式。這樣的話,后續(xù)預(yù)警子系統(tǒng)判斷出需要預(yù)警時,會采用與監(jiān)測到的異常的嚴(yán)重程度相適配的預(yù)警方式,向管理人員提供的通信地址或設(shè)備發(fā)送預(yù)警信息,而不是所有的預(yù)警采用單一預(yù)警方式發(fā)送預(yù)警信息。故相對于現(xiàn)有技術(shù),可以解決現(xiàn)有監(jiān)控該系統(tǒng)采用單一預(yù)警方式發(fā)送預(yù)警信息,導(dǎo)致管理人員的一個賬號出現(xiàn)成堆的預(yù)警信息造成的信息干擾問題。同時采用不同的預(yù)警方式進行預(yù)警信息的發(fā)送,方便管理人員可以根據(jù)預(yù)警方式就知道當(dāng)前檢測到異常的嚴(yán)重程度,從而做出相應(yīng)的反饋;且可以對于表征異常程度較為預(yù)警方式進行重點查看,從而可以減少管理人員對異常程度較大的預(yù)警信息的遺漏,從而提升監(jiān)控系統(tǒng)的監(jiān)控性能。
附圖說明
圖1為本發(fā)明實施例提供的第一種監(jiān)控系統(tǒng)的結(jié)構(gòu)示意圖;
圖2為本發(fā)明實施例提供的一種可用于監(jiān)控系統(tǒng)的電子設(shè)備的結(jié)構(gòu)示意圖;
圖3為本發(fā)明實施例提供的第二種監(jiān)控系統(tǒng)的結(jié)構(gòu)示意圖;
圖4為本發(fā)明實施例提供的第一種監(jiān)控方法的流程示意圖;
圖5為本發(fā)明實施例提供的第二種監(jiān)控方法的流程示意圖。
具體實施方式
應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明的技術(shù)方案,并不用于限定本發(fā)明的保護范圍。
如圖1所示,本實施例提供一種監(jiān)控系統(tǒng),包括:
后臺管理子系統(tǒng)110,用于配置監(jiān)控對象的監(jiān)控規(guī)則及預(yù)警規(guī)則;其中,所述預(yù)警規(guī)則至少包括:預(yù)警級別以及與預(yù)警級別對應(yīng)的預(yù)警方式;
數(shù)據(jù)采集子系統(tǒng)120,用于根據(jù)所述監(jiān)控規(guī)則對所述監(jiān)控對象進行數(shù)據(jù)采集,以獲取監(jiān)控數(shù)據(jù);
預(yù)警子系統(tǒng)130,用于根據(jù)所述預(yù)警規(guī)則,確定所述監(jiān)控數(shù)據(jù)是否觸發(fā)了預(yù)警及所述預(yù)警的預(yù)警參數(shù),并當(dāng)所述監(jiān)控數(shù)據(jù)觸發(fā)了預(yù)警時,采用與所述預(yù)警級別對應(yīng)的預(yù)警方式發(fā)送預(yù)警信息,其中,所述預(yù)警參數(shù)包括所述預(yù)警級別及所述預(yù)警方式。
本實施例提供一種監(jiān)控系統(tǒng),該系統(tǒng)至少包括三個子系統(tǒng)。分別是后臺管理子系統(tǒng)110、數(shù)據(jù)采集子系統(tǒng)120及預(yù)警子系統(tǒng)130。所述監(jiān)控子系統(tǒng)中每一個子系統(tǒng)都是有一臺或多臺的服務(wù)器或計算機等電子設(shè)備構(gòu)成。
圖2所示為本發(fā)明實施例提供的一種電子設(shè)備的結(jié)構(gòu)示意圖,所述電子設(shè)備200包括:處理器204、收發(fā)機202、存儲器203和總線接口.,所述總線接口,用于處理器、存儲器及收發(fā)機等電子設(shè)備的內(nèi)部通信。所述收發(fā)機202用于電子設(shè)備之間的信息交互。所述存儲器203,用于存儲有可執(zhí)行代碼,所述處理器204通過執(zhí)行所述代碼,可以實現(xiàn)監(jiān)控規(guī)則及預(yù)警規(guī)則的配置,或,監(jiān)控數(shù)據(jù)的采集,和/或預(yù)警信息的發(fā)送。
這里的處理器204,可為中央處理器、數(shù)字信號處理器、應(yīng)用處理器、可編程陣列、微處理器或?qū)S眉呻娐返取?/p>
在本實施例中所述后臺管理子系統(tǒng)110,會分別與所述數(shù)據(jù)采集子系統(tǒng)120及預(yù)警子系統(tǒng)相連,所述后臺管理子系統(tǒng)110內(nèi)配置有監(jiān)控規(guī)則及預(yù)警規(guī)則。
所述監(jiān)控規(guī)則,用于所述數(shù)據(jù)采集子系統(tǒng)120對監(jiān)控對象進行監(jiān)控及數(shù)據(jù)采集。所述預(yù)警規(guī)則,用于預(yù)警子系統(tǒng)130,根據(jù)所述數(shù)據(jù)采集子系統(tǒng)120采集的監(jiān)控數(shù)據(jù)確定是否需要預(yù)警,并根據(jù)預(yù)警級別采用不同的預(yù)警方式向管理人員給出的通信地址或通信設(shè)備發(fā)送預(yù)警信息。
在本實施例中所述監(jiān)控規(guī)則可包括:各種監(jiān)控參數(shù)。所述監(jiān)控參數(shù)可包括:對象參數(shù)、頻次參數(shù)、指標(biāo)參數(shù)等各種參數(shù)。
所述對象參數(shù),指示了需要監(jiān)控的監(jiān)控對象,可包括:監(jiān)控對象的名稱、網(wǎng)絡(luò)協(xié)議(ip)地址或媒體訪問控制(mac)地址及訪問路徑中的一項或多項。所述數(shù)據(jù)采集子系統(tǒng)120,根據(jù)所述對象參數(shù),可以確定出當(dāng)前需要監(jiān)控信息系統(tǒng)中哪一臺或幾臺服務(wù)器,并可以基于所述ip地址、mac地址及訪問路徑中的至少一項,可以與監(jiān)控對象建立連接,從而方便所述訪問子系統(tǒng)從所述監(jiān)控對象中采集數(shù)據(jù),從而進行監(jiān)控對象的運行狀況的監(jiān)控。
所述頻次參數(shù),可包括:數(shù)據(jù)采集間隔、監(jiān)控間隔等參數(shù)。所述數(shù)據(jù)采集間隔可為:數(shù)據(jù)采集子系統(tǒng)120根據(jù)監(jiān)控結(jié)果,輸出監(jiān)控數(shù)據(jù)的周期或時間段。所述監(jiān)控間隔可為所述數(shù)據(jù)采集子系統(tǒng)120,查看所述監(jiān)控對象的時間間隔或周期等。大多數(shù)的情況下,信息系統(tǒng)是會處于正常運行狀態(tài),通常所述數(shù)據(jù)采集間隔的時長,可稍微大于所述監(jiān)控間隔等,以減少所述數(shù)據(jù)采集子系統(tǒng)120的數(shù)據(jù)采集次數(shù),減少不必要的采集數(shù)據(jù)的輸出。
在不同的時間段,所述數(shù)據(jù)采集子系統(tǒng)120對監(jiān)控對象的監(jiān)控間隔或數(shù)據(jù)采集間隔可以不同。例如,信息系統(tǒng)可以分為閑時和忙時,閑時出現(xiàn)異常狀況的概率更小,為了減少監(jiān)控系統(tǒng)的負(fù)載和開銷,在閑時的數(shù)據(jù)采集間隔和/或監(jiān)控間隔對應(yīng)的時長,都可以小于所述信息系統(tǒng)在忙時的數(shù)據(jù)采集間隔和/或監(jiān)控間隔。這里的信息系統(tǒng)是處于閑時還是忙時,可以根據(jù)所述信息系統(tǒng)在各個不同各時段的負(fù)載率來確定。例如,基于一段時間的統(tǒng)計,信息系統(tǒng)掛在夜間12點以后的負(fù)載率低于預(yù)定閾值,則該時段可為閑時,否則可認(rèn)為是忙時。
所述指標(biāo)參數(shù),可用于指示所述數(shù)據(jù)采集子系統(tǒng)120采集的監(jiān)控對象的各種指標(biāo)參數(shù),例如,可包括:中央處理器(cpu)的負(fù)載率、剩余存儲資源,數(shù)據(jù)輸出量、數(shù)據(jù)寫入量等參數(shù),所述指標(biāo)參數(shù)可包括多種,在此就不一一限定了。
在本實施例中所述預(yù)警子系統(tǒng)130會根據(jù)數(shù)據(jù)采集子系統(tǒng)120采集的數(shù)據(jù)進行判斷,判斷是否需要預(yù)警,預(yù)警級別,及預(yù)警方式等。在本實施例中監(jiān)控數(shù)據(jù)觸發(fā)的預(yù)警根據(jù)異常的嚴(yán)重程度分別不同預(yù)警級別。不同的預(yù)警級別對應(yīng)的預(yù)警方式不同。假設(shè),預(yù)警級別越高,對應(yīng)的異常的嚴(yán)重程度越高,則采用的預(yù)警方式可為管理人員更容易查看的預(yù)警方式。
在本實施例中所述預(yù)警方式包括:郵件預(yù)警、短信預(yù)警及即時通信預(yù)警。
所述郵件預(yù)警,為采用郵件發(fā)送預(yù)警信息。
所述短信預(yù)警,為采用短信發(fā)送預(yù)警信息。
所述即時通信預(yù)警,為通過即時通信消息發(fā)送預(yù)警信息。這里的即時通信消息可包括:微信消息、臉書消息或qq消息等。
在本實施例中會根據(jù)監(jiān)控數(shù)據(jù)觸發(fā)的預(yù)警的嚴(yán)重程度不同,被劃分到不同的預(yù)警級別,并采用對應(yīng)于預(yù)警級別的預(yù)警方式發(fā)送預(yù)警信息。這樣的話,不會產(chǎn)生所有的預(yù)警都采用單一方式,而管理人員無法通過預(yù)警方式確定當(dāng)前告警的嚴(yán)重程度,進而導(dǎo)致的不重視,從而降低了遺漏掉嚴(yán)重預(yù)警導(dǎo)致的信息系統(tǒng)異常未被及時監(jiān)控或處理的概率,從而提升了監(jiān)控系統(tǒng)的監(jiān)控性能。且在本實施例中根據(jù)預(yù)警級別,采用對應(yīng)的預(yù)警方式進行預(yù)警,同時還可以減少大量的預(yù)警信息采用單一預(yù)警方式,導(dǎo)致管理人員的郵箱、短信箱或即時通信接收到大量信息,形成的對管理的信息騷擾的問題。
在本實施例中所述短信預(yù)警對應(yīng)的預(yù)警級別最高,所述郵件預(yù)警對應(yīng)的預(yù)警級別次之,所述即時通信預(yù)警對應(yīng)的預(yù)警級別再次之。
在一些實施例中所述預(yù)警子系統(tǒng)130,還可用于將預(yù)定個數(shù)預(yù)警級別為指定范圍的預(yù)警級別對應(yīng)預(yù)警信息,整合到一條預(yù)警消息中通過對應(yīng)的預(yù)警方式發(fā)送;或者,將預(yù)定時間內(nèi)預(yù)警級別為所述指定范圍內(nèi)的預(yù)警信息,整合到一條預(yù)警消息中通過對應(yīng)的預(yù)警方式發(fā)送。這樣相對于觸發(fā)了一次預(yù)警,就發(fā)送預(yù)警信息,顯然可以減少預(yù)警信息的條數(shù),從而可以減少管理人員接收到預(yù)警信息的條數(shù),從而可以減少信息干擾。在本實施例中所述指定范圍的預(yù)警級別均為不太嚴(yán)重的,暫時不會影響信息系統(tǒng)的正常運行的預(yù)警。
可選地,所述預(yù)警規(guī)則還包括:預(yù)警調(diào)整條件;
所述預(yù)警子系統(tǒng)130,還用于根據(jù)所述預(yù)警規(guī)則及所述監(jiān)控數(shù)據(jù),確定所述監(jiān)控對象的當(dāng)前運行狀況是否滿足所述預(yù)警調(diào)整條件,當(dāng)滿足所述預(yù)警調(diào)整條件時,修正所述監(jiān)控數(shù)據(jù)觸發(fā)的預(yù)警的預(yù)警參數(shù)。
當(dāng)信息系統(tǒng)處于一些特定狀況下,信息系統(tǒng)的正常運行也可能觸發(fā)預(yù)警。例如,當(dāng)前信息系統(tǒng)的兩臺設(shè)備之間進行數(shù)據(jù)備份,這時就可能導(dǎo)致被監(jiān)控的監(jiān)控對象的數(shù)據(jù)遷移量大于預(yù)警閾值,則可能觸發(fā)預(yù)警。在本實施例中為了排除了這種錯誤的預(yù)警,在本實施例中所述預(yù)警規(guī)則中還包括預(yù)警調(diào)整條件。所述預(yù)警子系統(tǒng)130在發(fā)送預(yù)警之前,還會根據(jù)所述預(yù)警規(guī)則及監(jiān)控數(shù)據(jù),確定監(jiān)控對象的當(dāng)前運行狀況是否滿足預(yù)警調(diào)整條件。例如,信息統(tǒng)統(tǒng)內(nèi)兩臺設(shè)備之間進行數(shù)據(jù)備份,則可以根據(jù)監(jiān)控數(shù)據(jù)中數(shù)據(jù)遷出的地址,確定出信息系統(tǒng)鍋內(nèi)的數(shù)據(jù)遷移備份,還是被系統(tǒng)外的設(shè)備頻繁訪問或病毒式訪問。
在本實施例中預(yù)警子系統(tǒng)130,根據(jù)監(jiān)控數(shù)據(jù)確定出滿足所述預(yù)警條件時,會修訂修正數(shù)據(jù)觸發(fā)的預(yù)警的預(yù)警參數(shù)。這里的預(yù)警參數(shù)可包括前述的預(yù)警級別和/或預(yù)警方式。具體的,可包括:降低預(yù)警級別,或直接調(diào)整預(yù)警方式。在一些實施例中還可以直接屏蔽該預(yù)警。
可選地,所述預(yù)警子系統(tǒng)130,具體用于根據(jù)所述預(yù)警規(guī)則及所述監(jiān)控數(shù)據(jù),確定所述監(jiān)控對象是否處于數(shù)據(jù)備份狀態(tài)和/或設(shè)備重新部署狀態(tài),當(dāng)所述監(jiān)控對象處于所述數(shù)據(jù)備份狀態(tài)和/或所述設(shè)備重新部署狀態(tài),則確定所述監(jiān)控對象滿足所述預(yù)警調(diào)整條件,降低所述監(jiān)控數(shù)據(jù)觸發(fā)的預(yù)警的所述預(yù)警級別,或,屏蔽所述監(jiān)控數(shù)據(jù)觸發(fā)的預(yù)警。
在本實施例中可以通過預(yù)警的屏蔽,或預(yù)警級別的降低,減少預(yù)警的錯誤率或?qū)芾砣藛T的信息干擾。
可選地,所述后臺管理子系統(tǒng)110,用于管理信息系統(tǒng)的節(jié)點樹并根據(jù)所述節(jié)點樹配置所述監(jiān)控對象的監(jiān)控規(guī)則及預(yù)警規(guī)則,其中,所述節(jié)點樹中一個節(jié)點定于一個所述監(jiān)控對象,并存儲有所述監(jiān)控對象的監(jiān)控規(guī)則和/或預(yù)警規(guī)則;
所述數(shù)據(jù)采集子系統(tǒng)120,還用于監(jiān)控所述信息系統(tǒng)中的所述節(jié)點樹是否發(fā)生了預(yù)設(shè)變化;若發(fā)生了預(yù)設(shè)變化,則重新獲取所述監(jiān)控對象的監(jiān)控規(guī)則。
在本實施例中所述后臺管理子系統(tǒng)110,還將用于管理信息系統(tǒng)中每一個節(jié)點,這里的一個節(jié)點可以對應(yīng)于一個監(jiān)控對象,一個監(jiān)控對象可對應(yīng)于一臺或多臺物理設(shè)備,或?qū)?yīng)于一臺物理設(shè)備的一項或多項功能。當(dāng)所述節(jié)點樹發(fā)生了變化,則信息系統(tǒng)的設(shè)備之間的架構(gòu)或功能發(fā)生了變化,為了更好的監(jiān)控信息系統(tǒng),則對應(yīng)的監(jiān)控規(guī)則會發(fā)生變化。故在本實施例中所述后臺管理子系統(tǒng)110,會管理信息系統(tǒng)的節(jié)點樹,并基于節(jié)點樹重新配置監(jiān)控規(guī)則。
在本實施例中所述數(shù)據(jù)采集子系統(tǒng)120,會監(jiān)控所述信息系統(tǒng)中的節(jié)點樹是否發(fā)生了變化,若發(fā)生了變化則將獲取新的監(jiān)控規(guī)則。
在一些實施例中,若所述節(jié)點樹發(fā)生了變化,所述后臺管理子系統(tǒng)110重新配置了監(jiān)控規(guī)則,則會將重新配置的額監(jiān)控規(guī)則,寫入到指定數(shù)據(jù)庫。對應(yīng)地,所述數(shù)據(jù)采集子系統(tǒng)120會從所述指定數(shù)據(jù)庫,讀取新的監(jiān)控規(guī)則。
在一些實施例中,所述后臺管理子系統(tǒng)110在更新了監(jiān)控規(guī)則之后,會主動將新的監(jiān)控規(guī)則推送給所述數(shù)據(jù)采集子系統(tǒng)120,方便所述數(shù)據(jù)采集子系統(tǒng)120及時根據(jù)新的監(jiān)控規(guī)則,對信息系統(tǒng)進行監(jiān)控。
在一些實施例中,所述預(yù)警子系統(tǒng)130,還用于在節(jié)點樹發(fā)生了預(yù)設(shè)變化時,從新獲取預(yù)警規(guī)則。這里的預(yù)警子系統(tǒng)130,重新獲取所述預(yù)警規(guī)則,可以直接從后臺管理子系統(tǒng)110中讀取,或從所述執(zhí)行數(shù)據(jù)庫中讀取,或接收所述后臺管理子系統(tǒng)110推送的預(yù)警規(guī)則。
但是節(jié)點樹發(fā)生了變化,則可能僅有監(jiān)控規(guī)則發(fā)生了變化,預(yù)警規(guī)則未發(fā)生變化,也有可能預(yù)警規(guī)則發(fā)生了變化,而監(jiān)控規(guī)則保持不變;在有一些實施例中所述監(jiān)控規(guī)則和所述預(yù)警規(guī)則都發(fā)生了相應(yīng)變化。
在一些實施例中,所述數(shù)據(jù)采集子系統(tǒng)120,具體用于根據(jù)所述監(jiān)控規(guī)則,采集獲得監(jiān)控數(shù)據(jù),將所述監(jiān)控數(shù)據(jù)存儲預(yù)定數(shù)據(jù)庫,將所述監(jiān)控對象的設(shè)備信息發(fā)送給預(yù)定消息隊列;
所述預(yù)警子系統(tǒng)130,具體用于從所述預(yù)定消息隊列接收所述設(shè)備信息,根據(jù)所述設(shè)備信息從所述預(yù)定數(shù)據(jù)庫讀取所述監(jiān)控對象的監(jiān)控數(shù)據(jù)。
在本實施例中所述預(yù)定消息隊列可為先進先出隊列,這樣的話,所述預(yù)警子系統(tǒng)130,會順序讀取到需要判斷當(dāng)前是否異常的監(jiān)控對象的設(shè)備信息,以順序從預(yù)定數(shù)據(jù)庫讀取監(jiān)控數(shù)據(jù)。
在一些場景中所述預(yù)定消息隊列分為包括多個,不同類型的監(jiān)控對象的設(shè)備信息,存儲到對應(yīng)類型的預(yù)定消息隊列中,這樣方便所述預(yù)警子系統(tǒng)130,可以根據(jù)可能發(fā)生的異常的嚴(yán)重程度,優(yōu)先處理哪一個預(yù)定消息隊列中攜帶的設(shè)備信息的異常判斷。
在一些實施例中所述預(yù)定消息隊列可為先進先出隊列,在另一些實施例中,所述預(yù)定消息隊列可為一個消息暫存通道,至于所述預(yù)警子系統(tǒng)130具體如何讀取所述預(yù)定消息隊列中的設(shè)備信息,可以由所述預(yù)警子系統(tǒng)130自行根據(jù)讀取規(guī)則確定??傊?,所述預(yù)定消息隊列不局限于先進先出隊列。例如,所述預(yù)定消息隊列還可為kafka隊列。
如圖3所示,以下結(jié)合上述任意實施例提供一個具體示例,包括:
在后臺管理子系統(tǒng)對需要監(jiān)控的服務(wù)器進行配置服務(wù)器的相關(guān)信息,同時配置該服務(wù)器的預(yù)警規(guī)則。此時,后臺管理子系統(tǒng)會同時去變更zookeeper的節(jié)點樹。這里的相關(guān)信息可包括前的監(jiān)控規(guī)則。
數(shù)據(jù)采集子系統(tǒng)時刻在監(jiān)聽zookeeper的節(jié)點樹的變化,當(dāng)有新增需要監(jiān)控的服務(wù)器的信息在zookeeper上有變化的時候,則會監(jiān)聽到該事件,同時去數(shù)據(jù)庫獲取被監(jiān)控的服務(wù)器的設(shè)備信息,根據(jù)該設(shè)備信息,按一定的頻率采集被監(jiān)控服務(wù)器的監(jiān)控指標(biāo)獲得監(jiān)控數(shù)據(jù),同時將該監(jiān)控數(shù)據(jù)存儲到mongodb數(shù)據(jù)庫。這里的mongodb數(shù)據(jù)庫可為前述預(yù)定數(shù)據(jù)庫。
當(dāng)數(shù)據(jù)采集子系統(tǒng)采集完數(shù)據(jù)后,根據(jù)獲取到的被監(jiān)控服務(wù)器的信息,如果該服務(wù)器需要去判斷預(yù)警,則發(fā)送消息到消息隊列kafka中。
預(yù)警子系統(tǒng)是kafka消息隊列的消費者,當(dāng)kafka中有消息過來的時候,會根據(jù)消息隊列中的被監(jiān)控服務(wù)器信息,會去mysql數(shù)據(jù)庫獲取被監(jiān)控服務(wù)器配置的預(yù)警規(guī)則,同時會再去mongodb中獲取被監(jiān)控服務(wù)器的監(jiān)控指標(biāo)數(shù)據(jù),之后根據(jù)配置的預(yù)警規(guī)則,對這些指標(biāo)數(shù)據(jù)進行判斷,當(dāng)這些數(shù)據(jù)滿足了需要發(fā)送的規(guī)則時,則根據(jù)配置的相關(guān)預(yù)警規(guī)則發(fā)送方式進行消息的預(yù)警。這里的發(fā)送方式可包括:短信、郵件及微信等。根據(jù)預(yù)警級別以對應(yīng)的預(yù)警方式發(fā)送預(yù)警信息到不同人員,方便靈活。通過預(yù)警規(guī)則的配置,減少之前全部通過短信發(fā)送不同嚴(yán)重程度的預(yù)警信息,在本實施例中僅對需要預(yù)警的異常發(fā)送必要的預(yù)警信息,節(jié)省了短信的費用。通過預(yù)警規(guī)則的配置,配置不同時段使用不同預(yù)警規(guī)則,以區(qū)別應(yīng)對特殊時刻時候的情形(數(shù)據(jù)庫備份的時候),使系統(tǒng)預(yù)警更加準(zhǔn)確。
如圖4所示,本實施例提供一種監(jiān)控方法,包括:
步驟s110:配置監(jiān)控對象的監(jiān)控規(guī)則及預(yù)警規(guī)則;其中,所述預(yù)警規(guī)則至少包括:預(yù)警級別以及與預(yù)警級別對應(yīng)的預(yù)警方式;
步驟s120:根據(jù)所述監(jiān)控規(guī)則對所述監(jiān)控對象進行數(shù)據(jù)采集,以獲取監(jiān)控數(shù)據(jù);
步驟s130:根據(jù)所述預(yù)警規(guī)則,確定所述監(jiān)控數(shù)據(jù)是否觸發(fā)了預(yù)警及所述預(yù)警的預(yù)警參數(shù);其中,所述預(yù)警參數(shù)包括所述預(yù)警級別及所述預(yù)警方式;
步驟s140:當(dāng)所述監(jiān)控數(shù)據(jù)觸發(fā)了預(yù)警時,采用與所述預(yù)警級別對應(yīng)的預(yù)警方式發(fā)送預(yù)警信息。
本實施例提供的監(jiān)控方法可為運行上述監(jiān)控系統(tǒng)中的方法。
在本實施例中步驟s110配置監(jiān)控對象的監(jiān)控規(guī)則,及基于監(jiān)控數(shù)據(jù)進行預(yù)警的預(yù)警規(guī)則。
在本實施例中配置監(jiān)控規(guī)則及預(yù)警規(guī)則時,可包括:人機交互界面或從其他設(shè)備接收所述監(jiān)控規(guī)則及預(yù)警規(guī)則。在一些實施例中,所述步驟s110還可包括:利用配置代碼自動根據(jù)信息系統(tǒng)的節(jié)點樹或設(shè)備部署架構(gòu)及功能部署,自動配置所述監(jiān)控規(guī)則及預(yù)警規(guī)則。
在步驟s120中采集子系統(tǒng)會根據(jù)監(jiān)控規(guī)則對監(jiān)控搞對象進行監(jiān)控,并進行數(shù)據(jù)采集,從而獲得所述監(jiān)控數(shù)據(jù)。
在步驟s130中會基于預(yù)警規(guī)則,處理所述監(jiān)控數(shù)據(jù),從而確定出是否需要預(yù)警,預(yù)警的預(yù)警級別及發(fā)送預(yù)警的預(yù)警方式等。
在步驟s140中會在需要預(yù)警時,采用與預(yù)警級別對應(yīng)的預(yù)警方式發(fā)送預(yù)警信息;而非對于所有預(yù)警采用單一預(yù)警方式進行預(yù)警。
在本實施例中所述預(yù)警級別及預(yù)警方式,都是與預(yù)警對應(yīng)的可能的信息異常的嚴(yán)重程度成正比的。
可選地,如圖5所示,所述預(yù)警規(guī)則還包括:預(yù)警調(diào)整條件;
所述方法還包括:
步驟s101:根據(jù)所述預(yù)警規(guī)則及所述監(jiān)控數(shù)據(jù),確定所述監(jiān)控對象的當(dāng)前運行狀況是否滿足所述預(yù)警調(diào)整條件;
步驟s102:當(dāng)滿足所述預(yù)警調(diào)整條件時,修正所述監(jiān)控數(shù)據(jù)觸發(fā)的預(yù)警的預(yù)警參數(shù)。
在本實施例中還會判斷所述監(jiān)控對象的當(dāng)前運行狀況,時可能導(dǎo)致預(yù)警但是卻是監(jiān)控對象正常運行的一些應(yīng)用場景,這些應(yīng)用場景即為滿足所述預(yù)警調(diào)整條件的應(yīng)用場景。在步驟s102中會在滿足預(yù)警調(diào)整條件時,修正的監(jiān)控數(shù)據(jù)觸發(fā)的預(yù)警的預(yù)警參數(shù)。這里的預(yù)警參數(shù)包括預(yù)警級別。若預(yù)警級別被調(diào)為0,則可認(rèn)為不用預(yù)警,相當(dāng)于屏蔽了所述監(jiān)控數(shù)據(jù)觸發(fā)的預(yù)警。這里的預(yù)警參數(shù)還可包括:預(yù)警方式。例如,若不修正之前,預(yù)警方式為短信預(yù)警,這樣管理人員接收到短信會認(rèn)為是監(jiān)控到很嚴(yán)重的異常,在修正之后,預(yù)警方式可為微信預(yù)警,管理人員接收到微信會認(rèn)為監(jiān)控的異常很小,暫時不會影響信息系統(tǒng)給的正常運行,可以屬于正常指標(biāo)波動,可以再觀察一段時間再做出決策。
可選地,所述步驟s101可包括:
根據(jù)所述預(yù)警規(guī)則及所述監(jiān)控數(shù)據(jù),確定所述監(jiān)控對象是否處于數(shù)據(jù)備份狀態(tài)和/或設(shè)備重新部署狀態(tài);
所述步驟s102可包括:當(dāng)所述監(jiān)控對象處于所述數(shù)據(jù)備份狀態(tài)和/或所述設(shè)備重新部署狀態(tài),則確定所述監(jiān)控對象滿足所述預(yù)警調(diào)整條件,降低所述監(jiān)控數(shù)據(jù)觸發(fā)的預(yù)警的所述預(yù)警級別,或,屏蔽所述監(jiān)控數(shù)據(jù)觸發(fā)的預(yù)警。
在本實施例中至少數(shù)據(jù)備份及設(shè)備重新部署,屬于觸發(fā)的預(yù)警進行預(yù)警參數(shù)調(diào)整的應(yīng)用場景。通過上述處理,則后續(xù)在進行信息系統(tǒng)內(nèi)的數(shù)據(jù)備份和/或設(shè)備重新部署時,管理人員會接收到不到預(yù)警或接收不到嚴(yán)重預(yù)警,一方面減少對管理人員的信息干擾,另一方面提升了預(yù)警的精確性。
在一些實施例中,所述方法還包括:
管理信息系統(tǒng)的節(jié)點樹并根據(jù)所述節(jié)點樹配置所述監(jiān)控對象的監(jiān)控規(guī)則及預(yù)警規(guī)則,其中,所述節(jié)點樹中一個節(jié)點定于一個所述監(jiān)控對象,并存儲有所述監(jiān)控對象的監(jiān)控規(guī)則和/或預(yù)警規(guī)則;
監(jiān)控所述信息系統(tǒng)中的所述節(jié)點樹是否發(fā)生了預(yù)設(shè)變化;
若發(fā)生了預(yù)設(shè)變化,則數(shù)據(jù)采集子系統(tǒng)重新獲取所述監(jiān)控對象的監(jiān)控規(guī)則,和/或,預(yù)警子系統(tǒng)重新獲取預(yù)警規(guī)則。
在本實施例中所述信息系統(tǒng)的節(jié)點樹,在節(jié)點樹發(fā)生了變化,則相當(dāng)于信息系統(tǒng)的架構(gòu)和/或功能部署發(fā)生了變化,則為了確保監(jiān)控系統(tǒng)的監(jiān)控精確性,可能需要調(diào)整監(jiān)控規(guī)則。在本實施例中若信息系統(tǒng)給的節(jié)點樹發(fā)送了變化,則預(yù)警子系統(tǒng)會重新獲取監(jiān)控對象的監(jiān)控規(guī)則,從而確保監(jiān)控的精確性。
對應(yīng)地,在一些實施例中節(jié)點樹發(fā)生了變化,對應(yīng)的預(yù)警規(guī)則也可能會發(fā)生變化,則所述預(yù)警子系統(tǒng)130,會重新獲取預(yù)警規(guī)則,從而實現(xiàn)精確的預(yù)警。
在一些實施例中,所述步驟s120可包括:
根據(jù)所述監(jiān)控規(guī)則,采集獲得監(jiān)控數(shù)據(jù);
將所述監(jiān)控數(shù)據(jù)存儲預(yù)定數(shù)據(jù)庫;
將所述監(jiān)控對象的設(shè)備信息發(fā)送給預(yù)定消息隊列;
所述步驟s130可包括:
從所述預(yù)定消息隊列接收所述設(shè)備信息,根據(jù)所述設(shè)備信息從所述預(yù)定數(shù)據(jù)庫讀取所述監(jiān)控對象的監(jiān)控數(shù)據(jù)。
在本實施例中采集子系統(tǒng)會將采集的需要判斷是否異常發(fā)送給預(yù)警子系統(tǒng)判斷時,會將對應(yīng)的監(jiān)控數(shù)據(jù)存儲到預(yù)定數(shù)據(jù)庫,并將對應(yīng)的設(shè)備信息發(fā)送給消息隊列,這樣預(yù)警子系統(tǒng)接收到所述預(yù)定消息隊列傳輸?shù)脑O(shè)備信息之后,會以該設(shè)備信息為查詢依據(jù),查詢所述預(yù)定數(shù)據(jù)庫,從而獲得對應(yīng)的監(jiān)控數(shù)據(jù),進行異常判斷,從而確定是否需要預(yù)警。
在一些實施例中,所述采集子系統(tǒng)具有一定的預(yù)判功能,采集子系統(tǒng)根據(jù)預(yù)判規(guī)則,對自己采集的監(jiān)控數(shù)據(jù),若無法明確出與判處是否發(fā)生了異常,則將所述監(jiān)控數(shù)據(jù)的監(jiān)控對象的設(shè)備信息推送到所述預(yù)定消息隊列中,這樣預(yù)警子系統(tǒng)中需要處理的數(shù)據(jù)就大大降低了。通過采集子系統(tǒng)的初步處理,可以減少預(yù)定消息隊列中的設(shè)備消息,從而提升正常異常被判斷出需要預(yù)警的時延減小了。
應(yīng)理解,說明書通篇中提到的“一個實施例”或“一實施例”意味著與實施例有關(guān)的特定特征、結(jié)構(gòu)或特性包括在本發(fā)明的至少一個實施例中。因此,在整個說明書各處出現(xiàn)的“在一個實施例中”或“在一實施例中”未必一定指相同的實施例。此外,這些特定的特征、結(jié)構(gòu)或特性可以任意適合的方式結(jié)合在一個或多個實施例中。應(yīng)理解,在本發(fā)明的各種實施例中,上述各過程的序號的大小并不意味著執(zhí)行順序的先后,各過程的執(zhí)行順序應(yīng)以其功能和內(nèi)在邏輯確定,而不應(yīng)對本發(fā)明實施例的實施過程構(gòu)成任何限定。上述本發(fā)明實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。
需要說明的是,在本文中,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括該要素的過程、方法、物品或者裝置中還存在另外的相同要素。
在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的設(shè)備和方法,可以通過其它的方式實現(xiàn)。以上所描述的設(shè)備實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,如:多個單元或組件可以結(jié)合,或可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討論的各組成部分相互之間的耦合、或直接耦合、或通信連接可以是通過一些接口,設(shè)備或單元的間接耦合或通信連接,可以是電性的、機械的或其它形式的。
上述作為分離部件說明的單元可以是、或也可以不是物理上分開的,作為單元顯示的部件可以是、或也可以不是物理單元;既可以位于一個地方,也可以分布到多個網(wǎng)絡(luò)單元上;可以根據(jù)實際的需要選擇其中的部分或全部單元來實現(xiàn)本實施例方案的目的。
另外,在本發(fā)明各實施例中的各功能單元可以全部集成在一個處理單元中,也可以是各單元分別單獨作為一個單元,也可以兩個或兩個以上單元集成在一個單元中;上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用硬件加軟件功能單元的形式實現(xiàn)。
本領(lǐng)域普通技術(shù)人員可以理解:實現(xiàn)上述方法實施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成,前述的程序可以存儲于計算機可讀取存儲介質(zhì)中,該程序在執(zhí)行時,執(zhí)行包括上述方法實施例的步驟;而前述的存儲介質(zhì)包括:移動存儲設(shè)備、只讀存儲器(readonlymemory,rom)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
或者,本發(fā)明上述集成的單元如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明實施例的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機、服務(wù)器、或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分。而前述的存儲介質(zhì)包括:移動存儲設(shè)備、rom、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
以上所述,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)以所述權(quán)利要求的保護范圍為準(zhǔn)。