本發(fā)明涉及系統(tǒng)運(yùn)維技術(shù)領(lǐng)域,尤其涉及一種監(jiān)控指標(biāo)及域值發(fā)現(xiàn)方法、域值調(diào)整方法及自動(dòng)監(jiān)控系統(tǒng)。
背景技術(shù):
系統(tǒng)監(jiān)控是指在信息系統(tǒng)運(yùn)行過(guò)程中,為盡快發(fā)現(xiàn)系統(tǒng)故障而采取的一種持續(xù)采集系統(tǒng)各項(xiàng)指標(biāo),分析并與正常值比對(duì)并進(jìn)行預(yù)警的一套方案。
現(xiàn)有的監(jiān)控系統(tǒng)一般需要人工輸入需要監(jiān)控的指標(biāo),并設(shè)計(jì)對(duì)應(yīng)的域值來(lái)進(jìn)行監(jiān)控的實(shí)現(xiàn)?,F(xiàn)有技術(shù)條件下的監(jiān)控系統(tǒng),可以實(shí)現(xiàn)監(jiān)控的主要功能:采集指標(biāo)、對(duì)比域值、產(chǎn)生警告,但是,對(duì)于監(jiān)控指標(biāo)的變化,例如監(jiān)控指標(biāo)的發(fā)現(xiàn)及增加,需要由人工完成。在為大型系統(tǒng)布置監(jiān)控的過(guò)程中,需要增加大量的需要監(jiān)控的指標(biāo),此時(shí)由人工完成監(jiān)控指標(biāo)的發(fā)現(xiàn)及增加,需要消耗大量的時(shí)間,降低監(jiān)控的時(shí)效性。
技術(shù)實(shí)現(xiàn)要素:
基于現(xiàn)有技術(shù)的缺陷和不足,本發(fā)明提出一種監(jiān)控指標(biāo)及域值發(fā)現(xiàn)方法、域值調(diào)整方法及自動(dòng)監(jiān)控系統(tǒng),能夠自動(dòng)完成監(jiān)控指標(biāo)的發(fā)現(xiàn)及增加工作,并且能夠自動(dòng)對(duì)監(jiān)控指標(biāo)的域值范圍進(jìn)行調(diào)整。
一種自動(dòng)監(jiān)控系統(tǒng),包括:
自適應(yīng)模塊、采集模塊、比較模塊、告警模塊;
其中,所述自適應(yīng)模塊與所述采集模塊及所述比較模塊連接,用于發(fā)現(xiàn)被監(jiān)控的系統(tǒng)中的監(jiān)控指標(biāo),計(jì)算發(fā)現(xiàn)的所述監(jiān)控指標(biāo)的域值范圍,并將所述監(jiān)控指標(biāo)保存到自身的監(jiān)控指標(biāo)庫(kù),以及將所述監(jiān)控指標(biāo)的域值范圍保存到自身的域值范圍數(shù)據(jù)庫(kù);
所述采集模塊與所述比較模塊連接,用于在被監(jiān)控的系統(tǒng)中采集所述自適應(yīng)模塊的監(jiān)控指標(biāo)庫(kù)中保存的監(jiān)控指標(biāo)的指標(biāo)值,并將所述指標(biāo)值發(fā)送給所述比較模塊;
所述比較模塊與所述告警模塊連接,用于將所述采集模塊采集到的監(jiān)控指標(biāo)的指標(biāo)值與所述自適應(yīng)模塊的域值范圍數(shù)據(jù)庫(kù)中保存的所述監(jiān)控指標(biāo)的域值范圍進(jìn)行對(duì)比,判斷所述監(jiān)控指標(biāo)的指標(biāo)值是否超出所述監(jiān)控指標(biāo)的域值范圍,當(dāng)所述監(jiān)控指標(biāo)的指標(biāo)值超出所述監(jiān)控指標(biāo)的域值范圍時(shí),調(diào)用所述告警模塊發(fā)出警告;
所述告警模塊,用于在所述比較模塊判斷監(jiān)控指標(biāo)的指標(biāo)值超出所述監(jiān)控指標(biāo)的域值范圍時(shí),發(fā)出警告。
優(yōu)選地,所述自適應(yīng)模塊發(fā)現(xiàn)被監(jiān)控的系統(tǒng)中的監(jiān)控指標(biāo),計(jì)算發(fā)現(xiàn)的所述監(jiān)控指標(biāo)的域值范圍時(shí),具體用于:
獲取對(duì)象庫(kù),所述對(duì)象庫(kù)包含被監(jiān)控的系統(tǒng)中的所有對(duì)象,以及每一個(gè)對(duì)象的所有指標(biāo);
根據(jù)所述對(duì)象庫(kù)中的數(shù)據(jù),在設(shè)定時(shí)間段內(nèi)對(duì)被監(jiān)控的系統(tǒng)進(jìn)行掃描,將掃描得到的,與所述對(duì)象庫(kù)中所有對(duì)象的所有指標(biāo)中的某一指標(biāo)相同的,并且未被監(jiān)控的指標(biāo),設(shè)定為監(jiān)控指標(biāo);
根據(jù)設(shè)定時(shí)間段內(nèi)掃描得到的所述監(jiān)控指標(biāo)的指標(biāo)值,計(jì)算得到所述監(jiān)控指標(biāo)的域值范圍。
優(yōu)選地,所述自適應(yīng)模塊根據(jù)所述對(duì)象庫(kù)中的數(shù)據(jù),在設(shè)定時(shí)間段內(nèi)對(duì)被監(jiān)控的系統(tǒng)進(jìn)行掃描,將掃描得到的,與所述對(duì)象庫(kù)中所有對(duì)象的所有指標(biāo)中的某一指標(biāo)相同的,并且未被監(jiān)控的指標(biāo),設(shè)定為監(jiān)控指標(biāo)時(shí),具體用于:
根據(jù)所述對(duì)象庫(kù)中的數(shù)據(jù),按照設(shè)定的周期對(duì)被監(jiān)控的系統(tǒng)進(jìn)行掃描;
連續(xù)掃描設(shè)定次數(shù)后,記錄掃描得到的,與所述對(duì)象庫(kù)中所有對(duì)象的所有指標(biāo)中的某一指標(biāo)相同的,并且未被監(jiān)控的指標(biāo);
分別統(tǒng)計(jì)所記錄的指標(biāo)出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)與掃描次數(shù)相同的指標(biāo)設(shè)定為監(jiān)控指標(biāo)。
優(yōu)選地,所述自適應(yīng)模塊還用于:
根據(jù)所述采集模塊在設(shè)定的時(shí)間段內(nèi)采集的監(jiān)控指標(biāo)的指標(biāo)值,調(diào)整所述監(jiān)控指標(biāo)的域值范圍。
優(yōu)選地,所述自適應(yīng)模塊根據(jù)所述采集模塊在設(shè)定的時(shí)間段內(nèi)采集的監(jiān)控指標(biāo)的指標(biāo)值,調(diào)整所述監(jiān)控指標(biāo)的域值范圍時(shí),具體用于:
根據(jù)所述采集模塊在設(shè)定的時(shí)間段內(nèi)采集的監(jiān)控指標(biāo)的指標(biāo)值,預(yù)測(cè)得到所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的域值范圍;
根據(jù)所述采集模塊在所述設(shè)定的時(shí)間段內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)采集的所述監(jiān)控指標(biāo)的指標(biāo)值,以及所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的域值范圍,進(jìn)一步預(yù)測(cè)得到所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)的域值范圍;其中,所述設(shè)定的第二時(shí)間段小于所述設(shè)定的時(shí)間段及所述設(shè)定的第一時(shí)間區(qū)間;
將所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)的域值范圍,調(diào)整為預(yù)測(cè)得到的所述監(jiān)控指標(biāo)在所述第一時(shí)間區(qū)間內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)的域值范圍。
優(yōu)選地,所述自適應(yīng)模塊還用于:
獲取監(jiān)控指標(biāo)的指標(biāo)值特殊時(shí)期信息,根據(jù)所述指標(biāo)值特殊時(shí)期信息,對(duì)所述監(jiān)控指標(biāo)在特殊時(shí)期的域值范圍進(jìn)行調(diào)整。
優(yōu)選地,所述自適應(yīng)模塊獲取監(jiān)控指標(biāo)的指標(biāo)值特殊時(shí)期信息,根據(jù)所述指標(biāo)值特殊時(shí)期信息,對(duì)所述監(jiān)控指標(biāo)在特殊時(shí)期的域值范圍進(jìn)行調(diào)整時(shí),具體用于:
獲取監(jiān)控指標(biāo)的指標(biāo)值特殊時(shí)期信息,并從所述指標(biāo)值特殊時(shí)期信息中識(shí)別得到所述監(jiān)控指標(biāo)的指標(biāo)值特殊時(shí)期以及指標(biāo)值變化趨勢(shì);
根據(jù)所述指標(biāo)值變化趨勢(shì),增大所述監(jiān)控指標(biāo)在所述指標(biāo)值特殊時(shí)期的域值范圍。
優(yōu)選地,所述比較模塊,還用于:
對(duì)于存在聯(lián)動(dòng)指標(biāo)值的監(jiān)控指標(biāo),當(dāng)判斷所述監(jiān)控指標(biāo)的指標(biāo)值超出域值范圍時(shí),通過(guò)查詢與所述監(jiān)控指標(biāo)關(guān)聯(lián)的聯(lián)動(dòng)指標(biāo)值的變化,驗(yàn)證所述監(jiān)控指標(biāo)是否真正發(fā)生異常。
一種監(jiān)控指標(biāo)及域值發(fā)現(xiàn)方法,包括:
獲取對(duì)象庫(kù),所述對(duì)象庫(kù)包含被監(jiān)控的系統(tǒng)中的所有對(duì)象,以及每一個(gè)對(duì)象的所有指標(biāo);
根據(jù)所述對(duì)象庫(kù)中的數(shù)據(jù),在設(shè)定時(shí)間段內(nèi)對(duì)被監(jiān)控的系統(tǒng)進(jìn)行掃描,將掃描得到的,與所述對(duì)象庫(kù)中所有對(duì)象的所有指標(biāo)中的某一指標(biāo)相同的,并且未被監(jiān)控的指標(biāo),設(shè)定為監(jiān)控指標(biāo);
根據(jù)設(shè)定時(shí)間段內(nèi)掃描得到的所述監(jiān)控指標(biāo)的指標(biāo)值,計(jì)算得到所述監(jiān)控指標(biāo)的域值范圍。
優(yōu)選地,所述根據(jù)所述對(duì)象庫(kù)中的數(shù)據(jù),在設(shè)定時(shí)間段內(nèi)對(duì)被監(jiān)控的系統(tǒng)進(jìn)行掃描,將掃描得到的,與所述對(duì)象庫(kù)中所有對(duì)象的所有指標(biāo)中的某一指標(biāo)相同的,并且未被監(jiān)控的指標(biāo),設(shè)定為監(jiān)控指標(biāo),包括:
根據(jù)所述對(duì)象庫(kù)中的數(shù)據(jù),在設(shè)定時(shí)間段內(nèi),按照設(shè)定的周期對(duì)被監(jiān)控的系統(tǒng)進(jìn)行掃描;
連續(xù)掃描設(shè)定次數(shù)后,記錄掃描得到的,與所述對(duì)象庫(kù)中所有對(duì)象的所有指標(biāo)中的某一指標(biāo)相同的,并且未被監(jiān)控的指標(biāo);
分別統(tǒng)計(jì)所記錄的指標(biāo)出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)與掃描次數(shù)相同的指標(biāo)設(shè)定為監(jiān)控指標(biāo)。
一種域值調(diào)整方法,包括:
根據(jù)在設(shè)定的時(shí)間段內(nèi)采集的監(jiān)控指標(biāo)的指標(biāo)值,預(yù)測(cè)得到所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的域值范圍;
根據(jù)在所述設(shè)定的時(shí)間段內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)采集的所述監(jiān)控指標(biāo)的指標(biāo)值,以及所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的域值范圍,進(jìn)一步預(yù)測(cè)得到所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)的域值范圍;其中,所述設(shè)定的第二時(shí)間段小于所述設(shè)定的時(shí)間段及所述設(shè)定的第一時(shí)間區(qū)間;
將所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)的域值范圍,調(diào)整為預(yù)測(cè)得到的所述監(jiān)控指標(biāo)在所述第一時(shí)間區(qū)間內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)的域值范圍。
本發(fā)明提出的自動(dòng)監(jiān)控系統(tǒng),包括:自適應(yīng)模塊、采集模塊、比較模塊及告警模塊;其中,自適應(yīng)模塊與采集模塊及比較模塊連接,用于發(fā)現(xiàn)被監(jiān)控的系統(tǒng)中的監(jiān)控指標(biāo),計(jì)算發(fā)現(xiàn)的所述監(jiān)控指標(biāo)的域值范圍,并將所述監(jiān)控指標(biāo)保存到自身的監(jiān)控指標(biāo)庫(kù),以及將所述監(jiān)控指標(biāo)的域值范圍保存到自身的域值范圍數(shù)據(jù)庫(kù);采集模塊在被監(jiān)控的系統(tǒng)中采集所述自適應(yīng)模塊的監(jiān)控指標(biāo)庫(kù)中保存的監(jiān)控指標(biāo)的指標(biāo)值,并將所述指標(biāo)值發(fā)送給比較模塊;比較模塊將采集模塊采集到的監(jiān)控指標(biāo)的指標(biāo)值與自適應(yīng)模塊的域值范圍數(shù)據(jù)庫(kù)中保存的所述監(jiān)控指標(biāo)的域值范圍進(jìn)行對(duì)比,判斷所述監(jiān)控指標(biāo)的指標(biāo)值是否超出所述監(jiān)控指標(biāo)的域值范圍,當(dāng)所述監(jiān)控指標(biāo)的指標(biāo)值超出所述監(jiān)控指標(biāo)的域值范圍時(shí),調(diào)用所述告警模塊發(fā)出警告。本發(fā)明提出的自動(dòng)監(jiān)控系統(tǒng),包含自適應(yīng)模塊,能夠自動(dòng)發(fā)現(xiàn)監(jiān)控指標(biāo),計(jì)算發(fā)現(xiàn)的監(jiān)控指標(biāo)的域值范圍,便于監(jiān)控系統(tǒng)實(shí)現(xiàn)監(jiān)控,節(jié)省人力成本,提高了系統(tǒng)監(jiān)控的時(shí)效性。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。
圖1是本發(fā)明實(shí)施例提供的自動(dòng)監(jiān)控系統(tǒng)的組成結(jié)構(gòu)圖;
圖2是本發(fā)明實(shí)施例提供的一種監(jiān)控指標(biāo)及域值發(fā)現(xiàn)方法的流程示意圖;
圖3是本發(fā)明實(shí)施例提供的另一種監(jiān)控指標(biāo)及域值發(fā)現(xiàn)方法的流程示意圖;
圖4是本發(fā)明實(shí)施例提供的一種域值調(diào)整方法的流程示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明實(shí)施例公開了一種自動(dòng)監(jiān)控系統(tǒng),參見圖1所示,該自動(dòng)監(jiān)控系統(tǒng)包括:
自適應(yīng)模塊101、采集模塊102、比較模塊103、告警模塊104;
其中,所述自適應(yīng)模塊101與所述采集模塊102及所述比較模塊103連接,用于發(fā)現(xiàn)被監(jiān)控的系統(tǒng)中的監(jiān)控指標(biāo),計(jì)算發(fā)現(xiàn)的所述監(jiān)控指標(biāo)的域值范圍,并將所述監(jiān)控指標(biāo)保存到自身的監(jiān)控指標(biāo)庫(kù),以及將所述監(jiān)控指標(biāo)的域值范圍保存到自身的域值范圍數(shù)據(jù)庫(kù);
具體的,在本發(fā)明實(shí)施例提出的自動(dòng)監(jiān)控系統(tǒng)中,除包含常用監(jiān)控系統(tǒng)的采集模塊102、比較模塊103、告警模塊104之外,還增加了自適應(yīng)模塊101。采集模塊102、比較模塊103、告警模塊104能夠?qū)崿F(xiàn)對(duì)設(shè)定監(jiān)控指標(biāo)的監(jiān)控,現(xiàn)有的監(jiān)控系統(tǒng),基本上都是由這三種功能模塊實(shí)現(xiàn)監(jiān)控功能。本發(fā)明實(shí)施例技術(shù)方案中的自動(dòng)監(jiān)控系統(tǒng),不但能實(shí)現(xiàn)現(xiàn)有監(jiān)控系統(tǒng)的監(jiān)控功能,還通過(guò)增加自適應(yīng)模塊101實(shí)現(xiàn)自動(dòng)發(fā)現(xiàn)監(jiān)控指標(biāo),計(jì)算監(jiān)控指標(biāo)域值范圍的功能,使得整個(gè)自動(dòng)監(jiān)控系統(tǒng)能夠自動(dòng)完成監(jiān)控指標(biāo)的增加,在監(jiān)控系統(tǒng)監(jiān)控指標(biāo)項(xiàng)增加過(guò)程中,省去人工操作,并且增加速度快,能提高對(duì)系統(tǒng)監(jiān)控的時(shí)效性。
需要說(shuō)明的是,所述自適應(yīng)模塊101可以被設(shè)置為周期性地對(duì)監(jiān)控系統(tǒng)進(jìn)行掃描,在每個(gè)掃描周期內(nèi),發(fā)現(xiàn)監(jiān)控系統(tǒng)中新出現(xiàn)的可被監(jiān)控的指標(biāo),將新發(fā)現(xiàn)的監(jiān)控指標(biāo)保存到自身監(jiān)控指標(biāo)庫(kù),并且計(jì)算出新發(fā)現(xiàn)的監(jiān)控指標(biāo)的域值范圍,保存到自身域值范圍數(shù)據(jù)庫(kù)。所述自適應(yīng)模塊101還可以被設(shè)置為在需要對(duì)系統(tǒng)進(jìn)行掃描的時(shí)候才被觸發(fā)工作,具體可以靠人工觸發(fā)或事件觸發(fā),例如對(duì)系統(tǒng)升級(jí)時(shí)觸發(fā)自適應(yīng)模塊101工作等。更進(jìn)一步地,根據(jù)被監(jiān)控的系統(tǒng)需求,所述自適應(yīng)模塊101還可以被設(shè)置為持續(xù)工作,為整個(gè)監(jiān)控系統(tǒng)增加監(jiān)控指標(biāo)。另外,所述監(jiān)控指標(biāo)庫(kù)和域值范圍數(shù)據(jù)庫(kù),可以設(shè)置在自適應(yīng)模塊101內(nèi)部,還可以設(shè)置在其它模塊內(nèi)部,還可以獨(dú)立設(shè)置,也就是說(shuō)可以設(shè)置在所述自動(dòng)監(jiān)控系統(tǒng)中的任意部位。本發(fā)明實(shí)施例將所述監(jiān)控指標(biāo)庫(kù)和域值范圍數(shù)據(jù)庫(kù)設(shè)置在自適應(yīng)模塊101內(nèi)部,便于所述自適應(yīng)模塊101進(jìn)行數(shù)據(jù)存儲(chǔ),僅限于說(shuō)明自適應(yīng)模塊101的工作過(guò)程,并不對(duì)所述監(jiān)控指標(biāo)庫(kù)和域值范圍數(shù)據(jù)庫(kù)的位置進(jìn)行嚴(yán)格限定。
綜上所述,在本發(fā)明實(shí)施例提出的自動(dòng)監(jiān)控系統(tǒng)中,設(shè)置了自適應(yīng)模塊101實(shí)現(xiàn)自動(dòng)發(fā)現(xiàn)監(jiān)控指標(biāo)并計(jì)算監(jiān)控指標(biāo)域值范圍的功能,從而使整個(gè)監(jiān)控系統(tǒng)更加自動(dòng)化。本發(fā)明實(shí)施例技術(shù)方案對(duì)所述自適應(yīng)模塊101的具體工作模式不做限定,對(duì)監(jiān)控指標(biāo)庫(kù)和域值范圍數(shù)據(jù)庫(kù)的位置也不做限定,所述自適應(yīng)模塊101的任意一種工作模式,以及所述監(jiān)控指標(biāo)庫(kù)和域值范圍數(shù)據(jù)庫(kù)設(shè)置在自動(dòng)監(jiān)控系統(tǒng)中的任意位置,都在本發(fā)明實(shí)施例保護(hù)范圍內(nèi)。
所述采集模塊102與所述比較模塊103連接,用于在被監(jiān)控的系統(tǒng)中采集所述自適應(yīng)模塊101的監(jiān)控指標(biāo)庫(kù)中保存的監(jiān)控指標(biāo)的指標(biāo)值,并將所述指標(biāo)值發(fā)送給所述比較模塊103;
具體的,所述采集模塊102完成監(jiān)控指標(biāo)的指標(biāo)值的采集工作。采集模塊102按照設(shè)定的周期,采集監(jiān)控系統(tǒng)所監(jiān)控的系統(tǒng)中各個(gè)被監(jiān)控的指標(biāo)的指標(biāo)值,將采集到的指標(biāo)值發(fā)送給比較模塊103,由比較模塊103判斷監(jiān)控的指標(biāo)是否異常。
需要說(shuō)明的是,對(duì)于監(jiān)控指標(biāo)庫(kù)中所有的監(jiān)控指標(biāo),采集模塊102周期性地采集這些監(jiān)控指標(biāo)的指標(biāo)值,并發(fā)送給比較模塊103。當(dāng)自適應(yīng)模塊101在監(jiān)控指標(biāo)庫(kù)中增加了新發(fā)現(xiàn)的監(jiān)控指標(biāo)時(shí),采集模塊102還是周期性地采集監(jiān)控指標(biāo)庫(kù)中所有的監(jiān)控指標(biāo)的指標(biāo)值,因此,對(duì)于整個(gè)自動(dòng)監(jiān)控系統(tǒng)來(lái)說(shuō),更新了所監(jiān)控的內(nèi)容,在整個(gè)監(jiān)控系統(tǒng)中,自動(dòng)增加了監(jiān)控指標(biāo)。
所述比較模塊103與所述告警模塊104連接,用于將所述采集模塊102采集到的監(jiān)控指標(biāo)的指標(biāo)值與所述自適應(yīng)模塊101的域值范圍數(shù)據(jù)庫(kù)中保存的所述監(jiān)控指標(biāo)的域值范圍進(jìn)行對(duì)比,判斷所述監(jiān)控指標(biāo)的指標(biāo)值是否超出所述監(jiān)控指標(biāo)的域值范圍,當(dāng)所述監(jiān)控指標(biāo)的指標(biāo)值超出所述監(jiān)控指標(biāo)的域值范圍時(shí),調(diào)用所述告警模塊104發(fā)出警告;
具體的,所述比較模塊103接收采集模塊102采集的監(jiān)控指標(biāo)的指標(biāo)值,根據(jù)所述指標(biāo)值,比較模塊103從域值范圍數(shù)據(jù)庫(kù)中匹配到該監(jiān)控指標(biāo)的域值范圍,將采集模塊102發(fā)送的該監(jiān)控指標(biāo)的指標(biāo)值與該監(jiān)控指標(biāo)的域值范圍進(jìn)行對(duì)比,即可判斷該監(jiān)控指標(biāo)的指標(biāo)值是否超出該監(jiān)控指標(biāo)的域值范圍,如果沒有超出該監(jiān)控指標(biāo)的域值范圍,則說(shuō)明該監(jiān)控指標(biāo)沒有發(fā)生異常;如果該監(jiān)控指標(biāo)的指標(biāo)值超出該監(jiān)控指標(biāo)的域值范圍,則說(shuō)明該監(jiān)控指標(biāo)發(fā)生了異常,調(diào)用所述告警模塊104發(fā)出警告。
所述告警模塊104,用于在所述比較模塊103判斷監(jiān)控指標(biāo)的指標(biāo)值超出所述監(jiān)控指標(biāo)的域值范圍時(shí),發(fā)出警告。
本發(fā)明提出的自動(dòng)監(jiān)控系統(tǒng),包括:自適應(yīng)模塊、采集模塊、比較模塊及告警模塊;其中,自適應(yīng)模塊與采集模塊及比較模塊連接,用于發(fā)現(xiàn)被監(jiān)控的系統(tǒng)中的監(jiān)控指標(biāo),計(jì)算發(fā)現(xiàn)的所述監(jiān)控指標(biāo)的域值范圍,并將所述監(jiān)控指標(biāo)保存到自身的監(jiān)控指標(biāo)庫(kù),以及將所述監(jiān)控指標(biāo)的域值范圍保存到自身的域值范圍數(shù)據(jù)庫(kù);采集模塊在被監(jiān)控的系統(tǒng)中采集所述自適應(yīng)模塊的監(jiān)控指標(biāo)庫(kù)中保存的監(jiān)控指標(biāo)的指標(biāo)值,并將所述指標(biāo)值發(fā)送給比較模塊;比較模塊將采集模塊采集到的監(jiān)控指標(biāo)的指標(biāo)值與自適應(yīng)模塊的域值范圍數(shù)據(jù)庫(kù)中保存的所述監(jiān)控指標(biāo)的域值范圍進(jìn)行對(duì)比,判斷所述監(jiān)控指標(biāo)的指標(biāo)值是否超出所述監(jiān)控指標(biāo)的域值范圍,當(dāng)所述監(jiān)控指標(biāo)的指標(biāo)值超出所述監(jiān)控指標(biāo)的域值范圍時(shí),調(diào)用所述告警模塊發(fā)出警告。本發(fā)明提出的自動(dòng)監(jiān)控系統(tǒng),包含自適應(yīng)模塊,能夠自動(dòng)發(fā)現(xiàn)監(jiān)控指標(biāo),計(jì)算發(fā)現(xiàn)的監(jiān)控指標(biāo)的域值范圍,便于監(jiān)控系統(tǒng)實(shí)現(xiàn)監(jiān)控,節(jié)省人力成本,提高了系統(tǒng)監(jiān)控的時(shí)效性。
可選的,在本發(fā)明的另一個(gè)實(shí)施例中,所述自適應(yīng)模塊101發(fā)現(xiàn)被監(jiān)控的系統(tǒng)中的監(jiān)控指標(biāo),計(jì)算發(fā)現(xiàn)的所述監(jiān)控指標(biāo)的域值范圍時(shí),具體用于:
獲取對(duì)象庫(kù),所述對(duì)象庫(kù)包含被監(jiān)控的系統(tǒng)中的所有對(duì)象,以及每一個(gè)對(duì)象的所有指標(biāo);
具體的,在構(gòu)建自動(dòng)監(jiān)控系統(tǒng)時(shí),由人工向自動(dòng)監(jiān)控系統(tǒng)錄入被監(jiān)控的應(yīng)用系統(tǒng)中所有的對(duì)象,例如系統(tǒng)進(jìn)程、端口、文件、日志等,以及每個(gè)對(duì)象的所有指標(biāo),例如進(jìn)程的數(shù)量、進(jìn)程占用內(nèi)存大小、端口連接數(shù)目等。這些所有的對(duì)象以及所有對(duì)象的所有指標(biāo),構(gòu)成對(duì)象庫(kù)。所述對(duì)象庫(kù)中的內(nèi)容包含了被監(jiān)控的系統(tǒng)中的所有可能需要監(jiān)控的指標(biāo),并且,對(duì)于一個(gè)穩(wěn)定的系統(tǒng)來(lái)說(shuō),其所有指標(biāo)的總和是穩(wěn)定的,也就是說(shuō),對(duì)于一個(gè)被監(jiān)控的系統(tǒng)來(lái)說(shuō),其對(duì)象庫(kù)中的內(nèi)容是穩(wěn)定不變的,只需在為系統(tǒng)布置監(jiān)控時(shí),在監(jiān)控系統(tǒng)中錄入一次即可?;蛘撸诒槐O(jiān)控的系統(tǒng)發(fā)生比較大的改變(例如系統(tǒng)升級(jí))時(shí),在相應(yīng)的監(jiān)控系統(tǒng)中錄入新的對(duì)象庫(kù)。
需要說(shuō)明的是,所述對(duì)象庫(kù)錄入自動(dòng)監(jiān)控系統(tǒng)后,由自動(dòng)監(jiān)控系統(tǒng)保存,當(dāng)所述自動(dòng)監(jiān)控系統(tǒng)的自適應(yīng)模塊101需要使用所述對(duì)象庫(kù)中的數(shù)據(jù)時(shí),直接從自身存儲(chǔ)裝置中獲取所述對(duì)象庫(kù)即可。
根據(jù)所述對(duì)象庫(kù)中的數(shù)據(jù),在設(shè)定時(shí)間段內(nèi)對(duì)被監(jiān)控的系統(tǒng)進(jìn)行掃描,將掃描得到的,與所述對(duì)象庫(kù)中所有對(duì)象的所有指標(biāo)中的某一指標(biāo)相同的,并且未被監(jiān)控的指標(biāo),設(shè)定為監(jiān)控指標(biāo);
具體的,自適應(yīng)模塊101獲取到對(duì)象庫(kù)后,根據(jù)對(duì)象庫(kù)對(duì)所監(jiān)控的系統(tǒng)進(jìn)行掃描,首先掃描被監(jiān)控系統(tǒng)中的所有對(duì)象,包括進(jìn)程、端口、文件等,當(dāng)掃描到與對(duì)象庫(kù)中保存的對(duì)象相同的對(duì)象時(shí),記錄該對(duì)象,并進(jìn)一步掃描該對(duì)象的所有指標(biāo),當(dāng)掃描到與對(duì)象庫(kù)中該對(duì)象的所有指標(biāo)相同的指標(biāo)時(shí),記錄該指標(biāo)。這樣,就發(fā)現(xiàn)了在實(shí)際系統(tǒng)中需要監(jiān)控的某個(gè)對(duì)象,及該對(duì)象需要監(jiān)控的指標(biāo)。
在被監(jiān)控系統(tǒng)工作過(guò)程中,自動(dòng)監(jiān)控系統(tǒng)的自適應(yīng)模塊101會(huì)周期性地掃描系統(tǒng),以發(fā)現(xiàn)新的監(jiān)控指標(biāo),這時(shí),自適應(yīng)模塊101根據(jù)對(duì)象庫(kù)掃描系統(tǒng)時(shí),會(huì)得到很多指標(biāo),在這些指標(biāo)中,有些指標(biāo)是已經(jīng)被設(shè)定為監(jiān)控指標(biāo)并且正在被監(jiān)控的。如果將這些掃描得到的指標(biāo)都作為新的監(jiān)控指標(biāo),會(huì)造成重復(fù)存儲(chǔ),浪費(fèi)資源。因此,自適應(yīng)模塊101在掃描得到需要監(jiān)控的指標(biāo)時(shí),會(huì)判斷掃描到的指標(biāo)是否已經(jīng)被設(shè)置為監(jiān)控指標(biāo)并且被監(jiān)控,也就是判斷所述指標(biāo)是否已存儲(chǔ)到監(jiān)控指標(biāo)庫(kù)中,如果已經(jīng)存儲(chǔ),則自適應(yīng)模塊101不再將該指標(biāo)設(shè)定為監(jiān)控指標(biāo);如果所述指標(biāo)還沒有被監(jiān)控,則自適應(yīng)模塊101將該指標(biāo)設(shè)定為監(jiān)控指標(biāo)。
根據(jù)設(shè)定時(shí)間段內(nèi)掃描得到的所述監(jiān)控指標(biāo)的指標(biāo)值,計(jì)算得到所述監(jiān)控指標(biāo)的域值范圍。
具體的,當(dāng)自適應(yīng)模塊101掃描新的監(jiān)控指標(biāo)時(shí),會(huì)在設(shè)定時(shí)間段內(nèi)對(duì)系統(tǒng)進(jìn)行掃描,記錄掃描得到的指標(biāo)及該指標(biāo)的指標(biāo)值。對(duì)于某一個(gè)指標(biāo)來(lái)說(shuō),由于自適應(yīng)模塊101會(huì)在設(shè)定時(shí)間段內(nèi)多次掃描,因此,自適應(yīng)模塊101會(huì)記錄其多個(gè)指標(biāo)值。根據(jù)記錄的該指標(biāo)的多個(gè)指標(biāo)值,自適應(yīng)模塊101計(jì)算得到該指標(biāo)的域值范圍。
自適應(yīng)模塊101在計(jì)算該指標(biāo)的域值范圍時(shí),首先通過(guò)去噪算法,去掉采集到的該指標(biāo)的指標(biāo)值中的異常值。具體的,自適應(yīng)模塊101分別統(tǒng)計(jì)采集到的該指標(biāo)的指標(biāo)值中,每個(gè)指標(biāo)值出現(xiàn)的概率,如果某一指標(biāo)值出現(xiàn)的概率小于設(shè)定的概率域值,則認(rèn)為該指標(biāo)值為異常值,將其去掉。對(duì)于去掉異常值后的指標(biāo)值,自適應(yīng)模塊101計(jì)算這些指標(biāo)值的均值,作為該指標(biāo)的穩(wěn)定值,該穩(wěn)定值上下波動(dòng)設(shè)定的百分比所表示的指標(biāo)值范圍,作為該指標(biāo)的域值范圍。
可選的,在本發(fā)明的另一個(gè)實(shí)施例中,所述自適應(yīng)模塊101根據(jù)所述對(duì)象庫(kù)中的數(shù)據(jù),在設(shè)定時(shí)間段內(nèi)對(duì)被監(jiān)控的系統(tǒng)進(jìn)行掃描,將掃描得到的,與所述對(duì)象庫(kù)中所有對(duì)象的所有指標(biāo)中的某一指標(biāo)相同的,并且未被監(jiān)控的指標(biāo),設(shè)定為監(jiān)控指標(biāo)時(shí),具體用于:
根據(jù)所述對(duì)象庫(kù)中的數(shù)據(jù),按照設(shè)定的周期對(duì)被監(jiān)控的系統(tǒng)進(jìn)行掃描;
連續(xù)掃描設(shè)定次數(shù)后,記錄掃描得到的,與所述對(duì)象庫(kù)中所有對(duì)象的所有指標(biāo)中的某一指標(biāo)相同的,并且未被監(jiān)控的指標(biāo);
分別統(tǒng)計(jì)所記錄的指標(biāo)出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)與掃描次數(shù)相同的指標(biāo)設(shè)定為監(jiān)控指標(biāo)。
具體的,為了保證采集質(zhì)量,避免部分突發(fā)因素(比如手工操作調(diào)起進(jìn)程,探測(cè)網(wǎng)絡(luò)端口,短時(shí)間進(jìn)程處理等)導(dǎo)致監(jiān)測(cè)到非常規(guī)的對(duì)象實(shí)例,影響長(zhǎng)期對(duì)象實(shí)例采集,本發(fā)明實(shí)施例設(shè)定自適應(yīng)模塊101按照連續(xù)采集的規(guī)則來(lái)進(jìn)行確認(rèn),將連續(xù)采集到設(shè)定次數(shù)的指標(biāo)設(shè)定為需要監(jiān)控的指標(biāo)。例如,自適應(yīng)模塊101每4個(gè)小時(shí)掃描一次,連續(xù)掃描12次,按照掃描到的次數(shù)對(duì)對(duì)象和指標(biāo)進(jìn)行分類,比如12次全掃描到并且未被監(jiān)控的指標(biāo)歸為一類,掃描到8次到12次并且未被監(jiān)控的指標(biāo)歸為一類,掃描到8次以下并且未被監(jiān)控的指標(biāo)歸為一類。最后,自適應(yīng)模塊101將12次全掃描到的,并且未被監(jiān)控的指標(biāo)設(shè)定為需要監(jiān)控的指標(biāo)。
需要說(shuō)明的是,本發(fā)明實(shí)施例中,自適應(yīng)模塊101按照指標(biāo)被掃描到的次數(shù)決定是否將該指標(biāo)設(shè)定為被監(jiān)控的指標(biāo),具體的,將被掃描到的次數(shù)與掃描次數(shù)相同的,即每次掃描都被掃描到的指標(biāo),設(shè)定為需要被監(jiān)控的指標(biāo)。事實(shí)上,在實(shí)際使用中,可以設(shè)定一個(gè)次數(shù)閾值,來(lái)決定掃描到的指標(biāo)是否可以被設(shè)定為監(jiān)控指標(biāo)。本發(fā)明實(shí)施例相當(dāng)于將次數(shù)閾值設(shè)置為與掃描次數(shù)相同。在實(shí)際使用中,根據(jù)使用需求,可靈活設(shè)定上述次數(shù)閾值。
可選的,在本發(fā)明的另一個(gè)實(shí)施例中,所述自適應(yīng)模塊101還用于:
根據(jù)所述采集模塊102在設(shè)定的時(shí)間段內(nèi)采集的監(jiān)控指標(biāo)的指標(biāo)值,調(diào)整所述監(jiān)控指標(biāo)的域值范圍。
具體的,在應(yīng)用系統(tǒng)及其相對(duì)應(yīng)的監(jiān)控系統(tǒng)正常工作過(guò)程中,為了滿足系統(tǒng)長(zhǎng)期的業(yè)務(wù)發(fā)展需求,自適應(yīng)模塊101能夠根據(jù)所監(jiān)控指標(biāo)的指標(biāo)值的規(guī)律性波動(dòng),對(duì)監(jiān)控指標(biāo)的域值范圍進(jìn)行調(diào)整,減少系統(tǒng)報(bào)警數(shù)量。比如,根據(jù)采集模塊102長(zhǎng)期采集的某一指標(biāo)的指標(biāo)值,自適應(yīng)模塊102分析得到該指標(biāo)值在接下來(lái)的一段時(shí)間內(nèi)指標(biāo)值的變化趨勢(shì),則自適應(yīng)模塊102根據(jù)該指標(biāo)值在接下來(lái)一段時(shí)間的指標(biāo)值變化趨勢(shì),調(diào)整該指標(biāo)值在接下來(lái)一段時(shí)間的域值范圍,使該指標(biāo)值在接下來(lái)一段時(shí)間的域值范圍更符合該指標(biāo)值正常的指標(biāo)值變化趨勢(shì)。
可選的,在本發(fā)明的另一個(gè)實(shí)施例中,所述自適應(yīng)模塊101根據(jù)所述采集模塊102在設(shè)定的時(shí)間段內(nèi)采集的監(jiān)控指標(biāo)的指標(biāo)值,調(diào)整所述監(jiān)控指標(biāo)的域值范圍時(shí),具體用于:
根據(jù)所述采集模塊102在設(shè)定的時(shí)間段內(nèi)采集的監(jiān)控指標(biāo)的指標(biāo)值,預(yù)測(cè)得到所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的域值范圍;
根據(jù)所述采集模塊102在所述設(shè)定的時(shí)間段內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)采集的所述監(jiān)控指標(biāo)的指標(biāo)值,以及所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的域值范圍,進(jìn)一步預(yù)測(cè)得到所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)的域值范圍;其中,所述設(shè)定的第二時(shí)間段小于所述設(shè)定的時(shí)間段及所述設(shè)定的第一時(shí)間區(qū)間;
將所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)的域值范圍,調(diào)整為預(yù)測(cè)得到的所述監(jiān)控指標(biāo)在所述第一時(shí)間區(qū)間內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)的域值范圍。
具體的,對(duì)于一個(gè)系統(tǒng)來(lái)說(shuō),其某個(gè)對(duì)象的某項(xiàng)指標(biāo),在長(zhǎng)期使用過(guò)程中,其指標(biāo)值是按照一定趨勢(shì)變化的,對(duì)于這些監(jiān)控指標(biāo),如果其域值范圍保持不變,就會(huì)導(dǎo)致在監(jiān)控該指標(biāo)時(shí),頻繁報(bào)警,而實(shí)際上該對(duì)象或該指標(biāo)是在正常工作的,這就導(dǎo)致監(jiān)控失靈。
為了滿足系統(tǒng)長(zhǎng)期業(yè)務(wù)發(fā)展需求,本發(fā)明實(shí)施例所述監(jiān)控系統(tǒng)根據(jù)設(shè)定時(shí)間段內(nèi)對(duì)監(jiān)控指標(biāo)的監(jiān)控,自動(dòng)調(diào)整監(jiān)控指標(biāo)的域值范圍,使監(jiān)控系統(tǒng)與被監(jiān)控系統(tǒng)相符合。具體的,在本發(fā)明實(shí)施例所述的自動(dòng)監(jiān)控系統(tǒng)中,自適應(yīng)模塊101根據(jù)采集模塊102在設(shè)定時(shí)間段內(nèi)采集的監(jiān)控指標(biāo)的指標(biāo)值,利用線性回歸算法,預(yù)測(cè)得到在接下來(lái)的設(shè)定的第一時(shí)間區(qū)間內(nèi),該監(jiān)控指標(biāo)的指標(biāo)值域值范圍。例如,自適應(yīng)模塊101根據(jù)采集模塊102在過(guò)去一年內(nèi)采集的某一監(jiān)控指標(biāo)的指標(biāo)值,預(yù)測(cè)得到接下來(lái)一個(gè)月內(nèi)該監(jiān)控指標(biāo)指標(biāo)值的變化趨勢(shì),根據(jù)該變化趨勢(shì),及該監(jiān)控指標(biāo)的穩(wěn)定值,得到該監(jiān)控指標(biāo)在接下來(lái)一個(gè)月的指標(biāo)值域值范圍。
進(jìn)一步的,自適應(yīng)模塊101根據(jù)采集模塊102在所述設(shè)定的時(shí)間段內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)采集的所述監(jiān)控指標(biāo)的指標(biāo)值,以及所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的域值范圍,進(jìn)一步預(yù)測(cè)得到所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)的域值范圍。例如,自適應(yīng)模塊101記錄采集模塊102在過(guò)去一年內(nèi)的每個(gè)月的第一周采集的該監(jiān)控指標(biāo)的指標(biāo)值,根據(jù)這些指標(biāo)值,自適應(yīng)模塊101預(yù)測(cè)得到該監(jiān)控指標(biāo)在接下來(lái)的一個(gè)月內(nèi)的第一周的指標(biāo)值;以此類推,自適應(yīng)模塊101根據(jù)采集模塊102在過(guò)去一年內(nèi)每個(gè)月的第二周、第三周、第四周采集的所述監(jiān)控指標(biāo)的指標(biāo)值,預(yù)測(cè)得到該監(jiān)控指標(biāo)在接下來(lái)一個(gè)月內(nèi)的第二周、第三周、第四周的指標(biāo)值域值范圍。
更進(jìn)一步的,自適應(yīng)模塊101還可以根據(jù)采集模塊102在設(shè)定時(shí)間段采集到的監(jiān)控指標(biāo)的指標(biāo)值,預(yù)測(cè)得到所述監(jiān)控指標(biāo)在接下來(lái)一個(gè)月內(nèi)每天或者每天每時(shí)段的指標(biāo)值域值范圍。理論上,自適應(yīng)模塊101能夠根據(jù)采集模塊102在設(shè)定時(shí)間段內(nèi)采集的監(jiān)控指標(biāo)的指標(biāo)值預(yù)測(cè)得到該監(jiān)控指標(biāo)在接下來(lái)設(shè)定時(shí)間區(qū)間內(nèi)任意時(shí)間段的域值范圍。
自適應(yīng)模塊101預(yù)測(cè)得到監(jiān)控指標(biāo)在接下來(lái)設(shè)定時(shí)間區(qū)間內(nèi)的域值范圍后,用預(yù)測(cè)得到的該監(jiān)控指標(biāo)的指標(biāo)值域值范圍,替換該監(jiān)控指標(biāo)在接下來(lái)設(shè)定時(shí)間區(qū)間內(nèi)的域值范圍。
可選的,在本發(fā)明的另一個(gè)實(shí)施例中,所述自適應(yīng)模塊101還用于:
獲取監(jiān)控指標(biāo)的指標(biāo)值特殊時(shí)期信息,根據(jù)所述指標(biāo)值特殊時(shí)期信息,對(duì)所述監(jiān)控指標(biāo)在特殊時(shí)期的域值范圍進(jìn)行調(diào)整。
具體的,被監(jiān)控系統(tǒng)中的監(jiān)控指標(biāo),可能存在指標(biāo)值特殊時(shí)期,比如在春節(jié)、國(guó)慶節(jié)等特殊節(jié)假日,可能導(dǎo)致被監(jiān)控系統(tǒng)中某個(gè)對(duì)象的某項(xiàng)指標(biāo)突然升高。但是這種突然升高是由真實(shí)的正常情況導(dǎo)致的,不應(yīng)該被認(rèn)為是系統(tǒng)故障而報(bào)警。本發(fā)明實(shí)施例提出的自動(dòng)監(jiān)控系統(tǒng)根據(jù)獲取的監(jiān)控指標(biāo)特殊時(shí)期信息,調(diào)整該監(jiān)控指標(biāo)在特殊時(shí)期的指標(biāo)值域值范圍,使對(duì)該監(jiān)控指標(biāo)的監(jiān)控更符合實(shí)際。
可選的,在本發(fā)明的另一個(gè)實(shí)施例中,所述自適應(yīng)模塊101獲取監(jiān)控指標(biāo)的指標(biāo)值特殊時(shí)期信息,根據(jù)所述指標(biāo)值特殊時(shí)期信息,對(duì)所述監(jiān)控指標(biāo)在特殊時(shí)期的域值范圍進(jìn)行調(diào)整時(shí),具體用于:
獲取監(jiān)控指標(biāo)的指標(biāo)值特殊時(shí)期信息,并從所述指標(biāo)值特殊時(shí)期信息中識(shí)別得到所述監(jiān)控指標(biāo)的指標(biāo)值特殊時(shí)期以及指標(biāo)值變化趨勢(shì);
根據(jù)所述指標(biāo)值變化趨勢(shì),增大所述監(jiān)控指標(biāo)在所述指標(biāo)值特殊時(shí)期的域值范圍。
具體的,由人工向所述自適應(yīng)模塊101輸入某一監(jiān)控指標(biāo)的特殊時(shí)期信息。所述特殊時(shí)期信息包括該監(jiān)控指標(biāo)的特殊時(shí)期時(shí)間段,及在所述特殊時(shí)期,所述監(jiān)控指標(biāo)的變化趨勢(shì)。自適應(yīng)模塊101根據(jù)所述監(jiān)控指標(biāo)在特殊時(shí)期的變化趨勢(shì),調(diào)整該監(jiān)控指標(biāo)在特殊時(shí)期的域值范圍。
例如,假設(shè)人工向自適應(yīng)模塊101輸入某一監(jiān)控指標(biāo)的特殊時(shí)期信息,該信息表明該監(jiān)控指標(biāo)在春節(jié)假期期間指標(biāo)值會(huì)急劇增大,則自適應(yīng)模塊101根據(jù)該信息,上調(diào)該監(jiān)控指標(biāo)在春節(jié)假期期間的指標(biāo)值域值范圍的上限,整體上增大該監(jiān)控指標(biāo)的域值范圍。使得在春節(jié)假期期間,監(jiān)控系統(tǒng)能夠客觀地監(jiān)控該監(jiān)控指標(biāo)。
可選的,在本發(fā)明的另一個(gè)實(shí)施例中,所述比較模塊103,還用于:
對(duì)于存在聯(lián)動(dòng)指標(biāo)值的監(jiān)控指標(biāo),當(dāng)判斷所述監(jiān)控指標(biāo)的指標(biāo)值超出域值范圍時(shí),通過(guò)查詢與所述監(jiān)控指標(biāo)關(guān)聯(lián)的聯(lián)動(dòng)指標(biāo)值的變化,驗(yàn)證所述監(jiān)控指標(biāo)是否真正發(fā)生異常。
具體的,對(duì)于存在指標(biāo)值特殊時(shí)期的監(jiān)控指標(biāo),在增大所述監(jiān)控指標(biāo)的域值范圍的同時(shí),為了更進(jìn)一步地保證客觀地監(jiān)控該監(jiān)控指標(biāo),可以人為地為所述監(jiān)控指標(biāo)增加聯(lián)動(dòng)監(jiān)控指標(biāo)。當(dāng)比較模塊103判斷所述監(jiān)控指標(biāo)的指標(biāo)值已經(jīng)超出所述監(jiān)控指標(biāo)的域值范圍時(shí),進(jìn)一步將所述聯(lián)動(dòng)監(jiān)控指標(biāo)的指標(biāo)值與所述聯(lián)動(dòng)監(jiān)控指標(biāo)的域值范圍進(jìn)行對(duì)比,確認(rèn)所述聯(lián)動(dòng)監(jiān)控指標(biāo)的指標(biāo)值是否伴隨所述監(jiān)控指標(biāo)值的變化而發(fā)生正常的應(yīng)有的變化,如果所述聯(lián)動(dòng)監(jiān)控指標(biāo)的指標(biāo)值發(fā)生了應(yīng)有的變化,則說(shuō)明所述監(jiān)控指標(biāo)的指標(biāo)值超出域值范圍是正常的業(yè)務(wù)導(dǎo)致,并不是系統(tǒng)故障。否則,則說(shuō)明所述監(jiān)控指標(biāo)真的發(fā)生了異常,應(yīng)當(dāng)發(fā)出警報(bào)。
例如,對(duì)于CPU占用率來(lái)說(shuō),當(dāng)對(duì)其監(jiān)控時(shí),為其增加聯(lián)動(dòng)監(jiān)控指標(biāo):處理線程數(shù)。當(dāng)比較模塊103判斷CPU占用率超出其域值范圍時(shí),比較模塊103進(jìn)一步判斷處理線程數(shù)是否超出域值范圍。如果處理線程數(shù)也超出域值范圍,則說(shuō)明CPU占用率超出范圍是因?yàn)樘幚泶罅康木€程造成的,是正常業(yè)務(wù)造成的而不是系統(tǒng)故障,不應(yīng)當(dāng)發(fā)出警報(bào);如果處理線程數(shù)在正常域值范圍內(nèi),則說(shuō)明CPU占用率高不是因?yàn)闃I(yè)務(wù)引起的,應(yīng)當(dāng)發(fā)出警報(bào)?;谏鲜鎏幚?,使得本發(fā)明實(shí)施例提出的自動(dòng)監(jiān)控系統(tǒng)在整體上的監(jiān)控更客觀,更準(zhǔn)確。
本發(fā)明實(shí)施例還公開了一種監(jiān)控指標(biāo)及域值發(fā)現(xiàn)方法,參見圖2所示,包括:
S201、獲取對(duì)象庫(kù),所述對(duì)象庫(kù)包含被監(jiān)控的系統(tǒng)中的所有對(duì)象,以及每一個(gè)對(duì)象的所有指標(biāo);
具體的,由人工錄入被監(jiān)控的應(yīng)用系統(tǒng)中所有的對(duì)象,例如系統(tǒng)進(jìn)程、端口、文件、日志等,以及每個(gè)對(duì)象的所有指標(biāo),例如進(jìn)程的數(shù)量、進(jìn)程占用內(nèi)存大小、端口連接數(shù)目等。這些所有的對(duì)象以及所有對(duì)象的所有指標(biāo),構(gòu)成對(duì)象庫(kù)。所述對(duì)象庫(kù)中的內(nèi)容包含了被監(jiān)控的系統(tǒng)中的所有可能需要監(jiān)控的指標(biāo),并且,對(duì)于一個(gè)穩(wěn)定的系統(tǒng)來(lái)說(shuō),其所有指標(biāo)的總和是穩(wěn)定的,也就是說(shuō),對(duì)于一個(gè)被監(jiān)控的系統(tǒng)來(lái)說(shuō),其對(duì)象庫(kù)中的內(nèi)容是穩(wěn)定不變的,只需在為系統(tǒng)布置監(jiān)控時(shí),錄入一次即可。或者,在被監(jiān)控的系統(tǒng)發(fā)生比較大的改變(例如系統(tǒng)升級(jí))時(shí),錄入新的對(duì)象庫(kù)。
需要說(shuō)明的是,對(duì)于一個(gè)監(jiān)控裝置來(lái)說(shuō),其監(jiān)控的系統(tǒng)的對(duì)象庫(kù)錄入后,由監(jiān)控裝置保存,當(dāng)所述監(jiān)控裝置需要使用所述對(duì)象庫(kù)中的數(shù)據(jù)時(shí),直接從自身存儲(chǔ)裝置中獲取所述對(duì)象庫(kù)即可。
S202、根據(jù)所述對(duì)象庫(kù)中的數(shù)據(jù),在設(shè)定時(shí)間段內(nèi)對(duì)被監(jiān)控的系統(tǒng)進(jìn)行掃描,將掃描得到的,與所述對(duì)象庫(kù)中所有對(duì)象的所有指標(biāo)中的某一指標(biāo)相同的,并且未被監(jiān)控的指標(biāo),設(shè)定為監(jiān)控指標(biāo);
具體的,獲取到對(duì)象庫(kù)后,根據(jù)對(duì)象庫(kù)對(duì)所監(jiān)控的系統(tǒng)進(jìn)行掃描,首先掃描被監(jiān)控系統(tǒng)中的所有對(duì)象,包括進(jìn)程、端口、文件等,當(dāng)掃描到與對(duì)象庫(kù)中保存的對(duì)象相同的對(duì)象時(shí),記錄該對(duì)象,并進(jìn)一步掃描該對(duì)象的所有指標(biāo),當(dāng)掃描到與對(duì)象庫(kù)中該對(duì)象的所有指標(biāo)相同的指標(biāo)時(shí),記錄該指標(biāo)。這樣,就發(fā)現(xiàn)了在實(shí)際系統(tǒng)中需要監(jiān)控的某個(gè)對(duì)象,及該對(duì)象需要監(jiān)控的指標(biāo)。
在被監(jiān)控系統(tǒng)工作過(guò)程中,周期性地掃描該系統(tǒng),以發(fā)現(xiàn)新的監(jiān)控指標(biāo),這時(shí),會(huì)掃描得到很多指標(biāo),在這些指標(biāo)中,有些指標(biāo)是已經(jīng)被設(shè)定為監(jiān)控指標(biāo)并且正在被監(jiān)控的。如果將這些掃描得到的指標(biāo)都作為新的監(jiān)控指標(biāo),會(huì)造成重復(fù)存儲(chǔ),浪費(fèi)資源。因此,在掃描得到需要監(jiān)控的指標(biāo)時(shí),會(huì)判斷掃描到的指標(biāo)是否已經(jīng)被設(shè)置為監(jiān)控指標(biāo)并且被監(jiān)控,也就是判斷所述指標(biāo)是否已存儲(chǔ)到監(jiān)控指標(biāo)庫(kù)中,如果已經(jīng)存儲(chǔ),則不再將該指標(biāo)設(shè)定為監(jiān)控指標(biāo);如果所述指標(biāo)還沒有被監(jiān)控,則將該指標(biāo)設(shè)定為監(jiān)控指標(biāo)。
S203、根據(jù)設(shè)定時(shí)間段內(nèi)掃描得到的所述監(jiān)控指標(biāo)的指標(biāo)值,計(jì)算得到所述監(jiān)控指標(biāo)的域值范圍。
具體的,當(dāng)掃描尋找新的監(jiān)控指標(biāo)時(shí),在設(shè)定時(shí)間段內(nèi)對(duì)系統(tǒng)進(jìn)行掃描,記錄掃描得到的指標(biāo)及該指標(biāo)的指標(biāo)值。對(duì)于某一個(gè)指標(biāo)來(lái)說(shuō),由于在設(shè)定時(shí)間段內(nèi)會(huì)被掃描多次,因此,會(huì)記錄其多個(gè)指標(biāo)值。根據(jù)記錄的該指標(biāo)的多個(gè)指標(biāo)值,計(jì)算得到該指標(biāo)的域值范圍。
在計(jì)算該指標(biāo)的域值范圍時(shí),首先通過(guò)去噪算法,去掉采集到的該指標(biāo)的指標(biāo)值中的異常值。具體的,分別統(tǒng)計(jì)采集到的該指標(biāo)的指標(biāo)值中,每個(gè)指標(biāo)值出現(xiàn)的概率,如果某一指標(biāo)值出現(xiàn)的概率小于設(shè)定的概率域值,則認(rèn)為該指標(biāo)值為異常值,將其去掉。對(duì)于去掉異常值后的指標(biāo)值,計(jì)算這些指標(biāo)值的均值,作為該指標(biāo)的穩(wěn)定值,該穩(wěn)定值上下波動(dòng)設(shè)定的百分比所表示的指標(biāo)值范圍,作為該指標(biāo)的域值范圍。
本發(fā)明實(shí)施例提出的監(jiān)控指標(biāo)及域值發(fā)現(xiàn)方法,首先獲取對(duì)象庫(kù),所述對(duì)象庫(kù)包含被監(jiān)控的系統(tǒng)中的所有對(duì)象,以及每一個(gè)對(duì)象的所有指標(biāo);然后根據(jù)所述對(duì)象庫(kù)中的數(shù)據(jù),在設(shè)定時(shí)間段內(nèi)對(duì)被監(jiān)控的系統(tǒng)進(jìn)行掃描,將掃描得到的,與所述對(duì)象庫(kù)中所有對(duì)象的所有指標(biāo)中的某一指標(biāo)相同的,并且未被監(jiān)控的指標(biāo),設(shè)定為監(jiān)控指標(biāo);最后根據(jù)設(shè)定時(shí)間段內(nèi)掃描得到的所述監(jiān)控指標(biāo)的指標(biāo)值,計(jì)算得到所述監(jiān)控指標(biāo)的域值范圍。上述方法能夠以系統(tǒng)的對(duì)象庫(kù)為基礎(chǔ),自動(dòng)掃描得到監(jiān)控指標(biāo),并且計(jì)算得到所述監(jiān)控指標(biāo)的域值范圍,能夠代替人工完成查找及發(fā)現(xiàn)監(jiān)控指標(biāo)的工作,節(jié)省勞動(dòng)力。
可選的,在本發(fā)明的另一個(gè)實(shí)施例中,參見圖3所示,所述根據(jù)所述對(duì)象庫(kù)中的數(shù)據(jù),在設(shè)定時(shí)間段內(nèi)對(duì)被監(jiān)控的系統(tǒng)進(jìn)行掃描,將掃描得到的,與所述對(duì)象庫(kù)中所有對(duì)象的所有指標(biāo)中的某一指標(biāo)相同的,并且未被監(jiān)控的指標(biāo),設(shè)定為監(jiān)控指標(biāo),包括:
S302、根據(jù)所述對(duì)象庫(kù)中的數(shù)據(jù),在設(shè)定時(shí)間段內(nèi),按照設(shè)定的周期對(duì)被監(jiān)控的系統(tǒng)進(jìn)行掃描;
具體的,為了保證采集質(zhì)量,避免部分突發(fā)因素(比如手工操作調(diào)起進(jìn)程,探測(cè)網(wǎng)絡(luò)端口,短時(shí)間進(jìn)程處理等)導(dǎo)致監(jiān)測(cè)到非常規(guī)的對(duì)象實(shí)例,影響長(zhǎng)期對(duì)象實(shí)例采集,本發(fā)明實(shí)施例設(shè)定按照連續(xù)采集的規(guī)則來(lái)進(jìn)行確認(rèn),將連續(xù)采集到設(shè)定次數(shù)的指標(biāo)設(shè)定為需要監(jiān)控的指標(biāo)。
例如,本發(fā)明實(shí)施例設(shè)定每4個(gè)小時(shí)對(duì)被監(jiān)控的系統(tǒng)進(jìn)行一次掃描。
S303、連續(xù)掃描設(shè)定次數(shù)后,記錄掃描得到的,與所述對(duì)象庫(kù)中所有對(duì)象的所有指標(biāo)中的某一指標(biāo)相同的,并且未被監(jiān)控的指標(biāo);
具體的,在掃描過(guò)程中,如果發(fā)現(xiàn)某一指標(biāo)與對(duì)象庫(kù)中的某一指標(biāo)相同,則進(jìn)一步查看該指標(biāo)是否已保存在監(jiān)控指標(biāo)庫(kù)中,如果該指標(biāo)沒有保存在監(jiān)控指標(biāo)庫(kù)中,則記錄該指標(biāo);反之,則將該指標(biāo)丟棄。
S304、分別統(tǒng)計(jì)所記錄的指標(biāo)出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)與掃描次數(shù)相同的指標(biāo)設(shè)定為監(jiān)控指標(biāo)。
例如,連續(xù)掃描12次,按照掃描到的次數(shù)對(duì)對(duì)象和指標(biāo)進(jìn)行分類,比如12次全掃描到并且未被保存到監(jiān)控指標(biāo)庫(kù)的指標(biāo)歸為一類,掃描到8次到12次并且未被保存到監(jiān)控指標(biāo)庫(kù)的指標(biāo)歸為一類,掃描到8次以下并且未被保存到監(jiān)控指標(biāo)庫(kù)的指標(biāo)歸為一類。最后,將12次全掃描到的,并且未被保存到監(jiān)控指標(biāo)庫(kù)的指標(biāo)設(shè)定為需要監(jiān)控的指標(biāo)。
需要說(shuō)明的是,本發(fā)明實(shí)施例中,按照指標(biāo)被掃描到的次數(shù)決定是否將該指標(biāo)設(shè)定為被監(jiān)控的指標(biāo),具體的,將被掃描到的次數(shù)與掃描次數(shù)相同的,即每次掃描都被掃描到的指標(biāo),設(shè)定為需要被監(jiān)控的指標(biāo)。事實(shí)上,在實(shí)際使用中,可以設(shè)定一個(gè)次數(shù)閾值,來(lái)決定掃描到的指標(biāo)是否可以被設(shè)定為監(jiān)控指標(biāo)。本發(fā)明實(shí)施例相當(dāng)于將次數(shù)閾值設(shè)置為與掃描次數(shù)相同。在實(shí)際使用中,根據(jù)使用需求,可靈活設(shè)定上述次數(shù)閾值。
本發(fā)明實(shí)施例中的步驟S301、S305分別對(duì)應(yīng)圖2所示的方法的實(shí)施例中的步驟S201、S203,其具體內(nèi)容請(qǐng)參見圖2所示的方法實(shí)施例的內(nèi)容,此處不再贅述。
本發(fā)明實(shí)施例還公開了一種域值調(diào)整方法,參見圖4所示,包括:
S401、根據(jù)在設(shè)定的時(shí)間段內(nèi)采集的監(jiān)控指標(biāo)的指標(biāo)值,預(yù)測(cè)得到所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的域值范圍;
具體的,對(duì)于一個(gè)系統(tǒng)來(lái)說(shuō),其某個(gè)對(duì)象的某項(xiàng)指標(biāo),在長(zhǎng)期使用過(guò)程中,其指標(biāo)值是按照一定趨勢(shì)變化的,對(duì)于這些監(jiān)控指標(biāo),如果其域值范圍保持不變,就會(huì)導(dǎo)致在監(jiān)控該指標(biāo)時(shí),頻繁報(bào)警,而實(shí)際上該對(duì)象或該指標(biāo)是在正常工作的,這就導(dǎo)致監(jiān)控失靈。
為了滿足系統(tǒng)長(zhǎng)期業(yè)務(wù)發(fā)展需求,本發(fā)明實(shí)施例根據(jù)設(shè)定時(shí)間段內(nèi)對(duì)監(jiān)控指標(biāo)的監(jiān)控,自動(dòng)調(diào)整監(jiān)控指標(biāo)的域值范圍。具體的,在本發(fā)明實(shí)施例中,根據(jù)在設(shè)定時(shí)間段內(nèi)采集的監(jiān)控指標(biāo)的指標(biāo)值,利用線性回歸算法,預(yù)測(cè)得到在接下來(lái)的設(shè)定的第一時(shí)間區(qū)間內(nèi),該監(jiān)控指標(biāo)的指標(biāo)值域值范圍。例如,根據(jù)在過(guò)去一年內(nèi)采集的某一監(jiān)控指標(biāo)的指標(biāo)值,預(yù)測(cè)得到接下來(lái)一個(gè)月內(nèi)該監(jiān)控指標(biāo)指標(biāo)值的變化趨勢(shì),根據(jù)該變化趨勢(shì),及該監(jiān)控指標(biāo)的穩(wěn)定值,得到該監(jiān)控指標(biāo)在接下來(lái)一個(gè)月的指標(biāo)值域值范圍。
S402、根據(jù)在所述設(shè)定的時(shí)間段內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)采集的所述監(jiān)控指標(biāo)的指標(biāo)值,以及所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的域值范圍,進(jìn)一步預(yù)測(cè)得到所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)的域值范圍;其中,所述設(shè)定的第二時(shí)間段小于所述設(shè)定的時(shí)間段及所述設(shè)定的第一時(shí)間區(qū)間;
具體的,例如,記錄在過(guò)去一年內(nèi)的每個(gè)月的第一周采集的該監(jiān)控指標(biāo)的指標(biāo)值,根據(jù)這些指標(biāo)值,預(yù)測(cè)得到該監(jiān)控指標(biāo)在接下來(lái)的一個(gè)月內(nèi)的第一周的指標(biāo)值;以此類推,根據(jù)在過(guò)去一年內(nèi)每個(gè)月的第二周、第三周、第四周采集的所述監(jiān)控指標(biāo)的指標(biāo)值,預(yù)測(cè)得到該監(jiān)控指標(biāo)在接下來(lái)一個(gè)月內(nèi)的第二周、第三周、第四周的指標(biāo)值域值范圍。
更進(jìn)一步的,還可以根據(jù)在設(shè)定時(shí)間段采集到的監(jiān)控指標(biāo)的指標(biāo)值,預(yù)測(cè)得到所述監(jiān)控指標(biāo)在接下來(lái)一個(gè)月內(nèi)每天或者每天每時(shí)段的指標(biāo)值域值范圍。理論上,本發(fā)明實(shí)施例技術(shù)方案能夠根據(jù)在設(shè)定時(shí)間段內(nèi)采集的監(jiān)控指標(biāo)的指標(biāo)值預(yù)測(cè)得到該監(jiān)控指標(biāo)在接下來(lái)設(shè)定時(shí)間區(qū)間內(nèi)任意時(shí)間段的域值范圍。
S403、將所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)的域值范圍,調(diào)整為預(yù)測(cè)得到的所述監(jiān)控指標(biāo)在所述第一時(shí)間區(qū)間內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)的域值范圍。
具體的,用預(yù)測(cè)得到的該監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)的指標(biāo)值域值范圍,替換該監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)的域值范圍。
本發(fā)明實(shí)施例提出的域值調(diào)整方法,首先根據(jù)在設(shè)定的時(shí)間段內(nèi)采集的監(jiān)控指標(biāo)的指標(biāo)值,預(yù)測(cè)得到所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的域值范圍;然后根據(jù)在所述設(shè)定的時(shí)間段內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)采集的所述監(jiān)控指標(biāo)的指標(biāo)值,以及所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的域值范圍,進(jìn)一步預(yù)測(cè)得到所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)的域值范圍;其中,所述設(shè)定的第二時(shí)間段小于所述設(shè)定的時(shí)間段及所述設(shè)定的第一時(shí)間區(qū)間;最后將所述監(jiān)控指標(biāo)在設(shè)定的第一時(shí)間區(qū)間內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)的域值范圍,調(diào)整為預(yù)測(cè)得到的所述監(jiān)控指標(biāo)在所述第一時(shí)間區(qū)間內(nèi)的每個(gè)設(shè)定的第二時(shí)間段內(nèi)的域值范圍。上述技術(shù)方案能夠根據(jù)過(guò)去設(shè)定時(shí)間段內(nèi)對(duì)監(jiān)控指標(biāo)的指標(biāo)值的采集,預(yù)測(cè)得到今后設(shè)定時(shí)間段內(nèi)所述監(jiān)控指標(biāo)的指標(biāo)值范圍,根據(jù)所述指標(biāo)值范圍調(diào)整所述監(jiān)控指標(biāo)在今后設(shè)定時(shí)間段內(nèi)的域值范圍,完成了對(duì)域值范圍的自動(dòng)調(diào)整,能夠代替人工勞動(dòng)。
對(duì)所公開的實(shí)施例的上述說(shuō)明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對(duì)這些實(shí)施例的多種修改對(duì)本領(lǐng)域的專業(yè)技術(shù)人員來(lái)說(shuō)將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實(shí)施例中實(shí)現(xiàn)。因此,本發(fā)明將不會(huì)被限制于本文所示的這些實(shí)施例,而是要符合與本文所公開的原理和新穎特點(diǎn)相一致的最寬的范圍。