本發(fā)明屬于網(wǎng)絡(luò)通信技術(shù)領(lǐng)域,具體涉及一種基于概率統(tǒng)計(jì)的網(wǎng)絡(luò)設(shè)備告警消息風(fēng)暴的處理方法和裝置。
背景技術(shù):
隨著移動(dòng)通信網(wǎng)絡(luò)的迅猛商用,2G、3G、LTE網(wǎng)絡(luò)逐步實(shí)現(xiàn)融合,網(wǎng)絡(luò)結(jié)構(gòu)日益復(fù)雜,網(wǎng)絡(luò)所承載的業(yè)務(wù)量逐年遞增。當(dāng)某個(gè)關(guān)鍵設(shè)備出現(xiàn)故障時(shí),會(huì)產(chǎn)生大量消息上報(bào)到網(wǎng)絡(luò)設(shè)備故障管理系統(tǒng),此時(shí)可能會(huì)導(dǎo)致故障監(jiān)控不及時(shí)、甚至無(wú)法監(jiān)控,繼而導(dǎo)致故障處理不及時(shí),如果消息數(shù)量超過(guò)系統(tǒng)的處理容量,則會(huì)給系統(tǒng)造成巨大的壓力,甚至癱瘓。及時(shí)有效地監(jiān)控網(wǎng)絡(luò)故障,并在第一時(shí)間進(jìn)行處理,成為當(dāng)代運(yùn)營(yíng)商面臨的首要問(wèn)題,對(duì)故障監(jiān)控系統(tǒng)所提供數(shù)據(jù)的及時(shí)性、準(zhǔn)確性、有效性、高可靠性提出了更高的要求。目前的故障管理系統(tǒng)雖然日臻完善,但是,當(dāng)網(wǎng)絡(luò)出現(xiàn)重大告警,告警數(shù)據(jù)量激增,即出現(xiàn)消息風(fēng)暴時(shí),消息量達(dá)到故障管理系統(tǒng)瓶頸時(shí),故障管理系統(tǒng)提供給監(jiān)控人員數(shù)據(jù)還是會(huì)出現(xiàn)數(shù)據(jù)處理緩慢、告警上報(bào)延遲、監(jiān)控不及時(shí)、處理不及時(shí),甚至故障管理系統(tǒng)癱瘓等問(wèn)題。
例如:當(dāng)某個(gè)運(yùn)營(yíng)支持系統(tǒng)(OSS,Operation and support system)在短時(shí)間內(nèi)出現(xiàn)某個(gè)網(wǎng)元的大量告警時(shí),會(huì)產(chǎn)生如下三方面影響:
(1)大量無(wú)實(shí)際意義的告警消息出現(xiàn)在監(jiān)控臺(tái),影響了監(jiān)控人員發(fā)現(xiàn)并處理正常的網(wǎng)元告警,包括網(wǎng)元重大告警。
(2)對(duì)大量的風(fēng)暴告警的解析,消耗了大量的CPU時(shí)間,可能會(huì)在解析時(shí)發(fā)生內(nèi)存溢出,導(dǎo)致告警監(jiān)控延遲。
(3)由于采集缺少對(duì)告警風(fēng)暴進(jìn)行一定的預(yù)測(cè)與消息歸并的機(jī)制,遇到消息風(fēng)暴時(shí),整個(gè)故障管理系統(tǒng)系統(tǒng)處于被動(dòng)的高負(fù)荷狀態(tài)。
目前,針對(duì)告警消息風(fēng)暴目前的處理方案主要有三種:
(1)消息風(fēng)暴同正常消息相同處理。然而,該方案無(wú)法預(yù)知網(wǎng)絡(luò)故障,當(dāng)發(fā)生消息風(fēng)暴時(shí),采用無(wú)風(fēng)暴時(shí)的處理方案,將消息風(fēng)暴等同于正常消息來(lái)處理。此方案導(dǎo)致進(jìn)程消耗大量的硬件資源,包括大量CPU、內(nèi)存、存儲(chǔ)、以及時(shí)間,并且可能會(huì)導(dǎo)致解析消息時(shí)內(nèi)存溢出、處理滯后。同時(shí),監(jiān)控臺(tái)出現(xiàn)大量故障的重復(fù)信息,導(dǎo)致處理不及時(shí),最終延誤了重大故障的監(jiān)控和處理,給運(yùn)營(yíng)商帶來(lái)一定的經(jīng)濟(jì)損失。
(2)人為設(shè)置告警過(guò)濾規(guī)則,將滿(mǎn)足此規(guī)則的告警消息過(guò)濾掉,即直接將滿(mǎn)足此規(guī)則的告警數(shù)據(jù)丟棄。然而,此方案同樣增加了消息處理的負(fù)荷,并且造成了告警數(shù)據(jù)丟失,影響了告警數(shù)據(jù)的完整性。此方案只能根據(jù)經(jīng)驗(yàn)來(lái)設(shè)置告警過(guò)濾規(guī)則,當(dāng)規(guī)則預(yù)設(shè)置不當(dāng)時(shí),同樣會(huì)造成故障管理系統(tǒng)的壓力,浪費(fèi)系統(tǒng)資源。
(3)人為設(shè)置閾值作為告警消息的風(fēng)暴數(shù)量閾值,如果消息風(fēng)暴超過(guò)此閾值,那么直接丟棄后續(xù)消息不處理。然而,此方案需要根據(jù)經(jīng)驗(yàn)預(yù)先設(shè)定閾值,但是消息風(fēng)暴的閾值一般很難預(yù)定。如果閾值過(guò)小,那么正常消息會(huì)被丟棄,正常告警無(wú)法監(jiān)控;如果閾值過(guò)大,那么當(dāng)實(shí)際產(chǎn)生告警風(fēng)暴時(shí),無(wú)法將告警消息風(fēng)暴過(guò)濾掉。
然而,以上方案依然不能完美地解決告警風(fēng)暴出現(xiàn)時(shí)面臨的問(wèn)題和帶來(lái)的影響。
技術(shù)實(shí)現(xiàn)要素:
為解決以上現(xiàn)有技術(shù)中存在的問(wèn)題,本發(fā)明提出了一種基于概率統(tǒng)計(jì)的網(wǎng)絡(luò)設(shè)備告警消息風(fēng)暴的處理方法和裝置。
根據(jù)本發(fā)明的一個(gè)方面,本發(fā)明提供了一種網(wǎng)絡(luò)設(shè)備告警消息風(fēng)暴的處理方法,所述方法包括如下步驟:
(1)設(shè)定被監(jiān)控網(wǎng)元,建立網(wǎng)元模型;
(2)創(chuàng)建網(wǎng)元告警規(guī)則引擎,基于源告警信息實(shí)時(shí)生成適配規(guī)則的網(wǎng)元告警數(shù)據(jù);
(3)取當(dāng)前滑動(dòng)時(shí)間窗口中的網(wǎng)元告警數(shù)據(jù)實(shí)時(shí)統(tǒng)計(jì)網(wǎng)元告警數(shù)量,使用概率統(tǒng)計(jì)方法動(dòng)態(tài)生成置信區(qū)間和閾值,所述的滑動(dòng)時(shí)間窗口包括多個(gè)順序的時(shí)間單位;
(4)根據(jù)所述告警數(shù)量和閾值判斷當(dāng)前滑動(dòng)時(shí)間窗口后一條告警消息的類(lèi)型,如果告警數(shù)量高于上限閾值則所述告警消息為風(fēng)暴消息并進(jìn)行風(fēng)暴預(yù)警,如果告警數(shù)量低于下限閾值則所述告警消息為解除風(fēng)暴消息并解除風(fēng)暴預(yù)警,否則為正常告警消息;
(5)基于當(dāng)前滑動(dòng)時(shí)間窗口向后滑動(dòng)一個(gè)時(shí)間單位,進(jìn)入下一個(gè)滑動(dòng)時(shí)間窗口,轉(zhuǎn)到上述步驟(3)。
優(yōu)選的,所述步驟(3)中的方法為:
(31)根據(jù)步驟(2)獲取的網(wǎng)元告警數(shù)據(jù),計(jì)算當(dāng)前滑動(dòng)時(shí)間窗口中的每個(gè)時(shí)間單位的網(wǎng)元告警數(shù)量,并作為統(tǒng)計(jì)參數(shù);
(32)將統(tǒng)計(jì)參數(shù)進(jìn)行均值計(jì)算、標(biāo)準(zhǔn)差計(jì)算、置信區(qū)間計(jì)算,求得置信區(qū)間的上下限,得到統(tǒng)計(jì)閾值;
(33)確定當(dāng)前置信區(qū)間的上限為告警風(fēng)暴的閾值,確定當(dāng)前置信區(qū)間的下限為解除告警風(fēng)暴的閾值。
優(yōu)選的,所述步驟(4)中判斷告警消息類(lèi)型后進(jìn)一步的方法為:
如果告警消息類(lèi)型為風(fēng)暴消息則生成風(fēng)暴預(yù)警消息,通知直通監(jiān)控窗口直接呈現(xiàn);如果告警消息類(lèi)型為解除風(fēng)暴消息則生成解除風(fēng)暴預(yù)警消息,通知直通監(jiān)控窗口直接呈現(xiàn);如果告警消息類(lèi)型為正常消息,則輸出到普通窗口中顯示。
優(yōu)選的,所述步驟(4)中的通知直通監(jiān)控窗口直接呈現(xiàn)的具體方法為:將風(fēng)暴預(yù)警消息和/或解除風(fēng)暴預(yù)警消息通知監(jiān)控客戶(hù)端,觸發(fā)監(jiān)控客戶(hù)端彈出直通監(jiān)控窗口,將風(fēng)暴預(yù)警消息和/或解除風(fēng)暴預(yù)警消息及發(fā)生風(fēng)暴的網(wǎng)元模型信息在直通監(jiān)控窗口直接呈現(xiàn)。
優(yōu)選的,所述步驟(2)具體為:
(21)根據(jù)網(wǎng)元模型數(shù)據(jù)生成網(wǎng)元告警規(guī)則;
(22)獲取源告警信息并執(zhí)行所述網(wǎng)元告警規(guī)則,得到適配的網(wǎng)元告警消息;
(23)將適配的網(wǎng)元告警消息保存到網(wǎng)元告警數(shù)據(jù)緩沖區(qū)。
優(yōu)選的,所述的網(wǎng)元告警數(shù)據(jù)緩沖區(qū)是一個(gè)網(wǎng)元告警數(shù)據(jù)檢索鏈表。
優(yōu)選的,滑動(dòng)時(shí)間窗口設(shè)為1或2小時(shí),時(shí)間單位設(shè)為半分鐘或1分鐘。
根據(jù)本發(fā)明的另一個(gè)方面,本發(fā)明還提供了一種網(wǎng)絡(luò)設(shè)備告警消息風(fēng)暴的處理裝置,所述裝置包括如下模塊:
網(wǎng)元模型建立模塊,用于設(shè)定被監(jiān)控網(wǎng)元,建立網(wǎng)元模型。
告警規(guī)則引擎模塊,用于創(chuàng)建網(wǎng)元告警規(guī)則引擎,基于源告警信息實(shí)時(shí)生成適配規(guī)則的網(wǎng)元告警數(shù)據(jù);
統(tǒng)計(jì)和閾值生成模塊,取當(dāng)前滑動(dòng)時(shí)間窗口中的網(wǎng)元告警數(shù)據(jù)實(shí)時(shí)統(tǒng)計(jì)網(wǎng)元告警數(shù)量,使用概率統(tǒng)計(jì)方法動(dòng)態(tài)生成置信區(qū)間和閾值,所述的滑動(dòng)時(shí)間窗口包括多個(gè)順序的時(shí)間單位;
判斷和預(yù)警模塊,根據(jù)告警數(shù)量和統(tǒng)計(jì)和閾值生成模塊生成的閾值判斷當(dāng)前滑動(dòng)時(shí)間窗口后一條告警消息的類(lèi)型,如果告警數(shù)量高于上限閾值則所述告警消息為風(fēng)暴消息并進(jìn)行風(fēng)暴預(yù)警,如果告警數(shù)量低于下限閾值則所述告警消息為解除風(fēng)暴消息并解除風(fēng)暴預(yù)警,否則為正常告警消息;
調(diào)整滑動(dòng)時(shí)間窗口模塊,基于當(dāng)前滑動(dòng)時(shí)間窗口向后滑動(dòng)一個(gè)時(shí)間單位,形成下一個(gè)滑動(dòng)時(shí)間窗口,轉(zhuǎn)到統(tǒng)計(jì)和閾值生成模塊。
優(yōu)選的,所述告警規(guī)則引擎模塊,包括規(guī)則生成模塊、規(guī)則執(zhí)行模塊、寫(xiě)緩沖區(qū)模塊;
其中,規(guī)則生成模塊,根據(jù)網(wǎng)元模型數(shù)據(jù)生成網(wǎng)元告警規(guī)則;
規(guī)則執(zhí)行模塊,獲取源告警信息并執(zhí)行所述網(wǎng)元告警規(guī)則,得到適配的網(wǎng)元告警消息;
寫(xiě)緩沖區(qū)模塊將所述適配的網(wǎng)元告警消息保存到網(wǎng)元告警數(shù)據(jù)緩沖區(qū)。
優(yōu)選的,統(tǒng)計(jì)和閾值生成模塊包括:
統(tǒng)計(jì)參數(shù)獲取模塊,根據(jù)告警規(guī)則引擎模塊獲得的網(wǎng)元告警數(shù)據(jù),計(jì)算當(dāng)前滑動(dòng)時(shí)間窗口中的每個(gè)時(shí)間單位的網(wǎng)元告警數(shù)量,并作為統(tǒng)計(jì)參數(shù);
統(tǒng)計(jì)閾值計(jì)算模塊,將統(tǒng)計(jì)參數(shù)進(jìn)行均值計(jì)算、標(biāo)準(zhǔn)差計(jì)算、置信區(qū)間計(jì)算,求得置信區(qū)間的上下限,得到統(tǒng)計(jì)閾值;
閾值確定模塊,確定當(dāng)前置信區(qū)間的上限為告警風(fēng)暴的閾值,確定當(dāng)前置信區(qū)間的下限為解除告警風(fēng)暴的閾值。
優(yōu)選的,所述的判斷和預(yù)警模塊還具有如下功能:
如果告警消息類(lèi)型為風(fēng)暴消息則生成風(fēng)暴預(yù)警消息,通知直通監(jiān)控窗口直接呈現(xiàn);如果告警消息類(lèi)型為解除風(fēng)暴消息則生成解除風(fēng)暴預(yù)警消息,通知直通監(jiān)控窗口直接呈現(xiàn);如果告警消息類(lèi)型為正常消息,則輸出到普通窗口中顯示。
優(yōu)選的,所述的網(wǎng)元告警數(shù)據(jù)緩沖區(qū)是一個(gè)網(wǎng)元告警數(shù)據(jù)檢索鏈表。
本發(fā)明具有如下特點(diǎn)及優(yōu)勢(shì):
(1)采用規(guī)則引擎,來(lái)適配各類(lèi)網(wǎng)元的告警消息,使每個(gè)網(wǎng)元告警都可以有效監(jiān)控。
(2)采用概率統(tǒng)計(jì)算法對(duì)告警消息量做統(tǒng)計(jì)和分析,計(jì)算單位時(shí)間內(nèi)某個(gè)網(wǎng)元的消息量,自動(dòng)生成其預(yù)警閾值。并采用移動(dòng)窗口,自動(dòng)更改所生成的閾值。
(3)在保證告警數(shù)據(jù)的完整性和及時(shí)性的基礎(chǔ)上實(shí)現(xiàn)了自動(dòng)地、及時(shí)地監(jiān)控和處理故障。
本方法及裝置能根據(jù)不同網(wǎng)元在不同時(shí)間段動(dòng)態(tài)自動(dòng)生成風(fēng)暴閾值,進(jìn)一步地以滑動(dòng)的觀(guān)察窗口方式產(chǎn)生某個(gè)時(shí)間段的相對(duì)閾值,很好地控制了當(dāng)前觀(guān)察窗口的告警風(fēng)暴的數(shù)量,因此,當(dāng)網(wǎng)絡(luò)設(shè)備發(fā)生告警消息風(fēng)暴時(shí),可以降低故障管理系統(tǒng)的數(shù)據(jù)處理壓力。
上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說(shuō)明書(shū)的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的具體實(shí)施方式。
附圖說(shuō)明
通過(guò)閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
圖1為本發(fā)明優(yōu)選實(shí)施例一的一種基于概率統(tǒng)計(jì)的網(wǎng)絡(luò)設(shè)備告警消息風(fēng)暴的處理方法流程圖。
圖2為網(wǎng)元的數(shù)據(jù)結(jié)構(gòu)示意圖。
圖3為本發(fā)明優(yōu)選實(shí)施例的統(tǒng)計(jì)閾值計(jì)算的流程圖。
圖4為本發(fā)明優(yōu)選實(shí)施例的風(fēng)暴告警時(shí)直通窗口呈現(xiàn)效果圖。
圖5為本發(fā)明優(yōu)選實(shí)施例的風(fēng)暴預(yù)警解除時(shí)直通窗口呈現(xiàn)的效果圖。
圖6為本發(fā)明的告警消息正文示意圖。
圖7為當(dāng)收到實(shí)時(shí)的新告警消息時(shí)解析具體的告警正文結(jié)果圖。
圖8為本發(fā)明優(yōu)選實(shí)施例的一種基于概率統(tǒng)計(jì)的網(wǎng)絡(luò)設(shè)備告警消息風(fēng)暴的處理裝置的模塊圖。
圖9為本發(fā)明優(yōu)選實(shí)施例的統(tǒng)計(jì)閾值計(jì)算模塊的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將參照附圖更詳細(xì)地描述本公開(kāi)的示例性實(shí)施例。雖然附圖中顯示了本公開(kāi)的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開(kāi)而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開(kāi),并且能夠?qū)⒈竟_(kāi)的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
首先,本發(fā)明中使用了如下所述的技術(shù)手段,以下對(duì)本發(fā)明中出現(xiàn)的基礎(chǔ)數(shù)理概念做出簡(jiǎn)介,而在后續(xù)的具體實(shí)施例中不再贅述:
本發(fā)明采用均值、標(biāo)準(zhǔn)差、置信區(qū)間等概率論與數(shù)理統(tǒng)計(jì)的工具,實(shí)現(xiàn)了消息風(fēng)暴發(fā)生閾值/告警風(fēng)暴解除閾值的自動(dòng)計(jì)算、動(dòng)態(tài)生成。
均值(Expected Mean),又叫期望、平均數(shù),表示樣本統(tǒng)計(jì)量的集中趨勢(shì)的程度,是指在一組數(shù)據(jù)中所有數(shù)據(jù)之和,再除以這組數(shù)據(jù)的個(gè)數(shù)。均值是反映數(shù)據(jù)集中趨勢(shì)的一項(xiàng)指標(biāo)。
標(biāo)準(zhǔn)差(Standard Deviation),作為統(tǒng)計(jì)的分布程度的測(cè)量,是每個(gè)個(gè)體的測(cè)量值與總體均值之差的平方和的算術(shù)平方根,反映了總體內(nèi)個(gè)體的偏離程度。
置信區(qū)間(Confidence interval),是指由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的區(qū)間估計(jì),展現(xiàn)了總體參數(shù)的真實(shí)值,有多大概率落在測(cè)量結(jié)果的周?chē)秶某潭取?/p>
總體(Population),是指客觀(guān)存在的、在同一性質(zhì)基礎(chǔ)上結(jié)合起來(lái)的許多個(gè)別單位的整體,即研究對(duì)象的某項(xiàng)指標(biāo)的取值的集合或全體。總體參數(shù)是指總體中對(duì)某變量的概括性描述,比如說(shuō)總體的均值、標(biāo)準(zhǔn)差等。樣本(Sample)是從總體中抽出的一部分個(gè)體。本發(fā)明中,以所有的告警消息,作為總體;以一個(gè)滑動(dòng)窗口(60分鐘為例)的告警消息作為樣本,計(jì)算其均值、標(biāo)準(zhǔn)差,來(lái)推斷總體的均值、標(biāo)準(zhǔn)差。
具體地,根據(jù)本發(fā)明的一個(gè)方面,如圖1所示,提供了一種基于概率統(tǒng)計(jì)的網(wǎng)絡(luò)設(shè)備告警消息風(fēng)暴的處理方法,所述方法包括如下步驟:
S101、設(shè)定被監(jiān)控網(wǎng)元,建立網(wǎng)元模型。
本發(fā)明以網(wǎng)元為監(jiān)控對(duì)象,因此,首先要建立網(wǎng)元模型,包括網(wǎng)元名稱(chēng)、網(wǎng)元類(lèi)型、網(wǎng)元id、采集點(diǎn)、設(shè)備廠(chǎng)家、所屬地市等資源信息,保存到配置文件。網(wǎng)元的數(shù)據(jù)結(jié)構(gòu)示例如圖2所示。
S102、創(chuàng)建網(wǎng)元告警規(guī)則引擎,基于源告警信息實(shí)時(shí)生成適配規(guī)則的網(wǎng)元告警數(shù)據(jù)。
一般來(lái)說(shuō),源告警信息通過(guò)告警采集系統(tǒng)得到。
由于源告警信息中包含了大量的各種各樣的告警信息,為了迅速找出S101所設(shè)定的網(wǎng)元的告警信息,過(guò)濾掉其他非關(guān)注信息,利用規(guī)則匹配的方法是快捷的。因此要?jiǎng)?chuàng)建規(guī)則引擎,用于建立網(wǎng)元告警規(guī)則,通過(guò)正則表達(dá)式選擇出相關(guān)網(wǎng)元的告警,這包括網(wǎng)元告警規(guī)則的生成與規(guī)則執(zhí)行兩部分。
S103、取當(dāng)前滑動(dòng)時(shí)間窗口中的網(wǎng)元告警數(shù)據(jù)實(shí)時(shí)統(tǒng)計(jì)網(wǎng)元告警數(shù)量,使用概率統(tǒng)計(jì)方法動(dòng)態(tài)生成置信區(qū)間和閾值,所述的滑動(dòng)時(shí)間窗口包括多個(gè)順序的時(shí)間單位。
滑動(dòng)時(shí)間窗口是指按時(shí)間順序取的觀(guān)察窗口,再滑動(dòng)一個(gè)時(shí)間單位再次形成下一個(gè)滑動(dòng)時(shí)間窗口。例如,步驟S102獲取了100分鐘的告警數(shù)據(jù),那么取第1分鐘-第60分鐘為第一個(gè)滑動(dòng)時(shí)間窗口,然后取第2分鐘-第61分鐘為第二個(gè)滑動(dòng)時(shí)間窗口,以此類(lèi)推?;瑒?dòng)時(shí)間窗口可以根據(jù)實(shí)際需要設(shè)定,如設(shè)為60分鐘,時(shí)間單位設(shè)為1分鐘。
本步驟使用概率統(tǒng)計(jì)方法每次動(dòng)態(tài)生成當(dāng)前滑動(dòng)時(shí)間窗口內(nèi)的告警數(shù)據(jù)的置信區(qū)間和閾值,隨著滑動(dòng)時(shí)間窗口的移動(dòng),每次生成的置信區(qū)間和閾值有所不同。
S104、根據(jù)所述告警數(shù)量和閾值判斷當(dāng)前滑動(dòng)時(shí)間窗口后一條告警消息的類(lèi)型,如果告警數(shù)量高于上限閾值則所述告警消息為風(fēng)暴消息并進(jìn)行風(fēng)暴預(yù)警,如果告警數(shù)量低于下限閾值則所述告警消息為解除風(fēng)暴消息并解除風(fēng)暴預(yù)警,否則為正常告警消息。
當(dāng)?shù)?分鐘-第60分鐘的滑動(dòng)時(shí)間窗口中告警數(shù)量的上下限閾值計(jì)算出來(lái)之后,此步驟判斷第61分鐘的告警消息類(lèi)型,進(jìn)行風(fēng)暴預(yù)警,或者解除風(fēng)暴預(yù)警,或者不預(yù)警。
S105、基于當(dāng)前滑動(dòng)時(shí)間窗口向后滑動(dòng)一個(gè)時(shí)間單位,進(jìn)入下一個(gè)滑動(dòng)時(shí)間窗口,轉(zhuǎn)到上述步驟S103。
此方法技術(shù)方案實(shí)現(xiàn)了實(shí)時(shí)生成消息風(fēng)暴的產(chǎn)生和解除的閾值,采用滑動(dòng)窗口動(dòng)態(tài)計(jì)算,解決了不同網(wǎng)元對(duì)于消息風(fēng)暴產(chǎn)生不同閾值、分別動(dòng)態(tài)生成閾值的問(wèn)題。
以下具體說(shuō)明使用概率統(tǒng)計(jì)方法動(dòng)態(tài)生成置信區(qū)間和閾值的過(guò)程:
步驟S1031、根據(jù)上述步驟S102獲取的網(wǎng)元告警數(shù)據(jù),計(jì)算當(dāng)前滑動(dòng)時(shí)間窗口中的每個(gè)時(shí)間單位的網(wǎng)元告警數(shù)量,并作為統(tǒng)計(jì)參數(shù);
在本實(shí)施例中,將滑動(dòng)時(shí)間窗口設(shè)為1小時(shí),將當(dāng)前窗口即最近的一個(gè)小時(shí)中某個(gè)網(wǎng)元的告警消息作為總體,統(tǒng)計(jì)每分鐘的消息量,即總體中包含60個(gè)統(tǒng)計(jì)參數(shù),N=60。在下一分鐘到來(lái)后,在時(shí)間軸上,將60個(gè)統(tǒng)計(jì)參數(shù),整體平移1分鐘,向右滑動(dòng)一個(gè)窗口,丟棄前面第1分鐘的統(tǒng)計(jì)值。如此,始終保持最近60分鐘的消息量,作為總體。
步驟S1032、將統(tǒng)計(jì)參數(shù)進(jìn)行均值計(jì)算、標(biāo)準(zhǔn)差計(jì)算、置信區(qū)間計(jì)算,求得置信區(qū)間的上下限,得到統(tǒng)計(jì)閾值;
如圖3所示,統(tǒng)計(jì)閾值計(jì)算包括如下三個(gè)子步驟:
S10321、均值計(jì)算
均值,是把總體中所有的觀(guān)測(cè)值求和,除以總體中觀(guān)察值的個(gè)數(shù)。計(jì)算公式為:
其中Xi是第i分鐘的告警消息總數(shù)。
以網(wǎng)元CDHSS1為例,最近1小時(shí)里,每分鐘的告警消息數(shù)(60個(gè)測(cè)量值)的均值為200個(gè)。
S10322、標(biāo)準(zhǔn)差計(jì)算
實(shí)驗(yàn)結(jié)果在期望值附近的分散程度,由標(biāo)準(zhǔn)差來(lái)衡量。
其中μ為總體平均值,N為總體中的觀(guān)測(cè)值的個(gè)數(shù)。
以網(wǎng)元CDHSS1為例,最近1小時(shí)里,每分鐘的告警消息數(shù)的標(biāo)準(zhǔn)差為103。
S10323、置信區(qū)間計(jì)算與閾值生成
根據(jù)數(shù)理統(tǒng)計(jì),當(dāng)總體方差已知時(shí),采用z標(biāo)準(zhǔn)正態(tài)分布,來(lái)構(gòu)建總體均值的置信區(qū)間??傮w均值μ的(1-α)置信區(qū)間是:
其中α表示顯著性水平,是估計(jì)總體參數(shù)落在某一區(qū)間內(nèi),可能犯錯(cuò)誤的概率。此發(fā)明中,設(shè)定α=5%,即以95%(1-5%)作為置信度。查標(biāo)準(zhǔn)正態(tài)分布表,Z0.05/2=1.96。
置信區(qū)間的下限為:
置信區(qū)間的上限為:
也就是說(shuō),有95%的置信度,每分鐘的告警消息量,應(yīng)該在(172,233)的區(qū)間范圍內(nèi)。
步驟S1033、確定當(dāng)前置信區(qū)間的上限為告警風(fēng)暴的閾值,確定當(dāng)前置信區(qū)間的下限為解除告警風(fēng)暴的閾值。
將置信區(qū)間上限233,作為告警風(fēng)暴的閾值。如果最近1分鐘的消息量超過(guò)前60分鐘的平均值233,那么認(rèn)為發(fā)生了告警風(fēng)暴。將置信區(qū)間下限172,作為解除告警風(fēng)暴的閾值。如果消息量小于172,則認(rèn)為告警風(fēng)暴已經(jīng)解除。
然后,總體統(tǒng)計(jì)值的時(shí)間窗口,整體平移1分鐘,加入新近1分鐘的消息量,去掉前面第1分鐘的消息量,重新計(jì)算出總體的新的均值和標(biāo)準(zhǔn)差,生成下1分鐘的消息量的置信區(qū)間。
當(dāng)判斷出有告警風(fēng)暴時(shí),為了迅速觀(guān)察到告警風(fēng)暴的情況,通過(guò)下述進(jìn)一步方法給運(yùn)營(yíng)維護(hù)人員直觀(guān)的通知。
如果告警消息類(lèi)型為風(fēng)暴消息則生成風(fēng)暴預(yù)警消息,通知直通監(jiān)控窗口直接呈現(xiàn);如果告警消息類(lèi)型為解除風(fēng)暴消息則生成解除風(fēng)暴預(yù)警消息,通知直通監(jiān)控窗口直接呈現(xiàn);如果告警消息類(lèi)型為正常消息,則輸出到普通窗口中顯示。
如圖4所示,當(dāng)告警數(shù)據(jù)累加最近1分鐘的告警消息個(gè)數(shù)達(dá)到240,即超過(guò)風(fēng)暴閾值上限233,為本實(shí)施例的風(fēng)暴告警時(shí)直通窗口呈現(xiàn)效果圖,可見(jiàn),由該效果圖可以直觀(guān)的顯示風(fēng)暴消息,從而解決了由于經(jīng)過(guò)其他環(huán)節(jié)繁瑣處理導(dǎo)致消息延遲、大量無(wú)用消息在監(jiān)控臺(tái)呈現(xiàn)、正常消息無(wú)法正常監(jiān)控、大量占用系統(tǒng)資源的問(wèn)題。
風(fēng)暴數(shù)量小于置信區(qū)間的下限時(shí),則清除掉此網(wǎng)元的風(fēng)暴預(yù)警,通知直通窗口,并自動(dòng)解除該網(wǎng)元消息的正常解析。如圖5所述,為風(fēng)暴預(yù)警解除時(shí)直通窗口呈現(xiàn)的效果圖。
正常告警消息時(shí)啟動(dòng)普通監(jiān)控窗口。該狀態(tài)是平時(shí)當(dāng)告警消息風(fēng)暴沒(méi)有出現(xiàn)時(shí)的普通狀態(tài),對(duì)正常消息保持著普通監(jiān)控即可。
進(jìn)一步地,通知直通監(jiān)控窗口直接呈現(xiàn)的具體方法為:將預(yù)警消息通知監(jiān)控客戶(hù)端,觸發(fā)監(jiān)控客戶(hù)端彈出直通監(jiān)控窗口,將風(fēng)暴預(yù)警消息和/或解除風(fēng)暴預(yù)警消息及發(fā)生風(fēng)暴的網(wǎng)元模型信息在直通監(jiān)控窗口直接呈現(xiàn)。
本發(fā)明實(shí)施例通過(guò)觸發(fā)監(jiān)控客戶(hù)端自動(dòng)彈出風(fēng)暴監(jiān)控直通窗口,能夠及時(shí)發(fā)送告警風(fēng)暴預(yù)警通知,自動(dòng)彈出的監(jiān)控窗口,將消息完整上送,通知監(jiān)控臺(tái)。由于繞過(guò)其他處理環(huán)節(jié),保證了故障的及時(shí)監(jiān)控,從而及時(shí)提示使用者處理故障。
所述創(chuàng)建網(wǎng)元告警規(guī)則引擎,基于源告警信息實(shí)時(shí)生成適配規(guī)則的網(wǎng)元告警數(shù)據(jù)的方法,可以分三步實(shí)現(xiàn),舉例:
S1021、根據(jù)網(wǎng)元模型數(shù)據(jù)生成網(wǎng)元告警規(guī)則;
根據(jù)網(wǎng)元模型信息,生成匹配網(wǎng)元的正則表達(dá)式描述為如下形式,可以保存到網(wǎng)元適配文件中:
extract_pattern=$userlabel"網(wǎng)元名稱(chēng)\s*=\s*([^\n]+)\n"
extract_pattern=$object_class"網(wǎng)元類(lèi)型\s*=\s*(\S+)\s*\n"
extract_pattern=$ne_mark"網(wǎng)元標(biāo)識(shí)\s*=\s*([^\n]+)\n"
所述的正則表達(dá)式將相關(guān)網(wǎng)元的告警關(guān)鍵信息(比如網(wǎng)元名稱(chēng)、網(wǎng)元類(lèi)型、告警發(fā)生時(shí)間等),抽象成模式匹配規(guī)則。
S1022、獲取源告警信息并執(zhí)行所述網(wǎng)元告警規(guī)則,得到適配的網(wǎng)元告警消息;
執(zhí)行S1021建立的網(wǎng)元告警規(guī)則引擎,實(shí)時(shí)地獲取源告警信息并處理,如圖6收到實(shí)時(shí)的新告警消息,從新告警信息找出與規(guī)則適配的相關(guān)網(wǎng)元告警信息,圖7是告警正文解析的結(jié)果。
S1023、將適配的網(wǎng)元告警消息保存到網(wǎng)元告警數(shù)據(jù)緩沖區(qū)。
將每一個(gè)單位時(shí)間的網(wǎng)元告警信息按時(shí)間順序?qū)懭刖W(wǎng)元告警緩存區(qū)。
例如存入網(wǎng)元數(shù)據(jù)檢索鏈表,包括網(wǎng)元模型信息和網(wǎng)元相關(guān)告警信息。這是一個(gè)靈活的便于在尾部增加數(shù)據(jù),在頭部去掉數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu),對(duì)于本實(shí)施例的實(shí)現(xiàn)效果突出,方便快捷。
根據(jù)本發(fā)明的另一個(gè)方面如圖8所示,還提供了一種基于概率統(tǒng)計(jì)的網(wǎng)絡(luò)設(shè)備告警消息風(fēng)暴的處理裝置,所述裝置包括如下模塊:
網(wǎng)元模型建立模塊M101,用于設(shè)定被監(jiān)控網(wǎng)元,建立網(wǎng)元模型。
在這個(gè)模塊中,以網(wǎng)元為監(jiān)控對(duì)象建立網(wǎng)元模型,建立網(wǎng)元的數(shù)學(xué)結(jié)構(gòu),保存各類(lèi)網(wǎng)元的屬性,包括網(wǎng)元名稱(chēng)、采集點(diǎn)、設(shè)備廠(chǎng)家、所屬地市等資源信息。可以保存到配置文件。網(wǎng)元的數(shù)據(jù)結(jié)構(gòu)示例如圖2所示。
告警規(guī)則引擎模塊M102,用于創(chuàng)建網(wǎng)元告警規(guī)則引擎,基于源告警信息實(shí)時(shí)獲取適配規(guī)則的網(wǎng)元告警數(shù)據(jù)。
由于源告警信息中包含了大量的各種各樣的告警信息,為了迅速找出S101所設(shè)定的網(wǎng)元的告警信息,過(guò)濾掉其他非關(guān)注信息,利用規(guī)則匹配的方法是快捷的。因此要?jiǎng)?chuàng)建規(guī)則引擎,用于建立網(wǎng)元告警規(guī)則并選擇出相關(guān)網(wǎng)元的告警,這包括網(wǎng)元告警規(guī)則的生成與規(guī)則執(zhí)行兩部分。
統(tǒng)計(jì)和閾值生成模塊M103,取當(dāng)前滑動(dòng)時(shí)間窗口中的網(wǎng)元告警數(shù)據(jù)實(shí)時(shí)統(tǒng)計(jì)網(wǎng)元告警數(shù)量,使用概率統(tǒng)計(jì)方法動(dòng)態(tài)生成置信區(qū)間和閾值,所述的滑動(dòng)時(shí)間窗口包括多個(gè)順序的時(shí)間單位。
滑動(dòng)時(shí)間窗口是指按時(shí)間順序取的觀(guān)察窗口,再滑動(dòng)一個(gè)時(shí)間單位再次形成下一個(gè)滑動(dòng)時(shí)間窗口。例如,步驟S102獲取了100分鐘的告警數(shù)據(jù),那么取第1分鐘-第60分鐘為第一個(gè)滑動(dòng)時(shí)間窗口,然后取第2分鐘-第61分鐘為第二個(gè)滑動(dòng)時(shí)間窗口,以此類(lèi)推。滑動(dòng)時(shí)間窗口可以根據(jù)實(shí)際需要設(shè)定,如設(shè)為60分鐘,時(shí)間單位設(shè)為1分鐘。
本模塊使用概率統(tǒng)計(jì)方法每次動(dòng)態(tài)生成當(dāng)前滑動(dòng)時(shí)間窗口內(nèi)的告警數(shù)據(jù)的置信區(qū)間和閾值,隨著滑動(dòng)時(shí)間窗口的移動(dòng),每次生成的置信區(qū)間和閾值有所不同。
判斷和預(yù)警模塊M104,根據(jù)統(tǒng)計(jì)和閾值生成模塊生成的閾值判斷當(dāng)前滑動(dòng)時(shí)間窗口后一條告警消息的類(lèi)型,如果高于上限閾值為風(fēng)暴消息則進(jìn)行風(fēng)暴預(yù)警,如果低于下限閾值為解除風(fēng)暴消息則解除風(fēng)暴預(yù)警,否則為正常告警消息。
當(dāng)?shù)?分鐘-第60分鐘的滑動(dòng)時(shí)間窗口中告警數(shù)量的上下限閾值計(jì)算出來(lái)之后,此步驟判斷第61分鐘的告警消息類(lèi)型,進(jìn)行風(fēng)暴預(yù)警,或者解除風(fēng)暴預(yù)警,或者不預(yù)警。
調(diào)整滑動(dòng)時(shí)間窗口模塊M105,基于當(dāng)前滑動(dòng)時(shí)間窗口向后滑動(dòng)一個(gè)時(shí)間單位,形成下一個(gè)滑動(dòng)時(shí)間窗口,轉(zhuǎn)到統(tǒng)計(jì)和閾值生成模塊。
此裝置方案實(shí)現(xiàn)了實(shí)時(shí)生成消息風(fēng)暴的產(chǎn)生和解除的閾值,采用滑動(dòng)窗口動(dòng)態(tài)計(jì)算,解決了不同網(wǎng)元對(duì)于消息風(fēng)暴產(chǎn)生不同閾值、分別動(dòng)態(tài)生成閾值的問(wèn)題。
所述告警規(guī)則引擎模塊M102具體可以包括規(guī)則生成模塊、規(guī)則執(zhí)行模塊、寫(xiě)緩沖區(qū)模塊;其中,規(guī)則生成模塊,根據(jù)網(wǎng)元模型數(shù)據(jù)生成網(wǎng)元告警規(guī)則;
根據(jù)網(wǎng)元模型信息,生成匹配網(wǎng)元的正則表達(dá)式描述為如下形式,保存到網(wǎng)元適配文件中:
extract_pattern=$userlabel"網(wǎng)元名稱(chēng)\s*=\s*([^\n]+)\n"
extract_pattern=$object_class"網(wǎng)元類(lèi)型\s*=\s*(\S+)\s*\n"
extract_pattern=$ne_mark"網(wǎng)元標(biāo)識(shí)\s*=\s*([^\n]+)\n"
所述的正則表達(dá)式將相關(guān)網(wǎng)元的告警關(guān)鍵信息(比如網(wǎng)元名稱(chēng)、網(wǎng)元類(lèi)型、告警發(fā)生時(shí)間等),抽象成模式匹配規(guī)則。
規(guī)則執(zhí)行模塊,獲取源告警信息并執(zhí)行規(guī)則生成模塊生成的網(wǎng)元告警規(guī)則,得到適配的網(wǎng)元告警消息;如圖6收到實(shí)時(shí)的新告警消息,從新告警信息找出與規(guī)則適配的相關(guān)網(wǎng)元告警信息,圖7是告警正文解析的結(jié)果。
寫(xiě)緩沖區(qū)模塊將所述適配的網(wǎng)元告警消息保存到網(wǎng)元告警數(shù)據(jù)緩沖區(qū)。
將每一個(gè)單位時(shí)間的網(wǎng)元告警信息按時(shí)間順序?qū)懭刖W(wǎng)元告警緩存區(qū)。
例如存入網(wǎng)元數(shù)據(jù)檢索鏈表,包括網(wǎng)元模型信息和網(wǎng)元相關(guān)告警信息。這是一個(gè)靈活的便于在尾部增加數(shù)據(jù),在頭部去掉數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu),對(duì)于本實(shí)施例的實(shí)現(xiàn)效果突出,方便快捷。
統(tǒng)計(jì)和閾值生成模塊M103具體可以包括:統(tǒng)計(jì)參數(shù)獲取模塊,根據(jù)告警規(guī)則引擎模塊獲得的網(wǎng)元告警數(shù)據(jù),計(jì)算當(dāng)前滑動(dòng)時(shí)間窗口中的每個(gè)時(shí)間單位的網(wǎng)元告警數(shù)量,并作為統(tǒng)計(jì)參數(shù);統(tǒng)計(jì)閾值計(jì)算模塊,將統(tǒng)計(jì)參數(shù)進(jìn)行均值計(jì)算、標(biāo)準(zhǔn)差計(jì)算、置信區(qū)間計(jì)算,求得置信區(qū)間的上下限,得到統(tǒng)計(jì)閾值;閾值確定模塊,確定當(dāng)前置信區(qū)間的上限為告警風(fēng)暴的閾值,確定當(dāng)前置信區(qū)間的下限為解除告警風(fēng)暴的閾值。
在本實(shí)施例中,將滑動(dòng)時(shí)間窗口設(shè)為1小時(shí),將當(dāng)前窗口即最近的一個(gè)小時(shí)中某個(gè)網(wǎng)元的告警消息作為總體,統(tǒng)計(jì)每分鐘的消息量,即總體中包含60個(gè)統(tǒng)計(jì)參數(shù),N=60。在下一分鐘到來(lái)后,在時(shí)間軸上,將60個(gè)統(tǒng)計(jì)參數(shù),整體平移1分鐘,向右滑動(dòng)一個(gè)窗口,丟棄前面第1分鐘的統(tǒng)計(jì)值。如此,始終保持最近60分鐘的消息量,作為總體。
具體地,如圖9所示,上述統(tǒng)計(jì)閾值計(jì)算模塊包括如下三個(gè)單元:
均值計(jì)算單元231、標(biāo)準(zhǔn)差計(jì)算單元232、置信區(qū)間判斷單元233。
均值,是把總體中所有的觀(guān)測(cè)值求和,除以總體中觀(guān)察值的個(gè)數(shù)。計(jì)算公式為:
其中Xi是第i分鐘的告警消息總數(shù)。
以網(wǎng)元CDHSS1為例,最近1小時(shí)里,每分鐘的告警消息數(shù)(60個(gè)測(cè)量值)的均值為200個(gè)。
實(shí)驗(yàn)結(jié)果在期望值附近的分散程度,由標(biāo)準(zhǔn)差來(lái)衡量。
其中μ為總體平均值,N為總體中的觀(guān)測(cè)值的個(gè)數(shù)。
以網(wǎng)元CDHSS1為例,最近1小時(shí)里,每分鐘的告警消息數(shù)的標(biāo)準(zhǔn)差為103。
根據(jù)數(shù)理統(tǒng)計(jì),當(dāng)總體方差已知時(shí),采用z標(biāo)準(zhǔn)正態(tài)分布,來(lái)構(gòu)建總體均值的置信區(qū)間??傮w均值μ的(1-α)置信區(qū)間是:
其中α表示顯著性水平,是估計(jì)總體參數(shù)落在某一區(qū)間內(nèi),可能犯錯(cuò)誤的概率。此發(fā)明中,設(shè)定α=5%,即以95%(1-5%)作為置信度。查標(biāo)準(zhǔn)正態(tài)分布表,Z0.05/2=1.96。
置信區(qū)間的下限為:
置信區(qū)間的上限為:
也就是說(shuō),有95%的置信度,每分鐘的告警消息量,應(yīng)該在(172,233)的區(qū)間范圍內(nèi)。將置信區(qū)間上限233,作為告警風(fēng)暴的閾值。如果最近1分鐘的消息量超過(guò)前60分鐘的平均值233,那么認(rèn)為發(fā)生了告警風(fēng)暴。將置信區(qū)間下限172,作為解除告警風(fēng)暴的閾值。如果消息量小于172,則認(rèn)為告警風(fēng)暴已經(jīng)解除。
然后,總體統(tǒng)計(jì)值的時(shí)間窗口,整體平移1分鐘,加入新近1分鐘的消息量,去掉前面第1分鐘的消息量,重新計(jì)算出總體的新的均值和標(biāo)準(zhǔn)差,生成下1分鐘的消息量的置信區(qū)間。
判斷和預(yù)警模塊M104,還包括:如果告警消息類(lèi)型為風(fēng)暴消息則生成風(fēng)暴預(yù)警消息,通知直通監(jiān)控窗口直接呈現(xiàn);如果告警消息類(lèi)型為解除風(fēng)暴消息則生成解除風(fēng)暴預(yù)警消息,通知直通監(jiān)控窗口直接呈現(xiàn);如果告警消息類(lèi)型為正常消息,則輸出到普通窗口中顯示。。
如圖4所示,當(dāng)告警采集累加最近1分鐘的告警消息個(gè)數(shù)達(dá)到240,即超過(guò)風(fēng)暴閾值上限233,為本實(shí)施例的風(fēng)暴告警時(shí)直通窗口呈現(xiàn)效果圖,可見(jiàn),由該效果圖可以直觀(guān)的顯示風(fēng)暴消息,從而解決了由于經(jīng)過(guò)其他環(huán)節(jié)繁瑣處理導(dǎo)致消息延遲、大量無(wú)用消息在監(jiān)控臺(tái)呈現(xiàn)、正常消息無(wú)法正常監(jiān)控、大量占用系統(tǒng)資源的問(wèn)題。
風(fēng)暴數(shù)量小于置信區(qū)間的下限時(shí),則清除掉此網(wǎng)元的風(fēng)暴預(yù)警,通知直通窗口,并自動(dòng)解除該網(wǎng)元消息的正常解析。如圖5所述,為風(fēng)暴預(yù)警解除時(shí)直通窗口呈現(xiàn)的效果圖。
正常告警消息時(shí)啟動(dòng)普通監(jiān)控窗口。該狀態(tài)是平時(shí)當(dāng)告警消息風(fēng)暴沒(méi)有出現(xiàn)時(shí)的普通狀態(tài),對(duì)正常消息保持著普通監(jiān)控即可。
進(jìn)一步地,通知直通監(jiān)控窗口直接呈現(xiàn)具體為:將預(yù)警消息通知監(jiān)控客戶(hù)端,觸發(fā)監(jiān)控客戶(hù)端彈出直通監(jiān)控窗口,將風(fēng)暴預(yù)警消息和/或解除風(fēng)暴預(yù)警消息及發(fā)生風(fēng)暴的網(wǎng)元模型信息在直通監(jiān)控窗口直接呈現(xiàn)。
本發(fā)明實(shí)施例通過(guò)觸發(fā)監(jiān)控客戶(hù)端自動(dòng)彈出風(fēng)暴監(jiān)控直通窗口,能夠及時(shí)發(fā)送告警風(fēng)暴預(yù)警通知,自動(dòng)彈出的監(jiān)控窗口,將消息完整上送,通知監(jiān)控臺(tái)。由于繞過(guò)其他處理環(huán)節(jié),保證了故障的及時(shí)監(jiān)控,從而及時(shí)提示使用者處理故障。
根據(jù)本發(fā)明的又一個(gè)方面,優(yōu)選地,消息風(fēng)暴除提供了上述觸發(fā)直通窗口呈現(xiàn)的必選方案外還提供其他兩種備選處理方案。
(1)將消息報(bào)文存儲(chǔ)成文件,待后續(xù)處理。
消息風(fēng)暴發(fā)生時(shí),故障管理系統(tǒng)數(shù)據(jù)壓力過(guò)大,達(dá)到處理瓶頸,將消息報(bào)文寫(xiě)入到文件中,待風(fēng)暴解除后,消息閾值低于閾值時(shí),程序再處理文件中消息報(bào)文,從而保證了數(shù)據(jù)的完整性。
(2)將消息補(bǔ)充屬性后存儲(chǔ)到數(shù)據(jù)庫(kù)。
發(fā)生風(fēng)暴時(shí),風(fēng)暴預(yù)警消息通過(guò)直通窗口呈現(xiàn),未補(bǔ)充資源屬性。待風(fēng)暴解除后,系統(tǒng)自動(dòng)加載風(fēng)暴期間的消息數(shù)據(jù),進(jìn)行解析,補(bǔ)充屬性,標(biāo)準(zhǔn)化處理,入庫(kù)保存。
綜合本發(fā)明的具體實(shí)施方式可以看出,本發(fā)明解決在保證數(shù)據(jù)完整型、準(zhǔn)確性、有效性的基礎(chǔ)上,解決了消息風(fēng)暴發(fā)生時(shí)出現(xiàn)的如下問(wèn)題:
1、大量無(wú)意義消息出現(xiàn)在監(jiān)控臺(tái)上,影響了監(jiān)控人員對(duì)正常告警的監(jiān)控。
2、對(duì)大量消息的處理,占用了大量系統(tǒng)資源、消耗了大量CPU時(shí)間,增加故障監(jiān)控系統(tǒng)負(fù)荷,甚至造成系統(tǒng)癱瘓。
3、對(duì)大量無(wú)意義消息的處理造成了消息處理內(nèi)存溢出、消息延遲,告警無(wú)法監(jiān)控到,從而無(wú)法處理。
4、由于采集缺少對(duì)告警風(fēng)暴進(jìn)行一定的預(yù)測(cè)與風(fēng)暴告警歸并的機(jī)制,遇到告警風(fēng)暴時(shí),整個(gè)故障系統(tǒng)處于被動(dòng)狀態(tài)。
需要說(shuō)明的是:
在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬裝置或者其它設(shè)備固有相關(guān)。各種通用裝置也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類(lèi)裝置所要求的結(jié)構(gòu)是顯而易見(jiàn)的。此外,本發(fā)明也不針對(duì)任何特定編程語(yǔ)言。應(yīng)當(dāng)明白,可以利用各種編程語(yǔ)言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語(yǔ)言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。
在此處所提供的說(shuō)明書(shū)中,說(shuō)明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒(méi)有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說(shuō)明書(shū)的理解。
類(lèi)似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開(kāi)并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開(kāi)的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說(shuō),如下面的權(quán)利要求書(shū)所反映的那樣,發(fā)明方面在于少于前面公開(kāi)的單個(gè)實(shí)施例的所有特征。因此,遵循具體實(shí)施方式的權(quán)利要求書(shū)由此明確地并入該具體實(shí)施方式,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中。可以把實(shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過(guò)程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說(shuō)明書(shū)(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的所有特征以及如此公開(kāi)的任何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述,本說(shuō)明書(shū)(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來(lái)代替。
此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書(shū)中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來(lái)使用。
本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP)來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的虛擬機(jī)的創(chuàng)建裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。
應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說(shuō)明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過(guò)同一個(gè)硬件項(xiàng)來(lái)具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱(chēng)。
顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若對(duì)本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其同等技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。