亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

面向電力業(yè)務(wù)的信息應(yīng)用系統(tǒng)故障趨勢預(yù)測方法及裝置與流程

文檔序號:12491452閱讀:240來源:國知局
面向電力業(yè)務(wù)的信息應(yīng)用系統(tǒng)故障趨勢預(yù)測方法及裝置與流程

本發(fā)明涉及一種計算機(jī)領(lǐng)域,特別是涉及一種面向電力業(yè)務(wù)的信息應(yīng)用系統(tǒng)故障趨勢預(yù)測方法及裝置。



背景技術(shù):

隨著國網(wǎng)公司信息化建設(shè)的不斷推進(jìn),信息系統(tǒng)的種類和數(shù)量不斷增加,信息系統(tǒng)安全可靠運(yùn)行要求不斷提高,國網(wǎng)公司統(tǒng)一建設(shè)了IMS(IP Multimedia Subsystem,IP多媒體子系統(tǒng))系統(tǒng)加強(qiáng)對信息系統(tǒng)運(yùn)行情況的集中監(jiān)控能力。尤其是夜間只有調(diào)度員值守的情況下,當(dāng)信息應(yīng)用系統(tǒng)突發(fā)重大故障時,運(yùn)維人員需要一定的時間才能到達(dá)現(xiàn)場排除故障。為了進(jìn)一步提升信息應(yīng)用的可靠運(yùn)行和運(yùn)維管理水平,提高信息系統(tǒng)安全可靠運(yùn)行保障能力,有必要結(jié)合公司信息調(diào)運(yùn)體系的實際情況,積極研究和應(yīng)用信息技術(shù)對現(xiàn)有信息應(yīng)用的運(yùn)行監(jiān)控分析與應(yīng)急處置機(jī)制進(jìn)行創(chuàng)新改進(jìn)。

國內(nèi)外研究水平綜述:

1)國外研究水平:

數(shù)據(jù)中心是一整套復(fù)雜的設(shè)施,它不僅僅包括信息系統(tǒng)和其它與之配套的服務(wù)器、通信、存儲等設(shè)備,還包含冗余的數(shù)據(jù)通信連接、環(huán)境控制設(shè)備、監(jiān)控設(shè)備以及各種安全裝置。針對常見的監(jiān)控需求,通過基本的監(jiān)控方法,并不能達(dá)到最理想的監(jiān)控效果。

信息系統(tǒng)運(yùn)維監(jiān)控對象主要包括主機(jī)和網(wǎng)絡(luò),主機(jī)監(jiān)控可以分為應(yīng)用層監(jiān)控、服務(wù)層監(jiān)控、服務(wù)器層監(jiān)控和網(wǎng)絡(luò)接口層監(jiān)控。信息系統(tǒng)網(wǎng)絡(luò)其實就是不同設(shè)備的集合,路由器、交換機(jī)、防火墻等可以視為特殊的“服務(wù)器”,而它們之間的聯(lián)系組成了網(wǎng)絡(luò)。因此,網(wǎng)絡(luò)監(jiān)控對象其實就是基于網(wǎng)絡(luò)環(huán)境的設(shè)備。

目前,國外主流商用IT監(jiān)控工具產(chǎn)品包括IBM Tivoli、HP Open View、Microsoft SCCM、BMC Patrol、CA Unicenter等,商用產(chǎn)品價格比較昂貴,一般在幾十萬至數(shù)百萬,且功能不易定制擴(kuò)展。開源的IT監(jiān)控技術(shù)包括Cacti、Nagios、Zenoss、Zabbix、Hyperic HQ等,以免費(fèi)的形式提供,能有效監(jiān)控Windows、Linux和Unix的主機(jī)狀態(tài),交換機(jī)、路由器等網(wǎng)絡(luò)設(shè)備等,可以支持WMI、PerfMon、SNMP、JMX、HTTP、Telnet、SSH、Syslog、ICMP、FTP、SMTP等協(xié)議,但是一般缺乏友好的用戶界面。

2)國內(nèi)研究水平

近年來,國內(nèi)在IT監(jiān)控理論與技術(shù)研究領(lǐng)域發(fā)展很快,基于上述開源的IT監(jiān)控技術(shù),國產(chǎn)商用IT監(jiān)控工具產(chǎn)品及解決方案得到快速發(fā)展,比較成熟的產(chǎn)品包括北塔、東華、神州泰岳、摩卡、泰豪等公司的IT運(yùn)維監(jiān)控管理系統(tǒng)。

即使現(xiàn)有信息應(yīng)用系統(tǒng)可以實現(xiàn)故障檢測,也只能在發(fā)生故障之后才能檢測到相應(yīng)故障,均無法實現(xiàn)可靠的故障趨勢預(yù)測,無法實現(xiàn)“事前報警”功能。



技術(shù)實現(xiàn)要素:

鑒于上述問題,提出了本發(fā)明以便于提供一種克服上述問題或者至少部分地解決上述問題的面向電力業(yè)務(wù)的信息應(yīng)用系統(tǒng)故障趨勢預(yù)測方法及裝置。

面向電力業(yè)務(wù)的信息應(yīng)用系統(tǒng)故障趨勢預(yù)測方法,其特征在于,包括:

對信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測,并獲取監(jiān)測數(shù)據(jù);

采用預(yù)設(shè)的故障趨勢預(yù)測規(guī)則,對獲取到的所述監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到對應(yīng)的故障趨勢信息;

在指定顯示設(shè)備上將所述故障趨勢信息進(jìn)行可視化展示。

所述至少一個設(shè)備包括:信息應(yīng)用系統(tǒng)中指定的服務(wù)器、存儲設(shè)備、交換機(jī)和路由器節(jié)點中的任意一個或多個;

所述監(jiān)測數(shù)據(jù)包括網(wǎng)絡(luò)接口層數(shù)據(jù)、服務(wù)器層數(shù)據(jù)、服務(wù)層數(shù)據(jù)和應(yīng)用層數(shù)據(jù);其中,

所述網(wǎng)絡(luò)接口層數(shù)據(jù)包括IP地址、MAC地址、路由表、端口存活狀態(tài)、上下行流量;

所述服務(wù)器層數(shù)據(jù)包括CPU負(fù)載、內(nèi)存占用率、進(jìn)程狀態(tài)、磁盤I/O;

所述服務(wù)層數(shù)據(jù)包括中間件、數(shù)據(jù)庫平臺軟件的狀態(tài)數(shù)據(jù);

所述應(yīng)用層數(shù)據(jù)包括信息應(yīng)用系統(tǒng)的性能狀態(tài)數(shù)據(jù)。

當(dāng)采用智能代理的分布式監(jiān)控方式,每臺被監(jiān)測設(shè)備上安裝有智能監(jiān)控代理SMA時,所述對信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測,并獲取監(jiān)測數(shù)據(jù),包括:

智能監(jiān)控代理SMA對所述信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測,得到監(jiān)測數(shù)據(jù);

監(jiān)控服務(wù)端獲取所述智能監(jiān)控代理SMA監(jiān)測到的所述監(jiān)測數(shù)據(jù),所述監(jiān)控服務(wù)端按照設(shè)定時間間隔定期輪巡所述智能監(jiān)控代理SMA,以獲取所述智能監(jiān)控代理SMA監(jiān)測到的所述監(jiān)測數(shù)據(jù);

其中,所述監(jiān)控服務(wù)端獲取所述智能監(jiān)控代理SMA之間通過XML格式傳輸所述監(jiān)測數(shù)據(jù)。

所述對信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測,并獲取監(jiān)測數(shù)據(jù),還包括:所述智能監(jiān)控代理SMA與所述監(jiān)控服務(wù)端建立心跳連接;所述監(jiān)控服務(wù)端監(jiān)測到所述智能監(jiān)控代理SMA心跳連接超時時,得出所述智能監(jiān)控代理SMA對應(yīng)的設(shè)備發(fā)生故障,并生成相應(yīng)的故障消息;其中,所述故障消息包含在所述監(jiān)測數(shù)據(jù)內(nèi);

當(dāng)采用SNMP協(xié)議的網(wǎng)絡(luò)監(jiān)控方式時,所述對信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測,并獲取監(jiān)測數(shù)據(jù),包括:對所述信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備的網(wǎng)絡(luò)性能以及網(wǎng)絡(luò)差錯進(jìn)行監(jiān)測,并獲取監(jiān)測數(shù)據(jù);

當(dāng)采用智能代理的主機(jī)故障診斷監(jiān)控方式,每臺被監(jiān)測設(shè)備上安裝有智能監(jiān)控代理SMA時,所述對信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測,并獲取監(jiān)測數(shù)據(jù),包括:所述智能監(jiān)控代理SMA根據(jù)指定的監(jiān)測策略,對所述信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測;監(jiān)控主服務(wù)器接收所述智能監(jiān)控代理SMA在監(jiān)測到所述設(shè)備運(yùn)行異常時發(fā)送的告警或故障消息;其中,所述告警或故障消息包含在所述監(jiān)測數(shù)據(jù);

所述對信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測,并獲取監(jiān)測數(shù)據(jù),還包括:所述智能監(jiān)控代理SMA與所述監(jiān)控主服務(wù)器建立心跳連接;所述監(jiān)控主服務(wù)器監(jiān)測到所述智能監(jiān)控代理SMA心跳連接超時時,得出所述智能監(jiān)控代理SMA對應(yīng)的設(shè)備發(fā)生故障,并生成相應(yīng)的故障消息;其中,所述故障消息包含在所述監(jiān)測數(shù)據(jù)內(nèi);

所述采用預(yù)設(shè)的故障趨勢預(yù)測規(guī)則,對獲取到的所述監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到對應(yīng)的故障趨勢信息,包括:

采用預(yù)設(shè)的線性回歸算法和指數(shù)回歸算法,對獲取到的所述監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到對應(yīng)的故障未來趨勢信息;

采用預(yù)設(shè)的三角函數(shù)回歸算法,對獲取到的所述監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到對應(yīng)的故障周期性趨勢信息;

其中,所述故障趨勢信息包括故障未來趨勢信息和故障周期性趨勢信息。

所述采用預(yù)設(shè)的三角函數(shù)回歸算法,對獲取到的所述監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到對應(yīng)的故障周期性趨勢信息,包括:

取出監(jiān)測數(shù)據(jù)狀態(tài)因子參數(shù)序列中最后采集的狀態(tài)因子參數(shù)值及其之前m-1個狀態(tài)因子參數(shù)值進(jìn)行周期性分析,根據(jù)采集到的狀態(tài)因子參數(shù)值計算這段時間內(nèi)狀態(tài)因子參數(shù)值變化的周期性參數(shù),得到周期性回歸分析函數(shù),然后根據(jù)該函數(shù)繪制狀態(tài)因子參數(shù)值變化的周期性曲線;

所述周期性分析算法具體如下:所采集的狀態(tài)因子參數(shù)序列為{y1,y2,……,yn},采集時間序列為{t1,t2,……,tn},采用的三角函數(shù)回歸函數(shù)為:

其中k為預(yù)設(shè)的分波數(shù),用于控制三角函數(shù)周期性回歸的精度,m為狀態(tài)因子參數(shù)序列的大小,ej(j=0,1,...,k)和fj(j=1,2,...,k)為三角函數(shù)周期性回歸函數(shù)的參數(shù),其中參數(shù)計算方法如下:

每次分析完畢后,繼續(xù)采集下一個周期的狀態(tài)因子參數(shù)值放到狀態(tài)因子參數(shù)序列末尾,同時將原狀態(tài)因子參數(shù)序列中最早采集的狀態(tài)因子參數(shù)值刪掉,保持狀態(tài)因子參數(shù)序列大小為m。

一種信息應(yīng)用系統(tǒng)故障趨勢預(yù)測裝置,包括:

監(jiān)測模塊,用于對信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測,并獲取監(jiān)測數(shù)據(jù);

處理模塊,用于采用預(yù)設(shè)的故障趨勢預(yù)測規(guī)則,對獲取到的所述監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到對應(yīng)的故障趨勢信息;

顯示模塊,用于在指定顯示設(shè)備上將所述故障趨勢信息進(jìn)行可視化展示。

當(dāng)采用智能代理的分布式監(jiān)控方式,每臺被監(jiān)測設(shè)備上安裝有智能監(jiān)控代理SMA時,所述監(jiān)測模塊,包括:

智能監(jiān)控代理SMA,用于對所述信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測,得到監(jiān)測數(shù)據(jù);

監(jiān)控服務(wù)端,用于獲取所述智能監(jiān)控代理SMA監(jiān)測到的所述監(jiān)測數(shù)據(jù);

其中,所述監(jiān)控服務(wù)端獲取所述智能監(jiān)控代理SMA之間通過XML格式傳輸所述監(jiān)測數(shù)據(jù)。

所述智能監(jiān)控代理SMA,還用于與所述監(jiān)控服務(wù)端建立心跳連接;所述監(jiān)控服務(wù)端,還用于當(dāng)監(jiān)測到所述智能監(jiān)控代理SMA心跳連接超時時,得出所述智能監(jiān)控代理SMA對應(yīng)的設(shè)備發(fā)生故障,并生成相應(yīng)的故障消息;其中,所述故障消息包含在所述監(jiān)測數(shù)據(jù)內(nèi);

當(dāng)采用SNMP協(xié)議的網(wǎng)絡(luò)監(jiān)控方式時,所述監(jiān)測模塊,具體用于:對所述信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備的網(wǎng)絡(luò)性能以及網(wǎng)絡(luò)差錯進(jìn)行監(jiān)測,并獲取監(jiān)測數(shù)據(jù);

當(dāng)采用智能代理的主機(jī)故障診斷監(jiān)控方式,每臺被監(jiān)測設(shè)備上安裝有智能監(jiān)控代理SMA時,所述監(jiān)測模塊,包括:所述智能監(jiān)控代理SMA,用于根據(jù)指定的監(jiān)測策略,對所述信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測;監(jiān)控主服務(wù)器,用于接收所述智能監(jiān)控代理SMA在監(jiān)測到所述設(shè)備運(yùn)行異常時發(fā)送的告警或故障消息;其中,所述告警或故障消息包含在所述監(jiān)測數(shù)據(jù);

所述智能監(jiān)控代理SMA,還用于與所述監(jiān)控主服務(wù)器建立心跳連接;所述監(jiān)控主服務(wù)器,還用于監(jiān)測到所述智能監(jiān)控代理SMA心跳連接超時時,得出所述智能監(jiān)控代理SMA對應(yīng)的設(shè)備發(fā)生故障,并生成相應(yīng)的故障消息;其中,所述故障消息包含在所述監(jiān)測數(shù)據(jù)內(nèi);

所述處理模塊,包括:

第一處理單元,用于采用預(yù)設(shè)的線性回歸算法和指數(shù)回歸算法,對獲取到的所述監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到對應(yīng)的故障未來趨勢信息;

第二處理單元,用于采用預(yù)設(shè)的三角函數(shù)回歸算法,對獲取到的所述監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到對應(yīng)的故障周期性趨勢信息;

其中,所述故障趨勢信息包括故障未來趨勢信息和故障周期性趨勢信息。

所述第二處理單元,具體用于:

取出監(jiān)測數(shù)據(jù)狀態(tài)因子參數(shù)序列中最后采集的狀態(tài)因子參數(shù)值及其之前m-1個狀態(tài)因子參數(shù)值進(jìn)行周期性分析,根據(jù)采集到的狀態(tài)因子參數(shù)值計算這段時間內(nèi)狀態(tài)因子參數(shù)值變化的周期性參數(shù),得到周期性回歸分析函數(shù),然后根據(jù)該函數(shù)繪制狀態(tài)因子參數(shù)值變化的周期性曲線;

所述周期性分析算法具體如下:所采集的狀態(tài)因子參數(shù)序列為{y1,y2,……,yn},采集時間序列為{t1,t2,……,tn},采用的三角函數(shù)回歸函數(shù)為:

其中k為預(yù)設(shè)的分波數(shù),用于控制三角函數(shù)周期性回歸的精度,m為狀態(tài)因子參數(shù)序列的大小,ej(j=0,1,...,k)和fj(j=1,2,...,k)為三角函數(shù)周期性回歸函數(shù)的參數(shù),其中參數(shù)計算方法如下:

每次分析完畢后,繼續(xù)采集下一個周期的狀態(tài)因子參數(shù)值放到狀態(tài)因子參數(shù)序列末尾,同時將原狀態(tài)因子參數(shù)序列中最早采集的狀態(tài)因子參數(shù)值刪掉,保持狀態(tài)因子參數(shù)序列大小為m。

借由上述技術(shù)方案,本發(fā)明實施例提供的技術(shù)方案至少具有下列優(yōu)點:

本發(fā)明實施例提供的技術(shù)方案通過對信息應(yīng)用系統(tǒng)中包含的設(shè)備進(jìn)行監(jiān)測,并采用預(yù)設(shè)的故障趨勢預(yù)測規(guī)則,對獲取到的所述監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到對應(yīng)的故障趨勢信息,實現(xiàn)了故障趨勢的準(zhǔn)確預(yù)測,即“事前報警”,進(jìn)而有助于提高信息系統(tǒng)安全可靠運(yùn)行保障能力。

上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,并可依照說明書的內(nèi)容予以實施,以下以本發(fā)明的較佳實施例并配合附圖詳細(xì)說明如后。

附圖說明

通過閱讀下文優(yōu)選實施方式的詳細(xì)描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認(rèn)為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:

圖1示出了本發(fā)明信息應(yīng)用系統(tǒng)故障趨勢預(yù)測方法的流程示意圖;

圖2示出了本發(fā)明信息應(yīng)用系統(tǒng)故障趨勢預(yù)測裝置的結(jié)構(gòu)示意圖。

具體實施方式

為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。

在詳細(xì)說明本發(fā)明提供的技術(shù)方案之前,首先介紹一下本發(fā)明的基本構(gòu)思。本發(fā)明實施例提供的技術(shù)方案的原理構(gòu)架,自下而上分別是采集層、數(shù)據(jù)層、展示層。采集層負(fù)責(zé)通過SNMP、WMI等協(xié)議實時收集網(wǎng)絡(luò)中指定服務(wù)器、受管交換機(jī)、路由器等節(jié)點的各層狀態(tài)數(shù)據(jù)。數(shù)據(jù)層負(fù)責(zé)對采集層收集的監(jiān)測數(shù)據(jù)進(jìn)行存儲和進(jìn)一步處理,如根據(jù)公式或模型進(jìn)行預(yù)警、告警計算。展示層負(fù)責(zé)對數(shù)據(jù)層提供監(jiān)測數(shù)據(jù)及對數(shù)據(jù)的處理結(jié)果進(jìn)行可視化展示。

信息應(yīng)用系統(tǒng)監(jiān)控數(shù)據(jù)可分為網(wǎng)絡(luò)接口層、服務(wù)器層、服務(wù)層、應(yīng)用層四個層次類別。網(wǎng)絡(luò)接口層主要包括主機(jī)網(wǎng)絡(luò)狀態(tài)數(shù)據(jù),如IP地址、MAC地址、端口存活、上下行流量、速率、路由表、網(wǎng)卡傳輸/包/壞包流量等。服務(wù)器層主要包括主機(jī)BIOS與操作系統(tǒng)狀態(tài)數(shù)據(jù),包括操作系統(tǒng)/溫度/風(fēng)扇/電壓/服務(wù)器狀態(tài)、CPU/負(fù)載/內(nèi)存/磁盤/IO使用情況、安裝的硬件和軟件信息等。服務(wù)層主要包括中間件、數(shù)據(jù)庫等平臺軟件的狀態(tài)數(shù)據(jù),包括服務(wù)端口/服務(wù)進(jìn)程、IIS/Apache/Webloglc、Mssql/Mysql/Oracle/DB2、其它應(yīng)用服務(wù)。應(yīng)用層主要針對業(yè)務(wù)應(yīng)用系統(tǒng)的可用性、性能等狀態(tài)數(shù)據(jù),包括基于用戶訪問的性能,如WEB頁面訪問響應(yīng)時間等。

如圖1所示,本發(fā)明信息應(yīng)用系統(tǒng)故障趨勢預(yù)測方法的流程示意圖。

S1:采集層通過通訊協(xié)議實時收集網(wǎng)絡(luò)中指定的服務(wù)器、存儲設(shè)備、受管交換機(jī)、路由器節(jié)點的各層狀態(tài)監(jiān)測數(shù)據(jù);

S2:數(shù)據(jù)層對采集層收集的監(jiān)測數(shù)據(jù)進(jìn)行存儲、故障檢測分析和故障趨勢預(yù)測分析;

S3:展示層對數(shù)據(jù)層提供監(jiān)測數(shù)據(jù)及對數(shù)據(jù)的處理結(jié)果進(jìn)行可視化展示。

本實施例提供的所述方法的執(zhí)行主體可以是能實現(xiàn)本實施例提供所述方法的硬件設(shè)備,和/或為安裝在所述硬件設(shè)備上的應(yīng)用。具體的,本實施例提供的所述方法,包括:

步驟101、對信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測,并獲取監(jiān)測數(shù)據(jù)。

其中,所述至少一個設(shè)備可以包括:信息應(yīng)用系統(tǒng)中指定的服務(wù)器、存儲設(shè)備、交換機(jī)和路由器節(jié)點中的任意一個或多個。即被測設(shè)備為一個時,所述設(shè)備可以是上述中的任意一個,被測設(shè)備為多個時,所述設(shè)備即可以是上述中的任意多個。

所述的監(jiān)測數(shù)據(jù)包括網(wǎng)絡(luò)接口層數(shù)據(jù)、服務(wù)器層數(shù)據(jù)、服務(wù)層數(shù)據(jù)和應(yīng)用層數(shù)據(jù),網(wǎng)絡(luò)接口層數(shù)據(jù)包括主機(jī)網(wǎng)絡(luò)狀態(tài)數(shù)據(jù),包括IP地址、MAC地址、路由表、端口存活狀態(tài)、上下行流量;服務(wù)器層數(shù)據(jù)包括主機(jī)BIOS與操作系統(tǒng)狀態(tài)數(shù)據(jù),包括CPU負(fù)載、內(nèi)存占用率、進(jìn)程狀態(tài)、磁盤I/O;服務(wù)層數(shù)據(jù)包括中間件、數(shù)據(jù)庫平臺軟件的狀態(tài)數(shù)據(jù);應(yīng)用層數(shù)據(jù)包括信息應(yīng)用系統(tǒng)的可用性、性能狀態(tài)數(shù)據(jù)。

具體的,本實施例可根據(jù)不同的監(jiān)控方式,采用不同的方法實現(xiàn):

(1)采用智能代理的分布式監(jiān)控方式

即當(dāng)采用智能代理的分布式監(jiān)控方式,每臺被監(jiān)測設(shè)備上安裝有智能監(jiān)控代理SMA時,所述對信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測,并獲取監(jiān)測數(shù)據(jù),包括:

步驟S11、智能監(jiān)控代理SMA對所述信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測,得到監(jiān)測數(shù)據(jù)。

步驟S12、監(jiān)控服務(wù)端獲取所述智能監(jiān)控代理SMA監(jiān)測到的所述監(jiān)測數(shù)據(jù)。

其中,所述監(jiān)控服務(wù)端獲取所述智能監(jiān)控代理SMA之間通過XML格式傳輸所述監(jiān)測數(shù)據(jù)。

基于分布式監(jiān)控結(jié)構(gòu),在每臺集群計算機(jī)上安裝智能監(jiān)控代理SMA。智能監(jiān)控代理SMA收集計算機(jī)的工作狀態(tài)信息,在監(jiān)控主機(jī)上安裝運(yùn)行監(jiān)控服務(wù)端;智能監(jiān)控代理SMA與監(jiān)控服務(wù)端之間通過XML格式傳遞監(jiān)控數(shù)據(jù),監(jiān)控服務(wù)端定期輪巡智能監(jiān)控代理SMA獲取監(jiān)控信息,監(jiān)控主機(jī)使用心跳探測檢測集群內(nèi)任意計算機(jī)的運(yùn)行狀態(tài)。

即進(jìn)一步的,上述步驟:監(jiān)控服務(wù)端獲取所述智能監(jiān)控代理SMA監(jiān)測到的所述監(jiān)測數(shù)據(jù),可具體為:所述監(jiān)控服務(wù)端按照設(shè)定時間間隔定期輪巡所述智能監(jiān)控代理SMA,以獲取所述智能監(jiān)控代理SMA監(jiān)測到的所述監(jiān)測數(shù)據(jù)。

進(jìn)一步的,步驟:所述對信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測,并獲取監(jiān)測數(shù)據(jù),還可包括:

步驟S13、所述智能監(jiān)控代理SMA與所述監(jiān)控服務(wù)端建立心跳連接。

步驟S14、所述監(jiān)控服務(wù)端監(jiān)測到所述智能監(jiān)控代理SMA心跳連接超時時,得出所述智能監(jiān)控代理SMA對應(yīng)的設(shè)備發(fā)生故障,并生成相應(yīng)的故障消息。

其中,所述故障消息包含在所述監(jiān)測數(shù)據(jù)內(nèi)。

(2)采用SNMP協(xié)議的網(wǎng)絡(luò)監(jiān)控方式

當(dāng)采用SNMP協(xié)議的網(wǎng)絡(luò)監(jiān)控方式時,所述對信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測,并獲取監(jiān)測數(shù)據(jù),包括:

對所述信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備的網(wǎng)絡(luò)性能以及網(wǎng)絡(luò)差錯進(jìn)行監(jiān)測,并獲取監(jiān)測數(shù)據(jù)。

在具體實施時,基于簡單網(wǎng)絡(luò)管理協(xié)議SNMP的網(wǎng)絡(luò)監(jiān)控功能包括監(jiān)視網(wǎng)絡(luò)性能、檢測分析網(wǎng)絡(luò)差錯和配置網(wǎng)絡(luò)設(shè)備,在網(wǎng)絡(luò)正常工作時,SNMP實現(xiàn)統(tǒng)計、配置和測試功能;在網(wǎng)絡(luò)故障時,實現(xiàn)各種差錯監(jiān)測和恢復(fù)功能。

(3)采用智能代理的主機(jī)故障診斷監(jiān)控方式

當(dāng)采用智能代理的主機(jī)故障診斷監(jiān)控方式,每臺被監(jiān)測設(shè)備上安裝有智能監(jiān)控代理SMA時,所述對信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測,并獲取監(jiān)測數(shù)據(jù),包括:

步驟S21、所述智能監(jiān)控代理SMA根據(jù)指定的監(jiān)測策略,對所述信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測。

步驟S22、監(jiān)控主服務(wù)器接收所述智能監(jiān)控代理SMA在監(jiān)測到所述設(shè)備運(yùn)行異常時發(fā)送的告警或故障消息。

其中,所述告警或故障消息包含在所述監(jiān)測數(shù)據(jù)。

進(jìn)一步的,所述對信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測,并獲取監(jiān)測數(shù)據(jù),還可包括:

步驟S23、所述智能監(jiān)控代理SMA與所述監(jiān)控主服務(wù)器建立心跳連接。

步驟S24、所述監(jiān)控主服務(wù)器監(jiān)測到所述智能監(jiān)控代理SMA心跳連接超時時,得出所述智能監(jiān)控代理SMA對應(yīng)的設(shè)備發(fā)生故障,并生成相應(yīng)的故障消息。

其中,所述故障消息包含在所述監(jiān)測數(shù)據(jù)內(nèi)。

步驟102、采用預(yù)設(shè)的故障趨勢預(yù)測規(guī)則,對獲取到的所述監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到對應(yīng)的故障趨勢信息。

在具體實施時,本步驟102可采用如下方法實現(xiàn):

首先,采用預(yù)設(shè)的線性回歸算法和指數(shù)回歸算法,對獲取到的所述監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到對應(yīng)的故障未來趨勢信息。

然后,采用預(yù)設(shè)的三角函數(shù)回歸算法,對獲取到的所述監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到對應(yīng)的故障周期性趨勢信息。

其中,所述故障趨勢信息包括故障未來趨勢信息和故障周期性趨勢信息。

更具體的,上述采用預(yù)設(shè)的線性回歸算法和指數(shù)回歸算法,對獲取到的所述監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到對應(yīng)的故障未來趨勢信息,可包括:

(1)所述線性回歸算法

①以所述信息應(yīng)用系統(tǒng)中與故障相關(guān)的監(jiān)測數(shù)據(jù)作為線性回歸算法的樣本數(shù)據(jù)集,收集所述信息應(yīng)用系統(tǒng)發(fā)生各種故障的歷史數(shù)據(jù),其中,所述歷史數(shù)據(jù)包括發(fā)生各種故障的具體時間,一段時間內(nèi)發(fā)生該故障的次數(shù),以及每次發(fā)生該故障時對應(yīng)的狀態(tài)因子數(shù)據(jù);

線性回歸算法模型如下:y=a+b1x1+b2x2+b3x3+…;

其中y為因變量,也是預(yù)測對象故障未來趨勢;x1、x2、x3為自變量,也是信息應(yīng)用系統(tǒng)中與故障相關(guān)的監(jiān)測數(shù)據(jù),即故障狀態(tài)因子,是y的相關(guān)因素;a為線性回歸系數(shù),b1、b2、b3為線性偏回歸系數(shù)。

②進(jìn)行偏相關(guān)分析,即確定所述信息應(yīng)用系統(tǒng)設(shè)定未來時期預(yù)計發(fā)生的主要故障,其中,主要故障為任意兩個偏相關(guān)系數(shù)大于等于-1且小于等于1的故障;

③采用逐步回歸法,對步驟②中確定出的各所述主要故障分別建立故障與狀態(tài)因子數(shù)據(jù)的映射關(guān)系方程式,并進(jìn)行F檢驗,如果顯著水平P不能滿足P<設(shè)定閾值,則剔除該主要故障,否則保留由該主要故障建立的故障與狀態(tài)因子數(shù)據(jù)的映射關(guān)系方程式;

④預(yù)測所述信息應(yīng)用系統(tǒng)所述設(shè)定未來時期的監(jiān)測數(shù)據(jù)狀態(tài)因子參數(shù)值,并將預(yù)測出的所述狀態(tài)因子參數(shù)值代入所述保留的所述故障與狀態(tài)因子數(shù)據(jù)的映射關(guān)系方程式中,得出發(fā)生相應(yīng)故障的概率值及故障未來趨勢信息;

(2)所述指數(shù)回歸算法

根據(jù)采集到的監(jiān)測數(shù)據(jù)狀態(tài)因子參數(shù)序列值利用預(yù)設(shè)的所述指數(shù)回歸算法計算所述信息應(yīng)用系統(tǒng)未來多個周期內(nèi)的監(jiān)測數(shù)據(jù)預(yù)測值:

所采集的狀態(tài)因子參數(shù)序列為{y1,y2,……,yn},采集時間序列為{t1,t2,……,tn},采用的指數(shù)回歸函數(shù)為:y=cedt;

其中c和d為指數(shù)回歸函數(shù)的參數(shù),參數(shù)計算方法為:

其中,

采用如下公式,根據(jù)上述參數(shù)計算結(jié)果計算未來一個周期的狀態(tài)因子參數(shù)預(yù)測值:

上述采用預(yù)設(shè)的三角函數(shù)回歸算法,對獲取到的所述監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到對應(yīng)的故障周期性趨勢信息,可包括:

取出監(jiān)測數(shù)據(jù)狀態(tài)因子參數(shù)序列中最后采集的狀態(tài)因子參數(shù)值及其之前m-1個狀態(tài)因子參數(shù)值進(jìn)行周期性分析,根據(jù)采集到的狀態(tài)因子參數(shù)值計算這段時間內(nèi)狀態(tài)因子參數(shù)值變化的周期性參數(shù),得到周期性回歸分析函數(shù),然后根據(jù)該函數(shù)繪制狀態(tài)因子參數(shù)值變化的周期性曲線;

所述周期性分析算法具體如下:所采集的狀態(tài)因子參數(shù)序列為{y1,y2,……,yn},采集時間序列為{t1,t2,……,tn},采用的三角函數(shù)回歸函數(shù)為:

其中k為預(yù)設(shè)的分波數(shù),用于控制三角函數(shù)周期性回歸的精度,m為狀態(tài)因子參數(shù)序列的大小,ej(j=0,1,...,k)和fj(j=1,2,...,k)為三角函數(shù)周期性回歸函數(shù)的參數(shù),其中參數(shù)計算方法如下:

每次分析完畢后,繼續(xù)采集下一個周期的狀態(tài)因子參數(shù)值放到狀態(tài)因子參數(shù)序列末尾,同時將原狀態(tài)因子參數(shù)序列中最早采集的狀態(tài)因子參數(shù)值刪掉,保持狀態(tài)因子參數(shù)序列大小為m。

步驟103、在指定顯示設(shè)備上將所述故障趨勢信息進(jìn)行可視化展示。

本實施例提供的技術(shù)方案通過對信息應(yīng)用系統(tǒng)中包含的設(shè)備進(jìn)行監(jiān)測,并采用預(yù)設(shè)的故障趨勢預(yù)測規(guī)則,對獲取到的所述監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到對應(yīng)的故障趨勢信息,實現(xiàn)了故障趨勢的準(zhǔn)確預(yù)測,即“事前報警”,進(jìn)而有助于提高信息系統(tǒng)安全可靠運(yùn)行保障能力。

需要說明的是:對于前述的各方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動作順序的限制,因為依據(jù)本發(fā)明,某些步驟可以采用其他順序或者同時進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作和模塊并不一定是本發(fā)明所必須的。

如圖2所示,本發(fā)明信息應(yīng)用系統(tǒng)故障趨勢預(yù)測裝置的結(jié)構(gòu)示意圖。本實施例提供的所述裝置可實現(xiàn)上述實施例一提供的所述方法。具體的,本實施例提供的所述裝置包括:

監(jiān)測模塊1,用于對信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測,并獲取監(jiān)測數(shù)據(jù);

處理模塊2,用于采用預(yù)設(shè)的故障趨勢預(yù)測規(guī)則,對獲取到的所述監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到對應(yīng)的故障趨勢信息;

顯示模塊3,用于在指定顯示設(shè)備上將所述故障趨勢信息進(jìn)行可視化展示。

本實施例提供的技術(shù)方案通過對信息應(yīng)用系統(tǒng)中包含的設(shè)備進(jìn)行監(jiān)測,并采用預(yù)設(shè)的故障趨勢預(yù)測規(guī)則,對獲取到的所述監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到對應(yīng)的故障趨勢信息,實現(xiàn)了故障趨勢的準(zhǔn)確預(yù)測,即“事前報警”,進(jìn)而有助于提高信息系統(tǒng)安全可靠運(yùn)行保障能力。

進(jìn)一步的,當(dāng)采用智能代理的分布式監(jiān)控方式,每臺被監(jiān)測設(shè)備上安裝有智能監(jiān)控代理SMA時,所述的監(jiān)測模塊,包括:

智能監(jiān)控代理SMA,用于對所述信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測,得到監(jiān)測數(shù)據(jù);

監(jiān)控服務(wù)端,用于獲取所述智能監(jiān)控代理SMA監(jiān)測到的所述監(jiān)測數(shù)據(jù);

其中,所述監(jiān)控服務(wù)端獲取所述智能監(jiān)控代理SMA之間通過XML格式傳輸所述監(jiān)測數(shù)據(jù)。

進(jìn)一步的,所述監(jiān)控服務(wù)端,具體用于:

按照設(shè)定時間間隔定期輪巡所述智能監(jiān)控代理SMA,以獲取所述智能監(jiān)控代理SMA監(jiān)測到的所述監(jiān)測數(shù)據(jù)。

進(jìn)一步的,所述智能監(jiān)控代理SMA,還用于與所述監(jiān)控服務(wù)端建立心跳連接;

所述監(jiān)控服務(wù)端,還用于當(dāng)監(jiān)測到所述智能監(jiān)控代理SMA心跳連接超時時,得出所述智能監(jiān)控代理SMA對應(yīng)的設(shè)備發(fā)生故障,并生成相應(yīng)的故障消息;

其中,所述故障消息包含在所述監(jiān)測數(shù)據(jù)內(nèi)。

進(jìn)一步的,當(dāng)采用SNMP協(xié)議的網(wǎng)絡(luò)監(jiān)控方式時,所述監(jiān)測模塊,具體用于:

對所述信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備的網(wǎng)絡(luò)性能以及網(wǎng)絡(luò)差錯進(jìn)行監(jiān)測,并獲取監(jiān)測數(shù)據(jù)。

進(jìn)一步的,當(dāng)采用智能代理的主機(jī)故障診斷監(jiān)控方式,每臺被監(jiān)測設(shè)備上安裝有智能監(jiān)控代理SMA時,所述監(jiān)測模塊,包括:

所述智能監(jiān)控代理SMA,用于根據(jù)指定的監(jiān)測策略,對所述信息應(yīng)用系統(tǒng)中包含的至少一個設(shè)備進(jìn)行監(jiān)測;

監(jiān)控主服務(wù)器,用于接收所述智能監(jiān)控代理SMA在監(jiān)測到所述設(shè)備運(yùn)行異常時發(fā)送的告警或故障消息;

其中,所述告警或故障消息包含在所述監(jiān)測數(shù)據(jù)。

進(jìn)一步的,所述智能監(jiān)控代理SMA,還用于與所述監(jiān)控主服務(wù)器建立心跳連接;

所述監(jiān)控主服務(wù)器,還用于監(jiān)測到所述智能監(jiān)控代理SMA心跳連接超時時,得出所述智能監(jiān)控代理SMA對應(yīng)的設(shè)備發(fā)生故障,并生成相應(yīng)的故障消息;

其中,所述故障消息包含在所述監(jiān)測數(shù)據(jù)內(nèi)。

進(jìn)一步的,所述處理模塊,包括:

第一處理單元,用于采用預(yù)設(shè)的線性回歸算法和指數(shù)回歸算法,對獲取到的所述監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到對應(yīng)的故障未來趨勢信息;

第二處理單元,用于采用預(yù)設(shè)的三角函數(shù)回歸算法,對獲取到的所述監(jiān)測數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,得到對應(yīng)的故障周期性趨勢信息;

其中,所述故障趨勢信息包括故障未來趨勢信息和故障周期性趨勢信息。

進(jìn)一步的,所述第一處理單元,具體用于:

(1)所述線性回歸算法

以所述信息應(yīng)用系統(tǒng)中與故障相關(guān)的監(jiān)測數(shù)據(jù)作為線性回歸算法的樣本數(shù)據(jù)集,收集所述信息應(yīng)用系統(tǒng)發(fā)生各種故障的歷史數(shù)據(jù),其中,所述歷史數(shù)據(jù)包括發(fā)生各種故障的具體時間,一段時間內(nèi)發(fā)生該故障的次數(shù),以及每次發(fā)生該故障時對應(yīng)的狀態(tài)因子數(shù)據(jù);

進(jìn)行偏相關(guān)分析,即確定所述信息應(yīng)用系統(tǒng)設(shè)定未來時期預(yù)計發(fā)生的主要故障,其中,主要故障為任意兩個偏相關(guān)系數(shù)大于等于-1且小于等于1的故障;

采用逐步回歸法,對確定出的各所述主要故障分別建立故障與狀態(tài)因子數(shù)據(jù)的映射關(guān)系方程式,并進(jìn)行F檢驗,如果顯著水平P不能滿足P<設(shè)定閾值,則剔除該主要故障,否則保留由該主要故障建立的故障與狀態(tài)因子數(shù)據(jù)的映射關(guān)系方程式;

預(yù)測所述信息應(yīng)用系統(tǒng)所述設(shè)定未來時期的監(jiān)測數(shù)據(jù)狀態(tài)因子參數(shù)值,并將預(yù)測出的所述狀態(tài)因子參數(shù)值代入所述保留的所述故障與狀態(tài)因子數(shù)據(jù)的映射關(guān)系方程式中,得出發(fā)生相應(yīng)故障的概率值及故障未來趨勢信息;

(2)所述指數(shù)回歸算法

根據(jù)采集到的監(jiān)測數(shù)據(jù)狀態(tài)因子參數(shù)序列值利用預(yù)設(shè)的所述指數(shù)回歸算法計算所述信息應(yīng)用系統(tǒng)未來多個周期內(nèi)的監(jiān)測數(shù)據(jù)預(yù)測值:

所采集的狀態(tài)因子參數(shù)序列為{y1,y2,……,yn},采集時間序列為{t1,t2,……,tn},采用的指數(shù)回歸函數(shù)為:y=cedt;

其中c和d為指數(shù)回歸函數(shù)的參數(shù),參數(shù)計算方法為:

其中,

采用如下公式,根據(jù)上述參數(shù)計算結(jié)果計算未來一個周期的狀態(tài)因子參數(shù)預(yù)測值:

進(jìn)一步的,所述第二處理單元,具體用于:

取出監(jiān)測數(shù)據(jù)狀態(tài)因子參數(shù)序列中最后采集的狀態(tài)因子參數(shù)值及其之前m-1個狀態(tài)因子參數(shù)值進(jìn)行周期性分析,根據(jù)采集到的狀態(tài)因子參數(shù)值計算這段時間內(nèi)狀態(tài)因子參數(shù)值變化的周期性參數(shù),得到周期性回歸分析函數(shù),然后根據(jù)該函數(shù)繪制狀態(tài)因子參數(shù)值變化的周期性曲線;

所述周期性分析算法具體如下:所采集的狀態(tài)因子參數(shù)序列為{y1,y2,……,yn},采集時間序列為{t1,t2,……,tn},采用的三角函數(shù)回歸函數(shù)為:

其中k為預(yù)設(shè)的分波數(shù),用于控制三角函數(shù)周期性回歸的精度,m為狀態(tài)因子參數(shù)序列的大小,ej(j=0,1,...,k)和fj(j=1,2,...,k)為三角函數(shù)周期性回歸函數(shù)的參數(shù),其中參數(shù)計算方法如下:

每次分析完畢后,繼續(xù)采集下一個周期的狀態(tài)因子參數(shù)值放到狀態(tài)因子參數(shù)序列末尾,同時將原狀態(tài)因子參數(shù)序列中最早采集的狀態(tài)因子參數(shù)值刪掉,保持狀態(tài)因子參數(shù)序列大小為m。

在上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關(guān)描述。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1