專利名稱:一種電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電網(wǎng)領(lǐng)域的網(wǎng)絡(luò)監(jiān)控技術(shù),尤其是涉及一種電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警系統(tǒng)及方法。
背景技術(shù):
電網(wǎng)信息管理的核心業(yè)務(wù)系統(tǒng)隨著IT系統(tǒng)分期建設(shè)和不同集成商和軟件供應(yīng)商參與,其系統(tǒng)管理越來越復(fù)雜和困難。如圖I所示,是現(xiàn)有的一種電網(wǎng)業(yè)務(wù)系統(tǒng)的管理架構(gòu)。包括多個(gè)業(yè)務(wù)系統(tǒng)操作終端4、與該業(yè)務(wù)系統(tǒng)操作終端4通過內(nèi)網(wǎng)依次連接的路由器5、核心交換機(jī)7和多個(gè)核心業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫8,其中,進(jìn)一步包括連接在路由器5上的負(fù)載均衡器6。該核心業(yè)務(wù)系統(tǒng)數(shù) 據(jù)庫8可以是諸如用于生產(chǎn)調(diào)度、營銷、資源管理等業(yè)務(wù)系統(tǒng)的網(wǎng)絡(luò)數(shù)據(jù)庫。根據(jù)測算,大型電網(wǎng)企業(yè)的核心系統(tǒng)(例如生產(chǎn)調(diào)度,營銷,資源管理等業(yè)務(wù)系統(tǒng))等每年都會由于機(jī)房掉電、交換機(jī)或者負(fù)載均衡器堵塞、數(shù)據(jù)庫宕機(jī)等原因造成核心系統(tǒng)故障,所損失的經(jīng)濟(jì)效益和人員流失給企業(yè)造成的經(jīng)濟(jì)損失以百萬人民幣計(jì)。發(fā)明人發(fā)現(xiàn),現(xiàn)有的電網(wǎng)業(yè)務(wù)系統(tǒng)的管理架構(gòu)存在兩個(gè)不足之處現(xiàn)有技術(shù)中不能及時(shí)發(fā)現(xiàn)系統(tǒng)的重大技術(shù),WEB服務(wù)器和性能故障,且不能實(shí)現(xiàn)智能化告警,讓相關(guān)管理人員可以迅速投入精力去排查問題,防止故障蔓延和更大的經(jīng)濟(jì)損失。由于電網(wǎng)系統(tǒng)技術(shù)架構(gòu)日益復(fù)雜,數(shù)據(jù)處理量已經(jīng)向T級進(jìn)軍,因此開發(fā)一種智能化告警監(jiān)控系統(tǒng)越來越具有戰(zhàn)略意義。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題在于,提供一種電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)庫智能化監(jiān)控告警方法,可以根據(jù)對電網(wǎng)核心交換機(jī)進(jìn)行實(shí)時(shí)監(jiān)控,實(shí)現(xiàn)智能化監(jiān)控和告警機(jī)制。為解決上述技術(shù)問題,本發(fā)明實(shí)施例提供一電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)庫智能化監(jiān)控告警方法,包括
獲得所述電網(wǎng)的一種核心業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù);
分析所獲得的所述至少一類監(jiān)控?cái)?shù)據(jù),并與預(yù)先設(shè)置的所述業(yè)務(wù)系統(tǒng)的每類監(jiān)控?cái)?shù)據(jù)所對應(yīng)的閾值告警區(qū)間進(jìn)行對比;
在比較結(jié)果為至少一類監(jiān)控?cái)?shù)據(jù)達(dá)到閾值告警區(qū)間時(shí),通過郵件將告警信息發(fā)送給所述業(yè)務(wù)系統(tǒng)對應(yīng)的郵件接收方。優(yōu)選地,所述獲得所述電網(wǎng)的一種核心業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù)包括 在所述電網(wǎng)的核心交換機(jī)上偵聽獲得所述核心業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù);或者 獲取所述核心業(yè)務(wù)系統(tǒng)在網(wǎng)絡(luò)上的數(shù)據(jù)庫訪問腳本數(shù)據(jù)。優(yōu)選地,所述在所述電網(wǎng)的核心交換機(jī)上進(jìn)行偵聽的步驟具體為
通過對所述核心交換機(jī)的鏡像端口進(jìn)行偵聽,獲得所述核心交換機(jī)的鏡像流量信息; 從所述鏡像流量信息中獲得所述核心業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù),所述核心業(yè)務(wù)系統(tǒng)的監(jiān)控?cái)?shù)據(jù)包括核心業(yè)務(wù)系統(tǒng)的網(wǎng)絡(luò)流量值、離網(wǎng)率、頁面訪問平均加載時(shí)間中至少一個(gè)。優(yōu)選地,所述獲取所述核心業(yè)務(wù)系統(tǒng)在網(wǎng)絡(luò)上的數(shù)據(jù)庫訪問腳本數(shù)據(jù)的具體步驟為
通過數(shù)據(jù)庫防火墻軟件監(jiān)控獲得所述核心業(yè)務(wù)系統(tǒng)的網(wǎng)絡(luò)報(bào)文中對于數(shù)據(jù)庫訪問的SQL腳本數(shù)據(jù),所述核心業(yè)務(wù)系統(tǒng)的監(jiān)控?cái)?shù)據(jù) 包括生成所述SQL腳本的數(shù)據(jù)庫交易時(shí)間,數(shù)據(jù)庫交易的SQL腳本等重要信息。優(yōu)選地,進(jìn)一步包括預(yù)先設(shè)置業(yè)務(wù)系統(tǒng)對應(yīng)的閾值告警區(qū)間的步驟,所述步驟包括
監(jiān)控獲得每一業(yè)務(wù)系統(tǒng)的一定區(qū)間內(nèi)的正常的每一類監(jiān)控?cái)?shù)據(jù);
根據(jù)所述正常的監(jiān)控?cái)?shù)據(jù)以及每一業(yè)務(wù)系統(tǒng)的數(shù)據(jù)模型,設(shè)置所述業(yè)務(wù)系統(tǒng)每一類監(jiān)控?cái)?shù)據(jù)所對應(yīng)的閾值告警區(qū)間并存儲。優(yōu)選地,若所述監(jiān)控?cái)?shù)據(jù)為網(wǎng)絡(luò)流量數(shù)據(jù),則所述監(jiān)控?cái)?shù)據(jù)對應(yīng)的閾值告警區(qū)間為大于所述一定區(qū)間內(nèi)的正常監(jiān)控?cái)?shù)據(jù)中的最大值的區(qū)間。優(yōu)選地,進(jìn)一步包括
預(yù)先設(shè)置每一業(yè)務(wù)系統(tǒng)的每一類監(jiān)控?cái)?shù)據(jù)對應(yīng)至少一個(gè)郵件接收方。相應(yīng)地,本發(fā)明實(shí)施例還提供一種電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)庫智能化監(jiān)控告警系統(tǒng),包括
監(jiān)控?cái)?shù)據(jù)獲取單元,用于獲取所述電網(wǎng)的一種核心業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù);監(jiān)控?cái)?shù)據(jù)分析單元,用于分析所述監(jiān)控?cái)?shù)據(jù)獲取單元所獲取的所述業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù),并與預(yù)先設(shè)置的所述業(yè)務(wù)系統(tǒng)的每類監(jiān)控?cái)?shù)據(jù)所對應(yīng)的閾值告警區(qū)間進(jìn)行比較;
比較結(jié)果處理單元,用于在所述監(jiān)控?cái)?shù)據(jù)分析單元的比較結(jié)果為至少一類監(jiān)控?cái)?shù)據(jù)達(dá)到閾值告警區(qū)間時(shí),通過郵件將告警信息發(fā)送給所述業(yè)務(wù)系統(tǒng)對應(yīng)的郵件接收方。優(yōu)選地,所述監(jiān)控?cái)?shù)據(jù)獲取單元包括
偵聽單元,用于在所述電網(wǎng)的核心交換機(jī)上偵聽獲得所述核心業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù);或者
腳本數(shù)據(jù)獲取單元,用于獲取所述核心業(yè)務(wù)系統(tǒng)在網(wǎng)絡(luò)上的數(shù)據(jù)庫訪問腳本數(shù)據(jù)。優(yōu)選地,所述偵聽單元進(jìn)一步包括
鏡像流量信息偵聽子單元,用于通過對所述核心交換機(jī)的鏡像端口進(jìn)行偵聽,獲得所述核心交換機(jī)的鏡像流量信息;
監(jiān)控?cái)?shù)據(jù)選擇子單元,用于從所述鏡像流量信息偵聽子單元獲得的所述鏡像流量信息中獲得所述核心業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù),所述核心業(yè)務(wù)系統(tǒng)的監(jiān)控?cái)?shù)據(jù)包括核心業(yè)務(wù)系統(tǒng)的網(wǎng)絡(luò)流量值、離網(wǎng)率、頁面訪問平均加載時(shí)間中至少一個(gè)。優(yōu)選地,所述腳本數(shù)據(jù)獲取單元具體為通過數(shù)據(jù)庫防火墻軟件監(jiān)控獲得所述核心業(yè)務(wù)系統(tǒng)的網(wǎng)絡(luò)報(bào)文中對于數(shù)據(jù)庫訪問的SQL腳本數(shù)據(jù),所述核心業(yè)務(wù)系統(tǒng)的監(jiān)控?cái)?shù)據(jù)包括生成所述SQL腳本的數(shù)據(jù)庫交易時(shí)間。優(yōu)選地,進(jìn)一步包括閾值告警區(qū)間設(shè)置單元,所述閾值告警區(qū)間設(shè)置單元包括
正常監(jiān)控?cái)?shù)據(jù)獲得單元,用于監(jiān)控獲得每一業(yè)務(wù)系統(tǒng)的一定區(qū)間內(nèi)的正常的每一類監(jiān)控?cái)?shù)據(jù);
設(shè)置單元,用于根據(jù)所述正常監(jiān)控?cái)?shù)據(jù)獲得單元所獲得的正常的監(jiān)控?cái)?shù)據(jù)以及每一業(yè)務(wù)系統(tǒng)的數(shù)據(jù)模型,設(shè)置所述業(yè)務(wù)系統(tǒng)每一類監(jiān)控?cái)?shù)據(jù)對應(yīng)的閾值告警區(qū)間并存儲。優(yōu)選地,若所述監(jiān)控?cái)?shù)據(jù)為網(wǎng)絡(luò)流量數(shù)據(jù),則所述監(jiān)控?cái)?shù)據(jù)對應(yīng)的閾值告警區(qū)間為大于所述一定區(qū)間內(nèi)的正常監(jiān)控?cái)?shù)據(jù)中的最大值的區(qū)間。優(yōu)選地,進(jìn)一步包括
郵件關(guān)聯(lián)設(shè)置單元,用于預(yù)先設(shè)置每一業(yè)務(wù)系統(tǒng)的每一類監(jiān)控?cái)?shù)據(jù)對應(yīng)至少一個(gè)郵件接收方。實(shí)施本發(fā)明的實(shí)施例,具有如下有益效果
實(shí)施本發(fā)明的實(shí)施例,具有如下的有益效果 本發(fā)明采用監(jiān)控告警服務(wù)器對電網(wǎng)核心交換機(jī)進(jìn)行流量和SQL數(shù)據(jù)庫腳本進(jìn)行偵聽,并對每一類型的監(jiān)控?cái)?shù)據(jù)設(shè)置一個(gè)閾值告警區(qū)間,當(dāng)判斷到某一類監(jiān)控?cái)?shù)據(jù)達(dá)到該閥值告警區(qū)間,能夠及時(shí)向?qū)?yīng)的郵件接收者發(fā)送告警郵件。設(shè)計(jì)數(shù)據(jù)區(qū)間組合來發(fā)出告警信息,從而實(shí)現(xiàn)了智能化告警機(jī)制。
本發(fā)明實(shí)現(xiàn)了對電網(wǎng)核心業(yè)務(wù)系統(tǒng)的實(shí)時(shí)智能化及監(jiān)控和告警,提高了現(xiàn)有IT系統(tǒng)的投資回報(bào),降低了企業(yè)的運(yùn)營和系統(tǒng)維護(hù)成本。
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖I是現(xiàn)有的一種電網(wǎng)管理系統(tǒng)的架構(gòu) 圖2是本發(fā)明電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警系統(tǒng)應(yīng)用架構(gòu)示意 圖3是本發(fā)明電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警系統(tǒng)中監(jiān)控告警服務(wù)器I的一個(gè)實(shí)施的結(jié)構(gòu)不意 圖4是圖3中的偵聽單元的結(jié)構(gòu)示意 圖5是本發(fā)明電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警方法的一個(gè)實(shí)施的主要流程 圖6是本發(fā)明電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警方法的一個(gè)實(shí)施的設(shè)置閾值告警區(qū)間的流程 圖7到圖10為圖6中閾值告警區(qū)間配置的界面示意圖。
具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對本發(fā)明作進(jìn)一步地詳細(xì)描述。如圖2所示,是本發(fā)明電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警系統(tǒng)應(yīng)用架構(gòu)示意圖。本發(fā)明通過在電網(wǎng)企業(yè)內(nèi)部核心交換機(jī)7上的鏡像端口上連接有監(jiān)控告警服務(wù)器1,用于捕捉核心交換機(jī)7的鏡像流量,并監(jiān)控核心業(yè)務(wù)網(wǎng)絡(luò)報(bào)文中對于核心業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫8訪問的數(shù)據(jù)腳本信息。使用者可以通過操作終端2對該監(jiān)控告警服務(wù)器I進(jìn)行操作,進(jìn)行諸如流量監(jiān)控、閾值告警區(qū)間配置及郵件發(fā)送方設(shè)置等工作。另外,在內(nèi)網(wǎng)上連接有多個(gè)郵件接收者3,通過監(jiān)控告警服務(wù)器I中觸發(fā)事件,將有關(guān)告警郵件發(fā)給企業(yè)的郵件服務(wù)器(未示出),然后再轉(zhuǎn)發(fā)給郵件接受者3。其他部件與圖I中的功能相同或相似,在此不進(jìn)行詳述。如圖3所示,是本發(fā)明電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警系統(tǒng)中監(jiān)控告警服務(wù)器I的一個(gè)實(shí)施的結(jié)構(gòu)示意圖;其包括
監(jiān)控?cái)?shù)據(jù)獲取單元10,用于獲取所述電網(wǎng)的一種核心業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù);監(jiān)控?cái)?shù)據(jù)分析單元11,用于分析所述監(jiān)控?cái)?shù)據(jù)獲取單元10所獲取的所述業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù),并與預(yù)先設(shè)置的所述業(yè)務(wù)系統(tǒng)的每類監(jiān)控?cái)?shù)據(jù)所對應(yīng)的閾值告警區(qū)間進(jìn)行比較; 比較結(jié)果處理單元13,用于在所述監(jiān)控?cái)?shù)據(jù)分析單元11的比較結(jié)果為至少一類監(jiān)控?cái)?shù)據(jù)達(dá)到所述業(yè)務(wù)系統(tǒng)的閾值告警區(qū)間,通過郵件將告警信息發(fā)送給所述業(yè)務(wù)系統(tǒng)對應(yīng)的郵件接收方3,實(shí)現(xiàn)智能化告警。其中,該監(jiān)控?cái)?shù)據(jù)獲取單元10包括
偵聽單元100,用于在所述電網(wǎng)的核心交換機(jī)7上偵聽獲得所述核心業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù),在具體實(shí)現(xiàn)時(shí),可以同時(shí)獲得多種核心業(yè)務(wù)系統(tǒng)的監(jiān)控制數(shù)據(jù);或者
腳本數(shù)據(jù)獲取單元101,用于獲取所述核心業(yè)務(wù)系統(tǒng)在網(wǎng)絡(luò)上的數(shù)據(jù)庫訪問腳本數(shù)據(jù),該腳本數(shù)據(jù)可以是諸如SQL腳本和PL/SQL腳本數(shù)據(jù),或者SQL NET協(xié)議下的腳本數(shù)據(jù)。一并結(jié)合圖4所示,所述偵聽單元100進(jìn)一步包括
鏡像流量信息偵聽子單元103,用于通過對所述核心交換機(jī)7的鏡像端口進(jìn)行偵聽,獲得所述核心交換機(jī)7的鏡像流量信息,具體地,可以對核心交換機(jī)中所有http和https協(xié)議下進(jìn)行實(shí)時(shí)數(shù)據(jù)捕捉。在一個(gè)實(shí)施例中,可以采用ORACLE公司如意軟件來進(jìn)行該數(shù)據(jù)采集;
監(jiān)控?cái)?shù)據(jù)選擇子單元104,用于從所述鏡像流量信息偵聽子單元103獲得的所述鏡像流量信息中獲得其中一種核心業(yè)務(wù)系統(tǒng)的監(jiān)控?cái)?shù)據(jù),該核心業(yè)務(wù)系統(tǒng)的監(jiān)控?cái)?shù)據(jù)包括核心業(yè)務(wù)系統(tǒng)的網(wǎng)絡(luò)流量值(PV)、使用客戶離網(wǎng)率、頁面訪問平均加載時(shí)間中至少一個(gè),在其他的實(shí)施方式中,該監(jiān)控?cái)?shù)據(jù)還可以包括諸如當(dāng)前會話的數(shù)量、每分鐘的網(wǎng)絡(luò)流量等等。其中,所述腳本數(shù)據(jù)獲取單元101具體為通過數(shù)據(jù)庫防火墻軟件(如Oracle數(shù)據(jù)庫防火墻軟件等)監(jiān)控獲得所述核心業(yè)務(wù)系統(tǒng)的網(wǎng)絡(luò)報(bào)文中對于數(shù)據(jù)庫訪問的SQL腳本數(shù)據(jù),該腳本數(shù)據(jù)可以是諸如SQL腳本和PL/SQL腳本數(shù)據(jù),或者SQL NET協(xié)議下的腳本數(shù)據(jù)。所述核心業(yè)務(wù)系統(tǒng)的監(jiān)控?cái)?shù)據(jù)包括生成所述SQL腳本的數(shù)據(jù)庫交易時(shí)間以及數(shù)據(jù)庫交易的SQL腳本等重要信息。在該監(jiān)控告警服務(wù)器中進(jìn)一步包括閾值告警區(qū)間設(shè)置單元12,所述閾值告警區(qū)間設(shè)置單元12包括
正常監(jiān)控?cái)?shù)據(jù)獲得單元120,用于通過監(jiān)控?cái)?shù)據(jù)獲取單元10監(jiān)控獲得每一業(yè)務(wù)系統(tǒng)的一定區(qū)間(如五天或十天等)內(nèi)的正常的每一類監(jiān)控?cái)?shù)據(jù);
設(shè)置單元121,用于根據(jù)所述正常監(jiān)控?cái)?shù)據(jù)獲得單元120所獲得的正常的監(jiān)控?cái)?shù)據(jù)以及每一業(yè)務(wù)系統(tǒng)的數(shù)據(jù)模型,設(shè)置每一類監(jiān)控?cái)?shù)據(jù)對應(yīng)的閾值告警區(qū)間并存儲。其中,在本發(fā)明中為了設(shè)置閾值告警區(qū)間,所采用的是通過其正常的監(jiān)控?cái)?shù)據(jù)樣板的過去表現(xiàn)來預(yù)測其未來的流量趨勢來進(jìn)行預(yù)警。根據(jù)電網(wǎng)核心業(yè)務(wù)的分析特點(diǎn),由于內(nèi)部用戶在調(diào)度業(yè)務(wù)流程,其訪問的并發(fā)數(shù),產(chǎn)生的系統(tǒng)流量在某個(gè)觀察區(qū)間內(nèi)都相對比較穩(wěn)定,因此任何突然的流量上升或者下降都預(yù)示著某種可以預(yù)見的危險(xiǎn),需要立即引起系統(tǒng)管理員的關(guān)注和持續(xù)跟蹤分析,例如由于網(wǎng)絡(luò)交換機(jī)或者負(fù)載均衡器的堵塞所造成的流量突然下降或者大規(guī)模的內(nèi)部網(wǎng)絡(luò)攻擊來偷竊客戶數(shù)據(jù)等嚴(yán)重安全泄密事件的發(fā)生等。故在經(jīng)過一段時(shí)間正常流量的捕捉和分析后,就可以依照企業(yè)網(wǎng)絡(luò)數(shù)據(jù)的經(jīng)驗(yàn)值來設(shè)計(jì)閥值告警區(qū)間。若所述監(jiān)控?cái)?shù)據(jù)為網(wǎng)絡(luò)流量數(shù)據(jù),則所述業(yè)務(wù)系統(tǒng)的業(yè)務(wù)信息對應(yīng)的閾值告警區(qū)間為大于所述一定區(qū)間內(nèi)的正常監(jiān)控?cái)?shù)據(jù)中的最大值的區(qū)間。進(jìn)一步地,還包括郵件關(guān)聯(lián)設(shè)置單元14,用于預(yù)先設(shè)置每一業(yè)務(wù)系統(tǒng)的每一類監(jiān)控?cái)?shù)據(jù)對應(yīng)至少一個(gè)郵件接收方3,在具體的實(shí)現(xiàn)中,可以采用監(jiān)控告警服務(wù)器中的郵件服務(wù)器與企業(yè)SMTP郵件服務(wù)器實(shí)現(xiàn)互聯(lián),從而可以實(shí)現(xiàn)向郵件接收者3定時(shí)發(fā)出告警郵件或監(jiān)控報(bào)表等。其中,比較結(jié)果處理單元13進(jìn)一步包括
告警郵件生成單元130,用于根據(jù)所述監(jiān)控?cái)?shù)據(jù)分析單元11中比較結(jié)果,判斷是否有 監(jiān)控?cái)?shù)據(jù)處于閾值告警區(qū)間內(nèi),如是,則含有告警信息(如業(yè)務(wù)系統(tǒng)類別、監(jiān)控?cái)?shù)據(jù)類別,具體的監(jiān)控?cái)?shù)據(jù)數(shù)值,可能存在的問題等)的告警郵件;
告警郵件發(fā)送單元131,用于將告警觸發(fā)單元130所生成的告警郵件,發(fā)送給郵件關(guān)聯(lián)設(shè)置單元14所預(yù)先設(shè)置的該類監(jiān)控?cái)?shù)據(jù)所對應(yīng)的郵件接收者3。如圖5所示,是本發(fā)明電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警方法的一個(gè)實(shí)施的主要流程圖;該流程包括如下步驟
步驟S51,獲得所述電網(wǎng)的一種核心業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù);
具體地,可以在所述電網(wǎng)的核心交換機(jī)上偵聽獲得一種核心業(yè)務(wù)系統(tǒng)的監(jiān)控?cái)?shù)據(jù),在具體的實(shí)施例中,通過對所述核心交換機(jī)的鏡像端口進(jìn)行偵聽,獲得所述核心交換機(jī)的鏡像流量信息;然后從所述鏡像流量信息中獲得所述一種核心業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù),所述核心業(yè)務(wù)系統(tǒng)的監(jiān)控?cái)?shù)據(jù)包括核心業(yè)務(wù)系統(tǒng)的網(wǎng)絡(luò)流量值、離網(wǎng)率、頁面訪問平均加載時(shí)間中至少一個(gè)?;蛘?br>
獲取所述核心業(yè)務(wù)系統(tǒng)在網(wǎng)絡(luò)上的數(shù)據(jù)庫訪問腳本數(shù)據(jù),在具體的實(shí)施方法中,通過數(shù)據(jù)庫防火墻軟件監(jiān)控獲得所述核心業(yè)務(wù)系統(tǒng)的網(wǎng)絡(luò)報(bào)文中對于數(shù)據(jù)庫訪問的SQL腳本數(shù)據(jù),所述核心業(yè)務(wù)系統(tǒng)的監(jiān)控?cái)?shù)據(jù)包括生成所述SQL腳本的數(shù)據(jù)庫交易時(shí)間。步驟S52,分析所獲得的所述業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù),并與預(yù)先設(shè)置的所述業(yè)務(wù)系統(tǒng)的每類監(jiān)控?cái)?shù)據(jù)所對應(yīng)的閾值告警區(qū)間進(jìn)行比較;
步驟S53,在比較結(jié)果為至少一類監(jiān)控?cái)?shù)據(jù)達(dá)到閾值告警區(qū)間時(shí),通過郵件將告警信息發(fā)送給所述業(yè)務(wù)系統(tǒng)對應(yīng)的郵件接收方。具體地,該步驟包括
根據(jù)步驟S52的比較結(jié)果,判斷比較結(jié)果是否在對應(yīng)的閾值告警區(qū)間內(nèi),如果則觸發(fā)自動(dòng)告警流程,生成含有告警信息(如業(yè)務(wù)系統(tǒng)類別、監(jiān)控?cái)?shù)據(jù)類別,具體的監(jiān)控?cái)?shù)據(jù)數(shù)值,可能存在的問題等))的告警郵件;
將所生成的告警郵件,發(fā)送給預(yù)先設(shè)置的該業(yè)務(wù)系統(tǒng)所對應(yīng)的郵件接收者。可以理解的是,需要預(yù)先為每一業(yè)務(wù)系統(tǒng)的每一類監(jiān)控?cái)?shù)據(jù)設(shè)置對應(yīng)至少一個(gè)郵件接收方。
如圖6所示,是本發(fā)明電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警方法的一個(gè)實(shí)施的設(shè)置閾值告警區(qū)間的流程圖;該設(shè)置閾值告警區(qū)間的流程圖包括
監(jiān)控獲得每一業(yè)務(wù)系統(tǒng)的一定區(qū)間內(nèi)的正常的每一類監(jiān)控?cái)?shù)據(jù);
根據(jù)所述正常的監(jiān)控?cái)?shù)據(jù)以及每一業(yè)務(wù)系統(tǒng)的數(shù)據(jù)模型,設(shè)置所述每一類業(yè)務(wù)系統(tǒng)的每一類業(yè)務(wù)信息對應(yīng)的閾值告警區(qū)間并存儲,在一個(gè)實(shí)施例中,若所述監(jiān)控?cái)?shù)據(jù)為網(wǎng)絡(luò)流量數(shù)據(jù),則所述業(yè)務(wù)系統(tǒng)的業(yè)務(wù)信息對應(yīng)的閾值告警區(qū)間為大于所述一定區(qū)間內(nèi)的正常監(jiān)控?cái)?shù)據(jù)中的最大值的區(qū)間。圖7-圖10為圖6中閾值告警區(qū)間配置的界面示意圖。分別示出了某一個(gè)業(yè)務(wù)系統(tǒng)的當(dāng)前會話數(shù)、離網(wǎng)率、網(wǎng)頁加載時(shí)間和網(wǎng)絡(luò)流量的閾值告警區(qū)間配置示意圖??梢岳斫獾氖?,此處僅為舉例,當(dāng)然還有其他類型的監(jiān)控?cái)?shù)據(jù)的閾值告警區(qū)間。例如,在一個(gè)實(shí)施例 中,在工作日的10點(diǎn)05分到11點(diǎn)05分,經(jīng)過對正常的流量監(jiān)測以及預(yù)估,對某一個(gè)業(yè)務(wù)系統(tǒng)(如資源管理系統(tǒng))的不同類別的監(jiān)控?cái)?shù)據(jù)分別設(shè)置了對應(yīng)的閾值告警區(qū)間,在圖7至圖10中虛線部分以下的區(qū)間為正常的區(qū)間,在虛線部分以上的為閾值告警區(qū)間。即在圖7中,當(dāng)檢測到該業(yè)務(wù)系統(tǒng)的當(dāng)前會話數(shù)超過1600個(gè),則觸發(fā)報(bào)警;在圖8中,當(dāng)檢測到該業(yè)務(wù)系統(tǒng)的離網(wǎng)率超過50%,則觸發(fā)報(bào)警;在圖9中,當(dāng)檢測到該業(yè)務(wù)系統(tǒng)的平均網(wǎng)頁加載時(shí)間超過10秒,則觸發(fā)報(bào)警。在一個(gè)實(shí)施例中,當(dāng)在步驟S52中檢測到某一電網(wǎng)核心業(yè)務(wù)系統(tǒng)(例如資源管理系統(tǒng)的)平均頁面加載時(shí)間,從I. 5秒陡增到19秒,達(dá)到了該業(yè)務(wù)系統(tǒng)的平均頁面加載時(shí)間閾值告警區(qū)間(大于10秒),那么說明此時(shí)對資源管理系統(tǒng)的業(yè)務(wù)訪問正在急速變慢,其原因有可能是核心交換機(jī)所導(dǎo)致的網(wǎng)路堵塞,或者業(yè)務(wù)調(diào)用在中間件服務(wù)器的JAVA存儲過程中的腳本可能有死循環(huán),造成服務(wù)器堆棧崩潰、內(nèi)存溢出,從而可能出現(xiàn)業(yè)務(wù)中止造成業(yè)務(wù)無法辦理。無論哪種原因都可以在步驟S53中觸發(fā)告警流程,通知郵件接收者(例如,系統(tǒng)管理員)進(jìn)行關(guān)注和分析,防止大面積的系統(tǒng)報(bào)錯(cuò)產(chǎn)生。實(shí)施本發(fā)明的實(shí)施例,具有如下的有益效果
本發(fā)明采用監(jiān)控告警服務(wù)器對電網(wǎng)核心交換機(jī)進(jìn)行流量和SQL數(shù)據(jù)庫腳本進(jìn)行偵聽,并對每一類型的監(jiān)控?cái)?shù)據(jù)設(shè)置一個(gè)閾值告警區(qū)間,當(dāng)判斷到某一類監(jiān)控?cái)?shù)據(jù)達(dá)到該類數(shù)據(jù)預(yù)先設(shè)定的閥值告警區(qū)間,能夠及時(shí)向?qū)?yīng)的郵件接收者發(fā)送告警郵件。設(shè)計(jì)數(shù)據(jù)區(qū)間組合來發(fā)出告警信息,從而實(shí)現(xiàn)了智能化告警機(jī)制。
本發(fā)明實(shí)現(xiàn)了對電網(wǎng)核心業(yè)務(wù)系統(tǒng)的實(shí)時(shí)智能化監(jiān)控和告警,提高了現(xiàn)有IT系統(tǒng)的投資回報(bào),降低了企業(yè)的運(yùn)營和系統(tǒng)維護(hù)成本。以上所揭露的僅是本發(fā)明的較佳實(shí)施例而已,然不能以此來限定本發(fā)明的權(quán)利范圍,本領(lǐng)域技術(shù)人員利用上述揭露的技術(shù)內(nèi)容做出些許簡單修改、等同變化或修飾,仍屬于本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)庫智能化監(jiān)控告警方法,其特征在于,包括 獲得所述電網(wǎng)的一種核心業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù); 分析所獲得的所述至少一類監(jiān)控?cái)?shù)據(jù),并與預(yù)先設(shè)置的所述業(yè)務(wù)系統(tǒng)的每類監(jiān)控?cái)?shù)據(jù)所對應(yīng)的閾值告警區(qū)間進(jìn)行比較; 在比較結(jié)果為至少一類監(jiān)控?cái)?shù)據(jù)達(dá)到閾值告警區(qū)間時(shí),通過郵件將告警信息發(fā)送給所述業(yè)務(wù)系統(tǒng)對應(yīng)的郵件接收方。
2.如權(quán)利要求I所述的電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警方法,其特征在于,所述獲得所述電網(wǎng)的一種核心業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù)包括 在所述電網(wǎng)的核心交換機(jī)上偵聽獲得所述核心業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù);或者 獲取所述核心業(yè)務(wù)系統(tǒng)在網(wǎng)絡(luò)上的數(shù)據(jù)庫訪問腳本數(shù)據(jù)。
3.如權(quán)利要求2所述的電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警方法,其特征在于,所述在所述電網(wǎng)的核心交換機(jī)上進(jìn)行偵聽的步驟具體為 通過對所述核心交換機(jī)的鏡像端口進(jìn)行偵聽,獲得所述核心交換機(jī)的鏡像流量信息;從所述鏡像流量信息中獲得所述核心業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù),所述核心業(yè)務(wù)系統(tǒng)的監(jiān)控?cái)?shù)據(jù)包括核心業(yè)務(wù)系統(tǒng)的網(wǎng)絡(luò)流量值、離網(wǎng)率、頁面訪問平均加載時(shí)間中至少一個(gè)。
4.如權(quán)利要求2所述的電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警方法,其特征在于,所述獲取所述核心業(yè)務(wù)系統(tǒng)在網(wǎng)絡(luò)上的數(shù)據(jù)庫訪問腳本數(shù)據(jù)的具體步驟為 通過數(shù)據(jù)庫防火墻軟件監(jiān)控獲得所述核心業(yè)務(wù)系統(tǒng)的網(wǎng)絡(luò)報(bào)文中對于數(shù)據(jù)庫訪問的SQL腳本數(shù)據(jù),所述核心業(yè)務(wù)系統(tǒng)的監(jiān)控?cái)?shù)據(jù)包括生成所述SQL腳本的數(shù)據(jù)庫交易時(shí)間。
5.如權(quán)利要求1-4任一項(xiàng)所述的電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警方法,其特征在于,進(jìn)一步包括預(yù)先設(shè)置業(yè)務(wù)系統(tǒng)對應(yīng)的閾值告警區(qū)間的步驟,所述步驟包括 監(jiān)控獲得每一業(yè)務(wù)系統(tǒng)的一定區(qū)間內(nèi)的正常的每一類監(jiān)控?cái)?shù)據(jù); 根據(jù)所述正常的監(jiān)控?cái)?shù)據(jù)以及每一業(yè)務(wù)系統(tǒng)的數(shù)據(jù)模型,設(shè)置所述業(yè)務(wù)系統(tǒng)每一類監(jiān)控?cái)?shù)據(jù)所對應(yīng)的閾值告警區(qū)間并存儲。
6.如權(quán)利要求5所述的電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警方法,其特征在于,若所述監(jiān)控?cái)?shù)據(jù)為網(wǎng)絡(luò)流量數(shù)據(jù),則所述監(jiān)控?cái)?shù)據(jù)對應(yīng)的閾值告警區(qū)間為大于所述一定區(qū)間內(nèi)的正常監(jiān)控?cái)?shù)據(jù)中的最大值的區(qū)間。
7.如權(quán)利要求5所述的電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警方法,其特征在于,包括 預(yù)先設(shè)置每一業(yè)務(wù)系統(tǒng)的每一類監(jiān)控?cái)?shù)據(jù)對應(yīng)至少一個(gè)郵件接收方。
8.—種電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)庫智能化監(jiān)控告警系統(tǒng),其特征在于,包括 監(jiān)控?cái)?shù)據(jù)獲取單元,用于獲取所述電網(wǎng)的一種核心業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù);監(jiān)控?cái)?shù)據(jù)分析單元,用于分析所述監(jiān)控?cái)?shù)據(jù)獲取單元所獲取的所述業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù),并與預(yù)先設(shè)置的所述業(yè)務(wù)系統(tǒng)的每類監(jiān)控?cái)?shù)據(jù)所對應(yīng)的閾值告警區(qū)間進(jìn)行比較; 比較結(jié)果處理單元,用于在所述監(jiān)控?cái)?shù)據(jù)分析單元的比較結(jié)果為至少一類監(jiān)控?cái)?shù)據(jù)達(dá)到閾值告警區(qū)間時(shí),通過郵件將告警信息發(fā)送給所述業(yè)務(wù)系統(tǒng)對應(yīng)的郵件接收方。
9.如權(quán)利要求8所述的電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警系統(tǒng),其特征在于,所述監(jiān)控?cái)?shù)據(jù)獲取單元包括偵聽單元,用于在所述電網(wǎng)的核心交換機(jī)上偵聽獲得所述核心業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù);或者 腳本數(shù)據(jù)獲取單元,用于獲取所述核心業(yè)務(wù)系統(tǒng)在網(wǎng)絡(luò)上的數(shù)據(jù)庫訪問腳本數(shù)據(jù)。
10.如權(quán)利要求9所述的電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警系統(tǒng),其特征在于,所述偵聽單元進(jìn)一步包括 鏡像流量信息偵聽子單元,用于通過對所述核心交換機(jī)的鏡像端口進(jìn)行偵聽,獲得所述核心交換機(jī)的鏡像流量信息; 監(jiān)控?cái)?shù)據(jù)選擇子單元,用于從所述鏡像流量信息偵聽子單元獲得的所述鏡像流量信息中獲得所述核心業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù),所述核心業(yè)務(wù)系統(tǒng)的監(jiān)控?cái)?shù)據(jù)包括核心業(yè)務(wù)系統(tǒng)的網(wǎng)絡(luò)流量值、離網(wǎng)率、頁面訪問平均加載時(shí)間中至少一個(gè)。
11.如權(quán)利要求9所述的電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警系統(tǒng),其特征在于,所述腳本數(shù)據(jù)獲取單元具體為通過數(shù)據(jù)庫防火墻軟件監(jiān)控獲得所述核心業(yè)務(wù)系統(tǒng)的網(wǎng)絡(luò)報(bào)文中對于數(shù)據(jù)庫訪問的SQL腳本數(shù)據(jù),所述核心業(yè)務(wù)系統(tǒng)的監(jiān)控?cái)?shù)據(jù)包括生成所述SQL腳本的數(shù)據(jù)庫交易時(shí)間。
12.如權(quán)利要求8-11任一項(xiàng)所述的電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警系統(tǒng),其特征在于,進(jìn)一步包括閾值告警區(qū)間設(shè)置單元,所述閾值告警區(qū)間設(shè)置單元包括 正常監(jiān)控?cái)?shù)據(jù)獲得單元,用于監(jiān)控獲得每一業(yè)務(wù)系統(tǒng)的一定區(qū)間內(nèi)的正常的每一類監(jiān)控?cái)?shù)據(jù); 設(shè)置單元,用于根據(jù)所述正常監(jiān)控?cái)?shù)據(jù)獲得單元所獲得的正常的監(jiān)控?cái)?shù)據(jù)以及每一業(yè)務(wù)系統(tǒng)的數(shù)據(jù)模型,設(shè)置所述業(yè)務(wù)系統(tǒng)每一類監(jiān)控?cái)?shù)據(jù)對應(yīng)的閾值告警區(qū)間并存儲。
13.如權(quán)利要求12所述的電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警系統(tǒng),其特征在于,若所述監(jiān)控?cái)?shù)據(jù)為網(wǎng)絡(luò)流量數(shù)據(jù),則所述監(jiān)控?cái)?shù)據(jù)對應(yīng)的閾值告警區(qū)間為大于所述一定區(qū)間內(nèi)的正常監(jiān)控?cái)?shù)據(jù)中的最大值的區(qū)間。
14.如權(quán)利要求12所述的電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)智能化監(jiān)控告警系統(tǒng),其特征在于,包括 郵件關(guān)聯(lián)設(shè)置單元,用于預(yù)先設(shè)置每一業(yè)務(wù)系統(tǒng)的每一類監(jiān)控?cái)?shù)據(jù)對應(yīng)至少一個(gè)郵件接收方。
全文摘要
本發(fā)明實(shí)施例提供了一種電網(wǎng)核心業(yè)務(wù)數(shù)據(jù)庫智能化監(jiān)控告警方法,包括獲得所述電網(wǎng)的一種核心業(yè)務(wù)系統(tǒng)的至少一類監(jiān)控?cái)?shù)據(jù);分析所獲得的所述至少一類監(jiān)控?cái)?shù)據(jù),并與預(yù)先設(shè)置的所述業(yè)務(wù)系統(tǒng)的每類監(jiān)控?cái)?shù)據(jù)所對應(yīng)的閾值告警區(qū)間進(jìn)行比較;在比較結(jié)果為至少一類監(jiān)控?cái)?shù)據(jù)達(dá)到閾值告警區(qū)間時(shí),通過郵件將告警信息發(fā)送給所述業(yè)務(wù)系統(tǒng)對應(yīng)的郵件接收方。本發(fā)明同時(shí)提供了一種相應(yīng)的系統(tǒng)。實(shí)現(xiàn)本發(fā)明,可以實(shí)現(xiàn)對電網(wǎng)核心業(yè)務(wù)系統(tǒng)的實(shí)時(shí)智能化及監(jiān)控和告警,提高了現(xiàn)有IT系統(tǒng)的投資回報(bào),降低了企業(yè)的運(yùn)營和系統(tǒng)維護(hù)成本。
文檔編號H04L12/24GK102882701SQ20121028753
公開日2013年1月16日 申請日期2012年8月14日 優(yōu)先權(quán)日2012年8月14日
發(fā)明者陳瑞, 邱海楓, 何子龍, 黃必峰 申請人:深圳供電局有限公司