亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種運(yùn)維告警處理方法和裝置的制作方法

文檔序號(hào):7768864閱讀:570來源:國知局
專利名稱:一種運(yùn)維告警處理方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及IT運(yùn)維領(lǐng)域,特別是運(yùn)維告警處理方法。
背景技術(shù)
隨著信息化建設(shè)的深入發(fā)展,IT系統(tǒng)日益成為核心業(yè)務(wù)處理的關(guān)鍵基礎(chǔ)設(shè)施;為 了保證網(wǎng)絡(luò)、服務(wù)器、數(shù)據(jù)庫等IT資源的正常運(yùn)行,需要對(duì)其進(jìn)行維護(hù);當(dāng)系統(tǒng)出現(xiàn)異常時(shí) 能夠及時(shí)產(chǎn)生告警并通知到運(yùn)維人員。運(yùn)維人員能夠根據(jù)告警對(duì)異常進(jìn)行定位,診斷,并完 成相應(yīng)的維護(hù)操作。告警的準(zhǔn)確性、實(shí)時(shí)性和有效性對(duì)保證系統(tǒng)故障的及時(shí)發(fā)現(xiàn)、預(yù)警和解 決起著至關(guān)重要的作用。

發(fā)明內(nèi)容
本發(fā)明提供了一種IT運(yùn)維告警處理方法,其主要步驟為1)采集點(diǎn)對(duì)系統(tǒng)運(yùn)行狀 態(tài)和性能指標(biāo)進(jìn)行采集;2)采集點(diǎn)將數(shù)據(jù)上傳到處理服務(wù)器;3)處理服務(wù)器按照預(yù)先定義 的規(guī)則判斷是否存在異常情況;如果有異常,則產(chǎn)生異常;4)對(duì)新產(chǎn)生的異常,進(jìn)行相關(guān)性 分析,確定是否產(chǎn)生新告警;5)對(duì)新產(chǎn)生的告警,執(zhí)行短信發(fā)送,報(bào)警燈驅(qū)動(dòng),即時(shí)消息發(fā)送 等操作。本發(fā)明還提供了一種根據(jù)上述方法制作的裝置,如圖1所示。該裝置包括3部分 采集單元,告警處理單元和告警發(fā)送單元。其中采集單元負(fù)責(zé)采集IT基礎(chǔ)設(shè)施的狀態(tài)和性 能數(shù)據(jù)。告警處理單元包括四個(gè)子單元異常判斷,負(fù)責(zé)按照預(yù)定義的規(guī)則對(duì)數(shù)據(jù)進(jìn)行分 析,確定是否有異常發(fā)生;相關(guān)性分析,將新的異常和已經(jīng)發(fā)現(xiàn)的事件進(jìn)行分析,判斷該異 常是否應(yīng)該觸發(fā)一個(gè)新的事件;信息擴(kuò)充,原始的告警里面可能只有一些基礎(chǔ)信息,通過 擴(kuò)充后,內(nèi)容變得更加豐富,運(yùn)維人員可以更有效的理解告警并做出最佳判斷。采集單元采集的數(shù)據(jù)包括狀態(tài)數(shù)據(jù)和性能數(shù)據(jù),它可以支持多種采集方式,包括 SNMP, Telnet/SSH, JDBC, JMX等,涵蓋網(wǎng)絡(luò)、服務(wù)器、數(shù)據(jù)庫、中間件等多種IT基礎(chǔ)設(shè)施。在IT運(yùn)維中,如何自動(dòng)判斷系統(tǒng)運(yùn)行異常是非常重要的。有些故障如系統(tǒng)無法訪 問,這會(huì)導(dǎo)致業(yè)務(wù)無法處理,用戶會(huì)報(bào)告投訴;但有些潛在的問題,用戶感受不到,但可以根 據(jù)相關(guān)知識(shí)做成判斷,比如,某鏈路的流量晚上正常狀態(tài)是1M以下,如果超出1M甚至更高, 就可能存在異常。異常判斷單元根據(jù)規(guī)則識(shí)別系統(tǒng)運(yùn)行中存在的問題。在規(guī)則中,采集單 元采集到的數(shù)據(jù)都稱為“值”,每個(gè)值都包含有所屬設(shè)備、模塊、指標(biāo)、采集時(shí)間等屬性。規(guī)則 是計(jì)算值是否滿足條件的表達(dá)式,表達(dá)式由宏,標(biāo)識(shí)符和運(yùn)算符組成。異常判斷單元對(duì)接收 到的每個(gè)值進(jìn)行宏替換后進(jìn)行計(jì)算,如果計(jì)算后的值為真,則表示出現(xiàn)異常。表達(dá)式的靈活 性使得這種判斷方法能適應(yīng)多種不同類型設(shè)備、指標(biāo)和場(chǎng)景的需要。原始告警信息中只包括告警來源,發(fā)生時(shí)間,內(nèi)容等屬性。由于業(yè)務(wù)系統(tǒng)日益復(fù) 雜,為了幫助運(yùn)維人員更好的掌握告警可能產(chǎn)生的風(fēng)險(xiǎn)或問題,對(duì)業(yè)務(wù)的影響等,信息擴(kuò)充 單元實(shí)現(xiàn)對(duì)告警信息的屬性進(jìn)行擴(kuò)充。在IT系統(tǒng)中,網(wǎng)絡(luò)、服務(wù)器、數(shù)據(jù)庫等資源之間是相互聯(lián)系的。當(dāng)其中某個(gè)組件發(fā)生異常后,和它相關(guān)聯(lián)的組件也會(huì)產(chǎn)生同樣的異常報(bào)告,從而產(chǎn)生一系列的告警。如何通過 分析相關(guān)性在這一系列告警之間找到真正的故障原因和位置,是保證告警有效性的一個(gè)關(guān) 鍵。當(dāng)告警發(fā)生后,需要及時(shí)的將告警通知需要了解的運(yùn)維人員。適應(yīng)不同的緊急程 度,告警通知單元提供短信、郵件、燈光、消息等多種告警方式。短信、燈光、消息等適用于緊 急、對(duì)實(shí)時(shí)性要求高的告警,郵件適用于一般的告警。此外,根據(jù)本發(fā)明的實(shí)施例,本發(fā)明的采集點(diǎn)由機(jī)器人和多個(gè)探針組成;機(jī)器人負(fù) 責(zé)調(diào)度探針執(zhí)行采集動(dòng)作;
此外,根據(jù)本發(fā)明的實(shí)施例,探針支持的采集方式包括SNMP,Telnet, SSH,JDBC, JMX寸。此外,根據(jù)本發(fā)明的實(shí)施例,采集點(diǎn)可以分布安裝在多個(gè)地方,但數(shù)據(jù)是集中存放 的。此外,根據(jù)本發(fā)明的實(shí)施例,采集探針分為SNMP探針,JDBC探針,Telnet/SSH探 針,JMX探針等。此外,根據(jù)本發(fā)明的實(shí)施例,采集單元和告警處理單元之間通過數(shù)據(jù)總線和消息 總線連接;數(shù)據(jù)總線用于上報(bào)數(shù)據(jù),消息總線用于下發(fā)采集命令;
此外,根據(jù)本發(fā)明的實(shí)施例,一個(gè)告警處理單元可以接收多個(gè)采集單元的數(shù)據(jù); 此外,根據(jù)本發(fā)明的實(shí)施例,當(dāng)出現(xiàn)傳輸故障時(shí),采集單元可以嘗試一個(gè)或多個(gè)備份告 警處理單元;
此外,根據(jù)本發(fā)明的實(shí)施例,當(dāng)數(shù)據(jù)無法傳輸時(shí),采集單元可以保存最新一段時(shí)間的數(shù) 據(jù),直到傳輸恢復(fù)。此外,根據(jù)本發(fā)明的實(shí)施例,當(dāng)告警處理單元發(fā)現(xiàn)需要重新采集時(shí),可以通過消息 總線通知采集單元重新采集。此外,根據(jù)本發(fā)明的實(shí)施例,異常判斷是通過條件表達(dá)式來計(jì)算的,條件表達(dá)式通 過宏定義引用指標(biāo)值、環(huán)境值等;
此外,根據(jù)本發(fā)明的實(shí)施例,信息擴(kuò)充通過條件表達(dá)式標(biāo)識(shí)告警集合,通過值表達(dá)式定 義擴(kuò)充的字段值;
此外,根據(jù)本發(fā)明的實(shí)施例,相關(guān)性分析通過規(guī)則定義告警之間的資源相關(guān)性、時(shí)間相 關(guān)性和業(yè)務(wù)相關(guān)性;
此外,根據(jù)本發(fā)明的實(shí)施例,相關(guān)性分析實(shí)現(xiàn)屏蔽、壓縮、升級(jí)、關(guān)聯(lián)操作。此外,根據(jù)本發(fā)明的實(shí)施例,告警通知單元和告警處理單元通過TCP協(xié)議傳輸告 警;告警處理單元可以把告警推送到多個(gè)告警通知單元。此外,根據(jù)本發(fā)明的實(shí)施例,告警通知單元通過串口電平高低控制報(bào)警燈的開關(guān) 閃爍和顏色。此外,根據(jù)本發(fā)明的實(shí)施例,告警通知單元通過串口控制短信貓發(fā)送告警。


本發(fā)明將通過例子并參照附圖的方式說明,其中 圖1是告警處理方法示意圖。
圖2是采集機(jī)工作示意圖。圖3是采集機(jī)工作流程圖。圖4是告警信息擴(kuò)充流程圖。圖5是相關(guān)性分析流程圖。
具體實(shí)施例方式本說明書中公開的所有特征,或公開的所有方法或過程中的步驟,除了互相排斥 的特征和/或步驟以外,均可以以任何方式組合。本說明書(包括任何附加權(quán)利要求、摘要和附圖)中公開的任一特征,除非特別敘 述,均可被其他等效或具有類似目的的替代特征加以替換。即,除非特別敘述,每個(gè)特征只 是一系列等效或類似特征中的一個(gè)例子而已。下面將結(jié)合附圖對(duì)本發(fā)明做進(jìn)一步的說明
如圖1,本發(fā)明裝置包括采集單元,告警處理單元,告警通知單元。采集單元包括機(jī)器人 和SNMP、Telnet等各種探針。根據(jù)設(shè)備支持的不同技術(shù)接口,探針通過不同的技術(shù)手段收 集設(shè)備的運(yùn)行狀態(tài)。采集單元將采集到的數(shù)據(jù)通過數(shù)據(jù)總線傳遞給告警處理單元。同時(shí), 采集單元也接收來自告警處理單元的指令,當(dāng)出現(xiàn)采集數(shù)據(jù)錯(cuò)誤時(shí)進(jìn)行重采、補(bǔ)采等操作。 采集單元和告警處理單元之間的連接支持備份。即當(dāng)采集單元發(fā)現(xiàn)當(dāng)前使用的告警處理單 元無法通信時(shí),可以自動(dòng)連接備份的告警處理單元。如果所有的告警處理單元都無法連接, 告警采集單元可保存最近一段時(shí)間的數(shù)據(jù),直到剩余磁盤空間小于指定大小。當(dāng)剩余空間 不足時(shí),告警采集單元會(huì)丟棄最“舊”的數(shù)據(jù);通過上述方法可最大可能保證告警的及時(shí)性 和準(zhǔn)確性。告警處理單元接收到原始數(shù)據(jù)后,首先根據(jù)預(yù)置的異常判斷規(guī)則分析是否出現(xiàn) 了異常。異??梢允荌T資源或業(yè)務(wù)系統(tǒng)的某個(gè)具體技術(shù)指標(biāo),可以是用戶體驗(yàn)的某個(gè)度 量;也可能是多個(gè)指標(biāo)綜合運(yùn)算后得出的判斷。為了能夠適應(yīng)不同設(shè)備、不同業(yè)務(wù)系統(tǒng)的復(fù) 雜性,規(guī)則通過異常表達(dá)式來描述異常。用戶可以根據(jù)自己對(duì)IT系統(tǒng)的理解,將異常情況 用表達(dá)式進(jìn)行描述。由于表達(dá)式的宏替換、運(yùn)算等可能比較耗時(shí),異常判斷模塊會(huì)記錄表達(dá) 式處理的性能并定期進(jìn)行分析,籍此優(yōu)化調(diào)整表達(dá)式處理的并發(fā)線程數(shù)。為了增加告警的可讀性,幫助運(yùn)維人員更準(zhǔn)確的分析告警,信息擴(kuò)充單元對(duì)告警 字段進(jìn)行擴(kuò)充。本裝置中,告警信息預(yù)留了擴(kuò)充字段。如圖4所示,系統(tǒng)首先定義一個(gè)條件 表達(dá)式,確定滿足條件的告警集合,然后再定義一個(gè)或多個(gè)擴(kuò)充字段的值表達(dá)式。對(duì)每條告 警,系統(tǒng)判斷其屬性是否滿足條件表達(dá)式,如果滿足,則將告警的原始屬性、環(huán)境信息、業(yè)務(wù) 信息、設(shè)備維護(hù)信息等宏替換代入值表達(dá)式,計(jì)算出擴(kuò)充字段的值。對(duì)一條新產(chǎn)生的告警,相關(guān)性分析單元將其與歷史告警進(jìn)行比較分析,以確定這 些事件之間是否存在相關(guān)性,并確定根源告警和衍生告警。這種相關(guān)性包括時(shí)間相關(guān)性、資 源相關(guān)性和業(yè)務(wù)相關(guān)性。如圖5所示,相關(guān)性處理包括下列步驟1)用戶建立相關(guān)性規(guī)則, 并確定規(guī)則的優(yōu)先級(jí);系統(tǒng)提供的規(guī)則能夠描述時(shí)間、資源和業(yè)務(wù)等相關(guān)性;2)系統(tǒng)讀取 預(yù)置規(guī)則;3)當(dāng)新告警產(chǎn)生后,系統(tǒng)根據(jù)告警的屬性和相關(guān)性規(guī)則計(jì)算出一個(gè)告警集合,如 果告警集合包含不止一個(gè)元素,則該告警和其他告警存在相關(guān)性,進(jìn)一步分析根源告警和衍生告警(默認(rèn)是先產(chǎn)生的告警為根源告警);4)對(duì)具有相關(guān)性的告警,根據(jù)規(guī)則預(yù)定義的 動(dòng)作執(zhí)行屏蔽、壓縮、升級(jí)等操作。5)具有相關(guān)性的告警,在顯示裝置上可分組顯示。告警經(jīng)過擴(kuò)充,相關(guān)性分析后,需要通知相關(guān)的運(yùn)維人員,包括通過查詢,短信,郵 件,燈光等。如圖1所示,本裝置中,告警通知裝置與告警處理裝置之間通過TCP進(jìn)行通信, 告警處理裝置將告警推送給告警通知裝置。告警通知裝置通過串口和短信貓、報(bào)警燈等連 接。裝置通過串口協(xié)議與短信貓通信并發(fā)送短信。裝置通過高低電平控制報(bào)警燈的開關(guān)。本發(fā)明并不局限于前述的具體實(shí)施方式
。本發(fā)明擴(kuò)展到任何在本說明書中披露 的新特征或任何新的組合,以及披露的任一新的方法或過程的步驟或任何新的組合。
權(quán)利要求
一種運(yùn)維告警處理方法,其特征在于該方法包括以下步驟:1)告警采集,機(jī)器人調(diào)度各種探針收集IT資源運(yùn)行健康狀況;2)告警處理,通過異常判斷,信息擴(kuò)充,相關(guān)性分析,保存等過程產(chǎn)生告警,擴(kuò)充字段,屏蔽無效告警等;3)告警通知通過短信、報(bào)警燈、郵件、消息等方式將告警通知相關(guān)運(yùn)維人員。
2.根據(jù)權(quán)利要求1所述的運(yùn)維告警處理方法,其特征在于所述相關(guān)性分析的過程主 要包括下列步驟1)用戶建立相關(guān)性規(guī)則;2)系統(tǒng)讀取預(yù)置規(guī)則;3)當(dāng)新告警產(chǎn)生后,系 統(tǒng)根據(jù)告警的屬性和相關(guān)性規(guī)則計(jì)算出一個(gè)告警集合,如果告警集合包含不止一個(gè)元素, 則該告警和其他告警存在相關(guān)性,進(jìn)一步分析根源告警和衍生告警;4)對(duì)具有相關(guān)性的告 警,根據(jù)規(guī)則預(yù)定義的動(dòng)作執(zhí)行屏蔽、壓縮、升級(jí)等操作。
3.一種應(yīng)用如權(quán)利要求1或2所述的運(yùn)維告警處理方法的裝置,其特征在于包括告 警采集單元、告警處理單元和告警通知單元。
4.根據(jù)權(quán)利要求3所述的裝置,其特征在于采集單元包括采集機(jī)器人和采集探針兩 部分;采集探針分為SNMP探針,JDBC探針,Telnet/SSH探針,JMX探針等;采集機(jī)器人負(fù)責(zé) 調(diào)度采集探針采集不同設(shè)備的運(yùn)行指標(biāo)。
5.根據(jù)權(quán)利要求3所述的裝置,其特征在于采集單元和告警處理單元之間通過數(shù)據(jù) 總線和消息總線連接;數(shù)據(jù)總線用于上報(bào)數(shù)據(jù),消息總線用于下發(fā)采集命令;一個(gè)告警處 理單元可以接收多個(gè)采集單元的數(shù)據(jù)。
6.根據(jù)權(quán)利要求3所述的裝置,其特征在于當(dāng)與主告警處理單元出現(xiàn)傳輸故障時(shí),采 集單元可以自動(dòng)連接一個(gè)或多個(gè)備份告警處理單元;當(dāng)所有告警處理單元均無法傳輸成功 時(shí),采集單元可以保存最新一段時(shí)間的數(shù)據(jù),直到剩余磁盤空間小于指定大??;當(dāng)剩余空間 不足時(shí),告警采集單元會(huì)丟棄最“舊”的數(shù)據(jù);傳輸恢復(fù)后,保存的數(shù)據(jù)會(huì)自動(dòng)上傳。
7.根據(jù)權(quán)利要求3所述的裝置,其特征在于當(dāng)告警處理單元發(fā)現(xiàn)需要重新采集時(shí),可 以通過消息總線通知采集單元重新采集。
8.根據(jù)權(quán)利要求3所述的裝置,其特征在于異常判斷是通過條件表達(dá)式來計(jì)算的,條 件表達(dá)式由運(yùn)算符和符號(hào)組成,可通過宏定義引用指標(biāo)值、屬性值、環(huán)境值,其運(yùn)算結(jié)果是 邏輯值真或假;異常判斷單元對(duì)接收到的每個(gè)值進(jìn)行宏替換后進(jìn)行計(jì)算,如果計(jì)算后的值 為真,則表示出現(xiàn)異常。
9.根據(jù)權(quán)利要求3所述的裝置,其特征在于信息擴(kuò)充通過條件表達(dá)式標(biāo)識(shí)告警集合, 通過值表達(dá)式定義擴(kuò)充的字段值,值表達(dá)式由運(yùn)算符和符號(hào)組成,可通過宏定義引用指標(biāo) 值、屬性值、環(huán)境值,其運(yùn)算結(jié)果是數(shù)值、字符串或邏輯值。
10.根據(jù)權(quán)利要求3所述的裝置,其特征在于告警通知單元和告警處理單元通過TCP 協(xié)議傳輸告警;其中,所述告警處理單元把告警信息推送到多個(gè)告警通知單元;通知單元 通過串口電平高低控制報(bào)警燈的開關(guān)閃爍和顏色,或者通過串口控制短信貓發(fā)送告警。
全文摘要
本發(fā)明公開了一種運(yùn)維告警處理方法,該方法包括以下步驟(1)告警采集,機(jī)器人調(diào)度各種探針收集IT資源運(yùn)行健康狀況;(2)告警處理,通過異常判斷,信息擴(kuò)充,相關(guān)性分析,保存等過程產(chǎn)生告警,擴(kuò)充字段,屏蔽無效告警等。(3)告警通知通過短信、報(bào)警燈、郵件、消息等方式將告警通知相關(guān)運(yùn)維人員。本發(fā)明方法及其相關(guān)裝置提高了運(yùn)維告警的準(zhǔn)確性、有效性和及時(shí)性。
文檔編號(hào)H04L12/24GK101989931SQ20101058971
公開日2011年3月23日 申請(qǐng)日期2010年12月15日 優(yōu)先權(quán)日2010年12月15日
發(fā)明者廖昕, 楊濤, 陳松 申請(qǐng)人:成都勤智數(shù)碼科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1