專利名稱:一種根告警數(shù)據(jù)分析的方法及其系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電信網(wǎng)管故障管理領(lǐng)域,更具體地涉及電信網(wǎng)管尤其是國(guó)家級(jí)省級(jí)大 型綜合網(wǎng)管中基于端到端模型的根告警數(shù)據(jù)分析的方法及其系統(tǒng)。
背景技術(shù):
綜合網(wǎng)管系統(tǒng)建立在各專業(yè)電信網(wǎng)管系統(tǒng)的基礎(chǔ)之上,通過標(biāo)準(zhǔn)接口,實(shí)現(xiàn)跨專 業(yè)網(wǎng)的數(shù)據(jù)集中、管理和分析。其中故障管理需要在界面上進(jìn)行實(shí)時(shí)呈現(xiàn)反映網(wǎng)元設(shè)備故 障狀態(tài)的活動(dòng)告警,以便維護(hù)人員根據(jù)這些告警進(jìn)行相應(yīng)的日常維護(hù),確保電信網(wǎng)絡(luò)的穩(wěn) 定運(yùn)行。由于各個(gè)專業(yè)網(wǎng)管上的活動(dòng)告警都有一定的數(shù)據(jù)規(guī)模(K數(shù)量級(jí)),集中匯聚到綜 合網(wǎng)管后其數(shù)量就相當(dāng)龐大(10K數(shù)量級(jí)),如此多的活動(dòng)告警既無法在界面上有效顯示, 操作維護(hù)人員也無法進(jìn)行處理。根據(jù)實(shí)際的運(yùn)營(yíng)經(jīng)驗(yàn),發(fā)生故障的網(wǎng)元設(shè)備是少數(shù),當(dāng)某個(gè) 網(wǎng)元設(shè)備(這里稱之為主設(shè)備)發(fā)生故障并上報(bào)告警的時(shí)候,與該網(wǎng)元有連接關(guān)系的其它 網(wǎng)元設(shè)備(包括跨專業(yè)的網(wǎng)元)也會(huì)產(chǎn)生一系列的告警,這些告警其實(shí)就是冗余告警,應(yīng)該 被主設(shè)備上的告警壓縮抑制。這樣可以有效減少綜合網(wǎng)管中的活動(dòng)告警數(shù)量,以便于操作 維護(hù)人員準(zhǔn)確定位故障網(wǎng)元,派發(fā)故障單給相關(guān)人員進(jìn)行網(wǎng)絡(luò)維護(hù)。在傳統(tǒng)的網(wǎng)管系統(tǒng)中,告警壓縮主要根據(jù)硬件專家提供業(yè)務(wù)知識(shí)而定制的處理邏 輯或關(guān)聯(lián)規(guī)則,系統(tǒng)根據(jù)這些預(yù)定義的關(guān)聯(lián)規(guī)則來確認(rèn)告警之間的相關(guān)性,過濾冗余告警。 然而,綜合網(wǎng)管管理各個(gè)專業(yè)的網(wǎng)元設(shè)備,網(wǎng)元設(shè)備間的連接最終取決于現(xiàn)場(chǎng)工程實(shí)施,單 純依靠專家提供關(guān)聯(lián)規(guī)則不太現(xiàn)實(shí),工作量大、效率低,而且規(guī)則數(shù)也比較有限。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是提供一種根告警數(shù)據(jù)分析的方法及其系統(tǒng),以利用已 有的海量歷史告警數(shù)據(jù)和端到端模型中網(wǎng)元連接關(guān)系,通過數(shù)據(jù)挖掘來實(shí)現(xiàn)自動(dòng)判定根告 警與冗余告警的關(guān)聯(lián)規(guī)則,進(jìn)而可以用根告警來壓縮抑制相應(yīng)的冗余告警。為了解決上述問題,本發(fā)明提供了一種根告警數(shù)據(jù)分析的方法,應(yīng)用于包括具有 指示網(wǎng)元連接關(guān)系的端到端模型的系統(tǒng)中,包括按網(wǎng)元類型和告警原因?qū)v史告警數(shù)據(jù)全集分成多個(gè)告警子集,同一告警子集中 所有告警的網(wǎng)元類型和告警原因相同;將劃分得到的告警子集兩兩任意組合,對(duì)每一種組合中的兩個(gè)告警子集,如計(jì)算 得到的該兩個(gè)告警子集在歷史告警全集中的支持度大于設(shè)定的第一閾值,再對(duì)該兩個(gè)告警 子集中的每一個(gè)告警子集,分別判斷在該告警子集中告警存在的條件下,另一個(gè)告警子集 中的告警同時(shí)存在的條件概率是否大于設(shè)定的第二閾值,如是,則判定作為條件的該告警 子集中的告警是相對(duì)于另一個(gè)告警子集中告警的根告警。進(jìn)一步地,上述方法還可具有以下特點(diǎn)用所述判定為根告警的告警子集中的告 警屏蔽相對(duì)于該根告警為冗余告警的所述另一個(gè)告警子集中的告警。進(jìn)一步地,上述方法還可具有以下特點(diǎn)所述支持度為所述兩個(gè)告警子集并集的告警總數(shù)與所述歷史告警數(shù)據(jù)全集的告警總數(shù)的比例。進(jìn)一步地,上述方法還可具有以下特點(diǎn)所述條件概率為所述兩個(gè)告警子集中的 其中一個(gè)告警子集的告警存在的條件下,另一個(gè)告警子集中的告警同時(shí)存在的告警數(shù)與作 為條件的所述告警子集中的告警數(shù)的比例。進(jìn)一步地,上述方法還可具有以下特點(diǎn)所述在該告警子集中告警存在的條件下, 另一個(gè)告警子集中的告警同時(shí)存在的判斷具體為,若所述兩個(gè)告警子集中的告警發(fā)生的時(shí) 間差的絕對(duì)值小于第一時(shí)間因子,并且當(dāng)故障消除時(shí)所述兩個(gè)告警子集中的告警消除的時(shí) 間差的絕對(duì)值小于第二時(shí)間因子,則判斷所述兩個(gè)告警子集中的告警同時(shí)存在。本發(fā)明還提供一種根告警數(shù)據(jù)分析的系統(tǒng),包括具有指示網(wǎng)元連接關(guān)系的端到端 模型,其中,包括拆分單元,其用于按網(wǎng)元類型和告警原因?qū)v史告警數(shù)據(jù)全集分成多個(gè)告警子 集,同一告警子集中所有告警的網(wǎng)元類型和告警原因相同;支持度計(jì)算單元,將劃分得到的告警子集兩兩任意組合,計(jì)算每一種組合中的兩 個(gè)告警子集在歷史告警全集中的支持度;置信度計(jì)算單元,若所述支持度計(jì)算單元所計(jì)算的支持度大于第一閾值,則所述 置信度計(jì)算單元對(duì)該兩個(gè)告警子集中的每一個(gè)告警子集,分別計(jì)算在該告警子集中告警存 在的條件下,另一個(gè)告警子集中告警同時(shí)存在的條件概率;判定單元,若所述條件概率大于第二閾值,則所述判定單元判定在所述置信度計(jì) 算單元計(jì)算條件概率過程中作為條件的該告警子集中的告警是相對(duì)于另一個(gè)告警子集中
告警的根告警。進(jìn)一步地,上述系統(tǒng)還可具有以下特點(diǎn)屏蔽單元,用所述判定為根告警的告警子 集中的告警屏蔽相對(duì)于該根告警為冗余告警的所述另一個(gè)告警子集中的告警。進(jìn)一步地,上述系統(tǒng)還可具有以下特點(diǎn)所述置信度計(jì)算單元中包括判斷模塊、記 錄模塊和計(jì)算模塊,若所述兩個(gè)告警子集中的告警發(fā)生的時(shí)間差的絕對(duì)值小于第一時(shí)間因子,并且當(dāng) 故障消除時(shí)所述兩個(gè)告警子集中的告警消除的時(shí)間差的絕對(duì)值小于第二時(shí)間因子,則所述 判斷模塊判斷所述兩個(gè)告警子集中的告警同時(shí)存在;若所述兩個(gè)告警子集中的告警同時(shí)存在,則所述記錄模塊記錄所述兩個(gè)告警子集 中的告警同時(shí)存在的告警數(shù); 所述計(jì)算模塊計(jì)算所述兩個(gè)告警子集中的告警同時(shí)存在的告警數(shù)與所述兩個(gè)告 警子集中的每一告警子集的告警數(shù)的比例。綜上所述,本發(fā)明提供的根告警數(shù)據(jù)分析的方法及其系統(tǒng)可以對(duì)存儲(chǔ)在數(shù)據(jù)庫(kù)中 的大量歷史告警進(jìn)行告警數(shù)據(jù)挖掘分析,可以實(shí)現(xiàn)自動(dòng)發(fā)現(xiàn)根告警與冗余告警的關(guān)聯(lián)規(guī) 則,進(jìn)而可以用根告警來屏蔽或壓縮抑制相對(duì)冗余告警,可以有效減少綜合網(wǎng)管中的活動(dòng) 的告警數(shù)量,以便于操作維護(hù)人員準(zhǔn)確定位故障網(wǎng)元,從而將派發(fā)故障單給相關(guān)人員進(jìn)行 網(wǎng)絡(luò)維護(hù)。
圖1為典型的端到端模型連接的示意圖2為根據(jù)本發(fā)明實(shí)施例的根告警數(shù)據(jù)分析的系統(tǒng)的示意圖;圖3為根據(jù)本發(fā)明實(shí)施例的根告警數(shù)據(jù)分析的方法的流程圖;圖4為根據(jù)本發(fā)明的根告警數(shù)據(jù)分析的方法的應(yīng)用示例的流程圖。
具體實(shí)施例方式端到端是源和目的之間的邏輯通信連接鏈路,這條邏輯鏈路可能經(jīng)過了很復(fù)雜的 物理路線,如圖1所示,就是一個(gè)典型的端到端模型連接。綜合網(wǎng)管的端到端模型管理主要 管理跨多個(gè)網(wǎng)元的端到端邏輯連接和該邏輯連接所基于相鄰網(wǎng)元之間的物理連接。本發(fā)明提供的根告警數(shù)據(jù)分析的方法主要是利用端到端模型中網(wǎng)元發(fā)出的已有 的海量歷史告警數(shù)據(jù)和端到端模型中網(wǎng)元的連接關(guān)系,通過數(shù)據(jù)挖掘來實(shí)現(xiàn)自動(dòng)判定根告 警與冗余告警的關(guān)聯(lián)規(guī)則。下面結(jié)合附圖及實(shí)施例對(duì)本發(fā)明的技術(shù)方案進(jìn)行更詳細(xì)的說明。圖2是本發(fā)明實(shí)施例的根告警數(shù)據(jù)分析的系統(tǒng)的示意圖,本發(fā)明實(shí)施例的根告警 數(shù)據(jù)分析的系統(tǒng)包括端到端模型,可以從該端到端模型獲取網(wǎng)元連接關(guān)系,如2圖所示,該 系統(tǒng)包括拆分單元,其用于按網(wǎng)元類型和告警原因?qū)v史告警數(shù)據(jù)全集分成多個(gè)告警子 集,同一告警子集中所有告警的網(wǎng)元類型和告警原因相同。支持度計(jì)算單元,將劃分得到的告警子集兩兩任意組合,計(jì)算每一種組合中的兩 個(gè)告警子集在歷史告警全集中的支持度。置信度計(jì)算單元,若所述支持度計(jì)算單元所計(jì)算的支持度大于第一閾值,則所述 置信度計(jì)算單元對(duì)該兩個(gè)告警子集中的每一個(gè)告警子集,分別計(jì)算在該告警子集中告警存 在的條件下,另一個(gè)告警子集中告警同時(shí)存在的條件概率;其中置信度計(jì)算單元中包括判斷模塊、記錄模塊和計(jì)算模塊,若所述支持度大于第一指定值,則所述判斷模塊判斷所述兩個(gè)告警子集中的告警 是否同時(shí)存在,若所述兩個(gè)告警子集中的告警發(fā)生的時(shí)間差的絕對(duì)值小于第一時(shí)間因子, 并且當(dāng)故障消除時(shí)所述兩個(gè)告警子集中的告警消除的時(shí)間差的絕對(duì)值小于第二時(shí)間因子, 則所述判斷模塊判斷所述兩個(gè)告警子集中的告警同時(shí)存在,若所述兩個(gè)告警子集中的告警同時(shí)存在,則所記錄模塊記錄所述兩個(gè)告警子集中 同時(shí)存在的告警,所述計(jì)算模塊計(jì)算所記錄同時(shí)存在的告警數(shù)與所述兩個(gè)告警子集中的一個(gè)告警 子集的告警數(shù)的比例。判定單元,若所述條件概率大于第二閾值,則所述判定單元判定在所述置信度計(jì) 算單元計(jì)算條件概率過程中作為條件的該告警子集中的告警是相對(duì)于另一個(gè)告警子集中
告警的根告警。該系統(tǒng)還包括屏蔽單元,用所述判定為根告警的告警子集中的告警屏蔽相對(duì)于該 根告警為冗余告警的所述另一個(gè)告警子集中的告警。圖3是根據(jù)本發(fā)明實(shí)施例的根告警數(shù)據(jù)分析的方法的流程圖。如圖3所示,本發(fā) 明實(shí)施例的根告警數(shù)據(jù)分析的方法包括步驟S101,按網(wǎng)元類型和告警原因?qū)⒑A康臍v史告警數(shù)據(jù)全集分成多個(gè)告警子
6集,同一告警子集中所有告警的網(wǎng)元類型和告警原因相同;這里的歷史告警數(shù)據(jù)具有上千萬條,每條歷史告警數(shù)據(jù)中包括多個(gè)不同網(wǎng)元類型 和不同告警原因的告警,每個(gè)告警數(shù)據(jù)中包括多個(gè)重要屬性網(wǎng)元位置、嚴(yán)重級(jí)別、網(wǎng)元類 型、告警類型、產(chǎn)生時(shí)間和告警原因等。可以將總的歷史告警數(shù)據(jù)當(dāng)成一個(gè)全集,假設(shè)系統(tǒng)中存在的網(wǎng)元類型集合 SN= In1, n2,n3,. . .,IIi, · . . },告警原因集合為 C = Ic1, C2, c3,· . .,Cj, · . . },那 么按網(wǎng)元類型N和告警原因C的笛卡爾積可以將歷史告警全集A分為多個(gè)告警子集
權(quán)利要求
1.一種根告警數(shù)據(jù)分析的方法,應(yīng)用于包括具有指示網(wǎng)元連接關(guān)系的端到端模型的系 統(tǒng)中,包括按網(wǎng)元類型和告警原因?qū)v史告警數(shù)據(jù)全集分成多個(gè)告警子集,同一告警子集中所有 告警的網(wǎng)元類型和告警原因相同;將劃分得到的告警子集兩兩任意組合,對(duì)每一種組合中的兩個(gè)告警子集,如計(jì)算得到 的該兩個(gè)告警子集在歷史告警全集中的支持度大于設(shè)定的第一閾值,再對(duì)該兩個(gè)告警子集 中的每一個(gè)告警子集,分別判斷在該告警子集中告警存在的條件下,另一個(gè)告警子集中的 告警同時(shí)存在的條件概率是否大于設(shè)定的第二閾值,如是,則判定作為條件的該告警子集 中的告警是相對(duì)于另一個(gè)告警子集中告警的根告警。
2.如權(quán)利要求1所述的方法,其特征在于,用所述判定為根告警的告警子集中的告警屏蔽相對(duì)于該根告警為冗余告警的所述另 一個(gè)告警子集中的告警。
3.如權(quán)利要求1所述的方法,其特征在于,所述支持度為所述兩個(gè)告警子集并集的告警總數(shù)與所述歷史告警數(shù)據(jù)全集的告警總 數(shù)的比例。
4.如權(quán)利要求1所述的方法,其特征在于,所述條件概率為所述兩個(gè)告警子集中的其 中一個(gè)告警子集的告警存在的條件下,另一個(gè)告警子集中的告警同時(shí)存在的告警數(shù)與作為 條件的所述告警子集中的告警數(shù)的比例。
5.如權(quán)利要求1至4任一項(xiàng)所述的方法,其特征在于,所述在該告警子集中告警存在的 條件下,另一個(gè)告警子集中的告警同時(shí)存在的判斷具體為,若所述兩個(gè)告警子集中的告警發(fā)生的時(shí)間差的絕對(duì)值小于第一時(shí)間因子,并且當(dāng)故障 消除時(shí)所述兩個(gè)告警子集中的告警消除的時(shí)間差的絕對(duì)值小于第二時(shí)間因子,則判斷所述 兩個(gè)告警子集中的告警同時(shí)存在。
6.一種根告警數(shù)據(jù)分析的系統(tǒng),包括具有指示網(wǎng)元連接關(guān)系的端到端模型,其中,包括拆分單元,其用于按網(wǎng)元類型和告警原因?qū)v史告警數(shù)據(jù)全集分成多個(gè)告警子集,同 一告警子集中所有告警的網(wǎng)元類型和告警原因相同;支持度計(jì)算單元,將劃分得到的告警子集兩兩任意組合,計(jì)算每一種組合中的兩個(gè)告 警子集在歷史告警全集中的支持度;置信度計(jì)算單元,若所述支持度計(jì)算單元所計(jì)算的支持度大于第一閾值,則所述置信 度計(jì)算單元對(duì)該兩個(gè)告警子集中的每一個(gè)告警子集,分別計(jì)算在該告警子集中告警存在的 條件下,另一個(gè)告警子集中告警同時(shí)存在的條件概率;判定單元,若所述條件概率大于第二閾值,則所述判定單元判定在所述置信度計(jì)算單 元計(jì)算條件概率過程中作為條件的該告警子集中的告警是相對(duì)于另一個(gè)告警子集中告警 的根告警。
7.如權(quán)利要求6所述的系統(tǒng),其特征在于,還包括,屏蔽單元,用所述判定為根告警的告警子集中的告警屏蔽相對(duì)于該根告警為冗余告警 的所述另一個(gè)告警子集中的告警。
8.如權(quán)利要求6或7所述的系統(tǒng),其特征在于,所述置信度計(jì)算單元中包括判斷模塊、記錄模塊和計(jì)算模塊,若所述兩個(gè)告警子集中的告警發(fā)生的時(shí)間差的絕對(duì)值小于第一時(shí)間因子,并且當(dāng)故障 消除時(shí)所述兩個(gè)告警子集中的告警消除的時(shí)間差的絕對(duì)值小于第二時(shí)間因子,則所述判斷 模塊判斷所述兩個(gè)告警子集中的告警同時(shí)存在;若所述兩個(gè)告警子集中的告警同時(shí)存在,則所述記錄模塊記錄所述兩個(gè)告警子集中的 告警同時(shí)存在的告警數(shù);所述計(jì)算模塊計(jì)算所述兩個(gè)告警子集中的告警同時(shí)存在的告警數(shù)與所述兩個(gè)告警子 集中的每一告警子集的告警數(shù)的比例。
全文摘要
本發(fā)明提供一種根告警數(shù)據(jù)分析的方法及其系統(tǒng),該方法應(yīng)用于包括具有指示網(wǎng)元連接關(guān)系的端到端模型的系統(tǒng)中,包括按網(wǎng)元類型和告警原因?qū)v史告警數(shù)據(jù)全集分成多個(gè)告警子集;將劃分得到的告警子集兩兩任意組合,如計(jì)算得到每一種組合中的該兩個(gè)告警子集在歷史告警全集中的支持度大于設(shè)定的第一閾值,再對(duì)該兩個(gè)告警子集中的每一個(gè)告警子集,分別判斷在該告警子集中告警存在的條件下,另一個(gè)告警子集中的告警同時(shí)存在的條件概率是否大于設(shè)定的第二閾值,如是,則判定作為條件的該告警子集中的告警是相對(duì)于另一個(gè)告警子集中告警的根告警。通過本發(fā)明可以實(shí)現(xiàn)自動(dòng)發(fā)現(xiàn)根告警與冗余告警的關(guān)聯(lián)規(guī)則,可以有效減少綜合網(wǎng)管中的活動(dòng)的告警數(shù)量。
文檔編號(hào)H04L12/24GK101997709SQ20091016584
公開日2011年3月30日 申請(qǐng)日期2009年8月10日 優(yōu)先權(quán)日2009年8月10日
發(fā)明者張清, 李進(jìn) 申請(qǐng)人:中興通訊股份有限公司