專利名稱:一種基于相關(guān)性分析的傳輸網(wǎng)通用快速故障定位方法
技術(shù)領(lǐng)域:
本發(fā)明屬于傳輸網(wǎng)技術(shù)領(lǐng)域,具體涉及一種利用時(shí)間相關(guān)性、空間相關(guān)性和業(yè)務(wù)相 關(guān)性在傳輸網(wǎng)范疇內(nèi)定位故障的通用分析方法。
背景技術(shù):
隨著傳輸網(wǎng)絡(luò)傳輸速率、容量越來越大,即使是一個(gè)細(xì)微故障所引發(fā)的損失也是災(zāi) 難性的,因此為將損失降低到最低,需要快速定位故障、判斷處理優(yōu)先級(jí),最短時(shí)間內(nèi) 處理最緊急故障,縮短故障處理時(shí)間。
目前的設(shè)備智能化程度比以往有所提高,設(shè)備本身例如單盤可以按照ITU-T定義的 層次屏蔽同一實(shí)體產(chǎn)生的關(guān)聯(lián)的不同層次的告警,但目前設(shè)備提供的告警抑制功能局限 于單個(gè)網(wǎng)元甚至單個(gè)盤內(nèi),沒有從全網(wǎng)關(guān)系處理告警數(shù)據(jù),因此壓縮率比較低,當(dāng)故障 發(fā)生時(shí)仍然有很多告警、信息產(chǎn)生,使維護(hù)人員難以處理。
隨著時(shí)間推移,在網(wǎng)運(yùn)行的設(shè)備類型、版本、支持的業(yè)務(wù)越來越多,導(dǎo)致告警種類 繁多,差異性非常大,對(duì)網(wǎng)絡(luò)運(yùn)維的要求也越來越高,這種情況對(duì)于釆用知識(shí)庫作為分 析基礎(chǔ)的方法也帶來沖擊,即導(dǎo)致知識(shí)庫異常龐大,甚至知識(shí)庫內(nèi)規(guī)則互相矛盾不可維 護(hù)。
另外,申請(qǐng)?zhí)枮?00710179292,x的中國(guó)專利申請(qǐng)《基于倒換因素相關(guān)性分析的傳輸 網(wǎng)通用倒換分析方法》中的分析只限于分析倒換狀態(tài)和引發(fā)倒換的故障原因。其分析原 理是維護(hù)操作發(fā)生點(diǎn)(如倒換)的時(shí)間附近必然存在引發(fā)該操作的故障,即根據(jù)故障引 發(fā)的維護(hù)操作點(diǎn),分析衍生因素得出倒換原因和倒換狀態(tài)。但是,全網(wǎng)故障分析事先不 知道維護(hù)操作點(diǎn),也不能確定當(dāng)前網(wǎng)絡(luò)上有多少故障,甚至傳輸網(wǎng)絡(luò)上可能存在并不引 發(fā)維護(hù)操作部分故障(例如沒有配置保護(hù)的業(yè)務(wù)),這種情況下200710179292.x號(hào)中國(guó)專 利申請(qǐng)無法分析。此外,倒換只針對(duì)有保護(hù)的業(yè)務(wù)的分析,而傳輸網(wǎng)在運(yùn)行過程中存在 無業(yè)務(wù)的設(shè)備告警和沒有保護(hù)的業(yè)務(wù)告警,所以也需要分析無業(yè)務(wù)或無保護(hù)的業(yè)務(wù)的設(shè) 備告警。另外倒換沒有考慮到方向一致性問題,會(huì)導(dǎo)致分析結(jié)果精度不夠。綜上所述, 申請(qǐng)?zhí)枮?00710179292.x的中國(guó)專利申請(qǐng)?jiān)诓恢来_切維護(hù)點(diǎn)的情況下無法分析出若干 個(gè)故障原因、處理優(yōu)先級(jí)和故障處理方式,也不能對(duì)所有類型的故障進(jìn)行分析,故無法
進(jìn)行全網(wǎng)故障分析。
綜上述分析可知,目前故障定位的難點(diǎn)在于
1) 設(shè)備提供的告警分析功能局限性高,告警壓縮率不高;
2) 單純基于知識(shí)庫的告警分析信息龐大,規(guī)則甚至存在相互矛盾,不便于長(zhǎng)期維護(hù);
3) 隨著設(shè)備、業(yè)務(wù)類型、版本越來越多,現(xiàn)存的方法通用性不強(qiáng);
4) 目前專利《基于倒換因素相關(guān)性分析的傳輸網(wǎng)通用倒換分析方法》只能用于分析 和倒換相關(guān)的情況,不適用全網(wǎng)故障分析。
5) 目前的故障定位方法結(jié)果不提供自動(dòng)分析過程的信息,不便于人工驗(yàn)證。
6) 目前的故障定位方法沒有提供處理優(yōu)先級(jí),不便于集中人力第一時(shí)間解決最迫切 的問題。
發(fā)明內(nèi)容
本發(fā)明目的在于提供一種基于相關(guān)性分析的傳輸網(wǎng)通用快速故障定位方法。該方法, 可以減少知識(shí)庫龐大不便于維護(hù),降低規(guī)則相互矛盾的概率,提高告警壓縮率、可以在 最大限度適應(yīng)設(shè)備類型、業(yè)務(wù)類型、版本的多樣性,同時(shí)在分析結(jié)果中提供處理優(yōu)先級(jí) 以便最短時(shí)間內(nèi)解決最迫切的問題。
本方法適用于傳輸網(wǎng)故障定位,協(xié)助運(yùn)維人員快速定位需要優(yōu)先處理的故障,減少 處理的信息量。本方法擴(kuò)充《基于倒換因素相關(guān)性分析的傳輸網(wǎng)通用倒換分析方法》的 相關(guān)性原理。其基本原理是利用故障因素(設(shè)備發(fā)生故障時(shí)引發(fā)變更的信息總稱,例如 告警、狀態(tài)、性能等等)的時(shí)間相關(guān)性、空間相關(guān)性和業(yè)務(wù)相關(guān)性,分析出每個(gè)故障因
素處理優(yōu)先等級(jí),并向運(yùn)維人員給出主故障因素(Focal Alarm即處理優(yōu)先級(jí)最高的故障 因素)和從故障因素(處理優(yōu)先級(jí)小于主故障因素的)。再根據(jù)主故障因素定位出故障點(diǎn), 故障原因,最后按照處理知識(shí)庫給出處理的緊急度和方案。故障處理優(yōu)先級(jí)分為可緩處 理級(jí)、 一般處理級(jí)、緊急處理級(jí)和特緊急處理級(jí)。本方法為加快分析速度,集中人力解 決最緊迫的問題,當(dāng)處理優(yōu)先級(jí)高的故障沒有處理完時(shí),低優(yōu)先級(jí)的故障因素不予分析, 因此本方法的另一個(gè)特征是需要重復(fù)調(diào)用直到?jīng)]有需要處理的故障優(yōu)先級(jí),而不是一次 性全部分析完。
一般而言從故障因素是衍生因素(由根因素引發(fā)的業(yè)務(wù)所經(jīng)資源產(chǎn)生的和本次故障 相關(guān)的因素,例如遠(yuǎn)端缺陷告等),主故障因素是根因素(根因素指由故障引發(fā)的最直接 的故障因素,例如光纖中斷告警,激光器故障等),但空間相關(guān)狀態(tài)優(yōu)先原則下從故障因 素不一定是衍生因素,而是處理優(yōu)先級(jí)低于主故障因素的故障因素。因此使用時(shí)需要多 次重復(fù)用本方法獲取主故障因素, 一直到?jīng)]有關(guān)心的主故障因素需要處理為止。 定義如下縮寫 E:事件結(jié)束時(shí)間
B:事件發(fā)生時(shí)間
Al:前向時(shí)間相關(guān)性闊值(故障因素發(fā)生變更到故障產(chǎn)生開始之間的時(shí)間) A2:后向時(shí)間相關(guān)性閾值(故障產(chǎn)生開始到故障因素發(fā)生變更之間的時(shí)間) FG:故障組(由一個(gè)或多個(gè)存在時(shí)間相關(guān)性的故障引發(fā)的全部故障因素集合)。故
障組為分層樹狀結(jié)構(gòu),頂層由多個(gè)主故障因素組成,每個(gè)主故障因素由一個(gè)獨(dú)立的故障
引發(fā),其下的層次存放被主故障因素抑制的從故障因素。
FGB:故障組的開始時(shí)間。(即發(fā)生故障后設(shè)備產(chǎn)生反映的最早時(shí)間)
FGE:故障組的結(jié)束時(shí)間。(即發(fā)生故障后設(shè)備不再產(chǎn)生其他動(dòng)作的最早時(shí)間,也稱
為故障收斂時(shí)間)
每條故障因素包括發(fā)生時(shí)間(B)、結(jié)束時(shí)間(E)、在對(duì)象樹上的位置信息,因素的
名稱和引發(fā)因素的可能原因,故障因素監(jiān)控點(diǎn)方向(引發(fā)告警的故障在信號(hào)流中的方向),
故障因素分類(包括環(huán)境類和其他),其中當(dāng)故障因素沒有消失時(shí)E為空。
本發(fā)明基于的信息模型符合ITU-TG.803, TMF814, 608, 513 Version 2.1規(guī)范。
本發(fā)明提供的基于相關(guān)性分析的傳輸網(wǎng)故障定位方法,具體包括以下步驟
步驟l、獲取要分析范圍內(nèi)發(fā)生的、且處理標(biāo)簽為未處理的所有故障因素,形成待分
析的因素集;
步驟2、把步驟1產(chǎn)生的結(jié)果按照時(shí)間相關(guān)性將故障因素劃分為多個(gè)故障組,每個(gè)故 障組給同樣的處理優(yōu)先級(jí);
步驟3、按照空間相關(guān)性抑制步驟2產(chǎn)生的每個(gè)故障組中的從故障因素,保留主故障
因素;
步驟4、把步驟3產(chǎn)生的每個(gè)故障組按照業(yè)務(wù)相關(guān)性抑制從故障因素,保留主故障因
素;
步驟5、將步驟4產(chǎn)生的多個(gè)故障組中的空故障組刪除;
步驟6、把步驟5產(chǎn)生的結(jié)果根據(jù)知識(shí)庫獲取故障原因和故障處理方式,將當(dāng)前處理 過的主故障因素的處理標(biāo)簽設(shè)置為已處理。 本發(fā)明的有益效果表現(xiàn)在以下幾個(gè)方面 1)減少知識(shí)庫的規(guī)模,減少知識(shí)庫本身?xiàng)l例沖突的問題。
2) 提高告警壓縮率、告警原因定位準(zhǔn)確度。
3) 適應(yīng)設(shè)備類型、版本和業(yè)務(wù)類型變化。
4) 可以適應(yīng)設(shè)備運(yùn)行異常時(shí)某種程度誤告的告警。
5) 擴(kuò)充《基于倒換因素相關(guān)性的傳輸網(wǎng)通用倒換分析方法》,使其在不知道確切維 護(hù)點(diǎn)的情況下能夠分析出若干個(gè)故障原因、處理優(yōu)先級(jí)和故障處理方式,使其適應(yīng)于全 網(wǎng)的故障分析。
6) 本方法采用樹狀故障組結(jié)構(gòu)能清晰反映自動(dòng)分析過程和原因、以及故障分析結(jié)果, 以便人工判斷、修正自動(dòng)分析結(jié)果。
7) 本發(fā)明提供故障處理優(yōu)先級(jí),便于最短時(shí)間內(nèi)解決最迫切的問題。
圖1:本發(fā)明所采用的故障組結(jié)構(gòu)圖2:本發(fā)明的故障定位方法的總體步驟流程圖;
圖3:基于時(shí)間相關(guān)性劃分故障組的流程圖4:基于空間相關(guān)性抑制從故障因素的流程圖;
圖5:基于業(yè)務(wù)相關(guān)性抑制從故障因素的流程圖;
圖6:基于業(yè)務(wù)相關(guān)性盤保護(hù)相關(guān)抑制圖7:基于業(yè)務(wù)相關(guān)性交叉相關(guān)抑制圖8:故障維護(hù)提示知識(shí)庫圖。
具體實(shí)施方式
為了更清晰的描述本發(fā)明,下面結(jié)合附圖給出實(shí)施例以對(duì)本發(fā)明做進(jìn)一步的說明。 發(fā)明的描述不涉及傳輸設(shè)備的具體類型,而只針對(duì)故障因素的通用規(guī)則給出一種通 用、快速的故障定位分析方法。
本發(fā)明中通用相關(guān)性主要從三方面分析的,第一是時(shí)間相關(guān)性,原理是一個(gè)故障引 發(fā)的故障因素和該故障在時(shí)間上存在著關(guān)聯(lián),例如當(dāng)光纖中斷故障發(fā)生時(shí),引發(fā)傳輸網(wǎng) 上一系列實(shí)體告警,而這些告警發(fā)生在相鄰端口 (直接通過光纖連接的兩個(gè)物理端口稱
為相鄰端口)時(shí)間差一般不超過3秒,同一個(gè)節(jié)點(diǎn)內(nèi)不相鄰端口發(fā)生的告警則時(shí)間差不 超過30S(同一個(gè)節(jié)點(diǎn)內(nèi)通過交叉連接的實(shí)體傳遞告警需要做光電信號(hào)處理時(shí)差比相鄰節(jié) 點(diǎn)大,不同廠家設(shè)備時(shí)間差不一樣,可以通過知識(shí)庫設(shè)置)。第二是空間相關(guān)性,主要是 實(shí)體在對(duì)象樹上的包含關(guān)系存在著處理優(yōu)先級(jí)的關(guān)系。例如當(dāng)單盤通信中斷時(shí),單盤上
其他部件的告警處理優(yōu)先級(jí)低于通信中斷,可以做為從故障因素被抑制。同樣需要優(yōu)先 處理物理層的告警,然后再是更高層次的告警。第三是業(yè)務(wù)相關(guān)性,指只有存在業(yè)務(wù)或 物理連接的實(shí)體發(fā)生的告警才可能是由一個(gè)故障引發(fā)的告警,其中優(yōu)先級(jí)需要根據(jù)業(yè)務(wù) 相關(guān)性規(guī)則確定。這三種相關(guān)性與具體設(shè)備類型無關(guān),但適用于全部類型的設(shè)備,可以 通用定位各種故障因素,抑制從故障因素。同時(shí)在設(shè)備誤告不符合上述通用相關(guān)性原則 時(shí)可以被抑制,因此可以防止設(shè)備某些情況的誤告(錯(cuò)誤的上報(bào)了故障因素)。
本發(fā)明將故障因素細(xì)化為告警,每條告警包括發(fā)生時(shí)間(B)、結(jié)束時(shí)間(E)、在對(duì)
象樹上的位置信息,因素的名稱和引發(fā)因素的可能原因,告警監(jiān)控點(diǎn)方向(引發(fā)告警的
故障在信號(hào)流中的方向),告警分類,其中當(dāng)告警沒有消失時(shí)E為空。
本發(fā)明考慮到設(shè)備之間存在時(shí)間不同步問題(一般校時(shí)后偏差不超過秒級(jí)),并根據(jù)
試驗(yàn)數(shù)據(jù)確定前向時(shí)間相關(guān)性閾值A(chǔ)1 (10S)和后向時(shí)間相關(guān)性閾值A(chǔ)2 G0S)。 本發(fā)明采用樹狀故障組結(jié)構(gòu)反映故障分析結(jié)果,故障組結(jié)構(gòu)圖如圖1所示。 圖2給出了本發(fā)明的基于相關(guān)性分析的傳輸網(wǎng)通用故障分析方法的總體步驟流程圖,
具體包括以下步驟,
步驟(1)獲取要分析范圍內(nèi)發(fā)生的且處理標(biāo)簽為未處理的所有故障因素,形成待分 析的因素集。當(dāng)故障因素發(fā)生點(diǎn)不是對(duì)象樹上的合法實(shí)體時(shí),將該告警轉(zhuǎn)移至特定的無 效故障組,抑制原因?yàn)檎也坏礁婢瘜?shí)體。
其中,步驟(1)包括以下步驟
步驟(1.1)按照指定分析范圍將故障因素取至緩存區(qū)。分析范圍包括時(shí)間范圍和實(shí) 體范圍。時(shí)間范圍指故障因素的發(fā)生時(shí)間在指定的時(shí)間段內(nèi),實(shí)體范圍是指故障因素的 位置信息是指定的實(shí)體或者其子實(shí)體的位置信息。
步驟(1.2)根據(jù)故障因素位置信息判斷本因素是否為對(duì)象樹(指?jìng)鬏斁W(wǎng)中資源的實(shí) 體,由于實(shí)體間存在父子關(guān)系和包含關(guān)系,因此形成了關(guān)系網(wǎng),簡(jiǎn)稱為對(duì)象樹)上合法 實(shí)體產(chǎn)生的。如果不是,將其轉(zhuǎn)移至特定的無效故障組(即不需要維護(hù)人員立即處理的 故障組,處理等級(jí)是可緩處理等級(jí))。
步驟(2)把步驟(1)產(chǎn)生的結(jié)果按照時(shí)間相關(guān)性將故障因素劃分故障組,每個(gè)故 障組給同樣的處理優(yōu)先級(jí)一緊急處理級(jí)。
參見圖3,步驟(2)具體包括如下步驟
步驟(2.1)將待分析因素集中的故障因素按照發(fā)生時(shí)間在緩存區(qū)內(nèi)排序。
步驟(2.2)判斷每個(gè)故障因素的發(fā)生時(shí)間是否和某個(gè)現(xiàn)存有效故障組滿足
((FGB-A1)〈B〈(FGE+A2))規(guī)則,滿足則轉(zhuǎn)到步驟2.3,否則轉(zhuǎn)到步驟2.4;其中B是故障 因素的發(fā)生時(shí)間,Al為前向時(shí)間相關(guān)性閾值,即故障因素發(fā)生變更到故障產(chǎn)生開始之間 的時(shí)間,A2為后向時(shí)間相關(guān)性閾值,即故障產(chǎn)生開始到故障因素發(fā)生變更之間的時(shí)間, FGB為故障組的開始時(shí)間,即故障組包含的全部故障因素最早的開始時(shí)間,也就是最可 能的發(fā)生故障后設(shè)備產(chǎn)生反映的最早時(shí)間,F(xiàn)GE為故障組的結(jié)束時(shí)間,即故障組包含的 全部故障因素最晚的開始時(shí)間,也就是最可能的發(fā)生故障后設(shè)備不再產(chǎn)生其他動(dòng)作的最 早時(shí)間,也稱為故障收斂時(shí)間。
步驟(2.3)將故障因素作為主故障因素移至相關(guān)故障組中,并更新該故障組的FGB 和FGE時(shí)間。
步驟(2.4)將故障因素放入新的故障組中,該新的故障組的FGB和FGE均為故障 因素的發(fā)生時(shí)間。故障組的處理優(yōu)先級(jí)為緊急處理。
步驟(2.5)判斷現(xiàn)存有效故障組(即需要維護(hù)人員處理的故障組,其處理優(yōu)先級(jí)為 一般或者緊急或者特緊急)是否存在時(shí)間相關(guān)性,即兩個(gè)故障組滿足 ((FGB1 -A 1 )<FGB2<(FGE1 +A2))或者(FGB1-A1 )<FGE2<(FGE 1十A2))關(guān)系則為相關(guān),如果 存在,則將故障組合并,并更新合并后的故障組的FGB和FGE, 一直處理到不再有任何 故障組存在時(shí)間相關(guān)性。此時(shí)故障組包括一個(gè)或者多個(gè)故障引發(fā)的全部故障因素,即一 個(gè)故障引發(fā)的故障因素不可能跨故障組存在。其中FGB1為兩個(gè)故障組中的其中一個(gè)故 障組的開始時(shí)間,F(xiàn)GE1為該其中一個(gè)故障組的結(jié)束時(shí)間,F(xiàn)GB2為兩個(gè)故障組中的另一 個(gè)故障組的開始時(shí)間,F(xiàn)GE1為該另一個(gè)故障組的結(jié)束時(shí)間。
其中,步驟(2.3)包括以下步驟如果故障因素和故障組存在時(shí)間相關(guān)性,且開始 時(shí)間和故障組的FGB、 FGE不相同,則若故障因素開始時(shí)間早于FGB,則按照故障因素 開始時(shí)間設(shè)置FGB,若故障因素開始時(shí)間晚于FGE,則按照故障因素開始時(shí)間設(shè)置FGE。
其中,步驟(2.5)包括以下步驟如果需要合并的兩個(gè)故障組的FGB、 FGE不相同, 則按照最早的FGB和最晚的FGE設(shè)置合并后的故障組的FGB、 FGE。
步驟(3)把步驟2產(chǎn)生的結(jié)果按照空間相關(guān)性抑制從故障因素,保留主故障因素。 參見圖4空間相關(guān)性分析流程,其具體包括如下步驟
步驟(3.1)同一個(gè)故障組中的主故障因素按照空間相關(guān)狀態(tài)優(yōu)先原則抑制。即如果 故障因素產(chǎn)生的實(shí)體處于倒換狀態(tài)、維護(hù)狀態(tài)(例如環(huán)回等)或者通信中斷狀態(tài)時(shí),則 抑制其本身其他故障因素(即除了倒換狀態(tài)、維護(hù)狀態(tài)、通信中斷狀態(tài)之外的故障因素)
和子故障因素(即子實(shí)體產(chǎn)生的故障因素),這些被抑制的故障因素必須和主故障因素同
屬一個(gè)故障組。抑制原因是倒換狀態(tài)、維護(hù)狀態(tài)、通信中斷需要優(yōu)先處理。
步驟(3.2)對(duì)于步驟3.1不能抑制的故障因素N按照實(shí)體空間相關(guān)低速率層次 (LayerRate,用于描述TP點(diǎn)或連接的層次)優(yōu)先原則抑制。獲取本故障因素N發(fā)生實(shí) 體上的全部故障因素(可能屬于不同的故障組)形成同實(shí)體待分析故障因素集,故障因 素N與該故障因素集比對(duì),如果N與其中任意一個(gè)故障因素M的方向一致,速率層次 (參考TMF814速率層次LayerRate—T定義)更低,則N抑制M,反之則M抑制N。抑 制原因是同一個(gè)實(shí)體的故障因素需要優(yōu)先處理底層故障因素。例如同一個(gè)PTP產(chǎn)生的故 障因素,當(dāng)其發(fā)生在RS (再生段)層時(shí)比發(fā)生在MS (復(fù)用段)層有更高處理優(yōu)先等級(jí)。
步驟(3.3)對(duì)于步驟3.2不能抑制的故障因素判斷是否可以被父實(shí)體產(chǎn)生的故障因 素抑制。取父實(shí)體的全部故障因素,判斷故障因素是否和父實(shí)體中某個(gè)故障因素存在空 間相關(guān)性,即方向一致,并且同屬于一個(gè)故障組的,則本故障因素被抑制,抑制原因?yàn)?優(yōu)先處理父實(shí)體的故障因素。
其中步驟(3.1)包括抑制故障因素,故障因素M抑制N即將從故障因素N從原來 的故障組中移至主故障因素M所屬故障組,故障因素N放于故障組底層做為從故障因素 存儲(chǔ),并設(shè)置信號(hào)指示N被M抑制,抑制的原因?yàn)榭臻g相關(guān)狀態(tài)優(yōu)先原則。
其中步驟(3.2)包括判斷方向一致,即兩個(gè)故障因素的監(jiān)控點(diǎn)處于同一信號(hào)流方向中。
步驟(4)把步驟3處理后的故障組按照業(yè)務(wù)相關(guān)性抑制從故障因素,保留主故障因 素;參見圖5空間相關(guān)性分析流程,其具體包括如下步驟
步驟(4.1)獲取步驟(3)處理后的全部有效故障組中主故障因素,如果主故障因素 是發(fā)生在單盤上則轉(zhuǎn)4.2,如果是發(fā)生在PTP (物理端口)或者CTP (連接終端點(diǎn))上則 轉(zhuǎn)4,3。
步驟(4.2)根據(jù)盤保護(hù)機(jī)制,抑制對(duì)耦盤(互為主備的單盤)上同故障組的相同故 障因素;
步驟(4.3)獲取故障因素發(fā)生點(diǎn)(即產(chǎn)生故障因素的實(shí)體)全部交叉;如果沒有經(jīng) 過故障因素發(fā)生點(diǎn)的交叉轉(zhuǎn)(4.4),否則轉(zhuǎn)(4.5);
步驟(4.4)將主故障因素抑制到特殊的故障組,其處理優(yōu)先級(jí)為可緩處理,抑制原 因?yàn)楸緦?shí)體無交叉。
步驟(4.5)按照業(yè)務(wù)相關(guān)性中交叉相關(guān)原則抑制故障因素。
參見圖6,步驟(4.2)的原理是互為盤保護(hù)的單盤在發(fā)生故障時(shí)會(huì)產(chǎn)生同樣故障因
素,只需要處理其中之一即可,包括如下步驟
步驟(4.2.1)判斷故障因素發(fā)生點(diǎn)的盤保護(hù)機(jī)制,獲取主故障因素發(fā)生單盤的對(duì)耦 盤。傳輸設(shè)備上盤備份有兩種機(jī)制1: 1和1: N,如果為1:1轉(zhuǎn)到步驟4.2.2,為1: N轉(zhuǎn) 到步驟4.2.3。
步驟(4.2.2)按照機(jī)框槽位屬性找到故障因素發(fā)生點(diǎn)所在單盤的唯一對(duì)耦盤。轉(zhuǎn)到 4.2.4。
步驟(4.2.3)、根據(jù)當(dāng)前故障因素產(chǎn)生單盤是否為備用單盤找到對(duì)應(yīng)的對(duì)耦盤。然后 轉(zhuǎn)到步驟4.2.4;
步驟(4.2.4)如果存在對(duì)耦盤,則獲取對(duì)耦盤上全部故障因素,抑制對(duì)耦盤上屬于 同一個(gè)故障組,且同類型的故障因素。則當(dāng)前故障因素N做為主故障因素,對(duì)偶盤發(fā)生 的故障因素M為從故障因素,N抑制M。抑制原因?yàn)楸P保護(hù)中相同告警只處理其一,這 可抑制盤保護(hù)時(shí)主備上報(bào)相同故障因素。
其中步驟(4.2.3)包括
步驟(4.2.3.1)如果當(dāng)前故障因素發(fā)生是主用盤,則根據(jù)槽位屬性找到備用盤做為對(duì) 耦盤,,然后轉(zhuǎn)步驟(4.2.4)。
步驟(4.2.3.2)如果當(dāng)前故障因素發(fā)生的是備用單盤,則判斷是否發(fā)生盤保護(hù)倒換, 如果是則轉(zhuǎn)4.2.3.3,否則轉(zhuǎn)4.2.3.4。
步驟(4.2.3.3)根據(jù)倒換信息獲取被保護(hù)主盤做為對(duì)耦盤,然后轉(zhuǎn)步驟(4.2.4)。
步驟(4.2.3.4)根據(jù)槽位信息,取所有被保護(hù)的N塊主盤做為對(duì)耦盤,然后轉(zhuǎn)步驟 (4.2.4)。
參見圖7,步驟(4.5)對(duì)步驟4.3中獲取的全部交叉中的每一條交叉執(zhí)行如下步驟 步驟(4.5.1)獲取交叉經(jīng)過的通道;通道由交叉經(jīng)過的實(shí)體組成,包括端口、交叉 和光纖。
步驟(4.5.2)獲取交叉經(jīng)過的通道上的全部實(shí)體,并獲取這些實(shí)體的父、子實(shí)體所
產(chǎn)生的全部故障因素形成新的待分析故障因素組。這些故障因素必須是待分析的(即未
被抑制的),且和步驟4.5.1的主故障因素同一個(gè)故障組。
步驟(4.5.3)設(shè)置本通道的有效屬性。其中無效狀態(tài)包括通道是殘損的、空閑的。
如果通道是無效的,則轉(zhuǎn)步驟4.5.4,否則轉(zhuǎn)步驟4.5.5。
步驟(4.5.4)重新獲取通道包含實(shí)體所產(chǎn)生的全部故障因素(可能不同故障組),按
照無效通道業(yè)務(wù)相關(guān)性規(guī)則抑制故障因素,將滿足規(guī)則的故障因素抑制到特殊故障組,
其處理優(yōu)先級(jí)是可緩處理等級(jí),抑制原因?yàn)闊o有效業(yè)務(wù)。無效通道業(yè)務(wù)相關(guān)性規(guī)則為
故障因素產(chǎn)生點(diǎn)的速率<=通道的速率。例如速率大小為VC4 (S卩155MBit/s)的無效通道 包含的2M端口 (即傳輸速度為2MBit/s的物理端口)產(chǎn)生的故障因素,其處理優(yōu)先級(jí)是可 緩處理等級(jí)。
步驟(4.5.5)遍歷通道包含的實(shí)體,按照有效通道業(yè)務(wù)相關(guān)性規(guī)則逐個(gè)抑制步驟4.5.2 產(chǎn)生的待分析故障因素組。 其中步驟(4.5.5)包括
步驟(4.5.5.1)將要分析的主故障因素和每個(gè)通道實(shí)體產(chǎn)生的故障因素比對(duì),滿足以 下規(guī)則的為主故障因素,即方向一致(兩個(gè)故障因素監(jiān)控方向在通道中屬同一個(gè)信號(hào) 流方向);故障因素的速率層次更低;故障因素產(chǎn)生點(diǎn)所處PTP具有較高的速率;同屬一 個(gè)故障組。
步驟(4.5.5.2)將步驟(4.5.5.1)分析結(jié)果設(shè)置為主故障因素,如果沒有主故障因素, 則不抑制,否則主故障因素抑制從故障因素。
步驟(5)清理步驟(4)產(chǎn)生的故障組,將空的故障組刪除。
步驟(6)把步驟(5)產(chǎn)生的結(jié)果按照知識(shí)庫獲取故障原因和處理操作;根據(jù)知識(shí) 庫獲取主故障因素的原因。 其中步驟6包括
步驟(6.1)根據(jù)知識(shí)庫中規(guī)則判斷判斷一個(gè)主故障因素和其屏蔽的次故障因素是否 有符合的規(guī)則,有則提供處理建議。
步驟(6.2)根據(jù)知識(shí)庫中規(guī)則同一故障組內(nèi)的主故障因素是否存在關(guān)聯(lián)性,如果有 從規(guī)則中獲得其處理建議。
其中步驟6中引用的知識(shí)庫如圖8。知識(shí)庫類型指當(dāng)前知識(shí)庫的用途,例如操作建議 知識(shí)庫等等。規(guī)則標(biāo)識(shí)指在同一種類型的知識(shí)庫內(nèi)規(guī)則的唯一標(biāo)識(shí)??尚哦缺硎颈疽?guī)則 的信任程度。故障因素列表描述了可能同時(shí)出現(xiàn)的故障因素,故障原因列表指示了當(dāng)故 障因素列表中所列故障同時(shí)發(fā)生時(shí)可能的故障原因,處理建議列表存儲(chǔ)了處理故障原因 的建議操作和處理等級(jí)。
步驟(7)判斷是否有需要處理的其他處理優(yōu)先級(jí)的故障組,如果有,則再次采用步 驟l-6分析故障組,如果得出的故障組處理優(yōu)先級(jí)是不需要繼續(xù)處理,則結(jié)束。
以上所屬僅為本發(fā)明的較佳實(shí)施例,并不用于限制本發(fā)明,凡在本發(fā)明精神和原則 之內(nèi)所做的任何修改、等同替換和改進(jìn)等,均包含于本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1、一種基于相關(guān)性分析的傳輸網(wǎng)故障定位方法,其特征在于包括以下步驟步驟1、獲取要分析范圍內(nèi)發(fā)生的、且處理標(biāo)簽為未處理的所有故障因素,形成待分析的因素集;步驟2、把步驟1產(chǎn)生的結(jié)果按照時(shí)間相關(guān)性將故障因素劃分為多個(gè)故障組,每個(gè)故障組給同樣的處理優(yōu)先級(jí);步驟3、按照空間相關(guān)性抑制步驟2產(chǎn)生的每個(gè)故障組中的從故障因素,保留主故障因素;步驟4、把步驟3產(chǎn)生的每個(gè)故障組按照業(yè)務(wù)相關(guān)性抑制從故障因素,保留主故障因素;步驟5、將步驟4產(chǎn)生的多個(gè)故障組中的空故障組刪除;步驟6、把步驟5產(chǎn)生的結(jié)果根據(jù)知識(shí)庫獲取故障原因和故障處理方式,將當(dāng)前處理過的主故障因素的處理標(biāo)簽設(shè)置為已處理。
2、 如權(quán)利要求1所述的方法,其特征在于所述步驟1包括以下步驟步驟l.l、按照指定分析范圍將故障因素取至緩存區(qū),其中分析范圍包括時(shí)間范圍和 實(shí)體范圍,所述時(shí)間范圍指故障因素的發(fā)生時(shí)間在指定的時(shí)間段內(nèi),所述實(shí)體范圍是指 故障因素的位置信息是指定的實(shí)體或者其子實(shí)體的位置信息;步驟1.2、根據(jù)故障因素位置信息判斷本因素是否為對(duì)象樹上合法實(shí)體產(chǎn)生的,如果 不是,將其轉(zhuǎn)移至特定的無效故障組,抑制原因?yàn)檎也坏礁婢瘜?shí)體。
3、 如權(quán)利要求1或2所述的方法,其特征在于所述步驟2包括以下步驟 步驟2.1、將待分析因素集中的故障因素按照發(fā)生時(shí)間B在緩存區(qū)內(nèi)排序;步驟2.2、判斷待分析因素集中的每個(gè)故障因素的發(fā)生時(shí)間是否和某個(gè)現(xiàn)存有效故障 組滿足((FGB-A1^B《(FGE+A2))規(guī)則,滿足則轉(zhuǎn)到步驟2.3,否則轉(zhuǎn)到步驟2.4;其中B 是故障因素的發(fā)生時(shí)間,Al為前向時(shí)間相關(guān)性閾值,即故障因素發(fā)生變更到故障產(chǎn)生開 始之間的時(shí)間,A2為后向時(shí)間相關(guān)性閾值,即故障產(chǎn)生開始到故障因素發(fā)生變更之間的 時(shí)間,F(xiàn)GB為故障組的開始時(shí)間,即故障組包含的全部故障因素最早的開始時(shí)間,也就 是最可能的發(fā)生故障后設(shè)備產(chǎn)生反映的最早時(shí)間,F(xiàn)GE為故障組的結(jié)束時(shí)間,即故障組 包含的全部故障因素最晚的開始時(shí)間,也就是最可能的發(fā)生故障后設(shè)備不再產(chǎn)生其他動(dòng) 作的最早時(shí)間,也稱為故障收斂時(shí)間; 步驟2.3、將故障因素作為主故障因素移至相關(guān)故障組中,并更新該故障組的FGB 和FGE時(shí)間;步驟2.4、將故障因素放入新的故障組中,該新的故障組的FGB和FGE均為故障因 素的發(fā)生時(shí)間;步驟2.5、判斷現(xiàn)存有效故障組是否存在時(shí)間相關(guān)性,即兩個(gè)故障組滿足 ((FGB 1 - A 1 )<FGB2<(FGE 1 + A2))或者((FGB 1 - A 1 )<FGE2<(FGE 1十A2))關(guān)系則為相關(guān),如果 存在,則將故障組合并,并更新合并后的故障組的FGB和FGE, 一直處理到不再有任何 故障組存在時(shí)間相關(guān)性,此時(shí)故障組包括一個(gè)或者多個(gè)故障引發(fā)的全部故障因素,即一 個(gè)故障引發(fā)的故障因素不可能跨故障組存在;其中FGB1為兩個(gè)故障組中的其中一個(gè)故 障組的開始時(shí)間,F(xiàn)GE1為該其中一個(gè)故障組的結(jié)束時(shí)間,F(xiàn)GB2為兩個(gè)故障組中的另一 個(gè)故障組的開始時(shí)間,F(xiàn)GE1為該另一個(gè)故障組的結(jié)束時(shí)間。
4、 如權(quán)利要求3所述的方法,其特征在于步驟2.3包括以下步驟如果故障因素和故障組存在時(shí)間相關(guān)性,且故障因素的發(fā)生 時(shí)間和故障組的FGB、 FGE不相同,則若故障因素發(fā)生時(shí)間早于FGB,則按照故障因素 發(fā)生時(shí)間設(shè)置FGB,若故障因素發(fā)生時(shí)間晚于FGE,則按照故障因素發(fā)生時(shí)間設(shè)置FGE;步驟2.5包括以下步驟如果需要合并的兩個(gè)故障組的FGB、 FGE不相同,則按照 最早的FGB和最晚的FGE設(shè)置合并后的故障組的FGB和FGE。
5、 如權(quán)利要求1-4中任一項(xiàng)所述的方法,其特征在于步驟3包括以下步驟 步驟3.K同一個(gè)故障組中的主故障因素按照空間相關(guān)狀態(tài)優(yōu)先原則抑制,即如果故障因素產(chǎn)生的實(shí)體處于倒換狀態(tài)、維護(hù)狀態(tài)或者通信中斷狀態(tài)時(shí),則抑制該實(shí)體的其他 故障因素和子故障因素,其中所述其他故障因素為除了倒換狀態(tài)、維護(hù)狀態(tài)、通信中斷 狀態(tài)之外的故障因素,所述子故障因素為子實(shí)體產(chǎn)生的故障因素,這些被抑制的故障因 素必須和主故障因素同屬一個(gè)故障組,抑制原因是倒換狀態(tài)、維護(hù)狀態(tài)、通信中斷需要 優(yōu)先處理;步驟3.2、對(duì)于步驟3.1不能抑制的故障因素N按照實(shí)體空間相關(guān)低速率層次優(yōu)先原 則抑制,即獲取本故障因素N發(fā)生實(shí)體上的全部故障因素形成同實(shí)體待分析故障因素集, 故障因素N與該故障因素集比對(duì),如果N與其中任意,個(gè)故障因素M的方向一致,速 率層次更低,則N抑制M,反之則M抑制N,抑制原因是同一個(gè)實(shí)體的故障因素需要優(yōu) 先處理底層故障因素;其中方向一致是指兩個(gè)故障因素的監(jiān)控點(diǎn)處于同一信號(hào)流方向中;步驟3.3、對(duì)于步驟3.2不能抑制的故障因素判斷是否可以被父實(shí)體產(chǎn)生的故障因素 抑制,即取父實(shí)體的全部故障因素,判斷故障因素是否和父實(shí)體中某個(gè)故障因素存在空 間相關(guān)性,即方向一致,并且同屬于一個(gè)故障組的,如果是,則本故障因素被抑制,抑 制原因?yàn)閮?yōu)先處理父實(shí)體的故障因素。
6、 如權(quán)利要求1-7中任一項(xiàng)所述的方法,其特征在于驟4包括以下步驟步驟4.1、獲取步驟3處理后的全部有效故障組中的所有主故障因素,依次進(jìn)行處理, 直至全部有效故障組中的所有主故障因素都處理完畢,對(duì)每個(gè)主故障因素的具體處理為 如果主故障因素是發(fā)生在單盤上則轉(zhuǎn)步驟4.2,如果是發(fā)生在PTP或者CTP上則轉(zhuǎn)步驟4.3;步驟4.2、根據(jù)盤保護(hù)機(jī)制,抑制對(duì)耦盤上同故障組的相同故障因素; 步驟4.3、獲取故障因素發(fā)生點(diǎn)的全部交叉,如果沒有經(jīng)過故障因素發(fā)生點(diǎn)的交叉則 轉(zhuǎn)步驟4.4,否則轉(zhuǎn)步驟4.5;其中故障因素發(fā)生點(diǎn)即為產(chǎn)生故障因素的實(shí)體; 步驟4.4、將主故障因素抑制到無效故障組,抑制原因?yàn)楸緦?shí)體無交叉; 步驟4.5、按照業(yè)務(wù)相關(guān)性中交叉相關(guān)原則抑制故障因素。
7、 如權(quán)利要求6所述的方法,其特征在于步驟4.2包括以下步驟步驟4.2.1、判斷故障因素發(fā)生點(diǎn)的盤保護(hù)機(jī)制,傳輸設(shè)備上有兩種盤保護(hù)機(jī)制,即1: l和l: N,如果為l: 1轉(zhuǎn)到步驟4.2.2,如果為h N轉(zhuǎn)到步驟4.2.3;步驟4.2.2、按照機(jī)框槽位屬性找到故障因素發(fā)生點(diǎn)所在單盤的唯一對(duì)耦盤,轉(zhuǎn)到步 驟4.2.4;步驟4.2.3、根據(jù)當(dāng)前故障因素發(fā)生點(diǎn)是否為備用單盤找到對(duì)應(yīng)的對(duì)耦盤。然后轉(zhuǎn)到 步驟4.2.4;步驟4.2.4、如果存在對(duì)耦盤,則獲取對(duì)耦盤上全部故障因素,抑制對(duì)耦盤上屬于同 一個(gè)故障組、且同類型的故障因素,即當(dāng)前故障因素N作為主故障因素,對(duì)耦盤上發(fā)生 的故障因素M為從故障因素,N抑制M,抑制原因?yàn)楸P保護(hù)中相同告警只處理其一。
8、 如權(quán)力要求7所述的方法,其特征在于步驟4.2.3包括以下步驟步驟4.2.3.1、如果當(dāng)前故障因素發(fā)生點(diǎn)是主用盤,則根據(jù)槽位屬性找到唯一的備用盤作為對(duì)耦盤,然后轉(zhuǎn)步驟4.2.4;步驟4.2.3.2、如果當(dāng)前故障因素發(fā)生點(diǎn)是備用單盤,則判斷是否發(fā)生盤保護(hù)倒換, 是則轉(zhuǎn)4.2.3.3,否則轉(zhuǎn)4.2.3.4;步驟4.2.3.3、根據(jù)倒換信息獲取被保護(hù)主盤作為對(duì)耦盤,然后轉(zhuǎn)步驟4.2.4;步驟4.2.3.4、根據(jù)槽位信息,取所有被保護(hù)的N塊主盤作為對(duì)耦盤,然后轉(zhuǎn)步驟4.2.4。
9、 如權(quán)利要求6-8中任一項(xiàng)所述的方法,其特征在于步驟4.5包括以下步驟步驟4.5.1、獲取主故障因素關(guān)聯(lián)的全部網(wǎng)元交叉,依次進(jìn)行處理,直至所有交叉都 已處理完畢,對(duì)每個(gè)交叉的具體處理為獲取交叉經(jīng)過的通道,通道由交叉經(jīng)過的實(shí)體 組成,然后進(jìn)入步驟4.5.2;步驟4.5.2、獲取交叉經(jīng)過的通道上的全部實(shí)體,并獲取這些實(shí)體的父、子實(shí)體所產(chǎn) 生的全部故障因素形成新的待分析故障因素組,該新的待分析故障因素組中的所有故障 因素都是未被抑制的,且和步驟4.5.1中的主故障因素同一個(gè)故障組;步驟4.5.3、設(shè)置本通道的有效屬性,如果通道是無效的,則轉(zhuǎn)步驟4.5.4,否則轉(zhuǎn)步 驟4.5.5;步驟4.5.4、重新獲取通道包含實(shí)體所產(chǎn)生的全部故障因素,該全部故障因素既包括 與步驟4.5.1中的主故障因素同一個(gè)故障組的故障因素,也包括不同故障組的故障因素, 按照無效通道業(yè)務(wù)相關(guān)性規(guī)則抑制故障因素,所述無效通道業(yè)務(wù)相關(guān)性規(guī)則為故障因 素產(chǎn)生點(diǎn)的速率<=通道的速率,將滿足規(guī)則的故障因素抑制到無效故障組,抑制原因?yàn)?無有效業(yè)務(wù);步驟4.5.5、遍歷通道包含的實(shí)體,按照有效通道業(yè)務(wù)相關(guān)性規(guī)則逐個(gè)抑制步驟4.5.2 產(chǎn)生的新的待分析故障因素組,S卩將要分析的主故障因素和每個(gè)通道實(shí)體產(chǎn)生的故障 因素比對(duì),滿足以下規(guī)則的為主故障因素兩個(gè)故障因素監(jiān)控方向在通道中屬同一個(gè)信 號(hào)流方向,故障因素的速率層次更低,故障因素產(chǎn)生點(diǎn)所處PTP具有較高的速率,同屬 一個(gè)故障組;將滿足該規(guī)則的故障因素設(shè)置為主故障因素,如果沒有主故障因素,則不 抑制,否則主故障因素抑制從故障因素。
10、 如權(quán)利要求1-9中任一項(xiàng)所述的方法,其特征在于還包括步驟7: 判斷是否有需要處理的其他處理優(yōu)先級(jí)的故障組,如果有,則再次采用步驟1-6分析故障組,如果得出的故障組處理優(yōu)先級(jí)是不需要繼續(xù)處理,則結(jié)束。
全文摘要
本發(fā)明涉及一種基于相關(guān)性分析的傳輸網(wǎng)故障定位方法,其包括獲取要分析范圍內(nèi)發(fā)生的所有故障因素,形成待分析的因素集;按照時(shí)間相關(guān)性將故障因素劃分為多個(gè)故障組,每個(gè)故障組給同樣的處理優(yōu)先級(jí);按照空間相關(guān)性抑制每個(gè)故障組中的從故障因素,保留主故障因素;把每個(gè)故障組按照業(yè)務(wù)相關(guān)性抑制從故障因素,保留主故障因素;將多個(gè)故障組中的空故障組刪除;根據(jù)知識(shí)庫獲取故障原因和故障處理方式。該方法可以減少知識(shí)庫龐大不便于維護(hù),降低規(guī)則相互矛盾的概率,提高告警壓縮率以及可以在最大限度適應(yīng)設(shè)備類型、業(yè)務(wù)類型、版本的多樣性,同時(shí)樹狀故障組結(jié)構(gòu)能清晰反映故障分析過程便于人工判斷和修正。
文檔編號(hào)H04M3/22GK101360013SQ20081022299
公開日2009年2月4日 申請(qǐng)日期2008年9月25日 優(yōu)先權(quán)日2008年9月25日
發(fā)明者張麗雅 申請(qǐng)人:烽火通信科技股份有限公司