專利名稱:一種網(wǎng)絡(luò)故障根源的確定方法及分析裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)故障診斷系統(tǒng),尤其涉及一種網(wǎng)絡(luò)故障根源的確定方法 及分析裝置。
背景技術(shù):
隨著社會(huì)經(jīng)濟(jì)的發(fā)展,企業(yè)規(guī)模日益擴(kuò)大,客戶分布日益廣泛,合作伙 伴日益增多,致使企業(yè)網(wǎng)用戶的網(wǎng)絡(luò)規(guī)??焖贁U(kuò)大,網(wǎng)絡(luò)規(guī)模的擴(kuò)大對(duì)網(wǎng)絡(luò)故障的分析定位提出了新的挑戰(zhàn);同時(shí),隨著整個(gè)行業(yè)向著智能化(Smart) 與面向業(yè)務(wù)(SOA)的方向發(fā)展,企業(yè)網(wǎng)用戶對(duì)故障分析的智能化水平、與 業(yè)務(wù)的綁定能力也提出了更高的要求?,F(xiàn)有的網(wǎng)絡(luò)管理平臺(tái)大多通過(guò)主動(dòng)輪詢的方式來(lái)獲取被管理設(shè)備的狀 態(tài),其中通常的處理是查看設(shè)備是否可達(dá)(即設(shè)備是否可以正常通信),如 果設(shè)備不可達(dá)(即設(shè)備不能正常通信),則發(fā)出告警。如圖l所示的網(wǎng)絡(luò)系 統(tǒng)中,網(wǎng)絡(luò)管理平臺(tái)定期的對(duì)交換機(jī)A、交換機(jī)B、交換機(jī)C、交換機(jī)D進(jìn) 行輪詢以確認(rèn)其狀態(tài)。但這種處理方法中,如果交換機(jī)D發(fā)生故障不能正 常通信,則由于交換機(jī)D和交換機(jī)A、交換機(jī)B、交換機(jī)C、其它網(wǎng)絡(luò)均有 鏈路連接,網(wǎng)絡(luò)管理平臺(tái)會(huì)先后上報(bào)四條設(shè)備不可達(dá)告警和/或四條鏈路不 通告警,即交換機(jī)A、交換機(jī)B、交換機(jī)C、交換機(jī)D不可達(dá)告警,和/或 A-D、 B-D、 C-D、 D-其他網(wǎng)絡(luò)四條鏈路不通告警??梢?,該處理方法中, 一方面會(huì)引起不必要的設(shè)備不可達(dá)和/或鏈路不通告警,致使用戶無(wú)法正確 定位發(fā)生故障的僅是交換機(jī)D;另一方面,如果交換機(jī)D連接的網(wǎng)絡(luò)很大, 則與交換機(jī)D有關(guān)聯(lián)的所有下屬設(shè)備都會(huì)上報(bào)不可達(dá)告警,嚴(yán)重時(shí)會(huì)引起 事件風(fēng)暴。此外,對(duì)于圖l所示的網(wǎng)絡(luò)系統(tǒng),若其他網(wǎng)絡(luò)與網(wǎng)絡(luò)管理平臺(tái)之間的鏈路沒(méi)有故障,只有交換機(jī)D發(fā)生故障,則在產(chǎn)生上述四個(gè)設(shè)備不可達(dá)、四條鏈路不通的情況時(shí),無(wú)法獲知造成網(wǎng)絡(luò)管理平臺(tái)與各交換機(jī)之間鏈路不通的故障根源是交換機(jī)D。即在發(fā)生眾多故障時(shí),不能定位當(dāng)前鏈路不通的故 障根源。發(fā)明內(nèi)容有鑒于此,本發(fā)明中一方面提供一種網(wǎng)絡(luò)故障根源的確定方法,另一方 面提供一種網(wǎng)絡(luò)故障根源的分析裝置,以便定位引起鏈路不通的故障根源。 本發(fā)明所提供的網(wǎng)絡(luò)故障根源的確定方法,包括 對(duì)網(wǎng)絡(luò)中包括設(shè)備和/或鏈路的被監(jiān)控對(duì)象進(jìn)行故障輪詢; 根據(jù)輪詢結(jié)果,將相互之間存在連接關(guān)系的故障對(duì)象確定為同 一個(gè)故障區(qū)域;從所確定的故障區(qū)域中,根據(jù)每個(gè)故障對(duì)象與其它對(duì)象的連接關(guān)系,確 定所述故障區(qū)域的故障根源。 較佳地,該方法進(jìn)一步包括較佳地,所述從所確定的故障區(qū)域中,根據(jù)每個(gè)故障對(duì)象與其它對(duì)象的連接關(guān)系,確定所述故障區(qū)域的故障根源包括從所確定的故障區(qū)域中,將和所述故障區(qū)域外的對(duì)象有連接關(guān)系的故障對(duì) 象確定為所述故障區(qū)域的懷疑對(duì)象集;的故障鏈路鏈接的故障設(shè)備確定為所述故障區(qū)域的故障根源。較佳地,所述根據(jù)輪詢結(jié)果,將相互之間存在連接關(guān)系的故障對(duì)象確定為一個(gè)故障區(qū)域包括根據(jù)輪詢結(jié)果,確定由所有故障對(duì)象組成的故障集;從所述故障集中,將相互之間存在連接關(guān)系的故障對(duì)象確定為同 一個(gè)故障區(qū)域。較佳地,所述根據(jù)輪詢結(jié)果,確定由所有故障對(duì)象組成的故障集包括A、 根據(jù)輪詢結(jié)果,將不可達(dá)設(shè)備和/或不通鏈路作為故障對(duì)象存放于告警集中;B、 將所述告警集中的所有故障對(duì)象存放在未處理對(duì)象區(qū),并將所述對(duì)象的 狀態(tài)標(biāo)識(shí)為故障,將所述告警集之外的其他對(duì)象存放在其他對(duì)象區(qū),并將所述 對(duì)象的狀態(tài)標(biāo)識(shí)為未知;C、 從未處理對(duì)象區(qū)中提取當(dāng)前對(duì)象,如果所述當(dāng)前對(duì)象的狀態(tài)為故障,則 從所述其他對(duì)象區(qū)中提取與所述當(dāng)前對(duì)象有鏈接的所有對(duì)象,并將這些對(duì)象存 放在未處理對(duì)象區(qū),同時(shí)將所述當(dāng)前對(duì)象存放在已處理對(duì)象區(qū);如果所述當(dāng)前 對(duì)象的狀態(tài)為未知,則重新測(cè)試所述當(dāng)前對(duì)象的狀態(tài),如果狀態(tài)為不可達(dá)或不 通,則將所述當(dāng)前對(duì)象存放在未處理對(duì)象區(qū),并將所述當(dāng)前對(duì)象的狀態(tài)更改為 故障,否則,將所述當(dāng)前對(duì)象存放在已處理對(duì)象區(qū);D、 判斷所述未處理對(duì)象區(qū)是否為空,如果為空,則將所述已處理對(duì)象區(qū) 中的故障對(duì)象作為故障集,否則,將所述未處理對(duì)象區(qū)中的下一個(gè)對(duì)象作為當(dāng) 前對(duì)象,返回執(zhí)行步驟C。較佳地,步驟A中進(jìn)一步包括對(duì)所述不可達(dá)設(shè)備和/或不通鏈路進(jìn)行告警;所述確定故障根源之后、對(duì)故障根源進(jìn)行告警之前,該方法進(jìn)一步包括 停止對(duì)所述不可達(dá)設(shè)備和/或不通鏈路的告警。較佳地,所述確定故障根源之后,該方法進(jìn)一步包括將所述不可達(dá)設(shè)備 和/或不通鏈路與所述故障根源進(jìn)行故障關(guān)聯(lián)。較佳地,若從所述各故障區(qū)域中,確定和所述故障區(qū)域外的對(duì)象有連接 關(guān)系的懷疑對(duì)象集為空,該方法進(jìn)一步包括對(duì)全網(wǎng)絡(luò)故障進(jìn)行告警。本發(fā)明所提供的網(wǎng)絡(luò)故障根源的分析裝置,包括故障輪詢模塊,用于 對(duì)網(wǎng)絡(luò)中包括設(shè)備和/或鏈路的被監(jiān)控對(duì)象進(jìn)行故障輪詢;此外,該裝置還 包括故障區(qū)域確定模塊,用于根據(jù)輪詢結(jié)果,將相互之間存在連接關(guān)系的故障對(duì)象確定為同 一個(gè)故障區(qū)域;故障根源確定模塊,用于從所確定的故障區(qū)域中,根據(jù)每個(gè)故障對(duì)象與 其它對(duì)象的連接關(guān)系,確定所述故障區(qū)域的故障根源。較佳地,該裝置進(jìn)一步包括告警模塊,用于將所述故障根源作為所述故 障區(qū)域的區(qū)域不可達(dá)進(jìn)行告警。較佳地,所述故障根源確定模塊包括懷疑對(duì)象集確定子模塊,用于從所確定的故障區(qū)域中,將和所述故障區(qū)域 外的對(duì)象有連接關(guān)系的故障對(duì)象確定為所述故障區(qū)域的懷疑對(duì)象集;故障根源確定子模塊,用于將所述懷疑對(duì)象集中的故障設(shè)備及所述故障區(qū) 域內(nèi)的與所述懷疑對(duì)象集中的故障鏈路鏈接的故障設(shè)備確定為所述故障區(qū)域的 故障根源。較佳地,所述故障區(qū)域確定模塊包括故障集確定子模塊,用于根據(jù)輪詢結(jié)果,確定由所有故障對(duì)象組成的故障故障區(qū)域確定子模塊,用于從所述故障集中,將相互之間存在連接關(guān)系的 故障對(duì)象確定為同一個(gè)故障區(qū)域。較佳地,所述故障集確定子模塊包括故障處理單元,用于根據(jù)輪詢結(jié)果,將不可達(dá)設(shè)備和/或不通鏈路作為故障 對(duì)象存放于告警集中;對(duì)象調(diào)度單元,用于將所述告警集中的所有故障對(duì)象存放在未處理對(duì)象區(qū), 并將所述對(duì)象的狀態(tài)標(biāo)識(shí)為故障,將所述告警集之外的其他對(duì)象存放在其他對(duì) 象區(qū),并將所述對(duì)象的狀態(tài)標(biāo)識(shí)為未知;從未處理對(duì)象區(qū)中提取當(dāng)前對(duì)象,如 果所述當(dāng)前對(duì)象的狀態(tài)為故障,則從所述其他對(duì)象區(qū)中提取與所述當(dāng)前對(duì)象有 鏈接的所有對(duì)象,并將這些對(duì)象存放在未處理對(duì)象區(qū),同時(shí)將所述當(dāng)前對(duì)象存 放在已處理對(duì)象區(qū);如果所述當(dāng)前對(duì)象的狀態(tài)為未知,則重新測(cè)試所述當(dāng)前對(duì) 象的狀態(tài),如果狀態(tài)為不可達(dá)或不通,則將所述當(dāng)前對(duì)象存放在未處理對(duì)象區(qū), 并將所述當(dāng)前對(duì)象的狀態(tài)更改為故障,否則,將所述當(dāng)前對(duì)象存放在已處理對(duì)象區(qū);如果未處理對(duì)象區(qū)不為空,將所述未處理對(duì)象區(qū)中的下一個(gè)對(duì)象作為當(dāng)前對(duì)象,并返回執(zhí)行所述從未處理對(duì)象區(qū)中提取當(dāng)前對(duì)象的操作,直到未處理對(duì)象區(qū)為空;故障集確定單元,用于在未處理對(duì)象區(qū)為空時(shí),將所述已處理對(duì)象區(qū)中的 故障對(duì)象確定為故障集。其中,所述未處理對(duì)象區(qū)、已處理對(duì)象區(qū)和其他對(duì)象區(qū)為堆?;騘^表或 除堆棧和鏈表之外的其它形式的存儲(chǔ)單元。較佳地,所述故障處理單元進(jìn)一步用于將所述不可達(dá)設(shè)備和/或不通鏈路上 報(bào)給所述告警模塊;所述告警模塊進(jìn)一步用于在對(duì)區(qū)域不可達(dá)進(jìn)行告警之前,對(duì)所述不可達(dá)設(shè) 備和/或不通鏈路進(jìn)行告警。較佳地,所述告警模塊進(jìn)一步用于將所述不可達(dá)設(shè)備的告警和/或所述 不通鏈路的告警與所述區(qū)域不可達(dá)的告警進(jìn)行故障關(guān)聯(lián)。從上述方案可以看出,本發(fā)明中,對(duì)網(wǎng)絡(luò)中由設(shè)備和鏈路構(gòu)成的被監(jiān)控 對(duì)象進(jìn)行輪詢;根據(jù)輪詢結(jié)果,將相互之間存在連接關(guān)系的故障對(duì)象確定為 同一個(gè)故障區(qū)域,進(jìn)一步地,從所述各故障區(qū)域中,根據(jù)每個(gè)故障對(duì)象與其 它對(duì)象的連接關(guān)系確定故障根源,可見,通過(guò)直接從眾多故障對(duì)象中定位到 故障根源,.從而縮短了故障處理的周期,并且,進(jìn)一步地,避免了4艮多不必 要的告警。
圖1為一種網(wǎng)絡(luò)系統(tǒng)架構(gòu)圖;圖2為本發(fā)明中網(wǎng)絡(luò)故障根源確定方法的實(shí)施例的示例性流程圖; 圖3為圖2所示流程中得到故障集的方法流程圖; 圖4為本發(fā)明中網(wǎng)絡(luò)故障根源分析裝置的實(shí)施例的示例性結(jié)構(gòu)圖; 圖5為應(yīng)用本發(fā)明技術(shù)方案的一個(gè)網(wǎng)絡(luò)故障根源確定方法的流程圖。10具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,下面結(jié)合實(shí)施例和 附圖,對(duì)本發(fā)明進(jìn)一步詳細(xì)說(shuō)明。圖2為本發(fā)明中網(wǎng)絡(luò)故障根源確定方法的實(shí)施例的示例性流程圖。如圖l所示,該流程包括如下步驟步驟201,對(duì)網(wǎng)絡(luò)中包括設(shè)備和/或鏈路的被監(jiān)控對(duì)象進(jìn)行故障輪詢。 本步驟中的具體操作可與現(xiàn)有技術(shù)中的操作一致。步驟202,根據(jù)輪詢結(jié)果,將相互之間存在連接關(guān)系的故障對(duì)象確定為 同一個(gè)故障區(qū)域。本步驟中,確定的故障區(qū)域可能只有一個(gè),也可能有多個(gè),每個(gè)故障區(qū) 域內(nèi)的故障對(duì)象之間存在連接關(guān)系,而故障區(qū)域之間的對(duì)象都不存在連接關(guān) 系,這里的連接關(guān)系通常指通信連接關(guān)系。具體實(shí)現(xiàn)時(shí),可有多種方法。例 如,可根據(jù)輪詢過(guò)程中故障對(duì)象的發(fā)生情況進(jìn)行實(shí)時(shí)的故障區(qū)域劃分,舉例 說(shuō)明,若對(duì)象l發(fā)生故障,接著對(duì)象2也發(fā)生故障,且對(duì)象1和對(duì)象2之間 存在連接關(guān)系,則可將對(duì)象1和對(duì)象2確定在一個(gè)故障區(qū)域中,若之后對(duì)象 3也發(fā)生故障,但對(duì)象3和對(duì)象1、對(duì)象2之間沒(méi)有連接關(guān)系,則可將對(duì)象 3確定在另一個(gè)對(duì)象區(qū)域中。又如也可根據(jù)輪詢過(guò)程中故障對(duì)象的發(fā)生情 況首先確定一個(gè)故障集,之后對(duì)該故障集進(jìn)行故障區(qū)域劃分,所述故障集可 以是實(shí)時(shí)記錄的故障集,也可以是對(duì)實(shí)時(shí)記錄的故障集進(jìn)行再處理后,得到 的穩(wěn)定故障集,舉例說(shuō)明,可先將上述發(fā)生故障的對(duì)象1、對(duì)象2和對(duì)象3 設(shè)置在一個(gè)故障集中,之后根據(jù)相互之間的連接關(guān)系,將對(duì)象1和對(duì)象2確 定在一個(gè)故障區(qū)域中,將對(duì)象3確定在另 一個(gè)故障區(qū)域中。步驟203,從所確定的故障區(qū)域中,根據(jù)每個(gè)故障對(duì)象與其它對(duì)象的連 接關(guān)系,確定該故障區(qū)域的故障根源。本步驟中,從各故障區(qū)域中確定故障根源的方法可有多種,例如,可根據(jù)每個(gè)故障對(duì)象與故障區(qū)域內(nèi)其它對(duì)象的連接關(guān)系,確定故障區(qū)域中與故障鏈路鏈接較多的設(shè)備作為故障根源。又如,也可根據(jù)每個(gè)故障對(duì)象與故障區(qū)域 外其它對(duì)象的連接關(guān)系,將各故障區(qū)域中和所述故障區(qū)域外的對(duì)象有連接關(guān) 系故障對(duì)象確定為該故障區(qū)域的懷疑對(duì)象集,若懷疑對(duì)象集不為空,則將所 述懷疑對(duì)象集中的故障設(shè)備作為故障根源,并且若懷疑對(duì)象集中存在鏈路, 則將鏈路本身從懷疑對(duì)象集中去除,并將與所述鏈路鏈接的位于故障區(qū)域內(nèi) 的故障設(shè)備確定為該故障區(qū)域的故障根源。其中,若懷疑對(duì)象集為空,則表示全網(wǎng)故障,可不確定故障根源,而對(duì) 全網(wǎng)故障進(jìn)行告警,或者也可從中確定與故障鏈路鏈接較多的設(shè)備作為故障 根源。具體實(shí)現(xiàn)時(shí),可將區(qū)域不可達(dá)告警上報(bào)給告警模塊,由告警模塊進(jìn)行告警 顯示。本實(shí)施例中,進(jìn)一步地,還可將所有故障對(duì)象(包括不可達(dá)設(shè)備和/或不通 鏈路)與故障根源進(jìn)行故障關(guān)聯(lián),以方便用戶進(jìn)一步查找其他故障,即用戶可 根據(jù)該故障根源可進(jìn)一步查找到與該故障根源有關(guān)聯(lián)的其他故障對(duì)象。可見,上述流程中避免了很多不必要的告警,直接定位到故障根源,縮短 了故障處理的周期。圖3為圖2所示流程步驟202中得到故障集的一種方法流程圖,該流程 包括如下步驟步驟301,根據(jù)輪詢結(jié)果,將不可達(dá)設(shè)備和/或不通鏈路作為故障對(duì)象存放 于告警集中,該告警集即為實(shí)時(shí)記錄的故障集。步驟302,將所述告警集中的所有故障對(duì)象存放在未處理對(duì)象區(qū),并將所 述對(duì)象的狀態(tài)標(biāo)識(shí)為故障,將所述告警集之外的其他對(duì)象存放在其他對(duì)象區(qū), 并將所述對(duì)象的狀態(tài)標(biāo)識(shí)為未知。本步驟可在步驟301中發(fā)現(xiàn)第一個(gè)故障對(duì)象的設(shè)定時(shí)間后執(zhí)行,該設(shè)定時(shí) 間可根據(jù)實(shí)際情況設(shè)定,如設(shè)定為如10秒等。此外,本步驟也可根據(jù)其它標(biāo)準(zhǔn) 確定#^于時(shí)刻。步驟303,從未處理對(duì)象區(qū)中提取當(dāng)前對(duì)象。步驟304,判斷所提取的當(dāng)前對(duì)象的狀態(tài),如果所述當(dāng)前對(duì)象的狀態(tài)為故 障,則執(zhí)行步驟305;否則,執(zhí)行步驟306。步驟305,從所述其他對(duì)象區(qū)中提取與所述當(dāng)前對(duì)象有鏈接的所有對(duì)象, 并將這些對(duì)象存放在未處理對(duì)象區(qū),同時(shí)將所述當(dāng)前對(duì)象存放在已處理對(duì)象區(qū), 之后執(zhí)行步驟310。步驟306,重新測(cè)試所述當(dāng)前對(duì)象的狀態(tài)。步驟307,判斷所述當(dāng)前對(duì)象的狀態(tài)是否為不可達(dá)或不通,如果是,則執(zhí) 行步驟308,否則,執(zhí)行步驟309。步驟308,將所述當(dāng)前對(duì)象存放在未處理對(duì)象區(qū),并將所述當(dāng)前對(duì)象的狀 態(tài)更改為故障,之后執(zhí)行步驟310。步驟309,將所述當(dāng)前對(duì)象存放在已處理對(duì)象區(qū),之后執(zhí)行步驟310。步驟310,判斷所述未處理對(duì)象區(qū)是否為空,如果為空,則執(zhí)行步驟311, 否則,將所述未處理對(duì)象區(qū)中的下一個(gè)對(duì)象作為當(dāng)前對(duì)象,返回執(zhí)行步驟 303。步驟311,將所述已處理對(duì)象區(qū)中的故障對(duì)象作為穩(wěn)定的故障集。 本實(shí)施例中,步驟301中可進(jìn)一步包括在輪詢過(guò)程中,發(fā)現(xiàn)設(shè)備不可 達(dá)或鏈路不通時(shí),也可產(chǎn)生設(shè)備不可達(dá)告警或鏈路不通告警,具體實(shí)現(xiàn)時(shí), 可將此告警上報(bào)給告警模塊,由告警模塊進(jìn)行告警顯示,并在步驟204中對(duì) 區(qū)域不可達(dá)進(jìn)行告警顯示時(shí),停止對(duì)這些設(shè)備不可達(dá)告警和/或鏈路不通告 警的顯示,并將這些設(shè)備不可達(dá)告警和/或鏈路不通告警與所述區(qū)域不可達(dá) 告警進(jìn)行故障關(guān)聯(lián),以方便用戶進(jìn)一步查找其他故障。圖4為本發(fā)明中網(wǎng)絡(luò)故障根源分析裝置的實(shí)施例的示例性結(jié)構(gòu)圖。如圖 4所示,該裝置包括故障輪詢模塊、故障區(qū)域確定模塊、故障根源確定模 塊和告警模塊。其中,故障輪詢模塊用于對(duì)網(wǎng)絡(luò)中由設(shè)備和/或鏈路構(gòu)成的被監(jiān)控對(duì)象 進(jìn)行故障輪詢。故障區(qū)域確定模塊用于根據(jù)輪詢結(jié)果,將相互之間存在連接關(guān)系的故障 對(duì)象確定為同一個(gè)故障區(qū)域,即確定由故障對(duì)象組成的相互之間沒(méi)有連接關(guān) 系而內(nèi)部故障對(duì)象有連接關(guān)系的各個(gè)故障區(qū)域。有些情況下,故障區(qū)域可能 只有一個(gè)。故障根源確定模塊用于從所確定的故障區(qū)域中,根據(jù)每個(gè)故障對(duì)象與其 它對(duì)象的連接關(guān)系,確定該故障區(qū)域的故障根源。警。具體實(shí)現(xiàn)時(shí),故障根源確定模塊可包括懷疑對(duì)象集確定子模塊和故障 根源確定子模塊。其中,懷疑對(duì)象集確定子模塊,用于從所確定的故障區(qū)域中,將和所述 故障區(qū)域外的對(duì)象有連接關(guān)系的故障對(duì)象確定為所述故障區(qū)域的懷疑對(duì)象集。故障根源確定子模塊,用于將所述懷疑對(duì)象集中的故障設(shè)備及所述故障 區(qū)域內(nèi)的與所述懷疑對(duì)象集中的故障鏈路鏈接的故障設(shè)備確定為故障根源。具體實(shí)現(xiàn)時(shí),故障區(qū)域確定模塊可包括故障集確定子模塊和故障區(qū)域 確定子模塊。其中,故障集確定子模塊,用于根據(jù)輪詢結(jié)果,確定由所有故障對(duì)象組成 的故障集。故障區(qū)域確定子模塊,用于從所述故障集中,將相互之間存在連接關(guān)系 的故障對(duì)象確定為同一個(gè)故障區(qū)域。即將故障集中的故障對(duì)象劃分為內(nèi)部有 連接關(guān)系、相互之間沒(méi)有連接關(guān)系的故障區(qū)域。其中,故障區(qū)域可以只有一個(gè)。具體實(shí)現(xiàn)時(shí),故障集確定子模塊可包括故障處理單元、對(duì)象調(diào)度單元 和故障集確定單元。故障處理單元,用于根據(jù)輪詢結(jié)果,將不可達(dá)設(shè)備和/或不通鏈路作為故障 對(duì)象存放于告警集中;對(duì)象調(diào)度單元,用于將所述告警集中的所有故障對(duì)象存放在未處理對(duì)象區(qū), 并將所述對(duì)象的狀態(tài)標(biāo)識(shí)為故障,將所述告警集之外的其他對(duì)象存放在其他對(duì)象區(qū),并將所述對(duì)象的狀態(tài)標(biāo)識(shí)為未知;從未處理對(duì)象區(qū)中提取當(dāng)前對(duì)象,如果所述當(dāng)前對(duì)象的狀態(tài)為故障,則從所述其他對(duì)象區(qū)中提取與所述當(dāng)前對(duì)象有 鏈接的所有對(duì)象,并將這些對(duì)象存放在未處理對(duì)象區(qū),同時(shí)將所述當(dāng)前對(duì)象存放在已處理對(duì)象區(qū);如果所述當(dāng)前對(duì)象的狀態(tài)為未知,則重新測(cè)試所述當(dāng)前對(duì) 象的狀態(tài),如果狀態(tài)為不可達(dá)或不通,則將所述當(dāng)前對(duì)象存放在未處理對(duì)象區(qū), 并將所述當(dāng)前對(duì)象的狀態(tài)更改為故障,否則,將所述當(dāng)前對(duì)象存放在已處理對(duì) 象區(qū);如果未處理對(duì)象區(qū)不為空,將所述未處理對(duì)象區(qū)中的下一個(gè)對(duì)象作為當(dāng) 前對(duì)象,并返回執(zhí)行所述從未處理對(duì)象區(qū)中提取當(dāng)前對(duì)象的操作,直到未處理 對(duì)象區(qū)為空;故障集確定單元,用于在未處理對(duì)象區(qū)為空時(shí),將所述已處理對(duì)象區(qū)中 的故障對(duì)象確定為故障集。進(jìn)一步地,故障處理單元還可將所述不可達(dá)設(shè)備和不通鏈路上報(bào)給所述 告警模塊,則告警模塊在對(duì)區(qū)域不可達(dá)進(jìn)行告警之前,可對(duì)所述不可達(dá)設(shè)備 和不通鏈路進(jìn)行告警。進(jìn)一步地,告警模塊還可將所述不可達(dá)設(shè)備的告警和 所述不通鏈路的告警與所述區(qū)域不可達(dá)的告警進(jìn)行故障關(guān)聯(lián)。實(shí)現(xiàn)應(yīng)用中,圖4所示裝置中各模塊的具體操作可與圖2和圖3所示流 程中描述的相應(yīng)操作一致。下面以圖1所示系統(tǒng)為例,對(duì)應(yīng)用本發(fā)明技術(shù)方案時(shí)的一個(gè)網(wǎng)絡(luò)故障才艮 源確定實(shí)例進(jìn)行詳細(xì)描述。參見圖5,圖5為應(yīng)用本發(fā)明技術(shù)方案時(shí)的一個(gè)網(wǎng)絡(luò)故障告警方法流程 圖。該流程包括如下步驟步驟501,系統(tǒng)正常對(duì)所有被監(jiān)控設(shè)備、鏈路進(jìn)行輪詢,發(fā)現(xiàn)設(shè)備D發(fā) 生故障,將D放入告警集中。步驟502,系統(tǒng)以告警集為中心,輪詢鏈路A-D、 B-D、 C-D、 D-其他 網(wǎng)絡(luò),發(fā)現(xiàn)這些鏈路不通,將其全部加入告警集中,同時(shí)發(fā)送A-D、 B-D、C-D、 D-其他網(wǎng)絡(luò)的鏈路不通告警。步驟503,系統(tǒng)主動(dòng)輪詢A-D、 B-D、 C-D、 D-其他網(wǎng)絡(luò)的鏈路的鏈接 設(shè)備A、 B、 C,發(fā)現(xiàn)A、 B、 C不可達(dá),將其加入告警集中。步驟504,系統(tǒng)執(zhí)行圖3所示步驟302至步驟311的操作,得到穩(wěn)定的 故障集(A、 B、 C、 D、 A-D、 B-D、 C-D、 D-其他網(wǎng)絡(luò)}。步驟505,由于上述故障集中的故障對(duì)象之間均有連接關(guān)系,因此得到 由上述故障集構(gòu)成的 一 個(gè)故障區(qū)域。步驟506 ,從上述故障區(qū)域中確定和該故障區(qū)域外的對(duì)象有連接關(guān)系的 懷疑對(duì)象集,得到{0-其他網(wǎng)絡(luò)}。步驟507,由于D-其他網(wǎng)絡(luò)是一條鏈路,因此將該鏈路本身從懷疑對(duì)象 集中去除,并將與該鏈路鏈接的位于上述故障區(qū)域內(nèi)的故障設(shè)備D確定為 故障根源。步驟508,將該故障根源D作為上述故障區(qū)域的區(qū)域不可達(dá)進(jìn)行告警, 并將A-D、 B-D、 C-D、 D-其他網(wǎng)絡(luò)的鏈路不通告警與該區(qū)域告警進(jìn)行故障 關(guān)聯(lián)。通過(guò)告警關(guān)聯(lián)技術(shù),用戶可以快速定位故障設(shè)備,縮短故障處理的周期, 從而從根本上提高企業(yè)對(duì)網(wǎng)絡(luò)的投資效益比,方便用戶在網(wǎng)絡(luò)上開展各項(xiàng)業(yè)務(wù)。本發(fā)明中的技術(shù)方案除了可應(yīng)用于企業(yè)網(wǎng)外,也可以應(yīng)用于其它局域網(wǎng)。以上所述的具體實(shí)施例,對(duì)本發(fā)明的目的、^支術(shù)方案和有益效果進(jìn)行了 進(jìn)一步詳細(xì)說(shuō)明,所應(yīng)理解的是,以上所述僅為本發(fā)明的較佳實(shí)施例而已, 并非用于限定本發(fā)明的保護(hù)范圍,凡在本發(fā)明的精神和原則之內(nèi),所作的任 何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1、一種網(wǎng)絡(luò)故障根源的確定方法,其特征在于,該方法包括對(duì)網(wǎng)絡(luò)中包括設(shè)備和/或鏈路的被監(jiān)控對(duì)象進(jìn)行故障輪詢;根據(jù)輪詢結(jié)果,將相互之間存在連接關(guān)系的故障對(duì)象確定為同一個(gè)故障區(qū)域;從所確定的故障區(qū)域中,根據(jù)每個(gè)故障對(duì)象與其它對(duì)象的連接關(guān)系,確定所述故障區(qū)域的故障根源。
2、 如權(quán)利要求l所述的方法,其特征在于,該方法進(jìn)一步包括
3、 如權(quán)利要求2所述的方法,其特征在于,所述從所確定的故障區(qū)域中, 根據(jù)每個(gè)故障對(duì)象與其它對(duì)象的連接關(guān)系,確定所述故障區(qū)域的故障根源包括從所確定的故障區(qū)域中,將和所述故障區(qū)域外的對(duì)象有連接關(guān)系的故障對(duì) 象確定為所述故障區(qū)域的懷疑對(duì)象集;的故障鏈路鏈接的故障設(shè)備確定為所述故障區(qū)域的故障根源。
4、 如權(quán)利要求2所述的方法,其特征在于,所述根據(jù)輪詢結(jié)果,將相互之 間存在連接關(guān)系的故障對(duì)象確定為 一個(gè)故障區(qū)域包括根據(jù)輪詢結(jié)果,確定由所有故障對(duì)象組成的故障集;從所述故障集中,將相互之間存在連接關(guān)系的故障對(duì)象確定為同一個(gè)故障 區(qū)域。
5、 如權(quán)利要求4所述的方法,其特征在于,所述根據(jù)輪詢結(jié)果,確定由所 有故障對(duì)象組成的故障集包括A、 根據(jù)輪詢結(jié)果,將不可達(dá)設(shè)備和/或不通鏈路作為故障對(duì)象存放于告警 集中;B、 將所述告警集中的所有故障對(duì)象存放在未處理對(duì)象區(qū),并將所述對(duì)象的 狀態(tài)標(biāo)識(shí)為故障,將所述告警集之外的其他對(duì)象存放在其他對(duì)象區(qū),并將所述對(duì)象的狀態(tài)標(biāo)識(shí)為未知;c、從未處理對(duì)象區(qū)中提取當(dāng)前對(duì)象,如果所述當(dāng)前對(duì)象的狀態(tài)為故障,則從所述其他對(duì)象區(qū)中提取與所述當(dāng)前對(duì)象有鏈接的所有對(duì)象,并將這些對(duì)象存放在未處理對(duì)象區(qū),同時(shí)將所述當(dāng)前對(duì)象存放在已處理對(duì)象區(qū);如果所述當(dāng)前 對(duì)象的狀態(tài)為未知,則重新測(cè)試所述當(dāng)前對(duì)象的狀態(tài),如果狀態(tài)為不可達(dá)或不 通,則將所述當(dāng)前對(duì)象存放在未處理對(duì)象區(qū),并將所述當(dāng)前對(duì)象的狀態(tài)更改為 故障,否則,將所述當(dāng)前對(duì)象存放在已處理對(duì)象區(qū);D、判斷所述未處理對(duì)象區(qū)是否為空,如果為空,則將所述已處理對(duì)象區(qū) 中的故障對(duì)象作為故障集,否則,將所述未處理對(duì)象區(qū)中的下一個(gè)對(duì)象作為當(dāng) 前對(duì)象,返回4丸行步驟C。
6、 如權(quán)利要求5所述的方法,其特征在于,步驟A中進(jìn)一步包括對(duì)所 述不可達(dá)設(shè)備和/或不通鏈路進(jìn)行告警;所述確定故障根源之后、對(duì)故障根源進(jìn)行告警之前,該方法進(jìn)一步包括 停止對(duì)所述不可達(dá)設(shè)備和/或不通鏈路的告警。
7、 如權(quán)利要求6所述的方法,其特征在于,所述確定故障根源之后,該方 法進(jìn)一步包括將所述不可達(dá)設(shè)備和/或不通鏈路與所述故障根源進(jìn)行故障關(guān) 聯(lián)。
8、 如權(quán)利要求2至7中任一項(xiàng)所述的方法,其特征在于,若從所述各故障 區(qū)域中,確定和所述故障區(qū)域外的對(duì)象有連接關(guān)系的懷疑對(duì)象集為空,該方法 進(jìn)一步包括對(duì)全網(wǎng)絡(luò)故障進(jìn)行告警。
9、 一種網(wǎng)絡(luò)故障根源的分析裝置,包括故障輪詢模塊,用于對(duì)網(wǎng)絡(luò)中包 括設(shè)備和/或鏈路的被監(jiān)控對(duì)象進(jìn)行故障輪詢;其特征在于,該裝置還包括故障區(qū)域確定模塊,用于根據(jù)輪詢結(jié)果,將相互之間存在連接關(guān)系的故障 對(duì)象確定為同 一個(gè)故障區(qū)域;故障根源確定模塊,用于從所確定的故障區(qū)域中,根據(jù)每個(gè)故障對(duì)象與其 它對(duì)象的連接關(guān)系,確定所述故障區(qū)域的故障根源。
10、 如權(quán)利要求9所述的裝置,其特征在于,該裝置進(jìn)一步包括告警模塊,用于將所述故障根源作為所述故障區(qū)域的區(qū)域不可達(dá)進(jìn)行告警。
11、 如權(quán)利要求IO所述的裝置,其特征在于,所述故障根源確定模塊包括 懷疑對(duì)象集確定子模塊,用于從所確定的故障區(qū)域中,將和所述故障區(qū)域外的對(duì)象有連接關(guān)系的故障對(duì)象確定為所述故障區(qū)域的懷疑對(duì)象集;故障根源確定子模塊,用于將所述懷疑對(duì)象集中的故障設(shè)備及所述故障區(qū) 域內(nèi)的與所述懷疑對(duì)象集中的故障鏈路鏈接的故障設(shè)備確定為所述故障區(qū)域的 故障根源。
12、 如權(quán)利要求IO所述的裝置,其特征在于,所述故障區(qū)域確定模塊包括 故障集確定子模塊,用于根據(jù)輪詢結(jié)果,確定由所有故障對(duì)象組成的故障集;故障區(qū)域確定子模塊,用于從所述故障集中,將相互之間存在連接關(guān)系的 故障對(duì)象確定為同一個(gè)故障區(qū)域。
13、 如權(quán)利要求12所述的裝置,其特征在于,所述故障集確定子模塊包括 故障處理單元,用于根據(jù)輪詢結(jié)果,將不可達(dá)設(shè)備和/或不通鏈路作為故障對(duì)象存放于告警集中;對(duì)象調(diào)度單元,用于將所述告警集中的所有故障對(duì)象存》文在未處理對(duì)象區(qū), 并將所述對(duì)象的狀態(tài)標(biāo)識(shí)為故障,將所述告警集之外的其他對(duì)象存放在其他對(duì) 象區(qū),并將所述對(duì)象的狀態(tài)標(biāo)識(shí)為未知;從未處理對(duì)象區(qū)中提取當(dāng)前對(duì)象,如 果所述當(dāng)前對(duì)象的狀態(tài)為故障,則從所述其他對(duì)象區(qū)中提取與所述當(dāng)前對(duì)象有 鏈接的所有對(duì)象,并將這些對(duì)象存放在未處理對(duì)象區(qū),同時(shí)將所述當(dāng)前對(duì)象存 放在已處理對(duì)象區(qū);如果所述當(dāng)前對(duì)象的狀態(tài)為未知,則重新測(cè)試所述當(dāng)前對(duì) 象的狀態(tài),如果狀態(tài)為不可達(dá)或不通,則將所述當(dāng)前對(duì)象存放在未處理對(duì)象區(qū), 并將所述當(dāng)前對(duì)象的狀態(tài)更改為故障,否則,將所述當(dāng)前對(duì)象存放在已處理對(duì) 象區(qū);如果未處理對(duì)象區(qū)不為空,將所述未處理對(duì)象區(qū)中的下一個(gè)對(duì)象作為當(dāng) 前對(duì)象,并返回執(zhí)行所述從未處理對(duì)象區(qū)中提取當(dāng)前對(duì)象的操作,直到未處理 對(duì)象區(qū)為空;故障集確定單元,用于在未處理對(duì)象區(qū)為空時(shí),將所述已處理對(duì)象區(qū)中的故障對(duì)象確定為故障集。
14、 如權(quán)利要求13所述的裝置,其特征在于,所述未處理對(duì)象區(qū)、已處理 對(duì)象區(qū)和其他對(duì)象區(qū)為堆?;蜴湵砘虺褩:玩湵碇獾钠渌问降拇鎯?chǔ)單 元。
15、 如權(quán)利要求13所述的裝置,其特征在于,所述故障處理單元進(jìn)一步用 于將所述不可達(dá)設(shè)備和/或不通鏈路上報(bào)給所述告警模塊;所述告警模塊進(jìn)一步用于在對(duì)區(qū)域不可達(dá)進(jìn)行告警之前,對(duì)所述不可達(dá)設(shè) 備和/或不通鏈路進(jìn)行告警。
16、 如權(quán)利要求15所述的裝置,其特征在于,所述告警模塊進(jìn)一步用于將 所述不可達(dá)設(shè)備的告警和/或所述不通鏈路的告警與所述區(qū)域不可達(dá)的告警進(jìn) 行故障關(guān)聯(lián)。
全文摘要
本發(fā)明公開了一種網(wǎng)絡(luò)故障根源的確定方法及分析裝置。其中,方法包括對(duì)網(wǎng)絡(luò)中包括設(shè)備和鏈路的被監(jiān)控對(duì)象進(jìn)行故障輪詢;根據(jù)輪詢結(jié)果,將相互之間存在連接關(guān)系的故障對(duì)象確定為同一個(gè)故障區(qū)域;從所確定的故障區(qū)域中,根據(jù)每個(gè)故障對(duì)象與其它對(duì)象的連接關(guān)系,確定所述故障區(qū)域的故障根源。本發(fā)明所公開的技術(shù)方案,能夠定位引起網(wǎng)絡(luò)故障的故障根源,避免不必要的告警。
文檔編號(hào)H04L12/26GK101252477SQ200810102858
公開日2008年8月27日 申請(qǐng)日期2008年3月27日 優(yōu)先權(quán)日2008年3月27日
發(fā)明者丁文濤 申請(qǐng)人:杭州華三通信技術(shù)有限公司