專利名稱:設備故障的檢測處理方法、裝置和網(wǎng)絡設備的制作方法
技術領域:
本發(fā)明涉及通信技術,尤其涉及一種設備故障的檢測處理方法、裝置和網(wǎng)絡設備。
背景技術:
彈性分組環(huán)(Resilient Packet Ring ;以下簡稱RPR)作為一種新型的介質(zhì)接 入控制(Media Access Control ;以下簡稱MAC)協(xié)議,具有同步數(shù)字體系(Synchronous Digital Hierarchy ;以下簡稱SDH)/同步光網(wǎng)絡(Synchronous Optical Network;以下 簡稱S0NET)環(huán)網(wǎng)的快速恢復能力和以太網(wǎng)的帶寬使用的有效性。其集IP的智能化、以太 網(wǎng)的經(jīng)濟性和光纖環(huán)網(wǎng)的高帶寬效率、可靠性于一體,為寬帶IP城域網(wǎng)運營商提供了良好 的組網(wǎng)方案,使得運營商在城域網(wǎng)內(nèi)以低成本提供電信級的服務成為可能,在提供類似SDH 級網(wǎng)絡可靠性的同時降低了傳送費用。圖1為現(xiàn)有技術中RH 環(huán)網(wǎng)的結構示意圖,圖2為現(xiàn) 有技術中RPR環(huán)網(wǎng)的雙環(huán)簡化結構示意圖,如圖1和圖2所示,圖中包括6個RPR站點,即 S1-S6,相鄰的RPR站點間通過RPR接口連接,以形成一個環(huán)狀網(wǎng)絡。每個RPR接口均對應 接收與發(fā)送線路,因此形成圖1中所示的可雙向傳輸?shù)腜RP環(huán)網(wǎng)。其中,LAN1、LAN2...LAN6 表示與各RH 環(huán)上站點互聯(lián)的內(nèi)部網(wǎng)絡,其通過RH 環(huán)網(wǎng)建立相互的通訊。圖3為現(xiàn)有技術中RH 環(huán)網(wǎng)的開環(huán)示意圖一,如圖3所示,當RPR站點S5和S4之 間的兩個連接(link)均斷開時,由于S5和S4之間無法傳遞任何數(shù)據(jù),則對于S5而言,無法 從環(huán)0收到任何站點的拓撲保護(Topology and Protection ;以下簡稱TP)幀,同時S5從 環(huán)0發(fā)送的TP幀中指示其環(huán)1發(fā)生故障。對于S4而言無法從環(huán)1收到任何站點的TP幀, 同時S4從環(huán)1發(fā)送的TP幀中指示其環(huán)0發(fā)生故障。對于S1而言,無法從環(huán)0收到S2-S4 的TP幀,同時無法從環(huán)1收到S6-S5的TP幀,其余站點類似S1的行為。此時,環(huán)上所有站 點均能檢測到目前環(huán)網(wǎng)上存在6個站點,且當前處于開環(huán)模式,且故障發(fā)生在S5和S4之 間,且各站點的拓撲表均和實際的物理拓撲一致,因此在這種模式下整網(wǎng)通訊正常。圖4為 現(xiàn)有技術中RH 環(huán)網(wǎng)的開環(huán)示意圖二,如圖4所示,當S5和S4之間只有一個link斷開時, 各個站點的行為與上述圖2的情況類似,此處不再贅述。此時,只有S5才能感知link斷開 而S4認為link是完好的,所以在這種情況下S5、S4在標準中定義其應遵循以下規(guī)則所 有期望經(jīng)過S5- > S4這一 link的其它站點的TP幀在S5站點中將被過濾丟棄;只有S5本 身的TP幀允許經(jīng)過該鏈路發(fā)送給S4 ;當S4檢測到S5發(fā)來的TP幀指示S4-S5之間的線路 (span)發(fā)生故障后,S4只接收S5的TP幀而不轉發(fā)S5的TP幀,即站點S3從環(huán)1方向看不 到S5的存在。在這種狀態(tài)下,由各站點的拓撲表可以獲知各站點的站點數(shù)、拓撲狀態(tài)仍一 致,即此時數(shù)據(jù)通訊處于正常狀態(tài)。由上可知,在現(xiàn)有的RPR標準協(xié)議中已經(jīng)定義了比較完善的機制來應對各種情況 的故障事件,即只要各個站點能正常響應,則整個環(huán)網(wǎng)可以處于正常的工作模式。但是由于 設備在使用過程中因老化、使用環(huán)境等因素影響會出現(xiàn)一些硬件損壞的故障,現(xiàn)有技術中 對于上述情況下的故障,通常只配置冗余的設備,當檢測到一臺設備發(fā)生故障時啟用另一 臺備份設備,這種解決方法無疑導致成本的增加。另外當碰到設備出現(xiàn)如某個站點只收發(fā)報文但無法轉發(fā)報文或只轉發(fā)報文而無法收發(fā)報文的情況時,即使采用冗余備份也無法檢 測出問題的存在并及時解決該問題。即現(xiàn)有技術中的RPR標準無法覆蓋到這些故障,使得 網(wǎng)絡中其他正常設備之間的通訊也受到影響,最終導致整個RH 環(huán)網(wǎng)無法正常通訊。
發(fā)明內(nèi)容
本發(fā)明提供一種設備故障的檢測處理方法、裝置和網(wǎng)絡設備,用以解決現(xiàn)有技術 中無法對RH 環(huán)網(wǎng)中出現(xiàn)的一些故障進行準確檢測而導致的通訊異常,實現(xiàn)對RH 環(huán)網(wǎng)中 的設備故障進行檢測處理,及時屏蔽故障設備,使得網(wǎng)絡中其他正常設備之間的通訊不受 影響,提高環(huán)網(wǎng)中設備工作的效率。本發(fā)明提供一種設備故障的檢測處理方法,包括判斷在預設的定時時間內(nèi)是否接收到相鄰站點發(fā)送的拓撲保護幀以及是否接收 到相鄰下一站點發(fā)送的拓撲保護幀,并根據(jù)預設的檢測規(guī)則獲取檢測結果;根據(jù)所述檢測結果對出現(xiàn)故障的站點進行隔離處理。本發(fā)明提供一種設備故障的檢測處理裝置,包括檢測模塊,用于判斷在預設的定時時間內(nèi)是否接收到相鄰站點發(fā)送的拓撲保護幀 以及是否接收到相鄰下一站點發(fā)送的拓撲保護幀,并根據(jù)預設的檢測規(guī)則獲取檢測結果;隔離模塊,用于根據(jù)所述檢測結果對出現(xiàn)故障的站點進行隔離處理。本發(fā)明提供一種網(wǎng)絡設備,包括上述設備故障的檢測處理裝置。本發(fā)明的設備故障的檢測處理方法、裝置和網(wǎng)絡設備,通過判斷本地站點在預設 的定時時間內(nèi)是否接收到相鄰站點發(fā)送的TP幀,以及是否接收到相鄰下一站點發(fā)送的TP 幀,根據(jù)預設的檢測規(guī)則獲取檢測結果,并根據(jù)檢測結果對出現(xiàn)故障的站點進行隔離處理; 本實施例解決了現(xiàn)有技術中無法對RH 環(huán)網(wǎng)中出現(xiàn)的一些故障進行準確檢測而導致的通 訊異常,實現(xiàn)了對RH 環(huán)網(wǎng)中的設備故障進行檢測處理,及時屏蔽故障設備,使得網(wǎng)絡中其 他正常設備之間的通訊不受影響,提高了環(huán)網(wǎng)中各設備工作的效率。
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn) 有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā) 明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。圖1為現(xiàn)有技術中RH 環(huán)網(wǎng)的結構示意圖;圖2為現(xiàn)有技術中RH 環(huán)網(wǎng)的雙環(huán)簡化結構示意圖;圖3為現(xiàn)有技術中RPR環(huán)網(wǎng)的開環(huán)示意圖一;圖4為現(xiàn)有技術中RH 環(huán)網(wǎng)的開環(huán)示意圖二;圖5為本發(fā)明設備故障的檢測處理方法實施例一的流程圖;圖6為本發(fā)明設備故障的檢測處理方法實施例二的流程圖;圖7為本發(fā)明設備故障的檢測處理裝置實施例一的結構示意;圖8為本發(fā)明設備故障的檢測處理裝置實施例二的結構示意。
具體實施例方式為使本發(fā)明實施例的目的、技術方案和優(yōu)點更加清楚,下面將結合本發(fā)明實施例 中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是 本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員 在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。為了更清楚地說明本發(fā)明的技術方案,以下先對RH 環(huán)網(wǎng)中的一些概念進行解 釋,具體可以參見圖1和圖2。其中,link表示RPR站點之間每個方向的連接。span為RPR 環(huán)網(wǎng)中相鄰兩站點間的部分,由一對互為相反方向傳輸?shù)膯蜗騦ink組成。每一個RH 站點 均與其它兩個RPR站點互聯(lián),因此對應有兩個span,通常將這兩個span按方位區(qū)分為西線 路(west span)和東線路(east span)。例如對于圖2中的S2而言,S2與S1互聯(lián)的span 對于S2稱為west span,對于SI則稱為east span, S2與S3互聯(lián)的span對于S2稱為east span,對于S3則稱為west span。邊緣(edge)表示不能正常傳送數(shù)據(jù)的span,也是本文 中描述的故障狀態(tài)。與本站點相鄰的站點稱為本站點的鄰居,鄰居有左右之分,分別對應 ringletO (環(huán)0)和ringlet (環(huán)1),例如圖2中S1的左鄰居是S0,右鄰居是S2。當處于網(wǎng) 絡邊緣設備時,可能只有左鄰居或者只有右鄰居;當只有兩臺設備組網(wǎng)時,左右鄰居將是同 一臺設備。TP幀為RH 環(huán)網(wǎng)中用于拓撲發(fā)現(xiàn)與保護的交換報文,其使得環(huán)網(wǎng)中各站點設備能 夠通過TP幀發(fā)現(xiàn)其它設備以及其它設備當前連接的狀態(tài)形成整網(wǎng)的拓撲表,用于后續(xù)的 數(shù)據(jù)傳輸。其中TP幀的主要內(nèi)容如下
MSBLSB
權利要求
一種設備故障的檢測處理方法,其特征在于,包括判斷在預設的定時時間內(nèi)是否接收到相鄰站點發(fā)送的拓撲保護幀以及是否接收到相鄰下一站點發(fā)送的拓撲保護幀,并根據(jù)預設的檢測規(guī)則獲取檢測結果;根據(jù)所述檢測結果對出現(xiàn)故障的站點進行隔離處理。
2.根據(jù)權利要求1所述的方法,其特征在于,所述判斷在預設的定時時間內(nèi)是否接收 到相鄰站點發(fā)送的拓撲保護幀以及是否接收到相鄰下一站點發(fā)送的拓撲保護幀,并根據(jù)預 設的檢測規(guī)則獲取檢測結果包括判斷在預設的定時時間內(nèi)是否接收到相鄰站點發(fā)送的拓撲保護幀以及是否接收到相 鄰下一站點發(fā)送的拓撲保護幀,所述相鄰下一站點為所述相鄰站點的下一跳對應的站點;當與所述相鄰站點相連的物理連接正常時,在所述預設的定時時間內(nèi)未接收到所述相 鄰站點發(fā)送的拓撲保護幀時,判定所述相鄰站點為出現(xiàn)故障的站點; 和/或,當在所述預設的定時時間內(nèi)接收到所述相鄰站點發(fā)送的拓撲保護幀,且所述拓撲保護 幀指示所述相鄰站點存在下一跳,且在所述預設的定時時間內(nèi)在同一環(huán)上未接收到所述相 鄰下一站點發(fā)送的拓撲保護幀時,判定所述相鄰站點為出現(xiàn)故障的站點。
3.根據(jù)權利要求2所述的方法,其特征在于,所述根據(jù)所述檢測結果對出現(xiàn)故障的站 點進行隔離處理包括由出現(xiàn)故障的站點的鄰居站點向環(huán)網(wǎng)中的各站點發(fā)送連接異常的拓撲保護幀; 若在所述定時時間內(nèi)未接收到所述相鄰站點發(fā)送的拓撲保護幀,則將與所述出現(xiàn)故障 的站點互聯(lián)的連接的狀態(tài)設置為鄰居錯誤的信號失效狀態(tài); 和/或,若在所述定時時間內(nèi)未接收到所述相鄰下一站點發(fā)送的拓撲保護幀,則將與所述出現(xiàn) 故障的站點互聯(lián)的連接的狀態(tài)設置為鄰居下一跳錯誤的信號失效狀態(tài)。
4.根據(jù)權利要求3所述的方法,其特征在于,在所述根據(jù)所述檢測結果對出現(xiàn)故障的 站點進行隔離處理之后,還包括當與所述出現(xiàn)故障的站點互聯(lián)的連接的狀態(tài)為所述鄰居錯誤的信號失效狀態(tài),且接收 到所述出現(xiàn)故障的站點發(fā)送的拓撲保護幀時,將所述出現(xiàn)故障的站點的狀態(tài)設置為實際的 物理狀態(tài); 和/或,當與所述出現(xiàn)故障的站點互聯(lián)的連接的狀態(tài)為所述鄰居下一跳錯誤的信號失效狀態(tài), 且接收到所述出現(xiàn)故障的站點的下一跳對應的站點發(fā)送的拓撲保護幀時,將所述出現(xiàn)故障 的站點的狀態(tài)設置為實際的物理狀態(tài); 和/或,當在所述出現(xiàn)故障的站點的線路上檢測到真實的信號失效事件和/或用戶強制保護 事件時,將所述出現(xiàn)故障的站點的狀態(tài)設置為實際的物理狀態(tài)。
5.根據(jù)權利要求1所述的方法,其特征在于,在所述判斷在預設的定時時間內(nèi)是否接 收到相鄰站點發(fā)送的拓撲保護幀以及是否接收到相鄰下一站點發(fā)送的拓撲保護幀之前,還 包括根據(jù)拓撲表的狀態(tài)啟動左鄰居對應的拓撲保護幀接收定時器和/或右鄰居對應的拓撲保護幀接收定時器。
6.根據(jù)權利要求5所述的方法,其特征在于,還包括根據(jù)所述相鄰站點發(fā)送的拓撲保護幀的接收情況啟動鄰居下一跳對應的拓撲保護幀 接收定時器。
7.一種設備故障的檢測處理裝置,其特征在于,包括檢測模塊,用于判斷在預設的定時時間內(nèi)是否接收到相鄰站點發(fā)送的拓撲保護幀以及 是否接收到相鄰下一站點發(fā)送的拓撲保護幀,并根據(jù)預設的檢測規(guī)則獲取檢測結果;隔離模塊,用于根據(jù)所述檢測結果對出現(xiàn)故障的站點進行隔離處理。
8.根據(jù)權利要求7所述的裝置,其特征在于,所述檢測模塊包括判斷單元,用于判斷在預設的定時時間內(nèi)是否接收到相鄰站點發(fā)送的拓撲保護幀以及 是否接收到相鄰下一站點發(fā)送的拓撲保護幀,所述相鄰下一站點為所述相鄰站點的下一跳 對應的站點;第一判定單元,用于當與所述相鄰站點相連的物理連接正常時,在所述預設的定時時 間內(nèi)未接收到所述相鄰站點發(fā)送的拓撲保護幀時,判定所述相鄰站點為出現(xiàn)故障的站點;和/或,第二判定單元,用于當在所述預設的定時時間內(nèi)接收到所述相鄰站點發(fā)送的拓撲保護 幀,且所述拓撲保護幀指示所述相鄰站點存在下一跳,且在所述預設的定時時間內(nèi)在同一 環(huán)上未接收到所述相鄰下一站點發(fā)送的拓撲保護幀時,判定所述相鄰站點為出現(xiàn)故障的站點o
9.根據(jù)權利要求8所述的裝置,其特征在于,所述隔離模塊包括發(fā)送單元,用于由出現(xiàn)故障的站點的鄰居站點向環(huán)網(wǎng)中的各站點發(fā)送連接異常的拓撲 保護幀;第一設置單元,用于若在所述定時時間內(nèi)未接收到所述相鄰站點發(fā)送的拓撲保護幀, 則將與所述出現(xiàn)故障的站點互聯(lián)的連接的狀態(tài)設置為鄰居錯誤的信號失效狀態(tài);和/或,第二設置單元,用于若在所述定時時間內(nèi)未接收到所述相鄰下一站點發(fā)送的拓撲保 護幀,則將與所述出現(xiàn)故障的站點互聯(lián)的連接的狀態(tài)設置為鄰居下一跳錯誤的信號失效狀 態(tài)。
10.根據(jù)權利要求9所述的裝置,其特征在于,還包括恢復模塊,用于在所述根據(jù)所述檢測結果對出現(xiàn)故障的站點進行隔離處理之后,當與 所述出現(xiàn)故障的站點互聯(lián)的連接的狀態(tài)為所述鄰居錯誤的信號失效狀態(tài),且接收到所述出 現(xiàn)故障的站點發(fā)送的拓撲保護幀時,將所述出現(xiàn)故障的站點的狀態(tài)設置為實際的物理狀 態(tài);和/或,當與所述出現(xiàn)故障的站點互聯(lián)的連接的狀態(tài)為所述鄰居下一跳錯誤的信號失 效狀態(tài),且接收到所述出現(xiàn)故障的站點的下一跳對應的站點發(fā)送的拓撲保護幀時,將所述 出現(xiàn)故障的站點的狀態(tài)設置為實際的物理狀態(tài);和/或,當在所述出現(xiàn)故障的站點的線路 上檢測到真實的信號失效事件和/或用戶強制保護事件時,將所述出現(xiàn)故障的站點的狀態(tài) 設置為實際的物理狀態(tài)。
11.根據(jù)權利要求7所述的裝置,其特征在于,還包括第一啟動模塊,用于在所述判斷在預設的定時時間內(nèi)是否接收到相鄰站點發(fā)送的拓撲保護幀以及是否接收到相鄰下一站點發(fā)送的拓撲保護幀之前,根據(jù)拓撲表的狀態(tài)啟動左鄰 居對應的拓撲保護幀接收定時器和/或右鄰居對應的拓撲保護幀接收定時器。
12.根據(jù)權利要求11所述的裝置,其特征在于,還包括第二啟動模塊,用于根據(jù)所述相鄰站點發(fā)送的拓撲保護幀的接收情況啟動鄰居下一跳 對應的拓撲保護幀接收定時器。
13.—種網(wǎng)絡設備,其特征在于,包括上述權利要求7-12中任一項所述的設備故障的 檢測處理裝置。
全文摘要
本發(fā)明提供一種設備故障的檢測處理方法、裝置和網(wǎng)絡設備,其中方法包括判斷在預設的定時時間內(nèi)是否接收到相鄰站點發(fā)送的拓撲保護幀以及是否接收到相鄰下一站點發(fā)送的拓撲保護幀,并根據(jù)預設的檢測規(guī)則獲取檢測結果;根據(jù)所述檢測結果對出現(xiàn)故障的站點進行隔離處理。裝置包括檢測模塊和隔離模塊。本發(fā)明提供的網(wǎng)絡設備包括設備故障的檢測處理裝置。本發(fā)明解決了現(xiàn)有技術中無法對RPR環(huán)網(wǎng)中出現(xiàn)的一些故障進行準確檢測而導致的通訊異常,實現(xiàn)了對RPR環(huán)網(wǎng)中的設備故障進行檢測處理,及時屏蔽故障設備,使得網(wǎng)絡中其他正常設備之間的通訊不受影響,提高了環(huán)網(wǎng)中各設備工作的效率。
文檔編號H04L12/26GK101980478SQ20101051211
公開日2011年2月23日 申請日期2010年10月13日 優(yōu)先權日2010年10月13日
發(fā)明者劉忠東, 吳航, 楊紅飛, 陳宏濤 申請人:北京星網(wǎng)銳捷網(wǎng)絡技術有限公司