專利名稱:一種鏈路聚合控制協(xié)議的優(yōu)雅重啟方法
技術領域:
本發(fā)明屬于數(shù)據(jù)通信領域,具體涉及一種在二層網(wǎng)絡設備中鏈路聚合控制協(xié)議(LACP, Link Aggregation Control Protocol)的優(yōu)雅重啟(GR, Graceful Restart)方法。
背景技術:
隨著網(wǎng)絡的發(fā)展,用戶對于網(wǎng)絡的可靠性提出了越來越高的要求,不間斷轉(zhuǎn)發(fā)(NSF, None Stop Forwarding)是一項重要的高可靠性(HA, High Availability)技術,保證在網(wǎng)絡設備 的控制層面出現(xiàn)故障時,數(shù)據(jù)轉(zhuǎn)發(fā)仍然正常執(zhí)行,從而保護網(wǎng)絡上關鍵業(yè)務不受影響。
不間斷轉(zhuǎn)發(fā)指在網(wǎng)絡設備控制層面故障過程中,數(shù)據(jù)轉(zhuǎn)發(fā)不間斷地正常執(zhí)行。通常情況 下,路由器故障后,其路由協(xié)議層面的鄰居會檢測到它們之間的鄰居關系斷掉,過一段時間 后再次建立,這個過程稱為鄰居關系震蕩。
為了實現(xiàn)不間斷轉(zhuǎn)發(fā),需要路由協(xié)議擴展支持GR功能,可以說GR是實現(xiàn)不間斷轉(zhuǎn)發(fā)的 重要組成部分。
圖l是現(xiàn)有技術中接收狀態(tài)機的流程圖,包括以下步驟
步驟101:接收狀態(tài)機接收到開始事件時,狀態(tài)遷移到初始化狀態(tài),在該狀態(tài)中進行狀 態(tài)機參數(shù)的初始化,初始化的參數(shù)包括端口選項變量,端口刪除標記,端口狀態(tài)字段的超時 位,然后狀態(tài)無條件遷移到端口 DISABLE狀態(tài);
步驟102:接收狀態(tài)機接收到結束事件或者端口 D0WN事件,狀態(tài)遷移到端口 DISABLE狀 態(tài),設置對端端口狀態(tài)變量的同步位為FALSE;
步驟103:接收狀態(tài)機在端口 DISABLE狀態(tài)時,接收到端口刪除事件,狀態(tài)遷移到初始 化狀態(tài),本步驟執(zhí)行的動作和步驟IOI中的動作一樣;
步驟104:接收狀態(tài)機在端口 DISABLE狀態(tài),接收到端口 UP和端口全雙工消息時,狀態(tài) 遷移到超時狀態(tài);本步驟中執(zhí)行的動作如下
設置對端端口狀態(tài)變量的同步位為FALSE;
設置對端端口狀態(tài)變量的LACP超時字段為短超時;
啟動接收狀態(tài)機的接收定時器,定時器時間設置為短超時;
本地端口端口狀態(tài)變量的超時字段設置為FALSE;
步驟105:接收狀態(tài)機在端口 DISABLE狀態(tài)時接收到了端口半雙工事件,狀態(tài)遷移到LACP DISABLE狀態(tài),本步驟中執(zhí)行的動作如下 設置端口選擇變量為FALSE; 用缺省值記錄PDU變量; 設置對端端口狀態(tài)變量的可聚合位為FALSE; 設置本地端口狀態(tài)變量的超時位設置為FALSE;
步驟106:接收狀態(tài)機在超時狀態(tài)時,接收到了LACP PDU報文,狀態(tài)遷移到當前狀態(tài),
本步驟中執(zhí)行的動作如下 更新立即發(fā)送變量; 記錄LACP報文;
啟動接收定時器,超時時間由本端端口配置的超時時間決定; 設置本端端口狀態(tài)變量的超時位為FALSE;
步驟107:接收狀態(tài)機在超時狀態(tài)時,接收到了接收定時器超時事件后,狀態(tài)遷移到缺
省狀態(tài),本步驟中執(zhí)行的動作如下-
用缺省值記錄PDU;
設置本端端口狀態(tài)變量的超時位為FASLE;
步驟108:接收狀態(tài)機在缺省狀態(tài)時,接收到了 LACP PDU報文事件后,狀態(tài)遷移到當前
狀態(tài),本步驟執(zhí)行的動作和歩驟106中的動作一樣;
步驟109:接收狀態(tài)機在當前狀態(tài)時,接收到了接收定時器超時事件后,狀態(tài)遷移到當 前超時狀態(tài),本步驟執(zhí)行的動作和步驟104中的動作一樣;
步驟110:接收狀態(tài)機在當前狀態(tài)時,接收到了 LACP PDU報文事件,狀態(tài)遷移到當前超 時狀態(tài),本步驟執(zhí)行的動作和步驟108中的動作一樣。
從上述的步驟中可以看出,接收狀態(tài)機存在以下問題和不足
在分布式設備中,如果交換機A進行了主備倒換,交換機B的端口設置了短超時,那么 在3秒鐘內(nèi)交換機B接收不到交換機A發(fā)送的LACP報文,交換機B的狀態(tài)就會從當前狀態(tài)遷 移到超時狀態(tài),這樣交換機B就認為鄰居交換機A失去了聯(lián)系,進而導致轉(zhuǎn)發(fā)平面變化,最 終導致轉(zhuǎn)發(fā)平面數(shù)據(jù)的丟失。
隨著交換機在網(wǎng)絡中越來越多的應用,用戶對交換機特別是核心交換機的可靠性也提出
了更高要求。但是,交換機跟路由器是有區(qū)別的,路由器是-臺三層設備,它的功能主要是 完成選路,而三層交換機除了具有路由功能外,它也會進行高速的二層轉(zhuǎn)發(fā)。LACP是交換機 設備中不可或缺的重要的二層協(xié)議,要想在核心交換機上做到NSF的高可靠性,二層轉(zhuǎn)發(fā)的 保證是必不可少的。而現(xiàn)有技術都是基于三層協(xié)議的GR實現(xiàn),尚未實現(xiàn)對于二層LACP協(xié)議 的GR功能。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術的不足,提供一種鏈路聚合控制協(xié)議的優(yōu)雅重啟(GR) 方法。該方法可使數(shù)據(jù)設備(如交換機設備等)中運行的LACP在控制層面出現(xiàn)故障時,數(shù)據(jù) 轉(zhuǎn)發(fā)仍然能正常進行,可實現(xiàn)二層不間斷轉(zhuǎn)發(fā),從而保障網(wǎng)絡上關鍵業(yè)務不受影響。
為解決上述技術問題,本發(fā)明是通過以下技術方案實現(xiàn)的
一種鏈路聚合控制協(xié)議的優(yōu)雅重啟方法,在第一數(shù)據(jù)設備和第二數(shù)據(jù)設備的接收狀態(tài)機 上各增加一個主備切換狀態(tài),
當?shù)谝粩?shù)據(jù)設備發(fā)生主備切換時,發(fā)送帶有切換信息的LACP PDU報文(即擴充后的LACP PDU報文)給第二數(shù)據(jù)設備;第二數(shù)據(jù)設備收到帶有切換信息的LACP PDU報文后,接收狀態(tài) 機從當前狀態(tài)(current)遷移到主備切換狀態(tài)(switchover),同時啟動其切換定時器,設定 切換需要時間,開始計時。
在上述方案中,若第一數(shù)據(jù)設備在所述切換需要時間內(nèi)向第二數(shù)據(jù)設備發(fā)送LACP PDU 報文,則第二數(shù)據(jù)設備接收到該報文時,其接收狀態(tài)機的切換定時器復位,第二數(shù)據(jù)設備進 入正常工作流程;若第一數(shù)據(jù)設備在所述切換需要時間內(nèi)未向第二數(shù)據(jù)設備發(fā)送LACP PDU報 文,則第二數(shù)據(jù)設備接收狀態(tài)機的切換定時器超時,接收狀態(tài)機的狀態(tài)遷移到超時狀態(tài) (EXPIRED),第一數(shù)據(jù)設備和第二數(shù)據(jù)設備的鄰居關系不再保持。
所述帶有切換信息的LACP PDU報文的報文格式是在所述LACP PDU報文的報文格式基礎 上增加了三個字段,分別是字段類型、字段長度和切換需要時間。
所述切換需要時間是30 200秒。
優(yōu)選地,所述切換需要時間是60秒。
使用本發(fā)明的鏈路聚合控制協(xié)議的優(yōu)雅重啟方法具有以下有益效果 改進后的數(shù)據(jù)設備(如交換機設備)在進行主備切換時,不影響二層流量轉(zhuǎn)發(fā)過程,提 高了數(shù)據(jù)設備(如交換機設備)的可靠性,增強了網(wǎng)絡穩(wěn)定性;在原來接收狀態(tài)機基礎上只增加一個主備切換狀態(tài)和擴充LACP PDU報文,就能實現(xiàn)LACP的GR功能,具有實際應用意義。
圖1是現(xiàn)有技術中接收狀態(tài)機的流程圖2是本發(fā)明中交換機設備間的通信示意圖3是本發(fā)明中數(shù)據(jù)設備的接收狀態(tài)機的流程圖4是本發(fā)明中擴充后的LACP PDU報文的字段內(nèi)容圖。
具體實施例方式
為了更好地理解本發(fā)明,下面結合附圖和具體實施例對本發(fā)明作進一步地描述。 本發(fā)明數(shù)據(jù)設備是在原有的基礎上增加主備切換狀態(tài),并修改LACPPDU報文,在主備切 換狀態(tài)(switchover)中增加了切換定時器動作。如現(xiàn)有兩臺可以進行主備切換的數(shù)據(jù)設備(如 交換機設備a和交換機設備b),如圖2所示,交換機設備a與交換機設備b之間進行通信。 當交換機設備a發(fā)生主備切換時,就自動觸發(fā)其報文發(fā)送機制,發(fā)送擴充后的LACP PDU報文 告之交換機設備b,說明其需要切換;當交換機設備b收到擴充的LACP PDU后,其接收狀態(tài) 機從當前狀態(tài)(current)遷移到主備切換狀態(tài)(switchover),同時啟動其切換定時器,開始計 時,切換需要時間默認為6 Q秒(可手工設置, 一般為30 200秒)。如果交換機設備b在6 0秒內(nèi)收到交換機設備a的LACP PDU報文,那么交換機設備b的接收狀態(tài)機由主備切換狀態(tài) 遷移到當前狀態(tài)(current),其切換定時器停止工作,計數(shù)清零;如果交換機設備b在6 O秒 內(nèi)沒有收到交換機設備a的LACP PDU報文,那么交換機設備b的接收狀態(tài)機就由主備切換狀 態(tài)(switchover)遷移到超時狀態(tài)(Expired),其切換定時器停止工作且計數(shù)至零,鏈路聚合 GR過程失敗,其具體狀態(tài)遷移見圖3。
請參閱圖3,該圖是本發(fā)明中數(shù)據(jù)設備的接收狀態(tài)機的流程圖,其包括如下步驟 步驟201 210和步驟101 110分別對應且內(nèi)容相同,這里不再重復; 步驟211:接收狀態(tài)機在當前狀態(tài)中接收到系統(tǒng)中的切換事件時,狀態(tài)遷移到切換中狀 態(tài),執(zhí)行的動作是發(fā)送帶有切換信息的LACP PDU報文;報文格式如圖4所示,是在原有的 LACP PDU報文基礎上增加三個字段,分別是TLV—type (字段類型),Length (字段長度)和 Time (切換需要時間),其中TLV—type=4, Length =4, Time=60 (表示默認的切換需要時間), 同時讓設備的轉(zhuǎn)發(fā)平面在切換需要時間內(nèi)保持不變;
步驟212:接收狀態(tài)機在當前狀態(tài)接收到帶有切換信息(其TLV—type為4)的LACP PDU 報文時,狀態(tài)遷移到切換狀態(tài),啟動切換定時器,超時時間設置為報文中的切換需要時間;
歩驟213:接收狀態(tài)機在切換狀態(tài)時接收到了LACPPDU報文,狀態(tài)遷移到當前狀態(tài),首 先復位切換定時器,后續(xù)動作和步驟210—樣;
步驟214:接收狀態(tài)機在切換狀態(tài)時,接收到了切換定時器超時事件,狀態(tài)遷移到超時
狀態(tài),其動作和步驟209中的動作一樣。
綜上所述,本發(fā)明有效地實現(xiàn)了當控制層面出現(xiàn)故障時,數(shù)據(jù)的不間斷轉(zhuǎn)發(fā)。本發(fā)明實 現(xiàn)簡單,只需要增加一個主備切換狀態(tài)(switchover),因此對軟件成本增加不大,避免了代 碼的大規(guī)模修改和由此引入的潛在問題,有效地提高了交換機設備的可靠性,實現(xiàn)了LACP的 GR功能。
以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,應當指出,對于本領域的普 通技術人員來說,凡是本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換或改進等,均應 包含在本發(fā)明的保護范圍之內(nèi)。
權利要求
1.一種鏈路聚合控制協(xié)議的優(yōu)雅重啟方法,其特征在于,包括以下步驟第一數(shù)據(jù)設備和第二數(shù)據(jù)設備的接收狀態(tài)機上各增加一個主備切換狀態(tài);第一數(shù)據(jù)設備發(fā)生主備切換,發(fā)送帶有切換信息的LACP PDU報文給第二數(shù)據(jù)設備;第二數(shù)據(jù)設備收到帶有切換信息的LACP PDU報文后,接收狀態(tài)機從當前狀態(tài)遷移到主備切換狀態(tài),同時啟動切換定時器,設定切換需要時間,開始計時。
2. 根據(jù)權利要求1所述的鏈路聚合控制協(xié)議的優(yōu)雅重啟方法,其特征在于,還包括若第一數(shù)據(jù)設備在所述切換需要時間內(nèi)向第二數(shù)據(jù)設備發(fā)送LACP PDU報文,則第二數(shù)據(jù) 設備接收到該報文時,其接收狀態(tài)機的切換定時器復位,第二數(shù)據(jù)設備進入正常工作流程;若第一數(shù)據(jù)設備在所述切換需要時間內(nèi)未向第二數(shù)據(jù)設備發(fā)送LACP PDU報文,則第二數(shù) 據(jù)設備接收狀態(tài)機的切換定時器超時,接收狀態(tài)機的狀態(tài)遷移到超時狀態(tài),第一數(shù)據(jù)設備和 第二數(shù)據(jù)設備的鄰居關系不再保持。
3. 根據(jù)權利要求l所述的鏈路聚合控制協(xié)議的優(yōu)雅重啟方法,其特征在于,所述帶有切 換信息的LACP PDU報文的報文格式是在所述LACP PDU報文的報文格式基礎上增加了三個字 段,分別是字段類型、字段長度和切換需要時間。
4. 根據(jù)權利要求3所述的鏈路聚合控制協(xié)議的優(yōu)雅重啟方法,其特征在于,所述切換需 要時間是30 200秒。
5. 根據(jù)權利要求4所述的鏈路聚合控制協(xié)議的優(yōu)雅重啟方法,其特征在于,所述切換需 要時間是60秒。
全文摘要
一種鏈路聚合控制協(xié)議的優(yōu)雅重啟方法,在第一數(shù)據(jù)設備和第二數(shù)據(jù)設備的接收狀態(tài)機上各增加一個主備切換狀態(tài);當?shù)谝粩?shù)據(jù)設備發(fā)生主備切換時,發(fā)送帶有切換信息的LACP PDU報文(即擴充后的LACP PDU報文)給第二數(shù)據(jù)設備;第二數(shù)據(jù)設備收到帶有切換信息的LACPPDU報文后,接收狀態(tài)機從當前狀態(tài)(current)遷移到主備切換狀態(tài)(switchover),同時啟動其切換定時器,設定切換需要時間,開始計時。使用本發(fā)明,改進后的數(shù)據(jù)設備(如交換機設備)在進行主備切換時,不影響二層流量轉(zhuǎn)發(fā)過程,提高了數(shù)據(jù)設備(如交換機設備)的可靠性,增強了網(wǎng)絡穩(wěn)定性;在原來接收狀態(tài)機基礎上只增加一個主備切換狀態(tài)和擴充LACPPDU報文,就能實現(xiàn)LACP的GR功能,具有實際應用意義。
文檔編號H04L29/06GK101355515SQ20081021603
公開日2009年1月28日 申請日期2008年9月5日 優(yōu)先權日2008年9月5日
發(fā)明者崢 楊, 畢小軍, 銳 錢 申請人:中興通訊股份有限公司