一種鏈路聚合控制協(xié)議的優(yōu)雅重啟方法

文檔序號：7925632閱讀：281來源：國知局

專利名稱：一種鏈路聚合控制協(xié)議的優(yōu)雅重啟方法
技術領域：
本發(fā)明屬于數(shù)據(jù)通信領域，具體涉及一種在二層網(wǎng)絡設備中鏈路聚合控制協(xié)議(LACP， Link Aggregation Control Protocol)的優(yōu)雅重啟(GR， Graceful Restart)方法。
背景技術：
隨著網(wǎng)絡的發(fā)展，用戶對于網(wǎng)絡的可靠性提出了越來越高的要求，不間斷轉(zhuǎn)發(fā)(NSF， None Stop Forwarding)是一項重要的高可靠性(HA， High Availability)技術，保證在網(wǎng)絡設備的控制層面出現(xiàn)故障時，數(shù)據(jù)轉(zhuǎn)發(fā)仍然正常執(zhí)行，從而保護網(wǎng)絡上關鍵業(yè)務不受影響。
不間斷轉(zhuǎn)發(fā)指在網(wǎng)絡設備控制層面故障過程中，數(shù)據(jù)轉(zhuǎn)發(fā)不間斷地正常執(zhí)行。通常情況下，路由器故障后，其路由協(xié)議層面的鄰居會檢測到它們之間的鄰居關系斷掉，過一段時間后再次建立，這個過程稱為鄰居關系震蕩。
為了實現(xiàn)不間斷轉(zhuǎn)發(fā)，需要路由協(xié)議擴展支持GR功能，可以說GR是實現(xiàn)不間斷轉(zhuǎn)發(fā)的重要組成部分。
圖l是現(xiàn)有技術中接收狀態(tài)機的流程圖，包括以下步驟
步驟101:接收狀態(tài)機接收到開始事件時，狀態(tài)遷移到初始化狀態(tài)，在該狀態(tài)中進行狀態(tài)機參數(shù)的初始化，初始化的參數(shù)包括端口選項變量，端口刪除標記，端口狀態(tài)字段的超時位，然后狀態(tài)無條件遷移到端口 DISABLE狀態(tài)；
步驟102:接收狀態(tài)機接收到結束事件或者端口 D0WN事件，狀態(tài)遷移到端口 DISABLE狀態(tài)，設置對端端口狀態(tài)變量的同步位為FALSE;
步驟103:接收狀態(tài)機在端口 DISABLE狀態(tài)時，接收到端口刪除事件，狀態(tài)遷移到初始化狀態(tài)，本步驟執(zhí)行的動作和步驟IOI中的動作一樣；
步驟104:接收狀態(tài)機在端口 DISABLE狀態(tài)，接收到端口 UP和端口全雙工消息時，狀態(tài) 遷移到超時狀態(tài)；本步驟中執(zhí)行的動作如下
設置對端端口狀態(tài)變量的同步位為FALSE;
設置對端端口狀態(tài)變量的LACP超時字段為短超時；
啟動接收狀態(tài)機的接收定時器，定時器時間設置為短超時；
本地端口端口狀態(tài)變量的超時字段設置為FALSE;
步驟105:接收狀態(tài)機在端口 DISABLE狀態(tài)時接收到了端口半雙工事件，狀態(tài)遷移到LACP DISABLE狀態(tài)，本步驟中執(zhí)行的動作如下設置端口選擇變量為FALSE; 用缺省值記錄PDU變量；設置對端端口狀態(tài)變量的可聚合位為FALSE; 設置本地端口狀態(tài)變量的超時位設置為FALSE;
步驟106:接收狀態(tài)機在超時狀態(tài)時，接收到了LACP PDU報文，狀態(tài)遷移到當前狀態(tài)，
本步驟中執(zhí)行的動作如下更新立即發(fā)送變量；記錄LACP報文；
啟動接收定時器，超時時間由本端端口配置的超時時間決定；設置本端端口狀態(tài)變量的超時位為FALSE;
步驟107:接收狀態(tài)機在超時狀態(tài)時，接收到了接收定時器超時事件后，狀態(tài)遷移到缺
省狀態(tài)，本步驟中執(zhí)行的動作如下-
用缺省值記錄PDU;
設置本端端口狀態(tài)變量的超時位為FASLE;
步驟108:接收狀態(tài)機在缺省狀態(tài)時，接收到了 LACP PDU報文事件后，狀態(tài)遷移到當前
狀態(tài)，本步驟執(zhí)行的動作和歩驟106中的動作一樣；
步驟109:接收狀態(tài)機在當前狀態(tài)時，接收到了接收定時器超時事件后，狀態(tài)遷移到當前超時狀態(tài)，本步驟執(zhí)行的動作和步驟104中的動作一樣；
步驟110:接收狀態(tài)機在當前狀態(tài)時，接收到了 LACP PDU報文事件，狀態(tài)遷移到當前超時狀態(tài)，本步驟執(zhí)行的動作和步驟108中的動作一樣。
從上述的步驟中可以看出，接收狀態(tài)機存在以下問題和不足
在分布式設備中，如果交換機A進行了主備倒換，交換機B的端口設置了短超時，那么在3秒鐘內(nèi)交換機B接收不到交換機A發(fā)送的LACP報文，交換機B的狀態(tài)就會從當前狀態(tài)遷移到超時狀態(tài)，這樣交換機B就認為鄰居交換機A失去了聯(lián)系，進而導致轉(zhuǎn)發(fā)平面變化，最終導致轉(zhuǎn)發(fā)平面數(shù)據(jù)的丟失。
隨著交換機在網(wǎng)絡中越來越多的應用，用戶對交換機特別是核心交換機的可靠性也提出
了更高要求。但是，交換機跟路由器是有區(qū)別的，路由器是-臺三層設備，它的功能主要是完成選路，而三層交換機除了具有路由功能外，它也會進行高速的二層轉(zhuǎn)發(fā)。LACP是交換機設備中不可或缺的重要的二層協(xié)議，要想在核心交換機上做到NSF的高可靠性，二層轉(zhuǎn)發(fā)的保證是必不可少的。而現(xiàn)有技術都是基于三層協(xié)議的GR實現(xiàn)，尚未實現(xiàn)對于二層LACP協(xié)議的GR功能。

發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術的不足，提供一種鏈路聚合控制協(xié)議的優(yōu)雅重啟(GR) 方法。該方法可使數(shù)據(jù)設備(如交換機設備等)中運行的LACP在控制層面出現(xiàn)故障時，數(shù)據(jù) 轉(zhuǎn)發(fā)仍然能正常進行，可實現(xiàn)二層不間斷轉(zhuǎn)發(fā)，從而保障網(wǎng)絡上關鍵業(yè)務不受影響。
為解決上述技術問題，本發(fā)明是通過以下技術方案實現(xiàn)的
一種鏈路聚合控制協(xié)議的優(yōu)雅重啟方法，在第一數(shù)據(jù)設備和第二數(shù)據(jù)設備的接收狀態(tài)機上各增加一個主備切換狀態(tài)，
當?shù)谝粩?shù)據(jù)設備發(fā)生主備切換時，發(fā)送帶有切換信息的LACP PDU報文(即擴充后的LACP PDU報文)給第二數(shù)據(jù)設備；第二數(shù)據(jù)設備收到帶有切換信息的LACP PDU報文后，接收狀態(tài) 機從當前狀態(tài)(current)遷移到主備切換狀態(tài)(switchover),同時啟動其切換定時器，設定切換需要時間，開始計時。
在上述方案中，若第一數(shù)據(jù)設備在所述切換需要時間內(nèi)向第二數(shù)據(jù)設備發(fā)送LACP PDU 報文，則第二數(shù)據(jù)設備接收到該報文時，其接收狀態(tài)機的切換定時器復位，第二數(shù)據(jù)設備進入正常工作流程；若第一數(shù)據(jù)設備在所述切換需要時間內(nèi)未向第二數(shù)據(jù)設備發(fā)送LACP PDU報文，則第二數(shù)據(jù)設備接收狀態(tài)機的切換定時器超時，接收狀態(tài)機的狀態(tài)遷移到超時狀態(tài) (EXPIRED),第一數(shù)據(jù)設備和第二數(shù)據(jù)設備的鄰居關系不再保持。
所述帶有切換信息的LACP PDU報文的報文格式是在所述LACP PDU報文的報文格式基礎上增加了三個字段，分別是字段類型、字段長度和切換需要時間。
所述切換需要時間是30 200秒。
優(yōu)選地，所述切換需要時間是60秒。
使用本發(fā)明的鏈路聚合控制協(xié)議的優(yōu)雅重啟方法具有以下有益效果改進后的數(shù)據(jù)設備(如交換機設備)在進行主備切換時，不影響二層流量轉(zhuǎn)發(fā)過程，提高了數(shù)據(jù)設備(如交換機設備)的可靠性，增強了網(wǎng)絡穩(wěn)定性；在原來接收狀態(tài)機基礎上只增加一個主備切換狀態(tài)和擴充LACP PDU報文，就能實現(xiàn)LACP的GR功能，具有實際應用意義。

圖1是現(xiàn)有技術中接收狀態(tài)機的流程圖2是本發(fā)明中交換機設備間的通信示意圖3是本發(fā)明中數(shù)據(jù)設備的接收狀態(tài)機的流程圖4是本發(fā)明中擴充后的LACP PDU報文的字段內(nèi)容圖。
具體實施例方式
為了更好地理解本發(fā)明，下面結合附圖和具體實施例對本發(fā)明作進一步地描述。本發(fā)明數(shù)據(jù)設備是在原有的基礎上增加主備切換狀態(tài)，并修改LACPPDU報文，在主備切換狀態(tài)(switchover)中增加了切換定時器動作。如現(xiàn)有兩臺可以進行主備切換的數(shù)據(jù)設備(如交換機設備a和交換機設備b)，如圖2所示，交換機設備a與交換機設備b之間進行通信。當交換機設備a發(fā)生主備切換時，就自動觸發(fā)其報文發(fā)送機制，發(fā)送擴充后的LACP PDU報文告之交換機設備b，說明其需要切換；當交換機設備b收到擴充的LACP PDU后，其接收狀態(tài) 機從當前狀態(tài)(current)遷移到主備切換狀態(tài)(switchover),同時啟動其切換定時器，開始計時，切換需要時間默認為6 Q秒(可手工設置，一般為30 200秒)。如果交換機設備b在6 0秒內(nèi)收到交換機設備a的LACP PDU報文，那么交換機設備b的接收狀態(tài)機由主備切換狀態(tài) 遷移到當前狀態(tài)(current),其切換定時器停止工作，計數(shù)清零；如果交換機設備b在6 O秒內(nèi)沒有收到交換機設備a的LACP PDU報文，那么交換機設備b的接收狀態(tài)機就由主備切換狀態(tài)(switchover)遷移到超時狀態(tài)(Expired),其切換定時器停止工作且計數(shù)至零，鏈路聚合 GR過程失敗，其具體狀態(tài)遷移見圖3。
請參閱圖3，該圖是本發(fā)明中數(shù)據(jù)設備的接收狀態(tài)機的流程圖，其包括如下步驟步驟201 210和步驟101 110分別對應且內(nèi)容相同，這里不再重復；步驟211:接收狀態(tài)機在當前狀態(tài)中接收到系統(tǒng)中的切換事件時，狀態(tài)遷移到切換中狀態(tài)，執(zhí)行的動作是發(fā)送帶有切換信息的LACP PDU報文；報文格式如圖4所示，是在原有的 LACP PDU報文基礎上增加三個字段，分別是TLV—type (字段類型)，Length (字段長度)和 Time (切換需要時間)，其中TLV—type=4， Length =4， Time=60 (表示默認的切換需要時間)，同時讓設備的轉(zhuǎn)發(fā)平面在切換需要時間內(nèi)保持不變；
步驟212:接收狀態(tài)機在當前狀態(tài)接收到帶有切換信息(其TLV—type為4)的LACP PDU 報文時，狀態(tài)遷移到切換狀態(tài)，啟動切換定時器，超時時間設置為報文中的切換需要時間；
歩驟213:接收狀態(tài)機在切換狀態(tài)時接收到了LACPPDU報文，狀態(tài)遷移到當前狀態(tài)，首先復位切換定時器，后續(xù)動作和步驟210—樣；
步驟214:接收狀態(tài)機在切換狀態(tài)時，接收到了切換定時器超時事件，狀態(tài)遷移到超時
狀態(tài)，其動作和步驟209中的動作一樣。
綜上所述，本發(fā)明有效地實現(xiàn)了當控制層面出現(xiàn)故障時，數(shù)據(jù)的不間斷轉(zhuǎn)發(fā)。本發(fā)明實現(xiàn)簡單，只需要增加一個主備切換狀態(tài)(switchover),因此對軟件成本增加不大，避免了代碼的大規(guī)模修改和由此引入的潛在問題，有效地提高了交換機設備的可靠性，實現(xiàn)了LACP的 GR功能。
以上所述僅為本發(fā)明的較佳實施例，并不用以限制本發(fā)明，應當指出，對于本領域的普通技術人員來說，凡是本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換或改進等，均應包含在本發(fā)明的保護范圍之內(nèi)。
權利要求
1.一種鏈路聚合控制協(xié)議的優(yōu)雅重啟方法，其特征在于，包括以下步驟第一數(shù)據(jù)設備和第二數(shù)據(jù)設備的接收狀態(tài)機上各增加一個主備切換狀態(tài)；第一數(shù)據(jù)設備發(fā)生主備切換，發(fā)送帶有切換信息的LACP PDU報文給第二數(shù)據(jù)設備；第二數(shù)據(jù)設備收到帶有切換信息的LACP PDU報文后，接收狀態(tài)機從當前狀態(tài)遷移到主備切換狀態(tài)，同時啟動切換定時器，設定切換需要時間，開始計時。
2. 根據(jù)權利要求1所述的鏈路聚合控制協(xié)議的優(yōu)雅重啟方法，其特征在于，還包括若第一數(shù)據(jù)設備在所述切換需要時間內(nèi)向第二數(shù)據(jù)設備發(fā)送LACP PDU報文，則第二數(shù)據(jù) 設備接收到該報文時，其接收狀態(tài)機的切換定時器復位，第二數(shù)據(jù)設備進入正常工作流程；若第一數(shù)據(jù)設備在所述切換需要時間內(nèi)未向第二數(shù)據(jù)設備發(fā)送LACP PDU報文，則第二數(shù) 據(jù)設備接收狀態(tài)機的切換定時器超時，接收狀態(tài)機的狀態(tài)遷移到超時狀態(tài)，第一數(shù)據(jù)設備和第二數(shù)據(jù)設備的鄰居關系不再保持。
3. 根據(jù)權利要求l所述的鏈路聚合控制協(xié)議的優(yōu)雅重啟方法，其特征在于，所述帶有切換信息的LACP PDU報文的報文格式是在所述LACP PDU報文的報文格式基礎上增加了三個字段，分別是字段類型、字段長度和切換需要時間。
4. 根據(jù)權利要求3所述的鏈路聚合控制協(xié)議的優(yōu)雅重啟方法，其特征在于，所述切換需要時間是30 200秒。
5. 根據(jù)權利要求4所述的鏈路聚合控制協(xié)議的優(yōu)雅重啟方法，其特征在于，所述切換需要時間是60秒。
全文摘要
一種鏈路聚合控制協(xié)議的優(yōu)雅重啟方法，在第一數(shù)據(jù)設備和第二數(shù)據(jù)設備的接收狀態(tài)機上各增加一個主備切換狀態(tài)；當?shù)谝粩?shù)據(jù)設備發(fā)生主備切換時，發(fā)送帶有切換信息的LACP PDU報文(即擴充后的LACP PDU報文)給第二數(shù)據(jù)設備；第二數(shù)據(jù)設備收到帶有切換信息的LACPPDU報文后，接收狀態(tài)機從當前狀態(tài)(current)遷移到主備切換狀態(tài)(switchover)，同時啟動其切換定時器，設定切換需要時間，開始計時。使用本發(fā)明，改進后的數(shù)據(jù)設備(如交換機設備)在進行主備切換時，不影響二層流量轉(zhuǎn)發(fā)過程，提高了數(shù)據(jù)設備(如交換機設備)的可靠性，增強了網(wǎng)絡穩(wěn)定性；在原來接收狀態(tài)機基礎上只增加一個主備切換狀態(tài)和擴充LACPPDU報文，就能實現(xiàn)LACP的GR功能，具有實際應用意義。
文檔編號H04L29/06GK101355515SQ20081021603
公開日2009年1月28日申請日期2008年9月5日優(yōu)先權日2008年9月5日
發(fā)明者崢楊, 畢小軍, 銳錢申請人:中興通訊股份有限公司

完整全部詳細技術資料下載