專利名稱:集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的方法及其系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種集群系統(tǒng)及其方法,特別是涉及一種集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的方法及其系統(tǒng)。
背景技術(shù):
集群服務(wù)是指通過將多臺計算機(jī)組合成一個集群系統(tǒng),每臺計算機(jī)作為集群中的一個節(jié)點(diǎn),如果其中一臺正在用于服務(wù)的主節(jié)點(diǎn)計算機(jī)出現(xiàn)故障時其他節(jié)點(diǎn)計算機(jī)可以在集群管理的控制下自動接替這臺計算機(jī)進(jìn)行服務(wù),從而提高服務(wù)的可靠性連續(xù)性。當(dāng)采用的是兩臺服務(wù)器組成的集群系統(tǒng)時,如果一臺正在提供服務(wù)的服務(wù)器出現(xiàn)故障,另一臺便會替換出現(xiàn)故障的服務(wù)器。
圖1揭露了一種兩臺服務(wù)器組成的現(xiàn)有技術(shù)集群系統(tǒng)。圖中服務(wù)器A和服務(wù)器B一起組成集群系統(tǒng)1,客戶端C3通過局域網(wǎng)交換機(jī)2連接到該集群系統(tǒng)1中。所述集群系統(tǒng)1網(wǎng)卡的IP和MAC設(shè)置如圖。L1/L2/L3/L4表示網(wǎng)線,L4為連接服務(wù)器A和服務(wù)器B的集群跳線,L3/L2分別是局域網(wǎng)交換機(jī)2連接服務(wù)器A和服務(wù)器B的網(wǎng)線,L1是客戶端C3連接局域網(wǎng)交換機(jī)2的網(wǎng)線。這里以服務(wù)器B為最開始提供服務(wù)的主節(jié)點(diǎn)服務(wù)器為例來說明雙機(jī)切換過程中客戶端C3與集群系統(tǒng)1的連接斷開與恢復(fù)的流程1)L2網(wǎng)線斷開,集群系統(tǒng)1判斷網(wǎng)絡(luò)出現(xiàn)問題,開始從服務(wù)器B切換到服務(wù)器A;2)由集群系統(tǒng)1管理控制的切換過程中,虛擬IP“192.17.120.150”從服務(wù)器B切換到服務(wù)器A,因此所述虛擬IP所對應(yīng)的MAC地址由MAC1變?yōu)榱薓AC0;3)當(dāng)服務(wù)器A的網(wǎng)卡獲得虛擬IP后,發(fā)送幾個免費(fèi)ARP來讓網(wǎng)絡(luò)中的客戶端C3更新它虛擬IP的ARP緩存,從而使得本來在物理上與服務(wù)器B連接的客戶端C在仍然請求連接相同IP的情況下可以連接到服務(wù)器A;4)當(dāng)所有集群資源切換到服務(wù)器A后,切換完成。
上述現(xiàn)有技術(shù)集群系統(tǒng)1存在技術(shù)缺陷,即在切換后可能需要等待較長的連接過程才能恢復(fù)網(wǎng)絡(luò)的連接。因?yàn)楝F(xiàn)有技術(shù)僅發(fā)送一次虛擬IP的免費(fèi)ARP到客戶端,很可能客戶端因?yàn)榫W(wǎng)絡(luò)問題收不到所述ARP而超過ARP老化時間之后才進(jìn)行網(wǎng)絡(luò)連接。比如,在所述現(xiàn)有技術(shù)集群系統(tǒng)1技術(shù)條件下,如果連接客戶端C3和局域網(wǎng)交換機(jī)2的網(wǎng)線L1斷開后再斷開L2導(dǎo)致服務(wù)器B到服務(wù)器A的切換,這時客戶端C3就得不到服務(wù)器A發(fā)送的免費(fèi)ARP。等到切換完畢,連接客戶端C3和局域網(wǎng)交換機(jī)2的網(wǎng)線L1再度連接,這時候客戶端C3中應(yīng)當(dāng)指向服務(wù)器A的ARP由于沒有更新,仍然指向服務(wù)器B。因此客戶端C3與服務(wù)器A不能夠馬上完成TCP/IP的連接,而是需要等待客戶端C3內(nèi)ARP十多分鐘的老化時間過后,才自動更新ARP,TCP/IP連接才能恢復(fù)。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是提供一種集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的方法。
本發(fā)明要解決的技術(shù)問題是還提供一種集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的系統(tǒng)。
為解決上述第一技術(shù)問題,本發(fā)明的目的是通過以下技術(shù)方案實(shí)現(xiàn)的提供一種集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的方法,包括步驟A、集群服務(wù)器切換后更新客戶端的ARP;D、判斷切換后的新集群服務(wù)器和客戶端之間是否實(shí)現(xiàn)網(wǎng)絡(luò)連接,如果是則結(jié)束,否則繼續(xù);E、判斷是否超過客戶端內(nèi)ARP的老化時間,如果是則結(jié)束,否則更新客戶端的ARP并跳到步驟D。
所述步驟D、E以及步驟A中更新客戶端的ARP步驟由新服務(wù)器執(zhí)行。
所述步驟A和E中更新客戶端的ARP步驟具體是發(fā)送虛擬IP的免費(fèi)ARP到客戶端以替換原ARP。
在另一種方案中,所述步驟D、E由所述客戶端執(zhí)行。
依據(jù)該方案,在步驟A和D之間,還包括步驟B、判斷切換后的新集群服務(wù)器和客戶端之間是否實(shí)現(xiàn)網(wǎng)絡(luò)連接,如果是則結(jié)束,否則繼續(xù);C、清除客戶端的ARP記錄。
所述步驟B是在客戶端和新服務(wù)器的網(wǎng)線連接后立即進(jìn)行。
步驟E中判斷是否超過客戶端內(nèi)ARP的老化時間的起算點(diǎn)是從所述更新客戶端APR動作起算,所述更新客戶端的ARP步驟具體是向所述新服務(wù)器發(fā)送虛擬IP的ARP請求,并返回所述ARP到客戶端以替換原ARP。
所述步驟A中的集群服務(wù)器切換步驟具體包括a1、判斷網(wǎng)絡(luò)出現(xiàn)問題,開始從原服務(wù)器到新服務(wù)器的切換;a2、切換原服務(wù)器的虛擬IP到新服務(wù)器;為解決上述第二技術(shù)問題,本發(fā)明的目的是通過以下技術(shù)方案實(shí)現(xiàn)的提供一種集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的系統(tǒng),包括互連的集群系統(tǒng)和客戶端,所述集群系統(tǒng)包括互連的至少兩個服務(wù)器,本發(fā)明還包括ARP處理模塊,用以在切換所述服務(wù)器并更新客戶端的ARP后、不超過客戶端ARP老化時間之前、以及在集群系統(tǒng)和客戶端未實(shí)現(xiàn)網(wǎng)絡(luò)連接時,繼續(xù)更新客戶端的ARP。
所述ARP處理模塊設(shè)置在新服務(wù)器上,處理更新客戶端的ARP的操作。
在另一種方案中,所述ARP處理模塊設(shè)置在客戶端上,處理繼續(xù)更新客戶端的ARP的操作。
依據(jù)上述方案,所述ARP處理模塊對網(wǎng)絡(luò)連接狀態(tài)進(jìn)行檢測,一旦發(fā)現(xiàn)網(wǎng)絡(luò)未連接即清除客戶端的ARP記錄。
所述ARP處理模塊在客戶端和新服務(wù)器的網(wǎng)線連接后立即對網(wǎng)絡(luò)連接狀態(tài)進(jìn)行檢測。
以上第一技術(shù)方案可以看出,由于本發(fā)明在集群系統(tǒng)中服務(wù)器進(jìn)行切換并發(fā)送ARP到客戶端更新其緩存的ARP后,超過ARP老化時間之前的期間內(nèi),如果出現(xiàn)網(wǎng)絡(luò)問題造成集群系統(tǒng)和客戶端未實(shí)現(xiàn)網(wǎng)絡(luò)連接,則繼續(xù)發(fā)送ARP到客戶端繼續(xù)更新其ARP。以期在ARP老化時間之前盡快實(shí)現(xiàn)客戶端和集群系統(tǒng)的網(wǎng)絡(luò)連接。避免現(xiàn)有技術(shù)超過ARP老化時間之后才進(jìn)行網(wǎng)絡(luò)連接而導(dǎo)致的較長時間的等待技術(shù)問題,實(shí)現(xiàn)快速恢復(fù)網(wǎng)絡(luò)連接的效果。
以上第二技術(shù)方案可以看出,由于本發(fā)明在服務(wù)器B,A切換并發(fā)送ARP到客戶端更新其緩存的ARP后,超過ARP老化時間之前此段時期內(nèi),采用ARP處理模塊持續(xù)檢測客戶端與新服務(wù)器A之間的網(wǎng)絡(luò)狀態(tài)。當(dāng)判斷新服務(wù)器A和客戶端未實(shí)現(xiàn)網(wǎng)絡(luò)連接時,采用ARP處理模塊指揮系統(tǒng)發(fā)送ARP到客戶端C30,繼續(xù)更新其ARP直至在ARP老化時間之前實(shí)現(xiàn)客戶端C30和集群系統(tǒng)10的網(wǎng)絡(luò)連接。避免現(xiàn)有技術(shù)僅發(fā)送一次虛擬IP的免費(fèi)ARP到客戶端、由于客戶端因?yàn)榫W(wǎng)絡(luò)問題收不到所述ARP而超過ARP老化時間之后才進(jìn)行網(wǎng)絡(luò)連接導(dǎo)致的較長時間的等待問題,實(shí)現(xiàn)快速恢復(fù)網(wǎng)絡(luò)連接的效果。
圖1是現(xiàn)有技術(shù)集群系統(tǒng)和客戶端連接的網(wǎng)絡(luò)示意圖;圖2是本發(fā)明集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的方法第一實(shí)施方式的流程圖;圖3是本發(fā)明集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的方法第二實(shí)施方式的流程圖;圖4是本發(fā)明集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接系統(tǒng)的網(wǎng)絡(luò)示意圖。
具體實(shí)施例方式
本發(fā)明的基本原理是當(dāng)集群系統(tǒng)中服務(wù)器進(jìn)行切換并發(fā)送ARP到客戶端更新其緩存的ARP后,超過ARP老化時間之前,如果出現(xiàn)網(wǎng)絡(luò)問題造成集群系統(tǒng)和客戶端未實(shí)現(xiàn)網(wǎng)絡(luò)連接,則繼續(xù)發(fā)送ARP到客戶端繼續(xù)更新其ARP。以期在ARP老化時間之前盡快實(shí)現(xiàn)客戶端和集群系統(tǒng)的網(wǎng)絡(luò)連接。避免現(xiàn)有技術(shù)超過ARP老化時間之后才進(jìn)行網(wǎng)絡(luò)連接而導(dǎo)致的較長時間的等待。
本發(fā)明基于上述基本原理而示意性地舉兩個主要實(shí)施方式作出說明,一個實(shí)施方式是在集群節(jié)點(diǎn)上根據(jù)連接情況繼續(xù)發(fā)送免費(fèi)ARP到客戶端,以盡快實(shí)現(xiàn)網(wǎng)絡(luò)連接;另外一個是在用于與集群連接的設(shè)備比如客戶端上根據(jù)連接情況發(fā)送免費(fèi)ARP請求到客戶端,以盡快實(shí)現(xiàn)網(wǎng)絡(luò)連接。以下結(jié)合上述實(shí)施方式和附圖,對本發(fā)明進(jìn)行詳細(xì)描述。
參閱圖2,是本發(fā)明集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接方法第一實(shí)施方式的流程圖。所述方法主要是在集群節(jié)點(diǎn)上根據(jù)網(wǎng)絡(luò)連接情況選擇繼續(xù)發(fā)送免費(fèi)ARP到客戶端或結(jié)束,包括以下步驟
A、集群服務(wù)器切換后更新客戶端的ARP;所述步驟A包括以下三個子步驟a1、在發(fā)生集群系統(tǒng)中局域網(wǎng)交換機(jī)與當(dāng)前服務(wù)器之間的網(wǎng)線斷開或其他導(dǎo)致連接斷開事故后,集群系統(tǒng)判斷網(wǎng)絡(luò)出現(xiàn)問題,開始從當(dāng)前服務(wù)器到新服務(wù)器的切換;a2、切換原服務(wù)器的虛擬IP到新服務(wù)器,即將當(dāng)前服務(wù)器上的虛擬IP加載到新服務(wù)器的網(wǎng)卡上;a3、新服務(wù)器發(fā)送一次虛擬IP的免費(fèi)ARP到客戶端以替換原ARP,更新客戶端的ARP;D、判斷切換后的新集群服務(wù)器和客戶端之間是否實(shí)現(xiàn)網(wǎng)絡(luò)連接,如果是則結(jié)束,否則可能發(fā)生了客戶端和集群系統(tǒng)之間的網(wǎng)線斷開事故,本方法繼續(xù)以下步驟;E、判斷從所述更新客戶端APR動作起算的時間是否超過客戶端內(nèi)ARP的老化時間,如果是則結(jié)束,否則更新客戶端的ARP并跳到步驟D。
從步驟a3發(fā)送一次虛擬IP的免費(fèi)ARP到客戶端開始算時間,在此時間內(nèi),如果集群系統(tǒng)不進(jìn)行任何加快網(wǎng)絡(luò)連接的步驟,則由于發(fā)生了客戶端和集群系統(tǒng)之間的網(wǎng)線斷開等事故造成客戶端無法接收新的ARP,導(dǎo)致客戶端在此老化時間內(nèi)一直指向原服務(wù)器而造成網(wǎng)絡(luò)無法通信。本發(fā)明在判斷集群系統(tǒng)未實(shí)現(xiàn)集群系統(tǒng)和客戶端之間的網(wǎng)絡(luò)連接時,繼續(xù)進(jìn)行步驟E繼續(xù)更新客戶端的ARP的步驟,然后跳到步驟D,繼續(xù)檢測客戶端與新服務(wù)器之間的網(wǎng)絡(luò)狀態(tài),如果因?yàn)槔^續(xù)更新客戶端的ARP而實(shí)現(xiàn)了網(wǎng)絡(luò)連接,則結(jié)束流程。
所述步驟E中更新客戶端的ARP步驟具體是發(fā)送虛擬IP的免費(fèi)ARP到客戶端以替換原ARP??梢砸?guī)定ARP發(fā)送的時間間隔,比如3秒,持續(xù)發(fā)送30秒,則再進(jìn)行網(wǎng)絡(luò)狀態(tài)的判斷,如果網(wǎng)絡(luò)未連接則繼續(xù)發(fā)送ARP,如此循環(huán)。
所述步驟D、E以及步驟A中更新客戶端的ARP步驟都由所述新服務(wù)器執(zhí)行。
從以上第一實(shí)施方式可以看出,本發(fā)明在集群系統(tǒng)中服務(wù)器進(jìn)行切換并發(fā)送ARP到客戶端更新其緩存的ARP后,超過ARP老化時間之前此段時期內(nèi),持續(xù)檢測客戶端與新服務(wù)器之間的網(wǎng)絡(luò)狀態(tài)。當(dāng)由于網(wǎng)絡(luò)事故而判斷集群系統(tǒng)未實(shí)現(xiàn)網(wǎng)絡(luò)連接時,則繼續(xù)發(fā)送ARP到客戶端繼續(xù)更新其ARP直至在ARP老化時間之前實(shí)現(xiàn)客戶端和集群系統(tǒng)的網(wǎng)絡(luò)連接。避免現(xiàn)有技術(shù)僅發(fā)送一次虛擬IP的免費(fèi)ARP到客戶端,由于客戶端因?yàn)榫W(wǎng)絡(luò)問題收不到所述ARP而超過ARP老化時間之后才進(jìn)行網(wǎng)絡(luò)連接導(dǎo)致的較長時間的等待問題。最佳情況下能在第二次發(fā)送ARP到客戶端即實(shí)現(xiàn)客戶端與新服務(wù)器之間的網(wǎng)絡(luò)連接,比現(xiàn)有技術(shù)快了上述的十幾分鐘等待時間,實(shí)現(xiàn)快速恢復(fù)網(wǎng)絡(luò)連接的本發(fā)明效果。
本發(fā)明還提供另外一種快速恢復(fù)網(wǎng)絡(luò)連接的方法,可參閱圖3。該方法主要是在用于與集群連接的設(shè)備比如客戶端上根據(jù)連接情況發(fā)送免費(fèi)ARP請求到客戶端,包括以下步驟A、集群服務(wù)器切換后更新客戶端的ARP;所述步驟A包括以下三個子步驟a1、在發(fā)生集群系統(tǒng)中局域網(wǎng)交換機(jī)與當(dāng)前服務(wù)器之間的網(wǎng)線斷開或其他導(dǎo)致連接斷開事故后,集群系統(tǒng)判斷網(wǎng)絡(luò)出現(xiàn)問題,開始從當(dāng)前服務(wù)器到新服務(wù)器的切換;a2、切換原服務(wù)器的虛擬IP到新服務(wù)器,即將當(dāng)前服務(wù)器上的虛擬IP加載到新服務(wù)器的網(wǎng)卡上;a3、新服務(wù)器發(fā)送一次虛擬IP的免費(fèi)ARP到客戶端以替換原ARP,更新客戶端的ARP;B、判斷切換后的新集群服務(wù)器和客戶端之間是否實(shí)現(xiàn)網(wǎng)絡(luò)連接,如果是則結(jié)束,否則繼續(xù)進(jìn)行下面的步驟;步驟B是在客戶端和新服務(wù)器的網(wǎng)線連接后立即進(jìn)行。在發(fā)生了客戶端和集群系統(tǒng)之間的網(wǎng)線斷開等事故造成網(wǎng)絡(luò)無法通信后,持續(xù)檢測客戶端和集群系統(tǒng)之間的網(wǎng)絡(luò)狀態(tài),在網(wǎng)絡(luò)未連接狀態(tài)下一旦發(fā)現(xiàn)客戶端和集群系統(tǒng)之間的網(wǎng)線接通,則進(jìn)行下面步驟。
C、清除客戶端的ARP記錄;清除客戶端的ARP記錄能保證下面步驟的正常開展。由于現(xiàn)有技術(shù)集群系統(tǒng)服務(wù)器的切換后,其新的ARP可能不能送到客戶端中??蛻舳艘蚨晕锤碌腁RP未依據(jù)進(jìn)行操作,也即繼續(xù)等待到其ARP老化而不進(jìn)行任何加快網(wǎng)絡(luò)連接的操作。此時需要清除未更新的ARP記錄以確保以下步驟的開展。
D、判斷切換后的新集群服務(wù)器和客戶端之間是否實(shí)現(xiàn)網(wǎng)絡(luò)連接,如果是則結(jié)束,否則可能發(fā)生了客戶端和集群系統(tǒng)之間的網(wǎng)線斷開事故,本方法繼續(xù)以下步驟;E、判斷從所述更新客戶端APR動作起算的時間是否超過客戶端內(nèi)ARP的老化時間,如果是則結(jié)束,否則更新客戶端的ARP并跳到步驟D。
從步驟a3發(fā)送一次虛擬IP的免費(fèi)ARP到客戶端開始算時間,大概在十幾二十分鐘內(nèi)為ARP的老化時間。在此時間內(nèi),如果集群系統(tǒng)不進(jìn)行任何加快網(wǎng)絡(luò)連接的步驟,則由于發(fā)生了客戶端和集群系統(tǒng)之間的網(wǎng)線斷開等事故造成客戶端無法接收新的ARP,導(dǎo)致客戶端在此老化時間內(nèi)一直指向原服務(wù)器而造成網(wǎng)絡(luò)無法通信。本發(fā)明在判斷集群系統(tǒng)未實(shí)現(xiàn)網(wǎng)絡(luò)連接時,繼續(xù)進(jìn)行步驟E繼續(xù)更新客戶端的ARP的步驟,然后跳到步驟D,繼續(xù)檢測客戶端與新服務(wù)器之間的網(wǎng)絡(luò)狀態(tài),如果因?yàn)槔^續(xù)更新客戶端的ARP而實(shí)現(xiàn)了網(wǎng)絡(luò)連接,則結(jié)束流程。
以上,步驟D、E都由所述客戶端執(zhí)行。步驟E中更新客戶端的ARP的步驟包括e1、向所述新服務(wù)器發(fā)送虛擬IP的ARP請求;e2、返回所述ARP到客戶端以替換原ARP。
如果客戶端與集群系統(tǒng)之間的網(wǎng)絡(luò)連接仍未正常,實(shí)現(xiàn)步驟e2并不能更新客戶端的ARP,因此需要繼續(xù)進(jìn)行步驟D;如果返回所述ARP到客戶端實(shí)現(xiàn)了客戶端與集群系統(tǒng)之間的網(wǎng)絡(luò)連接,則結(jié)束流程,不需要再繼續(xù)檢測網(wǎng)絡(luò)和發(fā)送ARP到客戶端。
從以上第二實(shí)施方式可以看出,本發(fā)明在集群系統(tǒng)中服務(wù)器進(jìn)行切換并發(fā)送ARP到客戶端更新其緩存的ARP后,超過ARP老化時間之前此段時期內(nèi),持續(xù)檢測客戶端與新服務(wù)器之間的網(wǎng)絡(luò)狀態(tài)。當(dāng)由于網(wǎng)絡(luò)事故而判斷集群系統(tǒng)未實(shí)現(xiàn)網(wǎng)絡(luò)連接時,一旦發(fā)現(xiàn)客戶端與集群系統(tǒng)之間網(wǎng)線接通,則請求發(fā)送ARP到客戶端,繼續(xù)更新其ARP直至在ARP老化時間之前實(shí)現(xiàn)客戶端和集群系統(tǒng)的網(wǎng)絡(luò)連接。避免現(xiàn)有技術(shù)僅發(fā)送一次虛擬IP的免費(fèi)ARP到客戶端,由于客戶端因?yàn)榫W(wǎng)絡(luò)問題收不到所述ARP而超過ARP老化時間之后才進(jìn)行網(wǎng)絡(luò)連接導(dǎo)致的較長時間的等待問題。最佳情況下能在第二次發(fā)送ARP到客戶端即實(shí)現(xiàn)客戶端與新服務(wù)器之間的網(wǎng)絡(luò)連接,比現(xiàn)有技術(shù)快了上述的十幾分鐘等待時間,實(shí)現(xiàn)快速恢復(fù)網(wǎng)絡(luò)連接的本發(fā)明效果。
為解決技術(shù)問題,本發(fā)明還另外提供一種集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的系統(tǒng)。請參閱圖4,該系統(tǒng)包括互連的集群系統(tǒng)10和客戶端C30,所述集群系統(tǒng)10包括互連的兩個服務(wù)器A,B。兩個服務(wù)器A,B上都設(shè)置有ARP處理模塊11。所述集群系統(tǒng)10網(wǎng)卡的IP和MAC設(shè)置如圖4。L1/L2/L3/L4表示網(wǎng)線,L4為連接服務(wù)器A和服務(wù)器B的集群跳線,L3/L2分別是局域網(wǎng)交換機(jī)20連接服務(wù)器A和服務(wù)器B的網(wǎng)線,L1是客戶端C30連接局域網(wǎng)交換機(jī)20的網(wǎng)線。兩個服務(wù)器A,B通過局域網(wǎng)交換機(jī)20和客戶端C30選擇性連接。例如切換前當(dāng)前和客戶端C30通信的是服務(wù)器B,切換后則由服務(wù)器A通過局域網(wǎng)交換機(jī)20連接。
ARP處理模塊11用于發(fā)送ARP和制定、執(zhí)行發(fā)送的策略;并對網(wǎng)絡(luò)連接狀態(tài)進(jìn)行檢測,檢測網(wǎng)線是否連接或網(wǎng)絡(luò)是否接通。在切換所述服務(wù)器并更新客戶端的ARP后、不超過客戶端ARP老化時間之前、以及在集群系統(tǒng)和客戶端未實(shí)現(xiàn)網(wǎng)絡(luò)連接時,所述ARP處理模塊11指示服務(wù)器或交換機(jī)20繼續(xù)更新客戶端的ARP。
整個系統(tǒng)運(yùn)作如下切換服務(wù)器當(dāng)判斷網(wǎng)絡(luò)出現(xiàn)問題時切換原服務(wù)器B的虛擬IP“192.17.120.150”到新服務(wù)器A并更新客戶端C30緩存的ARP。因?yàn)閺姆?wù)器B切換到服務(wù)器A,因此所述虛擬IP所對應(yīng)的MAC地址由MAC1“192.17.120.2”變?yōu)榱薓AC0“192.17.120.1”;
更新ARP當(dāng)服務(wù)器B的網(wǎng)卡獲得虛擬IP后,發(fā)送幾個免費(fèi)ARP來讓網(wǎng)絡(luò)中的客戶端C30更新它虛擬IP的ARP,從而使得本來在物理上與服務(wù)器B連接的客戶端C30在仍然請求連接相同IP的情況下可以連接到服務(wù)器A;但是,由于各種原因,可能客戶端C30和局域網(wǎng)交換機(jī)20的網(wǎng)線已經(jīng)斷開,即客戶端C30實(shí)際和集群系統(tǒng)10電隔離,這樣客戶端C30不能收到ARP來實(shí)現(xiàn)網(wǎng)絡(luò)連接。此時本發(fā)明系統(tǒng)采用ARP處理模塊11來檢測網(wǎng)絡(luò)狀態(tài)并根據(jù)所述狀態(tài)發(fā)送ARP到客戶端C30加快實(shí)現(xiàn)網(wǎng)絡(luò)連接。
判斷網(wǎng)絡(luò)狀態(tài)以繼續(xù)更新ARP在切換所述服務(wù)器A,B并更新客戶端C30的ARP后,超過ARP老化時間之前,所述ARP處理模塊11開始工作。當(dāng)ARP處理模塊11檢測到客戶端C30與當(dāng)前服務(wù)器A的網(wǎng)絡(luò)連接是斷開時,繼續(xù)向客戶端C30發(fā)送ARP以更新其緩存的ARP。該檢測和發(fā)送動作一直到客戶端C30與當(dāng)前服務(wù)器A實(shí)現(xiàn)網(wǎng)絡(luò)連接時結(jié)束。
在另外一種實(shí)施方式中,所述ARP處理模塊11設(shè)置在客戶端C30上。此時,所述ARP處理模塊11在客戶端C30和新服務(wù)器A的網(wǎng)線連接后立即對網(wǎng)絡(luò)連接狀態(tài)進(jìn)行檢測,一旦發(fā)現(xiàn)網(wǎng)絡(luò)未連接即清除客戶端的ARP記錄。然后再對網(wǎng)絡(luò)連接狀態(tài)進(jìn)行檢測,未發(fā)現(xiàn)網(wǎng)絡(luò)連接即請求新服務(wù)器A向客戶端C30發(fā)送ARP以更新其緩存的ARP。新服務(wù)器A收到請求后發(fā)送ARP,隨后ARP處理模塊11繼續(xù)對網(wǎng)絡(luò)連接狀態(tài)進(jìn)行檢測,如發(fā)現(xiàn)網(wǎng)絡(luò)未連接即繼續(xù)發(fā)送ARP到客戶端C30,直至實(shí)現(xiàn)客戶端C30和新服務(wù)器A之間的網(wǎng)絡(luò)連接。
所述ARP處理模塊11在集群系統(tǒng)每個節(jié)點(diǎn)上安裝,切換后在主節(jié)點(diǎn)自動啟動,而在其他節(jié)點(diǎn)自動停止。
從本發(fā)明系統(tǒng)可以看出,由于本發(fā)明在服務(wù)器B,A切換并發(fā)送ARP到客戶端C30更新其緩存的ARP后,超過ARP老化時間之前此段時期內(nèi),采用ARP處理模塊11持續(xù)檢測客戶端C30與新服務(wù)器A之間的網(wǎng)絡(luò)狀態(tài)。當(dāng)判斷新服務(wù)器A和客戶端C30未實(shí)現(xiàn)網(wǎng)絡(luò)連接時,采用ARP處理模塊11指揮系統(tǒng)發(fā)送ARP到客戶端C30,繼續(xù)更新其ARP直至在ARP老化時間之前實(shí)現(xiàn)客戶端C30和集群系統(tǒng)10的網(wǎng)絡(luò)連接。避免現(xiàn)有技術(shù)僅發(fā)送一次虛擬IP的免費(fèi)ARP到客戶端,由于客戶端收不到ARP而超過ARP老化時間之后才進(jìn)行網(wǎng)絡(luò)連接導(dǎo)致的較長時間的等待問題,實(shí)現(xiàn)快速恢復(fù)網(wǎng)絡(luò)連接的效果。
以上對本發(fā)明所提供的一種集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的方法及其系統(tǒng)進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個例對本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式
及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
權(quán)利要求
1.一種集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的方法,其特征在于,包括步驟A、集群服務(wù)器切換后更新客戶端的ARP;D、判斷切換后的新集群服務(wù)器和客戶端之間是否實(shí)現(xiàn)網(wǎng)絡(luò)連接,如果是則結(jié)束,否則繼續(xù);E、判斷是否超過客戶端內(nèi)ARP的老化時間,如果是則結(jié)束,否則更新客戶端的ARP并跳到步驟D。
2.根據(jù)權(quán)利要求1所述的集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的方法,其特征在于,所述步驟D、E以及步驟A中更新客戶端的ARP步驟由新服務(wù)器執(zhí)行。
3.根據(jù)權(quán)利要求1或2所述的集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的方法,其特征在于,所述步驟A和E中更新客戶端的ARP步驟具體是發(fā)送虛擬IP的免費(fèi)ARP到客戶端以替換原ARP。
4.根據(jù)權(quán)利要求1所述的集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的方法,其特征在于,所述步驟D、E由所述客戶端執(zhí)行。
5.根據(jù)權(quán)利要求4所述的集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的方法,其特征在于,在步驟A和D之間,還包括步驟B、判斷切換后的新集群服務(wù)器和客戶端之間是否實(shí)現(xiàn)網(wǎng)絡(luò)連接,如果是則結(jié)束,否則繼續(xù);C、清除客戶端的ARP記錄。
6.根據(jù)權(quán)利要求5所述的集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的方法,其特征在于,所述步驟B是在客戶端和新服務(wù)器的網(wǎng)線連接后立即進(jìn)行。
7.根據(jù)權(quán)利要求4或5所述的集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的方法,其特征在于,步驟E中判斷是否超過客戶端內(nèi)ARP的老化時間的起算點(diǎn)是從所述更新客戶端APR動作起算,所述更新客戶端的ARP步驟具體是向所述新服務(wù)器發(fā)送虛擬IP的ARP請求,并返回所述ARP到客戶端以替換原ARP。
8.根據(jù)權(quán)利要求1所述的集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的方法,其特征在于,所述步驟A中的集群服務(wù)器切換步驟具體包括a1、判斷網(wǎng)絡(luò)出現(xiàn)問題,開始從原服務(wù)器到新服務(wù)器的切換;a2、切換原服務(wù)器的虛擬IP到新服務(wù)器。
9.一種集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的系統(tǒng),包括互連的集群系統(tǒng)和客戶端,所述集群系統(tǒng)包括互連的至少兩個服務(wù)器,其特征在于,進(jìn)一步包括ARP處理模塊,用以在切換所述服務(wù)器并更新客戶端的ARP后、不超過客戶端ARP老化時間之前、以及在集群系統(tǒng)和客戶端未實(shí)現(xiàn)網(wǎng)絡(luò)連接時,繼續(xù)更新客戶端的ARP。
10.根據(jù)權(quán)利要求9所述的集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的系統(tǒng),其特征在于,所述ARP處理模塊設(shè)置在新服務(wù)器上,處理更新客戶端的ARP的操作。
11.根據(jù)權(quán)利要求9所述的集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的系統(tǒng),其特征在于,所述ARP處理模塊設(shè)置在客戶端上,處理繼續(xù)更新客戶端的ARP的操作。
12.根據(jù)權(quán)利要求11所述的集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的系統(tǒng),其特征在于,所述ARP處理模塊還用于對網(wǎng)絡(luò)連接狀態(tài)進(jìn)行檢測,一旦發(fā)現(xiàn)網(wǎng)絡(luò)未連接即清除客戶端的ARP記錄。
13.根據(jù)權(quán)利要求12所述的集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的系統(tǒng),其特征在于,所述ARP處理模塊在客戶端和新服務(wù)器的網(wǎng)線連接后立即對網(wǎng)絡(luò)連接狀態(tài)進(jìn)行檢測。
全文摘要
本發(fā)明公開一種集群服務(wù)器切換后快速恢復(fù)網(wǎng)絡(luò)連接的方法及其系統(tǒng),該方法包括步驟A.集群服務(wù)器切換后更新客戶端的ARP;D.判斷切換后的新集群服務(wù)器和客戶端之間是否實(shí)現(xiàn)網(wǎng)絡(luò)連接,如果是則結(jié)束,否則繼續(xù);E.判斷從所述更新客戶端APR動作起算的時間是否超過客戶端內(nèi)ARP的老化時間,如果是則結(jié)束,否則更新客戶端的ARP并跳到步驟D。本發(fā)明可以在系統(tǒng)服務(wù)器切換后、超過ARP老化時間之前盡快實(shí)現(xiàn)網(wǎng)絡(luò)連接,實(shí)現(xiàn)快速恢復(fù)網(wǎng)絡(luò)連接的效果。
文檔編號H04L12/24GK1968459SQ20061009034
公開日2007年5月23日 申請日期2006年6月29日 優(yōu)先權(quán)日2006年6月29日
發(fā)明者謝國軍, 王 華, 馮益 申請人:華為技術(shù)有限公司