專利名稱:三層任播尋址的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)聯(lián)網(wǎng)。
背景技術(shù):
尤其隨著因特網(wǎng)信息時(shí)代的出現(xiàn),機(jī)構(gòu)內(nèi)的數(shù)據(jù)管理越來越受關(guān)注。 這種數(shù)據(jù)管理功能的核心有時(shí)稱為數(shù)據(jù)中心。在過去十年間,數(shù)據(jù)中心已
經(jīng)演化成保護(hù)、優(yōu)化和發(fā)展機(jī)構(gòu)的信息技術(shù)(IT)努力的戰(zhàn)略重點(diǎn)。
圖1示出了 "孤立應(yīng)用程序"環(huán)境。 圖2示出了 DCE網(wǎng)絡(luò)。
圖3示出了包含被耦合到仿真交換機(jī)(emulated switch)的第2層交 換機(jī)的示例網(wǎng)絡(luò)。
圖4示出了 ARP請求分組的示例。
圖5示出了具有附加的MAC-in-MAC頭部的ARP請求分組的示例。 圖6示出了具有附加的MAC-in-MAC頭部的ARP答復(fù)分組的示例。 圖7示出了用于處理到由兩個(gè)或更多個(gè)路由器組成的仿真交換機(jī)中的
路由器的硬件地址請求的示例方法。
圖8示出了用于處理在第2層邊緣交換機(jī)處接收的來自由兩個(gè)或更多
個(gè)路由器組成的仿真交換機(jī)中的路由器的分組的示例方法。
圖9示出了用于在包含第2層交換機(jī)的網(wǎng)絡(luò)中的邊緣交換機(jī)處處理來
自主機(jī)的分組的示例方法。
圖10示出了用于在包含第2層交換機(jī)的網(wǎng)絡(luò)中的邊緣交換機(jī)處處理 來自主機(jī)的分組的示例方法。
圖11示出了用于處理到由兩個(gè)或更多個(gè)路由器組成的仿真交換機(jī)中
5的路由器的硬件地址請求的示例裝置。
圖12圖示出了用于處理在第2層邊緣交換機(jī)處接收的來自由兩個(gè)或 更多個(gè)路由器組成的仿真交換機(jī)中的路由器的分組的示例裝置。
圖13圖示出了用于在包含第2層交換機(jī)的網(wǎng)絡(luò)中的邊緣交換機(jī)處處
理來自主機(jī)的分組的示例裝置。
圖14圖示出了用于在包含第2層交換機(jī)的網(wǎng)絡(luò)中的邊緣交換機(jī)處處 理來自主機(jī)的分組的示例裝置。
圖15圖示出了 DCE交換機(jī)的簡化體系結(jié)構(gòu)。
具體實(shí)施方式
概述
在一個(gè)實(shí)施例中,提供了一種解決方案,其中,冗余路由器被當(dāng)作單 個(gè)仿真交換機(jī)。當(dāng)在第2層邊緣交換機(jī)處接收到來自主機(jī)的分組時(shí),第2 層邊緣交換機(jī)可以使用包含在分組中的目的地任播(anycast)硬件地址來 確定仿真交換機(jī)的交換機(jī)標(biāo)識符。任播硬件地址可以標(biāo)識包括多個(gè)路由器 的仿真交換機(jī)。然后,可以將一頭部添加到分組中,該頭部包括交換機(jī)標(biāo) 識符。接下來,分組可以沿著從第2層邊緣交換機(jī)到仿真交換機(jī)的最短路 徑被轉(zhuǎn)發(fā)到另一第2層交換機(jī)。
示例實(shí)施例
在此申請中,闡述了多個(gè)具體細(xì)節(jié)以便提供對本發(fā)明的透徹理解。然 而,可以不用一些或所有這些具體細(xì)節(jié)來實(shí)施本發(fā)明,這對本領(lǐng)域技術(shù)人 員來說是顯然的。在其他實(shí)例中,未詳細(xì)描述公知的處理步驟,以便不模 糊本發(fā)明。
數(shù)據(jù)中心管理員在實(shí)現(xiàn)數(shù)據(jù)中心的目標(biāo)時(shí)面臨著若干挑戰(zhàn)。大多數(shù)企 業(yè)的數(shù)據(jù)中心快速發(fā)展以滿足當(dāng)代爆炸式的經(jīng)濟(jì)增長。結(jié)果,未充分利用 的、孤立的基礎(chǔ)設(shè)施儲倉(silo)中的應(yīng)用程序通常是獨(dú)立的。各個(gè)基礎(chǔ) 設(shè)施儲倉是基于被部署的具體應(yīng)用程序的意向來設(shè)計(jì)的,以使得物理數(shù)據(jù) 中心支持廣泛種類的操作系統(tǒng)、計(jì)算平臺以及存儲系統(tǒng)。支持不同應(yīng)用程序"孤島"的完全不同的基礎(chǔ)設(shè)施難以改變或擴(kuò)展,并且管理、集成、確 保安全以及備份較昂貴。圖1圖示出了 "孤立應(yīng)用程序"環(huán)境。
一種對這種問題的解決方案是設(shè)計(jì)一種高度可擴(kuò)展、彈性強(qiáng)、安全, 并且能夠集成多個(gè)應(yīng)用程序和協(xié)議的數(shù)據(jù)中心環(huán)境。 一種這樣的解決方案 稱為數(shù)據(jù)中心網(wǎng)絡(luò)體系結(jié)構(gòu)。該數(shù)據(jù)中心網(wǎng)絡(luò)體系結(jié)構(gòu)的具體實(shí)現(xiàn)方式稱
為數(shù)據(jù)中心以太網(wǎng)(DCE) 。 DCE允許增強(qiáng)輸入和輸出,并改進(jìn)網(wǎng)絡(luò)內(nèi)通 信的轉(zhuǎn)發(fā)。這可以經(jīng)由專用協(xié)議以及由DCE網(wǎng)絡(luò)內(nèi)的交換機(jī)經(jīng)由第2網(wǎng) 絡(luò)層所操作的功能來實(shí)現(xiàn)。DCE網(wǎng)絡(luò)內(nèi)的每個(gè)交換機(jī)都可以是第2層交換 機(jī)。圖2圖示出了 DCE網(wǎng)絡(luò)。邊緣交換機(jī)200可以連接到主機(jī)202。邊緣 交換機(jī)204可以連接到主機(jī)206。邊緣交換機(jī)200、 204隨后可以被連接到 若干核心交換機(jī)208、 210,核心交換機(jī)208、 210然后可以被連接到其它 邊緣交換機(jī)212、 214。每個(gè)DCE交換機(jī)可以被指派有唯一標(biāo)識符。在 DCE內(nèi)部可以使用諸如中間系統(tǒng)到中間系統(tǒng)(IS-IS)之類的路由協(xié)議。實(shí) 現(xiàn)這種路由協(xié)議的邊緣交換機(jī)可以將信息附加到通過DCE發(fā)送的分組 中。這種被附加的信息可以以MAC-in-MAC頭部(MAC-in-MAC header) 的形式被附接到分組。邊緣交換機(jī)212、 214的每個(gè)隨后可以被連接到第3 層設(shè)備,例如路由器216、 218。取代將分組轉(zhuǎn)發(fā)到MAC地址,DCE交換 機(jī)基于利用MAC-in-MAC頭部的邊緣交換機(jī)標(biāo)識將分組發(fā)送到邊緣交換 機(jī)。邊緣交換機(jī)隨后得知其端口中要將分組發(fā)送出以到達(dá)正確的IP地址的 端口 (例如,連接到路由器216的端口),并且在完成此之前剝離MAC-in-MAC 頭部。
取代單獨(dú)操作路由器216和218,鏈接路由器以使得在路由器或鏈路 故障的情況下一個(gè)路由器可以充當(dāng)另一路由器的備份通常是有益的。這種 鏈接可以通過諸如熱備份路由協(xié)議(HSRP)之類的另一路由協(xié)議來完 成。其它的熱備份路由協(xié)議包括虛擬路由器冗余協(xié)議(VRRP)和網(wǎng)關(guān)負(fù) 載均衡協(xié)議(GLBP)。在這些協(xié)議中,若干路由器被連接到網(wǎng)絡(luò)中的同 一子網(wǎng),并且一起工作以表現(xiàn)出單個(gè)虛擬路由器的樣子。通常,單個(gè)虛擬 IP地址被指派給鏈接到單個(gè)虛擬MAC地址的路由器。然而,單個(gè)虛擬 MAC地址指向路由器中的特定的一個(gè)路由器,該特定的一個(gè)路由器被指定為"活動"路由器,而其它一個(gè)或多個(gè)路由器被指定為"備份"。如果
一個(gè)路由器出現(xiàn)故障,則另一路由器接替,并且將虛擬MAC地址映射到 該備份路由器。但是,當(dāng)兩個(gè)都運(yùn)行時(shí),僅一個(gè)被用于外出(outbound) 通信。這由于多個(gè)原因可能是沒有效率的。
首先,僅使用多個(gè)冗余路由器中的一個(gè)路由器作為用于外出通信的活 動路由器可能在單個(gè)路由器處或者在其關(guān)聯(lián)鏈路之一上產(chǎn)生瓶頸。均衡冗 余路由器之間負(fù)載將更有效。其次,即使將熱路由選擇協(xié)議用來均衡冗余 路由器之間的負(fù)載,由這些協(xié)議產(chǎn)生的流量也可能是浪費(fèi)的。再次,用于 路由器從活動切換到備份的時(shí)間量并不是微不足道的。如果需要更快的收 斂,則需要其他解決方案。
提供了一種解決方案,其中,多個(gè)冗余路由器被當(dāng)作單個(gè)仿真交換 機(jī)。這允許通過在包含第2層交換機(jī)的網(wǎng)絡(luò)中使用的諸如DCE之類的協(xié) 議,針對主機(jī)-交換機(jī)-路由器連接的故障恢復(fù)以及負(fù)載均衡機(jī)制。通過使 用這種解決方案,可以不需要諸如HSRP、 VRRP和GLBP之類的熱備份 路由協(xié)議。
可以通過首先將同一 IP地址指派給仿真交換機(jī)中的所有路由器來實(shí)現(xiàn) 網(wǎng)絡(luò)的配置。這種IP地址可以稱為"路由器任播地址"。另外,同一 MAC地址可以被指派給仿真交換機(jī)中的所有路由器。這種MAC地址可以 稱為"路由器任播MAC地址"。然后,可以使用虛擬IP地址為每個(gè)主機(jī) 配置默認(rèn)路由器。虛擬IP地址映射到虛擬MAC地址。虛擬交換機(jī)中的路 由器的虛擬MAC地址對應(yīng)于單個(gè)任播硬件地址。任播硬件地址可以用作 交換機(jī)標(biāo)識。可以使用諸如IS-IS、 RIP或(EIGRP)之類的協(xié)議向網(wǎng)絡(luò)內(nèi) 的所有第2層交換機(jī)通告該交換機(jī)標(biāo)識,只要邊緣交換機(jī)具有可達(dá)路由器 的連接。
圖3圖示出了包含被耦合到仿真交換機(jī)的第2層交換機(jī)的示例網(wǎng)絡(luò)。 當(dāng)分組從主機(jī)300被發(fā)送到耦合到仿真交換機(jī)302的諸如因特網(wǎng)之類的網(wǎng) 絡(luò)時(shí),其可以將該分組轉(zhuǎn)發(fā)到最近的邊緣交換機(jī)304。但是,該主機(jī)300 在其存儲器(例如地址解析協(xié)議(ARP)緩存)中沒有默認(rèn)路由器的 MAC地址。因此,主機(jī)300可以首先發(fā)送對路由器任播地址的請求例如作為ARP請求。ARP請求是在廣播樹上發(fā)送過DCE網(wǎng)絡(luò)的廣播分組。由 于路由器組是仿真任播交換機(jī)的一部分,因此,僅到仿真任播交換機(jī)中的 一個(gè)鏈路接收到該ARP分組。這可以通過例如連接到特定仿真交換機(jī)的邊 緣交換機(jī)之間的協(xié)調(diào)來實(shí)現(xiàn)。發(fā)送請求的鏈路被連接到單個(gè)路由器,而不 管該路由器可能是仿真交換機(jī)的一部分的事實(shí)。
接收到ARP請求的路由器可以通過向作出ARP請求的主機(jī)發(fā)送單播 分組來作出ARP答復(fù)。這允許直接連接到主機(jī)的第一跳交換機(jī)得知與該路 由器相關(guān)聯(lián)的邊緣交換機(jī)??梢愿鶕?jù)與仿真任播交換機(jī)相關(guān)聯(lián)的交換機(jī)標(biāo) 識來標(biāo)識該邊緣交換機(jī)。ARP答復(fù)可以與等同于路由器任播MAC地址的 源MAC地址一起被發(fā)送,以使得直接連接到主機(jī)的邊緣交換機(jī)將MAC 地址與仿真任播交換機(jī)相關(guān)聯(lián)。
此時(shí),主機(jī)的離開子網(wǎng)流量將找出到仿真任播交換機(jī)的最短路徑。這 可能是或可能不是答復(fù)ARP請求的同一路由器。例如,雖然路由器306可 能對ARP請求作出了響應(yīng),然而,到路由器308的路徑實(shí)際上可能是用于 流量的最短路徑。其它主機(jī)將找到它們各自的到仿真任播交換機(jī)的最短路 徑,這些最短路徑可能通過不同的路由器。這有效地均衡了仿真交換機(jī)中 的冗余路由器之間的負(fù)載。另外,如果因網(wǎng)絡(luò)中的拓?fù)涓淖兓蚵酚善鞅旧?發(fā)生故障而導(dǎo)致到特定路由器的連接發(fā)生故障,則可以快速將流量重新路 由到其它路由器。這是因?yàn)樵诎?層交換機(jī)的網(wǎng)絡(luò)中使用的諸如DCE 之類的協(xié)議可以比諸如HSRP、 VRRP或GLBP之類的熱備份路由協(xié)議更 快地發(fā)現(xiàn)拓?fù)涓淖兓蚬收湘溌?。提供了一種解決方案,該解決方案利用這 個(gè)事實(shí)來比現(xiàn)有技術(shù)更快地執(zhí)行故障切換,這是因?yàn)楝F(xiàn)在可以由交換機(jī)網(wǎng) 絡(luò)本身來執(zhí)行故障切換。
假設(shè)主機(jī)A 300想要獲知路由器306、 308之一的MAC地址。其可以 發(fā)送圖4所示的ARP分組。IP源地址400可以是A的IP地址。IP目的地 地址402可以是SW7的任播IP地址。分組的第2層目的地地址404可以 被設(shè)為廣播(所有地址)。第2層源地址406可以是主機(jī)A406。
當(dāng)接收到來自主機(jī)A 300的ARP請求時(shí),交換機(jī)SW1 304得知主機(jī) A 300不在特定接口上(例如,接口 2)。其隨后可以附加圖5所示的
9MAC-in-MAC頭部。這里,由于分組仍然是ARP請求因此目的地500可 以被設(shè)為廣播,同時(shí)源可以設(shè)為表示交換機(jī)2、接口 2的SW2,2??梢越?立包括仿真SW5的無環(huán)樹,因此,該樹表明了到仿真SW7302的最短路 徑(這可以在比ARP請求的接收更早的處理中被執(zhí)行)。ARP請求隨后 可以經(jīng)過該最短路徑被傳遞到仿真交換機(jī)SW7。然而,認(rèn)識到下一交換機(jī) 是仿真交換機(jī)的邊緣交換機(jī)SW5 310可以剝離MAC-in-MAC頭部。路由 器306、 308之一可以接收ARP請求并以ARP答復(fù)作出響應(yīng)。這里,假設(shè) 這是路由器308。當(dāng)接收到ARP答復(fù)時(shí),邊緣交換機(jī)SW5 310可以添加 MAC-in-MAC頭部以得出圖6所示的分組。答復(fù)中的MAC-in-MAC頭部 的目的地地址600可以是SW1。答復(fù)中的MAC-in-MAC頭部的源地址 602可以是仿真交換機(jī)SW7。還可以包括接口標(biāo)識,但是這種值是不相關(guān) 的,這是因?yàn)榉纸M將不會被用來執(zhí)行轉(zhuǎn)發(fā)。邊緣交換機(jī)SW5 310隨后可以 得知路由器308在其接口 (例如,接口 2)上。可以將該信息與整個(gè)DCE 網(wǎng)絡(luò)中的交換機(jī)上的信息同步,以使得每個(gè)交換機(jī)都知道路由器308在邊 緣交換機(jī)SW5 310的接口上。ARP答復(fù)隨后流經(jīng)交換機(jī)312、 304到達(dá)主 機(jī)A300。
當(dāng)主機(jī)300隨后希望通過與仿真交換機(jī)SW7 302相對應(yīng)的任播硬件地 址將正常流量發(fā)送出去時(shí),SW2 304可以接收該流量。其隨后可以在其表 中查找任播硬件地址,并發(fā)現(xiàn)該地址在仿真交換機(jī)SW7上。其隨后可以 將MAC-in-MAC頭部添加到該流量,并且經(jīng)由最短路徑將其轉(zhuǎn)發(fā)到交換 機(jī)SW7。再次,邊緣交換機(jī)310認(rèn)識到交換機(jī)SW7是仿真交換機(jī),并且 剝離MAC-in-MAC頭部以將其轉(zhuǎn)發(fā)。通過這樣做,使得路由器306和308 的負(fù)載均衡,這是因?yàn)閬碓从谥鳈C(jī)A 300的分組將通過路由器308 (利用 最短路徑)被發(fā)送,而來源于服務(wù)器B 314的分組將通過路由器306被發(fā) 送。在兩條路徑等同的情況中,可以使用平局決勝(tie-breaking)機(jī)制, 例如基于源地址的散列法。另外,如上所述,如果一條鏈路發(fā)生故障,則 DCE網(wǎng)絡(luò)能夠?qū)⑺蟹纸M轉(zhuǎn)發(fā)到另一路由器直至鏈路恢復(fù)時(shí)為止。
圖7圖示出了用于處理到兩個(gè)或更多個(gè)路由器組成的仿真交換機(jī)中的 第一路由器的硬件地址請求,例如ARP請求或IPv6鄰居請求的示例方法。可以在包含第2層交換機(jī)的網(wǎng)絡(luò)中的第2層邊緣交換機(jī)處執(zhí)行該處
理。在700中,可以接收來自第2層交換機(jī)的硬件地址請求。該請求可以 是ARP請求,并且可以包括由另一第2層交換機(jī)(不一定是直接從其接收 到請求的第2層交換機(jī))添加到請求中的第2層網(wǎng)絡(luò)頭部(例如,MAC-in-MAC頭部)。在702中,該第2層網(wǎng)絡(luò)頭部可以從請求中被剝離。在 704中,硬件地址請求可以被轉(zhuǎn)發(fā)到第一路由器。仿真交換機(jī)中的哪個(gè)路 由器被指定為第一路由器是無關(guān)緊要的。在706中,可以從該路由器接收 硬件地址答復(fù)。該答復(fù)可以是ARP答復(fù),并且可以包括在仿真交換機(jī)中的 各個(gè)路由器之間共享的任播硬件地址。在708中,諸如MAC-in-MAC頭 部之類的第2層網(wǎng)絡(luò)頭部可以被添加到硬件地址答復(fù)。在710中,硬件地 址答復(fù)可以被轉(zhuǎn)發(fā)到另一第2層交換機(jī)。該另一第2層交換機(jī)可以是或可 以不是與700中相同的第2層交換機(jī)。
圖8圖示出了用于處理在第2層邊緣交換機(jī)處接收到的來自由兩個(gè)或 更多個(gè)路由器組成的仿真交換機(jī)中的路由器的分組的示例方法。在800 中,分組被接收。分組可以是ARP分組答復(fù),但也可以是通常流量。分組 可以包括在仿真交換機(jī)中的各個(gè)路由器之間共享的任播硬件地址。在802 中,任播硬件地址可以與邊緣交換機(jī)的標(biāo)識一起被添加到表中??梢远ㄆ?將該表與關(guān)聯(lián)于網(wǎng)絡(luò)中的其它第2層交換機(jī)的表同步。在804中,諸如 MAC-in-MAC頭部之類的第2層網(wǎng)絡(luò)頭部可以被添加到分組。在806中, 分組可以被轉(zhuǎn)發(fā)到網(wǎng)絡(luò)中的另一第2層交換機(jī)。
圖9圖示出了用于在包含第2層交換機(jī)的網(wǎng)絡(luò)中的邊緣交換機(jī)處處理 來自主機(jī)的分組的示例方法。在900中,分組可以被接收。該分組可以包 括與多個(gè)路由器相對應(yīng)的仿真交換機(jī)的任播硬件地址。在902中,可以利 用任播硬件地址來確定仿真交換機(jī)的交換機(jī)標(biāo)識符。這可以通過例如在一 表中查找任播硬件地址以檢索交換機(jī)標(biāo)識符來進(jìn)行確定。在904中,頭部 可以被添加到分組,該頭部包括交換機(jī)標(biāo)識符。該頭部可以是第2層網(wǎng)絡(luò) 頭部,例如MAC-in-MAC頭部。在906中,分組可以沿著到仿真交換機(jī) 的最短路徑被轉(zhuǎn)發(fā)到另一第2層交換機(jī)。該最短路徑例如可以通過查閱針 對包括仿真交換機(jī)在內(nèi)的交換機(jī)而創(chuàng)建的生成樹來確定。如果兩條路徑之間存在平局(tie)而使得不能基于距離來確定最短路徑,則可以通過例如 查閱基于分組的源地址的散列表來打破該平局。
圖10圖示出了用于在包含第2層交換機(jī)的網(wǎng)絡(luò)中的邊緣交換機(jī)處處 理來自主機(jī)的分組的示例方法。在1000中,分組可以被接收。分組可以 包括與多個(gè)路由器相對應(yīng)的仿真交換機(jī)的目的地任播硬件地址。在1002 中,可以利用任播硬件地址來確定仿真交換機(jī)的交換機(jī)標(biāo)識符。這可以通 過例如在一表中査找任播硬件地址以檢索交換機(jī)標(biāo)識符來進(jìn)行確定。在 1004中,頭部可以被添加到分組,該頭部包括交換機(jī)標(biāo)識符。該頭部可以 是第2層網(wǎng)絡(luò)頭部,例如MAC-in-MAC頭部。在1006中,可以確定到該 仿真交換機(jī)的最短路徑。在1008,可以判斷該最短路徑是否包括不工作鏈 路。如果是,則在1010中,可以選擇不包括不工作鏈路的新最短路徑。 在1012中,分組可以沿著代表到仿真交換機(jī)的最短路徑的路徑被轉(zhuǎn)發(fā)到 另一第2層交換機(jī)。該最短路徑例如可以通過査閱針對包括仿真交換機(jī)在 內(nèi)的交換機(jī)而創(chuàng)建的生成樹來確定。如果兩條路徑之間存在平局而使得不 能基于距離來確定最短路徑,則可以通過例如查閱基于分組的源地址的散 列表來打破該平局。
圖11圖示出了用于處理到由兩個(gè)或更多個(gè)路由器組成的仿真交換機(jī) 中的第一路由器的硬件地址請求的示例裝置。該裝置可以是第2層邊緣交 換機(jī)或第2層邊緣交換機(jī)的一部分(例如,軟件)。硬件地址請求接收器 1100可以接收來自第2層交換機(jī)的硬件地址請求。該請求可以是ARP請 求,并且可以包括由另一第2層交換機(jī)(不一定是直接從其接收到請求的 第2層交換機(jī))添加到請求中的第2層網(wǎng)絡(luò)頭部(例如,MAC-in-MAC頭 部)。耦合到硬件地址請求接收器IIOO的第2層網(wǎng)絡(luò)頭部剝離器1102可 以從該請求剝離該第2層網(wǎng)絡(luò)頭部。耦合到第2層網(wǎng)絡(luò)頭部剝離器1102的 硬件地址請求轉(zhuǎn)發(fā)器1104將該硬件地址請求轉(zhuǎn)發(fā)到第一路由器。仿真交 換機(jī)中的哪個(gè)路由器被指定為第一路由器是無關(guān)緊要的。硬件地址答復(fù)接 收器1106可以從路由器接收硬件地址答復(fù)。該答復(fù)可以是ARP答復(fù),并 且可以包括在仿真交換機(jī)中的各個(gè)路由器之間共享的任播硬件地址。耦合 到硬件地址答復(fù)接收器1106的第2層網(wǎng)絡(luò)頭部添加器1108可以將諸如MAC-in-MAC頭部之類的第2層網(wǎng)絡(luò)頭部添加到硬件地址答復(fù)。耦合到第 2層網(wǎng)絡(luò)頭部添加器1108的硬件地址答復(fù)轉(zhuǎn)發(fā)器1110可將硬件地址轉(zhuǎn)發(fā) 到另一第2層交換機(jī)。這可以是或可以不是與以前相同的第2層交換機(jī)。
圖12圖示出了用于處理在第2層邊緣交換機(jī)處接收到的來自由兩個(gè) 或更多個(gè)路由器組成的仿真交換機(jī)中的路由器的分組的示例裝置。分組接 收器1200可以接收分組。該分組可以是ARP分組答復(fù),但也可以是通常 流量。該分組可以包括在仿真交換機(jī)中的各個(gè)路由器之間共享的任播硬件 地址。耦合到分組接收器1200的任播硬件地址表添加器1202可以將任播 硬件地址請求與邊緣交換機(jī)的標(biāo)識一起添加到表中??梢远ㄆ趯⒃摫砼c關(guān) 聯(lián)于網(wǎng)絡(luò)中的其它第2層交換機(jī)的表同步。耦合到任播硬件地址表添加器 1202的第2層網(wǎng)絡(luò)頭部添加器1204可以將諸如MAC-in-MAC頭部之類的 第2層網(wǎng)絡(luò)頭部添加到分組。耦合到第2層網(wǎng)絡(luò)頭部添加器1204的分組轉(zhuǎn) 發(fā)器1206可以將分組轉(zhuǎn)發(fā)到網(wǎng)絡(luò)中的第2層交換機(jī)。
圖13圖示出了用于在包含第2層交換機(jī)的網(wǎng)絡(luò)中的邊緣交換機(jī)處處 理來自主機(jī)的分組的示例裝置。分組接收器1300可以接收分組。該分組 可以包括與多個(gè)路由器相對應(yīng)的仿真交換機(jī)的任播硬件地址。耦合到分組 接收器1300的交換機(jī)標(biāo)識單元1302可以利用任播硬件地址來確定仿真交 換機(jī)的交換機(jī)標(biāo)識符。這可以通過例如在一表中查找任播硬件地址以檢索 交換機(jī)標(biāo)識符來進(jìn)行確定。耦合到交換機(jī)標(biāo)識單元1302的交換機(jī)標(biāo)識符 頭部添加器1304可以將頭部添加到分組,該頭部包括交換機(jī)標(biāo)識符。該 頭部可以是第2層網(wǎng)絡(luò)頭部,例如MAC-in-MAC頭部。耦合到交換機(jī)標(biāo) 識符頭部添加器1304的最短路徑分組轉(zhuǎn)發(fā)器1306可以沿著代表到仿真交 換機(jī)的最短路徑的路徑將分組轉(zhuǎn)發(fā)到另一第2層交換機(jī)。該最短路徑例如 可以通過查閱針對包括仿真交換機(jī)在內(nèi)的交換機(jī)而創(chuàng)建的生成樹來確定。 如果兩條路徑之間存在平局(tie)而使得不能基于距離來確定最短路徑, 則可以通過例如査閱基于分組的源地址的散列表來打破該平局。
圖14圖示出了用于在包含第2層交換機(jī)的網(wǎng)絡(luò)中的邊緣交換機(jī)處處 理來自主機(jī)的分組的示例裝置。分組接收器1400可以接收分組。分組可 以包括與多個(gè)路由器相對應(yīng)的仿真交換機(jī)的目的地任播硬件地址。耦合到分組接收器1400的交換機(jī)標(biāo)識單元1402可以使用任播硬件地址確定仿真 交換機(jī)的交換機(jī)標(biāo)識符。這可以通過例如在一表中査找任播硬件地址以檢 索交換機(jī)標(biāo)識符來進(jìn)行確定。耦合到交換機(jī)標(biāo)識單元1402的交換機(jī)標(biāo)識 符頭部添加器1404可以將頭部添加到分組,該頭部包括交換機(jī)標(biāo)識符。 該頭部可以是第2層網(wǎng)絡(luò)頭部,例如MAC-in-MAC頭部。耦合到交換機(jī) 標(biāo)識符頭部添加器的最短路徑確定器1406可以確定到仿真交換機(jī)的最短 路徑。耦合到最短路徑確定器1406的最短路徑不工作鏈路判斷器1408可 以判斷最短路徑是否包括不工作鏈路。如果是,則耦合到最短路徑不工作 鏈路判斷器的新最短路徑確定器1410可以選擇不包括不工作鏈路的新的 最短路徑。耦合到最短路徑不工作鏈路判斷器1408和新最短路徑確定器 1410的最短路徑分組轉(zhuǎn)發(fā)器1412可以經(jīng)由代表到仿真交換機(jī)的最短路徑 的路徑將分組轉(zhuǎn)發(fā)到另一第2層交換機(jī)。該最短路徑例如可以通過查閱針 對包括仿真交換機(jī)在內(nèi)的交換機(jī)而創(chuàng)建的生成樹來確定。如果兩條路徑之 間存在平局而使得不能基于距離來確定最短路徑,則可以通過例如査閱基 于分組的源地址的散列表來打破該平局。
在這些實(shí)施例中的每個(gè)實(shí)施例中,可以使用各種協(xié)議(例如,使用 IS-IS協(xié)議的DCE)。另外,在這些實(shí)施例中的每個(gè)實(shí)施例中,不再需要 運(yùn)行熱備份路由協(xié)議。
圖15圖示出了 DCE交換機(jī)1500的簡化體系結(jié)構(gòu)。DCE交換機(jī)1500 包括7V個(gè)線路卡,每個(gè)線路卡特征在于入口側(cè)(或輸入)1505以及出口側(cè) (或輸出)1525。線路卡入口側(cè)1505經(jīng)由交換結(jié)構(gòu)1550連接到出口側(cè) 1525,在此示例中交換結(jié)構(gòu)1550具有交叉開關(guān)。在此實(shí)施例中,由一個(gè) 或多個(gè)線路卡來執(zhí)行上述的一個(gè)或多個(gè)處理。
雖然在此示出并描述了本發(fā)明的例示實(shí)施例和應(yīng)用,然而,保持在本 發(fā)明的概念、范圍和精神之內(nèi)的許多變更和修改也是可以的,并且在細(xì)讀 了本申請之后,本領(lǐng)域技術(shù)人員會清楚這些變更。例如,可以將邊緣交換 機(jī)連接到單個(gè)仿真交換機(jī)內(nèi)的多個(gè)路由器。因此,所描述的實(shí)施例將被認(rèn) 為是例示性的而非限制性的,并且本發(fā)明不限于在此給出的細(xì)節(jié),而是可 以在所附權(quán)利要求的等同物和范圍內(nèi)進(jìn)行修改。
權(quán)利要求
1.一種用于在第一第2層交換機(jī)處處理從第二第2層交換機(jī)接收到的硬件地址請求的方法,其中,所述硬件地址請求指向仿真交換機(jī)中的第一路由器,其中,所述仿真交換機(jī)包括多個(gè)路由器,并且其中所述第一第2層交換機(jī)是邊緣交換機(jī),所述方法包括將所述硬件地址請求轉(zhuǎn)發(fā)到所述第一路由器;接收來自所述第一路由器的硬件地址答復(fù),所述硬件地址答復(fù)包括在所述仿真交換機(jī)中的各個(gè)路由器之間共享的任播硬件地址;將第2層網(wǎng)絡(luò)頭部添加到所述硬件地址答復(fù);以及將所述硬件地址答復(fù)轉(zhuǎn)發(fā)到第三第2層交換機(jī)。
2. 如權(quán)利要求1所述的方法,還包括將所述任播硬件地址與所述第一第2層交換機(jī)的標(biāo)識一起添加到表中。
3. 如權(quán)利要求2所述的方法,還包括將所述表與與除所述第一第2層交換機(jī)之外的一個(gè)或多個(gè)第2層交換 機(jī)相關(guān)聯(lián)的一個(gè)或多個(gè)表同步。
4. 一種方法,包括在第一第2層交換機(jī)處接收來自仿真交換機(jī)中的第一路由器的分組, 其中所述仿真交換機(jī)包括多個(gè)路由器,所述分組包括在所述仿真交換機(jī)中 的各個(gè)路由器之間共享的任播硬件地址,并且所述第一第2層交換機(jī)是邊 緣交換機(jī);將第2層網(wǎng)絡(luò)頭部添加到所述分組;以及 將所述分組轉(zhuǎn)發(fā)到第二第2層交換機(jī)。
5. 如權(quán)利要求4所述的方法,還包括將所述任播硬件地址與所述邊緣交換機(jī)的標(biāo)識一起添加到表中。
6. 如權(quán)利要求5所述的方法,還包括將所述表與與除所述第一第2層交換機(jī)之外的一個(gè)或多個(gè)第2層交換 機(jī)相關(guān)聯(lián)的一個(gè)或多個(gè)表同步。
7. —種用于在包含多個(gè)第2層交換機(jī)的網(wǎng)絡(luò)中的第2層邊緣交換機(jī)處處理從主機(jī)接收的分組的方法,其中所述分組包括仿真交換機(jī)的任播硬件地址,并且所述仿真交換機(jī)包括多個(gè)路由器,所述方法包括使用所述任播硬件地址確定所述仿真交換機(jī)的交換機(jī)標(biāo)識符; 向所述分組添加頭部,所述頭部包括所述交換機(jī)標(biāo)識符;以及 沿著從所述第2層邊緣交換機(jī)到所述仿真交換機(jī)的最短路徑將所述分 組轉(zhuǎn)發(fā)到另一第2層交換機(jī)。
8. 如權(quán)利要求7所述的方法,其中,確定步驟包括在表中查找所述任 播硬件地址以檢索所述交換機(jī)標(biāo)識符。
9. 如權(quán)利要求7所述的方法,其中,如果由于兩條或更多條路徑之間 的平局而不能基于距離來確定所述最短路徑,則利用散列表基于所述分組 的源地址來確定所述最短路徑。
10. —種用于在包含多個(gè)第2層交換機(jī)的網(wǎng)絡(luò)中的第2層邊緣交換機(jī) 處處理從主機(jī)接收的分組的方法,其中所述分組包括仿真交換機(jī)的目的地 任播硬件地址,并且所述仿真交換機(jī)包括多個(gè)路由器,所述方法包括使用所述任播硬件地址確定所述仿真交換機(jī)的交換機(jī)標(biāo)識符; 向所述分組添加頭部,所述頭部包括所述交換機(jī)標(biāo)識符; 確定從所述第2層邊緣交換機(jī)到所述仿真交換機(jī)的最短工作路徑;以及經(jīng)由所述最短工作路徑將所述分組轉(zhuǎn)發(fā)到另一第2層交換機(jī)。
11. 如權(quán)利要求IO所述的方法,其中,確定步驟包括在表中査找所述 任播硬件地址以檢索所述交換機(jī)標(biāo)識符。
12. 如權(quán)利要求IO所述的方法,其中,如果由于兩條或更多條路徑之 間的平局而不能基于距離來確定所述最短路徑,則利用散列表基于所述分 組的源地址來確定所述最短路徑。
13. 如權(quán)利要求IO所述的方法,其中,包含多個(gè)第2層交換機(jī)的所述 網(wǎng)絡(luò)是數(shù)據(jù)中心以太網(wǎng)DCE網(wǎng)絡(luò)。
14. 如權(quán)利要求10所述的方法,其中,所述頭部是MAC-in-MAC頭部。
15. 如權(quán)利要求IO所述的方法,其中,所述路由器不運(yùn)行熱備份路由 協(xié)議。
16. —種用在包含第2層交換機(jī)的網(wǎng)絡(luò)中的第2層邊緣交換機(jī),所述第2層邊緣交換機(jī)包括一個(gè)或多個(gè)線路卡,其中當(dāng)接收到來自主機(jī)的分組時(shí),所述一個(gè)或多 個(gè)線路卡中的至少一個(gè)線路卡被配置來執(zhí)行下面的操作,其中所述分組包 括仿真交換機(jī)的目的地任播硬件地址,并且所述仿真交換機(jī)包括多個(gè)路由器使用所述任播硬件地址確定所述仿真交換機(jī)的交換機(jī)標(biāo)識符; 向所述分組添加頭部,所述頭部包括所述交換機(jī)標(biāo)識符; 確定從所述第2層邊緣交換機(jī)到所述仿真交換機(jī)的最短工作路徑;以及經(jīng)由所述最短工作路徑將所述分組轉(zhuǎn)發(fā)到另一第2層交換機(jī)。
17. 如權(quán)利要求16所述的第2層邊緣交換機(jī),其中,所述第2層邊緣 交換機(jī)是DCE交換機(jī)。
18. 如權(quán)利要求16所述的第2層邊緣交換機(jī),其中,所述頭部是 MAC-in-MAC頭部。
19. 一種裝置,包括用于在包含多個(gè)第2層交換機(jī)的網(wǎng)絡(luò)中的第2層邊緣交換機(jī)處接收來 自主機(jī)的分組的裝置,其中所述分組包括仿真交換機(jī)的目的地任播硬件地 址,并且所述仿真交換機(jī)包括多個(gè)路由器;用于使用所述任播硬件地址確定所述仿真交換機(jī)的交換機(jī)標(biāo)識符的裝置;用于向所述分組添加頭部的裝置,其中所述頭部包括所述交換機(jī)標(biāo)識符;用于確定從所述第2層邊緣交換機(jī)到所述仿真交換機(jī)的最短工作路徑 的裝置;以及用于經(jīng)由所述最短工作路徑將所述分組轉(zhuǎn)發(fā)到另一第2層交換機(jī)的裝置。
20. 如權(quán)利要求19所述的裝置,其中,包含多個(gè)第2層交換機(jī)的所述 網(wǎng)絡(luò)是數(shù)據(jù)中心以太網(wǎng)DCE網(wǎng)絡(luò)。
全文摘要
在一個(gè)實(shí)施例中,提供了一種解決方案,其中,冗余路由器被當(dāng)作單個(gè)仿真交換機(jī)。當(dāng)在第2層邊緣交換機(jī)處接收到來自主機(jī)的分組時(shí),第2層邊緣交換機(jī)可以使用包含在分組中的目的地任播硬件地址來確定仿真交換機(jī)的交換機(jī)標(biāo)識符。任播硬件地址可以標(biāo)識包括多個(gè)路由器的仿真交換機(jī)。然后,可以將一頭部添加到分組中,該頭部包括交換機(jī)標(biāo)識符。接下來,分組可以沿著從第2層邊緣交換機(jī)到仿真交換機(jī)的最短路徑被轉(zhuǎn)發(fā)到另一第2層交換機(jī)。
文檔編號H04L12/28GK101601232SQ200880003496
公開日2009年12月9日 申請日期2008年1月25日 優(yōu)先權(quán)日2007年2月2日
發(fā)明者托馬斯·埃茲爾, 迪諾·法里納齊 申請人:思科技術(shù)公司