數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)方法及裝置制造方法
【專利摘要】本發(fā)明公開(kāi)了一種數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)方法及裝置,其中,方法包括以下步驟:S1:根據(jù)Fat-Tree網(wǎng)絡(luò)構(gòu)建數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)?;S2:根據(jù)多臺(tái)服務(wù)器和多臺(tái)交換機(jī)配置集中式控制器;S3:通過(guò)多臺(tái)服務(wù)器以及各層交換機(jī)與各自相鄰設(shè)備通信采集Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?;S4:發(fā)送Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⒅良惺娇刂破饕陨扇W(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?,并根?jù)全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⑦M(jìn)行錯(cuò)誤連線的檢測(cè)和恢復(fù)計(jì)算。本發(fā)明實(shí)施例的檢測(cè)方法,通過(guò)構(gòu)建數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)溥M(jìn)行錯(cuò)誤連線的檢測(cè)和恢復(fù)計(jì)算,簡(jiǎn)單快捷,無(wú)需人為判斷,更加自動(dòng)化,提高了工作效率。
【專利說(shuō)明】數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)中心網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,特別涉及一種數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)方法及裝置。
【背景技術(shù)】
[0002]為了解決傳統(tǒng)樹(shù)型拓?fù)浯嬖诳蓴U(kuò)展性差、單點(diǎn)失效、超額訂購(gòu)比較大等缺點(diǎn),因此提出了很多“富連接”拓?fù)?,例如Fat-Tree,VL2等新型拓?fù)洹_@些新型拓?fù)涞囊粋€(gè)顯著特點(diǎn)是引入的豐富的鏈路資源。然而,隨著鏈路資源的豐富,在搭建物理網(wǎng)絡(luò)時(shí),連線的復(fù)雜度也相應(yīng)地增加。以Fat-Tree網(wǎng)絡(luò)為例,使用含48個(gè)端口的交換機(jī)搭建的數(shù)據(jù)中心網(wǎng)絡(luò),總共包含27648臺(tái)服務(wù)器,總共的鏈路數(shù)量為82944條。可想而知,通過(guò)工程人員搭建這樣規(guī)模的物理網(wǎng)絡(luò)時(shí),不可避免會(huì)產(chǎn)生錯(cuò)誤連線。一旦錯(cuò)誤連線會(huì)造成物理網(wǎng)絡(luò)與網(wǎng)絡(luò)設(shè)計(jì)藍(lán)圖不一致,將導(dǎo)致網(wǎng)絡(luò)配置錯(cuò)誤,甚至發(fā)生通信錯(cuò)誤。
[0003]相關(guān)技術(shù)中檢測(cè)方法主要是通過(guò)圖同構(gòu)的思路對(duì)物理網(wǎng)絡(luò)和網(wǎng)絡(luò)設(shè)計(jì)藍(lán)圖進(jìn)行映射,進(jìn)而確定可能涉及錯(cuò)誤連線的節(jié)點(diǎn)。然而,相關(guān)技術(shù)的檢測(cè)方法不能明確指出哪些連線是錯(cuò)誤連線,還需人為進(jìn)行判斷,不能很好地滿足自動(dòng)化的要求,有待改進(jìn)。
【發(fā)明內(nèi)容】
[0004]本發(fā)明旨在至少在一定程度上解決上述相關(guān)技術(shù)中的技術(shù)問(wèn)題之一。
[0005]為此,本發(fā)明的一個(gè)目的在于提出一種能快速檢測(cè)錯(cuò)誤連線,更加自動(dòng)化化的數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)方法。
[0006]本發(fā)明的另一個(gè)目的在于提出一種數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)裝置。
[0007]為達(dá)到上述目的,本發(fā)明一方面實(shí)施例提出了一種數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)方法,包括以下步驟:S1:根據(jù)Fat-Tree網(wǎng)絡(luò)構(gòu)建數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)?,所述?shù)據(jù)中心網(wǎng)絡(luò)拓?fù)浒ǘ嗯_(tái)服務(wù)器、多臺(tái)邊緣層交換機(jī)、多臺(tái)聚集層交換機(jī)和多臺(tái)核心層交換機(jī),其中,所述多臺(tái)邊緣層交換機(jī)、所述多臺(tái)聚集層交換機(jī)和所述多臺(tái)核心層交換機(jī)均采用同構(gòu)交換機(jī),每臺(tái)服務(wù)器與所述多臺(tái)邊緣層交換機(jī)中一臺(tái)邊緣層交換機(jī)相連,并且所述多臺(tái)邊緣層交換機(jī)、多臺(tái)聚集層交換機(jī)和多臺(tái)核心層交換機(jī)的層次逐步提升;S2:根據(jù)所述多臺(tái)服務(wù)器和多臺(tái)交換機(jī)配置集中式控制器;S3:通過(guò)所述多臺(tái)服務(wù)器以及各層交換機(jī)與各自相鄰設(shè)備通信采集Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔ⅲ灰约癝4:發(fā)送所述Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⒅了黾惺娇刂破饕陨扇W(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?,并根?jù)所述全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⑦M(jìn)行錯(cuò)誤連線的檢測(cè)和恢復(fù)計(jì)算。
[0008]根據(jù)本發(fā)明實(shí)施例提出的數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)方法,通過(guò)構(gòu)建數(shù)據(jù)網(wǎng)絡(luò)中心拓?fù)?,從而采集Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?,以生成全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?,?shí)現(xiàn)根據(jù)所述全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⑦M(jìn)行錯(cuò)誤連線的檢測(cè)和恢復(fù)計(jì)算,本發(fā)明實(shí)施例不但能確定可能涉及錯(cuò)誤連線的節(jié)點(diǎn),還能快速的檢測(cè)出錯(cuò)誤連線進(jìn)行恢復(fù)計(jì)算,簡(jiǎn)單快捷,無(wú)需人為判斷,更加自動(dòng)化,提高了工作效率。
[0009]另外,根據(jù)本發(fā)明上述實(shí)施例的數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)方法還可以具有如下附加的技術(shù)特征:
[0010]進(jìn)一步地,在本發(fā)明的一個(gè)實(shí)施例中,所述通過(guò)所述多臺(tái)服務(wù)器以及各層交換機(jī)與各自相鄰設(shè)備通信采集Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?,具體包括:通過(guò)每臺(tái)服務(wù)器或每臺(tái)交換機(jī)接收所述相鄰設(shè)備的設(shè)備拓?fù)湫畔⒕S護(hù)鄰居列表,以采集所述Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?,其中,所述設(shè)備拓?fù)湫畔ū镜囟丝?、遠(yuǎn)端端口和所述相鄰設(shè)備的MAC (Media AccessControl,硬件地址)地址。
[0011]進(jìn)一步地,在本發(fā)明的一個(gè)實(shí)施例中,所述根據(jù)所述全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⑦M(jìn)行錯(cuò)誤連線的檢測(cè)和恢復(fù)計(jì)算,具體包括:根據(jù)所述全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔南轮辽戏謩e完成所述Fat-Tree網(wǎng)絡(luò)與設(shè)計(jì)藍(lán)圖的映射,以根據(jù)所述Fat-Tree網(wǎng)絡(luò)與設(shè)計(jì)藍(lán)圖的映射進(jìn)行錯(cuò)誤連線的檢測(cè)和恢復(fù)計(jì)算。
[0012]進(jìn)一步地,在本發(fā)明的一個(gè)實(shí)施例中,通過(guò)檢測(cè)所述Fat-Tree網(wǎng)絡(luò)中的每條連線的兩個(gè)端點(diǎn)是否與所述設(shè)計(jì)藍(lán)圖一致判斷在所述每條連線中是否存在連接錯(cuò)誤。
[0013]進(jìn)一步地,在本發(fā)明的一個(gè)實(shí)施例中,上述方法還包括:判斷在所述每條連線中存在連接錯(cuò)誤之后,收集錯(cuò)誤連線信息以確定錯(cuò)誤連線;根據(jù)確定的錯(cuò)誤連線建立錯(cuò)誤連線集合;以及根據(jù)所述錯(cuò)誤連線集合和所述設(shè)計(jì)藍(lán)圖進(jìn)行錯(cuò)誤連線恢復(fù)方案計(jì)算。
[0014]本發(fā)明另一方面實(shí)施例提出了一種數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)裝置,包括:構(gòu)建模塊,用于根據(jù)Fat-Tree網(wǎng)絡(luò)構(gòu)建數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)?,所述?shù)據(jù)中心網(wǎng)絡(luò)拓?fù)浒ǘ嗯_(tái)服務(wù)器、多臺(tái)邊緣層交換機(jī)、多臺(tái)聚集層交換機(jī)和多臺(tái)核心層交換機(jī),其中,所述多臺(tái)邊緣層交換機(jī)、所述多臺(tái)聚集層交換機(jī)和所述多臺(tái)核心層交換機(jī)均采用同構(gòu)交換機(jī),每臺(tái)服務(wù)器與所述多臺(tái)邊緣層交換機(jī)中一臺(tái)邊緣層交換機(jī)相連,并且所述多臺(tái)邊緣層交換機(jī)、多臺(tái)聚集層交換機(jī)和多臺(tái)核心層交換機(jī)的層次逐步提升;配置模塊,用于根據(jù)所述多臺(tái)服務(wù)器和多臺(tái)交換機(jī)配置集中式控制器;采集模塊,用于通過(guò)所述多臺(tái)服務(wù)器以及各層交換機(jī)與各自相鄰設(shè)備通信采集Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?,并發(fā)送所述Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⒅了黾惺娇刂破饕陨扇W(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?;以及檢測(cè)與恢復(fù)模塊,用于根據(jù)所述全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⑦M(jìn)行錯(cuò)誤連線的檢測(cè)和恢復(fù)計(jì)算。
[0015]根據(jù)本發(fā)明實(shí)施例提出的數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)裝置,通過(guò)構(gòu)建數(shù)據(jù)網(wǎng)絡(luò)中心拓?fù)洌瑥亩杉疐at-Tree網(wǎng)絡(luò)拓?fù)湫畔?,以生成全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?,?shí)現(xiàn)根據(jù)所述全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⑦M(jìn)行錯(cuò)誤連線的檢測(cè)和恢復(fù)計(jì)算,本發(fā)明實(shí)施例不但能確定可能涉及錯(cuò)誤連線的節(jié)點(diǎn),還能快速的檢測(cè)出錯(cuò)誤連線進(jìn)行恢復(fù)計(jì)算,簡(jiǎn)單快捷,無(wú)需人為判斷,更加自動(dòng)化,提高了工作效率。
[0016]另外,根據(jù)本發(fā)明上述實(shí)施例的數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)裝置還可以具有如下附加的技術(shù)特征:
[0017]進(jìn)一步地,在本發(fā)明的一個(gè)實(shí)施例中,所述采集模塊還用于:通過(guò)每臺(tái)服務(wù)器或每臺(tái)交換機(jī)接收所述相鄰設(shè)備的設(shè)備拓?fù)湫畔⒕S護(hù)鄰居列表,以采集所述Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔ⅲ渲?,所述設(shè)備拓?fù)湫畔ū镜囟丝凇⑦h(yuǎn)端端口和所述相鄰設(shè)備的硬件地址MAC地址。
[0018]進(jìn)一步地,在本發(fā)明的一個(gè)實(shí)施例中,所述檢測(cè)與恢復(fù)模塊還用于:根據(jù)所述全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔南轮辽戏謩e完成所述Fat-Tree網(wǎng)絡(luò)與設(shè)計(jì)藍(lán)圖的映射,以根據(jù)所述Fat-Tree網(wǎng)絡(luò)與設(shè)計(jì)藍(lán)圖的映射進(jìn)行錯(cuò)誤連線的檢測(cè)和恢復(fù)計(jì)算。
[0019]進(jìn)一步地,在本發(fā)明的一個(gè)實(shí)施例中,通過(guò)檢測(cè)所述Fat-Tree網(wǎng)絡(luò)中的每條連線的兩個(gè)端點(diǎn)是否與所述設(shè)計(jì)藍(lán)圖一致判斷在所述每條連線中是否存在連接錯(cuò)誤。
[0020]進(jìn)一步地,在本發(fā)明的一個(gè)實(shí)施例中,所述檢測(cè)與恢復(fù)模塊包括:檢測(cè)單元,用于判斷在所述每條連線中存在連接錯(cuò)誤之后,收集錯(cuò)誤連線信息以確定錯(cuò)誤連線;建立單元,用于根據(jù)確定的錯(cuò)誤連線建立錯(cuò)誤連線集合;以及恢復(fù)計(jì)算單元,用于根據(jù)所述錯(cuò)誤連線集合和所述設(shè)計(jì)藍(lán)圖進(jìn)行錯(cuò)誤連線恢復(fù)方案計(jì)算。
[0021]本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。
【專利附圖】
【附圖說(shuō)明】
[0022]本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:
[0023]圖1為根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)方法的流程圖;
[0024]圖2為根據(jù)本發(fā)明一個(gè)實(shí)施例的Fat-Tree網(wǎng)絡(luò)的設(shè)計(jì)藍(lán)圖的示意圖;
[0025]圖3為根據(jù)本發(fā)明一個(gè)實(shí)施例的Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⒌牟杉鞒虉D;
[0026]圖4為根據(jù)發(fā)明一個(gè)實(shí)施例的包含錯(cuò)誤連線的數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)涫疽鈭D;
[0027]圖5為根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)裝置的結(jié)構(gòu)示意圖;以及
[0028]圖6為根據(jù)本發(fā)明一個(gè)實(shí)施例的檢測(cè)與恢復(fù)模塊的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0029]下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過(guò)參考附圖描述的實(shí)施例是示例性的,旨在用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。
[0030]此外,術(shù)語(yǔ)“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括一個(gè)或者更多個(gè)該特征。在本發(fā)明的描述中,“多個(gè)”的含義是兩個(gè)或兩個(gè)以上,除非另有明確具體的限定。
[0031]在本發(fā)明中,除非另有明確的規(guī)定和限定,術(shù)語(yǔ)“安裝”、“相連”、“連接”、“固定”等術(shù)語(yǔ)應(yīng)做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或一體地連接;可以是機(jī)械連接,也可以是電連接;可以是直接相連,也可以通過(guò)中間媒介間接相連,可以是兩個(gè)元件內(nèi)部的連通。對(duì)于本領(lǐng)域的普通技術(shù)人員而言,可以根據(jù)具體情況理解上述術(shù)語(yǔ)在本發(fā)明中的具體含義。
[0032]在本發(fā)明中,除非另有明確的規(guī)定和限定,第一特征在第二特征之“上”或之“下”可以包括第一和第二特征直接接觸,也可以包括第一和第二特征不是直接接觸而是通過(guò)它們之間的另外的特征接觸。而且,第一特征在第二特征“之上”、“上方”和“上面”包括第一特征在第二特征正上方和斜上方,或僅僅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”包括第一特征在第二特征正上方和斜上方,或僅僅表示第一特征水平高度小于第二特征。
[0033]下面參照附圖描述根據(jù)本發(fā)明實(shí)施例提出的數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)方法及裝置,首先將參照附圖描述根據(jù)本發(fā)明實(shí)施例提出的數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)方法。參照?qǐng)D1所示,該方法包括以下步驟:
[0034]S1:根據(jù)Fat-Tree網(wǎng)絡(luò)構(gòu)建數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)?,?shù)據(jù)中心網(wǎng)絡(luò)拓?fù)浒ǘ嗯_(tái)服務(wù)器、多臺(tái)邊緣層交換機(jī)、多臺(tái)聚集層交換機(jī)和多臺(tái)核心層交換機(jī),其中,多臺(tái)邊緣層交換機(jī)、多臺(tái)聚集層交換機(jī)和多臺(tái)核心層交換機(jī)均采用同構(gòu)交換機(jī),每臺(tái)服務(wù)器與多臺(tái)邊緣層交換機(jī)中一臺(tái)邊緣層交換機(jī)相連,并且多臺(tái)邊緣層交換機(jī)、多臺(tái)聚集層交換機(jī)和多臺(tái)核心層交換機(jī)的層次逐步提升。
[0035]具體地,首先構(gòu)造一個(gè)Fat-Tree數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)?,包?多臺(tái)服務(wù)器、多臺(tái)交換機(jī),其中:
[0036]整個(gè)網(wǎng)絡(luò)采用同構(gòu)交換機(jī)。假設(shè)每個(gè)交換機(jī)的端口數(shù)量為K。整個(gè)網(wǎng)絡(luò)中包含5K2/4臺(tái)交換機(jī)。這些交換機(jī)分為三類,分別是邊緣層交換機(jī)、聚集層交換機(jī)和核心層交換機(jī)。邊緣層交換機(jī)和聚集層交換機(jī)的數(shù)量分別為Κ2/2,核心層交換機(jī)的數(shù)量為Κ2/4。邊緣層交換機(jī)、聚集層交換機(jī)和核心層交換機(jī)的層次級(jí)別是逐步提升的;
[0037]整個(gè)網(wǎng)絡(luò)服務(wù)器的數(shù)量是Κ3/4 ;
[0038]服務(wù)器、邊緣層交換機(jī)和聚集層交換機(jī)被劃分為K個(gè)集群。每個(gè)集群中服務(wù)器、邊緣層交換機(jī)和聚集層交換機(jī)的數(shù)量分別是Κ2/4、Κ/2和Κ/2。在連線正確的情況下,每一個(gè)集群中,每一臺(tái)邊緣層交換機(jī)使用Κ/2個(gè)端口與Κ/2臺(tái)服務(wù)器相連,余下的Κ/2個(gè)端口與該集群中的Κ/2臺(tái)聚集層交換機(jī)相連。每一臺(tái)服務(wù)器只與一臺(tái)邊緣層交換機(jī)相連;
[0039]在連線正確的情況下,所有聚集層交換機(jī)剩下的Κ/2個(gè)端口與Κ2/4臺(tái)核心層交換機(jī)相連,確保每臺(tái)核心層交換機(jī)與每個(gè)集群有且只有一個(gè)連接;
[0040]但網(wǎng)絡(luò)中可能存在錯(cuò)誤連線。即使存在錯(cuò)誤連線也確保每個(gè)交換機(jī)的端口都被使用。
[0041]也就是說(shuō),本發(fā)明實(shí)施例是基于Fat-Tree網(wǎng)絡(luò)。其中,F(xiàn)at-Tree網(wǎng)絡(luò)的拓?fù)涮攸c(diǎn)是:整個(gè)網(wǎng)絡(luò)采用同構(gòu)交換機(jī)。假設(shè)每個(gè)交換機(jī)的端口數(shù)量為K。整個(gè)網(wǎng)絡(luò)包括Κ3/4臺(tái)服務(wù)器和5Κ2/4臺(tái)交換機(jī)。這些交換機(jī)分為三類,分別是邊緣層交換機(jī)、聚集層交換機(jī)和核心層交換機(jī)。邊緣層交換機(jī)和聚集層交換機(jī)的數(shù)量分別為Κ2/2,核心層交換機(jī)的數(shù)量為Κ2/4。邊緣層交換機(jī)和聚集層交換機(jī)被劃分為K個(gè)集群。每個(gè)集群中邊緣層交換機(jī)和聚集層交換機(jī)的數(shù)量分別是Κ/2和Κ/2。在連線正確的情況下,每一個(gè)集群中,每一臺(tái)邊緣層交換機(jī)使用Κ/2個(gè)端口與Κ/2臺(tái)服務(wù)器相連,余下的Κ/2個(gè)端口與該集群中的Κ/2臺(tái)聚集層交換機(jī)相連。每一臺(tái)服務(wù)器只與一臺(tái)邊緣層交換機(jī)相連。
[0042]進(jìn)一步地,根據(jù)Fat-Tree網(wǎng)絡(luò)的拓?fù)涮攸c(diǎn)和搭建物理網(wǎng)絡(luò)時(shí)使用的框架,則可以作出如下假設(shè):
[0043]I)服務(wù)器與邊緣層交換機(jī)之間不存在錯(cuò)誤連線。因?yàn)樵诖罱ㄎ锢砭W(wǎng)絡(luò)時(shí),工程人員通常會(huì)采用基于機(jī)架的組建方式。在這種方式下,位于同一邊緣層交換機(jī)下的所有服務(wù)器將被放置在同一機(jī)架里,該邊緣層交換機(jī)被放置在該機(jī)架頂部。因此,在這種情況下,月艮務(wù)器與邊緣層交換機(jī)之間幾乎不會(huì)出現(xiàn)錯(cuò)誤連線。
[0044]2)錯(cuò)誤連線只會(huì)存在于相鄰的兩級(jí)交換機(jī)之間,即錯(cuò)誤連線只會(huì)存在邊緣層交換機(jī)和聚集層交換機(jī)之間,或聚集層交換機(jī)和核心層交換機(jī)之間。這是因?yàn)橥惤粨Q機(jī)通常被放置在同一機(jī)架上,而在Fat-Tree網(wǎng)絡(luò)中不存在跨級(jí)的連線,因此在實(shí)際組網(wǎng)過(guò)程中不太可能發(fā)生連接邊緣層交換機(jī)和核心層交換機(jī)的錯(cuò)誤連線。
[0045]3)由于Fat-Tree網(wǎng)絡(luò)中使用同構(gòu)的交換機(jī),因此假設(shè)每個(gè)交換機(jī)端口都被使用。
[0046]另外,在Fat-Tree網(wǎng)絡(luò)的設(shè)計(jì)藍(lán)圖中,不同層級(jí)之間的連線具有一定的規(guī)律性:
[0047]I)在每一個(gè)集群中,不同邊緣層交換機(jī)中索引相同的端口連接的是該集群中同一個(gè)聚集層交換機(jī)。參照?qǐng)D2所示,第一個(gè)集群里的邊緣層交換機(jī)都使用索引為2的端口連接至第一個(gè)聚集層交換機(jī)Al,而所有邊緣層交換機(jī)索引為3的端口都連接至第二個(gè)聚集層交換機(jī)A2。需要說(shuō)明的是,圖2為根據(jù)本發(fā)明一個(gè)實(shí)施例的Fat-Tree網(wǎng)絡(luò)的設(shè)計(jì)藍(lán)圖的示意圖,圖中為了舉例說(shuō)明,使K = 4,交換機(jī)El?E8為邊緣層交換機(jī),交換機(jī)Al?A8為聚集層交換機(jī),交換機(jī)Cl?C4為核心層交換機(jī),SI?S16為服務(wù)器,O?3為交換機(jī)轉(zhuǎn)發(fā)端口的索引值。
[0048]2)同一個(gè)核心層交換機(jī)會(huì)連接位于不同集群的聚集層交換機(jī)。這些聚集層交換機(jī)在各自集群中所處的邏輯位置是相同的,而且使用的端口索引也是一致的。參照?qǐng)D2所示,核心層交換機(jī)Cl分別連接至4個(gè)聚集層交換機(jī):聚集層交換機(jī)Al、聚集層交換機(jī)A3、聚集層交換機(jī)A5和聚集層交換機(jī)A7。這4個(gè)聚集層交換機(jī)都是每個(gè)集群中的第一個(gè)交換機(jī),而且均使用索引值為2的端口與Cl相連。
[0049]S2:根據(jù)多臺(tái)服務(wù)器和多臺(tái)交換機(jī)配置集中式控制器。
[0050]其次,配置一個(gè)集中式控制器(controller)。該集中式控制器可以與網(wǎng)絡(luò)中任意一臺(tái)服務(wù)器或交換機(jī)通信。
[0051]S3:通過(guò)多臺(tái)服務(wù)器以及各層交換機(jī)與各自相鄰設(shè)備通信采集Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔ⅰ7?wù)器以及各層交換機(jī)與鄰居相互通信,收集物理網(wǎng)絡(luò)拓?fù)湫畔ⅰ?br>
[0052]其中,在本發(fā)明的一個(gè)實(shí)施例中,通過(guò)多臺(tái)服務(wù)器以及各層交換機(jī)與各自相鄰設(shè)備通信采集Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?,具體包括:通過(guò)每臺(tái)服務(wù)器或每臺(tái)交換機(jī)接收相鄰設(shè)備的設(shè)備拓?fù)湫畔⒕S護(hù)鄰居列表,以采集Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?,其中,設(shè)備拓?fù)湫畔ū镜囟丝?、遠(yuǎn)端端口和相鄰設(shè)備的硬件地址MAC地址。
[0053]S4:發(fā)送Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⒅良惺娇刂破饕陨扇W(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?,并根?jù)全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⑦M(jìn)行錯(cuò)誤連線的檢測(cè)和恢復(fù)計(jì)算。
[0054]最后,各服務(wù)器和交換機(jī)將收集到的拓?fù)湫畔l(fā)送給集中式控制器,集中式控制器匯總所有服務(wù)器和交換機(jī)收集到的拓?fù)湫畔?,形成全網(wǎng)物理拓?fù)湫畔⒓慈W(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?。其中,在本發(fā)明的實(shí)施例中,由于本發(fā)明實(shí)施例是基于Fat-Tree網(wǎng)絡(luò),因此物理網(wǎng)絡(luò)相當(dāng)于Fat-Tree網(wǎng)絡(luò)。
[0055]進(jìn)一步地,在本發(fā)明的一個(gè)實(shí)施例中,根據(jù)全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⑦M(jìn)行錯(cuò)誤連線的檢測(cè)和恢復(fù)計(jì)算,具體包括:根據(jù)全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔南轮辽戏謩e完成Fat-Tree網(wǎng)絡(luò)與設(shè)計(jì)藍(lán)圖的映射,以根據(jù)Fat-Tree網(wǎng)絡(luò)與設(shè)計(jì)藍(lán)圖的映射進(jìn)行錯(cuò)誤連線的檢測(cè)和恢復(fù)計(jì)算。
[0056]其中,在本發(fā)明的一個(gè)實(shí)施例中,通過(guò)檢測(cè)Fat-Tree網(wǎng)絡(luò)中的每條連線的兩個(gè)端點(diǎn)是否與設(shè)計(jì)藍(lán)圖一致判斷在每條連線中是否存在連接錯(cuò)誤。
[0057]進(jìn)一步地,在本發(fā)明的一個(gè)實(shí)施例中,上述方法還包括:判斷在每條連線中存在連接錯(cuò)誤之后,收集錯(cuò)誤連線信息以確定錯(cuò)誤連線;根據(jù)確定的錯(cuò)誤連線建立錯(cuò)誤連線集合;根據(jù)錯(cuò)誤連線集合和設(shè)計(jì)藍(lán)圖進(jìn)行錯(cuò)誤連線恢復(fù)方案計(jì)算。
[0058]具體地,在本發(fā)明的一個(gè)實(shí)施例中,集中式控制器在匯總所有服務(wù)器和交換機(jī)收集到的拓?fù)湫畔?,形成全網(wǎng)物理拓?fù)湫畔⒅?,則根據(jù)掌握的物理拓?fù)湫畔?,利用拓?fù)涮攸c(diǎn),完成物理拓?fù)渑c設(shè)計(jì)藍(lán)圖的映射,并根據(jù)映射結(jié)果,檢測(cè)錯(cuò)誤連線,以及計(jì)算錯(cuò)誤連線的恢復(fù)方案相當(dāng)于恢復(fù)計(jì)算。
[0059]本發(fā)明實(shí)施例的思路在于:數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)湓O(shè)計(jì),各級(jí)交換機(jī)之間的連線有一定的規(guī)律性。通過(guò)拓?fù)湓O(shè)計(jì)的特點(diǎn),可以快速地實(shí)現(xiàn)物理網(wǎng)絡(luò)和設(shè)計(jì)藍(lán)圖的映射,確定每臺(tái)交換機(jī)的類型和其邏輯位置(即其在設(shè)計(jì)藍(lán)圖中的位置)。待每類交換機(jī)的類型和邏輯位置確定后,通過(guò)檢測(cè)物理鄰居與設(shè)計(jì)藍(lán)圖的異同,確定連線是否錯(cuò)誤。待錯(cuò)誤連線全部收集完畢后,可以根據(jù)錯(cuò)誤連線之間的關(guān)系設(shè)計(jì)相應(yīng)的算法求解出恢復(fù)錯(cuò)誤連線的方案。
[0060]本發(fā)明實(shí)施例提出的物理網(wǎng)絡(luò)和設(shè)計(jì)藍(lán)圖的映射算法效率遠(yuǎn)遠(yuǎn)高于基于圖同構(gòu)理論的算法,并且能夠給出錯(cuò)誤連線的恢復(fù)方案,不僅提高了恢復(fù)錯(cuò)誤連線的效率,還降低了工作人員操作過(guò)程中的人為錯(cuò)誤。
[0061 ] 下面對(duì)檢測(cè)錯(cuò)誤連線進(jìn)行詳細(xì)贅述。
[0062]檢測(cè)錯(cuò)誤連線的過(guò)程大致分為以下幾個(gè)步驟:
[0063]S1:服務(wù)器以及各層交換機(jī)與鄰居相互通信,收集物理網(wǎng)絡(luò)拓?fù)湫畔ⅰ?br>
[0064]在完成物理網(wǎng)絡(luò)與設(shè)計(jì)藍(lán)圖的映射前,各服務(wù)器和交換機(jī)還未配置IP地址,因此在收集物理網(wǎng)絡(luò)拓?fù)潆A段,我們使用MAC地址唯一標(biāo)識(shí)服務(wù)器和交換機(jī)。由于交換機(jī)具有多個(gè)端口、每個(gè)端口都有一個(gè)MAC地址,我們使用第一個(gè)端口的MAC地址標(biāo)識(shí)一個(gè)交換機(jī)。而在Fat-Tree網(wǎng)絡(luò)中,每臺(tái)服務(wù)器只使有一個(gè)網(wǎng)卡連接至網(wǎng)絡(luò),因此我們使用該網(wǎng)卡的MAC地址標(biāo)識(shí)該服務(wù)器。
[0065]服務(wù)器和交換機(jī)通過(guò)以下機(jī)制收集拓?fù)湫畔?每臺(tái)服務(wù)器和交換機(jī)上分別部署了一個(gè)代理,用于發(fā)送和接收拓?fù)湫畔ⅰC颗_(tái)服務(wù)器或交換機(jī)會(huì)定期向鄰居通告自己的拓?fù)湫畔?,該信息包含自己的MAC地址和發(fā)送該條信息的端口索引。當(dāng)服務(wù)器或交換機(jī)通過(guò)代理收集到來(lái)自鄰居的拓?fù)湫畔ⅲ瑫?huì)在本地維護(hù)一個(gè)鄰居列表。每一個(gè)表項(xiàng)的具體信息包括:I)本地端口索引。該端口用于連接相應(yīng)的鄰居;2)鄰居端口索引。鄰居使用該端口來(lái)連接自己;3)鄰居的MAC地址。后兩部分信息來(lái)自于代理接收到的拓?fù)湫畔ⅰ?br>
[0066]參照?qǐng)D3所示,圖3為邊緣層交換機(jī)E7搜集鄰居的拓?fù)湫畔⒌牧鞒虉D,包括以下幾個(gè)步驟:1)鄰居(S16和AS)向E7發(fā)送拓?fù)湫畔ⅲ?)E7合并,并處理拓?fù)湫畔?,維護(hù)鄰居列表。每一個(gè)鄰居列表的信息包括本地端口、遠(yuǎn)端端口和鄰居的MAC地址;3)待E7搜集完所有鄰居的拓?fù)湫畔⒑?,將整理完畢的拓?fù)湫畔l(fā)送給集中控制器。需要說(shuō)明的是,如圖所示,S16為編號(hào)為16的服務(wù)器,E7為編號(hào)為7的邊緣層交換機(jī),AS為編號(hào)為8的聚集層交換機(jī)。
[0067]S2:集中控制器從各服務(wù)器和交換機(jī)收集網(wǎng)絡(luò)拓?fù)湫畔?,完成物理網(wǎng)絡(luò)與設(shè)計(jì)藍(lán)圖的映射。
[0068]當(dāng)所有服務(wù)器和交換機(jī)都按上述流程收集所有鄰居的拓?fù)湫畔⒉l(fā)送給集中控制器后,集中控制器便收集到了完整的物理網(wǎng)絡(luò)拓?fù)湫畔ⅰH缓蠹锌刂破魇褂脧南轮辽系捻樞蚍謩e完成物理網(wǎng)絡(luò)與設(shè)計(jì)藍(lán)圖的映射:確定交換機(jī)的類型和邏輯位置。即先完成邊緣層交換機(jī)的映射,再完成聚集層交換機(jī)的映射,最后確定核心層交換機(jī)。
[0069]由于假設(shè)服務(wù)器和邊緣層交換機(jī)之間沒(méi)有錯(cuò)誤連線,因此可以肯定服務(wù)器的鄰居就是邊緣層交換機(jī)。為了確定邊緣層交換機(jī)的索引,集中控制器靜態(tài)配置了服務(wù)器的位置和MAC地址的映射信息。這樣,根據(jù)服務(wù)器的位置即可確定邊緣層交換機(jī)的邏輯位置。以圖2為例,服務(wù)器SI是第一個(gè)服務(wù)器,其鄰居即為第一個(gè)集群中的第一個(gè)邊緣層交換機(jī)。因此通過(guò)分析服務(wù)器SI的鄰居列表信息,即可知道其本地端口 O連接的鄰居是第一個(gè)邊緣層交換機(jī)El。
[0070]確定了邊緣層交換機(jī)后,接下來(lái)以集群為單位確定聚集層交換機(jī)和其邏輯位置。由于在每一個(gè)集群中,不同邊緣層交換機(jī)中索引相同的端口連接的該集群中的同一個(gè)聚集層交換機(jī),我們使用這個(gè)規(guī)律確定聚集層交換機(jī)和其邏輯位置:遍歷某個(gè)集群中的邊緣層交換機(jī)的某一相同端口即確定一個(gè)聚集層交換機(jī)和其邏輯位置。正常情況下,同一集群中的所有邊緣層交換機(jī)的同一端口連接的是同一個(gè)聚集層交換機(jī),但錯(cuò)誤連線可能導(dǎo)致連接至不同的聚集層交換機(jī)。因此,在確定聚集層交換機(jī)的時(shí)候,使用Major Voting算法。具體做法是:在對(duì)同一集群中的所有邊緣層交換機(jī)的同一端口連接的鄰居進(jìn)行遍歷時(shí),為其所有鄰居設(shè)置一個(gè)計(jì)數(shù)值,該值的初始值為零。在遍歷過(guò)程中,每遍歷一個(gè)鄰居,即將該鄰居的計(jì)數(shù)值加一。正常情況下,當(dāng)遍歷完后計(jì)數(shù)值大于零的鄰居只有一個(gè)。但錯(cuò)誤連接可能導(dǎo)致遍歷完后計(jì)數(shù)值大于零的鄰居有多個(gè)。其中計(jì)數(shù)值最大的鄰居即為相應(yīng)的聚集層交換機(jī)。如果計(jì)數(shù)值最大的鄰居有多個(gè),則隨機(jī)選擇一個(gè)作為相應(yīng)的聚集層交換機(jī)。每次遍歷時(shí)使用的邊緣層交換機(jī)的端口索引可以確定該聚集層交換機(jī)的邏輯位置。
[0071]參照?qǐng)D4所示,假設(shè)通過(guò)服務(wù)器已經(jīng)確定了邊緣層交換機(jī),從而可以通過(guò)分析第一個(gè)集群中的邊緣層交換機(jī)El和E2的鄰居確定相應(yīng)的聚集層交換機(jī)。首先,本發(fā)明實(shí)施例分別遍歷El和E2的索引為2的端口。通過(guò)分析其鄰居列表,從而可以得知,El的鄰居是Al,而E2的鄰居也是Al。因此,通過(guò)這輪遍歷,可以得知Al即為第一個(gè)集群的第一個(gè)聚集層交換機(jī)。接下來(lái),分別遍歷El和E2的索引為3的端口。通過(guò)分析其鄰居列表,從而可以得知,El的鄰居是A3,而E2的鄰居也是A2。因此,通過(guò)這輪遍歷,A2或A3對(duì)應(yīng)的計(jì)數(shù)值均為1,兩者都有可能是第一個(gè)集群的第二個(gè)聚集層交換機(jī)。因此隨機(jī)選擇一個(gè)即可。需要說(shuō)明的是,在實(shí)際部署中,錯(cuò)誤連線數(shù)量明顯小于正確連線,因此,在K較大的情況下,不太會(huì)出現(xiàn)示例中出現(xiàn)的計(jì)數(shù)值相等的情況,通過(guò)Major Voting算法在絕大多數(shù)情況下都可以明確得到結(jié)果。
[0072]如圖4所示,交換機(jī)El?E8為邊緣層交換機(jī),交換機(jī)Al?A8為聚集層交換機(jī),交換機(jī)Cl?C4為核心層交換機(jī),SI?S16為服務(wù)器,O?3為交換機(jī)轉(zhuǎn)發(fā)端口的索引值,黑色實(shí)線為正確的連線,黑色虛線為錯(cuò)誤的連線。
[0073]確定了聚集層交換機(jī),接下來(lái)就是確定核心層交換機(jī)。在無(wú)錯(cuò)誤連線的情況下,同一個(gè)核心層交換機(jī)會(huì)連接位于不同集群的聚集層交換機(jī),而且這些聚集層交換機(jī)在各自集群中所處的位置是相同的、且使用的端口索引也一樣。但錯(cuò)誤連線可能會(huì)導(dǎo)致同一核心層交換機(jī)連接的聚集層交換機(jī)在不同集群中的位置不同,或者使用不同的端口。因此,我們同樣使用Major Voting算法確定核心層交換機(jī)及其索引。我們對(duì)不同集群中索引相同的聚集層交換機(jī)的相同端口進(jìn)行遍歷。在遍歷過(guò)程中,每遍歷一個(gè)鄰居,即將該鄰居的計(jì)數(shù)值加一。當(dāng)遍歷完后,計(jì)數(shù)值最大的即為相應(yīng)的核心層交換機(jī)。同樣地,如果計(jì)數(shù)值最大的鄰居有多個(gè),則隨機(jī)選擇一個(gè)作為相應(yīng)的核心層交換機(jī)。根據(jù)遍歷使用的端口索引,即可確定該核心層交換機(jī)的邏輯位置。
[0074]參照?qǐng)D4所示,本發(fā)明實(shí)施例通過(guò)遍歷所有集群中第一個(gè)聚集層交換機(jī)索引為2的端口的鄰居可確定第一個(gè)核心層交換機(jī)。通過(guò)分析這些聚集層交換機(jī)的鄰居,可以發(fā)現(xiàn),所有鄰居均為交換機(jī)Cl,所以Cl即為第一個(gè)核心層交換機(jī)。同理,通過(guò)遍歷所有集群中第二個(gè)聚集層交換機(jī)索引為2的端口的鄰居可確定第三個(gè)核心層交換機(jī)。通過(guò)分析這些聚集層交換機(jī)的鄰居,可以確定C3是第三個(gè)核心層交換機(jī)。
[0075]當(dāng)所有交換機(jī)的類型和邏輯位置都確定后,就可以按照設(shè)計(jì)藍(lán)圖對(duì)所有交換機(jī)和服務(wù)器配置相應(yīng)的IP地址。
[0076]S3:集中控制器檢測(cè)錯(cuò)誤連線并計(jì)算出恢復(fù)方案。
[0077]完成了物理網(wǎng)絡(luò)和設(shè)計(jì)藍(lán)圖的映射后,接下來(lái)的工作就是對(duì)錯(cuò)誤連線的檢測(cè)。此時(shí)物理網(wǎng)絡(luò)中的服務(wù)器和交換機(jī)都與設(shè)計(jì)藍(lán)圖中的服務(wù)器和交換機(jī)一一對(duì)應(yīng)。通過(guò)檢測(cè)物理網(wǎng)絡(luò)中的每條連線(即鏈路)的兩個(gè)端點(diǎn)是否與設(shè)計(jì)藍(lán)圖一致即可判斷該條連線是否是錯(cuò)誤連線。我們使用矢量{{IPpPi},{IPj, PjlI代表一條連線,其中{IPi,PJ和{IPj,Pj}分別表示該連線的兩個(gè)端點(diǎn),IP*表示的是連線某一端點(diǎn)的IP地址,P*表示的是該條連線所占用的端口索引。
[0078]參照?qǐng)D4所示,本發(fā)明實(shí)施例分析到交換機(jī)El的索引值為3的端口。根據(jù)設(shè)計(jì)藍(lán)圖,它的鄰居應(yīng)該是聚集層交換機(jī)A2。但分析物理拓?fù)涞泥従有畔?,發(fā)現(xiàn)其鄰居是聚集層交換機(jī)A3,由此可以判定連線{{El,3},{A3, I}}是一條錯(cuò)誤連線。同理,當(dāng)分析交換機(jī)E4索引值為2的端口時(shí),根據(jù)設(shè)計(jì)藍(lán)圖,它的鄰居應(yīng)該是聚集層交換機(jī)A3。但分析物理拓?fù)涞泥従有畔?,發(fā)現(xiàn)其鄰居是聚集層交換機(jī)A2,由此可以判定連線{{E4,2},{A2,0}}是一條錯(cuò)誤連線。
[0079]進(jìn)一步地,檢測(cè)完網(wǎng)絡(luò)中所有的錯(cuò)誤連線后,接下來(lái)的工作就是計(jì)算這些錯(cuò)誤連線對(duì)應(yīng)的恢復(fù)方案?;謴?fù)方案實(shí)質(zhì)上是通過(guò)比較設(shè)計(jì)藍(lán)圖和物理網(wǎng)絡(luò)中的錯(cuò)誤連線計(jì)算得到的。通過(guò)第3步,我們可以得到一個(gè)包含所有錯(cuò)誤連線的集合。計(jì)算錯(cuò)誤連線的恢復(fù)方案時(shí),我們將從錯(cuò)誤連線的集合中隨機(jī)選擇一條錯(cuò)誤連線,我們用{{IPpPi},{IPj, PjII表示。然后,我們隨機(jī)選擇一個(gè)端點(diǎn){ΙΡ」,Ρ」},通過(guò)設(shè)計(jì)藍(lán)圖,我們可以得到該端點(diǎn)正確應(yīng)該連線至端點(diǎn){IPk,Pk}。因此,我們可以計(jì)算得到該條錯(cuò)誤連線的恢復(fù)方案是{{IPj, PjI, {IPk,Pk}}。由于之前,我們假設(shè)所有端口都被使用,因此我們可以肯定端點(diǎn){IPk,Pk}必定是某條錯(cuò)誤連線的一個(gè)端點(diǎn)。因此,我們通過(guò)搜索錯(cuò)誤連線集合,可以得到端點(diǎn){IPk,Pk}對(duì)應(yīng)的錯(cuò)誤連線,假設(shè)為{{IPk,Pk},{IPm, PJ1如果此時(shí)端點(diǎn){IPm,Pm}與我們最初選擇的錯(cuò)誤連線的端點(diǎn)({IPi,PJ)不相同,接下來(lái)我們又可以通過(guò)設(shè)計(jì)藍(lán)圖得到端點(diǎn){IPm, PJ相應(yīng)的正確連線為{{IPm,PJ, {IPn, pn}}。否則,我們?yōu)橐唤M錯(cuò)誤連線計(jì)算出相應(yīng)的恢復(fù)方案。如果還有錯(cuò)誤連線未被處理,則重復(fù)上述過(guò)程,直至為所有錯(cuò)誤連線計(jì)算了相應(yīng)的正確連線。
[0080]參照?qǐng)D4所示,網(wǎng)絡(luò)中有兩條錯(cuò)誤連線,分別是{{E1,3},{A3, I}}和{{E4, 2},{A2, 0}} ο我們首先隨機(jī)選擇一條,假設(shè)選擇{{E1, 3},{A3, 1}}。因此,根據(jù)設(shè)計(jì)藍(lán)圖,可以得知,A3索引為I的端口連接的是E4的索引為2的端口,因此恢復(fù)出一條正確連線為{{A3,1},{E4,2}}。而可以肯定的是E4的索引為2的端口肯定連接一條錯(cuò)誤連線,即{{E4,2},{A2,0}}。然后,我們可以根據(jù)設(shè)計(jì)藍(lán)圖確定A2索引為O的端口連接至El的索引為3的端口。到此,又恢復(fù)出另一條正確連接為{{A2,0},{El,3}}。因?yàn)閧El,3}與我們選擇的第一條錯(cuò)誤連線的某一端相同,至此,我們處理完了一組錯(cuò)誤連線。如果還有未處理的錯(cuò)誤連線,則重復(fù)上述操作,直至所有錯(cuò)誤連線都已經(jīng)處理,并計(jì)算出相應(yīng)的正確連線。
[0081]本發(fā)明實(shí)施例建立了一個(gè)Fat-Tree拓?fù)?。其中,本發(fā)明實(shí)施例做錯(cuò)誤連線的檢測(cè)和恢復(fù)實(shí)驗(yàn)時(shí),使用端口數(shù)量均為80的交換機(jī)。本發(fā)明實(shí)施例分別設(shè)置錯(cuò)誤連線占所有連線數(shù)量的百分比分別為5%、10%、15%和20%。實(shí)驗(yàn)結(jié)果顯示,在所有情況下,檢測(cè)錯(cuò)誤連線所消耗的時(shí)間不到28毫秒。而已有方案耗時(shí)均為秒級(jí)。另外,在端口數(shù)量均為32、錯(cuò)誤連線百分比為20%的情況下,計(jì)算恢復(fù)方案所消耗的時(shí)間也不足90毫秒。實(shí)驗(yàn)結(jié)果表明,本發(fā)明實(shí)施例能夠更加快速的檢測(cè)出錯(cuò)誤連線、并能夠計(jì)算出其恢復(fù)方案,為工程人員恢復(fù)錯(cuò)誤連線提供有效的指導(dǎo)。
[0082]根據(jù)本發(fā)明實(shí)施例提出的數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)方法,通過(guò)構(gòu)建數(shù)據(jù)網(wǎng)絡(luò)中心拓?fù)?,從而采集Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔ⅲ陨扇W(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?,?shí)現(xiàn)根據(jù)所述全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⑦M(jìn)行錯(cuò)誤連線的檢測(cè)和恢復(fù)計(jì)算。通過(guò)充分利用數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)涞奶攸c(diǎn),本發(fā)明實(shí)施例的方法不但能確定可能涉及錯(cuò)誤連線的節(jié)點(diǎn),還能快速的檢測(cè)出錯(cuò)誤連線,以及計(jì)算錯(cuò)誤連線的恢復(fù)方案,為工程人員快速恢復(fù)錯(cuò)誤連線提供有力的知道,簡(jiǎn)單快捷,無(wú)需人為判斷,更加自動(dòng)化,提高了工作效率。
[0083]其次參照附圖描述根據(jù)本發(fā)明實(shí)施例提出的數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)裝置。參照?qǐng)D5所示,該檢測(cè)裝置10包括:構(gòu)建模塊100、配置模塊200、采集模塊300和檢測(cè)與恢復(fù)模塊400。
[0084]其中,構(gòu)建模塊100用于根據(jù)Fat-Tree網(wǎng)絡(luò)構(gòu)建數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)?,?shù)據(jù)中心網(wǎng)絡(luò)拓?fù)浒ǘ嗯_(tái)服務(wù)器、多臺(tái)邊緣層交換機(jī)、多臺(tái)聚集層交換機(jī)和多臺(tái)核心層交換機(jī),其中,多臺(tái)邊緣層交換機(jī)、多臺(tái)聚集層交換機(jī)和多臺(tái)核心層交換機(jī)均采用同構(gòu)交換機(jī),每臺(tái)服務(wù)器與多臺(tái)邊緣層交換機(jī)中一臺(tái)邊緣層交換機(jī)相連,并且多臺(tái)邊緣層交換機(jī)、多臺(tái)聚集層交換機(jī)和多臺(tái)核心層交換機(jī)的層次逐步提升。配置模塊200用于根據(jù)多臺(tái)服務(wù)器和多臺(tái)交換機(jī)配置集中式控制器。采集模塊300用于通過(guò)多臺(tái)服務(wù)器以及各層交換機(jī)與各自相鄰設(shè)備通信采集Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?,并發(fā)送Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⒅良惺娇刂破饕陨扇W(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?。檢測(cè)與恢復(fù)模塊400用于根據(jù)全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⑦M(jìn)行錯(cuò)誤連線的檢測(cè)和恢復(fù)計(jì)算。
[0085]具體地,首先構(gòu)造一個(gè)Fat-Tree數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)洌?多臺(tái)服務(wù)器、多臺(tái)交換機(jī),其中:
[0086]整個(gè)網(wǎng)絡(luò)采用同構(gòu)交換機(jī)。假設(shè)每個(gè)交換機(jī)的端口數(shù)量為K。整個(gè)網(wǎng)絡(luò)中包含5K2/4臺(tái)交換機(jī)。這些交換機(jī)分為三類,分別是邊緣層交換機(jī)、聚集層交換機(jī)和核心層交換機(jī)。邊緣層交換機(jī)和聚集層交換機(jī)的數(shù)量分別為Κ2/2,核心層交換機(jī)的數(shù)量為Κ2/4。邊緣層交換機(jī)、聚集層交換機(jī)和核心層交換機(jī)的層次級(jí)別是逐步提升的;
[0087]整個(gè)網(wǎng)絡(luò)服務(wù)器的數(shù)量是Κ3/4 ;
[0088]服務(wù)器、邊緣層交換機(jī)和聚集層交換機(jī)被劃分為K個(gè)集群。每個(gè)集群中服務(wù)器、邊緣層交換機(jī)和聚集層交換機(jī)的數(shù)量分別是Κ2/4、Κ/2和Κ/2。在連線正確的情況下,每一個(gè)集群中,每一臺(tái)邊緣層交換機(jī)使用Κ/2個(gè)端口與Κ/2臺(tái)服務(wù)器相連,余下的Κ/2個(gè)端口與該集群中的Κ/2臺(tái)聚集層交換機(jī)相連。每一臺(tái)服務(wù)器只與一臺(tái)邊緣層交換機(jī)相連;
[0089]在連線正確的情況下,所有聚集層交換機(jī)剩下的Κ/2個(gè)端口與Κ2/4臺(tái)核心層交換機(jī)相連,確保每臺(tái)核心層交換機(jī)與每個(gè)集群有且只有一個(gè)連接;
[0090]但網(wǎng)絡(luò)中可能存在錯(cuò)誤連線。即使存在錯(cuò)誤連線也確保每個(gè)交換機(jī)的端口都被使用。
[0091]也就是說(shuō),本發(fā)明實(shí)施例是基于Fat-Tree網(wǎng)絡(luò)。其中,F(xiàn)at-Tree網(wǎng)絡(luò)的拓?fù)涮攸c(diǎn)是:整個(gè)網(wǎng)絡(luò)采用同構(gòu)交換機(jī)。假設(shè)每個(gè)交換機(jī)的端口數(shù)量為K。整個(gè)網(wǎng)絡(luò)服務(wù)器的數(shù)量是Κ3/4和5Κ2/4臺(tái)交換機(jī)。這些交換機(jī)分為三類,分別是邊緣層交換機(jī)、聚集層交換機(jī)和核心層交換機(jī)。邊緣層交換機(jī)和聚集層交換機(jī)的數(shù)量分別為Κ2/2,核心層交換機(jī)的數(shù)量為Κ2/4。邊緣層交換機(jī)和聚集層交換機(jī)被劃分為K個(gè)集群。每個(gè)集群中邊緣層交換機(jī)和聚集層交換機(jī)的數(shù)量分別是Κ/2和Κ/2。在連線正確的情況下,每一個(gè)集群中,每一臺(tái)邊緣層交換機(jī)使用Κ/2個(gè)端口與Κ/2臺(tái)服務(wù)器相連,余下的Κ/2個(gè)端口與該集群中的Κ/2臺(tái)聚集層交換機(jī)相連。每一臺(tái)服務(wù)器只與一臺(tái)邊緣層交換機(jī)相連。
[0092]進(jìn)一步地,根據(jù)Fat-Tree網(wǎng)絡(luò)的拓?fù)涮攸c(diǎn)和搭建物理網(wǎng)絡(luò)時(shí)使用的框架,則可以作出如下假設(shè):
[0093]I)服務(wù)器與邊緣層交換機(jī)之間不存在錯(cuò)誤連線。因?yàn)樵诖罱ㄎ锢砭W(wǎng)絡(luò)時(shí),工程人員通常會(huì)采用基于機(jī)架的組建方式。在這種方式下,位于同一邊緣層交換機(jī)下的所有服務(wù)器將被放置在同一機(jī)架里,該邊緣層交換機(jī)被放置在該機(jī)架頂部。因此,在這種情況下,月艮務(wù)器與邊緣層交換機(jī)之間幾乎不會(huì)出現(xiàn)錯(cuò)誤連線。
[0094]2)錯(cuò)誤連線只會(huì)存在于相鄰的兩級(jí)交換機(jī)之間,即錯(cuò)誤連線只會(huì)存在邊緣層交換機(jī)和聚集層交換機(jī)之間,或聚集層交換機(jī)和核心層交換機(jī)之間。這是因?yàn)橥惤粨Q機(jī)通常被放置在同一機(jī)架上,而在Fat-Tree網(wǎng)絡(luò)中不存在跨級(jí)的連線,因此在實(shí)際組網(wǎng)過(guò)程中不太可能發(fā)生連接邊緣層交換機(jī)和核心層交換機(jī)的錯(cuò)誤連線。
[0095]3)由于Fat-Tree網(wǎng)絡(luò)中使用同構(gòu)的交換機(jī),因此假設(shè)每個(gè)交換機(jī)端口都被使用。
[0096]另外,在Fat-Tree網(wǎng)絡(luò)的設(shè)計(jì)藍(lán)圖中,不同層級(jí)之間的連線具有一定的規(guī)律性:
[0097]I)在每一個(gè)集群中,不同邊緣層交換機(jī)中索引相同的端口連接的是該集群中同一個(gè)聚集層交換機(jī)。參照?qǐng)D2所示,第一個(gè)集群里的邊緣層交換機(jī)都使用索引為2的端口連接至第一個(gè)聚集層交換機(jī)Al,而所有邊緣層交換機(jī)索引為3的端口都連接至第二個(gè)聚集層交換機(jī)Α2。需要說(shuō)明的是,圖2為根據(jù)本發(fā)明一個(gè)實(shí)施例的Fat-Tree網(wǎng)絡(luò)的設(shè)計(jì)藍(lán)圖的示意圖,圖中為了舉例說(shuō)明,使K = 4,交換機(jī)El?Ε8為邊緣層交換機(jī),交換機(jī)Al?Α8為聚集層交換機(jī),交換機(jī)Cl?C4為核心層交換機(jī),SI?S16為服務(wù)器,O?3為交換機(jī)轉(zhuǎn)發(fā)端口的索引值。
[0098]2)同一個(gè)核心層交換機(jī)會(huì)連接位于不同集群的聚集層交換機(jī)。這些聚集層交換機(jī)在各自集群中所處的邏輯位置是相同的,而且使用的端口索引也是一致的。參照?qǐng)D2所示,核心層交換機(jī)Cl分別連接至4個(gè)聚集層交換機(jī):聚集層交換機(jī)Al、聚集層交換機(jī)A3、聚集層交換機(jī)Α5和聚集層交換機(jī)Α7。這4個(gè)聚集層交換機(jī)都是每個(gè)集群中的第一個(gè)交換機(jī),而且均使用索引值為2的端口與Cl相連。
[0099]其次,配置一個(gè)集中式控制器(controller)。該集中式控制器可以與網(wǎng)絡(luò)中任意一臺(tái)服務(wù)器或交換機(jī)通信。
[0100]以及,服務(wù)器以及各層交換機(jī)與鄰居相互通信,收集物理網(wǎng)絡(luò)拓?fù)湫畔ⅰ?br>
[0101]其中,在本發(fā)明的一個(gè)實(shí)施例中,參照?qǐng)D5所示,采集模塊300還用于:通過(guò)每臺(tái)服務(wù)器或每臺(tái)交換機(jī)接收相鄰設(shè)備的設(shè)備拓?fù)湫畔⒕S護(hù)鄰居列表,以采集Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?,其中,設(shè)備拓?fù)湫畔ū镜囟丝?、遠(yuǎn)端端口和相鄰設(shè)備的硬件地址MAC地址。
[0102]最后,各服務(wù)器和交換機(jī)將收集到的拓?fù)湫畔l(fā)送給集中式控制器,集中式控制器匯總所有服務(wù)器和交換機(jī)收集到的拓?fù)湫畔ⅲ纬扇W(wǎng)物理拓?fù)湫畔⒓慈W(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?。其中,在本發(fā)明的實(shí)施例中,由于本發(fā)明實(shí)施例是基于Fat-Tree網(wǎng)絡(luò),因此物理網(wǎng)絡(luò)相當(dāng)于Fat-Tree網(wǎng)絡(luò)。
[0103]進(jìn)一步地,在本發(fā)明的一個(gè)實(shí)施例中,參照?qǐng)D5所示,檢測(cè)與恢復(fù)模塊400還用于:根據(jù)全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔南轮辽戏謩e完成Fat-Tree網(wǎng)絡(luò)與設(shè)計(jì)藍(lán)圖的映射,以根據(jù)Fat-Tree網(wǎng)絡(luò)與設(shè)計(jì)藍(lán)圖的映射進(jìn)行錯(cuò)誤連線的檢測(cè)與恢復(fù)計(jì)算。
[0104]其中,在本發(fā)明的一個(gè)實(shí)施例中,通過(guò)檢測(cè)Fat-Tree網(wǎng)絡(luò)中的每條連線的兩個(gè)端點(diǎn)是否與設(shè)計(jì)藍(lán)圖一致判斷在每條連線中是否存在連接錯(cuò)誤。
[0105]進(jìn)一步地,在本發(fā)明的一個(gè)實(shí)施例中,參照?qǐng)D6所示,檢測(cè)與恢復(fù)模塊400包括:檢測(cè)單元401、建立單元402和恢復(fù)計(jì)算單元403。
[0106]其中,檢測(cè)單元401用于判斷在每條連線中存在連接錯(cuò)誤之后,收集錯(cuò)誤連線信息以確定錯(cuò)誤連線。建立單元402用于根據(jù)確定的錯(cuò)誤連線建立錯(cuò)誤連線集合?;謴?fù)計(jì)算單元403用于根據(jù)錯(cuò)誤連線集合和設(shè)計(jì)藍(lán)圖進(jìn)行錯(cuò)誤連線恢復(fù)方案計(jì)算。
[0107]具體地,在本發(fā)明的一個(gè)實(shí)施例中,集中式控制器在匯總所有服務(wù)器和交換機(jī)收集到的拓?fù)湫畔?,形成全網(wǎng)物理拓?fù)湫畔⒅螅瑒t根據(jù)掌握的物理拓?fù)湫畔?,利用拓?fù)涮攸c(diǎn),完成物理拓?fù)渑c設(shè)計(jì)藍(lán)圖的映射,并根據(jù)映射結(jié)果,檢測(cè)錯(cuò)誤連線,以及計(jì)算錯(cuò)誤連線的恢復(fù)方案相當(dāng)于恢復(fù)計(jì)算。
[0108]本發(fā)明實(shí)施例的思路在于:數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)湓O(shè)計(jì),各級(jí)交換機(jī)之間的連線有一定的規(guī)律性。通過(guò)拓?fù)湓O(shè)計(jì)的特點(diǎn),可以快速地實(shí)現(xiàn)物理網(wǎng)絡(luò)和設(shè)計(jì)藍(lán)圖的映射,確定每臺(tái)交換機(jī)的類型和其邏輯位置(即其在設(shè)計(jì)藍(lán)圖中的位置)。待每類交換機(jī)的類型和邏輯位置確定后,通過(guò)檢測(cè)物理鄰居與設(shè)計(jì)藍(lán)圖的異同,確定連線是否錯(cuò)誤。待錯(cuò)誤連線全部收集完畢后,可以根據(jù)錯(cuò)誤連線之間的關(guān)系設(shè)計(jì)相應(yīng)的算法求解出恢復(fù)錯(cuò)誤連線的方案。
[0109]本發(fā)明實(shí)施例提出的物理網(wǎng)絡(luò)和設(shè)計(jì)藍(lán)圖的映射算法效率遠(yuǎn)遠(yuǎn)高于基于圖同構(gòu)理論的算法,并且能夠給出錯(cuò)誤連線的恢復(fù)方案,不僅提高了恢復(fù)錯(cuò)誤連線的效率,還降低了工作人員操作過(guò)程中的人為錯(cuò)誤。
[0110]下面對(duì)檢測(cè)錯(cuò)誤連線進(jìn)行詳細(xì)贅述。
[0111]檢測(cè)錯(cuò)誤連線的過(guò)程大致分為以下幾個(gè)步驟:
[0112]S1:服務(wù)器以及各層交換機(jī)與鄰居相互通信,收集物理網(wǎng)絡(luò)拓?fù)湫畔ⅰ?br>
[0113]在完成物理網(wǎng)絡(luò)與設(shè)計(jì)藍(lán)圖的映射前,各服務(wù)器和交換機(jī)還未配置IP地址,因此在收集物理網(wǎng)絡(luò)拓?fù)潆A段,我們使用MAC地址唯一標(biāo)識(shí)服務(wù)器和交換機(jī)。由于交換機(jī)具有多個(gè)端口、每個(gè)端口都有一個(gè)MAC地址,我們使用第一個(gè)端口的MAC地址標(biāo)識(shí)一個(gè)交換機(jī)。而在Fat-Tree網(wǎng)絡(luò)中,每臺(tái)服務(wù)器只使有一個(gè)網(wǎng)卡連接至網(wǎng)絡(luò),因此我們使用該網(wǎng)卡的MAC地址標(biāo)識(shí)該服務(wù)器。
[0114]服務(wù)器和交換機(jī)通過(guò)以下機(jī)制收集拓?fù)湫畔?每臺(tái)服務(wù)器和交換機(jī)上分別部署了一個(gè)代理,用于發(fā)送和接收拓?fù)湫畔?。每臺(tái)服務(wù)器或交換機(jī)會(huì)定期向鄰居通告自己的拓?fù)湫畔?,該信息包含自己的MAC地址和發(fā)送該條信息的端口索引。當(dāng)服務(wù)器或交換機(jī)通過(guò)代理收集到來(lái)自鄰居的拓?fù)湫畔?,?huì)在本地維護(hù)一個(gè)鄰居列表。每一個(gè)表項(xiàng)的具體信息包括:I)本地端口索引。該端口用于連接相應(yīng)的鄰居;2)鄰居端口索引。鄰居使用該端口來(lái)連接自己;3)鄰居的MAC地址。后兩部分信息來(lái)自于代理接收到的拓?fù)湫畔ⅰ?br>
[0115]參照?qǐng)D3所示,圖3為邊緣層交換機(jī)E7搜集鄰居的拓?fù)湫畔⒌牧鞒虉D,包括以下幾個(gè)步驟:1)鄰居(S16和AS)向E7發(fā)送拓?fù)湫畔ⅲ?)E7合并,并處理拓?fù)湫畔?,維護(hù)鄰居列表。每一個(gè)鄰居列表的信息包括本地端口、遠(yuǎn)端端口和鄰居的MAC地址;3)待E7搜集完所有鄰居的拓?fù)湫畔⒑?,將整理完畢的拓?fù)湫畔l(fā)送給集中控制器。需要說(shuō)明的是,如圖所示,S16為編號(hào)為16的服務(wù)器,E7為編號(hào)為7的邊緣層交換機(jī),AS為編號(hào)為8的聚集層交換機(jī)。
[0116]S2:集中控制器從各服務(wù)器和交換機(jī)收集網(wǎng)絡(luò)拓?fù)湫畔ⅲ瓿晌锢砭W(wǎng)絡(luò)與設(shè)計(jì)藍(lán)圖的映射。
[0117]當(dāng)所有服務(wù)器和交換機(jī)都按上述流程收集所有鄰居的拓?fù)湫畔⒉l(fā)送給集中控制器后,集中控制器便收集到了完整的物理網(wǎng)絡(luò)拓?fù)湫畔?。然后集中控制器使用從下至上的順序分別完成物理網(wǎng)絡(luò)與設(shè)計(jì)藍(lán)圖的映射:確定交換機(jī)的類型和邏輯位置。即先完成邊緣層交換機(jī)的映射,再完成聚集層交換機(jī)的映射,最后確定核心層交換機(jī)。
[0118]由于假設(shè)服務(wù)器和邊緣層交換機(jī)之間沒(méi)有錯(cuò)誤連線,因此可以肯定服務(wù)器的鄰居就是邊緣層交換機(jī)。為了確定邊緣層交換機(jī)的索引,集中控制器靜態(tài)配置了服務(wù)器的位置和MAC地址的映射信息。這樣,根據(jù)服務(wù)器的位置即可確定邊緣層交換機(jī)的邏輯位置。以圖2為例,服務(wù)器SI是第一個(gè)服務(wù)器,其鄰居即為第一個(gè)集群中的第一個(gè)邊緣層交換機(jī)。因此通過(guò)分析服務(wù)器SI的鄰居列表信息,即可知道其本地端口 O連接的鄰居是第一個(gè)邊緣層交換機(jī)El。
[0119]確定了邊緣層交換機(jī)后,接下來(lái)以集群為單位確定聚集層交換機(jī)和其邏輯位置。由于在每一個(gè)集群中,不同邊緣層交換機(jī)中索引相同的端口連接的該集群中的同一個(gè)聚集層交換機(jī),我們使用這個(gè)規(guī)律確定聚集層交換機(jī)和其邏輯位置:遍歷某個(gè)集群中的邊緣層交換機(jī)的某一相同端口即確定一個(gè)聚集層交換機(jī)和其邏輯位置。正常情況下,同一集群中的所有邊緣層交換機(jī)的同一端口連接的是同一個(gè)聚集層交換機(jī),但錯(cuò)誤連線可能導(dǎo)致連接至不同的聚集層交換機(jī)。因此,在確定聚集層交換機(jī)的時(shí)候,使用Major Voting算法。具體做法是:在對(duì)同一集群中的所有邊緣層交換機(jī)的同一端口連接的鄰居進(jìn)行遍歷時(shí),為其所有鄰居設(shè)置一個(gè)計(jì)數(shù)值,該值的初始值為零。在遍歷過(guò)程中,每遍歷一個(gè)鄰居,即將該鄰居的計(jì)數(shù)值加一。正常情況下,當(dāng)遍歷完后計(jì)數(shù)值大于零的鄰居只有一個(gè)。但錯(cuò)誤連接可能導(dǎo)致遍歷完后計(jì)數(shù)值大于零的鄰居有多個(gè)。其中計(jì)數(shù)值最大的鄰居即為相應(yīng)的聚集層交換機(jī)。如果計(jì)數(shù)值最大的鄰居有多個(gè),則隨機(jī)選擇一個(gè)作為相應(yīng)的聚集層交換機(jī)。每次遍歷時(shí)使用的邊緣層交換機(jī)的端口索引可以確定該聚集層交換機(jī)的邏輯位置。
[0120]參照?qǐng)D4所示,假設(shè)通過(guò)服務(wù)器已經(jīng)確定了邊緣層交換機(jī),從而可以通過(guò)分析第一個(gè)集群中的邊緣層交換機(jī)El和E2的鄰居確定相應(yīng)的聚集層交換機(jī)。首先,本發(fā)明實(shí)施例分別遍歷El和E2的索引為2的端口。通過(guò)分析其鄰居列表,從而可以得知,El的鄰居是Al,而E2的鄰居也是Al。因此,通過(guò)這輪遍歷,可以得知Al即為第一個(gè)集群的第一個(gè)聚集層交換機(jī)。接下來(lái),分別遍歷El和E2的索引為3的端口。通過(guò)分析其鄰居列表,從而可以得知,El的鄰居是A3,而E2的鄰居也是A2。因此,通過(guò)這輪遍歷,A2或A3對(duì)應(yīng)的計(jì)數(shù)值均為1,兩者都有可能是第一個(gè)集群的第二個(gè)聚集層交換機(jī)。因此隨機(jī)選擇一個(gè)即可。需要說(shuō)明的是,在實(shí)際部署中,錯(cuò)誤連線數(shù)量明顯小于正確連線,因此,在K較大的情況下,不太會(huì)出現(xiàn)示例中出現(xiàn)的計(jì)數(shù)值相等的情況,通過(guò)Major Voting算法在絕大多數(shù)情況下都可以明確得到結(jié)果。
[0121]如圖4所示,交換機(jī)El?E8為邊緣層交換機(jī),交換機(jī)Al?A8為聚集層交換機(jī),交換機(jī)Cl?C4為核心層交換機(jī),SI?S16為服務(wù)器,O?3為交換機(jī)轉(zhuǎn)發(fā)端口的索引值,黑色實(shí)線為正確的連線,黑色虛線為錯(cuò)誤的連線。
[0122]確定了聚集層交換機(jī),接下來(lái)就是確定核心層交換機(jī)。在無(wú)錯(cuò)誤連線的情況下,同一個(gè)核心層交換機(jī)會(huì)連接位于不同集群的聚集層交換機(jī),而且這些聚集層交換機(jī)在各自集群中所處的位置是相同的、且使用的端口索引也一樣。但錯(cuò)誤連線可能會(huì)導(dǎo)致同一核心層交換機(jī)連接的聚集層交換機(jī)在不同集群中的位置不同,或者使用不同的端口。因此,我們同樣使用Major Voting算法確定核心層交換機(jī)及其索引。我們對(duì)不同集群中索引相同的聚集層交換機(jī)的相同端口進(jìn)行遍歷。在遍歷過(guò)程中,每遍歷一個(gè)鄰居,即將該鄰居的計(jì)數(shù)值加一。當(dāng)遍歷完后,計(jì)數(shù)值最大的即為相應(yīng)的核心層交換機(jī)。同樣地,如果計(jì)數(shù)值最大的鄰居有多個(gè),則隨機(jī)選擇一個(gè)作為相應(yīng)的核心層交換機(jī)。根據(jù)遍歷使用的端口索引,即可確定該核心層交換機(jī)的邏輯位置。
[0123]參照?qǐng)D4所示,本發(fā)明實(shí)施例通過(guò)遍歷所有集群中第一個(gè)聚集層交換機(jī)索引為2的端口的鄰居可確定第一個(gè)核心層交換機(jī)。通過(guò)分析這些聚集層交換機(jī)的鄰居,可以發(fā)現(xiàn),所有鄰居均為交換機(jī)Cl,所以Cl即為第一個(gè)核心層交換機(jī)。同理,通過(guò)遍歷所有集群中第二個(gè)聚集層交換機(jī)索引為2的端口的鄰居可確定第三個(gè)核心層交換機(jī)。通過(guò)分析這些聚集層交換機(jī)的鄰居,可以確定C3是第三個(gè)核心層交換機(jī)。
[0124]當(dāng)所有交換機(jī)的類型和邏輯位置都確定后,就可以按照設(shè)計(jì)藍(lán)圖對(duì)所有交換機(jī)和服務(wù)器配置相應(yīng)的IP地址。
[0125]S3:集中控制器檢測(cè)錯(cuò)誤連線并計(jì)算出恢復(fù)方案。
[0126]完成了物理網(wǎng)絡(luò)和設(shè)計(jì)藍(lán)圖的映射后,接下來(lái)的工作就是對(duì)錯(cuò)誤連線的檢測(cè)。此時(shí)物理網(wǎng)絡(luò)中的服務(wù)器和交換機(jī)都與設(shè)計(jì)藍(lán)圖中的服務(wù)器和交換機(jī)一一對(duì)應(yīng)。通過(guò)檢測(cè)物理網(wǎng)絡(luò)中的每條連線(即鏈路)的兩個(gè)端點(diǎn)是否與設(shè)計(jì)藍(lán)圖一致即可判斷該條連線是否是錯(cuò)誤連線。我們使用矢量{{IPpPi},{IPj, PjlI代表一條連線,其中{IPi,PJ和{IPj,Pj}分別表示該連線的兩個(gè)端點(diǎn),IP*表示的是連線某一端點(diǎn)的IP地址,P*表示的是該條連線所占用的端口索引。
[0127]參照?qǐng)D4所示,本發(fā)明實(shí)施例分析到交換機(jī)El的索引值為3的端口。根據(jù)設(shè)計(jì)藍(lán)圖,它的鄰居應(yīng)該是聚集層交換機(jī)A2。但分析物理拓?fù)涞泥従有畔?,發(fā)現(xiàn)其鄰居是聚集層交換機(jī)A3,由此可以判定連線{{El,3},{A3, I}}是一條錯(cuò)誤連線。同理,當(dāng)分析交換機(jī)E4索引值為2的端口時(shí),根據(jù)設(shè)計(jì)藍(lán)圖,它的鄰居應(yīng)該是聚集層交換機(jī)A3。但分析物理拓?fù)涞泥従有畔?,發(fā)現(xiàn)其鄰居是聚集層交換機(jī)A2,由此可以判定連線{{E4,2},{A2,0}}是一條錯(cuò)誤連線。
[0128]進(jìn)一步地,檢測(cè)完網(wǎng)絡(luò)中所有的錯(cuò)誤連線后,接下來(lái)的工作就是計(jì)算這些錯(cuò)誤連線對(duì)應(yīng)的恢復(fù)方案?;謴?fù)方案實(shí)質(zhì)上是通過(guò)比較設(shè)計(jì)藍(lán)圖和物理網(wǎng)絡(luò)中的錯(cuò)誤連線計(jì)算得到的。通過(guò)第3步,我們可以得到一個(gè)包含所有錯(cuò)誤連線的集合。計(jì)算錯(cuò)誤連線的恢復(fù)方案時(shí),我們將從錯(cuò)誤連線的集合中隨機(jī)選擇一條錯(cuò)誤連線,我們用{{IPpPi},{IPj, PjII表示。然后,我們隨機(jī)選擇一個(gè)端點(diǎn){ΙΡ」,Ρ」},通過(guò)設(shè)計(jì)藍(lán)圖,我們可以得到該端點(diǎn)正確應(yīng)該連線至端點(diǎn){IPk,Pk}。因此,我們可以計(jì)算得到該條錯(cuò)誤連線的恢復(fù)方案是{{IPj, PjI, {IPk,Pk}}。由于之前,我們假設(shè)所有端口都被使用,因此我們可以肯定端點(diǎn){IPk,Pk}必定是某條錯(cuò)誤連線的一個(gè)端點(diǎn)。因此,我們通過(guò)搜索錯(cuò)誤連線集合,可以得到端點(diǎn){IPk,Pk}對(duì)應(yīng)的錯(cuò)誤連線,假設(shè)為{{IPk,Pk},{IPm, PJ1如果此時(shí)端點(diǎn){IPm,Pm}與我們最初選擇的錯(cuò)誤連線的端點(diǎn)({IPi,PJ)不相同,接下來(lái)我們又可以通過(guò)設(shè)計(jì)藍(lán)圖得到端點(diǎn){IPm, PJ相應(yīng)的正確連線為{{IPm,PJ, {IPn, pn}}。否則,我們?yōu)橐唤M錯(cuò)誤連線計(jì)算出相應(yīng)的恢復(fù)方案。如果還有錯(cuò)誤連線未被處理,則重復(fù)上述過(guò)程,直至為所有錯(cuò)誤連線計(jì)算了相應(yīng)的正確連線。
[0129]參照?qǐng)D4所示,網(wǎng)絡(luò)中有兩條錯(cuò)誤連線,分別是{{E1,3},{A3, I}}和{{E4, 2},{A2, 0}} ο我們首先隨機(jī)選擇一條,假設(shè)選擇{{E1, 3},{A3, 1}}。因此,根據(jù)設(shè)計(jì)藍(lán)圖,可以得知,A3索引為I的端口連接的是E4的索引為2的端口,因此恢復(fù)出一條正確連線為{{A3,1},{E4,2}}。而可以肯定的是E4的索引為2的端口肯定連接一條錯(cuò)誤連線,即{{E4, 2}, {A2,0}}。然后,我們可以根據(jù)設(shè)計(jì)藍(lán)圖確定A2索引為O的端口連接至El的索引為3的端口。到此,又恢復(fù)出另一條正確連接為{{A2,0},{El,3}}。因?yàn)閧El,3}與我們選擇的第一條錯(cuò)誤連線的某一端相同,至此,我們處理完了一組錯(cuò)誤連線。如果還有未處理的錯(cuò)誤連線,則重復(fù)上述操作,直至所有錯(cuò)誤連線都已經(jīng)處理,并計(jì)算出相應(yīng)的正確連線。
[0130]本發(fā)明實(shí)施例建立了一個(gè)Fat-Tree拓?fù)洹F渲?,本發(fā)明實(shí)施例做錯(cuò)誤連線的檢測(cè)和恢復(fù)實(shí)驗(yàn)時(shí),使用端口數(shù)量均為80的交換機(jī)。本發(fā)明實(shí)施例分別設(shè)置錯(cuò)誤連線占所有連線數(shù)量的百分比分別為5%、10%、15%和20%。實(shí)驗(yàn)結(jié)果顯示,在所有情況下,檢測(cè)錯(cuò)誤連線所消耗的時(shí)間不到28毫秒。而已有方案耗時(shí)均為秒級(jí)。另外,在端口數(shù)量均為32、錯(cuò)誤連線百分比為20%的情況下,計(jì)算恢復(fù)方案所消耗的時(shí)間也不足90毫秒。實(shí)驗(yàn)結(jié)果表明,本發(fā)明實(shí)施例能夠更加快速的檢測(cè)出錯(cuò)誤連線、并能夠計(jì)算出其恢復(fù)方案,為工程人員恢復(fù)錯(cuò)誤連線提供有效的指導(dǎo)。
[0131]根據(jù)本發(fā)明實(shí)施例提出的數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)裝置,通過(guò)構(gòu)建數(shù)據(jù)網(wǎng)絡(luò)中心拓?fù)?,從而采集Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?,以生成全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?,?shí)現(xiàn)根據(jù)所述全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⑦M(jìn)行錯(cuò)誤連線的檢測(cè)和恢復(fù)計(jì)算。通過(guò)充分利用數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)涞奶攸c(diǎn),本發(fā)明實(shí)施例的裝置不但能確定可能涉及錯(cuò)誤連線的節(jié)點(diǎn),還能快速的檢測(cè)出錯(cuò)誤連線,以及計(jì)算錯(cuò)誤連線的恢復(fù)方案,為工程人員快速恢復(fù)錯(cuò)誤連線提供有力的知道,簡(jiǎn)單快捷,無(wú)需人為判斷,更加自動(dòng)化,提高了工作效率。
[0132]流程圖中或在此以其他方式描述的任何過(guò)程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過(guò)程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來(lái)執(zhí)行功能,這應(yīng)被本發(fā)明的實(shí)施例所屬【技術(shù)領(lǐng)域】的技術(shù)人員所理解。
[0133]在流程圖中表示或在此以其他方式描述的邏輯和/或步驟,例如,可以被認(rèn)為是用于實(shí)現(xiàn)邏輯功能的可執(zhí)行指令的定序列表,可以具體實(shí)現(xiàn)在任何計(jì)算機(jī)可讀介質(zhì)中,以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備(如基于計(jì)算機(jī)的系統(tǒng)、包括處理器的系統(tǒng)或其他可以從指令執(zhí)行系統(tǒng)、裝置或設(shè)備取指令并執(zhí)行指令的系統(tǒng))使用,或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用。就本說(shuō)明書(shū)而言,"計(jì)算機(jī)可讀介質(zhì)"可以是任何可以包含、存儲(chǔ)、通信、傳播或傳輸程序以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用的裝置。計(jì)算機(jī)可讀介質(zhì)的更具體的示例(非窮盡性列表)包括以下:具有一個(gè)或多個(gè)布線的電連接部(電子裝置),便攜式計(jì)算機(jī)盤盒(磁裝置),隨機(jī)存取存儲(chǔ)器(RAM),只讀存儲(chǔ)器(ROM),可擦除可編輯只讀存儲(chǔ)器(EPR0M或閃速存儲(chǔ)器),光纖裝置,以及便攜式光盤只讀存儲(chǔ)器(CDROM)。另外,計(jì)算機(jī)可讀介質(zhì)甚至可以是可在其上打印所述程序的紙或其他合適的介質(zhì),因?yàn)榭梢岳缤ㄟ^(guò)對(duì)紙或其他介質(zhì)進(jìn)行光學(xué)掃描,接著進(jìn)行編輯、解譯或必要時(shí)以其他合適方式進(jìn)行處理來(lái)以電子方式獲得所述程序,然后將其存儲(chǔ)在計(jì)算機(jī)存儲(chǔ)器中。
[0134]應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來(lái)實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來(lái)實(shí)現(xiàn)。例如,如果用硬件來(lái)實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來(lái)實(shí)現(xiàn):具有用于對(duì)數(shù)據(jù)信號(hào)實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場(chǎng)可編程門陣列(FPGA)等。
[0135]本【技術(shù)領(lǐng)域】的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合。
[0136]此外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理模塊中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。
[0137]上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤或光盤等。
[0138]在本說(shuō)明書(shū)的描述中,參考術(shù)語(yǔ)“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說(shuō)明書(shū)中,對(duì)上述術(shù)語(yǔ)的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。
[0139]盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對(duì)本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在不脫離本發(fā)明的原理和宗旨的情況下在本發(fā)明的范圍內(nèi)可以對(duì)上述實(shí)施例進(jìn)行變化、修改、替換和變型。
【權(quán)利要求】
1.一種數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)方法,其特征在于,包括以下步驟: 51:根據(jù)Fat-Tree網(wǎng)絡(luò)構(gòu)建數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)洌鰯?shù)據(jù)中心網(wǎng)絡(luò)拓?fù)浒ǘ嗯_(tái)服務(wù)器、多臺(tái)邊緣層交換機(jī)、多臺(tái)聚集層交換機(jī)和多臺(tái)核心層交換機(jī),其中, 所述多臺(tái)邊緣層交換機(jī)、所述多臺(tái)聚集層交換機(jī)和所述多臺(tái)核心層交換機(jī)均采用同構(gòu)交換機(jī),每臺(tái)服務(wù)器與所述多臺(tái)邊緣層交換機(jī)中一臺(tái)邊緣層交換機(jī)相連,并且所述多臺(tái)邊緣層交換機(jī)、多臺(tái)聚集層交換機(jī)和多臺(tái)核心層交換機(jī)的層次逐步提升; 52:根據(jù)所述多臺(tái)服務(wù)器和多臺(tái)交換機(jī)配置集中式控制器; 53:通過(guò)所述多臺(tái)服務(wù)器以及各層交換機(jī)與各自相鄰設(shè)備通信采集Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?;以? 54:發(fā)送所述Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⒅了黾惺娇刂破饕陨扇W(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?,并根?jù)所述全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⑦M(jìn)行錯(cuò)誤連線的檢測(cè)和恢復(fù)計(jì)算。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過(guò)所述多臺(tái)服務(wù)器以及各層交換機(jī)與各自相鄰設(shè)備通信采集Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?,具體包括: 通過(guò)每臺(tái)服務(wù)器或每臺(tái)交換機(jī)接收所述相鄰設(shè)備的設(shè)備拓?fù)湫畔⒕S護(hù)鄰居列表,以采集所述Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?,其中,所述設(shè)備拓?fù)湫畔ū镜囟丝?、遠(yuǎn)端端口和所述相鄰設(shè)備的硬件地址MAC地址。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⑦M(jìn)行錯(cuò)誤連線的檢測(cè)和恢復(fù)計(jì)算,具體包括: 根據(jù)所述全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔南轮辽戏謩e完成所述Fat-Tree網(wǎng)絡(luò)與設(shè)計(jì)藍(lán)圖的映射,以根據(jù)所述Fat-Tree網(wǎng)絡(luò)與設(shè)計(jì)藍(lán)圖的映射進(jìn)行錯(cuò)誤連線的檢測(cè)和恢復(fù)計(jì)算。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,通過(guò)檢測(cè)所述Fat-Tree網(wǎng)絡(luò)中的每條連線的兩個(gè)端點(diǎn)是否與所述設(shè)計(jì)藍(lán)圖一致判斷在所述每條連線中是否存在連接錯(cuò)誤。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,還包括: 判斷在所述每條連線中存在連接錯(cuò)誤之后,收集錯(cuò)誤連線信息以確定錯(cuò)誤連線; 根據(jù)確定的錯(cuò)誤連線建立錯(cuò)誤連線集合;以及 根據(jù)所述錯(cuò)誤連線集合和所述設(shè)計(jì)藍(lán)圖進(jìn)行錯(cuò)誤連線恢復(fù)方案計(jì)算。
6.一種數(shù)據(jù)中心網(wǎng)絡(luò)中錯(cuò)誤連線的檢測(cè)裝置,其特征在于,包括: 構(gòu)建模塊,用于根據(jù)Fat-Tree網(wǎng)絡(luò)構(gòu)建數(shù)據(jù)中心網(wǎng)絡(luò)拓?fù)?,所述?shù)據(jù)中心網(wǎng)絡(luò)拓?fù)浒ǘ嗯_(tái)服務(wù)器、多臺(tái)邊緣層交換機(jī)、多臺(tái)聚集層交換機(jī)和多臺(tái)核心層交換機(jī),其中, 所述多臺(tái)邊緣層交換機(jī)、所述多臺(tái)聚集層交換機(jī)和所述多臺(tái)核心層交換機(jī)均采用同構(gòu)交換機(jī),每臺(tái)服務(wù)器與所述多臺(tái)邊緣層交換機(jī)中一臺(tái)邊緣層交換機(jī)相連,并且所述多臺(tái)邊緣層交換機(jī)、多臺(tái)聚集層交換機(jī)和多臺(tái)核心層交換機(jī)的層次逐步提升; 配置模塊,用于根據(jù)所述多臺(tái)服務(wù)器和多臺(tái)交換機(jī)配置集中式控制器; 采集模塊,用于通過(guò)所述多臺(tái)服務(wù)器以及各層交換機(jī)與各自相鄰設(shè)備通信采集Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔ⅲl(fā)送所述Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⒅了黾惺娇刂破饕陨扇W(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔?;以? 檢測(cè)與恢復(fù)模塊,用于根據(jù)所述全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔⑦M(jìn)行錯(cuò)誤連線的檢測(cè)和恢復(fù)計(jì)算。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述采集模塊還用于: 通過(guò)每臺(tái)服務(wù)器或每臺(tái)交換機(jī)接收所述相鄰設(shè)備的設(shè)備拓?fù)湫畔⒕S護(hù)鄰居列表,以采集所述Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔ⅲ渲?,所述設(shè)備拓?fù)湫畔ū镜囟丝?、遠(yuǎn)端端口和所述相鄰設(shè)備的硬件地址MAC地址。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述檢測(cè)與恢復(fù)模塊還用于: 根據(jù)所述全網(wǎng)Fat-Tree網(wǎng)絡(luò)拓?fù)湫畔南轮辽戏謩e完成所述Fat-Tree網(wǎng)絡(luò)與設(shè)計(jì)藍(lán)圖的映射,以根據(jù)所述Fat-Tree網(wǎng)絡(luò)與設(shè)計(jì)藍(lán)圖的映射進(jìn)行錯(cuò)誤連線的檢測(cè)與恢復(fù)計(jì)算。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,通過(guò)檢測(cè)所述Fat-Tree網(wǎng)絡(luò)中的每條連線的兩個(gè)端點(diǎn)是否與所述設(shè)計(jì)藍(lán)圖一致判斷在所述每條連線中是否存在連接錯(cuò)誤。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述檢測(cè)與恢復(fù)模塊包括: 檢測(cè)單元,用于判斷在所述每條連線中存在連接錯(cuò)誤之后,收集錯(cuò)誤連線信息以確定錯(cuò)誤連線; 建立單元,用于根據(jù)確定的錯(cuò)誤連線建立錯(cuò)誤連線集合;以及 恢復(fù)計(jì)算單元,用于根據(jù)所述錯(cuò)誤連線集合和所述設(shè)計(jì)藍(lán)圖進(jìn)行錯(cuò)誤連線恢復(fù)方案計(jì)笪并ο
【文檔編號(hào)】H04L12/26GK104518927SQ201410779161
【公開(kāi)日】2015年4月15日 申請(qǐng)日期:2014年12月15日 優(yōu)先權(quán)日:2014年12月15日
【發(fā)明者】李丹, 蔣長(zhǎng)林, 徐明偉, 喻敬海 申請(qǐng)人:清華大學(xué), 中興通訊股份有限公司