數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備健康度的自適應(yīng)評價方法
【專利摘要】本發(fā)明公開一種數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備健康度的自適應(yīng)評價方法,該方法步驟為:1)建立設(shè)備的健康度模型,將設(shè)備的各項性能參數(shù)與性能參數(shù)對應(yīng)權(quán)值的加權(quán)和作為健康度值,將健康度值轉(zhuǎn)換為健康指數(shù);2)獲取網(wǎng)絡(luò)拓?fù)涿枋鲂畔⒉⒏鶕?jù)設(shè)備在網(wǎng)絡(luò)中的位置采集各設(shè)備所有網(wǎng)絡(luò)接口的狀態(tài)信息,計算設(shè)備報文接收狀況、掉線狀況的各項性能參數(shù);3)設(shè)置參數(shù)權(quán)值并根據(jù)性能參數(shù)發(fā)生的概率進(jìn)行調(diào)整,根據(jù)健康度模型計算設(shè)備的健康指數(shù),再根據(jù)計算得出的健康指數(shù)調(diào)整參數(shù)權(quán)值,直至健康度指數(shù)調(diào)整至預(yù)設(shè)范圍內(nèi)。本發(fā)明具有實現(xiàn)方法簡單,能夠?qū)Υ笠?guī)模網(wǎng)絡(luò)中設(shè)備健康度進(jìn)行有效、全面的評估并能夠根據(jù)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行自適應(yīng)動態(tài)調(diào)節(jié)的優(yōu)點。
【專利說明】數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備健康度的自適應(yīng)評價方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及網(wǎng)絡(luò)健康評價【技術(shù)領(lǐng)域】,尤其涉及一種數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備健康度的自 適應(yīng)評價方法。
【背景技術(shù)】
[0002] 大規(guī)模數(shù)據(jù)中心通常是使用數(shù)量眾多的核心交換機(jī)、匯聚交換機(jī)和接入交換機(jī)組 成層次式高速以太網(wǎng),并分別與數(shù)據(jù)中心計算服務(wù)器集群和大容量存儲系統(tǒng)連接,負(fù)責(zé)為 計算服務(wù)器之間、計算服務(wù)器與存儲系統(tǒng)之間提供高速信息傳輸支持,因此數(shù)據(jù)中心網(wǎng)絡(luò) 的可用性和傳輸性能是影響數(shù)據(jù)中心外部服務(wù)能力的重要因素。在數(shù)據(jù)中心網(wǎng)絡(luò)的實際 運維中,由于大規(guī)模網(wǎng)絡(luò)中設(shè)備規(guī)模龐大、鏈路結(jié)構(gòu)復(fù)雜,使得網(wǎng)絡(luò)出現(xiàn)故障的概率也相當(dāng) 尚。
[0003] 網(wǎng)絡(luò)的健康度是指通過健康指數(shù)來評價網(wǎng)絡(luò)及設(shè)備的性能狀況,以下是目前幾種 主要的網(wǎng)絡(luò)健康度評估方法以及其優(yōu)缺點:
[0004] 1)通過跟蹤大量的TCP會話交互過程,發(fā)現(xiàn)不同網(wǎng)絡(luò)路徑的端到端性能指標(biāo),并 且在匯聚的基礎(chǔ)上完成對不同網(wǎng)絡(luò)域之間網(wǎng)絡(luò)連接的健康度評估。該方法的優(yōu)點是能夠比 較準(zhǔn)確的得到端到端之間的鏈路情況;缺點是需要通過模擬每個TCP會話雙方的協(xié)議棧行 為指標(biāo)進(jìn)行測量,當(dāng)網(wǎng)絡(luò)規(guī)模龐大時健康度評估的指標(biāo)將難以獲得;
[0005] 2)將網(wǎng)絡(luò)劃分為幾個網(wǎng)絡(luò)域,通過不同網(wǎng)絡(luò)域間鏈路的空閑率、時延數(shù)據(jù)結(jié)果進(jìn) 行分析而得到網(wǎng)絡(luò)的健康度,在時間、位置不同的情況下比較RTT的各項指標(biāo),以此完成判 定。該方法的優(yōu)點是可以快速粗略評估整個網(wǎng)絡(luò)的運行狀況;缺點是無法按照設(shè)備的重要 程度區(qū)分不同鏈路對整個網(wǎng)絡(luò)的影響程度;
[0006] 3)基于網(wǎng)絡(luò)QoS參數(shù)的模糊評價方法,該方法可以根據(jù)用戶的應(yīng)用體驗、網(wǎng)絡(luò)的 傳輸質(zhì)量來判斷網(wǎng)絡(luò)健康度,并根據(jù)認(rèn)知算法調(diào)整使用的QoS參數(shù)的權(quán)重來計算網(wǎng)絡(luò)健康 度。該方法的優(yōu)點是能夠從應(yīng)用層的角度評價網(wǎng)絡(luò)的健康狀況,獲得較好的用戶體驗;缺點 是在數(shù)據(jù)中心網(wǎng)絡(luò)中采用QoS參數(shù)并不能全面反應(yīng)網(wǎng)絡(luò)設(shè)備的健康情況;
[0007] 4)將影響網(wǎng)絡(luò)運行的單元分層,每層都有若干的設(shè)備或鏈路,當(dāng)每層的所有設(shè)備 或鏈路都大于閾值時才判斷該層網(wǎng)絡(luò)情況為正常,然后逐層進(jìn)行判斷,最終得到整個網(wǎng)絡(luò) 的健康度情況。這種方法的優(yōu)點通過將復(fù)雜的網(wǎng)絡(luò)問題劃分成簡單的局部的模塊,能夠快 速評價數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備的整體狀況;缺點是沒有考慮網(wǎng)絡(luò)設(shè)備部署的層次結(jié)構(gòu),無法根 據(jù)網(wǎng)絡(luò)設(shè)備的層次結(jié)構(gòu)進(jìn)行動態(tài)的調(diào)整。
[0008] 5)通過對網(wǎng)絡(luò)中硬件,服務(wù),傳輸?shù)雀鞣N因素分類和逐個分析,來判斷網(wǎng)絡(luò)是否故 障,優(yōu)點是這種方法簡單快捷,缺點是只能非常粗略的判斷網(wǎng)絡(luò)是否正常,無法對網(wǎng)絡(luò)的健 康情況進(jìn)行分級判定。
[0009] 通過對十余個美國數(shù)據(jù)中心的日志進(jìn)行挖掘分析得出:網(wǎng)絡(luò)故障主要包括設(shè)備故 障、鏈路故障和接口故障,其中設(shè)備故障中軟件類故障占比約75%、硬件類故障為25%,且 其中接入交換機(jī)單設(shè)備故障率約為〇. 045,而匯聚交換機(jī)單設(shè)備故障率更是高達(dá)0. 111 ;在 鏈路故障中,接入交換機(jī)和匯聚交換機(jī)之間鏈路故障的比例最高,達(dá)到58%,且這些鏈路故 障會有18 %左右的概率影響到網(wǎng)絡(luò)的連通性。
[0010] 綜上所述,需要有一個網(wǎng)絡(luò)新的評估體系,能夠考慮數(shù)據(jù)中心巨大的設(shè)備規(guī)模與 復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),并能夠通過設(shè)備指標(biāo)對網(wǎng)絡(luò)設(shè)備性能進(jìn)行預(yù)測,幫助進(jìn)行網(wǎng)絡(luò)的優(yōu)化。
【發(fā)明內(nèi)容】
[0011] 本發(fā)明要解決的技術(shù)問題就在于:針對現(xiàn)有技術(shù)存在的技術(shù)問題,本發(fā)明提供一 種實現(xiàn)方法簡單,能夠?qū)Υ笠?guī)模網(wǎng)絡(luò)中設(shè)備健康度進(jìn)行有效、全面的評估并能夠根據(jù)網(wǎng)絡(luò) 結(jié)構(gòu)進(jìn)行自適應(yīng)的動態(tài)調(diào)節(jié)的數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備健康度的自適應(yīng)評價方法。
[0012] 為解決上述技術(shù)問題,本發(fā)明提出的技術(shù)方案為:
[0013] -種數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備健康度的自適應(yīng)評價方法,步驟為:
[0014] 1)健康度評價模型建立:建立設(shè)備的健康度模型,將設(shè)備的多項性能參數(shù) 與性能參數(shù)對應(yīng)權(quán)值的加權(quán)和作為健康度值,健康度值的計算公式為:HEALTHU= DEVPERFWXDEVPERF,其中HEALTHU為設(shè)備的健康度值,DEVPERF為性能參數(shù)矩陣,DEVPERFW 為參數(shù)權(quán)值矩陣,將健康度值按公式HEALTH=eAl+eHEAUBU)轉(zhuǎn)換為健康指數(shù)HEALTH,e 為轉(zhuǎn)換系數(shù);
[0015] 2)狀態(tài)數(shù)據(jù)采集:獲取網(wǎng)絡(luò)拓?fù)涿枋鲂畔⒉⒏鶕?jù)設(shè)備在網(wǎng)絡(luò)中的位置采用不同 的采集頻率采集各設(shè)備所有網(wǎng)絡(luò)接口的狀態(tài)信息,根據(jù)采集到的狀態(tài)信息計算設(shè)備報文接 收狀況、掉線狀況的多項性能參數(shù);
[0016] 3)參數(shù)權(quán)值調(diào)整:設(shè)置各項所述性能參數(shù)對應(yīng)的權(quán)值并根據(jù)各設(shè)備中性能參數(shù) 的概率進(jìn)行調(diào)整,由性能參數(shù)和調(diào)整后的權(quán)值根據(jù)所述健康度模型計算設(shè)備的健康指數(shù), 再根據(jù)計算得出的健康指數(shù)調(diào)整權(quán)值,直至將所述健康度指數(shù)調(diào)整至預(yù)設(shè)區(qū)間內(nèi),得到最 終的健康指數(shù)評價網(wǎng)絡(luò)設(shè)備的健康度。
[0017] 作為本發(fā)明的進(jìn)一步改進(jìn):所述步驟1)中設(shè)備的性能參數(shù)包括平均丟包率、平均 錯誤率、板卡掉線次數(shù)以及設(shè)備掉線次數(shù)中的任意多種組合。
[0018] 作為本發(fā)明的進(jìn)一步改進(jìn),所述步驟2)中根據(jù)采集到的狀態(tài)信息計算設(shè)備報文 接收狀況、掉線狀況的多項性能參數(shù)的具體實施方法為:
[0019] 2. 1)令集合S等于網(wǎng)絡(luò)中所有設(shè)備的集合S= {V(l,v2,…,%},取集合S中首個設(shè) 備Vi,轉(zhuǎn)入執(zhí)行步驟2. 2);
[0020] 2. 2)按照下式計算設(shè)備Vi的平均丟包率AvgDisRate;
【權(quán)利要求】
1. 一種數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備健康度的自適應(yīng)評價方法,其特征在于,步驟為: 1) 健康度評價模型建立:建立設(shè)備的健康度模型,將設(shè)備的多項性能參數(shù)與 性能參數(shù)對應(yīng)權(quán)值的加權(quán)和作為健康度值,健康度值的計算公式為:HEALTHU= DEVPERFWXDEVPERF,其中HEALTHU為設(shè)備的健康度值,DEVPERF為性能參數(shù)矩陣,DEVPERFW 為參數(shù)權(quán)值矩陣,將健康度值按公式HEALTH=eAl+eHEAU?)轉(zhuǎn)換為健康指數(shù)HEALTH,ε 為轉(zhuǎn)換系數(shù); 2) 狀態(tài)數(shù)據(jù)采集:獲取網(wǎng)絡(luò)拓?fù)涿枋鲂畔⒉⒏鶕?jù)設(shè)備在網(wǎng)絡(luò)中的位置采用不同的采 集頻率采集各設(shè)備所有網(wǎng)絡(luò)接口的狀態(tài)信息,根據(jù)采集到的狀態(tài)信息計算設(shè)備報文接收狀 況、掉線狀況的多項性能參數(shù); 3) 參數(shù)權(quán)值調(diào)整:設(shè)置各項所述性能參數(shù)對應(yīng)的權(quán)值并根據(jù)各設(shè)備中性能參數(shù)的概 率進(jìn)行調(diào)整,由性能參數(shù)和調(diào)整后的權(quán)值根據(jù)所述健康度模型計算設(shè)備的健康指數(shù),再根 據(jù)計算得出的健康指數(shù)調(diào)整權(quán)值,直至將所述健康度指數(shù)調(diào)整至預(yù)設(shè)區(qū)間內(nèi),得到最終的 健康指數(shù)評價網(wǎng)絡(luò)設(shè)備的健康度。
2. 根據(jù)權(quán)利要求1所述的數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備健康度的自適應(yīng)評價方法,其特征在于: 所述步驟1)中設(shè)備的性能參數(shù)包括平均丟包率、平均錯誤率、板卡掉線次數(shù)以及設(shè)備掉線 次數(shù)中的任意多種組合。
3. 根據(jù)權(quán)利要求2所述的數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備健康度的自適應(yīng)評價方法,其特征在于, 所述步驟2)中根據(jù)采集到的狀態(tài)信息計算設(shè)備報文接收狀況、掉線狀況的多項性能參數(shù) 的具體實施方法為: 2. 1)令集合S等于網(wǎng)絡(luò)中所有設(shè)備的集合S=Ivtl,V2,…,%},取集合S中首個設(shè)備Vi, 轉(zhuǎn)入執(zhí)行步驟2. 2); 2. 2)按照下式計算設(shè)備Vi的平均丟包率AvgDisRate;
其中eg表示設(shè)備Vi的第j個接口,Mi是設(shè)備Vi的接口總數(shù),IfInDisRate(eu)為eij接 口的入接口丟包率且IfInDisRate(eυ) =ΛI(xiàn)flnDiscarcKeij)/ΛΙ?1ηΡ1?1:(θυ), IfOutDisRate(e^)為e^·接口 的出接口丟包率且IfOutDisRate(eυ) =ΛI(xiàn)fOutDiscardCei j) /ΛI(xiàn)fOutPktGij),IfInDiscardGij)為e^·接口的出接口丟棄報文數(shù),IfInPkt(eu)為e" 接口的入接口報文數(shù),IfOutDiscard(eij)為eij接口的出接口丟棄報文數(shù),IfOutPkUeij) 為接口的出接口報文數(shù); 按照下式計算設(shè)備Vi的平均錯誤率AvgErrRate;
其中IfInErrRate(Gij)為eu接口 的入接口錯誤率且IfInErrRate(eu)=ΛI(xiàn)fInErKeij)/ΛI(xiàn)fInPkt(ej,IfOutErrRate(e^)為e^·接口 的出接口錯誤率且 IfOutErrRate(e?!? =ΛI(xiàn)fOutErr(e。)/ΛI(xiàn)fOutPkt(e。),IflnErr(e。)為e?!そ涌?的入接 口錯誤報文數(shù),IfOutErr(eij)為eij接口的出接口錯誤報文數(shù); 設(shè)置板卡掉線閥值w,判斷設(shè)備Vi上板卡的接口狀態(tài),若板卡上有X個接口的狀態(tài)為掉 線狀態(tài)且x/Hi>w,則判定板卡出現(xiàn)一次掉線,其中Hi是設(shè)備Vi上板卡的總數(shù),計算得到設(shè) 備板卡掉線次數(shù)SLOTERRC(Vi); 計算設(shè)備Vi的設(shè)備掉線次數(shù)DR0PC(vJ,并將計算得到的平均丟包率AvgDisRate(Vi)、平均錯誤率AvgErrRate(Vi)、板卡掉線次數(shù)SLOTERRC(Vi)以及設(shè)備掉線次數(shù)DROPC(Vi)保 存至性能參數(shù)矩陣DEVPERF(Vi)中; 2.3)將設(shè)備Vi從集合S中刪除,取下一個設(shè)備返回執(zhí)行步驟2. 2),直至集合S為空, 獲得各設(shè)備的性能參數(shù)矩陣DEVPERF=[DEVPERF(V。),DEVPERF(V1),…,DEVPERF(vN)]。
4. 根據(jù)權(quán)利要求3所述的數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備健康度的自適應(yīng)評價方法,其特征在于, 所述步驟3)的具體實施步驟為: 3. 1)局部權(quán)值調(diào)整:對所述步驟2)輸出的各項性能參數(shù)對應(yīng)的權(quán)值進(jìn)行初始化,計算 各項性能參數(shù)在各設(shè)備中的發(fā)生概率并根據(jù)概率值調(diào)整對應(yīng)的權(quán)值,輸出調(diào)整后的權(quán)值; 3. 2)循環(huán)權(quán)值調(diào)整:接收調(diào)整后的權(quán)值并與各項性能參數(shù)一起根據(jù)健康度模型計算 設(shè)備的健康指數(shù),計算所述健康指數(shù)的標(biāo)準(zhǔn)方差并判斷計算得出的所述標(biāo)準(zhǔn)方差是否在 預(yù)設(shè)標(biāo)準(zhǔn)方差區(qū)間內(nèi),若為否,上調(diào)或下調(diào)性能參數(shù)對應(yīng)的權(quán)值,返回執(zhí)行步驟3. 2);若為 是,將當(dāng)前健康指數(shù)作為最終的健康指數(shù)評價設(shè)備的健康度并退出計算。
5. 根據(jù)權(quán)利要求4所述的數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備健康度的自適應(yīng)評價方法,其特征在于, 所述步驟3. 1)的具體實施步驟為: 3. I. 1)將步驟2)獲得的性能參數(shù)矩陣DEVPERF = [DEVPERF(V。),DEVPERF(V1),…,DEVPERF (vN)]變換為DEVPERF = [DisRate, ErrRate, SLOTERRC, DROPC],其中DisRate為平 均丟包率集合且DisRate = {AvgDisRate(V。),…,AvgDisRate (vN)},ErrRate為平均錯誤 率集合且ErrRate = {AvgErrRate(V。),…,AvgErrRate (vN)},SLOTERRC為板卡掉線次數(shù)集 合且SLOTERRC={SLOTERRC(V。),…,SLOTERRC(vN)},DROPC為設(shè)備掉線次數(shù)集合且DROPC ={DROPC(v〇), - ,DR0PC(vn)}; 3.L2)定義參數(shù)權(quán)值矩陣DEVPERFW= [DisRateW,ErrRateW,SL0TERRCW,DR0PCW],其 中DisRateW、ErrRateW、SL0TERRCW和DROPCW分別對應(yīng)為平均丟包率、平均錯誤率、板卡掉 線次數(shù)以及設(shè)備掉線次數(shù)的權(quán)值,對權(quán)值矩陣DEVPERFW進(jìn)行初始化; 3. 1.3)分別對平均丟包率集合DisRate、平均錯誤率集合ErrRate、板卡掉線次數(shù)集合SLOTERRC和設(shè)備掉線次數(shù)集合DROPC中非0值進(jìn)行統(tǒng)計,得到各項性能參數(shù)在各設(shè)備中的 發(fā)生概率F=N0NZER0/C0UNT,其中COUNT表示集合中元素的總個數(shù),NONZERO表示集合中 非〇的個數(shù);判斷性能參數(shù)的發(fā)生概率F的大小,如果F〈FMIN,則提高性能參數(shù)對應(yīng)的參數(shù)權(quán) 值W且W=W+RANGEV;如果FMIN〈F〈FMX,不改變性能參數(shù)對應(yīng)的參數(shù)權(quán)值W;如果FWmax,降 低性能參數(shù)對應(yīng)的參數(shù)權(quán)值W且W=W-RANGEV,其中Fmx和FMIN分別為性能參數(shù)發(fā)生概率 的上限值、下限值,RANGEV為權(quán)值調(diào)整的幅度。
6. 根據(jù)權(quán)利要求5所述的數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備健康度的自適應(yīng)評價方法,其特征在于, 所述步驟3. 2)的具體實施步驟為: 3. 2. 1)由參數(shù)權(quán)值矩陣DEVPERFW和性能參數(shù)矩陣DEVPERF根據(jù)健康度模型計算網(wǎng)絡(luò) 中各設(shè)備的健康度值HEALTHU,得到HEALTHU=DEVPERFWXDEVPERF= [R。,R1,·…,RJ,其 中Ri為第i個設(shè)備的健康度值;將健康度值按公式HEALTHi= 100X2Al+eKi)轉(zhuǎn)換為健康 指數(shù)值HEALTH,獲得各設(shè)備的健康指數(shù)值HEALTH= [HEALTH。,HEALTH1,....,HEALTHN]; 3. 2. 2)計算各設(shè)備的健康指數(shù)HEALTH的標(biāo)準(zhǔn)方差并判斷標(biāo)準(zhǔn)方差的大小,如 果H^Emax,下調(diào)性能參數(shù)權(quán)值,返回執(zhí)行步驟3. 2. 1);如果HKEmin,上調(diào)性能參數(shù)權(quán)值,返 回執(zhí)行步驟3. 2. 1);如果EMIN〈EH〈EMAX,取當(dāng)前的健康度值為最終設(shè)備的健康度值并退出 計算,其中Emx是預(yù)設(shè)標(biāo)準(zhǔn)方差的最大值,EMIN是預(yù)設(shè)標(biāo)準(zhǔn)方差的最小值。
7.根據(jù)權(quán)利要求1?6中任意一項所述的數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備健康度的自適應(yīng)評價方 法,其特征在于,所述步驟2)中根據(jù)設(shè)備在網(wǎng)絡(luò)中的位置采用不同的采集頻率采集各設(shè)備 所有網(wǎng)絡(luò)接口的狀態(tài)信息的具體實施方法為:輸入網(wǎng)絡(luò)拓?fù)湫畔⒉⒏鶕?jù)設(shè)備在網(wǎng)絡(luò)中的位 置將網(wǎng)絡(luò)中各設(shè)備進(jìn)行劃分,根據(jù)設(shè)備劃分的層次為各個網(wǎng)絡(luò)設(shè)備設(shè)置優(yōu)先級;根據(jù)各設(shè) 備的優(yōu)先級設(shè)置對應(yīng)的采樣頻率采集設(shè)備的狀態(tài)信息,并將采集到的狀態(tài)信息按照采集時 間寫入數(shù)據(jù)庫中。
【文檔編號】H04L12/24GK104468200SQ201410690233
【公開日】2015年3月25日 申請日期:2014年11月25日 優(yōu)先權(quán)日:2014年11月25日
【發(fā)明者】陳琳, 王寶生, 張曉哲, 黃峰, 黃杰, 陶靜, 劉亞萍, 王斌鋒, 南洋, 張飛朋 申請人:中國人民解放軍國防科學(xué)技術(shù)大學(xué)