專利名稱:一種對時延、丟包進行綜合測量及關聯(lián)分析的系統(tǒng)和方法
技術領域:
本發(fā)明涉及一種對時延、丟包進行綜合測量及關聯(lián)分析的系統(tǒng)和方法,屬于固定分組網(wǎng)絡、計算機網(wǎng)絡、移動無線數(shù)據(jù)網(wǎng)絡中的測量分析技術領域。
背景技術:
在互聯(lián)網(wǎng)的運維中,客戶網(wǎng)絡的多種多樣接入方式(例如撥號、ADSL、以太網(wǎng)接入、光接入等)和千差萬別的故障原因(包括線路質量問題、客戶使用網(wǎng)絡不當導致?lián)砣?、網(wǎng)絡流量過大導致的擁塞等),使得網(wǎng)絡運行情況的總體評估和故障判斷,已經(jīng)不再能夠單靠某個網(wǎng)絡測量指標所能解決的問題。因此,如何對通信網(wǎng)絡中端到端的時延和丟包兩個指標進行綜合測量和關聯(lián)分析,實現(xiàn)通信網(wǎng)絡性能的總體評估和故障的快速區(qū)分,就成為業(yè)內人員關注的焦點。
目前,在彼此獨立的時延和丟包測量方面都有一些現(xiàn)有技術可供借鑒,現(xiàn)分別簡述如下雙向時延的測量是在一端發(fā)送攜帶時間標記的分組,另一端接收到該分組后,立即返回給發(fā)送端,發(fā)送端利用該分組的接收時間和分組攜帶的時間標記計算端到端路徑的雙向時延值。這里,從發(fā)送端到接收端所經(jīng)過的網(wǎng)絡鏈路和節(jié)點(路由器、交換機等)的序列集合,稱為被測網(wǎng)絡路徑。單向時延只計算雙向路徑中單個方向的時延值。由于兩端間的時間不完全同步,大多數(shù)測量裝置使用第三方工具進行時鐘同步,如網(wǎng)絡時間協(xié)議NTP方法、全球定位系統(tǒng)GPS。NTP方法實現(xiàn)過程簡單,但是它的最大誤差接近于雙向時延,因此精度難于達到實用化要求。GPS系統(tǒng)可以使得各個GPS信號接收點之間實現(xiàn)us級的時鐘同步,測量精度高;但是,GPS設備價格昂貴,而且使用前還需要部署天線,這就使得該技術不可能廣泛地被廣大互聯(lián)網(wǎng)和移動數(shù)據(jù)網(wǎng)用戶接受使用。
丟包的測量是通過在端到端之間收發(fā)分組序列,并在接收端對打了序號標記的分組進行統(tǒng)計計數(shù),以確定在某時間段內的丟包數(shù),從而獲得丟包比例。
上述兩種測量方法是從時延和丟包兩個不同角度分別衡量網(wǎng)絡的服務質量,其弱點是兩種測量結果數(shù)據(jù)各自獨立,無法對當時的網(wǎng)絡狀況進行關聯(lián)的綜合分析。然而,在分組網(wǎng)絡中,許多網(wǎng)絡故障和性能惡化現(xiàn)象的原因,單憑時延或丟包的獨立測量結果是無法準確判斷的。例如分組網(wǎng)丟包,可能是鏈路誤碼導致分組誤碼丟包,也可能是路由器緩沖區(qū)溢出導致?lián)砣麃G包,還可能是路由抖動使得IP分組TTL生存時間為0而導致丟包。如果能夠通過一次測量,在同一時間段內同時考察網(wǎng)絡路徑上的某個測試流的時延和丟包性能,將會發(fā)現(xiàn)許多重要現(xiàn)象,作為網(wǎng)絡故障診斷的重要數(shù)據(jù)基礎。
基于通信網(wǎng)絡中時延和丟包的內在關聯(lián)性能,同時測量多種性能參數(shù)和進行關聯(lián)分析,能夠更準確地展示網(wǎng)絡性能狀況。因此,如何研究和開發(fā)一種對網(wǎng)絡傳輸狀況進行時延和丟包的綜合測量及關聯(lián)分析的系統(tǒng)和方法,已經(jīng)開始引起業(yè)內人士的關注。
本發(fā)明借鑒了現(xiàn)有的LOSS PAIR技術和消除單向時延測量中的時鐘偏斜和重置的技術,并在其基礎上進行了改進和發(fā)展?,F(xiàn)對這兩種技術簡介如下LOSS PAIR技術在文獻《Using Loss Pairs to Discover Network Properties》(刊于ACM SIGCOMM Internet Measurement Workshop,2001)中用于推測網(wǎng)絡內部路由器的緩沖配置、路徑瓶頸位置的隊列管理模式,其基本原理是發(fā)送一串PAIR,該PAIR由背靠背(發(fā)送間隔時間為0)的兩個分組構成。由于兩個分組是背靠背發(fā)送的,且分組長度很小,因此該兩個分組在網(wǎng)絡中經(jīng)歷的網(wǎng)絡特性近似相等。
文獻《A Fuzzy-based Approach to Remove Clock Skew and Reset fromOne-Way Delay Measurement》(刊于IEEE Transactions on NeuralNetworks.2005.9.Vol.16,No.5)提出了單向時延測量中的時鐘偏斜和重置的消除方法基于模糊聚類分析的算法,檢測并消除測量端之間的相對時鐘頻差和時鐘重置給單向時延測量引入的誤差。本發(fā)明在消除測量兩端的時鐘不同步所帶來的單向時延測量的誤差時采用該文獻介紹的方法。
發(fā)明內容
有鑒于此,本發(fā)明的目的是提供一種對時延、丟包進行綜合測量及關聯(lián)分析的方法和系統(tǒng),本發(fā)明擯棄了現(xiàn)有測量技術的單一測量觀點及獨立分析方法,并基于現(xiàn)有測量技術,在通信網(wǎng)絡的端到端之間同時實現(xiàn)時延和丟包的綜合測量,在同時獲取同一路徑上的時延和丟包兩個測量指標后,再對其進行關聯(lián)分析,以獲取網(wǎng)絡內在特性,提高網(wǎng)絡運維效率。
為了達到上述目的,本發(fā)明提供了一種對時延、丟包進行綜合測量及關聯(lián)分析的系統(tǒng),由分別位于被測網(wǎng)絡路徑兩端的測量裝置和反饋裝置所組成;其特征在于所述測量裝置的組成部件包括收發(fā)單元、分析單元和通信控制單元,反饋裝置的組成部件至少包括反饋單元和通信控制單元;其中收發(fā)單元和反饋單元用于實現(xiàn)被測網(wǎng)絡路徑兩端之間測試流的交互,并在測試過程中對每個分組填寫相應的測試數(shù)據(jù);兩端的通信控制單元相互連接,用于控制、實現(xiàn)測試數(shù)據(jù)的交互;分析單元藉由其分析策略軟件對同時獲取的時延、丟包兩種測量參數(shù)進行關聯(lián)分析,并向用戶呈現(xiàn)最終測量結果。
所述收發(fā)單元和反饋單元在測試過程中對每個測試分組添加的測試參數(shù)至少包括分組序號、發(fā)送時間戳、反饋時間戳、接收時間戳。
為了達到上述目的,本發(fā)明還提供了一種根據(jù)上述對時延、丟包進行綜合測量及關聯(lián)分析的系統(tǒng)進行綜合測量和關聯(lián)分析的方法,其特征在于發(fā)送一串由測試包對PAIR構成的測試流,其中每個測試包對是背靠背—發(fā)送間隔時間為0—的兩個分組,且每個分組長度很小,該兩個分組在網(wǎng)絡中的傳輸性能被視為相等;測試流中的包對丟失其中一個分組后,采用另一個分組來代表被丟棄分組的時延,藉此同時測量該測試流的時延和丟包狀況,并進行關聯(lián)分析,評估網(wǎng)絡運行的總體情況,準確判斷和區(qū)分造成丟包和擁塞故障的不同原因,提高運維效率。
所述測試流中的分組格式包括包頭、分組序號PID、發(fā)送標記STAG和可選的反饋標記DTAG,其中PID是在測量過程中唯一標識該分組的序列號,STAG是測量裝置發(fā)送測試分組時嵌入時間戳和其它標記的字段,DTAG是反饋裝置在回應測試分組時嵌入時間戳和其它標記的字段,該三者字長均不大于4字節(jié)。
所述測試流的測試包對PAIR采用IP協(xié)議或UDP協(xié)議進行封裝。
所述方法包括下列步驟(1)測量測試流測量裝置生成測試流,再將其發(fā)送給對端;反饋裝置在接收到的測試流分組中標記接收時間戳后,將該測試流反饋給測量裝置;(2)分析測試流測量裝置根據(jù)其測試流的發(fā)送和接收信息,以及反饋裝置發(fā)送來的反饋數(shù)據(jù),進行計算處理和綜合分析后,輸出測量結果數(shù)據(jù)。
所述兩個步驟之間的時序是并行或重疊的測量裝置在接收到反饋裝置于每個測量周期或測量結束后發(fā)送的反饋數(shù)據(jù)時,就觸發(fā)、啟動分析測試流的操作;同時,繼續(xù)執(zhí)行測量測試流的操作。
所述步驟(1)進一步包括下列操作內容(11)用戶設置測試流的參數(shù)測試流的參數(shù)至少包括每個包對的分組結構,各分組間的時間間隔-測試流的發(fā)送流量模型,測試流的長度-測試包對PAIR的數(shù)量;(12)收發(fā)單元根據(jù)測試流參數(shù)構造測試流構造測試包對中的分組時,各分組的PID字段序列號保證唯一,以便在測量時間內對接收的分組與發(fā)送的分組進行PID匹配;在分組的STAG字段填充發(fā)送時間戳時,可用系統(tǒng)相對時鐘,但時間精度不低于10ms,以保持測量結果在時延大范圍變動下的一致性;(13)收發(fā)單元發(fā)送測試流將生成的測試流按照設定的流量模型發(fā)送到被測網(wǎng)絡路徑上,同時至少記錄發(fā)送測試流的下述信息每個分組的發(fā)送時間戳和每個測試流的長度;必要時,記錄所有分組的序列號PID范圍;(14)反饋單元接收測試流反饋單元使用無限循環(huán)的、與其他任務并發(fā)運行的后臺任務方式實時監(jiān)聽網(wǎng)絡測試流,并接收所有分組和進行及時處理記錄所接收到的分組PID字段和STAG字段數(shù)據(jù),并排序保存之;
(15)反饋單元標記測試流反饋單元在接收到的分組的DTAG字段嵌入反饋時間戳時,可用系統(tǒng)相對時鐘,但時間精度不低于10ms,以保持測量結果在時延大范圍變動下的一致性;(16)反饋單元反饋測試流反饋單元把嵌入相關標記的測試流及時送到被測網(wǎng)絡返回路徑上,回送給測量裝置;(17)收發(fā)單元接收測試流。收發(fā)單元監(jiān)聽并接收從反饋裝置回送的測試流,記錄在接收時流中每個分組的信息數(shù)據(jù)。
所述步驟(2)進一步包括下列操作內容(21)反饋單元收集測試流的反饋數(shù)據(jù),并將該反饋數(shù)據(jù)發(fā)送給測量裝置反饋單元周期性地收集反饋數(shù)據(jù),即測試流在反饋裝置的接收信息和反饋信息,再由通信控制單元以可靠的通信方式將反饋數(shù)據(jù)發(fā)送給測量裝置;(22)分析單元收集測試流的各種信息分析單元收集測量裝置的測試流收發(fā)數(shù)據(jù),即其收發(fā)單元在發(fā)送和接收分組序列時所記錄的分組信息,并通過通信控制單元接收反饋裝置發(fā)送來的反饋數(shù)據(jù);(23)分析單元調用分析策略軟件對測試流的收發(fā)數(shù)據(jù)和反饋數(shù)據(jù)進行關聯(lián)分析;(24)分析單元將最后測量結果直接以數(shù)據(jù)表和/或曲線形式呈現(xiàn)給用戶。
所述步驟(23)進一步包括下列操作內容(231)分析單元收到收發(fā)數(shù)據(jù)和反饋數(shù)據(jù)后,以測試流中的分組序號PID為關鍵字,建立測試流數(shù)據(jù)表,其中每條記錄對應一個測試分組;(232)計算測試流數(shù)據(jù)表中的每個分組的時延、丟包率、連續(xù)丟包數(shù)時延的計算方法是先計算分組的雙向時延值RTT=Tr-Ts,式中,Ts為測量裝置發(fā)送該分組的時間,Tr為測量裝置接收到反饋分組的時間;接著,計算測量裝置到反饋裝置的原始單向時延值OWLo=Te-Ts,式中,Te為反饋裝置接收到該分組的時間;再對OWLo進行時鐘同步校正,獲得修正后的單向時延值OWL;最后計算反饋裝置到測量裝置的單向時延值OWLr=RTT-OWL;
丟包率計算方法是雙向丟包率Ls=1-Cr/Cs,]]>測量裝置到反饋裝置的單向丟包率Le=1-Ce/Cs,]]>反饋裝置到測量裝置的單向丟包率Lr=1-Cr/Ce=1-(1-Ls)/(1-Le),]]>式中,Cs為給定測試流中,測量裝置記錄發(fā)送的分組總數(shù)-測試流長度,Cr為測量裝置記錄接收到的反饋分組數(shù),Ce為反饋裝置記錄接收到的分組數(shù);連續(xù)丟包數(shù)計算方法是對給定的測試流,記錄測量裝置發(fā)送的分組PID范圍,并在每次接收到反饋裝置的返回分組后,都將其PID與上一次所接收到的返回分組的PID進行比較,其中兩次收到的PID的最大差值為連續(xù)丟包數(shù);(233)評估網(wǎng)絡總體性能將整個測量時間均分為n個時間段,分別計算每個時間段內的平均雙向時延和雙向丟包率,記為集合{RTTi,LOSSi},式中,時間段的序列號i的取值范圍是0<i<n,n為自然數(shù),時間段長度酌情選??;再分別以時延T和丟包率L為橫軸和縱軸構建兩維坐標系,并以各軸上的兩個低、高門限T1、T2和L1、L2將該兩維坐標平面劃分為若干區(qū)域,根據(jù)集合{RTTi,LOSSi}在該坐標系中的區(qū)域位置,以統(tǒng)計方式展示測試流的時延、丟包特性,實現(xiàn)網(wǎng)絡的總體性能評估;其中,時延T1數(shù)值的選擇取決于被測網(wǎng)絡路徑情況位于接入網(wǎng)或同一局域網(wǎng)內,為2-10ms;位于城域網(wǎng)范圍內,則為20~50ms;位于廣域網(wǎng)范圍,則為100~500ms;構成跨洋路徑時,則為600~1200ms;T2選為2~8倍的T1;丟包率L1選為1%~5%,L2選為10%~30%;當統(tǒng)計點集中在同時滿足時延<T1和丟包率<L1的區(qū)域時,說明此時網(wǎng)絡處于性能良好的輕載狀態(tài),適合承載對時延和丟包率要求均較高的業(yè)務;當統(tǒng)計點集中于同時滿足T1<時延<T2和丟包率<L1的區(qū)域時,網(wǎng)絡丟包率較低、但是時延偏高,說明此時路徑中路由器的緩沖區(qū)長度配置較高,適合部署對丟包率要求高但是對時延要求不甚敏感的業(yè)務;當統(tǒng)計點集中于同時滿足T1<時延<T2和L1<丟包率<L2的區(qū)域時,說明網(wǎng)絡路徑已經(jīng)擁塞嚴重,需要進行網(wǎng)絡路徑擴容;當測量點落在同時滿足時延>T2和丟包率>L2的區(qū)域時,即時延和丟包率都較大,其原因通常是路由抖動;此時,由于路由器的路由不一致,出現(xiàn)分組“路由打圈”現(xiàn)象,大部分分組因IP協(xié)議分組頭的生存時間TTL變?yōu)?而被路由器丟棄,少部分分組即使最終到達目的地,時延也超常;當統(tǒng)計點集中在同時滿足時延<T1和L1<丟包率<L2的區(qū)域時,時延較低、但丟包率偏高,此時可懷疑是線路誤碼丟包或該網(wǎng)絡路徑上路由器的緩沖區(qū)配置過??;為準確區(qū)分兩種原因,繼續(xù)進行后續(xù)的丟包原因的關聯(lián)分析;(234)對于時延較低、但丟包率偏高的情況,分析區(qū)分線路誤碼丟包或擁塞丟包將整個測量期間發(fā)生的所有丟包記為LOSSPACKETAD,先計算LOSSPACKETAD中每個丟包的時延,如果是單個丟包,則以包對中另一個成功到達的分組時延作為其時延值;如果是連續(xù)丟包,則以最接近連續(xù)丟包的序列號之前、后的兩個分組的時延的平均值作為該連續(xù)丟包分組的時延值;分別以時延T和丟包數(shù)為橫軸和縱軸構建兩維坐標系,并以橫軸上的門限T1和縱軸上的丟包個數(shù)將該兩維坐標平面劃分為若干區(qū)域,并利用LOSSPAIRAD的樣點來繪制連續(xù)丟包數(shù)、時延的聯(lián)合概率分布圖,最后,依據(jù)樣點分布概率所在區(qū)域來判斷線路誤碼丟包或擁塞丟包當樣點集中分布在同時滿足時延<T1和連續(xù)丟包數(shù)=1的區(qū)域時,說明時延小且為單個丟包,則是線路誤碼原因引起丟包;當樣點集中分布在同時滿足時延<T1和連續(xù)丟包數(shù)>1的區(qū)域時,說明時延小和連續(xù)丟包,則是該路徑上的路由器緩沖區(qū)長度配置太小,當網(wǎng)絡流量有突發(fā)時,將導致嚴重的連續(xù)丟包;當樣點集中分布在同時滿足時延>T1和連續(xù)丟包數(shù)>1的區(qū)域時,說明時延大和丟包連續(xù)數(shù)大,則是線路擁塞引起的丟包;(235)對于擁塞引起的丟包,繼續(xù)關聯(lián)分析區(qū)別用戶網(wǎng)絡的上下行擁塞情況先分別以上行時延和下行時延為橫軸和縱軸構建兩維坐標系,并以兩軸上的時延門限T將該兩維坐標平面劃分為四個區(qū)域上下行空閑的A區(qū),上行空閑、下行繁忙的B區(qū),上下行都繁忙的C區(qū),上行繁忙、下行空閑的D區(qū);再將每個測量時間段的上下行平均時延值的集合記為{UDi,DDi},式中,時間段的序列號i的取值范圍是0<i<n,n為自然數(shù);如果大部分統(tǒng)計點集中在A區(qū),表示上下行時延均較小,網(wǎng)絡較為空閑;如果大部分統(tǒng)計點集中在B區(qū),表示上行空閑,下行繁忙,則通常為普通互聯(lián)網(wǎng)用戶訪問網(wǎng)絡的情況,原因是大部分數(shù)據(jù)都將從互聯(lián)網(wǎng)數(shù)據(jù)中心IDC(Internet Data Center)下載到客戶端;如果大部分統(tǒng)計點集中在C區(qū),表示上下行均繁忙,則通常是點對點應用運行的時延特性;如果大部分統(tǒng)計點集中在D區(qū),表示上行繁忙而下行空閑,通常為客戶網(wǎng)絡中設有對外提供服務的服務器,由該服務器對外提供內容傳遞服務而導致上行帶寬擁塞。
所述方法適用于固定分組網(wǎng)絡、無線數(shù)據(jù)網(wǎng)絡和計算機網(wǎng)絡的性能測試,也適用于包括但不限于VOIP、IPTV的實時業(yè)務的網(wǎng)絡性能評估。
本發(fā)明是一種對時延、丟包進行綜合測量及關聯(lián)分析的系統(tǒng)和方法,相對現(xiàn)有技術,具有如下優(yōu)點(1)本發(fā)明能夠一次同時完成兩個方向的單向時延、路徑雙向時延、丟包率和連續(xù)丟包數(shù)的測量,同時獲得基于丟包率和時延的綜合、關聯(lián)分析結果,從而能夠評估網(wǎng)絡運行的總體情況;對于丟包嚴重的情況,可以區(qū)分是線路誤碼丟包、擁塞丟包還是路由抖動丟包;再區(qū)分造成網(wǎng)絡擁塞的各種不同原因(路由刷新、路由器配置不合理等);并通過上下行時延分析,區(qū)分是BT等P2P業(yè)務導致的擁塞,還是提供上傳服務導致的擁塞,或者是傳統(tǒng)互聯(lián)網(wǎng)下載應用導致的擁塞(主要指WEB、Email、FTP等以單個TCP連接為基礎的數(shù)據(jù)傳送業(yè)務)等多種故障現(xiàn)象。最終,幫助網(wǎng)絡運維人員迅速判斷故障原因,提高運維效率,并切實幫助網(wǎng)絡客戶解決相關技術問題。
(2)適應性廣本發(fā)明的應用不局限于特定的網(wǎng)絡架構、技術、協(xié)議等,適用于現(xiàn)有和未來的許多通信網(wǎng)絡,包括光纖、同軸、無線網(wǎng)絡;以太、令牌環(huán)網(wǎng)絡;IP網(wǎng)、移動網(wǎng)絡、NGN等等。
(3)成本低、部署方便由于本發(fā)明使用的各項測量裝置和技術都是成熟技術,可以有效控制設備成本。而且,只用一套系統(tǒng)裝置就可以對整個網(wǎng)絡的任何兩點進行測量,無需在其它測量點部署設備,更無需添置昂貴的諸如GPS之類的設備。無需被測網(wǎng)絡作特定配置,無空間和位置要求。
(4)測試代價小系統(tǒng)進行測試時幾乎不影響原有通信,對網(wǎng)絡測量路徑上的負載增加微乎其微,尤其是一次測量同時完成多項功能,更減少了對網(wǎng)絡負載的影響。
圖1是測試過程中包對PAIR中丟失一個分組的傳輸情況示意圖。
圖2是本發(fā)明對時延、丟包進行綜合測量及關聯(lián)分析的系統(tǒng)結構示意圖。
圖3是本發(fā)明測量方法中的測量操作步驟的流程方框圖。
圖4是本發(fā)明測量方法中的分析操作步驟的流程方框圖。
圖5是本發(fā)明的測試流中的分組結構示意圖。
圖6是本發(fā)明由包對PAIR組成的測試流的結構示意圖。
圖7是圖4中的分析單元操作流程方框圖。
圖8是對時延、丟包進行綜合統(tǒng)計分析、評估網(wǎng)絡總體性能的坐標示意圖。
圖9是對時延、連續(xù)丟包進行關聯(lián)分析、評估丟包原因的坐標示意圖。
圖10是對上下行時延進行分析、評估的坐標示意圖。
圖11是本發(fā)明一試驗實施例的系統(tǒng)結構組成示意圖。
具體實施例方式
為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面結合附圖對本發(fā)明作進一步的詳細描述。
參見圖1,介紹本發(fā)明的測試機理或方法發(fā)送一串由測試包對PAIR構成的測試流,并對其同時進行時延和丟包的綜合測量和關聯(lián)分析,其中每個測試包對PAIR是背靠背(即發(fā)送間隔時間為0)的兩個分組(圖中以1、2表示之),且每個分組長度很小,因此,這兩個分組在網(wǎng)絡中的傳輸性能被視為相等。當發(fā)送端發(fā)出的測試流中的包對1、2在經(jīng)過某個中間節(jié)點(圖示為“丟包點”)時丟棄其中一個分組2(稱為LOSS PAIR)后,采用另一個未丟失的分組1到達發(fā)送端的時延值來代表被丟棄分組2的時延值,藉此同時測量該測試流的時延和丟包狀況,再進行兩者的關聯(lián)分析,進而區(qū)分擁塞和丟包的不同原因。
參見圖2,介紹本發(fā)明對時延、丟包進行綜合測量及關聯(lián)分析的系統(tǒng),它是由分別位于被測網(wǎng)絡路徑兩端的測量裝置和反饋裝置所組成;其中測量裝置的組成部件包括收發(fā)單元、分析單元和通信控制單元,反饋裝置的組成部件至少包括反饋單元和通信控制單元;收發(fā)單元和反饋單元用于實現(xiàn)被測網(wǎng)絡路徑兩端之間測試流的交互,并要在測試過程中對每個分組相應填寫分組序號、發(fā)送時間戳、反饋時間戳、接收時間戳等測試數(shù)據(jù);兩端的通信控制裝置相互連接,用于控制和實現(xiàn)測量數(shù)據(jù)的交互;分析單元藉由其策略分析軟件對同時獲取的時延、丟包兩種測量參數(shù)進行關聯(lián)分析,并向用戶呈現(xiàn)最終測量結果。
參見圖3和圖4,詳細介紹本發(fā)明測量方法。其中圖3是測量裝置的測量操作和反饋裝置在一個測量周期或全部測量過程結束后,發(fā)送數(shù)據(jù)給測量裝置,觸發(fā)啟動分析流程操作的方框圖。圖4是分析單元的操作流程方框圖。
本發(fā)明通過對時延、丟包進行綜合測量及關聯(lián)分析,能夠評估網(wǎng)絡運行的總體情況,準確判斷和區(qū)分造成丟包和擁塞故障的不同原因。該方法主要包括并行或重疊的兩個操作步驟(即在條件允許情形下,測量裝置的收發(fā)單元發(fā)送測試流和接收測試流兩個任務并發(fā)運行,且在接收到反饋裝置于每個測量周期或測量結束后發(fā)送的反饋數(shù)據(jù)時,就觸發(fā)、啟動分析測試流的操作;同時,繼續(xù)執(zhí)行測量測試流的操作,這樣能夠充分發(fā)揮本發(fā)明系統(tǒng)的高準確度優(yōu)勢)(1)測量測試流測量裝置生成測試流,再將其發(fā)送給對端;反饋裝置在接收到的測試流分組中標記接收時間戳后,將該測試流反饋給測量裝置。
(2)分析測試流測量裝置根據(jù)其測試流的發(fā)送和接收信息,以及反饋裝置發(fā)送來的反饋數(shù)據(jù),進行計算處理和綜合分析后,輸出測量結果數(shù)據(jù)。
下面參見圖3,具體介紹本發(fā)明測量方法中的步驟(1)的測量操作內容(11)用戶設置測試流的參數(shù)測試流是在測量過程中收發(fā)單元和反饋單元在被測網(wǎng)絡路徑上交互的一系列測試分組。其中測試分組格式(參見圖5)包括IP/UDP包頭、分組序號PID、發(fā)送標記STAG和可選的反饋標記DTAG。其中PID是在測量過程中唯一標識該分組的序列號,STAG是測量裝置發(fā)送測試分組時嵌入時間戳和其它標記的字段,DTAG是反饋裝置在回應測試分組時嵌入時間戳和其它標記的字段,該三者字長均不大于4字節(jié)。測試流的測試包對PAIR封裝在IP協(xié)議或UDP協(xié)議上傳輸。在反饋裝置放置部分分析功能模塊后,可以省掉DTAG。
測試流的參數(shù)用于定義測試流中所有分組的結構形式,測試流的參數(shù)至少包括每個包對的分組結構(如單個分組、包對、或多個分組的組合),各分組間的時間間隔-測試流的發(fā)送流量模型(采用泊松Poisson或定長分布流量模型等),測試流的長度-測試包對PAIR的數(shù)量;分組格式一般采用緊湊型的短小分組(如<100字節(jié)),流的長度也采用較小值。測試流的參數(shù)設置合理,可以使被測網(wǎng)絡路徑的內部特性得到充分展示。另外,測試分組采用定長字段,以利于提高系統(tǒng)處理效率,分組短小也使附加的網(wǎng)絡負載降到最小,同時可以保證其作為一個完整單元通過整個路徑。圖5所示的分組格式只是本發(fā)明使用的一種分組格式示例。具體實現(xiàn)中,可不局限于該形式。
參見圖6所示的一種測試流格式,該測試流由一系列包對組成,每個包對是連續(xù)發(fā)送的兩個背靠背(發(fā)送時間間隔為0)的分組。如果發(fā)送了N(N>2)個分組,稱為長度為N的測試流。
(12)收發(fā)單元根據(jù)測試流參數(shù)構造測試流收發(fā)單元根據(jù)用戶定義的測試流參數(shù)構造測試包對中的分組和測試流時,可分別參照圖5測試分組格式和圖6的測試流組織形式,包對中各分組的PID字段序列號必須保證測量期間的唯一性,以便在有效測量時間內對接收的分組與發(fā)送的分組進行PID匹配;在分組的STAG字段填充發(fā)送時間戳時,可用系統(tǒng)相對時鐘,但時間精度不低于10ms,以保持測量結果在時延大范圍變動下的一致性。
(13)收發(fā)單元發(fā)送測試流將生成的測試流按照設定的流量模型發(fā)送到被測網(wǎng)絡路徑上,同時至少記錄發(fā)送測試流的下述信息每個分組的發(fā)送時間戳和每個測試流的長度;必要時,記錄所有分組的序列號PID范圍。
(14)反饋單元接收測試流反饋單元實時監(jiān)聽網(wǎng)絡測試流,并接收所有分組,該過程使用無限循環(huán),以后臺任務方式與其他任務并發(fā)運行,使得所有分組的數(shù)據(jù)得到及時處理同時記錄所接收到的分組PID字段和STAG字段數(shù)據(jù)和排序保存之。
(15)反饋單元標記測試流反饋單元在接收到的分組的DTAG字段嵌入反饋時間戳時,可用系統(tǒng)相對時鐘,但時間精度不低于10ms,以保持測量結果在時延大范圍變動下的一致性。
(16)反饋單元反饋測試流反饋單元把嵌入相關標記的測試流及時送到被測網(wǎng)絡返回路徑上,回送給測量裝置。
(17)收發(fā)單元接收測試流。收發(fā)單元監(jiān)聽并接收從反饋裝置回送的測試流,記錄在接收時流中每個分組的信息數(shù)據(jù)。
需要強調的是,在測量過程中無需測量裝置和反饋裝置兩者的時鐘同步,本發(fā)明可以應用背景技術中的文獻所介紹的在單向時延測量中如何消除測量兩端的時鐘不同步所帶來的時鐘頻差和時鐘重置的方法。
參見圖4,具體介紹本發(fā)明測量方法中的步驟(2)的分析操作內容(21)反饋單元收集測試流的反饋數(shù)據(jù),并將該反饋數(shù)據(jù)發(fā)送給測量裝置反饋單元周期性地定時收集反饋數(shù)據(jù),即測試流在反饋裝置的接收信息和反饋信息,必要時可以對其進行壓縮和加密處理;再由通信控制單元以可靠的通信方式確保將反饋數(shù)據(jù)安全發(fā)送給測量裝置。
(22)分析單元收集測試流的各種信息分析單元收集測量裝置的測試流收發(fā)數(shù)據(jù),即其收發(fā)單元在發(fā)送和接收分組序列時所記錄的分組信息,并通過其通信控制單元接收反饋裝置送來的反饋數(shù)據(jù),必要時進行解密和解壓縮處理。
(23)分析單元調用分析策略軟件對測試流的收發(fā)數(shù)據(jù)和反饋數(shù)據(jù)進行關聯(lián)分析;由于關聯(lián)分析的過程是本發(fā)明的一個重要內容,后面對其詳細說明之。
(24)分析單元將最后測量結果直接以數(shù)據(jù)表和/或曲線形式呈現(xiàn)給用戶。
參見圖7,上述步驟(23)中分析單元進行的關聯(lián)分析是本發(fā)明的重要創(chuàng)新,現(xiàn)在具體介紹其操作內容(231)分析單元收到收發(fā)數(shù)據(jù)和反饋數(shù)據(jù)后,對照測試流中的每個分組以分組序號PID為關鍵字,建立測試流數(shù)據(jù)表,其中每條記錄對應一個測試分組。
(232)計算測試流數(shù)據(jù)表中的每個分組的時延、丟包率、連續(xù)丟包率時延的計算方法是先計算分組的雙向時延值RTT=Tr-Ts,式中,Ts為測量裝置發(fā)送該分組的時間,Tr為測量裝置接收到反饋分組的時間;接著,計算測量裝置到反饋裝置的原始單向時延值OWLo=Te-Ts,式中,Te為反饋裝置接收到該分組的時間;再利用前述文獻對OWLo進行時鐘同步校正,獲得修正后的單向時延值OWL;最后計算反饋裝置到測量裝置的單向時延值OWLr=RTT-OWL,因為本發(fā)明關聯(lián)分析是基于修正后的單向時延或RTT進行的;丟包率計算方法是雙向丟包率Ls=1-Cr/Cs,]]>測量裝置到反饋裝置的單向丟包率Le=1-Ce/Cs,]]>反饋裝置到測量裝置的單向丟包率Lr=1-Cr/Ce=1-(1-Ls)/(1-Le),]]>式中,Cs為給定測試流中,測量裝置記錄發(fā)送的分組總數(shù)(即測試流長度),Cr為測量裝置記錄接收到的反饋分組數(shù),Ce為反饋裝置記錄接收到的分組數(shù);連續(xù)丟包計算方法是對給定的測試流,記錄測量裝置發(fā)送的分組PID范圍,并在每次接收到反饋裝置的返回分組后,都將其PID與上一次所接收到的返回分組的PID進行比較,其中兩次收到的PID的最大差值為連續(xù)丟包數(shù)。
(233)評估網(wǎng)絡總體性能將整個測量時間平均分為n個時間段,分別計算每個時間段內的平均雙向時延和雙向丟包率,記為集合{RTTi,LOSSi},式中,時間段的序列號i取值范圍是0<i<n,n為自然數(shù),時間段長度酌情選??;再分別以時延T和丟包率L為橫軸和縱軸構建兩維坐標系,并以各軸上的兩個低、高門限T1、T2和L1、L2將該兩維坐標平面劃分為若干區(qū)域(參見圖8),根據(jù)集合{RTTi,LOSSi}在該坐標系中的區(qū)域位置,以統(tǒng)計方式展示測試流的時延、丟包特性,實現(xiàn)網(wǎng)絡的總體性能評估;其中,時延T1的選擇取決于被測網(wǎng)絡路徑情況位于接入網(wǎng)或同一局域網(wǎng)內,為2-10ms;位于城域網(wǎng)范圍內,則為20~50ms;位于廣域網(wǎng)范圍,則為100~500ms;構成跨洋路徑時,則為600~1200ms;T2選為2~8倍的T1;丟包率L1選為1%~5%,L2選為10%~30%;當統(tǒng)計點集中在同時滿足時延<T1和丟包率<L1的A1區(qū)域時,說明此時網(wǎng)絡處于性能良好的輕載狀態(tài),適合承載對時延和丟包率要求均較高的業(yè)務,比如高質量話音。
當統(tǒng)計點集中于同時滿足T1<時延<T2和丟包率<L1的B1區(qū)域時,網(wǎng)絡丟包率較低、但是時延偏高,說明此時路徑中路由器的緩沖區(qū)長度配置較高,適合部署對丟包率要求高但是對時延要求不甚敏感的業(yè)務,比如視頻業(yè)務。
當統(tǒng)計點集中于同時滿足T1<時延<T2和L1<丟包率<L2的C1區(qū)域時,說明網(wǎng)絡路徑已經(jīng)擁塞嚴重,需要進行網(wǎng)絡路徑擴容;當測量點落在同時滿足時延>T2和丟包率>L2的E1區(qū)域時,即時延和丟包率都較大,其原因通常是路由抖動;此時,由于路由器的路由不一致,出現(xiàn)分組“路由打圈”現(xiàn)象,大部分分組因IP協(xié)議分組頭的生存時間TTL變?yōu)?而被路由器丟棄,少部分分組即使最終到達目的地,時延也超常了。
當統(tǒng)計點集中在同時滿足時延<T1和L1<丟包率<L2的D1區(qū)域時,此時的時延較低、但丟包率偏高,可懷疑是線路誤碼丟包或該網(wǎng)絡路徑上路由器的緩沖區(qū)配置過小;為準確區(qū)分兩種原因,繼續(xù)進行后續(xù)的丟包原因的關聯(lián)分析。
(234)對于圖8中出現(xiàn)的大量統(tǒng)計點集中在時延較低、但丟包率偏高的D1區(qū)域時,要考察其丟包的原因區(qū)分線路誤碼丟包或擁塞丟包。將整個測量期間發(fā)生的所有丟包記為LOSSPACKETAD,先計算LOSSPACKETAD中每個丟包的時延,具體方法如下如果是單個丟包,則以包對LOSS PAIR中另一個成功到達的分組時延作為被丟棄分組的時延值;如果是連續(xù)多個丟包,則以最接近連續(xù)丟包的序列號之前、后的兩個分組的時延的平均值作為該連續(xù)丟包分組的時延值;例如PID為i,...,j的分組被丟失,則以PID為i-1和j+1兩個分組的時延的平均值作為該連續(xù)丟包分組的時延;分別以近似的丟包的時延T和連續(xù)丟包數(shù)為橫軸和縱軸構建兩維坐標系,并以橫軸上的門限T1和縱軸上的丟包個數(shù)將該兩維坐標平面劃分為若干區(qū)域,并利用LOSSPAIRAD的樣點來繪制連續(xù)丟包數(shù)、時延的聯(lián)合概率分布圖(參見圖9),最后,依據(jù)樣點分布概率所在區(qū)域來判斷線路誤碼丟包或擁塞丟包A2區(qū)對應著時延小且為單個丟包的情況。若在該區(qū)出現(xiàn)的高概率丟包指示線路誤碼原因引起丟包。
當樣點集中分布在同時時延小和單個丟包的A2區(qū)域時,說明是線路誤碼原因引起丟包,因為網(wǎng)絡負載很小(表現(xiàn)為時延低)時,仍然存在著丟包現(xiàn)象,說明不是由于網(wǎng)絡擁塞形成的緩沖區(qū)溢出丟包而是線路丟包。這種情況一般出現(xiàn)在線路誤碼率較高導致誤碼丟包的網(wǎng)絡中,比如ADSL接入但線路老化、PSTN撥號接入、WLAN/GPRS/CDMA等無線接入方式。
當樣點集中分布在小時延和連續(xù)丟包的B2區(qū)域時,說明該路徑上的路由器緩沖區(qū)長度配置太小,當網(wǎng)絡流量有突發(fā)時,將導致嚴重的連續(xù)丟包。
當樣點集中分布在同時滿足時延大和連續(xù)丟包數(shù)大的C2區(qū)域時,說明是線路擁塞引起的丟包。
(235)對于擁塞引起的丟包,繼續(xù)關聯(lián)分析區(qū)別用戶網(wǎng)絡的上下行擁塞情況參見圖10,先分別以上行時延和下行時延為橫軸和縱軸構建兩維坐標系,并以兩軸上的時延門限T將該兩維坐標平面劃分為四個區(qū)域上下行空閑的A區(qū),上行空閑、下行繁忙的B區(qū),上下行都繁忙的C區(qū),上行繁忙、下行空閑的D區(qū);再將每個測量時間段的上下行平均時延值的集合記為{UDi,DDi},式中,時間段的序列號i取值范圍是0<i<n,n為自然數(shù);如果大部分統(tǒng)計A2集中在A區(qū),表示上下行時延均較小,網(wǎng)絡較為空閑;如果大部分統(tǒng)計點集中在B區(qū),表示上行空閑,下行繁忙,則通常為普通互聯(lián)網(wǎng)用戶訪問網(wǎng)絡的情況,原因是大部分數(shù)據(jù)都將從互聯(lián)網(wǎng)數(shù)據(jù)中心IDC(Internet Data Center)下載到客戶端;如果大部分統(tǒng)計點集中在C區(qū),表示上下行均繁忙,則通常是點對點P2P應用運行的時延特性,因為許多P2P應用在下載時也為其他客戶端提供上傳服務,這將導致網(wǎng)絡在兩個方向上均呈現(xiàn)擁塞的情況;D區(qū)表示上行繁忙而下行空閑,這多為客戶網(wǎng)絡中對外提供了服務的服務器,這些服務器大量對外提供內容傳遞服務將導致上行帶寬擁塞。
如果大部分統(tǒng)計點集中在D區(qū),表示上行繁忙而下行空閑,通常為客戶網(wǎng)絡中設有WEB、FTP等對外提供服務的服務器,由于這些服務器對外提供內容傳遞服務而導致上行帶寬擁塞。
通過上述對上下行時延的關聯(lián)分析,可以很好地區(qū)分客戶網(wǎng)絡擁塞的原因,為網(wǎng)絡運維人員提供快速簡捷的擁塞問題分析手段。
該方法可廣泛適用于各種無線網(wǎng)絡(包括蜂窩狀數(shù)字式分組數(shù)據(jù)交換網(wǎng)絡CDPD、通用無線分組業(yè)務GPRS、碼分多址CDMA、3G等),固定分組網(wǎng)絡(包括撥號、非對稱數(shù)字用戶線路ADSL、Ethernet接入、光接入等)和計算機網(wǎng)絡的性能測試,也適用于網(wǎng)絡電話VOIP、網(wǎng)絡電視IPTV等實時業(yè)務的網(wǎng)絡性能評估。
參見圖11,介紹本發(fā)明在IP網(wǎng)進行服務質量測試的試驗實施例使用一對測量裝置和反饋裝置協(xié)作完成對用戶終端與媒體服務器之間的網(wǎng)絡路徑性能的測量。在圖示架構的部署下,終端用戶對網(wǎng)絡性能的質疑能夠通過本發(fā)明的綜合測量及關聯(lián)分析的系統(tǒng)和方法,發(fā)現(xiàn)網(wǎng)絡中存在的性能瓶頸及潛在的性能下降的因素。再通過網(wǎng)絡內部的重新配置或更換路由,使該終端用戶的合理服務質量要求得到滿足。本發(fā)明能夠同時對多條路徑進行的綜合測量將對整個網(wǎng)絡服務的性能有全局的認識,便于網(wǎng)絡的規(guī)劃和重新部署以及擴容問題等。因此,試驗是成功的,實現(xiàn)了發(fā)明目的。
權利要求
1.一種對時延、丟包進行綜合測量及關聯(lián)分析的系統(tǒng),由分別位于被測網(wǎng)絡路徑兩端的測量裝置和反饋裝置所組成;其特征在于所述測量裝置的組成部件包括收發(fā)單元、分析單元和通信控制單元,反饋裝置的組成部件至少包括反饋單元和通信控制單元;其中收發(fā)單元和反饋單元用于實現(xiàn)被測網(wǎng)絡路徑兩端之間測試流的交互,并在測試過程中對每個分組填寫相應的測試數(shù)據(jù);兩端的通信控制單元相互連接,用于控制、實現(xiàn)測試數(shù)據(jù)的交互;分析單元藉由其分析策略軟件對同時獲取的時延、丟包兩種測量參數(shù)進行關聯(lián)分析,并向用戶呈現(xiàn)最終分析結果。
2.根據(jù)權利要求1所述的綜合測量及關聯(lián)分析的系統(tǒng),其特征在于所述收發(fā)單元和反饋單元在測試過程中對每個測試分組添加的測試數(shù)據(jù)至少包括分組序號、發(fā)送時間戳、反饋時間戳、接收時間戳。
3.一種根據(jù)權利要求1所述的對時延、丟包進行綜合測量及關聯(lián)分析的系統(tǒng)進行綜合測量和關聯(lián)分析的方法,其特征在于發(fā)送一串由測試包對PAIR構成的測試流,其中每個測試包對是背靠背一發(fā)送間隔時間為0-的兩個分組,且每個分組長度很小,該兩個分組在網(wǎng)絡中的傳輸性能被視為相等;測試流中的包對丟失其中一個分組后,采用另一個分組來代表被丟棄分組的時延,藉此同時測量該測試流的時延和丟包狀況,并進行關聯(lián)分析,評估網(wǎng)絡運行的總體情況,準確判斷和區(qū)分造成丟包和擁塞故障的不同原因,提高運維效率。
4.根據(jù)權利要求3所述的進行綜合測量及關聯(lián)分析的方法,其特征在于所述測試流中的分組格式包括包頭、分組序號PID、發(fā)送標記STAG和可選的反饋標記DTAG,其中PID是在測量過程中唯一標識該分組的序列號,STAG是測量裝置發(fā)送測試分組時嵌入時間戳和其它標記的字段,DTAG是反饋裝置在回應測試分組時嵌入時間戳和其它標記的字段,該三者字長均不大于4字節(jié)。
5.根據(jù)權利要求4所述的進行綜合測量及關聯(lián)分析的方法,其特征在于所述測試流的測試包對PAIR采用IP協(xié)議或UDP協(xié)議進行封裝。
6.根據(jù)權利要求3所述的進行綜合測量及關聯(lián)分析的方法,其特征在于所述方法包括下列步驟(1)測量測試流測量裝置生成測試流,再將其發(fā)送給對端;反饋裝置在接收到的測試流分組中標記接收時間戳后,將該測試流反饋給測量裝置;(2)分析測試流測量裝置根據(jù)其測試流的發(fā)送和接收信息,以及反饋裝置發(fā)送來的反饋數(shù)據(jù),進行計算處理和綜合分析后,輸出測量結果數(shù)據(jù)。
7.根據(jù)權利要求3所述的進行綜合測量及關聯(lián)分析的方法,其特征在于所述兩個步驟之間的時序是并行或重疊的測量裝置在接收到反饋裝置于每個測量周期或測量結束后發(fā)送的反饋數(shù)據(jù)時,就觸發(fā)、啟動分析測試流的操作;同時,繼續(xù)執(zhí)行測量測試流的操作。
8.根據(jù)權利要求3所述的進行綜合測量及關聯(lián)分析的方法,其特征在于所述步驟(1)進一步包括下列操作內容(11)用戶設置測試流的參數(shù)測試流的參數(shù)至少包括每個包對的分組結構,各分組間的時間間隔-測試流的發(fā)送流量模型,測試流的長度-測試包對PAIR的數(shù)量;(12)收發(fā)單元根據(jù)測試流參數(shù)構造測試流構造測試包對中的分組時,各分組的PID字段序列號保證唯一,以便在測量時間內對接收的分組與發(fā)送的分組進行PID匹配;在分組的STAG字段填充發(fā)送時間戳時,可用系統(tǒng)相對時鐘,但時間精度不低于10ms,以保持測量結果在時延大范圍變動下的一致性;(13)收發(fā)單元發(fā)送測試流將生成的測試流按照設定的流量模型發(fā)送到被測網(wǎng)絡路徑上,同時至少記錄發(fā)送測試流的下述信息每個分組的發(fā)送時間戳和每個測試流的長度;必要時,記錄所有分組的序列號PID范圍;(14)反饋單元接收測試流反饋單元使用無限循環(huán)的、與其他任務并發(fā)運行的后臺任務方式實時監(jiān)聽網(wǎng)絡測試流,并接收所有分組和進行及時處理記錄所接收到的分組PID字段和STAG字段數(shù)據(jù),并排序保存之;(15)反饋單元標記測試流反饋單元在接收到的分組的DTAG字段嵌入反饋時間戳時,可用系統(tǒng)相對時鐘,但時間精度不低于10ms,以保持測量結果在時延大范圍變動下的一致性;(16)反饋單元反饋測試流反饋單元把嵌入相關標記的測試流及時送到被測網(wǎng)絡返回路徑上,回送給測量裝置;(17)收發(fā)單元接收測試流。收發(fā)單元監(jiān)聽并接收從反饋裝置回送的測試流,記錄在接收時流中每個分組的信息數(shù)據(jù)。
9.根據(jù)權利要求3所述的進行綜合測量及關聯(lián)分析的方法,其特征在于所述步驟(2)進一步包括下列操作內容(21)反饋單元收集測試流的反饋數(shù)據(jù),并將該反饋數(shù)據(jù)發(fā)送給測量裝置反饋單元周期性地收集反饋數(shù)據(jù),即測試流在反饋裝置的接收信息和反饋信息,再由通信控制單元以可靠的通信方式將反饋數(shù)據(jù)發(fā)送給測量裝置;(22)分析單元收集測試流的各種信息分析單元收集測量裝置的測試流收發(fā)數(shù)據(jù),即其收發(fā)單元在發(fā)送和接收分組序列時所記錄的分組信息,并通過通信控制單元接收反饋裝置發(fā)送來的反饋數(shù)據(jù);(23)分析單元調用分析策略軟件對測試流的收發(fā)數(shù)據(jù)和反饋數(shù)據(jù)進行關聯(lián)分析;(24)分析單元將最后測量結果直接以數(shù)據(jù)表和/或曲線形式呈現(xiàn)給用戶。
10.根據(jù)權利要求9所述的進行綜合測量及關聯(lián)分析的方法,其特征在于所述步驟(23)進一步包括下列操作內容(231)分析單元收到收發(fā)數(shù)據(jù)和反饋數(shù)據(jù)后,以測試流中的分組序號PID為關鍵字,建立測試流數(shù)據(jù)表,其中每條記錄對應一個測試分組;(232)計算測試流數(shù)據(jù)表中的每個分組的時延、丟包率、連續(xù)丟包數(shù)時延的計算方法是先計算分組的雙向時延值RTT=Tr-Ts,式中,Ts為測量裝置發(fā)送該分組的時間,Tr為測量裝置接收到反饋分組的時間;接著,計算測量裝置到反饋裝置的原始單向時延值OWLo=Te-Ts,式中,Te為反饋裝置接收到該分組的時間;再對OWLo進行時鐘同步校正,獲得修正后的單向時延值OWL;最后計算反饋裝置到測量裝置的單向時延值OWLr=RTT-OWL;丟包率計算方法是雙向丟包率Ls=1-Cr/Cs,]]>測量裝置到反饋裝置的單向丟包率Le=1-Ce/Cs,]]>反饋裝置到測量裝置的單向丟包率Lr=1-Cr/Ce=1-(1-Ls)/(1-Le),]]>式中,Cs為給定測試流中,測量裝置記錄發(fā)送的分組總數(shù)-測試流長度,Cr為測量裝置記錄接收到的反饋分組數(shù),Ce為反饋裝置記錄接收到的分組數(shù);連續(xù)丟包數(shù)計算方法是對給定的測試流,記錄測量裝置發(fā)送的分組PID范圍,并在每次接收到反饋裝置的返回分組后,都將其PID與上一次所接收到的返回分組的PID進行比較,其中兩次收到的PID的最大差值為連續(xù)丟包數(shù);(233)評估網(wǎng)絡總體性能將整個測量時間均分為n個時間段,分別計算每個時間段內的平均雙向時延和雙向丟包率,記為集合{RTTi,LOSSi},式中,時間段的序列號i的取值范圍是0<i<n,n為自然數(shù),時間段長度酌情選取;再分別以時延T和丟包率L為橫軸和縱軸構建兩維坐標系,并以各軸上的兩個低、高門限T1、T2和L1、L2將該兩維坐標平面劃分為若干區(qū)域,根據(jù)集合{RTTi,LOSSi}在該坐標系中的區(qū)域位置,以統(tǒng)計方式展示測試流的時延、丟包特性,實現(xiàn)網(wǎng)絡的總體性能評估;其中,時延T1數(shù)值的選擇取決于被測網(wǎng)絡路徑位于接入網(wǎng)或同一局域網(wǎng)內,為2-10ms;位于城域網(wǎng)范圍內,則為20~50ms;位于廣域網(wǎng)范圍,則為100~500ms;構成跨洋路徑時,則為600~1200ms;T2選為2~8倍的T1;丟包率L1選為1%~5%,L2選為10%~30%;當統(tǒng)計點集中分布在同時滿足時延<T1和丟包率<L1的區(qū)域時,說明此時網(wǎng)絡處于性能良好的輕載狀態(tài),適合承載對時延和丟包率要求均較高的業(yè)務;當統(tǒng)計點集中分布于同時滿足T1<時延<T2和丟包率<L1的區(qū)域時,網(wǎng)絡丟包率較低、但是時延偏高,說明此時路徑中路由器的緩沖區(qū)長度配置較高,適合部署對丟包率要求高但是對時延要求不甚敏感的業(yè)務,比如視頻業(yè)務。當統(tǒng)計點集中分布于同時滿足T1<時延<T2和L1<丟包率<L2的區(qū)域時,說明網(wǎng)絡路徑已經(jīng)擁塞嚴重,需要進行網(wǎng)絡路徑擴容;當統(tǒng)計點落在同時滿足時延>T2和丟包率>L2的區(qū)域時,即時延和丟包率都較大,其原因通常是路由抖動;此時,由于路由器的路由不一致,出現(xiàn)分組“路由打圈”現(xiàn)象,大部分分組因IP協(xié)議分組頭的生存時間TTL變?yōu)?而被路由器丟棄,少部分分組即使最終到達目的地,時延也超常;當統(tǒng)計點集中分布在同時滿足時延<T1和L1<丟包率<L2的區(qū)域時,時延較低、但丟包率偏高,此時可懷疑是線路誤碼丟包或該網(wǎng)絡路徑上路由器的緩沖區(qū)配置過?。粸闇蚀_區(qū)分兩種原因,繼續(xù)進行后續(xù)的丟包原因的關聯(lián)分析;(234)對于時延較低、但丟包率偏高的情況,分析區(qū)分線路誤碼丟包或擁塞丟包將整個測量期間發(fā)生的所有丟包記為LOSSPACKETAD,先計算LOSSPACKETAD中每個丟包的時延,如果是單個丟包,則以包對中另一個成功到達的分組時延作為其時延值;如果是連續(xù)丟包,則以最接近連續(xù)丟包的序列號之前、后的兩個分組的時延的平均值作為該連續(xù)丟包分組的時延值;分別以時延T和丟包數(shù)為橫軸和縱軸構建兩維坐標系,并以橫軸上的門限T1和縱軸上的丟包個數(shù)將該兩維坐標平面劃分為若干區(qū)域,并利用LOSSPAIRAD的樣點來繪制連續(xù)丟包數(shù)、時延的聯(lián)合概率分布圖,最后,依據(jù)樣點分布概率所在區(qū)域來判斷線路誤碼丟包或擁塞丟包當樣點集中分布在同時滿足時延<T1和連續(xù)丟包數(shù)=1的區(qū)域時,說明時延小且為單個丟包,則是線路誤碼原因引起丟包;當樣點集中分布在同時滿足時延<T1和連續(xù)丟包數(shù)>1的區(qū)域時,說明時延小和連續(xù)丟包,則是該路徑上的路由器緩沖區(qū)長度配置太小,當網(wǎng)絡流量有突發(fā)時,將導致嚴重的連續(xù)丟包;當樣點集中分布在同時滿足時延>T1和連續(xù)丟包數(shù)>1的區(qū)域時,說明時延大和丟包連續(xù)數(shù)大,則是線路擁塞引起的丟包;(235)對于擁塞引起的丟包,繼續(xù)關聯(lián)分析區(qū)別用戶網(wǎng)絡的上下行擁塞情況先分別以上行時延和下行時延為橫軸和縱軸構建兩維坐標系,并以兩軸上的時延門限T將該兩維坐標平面劃分為四個區(qū)域上下行空閑的A區(qū),上行空閑、下行繁忙的B區(qū),上下行都繁忙的C區(qū),上行繁忙、下行空閑的D區(qū);再將每個測量時間段的上下行平均時延值的集合記為{UDi,DDi},式中,時間段的序列號i的取值范圍是0<i<n,n為自然數(shù);如果大部分統(tǒng)計點集中在A區(qū),表示上下行時延均較小,網(wǎng)絡較為空閑;如果大部分統(tǒng)計點集中在B區(qū),表示上行空閑,下行繁忙,則通常為普通互聯(lián)網(wǎng)用戶訪問網(wǎng)絡的情況;如果大部分統(tǒng)計點集中在C區(qū),表示上下行均繁忙,則通常是點對點應用運行的時延特性;如果大部分統(tǒng)計點集中在D區(qū),表示上行繁忙而下行空閑,通常為客戶網(wǎng)絡中設有對外提供服務的服務器,由該服務器對外提供內容傳遞服務而導致上行帶寬擁塞。
11.根據(jù)權利要求3所述的進行綜合測量及關聯(lián)分析的方法,其特征在于所述方法適用于固定分組網(wǎng)絡、無線數(shù)據(jù)網(wǎng)絡和計算機網(wǎng)絡的性能測試,也適用于包括但不限于網(wǎng)絡電話VOIP、網(wǎng)絡電視IPTV實時業(yè)務的網(wǎng)絡性能評估。
全文摘要
一種對時延、丟包進行綜合測量及關聯(lián)分析的系統(tǒng)和方法,系統(tǒng)由位于被測網(wǎng)絡路徑兩端的測量裝置(包括收發(fā)單元、分析單元和通信控制單元)和反饋裝置(包括反饋單元和通信控制單元)組成,收發(fā)單元和反饋單元實現(xiàn)被測網(wǎng)絡路徑兩端間測試流的交互,并在測試過程中對每個分組填寫測試數(shù)據(jù);兩端通信控制單元相互連接,控制、實現(xiàn)測試數(shù)據(jù)的交互。測試流為一串測試包對,每個包對是背靠背、長度很小的兩個分組,在丟失一個分組后,用另一分組來代表被丟棄分組的時延,藉此同時測量測試流的時延和丟包,由分析單元對同時獲取的這兩種測量數(shù)據(jù)進行關聯(lián)分析,評估網(wǎng)絡運行的總體情況,準確判斷和區(qū)分造成丟包和擁塞故障的不同原因,并呈現(xiàn)最終分析結果。
文檔編號H04L12/26GK1777126SQ20051013014
公開日2006年5月24日 申請日期2005年12月12日 優(yōu)先權日2005年12月12日
發(fā)明者林宇 申請人:史文勇