專利名稱:一種VoIP網(wǎng)絡(luò)數(shù)據(jù)流的通用識別方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計(jì)算機(jī)網(wǎng)絡(luò)領(lǐng)域,特別是涉及計(jì)算機(jī)網(wǎng)絡(luò)中未知流媒體協(xié)議的VoIP 數(shù)據(jù)流的識別技術(shù)。
背景技術(shù):
網(wǎng)絡(luò)數(shù)據(jù)流識別是網(wǎng)絡(luò)測量的主要手段。隨著網(wǎng)絡(luò)流媒體技術(shù)發(fā)展,IP電話日益普及,互聯(lián)網(wǎng)中出現(xiàn)大量攜帶語音數(shù)據(jù)的IP數(shù)據(jù)包(VoIP數(shù)據(jù)包),這些數(shù)據(jù)包統(tǒng)稱為 VoIP數(shù)據(jù)流。出于網(wǎng)絡(luò)管理需要,對這部分?jǐn)?shù)據(jù)包進(jìn)行流量分析和處理。VoIP (Voice over Internet Protocol)以 IP 為網(wǎng)絡(luò)層協(xié)議,利用 Internet 為傳輸載體實(shí)現(xiàn)語音信號傳送,已形成一種新型電信業(yè)務(wù)。它實(shí)現(xiàn)了 PC對PC、PC對電話、電話對電話的連接。VoIP基本原理是對語音數(shù)據(jù)進(jìn)行壓縮編碼處理,然后把這些語音數(shù)據(jù)按IP 等相關(guān)協(xié)議進(jìn)行打包,由IP網(wǎng)絡(luò)負(fù)責(zé)把數(shù)據(jù)包傳輸?shù)浇邮盏?,再?jīng)過解碼解壓處理后,恢復(fù)成原來的語音信號,達(dá)到由IP網(wǎng)絡(luò)傳送語音的目的?,F(xiàn)有VoIP網(wǎng)絡(luò)數(shù)據(jù)流識別方法,從技術(shù)手段上可以劃分為3類,第1類為傳輸層端口分析法,通過觀察IP數(shù)據(jù)包中應(yīng)用層協(xié)議端口號來識別流量類型,這種方法簡單,開銷很小,易實(shí)現(xiàn),最大的缺點(diǎn)是不準(zhǔn)確;第2類是特征流量識別法,根據(jù)不同應(yīng)用表現(xiàn)出不同特征來識別數(shù)據(jù)包所對應(yīng)的業(yè)務(wù),存在的問題是擴(kuò)展性差,它需要通過大量的事前分析來確定排它的特征;第3類是協(xié)議流程分析法,依據(jù)構(gòu)成一次應(yīng)用中多個(gè)會(huì)話之間的聯(lián)系, 從控制會(huì)話中提取動(dòng)態(tài)會(huì)話信息,依據(jù)這些信息來識別該應(yīng)用涉及的動(dòng)態(tài)會(huì)話,此方法對流媒體協(xié)議識別困難,不能識別協(xié)議關(guān)鍵字。本發(fā)明依據(jù)VoIP多媒體數(shù)據(jù)在網(wǎng)絡(luò)傳輸過程中的碼流大小和VoIP應(yīng)用的實(shí)時(shí)性和均勻性特征,采用統(tǒng)計(jì)的方法,能夠在不分析封裝格式、不檢測應(yīng)用層流媒體協(xié)議的情況下,實(shí)現(xiàn)對VoIP數(shù)據(jù)流的識別。
發(fā)明內(nèi)容
本發(fā)明的目的是為了解決現(xiàn)有VoIP網(wǎng)絡(luò)數(shù)據(jù)流識別方法的準(zhǔn)確度低、效率不高和流媒體私有協(xié)議識別困難等問題,提供一種VoIP網(wǎng)絡(luò)數(shù)據(jù)流通用識別方法,可直接應(yīng)用于VoIP網(wǎng)絡(luò)管理,提高VoIP網(wǎng)絡(luò)QoS要求。VoIP應(yīng)用與網(wǎng)絡(luò)中其它應(yīng)用業(yè)務(wù)相比,具有兩個(gè)突出特點(diǎn),一是實(shí)時(shí)性,在通話過程中,發(fā)送方必須不停地向接收方發(fā)送數(shù)據(jù)包,以保證語音信號不會(huì)中斷;二是均勻性,在通話過程中,發(fā)送方向接收方發(fā)出的語音數(shù)據(jù)是基本均勻分布的,即語音數(shù)據(jù)在壓縮后的封裝大小、頻率是基本均勻的。VoIP應(yīng)用特點(diǎn)使得在網(wǎng)絡(luò)中傳輸?shù)腣oIP數(shù)據(jù)流表現(xiàn)出相應(yīng)特征,一是持續(xù)勻速性,即發(fā)送方向接收方發(fā)送數(shù)據(jù)包時(shí),持續(xù)不斷發(fā)送,而且單位時(shí)間內(nèi)發(fā)送方發(fā)送的數(shù)據(jù)包數(shù)量相對穩(wěn)定,不會(huì)出現(xiàn)較大波動(dòng)。這一特征為識別VoIP流提供了一個(gè)有力依據(jù)。二是長度固定性,即數(shù)據(jù)包中的有效載荷長度基本固定,不論發(fā)送方采取的是何種協(xié)議類型,對于同一次會(huì)話的數(shù)據(jù)包,采取的報(bào)文封裝方法、封裝大小是基本一致的,即報(bào)文中攜帶的有效載荷長度基本一致。對截取到的數(shù)據(jù)包進(jìn)行分析,將IP包長度減去IP首部長度和UDP首部長度,得出報(bào)文的有效載荷長度。通過對網(wǎng)絡(luò)數(shù)據(jù)流這兩個(gè)特征進(jìn)行識別,從網(wǎng)絡(luò)流中有效地區(qū)分出VoIP數(shù)據(jù)流。本發(fā)明所涉及的VoIP數(shù)據(jù)流通用識別方法,很好的解決了 VoIP數(shù)據(jù)流識別準(zhǔn)確度低、效率不高和流媒體私有協(xié)議識別困難等問題,極大提高對VoIP數(shù)據(jù)流識別的準(zhǔn)確性、可靠性和有效性。
具體實(shí)施例方式本發(fā)明通過對監(jiān)控范圍的UDP數(shù)據(jù)包進(jìn)行統(tǒng)計(jì)分析,得出以上兩個(gè)特征的流量表現(xiàn)分值和總表現(xiàn)分值,判斷該流量是否屬于VoIP流量,具體步驟如下1)捕獲網(wǎng)絡(luò)流量,對其中的UDP數(shù)據(jù)包進(jìn)行分析。對收到的UDP數(shù)據(jù)包進(jìn)行統(tǒng)計(jì),統(tǒng)計(jì)在監(jiān)控時(shí)間段內(nèi)具有相同IP源地址、IP目的地址、源端口、目的端口的數(shù)據(jù)包,分析它們是否有大致相同的發(fā)送頻率,將符合這些條件的數(shù)據(jù)流列入待考察流量。2)對已在待考察范圍的網(wǎng)絡(luò)流進(jìn)行跟蹤。對捕獲到的數(shù)據(jù)包以網(wǎng)絡(luò)流為單位進(jìn)行跟蹤和分析。網(wǎng)絡(luò)流定義為在同一組特定源地址和目標(biāo)地址、源端口和目的端口之間傳輸?shù)挠泄潭▍f(xié)議類型的數(shù)據(jù)包的集合。該步驟對每個(gè)UDP數(shù)據(jù)包進(jìn)行分析,獲取其如下信息源IP地址、目的IP地址、源端口、目的端口,以及IP報(bào)文總長度、IP首部長度、UDP首部長度和接收到報(bào)文的時(shí)間。將所有源IP 地址、目的IP地址、源端口、目的端口都相同的UDP數(shù)據(jù)包看做同一個(gè)網(wǎng)絡(luò)流進(jìn)行處理。如果2個(gè)UDP數(shù)據(jù)包具有相同的源IP地址、目的IP地址、源端口、目的端口,則該2個(gè)數(shù)據(jù)包屬于同一網(wǎng)絡(luò)流。將網(wǎng)絡(luò)流定義為FLOW,將網(wǎng)絡(luò)流中的數(shù)據(jù)包個(gè)數(shù)定義為N。將網(wǎng)絡(luò)流中的各個(gè)數(shù)據(jù)包按照捕獲的先后順序依次定義為PI、P2、. . . PN,將這N個(gè)數(shù)據(jù)包的捕獲時(shí)刻 (時(shí)間戳)依次定義為TS1、TS2、· · · TSN,將這N個(gè)數(shù)據(jù)包的長度分別定義為L1、L2、· · · LN03)對每個(gè)網(wǎng)絡(luò)流的數(shù)據(jù)包進(jìn)行分析,得出各特征表現(xiàn)分值。為每個(gè)網(wǎng)絡(luò)流定義2個(gè)特征參數(shù)參數(shù)1為流的勻速性特征參數(shù)SPEED,參數(shù)2為有效載荷長度固定性特征參數(shù)PAYLEN。各個(gè)特征的分析方法和計(jì)算公式如下a.流的勻速性特征參數(shù)SPEED對于一個(gè)網(wǎng)絡(luò)流FLOW,其包括N個(gè)數(shù)據(jù)包,按捕獲的先后順序依次為P1、 P2、· · · PN。定義任意兩個(gè)數(shù)據(jù)包Pi和Pi+Ι之間的時(shí)間間隔為Di = TSi+1-TSi,則數(shù)據(jù)包 PI、P2、. . . PN之間的時(shí)間間隔可分別定義為Dl、D2、. . . DN0將Dl、D2、. . . DN的平均值定義為Davg,以毫秒(ms)為計(jì)量單位。定義振動(dòng)區(qū)間RANGE = {Dmin, Dmax},其中Dmin = DavgxO. 8-30ms,Dmax = Davgxl. 2+30ms,則對 D1、D2、. . . DN 依次進(jìn)行檢查,如果 Dmin < Di < Dmax,則Di在振動(dòng)區(qū)間RANGE內(nèi)。將D1、D2、. . . DN中所有在RANGE內(nèi)的Di進(jìn)行統(tǒng)計(jì)計(jì)數(shù),可獲得計(jì)數(shù)值M(即在D1、D2、. . . DN中存在M個(gè)成員,這M個(gè)成員均在振動(dòng)區(qū)間RANGE 內(nèi))。則SPEED參數(shù)的計(jì)算方法為
權(quán)利要求
1. 一種VoIP網(wǎng)絡(luò)數(shù)據(jù)流通用識別方法,其重要特征是本識別方法能夠在不分析封裝格式、不檢測應(yīng)用層流媒體協(xié)議的情況下,實(shí)現(xiàn)對VoIP數(shù)據(jù)流的準(zhǔn)確識別,克服了現(xiàn)有 VoIP網(wǎng)絡(luò)數(shù)據(jù)流識別方法對流媒體協(xié)議的識別困難,甚至失效的不足之處;其基本工作流程是捕獲網(wǎng)絡(luò)流量,對其中的UDP數(shù)據(jù)包進(jìn)行分析,如果UDP數(shù)據(jù)在考察范圍內(nèi),就對數(shù)據(jù)流進(jìn)行跟蹤分析,統(tǒng)計(jì)出特征表現(xiàn)分值,將統(tǒng)計(jì)出的特征值用于VoIP會(huì)話判定,確定其是否屬于VoIP數(shù)據(jù)流;其基本思想是依據(jù)VoIP應(yīng)用本身所具有的兩個(gè)突出特點(diǎn),一是實(shí)時(shí)性,在通話過程中,發(fā)送方必須不停地向接收方發(fā)送數(shù)據(jù)包,以保證語音信號不會(huì)中斷,二是均勻性,在通話過程中,發(fā)送方向接收方發(fā)出的語音數(shù)據(jù)是基本均勻分布的,即語音數(shù)據(jù)在壓縮后的封裝大小、頻率是基本均勻的,這兩大特征使得在網(wǎng)絡(luò)中傳輸?shù)腣oIP數(shù)據(jù)流表現(xiàn)出相應(yīng)特征,一是持續(xù)勻速性,即發(fā)送方向接收方發(fā)送數(shù)據(jù)包時(shí),持續(xù)不斷發(fā)送,而且單位時(shí)間內(nèi)發(fā)送方發(fā)送的數(shù)據(jù)包數(shù)量相對穩(wěn)定,不會(huì)出現(xiàn)較大波動(dòng),二是長度固定性,即數(shù)據(jù)包中的有效載荷長度基本固定,不論發(fā)送方采取的是何種協(xié)議類型,對于同一次會(huì)話的數(shù)據(jù)包,采取的報(bào)文封裝方法、封裝大小是基本一致的,相應(yīng)報(bào)文中攜帶的有效載荷長度基本一致,采用流量特征統(tǒng)計(jì)方法,正確識別出VoIP數(shù)據(jù)流;本識別方法不僅適用于對已知協(xié)議的VoIP數(shù)據(jù)流的識別,同時(shí),還適用于對未知協(xié)議的VoIP數(shù)據(jù)流的識別。
全文摘要
本發(fā)明公開了一種VoIP網(wǎng)絡(luò)數(shù)據(jù)流的通用識別技術(shù),屬于計(jì)算機(jī)網(wǎng)絡(luò)管理領(lǐng)域,特別是涉及對未知流媒體協(xié)議的VoIP數(shù)據(jù)流的識別技術(shù)。主要內(nèi)容包括捕獲網(wǎng)絡(luò)流量,對其中的UDP數(shù)據(jù)包進(jìn)行分析,如果UDP數(shù)據(jù)在考察范圍內(nèi),就對數(shù)據(jù)流進(jìn)行跟蹤分析,統(tǒng)計(jì)出特征表現(xiàn)分值,即數(shù)據(jù)流的勻速性特征值和有效載荷長度固定性特征值,對其進(jìn)行相應(yīng)的計(jì)算,判定它是否屬于VoIP數(shù)據(jù)流。本發(fā)明很好的解決了VoIP數(shù)據(jù)流識別準(zhǔn)確度低、效率不高和流媒體私有協(xié)議識別困難等問題,極大提高對VoIP數(shù)據(jù)流識別的準(zhǔn)確性、可靠性和有效性。
文檔編號H04L12/56GK102340454SQ20111035326
公開日2012年2月1日 申請日期2011年11月10日 優(yōu)先權(quán)日2011年11月10日
發(fā)明者朱行濤, 李常春, 楊琳, 王康年, 蔣邦持, 譚建明, 黃鸝聲 申請人:中國人民解放軍重慶通信學(xué)院