專利名稱:基于UDP統(tǒng)計指印混合模型的VoIP流量檢測方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種VoIP流量檢測方法,特別是涉及一種基于UDP統(tǒng)計指印混合模型的VoIP流量檢測方法。
背景技術(shù):
Voice over Internet Protocol (以下簡稱VoIP)技術(shù)是一種以IP電話為主,并推出相應(yīng)的增值業(yè)務(wù)的技術(shù)。與傳統(tǒng)的語音業(yè)務(wù)相比,VoIP能在同樣帶寬條件下使通話數(shù)量成倍增加,可以實現(xiàn)低成本的語音傳送、傳真等傳統(tǒng)電信業(yè)務(wù)。應(yīng)用較為廣泛的VoIP技術(shù)主要有Skype和QQ語音等,在網(wǎng)絡(luò)帶寬中占有一定比例,VoIP流量的精確檢測有助于提高網(wǎng)絡(luò)服務(wù)質(zhì)量,提升網(wǎng)絡(luò)管理和控制的水平,并有助于維護網(wǎng)絡(luò)安全。文獻 I “SalmanA. Baset, Henning Schulzrinne. An Analysis of the SkypePeer-to-Peer Internet Telephony Protocol. IEEE06, Barcelona, Spain,Apr. 2006”對Skype協(xié)議進行了詳細分析,發(fā)現(xiàn)Skype協(xié)議使用動態(tài)端口而且負載部分完全加密,傳統(tǒng)的基于端口和DPI (Deep Packet Inspection)的協(xié)議識別方法已基本失效。文獻2 “徐鵬,劉瓊,林森.基于支持向量機的Internet流量分類研究[J].計算機研究與發(fā)展,2009,46 (3) :407_414” 公開了一種基于 SVM(Support Vector Machine)的流量分類方法,能有效降低冗余屬性的干擾,有很好的分類準確率和穩(wěn)定性,但目前這方面的研究并未考慮VoIP流量的識別。文獻3 “Manuel Crotti, Maurizio Dusi. Traffic Classification throughSimple Statistical Fingerprinting, ACM SIGCOMM Computer Communication Review,Vol. 37,No. 1,pp. 5-16,Jan. 2007”使用統(tǒng)計指印方法實現(xiàn)對HTTP、POP3、SMTP等常用協(xié)議的識別,該方法基于TCP流的前四個包的統(tǒng)計特征建立相應(yīng)的統(tǒng)計指印,并通過計算TCP流的相異度來判定流的協(xié)議類別,但文獻中并未研究m)P指印的構(gòu)造和應(yīng)用。文獻4 “D. Bonfiglio, M. Mellia, M. Meo. Revealing Skype Traffic ffhenRandomness Plays with You[C]//Proceedings of 2007ACM SIGCOMM ComputerCommunication Review,New York,USA ACM, 2007 :37_48”使用卡方檢驗和樸素貝葉斯的方法實現(xiàn)對Skype協(xié)議流量的識別,這也是目前在Skype流量識別方面最有效的方法,但該方法是根據(jù)Skype協(xié)議的編碼方式和包頭特征提出的,只能識別特定版本的Skype協(xié)議流量,無法識別QQ語音、MSN語音等其它VoIP流量,有一定的局限性。
發(fā)明內(nèi)容
為了克服現(xiàn)有的方法對VoIP流量檢測精確度差的不足,本發(fā)明提供一種基于UDP統(tǒng)計指印混合模型的VoiP流量檢測方法。該方法將m)P流的統(tǒng)計特征與網(wǎng)絡(luò)流的統(tǒng)計指印相異度結(jié)合共同訓(xùn)練一個支持向量機分類模型,把基于分類閾值點的分類轉(zhuǎn)換到基于多維特征的高維空間中的分類面的分類,綜合運用包層次和流層次統(tǒng)計特征,可以降低因網(wǎng)絡(luò)不穩(wěn)定造成的統(tǒng)計特征偏差對分類模型精確度的影響,提高對VoIP流量檢測的精確度。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是一種基于UDP統(tǒng)計指印混合模型的VoIP流量檢測方法,其特點是包括以下步驟(a)解析PCAP包文件,并根據(jù)五元組{源IP、源端口、目的IP、目的端口以及傳輸層協(xié)議}完成m)P流的組裝。(b)使用17-fiIeter對組裝后的UDP流進行標注,標注數(shù)據(jù)分為VoIP協(xié)議流和非VoIP協(xié)議流兩類。(C)使用(b)中標注好的VoIP協(xié)議流的包特征建立VoIP協(xié)議的UDP指印,用矩陣表不網(wǎng)絡(luò)流X ;
權(quán)利要求
1.一種基于UDP統(tǒng)計指印混合模型的VoIP流量檢測方法,其特征在于包括以下步驟Ca)解析PCAP包文件,并根據(jù)五元組{源IP、源端口、目的IP、目的端口以及傳輸層協(xié)議}完成m)P流的組裝; (b)使用17-fiIeter對組裝后的UDP流進行標注,標注數(shù)據(jù)分為VoIP協(xié)議流和非VoIP協(xié)議流兩類; (c)使用(b)中標注好的VoIP協(xié)議流的包特征建立VoIP協(xié)議的UDP指印,用矩陣表示網(wǎng)絡(luò)流無
全文摘要
本發(fā)明公開了一種基于UDP統(tǒng)計指印混合模型的VoIP流量檢測方法,用于解決現(xiàn)有的方法對VoIP流量檢測精確度差的技術(shù)問題。技術(shù)方案是首先解析PCAP包文件并組裝UDP流,再對組裝后的UDP流進行標注,生成VoIP協(xié)議的UDP指印M,計算網(wǎng)絡(luò)流與VoIP指印的相異度,生成訓(xùn)練集和測試集,采用訓(xùn)練集訓(xùn)練SVM分類器,采用測試集測試VoIP流量的精度。由于將UDP流的統(tǒng)計特征與網(wǎng)絡(luò)流的統(tǒng)計指印相異度結(jié)合共同訓(xùn)練一個支持向量機分類模型,把基于分類閾值點的分類轉(zhuǎn)換到基于多維特征的高維空間中的分類面的分類,綜合運用包層次和流層次統(tǒng)計特征,降低了因網(wǎng)絡(luò)不穩(wěn)定造成的統(tǒng)計特征偏差對分類模型精確度的影響。檢測結(jié)果表明,本發(fā)明對VoIP流量的檢測精確度達到90%以上。
文檔編號H04M7/00GK102821217SQ201210264260
公開日2012年12月12日 申請日期2012年7月29日 優(yōu)先權(quán)日2012年7月29日
發(fā)明者蔡皖東, 丁要軍, 張玉沖 申請人:西北工業(yè)大學(xué)