專利名稱:協(xié)議識別方法和裝置的制作方法
協(xié)議識別方法和裝置技術領域
本發(fā)明實施例涉及技術領域,尤其涉及一種協(xié)議識別方法和裝置。
背景技術
普通報文檢測僅分析因特網協(xié)議(Internet Protocol ;簡稱IP)包的層4以下的 內容,包括源地址、目的地址、源端口、目的端口以及協(xié)議類型。深度包檢測(De印Packet Inspection ;簡稱DPI)除了對前述的層次進行分析外還包括應用層分析,識別各種應用 及其內容。DPI的技術可以高效的識別出網絡上的各種應用。目前業(yè)界的DPI識別方法為, 預先定義協(xié)議的特征,再將網絡上的數(shù)據包與這些特征進行匹配,與哪條匹配成功,則該數(shù) 據包識別為哪個協(xié)議。其中,預先定義的特征包含一個或多個特征條件,這些特征條件可以 是應用報文的內容與某些字符匹配、符合某個算法、符合某種行為模式或者是這幾種條件 的組合。在同樣的環(huán)境下,減少匹配次數(shù)可以提升DPI識別協(xié)議的性能,最好的性能是輸入 一條數(shù)據流,匹配一個特征就匹配成功。
現(xiàn)有的DPI匹配方法為了減少匹配次數(shù),可以將特征庫中所有的特征按照某種特 定的順序串聯(lián)起來,設備運行后,特征的匹配順序不變,匹配性能低。發(fā)明內容
本發(fā)明提供一種協(xié)議識別方法和裝置,用以解決現(xiàn)有技術中協(xié)議特征匹配性能低 的缺陷,提升協(xié)議匹配性能。
本發(fā)明實施例提供一種協(xié)議識別方法,包括
根據對已接收的報文進行深度包檢測的識別結果,統(tǒng)計所述深度包檢測所采用的 協(xié)議特征信息的識別概率,所述識別概率表示協(xié)議特征信息根據預設統(tǒng)計策略是否被采用 的概率;
根據所述識別概率的大小,確定深度包檢測識別庫中的協(xié)議特征信息的優(yōu)化序 列,所述優(yōu)化序列用于確定對后續(xù)接收到的報文進行識別所采用的協(xié)議特征信息的先后順 序;
按照所述優(yōu)化序列,對后續(xù)接收到的報文進行協(xié)議識別。
本發(fā)明實施例又提供一種協(xié)議識別方法,包括
根據協(xié)議特征信息所具有的特征條件,獲取所述協(xié)議特征信息的性能指數(shù),所述 性能指數(shù)表示成功識別所述協(xié)議所消耗資源的能力;
根據所述協(xié)議特征信息的性能指數(shù),確定深度包檢測識別庫中的協(xié)議特征信息的 優(yōu)化序列,所述優(yōu)化序列用于確定對后續(xù)接收到的報文進行識別所采用的協(xié)議特征信息的 先后順序;
按照所述優(yōu)化序列,對后續(xù)接收到的報文進行協(xié)議識別。
本發(fā)明實施例提供一種協(xié)議識別裝置,包括
識別概率統(tǒng)計模塊,用于根據對已接收的報文進行深度包檢測的識別結果,統(tǒng)計所述深度包檢測所采用的協(xié)議特征信息的識別概率,所述識別概率表示協(xié)議特征信息根據 預設統(tǒng)計策略是否被采用的概率;
優(yōu)化序列確定模塊,用于根據所述識別概率的大小,確定深度包檢測識別庫中的 協(xié)議特征信息的優(yōu)化序列,所述優(yōu)化序列用于確定對后續(xù)接收到的報文進行識別所采用的 協(xié)議特征信息的先后順序;
協(xié)議識別模塊,用于按照所述優(yōu)化序列,對后續(xù)接收到的報文進行協(xié)議識別。
本發(fā)明實施例提供一種協(xié)議識別裝置,包括
性能指數(shù)獲取模塊,用于根據協(xié)議特征信息所具有的特征條件,獲取所述協(xié)議特 征信息的性能指數(shù),所述性能指數(shù)表示成功識別所述協(xié)議所消耗資源的能力;
優(yōu)化序列確定模塊,用于根據所述協(xié)議特征信息的性能指數(shù),確定深度包檢測識 別庫中的協(xié)議特征信息的優(yōu)化序列,所述優(yōu)化序列用于確定對后續(xù)接收到的報文進行識別 所采用的協(xié)議特征信息的先后順序;
協(xié)議識別模塊,用于按照所述優(yōu)化序列,對后續(xù)接收到的報文進行協(xié)議識別。
本發(fā)明提供的協(xié)議識別方法和裝置,根據預設統(tǒng)計策略的識別概率,可以確定協(xié) 議識別的優(yōu)化序列,不同的時間、地區(qū)的協(xié)議特征信息的排列順序可以不同,實現(xiàn)在不同的 時間、不同的地區(qū)輸入同樣協(xié)議的數(shù)據流中的報文,協(xié)議匹配的性能不同,從而可以匹配成 功概率大的協(xié)議特征信息優(yōu)先匹配,將匹配失敗概率大的協(xié)議特征信息后續(xù)匹配,提升協(xié) 議匹配性能。
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn) 有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā) 明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根 據這些附圖獲得其他的附圖。
圖1為本發(fā)明協(xié)議識別方法第一實施例的流程圖2為本發(fā)明實施例中協(xié)議-特征-條件的關系示意圖3為本發(fā)明協(xié)議識別方法第二實施例的流程圖4為本發(fā)明協(xié)議識別方法第二實施例中協(xié)議特征信息與特征條件性能指數(shù)的 關系示意圖5為本發(fā)明協(xié)議識別方法第三實施例的流程圖6為本發(fā)明協(xié)議識別方法第四實施例的流程圖7為本發(fā)明協(xié)議識別方法第五實施例的流程圖8為本發(fā)明協(xié)議識別方法第六實施例的流程圖9為本發(fā)明協(xié)議識別裝置第一實施例的結構示意圖10為本發(fā)明協(xié)議識別裝置第二實施例的結構示意圖11為本發(fā)明協(xié)議識別裝置第三實施例的結構示意圖。
具體實施方式
為使本發(fā)明實施例的目的、技術方案和優(yōu)點更加清楚,下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是 本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員 在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
圖1為本發(fā)明協(xié)議識別方法第一實施例的流程圖,如圖1所示,該協(xié)議識別方法包 括
步驟101、根據對已接收的報文進行深度包檢測的識別結果,統(tǒng)計所述深度包檢測 所采用的協(xié)議特征信息的識別概率,所述識別概率表示協(xié)議特征信息根據預設統(tǒng)計策略是 否被采用的概率;
在步驟101之前,還可以包括根據協(xié)議特征信息所具有的特征條件,獲取所述協(xié) 議特征信息的性能指數(shù),所述性能指數(shù)表示成功識別所述協(xié)議所消耗資源的能力;
圖2為本發(fā)明實施例中協(xié)議-特征-條件的關系示意圖,如圖2所示,同一個協(xié)議 的協(xié)議特征信息之間是“或”的關系,同一個協(xié)議特征信息的特征條件之間是“與”的關系。 根據一個協(xié)議特征信息的所有特征條件的性能指數(shù),可以計算出該協(xié)議特征信息的性能指 數(shù)。
其中,根據協(xié)議特征信息所具有的特征條件,獲取所述協(xié)議特征信息的性能指數(shù) 具體可以包括獲取每條協(xié)議特征信息中所有特征條件的性能指數(shù);按照設定算法對所有 特征條件的性能指數(shù)進行計算,得到協(xié)議特征信息的性能指數(shù)。所述性能指數(shù)表示成功識 別所述協(xié)議所消耗資源的能力,如表示成功設別協(xié)議所消耗的時間和/或內存等的能力。 可選的,某協(xié)議特征信息所消耗的時間和內存的能力都較低時,確定性能指數(shù)低;某協(xié)議特 征信息所消耗的時間和內存的能力都較高時,確定性能指數(shù)高。可選的,可以識別概率優(yōu) 先,及根據識別概率先確定深度包檢測識別庫中所有的協(xié)議特征信息的初步序列,后根據 所述性能指數(shù)確定初步序列的順序,確定優(yōu)化序列;也可以先根據性能指數(shù),確定深度包 檢測識別庫中所有的協(xié)議特征信息的初步序列,后根據識別概率確定初步序列的順序,確 定深度包檢測識別庫中所有的協(xié)議特征信息的優(yōu)化序列。可以理解,也可以按照一定的策 略條件結合識別概率和性能指數(shù),確定深度包檢測識別庫中所有的協(xié)議特征信息的優(yōu)化序 列。
如果預先“知道”輸入的數(shù)據流中的報文是什么協(xié)議,將這個協(xié)議的協(xié)議特征信息 排放在匹配數(shù)據的最前面進行匹配,匹配成功的可能性增大,可以減少匹配次數(shù)。本發(fā)明 實施例基于預設統(tǒng)計策略對數(shù)據流中的報文匹配哪條特征進行統(tǒng)計分析,統(tǒng)計出在某個設 定時間段出現(xiàn)什么特征的數(shù)據流中報文的識別概率最大,根據識別概率調整協(xié)議特征信息 的排列順序,自動提升協(xié)議匹配性能。由于網絡中的各個協(xié)議的數(shù)據流不是均勻分布的,決 定原因如下(a)不同國家地區(qū),使用的網絡軟件不同,網絡中協(xié)議數(shù)據流也不同。如歐美 多使用MSN軟件,中國大陸多使用QQ軟件,中國出現(xiàn)QQ的協(xié)議的特征信息的概率大于出現(xiàn) MSN協(xié)議特征信息。(b)在同一個地區(qū),不同的時間,由于人們的活動不同,網絡上協(xié)議的數(shù) 據流也不同。如白天是人們工作生活的主要時間段,需要人參與的軟件使用地比較多,網 頁瀏覽、即時通訊(IM)類型的協(xié)議、郵件協(xié)議等協(xié)議的數(shù)據流出現(xiàn)概率較大;而凌晨時分, 一些不需要人參與的軟件的使用占的比較多,因此BT、Thunder等下載類型協(xié)議的數(shù)據流 出現(xiàn)概率較大。(c)由于互聯(lián)網的發(fā)展,新的網絡協(xié)議不斷出現(xiàn),老的網絡協(xié)議也慢慢消失, 因此各個協(xié)議的數(shù)據流出現(xiàn)概率不斷變化。7
因此,在步驟101之前,還可以預先設定所述預設統(tǒng)計策略,所述預設統(tǒng)計策略包 括設定時間段、設定區(qū)域和協(xié)議新舊程度中的任意一種。
其中,步驟101具體可以包括以下任一情況
情況一、根據對已接收的報文進行深度包檢測的識別結果,統(tǒng)計所述深度包檢測 所采用的協(xié)議特征信息在預設統(tǒng)計策略的識別成功概率;
情況二、根據對已接收的報文進行深度包檢測的識別結果,統(tǒng)計所述深度包檢測 所采用的協(xié)議特征信息在預設統(tǒng)計策略的識別失敗概率。
步驟102、根據所述識別概率的大小,確定深度包檢測識別庫中的協(xié)議特征信息的 優(yōu)化序列,所述優(yōu)化序列用于確定對后續(xù)接收到的報文進行識別所采用的協(xié)議特征信息的 先后順序;
其中,可以直接根據識別概率的大小,按照識別成功概率從高到低或者按照識別 失敗概率從低到高的順序確定協(xié)議特征信息的優(yōu)化序列;也可以同時考慮識別概率和性能 指數(shù),確定協(xié)議特征信息的優(yōu)化序列,具體可以包括以下任一方式
方式一、根據所述協(xié)議特征信息的性能指數(shù)和所述識別概率,按照預設的函數(shù)關 系,計算深度包檢測識別庫中的所有協(xié)議特征信息在不同排列順序對應的外部性能指數(shù), 將所述外部性能指數(shù)最低的排列順序確定為優(yōu)化序列;可以理解,這里的外部性能指數(shù)是 用來衡量“協(xié)議特征信息排列順序”的性能指數(shù),是針對已經排好的排列順序。
方式二、根據所述協(xié)議特征信息的性能指數(shù)和所述識別概率,計算深度包檢測識 別庫中的所有協(xié)議特征信息對應的內部性能指數(shù),將所有協(xié)議特征信息按照所述內部性能 指數(shù)升序的排列順序確定為優(yōu)化序列,所述內部性能指數(shù)為所述性能指數(shù)與其對應的識別 成功概率的比值或所述性能指數(shù)與其對應的識別失敗概率的乘積??梢岳斫膺@里的內部性 能指數(shù)是用來衡量協(xié)議特征信息性能指數(shù),是針對協(xié)議特征信息,去排序協(xié)議特征信息。
步驟103、按照所述優(yōu)化序列,對后續(xù)接收到的報文進行協(xié)議識別。
本實施例根據預設統(tǒng)計策略的識別概率,可以確定協(xié)議識別的優(yōu)化序列,不同的 時間、地區(qū)的協(xié)議特征信息的排列順序可以不同,實現(xiàn)在不同的時間、不同的地區(qū)輸入同樣 協(xié)議的數(shù)據流中的報文,協(xié)議匹配的性能不同,從而可以將匹配成功概率大的協(xié)議特征信 息優(yōu)先匹配,將匹配失敗概率大的協(xié)議特征信息后續(xù)匹配,提升協(xié)議匹配性能。也可以綜合 識別概率和協(xié)議特征信息的性能指數(shù),將性能指數(shù)低、匹配成功概率大的協(xié)議特征信息優(yōu) 先匹配,將性能指數(shù)高、匹配失敗概率大的協(xié)議特征信息后續(xù)匹配,進一步提升協(xié)議匹配性 能。
圖3為本發(fā)明協(xié)議識別方法第二實施例的流程圖,如圖3所示,在本發(fā)明協(xié)議識別 方法第一實施例的基礎上,該協(xié)議識別方法包括
步驟201、計算識別成功每條協(xié)議特征信息的性能指數(shù)R。每條協(xié)議特征信息的性 能指數(shù)只與其所有的特征條件有關。在相同的軟硬件環(huán)境下,相同特征條件的性能指數(shù)相 同。因此,每條協(xié)議特征的性能指數(shù)可以預先計算。例如如圖4所示,為本發(fā)明協(xié)議識別 方法第二實施例中協(xié)議特征信息與特征條件性能指數(shù)的關系示意圖,協(xié)議特征信息_1由4個特征條件組成,特征條件對應的條件類型的性能指數(shù)分別為Cl、C2.......Cm,則協(xié)議特征信息_1的性能指數(shù)Rl = F(C1,C2,......Cm)。例如,需要識別出協(xié)議A,協(xié)議A的協(xié)議特征信息需要同時滿足兩個特征條件Al和A2 其中,Al表示第三字節(jié)等于“0x02”,A2表示第五字節(jié)為這個數(shù)據包的長度,則協(xié)議A的協(xié)議特征信息的性能指數(shù)R的計算方法為由 于匹配一個字節(jié)的需要1個性能單位,偏移一次指針需要0. 5個性能單位,匹配一次長度需 要1.5個性能單位,所以匹配Al和A2需要1+0. 5+0. 5+1.5 = 3. 5個性能單位,因此,可以 得到協(xié)議A的協(xié)議特征信息的性能指數(shù)R等于3. 5。其中,每個協(xié)議特征信息的特征條件的 個數(shù)可以根據具體的應用確定,本發(fā)明不做限定。
步驟202、統(tǒng)計在設定策略內識別成功每條協(xié)議特征信息的識別成功概率P。
如果設定策略為設定時間段,則可以先將時間分段,其中,時間分段可以自動完 成,也可以手工設置;時間分段的粒度可以是一天、一周、一年等。例如將一天分成三個設 定時間段(900-18:00,18:00-0:00,0:00-900),在設備運行一個月后,根據統(tǒng)計結果計算 在該三個設定時間段內每條協(xié)議特征信息的識別成功概率。設定策略為設定區(qū)域或協(xié)議新 舊程度時,識別概率的統(tǒng)計方法與設定時間段類似。
步驟203、根據性能指數(shù)和識別成功概率確定協(xié)議特征信息的所有排列順序對應 的外部性能指數(shù)的序列,選取最低的外部性能指數(shù)對應的協(xié)議特征信息的序列,作為調整 后的優(yōu)化序列。例如假設系統(tǒng)包括m個協(xié)議特征信息,協(xié)議識別的預先匹配序列對應的 性能指數(shù)為Rx = (R1,R2,. . .,Rm),每個協(xié)議特征信息對應的識別成功概率的序列為I^x = (Pl,P2,. . .,Pm),m個協(xié)議特征信息的每一種排列順序對應的外部性能指數(shù)為Qx = F (Rx, Px),調整m個協(xié)議特征信息的排列順序,可以得到m個協(xié)議特征信息在不同排列順序對應 的外部性能指數(shù),確定協(xié)議特征信息的所有排列順序對應的外部性能指數(shù)的序列為Oil, Q2,. . .,Qn),其中,m為正整數(shù),η是m個協(xié)議特征信息的排列組合的個數(shù)。選取最低的外 部性能指數(shù)Qi = min(Ql,Q2,...,Qm),Qi對應的協(xié)議特征信息的序列Ri為匹配效率最高 的序列,作為調整后的優(yōu)化序列。例如,假設某個協(xié)議包括兩個協(xié)議特征信息“ 1 ”、“ 2 ”,對 應的性能指數(shù)分別是Rl和R2,在某個設定時間段,對應的匹配成功概率分別為Pl和P2,并 且協(xié)議特征信息的序列即排列順序有兩種(1, 和0,1),則這兩種序列對應的兩個外部 性能指數(shù)可以分別為Q1 = Rl+(I-Pl)*R2,Q2 = R2+(1_P2)*R1 ;選取最低的外部性能指數(shù) Qi = min(Ql, Q2),Qi對應的協(xié)議特征信息的序列為調整后的優(yōu)化序列。
步驟204、系統(tǒng)按照確定的優(yōu)化序列,對后續(xù)接收到的報文進行協(xié)議識別。
本實施例根據預設統(tǒng)計策略的識別概率和協(xié)議特征信息的性能指數(shù),可以確定協(xié) 議識別的優(yōu)化序列,不同的時間、地區(qū)的協(xié)議特征信息的排列順序可以不同,實現(xiàn)在不同的 時間、不同的地區(qū)輸入同樣協(xié)議的數(shù)據流,協(xié)議匹配的性能不同,從而可以將性能指數(shù)低、 匹配成功概率大的協(xié)議特征信息優(yōu)先匹配,提升協(xié)議匹配性能。
圖5為本發(fā)明協(xié)議識別方法第三實施例的流程圖,如圖5所示,在本發(fā)明協(xié)議識別 方法第一實施例的基礎上,該協(xié)議識別方法包括
步驟301、計算識別成功每條協(xié)議特征信息的性能指數(shù)R。具體方法可以參見上述 實施例中的步驟201。
步驟302、統(tǒng)計在設定策略內識別成功每條協(xié)議特征信息的識別成功概率P。具體 方法可以參見上述實施例中的步驟202。
步驟303、根據性能指數(shù)和識別成功概率計算每個協(xié)議特征信息對應的內部性能 指數(shù),將每個協(xié)議特征信息對應的內部性能指數(shù)的序列按照升序排序,得到優(yōu)化序列。例 如假設當前總共有m個協(xié)議特征信息,協(xié)議識別的預先匹配序列對應的性能指數(shù)為Rx =(R1, R2,. . .,Rm),每個協(xié)議特征信息對應的協(xié)議特征識別成功概率的序列為I^x = (Pl, P2,...,Pm),計算每個協(xié)議特征信息對應的內部性能指數(shù)foc = RX/PX,將每個協(xié)議特征信 息對應的內部性能指數(shù)的序列(Gl,G2,. . .,Gm)按升序排序,得到的協(xié)議特征信息序列為 調整后的優(yōu)化序列。
步驟304、系統(tǒng)按照確定的優(yōu)化序列,對后續(xù)接收到的報文進行協(xié)議識別。
本實施例根據預設統(tǒng)計策略的識別概率和協(xié)議特征信息的性能指數(shù),可以確定協(xié) 議識別的優(yōu)化序列,不同的時間、地區(qū)的協(xié)議特征信息的排列順序可以不同,實現(xiàn)在不同的 時間、不同的地區(qū)輸入同樣協(xié)議的數(shù)據流,協(xié)議匹配的性能不同,可以將性能指數(shù)低、匹配 成功概率大的協(xié)議特征信息優(yōu)先匹配,提升協(xié)議匹配性能。
圖6為本發(fā)明協(xié)議識別方法第四實施例的流程圖,如圖6所示,在本發(fā)明協(xié)議識別 方法第一實施例的基礎上,該協(xié)議識別方法包括
步驟401、計算識別成功每條協(xié)議特征信息的性能指數(shù)R。具體方法可以參見上述 實施例中的步驟201。
步驟402、統(tǒng)計在設定策略內每條協(xié)議特征信息的識別失敗概率P’ χ。
如果設定策略為設定時間段,則可以先將時間分段,其中,時間分段可以自動完 成,也可以手工設置;時間分段的粒度可以是一天、一周、一年等。例如將一天分成三個設 定時間段(900-18:00,18:00-0:00,0:00-900),在設備運行一個月后,根據統(tǒng)計結果計算 在該三個設定時間段內每條協(xié)議特征信息的識別失敗概率。設定策略為設定區(qū)域或協(xié)議新 舊程度時,識別概率的統(tǒng)計方法與設定時間段類似。本發(fā)明協(xié)議識別方法第二、第三實施例 不同,本實施例不計算每個時間段協(xié)議特征新的識別成功概率I3X,而是計算識別失敗概率 P,X,其中,P,χ = I-Px0
步驟403、根據性能指數(shù)和識別失敗概率確定協(xié)議特征信息的所有排列順序對應 的外部性能指數(shù)的序列,選取最低的外部性能指數(shù)對應的協(xié)議特征信息的序列,作為調整 后的優(yōu)化序列。例如假設系統(tǒng)包括m個協(xié)議特征信息,協(xié)議識別的預先匹配序列對應的 性能指數(shù)為Rx = (R1, R2,...,Rm),每個協(xié)議特征信息對應的識別失敗概率的序列為P’ χ =(P’ 1,ρ’ 2,. . .,P’ m),m個協(xié)議特征信息的每一種排列順序對應的外部性能指數(shù)為Q’ χ =F(Rx, P’ x),m個協(xié)議特征信息的排列順序,可以得到m個協(xié)議特征信息在不同排列順 序對應的外部性能指數(shù),確定協(xié)議特征信息的所有排列順序對應的外部性能指數(shù)的序列為 (Q’ 1,Q’ 2,...,Q’m),其中,m為正整數(shù),η是m個協(xié)議特征信息的排列組合的個數(shù)。選取 最低的外部性能指數(shù)Q’ i = min(Q' 1,Q’ 2,. . .,Q’ m),Q’ i對應的協(xié)議特征信息的序列 R’ i為匹配效率最高的序列,作為調整后的優(yōu)化序列。
步驟404、系統(tǒng)按照確定的優(yōu)化序列,對后續(xù)接收到的報文進行協(xié)議識別。
本實施例根據預設統(tǒng)計策略的識別概率和協(xié)議特征信息的性能指數(shù),可以確定協(xié) 議識別的優(yōu)化序列,不同的時間、地區(qū)的協(xié)議特征信息的排列順序可以不同,實現(xiàn)在不同的 時間、不同的地區(qū)輸入同樣協(xié)議的數(shù)據流,協(xié)議匹配的性能不同,可以將性能指數(shù)高、匹配 失敗概率大的協(xié)議特征信息后續(xù)匹配,提升協(xié)議匹配性能。
圖7為本發(fā)明協(xié)議識別方法第五實施例的流程圖,如圖7所示,在本發(fā)明協(xié)議識別 方法第一實施例的基礎上,該協(xié)議識別方法包括
步驟501、計算識別成功每條協(xié)議特征信息的性能指數(shù)R。具體方法可以參見上述10實施例中的步驟201。
步驟502、統(tǒng)計在設定策略內每條協(xié)議特征信息的識別失敗概率P’x。具體方法可 以參見上述實施例中的步驟402。
步驟503、根據性能指數(shù)和識別失敗概率計算每個協(xié)議特征信息對應的內部性能 指數(shù),將每個協(xié)議特征信息對應的內部性能指數(shù)的序列按照升序排序,得到優(yōu)化序列。例 如假設系統(tǒng)包括m個協(xié)議特征信息,協(xié)議識別的預先匹配序列對應的性能指數(shù)為Rx = (R1,R2,. . ·,Rm),每個協(xié)議特征信息對應的識別失敗概率的序列為P,χ = (P,1,Ρ,2,· · ·, P’ m),計算每個協(xié)議特征信息對應的內部性能指數(shù)G’ χ = Rx*P’ χ,將每個協(xié)議特征信息對 應的內部性能指數(shù)的序列(G’ 1,G' 2,...,6'm)按照升序排序,得到的協(xié)議特征信息的序 列為調整后的優(yōu)化序列。
步驟504、系統(tǒng)按照確定的優(yōu)化序列,對后續(xù)接收到的報文進行協(xié)議識別。
上述各個協(xié)議識別方法的實施例可以是動態(tài)調整的過程,每間隔一段時間進行一 次計算,將協(xié)議特征信息的排列順序調整為優(yōu)化序列;也可以不是動態(tài)調整的過程,而是預 先計算得到優(yōu)化序列后,靜態(tài)的將協(xié)議特征信息按照優(yōu)化序列的排列,例如將出現(xiàn)頻率 高、性能指數(shù)低的協(xié)議特征信息排放在匹配序列的前面,如果都匹配不成功,則再采用匹配 性能指數(shù)高的協(xié)議特征信息進行匹配。
本實施例根據預設統(tǒng)計策略的識別概率和協(xié)議特征信息的性能指數(shù),可以確定協(xié) 議識別的優(yōu)化序列,不同的時間、地區(qū)的協(xié)議特征信息的排列順序可以不同,實現(xiàn)在不同的 時間、不同的地區(qū)輸入同樣協(xié)議的數(shù)據流,協(xié)議匹配的性能不同,可以將性能指數(shù)高、匹配 失敗概率大的協(xié)議特征信息后續(xù)匹配,提升協(xié)議匹配性能。
圖8為本發(fā)明協(xié)議識別方法第六實施例的流程圖,如圖8所示,該協(xié)議識別方法可 以包括以下步驟
步驟601、根據協(xié)議特征信息所具有的特征條件,獲取所述協(xié)議特征信息的性能指 數(shù),所述性能指數(shù)表示成功識別所述協(xié)議所消耗資源的能力;
其中,步驟601可以包括獲取每條協(xié)議特征信息中所有特征條件的性能指數(shù);按 照設定算法對所有特征條件的性能指數(shù)進行計算,得到協(xié)議特征信息的性能指數(shù)。具體可 以參見本發(fā)明協(xié)議識別方法第一實施例中的相關描述及圖2。
步驟602、根據所述協(xié)議特征信息的性能指數(shù),確定深度包檢測識別庫中的協(xié)議特 征信息的優(yōu)化序列,所述優(yōu)化序列用于確定對后續(xù)接收到的報文進行識別所采用的協(xié)議特 征信息的先后順序;
例如按照性能指數(shù)從低到高的順序,確定對后續(xù)接收到的報文進行識別所采用 的協(xié)議特征信息的先后順序。
步驟603、按照所述優(yōu)化序列,對后續(xù)接收到的報文進行協(xié)議識別。
本實施例根據協(xié)議特征信息的性能指數(shù),可以確定協(xié)議識別的優(yōu)化序列,不同的 時間、地區(qū)的協(xié)議特征信息的排列順序可以不同,實現(xiàn)在不同的時間、不同的地區(qū)輸入同樣 協(xié)議的數(shù)據流,協(xié)議匹配的性能不同,從而可以將性能指數(shù)低的協(xié)議特征信息優(yōu)先匹配,將 性能指數(shù)高的協(xié)議特征信息后續(xù)匹配,提升協(xié)議匹配性能。
圖9為本發(fā)明協(xié)議識別裝置第一實施例的結構示意圖,如圖9所示,該協(xié)議識別裝 置可以包括
識別概率統(tǒng)計模塊71,用于根據對已接收的報文進行深度包檢測的識別結果,統(tǒng) 計所述深度包檢測所采用的協(xié)議特征信息的識別概率,所述識別概率表示協(xié)議特征信息根 據預設統(tǒng)計策略是否被采用的概率;
優(yōu)化序列確定模塊73,用于根據所述識別概率的大小,確定深度包檢測識別庫中 的協(xié)議特征信息的優(yōu)化序列,所述優(yōu)化序列用于確定對后續(xù)接收到的報文進行識別所采用 的協(xié)議特征信息的先后順序;
協(xié)議識別模塊74,用于按照所述優(yōu)化序列,對后續(xù)接收到的報文進行協(xié)議識別。
具體地,深度包檢測識別庫中的每條協(xié)議特征信息都具有相應的性能指數(shù);識別 概率統(tǒng)計模塊71根據深度包檢測的識別結果,統(tǒng)計所述深度包檢測所采用的協(xié)議特征信 息在預設統(tǒng)計策略是否被采用的概率即識別成功概率或識別失敗概率;然后,優(yōu)化序列確 定模塊73可以根據所述協(xié)議特征信息的識別概率,確定深度包檢測識別庫中所有的協(xié)議 特征信息的優(yōu)化序列;最后,協(xié)議識別模塊74,用于按照所述優(yōu)化序列,對后續(xù)接收到的報 文進行協(xié)議識別本發(fā)明實施例的協(xié)議識別裝置可由開關控制是否啟動,該開關可以是物理 的,也可以是邏輯代碼命令;該協(xié)議識別裝置可以獨立設置,也可嵌入到網絡匯聚設備如 DPI設備、網管設備產品中。該協(xié)議識別裝置各模塊的輸出值可以根據自身的運算結果確 定,也可以預先設置的輸出值。該協(xié)議識別裝置的各個模塊可以每間隔一定的時間,確定一 次優(yōu)化序列,實時更新優(yōu)化策略;也可以在協(xié)議識別開始時,確定優(yōu)化策略,隨后則一直采 用優(yōu)化策略進行協(xié)議識別。
本實施例優(yōu)化序列確定模塊根據預設統(tǒng)計策略的識別概率可以確定協(xié)議識別的 優(yōu)化序列,不同的時間、地區(qū)的協(xié)議特征信息的排列順序可以不同,實現(xiàn)在不同的時間、不 同的地區(qū)輸入同樣協(xié)議的數(shù)據流中的報文,協(xié)議匹配的性能不同,從而可以將匹配成功概 率大的協(xié)議特征信息優(yōu)先匹配,將匹配失敗概率大的協(xié)議特征信息后續(xù)匹配,提升協(xié)議匹 配性能。
圖10為本發(fā)明協(xié)議識別裝置第二實施例的結構示意圖,如圖10所示,在本發(fā)明協(xié) 議識別裝置第一實施例的基礎上,該協(xié)議識別裝置還可以包括性能指數(shù)獲取模塊70和/ 或統(tǒng)計策略設定模塊75。
其中,性能指數(shù)獲取模塊70,用于根據協(xié)議特征信息所具有的特征條件,獲取所述 協(xié)議特征信息的性能指數(shù),所述性能指數(shù)表示成功識別所述協(xié)議所消耗資源的能力;性能 指數(shù)獲取模塊獲取協(xié)議特征信息的性能指數(shù)的具體方法,可以參見本發(fā)明協(xié)議識別方法第 一、第二實施例中的相關描述。
統(tǒng)計策略設定模塊75,用于預先設定所述預設統(tǒng)計策略,所述預設統(tǒng)計策略包括 設定時間段、設定區(qū)域和協(xié)議新舊程度中的任意一種。統(tǒng)計策略設定模塊預先預設統(tǒng)計策 略的具體方法,可以參見本發(fā)明協(xié)議識別方法第一、第二實施例中的相關描述。
進一步地,性能指數(shù)獲取模塊70可以包括特征條件子模塊701和協(xié)議特征信息 子模塊702。
其中,特征條件子模塊701,用于獲取每條協(xié)議特征信息中所有特征條件的性能指 數(shù);
協(xié)議特征信息子模塊702,用于按照設定算法對所有特征條件的性能指數(shù)進行計 算,得到協(xié)議特征信息的性能指數(shù)。具體可以參見本發(fā)明協(xié)議識別方法第一、第二實施例中的相關描述和圖2。
進一步地,識別概率統(tǒng)計模塊71可以包括第一統(tǒng)計子模塊711和/或第二統(tǒng)計 子模塊712。
其中,第一統(tǒng)計子模塊711,用于根據對已接收的報文進行深度包檢測的識別結 果,統(tǒng)計所述深度包檢測所采用的協(xié)議特征信息在預設統(tǒng)計策略的識別成功概率;第一統(tǒng) 計子模塊確定識別成功概率的具體方法,可以參見本發(fā)明協(xié)議識別方法第一、第二、第三實 施例中的相關描述。
第二統(tǒng)計子模塊712,用于根據對已接收的報文進行深度包檢測的識別結果,統(tǒng)計 所述深度包檢測所采用的協(xié)議特征信息在預設統(tǒng)計策略的識別失敗概率。第二統(tǒng)計子模塊 統(tǒng)計子模塊確定識別失敗概率的具體方法,可以參見本發(fā)明協(xié)議識別方法第一、第四、第五 實施例中的相關描述。
再進一步地,優(yōu)化序列確定模塊73可以包括第一確定子模塊731和/或第二確 定子模塊732。
其中,第一確定子模塊731,用于根據所述協(xié)議特征信息的性能指數(shù)和所述識別概 率,按照預設的函數(shù)關系,計算深度包檢測識別庫中的所有協(xié)議特征信息在不同排列順序 對應的外部性能指數(shù),將所述外部性能指數(shù)最低的排列順序確定為優(yōu)化序列;第一確定子 模塊根據外部性能指數(shù)確定優(yōu)化序列的具體方法,可以參見本發(fā)明協(xié)議識別方法第一、第 二、第三實施例中的相關描述。
第二確定子模塊732,用于根據所述協(xié)議特征信息的性能指數(shù)和所述識別概率,計 算深度包檢測識別庫中的所有協(xié)議特征信息對應的內部性能指數(shù),將所有協(xié)議特征信息按 照所述內部性能指數(shù)升序的排列順序確定為優(yōu)化序列,所述內部性能指數(shù)為所述性能指數(shù) 與其對應的識別成功概率的比值或所述性能指數(shù)與其對應的識別失敗概率的乘積。第二 確定子模塊根據內部性能指數(shù)確定優(yōu)化序列的具體方法,可以參見本發(fā)明協(xié)議識別方法第 一、第四、第五實施例中的相關描述。
本實施例優(yōu)化序列確定模塊的各個子模塊根據預設統(tǒng)計策略的識別概率和協(xié)議 特征信息的性能指數(shù),可以確定協(xié)議識別的優(yōu)化序列,不同的時間、地區(qū)的協(xié)議特征信息的 排列順序可以不同,實現(xiàn)在不同的時間、不同的地區(qū)輸入同樣協(xié)議的數(shù)據流,協(xié)議匹配的性 能不同,從而可以將性能指數(shù)低、匹配成功概率大的協(xié)議特征信息優(yōu)先匹配,將性能指數(shù) 高、匹配失敗概率大的協(xié)議特征信息后續(xù)匹配,提升協(xié)議匹配性能。
圖11為本發(fā)明協(xié)議識別裝置第三實施例的結構示意圖,如圖11所示,該協(xié)議識別 裝置可以包括
性能指數(shù)獲取模塊81,用于根據協(xié)議特征信息所具有的特征條件,獲取所述協(xié)議 特征信息的性能指數(shù),所述性能指數(shù)表示成功識別所述協(xié)議所消耗資源的能力;
優(yōu)化序列確定模塊83,用于根據所述協(xié)議特征信息的性能指數(shù),確定深度包檢測 識別庫中的協(xié)議特征信息的優(yōu)化序列,所述優(yōu)化序列用于確定對后續(xù)接收到的報文進行識 別所采用的協(xié)議特征信息的先后順序;
協(xié)議識別模塊85,用于按照所述優(yōu)化序列,對后續(xù)接收到的報文進行協(xié)議識別。性 能指數(shù)獲取模塊獲取協(xié)議特征信息的性能指數(shù)的具體方法,可以參見本發(fā)明協(xié)議識別方法 第一、第二實施例中的相關描述。13
進一步地,性能指數(shù)獲取模塊81可以包括
特征條件子模塊811,用于獲取每條協(xié)議特征信息中所有特征條件的性能指數(shù);
協(xié)議特征信息子模塊813,用于按照設定算法對所有特征條件的性能指數(shù)進行計 算,得到協(xié)議特征信息的性能指數(shù)。具體可以參見本發(fā)明協(xié)議識別方法第一、第二實施例中 的相關描述和圖2。
本實施例優(yōu)化序列確定模塊根據協(xié)議特征信息的性能指數(shù),可以確定協(xié)議識別的 優(yōu)化序列,不同的時間、地區(qū)的協(xié)議特征信息的排列順序可以不同,實現(xiàn)在不同的時間、不 同的地區(qū)輸入同樣協(xié)議的數(shù)據流,協(xié)議匹配的性能不同,從而可以將性能指數(shù)低的協(xié)議特 征信息優(yōu)先匹配,將性能指數(shù)高的協(xié)議特征信息后續(xù)匹配,提升協(xié)議匹配性能。
本領域普通技術人員可以理解實現(xiàn)上述方法實施例的全部或部分步驟可以通過 程序指令相關的硬件來完成,前述的程序可以存儲于一計算機可讀取存儲介質中,該程序 在執(zhí)行時,執(zhí)行包括上述方法實施例的步驟;而前述的存儲介質包括R0M、RAM、磁碟或光 盤等各種可以存儲程序代碼的介質。
最后應說明的是以上實施例僅用以說明本發(fā)明的技術方案,而非對其限制;盡 管參照前述實施例對本發(fā)明進行了詳細的說明,本領域的普通技術人員應當理解其依然 可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替 換;而這些修改或者替換,并不使相應技術方案的本質脫離本發(fā)明各實施例技術方案的精 神和范圍。
權利要求
1.一種協(xié)議識別方法,其特征在于,包括根據對已接收的報文進行深度包檢測的識別結果,統(tǒng)計所述深度包檢測所采用的協(xié)議 特征信息的識別概率,所述識別概率表示協(xié)議特征信息根據預設統(tǒng)計策略是否被采用的概 率;根據所述識別概率的大小,確定深度包檢測識別庫中的協(xié)議特征信息的優(yōu)化序列,所 述優(yōu)化序列用于確定對后續(xù)接收到的報文進行識別所采用的協(xié)議特征信息的先后順序;按照所述優(yōu)化序列,對后續(xù)接收到的報文進行協(xié)議識別。
2.根據權利要求1所述的協(xié)議識別方法,其特征在于,還包括根據協(xié)議特征信息所具有的特征條件,獲取所述協(xié)議特征信息的性能指數(shù),所述性能 指數(shù)表示成功識別所述協(xié)議所消耗資源的能力。
3.根據權利要求2所述的協(xié)議識別方法,其特征在于,所述根據協(xié)議特征信息所具有 的特征條件,獲取所述協(xié)議特征信息的性能指數(shù),包括獲取每條協(xié)議特征信息中所有特征條件的性能指數(shù);按照設定算法對所有特征條件的性能指數(shù)進行計算,得到協(xié)議特征信息的性能指數(shù)。
4.根據權利要求1所述的協(xié)議識別方法,其特征在于,所述根據對已接收的報文進行 深度包檢測的識別結果,統(tǒng)計所述深度包檢測所采用的協(xié)議特征信息的識別概率,包括根據對已接收的報文進行深度包檢測的識別結果,統(tǒng)計所述深度包檢測所采用的協(xié)議 特征信息在預設統(tǒng)計策略的識別成功概率;或根據對已接收的報文進行深度包檢測的識別結果,統(tǒng)計所述深度包檢測所采用的協(xié)議 特征信息在預設統(tǒng)計策略的識別失敗概率。
5.根據權利要求2所述的協(xié)議識別方法,其特征在于,所述根據所述識別概率的大小, 確定深度包檢測識別庫中的協(xié)議特征信息的優(yōu)化序列,包括根據所述協(xié)議特征信息的性能指數(shù)和所述識別概率,按照預設的函數(shù)關系,計算深度 包檢測識別庫中的所有協(xié)議特征信息在不同排列順序對應的外部性能指數(shù),將所述外部性 能指數(shù)最低的排列順序確定為優(yōu)化序列;或根據所述協(xié)議特征信息的性能指數(shù)和所述識別概率,計算深度包檢測識別庫中的所有 協(xié)議特征信息對應的內部性能指數(shù),將所有協(xié)議特征信息按照所述內部性能指數(shù)升序的排 列順序確定為優(yōu)化序列,所述內部性能指數(shù)為所述性能指數(shù)與其對應的識別成功概率的比 值或所述性能指數(shù)與其對應的識別失敗概率的乘積。
6.根據權利要求1-5任一所述的協(xié)議識別方法,其特征在于,還包括預先設定所述預設統(tǒng)計策略,所述預設統(tǒng)計策略包括設定時間段、設定區(qū)域和協(xié)議新 舊程度中的任意一種。
7.一種協(xié)議識別方法,其特征在于,包括根據協(xié)議特征信息所具有的特征條件,獲取所述協(xié)議特征信息的性能指數(shù),所述性能 指數(shù)表示成功識別所述協(xié)議所消耗資源的能力;根據所述協(xié)議特征信息的性能指數(shù),確定深度包檢測識別庫中的協(xié)議特征信息的優(yōu)化 序列,所述優(yōu)化序列用于確定對后續(xù)接收到的報文進行識別所采用的協(xié)議特征信息的先后 順序;按照所述優(yōu)化序列,對后續(xù)接收到的報文進行協(xié)議識別。
8.根據權利要求7所述的協(xié)議識別方法,其特征在于,所述根據協(xié)議特征信息所具有 的特征條件,獲取所述協(xié)議特征信息的性能指數(shù),包括獲取每條協(xié)議特征信息中所有特征條件的性能指數(shù);按照設定算法對所有特征條件的性能指數(shù)進行計算,得到協(xié)議特征信息的性能指數(shù)。
9.一種協(xié)議識別裝置,其特征在于,包括識別概率統(tǒng)計模塊,用于根據對已接收的報文進行深度包檢測的識別結果,統(tǒng)計所述 深度包檢測所采用的協(xié)議特征信息的識別概率,所述識別概率表示協(xié)議特征信息根據預設 統(tǒng)計策略是否被采用的概率;優(yōu)化序列確定模塊,用于根據所述識別概率的大小,確定深度包檢測識別庫中的協(xié)議 特征信息的優(yōu)化序列,所述優(yōu)化序列用于確定對后續(xù)接收到的報文進行識別所采用的協(xié)議 特征信息的先后順序;協(xié)議識別模塊,用于按照所述優(yōu)化序列,對后續(xù)接收到的報文進行協(xié)議識別。
10.根據權利要求9所述的協(xié)議識別裝置,其特征在于,還包括性能指數(shù)獲取模塊,用于根據協(xié)議特征信息所具有的特征條件,獲取所述協(xié)議特征信 息的性能指數(shù),所述性能指數(shù)表示成功識別所述協(xié)議所消耗資源的能力;和/或統(tǒng)計策略設定模塊,用于預先設定所述預設統(tǒng)計策略,所述預設統(tǒng)計策略包括設定時 間段、設定區(qū)域和協(xié)議新舊程度中的任意一種。
11.根據權利要求10所述的協(xié)議識別裝置,其特征在于,所述性能指數(shù)獲取模塊包括 特征條件子模塊,用于獲取每條協(xié)議特征信息中所有特征條件的性能指數(shù);協(xié)議特征信息子模塊,用于按照設定算法對所有特征條件的性能指數(shù)進行計算,得到 協(xié)議特征信息的性能指數(shù)。
12.根據權利要求9所述的協(xié)議識別裝置,其特征在于,所述識別概率統(tǒng)計模塊還包括第一統(tǒng)計子模塊,用于根據對已接收的報文進行深度包檢測的識別結果,統(tǒng)計所述深 度包檢測所采用的協(xié)議特征信息在預設統(tǒng)計策略的識別成功概率;和/或第二統(tǒng)計子模塊,用于根據對已接收的報文進行深度包檢測的識別結果,統(tǒng)計所述深 度包檢測所采用的協(xié)議特征信息在預設統(tǒng)計策略的識別失敗概率。
13.根據權利要求9所述的協(xié)議識別裝置,其特征在于,所述優(yōu)化序列確定模塊包括 第一確定子模塊,用于根據所述協(xié)議特征信息的性能指數(shù)和所述識別概率,按照預設的函數(shù)關系,計算深度包檢測識別庫中的所有協(xié)議特征信息在不同排列順序對應的外部性 能指數(shù),將所述外部性能指數(shù)最低的排列順序確定為優(yōu)化序列;和/或第二確定子模塊,用于根據所述協(xié)議特征信息的性能指數(shù)和所述識別概率,計算深度 包檢測識別庫中的所有協(xié)議特征信息對應的內部性能指數(shù),將所有協(xié)議特征信息按照所述 內部性能指數(shù)升序的排列順序確定為優(yōu)化序列,所述內部性能指數(shù)為所述性能指數(shù)與其對 應的識別成功概率的比值或所述性能指數(shù)與其對應的識別失敗概率的乘積。
14.一種協(xié)議識別裝置,其特征在于,包括性能指數(shù)獲取模塊,用于根據協(xié)議特征信息所具有的特征條件,獲取所述協(xié)議特征信 息的性能指數(shù),所述性能指數(shù)表示成功識別所述協(xié)議所消耗資源的能力;優(yōu)化序列確定模塊,用于根據所述協(xié)議特征信息的性能指數(shù),確定深度包檢測識別庫中的協(xié)議特征信息的優(yōu)化序列,所述優(yōu)化序列用于確定對后續(xù)接收到的報文進行識別所采 用的協(xié)議特征信息的先后順序;協(xié)議識別模塊,用于按照所述優(yōu)化序列,對后續(xù)接收到的報文進行協(xié)議識別。
15.根據權利要求14所述的協(xié)議識別裝置,其特征在于,所述性能指數(shù)獲取模塊包括 特征條件子模塊,用于獲取每條協(xié)議特征信息中所有特征條件的性能指數(shù); 協(xié)議特征信息子模塊,用于按照設定算法對所有特征條件的性能指數(shù)進行計算,得到 協(xié)議特征信息的性能指數(shù)。
全文摘要
本發(fā)明公開了一種協(xié)議識別方法和裝置。其中,該協(xié)議識別方法包括根據協(xié)議特征信息的特征條件,獲取所述協(xié)議特征信息的性能指數(shù);根據深度包檢測的識別結果,統(tǒng)計所述深度包檢測所采用的協(xié)議特征信息在預設統(tǒng)計策略的識別概率;根據所述協(xié)議特征信息的性能指數(shù)和識別概率,確定深度包檢測識別庫中所有的協(xié)議特征信息的優(yōu)化序列;按照所述優(yōu)化序列,對接收到的報文進行協(xié)議識別。本發(fā)明實施例根據預設統(tǒng)計策略的識別概率,可以確定協(xié)議識別的優(yōu)化序列,可以將匹配成功概率大的協(xié)議特征信息優(yōu)先匹配,將匹配失敗概率大的協(xié)議特征信息后續(xù)匹配,提升協(xié)議匹配性能。
文檔編號H04L29/06GK102045347SQ20101056758
公開日2011年5月4日 申請日期2010年11月30日 優(yōu)先權日2010年11月30日
發(fā)明者王文學, 黃家星 申請人:華為技術有限公司