本發(fā)明涉及通信技術(shù)領(lǐng)域,具體涉及近似匹配方法和相關(guān)設(shè)備及通信系統(tǒng)。
背景技術(shù):當(dāng)前,寬帶業(yè)務(wù)給運(yùn)營(yíng)商帶來機(jī)遇的同時(shí)也帶來了挑戰(zhàn),運(yùn)營(yíng)商需要面對(duì)例如帶寬管理、內(nèi)容計(jì)費(fèi)、信息安全等一系列新的課題。其中,面對(duì)日益增長(zhǎng)的業(yè)務(wù)流,深層包檢測(cè)(DPI,DeepPacketInspection)技術(shù)被認(rèn)為是應(yīng)對(duì)網(wǎng)絡(luò)多業(yè)務(wù)所帶來的管理和控制挑戰(zhàn)的有效方法。區(qū)域流量覆蓋是衡量DPI能力的重要指標(biāo)。而隨著智能手機(jī)等智能終端的普及,應(yīng)用數(shù)量出現(xiàn)井噴式增長(zhǎng)。并且越來越多的應(yīng)用(如Skype、Vbuzzer等應(yīng)用)經(jīng)常通過自動(dòng)改變自身的流量特征來逃避DPI廠商的檢測(cè),包括行為特征變種、二進(jìn)制變化、混合流量、隨機(jī)長(zhǎng)度添加等流量特征改變方式。面對(duì)新應(yīng)用產(chǎn)生的未知流量的挑戰(zhàn),業(yè)界目前普遍采取捕獲現(xiàn)網(wǎng)流量+人工分析的方式進(jìn)行分析。在對(duì)現(xiàn)有技術(shù)的研究和實(shí)踐過程中,本發(fā)明的發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)通常存在如下一些缺點(diǎn):現(xiàn)有人工分析方式效率較低、響應(yīng)速度較慢,難以及時(shí)滿足運(yùn)營(yíng)商對(duì)現(xiàn)網(wǎng)覆蓋率的要求,難以支撐新應(yīng)用流量的分析和識(shí)別;精準(zhǔn)度也難以滿足精細(xì)化業(yè)務(wù)需求。
技術(shù)實(shí)現(xiàn)要素:本發(fā)明實(shí)施例提供近似匹配方法和相關(guān)設(shè)備及通信系統(tǒng),以期待提高流量分析的效率和準(zhǔn)確性。本發(fā)明第一方面提供一種近似匹配方法,可包括:獲取未知流量;按照N個(gè)維度分別計(jì)算所述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到所述未知流量與樣本流量的匹配相似度,其中,所述N為大于或等于2的整數(shù),其中,所述N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度、與流量自身相關(guān)的n3個(gè)維度,其中,所述n1、n2、n3為正整數(shù)。結(jié)合第一方面,在第一種可能的實(shí)施方式中,所述按照N個(gè)維度分別計(jì)算所述未知流量與樣本流量的相似度包括:當(dāng)基于深層包檢測(cè)技術(shù)未能識(shí)別出所述未知流量時(shí),按照所述N個(gè)維度分別計(jì)算所述未知流量與樣本流量的相似度。結(jié)合第一方面或第一方面的第一種可能的實(shí)施方式,在第二種可能的實(shí)施方式中,所述按照N個(gè)維度分別計(jì)算所述未知流量與樣本流量的相似度,包括:執(zhí)行如下相似度計(jì)算操作中的至少兩種:計(jì)算所述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度、計(jì)算所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度、計(jì)算所述未知流量與樣本流量的報(bào)文端口號(hào)的相似度、計(jì)算所述未知流量與樣本流量的發(fā)包速率的相似度、計(jì)算所述未知流量與樣本流量的上行包數(shù)量的相似度、計(jì)算所述未知流量與樣本流量的下行包數(shù)量的相似度、計(jì)算所述未知流量與樣本流量的上下行包數(shù)量比值的相似度、計(jì)算所述未知流量與樣本流量的上行流量值的相似度、計(jì)算所述未知流量與樣本流量的下行流量值的相似度、計(jì)算所述未知流量與樣本流量的上下行流量值的比值的相似度、計(jì)算所述未知流量與樣本流量的前M個(gè)包的流量值的相似度。結(jié)合第一方面的第二種可能的實(shí)施方式,在第三種可能的實(shí)施方式中,所述計(jì)算所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度,包括:計(jì)算所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的字符相似度;計(jì)算所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的匹配度;計(jì)算所述匹配度的平方根與所述字符相似度的乘積,其中,計(jì)算得到的所述乘積為所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度,其中,所述字符相似度等于所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相同字符數(shù),除以所述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);所述匹配度等于1減去所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的區(qū)別度,其中,所述區(qū)別度等于所述樣本流量的報(bào)文負(fù)載內(nèi)容中與所述未知流量不相同的字符數(shù),除以所述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù)。結(jié)合第一方面的第二種可能的實(shí)施方式或第一方面的第三種可能的實(shí)施方式,在第四種可能的實(shí)施方式中,所述計(jì)算所述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度,包括:將所述未知流量的報(bào)文長(zhǎng)度除以所述樣本流量的報(bào)文長(zhǎng)度以得到商,其中,所述商為所述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度;或者,確定所述未知流量的報(bào)文長(zhǎng)度所落入的第一長(zhǎng)度區(qū)域,根據(jù)長(zhǎng)度區(qū)域與相似度值的對(duì)應(yīng)關(guān)系,確定出所述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值,其中,所述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值為所述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度。本發(fā)明第二方面提供一種近似匹配裝置,包括:獲取單元,用于獲取未知流量;相似度計(jì)算單元,用于按照N個(gè)維度,分別計(jì)算樣本流量與所述獲取單元獲取的所述未知流量與的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào),以得到所述未知流量與樣本流量的匹配相似度,其中,所述N為大于或等于2的整數(shù),其中,所述N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度、與流量自身相關(guān)的n3個(gè)維度,所述n1、n2、n3為正整數(shù)。結(jié)合第二方面,在第一種可能的實(shí)施方式中,所述相似度計(jì)算單元,具體用于當(dāng)基于深層包檢測(cè)技術(shù)未能識(shí)別出所述未知流量時(shí),按照N個(gè)維度分別計(jì)算所述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào),以得到所述未知流量與樣本流量的匹配相似度,其中,所述N為大于或等于2的整數(shù),其中,所述N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度、與流量自身相關(guān)的n3個(gè)維度,所述n1、n2、n3為正整數(shù)。結(jié)合第二方面或第二方面的第一種可能的實(shí)施方式,在第二種可能的實(shí)施方式中,在所述按照所述N個(gè)維度分別計(jì)算所述未知流量與樣本流量的相似度的方面,所述相似度計(jì)算單元具體用于,執(zhí)行如下相似度計(jì)算操作中的至少兩種:計(jì)算所述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度、計(jì)算所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度、計(jì)算所述未知流量與樣本流量的報(bào)文端口號(hào)的相似度、計(jì)算所述未知流量與樣本流量的發(fā)包速率的相似度、計(jì)算所述未知流量與樣本流量的上行包數(shù)量的相似度、計(jì)算所述未知流量與樣本流量的下行包數(shù)量的相似度、計(jì)算所述未知流量與樣本流量的上下行包數(shù)量比值的相似度、計(jì)算所述未知流量與樣本流量的上行流量值的相似度、計(jì)算所述未知流量與樣本流量的下行流量值的相似度、計(jì)算所述未知流量與樣本流量的上下行流量值的比值的相似度、計(jì)算所述未知流量與樣本流量的前M個(gè)包的流量值的相似度,對(duì)計(jì)算得到的至少兩種的相似度進(jìn)行加權(quán)調(diào),以得到所述未知流量與樣本流量的匹配相似度。結(jié)合第二方面的第二種可能的實(shí)施方式,在第三種可能的實(shí)施方式中,在所述計(jì)算所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,所述相似度計(jì)算單元具體用于,計(jì)算所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的字符相似度;計(jì)算所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的匹配度;計(jì)算所述匹配度的平方根與所述字符相似度的乘積,其中,計(jì)算得到的所述乘積為所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度,其中,所述字符相似度等于所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相同字符數(shù),除以所述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);所述匹配度等于1減去所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的區(qū)別度,其中,所述區(qū)別度等于所述樣本流量的報(bào)文負(fù)載內(nèi)容中與所述未知流量不相同的字符數(shù),除以所述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù)。結(jié)合第二方面的第二種可能的實(shí)施方式,在第四種可能的實(shí)施方式中,在所述計(jì)算所述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度的方面,所述相似度計(jì)算單元具體用于,將所述未知流量的報(bào)文長(zhǎng)度除以所述樣本流量的報(bào)文長(zhǎng)度以得到商,其中,所述商為所述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度;或者,確定所述未知流量的報(bào)文長(zhǎng)度所落入的第一長(zhǎng)度區(qū)域,根據(jù)長(zhǎng)度區(qū)域與相似度值的對(duì)應(yīng)關(guān)系,確定出所述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值,其中,所述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值為所述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度。本發(fā)明第三方面提供一種流量分析服務(wù)器,可包括:深層包檢測(cè)識(shí)別系統(tǒng),用于獲取未知流量,基于深層包檢測(cè)技術(shù)對(duì)所述未知流量進(jìn)行識(shí)別;近似匹配系統(tǒng),用于當(dāng)所述深層包檢測(cè)識(shí)別系統(tǒng)基于深層包檢測(cè)技術(shù)未能識(shí)別出所述未知流量時(shí),按照N個(gè)維度分別計(jì)算所述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到所述未知流量與樣本流量的匹配相似度,其中,所述N為大于或等于2的整數(shù),所述N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度、與流量自身相關(guān)的n3個(gè)維度,所述n1、n2、n3為正整數(shù)。結(jié)合第三方面,在第一種可能的實(shí)施方式中,在所述按照N個(gè)維度分別計(jì)算所述未知流量與樣本流量的相似度的方面,所述近似匹配系統(tǒng)具體用于,執(zhí)行如下相似度計(jì)算操作中的至少兩種:計(jì)算所述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度、計(jì)算所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度、計(jì)算所述未知流量與樣本流量的報(bào)文端口號(hào)的相似度、計(jì)算所述未知流量與樣本流量的發(fā)包速率的相似度、計(jì)算所述未知流量與樣本流量的上行包數(shù)量的相似度、計(jì)算所述未知流量與樣本流量的下行包數(shù)量的相似度、計(jì)算所述未知流量與樣本流量的上下行包數(shù)量比值的相似度、計(jì)算所述未知流量與樣本流量的上行流量值的相似度、計(jì)算所述未知流量與樣本流量的下行流量值的相似度、計(jì)算所述未知流量與樣本流量的上下行流量值的比值的相似度、計(jì)算所述未知流量與樣本流量的前M個(gè)包的流量值的相似度。結(jié)合第三方面的第二種可能的實(shí)施方式,在第三種可能的實(shí)施方式中,在所述計(jì)算所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,所述近似匹配系統(tǒng)具體用于:計(jì)算所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的字符相似度;計(jì)算所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的匹配度;計(jì)算所述匹配度的平方根與所述字符相似度的乘積,其中,計(jì)算得到的所述乘積為所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度,其中,所述字符相似度等于所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相同字符數(shù),除以所述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);所述匹配度等于1減去所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的區(qū)別度,其中,所述區(qū)別度等于所述樣本流量的報(bào)文負(fù)載內(nèi)容中與所述未知流量不相同的字符數(shù),除以所述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);和/或,在所述計(jì)算所述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度的方面,所述近似匹配系統(tǒng)具體用于:將所述未知流量的報(bào)文長(zhǎng)度除以所述樣本流量的報(bào)文長(zhǎng)度以得到商,其中,所述商為所述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度;或者,確定所述未知流量的報(bào)文長(zhǎng)度所落入的第一長(zhǎng)度區(qū)域,根據(jù)長(zhǎng)度區(qū)域與相似度值的對(duì)應(yīng)關(guān)系,確定出所述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值,其中所述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值為所述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度。本發(fā)明第四方面提供一種通信系統(tǒng),可包括:通信網(wǎng)元和流量分析服務(wù)器,其中,所述通信網(wǎng)元用于接收未知流量;所述流量分析服務(wù)器用于,獲取所述通信網(wǎng)元接收的未知流量或者獲取所述通信網(wǎng)元接收的未知流量的鏡像,基于深層包檢測(cè)技術(shù)對(duì)所述未知流量或者所述未知流量的鏡像進(jìn)行識(shí)別;當(dāng)基于深層包檢測(cè)技術(shù)未能識(shí)別出所述未知流量或未知流量的鏡像時(shí),按照N個(gè)維度分別計(jì)算所述未知流量或未知流量的鏡像與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到所述未知流量或未知流量的鏡像與樣本流量的匹配相似度,其中,所述N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度、與流量自身相關(guān)的n3個(gè)維度,其中,所述n1、n2、n3為正整數(shù)。結(jié)合第四方面,在第一種可能的實(shí)施方式中,在所述按照N個(gè)維度分別計(jì)算所述未知流量或所述未知流量的鏡像與樣本流量的相似度的方面,所述流量分析服務(wù)器具體用于:執(zhí)行如下相似度計(jì)算操作中的至少兩種:計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文端口號(hào)的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的發(fā)包速率的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的上行包數(shù)量的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的下行包數(shù)量的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的上下行包數(shù)量比值的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的上行流量值的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的下行流量值的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的上下行流量值的比值的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的前M個(gè)包的流量值的相似度。結(jié)合第四方面的第一種可能的實(shí)施方式,在第二種可能的實(shí)施方式中,在所述計(jì)算所述未知流量或所述未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,所述流量分析服務(wù)器具體用于:計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的字符相似度;計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的匹配度;計(jì)算所述匹配度的平方根與所述字符相似度的乘積,其中,計(jì)算得到的所述乘積為所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度,其中,所述字符相似度等于所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相同字符數(shù),除以所述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);所述匹配度等于1減去所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的區(qū)別度,其中,所述區(qū)別度等于所述樣本流量的報(bào)文負(fù)載內(nèi)容中與所述未知流量或未知流量的鏡像不相同的字符數(shù),除以所述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);和/或,在所述計(jì)算所述未知流量或所述未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度的方面,所述流量分析服務(wù)器具體用于:將所述未知流量或未知流量的鏡像的報(bào)文長(zhǎng)度除以所述樣本流量的報(bào)文長(zhǎng)度以得到商,其中,所述商為所述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度;或者,確定所述未知流量或未知流量的鏡像的報(bào)文長(zhǎng)度所落入的第一長(zhǎng)度區(qū)域,根據(jù)長(zhǎng)度區(qū)域與相似度值的對(duì)應(yīng)關(guān)系,確定出所述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值,其中,所述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值為所述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度。本發(fā)明第五方面提供一種通信系統(tǒng),包括:通信網(wǎng)元和近似匹配服務(wù)器,其中,所述通信網(wǎng)元用于接收未知流量,基于深層包檢測(cè)技術(shù)對(duì)所述未知流量進(jìn)行識(shí)別,若未能識(shí)別出所述未知流量,向所述近似匹配服務(wù)器發(fā)送未能識(shí)別出的所述未知流量或者所述未能識(shí)別出的所述未知流量的鏡像;所述近似匹配服務(wù)器用于,接收來自所述通信網(wǎng)元的所述未能識(shí)別出的所述未知流量或所述未知流量的鏡像,按照N個(gè)維度分別計(jì)算所述未知流量或所述未知流量的鏡像與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到所述未知流量或所述未知流量的鏡像與樣本流量的匹配相似度,其中,所述N為大于或等于2的整數(shù),其中,所述N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度、與流量自身相關(guān)的n3個(gè)維度,所述n1、n2、n3為正整數(shù)。結(jié)合第五方面,在第一種可能的實(shí)施方式中,在所述按照N個(gè)維度分別計(jì)算所述未知流量或所述未知流量的鏡像與樣本流量的相似度的方面,所述近似匹配服務(wù)器具體用于,執(zhí)行如下相似度計(jì)算操作中的至少兩種:計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文端口號(hào)的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的發(fā)包速率的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的上行包數(shù)量的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的下行包數(shù)量的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的上下行包數(shù)量比值的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的上行流量值的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的下行流量值的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的上下行流量值的比值的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的前M個(gè)包的流量值的相似度。結(jié)合第五方面的第一種可能的實(shí)施方式,在第二種可能的實(shí)施方式中,在所述計(jì)算所述未知流量或所述未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,所述近似匹配服務(wù)器具體用于,計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的字符相似度;計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的匹配度;計(jì)算所述匹配度的平方根與所述字符相似度的乘積,其中,計(jì)算得到的所述乘積為所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度,其中,所述字符相似度等于所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相同字符數(shù),除以所述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);所述匹配度等于1減去所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的區(qū)別度,其中,所述區(qū)別度等于所述樣本流量的報(bào)文負(fù)載內(nèi)容中與所述未知流量或未知流量的鏡像不相同的字符數(shù),除以所述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);和/或,在所述計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度的方面,所述近似匹配服務(wù)器具體用于,將所述未知流量或未知流量的鏡像的報(bào)文長(zhǎng)度除以所述樣本流量的報(bào)文長(zhǎng)度以得到商,其中,所述商為所述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度;或者,確定所述未知流量或未知流量的鏡像的報(bào)文長(zhǎng)度所落入的第一長(zhǎng)度區(qū)域,根據(jù)長(zhǎng)度區(qū)域與相似度值的對(duì)應(yīng)關(guān)系,確定出所述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值,其中,所述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值為所述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度。本發(fā)明第六方面提供一種通信系統(tǒng),可包括:通信網(wǎng)元和深層包檢測(cè)識(shí)別服務(wù)器,其中,所述通信網(wǎng)元,用于接收未知流量;所述深層包檢測(cè)識(shí)別服務(wù)器,用于獲取所述通信網(wǎng)元接收的未知流量或者獲取所述通信網(wǎng)元接收的未知流量的鏡像;基于深層包檢測(cè)技術(shù)對(duì)來自所述通信網(wǎng)元的所述未知流量或未知流量的鏡像進(jìn)行識(shí)別,若未能識(shí)別出所述未知流量或未知流量的鏡像,向所述通信網(wǎng)元發(fā)送未能識(shí)別出的所述未知流量或所述未能識(shí)別出的所述未知流量的鏡像;所述通信網(wǎng)元還用于,接收來自所述深層包檢測(cè)識(shí)別服務(wù)器的所述未能識(shí)別出的所述未知流量或所述未能識(shí)別出的所述未知流量的鏡像,按照N個(gè)維度分別計(jì)算所述未知流量或未知流量的鏡像與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到所述未知流量或未知流量的鏡像與樣本流量的匹配相似度,其中,所述N為大于或等于2的整數(shù),其中,所述N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度、與流量自身相關(guān)的n3個(gè)維度,其中,所述n1、n2、n3為正整數(shù)。結(jié)合第六方面,在第一種可能的實(shí)施方式中,在所述按照N個(gè)維度分別計(jì)算所述未知流量或未知流量的鏡像與樣本流量的相似度的方面,所述通信網(wǎng)元具體用于:執(zhí)行如下相似度計(jì)算操作中的至少兩種:計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文端口號(hào)的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的發(fā)包速率的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的上行包數(shù)量的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的下行包數(shù)量的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的上下行包數(shù)量比值的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的上行流量值的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的下行流量值的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的上下行流量值的比值的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的前M個(gè)包的流量值的相似度。結(jié)合第六方面的第一種可能的實(shí)施方式,在第二種可能的實(shí)施方式中,在所述計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,所述通信網(wǎng)元具體用于:計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的字符相似度;計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的匹配度;計(jì)算所述匹配度的平方根與所述字符相似度的乘積,其中,計(jì)算得到的所述乘積為所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度,其中,所述字符相似度等于所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相同字符數(shù),除以所述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);所述匹配度等于1減去所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的區(qū)別度,其中,所述區(qū)別度等于所述樣本流量的報(bào)文負(fù)載內(nèi)容中與所述未知流量或未知流量的鏡像不相同的字符數(shù),除以所述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);和/或,在所述計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度的方面,所述通信網(wǎng)元具體用于:將所述未知流量或未知流量的鏡像的報(bào)文長(zhǎng)度除以所述樣本流量的報(bào)文長(zhǎng)度以得到商,其中,所述商為所述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度;或者,確定所述未知流量或未知流量的鏡像的報(bào)文長(zhǎng)度所落入的第一長(zhǎng)度區(qū)域,根據(jù)長(zhǎng)度區(qū)域與相似度值的對(duì)應(yīng)關(guān)系,確定出所述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值,其中,所述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值為所述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度。本發(fā)明第七方面提供一種通信系統(tǒng),可包括:通信網(wǎng)元、深層包檢測(cè)識(shí)別服務(wù)器和近似匹配服務(wù)器,其中,所述通信網(wǎng)元,用于接收未知流量;所述深層包檢測(cè)識(shí)別服務(wù)器,用于獲取所述通信網(wǎng)元接收的未知流量或者獲取所述通信網(wǎng)元接收的未知流量的鏡像;基于深層包檢測(cè)技術(shù)對(duì)所述通信網(wǎng)元接收的所述未知流量或未知流量的鏡像進(jìn)行識(shí)別,若未能識(shí)別出所述未知流量或未知流量的鏡像,向所述近似匹配服務(wù)器發(fā)送所述未能識(shí)別出的所述未知流量或所述未能識(shí)別出的所述未知流量的鏡像;所述近似匹配服務(wù)器用于,接收來自所述深層包檢測(cè)識(shí)別服務(wù)器的所述未能識(shí)別出的所述未知流量或者所述未能識(shí)別出的所述未知流量的鏡像,按照N個(gè)維度分別計(jì)算所述未知流量或者未知流量的鏡像與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到所述未知流量或未知流量的鏡像與樣本流量的匹配相似度,其中,所述N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度、與流量自身相關(guān)的n3個(gè)維度,其中,所述N為大于或等于2的整數(shù),所述n1、n2、n3為正整數(shù)。結(jié)合第七方面,在第一種可能的實(shí)施方式中,在所述按照N個(gè)維度分別計(jì)算所述未知流量或未知流量的鏡像與樣本流量的相似度的方面,所述近似匹配服務(wù)器具體用于:執(zhí)行如下相似度計(jì)算操作中的至少兩種:計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文端口號(hào)的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的發(fā)包速率的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的上行包數(shù)量的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的下行包數(shù)量的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的上下行包數(shù)量比值的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的上行流量值的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的下行流量值的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的上下行流量值的比值的相似度、計(jì)算所述未知流量或未知流量的鏡像與樣本流量的前M個(gè)包的流量值的相似度。結(jié)合第七方面的第一種可能的實(shí)施方式,在第二種可能的實(shí)施方式中,在所述計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,所述近似匹配服務(wù)器具體用于,計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的字符相似度;計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的匹配度;計(jì)算所述匹配度的平方根與所述字符相似度的乘積,其中,計(jì)算得到的所述乘積為所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度,其中,所述字符相似度等于所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相同字符數(shù),除以所述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);所述匹配度等于1減去所述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的區(qū)別度,其中,所述區(qū)別度等于所述樣本流量的報(bào)文負(fù)載內(nèi)容中與所述未知流量或未知流量的鏡像不相同的字符數(shù),除以所述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);和/或,在所述計(jì)算所述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度的方面,所述近似匹配服務(wù)器具體用于:將所述未知流量或未知流量的鏡像的報(bào)文長(zhǎng)度除以所述樣本流量的報(bào)文長(zhǎng)度以得到商,其中,所述商為所述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度;或者,確定所述未知流量或未知流量的鏡像的報(bào)文長(zhǎng)度所落入的第一長(zhǎng)度區(qū)域,根據(jù)長(zhǎng)度區(qū)域與相似度值的對(duì)應(yīng)關(guān)系,確定出所述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值,其中,所述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值為所述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度。本發(fā)明第八方面提供一種流量分析服務(wù)器,所述流量分析服務(wù)器包括:用于接收未知流量或未知流量的鏡像的接收器,與所述接收器耦合的近似識(shí)別引擎,以及用于發(fā)送所述未知流量或未知流量的鏡像或所述近似識(shí)別引擎輸出的所述未知流量或未知流量的鏡像與樣本流量的匹配相似度的發(fā)送器,其中,所述近似識(shí)別引擎為如上述實(shí)施例所述的近似匹配裝置。本發(fā)明第九方面提供一種通信網(wǎng)元,包括收發(fā)信機(jī)和與所述收發(fā)信機(jī)耦合的用于進(jìn)行網(wǎng)絡(luò)通信的處理器,其特征在于,所述通信設(shè)備還包括:與所述收發(fā)信機(jī)耦合的近似識(shí)別引擎,其中,所述近似識(shí)別引擎為如上述實(shí)施例所述的近似匹配裝置。由上可見,本發(fā)明一個(gè)實(shí)施例的方案中,在獲取未知流量后按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到未知流量與樣本流量的匹配相似度,其中,N為大于或等于2的整數(shù)。由于本發(fā)明一個(gè)實(shí)施例提供了一種可利用流量分析設(shè)備來進(jìn)行近似流量分析的機(jī)制,有利于提高流量分析的效率;由于是按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度,并對(duì)N個(gè)維度得到的相似度進(jìn)行綜合,N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度,相對(duì)于常規(guī)單維度匹配機(jī)制,本發(fā)明實(shí)施例提出的技術(shù)方案從與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度等極具代表性的維度中選擇N個(gè)維度來進(jìn)行組合分析,這有利于極大的提高流量分析的準(zhǔn)確性,進(jìn)而有利于為相關(guān)業(yè)務(wù)計(jì)費(fèi)提供有效支撐。附圖說明為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本發(fā)明實(shí)施例提供的一種近似匹配方法的流程示意圖;圖2-a是本發(fā)明實(shí)施例提供的一種流量分析設(shè)備所處的網(wǎng)絡(luò)架構(gòu)示意圖;圖2-b是本發(fā)明實(shí)施例提供的一種近似匹配系統(tǒng)和DPI識(shí)別系統(tǒng)的部署示意圖;圖2-c是本發(fā)明實(shí)施例提供的另一種近似匹配系統(tǒng)和DPI識(shí)別系統(tǒng)的部署示意圖;圖2-d是本發(fā)明實(shí)施例提供的另一種近似匹配系統(tǒng)和DPI識(shí)別系統(tǒng)的部署示意圖;圖3是本發(fā)明實(shí)施例提供的另一種流量分析方法的流程示意圖;圖4-a是本發(fā)明實(shí)施例提供的一種樣本流量的端口號(hào)分布的示意圖;圖4-b是本發(fā)明實(shí)施例提供的一種樣本流量的報(bào)文長(zhǎng)度的分布示意圖;圖4-c是本發(fā)明實(shí)施例提供的另一種樣本流量的報(bào)文長(zhǎng)度的分布示意圖;圖4-d是本發(fā)明實(shí)施例提供的一種樣本流量的發(fā)包速率的分布示意圖;圖4-e是本發(fā)明實(shí)施例提供的另一種樣本流量的發(fā)包速率的分布示意圖;圖5是本發(fā)明實(shí)施例提供的一種近似匹配服務(wù)器的示意圖;圖6是本發(fā)明實(shí)施例提供的另一種近似匹配服務(wù)器的示意圖;圖7是本發(fā)明實(shí)施例提供的一種通信系統(tǒng)的示意圖;圖8是本發(fā)明實(shí)施例提供的一種流量分析服務(wù)器的示意圖;圖9是本發(fā)明實(shí)施例提供的另一種通信系統(tǒng)的示意圖;圖10是本發(fā)明實(shí)施例提供的另一種通信系統(tǒng)的示意圖;圖11是本發(fā)明實(shí)施例提供的另一種通信系統(tǒng)的示意圖;圖12是本發(fā)明實(shí)施例提供的另一種通信系統(tǒng)的示意圖;圖13是本發(fā)明實(shí)施例提供的另一種近似匹配服務(wù)器的示意圖;圖14-a是本發(fā)明實(shí)施例提供的一種通信網(wǎng)元的示意圖;圖14-b是本發(fā)明實(shí)施例提供的另一種通信網(wǎng)元的示意圖;圖15-a是本發(fā)明實(shí)施例提供的一種流量識(shí)別服務(wù)器的示意圖;圖15-b是本發(fā)明實(shí)施例提供的另一種流量識(shí)別服務(wù)器的示意圖。具體實(shí)施方式本發(fā)明實(shí)施例提供近似匹配方法和相關(guān)設(shè)備及通信系統(tǒng),以期待提高流量分析的效率和準(zhǔn)確性。為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分的實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。以下分別進(jìn)行詳細(xì)說明。本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”、“第三”“第四”等(如果存在)是用于區(qū)別類似的對(duì)象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本發(fā)明的實(shí)施例例如能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外,術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。本發(fā)明近似匹配方法的一個(gè)實(shí)施例,一種近似匹配方法可包括:獲取未知流量;按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到上述未知流量與樣本流量的匹配相似度,其中,上述N為大于或等于2的整數(shù)。參見圖1,圖1是本發(fā)明的一個(gè)實(shí)施例提供的一種近似匹配方法的流程示意圖,如圖1所示,本發(fā)明的一個(gè)實(shí)施例提供的一種近似匹配方法可包括以下內(nèi)容:101、獲取未知流量。其中,用于實(shí)現(xiàn)近似匹配的設(shè)備或系統(tǒng)可從DPI服務(wù)器或網(wǎng)元(網(wǎng)元例如可為基站、基站控制器、網(wǎng)關(guān)、服務(wù)器等)獲取未知流量。102、按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到上述未知流量與樣本流量的匹配相似度,其中,上述N為大于或等于2的整數(shù)。其中,上述N個(gè)維度可包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度、與流量自身相關(guān)的n3個(gè)維度,其中,所述n1、n2、n3為正整數(shù)??梢岳斫?,上述未知流量與樣本流量的匹配相似度,等于對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和而得到的值,也就是說,匹配相似度是綜合N個(gè)維度對(duì)應(yīng)的相似度的結(jié)果,匹配相似度有利于更客觀準(zhǔn)確的反映未知流量與樣本流量的相似度。其中,與流量的報(bào)文相關(guān)的n1個(gè)維度是將流量中報(bào)文(例如報(bào)文頭和/或報(bào)文負(fù)載)作為分析角度的n1個(gè)維度,與流量的報(bào)文相關(guān)的n1個(gè)維度例如可包括:以流量中報(bào)文的長(zhǎng)度為維度、以流量中報(bào)文的負(fù)載內(nèi)容為維度、以流量中報(bào)文的端口號(hào)為維度等。其中,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度是將流量所對(duì)應(yīng)的會(huì)話作為分析角度的n2個(gè)維度,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度例如可包括:以流量所對(duì)應(yīng)會(huì)話的上行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的下行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的上下行包數(shù)量比值為維度、以流量所對(duì)應(yīng)會(huì)話的上行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的下行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的上下行流量值比值為維度等。與流量自身相關(guān)的n3個(gè)維度是將流量本身作為分析角度的n3個(gè)維度,這n3個(gè)維度與流量中各報(bào)文的負(fù)載無關(guān)、也與流量所對(duì)應(yīng)的會(huì)話無關(guān),與流量自身相關(guān)的n3個(gè)維度例如可包括以流量前M個(gè)包的流量值為維度、以流量的發(fā)包速率為維度等,以此類推。在本發(fā)明的一些實(shí)施例中,在按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度之前,可先基于DPI技術(shù)對(duì)獲取的未知流量進(jìn)行識(shí)別,若基于DPI技術(shù)識(shí)別出了上述未知流量,則可輸出DPI技術(shù)的識(shí)別結(jié)果;在基于上述DPI技術(shù)未能識(shí)別出上述未知流量之后,才執(zhí)行上述按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度的步驟。在本發(fā)明的一些實(shí)施例中,若得到的樣本流量與上述未知流量的匹配相似度大于設(shè)定的相似度閾值,則流量分析設(shè)備可輸出未知流量與樣本流量的匹配成功的流量識(shí)別結(jié)果(其中,該流量識(shí)別結(jié)果例如可指示出上述未知流量與樣本流量的業(yè)務(wù)類型相同等,此時(shí)可按照樣本流量的業(yè)務(wù)類型所對(duì)應(yīng)的套餐計(jì)費(fèi)方式對(duì)上述未知流量進(jìn)行計(jì)費(fèi)。例如存在Fk1套餐業(yè)務(wù),針對(duì)用戶所有訪問Fk1的流量免費(fèi),F(xiàn)k1的外掛視頻流量和廣告流量單獨(dú)計(jì)費(fèi),其它業(yè)務(wù)場(chǎng)景以此類推),此外,若得到的樣本流量與上述未知流量的匹配相似度小于設(shè)定的相似度閾值,則流量分析設(shè)備可輸出未知流量與樣本流量的匹配失敗的流量識(shí)別結(jié)果。其中,可根據(jù)實(shí)際需要來選著用于識(shí)別的維度,針對(duì)不同的應(yīng)用場(chǎng)景不同的精度要求,選擇的維度可能不盡相同。舉例來說,可以從下面舉例的幾個(gè)維度中選擇至少兩個(gè)維度來計(jì)算上述未知流量與樣本流量的相似度:報(bào)文負(fù)載內(nèi)容、報(bào)文長(zhǎng)度、報(bào)文端口號(hào)、發(fā)包速率、上行包數(shù)量、下行包數(shù)量、上下行包數(shù)量比值、上行流量值、下行流量值、上下行流量值的比值、前M個(gè)包的流量值等。當(dāng)然,本發(fā)明實(shí)施例并不限于上述舉例的相似度比較維度,其它維度亦可引入。在本發(fā)明的一些實(shí)施例中,上述按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度,包括:執(zhí)行如下相似度計(jì)算操作中的至少兩種:計(jì)算上述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度、計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度、計(jì)算上述未知流量與樣本流量的報(bào)文端口號(hào)的相似度、計(jì)算上述未知流量與樣本流量的發(fā)包速率的相似度、計(jì)算上述未知流量與樣本流量的上行包數(shù)量的相似度、計(jì)算上述未知流量與樣本流量的下行包數(shù)量的相似度、計(jì)算上述未知流量與樣本流量的上下行包數(shù)量比值的相似度、計(jì)算上述未知流量與樣本流量的上行流量值的相似度、計(jì)算上述未知流量與樣本流量的下行流量值的相似度、計(jì)算上述未知流量與樣本流量的上下行流量值的比值的相似度、計(jì)算上述未知流量與樣本流量的前M個(gè)包的流量值的相似度。在實(shí)際應(yīng)用中,可采用符合本領(lǐng)域計(jì)算邏輯的多種方式,按照相應(yīng)維度計(jì)算上述未知流量與樣本流量的相似度。例如,計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度可包括:計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的字符相似度;計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的匹配度;計(jì)算上述匹配度的平方根與上述字符相似度的乘積,其中,計(jì)算得到的上述乘積為上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度,其中,上述字符相似度等于上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相同字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);上述匹配度等于1減去上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的區(qū)別度,其中,上述區(qū)別度等于上述樣本流量的報(bào)文負(fù)載內(nèi)容中與上述未知流量不相同的字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù)。在本發(fā)明的一些實(shí)施例中,上述計(jì)算上述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度,例如可以包括:將上述未知流量的報(bào)文長(zhǎng)度除以上述樣本流量的報(bào)文長(zhǎng)度以得到商,其中,上述商為上述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度;或者,確定上述未知流量的報(bào)文長(zhǎng)度所落入的第一長(zhǎng)度區(qū)域,根據(jù)長(zhǎng)度區(qū)域與相似度值的對(duì)應(yīng)關(guān)系,確定出第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值,其中,第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值為上述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度。其中,其它維度的相似度計(jì)算方式可類推,此處不再一一舉例。如圖2-a所示,其中,通過部署,DIP識(shí)別系統(tǒng)可獲取網(wǎng)絡(luò)中的多種設(shè)備的流量。例如DIP識(shí)別系統(tǒng)可以是板卡或軟模塊,可將DIP識(shí)別系統(tǒng)嵌入到基站控制器、數(shù)據(jù)網(wǎng)關(guān)等網(wǎng)元中?;蛘逥IP識(shí)別系統(tǒng)可作為獨(dú)立設(shè)備,可采用外掛或串聯(lián)等方式接入網(wǎng)絡(luò)。例如圖2-a舉例所示,DIP識(shí)別系統(tǒng)可以以外掛或串聯(lián)等方式部署于網(wǎng)絡(luò)系統(tǒng)的多種位置(如基站、基站控制器、網(wǎng)關(guān)、服務(wù)器等位置)以便對(duì)需要分析的設(shè)備流量進(jìn)行分析。參見圖2-b、圖2-c和圖2-d,圖2-b、圖2-c和圖2-d舉例示出了DPI識(shí)別系統(tǒng)和近似匹配系統(tǒng)之間的部署位置關(guān)系。參見圖2-b和圖2-c,近似匹配系統(tǒng)和DPI識(shí)別系統(tǒng)可作為1個(gè)整體,當(dāng)然近似匹配系統(tǒng)和DPI識(shí)別系統(tǒng)亦可是兩個(gè)獨(dú)立設(shè)備,其中,近似匹配系統(tǒng)和DPI識(shí)別系統(tǒng)可和稱之為流量分析系統(tǒng)。其中,圖2-b示出一種近似匹配系統(tǒng)可與DPI識(shí)別系統(tǒng)跨接(旁路)的場(chǎng)景,近似匹配系統(tǒng)可將流量識(shí)別報(bào)告反饋給DPI識(shí)別系統(tǒng),由DPI識(shí)別系統(tǒng)統(tǒng)一向相關(guān)設(shè)備(例如計(jì)費(fèi)服務(wù)器等)上報(bào)流量識(shí)別報(bào)告,當(dāng)然近似匹配系統(tǒng)和DPI識(shí)別系統(tǒng)亦可獨(dú)自向相關(guān)設(shè)備(例如計(jì)費(fèi)服務(wù)器等)上報(bào)各自的流量識(shí)別報(bào)告(圖2-c所示)。其中,圖2-d示出一種近似匹配系統(tǒng)可與DPI識(shí)別系統(tǒng)集成在一起的場(chǎng)景,圖2-d中舉例示出近似匹配系統(tǒng)可與DPI識(shí)別系統(tǒng)集成在流量分析服務(wù)器之中??梢岳斫猓破ヅ湎到y(tǒng)和DPI識(shí)別系統(tǒng)中的至少一個(gè)可以集成在通信網(wǎng)元之中,當(dāng)然近似匹配系統(tǒng)和DPI識(shí)別系統(tǒng)亦可以是獨(dú)立于通信網(wǎng)元的設(shè)備。其中,流量識(shí)別報(bào)告可攜帶未知流量與樣本流量的匹配相似度,或者可攜帶未知流量與樣本流量是否匹配的指示信息(例如當(dāng)匹配相似度大于某設(shè)定閾值時(shí)表示未知流量與樣本流量匹配,當(dāng)匹配相似度小雨某設(shè)定閾值時(shí)表示未知流量與樣本流量不匹配),其中,接收到流量識(shí)別報(bào)告的相關(guān)設(shè)備(例如計(jì)費(fèi)服務(wù)器等)可基于流量識(shí)別報(bào)告來進(jìn)行相應(yīng)處理(例如流量計(jì)費(fèi)處理等)??梢岳斫獾氖牵鲜雠e例主要是針對(duì)某條未知流量和樣本流量來進(jìn)行匹配相似度計(jì)算的,對(duì)于存著多個(gè)樣本流量的場(chǎng)景,可按類似方式,分別計(jì)算未知流量和各個(gè)樣本流量的匹配相似度。同理,對(duì)應(yīng)存著多條未知流量的場(chǎng)景,亦可按類似方式,分別計(jì)算各未知流量和各樣本流量的匹配相似度,具體過程此處不再贅述。由上可見,本發(fā)明一個(gè)實(shí)施例的方案中,在獲取未知流量后按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到未知流量與樣本流量的匹配相似度,其中,N為大于或等于2的整數(shù)。由于提供了一種可利用流量分析設(shè)備來進(jìn)行近似流量分析的機(jī)制,有利于提高流量分析的效率;由于是按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度,并對(duì)N個(gè)維度得到的相似度進(jìn)行綜合,N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度,相對(duì)于常規(guī)單維度匹配機(jī)制,本發(fā)明實(shí)施例提出的技術(shù)方案從與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度等極具代表性的維度中選擇N個(gè)維度來進(jìn)行組合分析,這樣就有利于極大的提高流量分析的準(zhǔn)確性,進(jìn)而有利于為相關(guān)業(yè)務(wù)計(jì)費(fèi)提供有效支撐。為便于更好的理解和實(shí)施本發(fā)明實(shí)施例的上述方案,下面舉例一些應(yīng)用場(chǎng)景進(jìn)行說明。參見圖3,圖3是本發(fā)明的另一個(gè)實(shí)施例提供的另一種流量分析方法的流程示意圖,如圖3所示,本發(fā)明的另一個(gè)實(shí)施例提供的另一種流量分析方法可包括以下內(nèi)容:301、對(duì)網(wǎng)絡(luò)流量A(即:未知流量)進(jìn)行DPI識(shí)別。其中,DPI識(shí)別中以基于特征字的識(shí)別技術(shù)最為基礎(chǔ)、應(yīng)用最為廣泛。不同的應(yīng)用通常會(huì)采用不同的協(xié)議,而各種協(xié)議都有其特殊的指紋,這些指紋可能是特定的端口、特定的字符串或者特定的比特(Bit)序列。其中,基于特征字的識(shí)別技術(shù),正是通過識(shí)別網(wǎng)絡(luò)流量A的數(shù)據(jù)報(bào)文中的指紋信息來確定業(yè)務(wù)流所承載的應(yīng)用。根據(jù)具體檢測(cè)方式的不同,基于特征字的識(shí)別技術(shù)又可細(xì)分為固定位置特征字匹配、變動(dòng)位置特征字匹配和狀態(tài)特征字匹配三種分支技術(shù)。DPI識(shí)別的相關(guān)機(jī)制此處不再贅述。其中,若DPI識(shí)別成功,則執(zhí)行步驟306;若DPI識(shí)別失敗,則執(zhí)行步驟302。假設(shè),網(wǎng)絡(luò)流量A的特征如下:源端口1433、目的端口2457、源IP地址為192.168.1.2、目的IP地址為IP192.168.1.1、負(fù)載內(nèi)容為abefgabc785551……、負(fù)載長(zhǎng)度為97字節(jié)、發(fā)包速率為13ms、網(wǎng)絡(luò)流量A的協(xié)議為傳輸控制協(xié)議。302、獲取網(wǎng)絡(luò)流量A的端口號(hào)、報(bào)文長(zhǎng)度和負(fù)載內(nèi)容。303、分別按照端口號(hào)、報(bào)文長(zhǎng)度和負(fù)載內(nèi)容等三個(gè)維度計(jì)算出網(wǎng)絡(luò)流量A和樣本流量的相似度。假設(shè),樣本流量的負(fù)載內(nèi)容為aabcabce、偏移量為0、樣本流量由傳輸控制協(xié)議來承載,協(xié)議名為VoIPA。假設(shè),樣本流量的端口號(hào)分布情況例如圖4-a所示,圖4-a中橫坐標(biāo)表示端口號(hào),縱坐標(biāo)表示概率。樣本流量的報(bào)文長(zhǎng)度分布情況例如圖4-b和圖4-c所示,其中,圖4-b中橫坐標(biāo)表示流編號(hào),縱坐標(biāo)表示包長(zhǎng)度,圖4-c中橫坐標(biāo)表示上行包長(zhǎng)分段(圖中分為三段),縱坐標(biāo)左表示分段出現(xiàn)的頻率縱坐標(biāo)右表示分段所占百分比。樣本流量的發(fā)包速率分布情況例如圖4-d和圖4-e所示,其中,圖4-d中橫坐標(biāo)表示流編號(hào),縱坐標(biāo)表示發(fā)包速率,圖4-e中橫坐標(biāo)表示發(fā)包速率分段(圖中分為5段),縱坐標(biāo)左表示分段出現(xiàn)的頻率縱坐標(biāo)右表示分段所占百分比。在本發(fā)明的一些實(shí)施例中,可基于余弦定理計(jì)算網(wǎng)絡(luò)流量A和樣本流量的負(fù)載內(nèi)容的相似度。假設(shè),網(wǎng)絡(luò)流量A的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,比較兩個(gè)字符串的相似度sim(s1,s2),假設(shè)字符串s1和字符串s2中含有n個(gè)不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉(zhuǎn)換為對(duì)兩個(gè)字符串對(duì)應(yīng)的向量v1和v2之間夾角大小的判斷,余弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,網(wǎng)絡(luò)流量A和樣本流量的負(fù)載內(nèi)容相似度越大;相反,余弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,網(wǎng)絡(luò)流量A和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明的一些實(shí)施例中,也可基于最長(zhǎng)公共子串來計(jì)算網(wǎng)絡(luò)流量A和樣本流量負(fù)載內(nèi)容相似度。假設(shè),網(wǎng)絡(luò)流量A的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,可用一個(gè)矩陣來記錄兩個(gè)字符串中所有位置的兩個(gè)字符之間的匹配情況,若是匹配則為1,否則為0,然后,求出矩陣中對(duì)角線最長(zhǎng)的1個(gè)序列,其對(duì)應(yīng)的位置就是最長(zhǎng)匹配子串的位置,例如最長(zhǎng)公共子串越長(zhǎng),則表示兩個(gè)字符串的相似度越大,即,網(wǎng)絡(luò)流量A和樣本流量的負(fù)載內(nèi)容的相似度越大,相反,最長(zhǎng)公共子串越短,則可認(rèn)為兩個(gè)字符串的相似度越小,即,網(wǎng)絡(luò)流量A和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明的一些實(shí)施例中,也還可以基于如下方式來計(jì)算網(wǎng)絡(luò)流量A和樣本流量的負(fù)載內(nèi)容的相似度:計(jì)算網(wǎng)絡(luò)流量A與樣本流量的報(bào)文負(fù)載內(nèi)容的字符相似度;計(jì)算網(wǎng)絡(luò)流量A與樣本流量的報(bào)文負(fù)載內(nèi)容的匹配度;計(jì)算上述匹配度的平方根與上述字符相似度的乘積,將計(jì)算得到的上述乘積作為網(wǎng)絡(luò)流量A和樣本流量的報(bào)文負(fù)載內(nèi)容的相似度,其中,上述字符相似度等于網(wǎng)絡(luò)流量A與樣本流量的報(bào)文負(fù)載內(nèi)容的相同字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);上述匹配度等于1減去網(wǎng)絡(luò)流量A與樣本流量的報(bào)文負(fù)載內(nèi)容的區(qū)別度,其中,上述區(qū)別度等于上述樣本流量的報(bào)文負(fù)載內(nèi)容中與網(wǎng)絡(luò)流量A不相同的字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù)。當(dāng)然,計(jì)算網(wǎng)絡(luò)流量A和樣本流量負(fù)載內(nèi)容相似度的方式并限于上述舉例的方式。在本發(fā)明一些實(shí)施例中,可基于如下舉例的分段函數(shù)來計(jì)算網(wǎng)絡(luò)流量A和樣本流量的報(bào)文長(zhǎng)度的相似度:其中,基于上述分段函數(shù)可得到網(wǎng)絡(luò)流量A和樣本流量報(bào)文長(zhǎng)度的相似度為0.881,因?yàn)榫W(wǎng)絡(luò)流量A的報(bào)文長(zhǎng)度x落入了第一長(zhǎng)度區(qū)域[0,100],而第一長(zhǎng)度區(qū)域[0,100]對(duì)應(yīng)的相似度值等于0.881。其中,上述分段函數(shù)中用到分段可參考wireshark軟件中所使用的分類方法。當(dāng)然,計(jì)算網(wǎng)絡(luò)流量A和樣本流量的報(bào)文長(zhǎng)度的相似度的方式并限于上述舉例的方式。在本發(fā)明一些實(shí)施例中,可基于正態(tài)分布機(jī)制來計(jì)算網(wǎng)絡(luò)流量A和樣本流量的端口的相似度。其中,正態(tài)分布公式如下:其中,正態(tài)分布公式具有兩個(gè)參數(shù)μ和σ2的連續(xù)型隨機(jī)變量的分布,第一參數(shù)μ是服從正態(tài)分布的隨機(jī)變量的均值,第二個(gè)參數(shù)σ2是此隨機(jī)變量的方差,所以正態(tài)分布記作N(μ,σ2)。服從正態(tài)分布的隨機(jī)變量的概率規(guī)律為取與μ鄰近的值的概率大,而取離μ越遠(yuǎn)的值的概率越?。沪以叫?,分布越集中在μ附近,σ越大,分布越分散。假設(shè),通過計(jì)算得出樣本流量的端口號(hào)的標(biāo)準(zhǔn)差為310.2418(σ),算術(shù)平均值為2500(μ),概率密度可如下表所示:公式下限上限概率密度μ±σ2189.7582810.24268.3%μ±2σ1879.5163120.48495.4%μ±3σ1569.2743430.72699.7%由于網(wǎng)絡(luò)流量A的端口號(hào)為2457,落在[2189.758,2810.242]之間,故可得到網(wǎng)絡(luò)流量A和樣本流量的端口相似度68.3%。當(dāng)然,計(jì)算網(wǎng)絡(luò)流量A和樣本流量的端口相似度的方式并限于上述舉例的方式。304、對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到網(wǎng)絡(luò)流量A與樣本流量的匹配相似度。舉例來說,假設(shè)設(shè)定的負(fù)載內(nèi)容相似度、報(bào)文長(zhǎng)度相似度、端口相似度的權(quán)值分別為6、3和1,則加權(quán)調(diào)和計(jì)算出的匹配相似度如下:匹配相似度=(PayloadSR6*LengthSR^3*PortSR^1)0.1=(0.420466*0.881^3*0.683^1)0.1=0.550976當(dāng)然,設(shè)定的負(fù)載內(nèi)容相似度、報(bào)文長(zhǎng)度相似度、端口相似度的權(quán)值亦可分別為3、3和1或其它值,加權(quán)調(diào)和計(jì)算出的匹配相似度的方式類似。305、判斷計(jì)算得到的匹配相似度是否大于相似度閾值。若是,則執(zhí)行步驟306;若否,則執(zhí)行步驟307。306、輸出成功識(shí)別的識(shí)別結(jié)果;假設(shè),識(shí)別出網(wǎng)絡(luò)流量A屬于某套餐內(nèi)的流量,則可通知相關(guān)設(shè)備不單獨(dú)計(jì)費(fèi)。307、輸出識(shí)別失敗的識(shí)別結(jié)果。其中,上述場(chǎng)景中,主要以按照端口號(hào)、報(bào)文長(zhǎng)度和負(fù)載內(nèi)容等三個(gè)維度計(jì)算出網(wǎng)絡(luò)流量A和樣本流量的相似度。對(duì)于按照其它維度計(jì)算出網(wǎng)絡(luò)流量A和樣本流量的相似度的場(chǎng)景,可以此類推??梢岳斫獾氖?,上述舉例主要是針對(duì)某條未知流量和樣本流量來進(jìn)行匹配相似度計(jì)算的,對(duì)于存著多個(gè)樣本流量的場(chǎng)景,可按類似方式,分別計(jì)算未知流量和各個(gè)樣本流量的匹配相似度。同理,對(duì)應(yīng)存著多條未知流量的場(chǎng)景,亦可按類似方式,分別計(jì)算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述。由上可見,本實(shí)施例的方案中,先將未知流量進(jìn)行DPI識(shí)別,若DPI識(shí)別失敗,則按照端口號(hào)、報(bào)文長(zhǎng)度和負(fù)載內(nèi)容等維度分別計(jì)算上述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到未知流量與樣本流量的匹配相似度。由于提供了一種可利用流量分析設(shè)備來進(jìn)行近似流量分析的機(jī)制,可提供在線分析能力,有利于提升自動(dòng)化率,減少分析時(shí)間,有利于提高流量分析的效率。由于是按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度,并對(duì)N個(gè)維度得到的相似度進(jìn)行綜合,N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度,相對(duì)于常規(guī)單維度匹配機(jī)制,本發(fā)明實(shí)施例提出的技術(shù)方案從與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度等極具代表性的維度中選擇N個(gè)維度來進(jìn)行組合分析,這樣就有利于極大的提高流量分析的準(zhǔn)確性,進(jìn)而有利于為相關(guān)業(yè)務(wù)計(jì)費(fèi)提供有效支撐。為便于更好的實(shí)施本發(fā)明實(shí)施例的上述方案,下面還提供用于實(shí)施上述方案的相關(guān)裝置。參見圖5,本發(fā)明實(shí)施例還提供一種近似匹配服務(wù)器500,可包括:獲取單元510和相似度計(jì)算單元520。其中,獲取單元510,用于獲取未知流量。相似度計(jì)算單元520,用于按照N個(gè)維度,分別計(jì)算樣本流量與上述獲取單元獲取的上述未知流量與的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào),以得到上述未知流量與樣本流量的匹配相似度,其中,上述N為大于或等于2的整數(shù)。在本發(fā)明的一些實(shí)施例中,相似度計(jì)算單元520可具體用于,當(dāng)基于深層包檢測(cè)技術(shù)未能識(shí)別出上述未知流量時(shí),按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度,對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào),以得到上述未知流量與樣本流量的匹配相似度,其中,上述N為大于或等于2的整數(shù)。其中,上述N個(gè)維度可包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度、與流量自身相關(guān)的n3個(gè)維度,其中,所述n1、n2、n3為正整數(shù)。其中,與流量的報(bào)文相關(guān)的n1個(gè)維度是將流量中報(bào)文(例如報(bào)文頭和/或報(bào)文負(fù)載)作為分析角度的n1個(gè)維度,與流量的報(bào)文相關(guān)的n1個(gè)維度例如可包括:以流量中報(bào)文的長(zhǎng)度為維度、以流量中報(bào)文的負(fù)載內(nèi)容為維度、以流量中報(bào)文的端口號(hào)為維度等。其中,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度是將流量所對(duì)應(yīng)的會(huì)話作為分析角度的n2個(gè)維度,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度例如可包括:以流量所對(duì)應(yīng)會(huì)話的上行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的下行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的上下行包數(shù)量比值為維度、以流量所對(duì)應(yīng)會(huì)話的上行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的下行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的上下行流量值比值為維度等。與流量自身相關(guān)的n3個(gè)維度是將流量本身作為分析角度的n3個(gè)維度,這n3個(gè)維度與流量中各報(bào)文的負(fù)載無關(guān)、也與流量所對(duì)應(yīng)的會(huì)話無關(guān),與流量自身相關(guān)的n3個(gè)維度例如可包括以流量前M個(gè)包的流量值為維度、以流量的發(fā)包速率為維度等,以此類推。其中,相似度計(jì)算單元520可根據(jù)實(shí)際需要來選著用于識(shí)別的維度,針對(duì)不同的應(yīng)用場(chǎng)景不同的精度要求,選擇的維度可能不盡相同。舉例來說,相似度計(jì)算單元520可以從下面舉例的幾個(gè)維度中選擇至少兩個(gè)維度來計(jì)算上述未知流量與樣本流量的相似度:報(bào)文負(fù)載內(nèi)容、報(bào)文長(zhǎng)度、報(bào)文端口號(hào)、發(fā)包速率、上行包數(shù)量、下行包數(shù)量、上下行包數(shù)量比值、上行流量值、下行流量值、上下行流量值的比值、前M個(gè)包的流量值等。當(dāng)然,本發(fā)明實(shí)施例并不限于上述舉例的相似度比較維度,其它維度亦可引入。在本發(fā)明的一些實(shí)施例中,在按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度的方面,相似度計(jì)算單元520可具體用于,執(zhí)行如下相似度計(jì)算操作中的至少兩種:計(jì)算上述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度、計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度、計(jì)算上述未知流量與樣本流量的報(bào)文端口號(hào)的相似度、計(jì)算上述未知流量與樣本流量的發(fā)包速率的相似度、計(jì)算上述未知流量與樣本流量的上行包數(shù)量的相似度、計(jì)算上述未知流量與樣本流量的下行包數(shù)量的相似度、計(jì)算上述未知流量與樣本流量的上下行包數(shù)量比值的相似度、計(jì)算上述未知流量與樣本流量的上行流量值的相似度、計(jì)算上述未知流量與樣本流量的下行流量值的相似度、計(jì)算上述未知流量與樣本流量的上下行流量值的比值的相似度、計(jì)算上述未知流量與樣本流量的前M個(gè)包的流量值的相似度,并對(duì)計(jì)算得到的至少兩種的相似度進(jìn)行加權(quán)調(diào),以得到上述未知流量與樣本流量的匹配相似度。在本發(fā)明的一些實(shí)施例中,在計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,相似度計(jì)算單元520可具體用于:計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的字符相似度;計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的匹配度;計(jì)算上述匹配度的平方根與上述字符相似度的乘積,其中,該乘積為上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度,其中,上述字符相似度等于上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相同字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);上述匹配度等于1減去上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的區(qū)別度,其中,上述區(qū)別度等于上述樣本流量的報(bào)文負(fù)載內(nèi)容中與上述未知流量不相同的字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù)。在本發(fā)明的另一些實(shí)施例中,在計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,相似度計(jì)算單元520也可具體用于:假設(shè)未知流量的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,比較兩個(gè)字符串的相似度sim(s1,s2),假設(shè)字符串s1和字符串s2中含有n個(gè)不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉(zhuǎn)換為對(duì)兩個(gè)字符串對(duì)應(yīng)的向量v1和v2之間夾角大小的判斷,余弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,未知流量和樣本流量的負(fù)載內(nèi)容相似度越大;相反,余弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,未知流量和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明另一些實(shí)施例中,在計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,相似度計(jì)算單元520也可具體用于:假設(shè)未知流量的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,可用一個(gè)矩陣來記錄兩個(gè)字符串中所有位置的兩個(gè)字符之間的匹配情況,若匹配(相同)則為1,否則為0,然后,求出矩陣中對(duì)角線最長(zhǎng)的1個(gè)序列,其對(duì)應(yīng)的位置就是最長(zhǎng)匹配子串的位置,例如最長(zhǎng)公共子串越長(zhǎng),則表示兩個(gè)字符串的相似度越大,即未知流量和樣本流量的負(fù)載內(nèi)容的相似度越大,相反,最長(zhǎng)公共子串越短,則可認(rèn)為兩個(gè)字符串的相似度越小,即,未知流量和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明的一些實(shí)施例中,在計(jì)算上述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度的方面,相似度計(jì)算單元520可具體用于:將上述未知流量的報(bào)文長(zhǎng)度除以上述樣本流量的報(bào)文長(zhǎng)度以得到商,其中,該商為上述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度;或者,確定上述未知流量的報(bào)文長(zhǎng)度所落入的第一長(zhǎng)度區(qū)域,根據(jù)長(zhǎng)度區(qū)域與相似度值的對(duì)應(yīng)關(guān)系,確定出第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值,其中,第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值為未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度??梢岳斫獾氖牵鲜雠e例主要是針對(duì)某條未知流量和樣本流量來進(jìn)行匹配相似度計(jì)算的,對(duì)于存著多個(gè)樣本流量的場(chǎng)景,可按類似方式,分別計(jì)算未知流量和各個(gè)樣本流量的匹配相似度。同理,對(duì)應(yīng)存著多條未知流量的場(chǎng)景,亦可按類似方式,分別計(jì)算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述。可以理解的是,本實(shí)施例近似匹配裝置500可以用于實(shí)現(xiàn)上述方法實(shí)施例中的部分或全部技術(shù)方案,其各個(gè)功能模塊的功能可根據(jù)上述方法實(shí)施例中的方法具體實(shí)現(xiàn),其具體實(shí)現(xiàn)過程可參照上述實(shí)施例中的相關(guān)描述,此處不再贅述。由上可見,本實(shí)施例的方案中,近似匹配裝置500在獲取未知流量后按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到未知流量與樣本流量的匹配相似度,其中N為大于或等于2的整數(shù)。由于提供了一種可利用近似匹配裝置500來進(jìn)行近似流量分析的機(jī)制,可提供在線分析能力,有利于提升自動(dòng)化率,減少分析時(shí)間,有利于提高流量分析的效率,由于是按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度,并對(duì)N個(gè)維度得到的相似度進(jìn)行綜合,N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度,相對(duì)于常規(guī)單維度匹配機(jī)制,本發(fā)明實(shí)施例提出的技術(shù)方案從與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度等極具代表性的維度中選擇N個(gè)維度來進(jìn)行組合分析,這樣就有利于極大的提高流量分析的準(zhǔn)確性,進(jìn)而有利于為相關(guān)業(yè)務(wù)計(jì)費(fèi)提供有效支撐。圖6為本發(fā)明提供的近似匹配服務(wù)器600的結(jié)構(gòu)示意圖,如圖6所示,本實(shí)施例的近似匹配服務(wù)器600包括至少一個(gè)總線601、與總線601相連的至少一個(gè)處理器602以及與總線601相連的至少一個(gè)存儲(chǔ)器603。其中,處理器602通過總線601,調(diào)用存儲(chǔ)器603中存儲(chǔ)的代碼以用于獲取未知流量;按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到上述未知流量與樣本流量的匹配相似度,其中,上述N為大于或等于2的整數(shù)。其中,上述N個(gè)維度可包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度、與流量自身相關(guān)的n3個(gè)維度,其中,所述n1、n2、n3為正整數(shù)。其中,與流量的報(bào)文相關(guān)的n1個(gè)維度是將流量中報(bào)文(例如報(bào)文頭和/或報(bào)文負(fù)載)作為分析角度的n1個(gè)維度,與流量的報(bào)文相關(guān)的n1個(gè)維度例如可包括:以流量中報(bào)文的長(zhǎng)度為維度、以流量中報(bào)文的負(fù)載內(nèi)容為維度、以流量中報(bào)文的端口號(hào)為維度等。其中,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度是將流量所對(duì)應(yīng)的會(huì)話作為分析角度的n2個(gè)維度,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度例如可包括:以流量所對(duì)應(yīng)會(huì)話的上行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的下行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的上下行包數(shù)量比值為維度、以流量所對(duì)應(yīng)會(huì)話的上行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的下行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的上下行流量值比值為維度等。與流量自身相關(guān)的n3個(gè)維度是將流量本身作為分析角度的n3個(gè)維度,這n3個(gè)維度與流量中各報(bào)文的負(fù)載無關(guān)、也與流量所對(duì)應(yīng)的會(huì)話無關(guān),與流量自身相關(guān)的n3個(gè)維度例如可包括以流量前M個(gè)包的流量值為維度、以流量的發(fā)包速率為維度等,以此類推。其中,通過部署,處理器602可獲取網(wǎng)絡(luò)中的多種設(shè)備的流量。例如近似匹配服務(wù)器600可為板卡或軟模塊,可將近似匹配服務(wù)器600嵌入到基站控制器、數(shù)據(jù)網(wǎng)關(guān)等網(wǎng)元中?;蛘呓破ヅ浞?wù)器600可作為獨(dú)立設(shè)備,可采用外掛或串聯(lián)等方式接入網(wǎng)絡(luò)。在本發(fā)明的一些實(shí)施例中,處理器602可以在當(dāng)基于深層包檢測(cè)技術(shù)未能識(shí)別出上述未知流量時(shí),按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度,對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào),以得到上述未知流量與樣本流量的匹配相似度,其中,上述N為大于或等于2的整數(shù)。在本發(fā)明的一些實(shí)施例中,若得到的樣本流量與上述未知流量的匹配相似度大于設(shè)定的相似度閾值,則處理器602可輸出未知流量與樣本流量的匹配成功的流量識(shí)別結(jié)果(其中,該流量識(shí)別結(jié)果例如可指示出上述未知流量與樣本流量的業(yè)務(wù)類型相同等,此時(shí)可按照樣本流量的業(yè)務(wù)類型所對(duì)應(yīng)的套餐計(jì)費(fèi)方式對(duì)上述未知流量進(jìn)行計(jì)費(fèi)。例如存在Fk1套餐業(yè)務(wù),針對(duì)用戶所有訪問Fk1的流量免費(fèi),F(xiàn)k1的外掛視頻流量和廣告流量單獨(dú)計(jì)費(fèi),其它業(yè)務(wù)場(chǎng)景以此類推),此外,若得到的樣本流量與上述未知流量的匹配相似度小于設(shè)定的相似度閾值,則處理器602可輸出未知流量與樣本流量的匹配失敗的流量識(shí)別結(jié)果。其中,處理器602可根據(jù)實(shí)際需要來選著用于識(shí)別的維度,針對(duì)不同的應(yīng)用場(chǎng)景不同的精度要求,選擇的維度可能不盡相同。舉例來說,處理器602可以從下面舉例的幾個(gè)維度中選擇至少兩個(gè)維度來計(jì)算上述未知流量與樣本流量的相似度:報(bào)文負(fù)載內(nèi)容、報(bào)文長(zhǎng)度、報(bào)文端口號(hào)、發(fā)包速率、上行包數(shù)量、下行包數(shù)量、上下行包數(shù)量比值、上行流量值、下行流量值、上下行流量值的比值、前M個(gè)包的流量值等。當(dāng)然,本發(fā)明實(shí)施例并不限于上述舉例的相似度比較維度,其它維度亦可引入。在本發(fā)明的一些實(shí)施例中,在按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度的方面,處理器602可具體用于:執(zhí)行如下相似度計(jì)算操作中的至少兩種:計(jì)算上述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度、計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度、計(jì)算上述未知流量與樣本流量的報(bào)文端口號(hào)的相似度、計(jì)算上述未知流量與樣本流量的發(fā)包速率的相似度、計(jì)算上述未知流量與樣本流量的上行包數(shù)量的相似度、計(jì)算上述未知流量與樣本流量的下行包數(shù)量的相似度、計(jì)算上述未知流量與樣本流量的上下行包數(shù)量比值的相似度、計(jì)算上述未知流量與樣本流量的上行流量值的相似度、計(jì)算上述未知流量與樣本流量的下行流量值的相似度、計(jì)算上述未知流量與樣本流量的上下行流量值的比值的相似度、計(jì)算上述未知流量與樣本流量的前M個(gè)包的流量值的相似度。在實(shí)際應(yīng)用中,可采用符合本領(lǐng)域計(jì)算邏輯的多種方式,按照相應(yīng)維度計(jì)算上述未知流量與樣本流量的相似度。例如,在計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,處理器602可具體用于:計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的字符相似度;計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的匹配度;計(jì)算上述匹配度的平方根與上述字符相似度的乘積,其中,上述乘積為上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度,其中,上述字符相似度等于上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相同字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);上述匹配度等于1減去上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的區(qū)別度,其中,上述區(qū)別度等于上述樣本流量的報(bào)文負(fù)載內(nèi)容中與上述未知流量不相同的字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù)。在本發(fā)明的另一些實(shí)施例中,在上述計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,處理器602也可具體用于:假設(shè)未知流量的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,比較兩個(gè)字符串的相似度sim(s1,s2),假設(shè)字符串s1和字符串s2中含有n個(gè)不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉(zhuǎn)換為對(duì)兩個(gè)字符串對(duì)應(yīng)的向量v1和v2之間夾角大小的判斷,余弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,未知流量和樣本流量的負(fù)載內(nèi)容相似度越大;相反,余弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,未知流量和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明另一些實(shí)施例中,在上述計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,處理器602也可具體用于:假設(shè)未知流量的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,可用一個(gè)矩陣來記錄兩個(gè)字符串中所有位置的兩個(gè)字符之間的匹配情況,若匹配(相同)則為1,否則為0,然后,求出矩陣中對(duì)角線最長(zhǎng)的1個(gè)序列,其對(duì)應(yīng)的位置就是最長(zhǎng)匹配子串的位置,例如最長(zhǎng)公共子串越長(zhǎng),則表示兩個(gè)字符串的相似度越大,即未知流量和樣本流量的負(fù)載內(nèi)容的相似度越大,相反,最長(zhǎng)公共子串越短,則可認(rèn)為兩個(gè)字符串的相似度越小,即,未知流量和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明的一些實(shí)施例中,在計(jì)算上述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度的方面。處理器602可具體用于:將上述未知流量的報(bào)文長(zhǎng)度除以上述樣本流量的報(bào)文長(zhǎng)度以得到商,該商為上述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度;或者確定上述未知流量的報(bào)文長(zhǎng)度所落入的第一長(zhǎng)度區(qū)域,根據(jù)長(zhǎng)度區(qū)域與相似度值的對(duì)應(yīng)關(guān)系,確定出第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值,其中,第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值為未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度。其中,其它維度的相似度計(jì)算方式可類推,此處不再一一舉例??梢岳斫獾氖?,上述舉例主要是針對(duì)某條未知流量和樣本流量來進(jìn)行匹配相似度計(jì)算的,對(duì)于存著多個(gè)樣本流量的場(chǎng)景,可按類似方式,分別計(jì)算未知流量和各個(gè)樣本流量的匹配相似度。同理,對(duì)應(yīng)存著多條未知流量的場(chǎng)景,亦可按類似方式,分別計(jì)算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述??梢岳斫獾氖?,本實(shí)施例近似匹配服務(wù)器600可以用于實(shí)現(xiàn)上述方法實(shí)施例中的部分或全部技術(shù)方案,其各個(gè)功能模塊的功能可根據(jù)上述方法實(shí)施例中的方法具體實(shí)現(xiàn),其具體實(shí)現(xiàn)過程可參照上述實(shí)施例中的相關(guān)描述,此處不再贅述。由上可見,本發(fā)明實(shí)施例的方案中,處理器602在獲取未知流量后按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到未知流量與樣本流量的匹配相似度,其中,N為大于或等于2的整數(shù)。由于提供了利用近似匹配服務(wù)器600來進(jìn)行近似流量分析的機(jī)制,可提供在線分析能力,有利于提升自動(dòng)化率,減少分析時(shí)間,有利于提高流量分析的效率,由于是按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度,并對(duì)N個(gè)維度得到的相似度進(jìn)行綜合,N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度,相對(duì)于常規(guī)單維度匹配機(jī)制,本發(fā)明實(shí)施例提出的技術(shù)方案從與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度等極具代表性的維度中選擇N個(gè)維度來進(jìn)行組合分析,這樣就有利于極大的提高流量分析的準(zhǔn)確性,進(jìn)而有利于為相關(guān)業(yè)務(wù)計(jì)費(fèi)提供有效支撐。參見圖7,本發(fā)明實(shí)施例還提供一種通信系統(tǒng),包括:通信網(wǎng)元710和與該通信網(wǎng)元連接的流量分析服務(wù)器720。其中,通信網(wǎng)元710用于接收未知流量;其中,流量分析服務(wù)器720,用于獲取通信網(wǎng)元710接收的未知流量或者獲取通信網(wǎng)元710接收的未知流量的鏡像;按照N個(gè)維度分別計(jì)算上述未知流量或未知流量的鏡像與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到上述未知流量或未知流量的鏡像與樣本流量的匹配相似度,上述N為大于或等于2的整數(shù)。流量分析服務(wù)器720可嵌入到通信網(wǎng)元710(例如基站控制器、數(shù)據(jù)網(wǎng)關(guān)等網(wǎng)元)中?;蛘吡髁糠治龇?wù)器720可作為獨(dú)立設(shè)備,可采用外掛或串聯(lián)等方式接入網(wǎng)絡(luò)中,以與通信網(wǎng)元710連接。其中,上述N個(gè)維度可包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度、與流量自身相關(guān)的n3個(gè)維度,其中,所述n1、n2、n3為正整數(shù)。其中,與流量的報(bào)文相關(guān)的n1個(gè)維度是將流量中報(bào)文(例如報(bào)文頭和/或報(bào)文負(fù)載)作為分析角度的n1個(gè)維度,與流量的報(bào)文相關(guān)的n1個(gè)維度例如可包括:以流量中報(bào)文的長(zhǎng)度為維度、以流量中報(bào)文的負(fù)載內(nèi)容為維度、以流量中報(bào)文的端口號(hào)為維度等。其中,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度是將流量所對(duì)應(yīng)的會(huì)話作為分析角度的n2個(gè)維度,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度例如可包括:以流量所對(duì)應(yīng)會(huì)話的上行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的下行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的上下行包數(shù)量比值為維度、以流量所對(duì)應(yīng)會(huì)話的上行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的下行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的上下行流量值比值為維度等。與流量自身相關(guān)的n3個(gè)維度是將流量本身作為分析角度的n3個(gè)維度,這n3個(gè)維度與流量中各報(bào)文的負(fù)載無關(guān)、也與流量所對(duì)應(yīng)的會(huì)話無關(guān),與流量自身相關(guān)的n3個(gè)維度例如可包括以流量前M個(gè)包的流量值為維度、以流量的發(fā)包速率為維度等,以此類推。可以理解,本實(shí)施例的通信網(wǎng)元例如可為基站、基站控制器、網(wǎng)關(guān)、各種數(shù)據(jù)服務(wù)器等網(wǎng)絡(luò)中可用于傳輸業(yè)務(wù)流量的網(wǎng)元。在本發(fā)明一些實(shí)施例中,流量分析服務(wù)器720可以具體用于,在當(dāng)基于深層包檢測(cè)技術(shù)未能識(shí)別出上述未知流量或未知流量的鏡像時(shí),按照N個(gè)維度分別計(jì)算上述未知流量或未知流量的鏡像與樣本流量的相似度,對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào),以得到上述未知流量或未知流量的鏡像與樣本流量的匹配相似度,其中,上述N為大于或等于2的整數(shù)。在本發(fā)明一些實(shí)施例中,若得到的樣本流量與上述未知流量或未知流量的鏡像的匹配相似度大于設(shè)定的相似度閾值,則流量分析服務(wù)器720可向通信網(wǎng)元710或其它通信網(wǎng)元輸出未知流量或未知流量的鏡像與樣本流量的匹配成功的流量識(shí)別結(jié)果(其中,該流量識(shí)別結(jié)果例如可指示出上述未知流量或未知流量的鏡像與樣本流量的業(yè)務(wù)類型相同等,此時(shí)可按照樣本流量的業(yè)務(wù)類型所對(duì)應(yīng)的套餐計(jì)費(fèi)方式對(duì)上述未知流量或未知流量的鏡像進(jìn)行計(jì)費(fèi)。如存在Fk1套餐業(yè)務(wù),針對(duì)用戶所有訪問Fk1的流量免費(fèi),F(xiàn)k1的外掛視頻流量和廣告流量單獨(dú)計(jì)費(fèi),其它業(yè)務(wù)場(chǎng)景以此類推),此外,若得到的樣本流量與上述未知流量或未知流量的鏡像的匹配相似度小于設(shè)定的相似度閾值,則流量分析服務(wù)器720可向通信網(wǎng)元710或其它通信網(wǎng)元輸出未知流量或未知流量的鏡像與樣本流量的匹配失敗的流量識(shí)別結(jié)果。其中,可根據(jù)實(shí)際需要來選著用于識(shí)別的維度,針對(duì)不同的應(yīng)用場(chǎng)景不同的精度要求,選擇的維度可能不盡相同。舉例來說,可以從下面舉例的幾個(gè)維度中選擇至少兩個(gè)維度來計(jì)算上述未知流量或未知流量的鏡像與樣本流量的相似度:報(bào)文負(fù)載內(nèi)容、報(bào)文長(zhǎng)度、報(bào)文端口號(hào)、發(fā)包速率、上行包數(shù)量、下行包數(shù)量、上下行包數(shù)量比值、上行流量值、下行流量值、上下行流量值的比值、前M個(gè)包的流量值等。當(dāng)然,本發(fā)明實(shí)施例并不限于上述舉例的相似度比較維度,其它維度亦可引入。在本發(fā)明的一些實(shí)施例中,在按照N個(gè)維度分別計(jì)算上述未知流量或未知流量的鏡像與樣本流量的相似度的方面,流量分析服務(wù)器720可具體用于執(zhí)行如下相似度計(jì)算操作中的至少兩種:計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文端口號(hào)的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的發(fā)包速率的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上行包數(shù)量的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的下行包數(shù)量的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上下行包數(shù)量比值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上行流量值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的下行流量值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上下行流量值的比值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的前M個(gè)包的流量值的相似度。在實(shí)際應(yīng)用中,可采用符合本領(lǐng)域計(jì)算邏輯的多種方式,按照相應(yīng)維度計(jì)算上述未知流量或未知流量的鏡像與樣本流量的相似度。例如,在計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,流量分析服務(wù)器720可具體用于:計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的字符相似度;計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的匹配度;計(jì)算上述匹配度的平方根與上述字符相似度的乘積,其中,該乘積為上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度,其中,上述字符相似度等于上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相同字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);上述匹配度等于1減去上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的區(qū)別度,其中,上述區(qū)別度等于上述樣本流量的報(bào)文負(fù)載內(nèi)容中與上述未知流量或未知流量的鏡像不相同的字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù)。在本發(fā)明的另一些實(shí)施例中,在上述計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,流量分析服務(wù)器720也可具體用于:假設(shè)未知流量的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,比較兩個(gè)字符串的相似度sim(s1,s2),假設(shè)字符串s1和字符串s2中含有n個(gè)不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉(zhuǎn)換為對(duì)兩個(gè)字符串對(duì)應(yīng)的向量v1和v2之間夾角大小的判斷,余弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,未知流量和樣本流量的負(fù)載內(nèi)容相似度越大;相反,余弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,未知流量和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明另一些實(shí)施例中,在上述計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,流量分析服務(wù)器720也可具體用于:假設(shè)未知流量的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,可用一個(gè)矩陣來記錄兩個(gè)字符串中所有位置的兩個(gè)字符之間的匹配情況,若匹配(相同)則為1,否則為0,然后,求出矩陣中對(duì)角線最長(zhǎng)的1個(gè)序列,其對(duì)應(yīng)的位置就是最長(zhǎng)匹配子串的位置,例如最長(zhǎng)公共子串越長(zhǎng),則表示兩個(gè)字符串的相似度越大,即未知流量和樣本流量的負(fù)載內(nèi)容的相似度越大,相反,最長(zhǎng)公共子串越短,則可認(rèn)為兩個(gè)字符串的相似度越小,即,未知流量和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明的一些實(shí)施例中,在上述計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度的方面,流量分析服務(wù)器720可具體用于:將上述未知流量或未知流量的鏡像的報(bào)文長(zhǎng)度除以上述樣本流量的報(bào)文長(zhǎng)度以得到商,其中,上述商為上述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度;或者,確定上述未知流量或未知流量的鏡像的報(bào)文長(zhǎng)度所落入的第一長(zhǎng)度區(qū)域,根據(jù)長(zhǎng)度區(qū)域與相似度值的對(duì)應(yīng)關(guān)系,確定出第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值,其中,第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值為未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度??梢岳斫獾氖?,上述舉例主要是針對(duì)某條未知流量和樣本流量來進(jìn)行匹配相似度計(jì)算的,對(duì)于存著多個(gè)樣本流量的場(chǎng)景,可按類似方式,分別計(jì)算未知流量和各個(gè)樣本流量的匹配相似度。同理,對(duì)應(yīng)存著多條未知流量的場(chǎng)景,亦可按類似方式,分別計(jì)算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述。其中,其它維度的相似度計(jì)算方式可類推,此處不再一一舉例。由上可見,本實(shí)施例方案中,流量分析服務(wù)器720從通信網(wǎng)元710獲取未知流量后,按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到未知流量與樣本流量的匹配相似度,其中,N為大于或等于2的整數(shù)。由于可利用流量分析服務(wù)器來進(jìn)行近似流量分析的機(jī)制,可提供在線分析能力,有利于提升自動(dòng)化率,減少分析時(shí)間,有利于提高流量分析的效率,由于是按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度,并對(duì)N個(gè)維度得到的相似度進(jìn)行綜合,N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度,相對(duì)于常規(guī)單維度匹配機(jī)制,本實(shí)施例提出的技術(shù)方案從與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度等極具代表性的維度中選擇N個(gè)維度來進(jìn)行組合分析,這樣就有利于極大的提高流量分析的準(zhǔn)確性,進(jìn)而有利于為相關(guān)業(yè)務(wù)計(jì)費(fèi)提供有效支撐。參見圖8,本發(fā)明實(shí)施例還提供一種流量分析服務(wù)器800,可包括:深層包檢測(cè)識(shí)別系統(tǒng)810和近似匹配系統(tǒng)820。深層包檢測(cè)識(shí)別系統(tǒng)810,用于獲取未知流量,基于深層包檢測(cè)技術(shù)對(duì)所述未知流量進(jìn)行識(shí)別;近似匹配系統(tǒng)820,用于當(dāng)深層包檢測(cè)識(shí)別系統(tǒng)810基于深層包檢測(cè)技術(shù)未能識(shí)別出所述未知流量時(shí),按照N個(gè)維度分別計(jì)算所述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到所述未知流量與樣本流量的匹配相似度,其中,所述N為大于或等于2的整數(shù),其中,上述N個(gè)維度可包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度、與流量自身相關(guān)的n3個(gè)維度,其中,所述n1、n2、n3為正整數(shù)。其中,與流量的報(bào)文相關(guān)的n1個(gè)維度是將流量中報(bào)文(例如報(bào)文頭和/或報(bào)文負(fù)載)作為分析角度的n1個(gè)維度,與流量的報(bào)文相關(guān)的n1個(gè)維度例如可包括:以流量中報(bào)文的長(zhǎng)度為維度、以流量中報(bào)文的負(fù)載內(nèi)容為維度、以流量中報(bào)文的端口號(hào)為維度等。其中,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度是將流量所對(duì)應(yīng)的會(huì)話作為分析角度的n2個(gè)維度,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度例如可包括:以流量所對(duì)應(yīng)會(huì)話的上行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的下行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的上下行包數(shù)量比值為維度、以流量所對(duì)應(yīng)會(huì)話的上行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的下行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的上下行流量值比值為維度等。與流量自身相關(guān)的n3個(gè)維度是將流量本身作為分析角度的n3個(gè)維度,這n3個(gè)維度與流量中各報(bào)文的負(fù)載無關(guān)、也與流量所對(duì)應(yīng)的會(huì)話無關(guān),與流量自身相關(guān)的n3個(gè)維度例如可包括以流量前M個(gè)包的流量值為維度、以流量的發(fā)包速率為維度等,以此類推。在本發(fā)明的一些實(shí)施例中,近似匹配系統(tǒng)820按照N個(gè)維度分別計(jì)算所述未知流量與樣本流量的相似度可包括:執(zhí)行如下相似度計(jì)算操作中的至少兩種:計(jì)算所述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度、計(jì)算所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度、計(jì)算所述未知流量與樣本流量的報(bào)文端口號(hào)的相似度、計(jì)算所述未知流量與樣本流量的發(fā)包速率的相似度、計(jì)算所述未知流量與樣本流量的上行包數(shù)量的相似度、計(jì)算所述未知流量與樣本流量的下行包數(shù)量的相似度、計(jì)算所述未知流量與樣本流量的上下行包數(shù)量比值的相似度、計(jì)算所述未知流量與樣本流量的上行流量值的相似度、計(jì)算所述未知流量與樣本流量的下行流量值的相似度、計(jì)算所述未知流量與樣本流量的上下行流量值的比值的相似度、計(jì)算所述未知流量與樣本流量的前M個(gè)包的流量值的相似度。在本發(fā)明的一些實(shí)施例中,在計(jì)算所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,近似匹配系統(tǒng)820可具體用于:計(jì)算所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的字符相似度;計(jì)算所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的匹配度;計(jì)算所述匹配度的平方根與所述字符相似度的乘積,其中,計(jì)算得到的所述乘積為所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度,其中,所述字符相似度等于所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相同字符數(shù),除以所述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);所述匹配度等于1減去所述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的區(qū)別度,其中,所述區(qū)別度等于所述樣本流量的報(bào)文負(fù)載內(nèi)容中與所述未知流量不相同的字符數(shù),除以所述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù)。在本發(fā)明的另一些實(shí)施例中,在上述計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,近似匹配系統(tǒng)820也可具體用于:假設(shè)未知流量的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,比較兩個(gè)字符串的相似度sim(s1,s2),假設(shè)字符串s1和字符串s2中含有n個(gè)不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉(zhuǎn)換為對(duì)兩個(gè)字符串對(duì)應(yīng)的向量v1和v2之間夾角大小的判斷,余弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,未知流量和樣本流量的負(fù)載內(nèi)容相似度越大;相反,余弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,未知流量和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明另一些實(shí)施例中,在上述計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,近似匹配系統(tǒng)820也可具體用于:假設(shè)未知流量的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,可用一個(gè)矩陣來記錄兩個(gè)字符串中所有位置的兩個(gè)字符之間的匹配情況,若匹配(相同)則為1,否則為0,然后,求出矩陣中對(duì)角線最長(zhǎng)的1個(gè)序列,其對(duì)應(yīng)的位置就是最長(zhǎng)匹配子串的位置,例如最長(zhǎng)公共子串越長(zhǎng),則表示兩個(gè)字符串的相似度越大,即未知流量和樣本流量的負(fù)載內(nèi)容的相似度越大,相反,最長(zhǎng)公共子串越短,則可認(rèn)為兩個(gè)字符串的相似度越小,即,未知流量和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明的一些實(shí)施例中,計(jì)算所述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度的方面,近似匹配系統(tǒng)820可具體用于:將所述未知流量的報(bào)文長(zhǎng)度除以所述樣本流量的報(bào)文長(zhǎng)度以得到商,其中,所述商為所述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度;或,確定所述未知流量的報(bào)文長(zhǎng)度所落入的第一長(zhǎng)度區(qū)域,根據(jù)長(zhǎng)度區(qū)域與相似度值的對(duì)應(yīng)關(guān)系,確定出第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值,其中,第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值為所述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度??梢岳斫獾氖?,上述舉例主要是針對(duì)某條未知流量和樣本流量來進(jìn)行匹配相似度計(jì)算的,對(duì)于存著多個(gè)樣本流量的場(chǎng)景,可按類似方式,分別計(jì)算未知流量和各個(gè)樣本流量的匹配相似度。同理,對(duì)應(yīng)存著多條未知流量的場(chǎng)景,亦可按類似方式,分別計(jì)算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述。由上可見,本發(fā)明實(shí)施例方案中,深層包檢測(cè)識(shí)別系統(tǒng)810獲取未知流量后,基于深層包檢測(cè)技術(shù)對(duì)所述未知流量進(jìn)行識(shí)別,當(dāng)深層包檢測(cè)識(shí)別系統(tǒng)810基于深層包檢測(cè)技術(shù)未能識(shí)別出未知流量時(shí),近似匹配系統(tǒng)820按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到未知流量與樣本流量的匹配相似度,其中,N為大于或等于2的整數(shù)。由于提供了一種可利用設(shè)備來進(jìn)行近似流量分析的機(jī)制,可提供在線分析能力,有利于提升自動(dòng)化率,減少分析時(shí)間,有利于提高流量分析的效率,由于是按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度,并對(duì)N個(gè)維度得到的相似度進(jìn)行綜合,N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度,相對(duì)于常規(guī)單維度匹配機(jī)制,本發(fā)明實(shí)施例提出的技術(shù)方案從與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度等極具代表性的維度中選擇N個(gè)維度來進(jìn)行組合分析,這樣就有利于極大的提高流量分析的準(zhǔn)確性,進(jìn)而有利于為相關(guān)業(yè)務(wù)計(jì)費(fèi)提供有效支撐。參見圖9,本發(fā)明實(shí)施例還提供一種通信系統(tǒng),可包括:通信網(wǎng)元910和流量分析服務(wù)器920。其中,通信網(wǎng)元910用于接收未知流量;流量分析服務(wù)器920用于,獲取通信網(wǎng)元910接收的獲取未知流量或者獲取通信網(wǎng)元910接收的未知流量的鏡像,基于深層包檢測(cè)技術(shù)對(duì)上述未知流量或未知流量的鏡像進(jìn)行識(shí)別;當(dāng)上述深層包檢測(cè)識(shí)別系統(tǒng)基于深層包檢測(cè)技術(shù)未能識(shí)別出上述未知流量或未知流量的鏡像時(shí),按照N個(gè)維度分別計(jì)算上述未知流量或未知流量的鏡像與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到上述未知流量或未知流量的鏡像與樣本流量的匹配相似度,其中,上述N為大于或等于2的整數(shù),其中,上述N個(gè)維度可包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度、與流量自身相關(guān)的n3個(gè)維度,其中,上述n1、n2和n3為正整數(shù)。其中,與流量的報(bào)文相關(guān)的n1個(gè)維度是將流量中報(bào)文(例如報(bào)文頭和/或報(bào)文負(fù)載)作為分析角度的n1個(gè)維度,與流量的報(bào)文相關(guān)的n1個(gè)維度例如可包括:以流量中報(bào)文的長(zhǎng)度為維度、以流量中報(bào)文的負(fù)載內(nèi)容為維度、以流量中報(bào)文的端口號(hào)為維度等。其中,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度是將流量所對(duì)應(yīng)的會(huì)話作為分析角度的n2個(gè)維度,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度例如可包括:以流量所對(duì)應(yīng)會(huì)話的上行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的下行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的上下行包數(shù)量比值為維度、以流量所對(duì)應(yīng)會(huì)話的上行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的下行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的上下行流量值比值為維度等。與流量自身相關(guān)的n3個(gè)維度是將流量本身作為分析角度的n3個(gè)維度,這n3個(gè)維度與流量中各報(bào)文的負(fù)載無關(guān)、也與流量所對(duì)應(yīng)的會(huì)話無關(guān),與流量自身相關(guān)的n3個(gè)維度例如可包括以流量前M個(gè)包的流量值為維度、以流量的發(fā)包速率為維度等,以此類推。可以理解,本實(shí)施例的通信網(wǎng)元例如可為基站、基站控制器、網(wǎng)關(guān)、各種數(shù)據(jù)服務(wù)器等網(wǎng)絡(luò)中可用于傳輸業(yè)務(wù)流量的網(wǎng)元。在本發(fā)明的一些實(shí)施例中,流量分析服務(wù)器920按照N個(gè)維度分別計(jì)算上述未知流量或未知流量的鏡像與樣本流量的相似度包括:執(zhí)行如下相似度計(jì)算操作中的至少兩種:計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文端口號(hào)的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的發(fā)包速率的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上行包數(shù)量的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的下行包數(shù)量的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上下行包數(shù)量比值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上行流量值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的下行流量值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上下行流量值的比值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的前M個(gè)包的流量值的相似度。在本發(fā)明的一些實(shí)施例中,在計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,流量分析服務(wù)器920可具體用于:計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的字符相似度;計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的匹配度;計(jì)算上述匹配度的平方根與上述字符相似度的乘積,其中,計(jì)算得到的上述乘積為上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度,其中,上述字符相似度等于上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相同字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);上述匹配度等于1減去上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的區(qū)別度,其中,上述區(qū)別度等于上述樣本流量的報(bào)文負(fù)載內(nèi)容中與上述未知流量或未知流量的鏡像不相同的字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù)。在本發(fā)明的另一些實(shí)施例中,在上述計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,流量分析服務(wù)器920也可具體用于:假設(shè)未知流量的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,比較兩個(gè)字符串的相似度sim(s1,s2),假設(shè)字符串s1和字符串s2中含有n個(gè)不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉(zhuǎn)換為對(duì)兩個(gè)字符串對(duì)應(yīng)的向量v1和v2之間夾角大小的判斷,余弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,未知流量和樣本流量的負(fù)載內(nèi)容相似度越大;相反,余弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,未知流量和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明另一些實(shí)施例中,在上述計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,流量分析服務(wù)器920也可具體用于:假設(shè)未知流量的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,可用一個(gè)矩陣來記錄兩個(gè)字符串中所有位置的兩個(gè)字符之間的匹配情況,若匹配(相同)則為1,否則為0,然后,求出矩陣中對(duì)角線最長(zhǎng)的1個(gè)序列,其對(duì)應(yīng)的位置就是最長(zhǎng)匹配子串的位置,例如最長(zhǎng)公共子串越長(zhǎng),則表示兩個(gè)字符串的相似度越大,即未知流量和樣本流量的負(fù)載內(nèi)容的相似度越大,相反,最長(zhǎng)公共子串越短,則可認(rèn)為兩個(gè)字符串的相似度越小,即,未知流量和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明的一些實(shí)施例中,在計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度的方面,流量分析服務(wù)器920可具體用于:將上述未知流量或未知流量的鏡像的報(bào)文長(zhǎng)度除以上述樣本流量的報(bào)文長(zhǎng)度以得到商,其中,上述商為上述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度;或者,確定上述未知流量或未知流量的鏡像的報(bào)文長(zhǎng)度所落入的第一長(zhǎng)度區(qū)域,根據(jù)長(zhǎng)度區(qū)域與相似度值的對(duì)應(yīng)關(guān)系,確定出所述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值,其中,上述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值為上述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度??梢岳斫獾氖?,上述未知流量和未知流量的鏡像的內(nèi)容基本相同,上述未知流量與樣本流量的匹配相似度,等于上述未知流量的鏡像與樣本流量的匹配相似度??梢岳斫獾氖牵鲜雠e例主要是針對(duì)某條未知流量和樣本流量來進(jìn)行匹配相似度計(jì)算的,對(duì)于存著多個(gè)樣本流量的場(chǎng)景,可按類似方式,分別計(jì)算未知流量和各個(gè)樣本流量的匹配相似度。同理,對(duì)應(yīng)存著多條未知流量的場(chǎng)景,亦可按類似方式,分別計(jì)算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述。由上可見,本發(fā)明實(shí)施例方案中,流量分析服務(wù)器920從通信網(wǎng)元910獲取未知流量后,基于深層包檢測(cè)技術(shù)對(duì)上述未知流量進(jìn)行識(shí)別,當(dāng)基于深層包檢測(cè)技術(shù)未能識(shí)別出未知流量時(shí),流量分析服務(wù)器920按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到未知流量與樣本流量的匹配相似度,其中,N為大于或等于2的整數(shù)。由于可利用設(shè)備來進(jìn)行近似流量分析的機(jī)制,可提供在線分析能力,有利于提升自動(dòng)化率,減少分析時(shí)間,有利于提高流量分析的效率,由于是按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度,并對(duì)N個(gè)維度得到的相似度進(jìn)行綜合,N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度,相對(duì)于常規(guī)單維度匹配機(jī)制,本發(fā)明實(shí)施例提出的技術(shù)方案從與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度等極具代表性的維度中選擇N個(gè)維度來進(jìn)行組合分析,這樣就有利于極大的提高流量分析的準(zhǔn)確性,進(jìn)而有利于為相關(guān)業(yè)務(wù)計(jì)費(fèi)提供有效支撐。參見圖10、本發(fā)明實(shí)施例還提供一種通信系統(tǒng),可包括:通信網(wǎng)元1010和近似匹配服務(wù)器1020,其中,通信網(wǎng)元1010用于接收未知流量,基于深層包檢測(cè)技術(shù)對(duì)上述未知流量進(jìn)行識(shí)別,若未能識(shí)別出上述未知流量,向近似匹配服務(wù)器1020發(fā)送未能識(shí)別出的上述未知流量或者上述未能識(shí)別出的上述未知流量的鏡像;近似匹配服務(wù)器1020用于,接收來自通信網(wǎng)元1010的未能識(shí)別出的上述未知流量或所述未知流量的鏡像,按照N個(gè)維度分別計(jì)算上述未知流量或未知流量的鏡像與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到上述未知流量或未知流量的鏡像與樣本流量的匹配相似度,其中,上述N為大于或等于2的整數(shù),其中,上述N個(gè)維度可包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度、與流量自身相關(guān)的n3個(gè)維度,其中,上述n1、n2、n3為正整數(shù)??梢岳斫獾氖?,上述未知流量和未知流量的鏡像的內(nèi)容基本相同,上述未知流量與樣本流量的匹配相似度,等于上述未知流量的鏡像與樣本流量的匹配相似度。其中,與流量的報(bào)文相關(guān)的n1個(gè)維度是將流量中報(bào)文(例如報(bào)文頭和/或報(bào)文負(fù)載)作為分析角度的n1個(gè)維度,與流量的報(bào)文相關(guān)的n1個(gè)維度例如可包括:以流量中報(bào)文的長(zhǎng)度為維度、以流量中報(bào)文的負(fù)載內(nèi)容為維度、以流量中報(bào)文的端口號(hào)為維度等。其中,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度是將流量所對(duì)應(yīng)的會(huì)話作為分析角度的n2個(gè)維度,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度例如可包括:以流量所對(duì)應(yīng)會(huì)話的上行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的下行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的上下行包數(shù)量比值為維度、以流量所對(duì)應(yīng)會(huì)話的上行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的下行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的上下行流量值比值為維度等。與流量自身相關(guān)的n3個(gè)維度是將流量本身作為分析角度的n3個(gè)維度,這n3個(gè)維度與流量中各報(bào)文的負(fù)載無關(guān)、也與流量所對(duì)應(yīng)的會(huì)話無關(guān),與流量自身相關(guān)的n3個(gè)維度例如可包括以流量前M個(gè)包的流量值為維度、以流量的發(fā)包速率為維度等,以此類推??梢岳斫?,本實(shí)施例的通信網(wǎng)元例如可為基站、基站控制器、網(wǎng)關(guān)、各種數(shù)據(jù)服務(wù)器等網(wǎng)絡(luò)中可用于傳輸業(yè)務(wù)流量的網(wǎng)元。在本發(fā)明的一些實(shí)施例中,在按照N個(gè)維度分別計(jì)算上述未知流量或未知流量的鏡像與樣本流量的相似度的方面,近似匹配服務(wù)器1020可具體用于:執(zhí)行如下相似度計(jì)算操作中的至少兩種:計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文端口號(hào)的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的發(fā)包速率的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上行包數(shù)量的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的下行包數(shù)量的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上下行包數(shù)量比值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上行流量值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的下行流量值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上下行流量值的比值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的前M個(gè)包的流量值的相似度。在本發(fā)明的一些實(shí)施例中,在計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,近似匹配服務(wù)器1020可具體用于:計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的字符相似度;計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的匹配度;計(jì)算上述匹配度的平方根與上述字符相似度的乘積,其中,計(jì)算得到的上述乘積為上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度,其中,上述字符相似度等于上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相同字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);上述匹配度等于1減去上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的區(qū)別度,其中,上述區(qū)別度等于上述樣本流量的報(bào)文負(fù)載內(nèi)容中與上述未知流量或未知流量的鏡像不相同的字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù)。在本發(fā)明的另一些實(shí)施例中,在上述計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,近似匹配服務(wù)器1020也可具體用于:假設(shè)未知流量的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,比較兩個(gè)字符串的相似度sim(s1,s2),假設(shè)字符串s1和字符串s2中含有n個(gè)不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉(zhuǎn)換為對(duì)兩個(gè)字符串對(duì)應(yīng)的向量v1和v2之間夾角大小的判斷,余弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,未知流量和樣本流量的負(fù)載內(nèi)容相似度越大;相反,余弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,未知流量和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明另一些實(shí)施例中,在上述計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,近似匹配服務(wù)器1020也可具體用于:假設(shè)未知流量的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,可用一個(gè)矩陣來記錄兩個(gè)字符串中所有位置的兩個(gè)字符之間的匹配情況,若匹配(相同)則為1,否則為0,然后,求出矩陣中對(duì)角線最長(zhǎng)的1個(gè)序列,其對(duì)應(yīng)的位置就是最長(zhǎng)匹配子串的位置,例如最長(zhǎng)公共子串越長(zhǎng),則表示兩個(gè)字符串的相似度越大,即未知流量和樣本流量的負(fù)載內(nèi)容的相似度越大,相反,最長(zhǎng)公共子串越短,則可認(rèn)為兩個(gè)字符串的相似度越小,即,未知流量和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明的一些實(shí)施例中,在計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度的方面,近似匹配服務(wù)器1020可具體用于,將上述未知流量或未知流量的鏡像的報(bào)文長(zhǎng)度除以上述樣本流量的報(bào)文長(zhǎng)度以得到商,其中,上述商為上述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度;或者,確定上述未知流量或未知流量的鏡像的報(bào)文長(zhǎng)度所落入的第一長(zhǎng)度區(qū)域,根據(jù)長(zhǎng)度區(qū)域與相似度值的對(duì)應(yīng)關(guān)系,確定出所述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值,其中,上述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值為上述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度。可以理解的是,上述舉例主要是針對(duì)某條未知流量和樣本流量來進(jìn)行匹配相似度計(jì)算的,對(duì)于存著多個(gè)樣本流量的場(chǎng)景,可按類似方式,分別計(jì)算未知流量和各個(gè)樣本流量的匹配相似度。同理,對(duì)應(yīng)存著多條未知流量的場(chǎng)景,亦可按類似方式,分別計(jì)算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述。由上可見,本發(fā)明實(shí)施例的方案中,通信網(wǎng)元1010接到未知流量后,基于深層包檢測(cè)技術(shù)對(duì)上述未知流量進(jìn)行識(shí)別,當(dāng)基于深層包檢測(cè)技術(shù)未能識(shí)別出未知流量時(shí),近似匹配服務(wù)器1020按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到未知流量與樣本流量的匹配相似度,其中,N為大于或等于2的整數(shù)。由于可利用設(shè)備來進(jìn)行近似流量分析的機(jī)制,可提供在線分析能力,有利于提升自動(dòng)化率,減少分析時(shí)間,有利于提高流量分析的效率,由于是按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度,并對(duì)N個(gè)維度得到的相似度進(jìn)行綜合,N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度,相對(duì)于常規(guī)單維度匹配機(jī)制,本發(fā)明實(shí)施例提出的技術(shù)方案從與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度等極具代表性的維度中選擇N個(gè)維度來進(jìn)行組合分析,這樣就有利于極大的提高流量分析的準(zhǔn)確性,進(jìn)而有利于為相關(guān)業(yè)務(wù)計(jì)費(fèi)提供有效支撐。參見圖11,本發(fā)明實(shí)施例還提供一種通信系統(tǒng),可包括:通信網(wǎng)元1110和深層包檢測(cè)識(shí)別服務(wù)器1120,其中,通信網(wǎng)元1110用于接收未知流量;上述深層包檢測(cè)識(shí)別服務(wù)器1120,用于獲取通信網(wǎng)元1110接收的未知流量或者獲取通信網(wǎng)元1110接收的未知流量的鏡像;基于深層包檢測(cè)技術(shù)對(duì)來自通信網(wǎng)元1110的上述未知流量進(jìn)行識(shí)別,若未能識(shí)別出上述未知流量,向通信網(wǎng)元1110發(fā)送未能識(shí)別出的上述未知流量或未能識(shí)別出的上述未知流量的鏡像;通信網(wǎng)元1110還用于,接收來自深層包檢測(cè)識(shí)別服務(wù)器1120的上述未能識(shí)別出的上述未知流量或未知流量的鏡像,按照N個(gè)維度分別計(jì)算上述未知流量或未知流量的鏡像與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到上述未知流量或未知流量的鏡像與樣本流量的匹配相似度,其中,上述N為大于或等于2的整數(shù),其中,上述N個(gè)維度可包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度、與流量自身相關(guān)的n3個(gè)維度,其中,上述n1、n2、n3為正整數(shù)??梢岳斫獾氖?,上述未知流量和未知流量的鏡像的內(nèi)容基本相同,上述未知流量與樣本流量的匹配相似度,等于上述未知流量的鏡像與樣本流量的匹配相似度。其中,與流量的報(bào)文相關(guān)的n1個(gè)維度是將流量中報(bào)文(例如報(bào)文頭和/或報(bào)文負(fù)載)作為分析角度的n1個(gè)維度,與流量的報(bào)文相關(guān)的n1個(gè)維度例如可包括:以流量中報(bào)文的長(zhǎng)度為維度、以流量中報(bào)文的負(fù)載內(nèi)容為維度、以流量中報(bào)文的端口號(hào)為維度等。其中,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度是將流量所對(duì)應(yīng)的會(huì)話作為分析角度的n2個(gè)維度,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度例如可包括:以流量所對(duì)應(yīng)會(huì)話的上行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的下行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的上下行包數(shù)量比值為維度、以流量所對(duì)應(yīng)會(huì)話的上行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的下行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的上下行流量值比值為維度等。與流量自身相關(guān)的n3個(gè)維度是將流量本身作為分析角度的n3個(gè)維度,這n3個(gè)維度與流量中各報(bào)文的負(fù)載無關(guān)、也與流量所對(duì)應(yīng)的會(huì)話無關(guān),與流量自身相關(guān)的n3個(gè)維度例如可包括以流量前M個(gè)包的流量值為維度、以流量的發(fā)包速率為維度等,以此類推??梢岳斫猓緦?shí)施例通信網(wǎng)元1110例如可為基站、基站控制器、網(wǎng)關(guān)或各種數(shù)據(jù)服務(wù)器等網(wǎng)絡(luò)中可用于傳輸業(yè)務(wù)流量的網(wǎng)元。在本發(fā)明的一些實(shí)施例中,在按照N個(gè)維度分別計(jì)算上述未知流量或未知流量的鏡像與樣本流量的相似度的方面,通信網(wǎng)元1110可具體用于:執(zhí)行如下相似度計(jì)算操作中的至少兩種:計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文端口號(hào)的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的發(fā)包速率的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上行包數(shù)量的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的下行包數(shù)量的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上下行包數(shù)量比值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上行流量值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的下行流量值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上下行流量值的比值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的前M個(gè)包的流量值的相似度。在本發(fā)明的一些實(shí)施例中,在計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,通信網(wǎng)元1110可具體用于,計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的字符相似度;計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的匹配度;計(jì)算上述匹配度的平方根與上述字符相似度的乘積,其中,計(jì)算得到的上述乘積為上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度,其中,上述字符相似度等于上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相同字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);上述匹配度等于1減去上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的區(qū)別度,其中,上述區(qū)別度等于上述樣本流量的報(bào)文負(fù)載內(nèi)容中與上述未知流量或未知流量的鏡像不相同的字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù)。在本發(fā)明的另一些實(shí)施例中,在上述計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,通信網(wǎng)元1110也可具體用于:假設(shè)未知流量的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,比較兩個(gè)字符串的相似度sim(s1,s2),假設(shè)字符串s1和字符串s2中含有n個(gè)不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉(zhuǎn)換為對(duì)兩個(gè)字符串對(duì)應(yīng)的向量v1和v2之間夾角大小的判斷,余弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,未知流量和樣本流量的負(fù)載內(nèi)容相似度越大;相反,余弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,未知流量和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明另一些實(shí)施例中,在上述計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,通信網(wǎng)元1110也可具體用于:假設(shè)未知流量的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,可用一個(gè)矩陣來記錄兩個(gè)字符串中所有位置的兩個(gè)字符之間的匹配情況,若匹配(相同)則為1,否則為0,然后,求出矩陣中對(duì)角線最長(zhǎng)的1個(gè)序列,其對(duì)應(yīng)的位置就是最長(zhǎng)匹配子串的位置,例如最長(zhǎng)公共子串越長(zhǎng),則表示兩個(gè)字符串的相似度越大,即未知流量和樣本流量的負(fù)載內(nèi)容的相似度越大,相反,最長(zhǎng)公共子串越短,則可認(rèn)為兩個(gè)字符串的相似度越小,即,未知流量和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明的一些實(shí)施例中,在計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度的方面,通信網(wǎng)元1110可具體用于:將上述未知流量或未知流量的鏡像的報(bào)文長(zhǎng)度除以上述樣本流量的報(bào)文長(zhǎng)度以得到商,其中,上述商為上述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度;或者,確定上述未知流量或未知流量的鏡像的報(bào)文長(zhǎng)度所落入的第一長(zhǎng)度區(qū)域,根據(jù)長(zhǎng)度區(qū)域與相似度值的對(duì)應(yīng)關(guān)系,確定出所述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值,其中,上述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值為上述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度。可以理解的是,上述舉例主要是針對(duì)某條未知流量和樣本流量來進(jìn)行匹配相似度計(jì)算的,對(duì)于存著多個(gè)樣本流量的場(chǎng)景,可按類似方式,分別計(jì)算未知流量和各個(gè)樣本流量的匹配相似度。同理,對(duì)應(yīng)存著多條未知流量的場(chǎng)景,亦可按類似方式,分別計(jì)算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述。由上可見,本發(fā)明實(shí)施例的方案中,深層包檢測(cè)識(shí)別服務(wù)器1120,用于從通信網(wǎng)元1110獲取未知流量;基于深層包檢測(cè)技術(shù)對(duì)來自通信網(wǎng)元1110的上述未知流量進(jìn)行識(shí)別,若未能識(shí)別出上述未知流量,向通信網(wǎng)元1110發(fā)送未能識(shí)別出的上述未知流量,通信網(wǎng)元1110接到未知流量后按N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到未知流量與樣本流量的匹配相似度,其中,N為大于或等于2的整數(shù)。由于可利用設(shè)備來進(jìn)行近似流量分析的機(jī)制,可提供在線分析能力,有利于提升自動(dòng)化率,減少分析時(shí)間,有利于提高流量分析的效率,由于是按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度,并對(duì)N個(gè)維度得到的相似度進(jìn)行綜合,N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度,相對(duì)于常規(guī)單維度匹配機(jī)制,本發(fā)明實(shí)施例提出的技術(shù)方案從與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度等極具代表性的維度中選擇N個(gè)維度來進(jìn)行組合分析,這樣就有利于極大的提高流量分析的準(zhǔn)確性,進(jìn)而有利于為相關(guān)業(yè)務(wù)計(jì)費(fèi)提供有效支撐。參見圖12,本發(fā)明實(shí)施例提供還一種通信系統(tǒng),可包括:通信網(wǎng)元1210、深層包檢測(cè)識(shí)別服務(wù)器1220和近似匹配服務(wù)器1230,其中,通信網(wǎng)元1210,用于接收未知流量;深層包檢測(cè)識(shí)別服務(wù)器1220,用于獲取通信網(wǎng)元1210接收的未知流量或者獲取通信網(wǎng)元1210接收的未知流量的鏡像;基于深層包檢測(cè)技術(shù)對(duì)通信網(wǎng)元1210的上述未知流量或未知流量的鏡像進(jìn)行識(shí)別,若未能識(shí)別出上述未知流量或未知流量的鏡像,向近似匹配服務(wù)器1230發(fā)送未能識(shí)別出的上述未知流量或未能識(shí)別出的上述未知流量的鏡像;近似匹配服務(wù)器1230,用于接收來自深層包檢測(cè)識(shí)別服務(wù)器1220的上述未能識(shí)別出的上述未知流量或未知流量的鏡像,按照N個(gè)維度分別計(jì)算上述未知流量或未知流量的鏡像與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到上述未知流量或未知流量的鏡像與樣本流量的匹配相似度,其中,上述N個(gè)維度可包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度、與流量自身相關(guān)的n3個(gè)維度,其中,上述n1、n2、n3為正整數(shù)??梢岳斫獾氖?,上述未知流量和未知流量的鏡像的內(nèi)容基本相同,上述未知流量與樣本流量的匹配相似度,等于上述未知流量的鏡像與樣本流量的匹配相似度。其中,與流量的報(bào)文相關(guān)的n1個(gè)維度是將流量中報(bào)文(例如報(bào)文頭和/或報(bào)文負(fù)載)作為分析角度的n1個(gè)維度,與流量的報(bào)文相關(guān)的n1個(gè)維度例如可包括:以流量中報(bào)文的長(zhǎng)度為維度、以流量中報(bào)文的負(fù)載內(nèi)容為維度、以流量中報(bào)文的端口號(hào)為維度等。其中,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度是將流量所對(duì)應(yīng)的會(huì)話作為分析角度的n2個(gè)維度,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度例如可包括:以流量所對(duì)應(yīng)會(huì)話的上行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的下行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的上下行包數(shù)量比值為維度、以流量所對(duì)應(yīng)會(huì)話的上行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的下行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的上下行流量值比值為維度等。與流量自身相關(guān)的n3個(gè)維度是將流量本身作為分析角度的n3個(gè)維度,這n3個(gè)維度與流量中各報(bào)文的負(fù)載無關(guān)、也與流量所對(duì)應(yīng)的會(huì)話無關(guān),與流量自身相關(guān)的n3個(gè)維度例如可包括以流量前M個(gè)包的流量值為維度、以流量的發(fā)包速率為維度等,以此類推??梢岳斫?,本實(shí)施例的通信網(wǎng)元例如可為基站、基站控制器、網(wǎng)關(guān)、各種數(shù)據(jù)服務(wù)器等網(wǎng)絡(luò)中可用于傳輸業(yè)務(wù)流量的網(wǎng)元。在本發(fā)明的一些實(shí)施例中,在按照N個(gè)維度分別計(jì)算上述未知流量或未知流量的鏡像與樣本流量的相似度的方面,近似匹配服務(wù)器1230可具體用于:執(zhí)行如下相似度計(jì)算操作中的至少兩種:計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文端口號(hào)的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的發(fā)包速率的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上行包數(shù)量的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的下行包數(shù)量的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上下行包數(shù)量比值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上行流量值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的下行流量值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的上下行流量值的比值的相似度、計(jì)算上述未知流量或未知流量的鏡像與樣本流量的前M個(gè)包的流量值的相似度。在本發(fā)明的一些實(shí)施例中,在計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,近似匹配服務(wù)器1230可具體用于:計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的字符相似度;計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的匹配度;計(jì)算上述匹配度的平方根與上述字符相似度的乘積,其中,計(jì)算得到的上述乘積為上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度,其中,上述字符相似度等于上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的相同字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);上述匹配度等于1減去上述未知流量或未知流量的鏡像與樣本流量的報(bào)文負(fù)載內(nèi)容的區(qū)別度,其中,上述區(qū)別度等于上述樣本流量的報(bào)文負(fù)載內(nèi)容中與上述未知流量或未知流量的鏡像不相同的字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù)。在本發(fā)明的另一些實(shí)施例中,在上述計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,近似匹配服務(wù)器1230也可具體用于:假設(shè)未知流量的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,比較兩個(gè)字符串的相似度sim(s1,s2),假設(shè)字符串s1和字符串s2中含有n個(gè)不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉(zhuǎn)換為對(duì)兩個(gè)字符串對(duì)應(yīng)的向量v1和v2之間夾角大小的判斷,余弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,未知流量和樣本流量的負(fù)載內(nèi)容相似度越大;相反,余弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,未知流量和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明另一些實(shí)施例中,在上述計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,近似匹配服務(wù)器1230也可具體用于:假設(shè)未知流量的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,可用一個(gè)矩陣來記錄兩個(gè)字符串中所有位置的兩個(gè)字符之間的匹配情況,若匹配(相同)則為1,否則為0,然后,求出矩陣中對(duì)角線最長(zhǎng)的1個(gè)序列,其對(duì)應(yīng)的位置就是最長(zhǎng)匹配子串的位置,例如最長(zhǎng)公共子串越長(zhǎng),則表示兩個(gè)字符串的相似度越大,即未知流量和樣本流量的負(fù)載內(nèi)容的相似度越大,相反,最長(zhǎng)公共子串越短,則可認(rèn)為兩個(gè)字符串的相似度越小,即,未知流量和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明一些實(shí)施例中,在計(jì)算上述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度的方面,近似匹配服務(wù)器1230可具體用于:將上述未知流量或未知流量的鏡像的報(bào)文長(zhǎng)度除以上述樣本流量的報(bào)文長(zhǎng)度以得到商,其中,上述商為上述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度;或者,確定上述未知流量或未知流量的鏡像的報(bào)文長(zhǎng)度所落入的第一長(zhǎng)度區(qū)域,根據(jù)長(zhǎng)度區(qū)域與相似度值的對(duì)應(yīng)關(guān)系,確定出所述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值,其中,上述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值為上述未知流量或未知流量的鏡像與樣本流量的報(bào)文長(zhǎng)度的相似度。可以理解的是,上述舉例主要是針對(duì)某條未知流量和樣本流量來進(jìn)行匹配相似度計(jì)算的,對(duì)于存著多個(gè)樣本流量的場(chǎng)景,可按類似方式,分別計(jì)算未知流量和各個(gè)樣本流量的匹配相似度。同理,對(duì)應(yīng)存著多條未知流量的場(chǎng)景,亦可按類似方式,分別計(jì)算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述。由上可見,本發(fā)明實(shí)施例的方案中,深層包檢測(cè)識(shí)別服務(wù)器1220,用于從通信網(wǎng)元1210獲取未知流量;基于深層包檢測(cè)技術(shù)對(duì)來自通信網(wǎng)元1010的上述未知流量進(jìn)行識(shí)別,若未能識(shí)別出上述未知流量,向近似匹配服務(wù)器1230發(fā)送未能識(shí)別出的上述未知流量,近似匹配服務(wù)器1230接到未知流量后按N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到未知流量與樣本流量的匹配相似度,其中,N為大于或等于2的整數(shù)。由于可利用設(shè)備來進(jìn)行近似流量分析的機(jī)制,可提供在線分析能力,有利于提升自動(dòng)化率,減少分析時(shí)間,有利于提高流量分析的效率,由于是按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度,并對(duì)N個(gè)維度得到的相似度進(jìn)行綜合,N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度,相對(duì)于常規(guī)單維度匹配機(jī)制,本發(fā)明實(shí)施例提出的技術(shù)方案從與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度等極具代表性的維度中選擇N個(gè)維度來進(jìn)行組合分析,這樣就有利于極大的提高流量分析的準(zhǔn)確性,進(jìn)而有利于為相關(guān)業(yè)務(wù)計(jì)費(fèi)提供有效支撐。圖13描述了本發(fā)明實(shí)施例提供的一種近似匹配服務(wù)器1300的結(jié)構(gòu),近似匹配服務(wù)器1300包括:至少1個(gè)處理器1301,例如CPU,至少一個(gè)網(wǎng)絡(luò)接口1304或者其他用戶接口1303,存儲(chǔ)器1305,至少一個(gè)通信總線1302。通信總線1302用于實(shí)現(xiàn)這些組件之間的連接通信。該近似匹配服務(wù)器1300可選的包含用戶接口1303,包括顯示器,鍵盤或者點(diǎn)擊設(shè)備(例如,鼠標(biāo),軌跡球(trackball),觸感板或者觸感顯示屏)。存儲(chǔ)器1305可能包含高速RAM存儲(chǔ)器,也可能還包括非不穩(wěn)定的存儲(chǔ)器(non-volatilememory),例如至少一個(gè)磁盤存儲(chǔ)器。存儲(chǔ)器1305可選的可以包含至少一個(gè)位于遠(yuǎn)離前述處理器1301的存儲(chǔ)裝置。在一些實(shí)施方式中,存儲(chǔ)器1305存儲(chǔ)了如下的元素,可執(zhí)行模塊或者數(shù)據(jù)結(jié)構(gòu),或者他們的子集,或者他們的擴(kuò)展集:操作系統(tǒng)13051,包含各種系統(tǒng)程序,用于實(shí)現(xiàn)各種基礎(chǔ)業(yè)務(wù)以及處理基于硬件的任務(wù);應(yīng)用程序模塊13052,包含各種應(yīng)用程序,用于實(shí)現(xiàn)各種應(yīng)用業(yè)務(wù)。應(yīng)用程序模塊13052中包括但不限于獲取單元510和相似度計(jì)算單元520。應(yīng)用程序模塊13052中各模塊的具體實(shí)現(xiàn)參見圖5所示實(shí)施例中的相應(yīng)模塊,在此不贅述。在本發(fā)明一些實(shí)施例中,通過調(diào)用存儲(chǔ)器1305存儲(chǔ)的程序或指令,處理器1301可用于獲取未知流量;按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到上述未知流量與樣本流量的匹配相似度,其中,上述N為大于或等于2的整數(shù)。在本發(fā)明的一些實(shí)施例中,處理器1301可以在當(dāng)基于深層包檢測(cè)技術(shù)未能識(shí)別出上述未知流量時(shí),按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度,對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào),以得到上述未知流量與樣本流量的匹配相似度,其中,上述N為大于或等于2的整數(shù)。其中,上述N個(gè)維度可包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度、與流量自身相關(guān)的n3個(gè)維度,其中,上述n1、n2、n3為正整數(shù)。其中,與流量的報(bào)文相關(guān)的n1個(gè)維度是將流量中報(bào)文(例如報(bào)文頭和/或報(bào)文負(fù)載)作為分析角度的n1個(gè)維度,與流量的報(bào)文相關(guān)的n1個(gè)維度例如可包括:以流量中報(bào)文的長(zhǎng)度為維度、以流量中報(bào)文的負(fù)載內(nèi)容為維度、以流量中報(bào)文的端口號(hào)為維度等。其中,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度是將流量所對(duì)應(yīng)的會(huì)話作為分析角度的n2個(gè)維度,與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度例如可包括:以流量所對(duì)應(yīng)會(huì)話的上行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的下行包數(shù)量為維度、以流量所對(duì)應(yīng)會(huì)話的上下行包數(shù)量比值為維度、以流量所對(duì)應(yīng)會(huì)話的上行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的下行流量值為維度、以流量所對(duì)應(yīng)會(huì)話的上下行流量值比值為維度等。與流量自身相關(guān)的n3個(gè)維度是將流量本身作為分析角度的n3個(gè)維度,這n3個(gè)維度與流量中各報(bào)文的負(fù)載無關(guān)、也與流量所對(duì)應(yīng)的會(huì)話無關(guān),與流量自身相關(guān)的n3個(gè)維度例如可包括以流量前M個(gè)包的流量值為維度、以流量的發(fā)包速率為維度等,以此類推。在本發(fā)明的一些實(shí)施例中,若得到的樣本流量與上述未知流量的匹配相似度大于設(shè)定的相似度閾值,則處理器1301可輸出未知流量與樣本流量的匹配成功的流量識(shí)別結(jié)果(其中,該流量識(shí)別結(jié)果例如可指示出上述未知流量與樣本流量的業(yè)務(wù)類型相同等,此時(shí)可按照樣本流量的業(yè)務(wù)類型所對(duì)應(yīng)的套餐計(jì)費(fèi)方式對(duì)上述未知流量進(jìn)行計(jì)費(fèi)。例如存在Fk1套餐業(yè)務(wù),針對(duì)用戶所有訪問Fk1的流量免費(fèi),F(xiàn)k1的外掛視頻流量和廣告流量單獨(dú)計(jì)費(fèi),其它業(yè)務(wù)場(chǎng)景以此類推),此外,若得到的樣本流量與上述未知流量的匹配相似度小于設(shè)定的相似度閾值,則處理器1301可輸出未知流量與樣本流量的匹配失敗的流量識(shí)別結(jié)果。其中,處理器1301可根據(jù)實(shí)際需要來選著用于識(shí)別的維度,針對(duì)不同的應(yīng)用場(chǎng)景不同的精度要求,選擇的維度可能不盡相同。舉例來說,處理器1301可以從下面舉例的幾個(gè)維度中選擇至少兩個(gè)維度來計(jì)算上述未知流量與樣本流量的相似度:報(bào)文負(fù)載內(nèi)容、報(bào)文長(zhǎng)度、報(bào)文端口號(hào)、發(fā)包速率、上行包數(shù)量、下行包數(shù)量、上下行包數(shù)量比值、上行流量值、下行流量值、上下行流量值的比值、前M個(gè)包的流量值等。當(dāng)然,本發(fā)明實(shí)施例并不限于上述舉例的相似度比較維度,其它維度亦可引入。在本發(fā)明的一些實(shí)施例中,在按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度的方面,處理器1301可具體用于:執(zhí)行如下相似度計(jì)算操作中的至少兩種:計(jì)算上述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度、計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度、計(jì)算上述未知流量與樣本流量的報(bào)文端口號(hào)的相似度、計(jì)算上述未知流量與樣本流量的發(fā)包速率的相似度、計(jì)算上述未知流量與樣本流量的上行包數(shù)量的相似度、計(jì)算上述未知流量與樣本流量的下行包數(shù)量的相似度、計(jì)算上述未知流量與樣本流量的上下行包數(shù)量比值的相似度、計(jì)算上述未知流量與樣本流量的上行流量值的相似度、計(jì)算上述未知流量與樣本流量的下行流量值的相似度、計(jì)算上述未知流量與樣本流量的上下行流量值的比值的相似度、計(jì)算上述未知流量與樣本流量的前M個(gè)包的流量值的相似度。在實(shí)際應(yīng)用中,可采用符合本領(lǐng)域計(jì)算邏輯的多種方式,按照相應(yīng)維度計(jì)算上述未知流量與樣本流量的相似度。例如,在計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,處理器1301可具體用于:計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的字符相似度;計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的匹配度;計(jì)算上述匹配度的平方根與上述字符相似度的乘積,其中,上述乘積為上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度,其中,上述字符相似度等于上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相同字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù);上述匹配度等于1減去上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的區(qū)別度,其中,上述區(qū)別度等于上述樣本流量的報(bào)文負(fù)載內(nèi)容中與上述未知流量不相同的字符數(shù),除以上述樣本流量的報(bào)文負(fù)載內(nèi)容的總字符數(shù)。在本發(fā)明的另一些實(shí)施例中,在上述計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,處理器1301也可具體用于:假設(shè)未知流量的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,比較兩個(gè)字符串的相似度sim(s1,s2),假設(shè)字符串s1和字符串s2中含有n個(gè)不同的字符,其分別為c1,c2,...cn,判斷字符串的相似度可轉(zhuǎn)換為對(duì)兩個(gè)字符串對(duì)應(yīng)的向量v1和v2之間夾角大小的判斷,余弦值越大,則表示其向量v1和v2之間的夾角越小,字符串s1與字符串s2的相似度越大,即,未知流量和樣本流量的負(fù)載內(nèi)容相似度越大;相反,余弦值越小,則表示其向量v1和v2之間的夾角越大,字符串s1與字符串s2的相似度越小,即,未知流量和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明另一些實(shí)施例中,在上述計(jì)算上述未知流量與樣本流量的報(bào)文負(fù)載內(nèi)容的相似度的方面,處理器1301也可具體用于:假設(shè)未知流量的負(fù)載內(nèi)容為字符串s1,樣本流量的負(fù)載內(nèi)容為字符串s2,可用一個(gè)矩陣來記錄兩個(gè)字符串中所有位置的兩個(gè)字符之間的匹配情況,若匹配(相同)則為1,否則為0,然后,求出矩陣中對(duì)角線最長(zhǎng)的1個(gè)序列,其對(duì)應(yīng)的位置就是最長(zhǎng)匹配子串的位置,例如最長(zhǎng)公共子串越長(zhǎng),則表示兩個(gè)字符串的相似度越大,即未知流量和樣本流量的負(fù)載內(nèi)容的相似度越大,相反,最長(zhǎng)公共子串越短,則可認(rèn)為兩個(gè)字符串的相似度越小,即,未知流量和樣本流量的負(fù)載內(nèi)容的相似度越小。在本發(fā)明的一些實(shí)施例中,在計(jì)算上述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度的方面,處理器1301可具體用于:將上述未知流量的報(bào)文長(zhǎng)度除以上述樣本流量的報(bào)文長(zhǎng)度以得到商,該商為上述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度;或者確定上述未知流量的報(bào)文長(zhǎng)度所落入的第一長(zhǎng)度區(qū)域,根據(jù)長(zhǎng)度區(qū)域與相似度值的對(duì)應(yīng)關(guān)系,確定出所述第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值,其中,與第一長(zhǎng)度區(qū)域?qū)?yīng)的相似度值,為上述未知流量與樣本流量的報(bào)文長(zhǎng)度的相似度。其中,其它維度的相似度計(jì)算方式可類推,此處不再一一舉例??梢岳斫獾氖?,本實(shí)施例近似匹配服務(wù)器1300可以用于實(shí)現(xiàn)上述方法實(shí)施例中的部分或全部技術(shù)方案,其各個(gè)功能模塊的功能可根據(jù)上述方法實(shí)施例中的方法具體實(shí)現(xiàn),其具體實(shí)現(xiàn)過程可參照上述實(shí)施例中的相關(guān)描述,此處不再贅述。可以理解的是,上述舉例主要是針對(duì)某條未知流量和樣本流量來進(jìn)行匹配相似度計(jì)算的,對(duì)于存著多個(gè)樣本流量的場(chǎng)景,可按類似方式,分別計(jì)算未知流量和各個(gè)樣本流量的匹配相似度。同理,對(duì)應(yīng)存著多條未知流量的場(chǎng)景,亦可按類似方式,分別計(jì)算各未知流量和樣本流量的匹配相似度,具體過程此處不再贅述??梢姡捎蒙鲜龇桨负?,處理器1301在獲取未知流量后按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度;對(duì)計(jì)算得到的各維度對(duì)應(yīng)的相似度進(jìn)行加權(quán)調(diào)和,以得到未知流量與樣本流量的匹配相似度,其中,N為大于或等于2的整數(shù)。由于提供了利用近似匹配服務(wù)器1300來進(jìn)行近似流量分析的機(jī)制,可提供在線分析能力,有利于提升自動(dòng)化率,減少分析時(shí)間,有利于提高流量分析的效率,由于是按照N個(gè)維度分別計(jì)算上述未知流量與樣本流量的相似度,并對(duì)N個(gè)維度得到的相似度進(jìn)行綜合,N個(gè)維度包括如下維度中的N個(gè)維度:與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度,相對(duì)于常規(guī)單維度匹配機(jī)制,本發(fā)明實(shí)施例提出的技術(shù)方案從與流量的報(bào)文相關(guān)的n1個(gè)維度、與流量所對(duì)應(yīng)的會(huì)話相關(guān)的n2個(gè)維度和與流量自身相關(guān)的n3個(gè)維度等極具代表性的維度中選擇N個(gè)維度來進(jìn)行組合分析,這樣就有利于極大的提高流量分析的準(zhǔn)確性,進(jìn)而有利于為相關(guān)業(yè)務(wù)計(jì)費(fèi)提供有效支撐。參見圖14-a,本發(fā)明實(shí)施例還提供一種通信網(wǎng)元1400,包括收發(fā)信機(jī)1401和與收發(fā)信機(jī)耦合的用于進(jìn)行網(wǎng)絡(luò)通信的處理器1403,通信網(wǎng)元1400還可包括:與收發(fā)信機(jī)1401耦合的近似識(shí)別引擎1402,其中,近似識(shí)別引擎1402例如可為近似匹配裝置500。在本發(fā)明的一些實(shí)施例中,如圖14-b所示,通信網(wǎng)元1400還可包括與收發(fā)信機(jī)1401耦合的DPI識(shí)別引擎1404,其中,DPI識(shí)別引擎1404可用于獲取未知流量,基于深層包檢測(cè)技術(shù)對(duì)該未知流量進(jìn)行識(shí)別。參見圖15-a,本發(fā)明實(shí)施例還提供一種流量分析服務(wù)器1500,流量分析服務(wù)器1500可包括:用于接收未知流量或未知流量的鏡像的接收器1501,與接收器1501耦合的近似識(shí)別引擎1502,以及用于發(fā)送所述未知流量或未知流量的鏡像或所述近似識(shí)別引擎1502輸出的未知流量或未知流量的鏡像與樣本流量的匹配相似度的發(fā)送器1503,其中,近似識(shí)別引擎1502例如可為近似匹配裝置500。在本發(fā)明的一些實(shí)施例中,如圖15-b所示,流量分析服務(wù)器1500還可包括與接收器1501耦合的DPI識(shí)別引擎1504,其中,DPI識(shí)別引擎1504可用于獲取未知流量或未知流量的鏡像,基于深層包檢測(cè)技術(shù)對(duì)該未知流量或未知流量的鏡像進(jìn)行識(shí)別。本發(fā)明實(shí)施例還提供一種計(jì)算機(jī)存儲(chǔ)介質(zhì),其中,該計(jì)算機(jī)存儲(chǔ)介質(zhì)可存儲(chǔ)有程序,該程序執(zhí)行時(shí)包括上述方法實(shí)施例中記載的近似匹配方法或流量分析方法的部分或全部步驟。需要說明的是,對(duì)于前述的各方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本發(fā)明所必須的。在上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述。在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的裝置,可通過其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性或其它的形式。所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上。可以根據(jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可為個(gè)人計(jì)算機(jī)、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、只讀存儲(chǔ)器(ROM,Read-OnlyMemory)、隨機(jī)存取存儲(chǔ)器(RAM,RandomAccessMemory)、移動(dòng)硬盤、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。以上所述,以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。