亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種高速路由器及防火墻中實(shí)現(xiàn)快速分組流識(shí)別的方法

文檔序號(hào):82014閱讀:245來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):一種高速路由器及防火墻中實(shí)現(xiàn)快速分組流識(shí)別的方法
技術(shù)領(lǐng)域
本發(fā)明涉及分組流的識(shí)別方法,屬于高速路由器及防火墻分組流識(shí)別技術(shù)領(lǐng)域

背景技術(shù)
目前TCP/IP網(wǎng)絡(luò),全部是通過(guò)路由器互連起來(lái)的,Internet就是成千上萬(wàn)個(gè)IP子網(wǎng)通過(guò)路由器互連起來(lái)的國(guó)際性網(wǎng)絡(luò)。這種網(wǎng)絡(luò)稱(chēng)為以路由器為基礎(chǔ)的網(wǎng)絡(luò)(router basednetwork),形成了以路由器為結(jié)點(diǎn)的“網(wǎng)間網(wǎng)”。在“網(wǎng)間網(wǎng)”中,路由器不僅負(fù)責(zé)對(duì)IP分組的轉(zhuǎn)發(fā),還要負(fù)責(zé)與別的路由器進(jìn)行聯(lián)絡(luò),共同確定“網(wǎng)間網(wǎng)”的路由選擇和維護(hù)路由表。
防火墻由軟件和硬件設(shè)備組合而成,處于企業(yè)或網(wǎng)絡(luò)群體計(jì)算機(jī)與外界通道(Internet)之間,限制外界用戶(hù)對(duì)內(nèi)部網(wǎng)絡(luò)訪問(wèn)及管理內(nèi)部用戶(hù)訪問(wèn)外界網(wǎng)絡(luò)的權(quán)限。其中包過(guò)濾是防火墻要實(shí)現(xiàn)的最基本功能。
流分類(lèi)是現(xiàn)代高性能路由器的一項(xiàng)關(guān)鍵技術(shù),當(dāng)然也應(yīng)用于防火墻的包過(guò)濾實(shí)現(xiàn)部分。路由器或防火墻通過(guò)對(duì)進(jìn)入其中的分組進(jìn)行分類(lèi)來(lái)決定分組的出口以及對(duì)分組要進(jìn)行何種處理操作。流是由規(guī)則來(lái)定義的,規(guī)則可以由網(wǎng)絡(luò)管理員通過(guò)網(wǎng)管系統(tǒng)設(shè)置,也可以由資源預(yù)留協(xié)議(RSVP)動(dòng)態(tài)生成。分組頭中用來(lái)分類(lèi)的典型域包括源IP地址(Source IP Address)、目的IP地址(Destination IP Address)、協(xié)議類(lèi)型(Protocol Type)、源端口(Source Port)和目的端口(Destination Port)等。
流分類(lèi)技術(shù)中,進(jìn)行分類(lèi)的依據(jù)是規(guī)則。規(guī)則是用來(lái)對(duì)IP包進(jìn)行分類(lèi)的由包頭中若干字段(域)組成的集合,通常也稱(chēng)作過(guò)濾器(filter)。而若干規(guī)則的集合就是分類(lèi)器,即規(guī)則庫(kù)。規(guī)則庫(kù)中的每條規(guī)則都定義了一個(gè)IP流的類(lèi),每一個(gè)類(lèi)具有一個(gè)唯一的標(biāo)識(shí),該標(biāo)識(shí)對(duì)應(yīng)著與該類(lèi)相關(guān)的唯一操作。規(guī)則、類(lèi)標(biāo)識(shí)和操作是一一對(duì)應(yīng)的。當(dāng)一IP分組P與規(guī)則R相匹配,該分組即被劃分到規(guī)則R所對(duì)應(yīng)的類(lèi)中。假設(shè)規(guī)則庫(kù)中每條規(guī)則包含k個(gè)域,R[i]是規(guī)則R的第i個(gè)域,1≤i≤k,則任一規(guī)則R可用一k維向量表示R=(R[1],R[2],…,R[k])。對(duì)于分組P,其分組頭的相應(yīng)k個(gè)域表示為(H[1],H[2],…,H[k]),如果對(duì)于任意i(1≤i≤k),分組頭的第i域H[i]均滿(mǎn)足R[i]的表達(dá)式,那么該分組就匹配規(guī)則R。其中,H[i]匹配R[i]有三種形式1)精確匹配(exact match)。分組頭的特定域值必須精確等于規(guī)則的對(duì)應(yīng)域值。如協(xié)議域?yàn)門(mén)CP;2)前綴匹配(prefix match)。規(guī)則的特定域值要求為分組頭相應(yīng)域值的前綴。該類(lèi)匹配通常用于目的地址和源地址,如前綴“101*”可以匹配所有以“101”開(kāi)頭的IP地址;3)范圍匹配(range match)。分組頭的特定域值要求在規(guī)則相應(yīng)域所定義的范圍之內(nèi)。該類(lèi)匹配通常用于目的端口號(hào)和源端口號(hào),如范圍“45-1023”可以匹配所有大于等于45且小于等于1023的端口號(hào)。
正因?yàn)榇嬖谇熬Y匹配和范圍匹配,所以一個(gè)分組可能會(huì)與多個(gè)規(guī)則相匹配,選擇最佳匹配是指確定匹配規(guī)則中優(yōu)先級(jí)最高或者代價(jià)最低的規(guī)則。
根據(jù)規(guī)則庫(kù)對(duì)分組分類(lèi)即是在規(guī)則庫(kù)中搜索給定分組的最佳匹配規(guī)則。
現(xiàn)有技術(shù)方案一分組流分類(lèi)的研究起源于路由器中轉(zhuǎn)發(fā)路由表的快速查詢(xún),路由表查詢(xún)實(shí)際上就是一個(gè)一維流分類(lèi)問(wèn)題。當(dāng)前應(yīng)用于路由器和防火墻中的流分類(lèi)算法有多種,與本發(fā)明相關(guān)的流分類(lèi)方案及其優(yōu)缺點(diǎn)如下所述采用啟發(fā)式算法,根據(jù)不同分類(lèi)器的規(guī)則數(shù)據(jù)庫(kù)的結(jié)構(gòu)和特性來(lái)優(yōu)化處理過(guò)程,提高處理速度,從性能評(píng)估的結(jié)果來(lái)看,這種設(shè)計(jì)方法通常是比較有效的。其中,HiCuts(Hierarchical Intelligent Cuttings)啟發(fā)式流分類(lèi)算法是現(xiàn)有流分類(lèi)算法當(dāng)中啟發(fā)式算法的一種,基于決策樹(shù),并支持范圍匹配,能夠應(yīng)用于路由器和防火墻中實(shí)現(xiàn)對(duì)數(shù)據(jù)包的分類(lèi)功能。
算法實(shí)現(xiàn)包括預(yù)處理和搜索匹配兩個(gè)過(guò)程。
預(yù)處理過(guò)程整個(gè)分類(lèi)器(路由器或防火墻自身存貯的規(guī)則庫(kù))建立一棵決策樹(shù)假設(shè)用于分類(lèi)的典型域有k個(gè),創(chuàng)建根結(jié)點(diǎn)表示整個(gè)k維空間;從k個(gè)域中選擇一個(gè)進(jìn)行空間范圍上的切割,產(chǎn)生子結(jié)點(diǎn),即每個(gè)子結(jié)點(diǎn)都覆蓋k維空間的一個(gè)子集。選擇域遵照的依據(jù)是該域包含的相異(不存在包含關(guān)系)規(guī)則數(shù)目最多;切割次數(shù)的確定滿(mǎn)足切割產(chǎn)生的子結(jié)點(diǎn)所占據(jù)的存儲(chǔ)空間在空間允許的域值(可計(jì)算)之內(nèi)情況下的最大值。依次類(lèi)推,對(duì)每個(gè)子結(jié)點(diǎn)實(shí)施如上的操作,選域,切割,逐漸構(gòu)造整個(gè)樹(shù)結(jié)構(gòu)。當(dāng)結(jié)點(diǎn)上覆蓋的規(guī)則數(shù)目小于等于binth值(人為確定的葉結(jié)點(diǎn)規(guī)則數(shù)目最大值),該結(jié)點(diǎn)不再繼續(xù)切割,成為葉子結(jié)點(diǎn),這樣每個(gè)葉子結(jié)點(diǎn)上存儲(chǔ)有一個(gè)小規(guī)則集。
搜索匹配過(guò)程分組到達(dá)路由器或防火墻后,被送到?jīng)Q策樹(shù)結(jié)構(gòu)的根結(jié)點(diǎn)處,根據(jù)自身各個(gè)分類(lèi)域的值所對(duì)應(yīng)的范圍選擇下行分支,最終到達(dá)葉子結(jié)點(diǎn),然后通過(guò)線性查找葉子結(jié)點(diǎn)上存儲(chǔ)的小規(guī)則集來(lái)找到匹配規(guī)則。
HiCuts算法應(yīng)用于路由器或防火墻時(shí)是在之上建立基于決策樹(shù)的數(shù)據(jù)結(jié)構(gòu),而決策樹(shù)性能可以從搜索時(shí)間和空間兩方面來(lái)衡量。搜索時(shí)間性能可以體現(xiàn)在樹(shù)的深度上深度越大,搜索時(shí)間越長(zhǎng),性能越差;空間性能可以體現(xiàn)在樹(shù)的結(jié)點(diǎn)數(shù)上,它反映了算法占用的存貯器空間的大小。
Hicuts算法建立數(shù)據(jù)結(jié)構(gòu)的方法,在樹(shù)結(jié)構(gòu)能夠?qū)崿F(xiàn)的時(shí)間性能和空間性能方面,考慮不足,無(wú)論從樹(shù)的平衡度(影響樹(shù)深)還是樹(shù)的整體規(guī)模(反映樹(shù)深和結(jié)點(diǎn)數(shù))上來(lái)看,都未能達(dá)到最優(yōu)(或接近最優(yōu))。在選擇切分域的方法上,采用了單一選擇的方法,有可能造成更優(yōu)效果的喪失;在切割次數(shù)的確定方法上,算法限定了一個(gè)空間允許的最大值,這種對(duì)空間性能的側(cè)重考慮可能造成生成的決策樹(shù)在整體性能上的下降,進(jìn)而影響路由器或是防火墻的工作性能。
現(xiàn)有技術(shù)方案二啟發(fā)式流分類(lèi)算法HyperCuts采用基于決策樹(shù)的數(shù)據(jù)結(jié)構(gòu),支持范圍匹配,是從Hicuts算法上衍生出來(lái)的,能夠應(yīng)用于路由器和防火墻中實(shí)現(xiàn)數(shù)據(jù)包的分類(lèi)功能。
算法實(shí)現(xiàn)包括預(yù)處理和搜索匹配兩個(gè)過(guò)程。
建立數(shù)據(jù)結(jié)構(gòu)的過(guò)程在每個(gè)結(jié)點(diǎn)上,根據(jù)規(guī)則一個(gè)或多個(gè)域上的信息對(duì)當(dāng)前結(jié)點(diǎn)上覆蓋的規(guī)則集進(jìn)行劃分,產(chǎn)生子結(jié)點(diǎn),直到結(jié)點(diǎn)上規(guī)則數(shù)目小于或等于域值binth時(shí),停止劃分,成為葉子結(jié)點(diǎn)。由于每次同時(shí)在一個(gè)或多個(gè)域上進(jìn)行劃分,因此要選擇經(jīng)過(guò)劃分后使得各個(gè)子結(jié)點(diǎn)上的規(guī)則分布均勻的域進(jìn)行劃分。對(duì)此,HyperCuts算法選擇當(dāng)前規(guī)則集含有相異元素最多的域去劃分,首先計(jì)算各域上相異元素個(gè)數(shù),并計(jì)算出一個(gè)平均值,然后優(yōu)先選擇相異元素?cái)?shù)大于平均值的那些域。若多個(gè)域上相異元素個(gè)數(shù)相同,則把相異元素個(gè)數(shù)與所涵蓋空間的范圍大小的比率作為選擇標(biāo)準(zhǔn),選擇比值較大的空間優(yōu)先劃分。
一旦一個(gè)結(jié)點(diǎn)上切割域(D)的集合選定以后,下一步就要確定各域上的切割次數(shù){nc(i)}i∈D,nc(i)代表在第i維上的切割次數(shù)。為了使建立的數(shù)據(jù)結(jié)構(gòu)能夠占用較少的空間,對(duì)結(jié)點(diǎn)進(jìn)行切割時(shí),限制切割的子結(jié)點(diǎn)最大數(shù)目f(N)=spfac*N,]]>N是當(dāng)前結(jié)點(diǎn)上規(guī)則的數(shù)目,spfac是用來(lái)平衡時(shí)間、空間性能的可變參數(shù)。總切割次數(shù)NC=∏i∈Dnc(i),根據(jù)以下三個(gè)值判斷如何切割(1)每個(gè)子結(jié)點(diǎn)上規(guī)則的平均數(shù);(2)子結(jié)點(diǎn)上規(guī)則數(shù)的最大值;(3)空的子結(jié)點(diǎn)的數(shù)目。
搜索匹配過(guò)程分組到達(dá)路由器或防火墻后,送達(dá)決策樹(shù)結(jié)構(gòu)的根結(jié)點(diǎn),根據(jù)自身各個(gè)分類(lèi)域的值所處的范圍選擇下行分支,最終到達(dá)葉子結(jié)點(diǎn),然后通過(guò)線性查找葉子結(jié)點(diǎn)上存儲(chǔ)的小規(guī)則集來(lái)找到匹配規(guī)則。
Hypercuts算法應(yīng)用于路由器或防火墻上建立決策樹(shù)結(jié)構(gòu)實(shí)現(xiàn)數(shù)據(jù)流分類(lèi)功能,它在Hicuts算法的基礎(chǔ)上,對(duì)決策樹(shù)的生成算法進(jìn)行了改進(jìn),但在確定結(jié)點(diǎn)的切割次數(shù)時(shí),僅根據(jù)子結(jié)點(diǎn)上規(guī)則的平均數(shù)和空結(jié)點(diǎn)的數(shù)目來(lái)進(jìn)行,導(dǎo)致生成的決策樹(shù)在平衡度和整體規(guī)模上仍未能達(dá)到最優(yōu)(或接近最優(yōu)),勢(shì)必還是會(huì)影響路由器或防火墻的整體性能。

發(fā)明內(nèi)容本發(fā)明的目的在于提供一種高速路由器及防火墻中實(shí)現(xiàn)快速分組流識(shí)別的方法。在網(wǎng)絡(luò)路由器或是防火墻上建立優(yōu)化的基于決策樹(shù)的流分類(lèi)數(shù)據(jù)結(jié)構(gòu),實(shí)現(xiàn)數(shù)據(jù)包快速轉(zhuǎn)發(fā)或過(guò)濾的技術(shù)方案。
其中,路由器包括邊緣路由器和網(wǎng)絡(luò)內(nèi)部非邊緣路由器。邊緣路由器在運(yùn)營(yíng)商網(wǎng)絡(luò)邊緣,主要任務(wù)是為運(yùn)營(yíng)商接入用戶(hù),向用戶(hù)提供包括多播、帶寬管理、防火墻、服務(wù)質(zhì)量(QoS)、動(dòng)態(tài)策略管理、虛擬路由、多協(xié)議標(biāo)簽交換(MPLS)等多種業(yè)務(wù)。QoS是實(shí)現(xiàn)的難點(diǎn),邊緣路由器的QoS需要強(qiáng)大而高速的流分類(lèi)的支持。
為達(dá)到建立優(yōu)化的基于決策樹(shù)的流分類(lèi)數(shù)據(jù)結(jié)構(gòu),實(shí)現(xiàn)數(shù)據(jù)包快速轉(zhuǎn)發(fā)或過(guò)濾,本發(fā)明采用如下技術(shù)方案一種高速路由器及防火墻中實(shí)現(xiàn)快速分組流識(shí)別的方法,包括以下步驟1)建立一個(gè)決策樹(shù)的根結(jié)點(diǎn),將路由器或防火墻上規(guī)則集合的全集賦予根結(jié)點(diǎn);2)遞歸性地對(duì)決策樹(shù)上的每一個(gè)結(jié)點(diǎn)所對(duì)應(yīng)的規(guī)則集進(jìn)行分割,每次在一個(gè)或多個(gè)域上進(jìn)行切割,劃分成若干子結(jié)點(diǎn),每個(gè)子結(jié)點(diǎn)對(duì)應(yīng)于一個(gè)劃分后的規(guī)則子集;當(dāng)所有結(jié)點(diǎn)上規(guī)則集的規(guī)模小于某個(gè)預(yù)定的閾值時(shí),結(jié)束分割;其中,所述分割采用以下方法a)針對(duì)結(jié)點(diǎn)上規(guī)則集的分割方案所生成的決策樹(shù)的性能,結(jié)合各種性能參數(shù)在整體性能評(píng)估中的權(quán)重,以性能評(píng)估函數(shù)進(jìn)行評(píng)估和預(yù)測(cè);b)計(jì)算并比較各種分割方案中性能評(píng)估函數(shù)的值,以該值中的最優(yōu)值對(duì)應(yīng)的分割方法作為在本結(jié)點(diǎn)上應(yīng)采用的分割方法。
其中,所述性能評(píng)估函數(shù)為ValueP(di)=w1·P1(di)+w2·P2(di)+w3·P3(di)+…+wn·Pn(di)其中,設(shè)分割設(shè)對(duì)結(jié)點(diǎn)上的規(guī)則集進(jìn)行分割包括n個(gè)方案,以集合D={d1,d2,...,dn}表示;di∈D,P1(di),P2(di),P3(di),......,Pn(di)分別代表性能參數(shù)分割方案di在不同方面的性能評(píng)估,w1,w2,w3,......wn代表各種性能參數(shù)在整體性能評(píng)估中的權(quán)重。
其中,所述性能評(píng)估參數(shù)還可包括一結(jié)點(diǎn)分割時(shí)出現(xiàn)的規(guī)則被復(fù)制程度。所述規(guī)則被復(fù)制程度可以如下定義的復(fù)制度指數(shù)表示Idxcopy(di)=C(di)-CminCmax(di)-Cmin,]]>其中,C(di)為分割方案di平均每個(gè)子結(jié)點(diǎn)上復(fù)制規(guī)則的數(shù)量,即C(di)=Nc(di)-Npm(di)]]>其中Nc(di)為分割方法di的所有子結(jié)點(diǎn)上的規(guī)則數(shù)的總和;Np為父結(jié)點(diǎn)的規(guī)則數(shù);m(di)為分割方法di的分割成的子結(jié)點(diǎn)的個(gè)數(shù);Cmin為C(di)的最小值,Cmax(di)為所有分割方式中,子結(jié)點(diǎn)個(gè)數(shù)等于di的分割方式中,C(di)的最小值。
其中,所述性能評(píng)估參數(shù)還可包括一結(jié)點(diǎn)分割的平衡度。所述結(jié)點(diǎn)分割的平衡度可以如下定義的平衡度指數(shù)表示Idxbal(di)=B(di)-BminBmax(di)-Bmin]]>其中,B(di)為分割方案di平均子結(jié)點(diǎn)上的規(guī)則數(shù)與理想規(guī)則數(shù)的差異,即B(di)=Σj=1m(di)|Nc(di,j)-Np/m(di)|m(di)]]>其中,Nc(di,j)為分割方法di的第j個(gè)子結(jié)點(diǎn)上的規(guī)則數(shù),Np/m(di)為理想情況下,每個(gè)子結(jié)點(diǎn)上的規(guī)則數(shù),Bmin為B(di)的最小值,顯然Bmin=0;Bmax(di)為所有分割方式中,子結(jié)點(diǎn)個(gè)數(shù)等于di的分割方式中,B(di)的最小值。
所述結(jié)點(diǎn)分割的平衡度還可以如下定義的平衡度指數(shù)表示Idxbal_II(di)=BII(di)-BIIminBIImax(di)-BIImin]]>其中,BII(di)代表了分割方案di子結(jié)點(diǎn)上的最大規(guī)則數(shù)與理想規(guī)則數(shù)的差異,定義為
BII(di)=maxj=1m(di)Nc(di,j)-Np/m(di)m(di)]]>其中,Nc(di,j)為分割方法di的第j個(gè)子結(jié)點(diǎn)上的規(guī)則數(shù),Np/m(di)為理想情況下,每個(gè)子結(jié)點(diǎn)上的規(guī)則數(shù),BIImin為BII(di)的最小值,顯然BIImin=0;BIImax(di)為所有分割方式中,子結(jié)點(diǎn)個(gè)數(shù)等于di的分割方式中,BII(di)的最小值。
作為本發(fā)明技術(shù)方案的一種改進(jìn),在用評(píng)估函數(shù)ValueP()對(duì)分割方案空間D={d1,d2,...,dn}中分割方案進(jìn)行檢驗(yàn)時(shí),假定最優(yōu)或接近最優(yōu)的方案應(yīng)該在某個(gè)di附近,只檢查di附近的分割方法的一個(gè)子集D’(D’={di-k,di-k+1,...,di,di+1,...,di+k}D)。
本發(fā)明技術(shù)方案能夠在決策樹(shù)數(shù)據(jù)結(jié)構(gòu)的生成過(guò)程中,對(duì)決策樹(shù)的平衡度、深度以及占用空間(結(jié)點(diǎn)總數(shù))進(jìn)行評(píng)估和預(yù)測(cè),從而使生成的決策樹(shù)在一定的存貯空間限制的條件下,和現(xiàn)有的同類(lèi)方案相比具有更好的搜索時(shí)間性能。
圖1為路由器應(yīng)用流分類(lèi)技術(shù)簡(jiǎn)單流程示意圖;圖2為包過(guò)濾防火墻應(yīng)用流分類(lèi)技術(shù)簡(jiǎn)單流程示意圖;圖3為決策樹(shù)簡(jiǎn)單結(jié)構(gòu)及數(shù)據(jù)包查找流程簡(jiǎn)單示意圖。
具體實(shí)施方式路由器針對(duì)數(shù)據(jù)包流的處理(只涉及流分類(lèi)的部分)如圖1所示,其流程描述如下1)路由器從所連接的各個(gè)鏈路上接收網(wǎng)絡(luò)數(shù)據(jù)包流;2)提取包頭信息,作為流分類(lèi)處理的對(duì)象;3)將包頭信息作為路由器上的流分類(lèi)處理結(jié)構(gòu)的輸入,通過(guò)處理,為每個(gè)數(shù)據(jù)包找到匹配的業(yè)務(wù)流(業(yè)務(wù)流有多個(gè)業(yè)務(wù)流1,2,3……);4)路由器上的流分類(lèi)處理結(jié)構(gòu)建立是預(yù)處理過(guò)程,在網(wǎng)絡(luò)數(shù)據(jù)包到達(dá)之前已經(jīng)通過(guò)一定途徑建立了該結(jié)構(gòu);5)對(duì)數(shù)據(jù)包進(jìn)行正確分類(lèi)之后,針對(duì)不同業(yè)務(wù)流實(shí)施路由選擇和QoS等一系列后繼處理;6)最終將數(shù)據(jù)包流從路由器輸出轉(zhuǎn)發(fā)。
基于路由器的包過(guò)濾防火墻,其過(guò)濾規(guī)則集由若干條規(guī)則組成,涵蓋對(duì)所有出入防火墻的數(shù)據(jù)包的處理方法,同樣需要流分類(lèi)技術(shù)的強(qiáng)力支持,根據(jù)規(guī)則集建立性能優(yōu)良的流分類(lèi)處理結(jié)構(gòu),對(duì)數(shù)據(jù)包實(shí)施恰當(dāng)?shù)姆诸?lèi)和操作。
包過(guò)濾防火墻針對(duì)數(shù)據(jù)包流的處理(只涉及流分類(lèi)的部分)如圖2所示,其流程描述如下1)包過(guò)濾防火墻接收到達(dá)的網(wǎng)絡(luò)數(shù)據(jù)包流;2)提取包頭信息,作為流分類(lèi)處理的對(duì)象;3)將包頭信息作為防火墻上的流分類(lèi)處理結(jié)構(gòu)的輸入,通過(guò)處理,為每個(gè)數(shù)據(jù)包找到匹配的業(yè)務(wù)流(業(yè)務(wù)流有多個(gè)業(yè)務(wù)流1,2,3……);4)包過(guò)濾防火墻上的流分類(lèi)處理結(jié)構(gòu)建立是預(yù)處理過(guò)程,在網(wǎng)絡(luò)數(shù)據(jù)包到達(dá)之前已經(jīng)通過(guò)一定途徑建立了該結(jié)構(gòu);5)對(duì)數(shù)據(jù)包進(jìn)行正確分類(lèi)之后,決定對(duì)數(shù)據(jù)包采取允許通過(guò)、修改通過(guò)還是禁止通過(guò)等行為;6)最終將可通過(guò)數(shù)據(jù)包流從防火墻輸出。
從上述流程圖及描述中可以看出,路由器或防火墻通常包括(一)接收網(wǎng)絡(luò)數(shù)據(jù)包,獲取包頭信息;(二)實(shí)施分類(lèi);(三)包處理。以下分別論述。
(一)接收網(wǎng)絡(luò)數(shù)據(jù)包,獲取包頭信息流分類(lèi)要求路由器或是防火墻可以根據(jù)數(shù)據(jù)包的包頭中一個(gè)或多個(gè)域(字段)的信息將其分到不同的流上,因此獲取數(shù)據(jù)包的包頭信息是對(duì)其歸類(lèi)的首要工作。
(二)實(shí)施分類(lèi)流分類(lèi)處理結(jié)構(gòu)(在本發(fā)明中是決策樹(shù))是路由器和防火墻實(shí)現(xiàn)流分類(lèi)功能的關(guān)鍵部分,如下圖3,展示了決策樹(shù)的簡(jiǎn)單結(jié)構(gòu)樹(shù)中的根結(jié)點(diǎn)對(duì)應(yīng)了規(guī)則庫(kù)的全集,每個(gè)子結(jié)點(diǎn)則對(duì)應(yīng)了規(guī)則庫(kù)的一個(gè)子集,但除了葉子結(jié)點(diǎn)以外,其它結(jié)點(diǎn)均不存儲(chǔ)規(guī)則,只存儲(chǔ)實(shí)現(xiàn)流分類(lèi)的信息,包括每一次選擇哪一個(gè)域或幾個(gè)域進(jìn)行結(jié)點(diǎn)分割以及分割數(shù)目的大小,當(dāng)然還有其他一些必要信息(如指向結(jié)點(diǎn)覆蓋規(guī)則集合的指針,指向子結(jié)點(diǎn)的指針等,圖中未標(biāo)出)。
數(shù)據(jù)包查找流程簡(jiǎn)單描述如下提取的數(shù)據(jù)包的包頭信息直接作為決策樹(shù)的輸入,根據(jù)自身各個(gè)分類(lèi)域的值所處的范圍以及當(dāng)前所處的結(jié)點(diǎn)上的流分類(lèi)信息選擇下行分支,跳到正確的子結(jié)點(diǎn)上去,按此方法遞歸進(jìn)行,最終到達(dá)葉子結(jié)點(diǎn),通過(guò)線性查找葉子結(jié)點(diǎn)上存儲(chǔ)的小規(guī)則集來(lái)找到匹配規(guī)則,即可獲得對(duì)該數(shù)據(jù)包的處理方法。
顯然,路由器或防火墻流分類(lèi)性能的好壞取決于所建決策樹(shù)結(jié)構(gòu)性能的高低,我們要提供的發(fā)明技術(shù)方案正是針對(duì)該點(diǎn)——根據(jù)自身存儲(chǔ)的規(guī)則庫(kù)構(gòu)造實(shí)施流分類(lèi)的優(yōu)化的數(shù)據(jù)結(jié)構(gòu)。應(yīng)用基于決策樹(shù)的快速流分類(lèi)方案,關(guān)鍵是建立性能優(yōu)良的決策樹(shù)結(jié)構(gòu),例如令決策樹(shù)具有更少的結(jié)點(diǎn)總數(shù)、更好的平衡性和盡可能小的深度,使其達(dá)到更好的搜索時(shí)間性能和更小空間占用,流分類(lèi)性能有所提高。
路由器或防火墻上存儲(chǔ)的規(guī)則庫(kù)(規(guī)則可以由網(wǎng)絡(luò)管理員通過(guò)網(wǎng)管系統(tǒng)設(shè)置,也可以由資源預(yù)留協(xié)議(RSVP)動(dòng)態(tài)生成)用于生成整個(gè)決策樹(shù)結(jié)構(gòu),從根結(jié)點(diǎn)開(kāi)始自上向下逐步展開(kāi)。決策樹(shù)上的每一個(gè)結(jié)點(diǎn)對(duì)應(yīng)于一個(gè)規(guī)則集合的子集(根結(jié)點(diǎn)對(duì)應(yīng)于路由器規(guī)則集的全集)。每次將一個(gè)結(jié)點(diǎn)分裂成若干個(gè)子結(jié)點(diǎn),相當(dāng)于將該結(jié)點(diǎn)對(duì)應(yīng)的規(guī)則集分割成更小的子集,并分配到各個(gè)子結(jié)點(diǎn)上。在每一個(gè)結(jié)點(diǎn)上分割方法的不同,將導(dǎo)致其生成的決策樹(shù)具有不同的形狀,導(dǎo)致決策樹(shù)具有不同平衡度和性能(搜索時(shí)間和占用空間)。因此,在對(duì)結(jié)點(diǎn)進(jìn)行分割時(shí),選擇正確的分割方案對(duì)優(yōu)化決策樹(shù)的結(jié)構(gòu)和性能具有重要意義。現(xiàn)有一些同類(lèi)算法中,在確定結(jié)點(diǎn)的分割方法時(shí)采用相對(duì)固定、靜態(tài)的判定標(biāo)準(zhǔn),具有局限性。本發(fā)明在進(jìn)行結(jié)點(diǎn)分割時(shí),采用一種評(píng)估函數(shù)來(lái)評(píng)估不同分割方案對(duì)決策樹(shù)時(shí)間空間性能的影響,并從中選擇最佳的方案來(lái)對(duì)結(jié)點(diǎn)進(jìn)行分割。
本實(shí)施例中提出一種高速路由器及防火墻中實(shí)現(xiàn)快速分組流識(shí)別的方法,包括以下步驟1)建立一個(gè)決策樹(shù)的根結(jié)點(diǎn),將路由器或防火墻上規(guī)則集合的全集賦予根結(jié)點(diǎn)。
2)遞歸性地對(duì)決策樹(shù)上的每一個(gè)結(jié)點(diǎn)所對(duì)應(yīng)的規(guī)則集進(jìn)行分割,每次可以在一個(gè)或多個(gè)域上進(jìn)行切割,并生成(劃分成)若干子結(jié)點(diǎn),每個(gè)子結(jié)點(diǎn)對(duì)應(yīng)于一個(gè)劃分后的規(guī)則子集;直到所有結(jié)點(diǎn)上規(guī)則集的規(guī)模小于某個(gè)預(yù)定的閾值。其中在結(jié)點(diǎn)進(jìn)行分割時(shí),采用以下方法(1)結(jié)點(diǎn)所對(duì)應(yīng)的規(guī)則集的規(guī)模小于某個(gè)預(yù)定的閾值,則不對(duì)其進(jìn)行繼續(xù)分割;否則進(jìn)行下面的步驟,確定分割的方案。
(2)對(duì)結(jié)點(diǎn)上的規(guī)則集進(jìn)行分割可能存在多種方案,設(shè)為D={d1,d2,...,dn};設(shè)計(jì)一個(gè)對(duì)不同分割方案的性能評(píng)估函數(shù)ValueP(),用來(lái)對(duì)每個(gè)分割方案生成的決策樹(shù)的性能進(jìn)行評(píng)估和預(yù)測(cè)ValueP(di)di∈D令ValueP()的值越小預(yù)測(cè)的性能越高。也可令其值越大越好,下面不加說(shuō)明時(shí),ValueP()的值越小預(yù)測(cè)的性能越高。
(3)計(jì)算各種分割方案中ValueP()的最小值,令其為
valuemin=mindi∈D[ValueP(di)]=Value(dk)]]>與valuemin對(duì)應(yīng)的某個(gè)分割方法dk即在本結(jié)點(diǎn)上應(yīng)采用的分割方法。
其中,性能評(píng)估函數(shù)ValueP()的采用如下設(shè)計(jì)方法性能評(píng)估函數(shù)ValueP()應(yīng)該能夠反映出對(duì)特定分割方法所生成的決策樹(shù)的整體性能的估計(jì)。整體性能應(yīng)該主要包括搜索時(shí)間、占用空間上的性能,也可涵蓋其他方面的可能的性能參數(shù)??偟膩?lái)說(shuō),ValueP()的設(shè)計(jì)需要考慮到影響決策樹(shù)性能的各種因素,進(jìn)行綜合考慮。該技術(shù)應(yīng)用于邊緣路由器或是防火墻上,可以通過(guò)對(duì)其處理業(yè)務(wù)的性質(zhì)、數(shù)量的統(tǒng)計(jì)以及路由器自身特性的測(cè)量,從不同的角度出發(fā),定義符合需要的ValueP()的設(shè)計(jì)方法和參數(shù)。
ValueP()設(shè)計(jì)的一般形式為ValueP(di)=w1·P1(di)+w2·P2(di)+w3·P3(di)+...+wn·Pn(di)其中P1(di),P2(di),P3(di),......分別代表性能參數(shù)分割方案di在不同方面的性能評(píng)估(時(shí)間、空間、決策樹(shù)的平衡度、......);w1,w2,w3,......wn代表各種性能參數(shù)在整體性能評(píng)估中的權(quán)重。通過(guò)對(duì)各性能參數(shù)權(quán)重的調(diào)整,可以獲得不同應(yīng)用環(huán)境下的性能評(píng)估函數(shù)。例如,當(dāng)系統(tǒng)對(duì)搜索時(shí)間性能要求較高,而存貯空間充裕的情況下,可以增加時(shí)間性能相關(guān)參數(shù)的權(quán)重;而當(dāng)系統(tǒng)存貯空間受限時(shí),可增加空間性能相關(guān)參數(shù)的權(quán)重。這種定義方法提供了一種靈活性,令使用者能夠在諸多相互矛盾和制約的性能參數(shù)中進(jìn)行權(quán)衡,使得技術(shù)方案的運(yùn)用對(duì)于其應(yīng)用環(huán)境接近最優(yōu)化。
以下以規(guī)則被復(fù)制程度和結(jié)點(diǎn)分割的平衡度為例說(shuō)明性能評(píng)估函數(shù)ValueP()。
a)結(jié)點(diǎn)分割時(shí)出現(xiàn)的規(guī)則被復(fù)制程度結(jié)點(diǎn)在被分割時(shí),某些規(guī)則將可能被復(fù)制到多個(gè)子結(jié)點(diǎn)上。規(guī)則的復(fù)制將造成生成的決策樹(shù)總結(jié)點(diǎn)數(shù)和總存貯空間的增大,樹(shù)深度也將增加。因此,在進(jìn)行分割時(shí),規(guī)則的復(fù)制程度越小越好。定義分割方案di的復(fù)制度指數(shù)定義為Idxcopy(di)=C(di)-CminCmax(di)-Cmin]]>其中,C(di)為分割方案di平均每個(gè)子結(jié)點(diǎn)上復(fù)制規(guī)則的數(shù)量,即C(di)=Nc(di)-Npm(di)]]>其中Nc(di)為分割方法di的所有子結(jié)點(diǎn)上的規(guī)則數(shù)的總和;
Np為父結(jié)點(diǎn)(被分割結(jié)點(diǎn))的規(guī)則數(shù);m(di)為分割方法di的分割成的子結(jié)點(diǎn)的個(gè)數(shù);Cmin為C(di)的最小值,顯然Cmin=0Cmax(di)為所有分割方式中,子結(jié)點(diǎn)個(gè)數(shù)等于di的分割方式中,C(di)的最小值Cmax(di)=maxdi∈D,m(dj)=m(di)C(dj)=(m(di)-1)·Npm(di)]]>Cmax的最大值當(dāng)父結(jié)點(diǎn)上的規(guī)則被復(fù)制到所有子結(jié)點(diǎn)上時(shí)取得。
b)結(jié)點(diǎn)分割的平衡度(I)。
結(jié)點(diǎn)在被分割時(shí),每個(gè)子結(jié)點(diǎn)上的規(guī)則越接近,決策樹(shù)的平衡度越好,將有利于減少?zèng)Q策樹(shù)的深度,改善時(shí)間和空間性能。分割方案di的平衡度定義為每個(gè)子結(jié)點(diǎn)上規(guī)則數(shù)與理想分割情況下子結(jié)點(diǎn)規(guī)則數(shù)之間的差異。這個(gè)差異越小越好。平衡度指數(shù)定義為Idxbal(di)=B(di)-BminBmax(di)-Bmin]]>其中,B(di)為分割方案di平均子結(jié)點(diǎn)上的規(guī)則數(shù)與理想規(guī)則數(shù)的差異,即B(di)=Σj=1m(di)|Nc(di,j)-Np/m(di)|m(di)]]>其中,Nc(di,j)為分割方法di的第j個(gè)子結(jié)點(diǎn)上的規(guī)則數(shù)。
Np/m(di)為理想情況下,每個(gè)子結(jié)點(diǎn)上的規(guī)則數(shù)。
Bmin為B(di)的最小值,顯然Bmin=0Bmax(di)為所有分割方式中,子結(jié)點(diǎn)個(gè)數(shù)等于di的分割方式中,B(di)的最小值Bmax(di)=maxdi∈D,m(dj)=m(di)B(dj)=(m(di)-1)·Npm(di)]]>Bmax的最大值當(dāng)父結(jié)點(diǎn)上的規(guī)則被復(fù)制到所有子結(jié)點(diǎn)上時(shí)取得。
c)結(jié)點(diǎn)分割的平衡度(II)。
描述結(jié)點(diǎn)分割方法di平衡度的另外一種方法是子結(jié)點(diǎn)中最大的規(guī)則集數(shù)量與理想的平均子結(jié)點(diǎn)規(guī)則數(shù)目之間的差異。差異越小,結(jié)點(diǎn)間趨向平衡的可能性就越大,因此該值同樣是越小越好的。定義如下Idxbal_II(di)=BII(di)-BIIminBIImax(di)-BIImin]]>其中,BII(di)代表了分割方案di子結(jié)點(diǎn)上的最大規(guī)則數(shù)與理想規(guī)則數(shù)的差異,定義為BII(di)=maxj=1m(di)Nc(di,j)-Np/m(di)m(di)]]>其中,Nc(di,j)為分割方法di的第j個(gè)子結(jié)點(diǎn)上的規(guī)則數(shù)。
Np/m(di)為理想情況下,每個(gè)子結(jié)點(diǎn)上的規(guī)則數(shù)。
BIImin為BII(di)的最小值,顯然BIImin=0BIImax(di)為所有分割方式中,子結(jié)點(diǎn)個(gè)數(shù)等于di的分割方式中,BII(di)的最小值BIImax(di)=maxdi∈D,m(dj)=m(di)BII(dj)=Npm(di)-1]]>BIImax的最大值當(dāng)子結(jié)點(diǎn)的最大規(guī)則數(shù)等于結(jié)點(diǎn)規(guī)則數(shù)時(shí)取得。
d)根據(jù)以上信息定義性能評(píng)估函數(shù)ValueP()ValueP(di)=w1·Idxcopy(di)+w2·Idxbal(di)+w3·Idxbal_II(di)根據(jù)實(shí)際應(yīng)用的需求,調(diào)整三個(gè)w1,w2,w3權(quán)重,可以對(duì)決策樹(shù)的性能進(jìn)行不同方向的優(yōu)化或權(quán)衡。
e)權(quán)重的調(diào)整評(píng)估函數(shù)ValueP()中的參數(shù)權(quán)重可以通過(guò)實(shí)踐中總結(jié)的經(jīng)驗(yàn)值來(lái)確定,也可以針對(duì)特定的規(guī)則庫(kù)輸入,在權(quán)重的取值空間進(jìn)行遍歷,以找到適合實(shí)際的性能需求的合理的權(quán)重分配。
f)分割方案空間D的縮減在用評(píng)估函數(shù)ValueP()對(duì)分割方案空間D={d1,d2,...,dn}中分割方案進(jìn)行檢驗(yàn)時(shí),由于可能的分割方案很多,遍歷D所有的方案di是不可能的??梢约俣ㄗ顑?yōu)(或接近最優(yōu))的方案應(yīng)該在某個(gè)di附近。算法只需檢查di附近的分割方法的一個(gè)子集D’(D’={di-k,di-k+1,...,di,di+1,...,di+k}D)。該di的選擇可以依據(jù)實(shí)踐經(jīng)驗(yàn),也可以使用已采用過(guò)的分割方案作為參考點(diǎn),在其附近的分割方案中選擇。
(三)包處理到來(lái)的數(shù)據(jù)包被歸入不同的業(yè)務(wù)流中,路由器和防火墻均會(huì)針對(duì)各個(gè)業(yè)務(wù)流采取不同的處理方式,或轉(zhuǎn)發(fā),或進(jìn)一步處理,或標(biāo)記允許通過(guò),或直接丟棄。
實(shí)踐表明通過(guò)選擇適當(dāng)評(píng)估函數(shù)和參數(shù),在路由器或防火墻上包含的規(guī)則庫(kù)規(guī)模和沖突率都不同的情況下,本發(fā)明都可使其建立的決策樹(shù)的時(shí)間/空間的綜合性能得到改善,相應(yīng)使路由器或防火墻的整體性能有所提高。
與現(xiàn)有現(xiàn)有技術(shù)相比,本發(fā)明在決策樹(shù)的建立方法上采取了上述有效措施,使得路由器實(shí)現(xiàn)了快速包轉(zhuǎn)發(fā),防火墻實(shí)現(xiàn)了快速包過(guò)濾,使其在時(shí)間/空間的綜合性能上要優(yōu)于現(xiàn)有的方案。
權(quán)利要求
1.一種高速路由器及防火墻中實(shí)現(xiàn)快速分組流識(shí)別的方法,其特征在于包括以下步驟1)建立一個(gè)決策樹(shù)的根結(jié)點(diǎn),將路由器或防火墻上規(guī)則集合的全集賦予根結(jié)點(diǎn);2)遞歸性地對(duì)決策樹(shù)上的每一個(gè)結(jié)點(diǎn)所對(duì)應(yīng)的規(guī)則集進(jìn)行分割,每次在一個(gè)或多個(gè)域上進(jìn)行切割,劃分成若干子結(jié)點(diǎn),每個(gè)子結(jié)點(diǎn)對(duì)應(yīng)于一個(gè)劃分后的規(guī)則子集;當(dāng)所有結(jié)點(diǎn)上規(guī)則集的規(guī)模小于某個(gè)預(yù)定的閾值時(shí),結(jié)束分割;其中,所述分割采用以下方法a)針對(duì)結(jié)點(diǎn)上規(guī)則集的分割方案所生成的決策樹(shù)的性能,結(jié)合各種性能參數(shù)在整體性能評(píng)估中的權(quán)重,以性能評(píng)估函數(shù)進(jìn)行評(píng)估和預(yù)測(cè);b)計(jì)算并比較各種分割方案中性能評(píng)估函數(shù)的值,以該值中的最優(yōu)值對(duì)應(yīng)的分割方法作為在本結(jié)點(diǎn)上應(yīng)采用的分割方法。
2.根據(jù)權(quán)利要求
1所述的一種高速路由器及防火墻中實(shí)現(xiàn)快速分組流識(shí)別的方法,其特征在于所述性能評(píng)估函數(shù)為ValueP(di)=w1·P1(di)+w2·P2(di)+w3·P3(di)+…+wn·Pn(di)其中,設(shè)分割設(shè)對(duì)結(jié)點(diǎn)上的規(guī)則集進(jìn)行分割包括n個(gè)方案,以集合D={d1,d2,…,dn}表示;di∈D,P1(di),P2(di),P3(di),……,Pn(di)分別代表性能參數(shù)分割方案di在不同方面的性能評(píng)估,w1,w2,w3,……wn代表各種性能參數(shù)在整體性能評(píng)估中的權(quán)重。
3.根據(jù)權(quán)利要求
2所述的一種高速路由器及防火墻中實(shí)現(xiàn)快速分組流識(shí)別的方法,其特征在于所述性能評(píng)估參數(shù)包括搜索時(shí)間、占用空間上的性能及其處理業(yè)務(wù)的性質(zhì)、數(shù)量的統(tǒng)計(jì)以及路由器自身特性。
4.根據(jù)權(quán)利要求
2所述的一種高速路由器及防火墻中實(shí)現(xiàn)快速分組流識(shí)別的方法,其特征在于所述性能評(píng)估參數(shù)包括一結(jié)點(diǎn)分割時(shí)出現(xiàn)的規(guī)則被復(fù)制程度。
5.根據(jù)權(quán)利要求
4所述的一種高速路由器及防火墻中實(shí)現(xiàn)快速分組流識(shí)別的方法,其特征在于所述規(guī)則被復(fù)制程度以如下復(fù)制度指數(shù)表示Idxcopy(di)=C(di)-CminCmax(di)-Cmin,]]>其中,C(di)為分割方案di平均每個(gè)子結(jié)點(diǎn)上復(fù)制規(guī)則的數(shù)量,即C(di)=Nc(di)-Npm(di)]]>其中Nc(di)為分割方法di的所有子結(jié)點(diǎn)上的規(guī)則數(shù)的總和;Np為父結(jié)點(diǎn)的規(guī)則數(shù);m(di)為分割方法di的分割成的子結(jié)點(diǎn)的個(gè)數(shù);Cmin為C(di)的最小值,Cmax(di)為所有分割方式中,子結(jié)點(diǎn)個(gè)數(shù)等于di的分割方式中,C(di)的最小值。
6.根據(jù)權(quán)利要求
1所述的一種高速路由器及防火墻中實(shí)現(xiàn)快速分組流識(shí)別的方法,其特征在于所述性能評(píng)估參數(shù)還包括一結(jié)點(diǎn)分割的平衡度。
7.根據(jù)權(quán)利要求
6所述的一種高速路由器及防火墻中實(shí)現(xiàn)快速分組流識(shí)別的方法,其特征在于所述結(jié)點(diǎn)分割的平衡度以如下平衡度指數(shù)表示Idxbal(di)=B(di)-BminBmax(di)-Bmin]]>其中,B(di)為分割方案di平均子結(jié)點(diǎn)上的規(guī)則數(shù)與理想規(guī)則數(shù)的差異,即B(di)=Σj=1m(di)|Nc(di,j)-Np/m(di)|m(di)]]>其中,Nc(di,j)為分割方法di的第j個(gè)子結(jié)點(diǎn)上的規(guī)則數(shù),Np/m(di)為理想情況下,每個(gè)子結(jié)點(diǎn)上的規(guī)則數(shù),Bmin為B(di)的最小值,顯然Bmin=0;Bmax(di)為所有分割方式中,子結(jié)點(diǎn)個(gè)數(shù)等于di的分割方式中,B(di)的最小值。
8.根據(jù)權(quán)利要求
6所述的一種高速路由器及防火墻中實(shí)現(xiàn)快速分組流識(shí)別的方法,其特征在于所述結(jié)點(diǎn)分割的平衡度以如下定義的平衡度指數(shù)表示Idxbal_II(di)=BII(di)-BIIminBIImax(di)-BIImin]]>其中,BII(di)代表了分割方案di子結(jié)點(diǎn)上的最大規(guī)則數(shù)與理想規(guī)則數(shù)的差異,定義為BII(di)=maxj=1m(di)Nc(di,j)-Np/m(di)m(di)]]>其中,Nc(di,j)為分割方法di的第j個(gè)子結(jié)點(diǎn)上的規(guī)則數(shù),Np/m(di)為理想情況下,每個(gè)子結(jié)點(diǎn)上的規(guī)則數(shù),BIImin為BII(di)的最小值,顯然BIImin=0;BIImax(di)為所有分割方式中,子結(jié)點(diǎn)個(gè)數(shù)等于di的分割方式中,BII(di)的最小值。
9.根據(jù)權(quán)利要求
2所述的一種高速路由器及防火墻中實(shí)現(xiàn)快速分組流識(shí)別的方法,其特征在于在用評(píng)估函數(shù)Valuep()對(duì)分割方案空間D中分割方案進(jìn)行檢驗(yàn)時(shí),假定最優(yōu)或接近最優(yōu)的方案應(yīng)該在某個(gè)di附近,只檢查di附近的分割方法的一個(gè)子集D’。
10.根據(jù)權(quán)利要求
3所述的一種高速路由器及防火墻中實(shí)現(xiàn)快速分組流識(shí)別的方法,其特征在于當(dāng)系統(tǒng)對(duì)搜索時(shí)間性能要求較高,而存貯空間充裕的情況下,增加時(shí)間性能相關(guān)參數(shù)的權(quán)重,當(dāng)系統(tǒng)存貯空間受限時(shí),增加空間性能相關(guān)參數(shù)的權(quán)重。
專(zhuān)利摘要
一種高速路由器及防火墻中實(shí)現(xiàn)快速分組流識(shí)別的方法,包括以下步驟,建立一個(gè)決策樹(shù)的根結(jié)點(diǎn),將路由器或防火墻上規(guī)則集合的全集賦予根結(jié)點(diǎn);遞歸性地對(duì)決策樹(shù)上的每一個(gè)結(jié)點(diǎn)所對(duì)應(yīng)的規(guī)則集進(jìn)行分割,當(dāng)所有結(jié)點(diǎn)上規(guī)則集的規(guī)模小于某個(gè)預(yù)定的閾值時(shí),結(jié)束分割;其中,所述分割采用以下方法設(shè)對(duì)結(jié)點(diǎn)上的規(guī)則集進(jìn)行分割的n個(gè)方案,以性能評(píng)估函數(shù)ValueP()對(duì)每個(gè)分割方案生成的決策樹(shù)的性能進(jìn)行評(píng)估和預(yù)測(cè),本發(fā)明技術(shù)方案能夠在決策樹(shù)數(shù)據(jù)結(jié)構(gòu)的生成過(guò)程中,對(duì)決策樹(shù)的平衡度、深度以及占用空間(結(jié)點(diǎn)總數(shù))進(jìn)行評(píng)估和預(yù)測(cè),從而使生成的決策樹(shù)在一定的存貯空間限制的條件下,和現(xiàn)有的同類(lèi)方案相比具有更好的搜索時(shí)間性能。
文檔編號(hào)H04L12/56GK1992673SQ200510121521
公開(kāi)日2007年7月4日 申請(qǐng)日期2005年12月31日
發(fā)明者龔向陽(yáng), 劉宏明, 曹婷, 褚靈偉, 鄭月霞, 李偉 申請(qǐng)人:華為技術(shù)有限公司, 北京郵電大學(xué)導(dǎo)出引文BiBTeX, EndNote, RefMan
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1