專利名稱:Url過濾系統(tǒng)的應(yīng)用方法
技術(shù)領(lǐng)域:
本發(fā)明涉及本發(fā)明涉及一種URL過濾系統(tǒng)的應(yīng)用方法,尤其是涉及URL快速檢索、 定位、以及控制的應(yīng)用方法。
背景技術(shù):
URL,即統(tǒng)一資源定位符(英語 Uniform/Universal Resource Locator 的縮寫), 也被稱為網(wǎng)頁地址,是因特網(wǎng)上標(biāo)準(zhǔn)的資源的地址。統(tǒng)一資源定位符(URL)是用于完整地 描述Internet上網(wǎng)頁和其他資源的地址的一種標(biāo)識(shí)方法。Internet上的每一個(gè)網(wǎng)頁都具 有一個(gè)唯一的名稱標(biāo)識(shí),通常稱之為URL地址,這種地址可以是本地磁盤,也可以是局域網(wǎng) 上的某一臺(tái)計(jì)算機(jī),更多的是Internet上的站點(diǎn)。簡單地說,URL就是Web地址,俗稱“網(wǎng) 址”。現(xiàn)有的主流的URL過濾技術(shù),主要技術(shù)分為實(shí)時(shí)內(nèi)容過濾以及URL地址過濾,這兩 種技術(shù)前一種非常難滿足網(wǎng)絡(luò)延時(shí)需求,后一種同樣也有類似的問題;可行方法一般選擇 后一種方式;現(xiàn)有URL地址過濾方法主要為建立URL庫,把所有網(wǎng)絡(luò)上HTTP流量的URL地址 與該庫進(jìn)行比對;該方法技術(shù)上存以幾個(gè)問題,一是URL庫的建立是一個(gè)導(dǎo)常煩瑣并且也 很難定義其URL的應(yīng)屬于可訪問或是不可訪問的屬性;二是性能問題,該種匹配方法存在 網(wǎng)絡(luò)延時(shí)問題對硬件系統(tǒng)性能要求過高,特別是在比較大的網(wǎng)絡(luò)中該問題尤為突出;三是 URL庫中用戶真正關(guān)心的URL還是相對有限的;基于以上問題該發(fā)明解決了以上三個(gè)問題即以用戶自定義域(DOMAIN),通用資源 標(biāo)志符(Uniform Resource Identif ier,簡稱“URI ”),擴(kuò)展名為基礎(chǔ),對用戶關(guān)心的URL信 息進(jìn)行檢測,控制。并且解決了性能上的問題,通過系統(tǒng)DFA方法以達(dá)到匹配規(guī)則,時(shí)間復(fù) 雜度=O(I)0
發(fā)明內(nèi)容
本發(fā)明的目的在于解決上述的技術(shù)問題,提供一種URL過濾系統(tǒng)的應(yīng)用方法。本發(fā)明的目的通過以下技術(shù)方案來實(shí)現(xiàn)一種URL過濾系統(tǒng)的應(yīng)用方法,該URL過濾系統(tǒng)以用戶自定義URL匹配規(guī)則為基 礎(chǔ),應(yīng)用該URL過濾系統(tǒng)時(shí),包括如下步驟,第一步、分配用來存儲(chǔ)用戶自定義URL匹配規(guī)則的內(nèi)存;第二步、分配用來存放DFA圖的內(nèi)存;第三步、將用戶自定義URL規(guī)則生成DFA圖;第四步、將網(wǎng)內(nèi)HTTP請求中的DOMAIN,URI以及擴(kuò)展名到生成的DFA圖中匹配;第五步、將第四步得到的結(jié)果填入對應(yīng)HTTP,記錄相應(yīng)的節(jié)點(diǎn);第六步、根據(jù)用戶設(shè)定的策略匹配,并做相應(yīng)的動(dòng)作。進(jìn)一步地,所述的一種URL過濾系統(tǒng)的應(yīng)用方法,其中所述第四步中匹配的時(shí)間
3復(fù)雜度=O(I)0進(jìn)一步地,所述的一種URL過濾系統(tǒng)的應(yīng)用方法,其中所述第一步中用戶自定義 URL匹配規(guī)則是指URL過濾的流程,HTTP包文件中的URL分成DOMAIN,URI、HTTP方法和擴(kuò) 展名,該具體流程為第一步、將DOMAIN,URI, HTTP方法和擴(kuò)展名去用戶自定規(guī)則的DFA圖中查找相應(yīng) 的ID號(hào);第二步、根據(jù)用戶設(shè)定的策略對比以上的ID號(hào),符合條件的按要求設(shè)定的作行 為,所述行為為放行或丟棄,默認(rèn)的行為為放行。進(jìn)一步地,所述的一種URL過濾系統(tǒng)的應(yīng)用方法,其中所述第四步中匹配的具體 步驟為第一步、將DOMAIN放入U(xiǎn)RL DFA匹配;第二步、根據(jù)DOMAIN匹配到的ID,將URI放入U(xiǎn)RL DFA中匹配并將對應(yīng)的ID保存 在該URL節(jié)點(diǎn)上;第三步、將擴(kuò)展名放入擴(kuò)展名的DFA圖中匹配并將其ID保存在URL節(jié)點(diǎn)上;第四步、將HTTP方法轉(zhuǎn)換成對應(yīng)的ID保存入U(xiǎn)RL節(jié)點(diǎn)。進(jìn)一步地,所述的一種URL過濾系統(tǒng)的應(yīng)用方法,其中所述第六步中,相應(yīng)的動(dòng)作 指與策略相匹配的進(jìn)行放行,反之則過濾。本發(fā)明的有益效果主要體現(xiàn)在以用戶自定義域(DOMAIN),通用資源標(biāo)志符 (URI),擴(kuò)展名為基礎(chǔ),對用戶關(guān)心的URL信息進(jìn)行檢測,控制。并且解決了性能上的問題, 通過系統(tǒng)DFA方法以達(dá)到匹配規(guī)則,時(shí)間復(fù)雜度為0(1)。
下面結(jié)合附圖對本發(fā)明技術(shù)方案作進(jìn)一步說明圖1 本發(fā)明用戶自定義規(guī)則生成DFA圖并且對應(yīng)規(guī)則的策略。圖2 本發(fā)明URL過濾的主要流程。圖3 本發(fā)明DOMAIN,URI,擴(kuò)展名,HTTP方法匹配過程,即規(guī)則的匹配過程。
具體實(shí)施例方式本發(fā)明揭示了一種URL過濾系統(tǒng)的應(yīng)用方法,如圖1、圖2、圖3所示,該URL過濾 系統(tǒng)以用戶自定義URL匹配規(guī)則為基礎(chǔ),以DFA快速定位URL屬于那條規(guī)則為核心,以策略 為手段實(shí)現(xiàn)URL過濾系統(tǒng),包括以下步驟第一步、分配用來存儲(chǔ)用戶自定義URL匹配規(guī)則的內(nèi)存;第二步、分配用來存放DFA圖的內(nèi)存;第三步、將用戶自定義URL規(guī)則生成DFA圖;第四步、將網(wǎng)內(nèi)HTTP請求中的DOMAIN,URI以及擴(kuò)展名到生成的DFA圖中匹配,其 時(shí)間復(fù)雜度0(1);第五步、將第四步得到的結(jié)果填入對應(yīng)http記錄相應(yīng)的結(jié)點(diǎn);第六步、根據(jù)用戶設(shè)定的策略匹配,并做相應(yīng)的動(dòng)作(過濾/放行);本發(fā)明用戶自定義規(guī)則以對象為基準(zhǔn),后根據(jù)對象生成DFA圖;其中規(guī)則包括URL
4規(guī)則和擴(kuò)展名規(guī)則;URL分成兩個(gè)部分DOMAIN和URI ;先匹配DOMAIN再根據(jù)URI,這樣會(huì)增 加匹配的效率;與普通正則表達(dá)式匹配相比較使用DFA更有效率;本發(fā)明為每一個(gè)HTTP會(huì)話保留相關(guān)URL,擴(kuò)展名,以及HTTP方法保存其相應(yīng)的 ID ;之后根據(jù)相應(yīng)的ID在策略中進(jìn)行匹配;并將符合策略條件的HTTP流量作相應(yīng)的動(dòng)作 (通過/阻止);本發(fā)明尚有多種具體的實(shí)施方式,凡采用等同替換或者等效變換而形成的所有技 術(shù)方案,均落在本發(fā)明要求保護(hù)的范圍之內(nèi)。
權(quán)利要求
1.一種URL過濾系統(tǒng)的應(yīng)用方法,該URL過濾系統(tǒng)以用戶自定義URL匹配規(guī)則為基礎(chǔ), 其特征在于應(yīng)用該URL過濾系統(tǒng)時(shí),包括如下步驟,第一步、分配用來存儲(chǔ)用戶自定義URL匹配規(guī)則的內(nèi)存; 第二步、分配用來存放DFA圖的內(nèi)存; 第三步、將用戶自定義URL規(guī)則生成DFA圖;第四步、將網(wǎng)內(nèi)HTTP請求中的DOMAIN,URI以及擴(kuò)展名到生成的DFA圖中匹配; 第五步、將第四步得到的結(jié)果填入對應(yīng)HTTP,記錄相應(yīng)的節(jié)點(diǎn); 第六步、根據(jù)用戶設(shè)定的策略匹配,并做相應(yīng)的動(dòng)作。
2.根據(jù)權(quán)利要求1所述的一種URL過濾系統(tǒng)的應(yīng)用方法,其特征在于所述第四步中 匹配的時(shí)間復(fù)雜度0(1)。
3.根據(jù)權(quán)利要求1所述的一種URL過濾系統(tǒng)的應(yīng)用方法,其特征在于所述第一步中 用戶自定義URL匹配規(guī)則是指URL過濾的流程,HTTP包文件中的URL分成DOMAIN,URI,HTTP 方法和擴(kuò)展名,該具體流程為第一步、將DOMAIN,URI、HTTP方法和擴(kuò)展名去用戶自定規(guī)則的DFA圖中查找相應(yīng)的ID號(hào);第二步、根據(jù)用戶設(shè)定的策略對比以上的ID號(hào),符合條件的按要求設(shè)定的作行為,所 述行為為放行或丟棄,默認(rèn)的行為為放行。
4.根據(jù)權(quán)利要求1所述的一種URL過濾系統(tǒng)的應(yīng)用方法,其特征在于所述第四步中 匹配的具體步驟為第一步、將DOMAIN放入U(xiǎn)RL DFA匹配;第二步、根據(jù)DOMAIN匹配到的ID,將URI放入U(xiǎn)RL DFA中匹配并將對應(yīng)的ID保存在該 URL節(jié)點(diǎn)上;第三步、將擴(kuò)展名放入擴(kuò)展名的DFA圖中匹配并將其ID保存在URL節(jié)點(diǎn)上; 第四步、將HTTP方法轉(zhuǎn)換成對應(yīng)的ID保存入U(xiǎn)RL節(jié)點(diǎn)。
5.根據(jù)權(quán)利要求1所述的一種URL過濾系統(tǒng)的應(yīng)用方法,其特征在于所述第六步中, 相應(yīng)的動(dòng)作指與策略相匹配的進(jìn)行放行,反之則過濾。
全文摘要
本發(fā)明提供了一種URL過濾系統(tǒng)的應(yīng)用方法,該URL過濾系統(tǒng)以用戶自定義URL匹配規(guī)則為基礎(chǔ),應(yīng)用該URL過濾系統(tǒng)時(shí),先分配用來存儲(chǔ)用戶自定義URL匹配規(guī)則的內(nèi)存;再分配用來存放DFA圖的內(nèi)存;將用戶自定義URL規(guī)則生成DFA圖;將網(wǎng)內(nèi)HTTP請求中的DOMAIN,URI以及擴(kuò)展名到生成的DFA圖中匹配;將上述得到的結(jié)果填入對應(yīng)HTTP,記錄相應(yīng)的節(jié)點(diǎn);根據(jù)用戶設(shè)定的策略匹配,并做相應(yīng)的動(dòng)作。本發(fā)明以用戶自定義域(DOMAIN),通用資源標(biāo)志符(URI),擴(kuò)展名為基礎(chǔ),對用戶關(guān)心的URL信息進(jìn)行檢測,控制。并且解決了性能上的問題,通過系統(tǒng)DFA方法以達(dá)到匹配規(guī)則,時(shí)間復(fù)雜度為O(1)。
文檔編號(hào)G06F17/30GK102004789SQ201010576719
公開日2011年4月6日 申請日期2010年12月7日 優(yōu)先權(quán)日2010年12月7日
發(fā)明者張賓, 胡斌 申請人:蘇州邁科網(wǎng)絡(luò)安全技術(shù)股份有限公司