亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種信息分析方法及系統(tǒng)與流程

文檔序號:12906076閱讀:283來源:國知局
一種信息分析方法及系統(tǒng)與流程

本發(fā)明涉及通信領域中的網(wǎng)絡資源管理技術,尤其涉及一種信息分析方法及系統(tǒng)。



背景技術:

隨著互聯(lián)網(wǎng)業(yè)務的快速發(fā)展,針對互聯(lián)網(wǎng)站點內容的用戶訪問量不斷增加,網(wǎng)絡擁塞和源站服務器超載現(xiàn)象日益頻繁突出,為減輕服務器的負載、降低網(wǎng)絡擁塞、減少用戶訪問延遲,互聯(lián)網(wǎng)內容緩存技術應運而生。但是內容緩存系統(tǒng)并不是一個獨立的離線系統(tǒng),該系統(tǒng)需要日常不間斷地在線運營才能發(fā)揮其最大的緩存加速效力。這是由于以下2個原因:第一、并不是所有的互聯(lián)網(wǎng)內容都能夠進行靜態(tài)緩存:互聯(lián)網(wǎng)內容主要由文本、圖片、視頻、應用文件、腳本等組成,并不是所有內容都可以通過第三方緩存來實現(xiàn)正確的加載,有些動態(tài)內容需要到源站進行計算才能夠實現(xiàn)會送用戶想要的正確的內容,由于緩存僅是一個大容量的存儲系統(tǒng),它并不具備源站的計算能力;第二、互聯(lián)網(wǎng)內容是復雜多變的,對于已經(jīng)生成的緩存策略需要進行持續(xù)更新,才能保證該策略對應的站點內容正確的被緩存加速。

因此,互聯(lián)網(wǎng)內容緩存系統(tǒng)正常運轉需要日常不間斷的互聯(lián)網(wǎng)內容運營工作支撐,以不斷新增或更新緩存策略,提供正確的緩存加速服務。在運營工作中,為針對某個站點生成正確的緩存策略,需要首先獲取該站點服務器都有哪些文件內容,進而對獲取的內容進行類聚分析,以用若干條策略描述出該站點可緩存內容和不可緩存內容,生成緩存策略配置至緩存系統(tǒng)中。同時由于各大視頻網(wǎng)站都采用了防盜鏈技術來防止第三方竊取其寶貴的內容,導致緩存系統(tǒng)很難對各大視頻網(wǎng)站的視頻進行緩存。



技術實現(xiàn)要素:

有鑒于此,本發(fā)明的目的在于提供一種信息分析方法及系統(tǒng),能至少解決現(xiàn)有技術中存在的上述問題。

為達到上述目的,本發(fā)明的技術方案是這樣實現(xiàn)的:

本發(fā)明實施例提供了一種信息分析方法,所述方法包括:

獲取到至少一個目標網(wǎng)站中每一個目標網(wǎng)站的至少兩個統(tǒng)一資源定位器url;

對每一個目標網(wǎng)站的所述至少兩個url進行比對,得到每一個所述目標網(wǎng)站對應的通用防盜鏈url字符串;

利用所述目標網(wǎng)站對應的所述通用防盜鏈url字符串,建立通用防盜鏈數(shù)據(jù)庫;

利用所述通用防盜鏈數(shù)據(jù)庫,生成針對通用防盜鏈的規(guī)則。

本發(fā)明實施例提供了一種信息分析系統(tǒng),所述系統(tǒng)包括:

流量采集單元,用于獲取到至少一個目標網(wǎng)站中每一個目標網(wǎng)站的至少兩個url;

流量數(shù)據(jù)處理單元,用于對每一個目標網(wǎng)站的所述至少兩個url進行比對,得到每一個所述目標網(wǎng)站對應的通用防盜鏈url字符串;利用所述目標網(wǎng)站對應的所述通用防盜鏈url字符串,建立通用防盜鏈數(shù)據(jù)庫;利用所述通用防盜鏈數(shù)據(jù)庫,生成針對通用防盜鏈的規(guī)則。

本發(fā)明實施例提供了信息分析方法及系統(tǒng),就能夠基于獲取到的多個目標網(wǎng)站的url,并且根據(jù)多個目標網(wǎng)站的url建立通用防盜鏈數(shù)據(jù)庫,最終基于所述數(shù)據(jù)庫建立針對通用防盜鏈的規(guī)則。通過該方法能夠有效維護多個域名的通用防盜鏈url字符串,并能夠動態(tài)地根據(jù)不同參數(shù)為緩存設備提供黑白名單配置規(guī)則,如此,就填補了網(wǎng)站url防盜鏈無法自動逆向分析和維護的空白。

附圖說明

圖1為本發(fā)明實施例信息分析方法流程示意圖;

圖2為本發(fā)明實施例信息分析系統(tǒng)組成結構示意圖;

圖3為本發(fā)明實施例信息分析系統(tǒng)實施結構示例。

具體實施方式

下面結合附圖及具體實施例對本發(fā)明再作進一步詳細的說明。

實施例一、

本發(fā)明實施例提供了一種信息分析方法,如圖1所示,包括:

步驟101:獲取到至少一個目標網(wǎng)站中每一個目標網(wǎng)站的至少兩個統(tǒng)一資源定位器url;

步驟102:對每一個目標網(wǎng)站的所述至少兩個url進行比對,得到每一個所述目標網(wǎng)站對應的通用防盜鏈url字符串;

步驟103:利用所述目標網(wǎng)站對應的所述通用防盜鏈url字符串,建立通用防盜鏈數(shù)據(jù)庫;

步驟104:利用所述通用防盜鏈數(shù)據(jù)庫,生成針對通用防盜鏈的規(guī)則。

這里,本實施例中所述信息分析方法可以應用于至少一個服務器組成的集群中;或者,也可以應用于一個服務器中,可以根據(jù)實際情況進行設置。

上述步驟101中,所述獲取到至少一個目標網(wǎng)站中每一個目標網(wǎng)站的至少一個統(tǒng)一資源定位器url,可以包括:先設置分布式至少一個流量采集器,至少一個流量采集器獲取、選擇和提純至少一個統(tǒng)一資源定位器url作為原始數(shù)據(jù)樣本。

所述獲取數(shù)據(jù)樣本,可以為:在網(wǎng)絡中設置爬蟲服務器,即運行爬取網(wǎng)站url程序的windowspc機,獲取并選擇視頻網(wǎng)站url數(shù)據(jù)樣本。

具體如下:利用爬蟲獲取指定分析的域名入口(如http://tv.sohu.com),獲得相應網(wǎng)站的域名列表存儲到磁盤中。

其中,所述相應網(wǎng)站的域名列表可以包括:

http://tv.sohu.com/20080504/n256652702.shtml、

http://v.sohu.com/20080428/n256554182.shtml、

http://tv.sohu.com/20090211/n262183824.shtml、

http://v.sohu.com/20080428/n526532112.shtml等。

進一步地,獲取到至少兩個url之后,還可以針對獲取到所述至少兩個url進行數(shù)據(jù)清洗,具體包括:過濾掉非目標網(wǎng)站域名所屬的url,如廣告鏈接。然后對url數(shù)據(jù)進行去重操作,清洗掉數(shù)據(jù)噪音。其中,所述清洗掉數(shù)據(jù)噪音的方式可以有以下兩種:比如,利用“sohu”作為關鍵字進行清洗;另一種可以是去重操作,也就是前面所述的對url數(shù)據(jù)進行去重操作。

上述步驟102中,所述對所述至少兩個url進行比對,得到所述至少一個目標網(wǎng)站對應的至少一個通用防盜鏈url字符串,包括:

針對每一個目標網(wǎng)站,選取對應的至少兩個url;

利用多序列對比算法,對選取的目標網(wǎng)站對應的至少兩個url進行比對,以得到所述至少兩個url對應的最長url字段;其中,所述最長url字段表征所述至少兩個url中包含的共有信息;

將所述至少兩個url對應的最長url字段作為所述通用防盜鏈url字符串。

首先,利用多序列對比算法,對選取的目標網(wǎng)站對應的至少兩個url進行比對,可以為:利用多序列比對算法對輸入序列進行雙序列全局和局部比對;建立全局比對信息庫和局部比對信息庫,然后合成兩個庫為一個基本比對信息庫。其中,所述多序列比對算法可以包括以下之一:t-coffee、clustalw、muscle、mafft、hmm-kalign等;具體采用多序列比對算法的方式這里不做贅述。

其次,多序列比對算法有效地綜合全局比對和局域比對等雙序列結果形成初始比對庫。多序列比對算法可以啟發(fā)式比較每個兩兩比對與其他所有序列的信息,并將結果進行多序列比對。

進一步地,上述方案中進行比對的操作,除了直接進行url比對的方式,還可以具備以下操作方式:

所述利用多序列對比算法,對選取的目標網(wǎng)站對應的至少兩個url進行比對,還包括:獲取到所述至少兩個url對應的權重值;

基于所述至少兩個url對應的權重值,采用多序列對比算法對選取的目標網(wǎng)站對應的至少兩個url進行比對。

多序列比對算法可以結合全局和局部雙序列比對設計加權系統(tǒng),保證了任一序列對的最終權重反映了全部序列能所包含的全部相關信息。多序列比對算法結合序列之間的距離,得到最終的結果。即輸出通用防盜鏈url字符串最長url字段,如http://tv.sohu.com/…n…\.shtml,其中\(zhòng)為轉義符。

其中,所述權重值可以設置兩個級別,高權重值和低權重值,比如,高權重值可以為2,低權重值可以為0.5;相應的,所述url對應的權重值的確定方式可以為:將包含所述目標網(wǎng)站的主頁鏈接信息的url設置為高權重,其余的url設置為低權重。比如,主要想分析v.sohu.com但是很有可能會頁面攜帶不少其他的url,其中有很多是廣告或者圖片服務器,例如click.tanx.com/***;將出現(xiàn)“v.sohu.com”序列的url給予較高權重,其他url也予以保留(click.tanx.com)也保留,但是對應的權重較低。

上述步驟103中,建立通用防盜鏈數(shù)據(jù)庫時,首先可以對通用防盜鏈url字符串庫維護算法變量定義:

由于可能需要維護多達上百個的url的通用防盜鏈url字符串,而單一的待分析數(shù)據(jù)集輸出一般只對應于一個網(wǎng)站域名,而一個域名可能包含若干種不同的類型的通用防盜鏈url字符串,所以需要通用防盜鏈url字符串提取算法能夠同時維護多個域名的多個通用防盜鏈url字符串。

在經(jīng)過基于多序列比對的通用防盜鏈url字符串提取核心算法得到一系列特征后,需要對提取出來的冗余特征進行去除。其具體定義如表1所示:

表1

對每次經(jīng)過通用防盜鏈url字符串提取核心算法提取出的通用防盜鏈url字符串按照通用防盜鏈url字符串長度進行排序,生成一個待處理通用防盜鏈url字符串序列。其中以每個通用防盜鏈url字符串以“\n”結尾作為結束符。

基于上述定義建立通用防盜鏈url字符串輸入隊列,即所述利用所述目標網(wǎng)站對應的所述通用防盜鏈url字符串建立通用防盜鏈數(shù)據(jù)庫,可以包括:建立空的n叉樹數(shù)據(jù)結構;其中,n為大于等于2的整數(shù);根據(jù)預設條件,逐個將所述目標網(wǎng)站對應的通用防盜鏈url字符串添加至所述n叉樹數(shù)據(jù)結構。

由于通用防盜鏈url字符串提取核心算法產(chǎn)生的通用防盜鏈url字符串長度至少為2,故建立長度為1,通用防盜鏈url字符串值為“*”的結點root作為n叉樹的根結點,建立一個n叉樹。

插入通用防盜鏈url字符串,需要滿足的預設條件包括:

1、si的長度>=2;所述通用防盜鏈url字符串的長度大于預設長度;

2、si.tphitflows_ratio>min_tphitflows_ratio,其中tphitflows_ratio為si在m中出現(xiàn)比例;所述通用防盜鏈url字符串在url庫的各個url中出現(xiàn)的比例大于預設比例值;

3、si.packetdistribution<max_pktopcount),其中packetdistribution為si在m中出現(xiàn)的位于不同包位置的統(tǒng)計量;所述通用防盜鏈url字符串在url庫中的各個url中的不同位置的數(shù)量小于預設門限值;

4、si.sigdata不在blacklist中,其中si.sigdata為通用防盜鏈url字符串的實際內容;所述通用防盜鏈url字符串對應的實際內容不在預設的黑名單中。

比如,實際的字符內容包括http://111.206.106.209/youku/65747b445ef42835efcbbf516e/030002070252a1abf58570041f3eeb2e9cbbcd-2d92-f8f3-9cd1-a713ed7f51d0.flv;和,http://111.206.106.209/youku/6775f9b0866338297d61a753ec/030002070252a1abf58570041f3eeb2e9cbbcd-2d92-f8f3-9cd1-a713ed7f51d0.flv;

提取出來的字符串類似:http://......../youku/..........flv。

也就是說,當滿足上述4個條件時,將通用防盜鏈url字符串序列中的通用防盜鏈url字符串si插入到n叉樹結構(sigtree)中。直到t隊列為空,則通用防盜鏈url字符串庫建立成功。

進一步地,執(zhí)行上述步驟104之前,所述建立通用防盜鏈數(shù)據(jù)庫之后,所述方法還包括:基于所述通用防盜鏈數(shù)據(jù)庫中的通用防盜鏈url字符串,查找所述通用防盜鏈url字符串對應的url并展示所述url。

首先需要進行通用防盜鏈url字符串生成:將n叉樹進行深度優(yōu)先遍歷,獲得去重的通用防盜鏈url字符串。另外,還可以包括:反查所述通用防盜鏈url字符串對應的url,并報表展示。

需要說明的是,所述通用防盜鏈url字符串展示,可以包括:將通用防盜鏈url字符串在真實url進行重點突出處理(如標紅、加重等)。

最后,上述步驟104中所述生成針對通用防盜鏈的規(guī)則以對url進行處理,包括:發(fā)送所述通用防盜鏈的規(guī)則至緩存設備中,以對所述緩存設備中的黑白名單列表進行處理。

其中,所述通用防盜鏈的規(guī)則可以為生成正則表達式;相應的,將正則表達式下發(fā)到緩存設備的黑白名單列表中。其中,所述正則表達式可以如下:

http://[0-9]{0,3}\.[0-9]{0,3}\.[0-9]{0,3}\.[0-9]{0,3}/(youku)/[0-9,a-e]{25,27}/(.*.flv)。

上述方案核心思想是:(一)通用防盜鏈url字符串庫的提取:本發(fā)明首次提出利用dns多序列比對的方法對網(wǎng)站url防盜鏈進行逆向分析。(二)通用防盜鏈url字符串庫的維護方法。具體的,流量通用防盜鏈url字符串提取器在已經(jīng)獲得的純凈數(shù)據(jù)基礎上,提取或生成網(wǎng)絡業(yè)務流量通用防盜鏈url字符串,并建立業(yè)務流通用防盜鏈url字符串庫,以便管理和維護業(yè)務流通用防盜鏈url字符串;流量通用防盜鏈url字符串提取器還要選擇適宜的業(yè)務流通用防盜鏈url字符串,以輔助研究人員或網(wǎng)絡管理者進一步分析,并提供給dpi設備利用。

可見,通過采用上述方案,就能夠基于獲取到的多個目標網(wǎng)站的url,并且根據(jù)多個目標網(wǎng)站的url建立通用防盜鏈數(shù)據(jù)庫,最終基于所述數(shù)據(jù)庫建立針對通用防盜鏈的規(guī)則。通過該方法能夠有效維護多個域名的通用防盜鏈url字符串,并動態(tài)地根據(jù)不同參數(shù)為緩存設備提供黑白名單配置規(guī)則。

另外,上述方案還提供了基于通用防盜鏈url字符串的黑白名單下發(fā)機制;基于多序列比對算法的通用防盜鏈url字符串提取的方式;以及基于n叉樹的通用防盜鏈url字符串庫維護算法。

如此,就填補了網(wǎng)站url防盜鏈無法自動逆向分析和維護的空白,具有很好的推廣應用前景。

實施例二、

本發(fā)明實施例提供了一種信息分析系統(tǒng),如圖2所示,所述系統(tǒng)包括:

流量采集單元21,用于獲取到至少一個目標網(wǎng)站中每一個目標網(wǎng)站的至少一個統(tǒng)一資源定位器(url);

流量數(shù)據(jù)處理單元22,用于對每一個目標網(wǎng)站的所述至少兩個url進行比對,得到每一個所述目標網(wǎng)站對應的通用防盜鏈url字符串;利用所述目標網(wǎng)站對應的所述通用防盜鏈url字符串,建立通用防盜鏈數(shù)據(jù)庫;利用所述通用防盜鏈數(shù)據(jù)庫,生成針對通用防盜鏈的規(guī)則。

這里,本實施例中所述信息分析方法可以應用于至少一個服務器組成的集群中;或者,也可以應用于一個服務器中,可以根據(jù)實際情況進行設置。

上述流量采集單元,可以表現(xiàn)為分布式的至少一個流量采集器,至少一個流量采集器獲取、選擇和提純至少一個統(tǒng)一資源定位器url作為原始數(shù)據(jù)樣本。

所述流量采集單元可以通過在網(wǎng)絡中設置爬蟲服務器,即運行爬取網(wǎng)站url程序的windowspc機,獲取并選擇視頻網(wǎng)站url數(shù)據(jù)樣本。

具體如下:利用爬蟲爬取指定分析的域名入口(如http://tv.sohu.com),獲得相應網(wǎng)站的域名列表存儲到磁盤中。

其中,所述相應網(wǎng)站的域名列表可以包括:

http://tv.sohu.com/20080504/n256652702.shtml、

http://v.sohu.com/20080428/n256554182.shtml、

http://tv.sohu.com/20090211/n262183824.shtml、

http://v.sohu.com/20080428/n526532112.shtml等。

進一步地,流量采集單元,用于過濾掉非目標網(wǎng)站域名所屬的url,如廣告鏈接。然后對url數(shù)據(jù)進行去重操作,清洗掉數(shù)據(jù)噪音。

所述流量數(shù)據(jù)處理單元,用于從所述至少一個目標網(wǎng)站中依次選取一個目標網(wǎng)站對應的至少兩個url;利用多序列對比算法,對選取的目標網(wǎng)站對應的 至少兩個url進行比對,以得到所述至少兩個url對應的最長url字段;其中,所述最長url字段表征所述至少兩個url中包含的共有信息;將所述至少兩個url對應的最長url字段作為選取的一個目標網(wǎng)站對應的所述通用防盜鏈url字符串。

首先,利用多序列對比算法,對選取的目標網(wǎng)站對應的至少兩個url進行比對,可以為:利用多序列比對算法對輸入序列進行雙序列全局和局部比對;建立全局比對信息庫和局部比對信息庫,然后合成兩個庫為一個基本比對信息庫。其中,所述多序列比對算法可以包括以下之一:t-coffee、clustalw、muscle、mafft、hmm-kalign等;具體采用多序列比對算法的方式這里不做贅述。

其次,多序列比對算法有效地綜合全局比對和局域比對等雙序列結果形成初始比對庫。多序列比對算法可以啟發(fā)式比較每個兩兩比對與其他所有序列的信息,并將結果進行多序列比對。

進一步地,上述方案中進行比對的操作,除了直接進行url比對的方式,還可以具備以下操作方式:

所述流量數(shù)據(jù)處理單元,用于獲取到所述至少兩個url對應的權重值;基于所述至少兩個url對應的權重值,采用多序列對比算法對選取的目標網(wǎng)站對應的至少兩個url進行比對。多序列比對算法可以結合全局和局部雙序列比對設計加權系統(tǒng),構建指導庫。多序列比對算法保證了任一序列對的最終權重反映了全部序列能所包含的全部相關信息??紤]每個序列對與其他比對中相關序列對的一致性問題,同時為了增加庫內序列對的信息含量,多序列比對算法通過加權來體現(xiàn)這種相容性程度。多序列比對算法的加權不僅體現(xiàn)了兩個序列的相似性,而且體現(xiàn)了與其他序列比對的相容性。t-coffee算法綜合了全部庫相關的信息,結合序列之間的距離,近鄰歸并法生成并構建出指導樹擴展庫;最終根據(jù)構建成的擴展庫,采用漸進式比對算法,得到最終的結果。即輸出通用防盜鏈url字符串最長url字段,如http://tv.sohu.com/...n…\.shtml,其中\(zhòng)為轉義符。

所述流量數(shù)據(jù)處理單元,用于可以對通用防盜鏈url字符串庫維護算法變量定義:由于可能需要維護多達上百個的url的通用防盜鏈url字符串,而單一的待分析數(shù)據(jù)集輸出一般只對應于一個網(wǎng)站域名,而一個域名可能包含若干種不同的類型的通用防盜鏈url字符串,所以需要通用防盜鏈url字符串提取算法能夠同時維護多個域名的多個通用防盜鏈url字符串。

在經(jīng)過基于多序列比對的通用防盜鏈url字符串提取核心算法得到一系列特征后,需要對提取出來的冗余特征進行去除。其具體定義如表1所示:

表1

對每次經(jīng)過通用防盜鏈url字符串提取核心算法提取出的通用防盜鏈url字符串按照通用防盜鏈url字符串長度進行排序,生成一個待處理通用防盜鏈url字符串序列。其中以每個通用防盜鏈url字符串以“\n”結尾作為結束符。

基于上述定義建立通用防盜鏈url字符串輸入隊列,所述流量數(shù)據(jù)處理單元,用于建立空的n叉樹數(shù)據(jù)結構;其中,n為大于等于2的整數(shù);根據(jù)預設條件,逐個將所述至少一個目標網(wǎng)站中每一個目標網(wǎng)站對應的通用防盜鏈url字符串添加至所述n叉樹數(shù)據(jù)結構。

由于通用防盜鏈url字符串提取核心算法產(chǎn)生的通用防盜鏈url字符串長度至少為2,故建立長度為1,通用防盜鏈url字符串值為“*”的結點root作為n叉樹的根結點,建立一個n叉樹。

插入通用防盜鏈url字符串,需要滿足的預設條件包括:

1、si的長度>=2;所述通用防盜鏈url字符串的長度大于預設長度;

2、si.tphitflows_ratio>min_tphitflows_ratio,其中tphitflows_ratio為si在m中出現(xiàn)比例;所述通用防盜鏈url字符串在url庫的各個url中出現(xiàn)的比例大于預設比例值;

3、si.packetdistribution<max_pktopcount),其中packetdistribution為si在m中出現(xiàn)的位于不同包位置的統(tǒng)計量;所述通用防盜鏈url字符串在url庫中的各個url中的不同位置的數(shù)量小于預設門限值;

4、si.sigdata不在blacklist中,其中si.sigdata為通用防盜鏈url字符串的實際內容;所述通用防盜鏈url字符串對應的實際內容不在預設的黑名單中。

也就是說,當滿足上述4個條件時,將通用防盜鏈url字符串序列中的通用防盜鏈url字符串si插入到n叉樹結構(sigtree)中。直到t隊列為空,則通用防盜鏈url字符串庫建立成功。

進一步地,所述流量數(shù)據(jù)處理單元,用于基于所述通用防盜鏈數(shù)據(jù)庫中的通用防盜鏈url字符串,查找所述通用防盜鏈url字符串對應的url并展示所述url。

首先需要進行通用防盜鏈url字符串生成:將n叉樹進行深度優(yōu)先遍歷,獲得去重的通用防盜鏈url字符串。另外,還可以包括:反查所述通用防盜鏈url字符串對應的url,并報表展示。

需要說明的是,所述通用防盜鏈url字符串展示,可以包括:將通用防盜鏈url字符串在真實url進行重點突出處理(如標紅、加重等)。

最后,所述系統(tǒng)還包括:緩存設備23,用于根據(jù)操作對黑白名單列表進行處理;

相應的,所述流量數(shù)據(jù)處理單元22,用于發(fā)送所述通用防盜鏈的規(guī)則至緩存設備中,以對所述緩存設備中的黑白名單列表進行處理。

其中,所述通用防盜鏈的規(guī)則可以為生成正則表達式;相應的,將正則表達式下發(fā)到緩存設備的黑白名單列表中。

下面結合圖3將本實施例提供的系統(tǒng)進行具體說明,其中,所述流量采集單元具體實現(xiàn)時可以設置在爬蟲服務器中;所述流程數(shù)據(jù)處理單元可以根據(jù)功能不同采用多個服務器組成,比如,可以包括有服務器進行url存儲操作、有服務器設置為進行序列對比操作、有服務器設置為通用字段管理操作、有服務器設置為進行規(guī)則生成操作;另外,所述緩存設備在實際實現(xiàn)時可以有管理系統(tǒng)和具體的緩存設備兩部分共同組成,通過緩存設備的管理系統(tǒng)從規(guī)則生成的服務器側獲取到黑白名單,并下發(fā)到緩存設備中。

可見,通過采用上述方案,就能夠基于獲取到的多個目標網(wǎng)站的url,并且根據(jù)多個目標網(wǎng)站的url建立通用防盜鏈數(shù)據(jù)庫,最終基于所述數(shù)據(jù)庫建立針對通用防盜鏈的規(guī)則。從而,能夠幫助網(wǎng)絡管理者能夠方便、快捷、準確地分析和感知新型業(yè)務,并為網(wǎng)絡管理者更好更快地管理dpi設備提供一種輔助的自動機制,從而為互聯(lián)網(wǎng)流量感知設備與網(wǎng)絡研究人員和管理者提供判斷依據(jù)。

另外,上述方案還提供了基于通用防盜鏈url字符串的黑白名單下發(fā)機制;基于多序列比對算法的通用防盜鏈url字符串提取的方式;以及基于n叉樹的通用防盜鏈url字符串庫維護算法。

如此,就填補了網(wǎng)站url防盜鏈無法自動逆向分析和維護的空白,具有很好的推廣應用前景。

本發(fā)明實施例所述集成的模塊如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質中。基于這樣的理解,本發(fā)明實施例的技術方案本質上或者說對現(xiàn)有技術做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質中,包括若干指令用以使得一臺計算機設備(可以是個人計算機、網(wǎng)絡設備、或者網(wǎng)絡設備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分。而前述的存儲介質包括:u盤、移動硬盤、只讀存儲器(rom,read-onlymemory)、隨機存取存儲器(ram,randomaccessmemory)、磁碟或者光盤等各種可以存儲程序代碼的介質。這樣,本發(fā)明實施例不限制于任何特定的硬件和軟件結合。

以上所述,僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范圍。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1