亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

頁(yè)面篡改檢測(cè)方法及黑鏈數(shù)據(jù)庫(kù)生成方法

文檔序號(hào):6546760閱讀:231來(lái)源:國(guó)知局
頁(yè)面篡改檢測(cè)方法及黑鏈數(shù)據(jù)庫(kù)生成方法【專利摘要】本申請(qǐng)?zhí)峁┝艘环N檢測(cè)頁(yè)面篡改的方法及裝置,其中,所述方法包括:生成黑鏈特征數(shù)據(jù)庫(kù),并在多臺(tái)服務(wù)器中部署所述黑鏈特征數(shù)據(jù)庫(kù),所述黑鏈特征數(shù)據(jù)庫(kù)中包括黑鏈特征數(shù)據(jù);獲取當(dāng)前檢測(cè)頁(yè)面的特征信息;依據(jù)所述頁(yè)面的特征信息確定對(duì)應(yīng)的目標(biāo)服務(wù)器;采用所述目標(biāo)服務(wù)器中的黑鏈特征數(shù)據(jù)庫(kù)與當(dāng)前檢測(cè)頁(yè)面進(jìn)行匹配,判斷當(dāng)前檢測(cè)頁(yè)面中是否包含所述黑鏈特征數(shù)據(jù)庫(kù)中的黑鏈特征數(shù)據(jù),若是,則判定當(dāng)前頁(yè)面為被篡改頁(yè)面。本申請(qǐng)可以在盡可能減少人工干預(yù)的前提下,提高檢測(cè)頁(yè)面篡改的效率和準(zhǔn)確率,尤其是在需檢測(cè)頁(yè)面數(shù)量眾多,并且,所需匹配的黑鏈特征數(shù)據(jù)較多的情況下,提高檢測(cè)頁(yè)面篡改的效率和準(zhǔn)確率。【專利說(shuō)明】頁(yè)面篡改檢測(cè)方法及黑鏈數(shù)據(jù)庫(kù)生成方法[0001]本發(fā)明專利申請(qǐng)是申請(qǐng)日為2011年12月30日、申請(qǐng)?zhí)枮?01110457654.3、名稱為“一種檢測(cè)頁(yè)面篡改的方法及裝置”的中國(guó)發(fā)明專利申請(qǐng)的分案申請(qǐng)?!?br>技術(shù)領(lǐng)域
】[0002]本申請(qǐng)涉及計(jì)算機(jī)安全的【
技術(shù)領(lǐng)域
】,特別是涉及一種檢測(cè)頁(yè)面篡改的方法,以及一種檢測(cè)頁(yè)面篡改的裝置?!?br>背景技術(shù)
】[0003]萬(wàn)維網(wǎng)成為大量信息的載體,為有效地提取并利用這些信息,搜索引擎(SearchEngine)作為一個(gè)輔助人們檢索信息的工具,成為用戶訪問(wèn)萬(wàn)維網(wǎng)的入口和指南。[0004]SEO(SearchEngineOptimizat1n,搜索引擎優(yōu)化),是較為流行的網(wǎng)絡(luò)營(yíng)銷方式,主要目的是增加特定關(guān)鍵字的曝光率以增加網(wǎng)站的能見(jiàn)度,使其提高搜索引擎排名,從而提高網(wǎng)站訪問(wèn)量,最終提升網(wǎng)站的銷售能力或宣傳能力。網(wǎng)站SEO數(shù)據(jù)表示本網(wǎng)站的內(nèi)容在其它搜索引擎中被收錄的數(shù)量,收錄得越多就更容易被用戶搜索到。[0005]對(duì)于搜索引擎的這種特性,目前有些工具提供了黑鏈技術(shù),黑鏈?zhǔn)荢EO黑帽手法中相當(dāng)普遍的一種手段,籠統(tǒng)地說(shuō),它就是指一些人用非正常的手段獲取的其它網(wǎng)站的反向鏈接,最常見(jiàn)的黑鏈就是通過(guò)各種網(wǎng)站程序漏洞獲取搜索引擎權(quán)重或者PR(PageRank,網(wǎng)頁(yè)級(jí)別),較高的網(wǎng)站的WEBSHELL(匿名用戶(入侵者)通過(guò)網(wǎng)站端口對(duì)網(wǎng)站服務(wù)器的某種程度上操作的權(quán)限),進(jìn)而在被黑網(wǎng)站上鏈接自己的網(wǎng)站。[0006]黑鏈主要針對(duì)搜索引擎,例如,對(duì)搜索引擎搜索出來(lái)的排名最靠前的幾個(gè)網(wǎng)站進(jìn)行簡(jiǎn)單的分析,查看其網(wǎng)站架構(gòu),關(guān)鍵詞分布,以及外鏈等等,有可能發(fā)現(xiàn)一些網(wǎng)站排名非常好,而且關(guān)鍵詞網(wǎng)頁(yè)相關(guān)數(shù)都達(dá)到幾百萬(wàn),但網(wǎng)站架構(gòu)一般,關(guān)鍵詞密度不是很合適,最主要的是有些網(wǎng)站沒(méi)有任何導(dǎo)出的鏈接,通過(guò)查看其反向鏈接才發(fā)現(xiàn),絕大數(shù)外鏈都來(lái)自于黑鏈。SEO主要是靠高質(zhì)量的外鏈來(lái)決定排名,按照百分比來(lái)講,應(yīng)超過(guò)50%,因此在權(quán)重較高的網(wǎng)站上做黑鏈有利于網(wǎng)站排名的。此外黑鏈一般以隱藏鏈接的模式,所以在網(wǎng)站的常規(guī)檢查中管理員很難發(fā)現(xiàn)網(wǎng)站被做了黑鏈。目前,黑鏈一般用于暴利的黑(灰)色產(chǎn)業(yè),例如私服,醫(yī)療,冷門高利潤(rùn)行業(yè)等等。黑鏈也已形成產(chǎn)業(yè)化。在實(shí)際應(yīng)用中,如果用戶沒(méi)有做好安全防護(hù)工作,那么打開(kāi)被黑鏈篡改的頁(yè)面就會(huì)容易就會(huì)感染網(wǎng)站上的病毒。[0007]現(xiàn)有技術(shù)中,對(duì)于黑鏈的檢測(cè)通常是由人工,比如網(wǎng)站的站長(zhǎng),通過(guò)大量人工收集的篡改關(guān)鍵詞,如hack、hackedby,六合彩、性經(jīng)歷、夕卜掛,私服等匹配網(wǎng)頁(yè)中的HTML正文,以判斷其是否被黑鏈篡改。例如,被黑鏈篡改網(wǎng)頁(yè)常見(jiàn)的特征分為黑客炫耀的特征如:然而,這種人工檢測(cè)的方式嚴(yán)重依賴于人工收集的篡改關(guān)鍵詞和人工的定期檢測(cè),效率十分低下。[0008]再者,對(duì)于在所需檢測(cè)頁(yè)面數(shù)量眾多,并且,所需匹配的黑鏈特征數(shù)據(jù)(如篡改關(guān)鍵詞)較多的情況下,人工的方式顯然完全無(wú)法應(yīng)對(duì)。[0009]因此,目前需要本領(lǐng)域技術(shù)人員解決的一個(gè)技術(shù)問(wèn)題就是,提供一種檢測(cè)頁(yè)面篡改的機(jī)制,用以在盡可能減少人工干預(yù)的前提下,提高檢測(cè)頁(yè)面篡改的效率和準(zhǔn)確率,尤其是在需檢測(cè)頁(yè)面數(shù)量眾多,并且,所需匹配的黑鏈特征數(shù)據(jù)較多的情況下,提高檢測(cè)頁(yè)面篡改的效率和準(zhǔn)確率?!?br/>發(fā)明內(nèi)容】[0010]本申請(qǐng)?zhí)峁┮环N檢測(cè)頁(yè)面篡改的方法,用以在盡可能減少人工干預(yù)的前提下,提高檢測(cè)頁(yè)面篡改的效率和準(zhǔn)確率,尤其是在需檢測(cè)頁(yè)面數(shù)量眾多,并且,所需匹配的黑鏈特征數(shù)據(jù)較多的情況下,提高檢測(cè)頁(yè)面篡改的效率和準(zhǔn)確率。[0011]本申請(qǐng)還提供了一種檢測(cè)頁(yè)面篡改的裝置,用以保證上述方法在實(shí)際中的應(yīng)用及實(shí)現(xiàn)。[0012]為了解決上述問(wèn)題,本申請(qǐng)公開(kāi)了一種檢測(cè)頁(yè)面篡改的方法,包括:[0013]生成黑鏈特征數(shù)據(jù)庫(kù),并在多臺(tái)服務(wù)器中部署所述黑鏈特征數(shù)據(jù)庫(kù),所述黑鏈特征數(shù)據(jù)庫(kù)中包括黑鏈特征數(shù)據(jù);[0014]獲取當(dāng)前檢測(cè)頁(yè)面的特征信息;[0015]依據(jù)所述頁(yè)面的特征信息確定對(duì)應(yīng)的目標(biāo)服務(wù)器;[0016]采用所述目標(biāo)服務(wù)器中的黑鏈特征數(shù)據(jù)庫(kù)與當(dāng)前檢測(cè)頁(yè)面進(jìn)行匹配,判斷當(dāng)前檢測(cè)頁(yè)面中是否包含所述黑鏈特征數(shù)據(jù)庫(kù)中的黑鏈特征數(shù)據(jù),若是,則判定當(dāng)前頁(yè)面為被篡改頁(yè)面。[0017]優(yōu)選的,所述服務(wù)器具有服務(wù)器標(biāo)識(shí),所述特征信息包括頁(yè)面分類信息,所述依據(jù)頁(yè)面的特征信息確定對(duì)應(yīng)的目標(biāo)服務(wù)器的步驟包括:[0018]按照預(yù)置的頁(yè)面分類信息與服務(wù)器標(biāo)識(shí)的對(duì)應(yīng)關(guān)系,提取當(dāng)前頁(yè)面分類信息對(duì)應(yīng)的服務(wù)器標(biāo)識(shí);[0019]將所述服務(wù)器標(biāo)識(shí)對(duì)應(yīng)的服務(wù)器確定為目標(biāo)服務(wù)器。[0020]優(yōu)選的,所述特征信息包括頁(yè)面的URL,所述服務(wù)器具有數(shù)值標(biāo)識(shí),所述依據(jù)頁(yè)面的特征信息確定對(duì)應(yīng)的服務(wù)器標(biāo)識(shí)的步驟包括:[0021]采用預(yù)設(shè)算法將當(dāng)前檢測(cè)頁(yè)面的URL轉(zhuǎn)換為數(shù)值;[0022]按所述數(shù)值提取對(duì)應(yīng)數(shù)值標(biāo)識(shí)的服務(wù)器為目標(biāo)服務(wù)器。[0023]優(yōu)選的,所述頁(yè)面分類信息包括頁(yè)面的內(nèi)容分類信息,頁(yè)面的類型分類信息,頁(yè)面的屬性分類信息。[0024]優(yōu)選的,所述生成黑鏈特征數(shù)據(jù)庫(kù)的步驟包括:[0025]采用已有的黑鏈特征數(shù)據(jù)搜索包含所述黑鏈特征數(shù)據(jù)的頁(yè)面為特征頁(yè)面;[0026]分析所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局,當(dāng)發(fā)現(xiàn)布局異常時(shí),從該特征頁(yè)面中提取包含所述黑鏈特征數(shù)據(jù)的頁(yè)面元素;[0027]根據(jù)所述頁(yè)面元素生成黑鏈規(guī)則,采用所述黑鏈規(guī)則在其它特征頁(yè)面中進(jìn)行匹配,并在匹配的特征頁(yè)面中提取新的黑鏈特征數(shù)據(jù);[0028]保存所述黑鏈特征數(shù)據(jù)形成黑鏈特征數(shù)據(jù)庫(kù)。[0029]優(yōu)選的,所述黑鏈特征數(shù)據(jù)包括篡改關(guān)鍵詞和黑鏈URL。[0030]優(yōu)選的,所述分析所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局的步驟包括:[0031]判斷所述黑鏈特征數(shù)據(jù)的頁(yè)面元素位置是否在預(yù)設(shè)閾值范圍內(nèi),若是,則判定所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局異常;[0032]和/或,[0033]判斷所述黑鏈特征數(shù)據(jù)的頁(yè)面元素屬性是否為不可見(jiàn)屬性,若是,則判定所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局異常;[0034]和/或,[0035]判斷所述黑鏈特征數(shù)據(jù)的頁(yè)面元素屬性是否為對(duì)瀏覽器隱藏的屬性,若是,則判定所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局異常。[0036]優(yōu)選的,所述根據(jù)頁(yè)面元素生成黑鏈規(guī)則的步驟為:[0037]從包含所述篡改關(guān)鍵詞和/或黑鏈URL的頁(yè)面元素中,抽象出正則表達(dá)式作為黑鏈規(guī)則。[0038]優(yōu)選的,所述的方法,還包括:[0039]按預(yù)設(shè)時(shí)間間隔更新所述黑鏈特征數(shù)據(jù)庫(kù)。[0040]本申請(qǐng)還公開(kāi)了一種檢測(cè)頁(yè)面篡改的裝置,包括:[0041]數(shù)據(jù)庫(kù)生成模塊,用于生成黑鏈特征數(shù)據(jù)庫(kù),所述黑鏈特征數(shù)據(jù)庫(kù)中包括黑鏈特征數(shù)據(jù);[0042]數(shù)據(jù)庫(kù)部署模塊,用于在多臺(tái)服務(wù)器中部署所述黑鏈特征數(shù)據(jù)庫(kù);[0043]特征信息獲取模塊,用于獲取當(dāng)前檢測(cè)頁(yè)面的特征信息;[0044]目標(biāo)服務(wù)器確定模塊,用于依據(jù)所述頁(yè)面的特征信息確定對(duì)應(yīng)的目標(biāo)服務(wù)器;[0045]篡改檢測(cè)模塊,用于采用所述目標(biāo)服務(wù)器中的黑鏈特征數(shù)據(jù)庫(kù)與當(dāng)前檢測(cè)頁(yè)面進(jìn)行匹配,判斷當(dāng)前檢測(cè)頁(yè)面中是否包含所述黑鏈特征數(shù)據(jù)庫(kù)中的黑鏈特征數(shù)據(jù),若是,則判定當(dāng)前頁(yè)面為被篡改頁(yè)面。[0046]優(yōu)選的,所述服務(wù)器具有服務(wù)器標(biāo)識(shí),所述特征信息包括頁(yè)面分類信息,所述目標(biāo)服務(wù)器確定模塊包括:[0047]標(biāo)識(shí)提取子模塊,用于按照預(yù)置的頁(yè)面分類信息與服務(wù)器標(biāo)識(shí)的對(duì)應(yīng)關(guān)系,提取當(dāng)前頁(yè)面分類信息對(duì)應(yīng)的服務(wù)器標(biāo)識(shí);[0048]標(biāo)識(shí)定位子模塊,用于將所述服務(wù)器標(biāo)識(shí)對(duì)應(yīng)的服務(wù)器確定為目標(biāo)服務(wù)器。[0049]優(yōu)選的,所述特征信息包括頁(yè)面的URL,所述服務(wù)器具有數(shù)值標(biāo)識(shí),所述目標(biāo)服務(wù)器確定模塊包括:[0050]URL轉(zhuǎn)換子模塊,用于采用預(yù)設(shè)算法將當(dāng)前檢測(cè)頁(yè)面的URL轉(zhuǎn)換為數(shù)值;[0051]標(biāo)識(shí)對(duì)應(yīng)子模塊,用于按所述數(shù)值提取對(duì)應(yīng)數(shù)值標(biāo)識(shí)的服務(wù)器為目標(biāo)服務(wù)器。[0052]優(yōu)選的,所述數(shù)據(jù)庫(kù)生成模塊包括:[0053]特征頁(yè)面搜索子模塊,用于采用已有的黑鏈特征數(shù)據(jù)搜索包含所述黑鏈特征數(shù)據(jù)的頁(yè)面為特征頁(yè)面;[0054]布局分析子模塊,用于分析所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局;[0055]頁(yè)面元素提取子模塊,用于在發(fā)現(xiàn)布局異常時(shí),從該特征頁(yè)面中提取包含所述黑鏈特征數(shù)據(jù)的頁(yè)面元素;[0056]黑鏈規(guī)則生成子模塊,用于根據(jù)所述頁(yè)面元素生成黑鏈規(guī)則;[0057]黑鏈特征數(shù)據(jù)提取子模塊,用于采用所述黑鏈規(guī)則在其它特征頁(yè)面中進(jìn)行匹配,并在匹配的特征頁(yè)面中提取新的黑鏈特征數(shù)據(jù),保存所述黑鏈特征數(shù)據(jù)形成黑鏈特征數(shù)據(jù)庫(kù)。[0058]優(yōu)選的,所述布局分析子模塊進(jìn)一步包括:[0059]第一判斷單元,用于判斷所述黑鏈特征數(shù)據(jù)的頁(yè)面元素位置是否在預(yù)設(shè)閾值范圍內(nèi),若是,則判定所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局異常;[0060]和/或,[0061]第二判斷單元,用于判斷所述黑鏈特征數(shù)據(jù)的頁(yè)面元素屬性是否為不可見(jiàn)屬性,若是,則判定所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局異常;[0062]和/或,[0063]第三判斷單元,用于判斷所述黑鏈特征數(shù)據(jù)的頁(yè)面元素屬性是否為對(duì)瀏覽器隱藏的屬性,若是,則判定所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局異常。[0064]優(yōu)選的,所述黑鏈特征數(shù)據(jù)包括篡改關(guān)鍵詞和黑鏈URL,所述黑鏈規(guī)則生成子模塊包括:[0065]正則表達(dá)式抽取單元,用于從包含所述篡改關(guān)鍵詞和/或黑鏈URL的頁(yè)面元素中,抽象出正則表達(dá)式作為黑鏈規(guī)則。[0066]優(yōu)選的,所述的裝置,還包括:[0067]數(shù)據(jù)庫(kù)更新模塊,用于按預(yù)設(shè)時(shí)間間隔更新所述黑鏈特征數(shù)據(jù)庫(kù)。[0068]與現(xiàn)有技術(shù)相比,本申請(qǐng)具有以下優(yōu)點(diǎn):[0069]本申請(qǐng)通過(guò)將生成的黑鏈特征數(shù)據(jù)庫(kù)在多臺(tái)服務(wù)器中進(jìn)行部署以分散單獨(dú)服務(wù)器或客戶端處理的壓力,當(dāng)接收到并發(fā)的多個(gè)頁(yè)面篡改檢測(cè)請(qǐng)求時(shí),依據(jù)所請(qǐng)求檢測(cè)頁(yè)面的特征信息確定處理當(dāng)前檢測(cè)的服務(wù)器,由該服務(wù)器進(jìn)行具體的篡改檢測(cè)處理,從而能在需檢測(cè)頁(yè)面數(shù)量眾多,并且,所需匹配的黑鏈特征數(shù)據(jù)較多的情況下,有效提高檢測(cè)頁(yè)面篡改的效率和準(zhǔn)確率。[0070]再者,本申請(qǐng)根據(jù)黑鏈特征數(shù)據(jù)庫(kù),判斷當(dāng)前檢測(cè)頁(yè)面中是否包含黑鏈特征數(shù)據(jù),將包含黑鏈特征數(shù)據(jù)的頁(yè)面確定為被篡改頁(yè)面。在本申請(qǐng)實(shí)施例中,黑鏈特征數(shù)據(jù)庫(kù)中的黑鏈特征可以不全部由人工收集,可以采用以下方式自動(dòng)收集:通過(guò)已知的黑鏈特征數(shù)據(jù)結(jié)合搜索引擎技術(shù),使用網(wǎng)絡(luò)爬蟲(chóng)抓取包含此黑鏈特征數(shù)據(jù)的頁(yè)面作為特征頁(yè)面,通過(guò)分析此黑鏈特征數(shù)據(jù)在這些特征頁(yè)面中的布局,若布局異常則從該異常的特征頁(yè)面中提取包含所述黑鏈特征數(shù)據(jù)的頁(yè)面元素,形成一套通用的正則表達(dá)式作為黑鏈規(guī)則,將該黑鏈規(guī)則在其它特征頁(yè)面中進(jìn)行匹配,并在匹配的特征頁(yè)面中提取新的黑鏈特征數(shù)據(jù)。這樣收集黑鏈特征數(shù)據(jù)不需人工干預(yù),非??焖?,并且,所收集的黑鏈特征數(shù)據(jù)的準(zhǔn)確率也非常高,從而用在頁(yè)面篡改檢測(cè)時(shí),能有效提高檢測(cè)的效率和準(zhǔn)確率。[0071]并且,本申請(qǐng)實(shí)施例根據(jù)黑鏈特征數(shù)據(jù),結(jié)合搜索引擎技術(shù),使用網(wǎng)絡(luò)爬蟲(chóng)抓取包含此黑鏈特征數(shù)據(jù)的頁(yè)面,然后分析包含此黑鏈特征數(shù)據(jù)頁(yè)面的布局,從而判定頁(yè)面是否被篡改,并提取所述被篡改頁(yè)面中包含所述黑鏈特征數(shù)據(jù)的頁(yè)面元素,最終形成一套通用的正則表達(dá)式作為黑鏈規(guī)則。本申請(qǐng)無(wú)需人工干預(yù),無(wú)需額外設(shè)置系統(tǒng),采用正則表達(dá)式作為黑鏈規(guī)則在頁(yè)面中進(jìn)行匹配,以提取更多的黑鏈特征數(shù)據(jù),訓(xùn)練更多黑鏈規(guī)則的方式,能更好地適用于當(dāng)前黑鏈產(chǎn)業(yè)化的情形,不僅能降低成本,還能更快更多地發(fā)現(xiàn)被篡改的頁(yè)面,有效提高檢測(cè)頁(yè)面篡改的效率。并且,基于網(wǎng)絡(luò)爬蟲(chóng)技術(shù)和瀏覽器內(nèi)核隔離沙箱技術(shù)的實(shí)現(xiàn),也有效保證了檢測(cè)頁(yè)面篡改的安全性、可信度和準(zhǔn)確度?!緦@綀D】【附圖說(shuō)明】[0072]圖1是本申請(qǐng)的一種檢測(cè)頁(yè)面篡改的方法實(shí)施例的流程圖;[0073]圖2是本申請(qǐng)的一種檢測(cè)頁(yè)面篡改的裝置實(shí)施例的結(jié)構(gòu)框圖?!揪唧w實(shí)施方式】[0074]為使本申請(qǐng)的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和【具體實(shí)施方式】對(duì)本申請(qǐng)作進(jìn)一步詳細(xì)的說(shuō)明。[0075]黑鏈,又被稱作“網(wǎng)絡(luò)牛皮癬”。公知的是,搜索引擎有一個(gè)排名系統(tǒng),搜索引擎認(rèn)為好的網(wǎng)站,在搜索結(jié)果的排名中就會(huì)靠前,相應(yīng)地,網(wǎng)站的點(diǎn)擊率就會(huì)越高。搜索引擎衡量一個(gè)網(wǎng)站的好壞有多方面的指標(biāo),其中非常重要的一點(diǎn)就是網(wǎng)站的外部鏈接。如果一個(gè)網(wǎng)站的外部鏈接都很不錯(cuò),那么這個(gè)網(wǎng)站在搜索引擎中的排名就會(huì)相應(yīng)地提高。[0076]例如,某新開(kāi)的網(wǎng)站在搜索引擎中的排名很靠后,之后某個(gè)權(quán)利高(排名好,質(zhì)量高)的網(wǎng)站和這個(gè)新開(kāi)的網(wǎng)站做了鏈接,那么搜索引擎就會(huì)認(rèn)為這個(gè)新開(kāi)的網(wǎng)站既然可以和這樣權(quán)重高的網(wǎng)站做上鏈接,那么它的權(quán)重也不會(huì)低,所以這個(gè)網(wǎng)站在搜索引擎中的排名就會(huì)提升。如果有多個(gè)權(quán)重高的網(wǎng)站也都和這個(gè)網(wǎng)站做了鏈接,那么它的排名將會(huì)上升得非??臁0077]反之,如果一個(gè)新開(kāi)的網(wǎng)站,沒(méi)有任何背景,沒(méi)有任何關(guān)系,它的權(quán)重不會(huì)很高,所以搜索引擎不會(huì)給它很高的排名,其在搜索結(jié)果中的排名就會(huì)比較靠后。對(duì)于搜索引擎的這種特性,目前有些工具提供了黑鏈技術(shù),即通過(guò)入侵一些權(quán)重高的網(wǎng)站,入侵成功后將網(wǎng)站的鏈接插入到被入侵網(wǎng)站的頁(yè)面中,從而實(shí)現(xiàn)鏈接的效果,并且通過(guò)隱藏網(wǎng)站鏈接,使別人在被入侵網(wǎng)站的頁(yè)面上是看不到任何鏈接。[0078]然而,目前采用黑鏈技術(shù)來(lái)實(shí)現(xiàn)搜索排名提升的,相當(dāng)一部分是游戲私服網(wǎng)站、盜號(hào)木馬網(wǎng)站、釣魚(yú)網(wǎng)站和廣告網(wǎng)站等不安全網(wǎng)站。對(duì)于這些不安全網(wǎng)站,搜索引擎不會(huì)給它們很高的排名,但通過(guò)“黑鏈”,它們的排名就會(huì)很靠前,在這種情況下,當(dāng)使用搜索引擎的時(shí)候,點(diǎn)擊打開(kāi)這些網(wǎng)站的概率就會(huì)很高,如果用戶沒(méi)有做好安全防護(hù)工作,那么就會(huì)容易就會(huì)感染網(wǎng)站上的病毒。[0079]正是本專利發(fā)明人發(fā)現(xiàn)這一問(wèn)題的嚴(yán)重性,提出本申請(qǐng)實(shí)施例的核心構(gòu)思之一在于,本申請(qǐng)通過(guò)將生成的黑鏈特征數(shù)據(jù)庫(kù)在多臺(tái)服務(wù)器中進(jìn)行部署以分散單獨(dú)服務(wù)器或客戶端處理的壓力,當(dāng)接收到并發(fā)的多個(gè)頁(yè)面篡改檢測(cè)請(qǐng)求時(shí),依據(jù)所請(qǐng)求檢測(cè)頁(yè)面的特征信息確定處理當(dāng)前檢測(cè)的服務(wù)器,由該服務(wù)器進(jìn)行具體的篡改檢測(cè)處理,從而能在需檢測(cè)頁(yè)面數(shù)量眾多,所需匹配的黑鏈特征數(shù)據(jù)較多的情況下,有效提高檢測(cè)頁(yè)面篡改的效率和準(zhǔn)確率。并且,在本申請(qǐng)實(shí)施例中,黑鏈特征數(shù)據(jù)庫(kù)中的黑鏈特征可以不全部由人工收集,可以采用以下方式自動(dòng)收集:通過(guò)已知的黑鏈特征數(shù)據(jù)結(jié)合搜索引擎技術(shù),使用網(wǎng)絡(luò)爬蟲(chóng)抓取包含此黑鏈特征數(shù)據(jù)的頁(yè)面作為特征頁(yè)面,通過(guò)分析此黑鏈特征數(shù)據(jù)在這些特征頁(yè)面中的布局,若布局異常則從該異常的特征頁(yè)面中提取包含所述黑鏈特征數(shù)據(jù)的頁(yè)面元素,形成一套通用的正則表達(dá)式作為黑鏈規(guī)則,將該黑鏈規(guī)則在其它特征頁(yè)面中進(jìn)行匹配,并在匹配的特征頁(yè)面中提取新的黑鏈特征數(shù)據(jù)。這樣收集黑鏈特征數(shù)據(jù)不需人工干預(yù),非??焖伲⑶?,所收集的黑鏈特征數(shù)據(jù)的準(zhǔn)確率也非常高,從而用在頁(yè)面篡改檢測(cè)時(shí),能有效提高檢測(cè)的效率和準(zhǔn)確率。[0080]參照?qǐng)D1,示出了本申請(qǐng)的一種檢測(cè)頁(yè)面篡改的方法實(shí)施例的步驟流程圖,具體可以包括如下步驟:[0081]步驟11、生成黑鏈特征數(shù)據(jù)庫(kù),并在多臺(tái)服務(wù)器中部署所述黑鏈特征數(shù)據(jù)庫(kù),所述黑鏈特征數(shù)據(jù)庫(kù)中包括黑鏈特征數(shù)據(jù);[0082]在具體實(shí)現(xiàn)中,所述黑鏈特征數(shù)據(jù)可以包括篡改關(guān)鍵詞和黑鏈URL。如篡改關(guān)鍵詞“傳奇私服發(fā)布”,黑鏈URL“http://www.45u.com”等。[0083]在本申請(qǐng)的一種優(yōu)選實(shí)施例中,可以通過(guò)以下子步驟生成黑鏈特征數(shù)據(jù)庫(kù):[0084]子步驟111、采用已有的黑鏈特征數(shù)據(jù)搜索包含所述黑鏈特征數(shù)據(jù)的頁(yè)面為特征頁(yè)面;[0085]子步驟112、分析所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局,當(dāng)發(fā)現(xiàn)布局異常時(shí),從該特征頁(yè)面中提取包含所述黑鏈特征數(shù)據(jù)的頁(yè)面元素;[0086]子步驟113、根據(jù)所述頁(yè)面元素生成黑鏈規(guī)則,采用所述黑鏈規(guī)則在其它特征頁(yè)面中進(jìn)行匹配,并在匹配的特征頁(yè)面中提取新的黑鏈特征數(shù)據(jù);[0087]子步驟114、保存所述黑鏈特征數(shù)據(jù)形成黑鏈特征數(shù)據(jù)庫(kù);[0088]在具體實(shí)現(xiàn)中,所述已有的黑鏈特征數(shù)據(jù)可以包括篡改關(guān)鍵詞和黑鏈URL。根據(jù)所述已有的黑鏈特征數(shù)據(jù),利用網(wǎng)絡(luò)爬蟲(chóng)抓取包含所述黑鏈特征數(shù)據(jù)的頁(yè)面,并將這些頁(yè)面作為特征頁(yè)面。[0089]公知的是,搜索引擎從萬(wàn)維網(wǎng)上自動(dòng)提取網(wǎng)頁(yè)的功能是通過(guò)網(wǎng)絡(luò)爬蟲(chóng)實(shí)現(xiàn)的。網(wǎng)絡(luò)爬蟲(chóng)又稱為網(wǎng)絡(luò)蜘蛛,即WebSpider,網(wǎng)絡(luò)蜘蛛是通過(guò)網(wǎng)頁(yè)的鏈接地址來(lái)尋找網(wǎng)頁(yè),從網(wǎng)站某一個(gè)頁(yè)面(通常是首頁(yè))開(kāi)始,讀取網(wǎng)頁(yè)的內(nèi)容,找到在網(wǎng)頁(yè)中的其它鏈接地址,然后通過(guò)這些鏈接地址尋找下一個(gè)網(wǎng)頁(yè),這樣一直循環(huán)下去,直到把這個(gè)網(wǎng)站所有的網(wǎng)頁(yè)都抓取完為止。如果把整個(gè)互聯(lián)網(wǎng)當(dāng)成一個(gè)網(wǎng)站,那么網(wǎng)絡(luò)蜘蛛就可以用這個(gè)原理把互聯(lián)網(wǎng)上所有的網(wǎng)頁(yè)都抓取下來(lái)。[0090]目前的網(wǎng)絡(luò)爬蟲(chóng)可以分為通用爬蟲(chóng)和聚焦爬蟲(chóng)。通用爬蟲(chóng)是基于廣度優(yōu)先搜索的思想,從一個(gè)或若干個(gè)初始網(wǎng)頁(yè)的URL(UniformResourceLocator,統(tǒng)一資源定位符)開(kāi)始,獲得初始網(wǎng)頁(yè)上的URL,在抓取網(wǎng)頁(yè)的過(guò)程中,不斷從當(dāng)前頁(yè)面上抽取新的URL放入隊(duì)列,直到滿足系統(tǒng)的一定停止條件。而聚焦爬蟲(chóng)是一個(gè)自動(dòng)下載網(wǎng)頁(yè)的程序,用于定向抓取相關(guān)頁(yè)面資源。它根據(jù)既定的抓取目標(biāo),有選擇地訪問(wèn)萬(wàn)維網(wǎng)上的網(wǎng)頁(yè)與相關(guān)的鏈接,獲取所需要的信息。與通用爬蟲(chóng)不同,聚焦爬蟲(chóng)并不追求大的覆蓋,而是將目標(biāo)定為抓取與某一特定主題內(nèi)容相關(guān)的網(wǎng)頁(yè),為面向主題的用戶查詢準(zhǔn)備數(shù)據(jù)資源。[0091]現(xiàn)有的黑鏈技術(shù)中,隱藏鏈接有一些固定技巧,例如搜索引擎對(duì)javascript的識(shí)別不是很好,通過(guò)javascript來(lái)輸出隱藏的div。這樣的話,人工直接通過(guò)頁(yè)面無(wú)法看到這些鏈接,而搜索引擎確認(rèn)為這些鏈接是有效的。代碼為:首先通過(guò)javascript寫前面的div,設(shè)置display為none。然后輸出一個(gè)table,table中包含了要掛的黑鏈。最后再通過(guò)javascript輸出后半部分div。[0092]采用瀏覽器內(nèi)核的隔離沙箱技術(shù)可以快速、有效地察覺(jué)出頁(yè)面被篡改。具體而言,瀏覽器內(nèi)核的隔離沙箱技術(shù)為瀏覽器內(nèi)核,比如IE或firefox,構(gòu)建了一個(gè)安全的虛擬執(zhí)行環(huán)境。用戶通過(guò)瀏覽器所作的任何寫磁盤操作,都將重定向到一個(gè)特定的臨時(shí)文件夾中。這樣,即使網(wǎng)頁(yè)中包含病毒,木馬,廣告等惡意程序,被強(qiáng)行安裝后,也只是安裝到了臨時(shí)文件夾中,不會(huì)對(duì)用戶設(shè)備造成危害。瀏覽器內(nèi)核負(fù)責(zé)對(duì)網(wǎng)頁(yè)語(yǔ)法的解釋(如HTML、JavaScript)并渲染(顯示)網(wǎng)頁(yè)。所以,通常所謂的瀏覽器內(nèi)核也就是對(duì)頁(yè)面進(jìn)行下載、解析、執(zhí)行、渲染的引擎,該引擎決定了瀏覽器如何顯示網(wǎng)頁(yè)的內(nèi)容以及頁(yè)面的格式信息。[0093]根據(jù)瀏覽器內(nèi)核的上述操作特性,采用隔離沙箱技術(shù),可以安全地分析黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局是否發(fā)生異常,具體而言,可以通過(guò)分析所述黑鏈特征數(shù)據(jù)的頁(yè)面元素位置和屬性,來(lái)判定黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局是否異常,例如,判斷所述黑鏈特征數(shù)據(jù)的頁(yè)面元素的位置是否不在預(yù)設(shè)閾值范圍內(nèi),所述黑鏈特征數(shù)據(jù)的頁(yè)面元素是否具有不可見(jiàn)的屬性,和/或,所述黑鏈特征數(shù)據(jù)的頁(yè)面元素是否具有對(duì)瀏覽器隱藏的屬性,若是,則判定黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局異常。例如,若檢測(cè)到某個(gè)頁(yè)面的超鏈接是不可見(jiàn)的,或者,頁(yè)面中某個(gè)html標(biāo)簽元素的長(zhǎng)寬高是負(fù)值,則可判定該頁(yè)面的布局異常,是被篡改的頁(yè)面。[0094]當(dāng)發(fā)現(xiàn)布局異常時(shí),從該布局異常的特征頁(yè)面中提取包含所述所述篡改關(guān)鍵詞和/或黑鏈URL的頁(yè)面元素;然后從包含所述篡改關(guān)鍵詞和/或黑鏈URL的頁(yè)面元素中,抽象出正則表達(dá)式作為黑鏈規(guī)則。[0095]公知的是,正則表達(dá)式是用于進(jìn)行文本匹配的工具,通常由一些普通字符和一些元字符(metacharacters)組成。普通字符包括大小寫的字母和數(shù)字,而元字符則具有特殊的含義。正則表達(dá)式的匹配可以理解為,在給定的字符串中,尋找與給定的正則表達(dá)式相匹配的部分。有可能字符串里有不止一個(gè)部分滿足給定的正則表達(dá)式,這時(shí)每一個(gè)這樣的部分被稱為一個(gè)匹配。匹配在本文里可以包括三種含義:一種是形容詞性的,比如說(shuō)一個(gè)字符串匹配一個(gè)表達(dá)式;一種是動(dòng)詞性的,比如說(shuō)在字符串里匹配正則表達(dá)式;還有一種是名詞性的,就是剛剛說(shuō)到的“字符串中滿足給定的正則表達(dá)式的一部分”。[0096]以下通過(guò)舉例對(duì)正則表達(dá)式的生成規(guī)則進(jìn)行說(shuō)明。[0097]假設(shè)要查找hi,則可以使用正則表達(dá)式hi。這個(gè)正則表達(dá)式可以精確匹配這樣的字符串:由兩個(gè)字符組成,前一個(gè)字符是h,后一個(gè)是i。在實(shí)際中,正則表達(dá)式是可以忽略大小寫的。如果很多單詞里都包含hi這兩個(gè)連續(xù)的字符,比如him,history,high等等。用hi來(lái)查找的話,這此單詞里面的hi也會(huì)被找出來(lái)。如果要精確地查找hi這個(gè)單詞的話,則應(yīng)該使用\bhi\b。其中,\b是正則表達(dá)式的一個(gè)元字符,它代表著單詞的開(kāi)頭或結(jié)尾,也就是單詞的分界處。雖然通常英文的單詞是由空格或標(biāo)點(diǎn)符號(hào)或換行來(lái)分隔的,但是\b并不匹配這些單詞分隔符中的任何一個(gè),它只匹配一個(gè)位置。假如要找的是hi后面不遠(yuǎn)處跟著一個(gè)Lucy,貝U應(yīng)該用\bhi\b.*\bLucy\b。其中,.是另一個(gè)元字符,匹配除了換行符以外的任意字符。*同樣是元字符,它代表的是數(shù)量——即指定*前邊的內(nèi)容可以連續(xù)重復(fù)出現(xiàn)任意次以使整個(gè)表達(dá)式得到匹配。現(xiàn)在\bhi\b.*\bLucy\b的意思就很明顯了:先是一個(gè)單詞hi,然后是任意個(gè)任意字符(但不能是換行),最后是Lucy這個(gè)單詞。[0098]例如,在頁(yè)面布局異常的A頁(yè)面的html片段里,提取包含黑鏈特征數(shù)據(jù)的頁(yè)面元素如下:[0099]<script>document.write(,〈d,+,ivst,+,yle'+,="po,+,si,+,t1,+,n:a+,bso’+’Iu+’te;I’+’ef'+’t:」+’10’+’00’+’0’+’p’+’x)>XXXX〈script>document.write(,〈’+,/d'+,i'+,v>');</script)[0100]根據(jù)上述頁(yè)面元素生成作為黑鏈規(guī)則的正則表達(dá)式為:[0101]〈script.*?>document\.write.*?\(.*?\+.*?\+.*?\+.*?\+.*?\+.*?\).*?</script)([\S\s]+?)</div>[0102]或如,在頁(yè)面布局異常的B頁(yè)面的html片段里,提取包含黑鏈特征數(shù)據(jù)的頁(yè)面元素如下:[0103]<ahref=^http://www.45u.com,>style=margin-left:-83791;”〉;[0104]根據(jù)上述頁(yè)面元素生成作為黑鏈規(guī)則的正則表達(dá)式為:[0105]<a\s*href\s*=["\,].+?["\,]\s*style=["\,][\w+\-]+:-[0_9]+.*?["\,].*?>.*?</a>。[0106]當(dāng)然,上述生成黑鏈規(guī)則的方法僅僅用作示例,本領(lǐng)域技術(shù)人員根據(jù)實(shí)際情況采用任一種黑鏈規(guī)則的生成方式都是可行的,本申請(qǐng)對(duì)此無(wú)需加以限制。[0107]采用黑鏈規(guī)則在其它特征頁(yè)面中進(jìn)行匹配,可以提取更多的黑鏈特征數(shù)據(jù),訓(xùn)練更多黑鏈規(guī)則,最終可形成針對(duì)全網(wǎng)黑鏈的黑鏈特征數(shù)據(jù)庫(kù)。[0108]由于掛黑鏈如今已形成一個(gè)產(chǎn)業(yè)鏈,所以相同的篡改關(guān)鍵詞和/或黑鏈URL會(huì)大量出現(xiàn)在其它被篡改的頁(yè)面中。采用正則表達(dá)式作為黑鏈規(guī)則在頁(yè)面中進(jìn)行匹配,以提取更多的黑鏈特征數(shù)據(jù),訓(xùn)練更多黑鏈規(guī)則,更適用于當(dāng)前黑鏈產(chǎn)業(yè)化的情形,能更快更多地發(fā)現(xiàn)被篡改的頁(yè)面,有效提高檢測(cè)頁(yè)面篡改的效率。[0109]為適用所需檢測(cè)頁(yè)面數(shù)量眾多,并且,所需匹配的黑鏈特征數(shù)據(jù)較多的情形,在本申請(qǐng)實(shí)施例中,需要將所生成的黑鏈特征數(shù)據(jù)庫(kù)部署到多臺(tái)服務(wù)器中,如部署到后臺(tái)的10臺(tái)服務(wù)器中,每臺(tái)服務(wù)器中所部署的黑鏈特征數(shù)據(jù)庫(kù)內(nèi)容相同。[0110]在具體實(shí)現(xiàn)中,由于黑鏈特征數(shù)據(jù)具有一定的時(shí)效性,可以按預(yù)設(shè)時(shí)間間隔發(fā)起對(duì)所述黑鏈特征數(shù)據(jù)庫(kù)的更新,具體可以通過(guò)重復(fù)上述子步驟Slll—S114完成黑鏈特征數(shù)據(jù)庫(kù)的更新。[0111]步驟12、獲取當(dāng)前檢測(cè)頁(yè)面的特征信息;[0112]步驟13、依據(jù)所述頁(yè)面的特征信息確定對(duì)應(yīng)的目標(biāo)服務(wù)器;[0113]在具體實(shí)現(xiàn)中,對(duì)于黑鏈特征庫(kù)所部署的服務(wù)器,可以分別設(shè)置服務(wù)器標(biāo)識(shí),所述標(biāo)識(shí)可以采用任一種規(guī)則和形式設(shè)置,比如,數(shù)字排序,字符排序等,本申請(qǐng)對(duì)此不作限制。[0114]作為本申請(qǐng)實(shí)施例具體應(yīng)用的一種示例,所述特征信息可以包括頁(yè)面分類信息,在這種情況下,所述步驟103具體可以包括如下子步驟:[0115]子步驟S311、按照預(yù)置的頁(yè)面分類信息與服務(wù)器標(biāo)識(shí)的對(duì)應(yīng)關(guān)系,提取當(dāng)前頁(yè)面分類信息對(duì)應(yīng)的服務(wù)器標(biāo)識(shí);[0116]子步驟S312、將所述服務(wù)器標(biāo)識(shí)對(duì)應(yīng)的服務(wù)器確定為目標(biāo)服務(wù)器。[0117]在具體實(shí)現(xiàn)中,所述頁(yè)面分類信息可以為頁(yè)面的內(nèi)容分類信息,例如,根據(jù)頁(yè)面內(nèi)容將頁(yè)面分為游戲類、電影類、小說(shuō)類、視頻類、音樂(lè)類、購(gòu)物類、郵箱類、生活類、銀行類、旅游類等;預(yù)置上述各類頁(yè)面內(nèi)容分別與服務(wù)器標(biāo)識(shí)的對(duì)應(yīng)如下表所示:【權(quán)利要求】1.一種頁(yè)面篡改檢測(cè)方法,其包括:獲取當(dāng)前檢測(cè)頁(yè)面的特征信息;依據(jù)所獲取的特征信息確定對(duì)應(yīng)的目標(biāo)服務(wù)器;采用所述目標(biāo)服務(wù)器中的黑鏈特征數(shù)據(jù)庫(kù)與當(dāng)前檢測(cè)頁(yè)面進(jìn)行匹配以判斷當(dāng)前檢測(cè)頁(yè)面中是否包含所述黑鏈特征數(shù)據(jù)庫(kù)中的黑鏈特征數(shù)據(jù);如果包含,則判定當(dāng)前頁(yè)面為被篡改頁(yè)面。2.如權(quán)利要求1所述的方法,其中,所述黑鏈特征數(shù)據(jù)庫(kù)部署在多臺(tái)服務(wù)器上。3.如權(quán)利要求1或2所述的方法,其中,所述服務(wù)器具有服務(wù)器標(biāo)識(shí),所述特征信息包括頁(yè)面分類信息,所述依據(jù)頁(yè)面的特征信息確定對(duì)應(yīng)的目標(biāo)服務(wù)器的步驟包括:按照預(yù)置的頁(yè)面分類信息與服務(wù)器標(biāo)識(shí)的對(duì)應(yīng)關(guān)系,提取當(dāng)前頁(yè)面分類信息對(duì)應(yīng)的服務(wù)器標(biāo)識(shí);將所述服務(wù)器標(biāo)識(shí)對(duì)應(yīng)的服務(wù)器確定為目標(biāo)服務(wù)器。4.如權(quán)利要求3所述的方法,其中,所述頁(yè)面分類信息包括頁(yè)面的內(nèi)容分類信息、頁(yè)面的類型分類信息、頁(yè)面的標(biāo)簽分類信息和/或頁(yè)面的屬性分類信息。5.如權(quán)利要求1或2所述的方法,其中,所述特征信息包括頁(yè)面的URL,所述服務(wù)器具有數(shù)值標(biāo)識(shí),所述依據(jù)頁(yè)面的特征信息確定對(duì)應(yīng)的服務(wù)器標(biāo)識(shí)的步驟包括:采用預(yù)設(shè)算法將當(dāng)前檢測(cè)頁(yè)面的URL轉(zhuǎn)換為數(shù)值;按所述數(shù)值提取對(duì)應(yīng)數(shù)值標(biāo)識(shí)的服務(wù)器并將其作為目標(biāo)服務(wù)器。6.如權(quán)利要求1至5中任一項(xiàng)所述的方法,其中,所述黑鏈特征數(shù)據(jù)庫(kù)按照下面步驟生成:采用已有的黑鏈特征數(shù)據(jù)搜索包含所述黑鏈特征數(shù)據(jù)的頁(yè)面為特征頁(yè)面;分析所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局,當(dāng)發(fā)現(xiàn)布局異常時(shí),從該特征頁(yè)面中提取包含所述黑鏈特征數(shù)據(jù)的頁(yè)面元素;根據(jù)所述頁(yè)面元素生成黑鏈規(guī)則,采用所述黑鏈規(guī)則在其它特征頁(yè)面中進(jìn)行匹配,并在匹配的特征頁(yè)面中提取新的黑鏈特征數(shù)據(jù);保存所述黑鏈特征數(shù)據(jù)形成黑鏈特征數(shù)據(jù)庫(kù)。7.如權(quán)利要求6所述的方法,其中,所述黑鏈特征數(shù)據(jù)包括篡改關(guān)鍵詞和黑鏈URL。8.如權(quán)利要求6所述的方法,其中,所述分析所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局進(jìn)一步包括:判斷所述黑鏈特征數(shù)據(jù)的頁(yè)面元素位置是否在預(yù)設(shè)閾值范圍內(nèi),若是,則判定所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局異常;和/或,判斷所述黑鏈特征數(shù)據(jù)的頁(yè)面元素屬性是否為不可見(jiàn)屬性,若是,則判定所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局異常;和/或,判斷所述黑鏈特征數(shù)據(jù)的頁(yè)面元素屬性是否為對(duì)瀏覽器隱藏的屬性,若是,則判定所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局異常。9.如權(quán)利要求7所述的方法,其中,所述根據(jù)頁(yè)面元素生成黑鏈規(guī)則的步驟為:從包含所述篡改關(guān)鍵詞和/或黑鏈URL的頁(yè)面元素中,抽象出正則表達(dá)式作為黑鏈規(guī)則。10.如權(quán)利要求7所述的方法,其中,還包括:按預(yù)設(shè)時(shí)間間隔更新所述黑鏈特征數(shù)據(jù)庫(kù)。11.一種黑鏈數(shù)據(jù)庫(kù)生成方法,其包括:采用已有的黑鏈特征數(shù)據(jù)搜索包含所述黑鏈特征數(shù)據(jù)的頁(yè)面為特征頁(yè)面;分析所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局,當(dāng)發(fā)現(xiàn)布局異常時(shí),從該特征頁(yè)面中提取包含所述黑鏈特征數(shù)據(jù)的頁(yè)面元素;根據(jù)所述頁(yè)面元素生成黑鏈規(guī)則,采用所述黑鏈規(guī)則在其它特征頁(yè)面中進(jìn)行匹配,并在匹配的特征頁(yè)面中提取新的黑鏈特征數(shù)據(jù);保存所述黑鏈特征數(shù)據(jù)形成黑鏈特征數(shù)據(jù)庫(kù)。12.如權(quán)利要求11所述的方法,其中,所述黑鏈特征數(shù)據(jù)包括篡改關(guān)鍵詞和黑鏈URL。13.如權(quán)利要求12所述的方法,其中,所述分析所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局進(jìn)一步包括:判斷所述黑鏈特征數(shù)據(jù)的頁(yè)面元素位置是否在預(yù)設(shè)閾值范圍內(nèi),若是,則判定所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局異常;和/或,判斷所述黑鏈特征數(shù)據(jù)的頁(yè)面元素屬性是否為不可見(jiàn)屬性,若是,則判定所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局異常;和/或,判斷所述黑鏈特征數(shù)據(jù)的頁(yè)面元素屬性是否為對(duì)瀏覽器隱藏的屬性,若是,則判定所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局異常。14.如權(quán)利要求13所述的方法,其中,所述根據(jù)頁(yè)面元素生成黑鏈規(guī)則的步驟為:從包含所述篡改關(guān)鍵詞和/或黑鏈URL的頁(yè)面元素中,抽象出正則表達(dá)式作為黑鏈規(guī)則。15.如權(quán)利要求11至14中任一項(xiàng)所述的方法,其中,還包括:按預(yù)設(shè)時(shí)間間隔更新所述黑鏈特征數(shù)據(jù)庫(kù)。16.一種頁(yè)面篡改檢測(cè)方法,其包括:獲取當(dāng)前檢測(cè)頁(yè)面的URL;采用預(yù)設(shè)算法將當(dāng)前檢測(cè)頁(yè)面的URL轉(zhuǎn)換為數(shù)值;按所述數(shù)值提取具有對(duì)應(yīng)數(shù)值標(biāo)識(shí)的服務(wù)器并將其作為目標(biāo)服務(wù)器;采用所述目標(biāo)服務(wù)器中的黑鏈特征數(shù)據(jù)庫(kù)與當(dāng)前檢測(cè)頁(yè)面進(jìn)行匹配以判斷當(dāng)前檢測(cè)頁(yè)面中是否包含所述黑鏈特征數(shù)據(jù)庫(kù)中的黑鏈特征數(shù)據(jù);如果包含,則判定當(dāng)前頁(yè)面為被篡改頁(yè)面。17.如權(quán)利要求16所述的方法,其中,所述黑鏈特征數(shù)據(jù)庫(kù)部署在多臺(tái)服務(wù)器上。18.如權(quán)利要求16或17所述的方法,其中,所述黑鏈特征數(shù)據(jù)庫(kù)按照下面步驟生成:采用已有的黑鏈特征數(shù)據(jù)搜索包含所述黑鏈特征數(shù)據(jù)的頁(yè)面為特征頁(yè)面;分析所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局,當(dāng)發(fā)現(xiàn)布局異常時(shí),從該特征頁(yè)面中提取包含所述黑鏈特征數(shù)據(jù)的頁(yè)面元素;根據(jù)所述頁(yè)面元素生成黑鏈規(guī)則,采用所述黑鏈規(guī)則在其它特征頁(yè)面中進(jìn)行匹配,并在匹配的特征頁(yè)面中提取新的黑鏈特征數(shù)據(jù);保存所述黑鏈特征數(shù)據(jù)形成黑鏈特征數(shù)據(jù)庫(kù)。19.如權(quán)利要求18所述的方法,其中,所述黑鏈特征數(shù)據(jù)包括篡改關(guān)鍵詞和黑鏈URL。20.如權(quán)利要求18所述的方法,其中,所述分析所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局進(jìn)一步包括:判斷所述黑鏈特征數(shù)據(jù)的頁(yè)面元素位置是否在預(yù)設(shè)閾值范圍內(nèi),若是,則判定所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局異常;和/或,判斷所述黑鏈特征數(shù)據(jù)的頁(yè)面元素屬性是否為不可見(jiàn)屬性,若是,則判定所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局異常;和/或,判斷所述黑鏈特征數(shù)據(jù)的頁(yè)面元素屬性是否為對(duì)瀏覽器隱藏的屬性,若是,則判定所述黑鏈特征數(shù)據(jù)在特征頁(yè)面中的布局異常。21.如權(quán)利要求18所述的方法,其中,所述根據(jù)頁(yè)面元素生成黑鏈規(guī)則的步驟為:從包含所述篡改關(guān)鍵詞和/或黑鏈URL的頁(yè)面元素中,抽象出正則表達(dá)式作為黑鏈規(guī)則。22.如權(quán)利要求16至21中任一項(xiàng)所述的方法,還包括:按預(yù)設(shè)時(shí)間間隔更新所述黑鏈特征數(shù)據(jù)庫(kù)?!疚臋n編號(hào)】G06F17/30GK104036189SQ201410208997【公開(kāi)日】2014年9月10日申請(qǐng)日期:2014年5月16日優(yōu)先權(quán)日:2014年5月16日【發(fā)明者】劉起,郭峰申請(qǐng)人:北京奇虎科技有限公司,奇智軟件(北京)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1