一種黑鏈檢測(cè)方法、裝置和系統(tǒng)的制作方法
【專利摘要】本發(fā)明實(shí)施方式提出了一種黑鏈檢測(cè)方法、裝置和系統(tǒng)。方法包括:接收針對(duì)統(tǒng)一資源定位符(URL)的訪問(wèn)請(qǐng)求,并下載對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件;解析所述對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件,以提取出包含于該網(wǎng)頁(yè)文件中的外部鏈接URL;提取外部鏈接URL的域名,并根據(jù)所提取出的域名查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定外部鏈接URL中是否包含黑鏈。本發(fā)明實(shí)施方式實(shí)現(xiàn)了黑鏈的快速和自動(dòng)檢測(cè),提高了黑鏈檢測(cè)效率。
【專利說(shuō)明】一種黑鏈檢測(cè)方法、裝置和系統(tǒng)【技術(shù)領(lǐng)域】
[0001]本發(fā)明實(shí)施方式涉及信息安全【技術(shù)領(lǐng)域】,更具體地,涉及一種黑鏈檢測(cè)方法、裝置和系統(tǒng)。
【背景技術(shù)】
[0002]隨著計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,互聯(lián)網(wǎng)(Internet)在人們的日常生活、學(xué)習(xí)和工作中發(fā)揮的作用也越來(lái)越大。互聯(lián)網(wǎng)上的超媒體文檔稱之為網(wǎng)頁(yè)(web page)。網(wǎng)頁(yè)中通常包括有指向其他相關(guān)頁(yè)面或其他節(jié)點(diǎn)的指針(超級(jí)鏈接)。在邏輯上將視為一個(gè)整體的一系列網(wǎng)頁(yè)的有機(jī)集合稱為網(wǎng)站(Website或Site)。
[0003]黑鏈又稱暗鏈,是搜索引擎優(yōu)化(Search Engine Optimization, SE0)手法中相當(dāng)普遍的一種手段,是指用非正常手段獲取其他網(wǎng)站的反向鏈接,最常見(jiàn)的手段就是通過(guò)各種網(wǎng)站服務(wù)器的漏洞獲取其管理權(quán)限,進(jìn)而在被黑網(wǎng)站上鏈接自己的網(wǎng)站。黑鏈?zhǔn)轻槍?duì)搜索引擎作弊的最快捷有效的方法之一,一般用于暴利的黑色產(chǎn)業(yè),如各類游戲私服、外掛、醫(yī)療、色情、博彩等行業(yè),而且已經(jīng)逐步產(chǎn)業(yè)化。在實(shí)際應(yīng)用中,被黑網(wǎng)站不僅有可能被植入黑鏈,還經(jīng)常被植入各類惡意掛馬代碼,如果用戶沒(méi)有安裝任何安全防護(hù)軟件,那么打開(kāi)此類被篡改的網(wǎng)頁(yè)還很容易感染網(wǎng)站上的木馬病毒。
[0004]在現(xiàn)有技術(shù)中,一般由網(wǎng)站管理人員人工收集篡改關(guān)鍵詞和可疑外鏈,以判斷其是否被黑鏈篡改。然而,這種人工處理方式嚴(yán)重依賴于人工收集的可疑關(guān)鍵詞和定期的人工檢查,對(duì)網(wǎng)站管理人員的專業(yè)知識(shí)也有較高要求,無(wú)法實(shí)現(xiàn)黑鏈的快速和自動(dòng)檢測(cè),因此黑鏈檢測(cè)效率不高。
[0005]而且,黑鏈通常使用一些手段使得黑鏈對(duì)用戶不可見(jiàn),如設(shè)定超小字體、字體顏色與背景色一致、位置參數(shù)設(shè)為網(wǎng)頁(yè)可見(jiàn)范圍之外、置于隱藏的div標(biāo)簽中(如〈divstyle=” display:n0ne”X/diV>)等,因此這也增加了人工鑒別黑鏈的難度。
【發(fā)明內(nèi)容】
[0006]本發(fā)明實(shí)施方式提出一種黑鏈檢測(cè)方法,從而提高黑鏈檢測(cè)效率。
[0007]本發(fā)明實(shí)施方式還提出一種黑鏈檢測(cè)裝置,從而提高黑鏈檢測(cè)效率。
[0008]本發(fā)明實(shí)施方式還提出一種黑鏈檢測(cè)系統(tǒng),從而提高黑鏈檢測(cè)效率。
[0009]本發(fā)明實(shí)施方式的具體方案如下:
[0010]一種黑鏈檢測(cè)方法,該方法包括:
[0011]接收針對(duì)統(tǒng)一資源定位符(URL)的訪問(wèn)請(qǐng)求,并下載對(duì)應(yīng)該ULL的網(wǎng)頁(yè)文件;
[0012]解析所述對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件,以提取出包含于該網(wǎng)頁(yè)文件中的外部鏈接URL ;
[0013]提取所述外部鏈接URL的域名,并根據(jù)所提取出的域名查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定所述外部鏈接URL中是否包含黑鏈
[0014]一種黑鏈檢測(cè)裝置,該裝置包括訪問(wèn)請(qǐng)求接收單元、外部鏈接URL提取單元和黑鏈判定單元,其中:[0015]訪問(wèn)請(qǐng)求接收單元,用于接收針對(duì)URL的訪問(wèn)請(qǐng)求,并下載對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件;
[0016]外部鏈接URL提取單元,用于解析所述對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件,以提取出包含于該網(wǎng)頁(yè)文件中的外部鏈接URL ;
[0017]黑鏈判定單元,用于提取所述外部鏈接URL的域名,并根據(jù)所提取出的域名查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定所述外部鏈接URL中是否包含黑鏈。
[0018]一種黑鏈檢測(cè)系統(tǒng),包括客戶端和服務(wù)器,其中:
[0019]客戶端,用于發(fā)出針對(duì)URL的訪問(wèn)請(qǐng)求,并將所述訪問(wèn)請(qǐng)求發(fā)送到服務(wù)器;
[0020]服務(wù)器,用于解析所述對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件,以提取出包含于該網(wǎng)頁(yè)文件中的外部鏈接URL,提取所述外部鏈接URL的域名,并根據(jù)所提取出的域名查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定所述外部鏈接URL中是否包含黑鏈。
[0021 ] 從上述技術(shù)方案可以看出,在本發(fā)明實(shí)施方式中,接收針對(duì)統(tǒng)一資源定位符(URL)的訪問(wèn)請(qǐng)求,并下載對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件;解析所述對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件,以提取出包含于該網(wǎng)頁(yè)文件中的外部鏈接URL ;提取所述外部鏈接URL的域名,并根據(jù)所提取出的域名查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定所述外部鏈接URL中是否包含黑鏈。由此可見(jiàn),應(yīng)用本發(fā)明實(shí)施方式之后,可以根據(jù)頁(yè)面外連的域名信任度值進(jìn)行網(wǎng)頁(yè)的黑鏈自動(dòng)判斷,從而實(shí)現(xiàn)了黑鏈的快速和自動(dòng)檢測(cè),因此提高了黑鏈檢測(cè)效率。
[0022]另外,可以針對(duì)黑鏈判定條件在客戶端進(jìn)行自行設(shè)置,因此本發(fā)明實(shí)施方式的靈活性高,也進(jìn)一步提高了黑鏈檢測(cè)效率。
【專利附圖】
【附圖說(shuō)明】
[0023]圖1為根據(jù)本發(fā)明實(shí)施方式的黑鏈檢測(cè)方法流程圖;
[0024]圖2為根據(jù)本發(fā)明實(shí)施方式的域名信任度賦值示意圖;
[0025]圖3為根據(jù)本發(fā)明實(shí)施方式,在網(wǎng)絡(luò)側(cè)實(shí)現(xiàn)黑鏈檢測(cè)的方法流程圖;
[0026]圖4為根據(jù)本發(fā)明實(shí)施方式的黑鏈檢測(cè)裝置結(jié)構(gòu)圖;
[0027]圖5為根據(jù)本發(fā)明實(shí)施方式的黑鏈檢測(cè)系統(tǒng)結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0028]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步的詳細(xì)描述。
[0029]在本發(fā)明實(shí)施方式中,優(yōu)選將外鏈URL所指網(wǎng)站的域名信任度值作為衡量原網(wǎng)站是否被黑鏈篡改的依據(jù)。具體地,域名信任度值描述了一個(gè)域名的安全程度,當(dāng)一個(gè)域名下的惡意URL越多,其域名信任度值就越低??梢灶A(yù)先針對(duì)眾多域名建立域名信任度數(shù)據(jù)庫(kù),其中可信任網(wǎng)站域名的域名信任度值一般較高,而包含有惡意URL較多的網(wǎng)站域名的域名信任度值一般較低。
[0030]圖1為根據(jù)本發(fā)明實(shí)施方式的黑鏈檢測(cè)方法流程圖。
[0031]如圖1所示,該方法包括步驟如下:
[0032]步驟101:接收針對(duì)統(tǒng)一資源定位符(URL)的訪問(wèn)請(qǐng)求,并下載對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件。[0033]在這里,優(yōu)選地,可以預(yù)先由客戶端在本地發(fā)起針對(duì)URL的訪問(wèn)請(qǐng)求,而且客戶端將該訪問(wèn)請(qǐng)求發(fā)送到位于網(wǎng)絡(luò)側(cè)的服務(wù)器。此時(shí),由位于網(wǎng)絡(luò)側(cè)的服務(wù)器接收該針對(duì)URL的訪問(wèn)請(qǐng)求,并下載對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件。
[0034]具體地,當(dāng)用戶在客戶端期望訪問(wèn)某條URL時(shí),比如,當(dāng)用戶在瀏覽器的地址欄中輸入期望訪問(wèn)的URL時(shí),客戶端則發(fā)出針對(duì)該URL的訪問(wèn)請(qǐng)求,此時(shí),安裝在客戶端上的檢測(cè)單元(比如安裝在客戶端上的安全軟件)截獲到本次訪問(wèn)請(qǐng)求,則將該URL發(fā)送到位于云端的服務(wù)器進(jìn)行檢測(cè),然后該服務(wù)器再下載該URL所對(duì)應(yīng)的網(wǎng)頁(yè)文件。
[0035]如,客戶端可以包括但是不局限于:功能手機(jī)、智能手機(jī)、掌上電腦、個(gè)人電腦(PC)、平板電腦或個(gè)人數(shù)字助理(PDA),等等。
[0036]在這里,對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件可以為多種形式的網(wǎng)頁(yè)文件,比如HTML文件、JS文件或CSS文件,等等。
[0037]以上雖然詳細(xì)羅列了客戶端和網(wǎng)頁(yè)文件的具體表現(xiàn)形式,本領(lǐng)域技術(shù)人員可以意識(shí)到,這種羅列僅是示范性的,并不用于對(duì)本發(fā)明實(shí)施方式的保護(hù)范圍進(jìn)行限定。
[0038]步驟102:解析所述對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件,以提取出包含于該網(wǎng)頁(yè)文件中的外部鏈接URL。
[0039]在這里,首先解析對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件,以獲取包含于該網(wǎng)頁(yè)文件中的<a>標(biāo)簽;然后提取所獲取的<a>標(biāo)簽的超文本引用(href)屬性值;再?gòu)乃崛〉膆ref屬性值中剔除與該網(wǎng)頁(yè)文件的本地域名相同的href屬性值,并將剩余的href屬性值作為包含于該網(wǎng)頁(yè)文件中的外部鏈接URL。
[0040]具體地,可以從網(wǎng)頁(yè)文件中提取所有外鏈,包括HTMLl文件中的<a>標(biāo)簽和js代碼中通過(guò)document, write等方式寫入的<a>標(biāo)簽等,并提取其中href屬性對(duì)應(yīng)的值,而且排除與當(dāng)前所訪問(wèn)URL域名相同的href值。
[0041]比如:假設(shè)當(dāng)前訪問(wèn)URL為http://www.a.com/ ;其頁(yè)面包含以下3個(gè)<a>標(biāo)簽:
[0042]<a href =,,http://www.a.com/test, htm,,>
[0043]<a href = ” test, htm” >
[0044]<a href =,,http: //www.b.com/ ” >
[0045]由于〈a href =,,http://www.a.com/test, htm” > 和〈a href =,,test, htm,,>分別以絕對(duì)路徑和相對(duì)路徑的方式鏈接到本地站點(diǎn)的同一文件test.htm,因此最終只有http://www.b.com/被提取出來(lái)作為包含于該網(wǎng)頁(yè)文件中的外部鏈接URL。
[0046]再比如,假設(shè)當(dāng)前訪問(wèn)URL為http://www.a.com/ ;其頁(yè)面包含以下5個(gè)<a>標(biāo)簽:
[0047]<a href =,,http://www.a.com/test, htm,,>
[0048]<a href = ” test, htm” >
[0049]<a href =,,http: //www.b.com/ ” >
[0050]<a href =,,http://www.c.com/test, htm,,>
[0051]<a href =,,http://www.d.com,,>
[0052]由于〈ahref =”http://www.a.com/test.htm,,> 和〈a href =,,test, htm” > 分別以絕對(duì)路徑和相對(duì)路徑的方式鏈接到本地站點(diǎn)的同一文件test, htm,最終只有http://www.b.com/>http://www.c.com/test, htm,http://www.d.com 這 3 個(gè) URL 被提取出來(lái)作為包含于該網(wǎng)頁(yè)文件中的外部鏈接URL。
[0053]步驟103:提取所述外部鏈接URL的域名,并根據(jù)所提取出的域名查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定所述外部鏈接URL中是否包含黑鏈。
[0054]在這里,首先從外部鏈接URL中提取域名。域名是由一串用點(diǎn)分隔的名字組成的Internet上某一臺(tái)計(jì)算機(jī)或計(jì)算機(jī)組的名稱,用于在數(shù)據(jù)傳輸時(shí)標(biāo)識(shí)計(jì)算機(jī)的電子方位??梢蕴崛〉挠蛎譃椴煌?jí)別,包括頂級(jí)域名、二級(jí)域名、三級(jí)域名等。其中頂級(jí)域名又分為兩類:一是國(guó)家頂級(jí)域名(national top-level domainnames, nTLDs),目前200多個(gè)國(guó)家都按照IS03166國(guó)家代碼分配了頂級(jí)域名,例如中國(guó)是cn,美國(guó)是us,日本是jp等;二是國(guó)際頂級(jí)域名(international top-level domain names, iTDs),例如表不工商企業(yè)的.Com,表示網(wǎng)絡(luò)提供商的.net,表示非盈利組織的.0rg等。二級(jí)域名是指頂級(jí)域名之下的域名,在國(guó)際頂級(jí)域名下,它是指域名注冊(cè)人的網(wǎng)上名稱,例如ibm, yahoo, microsoft等;在國(guó)家頂級(jí)域名下,它是表示注冊(cè)企業(yè)類別的符號(hào),例如com, edu, gov, net等;三級(jí)域名用字母(A?Z,a?z,大小寫等)、數(shù)字(O?9)和連接符(一)組成,各級(jí)域名之間用實(shí)點(diǎn)(.)連接,三級(jí)域名的長(zhǎng)度不能超過(guò)20個(gè)字符。
[0055]在域名信任度數(shù)據(jù)庫(kù)中保存有域名與其域名信任度值之間的對(duì)應(yīng)關(guān)系。優(yōu)選地,該域名信任度數(shù)據(jù)庫(kù)是可以編輯的,從而可以在域名信任度數(shù)據(jù)庫(kù)中增加、刪除或變更域名及其域名信任度值。
[0056]在建立域名信任度數(shù)據(jù)庫(kù)的過(guò)程中,可以參考下列原則:
[0057]域名信任度值描述了域名的安全程度,當(dāng)一個(gè)域名下的惡意URL越多,其域名信任度值就越低。通常網(wǎng)站上的正常鏈接(即明鏈)指向的都是同類型的安全網(wǎng)站,代表當(dāng)前網(wǎng)站對(duì)其他網(wǎng)站的推薦和信任,以明鏈方式將用戶導(dǎo)向一個(gè)惡意站點(diǎn)對(duì)網(wǎng)站自身的聲譽(yù)也會(huì)有很大影響。然而,黑鏈則正好相反,其往往指向各類游戲私服、外掛、醫(yī)療、色情、博彩等暴利和惡意網(wǎng)站,而通常也只有這類網(wǎng)站才有動(dòng)機(jī)大量向黑客購(gòu)買黑鏈以提高其在搜索引擎的可見(jiàn)度,從而吸引更多用戶獲取暴利。
[0058]當(dāng)一個(gè)正常網(wǎng)站上出現(xiàn)大量指向惡意網(wǎng)站的外鏈時(shí),其被篡改的幾率則大大增力口。由于被篡改的網(wǎng)站通常還可能植入各類惡意掛馬代碼,用戶應(yīng)該盡量避免訪問(wèn)此類站點(diǎn)以避免電腦感染網(wǎng)站上的木馬病毒。
[0059]優(yōu)選地,可以根據(jù)所提取出的域名查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定每個(gè)域名的域名信任度值;判斷所確定的域名信任度值是否滿足預(yù)先設(shè)定的黑鏈判定條件,如果是,則判定所述外部鏈接URL中包含黑鏈,如果不滿足,則判定所述外部鏈接URL中不包含黑鏈。
[0060]其中:判斷所確定的域名信任度值是否滿足預(yù)先設(shè)定的黑鏈判定條件具體可以包括:判斷域名信任度值中低于預(yù)先設(shè)置的域名信任度門限值的域名個(gè)數(shù)是否達(dá)到預(yù)先設(shè)置的域名數(shù);或判斷各個(gè)域名的域名信任度值的平均數(shù)是否低于預(yù)先設(shè)定的黑鏈門限值,等
坐寸ο
[0061]變更黑鏈判定條件可以設(shè)置/保存在客戶端,也可以設(shè)置/保存在服務(wù)器中。在這里,優(yōu)選在客戶端中設(shè)置或變更黑鏈判定條件。當(dāng)客戶端判定黑鏈判定條件發(fā)生更改時(shí),將最新的黑鏈判定條件發(fā)送到服務(wù)器,并由服務(wù)器保存。通過(guò)在在客戶端中設(shè)置黑鏈判定條件,可以便于用戶隨時(shí)更改黑鏈判定條件,從而提高本發(fā)明實(shí)施方式的靈活性。[0062]比如:基于查詢域名信任度數(shù)據(jù)庫(kù)所提取出的有效外鏈的域名信任度值,可以根據(jù)預(yù)定的黑鏈判定條件進(jìn)行黑鏈篡改判定。優(yōu)選地,黑鏈判定條件可以由用戶自定義設(shè)置,可能的規(guī)則包括:
[0063]a)域名信任度值低于某閾值的外鏈URL到達(dá)某個(gè)預(yù)定數(shù)目;
[0064]b)所有有效外鏈URL的域名信任度分?jǐn)?shù)平均值低于某預(yù)先設(shè)置的閾值。
[0065]在本發(fā)明實(shí)施方式中,優(yōu)選當(dāng)判定所述外部鏈接URL中包含黑鏈時(shí),阻止對(duì)所述URL的訪問(wèn)請(qǐng)求,并向用戶發(fā)出風(fēng)險(xiǎn)報(bào)警消息;當(dāng)判定所述外部鏈接URL中不包含黑鏈時(shí),允許對(duì)所述URL的訪問(wèn)請(qǐng)求。
[0066]圖2為根據(jù)本發(fā)明實(shí)施方式的域名信任度賦值示意圖。
[0067]如圖2所示,待分析頁(yè)面中有3個(gè)外鏈URL,其中第I個(gè)外鏈URL對(duì)應(yīng)的域名信任度值為100、第2個(gè)外鏈URL對(duì)應(yīng)的域名信任度值為80、第3個(gè)外鏈URL對(duì)應(yīng)的域名信任度值為60。
[0068]假設(shè)預(yù)定義的黑鏈判定條件為:信任度評(píng)分低于90的域名到達(dá)2個(gè)及以上,則這3個(gè)外鏈URL滿足規(guī)則,則判定包含該3個(gè)外鏈URL的網(wǎng)頁(yè)文件所對(duì)應(yīng)的URL被黑鏈篡改,此時(shí)優(yōu)選阻止用戶訪問(wèn)該網(wǎng)頁(yè)文件所對(duì)應(yīng)的URL,并向用戶提示風(fēng)險(xiǎn)。
[0069]假設(shè)預(yù)定義的黑鏈判定條件為:所有有效外鏈的信任度分?jǐn)?shù)平均值低于80,則此URL不滿足規(guī)則,則判定包含該3個(gè)外鏈URL的網(wǎng)頁(yè)文件所對(duì)應(yīng)的URL未被黑鏈篡改,用戶可以正常訪問(wèn)該網(wǎng)頁(yè)文件所對(duì)應(yīng)的URL。
[0070]以上詳細(xì)羅列了黑鏈判定條件的一些具體實(shí)例,本領(lǐng)域技術(shù)人員可以意識(shí)到,這種羅列僅僅是示范性的,并不用于限定本發(fā)明實(shí)施方式的保護(hù)范圍。
[0071]可以將本發(fā)明實(shí)施方式應(yīng)用到多種具體情形中,比如應(yīng)用到客戶端-服務(wù)器的模式中,其中服務(wù)器位于網(wǎng)絡(luò)側(cè),而且優(yōu)選構(gòu)成服務(wù)器群的表現(xiàn)形式。
[0072]圖3為根據(jù)本發(fā)明實(shí)施方式,在網(wǎng)絡(luò)側(cè)實(shí)現(xiàn)黑鏈檢測(cè)的方法流程圖。
[0073]如圖3所示,該流程包括:
[0074]步驟301:客戶端在本地瀏覽器發(fā)起對(duì)URL的訪問(wèn)請(qǐng)求,安裝在該客戶端上的插件截獲該訪問(wèn)請(qǐng)求,并將用戶期望訪問(wèn)的URL發(fā)送到位于網(wǎng)絡(luò)側(cè)的服務(wù)器進(jìn)行檢測(cè),而且位于網(wǎng)絡(luò)側(cè)的服務(wù)器優(yōu)選為云服務(wù)器。
[0075]步驟302:服務(wù)器獲取該用戶期望訪問(wèn)的URL之后,下載該用戶期望訪問(wèn)的URL所對(duì)應(yīng)的頁(yè)面文件。
[0076]步驟303:服務(wù)器從該頁(yè)面文件中提取所有的有效外鏈URL。
[0077]步驟304:服務(wù)器查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定每個(gè)外鏈URL所對(duì)應(yīng)域名的域名信任度值。在這里,基于實(shí)際應(yīng)用環(huán)境的需求,可以選擇針對(duì)各個(gè)級(jí)別的域名來(lái)確定其域名信任度值。
[0078]步驟305:判斷外鏈URL所對(duì)應(yīng)域名的域名信任度值是否滿足預(yù)先設(shè)定的黑鏈判定條件,如果是則執(zhí)行步驟306,否則執(zhí)行步驟307。在這里,黑鏈判定條件具體可以為:域名信任度值低于某閾值的外鏈URL到達(dá)某個(gè)預(yù)定數(shù)目;或者所有有效外鏈URL的域名信任度分?jǐn)?shù)平均值低于某預(yù)先設(shè)置的閾值。
[0079]步驟306:服務(wù)器向客戶端發(fā)出指令,以阻斷客戶端訪問(wèn)該用戶期望訪問(wèn)的URL,并且服務(wù)器向客戶端發(fā)出風(fēng)險(xiǎn)報(bào)警消息,提示該期望訪問(wèn)的URL中包含黑鏈。[0080]步驟307:服務(wù)器允許客戶端訪問(wèn)該用戶期望訪問(wèn)的URL。
[0081]基于上述詳細(xì)分析,本發(fā)明實(shí)施方式還提出了一種黑鏈檢測(cè)裝置。
[0082]圖4為根據(jù)本發(fā)明實(shí)施方式的黑鏈檢測(cè)裝置結(jié)構(gòu)圖。如圖4所示,
[0083]該裝置包括訪問(wèn)請(qǐng)求接收單元401、外部鏈接URL提取單元402和黑鏈判定單元403,其中:
[0084]訪問(wèn)請(qǐng)求接收單元401,用于接收針對(duì)URL的訪問(wèn)請(qǐng)求,并下載對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件;
[0085]外部鏈接URL提取單元402,用于解析所述對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件,以提取出包含于該網(wǎng)頁(yè)文件中的外部鏈接URL ;
[0086]黑鏈判定單元403,用于提取所述外部鏈接URL的域名,并根據(jù)所提取出的域名查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定所述外部鏈接URL中是否包含黑鏈。
[0087]在一個(gè)實(shí)施方式中,外部鏈接URL提取單元402,用于解析對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件,以獲取包含于該網(wǎng)頁(yè)文件中的<a>標(biāo)簽;提取所獲取的<a>標(biāo)簽的超文本引用(href )屬性值;從所提取的href屬性值中剔除與該網(wǎng)頁(yè)文件的本地域名相同的href屬性值,并將剩余的href屬性值作為包含于該網(wǎng)頁(yè)文件中的外部鏈接URL。
[0088]優(yōu)選地,黑鏈判定單元403,進(jìn)一步用于當(dāng)判定所述外部鏈接URL中包含黑鏈時(shí),阻止對(duì)所述URL的訪問(wèn)請(qǐng)求,并向用戶發(fā)出風(fēng)險(xiǎn)報(bào)警消息;當(dāng)判定所述外部鏈接URL中不包含黑鏈時(shí),允許對(duì)所述URL的訪問(wèn)請(qǐng)求。
[0089]優(yōu)選地,黑鏈判定單元403,用于根據(jù)所提取出的域名查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定每個(gè)域名的域名信任度值;判斷所確定的域名信任度值是否滿足預(yù)先設(shè)定的黑鏈判定條件,如果是,則判定所述外部鏈接URL中包含黑鏈,如果不滿足,則判定所述外部鏈接URL中不包含黑鏈。
[0090]在一個(gè)實(shí)施方式中,黑鏈判定單元403,用于判斷域名信任度值中低于預(yù)先設(shè)置的域名信任度門限值的域名個(gè)數(shù)是否達(dá)到預(yù)先設(shè)置的域名數(shù);或判斷各個(gè)域名的域名信任度值的平均數(shù)是否低于預(yù)先設(shè)定的黑鏈門限值。
[0091]基于上述詳細(xì)分析,本發(fā)明實(shí)施方式還提出了一種黑鏈檢測(cè)系統(tǒng)。
[0092]圖5為根據(jù)本發(fā)明實(shí)施方式的黑鏈檢測(cè)系統(tǒng)的結(jié)構(gòu)圖。
[0093]如圖5所示,包括客戶端501和服務(wù)器502,其中:服務(wù)器位于網(wǎng)絡(luò)側(cè)。
[0094]在本發(fā)明實(shí)施方式中,客戶端501和服務(wù)器502之間可以通過(guò)多種網(wǎng)絡(luò)(比如,互聯(lián)網(wǎng)或者無(wú)線通信網(wǎng)絡(luò))進(jìn)行通信連接。比如:按信息傳送的方向與時(shí)間關(guān)系,客戶端501與服務(wù)器502之間的通信方式優(yōu)選可分為單工通信、半雙工通信及全雙工通信,等等。
[0095]在本發(fā)明實(shí)施方式中,客戶端501與服務(wù)器502之間可以約定具體的通信協(xié)議,在這些通信協(xié)議中定義好數(shù)據(jù)單元使用的格式,信息單元應(yīng)該包含的信息與含義、連接方式、信息發(fā)送和接收的時(shí)序,從而確保網(wǎng)絡(luò)中數(shù)據(jù)順利地傳送到確定的地方。
[0096]比如,本發(fā)明實(shí)施方式可以采用的通信協(xié)議包括但是不局限于:傳輸控制協(xié)議/網(wǎng)際協(xié)議(TCP/IP)、超文本傳輸協(xié)議(HTTP)、簡(jiǎn)單郵件傳輸協(xié)議(SMTP)、郵局協(xié)議的第3個(gè)版本(POP3),等等。
[0097]而且,當(dāng)客戶端501通過(guò)無(wú)線方式與服務(wù)器502連接時(shí),本發(fā)明實(shí)施方式中客戶端501可以通過(guò)多種通信標(biāo)準(zhǔn)與服務(wù)器502執(zhí)行信息交互。比如:可以采用全球移動(dòng)通訊系統(tǒng)(GSM)、寬帶碼分多址(WCDMA)、碼分多址2000 (CDMA-2000)、時(shí)分同步碼分多址(TD-SCDMA)等各種通信標(biāo)準(zhǔn)。而且,客戶端501與服務(wù)器502之間的信息交互格式可以具有多種形式。
如,信息格式可以包括但是不局限于:短信息(SMS)、電子郵件、即時(shí)通訊(IM)信息、多媒體信息(麗S)或語(yǔ)音信息,等等。
[0098]其中:
[0099]客戶端501,用于發(fā)出針對(duì)URL的訪問(wèn)請(qǐng)求,并將所述訪問(wèn)請(qǐng)求發(fā)送到服務(wù)器;
[0100]服務(wù)器502,用于解析所述對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件,以提取出包含于該網(wǎng)頁(yè)文件中的外部鏈接URL,提取所述外部鏈接URL的域名,并根據(jù)所提取出的域名查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定所述外部鏈接URL中是否包含黑鏈。
[0101]優(yōu)選地,服務(wù)器502,用于解析對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件,以獲取包含于該網(wǎng)頁(yè)文件中的<a>標(biāo)簽;提取所獲取的<a>標(biāo)簽的超文本引用(href )屬性值;從所提取的href屬性值中剔除與該網(wǎng)頁(yè)文件的本地域名相同的href屬性值,并將剩余的href屬性值作為包含于該網(wǎng)頁(yè)文件中的外部鏈接URL。
[0102]在一個(gè)實(shí)施方式中,服務(wù)器502,進(jìn)一步用于當(dāng)判定所述外部鏈接URL中包含黑鏈時(shí),阻止客戶端501對(duì)所述URL的訪問(wèn)請(qǐng)求,并向客戶端501發(fā)出風(fēng)險(xiǎn)報(bào)警消息;當(dāng)判定所述外部鏈接URL中不包含黑鏈時(shí),允許客戶端502對(duì)所述URL的訪問(wèn)請(qǐng)求。
[0103]優(yōu)選的,服務(wù)器502,用于根據(jù)所提取出的域名查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定每個(gè)域名的域名信任度值;判斷所確定的域名信任度值是否滿足預(yù)先設(shè)定的黑鏈判定條件,如果是,則判定所述外部鏈接URL中包含黑鏈,如果不滿足,則判定所述外部鏈接URL中不包含黑鏈。
[0104]其中:服務(wù)器502,可以判斷域名`信任度值中低于預(yù)先設(shè)置的域名信任度門限值的域名個(gè)數(shù)是否達(dá)到預(yù)先設(shè)置的域名數(shù);或判斷各個(gè)域名的域名信任度值的平均數(shù)是否低于預(yù)先設(shè)定的黑鏈門限值。
[0105]可以將圖4所示裝置集成到各種通信網(wǎng)絡(luò)的硬件實(shí)體當(dāng)中。比如,可以將黑鏈檢測(cè)裝置集成到:功能手機(jī)、智能手機(jī)、掌上電腦、個(gè)人電腦(PC)、平板電腦或個(gè)人數(shù)字助理(PDA),等等設(shè)備之中。
[0106]實(shí)際上,可以通過(guò)多種形式來(lái)具體實(shí)施本發(fā)明實(shí)施方式所提出的黑鏈檢測(cè)裝置。比如,可以遵循一定規(guī)范的應(yīng)用程序接口,將黑鏈檢測(cè)裝置編寫為安裝到終端中的插件程序,也可以將其封裝為應(yīng)用程序以供用戶自行下載使用。當(dāng)編寫為插件程序時(shí),可以將其實(shí)施為ocx、dll、cab等多種插件形式。也可以通過(guò)Flash插件、RealPlayer插件、MMS插件、MIDI五線譜插件、ActiveX插件等具體技術(shù)來(lái)實(shí)施本發(fā)明實(shí)施方式所提出的黑鏈檢測(cè)
>j-U ρ?α裝直。
[0107]可以通過(guò)指令或指令集存儲(chǔ)的儲(chǔ)存方式將本發(fā)明實(shí)施方式所提出的黑鏈檢測(cè)方法存儲(chǔ)在各種存儲(chǔ)介質(zhì)上。這些存儲(chǔ)介質(zhì)包括但是不局限于:軟盤、光盤、DVD、硬盤、閃存、U 盤、CF 卡、SD 卡、MMC 卡、SM 卡、記憶棒(Memory Stick)、xD 卡等。
[0108]另外,還可以將本發(fā)明實(shí)施方式所提出的黑鏈檢測(cè)方法應(yīng)用到基于閃存(Nandflash)的存儲(chǔ)介質(zhì)中,比如U盤、CF卡、SD卡、SDHC卡、MMC卡、SM卡、記憶棒、xD卡等。
[0109]綜上所述,在本發(fā)明實(shí)施方式中,接收針對(duì)統(tǒng)一資源定位符(URL)的訪問(wèn)請(qǐng)求,并下載對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件;解析所述對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件,以提取出包含于該網(wǎng)頁(yè)文件中的外部鏈接URL ;提取所述外部鏈接URL的域名,并根據(jù)所提取出的域名查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定所述外部鏈接URL中是否包含黑鏈。由此可見(jiàn),應(yīng)用本發(fā)明實(shí)施方式之后,可以根據(jù)頁(yè)面外連的域名信任度值進(jìn)行網(wǎng)頁(yè)的黑鏈自動(dòng)判斷,從而實(shí)現(xiàn)了黑鏈的快速和自動(dòng)檢測(cè),因此提高了黑鏈檢測(cè)效率。
[0110]另外,可以針對(duì)黑鏈判定條件在客戶端進(jìn)行自行設(shè)置,因此本發(fā)明實(shí)施方式的靈活性高,也進(jìn)一步提高了黑鏈檢測(cè)效率。
[0111]以上所述,僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種黑鏈檢測(cè)方法,其特征在于,該方法包括: 接收針對(duì)統(tǒng)一資源定位符(URL)的訪問(wèn)請(qǐng)求,并下載對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件; 解析所述對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件,以提取出包含于該網(wǎng)頁(yè)文件中的外部鏈接URL ; 提取所述外部鏈接URL的域名,并根據(jù)所提取出的域名查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定所述外部鏈接URL中是否包含黑鏈。
2.根據(jù)權(quán)利要求1所述的黑鏈檢測(cè)方法,其特征在于,所述解析對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件,以提取出包含于該網(wǎng)頁(yè)文件中的外部鏈接URL包括: 解析對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件,以獲取包含于該網(wǎng)頁(yè)文件中的<a>標(biāo)簽; 提取所獲取的<a>標(biāo)簽的超文本引用(href)屬性值; 從所提取的href屬性值中剔除與該網(wǎng)頁(yè)文件的本地域名相同的href屬性值,并將剩余的href屬性值作為包含于該網(wǎng)頁(yè)文件中的外部鏈接URL。
3.根據(jù)權(quán)利要求1所述的黑鏈檢測(cè)方法,其特征在于,該方法進(jìn)一步包括: 當(dāng)判定所述外部鏈接URL中包含黑鏈時(shí),阻止對(duì)所述URL的訪問(wèn)請(qǐng)求,并向用戶發(fā)出風(fēng)險(xiǎn)報(bào)警消息;當(dāng)判定所述外部鏈接URL中不包含黑鏈時(shí),允許對(duì)所述URL的訪問(wèn)請(qǐng)求。
4.根據(jù)權(quán)利要求1所述的黑鏈檢測(cè)方法,其特征在于,所述接收針對(duì)URL的訪問(wèn)請(qǐng)求,并下載對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件包括: 客戶端針對(duì)該URL發(fā)出訪問(wèn)請(qǐng)求,并將所述訪問(wèn)請(qǐng)求發(fā)送到位于網(wǎng)絡(luò)側(cè)的服務(wù)器; 位于網(wǎng)絡(luò)側(cè)的服務(wù)器接收該針對(duì)URL的訪問(wèn)請(qǐng)求,并下載對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件。
5.根據(jù)權(quán)利要求1所述的黑鏈檢測(cè)方法,其特征在于,所述根據(jù)所提取出的域名查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定所述外部鏈接URL中是否包含黑鏈包括: 根據(jù)所提取出的域名查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定每個(gè)域名的域名信任度值; 判斷所確定的域名信任度值是否滿足預(yù)先設(shè)定的黑鏈判定條件,如果是,則判定所述外部鏈接URL中包含黑鏈,如果不滿足,則判定所述外部鏈接URL中不包含黑鏈。
6.根據(jù)權(quán)利要求5所述的黑鏈檢測(cè)方法,其特征在于,所述判斷所確定的域名信任度值是否滿足預(yù)先設(shè)定的黑鏈判定條件包括: 判斷域名信任度值中低于預(yù)先設(shè)置的域名信任度門限值的域名個(gè)數(shù)是否達(dá)到預(yù)先設(shè)置的域名數(shù);或 判斷各個(gè)域名的域名信任度值的平均數(shù)是否低于預(yù)先設(shè)定的黑鏈門限值。
7.—種黑鏈檢測(cè)裝置,其特征在于,該裝置包括訪問(wèn)請(qǐng)求接收單元、外部鏈接URL提取單元和黑鏈判定單元,其中: 訪問(wèn)請(qǐng)求接收單元,用于接收針對(duì)URL的訪問(wèn)請(qǐng)求,并下載對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件; 外部鏈接URL提取單元,用于解析所述對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件,以提取出包含于該網(wǎng)頁(yè)文件中的外部鏈接URL ; 黑鏈判定單元,用于提取所述外部鏈接URL的域名,并根據(jù)所提取出的域名查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定所述外部鏈接URL中是否包含黑鏈。
8.根據(jù)權(quán)利要求7所述的黑鏈檢測(cè)裝置,其特征在于, 外部鏈接URL提取單元,用于解析對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件,以獲取包含于該網(wǎng)頁(yè)文件中的<a>標(biāo)簽;提取所獲取的<a>標(biāo)簽的超文本引用(href)屬性值;從所提取的href屬性值中剔除與該網(wǎng)頁(yè)文件的本地域名相同的href屬性值,并將剩余的href屬性值作為包含于該網(wǎng)頁(yè)文件中的外部鏈接URL。
9.根據(jù)權(quán)利要求7所述的黑鏈檢測(cè)裝置,其特征在于, 黑鏈判定單元,進(jìn)一步用于當(dāng)判定所述外部鏈接URL中包含黑鏈時(shí),阻止對(duì)所述URL的訪問(wèn)請(qǐng)求,并向用戶發(fā)出風(fēng)險(xiǎn)報(bào)警消息;當(dāng)判定所述外部鏈接URL中不包含黑鏈時(shí),允許對(duì)所述URL的訪問(wèn)請(qǐng)求。
10.根據(jù)權(quán)利要求7所述的黑鏈檢測(cè)裝置,其特征在于, 黑鏈判定單元,用于根據(jù)所提取出的域名查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定每個(gè)域名的域名信任度值;判斷所確定的域名信任度值是否滿足預(yù)先設(shè)定的黑鏈判定條件,如果是,則判定所述外部鏈接URL中包含黑鏈,如果不滿足,則判定所述外部鏈接URL中不包含黑鏈。
11.根據(jù)權(quán)利要求10所述的黑鏈檢測(cè)裝置,其特征在于, 黑鏈判定單元,用于判斷域名信任度值中低于預(yù)先設(shè)置的域名信任度門限值的域名個(gè)數(shù)是否達(dá)到預(yù)先設(shè)置的域名數(shù);或判斷各個(gè)域名的域名信任度值的平均數(shù)是否低于預(yù)先設(shè)定的黑鏈門限值。
12.一種黑鏈檢測(cè)系統(tǒng),其特征在于,包括客戶端和服務(wù)器,其中: 客戶端,用于發(fā)出針對(duì)URL的訪問(wèn)請(qǐng)求,并將所述訪問(wèn)請(qǐng)求發(fā)送到服務(wù)器; 服務(wù)器,用于解析所述對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件,以提取出包含于該網(wǎng)頁(yè)文件中的外部鏈接URL,提取所述外部鏈接URL的域名,并根據(jù)所提取出的域名查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定 所述外部鏈接URL中是否包含黑鏈。
13.根據(jù)權(quán)利要求12所述的黑鏈檢測(cè)系統(tǒng),其特征在于, 服務(wù)器,用于解析對(duì)應(yīng)該URL的網(wǎng)頁(yè)文件,以獲取包含于該網(wǎng)頁(yè)文件中的<a>標(biāo)簽;提取所獲取的<a>標(biāo)簽的超文本引用(href)屬性值;從所提取的href屬性值中剔除與該網(wǎng)頁(yè)文件的本地域名相同的href屬性值,并將剩余的href屬性值作為包含于該網(wǎng)頁(yè)文件中的外部鏈接URL。
14.根據(jù)權(quán)利要求12所述的黑鏈檢測(cè)系統(tǒng),其特征在于, 服務(wù)器,進(jìn)一步用于當(dāng)判定所述外部鏈接URL中包含黑鏈時(shí),阻止客戶端對(duì)所述URL的訪問(wèn)請(qǐng)求,并向客戶端發(fā)出風(fēng)險(xiǎn)報(bào)警消息;當(dāng)判定所述外部鏈接URL中不包含黑鏈時(shí),允許客戶端對(duì)所述URL的訪問(wèn)請(qǐng)求。
15.根據(jù)權(quán)利要求12所述的黑鏈檢測(cè)系統(tǒng),其特征在于, 服務(wù)器,用于根據(jù)所提取出的域名查詢預(yù)先設(shè)置的域名信任度數(shù)據(jù)庫(kù),以確定每個(gè)域名的域名信任度值;判斷所確定的域名信任度值是否滿足預(yù)先設(shè)定的黑鏈判定條件,如果是,則判定所述外部鏈接URL中包含黑鏈,如果不滿足,則判定所述外部鏈接URL中不包含黑鏈。
16.根據(jù)權(quán)利要求15所述的黑鏈檢測(cè)系統(tǒng),其特征在于, 服務(wù)器,判斷域名信任度值中低于預(yù)先設(shè)置的域名信任度門限值的域名個(gè)數(shù)是否達(dá)到預(yù)先設(shè)置的域名數(shù);或判斷各個(gè)域名的域名信任度值的平均數(shù)是否低于預(yù)先設(shè)定的黑鏈門限值。
【文檔編號(hào)】H04L29/08GK103856442SQ201210501415
【公開(kāi)日】2014年6月11日 申請(qǐng)日期:2012年11月30日 優(yōu)先權(quán)日:2012年11月30日
【發(fā)明者】劉健, 張輝 申請(qǐng)人:騰訊科技(深圳)有限公司