本發(fā)明屬于計算機(jī)網(wǎng)絡(luò)安全技術(shù)領(lǐng)域,更具體地,涉及一種釣魚網(wǎng)站檢測方法。
背景技術(shù):
隨著網(wǎng)絡(luò)信息與服務(wù)的迅速發(fā)展,人們的生活消費(fèi)以及服務(wù)活動逐漸開始由現(xiàn)實向互聯(lián)網(wǎng)環(huán)境轉(zhuǎn)移;釣魚網(wǎng)站問題隨之浮現(xiàn);釣魚網(wǎng)站由于頁面內(nèi)容與被假冒的網(wǎng)站的頁面內(nèi)容幾乎完全相同,導(dǎo)致用戶被欺騙造成巨大的經(jīng)濟(jì)財產(chǎn)損失。
現(xiàn)有技術(shù)中對于釣魚網(wǎng)站的檢測方法包括人工舉報、關(guān)鍵字識別和黑白名單技術(shù);其中,人工舉報需要用戶主動發(fā)現(xiàn),效果較為被動;關(guān)鍵字識別受限于釣魚網(wǎng)站文字內(nèi)容,局限性較大;而黑白名單技術(shù)需要管理者不停的更新名單,漏報、錯報可能性較大。
技術(shù)實現(xiàn)要素:
針對現(xiàn)有技術(shù)的以上缺陷或改進(jìn)需求,本發(fā)明提供了一種釣魚網(wǎng)站檢測方法,其目的在于解決現(xiàn)有釣魚網(wǎng)站檢測方法漏報概率大、實時性差的問題。
為實現(xiàn)上述目的,按照本發(fā)明的一個方面,提供了一種釣魚網(wǎng)站檢測方法,包括如下步驟:
(1)隨機(jī)填充待檢測網(wǎng)站的表單,若表單中隨機(jī)填充的賬號密碼通過了驗證,則判定待檢測網(wǎng)站為釣魚網(wǎng)站;否則,進(jìn)入步驟(2);
(2)獲取待檢測網(wǎng)站快照并從中提取其logo區(qū)域的文字;
(3)將所述文字與預(yù)設(shè)的白名單進(jìn)行匹配,獲取所述logo區(qū)域?qū)?yīng)的根域名;
(4)將所述根域名與白名單中的根域名進(jìn)行比對,若所述域名的根域名與白名單中的根域名匹配,則判定待檢測網(wǎng)站為非釣魚網(wǎng)站;否則,判定為非釣魚網(wǎng)站。
優(yōu)選地,上述釣魚網(wǎng)站檢測方法,所述表單的內(nèi)容是根據(jù)待檢測網(wǎng)站對用戶名、密碼的長度和字符格式限制隨機(jī)生成的字符串。
優(yōu)選地,上述釣魚網(wǎng)站檢測方法,所述步驟(2)中,將網(wǎng)頁快照劃分為面積相同4塊正方形區(qū)域,對左上的正方形區(qū)域內(nèi)容進(jìn)行識別;根據(jù)網(wǎng)站布局的統(tǒng)計結(jié)果獲知網(wǎng)站logo位于頁面左上區(qū)域的概率大,因此在本步驟中,直接對左上區(qū)域內(nèi)容進(jìn)行識別,以提高處理的實時性。
優(yōu)選地,上述釣魚網(wǎng)站檢測方法,所述步驟(3)中,通過去除請求參數(shù),去除控制器與方法字段,對所述域名的當(dāng)前統(tǒng)一資源定位符(Uniform Resource Locator,URL)進(jìn)行字符串處理獲取根域名。
優(yōu)選地,上述釣魚網(wǎng)站檢測方法,所述步驟(4)具體為:將根域名與官網(wǎng)域名進(jìn)行比對,若兩者匹配,則判定待檢測網(wǎng)站為非釣魚網(wǎng)站;否則,判定待檢測網(wǎng)站為釣魚網(wǎng)站。
總體而言,通過本發(fā)明所構(gòu)思的以上技術(shù)方案與現(xiàn)有技術(shù)相比,能夠取得下列有益效果:
(1)本發(fā)明提供的釣魚網(wǎng)站檢測方法,直接從圖片層次進(jìn)行識別,解決了釣魚網(wǎng)站將文字內(nèi)容偽裝成圖片從而導(dǎo)致誤報、漏報的問題;相比較而言,現(xiàn)有的釣魚網(wǎng)站檢測技術(shù)的檢測初始點(diǎn)為網(wǎng)站的源代碼,通過對網(wǎng)站源代碼的分析判斷出該網(wǎng)站是否為釣魚網(wǎng)站;這類方法的缺陷在于:由于源代碼中看不到圖片內(nèi)容,因此無法識別出用圖片偽造內(nèi)容的釣魚網(wǎng)站,而產(chǎn)生誤報、漏報;
(2)本發(fā)明提供的釣魚網(wǎng)站檢測方法,通過分析圖片內(nèi)容與URL的對應(yīng)性,可以判斷待檢測網(wǎng)站是否為釣魚網(wǎng)站,并具有普適性,無論釣魚網(wǎng)站如何在源代碼中隱藏偽造痕跡,其偽造的網(wǎng)站均與白名單中的真實網(wǎng)站內(nèi)容相似或相同,呈獻(xiàn)給用戶的視覺信息不會發(fā)生改變,由此可由一條白名單數(shù)據(jù)檢測出多條釣魚網(wǎng)站信息,具有高效檢測的特點(diǎn);相比較而言,現(xiàn)有的釣魚網(wǎng)站檢測技術(shù)僅通過源代碼中的文字內(nèi)容進(jìn)行識別,無法直接與用戶所看到的內(nèi)容產(chǎn)生一致性,可能存在視覺信息與網(wǎng)站內(nèi)容不相匹配的情況,從而產(chǎn)生漏判、誤判;
(3)本發(fā)明提供的釣魚網(wǎng)站檢測方法,由于與服務(wù)端之間僅僅傳遞的是待檢測網(wǎng)站的URL,再在服務(wù)端上對該URL對應(yīng)的網(wǎng)站進(jìn)行檢測,整個過程傳遞的都只是文字內(nèi)容,傳遞速度快,因此提高了釣魚網(wǎng)站檢測的實時性。
附圖說明
圖1是本發(fā)明實施例提供的釣魚網(wǎng)站檢測方法流程圖;
圖2是本發(fā)明實施例所檢測的某購物網(wǎng)站的登錄界面示意圖;
圖3是本發(fā)明實施例所檢測的某購物網(wǎng)站的登錄界面的切分示例圖;
圖4是本發(fā)明實施例所檢測的某購物網(wǎng)站的登錄界面的左上方logo區(qū)域示意圖。
具體實施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。此外,下面所描述的本發(fā)明各個實施方式中所涉及到的技術(shù)特征只要彼此之間未構(gòu)成沖突就可以相互組合。
本發(fā)明提供的釣魚網(wǎng)站檢查方法,先隨機(jī)填充待檢測網(wǎng)站中的表單,若表單中隨機(jī)填充的賬號密碼通過了驗證,則判定待檢測網(wǎng)站為釣魚網(wǎng)站;否則繼續(xù)判斷;生成網(wǎng)站快照并用圖像識別技術(shù)識別logo區(qū)域的文字,將文字與白名單數(shù)據(jù)庫中對應(yīng)數(shù)據(jù)進(jìn)行匹配,并取白名單中的根域名與待檢測網(wǎng)站根域名進(jìn)行比對,若比對成功,則判定為非釣魚網(wǎng)站,若比對不成功,則判定為釣魚網(wǎng)站;與現(xiàn)有的釣魚網(wǎng)站檢查方法相比,本發(fā)明的這種方法利用釣魚網(wǎng)站的登錄系統(tǒng)大多只是虛設(shè),實則為了獲取用戶賬號信息的特點(diǎn),用虛假的賬號密碼組合進(jìn)行試探,從而進(jìn)行初始判斷;對于初始判斷不能確定的網(wǎng)站,則直接利用圖像識別待測網(wǎng)頁的logo,從視覺上判斷待測網(wǎng)頁是否為釣魚網(wǎng)站,做到與用戶所看到的內(nèi)容相一致,從而避免誤判、漏判。
以下結(jié)合對某購物網(wǎng)站進(jìn)行檢測的實施例,來具體闡述本發(fā)明提供的釣魚網(wǎng)站檢測方法;實施例提供的釣魚網(wǎng)站檢查方法,其流程如圖1所示,具體包括如下步驟:
(1)隨機(jī)填充表單數(shù)據(jù);實施例中,賬號填充為asdiw9424uad,密碼為23iwsdh824!ad;其填充頁面如圖2所示;
(2)根據(jù)待檢測網(wǎng)站返回內(nèi)容中是否有類似“賬戶名與密碼不匹配”的文本判斷是否登錄成功來判斷待檢測網(wǎng)站是否為釣魚網(wǎng)站;當(dāng)待檢測網(wǎng)站返回內(nèi)容中不存在該類文本,表明登陸成功,判定待檢測網(wǎng)站為釣魚網(wǎng)站,否則進(jìn)入步驟(3);
(3)生成待檢測網(wǎng)站對應(yīng)頁面的網(wǎng)頁快照,提取網(wǎng)頁快照左上方內(nèi)容,并利用光學(xué)字符識別技術(shù)(Optical Character Recognition,OCR)提取Logo區(qū)域的文字;
(4)將檢測出的所有文字與預(yù)設(shè)的白名單進(jìn)行匹配,找出存在于文字中的白名單域名,獲取Logo區(qū)域?qū)?yīng)的根域名;
(5)將上述根域名與白名單中的根域名進(jìn)行比對,若所述域名的根域名與白名單中的根域名匹配,則判定待檢測網(wǎng)站為非釣魚網(wǎng)站;否則,判定為非釣魚網(wǎng)站;
本實施例中,待測網(wǎng)站域名的根域名為www.ks-harq.cn,白名單中的域名為www.taobao.com,兩者不匹配;判定待測網(wǎng)站為釣魚網(wǎng)站。
實施例中,檢測到待測網(wǎng)站的源代碼進(jìn)行了加密;對于在這類源代碼加密的釣魚網(wǎng)站,通過現(xiàn)有的通過源代碼檢測來進(jìn)行釣魚網(wǎng)站識別的方法,極易誤判,漏判;而采用本實施例提供的這種從提前的網(wǎng)頁快照的圖片層次進(jìn)行識別,則解決了漏判、誤判的問題。
本領(lǐng)域的技術(shù)人員容易理解,以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。