專利名稱:仿冒域名檢測方法及設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息處理技術(shù),尤其涉及一種仿冒域名檢測方法及設(shè)備,屬于網(wǎng)絡(luò)安全技術(shù)領(lǐng)域。
背景技術(shù):
隨著科技的普及化,網(wǎng)絡(luò)通訊技術(shù)以不可取代的地位深入各個領(lǐng)域,而網(wǎng)絡(luò)安全問題也日益嚴(yán)峻,其中以網(wǎng)絡(luò)釣魚問題尤為突出。網(wǎng)絡(luò)釣魚,是指通過發(fā)送垃圾電子郵件等方式,將收信用戶引誘到一個通過精心設(shè)計與目標(biāo)組織的網(wǎng)站非常相似的釣魚網(wǎng)站上,并獲取收信人在此網(wǎng)站上輸入的個人敏感信息的網(wǎng)絡(luò)犯罪行為。由于電子商務(wù)和互聯(lián)網(wǎng)應(yīng)用的普及和發(fā)展,網(wǎng)絡(luò)釣魚造成的損失日
益嚴(yán)重。由于域名是網(wǎng)站的入口標(biāo)識,網(wǎng)絡(luò)釣魚行為常常要采用和目標(biāo)網(wǎng)站相似的域名,來使得用戶誤以為釣魚網(wǎng)站是正規(guī)的目標(biāo)網(wǎng)站,域名仿冒行為是釣魚攻擊的一個重要特征。因此,對可疑鏈接的檢測,對可疑郵件的檢測等反釣魚的技術(shù)都需要對可疑網(wǎng)站所用域名是否為正規(guī)域名的仿冒域名進(jìn)行檢測,但是目前并沒有出現(xiàn)有效的仿冒域名檢測方法。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)中的缺陷,本發(fā)明提供一種仿冒域名檢測方法及設(shè)備,用以實現(xiàn)仿冒域名的有效檢測。根據(jù)本發(fā)明的一方面,提供一種仿冒域名檢測方法,包括獲取待檢測域名; 獲取所述待檢測域名的關(guān)鍵詞與預(yù)先獲取的目標(biāo)域名的關(guān)鍵詞編輯距離;若所述編輯距離小于等于預(yù)設(shè)閾值,則判定所述待檢測域名為所述目標(biāo)域名的仿冒域名。進(jìn)一步地,在上述仿冒域名檢測方法中,所述獲取所述待檢測域名的關(guān)鍵詞與預(yù)先獲取的目標(biāo)域名的關(guān)鍵詞編輯距離之前還包括獲取目標(biāo)域名關(guān)鍵詞列表,所述目標(biāo)域名關(guān)鍵詞列表包括至少兩個目標(biāo)域名的關(guān)鍵詞;相應(yīng)地,所述獲取所述待檢測域名的關(guān)鍵詞與預(yù)先獲取的目標(biāo)域名的關(guān)鍵詞編輯距離具體包括將所述待檢測域名的關(guān)鍵詞分別與所述目標(biāo)域名關(guān)鍵詞列表中的各目標(biāo)域名的關(guān)鍵詞比較,以獲取所述待檢測域名的關(guān)鍵詞與各目標(biāo)域名的關(guān)鍵詞編輯距離。進(jìn)一步地,在上述仿冒域名檢測方法中,所述獲取所述待檢測域名的關(guān)鍵詞與預(yù)先獲取的目標(biāo)域名的關(guān)鍵詞編輯距離之后,還包括若所述編輯距離大于所述預(yù)設(shè)閾值,則判斷所述待檢測域名的關(guān)鍵詞的字符長度是否大于所述目標(biāo)域名的關(guān)鍵詞的字符長度;
若所述待檢測域名的關(guān)鍵詞的字符長度小于等于所述目標(biāo)域名的關(guān)鍵詞的字符長度,則判定所述待檢測域名不是所述目標(biāo)域名的仿冒域名。進(jìn)一步地,在上述仿冒域名檢測方法中,所述判斷所述待檢測域名的關(guān)鍵詞的字符長度是否大于所述目標(biāo)域名的關(guān)鍵詞的字符長度之后,還包括若所述待檢測域名的關(guān)鍵詞的字符長度大于所述目標(biāo)域名的關(guān)鍵詞的字符長度,獲取所述待檢測域名的關(guān)鍵詞的至少兩個子字符串,所述子字符串的字符長度與所述目標(biāo)域名的關(guān)鍵詞的字符長度相等; 分別獲取各子字符串與所述目標(biāo)域名的關(guān)鍵詞編輯距離;若存在與所述目標(biāo)域名的關(guān)鍵詞編輯距離小于等于所述預(yù)設(shè)閾值的子字符串,則判定所述待檢測域名為所述目標(biāo)域名的仿冒域名。進(jìn)一步地,在上述仿冒域名檢測方法中,所述目標(biāo)域名的關(guān)鍵詞包括頂級域名的關(guān)鍵詞,所述待檢測域名的關(guān)鍵詞包括頂級域名的關(guān)鍵詞、二級域名的關(guān)鍵詞和/或三級域名的關(guān)鍵詞。根據(jù)本發(fā)明的另一方面,還提供一種仿冒域名檢測設(shè)備,包括第一獲取模塊,用于獲取待檢測域名;第二獲取模塊,用于獲取所述待檢測域名的關(guān)鍵詞與預(yù)先獲取的目標(biāo)域名的關(guān)鍵詞編輯距離;第一判定模塊,用于若所述編輯距離小于等于預(yù)設(shè)閾值,則判定所述待檢測域名為所述目標(biāo)域名的仿冒域名。進(jìn)一步地,在上述仿冒域名檢測設(shè)備中,還包括第三獲取模塊,用于獲取目標(biāo)域名關(guān)鍵詞列表,所述目標(biāo)域名關(guān)鍵詞列表包括至少兩個目標(biāo)域名的關(guān)鍵詞;相應(yīng)地,所述第二獲取模塊還用于將所述待檢測域名的關(guān)鍵詞分別與所述目標(biāo)域名關(guān)鍵詞列表中的各目標(biāo)域名的關(guān)鍵詞比較,以獲取所述待檢測域名的關(guān)鍵詞與各目標(biāo)域名的關(guān)鍵詞編輯距離。進(jìn)一步地,在上述仿冒域名檢測設(shè)備中,還包括第二判定模塊,用于若所述編輯距離大于所述預(yù)設(shè)閾值,則判斷所述待檢測域名的關(guān)鍵詞的字符長度是否大于所述目標(biāo)域名的關(guān)鍵詞的字符長度;若所述待檢測域名的關(guān)鍵詞的字符長度小于等于所述目標(biāo)域名的關(guān)鍵詞的字符長度,則判定所述待檢測域名不是所述目標(biāo)域名的仿冒域名。進(jìn)一步地,在上述仿冒域名檢測設(shè)備中,還包括第三判定模塊,用于若所述待檢測域名的關(guān)鍵詞的字符長度大于所述目標(biāo)域名的關(guān)鍵詞的字符長度,獲取所述待檢測域名的關(guān)鍵詞的至少兩個子字符串,所述子字符串的字符長度與所述目標(biāo)域名的關(guān)鍵詞的字符長度相等;分別獲取各子字符串與所述目標(biāo)域名的關(guān)鍵詞編輯距離;若存在與所述目標(biāo)域名的關(guān)鍵詞編輯距離小于等于所述預(yù)設(shè)閾值的子字符串,則判定所述待檢測域名為所述目標(biāo)域名的仿冒域名。進(jìn)一步地,在上述仿冒域名檢測設(shè)備中,所述目標(biāo)域名的關(guān)鍵詞包括頂級域名的關(guān)鍵詞,所述待檢測域名的關(guān)鍵詞包括頂級域名的關(guān)鍵詞、二級域名的關(guān)鍵詞和/或三級域名的關(guān)鍵詞。
根據(jù)本發(fā)明提供的仿冒域名檢測方法及設(shè)備,通過計算待檢測域名的關(guān)鍵詞與目標(biāo)域名的關(guān)鍵詞之間的編輯距離來計算兩者之間的相似度,并當(dāng)編輯距離小于預(yù)設(shè)值,即相似程度超過合理范圍時,確認(rèn)待檢測域名為目標(biāo)域名的仿冒域名,從而實現(xiàn)了仿冒域名的有效檢測。
圖I為本發(fā)明實施例仿冒域名檢測方法的流程示意圖。
圖2為本發(fā)明實施例仿冒域名檢測設(shè)備的結(jié)構(gòu)示意圖。
具體實施例方式本發(fā)明實施例的釣魚網(wǎng)站檢測方法例如由設(shè)置在網(wǎng)絡(luò)中的釣魚網(wǎng)站檢測設(shè)備來執(zhí)行。圖I為本發(fā)明實施例仿冒域名檢測方法的流程示意圖。如圖I所示,該仿冒域名檢測方法包括以下步驟步驟SlOl,獲取待檢測域名;其中,該待檢測域名例如為疑為釣魚網(wǎng)站的域名,可根據(jù)用戶舉報或基于已有的可疑釣魚網(wǎng)站檢測方法獲得,例如包括啟發(fā)式特征檢測技術(shù)和模式識別檢測技術(shù)等。步驟S102,獲取所述待檢測域名的關(guān)鍵詞與預(yù)先獲取的目標(biāo)域名的關(guān)鍵詞編輯距離;其中,該目標(biāo)域名例如為知名度較高的網(wǎng)站域名、用戶點擊量較大的網(wǎng)站域名或曾被仿冒的網(wǎng)站域名等。域名的關(guān)鍵詞為域名中用于與其他域名相區(qū)分、作為該目標(biāo)域名特殊標(biāo)識的字段,例如域名“http://www. baidu. com”的關(guān)鍵詞為“baidu”,目標(biāo)域名“http://www. taobao. com” 的關(guān)鍵詞為 “taobao”。編輯距離,又稱為Levenshtein距離,是指兩個字符串之間,由一個轉(zhuǎn)成另一個所需的最少編輯操作次數(shù)。其中,編輯操作包括將一個字符替換成另一個字符,插入一個字符和刪除一個字符。例如當(dāng)將字符串“kitten”轉(zhuǎn)化為字符串“sitting”時,至少需進(jìn)行以下三次編輯操作一、替換操作,將“kitten”中的“k”轉(zhuǎn)化為“S”,得到“sitten”;二、替換操作,“sitten”中的“e”轉(zhuǎn)化為“i”,得到“sittin”;三、插入操作,在“sittin”中插入“g”,得到“sitting”,因此字符串“kitten”與字符串“sitting”之間的編輯距離為3。步驟S103,若所述編輯距離小于等于預(yù)設(shè)閾值,則判定所述待檢測域名為所述目標(biāo)域名的仿冒域名。其中,該預(yù)設(shè)閾值可根據(jù)需要進(jìn)行設(shè)定,或通過統(tǒng)計已知使用仿冒域名的釣魚網(wǎng)站與其所仿冒的目標(biāo)網(wǎng)站的域名關(guān)鍵詞之間的編輯距離進(jìn)行設(shè)定。根據(jù)上述實施例的仿冒域名檢測方法,通過計算待檢測域名的關(guān)鍵詞與目標(biāo)域名的關(guān)鍵詞之間的編輯距離來計算兩者之間的相似度,并當(dāng)編輯距離小于預(yù)設(shè)值,即相似程度超過合理范圍時,確認(rèn)待檢測域名為目標(biāo)域名的仿冒域名,從而實現(xiàn)了仿冒域名的有效檢測。由于在實際應(yīng)用中,釣魚網(wǎng)站通常通過使用與知名網(wǎng)站域名相近似的域名作為釣魚網(wǎng)站域名來迷惑用戶,例如某一釣魚網(wǎng)站的域名仿冒淘寶網(wǎng)站的域名,該釣魚網(wǎng)站的域名為http://www. tlobao. com,關(guān)鍵詞為“tIobao”,該關(guān)鍵詞與淘寶網(wǎng)站的關(guān)鍵詞“taobao”之間的編輯距離僅為1,因此只要預(yù)設(shè)閾值大于等于1,則可確定該域名為淘寶網(wǎng)站的仿冒域名,從而可確定該網(wǎng)站為釣魚網(wǎng)站或通過進(jìn)一步的釣魚網(wǎng)站檢測方法對該網(wǎng)站進(jìn)行檢測。進(jìn)一步地, 在上述實施例的仿冒域名檢測方法中,所述獲取所述待檢測域名的關(guān)鍵詞與預(yù)先獲取的目標(biāo)域名的關(guān)鍵詞編輯距離之前還包括獲取目標(biāo)域名關(guān)鍵詞列表,所述目標(biāo)域名關(guān)鍵詞列表包括至少兩個目標(biāo)域名的關(guān)鍵詞;相應(yīng)地,所述獲取所述待檢測域名的關(guān)鍵詞與預(yù)先獲取的目標(biāo)域名的關(guān)鍵詞編輯距離具體包括將所述待檢測域名的關(guān)鍵詞分別與所述目標(biāo)域名關(guān)鍵詞列表中的各目標(biāo)域名的關(guān)鍵詞比較,以獲取所述待檢測域名的關(guān)鍵詞與各目標(biāo)域名的關(guān)鍵詞編輯距離。具體地,釣魚網(wǎng)站檢測設(shè)備中例如預(yù)先建立有目標(biāo)域名關(guān)鍵詞列表,該目標(biāo)域名關(guān)鍵詞列表中包括多個目標(biāo)域名的關(guān)鍵詞。在進(jìn)行仿冒域名檢測時,可通過將待檢測域名分別與目標(biāo)域名關(guān)鍵詞列表中的各關(guān)鍵詞進(jìn)行比較,來判斷該待檢測域名是否存在仿冒行為,從而實現(xiàn)全面檢測。進(jìn)一步地,在上述實施例的仿冒域名檢測方法中,所述獲取所述待檢測域名的關(guān)鍵詞與預(yù)先獲取的目標(biāo)域名的關(guān)鍵詞編輯距離之后,還包括若所述編輯距離大于所述預(yù)設(shè)閾值,則判斷所述待檢測域名的關(guān)鍵詞的字符長度是否大于所述目標(biāo)域名的關(guān)鍵詞的字符長度;若所述待檢測域名的關(guān)鍵詞的字符長度小于等于所述目標(biāo)域名的關(guān)鍵詞的字符長度,則判定所述待檢測域名不是所述目標(biāo)域名的仿冒域名。具體地,釣魚網(wǎng)站的域名中還可能嵌入了與目標(biāo)網(wǎng)站相同或相似的域名,例如釣魚網(wǎng)站的域名關(guān)鍵詞為“tsobao-aution”,其中嵌入了與淘寶網(wǎng)站域名的關(guān)鍵詞“taobao”極為相似的“tsobao”,但由于“tsobao-aution”相對于“taobao”中增加了字符串“-aution”,使得該兩個關(guān)鍵詞之間的編輯距離為8,可能超出了預(yù)設(shè)閾值(例如預(yù)設(shè)閾值為3) ο因此,在執(zhí)行上述實施例的步驟S103之后,對于待檢測域名的關(guān)鍵詞與目標(biāo)域名的關(guān)鍵詞之間的編輯距離超過預(yù)設(shè)閾值的情況,還可通過比較待檢測域名的關(guān)鍵詞與目標(biāo)域名的關(guān)鍵詞的字符長度,來判斷兩者之間較大的編輯距離是否是由待檢測域名的關(guān)鍵詞較長造成的,即檢測待檢測域名的關(guān)鍵詞中是否嵌入了與目標(biāo)網(wǎng)站域名相同或相似的關(guān)鍵詞。因此,若檢測獲知待檢測域名的關(guān)鍵詞的字符長度小于或等于目標(biāo)域名的關(guān)鍵詞,則可判定待檢測域名不是目標(biāo)域名的仿冒域名,若檢測獲知待檢測域名的關(guān)鍵詞的字符長度大于目標(biāo)域名的關(guān)鍵詞,則可通過進(jìn)一步的檢測來判斷待檢測域名是否為仿冒域名。進(jìn)一步地,在上述實施例的仿冒域名檢測方法中,所述判斷所述待檢測域名的關(guān)鍵詞的字符長度是否大于所述目標(biāo)域名的關(guān)鍵詞的字符長度之后,還包括若所述待檢測域名的關(guān)鍵詞的字符長度大于所述目標(biāo)域名的關(guān)鍵詞的字符長度,獲取所述待檢測域名的關(guān)鍵詞的至少兩個子字符串,所述子字符串的字符長度與所述目標(biāo)域名的關(guān)鍵詞的字符長度相等;
分別獲取各子字符串與所述目標(biāo)域名的關(guān)鍵詞編輯距離;若存在與所述目標(biāo)域名的關(guān)鍵詞編輯距離小于等于所述預(yù)設(shè)閾值的子字符串,則判定所述待檢測域名為所述目標(biāo)域名的仿冒域名。具體地,當(dāng)待檢測域名的關(guān)鍵詞的字符長度大于目標(biāo)域名的關(guān)鍵詞的字符長度時,獲取待檢測域名的關(guān)鍵詞中與目標(biāo)域名的關(guān)鍵詞相同字符長度的子字符串。例如,以 “taobao”作為目標(biāo)域名的關(guān)鍵詞時,上述釣魚網(wǎng)站的域名關(guān)鍵詞“tsobao-aution”的子字符串包括 “tsobao,,、“sobao-,,、“obao-a,,、“bao-au,,、“ao-aut,,、“o-auti”、“_autio,,和“aution”。分別計算這些子字符串與目標(biāo)域名的關(guān)鍵詞“taobao”之間的編輯距離,并判斷這些編輯距離中是否存在小于或等于預(yù)設(shè)閾值的編輯距離,若存在,則判定該待檢測域名為目標(biāo)域名的仿冒域名,若不存在,則判定該待檢測域名不為目標(biāo)域名的仿冒域名。例如上述子字符串“tsobao”與“taobao”之間的編輯距離為1,小于預(yù)設(shè)閾值,則判定該以“tsobao-aution”作為關(guān)鍵詞的待檢測域名為淘寶網(wǎng)站域名的仿冒域名。而且,上述獲取待檢測域名的關(guān)鍵詞的子字符串以及進(jìn)行編輯距離計算及比對的過程,既可以先形成包括全部子字符串的子字符串列表,并對子字符串列表中的各子字符串進(jìn)行逐個處理;還可以按照由左至右或由右至左的順序,首先獲取一個子字符串,對該子字符串進(jìn)行輯距離計算及比對,若該子字符串與目標(biāo)域名的關(guān)鍵詞的編輯距離小于或等于預(yù)設(shè)閾值,即確定待檢測域名存在仿冒行為,并停止后續(xù)處理;若該子字符串與目標(biāo)域名的關(guān)鍵詞的編輯距離大于預(yù)設(shè)閾值,再獲取下一子字符串。進(jìn)一步地,在上述實施例的仿冒域名檢測方法中,所述目標(biāo)域名的關(guān)鍵詞包括頂級域名的關(guān)鍵詞,所述待檢測域名的關(guān)鍵詞包括頂級域名的關(guān)鍵詞、二級域名的關(guān)鍵詞和/或三級域名的關(guān)鍵詞。具體地,網(wǎng)站域名可能為形如“http://www. baidu. com”的域名,也可能為形如“http: //www. mp3, baidu. com” 的域名,還可能為形如 “http: //www. bbs. youa. baidu.com”的域名。以“http: //www. bbs. youa. baidu. com”為例,“baidu”為頂級域名的關(guān)鍵詞,“youa”為二級域名的關(guān)鍵詞,“bbs”為三級域名的關(guān)鍵詞。釣魚網(wǎng)站除利用頂級域名進(jìn)行釣魚外,還可能利用二級域名或三級域名進(jìn)行釣魚,例如“http: //www. qq. ok673. cn”,利用二級域名的關(guān)鍵詞“qq”進(jìn)行域名仿冒,此時,可按照上述實施例中的仿冒域名檢測方法,分別針對待檢測域名中的各級域名的關(guān)鍵詞進(jìn)行仿冒域名檢測,若任意一級或多級域名的關(guān)鍵詞對于目標(biāo)域名存在仿冒行為,則可判定待檢測域名為目標(biāo)域名的仿冒域名。圖2為本發(fā)明實施例仿冒域名檢測設(shè)備的流程示意圖。如圖2所示,該仿冒域名檢測設(shè)備包括第一獲取模塊21,用于獲取待檢測域名;第二獲取模塊22,用于獲取所述待檢測域名的關(guān)鍵詞與預(yù)先獲取的目標(biāo)域名的關(guān)鍵詞編輯距離;第一判定模塊23,用于若所述編輯距離小于等于預(yù)設(shè)閾值,則判定所述待檢測域名為所述目標(biāo)域名的仿冒域名。上述實施例的仿冒域名檢測設(shè)備執(zhí)行仿冒域名檢測的具體流程與前述實施例的仿冒域名檢測方法相同,故此處不再贅述。
根據(jù)上述實施例的仿冒域名檢測設(shè)備,通過計算待檢測域名的關(guān)鍵詞與目標(biāo)域名的關(guān)鍵詞之間的編輯距離來計算兩者之間的相似度,并當(dāng)編輯距離小于預(yù)設(shè)值,即相似程度超過合理范圍時,確認(rèn)待檢測域名為目標(biāo)域名的仿冒域名,從而實現(xiàn)了仿冒域名的有效檢測。進(jìn)一步地,在上述實施例的仿冒域名檢測設(shè)備中,還包括第三獲取模塊,用于獲取目標(biāo)域名關(guān)鍵詞列表,所述目標(biāo)域名關(guān)鍵詞列表包括至少兩個目標(biāo)域名的關(guān)鍵詞;相應(yīng)地,所述第二獲取模塊還用于將所述待檢測域名的關(guān)鍵詞分別與所述目標(biāo)域名關(guān)鍵詞列表中的各目標(biāo)域名的關(guān)鍵詞比較,以獲取所述待檢測域名的關(guān)鍵詞與各目標(biāo)域名的關(guān)鍵詞編輯距離。進(jìn)一步地,在上述實施例的仿冒域名檢測設(shè)備中,還包括第二判定模塊,用于若所述編輯距離大于所述預(yù)設(shè)閾值,則判斷所述待檢測域名的關(guān)鍵詞的字符長度是否大于所述目標(biāo)域名的關(guān)鍵詞的字符長度;若所述待檢測域名的關(guān)鍵詞的字符長度小于等于所述目標(biāo)域名的關(guān)鍵詞的字符長度,則判定所述待檢測域名不是所述目標(biāo)域名的仿冒域名。進(jìn)一步地,在上述實施例的仿冒域名檢測設(shè)備中,還包括第三判定模塊,用于若所述待檢測域名的關(guān)鍵詞的字符長度大于所述目標(biāo)域名的關(guān)鍵詞的字符長度,獲取所述待檢測域名的關(guān)鍵詞的至少兩個子字符串,所述子字符串的字符長度與所述目標(biāo)域名的關(guān)鍵詞的字符長度相等;分別獲取各子字符串與所述目標(biāo)域名的關(guān)鍵詞編輯距離;若存在與所述目標(biāo)域名的關(guān)鍵詞編輯距離小于等于所述預(yù)設(shè)閾值的子字符串,則判定所述待檢測域名為所述目標(biāo)域名的仿冒域名。進(jìn)一步地,在上述實施例的仿冒域名檢測設(shè)備中,所述目標(biāo)域名的關(guān)鍵詞包括頂級域名的關(guān)鍵詞,所述待檢測域名的關(guān)鍵詞包括頂級域名的關(guān)鍵詞、二級域名的關(guān)鍵詞和/或三級域名的關(guān)鍵詞。最后應(yīng)說明的是以上各實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制; 盡管參照前述各實施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解其依然可以對前述各實施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的范圍。
權(quán)利要求
1.一種仿冒域名檢測方法,其特征在于,包括 獲取待檢測域名; 獲取所述待檢測域名的關(guān)鍵詞與預(yù)先獲取的目標(biāo)域名的關(guān)鍵詞編輯距離; 若所述編輯距離小于等于預(yù)設(shè)閾值,則判定所述待檢測域名為所述目標(biāo)域名的仿冒域名。
2.根據(jù)權(quán)利要求I所述的仿冒域名檢測方法,其特征在于,所述獲取所述待檢測域名的關(guān)鍵詞與預(yù)先獲取的目標(biāo)域名的關(guān)鍵詞編輯距離之前還包括 獲取目標(biāo)域名關(guān)鍵詞列表,所述目標(biāo)域名關(guān)鍵詞列表包括至少兩個目標(biāo)域名的關(guān)鍵詞; 相應(yīng)地,所述獲取所述待檢測域名的關(guān)鍵詞與預(yù)先獲取的目標(biāo)域名的關(guān)鍵詞編輯距離具體包括 將所述待檢測域名的關(guān)鍵詞分別與所述目標(biāo)域名關(guān)鍵詞列表中的各目標(biāo)域名的關(guān)鍵詞比較,以獲取所述待檢測域名的關(guān)鍵詞與各目標(biāo)域名的關(guān)鍵詞編輯距離。
3.根據(jù)權(quán)利要求I所述的仿冒域名檢測方法,其特征在于,所述獲取所述待檢測域名的關(guān)鍵詞與預(yù)先獲取的目標(biāo)域名的關(guān)鍵詞編輯距離之后,還包括 若所述編輯距離大于所述預(yù)設(shè)閾值,則判斷所述待檢測域名的關(guān)鍵詞的字符長度是否大于所述目標(biāo)域名的關(guān)鍵詞的字符長度; 若所述待檢測域名的關(guān)鍵詞的字符長度小于等于所述目標(biāo)域名的關(guān)鍵詞的字符長度,則判定所述待檢測域名不是所述目標(biāo)域名的仿冒域名。
4.根據(jù)權(quán)利要求3所述的仿冒域名檢測方法,其特征在于,所述判斷所述待檢測域名的關(guān)鍵詞的字符長度是否大于所述目標(biāo)域名的關(guān)鍵詞的字符長度之后,還包括 若所述待檢測域名的關(guān)鍵詞的字符長度大于所述目標(biāo)域名的關(guān)鍵詞的字符長度,獲取所述待檢測域名的關(guān)鍵詞的至少兩個子字符串,所述子字符串的字符長度與所述目標(biāo)域名的關(guān)鍵詞的字符長度相等; 分別獲取各子字符串與所述目標(biāo)域名的關(guān)鍵詞編輯距離; 若存在與所述目標(biāo)域名的關(guān)鍵詞編輯距離小于等于所述預(yù)設(shè)閾值的子字符串,則判定所述待檢測域名為所述目標(biāo)域名的仿冒域名。
5.根據(jù)權(quán)利要求1-4任一所述的仿冒域名檢測方法,其特征在于,所述目標(biāo)域名的關(guān)鍵詞包括頂級域名的關(guān)鍵詞,所述待檢測域名的關(guān)鍵詞包括頂級域名的關(guān)鍵詞、ニ級域名的關(guān)鍵詞和/或三級域名的關(guān)鍵詞。
6.一種仿冒域名檢測設(shè)備,其特征在于,包括 第一獲取模塊,用于獲取待檢測域名; 第二獲取模塊,用于獲取所述待檢測域名的關(guān)鍵詞與預(yù)先獲取的目標(biāo)域名的關(guān)鍵詞編輯距離; 第一判定模塊,用于若所述編輯距離小于等于預(yù)設(shè)閾值,則判定所述待檢測域名為所述目標(biāo)域名的仿冒域名。
7.根據(jù)權(quán)利要求6所述的仿冒域名檢測設(shè)備,其特征在于,還包括 第三獲取模塊,用于獲取目標(biāo)域名關(guān)鍵詞列表,所述目標(biāo)域名關(guān)鍵詞列表包括至少兩個目標(biāo)域名的關(guān)鍵詞;相應(yīng)地,所述第二獲取模塊還用于將所述待檢測域名的關(guān)鍵詞分別與所述目標(biāo)域名關(guān)鍵詞列表中的各目標(biāo)域名的關(guān)鍵詞比較,以獲取所述待檢測域名的關(guān)鍵詞與各目標(biāo)域名的關(guān)鍵詞編輯距離。
8.根據(jù)權(quán)利要求6所述的仿冒域名檢測設(shè)備,其特征在于,還包括 第二判定模塊,用于若所述編輯距離大于所述預(yù)設(shè)閾值,則判斷所述待檢測域名的關(guān)鍵詞的字符長度是否大于所述目標(biāo)域名的關(guān)鍵詞的字符長度;若所述待檢測域名的關(guān)鍵詞的字符長度小于等于所述目標(biāo)域名的關(guān)鍵詞的字符長度,則判定所述待檢測域名不是所述目標(biāo)域名的仿冒域名。
9.根據(jù)權(quán)利要求8所述的仿冒域名檢測設(shè)備,其特征在于,還包括 第三判定模塊,用于若所述待檢測域名的關(guān)鍵詞的字符長度大于所述目標(biāo)域名的關(guān)鍵詞的字符長度,獲取所述待檢測域名的關(guān)鍵詞的至少兩個子字符串,所述子字符串的字符長度與所述目標(biāo)域名的關(guān)鍵詞的字符長度相等;分別獲取各子字符串與所述目標(biāo)域名的關(guān)鍵詞編輯距離;若存在與所述目標(biāo)域名的關(guān)鍵詞編輯距離小于等于所述預(yù)設(shè)閾值的子字符串,則判定所述待檢測域名為所述目標(biāo)域名的仿冒域名。
10.根據(jù)權(quán)利要求6-9任一所述的仿冒域名檢測設(shè)備,其特征在于,所述目標(biāo)域名的關(guān)鍵詞包括頂級域名的關(guān)鍵詞,所述待檢測域名的關(guān)鍵詞包括頂級域名的關(guān)鍵詞、ニ級域名的關(guān)鍵詞和/或三級域名的關(guān)鍵詞。
全文摘要
本發(fā)明提供一種仿冒域名檢測方法及設(shè)備。該方法包括獲取待檢測域名;獲取所述待檢測域名的關(guān)鍵詞與預(yù)先獲取的目標(biāo)域名的關(guān)鍵詞編輯距離;若所述編輯距離小于等于預(yù)設(shè)閾值,則判定所述待檢測域名為所述目標(biāo)域名的仿冒域名。根據(jù)本發(fā)明提供的仿冒域名檢測方法及設(shè)備,能夠?qū)崿F(xiàn)仿冒域名的有效檢測。
文檔編號H04L29/12GK102664878SQ201210104110
公開日2012年9月12日 申請日期2012年4月10日 優(yōu)先權(quán)日2012年4月10日
發(fā)明者洪博, 王利明 申請人:中國科學(xué)院計算機(jī)網(wǎng)絡(luò)信息中心