本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,尤其涉及一種高覆蓋度且準(zhǔn)確的域名ip對應(yīng)關(guān)系獲取方法及裝置。
背景技術(shù):
目前,通過統(tǒng)合多個(gè)數(shù)據(jù)源以及使用多種降噪技術(shù),能夠獲得全面準(zhǔn)確的域名和ip。在獲得全面且準(zhǔn)確的域名和ip后,研究各域名的接入ip,即域名和ip的對應(yīng)關(guān)系將成為下一步的關(guān)注點(diǎn)。目前,獲取域名和ip的對應(yīng)關(guān)系的方式主要有兩種,其一是使用dns(domainnamesystem,域名系統(tǒng))探針獲取域名和ip的對應(yīng)關(guān)系,即在機(jī)房內(nèi)部署dns探針服務(wù)器,通過數(shù)據(jù)流量獲取鏡像數(shù)據(jù),采集udp(userdatagramprotocol,用戶數(shù)據(jù)報(bào)協(xié)議)協(xié)議的響應(yīng)包,并從數(shù)據(jù)中提取dns六元組(cnname,源ip、目的ip、解析ip、域名,訪問時(shí)間)信息,解析六元組信息獲得域名ip對應(yīng)關(guān)系。但是由于dns數(shù)據(jù)量極大,導(dǎo)致采集的數(shù)據(jù)存在一個(gè)域名對應(yīng)大量ip,一個(gè)ip對應(yīng)大量域名的情況;因此該方式中,數(shù)據(jù)源的準(zhǔn)確性得不到保障,需要經(jīng)過處理才能使用。由此,dns探針采集的域名ip對應(yīng)關(guān)系存在著準(zhǔn)確性問題。其二,使用eu(executionunit,執(zhí)行單元)設(shè)備獲取域名和ip的對應(yīng)關(guān)系,即在運(yùn)營商企業(yè)處部署eu采集設(shè)備,eu設(shè)備將采集通過該運(yùn)營商的全部httpget請求和httpsget請求,將請求的域名和ip的對應(yīng)關(guān)系以及域名的存活狀態(tài)記錄;通過這部分?jǐn)?shù)據(jù)可以獲取域名和ip的對應(yīng)關(guān)系,并對域名的存活狀態(tài)進(jìn)行劃分;然而,eu設(shè)備采集到的數(shù)據(jù)僅為撥測過的域名和ip數(shù)據(jù),導(dǎo)致其全面性得不到保障,需要其他數(shù)據(jù)源進(jìn)行補(bǔ)充。由此,eu設(shè)備采集的域名ip對應(yīng)關(guān)系存在著全面性問題。可見,現(xiàn)有的域名和ip對應(yīng)關(guān)系的獲取方式均存在弊端,不能獲取到全面的、準(zhǔn)確的域名和ip的對應(yīng)關(guān)系。因此,希望有一種能夠獲取最準(zhǔn)確且最全面的域名ip對應(yīng)關(guān)系的方法,從而能夠有效的進(jìn)行行業(yè)監(jiān)管。
技術(shù)實(shí)現(xiàn)要素:
為克服現(xiàn)有技術(shù)的缺陷,本發(fā)明提供一種高效的域名ip對應(yīng)關(guān)系獲取方法及裝置。
一方面,本發(fā)明提供一種高覆蓋度且準(zhǔn)確的域名ip對應(yīng)關(guān)系獲取方法,包括:
步驟s1:從各數(shù)據(jù)源中獲取第一域名集合,并通過域名系統(tǒng)探針設(shè)備獲取第二域名集合和第一域名ip對應(yīng)關(guān)系集合,通過采集設(shè)備獲取第三域名集合和第二域名ip對應(yīng)關(guān)系集合;
步驟s2:對所述第一域名集合、所述第二域名集合和所述第三域名集合進(jìn)行域名融合,得到域名總集,并獲取所述域名總集中各域名的ip對應(yīng)關(guān)系得到第三域名ip對應(yīng)關(guān)系集合;
步驟s3:對所述第一域名ip對應(yīng)關(guān)系集合、所述第二域名ip對應(yīng)關(guān)系集合和所述第三域名ip對應(yīng)關(guān)系集合進(jìn)行域名ip對應(yīng)關(guān)系融合,得到域名ip對應(yīng)關(guān)系總集;
步驟s4:對所述域名ip對應(yīng)關(guān)系總集中各域名ip對應(yīng)關(guān)系進(jìn)行存活判斷得到存活域名ip對應(yīng)關(guān)系總集并保存。
可選地,所述步驟s1,具體包括:
從備案數(shù)據(jù)、上報(bào)數(shù)據(jù)中獲取第一域名集合;
通過域名系統(tǒng)探針設(shè)備獲取鏡像數(shù)據(jù),在所述鏡像數(shù)據(jù)中提取六元組信息,對所述六元組信息中含有的各域名進(jìn)行降噪去重處理得到第二域名集合,并提取所述六元組信息中含有的各域名ip對應(yīng)關(guān)系得到第一域名ip對應(yīng)關(guān)系集合;
通過采集設(shè)備記錄各預(yù)設(shè)請求的域名及域名ip對應(yīng)關(guān)系得到活躍數(shù)據(jù),對所述活躍數(shù)據(jù)中含有的各域名進(jìn)行降噪去重處理得到第三域名集合,并提取所述活躍數(shù)據(jù)中含有的各域名ip對應(yīng)關(guān)系得到第二域名ip對應(yīng)關(guān)系集合。
可選地,所述步驟s1中,獲取所述第一域名集合、所述第二域名集合和所述第三域名集合過程中,還包括:對各域名進(jìn)行降噪去重處理;
可選地,所述步驟s2中,所述對所述第一域名集合、所述第二域名集合和所述第三域名集合進(jìn)行域名融合,得到域名總集的過程中,還包括:對各域名進(jìn)行降噪去重處理;
可選地,所述步驟s3中,所述對所述第一域名ip對應(yīng)關(guān)系集合、所述第二域名ip對應(yīng)關(guān)系集合和所述第三域名ip對應(yīng)關(guān)系集合進(jìn)行域名ip對應(yīng)關(guān)系融合,得到域名ip對應(yīng)關(guān)系總集的過程中,還包括:對各域名ip對應(yīng)關(guān)系進(jìn)行降噪去重處理。
可選地,所述步驟s2中,所述獲取所述域名總集中各域名的ip對應(yīng)關(guān)系得到第三域名ip對應(yīng)關(guān)系集合,具體為:使用第一指令撥測所述域名總集中各域名對應(yīng)的ip得到第三域名ip對應(yīng)關(guān)系集合。
可選地,所述步驟s4,具體包括:
步驟a1:依次使用第二指令對所述域名ip對應(yīng)關(guān)系總集中各域名ip對應(yīng)關(guān)系進(jìn)行撥測,判斷是否存在未存活的域名ip對應(yīng)關(guān)系,是則執(zhí)行步驟a2;否則,將所述域名ip對應(yīng)關(guān)系總集作為存活域名ip對應(yīng)關(guān)系總集并保存;
步驟a2:使用第三指令對未存活的域名ip對應(yīng)關(guān)系進(jìn)行撥測,判斷是否存活,是則將所述域名ip對應(yīng)關(guān)系總集作為存活域名ip對應(yīng)關(guān)系總集并保存;否則將其移除,并將保留的各域名ip對應(yīng)關(guān)系作為存活域名ip對應(yīng)關(guān)系總集并保存。
另一方面,本發(fā)明提供一種高覆蓋度且準(zhǔn)確的域名ip對應(yīng)關(guān)系獲取裝置,包括:
第一獲取模塊,用于從各數(shù)據(jù)源中獲取第一域名集合,并通過域名系統(tǒng)探針設(shè)備獲取第二域名集合和第一域名ip對應(yīng)關(guān)系集合,通過采集設(shè)備獲取第三域名集合和第二域名ip對應(yīng)關(guān)系集合;
第一融合模塊,用于對所述第一獲取模塊獲取的第一域名集合、第二域名集合和第三域名集合進(jìn)行域名融合,得到域名總集;
第二獲取模塊,用于獲取所述第一融合模塊得到的域名總集中各域名的ip對應(yīng)關(guān)系得到第三域名ip對應(yīng)關(guān)系集合;
第二融合模塊,用于對所述第一獲取模塊獲取的第一域名ip對應(yīng)關(guān)系集合、第二域名ip對應(yīng)關(guān)系集合和所述第二獲取模塊獲取的第三域名ip對應(yīng)關(guān)系集合進(jìn)行域名ip對應(yīng)關(guān)系融合,得到域名ip對應(yīng)關(guān)系總集;
存活判斷模塊,用于對所述第二融合模塊得到的域名ip對應(yīng)關(guān)系總集中各域名ip對應(yīng)關(guān)系進(jìn)行存活判斷得到存活域名ip對應(yīng)關(guān)系總集并保存。
可選地,所述第一獲取模塊,具體用于:
從備案數(shù)據(jù)、上報(bào)數(shù)據(jù)中獲取第一域名集合;
通過域名系統(tǒng)探針設(shè)備獲取鏡像數(shù)據(jù),在所述鏡像數(shù)據(jù)中提取六元組信息,對所述六元組信息中含有的各域名進(jìn)行降噪去重處理得到第二域名集合,并提取所述六元組信息中含有的各域名ip對應(yīng)關(guān)系得到第一域名ip對應(yīng)關(guān)系集合;
通過采集設(shè)備記錄各預(yù)設(shè)請求的域名及域名ip對應(yīng)關(guān)系得到活躍數(shù)據(jù),對所述活躍數(shù)據(jù)中含有的各域名進(jìn)行降噪去重處理得到第三域名集合,并提取所述活躍數(shù)據(jù)中含有的各域名ip對應(yīng)關(guān)系得到第二域名ip對應(yīng)關(guān)系集合。
可選地,所述第一獲取模塊,包括:第一降噪單元,用于對各域名進(jìn)行降噪去重處理;
可選地,所述第一融合模塊,包括:第二降噪單元,用于對各域名進(jìn)行降噪去重處理;
可選地,所述第二融合模塊,包括:第三降噪單元,用于對各域名ip對應(yīng)關(guān)系進(jìn)行降噪去重處理。
可選地,所述第二獲取模塊,具體用于:使用第一指令撥測所述域名總集中各域名對應(yīng)的ip得到第三域名ip對應(yīng)關(guān)系集合。
可選地,所述存活判斷模塊,包括:第一判斷單元、第二判斷單元、保存單元、移除單元;
所述第一判斷單元,用于依次使用第二指令對所述域名ip對應(yīng)關(guān)系總集中各域名ip對應(yīng)關(guān)系進(jìn)行撥測,判斷是否存在未存活的域名ip對應(yīng)關(guān)系;
所述保存單元,用于當(dāng)所述第一判斷單元判斷出不存在未存活的域名ip對應(yīng)關(guān)系時(shí),將所述域名ip對應(yīng)關(guān)系總集作為存活域名ip對應(yīng)關(guān)系總集并保存;
所述第二判斷單元,用于當(dāng)所述第一判斷單元判斷出存在未存活的域名ip對應(yīng)關(guān)系時(shí),使用第三指令對未存活的域名ip對應(yīng)關(guān)系進(jìn)行撥測,判斷是否存活;
所述移除單元,用于當(dāng)所述第二判斷單元判斷出未存活時(shí),將未存活的域名ip對應(yīng)關(guān)系移除;
所述保存單元,還用于當(dāng)?shù)诙袛鄦卧袛喑龃婊顣r(shí),將所述域名ip對應(yīng)關(guān)系總集作為存活域名ip對應(yīng)關(guān)系總集并保存;還用于在所述移除單元將未存活的域名ip對應(yīng)關(guān)系移除之后,將保留的各域名ip對應(yīng)關(guān)系作為存活域名ip對應(yīng)關(guān)系總集并保存。
本發(fā)明的優(yōu)點(diǎn)在于:
本發(fā)明中,通過采集多方的域名及域名ip對應(yīng)關(guān)系,并對域名及域名ip關(guān)系進(jìn)行融合,保證了域名ip對應(yīng)關(guān)系的全面性;同時(shí)對獲取到的所有域名ip對應(yīng)關(guān)系進(jìn)行存活判斷,保證了保留下來的域名ip對應(yīng)關(guān)系的準(zhǔn)確性。
附圖說明
通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號表示相同的部件。在附圖中:
附圖1為本發(fā)明提供的一種高覆蓋度且準(zhǔn)確的域名ip對應(yīng)關(guān)系獲取方法框架圖;
附圖2為本發(fā)明實(shí)施例一提供的一種高覆蓋度且準(zhǔn)確的域名ip對應(yīng)關(guān)系獲取方法流程圖;
附圖3為本發(fā)明實(shí)施例二提供的一種高覆蓋度且準(zhǔn)確的域名ip對應(yīng)關(guān)系獲取裝置框圖。
具體實(shí)施方式
下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施方式。雖然附圖中顯示了本公開的示例性實(shí)施方式,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施方式所限制。相反,提供這些實(shí)施方式是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
在現(xiàn)有技術(shù)的基礎(chǔ)上,本發(fā)明作出改進(jìn),如圖1所示的框架圖,本發(fā)明中使用dns探針設(shè)備和eu采集設(shè)備分別采集域名并降噪去重,同時(shí)提取域名ip對應(yīng)關(guān)系,以及采集其他數(shù)據(jù)源(備案數(shù)據(jù)、上報(bào)數(shù)據(jù)等)中的域名并降噪去重,對上述降噪去重后的域名進(jìn)行融合并再次降噪去重后,進(jìn)行撥測得到域名ip對應(yīng)關(guān)系,將得到的域名ip對應(yīng)關(guān)系與dns探針設(shè)備和eu采集設(shè)備提取的域名ip對應(yīng)關(guān)系融合并降噪去重處理得到全面的域名ip對應(yīng)關(guān)系,隨后使用httpget和httpsget進(jìn)行存活判斷,剔除不存活的域名ip對應(yīng)關(guān)系,最終得到準(zhǔn)確且全面的域名ip對應(yīng)關(guān)系。
本發(fā)明中的域名ip對應(yīng)關(guān)系,具體為域名和該域名的接入ip的對應(yīng)關(guān)系。
實(shí)施例一
根據(jù)本發(fā)明的實(shí)施方式,提供一種高覆蓋度且準(zhǔn)確的域名ip對應(yīng)關(guān)系獲取方法,如圖2所示,包括:
步驟101:從各數(shù)據(jù)源中獲取第一域名集合,并通過域名系統(tǒng)探針設(shè)備獲取第二域名集合和第一域名ip對應(yīng)關(guān)系集合,通過采集設(shè)備獲取第三域名集合和第二域名ip對應(yīng)關(guān)系集合;
步驟102:對第一域名集合、第二域名集合和第三域名集合進(jìn)行域名融合,得到域名總集,并獲取域名總集中各域名的ip對應(yīng)關(guān)系得到第三域名ip對應(yīng)關(guān)系集合;
步驟103:對第一域名ip對應(yīng)關(guān)系集合、第二域名ip對應(yīng)關(guān)系集合和第三域名ip對應(yīng)關(guān)系集合進(jìn)行域名ip對應(yīng)關(guān)系融合,得到域名ip對應(yīng)關(guān)系總集;
步驟104:對域名ip對應(yīng)關(guān)系總集中各域名ip對應(yīng)關(guān)系進(jìn)行存活判斷得到存活域名ip對應(yīng)關(guān)系總集并保存。
根據(jù)本發(fā)明的實(shí)施方式,步驟101,具體包括:
從備案數(shù)據(jù)、上報(bào)數(shù)據(jù)中獲取第一域名集合;
通過域名系統(tǒng)探針設(shè)備獲取鏡像數(shù)據(jù),在鏡像數(shù)據(jù)中提取六元組信息,對六元組信息中含有的各域名進(jìn)行降噪去重處理得到第二域名集合,并提取六元組信息中含有的各域名ip對應(yīng)關(guān)系得到第一域名ip對應(yīng)關(guān)系集合;
通過采集設(shè)備記錄各預(yù)設(shè)請求的域名及域名ip對應(yīng)關(guān)系得到活躍數(shù)據(jù),對活躍數(shù)據(jù)中含有的各域名進(jìn)行降噪去重處理得到第三域名集合,并提取活躍數(shù)據(jù)中含有的各域名ip對應(yīng)關(guān)系得到第二域名ip對應(yīng)關(guān)系集合。
其中,在鏡像數(shù)據(jù)中提取六元組信息,具體為:在鏡像數(shù)據(jù)中采集udp(英文全稱:userdatagramprotocol;中文全稱:用戶數(shù)據(jù)報(bào)協(xié)議)協(xié)議的響應(yīng)包,從響應(yīng)包中提取dns(英文全稱:domainnamesystem;中文全稱:域名系統(tǒng))六元組集合(cnname、源ip、目的ip、解析ip、域名、訪問時(shí)間);
其中,通過采集設(shè)備記錄各預(yù)設(shè)請求的域名及域名ip對應(yīng)關(guān)系得到活躍數(shù)據(jù),具體為:在運(yùn)營商企業(yè)部署采集設(shè)備,采集設(shè)備采集通過該運(yùn)營商的全部httpget請求,將請求的域名及域名ip對應(yīng)關(guān)系記錄得到活躍數(shù)據(jù)。
優(yōu)選地,在本實(shí)施例中,第一域名ip對應(yīng)關(guān)系集合具體為第一域名ip對應(yīng)關(guān)系表,第二域名ip對應(yīng)關(guān)系集合具體為第二域名ip對應(yīng)關(guān)系表;域名系統(tǒng)探針設(shè)備具體為dns探針設(shè)備;采集設(shè)備具體為eu采集設(shè)備。
根據(jù)本發(fā)明的實(shí)施方式,步驟101中,獲取第一域名集合、第二域名集合和第三域名集合的過程中,還包括:對各域名進(jìn)行降噪去重處理;
根據(jù)本發(fā)明的實(shí)施方式,步驟102中,對第一域名集合、第二域名集合和第三域名集合進(jìn)行域名融合,得到域名總集的過程中,還包括:對各域名進(jìn)行降噪去重處理;
根據(jù)本發(fā)明的實(shí)施方式,步驟103中,對第一域名ip對應(yīng)關(guān)系集合、第二域名ip對應(yīng)關(guān)系集合和第三域名ip對應(yīng)關(guān)系集合進(jìn)行域名ip對應(yīng)關(guān)系融合,得到域名ip對應(yīng)關(guān)系總集的過程中,還包括:對各域名ip對應(yīng)關(guān)系進(jìn)行降噪去重處理。
其中,域名ip對應(yīng)關(guān)系總集,優(yōu)選為域名ip對應(yīng)關(guān)系總表。
根據(jù)本發(fā)明的實(shí)施方式,步驟102中,獲取域名總集中各域名的ip對應(yīng)關(guān)系得到第三域名ip對應(yīng)關(guān)系集合,具體為:使用第一指令撥測域名總集中各域名對應(yīng)的ip得到第三域名ip對應(yīng)關(guān)系集合。
優(yōu)選地,第一指令為nslookup指令;第三域名ip對應(yīng)關(guān)系集合具體為第三域名ip對應(yīng)關(guān)系表。
在本實(shí)施例中,通過撥測操作則能夠彌補(bǔ)當(dāng)前時(shí)間域名系統(tǒng)探針設(shè)備和采集設(shè)備未獲取到的域名ip對應(yīng)關(guān)系,從而可以保證后續(xù)融合后的域名ip對應(yīng)關(guān)系的全面性。
根據(jù)本發(fā)明的實(shí)施方式,步驟104,具體包括:
步驟a1:依次使用第二指令對域名ip對應(yīng)關(guān)系總集中各域名ip對應(yīng)關(guān)系進(jìn)行撥測,判斷是否存在未存活的域名ip對應(yīng)關(guān)系,是則執(zhí)行步驟a2;否則,將域名ip對應(yīng)關(guān)系總集作為存活域名ip對應(yīng)關(guān)系總集并保存;
步驟a2:使用第三指令對未存活的域名ip對應(yīng)關(guān)系進(jìn)行撥測,判斷是否存活,是則將域名ip對應(yīng)關(guān)系總集作為存活域名ip對應(yīng)關(guān)系總集并保存;否則將其移除,并將保留的各域名ip對應(yīng)關(guān)系作為存活域名ip對應(yīng)關(guān)系總集并保存。
更加具體地,步驟104,包括:
步驟b1:讀取域名ip對應(yīng)關(guān)系總表中的第一個(gè)域名ip對應(yīng)關(guān)系,并將其作為當(dāng)前域名ip對應(yīng)關(guān)系;
步驟b2:使用第二指令對當(dāng)前域名ip對應(yīng)關(guān)系進(jìn)行撥測,判斷是否存活,是則執(zhí)行步驟b4;否則執(zhí)行步驟b3;
步驟b3:使用第三指令對當(dāng)前域名ip對應(yīng)關(guān)系進(jìn)行撥測,判斷是否存活,是則將其屬性改為存活,執(zhí)行步驟b4;否則將當(dāng)前域名ip對應(yīng)關(guān)系移除,執(zhí)行步驟b4;
步驟b4:判斷當(dāng)前域名ip對應(yīng)關(guān)系是否為域名ip對應(yīng)關(guān)系總表中的最后一個(gè),是則將當(dāng)前保留的屬性為存活的域名ip對應(yīng)關(guān)系作為存活域名ip對應(yīng)關(guān)系總集并保存;否則讀取當(dāng)前域名ip對應(yīng)關(guān)系的下一個(gè)域名ip對應(yīng)關(guān)系并作為當(dāng)前域名ip對應(yīng)關(guān)系,返回步驟b2。
優(yōu)選地,在本實(shí)施例中,第二指令為httpget請求,撥80端口,當(dāng)接收到的返回值為200時(shí),判定存活,否則判定未存活;第三指令為httpsget請求,撥443端口,當(dāng)接收到的返回值為200時(shí),判定存活,否則判定未存活。
進(jìn)一步地,在本實(shí)施例中,將存活域名ip對應(yīng)關(guān)系總集保存,具體為將存活域名ip對應(yīng)關(guān)系總表入庫,存活域名ip對應(yīng)關(guān)系總表即為全面的準(zhǔn)確的域名ip對應(yīng)關(guān)系數(shù)據(jù)表。
實(shí)施例二
根據(jù)本發(fā)明的實(shí)施方式,提供一種高覆蓋度且準(zhǔn)確的域名ip對應(yīng)關(guān)系獲取裝置,如圖3所示,包括:
第一獲取模塊201,用于從各數(shù)據(jù)源中獲取第一域名集合,并通過域名系統(tǒng)探針設(shè)備獲取第二域名集合和第一域名ip對應(yīng)關(guān)系集合,通過采集設(shè)備獲取第三域名集合和第二域名ip對應(yīng)關(guān)系集合;
第一融合模塊202,用于對第一獲取模塊201獲取的第一域名集合、第二域名集合和第三域名集合進(jìn)行域名融合,得到域名總集;
第二獲取模塊203,用于獲取第一融合模塊202得到的域名總集中各域名的ip對應(yīng)關(guān)系得到第三域名ip對應(yīng)關(guān)系集合;
第二融合模塊204,用于對第一獲取模塊201獲取的第一域名ip對應(yīng)關(guān)系集合、第二域名ip對應(yīng)關(guān)系集合和第二獲取模塊203獲取的第三域名ip對應(yīng)關(guān)系集合進(jìn)行域名ip對應(yīng)關(guān)系融合,得到域名ip對應(yīng)關(guān)系總集;
存活判斷模塊205,用于對第二融合模塊204得到的域名ip對應(yīng)關(guān)系總集中各域名ip對應(yīng)關(guān)系進(jìn)行存活判斷得到存活域名ip對應(yīng)關(guān)系總集并保存。
根據(jù)本發(fā)明的實(shí)施方式,第一獲取模塊201,具體用于:
從備案數(shù)據(jù)、上報(bào)數(shù)據(jù)中獲取第一域名集合;
通過域名系統(tǒng)探針設(shè)備獲取鏡像數(shù)據(jù),在鏡像數(shù)據(jù)中提取六元組信息,對六元組信息中含有的各域名進(jìn)行降噪去重處理得到第二域名集合,并提取六元組信息中含有的各域名ip對應(yīng)關(guān)系得到第一域名ip對應(yīng)關(guān)系集合;
通過采集設(shè)備記錄各預(yù)設(shè)請求的域名及域名ip對應(yīng)關(guān)系得到活躍數(shù)據(jù),對活躍數(shù)據(jù)中含有的各域名進(jìn)行降噪去重處理得到第三域名集合,并提取活躍數(shù)據(jù)中含有的各域名ip對應(yīng)關(guān)系得到第二域名ip對應(yīng)關(guān)系集合。
根據(jù)本發(fā)明的實(shí)施方式,第一獲取模塊201,包括:第一降噪單元,用于對各域名進(jìn)行降噪去重處理;
根據(jù)本發(fā)明的實(shí)施方式,第一融合模塊202,包括:第二降噪單元,用于對各域名進(jìn)行降噪去重處理;
根據(jù)本發(fā)明的實(shí)施方式,第二融合模塊204,包括:第三降噪單元,用于對各域名ip對應(yīng)關(guān)系進(jìn)行降噪去重處理。
根據(jù)本發(fā)明的實(shí)施方式,第二獲取模塊203,具體用于:使用第一指令撥測域名總集中各域名對應(yīng)的ip得到第三域名ip對應(yīng)關(guān)系集合。
根據(jù)本發(fā)明的實(shí)施方式,存活判斷模塊,包括:第一判斷單元、第二判斷單元、保存單元、移除單元;
其中,第一判斷單元,用于依次使用第二指令對域名ip對應(yīng)關(guān)系總集中各域名ip對應(yīng)關(guān)系進(jìn)行撥測,判斷是否存在未存活的域名ip對應(yīng)關(guān)系;
保存單元,用于當(dāng)?shù)谝慌袛鄦卧袛喑霾淮嬖谖创婊畹挠蛎鹖p對應(yīng)關(guān)系時(shí),將域名ip對應(yīng)關(guān)系總集作為存活域名ip對應(yīng)關(guān)系總集并保存;
第二判斷單元,用于當(dāng)?shù)谝慌袛鄦卧袛喑龃嬖谖创婊畹挠蛎鹖p對應(yīng)關(guān)系時(shí),使用第三指令對未存活的域名ip對應(yīng)關(guān)系進(jìn)行撥測,判斷是否存活;
移除單元,用于當(dāng)?shù)诙袛鄦卧袛喑鑫创婊顣r(shí),將未存活的域名ip對應(yīng)關(guān)系移除;
保存單元,還用于當(dāng)?shù)诙袛鄦卧袛喑龃婊顣r(shí),將域名ip對應(yīng)關(guān)系總集作為存活域名ip對應(yīng)關(guān)系總集并保存;還用于在移除單元將未存活的域名ip對應(yīng)關(guān)系移除之后,將保留的各域名ip對應(yīng)關(guān)系作為存活域名ip對應(yīng)關(guān)系總集并保存。
本發(fā)明中,通過采集多方的域名及域名ip對應(yīng)關(guān)系,并對域名及域名ip關(guān)系進(jìn)行融合,保證了域名ip對應(yīng)關(guān)系的全面性;同時(shí)對獲取到的所有域名ip對應(yīng)關(guān)系進(jìn)行存活判斷,保證了保留下來的域名ip對應(yīng)關(guān)系的準(zhǔn)確性。
以上所述,僅為本發(fā)明較佳的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。