本發(fā)明涉及超高精度的IP定位技術(shù)中IP應(yīng)用場(chǎng)景分類技術(shù)領(lǐng)域,具體地,涉及一種IP應(yīng)用場(chǎng)景的分類方法。
背景技術(shù):
IP是互聯(lián)網(wǎng)通信的基礎(chǔ),是互聯(lián)網(wǎng)設(shè)備的標(biāo)識(shí)。全球42億IPV4,IP會(huì)被網(wǎng)絡(luò)運(yùn)營(yíng)商、機(jī)構(gòu)、組織等申請(qǐng)使用,網(wǎng)絡(luò)運(yùn)營(yíng)商又可以將IP用于做企業(yè)專線、住宅用戶等業(yè)務(wù),所以每個(gè)IP都有其相應(yīng)的用途即應(yīng)用場(chǎng)景。
IP應(yīng)用場(chǎng)景類型的確定,首先可以幫助IP地理位置定位系統(tǒng),根據(jù)不同類型IP采取不同的定位策略,提高IP定位結(jié)果準(zhǔn)確性,提供更好的IP地理位置定位服務(wù);其次,結(jié)合IP應(yīng)用場(chǎng)景和用戶的網(wǎng)絡(luò)行為軌跡,可以對(duì)其進(jìn)行用戶畫像,從而給用戶提供更好的上網(wǎng)服務(wù)。
目前,對(duì)IP應(yīng)用場(chǎng)景的分類,相關(guān)行業(yè)研究和技術(shù)并沒有統(tǒng)一標(biāo)準(zhǔn)。市場(chǎng)上,有公司將IP分為咖啡館、網(wǎng)吧等,這種分類方法只是根據(jù)IP地理位置采集方式來(lái)確定IP的應(yīng)用場(chǎng)景,表述IP被用到什么地方,并不能真實(shí)描述IP是如何被使用的。
為了能夠?qū)P的應(yīng)用場(chǎng)景進(jìn)行準(zhǔn)確的分類,有必要提出一套完整的IP應(yīng)用場(chǎng)景分類方法,供學(xué)術(shù)研究和商業(yè)產(chǎn)品使用。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于,針對(duì)上述問題,提出一種IP應(yīng)用場(chǎng)景的分類方法,以實(shí)現(xiàn)對(duì)IP應(yīng)用場(chǎng)景的準(zhǔn)確分類。
為實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案是:一種IP應(yīng)用場(chǎng)景的分類方法,主要包括以下步驟:
A、獲取與IP相關(guān)的AS和Whois數(shù)據(jù)信息;
B、根據(jù)IP所屬的網(wǎng)絡(luò)服務(wù)商,對(duì)IP的應(yīng)用場(chǎng)景初步分類;
C、根據(jù)IP的網(wǎng)絡(luò)特征,對(duì)IP的應(yīng)用場(chǎng)景進(jìn)一步分類;
進(jìn)一步地,所述步驟A具體為通過(guò)分布式網(wǎng)絡(luò)爬蟲技術(shù),獲取每個(gè)IP對(duì)應(yīng)的AS和Whois數(shù)據(jù)信息。
進(jìn)一步地,所述步驟B具體為,利用數(shù)據(jù)挖掘中的分詞技術(shù),對(duì)網(wǎng)絡(luò)服務(wù)商的業(yè)務(wù)關(guān)鍵詞進(jìn)行學(xué)習(xí),對(duì)IP應(yīng)用場(chǎng)景初步分類為數(shù)據(jù)中心、學(xué)校、機(jī)構(gòu)和網(wǎng)絡(luò)運(yùn)營(yíng)商。
進(jìn)一步地,所述步驟C具體為,利用大數(shù)據(jù)挖掘技術(shù),分析IP的網(wǎng)絡(luò)特征,建立IP應(yīng)用場(chǎng)景數(shù)據(jù)模型,利用機(jī)器學(xué)習(xí)技術(shù)對(duì)IP應(yīng)用場(chǎng)景進(jìn)行分類,對(duì)網(wǎng)絡(luò)運(yùn)營(yíng)商的IP進(jìn)一步分類細(xì)分,最終將網(wǎng)絡(luò)運(yùn)營(yíng)商的IP分為基礎(chǔ)設(shè)施、企業(yè)專線、住宅用戶、移動(dòng)網(wǎng)絡(luò)、WLAN和衛(wèi)星。
進(jìn)一步地,所述IP的網(wǎng)絡(luò)特征包括IP塊大小、活I(lǐng)P率、地理覆蓋范圍、時(shí)延大小、路由匯聚情況和與骨干網(wǎng)距離。
本發(fā)明各實(shí)施例的一種IP應(yīng)用場(chǎng)景的分類方法,由于主要包括:從IP所屬的服務(wù)商出發(fā),根據(jù)IP的網(wǎng)絡(luò)特征,將IP按應(yīng)用場(chǎng)景進(jìn)行分類;從而可以克服現(xiàn)有技術(shù)中對(duì)IP應(yīng)用場(chǎng)景分類方法不確定,IP應(yīng)用場(chǎng)景分類不準(zhǔn)確的缺陷。
本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說(shuō)明書中闡述,并且,部分地從說(shuō)明書中變得顯而易見,或者通過(guò)實(shí)施本發(fā)明而了解。
下面通過(guò)實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
具體實(shí)施方式
以下對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行說(shuō)明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實(shí)施例僅用于說(shuō)明和解釋本發(fā)明,并不用于限定本發(fā)明。
具體地,一種IP應(yīng)用場(chǎng)景的分類方法,包括:
A、獲取與IP相關(guān)的AS和Whois數(shù)據(jù)信息;
B、根據(jù)IP所屬的網(wǎng)絡(luò)服務(wù)商,對(duì)IP的應(yīng)用場(chǎng)景初步分類;
C、根據(jù)IP的網(wǎng)絡(luò)特征,對(duì)IP的應(yīng)用場(chǎng)景進(jìn)一步分類;
所述步驟A具體為通過(guò)分布式網(wǎng)絡(luò)爬蟲技術(shù),獲取并得到每個(gè)IP對(duì)應(yīng)的AS和Whois數(shù)據(jù)信息。
所述步驟B具體為,利用數(shù)據(jù)挖掘中的分詞技術(shù),對(duì)網(wǎng)絡(luò)服務(wù)商的業(yè)務(wù)關(guān)鍵詞進(jìn)行學(xué)習(xí),對(duì)IP應(yīng)用場(chǎng)景初步分類為數(shù)據(jù)中心、學(xué)校、機(jī)構(gòu)和網(wǎng)絡(luò)運(yùn)營(yíng)商。
所述步驟C具體為,利用大數(shù)據(jù)挖掘技術(shù),分析IP的網(wǎng)絡(luò)特征,建立IP應(yīng)用場(chǎng)景數(shù)據(jù)模型,利用機(jī)器學(xué)習(xí)技術(shù)對(duì)IP應(yīng)用場(chǎng)景進(jìn)行分類,對(duì)網(wǎng)絡(luò)運(yùn)營(yíng)商的IP進(jìn)一步分類細(xì)分,最終將網(wǎng)絡(luò)運(yùn)營(yíng)商的IP分為基礎(chǔ)設(shè)施、企業(yè)專線、住宅用戶、移動(dòng)網(wǎng)絡(luò)、WLAN和衛(wèi)星。
所述IP的網(wǎng)絡(luò)特征包括IP塊大小、活I(lǐng)P率、地理覆蓋范圍、時(shí)延大小、路由匯聚情況和與骨干網(wǎng)距離。
本發(fā)明針對(duì)IP應(yīng)用場(chǎng)景分類方法不確定的問題,提供一套完整的IP應(yīng)用場(chǎng)景分類方法,從IP所屬的服務(wù)商出發(fā),根據(jù)IP的活躍程度(活I(lǐng)P率)、地理覆蓋范圍、時(shí)延大小等網(wǎng)絡(luò)特征,將IP的應(yīng)用場(chǎng)景進(jìn)行分類。
為解決上述問題,本發(fā)明是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的:
一套完整的IP應(yīng)用場(chǎng)景分類方法,包含以下步驟:
步驟1、獲取IP相關(guān)數(shù)據(jù)信息;
該步驟通過(guò)分布式網(wǎng)絡(luò)爬蟲技術(shù),對(duì)IP相關(guān)的AS、Whois等信息進(jìn)行獲取。
步驟2、根據(jù)IP所屬的網(wǎng)絡(luò)服務(wù)商,初步給出IP的應(yīng)用場(chǎng)景;
該步驟利用數(shù)據(jù)挖掘中的分詞技術(shù),對(duì)網(wǎng)絡(luò)運(yùn)營(yíng)商的業(yè)務(wù)關(guān)鍵字進(jìn)行學(xué)習(xí),對(duì)IP應(yīng)用場(chǎng)景進(jìn)行數(shù)據(jù)中心、學(xué)校、機(jī)構(gòu)和網(wǎng)絡(luò)運(yùn)營(yíng)商的劃分。
步驟3、根據(jù)IP的網(wǎng)絡(luò)特征,對(duì)網(wǎng)絡(luò)運(yùn)營(yíng)商IP的應(yīng)用場(chǎng)景進(jìn)行細(xì)分;
該步驟利用大數(shù)據(jù)挖掘技術(shù),結(jié)合步驟2的分類,分析IP的網(wǎng)絡(luò)特征,建立IP應(yīng)用場(chǎng)景數(shù)據(jù)模型,然后利用機(jī)器學(xué)習(xí)技術(shù)對(duì)IP應(yīng)用場(chǎng)景進(jìn)行分類,將網(wǎng)絡(luò)運(yùn)營(yíng)商的IP進(jìn)行細(xì)分,最終將IP分為學(xué)校、數(shù)據(jù)中心、機(jī)構(gòu)、基礎(chǔ)設(shè)施、企業(yè)專線、住宅用戶、移動(dòng)網(wǎng)絡(luò)、WLAN和衛(wèi)星。
與現(xiàn)有技術(shù)相比,本發(fā)明首次根據(jù)IP用途,對(duì)IP的應(yīng)用場(chǎng)景進(jìn)行分類,并提出一套完整的IP應(yīng)用場(chǎng)景分類方法。
在表1中,分別列出不同應(yīng)用場(chǎng)景IP的網(wǎng)絡(luò)特征。如活I(lǐng)P率,說(shuō)明該類IP的活躍情況,如企業(yè)專線、數(shù)據(jù)中心、移動(dòng)網(wǎng)絡(luò),其IP更多的是在較穩(wěn)定的在線狀態(tài),即靜態(tài)分配,而住宅用戶是動(dòng)態(tài)分配,處在較不穩(wěn)定在線狀態(tài);時(shí)延大小、距離骨干網(wǎng)遠(yuǎn)近,說(shuō)明網(wǎng)絡(luò)狀況,數(shù)據(jù)中心提供網(wǎng)絡(luò)服務(wù)時(shí)延小,企業(yè)專線是光纖,住宅用戶使用ADSL,時(shí)延稍大,移動(dòng)網(wǎng)絡(luò)涉及到切換網(wǎng)絡(luò),會(huì)使時(shí)延變大。
表1 IP的9類用途及其特征
結(jié)合真實(shí)數(shù)據(jù)集,對(duì)本發(fā)明進(jìn)行進(jìn)一步說(shuō)明。數(shù)據(jù)集是全球IPV4,以3個(gè)IP舉例,如表2所示。
表2 IP信息列表
步驟1、獲取IP對(duì)應(yīng)的AS及公司名稱;
通過(guò)分布式網(wǎng)絡(luò)爬蟲,獲取IP的AS和Whois信息(網(wǎng)絡(luò)公開數(shù)據(jù)),得到表2中每個(gè)IP對(duì)應(yīng)的AS及其對(duì)應(yīng)的公司名稱。
步驟2、根據(jù)AS及公司名稱中的關(guān)鍵字,利用數(shù)據(jù)挖掘的分詞技術(shù),初步給出應(yīng)用場(chǎng)景。由于2.2.2.2和3.3.3.3分別對(duì)應(yīng)的是學(xué)校(包含學(xué)校字樣)和數(shù)據(jù)中心(包含托管服務(wù)字樣),所以該IP的應(yīng)用場(chǎng)景已經(jīng)確定,而1.1.1.1初步判斷為網(wǎng)絡(luò)運(yùn)營(yíng)商。
步驟3、通過(guò)分析應(yīng)用場(chǎng)景的網(wǎng)絡(luò)特征,建立9類應(yīng)用場(chǎng)景的數(shù)據(jù)特征模型,然后利用機(jī)器學(xué)習(xí),分析1.1.1.1的網(wǎng)絡(luò)特征,發(fā)現(xiàn)其符合住宅用戶的IP類型特征,則將該IP進(jìn)一步劃分為住宅用戶。
經(jīng)過(guò)上面3個(gè)步驟,最終將IP進(jìn)行應(yīng)用場(chǎng)景分類為學(xué)校、數(shù)據(jù)中心、機(jī)構(gòu)、基礎(chǔ)設(shè)施、企業(yè)專線、住宅用戶、移動(dòng)網(wǎng)絡(luò)、WLAN和衛(wèi)星。
至少可以達(dá)到以下有益效果:克服現(xiàn)有技術(shù)中對(duì)IP應(yīng)用場(chǎng)景分類方法不確定,IP應(yīng)用場(chǎng)景分類不準(zhǔn)確的缺陷,實(shí)現(xiàn)對(duì)IP應(yīng)用場(chǎng)景的準(zhǔn)確分類,
最后應(yīng)說(shuō)明的是:以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。