亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

作弊渠道的自動檢測方法及裝置與流程

文檔序號:12271183閱讀:335來源:國知局
作弊渠道的自動檢測方法及裝置與流程

本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種作弊渠道的自動檢測方法及裝置。



背景技術(shù):

隨著手機(jī)應(yīng)用軟件在各種渠道平臺上的推廣,有的渠道商為了騙取手機(jī)應(yīng)用軟件提供商的推廣費(fèi)用而想方設(shè)法制造大量虛假用戶。在該利益的驅(qū)動下,刷量工具應(yīng)運(yùn)而生。為了保護(hù)手機(jī)應(yīng)用軟件提供商的利益不受非法手段的侵害,也為了保證網(wǎng)絡(luò)數(shù)據(jù)的安全性,找到能夠有效自動檢測渠道是否使用刷量工具進(jìn)行作弊的方法刻不容緩。

現(xiàn)有的檢測刷量工具的方法主要有兩種,一種是通過檢測當(dāng)前渠道下已有手機(jī)設(shè)備硬件屬性的分布是否正常,來判斷當(dāng)前渠道是否使用了刷量工具;另一種是針對刷量工具生成虛假新增用戶的特點(diǎn),基于計算渠道的留存率來檢測當(dāng)前渠道是否使用了刷量工具。

然而,上述兩種檢測方法雖能在一定程度上檢測到渠道是否使用刷量工具,但還存在以下問題:

1、有的刷量工具會基于各個硬件接入環(huán)境屬性在真實(shí)情況下的分布來生成,使得所生成的虛假用戶屬性信息與正常渠道下的真實(shí)用戶屬性分布一致,導(dǎo)致不能檢測出該情況下的作弊渠道;

2、由于各個渠道的質(zhì)量有差別,留存率更多的作為評價渠道質(zhì)量的指標(biāo),或者用來驗(yàn)證通過其他檢測方法發(fā)現(xiàn)的可疑作弊渠道;單獨(dú)因?yàn)榱舸媛十惓>团卸ㄇ雷鞅?,也會面臨產(chǎn)品部門和渠道方面的挑戰(zhàn)。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明實(shí)施例的主要目的是提供一種作弊渠道的自動檢測方法及裝置,旨在更為有效地檢測出渠道是否作弊。

為實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例提供了一種作弊渠道的自動檢測方法,包括以下步驟:

監(jiān)測每個渠道的所有可疑IP3段,所述IP3段是IP地址的前3段;

獲取存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)的用戶屬性;

根據(jù)所獲取的存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)的用戶屬性,判斷存在可疑IP3段的渠道是否為作弊渠道。

此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供了一種作弊渠道的自動檢測裝置,包括:

可疑IP3段監(jiān)測模塊,用于監(jiān)測每個渠道的所有可疑IP3段;

用戶屬性統(tǒng)計模塊,用于獲取存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)的用戶屬性;

渠道作弊判斷模塊,用于根據(jù)所獲取的存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)的用戶屬性,判斷存在可疑IP3段的渠道是否為作弊渠道。

本發(fā)明實(shí)施例是根據(jù)新增用戶訪問的接入IP地址信息生成預(yù)設(shè)格式的數(shù)據(jù)記錄,通過統(tǒng)計所述數(shù)據(jù)記錄進(jìn)而判斷渠道是否作弊,與采用用戶的硬件接入環(huán)境屬性或計算留存率的作弊渠道檢測方法相比,能夠更為有效地檢測出渠道是否作弊。

附圖說明

圖1是本發(fā)明一種作弊渠道的自動檢測方法的應(yīng)用場景示意圖;

圖2是本發(fā)明一種作弊渠道的自動檢測方法的流程示意圖;

圖3是本發(fā)明一種作弊渠道的自動檢測方法中監(jiān)測獲得每個渠道的可疑IP3段集合的細(xì)化流程示意圖;

圖4是本發(fā)明一種作弊渠道的自動檢測方法中處理獲得存在可疑IP3段的渠道的用戶屬性第一實(shí)施例的細(xì)化流程示意圖;

圖5是本發(fā)明一種作弊渠道的自動檢測方法中處理獲得存在可疑IP3段的渠道的用戶屬性第三實(shí)施例的細(xì)化流程示意圖;

圖6是本發(fā)明一種作弊渠道的自動檢測方法中自動獲取新增用戶接入 數(shù)據(jù)并處理獲得數(shù)據(jù)記錄的細(xì)化流程示意圖;

圖7是本發(fā)明一種作弊渠道的自動檢測裝置的功能模塊示意圖。

本發(fā)明目的的實(shí)現(xiàn)、功能特點(diǎn)及優(yōu)點(diǎn)將結(jié)合實(shí)施例,參照附圖做進(jìn)一步說明。

具體實(shí)施方式

以下結(jié)合說明書附圖及具體實(shí)施例進(jìn)一步說明本發(fā)明的技術(shù)方案。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

本發(fā)明提出一種作弊渠道的自動檢測方法,該方法能夠自動獲取所有新增用戶訪問的接入數(shù)據(jù),監(jiān)測每個渠道的所有可疑IP3段,并獲取存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)的用戶屬性,然后根據(jù)所獲取的存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)的用戶屬性,判斷存在可疑IP3段的渠道是否為作弊渠道。本發(fā)明是根據(jù)新增用戶訪問的接入IP地址信息生成預(yù)設(shè)格式的數(shù)據(jù)記錄,通過統(tǒng)計所述數(shù)據(jù)記錄進(jìn)而判斷渠道是否作弊,與采用用戶的硬件接入環(huán)境屬性或計算留存率(登陸用戶數(shù)與新增用戶數(shù)的百分比)的作弊渠道檢測方法相比,能夠更為有效地檢測出渠道是否作弊。

所述渠道可以是擁有大量應(yīng)用和用戶,并能夠?qū)@些應(yīng)用進(jìn)行流量分發(fā)的平臺,也可以是能夠獲取應(yīng)用用戶的平臺。所述應(yīng)用可以是手機(jī)游戲,也可以是其他手機(jī)應(yīng)用軟件,由內(nèi)容提供商提供。所述內(nèi)容提供商可以是制作手機(jī)游戲產(chǎn)品或手機(jī)其他應(yīng)用軟件的公司或團(tuán)隊。

渠道通過向用戶成功推廣使用應(yīng)用軟件而從該應(yīng)用軟件的內(nèi)容提供商那里獲得推廣費(fèi)用。所述渠道獲得內(nèi)容提供商的推廣費(fèi)用包括兩種情況:第一種是指注冊,即每有一個用戶注冊了游戲賬號或應(yīng)用賬號后,內(nèi)容提供商付給渠道一個費(fèi)用;第二種是指聯(lián)網(wǎng)激活,即每有一個用戶聯(lián)網(wǎng)登錄了游戲或應(yīng)用后,內(nèi)容提供商付給渠道一個費(fèi)用。然而有的渠道為了騙取內(nèi)容提供商的推廣費(fèi)用,而采用通過刷量工具來制造假用戶的作弊方式。

所述刷量工具是指安裝在手機(jī)上的能夠生成虛假新用戶的應(yīng)用,這類應(yīng)用可以隨機(jī)或基于已有用戶數(shù)據(jù)文件,生成手機(jī)設(shè)備號IMEI(即International Mobile Equipment Identity,是國際移動設(shè)備身份碼的縮寫,是由15位數(shù)字組 成的“電子串號”,每一個手機(jī)在組裝完成后都將被賦予一個全球唯一的一組號碼,這個號碼從生產(chǎn)到交付使用都將被制造生產(chǎn)的廠商所記錄)、IMSI(即International Mobile Subscriber Identification Number,是區(qū)別移動用戶的標(biāo)志,儲存在用戶身份識別SIM卡中,可用于區(qū)別移動用戶的有效信息)、MAC地址(Media Access Control,媒體訪問控制,或稱為物理地址、硬件地址)、屏幕分辨率、機(jī)型、SIM卡(即Subscriber Identity Module,客戶識別模塊,也稱為用戶身份識別卡)號、手機(jī)號、運(yùn)營商編號或名稱、手機(jī)操作系統(tǒng)版本等各種參數(shù),其中,每個不同的IMEI代表一個新的用戶。

如圖1所示,示出了本發(fā)明一種作弊渠道的自動檢測方法的一個應(yīng)用場景示例,包括:

終端110通過渠道120獲得推廣的應(yīng)用軟件;

所述終端110上運(yùn)行已安裝的所述應(yīng)用軟件并在請求應(yīng)用數(shù)據(jù)時,向所述服務(wù)器130上報信息;

所述服務(wù)器130根據(jù)所述獲得的上報信息對所述渠道120進(jìn)行作弊檢測。

其中,所述終端110主要指手機(jī)設(shè)備,也可以是能夠模擬手機(jī)操作的電腦;所述渠道120可以為應(yīng)用分發(fā)平臺,也可以是網(wǎng)頁廣告位推薦平臺,還可以是安裝軟件廣告位推薦平臺;所述服務(wù)器130是用來進(jìn)行作弊渠道自動檢測的服務(wù)器,該服務(wù)器可以是提供用戶訪問所需應(yīng)用數(shù)據(jù)的后臺服務(wù)器,也可以是一個采集用戶行為的獨(dú)立服務(wù)器;所述應(yīng)用軟件中存儲有該應(yīng)用來源所屬的渠道信息。

安裝有所述應(yīng)用軟件的終端110向所述服務(wù)器130上報的信息包括用戶名信息、接入IP地址信息、渠道信息,也可以包括其他信息,例如,用戶在應(yīng)用軟件上的動作信息、用戶請求的數(shù)據(jù)信息等。

本發(fā)明的應(yīng)用場景不局限于上述應(yīng)用場景示例,還可用于其他通過網(wǎng)絡(luò)訪問服務(wù)器的場景,應(yīng)用比較廣泛。

進(jìn)一步地,如圖2所示,示出了本發(fā)明一種作弊渠道的自動檢測方法的一個實(shí)施例。所述作弊渠道的自動檢測方法包括以下步驟:

S201、監(jiān)測每個渠道的所有可疑IP3段;

所述每個渠道的所有可疑IP3段是根據(jù)所有新增用戶訪問的接入數(shù)據(jù)處 理獲得。所述接入數(shù)據(jù)包括IP協(xié)議中的IP地址,該IP地址的表示被分為4段,每段的二進(jìn)制轉(zhuǎn)成十進(jìn)制,中間用小數(shù)點(diǎn)隔開;所述IP3段是指所述IP地址表示方式中對應(yīng)的前3段,例如,32位IP地址中的前3個字節(jié)。每個渠道的所有可疑IP3段可組成一個可疑IP3段集合。

S202、獲取存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)的用戶屬性;

所述存在可疑IP3段的渠道是指該渠道的可疑IP3段集合不為空。

所述第一預(yù)設(shè)時間為一個預(yù)設(shè)的起始時間點(diǎn)和一個預(yù)設(shè)的結(jié)束時間點(diǎn)之間的時間段,所述預(yù)設(shè)的結(jié)束時間點(diǎn)由預(yù)設(shè)的起始時間點(diǎn)開始往回計算第一時間閾值。例如,本實(shí)施例的第一預(yù)設(shè)時間中,假設(shè)第一時間閾值為24小時,若預(yù)設(shè)的起始時間點(diǎn)為當(dāng)天0點(diǎn),則預(yù)設(shè)的結(jié)束時間點(diǎn)為當(dāng)天的前一天的0點(diǎn);或者預(yù)設(shè)的起始時間點(diǎn)為當(dāng)天5點(diǎn),則預(yù)設(shè)的結(jié)束時間點(diǎn)為當(dāng)天的前一天的5點(diǎn)。當(dāng)然,所述第一時間閾值可以為其他值,例如12小時等等。若第一時間閾值為24小時,則本實(shí)施例中將統(tǒng)計從距離當(dāng)前時間點(diǎn)最近的過去一天內(nèi)存在可疑IP3段的渠道的用戶屬性。

所述存在可疑IP3段的用戶屬性可包括存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)的所有新增用戶總數(shù)量、存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)所有可疑IP3段下新增用戶的總數(shù)量、存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)所有可疑IP3段下的新增用戶總數(shù)量在該渠道所有新增用戶總數(shù)量中的占比、存在可疑IP3段的渠道中新增用戶數(shù)量最大的可疑IP3段的數(shù)量、存在可疑IP3段的渠道中新增用戶數(shù)量最大的可疑IP3段的數(shù)量在該渠道所有新增用戶總數(shù)量中的占比。

S203、根據(jù)所獲取的存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)的用戶屬性,判斷存在可疑IP3段的渠道是否為作弊渠道。

本發(fā)明根據(jù)新增用戶訪問的接入IP地址信息通過統(tǒng)計進(jìn)而判斷渠道是否作弊,能夠更為有效地檢測出渠道是否作弊。

進(jìn)一步地,如圖3所示,示出了本發(fā)明一種作弊渠道的自動檢測方法中監(jiān)測獲得每個渠道的可疑IP3段集合的一個實(shí)施例,即上述步驟S201具體包括以下步驟:

S301、獲取第二預(yù)設(shè)時間內(nèi)利用當(dāng)前渠道進(jìn)行接入的所有新增用戶中同 一IP3段下的用戶數(shù)量;

所述第二預(yù)設(shè)時間為一個預(yù)設(shè)的起始時間點(diǎn)和一個預(yù)設(shè)的結(jié)束時間點(diǎn)之間的時間段,該預(yù)設(shè)的結(jié)束時間點(diǎn)由預(yù)設(shè)的起始時間點(diǎn)開始往回計算第二時間閾值。例如,本實(shí)施例的第二預(yù)設(shè)時間中,假設(shè)第二時間閾值為n×24小時(n是一個自然數(shù),取值可以是7、14、30等),若預(yù)設(shè)的起始時間點(diǎn)為當(dāng)天0點(diǎn),則預(yù)設(shè)的結(jié)束時間點(diǎn)為當(dāng)天的前n天的0點(diǎn);或者預(yù)設(shè)的起始時間點(diǎn)為當(dāng)天5點(diǎn),則預(yù)設(shè)的結(jié)束時間點(diǎn)為當(dāng)天的前n天的5點(diǎn)。若第二時間閾值為n×24小時,則本實(shí)施例中將統(tǒng)計從距離當(dāng)前時間點(diǎn)最近的過去n天內(nèi)利用當(dāng)前渠道進(jìn)行接入的所有新增用戶中同一IP3段下的用戶總數(shù)量。

根據(jù)在第二預(yù)設(shè)時間內(nèi)每個渠道下的所有數(shù)據(jù)記錄,統(tǒng)計當(dāng)前渠道的每個IP3段下的用戶總數(shù)量。其中,所述數(shù)據(jù)記錄是根據(jù)自動獲取的所有新增用戶的接入數(shù)據(jù),按照預(yù)設(shè)格式“渠道/用戶/IP3段”生成,用于可疑IP3段的監(jiān)測及用戶屬性的獲取。

S302、判斷同一IP3段下的新增用戶的數(shù)量是否大于或等于第一預(yù)設(shè)閾值;

所述第一預(yù)設(shè)閾值可以是一個固定值,根據(jù)數(shù)據(jù)的實(shí)際分布情況通過統(tǒng)計分析而采用合適的數(shù)值。

S303、當(dāng)同一IP3段下的新增用戶的數(shù)量大于或等于第一預(yù)設(shè)閾值時,確定該IP3段為可疑IP3段,并將該IP3段增加到對應(yīng)渠道的可疑IP3段集合;

本實(shí)施例中該第一預(yù)設(shè)閾值取值為80,即當(dāng)一個渠道的一個IP3段在第二預(yù)設(shè)時間內(nèi)累計產(chǎn)生的新增用戶數(shù)量大于或等于80時,則認(rèn)為該IP3段是該渠道的一個可疑IP3段。

一個渠道下的所有可疑IP3段可組成一個可疑IP3段集合。如果所述渠道的可疑IP3段集合不為空,則該渠道的可疑IP3段集合作為被監(jiān)控對象參與該渠道的用戶屬性獲取及渠道作弊判斷的操作;如果所述渠道的可疑IP3段集合為空,則說明該渠道的所有IP3段下新增用戶數(shù)量的增長符合常態(tài),此時,該渠道無需參與之后的渠道用戶屬性獲取及渠道作弊判斷的操作。

S304、當(dāng)同一IP3段下的新增用戶的數(shù)量小于第一預(yù)設(shè)閾值時,轉(zhuǎn)入步驟S301。

當(dāng)同一IP3段下的新增用戶的數(shù)量小于第一預(yù)設(shè)閾值時,則該IP3段不是可疑IP3段,此時轉(zhuǎn)入步驟S301進(jìn)行同一渠道或不同渠道的其他IP3段下新增用戶數(shù)量的統(tǒng)計。

本發(fā)明根據(jù)生成的數(shù)據(jù)記錄通過統(tǒng)計第二預(yù)設(shè)時間內(nèi)每個渠道下每個IP3段的新增用戶數(shù)量,結(jié)合預(yù)設(shè)的一個合適閾值即能判斷并獲得每個渠道的可疑IP3段集合,方法簡單、有效。

進(jìn)一步地,如圖4所示,示出了本發(fā)明一種作弊渠道的自動檢測方法中處理獲得存在可疑IP3段的渠道的用戶屬性的第一實(shí)施例,即上述步驟S202具體包括以下步驟:

S401、對于每一個存在可疑IP3段的渠道,獲取存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)所有新增用戶的總數(shù)量;

所述存在可疑IP3段的渠道,是指所述渠道對應(yīng)的可疑IP3段集合不為空。對于每一個渠道,首先判斷該渠道的可疑IP3段集合是否為空;如果所述渠道的可疑IP3段不為空,則根據(jù)生成的所述數(shù)據(jù)記錄統(tǒng)計該渠道在第一預(yù)設(shè)時間內(nèi)所有新增用戶的總數(shù)量;如果所述渠道的可疑IP3段集合為空,則跳過該渠道進(jìn)入下一個渠道的上述操作。

S402、獲取所述存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)所有可疑IP3段下新增用戶的總數(shù)量;

所述存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)所有可疑IP3段下新增用戶的總數(shù)量,是根據(jù)生成的所述數(shù)據(jù)記錄及所述渠道的可疑IP3段集合,通過統(tǒng)計該渠道在第一預(yù)設(shè)時間內(nèi)所有可疑IP3段下新增用戶數(shù)量的總和而獲得。

S403、根據(jù)步驟S401和步驟S402中獲取的信息,獲取所述存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)所有可疑IP3段下的新增用戶總數(shù)量在所述渠道所有新增用戶總數(shù)量中的占比;

S404、判斷所述存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)所有可疑IP3段下的新增用戶總數(shù)量在該渠道所有新增用戶總數(shù)量中的占比是否大于或等于第三預(yù)設(shè)閾值;若是,則轉(zhuǎn)入步驟S405;若否,則轉(zhuǎn)入步驟406;

所述第三預(yù)設(shè)閾值是基于大量統(tǒng)計分析而選取的一個閾值,可根據(jù)數(shù)據(jù) 的具體分布情況而定。

S405、確定該渠道為作弊渠道,并結(jié)束本次判斷操作;

所述結(jié)束本次判斷操作,是指結(jié)束所述渠道的判斷操作然后進(jìn)入下一個存在可疑IP3段的渠道的作弊判斷操作;如果所述渠道是最后一個進(jìn)行作弊判斷操作的對象,則結(jié)束本次作弊渠道自動檢測操作并給出檢測結(jié)果。

S406、確定該渠道不是作弊渠道,并結(jié)束本次判斷操作。

第二實(shí)施例中,在上述步驟S401之后,也可以根據(jù)第二判斷規(guī)則判斷渠道是否作弊,即判斷所述存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)所有可疑IP3段下新增用戶的總數(shù)量是否大于或等于第二預(yù)設(shè)閾值,若是,則轉(zhuǎn)入上述步驟S405,若否,則轉(zhuǎn)入上述步驟S406。其中,所述第二預(yù)設(shè)閾值是基于大量統(tǒng)計分析而選取的一個閾值,可根據(jù)數(shù)據(jù)的具體分布情況而定。

本發(fā)明提出的存在可疑IP3段的渠道的用戶屬性能夠較好地反映渠道中新增用戶數(shù)量的分布情況,便于分析渠道中新增用戶數(shù)量的增長情況;提出的根據(jù)存在可疑IP3段的渠道的用戶屬性及預(yù)設(shè)的通過大量統(tǒng)計分析獲得的合適閾值來判斷渠道是否作弊的方法,能夠直觀地從數(shù)據(jù)上判斷得出渠道是否作弊。

進(jìn)一步地,如圖5所示,示出了本發(fā)明一種作弊渠道的自動檢測方法中處理獲得存在可疑IP3段的渠道的用戶屬性的第三實(shí)施例,即上述步驟S202具體還可以包括以下步驟:

S501、對于每一個存在可疑IP3段的渠道,獲取存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)所有新增用戶的總數(shù)量;

S502、獲取所述存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)新增用戶數(shù)量最大的可疑IP3段的數(shù)量;

所述存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)新增用戶數(shù)量最大的可疑IP3段的數(shù)量,是根據(jù)生成的所述數(shù)據(jù)記錄及所述渠道的可疑IP3段集合,通過分別統(tǒng)計該渠道的每個可疑IP3段下新增用戶數(shù)量,并比較所述渠道的每個可疑IP3段下新增用戶數(shù)量的大小而獲得。

S503、根據(jù)步驟S501和步驟S502中獲取的信息,獲取所述存在可疑IP3段的渠道中新增用戶數(shù)量最大的可疑IP3段的數(shù)量在該渠道所有新增用戶總 數(shù)量中的占比;

S504、判斷所述存在可疑IP3段的渠道中新增用戶數(shù)量最大的可疑IP3段的數(shù)量在該渠道所有新增用戶數(shù)量中的占比是否大于或等于第五預(yù)設(shè)閾值;若是,則轉(zhuǎn)入步驟S505;若否,則轉(zhuǎn)入步驟506;

所述第五預(yù)設(shè)閾值是基于大量統(tǒng)計分析而選取的一個閾值,可根據(jù)數(shù)據(jù)的具體分布情況而定。

S505、確定該渠道為作弊渠道,并結(jié)束本次判斷操作;

所述結(jié)束本次判斷操作,是指結(jié)束所述渠道的判斷操作然后進(jìn)入下一個存在可疑IP3段的渠道的作弊判斷操作;如果所述渠道是最后一個進(jìn)行作弊判斷操作的對象,則結(jié)束本次作弊渠道自動檢測操作并給出檢測結(jié)果。

S506、確定該渠道不是作弊渠道,并結(jié)束本次判斷操作。

第四實(shí)施例中,在上述步驟S502之后,還可以根據(jù)第四判斷規(guī)則判斷渠道是否作弊,即判斷所述存在可疑IP3段的渠道中新增用戶數(shù)量最大的可疑IP3段的數(shù)量是否大于或等于第四預(yù)設(shè)閾值,若是,則轉(zhuǎn)入上述步驟S505;若否,則轉(zhuǎn)入上述步驟S506。其中,所述第四預(yù)設(shè)閾值是基于大量統(tǒng)計分析而選取的一個閾值,可根據(jù)數(shù)據(jù)的具體分布情況而定。

可以想象,還可以有這樣的一些實(shí)施例:根據(jù)第一實(shí)施例中步驟S404的第一判斷規(guī)則和第二實(shí)施例中的第二判斷規(guī)則、第三實(shí)施例中步驟S504的第三判斷規(guī)則、第四實(shí)施例中的第四判斷規(guī)則可以進(jìn)行任意2個判斷規(guī)則或任意3個判斷規(guī)則或任意4個判斷規(guī)則的任意先后順序的組合對渠道進(jìn)行作弊檢測。在這些實(shí)施例中,當(dāng)其中一個判斷規(guī)則為否時,再進(jìn)行另一個判斷規(guī)則的判斷,直到有一個判斷規(guī)則的判斷結(jié)果為是,則停止本次判斷操作。實(shí)施例中多個判斷規(guī)則的先后順序,可根據(jù)實(shí)際的數(shù)據(jù)分布情況進(jìn)行調(diào)整。

本發(fā)明提出的存在可疑IP3段的渠道的用戶屬性能夠較好地反映渠道中新增用戶數(shù)量的分布情況,便于分析渠道中新增用戶數(shù)量的增長情況;提出的根據(jù)存在可疑IP3段的渠道的用戶屬性及預(yù)設(shè)的通過大量統(tǒng)計分析獲得的合適閾值來判斷渠道是否作弊的方法,能夠直觀地從數(shù)據(jù)上判斷得出渠道是否作弊。

進(jìn)一步地,如圖6所示,示出了本發(fā)明一種作弊渠道的自動檢測方法中 自動獲取新增用戶接入數(shù)據(jù)并處理獲得數(shù)據(jù)記錄的一個實(shí)施例,即上述步驟S201之前還包括以下步驟:

S601、接收用戶的接入數(shù)據(jù);

所述接收用戶的接入數(shù)據(jù)是指接收包括新增用戶和已有用戶在內(nèi)的所有用戶的接入數(shù)據(jù)。

S602、判斷當(dāng)前用戶是否是新增用戶;

在本實(shí)施例中,如果當(dāng)前用戶在第三預(yù)設(shè)時間內(nèi)的首次訪問時被判斷為新增用戶,則該用戶在第三預(yù)設(shè)時間內(nèi)的每次訪問都被簡單地認(rèn)為是新增用戶的訪問,在判斷所述在第三預(yù)設(shè)時間內(nèi)的每次訪問對應(yīng)的用戶是否是新增用戶時,都簡單地認(rèn)為該用戶仍是新增用戶。

所述第三預(yù)設(shè)時間為一個預(yù)設(shè)的起始時間點(diǎn)和一個預(yù)設(shè)的結(jié)束時間點(diǎn)之間的時間段,該預(yù)設(shè)的結(jié)束時間點(diǎn)由預(yù)設(shè)的起始時間點(diǎn)開始往回計算第三時間閾值。例如,本實(shí)施例的第三預(yù)設(shè)時間中,假設(shè)第三時間閾值為24小時,若預(yù)設(shè)的起始時間點(diǎn)為當(dāng)天0點(diǎn),則預(yù)設(shè)的結(jié)束時間點(diǎn)為當(dāng)天的前一天的0點(diǎn);或者預(yù)設(shè)的起始時間點(diǎn)為當(dāng)天5點(diǎn),則預(yù)設(shè)的結(jié)束時間點(diǎn)為當(dāng)天的前一天的5點(diǎn)。當(dāng)然,所述第三時間閾值可以為其他值,例如12小時等等。

例如,若所述第三預(yù)設(shè)時間的預(yù)設(shè)的起始時間點(diǎn)為當(dāng)天0點(diǎn),第三時間閾值為24小時,一個用戶的首次訪問服務(wù)器時間點(diǎn)是在當(dāng)天的前一天內(nèi),則該用戶在當(dāng)天的前一天內(nèi)的每次訪問都被簡單地認(rèn)為是新增用戶的訪問。

S603、如果當(dāng)前用戶為新增用戶,則提取所述接入數(shù)據(jù)中的渠道信息、用戶信息及IP3段信息;

接收當(dāng)前用戶訪問的接入環(huán)境數(shù)據(jù),在判斷出當(dāng)前用戶是新增用戶時,從所述接入環(huán)境數(shù)據(jù)中提取出該用戶的渠道信息、用戶信息、IP地址信息,并提取所述IP地址的前3段作為該用戶的IP3段。

S604、如果當(dāng)前用戶不是新增用戶,則轉(zhuǎn)入步驟S601;

S605、根據(jù)在第三預(yù)設(shè)時間內(nèi)獲得的所有渠道信息、用戶信息及IP3段信息,生成數(shù)據(jù)記錄,之后轉(zhuǎn)入步驟S201;

本實(shí)施例中,所述數(shù)據(jù)記錄的格式為“渠道/用戶/IP3段”,用于可疑IP3段的監(jiān)測及用戶屬性的獲取。生成數(shù)據(jù)記錄時,在所述第三預(yù)設(shè)時間內(nèi)相同渠道下同一用戶的同一個IP3段對應(yīng)的多次訪問記錄合并為一條數(shù)據(jù)記錄, 相同渠道下同一用戶的多個不同IP3段訪問記錄對應(yīng)多條數(shù)據(jù)記錄。

例如,如果一個用戶通過同一個渠道在第三預(yù)設(shè)時間內(nèi)使用同一個IP3段對應(yīng)的相同或不同IP地址訪問過服務(wù)器,則會生成1條數(shù)據(jù)記錄,該數(shù)據(jù)記錄對應(yīng)第三預(yù)設(shè)時間內(nèi)所述用戶在所述渠道下同一IP3段的多次訪問;如果一個用戶通過同一個渠道在第三預(yù)設(shè)時間內(nèi)使用5個不同IP3段對應(yīng)的相同或不同IP地址訪問過服務(wù)器,則會生成5條數(shù)據(jù)記錄,該5條數(shù)據(jù)記錄分別對應(yīng)第三預(yù)設(shè)時間內(nèi)所述用戶在所述渠道下5個不同IP3段的訪問。

本發(fā)明提出的根據(jù)新增用戶訪問的接入數(shù)據(jù)處理獲得格式為“渠道/用戶/IP3段”的數(shù)據(jù)記錄,方法簡單且方便后續(xù)操作中使用所述數(shù)據(jù)記錄進(jìn)行統(tǒng)計、判斷。

對應(yīng)地,如圖7所示,提出了本發(fā)明一種作弊渠道的自動檢測裝置的一個實(shí)施例。該實(shí)施例中的自動檢測裝置包括:

可疑IP3段監(jiān)測模塊150,用于監(jiān)測每個渠道的所有可疑IP3段;

所述每個渠道的所有可疑IP3段是根據(jù)所有新增用戶訪問的接入數(shù)據(jù)處理獲得。所述接入數(shù)據(jù)包括IP協(xié)議中的IP地址,該IP地址的表示被分為4段,每段的二進(jìn)制轉(zhuǎn)成十進(jìn)制,中間用小數(shù)點(diǎn)隔開;所述IP3段是指所述IP地址表示方式中對應(yīng)的前3段,例如,32位IP地址的前3個字節(jié)。每個渠道的所有可疑IP3段組成一個可疑IP3段集合。

用戶屬性統(tǒng)計模塊160,用于獲取存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)的用戶屬性;

所述存在可疑IP3段的渠道是指該渠道的可疑IP3段集合不為空。

所述第一預(yù)設(shè)時間為一個預(yù)設(shè)的起始時間點(diǎn)和一個預(yù)設(shè)的結(jié)束時間點(diǎn)之間的時間段,該預(yù)設(shè)的結(jié)束時間點(diǎn)由預(yù)設(shè)的起始時間點(diǎn)開始往回計算第一時間閾值。例如,本實(shí)施例的第一預(yù)設(shè)時間中,假設(shè)第一時間閾值為24小時,若預(yù)設(shè)的起始時間點(diǎn)為當(dāng)天0點(diǎn),則預(yù)設(shè)的結(jié)束時間點(diǎn)為當(dāng)天的前一天的0點(diǎn);或者預(yù)設(shè)的起始時間點(diǎn)為當(dāng)天5點(diǎn),則預(yù)設(shè)的結(jié)束時間點(diǎn)為當(dāng)天的前一天的5點(diǎn)。當(dāng)然,所述第一時間閾值可以為其他值,例如12小時等等。若第一時間閾值為24小時,則本實(shí)施例中將統(tǒng)計從距離當(dāng)前時間點(diǎn)最近的過去一天內(nèi)存在可疑IP3段的渠道的用戶屬性。

所述存在可疑IP3段的用戶屬性可包括存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)所有新增用戶總數(shù)量、存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)所有可疑IP3段下新增用戶的總數(shù)量、存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)所有可疑IP3段下的新增用戶總數(shù)量在該渠道所有新增用戶總數(shù)量中的占比、存在可疑IP3段的渠道中新增用戶數(shù)量最大的可疑IP3段的數(shù)量、存在可疑IP3段的渠道中新增用戶數(shù)量最大的可疑IP3段的數(shù)量在該渠道所有新增用戶總數(shù)量中的占比。

渠道作弊判斷模塊170,用于根據(jù)所獲取的存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)的用戶屬性,判斷存在可疑IP3段的渠道是否為作弊渠道。

本發(fā)明根據(jù)新增用戶訪問的接入IP地址信息進(jìn)行統(tǒng)計進(jìn)而判斷渠道是否作弊,能夠更為有效地檢測出渠道是否作弊。

進(jìn)一步地,所述可疑IP3段監(jiān)測模塊150具體用于:

獲取第二預(yù)設(shè)時間內(nèi)利用當(dāng)前渠道進(jìn)行接入的所有新增用戶中同一IP3段下的用戶數(shù)量;

當(dāng)同一IP3段下的新增用戶的數(shù)量大于或等于第一預(yù)設(shè)閾值時,確定該IP3段為可疑IP3段。

所述第二預(yù)設(shè)時間為一個預(yù)設(shè)的起始時間點(diǎn)和一個預(yù)設(shè)的結(jié)束時間點(diǎn)之間的時間段,該預(yù)設(shè)的結(jié)束時間點(diǎn)由預(yù)設(shè)的起始時間點(diǎn)開始往回計算第二時間閾值。例如,本實(shí)施例的第二預(yù)設(shè)時間中,假設(shè)第二時間閾值為n×24小時(n是一個自然數(shù),取值可以是7、14、30等),若預(yù)設(shè)的起始時間點(diǎn)為當(dāng)天0點(diǎn),則預(yù)設(shè)的結(jié)束時間點(diǎn)為當(dāng)天的前n天的0點(diǎn);或者預(yù)設(shè)的起始時間點(diǎn)為當(dāng)天5點(diǎn),則預(yù)設(shè)的結(jié)束時間點(diǎn)為當(dāng)天的前n天的5點(diǎn)。若第二時間閾值為n×24小時,則本實(shí)施例中將統(tǒng)計從距離當(dāng)前時間點(diǎn)最近的過去n天內(nèi)利用當(dāng)前渠道進(jìn)行接入的所有新增用戶中同一IP3段下的用戶總數(shù)量。

根據(jù)在第二預(yù)設(shè)時間內(nèi)每個渠道下的所有數(shù)據(jù)記錄,統(tǒng)計當(dāng)前渠道的每個IP3段下的用戶總數(shù)量。其中,所述數(shù)據(jù)記錄是根據(jù)自動獲取的所有新增用戶的接入數(shù)據(jù),按照預(yù)設(shè)格式“渠道/用戶/IP3段”生成數(shù)據(jù)記錄,用于可疑IP3段的監(jiān)測及用戶屬性的獲取。

所述第一預(yù)設(shè)閾值可以是一個固定值,根據(jù)數(shù)據(jù)的實(shí)際分布情況通過統(tǒng) 計分析而采用合適的數(shù)值。本實(shí)施例中該第一預(yù)設(shè)閾值取值為80,即當(dāng)一個渠道的一個IP3段在第二預(yù)設(shè)時間內(nèi)累計產(chǎn)生的新增用戶數(shù)量大于或等于80時,則認(rèn)為該IP3段是可疑IP3段。

一個渠道下的所有可疑IP3段可組成一個可疑IP3段集合。如果所述渠道的可疑IP3段集合不為空,則該渠道的可疑IP3段集合作為被監(jiān)控對象參與該渠道的用戶屬性獲取及渠道作弊判斷的操作;如果所述渠道的可疑IP3段集合為空,則說明該渠道的所有IP3段下新增用戶數(shù)量的增長符合常態(tài),此時,該渠道無需參與之后的渠道用戶屬性獲取及渠道作弊判斷的操作。

當(dāng)同一IP3段下的新增用戶的數(shù)量小于第一預(yù)設(shè)閾值時,則該IP3段不是可疑IP3段,此時轉(zhuǎn)入對同一渠道或不同渠道的其他IP3段下新增用戶數(shù)量的統(tǒng)計。

本發(fā)明根據(jù)生成的數(shù)據(jù)記錄通過統(tǒng)計在第二預(yù)設(shè)時間內(nèi)每個渠道下每個IP3段的新增用戶數(shù)量,結(jié)合預(yù)設(shè)的一個合適閾值即能判斷并獲得每個渠道的可疑IP3段集合,方法簡單、有效。

進(jìn)一步地,所述用戶屬性統(tǒng)計模塊160具體用于:

獲取存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)所有可疑IP3段下新增用戶的總數(shù)量;或者獲取存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)所有可疑IP3段下的新增用戶總數(shù)量在該渠道所有新增用戶總數(shù)量中的占比;

所述存在可疑IP3段的渠道,是指所述渠道對應(yīng)的可疑IP3段集合不為空。對于每一個渠道,首先判斷該渠道的可疑IP3段集合是否為空;如果所述渠道的可疑IP3段不為空,則根據(jù)生成的所述數(shù)據(jù)記錄統(tǒng)計該渠道在第一預(yù)設(shè)時間內(nèi)所有新增用戶的總數(shù)量;如果所述渠道的可疑IP3段集合為空,則跳過該渠道進(jìn)入下一個渠道的上述操作。

所述存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)所有可疑IP3段下新增用戶的總數(shù)量,是根據(jù)生成的所述數(shù)據(jù)記錄及所述渠道的可疑IP3段集合,通過統(tǒng)計該渠道在第一預(yù)設(shè)時間內(nèi)所有可疑IP3段下新增用戶數(shù)量的總和而獲得。

所述渠道作弊判斷模塊170具體用于:

當(dāng)所述存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)所有可疑IP3段下新增 用戶的總數(shù)量大于或等于第二預(yù)設(shè)閾值時,確定該渠道為作弊渠道;或者,

當(dāng)所述存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)所有可疑IP3段下的新增用戶總數(shù)量占比大于或等于第三預(yù)設(shè)閾值時,確定該渠道為作弊渠道。

所述第二預(yù)設(shè)閾值和第三預(yù)設(shè)閾值均是基于大量統(tǒng)計分析而選取的一個閾值,可根據(jù)數(shù)據(jù)的具體分布情況而定。

本發(fā)明提出的存在可疑IP3段的渠道的用戶屬性能夠較好地反映渠道中新增用戶數(shù)量的分布情況,便于分析渠道中新增用戶數(shù)量的增長情況;提出的根據(jù)存在可疑IP3段的渠道的用戶屬性及預(yù)設(shè)的通過大量統(tǒng)計分析獲得的合適閾值來判斷渠道是否作弊的方法,能夠直觀地從數(shù)據(jù)上判斷得出渠道是否作弊。

進(jìn)一步地,所述用戶屬性統(tǒng)計模塊160具體還用于:

獲取存在可疑IP3段的渠道中新增用戶數(shù)量最大的可疑IP3段的數(shù)量;或者獲取存在可疑IP3段的渠道中新增用戶數(shù)量最大的可疑IP3段的數(shù)量在該渠道所有新增用戶總數(shù)量中的占比;

所述存在可疑IP3段的渠道在第一預(yù)設(shè)時間內(nèi)新增用戶數(shù)量最大的可疑IP3段的數(shù)量,是根據(jù)生成的所述數(shù)據(jù)記錄及所述渠道的可疑IP3段集合,通過分別統(tǒng)計該渠道的每個可疑IP3段下新增用戶數(shù)量,并比較所述該渠道的每個可疑IP3段下新增用戶數(shù)量的大小而獲得。

所述渠道作弊判斷模塊170具體還用于:

當(dāng)所述存在可疑IP3段的渠道中新增用戶數(shù)量最大的可疑IP3段的數(shù)量大于或等于第四預(yù)設(shè)閾值時,確定該渠道為作弊渠道;或者,

當(dāng)所述存在可疑IP3段的渠道中新增用戶數(shù)量最大的可疑IP3段的數(shù)量在該渠道所有新增用戶數(shù)量中的占比大于或等于第五預(yù)設(shè)閾值時,確定該渠道為作弊渠道。

所述第四預(yù)設(shè)閾值和第五預(yù)設(shè)閾值均是基于大量統(tǒng)計分析而選取的一個閾值,可根據(jù)數(shù)據(jù)的具體分布情況而定。

本發(fā)明提出的存在可疑IP3段的渠道的用戶屬性能夠較好地反映渠道中新增用戶數(shù)量的分布情況,便于分析渠道中新增用戶數(shù)量的增長情況;提出的根據(jù)存在可疑IP3段的渠道的用戶屬性及預(yù)設(shè)的通過大量統(tǒng)計分析獲得的 合適閾值來判斷渠道是否作弊的方法,能夠直觀地從數(shù)據(jù)上判斷得出渠道是否作弊。

進(jìn)一步地,如圖7所示,在可疑IP3段監(jiān)測模塊150之前,本發(fā)明提出的一種作弊渠道的自動檢測裝置還包括:

接入數(shù)據(jù)獲取模塊140,用于接收用戶的接入數(shù)據(jù),在當(dāng)前用戶為新增用戶時,提取所述接入數(shù)據(jù)中的渠道信息、用戶信息及IP3段信息,并根據(jù)所提取的在第三預(yù)設(shè)時間內(nèi)的渠道信息、用戶信息及IP3段信息,生成數(shù)據(jù)記錄。

所述接收用戶的接入數(shù)據(jù)是指接收包括新增用戶和已有用戶在內(nèi)的所有用戶的接入數(shù)據(jù)。

在本實(shí)施例中,如果當(dāng)前用戶在第三預(yù)設(shè)時間內(nèi)的首次訪問時被判斷為新增用戶,則該用戶在第三預(yù)設(shè)時間內(nèi)的每次訪問都被簡單地認(rèn)為是新增用戶的訪問,在判斷所述在第三預(yù)設(shè)時間內(nèi)的每次訪問對應(yīng)的用戶是否是新增用戶時,都簡單地認(rèn)為該用戶仍是新增用戶。

所述第三預(yù)設(shè)時間為一個預(yù)設(shè)的起始時間點(diǎn)和一個預(yù)設(shè)的結(jié)束時間點(diǎn)之間的時間段,該預(yù)設(shè)的結(jié)束時間點(diǎn)由預(yù)設(shè)的起始時間點(diǎn)開始往回計算第三時間閾值。例如,本實(shí)施例的第三預(yù)設(shè)時間中,假設(shè)第三時間閾值為24小時,若預(yù)設(shè)的起始時間點(diǎn)為當(dāng)天0點(diǎn),則預(yù)設(shè)的結(jié)束時間點(diǎn)為當(dāng)天的前一天的0點(diǎn);或者預(yù)設(shè)的起始時間點(diǎn)為當(dāng)天5點(diǎn),則預(yù)設(shè)的結(jié)束時間點(diǎn)為當(dāng)天的前一天的5點(diǎn)。當(dāng)然,所述第三時間閾值可以為其他值,例如12小時等等。

例如,若所述第三預(yù)設(shè)時間的預(yù)設(shè)的起始時間點(diǎn)為當(dāng)天0點(diǎn),第三時間閾值為24小時,一個用戶的首次訪問服務(wù)器時間點(diǎn)是當(dāng)天的前一天內(nèi),則該用戶在當(dāng)天的前一天內(nèi)的每次訪問都被簡單地認(rèn)為是新增用戶的訪問。

接收當(dāng)前用戶訪問的接入環(huán)境數(shù)據(jù),在判斷出當(dāng)前用戶是新增用戶時,從所述接入環(huán)境數(shù)據(jù)中提取出該用戶的渠道信息、用戶信息、IP地址信息,并提取所述IP地址的前3段作為該用戶的IP3段。

所述數(shù)據(jù)記錄的格式為“渠道/用戶/IP3段”,用于可疑IP3段的監(jiān)測及用戶屬性的獲取。生成數(shù)據(jù)記錄時,在所述第三預(yù)設(shè)時間內(nèi)相同渠道下同一用戶的同一個IP3段對應(yīng)的多次訪問記錄合并為一條數(shù)據(jù)記錄,相同渠道下 同一用戶的多個不同IP3段訪問記錄對應(yīng)多條數(shù)據(jù)記錄。

例如,如果一個用戶通過同一個渠道在第三預(yù)設(shè)時間內(nèi)使用同一個IP3段對應(yīng)的相同或不同IP地址訪問過服務(wù)器,則會生成1條數(shù)據(jù)記錄,該數(shù)據(jù)記錄對應(yīng)第三預(yù)設(shè)時間內(nèi)所述用戶在所述渠道下同一IP3段的多次訪問;如果一個用戶通過同一個渠道在第三預(yù)設(shè)時間內(nèi)使用5個不同IP3段對應(yīng)的相同或不同IP地址訪問過服務(wù)器,則會生成5條數(shù)據(jù)記錄,該5條數(shù)據(jù)記錄分別對應(yīng)第三預(yù)設(shè)時間內(nèi)所述用戶在所述渠道下5個不同IP3段的訪問。

本發(fā)明提出的根據(jù)新增用戶訪問的接入數(shù)據(jù)處理獲得格式為“渠道/用戶/IP3段”的數(shù)據(jù)記錄,方法簡單且方便后續(xù)操作中使用所述數(shù)據(jù)記錄進(jìn)行統(tǒng)計、判斷。

以上所述僅為本發(fā)明的優(yōu)選實(shí)施例,并非因此限制其專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,直接或間接運(yùn)用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1