專利名稱:一種針對數(shù)據(jù)對象的數(shù)據(jù)信息獲取和分析的方法及裝置的制作方法
技術(shù)領域:
本發(fā)明涉及數(shù)據(jù)處理領域,特別是針對數(shù)據(jù)對象的數(shù)據(jù)信息獲取和分析的方法及裝置。
背景技術(shù):
目前隨著互聯(lián)網(wǎng)技術(shù)應用的越來越廣泛,人們很多的日常工作和娛樂都在網(wǎng)絡上進行,互聯(lián)網(wǎng)也為了滿足人民日益增長的各種需求,提供了各種各樣的服務,這些服務在互聯(lián)網(wǎng)上以數(shù)據(jù)對象的形式存在,比如新聞、多媒體內(nèi)容、網(wǎng)絡廣告等,人民為了享受這些服務,都需要對所提供的數(shù)據(jù)對象進行各種各樣的操作,這些操作行為我們稱之為針對數(shù)據(jù)對象的行為,這樣既方便了廣大互聯(lián)網(wǎng)用戶,也為各種服務提供商帶來了無限商機,但隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,產(chǎn)生了越來越多阻礙其進步的因素,比如針對數(shù)據(jù)對象的操作,許多互聯(lián)網(wǎng)用戶出于各種目的會產(chǎn)生大量的無效的針對數(shù)據(jù)對象的操作,這些無效的針對數(shù)據(jù)對象的操作不僅消耗互聯(lián)網(wǎng)資源,也給那些服務提供者帶了大量的困擾,下面以互聯(lián)網(wǎng)上最常見的網(wǎng)絡廣告為例來分析。
目前,互聯(lián)網(wǎng)已經(jīng)成為一種非常直接、有效的廣告媒介,但令廣告客戶感到困擾的是,網(wǎng)絡廣告受到的點擊有很大一部分都屬于欺詐點擊。在常規(guī)搜索模式下,當用戶搜索某個關(guān)鍵字時,搜索結(jié)果頁面中就會出現(xiàn)一些相關(guān)公司的廣告。如果用戶點擊廣告,廣告客戶就需要向搜索服務提供商支付一定的費用。通過這一模式,廣告客戶可以更有針對性地接觸潛在用戶,搜索服務提供商也可以獲得豐厚的利潤。但不幸的是,搜索服務提供商的網(wǎng)絡廣告系統(tǒng)成為了滋生點擊欺詐的溫床,因為欺騙該系統(tǒng)非常容易。如Google、雅虎和其它搜索服務提供商在第三方網(wǎng)站上投放了大量廣告,并依據(jù)廣告點擊次數(shù)同相關(guān)網(wǎng)站共享部分營收。為了獲得更多營收,很多缺乏道德感的網(wǎng)站會通過各種途徑重復點擊自己網(wǎng)站上的廣告,而這些點擊對于廣告客戶沒有任何意義。此外,還有很多公司重復點擊競爭對手的網(wǎng)絡廣告,目的是消耗競爭對手的廣告預算。目前,點擊欺詐已經(jīng)成為阻礙網(wǎng)絡廣告市場健康發(fā)展的一大頑疾,各搜索廠商一直都致力于通過技術(shù)和服務等來防止減少點擊欺詐的發(fā)生。雅虎公司發(fā)布的全新反點擊欺詐技術(shù)就是在這方面的有力探索,它以點擊分析過濾、歷史行為分析過濾、AI模式識別過濾、雅虎趨勢分析平臺等四大技術(shù)特點有效防止和減少了點擊欺詐的發(fā)生。憑借全球領先的搜索智能識別技術(shù),雅虎公司的反點擊欺詐系統(tǒng)可以對每一次點擊的用戶端信息、以及其他幾十種常用的點擊參數(shù)進行分析,智能判斷其中的欺詐點擊并進行直接過濾。其次,通過綜合分析每一個瀏覽用戶在一段時間內(nèi)的點擊行為,雅虎公司的反點擊欺詐系統(tǒng)可以主動過濾其中存在的欺詐點擊。尤其值得一提的是該反欺詐點擊系統(tǒng)先進的AI模式識別過濾功能,它利用雅虎在各國家的反欺詐點擊小組進行密切聯(lián)系,共同建立了一個龐大的欺詐點擊樣例庫。通過AI模式識別系統(tǒng),對來自全球的樣例庫進行訓練,使得AI模式識別系統(tǒng)可以綜合多種特征準確識別出欺詐點擊。除此之外,該反欺詐點擊系統(tǒng)還建立了雅虎趨勢分析平臺,綜合收集來自雅虎搜索引擎和雅虎搜索競價的明細信息,基于歷史采樣統(tǒng)計,進行點擊趨勢分析,可以更加有效的防御一些未知的作弊方式,憑借領先的反點擊欺詐技術(shù),雅虎已經(jīng)識別了數(shù)十億次惡意點擊,避免了廣告客戶的利益損失。
雖然像雅虎這一類的反欺詐點擊技術(shù)能在一定程度上識別出點擊欺詐,但由于它只是單純的從點擊網(wǎng)絡廣告的網(wǎng)絡行為分析的基礎上進行的識別,這樣的技術(shù)具有以下一些缺陷首先,該類技術(shù)由于完全從用戶的網(wǎng)絡行為進行分析,不能真正完全地識別點擊欺詐,因為欺詐者在網(wǎng)絡上是可以完全按照真實用戶的操作行為進行模擬廣告點擊的,這個是該類技術(shù)無法識別出來的。其次,運算方法復雜,需要積累大量用戶數(shù)據(jù)進行分析,成本很高,例如雅虎公司的反欺詐系統(tǒng)中的核心技術(shù)AI模式識別過濾功能,需要在全球建立一個龐大的欺詐點擊/無效點擊樣例庫,對來自全球的樣例庫進行訓練,使得AI模式識別系統(tǒng)可以綜合多種特征準確識別出欺詐點擊/無效點擊,這樣的系統(tǒng)需要大量的數(shù)據(jù)為基礎,花費大量的人力物力才能做到。最后,誤識別率高,常常會將一些真實的廣告行為識別為欺詐行為,這樣會使廣告提供商承擔大量的損失。
總之,需要本領域技術(shù)人員迫切解決的一個技術(shù)問題就是如何能夠準確、有效的識別出針對數(shù)據(jù)對象的行為是有效、無效行為等類別。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種能夠有效的識別出針對數(shù)據(jù)對象的行為是有效行為、無效行為的類別,從而可以真正完全地識別出互聯(lián)網(wǎng)用戶針對網(wǎng)絡上的數(shù)據(jù)對象的行為哪些是有效的,哪些是無效的,并且運算方法簡單,成本低,誤碼率低,從而更加準確的排除無效行為。
為此,根據(jù)本發(fā)明的一實施例,公開了一種針對數(shù)據(jù)對象的數(shù)據(jù)信息獲取和分析的方法,所述數(shù)據(jù)對象為包含網(wǎng)絡行為和電話行為的數(shù)據(jù)對象,所述方法包括如下步驟接收第一用戶觸發(fā),獲取針對該數(shù)據(jù)對象的網(wǎng)絡行為數(shù)據(jù)信息,所述數(shù)據(jù)信息包括用戶的IP地址;發(fā)送第一用戶和第二用戶的電話號碼,通知通信網(wǎng)絡連接第一用戶和第二用戶完成通話;獲取針對該數(shù)據(jù)對象的電話行為數(shù)據(jù)信息,所述數(shù)據(jù)信息包括用戶的電話號碼和有效通話時長;分析IP地址對應的電話號碼,當某個IP地址的用戶的有效通話時長小于預設時間,則此次觸發(fā)行為無效。
優(yōu)選的,所述方法還可以包括當某個IP地址用戶在預置時間段內(nèi)采用超過預定個數(shù)的電話號碼進行通話,則該IP地址在預置時間段為無效IP地址,該無效IP地址在預置時間段對應的觸發(fā)行為均無效。
優(yōu)選的,所述電話行為數(shù)據(jù)信息的獲取為通話結(jié)束后,接收通信網(wǎng)絡實時返回的針對該數(shù)據(jù)對象的電話行為數(shù)據(jù)信息。
優(yōu)選的,所述的IP地址、電話號碼、有效通話時長對應存儲在展示數(shù)據(jù)對象的網(wǎng)站的數(shù)據(jù)庫中。
優(yōu)選的,所述方法還可以包括將分散的針對同一數(shù)據(jù)對象的數(shù)據(jù)信息匯集后集中存儲至一數(shù)據(jù)庫中;所述同一數(shù)據(jù)對象分散在多個網(wǎng)站中進行展示。
優(yōu)選的,所述的數(shù)據(jù)對象為網(wǎng)站上展示的網(wǎng)絡廣告。其中,所述獲取的數(shù)據(jù)對象的電話行為的數(shù)據(jù)信息為通信網(wǎng)絡提供給網(wǎng)站的通話記錄,所述的通話記錄包括呼叫終端客戶的電話號碼和網(wǎng)絡廣告廠商的電話號碼、呼叫終端客戶的IP、來源網(wǎng)址URL、有效通話開始時間、有效通話結(jié)束時間、有效通話時長、通話次數(shù)。
優(yōu)選的,所述方法還可以包括獲取用戶的IP地址、通話記錄;分析每個IP用戶對應的通話記錄,如果某個IP的用戶的有效通話時間小于預設時間,或者某個IP的用戶在預置時間段內(nèi)采用超過預定個數(shù)的電話號碼進行通話,則該IP用戶為無效用戶。
優(yōu)選的,所述方法還可以包括獲取用戶的通話記錄;分析不同電話號碼的通話記錄,如果某個電話號碼的通話次數(shù)超過預設頻率或者有效通話時長小于預設時間,則該電話用戶為無效用戶。
進一步,當IP用戶為無效用戶或者電話用戶為無效用戶時,確定該用戶的本次點擊行為無效,或者確定該用戶之后的所有點擊行為無效。
根據(jù)本發(fā)明的另一實施例,還公開了一種針對數(shù)據(jù)對象的數(shù)據(jù)信息獲取和分析的裝置,包含第一信息獲取模塊,用于接收第一用戶觸發(fā),獲取針對該數(shù)據(jù)對象的網(wǎng)絡行為數(shù)據(jù)信息,所述數(shù)據(jù)信息包括用戶的IP地址;第二信息獲取模塊,用于發(fā)送第一用戶和第二用戶的電話號碼,通知通信網(wǎng)絡連接第一用戶和第二用戶完成通話;以及,獲取針對該數(shù)據(jù)對象的電話行為數(shù)據(jù)信息,所述數(shù)據(jù)信息包括用戶的電話號碼和有效通話時長;第一分析模塊,用于分析IP地址對應的電話號碼,當某個IP地址用戶的有效通話時長小于預設時間,則此次觸發(fā)行為無效。優(yōu)選的,還可以包括,當某個IP的用戶在預置時間段內(nèi)采用超過預定個數(shù)的電話號碼進行通話,則此次觸發(fā)行為無效。
優(yōu)選的,所述電話行為數(shù)據(jù)信息的獲取為通話結(jié)束后,接收通信網(wǎng)絡實時返回的針對該數(shù)據(jù)對象的電話行為數(shù)據(jù)信息。
優(yōu)選的,所述裝置還可以包括一存儲模塊,用來存儲IP地址和對應的電話號碼、有效通話時長,所述存儲模塊位于展示所述數(shù)據(jù)對象的網(wǎng)站中。
優(yōu)選的,所述裝置還可以包括一數(shù)據(jù)庫,用于將分散的針對同一數(shù)據(jù)對象的數(shù)據(jù)信息匯集后集中存儲;所述同一數(shù)據(jù)對象分散在多個網(wǎng)站中進行展示。
優(yōu)選的,所述的數(shù)據(jù)對象為網(wǎng)站上展示的網(wǎng)絡廣告。
優(yōu)選的,所述裝置還可以包括第二分析模塊,用于分析每個IP用戶對應的通話記錄,如果某個IP的用戶的有效通話時間小于預設時間,或者某個IP的用戶在預置時間段內(nèi)采用超過預定個數(shù)的電話號碼進行通話,則該IP用戶為無效用戶,該IP地址對應的此次觸發(fā)行為為無效行為或者之后的所有觸發(fā)行為均無效。
優(yōu)選的,所述裝置還可以包括第三分析模塊,用于分析不同電話號碼的通話記錄,如果某個電話號碼的通話次數(shù)超過預設頻率或者有效通話時長小于預設時間,則該電話號碼為無效號碼,該電話號碼對應的此次觸發(fā)行為為無效行為或者之后的所有觸發(fā)行為均無效。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點由于本發(fā)明采用分析的數(shù)據(jù)不但包括數(shù)據(jù)對象的網(wǎng)絡行為數(shù)據(jù)信息,而且還包括電話行為數(shù)據(jù)信息,在獲取網(wǎng)絡行為數(shù)據(jù)信息的同時獲取電話行為的數(shù)據(jù)信息,從而建立網(wǎng)絡行為和電話行為數(shù)據(jù)信息的一一對應,這樣有效的解決了數(shù)據(jù)信息的獲取過程,而且為分析數(shù)據(jù)信息進行識別提供了更加準確的數(shù)據(jù)基礎。
本發(fā)明利用獲取的數(shù)據(jù)對象的網(wǎng)絡行為和電話行為數(shù)據(jù)信息的一一對應,結(jié)合網(wǎng)絡行為數(shù)據(jù)信息和電話行為數(shù)據(jù)信息進行綜合分析,分析用戶的IP地址對應的電話號碼,如果某個IP地址的用戶的有效通話時長小于預設時間,則該IP地址為無效IP地址,該電話號碼為無效電話號碼,從而確定該IP地址及電話號碼對應的此次觸發(fā)行為為無效行為。在這樣結(jié)合兩者數(shù)據(jù)的基礎上進行的分析,比單純的從數(shù)據(jù)對象的網(wǎng)絡行為數(shù)據(jù)信息出發(fā)進行分析,能得到更加準確的結(jié)果,能更加有效的區(qū)別哪些行為是有效行為,哪些行為是無效行為,大大的提高了識別的準確率。
既可以實時的進行分析,也可以在一段時間內(nèi)進行分析,不需要進行大量的數(shù)據(jù)采集,也不需要匯集大量的數(shù)據(jù)為基礎進行分析,因此成本低,能節(jié)約大量的人力、物力及網(wǎng)絡資源。
由于采用了網(wǎng)絡行為數(shù)據(jù)信息結(jié)合電話行為數(shù)據(jù)信息作為綜合分析的基礎,因此能有效的降低誤識別率,有效的提高識別效率。
圖1是本發(fā)明的數(shù)據(jù)獲取和分析的方法的流程圖;圖2是本發(fā)明數(shù)據(jù)獲取的流程圖;圖3是本發(fā)明實施例所述的針對網(wǎng)絡廣告行為的數(shù)據(jù)信息獲取和分析方法的流程圖;圖4是圖3所示實施例的具體流程圖;
圖5是圖3所示實施例數(shù)據(jù)分析的具體流程圖;圖6是本發(fā)明針對數(shù)據(jù)對象行為的數(shù)據(jù)獲取和分析裝置框圖;圖7是圖6所示裝置存儲模塊中數(shù)據(jù)存儲的格式。
具體實施例方式
為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結(jié)合附圖和具體實施方式
對本發(fā)明作進一步詳細的說明。
參照圖1,示出了本發(fā)明一種針對數(shù)據(jù)對象行為的數(shù)據(jù)獲取和分析的方法的流程圖。
由獲取針對數(shù)據(jù)對象的網(wǎng)絡行為的數(shù)據(jù)信息步驟101、獲取針對數(shù)據(jù)對象的電話行為的數(shù)據(jù)信息步驟102、存儲數(shù)據(jù)信息步驟103、結(jié)合網(wǎng)絡行為和電話行為所獲取的數(shù)據(jù)信息進行分析步驟104、根據(jù)分析所獲取的數(shù)據(jù)信息確定行為為有效或無效的步驟105組成。
在步驟101中,獲取針對數(shù)據(jù)對象的網(wǎng)絡行為的數(shù)據(jù)信息包括用戶的IP地址,還可以包括用戶的來源網(wǎng)址URL等其他與用戶的網(wǎng)絡行為有關(guān)的數(shù)據(jù)信息,當用戶在互聯(lián)網(wǎng)站上對數(shù)據(jù)對象進行有針對性的行為時,如點擊該數(shù)據(jù)對象時,則位于網(wǎng)站的后臺程序會將用戶的IP地址、來源網(wǎng)址URL等信息記錄下來,這種記錄用戶IP地址等信息的后臺程序是現(xiàn)有技術(shù),很容易就能實現(xiàn),在此不過多贅述。步驟102,當用戶對該數(shù)據(jù)對象進行有針對性的行為時,如點擊該數(shù)據(jù)對象,在記錄針對該數(shù)據(jù)對象的網(wǎng)絡行為的數(shù)據(jù)信息時會請求用戶輸入電話號碼,獲取用戶的電話行為的數(shù)據(jù)信息,該電話行為的數(shù)據(jù)信息包括用戶的電話號碼、有效通話時長等記錄,該步驟會在后面做詳細的描述。步驟103,存儲獲取的用戶網(wǎng)絡行為數(shù)據(jù)信息和電話行為數(shù)據(jù)信息,網(wǎng)絡數(shù)據(jù)庫會建立一個數(shù)據(jù)表,一一對應存儲用戶的網(wǎng)絡行為數(shù)據(jù)信息如IP地址等信息和電話行為數(shù)據(jù)信息如電話號碼和有效通話時長等信息。步驟104,在獲取用戶的網(wǎng)絡行為數(shù)據(jù)信息和對應的電話行為數(shù)據(jù)信息后,結(jié)合用戶的網(wǎng)絡行為數(shù)據(jù)行為和用戶電話行為數(shù)據(jù)信息綜合進行分析,分析用戶的IP地址對應的電話號碼,當某個IP地址的用戶的有效通話時長小于預設時間,則對該IP地址和電話號碼進行處理,如為無效的IP地址和電話號碼,或者把該IP地址和電話號碼存入黑名單,該有效通話時長的預設時間可以設為2秒或5秒。當某個IP的用戶更換不同的電話號碼的次數(shù)超過預設頻率,則對該IP地址和電話號碼進行處理,如標記為無效的IP地址和電話號碼,或者把該IP地址和電話號碼存入黑名單。
當IP無效或者電話號碼無效時,其對應的此次觸發(fā)行為一定無效;更嚴格的情況,該無效IP或者無效電話號碼之后的所有觸發(fā)行為都是無效的。當然,也可以當IP或者電話號碼多次被判定為無效后,再認定該無效IP或者無效電話號碼之后的所有觸發(fā)行為都是無效的,從而提高分析效率。
圖2是獲取用戶針對數(shù)據(jù)對象的電話行為數(shù)據(jù)信息的具體流程圖。包括獲取數(shù)據(jù)對象網(wǎng)絡行為數(shù)據(jù)信息的步驟、請求用戶輸入電話號碼的步驟201、提供電話號碼給通信網(wǎng)絡步驟202、請求通信網(wǎng)絡返回數(shù)據(jù)信息步驟203、以及存儲所獲取的數(shù)據(jù)信息步驟。
步驟201,當獲取針對數(shù)據(jù)對象的網(wǎng)絡行為數(shù)據(jù)信息時,請求用戶輸入電話號碼,該請求的方式可以是彈出一個對話框,讓用戶輸入電話號碼,也可以是一看到數(shù)據(jù)對象就可以看到的電話號碼輸入框。步驟202,當用戶在對話框或輸入框輸入電話號碼后,把該電話號碼提交給通話網(wǎng)絡中心,如提交給電信通信網(wǎng)絡,移動通信中心等都可以,同時還把提供數(shù)據(jù)對象的客戶的電話號碼提交給通話網(wǎng)絡中心,如把網(wǎng)絡廣告客戶的電話號碼提交給通信中心,通信中心收到這兩個電話號碼以后,接通兩個電話號碼,這時,用戶就可以和客戶直接進行通話,用戶可以對他感興趣的數(shù)據(jù)對象向客戶詢問,定購等。步驟203,當用戶和客戶通信結(jié)束以后,再請求通信網(wǎng)絡返回該次電話行為的數(shù)據(jù)信息,包括電話號碼、有效通話時長等數(shù)據(jù)信息。存儲步驟,在獲取網(wǎng)絡行為數(shù)據(jù)信息和電話行為數(shù)據(jù)信息以后,一一對應存儲在數(shù)據(jù)庫中。
為了更清楚的說明本發(fā)明的原理及數(shù)據(jù)處理過程,下面以一個具體的例子來說明本發(fā)明所述方法的詳細過程。如圖3,是本發(fā)明在網(wǎng)絡廣告領域的一個具體的應用。該網(wǎng)絡廣告為包含網(wǎng)絡行為和電話行為的網(wǎng)絡廣告即包含網(wǎng)絡行為和電話行為的數(shù)據(jù)對象的一個具體的例子,這種網(wǎng)絡廣告現(xiàn)在越來越成為互聯(lián)網(wǎng)廣告的主流,因為通過這樣的網(wǎng)絡廣告,使得用戶不僅僅只是瀏覽廣告,產(chǎn)生視覺上的沖擊,而且會使對廣告商品感興趣的用戶直接方便的與廣告客戶溝通,既方便了客戶,也使商家即廣告客戶獲得了更大的利益。這樣包含了網(wǎng)絡行為和電話行為的網(wǎng)絡廣告以各種各樣的形式存在,如在傳統(tǒng)網(wǎng)絡廣告上面加了一個電話圖標,當用戶點擊電話圖標的時候,會彈出一個窗口提示他們輸入自己的電話號碼,然后再點擊通話的按鈕,通信網(wǎng)絡就會撥通廣告客戶的號碼,然后再撥通用戶輸入的號碼,當用戶拿起聽筒時,就會聽到廣告客戶的來電。通過這種網(wǎng)絡廣告的方式,可以使對廣告產(chǎn)品感興趣的用戶直接和廣告客戶通話,進行直接的溝通,即為用戶提供了方便,也使廣告客戶能獲取更多的利益。這樣的網(wǎng)絡廣告就是本發(fā)明所說的集成了網(wǎng)絡行為和電話行為的數(shù)據(jù)對象,這樣的網(wǎng)絡廣告最大的特點就是使存放網(wǎng)絡廣告的網(wǎng)站既能通過用戶的網(wǎng)絡行為如瀏覽行為等知道用戶的信息,又能通過通信網(wǎng)絡返回的數(shù)據(jù)信息知道用戶的信息,前者的信息包括用戶的IP地址、來源網(wǎng)址URL,后者包括用戶的電話號碼,有效通話時長、有效通話開始時間、有效通話結(jié)束時間、通話次數(shù)等信息。
在步驟301中,獲取針對網(wǎng)絡廣告的網(wǎng)絡行為的數(shù)據(jù)信息包括用戶的IP地址,還可以包括用戶的來源網(wǎng)址URL等其他與用戶的網(wǎng)絡行為有關(guān)的數(shù)據(jù)信息,當用戶在互聯(lián)網(wǎng)站上對網(wǎng)絡廣告進行有針對性的行為時,如點擊該網(wǎng)絡廣告時,則位于網(wǎng)站的后臺程序會將用戶的IP地址、來源網(wǎng)址URL等信息記錄下來,這種記錄用戶IP地址等信息的后臺程序是現(xiàn)有技術(shù),很容易就能實現(xiàn),在此不過多贅述。步驟302,當用戶對該網(wǎng)絡廣告進行有針對性的行為時,如點擊該網(wǎng)絡廣告,在記錄針對該網(wǎng)絡廣告的網(wǎng)絡行為的數(shù)據(jù)信息時會請求用戶輸入電話號碼,獲取用戶的電話行為的數(shù)據(jù)信息,該電話行為的數(shù)據(jù)信息包括用戶的電話號碼、有效通話時長等記錄,該步驟會在上面做了詳細的描述。步驟303,存儲獲取的用戶網(wǎng)絡行為數(shù)據(jù)信息和電話行為數(shù)據(jù)信息,網(wǎng)絡數(shù)據(jù)庫會建立一個數(shù)據(jù)表,一一對應存儲用戶的網(wǎng)絡行為數(shù)據(jù)信息如IP地址等信息和電話行為數(shù)據(jù)信息如電話號碼和有效通話時長等信息。步驟304,在獲取用戶的網(wǎng)絡行為數(shù)據(jù)信息和對應的電話行為數(shù)據(jù)信息后,結(jié)合用戶的網(wǎng)絡行為數(shù)據(jù)行為和用戶電話行為數(shù)據(jù)信息綜合進行分析,分析用戶的IP地址對應的電話號碼,當某個IP地址的用戶的有效通話時長小于預設時間,則對該IP地址和電話號碼進行處理,如為無效的IP地址和電話號碼,或者把該IP地址和電話號碼存入黑名單,該有效通話時長的預設時間可以設為2秒或5秒。當某個IP的用戶更換不同的電話號碼的次數(shù)超過預設頻率,則對該IP地址和電話號碼進行處理,如標記為無效的IP地址和電話號碼,或者把該IP地址和電話號碼存入黑名單。從而判斷出用戶對該網(wǎng)絡廣告的點擊,通話是不是欺詐的點擊等,從而能夠識別出無效用戶的無效點擊,有效用戶的有效點擊。
圖4是圖3所述步驟的更為詳細的說明,下面以圖4來具體說明本發(fā)明。
參照圖4,當普通用戶進入網(wǎng)站W(wǎng)1上擺放廣告的網(wǎng)頁P1,普通用戶看到了網(wǎng)頁P1上面的網(wǎng)絡廣告A1或者看到了廣告A1的關(guān)聯(lián)地址A2,如果用戶看到的是廣告頁面,則進入左邊的流程,用戶點擊廣告A1,然后看到廣告商品的頁面P2,這時,網(wǎng)頁W1上的程序就會分析該用戶甲的行為數(shù)據(jù)從而獲取用戶甲的IP地址和來源網(wǎng)址URL等信息,位于網(wǎng)站W(wǎng)1上的程序獲取這些信息后就會存儲在網(wǎng)站的數(shù)據(jù)庫中,用戶在觀看廣告的同時也會看到電話號碼輸入框K1,用戶甲在電話號碼輸入框K1中輸入自己的電話號碼N1,當用戶輸入完自己的電話號碼以后,網(wǎng)站W(wǎng)1后臺程序會記錄下電話號碼N1、該用戶的IP地址及當時的時間,并將這些信息整體寫入W1的數(shù)據(jù)庫中,之后將該廣告A1代表的產(chǎn)品商家S1的指定電話號碼N2從數(shù)據(jù)庫中讀取出來,然后將兩個號碼N1和N2同時提交給電信通信網(wǎng)絡。電信通信網(wǎng)絡會依次撥通N1和N2這兩個電話號碼,順序是先N2后N1。然后雙方進行通話。通話結(jié)束以后,電信通信網(wǎng)絡將通話記錄,包括N1和N2這兩個電話號碼、呼叫終端客戶N1的IP、來源網(wǎng)址URL、發(fā)起端電話、有效通話開始時間、有效通話結(jié)束時間、總有效通話時長等返給網(wǎng)站W(wǎng)1。網(wǎng)站W(wǎng)1將電信通信網(wǎng)絡提供的相關(guān)數(shù)據(jù)信息,包括N1和N2這兩個電話號碼、呼叫終端客戶N1的IP、來源網(wǎng)址URL、發(fā)起端電話、有效通話開始時間、有效通話結(jié)束時間、總有效通話時長等存貯起來。
如果用戶在網(wǎng)頁P1上看到的是廣告A1的關(guān)聯(lián)地址A2,則點擊A2進入網(wǎng)站W(wǎng)2的廣告頁面P3,這時,網(wǎng)頁W2上的程序就會分析該用戶甲的行為數(shù)據(jù)從而獲取用戶甲的IP地址和來源網(wǎng)址URL等信息,位于網(wǎng)站W(wǎng)2上的程序獲取這些信息后就會存儲在網(wǎng)站的數(shù)據(jù)庫中,用戶在觀看廣告的同時也會看到電話號碼輸入框K1,用戶甲在電話號碼輸入框K1中輸入自己的電話號碼N1,當用戶輸入完自己的電話號碼以后,網(wǎng)站W(wǎng)2后臺程序會記錄下電話號碼N1、該用戶的IP地址及當時的時間,并將這些信息整體寫入W2的數(shù)據(jù)庫中,之后將該廣告A1代表的產(chǎn)品商家S1的指定電話號碼N2從數(shù)據(jù)庫中讀取出來,然后將兩個號碼N1和N2同時提交給電信通信網(wǎng)絡。電信通信網(wǎng)絡會依次撥通N1和N2這兩個電話號碼,順序是先N2后N1。然后雙方進行通話。通話結(jié)束以后,電信通信網(wǎng)絡將通話記錄,包括N1和N2這兩個電話號碼、呼叫終端客戶N1的IP、來源網(wǎng)址URL、發(fā)起端電話、有效通話開始時間、有效通話結(jié)束時間、總有效通話時長等返給網(wǎng)站W(wǎng)2。網(wǎng)站W(wǎng)2將電信通信網(wǎng)絡提供的相關(guān)數(shù)據(jù)信息,包括N1和N2這兩個電話號碼、呼叫終端客戶N1的IP、來源網(wǎng)址URL、發(fā)起端電話、有效通話開始時間、有效通話結(jié)束時間、總有效通話時長等存貯起來。如果變通用戶是在第三方網(wǎng)頁上看到了廣告及電話號碼輸入框K1,數(shù)據(jù)的處理流程與上面是相同的,所不同的只是數(shù)據(jù)存儲在W3中,在此不再詳述。
圖5提供了具體進行分析的詳細步驟流程圖。
步驟501,從數(shù)據(jù)庫中提取用戶的IP地址,和相應的通話記錄等數(shù)據(jù),獲取數(shù)據(jù)后,綜合用戶針對網(wǎng)絡廣告的行為的數(shù)據(jù)信息即綜合IP地址和通話記錄,以IP地址和通話記錄的結(jié)合來分析,就可以從兩個不同的角度對數(shù)據(jù)進行分析,步驟502,分析所有不同IP的用戶,分析每個不同IP的用戶的來源網(wǎng)址及通話歷史記錄,如果有某個IP用戶的通話次數(shù)過于頻繁或者有效通話時長過短或者某個IP的用戶頻繁的更換不同的電話號碼,都作為無效用戶處理,步驟503,從電話號碼的角度來分析,當獲取了用戶的歷史行為記錄以后先分析所有不同電話號碼的用戶,分析每個不同電話號碼的用戶的IP和通話記錄,如果有某個電話號碼的用戶的通話過于頻繁或者有效通話時長過短,則作為無效用戶處理。確定無效用戶以后,就可以根據(jù)數(shù)據(jù)庫存中存儲的IP地址及電話號碼等信息確定哪些點擊行為是無效點擊行為,哪些是有效點擊行為,然后根據(jù)來源網(wǎng)址URL來判斷這些無效用戶的無效點擊來源于哪個網(wǎng)站。
下面還是以網(wǎng)絡廣告這個具體的例子來說明通過網(wǎng)絡行為和電話行為數(shù)據(jù)信息獲取和分析的具體應用。通過上面的說明我們明確了無效點擊的識別過程,通過本發(fā)明所述的方法分析出數(shù)據(jù)信息特征即針對網(wǎng)絡廣告的點擊行為是有效還是無效行為以后,比如說某個IP地址的用戶在某次通話中通話時長過短,剛該次的該IP地址和電話號碼被標記為無效IP地址和電話號碼,其對應的該次點擊為無效點擊,通過IP地址,電話號碼,來源網(wǎng)址在數(shù)據(jù)庫中的對應存儲,我們很容易就能跟蹤到該無效用戶的來源網(wǎng)址URL,這樣我們就可以知道在哪個網(wǎng)站發(fā)生了無效點擊,從而廣告客戶對該網(wǎng)站的該次點擊不需要付廣告費,這樣就能避免廣告客戶因為欺詐點擊而付廣告費。
本發(fā)明還提供了一種實施例,即把存放數(shù)據(jù)對象的各個網(wǎng)站所獲取的數(shù)據(jù)全部集中存放在第三個網(wǎng)站的數(shù)據(jù)庫中,如廣告客戶的網(wǎng)站中的數(shù)據(jù)庫中,然后再把這些集中的數(shù)據(jù)信息按本發(fā)明的方法進行分析,通過這樣的分析得到的數(shù)據(jù)信息特征能更加準確的識別出行為的種類。還是以網(wǎng)絡廣告為例,通常一個廣告客戶的一個網(wǎng)絡廣告是不止投放一個網(wǎng)站的,它通常會投放在大量的網(wǎng)站上,我們把這些網(wǎng)站稱為網(wǎng)站聯(lián)盟。雖然通過前面的實施例可以知道在每個網(wǎng)站上分別進行分析,從而識別出行為的類別,但這樣還不夠精確和準確的識別出行為類別。還會發(fā)生這樣一種情況,比如說一個無效的用戶,它在每個網(wǎng)站上都無效點擊一次網(wǎng)絡廣告,進行一次無效的電話行為,這時如果每個網(wǎng)站都獨立分析的話是不能識別出該行為的。但如果把這個用戶的數(shù)據(jù)信息集中到一個數(shù)據(jù)庫存中進行分析,就能準確的識別出它的行為類別來了。
請參閱圖6,是本發(fā)明針對數(shù)據(jù)對象行為的數(shù)據(jù)獲取和分析裝置框圖。
由第一信息獲取模塊601、第二信息獲取模塊602、存儲模塊603、分析模塊604組成。
第一信息獲取模塊用來獲取針對數(shù)據(jù)對象網(wǎng)絡行為的數(shù)據(jù)信息,這些信息包括用戶的IP地址、來源網(wǎng)址URL等,第二信息獲取模塊用來獲取針對數(shù)據(jù)對象電話行為的數(shù)據(jù)信息,包括用戶的電話號碼、有效通話時長等數(shù)據(jù)信息。存儲模塊存儲的是一一對應的用戶網(wǎng)絡行為數(shù)據(jù)信息和電話行為數(shù)據(jù)信息,如一個用戶的IP地址、電話號碼、有效通話時長等。分析模塊用來分析用戶的IP地址對應的電話號碼,當某個IP地址的用戶的有效通話時長小于預設時間,則該IP地址為無效IP地址,該電話號碼為無效電話號碼,從而對該IP地址和電話號碼進行處理,如放入黑名單。
圖7是本發(fā)明存儲模塊中表格的格式,它存儲的是用戶的IP地址信息,以及與IP地址對應的電話號碼,有效通話時長等信息,還可以包括用戶的來源網(wǎng)址URL、通話次數(shù)等其它的網(wǎng)絡行為信息和電話行為信息。
還是以網(wǎng)絡廣告來具體介紹本發(fā)明所述裝置。
首先用戶進入互聯(lián)網(wǎng)站,看到存放在網(wǎng)站上的網(wǎng)絡廣告,當用戶點擊該網(wǎng)絡廣告時,第一信息獲取模塊獲取用戶的IP地址,來源網(wǎng)址URL等網(wǎng)絡行為的數(shù)據(jù)信息,在獲取網(wǎng)絡行為數(shù)據(jù)信息時,請求用戶輸入電話號碼,當用戶輸入完電話號碼后,將該號碼及存放在網(wǎng)站數(shù)據(jù)庫中的該廣告客戶的電話號碼一并提交給通信網(wǎng)絡,通信網(wǎng)絡接通這兩電話號碼,通話結(jié)束以后,第二信息獲取模塊請求通信網(wǎng)絡返回該電話行為的數(shù)據(jù)信息,如用戶的電話號碼,有效通話時長等。在獲取網(wǎng)絡行為和電話行為數(shù)據(jù)信息以后,存儲模塊將網(wǎng)絡行為數(shù)據(jù)信息和電話行為數(shù)據(jù)行為一一對應存儲起來,該存儲模塊可以位于存入網(wǎng)絡廣告的網(wǎng)站,也可位于第三方網(wǎng)站,如廣告客戶的網(wǎng)站上。分析模塊從存儲模塊中提取數(shù)據(jù)信息,并進行分析,分析用戶的IP地址對應的電話號碼,當某個IP地址的用戶的有效通話時長小于預設時間,則對該IP地址和電話號碼進行處理,如為無效的IP地址和電話號碼,或者把該IP地址和電話號碼存入黑名單,該有效通話時長的預設時間可以設為2秒或5秒。當某個IP的用戶更換不同的電話號碼的次數(shù)超過預設頻率,則對該IP地址和電話號碼進行處理,如標記為無效的IP地址和電話號碼,或者把該IP地址和電話號碼存入黑名單。則該無效IP地址和電話號碼所對應的此次行為為無效行為。
以上對本發(fā)明所提供的一種數(shù)據(jù)信息獲取和分析的方法及裝置,進行了詳細介紹,本文中應用了具體個例對本發(fā)明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實施方式
及應用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應理解為對本發(fā)明的限定。
權(quán)利要求
1.一種針對數(shù)據(jù)對象的數(shù)據(jù)信息獲取和分析的方法,其特征在于,所述數(shù)據(jù)對象為包含網(wǎng)絡行為和電話行為的數(shù)據(jù)對象,所述方法包含如下步驟接收第一用戶觸發(fā),獲取針對該數(shù)據(jù)對象的網(wǎng)絡行為數(shù)據(jù)信息,所述數(shù)據(jù)信息包括用戶的IP地址;發(fā)送第一用戶和第二用戶的電話號碼,通知通信網(wǎng)絡連接第一用戶和第二用戶完成通話;獲取針對該數(shù)據(jù)對象的電話行為數(shù)據(jù)信息,所述數(shù)據(jù)信息包括用戶的電話號碼和有效通話時長;分析IP地址對應的電話號碼,當某個IP地址的用戶的有效通話時長小于預設時間,則此次觸發(fā)行為無效。
2.根據(jù)權(quán)利要求1所述的一種數(shù)據(jù)信息獲取和分析的方法,其特征在于,還包括當某個IP地址用戶在預置時間段內(nèi)采用超過預定個數(shù)的電話號碼進行通話,則該IP地址在預置時間段為無效IP地址,該無效IP地址在預置時間段對應的觸發(fā)行為均無效。
3.根據(jù)權(quán)利要求1所述的一種數(shù)據(jù)信息獲取和分析的方法,其特征在于,所述電話行為數(shù)據(jù)信息的獲取為通話結(jié)束后,接收通信網(wǎng)絡實時返回的針對該數(shù)據(jù)對象的電話行為數(shù)據(jù)信息。
4.根據(jù)權(quán)利要求1所述的一種數(shù)據(jù)信息獲取和分析的方法,其特征在于,所述的IP地址、電話號碼、有效通話時長對應存儲在展示數(shù)據(jù)對象的網(wǎng)站的數(shù)據(jù)庫中。
5.根據(jù)權(quán)利要求4所述的一種數(shù)據(jù)信息獲取和分析的方法,其特征在于,還包括將分散的針對同一數(shù)據(jù)對象的數(shù)據(jù)信息匯集后集中存儲至一數(shù)據(jù)庫中;所述同一數(shù)據(jù)對象分散在多個網(wǎng)站中進行展示。
6.根據(jù)權(quán)利要求1所述的一種數(shù)據(jù)信息獲取和分析的方法,其特征在于,所述的數(shù)據(jù)對象為網(wǎng)站上展示的網(wǎng)絡廣告。
7.根據(jù)權(quán)利要求6所述的一種數(shù)據(jù)信息獲取和分析的方法,其特征在于,所述獲取的數(shù)據(jù)對象的電話行為的數(shù)據(jù)信息為通信網(wǎng)絡提供給網(wǎng)站的通話記錄,所述的通話記錄包括呼叫終端客戶的電話號碼和網(wǎng)絡廣告廠商的電話號碼、呼叫終端客戶的IP、來源網(wǎng)址URL、有效通話開始時間、有效通話結(jié)束時間、有效通話時長、通話次數(shù)。
8.根據(jù)權(quán)利要求7所述的一種數(shù)據(jù)信息獲取和分析的方法,其特征在于,還包括獲取用戶的IP地址、通話記錄;分析每個IP用戶對應的通話記錄,如果某個IP的用戶的有效通話時間小于預設時間,或者某個IP的用戶在預置時間段內(nèi)采用超過預定個數(shù)的電話號碼進行通話,則該IP用戶為無效用戶。
9.根據(jù)權(quán)利要求7所述的一種數(shù)據(jù)獲取和分析的方法,其特征在于,還包括獲取用戶的通話記錄;分析不同電話號碼的通話記錄,如果某個電話號碼的通話次數(shù)超過預設頻率或者有效通話時長小于預設時間,則該電話用戶為無效用戶。
10.根據(jù)權(quán)利要求8或9所述的一種數(shù)據(jù)信息獲取和分析的方法,其特征在于,當IP用戶為無效用戶或者電話用戶為無效用戶時,確定該用戶的本次點擊行為無效,或者確定該用戶之后的所有點擊行為無效。
11.一種針對數(shù)據(jù)對象的數(shù)據(jù)信息獲取和分析的裝置,其特征在于,包含第一信息獲取模塊,用于接收第一用戶觸發(fā),獲取針對該數(shù)據(jù)對象的網(wǎng)絡行為數(shù)據(jù)信息,所述數(shù)據(jù)信息包括用戶的IP地址;第二信息獲取模塊,用于發(fā)送第一用戶和第二用戶的電話號碼,通知通信網(wǎng)絡連接第一用戶和第二用戶完成通話;以及,獲取針對該數(shù)據(jù)對象的電話行為數(shù)據(jù)信息,所述數(shù)據(jù)信息包括用戶的電話號碼和有效通話時長;第一分析模塊,用于分析IP地址對應的電話號碼,當某個IP地址用戶的有效通話時長小于預設時間,則此次觸發(fā)行為無效。
12.根據(jù)權(quán)利要求11所述的一種針對數(shù)據(jù)對象的數(shù)據(jù)信息獲取和分析的裝置,其特征在于,還包括當某個IP的用戶在預置時間段內(nèi)采用超過預定個數(shù)的電話號碼進行通話,則此次觸發(fā)行為無效。
13.根據(jù)權(quán)利要求11所述的一種針對數(shù)據(jù)對象的數(shù)據(jù)信息獲取和分析的裝置,其特征在于,所述電話行為數(shù)據(jù)信息的獲取為通話結(jié)束后,接收通信網(wǎng)絡實時返回的針對該數(shù)據(jù)對象的電話行為數(shù)據(jù)信息。
14.根據(jù)權(quán)利要求11所述的一種針對數(shù)據(jù)對象的數(shù)據(jù)信息獲取和分析的裝置,其特征在于,還包括一存儲模塊,用來存儲IP地址和對應的電話號碼、有效通話時長,所述存儲模塊位于展示所述數(shù)據(jù)對象的網(wǎng)站中。
15.根據(jù)權(quán)利要求14所述的一種針對數(shù)據(jù)對象的數(shù)據(jù)信息獲取和分析的裝置,還包括一數(shù)據(jù)庫,用于將分散的針對同一數(shù)據(jù)對象的數(shù)據(jù)信息匯集后集中存儲;所述同一數(shù)據(jù)對象分散在多個網(wǎng)站中進行展示。
16.根據(jù)權(quán)利要求11所述的一種針對數(shù)據(jù)對象的數(shù)據(jù)信息獲取和分析的裝置,其特征在于,所述的數(shù)據(jù)對象為網(wǎng)站上展示的網(wǎng)絡廣告。
17.根據(jù)權(quán)利要求16所述的一種數(shù)據(jù)信息獲取和分析的裝置,其特征在于,還包括第二分析模塊,用于分析每個IP用戶對應的通話記錄,如果某個IP的用戶的有效通話時間小于預設時間,或者某個IP的用戶在預置時間段內(nèi)采用超過預定個數(shù)的電話號碼進行通話,則該IP用戶為無效用戶,該IP地址對應的此次觸發(fā)行為為無效行為或者之后的所有觸發(fā)行為均無效。
18.根據(jù)權(quán)利要求16所述的一種數(shù)據(jù)信息獲取和分析的裝置,其特征在于,還包括第三分析模塊,用于分析不同電話號碼的通話記錄,如果某個電話號碼的通話次數(shù)超過預設頻率或者有效通話時長小于預設時間,則該電話號碼為無效號碼,該電話號碼對應的此次觸發(fā)行為為無效行為或者之后的所有觸發(fā)行為均無效。
全文摘要
本發(fā)明提供了一種針對數(shù)據(jù)對象的數(shù)據(jù)信息獲取和分析的方法和裝置,所述數(shù)據(jù)對象為包含網(wǎng)絡行為和電話行為的數(shù)據(jù)對象,所述方法包含如下步驟接收第一用戶觸發(fā),獲取針對該數(shù)據(jù)對象的網(wǎng)絡行為數(shù)據(jù)信息,所述數(shù)據(jù)信息包括用戶的IP地址;發(fā)送第一用戶和第二用戶的電話號碼,通知通信網(wǎng)絡連接第一用戶和第二用戶完成通話;獲取針對該數(shù)據(jù)對象的電話行為數(shù)據(jù)信息,所述數(shù)據(jù)信息包括用戶的電話號碼和有效通話時長;分析IP地址對應的電話號碼,當某個IP地址的用戶的有效通話時長小于預設時間,則此次觸發(fā)行為無效。本發(fā)明由于采用了網(wǎng)絡行為數(shù)據(jù)信息結(jié)合電話行為數(shù)據(jù)信息作為綜合分析的基礎,因此能有效的降低誤識別率,有效的提高識別效率。
文檔編號H04L12/24GK101014072SQ200710080269
公開日2007年8月8日 申請日期2007年2月15日 優(yōu)先權(quán)日2007年2月15日
發(fā)明者田軍, 陳永斌, 郭慶, 李俊 申請人:北京互聯(lián)易通信息技術(shù)有限公司