亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

還原推介流量數(shù)據(jù)的方法和裝置與流程

文檔序號:11929788閱讀:535來源:國知局
還原推介流量數(shù)據(jù)的方法和裝置與流程

本發(fā)明涉及網(wǎng)站分析領域,具體而言,涉及一種還原推介流量數(shù)據(jù)的方法和裝置。



背景技術:

目前,很多商家都在通過各式各樣的網(wǎng)絡用戶行為分析的方法的用戶流量瀏覽網(wǎng)站的行為習慣進行分析,以網(wǎng)絡用戶行為的分析結(jié)果作為改進網(wǎng)站布局和增加訪問量等商業(yè)目的重要數(shù)據(jù)來源。作為目前主流的網(wǎng)站分析方法,頁面標簽數(shù)據(jù)采集技術常常被使用在對網(wǎng)站的流量分析中;網(wǎng)站流量的主要來源類型有直接流量、搜索流量以及推介流量,推介流量是指用戶通過非鍵入目標網(wǎng)站的網(wǎng)址方式和通過非搜索引擎的其他網(wǎng)站來到目的網(wǎng)站所產(chǎn)生的流量,因此查找推介流量的流量來源,可以知曉目的網(wǎng)站當前的推介方法對目的網(wǎng)站是否適用,并且網(wǎng)站開發(fā)人員可以根據(jù)推介流量的統(tǒng)計結(jié)果對網(wǎng)站進行進一步的改進,故推介流量的流量來源值得深入分析。

在使用頁面標簽數(shù)據(jù)采集技術分析網(wǎng)絡用戶行為時,是利用訪問流量中的cookie數(shù)據(jù)對用戶行為進行統(tǒng)計分析的,然而在實際統(tǒng)計分析的過程中,由于cookie的可清除性和實效性,會導致部分來自于非搜索引擎的其他網(wǎng)站的推介流量數(shù)據(jù)會被誤統(tǒng)計為來自于目標網(wǎng)站本身的流量數(shù)據(jù)。例如當用戶通過非搜索引擎的其他網(wǎng)站進入目標網(wǎng)站后,進行了清除cookie的操作,當用戶在目標網(wǎng)站包含的頁面進行其他訪問時,由于之前的cookie已經(jīng)被清除,因此服務器會為清除cookie數(shù)據(jù)之后的訪問流量數(shù)據(jù)重新分配cookie數(shù)據(jù),然而新的cookie數(shù)據(jù)的字段中記錄此部分流量數(shù)據(jù)的來源是目標網(wǎng)站本身,而不是這段流量數(shù)據(jù)的真正來源,故新的cookie數(shù)據(jù)會導致流量的來源被誤統(tǒng)計。

針對在訪問終端通過訪問非搜索引擎的其他網(wǎng)站提供的鏈接地址進入目標網(wǎng)站之后,由于訪問終端中保存的本地訪問的cookie的時效性限制或用戶清除該cookie,使得繼續(xù)訪問該目標網(wǎng)站中的內(nèi)容時,網(wǎng)絡服務器產(chǎn)生的新cookie中未記錄該目標網(wǎng)站的原始來源,導致當前繼續(xù)訪問該目標網(wǎng)站中的內(nèi)容所產(chǎn)生的流量數(shù)據(jù)被誤統(tǒng)計為來自于目標網(wǎng)站自身訪問所產(chǎn)生的推介流量數(shù)據(jù)的問題,目前尚未提出有效的解決方案。



技術實現(xiàn)要素:

本發(fā)明實施例提供了一種還原推介流量數(shù)據(jù)的方法和裝置,以至少解決在訪問終端通過訪問非搜索引擎的其他網(wǎng)站提供的鏈接地址進入目標網(wǎng)站之后,由于cookie的時效性限制或用戶清除該cookie,使得繼續(xù)訪問該目標網(wǎng)站中的內(nèi)容時,網(wǎng)絡服務器產(chǎn)生的新cookie中未記錄該目標網(wǎng)站的原始來源,導致在cookie失效后或刪除cookie后的流量數(shù)據(jù)的來源被誤統(tǒng)計為來自于目標網(wǎng)站自身訪問所產(chǎn)生的推介流量數(shù)據(jù)的技術問題。

根據(jù)本發(fā)明實施例的一個方面,提供了一種還原推介流量的方法,包括:在目標網(wǎng)站的全部推介流量數(shù)據(jù)中提取待還原的流量數(shù)據(jù),其中,待還原的流量數(shù)據(jù)包括:訪問目標網(wǎng)站的當前訪問界面中的內(nèi)容以及當前訪問界面中的子界面的內(nèi)容所產(chǎn)生的流量數(shù)據(jù);獲取全部推介流量數(shù)據(jù)中除去待還原的流量數(shù)據(jù)之外的第一推介流量數(shù)據(jù)集合;從第一推介流量數(shù)據(jù)集合中,查找與待還原的流量數(shù)據(jù)的數(shù)據(jù)參數(shù)相匹配的第二推介流量數(shù)據(jù)集合,其中,數(shù)據(jù)參數(shù)包括:cookie字段、流量來源的設備屬性和/或訪問目標網(wǎng)站的過程中記錄的最后一個訪問頁面;從第二推介流量數(shù)據(jù)集合中查找與待還原的流量數(shù)據(jù)中訪問目標網(wǎng)站間隔最短的第三推介流量數(shù)據(jù);將第三推介流量數(shù)據(jù)與待還原的流量數(shù)據(jù)進行合并,以還原待還原的流量數(shù)據(jù)。

根據(jù)本發(fā)明實施例的另一方面,還提供了一種還原推介流量的裝置,包括:提取模塊,用于在目標網(wǎng)站的全部推介流量數(shù)據(jù)中提取待還原的流量數(shù)據(jù),其中,待還原的流量數(shù)據(jù)包括訪問目標網(wǎng)站的當前訪問界面中的內(nèi)容以及當前訪問界面中的子界面的內(nèi)容所產(chǎn)生的流量數(shù)據(jù);第一獲取模塊,用于獲取全部推介流量數(shù)據(jù)中除去待還原的流量數(shù)據(jù)之外的第一推介流量數(shù)據(jù)集合;第一查找模塊,用于從第一推介流量數(shù)據(jù)集合中查找與待還原的流量數(shù)據(jù)的數(shù)據(jù)參數(shù)相匹配的第二推介流量數(shù)據(jù)集合,其中,數(shù)據(jù)參數(shù)包括:cookie字段、流量來源的設備屬性和/或訪問目標網(wǎng)站的過程中記錄的最后一個訪問頁面;第二查找模塊,用于從第二推介流量數(shù)據(jù)集合中查找與待還原的流量數(shù)據(jù)中訪問目標網(wǎng)站間隔最短的第三推介流量數(shù)據(jù);合并模塊,用于將第三推介流量數(shù)據(jù)與待還原的流量數(shù)據(jù)進行合并,以還原待還原的流量數(shù)據(jù)。

在本發(fā)明實施例中,采用從目標網(wǎng)站的全畢業(yè)推介流量在中提取待還原的流量數(shù)據(jù)的方式,通過比對待還原的流量數(shù)據(jù)的數(shù)據(jù)參數(shù)和除待還原的流量數(shù)據(jù)以外的其余推介流量數(shù)據(jù)的數(shù)據(jù)參數(shù),達到了從除待還原的流量數(shù)據(jù)以外的其余推介流量數(shù)據(jù)中根據(jù)篩選條件逐層篩選查找待還原的流量數(shù)據(jù)原所屬的推介流量數(shù)據(jù)的目的,從而實現(xiàn)了待還原的流量數(shù)據(jù)與其原所屬的流量數(shù)據(jù)合并的技術效果,進一步的使待還原的流量數(shù)據(jù)根據(jù)其流量來源進行還原的技術效果,進而解決了在訪問終端通過訪問非搜 索引擎的其他網(wǎng)站提供的鏈接地址進入目標網(wǎng)站之后,由于cookie的時效性限制或用戶清除該cookie,使得繼續(xù)訪問該目標網(wǎng)站中的內(nèi)容時,網(wǎng)絡服務器產(chǎn)生的新cookie中未記錄該目標網(wǎng)站的原始來源,導致在cookie失效后或刪除cookie后的流量數(shù)據(jù)的來源被誤統(tǒng)計為來自于目標網(wǎng)站自身訪問所產(chǎn)生的推介流量數(shù)據(jù)的技術問題。

附圖說明

此處所說明的附圖用來提供對本發(fā)明的進一步理解,構成本申請的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構成對本發(fā)明的不當限定。在附圖中:

圖1是根據(jù)本發(fā)明實施例的一種還原推介流量數(shù)據(jù)的方法的流程圖;

圖2是根據(jù)本發(fā)明實施例的一種可選的還原推介流量數(shù)據(jù)的方法的流程圖;

圖3是根據(jù)本發(fā)明實施例的一種還原推介流量數(shù)據(jù)的裝置的示意圖;

圖4是根據(jù)本發(fā)明實施例的一種可選的還原推介流量數(shù)據(jù)的裝置的示意圖;

圖5是根據(jù)本發(fā)明實施例的一種可選的還原推介流量數(shù)據(jù)的裝置的示意圖;

圖6是根據(jù)本發(fā)明實施例的一種可選的還原推介流量數(shù)據(jù)的裝置的示意圖;

圖7是根據(jù)本發(fā)明實施例的一種可選的還原推介流量數(shù)據(jù)的裝置的示意圖;

圖8是根據(jù)本發(fā)明實施例的一種可選的還原推介流量數(shù)據(jù)的裝置的示意圖;以及

圖9是根據(jù)本發(fā)明實施例的一種可選的還原推介流量數(shù)據(jù)的裝置的示意圖。

具體實施方式

為了使本技術領域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分的實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都應當屬于本發(fā)明保護的范圍。

需要說明的是,本發(fā)明的說明書和權利要求書及上述附圖中的術語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應該理解這樣使用的數(shù)據(jù)在適當情況下可以互換,以便這里描述的本發(fā)明的實施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外,術語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方 法、系統(tǒng)、產(chǎn)品或設備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設備固有的其它步驟或單元。

下面對本申請涉及到的名詞解釋如下:

cookie:是服務器暫時存放在上網(wǎng)用戶的電腦里的資料,即一種文本文件,以便讓服務器能夠識別網(wǎng)絡用戶身份。當用戶訪問某一網(wǎng)站時,服務器會首先傳遞一份cookie資料放在用戶的訪問終端上。當用戶再次訪問同一個網(wǎng)站時,服務器便會把這次訪問數(shù)據(jù)歸并到同一用戶。

推介流量數(shù)據(jù):是指用戶通過非搜索引擎的其他網(wǎng)站來到特定網(wǎng)站的流量。

URL:統(tǒng)一資源定位符是對可以從互聯(lián)網(wǎng)上得到的資源的位置和訪問方法的一種簡潔的表示,是互聯(lián)網(wǎng)上標準資源的地址。

實施例1

根據(jù)本發(fā)明實施例,提供了一種還原推介流量數(shù)據(jù)的方法實施例,需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計算機可執(zhí)行指令的計算機系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。

圖1是根據(jù)本發(fā)明實施例的一種還原推介流量數(shù)據(jù)的方法的流程圖,如圖1所示,該方法包括如下步驟:

步驟S102,在目標網(wǎng)站的全部推介流量數(shù)據(jù)中提取待還原的流量數(shù)據(jù),其中,待還原的流量數(shù)據(jù)包括訪問目標網(wǎng)站的當前訪問界面中的內(nèi)容以及當前訪問界面中的子界面的內(nèi)容所產(chǎn)生的流量數(shù)據(jù)。

具體的,在上述步驟S102中,目標網(wǎng)站可以是用戶訪問的任意網(wǎng)站,可以通過獲取目標網(wǎng)站的全部流量數(shù)據(jù)的cookie字段包含的流量來源,從上述目標網(wǎng)站的全部流量數(shù)據(jù)中識別上述目標網(wǎng)站的推介流量數(shù)據(jù)。上述目標網(wǎng)站的推介流量可以是用戶的訪問終端通過任意非搜索引擎的方式進入目標網(wǎng)站所產(chǎn)生的流量,上述待還原的流量數(shù)據(jù)可以是用戶在訪問當前目標網(wǎng)站時,在當前目標網(wǎng)站進行進一步操作,繼續(xù)訪問當前訪問界面的內(nèi)容,或通過當前訪問界面提供的鏈接進入當前目標網(wǎng)站的兄弟網(wǎng)站或者當前目標網(wǎng)站子界面所產(chǎn)生的流量數(shù)據(jù)。

作為一種可選的實施例,以用戶當前訪問的購物網(wǎng)站為目標網(wǎng)站,在用戶訪問該購物網(wǎng)站產(chǎn)生的所有流量數(shù)據(jù)中,除去用戶通過搜索引擎的方式和直接鍵入購物網(wǎng)站網(wǎng)址的方式進入該購物網(wǎng)站所產(chǎn)生的流量,其余的流量可以認為是用戶訪問該購物網(wǎng) 站產(chǎn)生的全部推介流量。在該購物網(wǎng)站的全部推介流量中,有一部分推介流量數(shù)據(jù)是用戶在瀏覽其他網(wǎng)站時,其他網(wǎng)站通過浮動廣告等方式提供的包含該購物網(wǎng)站鏈接的廣告信息,用戶通過訪問上述廣告信息進入該購物網(wǎng)站所產(chǎn)生的推介流量數(shù)據(jù),還有一部分推介流量數(shù)據(jù)是用戶在訪問該購物網(wǎng)站時,訪問了購物網(wǎng)站當前訪問頁面提供的內(nèi)容或子界面提供的內(nèi)容所產(chǎn)生的推介流量數(shù)據(jù),可以認為用戶通過訪問上述廣告信息進入該購物網(wǎng)站所產(chǎn)生的推介流量數(shù)據(jù),還有一部分推介流量數(shù)據(jù)是用戶在訪問該購物網(wǎng)站時,訪問了購物網(wǎng)站當前訪問頁面提供的內(nèi)容或子界面提供的內(nèi)容所產(chǎn)生的推介流量數(shù)據(jù)是待還原的流量數(shù)據(jù)。

步驟S104,獲取全部推介流量數(shù)據(jù)中除去待還原的流量數(shù)據(jù)之外的第一推介流量數(shù)據(jù)集合。

作為一種可選的實施例,可以認為上述目標網(wǎng)站的全部推介由上述待還原的流量數(shù)據(jù)和除上述待還原的流量數(shù)據(jù)的剩余流量數(shù)據(jù)組成,并可以認為除上述待還原的流量數(shù)據(jù)的剩余流量數(shù)據(jù)為第一推介流量數(shù)據(jù)。

步驟S106,從第一推介流量數(shù)據(jù)集合中查找與待還原的流量數(shù)據(jù)的數(shù)據(jù)參數(shù)相匹配的第二推介流量數(shù)據(jù)集合,其中,數(shù)據(jù)參數(shù)包括:cookie字段、流量來源的設備屬性和/或訪問目標網(wǎng)站的最后一次訪問頁面的URL。

具體的,在上述步驟S106中,由于待還原的數(shù)據(jù)流量和原所屬的數(shù)據(jù)流量具有相同的數(shù)據(jù)參數(shù),因此通過比對待還原的流量數(shù)據(jù)和第一推介流量數(shù)據(jù)的數(shù)據(jù)參數(shù),可以得到可能是待還原的流量數(shù)據(jù)原所屬的數(shù)據(jù)流量,值得注意的是,上述步驟得到的數(shù)據(jù)流量可能是個數(shù)任意的推介流量數(shù)據(jù),在不存在與待還原的數(shù)據(jù)流量的數(shù)據(jù)參數(shù)相同的數(shù)據(jù)流量時,可以認為待還原的數(shù)據(jù)流量并未出現(xiàn)被誤統(tǒng)計的現(xiàn)象,在存在一條與待還原的數(shù)據(jù)流量的數(shù)據(jù)參數(shù)相同的數(shù)據(jù)流量時,可以判斷這一條數(shù)據(jù)流量是否為待還原的流量數(shù)據(jù)原所屬的推介流量數(shù)據(jù),在存在多條與待還原的數(shù)據(jù)流量的數(shù)據(jù)參數(shù)相同的流量數(shù)據(jù)時,可以在多條流量數(shù)據(jù)中查找待還原的流量數(shù)據(jù)原所屬的推介流量數(shù)據(jù)。

此處需要說明的是,上述第二推介流量數(shù)據(jù)集合可以包括N個推介流量數(shù)據(jù),此處N可以是自然數(shù)。

步驟S108,從第二推介流量數(shù)據(jù)集合中查找與待還原的流量數(shù)據(jù)中訪問目標網(wǎng)站間隔最短的第三推介流量數(shù)據(jù)。

具體的,在上述步驟S108中,在查找到多條與待還原的流量數(shù)據(jù)的數(shù)據(jù)參數(shù)相匹配的第二推介流量數(shù)據(jù)后,為了確定待還原的流量數(shù)據(jù)所屬的原推介流量數(shù)據(jù),采用 查找第二推介流量數(shù)據(jù)和待還原的流量數(shù)據(jù)中訪問間隔時間的方法查找待還原的流量數(shù)據(jù)原所屬的推介流量數(shù)據(jù),認為與待還原的流量數(shù)據(jù)訪問間隔時間最短的第二推介流量數(shù)據(jù)為第三推介流量數(shù)據(jù)。

步驟S110,將第三推介流量數(shù)據(jù)與待還原的流量數(shù)據(jù)進行合并,以還原待還原的流量數(shù)據(jù)。

具體的,在上述步驟S110中,可以認為第三推介流量數(shù)據(jù)是待還原的流量數(shù)據(jù)所屬的原推介數(shù)據(jù),因此將待還原的流量數(shù)據(jù)與第三推介流量數(shù)據(jù)合并。

在一種可選的實施例中,仍以目標網(wǎng)站為一購物網(wǎng)站為例,用戶在視頻網(wǎng)站觀看視頻時,該視頻網(wǎng)站多彈出包括上述購物網(wǎng)站的鏈接的廣告,用戶通過點擊上述包括購物網(wǎng)站鏈接的廣告進入該購物網(wǎng)站,在進入該購物網(wǎng)站進行訪問的過程中,用戶進行了清除訪問終端的cookie的操作,然后在用戶繼續(xù)訪問該購物網(wǎng)站時,服務器會為這一流量分配一個新的cookie字段,在這一新的cookie字段中記錄的用戶對該購物網(wǎng)站的訪問行為并非來自上述視頻網(wǎng)站,而是來自購物網(wǎng)站自身,因此用戶的清除訪問終端的cookie的行為導致上述來自視頻網(wǎng)站的推介流量數(shù)據(jù)被誤統(tǒng)計。

在另一種可選的實施例中,仍以目標網(wǎng)站為一購物網(wǎng)站為例,在流量監(jiān)控方定義cookie的時效性為30分鐘的情況下,用戶在視頻網(wǎng)站觀看視頻時,該視頻網(wǎng)站多彈出包括上述購物網(wǎng)站的鏈接的廣告,用戶通過點擊上述包括購物網(wǎng)站鏈接的廣告進入該購物網(wǎng)站,在訪問該購物網(wǎng)站進行訪問的過程中,剛好達到30分鐘,故30分鐘后服務器會為這一流量重新分配一個新的cookie,而在這一新的cookie字段中記錄的用戶對該購物網(wǎng)站的訪問行為并非來自上述視頻網(wǎng)站,而是來自購物網(wǎng)站自身,使得原本同為來上述視頻網(wǎng)站的推介流量數(shù)據(jù)被分為兩部分,且30分鐘的后的推介流量數(shù)據(jù)的來源被誤統(tǒng)計。

作為一種可選的實施例,仍以目標網(wǎng)站為一購物網(wǎng)站為例,待還原的流量數(shù)據(jù)可以是流量數(shù)據(jù)來源是購物網(wǎng)站自身的流量數(shù)據(jù),提取待還原的流量數(shù)據(jù),并將上述流量數(shù)據(jù)的數(shù)據(jù)參數(shù)與其余流量數(shù)據(jù)的數(shù)據(jù)參數(shù)進行比較,在數(shù)據(jù)參數(shù)一致的情況下,查找與待還原的流量數(shù)據(jù)的訪問間隔時間最短的流量數(shù)據(jù),并認為與待還原的流量數(shù)據(jù)的訪問間隔時間最短的流量數(shù)據(jù)為待還原的流量數(shù)據(jù)原所屬的流量數(shù)據(jù)。

由上可知,本申請上述實施例提供的方法通過在目標網(wǎng)站的全部推介流量數(shù)據(jù)中提取待還原的流量數(shù)據(jù),獲取全部推介流量數(shù)據(jù)中除去待還原的流量數(shù)據(jù)之外的第一推介流量數(shù)據(jù),并從第一推介流量數(shù)據(jù)中查找與待還原的流量數(shù)據(jù)的數(shù)據(jù)參數(shù)相匹配的第二推介流量數(shù)據(jù),其中,數(shù)據(jù)參數(shù)包括:cookie字段、流量來源的設備屬性和/ 或訪問目標網(wǎng)站之后記錄的最后一個訪問頁面,再從第二推介流量數(shù)據(jù)中查找與待還原的流量數(shù)據(jù)中訪問間隔最短的第三推介流量數(shù)據(jù),最后將第三推介流量數(shù)據(jù)與待還原的流量數(shù)據(jù)進行合并,以還原待還原的流量數(shù)據(jù),達到了查找待還原的流量數(shù)據(jù)的原所屬推介流量數(shù)據(jù)的技術下溝,實現(xiàn)了對誤統(tǒng)計的流量數(shù)據(jù)進行還原的目的,進而解決了在訪問終端通過訪問非搜索引擎的其他網(wǎng)站提供的鏈接地址進入目標網(wǎng)站之后,由于訪問終端中保存的本地訪問的cookie的時效性限制或用戶清除該cookie,使得繼續(xù)訪問該目標網(wǎng)站中的內(nèi)容時,網(wǎng)絡服務器產(chǎn)生的新cookie中未記錄該目標網(wǎng)站的原始來源,導致當前繼續(xù)訪問該目標網(wǎng)站中的內(nèi)容所產(chǎn)生的流量數(shù)據(jù)被誤統(tǒng)計為來自于目標網(wǎng)站自身訪問所產(chǎn)生的推介流量數(shù)據(jù)的技術問題。

可選的,在上述步驟S106中,從第一推介流量數(shù)據(jù)集合中查找與待還原的流量數(shù)據(jù)的數(shù)據(jù)參數(shù)相匹配的第二推介流量數(shù)據(jù)集合包括如下步驟:

步驟S1061,將待還原的流量數(shù)據(jù)的cookie字段與第一推介流量數(shù)據(jù)集合中包含的每個推介流量數(shù)據(jù)的cookie字段進行比對。

具體的,在上述步驟S1061中,第一推介流量數(shù)據(jù)中可以包含多個推介流量數(shù)據(jù)。

步驟S1063,從第一推介流量數(shù)據(jù)集合中篩選得到多個與待還原的流量數(shù)據(jù)的cookie字段一致的推介流量數(shù)據(jù)。

此處需要說明的是,上述cookie字段與待還原的流量數(shù)據(jù)的cookie字段一致的第一推介流量數(shù)據(jù)的個數(shù)可以是i個,i為小于等于N的自然數(shù)。

步驟S1065,獲取待還原的流量數(shù)據(jù)包含的首個訪問界面的地址信息和篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問界面的地址信息。

步驟S1067,判斷篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與待還原的流量數(shù)據(jù)中的首個訪問界面的地址信息是否相同。

作為一種可選的實施例,由于待還原的流量數(shù)據(jù)的誤統(tǒng)計是由于cookie數(shù)據(jù)被清除或cookie數(shù)據(jù)的時效性引起的,即由于cookie數(shù)據(jù)被清除或cookie數(shù)據(jù)的時效使得完整的推介流量數(shù)據(jù)被分為兩部分,因此待還原的流量數(shù)據(jù)應該與原所屬的流量數(shù)據(jù)可以連接成一條完整的流量數(shù)據(jù),故若篩選得到的多個推介流量數(shù)據(jù)中包括待還原流量數(shù)據(jù)原所屬的流量數(shù)據(jù),則待還原的流量數(shù)據(jù)的首個訪問頁面的地址信息應該與原所屬的推介流量數(shù)據(jù)的最后訪問界面的地址信息相同,具體的,上述地址信息可以是訪問界面的URL。

步驟S1069,在多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與首個 訪問界面的地址信息相同的情況下,確認篩選得到的多個推介流量數(shù)據(jù)中地址信息相同的推介流量數(shù)據(jù)構成第二推介流量數(shù)據(jù)集合。

具體的,在上述步驟S1067中,從多個推介流量數(shù)據(jù)中篩選的最后一個訪問頁面的地址信息與首個訪問界面的地址信息相同的流量數(shù)據(jù)可以是多個,上述多個推介流量數(shù)據(jù)構成了第二推介流量數(shù)據(jù)集合。

在一種可選的實施例中,仍以上述目標網(wǎng)站為購物網(wǎng)站為例,在用戶通過包括此購物網(wǎng)站鏈接的廣告的視頻網(wǎng)站進入購物網(wǎng)站后,在用戶瀏覽購物網(wǎng)站時,出現(xiàn)了由于cookie的有效時間截止導致的cookie的有效時間截止后的訪問流量數(shù)據(jù)被統(tǒng)計為新的推介流量數(shù)據(jù),這一新的推介流量數(shù)據(jù)就是待還原的流量數(shù)據(jù);由于新的推介流量數(shù)據(jù)的起始記錄來源是購物網(wǎng)站自身,因此服務器為新的推介流量數(shù)據(jù)分配新的cookie所記錄的推介流量數(shù)據(jù)的來源會被誤記錄為來自購物網(wǎng)站自身。由于新的推介流量數(shù)據(jù)與原所屬的流量數(shù)據(jù)具有數(shù)據(jù)參數(shù)相同,且前后連續(xù)的特點,因此比對新的推介流量數(shù)據(jù)的cookie字段和其余推介流量數(shù)據(jù)的cookie字段,在二者的cookie字段一致的情況下,比對新的推介流量的首個訪問界面的地址信息和其余推介流量數(shù)據(jù)的最后一個訪問界面的地址信息,將最后一個訪問界面的地址信息與新的推介流量的首個訪問界面的地址信息一致的推介流量構成第二推介流量數(shù)據(jù),并進入下一個篩選待還原的流量數(shù)據(jù)的原所屬流量數(shù)據(jù)的步驟。

由上可知,本申請上述實施例提供的上述方法通過將待還原的流量數(shù)據(jù)的cookie字段與第一推介流量數(shù)據(jù)集合中包含的每個推介流量數(shù)據(jù)的cookie字段進行比對,從第一推介流量數(shù)據(jù)集合中篩選得到多個與待還原的流量數(shù)據(jù)的cookie字段一致的推介流量數(shù)據(jù),獲取待還原的流量數(shù)據(jù)包含的首個訪問界面的地址信息和篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問界面的地址信息,并判斷篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與待還原的流量數(shù)據(jù)中的首個訪問界面的地址信息是否相同,最終在多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與首個訪問界面的地址信息相同的情況下,確認篩選得到的多個推介流量數(shù)據(jù)中地址信息相同的推介流量數(shù)據(jù)構成第二推介流量數(shù)據(jù)集合,完成了在推介流量數(shù)據(jù)中查找可能是待還原的流量數(shù)據(jù)的原所屬的推介流量數(shù)據(jù)的目的,達到了在除待還原的流量數(shù)據(jù)之外的其他流量數(shù)據(jù)中查找與待還原的流量數(shù)據(jù)原所屬的流量數(shù)據(jù)的技術效果,解決了在推介流量數(shù)據(jù)中查找待還原的流量數(shù)據(jù)的原所屬流量數(shù)據(jù)的技術問題。

可選的,在上述步驟S106中,從第一推介流量數(shù)據(jù)集合中查找與待還原的流量數(shù)據(jù)的數(shù)據(jù)參數(shù)相匹配的第二推介流量數(shù)據(jù)集合的步驟包括:

步驟S1071,將待還原的流量數(shù)據(jù)的cookie字段與第一推介流量數(shù)據(jù)集合中包含 的每個推介流量數(shù)據(jù)的cookie字段進行比對。

具體的,在上述步驟S1071中,第一推介流量數(shù)據(jù)集合包含多個推介流量數(shù)據(jù)。

步驟S1073,從第一推介流量數(shù)據(jù)集合中篩選得到多個與待還原的流量數(shù)據(jù)的cookie字段不一致的推介流量數(shù)據(jù)。

此處需要注意的是,從第一推介流量數(shù)據(jù)集合中篩選得到的多個與待還原的流量數(shù)據(jù)的cookie字段不一致的推介流量數(shù)據(jù)可以是j個,其中,j為小于等于N的自然數(shù)。此處j與上述i不同的是,i代表與待還原的流量數(shù)據(jù)的cookie字段一致的推介流量數(shù)據(jù)的數(shù)目;j代表與待還原的流量數(shù)據(jù)的cookie字段不一致的推介流量數(shù)據(jù)的數(shù)目。

步驟S1075,從多個與待還原的流量數(shù)據(jù)的cookie字段不一致的推介流量數(shù)據(jù)中篩選得到設備屬性相同的多個推介流量數(shù)據(jù)。

具體的,在上述步驟S1075中,設備屬性可以包括:操作系統(tǒng)、瀏覽器、屏幕分辨率、色深以及訪問終端是否為移動設備。此處需要注意的是,從多個與待還原的流量數(shù)據(jù)的cookie字段不一致的推介流量數(shù)據(jù)中篩選得到設備屬性相同的多個推介流量數(shù)據(jù)可以是k個,其中,k是小于等于j的自然數(shù)。

步驟S1077,獲取待還原的流量數(shù)據(jù)包含的首個訪問界面的地址信息和篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問界面的地址信息。

具體的,在上述步驟S1077中,訪問界面的地址信息可以是訪問界面的URL。當多個推介流量數(shù)據(jù)中記錄的最后一個訪問界面地址信息與待還原的流量數(shù)據(jù)包含的首個訪問界面的地址信息相同時,可以認為多個推介流量中包含待還原流量數(shù)據(jù)原所屬的流量數(shù)據(jù),因此獲取待還原的流量數(shù)據(jù)包含的首個訪問界面的地址信息和篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問界面的地址信息以便在多個推介流量數(shù)據(jù)中進一步篩選待還原流量數(shù)據(jù)的原所屬推介流量數(shù)據(jù)。

步驟S1079,判斷篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與待還原的流量數(shù)據(jù)中的首個訪問界面的地址信息是否相同。

步驟S1081,在多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與首個訪問界面的地址信息相同的情況下,確認篩選得到的多個推介流量數(shù)據(jù)中地址信息相同的推介流量數(shù)據(jù)構成第二推介流量數(shù)據(jù)集合。

作為一種可選的實施例,推介流量數(shù)據(jù)的來源被誤統(tǒng)計是由于cookie數(shù)據(jù)的時效性或用戶清除了cookie數(shù)據(jù)導致的,這使得待還原的流量數(shù)據(jù)與其所屬的原推介流量 數(shù)據(jù)是連續(xù)的,因此上述步驟確認篩選得到的多個推介流量數(shù)據(jù)中地址信息相同的推介流量數(shù)據(jù)構成第二推介流量數(shù)據(jù)集合,第二推介流量數(shù)據(jù)集合包括待還原的流量數(shù)據(jù)的原所屬的推介流量數(shù)據(jù)。

由上可知,本申請上述實施例提供的方法通過比對待還原的流量數(shù)據(jù)的cookie字段與第一推介流量數(shù)據(jù)集合中包含的每個推介流量數(shù)據(jù)的cookie字段,從第一推介流量數(shù)據(jù)集合中篩選得到多個個與待還原的流量數(shù)據(jù)的cookie字段不一致的推介流量數(shù)據(jù),再從多個與待還原的流量數(shù)據(jù)的cookie字段不一致的推介流量數(shù)據(jù)中篩選得到設備屬性相同的多個推介流量數(shù)據(jù),并在獲取待還原的流量數(shù)據(jù)包含的首個訪問界面的地址信息和篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問界面的地址信息之后判斷篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與待還原的流量數(shù)據(jù)中的首個訪問界面的地址信息是否相同,在多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與首個訪問界面的地址信息相同的情況下,確認篩選得到的多個推介流量數(shù)據(jù)中地址信息相同的推介流量數(shù)據(jù)構成第二推介流量數(shù)據(jù)集合,實現(xiàn)了對于cookie字段與待還原的流量數(shù)據(jù)的cookie字段不一致的多個推介流量進行進一步判斷的目的,通過比對待還原的流量數(shù)據(jù)和多個推介流量數(shù)據(jù)包含的其他參數(shù),達到了查找與待還原的流量數(shù)據(jù)來自同一訪問終端的推介流量數(shù)據(jù)的技術效果,進一步達到了查找可能與待還原的流量數(shù)據(jù)存在前后連接關系的推介流量數(shù)據(jù)的技術效果,進而解決了在推介流量數(shù)據(jù)中查找待還原的流量數(shù)據(jù)的原所屬流量數(shù)據(jù)的技術問題。

可選的,在上述步驟S108中,從第二推介流量數(shù)據(jù)集合中查找與待還原的流量數(shù)據(jù)中訪問間隔最短的第三推介流量數(shù)據(jù),包括:

步驟S1081:獲取待還原的流量數(shù)據(jù)包含的首個訪問界面的會話開始時間。

步驟S1083:獲取第二推介流量數(shù)據(jù)集合中包含的每個推介流量數(shù)據(jù)中記錄最后訪問界面的會話結(jié)束時間。

具體的,在上述步驟S1083中,第二推介流量數(shù)據(jù)集合中包含的每個推介流量數(shù)據(jù)中記錄的最后訪問界面可以是上述每個推介流量數(shù)據(jù)在統(tǒng)計時,統(tǒng)計時間截止時所訪問的界面。

步驟S1085計算首個訪問界面的會話開始時間與每個最后訪問界面的會話結(jié)束時間的時間間隔。

步驟S1087:將第二推介流量數(shù)據(jù)集合中對應的訪問間隔最短的推介流量數(shù)據(jù)作為第三推介流量數(shù)據(jù)。

具體的,在上述步驟S1087中,第二推介流量數(shù)據(jù)集合包含多條流量數(shù)據(jù),可以認為有多個推介流量數(shù)據(jù)的最后訪問界面的地址信息與待還原的流量數(shù)據(jù)的地址信息相同,在多個與待還原的流量數(shù)據(jù)的地址信息相同的推介流量數(shù)據(jù)中,其中只有一條可以為待還原的流量數(shù)據(jù)原所屬的推介流量數(shù)據(jù),可以認為與待還原的流量數(shù)據(jù)訪問間隔時間最短的推介流量數(shù)據(jù)為待還原的流量數(shù)據(jù)原所屬的推介流量數(shù)據(jù)。

由上可知,本申請上述實施例提供的方法通過獲取待還原的流量數(shù)據(jù)包含的首個訪問界面的會話開始時間和第二推介流量數(shù)據(jù)集合中包含的每個推介流量數(shù)據(jù)中記錄最后訪問界面的會話結(jié)束時間,并計算上述兩個會話時間的時間差,再將第二推介流量數(shù)據(jù)集合中對應的訪問間隔最短的推介流量數(shù)據(jù)作為第三推介流量數(shù)據(jù),其中,上述第三推介流量數(shù)據(jù)可以認為是待還原的流量數(shù)據(jù)原所屬的推介流量數(shù)據(jù),達到了對上述步驟中篩選得到的多個可能是待還原的流量數(shù)據(jù)的原所屬的推介流量數(shù)據(jù)進行進一步篩選的技術效果,解決了確定待還原的流量數(shù)據(jù)原所屬的推介流量數(shù)據(jù)的技術問題。

可選地,在上述步驟S110中,在目標網(wǎng)站的全部推介流量數(shù)據(jù)中提取待還原的流量數(shù)據(jù)的步驟包括:

步驟S1101:獲取全部推介流量數(shù)據(jù)的來源主機名。

步驟S1103:判斷全部推介流量數(shù)據(jù)的來源主機名是否包含目標網(wǎng)站的網(wǎng)站域名或目標網(wǎng)站的兄弟網(wǎng)站的網(wǎng)站域名。

具體的,在上述步驟S1103中,兄弟網(wǎng)站可以是與目標網(wǎng)站隸屬與統(tǒng)一總網(wǎng)站的的網(wǎng)站,例如同一購物網(wǎng)站中的不同商品的網(wǎng)站可以被認為是互相為對方的兄弟網(wǎng)站。

步驟S1105:確認來源主機名包含目標網(wǎng)站或目標網(wǎng)站的兄弟網(wǎng)站的網(wǎng)站域名的推介流量數(shù)據(jù)為待還原的流量數(shù)據(jù)。

由此可知,本申請上述實施例通過在全部推介流量數(shù)據(jù)中查找來源主機名包含目標網(wǎng)站的網(wǎng)站域名或目標網(wǎng)站的兄弟網(wǎng)站的網(wǎng)站域名的推介流量數(shù)據(jù)的方法,確認來源主機名包含目標網(wǎng)站或目標網(wǎng)站的兄弟網(wǎng)站的網(wǎng)站域名的推介流量數(shù)據(jù)為待還原的流量數(shù)據(jù),達到了在全部推介流量數(shù)據(jù)中查找來自于目標網(wǎng)站自身的流量數(shù)據(jù);解決了在全部推介流量數(shù)據(jù)中提取流量數(shù)據(jù)來源有可能被誤統(tǒng)計的推介流量數(shù)據(jù)。

可選的,在上述步驟S1067中,在判斷篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與待還原的流量數(shù)據(jù)中的首個訪問界面的地址信息是否相同之后的步驟還包括:

步驟S10671:在多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與首個訪問界面的地址信息不相同的情況下,放棄還原多個推介流量數(shù)據(jù)。

由上可知,本申請?zhí)岢龅纳鲜鰧嵤├捎迷诙鄠€推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與首個訪問界面的地址信息不相同的情況下,放棄還原多個推介流量數(shù)據(jù)的方法,完成了對待還原的流量數(shù)據(jù)的原所屬推介流量數(shù)據(jù)的篩選,達到了放棄非待還原的流量數(shù)據(jù)的原所屬推介流量數(shù)據(jù)的技術效果。

可選的,在上述步驟S1077中,在獲取待還原的流量數(shù)據(jù)包含的首個訪問界面的地址信息和篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問界面的地址信息之后的步驟還包括:

在多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與首個訪問界面的地址信息不相同的情況下,放棄還原多個推介流量數(shù)據(jù)。

由上可知,本申請?zhí)岢龅纳鲜鰧嵤├捎迷诙鄠€推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與首個訪問界面的地址信息不相同的情況下,放棄還原多個推介流量數(shù)據(jù)的方法,完成了對待還原的流量數(shù)據(jù)的原所屬推介流量數(shù)據(jù)的篩選,達到了放棄非待還原的流量數(shù)據(jù)的原所屬推介流量數(shù)據(jù)的技術效果。

圖2是根據(jù)本發(fā)明實施例的一種可選的還原推介流量數(shù)據(jù)的方法的流程圖,結(jié)合圖2所示的流程圖,下面對一種可選的應用場景下的還原推介流量數(shù)據(jù)的方法進行詳細描述如下:

S21:從全部流量數(shù)據(jù)中提取待還原的流量數(shù)據(jù)。

具體的,在上述步驟S21中,在目標網(wǎng)站的全部推介流量數(shù)據(jù)中提取待還原的流量數(shù)據(jù)。

S22:獲取全部流量數(shù)據(jù)中除提取待還原的流量數(shù)據(jù)以外的第一推介流量數(shù)據(jù)。

具體的,在上述步驟S22中,獲取第一推介流量數(shù)據(jù),即目標網(wǎng)站中除待提取的流量數(shù)據(jù)以外的其他數(shù)據(jù)。

S23:對比第一推介流量數(shù)據(jù)的cookie字段與待還原的流量數(shù)據(jù)的cookie字段。

S24:判斷對比結(jié)果是否一致。

具體的,在上述步驟S24中,判斷第一推介流量數(shù)據(jù)的cookie字段與待還原的流量數(shù)據(jù)的cookie字段的比對結(jié)果是否一致,在比對結(jié)果一致時進入步驟S25,比對結(jié)果不一致時進入步驟S29。

S25:比對待還原的流量數(shù)據(jù)與第一推介流量數(shù)據(jù)的最后訪問頁面的地址信息。

具體的,在上述步驟S25中,比對待還原的流量數(shù)據(jù)的首個訪問頁面的地址信息和第一推介流量數(shù)據(jù)合集中每個推介流量數(shù)據(jù)的最后訪問頁面的地址信息。

S26:判斷對比結(jié)果是否一致。

具體的,在上述步驟S26中,判斷待還原的流量數(shù)據(jù)的首個訪問頁面的地址信息和第一推介流量數(shù)據(jù)合集中每個推介流量數(shù)據(jù)的最后訪問頁面的地址信息是否一致,在比對結(jié)果一致時進入步驟S27,比對結(jié)果不一致時進入步驟S213。

S27:確認與待還原流量數(shù)據(jù)訪問間隔時間最短的第三流量數(shù)據(jù)為待還原的流量數(shù)據(jù)原所屬的流量數(shù)據(jù)。

S28:將待還原的流量數(shù)據(jù)與原所屬的流量數(shù)據(jù)合并。

具體的,在上述步驟S28中,認為上述第三流量數(shù)據(jù)為待還原的流量數(shù)據(jù)原所屬的推介流量數(shù)據(jù)。

S29:對比第一推介流量數(shù)據(jù)與待還原的流量數(shù)據(jù)的設備屬性。

具體的,在上述步驟S29中,對比第一推介流量數(shù)據(jù)與待還原的流量數(shù)據(jù)的設備屬性,其中,設備屬性可以包括:操作系統(tǒng)、瀏覽器、屏幕分辨率、屏幕色深和是否為移動設備。

S210:判斷對比結(jié)果是否一致。

具體的,在上述步驟S210中,在在對比第一推介流量數(shù)據(jù)與待還原的流量數(shù)據(jù)的設備屬性的結(jié)果一致時進入步驟S211,比對結(jié)果不一致時進入步驟S213。

S211:比對待還原的流量數(shù)據(jù)與第一推介流量數(shù)據(jù)的最后訪問頁面的地址信息。

具體的,在上述步驟S211中,比對待還原的流量數(shù)據(jù)的首個訪問頁面的地址信息與第一推介流量數(shù)據(jù)浴的最后訪問頁面的地址信息。

S212:判斷對比結(jié)果是否一致。

具體的,在上述步驟S212中,在比對待還原的流量數(shù)據(jù)的首個訪問頁面的地址信息與第一推介流量數(shù)據(jù)浴的最后訪問頁面的地址信息結(jié)果一致時進入步驟S27,比對結(jié)果不一致時進入步驟S213。

S213:放棄還原此部分待還原流量數(shù)據(jù)。

具體的,在上述步驟S213中,在經(jīng)過上述步驟的篩選仍不能找到待還原的流量數(shù)據(jù)的原所屬的推介流量數(shù)據(jù),則放棄還原此部分流量數(shù)據(jù)。

實施例2

根據(jù)本發(fā)明實施例,提供了一種獲取視頻的播放結(jié)果的裝置實施例。

圖3是根據(jù)本發(fā)明實施例的一種還原推介流量數(shù)據(jù)的裝置的示意圖,如圖3所示,該裝置包括:提取模塊30、第一獲取模塊32、第一查找模塊34、第二查找模塊36和合并模塊38。其中,

提取模塊30,用于在目標網(wǎng)站的全部推介流量數(shù)據(jù)中提取待還原的流量數(shù)據(jù),其中,待還原的流量數(shù)據(jù)包括訪問目標網(wǎng)站的當前訪問界面中的內(nèi)容以及當前訪問界面中的子界面的內(nèi)容所產(chǎn)生的流量數(shù)據(jù)。

具體的,在上述裝置中,目標網(wǎng)站可以是用戶訪問的任意網(wǎng)站,可以通過獲取目標網(wǎng)站的全部流量數(shù)據(jù)的cookie字段包含的流量來源,從上述目標網(wǎng)站的全部流量數(shù)據(jù)中識別上述目標網(wǎng)站的推介流量數(shù)據(jù)。上述目標網(wǎng)站的推介流量可以是用戶的訪問終端通過任意非搜索引擎的方式進入目標網(wǎng)站所產(chǎn)生的流量,上述待還原的流量數(shù)據(jù)可以是用戶在訪問當前目標網(wǎng)站時,在當前目標網(wǎng)站進行進一步操作,繼續(xù)訪問當前訪問界面的內(nèi)容,或通過當前訪問界面提供的鏈接進入當前目標網(wǎng)站的兄弟網(wǎng)站或者當前目標網(wǎng)站子界面所產(chǎn)生的流量數(shù)據(jù)。

第一獲取模塊32,用于獲取全部推介流量數(shù)據(jù)中除去待還原的流量數(shù)據(jù)之外的第一推介流量數(shù)據(jù)集合;

第一查找模塊34,用于從第一推介流量數(shù)據(jù)集合中查找與待還原的流量數(shù)據(jù)的數(shù)據(jù)參數(shù)相匹配的第二推介流量數(shù)據(jù)集合,其中,數(shù)據(jù)參數(shù)包括:cookie字段、流量來源的設備屬性和/或訪問目標網(wǎng)站的過程中記錄的最后一個訪問頁面。

具體的,在上述裝置中,由于待還原的數(shù)據(jù)流量和原所屬的數(shù)據(jù)流量具有相同的數(shù)據(jù)參數(shù),因此通過比對待還原的流量數(shù)據(jù)和第一推介流量數(shù)據(jù)的數(shù)據(jù)參數(shù),可以得到可能是待還原的流量數(shù)據(jù)原所屬的數(shù)據(jù)流量,值得注意的是,上述步驟得到的數(shù)據(jù)流量可能是個數(shù)任意的推介流量數(shù)據(jù),在不存在與待還原的數(shù)據(jù)流量的數(shù)據(jù)參數(shù)相同的數(shù)據(jù)流量時,可以認為待還原的數(shù)據(jù)流量并未出現(xiàn)被誤統(tǒng)計的現(xiàn)象,在存在一條與待還原的數(shù)據(jù)流量的數(shù)據(jù)參數(shù)相同的數(shù)據(jù)流量時,可以判斷這一條數(shù)據(jù)流量是否為待還原的流量數(shù)據(jù)原所屬的推介流量數(shù)據(jù),在存在多條與待還原的數(shù)據(jù)流量的數(shù)據(jù)參數(shù)相同的流量數(shù)據(jù)時,可以在多條流量數(shù)據(jù)中查找待還原的流量數(shù)據(jù)原所屬的推介流量數(shù)據(jù)。

第二查找模塊36,用于從第二推介流量數(shù)據(jù)集合中查找與待還原的流量數(shù)據(jù)中訪問間隔最短的第三推介流量數(shù)據(jù)。

具體的,在上述裝置中,在查找到多條與待還原的流量數(shù)據(jù)的數(shù)據(jù)參數(shù)相匹配的第二推介流量數(shù)據(jù)后,為了確定待還原的流量數(shù)據(jù)所屬的原推介流量數(shù)據(jù),采用第二 查找模塊查找待還原的流量數(shù)據(jù)原所屬的推介流量數(shù)據(jù),認為與待還原的流量數(shù)據(jù)訪問間隔時間最短的第二推介流量數(shù)據(jù)為第三推介流量數(shù)據(jù)。

合并模塊38,用于將第三推介流量數(shù)據(jù)與待還原的流量數(shù)據(jù)進行合并,以還原待還原的流量數(shù)據(jù)。

由上可知,本申請上述實施例提供的裝置通過提取模塊在目標網(wǎng)站的全部推介流量數(shù)據(jù)中提取待還原的流量數(shù)據(jù),通過第一獲取模塊獲取全部推介流量數(shù)據(jù)中除去待還原的流量數(shù)據(jù)之外的第一推介流量數(shù)據(jù),并通過第一查找模塊從第一推介流量數(shù)據(jù)中查找與待還原的流量數(shù)據(jù)的數(shù)據(jù)參數(shù)相匹配的第二推介流量數(shù)據(jù),其中,數(shù)據(jù)參數(shù)包括:cookie字段、流量來源的設備屬性和/或訪問目標網(wǎng)站之后記錄的最后一個訪問頁面,再通過第二查找模塊從第二推介流量數(shù)據(jù)中查找與待還原的流量數(shù)據(jù)中訪問間隔最短的第三推介流量數(shù)據(jù),最后通過合并模塊將第三推介流量數(shù)據(jù)與待還原的流量數(shù)據(jù)進行合并,以還原待還原的流量數(shù)據(jù),達到了查找待還原的流量數(shù)據(jù)的原所屬推介流量數(shù)據(jù)的技術下溝,實現(xiàn)了對誤統(tǒng)計的流量數(shù)據(jù)進行還原的目的,進而解決了在訪問終端通過訪問非搜索引擎的其他網(wǎng)站提供的鏈接地址進入目標網(wǎng)站之后,由于訪問終端中保存的本地訪問的cookie的時效性限制或用戶清除該cookie,使得繼續(xù)訪問該目標網(wǎng)站中的內(nèi)容時,網(wǎng)絡服務器產(chǎn)生的新cookie中未記錄該目標網(wǎng)站的原始來源,導致當前繼續(xù)訪問該目標網(wǎng)站中的內(nèi)容所產(chǎn)生的流量數(shù)據(jù)被誤統(tǒng)計為來自于目標網(wǎng)站自身訪問所產(chǎn)生的推介流量數(shù)據(jù)的技術問題。

可選地,如圖4所示,在上述裝置中,第一查找模塊包括:第一比對模塊40、第一篩選模塊42、第二獲取模塊44、第一判斷模塊46和第一確認模塊48。其中,

第一比對模塊40,將待還原的流量數(shù)據(jù)的cookie字段與第一推介流量數(shù)據(jù)集合中包含的每個推介流量數(shù)據(jù)的cookie字段進行比對。

第一篩選模塊42,用于從第一推介流量數(shù)據(jù)集合中篩選得到多個與待還原的流量數(shù)據(jù)的cookie字段一致的推介流量數(shù)據(jù)。

第二獲取模塊44,用于獲取待還原的流量數(shù)據(jù)包含的首個訪問界面的地址信息和篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問界面的地址信息。

第一判斷模塊46,用于判斷篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與待還原的流量數(shù)據(jù)中的首個訪問界面的地址信息是否相同。

第一確認模塊48,用于在多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與首個訪問界面的地址信息相同的情況下,確認篩選得到的多個推介流量數(shù)據(jù)中地址信息相同的推介流量數(shù)據(jù)構成第二推介流量數(shù)據(jù)集合。

具體的,在上述裝置中,從多個推介流量數(shù)據(jù)中篩選的最后一個訪問頁面的地址信息與首個訪問界面的地址信息相同的流量數(shù)據(jù)可以是多個,上述多個推介流量數(shù)據(jù)構成了第二推介流量數(shù)據(jù)集合。

由上可知,本申請上述實施例提供的上述裝置通過第一比對模塊將待還原的流量數(shù)據(jù)的cookie字段與第一推介流量數(shù)據(jù)集合中包含的每個推介流量數(shù)據(jù)的cookie字段進行比對,通過第一篩選模塊從第一推介流量數(shù)據(jù)集合中篩選得到多個與待還原的流量數(shù)據(jù)的cookie字段一致的推介流量數(shù)據(jù),通過第二獲取模塊獲取待還原的流量數(shù)據(jù)包含的首個訪問界面的地址信息和篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問界面的地址信息,并通過第一判斷模塊判斷篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與待還原的流量數(shù)據(jù)中的首個訪問界面的地址信息是否相同,最終在多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與首個訪問界面的地址信息相同的情況下,通過第一確認模塊確認篩選得到的多個推介流量數(shù)據(jù)中地址信息相同的推介流量數(shù)據(jù)構成第二推介流量數(shù)據(jù)集合,完成了在推介流量數(shù)據(jù)中查找可能是待還原的流量數(shù)據(jù)的原所屬的推介流量數(shù)據(jù)的目的,達到了在除待還原的流量數(shù)據(jù)之外的其他流量數(shù)據(jù)中查找與待還原的流量數(shù)據(jù)原所屬的流量數(shù)據(jù)的技術效果,解決了在推介流量數(shù)據(jù)中查找待還原的流量數(shù)據(jù)的原所屬流量數(shù)據(jù)的技術問題。

可選地,如圖5所示,在上述裝置中,第一查找模塊還可以包括:第二比對模塊50、第二篩選模塊52、第三篩選模塊54、第三獲取模塊56、第二判斷模塊58和第二確認模塊510。其中,

第二比對模塊50,用于將待還原的流量數(shù)據(jù)的cookie字段與第一推介流量數(shù)據(jù)集合中包含的每個推介流量數(shù)據(jù)的cookie字段進行比對。

第二篩選模塊52,用于從第一推介流量數(shù)據(jù)集合中篩選得到多個與待還原的流量數(shù)據(jù)的cookie字段不一致的推介流量數(shù)據(jù)。

第三篩選模塊54,用于從多個與待還原的流量數(shù)據(jù)的cookie字段不一致的推介流量數(shù)據(jù)中篩選得到設備屬性相同的多個推介流量數(shù)據(jù)。

具體的,在上述裝置中,設備屬性可以包括多個與待還原的流量數(shù)據(jù)的cookie字段不一致的推介流量數(shù)據(jù)和待還原的流量數(shù)據(jù)的操作系統(tǒng)、瀏覽器、屏幕分辨率、色深以及訪問終端是否為移動設備。

第三獲取模塊56,用于獲取待還原的流量數(shù)據(jù)包含的首個訪問界面的地址信息和篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問界面的地址信息。

具體的,在上述裝置中,訪問界面的地址信息可以是訪問界面的URL。當多個推 介流量數(shù)據(jù)中記錄的最后一個訪問界面地址信息與待還原的流量數(shù)據(jù)包含的首個訪問界面的地址信息相同時,可以認為多個推介流量中包含待還原流量數(shù)據(jù)原所屬的流量數(shù)據(jù),因此獲取待還原的流量數(shù)據(jù)包含的首個訪問界面的地址信息和篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問界面的地址信息以便在多個推介流量數(shù)據(jù)中進一步篩選待還原流量數(shù)據(jù)的原所屬推介流量數(shù)據(jù)。

第二判斷模塊58,用于判斷篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與待還原的流量數(shù)據(jù)中的首個訪問界面的地址信息是否相同。

第二確認模塊510,用于在多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與首個訪問界面的地址信息相同的情況下,確認篩選得到的多個推介流量數(shù)據(jù)中地址信息相同的推介流量數(shù)據(jù)構成第二推介流量數(shù)據(jù)集合。

由上可知,本申請上述實施例提供的裝置通過第二比對模塊比對待還原的流量數(shù)據(jù)的cookie字段與第一推介流量數(shù)據(jù)集合中包含的每個推介流量數(shù)據(jù)的cookie字段,通過第二篩選模塊從第一推介流量數(shù)據(jù)集合中篩選得到多個與待還原的流量數(shù)據(jù)的cookie字段不一致的推介流量數(shù)據(jù),再通過第三篩選模塊從多個與待還原的流量數(shù)據(jù)的cookie字段不一致的推介流量數(shù)據(jù)中篩選得到設備屬性相同的多個推介流量數(shù)據(jù),并通過第三獲取模塊獲取待還原的流量數(shù)據(jù)包含的首個訪問界面的地址信息和篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問界面的地址信息,并通過第二判斷模塊判斷篩選得到的多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與待還原的流量數(shù)據(jù)中的首個訪問界面的地址信息是否相同,再通過第二確認模塊在多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與首個訪問界面的地址信息相同的情況下,確認篩選得到的多個推介流量數(shù)據(jù)中地址信息相同的推介流量數(shù)據(jù)構成第二推介流量數(shù)據(jù)集合,達到了查找與待還原的流量數(shù)據(jù)來自同一訪問終端的推介流量數(shù)據(jù)的技術效果,進一步達到了查找可能與待還原的流量數(shù)據(jù)存在前后連接關系的推介流量數(shù)據(jù)的技術效果,進而解決了在推介流量數(shù)據(jù)中查找待還原的流量數(shù)據(jù)的原所屬流量數(shù)據(jù)的技術問題。

可選的,如圖6所示,在上述裝置中,第一查找模塊包括:第四獲取模塊60、第五獲取模塊62、計算模塊64、第三確認模塊66。其中,

第四獲取模塊60,用于獲取待還原的流量數(shù)據(jù)包含的首個訪問界面的會話開始時間。

第五獲取模塊62,用于獲取第二推介流量數(shù)據(jù)集合中包含的每個推介流量數(shù)據(jù)中記錄最后訪問界面的會話結(jié)束時間。

計算模塊64,用于計算首個訪問界面的會話開始時間與每個最后訪問界面的會話結(jié)束時間的時間間隔。

第三確認模塊66,用于確認第二推介流量數(shù)據(jù)集合中對應的訪問間隔最短的推介流量數(shù)據(jù)為第三推介流量數(shù)據(jù)。

具體的,在上述裝置中,第二推介流量數(shù)據(jù)集合包含多條數(shù)據(jù)流量,可以認為有多個推介流量數(shù)據(jù)的最后訪問界面的地址信息與待還原的流量數(shù)據(jù)的地址信息相同,在多個與待還原的流量數(shù)據(jù)的地址信息相同的推介流量數(shù)據(jù)中,其中只有一條可以為待還原的流量數(shù)據(jù)原所屬的推介流量數(shù)據(jù),可以認為與待還原的流量數(shù)據(jù)訪問間隔時間最短的推介流量數(shù)據(jù)為待還原的流量數(shù)據(jù)原所屬的推介流量數(shù)據(jù)。

由上可知,本申請上述實施例提供的裝置通過第四獲取模塊和第五獲取模塊獲取待還原的流量數(shù)據(jù)包含的首個訪問界面的會話開始時間和第二推介流量數(shù)據(jù)集合中包含的每個推介流量數(shù)據(jù)中記錄最后訪問界面的會話結(jié)束時間,并通過計算模塊計算上述兩個會話時間的時間差,再通過第三確認模塊將第二推介流量數(shù)據(jù)集合中對應的訪問間隔最短的推介流量數(shù)據(jù)確認為第三推介流量數(shù)據(jù),其中,上述第三推介流量數(shù)據(jù)可以認為是待還原的流量數(shù)據(jù)原所屬的推介流量數(shù)據(jù),達到了對上述步驟中篩選得到的多個可能是待還原的流量數(shù)據(jù)的原所屬的推介流量數(shù)據(jù)進行進一步篩選的技術效果,解決了確定待還原的流量數(shù)據(jù)原所屬的推介流量數(shù)據(jù)的技術問題。

可選的,如圖7所示,在上述裝置中,提取模塊包括:第六獲取模塊70、第三判斷模塊72、第四確認模塊74。其中,

第六獲取模塊70,用于獲取全部推介流量數(shù)據(jù)的來源主機名。

第三判斷模塊72,用于判斷全部推介流量數(shù)據(jù)的來源主機名是否包含目標網(wǎng)站的網(wǎng)站域名或目標網(wǎng)站的兄弟網(wǎng)站的網(wǎng)站域名。

第四確認模塊74,用于確認來源主機名包含目標網(wǎng)站或目標網(wǎng)站的兄弟網(wǎng)站的網(wǎng)站域名的推介流量數(shù)據(jù)為待還原的流量數(shù)據(jù)。

由此可知,本申請上述實施例通過第六獲取模塊獲取全部推介流量數(shù)據(jù)的來源主機名,再通過第三判斷模塊判斷全部推介流量數(shù)據(jù)的來源主機名是否包含目標網(wǎng)站的網(wǎng)站域名或目標網(wǎng)站的兄弟網(wǎng)站的網(wǎng)站域名,最后第四確認模塊確認來源主機名包含目標網(wǎng)站或目標網(wǎng)站的兄弟網(wǎng)站的網(wǎng)站域名的推介流量數(shù)據(jù)為待還原的流量數(shù)據(jù)達到了在全部推介流量數(shù)據(jù)中查找來自于目標網(wǎng)站自身的流量數(shù)據(jù);解決了在全部推介流量數(shù)據(jù)中提取流量數(shù)據(jù)來源有可能被誤統(tǒng)計的推介流量數(shù)據(jù)。

可選的,如圖8所示,在本申請?zhí)岢龅纳鲜鲅b置中,該裝置還包括:第一放棄模塊80。

第一放棄模塊80,用于在多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與首個訪問界面的地址信息不相同的情況下,放棄還原多個推介流量數(shù)據(jù)。

由上可知,本申請?zhí)岢龅纳鲜鰧嵤├捎玫谝环艞壞K在多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與首個訪問界面的地址信息不相同的情況下,放棄還原多個推介流量數(shù)據(jù),完成了對待還原的流量數(shù)據(jù)的原所屬推介流量數(shù)據(jù)的篩選,達到了放棄非待還原的流量數(shù)據(jù)的原所屬推介流量數(shù)據(jù)的技術效果。

可選的,如圖9所示,在本申提出的上述裝置中,該裝置還包括:第二放棄模塊90。

第二放棄模塊90,用于在多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與首個訪問界面的地址信息不相同的情況下,放棄還原多個推介流量數(shù)據(jù)。

由上可知,本申請?zhí)岢龅纳鲜鰧嵤├捎玫诙艞壞K在多個推介流量數(shù)據(jù)中記錄的最后一個訪問頁面的地址信息與首個訪問界面的地址信息不相同的情況下,放棄還原多個推介流量數(shù)據(jù),完成了對待還原的流量數(shù)據(jù)的原所屬推介流量數(shù)據(jù)的篩選,達到了放棄非待還原的流量數(shù)據(jù)的原所屬推介流量數(shù)據(jù)的技術效果。

還原推介流量數(shù)據(jù)的裝置包括處理器和存儲器,上述提取模塊、第一獲取模塊、第一查找模塊、第二查找模塊和合并模塊等均作為程序單元存儲在存儲器中,由處理器執(zhí)行存儲在存儲器中的上述程序單元。

處理器中包含內(nèi)核,由內(nèi)核去存儲器中調(diào)取相應的程序單元。內(nèi)核可以設置一個或以上,通過調(diào)整內(nèi)核參數(shù)還原推介流量數(shù)據(jù)。

存儲器可能包括計算機可讀介質(zhì)中的非永久性存儲器,隨機存取存儲器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲器(ROM)或閃存(flash RAM),存儲器包括至少一個存儲芯片。

本申請還提供了一種計算機程序產(chǎn)品的實施例,當在數(shù)據(jù)處理設備上執(zhí)行時,適于執(zhí)行初始化有如下方法步驟的程序代碼:在目標網(wǎng)站的全部推介流量數(shù)據(jù)中提取待還原的流量數(shù)據(jù),其中,待還原的流量數(shù)據(jù)包括訪問目標網(wǎng)站的當前訪問界面中的內(nèi)容以及當前訪問界面中的子界面的內(nèi)容所產(chǎn)生的流量數(shù)據(jù);獲取全部推介流量數(shù)據(jù)中除去待還原的流量數(shù)據(jù)之外的第一推介流量數(shù)據(jù)集合;從第一推介流量數(shù)據(jù)集合中查找與待還原的流量數(shù)據(jù)的數(shù)據(jù)參數(shù)相匹配的第二推介流量數(shù)據(jù)集合,其中,數(shù)據(jù)參數(shù) 包括:cookie字段、流量來源的設備屬性和/或訪問目標網(wǎng)站的過程中記錄的最后一個訪問頁面;從第二推介流量數(shù)據(jù)集合中查找與待還原的流量數(shù)據(jù)中訪問間隔最短的第三推介流量數(shù)據(jù);以及將第三推介流量數(shù)據(jù)與待還原的流量數(shù)據(jù)進行合并,以還原待還原的流量數(shù)據(jù)。

上述本發(fā)明實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。

在本發(fā)明的上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關描述。

在本申請所提供的幾個實施例中,應該理解到,所揭露的技術內(nèi)容,可通過其它的方式實現(xiàn)。其中,以上所描述的裝置實施例僅僅是示意性的,例如所述單元的劃分,可以為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,單元或模塊的間接耦合或通信連接,可以是電性或其它的形式。

所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。

另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。

所述集成的單元如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術方案本質(zhì)上或者說對現(xiàn)有技術做出貢獻的部分或者該技術方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設備(可為個人計算機、服務器或者網(wǎng)絡設備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、只讀存儲器(ROM,Read-Only Memory)、隨機存取存儲器(RAM,Random Access Memory)、移動硬盤、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

以上所述僅是本發(fā)明的優(yōu)選實施方式,應當指出,對于本技術領域的普通技術人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應視為本發(fā)明的保護范圍。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1