本申請涉及互聯(lián)網(wǎng)領(lǐng)域,具體而言,涉及一種網(wǎng)站頁面間訪問路徑的確定方法及裝置。
背景技術(shù):
目前,在對網(wǎng)站數(shù)據(jù)進(jìn)行分析時(shí),通常需要獲知用戶在網(wǎng)站的指定的幾個(gè)重要頁面間最常使用的訪問路徑。例如,網(wǎng)站中有A、B、C、D四個(gè)重要頁面,預(yù)期用戶會按照A->B->C->D頁面間的順序進(jìn)行訪問(忽略中間訪問了其它頁面),而且A->B->C->D這個(gè)路徑也跟網(wǎng)站的具體業(yè)務(wù)處理路徑相符合。然而,用戶在重要頁面間真實(shí)的訪問路徑不一定與網(wǎng)站預(yù)期的訪問路徑相同,而相關(guān)技術(shù)中無法獲知用戶在網(wǎng)站上重要頁面間的真實(shí)訪問路徑。
針對相關(guān)技術(shù)中無法獲知用戶在網(wǎng)站上重要頁面間的真實(shí)訪問路徑的問題,目前尚未提出有效的解決方案。
技術(shù)實(shí)現(xiàn)要素:
本申請的主要目的在于提供一種網(wǎng)站頁面間訪問路徑的確定方法及裝置,以解決相關(guān)技術(shù)中無法獲知用戶在網(wǎng)站上重要頁面間的真實(shí)訪問路徑的問題。
為了實(shí)現(xiàn)上述目的,根據(jù)本申請的一個(gè)方面,提供了一種網(wǎng)站頁面間訪問路徑的確定方法。該方法包括:獲取訪問日志,其中,訪問日志為根據(jù)目標(biāo)網(wǎng)站的訪問信息生成的日志;根據(jù)訪問日志獲取網(wǎng)站頁面的原始頁面間原始訪問路徑;對原始頁面間原始訪問路徑進(jìn)行過濾處理,得到目標(biāo)頁面間原始訪問路徑;以及去除目標(biāo)頁面間原始訪問路徑中的環(huán)路,并根據(jù)訪問日志在去除環(huán)路后的目標(biāo)頁面間原始訪問路徑中確定目標(biāo)頁面間目標(biāo)訪問路徑。
進(jìn)一步地,去除目標(biāo)頁面間原始訪問路徑中的環(huán)路,并根據(jù)訪問日志在去除環(huán)路后的目標(biāo)頁面間原始訪問路徑中確定目標(biāo)頁面間目標(biāo)訪問路徑包括:按照訪問順序遍歷目標(biāo)頁面間原始訪問路徑,對目標(biāo)頁面間原始訪問路徑中的環(huán)路進(jìn)行切分,得到目標(biāo)頁面間原始訪問子路徑集合;在目標(biāo)頁面間原始訪問子路徑集合中,刪除包含在其他子路徑中的子路徑,得到刪除后的目標(biāo)頁面間原始訪問子路徑集合;根據(jù)訪問日志分別統(tǒng)計(jì)刪除后的目標(biāo)頁面間原始訪問子路徑集合中每條目標(biāo)頁面間原始訪問子路徑 包含的會話數(shù)量;根據(jù)會話數(shù)量對刪除后的目標(biāo)頁面間原始訪問子路徑集合中每條目標(biāo)頁面間原始訪問子路徑進(jìn)行排序處理;以及從排序后的目標(biāo)頁面間原始訪問子路徑中確定目標(biāo)頁面間目標(biāo)訪問路徑。
進(jìn)一步地,對原始頁面間原始訪問路徑進(jìn)行過濾處理,得到目標(biāo)頁面間原始訪問路徑包括:確定預(yù)先設(shè)置的目標(biāo)頁面;從原始頁面間原始訪問路徑中提取連續(xù)訪問目標(biāo)頁面的路徑,得到至少一條連續(xù)訪問目標(biāo)頁面的路徑;以及將至少一條連續(xù)訪問目標(biāo)頁面的路徑作為目標(biāo)頁面間原始訪問路徑。
進(jìn)一步地,對原始頁面間原始訪問路徑進(jìn)行過濾處理,得到目標(biāo)頁面間原始訪問路徑包括:確定預(yù)先設(shè)置的目標(biāo)頁面;根據(jù)預(yù)先設(shè)置的目標(biāo)頁面對原始頁面間原始訪問路徑中的非目標(biāo)頁面進(jìn)行過濾處理;以及將過濾后的原始頁面間原始訪問路徑作為目標(biāo)頁面間原始訪問路徑。
進(jìn)一步地,在獲取訪問日志之前,該方法還包括:根據(jù)預(yù)設(shè)腳本代碼采集針對目標(biāo)網(wǎng)站的訪問信息;發(fā)送目標(biāo)網(wǎng)站的訪問信息至目標(biāo)地址;以及在目標(biāo)地址上根據(jù)目標(biāo)網(wǎng)站的訪問信息生成訪問日志。
進(jìn)一步地,根據(jù)訪問日志獲取網(wǎng)站頁面的原始頁面間原始訪問路徑包括:獲取預(yù)先設(shè)置的目標(biāo)頁面;確定訪問日志中的所有會話;從訪問日志中的所有會話中篩選訪問過預(yù)先設(shè)置的目標(biāo)頁面的會話,得到目標(biāo)會話;以及分別確定目標(biāo)會話中對被訪問頁面的訪問順序,得到原始頁面間原始訪問路徑。
為了實(shí)現(xiàn)上述目的,根據(jù)本申請的另一方面,提供了一種網(wǎng)站頁面間訪問路徑的確定裝置。該裝置包括:第一獲取單元,用于獲取訪問日志,其中,訪問日志為根據(jù)目標(biāo)網(wǎng)站的訪問信息生成的日志;第二獲取單元,用于根據(jù)訪問日志獲取網(wǎng)站頁面的原始頁面間原始訪問路徑;處理單元,用于對原始頁面間原始訪問路徑進(jìn)行過濾處理,得到目標(biāo)頁面間原始訪問路徑;以及確定單元,用于去除目標(biāo)頁面間原始訪問路徑中的環(huán)路,并根據(jù)訪問日志在去除環(huán)路后的目標(biāo)頁面間原始訪問路徑中確定目標(biāo)頁面間目標(biāo)訪問路徑。
進(jìn)一步地,確定單元包括:切分模塊,用于按照訪問順序遍歷目標(biāo)頁面間原始訪問路徑,對目標(biāo)頁面間原始訪問路徑中的環(huán)路進(jìn)行切分,得到目標(biāo)頁面間原始訪問子路徑集合;刪除模塊,用于在目標(biāo)頁面間原始訪問子路徑集合中,刪除包含在其他子路徑中的子路徑,得到刪除后的目標(biāo)頁面間原始訪問子路徑集合;統(tǒng)計(jì)模塊,用于根據(jù)訪問日志分別統(tǒng)計(jì)刪除后的目標(biāo)頁面間原始訪問子路徑集合中每條目標(biāo)頁面間原始訪問子路徑包含的會話數(shù)量;第一處理模塊,用于根據(jù)會話數(shù)量對刪除后的目標(biāo)頁面間原始訪問子路徑集合中每條目標(biāo)頁面間原始訪問子路徑進(jìn)行排序處理;以及第一確 定模塊,用于從排序后的目標(biāo)頁面間原始訪問子路徑中確定目標(biāo)頁面間目標(biāo)訪問路徑。
進(jìn)一步地,處理單元包括:第二確定模塊,用于確定預(yù)先設(shè)置的目標(biāo)頁面;提取模塊,用于從原始頁面間原始訪問路徑中提取連續(xù)訪問目標(biāo)頁面的路徑,得到至少一條連續(xù)訪問目標(biāo)頁面的路徑;以及第三確定模塊,用于將至少一條連續(xù)訪問目標(biāo)頁面的路徑作為目標(biāo)頁面間原始訪問路徑。
進(jìn)一步地,處理單元包括:第四確定模塊,用于確定預(yù)先設(shè)置的目標(biāo)頁面;第二處理模塊,用于根據(jù)預(yù)先設(shè)置的目標(biāo)頁面對原始頁面間原始訪問路徑中的非目標(biāo)頁面進(jìn)行過濾處理;以及第五確定模塊,用于將過濾后的原始頁面間原始訪問路徑作為目標(biāo)頁面間原始訪問路徑。
通過本申請,采用以下步驟:獲取訪問日志,其中,訪問日志為根據(jù)目標(biāo)網(wǎng)站的訪問信息生成的日志;根據(jù)訪問日志獲取網(wǎng)站頁面的原始頁面間原始訪問路徑;對原始頁面間原始訪問路徑進(jìn)行過濾處理,得到目標(biāo)頁面間原始訪問路徑;以及去除目標(biāo)頁面間原始訪問路徑中的環(huán)路,并根據(jù)訪問日志在去除環(huán)路后的目標(biāo)頁面間原始訪問路徑中確定目標(biāo)頁面間目標(biāo)訪問路徑,解決了相關(guān)技術(shù)中無法獲知用戶在網(wǎng)站上重要頁面間的真實(shí)訪問路徑的問題,解決了相關(guān)技術(shù)中無法獲知用戶在網(wǎng)站上重要頁面間的真實(shí)訪問路徑的問題。通過收集用戶在目標(biāo)網(wǎng)站上的訪問信息,找出訪問指定頁面的會話,去除會話中的非重要頁面,然后對會話中包含的環(huán)進(jìn)行切分,最后統(tǒng)計(jì)出目標(biāo)頁面間目標(biāo)訪問路徑,進(jìn)而達(dá)到了能夠獲知用戶在網(wǎng)站上重要頁面間的真實(shí)訪問路徑的效果。
附圖說明
構(gòu)成本申請的一部分的附圖用來提供對本申請的進(jìn)一步理解,本申請的示意性實(shí)施例及其說明用于解釋本申請,并不構(gòu)成對本申請的不當(dāng)限定。在附圖中:
圖1是根據(jù)本申請實(shí)施例的網(wǎng)站頁面間訪問路徑的確定方法的流程圖;以及
圖2是根據(jù)本申請實(shí)施例的網(wǎng)站頁面間訪問路徑的確定裝置的示意圖。
具體實(shí)施方式
需要說明的是,在不沖突的情況下,本申請中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本申請。
為了使本技術(shù)領(lǐng)域的人員更好地理解本申請方案,下面將結(jié)合本申請實(shí)施例中的附圖,對本申請實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例 僅僅是本申請一部分的實(shí)施例,而不是全部的實(shí)施例?;诒旧暾堉械膶?shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本申請保護(hù)的范圍。
需要說明的是,本申請的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本申請的實(shí)施例。此外,術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
根據(jù)本申請的實(shí)施例,提供了一種網(wǎng)站頁面間訪問路徑的確定方法。
圖1是根據(jù)本申請實(shí)施例的網(wǎng)站頁面間訪問路徑的確定方法的流程圖。如圖1所示,該方法包括以下步驟:
步驟S101,獲取訪問日志,其中,訪問日志為根據(jù)目標(biāo)網(wǎng)站的訪問信息生成的日志。
可選地,在本申請實(shí)施例提供的網(wǎng)站頁面間訪問路徑的確定方法中,在獲取訪問日志之前,該方法還包括:根據(jù)預(yù)設(shè)腳本代碼采集針對目標(biāo)網(wǎng)站的訪問信息;發(fā)送目標(biāo)網(wǎng)站的訪問信息至目標(biāo)地址;以及在目標(biāo)地址上根據(jù)目標(biāo)網(wǎng)站的訪問信息生成訪問日志。
在目標(biāo)網(wǎng)站上部署Tracker(JS腳本),部署完成之后,用戶在該網(wǎng)站的所有訪問數(shù)據(jù)都會被發(fā)送到指定服務(wù)器,在指定服務(wù)器上根據(jù)目標(biāo)網(wǎng)站的訪問信息生成訪問日志,獲取目標(biāo)時(shí)間段內(nèi)的訪問日志,其中,目標(biāo)時(shí)間是用戶希望在具體哪段時(shí)間內(nèi)確定網(wǎng)站頁面間訪問路徑的時(shí)間。
步驟S102,根據(jù)訪問日志獲取網(wǎng)站頁面的原始頁面間原始訪問路徑。
可選地,在本申請實(shí)施例提供的網(wǎng)站頁面間訪問路徑的確定方法中,根據(jù)訪問日志獲取網(wǎng)站頁面的原始頁面間原始訪問路徑包括:獲取預(yù)先設(shè)置的目標(biāo)頁面;確定訪問日志中的所有會話;從訪問日志中的所有會話中篩選訪問過預(yù)先設(shè)置的目標(biāo)頁面的會話,得到目標(biāo)會話;以及分別確定目標(biāo)會話中對被訪問頁面的訪問順序,得到原始頁面間原始訪問路徑。
例如,預(yù)先設(shè)置的目標(biāo)頁面為客戶想要統(tǒng)計(jì)的重要頁面,如p1、p2、p3和p4四個(gè)頁面,從訪問日志中的所有會話中,篩選訪問過所設(shè)重要頁面的會話,并將其作為 目標(biāo)會話。
分別確定上述得到的至少一個(gè)目標(biāo)會話中每個(gè)目標(biāo)會話中對被訪問頁面的訪問順序,得到原始頁面間原始訪問路徑。例如,某個(gè)目標(biāo)會話的訪問路徑為p5-p1-p3-p7-p6-p4-p1-p9-p3-p2-p8,即其為該目標(biāo)會話的原始頁面間原始訪問路徑。
步驟S103,對原始頁面間原始訪問路徑進(jìn)行過濾處理,得到目標(biāo)頁面間原始訪問路徑。
可選地,在本申請實(shí)施例提供的網(wǎng)站頁面間訪問路徑的確定方法中,對原始頁面間原始訪問路徑進(jìn)行過濾處理,得到目標(biāo)頁面間原始訪問路徑包括:確定預(yù)先設(shè)置的目標(biāo)頁面;從原始頁面間原始訪問路徑中提取連續(xù)訪問目標(biāo)頁面的路徑,得到至少一條連續(xù)訪問目標(biāo)頁面的路徑;以及將至少一條連續(xù)訪問目標(biāo)頁面的路徑作為目標(biāo)頁面間原始訪問路徑。
例如,預(yù)先設(shè)置的目標(biāo)頁面為客戶想要統(tǒng)計(jì)的重要頁面,如p1、p2、p3和p4四個(gè)目標(biāo)頁面,若用戶只統(tǒng)計(jì)連續(xù)訪問目標(biāo)頁面的路徑,則根據(jù)p1、p2、p3和p4從p5-p1-p3-p7-p6-p4-p1-p9-p3-p2-p8中提取連續(xù)訪問目標(biāo)頁面的路徑,得到:p1-p3,p4-p1和p3-p2三條連續(xù)訪問的訪問路徑,將p1-p3,p4-p1和p3-p2作為目標(biāo)頁面間原始訪問路徑。
可選地,在本申請實(shí)施例提供的網(wǎng)站頁面間訪問路徑的確定方法中,對原始頁面間原始訪問路徑進(jìn)行過濾處理,得到目標(biāo)頁面間原始訪問路徑包括:確定預(yù)先設(shè)置的目標(biāo)頁面;根據(jù)預(yù)先設(shè)置的目標(biāo)頁面對原始頁面間原始訪問路徑中的非目標(biāo)頁面進(jìn)行過濾處理;以及將過濾后的原始頁面間原始訪問路徑作為目標(biāo)頁面間原始訪問路徑。
例如,預(yù)先設(shè)置的目標(biāo)頁面為客戶想要統(tǒng)計(jì)的重要頁面,如p1、p2、p3和p4四個(gè)頁面,若用戶不要求只統(tǒng)計(jì)連續(xù)訪問目標(biāo)頁面的路徑,則根據(jù)p1、p2、p3和p4對p5-p1-p3-p7-p6-p4-p1-p9-p3-p2-p8中的非目標(biāo)頁面進(jìn)行過濾處理,去除掉p5-p1-p3-p7-p6-p4-p1-p9-p3-p2-p8中非目標(biāo)頁面,處理后得到:p1-p3-p4-p1-p3-p2。將p1-p3-p4-p1-p3-p2作為目標(biāo)頁面間原始訪問路徑。
通過該步驟,可以根據(jù)用戶需求只統(tǒng)計(jì)連續(xù)訪問的訪問路徑或者統(tǒng)計(jì)所有訪問目標(biāo)頁面的訪問路徑作為目標(biāo)頁面間原始訪問路徑。
步驟S104,去除目標(biāo)頁面間原始訪問路徑中的環(huán)路,并根據(jù)訪問日志在去除環(huán)路后的目標(biāo)頁面間原始訪問路徑中確定目標(biāo)頁面間目標(biāo)訪問路徑。
例如,去除p1-p3-p4-p1-p3-p2中的環(huán)路,并根據(jù)訪問日志在去除環(huán)路后的目標(biāo)頁面間原始訪問路徑中確定目標(biāo)頁面間目標(biāo)訪問路徑。
可選地,在本申請實(shí)施例提供的網(wǎng)站頁面間訪問路徑的確定方法中,去除目標(biāo)頁面間原始訪問路徑中的環(huán)路,并根據(jù)訪問日志在去除環(huán)路后的目標(biāo)頁面間原始訪問路徑中確定目標(biāo)頁面間目標(biāo)訪問路徑包括:按照訪問順序遍歷目標(biāo)頁面間原始訪問路徑,對目標(biāo)頁面間原始訪問路徑中的環(huán)路進(jìn)行切分,得到目標(biāo)頁面間原始訪問子路徑集合;在目標(biāo)頁面間原始訪問子路徑集合中,刪除包含在其他子路徑中的子路徑,得到刪除后的目標(biāo)頁面間原始訪問子路徑集合;根據(jù)訪問日志分別統(tǒng)計(jì)刪除后的目標(biāo)頁面間原始訪問子路徑集合中每條目標(biāo)頁面間原始訪問子路徑包含的會話數(shù)量;根據(jù)會話數(shù)量對刪除后的目標(biāo)頁面間原始訪問子路徑集合中每條目標(biāo)頁面間原始訪問子路徑進(jìn)行排序處理;以及從排序后的目標(biāo)頁面間原始訪問子路徑中確定目標(biāo)頁面間目標(biāo)訪問路徑。
具體地,對上述取出的路徑p1-p3-p4-p1-p3-p2進(jìn)行切分,切分的目的是從p1-p3-p4-p1-p3-p2路徑中去除環(huán)路,從路徑中第一個(gè)元素開始依次尋找最長無環(huán)路徑,例如對p1-p3-p4-p1-p3-p2,先從第一個(gè)開始,找到p1-p3-p4,然后從第二個(gè)元素開始找得到p3-p4-p1,然后從第三個(gè)元素開始找得到p4-p1-p3-p2,一直找到路徑的末尾。最后對得到的路徑進(jìn)行去重合并。即假設(shè)最終得到的路徑中既有p4-p1-p3-p2又有p3-p2,由于前者包含后者,則將后者舍去,最終返回p1-p3-p4和p4-p1-p3-p2兩條路徑。再解析目標(biāo)時(shí)間內(nèi)訪問日志中的所有訪問信息,得到此段時(shí)間的所有訪問路徑,并統(tǒng)計(jì)各個(gè)路徑包含的會話數(shù)量,根據(jù)會話數(shù)對各個(gè)路徑進(jìn)行排名,根據(jù)排名結(jié)果得到目標(biāo)頁面間目標(biāo)訪問路徑。
綜上所述,以上步驟通過在目標(biāo)網(wǎng)站添加Tracker(預(yù)設(shè)腳本代碼),收集用戶在目標(biāo)網(wǎng)站的訪問信息,統(tǒng)計(jì)每個(gè)用戶在網(wǎng)站中的訪問行為,找出訪問指定頁面(重要頁面)的會話,去除會話中的非重要頁面,然后對會話中包含的環(huán)進(jìn)行切分,最后統(tǒng)計(jì)出目標(biāo)頁面間目標(biāo)訪問路徑,進(jìn)而達(dá)到了能夠獲知用戶在網(wǎng)站上重要頁面間的真實(shí)訪問路徑的效果。
本申請實(shí)施例提供的網(wǎng)站頁面間訪問路徑的確定方法,通過獲取訪問日志,其中,訪問日志為根據(jù)目標(biāo)網(wǎng)站的訪問信息生成的日志;根據(jù)訪問日志獲取網(wǎng)站頁面的原始頁面間原始訪問路徑;對原始頁面間原始訪問路徑進(jìn)行過濾處理,得到目標(biāo)頁面間原始訪問路徑;以及去除目標(biāo)頁面間原始訪問路徑中的環(huán)路,并根據(jù)訪問日志在去除環(huán)路后的目標(biāo)頁面間原始訪問路徑中確定目標(biāo)頁面間目標(biāo)訪問路徑,解決了相關(guān)技術(shù)中無法獲知用戶在網(wǎng)站上重要頁面間的真實(shí)訪問路徑的問題,解決了相關(guān)技術(shù)中無法獲知用戶在網(wǎng)站上重要頁面間的真實(shí)訪問路徑的問題。通過收集用戶在目標(biāo)網(wǎng)站上的訪問信息,找出訪問指定頁面的會話,去除會話中的非重要頁面,然后對會話中包含的環(huán)進(jìn)行切分,最后統(tǒng)計(jì)出目標(biāo)頁面間目標(biāo)訪問路徑,進(jìn)而達(dá)到了能夠獲知用戶在網(wǎng)站上重要頁面間的真實(shí)訪問路徑的效果。
需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
本申請實(shí)施例還提供了一種網(wǎng)站頁面間訪問路徑的確定裝置,需要說明的是,本申請實(shí)施例的網(wǎng)站頁面間訪問路徑的確定裝置可以用于執(zhí)行本申請實(shí)施例所提供的用于網(wǎng)站頁面間訪問路徑的確定方法。以下對本申請實(shí)施例提供的網(wǎng)站頁面間訪問路徑的確定裝置進(jìn)行介紹。
圖2是根據(jù)本申請實(shí)施例的網(wǎng)站頁面間訪問路徑的確定裝置的示意圖。如圖2所示,該裝置包括:第一獲取單元10、第二獲取單元20、處理單元30和確定單元40。
第一獲取單元10,用于獲取訪問日志,其中,訪問日志為根據(jù)目標(biāo)網(wǎng)站的訪問信息生成的日志。
第二獲取單元20,用于根據(jù)訪問日志獲取網(wǎng)站頁面的原始頁面間原始訪問路徑。
處理單元30,用于對原始頁面間原始訪問路徑進(jìn)行過濾處理,得到目標(biāo)頁面間原始訪問路徑。
確定單元40,用于去除目標(biāo)頁面間原始訪問路徑中的環(huán)路,并根據(jù)訪問日志在去除環(huán)路后的目標(biāo)頁面間原始訪問路徑中確定目標(biāo)頁面間目標(biāo)訪問路徑。
本申請實(shí)施例提供的網(wǎng)站頁面間訪問路徑的確定裝置,通過第一獲取單元10獲取訪問日志,其中,訪問日志為根據(jù)目標(biāo)網(wǎng)站的訪問信息生成的日志;第二獲取單元20根據(jù)訪問日志獲取網(wǎng)站頁面的原始頁面間原始訪問路徑;處理單元30對原始頁面間原始訪問路徑進(jìn)行過濾處理,得到目標(biāo)頁面間原始訪問路徑;以及確定單元40去除目標(biāo)頁面間原始訪問路徑中的環(huán)路,并根據(jù)訪問日志在去除環(huán)路后的目標(biāo)頁面間原始訪問路徑中確定目標(biāo)頁面間目標(biāo)訪問路徑,解決了相關(guān)技術(shù)中無法獲知用戶在網(wǎng)站上重要頁面間的真實(shí)訪問路徑的問題,通過收集用戶在目標(biāo)網(wǎng)站上的訪問信息(即統(tǒng)計(jì)每個(gè)用戶在網(wǎng)站中的訪問行為),找出訪問指定頁面的會話,去除會話中的非重要頁面,然后對會話中包含的環(huán)進(jìn)行切分,最后統(tǒng)計(jì)出目標(biāo)頁面間目標(biāo)訪問路徑,進(jìn)而達(dá)到了能夠獲知用戶在網(wǎng)站上重要頁面間的真實(shí)訪問路徑的效果。
可選地,在本申請實(shí)施例提供的網(wǎng)站頁面間訪問路徑的確定裝置中,確定單元40包括:切分模塊,用于按照訪問順序遍歷目標(biāo)頁面間原始訪問路徑,對目標(biāo)頁面間原始訪問路徑中的環(huán)路進(jìn)行切分,得到目標(biāo)頁面間原始訪問子路徑集合;刪除模塊,用于在目標(biāo)頁面間原始訪問子路徑集合中,刪除包含在其他子路徑中的子路徑,得到刪除后的目標(biāo)頁面間原始訪問子路徑集合;統(tǒng)計(jì)模塊,用于根據(jù)訪問日志分別統(tǒng)計(jì)刪除后的目標(biāo)頁面間原始訪問子路徑集合中每條目標(biāo)頁面間原始訪問子路徑包含的會話數(shù) 量;第一處理模塊,用于根據(jù)會話數(shù)量對刪除后的目標(biāo)頁面間原始訪問子路徑集合中每條目標(biāo)頁面間原始訪問子路徑進(jìn)行排序處理;以及第一確定模塊,用于從排序后的目標(biāo)頁面間原始訪問子路徑中確定目標(biāo)頁面間目標(biāo)訪問路徑。
可選地,在本申請實(shí)施例提供的網(wǎng)站頁面間訪問路徑的確定裝置中,處理單元30包括:第二確定模塊,用于確定預(yù)先設(shè)置的目標(biāo)頁面;提取模塊,用于從原始頁面間原始訪問路徑中提取連續(xù)訪問目標(biāo)頁面的路徑,得到至少一條連續(xù)訪問目標(biāo)頁面的路徑;以及第三確定模塊,用于將至少一條連續(xù)訪問目標(biāo)頁面的路徑作為目標(biāo)頁面間原始訪問路徑。
可選地,在本申請實(shí)施例提供的網(wǎng)站頁面間訪問路徑的確定裝置中,處理單元30包括:第四確定模塊,用于確定預(yù)先設(shè)置的目標(biāo)頁面;第二處理模塊,用于根據(jù)預(yù)先設(shè)置的目標(biāo)頁面對原始頁面間原始訪問路徑中的非目標(biāo)頁面進(jìn)行過濾處理;以及第五確定模塊,用于將過濾后的原始頁面間原始訪問路徑作為目標(biāo)頁面間原始訪問路徑。
所述網(wǎng)站頁面間訪問路徑的確定裝置包括處理器和存儲器,上述第一獲取單元、第二獲取單元、處理單元和確定單元等均作為程序單元存儲在存儲器中,由處理器執(zhí)行存儲在存儲器中的上述程序單元實(shí)現(xiàn)相應(yīng)功能。上述第一預(yù)設(shè)條件、第二預(yù)設(shè)條件、預(yù)設(shè)切分規(guī)則、預(yù)設(shè)腳本代碼等都可以存儲在存儲器中。
處理器中包含內(nèi)核,由內(nèi)核去存儲器中調(diào)取相應(yīng)的程序單元。內(nèi)核可以設(shè)置一個(gè)或以上,通過調(diào)整內(nèi)核參數(shù)確定網(wǎng)站頁面間訪問路徑。
存儲器可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲器,隨機(jī)存取存儲器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲器(ROM)或閃存(flash RAM),存儲器包括至少一個(gè)存儲芯片。
本申請還提供了一種計(jì)算機(jī)程序產(chǎn)品的實(shí)施例,當(dāng)在數(shù)據(jù)處理設(shè)備上執(zhí)行時(shí),適于執(zhí)行初始化有如下方法步驟的程序代碼:獲取訪問日志,其中,訪問日志為根據(jù)目標(biāo)網(wǎng)站的訪問信息生成的日志;從訪問日志中確定訪問過目標(biāo)頁面的所有會話,得到至少一個(gè)目標(biāo)會話;分別確定每個(gè)目標(biāo)會話中對被訪問頁面的訪問順序,得到原始頁面間原始訪問路徑;按照第一預(yù)設(shè)條件對原始頁面間原始訪問路徑進(jìn)行處理,得到目標(biāo)頁面間原始訪問路徑;以及根據(jù)目標(biāo)頁面間原始訪問路徑確定目標(biāo)頁面間目標(biāo)訪問路徑。
需要說明的是,對于前述的各方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本申請并不受所描述的動作順序的限制,因?yàn)橐罁?jù)本申請,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動作和模塊 并不一定是本申請所必須的。
在上述實(shí)施例中,對各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述。
在本申請所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的裝置,可通過其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。
另外,在本申請各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。
顯然,本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本申請的各模塊或各步驟可以用通用的計(jì)算裝置來實(shí)現(xiàn),它們可以集中在單個(gè)的計(jì)算裝置上,或者分布在多個(gè)計(jì)算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計(jì)算裝置可執(zhí)行的程序代碼來實(shí)現(xiàn),從而,可以將它們存儲在存儲裝置中由計(jì)算裝置來執(zhí)行,或者將它們分別制作成各個(gè)集成電路模塊,或者將它們中的多個(gè)模塊或步驟制作成單個(gè)集成電路模塊來實(shí)現(xiàn)。這樣,本申請不限制于任何特定的硬件和軟件結(jié)合。
以上所述僅為本申請的優(yōu)選實(shí)施例,并不用于限制本申請,對于本領(lǐng)域的技術(shù)人員來說,本申請可以有各種更改和變化。凡在本申請的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本申請的保護(hù)范圍之內(nèi)。