基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新方法和裝置,其中的方法包括:根據(jù)各終端設(shè)備進(jìn)行網(wǎng)絡(luò)訪問的信息獲取各網(wǎng)絡(luò)訪問的來源地址與點(diǎn)出頁(yè)地址的鏈接對(duì)信息;根據(jù)所述鏈接對(duì)信息更新所述鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N以及點(diǎn)出頁(yè)在過去預(yù)定時(shí)長(zhǎng)的時(shí)間窗內(nèi)的熱度H;根據(jù)熱度衰減周期利用熱度H和針對(duì)來源地址的熱度衰減因子對(duì)所述累積熱度N進(jìn)行在所述時(shí)間窗內(nèi)的熱度衰減處理;根據(jù)所述衰減處理結(jié)果更新相應(yīng)鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N,所述累積熱度N為選取向終端設(shè)備提前推送資源的一個(gè)參數(shù)。
【專利說明】基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)訪問技術(shù),具體涉及基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新方法和裝置。
【背景技術(shù)】
[0002]用戶在使用瀏覽器(如搜狗高速瀏覽器)訪問網(wǎng)站過程中,往往會(huì)因?yàn)榫W(wǎng)站的服務(wù)能力、用戶的帶寬以及訪問網(wǎng)頁(yè)內(nèi)容的大小等多種因素,而導(dǎo)致該網(wǎng)站網(wǎng)頁(yè)的打開速度較慢,從而影響了用戶的上網(wǎng)體驗(yàn)。
[0003]目前,可以采用預(yù)讀取方法來提高網(wǎng)站訪問速度,即提前獲取相應(yīng)網(wǎng)頁(yè)對(duì)應(yīng)的資源,并本地緩存這些資源,當(dāng)用戶真正去訪問這些網(wǎng)頁(yè)時(shí),只需從本地緩存中讀取相應(yīng)的資源即可,從用戶角度而言,該方法提高了網(wǎng)站網(wǎng)頁(yè)的打開速度,從而提高了用戶體驗(yàn)。
[0004]發(fā)明人在實(shí)現(xiàn)本發(fā)明過程中發(fā)現(xiàn),在現(xiàn)有的預(yù)讀取方法中,準(zhǔn)確的預(yù)測(cè)用戶會(huì)訪問哪些網(wǎng)頁(yè)是非常重要的,如何準(zhǔn)確的預(yù)測(cè)用戶會(huì)訪問哪些網(wǎng)頁(yè),以不斷改善用戶的網(wǎng)絡(luò)訪問體驗(yàn),是一個(gè)需要持續(xù)關(guān)注的課題。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于,克服現(xiàn)有的預(yù)讀取方法存在的技術(shù)問題,而提供一種針對(duì)移動(dòng)設(shè)備的基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新方法和裝置,所要解決的技術(shù)問題是,保證預(yù)讀取的高準(zhǔn)確性和高有效性,以提高用戶體驗(yàn)。
[0006]本發(fā)明的目的以及解決其技術(shù)問題可以采用以下的技術(shù)方案來實(shí)現(xiàn)。
[0007]依據(jù)本發(fā)明提出的一種基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新方法,其中,所述方法包括:根據(jù)各終端設(shè)備進(jìn)行網(wǎng)絡(luò)訪問的信息獲取各網(wǎng)絡(luò)訪問的來源地址與點(diǎn)出頁(yè)地址的鏈接對(duì)信息;根據(jù)所述鏈接對(duì)信息更新所述鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N以及點(diǎn)出頁(yè)在過去預(yù)定時(shí)長(zhǎng)的時(shí)間窗內(nèi)的熱度H ;根據(jù)熱度衰減周期利用熱度H和針對(duì)來源地址的熱度衰減因子對(duì)所述累積熱度N進(jìn)行在所述時(shí)間窗內(nèi)的熱度衰減處理;根據(jù)所述衰減處理結(jié)果更新相應(yīng)鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N,所述累積熱度N為選取向終端設(shè)備提前推送資源的一個(gè)參數(shù)。
[0008]可選的,上述基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新方法,其中,所述方法在更新所述累積熱度N以及熱度H之后還包括:根據(jù)時(shí)間衰減周期利用針對(duì)來源地址的時(shí)間衰減因子對(duì)所述累積熱度N進(jìn)行時(shí)間衰減處理。
[0009]可選的,上述基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新方法,其中,所述根據(jù)各終端設(shè)備進(jìn)行網(wǎng)絡(luò)訪問的信息獲取各網(wǎng)絡(luò)訪問的來源地址與點(diǎn)出頁(yè)地址的鏈接對(duì)信息的步驟包括:實(shí)時(shí)獲取各終端設(shè)備的網(wǎng)絡(luò)訪問的客戶端日志;從所述網(wǎng)絡(luò)訪問的客戶端日志中獲取各網(wǎng)絡(luò)訪問的來源地址與點(diǎn)出頁(yè)地址的鏈接對(duì)信息。
[0010]可選的,上述基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新方法,其中,所述方法在更新所述累積熱度N以及熱度H之前還包括:對(duì)所述鏈接對(duì)信息進(jìn)行過濾的步驟,且所述過濾的步驟包括:根據(jù)所述鏈接對(duì)信息確定點(diǎn)出頁(yè)的類型;濾除出點(diǎn)出頁(yè)的類型屬于預(yù)定類型的鏈接對(duì)信息。
[0011]可選的,上述基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新方法,其中,所述根據(jù)所述鏈接對(duì)信息更新所述鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N以及點(diǎn)出頁(yè)在過去預(yù)定時(shí)長(zhǎng)的時(shí)間窗內(nèi)的熱度H的步驟包括:在所述獲取的鏈接對(duì)信息中的點(diǎn)出頁(yè)地址為之前未曾存儲(chǔ)的點(diǎn)出頁(yè)地址的情況下,存儲(chǔ)該未曾存儲(chǔ)的點(diǎn)出頁(yè)地址,并將所述未曾存儲(chǔ)的點(diǎn)出頁(yè)地址的訪問時(shí)間作為第一次被訪問的時(shí)間存儲(chǔ);將所述之前未曾存儲(chǔ)的點(diǎn)出頁(yè)地址的累積熱度N設(shè)置為在累積熱度N的初始值的基礎(chǔ)上根據(jù)第一預(yù)定步長(zhǎng)的遞增值;將所述之前未曾存儲(chǔ)的點(diǎn)出頁(yè)地址的熱度H設(shè)置為在熱度H的初始值的基礎(chǔ)上根據(jù)第二預(yù)定步長(zhǎng)的遞增值。
[0012]可選的,上述基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新方法,其中,所述根據(jù)所述鏈接對(duì)信息更新所述鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N以及點(diǎn)出頁(yè)在過去預(yù)定時(shí)長(zhǎng)的時(shí)間窗內(nèi)的熱度H的步驟包括:在所述獲取的鏈接對(duì)信息中的點(diǎn)出頁(yè)地址為之前曾記錄的點(diǎn)出頁(yè)地址的情況下,根據(jù)第一預(yù)定步長(zhǎng)使所述鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N在當(dāng)前累積熱度數(shù)值的基礎(chǔ)上遞增,根據(jù)第二預(yù)定步長(zhǎng)使所述鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的熱度H在當(dāng)前熱度數(shù)值的基礎(chǔ)上遞增;其中,所述熱度H根據(jù)熱度衰減周期定期恢復(fù)為初始值。
[0013]可選的,上述基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新方法,其中,所述根據(jù)時(shí)間衰減周期利用針對(duì)來源地址的時(shí)間衰減因子對(duì)所述累積熱度N進(jìn)行時(shí)間衰減處理的步驟包括:根據(jù)時(shí)間衰減周期利用下述公式對(duì)所述累積熱度N進(jìn)行時(shí)間衰減處理;N=NXXXA ;其中,所述X為針對(duì)來源地址的時(shí)間衰減因子,所述A為基于T/Now的時(shí)間倒數(shù)曲線,所述T為鏈接對(duì)信息中的點(diǎn)出頁(yè)第一次被訪問的時(shí)間,所述Now為當(dāng)前時(shí)間。
[0014]可選的,上述基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新方法,其中,所述根據(jù)熱度衰減周期利用熱度H和針對(duì)來源地址的熱度衰減因子對(duì)所述累積熱度N進(jìn)行在所述時(shí)間窗內(nèi)的熱度衰減處理的步驟包括:根據(jù)熱度衰減周期利用下述公式對(duì)所述累積熱度N進(jìn)行在所述時(shí)間窗內(nèi)的熱度衰減處理;N = NXYX (H/H’ ) X (N’ /H’ );其中,所述Y為針對(duì)來源地址的熱度衰減因子,所述H’為所有屬于同一個(gè)來源地址的點(diǎn)出頁(yè)在同一時(shí)間窗內(nèi)的熱度H的平均值,所述N’為鏈接對(duì)信息中的點(diǎn)出頁(yè)地址在其被存儲(chǔ)時(shí)間段內(nèi),單位時(shí)間的熱度值。
[0015]依據(jù)本發(fā)明提出的一種基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新裝置,其中,該裝置包括:獲取模塊,用于根據(jù)各終端設(shè)備進(jìn)行網(wǎng)絡(luò)訪問的信息獲取各網(wǎng)絡(luò)訪問的來源地址與點(diǎn)出頁(yè)地址的鏈接對(duì)信息;第一更新模塊,用于根據(jù)所述鏈接對(duì)信息更新所述鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N以及點(diǎn)出頁(yè)在過去預(yù)定時(shí)長(zhǎng)的時(shí)間窗內(nèi)的熱度H ;熱度衰減模塊,用于根據(jù)熱度衰減周期利用熱度H和針對(duì)來源地址的熱度衰減因子對(duì)所述累積熱度N進(jìn)行在所述時(shí)間窗內(nèi)的熱度衰減處理;第二更新模塊,用于根據(jù)所述衰減處理結(jié)果更新相應(yīng)鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N,所述累積熱度N為選取向終端設(shè)備提前推送資源的一個(gè)參數(shù)。
[0016]可選的,上述基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新裝置,其中,所述裝置還包括:時(shí)間衰減模塊,與第一更新模塊連接,用于根據(jù)時(shí)間衰減周期利用針對(duì)來源地址的時(shí)間衰減因子對(duì)所述累積熱度N進(jìn)行時(shí)間衰減處理。[0017]可選的,上述基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新裝置,其中,所述獲取模塊具體用于:實(shí)時(shí)獲取各終端設(shè)備的網(wǎng)絡(luò)訪問的客戶端日志,并從所述網(wǎng)絡(luò)訪問的客戶端日志中獲取各網(wǎng)絡(luò)訪問的來源地址與點(diǎn)出頁(yè)地址的鏈接對(duì)信息。
[0018]可選的,上述基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新裝置,其中,所述裝置還包括:過濾模塊,與所述獲取模塊和第一更新模塊分別連接,且所述過濾模塊用于根據(jù)所述鏈接對(duì)信息確定點(diǎn)出頁(yè)的類型,并濾除出點(diǎn)出頁(yè)的類型屬于預(yù)定類型的鏈接對(duì)信息。
[0019]可選的,上述基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新裝置,其中,所述第一更新模塊具體用于:在所述獲取的鏈接對(duì)信息中的點(diǎn)出頁(yè)地址為之前未曾存儲(chǔ)的點(diǎn)出頁(yè)地址的情況下,存儲(chǔ)該未曾存儲(chǔ)的點(diǎn)出頁(yè)地址,并將所述未曾存儲(chǔ)的點(diǎn)出頁(yè)地址的訪問時(shí)間作為第一次被訪問的時(shí)間存儲(chǔ);將所述之前未曾存儲(chǔ)的點(diǎn)出頁(yè)地址的累積熱度N設(shè)置為在累積熱度N的初始值的基礎(chǔ)上根據(jù)第一預(yù)定步長(zhǎng)的遞增值;將所述之前未曾存儲(chǔ)的點(diǎn)出頁(yè)地址的熱度H設(shè)置為在熱度H的初始值的基礎(chǔ)上根據(jù)第二預(yù)定步長(zhǎng)的遞增值。
[0020]可選的,上述基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新裝置,其中,所述第一更新模塊具體用于:在所述獲取的鏈接對(duì)信息中的點(diǎn)出頁(yè)地址為之前曾記錄的點(diǎn)出頁(yè)地址的情況下,根據(jù)第一預(yù)定步長(zhǎng)使所述鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N在當(dāng)前累積熱度數(shù)值的基礎(chǔ)上遞增,根據(jù)第二預(yù)定步長(zhǎng)使所述鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的熱度H在當(dāng)前熱度數(shù)值的基礎(chǔ)上遞增;其中,所述熱度H根據(jù)熱度衰減周期定期恢復(fù)為初始值。
[0021]可選的,上述基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新裝置,其中,所述時(shí)間衰減模塊具體用于:根據(jù)時(shí)間衰減周期利用下述公式對(duì)所述累積熱度N進(jìn)行時(shí)間衰減處理;N=NXXXA ;其中,所述X為針對(duì)來源地址的時(shí)間衰減因子,所述A為基于T/Now的時(shí)間倒數(shù)曲線,所述T為鏈接對(duì)信息中的點(diǎn)出頁(yè)第一次被訪問的時(shí)間,所述Now為當(dāng)前時(shí)間。
[0022]可選的,上述基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新裝置,其中,所述熱度衰減模塊具體用于:根據(jù)熱度衰減周期利用下述公式對(duì)所述累積熱度N進(jìn)行在所述時(shí)間窗內(nèi)的熱度衰減處理;N = NXYX (H/H’ ) X (N’ /H’ );其中,所述Y為針對(duì)來源地址的熱度衰減因子,所述H’為所有屬于同一個(gè)來源地址的點(diǎn)出頁(yè)在同一時(shí)間窗內(nèi)的熱度H的平均值,所述N’為鏈接對(duì)信息中的點(diǎn)出頁(yè)地址在其被存儲(chǔ)時(shí)間段內(nèi),單位時(shí)間的熱度值。
[0023]借由上述技術(shù)方案,本發(fā)明提供的針對(duì)移動(dòng)設(shè)備的基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新方法和裝置至少具有下列優(yōu)點(diǎn)及有益效果:本發(fā)明實(shí)施例通過獲取各網(wǎng)絡(luò)訪問的來源地址與點(diǎn)出頁(yè)地址的鏈接對(duì)信息,并根據(jù)該鏈接對(duì)信息對(duì)點(diǎn)出頁(yè)的累積熱度N進(jìn)行時(shí)間衰減處理以及熱度衰減處理,使各點(diǎn)出頁(yè)的累積熱度N可以準(zhǔn)確的反應(yīng)各點(diǎn)出頁(yè)的用戶的消費(fèi)趨勢(shì),這樣,在向用戶基于預(yù)讀取進(jìn)行頁(yè)面推送時(shí),通過參考各點(diǎn)出頁(yè)的累積熱度N,可以使服務(wù)端提前向用戶推送的頁(yè)面被用戶選中點(diǎn)擊的命中概率會(huì)大大提高,進(jìn)而保證了預(yù)讀取的聞準(zhǔn)確性和聞?dòng)行?,最終提聞了用戶體驗(yàn)。
[0024]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其他目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉較佳的實(shí)施例,詳細(xì)說明如下。
【專利附圖】
【附圖說明】
[0025]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0026]圖1是本發(fā)明實(shí)施例提供的基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新方法流程圖;
[0027]圖2是本發(fā)明實(shí)施例提供的基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新裝置示意圖。
【具體實(shí)施方式】
[0028]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0029]實(shí)施例一、基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新方法。該更新方法的流程如圖1所示。
[0030]圖1中,S100、根據(jù)各終端設(shè)備進(jìn)行網(wǎng)絡(luò)訪問的信息獲取各網(wǎng)絡(luò)訪問的來源地址與點(diǎn)出頁(yè)地址的鏈接對(duì)信息。
[0031]具體的,本發(fā)明實(shí)施例可以通過各終端設(shè)備的網(wǎng)絡(luò)訪問的客戶端日志實(shí)時(shí)的獲取到上述鏈接對(duì)信息;該網(wǎng)絡(luò)訪問的客戶端日志通常是由終端設(shè)備的瀏覽器客戶端產(chǎn)生的。該終端設(shè)備可以為臺(tái)式計(jì)算機(jī)、筆記型計(jì)算機(jī)、平板電腦以及智能型移動(dòng)電話等可以通過客戶端瀏覽器進(jìn)行網(wǎng)絡(luò)訪問的終端設(shè)備。
[0032]本步驟的一個(gè)具體的例子,服務(wù)器可以通過構(gòu)建后臺(tái)服務(wù)端來實(shí)時(shí)獲取網(wǎng)絡(luò)中的所有終端設(shè)備的網(wǎng)絡(luò)訪問的客戶端日志,該客戶端日志中記錄有用戶通過客戶端進(jìn)行網(wǎng)絡(luò)訪問的瀏覽路徑,從而服務(wù)器(如服務(wù)器的后臺(tái)服務(wù)端)可以從上述實(shí)時(shí)獲得的網(wǎng)絡(luò)訪問的客戶端日志的瀏覽路徑中提取出網(wǎng)絡(luò)訪問的來源地址以及針對(duì)該來源地址的點(diǎn)出頁(yè)地址,從而獲得上述鏈接對(duì)信息。
[0033]上述獲取的鏈接對(duì)信息可以具體包括:來源地址以及針對(duì)該來源地址的點(diǎn)出頁(yè)地址,且該鏈接對(duì)信息可以使用Refer->Url信息來表示,其中,Refer表示來源地址,而Url表示針對(duì)該來源地址的點(diǎn)出頁(yè)地址。
[0034]S110、根據(jù)獲取的各鏈接對(duì)信息更新鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N以及點(diǎn)出頁(yè)在過去預(yù)定時(shí)長(zhǎng)的時(shí)間窗內(nèi)的熱度H。
[0035]具體的,本發(fā)明實(shí)施例可以在獲取到鏈接對(duì)信息之后,先對(duì)獲取到的鏈接對(duì)信息進(jìn)行過濾處理,然后,再利用過濾處理后的鏈接對(duì)信息對(duì)累積熱度N以及熱度H進(jìn)行更新處理。
[0036]對(duì)獲取到的鏈接對(duì)信息進(jìn)行過濾的目的包括:避免一些不需要向用戶提前推送的網(wǎng)頁(yè)對(duì)應(yīng)的鏈接對(duì)信息對(duì)本發(fā)明實(shí)施例中的頁(yè)面熱點(diǎn)資源更新的影響。
[0037]本發(fā)明實(shí)施例對(duì)上述SlOO中獲得的鏈接對(duì)信息進(jìn)行過濾的一個(gè)具體實(shí)現(xiàn)方式為:根據(jù)鏈接對(duì)信息中的來源地址以及點(diǎn)出頁(yè)地址判斷鏈接對(duì)的點(diǎn)出頁(yè)的類型,如果判斷出點(diǎn)出頁(yè)的類型屬于需要進(jìn)行濾除的預(yù)定類型,則濾除該鏈接對(duì)信息,否則,保留該鏈接對(duì)信息。
[0038]上述需要進(jìn)行濾除的預(yù)定類型可以包括:不可預(yù)讀取類型、信息含量少類型以及具有破壞性功能類型等。上述不可預(yù)讀取類型可以包括廣告類型等;上述信息含量少類型可以包括微博類型等;上述具有破壞性功能類型可以包括用戶登錄類型等。[0039]廣告類型的點(diǎn)出頁(yè)的特點(diǎn)可以為:鏈接對(duì)信息中通常包含有類似“www.alimama.com”這樣的特征信息,從而在判斷出鏈接對(duì)信息中包含有類似“www.al imama.com”這樣的特征信息時(shí),可以確定出該鏈接對(duì)信息屬于應(yīng)被濾除的鏈接對(duì)信息。
[0040]信息含量少類型的點(diǎn)出頁(yè)的特點(diǎn)可以為:鏈接對(duì)信息中通常包含有類似“weibo”這樣的特征信息,從而在判斷出鏈接對(duì)信息中包含有類似“weibo”這樣的特征信息時(shí),可以確定出該鏈接對(duì)信息屬于應(yīng)被濾除的鏈接對(duì)信息。
[0041]用戶登錄類型的點(diǎn)出頁(yè)的特點(diǎn)可以為:鏈接對(duì)信息中通常包含有類似“l(fā)ogin”、“l(fā)ogout”以及“account=”這樣的特征信息,從而在判斷出鏈接對(duì)信息中包含有類似“l(fā)ogin”、“l(fā)ogout”或者“account=”這樣的特征信息時(shí),可以確定出該鏈接對(duì)信息屬于應(yīng)被濾除的鏈接對(duì)信息。
[0042]本發(fā)明實(shí)施例可以利用預(yù)先設(shè)定的過濾模板對(duì)上述S100中獲得的鏈接對(duì)信息進(jìn)行過濾處理。
[0043]在本發(fā)明實(shí)施例包含有上述過濾處理操作的情況下,應(yīng)利用過濾處理后的鏈接對(duì)信息來更新鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N以及點(diǎn)出頁(yè)在過去預(yù)定時(shí)長(zhǎng)的時(shí)間窗內(nèi)的熱度H,而不是利用S100中獲取到的所有鏈接對(duì)信息來更新鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N以及點(diǎn)出頁(yè)在過去預(yù)定時(shí)長(zhǎng)的時(shí)間窗內(nèi)的熱度H。
[0044]在本發(fā)明實(shí)施例不包含有上述過濾處理操作的情況下,應(yīng)直接利用S100中獲取到的所有鏈接對(duì)信息來更新鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N以及點(diǎn)出頁(yè)在過去預(yù)定時(shí)長(zhǎng)的時(shí)間窗內(nèi)的熱度H。
[0045]不論本發(fā)明實(shí)施例是利用過濾處理后的鏈接對(duì)信息來更新鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N以及點(diǎn)出頁(yè)在過去預(yù)定時(shí)長(zhǎng)的時(shí)間窗內(nèi)的熱度H,還是利用S100中獲取到的所有鏈接對(duì)信息來更新鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N以及點(diǎn)出頁(yè)在過去預(yù)定時(shí)長(zhǎng)的時(shí)間窗內(nèi)的熱度H,都可以采用下述更新處理方式,SP:
[0046]針對(duì)每一條鏈接對(duì)信息,分別判斷鏈接對(duì)信息中的點(diǎn)出頁(yè)地址是否為針對(duì)該鏈接對(duì)信息中的來源地址的一個(gè)新的點(diǎn)出頁(yè)地址(即該點(diǎn)出頁(yè)地址是否已存在于之前記錄的該來源地址下的各點(diǎn)出頁(yè)地址中),如果是一個(gè)新的點(diǎn)出頁(yè)地址,則針對(duì)該新的點(diǎn)出頁(yè)地址執(zhí)行下述第一操作;如果不是一個(gè)新的點(diǎn)出頁(yè)地址,則針對(duì)該新的點(diǎn)出頁(yè)地址執(zhí)行下述第二操作。
[0047]第一操作:存儲(chǔ)該點(diǎn)出頁(yè)地址,并將該點(diǎn)出頁(yè)地址的訪問時(shí)間作為該點(diǎn)出頁(yè)地址的第一次被訪問的時(shí)間存儲(chǔ);同時(shí),將該點(diǎn)出頁(yè)地址的累積熱度N設(shè)置為在N的初始值的基礎(chǔ)上根據(jù)第一預(yù)定步長(zhǎng)的遞增值,如N=NWMt+l ;將該點(diǎn)出頁(yè)在過去預(yù)定時(shí)長(zhǎng)的時(shí)間窗內(nèi)的熱度H設(shè)置為在H的初始值的基礎(chǔ)上根據(jù)第二預(yù)定步長(zhǎng)的遞增值,如H=HWMt+l,該熱度H可以表示出在過去預(yù)定時(shí)長(zhǎng)的時(shí)間窗內(nèi)該點(diǎn)出頁(yè)被點(diǎn)擊的次數(shù)。上述Nw可以設(shè)置為0,且上述Hwmi也可以設(shè)置為O。當(dāng)然,上述第一預(yù)定步長(zhǎng)和第二預(yù)定步長(zhǎng)也可以不為1,且上述和Hwmi也可以為除0之外的其他數(shù)值。
[0048]第二操作:根據(jù)第一預(yù)定步長(zhǎng)使該鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N在當(dāng)前累積熱度數(shù)值的基礎(chǔ)上遞增,如N=N3IMt+l ;根據(jù)第二預(yù)定步長(zhǎng)使鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)在過去預(yù)定時(shí)長(zhǎng)的時(shí)間窗內(nèi)的熱度H在當(dāng)前熱度數(shù)值的基礎(chǔ)上遞增,如H=Hstm+l ;當(dāng)然,這里的第一預(yù)定步長(zhǎng)和第二預(yù)定步長(zhǎng)也可以不為I。上述點(diǎn)出頁(yè)的累積熱度N通常并不會(huì)周期性的被恢復(fù)為初始值(即Nw,如0),然而,上述熱度H應(yīng)根據(jù)熱度衰減周期定期恢復(fù)為初始值(即Hw,如0),即上述時(shí)間窗的預(yù)定時(shí)長(zhǎng)為熱度衰減周期的時(shí)長(zhǎng)。另外,上述熱度衰減周期的時(shí)長(zhǎng)(即時(shí)間窗的預(yù)定時(shí)長(zhǎng))的取值可根據(jù)實(shí)際需求以及服務(wù)器的計(jì)算能力等進(jìn)行設(shè)置,如設(shè)置為I分鐘或者設(shè)置為5分鐘等。
[0049]本發(fā)明實(shí)施例可以針對(duì)一個(gè)來源地址設(shè)置一個(gè)列表,該列表可以稱為頁(yè)面熱點(diǎn)資源列表,該頁(yè)面熱點(diǎn)資源列表中可以主要包括:針對(duì)來源地址的時(shí)間衰減因子、針對(duì)來源地址的熱度衰減因子、點(diǎn)出頁(yè)地址、點(diǎn)出頁(yè)地址的累積熱度N、點(diǎn)出頁(yè)在過去預(yù)定時(shí)長(zhǎng)的時(shí)間窗內(nèi)的熱度H以及點(diǎn)出頁(yè)地址第一次被訪問的時(shí)間。當(dāng)然,該頁(yè)面熱點(diǎn)資源列表中還可以包括其他內(nèi)容,如來源地址的熱度以及在該列表中所記錄的來源地址下的點(diǎn)出頁(yè)的數(shù)量等。另外,本發(fā)明實(shí)施例也可以針對(duì)多個(gè)來源地址設(shè)置一個(gè)頁(yè)面熱點(diǎn)資源列表,此時(shí),該列表中還應(yīng)包括來源地址這一項(xiàng)。
[0050]需要說明的是,對(duì)于新的點(diǎn)出頁(yè)地址而言,其出現(xiàn)的時(shí)間可能是在當(dāng)前時(shí)間窗的中間位置或者中間偏后的位置,因此,在當(dāng)前時(shí)間窗(即針對(duì)新的點(diǎn)出頁(yè)地址的第一個(gè)時(shí)間窗內(nèi)),新的點(diǎn)出頁(yè)的累積熱度N以及熱度H的數(shù)值大小可能會(huì)偏低,在進(jìn)入下一個(gè)時(shí)間窗(即針對(duì)新的點(diǎn)出頁(yè)地址的第二個(gè)時(shí)間窗)后,其累積熱度N以及熱度H的數(shù)值大小很可能會(huì)逐步提聞。
[0051]S120、根據(jù)熱度衰減周期利用熱度H和針對(duì)來源地址的熱度衰減因子對(duì)累積熱度N進(jìn)行在時(shí)間窗內(nèi)的熱度衰減處理。
[0052]具體的,上述S120中還可以包含有根據(jù)時(shí)間衰減周期利用針對(duì)來源地址的時(shí)間衰減因子對(duì)累積熱度N進(jìn)行時(shí)間衰減處理,本發(fā)明實(shí)施例對(duì)這兩個(gè)衰減處理操作的先后執(zhí)行順序并不進(jìn)行特殊限定;且上述時(shí)間衰減周期和熱度衰減周期的時(shí)長(zhǎng)可以相同,也可以不相同,用戶可以根據(jù)實(shí)際需求靈活設(shè)置上述時(shí)間衰減周期和熱度衰減周期的時(shí)長(zhǎng)。需要說明的是,由于熱度衰減周期的時(shí)長(zhǎng)應(yīng)為上述時(shí)間窗的預(yù)定時(shí)長(zhǎng),因此,在根據(jù)熱度衰減周期利用熱度H和針對(duì)來源地址的熱度衰減因子對(duì)累積熱度N進(jìn)行在時(shí)間窗內(nèi)的熱度衰減后,熱度H被恢復(fù)為初始值,如O。
[0053]頁(yè)面熱點(diǎn)資源具有的一個(gè)特點(diǎn)為:隨著時(shí)間的推移,頁(yè)面熱點(diǎn)資源會(huì)呈現(xiàn)出降溫的趨勢(shì),且老的頁(yè)面熱點(diǎn)資源由于已經(jīng)累積了一定的熱度,因此,老的頁(yè)面熱點(diǎn)資源的降溫趨勢(shì)會(huì)比新的頁(yè)面熱點(diǎn)資源的降溫趨勢(shì)更明顯;本發(fā)明實(shí)施例對(duì)累積熱度N進(jìn)行時(shí)間衰減即是針對(duì)頁(yè)面熱點(diǎn)資源的這一特點(diǎn)設(shè)計(jì)的。
[0054]頁(yè)面熱點(diǎn)資源具有的另一個(gè)特點(diǎn)為:針對(duì)新出現(xiàn)的頁(yè)面熱點(diǎn)資源,如果一開始熱度就很高,那么其熱的趨勢(shì)會(huì)繼續(xù)上升,該頁(yè)面熱點(diǎn)資源會(huì)快速上升到一定的熱度;對(duì)于老的頁(yè)面熱點(diǎn)資源,如果熱度開始降低,那么其熱的趨勢(shì)會(huì)繼續(xù)下降,該頁(yè)面熱點(diǎn)資源會(huì)快速下降出一定的熱度區(qū)域。另外,通過進(jìn)行熱度的平均可以平衡短暫內(nèi)熱門的頁(yè)面熱點(diǎn)資源的所出現(xiàn)的波動(dòng)現(xiàn)象。本發(fā)明實(shí)施例對(duì)累積熱度N進(jìn)行熱度衰減即是針對(duì)頁(yè)面熱點(diǎn)資源的這一特點(diǎn)設(shè)計(jì)的。
[0055]根據(jù)時(shí)間衰減周期利用針對(duì)來源地址的時(shí)間衰減因子對(duì)累積熱度N進(jìn)行時(shí)間衰減處理的一個(gè)具體例子為:周期性(基于時(shí)間衰減周期)的利用下述公式(I)計(jì)算累積熱度N在時(shí)間衰減處理操作后的數(shù)值;[0056]N=NX X XT/Now ; 公式(I)
[0057]在上述公式(I)中,X為時(shí)間衰減因子,T為鏈接對(duì)信息中的點(diǎn)出頁(yè)第一次被訪問的時(shí)間,Now為當(dāng)前時(shí)間(如服務(wù)器當(dāng)前時(shí)間),上述第一次被訪問的時(shí)間以及當(dāng)前時(shí)間均可以包括:年、月、日、小時(shí)、分鐘以及秒,如第一次被訪問的時(shí)間以及當(dāng)前時(shí)間均可以采用格林威治時(shí)間表示方法,格林威治時(shí)間表示方法的一個(gè)具體例子:1970年I月I日00:00:00。
[0058]由于上述T的取值為固定值,而Now的取值會(huì)不斷增加,因此,時(shí)間衰減體現(xiàn)的是基于當(dāng)前時(shí)間的倒數(shù)的曲線,由此可知,上述T/Now也可采用對(duì)數(shù)、指數(shù)、開方或者冪等多種數(shù)學(xué)形式,其區(qū)別在于:曲線的變化速率不同。
[0059]根據(jù)熱度衰減周期利用熱度H和針對(duì)來源地址的熱度衰減因子對(duì)累積熱度N進(jìn)行在時(shí)間窗內(nèi)的熱度衰減處理的一個(gè)具體的例子為:周期性的利用下述公式(2)計(jì)算累積熱度N在時(shí)間窗內(nèi)的熱度衰減處理后的數(shù)值;
[0060]N = NXYX (H/H,)X (N,/H,); 公式(2)
[0061]在上述公式(2)中,Y為熱度衰減因子,H’為所有屬于同一個(gè)來源地址的點(diǎn)出頁(yè)
在同一時(shí)間窗內(nèi)的的熱度H的平均值,即n為屬于同一個(gè)來源地址的所有點(diǎn)
出頁(yè)的數(shù)量;N’表示一個(gè)點(diǎn)出頁(yè)地址在其存儲(chǔ)的時(shí)間段內(nèi)單位時(shí)間的熱度值,如N’ =N/(Now-T+1);上述H/H’可以描述為:一個(gè)點(diǎn)出頁(yè)地址的熱度如果高于上述平均值,且高出的程度越高,則H/H’所表示出來的系數(shù)越大,相反,如果低于上述平均值,且低出的程度越低,則H/H’所表示出來的系數(shù)越小。考慮到一個(gè)點(diǎn)出頁(yè)在某些時(shí)間窗內(nèi)的熱度H可能很低,這樣會(huì)造成曲線的波動(dòng)很大,因此,上述N’ /H’中的單位時(shí)間的熱度值N’可以起到平滑曲線的作用,具體的,由于用戶的訪問時(shí)間的不可控等因素很可能會(huì)使H在某一時(shí)間窗內(nèi)的計(jì)算結(jié)果產(chǎn)生非常大的變化,因此,本發(fā)明實(shí)施例通過利用點(diǎn)出頁(yè)地址在其存儲(chǔ)的時(shí)間段內(nèi)單位時(shí)間的熱度值N’來平衡H,可以避免H在某一時(shí)間窗內(nèi)的計(jì)算結(jié)果具有非常大的變化,從而使相應(yīng)的曲線表現(xiàn)的更趨平滑。
[0062]同理,由于上述T的取值為固定值,而Now的取值會(huì)不斷增加,因此,熱度衰減體現(xiàn)的是基于當(dāng)前時(shí)間的倒數(shù)的曲線,從而上述H/H’以及N’/H’也可采用對(duì)數(shù)、指數(shù)、開方或者冪等多種數(shù)學(xué)形式,其區(qū)別在于:曲線的變化速率不同。
[0063]上述時(shí)間衰減因子X和熱度衰減因子Y可以是通過對(duì)客戶端日志進(jìn)行數(shù)據(jù)挖掘后而設(shè)置的,對(duì)不同的來源地址(Refer)配置的時(shí)間衰減因子X和熱度衰減因子Y通常并不相同:一個(gè)具體的例子,對(duì)于變化更新比較快的來源地址(如http://www.sina.com, cn/以及http://www.sohu.com/等),所設(shè)置的時(shí)間衰減因子X和熱度衰減因子Y的取值,應(yīng)與對(duì)于變化更新比較慢的來源地址(如http://www.soRou.com/等)所設(shè)置的時(shí)間衰減因子X和熱度衰減因子Y的取值具有比較明顯的差別。且對(duì)于一個(gè)點(diǎn)出頁(yè)地址而言,針對(duì)其來源地址的時(shí)間衰減因子X和針對(duì)其來源地址的熱度衰減因子Y—旦確定通常不會(huì)再發(fā)生變化。
[0064]S130、根據(jù)衰減處理結(jié)果更新相應(yīng)鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N。
[0065]具體的,本發(fā)明實(shí)施例可以根據(jù)上述衰減處理后獲得的N更新頁(yè)面熱點(diǎn)資源列表中的相應(yīng)鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N,并可以按照該積累熱度N由大到小的順序?qū)α斜碇械狞c(diǎn)出頁(yè)進(jìn)行重新排序,從而在向用戶基于預(yù)讀取進(jìn)行頁(yè)面推送時(shí),可以參考當(dāng)前頁(yè)面熱點(diǎn)資源列表,由于該列表可以準(zhǔn)確的反應(yīng)各點(diǎn)出頁(yè)的消費(fèi)趨勢(shì),因此,在預(yù)讀取過程中,提前推送的頁(yè)面被用戶選中點(diǎn)擊的命中概率會(huì)被大大提高,從而提高了用戶的體驗(yàn)。當(dāng)然,本發(fā)明實(shí)施例也可以不對(duì)該列表進(jìn)行重新排序,而是將一個(gè)來源地址下的各點(diǎn)出頁(yè)地址提取出來放在一個(gè)新的列表中,且在該新的列表中,各點(diǎn)出頁(yè)地址是按照點(diǎn)出頁(yè)的累積熱度N由大到小的順序依次排列的。
[0066]實(shí)施例二、基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新方法的一個(gè)具體實(shí)例。
[0067]在本實(shí)施例中,來源地址(下述用Refer表示)為新浪國(guó)際足球的網(wǎng)頁(yè)地址,即http://sports, sina.com.cn/global/,并使用 Url 來表示針對(duì) Refer 的點(diǎn)出頁(yè)地址。
[0068]云端服務(wù)器的服務(wù)端實(shí)時(shí)收集網(wǎng)絡(luò)中所有用戶的客戶端瀏覽器在http://sports, sina.com.cn/global/上的點(diǎn)擊信息,從而產(chǎn)生鏈接對(duì)信息(refer, url);服務(wù)端收
集的鏈接對(duì)信息如下:
[0069]
【權(quán)利要求】
1.一種基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新方法,其特征在于,該方法包括: 根據(jù)各終端設(shè)備進(jìn)行網(wǎng)絡(luò)訪問的信息獲取各網(wǎng)絡(luò)訪問的來源地址與點(diǎn)出頁(yè)地址的鏈接對(duì)信息; 根據(jù)所述鏈接對(duì)信息更新所述鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N以及點(diǎn)出頁(yè)在過去預(yù)定時(shí)長(zhǎng)的時(shí)間窗內(nèi)的熱度H ; 根據(jù)熱度衰減周期利用熱度H和針對(duì)來源地址的熱度衰減因子對(duì)所述累積熱度N進(jìn)行在所述時(shí)間窗內(nèi)的熱度衰減處理; 根據(jù)所述衰減處理結(jié)果更新相應(yīng)鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N,所述累積熱度N為選取向終端設(shè)備提前推送資源的一個(gè)參數(shù)。
2.如權(quán)利要求1所述的方法,其特征在于,所述方法在更新所述累積熱度N以及熱度H之后還包括: 根據(jù)時(shí)間衰減周期利用針對(duì)來源地址的時(shí)間衰減因子對(duì)所述累積熱度N進(jìn)行時(shí)間衰減處理。
3.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)各終端設(shè)備進(jìn)行網(wǎng)絡(luò)訪問的信息獲取各網(wǎng)絡(luò)訪問的來源地址與點(diǎn)出頁(yè)地址的鏈接對(duì)信息的步驟包括: 實(shí)時(shí)獲取各終端設(shè)備的網(wǎng)絡(luò)訪問的客戶端日志; 從所述網(wǎng)絡(luò)訪問的客戶端日志中獲取各網(wǎng)絡(luò)訪問的來源地址與點(diǎn)出頁(yè)地址的鏈接對(duì)信息。
4.如權(quán)利要求1所述的方法,其特征在于,所述方法在更新所述累積熱度N以及熱度H之前還包括:對(duì)所述鏈接對(duì)信息進(jìn)行過濾的步驟,且所述過濾的步驟包括: 根據(jù)所述鏈接對(duì)信息確定點(diǎn)出頁(yè)的類型; 濾除出點(diǎn)出頁(yè)的類型屬于預(yù)定類型的鏈接對(duì)信息。
5.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述鏈接對(duì)信息更新所述鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N以及點(diǎn)出頁(yè)在過去預(yù)定時(shí)長(zhǎng)的時(shí)間窗內(nèi)的熱度H的步驟包括: 在所述獲取的鏈接對(duì)信息中的點(diǎn)出頁(yè)地址為之前未曾存儲(chǔ)的點(diǎn)出頁(yè)地址的情況下,存儲(chǔ)該未曾存儲(chǔ)的點(diǎn)出頁(yè)地址,并將所述未曾存儲(chǔ)的點(diǎn)出頁(yè)地址的訪問時(shí)間作為第一次被訪問的時(shí)間存儲(chǔ); 將所述之前未曾存儲(chǔ)的點(diǎn)出頁(yè)地址的累積熱度N設(shè)置為在累積熱度N的初始值的基礎(chǔ)上根據(jù)第一預(yù)定步長(zhǎng)的遞增值; 將所述之前未曾存儲(chǔ)的點(diǎn)出頁(yè)地址的熱度H設(shè)置為在熱度H的初始值的基礎(chǔ)上根據(jù)第二預(yù)定步長(zhǎng)的遞增值。
6.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述鏈接對(duì)信息更新所述鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N以及點(diǎn)出頁(yè)在過去預(yù)定時(shí)長(zhǎng)的時(shí)間窗內(nèi)的熱度H的步驟包括: 在所述獲取的鏈接對(duì)信息中的點(diǎn)出頁(yè)地址為之前曾記錄的點(diǎn)出頁(yè)地址的情況下,根據(jù)第一預(yù)定步長(zhǎng)使所述鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N在當(dāng)前累積熱度數(shù)值的基礎(chǔ)上遞增,根據(jù)第二預(yù)定步長(zhǎng)使所述鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的熱度H在當(dāng)前熱度數(shù)值的基礎(chǔ)上遞增;其中,所述熱度H根據(jù)熱度衰減周期定期恢復(fù)為初始值。
7.如權(quán)利要求2求所述的方法,其特征在于,所述根據(jù)時(shí)間衰減周期利用針對(duì)來源地址的時(shí)間衰減因子對(duì)所述累積熱度N進(jìn)行時(shí)間衰減處理的步驟包括: 根據(jù)時(shí)間衰減周期利用下述公式對(duì)所述累積熱度N進(jìn)行時(shí)間衰減處理; N=NXXXA ; 其中,所述X為針對(duì)來源地址的時(shí)間衰減因子,所述A為基于T/Now的時(shí)間倒數(shù)曲線,所述T為鏈接對(duì)信息中的點(diǎn)出頁(yè)第一次被訪問的時(shí)間,所述Now為當(dāng)前時(shí)間。
8.如權(quán)利要求1至7中任一權(quán)利要求所述的方法,其中,所述根據(jù)熱度衰減周期利用熱度H和針對(duì)來源地址的熱度衰減因子對(duì)所述累積熱度N進(jìn)行在所述時(shí)間窗內(nèi)的熱度衰減處理的步驟包括: 根據(jù)熱度衰減周期利用下述公式對(duì)所述累積熱度N進(jìn)行在所述時(shí)間窗內(nèi)的熱度衰減處理; N = NXYX (H/H,) X (N,/H,); 其中,所述Y為針對(duì)來源地址的熱度衰減因子,所述H’為所有屬于同一個(gè)來源地址的點(diǎn)出頁(yè)在同一時(shí)間窗內(nèi)的熱度H的平均值,所述N’為鏈接對(duì)信息中的點(diǎn)出頁(yè)地址在其被存儲(chǔ)時(shí)間段內(nèi),單位時(shí)間的熱度值。
9.一種基于預(yù)讀取的頁(yè)面熱點(diǎn)資源更新裝置,其特征在于,該裝置包括: 獲取模塊,用于根據(jù)各終端設(shè) 備進(jìn)行網(wǎng)絡(luò)訪問的信息獲取各網(wǎng)絡(luò)訪問的來源地址與點(diǎn)出頁(yè)地址的鏈接對(duì)信息; 第一更新模塊,用于根據(jù)所述鏈接對(duì)信息更新所述鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N以及點(diǎn)出頁(yè)在過去預(yù)定時(shí)長(zhǎng)的時(shí)間窗內(nèi)的熱度H ; 熱度衰減模塊,用于根據(jù)熱度衰減周期利用熱度H和針對(duì)來源地址的熱度衰減因子對(duì)所述累積熱度N進(jìn)行在所述時(shí)間窗內(nèi)的熱度衰減處理; 第二更新模塊,用于根據(jù)所述衰減處理結(jié)果更新相應(yīng)鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N,所述累積熱度N為選取向終端設(shè)備提前推送資源的一個(gè)參數(shù)。
10.如權(quán)利要求9所述的裝置,其特征在于,所述裝置還包括: 時(shí)間衰減模塊,與第一更新模塊連接,用于根據(jù)時(shí)間衰減周期利用針對(duì)來源地址的時(shí)間衰減因子對(duì)所述累積熱度N進(jìn)行時(shí)間衰減處理。
11.如權(quán)利要求9所述的裝置,其特征在于,所述獲取模塊具體用于:實(shí)時(shí)獲取各終端設(shè)備的網(wǎng)絡(luò)訪問的客戶端日志,并從所述網(wǎng)絡(luò)訪問的客戶端日志中獲取各網(wǎng)絡(luò)訪問的來源地址與點(diǎn)出頁(yè)地址的鏈接對(duì)信息。
12.如權(quán)利要求9所述的裝置,其特征在于,所述裝置還包括: 過濾模塊,與所述獲取模塊和第一更新模塊分別連接,且所述過濾模塊用于根據(jù)所述鏈接對(duì)信息確定點(diǎn)出頁(yè)的類型,并濾除出點(diǎn)出頁(yè)的類型屬于預(yù)定類型的鏈接對(duì)信息。
13.如權(quán)利要求9所述的裝置,其特征在于,所述第一更新模塊具體用于: 在所述獲取的鏈接對(duì)信息中的點(diǎn)出頁(yè)地址為之前未曾存儲(chǔ)的點(diǎn)出頁(yè)地址的情況下,存儲(chǔ)該未曾存儲(chǔ)的點(diǎn)出頁(yè)地址,并將所述未曾存儲(chǔ)的點(diǎn)出頁(yè)地址的訪問時(shí)間作為第一次被訪問的時(shí)間存儲(chǔ); 將所述之前未曾存儲(chǔ)的點(diǎn)出頁(yè)地址的累積熱度N設(shè)置為在累積熱度N的初始值的基礎(chǔ)上根據(jù)第一預(yù)定步長(zhǎng)的遞增值; 將所述之前未曾存儲(chǔ)的點(diǎn)出頁(yè)地址的熱度H設(shè)置為在熱度H的初始值的基礎(chǔ)上根據(jù)第二預(yù)定步長(zhǎng)的遞增值。
14.如權(quán)利要求9所述的裝置,其特征在于,所述第一更新模塊具體用于: 在所述獲取的鏈接對(duì)信息中的點(diǎn)出頁(yè)地址為之前曾記錄的點(diǎn)出頁(yè)地址的情況下,根據(jù)第一預(yù)定步長(zhǎng)使所述鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的累積熱度N在當(dāng)前累積熱度數(shù)值的基礎(chǔ)上遞增,根據(jù)第二預(yù)定步長(zhǎng)使所述鏈接對(duì)信息所屬的鏈接對(duì)的點(diǎn)出頁(yè)的熱度H在當(dāng)前熱度數(shù)值的基礎(chǔ)上遞增; 其中,所述熱度H根據(jù)熱度衰減周期定期恢復(fù)為初始值。
15.如權(quán)利要求10所述的裝置,其特征在于,所述時(shí)間衰減模塊具體用于: 根據(jù)時(shí)間衰減周期利用下述公式對(duì)所述累積熱度N進(jìn)行時(shí)間衰減處理; N=NXXXA ; 其中,所述X為針對(duì)來源地址的時(shí)間衰減因子,所述A為基于T/Now的時(shí)間倒數(shù)曲線,所述T為鏈接對(duì)信息中的點(diǎn)出頁(yè)第一次被訪問的時(shí)間,所述Now為當(dāng)前時(shí)間。
16.如權(quán)利要求9至15中任一權(quán)利要求所述的裝置,其特征在于,所述熱度衰減模塊具體用于: 根據(jù)熱度衰減周期利用 下述公式對(duì)所述累積熱度N進(jìn)行在所述時(shí)間窗內(nèi)的熱度衰減處理; N = NXYX (H/H,) X (N,/H,); 其中,所述Y為針對(duì)來源地址的熱度衰減因子,所述H’為所有屬于同一個(gè)來源地址的點(diǎn)出頁(yè)在同一時(shí)間窗內(nèi)的熱度H的平均值,所述N’為鏈接對(duì)信息中的點(diǎn)出頁(yè)地址在其被存儲(chǔ)時(shí)間段內(nèi),單位時(shí)間的熱度值。
【文檔編號(hào)】G06F17/30GK103500213SQ201310461879
【公開日】2014年1月8日 申請(qǐng)日期:2013年9月30日 優(yōu)先權(quán)日:2013年9月30日
【發(fā)明者】羅興, 湯傳喜, 胡又歡, 郭奇 申請(qǐng)人:北京搜狗科技發(fā)展有限公司