本發(fā)明屬于互聯(lián)網(wǎng)
技術(shù)領域:
,具體涉及一種對網(wǎng)頁信息展示位置進行排序的方法。
背景技術(shù):
:隨著電子商務的迅猛發(fā)展,網(wǎng)頁信息瀏覽量迎來了爆發(fā)式增長,伴隨而來的是網(wǎng)站信息展示資源競爭的白熱化。網(wǎng)站頁面是互聯(lián)網(wǎng)信息展示的載體,由于展示信息量比較大,需要對不同的信息來源進行排序,由此而形成網(wǎng)頁設計中的展示位置模塊。網(wǎng)頁通常由不同的展示位置組成,不同的信息匹配相應的展示位置。目前展示位置的先后順序通常是采用按照慣例從左到右、從上到下依次排序的方法,比如第一行左邊第一位優(yōu)先級最高,序號為1,第二位其次,序號為2,第三位序號為3,第二行第一位序號為4…。然而,這種排序方式不是基于展示位置實際價值,而是習慣使然?,F(xiàn)有的相關研究是根據(jù)眼球軌跡實驗得到的熱點圖確定用戶在網(wǎng)頁內(nèi)瀏覽的注意力分布,這種結(jié)果可以用于評估不同展示位置的價值,然而在現(xiàn)實中無法做到實時、大量統(tǒng)計,而且注意力分布與展示位置的分布不一定可以高度匹配,不具備實際操作性。綜上所述,目前對網(wǎng)站展示位置本身的排序方法上存在需求,提供一種可測量的、與展示位置實際價值匹配的排序方法具有非常重要的實踐意義和商業(yè)價值。技術(shù)實現(xiàn)要素:針對現(xiàn)有技術(shù)存在的問題,本發(fā)明的目的在于提供一種對網(wǎng)頁信息展示位置進行排序方法,解決現(xiàn)有展示位置實際價值與排序之間的“扭曲性匹配”問題,能夠?qū)崿F(xiàn)展示資源合理化利用。所述的一種對網(wǎng)頁信息展示位置進行排序的方法,其特征在于利用監(jiān)控程序收集一定時間段、同一網(wǎng)頁內(nèi)不同展示位置的用戶點擊量數(shù)據(jù),對收集的歷史點擊量進行數(shù)據(jù)凈化,通過時間序列計算歷史點擊量期望值,根據(jù)期望值來估計展示位置的當前價值,再按照當前估計價值從高到低對網(wǎng)站不同的展示位置進行排序。所述的一種對網(wǎng)頁信息展示位置進行排序的方法,其特征在于具體包括以下步驟:1)數(shù)據(jù)獲?。豪帽O(jiān)控程序,監(jiān)控各個展示位置的用戶點擊軌跡,收集和統(tǒng)計特定時間段、同一網(wǎng)頁內(nèi)各展示位置每天的用戶點擊量數(shù)據(jù);2)對原始數(shù)據(jù)進行清洗,得到“干凈數(shù)據(jù)”;3)計算在該時間段內(nèi)各個展示位置點擊量的期望值;4)以點擊量的期望值來估計展位當前價值,并對展示位置從高到低進行排序;5)滾動排序,即在下一個排序周期,收集相同時間間隔的數(shù)據(jù),重復1)到4)的步驟,實現(xiàn)周期性動態(tài)排序。所述的一種對網(wǎng)頁信息展示位置進行排序的方法,其特征在于所述的步驟1)中特定時間段包括:5年到1個月區(qū)間內(nèi)的任意時長,以天數(shù)為單位。所述的一種對網(wǎng)頁信息展示位置進行排序的方法,其特征在于所述的步驟2)中對原始數(shù)據(jù)進行清洗包括如下步驟:1)數(shù)據(jù)分析,做出數(shù)據(jù)分布散點圖;2)定義清洗規(guī)則,包括缺失數(shù)據(jù)處理規(guī)則和噪聲數(shù)據(jù)處理規(guī)則;3)執(zhí)行清洗過程;4)干凈數(shù)據(jù)回流。所述的一種對網(wǎng)頁信息展示位置進行排序的方法,其特征在于所述的步驟3)中計算在該時間段內(nèi)各個展示位置點擊量的期望值具體為:以下三種方法得到期望值的組合,其中,且:方法一,算術(shù)移動平均:,at,i表示在距離當前時間節(jié)點第t天,即時間距離t,其中1≤t≤n,i展示位的日點擊量;f0,i(1)表示當前時間i展示位的日點擊量估計值,0表示當前時間;n表示特定時間段的時長,用天數(shù)表示;方法二,加權(quán)移動平均模型:,ct表示距離當前時間節(jié)點第t天的點擊量的權(quán)重;at,i表示at,i表示在距離當前時間節(jié)點第t天,i展示位的日點擊量;f0,i(2)表示當前時間i展示位的日點擊量估計值;方法三,移動加權(quán)-指數(shù)平滑模型:基于移動加權(quán)平均計算的結(jié)果,結(jié)合指數(shù)平滑方法,計算公式為,δ表示滑動系數(shù),且0≤δ≤1,表示在1≤t≤n時間段內(nèi),i展示位所有日點擊量的期望值,采用方法二的計算公式;f1,i(3)表示距離當前時間前一天的平滑模型計算結(jié)果,初始值設置為距離當前時間前一天的實際點擊量a1,i。所述的一種對網(wǎng)頁信息展示位置進行排序的方法,其特征在于所述的步驟4)中排序按照展示位置價值由高到低,即不同展示位置點擊量期望值由高到低排序。所述的一種對網(wǎng)頁信息展示位置進行排序的方法,其特征在于所述的步驟5)中所述的排序周期是從1天到3個月時間內(nèi)的任意時長。所述的一種對網(wǎng)頁信息展示位置進行排序的方法,其特征在于所述的缺失數(shù)據(jù)處理規(guī)則采用缺失位置相鄰兩個數(shù)據(jù)進行求和平均的方法得到數(shù)值,四舍五入求整后填補進入缺失位置。所述的一種對網(wǎng)頁信息展示位置進行排序的方法,其特征在于所述的噪聲數(shù)據(jù)處理規(guī)則采用異頻分箱刪除方法:把經(jīng)過補缺處理的數(shù)據(jù)由小到大排序,分為3個箱子,第1個箱子占數(shù)據(jù)量的2.5%,第2個箱子占數(shù)據(jù)量的95%,第3個箱子占數(shù)據(jù)量的2.5%;刪除第1個箱子和第3個箱子的數(shù)據(jù),得到第2個箱子里面的數(shù)據(jù),即干凈數(shù)據(jù),如果2.5%的數(shù)據(jù)量小于1,則第1和3個箱子里面分別放入最小的和最大的點擊量數(shù)據(jù)。所述的一種對網(wǎng)頁信息展示位置進行排序的方法,其特征在于所述的加權(quán)移動平均模型中權(quán)重ct隨距離當前時間由遠到近逐漸增加,越靠近當前時間,權(quán)重越大;對同一個t,不同展位的權(quán)重ct是相同的,權(quán)重計算公式:。利用本發(fā)明可以實現(xiàn)網(wǎng)頁布局的優(yōu)化設計;實現(xiàn)信息展示位置本身價值和排列順序的合理匹配;提高網(wǎng)站資源利用效率和平臺效用。附圖說明圖1為本發(fā)明提供的對網(wǎng)頁廣告位置進行排序的方法流程圖;圖2為本發(fā)明中數(shù)據(jù)清洗步驟的示意圖;圖3為本發(fā)明中噪聲數(shù)據(jù)處理的異頻分箱示意圖;圖4為實施例中網(wǎng)頁展示位分布示意圖;圖5為實施例中數(shù)據(jù)分布散點圖;圖6為實施例中噪聲數(shù)據(jù)處理的異頻分箱示意圖;圖7為實施例中按照價值排序后的展位次序分布示意圖。具體實施方式以下結(jié)合具體實施例對本發(fā)明作進一步說明。一種對網(wǎng)頁信息展示位置進行排序的方法其利用監(jiān)控程序收集一定時間段、同一網(wǎng)頁內(nèi)不同展示位置的用戶點擊量數(shù)據(jù),對收集的歷史點擊量進行數(shù)據(jù)凈化,通過時間序列計算歷史點擊量期望值,根據(jù)期望值來估計展示位置的當前價值,再按照當前估計價值從高到低對網(wǎng)站不同的展示位置進行排序,具體包括以下步驟:1)數(shù)據(jù)獲取:利用監(jiān)控程序,監(jiān)控各個展示位置的用戶點擊軌跡,收集和統(tǒng)計特定時間段、同一網(wǎng)頁內(nèi)各展示位置每天的用戶點擊量數(shù)據(jù),其中特定時間段包括:5年到1個月區(qū)間內(nèi)的任意時長,以天數(shù)為單位。2)對原始數(shù)據(jù)進行清洗,得到“干凈數(shù)據(jù)”,具體包括:a數(shù)據(jù)分析,做出數(shù)據(jù)分布散點圖;b定義清洗規(guī)則,包括缺失數(shù)據(jù)處理規(guī)則和噪聲數(shù)據(jù)處理規(guī)則;c執(zhí)行清洗過程;d干凈數(shù)據(jù)回流。其中缺失數(shù)據(jù)處理規(guī)則采用缺失位置相鄰兩個數(shù)據(jù)進行求和平均的方法得到數(shù)值,四舍五入求整后填補進入缺失位置;噪聲數(shù)據(jù)處理規(guī)則采用異頻分箱刪除方法:把經(jīng)過補缺處理的數(shù)據(jù)由小到大排序,分為3個箱子,第1個箱子占數(shù)據(jù)量的2.5%,第2個箱子占數(shù)據(jù)量的95%,第3個箱子占數(shù)據(jù)量的2.5%;刪除第1個箱子和第3個箱子的數(shù)據(jù),得到第2個箱子里面的數(shù)據(jù),即干凈數(shù)據(jù),如果2.5%的數(shù)據(jù)量小于1,則第1和3個箱子里面分別放入最小的和最大的點擊量數(shù)據(jù)。3)計算在該時間段內(nèi)各個展示位置點擊量的期望值,計算方法具體為:以下三種方法得到期望值的組合,其中,且:方法一,算術(shù)移動平均:,at,i表示在距離當前時間節(jié)點第t天,即時間距離t,其中1≤t≤n,i展示位的日點擊量;f0,i(1)表示當前時間i展示位的日點擊量估計值,0表示當前時間;n表示特定時間段的時長,用天數(shù)表示;方法二,加權(quán)移動平均模型:,ct表示距離當前時間節(jié)點第t天的點擊量的權(quán)重;at,i表示at,i表示在距離當前時間節(jié)點第t天,i展示位的日點擊量;f0,i(2)表示當前時間i展示位的日點擊量估計值;其中加權(quán)移動平均模型中權(quán)重ct隨距離當前時間由遠到近逐漸增加,越靠近當前時間,權(quán)重越大;對同一個t,不同展位的權(quán)重ct是相同的,權(quán)重計算公式:;方法三,移動加權(quán)-指數(shù)平滑模型:基于移動加權(quán)平均計算的結(jié)果,結(jié)合指數(shù)平滑方法,計算公式為,δ表示滑動系數(shù),且0≤δ≤1,表示在1≤t≤n時間段內(nèi),i展示位所有日點擊量的期望值,采用方法二的計算公式;f1,i(3)表示距離當前時間前一天的平滑模型計算結(jié)果,初始值設置為距離當前時間前一天的實際點擊量a1,i。4)以點擊量的期望值來估計展位當前價值,并對展示位置從高到低進行排序,具體為排序按照展示位置價值由高到低,即不同展示位置點擊量期望值由高到低排序5)滾動排序,即在下一個排序周期,排序周期是從1天到3個月時間內(nèi)的任意時長,收集相同時間間隔的數(shù)據(jù),重復1)到4)的步驟,實現(xiàn)周期性動態(tài)排序。實施例1基于附圖1所示對網(wǎng)頁廣告位置進行排序的方法流程圖,結(jié)合具體實施例對本發(fā)明的方法做進一步的詳細說明。假設有一個網(wǎng)站,其頁面排版見附圖4。1.獲取最近1個月同一個網(wǎng)頁內(nèi),8個不同展示位置日點擊量的源數(shù)據(jù),如下表1所示:表12.在獲取數(shù)據(jù)以后,進行數(shù)據(jù)清洗,見附圖2:1)數(shù)據(jù)分析,做出數(shù)據(jù)分布散點圖,見附圖5。2)清洗規(guī)則:發(fā)現(xiàn)有數(shù)據(jù)缺失,采用缺失位置相鄰兩個數(shù)據(jù)進行求和平均的方法得到數(shù)值,即展位2,t=24時的缺失點擊量=(672+612)/2=642,展位5,t=27和t=26是兩個相連空位,卻是點擊量均等于(741+705)/2=723,展位6,t=21時的缺失點擊量=(569+515)/2=542,t=16時的缺失點擊量=(587+522)/2=554.5,去整后為555。噪聲數(shù)據(jù)處理見附圖3,將展位i的點擊量按照從小到大排序,如下表2所示。把每個展位的數(shù)據(jù)從小到大分別按照2.5%,95%,2.5%進行分箱,刪除第1個和第3個分箱,即表2中第一行和最后一行的數(shù)據(jù),剩余占數(shù)據(jù)量95%的第2分箱的數(shù)據(jù)成為干凈數(shù)據(jù),見附圖6。表2-1表2-23.計算點擊量期望值在本實施例中,n=28,1≤t≤28,i∈{1,2,3,4,5,6,7,8},根據(jù)方法二中公式:θ取值0.3,計算得到的ct值見下表3。另外,方法三中的δ取值為0.6。表3c1c2c3c4c5c6c7c8c9c100.0250.02810.02990.03110.03210.03290.03360.03420.03470.0352c11c12c13c14c15c16c17c18c19c200.035670.03600.036330.036770.0370.037330.037550.037880.0380.03822c21c22c23c24c25c26c27c280.03850.038770.03890.0390.039220.03940.03960.0397分別采用三種方法計算得到如下結(jié)果,取,得到當前時點,展位i的總體期望值f0,i。然后根據(jù)期望值估計展位價值,進行排序得到:展位1>展位5>展位2>展位6>展位7>展位4>展位3>展位8,如表4所示。得到展位價值排序以后,與展示的信息形成匹配,即排序1的展位匹配排名得分第一的信息,排序2的展位匹配排名得分第二的信息…,見附圖7。表4展位1展位2展位3展位4展位5展位6展位7展位8f0,i(1)856643445354742541423268f0,i(2)86064544357744544426270f0,i(3)859647454334737530424276f0,i858645328347741538424272排序13762458滾動排序周期設置為7天,即每隔7天重新進行一次排序運算,得到新的展位價值排序。需要說明的是,上述對實施例的詳細說明僅僅為了理解本發(fā)明,對本領域技術(shù)人員而言,可以根據(jù)上述說明加以改進或變換。只要是達到此目的的所有改進和變換都應屬于本發(fā)明所附權(quán)利要求的保護范圍。當前第1頁12