本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別是涉及一種互聯(lián)網(wǎng)內(nèi)容的投放方法及裝置。
背景技術(shù):
現(xiàn)如今,隨著互聯(lián)網(wǎng)尤其是移動互聯(lián)網(wǎng)的發(fā)展,互聯(lián)網(wǎng)可以提供給用戶的信息越來越豐富,用戶通過互聯(lián)網(wǎng)可以關(guān)注到不同類別的信息內(nèi)容。例如,對于新聞內(nèi)容,用戶可以通過互聯(lián)網(wǎng)訪問體育類信息、科技類信息、財經(jīng)類信息和娛樂類信息等等。
根據(jù)用戶歷史上在網(wǎng)站上的行為,比如瀏覽、搜索、收藏等,可以給用戶推送其曾經(jīng)訪問過的對象,如商品等的有關(guān)內(nèi)容。在現(xiàn)有技術(shù)中,推薦的方法往往根據(jù)業(yè)務(wù)和經(jīng)驗配置簡單的處理規(guī)則,例如處理規(guī)則所選取的特征為用戶瀏覽對象的時間順序,按照離當(dāng)前時間由近至遠(yuǎn)的順序排列推薦內(nèi)容投放順序,預(yù)估用戶點擊最近一次瀏覽的對象的可能性更大。
然而,根據(jù)現(xiàn)有技術(shù)的方法預(yù)測的用戶對推薦內(nèi)容的優(yōu)先點擊順序不夠準(zhǔn)確,換句話說,較優(yōu)先推薦的內(nèi)容不能夠準(zhǔn)確地代表用戶優(yōu)先點擊的內(nèi)容。
技術(shù)實現(xiàn)要素:
本發(fā)明解決的技術(shù)問題是提供一種互聯(lián)網(wǎng)內(nèi)容的投放方法及裝置,提高互聯(lián)網(wǎng)內(nèi)容投放的準(zhǔn)確率。
為解決上述技術(shù)問題,本發(fā)明實施例提供互聯(lián)網(wǎng)內(nèi)容的投放方法,所述方法包括:
獲取當(dāng)前用戶在當(dāng)前網(wǎng)站的歷史訪問記錄數(shù)據(jù),并將所述歷史訪問記錄數(shù)據(jù)切分為多個持續(xù)訪問記錄,每個所述持續(xù)訪問記錄包括所述當(dāng)前用戶對所述當(dāng)前網(wǎng)站的連續(xù)訪問行為形成的至少一條訪問記錄,每條所述訪問記錄包括所述當(dāng)前用戶在所述當(dāng)前網(wǎng)站上對對象的訪問行為數(shù)據(jù);從所述多個持續(xù)訪問記錄包含的訪問記錄中選取正例樣本和負(fù)例樣本;根據(jù)所述正例樣本和所述負(fù)例樣本,從所述歷史訪問記錄數(shù)據(jù)歸納訪問特征數(shù)據(jù);基于所述訪問特征數(shù)據(jù)進行模型訓(xùn)練,以得到多個回歸模型;基于多個待預(yù)測對象的更新訪問特征數(shù)據(jù)以及所述多個回歸模型,確定與所述多個待預(yù)測對象關(guān)聯(lián)的推薦內(nèi)容的投放優(yōu)先順序。
可選地,從所述多個持續(xù)訪問記錄包含的訪問記錄中選取正例樣本和負(fù)例樣本包括:
對于每一持續(xù)訪問記錄中的訪問記錄,如果所述訪問記錄針對的對象在先前的持續(xù)訪問記錄中被訪問過,則將所述訪問記錄標(biāo)記為所述正例樣本;
對于每一持續(xù)訪問記錄中的訪問記錄,如果所述訪問記錄針對的對象在先前的持續(xù)訪問記錄中被訪問過,但在當(dāng)前持續(xù)訪問記錄中沒有被訪問,則將所述訪問記錄標(biāo)記為所述負(fù)例樣本。
可選地,所述回歸模型為GBDT樹模型。
可選地,基于多個待預(yù)測對象的更新訪問特征數(shù)據(jù)以及所述多個回歸模型,確定與所述多個待預(yù)測對象關(guān)聯(lián)的推薦內(nèi)容的投放優(yōu)先順序,包括:
基于待預(yù)測對象的更新訪問特征數(shù)據(jù)和所述多個回歸模型得到所述待預(yù)測對象的得分;
根據(jù)所述得分按從高至低進行排序,并根據(jù)所述排序確定與所述多個待預(yù)測對象關(guān)聯(lián)的推薦內(nèi)容的投放優(yōu)先順序。
可選地,所述訪問特征數(shù)據(jù)包括當(dāng)前用戶訪問所述當(dāng)前網(wǎng)站的特征數(shù)據(jù)、對象被訪問的特征數(shù)據(jù)和所述當(dāng)前用戶訪問所述對象的特征數(shù)據(jù)。
本發(fā)明實施例還提供一種互聯(lián)網(wǎng)內(nèi)容的投放裝置,所述裝置包括:
獲取單元,適于獲取當(dāng)前用戶在當(dāng)前網(wǎng)站的歷史訪問記錄數(shù)據(jù),并將所述歷史訪問記錄數(shù)據(jù)切分為多個持續(xù)訪問記錄,每個所述持續(xù)訪問記錄包括所述當(dāng)前用戶對所述當(dāng)前網(wǎng)站的連續(xù)訪問行為形成的至少一條訪問記錄,每條所述訪問記錄包括所述當(dāng)前用戶在所述當(dāng)前網(wǎng)站上對對象的訪問行為數(shù)據(jù);
選取單元,適于從所述多個持續(xù)訪問記錄包含的訪問記錄中選取正例樣本和負(fù)例樣本;
歸納單元,適于根據(jù)所述正例樣本和所述負(fù)例樣本,從所述歷史訪問記錄數(shù)據(jù)歸納訪問特征數(shù)據(jù);
模型訓(xùn)練單元,適于基于所述訪問特征數(shù)據(jù)進行模型訓(xùn)練,以得到多個回歸模型;
確定單元,適于基于多個待預(yù)測對象的更新訪問特征數(shù)據(jù)以及所述多個回歸模型,確定與所述多個待預(yù)測對象關(guān)聯(lián)的推薦內(nèi)容的投放優(yōu)先順序。
可選地,所述選取單元包括:
第一標(biāo)記子單元,適于對于每一持續(xù)訪問記錄中的訪問記錄,如果所述訪問記錄針對的對象在先前的持續(xù)訪問記錄中被訪問過,則將所述訪問記錄標(biāo)記為所述正例樣本;
第二標(biāo)記子單元,適于對于每一持續(xù)訪問記錄中的訪問記錄,如果所述訪問記錄針對的對象在先前的持續(xù)訪問記錄中被訪問過,但在當(dāng)前持續(xù)訪問記錄中沒有被訪問,則將所述訪問記錄標(biāo)記為所述負(fù)例樣本。
可選地,所述回歸模型為GBDT模型。
可選地,所述確定單元包括:
得分獲取子單元,適于基于待預(yù)測對象的更新訪問特征數(shù)據(jù)和所述多個回歸模型得到所述待預(yù)測對象的得分;
投放順序確定子單元,適于根據(jù)所述得分按從高至低進行排序,并根據(jù)所述排序確定與所述多個待預(yù)測對象關(guān)聯(lián)的推薦內(nèi)容的投放優(yōu)先順序。
可選地,所述訪問特征數(shù)據(jù)包括當(dāng)前用戶訪問所述當(dāng)前網(wǎng)站的特征數(shù)據(jù)、對象被訪問的特征數(shù)據(jù)和所述當(dāng)前用戶訪問所述對象的特征數(shù)據(jù)。
與現(xiàn)有技術(shù)相比,本發(fā)明實施例的技術(shù)方案具有以下有益效果:
本發(fā)明實施例的技術(shù)方案通過獲取當(dāng)前用戶在當(dāng)前網(wǎng)站的歷史訪問記錄數(shù)據(jù),并將所述歷史訪問記錄數(shù)據(jù)切分為多個持續(xù)訪問記錄,從所述多個持續(xù)訪問記錄包含的訪問記錄中選取正例樣本和負(fù)例樣本,對每個正例樣本和負(fù)例樣本歸納訪問特征數(shù)據(jù),基于已被標(biāo)記為正例或負(fù)例的所述訪問特征數(shù)據(jù)進行模型訓(xùn)練,以得到多個回歸模型,再通過回歸模型和待預(yù)測對象的更新訪問特征數(shù)據(jù)確定與所述多個待預(yù)測對象關(guān)聯(lián)的推薦內(nèi)容的投放優(yōu)先順序。由于上述過程中,根據(jù)用戶的連續(xù)訪問行為將用戶的歷史訪問記錄拆分為多個持續(xù)訪問記錄,并以持續(xù)訪問記錄作為判斷的基準(zhǔn),從持續(xù)訪問記錄包含的訪問記錄中選取正例樣本和負(fù)例樣本,這樣的正例樣本和負(fù)例樣本提供了更加準(zhǔn)確的模型訓(xùn)練優(yōu)化目標(biāo),而基于此目標(biāo)訓(xùn)練得到的回歸模型可以對待預(yù)測對象進行較準(zhǔn)確的排序,使得該排序可較準(zhǔn)確地代表用戶點擊待預(yù)測對象的可能性順序,當(dāng)按照該順序確定向用戶投放的推薦內(nèi)容的優(yōu)先順序時,用戶點擊當(dāng)前優(yōu)先級較高的推薦內(nèi)容的可能性也較大,從而提高了推薦內(nèi)容投放的準(zhǔn)確性。由于投放的推薦內(nèi)容更加準(zhǔn)確,因而可以較好地避免用戶為獲取其感興趣的內(nèi)容而進行多次搜索和瀏覽等操作,進而可節(jié)省為響應(yīng)用戶的再次訪問或者搜索所需的網(wǎng)絡(luò)系統(tǒng)資源。同時,由于用戶從推薦內(nèi)容獲取其感興趣的內(nèi)容的可能性增大,從而降低需多次搜索和瀏覽等操作的可能性,進而提升了用戶體驗。
附圖說明
圖1是本發(fā)明實施例中的一種互聯(lián)網(wǎng)內(nèi)容的投放方法的流程圖;
圖2是本發(fā)明實施例中的一種互聯(lián)網(wǎng)內(nèi)容的投放方法的結(jié)構(gòu)示意圖。
具體實施方式
如背景技術(shù)所言,根據(jù)現(xiàn)有技術(shù)的方法所預(yù)測的用戶對推薦內(nèi)容的優(yōu)先點擊順序不夠準(zhǔn)確,換句話說,較優(yōu)先推薦的內(nèi)容不能夠準(zhǔn)確地代表用戶優(yōu)先點擊的內(nèi)容。因此,用戶為獲取其感興趣的內(nèi)容,往往需要進行多次搜索和瀏覽等操作,為響應(yīng)用戶的再次瀏覽或者搜索,需提供更多的網(wǎng)絡(luò)系統(tǒng)資源,導(dǎo)致成本上升。與此同時,用戶體驗也較差。
本發(fā)明實施例的技術(shù)方案通過獲取當(dāng)前用戶在當(dāng)前網(wǎng)站的歷史訪問記錄數(shù)據(jù),并將所述歷史訪問記錄數(shù)據(jù)切分為多個持續(xù)訪問記錄,從所述多個持續(xù)訪問記錄包含的訪問記錄中選取正例樣本和負(fù)例樣本,對每個正例樣本和負(fù)例樣本歸納訪問特征數(shù)據(jù),基于已被標(biāo)記為正例或負(fù)例的所述訪問特征數(shù)據(jù)進行模型訓(xùn)練,以得到多個回歸模型,再通過回歸模型和待預(yù)測對象的更新訪問特征數(shù)據(jù)確定與所述多個待預(yù)測對象關(guān)聯(lián)的推薦內(nèi)容的投放優(yōu)先順序。由于上述過程中,根據(jù)用戶的連續(xù)訪問行為將用戶的歷史訪問記錄拆分為多個持續(xù)訪問記錄,并以持續(xù)訪問記錄作為判斷的基準(zhǔn),從持續(xù)訪問記錄包含的訪問記錄中選取正例樣本和負(fù)例樣本,這樣的正例樣本和負(fù)例樣本提供了更加準(zhǔn)確的模型訓(xùn)練優(yōu)化目標(biāo),而基于此目標(biāo)訓(xùn)練得到的回歸模型可以對待預(yù)測對象進行較準(zhǔn)確的排序,使得該排序可較準(zhǔn)確地代表用戶點擊待預(yù)測對象的可能性順序,當(dāng)按照該順序確定向用戶投放的推薦內(nèi)容的優(yōu)先順序時,用戶點擊當(dāng)前優(yōu)先級較高的推薦內(nèi)容的可能性也較大,從而提高了推薦內(nèi)容投放的準(zhǔn)確性。由于投放的推薦內(nèi)容更加準(zhǔn)確,因而可以較好地避免用戶為獲取其感興趣的內(nèi)容而進行多次搜索和瀏覽等操作,進而可節(jié)省為響應(yīng)用戶的再次訪問或者搜索所需的網(wǎng)絡(luò)系統(tǒng)資源。同時,由于用戶從推薦內(nèi)容獲取其感興趣的內(nèi)容的可能性增大,從而降低需多次搜索和瀏覽等操作的可能性,進而提升了用戶體驗。
為使本發(fā)明的上述目的、特征和有益效果能夠更為明顯易懂,下面結(jié)合附圖對本發(fā)明的具體實施例做詳細(xì)的說明。
圖1是本發(fā)明實施例中的一種互聯(lián)網(wǎng)內(nèi)容的投放方法的流程圖。下面結(jié)合圖1所示的步驟進行說明。
步驟S101:獲取當(dāng)前用戶在當(dāng)前網(wǎng)站的歷史訪問記錄數(shù)據(jù),并將所述歷史訪問記錄數(shù)據(jù)切分為多個持續(xù)訪問記錄,每個所述持續(xù)訪問記錄包括所述當(dāng)前用戶對所述當(dāng)前網(wǎng)站的連續(xù)訪問行為形成的至少一條訪問記錄,每條所述訪問記錄包括所述當(dāng)前用戶在所述當(dāng)前網(wǎng)站上對對象的訪問行為數(shù)據(jù)。
其中,當(dāng)前網(wǎng)站是待投放互聯(lián)網(wǎng)內(nèi)容的網(wǎng)站,其可以是任何適當(dāng)?shù)木W(wǎng)站,例如新聞網(wǎng)站、視頻網(wǎng)站、購物網(wǎng)站等。
當(dāng)前網(wǎng)站的歷史訪問記錄數(shù)據(jù)來自于所述當(dāng)前網(wǎng)站的服務(wù)器,所述歷史訪問記錄數(shù)據(jù)可以以某個時間點以前的一個時間范圍為限,例如以上一個月的訪問行為數(shù)據(jù)作為本實施例所述的歷史訪問記錄數(shù)據(jù)。
在具體實施中,所述持續(xù)訪問記錄包括用戶的連續(xù)的訪問行為所形成的至少一條訪問記錄。其中,連續(xù)的訪問行為可以是一個會話(session)過程中的訪問行為,例如,從用戶U打開網(wǎng)站S至關(guān)閉網(wǎng)站S的過程即為所述用戶U在該網(wǎng)站S的一個會話過程。每條所述訪問記錄包括所述當(dāng)前用戶在所述當(dāng)前網(wǎng)站上對對象的訪問行為數(shù)據(jù)。具體地,每條訪問記錄可以包括訪問時間、訪問對象、是否為當(dāng)前會話的第一次訪問以及訪問類型所構(gòu)成訪問行為數(shù)據(jù)。本發(fā)明實施例所指的“對象”可以是新聞類別、視頻類別、商品或者其他特定的對象。所述訪問類型包括瀏覽和搜索。當(dāng)所述對象為商品時,所述訪問類型還可以包括收藏和加入購物車。下面以表1中用戶U在網(wǎng)站S的部分訪問行為數(shù)據(jù)為例進行說明:
表1
表1中,Ts1至Ts3界定的會話的訪問行為數(shù)據(jù)為第一持續(xù)訪問記錄S1,包括3條訪問記錄。Ts4和Ts5界定的會話訪問行為數(shù)據(jù)為第二持續(xù)訪問記錄S2,包括2條訪問記錄。每條訪問記錄包括訪問時間、是否是當(dāng)前會話內(nèi)的第一次訪問、訪問的商品和訪問類型。需要說明的是,訪問行為數(shù)據(jù)不限于上述列舉。
步驟S102:從所述多個持續(xù)訪問記錄包含的訪問記錄中選取正例樣本和負(fù)例樣本。
在具體實施中,對于每一持續(xù)訪問記錄中的訪問記錄,如果所述訪問記錄針對的對象在先前的持續(xù)訪問記錄中被訪問過,則將所述訪問記錄標(biāo)記為所述正例樣本;對于每一持續(xù)訪問記錄中的訪問記錄,如果所述訪問記錄針對的對象在先前的持續(xù)訪問記錄中被訪問過,但在當(dāng)前持續(xù)訪問記錄中沒有被訪問,則將所述訪問記錄標(biāo)記為所述負(fù)例樣本。
繼續(xù)以表1進行說明正例樣本和負(fù)例樣本的選取,在此假設(shè)第一持續(xù)訪問記錄為所選取的歷史訪問記錄數(shù)據(jù)中的第一個持續(xù)訪問記錄,換句話說,歷史訪問記錄數(shù)據(jù)從時間Ts1開始。其中:
對于第一持續(xù)訪問記錄S1而言,任何商品在之前都沒有被訪問過,因此第一持續(xù)訪問記錄S1中不產(chǎn)生正例樣本和負(fù)例樣本。對于第二持續(xù)訪問記錄S2而言,由于商品Pid1在第一訪問記錄中S1被訪問過,并且在當(dāng)前持續(xù)訪問記錄S2中也被訪問,因此商品Pid1對應(yīng)的這一條訪問記錄被標(biāo)記為正例樣本;商品Pid2在第一持續(xù)訪問記錄S1中被訪問過,但是在當(dāng)前第二持續(xù)訪問記錄S2中沒有被訪問,因此商品Pid2對應(yīng)的這一條訪問記錄被標(biāo)記為負(fù)例樣本。
類似地,針對所選取的歷史訪問記錄數(shù)據(jù)中的其他持續(xù)訪問記錄,也可以從中選出正例樣本和負(fù)例樣本。
需要說明的是,在標(biāo)記正例樣本和負(fù)例樣本時,可以不僅以被瀏覽或搜索作為條件,還可以限制滿足預(yù)設(shè)訪問類型作為條件。例如,當(dāng)所述對象為商品,所述訪問類型包括瀏覽、搜索、收藏和加入購物車時,將當(dāng)前持續(xù)訪問記錄之前的訪問記錄和當(dāng)前持續(xù)訪問記錄中訪問類型為預(yù)設(shè)類型的對象標(biāo)記為所述正例樣本,將當(dāng)前持續(xù)訪問記錄之前的訪問記錄中訪問類型為預(yù)設(shè)類型,但在當(dāng)前持續(xù)訪問記錄中訪問類型沒有預(yù)設(shè)類型的對象標(biāo)記為所述負(fù)例樣本,所述預(yù)設(shè)類型包括搜索和瀏覽。在選取正例樣本和負(fù)例樣本時,通過指定需滿足的預(yù)設(shè)類型,可以選出被認(rèn)為有價值的樣本作為模型訓(xùn)練的集合。
步驟S103:根據(jù)所述正例樣本和所述負(fù)例樣本,從所述歷史訪問記錄數(shù)據(jù)歸納訪問特征數(shù)據(jù)。
在具體實施中,所述訪問特征數(shù)據(jù)包括當(dāng)前用戶訪問所述當(dāng)前網(wǎng)站的特征數(shù)據(jù)、對象被訪問的特征數(shù)據(jù)和所述當(dāng)前用戶訪問所述對象的特征數(shù)據(jù)。其中,當(dāng)前用戶訪問所述當(dāng)前網(wǎng)站的特征數(shù)據(jù)可以包括當(dāng)前用戶對當(dāng)前網(wǎng)站的訪問行為的統(tǒng)計數(shù)據(jù),例如可以是當(dāng)前用戶在預(yù)設(shè)周期內(nèi)訪問當(dāng)前網(wǎng)站的次數(shù)、瀏覽不同對象的次數(shù)、搜索不同對象的次數(shù)等;對象被訪問的特征數(shù)據(jù)可以包括不同對象的統(tǒng)計數(shù)據(jù),例如可以是不同對象在各個持續(xù)訪問記錄中被瀏覽的次數(shù)、被搜索的次數(shù)等;當(dāng)前用戶訪問所述對象的特征數(shù)據(jù)可以是當(dāng)前用戶對不同對象的訪問行為的統(tǒng)計數(shù)據(jù),例如可以是當(dāng)前用戶在各個持續(xù)訪問記錄中對不同對象的瀏覽次數(shù)、搜索次數(shù)以及最后訪問時間等。
以步驟S102從表1中選出的正例樣本和負(fù)例樣本為例進行說明,所述對象為仍為商品。
所述當(dāng)前用戶訪問所述當(dāng)前網(wǎng)站的特征數(shù)據(jù)可以包括:Ts4之前,當(dāng)前用戶U訪問當(dāng)前網(wǎng)站S的總次數(shù)為3次,當(dāng)前用戶U最后的訪問時間為Ts3,等等。
所述對象被訪問的特征數(shù)據(jù)可以包括:基于商品Pid1統(tǒng)計,在Ts4之前,商品Pid1被訪問共2次(即搜索1次和瀏覽1次);基于商品Pid2統(tǒng)計,在Ts4之前,商品Pid2被訪問共1次(即搜索1次)。
所述當(dāng)前用戶U訪問所述對象的特征數(shù)據(jù)可以包括:在Ts4之前,當(dāng)前用戶U對商品Pid1訪問2次(即搜索1次和瀏覽1次);在Ts4之前,當(dāng)前用戶U對商品Pid2訪問1次(即搜索1次);在Ts4之前,當(dāng)前用戶U對商品Pid1的最后訪問時間為Ts3,當(dāng)前用戶U對商品Pid2的最后訪問時間為Ts2。
需要說明的是,所述訪問特征數(shù)據(jù)還可以根據(jù)其他預(yù)設(shè)標(biāo)準(zhǔn)來進行歸納,在此不做限制。
步驟S104:基于所述訪問特征數(shù)據(jù)進行模型訓(xùn)練,以得到多個回歸模型。
在具體實施中,所述回歸模型可以是梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)模型。所述模型訓(xùn)練的過程為本領(lǐng)域技術(shù)人員所能理解的現(xiàn)有技術(shù),在此不贅述。
步驟S105:基于多個待預(yù)測對象的更新訪問特征數(shù)據(jù)以及所述多個回歸模型,確定與所述多個待預(yù)測對象關(guān)聯(lián)的推薦內(nèi)容的投放優(yōu)先順序。
所述待預(yù)測對象為針對當(dāng)前用戶可能進行內(nèi)容推薦的候選對象。例如,需要從100個候選對象中選出8個對象關(guān)聯(lián)的推薦內(nèi)容對用戶進行投放,這100個候選對象為待預(yù)測對象。
在具體實施中,可以基于待預(yù)測對象的更新訪問特征數(shù)據(jù)和所述多個回歸模型得到所述待預(yù)測對象的得分,再根據(jù)所述得分按從高至低進行排序,并根據(jù)所述排序確定與所述多個待預(yù)測對象關(guān)聯(lián)的推薦內(nèi)容的投放優(yōu)先順序。例如,待預(yù)測對象中有第一對象和第二對象,根據(jù)第一對象和第二對象更新的訪問特征數(shù)據(jù)以及所述多個回歸模型進行預(yù)測,若第一對象的得分比第二對象的得分高,則兩者中優(yōu)先投放第一對象的推薦內(nèi)容至當(dāng)前用戶。
在具體實施中,可以選取投放優(yōu)先級順序排位最高的待預(yù)測對象所關(guān)聯(lián)的推薦內(nèi)容進行投放,或者選取投放優(yōu)先級順序處于前N位的待預(yù)測對象所關(guān)聯(lián)的推薦內(nèi)容進行投放。例如,基于100個待預(yù)測對象的更新訪問特征數(shù)據(jù)以及所述多個回歸模型,可以得到每個待預(yù)測對象的得分,按照得分從高至低的順序,選取得分最高的待預(yù)測對象關(guān)聯(lián)的推薦內(nèi)容向用戶進行投放,或者選取得分處于前8位的待預(yù)測對象關(guān)聯(lián)的推薦內(nèi)容向用戶進行投放。例如,當(dāng)所述對象為新聞類別時,所述推薦內(nèi)容可以是新聞內(nèi)容;當(dāng)所述對象為商品時,所述推薦內(nèi)容可以是互聯(lián)網(wǎng)廣告。
需要說明的是,本發(fā)明實施例的步驟S101至步驟S105是針對以一具體的當(dāng)前用戶而言,對于訪問當(dāng)前網(wǎng)站的其他用戶可使用同樣的實施方式確定針對該用戶的推薦內(nèi)容的投放優(yōu)先順序。
本發(fā)明的實施例中,從持續(xù)訪問記錄中所包含的訪問記錄中選取的正例樣本和負(fù)例樣本提供了模型訓(xùn)練優(yōu)化的目標(biāo),而基于此目標(biāo)訓(xùn)練得到的回歸模型可以對待預(yù)測對象進行較準(zhǔn)確的排序,使得該排序可較準(zhǔn)確地代表用戶點擊待預(yù)測對象的可能性順序,進而提升預(yù)估用戶點擊推薦內(nèi)容的可能性的準(zhǔn)確性,當(dāng)按照該順序確定向用戶投放的推薦內(nèi)容的優(yōu)先順序時,用戶點擊當(dāng)前優(yōu)先級較高的推薦內(nèi)容的可能性也較大,從而較好地避免用戶為獲取其感興趣的內(nèi)容而進行多次搜索和瀏覽等操作,進而可節(jié)省為響應(yīng)用戶的再次訪問或者搜索所需的網(wǎng)絡(luò)系統(tǒng)資源。同時,由于用戶從推薦內(nèi)容獲取其感興趣的內(nèi)容的可能性增大,從而降低需多次搜索和瀏覽等操作的可能性,進而提升了用戶體驗。
圖2是本發(fā)明實施例中的一種互聯(lián)網(wǎng)內(nèi)容的投放裝置的結(jié)構(gòu)示意圖。如圖2所示的互聯(lián)網(wǎng)內(nèi)容的投放裝置可以包括:獲取單元201、選取單元202、歸納單元203、模型訓(xùn)練單元204和確定單元205。
所述獲取單元201,適于獲取當(dāng)前用戶在當(dāng)前網(wǎng)站的歷史訪問記錄數(shù)據(jù),并將所述歷史訪問記錄數(shù)據(jù)切分為多個持續(xù)訪問記錄,每個所述持續(xù)訪問記錄包括所述當(dāng)前用戶對所述當(dāng)前網(wǎng)站的連續(xù)訪問行為形成的至少一條訪問記錄,每條所述訪問記錄包括所述當(dāng)前用戶在所述當(dāng)前網(wǎng)站上對對象的訪問行為數(shù)據(jù)。
所述選取單元202,適于從所述多個持續(xù)訪問記錄包含的訪問記錄中選取正例樣本和負(fù)例樣本。
在具體實施中,所述選取單元202可以包括:
第一標(biāo)記子單元,適于對于每一持續(xù)訪問記錄中的訪問記錄,如果所述訪問記錄針對的對象在先前的持續(xù)訪問記錄中被訪問過,則將所述訪問記錄標(biāo)記為所述正例樣本;
第二標(biāo)記子單元,適于對于每一持續(xù)訪問記錄中的訪問記錄,如果所述訪問記錄針對的對象在先前的持續(xù)訪問記錄中被訪問過,但在當(dāng)前持續(xù)訪問記錄中沒有被訪問,則將所述訪問記錄標(biāo)記為所述負(fù)例樣本。
所述歸納單元203,適于根據(jù)所述正例樣本和所述負(fù)例樣本,從所述歷史訪問記錄數(shù)據(jù)歸納訪問特征數(shù)據(jù)。
所述模型訓(xùn)練單元204,適于基于所述訪問特征數(shù)據(jù)進行模型訓(xùn)練,以得到多個回歸模型。
在具體實施中,所述回歸模型可以是GBDT模型。
所述確定單元205,適于基于多個待預(yù)測對象的更新訪問特征數(shù)據(jù)以及所述多個回歸模型,確定與所述多個待預(yù)測對象關(guān)聯(lián)的推薦內(nèi)容的投放優(yōu)先順序。
在具體實施中,所述確定單元205可以包括:
得分獲取子單元,適于基于待預(yù)測對象的更新訪問特征數(shù)據(jù)和所述多個回歸模型得到所述待預(yù)測對象的得分;
投放順序確定子單元,適于根據(jù)所述得分按從高至低進行排序,以根據(jù)所述排序確定與所述多個待預(yù)測對象關(guān)聯(lián)的推薦內(nèi)容的投放優(yōu)先順序。
有關(guān)所述互聯(lián)網(wǎng)內(nèi)容的投放裝置的結(jié)構(gòu)說明和有益效果可對應(yīng)參照圖1中所述的互聯(lián)網(wǎng)內(nèi)容的投放方法的實施說明和有益效果,在此不再贅述。
在具體實施中,當(dāng)所述互聯(lián)網(wǎng)內(nèi)容的投放方法可以應(yīng)用于互聯(lián)網(wǎng)廣告領(lǐng)域時,所述互聯(lián)網(wǎng)內(nèi)容的投放裝置可以應(yīng)用于DSP服務(wù)器。
本領(lǐng)域普通技術(shù)人員可以理解上述實施例的各種方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成,該程序可以存儲于計算機可讀存儲介質(zhì)中,存儲介質(zhì)可以包括:ROM、RAM、磁盤或光盤等。
以上對本發(fā)明實施例的方法及系統(tǒng)做了詳細(xì)的介紹,本發(fā)明并不限于此。任何本領(lǐng)域技術(shù)人員,在不脫離本發(fā)明的精神和范圍內(nèi),均可作各種更動與修改,因此本發(fā)明的保護范圍應(yīng)當(dāng)以權(quán)利要求所限定的范圍為準(zhǔn)。