本申請涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,特別涉及一種建立點擊率預(yù)估模型的方法及裝置、終端、存儲介質(zhì)。
背景技術(shù):
網(wǎng)絡(luò)技術(shù)發(fā)展到今天,越來越多的對象,如新聞資訊,文章,音樂,圖片等等需要推薦給用戶,而這種推薦要獲得好的效果,就需要為不同的對象有針對性地找到被推薦的用戶,進行個性化推薦,個性化推薦的核心技術(shù)難點就是如何準確地確定待推薦的對象。
技術(shù)實現(xiàn)要素:
鑒于上述問題,本申請的目的在于提供了一種建立點擊率預(yù)估模型的方法及裝置、終端、存儲介質(zhì),提高了向用戶推薦對象的準確性。
一方面,本申請實施例提供了一種建立點擊率預(yù)估模型的方法,包括:
采集多個第一用戶的特征,所述第一用戶為對象被推薦過的用戶,所述對象為推薦的待點擊內(nèi)容;
為所述多個第一用戶中的每個用戶的每個特征設(shè)定對所述對象的評價指標,基于所述評價指標構(gòu)建所述點擊率預(yù)估模型;
根據(jù)所述點擊率預(yù)估模型,建立每個第一用戶對所述對象的實際點擊值與預(yù)估點擊值的誤差函數(shù),基于所述誤差函數(shù)建立誤差損失函數(shù);
基于所述誤差損失函數(shù)以及預(yù)先統(tǒng)計的每個第一用戶對所述對象的實際點擊值,求解對所述對象設(shè)定的評價指標的數(shù)值;
根據(jù)求解得到的對所述對象的評價指標的數(shù)值確定所述點擊率預(yù)估模型。
可選地,所述方法還包括:
基于第二用戶的特征,利用所述點擊率預(yù)估模型得到所述第二用戶對所述對象的點擊率的預(yù)估值,所述第二用戶為所述對象未被推薦過的用戶。
采集多個第一用戶的特征之后,還包括:
將特征進行歸類,將每類特征劃分為多個特征集合;
為所述多個第一用戶中的每個用戶的每個特征設(shè)定對所述對象的評價指標之后還包括:
為每個特征集合內(nèi)的特征對所述對象的相同評價指標賦相同的數(shù)值。
所述評價指標包括:所述每個特征對所述對象的預(yù)估點擊值r和所述每個特征對所述對象的預(yù)估點擊值的可靠程度a,其中,r∈[0,1],a∈[0,1]。
所述基于所述誤差損失函數(shù)以及預(yù)先統(tǒng)計的每個用戶對所述對象的實際點擊值,求解對所述對象設(shè)定的評價指標的數(shù)值包括:
設(shè)置所述評價指標的初始值;
以所述誤差損失函數(shù)的損失最小為目標對所述誤差損失函數(shù)進行迭代計算;
當所述誤差損失函數(shù)的變化率小于預(yù)設(shè)閾值時停止所述迭代計算并以此時所述評價指標的取值作為所述評價指標的數(shù)值。
所述點擊率預(yù)估模型為:
所述誤差函數(shù)為:
所述誤差損失函數(shù)為:
其中,i表示對象,u表示用戶,u表示所述第一用戶的集合,ctru,i表示用戶u對對象i的點擊率預(yù)估值,f表示用戶u的特征,fu表示用戶u的特征集合;yu,i表示用戶u對對象i的實際點擊值;rf,i表示特征f對對象i的預(yù)估點擊值;af,i表示特征f對對象i的預(yù)估點擊值的可靠程度。
另一方面,本申請還提供一種建立點擊率預(yù)估模型的裝置,包括:
采集模塊,用于采集多個第一用戶的特征,所述第一用戶為對象被推薦過的用戶,所述對象為推薦的待點擊內(nèi)容;
第一建模模塊,用于為所述多個第一用戶中的每個用戶的每個特征設(shè)定對所述對象的評價指標,基于所述評價指標構(gòu)建所述點擊率預(yù)估模型;
第二建模模塊,用于根據(jù)所述點擊率預(yù)估模型,建立每個第一用戶對所述對象的實際點擊值與預(yù)估點擊值的誤差函數(shù),基于所述誤差函數(shù)建立誤差損失函數(shù);
求解模塊,用于基于所述誤差損失函數(shù)以及預(yù)先統(tǒng)計的每個第一用戶對所述對象的實際點擊值,求解對所述對象設(shè)定的評價指標的數(shù)值;
第三建模模塊,用于根據(jù)求解得到的對所述對象的評價指標的數(shù)值確定所述點擊率預(yù)估模型。
可選地,所述裝置還包括:
計算模塊,用于基于第二用戶的特征,利用所述點擊率預(yù)估模型得到所述第二用戶對所述對象的點擊率的預(yù)估值,所述第二用戶為所述對象未被推薦過的用戶。
可選地,所述采集模塊,還用于將特征進行歸類,將每類特征劃分為多個特征集合;
所述第一建模模塊,還用于為每個特征集合內(nèi)的特征對所述對象的相同評價指標賦相同的數(shù)值。
所述評價指標包括:每個特征對所述對象的評價指標包括:所述每個特征對所述對象的預(yù)估點擊值r和所述每個特征對所述對象的預(yù)估點擊值的可靠程度a,其中,r∈[0,1],a∈[0,1]。
所述求解模塊包括:
第一求解子模塊,用于設(shè)置所述評價指標的初始值;
第二求解子模塊,用于以所述誤差損失函數(shù)的損失最小為目標對所述誤差損失函數(shù)進行迭代計算;
第三求解子模塊,用于當所述誤差損失函數(shù)的變化率小于預(yù)設(shè)閾值時停止所述迭代計算并以此時所述評價指標的取值作為所述評價指標的數(shù)值。
所述點擊率預(yù)估模型為:
所述誤差函數(shù)為:
所述誤差損失函數(shù)為:
其中,i表示對象,u表示用戶,u表示所述第一用戶的集合,ctru,i表示用戶u對對象i的點擊率預(yù)估值,f表示用戶u的特征,fu表示用戶u的特征集合;yu,i表示用戶u對對象i的實際點擊值;rf,i表示特征f對對象i的預(yù)估點擊值;af,i表示特征f對對象i的預(yù)估點擊值的可靠程度。
又一方面,本申請還提供一種終端,包括:處理器、以及存儲有計算機指令的存儲器;
所述處理器讀取所述計算機指令,并執(zhí)行如前所述的一種建立點擊率預(yù)估模型的方法。
另一方面,本申請還提供一種存儲介質(zhì),存儲有計算機指令,所述計算機指令被執(zhí)行時實現(xiàn)如前所述的一種建立點擊率預(yù)估模型的方法。
本申請實施例提供的一種建立點擊率預(yù)估模型的方法及裝置、終端、存儲介質(zhì),以對象i被推薦過的用戶的點擊行為為基礎(chǔ),采集每個用戶的特征,以每個特征對對象i的評價指標為參數(shù)建立點擊率預(yù)估模型。當各個特征對對象i的評價指標確定后,對于一個未被推薦過該對象i的用戶,只要確定了該用戶的特征集合,即可根據(jù)該點擊率預(yù)估模型預(yù)估該用戶對對象i的點擊率。結(jié)合該方法,可以將對象i推薦給預(yù)估點擊率較高的用戶,該方法提高了對用戶推送對象的準確度,在實際應(yīng)用中,減少了無效推薦,提高了網(wǎng)絡(luò)利用率,能夠?qū)崿F(xiàn)為不同用戶提供個性化的對象推薦。
附圖說明
根據(jù)下述參照附圖進行的詳細描述,本申請的上述和其他目的、特征和優(yōu)點將變得顯而易見。在附圖中:
圖1為本申請一實施例提供的建立點擊率預(yù)估模型的方法的流程圖;
圖2為本申請一實施例提供的建立一網(wǎng)絡(luò)廣告的擊率預(yù)估模型的方法的流程圖;
圖3為本申請一實施例提供的網(wǎng)絡(luò)廣告點擊率預(yù)估模型應(yīng)用的場景示意圖;
圖4為本申請一實施例提供的建立文章點擊率預(yù)估模型的方法流程圖;
圖5為本申請一實施例提供的文章的點擊率預(yù)估模型應(yīng)用的場景示意圖;
圖6為本申請一實施例提供的建立點擊率預(yù)估模型的裝置的結(jié)構(gòu)示意圖。
具體實施方式
下面描述本申請的各個方面。本文的教導(dǎo)可以以多種多樣形式具體體現(xiàn),并且在本文中公開的任何具體結(jié)構(gòu)、功能或兩種僅僅是代表性的?;诒疚牡慕虒?dǎo),本領(lǐng)域技術(shù)人員應(yīng)該明白的是,本文所公開的一個方面可以獨立于任何其他方面實現(xiàn),并且這些方面中的兩個或多個方面可以按照各種方式組合。例如,可以使用本文所闡述的任何數(shù)目的方面,實現(xiàn)裝置或?qū)嵺`方法。另外,可以使用其他機構(gòu)、功能、或除了本文所闡述的一個或多個方面之外或不是本文所闡述的一個或多個方面的結(jié)構(gòu)和功能,實現(xiàn)這種裝置或?qū)嵺`這種方法。此外,本文所描述的任何方面可以包括權(quán)利要求的至少一個元素。
在本申請中,提供了一種建立點擊率預(yù)估模型的方法及裝置、終端、存儲介質(zhì)。下面結(jié)合附圖對本申請的具體實施方式進行描述。
參見圖1,本申請一實施例提供的建立點擊率預(yù)估模型的方法,包括步驟101至106。
步驟101:采集多個第一用戶的特征,所述第一用戶為對象被推薦過的用戶。
如前所述,在本申請的實施例中,所述對象為推薦的待點擊內(nèi)容,如可以是網(wǎng)絡(luò)廣告、文章、應(yīng)用、音樂或者圖片、電影等。
以音樂推薦為例,某個音樂被推薦給了眾多用戶,那么這些被推薦過該音樂的用戶即為該音樂的第一用戶。通過采集第一用戶的特征即可獲得該音樂被推薦過的用戶的特征。
在本實施例中,所述第一用戶的特征可以包括年齡、學(xué)歷、所在城市、職業(yè)或收入等多種類型。
在本申請的實施例中,采集多個第一用戶的特征之后,還可以包括:
將特征進行歸類,將每類特征劃分為多個特征集合。
對于每類特征,都可以以某種方式,劃分成多個不同的特征集合。以年齡為例,如可以劃分為“兒童”、“少年”、“青年”、“中年”、“老年”等,也可以劃分為“60后”、“70后”、“80后”、“90后”、“00后”等。
每類特征的劃分方式可以根據(jù)實際需要確定,本申請不作限定。
步驟102:為所述多個第一用戶中的每個用戶的每個特征設(shè)定對所述對象的評價指標,基于所述評價指標構(gòu)建所述點擊率預(yù)估模型。
本申請一實施例中,對所述對象的評價指標可以包括:所述每個特征對對象的預(yù)估點擊值r和所述每個特征對對象的預(yù)估點擊值的可靠程度a;其中,r∈[0,1],a∈[0,1]。即本申請實施例中,每個特征都通過預(yù)估點擊值r和所述預(yù)估點擊值的可靠程度a這兩個指標來對一個對象進行評價。
當特征被進行歸類,而且每類特征被劃分為多個特征集合時,本申請實施例提供的方法還包括:
為每個特征集合內(nèi)的特征對所述對象的相同評價指標賦相同的數(shù)值。
以年齡這個類型的特征為例,該特征被進一步劃分為“兒童”、“少年”、“青年”、“中年”、“老年”多個特征集合,那么每個集合中特征對同一個對象的評價指標r和a的取值相同。
仍然以音樂推薦為例,一個推薦對象為音樂i,若“少年”這個特征集合中的特征對該音樂i的評價指標r和a的取值分別為r1和a1,那么任意一個用戶,其年齡這個特征若是屬于“少年”這個特征集合,那么用戶的年齡這個特征對該音樂i的評價指標均為r1和a1。
本申請一實施例中,所述點擊率預(yù)估模型可以是:
其中,ctr表示點擊率預(yù)估值;u表示用戶;i表示對象;f表示用戶的特征;fu表示用戶的特征集合;rf,i表示特征f對對象i預(yù)估點擊值;af,i表示特征f對對象i預(yù)估點擊值的可靠程度。
通過該點擊率預(yù)估模型,可以知道,一個用戶u對某個對象i的點擊率是通過該用戶的特征集合f中的每個特征對對象i的預(yù)估點擊值r以及對對象i的預(yù)估點擊值的可靠程度a共同確定的。
若用戶a的特征集合f中有“青年”、“大學(xué)生”、“常住廣州”、“科技愛好者”這4個特征,這4個特征對某對象i的兩個評價指標分別為a1和r1、a2和r2、a3和r3以及a4和r4,則用戶a對對象i的點擊率預(yù)估值ctra,i=(a1*r1+a2*r2+a3*r3+a4*r4)/(a1+a2+a3+a4)。即當用戶的特征集合f確定后,若用戶的特征集合f中的各個特征對對象i的評價指標是確定的,那么即可以根據(jù)各個特征對該對象i的評價指標估算出該用戶對該對象的點擊率。
步驟103:根據(jù)所述點擊率預(yù)估模型,建立每個第一用戶對所述對象的實際點擊值與預(yù)估點擊值的誤差函數(shù),基于所述誤差函數(shù)建立誤差損失函數(shù)。
步驟104:基于所述誤差損失函數(shù)以及預(yù)先統(tǒng)計的每個第一用戶對所述對象的實際點擊值,求解對所述對象設(shè)定的評價指標的數(shù)值。
本申請一實施例中,基于所述誤差損失函數(shù)以及預(yù)先統(tǒng)計的每個用戶對所述對象的實際點擊值與預(yù)估點擊值之差,求解對所述對象設(shè)定的評價指標的數(shù)值可以包括:
設(shè)置所述評價指標的初始值;
以所述誤差損失函數(shù)的損失最小為目標對所述誤差損失函數(shù)進行迭代計算;
當所述誤差損失函數(shù)的變化率小于預(yù)設(shè)閾值時停止所述迭代計算并以此時所述評價指標的取值作為所述評價指標的數(shù)值。
本申請實施例中,是根據(jù)對象i被推薦過的多個用戶u的真實點擊值和預(yù)估點擊值來確定各個特征對該對象的評價指標的。
本申請一實施例中,若點擊率預(yù)估模型如式1所示,那么對應(yīng)的誤差函數(shù)為:
誤差損失函數(shù)為:
其中,u表示用戶;i表示對象;f表示用戶的特征;ctru,i表示用戶u對對象i的點擊率預(yù)估值,fu表示用戶u的特征集合;yu,i表示用戶u對對象i的實際點擊值;rf,i表示特征f對對象i預(yù)估點擊值;af,i表示特征f對對象i預(yù)估點擊值的可靠程度,u表示對象i被推薦過的用戶的集合。
若用戶點u擊了對象i,則yu,i=1,否則yu,i=0。
根據(jù)式3可以知道,本申請實施例是基于對對象i的多個被推薦過的用戶的特征和實際點擊值的分析來確定每個特征f的對對象i的評價指標af,i和rf,i。
本申請實施例中,可以采用梯度下降法,基于對象i被推薦過的用戶的實際點擊值,以誤差l(r,a)最小為目標,求解各個特征f對對象i的評價指標。該求解方法可以包括如下步驟:
第1步:隨機給定一組在0-1之間小數(shù)組成的向量r,a,設(shè)為r(0),a(0),初始化迭代步數(shù)k=0;
第2步:迭代計算
其中θ為迭代的步長,取0.01
第3步:判斷所述誤差損失函數(shù)是否收斂
δl(r(k+1),a(k+1))=|l(r(k+1),a(k+1))-l(r(k),a(k))|
如果|δl(r(k+1),a(k+1))-δl(r(k),a(k))|<α,那么就返回r(k+1),a(k+1)即為模型的參數(shù),否則回到步驟2繼續(xù)計算,其中α是一個很小的值,可以取α=0.01·θ.
步驟105:根據(jù)求解得到的對所述對象的評價指標的數(shù)值確定所述點擊率預(yù)估模型。
通過上述步驟計算確定了各個特征f對對象i的評價指標af,i和rf,i,從而對象i的點擊率預(yù)估模型就確定了。
步驟106:基于第二用戶的特征,利用所述點擊率預(yù)估模型得到所述第二用戶對所述對象的點擊率的預(yù)估值,所述第二用戶為所述對象未被推薦過的用戶。
對于一個未被推薦過對象i的用戶b,通過采集該用戶的特征,根據(jù)采集的特征確定出對應(yīng)的評價指標,即可根據(jù)該點擊率預(yù)估模型計算出用戶b對對象i的點擊率預(yù)估值。
本申請實施例提供的建立點擊率預(yù)估模型的方法,以對象i被推薦過的用戶的點擊行為為基礎(chǔ),采集每個用戶的特征,以每個特征對對象i的評價指標為參數(shù)建立點擊率預(yù)估模型。當各個特征對對象i的評價指標確定后,對于一個未被推薦過該對象i的用戶,只要確定了該用戶的特征集合,即可根據(jù)該點擊率預(yù)估模型預(yù)估該用戶對對象i的點擊率。結(jié)合該方法,可以將對象i推薦給預(yù)估點擊率較高的用戶,該方法提高了對用戶推送對象的準確度,在實際應(yīng)用中,減少了無效推薦,提高了網(wǎng)絡(luò)利用率,能夠?qū)崿F(xiàn)為不同用戶提供個性化的對象推薦。
參見圖2,在本申請的一個實施例中,所述對象為網(wǎng)絡(luò)廣告c,本申請所提供的建立點擊率預(yù)估模型的方法包括步驟201至206。
步驟201:采集多個該網(wǎng)絡(luò)廣告被推薦過的用戶的特征,建立刻畫所述網(wǎng)絡(luò)廣告被推薦過的用戶的特征集合。
本申請實施例中,通過采集所述網(wǎng)絡(luò)廣告c被推薦過的用戶的特征來建立所述網(wǎng)絡(luò)廣告c的點擊率預(yù)估模型。
本申請實施例中,可以從多個維度來采集刻畫所述網(wǎng)絡(luò)廣告被推薦過的用戶的特征集合。
維度1:通過用戶的對網(wǎng)絡(luò)廣告的偏好刻畫,例如喜歡購物的用戶刻畫“購物迷”。
維度2:通過用戶的地域?qū)傩钥坍?,例如北京、天津、上?!?/p>
維度3:通過用戶自然屬性刻畫,例如年齡、性別等。
維度4:通過用戶的社會屬性刻畫,例如文化水平、職業(yè)、地域等。
實際應(yīng)用中,根據(jù)對象的不同,所選擇的維度也可以不同。本申請對此不作限定。
對每類特征,都可以進一步劃分為不同的特征集合。
步驟202:為每個特征集合的特征設(shè)定對所述網(wǎng)絡(luò)廣告的評價指標,基于所述評價指標構(gòu)建所述點擊率預(yù)估模型。
本申請實施例中,對所述網(wǎng)絡(luò)廣告的評價指標可以包括:所述每個特征集的特征對所述網(wǎng)絡(luò)廣告的預(yù)估點擊值r和所述每個特征集合的特征對所述網(wǎng)絡(luò)廣告的預(yù)估點擊值的可靠程度a;其中,r∈[0,1],a∈[0,1]。
需要說明的是,每個特征集合的特征對所述網(wǎng)絡(luò)廣告的評價指標的值相同。
以年齡為例,若年齡這個類型的特征進一步包括“兒童”、“少年”、“青年”、“中年”、“老年”5個特征集合,那么每個特征集合中的特征對同一個網(wǎng)絡(luò)廣告具有相同的評價指標。例如,30歲和32歲的用戶均屬于“青年”這個特征集合,那么30歲的用戶和32歲的用戶的年齡這個特征對同一個網(wǎng)絡(luò)廣告的評價指標值相同。
本申請實施例中建立的該網(wǎng)絡(luò)廣告的點擊率預(yù)估模型如式4所示。
其中,c表示所述網(wǎng)絡(luò)廣告,u表示用戶,f表示用戶的特征,ctru,c,表示用戶u對網(wǎng)絡(luò)廣告c點擊率預(yù)估值,fu表示用戶u的特征集合,rf,c表示特征f對網(wǎng)絡(luò)廣告c預(yù)估點擊值;af,c表示特征f對網(wǎng)絡(luò)廣告c預(yù)估點擊值的可靠程度。
步驟203:根據(jù)所述網(wǎng)絡(luò)廣告點擊率預(yù)估模型,建立每個所述網(wǎng)絡(luò)廣告推薦過的用戶對所述網(wǎng)絡(luò)廣告的實際點擊值與預(yù)估點擊值的誤差函數(shù),基于所述誤差函數(shù)建立誤差損失函數(shù)。
本申請實施例中的誤差函數(shù)如式5所示:
其中,yu,c表示用戶u對網(wǎng)絡(luò)廣告c的實際點擊值。若用戶u點擊了該網(wǎng)絡(luò)廣告c,則yu,c=1,否則yu,c=0。
步驟204:基于所述誤差損失函數(shù)以及預(yù)先統(tǒng)計的每個用戶對所述網(wǎng)絡(luò)廣告的實際點擊值與預(yù)估點擊值之差,求解對所述對象設(shè)定的評價指標的數(shù)值。
所述誤差損失函數(shù)如式6所示:
其中,l(r,a)表示誤差損失函數(shù),u表示所述網(wǎng)絡(luò)廣告c被推薦過的用戶u的集合。
從式6可以看出,本申請實施例是結(jié)合多個所述網(wǎng)絡(luò)廣告c被推薦過的用戶對所述網(wǎng)絡(luò)廣告c的實際點擊值以及每個用戶的特征f來確定每個特征對所述網(wǎng)絡(luò)廣告c的評價指標的af,c和rf,c的。
可以采用梯度下降法,基于所述網(wǎng)絡(luò)廣告c被推薦過的用戶u的實際點擊值yu,c,以誤差l(r,a)最小為目標,求解用戶集合u中各個用戶u的每個特征f對所述網(wǎng)絡(luò)廣告c的評價指標。該求解方法可以包括如下步驟:
第1步:隨機給定一組在0-1之間小數(shù)組成的向量r,a,設(shè)為r(0),a(0),初始化迭代步數(shù)k=0;
第2步:迭代計算
其中θ為迭代的步長,取0.01
第3步:判斷所述誤差損失函數(shù)是否收斂
δl(r(k+1),a(k+1))=|l(r(k+1),a(k+1))-l(r(k),a(k))|
如果|δl(r(k+1),a(k+1))-δl(r(k),a(k))|<α,那么就返回r(k+1),a(k+1)即為模型的參數(shù),否則回到步驟2繼續(xù)計算,其中α是一個很小的值,可以取α=0.01·θ。
步驟205:根據(jù)求解得到的對所述網(wǎng)絡(luò)廣告的評價指標的數(shù)值確定所述網(wǎng)絡(luò)廣告的點擊率預(yù)估模型。
通過上述步驟計算確定了各個特征f對所述網(wǎng)絡(luò)廣告c的評價指標af,c和rf,c,從而所述網(wǎng)絡(luò)廣告的點擊率預(yù)估模型就確定了。
步驟206:將所述網(wǎng)絡(luò)廣告未被推薦過的用戶的特征對應(yīng)的評價指標輸入所述點擊率預(yù)估模型得到所述用戶對所述網(wǎng)絡(luò)廣告的點擊率的預(yù)估值。
圖3是對該網(wǎng)絡(luò)廣告點擊率預(yù)估模型的應(yīng)用場景示意圖。對于一個未被推薦過所述網(wǎng)絡(luò)廣告c的用戶b,通過采集該用戶的n個特征,每個特征對應(yīng)的評價指標分別為a1和r1、a2和r2、a3和r3……an和rn,所述每個特征對應(yīng)的評價指標已經(jīng)通過上述建模過程確定。則用戶b對所述網(wǎng)絡(luò)廣告的點擊率預(yù)估值ctrb,c=(a1*r1+a2*r2+a3*r3+……+an*rn)/(a1+a2+a3+……+an)。
通過基于該網(wǎng)絡(luò)廣告被推薦過的用戶的特征和實際點擊值建立該網(wǎng)絡(luò)廣告的點擊率預(yù)估模型,并利用該點擊率預(yù)估模型計算出該網(wǎng)絡(luò)廣告未被推薦過的用戶的點擊率預(yù)估值,然后從中選出點擊率預(yù)估值高的用戶并向這些用戶發(fā)送該網(wǎng)絡(luò)廣告,則能極大地提高所述網(wǎng)絡(luò)廣告投放的準確度,避免低點擊率的廣告的投放,節(jié)約了廣告投放成本,提高了該網(wǎng)絡(luò)廣告的經(jīng)濟效益。
圖4是本申請?zhí)峁┑狞c擊率預(yù)估模型在文章點擊率預(yù)估方面的應(yīng)用,該方法包括步驟401至406。
步驟401:采集所述文章被推薦過的多個用戶的特征,建立刻畫多個用戶的特征集合。
本申請實施例中,通過采集所述文章被推薦過的用戶的特征來建立所述文章的點擊率預(yù)估模型。
用戶的特征集合的確定方式與之前的實施例相似,此處不再贅述。
步驟402:為每個特征集合的特征設(shè)定對所述文章的評價指標,基于所述評價指標構(gòu)建所述文章的點擊率預(yù)估模型。
本申請實施例中,對所述文章的評價指標可以包括:所述每個特征集的特征對所述文章的預(yù)估點擊值r和所述每個特征集合的特征對所述文章的預(yù)估點擊值的可靠程度a;其中,r∈[0,1],a∈[0,1]。
需要說明的是,每個特征集合的特征對所述文章的評價指標的值相同。
本申請實施例中建立的該文章的點擊率預(yù)估模型如式7所示。
其中,d表示所述文章,u表示用戶,f表示特征;ctru,d表示用戶u對文章d的點擊率預(yù)估值,fu表示用戶u的特征集合,rf,d表示特征f對文章d的預(yù)估點擊值;af,d表示特征f對文章d預(yù)估點擊值的可靠程度。
步驟403:根據(jù)所述文章的點擊率預(yù)估模型,建立每個用戶對所述文章的實際點擊值與預(yù)估點擊值的誤差函數(shù),基于所述誤差函數(shù)建立誤差損失函數(shù)。
本申請實施例中的誤差函數(shù)如式8所示:
其中,yu,d表示用戶u對文章d的實際點擊值,若用戶點u點擊了該文章d,則yu,d=1,否則yu,d=0。
步驟404:基于所述誤差損失函數(shù)以及預(yù)先統(tǒng)計的每個用戶對所述文章的實際點擊值與預(yù)估點擊值之差,求解對所述對象設(shè)定的評價指標的數(shù)值。
所述誤差損失函數(shù)如式9所示。
其中,l(r,a)表示誤差損失,u表示所述文章d被推薦過的用戶u的集合。
從式9可以看出,本申請實施例是結(jié)合多個所述文章d被推薦過的用戶對所述文章d的實際點擊值以及每個用戶的特征來確定每個特征對所述文章d的評價指標的af,d和rf,d的。
可以采用梯度下降法,基于所述文章d被推薦過的用戶u的實際點擊值yu,d,以誤差l(r,a)最小為目標,求解特征集合中的每個特征f對所述文章d的評價指標。該求解方法可以包括如下步驟:
第1步:隨機給定一組在0-1之間小數(shù)組成的向量r,a,設(shè)為r(0),a(0),初始化迭代步數(shù)k=0;
第2步:迭代計算
其中θ為迭代的步長,取0.01
第3步:判斷所述誤差損失函數(shù)是否收斂
δl(r(k+1),a(k+1))=|l(r(k+1),a(k+1))-l(r(k),a(k))|
如果|δl(r(k+1),a(k+1))-δl(r(k),a(k))|<α,那么就返回r(k+1),a(k+1)即為模型的參數(shù),否則回到步驟2繼續(xù)計算,其中α是一個很小的值,可以取α=0.01·θ。
步驟405:根據(jù)求解得到的對所述文章的評價指標的數(shù)值確定所述文章的點擊率預(yù)估模型。
通過上述步驟計算確定了各個特征f對所述文章d的評價指標af,d和rf,d,從而所述文章的點擊率預(yù)估模型就確定了。
步驟406:將所述文章未被推薦過的用戶的特征對應(yīng)的評價指標輸入所述點擊率預(yù)估模型得到所述用戶對所述文章的點擊率的預(yù)估值。
圖5是對該文章點擊率預(yù)估模型的應(yīng)用場景示意圖。對于一個未被推薦過所述文章d的用戶m,通過采集該用戶的4個特征(以4個特征為例),每個特征對應(yīng)的評價指標分別為a1和r1、a2和r2、a3和r3以及a4和r4,所述每個特征對應(yīng)的評價指標已經(jīng)通過上述建模過程確定。則用戶m對所述文章d的點擊率預(yù)估值ctrm,d=(a1*r1+a2*r2+a3*r3+a4*r4)/(a1+a2+a3+a4)。
通過基于該文章d被推薦過的用戶的特征和實際點擊值建立該文章d的點擊率預(yù)估模型,并利用該點擊率預(yù)估模型計算出該文章d未被推薦過的用戶的點擊率預(yù)估值,然后從中選出點擊率預(yù)估值高的用戶并向這些用戶發(fā)送該文章d,則能極大地提高所述文章d推薦的準確度,極大地提高文章的閱讀量。
圖6為本申請實施例提供的一種建立點擊率預(yù)估模型的裝置的結(jié)構(gòu)示意圖。由于裝置實施例基本相似于方法實施例,相關(guān)之處參見方法實施例的部分說明即可。下述描述的裝置實施例僅僅是示意性的。
本申請?zhí)峁┑慕Ⅻc擊率預(yù)估模型的裝置包括:
采集模塊601,用于采集多個第一用戶的特征,所述第一用戶為對象被推薦過的用戶;
第一建模模塊602,用于為所述多個第一用戶中的每個用戶的每個特征設(shè)定對所述對象的評價指標,基于所述評價指標構(gòu)建所述點擊率預(yù)估模型;
第二建模模塊603,用于根據(jù)所述點擊率預(yù)估模型,建立每個第一用戶對所述對象的實際點擊值與預(yù)估點擊值的誤差函數(shù),基于所述誤差函數(shù)建立誤差損失函數(shù);
求解模塊604,用于基于所述誤差損失函數(shù)以及預(yù)先統(tǒng)計的每個第一用戶對所述對象的實際點擊值,求解對所述對象設(shè)定的評價指標的數(shù)值;
第三建模模塊605,用于根據(jù)求解得到的對所述對象的評價指標的數(shù)值確定所述點擊率預(yù)估模型。
本申請一實施例中,所述裝置還包括:
計算模塊606,用于基于第二用戶的特征,利用所述點擊率預(yù)估模型得到所述第二用戶對所述對象的點擊率的預(yù)估值,所述第二用戶為所述對象未被推薦過的用戶。
本申請一實施例中,所述采集模塊601,還用于將特征進行歸類,將每類特征劃分為多個特征集合;
所述第一建模模塊602,還用于為每個特征集合內(nèi)的特征對所述對象的相同評價指標賦相同的數(shù)值。
本申請實施例中,所述評價指標包括:每個特征對所述對象的評價指標包括:所述每個特征對所述對象的預(yù)估點擊值r和所述每個特征對所述對象的預(yù)估點擊值的可靠程度a,其中,r∈[0,1],a∈[0,1]。
本申請一實施例中,所述求解模塊604包括:
第一求解子模塊,用于設(shè)置所述評價指標的初始值;
第二求解子模塊,用于以所述誤差損失函數(shù)的損失最小為目標對所述損失函數(shù)進行迭代計算;
第三求解子模塊,用于當所述誤差損失函數(shù)的變化率小于預(yù)設(shè)閾值時停止所述迭代計算并以此時所述評價指標的取值作為所述評價指標的數(shù)值。
本申請一實施例中,所述點擊率預(yù)估模型為:
所述誤差函數(shù)為:
所述誤差損失函數(shù)為:
其中,i表示對象,u表示用戶,u表示所述第一用戶的集合,ctru,i表示用戶u對對象i的點擊率預(yù)估值,f表示用戶u的特征,fu表示用戶u的特征集合;yu,i表示用戶u對對象i的實際點擊值;rf,i表示特征f對對象i的預(yù)估點擊值;af,i表示特征f對對象i的預(yù)估點擊值的可靠程度。
本申請實施例提供的一種建立點擊率預(yù)估模型的裝置,以對象i被推薦過的用戶的點擊行為為基礎(chǔ),采集每個用戶的特征,以每個特征對對象i的評價指標為參數(shù)建立點擊率預(yù)估模型。當各個特征對對象i的評價指標確定后,對于一個未被推薦過該對象i的用戶,只要確定了該用戶的特征集合,即可根據(jù)該點擊率預(yù)估模型預(yù)估該用戶對對象i的點擊率。通過該裝置,可以將對象i推薦給預(yù)估點擊率較高的用戶,該方法提高了對用戶推送對象的準確度,在實際應(yīng)用中,減少了無效推薦,提高了網(wǎng)絡(luò)利用率,能夠?qū)崿F(xiàn)為不同用戶提供個性化的對象推薦。
本申請還提供了一種終端,包括:處理器、以及存儲有計算機指令的存儲器;所述處理器讀取所述計算機指令,并執(zhí)行如上所述的一種建立點擊率預(yù)估模型方法。
本申請還提供了一種存儲介質(zhì),存儲有計算機指令,所述計算機指令被執(zhí)行時實現(xiàn)如上所述的一種建立點擊率預(yù)估模型方法。
需要說明的是,所述建立點擊率預(yù)估模型裝置如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中?;谶@樣的理解,本申請實現(xiàn)上述實施例方法中的全部或部分流程,也可以通過計算機程序來指令相關(guān)的硬件來完成,所述的計算機程序可存儲于一計算機可讀存儲介質(zhì)中,該計算機程序在被計算機執(zhí)行時,可實現(xiàn)上述各個方法實施例的步驟。其中,所述計算機程序包括計算機程序代碼,所述計算機程序代碼可以為源代碼形式、對象代碼形式、可執(zhí)行文件或某些中間形式等。所述計算機可讀介質(zhì)可以包括:能夠攜帶所述計算機程序代碼的任何實體或裝置、記錄介質(zhì)、u盤、移動硬盤、磁碟、光盤、計算機存儲器、只讀存儲器(rom,read-onlymemory)、隨機存取存儲器(ram,randomaccessmemory)、電載波信號、電信信號以及軟件分發(fā)介質(zhì)等。需要說明的是,所述計算機可讀介質(zhì)包含的內(nèi)容可以根據(jù)司法管轄區(qū)內(nèi)立法和專利實踐的要求進行適當?shù)脑鰷p,例如在某些司法管轄區(qū),根據(jù)立法和專利實踐,計算機可讀介質(zhì)不包括電載波信號和電信信號。
需要說明的是,對于前述的各方法實施例,為了簡便描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本申請并不受所描述的動作順序的限制,因為依據(jù)本申請,某些步驟可以采用其它順序或者同時進行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所涉及的動作和模塊并不一定都是本申請所必須的。
在上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有詳述的部分,可以參見其它實施例的相關(guān)描述。
以上公開的本申請優(yōu)選實施例只是用于幫助闡述本申請??蛇x實施例并沒有詳盡敘述所有的細節(jié),也不限制該申請僅為所述的具體實施方式。顯然,根據(jù)本說明書的內(nèi)容,可作很多的修改和變化。本說明書選取并具體描述這些實施例,是為了更好地解釋本申請的原理和實際應(yīng)用,從而使所屬技術(shù)領(lǐng)域技術(shù)人員能很好地理解和利用本申請。本申請僅受權(quán)利要求書及其全部范圍和等效物的限制。
上面結(jié)合附圖對本申請優(yōu)選的具體實施方式和實施例作了詳細說明,但是申請并不限于上述實施方式和實施例,在本領(lǐng)域技術(shù)人員所具備的知識范圍內(nèi),還可以在不脫離本申請構(gòu)思的前提下做出各種變化。