推薦廣告的方法及廣告推薦服務(wù)器的制造方法
【專利摘要】本發(fā)明實(shí)施例提供推薦廣告的方法及廣告推薦服務(wù)器。該方法包括:獲取網(wǎng)頁訪問信息和廣告點(diǎn)擊信息,網(wǎng)頁訪問信息用于指示m個(gè)用戶所訪問的n個(gè)網(wǎng)頁,廣告點(diǎn)擊信息用于指示m個(gè)用戶在n個(gè)網(wǎng)頁上點(diǎn)擊的x個(gè)廣告;根據(jù)網(wǎng)頁訪問信息和廣告點(diǎn)擊信息,預(yù)測(cè)m個(gè)用戶中第i用戶訪問第j網(wǎng)頁時(shí)x個(gè)廣告的點(diǎn)擊概率;確定x個(gè)廣告分別對(duì)應(yīng)的新穎性因子;根據(jù)x個(gè)廣告的點(diǎn)擊概率和x個(gè)廣告分別對(duì)應(yīng)的新穎性因子在x個(gè)廣告中確定待向第i用戶推薦的p個(gè)廣告。本發(fā)明實(shí)施例能夠提高廣告的點(diǎn)擊率并提升用戶體驗(yàn)。
【專利說明】推薦廣告的方法及廣告推薦服務(wù)器
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及信息處理領(lǐng)域,并且具體地,涉及推薦廣告的方法及廣告推薦服務(wù)器。
【背景技術(shù)】
[0002] 互聯(lián)網(wǎng)在線廣告已成為除電視和報(bào)紙之外的主要廣告投放方式。在線廣告的收益 與廣告的點(diǎn)擊率密切相關(guān),增加廣告點(diǎn)擊率是提高廣告收益的有效途徑之一。為了提高廣 告點(diǎn)擊率,推薦廣告之前需要預(yù)測(cè)用戶點(diǎn)擊廣告的概率(以下稱為廣告的點(diǎn)擊概率)。
[0003] 目前,主要通過兩種算法預(yù)測(cè)廣告的點(diǎn)擊概率來向用戶推薦廣告。一種是基于內(nèi) 容過濾(Content-based Filtering, CBF)的推薦算法,另一種是基于用戶或項(xiàng)目的協(xié)同過 濾(Collaborative Filtering,CF)的推薦算法。
[0004] 具體而言,對(duì)于基于CBF的算法,主要是利用信息檢索或信息過濾技術(shù),根據(jù)廣告 和網(wǎng)頁內(nèi)容的相關(guān)性向目標(biāo)用戶推薦廣告。即,與網(wǎng)頁內(nèi)容相關(guān)性越高的廣告,認(rèn)為其點(diǎn)擊 概率越高。因此,在相同的網(wǎng)頁上往往會(huì)向用戶推薦相同的廣告。然而,這種算法未考慮用 戶的興趣,導(dǎo)致廣告的點(diǎn)擊概率預(yù)測(cè)的準(zhǔn)確性并不高,因此難以保證廣告的點(diǎn)擊率。
[0005] 對(duì)于基于用戶的CF算法,主要根據(jù)用戶的歷史廣告點(diǎn)擊信息計(jì)算用戶之間的相 似性,然后根據(jù)與目標(biāo)用戶相似性較高的用戶對(duì)廣告的點(diǎn)擊情況,預(yù)測(cè)目標(biāo)用戶對(duì)廣告的 喜好程度,然后根據(jù)喜好程度對(duì)目標(biāo)用戶進(jìn)行推薦。對(duì)于基于項(xiàng)目的CF算法,主要通過計(jì) 算廣告之間的相似性,選擇目標(biāo)廣告的最接近的廣告集合,根據(jù)當(dāng)前用戶對(duì)最接近的廣告 的喜好程度來決定是否推薦目標(biāo)廣告。這兩種CF算法均是利用用戶的喜好程度預(yù)測(cè)廣告 的點(diǎn)擊概率??梢姡啾然贑BF的算法而言,雖然CF算法在一定程度上提高了廣告的點(diǎn)擊 概率預(yù)測(cè)的準(zhǔn)確性,能夠提高廣告的點(diǎn)擊率,但是由于用戶經(jīng)常訪問內(nèi)容相似的網(wǎng)頁,采用 CF算法推薦給用戶的廣告往往和此用戶熟悉的廣告很相似,無法發(fā)現(xiàn)用戶并不熟悉但潛在 感興趣的廣告,導(dǎo)致廣告的點(diǎn)擊率不高,用戶體驗(yàn)差。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明實(shí)施例提供推薦廣告的方法及廣告推薦服務(wù)器,能夠提高廣告的點(diǎn)擊率, 進(jìn)而提升用戶體驗(yàn)。
[0007] 第一方面,提供了一種推薦廣告的方法,包括:從用戶訪問互聯(lián)網(wǎng)日志中獲取網(wǎng)頁 訪問信息和廣告點(diǎn)擊信息,所述網(wǎng)頁訪問信息用于指示m個(gè)用戶所訪問的η個(gè)網(wǎng)頁,所述廣 告點(diǎn)擊信息用于指示m個(gè)用戶在η個(gè)網(wǎng)頁上點(diǎn)擊的X個(gè)廣告,n、m和X均為大于1的正整 數(shù);根據(jù)所述網(wǎng)頁訪問信息和所述廣告點(diǎn)擊信息,預(yù)測(cè)所述m個(gè)用戶中第i用戶訪問第j網(wǎng) 頁時(shí)所述X個(gè)廣告的點(diǎn)擊概率,其中i為取值從1至m的正整數(shù),j為取值從1至η的正整 數(shù);確定所述X個(gè)廣告分別對(duì)應(yīng)的新穎性因子,所述X個(gè)廣告中每個(gè)廣告對(duì)應(yīng)的新穎性因子 用于表示所述第i用戶對(duì)所述每個(gè)廣告的知曉程度;根據(jù)所述X個(gè)廣告的點(diǎn)擊概率和所述 X個(gè)廣告分別對(duì)應(yīng)的新穎性因子,在所述X個(gè)廣告中確定待向所述第i用戶推薦的P個(gè)廣 告,其中,所述第i用戶對(duì)所述P個(gè)廣告的知曉程度低于所述第i用戶對(duì)所述X個(gè)廣告中除 所述P個(gè)廣告之外的廣告的知曉程度,所述P個(gè)廣告的點(diǎn)擊概率高于所述X個(gè)廣告中除所 述P個(gè)廣告之外的廣告的點(diǎn)擊概率,P為正整數(shù)且P彡X。
[0008] 結(jié)合第一方面,在第一種可能的實(shí)現(xiàn)方式中,所述確定所述X個(gè)廣告分別對(duì)應(yīng)的 新穎性因子,包括:根據(jù)歷史推薦信息,確定所述X個(gè)廣告分別對(duì)應(yīng)的新穎性因子,所述歷 史推薦信息用于指示向所述第i用戶分別推薦所述X個(gè)廣告的歷史記錄。
[0009] 結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中,所述根據(jù) 歷史推薦信息,確定所述X個(gè)廣告分別對(duì)應(yīng)的新穎性因子,包括:對(duì)于所述X個(gè)廣告中的第 k廣告,如果所述歷史推薦信息指示未向所述第i用戶推薦過所述第k廣告,則確定所述第 k廣告對(duì)應(yīng)的新穎性因子為第一值;如果所述歷史推薦信息指示過去向所述第i用戶推薦 過所述第k廣告,則確定所述第k廣告對(duì)應(yīng)的新穎性因子為第二值;其中,所述第一值大于 所述第二值,k為取值從1至X的正整數(shù)。
[0010] 結(jié)合第一方面的第二種可能的實(shí)現(xiàn)方式,在第三種可能的實(shí)現(xiàn)方式中,所述確定 所述第k廣告對(duì)應(yīng)的新穎性因子為第二值,包括:確定q天前向所述第i用戶推薦過所述第 k廣告,q為正整數(shù);確定所述q天對(duì)應(yīng)的艾賓浩斯遺忘曲線值;確定所述第k廣告對(duì)應(yīng)的 新穎性因子為所述第一值與所述艾賓浩斯遺忘曲線值之間的差值。
[0011] 結(jié)合第一方面,在第四種可能的實(shí)現(xiàn)方式中,所述確定所述X個(gè)廣告分別對(duì)應(yīng)的 新穎性因子,包括:對(duì)于所述X個(gè)廣告中的第k廣告,確定所述第k廣告分別與所述X個(gè)廣 告中除所述第k廣告之外的其它廣告之間的相似度;根據(jù)所述第k廣告分別與所述X個(gè)廣 告中除所述第k廣告之外的其它廣告之間的相似度,確定在所述X個(gè)廣告中所述第k廣告 對(duì)應(yīng)的相似性排名和所述第k廣告對(duì)應(yīng)的不相似性排名;對(duì)所述第k廣告對(duì)應(yīng)的相似性排 名和所述第k廣告對(duì)應(yīng)的不相似性排名進(jìn)行加權(quán),以得到所述第k廣告對(duì)應(yīng)的新穎性因子; 其中,k為取值從1至X的正整數(shù)。
[0012] 結(jié)合第一方面,在第五種可能的實(shí)現(xiàn)方式中,所述確定所述X個(gè)廣告分別對(duì)應(yīng)的 新穎性因子,包括:對(duì)于所述X個(gè)廣告中的第k廣告,確定所述第k廣告分別與所述X個(gè)廣 告中除所述第k廣告之外的其它廣告之間的多樣性距離;根據(jù)所述第k廣告分別與所述X 個(gè)廣告中除所述第k廣告之外的其它廣告之間的多樣性距離,確定所述第k廣告對(duì)應(yīng)的新 穎性因子;其中,k為取值從1至X的正整數(shù)。
[0013] 結(jié)合第一方面或上述任一實(shí)現(xiàn)方式,在第六種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述X 個(gè)廣告分別對(duì)應(yīng)的點(diǎn)擊概率和所述X個(gè)廣告分別對(duì)應(yīng)的新穎性因子,在所述X個(gè)廣告中確 定待向所述第i用戶推薦的P個(gè)廣告,包括:對(duì)所述X個(gè)廣告中每個(gè)廣告對(duì)應(yīng)的點(diǎn)擊概率和 所述每個(gè)廣告對(duì)應(yīng)的新穎性因子進(jìn)行加權(quán),確定所述X個(gè)廣告分別對(duì)應(yīng)的評(píng)分;按照所述X 個(gè)廣告對(duì)應(yīng)的評(píng)分從大到小的順序,對(duì)所述X個(gè)廣告進(jìn)行排序,得到排序后的X個(gè)廣告;將 所述排序后的X個(gè)廣告中的前P個(gè)廣告確定為待向所述第i用戶推薦的P個(gè)廣告。
[0014] 結(jié)合第一方面或第一種可能的實(shí)現(xiàn)方式至第五種可能的實(shí)現(xiàn)方式中任一方式,在 第七種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述X個(gè)廣告分別對(duì)應(yīng)的點(diǎn)擊概率和所述X個(gè)廣告分 別對(duì)應(yīng)的新穎性因子,在所述X個(gè)廣告中確定待向所述第i用戶推薦的P個(gè)廣告,包括:按 照點(diǎn)擊概率從大到小的順序,對(duì)所述X個(gè)廣告進(jìn)行排序,得到排序后的X個(gè)廣告;按照新穎 性因子從大到小的順序,對(duì)所述排序后的X個(gè)廣告中的前q個(gè)廣告進(jìn)行排序,得到重新排序 后的q個(gè)廣告,其中q為正整數(shù)且q大于P ;將所述重新排序后的q個(gè)廣告中的前P個(gè)廣告 確定為待向所述第i用戶推薦的P個(gè)廣告。
[0015] 結(jié)合第一方面或上述任一實(shí)現(xiàn)方式,在第八種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述 網(wǎng)頁訪問信息和所述廣告點(diǎn)擊信息,預(yù)測(cè)所述m個(gè)用戶中第i用戶訪問第j網(wǎng)頁時(shí)所述X 個(gè)廣告的點(diǎn)擊概率,包括:根據(jù)所述網(wǎng)頁訪問信息和所述廣告點(diǎn)擊信息,生成用戶-網(wǎng)頁訪 問矩陣、用戶-廣告點(diǎn)擊矩陣和廣告-網(wǎng)頁關(guān)聯(lián)度矩陣,其中,所述用戶-網(wǎng)頁訪問矩陣的 第i行第j列對(duì)象表示所述第i用戶對(duì)所述第j網(wǎng)頁的訪問記錄,所述用戶-廣告點(diǎn)擊矩 陣的第i行第k列對(duì)象表示所述第i用戶對(duì)第k廣告的點(diǎn)擊記錄,所述廣告-網(wǎng)頁關(guān)聯(lián)度 矩陣的第j行第k列對(duì)象表示所述第j網(wǎng)頁與所述第k廣告之間的關(guān)聯(lián)度,k為取值從1至 X的正整數(shù);對(duì)所述用戶-網(wǎng)頁訪問矩陣、所述用戶-廣告點(diǎn)擊矩陣和所述廣告-網(wǎng)頁關(guān)聯(lián) 度矩陣進(jìn)行聯(lián)合概率矩陣分解,得到所述第i用戶的用戶隱含特征向量、所述第j網(wǎng)頁的網(wǎng) 頁隱含特征向量和所述第k廣告的廣告隱含特征向量;根據(jù)所述第i用戶的用戶隱含特征 向量、所述第j網(wǎng)頁的網(wǎng)頁隱含特征向量和所述第k廣告的廣告隱含特征向量,確定所述第 i用戶訪問所述第j網(wǎng)頁時(shí)所述第k廣告的點(diǎn)擊概率。
[0016] 第二方面,提供了一種廣告推薦服務(wù)器,包括:獲取單元,用于從用戶訪問互聯(lián)網(wǎng) 日志中獲取網(wǎng)頁訪問信息和廣告點(diǎn)擊信息,所述網(wǎng)頁訪問信息用于指示m個(gè)用戶所訪問的 η個(gè)網(wǎng)頁,所述廣告點(diǎn)擊信息用于指示m個(gè)用戶在η個(gè)網(wǎng)頁上點(diǎn)擊的X個(gè)廣告,n、m和X均 為大于1的正整數(shù);預(yù)測(cè)單元,用于根據(jù)所述網(wǎng)頁訪問信息和所述廣告點(diǎn)擊信息,預(yù)測(cè)所述 m個(gè)用戶中第i用戶訪問第j網(wǎng)頁時(shí)所述X個(gè)廣告的點(diǎn)擊概率,其中i為取值從1至m的正 整數(shù),j為取值從1至η的正整數(shù);確定單元,用于確定所述X個(gè)廣告分別對(duì)應(yīng)的新穎性因 子,所述X個(gè)廣告中每個(gè)廣告對(duì)應(yīng)的新穎性因子用于表示所述第i用戶對(duì)所述每個(gè)廣告的 知曉程度;選擇單元,用于根據(jù)所述X個(gè)廣告的點(diǎn)擊概率和所述X個(gè)廣告分別對(duì)應(yīng)的新穎性 因子,在所述X個(gè)廣告中確定待向所述第i用戶推薦的P個(gè)廣告,其中,所述第i用戶對(duì)所 述P個(gè)廣告的知曉程度低于所述第i用戶對(duì)所述X個(gè)廣告中除所述P個(gè)廣告之外的廣告的 知曉程度,所述P個(gè)廣告的點(diǎn)擊概率高于所述X個(gè)廣告中除所述P個(gè)廣告之外的廣告的點(diǎn) 擊概率,P為正整數(shù)且Ρ<χ。
[0017] 結(jié)合第二方面,在第一種可能的實(shí)現(xiàn)方式中,所述確定單元,具體用于:根據(jù)歷史 推薦信息,確定所述X個(gè)廣告分別對(duì)應(yīng)的新穎性因子,所述歷史推薦信息用于指示向所述 第i用戶分別推薦所述X個(gè)廣告的歷史記錄。
[0018] 結(jié)合第二方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中,所述確定 單元,具體用于:對(duì)于所述X個(gè)廣告中的第k廣告,如果所述歷史推薦信息指示未向所述第 i用戶推薦過所述第k廣告,則確定所述第k廣告對(duì)應(yīng)的新穎性因子為第一值;如果所述歷 史推薦信息指示過去向所述第i用戶推薦過所述第k廣告,則確定所述第k廣告對(duì)應(yīng)的新 穎性因子為第二值;其中,所述第一值大于所述第二值,k為取值從1至X的正整數(shù)。
[0019] 結(jié)合第二方面的第二種可能的實(shí)現(xiàn)方式,在第三種可能的實(shí)現(xiàn)方式中,所述確定 單元,具體用于:確定q天前向所述第i用戶推薦過所述第k廣告,q為正整數(shù);確定所述q 天對(duì)應(yīng)的艾賓浩斯遺忘曲線值;確定所述第k廣告對(duì)應(yīng)的新穎性因子為所述第一值與所述 艾賓浩斯遺忘曲線值之間的差值。
[0020] 結(jié)合第二方面,在第四種可能的實(shí)現(xiàn)方式中,所述確定單元,具體用于:對(duì)于所述 X個(gè)廣告中的第k廣告,確定所述第k廣告分別與所述X個(gè)廣告中除所述第k廣告之外的 其它廣告之間的相似度;根據(jù)所述第k廣告分別與所述X個(gè)廣告中除所述第k廣告之外的 其它廣告之間的相似度,確定在所述X個(gè)廣告中所述第k廣告對(duì)應(yīng)的相似性排名和所述第 k廣告對(duì)應(yīng)的不相似性排名;對(duì)所述第k廣告對(duì)應(yīng)的相似性排名和所述第k廣告對(duì)應(yīng)的不 相似性排名進(jìn)行加權(quán),以得到所述第k廣告對(duì)應(yīng)的新穎性因子;其中,k為取值從1至X的 正整數(shù)。
[0021] 結(jié)合第二方面,在第五種可能的實(shí)現(xiàn)方式中,所述確定單元,具體用于:對(duì)于所述 X個(gè)廣告中的第k廣告,確定所述第k廣告分別與所述X個(gè)廣告中除所述第k廣告之外的 其它廣告之間的多樣性距離;根據(jù)所述第k廣告分別與所述X個(gè)廣告中除所述第k廣告之 外的其它廣告之間的多樣性距離,確定所述第k廣告對(duì)應(yīng)的新穎性因子;其中,k為取值從 1至X的正整數(shù)。
[0022] 結(jié)合第二方面或上述任一實(shí)現(xiàn)方式,在第六種可能的實(shí)現(xiàn)方式中,所述選擇單元, 具體用于:對(duì)所述X個(gè)廣告中每個(gè)廣告對(duì)應(yīng)的點(diǎn)擊概率和所述每個(gè)廣告對(duì)應(yīng)的新穎性因子 進(jìn)行加權(quán),確定所述X個(gè)廣告分別對(duì)應(yīng)的評(píng)分;按照所述X個(gè)廣告對(duì)應(yīng)的評(píng)分從大到小的順 序,對(duì)所述X個(gè)廣告進(jìn)行排序,得到排序后的X個(gè)廣告;將所述排序后的X個(gè)廣告中的前P 個(gè)廣告確定為待向所述第i用戶推薦的P個(gè)廣告。
[0023] 結(jié)合第二方面或第一種可能的實(shí)現(xiàn)方式至第五種可能的實(shí)現(xiàn)方式中任一方式,在 第七種可能的實(shí)現(xiàn)方式中,所述選擇單元,具體用于:按照點(diǎn)擊概率從大到小的順序,對(duì)所 述X個(gè)廣告進(jìn)行排序,得到排序后的X個(gè)廣告;按照新穎性因子從大到小的順序,對(duì)所述排 序后的X個(gè)廣告中的前q個(gè)廣告進(jìn)行排序,得到重新排序后的q個(gè)廣告,其中q為正整數(shù)且 q大于P ;將所述重新排序后的q個(gè)廣告中的前P個(gè)廣告確定為待向所述第i用戶推薦的P 個(gè)廣告。
[0024] 結(jié)合第二方面或上述任一實(shí)現(xiàn)方式,在第八種可能的實(shí)現(xiàn)方式中,所述預(yù)測(cè)單 元,具體用于:根據(jù)所述網(wǎng)頁訪問信息和所述廣告點(diǎn)擊信息,生成用戶-網(wǎng)頁訪問矩陣、用 戶-廣告點(diǎn)擊矩陣和廣告-網(wǎng)頁關(guān)聯(lián)度矩陣,其中,所述用戶-網(wǎng)頁訪問矩陣的第i行第j 列對(duì)象表示所述第i用戶對(duì)所述第j網(wǎng)頁的訪問記錄,所述用戶-廣告點(diǎn)擊矩陣的第i行 第k列對(duì)象表示所述第i用戶對(duì)第k廣告的點(diǎn)擊記錄,所述廣告-網(wǎng)頁關(guān)聯(lián)度矩陣的第j 行第k列對(duì)象表示所述第j網(wǎng)頁與所述第k廣告之間的關(guān)聯(lián)度,k為取值從1至X的正整 數(shù);對(duì)所述用戶-網(wǎng)頁訪問矩陣、所述用戶-廣告點(diǎn)擊矩陣和所述廣告-網(wǎng)頁關(guān)聯(lián)度矩陣進(jìn) 行聯(lián)合概率矩陣分解,得到所述第i用戶的用戶隱含特征向量、所述第j網(wǎng)頁的網(wǎng)頁隱含特 征向量和所述第k廣告的廣告隱含特征向量;根據(jù)所述第i用戶的用戶隱含特征向量、所述 第j網(wǎng)頁的網(wǎng)頁隱含特征向量和所述第k廣告的廣告隱含特征向量,確定所述第i用戶訪 問所述第j網(wǎng)頁時(shí)所述第k廣告的點(diǎn)擊概率。
[0025] 本發(fā)明實(shí)施例中,根據(jù)網(wǎng)頁訪問信息和廣告點(diǎn)擊信息預(yù)測(cè)第i用戶訪問第j網(wǎng)頁 時(shí)X個(gè)廣告的點(diǎn)擊概率,根據(jù)歷史推薦信息確定X個(gè)廣告分別對(duì)應(yīng)的新穎性因子,并根據(jù)X 個(gè)廣告的點(diǎn)擊概率和X個(gè)廣告分別對(duì)應(yīng)的新穎性因子在X個(gè)廣告中確定待向第i用戶推薦 的P個(gè)廣告,其中第i用戶對(duì)P個(gè)廣告的知曉程度低于第i用戶對(duì)X個(gè)廣告中除P個(gè)廣告 之外的廣告的知曉程度,P個(gè)廣告的點(diǎn)擊概率高于X個(gè)廣告中除P個(gè)廣告之外的廣告的點(diǎn) 擊概率。由于綜合考慮了用戶、網(wǎng)頁和廣告三方面的信息來預(yù)測(cè)廣告的點(diǎn)擊概率,從而能夠 提升廣告的點(diǎn)擊概率預(yù)測(cè)的準(zhǔn)確性,并且由于考慮了廣告的新穎性,從而能夠避免長(zhǎng)時(shí)間 向用戶推薦同一類型而未考慮用戶潛在興趣的廣告,因此能夠提高廣告的點(diǎn)擊率,進(jìn)而提 升用戶體驗(yàn)。
【專利附圖】
【附圖說明】
[0026] 為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)本發(fā)明實(shí)施例中所需要使 用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面所描述的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于 本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他 的附圖。
[0027] 圖1是根據(jù)本發(fā)明實(shí)施例的推薦廣告的方法的示意性流程圖。
[0028] 圖2是根據(jù)本發(fā)明實(shí)施例的推薦廣告的方法的過程的示意性流程圖。
[0029] 圖3是根據(jù)本發(fā)明實(shí)施例的AdRec模型的示意圖。
[0030] 圖4是根據(jù)本發(fā)明實(shí)施例的廣告推薦服務(wù)器的示意性框圖。
[0031] 圖5是根據(jù)本發(fā)明實(shí)施例的廣告推薦服務(wù)器的示意性框圖。
[0032] 圖6是根據(jù)本發(fā)明實(shí)施例的廣告推薦系統(tǒng)的示意框圖。
【具體實(shí)施方式】
[0033] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例是本發(fā)明的一部分實(shí)施例,而不是全部實(shí)施例?;诒景l(fā) 明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其他實(shí) 施例,都應(yīng)屬于本發(fā)明保護(hù)的范圍。
[0034] 本發(fā)明實(shí)施例可以應(yīng)用于各種對(duì)象的推薦場(chǎng)景,例如商品、應(yīng)用(Application) 或歌曲等對(duì)象的推薦。因此,本發(fā)明實(shí)施例中,廣告可以是這些推薦對(duì)象的載體,被推薦對(duì) 象的信息可以通過廣告頁面來顯示。
[0035] 本發(fā)明實(shí)施例的方法可以由廣告推薦服務(wù)器來執(zhí)行。廣告推薦服務(wù)器可以存儲(chǔ)廣 告主發(fā)布的廣告,對(duì)廣告主發(fā)布的廣告進(jìn)行管理,并可以向用戶提供廣告服務(wù)。具體地,廣 告推薦服務(wù)器可以統(tǒng)計(jì)用戶對(duì)廣告的點(diǎn)擊記錄以及用戶對(duì)網(wǎng)頁的點(diǎn)擊記錄等信息,可以基 于這些信息向用戶推薦廣告。
[0036] 圖1是根據(jù)本發(fā)明實(shí)施例的推薦廣告的方法的示意性流程圖。圖1的方法可由廣 告推薦服務(wù)器執(zhí)行。
[0037] 110,從用戶訪問互聯(lián)網(wǎng)日志中獲取網(wǎng)頁訪問信息和廣告點(diǎn)擊信息,網(wǎng)頁訪問信息 用于指示m個(gè)用戶所訪問的η個(gè)網(wǎng)頁,廣告點(diǎn)擊信息用于指示m個(gè)用戶在η個(gè)網(wǎng)頁上點(diǎn)擊 的X個(gè)廣告,n、m和X均為大于1的正整數(shù)。
[0038] 120,根據(jù)網(wǎng)頁訪問信息和廣告點(diǎn)擊信息,預(yù)測(cè)m個(gè)用戶中第i用戶訪問第j網(wǎng)頁 時(shí)X個(gè)廣告的點(diǎn)擊概率,其中i為取值從1至m的正整數(shù),j為取值從1至η的正整數(shù)。
[0039] 130,根據(jù)歷史推薦信息,確定X個(gè)廣告分別對(duì)應(yīng)的新穎性因子,歷史推薦信息用 于指示向第i用戶分別推薦X個(gè)廣告的歷史記錄,X個(gè)廣告中每個(gè)廣告的新穎性因子用于 表示第i用戶對(duì)該廣告的知曉程度。
[0040] 140,根據(jù)X個(gè)廣告的點(diǎn)擊概率和X個(gè)廣告分別對(duì)應(yīng)的新穎性因子,在X個(gè)廣告中 確定待向第i用戶推薦的P個(gè)廣告,其中,第i用戶對(duì)P個(gè)廣告的知曉程度低于第i用戶對(duì) X個(gè)廣告中除所述P個(gè)廣告之外的廣告的知曉程度,P個(gè)廣告的點(diǎn)擊概率高于X個(gè)廣告中除 P個(gè)廣告之外的廣告的點(diǎn)擊概率,P為正整數(shù)且P < X。
[0041] 本發(fā)明實(shí)施例中,根據(jù)網(wǎng)頁訪問信息和廣告點(diǎn)擊信息預(yù)測(cè)第i用戶訪問第j網(wǎng)頁 時(shí)X個(gè)廣告的點(diǎn)擊概率,根據(jù)歷史推薦信息確定X個(gè)廣告分別對(duì)應(yīng)的新穎性因子,并根據(jù)X 個(gè)廣告的點(diǎn)擊概率和X個(gè)廣告分別對(duì)應(yīng)的新穎性因子在X個(gè)廣告中確定待向第i用戶推薦 的P個(gè)廣告,其中第i用戶對(duì)P個(gè)廣告的知曉程度低于第i用戶對(duì)X個(gè)廣告中除P個(gè)廣告 之外的廣告的知曉程度,P個(gè)廣告的點(diǎn)擊概率高于X個(gè)廣告中除P個(gè)廣告之外的廣告的點(diǎn) 擊概率。由于綜合考慮了用戶、網(wǎng)頁和廣告三方面的信息來預(yù)測(cè)廣告的點(diǎn)擊概率,從而能夠 提升廣告的點(diǎn)擊概率預(yù)測(cè)的準(zhǔn)確性,并且由于考慮了廣告的新穎性,從而能夠避免長(zhǎng)時(shí)間 向用戶推薦同一類型而未考慮用戶潛在興趣的廣告,因此能夠提高廣告的點(diǎn)擊率,進(jìn)而提 升用戶體驗(yàn)。
[0042] 具體而言,現(xiàn)有的廣告推薦算法中,均是利用二維信息預(yù)測(cè)廣告的點(diǎn)擊概率,例如 廣告和網(wǎng)頁的相關(guān)信息或者用戶和廣告的相關(guān)信息。此外,基于現(xiàn)有的基于CBF的算法或 CF算法,向用戶推薦的廣告往往和該用戶熟悉的廣告很相似。用戶不熟悉但具有潛在興趣 的廣告卻難以被推薦給用戶。
[0043] 本發(fā)明實(shí)施例中,網(wǎng)頁訪問信息用于指示m個(gè)用戶所訪問的η個(gè)網(wǎng)頁,廣告點(diǎn)擊信 息用于指示m個(gè)用戶在η個(gè)網(wǎng)頁上點(diǎn)擊的X個(gè)廣告,因此,根據(jù)網(wǎng)頁訪問信息和廣告點(diǎn)擊信 息預(yù)測(cè)廣告的點(diǎn)擊概率,也就是利用用戶、網(wǎng)頁以及廣告這三個(gè)維度的信息預(yù)測(cè)X個(gè)廣告 的點(diǎn)擊概率,從而能夠提高廣告的點(diǎn)擊概率預(yù)測(cè)的準(zhǔn)確性。此外,根據(jù)用于指示向第i用戶 推薦X個(gè)廣告的歷史記錄的歷史推薦信息,確定X個(gè)廣告分別對(duì)應(yīng)的新穎性因子。這樣,在 根據(jù)X個(gè)廣告的點(diǎn)擊概率和X個(gè)廣告分別對(duì)應(yīng)的新穎性因子確定待向第i用戶推薦的P個(gè) 廣告時(shí),同時(shí)考慮了廣告的點(diǎn)擊概率預(yù)測(cè)的準(zhǔn)確性和廣告的新穎性兩方面,因此不僅能夠 提升廣告的點(diǎn)擊概率預(yù)測(cè)的準(zhǔn)確性,并且由于考慮了廣告的新穎性,從而能夠避免長(zhǎng)時(shí)間 向用戶推薦同一類型而未考慮用戶潛在興趣的廣告,因此能夠提高廣告的點(diǎn)擊率,并提升 用戶體驗(yàn)。
[0044] 應(yīng)理解,本發(fā)明實(shí)施例中,第i用戶可以是m個(gè)用戶中任意一個(gè)用戶,第j網(wǎng)頁可 以是η個(gè)網(wǎng)頁中任意一個(gè)網(wǎng)頁。
[0045] 可選地,作為一個(gè)實(shí)施例,上述X個(gè)廣告可以是廣告推薦服務(wù)器中存儲(chǔ)的所有廣 告或部分廣告。
[0046] 可選地,作為另一實(shí)施例,在步驟120中,可以根據(jù)網(wǎng)頁訪問信息和廣告點(diǎn)擊信 息,生成用戶-網(wǎng)頁訪問矩陣、用戶-廣告點(diǎn)擊矩陣和廣告-網(wǎng)頁關(guān)聯(lián)度矩陣,其中,用 戶-網(wǎng)頁訪問矩陣的第i行第j列對(duì)象表示第i用戶對(duì)第j網(wǎng)頁的訪問記錄,用戶-廣告 點(diǎn)擊矩陣的第i行第k列對(duì)象表示第i用戶對(duì)第k廣告的點(diǎn)擊記錄,廣告-網(wǎng)頁關(guān)聯(lián)度矩 陣的第j行第k列對(duì)象表示第j網(wǎng)頁與第k廣告之間的關(guān)聯(lián)度,k為取值從1至X的正整 數(shù)。然后可以對(duì)用戶-網(wǎng)頁訪問矩陣、用戶-廣告點(diǎn)擊矩陣和廣告-網(wǎng)頁關(guān)聯(lián)度矩陣進(jìn)行 聯(lián)合概率矩陣分解,得到第i用戶的用戶隱含特征向量、第j網(wǎng)頁的網(wǎng)頁隱含特征向量和第 k廣告的廣告隱含特征向量。最后可以根據(jù)第i用戶的用戶隱含特征向量、第j網(wǎng)頁的網(wǎng)頁 隱含特征向量和第k廣告的廣告隱含特征向量,確定第i用戶訪問第j網(wǎng)頁時(shí)第k廣告的 點(diǎn)擊概率。
[0047] 通常網(wǎng)頁的數(shù)量非常大,可以將網(wǎng)頁按照進(jìn)行分類后,再將網(wǎng)頁訪問信息和廣告 點(diǎn)擊信息轉(zhuǎn)化為用戶-網(wǎng)頁訪問矩陣、用戶-廣告點(diǎn)擊矩陣以及網(wǎng)頁和廣告同時(shí)出現(xiàn)時(shí)廣 告的點(diǎn)擊率矩陣。例如,可以按照域名對(duì)網(wǎng)頁進(jìn)行分類。此外,可以從網(wǎng)頁訪問信息和廣告 點(diǎn)擊信息中提取網(wǎng)頁與廣告的相似度信息。基于網(wǎng)頁和廣告同時(shí)出現(xiàn)時(shí)廣告的點(diǎn)擊率矩陣 以及網(wǎng)頁與廣告的相似度信息,可以得到廣告-網(wǎng)頁關(guān)聯(lián)度矩陣。
[0048] 利用聯(lián)合概率矩陣分解(Unified Probabilistic Matrix Factorization,UPMF) 算法,可以對(duì)用戶-網(wǎng)頁訪問矩陣、用戶-廣告點(diǎn)擊矩陣和廣告-網(wǎng)頁關(guān)聯(lián)度矩陣進(jìn)行分 解,從而得到第i用戶訪問第j網(wǎng)頁時(shí)X個(gè)廣告的點(diǎn)擊概率。
[0049] 用戶-網(wǎng)頁訪問矩陣和用戶-廣告點(diǎn)擊矩陣可以反映用戶的的興趣,而廣告-網(wǎng) 頁關(guān)聯(lián)度矩陣可以反映網(wǎng)頁與廣告之間的相關(guān)性,可見,本實(shí)施例中,同時(shí)考慮了用戶的興 趣以及網(wǎng)頁與廣告之間的相關(guān)性,預(yù)測(cè)各個(gè)廣告的點(diǎn)擊概率。因此,能夠提高廣告的點(diǎn)擊概 率預(yù)測(cè)的準(zhǔn)確性,從而能夠保證廣告的點(diǎn)擊率。
[0050] 目前,由于網(wǎng)頁數(shù)量和用戶數(shù)量很大,用戶對(duì)網(wǎng)頁的訪問數(shù)據(jù)以及用戶對(duì)廣告的 點(diǎn)擊數(shù)據(jù)十分稀疏。這種現(xiàn)象也可以稱為數(shù)據(jù)稀疏。這種情況下,采用基于CBF的算法或 者CF算法預(yù)測(cè)廣告的點(diǎn)擊概率的準(zhǔn)確率會(huì)大大降低。而本發(fā)明實(shí)施例中,利用聯(lián)合概率矩 陣分解算法,根據(jù)用戶-網(wǎng)頁訪問矩陣、用戶-廣告點(diǎn)擊矩陣和廣告-網(wǎng)頁關(guān)聯(lián)度矩陣這三 個(gè)矩陣預(yù)測(cè)廣告的點(diǎn)擊概率,雖然這三個(gè)矩陣可能均為稀疏矩陣,但由于并非僅僅基于其 中某一個(gè)矩陣預(yù)測(cè)點(diǎn)擊概率,從而在數(shù)據(jù)稀疏的情況下也能夠保證廣告的點(diǎn)擊概率預(yù)測(cè)的 準(zhǔn)確性。稀疏矩陣可以指行或列的數(shù)據(jù)缺失較多的矩陣。
[0051] 具體而言,在第i用戶訪問第j網(wǎng)頁時(shí),對(duì)于X個(gè)廣告中的第k廣告,可以以最大 化聯(lián)合后驗(yàn)概率為目標(biāo)函數(shù),基于梯度下降法,對(duì)用戶-網(wǎng)頁訪問矩陣、用戶-廣告點(diǎn)擊矩 陣和廣告-網(wǎng)頁關(guān)聯(lián)度矩陣進(jìn)行分解,得到第i用戶的用戶隱含特征向量、第j網(wǎng)頁的網(wǎng)頁 隱含特征向量和第k廣告的廣告隱含特征向量??梢岳?,根據(jù)第i用戶的用戶隱含特征 向量、第j網(wǎng)頁的網(wǎng)頁隱含特征向量和第k廣告的廣告隱含特征向量,預(yù)測(cè)第k廣告的點(diǎn)擊 概率。
[0052] 具體地,以最大化聯(lián)合后驗(yàn)概率為目標(biāo)函數(shù),基于梯度下降法,根據(jù)上述三個(gè)矩陣 得到第i用戶的用戶隱含特征向量、第j網(wǎng)頁的網(wǎng)頁隱含特征向量和第k廣告的廣告隱含 特征向量。根據(jù)第i用戶的用戶隱含特征向量、第j網(wǎng)頁的網(wǎng)頁隱含特征向量和第k廣告 的廣告隱含特征向量,可以分別確定第一向量、第二向量和第三向量,第一向量可以表不第 i用戶對(duì)第j網(wǎng)頁的感興趣程度,第二向量可以表示第i用戶對(duì)第k廣告的感興趣程度,第 三向量可以表示第j網(wǎng)頁與第k廣告的關(guān)聯(lián)程度??梢詫⒌谝幌蛄俊⒌诙蛄恳约暗谌?量的線性組合映射到[0,1],從而可以得到在第i用戶訪問第j網(wǎng)頁時(shí)第k廣告的點(diǎn)擊概 率。
[0053] 第k廣告可以是X個(gè)廣告中的任一廣告。對(duì)于每個(gè)廣告而言,均可以按照上述過 程計(jì)算在第i用戶訪問第j網(wǎng)頁時(shí)其點(diǎn)擊概率。這樣可以得到在第i用戶訪問第j網(wǎng)頁時(shí) X個(gè)廣告的點(diǎn)擊概率。
[0054] 目前,由于網(wǎng)頁數(shù)量和用戶數(shù)量的規(guī)模較大,因此推薦算法的復(fù)雜度是需要重點(diǎn) 關(guān)注的因素。本實(shí)施例中,計(jì)算過程的開銷主要來源于梯度下降法。算法復(fù)雜度隨三個(gè)矩 陣中數(shù)據(jù)量增加而線性增長(zhǎng)。因此,本實(shí)施例適用于大規(guī)模數(shù)據(jù)的處理。
[0055] 可選地,作為另一實(shí)施例,在步驟130中,對(duì)于x個(gè)廣告中的第k廣告,如果歷史推 薦信息指示未向第i用戶推薦過第k廣告,則可以確定第k廣告對(duì)應(yīng)的新穎性因子為第一 值;如果歷史推薦信息指示過去向第i用戶推薦過第k廣告,則可以確定第k廣告對(duì)應(yīng)的新 穎性因子為第二值。
[0056] 其中,第一值大于第二值,k為取值從1至X的正整數(shù)。
[0057] 具體而言,上述第k廣告可以是X個(gè)廣告中的任意一個(gè)廣告。每個(gè)廣告可以對(duì)應(yīng) 一個(gè)新穎性因子。每個(gè)廣告對(duì)應(yīng)的新穎性因子可以用于表示對(duì)第i用戶而言該廣告的新穎 性。對(duì)于每個(gè)廣告而言,在未向第i用戶推薦過的情況下的新穎性因子大于在向第i用戶 已經(jīng)推薦過的情況下的新穎性因子。廣告對(duì)應(yīng)的新穎性因子越大,則可以表明對(duì)于第i用 戶來說該廣告的新穎性越高,換句話說,第i用戶對(duì)該廣告不熟悉或者未見過該廣告。
[0058] 可見,本實(shí)施例中,對(duì)于每個(gè)廣告而言,在未向第i用戶推薦過的情況下的新穎性 因子大于在向第i用戶已經(jīng)推薦過的情況下的新穎性因子,這樣,能夠提升所推薦的廣告 的新穎性,從而提升用戶體驗(yàn)。
[0059] 第一值和第二值可以是預(yù)先設(shè)定的,例如,第一值可以預(yù)設(shè)為1,第二值可以預(yù)設(shè) 為0. 5?;蛘撸诙悼梢允歉鶕?jù)歷史推薦信息和艾賓浩斯遺忘曲線得到的。
[0060] 可選地,作為另一實(shí)施例,在步驟130中,可以確定q天前向第i用戶推薦過第k 廣告,q為正整數(shù),確定q天對(duì)應(yīng)的艾賓浩斯遺忘曲線值,并確定第k廣告對(duì)應(yīng)的新穎性因 子為第一值與艾賓浩斯遺忘曲線值之間的差值。
[0061] 例如,第一值可以預(yù)設(shè)為1,第二值為1-艾賓浩斯遺忘曲線值。
[0062] 對(duì)于向第i用戶推薦過的廣告而言,可以基于艾賓浩斯遺忘曲線來確定該廣告對(duì) 應(yīng)的新穎性因子。這樣能夠提高新穎性因子的準(zhǔn)確度,從而能夠提升向用戶推薦的廣告的 新穎性,并提升用戶體驗(yàn)。需要說明的是,基于艾賓浩斯遺忘曲線值來確定該廣告對(duì)應(yīng)的新 穎性因子只是本發(fā)明采用的一種較佳的實(shí)施方式,可以理解的是,將艾賓浩斯遺忘曲線值 替換成與q相關(guān)的權(quán)重值,也可以實(shí)現(xiàn)本發(fā)明方案。
[0063] 可選地,作為另一實(shí)施例,在步驟130中,對(duì)于X個(gè)廣告中的第k廣告,可以確定第 k廣告分別與X個(gè)廣告中除第k廣告之外的其它廣告之間的相似度??梢愿鶕?jù)第k廣告分 別與X個(gè)廣告中除第k廣告之外的其它廣告之間的相似度,確定在X個(gè)廣告中第k廣告對(duì) 應(yīng)的相似性排名和第k廣告對(duì)應(yīng)的不相似性排名??梢詫?duì)第k廣告對(duì)應(yīng)的相似性排名和第 k廣告對(duì)應(yīng)的不相似性排名進(jìn)行加權(quán),以得到第k廣告對(duì)應(yīng)的新穎性因子,其中,k為取值從 1至X的正整數(shù)。
[0064] 具體而言,可以根據(jù)領(lǐng)域分類體系的評(píng)價(jià)指標(biāo)--列表內(nèi)部相似度(Intra-list Similarity)來確定各個(gè)廣告對(duì)應(yīng)的新穎性因子。針對(duì)X個(gè)廣告,可以確定兩兩廣告之間的 相似度。例如,可以根據(jù)余弦相似性算法或皮爾森(Pearson)相似性算法,確定兩兩廣告之 間的相似度。這樣,對(duì)于每個(gè)廣告,可以利用其與其它廣告之間的相似度,確定在X個(gè)廣告 中該廣告對(duì)應(yīng)的相似性排名RS和不相似性排名NRS。然后可以對(duì)該廣告對(duì)應(yīng)的相似性排名 和不相似性排名進(jìn)行加權(quán),從而得到該廣告對(duì)應(yīng)的新穎性因子。例如,該廣告的新穎性因子 =W*RS+(1-W)*NRS,其中W為權(quán)重值。
[0065] 本實(shí)施例能夠提高新穎性因子的準(zhǔn)確度,從而能夠提升向用戶推薦的廣告的新穎 性,并提升用戶體驗(yàn)。
[0066] 可選地,作為另一實(shí)施例,在步驟130中,對(duì)于x個(gè)廣告中的第k廣告,確定第k廣 告分別與X個(gè)廣告中除第k廣告之外的其它廣告之間的多樣性距離;根據(jù)第k廣告分別與 X個(gè)廣告中除第k廣告之外的其它廣告之間的多樣性距離,確定第k廣告對(duì)應(yīng)的新穎性因 子;其中,k為取值從1至X的正整數(shù)。
[0067] 具體地,可以基于推薦多樣性原理來確定X個(gè)廣告分別對(duì)應(yīng)的新穎性因子。對(duì)于 X個(gè)廣告,可以確定兩兩廣告之間的多樣性距離。例如,可以基于Jaccard多樣性距離計(jì)算 方式,來得到兩兩廣告之間的多樣性距離。
[0068]因此,對(duì)于每個(gè)廣告,可以計(jì)算出其與其它各個(gè)廣告之間的多樣性距離。根據(jù)該廣 告與其它各個(gè)廣告之間的多樣性距離,確定該廣告對(duì)應(yīng)的新穎性因子。例如,可以將該廣告 與其它各個(gè)廣告之間的多樣性距離進(jìn)行求和,得到該廣告對(duì)應(yīng)的新穎性因子。本實(shí)施例能 夠提高新穎性因子的準(zhǔn)確度,從而能夠提升向用戶推薦的廣告的新穎性,并提升用戶體驗(yàn)。
[0069] 可選地,作為另一實(shí)施例,在步驟140中,可以對(duì)X個(gè)廣告中每個(gè)廣告對(duì)應(yīng)的點(diǎn)擊 概率和每個(gè)廣告對(duì)應(yīng)的新穎性因子進(jìn)行加權(quán),確定X個(gè)廣告分別對(duì)應(yīng)的評(píng)分??梢园凑誜 個(gè)廣告對(duì)應(yīng)的評(píng)分從大到小的順序,對(duì)X個(gè)廣告進(jìn)行排序,得到排序后的X個(gè)廣告??梢詫?排序后的X個(gè)廣告中的前P個(gè)廣告確定為待向第i用戶推薦的P個(gè)廣告。
[0070] 具體地,可以通過加權(quán)算法,對(duì)點(diǎn)擊概率和新穎性因子進(jìn)行加權(quán),來得到各個(gè)廣告 對(duì)應(yīng)的評(píng)分。例如,對(duì)于每個(gè)廣告,可以為其點(diǎn)擊概率和新穎性因子分配相應(yīng)的權(quán)重,利用 所分配的權(quán)重對(duì)該廣告的點(diǎn)擊概率和新穎性因子進(jìn)行加權(quán),從而得到該廣告對(duì)應(yīng)的評(píng)分。 可以按照評(píng)分從大到小的順序?qū)個(gè)廣告進(jìn)行排序,將排序后的X個(gè)廣告中前P個(gè)廣告作 為待向第i用戶推薦的廣告??梢?,在確定要向第i用戶推薦的廣告時(shí),同時(shí)考慮了點(diǎn)擊概 率和新穎性因子兩方面因素,從而能夠提高廣告的點(diǎn)擊率并提升用戶體驗(yàn)。
[0071] 可選地,作為另一實(shí)施例,在步驟140中,可以按照點(diǎn)擊概率從大到小的順序,對(duì)X 個(gè)廣告進(jìn)行排序,得到排序后的X個(gè)廣告??梢园凑招路f性因子從大到小的順序,對(duì)排序后 的X個(gè)廣告中的前q個(gè)廣告進(jìn)行排序,得到重新排序后的q個(gè)廣告,其中q為正整數(shù)且q大 于P??梢詫⒅匦屡判蚝蟮膓個(gè)廣告中前P個(gè)廣告確定為待向第i用戶推薦的P個(gè)廣告。
[0072] 例如,可以基于上述這種漏斗形的過濾加權(quán)方式得到廣告推薦列表。q優(yōu)選為p的 2倍。可見,在確定待向第i用戶推薦的廣告時(shí),同時(shí)考慮了點(diǎn)擊概率和新穎性因子兩方面 因素,從而能夠提高廣告的點(diǎn)擊率并提升用戶體驗(yàn)。
[0073] 可選地,作為另一實(shí)施例,在步驟110中,可以實(shí)時(shí)地從用戶訪問互聯(lián)網(wǎng)日志中獲 取網(wǎng)頁訪問信息和廣告點(diǎn)擊信息。廣告點(diǎn)擊信息可以包含用戶對(duì)推薦的P個(gè)廣告的點(diǎn)擊信 息。也就是說,用戶對(duì)推薦的P個(gè)廣告的點(diǎn)擊信息會(huì)被實(shí)時(shí)地反饋回來,這樣結(jié)合實(shí)時(shí)的信 息能夠自適應(yīng)地調(diào)整廣告的點(diǎn)擊概率,從而進(jìn)一步提高廣告的點(diǎn)擊概率預(yù)測(cè)的準(zhǔn)確性。
[0074] 下面將結(jié)合具體例子詳細(xì)描述本發(fā)明實(shí)施例的過程。應(yīng)理解,下面的例子僅是為 了幫助本領(lǐng)域技術(shù)人員更好地理解本發(fā)明實(shí)施例,而非限制本發(fā)明實(shí)施例的范圍。
[0075] 圖2是根據(jù)本發(fā)明實(shí)施例的推薦廣告的方法的過程的示意性流程圖。
[0076] 201,從用戶訪問互聯(lián)網(wǎng)的日志中獲取網(wǎng)頁訪問信息和廣告點(diǎn)擊信息,網(wǎng)頁訪問信 息用于指示m個(gè)用戶所訪問的η個(gè)網(wǎng)頁,廣告點(diǎn)擊信息用于指示m個(gè)用戶在η個(gè)網(wǎng)頁上點(diǎn) 擊的X個(gè)廣告,n、m和X均為大于1的正整數(shù)。
[0077] 202,根據(jù)網(wǎng)頁訪問信息和廣告點(diǎn)擊信息,生成用戶-網(wǎng)頁訪問矩陣、用戶-廣告點(diǎn) 擊矩陣和廣告-網(wǎng)頁關(guān)聯(lián)度矩陣。
[0078] (I)用戶-網(wǎng)頁訪問矩陣
[0079] B可以表示用戶-網(wǎng)頁訪問矩陣。B中的元素[0,1])表示用戶屮對(duì)網(wǎng) 頁%的訪問記錄,也可以認(rèn)為是用戶Ui對(duì)網(wǎng)頁 Wj的感興趣程度。顯然地,用戶瀏覽網(wǎng)頁的 次數(shù)越多,可以表明用戶對(duì)此網(wǎng)頁內(nèi)容越感興趣。可以由公式(1)計(jì)算得到:
[0080] b^· = g(f (ui; Wj)) (1)
[0081] 其中,g( ·)是邏輯斯蒂(Logistic Function)函數(shù),用于歸一化。f^Ui, Wj)表示 用戶Ui瀏覽網(wǎng)%的次數(shù)。
[0082] (II)用戶-廣告點(diǎn)擊矩陣
[0083] C可以表示用戶-廣告點(diǎn)擊矩陣。C中的元素 cik表示用戶Ui對(duì)廣告ak的感興趣 程度。顯然地,用戶點(diǎn)擊廣告,可以表明用戶對(duì)該廣告感興趣。c ik可以由公式(2)得到:
[0084] cik = g(f (ui; ak)) (2)
[0085] 其中,f (Up ak)表示用戶w點(diǎn)擊廣告ak的次數(shù)。
[0086] (III)廣告-網(wǎng)頁關(guān)聯(lián)度矩陣
[0087] R可以表示廣告-網(wǎng)頁關(guān)聯(lián)度矩陣。R中的元素 rjk表示網(wǎng)頁%與廣告ak之間的 關(guān)聯(lián)度。同一廣告在不同網(wǎng)頁上顯示時(shí),具有不同的點(diǎn)擊率。廣告和網(wǎng)頁的內(nèi)容越相關(guān),廣 告被點(diǎn)擊的可能性越大。此處結(jié)合網(wǎng)頁-廣告同時(shí)出現(xiàn)時(shí)廣告的點(diǎn)擊率以及網(wǎng)頁和廣告之 間的相似度,確定廣告-網(wǎng)頁關(guān)聯(lián)度矩陣,這樣能夠提高廣告-網(wǎng)頁關(guān)聯(lián)度矩陣的準(zhǔn)確度。
[0088] rjk可以由公式(3)得到:
[0089] rJk = a dJk+ (1- α ) hJk ⑶
[0090] 其中,djk可以表示網(wǎng)頁Wj與廣告ak之間的相似度,h jk表示在網(wǎng)頁Wj上廣告ak的 點(diǎn)擊率。
[0091] djk 可以按照概率潛在語義分析(Probabilistic Latent Semantic Analysis, PLSA)方法或潛在狄利克雷分配(Latent Dirichlet Allocation, LDA)算法得到。
[0092] hjk可以等于網(wǎng)頁Wj上廣告ak被點(diǎn)擊的次數(shù)除以廣告ak在網(wǎng)頁 Wj上總的投放次 數(shù)。
[0093] 203,根據(jù)用戶-網(wǎng)頁訪問矩陣、用戶-廣告點(diǎn)擊矩陣和廣告-網(wǎng)頁關(guān)聯(lián)度矩陣,確 定用戶 Ui的用戶隱含特征向量、網(wǎng)頁Wj的網(wǎng)頁隱含特征向量和X個(gè)廣告各自的廣告隱含特 征向量。
[0094] 用戶對(duì)網(wǎng)頁的訪問歷史和對(duì)廣告的點(diǎn)擊歷史均能反映用戶的興趣或偏好。而廣告 點(diǎn)擊率與用戶興趣及廣告與網(wǎng)頁關(guān)聯(lián)度密切相關(guān)。本實(shí)施例中,通過利用AdRec模型將用 戶興趣及廣告與網(wǎng)頁關(guān)聯(lián)度相結(jié)合。
[0095] 下面將以X個(gè)廣告中的廣告ak為例進(jìn)行描述。應(yīng)理解,廣告ak可以是X個(gè)廣告中 任一廣告。
[0096] 具體地,可以基于AdRec模型確定這三個(gè)隱含特征向量。圖3是根據(jù)本發(fā)明實(shí)施 例的AdRec模型的示意圖。如圖3所示,用戶-網(wǎng)頁訪問矩陣與用戶-廣告點(diǎn)擊矩陣共享 用戶隱含特征向量A,用戶-廣告點(diǎn)擊矩陣與廣告-網(wǎng)頁關(guān)聯(lián)度矩陣共享廣告隱含特征向 量Ak。
[0097] AdRec模型基于如下假設(shè):
[0099] ( 4 )
[0098] (I)假設(shè)%、Wj和Ak先驗(yàn)服從正態(tài)分布且相互獨(dú)立,即
【權(quán)利要求】
1. 一種推薦廣告的方法,其特征在于,包括: 從用戶訪問互聯(lián)網(wǎng)日志中獲取網(wǎng)頁訪問信息和廣告點(diǎn)擊信息,所述網(wǎng)頁訪問信息用于 指示m個(gè)用戶所訪問的η個(gè)網(wǎng)頁,所述廣告點(diǎn)擊信息用于指示m個(gè)用戶在η個(gè)網(wǎng)頁上點(diǎn)擊 的X個(gè)廣告,n、m和X均為大于1的正整數(shù); 根據(jù)所述網(wǎng)頁訪問信息和所述廣告點(diǎn)擊信息,預(yù)測(cè)所述m個(gè)用戶中第i用戶訪問第j 網(wǎng)頁時(shí)所述X個(gè)廣告的點(diǎn)擊概率,其中i為取值從1至m的正整數(shù),j為取值從1至η的正 整數(shù); 確定所述X個(gè)廣告分別對(duì)應(yīng)的新穎性因子,所述X個(gè)廣告中每個(gè)廣告對(duì)應(yīng)的新穎性因 子用于表示所述第i用戶對(duì)所述每個(gè)廣告的知曉程度; 根據(jù)所述X個(gè)廣告的點(diǎn)擊概率和所述X個(gè)廣告分別對(duì)應(yīng)的新穎性因子,在所述X個(gè)廣 告中確定待向所述第i用戶推薦的P個(gè)廣告,其中,所述第i用戶對(duì)所述P個(gè)廣告的知曉程 度低于所述第i用戶對(duì)所述X個(gè)廣告中除所述P個(gè)廣告之外的廣告的知曉程度,所述P個(gè) 廣告的點(diǎn)擊概率高于所述X個(gè)廣告中除所述P個(gè)廣告之外的廣告的點(diǎn)擊概率,P為正整數(shù) 且 P < X。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定所述X個(gè)廣告分別對(duì)應(yīng)的新穎性 因子,包括: 根據(jù)歷史推薦信息,確定所述X個(gè)廣告分別對(duì)應(yīng)的新穎性因子,所述歷史推薦信息用 于指示向所述第i用戶分別推薦所述X個(gè)廣告的歷史記錄。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)歷史推薦信息,確定所述X個(gè)廣 告分別對(duì)應(yīng)的新穎性因子,包括: 對(duì)于所述X個(gè)廣告中的第k廣告, 如果所述歷史推薦信息指示未向所述第i用戶推薦過所述第k廣告,則確定所述第k 廣告對(duì)應(yīng)的新穎性因子為第一值; 如果所述歷史推薦信息指示過去向所述第i用戶推薦過所述第k廣告,則確定所述第 k廣告對(duì)應(yīng)的新穎性因子為第二值; 其中,所述第一值大于所述第二值,k為取值從1至X的正整數(shù)。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述確定所述第k廣告對(duì)應(yīng)的新穎性因子 為第二值,包括: 確定q天前向所述第i用戶推薦過所述第k廣告,q為正整數(shù); 確定所述q天對(duì)應(yīng)的艾賓浩斯遺忘曲線值; 確定所述第k廣告對(duì)應(yīng)的新穎性因子為所述第一值與所述艾賓浩斯遺忘曲線值之間 的差值。
5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定所述X個(gè)廣告分別對(duì)應(yīng)的新穎性 因子,包括: 對(duì)于所述X個(gè)廣告中的第k廣告, 確定所述第k廣告分別與所述X個(gè)廣告中除所述第k廣告之外的其它廣告之間的相似 度; 根據(jù)所述第k廣告分別與所述X個(gè)廣告中除所述第k廣告之外的其它廣告之間的相似 度,確定在所述X個(gè)廣告中所述第k廣告對(duì)應(yīng)的相似性排名和所述第k廣告對(duì)應(yīng)的不相似 性排名; 對(duì)所述第k廣告對(duì)應(yīng)的相似性排名和所述第k廣告對(duì)應(yīng)的不相似性排名進(jìn)行加權(quán),以 得到所述第k廣告對(duì)應(yīng)的新穎性因子; 其中,k為取值從1至X的正整數(shù)。
6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定所述X個(gè)廣告分別對(duì)應(yīng)的新穎性 因子,包括: 對(duì)于所述X個(gè)廣告中的第k廣告, 確定所述第k廣告分別與所述X個(gè)廣告中除所述第k廣告之外的其它廣告之間的多樣 性距離; 根據(jù)所述第k廣告分別與所述X個(gè)廣告中除所述第k廣告之外的其它廣告之間的多樣 性距離,確定所述第k廣告對(duì)應(yīng)的新穎性因子; 其中,k為取值從1至X的正整數(shù)。
7. 根據(jù)權(quán)利要求1至6中任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述X個(gè)廣告分別 對(duì)應(yīng)的點(diǎn)擊概率和所述X個(gè)廣告分別對(duì)應(yīng)的新穎性因子,在所述X個(gè)廣告中確定待向所述 第i用戶推薦的P個(gè)廣告,包括: 對(duì)所述X個(gè)廣告中每個(gè)廣告對(duì)應(yīng)的點(diǎn)擊概率和所述每個(gè)廣告對(duì)應(yīng)的新穎性因子進(jìn)行 加權(quán),確定所述X個(gè)廣告分別對(duì)應(yīng)的評(píng)分; 按照所述X個(gè)廣告對(duì)應(yīng)的評(píng)分從大到小的順序,對(duì)所述X個(gè)廣告進(jìn)行排序,得到排序后 的X個(gè)廣告; 將所述排序后的X個(gè)廣告中的前P個(gè)廣告確定為待向所述第i用戶推薦的P個(gè)廣告。
8. 根據(jù)權(quán)利要求1至6中任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述X個(gè)廣告分別 對(duì)應(yīng)的點(diǎn)擊概率和所述X個(gè)廣告分別對(duì)應(yīng)的新穎性因子,在所述X個(gè)廣告中確定待向所述 第i用戶推薦的P個(gè)廣告,包括: 按照點(diǎn)擊概率從大到小的順序,對(duì)所述X個(gè)廣告進(jìn)行排序,得到排序后的X個(gè)廣告; 按照新穎性因子從大到小的順序,對(duì)所述排序后的X個(gè)廣告中的前q個(gè)廣告重新進(jìn)行 排序,得到重新排序后的q個(gè)廣告;其中q為正整數(shù)且q大于P ; 將所述重新排序后的q個(gè)廣告中的前P個(gè)廣告確定為待向所述第i用戶推薦的P個(gè)廣 生 1=1 〇
9. 根據(jù)權(quán)利要求1至8中任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述網(wǎng)頁訪問信息 和所述廣告點(diǎn)擊信息,預(yù)測(cè)所述m個(gè)用戶中第i用戶訪問第j網(wǎng)頁時(shí)所述X個(gè)廣告的點(diǎn)擊 概率,包括: 根據(jù)所述網(wǎng)頁訪問信息和所述廣告點(diǎn)擊信息,生成用戶-網(wǎng)頁訪問矩陣、用戶-廣告點(diǎn) 擊矩陣和廣告-網(wǎng)頁關(guān)聯(lián)度矩陣,其中,所述用戶-網(wǎng)頁訪問矩陣的第i行第j列對(duì)象表示 所述第i用戶對(duì)所述第j網(wǎng)頁的訪問記錄,所述用戶-廣告點(diǎn)擊矩陣的第i行第k列對(duì)象 表示所述第i用戶對(duì)第k廣告的點(diǎn)擊記錄,所述廣告-網(wǎng)頁關(guān)聯(lián)度矩陣的第j行第k列對(duì) 象表示所述第j網(wǎng)頁與所述第k廣告之間的關(guān)聯(lián)度,k為取值從1至X的正整數(shù); 對(duì)所述用戶-網(wǎng)頁訪問矩陣、所述用戶-廣告點(diǎn)擊矩陣和所述廣告-網(wǎng)頁關(guān)聯(lián)度矩陣 進(jìn)行聯(lián)合概率矩陣分解,得到所述第i用戶的用戶隱含特征向量、所述第j網(wǎng)頁的網(wǎng)頁隱含 特征向量和所述第k廣告的廣告隱含特征向量; 根據(jù)所述第i用戶的用戶隱含特征向量、所述第j網(wǎng)頁的網(wǎng)頁隱含特征向量和所述第 k廣告的廣告隱含特征向量,確定所述第i用戶訪問所述第j網(wǎng)頁時(shí)所述第k廣告的點(diǎn)擊概 率。
10. -種廣告推薦服務(wù)器,其特征在于,包括: 獲取單元,用于從用戶訪問互聯(lián)網(wǎng)日志中獲取網(wǎng)頁訪問信息和廣告點(diǎn)擊信息,所述網(wǎng) 頁訪問信息用于指示m個(gè)用戶所訪問的η個(gè)網(wǎng)頁,所述廣告點(diǎn)擊信息用于指示m個(gè)用戶在 η個(gè)網(wǎng)頁上點(diǎn)擊的X個(gè)廣告,n、m和X均為大于1的正整數(shù); 預(yù)測(cè)單元,用于根據(jù)所述網(wǎng)頁訪問信息和所述廣告點(diǎn)擊信息,預(yù)測(cè)所述m個(gè)用戶中第i 用戶訪問第j網(wǎng)頁時(shí)所述X個(gè)廣告的點(diǎn)擊概率,其中i為取值從1至m的正整數(shù),j為取值 從1至η的正整數(shù); 確定單元,用于確定所述X個(gè)廣告分別對(duì)應(yīng)的新穎性因子,所述X個(gè)廣告中每個(gè)廣告對(duì) 應(yīng)的新穎性因子用于表示所述第i用戶對(duì)所述每個(gè)廣告的知曉程度; 選擇單元,用于根據(jù)所述X個(gè)廣告的點(diǎn)擊概率和所述X個(gè)廣告分別對(duì)應(yīng)的新穎性因子, 在所述X個(gè)廣告中確定待向所述第i用戶推薦的P個(gè)廣告,其中,所述第i用戶對(duì)所述P個(gè) 廣告的知曉程度低于所述第i用戶對(duì)所述X個(gè)廣告中除所述P個(gè)廣告之外的廣告的知曉程 度,所述P個(gè)廣告的點(diǎn)擊概率高于所述X個(gè)廣告中除所述P個(gè)廣告之外的廣告的點(diǎn)擊概率, P為正整數(shù)且P彡X。
11. 根據(jù)權(quán)利要求10所述的廣告推薦服務(wù)器,其特征在于,所述確定單元,具體用于: 根據(jù)歷史推薦信息,確定所述X個(gè)廣告分別對(duì)應(yīng)的新穎性因子,所述歷史推薦信息用 于指示向所述第i用戶分別推薦所述X個(gè)廣告的歷史記錄。
12. 根據(jù)權(quán)利要求11所述的廣告推薦服務(wù)器,其特征在于,在根據(jù)歷史推薦信息,確定 所述X個(gè)廣告分別對(duì)應(yīng)的新穎性因子的方面,所述確定單元,具體用于: 對(duì)于所述X個(gè)廣告中的第k廣告, 如果所述歷史推薦信息指示未向所述第i用戶推薦過所述第k廣告,則確定所述第k 廣告對(duì)應(yīng)的新穎性因子為第一值; 如果所述歷史推薦信息指示過去向所述第i用戶推薦過所述第k廣告,則確定所述第 k廣告對(duì)應(yīng)的新穎性因子為第二值; 其中,所述第一值大于所述第二值,k為取值從1至X的正整數(shù)。
13. 根據(jù)權(quán)利要求12所述的廣告推薦服務(wù)器,其特征在于,在確定所述第k廣告對(duì)應(yīng)的 新穎性因子為第二值的方面,所述確定單元,具體用于: 確定q天前向所述第i用戶推薦過所述第k廣告,q為正整數(shù); 確定所述q天對(duì)應(yīng)的艾賓浩斯遺忘曲線值; 確定所述第k廣告對(duì)應(yīng)的新穎性因子為所述第一值與所述艾賓浩斯遺忘曲線值之間 的差值。
14. 根據(jù)權(quán)利要求10所述的廣告推薦服務(wù)器,其特征在于,在確定所述X個(gè)廣告分別對(duì) 應(yīng)的新穎性因子的方面,所述確定單元,具體用于: 對(duì)于所述X個(gè)廣告中的第k廣告, 確定所述第k廣告分別與所述X個(gè)廣告中除所述第k廣告之外的其它廣告之間的相似 度; 根據(jù)所述第k廣告分別與所述X個(gè)廣告中除所述第k廣告之外的其它廣告之間的相似 度,確定在所述X個(gè)廣告中所述第k廣告對(duì)應(yīng)的相似性排名和所述第k廣告對(duì)應(yīng)的不相似 性排名; 對(duì)所述第k廣告對(duì)應(yīng)的相似性排名和所述第k廣告對(duì)應(yīng)的不相似性排名進(jìn)行加權(quán),以 得到所述第k廣告對(duì)應(yīng)的新穎性因子; 其中,k為取值從1至X的正整數(shù)。
15. 根據(jù)權(quán)利要求10所述的廣告推薦服務(wù)器,其特征在于,在確定所述X個(gè)廣告分別對(duì) 應(yīng)的新穎性因子的方面,所述確定單元,具體用于: 對(duì)于所述X個(gè)廣告中的第k廣告, 確定所述第k廣告分別與所述X個(gè)廣告中除所述第k廣告之外的其它廣告之間的多樣 性距離; 根據(jù)所述第k廣告分別與所述X個(gè)廣告中除所述第k廣告之外的其它廣告之間的多樣 性距離,確定所述第k廣告對(duì)應(yīng)的新穎性因子; 其中,k為取值從1至X的正整數(shù)。
16. 根據(jù)權(quán)利要求10至15中任一項(xiàng)所述的廣告推薦服務(wù)器,其特征在于,所述選擇單 元,具體用于: 對(duì)所述X個(gè)廣告中每個(gè)廣告對(duì)應(yīng)的點(diǎn)擊概率和所述每個(gè)廣告對(duì)應(yīng)的新穎性因子進(jìn)行 加權(quán),確定所述X個(gè)廣告分別對(duì)應(yīng)的評(píng)分; 按照所述X個(gè)廣告對(duì)應(yīng)的評(píng)分從大到小的順序,對(duì)所述X個(gè)廣告進(jìn)行排序,得到排序后 的X個(gè)廣告; 將所述排序后的X個(gè)廣告中的前P個(gè)廣告確定為待向所述第i用戶推薦的P個(gè)廣告。
17. 根據(jù)權(quán)利要求10至15中任一項(xiàng)所述的廣告推薦服務(wù)器,其特征在于,所述選擇單 元,具體用于: 按照點(diǎn)擊概率從大到小的順序,對(duì)所述X個(gè)廣告進(jìn)行排序,得到排序后的X個(gè)廣告; 按照新穎性因子從大到小的順序,對(duì)所述排序后的X個(gè)廣告中的前q個(gè)廣告進(jìn)行排序, 得到重新排序后的q個(gè)廣告,其中q為正整數(shù)且q大于P ; 將所述重新排序后的q個(gè)廣告中的前P個(gè)廣告確定為待向所述第i用戶推薦的P個(gè)廣 生 1=1 〇
18. 根據(jù)權(quán)利要求10至17中任一項(xiàng)所述的廣告推薦服務(wù)器,其特征在于,所述預(yù)測(cè)單 元,具體用于: 根據(jù)所述網(wǎng)頁訪問信息和所述廣告點(diǎn)擊信息,生成用戶-網(wǎng)頁訪問矩陣、用戶-廣告點(diǎn) 擊矩陣和廣告-網(wǎng)頁關(guān)聯(lián)度矩陣,其中,所述用戶-網(wǎng)頁訪問矩陣的第i行第j列對(duì)象表示 所述第i用戶對(duì)所述第j網(wǎng)頁的訪問記錄,所述用戶-廣告點(diǎn)擊矩陣的第i行第k列對(duì)象 表示所述第i用戶對(duì)第k廣告的點(diǎn)擊記錄,所述廣告-網(wǎng)頁關(guān)聯(lián)度矩陣的第j行第k列對(duì) 象表示所述第j網(wǎng)頁與所述第k廣告之間的關(guān)聯(lián)度,k為取值從1至X的正整數(shù); 對(duì)所述用戶-網(wǎng)頁訪問矩陣、所述用戶-廣告點(diǎn)擊矩陣和所述廣告-網(wǎng)頁關(guān)聯(lián)度矩陣 進(jìn)行聯(lián)合概率矩陣分解,得到所述第i用戶的用戶隱含特征向量、所述第j網(wǎng)頁的網(wǎng)頁隱含 特征向量和所述第k廣告的廣告隱含特征向量; 根據(jù)所述第i用戶的用戶隱含特征向量、所述第j網(wǎng)頁的網(wǎng)頁隱含特征向量和所述第 k廣告的廣告隱含特征向量,確定所述第i用戶訪問所述第j網(wǎng)頁時(shí)所述第k廣告的點(diǎn)擊概 率。
【文檔編號(hào)】G06Q30/02GK104090919SQ201410268560
【公開日】2014年10月8日 申請(qǐng)日期:2014年6月16日 優(yōu)先權(quán)日:2014年6月16日
【發(fā)明者】涂丹丹, 張勇 申請(qǐng)人:華為技術(shù)有限公司