一種推送信息點擊率估計方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種推送信息點擊率估計方法和裝 置。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)的快速發(fā)展,信息推薦系統(tǒng)在互聯(lián)網(wǎng)技術(shù)領(lǐng)域得到了廣泛的使用,如 在電商,視頻,文學(xué)等互聯(lián)網(wǎng)服務(wù)當(dāng)中?,F(xiàn)有的信息推薦系統(tǒng),主要考慮用戶與用戶之間,或 推送對象與推送對象之間的相似程度,即給用戶推薦與他相似的用戶評價高或點擊過的推 送對象,或推薦用戶看過的推送對象的近似對象。在推薦系統(tǒng)的應(yīng)用中,針對新的用戶,或 新的推送對象或初始化的推薦系統(tǒng),由于缺乏用戶的歷史行為數(shù)據(jù),而造成的問題叫做冷 啟動問題。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明實施例所要解決的技術(shù)問題在于,提供一種推送信息點擊率估計方法和裝 置,可有效解決信息推薦系統(tǒng)的冷啟動問題。
[0004] 為了解決上述技術(shù)問題,本發(fā)明實施例提供了一種推送信息點擊率估計方法,所 述方法包括:
[0005] 獲取信息點擊行為數(shù)據(jù),所述信息點擊行為數(shù)據(jù)包括多個用戶分別對被推送至該 多個用戶的推送信息的點擊行為記錄和不點擊行為記錄;
[0006] 根據(jù)所述多個用戶中各個用戶的多維用戶特征,以及所述被推送至該多個用戶的 推送信息中各個推送信息的多維信息特征,對所述信息點擊行為數(shù)據(jù)進(jìn)行分解得到訓(xùn)練語 料,所述訓(xùn)練語料包括各個用戶特征分別對各個信息特征的點擊行為記錄和不點擊行為記 錄;
[0007] 對任意某個用戶特征對任意某個信息特征的點擊率建立二分類算法模型,并根據(jù) 所述訓(xùn)練語料對所述二分類算法模型進(jìn)行參數(shù)優(yōu)化,得到最逼近所述信息點擊行為數(shù)據(jù)的 點擊率算法模型;
[0008] 根據(jù)經(jīng)過參數(shù)優(yōu)化得到的所述點擊率算法模型,計算目標(biāo)推送信息相對于目標(biāo)用 戶的點擊率。
[0009 ]相應(yīng)地,本發(fā)明實施例還提供了一種推送信息點擊率估計裝置,所述裝置包括: [0010]點擊數(shù)據(jù)獲取模塊,用于獲取信息點擊行為數(shù)據(jù),所述信息點擊行為數(shù)據(jù)包括多 個用戶分別對被推送至該多個用戶的推送信息的點擊行為記錄和不點擊行為記錄;
[0011]訓(xùn)練語料獲取模塊,用于根據(jù)所述多個用戶中各個用戶的多維用戶特征,以及所 述被推送至該多個用戶的推送信息中各個推送信息的多維信息特征,對所述信息點擊行為 數(shù)據(jù)進(jìn)行分解得到訓(xùn)練語料,所述訓(xùn)練語料包括各個用戶特征分別對各個信息特征的點擊 行為記錄和不點擊行為記錄;
[0012]算法模型優(yōu)化模塊,用于對任意某個用戶特征對任意某個信息特征的點擊率建立 二分類算法模型,并根據(jù)所述訓(xùn)練語料對所述二分類算法模型進(jìn)行參數(shù)優(yōu)化,得到最逼近 所述信息點擊行為數(shù)據(jù)的點擊率算法模型;
[0013] 點擊率估計模塊,用于根據(jù)經(jīng)過參數(shù)優(yōu)化得到的所述點擊率算法模型,計算目標(biāo) 推送信息相對于目標(biāo)用戶的點擊率。
[0014] 本發(fā)明實施例通過將已有的信息點擊行為數(shù)據(jù)分解為多個維度的用戶特征對多 個維度的信息特征之間的點擊行為記錄,進(jìn)而基于用戶特征與信息特征之間的點擊行為作 為訓(xùn)練語料進(jìn)行二分類算法模型優(yōu)化,能夠充分理由已有的點擊行為數(shù)據(jù),能夠?qū)崿F(xiàn)根據(jù) 非常少的點擊行為記錄得到較為準(zhǔn)確的點擊率估算模型,同時對于新用戶或新生成的推送 信息,依然可以根據(jù)其自身的用戶特征或信息特征估算出點擊率,可以很好的解決推薦系 統(tǒng)冷啟動的問題。
【附圖說明】
[0015] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。
[0016] 圖1是本發(fā)明實施例中的一種推送信息點擊率估計方法的流程示意圖;
[0017] 圖2是本發(fā)明實施例中對信息點擊行為數(shù)據(jù)進(jìn)行分解得到訓(xùn)練語料的示意圖;
[0018] 圖3是本發(fā)明實施例中的一種推送信息點擊率估計裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0019] 下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;?本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護的范圍。
[0020] 本發(fā)明實施例中的推送信息點擊率估計方法和裝置,可以實現(xiàn)在馮若依曼體系的 計算機系統(tǒng)之上。例如可以以計算機程序的形式運行,該計算機程序可集成在應(yīng)用中,也可 作為獨立的工具類應(yīng)用運行。該計算機系統(tǒng)可以是個人電腦、平板電腦、筆記本電腦、掌上 電腦、智能手機等具有觸控功能的終端設(shè)備,也可以以互聯(lián)網(wǎng)后臺服務(wù)器的形式實施,例如 網(wǎng)絡(luò)搜索服務(wù)器。
[0021] 圖1是本發(fā)明實施例中的一種推送信息點擊率估計方法的流程示意圖,如圖所示 本實施例中的推送信息點擊率估計方法可以包括以下流程:
[0022] S101,獲取信息點擊行為數(shù)據(jù),所述信息點擊行為數(shù)據(jù)包括多個用戶分別對被推 送至該多個用戶的推送信息的點擊行為記錄和不點擊行為記錄。
[0023] 具體實現(xiàn)中,所述信息點擊行為數(shù)據(jù),可以為通過指定推送信息集合推送至指定 用戶集合后,將該用戶集合中對該指定推送集合的點擊行為匯總得到的,例如指定用戶集 合包括用戶A、用戶B、用戶C,推送信息集合包括信息a、信息b、信息c以及信息d,那么得到的 信息點擊行為數(shù)據(jù)可以包括該用戶集合中各個用戶在接收到推送信息集合中的信息后,是 否點擊了各個信息的行為記錄,比如將點擊描述為1,不點擊描述為〇,那么用戶A的點擊行 為數(shù)據(jù)就可以描述為(1,0,1,0)表示其點擊了信息a和信息c,未點擊信息b和信息d,以此類 推。
[0024] S102,根據(jù)所述多個用戶中各個用戶的多維用戶特征,以及所述被推送至該多個 用戶的推送信息中各個推送信息的多維信息特征,對所述信息點擊行為數(shù)據(jù)進(jìn)行分解得到 訓(xùn)練語料,所述訓(xùn)練語料包括各個用戶特征分別對各個信息特征的點擊行為記錄和不點擊 行為記錄。
[0025] 具體的,例如圖2所示的分解過程,所述用戶特征可以包括用戶的基礎(chǔ)屬性特征, 例如包括年齡、性別、所在地等,還可以包括用戶的興趣特征,如愛好聽歌、旅游等,本發(fā)明 實施例中將所有用戶均按照相同的h維用戶特征進(jìn)行描述,若某個用戶缺少某項特征信息 則可以缺省處理;同理的,本發(fā)明實施例將所有推送信息均按照相同的i維信息特征進(jìn)行描 述,例如推送的信息涉及的商品的商品類型或標(biāo)題分詞特征,此外在可選實施例中還可以 包括是否商品廣告、商品/服務(wù)類型等維度的特征。根據(jù)所述多個用戶中各個用戶的h維用 戶特征,以及所述被推送至該多個用戶的推送信息中各個推送信息的i維信息特征,對所述 信息點擊行為數(shù)據(jù)進(jìn)行分解得到訓(xùn)練語料,即每一條用戶對接收到的推送信息的點擊與否 的記錄,均可以分解得到該用戶的h個用戶特征分別對該推送信息的i個信息特征的點擊與 否的記錄,以便后續(xù)作為算法模型的訓(xùn)練語料。在可選實施例中,如圖2所示,可以將用戶特 征集合與商品特征集合之間進(jìn)行笛卡爾內(nèi)積,進(jìn)而根據(jù)點擊與否的記錄對每個內(nèi)積進(jìn)行賦 值,即可得到代表各個用戶特征對各個信息特征的點擊與否的訓(xùn)練語料數(shù)據(jù)。
[0026] S103,對任意某個用戶特征對任意某個信息特征的點擊率建立二分類算法模型, 并根據(jù)所述訓(xùn)練語料對所述二分類算法模型進(jìn)行參數(shù)優(yōu)化,得到最逼近所述信息點擊行為 數(shù)據(jù)的點擊率算法模型。
[0027] 具體實現(xiàn)中,可以根據(jù)某個信息特征的全局點擊率、某個用戶特征的全局點擊率 以及該信息特征與該用戶特征之間的相關(guān)度,建立代表該用戶特征對該信息特征的點擊率 的二分類算法模型。其中,所述信息特征與用戶特征之