交叉特征 標(biāo)識。
[0152] 具體地,將各個歷史投放廣告的多種特征類型中的兩種或兩種以上的特征相關(guān)信 息進(jìn)行交叉組合來確定多個交叉特征集,隨后,通過如哈希算法等方式,計算確定各個交叉 特征集分別對應(yīng)的具有唯一性的數(shù)值,將該數(shù)值作為交叉特征標(biāo)識,如交叉特征ID。
[0153] 例如,接上例,針對一個歷史投放廣告,將與其相關(guān)的投放用戶的用戶ID、用戶性 另IJ,投放上下文的終端設(shè)備的操作系統(tǒng)信息、投放應(yīng)用的APP_ID進(jìn)行交叉組合,來確定多 個交叉特征集,如上述表1所示,每一行代表一個交叉特征集;隨后,將交叉特征集中的各 個特征相關(guān)信息均用數(shù)值表達(dá)方式來表征,通過哈希算法計算確定各個交叉特征集分別對 應(yīng)的具有唯一性的數(shù)值,將該數(shù)值作為交叉特征ID。
[0154] 特征值計算模塊S430提取在預(yù)定歷史時間段內(nèi)各個交叉特征集對應(yīng)的廣告展現(xiàn) 量及廣告點(diǎn)擊量,并計算確定各個交叉特征集對應(yīng)的廣告點(diǎn)擊率以作為交叉特征值。
[0155] 具體地,針對一個歷史投放廣告,提取在預(yù)定歷史時間段內(nèi)每個交叉特征集中的 特征相關(guān)信息均出現(xiàn)的情況下對應(yīng)的廣告展現(xiàn)量及廣告點(diǎn)擊量,隨后,計算廣告展現(xiàn)量及 廣告點(diǎn)擊量的比值來確定各個交叉特征集對應(yīng)的廣告點(diǎn)擊率以作為交叉特征值。
[0156] 例如,如上述表2所示,針對歷史投放廣告ADl,提取在過去三個月內(nèi)在用戶ID、用 戶性別、操作系統(tǒng)信息及APP_ID同時出現(xiàn)的情況下確定的交叉特征集對應(yīng)的廣告展現(xiàn)量 及廣告點(diǎn)擊量,隨后,通過上述公式1)來計算確定交叉特征值。
[0157] 優(yōu)選地,該裝置還包括判斷模塊;判斷模塊判斷各個交叉特征集對應(yīng)的廣告展現(xiàn) 量和/或廣告點(diǎn)擊量是否符合再處理?xiàng)l件;當(dāng)交叉特征集對應(yīng)的廣告展現(xiàn)量和/或廣告點(diǎn) 擊量符合再處理?xiàng)l件時,特征值計算模塊S330對該交叉特征集對應(yīng)的廣告展現(xiàn)量及廣告 點(diǎn)擊量進(jìn)行貝葉斯平滑計算處理,以確定該交叉特征集對應(yīng)的廣告點(diǎn)擊率以作為交叉特征 值。
[0158] 其中,再處理?xiàng)l件包括以下任一情形:
[0159] 交叉特征集對應(yīng)的廣告展現(xiàn)量小于預(yù)定展現(xiàn)量閾值;
[0160] 交叉特征集對應(yīng)的廣告點(diǎn)擊量小于預(yù)定點(diǎn)擊量閾值;
[0161] 交叉特征集對應(yīng)的廣告展現(xiàn)量與廣告點(diǎn)擊量的比值小于預(yù)定點(diǎn)擊率閾值。
[0162] 具體地,判斷提取到的各個交叉特征集對應(yīng)的廣告展現(xiàn)量和/或廣告點(diǎn)擊量是否 符合再處理?xiàng)l件,當(dāng)交叉特征集對應(yīng)的廣告展現(xiàn)量小于預(yù)定展現(xiàn)量閾值時,或當(dāng)交叉特征 集對應(yīng)的廣告點(diǎn)擊量小于預(yù)定點(diǎn)擊量閾值時,或當(dāng)交叉特征集對應(yīng)的廣告展現(xiàn)量與廣告點(diǎn) 擊量的比值小于預(yù)定點(diǎn)擊率閾值時,通過上述公式2)
[0163] 對該交叉特征集對應(yīng)的廣告展現(xiàn)量及廣告點(diǎn)擊量進(jìn)行貝葉斯平滑計算處理,以確 定該交叉特征集對應(yīng)的廣告點(diǎn)擊率以作為交叉特征值。
[0164] 例如,當(dāng)交叉特征集對應(yīng)的廣告展現(xiàn)量為1次,小于預(yù)定展現(xiàn)量閾值500次時,且 廣告點(diǎn)擊量為1次,小于預(yù)定點(diǎn)擊量閾值10次時,對該交叉特征集對應(yīng)的廣告展現(xiàn)量及廣 告點(diǎn)擊量通過公式2)進(jìn)行貝葉斯平滑計算處理,以確定該交叉特征集對應(yīng)的廣告點(diǎn)擊率 以作為交叉特征值。
[0165] 本優(yōu)選實(shí)施例中,通過采用貝葉斯平滑計算的方式對廣告點(diǎn)擊率進(jìn)行優(yōu)化,以避 免在廣告投放中展現(xiàn)量過低或點(diǎn)擊率過低等特殊情形給計算獲得的廣告點(diǎn)擊率帶來的數(shù) 據(jù)不準(zhǔn)確性問題,由于平滑處理后的廣告點(diǎn)擊率更加接近實(shí)際值,可保證后續(xù)對邏輯回歸 模型進(jìn)行訓(xùn)練時輸入更加準(zhǔn)確的訓(xùn)練數(shù)據(jù)。
[0166] 訓(xùn)練模塊S440基于多個交叉特征集分別對應(yīng)的交叉特征標(biāo)識及交叉特征值,對 邏輯回歸模型進(jìn)行訓(xùn)練,以計算確定模型訓(xùn)練參數(shù)。
[0167] 具體地,基于多個交叉特征集分別對應(yīng)的交叉特征標(biāo)識及交叉特征值,即交叉特 征ID-CTR的數(shù)據(jù)對應(yīng)關(guān)系,組裝形成用于訓(xùn)練及測試邏輯回歸模型的訓(xùn)練樣例和測試樣 例,對邏輯回歸模型進(jìn)行訓(xùn)練,并解析計算確定模型訓(xùn)練參數(shù)。
[0168] 第一預(yù)測計算模塊S450基于模型訓(xùn)練參數(shù)對多個待預(yù)測廣告進(jìn)行廣告點(diǎn)擊率的 預(yù)測計算。
[0169] 第一預(yù)測計算模塊S450具體包括實(shí)時特征獲取單元(圖中未示出)和點(diǎn)擊率預(yù) 測單元(圖中未示出);實(shí)時特征獲取單元獲取各個待預(yù)測廣告實(shí)時投放時的至少兩種特 征類型的特征相關(guān)信息進(jìn)行交叉組合后對應(yīng)的交叉特征集的交叉特征標(biāo)識;點(diǎn)擊率預(yù)測單 元基于模型訓(xùn)練參數(shù)與待預(yù)測廣告的交叉特征標(biāo)識,進(jìn)行預(yù)測計算以確定待預(yù)測廣告的廣 告點(diǎn)擊率。
[0170] 具體地,獲取各個待預(yù)測廣告實(shí)時投放時的至少兩種特征類型的特征相關(guān)信息進(jìn) 行交叉組合后對應(yīng)的交叉特征集,并計算交叉特征及對應(yīng)交叉特征標(biāo)識,如交叉特征ID ; 隨后,計算模型訓(xùn)練參數(shù)與待預(yù)測廣告的交叉特征ID的乘積以作為待預(yù)測廣告的預(yù)測計 算后的廣告點(diǎn)擊率。
[0171] 在本優(yōu)選實(shí)施例中,模型訓(xùn)練參數(shù)直接影響預(yù)測計算結(jié)果,模型訓(xùn)練參數(shù)越高則 預(yù)測計算后的廣告點(diǎn)擊率越高,即可認(rèn)為待預(yù)測廣告被點(diǎn)擊的可能性越高,預(yù)測計算后的 廣告點(diǎn)擊率可作為對待預(yù)測廣告的評價標(biāo)準(zhǔn),為后續(xù)對廣告的篩選提供可靠依據(jù)。
[0172] 本發(fā)明的技術(shù)方案中,提出了一種對廣告點(diǎn)擊率進(jìn)行預(yù)測的方案,在對廣告點(diǎn)擊 率進(jìn)行預(yù)測的前期數(shù)據(jù)準(zhǔn)備過程中,對歷史投放廣告的多種特征信息進(jìn)行交叉,使得交叉 組合后的交叉特征更加豐富有效,能夠更加準(zhǔn)確地反應(yīng)廣告投放的實(shí)際投放情形,從而為 廣告的預(yù)測計算提供了更加有效可靠的訓(xùn)練數(shù)據(jù),避免了現(xiàn)有技術(shù)中僅使用單個特征的不 準(zhǔn)確性;同時,根據(jù)準(zhǔn)確性較高的訓(xùn)練數(shù)據(jù)得到的模型訓(xùn)練參數(shù)可進(jìn)一步保證廣告點(diǎn)擊率 的預(yù)測計算結(jié)果的準(zhǔn)確性,從而為后續(xù)根據(jù)廣告點(diǎn)擊率對廣告進(jìn)行篩選提供了可靠依據(jù)。
[0173] 在一個優(yōu)選實(shí)施例中,該裝置還包括第一篩選模塊(圖中未示出);第一篩選模塊 根據(jù)預(yù)測計算結(jié)果,篩選多個待預(yù)測廣告。
[0174] 具體地,將預(yù)測計算后得的到的多個待預(yù)測廣告的廣告點(diǎn)擊率與預(yù)定的預(yù)測點(diǎn)擊 率閾值進(jìn)行比較,當(dāng)預(yù)測得到的廣告點(diǎn)擊率小于預(yù)定的預(yù)測點(diǎn)擊率閾值時,濾除相應(yīng)的待 預(yù)測廣告;或?qū)㈩A(yù)測計算后得到的多個待預(yù)測廣告的廣告點(diǎn)擊率進(jìn)行排序,隨后,濾除排序 靠后預(yù)定個數(shù)的待預(yù)測廣告。
[0175] 本優(yōu)選實(shí)施例中,預(yù)測計算后得到的廣告點(diǎn)擊率可在很大程度上反應(yīng)廣告的投放 效果,基于預(yù)測計算后的廣告點(diǎn)擊率進(jìn)行廣告的篩選過濾,可為廣告投放方和展現(xiàn)方提供 可靠的廣告投放參考依據(jù)。
[0176] 圖5為本發(fā)明中另一個實(shí)施例的根據(jù)廣告點(diǎn)擊率的預(yù)測計算結(jié)果進(jìn)行應(yīng)用推薦 的裝置的結(jié)構(gòu)示意圖。
[0177] 相關(guān)信息獲取模塊510獲取與目標(biāo)用戶相關(guān)的特征相關(guān)信息;特征交叉模塊520 將目標(biāo)用戶相關(guān)的特征相關(guān)信息與多個待推薦廣告分別進(jìn)行交叉組合來確定多個交叉特 征集,并計算確定該多個交叉特征集對應(yīng)的交叉特征標(biāo)識;第二預(yù)測計算模塊530基于預(yù) 先訓(xùn)練得到模型訓(xùn)練參數(shù)與多個待推薦廣告的交叉特征標(biāo)識,進(jìn)行預(yù)測計算以確定多個待 推薦廣告的廣告點(diǎn)擊率;第二篩選模塊540根據(jù)預(yù)測計算得到的廣告點(diǎn)擊率對多個待推薦 廣告進(jìn)行篩選;推薦模塊550將篩選出的一個或多個待推薦廣告推薦給目標(biāo)用戶。
[0178] 其中,與目標(biāo)用戶相關(guān)的特征相關(guān)信息,具體包括:
[0179] 屬于投放用戶的特征相關(guān)信息;
[0180] 或?qū)儆谕斗派舷挛牡奶卣飨嚓P(guān)信息。
[0181] 在一個優(yōu)選實(shí)施例中,本發(fā)明提供了一種根據(jù)廣告點(diǎn)擊率的預(yù)測計算結(jié)果進(jìn)行應(yīng) 用推薦的終端設(shè)備,包括:
[0182] 用于獲取與目標(biāo)用戶相關(guān)的特征相關(guān)信息的裝置;用于將目標(biāo)用戶相關(guān)的特征相 關(guān)信息與多個待推薦廣告分別進(jìn)行交叉組合來確定多個交叉特征集,并計算確定該多個交 叉特征集對應(yīng)的交叉特征標(biāo)識的裝置;用于基于預(yù)先訓(xùn)練得到模型訓(xùn)練參數(shù)與多個待推薦 廣告的交叉特征標(biāo)識,進(jìn)行預(yù)測計算以確定多個待推薦廣告的廣告點(diǎn)擊率的裝置;用于根 據(jù)預(yù)測計算得到的廣告點(diǎn)擊率對多個待推薦廣告進(jìn)行篩選的裝置;用于將篩選出的一個或 多個待推薦廣告推薦給目標(biāo)用戶的裝置。
[0183] 本技術(shù)領(lǐng)域技術(shù)人員可以理解,本發(fā)明包括涉及用于執(zhí)行本申請中所述操作中的 一項(xiàng)或多項(xiàng)的設(shè)備。這些設(shè)備可以為所需的目的而專門設(shè)計和制造,或者也可以包括通用 計算機(jī)中的已知設(shè)備。這些設(shè)備具有存儲在其內(nèi)的計算機(jī)程序,這些計算機(jī)程序選擇性地 激活或重構(gòu)。這樣的計算機(jī)程序可以被存儲在設(shè)備(例如,計算機(jī))可讀介質(zhì)中或者存儲 在適于存儲電子指令并分別耦