再處理?xiàng)l件;當(dāng)交叉特征集對(duì)應(yīng)的廣告展現(xiàn) 量和/或廣告點(diǎn)擊量符合再處理?xiàng)l件時(shí),步驟S130 :對(duì)該交叉特征集對(duì)應(yīng)的廣告展現(xiàn)量及 廣告點(diǎn)擊量進(jìn)行貝葉斯平滑計(jì)算處理,以確定該交叉特征集對(duì)應(yīng)的廣告點(diǎn)擊率以作為交叉 特征值。
[0111] 其中,再處理?xiàng)l件包括以下任一情形:
[0112] 交叉特征集對(duì)應(yīng)的廣告展現(xiàn)量小于預(yù)定展現(xiàn)量閾值;
[0113] 交叉特征集對(duì)應(yīng)的廣告點(diǎn)擊量小于預(yù)定點(diǎn)擊量閾值;
[0114] 交叉特征集對(duì)應(yīng)的廣告展現(xiàn)量與廣告點(diǎn)擊量的比值小于預(yù)定點(diǎn)擊率閾值。
[0115] 具體地,判斷提取到的各個(gè)交叉特征集對(duì)應(yīng)的廣告展現(xiàn)量和/或廣告點(diǎn)擊量是否 符合再處理?xiàng)l件,當(dāng)交叉特征集對(duì)應(yīng)的廣告展現(xiàn)量小于預(yù)定展現(xiàn)量閾值時(shí),或當(dāng)交叉特征 集對(duì)應(yīng)的廣告點(diǎn)擊量小于預(yù)定點(diǎn)擊量閾值時(shí),或當(dāng)交叉特征集對(duì)應(yīng)的廣告展現(xiàn)量與廣告點(diǎn) 擊量的比值小于預(yù)定點(diǎn)擊率閾值時(shí),通過(guò)以下公式2):
[0116] CTR= (Click+a )/(PV+a+β )公式 2)
[0117] 其中,CTR代表交叉特征值,PV代表廣告展現(xiàn)量,Click代表廣告點(diǎn)擊量,α和β 為調(diào)節(jié)參數(shù);
[0118] 對(duì)該交叉特征集對(duì)應(yīng)的廣告展現(xiàn)量及廣告點(diǎn)擊量進(jìn)行貝葉斯平滑計(jì)算處理,以確 定該交叉特征集對(duì)應(yīng)的廣告點(diǎn)擊率以作為交叉特征值。
[0119] 例如,當(dāng)交叉特征集對(duì)應(yīng)的廣告展現(xiàn)量為1次,小于預(yù)定展現(xiàn)量閾值500次時(shí),且 廣告點(diǎn)擊量為1次,小于預(yù)定點(diǎn)擊量閾值10次時(shí),對(duì)該交叉特征集對(duì)應(yīng)的廣告展現(xiàn)量及廣 告點(diǎn)擊量通過(guò)公式2)進(jìn)行貝葉斯平滑計(jì)算處理,以確定該交叉特征集對(duì)應(yīng)的廣告點(diǎn)擊率 以作為交叉特征值。
[0120] 本優(yōu)選實(shí)施例中,通過(guò)采用貝葉斯平滑計(jì)算的方式對(duì)廣告點(diǎn)擊率進(jìn)行優(yōu)化,以避 免在廣告投放中展現(xiàn)量過(guò)低或點(diǎn)擊率過(guò)低等特殊情形給計(jì)算獲得的廣告點(diǎn)擊率帶來(lái)的數(shù) 據(jù)不準(zhǔn)確性問(wèn)題,由于平滑處理后的廣告點(diǎn)擊率更加接近實(shí)際值,可保證后續(xù)對(duì)邏輯回歸 模型進(jìn)行訓(xùn)練時(shí)輸入更加準(zhǔn)確的訓(xùn)練數(shù)據(jù)。
[0121] 步驟S140 :基于多個(gè)交叉特征集分別對(duì)應(yīng)的交叉特征標(biāo)識(shí)及交叉特征值,對(duì)邏輯 回歸模型進(jìn)行訓(xùn)練,以計(jì)算確定模型訓(xùn)練參數(shù)。
[0122] 具體地,基于多個(gè)交叉特征集分別對(duì)應(yīng)的交叉特征標(biāo)識(shí)及交叉特征值,即交叉特 征ID-CTR的數(shù)據(jù)對(duì)應(yīng)關(guān)系,組裝形成用于訓(xùn)練及測(cè)試邏輯回歸模型的訓(xùn)練樣例和測(cè)試樣 例,對(duì)邏輯回歸模型進(jìn)行訓(xùn)練,并解析計(jì)算確定模型訓(xùn)練參數(shù)。
[0123] 步驟S150 :基于模型訓(xùn)練參數(shù)對(duì)多個(gè)待預(yù)測(cè)廣告進(jìn)行廣告點(diǎn)擊率的預(yù)測(cè)計(jì)算。
[0124] 如圖2所示,步驟S150具體包括步驟S151和步驟S152 ;步驟S151 :獲取各個(gè)待預(yù) 測(cè)廣告實(shí)時(shí)投放時(shí)的至少兩種特征類型的特征相關(guān)信息進(jìn)行交叉組合后對(duì)應(yīng)的交叉特征 集的交叉特征標(biāo)識(shí);步驟S152 :基于模型訓(xùn)練參數(shù)與待預(yù)測(cè)廣告的交叉特征標(biāo)識(shí),進(jìn)行預(yù) 測(cè)計(jì)算以確定待預(yù)測(cè)廣告的廣告點(diǎn)擊率。
[0125] 具體地,獲取各個(gè)待預(yù)測(cè)廣告實(shí)時(shí)投放時(shí)的至少兩種特征類型的特征相關(guān)信息進(jìn) 行交叉組合后對(duì)應(yīng)的交叉特征集,并計(jì)算交叉特征及對(duì)應(yīng)交叉特征標(biāo)識(shí),如交叉特征ID ; 隨后,計(jì)算模型訓(xùn)練參數(shù)與待預(yù)測(cè)廣告的交叉特征ID的乘積以作為待預(yù)測(cè)廣告的預(yù)測(cè)計(jì) 算后的廣告點(diǎn)擊率。
[0126] 在本優(yōu)選實(shí)施例中,模型訓(xùn)練參數(shù)直接影響預(yù)測(cè)計(jì)算結(jié)果,模型訓(xùn)練參數(shù)越高則 預(yù)測(cè)計(jì)算后的廣告點(diǎn)擊率越高,即可認(rèn)為待預(yù)測(cè)廣告被點(diǎn)擊的可能性越高,預(yù)測(cè)計(jì)算后的 廣告點(diǎn)擊率可作為對(duì)待預(yù)測(cè)廣告的評(píng)價(jià)標(biāo)準(zhǔn),為后續(xù)對(duì)廣告的篩選提供可靠依據(jù)。
[0127] 在一個(gè)優(yōu)選實(shí)施例中,該方法還包括步驟Sl70 (圖中未示出);步驟Sl70 :根據(jù)預(yù) 測(cè)計(jì)算結(jié)果,篩選多個(gè)待預(yù)測(cè)廣告。
[0128] 具體地,將預(yù)測(cè)計(jì)算后得到的多個(gè)待預(yù)測(cè)廣告的廣告點(diǎn)擊率與預(yù)定的預(yù)測(cè)點(diǎn)擊率 閾值進(jìn)行比較,當(dāng)預(yù)測(cè)得到的廣告點(diǎn)擊率小于預(yù)定的預(yù)測(cè)點(diǎn)擊率閾值時(shí),濾除相應(yīng)的待預(yù) 測(cè)廣告;或?qū)㈩A(yù)測(cè)計(jì)算后得到的多個(gè)待預(yù)測(cè)廣告的廣告點(diǎn)擊率進(jìn)行排序,隨后,濾除排序靠 后預(yù)定個(gè)數(shù)的待預(yù)測(cè)廣告。
[0129] 本優(yōu)選實(shí)施例中,預(yù)測(cè)計(jì)算后得到的廣告點(diǎn)擊率可在很大程度上反應(yīng)廣告的投放 效果,基于預(yù)測(cè)計(jì)算后的廣告點(diǎn)擊率進(jìn)行廣告的篩選過(guò)濾,可為廣告投放方和展現(xiàn)方提供 可靠的廣告投放參考依據(jù)。
[0130] 本發(fā)明的技術(shù)方案中,提出了一種對(duì)廣告點(diǎn)擊率進(jìn)行預(yù)測(cè)的方案,在對(duì)廣告點(diǎn)擊 率進(jìn)行預(yù)測(cè)的前期數(shù)據(jù)準(zhǔn)備過(guò)程中,對(duì)歷史投放廣告的多種特征信息進(jìn)行交叉,使得交叉 組合后的交叉特征更加豐富有效,能夠更加準(zhǔn)確地反應(yīng)廣告投放的實(shí)際投放情形,從而為 廣告的預(yù)測(cè)計(jì)算提供了更加有效可靠的訓(xùn)練數(shù)據(jù),避免了現(xiàn)有技術(shù)中僅使用單個(gè)特征的不 準(zhǔn)確性;同時(shí),根據(jù)準(zhǔn)確性較高的訓(xùn)練數(shù)據(jù)得到的模型訓(xùn)練參數(shù)可進(jìn)一步保證廣告點(diǎn)擊率 的預(yù)測(cè)計(jì)算結(jié)果的準(zhǔn)確性,從而為后續(xù)根據(jù)廣告點(diǎn)擊率對(duì)廣告進(jìn)行篩選提供了可靠依據(jù)。
[0131] 圖3為本發(fā)明中一個(gè)實(shí)施例的根據(jù)廣告點(diǎn)擊率的預(yù)測(cè)計(jì)算結(jié)果進(jìn)行應(yīng)用推薦的 方法的流程圖。
[0132] 步驟S310 :獲取與目標(biāo)用戶相關(guān)的特征相關(guān)信息;步驟S320 :將目標(biāo)用戶相關(guān)的 特征相關(guān)信息與多個(gè)待推薦廣告分別進(jìn)行交叉組合來(lái)確定多個(gè)交叉特征集,并計(jì)算確定該 多個(gè)交叉特征集對(duì)應(yīng)的交叉特征標(biāo)識(shí);步驟S330 :基于預(yù)先訓(xùn)練得到模型訓(xùn)練參數(shù)與多 個(gè)待推薦廣告的交叉特征標(biāo)識(shí),進(jìn)行預(yù)測(cè)計(jì)算以確定多個(gè)待推薦廣告的廣告點(diǎn)擊率;步驟 S340 :根據(jù)預(yù)測(cè)計(jì)算得到的廣告點(diǎn)擊率對(duì)多個(gè)待推薦廣告進(jìn)行篩選;步驟S350 :將篩選出 的一個(gè)或多個(gè)待推薦廣告推薦給目標(biāo)用戶。
[0133] 其中,與目標(biāo)用戶相關(guān)的特征相關(guān)信息,具體包括:
[0134] 屬于投放用戶的特征相關(guān)信息;
[0135] 或?qū)儆谕斗派舷挛牡奶卣飨嚓P(guān)信息。
[0136] 圖4為本發(fā)明中一個(gè)實(shí)施例的對(duì)廣告點(diǎn)擊率進(jìn)行預(yù)測(cè)的裝置的結(jié)構(gòu)框架示意圖。
[0137] 特征獲取模塊S410獲取在預(yù)定歷史時(shí)間段內(nèi)與多個(gè)歷史投放廣告相關(guān)的多種特 征類型的特征相關(guān)信息;特征標(biāo)識(shí)計(jì)算模塊S420將各個(gè)歷史投放廣告的至少兩種特征類 型的特征相關(guān)信息進(jìn)行交叉組合來(lái)確定多個(gè)交叉特征集,并計(jì)算確定多個(gè)交叉特征集分別 對(duì)應(yīng)的交叉特征標(biāo)識(shí);特征值計(jì)算模塊S430提取在預(yù)定歷史時(shí)間段內(nèi)各個(gè)交叉特征集對(duì) 應(yīng)的廣告展現(xiàn)量及廣告點(diǎn)擊量,并計(jì)算確定各個(gè)交叉特征集對(duì)應(yīng)的廣告點(diǎn)擊率以作為交叉 特征值;訓(xùn)練模塊S440基于多個(gè)交叉特征集分別對(duì)應(yīng)的交叉特征標(biāo)識(shí)及交叉特征值,對(duì)邏 輯回歸模型進(jìn)行訓(xùn)練,以計(jì)算確定模型訓(xùn)練參數(shù);第一預(yù)測(cè)計(jì)算模塊S450基于模型訓(xùn)練參 數(shù)對(duì)多個(gè)待預(yù)測(cè)廣告進(jìn)行廣告點(diǎn)擊率的預(yù)測(cè)計(jì)算。
[0138] 特征獲取模塊S410獲取在預(yù)定歷史時(shí)間段內(nèi)與多個(gè)歷史投放廣告相關(guān)的多種特 征類型的特征相關(guān)信息。
[0139] 其中,歷史投放廣告指在預(yù)定歷史時(shí)間段內(nèi)已進(jìn)行投放的廣告。
[0140] 其中,特征類型包括但不限于:投放用戶;投放上下文;歷史投放廣告。
[0141] 其中,投放用戶的特征相關(guān)信息包括但不限于:
[0142] 用戶屬性信息,例如,性別、年齡、教育程度、收入、職業(yè)信息等;
[0143] 用戶的歷史興趣信息,例如,用戶歷史點(diǎn)擊或?yàn)g覽的廣告信息、用戶歷史瀏覽的網(wǎng) 頁(yè)信息、用戶歷史的購(gòu)買(mǎi)信息;
[0144] 用戶的實(shí)時(shí)興趣信息,例如,用戶當(dāng)前瀏覽的網(wǎng)頁(yè)信息。
[0145] 其中,投放上下文的特征相關(guān)信息包括但不限于:
[0146] 終端設(shè)備相關(guān)信息,例如,終端設(shè)備的型號(hào)、操作系統(tǒng)類型、操作系統(tǒng)版本;
[0147] 網(wǎng)絡(luò)相關(guān)信息,例如,終端設(shè)備連接網(wǎng)絡(luò)的網(wǎng)絡(luò)運(yùn)營(yíng)商信息、網(wǎng)絡(luò)類型;
[0148] 地理位置信息,例如,終端設(shè)備的地理位置信息;
[0149] 廣告展現(xiàn)相關(guān)信息,例如,廣告尺寸信息、廣告投放位置。
[0150] 例如,針對(duì)多個(gè)歷史投放廣告,獲取在過(guò)去三個(gè)月內(nèi)的每個(gè)歷史投放廣告的用戶 屬性信息的特征相關(guān)信息、投放上下文的特征相關(guān)信息及歷史投放廣告的廣告標(biāo)識(shí)。例如, 針對(duì)一個(gè)歷史投放廣告,獲取與其相關(guān)的投放用戶的用戶ID、用戶性別,投放上下文的終端 設(shè)備的操作系統(tǒng)信息、投放應(yīng)用的APP_ID。
[0151] 特征標(biāo)識(shí)計(jì)算模塊S420將各個(gè)歷史投放廣告的至少兩種特征類型的特征相關(guān)信 息進(jìn)行交叉組合來(lái)確定多個(gè)交叉特征集,并計(jì)算確定多個(gè)交叉特征集分別對(duì)應(yīng)的