本發(fā)明屬于廣告競價(jià),更具體地,涉及一種廣告定價(jià)方法及系統(tǒng)。
背景技術(shù):
1、rtb廣告是網(wǎng)絡(luò)廣告的一種,rtb是“real?time?bidding”的縮寫,意思就是“實(shí)時(shí)競價(jià)”,即在每個(gè)廣告展示曝光的基礎(chǔ)上進(jìn)行實(shí)時(shí)競價(jià)的新興廣告類型。
2、具體來說,rtb廣告的競價(jià)過程主要包括四個(gè)步驟:第一步,ssp端(供應(yīng)方平臺(tái)端)向adx端(廣告交易平臺(tái)端)提供用戶id、廣告位信息和最低出價(jià)等;第二步,adx端邀請各個(gè)dsp端進(jìn)行報(bào)價(jià);第三步,各個(gè)dsp端通過對該用戶價(jià)值的分析決定是否出價(jià)和出多少價(jià);第四步,adx端在各個(gè)dsp端的廣告報(bào)價(jià)中選出最高廣告報(bào)價(jià),并在dsp端最高廣告報(bào)價(jià)的基礎(chǔ)上結(jié)合自身利潤確定最終返回給ssp端的廣告報(bào)價(jià)。
3、在上述rtb廣告的競價(jià)過程中,adx端返回給ssp端的廣告報(bào)價(jià)是決定rtb廣告最終能否成功交易的主要因素之一,若adx端返回給ssp端的廣告報(bào)價(jià)較高,即adx端的利潤設(shè)置得較高,則ssp端可能會(huì)拒絕交易,若adx端返回給ssp端的廣告報(bào)價(jià)較低,即adx端的利潤設(shè)置得較低,則將會(huì)造成adx端利益受損的情況。為此,現(xiàn)有adx端通常基于rtb廣告定價(jià)模型來為rtb廣告進(jìn)行定價(jià),以使自身利益與rtb廣告競價(jià)成功率之間達(dá)到平衡。
4、然而,現(xiàn)有的rtb廣告定價(jià)模型主要為基于歷史廣告投放數(shù)據(jù)建立的經(jīng)典統(tǒng)計(jì)學(xué)模型,面對越來越復(fù)雜的數(shù)據(jù)環(huán)境,基于統(tǒng)計(jì)學(xué)原理的rtb廣告定價(jià)模型因無法深度挖掘影響rtb廣告定價(jià)的各個(gè)因素與rtb廣告最終定價(jià)之間的非線性關(guān)系,而在一定程度上已無法滿足adx端對于廣告定價(jià)準(zhǔn)確性的要求。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于解決現(xiàn)有基于統(tǒng)計(jì)學(xué)模型的rtb廣告定價(jià)方式的定價(jià)準(zhǔn)確性低的問題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供一種廣告定價(jià)方法及系統(tǒng)。
3、根據(jù)本發(fā)明的第一方面,提供一種廣告定價(jià)方法,該廣告定價(jià)方法包括以下步驟:
4、基于歷史廣告投放數(shù)據(jù)獲取樣本數(shù)據(jù)集,所述樣本數(shù)據(jù)集中的每條樣本數(shù)據(jù)包括特征組和標(biāo)簽,所述特征組包括用戶點(diǎn)擊率、廣告轉(zhuǎn)化率、競價(jià)成功率和dsp端最高廣告報(bào)價(jià),所述標(biāo)簽為廣告價(jià)格,所述廣告價(jià)格為adx端返回給ssp端的廣告報(bào)價(jià);
5、采用所述樣本數(shù)據(jù)集對預(yù)先建立的混合架構(gòu)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練、驗(yàn)證及測試,得到廣告定價(jià)模型,所述廣告定價(jià)模型包括用于接收輸入特征的輸入層、用于對輸入特征進(jìn)行全連接處理以獲取高階特征的多層感知機(jī)網(wǎng)絡(luò)分支、用于對輸入特征進(jìn)行卷積操作以獲取局部特征的卷積神經(jīng)網(wǎng)絡(luò)分支、用于對輸入特征進(jìn)行時(shí)間序列處理以獲取時(shí)間依賴關(guān)系的長短期記憶網(wǎng)絡(luò)分支、用于對各個(gè)網(wǎng)絡(luò)分支的輸出特征進(jìn)行拼接并對拼接特征進(jìn)行全連接融合的融合層以及輸出廣告定價(jià)結(jié)果的輸出層;
6、將獲取的待定價(jià)廣告的特征組輸入所述廣告定價(jià)模型以得到相應(yīng)的廣告定價(jià)結(jié)果,并將該廣告定價(jià)結(jié)果返回給ssp端。
7、作為可選的是,所述基于歷史廣告投放數(shù)據(jù)獲取樣本數(shù)據(jù)集包括:
8、對所述歷史廣告投放數(shù)據(jù)進(jìn)行清洗及歸一化處理;
9、對歸一化后的歷史廣告投放數(shù)據(jù)進(jìn)行特征提取,以得到所述樣本數(shù)據(jù)集。
10、作為可選的是,所述多層感知機(jī)網(wǎng)絡(luò)分支表示為:
11、
12、上式中,himlp為第i個(gè)全連接層的激活值,wimlp為第i個(gè)全連接層的權(quán)重矩陣,x為輸入的特征組,bimlp為第i個(gè)全連接層的偏置向量,relu(·)為激活函數(shù)。
13、作為可選的是,所述卷積神經(jīng)網(wǎng)絡(luò)分支的前兩層表示為:
14、
15、上式中,hicnn為第i卷積層的激活值,wicnn為第i卷積層的權(quán)重矩陣,bicnn為第i卷積層的偏置向量,conv(x,w)表示對輸入的x進(jìn)行卷積核為w的卷積操作,picnn為第i卷積層的池化值,maxpooling(h,k)表示為對輸入的h進(jìn)行k*k的最大池化操作。
16、作為可選的是,所述長短期記憶網(wǎng)絡(luò)分支的前兩層表示為:
17、
18、上式中,h0lstm表示初始時(shí)間步的隱藏狀態(tài)向量,c0lstm表示初始時(shí)間步的記憶細(xì)胞狀態(tài)向量,h1lstm表示第一個(gè)時(shí)間步的隱藏狀態(tài)向量,c1lstm表示第一個(gè)時(shí)間步的記憶細(xì)胞狀態(tài)向量。
19、作為可選的是,所述融合層表示為:
20、
21、hfusion=relu(wfusion·hconcat+bfusion)
22、上式中,hkmlp為多層感知機(jī)網(wǎng)絡(luò)分支的輸出激活值,hmcnn為卷積神經(jīng)網(wǎng)絡(luò)分支的輸出激活值,hnlstm為長短期記憶網(wǎng)絡(luò)分支的輸出激活值,hconcat為通過對各個(gè)網(wǎng)絡(luò)分支的輸出激活值進(jìn)行拼接操作而得到的整體向量,wfusion為融合層的權(quán)重矩陣,bfusion為融合層的偏置向量,hfusion為融合層的激活值。
23、作為可選的是,所述輸出層表示為:
24、y=wout·hfusion+bout
25、上式中,bout為輸出層的偏置向量,wout為輸出層的權(quán)重矩陣,y為廣告定價(jià)結(jié)果。
26、作為可選的是,所述采用所述樣本數(shù)據(jù)集對預(yù)先建立的混合架構(gòu)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練、驗(yàn)證及測試包括:
27、將所述樣本數(shù)據(jù)集劃分為訓(xùn)練數(shù)據(jù)集、驗(yàn)證數(shù)據(jù)集和測試數(shù)據(jù)集;
28、基于所述訓(xùn)練數(shù)據(jù)集對所述混合架構(gòu)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到待驗(yàn)證的混合架構(gòu)神經(jīng)網(wǎng)絡(luò);
29、基于所述驗(yàn)證數(shù)據(jù)集對所述待驗(yàn)證的混合架構(gòu)神經(jīng)網(wǎng)絡(luò)進(jìn)行驗(yàn)證,其中,基于均方誤差損失函數(shù)評估所述混合架構(gòu)神經(jīng)網(wǎng)絡(luò)的預(yù)測誤差,并采用adam優(yōu)化算法調(diào)整所述混合架構(gòu)神經(jīng)網(wǎng)絡(luò)的模型參數(shù),,以得到待測試的混合架構(gòu)神經(jīng)網(wǎng)絡(luò);
30、基于所述測試數(shù)據(jù)集對所述待測試的混合架構(gòu)神經(jīng)網(wǎng)絡(luò)進(jìn)行測試,以得到所述廣告定價(jià)模型。
31、作為可選的是,所述廣告定價(jià)方法還包括:
32、在每次返回廣告定價(jià)結(jié)果之后,收集相應(yīng)廣告的實(shí)際投放數(shù)據(jù);
33、按照預(yù)定的更新周期,基于收集到的實(shí)際投放數(shù)據(jù)對所述廣告定價(jià)模型的模型參數(shù)進(jìn)行更新。
34、根據(jù)本發(fā)明的第二方面,提供一種廣告定價(jià)系統(tǒng),該廣告定價(jià)系統(tǒng)包括以下功能模塊:
35、樣本數(shù)據(jù)集獲取模塊,用于基于歷史廣告投放數(shù)據(jù)獲取樣本數(shù)據(jù)集,所述樣本數(shù)據(jù)集中的每條樣本數(shù)據(jù)包括特征組和標(biāo)簽,所述特征組包括用戶點(diǎn)擊率、廣告轉(zhuǎn)化率、競價(jià)成功率和dsp端最高廣告報(bào)價(jià),所述標(biāo)簽為廣告價(jià)格,所述廣告價(jià)格為adx端返回給ssp端的廣告報(bào)價(jià);
36、廣告定價(jià)模型訓(xùn)練模塊,用于采用所述樣本數(shù)據(jù)集對預(yù)先建立的混合架構(gòu)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練、測試及驗(yàn)證,得到廣告定價(jià)模型,所述廣告定價(jià)模型包括用于接收輸入特征的輸入層、用于對輸入特征進(jìn)行全連接處理以獲取高階特征的多層感知機(jī)網(wǎng)絡(luò)分支、用于對輸入特征進(jìn)行卷積操作以獲取局部特征的卷積神經(jīng)網(wǎng)絡(luò)分支、用于對輸入特征進(jìn)行時(shí)間序列處理以獲取時(shí)間依賴關(guān)系的長短期記憶網(wǎng)絡(luò)分支、用于對各個(gè)網(wǎng)絡(luò)分支的輸出特征進(jìn)行拼接并對拼接特征進(jìn)行全連接融合的融合層以及輸出廣告定價(jià)結(jié)果的輸出層;
37、廣告定價(jià)結(jié)果獲取模塊,用于將獲取的待定價(jià)廣告的特征組輸入所述廣告定價(jià)模型以得到相應(yīng)的廣告定價(jià)結(jié)果,并將該廣告定價(jià)結(jié)果返回給ssp端。
38、本發(fā)明的有益效果在于:
39、本發(fā)明的廣告定價(jià)方法,首先,基于歷史廣告投放數(shù)據(jù)獲取樣本數(shù)據(jù)集;其次,采用所述樣本數(shù)據(jù)集對預(yù)先建立的混合架構(gòu)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練、驗(yàn)證及測試,得到廣告定價(jià)模型;最后,將獲取的待定價(jià)廣告的特征組輸入所述廣告定價(jià)模型,得到廣告定價(jià)結(jié)果。
40、本發(fā)明的廣告定價(jià)方法,基于以混合架構(gòu)神經(jīng)網(wǎng)絡(luò)為內(nèi)核的廣告定價(jià)模型對rtb廣告進(jìn)行定價(jià),進(jìn)而將廣告定價(jià)結(jié)果返回給ssp端。與現(xiàn)有基于統(tǒng)計(jì)學(xué)原理的rtb廣告定價(jià)模型相比,本發(fā)明中的基于混合架構(gòu)神經(jīng)網(wǎng)絡(luò)的廣告定價(jià)模型能夠深層次地挖掘影響rtb廣告定價(jià)的各個(gè)因素與rtb廣告最終定價(jià)之間的非線性關(guān)系,其對rtb廣告的定價(jià)相對更為準(zhǔn)確。
41、本發(fā)明的廣告定價(jià)系統(tǒng)與上述廣告定價(jià)方法屬于一個(gè)總的發(fā)明構(gòu)思,至少具有與上述廣告定價(jià)方法相同的有益效果,其有益效果在此不再贅述。
42、本發(fā)明的其他特征和優(yōu)點(diǎn)將在隨后具體實(shí)施方式部分予以詳細(xì)說明。