亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種廣告信息的推送方法及系統(tǒng)與流程

文檔序號:11627912閱讀:230來源:國知局
一種廣告信息的推送方法及系統(tǒng)與流程
本發(fā)明涉及網(wǎng)絡(luò)數(shù)據(jù)領(lǐng)域,特別是一種對移動設(shè)備用戶進行個性化廣告推薦的方法和系統(tǒng)。
背景技術(shù)
:近年來,隨著網(wǎng)絡(luò)技術(shù)的進步,互聯(lián)網(wǎng)已經(jīng)成為人們生活中的重要部分。廣告的內(nèi)容和投放方式隨著互聯(lián)網(wǎng)的飛速發(fā)展從根本上發(fā)生了改變,在線廣告也日益成為互聯(lián)網(wǎng)經(jīng)濟的一個主要組成部分。在線廣告,就是在媒體上投放、顯示的廣告。經(jīng)過十幾年的發(fā)展,在線廣告已經(jīng)形成了以人群為投放目標,以產(chǎn)品為導(dǎo)向的技術(shù)型投放模式。隨著技術(shù)的進步,在線廣告的投放日益向精準化的方向演進。在線廣告的精準投放就是對投放的環(huán)境和給定的用戶進行分析,通過不同算法來選擇與給定用戶最匹配的廣告,并進行定向投放的機制。在線廣告是當前較為成熟的大規(guī)模、自動化地利用數(shù)據(jù)改善產(chǎn)品和提高收入的行業(yè)。在互聯(lián)網(wǎng)廣告發(fā)展迅速的同時,如何優(yōu)化廣告的投放,以達到提高收益并滿足廣告主的投放需求同時又不會因為太多廣告而破壞用戶體驗,已成為急需解決的關(guān)鍵問題,這便催生了計算廣告的發(fā)展。計算廣告的核心任務(wù)就是在特定環(huán)境下為特定用戶選擇最合適的廣告展示。點擊率(click-throughrate,ctr)即廣告展示后被點擊的概率,一方面廣告被點擊與否可以有效地說明當前展示的廣告是否符合用戶的興趣,有較高的點擊的率的廣告更符合用戶的興趣,展示符合用戶興趣的廣告既不影響用戶體驗,又更能實現(xiàn)推廣目的;另一方面,點擊是后續(xù)廣告其他操作的前提,而對后續(xù)操作的預(yù)測一般比較困難,因此準確的預(yù)測廣告的點擊率成為計算廣告的一個核心任務(wù)。目前在線廣告的投放技術(shù)主要關(guān)注于pc端,即付費搜索(sponsoredsearch)和內(nèi)容匹配(contentmatch)兩類。付費搜索廣告根據(jù)用戶在搜索引擎的搜索輸入選擇合適的廣告,內(nèi)容匹配廣告則根據(jù)用戶瀏覽網(wǎng)頁的內(nèi)容選擇廣告。隨著智能移動設(shè)備(如智能手機、平板電腦等)的普及和無線網(wǎng)絡(luò)技術(shù)的發(fā)展,移動互聯(lián)網(wǎng)也日益成為人們的生活中重要的部分。移動端的在線廣告相比pc端web網(wǎng)頁上的在線廣告有一些特有的特點:(1)相對于pc端,移動設(shè)備一般都是個人使用,智能移動設(shè)備更容易定位一個用戶;(2)用戶使用移動端app應(yīng)用的興趣愛好、行為習(xí)慣等數(shù)據(jù)較難被提??;(3)移動設(shè)備顯示尺寸的限制和移動設(shè)備上用戶瀏覽廣告的普遍行為習(xí)慣,一次顯示的廣告數(shù)量不宜太多且不應(yīng)該包含太多文字內(nèi)容。技術(shù)實現(xiàn)要素:本發(fā)明的目的在于克服現(xiàn)有技術(shù)的缺點與不足,提供了一種對移動設(shè)備用戶進行個性化廣告推薦的方法和系統(tǒng)。本發(fā)明通過以下的方案實現(xiàn):一種廣告信息的推送方法,包括以下步驟:服務(wù)器端獲取客戶端的廣告推送請求;服務(wù)器端向廣告池模塊發(fā)送廣告請求,由所述廣告池模塊從數(shù)據(jù)庫中獲取廣告;服務(wù)器端接收由廣告池模塊返回的廣告;服務(wù)器端調(diào)用算法策略模塊,對廣告數(shù)據(jù)進行點擊率預(yù)估,并進行篩選和排序;服務(wù)器端將篩選排序后的廣告發(fā)回客戶端。相比于現(xiàn)有技術(shù),本發(fā)明針對移動終端的特點,提供了一種對移動設(shè)備用戶進行個性化廣告推薦的方法。通過本發(fā)明可以針對用戶的需求,更加精確地挑選更加適合的廣告數(shù)據(jù),并相應(yīng)地推送給用戶。作為本發(fā)明的進一步改進,所述服務(wù)器端調(diào)用算法策略模塊,對廣告數(shù)據(jù)進行點擊率預(yù)估,并進行篩選和排序的步驟中,包括:提取原始特征,所述原始特征包括:廣告特征、用戶特征和用戶歷史行為特征;對原始特征進行處理,針對不同類型的特征生成數(shù)值向量;將廣告、用戶和用戶行為特征拼接形成特征向量,根據(jù)該特征向量計算出該用戶點擊該廣告的概率,并將該廣告插入有序隊列中。作為本發(fā)明的進一步改進,所述廣告特征包括靜態(tài)特征和動態(tài)特征;所述廣告靜態(tài)特征包括廣告的唯一id、提供廣告的廣告衫、廣告應(yīng)用的國家代碼、廣告推廣的應(yīng)用的標題、描述和大?。凰鰪V告動態(tài)特征包括:廣告設(shè)定時間范圍內(nèi)的展示數(shù)量和被點擊量。作為本發(fā)明的進一步改進,所述用戶特征包括靜態(tài)特征和動態(tài)特征;所述用戶靜態(tài)特征包括:用戶使用的設(shè)備號、軟件版本、用戶渠道、設(shè)備系統(tǒng)及版本、手機型號、網(wǎng)絡(luò)運營商、ip地址、年齡、性別、用戶使用的語言;所述用戶動態(tài)特征包括用戶設(shè)定時間范圍內(nèi)的廣告的展示數(shù)量和點擊數(shù)量。作為本發(fā)明的進一步改進,所述用戶歷史行為特征包括:用戶下載、安裝的應(yīng)用,以及打開應(yīng)用中的功能。作為本發(fā)明的進一步改進,所述對原始特征進行處理,針對不同類型的特征生成數(shù)值向量的步驟中,當針對取值為有限范圍的數(shù)值特征,處理步驟為:把數(shù)值的取值范圍劃分為n個區(qū)間,特征維度為區(qū)間的數(shù)量,對每一個實例構(gòu)建一個n維全零向量,并在該向量中,將該實例所映射到的區(qū)間對應(yīng)的向量位置上的值設(shè)置為1。作為本發(fā)明的進一步改進,所述對原始特征進行處理,針對不同類型的特征生成數(shù)值向量的步驟中,當針對枚舉特征,取值為有限數(shù)量的不同可能值的特征,處理步驟為:把有n種不同值的特征,首先根據(jù)值的頻率選取前k個,將每個值唯一地映射到一個0到k-1之間的數(shù),對每一個實例構(gòu)建一個k維全零向量,并將該實例取值對應(yīng)的位置的值置為1。作為本發(fā)明的進一步改進,所述對原始特征進行處理,針對不同類型的特征生成數(shù)值向量的步驟中,當針對文本特征,處理步驟為:首先,將文本中的詞進行詞嵌入映射,得到詞向量;然后將詞向量累加作為該類特征的詞向量,并對該類特征下的所有詞向量進行k均值聚類;最后將該類特征的詞向量的簇編號進行one-hot映射,映射后的向量作為該類特征,特征維度為簇中心的數(shù)量。作為本發(fā)明的進一步改進,所述對原始特征進行處理,針對不同類型的特征生成數(shù)值向量的步驟中,針對時序特征,處理步驟包括:獲取用戶的所有的操作行為構(gòu)成行為序列,所述用戶的行為序列如下:s=(s1,s2,s3,s4,...,s2*n-2,s2*n-1),其中,設(shè)用戶一共有n個操作事件,序列s中奇數(shù)位置的元素為用戶的各種操作行為,偶數(shù)位置的元素兩個操作事件發(fā)生的時間差;使用序列s的所有的子序列作為用戶的特征進行聚類;提取s所有的k-gram集合,即所有在序列s中出現(xiàn)過的長度為k的子序列:tk(s)={(s1,si+1,...,si+k-1)|1≤i≤n-k+1},對于一個給定的k和兩個序列s1和s2,首先計算得到兩個序列的k-gram集合的并集,t=tk(s1)∪tk(s2),并分別統(tǒng)計兩個序列t中每個元素出現(xiàn)的頻率:ci=(ci,1,ci,2,...,ci,m),其中ci,j為t中第j個元素在序列si中出現(xiàn)的頻率;由以上定義序列s1和s2的距離為:得到每兩個用戶行為序列的距離后,依此使用基于距離的聚類方法對用戶進行聚類;聚類之后,將用戶的行為序列的類別進行one-hot映射,映射后的向量作為該類特征。作為本發(fā)明的進一步改進,所述將廣告、用戶和用戶行為特征拼接形成特征向量,根據(jù)該特征向量計算出該用戶點擊該廣告的概率,并將該廣告插入有序隊列中的步驟中,具體包括:將廣告,用戶和用戶歷史行為特征拼接而成的特征向量,即[xad,xuser,xhistory];計算該用戶點擊該廣告的概率,p(y=1|xad,xuser,xhistory);其中,廣告點擊概率預(yù)測函數(shù)為:因子分解機模型定義為:其中,參數(shù)w∈r,w∈rn,v∈rn×k,<vivj>表示兩個大小為k的向量vi和vj的點積;將該廣告插入有序隊列,如果該廣告對應(yīng)的預(yù)估點擊率的排序在前k個,則保留,否則過濾。作為本發(fā)明的進一步改進,還包括步驟:廣告池模塊獲取廣告特征,并存入數(shù)據(jù)庫;客戶端獲取用戶特征和用戶歷史行為特征,并存入數(shù)據(jù)庫。針對上述廣告信息的推送方法,本發(fā)明還提供了一種廣告信息的推送系統(tǒng),其包括服務(wù)器、客戶端、廣告池模塊、算法策略模塊和數(shù)據(jù)庫;所述服務(wù)器,用于獲取客戶端的廣告推送請求;所述服務(wù)器,用于向廣告池模塊發(fā)送廣告請求,由所述廣告池模塊從所述數(shù)據(jù)庫中獲取廣告;所述服務(wù)器,用于接收由廣告池模塊返回的廣告;所述服務(wù)器,用于調(diào)用算法策略模塊,對廣告數(shù)據(jù)進行點擊率預(yù)估,并進行篩選和排序;所述服務(wù)器,用于將篩選排序后的廣告發(fā)回客戶端。作為本發(fā)明的進一步改進,所述調(diào)用算法策略模塊包括:提取單元,用于提取原始特征,所述原始特征包括:廣告特征、用戶特征和用戶歷史行為特征;處理單元,用于對原始特征進行處理,針對不同類型的特征生成數(shù)值向量;概率計算單元,用于將廣告、用戶和用戶行為特征拼接形成特征向量,根據(jù)該特征向量計算出該用戶點擊該廣告的概率,并將該廣告插入有序隊列中。作為本發(fā)明的進一步改進,所述廣告特征包括靜態(tài)特征和動態(tài)特征;所述廣告靜態(tài)特征包括廣告的唯一id、提供廣告的廣告衫、廣告應(yīng)用的國家代碼、廣告推廣的應(yīng)用的標題、描述和大小;所述廣告動態(tài)特征包括:廣告設(shè)定時間范圍內(nèi)的展示數(shù)量和被點擊量。作為本發(fā)明的進一步改進,所述用戶特征包括靜態(tài)特征和動態(tài)特征;所述用戶靜態(tài)特征包括:用戶使用的設(shè)備號、軟件版本、用戶渠道、設(shè)備系統(tǒng)及版本、手機型號、網(wǎng)絡(luò)運營商、ip地址、年齡、性別、用戶使用的語言;所述用戶動態(tài)特征包括用戶設(shè)定時間范圍內(nèi)的廣告的展示數(shù)量和點擊數(shù)量。作為本發(fā)明的進一步改進,所述用戶歷史行為特征包括:用戶下載、安裝的應(yīng)用,以及打開應(yīng)用中的功能。作為本發(fā)明的進一步改進,所述處理單元包括第一子單元,用于對取值為有限范圍的數(shù)值特征進行處理,處理步驟為:把數(shù)值的取值范圍劃分為n個區(qū)間,特征維度為區(qū)間的數(shù)量,對每一個實例構(gòu)建一個n維全零向量,并在該向量中,將該實例所映射到的區(qū)間對應(yīng)的向量位置上的值設(shè)置為1。作為本發(fā)明的進一步改進,所述處理單元包括第二子單元,用于對枚舉特征,即取值為有限數(shù)量的不同可能值的特征進行處理,處理步驟為:把有n種不同值的特征,首先根據(jù)值的頻率選取前k個,將每個值唯一地映射到一個0到k-1之間的數(shù),對每一個實例構(gòu)建一個k維全零向量,并將該實例取值對應(yīng)的位置的值置為1。作為本發(fā)明的進一步改進,所述處理子模塊包括第三處理子單元,用于對文本特征進行處理,具體處理步驟包括:將文本中的詞進行詞嵌入映射,得到詞向量;將詞向量累加作為該類特征的詞向量,并對該類特征下的所有詞向量進行k均值聚類;將該類特征的詞向量的簇編號進行one-hot映射,映射后的向量作為該類特征,特征維度為簇中心的數(shù)量。作為本發(fā)明的進一步改進,所述處理單元包括第四子單元,其用于處理時序特征,具體步驟包括:獲取用戶的所有的操作行為構(gòu)成行為序列,所述用戶的行為序列如下:s=(s1,s2,s3,s4,...,s2*n-2,s2*n-1),其中,設(shè)用戶一共有n個操作事件,序列s中奇數(shù)位置的元素為用戶的各種操作行為,偶數(shù)位置的元素兩個操作事件發(fā)生的時間差;使用序列s的所有的子序列作為用戶的特征進行聚類;提取s所有的k-gram集合,即所有在序列s中出現(xiàn)過的長度為k的子序列:tk(s)={(s1,si+1,...,si+k-1)|1≤i≤n-k+1},對于一個給定的k和兩個序列s1和s2,首先計算得到兩個序列的k-gram集合的并集,t=tk(s1)∪tk(s2),并分別統(tǒng)計兩個序列t中每個元素出現(xiàn)的頻率:ci=(ci,1,ci,2,...,ci,m),其中ci,j為t中第j個元素在序列si中出現(xiàn)的頻率;由以上定義序列s1和s2的距離為:得到每兩個用戶行為序列的距離后,依此使用基于距離的聚類方法對用戶進行聚類;聚類之后,將用戶的行為序列的類別進行one-hot映射,映射后的向量作為該類特征。作為本發(fā)明的進一步改進,所述概率計算單元,具體包括:拼接子單元,用于將廣告,用戶和用戶歷史行為特征拼接而成的特征向量,即[xad,xuser,xhistory];計算子單元,用于計算該用戶點擊該廣告的概率,p(y=1|xad,xuser,xhistory);其中,廣告點擊概率預(yù)測函數(shù)為:因子分解機模型定義為:其中,參數(shù)w∈r,w∈rn,v∈rn×k,<vivj>表示兩個大小為k的向量vi和vj的點積;插入子單元,用于將該廣告插入有序隊列,如果該廣告對應(yīng)的預(yù)估點擊率的排序在前k個,則保留,否則過濾。作為本發(fā)明的進一步改進,所述廣告池模塊,還用于獲取廣告特征,并存入數(shù)據(jù)庫;所述客戶端,還用于獲取用戶特征和用戶歷史行為特征,并存入數(shù)據(jù)庫。相比于現(xiàn)有技術(shù),本發(fā)明在傳統(tǒng)的計算廣告學(xué)方法的基礎(chǔ)上,結(jié)合移動app應(yīng)用環(huán)境的特點,提出了一個新的智能移動終端在線廣告投放的業(yè)務(wù)架構(gòu),并基于此架構(gòu),對可用的用戶特征以及特征處理方式進行探索,并利用合適的預(yù)測模型來處理移動應(yīng)用上的用戶基本信息、用戶歷史行為信息、廣告內(nèi)容等數(shù)據(jù),從而精確預(yù)測ctr。為了更好地理解和實施,下面結(jié)合附圖詳細說明本發(fā)明。附圖說明圖1是本發(fā)明的廣告信息的推送方法的步驟流程圖。圖2是本發(fā)明的步驟s5的具體步驟流程圖。圖3是本發(fā)明的步驟s52的具體步驟流程圖。圖4是本發(fā)明的決策樹的示意圖。圖5是本發(fā)明的廣告信息的推送系統(tǒng)的模塊框圖。圖6是本發(fā)明的算法策略模塊的內(nèi)部處理框圖。具體實施方式下面結(jié)合實施例及附圖對本發(fā)明作進一步詳細的描述,但本發(fā)明的實施方式不限于此。本發(fā)明為了解決現(xiàn)有技術(shù)的缺陷,提出了一種服務(wù)于移動終端上的廣告聚合平臺架構(gòu),該平臺能夠?qū)崿F(xiàn)對多家移動廣告商的廣告進行聚合去重,并存儲于數(shù)據(jù)倉庫里,形成海量廣告池。并在此基礎(chǔ)上,本發(fā)明還提供了一種在廣告聚合平臺中向用戶精準推薦的廣告?zhèn)€性化推薦方法。以下通過具體的實施例,介紹本發(fā)明的廣告推薦方法和系統(tǒng)架構(gòu)。首先,請參閱圖1,其為本發(fā)明的廣告信息的推送方法的步驟流程圖。本發(fā)明提供了一種廣告信息的推送方法,包括以下步驟:s1:廣告池模塊獲取廣告特征,并存入數(shù)據(jù)庫;客戶端獲取用戶特征和用戶歷史行為特征,并存入數(shù)據(jù)庫。具體的,在本步驟中,需要完成廣告池的構(gòu)建和用戶信息的采集。而其中,廣告池構(gòu)建主要由廣告池模塊完成。廣告池模塊為廣告數(shù)據(jù)內(nèi)存緩沖池,根據(jù)廣告商或者網(wǎng)盟提供的api接口,該模塊定時向多家廣告商發(fā)送請求拉取廣告數(shù)據(jù),例如avazu,appnext等。由于多家的廣告商的廣告可能出現(xiàn)重復(fù),因此廣告拉取之后,需對廣告進行去重,然后存儲于廣告池中,如果廣告已經(jīng)存在,那么需對廣告池已有的廣告進行更新,以保證廣告數(shù)據(jù)的有效性,最后將廣告信息存入數(shù)據(jù)庫中。而對于用戶特征的采集,則通過移動客戶端執(zhí)行。本實施例中,所述移動客戶端負責收集和上報用戶行為日志,例如,用戶在應(yīng)用中的點擊和展示廣告行為數(shù)據(jù)。同時,客戶端還上報用戶的靜態(tài)數(shù)據(jù),例如,用戶應(yīng)用安裝列表、使用的設(shè)備號、軟件版本、用戶渠道、設(shè)備系統(tǒng)等。服務(wù)器接收到上報日志之后,將其存入對應(yīng)的數(shù)據(jù)庫中。s2:服務(wù)器端獲取客戶端的廣告推送請求。在本步驟中,當用戶打開移動客戶端時,客戶端會向服務(wù)器請求廣告推薦列表。s3:服務(wù)器端向廣告池模塊發(fā)送廣告請求,由所述廣告池模塊從數(shù)據(jù)庫中獲取廣告。s4:服務(wù)器端接收由廣告池模塊返回的廣告。s5:服務(wù)器端調(diào)用算法策略模塊,對廣告數(shù)據(jù)進行點擊率預(yù)估,并進行篩選和排序。在本步驟中,服務(wù)器為了更加精確地將廣告推薦給用戶,則需要調(diào)用算法策略接口對廣告進行點擊率預(yù)估,然后篩選和排序。其中,如何進行點擊率預(yù)估,具體的步驟包括:s51:提取原始特征,所述原始特征包括:廣告特征、用戶特征和用戶歷史行為特征;具體的,所述廣告特征包括靜態(tài)特征和動態(tài)特征;所述廣告靜態(tài)特征包括廣告的唯一id、提供廣告的廣告衫、廣告應(yīng)用的國家代碼、廣告推廣的應(yīng)用的標題、描述和大小;所述廣告動態(tài)特征包括:廣告設(shè)定時間范圍內(nèi)的展示數(shù)量和被點擊量。所述用戶特征包括靜態(tài)特征和動態(tài)特征;所述用戶靜態(tài)特征包括:用戶使用的設(shè)備號、軟件版本、用戶渠道、設(shè)備系統(tǒng)及版本、手機型號、網(wǎng)絡(luò)運營商、ip地址、年齡、性別、用戶使用的語言;所述用戶動態(tài)特征包括用戶設(shè)定時間范圍內(nèi)的廣告的展示數(shù)量和點擊數(shù)量。所述用戶歷史行為特征包括:用戶下載、安裝的應(yīng)用,以及打開應(yīng)用中的功能。一個用戶的歷史記錄為一個列表,列表的每一行代表用戶的一次事件,如下所示:事件1(時間1,類型1,參數(shù)1)事件2(時間2,類型2,參數(shù)2)…事件n(時間n,類型n,參數(shù)n)s52:對原始特征進行處理,針對不同類型的特征生成數(shù)值向量。具體的,在本步驟中,分為以下幾種情況進行處理:s521:當針對取值為有限范圍的數(shù)值特征,如用戶歷史的點擊數(shù)量、廣告推廣應(yīng)用的大小等,采用分塊映射的方法。具體的處理步驟為:把數(shù)值的取值范圍劃分為n個區(qū)間,特征維度為區(qū)間的數(shù)量,對每一個實例構(gòu)建一個n維全零向量,并在該向量中,將該實例所映射到的區(qū)間對應(yīng)的向量位置上的值設(shè)置為1。例如廣告應(yīng)用大小的取值范圍為10,然后將該范圍分為2個區(qū)間,分別是[0,5],[5,10],那么該特征的維度為2。給定大小為2的廣告應(yīng)用,該數(shù)值通過分塊映射到第二個區(qū)間,則該特征為[0,1]。這樣就將連續(xù)的數(shù)值特征轉(zhuǎn)化為離散的分類特征,這樣可以獲取非線性的結(jié)構(gòu)。s522:當針對枚舉特征,取值為有限數(shù)量的不同可能值的特征,如廣告推廣商品的類別、用戶使用的語言等。采用one-hot映射或者哈希方法。具體的處理步驟為:把有n種不同值的特征,首先根據(jù)值的頻率選取前k個,將每個值唯一地映射到一個0到k-1之間的數(shù),對每一個實例構(gòu)建一個k維全零向量,并將該實例取值對應(yīng)的位置的值置為1。這種處理方式,用于降低向量的長度,減輕數(shù)據(jù)的稀疏度。s523:當針對文本特征,如應(yīng)用的標題、產(chǎn)品的描述等,采用word2vec方法。具體的處理步驟為:首先,將文本中的詞進行詞嵌入映射,得到詞向量;然后將詞向量累加作為該類特征的詞向量,并對該類特征下的所有詞向量進行k均值聚類;最后將該類特征的詞向量的簇編號進行one-hot映射,映射后的向量作為該類特征,特征維度為簇中心的數(shù)量。s524:當針對時序特征,采用cluster方法。具體的處理步驟包括:獲取用戶的所有的操作行為構(gòu)成行為序列,所述用戶的行為序列如下:s=(s1,s2,s3,s4,...,s2*n-2,s2*n-1),其中,設(shè)用戶一共有n個操作事件,序列s中奇數(shù)位置的元素為用戶的各種操作行為,偶數(shù)位置的元素兩個操作事件發(fā)生的時間差;使用序列s的所有的子序列作為用戶的特征進行聚類;提取s所有的k-gram集合,即所有在序列s中出現(xiàn)過的長度為k的子序列:tk(s)={(s1,si+1,...,si+k-1)|1≤i≤n-k+1},對于一個給定的k和兩個序列s1和s2,首先計算得到兩個序列的k-gram集合的并集,t=tk(s1)∪tk(s2),并分別統(tǒng)計兩個序列t中每個元素出現(xiàn)的頻率:ci=(ci,1,ci,2,...,ci,m),其中ci,j為t中第j個元素在序列si中出現(xiàn)的頻率;由以上定義序列s1和s2的距離為:得到每兩個用戶行為序列的距離后,依此使用基于距離的聚類方法對用戶進行聚類;聚類之后,將用戶的行為序列的類別進行one-hot映射,映射后的向量作為該類特征。s53:將廣告、用戶和用戶行為特征拼接形成特征向量,根據(jù)該特征向量計算出該用戶點擊該廣告的概率,并將該廣告插入有序隊列中。具體的,在本步驟中具體執(zhí)行以下步驟:將廣告,用戶和用戶歷史行為特征拼接而成的特征向量,即[xadxuserxhistory];計算該用戶點擊該廣告的概率,p(y=xadxuserxhistory);其中,廣告點擊概率預(yù)測函數(shù)為:因子分解機模型定義為:其中,參數(shù)w∈r,w∈rn,v∈rn×k,<vivj>表示兩個大小為k的向量vi和vj的點積;將該廣告插入有序隊列,如果該廣告對應(yīng)的預(yù)估點擊率的排序在前k個,則保留,否則過濾。在本步驟中,模型的輸入為廣告,用戶和用戶歷史行為特征拼接而成的向量,即[xadxuserxhistory]。其中,不同類別的特征為特征處理模塊輸出的數(shù)值向量。將該特征向量通過提升決策樹進行特征映射,得到每個樹的葉子索引值,接著將索引值進行one-hot映射,最后所有樹的one-hot特征拼接起來,得到轉(zhuǎn)化特征。該轉(zhuǎn)化特征作為因子分解機的輸入,從而可以計算得到廣告點擊概率值。請同時參閱圖4,其為本發(fā)明的決策樹的示意圖。本實施例中利用混合模型結(jié)構(gòu)預(yù)估廣告點擊率的具體做法是:將特征向量通過提升決策樹進行特征映射,使用提升決策樹的每一棵樹的輸出作為分類特征,再放入因子分解機進行計算得出廣告點擊概率值。圖中的兩棵樹是提升決策樹訓(xùn)練得出,第一棵樹有3個葉子節(jié)點,第一棵樹有2個葉子節(jié)點。對于一個樣本特征x,如果它在第一棵樹最后落在其中的第二個葉子節(jié)點,而在第二棵樹里最后落在其中的第一個葉子節(jié)點。再將這些葉子節(jié)點索引值進行one-hot映射,那么通過提升決策樹獲得的新特征向量為[0,1,0,1,0],其中向量中的前三位對應(yīng)第一棵樹的3個葉子節(jié)點,后兩位對應(yīng)第二棵樹的2個葉子節(jié)點。新特征向量的長度等于提升決策樹模型里所有樹包含的葉子節(jié)點數(shù)之和。最后將轉(zhuǎn)化后的特征作為因子分解機的輸入,從而計算得到廣告的點擊概率值。經(jīng)實驗,當提升決策樹的數(shù)量n高于60時,提升幾乎為0,因此默認n為60。而提升決策樹的最大深度d的設(shè)定,一般控制一棵樹的葉節(jié)點在12個左右。s5:服務(wù)器端將篩選排序后的廣告發(fā)回客戶端。相比于現(xiàn)有技術(shù),本發(fā)明針對移動終端的特點,提供了一種對移動設(shè)備用戶進行個性化廣告推薦的方法。通過本發(fā)明可以針對用戶的需求,更加精確地挑選更加適合的廣告數(shù)據(jù),并相應(yīng)地推送給用戶。該推薦方法使得用戶在信息過載的時代,從大量的廣告中找到自己感興趣的廣告。本聚合平臺還能為移動終端開發(fā)者提供廣告服務(wù),移動終端開發(fā)者可以通過api接受聚合平臺的廣告獲得廣告收益。而同時,聚合平臺通過自身的優(yōu)化策略和推薦算法實現(xiàn)廣告的精準推送,從而帶來了廣告收益的提升。請參閱圖5,其為本發(fā)明的廣告信息推送系統(tǒng)的架構(gòu)框圖。另外,針對上述廣告信息的推送方法,本發(fā)明還提供了一種用于實現(xiàn)上述推送方法的廣告信息的推送系統(tǒng),其包括服務(wù)器1、客戶端2、廣告池模塊3、算法策略模塊4和數(shù)據(jù)庫5。以下介紹本發(fā)明的廣告信息推送系統(tǒng)的運行過程和功能原理。首先,通過所述廣告池模塊3,獲取廣告特征,并存入數(shù)據(jù)庫5。通過所述客戶端2,獲取用戶特征和用戶歷史行為特征,并存入數(shù)據(jù)庫5。接著,當移動客戶端2打開時,向服務(wù)器1發(fā)送獲取廣告的請求。此時,所述服務(wù)器1獲取客戶端2的廣告推送請求。然后,所述服務(wù)器1向廣告池模塊3發(fā)送廣告請求,由所述廣告池模塊3從所述數(shù)據(jù)庫5中獲取廣告。所述服務(wù)器1接收由廣告池模塊返回的廣告。最后,所述服務(wù)器1調(diào)用算法策略模塊,對廣告數(shù)據(jù)進行點擊率預(yù)估,并進行篩選和排序。再通過所述服務(wù)器1將篩選排序后的廣告發(fā)回客戶端,在客戶端中進行廣告顯示。請同時參閱圖5,其為本發(fā)明的算法策略模塊的內(nèi)部邏輯框圖。其中,為了更加精確地向用戶推薦廣告,需要通過算法策略模塊4進行點擊率的預(yù)估和計算。而所述調(diào)用算法策略模塊包括:提取單元41、處理單元42和概率計算單元43。所述提取單元41,用于提取原始特征,所述原始特征包括:廣告特征、用戶特征和用戶歷史行為特征。具體的,所述廣告特征包括靜態(tài)特征和動態(tài)特征;所述廣告靜態(tài)特征包括廣告的唯一id、提供廣告的廣告衫、廣告應(yīng)用的國家代碼、廣告推廣的應(yīng)用的標題、描述和大小;所述廣告動態(tài)特征包括:廣告設(shè)定時間范圍內(nèi)的展示數(shù)量和被點擊量。所述用戶特征包括靜態(tài)特征和動態(tài)特征;所述用戶靜態(tài)特征包括:用戶使用的設(shè)備號、軟件版本、用戶渠道、設(shè)備系統(tǒng)及版本、手機型號、網(wǎng)絡(luò)運營商、ip地址、年齡、性別、用戶使用的語言;所述用戶動態(tài)特征包括用戶設(shè)定時間范圍內(nèi)的廣告的展示數(shù)量和點擊數(shù)量。所述用戶歷史行為特征包括:用戶下載、安裝的應(yīng)用,以及打開應(yīng)用中的功能。所述處理單元42,用于對原始特征進行處理,針對不同類型的特征生成數(shù)值向量。其中,所述處理單元42包括第一子單元421、第二子單元422、第三子單元423和第四子單元424,分別對以下幾種情況進行處理。所述第一子單元421,用于對取值為有限范圍的數(shù)值特征進行處理,處理步驟為:把數(shù)值的取值范圍劃分為n個區(qū)間,特征維度為區(qū)間的數(shù)量,對每一個實例構(gòu)建一個n維全零向量,并在該向量中,將該實例所映射到的區(qū)間對應(yīng)的向量位置上的值設(shè)置為1。所述第二子單元422,用于對枚舉特征,即取值為有限數(shù)量的不同可能值的特征進行處理,處理步驟為:把有n種不同值的特征,首先根據(jù)值的頻率選取前k個,將每個值唯一地映射到一個0到k-1之間的數(shù),對每一個實例構(gòu)建一個k維全零向量,并將該實例取值對應(yīng)的位置的值置為1。所述第三處理子單元423,用于對文本特征進行處理,具體處理步驟包括:將文本中的詞進行詞嵌入映射,得到詞向量;將詞向量累加作為該類特征的詞向量,并對該類特征下的所有詞向量進行k均值聚類;將該類特征的詞向量的簇編號進行one-hot映射,映射后的向量作為該類特征,特征維度為簇中心的數(shù)量。所述第四子單元424,其用于處理時序特征,具體步驟包括:獲取用戶的所有的操作行為構(gòu)成行為序列,所述用戶的行為序列如下:s=(s1,s2,s3,s4,...,s2*n-2,s2*n-1),其中,設(shè)用戶一共有n個操作事件,序列s中奇數(shù)位置的元素為用戶的各種操作行為,偶數(shù)位置的元素兩個操作事件發(fā)生的時間差;使用序列s的所有的子序列作為用戶的特征進行聚類;提取s所有的k-gram集合,即所有在序列s中出現(xiàn)過的長度為k的子序列:tk(s)={(s1,si+1,...,si+k-1)|1≤i≤n-k+1},對于一個給定的k和兩個序列s1和s2,首先計算得到兩個序列的k-gram集合的并集,t=tk(s1)∪tk(s2),并分別統(tǒng)計兩個序列t中每個元素出現(xiàn)的頻率:ci=(ci,1,ci,2,...,ci,m),其中ci,j為t中第j個元素在序列si中出現(xiàn)的頻率;由以上定義序列s1和s2的距離為:得到每兩個用戶行為序列的距離后,依此使用基于距離的聚類方法對用戶進行聚類;聚類之后,將用戶的行為序列的類別進行one-hot映射,映射后的向量作為該類特征。所述概率計算單元43,用于將廣告、用戶和用戶行為特征拼接形成特征向量,根據(jù)該特征向量計算出該用戶點擊該廣告的概率,并將該廣告插入有序隊列中。其中,所述概率計算單元43,具體包括:拼接子單元431、計算子單元432和插入子單元433。所述拼接子單元431,用于將廣告,用戶和用戶歷史行為特征拼接而成的特征向量,即[xad,xuser,xhistory];所述計算子單元432,用于計算該用戶點擊該廣告的概率,p(y=1|xad,xuser,xhistory);其中,廣告點擊概率預(yù)測函數(shù)為:因子分解機模型定義為:其中,參數(shù)w∈r,w∈rn,v∈rn×k,<vivj>表示兩個大小為k的向量vi和vj的點積;所述插入子單元433,用于將該廣告插入有序隊列,如果該廣告對應(yīng)的預(yù)估點擊率的排序在前k個,則保留,否則過濾。綜上,相比于現(xiàn)有技術(shù),本發(fā)明在傳統(tǒng)的計算廣告學(xué)方法的基礎(chǔ)上,結(jié)合移動app應(yīng)用環(huán)境的特點,提出了一個新的智能移動終端在線廣告投放的業(yè)務(wù)架構(gòu),并基于此架構(gòu),對可用的用戶特征以及特征處理方式進行探索,并利用合適的預(yù)測模型來處理移動應(yīng)用上的用戶基本信息、用戶歷史行為信息、廣告內(nèi)容等數(shù)據(jù),從而精確預(yù)測ctr。上述實施例為本發(fā)明較佳的實施方式,但本發(fā)明的實施方式并不受上述實施例的限制,其他的任何未背離本發(fā)明的精神實質(zhì)與原理下所作的改變、修飾、替代、組合、簡化,均應(yīng)為等效的置換方式,都包含在本發(fā)明的保護范圍之內(nèi)。當前第1頁12
當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1