本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種資源推送方法及裝置。
背景技術(shù):
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,社交網(wǎng)絡(luò)成為了重要的交流平臺(tái)之一。眾所周知,在社交網(wǎng)絡(luò)中進(jìn)行資源推送,是資源推廣的重要方式。然而在傳統(tǒng)的資源推送方式中,通常采用是將全量用戶按照預(yù)設(shè)規(guī)則進(jìn)行過濾,得到候選用戶集,然后利用種子用戶加負(fù)樣本構(gòu)成的訓(xùn)練集訓(xùn)練模型對(duì)候選用戶集,排序過濾出目標(biāo)投放用戶群,然后進(jìn)行資源的一次性推送,這種推送方式的精準(zhǔn)度較差。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供一種資源推送方法及裝置,以解決資源推送精準(zhǔn)度較差的問題。
第一方面,本發(fā)明實(shí)施例提供了一種資源推送方法,包括:
獲取基準(zhǔn)用戶的目標(biāo)關(guān)系鏈;
根據(jù)所述基準(zhǔn)用戶和目標(biāo)關(guān)系鏈確定所述基準(zhǔn)用戶的關(guān)系用戶;
從預(yù)設(shè)數(shù)據(jù)庫中獲取所述關(guān)系用戶的參數(shù)特征;
根據(jù)所述參數(shù)特征確定每一所述關(guān)系用戶與對(duì)應(yīng)的基準(zhǔn)用戶的相似度值,或根據(jù)所述參數(shù)特征確定每一所述關(guān)系用戶的概率值;
根據(jù)所述相似度值或概率值從所述關(guān)系用戶中確定推送用戶,向所述推送用戶推送目標(biāo)資源。
第二方面,本發(fā)明實(shí)施例還提供了一種資源推送裝置,包括:
關(guān)系鏈獲取模塊,用于獲取基準(zhǔn)用戶的目標(biāo)關(guān)系鏈;
第一確定模塊,用于根據(jù)所述基準(zhǔn)用戶和目標(biāo)關(guān)系鏈確定所述基準(zhǔn)用戶的關(guān)系用戶;
圈子定向關(guān)系鏈拉取模塊,用于從預(yù)設(shè)數(shù)據(jù)庫中獲取所述關(guān)系用戶的參數(shù)特征;
第二確定模塊,用于根據(jù)所述參數(shù)特征確定每一所述關(guān)系用戶與對(duì)應(yīng)的基準(zhǔn)用戶的相似度值,或根據(jù)所述參數(shù)特征確定每一所述關(guān)系用戶的概率值;
排序過濾模塊,用于根據(jù)所述相似度值或概率值從所述關(guān)系用戶中確定推送用戶,向所述推送用戶推送目標(biāo)資源。
這樣,本發(fā)明實(shí)施例中,獲取基準(zhǔn)用戶的目標(biāo)關(guān)系鏈;根據(jù)所述基準(zhǔn)用戶和目標(biāo)關(guān)系鏈確定所述基準(zhǔn)用戶的關(guān)系用戶;從預(yù)設(shè)數(shù)據(jù)庫中獲取所述關(guān)系用戶的參數(shù)特征;根據(jù)所述參數(shù)特征確定每一所述關(guān)系用戶與對(duì)應(yīng)的基準(zhǔn)用戶的相似度值,或根據(jù)所述參數(shù)特征確定每一所述關(guān)系用戶的概率值;根據(jù)所述相似度值或概率值從所述關(guān)系用戶中確定推送用戶,向所述推送用戶推送目標(biāo)資源。由于在本發(fā)明實(shí)施例中采用基準(zhǔn)用戶的關(guān)系用戶作為候選用戶集,然后從候選用戶集中選取推送用戶,從而有效利用了用戶群社交同質(zhì)性(相似性)以及用戶群社交影響力,因此提高了對(duì)資源推送的精準(zhǔn)度,進(jìn)而提升了資源推送的效果。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)本發(fā)明實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實(shí)施例提供的資源推送方法的流程圖;
圖2是本發(fā)明又一實(shí)施例提供的資源推送方法的流程圖;
圖3是本發(fā)明實(shí)施例提供的資源推送方法中預(yù)測(cè)概率值的流程圖;
圖4是本發(fā)明又一實(shí)施例提供的資源推送方法的流程圖;
圖5是本發(fā)明又一實(shí)施例提供的資源推送方法的流程圖;
圖6是本發(fā)明實(shí)施例提供的資源推送方法中種子用戶上傳界面圖;
圖7是本發(fā)明實(shí)施例提供的資源推送方法應(yīng)用的系統(tǒng)架構(gòu)圖;
圖8是本發(fā)明實(shí)施例提供的資源推送方法中用戶畫像特征和興趣標(biāo)簽的分析流程圖;
圖9是本發(fā)明實(shí)施例提供的資源推送方法中合并向量的直觀圖;
圖10是本發(fā)明實(shí)施例提供的資源推送裝置的結(jié)構(gòu)圖;
圖11是本發(fā)明又一實(shí)施例提供的資源推送裝置的結(jié)構(gòu)圖;
圖12是本發(fā)明又一實(shí)施例提供的資源推送裝置的結(jié)構(gòu)圖;
圖13是本發(fā)明又一實(shí)施例提供的資源推送裝置的結(jié)構(gòu)圖;
圖14本發(fā)明實(shí)施例提供的服務(wù)器的結(jié)構(gòu)圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
參照?qǐng)D1,本發(fā)明實(shí)施例提供了一種資源推送方法,包括:
步驟101,獲取基準(zhǔn)用戶的目標(biāo)關(guān)系鏈;
本發(fā)明實(shí)施例提供的資源推送方法主要應(yīng)用于資源推送服務(wù)器中,用于對(duì)目標(biāo)資源的推送進(jìn)行管理。
該步驟中,上述目標(biāo)關(guān)系鏈可以由用戶進(jìn)行設(shè)定,例如用戶可以通過預(yù)設(shè)的交互界面設(shè)定目標(biāo)關(guān)系鏈,例如該目標(biāo)關(guān)系鏈包括全部好友或者部分好友,例如對(duì)好友進(jìn)行分類包括朋友、親人、同學(xué)、同事和親人時(shí),上述目標(biāo)關(guān)系鏈包括朋友、親人、同學(xué)、同事和親人中的一項(xiàng)或者多項(xiàng)。
本發(fā)明實(shí)施例中,對(duì)目標(biāo)資源進(jìn)行推送時(shí),可以采取多次動(dòng)態(tài)的推送方式,在首次進(jìn)行目標(biāo)資源推送時(shí),上述基準(zhǔn)用戶為種子用戶(即資源推送方提供的用戶);后續(xù)每一次進(jìn)行資源推送時(shí),上述基準(zhǔn)用戶為歷史推送用戶中選取的用戶。例如,可以根據(jù)上一次進(jìn)行目標(biāo)資源推送的推送用戶選取下一次進(jìn)行資源推送對(duì)應(yīng)的基準(zhǔn)用戶。其中,同一用戶作為基準(zhǔn)用戶使用的次數(shù)只能為一次,也就是說,在對(duì)同一目標(biāo)資源進(jìn)行推送時(shí),每一用戶僅被允許一次作為基準(zhǔn)用戶。
步驟102,根據(jù)所述基準(zhǔn)用戶和目標(biāo)關(guān)系鏈確定基準(zhǔn)用戶的關(guān)系用戶;
步驟103,從預(yù)設(shè)數(shù)據(jù)庫中獲取所述關(guān)系用戶的參數(shù)特征;
上述參數(shù)特征的具體內(nèi)容可以根據(jù)實(shí)際需要進(jìn)行設(shè)置,例如,在本實(shí)施例中,該參數(shù)特征可以包括用戶畫像特征和嵌入(embedding)向量,其中,該embedding向量為用戶位于共同類網(wǎng)絡(luò)中的網(wǎng)絡(luò)節(jié)點(diǎn)所映射的向量??蛇x的,為了提高對(duì)用戶相似度計(jì)算的精準(zhǔn)度,上述參數(shù)特征還可以包括:用于反應(yīng)用戶喜好資源類型的興趣標(biāo)簽,該興趣標(biāo)簽的劃分規(guī)則可以根據(jù)實(shí)際需要進(jìn)行設(shè)置,例如可以進(jìn)行大類和小類逐層劃分,例如興趣標(biāo)簽可以包括體育類、軍事類和閱讀類等劃分大類,再從大類進(jìn)行小類劃分,例如,在閱讀內(nèi)中可以劃分為雜志類、小說類和文藝類等,其具體的劃分細(xì)節(jié)在此不再一一列舉。
其中,上述用戶畫像特征、embedding向量和興趣標(biāo)簽通常是在之前進(jìn)行了統(tǒng)計(jì)并儲(chǔ)存。本實(shí)施例中,可以根據(jù)基準(zhǔn)用戶和目標(biāo)關(guān)系鏈獲取存儲(chǔ)的參數(shù)特征,從而獲得關(guān)系用戶的參數(shù)特征。可選的,上述基準(zhǔn)用戶的數(shù)量可以根據(jù)實(shí)際需要進(jìn)行設(shè)置,且每一基準(zhǔn)用戶的目標(biāo)關(guān)系鏈對(duì)應(yīng)的關(guān)系用戶數(shù)量可以根據(jù)實(shí)際需要進(jìn)行設(shè)置,應(yīng)當(dāng)說明的是,基準(zhǔn)用戶的目標(biāo)關(guān)系鏈對(duì)應(yīng)的關(guān)系用戶數(shù)量和與關(guān)系用戶的互動(dòng)類行為狀態(tài)均可以反應(yīng)該基準(zhǔn)用戶的社交影響力,互動(dòng)類行為包括兩個(gè)用戶在社交平臺(tái)上的收發(fā)消息、點(diǎn)贊評(píng)論、視頻通話和語音通話。
步驟104,根據(jù)所述參數(shù)特征確定每一所述關(guān)系用戶與對(duì)應(yīng)的基準(zhǔn)用戶的相似度值,或根據(jù)所述參數(shù)特征確定每一所述關(guān)系用戶的概率值;
該步驟中,可以根據(jù)預(yù)設(shè)的相似度模型或者概率分析模型對(duì)上述預(yù)設(shè)特征進(jìn)行分析計(jì)算,得到每一關(guān)系用戶與對(duì)應(yīng)的基準(zhǔn)用戶的相似度值,或根據(jù)所述參數(shù)特征確定每一所述關(guān)系用戶的概率值。
步驟105,根據(jù)所述相似度值或概率值從所述關(guān)系用戶中確定推送用戶,向所述推送用戶推送目標(biāo)資源。
該步驟中,可以根據(jù)每一關(guān)系用戶與對(duì)應(yīng)的基準(zhǔn)用戶的相似度或者每一關(guān)系用戶的概率值進(jìn)行關(guān)系用戶的排序,然后根據(jù)排序的順序確定本次進(jìn)行資源推送的推送用戶。其中確定推送用戶的方式可以根據(jù)實(shí)際需要進(jìn)行設(shè)置,例如可以對(duì)每一基準(zhǔn)用戶的關(guān)系用戶進(jìn)行排序,分別選取與對(duì)應(yīng)的基準(zhǔn)用戶的相似度值或者概率值排列前n位的關(guān)系用戶作為本次資源推送的推送用戶,即從每一基準(zhǔn)用戶對(duì)應(yīng)的關(guān)系用戶中選取相似度值或者概率值排列前n位的關(guān)系用戶;還可以將所有關(guān)系用戶與對(duì)應(yīng)的基準(zhǔn)用戶的相似度值或者關(guān)系用戶概率值進(jìn)行整體排列,選取前m位關(guān)系用戶作為本次資源推送的推送用戶,即從所有的關(guān)系用戶中選取相似度值或者概率值排列前m位的關(guān)系用戶。
應(yīng)理解,在排序的過程中,還可以增加其他的權(quán)重因子,例如可以根據(jù)用戶在24小時(shí)內(nèi)朋友圈的活躍度和用戶1小時(shí)內(nèi)情感狀態(tài)分別設(shè)置相應(yīng)的活躍度權(quán)重因子和情感監(jiān)測(cè)權(quán)重因子,根據(jù)相似度值或者概率值與相應(yīng)的權(quán)重因子的乘積對(duì)每一關(guān)系用戶進(jìn)行排序。
在確定推送用戶后,可以向推送用戶推送目標(biāo)資源。具體的,推送目標(biāo)資源的額方式可以根據(jù)實(shí)際需要進(jìn)行設(shè)置,以下實(shí)施例中將會(huì)對(duì)此進(jìn)行詳細(xì)說明,在此不再詳述。
這樣,本發(fā)明實(shí)施例中,獲取基準(zhǔn)用戶的目標(biāo)關(guān)系鏈;根據(jù)所述基準(zhǔn)用戶和目標(biāo)關(guān)系鏈確定所述基準(zhǔn)用戶的關(guān)系用戶;從預(yù)設(shè)數(shù)據(jù)庫中獲取所述關(guān)系用戶的參數(shù)特征;根據(jù)所述參數(shù)特征確定每一所述關(guān)系用戶與對(duì)應(yīng)的基準(zhǔn)用戶的相似度值,或根據(jù)所述參數(shù)特征確定每一所述關(guān)系用戶的概率值;根據(jù)所述相似度值或概率值從所述關(guān)系用戶中確定推送用戶,向所述推送用戶推送目標(biāo)資源。由于在本發(fā)明實(shí)施例中采用基準(zhǔn)用戶的關(guān)系用戶作為候選用戶集,然后從候選用戶集中選取推送用戶,從而有效利用了用戶群社交同質(zhì)性(相似性)以及用戶群社交影響力,因此提高了對(duì)資源推送的精準(zhǔn)度,進(jìn)而提升了資源推送的效果。
可選的,參照?qǐng)D2,上述步驟105之后,所述方法還包括:
步驟106,從所述推送用戶中選擇下一次對(duì)所述目標(biāo)資源進(jìn)行資源推送的基準(zhǔn)用戶。
該步驟中,根據(jù)選取的推送用戶在預(yù)設(shè)的網(wǎng)絡(luò)平臺(tái)上進(jìn)行資源推送,并且從本次進(jìn)行資源推送的推送用戶中選取下一次對(duì)目標(biāo)資源進(jìn)行資源推送的基準(zhǔn)用戶。
可以理解的是,從本次進(jìn)行資源推送的推送用戶中選取基準(zhǔn)用戶的方式可以根據(jù)實(shí)際需要進(jìn)行設(shè)置。例如,可以將所述推送用戶中的正向反饋用戶設(shè)定為下一次對(duì)所述目標(biāo)資源進(jìn)行資源推送的基準(zhǔn)用戶,也可以從正向反饋用戶中選取部分用戶作為基準(zhǔn)用戶。其中,正向反饋用戶可以是點(diǎn)擊獲取推送資源的用戶,也可以是與所述推送資源對(duì)應(yīng)的服務(wù)器存在交互的用戶,例如在該服務(wù)器上進(jìn)行注冊(cè)的用戶。
本實(shí)施例中,還可以根據(jù)每一正向反饋用戶的社交影響力對(duì)正向反饋用戶進(jìn)行篩選,將社交影響力大的用戶作為新的基準(zhǔn)用戶。
由于在本實(shí)施例中,根據(jù)上一次進(jìn)行目標(biāo)資源推送的推送用戶選擇下一次進(jìn)行資源推送對(duì)應(yīng)的基準(zhǔn)用戶,從而可以進(jìn)一步提高資源推送的精準(zhǔn)度。
可選的,計(jì)算每一關(guān)系用戶與對(duì)應(yīng)的基準(zhǔn)用戶之間的相似度值和概率值的方式可以根據(jù)實(shí)際需要進(jìn)行設(shè)置,以下對(duì)此進(jìn)行詳細(xì)說明:
在一實(shí)施例中,上述步驟104包括:
將所述參數(shù)特征輸入到邏輯回歸lr(logisticregression)/支持向量機(jī)svm(supportvectormachine)模型中,預(yù)測(cè)所述每一所述關(guān)系用戶的概率值,其中,所述lr/svm模型是根據(jù)梯度提升決策樹gbdt(gradientboostingdecisiontree)樹葉子節(jié)點(diǎn)序列和所述embedding向量進(jìn)行訓(xùn)練的,所述gbdt樹葉子節(jié)點(diǎn)序列是將預(yù)設(shè)的樣本訓(xùn)練集輸入到gbdt模型中轉(zhuǎn)換獲得的。
本實(shí)施例中,采用的是有監(jiān)督相似模型預(yù)測(cè)每一關(guān)系用戶對(duì)共同點(diǎn)擊的概率??蛇x的,可以抽取2000萬好友共同點(diǎn)擊率高的樣本作為訓(xùn)練集正樣本,抽取2000萬好友共同點(diǎn)擊率低的樣本作為訓(xùn)練集的負(fù)樣本,然后從正向樣本和負(fù)向樣本中與參數(shù)特征所包含的特征類型一致的特征進(jìn)行訓(xùn)練得到gbdt模型,該gbdt模型中可以綜合考慮用戶畫像特征、興趣標(biāo)簽和好友互動(dòng)類行為特征等。如圖3所示,可以根據(jù)樣本訓(xùn)練集中的用戶畫像特征、興趣標(biāo)簽和好友互動(dòng)類行為特征訓(xùn)練gbdt模型,接著利用訓(xùn)練好的模型預(yù)測(cè)樣本訓(xùn)練集全量數(shù)據(jù)的gbdt特征,即樣本轉(zhuǎn)換后的gbdt樹葉子節(jié)點(diǎn)序列。接著根據(jù)gbdt樹葉子節(jié)點(diǎn)序列和所述embedding向量訓(xùn)練lr/svm模型,并預(yù)測(cè)每一所述關(guān)系用戶的概率值,即好友共同點(diǎn)擊的概率。
需要理解的是,當(dāng)輸入的參數(shù)特征的類型不統(tǒng)一時(shí),每一次進(jìn)行推送用戶確定時(shí),都需要進(jìn)行g(shù)bdt模型和lr/svm模型的訓(xùn)練。當(dāng)采用固定的參數(shù)特征時(shí),可以提前訓(xùn)練好,僅訓(xùn)練一次即可,也可以周期性的更新,提高準(zhǔn)確率。
可選的,參照?qǐng)D4,在另一實(shí)施例中,上述步驟104包括:
步驟1041,將所述參數(shù)特征進(jìn)行合并得到,每一所述關(guān)系用戶的第一預(yù)設(shè)維目標(biāo)向量,并將所述基準(zhǔn)用戶的參數(shù)特征進(jìn)行合并得到每一所述基準(zhǔn)用戶的第二預(yù)設(shè)維目標(biāo)向量;
步驟1042,根據(jù)預(yù)設(shè)函數(shù)計(jì)算每一所述基準(zhǔn)用戶的第二預(yù)設(shè)維目標(biāo)向量和對(duì)應(yīng)的關(guān)系用戶的第一預(yù)設(shè)維目標(biāo)向量的相似度,得到每一關(guān)系用戶與對(duì)應(yīng)的基準(zhǔn)用戶的相似度值。
本實(shí)施例中,上述基準(zhǔn)用戶的參數(shù)特征與關(guān)系用戶的參數(shù)特征所包含的特征一致,且均存儲(chǔ)在上述預(yù)設(shè)數(shù)據(jù)庫中,在提取所述關(guān)系用戶的參數(shù)特征同時(shí),可以提取基準(zhǔn)用戶的參數(shù)特征。將參數(shù)特征進(jìn)行合并是指將多個(gè)參數(shù)特征進(jìn)行組合得到多維向量,例如,可以將50維的向量和50維的特征進(jìn)行組合得到100維的向量。假設(shè)基準(zhǔn)用戶a的第二預(yù)設(shè)維目標(biāo)向量用ua表示,該ua={ui},i=1,2,····,n,關(guān)系用戶b的第一預(yù)設(shè)維目標(biāo)向量用ub表示,該ub={ui},i=1,2,····,m。然后利用函數(shù)sim(ua,ub)用于衡量用戶a與用戶b的相似度值。具體的,該sim(ua,ub)可以是皮爾遜相關(guān)系數(shù)、余弦相似度、杰卡德(jaccard)相似度和歐式距離中的任一項(xiàng)。
可選的,參照?qǐng)D5,在上述104之前還包括:
步驟107,按照相似度計(jì)算條件對(duì)所述參數(shù)特征中的特征進(jìn)行過濾;
上述步驟104具體包括:根據(jù)過濾后的參數(shù)特征確定每一所述關(guān)系用戶與對(duì)應(yīng)的基準(zhǔn)用戶的相似度值,或根據(jù)過濾后的參數(shù)特征確定每一所述關(guān)系用戶的概率值。
本實(shí)施例中,可以提供一個(gè)相似度計(jì)算條件的選擇按鈕供用戶輸入,基于用戶輸入的相似度計(jì)算條件對(duì)獲取的參數(shù)特征進(jìn)行篩選,然后將篩選后的參數(shù)特征輸入后后續(xù)的相似度模型中進(jìn)行相似度值的計(jì)算或者概率值的預(yù)測(cè)。
其中,上述相似度計(jì)算條件可以包括但不限于以下三種:綜合相似性、興趣相似性和好友相互影響力??梢愿鶕?jù)用戶選擇的不同相似度計(jì)算條件對(duì)獲取的參數(shù)特征進(jìn)行篩選,例如,選擇綜合相似性,則可以不進(jìn)行篩選,如選擇興趣相似性,則可以篩選去除embedding向量中的部分特征,選擇好友相互影響力,則可以篩選去除興趣標(biāo)簽等,具體的,篩選原則和篩選實(shí)例在此不再詳述。由于增加了對(duì)參數(shù)特征的篩選,從而可以提高對(duì)資源推送的針對(duì)性,提高用戶對(duì)資源的點(diǎn)擊率。
可以理解的是,對(duì)于上述目標(biāo)資源推送的內(nèi)容可以根據(jù)實(shí)際需要進(jìn)行設(shè)置,以下將會(huì)以廣告資源推送為例進(jìn)行詳細(xì)說明。
具體的,參照?qǐng)D6,廣告投放商可以廣告投放界面中種子用戶上傳界面中選擇需要使用的種子用戶,例如上傳新的種子用戶和或者從已有的用戶包中選擇種子用戶,若采用上傳新的種子用戶時(shí),顯示相應(yīng)的操作按鈕供用戶進(jìn)行種子用戶的上傳。同時(shí),還設(shè)有關(guān)系鏈標(biāo)簽供用戶選擇需要擴(kuò)散的目標(biāo)關(guān)系鏈,該關(guān)系鏈標(biāo)簽包括:不限、同事、親人和同學(xué)四個(gè)選項(xiàng)按鈕。此外還設(shè)有擴(kuò)散規(guī)模,供用戶選擇廣告資源擴(kuò)散的用戶量,該用戶量可以為廣告資源一次的擴(kuò)散量,也可以廣告資源總擴(kuò)散量,根據(jù)總擴(kuò)散量計(jì)算每一次資源推送時(shí),廣告資源的擴(kuò)散量。在用戶設(shè)置好相應(yīng)的條件后,可以點(diǎn)擊開始擴(kuò)散按鈕,此時(shí)將會(huì)將用戶在種子用戶上傳界面中設(shè)置的條件和上傳的種子用戶發(fā)送給后臺(tái)系統(tǒng),由后臺(tái)系統(tǒng)進(jìn)行廣告資源的用戶的確定。
進(jìn)一步的,參照?qǐng)D7,在后臺(tái)系統(tǒng)中,包括離線計(jì)算部分a和實(shí)時(shí)計(jì)算部分b。
離線計(jì)算部分a中具有用戶歷史行為數(shù)據(jù)庫、用戶興趣標(biāo)簽挖掘模塊、精準(zhǔn)用戶畫像模塊和圖特征embedding模塊。其中,用戶歷史行為數(shù)據(jù)庫可以拉取基礎(chǔ)日志得到用戶的歷史行為,該基礎(chǔ)日志可以包括:社交日志、支付日志、游戲日志、電商日志和o2o(onlinetooffline,線上到線下)日志等。如圖8所示,然后由用戶興趣標(biāo)簽挖掘模塊和精準(zhǔn)用戶畫像模塊通過對(duì)用戶注冊(cè)類數(shù)據(jù)、行為類數(shù)據(jù)、ugc(usergeneratedcontent,用戶原創(chuàng)內(nèi)容)數(shù)據(jù)等清洗處理,通過挖掘模型和語意分析技術(shù),獲取用戶精準(zhǔn)興趣標(biāo)簽和全方位的用戶畫像特征。圖特征embedding模塊,抽取用戶的共同類網(wǎng)絡(luò),分別通過網(wǎng)絡(luò)嵌入networkembedding技術(shù),將共同類網(wǎng)絡(luò)中的節(jié)點(diǎn)(node)(即用戶位于共同類網(wǎng)絡(luò)中的節(jié)點(diǎn))映射為空間的一個(gè)向量。networkembedding是一種圖特征表達(dá)的學(xué)習(xí)算法,也就是通過一種映射方法f得到d維向量空間rd的向量vec,利用該空間中的一個(gè)向量表達(dá)網(wǎng)絡(luò)中的一個(gè)節(jié)點(diǎn)u,具體直觀圖如圖9所示。在此模塊中,我們采用deepwalk(該deepwalk是指一種訓(xùn)練網(wǎng)絡(luò)節(jié)點(diǎn)潛在向量表示的方法)、node2vec(即網(wǎng)絡(luò)節(jié)點(diǎn)的向量化)技術(shù)對(duì)用戶在微信平臺(tái)上的共同類網(wǎng)絡(luò),即共同好友網(wǎng)絡(luò)、共同關(guān)注公眾號(hào)網(wǎng)絡(luò)、共同閱讀公眾號(hào)文章網(wǎng)絡(luò)、互動(dòng)類行為網(wǎng)絡(luò),分別得到這些網(wǎng)絡(luò)節(jié)點(diǎn)在低維空間的描述向量,即上述embedding向量。
實(shí)時(shí)計(jì)算部分b包括圈子定向關(guān)系鏈拉取模塊、基準(zhǔn)用戶提供模塊、標(biāo)簽定向過濾模塊、有監(jiān)督相似度模型、無監(jiān)督相似度模型、排序過濾模塊和廣告實(shí)時(shí)反饋數(shù)據(jù)庫。在進(jìn)行第一次廣告資源推送時(shí),基準(zhǔn)用戶提供模塊可以獲取廣告投放商在系統(tǒng)前端交互的種子用戶上傳界面設(shè)置的種子用戶以及關(guān)系鏈標(biāo)簽,然后輸出給圈子定向關(guān)系鏈拉取模塊,由圈子定向關(guān)系鏈拉取模塊根據(jù)廣告投放商在系統(tǒng)前端交互的種子用戶上傳界面設(shè)置的種子用戶以及關(guān)系鏈標(biāo)簽從用戶興趣標(biāo)簽挖掘模塊、精準(zhǔn)用戶畫像模塊和圖特征embedding模塊中拉取關(guān)系用戶和基準(zhǔn)用戶的參數(shù)特征。圈子定向關(guān)系鏈拉取模塊將拉取的參數(shù)特征輸出到標(biāo)簽定向過濾模塊進(jìn)行預(yù)設(shè)特征過濾,然后將過濾后的參數(shù)特征輸出到有監(jiān)督相似度模型進(jìn)行共同點(diǎn)擊概率的預(yù)測(cè)或輸出到無監(jiān)督相似度模型進(jìn)行相似度值的計(jì)算。接收由排序過濾模塊對(duì)每一關(guān)系用戶進(jìn)行排序,然后確定推送廣告資源的推送用戶,由于在第一次進(jìn)行廣告資源推送時(shí),種子用戶也需要進(jìn)行廣告資源推送,因此也會(huì)將種子用戶納入到推送用戶中。在后續(xù)推送時(shí),排序過濾模塊將會(huì)過濾掉已經(jīng)進(jìn)行同一廣告資源推送的關(guān)系用戶后,再進(jìn)行排序確定推送用戶。
排序過濾模塊確定推送用戶后,將會(huì)通過廣告投放系統(tǒng)接口將推送用戶發(fā)送給廣告投放系統(tǒng),由廣告投放系統(tǒng)進(jìn)行廣告資源的推送。廣告實(shí)時(shí)反饋數(shù)據(jù)庫將會(huì)實(shí)時(shí)獲取每一推送用戶的反饋情況,在下一次進(jìn)行廣告資源推送時(shí),基準(zhǔn)用戶提供模塊將會(huì)獲取廣告實(shí)時(shí)反饋數(shù)據(jù)庫中廣告資源正向反饋用戶,然后重新確定基準(zhǔn)用戶進(jìn)行廣告資源推送。
例如廣告資源的推送量為500萬,可以分5次進(jìn)行廣告資源推送,由于本發(fā)明基于社交影響力的社會(huì)強(qiáng)化效應(yīng),引入動(dòng)態(tài)投放策略,可以大幅度提升點(diǎn)擊量和互動(dòng)率,提高廣告資源推送的效果。
參照?qǐng)D10,本發(fā)明還提供了一種資源推送裝置,該資源推送裝置包括:
關(guān)系鏈獲取模塊1001,用于獲取基準(zhǔn)用戶的目標(biāo)關(guān)系鏈;
第一確定模塊1002,用于根據(jù)所述基準(zhǔn)用戶和目標(biāo)關(guān)系鏈確定基準(zhǔn)用戶的關(guān)系用戶;
圈子定向關(guān)系鏈拉取模塊1003,用于從預(yù)設(shè)數(shù)據(jù)庫中獲取所述關(guān)系用戶的參數(shù)特征;
第二確定模塊1004,用于根據(jù)所述參數(shù)特征確定每一所述關(guān)系用戶與對(duì)應(yīng)的基準(zhǔn)用戶的相似度值,或根據(jù)所述參數(shù)特征確定每一所述關(guān)系用戶的概率值;
排序過濾模塊1005,用于根據(jù)所述相似度值或概率值從所述關(guān)系用戶中確定推送用戶,向所述推送用戶推送目標(biāo)資源。
可選的,參照?qǐng)D11,所述裝置還包括:基準(zhǔn)用戶提供模塊1006,用于從所述推送用戶中選擇下一次對(duì)所述目標(biāo)資源進(jìn)行資源推送的基準(zhǔn)用戶。
可選的,所述基準(zhǔn)用戶提供模塊具體用于,將所述推送用戶中的正向反饋用戶設(shè)定為下一次對(duì)所述目標(biāo)資源進(jìn)行資源推送的基準(zhǔn)用戶。
可選的,所述參數(shù)特征包括用戶畫像特征和embedding向量,所述embedding向量為用戶位于共同類網(wǎng)絡(luò)中的網(wǎng)絡(luò)節(jié)點(diǎn)所映射的向量。
可選的,所述第二確定模塊1004具體用于:將所述參數(shù)特征輸入到邏輯回歸lr/支持向量機(jī)svm模型中,預(yù)測(cè)所述每一所述關(guān)系用戶的概率值,其中,所述lr/svm模型是根據(jù)gbdt樹葉子節(jié)點(diǎn)序列和所述embedding向量進(jìn)行訓(xùn)練的,所述gbdt樹葉子節(jié)點(diǎn)序列是將預(yù)設(shè)的樣本訓(xùn)練集輸入到gbdt模型中轉(zhuǎn)換獲得的。
可選的,參照?qǐng)D12,所述第二確定模塊1004包括:
向量合成子模塊10041,用于將所述參數(shù)特征進(jìn)行合并得到,每一所述關(guān)系用戶的第一預(yù)設(shè)維目標(biāo)向量,并將所述基準(zhǔn)用戶的參數(shù)特征進(jìn)行合并得到每一所述基準(zhǔn)用戶的第二預(yù)設(shè)維目標(biāo)向量;
計(jì)算子模塊10042,用于根據(jù)預(yù)設(shè)函數(shù)計(jì)算每一所述基準(zhǔn)用戶的第二預(yù)設(shè)維目標(biāo)向量和對(duì)應(yīng)的關(guān)系用戶的第一預(yù)設(shè)維目標(biāo)向量之間的相似度,得到每一關(guān)系用戶與對(duì)應(yīng)的基準(zhǔn)用戶之間的相似度值。
可選的,所述預(yù)設(shè)函數(shù)包括皮爾遜相關(guān)系數(shù)、余弦相似度、jaccard相似度和歐式距離中的任一項(xiàng)。
可選的,所述參數(shù)特征還包括:用于反應(yīng)用戶喜好資源類型的興趣標(biāo)簽。
可選的,參照?qǐng)D13,所述裝置還包括:
特征過濾模塊1007,用于按照相似度計(jì)算條件對(duì)所述參數(shù)特征中的特征進(jìn)行過濾;
所述第二確定模塊1004具體用于:根據(jù)過濾后的參數(shù)特征確定每一所述關(guān)系用戶與對(duì)應(yīng)的基準(zhǔn)用戶的相似度值,或根據(jù)過濾后的參數(shù)特征確定每一所述關(guān)系用戶的概率值。
這樣,本發(fā)明實(shí)施例中,獲取基準(zhǔn)用戶的目標(biāo)關(guān)系鏈;根據(jù)所述基準(zhǔn)用戶和目標(biāo)關(guān)系鏈確定所述基準(zhǔn)用戶的關(guān)系用戶;從預(yù)設(shè)數(shù)據(jù)庫中獲取所述關(guān)系用戶的參數(shù)特征;根據(jù)所述參數(shù)特征確定每一所述關(guān)系用戶與對(duì)應(yīng)的基準(zhǔn)用戶的相似度值,或根據(jù)所述參數(shù)特征確定每一所述關(guān)系用戶的概率值;根據(jù)所述相似度值或概率值從所述關(guān)系用戶中確定推送用戶,向所述推送用戶推送目標(biāo)資源。由于在本發(fā)明實(shí)施例中采用基準(zhǔn)用戶的關(guān)系用戶作為候選用戶集,然后從候選用戶集中選取推送用戶,從而有效利用了用戶群社交同質(zhì)性(相似性)以及用戶群社交影響力,因此提高了對(duì)資源推送的精準(zhǔn)度,進(jìn)而提升了資源推送的效果。
參照?qǐng)D14,圖14是本發(fā)明實(shí)施例提供的服務(wù)器的結(jié)構(gòu)圖,如圖14所示服務(wù)器包括:至少一個(gè)處理器1401、存儲(chǔ)器1402、至少一個(gè)網(wǎng)絡(luò)接口1404和用戶接口1403。服務(wù)器中的各個(gè)組件通過總線系統(tǒng)1405耦合在一起??衫斫猓偩€系統(tǒng)1405用于實(shí)現(xiàn)這些組件之間的連接通信??偩€系統(tǒng)1405除包括數(shù)據(jù)總線之外,還包括電源總線、控制總線和狀態(tài)信號(hào)總線。但是為了清楚說明起見,在圖14中將各種總線都標(biāo)為總線系統(tǒng)1405。
其中,用戶接口1403可以包括顯示器、鍵盤或者點(diǎn)擊設(shè)備(例如,鼠標(biāo),軌跡球(trackball)、觸感板或者觸摸屏等。
可以理解,本發(fā)明實(shí)施例中的存儲(chǔ)器1402可以是易失性存儲(chǔ)器或非易失性存儲(chǔ)器,或可包括易失性和非易失性存儲(chǔ)器兩者。其中,非易失性存儲(chǔ)器可以是只讀存儲(chǔ)器(read-onlymemory,rom)、可編程只讀存儲(chǔ)器(programmablerom,prom)、可擦除可編程只讀存儲(chǔ)器(erasableprom,eprom)、電可擦除可編程只讀存儲(chǔ)器(electricallyeprom,eeprom)或閃存。易失性存儲(chǔ)器可以是隨機(jī)存取存儲(chǔ)器(randomaccessmemory,ram),其用作外部高速緩存。通過示例性但不是限制性說明,許多形式的ram可用,例如靜態(tài)隨機(jī)存取存儲(chǔ)器(staticram,sram)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(dynamicram,dram)、同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(synchronousdram,sdram)、雙倍數(shù)據(jù)速率同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(doubledataratesdram,ddrsdram)、增強(qiáng)型同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(enhancedsdram,esdram)、同步連接動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(synchlinkdram,sldram)和直接內(nèi)存總線隨機(jī)存取存儲(chǔ)器(directrambusram,drram)。本文描述的系統(tǒng)和方法的存儲(chǔ)器1402旨在包括但不限于這些和任意其它適合類型的存儲(chǔ)器。
在一些實(shí)施方式中,存儲(chǔ)器1402存儲(chǔ)了如下的元素,可執(zhí)行模塊或者數(shù)據(jù)結(jié)構(gòu),或者他們的子集,或者他們的擴(kuò)展集:操作系統(tǒng)14021和應(yīng)用程序14022。
其中,操作系統(tǒng)14021,包含各種系統(tǒng)程序,例如框架層、核心庫層、驅(qū)動(dòng)層等,用于實(shí)現(xiàn)各種基礎(chǔ)業(yè)務(wù)以及處理基于硬件的任務(wù)。應(yīng)用程序14022,包含各種應(yīng)用程序,例如媒體播放器(mediaplayer)、瀏覽器(browser)等,用于實(shí)現(xiàn)各種應(yīng)用業(yè)務(wù)。實(shí)現(xiàn)本發(fā)明實(shí)施例方法的程序可以包含在應(yīng)用程序14022中。
在本發(fā)明實(shí)施例中,通過調(diào)用存儲(chǔ)器1402存儲(chǔ)的程序或指令,具體的,可以是應(yīng)用程序14022中存儲(chǔ)的程序或指令,處理器1401用于:獲取基準(zhǔn)用戶的目標(biāo)關(guān)系鏈;根據(jù)所述基準(zhǔn)用戶和目標(biāo)關(guān)系鏈確定所述基準(zhǔn)用戶的關(guān)系用戶;從預(yù)設(shè)數(shù)據(jù)庫中獲取所述關(guān)系用戶的參數(shù)特征;根據(jù)所述參數(shù)特征確定每一所述關(guān)系用戶與對(duì)應(yīng)的基準(zhǔn)用戶的相似度值,或根據(jù)所述參數(shù)特征確定每一所述關(guān)系用戶的概率值;根據(jù)所述相似度值或概率值從所述關(guān)系用戶中確定推送用戶,向所述推送用戶推送目標(biāo)資源。
可選的,處理器1401還用于:從所述推送用戶中選擇下一次對(duì)所述目標(biāo)資源進(jìn)行資源推送的基準(zhǔn)用戶。
可選的,處理器1401還用于:將所述推送用戶中的正向反饋用戶設(shè)定為下一次對(duì)所述目標(biāo)資源進(jìn)行資源推送的基準(zhǔn)用戶。
可選的,所述參數(shù)特征包括用戶畫像特征和embedding向量,所述embedding向量為用戶位于共同類網(wǎng)絡(luò)中的網(wǎng)絡(luò)節(jié)點(diǎn)所映射的向量。
可選的,處理器1401還用于:將所述參數(shù)特征輸入到邏輯回歸lr/支持向量機(jī)svm模型中,預(yù)測(cè)所述每一所述關(guān)系用戶的概率值,其中,所述lr/svm模型是根據(jù)gbdt樹葉子節(jié)點(diǎn)序列和所述embedding向量進(jìn)行訓(xùn)練的,所述gbdt樹葉子節(jié)點(diǎn)序列是將預(yù)設(shè)的樣本訓(xùn)練集輸入到gbdt模型中轉(zhuǎn)換獲得的。
可選的,所述目標(biāo)用戶還包括基準(zhǔn)用戶,處理器1401還用于:將所述參數(shù)特征進(jìn)行合并得到,每一所述關(guān)系用戶的第一預(yù)設(shè)維目標(biāo)向量,并將所述基準(zhǔn)用戶的參數(shù)特征進(jìn)行合并得到每一所述基準(zhǔn)用戶的第二預(yù)設(shè)維目標(biāo)向量;根據(jù)預(yù)設(shè)函數(shù)計(jì)算每一所述基準(zhǔn)用戶的第二預(yù)設(shè)維目標(biāo)向量和對(duì)應(yīng)的關(guān)系用戶的第一預(yù)設(shè)維目標(biāo)向量之間的相似度,得到每一關(guān)系用戶與對(duì)應(yīng)的基準(zhǔn)用戶之間的相似度值。
可選的,所述預(yù)設(shè)函數(shù)包括皮爾遜相關(guān)系數(shù)、余弦相似度、jaccard相似度和歐式距離中的任一項(xiàng)。
可選的,所述參數(shù)特征還包括:用于反應(yīng)用戶喜好資源類型的興趣標(biāo)簽。
可選的,處理器1401還用于:按照相似度計(jì)算條件對(duì)所述參數(shù)特征中的特征進(jìn)行過濾。
本發(fā)明實(shí)施例還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任意一個(gè)方法實(shí)施例中的資源推送方法中的步驟。
本領(lǐng)域普通技術(shù)人員可以意識(shí)到,結(jié)合本文中所公開的實(shí)施例描述的各示例的單元及算法步驟,能夠以電子硬件、或者計(jì)算機(jī)軟件和電子硬件的結(jié)合來實(shí)現(xiàn)。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以對(duì)每個(gè)特定的應(yīng)用來使用不同方法來實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。
所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述的系統(tǒng)、裝置和單元的具體工作過程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過程,在此不再贅述。
在本申請(qǐng)所提供的實(shí)施例中,應(yīng)該理解到,所揭露的裝置和方法,可以通過其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機(jī)械或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上。可以根據(jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本發(fā)明實(shí)施例方案的目的。
另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。
所述功能如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:u盤、移動(dòng)硬盤、rom、ram、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以權(quán)利要求的保護(hù)范圍為準(zhǔn)。