目標(biāo)用戶定向方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息技術(shù)領(lǐng)域,尤其涉及一種目標(biāo)用戶定向方法及裝置。
【背景技術(shù)】
[0002]隨著信息技術(shù)的發(fā)展,在信息推送領(lǐng)域確定出信息推送的目標(biāo)用戶以提升信息推送的效率是現(xiàn)有技術(shù)中一直致力解決的問題。所述信息推送包括廣告推送,向用戶推薦的視頻、音頻以及圖文信息等。這個(gè)時(shí)候?yàn)榱藴p少用戶對信息推送的反感,提升用戶使用滿意度及推送信息的傳達(dá)和轉(zhuǎn)換效率,通常需要選擇可能對推送信息感興趣的用戶,就出現(xiàn)了定位目標(biāo)用戶。在現(xiàn)有技術(shù)中提供了以下幾種定位目標(biāo)用戶的方法:
[0003]第一種:將一段時(shí)間內(nèi)轉(zhuǎn)化用戶作為種子用戶,作為正樣本用戶;將未轉(zhuǎn)化的用戶作為負(fù)樣本用戶;然后對用戶查詢行為,網(wǎng)頁瀏覽行為及社交數(shù)據(jù)等用戶特征進(jìn)行抽取,根據(jù)抽取的用戶行為得到轉(zhuǎn)化模型;利用該轉(zhuǎn)換模型對所有用戶進(jìn)行預(yù)估,確定是否為該廣告的受眾。
[0004]第二種:利用發(fā)生過轉(zhuǎn)換行為的用戶作為正樣本用戶,其他用戶作為負(fù)樣本用戶得到一個(gè)初選模型;該模型主要關(guān)注用戶方位過廣告的網(wǎng)頁的這一特征。還會利用精選模型來定位目標(biāo)用戶,在精選模型中不僅會關(guān)注用戶是否訪問過對應(yīng)的網(wǎng)站,還會關(guān)注用戶更多的屬性標(biāo)簽。這里的屬性標(biāo)簽可包括分類標(biāo)簽,包括用戶關(guān)注的與廣告網(wǎng)站關(guān)聯(lián)的特征等。結(jié)合初選模型和精選模型來定位目標(biāo)用戶。
[0005]第三種:首先利用用戶注冊、行為、社交等數(shù)據(jù)抽取用戶特征,并建立倒排索引,索引項(xiàng)是特征,索引值是用戶,定期更新;然后廣告主給定種子用戶號碼包之后,在抽取的用戶特征基礎(chǔ)上,基于互信息等特征選擇方法篩選出相關(guān)性較高的特征子集;最后使用相關(guān)性高的特征子集構(gòu)造檢索查詢相似用戶,類似搜索引擎檢索相似文檔的過程。廣告主根據(jù)擴(kuò)展的相似用戶做畫像分析,決定是否使用該功能。除了提供在線檢索擴(kuò)展相似用戶之外,還提供了離線挖掘模型,同樣的,在給定種子用戶號碼包高相關(guān)性特征基礎(chǔ)上,對用戶做局部敏感哈希聚類,通過計(jì)算海明距離挖掘相似用戶。
[0006]雖然上述方法實(shí)現(xiàn)了目標(biāo)用戶的定位,但是目標(biāo)用戶定位的精確度依然很低,采用上述方法定位目標(biāo)用戶之后存在將非目標(biāo)用戶錯(cuò)誤的認(rèn)定為了目標(biāo)用戶或遺漏真正的目標(biāo)用戶。
【發(fā)明內(nèi)容】
[0007]有鑒于此,本發(fā)明實(shí)施例期望提供一種目標(biāo)用戶定位方法及裝置,至少部分解決目標(biāo)用戶定位不夠精確的問題。
[0008]為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
[0009]本發(fā)明實(shí)施例第一方面提供一種目標(biāo)用戶定向方法,所述方法包括:
[0010]基于種子用戶的用戶特征,生成虛擬用戶;
[0011 ]將所述種子用戶和所述虛擬用戶共同作為正樣本用戶;
[0012]確定負(fù)樣本用戶;
[0013]分別抽取所述正樣本用戶和所述負(fù)樣本用戶的用戶特征;
[0014]基于所述正樣本用戶和所述負(fù)樣本用戶的用戶特征進(jìn)行訓(xùn)練,確定出定向參數(shù);
[0015]基于所述定向參數(shù),定位出與所述種子用戶滿足預(yù)定相似度條件的目標(biāo)用戶。
[0016]基于上述方案,所述基于種子用戶的用戶特征,生成虛擬用戶,包括:
[0017]確定所述種子用戶在特征空間的第一位置;
[0018]基于至少兩個(gè)所述第一位置確定第二位置;
[0019]基于所述第二位置確定所述虛擬用戶的用戶特征并生成虛擬用戶。
[0020]基于上述方案,所述基于種子用戶的用戶特征,生成虛擬用戶,包括:
[0021]提取所述種子用戶的用戶特征中的數(shù)值用戶特征;
[0022]基于所述數(shù)值用戶特征,確定數(shù)值用戶特征的可選范圍;
[0023]從所述可選范圍選出一個(gè)數(shù)值作為所述虛擬用戶的數(shù)值用戶特征;
[0024]提取所述種子用戶的用戶特征中的非數(shù)值用戶特征,并對所述非數(shù)值用戶特征賦予概率值;
[0025]基于所述概率值確定所述虛擬用戶的非數(shù)值用戶特征。
[0026]基于上述方案,所述確定負(fù)樣本用戶,包括:
[0027]基于所述種子用戶的用戶特征,計(jì)算備選樣本用戶與所述種子用戶的相似度;
[0028]基于所述相似度,確定滿足負(fù)樣本用戶條件的所述備選樣本用戶,作為所述樣本用戶中的負(fù)樣本用戶。
[0029]基于上述方案,所述基于所述正樣本用戶和所述負(fù)樣本用戶的用戶特征進(jìn)行訓(xùn)練,確定出定向參數(shù),包括:
[0030]利用所述正樣本用戶和所述負(fù)樣本用戶的用戶特征進(jìn)行模型訓(xùn)練,確定出選擇目標(biāo)用戶的分類模型。
[0031]基于上述方案,所述利用所述樣本用戶的用戶特征進(jìn)行模型訓(xùn)練,確定出選擇目標(biāo)用戶的訓(xùn)練模型,包括:
[0032]將所述正樣本用戶和負(fù)樣本用戶均分為訓(xùn)練集、驗(yàn)證集和測試集;
[0033]利用所述訓(xùn)練集,采用不同的訓(xùn)練算法進(jìn)行模型訓(xùn)練;
[0034]利用所述驗(yàn)證集驗(yàn)證對所述模型訓(xùn)練是否需要繼續(xù);
[0035]在停止所述模型訓(xùn)練后,利用所述測試集對各所述訓(xùn)練算法得到的備選模型進(jìn)行效果評估;
[0036]基于所述效果評估,選擇出一個(gè)所述備選模型作為所述分類模型。
[0037]本發(fā)明實(shí)施例第二方面提供一種目標(biāo)用戶定向裝置,所述裝置包括:
[0038]生成單元,用于基于種子用戶的用戶特征,生成虛擬用戶;
[0039]第一確定單元,用于將所述種子用戶和所述虛擬用戶共同作為正樣本用戶;
[0040]第二確定單元,用于確定負(fù)樣本用戶;
[0041]訓(xùn)練單元,用于分別抽取所述正樣本用戶和所述負(fù)樣本用戶的用戶特征;
[0042]定位單元,用于基于所述定向參數(shù),定位出與所述種子用戶滿足預(yù)定相似度條件的目標(biāo)用戶。
[0043]基于上述方案,所述生成單元,用于確定所述種子用戶在特征空間的第一位置;基于至少兩個(gè)所述第一位置確定第二位置;基于所述第二位置確定所述虛擬用戶的用戶特征并生成虛擬用戶。
[0044]基于上述方案,所述生成單元,具體用于提取所述種子用戶的用戶特征中的數(shù)值用戶特征;基于所述數(shù)值用戶特征,確定數(shù)值用戶特征的可選范圍;從所述可選范圍選出一個(gè)數(shù)值作為所述虛擬用戶的數(shù)值用戶特征;提取所述種子用戶的用戶特征中的非數(shù)值用戶特征,并對所述非數(shù)值用戶特征賦予概率值;基于所述概率值確定所述虛擬用戶的非數(shù)值用戶特征。
[0045]基于上述方案,所述第二確定單元,具體用于基于所述種子用戶的用戶特征,計(jì)算備選樣本用戶與所述種子用戶的相似度;基于所述相似度,確定滿足負(fù)樣本用戶條件的所述備選樣本用戶,作為所述樣本用戶中的負(fù)樣本用戶。
[0046]基于上述方案,所述訓(xùn)練單元,具體用于利用所述正樣本用戶和所述負(fù)樣本用戶的用戶特征進(jìn)行模型訓(xùn)練,確定出選擇目標(biāo)用戶的分類模型。
[0047]基于上述方案,所述訓(xùn)練單元,具體用于將所述正樣本用戶和負(fù)樣本用戶均分為訓(xùn)練集、驗(yàn)證集和測試集;利用所述訓(xùn)練集,采用不同的訓(xùn)練算法進(jìn)行模型訓(xùn)練;利用所述驗(yàn)證集驗(yàn)證對所述模型訓(xùn)練是否需要繼續(xù);在停止所述模型訓(xùn)練后,利用所述測試集對各所述訓(xùn)練算法得到的備選模型進(jìn)行效果評估;基于所述效果評估,選擇出一個(gè)所述備選模型作為所述分類模型。
[0048]本發(fā)明實(shí)施例所述目標(biāo)用戶定位方法及裝置,首先將基于種子用戶的用戶特征生成虛擬用戶,將種子用戶和虛擬用戶共同作為正樣本用戶,顯然增加正樣本用戶的數(shù)量,顯然可以緩解因正樣本用戶數(shù)量少而負(fù)樣本數(shù)量多,導(dǎo)致的訓(xùn)練數(shù)據(jù)不平衡為題,進(jìn)而可以緩解因數(shù)據(jù)不平衡導(dǎo)致訓(xùn)練得到的定向參數(shù)的鑒別能夠不夠強(qiáng),及目標(biāo)用戶定位精確度低的現(xiàn)象。
【附圖說明】
[0049]圖1為本發(fā)明實(shí)施例提供的第一種目標(biāo)用戶定向方法的流程示意圖;
[0050]圖2為本發(fā)明實(shí)施例提供的確定正樣本用戶的流程示意圖;
[0051 ]圖3為本發(fā)明實(shí)施例提供的第一種虛擬用戶的生成示意圖;
[0052]圖4為本發(fā)明實(shí)施例提供的第二種虛擬用戶的生成示意圖;
[0053]圖5A為本發(fā)明實(shí)施例提供的第一種確定負(fù)樣本用戶的流程示意圖;
[0054]圖5B為本發(fā)明實(shí)施例提供的第二種確定負(fù)樣本用戶的流程示意圖;
[0055]圖6為本發(fā)明實(shí)施例提供的定向參數(shù)的確定方法流程示意圖;
[0056]圖7為本發(fā)明實(shí)施例提供的第二種目標(biāo)用戶定向方法的流程示意圖;
[0057]圖8為本發(fā)明實(shí)施例提供的一種目標(biāo)用戶定向裝置的結(jié)構(gòu)示意圖;
[0058]圖9為本發(fā)明實(shí)施例提供的另一種目標(biāo)用戶定向裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0059]以下結(jié)合說明書附圖及具體實(shí)施例對本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)闡述。
[0060]實(shí)施例一:
[0061]如圖1所示,本實(shí)施例提供一種目標(biāo)用戶定向方法,所述方法包括:
[0062]步驟S110:基于種子用戶的用戶特征,生成虛擬用戶;
[0063]步驟S120:將所述種子用戶和所述虛擬用戶共同作為正樣本用戶;
[0064]步驟S130:確定負(fù)樣本用戶;
[0065]步驟S140:分別抽取所述正樣本用戶和所述負(fù)樣本用戶的用戶特征;
[0066]步驟S150:基于所述定向參數(shù),定位出與所述種子用戶滿足預(yù)定相