亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種廣告人群篩選方法

文檔序號:8431374閱讀:268來源:國知局
一種廣告人群篩選方法
【技術領域】
[0001]本發(fā)明涉及一種廣告人群篩選方法。
【背景技術】
[0002]在廣告人群定向中,現有一種方法是根據廣告主提供的種子用戶信息,結合廣告平臺更豐富的數據,為廣告主尋找到行為上相似的潛在客戶。然而,廣告主提供的原始種子用戶量相對太少,無法滿足廣告主接觸潛在用戶的需求,因此不能僅僅依靠種子用戶來投送廣告。
[0003]特別是在視頻媒體領域的廣告投放中,由于訪客用戶不用注冊即可觀看視頻,而且注冊用戶的信息量也相對較少,因此,視頻媒體領域所獲取的用戶信息相對于淘寶、京東類的購物網站來說較弱。所以,直接使用廣告主提供的種子用戶來尋找相似用戶則精準度較為欠缺。如何有效地在視頻媒體領域投放廣告成為亟待解決的問題。

【發(fā)明內容】

[0004]我們注意到,視頻媒體領域的最大優(yōu)勢在于擁有豐富的視頻資源,而且視頻上擁有豐富而準確的視頻標簽,同時,用戶的觀看習慣是可以通過視頻標簽影射出來的。因此,我們充分利用視頻媒體平臺的優(yōu)勢,并不直接通過種子用戶找相似用戶,而是基于豐富的視頻和視頻標簽資源,先對相似視頻進行聚類,然后通過用戶對視頻的觀看訂閱等行為習慣將視頻聚類結果轉換為用戶聚類結果,此時就可以找到與種子對應的用戶聚類,最后對這些聚類中的用戶進行抽取排序找到滿足需求的潛在客戶。
[0005]通過本發(fā)明提出的方法,能夠避免視頻媒體用戶信息較弱的缺陷,充分利用視頻媒體的視頻和標簽資源豐富的優(yōu)勢,將直接尋找相似用戶轉換為先對視頻與標簽的聚類。本發(fā)明還充分利用用戶在視頻媒體中的行為日志來搭建用戶與視頻或標簽的關系橋梁,通過這種關系,可以通過用戶喜歡的視頻或標簽類別來找到相似視頻與相似用戶的映射關系O
【附圖說明】
[0006]本發(fā)明將參照附圖來進一步詳細說明,其中:
[0007]圖1是本發(fā)明方法的流程圖。
【具體實施方式】
[0008]下面結合圖1詳細描述本發(fā)明。本發(fā)明的基于Look-alike的廣告人群篩選方法包括:
[0009]第一步,將視頻媒體的視頻標簽映射為X維標簽向量,之后通過將視頻的所有標簽向量累加后平均,得到每個視頻的X維視頻向量。
[0010]視頻媒體一般都擁有百萬級的視頻標簽資源,使用google的深度學習工具Word2Vec將每一個視頻標簽(即視頻作者為視頻總結的能反映視頻主題的詞)映射為X維向量,而向量空間上的相似度可以用來表示視頻標簽語義上的相似度。X參數的取值一般為10到200之間(取值太大可能會出現維數災難,且計算復雜度過高,取值太小可能不能表達完整的語義空間,具體取值可根據多次試驗后取最優(yōu)值),在本實施例中X參數取值20。
[0011]由于每個視頻都會有一個或多個視頻標簽,這些標簽代表了該視頻的相關內容或看點,一般的,一個視頻上的標簽往往語義上較為相似,所以可以把一個視頻上的所有標簽的向量通過累加平均的方式聚合成一個向量,將每個視頻的所有標簽向量的相應維度的值進行累加后平均,最后得到每個視頻的一個X維視頻向量。
[0012]第二步,對視頻進行聚類,得到相似視頻聚類結果。
[0013]每個聚類中的視頻是標簽相似、內容或主題相近的,由于視頻的數據量巨大,而且聚類過程需要對視頻向量進行相似度計算,我們采用分布式計算平臺Spark中MLlib組件中的K-Means算法完成此聚類過程,K聚類數的取值視情況而定,在本實施例中K聚類數取值 10000ο
[0014]第三步,將相似視頻聚類結果轉換為相似用戶聚類結果。
[0015]用戶對自己喜愛的視頻往往會留下“觀看”,“訂閱”,“評論”,“頂”等行為日志,這些行為日志搭建了用戶與視頻之間的關系橋梁。通過收集這些行為日志,將相似視頻聚類結果轉換為相似用戶聚類結果,每個用戶聚類結果中的用戶是興趣相似、觀看習慣相近的。
[0016]第四步,從種子用戶中提取聚類結果,進行相似度排序,從而確定用戶排名。
[0017]從廣告主得到種子用戶后,通過相似用戶聚類結果找到種子用戶所在的N個聚類,將N個聚類的用戶抽取出來,進行相似度排序,確定排名在前的用戶是滿足需求的潛在客戶,并進行廣告投放。
[0018]下面通過具體示例描述本發(fā)明。
[0019]示例一,對3C人群種子擴充篩選的示例
[0020]廣告主計劃向3C人群投放廣告,其提供少量3C人群種子cookie,3C人群是一類對科技、通訊、IT電子產品等感興趣的一類較高端人群,這類人群是該廣告主希望定向的目標。在視頻媒體的科技頻道中,大多數視頻的標簽都是與計算機、通訊、電子產品等相關的,如微軟、小米、錘子手機、iphone6、Nexus6、機器人等等。第一步,通過word2vec將視頻標簽向量化,將每個視頻的所有標簽向量的相應維度的值進行累加后平均,最后得到每個視頻的X維視頻向量,類別相近的標簽的向量相似度高,比如小米與錘子手機的向量相似度遠大于小米與旅游的向量相似度。第二步,對視頻進行聚類,將類別或主題相近的視頻歸為一類,得到相似視頻的聚類結果。第三步,借助用戶在視頻媒體中的行為日志將相似視頻聚類轉換為相似用戶聚類,比如最關注手機電腦的用戶歸為一類,喜歡汽車的用戶歸為另一類。第四步,從3C人群種子用戶中找到這些人群所屬的聚類,將聚類中的所有用戶做一個降序排序,根據排序結果得到與3C種子人群相似的廣告人群。
[0021]示例二:對旅游人群種子擴充篩選的示例
[0022]廣告主計劃向旅游人群投放廣告,其提供少量旅游人群種子cookie,這類人群是熱愛旅游,追求生活品質的一類人,廣告主希望定向到更多相似的此類人群以達到營銷或品牌效應的目的。
[0023]在視頻媒體的旅游頻道中,大多數視頻的標簽都是與旅游,國外生活等相關的,如旅行,出境游,避暑,探訪,九寨溝等等。第一步,通過word2vec將視頻標簽向量化,將每個視頻的所有標簽向量的相應維度的值進行累加后平均,最后得到每個視頻的X維視頻向量。視頻媒體中的所有標簽表示成固定維數的向量,類別相近的標簽的向量相似度高,比如九寨溝與張家界的向量相似度遠大于九寨溝與動漫的向量相似度。第二步,對視頻完成聚類,類別或主題相近的視頻歸為一類,比如與名勝古跡相關的視頻聚在一起。第三步,借助用戶在視頻媒體中的行為日志將相似視頻聚類轉換為相似用戶聚類,比如關注旅游景點用戶歸為一類,喜歡動漫的用戶歸為另一類。第四步,從旅游人群種子用戶中找到這些人群所屬的聚類,將聚類中的所有用戶做一個降序排序,根據排序結果得到與旅游種子人群相似的廣告人群。
[0024]在詳細說明本發(fā)明的較佳實施例之后,熟悉本領域的技術人員可清楚的了解,在不脫離隨附權利要求的保護范圍與精神下可進行各種變化與改變,且本發(fā)明亦不受限于說明書中所舉示例性實施例的實施方式。
【主權項】
1.一種廣告人群篩選方法,其特征在于: 第一步,將視頻媒體的視頻標簽映射為X維標簽向量,之后通過將視頻的所有標簽向量累加后平均,得到每個視頻的X維視頻向量; 第二步,對視頻進行聚類,得到相似視頻聚類結果; 第三步,將相似視頻聚類結果轉換為相似用戶聚類結果; 第四步,從種子用戶中提取聚類結果,進行相似度排序,從而確定用戶排名。
2.如權利要求1所述的方法,其中,第一步驟中使用google的深度學習工具Word2Vec將每一個視頻標簽映射為X維向量。
3.如權利要求1所述的方法,其中,第一步驟中X維標簽向量的參數取值一般為10-200。
4.如權利要求3所述的方法,其中,第一步驟中X維標簽向量的參數取值可以為20。
5.如權利要求1所述的方法,其中,第二步驟中對視頻進行聚類的過程需要對視頻向量進行相似度計算,是采用分布式計算平臺Spark中MLlib組件中的K-Means算法完成的。
6.如權利要求1所述的方法,其中,第三步驟中通過收集行為日志將相似視頻聚類結果轉換為相似用戶聚類結果,所述行為日志包括“觀看”,“訂閱”,“評論”,“頂”。
【專利摘要】本發(fā)明提供一種廣告人群篩選方法,基于豐富的視頻和視頻標簽資源,先對相似視頻進行聚類,然后通過用戶對視頻的觀看訂閱等行為習慣將視頻聚類結果轉換為用戶聚類結果,找到與種子對應的用戶聚類,最后對這些聚類中的用戶進行抽取排序找到滿足需求的潛在客戶。通過本發(fā)明的方法,能夠避免視頻媒體用戶信息較弱的缺陷,充分利用視頻媒體的視頻和標簽資源豐富的優(yōu)勢,將直接尋找相似用戶轉換為先對視頻與標簽的聚類。
【IPC分類】G06K9-62, G06Q30-02
【公開號】CN104751354
【申請?zhí)枴緾N201510172689
【發(fā)明人】雷龍艷, 章岑, 朱凱泉, 房曉宇, 江建博, 潘柏宇, 盧述奇
【申請人】合一信息技術(北京)有限公司
【公開日】2015年7月1日
【申請日】2015年4月13日
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1