1.基于海量跨屏收視行為數(shù)據(jù)的直播推薦方法,其特征在于,包括以下步驟:
(1)設(shè)置終端數(shù)據(jù)采集模塊、HDFS分布式存儲(chǔ)模塊、ETL模塊、推薦模塊、WEB應(yīng)用模塊;
(2)終端數(shù)據(jù)采集模塊用于采集用戶在多媒體信息播放終端的收視行為數(shù)據(jù),并將所采集的數(shù)據(jù)轉(zhuǎn)發(fā)給HDFS分布式存儲(chǔ)模塊負(fù)責(zé)存儲(chǔ);
(3)HDFS分布式存儲(chǔ)模塊除了負(fù)責(zé)存儲(chǔ)用戶收視行為數(shù)據(jù),還負(fù)責(zé)存儲(chǔ)其他第三方系統(tǒng)異構(gòu)數(shù)據(jù);
(4)ETL模塊負(fù)責(zé)從HDFS分布式存儲(chǔ)模塊對(duì)所存儲(chǔ)的用戶收視行為數(shù)據(jù)進(jìn)行提取、轉(zhuǎn)換和加載,并為推薦模塊提供基礎(chǔ)元素?cái)?shù)據(jù);
(5)推薦模塊包括策略處理模塊、算法處理模塊、線下推薦結(jié)果、線上推薦結(jié)果、內(nèi)容-特征推薦結(jié)果數(shù)據(jù);
(6)WEB應(yīng)用模塊為終端內(nèi)嵌的web應(yīng)用程序,用于推薦請(qǐng)求和推薦內(nèi)容的展示。
2.根據(jù)權(quán)利要求1的基于海量跨屏收視行為數(shù)據(jù)的直播推薦方法,其特征在于,所述多媒體信息播放終端包括DVB STB、OTT、智能電視、手機(jī)、平板電腦。
3.根據(jù)權(quán)利要求1的基于海量跨屏收視行為數(shù)據(jù)的直播推薦方法,其特征在于,所述其他第三方系統(tǒng)異構(gòu)數(shù)據(jù)為PV、UV這些頁面瀏覽數(shù)據(jù)。
4.根據(jù)權(quán)利要求1的基于海量跨屏收視行為數(shù)據(jù)的直播推薦方法,其特征在于,所述推薦模塊中的策略處理模塊用于為算法處理模塊提供基礎(chǔ)數(shù)據(jù),由用戶標(biāo)簽、內(nèi)容標(biāo)簽、用戶畫像三部分組成;內(nèi)容標(biāo)簽定義了用戶所收看節(jié)目的節(jié)目類型、所屬地區(qū)、節(jié)目狀態(tài)、情感類型這些屬性;用戶標(biāo)簽定義了用戶的個(gè)人屬性、社會(huì)屬性、消費(fèi)行為屬性、愛好偏向?qū)傩?、收視行為屬性;用戶畫像通過內(nèi)容標(biāo)簽和用戶標(biāo)簽的數(shù)據(jù)整合,標(biāo)記了用戶的標(biāo)簽?zāi)P鸵晥D,由此勾勒用戶的整體輪廓和興趣偏好。
5.根據(jù)權(quán)利要求1的基于海量跨屏收視行為數(shù)據(jù)的直播推薦方法,其特征在于,所述推薦模塊中的算法處理模塊所采用的推薦算法主要使用協(xié)同過濾、用戶相似度計(jì)算、節(jié)目相似度計(jì)算、聚類算法、關(guān)聯(lián)規(guī)則、統(tǒng)計(jì),在自然語言處理上,使用分詞、索引、關(guān)鍵詞和輿情相關(guān)的算法、基于時(shí)間序列的預(yù)測(cè),GBDT+LR的排序算法框架,實(shí)現(xiàn)基于用戶畫像的個(gè)性化推薦。
6.根據(jù)權(quán)利要求1的基于海量跨屏收視行為數(shù)據(jù)的直播推薦方法,其特征在于,所述推薦模塊中的線下推薦結(jié)果是將用戶特征屬性、內(nèi)容特征屬性和業(yè)務(wù)規(guī)則相結(jié)合,融合推薦算法形成的線下推薦結(jié)果集。
7.根據(jù)權(quán)利要求1的基于海量跨屏收視行為數(shù)據(jù)的直播推薦方法,其特征在于,所述推薦模塊中的線上推薦結(jié)果是基于用戶實(shí)時(shí)的收視行為數(shù)據(jù)和頁面瀏覽行為數(shù)據(jù),結(jié)合用戶應(yīng)用場(chǎng)景、條件規(guī)則,形成的實(shí)時(shí)線上推薦結(jié)果集。
8.根據(jù)權(quán)利要求1的基于海量跨屏收視行為數(shù)據(jù)的直播推薦方法,其特征在于,所述推薦模塊中的內(nèi)容-特征推薦結(jié)果數(shù)據(jù)是融合線下推薦結(jié)果和線上推薦結(jié)果,經(jīng)過預(yù)處理、去重、過濾、排名這些步驟后形成的最終推薦結(jié)果集。