一種數(shù)字電視用戶行為的大數(shù)據(jù)采集與分析方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種數(shù)據(jù)采集與分析方法及系統(tǒng),尤其是一種針對(duì)數(shù)字電視用戶行為的數(shù)據(jù)采集與分析方法及系統(tǒng)。
【背景技術(shù)】
[0002]近年來,隨著“大數(shù)據(jù)”概念的普及,在許多領(lǐng)域,服務(wù)提供商開始有意識(shí)地對(duì)海量用戶數(shù)據(jù)的進(jìn)行實(shí)時(shí)采集與分析,從而提取有價(jià)值的潛在信息。例如,在在線購物領(lǐng)域,阿里巴巴旗下的淘寶對(duì)每個(gè)用戶的網(wǎng)上購物習(xí)慣(例如商品購買歷史、商鋪瀏覽記錄等)以及其個(gè)人信息進(jìn)行綜合分析,從而實(shí)現(xiàn)個(gè)性化的商鋪推薦,提高用戶購買效率與商鋪銷售額。在網(wǎng)絡(luò)視頻領(lǐng)域,YouTube以及優(yōu)酷依據(jù)用戶信息(例如地理位置、性別等)以及用戶的瀏覽歷史,為用戶推送相關(guān)的廣告以及其他同類視頻;在零售領(lǐng)域,梅西百貨(Macy’ s)通過對(duì)不同商品需求和庫存的情況的實(shí)時(shí)統(tǒng)計(jì)與分析,進(jìn)行商品的實(shí)時(shí)調(diào)價(jià),從而實(shí)現(xiàn)利潤(rùn)最大化;在信用卡領(lǐng)域,美國運(yùn)通公司(American Express)通過對(duì)用戶信用卡歷史交易數(shù)據(jù)的建模與分析,來預(yù)測(cè)客戶忠誠度,并采取相應(yīng)促銷手段提升忠誠度。
[0003]但是,在大數(shù)據(jù)應(yīng)用快速發(fā)展的同時(shí),廣播電視領(lǐng)域的用戶收視行為數(shù)據(jù)采集與分析,卻仍然停留在主要依靠人力的階段。具體來說,這種傳統(tǒng)的信息采集與分析方法按照以下流程進(jìn)行:1)廣電服務(wù)商委托調(diào)查公司進(jìn)行用戶收視調(diào)查;2)調(diào)查公司對(duì)用戶隨機(jī)抽樣;3)調(diào)查員人工上門遞送紙質(zhì)調(diào)查單;4)用戶手動(dòng)填寫調(diào)查單;5)調(diào)查員上門回收調(diào)查單;6)調(diào)查公司手工整理與分析數(shù)據(jù);7)調(diào)查公司將分析結(jié)果反饋給廣電服務(wù)商,為廣告投放與電視節(jié)目制作提供參考。然而,該方法存在很多缺點(diǎn)。首先,它需要耗費(fèi)大量的人力物力;其次,它涉及到除廣電與用戶外的第三方機(jī)構(gòu)(調(diào)查公司),使得流程更復(fù)雜、保密性更差;最后,此方法所采集到的數(shù)據(jù)以及在此基礎(chǔ)上的分析,往往準(zhǔn)確性較差、實(shí)時(shí)性較低、覆蓋面較窄。
[0004]當(dāng)今,三網(wǎng)融合的進(jìn)一步推進(jìn),尤其是數(shù)字電視的雙向改造,為“廣電大數(shù)據(jù)”提供了契機(jī)。在此背景下,如何實(shí)現(xiàn)對(duì)海量廣電用戶收視行為數(shù)據(jù)的自動(dòng)采集與高效分析,已成為廣播電視技術(shù)的一項(xiàng)重要研宄課題。
【發(fā)明內(nèi)容】
[0005]本發(fā)明要解決的技術(shù)問題是傳統(tǒng)的信息采集與分析方法費(fèi)時(shí)費(fèi)力、流程復(fù)雜、保密性差、準(zhǔn)確性較差、實(shí)時(shí)性較低且覆蓋面較窄。
[0006]為了解決上述技術(shù)問題,本發(fā)明提供了一種數(shù)字電視用戶行為的大數(shù)據(jù)采集與分析方法,包括如下步驟:
步驟1,將數(shù)字電視用戶對(duì)數(shù)字機(jī)頂盒進(jìn)行交互操作的操作數(shù)據(jù)進(jìn)行實(shí)時(shí)記錄,并將操作數(shù)據(jù)存儲(chǔ)至本地存儲(chǔ)器中;
步驟2,讀取本地存儲(chǔ)器中的操作數(shù)據(jù),并對(duì)操作數(shù)據(jù)進(jìn)行預(yù)處理,獲得每個(gè)節(jié)目的觀看時(shí)長(zhǎng)、數(shù)字電視用戶的調(diào)臺(tái)次數(shù)以及每個(gè)節(jié)目的平均觀看時(shí)長(zhǎng); 步驟3,將預(yù)處理獲得的觀看時(shí)長(zhǎng)、調(diào)臺(tái)次數(shù)以及平均觀看時(shí)長(zhǎng)作為預(yù)處理數(shù)據(jù)定時(shí)或定量地遠(yuǎn)程發(fā)送至遠(yuǎn)程存儲(chǔ)器中;
步驟4,讀取遠(yuǎn)程存儲(chǔ)器中的預(yù)處理數(shù)據(jù),并按照分類規(guī)則對(duì)預(yù)處理數(shù)據(jù)進(jìn)行分類處理,再將分類處理獲得的分類數(shù)據(jù)分類存儲(chǔ)至面向大數(shù)據(jù)的數(shù)據(jù)庫中;
步驟5,按照分類有序讀取數(shù)據(jù)庫中的分類數(shù)據(jù),并對(duì)各個(gè)類別的分類數(shù)據(jù)進(jìn)行分析,獲得數(shù)字電視用戶的收視習(xí)慣和/或電視節(jié)目的收視率。
[0007]采用自動(dòng)實(shí)時(shí)記錄操作數(shù)據(jù)替換現(xiàn)有的人工采集,能夠有效提高了數(shù)據(jù)采集的效率和全面性,簡(jiǎn)化了采集復(fù)雜的人工采集流程,同時(shí)也避免了用戶信息泄露;采用預(yù)處理步驟能夠有效減少操作數(shù)據(jù)的傳輸量,降低了傳輸功耗;將分類數(shù)據(jù)分類存儲(chǔ)至數(shù)據(jù)庫中,能夠方便數(shù)據(jù)分析時(shí)分類讀取各個(gè)分類數(shù)據(jù),提高了分析效率;采用主動(dòng)采集分析獲得收視習(xí)慣和/或收視率,能夠有效提高數(shù)據(jù)采集的準(zhǔn)確性,避免人工采集時(shí)數(shù)字電視用戶任意填寫表格。
[0008]作為本發(fā)明方法的進(jìn)一步限定方案,操作數(shù)據(jù)包括節(jié)目名稱、調(diào)臺(tái)時(shí)間點(diǎn)以及節(jié)目慢放控制。
[0009]作為本發(fā)明方法的進(jìn)一步限定方案,分類規(guī)則包括收看時(shí)間段、節(jié)目類型、收視人群、收視地域以及收視率范圍。
[0010]作為本發(fā)明方法的進(jìn)一步改進(jìn)方案,還包括如下步驟:
步驟6,利用預(yù)測(cè)算法根據(jù)收視習(xí)慣和/或收視率對(duì)數(shù)字電視用戶的收視行為進(jìn)行預(yù)測(cè),獲得數(shù)字電視用戶期望收看的電視節(jié)目的收視預(yù)測(cè)報(bào)告。采用預(yù)測(cè)算法獲得收視預(yù)測(cè)報(bào)告,能夠方便廣播電視運(yùn)營(yíng)商向數(shù)字電視用戶針對(duì)性地推送所期望的電視節(jié)目,既能夠有效提尚數(shù)字電視用戶收看電視節(jié)目的興趣,又能夠有效提尚廣播電視的收視率。
[0011]作為本發(fā)明方法的進(jìn)一步限定方案,預(yù)測(cè)算法為聚類算法、回歸算法、神經(jīng)網(wǎng)絡(luò)或深度學(xué)習(xí)算法。
[0012]作為本發(fā)明方法的進(jìn)一步改進(jìn)方案,還包括如下步驟:
步驟7,根據(jù)收視預(yù)測(cè)報(bào)告向數(shù)字電視用戶推送期望收看的電視節(jié)目或廣告。采用向數(shù)字電視用戶推送期望收看的電視節(jié)目或廣告,從而潛在地幫助電視節(jié)目制作商制作出更受用戶歡迎的電視節(jié)目,也能幫助電視廣告投放商提高廣告收益。
[0013]本發(fā)明還提供了一種數(shù)字電視用戶行為的大數(shù)據(jù)采集與分析系統(tǒng),包括如下模塊:
數(shù)據(jù)記錄模塊,用于將數(shù)字電視用戶對(duì)數(shù)字機(jī)頂盒進(jìn)行交互操作的操作數(shù)據(jù)進(jìn)行實(shí)時(shí)記錄,并將操作數(shù)據(jù)存儲(chǔ)至本地存儲(chǔ)器中;
數(shù)據(jù)預(yù)處理模塊,用于讀取本地存儲(chǔ)器中的操作數(shù)據(jù),并對(duì)操作數(shù)據(jù)進(jìn)行預(yù)處理,獲得每個(gè)節(jié)目的觀看時(shí)長(zhǎng)、數(shù)字電視用戶的調(diào)臺(tái)次數(shù)以及每個(gè)節(jié)目的平均觀看時(shí)長(zhǎng);
數(shù)據(jù)發(fā)送模塊,用于將預(yù)處理獲得的觀看時(shí)長(zhǎng)、調(diào)臺(tái)次數(shù)以及平均觀看時(shí)長(zhǎng)作為預(yù)處理數(shù)據(jù)定時(shí)或定量地遠(yuǎn)程發(fā)送至遠(yuǎn)程存儲(chǔ)器中;
數(shù)據(jù)分類模塊,用于讀取遠(yuǎn)程存儲(chǔ)器中的預(yù)處理數(shù)據(jù),并按照分類規(guī)則對(duì)預(yù)處理數(shù)據(jù)進(jìn)行分類處理,再將分類處理獲得的分類數(shù)據(jù)分類存儲(chǔ)至面向大數(shù)據(jù)的數(shù)據(jù)庫中;
數(shù)據(jù)分析模塊,用于按照分類有序讀取數(shù)據(jù)庫中的分類數(shù)據(jù),并對(duì)各個(gè)類別的分類數(shù)據(jù)進(jìn)行分析,獲得數(shù)字電視用戶的收視習(xí)慣和/或電視節(jié)目的收視率。
[0014]作為本發(fā)明系統(tǒng)的進(jìn)一步改進(jìn)方案,還包括如下模塊:
收視預(yù)測(cè)模塊,用于利用預(yù)測(cè)算法根據(jù)收視習(xí)慣和/或收視率對(duì)數(shù)字電視用戶的收視行為進(jìn)行預(yù)測(cè),獲得數(shù)字電視用戶期望收看的電視節(jié)目的收視預(yù)測(cè)報(bào)告。
[0015]作為本發(fā)明系統(tǒng)的進(jìn)一步限定方案,預(yù)測(cè)算法為聚類算法、回歸算法、神經(jīng)網(wǎng)絡(luò)或深度學(xué)習(xí)算法。
[0016]作為本發(fā)明系統(tǒng)的進(jìn)一步改進(jìn)方案,還包括如下模塊:
信息推送模塊,用于根據(jù)收視預(yù)測(cè)報(bào)告向數(shù)字電視用戶推送期望收看的電視節(jié)目或廣生口 O
[0017]本發(fā)明的有益效果在于:(I)采用自動(dòng)實(shí)時(shí)記錄操作數(shù)據(jù)替換現(xiàn)有的人工采集,無需用戶改變?nèi)魏维F(xiàn)有收視習(xí)慣,能夠有效提高了數(shù)據(jù)采集的效率和全面性,簡(jiǎn)化了采集復(fù)雜的人工采集流程,同時(shí)也避免了用戶信息泄露;(2)采用預(yù)處理步驟能夠有效減少操作數(shù)據(jù)的傳輸量,降低了傳輸功耗;(3)將分類數(shù)據(jù)分類存儲(chǔ)至數(shù)據(jù)庫中,能夠方便數(shù)據(jù)分析時(shí)分類讀取各個(gè)分類數(shù)據(jù),提高了分析效率;(4)采用主動(dòng)采集分析獲得收視習(xí)慣和/或收視率,能夠有效提高數(shù)據(jù)采集的準(zhǔn)確性,避免人工采集時(shí)數(shù)字電視用戶任意填寫表格。
【附圖說明】
[0018]圖1為本發(fā)明的方法流程圖;
圖2為本發(fā)明的系統(tǒng)結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0019]如圖1所示,本發(fā)明的數(shù)字電視用戶行為的大數(shù)據(jù)采集與分析方法,包括如下步驟:
步驟1,將數(shù)字電視用戶對(duì)數(shù)字機(jī)頂盒進(jìn)行交互操作的操作數(shù)據(jù)進(jìn)行實(shí)時(shí)記錄,并將操作數(shù)據(jù)存儲(chǔ)至本地存儲(chǔ)器中;
步驟2,讀取本地存儲(chǔ)器中的操作數(shù)據(jù),并對(duì)操作數(shù)據(jù)進(jìn)行預(yù)處理,獲得每個(gè)節(jié)目的觀看時(shí)長(zhǎng)、數(shù)字電視用戶的調(diào)臺(tái)次數(shù)以及每個(gè)節(jié)目的平均觀看時(shí)長(zhǎng);
步驟3,將預(yù)處理獲得的觀看時(shí)長(zhǎng)、調(diào)臺(tái)次數(shù)以及平均觀看時(shí)長(zhǎng)作為預(yù)處理數(shù)據(jù)定時(shí)或定量地遠(yuǎn)程發(fā)送至遠(yuǎn)程存儲(chǔ)器中;
步驟4,讀取遠(yuǎn)程存儲(chǔ)器中的預(yù)處理數(shù)據(jù),并按照分類規(guī)則對(duì)預(yù)處理數(shù)據(jù)進(jìn)行分類處理,再將分類處理獲得的分類數(shù)據(jù)分類存儲(chǔ)至面向大數(shù)據(jù)的數(shù)據(jù)庫中;
步驟5,按照分類有序讀取數(shù)據(jù)庫中的分類數(shù)據(jù),并對(duì)各個(gè)類別的分類數(shù)據(jù)進(jìn)行分析,獲得數(shù)字電視用戶的收視習(xí)慣和/或電視節(jié)目的收視率;
步驟6,利用預(yù)測(cè)算法根據(jù)收視習(xí)慣和/或收視率對(duì)數(shù)字電視用戶的收視行為進(jìn)行預(yù)測(cè),獲得數(shù)字電視用戶期望收看的電視節(jié)目的收視預(yù)測(cè)報(bào)告;