專利名稱:一種基于用戶操作日志的epg校準(zhǔn)系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字電視EPG,尤其是涉及一種基于用戶操作日志的EPG校準(zhǔn)系統(tǒng)及 方法。
背景技術(shù):
現(xiàn)在通常都使用EPG (Electronic Program Guide,電子節(jié)目菜單)來為數(shù)字電視 提供各種業(yè)務(wù)的索引和導(dǎo)航,用戶利用EPG提供的菜單可以選擇自己喜歡的頻道,點(diǎn)播自 己喜歡的節(jié)目,查找各種信息等,在數(shù)字電視中起著非常重要的作用。在電視節(jié)目回看系統(tǒng) 中,EPG包含了各個(gè)頻道過去一段時(shí)間(例如一周)內(nèi)的節(jié)目信息,這些節(jié)目(例如電視劇, 電影,專題,綜藝節(jié)目等)是通過EPG的形式表現(xiàn)出來給用戶挑選觀看的。機(jī)頂盒從EPG信 息中可以獲取到節(jié)目名稱、節(jié)目起始時(shí)間、節(jié)目結(jié)束時(shí)間,當(dāng)用戶選擇某個(gè)頻道的回看節(jié)目 進(jìn)行觀看時(shí),機(jī)頂盒會(huì)發(fā)送信令給前端服務(wù)器,服務(wù)器根據(jù)EPG設(shè)定的起始結(jié)束時(shí)間播發(fā) 流給機(jī)頂盒。因此如果EPG給出的節(jié)目起始時(shí)間有偏差,那么用戶最終得到的節(jié)目也會(huì)有 偏差。但是,現(xiàn)有的IPTV系統(tǒng)中,電視節(jié)目回看中的EPG時(shí)間信息往往是不準(zhǔn)確的,這使 得用戶在點(diǎn)播節(jié)目的時(shí)候無法定位到正確的節(jié)目起始時(shí)間,因而無法找到點(diǎn)播的節(jié)目。而 為了找到點(diǎn)播的節(jié)目,不得不通過手工操作來定位到正確的節(jié)目時(shí)間,不但浪費(fèi)人力物力, 并且也增加了由于誤操作而出錯(cuò)的可能性。因此,如何開發(fā)設(shè)計(jì)一種可確定正確的EPG時(shí)間信息的系統(tǒng)和方法,已成為目前 急需解決的技術(shù)難題之一。
發(fā)明內(nèi)容
本發(fā)明為解決現(xiàn)有技術(shù)無法正確定位到節(jié)目起始時(shí)間的技術(shù)問題,提供了一種基 于用戶操作日志的EPG校準(zhǔn)系統(tǒng)及方法。為解決上述技術(shù)問題,本發(fā)明采用的技術(shù)方案為設(shè)計(jì)一種基于用戶操作日志的 EPG校準(zhǔn)系統(tǒng),包括機(jī)頂盒、流媒體服務(wù)器,所述流媒體服務(wù)器設(shè)置有一日志數(shù)據(jù)庫和一日 志聚類分析引擎,所述日志數(shù)據(jù)庫用于記錄和存儲(chǔ)用戶通過機(jī)頂盒向流媒體服務(wù)器點(diǎn)播節(jié) 目的操作日志;所述的日志聚類分析引擎用于對(duì)用戶在點(diǎn)播回看節(jié)目時(shí)候產(chǎn)生的日志進(jìn)行 聚類分析,判斷出正確的節(jié)目起始時(shí)間并記錄下來供后繼用戶使用。所述的操作日志包括用戶ID、頻道名稱、節(jié)目名稱、用戶操作類型和操作時(shí)的媒體 流時(shí)間。所述的媒體流時(shí)間包括播放時(shí)間、快進(jìn)時(shí)間、快退時(shí)間、和停止時(shí)間。所述的聚類分析包括對(duì)媒體流數(shù)據(jù)進(jìn)行預(yù)處理,清除不能用來作為聚類分析數(shù)據(jù) 源的用戶操作日志,和對(duì)上一次點(diǎn)播的操作行為記錄進(jìn)行聚類分析,得到準(zhǔn)確的播放時(shí)間 點(diǎn),該時(shí)間點(diǎn)作為節(jié)目起始的參考值。本發(fā)明還提供了一種基于用戶操作日志的EPG校準(zhǔn)方法,包括下列步驟
步驟1、將用戶點(diǎn)播回放節(jié)目的操作日志記錄存儲(chǔ)在日志數(shù)據(jù)庫中;步驟2、日志聚類分析引擎對(duì)操作日志數(shù)據(jù)庫記錄的操作數(shù)據(jù)進(jìn)行預(yù)處理,清除噪 音數(shù)據(jù);步驟3、日志聚類分析引擎對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行聚類分析,得到節(jié)目開始正常播 放的時(shí)間參考值;步驟4、將上述參考值作為節(jié)目的起始時(shí)間寫入到EPG中,供后繼的用戶使用。所述步驟1中的操作日志包括用戶ID、頻道名稱、節(jié)目名稱、用戶操作類型和操作 時(shí)的媒體流時(shí)間。所述的媒體流時(shí)間包括播放時(shí)間、快進(jìn)時(shí)間、快退時(shí)間、和停止時(shí)間。所述的聚類分析選用DBSCAN算法,聚類的對(duì)象就是節(jié)目開始正常播放的時(shí)間參考值。本發(fā)明基于用戶行為聚類分析的EPG校準(zhǔn)系統(tǒng)及方法通過分析用戶操作時(shí)產(chǎn)生 的操作日志,并對(duì)操作日志進(jìn)行聚類分析后得到節(jié)目的真正起始時(shí)間,并寫入EPG中,供后 續(xù)用戶使用,使后續(xù)用戶在回看節(jié)目時(shí)能準(zhǔn)確定位到節(jié)目起始時(shí)間,相比現(xiàn)有技術(shù)具有突 出的優(yōu)點(diǎn)。
下面結(jié)合實(shí)施例和附圖對(duì)本發(fā)明進(jìn)行詳細(xì)說明,其中圖1是本發(fā)明EPG校準(zhǔn)系統(tǒng)邏輯圖;圖2是本發(fā)明EPG校準(zhǔn)方法流程圖。
具體實(shí)施例方式本發(fā)明提出的一種基于用戶行為聚類分析的EPG校準(zhǔn)系統(tǒng)及方法,是通過對(duì)用戶 在點(diǎn)播回看節(jié)目時(shí)候產(chǎn)生的日志進(jìn)行聚類分析,判斷出正確的節(jié)目起止時(shí)間并記錄下來給 后繼用戶使用。其是在分析用戶行為日志的基礎(chǔ)上實(shí)現(xiàn)的,對(duì)普通用戶來說,當(dāng)用戶點(diǎn)播了 一個(gè)節(jié)目但是卻沒有收到正確的開始時(shí),他會(huì)嘗試對(duì)當(dāng)前的媒體流進(jìn)行快進(jìn)快退行為,當(dāng) 快進(jìn)快退到滿意的位置時(shí)他會(huì)停下來開始觀看。這個(gè)滿意的位置有可能是片頭,也有可能 是跳過了片頭的內(nèi)容起始。因此,記錄機(jī)頂盒在流媒體服務(wù)器點(diǎn)播節(jié)目的操作日志并保存 在日志數(shù)據(jù)庫中,通過對(duì)日志數(shù)據(jù)庫中的操作日志并進(jìn)行聚類分析,就可獲得節(jié)目的起始 時(shí)間,然后再將聚類分析獲得節(jié)目的起始時(shí)間寫入EPG中,即可供后續(xù)用戶使用,以準(zhǔn)確定 位到需要的節(jié)目。請(qǐng)參閱圖1。本發(fā)明基于用戶行為聚類分析的EPG校準(zhǔn)系統(tǒng)包括機(jī)頂盒、流媒體服 務(wù)器和日志聚類分析引擎。其中機(jī)頂盒從EPG信息中獲取節(jié)目名稱、節(jié)目起始時(shí)間、節(jié)目結(jié)束時(shí)間,當(dāng)用戶選擇某 個(gè)頻道的節(jié)目進(jìn)行觀看時(shí),機(jī)頂盒發(fā)送信令給前端的流媒體服務(wù)器,流媒體服務(wù)器根據(jù)EPG 設(shè)定的起始結(jié)束時(shí)間播發(fā)節(jié)目流給機(jī)頂盒。流媒體服務(wù)器包括一日志記錄數(shù)據(jù)庫和日志聚類分析引擎。日志數(shù)據(jù)庫記錄用戶 點(diǎn)播回看節(jié)目的整個(gè)過程中的操作行為,包括點(diǎn)播,快進(jìn),快退,停止等,并且產(chǎn)生操作日志 存儲(chǔ)在日志數(shù)據(jù)庫中。在本具體實(shí)施例中,操作日志的形式為(user,channel, program, operation, time)的五元組,其中,user表示用戶ID, channel表示頻道名稱,program表示節(jié)目名稱,operation表示操作類型,如快進(jìn)、播放等,time表示用戶操作時(shí)的媒體流時(shí) 間。例如一個(gè)用戶操作日志可能為(userl,CCTV1,16,play,10:30:26)。其中用戶id是 userl,頻道名稱是CCTV1,點(diǎn)播的節(jié)目的id是16,用戶操作是play,操作時(shí)的媒體流時(shí)間 是10:30:26,值得注意的是,五元組中的time代表的是用戶操作時(shí)的媒體流時(shí)間,也就是 當(dāng)前回看節(jié)目中的時(shí)間。日志聚類分析引擎用于對(duì)用戶在點(diǎn)播回看節(jié)目時(shí)候產(chǎn)生的操作日志進(jìn)行聚類分 析,判斷出正確的節(jié)目起始時(shí)間并記錄下來供后繼用戶使用。日志聚類分析引擎先對(duì)日志 數(shù)據(jù)進(jìn)行預(yù)處理,刪除噪音數(shù)據(jù),然后再對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行聚類分析。其原理如下1、數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理的目的是清除噪音數(shù)據(jù),所謂噪音數(shù)據(jù)是指不能用來作為聚類分析數(shù) 據(jù)源的用戶操作日志,在回看系統(tǒng)中多體現(xiàn)為用戶隨意性的操作行為,包括用戶隨意瀏覽 并離開,用戶誤點(diǎn)擊之后馬上離開等,這類行為的特點(diǎn)是正常觀看時(shí)間與節(jié)目的時(shí)長不成 正比,操作頻繁大于正常觀看。日志聚類分析引擎是根據(jù)設(shè)定的時(shí)間對(duì)數(shù)據(jù)庫的操作日志信息進(jìn)行聚類分析,它 對(duì)操作日志的五元組(user,channel, program, operation, time)進(jìn)行分析,將用戶隨意性 的行為日志刪除掉。對(duì)此可以通過設(shè)定閾值進(jìn)行淘汰,對(duì)于節(jié)目正常觀看時(shí)間(即沒有操 作的這段時(shí)間)占用戶瀏覽本節(jié)目跨度時(shí)間(即用戶從觀看節(jié)目到退出節(jié)目的媒體流時(shí)間 跨度)的比例小于一定程度,則認(rèn)為是非正常用戶。2、對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行聚類分析描述用戶操作的原語有play (播放)、fast forward(快進(jìn))、back forward(快 退)、teardown(停止)等。舉例來說,對(duì)于時(shí)間范圍是10:30:26-10:56:10的節(jié)目《科技 之光》,某個(gè)用戶可能產(chǎn)生如下的操作日志Dplay 10:30:262) fast forward 10:30:393)back forward 10:34:554)play 10:33:02從用戶的操作日志可以看到1)用戶首先從EPG中點(diǎn)播了《科技之光》,因此這時(shí) 候play所帶的時(shí)間參數(shù)與EPG相同;2)用戶發(fā)現(xiàn)播出的節(jié)目不是《科技之光》,而是廣告, 因此他選擇快進(jìn),快進(jìn)操作是在回看節(jié)目播放到了 10:30:39的時(shí)候發(fā)出的;3)用戶發(fā)現(xiàn)已 經(jīng)快進(jìn)遠(yuǎn)遠(yuǎn)超過節(jié)目起始了,因此他選擇快退,快退操作時(shí)在回看節(jié)目播放到了 10 34 55 的時(shí)候發(fā)出的;4)用戶最終快退到了滿意的時(shí)間,這時(shí)候正常播放開始,時(shí)間是10:33:02。以上是一個(gè)正常用戶在點(diǎn)播到不準(zhǔn)確EPG時(shí)候的操作行為記錄,對(duì)操作日志的正 常播放時(shí)間,也即操作日志中的4)的時(shí)間點(diǎn)進(jìn)行密度聚類分析,可以得到幾個(gè)簇,選擇最 大的簇,其平均值可以作為節(jié)目起始的參考值。最后將聚類的結(jié)果,也即節(jié)目起始時(shí)間寫入數(shù)據(jù)庫,以供后繼的用戶觀看使用,從 而提升用戶的滿意度。聚類所使用的數(shù)據(jù)是(user,channel, program, "play", time)的五元組,密度聚 類分析采用基本的DBSCAN算法,聚類所得到的簇是time的簇,是一維的。當(dāng)存在多個(gè)簇的 情況下,可能會(huì)這樣的情況某些用戶定位到節(jié)目片頭開始就停下來觀看;另外一些用戶則會(huì)跳過節(jié)目片頭,直接觀看節(jié)目內(nèi)容。因此這時(shí)候可以同時(shí)選用較大的兩個(gè)簇。需要特 別注意的是,聚類最后使用的操作日志使用的操作類型僅僅為播放,而不包括其它操作類 型如快進(jìn)、快退等。請(qǐng)參見圖2,本發(fā)明基于用戶操作行為的EPG校準(zhǔn)方法包括下列步驟步驟1、將用戶點(diǎn)播回放節(jié)目的操作日志記錄存儲(chǔ)在日志數(shù)據(jù)庫中。操作日志包括 用戶ID、頻道名稱、節(jié)目名稱、用戶操作類型和操作時(shí)的媒體流時(shí)間。所述的媒體流時(shí)間包 括播放時(shí)間、快進(jìn)時(shí)間、快退時(shí)間、和停止時(shí)間。步驟2、日志聚類分析引擎對(duì)操作日志數(shù)據(jù)庫記錄的操作數(shù)據(jù)進(jìn)行預(yù)處理,清除噪 音數(shù)據(jù);步驟3、日志聚類分析引擎對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行聚類分析,得到節(jié)目開始正常播 放的時(shí)間參考值。所述的聚類分析選用DBSCAN算法,聚類的對(duì)象就是節(jié)目開始正常播放的 時(shí)間參考值。步驟4、將上述參考值作為節(jié)目的起始時(shí)間寫入到EPG中,供后繼的用戶使用。
權(quán)利要求
一種基于用戶操作日志的EPG校準(zhǔn)系統(tǒng),包括機(jī)頂盒、流媒體服務(wù)器,其特征在于所述流媒體服務(wù)器設(shè)置有一日志數(shù)據(jù)庫和一日志聚類分析引擎,所述日志數(shù)據(jù)庫用于記錄和存儲(chǔ)用戶通過機(jī)頂盒向流媒體服務(wù)器點(diǎn)播節(jié)目的操作日志;所述的日志聚類分析引擎用于對(duì)用戶在點(diǎn)播回看節(jié)目時(shí)候產(chǎn)生的操作日志進(jìn)行聚類分析,判斷出正確的節(jié)目起始時(shí)間并記錄下來供后繼用戶使用。
2.根據(jù)權(quán)利要求1所述的EPG校準(zhǔn)系統(tǒng),其特征在于所述的操作日志包括用戶ID、頻 道名稱、節(jié)目名稱、用戶操作類型和操作時(shí)的媒體流時(shí)間。
3.根據(jù)權(quán)利要求1所述的EPG校準(zhǔn)系統(tǒng),其特征在于所述的媒體流時(shí)間包括播放時(shí) 間、快進(jìn)時(shí)間、快退時(shí)間、和停止時(shí)間。
4.根據(jù)權(quán)利要求1所述的EPG校準(zhǔn)系統(tǒng),其特征在于所述的聚類分析包括對(duì)媒體流 數(shù)據(jù)進(jìn)行預(yù)處理,清除不能用來作為聚類分析數(shù)據(jù)源的用戶操作日志,和對(duì)上一次點(diǎn)播的 操作行為記錄進(jìn)行聚類分析,得到準(zhǔn)確的播放時(shí)間點(diǎn),該時(shí)間點(diǎn)作為節(jié)目起始的參考值。
5.一種基于用戶操作日志的EPG校準(zhǔn)方法,其特征在于包括下列步驟步驟1、將用戶點(diǎn)播回放節(jié)目的操作日志記錄存儲(chǔ)在日志數(shù)據(jù)庫中;步驟2、日志聚類分析引擎對(duì)操作日志數(shù)據(jù)庫記錄的操作數(shù)據(jù)進(jìn)行預(yù)處理,清除噪音數(shù)據(jù);步驟3、日志聚類分析引擎對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行聚類分析,得到節(jié)目開始正常播放的 時(shí)間參考值;步驟4、將上述參考值作為節(jié)目的起始時(shí)間寫入到EPG中,供后繼的用戶使用。
6.根據(jù)權(quán)利要求5所述的EPG校準(zhǔn)方法,其特征在于所述步驟1中的操作日志包括 用戶ID、頻道名稱、節(jié)目名稱、用戶操作類型和操作時(shí)的媒體流時(shí)間。
7.根據(jù)權(quán)利要求6所述的EPG校準(zhǔn)方法,其特征在于所述的媒體流時(shí)間包括播放時(shí) 間、快進(jìn)時(shí)間、快退時(shí)間、和停止時(shí)間。
8.根據(jù)權(quán)利要求5所述的EPG校準(zhǔn)方法,其特征在于所述的聚類分析選用DBSCAN算 法,聚類的對(duì)象就是節(jié)目開始正常播放的時(shí)間參考值。
全文摘要
本發(fā)明公開一種基于用戶操作日志的EPG校準(zhǔn)系統(tǒng),包括機(jī)頂盒、流媒體服務(wù)器,所述流媒體服務(wù)器設(shè)置有一日志數(shù)據(jù)庫和一日志聚類分析引擎,所述日志數(shù)據(jù)庫用于記錄和存儲(chǔ)用戶通過機(jī)頂盒向流媒體服務(wù)器點(diǎn)播節(jié)目的操作日志;所述的日志聚類分析引擎用于對(duì)用戶在點(diǎn)播回看節(jié)目時(shí)候產(chǎn)生的操作日志進(jìn)行聚類分析,判斷出正確的節(jié)目起始時(shí)間并記錄下來供后繼用戶使用。本發(fā)明還公開了一種EPG校準(zhǔn)方法。本發(fā)明可用于校準(zhǔn)EPG中的節(jié)目的起始時(shí)間。
文檔編號(hào)H04N7/173GK101964886SQ201010272660
公開日2011年2月2日 申請(qǐng)日期2010年9月3日 優(yōu)先權(quán)日2010年9月3日
發(fā)明者李昌盛 申請(qǐng)人:深圳創(chuàng)維數(shù)字技術(shù)股份有限公司