專利名稱:一種基于貝葉斯算法的數(shù)字電視節(jié)目推薦方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電視節(jié)目推薦技術(shù),更具體地說,涉及一種基于貝葉斯算法的 數(shù)字電視節(jié)目推薦方法和系統(tǒng)
背景技術(shù):
當(dāng)今世界正處在數(shù)字化浪潮之中,廣播電視也是如此。歐美主要發(fā)達(dá)國(guó)家
都將廣播電視全面數(shù)字化的時(shí)間定在2010年前后,我國(guó)也計(jì)劃于2015年全面 實(shí)現(xiàn)數(shù)字化。2006年底,中國(guó)數(shù)字電視用戶已經(jīng)達(dá)到1200萬戶,并且,根據(jù) 賽迪顧問的預(yù)測(cè),到2007年,全球數(shù)字電視用戶將達(dá)到6.3億戶。
電視數(shù)字化帶來的變革之一就是電視節(jié)目的極大豐富。按照當(dāng)前MPEG2 的視頻編碼方式,有線電視系統(tǒng)將能夠傳輸500套標(biāo)準(zhǔn)清晰度的數(shù)字電視節(jié) 目。如果使用H.264等先進(jìn)的編碼格式,傳輸?shù)臄?shù)字電視節(jié)目將達(dá)到1500套, 在此趨勢(shì)下, 一方面電視用戶在很高興地面對(duì)日益豐富多彩的電視節(jié)目,而另 一方面他們又在為如何在如此眾多的電視節(jié)目中挑選他們感興趣的內(nèi)容而發(fā) 愁,電視用戶將面臨與互聯(lián)網(wǎng)用戶類似的"信息過載"問題。傳統(tǒng)的印制電視 節(jié)目清單和頻道沖浪方式此時(shí)已經(jīng)不能對(duì)他們提供幫助。因?yàn)閷?duì)于500個(gè)頻 道,如果IO個(gè)頻道1天的節(jié)目清單印制在一頁紙上,那么全部500個(gè)頻道一 個(gè)星期的電視節(jié)目清單將是一本350頁的厚書,面對(duì)這樣一本書,用戶很難有 耐心來閱讀和查找他所需要的節(jié)目;另外,如果每個(gè)頻道瀏覽IO秒鐘,用戶 采用頻道沖浪方法瀏覽完全部500個(gè)頻道的內(nèi)容將^^時(shí)82.5分鐘,這樣的時(shí) 間用戶是難以接受的。目前的電子節(jié)目指南采用基于頻道或類別(例如體育、 財(cái)經(jīng)、電影等)的方式顯示節(jié)目清單,此種方式雖然能夠部分解決上述問題, 但仍然沒有徹底解決問題。
要徹底的解決電視信息"過載"的問題,就需要研究用戶的收視行為,判斷用戶的收視喜好以及其他愛好,根據(jù)用戶的興趣、愛好和規(guī)律自動(dòng)地向用戶 推薦電視節(jié)目和服務(wù)。
現(xiàn)有技術(shù)多采用如下方法來實(shí)現(xiàn)電視節(jié)目的自動(dòng)推薦。首先,從用戶收視 記錄中提取收視行為參量,用于表征用戶的收視喜好。隨后,為電視節(jié)目定義 節(jié)目特征,用于表征節(jié)目的各個(gè)屬性。為實(shí)現(xiàn)節(jié)目特征與用戶收視喜好的自動(dòng) 匹配,需使用相同的分量來描述收視行為參量和節(jié)目特征,例如,這些分量可 以是播放時(shí)段、所在頻道等。在得到使用相同分量來描述的收視行為分量和節(jié) 目特征之后,便可通過比較即將播放電視節(jié)目的節(jié)目特征和用戶收視行為參量 之間的相似度,來將電視節(jié)目與用戶喜好進(jìn)行匹配,繼而向用戶推薦其喜愛的 電視節(jié)目,即節(jié)目特征與用戶的收視行為參量之間相似度較高的節(jié)目。
然而,由上文所述不難看出,現(xiàn)有的電視節(jié)目推薦方案只統(tǒng)計(jì)用戶的收視 行為參量,而忽略了電視臺(tái)的播放行為參量,即所播放的各類節(jié)目中每類節(jié)目 所占的比例。這樣一來,匹配得到的推薦結(jié)果顯然無法精確地反映用戶真實(shí)的
收視喜好。例如收視記錄顯示用戶在最近一個(gè)月內(nèi)共收看了 130個(gè)電視節(jié)目, 其中新聞?lì)惞?jié)目50個(gè)、電3見劇類節(jié)目40、體育類節(jié)目20、休閑娛樂類節(jié)目 20。而電視臺(tái)在同期內(nèi)一共播放了 10000個(gè)電視節(jié)目,其中新聞?lì)惞?jié)目5000 個(gè)、電視劇類節(jié)目3000個(gè)、體育類節(jié)目300個(gè)、休閑娛樂類節(jié)目1700個(gè)。如 果依照現(xiàn)有的節(jié)目推薦方法,新聞?lì)惞?jié)目無1€是最受該用戶喜愛的,其次是電 視劇類節(jié)目,最后是體育類節(jié)目和休閑娛樂類節(jié)目,且二者的喜愛程度相等。 而如果依照各類節(jié)目的播放/收視率來看,則體育類節(jié)目無疑最受歡迎,其次 是電視劇類節(jié)目、再次是娛樂類節(jié)目,最后才是新聞?lì)惞?jié)目。由此不難看出, 電視臺(tái)的播放行為會(huì)對(duì)推薦結(jié)果產(chǎn)生較大的影響,而現(xiàn)有技術(shù)忽略了播放行 為,因此其推薦結(jié)果不夠精確。
因此,需要一種電視節(jié)目推薦方案,能夠克服現(xiàn)有技術(shù)存在的缺陷。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題在于,針對(duì)現(xiàn)有電^L節(jié)目推薦方法由于只統(tǒng)計(jì)用 戶的收視行為而忽略了電視臺(tái)的播放行為致使推薦結(jié)果不夠精確的缺陷,提供一種基于貝葉斯算法的數(shù)字電視節(jié)目推薦方法和系統(tǒng)。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是 一種基于貝葉斯算法的數(shù)字電視節(jié)目推薦方法,包括
51、 采集用戶收^L記錄;
52、 分析用戶收視記錄,得到收視行為參量; 所述方法還包括
53、 依據(jù)收視行為參量,得到播放行為參量;
54、 基于貝葉斯算法,通過收視行為參量和播放行為參量預(yù)測(cè)用戶對(duì)待 播電視節(jié)目的收看概率,據(jù)此向用戶推薦電視節(jié)目。
在本發(fā)明所述的基于貝葉斯算法的數(shù)字電視節(jié)目推薦方法中,所述收視行 為參量包括
用戶收看電3見的概率; 用戶不收看電3見的和克率; 用戶收看的節(jié)目中每類節(jié)目的概率; 用戶未收看的節(jié)目中每類節(jié)目的概率。
在本發(fā)明所述的基于貝葉斯算法的數(shù)字電視節(jié)目推薦方法中,所述播放行 為參量包括
每類節(jié)目的播放概率。
在本發(fā)明所述的基于貝葉斯算法的數(shù)字電視節(jié)目推薦方法中,設(shè) 每一節(jié)目Z表示為^力,…,x,7;,…,;c丄),其中/(lS^n)代表節(jié)目%的各
個(gè)屬性,x,. (lSSw)代表節(jié)目X各個(gè)屬性的權(quán)重,w代表節(jié)目的屬性數(shù)量,且
必;
C +和C-分別代表收看行為和不收看行為;
將一段時(shí)間內(nèi)電視臺(tái)播出的電視節(jié)目總數(shù)表示為A(C+) + 其中, WC+)和A(C-)分別代表所述用戶收看電視節(jié)目的數(shù)量和未收看電視節(jié)目的數(shù)
量;
W,lc+)和^(y;lc-)分別代表在依據(jù)屬性乂對(duì)所有電視節(jié)目進(jìn)行分類時(shí), 用戶收看的節(jié)目中每類節(jié)目的數(shù)量和用戶未收看的節(jié)目中每類節(jié)目的數(shù)量;; (C+)和_p(C-)分別代表用戶收看電視的積克率和用戶不收看電3見的相克率; P(川C+)和; (川C-)分別代表在依據(jù)屬性力對(duì)所有電視節(jié)目進(jìn)行分類時(shí),
用戶收看的節(jié)目中每類節(jié)目的概率和用戶未收看的電視節(jié)目中每類節(jié)目的概
率;
p(義IC+)和p(^C-)分別代表在依據(jù)屬性力 / 對(duì)所有電視節(jié)目進(jìn)行分 類時(shí),用戶收看的節(jié)目中每類節(jié)目的概率和用戶未收看的節(jié)目中每類節(jié)目的概
率;
則在所述S2中,按照如下步驟計(jì)算所述收3見行為參量
S21 、依據(jù)電視臺(tái)播出的電視節(jié)目數(shù)量及用戶收視記錄分別統(tǒng)計(jì)
A:(C+)、 A(C-)、 M|C+W |C-); S22、計(jì)算
A:(C+) ,
A:(C+) + A:(C-)
(,|C+) = M^;
"豐+) = fl/7(乂 |C +" (1 - p" |C +)";
# ic -)=riA乂 ic -" (1 - "乂 ic -))
在本發(fā)明所述的基于貝葉斯算法的數(shù)字電視節(jié)目推薦方法中,設(shè)
p(i)代表在依據(jù)屬性yi /"對(duì)所有電視節(jié)目進(jìn)行分類時(shí),每類節(jié)目的播
放概率;
則在所述S3中,按照如下步驟計(jì)算所述播放行為參量 S31、計(jì)算
=洲c十)p(c+)+-)p(c-)。在本發(fā)明所述的基于貝葉斯算法的數(shù)字電視節(jié)目推薦方法中,設(shè)
; (c+代表在依據(jù)屬性力 /;對(duì)所有電視節(jié)目進(jìn)行分類時(shí),用戶對(duì)每類
節(jié)目的收看概率;
則在所述S4中,按照如下步驟預(yù)測(cè)每類節(jié)目的收看概率 S41、基于貝葉斯公式計(jì)算
1 柳
在本發(fā)明所述的基于貝葉斯算法的數(shù)字電視節(jié)目推薦方法中,每一節(jié)目包 括下列屬性之中的至少一個(gè) 播放時(shí)段; 所在頻道; 所屬大類; 所屬小類。
本發(fā)明還提供了 一種基于貝葉斯算法的數(shù)字?jǐn)?shù)字電視節(jié)目推薦系統(tǒng),包
括
采集單元,用于采集數(shù)字電視終端的收3見記錄并存儲(chǔ); 收視行為參量提f^莫塊,與采集單元通信鏈接,用于分析用戶收視記錄, 輸出收視行為參量; 還包括
播放行為參量提取模塊,與收視行為參量提取模塊通信連接,用于分析收 視行為參量,輸出播放行為參量;
收看概率提取模塊,與收視行為參量提取模塊和播放行為參量提和漠塊通 信連接,用于接收收3見行為參量和播放行為參量,基于貝葉斯算法輸出用戶對(duì) 待播電視節(jié)目的收看概率;
推薦模塊,與收看概率提取模塊通信連接,用于接收各類電視節(jié)目的收看 概率,據(jù)此向用戶推薦電視節(jié)目。
在本發(fā)明所述的基于貝葉斯算法的數(shù)字電視節(jié)目推薦系統(tǒng)中,
所述收視行為參量包括用戶收看電^L的扭無率;
用戶不收看電3見的相克率;
用戶收看的節(jié)目中每類節(jié)目的概率;
用戶未收看的節(jié)目中每類節(jié)目的概率; 所述播放行為參量包括
每類節(jié)目的播放概率。 在本發(fā)明所述的基于貝葉斯算法的數(shù)字?jǐn)?shù)字電視節(jié)目推薦系統(tǒng)中,設(shè) 每一節(jié)目X表示為(x^,…,x,乂,…,x丄),其中乂 ( 13^1)代表節(jié)目義的各 個(gè)屬性,x,. (12^7)代表節(jié)目Z各個(gè)屬性的權(quán)重,w代表節(jié)目的屬性數(shù)量,且 論l;
C +和C-分別代表收看行為和不收看行為;
將一段時(shí)間內(nèi)電視臺(tái)播出的電視節(jié)目總數(shù)表示為A:(C+) + A:(C-),其中, A:(C+)和A:(C-)分別代表所述用戶收看電視節(jié)目的數(shù)量和未收看電視節(jié)目的數(shù)
量;
W乂lc+)和A:C/;lc-)分別代表在依據(jù)屬性乂對(duì)所有電視節(jié)目進(jìn)行分類時(shí), 用戶收看的節(jié)目中每類節(jié)目的數(shù)量和用戶未收看的節(jié)目中每類節(jié)目的數(shù)量; p(C+)和; (C-)分別代表用戶收看電^L的扭克率和用戶不收看電^L的概率;
/K,lc+)和K/;lc-)分別代表在依據(jù)屬性/對(duì)所有電視節(jié)目進(jìn)行分類時(shí), 用戶收看的節(jié)目中每類節(jié)目的概率和用戶未收看的電視節(jié)目中每類節(jié)目的概 率;
p(zlc+)和p(zlc-)分別代表在依據(jù)屬性力 /;對(duì)所有電視節(jié)目進(jìn)行分 類時(shí),用戶收看的節(jié)目中每類節(jié)目的概率和用戶未收看的節(jié)目中每類節(jié)目的概 率;
; (jr)代表在依據(jù)屬性yi /"對(duì)所有電視節(jié)目進(jìn)行分類時(shí),每類節(jié)目的播 放概率;
; (c+lx)代表在依據(jù)屬性力 /;對(duì)所有電視節(jié)目進(jìn)行分類時(shí),用戶對(duì)每類
節(jié)目的收看概率;
則所述收視行為參量提取模塊用于按照如下步驟計(jì)算所述收視行為參量51、 依據(jù)電視臺(tái)播出的電視節(jié)目的數(shù)量及用戶收視記錄分別統(tǒng)計(jì)a(c+) A:(C-)、 A(乂IC+)和^/;IC-);
52、 計(jì)算
<formula>formula see original document page 13</formula>所述播放行為參量提取模塊用于按照如下步驟計(jì)算所述播放行為參量
53、 計(jì)算
<formula>formula see original document page 13</formula>
所述收看概率提取模塊用于按照如下步驟預(yù)測(cè)每類節(jié)目的收看概率
54、 基于貝葉斯公式計(jì)算
實(shí)施本發(fā)明的技術(shù)方案,具有以下有益效果,由于在計(jì)算播放概率時(shí)結(jié)合 使用了用戶的收視行為參量和電視臺(tái)的播放行為參量,因此采用本發(fā)明提供的 電視節(jié)目推薦方案所得到的推薦結(jié)果更為精確,更能反映用戶真實(shí)的收視喜 好。
下面將結(jié)合附圖及實(shí)施例對(duì)本發(fā)明作進(jìn)一步說明,附圖中:圖1是依據(jù)本發(fā)明一較佳實(shí)施例數(shù)字電視網(wǎng)絡(luò)的結(jié)構(gòu)示意圖2是依據(jù)本發(fā)明一較佳實(shí)施例的數(shù)字電視節(jié)目推薦方法的流程圖。
具體實(shí)施例方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí) 施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅 僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
圖1是依據(jù)本發(fā)明一較佳實(shí)施例數(shù)字電視網(wǎng)絡(luò)100的結(jié)構(gòu)示意圖。如圖1 所示,數(shù)字電視網(wǎng)絡(luò)100包括數(shù)字電視節(jié)目推薦系統(tǒng)102、多個(gè)數(shù)字電視終端 104、 106和108,以及寬帶城域網(wǎng)110,其中,多個(gè)數(shù)字電^L終端104、 106 和108通過寬帶城域網(wǎng)IIO與數(shù)字電視節(jié)目推薦系統(tǒng)102通信連接。
數(shù)字電視終端104和106通過雙向機(jī)頂盒連接到寬帶城域網(wǎng)110。雙向機(jī) 頂盒既可用于通過寬帶城域網(wǎng)IIO接收電視節(jié)目,又可將統(tǒng)計(jì)得到的用戶收視 記錄通過寬帶城域網(wǎng)IIO發(fā)送給數(shù)字電視節(jié)目推薦系統(tǒng)102。不同于數(shù)字電視 終端104和106,數(shù)字電^L終端108無需通過機(jī)頂盒即可連接到寬帶城域網(wǎng) 110,并接收電視節(jié)目,以及向數(shù)字電視節(jié)目推薦系統(tǒng)102發(fā)送用戶收視記錄。
數(shù)字電視節(jié)目推薦系統(tǒng)102包括順序通信連接的采集服務(wù)器(采集單元) 112、收視行為參量提取服務(wù)器(收視行為參量提取單元)114、播放行為參量 提取服務(wù)器(播放行為參量提取單元)116、收視概率提取服務(wù)器(收視概率 提取單元)118和推薦服務(wù)器(推薦單元)120,且收視概率提取服務(wù)器118 通信連接到收視行為參量提取服務(wù)器114。
采集服務(wù)器112通信連接到寬帶城域網(wǎng)110,用于接收多個(gè)數(shù)字電視終端 104、 106和108發(fā)來的用戶收視記錄。用戶收^L記錄中記錄有與用戶近期收 看的電視節(jié)目有關(guān)的記錄信息,包括例如但不限于用戶近期收看的電視節(jié)目的 名稱、播放頻道、播放時(shí)間、所屬大類、所屬小類等等。
收視行為參量提取服務(wù)器114用于讀取采集服務(wù)器112采集的用戶收視記 錄,并從中提取用戶的收視行為參量。收視行為參量中記錄有用戶的收視行為, 包括用戶收看電視的概率、用戶不收看電視的概率、用戶收看的節(jié)目中每類節(jié)目的播放概率和用戶未收看的節(jié)目中每類節(jié)目的播放概率。收3見行為參量提取
服務(wù)器114從用戶收視記錄中提取收視行為參量,并將其發(fā)往播放行為參量提 取服務(wù)器116和收視概率提取服務(wù)器118。有關(guān)收視行為參量的提取方法將在 下文進(jìn)行詳細(xì)描述。
播放行為參量提取服務(wù)器116用于接收收視行為參量提取服務(wù)器114發(fā)送' 來的收視行為參量,并從中提取播放行為參量。播放行為參量中記錄電視臺(tái)對(duì) 每類節(jié)目的播放概率。提取的播放行為參量將發(fā)往收視概率提取服務(wù)器118。 有關(guān)播放行為參量的提取方法將在下文進(jìn)行詳細(xì)描述。
收視概率提取服務(wù)器118用于接收收3見行為參量提取服務(wù)器114發(fā)送來的 收視行為參量,和播放行為參量提取服務(wù)器116發(fā)來的播放行為參量,并基于 貝葉斯算法計(jì)算各類電視節(jié)目的收看概率,發(fā)往推薦服務(wù)器120。有關(guān)收視概 率的提取方法將在下文進(jìn)行詳細(xì)描述。
的收看概率,依據(jù)每一待播放節(jié)目的類型查找其對(duì)應(yīng)的收看概率,并對(duì)所有待 播放節(jié)目按照收看概率由大到小進(jìn)行排序,向用戶推薦排序靠前的待播放節(jié) 目。
本發(fā)明還提供了 一種數(shù)字電視節(jié)目推薦方法,下面就結(jié)合圖2進(jìn)行詳細(xì)描述。
圖2是依據(jù)本發(fā)明一較佳實(shí)施例的數(shù)字電視節(jié)目推薦方法200的流程圖。 如圖2所示,方法200開始于步驟202。
隨后,在下一步驟204,采集用戶收3見記錄。
隨后,在下一步驟206,依據(jù)用戶收視記錄得到收視行為參量。如上文所 述,收視行為參量包括用戶收看電視的概率、用戶不收看電視的概率、用戶收 看的節(jié)目中每類節(jié)目的播放概率和用戶未收看的節(jié)目中每類節(jié)目的播放概率, 其計(jì)算方法如下
設(shè)
每一節(jié)目x表示為(v;,…,^;,,其中,乂 ( is$n)代表節(jié)目義的
各個(gè)屬性,例如節(jié)目X的播出時(shí)^:、所在頻道、所屬大類和所屬小類等;x,代表節(jié)目X各個(gè)屬性的權(quán)重,W代表節(jié)目的屬性數(shù)量,且論l。
C代表用戶的行為,其中C +和C-分別代表收看行為和不收看行為; 將一段時(shí)間內(nèi)電i見臺(tái)播出的電^L節(jié)目總數(shù)表示為A:(C+) + A(C-),其中,
A:(C+)和A:(C-)分別代表所述用戶收看電視節(jié)目的數(shù)量和未收看電視節(jié)目的數(shù)
量。A:(C+)和A:(C-)可從用戶收視記錄直接統(tǒng)計(jì)得出。
wy;lc+)和A:(y;lc-)分別代表在依據(jù)屬性力(例如所在頻道)對(duì)所有電視 節(jié)目進(jìn)行分類(例如將所在頻道相同的節(jié)目歸入一類)時(shí),用戶收看的節(jié)目中
每類節(jié)目的數(shù)量和用戶未收看的節(jié)目中每類節(jié)目的數(shù)量。Ar(乂IC+)和^:C/;IC-) 可從用戶收視記錄直接統(tǒng)計(jì)得出。
; (C+)和分別代表用戶收看電視的概率和用戶不收看電視的概率, 其中,
<formula>formula see original document page 16</formula>(公式i )
<formula>formula see original document page 16</formula>公式2) ^c/;lc+)和; (乂ic-)分別代表在依據(jù)屬性力對(duì)所有電視節(jié)目進(jìn)行分類時(shí), 用戶收看的節(jié)目中每類節(jié)目的概率和用戶未收看的電視節(jié)目中每類節(jié)目的播 》文才既率,其中,
<formula>formula see original document page 16</formula>(公式3)
<formula>formula see original document page 16</formula> (公式4)
/ (^IC+)和p(xlC-)分別代表在依據(jù)屬性/l /"(播出時(shí)^:、所在頻道、 所屬大類和所屬小類)對(duì)所有電視節(jié)目進(jìn)行分類(例如將播出時(shí)段、所在頻道、 所屬大類和所屬小類均相同的節(jié)目歸入一類)時(shí),用戶收看的節(jié)目中每類節(jié)目 的概率和用戶未收看的節(jié)目中每類節(jié)目的概率,其中,
<formula>formula see original document page 16</formula> (公式5 )<formula>formula see original document page 17</formula>(公式6 )
如此一來,我們1"更可依照從用戶收一見記錄中統(tǒng)計(jì)得到的a:(c+)、 a(c-)、 a(川c+)和/k,Ic-),使用公式1 6來計(jì)算收視行為參量,即用戶收看電視 的概率、用戶不收看電視的概率、用戶收看的節(jié)目中每類節(jié)目的播放概率和用 戶未收看的節(jié)目中每類節(jié)目的播放概率。
隨后,在下一步驟208,依據(jù)計(jì)算得到的收視行為參量計(jì)算播放行為參量。 如上文所述,播放行為參量包括每類節(jié)目的播放概率,其計(jì)算方法如下
設(shè)
p(X)代表在依據(jù)屬性力 / 對(duì)所有電視節(jié)目進(jìn)行分類時(shí),每類節(jié)目的播 放概率,其中,
<formula>formula see original document page 17</formula>(公式7 )
如此一來,我們便可使用步驟206中求得的收視行為參量依照公式7來計(jì)算每 類節(jié)目的播放概率。
在下一步驟210,依據(jù)計(jì)算得到的收視行為參量和播放行為參量,基于貝 葉斯公式計(jì)算每類節(jié)目的收看概率,其計(jì)算方法如下 設(shè)
; (c+lz)代表在依據(jù)屬性/i /;對(duì)所有電視節(jié)目進(jìn)行分類時(shí),用戶對(duì)每類
節(jié)目的收看概率,其中,
<formula>formula see original document page 17</formula>
如此一來,我們便可使用步驟206中計(jì)算得到的收視行為參量和步驟208中計(jì) 算得到的播放行為參量來基于貝葉斯公式計(jì)算每類節(jié)目的收看概率。
隨后,在下一步驟212,在得到每類節(jié)目的收看概率后,便可據(jù)此向用戶 推薦電視節(jié)目,即首先確定待播節(jié)目的類別,然后查找其收看概率,最后將各 待播節(jié)目按收看概率由大到小進(jìn)行排序,將排序靠前的節(jié)目推薦給用戶。
最后,方法200結(jié)束于步驟214。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明 的保護(hù)范圍之內(nèi)。
權(quán)利要求
1、一種基于貝葉斯算法的數(shù)字電視節(jié)目推薦方法,包括S1、采集用戶收視記錄;S2、分析用戶收視記錄,得到收視行為參量;其特征在于,所述方法還包括S3、依據(jù)收視行為參量,得到播放行為參量;S4、基于貝葉斯算法,通過收視行為參量和播放行為參量預(yù)測(cè)用戶對(duì)待播電視節(jié)目的收看概率,據(jù)此向用戶推薦電視節(jié)目。
2、 根據(jù)權(quán)利要求1所述的基于貝葉斯算法的數(shù)字電視節(jié)目推薦方法,其 特征在于,所述收視行為參量包括用戶收看電視的概率; 用戶不收看電^L的概率; 用戶收看的節(jié)目中每類節(jié)目的概率;用戶未收看的節(jié)目中每類節(jié)目的概率。(為避免限制保護(hù)范圍,有關(guān)各參 量的表達(dá)式在權(quán)利要求4中定義)
3、 根據(jù)權(quán)利要求2所述的基于貝葉斯算法的數(shù)字電視節(jié)目推薦方法,其 特征在于,所述播放行為參量包括每類節(jié)目的播放概率。
4、 根據(jù)權(quán)利要求3所述的基于貝葉斯算法的數(shù)字電視節(jié)目推薦方法,其 特征在于,沒每一節(jié)目^表示為^,,…,;c,,…,x丄),其中乂(l22n)代表節(jié)目Z的各 個(gè)屬性,;c,. ()代表節(jié)目JT各個(gè)屬性的權(quán)重,"代表節(jié)目的屬性數(shù)量,且 論l;C +和C-分別代表收看行為和不收看行為;將一段時(shí)間內(nèi)電視臺(tái)播出的電視節(jié)目總數(shù)表示為A:(C+) + A:(C-),其中, yKC+)和A(C-)分別代表所述用戶收看電視節(jié)目的數(shù)量和未收看電視節(jié)目的數(shù)w乂lc+)和^/;lc-)分別代表在依據(jù)屬性力對(duì)所有電視節(jié)目進(jìn)行分類時(shí),用戶收看的節(jié)目中每類節(jié)目的數(shù)量和用戶未收看的節(jié)目中每類節(jié)目的數(shù)量; ; (C+)和; (C-)分別代表用戶收看電視的概率和用戶不收看電視的概率;M乂lc+)和/ (/;lc-)分別代表在依據(jù)屬性力對(duì)所有電視節(jié)目進(jìn)行分類時(shí),用戶收看的節(jié)目中每類節(jié)目的概率和用戶未收看的電視節(jié)目中每類節(jié)目的概率;/ (llC+)和; (llC-)分別代表在依據(jù)屬性力 / 對(duì)所有電視節(jié)目進(jìn)行分 類時(shí),用戶收看的節(jié)目中每類節(jié)目的概率和用戶未收看的節(jié)目中每類節(jié)目的概率;則在所述S2中,按照如下步驟計(jì)算所述收視行為參量S21 、依據(jù)電視臺(tái)播出的電視節(jié)目數(shù)量及用戶收視記錄分別統(tǒng)計(jì)<formula>formula see original document page 3</formula>
5、根據(jù)權(quán)利要求4所述的基于貝葉斯算法的數(shù)字電視節(jié)目推薦方法,其 特征在于,設(shè)p(I)代表在依據(jù)屬性力 乂對(duì)所有電視節(jié)目進(jìn)行分類時(shí),每類節(jié)目的播 放概率;則在所述S3中,按照如下步驟計(jì)算所述播^:行為參量 S31、計(jì)算-.;W = p(義|C十)p(C+) + p(豐)(C-)。
6、 根據(jù)權(quán)利要求5所述的基于貝葉斯算法的數(shù)字電視節(jié)目推薦方法,其 特征在于,設(shè)戶(c+|i)代表在依據(jù)屬性yi /;對(duì)所有電視節(jié)目進(jìn)行分類時(shí),用戶對(duì)每類 節(jié)目的收看概率;則在所述S4中,按照如下步驟預(yù)測(cè)每類節(jié)目的收看概率 S41、基于貝葉斯公式計(jì)算<formula>formula see original document page 4</formula>
7、 根據(jù)權(quán)利要求6所述的基于貝葉斯算法的數(shù)字電視節(jié)目推薦方法,其 特征在于,每一節(jié)目包括下列屬性之中的至少一個(gè)播放時(shí)段; 所在頻道; 所屬大類; 所屬小類。
8、 一種基于貝葉斯算法的數(shù)字?jǐn)?shù)字電視節(jié)目推薦系統(tǒng),包括 采集單元,用于采集數(shù)字電視終端的收視記錄并存儲(chǔ); 收視行為參量提^^莫塊,與采集單元通信鏈接,用于分析用戶收視記錄,輸出收視行為參量;其特征在于,還包括播放行為參量提取模塊,與收視行為參量提取模塊通信連接,用于分析收 視行為參量,輸出播放行為參量;收看概率提取模塊,與收視行為參量提取模塊和播放行為參量提取模塊通 信連接,用于接收收視行為參量和播放行為參量,基于貝葉斯算法輸出用戶對(duì) 待播電視節(jié)目的收看概率;推薦模塊,與收看概率提取模塊通信連接,用于接收各類電視節(jié)目的收看概率,據(jù)此向用戶推薦電3見節(jié)目。
9、 根據(jù)權(quán)利要求8所述的基于貝葉斯算法的數(shù)字?jǐn)?shù)字電視節(jié)目推薦系統(tǒng), 其特征在于,所述收視行為參量包括用戶收看電-見的扭克率;用戶不收看電一見的4既率;用戶收看的節(jié)目中每類節(jié)目的概率;用戶未收看的節(jié)目中每類節(jié)目的概率; 所述播放行為參量包括每類節(jié)目的播放概率。
10、 根據(jù)權(quán)利要求9所述的基于貝葉斯算法的數(shù)字?jǐn)?shù)字電視節(jié)目推薦系 統(tǒng),其特征在于,設(shè)每一節(jié)目x表示為(x^,…,x,y;,,其中/ ( is/^i )代表節(jié)目z的各 個(gè)屬性,x,. (代表節(jié)目x各個(gè)屬性的權(quán)重,"代表節(jié)目的屬性數(shù)量,且必;C +和C-分別代表收看行為和不收看行為;將一段時(shí)間內(nèi)電視臺(tái)播出的電視節(jié)目總數(shù)表示為A:(C+) + A:(C-),其中, A:(C+)和A:(C-)分別代表所述用戶收看電視節(jié)目的數(shù)量和未收看電視節(jié)目的數(shù)量;W乂 |C +)和|C -)分別代表在依據(jù)屬性力對(duì)所有電視節(jié)目進(jìn)行分類時(shí), 用戶收看的節(jié)目中每類節(jié)目的數(shù)量和用戶未收看的節(jié)目中每類節(jié)目的數(shù)量; p(C+)和; (C-)分別代表用戶收看電視的概率和用戶不收看電視的概率;p(/;lc+)和K/;lc-)分別代表在依據(jù)屬性力對(duì)所有電視節(jié)目進(jìn)行分類時(shí),用戶收看的節(jié)目中每類節(jié)目的概率和用戶未收看的電視節(jié)目中每類節(jié)目的概 率;/ (^C+)和; (XlC-)分別代表在依據(jù)屬性對(duì)所有電視節(jié)目進(jìn)行分 類時(shí),用戶收看的節(jié)目中每類節(jié)目的概率和用戶未收看的節(jié)目中每類節(jié)目的概率;; (X)代表在依據(jù)屬性力 / 對(duì)所有電視節(jié)目進(jìn)行分類時(shí),每類節(jié)目的播 放概率;/7(C + IX)代表在依據(jù)屬性/i /n對(duì)所有電視節(jié)目進(jìn)行分類時(shí),用戶對(duì)每類節(jié)目的收看概率;則所述收視行為參量提取模塊用于按照如下步驟計(jì)算所述收視行為參量 Sl 、依據(jù)電視臺(tái)播出的電視節(jié)目數(shù)量及用戶收視記錄分別統(tǒng)計(jì)A(C+)、 *(C-)、 A:(,IC+)和"川C-); S2、計(jì)算<formula>formula see original document page 6</formula>。所述播放行為參量提取模塊用于按照如下步驟計(jì)算所述播放行為參量:S3、 計(jì)算<formula>formula see original document page 6</formula>所述收看概率提^4莫塊用于按照如下步驟預(yù)測(cè)每類節(jié)目的收看概率S4、 基于貝葉斯公式計(jì)算<formula>formula see original document page 6</formula>
全文摘要
本發(fā)明涉及電視節(jié)目推薦,針對(duì)現(xiàn)有電視節(jié)目推薦方法只統(tǒng)計(jì)用戶的收視行為而忽略電視臺(tái)的播放行為致使推薦結(jié)果不夠精確缺陷,提供一種基于貝葉斯算法的數(shù)字電視節(jié)目推薦方法和系統(tǒng)。方法包括采集用戶收視記錄;分析用戶收視記錄,得到用戶收視行為參量;該方法還包括依據(jù)收視行為參量,得到電視臺(tái)播放行為參量;基于貝葉斯算法,通過收視行為參量和播放行為參量預(yù)測(cè)用戶對(duì)待播電視節(jié)目的收看概率,據(jù)此向用戶推薦電視節(jié)目。本發(fā)明還提供了一種與上述方法相對(duì)應(yīng)的推薦系統(tǒng)。由于預(yù)測(cè)用戶收看特定節(jié)目的概率時(shí)結(jié)合使用用戶收視行為參量和電視臺(tái)的播放行為參量,因此本電視節(jié)目推薦方案所得到的推薦結(jié)果更為精確,更能反映用戶真實(shí)的收視喜好。
文檔編號(hào)H04N17/00GK101431694SQ20081021788
公開日2009年5月13日 申請(qǐng)日期2008年11月26日 優(yōu)先權(quán)日2008年11月26日
發(fā)明者徐江山 申請(qǐng)人:深圳市天威視訊股份有限公司