專利名稱::基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及視頻節(jié)目推薦系統(tǒng)。
背景技術(shù):
:隨著視頻網(wǎng)絡(luò)的發(fā)展,通過(guò)網(wǎng)絡(luò)觀看視頻節(jié)目成為眾多網(wǎng)絡(luò)用戶的上網(wǎng)目的之一。如何最大限度地吸引用戶,成為視頻網(wǎng)站的所要考慮的重要問(wèn)題。一種有效的方法是根據(jù)用戶的觀看的喜好向用戶推薦視頻節(jié)目。經(jīng)過(guò)分析,用戶通常具有觀看某類節(jié)目的喜好。例如,有的用戶喜歡觀看體育節(jié)目,有的用戶則喜歡觀看娛樂(lè)節(jié)目,而有的用戶只喜歡觀看功夫節(jié)目等等。在第十屆國(guó)際互聯(lián)網(wǎng)會(huì)議上(Proceedingsofthe10thinternationalconferenceonWorldWideWeb),Badru和George等人提出了基于項(xiàng)目(Item)的協(xié)同過(guò)濾推薦系統(tǒng)(Item-basedCollaborativeFilteringRecommendationAlgorithms),在這篇文章中同時(shí)還提到一種基于用戶(User)的協(xié)同過(guò)濾推薦系統(tǒng)。這兩種過(guò)濾系統(tǒng)的基本原理如下根據(jù)已知的用戶對(duì)某些節(jié)目的喜好程度進(jìn)行計(jì)算,然后向具有相同喜好的用戶推薦已知用戶的其他喜好節(jié)目。這種喜好程度通過(guò)分值表示,該分值由用戶選擇,例如1分表示討厭某個(gè)節(jié)目,5分表示非常喜歡某個(gè)節(jié)目。然而在視頻網(wǎng)站中,采用這種方法的進(jìn)行節(jié)目推薦的時(shí)候,卻碰到許多困難。例如一、用戶不愿意刻意去給節(jié)目打分。通常用戶到視頻網(wǎng)站的目的是觀看視頻,他們不愿意刻意去給一個(gè)節(jié)目打分。二、即便有少量的用戶給視頻節(jié)目打分,這些被打分的節(jié)目數(shù)在所有視頻節(jié)目的比例非常的小,通常不到1%。上述這些困難會(huì)導(dǎo)致上述的協(xié)同過(guò)濾推薦系統(tǒng)出現(xiàn)"冷啟動(dòng)問(wèn)題",(請(qǐng)參見(jiàn)發(fā)表于《計(jì)算機(jī)研究與發(fā)展》上的"基于類別的推薦——一種解決協(xié)同推薦中冷啟動(dòng)問(wèn)題的方法"),這種冷啟動(dòng)問(wèn)題會(huì)導(dǎo)致推薦系統(tǒng)無(wú)法正常工作,產(chǎn)生錯(cuò)誤的推薦結(jié)果。
發(fā)明內(nèi)容針對(duì)現(xiàn)有推薦系統(tǒng)中的不足,本發(fā)明提供一種基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),該系統(tǒng)首先收集用戶在視頻網(wǎng)站上的與興趣度相關(guān)的瀏覽行為,然后通過(guò)分析瀏覽行為并打分后,進(jìn)行數(shù)據(jù)融合,融合后的分值,也就是某用戶對(duì)某視頻節(jié)目的興趣度值,根據(jù)該興趣度值進(jìn)行節(jié)目的推薦。本發(fā)明具體是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的—種基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于包括用戶行為數(shù)據(jù)收集模塊,用于收集和存儲(chǔ)用戶在視頻網(wǎng)站的瀏覽行為數(shù)據(jù);數(shù)據(jù)融合模塊,與所述用戶行為數(shù)據(jù)收集模塊相連接,用于將某個(gè)用戶對(duì)某個(gè)視頻節(jié)目的瀏覽行為數(shù)據(jù)轉(zhuǎn)化為該用戶對(duì)某個(gè)視頻節(jié)目的興趣度值;節(jié)目推薦模塊,根據(jù)用戶對(duì)某些節(jié)目的興趣度值,向具有相同喜好的其他用戶推薦該用戶的其他興趣度值高的節(jié)目;其中,瀏覽行為數(shù)據(jù)包括為播放行為數(shù)據(jù),將用戶播放節(jié)目的時(shí)長(zhǎng)除以該節(jié)目的4長(zhǎng)度得到時(shí)長(zhǎng)比例r,時(shí)長(zhǎng)比例r越大,興趣度值越高。進(jìn)一步地,所述用戶行為數(shù)據(jù)收集模塊中收集數(shù)據(jù)的時(shí)間長(zhǎng)度為某一時(shí)刻之前的一個(gè)時(shí)間段。進(jìn)一步地,所述數(shù)據(jù)融合模塊中的興趣度值為某一時(shí)刻之前的一個(gè)時(shí)間段內(nèi)的瀏覽行為數(shù)據(jù)轉(zhuǎn)化而獲得的數(shù)值。進(jìn)一步地,所述節(jié)目推薦模塊為采用定期的方式向具有相同喜好的其他用戶推薦該用戶的其他興趣度高的節(jié)目的模塊。本發(fā)明避免了用戶在不愿意刻意去給節(jié)目打分的情況下,導(dǎo)致上述的協(xié)同過(guò)濾推薦系統(tǒng)出現(xiàn)冷啟動(dòng)的問(wèn)題,只要用戶有播放行為,就可產(chǎn)生正確的推薦結(jié)果。并且在融合了用戶其它與興趣度相關(guān)的瀏覽行為數(shù)據(jù)后,可更加準(zhǔn)確地產(chǎn)生推薦的節(jié)目列表,通過(guò)這種無(wú)需用戶刻意評(píng)分的技術(shù)方案,大大提高了用戶對(duì)推薦節(jié)目的滿意度,降低了視頻服務(wù)器因用戶盲目點(diǎn)擊造成的負(fù)擔(dān)。圖1為本發(fā)明基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng)實(shí)施例示意圖。具體實(shí)施例方式如圖1所示,一種基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),包括以下模塊用戶行為數(shù)據(jù)收集模塊,用于收集和存儲(chǔ)用戶在視頻網(wǎng)站的瀏覽行為數(shù)據(jù);數(shù)據(jù)融合模塊,與所述用戶行為數(shù)據(jù)收集模塊相連接,用于將某個(gè)用戶對(duì)某個(gè)視頻節(jié)目的瀏覽行為數(shù)據(jù)轉(zhuǎn)化為該用戶對(duì)某個(gè)視頻節(jié)目的興趣度值;節(jié)目推薦模塊,根據(jù)用戶對(duì)某些節(jié)目的興趣度值,向具有相同喜好的其他用戶推薦該用戶的其他興趣度值高的節(jié)目;其中,瀏覽行為數(shù)據(jù)包括為播放行為數(shù)據(jù),將用戶播放節(jié)目的時(shí)長(zhǎng)除以該節(jié)目的長(zhǎng)度得到時(shí)長(zhǎng)比例r,時(shí)長(zhǎng)比例r越大,興趣度值越高。所述用戶行為數(shù)據(jù)收集模塊中收集數(shù)據(jù)的時(shí)間長(zhǎng)度為某一時(shí)刻之前的一個(gè)時(shí)間段。例如最近的一個(gè)月至三個(gè)月內(nèi)用戶在視頻網(wǎng)站的瀏覽行為數(shù)據(jù)。所述數(shù)據(jù)融合模塊中的興趣度值為某一時(shí)刻之前的一個(gè)時(shí)間段內(nèi)的瀏覽行為數(shù)據(jù)轉(zhuǎn)化而獲得的數(shù)值。所述節(jié)目推薦模塊為采用定期的方式向具有相同喜好的其他用戶推薦該用戶的其他興趣度高的節(jié)目的模塊。所述數(shù)據(jù)融合模塊為以用戶編號(hào)為行,視頻節(jié)目編號(hào)為列,用戶對(duì)視頻節(jié)目的興趣度值為內(nèi)容,形成一個(gè)二維的用戶對(duì)視頻節(jié)目的興趣度值表格的模塊;所述節(jié)目推薦模塊為在該興趣度值表的基礎(chǔ)上,采用基于協(xié)同過(guò)濾的推薦方法對(duì)已知用戶和未知用戶產(chǎn)生推薦節(jié)目列表的模塊,其中,有對(duì)應(yīng)興趣度值的用戶為已知用戶,否則為未知用戶。所述節(jié)目推薦模塊為包括去除推薦的節(jié)目中其他用戶已經(jīng)觀看過(guò)的節(jié)目的模塊。其中,所述瀏覽行為數(shù)據(jù)還包括以下行為中的一個(gè)、多個(gè)或全部對(duì)節(jié)目打分行為數(shù)據(jù)、收藏節(jié)目行為數(shù)據(jù)、挖行為數(shù)據(jù)、埋行為數(shù)據(jù)或上傳節(jié)目行為數(shù)據(jù)。所述數(shù)據(jù)融合模塊為對(duì)于同一類型的瀏覽行為,后出現(xiàn)的行為的分值覆蓋先出現(xiàn)的行為的分值的模塊。其中,數(shù)據(jù)融合的順序依次為播放行為數(shù)據(jù)、對(duì)節(jié)目打分行為、收藏節(jié)目行為、挖(或頂\踩)行為\埋行為(或頂\踩)或上傳節(jié)目行為。本實(shí)施例中所述數(shù)據(jù)融合模塊采用1、2、3、4、5五個(gè)離散化的數(shù)值表示興趣度值,其中l(wèi)表示很討厭,2表示一般討厭,3表示一般,4表示喜歡,5表示很喜歡。用戶在視頻網(wǎng)站的瀏覽行為數(shù)據(jù)的截取范圍為最近的一個(gè)月內(nèi)。用戶瀏覽行為的融合規(guī)則如表1所示。表1各種用戶瀏覽行為數(shù)據(jù)的融合規(guī)則瀏覽行為原始取值r說(shuō)明對(duì)應(yīng)取值截取范圍播放0%100%以最后一次播放為準(zhǔn),r為播放1,2,3,4,5近一個(gè)月的時(shí)長(zhǎng)比例1:r《0.1;2:0.1<r《0.3;3:0.3<r《0.7;4:0.7<r《0.9;5:0.9<r。打分15按原值1,2,3,4,5近一個(gè)月收藏1或or=l表示用戶收藏某一個(gè)節(jié)目,打5分;r=0時(shí),則不記分?jǐn)?shù)。5近一個(gè)月挖行為1或or=1表示用戶挖行為某一個(gè)節(jié)目,打5分;r=0時(shí),則不記分?jǐn)?shù)。5近一個(gè)月埋行為1或or=1表示用戶埋行為某一個(gè)節(jié)目,打1分;r=0時(shí),則不記分?jǐn)?shù)。1近一個(gè)月上傳1或or=l表示用戶上傳某一個(gè)節(jié)目,打5分;r=0時(shí),則不記分?jǐn)?shù)。5近一個(gè)月6將同一用戶對(duì)某個(gè)視頻節(jié)目的上述瀏覽行為數(shù)據(jù)值融合,即將對(duì)節(jié)目打分行為數(shù)據(jù)、收藏節(jié)目行為數(shù)據(jù)、挖行為\埋行為(或頂\踩)數(shù)據(jù)或上傳節(jié)目行為數(shù)據(jù)中r的對(duì)應(yīng)取值累加后,得到該用戶對(duì)某個(gè)視頻節(jié)目的興趣度值。并在得到興趣度值表后,采用基于項(xiàng)目的協(xié)同過(guò)濾方法進(jìn)行視頻節(jié)目的推薦。所述節(jié)目推薦模塊為在得到興趣度值表后,按每天兩次的頻率更推薦節(jié)目列表的模塊。以上所述的實(shí)施例僅用于說(shuō)明本發(fā)明的技術(shù)思想及特點(diǎn),其目的在使本領(lǐng)域內(nèi)的技術(shù)人員能夠了解本發(fā)明的內(nèi)容并據(jù)以實(shí)施,當(dāng)不能僅以本實(shí)施例來(lái)限定本發(fā)明的專利范圍,即凡依本發(fā)明所揭示的精神所作的同等變化或修飾,仍落在本發(fā)明的專利范圍內(nèi)。權(quán)利要求一種基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于包括用戶行為數(shù)據(jù)收集模塊,用于收集和存儲(chǔ)用戶在視頻網(wǎng)站的瀏覽行為數(shù)據(jù);數(shù)據(jù)融合模塊,與所述用戶行為數(shù)據(jù)收集模塊相連接,用于將某個(gè)用戶對(duì)某個(gè)視頻節(jié)目的瀏覽行為數(shù)據(jù)轉(zhuǎn)化為該用戶對(duì)某個(gè)視頻節(jié)目的興趣度值;節(jié)目推薦模塊,根據(jù)用戶對(duì)某些節(jié)目的興趣度值,向具有相同喜好的其他用戶推薦該用戶的其他興趣度值高的節(jié)目;其中,瀏覽行為數(shù)據(jù)包括為播放行為數(shù)據(jù),將用戶播放節(jié)目的時(shí)長(zhǎng)除以該節(jié)目的長(zhǎng)度得到時(shí)長(zhǎng)比例r,時(shí)長(zhǎng)比例r越大,興趣度值越高。2.根據(jù)權(quán)利要求1所述的基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于所述用戶行為數(shù)據(jù)收集模塊中收集數(shù)據(jù)的時(shí)間長(zhǎng)度為某一時(shí)刻之前的一個(gè)時(shí)間段。3.根據(jù)權(quán)利要求2所述的基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于所述數(shù)據(jù)融合模塊中的興趣度值為某一時(shí)刻之前的一個(gè)時(shí)間段內(nèi)的瀏覽行為數(shù)據(jù)轉(zhuǎn)化而獲得的數(shù)值。4.根據(jù)權(quán)利要求1所述的基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于所述節(jié)目推薦模塊為采用定期的方式向具有相同喜好的其他用戶推薦該用戶的其他興趣度高的節(jié)目的模塊。5.根據(jù)權(quán)利要求1至4中任一權(quán)利要求所述的基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于所述數(shù)據(jù)融合模塊為以用戶編號(hào)為行,視頻節(jié)目編號(hào)為列,用戶對(duì)視頻節(jié)目的興趣度值為內(nèi)容,形成一個(gè)二維的用戶對(duì)視頻節(jié)目的興趣度值表格的模塊;所述節(jié)目推薦模塊為在該興趣度值表的基礎(chǔ)上,采用基于協(xié)同過(guò)濾的推薦方法對(duì)已知用戶和未知用戶產(chǎn)生推薦節(jié)目列表的模塊,其中,有對(duì)應(yīng)興趣度值的用戶為已知用戶,否則為未知用戶。6.根據(jù)權(quán)利要求5所述的基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于所述節(jié)目推薦模塊為包括去除推薦的節(jié)目中其他用戶已經(jīng)觀看過(guò)的節(jié)目的模塊。7.根據(jù)權(quán)利要求6所述的基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于所述瀏覽行為數(shù)據(jù)還包括以下行為中的一個(gè)、多個(gè)或全部對(duì)節(jié)目打分行為數(shù)據(jù)、收藏節(jié)目行為數(shù)據(jù)、挖行為數(shù)據(jù)、埋行為數(shù)據(jù)或上傳節(jié)目行為數(shù)據(jù)。8.根據(jù)權(quán)利要求7所述的基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于所述數(shù)據(jù)融合模塊為對(duì)于同一類型的瀏覽行為,后出現(xiàn)的行為的分值覆蓋先出現(xiàn)的行為的分值的模塊。9.根據(jù)權(quán)利要求8所述的基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于所述數(shù)據(jù)融合模塊為采用1、2、3、4、5五個(gè)離散化的數(shù)值表示興趣度值,其中1表示很討厭,2表示一般討厭,3表示一般,4表示喜歡,5表示很喜歡,用戶在視頻網(wǎng)站的瀏覽行為數(shù)據(jù)的截取范圍為最近的一個(gè)月內(nèi),各種用戶瀏覽行為數(shù)據(jù)的融合規(guī)則如下表<table>tableseeoriginaldocumentpage3</column></row><table>將同一用戶對(duì)某個(gè)視頻節(jié)目的打分行為數(shù)據(jù)、收藏行為數(shù)據(jù)、挖行為數(shù)據(jù)、埋行為數(shù)據(jù)和上傳節(jié)目行為數(shù)據(jù)中r的對(duì)應(yīng)取值累加后,得到該用戶對(duì)某個(gè)視頻節(jié)目的興趣度值的模塊。10.根據(jù)權(quán)利要求9所述的基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于所述節(jié)目推薦模塊為在得到興趣度值表后,按每天兩次的頻率更推薦節(jié)目列表的模塊。全文摘要一種基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),包括用戶行為數(shù)據(jù)收集模塊,用于收集和存儲(chǔ)用戶在視頻網(wǎng)站的瀏覽行為數(shù)據(jù);數(shù)據(jù)融合模塊,與所述用戶行為數(shù)據(jù)收集模塊相連接,用于將某個(gè)用戶對(duì)某個(gè)視頻節(jié)目的瀏覽行為數(shù)據(jù)轉(zhuǎn)化為該用戶對(duì)某個(gè)視頻節(jié)目的興趣度值;節(jié)目推薦模塊,根據(jù)用戶對(duì)某些節(jié)目的興趣度值,向具有相同喜好的其他用戶推薦該用戶的其他興趣度值高的節(jié)目;其中,瀏覽行為數(shù)據(jù)包括為播放行為數(shù)據(jù),將用戶播放節(jié)目的時(shí)長(zhǎng)除以該節(jié)目的長(zhǎng)度得到時(shí)長(zhǎng)比例r,時(shí)長(zhǎng)比例r越大,興趣度值越高。本發(fā)明只要用戶有播放行為,并且在融合了用戶其它與興趣度相關(guān)的瀏覽行為數(shù)據(jù)后,可更加準(zhǔn)確地產(chǎn)生推薦的節(jié)目列表,大大提高了用戶對(duì)推薦節(jié)目的滿意度。文檔編號(hào)H04H60/61GK101764661SQ20081020760公開(kāi)日2010年6月30日申請(qǐng)日期2008年12月23日優(yōu)先權(quán)日2008年12月23日發(fā)明者連惠城申請(qǐng)人:未序網(wǎng)絡(luò)科技(上海)有限公司