本發(fā)明涉及大數(shù)據(jù)應(yīng)用技術(shù)領(lǐng)域,尤其涉及一種改善電視終端推薦系統(tǒng)推薦效果的方法。
背景技術(shù):
推薦系統(tǒng)作為解決“信息過載”問題的重要工具,在電子商務(wù)領(lǐng)域獲得了廣泛應(yīng)用:如amazon網(wǎng)站利用基于項(xiàng)目的協(xié)同過濾推薦方法向顧客推薦與興趣項(xiàng)目類似的項(xiàng)目。推薦系統(tǒng)中常見的推薦方法分為協(xié)同過濾推薦方法、基于內(nèi)容的推薦方法和混合推薦方法等。
一個(gè)推薦系統(tǒng)的實(shí)際推薦效果、系統(tǒng)性能,可以從多方面進(jìn)行評(píng)估。常見的評(píng)估指標(biāo)有:用戶滿意度、解釋性、預(yù)測(cè)準(zhǔn)確度、覆蓋率、多樣性、新穎性、驚喜度、信任度、實(shí)時(shí)性、健壯性等多個(gè)維度。
眾多的推薦方法各有利弊,利用的數(shù)據(jù)源有所不同,并且側(cè)重于從已有數(shù)據(jù)的不同維度進(jìn)行挖掘信息進(jìn)而推薦,因此各推薦方法在推薦系統(tǒng)評(píng)估的各項(xiàng)常見指標(biāo)中各有優(yōu)劣,通常難于周全。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)現(xiàn)有當(dāng)前推薦系統(tǒng)推薦結(jié)果的解釋性不強(qiáng)、覆蓋率不夠、多樣性不足、驚喜度不足等缺點(diǎn),本發(fā)明的目的在于提供一種改善電視終端推薦系統(tǒng)推薦效果的方法,通過引入與熱榜數(shù)據(jù)庫對(duì)應(yīng)的冷榜數(shù)據(jù)庫,通過媒體資源庫以及用戶歷史行為來構(gòu)建冷榜進(jìn)行推薦,可以有效提升推薦系統(tǒng)在這些評(píng)估指標(biāo)上的效果,進(jìn)而改善推薦結(jié)果,本發(fā)明公開的推薦方法可以作為一種獨(dú)立的推薦方法,也可以作為其它推薦方法的一種補(bǔ)充。
本發(fā)明的目的通過下述技術(shù)方案實(shí)現(xiàn):
一種改善電視終端推薦系統(tǒng)推薦效果的方法,所述電視終端內(nèi)部安裝有推薦系統(tǒng),所述電視終端內(nèi)部具有媒體資源庫,所述電視終端的媒體資源庫內(nèi)部存儲(chǔ)有能夠播放的所有節(jié)目及其相關(guān)信息,其方法步驟如下:
a、判斷推薦系統(tǒng)是否首次使用;若是首次使用,則進(jìn)入步驟b,否則,進(jìn)入步驟c;
b、利用媒體資源庫構(gòu)建與熱榜數(shù)據(jù)庫對(duì)應(yīng)的冷榜數(shù)據(jù)庫,冷榜數(shù)據(jù)庫構(gòu)建方法如下:
b1、根據(jù)媒體資源庫計(jì)算節(jié)目相似性矩陣wn*n:
式中,wij表示節(jié)目ii與節(jié)目ij的相似性;
媒體資源庫的所有節(jié)目記為i={i1i2…ii…in},每個(gè)節(jié)目ii會(huì)有多個(gè)特征features={feature1,feature2,…,featurek,…,featuref};通過這些特征可以計(jì)算節(jié)目間的內(nèi)容相似性,進(jìn)而獲得節(jié)目-節(jié)目相似性矩陣wn*n;
假設(shè)節(jié)目ii或ij總共有f個(gè)特征,其中有α個(gè)序數(shù)性特征,f-α個(gè)非序數(shù)性特征,則節(jié)目ii與節(jié)目ij的相似性可通過如下公式計(jì)算:
式中,αk表示第k個(gè)特征的重要性,若第k個(gè)特征是序數(shù)性特征,則節(jié)目ii與節(jié)目ij在第k個(gè)特征上的相似性可通過下式計(jì)算:
若第k個(gè)特征是非序數(shù)性特征,則節(jié)目ii與節(jié)目ij在第k個(gè)特征上的相似性可通過下式計(jì)算:
其中ii.featurevector和ij.featurevector分別為節(jié)目ii與節(jié)目ij在第k個(gè)特征上的onehot編碼向量;
b2、根據(jù)節(jié)目-節(jié)目相似性矩陣wn*n通過下式計(jì)算節(jié)目ii的冷門度coldi
coldi值越小,表明此節(jié)目越冷門;對(duì)coldi進(jìn)行升序排列,得到冷榜數(shù)據(jù)庫:coldlist=sort(coldi)ascending;
c、利用用戶觀影行為及媒體資源庫構(gòu)建與熱榜數(shù)據(jù)庫對(duì)應(yīng)的冷榜數(shù)據(jù)庫;
c1、利用媒體資源庫按照步驟b的方法構(gòu)建冷榜coldlist1;
c2、根據(jù)用戶觀影行為,統(tǒng)計(jì)每個(gè)節(jié)目ii被觀看的次數(shù),然后將觀看次數(shù)的多少按照降序排列,得到冷榜coldlist2;
c3、融合coldlist1和coldlist2得到最終冷榜coldlist,假如coldlist2中涉及的節(jié)目有p個(gè),則有p≤n,記為coldlist1={i1i2…in},coldlist2={i′1i′2…i′p},則融合后的coldlist通過以下運(yùn)算規(guī)則得到:
coldlist=(coldlist1-coldlist2)∪coldlist2
其中,符號(hào)“-”表示集合差運(yùn)算,符號(hào)∪表示集合并運(yùn)算;
d、判斷當(dāng)前推薦系統(tǒng)是否有其它推薦算法,若有,則轉(zhuǎn)入步驟e,否則,轉(zhuǎn)入步驟f;
e、融合冷榜數(shù)據(jù)庫與其他推薦算法的結(jié)果,產(chǎn)生推薦列表reclist;
假如推薦系統(tǒng)其他推薦算法,其他推薦算法包括協(xié)同過濾或頻繁項(xiàng)集,則其他推薦算法產(chǎn)生推薦列表alglist,則reclist可通過以下運(yùn)算法則獲得:
reclist=alglist∪(coldlist-alglist)
其中,符號(hào)“-”表示集合差運(yùn)算,符號(hào)∪表示集合并運(yùn)算;
f:對(duì)電視終端用戶進(jìn)行推薦,將步驟e的reclist或步驟c的coldlist推薦給電視終端用戶。
本發(fā)明較現(xiàn)有技術(shù)相比,具有以下優(yōu)點(diǎn)及有益效果:
本發(fā)明的目的在于提供一種改善電視終端推薦系統(tǒng)推薦效果的方法,通過引入與熱榜數(shù)據(jù)庫對(duì)應(yīng)的冷榜數(shù)據(jù)庫,通過媒體資源庫以及用戶歷史行為來構(gòu)建冷榜進(jìn)行推薦,可以有效提升推薦系統(tǒng)在這些評(píng)估指標(biāo)上的效果,進(jìn)而改善推薦結(jié)果,本發(fā)明公開的推薦方法可以作為一種獨(dú)立的推薦方法,也可以作為其它推薦方法的一種補(bǔ)充。
附圖說明
圖1為本發(fā)明的流程示意圖。
具體實(shí)施方式
下面結(jié)合實(shí)施例對(duì)本發(fā)明作進(jìn)一步地詳細(xì)說明:
實(shí)施例一
如圖1所示,一種改善電視終端推薦系統(tǒng)推薦效果的方法,所述電視終端內(nèi)部安裝有推薦系統(tǒng),所述電視終端內(nèi)部具有媒體資源庫,所述電視終端的媒體資源庫內(nèi)部存儲(chǔ)有能夠播放的所有節(jié)目及其相關(guān)信息,其方法步驟如下:
a、判斷推薦系統(tǒng)是否首次使用;若是首次使用,則進(jìn)入步驟b,否則,進(jìn)入步驟c;
b、利用媒體資源庫構(gòu)建與熱榜數(shù)據(jù)庫對(duì)應(yīng)的冷榜數(shù)據(jù)庫,冷榜數(shù)據(jù)庫構(gòu)建方法如下:
b1、根據(jù)媒體資源庫計(jì)算節(jié)目相似性矩陣wn*n:
式中,wij表示節(jié)目ii與節(jié)目ij的相似性;
媒體資源庫的所有節(jié)目記為i={i1i2…ii…in},每個(gè)節(jié)目ii會(huì)有多個(gè)特征features={feature1,feature2,…,featurek,…,featuref};通過這些特征可以計(jì)算節(jié)目間的內(nèi)容相似性,進(jìn)而獲得節(jié)目-節(jié)目相似性矩陣wn*n;
假設(shè)節(jié)目ii或ij總共有f個(gè)特征,其中有α個(gè)序數(shù)性特征,f-α個(gè)非序數(shù)性特征,則節(jié)目ii與節(jié)目ij的相似性可通過如下公式計(jì)算:
式中,αk表示第k個(gè)特征的重要性,若第k個(gè)特征是序數(shù)性特征,則節(jié)目ii與節(jié)目ij在第k個(gè)特征上的相似性可通過下式計(jì)算:
若第k個(gè)特征是非序數(shù)性特征,則節(jié)目ii與節(jié)目ij在第k個(gè)特征上的相似性可通過下式計(jì)算:
其中ii.featurevector和ij.featurevector分別為節(jié)目ii與節(jié)目ij在第k個(gè)特征上的onehot編碼向量;
b2、根據(jù)節(jié)目-節(jié)目相似性矩陣wn*n通過下式計(jì)算節(jié)目ii的冷門度coldi
coldi值越小,表明此節(jié)目越冷門;對(duì)coldi進(jìn)行升序排列,得到冷榜數(shù)據(jù)庫:coldlist=sort(coldi)ascending;
c、利用用戶觀影行為及媒體資源庫構(gòu)建與熱榜數(shù)據(jù)庫對(duì)應(yīng)的冷榜數(shù)據(jù)庫;
c1、利用媒體資源庫按照步驟b的方法構(gòu)建冷榜coldlist1;
c2、根據(jù)用戶觀影行為,統(tǒng)計(jì)每個(gè)節(jié)目ii被觀看的次數(shù),然后將觀看次數(shù)的多少按照降序排列,得到冷榜coldlist2;
c3、融合coldlist1和coldlist2得到最終冷榜coldlist,假如coldlist2中涉及的節(jié)目有p個(gè),則有p≤n,記為coldlist1={i1i2…in},coldlist2={i′1i′2…i′p},則融合后的coldlist通過以下運(yùn)算規(guī)則得到:
coldlist=(coldlist1-coldlist2)∪coldlist2
其中,符號(hào)“-”表示集合差運(yùn)算,符號(hào)∪表示集合并運(yùn)算;
d、判斷當(dāng)前推薦系統(tǒng)是否有其它推薦算法,若有,則轉(zhuǎn)入步驟e,否則,轉(zhuǎn)入步驟f;
e、融合冷榜數(shù)據(jù)庫與其他推薦算法的結(jié)果,產(chǎn)生推薦列表reclist;
假如推薦系統(tǒng)其他推薦算法,其他推薦算法包括協(xié)同過濾或頻繁項(xiàng)集,則其他推薦算法產(chǎn)生推薦列表alglist,則reclist可通過以下運(yùn)算法則獲得:
reclist=alglist∪(coldlist-alglist)
其中,符號(hào)“-”表示集合差運(yùn)算,符號(hào)∪表示集合并運(yùn)算;
f:對(duì)電視終端用戶進(jìn)行推薦,將步驟e的reclist或步驟c的coldlist推薦給電視終端用戶。
實(shí)施例二
如圖1所示,一種改善電視終端推薦系統(tǒng)推薦效果的方法,所述電視終端內(nèi)部安裝有推薦系統(tǒng),所述電視終端內(nèi)部具有媒體資源庫,所述電視終端的媒體資源庫內(nèi)部存儲(chǔ)有能夠播放的所有節(jié)目及其相關(guān)信息。
定義媒體資源庫:將電視終端能夠播放的所有節(jié)目及其相關(guān)信息存放的位置,稱為媒體資源庫。
定義用戶觀影行為:將電視終端用戶觀看媒體資源的相關(guān)行為,稱為用戶觀影行為。
定義冷門度:節(jié)目的冷門程度,即冷門度,與節(jié)目的熱門程度對(duì)應(yīng),一個(gè)節(jié)目越冷門,表明此節(jié)目越少被公眾所知曉。
其方法步驟如下:
步驟一:判斷推薦系統(tǒng)是否首次使用(裝有推薦系統(tǒng)應(yīng)用的所有電視終端均未使用過推薦系統(tǒng),此時(shí)存在推薦系統(tǒng)冷啟動(dòng)問題,能利用的信息只有媒體資源庫信息)。若是首次使用,則轉(zhuǎn)入步驟二,否則,轉(zhuǎn)入步驟三。
步驟二:利用媒體資源庫采用基于內(nèi)容的推薦方法構(gòu)建與熱榜數(shù)據(jù)庫對(duì)應(yīng)的冷榜數(shù)據(jù)庫;
冷榜數(shù)據(jù)庫構(gòu)建第一步:根據(jù)媒體資源庫計(jì)算節(jié)目節(jié)目相似性矩陣wn*n:
式中,wij表示節(jié)目ii與節(jié)目ij的相似性,媒體資源庫的所有節(jié)目記為i={i1i2…ii…in},每個(gè)節(jié)目ii會(huì)有多個(gè)特征features={feature1,feature2,…,featurek,…,featuref},這些特征通常分為有序的和無序的,例如,影片節(jié)目的特征可以為{導(dǎo)演,演員,影片時(shí)長,…},其中影片時(shí)長是有序的(可數(shù)值比較),而導(dǎo)演、演員是無序的。通過這些特征可以計(jì)算節(jié)目間的內(nèi)容相似性,進(jìn)而獲得節(jié)目-節(jié)目相似性矩陣wn*n?,F(xiàn)假設(shè)節(jié)目ii或ij總共有f個(gè)特征,其中有α個(gè)序數(shù)性特征,f-α個(gè)非序數(shù)性特征,則節(jié)目ii與節(jié)目ij的相似性可通過如下公式計(jì)算:
式中,αk表示第k個(gè)特征的重要性,ii.features(k)表示節(jié)目ii的第k個(gè)特征。
若第k個(gè)特征是序數(shù)性特征,則節(jié)目ii與節(jié)目ij在第k個(gè)特征上的相似性可通過下式計(jì)算:
若第k個(gè)特征是非序數(shù)性特征,則節(jié)目ii與節(jié)目ij在第k個(gè)特征上的相似性可通過下式計(jì)算:
其中,<·,·>為內(nèi)積運(yùn)算,||·||為2-范數(shù),ii.featurevector和ij.featurevector分別為節(jié)目ii與節(jié)目ij在第k個(gè)特征上的onehot編碼向量。
冷榜數(shù)據(jù)庫構(gòu)建第二步:根據(jù)節(jié)目-節(jié)目相似性矩陣wn*n通過下式計(jì)算節(jié)目ii的冷門度coldi:
coldi值越小,表明此節(jié)目越冷門,對(duì)coldi進(jìn)行升序排列(此時(shí)冷榜數(shù)據(jù)庫的冷門度主要表現(xiàn)為單一節(jié)目與其它節(jié)目的內(nèi)容相似性上),得到冷榜:coldlist=sort(coldi)ascending。
其中,αk可以通過調(diào)查問卷的方式獲得,一種可行的調(diào)查問卷的形式可設(shè)計(jì)如下:
為更客觀的統(tǒng)計(jì),以上問卷應(yīng)設(shè)計(jì)成多選?,F(xiàn)假設(shè)第k個(gè)特征的投票數(shù)為nk,則αk可通過下式計(jì)算:
步驟三:利用用戶觀影行為及媒體資源庫構(gòu)建與“熱榜”對(duì)應(yīng)的冷榜數(shù)據(jù)庫
冷榜數(shù)據(jù)庫構(gòu)建第一步:利用媒體資源庫采用步驟二的方法構(gòu)建冷榜coldlist1;
冷榜數(shù)據(jù)庫構(gòu)建第二步:根據(jù)用戶觀影行為,統(tǒng)計(jì)每個(gè)節(jié)目ii被觀看的次數(shù),然后將觀看次數(shù)的多少按照降序排列,得到冷榜coldlist2,此時(shí)冷榜數(shù)據(jù)庫的冷門度表現(xiàn)在單一節(jié)目被觀看的次數(shù)越少則此節(jié)目越冷門;
冷榜數(shù)據(jù)庫構(gòu)建第三步:融合coldlist1和coldlist2得到最終冷榜coldlist
假定coldlist2中涉及的節(jié)目有p個(gè),則有p≤n,記coldlist1={i1i2…in},coldlist2={i′1i′2…i′p},則融合后的coldlist通過以下運(yùn)算規(guī)則得到:
coldlist=(coldlist1-coldlist2)∪coldlist2
其中,符號(hào)“-”表示集合差運(yùn)算(且此處保持coldlist1中節(jié)目的相對(duì)排序不變),符號(hào)∪表示集合并運(yùn)算(且此處保持(coldlist1-coldlist2)和coldlist2中節(jié)目相對(duì)排序不變,合并之后的結(jié)果(coldlist1-coldlist2)排在coldlist2之前)。舉例來說,當(dāng)coldlist1={i5i2i3i1i4i6},coldlist2={i2i3i5i4}時(shí),(coldlist1-coldlist2)={i1i6},coldlist=(coldlist1-coldlist2)∪coldlist2={i1i6i2i3i5i4},上式的含義為如果節(jié)目未出現(xiàn)在用戶行為中,且此節(jié)目與其它節(jié)目內(nèi)容上越不相似,則此節(jié)目越冷門。
步驟四:當(dāng)前推薦系統(tǒng)是否有其它推薦算法;若有,則轉(zhuǎn)步驟五,否則,轉(zhuǎn)步驟六。
步驟五:融合冷榜數(shù)據(jù)庫與其他推薦算法的結(jié)果,產(chǎn)生推薦列表reclist。
假定推薦系統(tǒng)其他推薦算法(如協(xié)同過濾,頻繁項(xiàng)集等)產(chǎn)生推薦列表alglist,則reclist可通過以下運(yùn)算法則獲得:
reclist=alglist∪(coldlist-alglist)
式中,各符號(hào)運(yùn)算含義同步驟三,上述含義為如果推薦系統(tǒng)有其他的推薦算法,則構(gòu)建的冷榜就作為其它推薦算法的補(bǔ)充算法對(duì)原有的推薦算法結(jié)果進(jìn)行補(bǔ)充以提升整個(gè)推薦系統(tǒng)的覆蓋率、多樣性、驚喜度等效果指標(biāo)。
步驟六:對(duì)電視終端用戶進(jìn)行推薦;將reclist推薦給電視終端用戶。當(dāng)步驟四的當(dāng)前推薦系統(tǒng)沒有其它推薦算法,直接將步驟三的coldlist推薦給電視終端用戶
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。