一種社會化網(wǎng)絡(luò)的視頻推薦方法和裝置的制造方法
【專利摘要】本發(fā)明適用于視頻推薦領(lǐng)域,提供了一種社會化網(wǎng)絡(luò)的視頻推薦方法和裝置,該方法包括:采集用戶的正樣本數(shù)據(jù)和用戶的負樣本數(shù)據(jù),根據(jù)所述正樣本數(shù)據(jù)和負樣本數(shù)據(jù)計算所述用戶之間的興趣相似度值;根據(jù)用戶的好友數(shù)量值計算用戶之間的熟悉度值;根據(jù)所述熟悉度值和所述興趣相似度值,計算用戶之間的信任度值;根據(jù)所述信任度值計算用戶的信譽度值;根據(jù)所述信任度值、所述信譽度值、所述興趣相似度值計算用戶之間的依賴度值,根據(jù)所述依賴度值進行視頻推薦。本發(fā)明采集的用戶更為豐富的數(shù)據(jù),有利于提高推薦精度。
【專利說明】
-種社會化網(wǎng)絡(luò)的視頻推薦方法和裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于互聯(lián)網(wǎng)領(lǐng)域,尤其設(shè)及一種社會化網(wǎng)絡(luò)的視頻推薦方法和裝置。
【背景技術(shù)】
[0002] 社會化網(wǎng)絡(luò)推薦,即利用社會化關(guān)系進行推薦。在現(xiàn)實生活中,人必然和身邊的人 產(chǎn)生各種各樣的關(guān)系,關(guān)系的產(chǎn)生必然基于某種交互和影響。如果充分利用與用戶交互的 其它用戶的影響因素,就可W很好的預(yù)測用戶的偏好,運也是目前推薦系統(tǒng)中研究的熱點。
[0003] 目前的社會化網(wǎng)絡(luò)推薦的數(shù)據(jù)來源,一般包括用戶之間的社會關(guān)系信息和用戶的 行為信息。其中,用戶之間的社會關(guān)系信息主要包括好友關(guān)系或者關(guān)注關(guān)系。用戶的行為信 息則包括多種,比如瀏覽行為、點擊行為、收藏行為等。用戶的社會關(guān)系可W用于度量社會 網(wǎng)絡(luò)中用戶之間的熟悉程度,用戶的行為信息可W用于度量用戶與用戶之間的興趣的相似 度。
[0004] 通過目前的社會化網(wǎng)絡(luò)推薦方法,可W為社會化網(wǎng)絡(luò)過濾無關(guān)的信息,并且能為 推薦系統(tǒng)提供更多的有效數(shù)據(jù)來源。特別是對于行為稀疏的用戶,W及一些冷啟動的用戶, 社會化網(wǎng)絡(luò)的推薦方法的效果非常顯著。
[0005] 但是,目前的視頻推薦方法的數(shù)據(jù)來源一般都是采集用戶所喜歡或者感興趣的視 頻對象,向與該用戶較為熟悉的其它用戶,或者興趣與該用戶較為相近的其它用戶進行推 薦,由于采集數(shù)據(jù)來源仍然不夠豐富,不利于進一步提高視頻推薦的精度。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明實施例的目的在于提供一種用于社會化網(wǎng)絡(luò)的視頻推薦方法及裝置,旨在 解決現(xiàn)有技術(shù)的視頻推薦方法中,由于采集數(shù)據(jù)來源仍然不夠豐富,不利于進一步提高視 頻推薦的精度的問題。
[0007] 第一方面,本發(fā)明實施例提供了一種社會化網(wǎng)絡(luò)的視頻推薦方法,所述方法包括: [000引采集用戶的正樣本數(shù)據(jù)和用戶的負樣本數(shù)據(jù),其中所述正樣本數(shù)據(jù)為用戶感興趣 的數(shù)據(jù),負樣本數(shù)據(jù)為用戶不感興趣的數(shù)據(jù);
[0009] 根據(jù)所述正樣本數(shù)據(jù)和負樣本數(shù)據(jù)計算所述用戶之間的興趣相似度值;
[0010] 根據(jù)用戶的好友數(shù)量值計算用戶之間的熟悉度值;
[0011] 根據(jù)所述熟悉度值和所述興趣相似度值,計算用戶之間的信任度值;
[0012] 根據(jù)所述信任度值計算用戶的信譽度值;
[0013] 根據(jù)所述信任度值、所述信譽度值、所述興趣相似度值計算用戶之間的依賴度值, 根據(jù)所述依賴度值進行視頻推薦。
[0014] 結(jié)合第一方面,在第一方面的第一種可能實施方式中,采集用戶的負樣本數(shù)據(jù)的 步驟包括:
[0015] 根據(jù)用戶的行為確定用戶的正樣本數(shù)據(jù);
[0016] 根據(jù)所述正樣本數(shù)據(jù),查找與所述正樣本數(shù)據(jù)相似的數(shù)據(jù)集合;
[0017] 在所述數(shù)據(jù)集合中查找所述用戶未發(fā)生行為,且相似度超過預(yù)定闊值的樣本數(shù)據(jù) 作為負樣本數(shù)據(jù)。
[0018] 結(jié)合第一方面,在第一方面的第二種可能實施方式中,所述根據(jù)所述正樣本數(shù)據(jù) 和負樣本數(shù)據(jù)計算所述用戶之間的興趣相似度值步驟包括:
[0019]根據(jù)公式5。,巾=^巧"。,,+ 1-成*5'。^十算所述用戶之間的興趣相信度值,其中,
表示用戶U的負樣本,N' (V)表示用戶V的負樣本,K表示為調(diào)節(jié)系數(shù),取值在0~1之間。
[0020] 結(jié)合第一方面,在第一方面的第=種可能實施方式中,所述根據(jù)用戶的好友數(shù)量 值計算用戶之間的熟悉度值步驟包括:
[0021] 根據(jù)公:
h算計算用戶之間的熟悉度值,其中=OUt(U)、in(v) 分別表示用戶U關(guān)注的用戶數(shù)和關(guān)注用戶V的用戶數(shù)。
[0022] 結(jié)合第一方面,在第一方面的第四種可能實施方式中,所述根據(jù)所述熟悉度值和 所述興趣相似度值,計算用戶之間的信任度值步驟包括:
[0023] 根據(jù)公:
十算用戶之間的信任度值,其中:
[0024] T'(u,v)=F(u,v)+S(u,v)
為衰減因子,滿足 〇<(p<l,Cm 表示與 用戶U的好友深度為m并且信任V的用戶集合,T'(u,v)直接信任度值,F(xiàn)(u,v)表示用戶U與用戶 V的熟悉度值,S(u,V康示用戶U與V之間的興趣相似度值。
[0025] 結(jié)合第一方面,在第一方面的第五種可能實施方式中,所述根據(jù)所述信任度值計 算用戶的信譽度值步驟包括:
[00%]根據(jù)公
計算用戶的信譽度值,其中:TSu代表信任用戶U的用 戶集合,TS^ y代表用戶U信任的用戶集合,T表示信任度值。
[0027]結(jié)合第一方面,在第一方面的第六種可能實施方式中,所述根據(jù)所述信任度值、所 述信譽度值、所述興趣相似度值計算用戶之間的依賴度值,根據(jù)所述依賴度值進行視頻推 薦步驟包括:
[002引根據(jù)公式化u,v=K*Tu,v+l-K*Rv+Su,v計算用戶間的依賴度,其中:RLu,v表示U對V 的依賴度,Tu,V表示U對V的信任度,Rv表示V的信譽度,Su,V表示u、v之間的興趣相似度,K表 示為調(diào)節(jié)系數(shù),取值在0~1,間。
[0029] 根據(jù)公支
f算用戶U對視頻i的感興趣程度,其 中:mostR(u)表示對U依賴度最高的前N個用戶,RLu,v表示對u來說v的依賴度,;r(v,i)表示用 戶V對視頻i的興趣程度。
[0030] 第二方面,本發(fā)明實施例提供了一種社會化網(wǎng)絡(luò)的視頻推薦裝置,所述裝置包括:
[0031] 數(shù)據(jù)采集單元,用于采集用戶的正樣本數(shù)據(jù)和用戶的負樣本數(shù)據(jù),其中所述正樣 本數(shù)據(jù)為用戶感興趣的數(shù)據(jù),負樣本數(shù)據(jù)為用戶不感興趣的數(shù)據(jù);
[0032] 相似度計算單元,用于根據(jù)所述正樣本數(shù)據(jù)和負樣本數(shù)據(jù)計算所述用戶之間的興 趣相似度值;
[0033] 熟悉度計算單元,用于根據(jù)用戶的好友數(shù)量值計算用戶之間的熟悉度值;
[0034] 信任度計算單元,用于根據(jù)所述熟悉度值和所述興趣相似度值,計算用戶之間的 信任度值;
[0035] 信譽度計算單元,用于根據(jù)所述信任度值計算用戶的信譽度值;
[0036] 依賴度計算和推薦單元,用于根據(jù)所述信任度值、所述信譽度值、所述興趣相似度 值計算用戶之間的依賴度值,根據(jù)所述依賴度值進行視頻推薦。
[0037] 結(jié)合第二方面,在第二方面的第一種可能實現(xiàn)方式中,所述數(shù)據(jù)采集單元包括:
[0038] 正樣本采集子單元,用于根據(jù)用戶的行為確定用戶的正樣本數(shù)據(jù);
[0039] 查找子單元,用于根據(jù)所述正樣本數(shù)據(jù),查找與所述正樣本數(shù)據(jù)相似的數(shù)據(jù)集合;
[0040] 負樣本確定子單元,用于在所述數(shù)據(jù)集合中查找所述用戶未發(fā)生行為,且相似度 超過預(yù)定闊值的樣本數(shù)據(jù)作為負樣本數(shù)據(jù)。
[0041] 結(jié)合第二方面,在第二方面的第二種可能實現(xiàn)方式中,所述興趣相似度計算單元 具體用于:
[0042] 根據(jù)公式Su,V=K巧"u,v+l-K*s Vv計算所述用戶之間的興趣相信度值,其中,
V'(U)表示用戶U的負樣本,N' (V)表示用戶V的負樣本,K表示為調(diào)節(jié)系數(shù),取值在0~1之間。
[0043] 在本發(fā)明實施例中,通過采集用戶的正樣本數(shù)據(jù)和用戶的負樣本數(shù)據(jù),在獲取了 用戶喜歡的樣本數(shù)據(jù)的同時,還獲取了用戶不喜歡的樣本數(shù)據(jù),通過所述正樣本數(shù)據(jù)和負 樣本數(shù)據(jù)得到用戶之前的興趣相似度值,并結(jié)合用戶之間的熟悉度值和興趣相似度值計算 用戶之間的信任度值,通過所述信任度值和信譽度值和興趣相似度值得到用戶之間的依賴 度值,并根據(jù)所述依賴度值進行視頻推薦,從而使得本發(fā)明采集的用戶更為豐富的數(shù)據(jù),有 利于提高推薦精度。
【附圖說明】
[0044] 圖1是本發(fā)明實施例提供的社會化網(wǎng)絡(luò)的視頻推薦方法的實現(xiàn)流程圖;
[0045] 圖2是本發(fā)明實施例提供的采集負樣本數(shù)據(jù)的實現(xiàn)流程圖;
[0046] 圖3是本發(fā)明實施例提供的用戶間信任度傳遞示意圖;
[0047] 圖4是本發(fā)明實施例提供的社會化網(wǎng)絡(luò)的視頻推薦的結(jié)構(gòu)示意圖。
【具體實施方式】
[004引為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,W下結(jié)合附圖及實施例,對 本發(fā)明進行進一步詳細說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用W解釋本發(fā)明,并 不用于限定本發(fā)明。
[0049] 在本發(fā)明實施例的目的在于提供一種對用戶的數(shù)據(jù)采集更為全面,推薦精度更高 的視頻推薦方法。從而能夠解決現(xiàn)有技術(shù)采集的算法在度量用戶之間興趣相似度時,只從 用戶已觀看的視頻中提取,而對于用戶未觀看過的視頻,不能從其中提取到用戶的興趣度 信息W及計算其對依賴度的影響。因為如果兩個用戶都不喜歡某個視頻,那么他們之間也 有隱藏的相似性,并且同時不喜歡的視頻越多,運種相似性可能越明顯,本發(fā)明有效的對該 部分?jǐn)?shù)據(jù)進行了收集與處理。下面結(jié)合附圖進行具體說明。
[0050] 圖1示出了本發(fā)明實施例提供的社會化網(wǎng)絡(luò)的視頻推薦方法實現(xiàn)流程,詳述如下:
[0051] 在步驟Sioi中,采集用戶的正樣本數(shù)據(jù)和用戶的負樣本數(shù)據(jù),其中所述正樣本數(shù) 據(jù)為用戶感興趣的數(shù)據(jù),負樣本數(shù)據(jù)為用戶不感興趣的數(shù)據(jù)。
[0052] 具體的,本發(fā)明實施例中所述正樣本數(shù)據(jù),即用戶通過點擊、收藏或者瀏覽的對象 數(shù)據(jù),所述對象數(shù)據(jù)包括圖片、視頻、聲音等文件。
[0053] 在本發(fā)明實施例中,對于所述負樣本數(shù)據(jù),還包括熱度值的限定,只有對于熱度值 大于預(yù)定的熱度值,并且用戶對所述樣本數(shù)據(jù)沒有實施行為時,才選取所述樣本數(shù)據(jù)為負 樣本數(shù)據(jù)。所述樣本數(shù)據(jù)的熱度值可W根據(jù)樣本數(shù)據(jù)在頁面中呈現(xiàn)的位置W及用戶瀏覽的 次數(shù)進行評估和計算,在用戶面前呈現(xiàn)的次數(shù)越多,則表示該樣本數(shù)據(jù)對于該用戶的熱度 越局。
[0054] 用戶未發(fā)生行為的負樣本數(shù)據(jù),可W與正樣本數(shù)據(jù)的數(shù)目相等,采集負樣本數(shù)據(jù) 的流程可W如圖2所示,包括:
[0055] S201,遍歷用戶列表,如果用戶列表為空則結(jié)束該流程,不為空則進入下一步驟;
[0056] S202,讀取用戶U,遍歷該用戶觀看過的物品列表(此處可W為歷史視頻觀看記 錄),如果該用戶的物品列表為空則返回到開頭尋找下一個用戶;如果不為空則進入下一步 驟;
[0057] S203,讀取用戶的歷史觀看正樣本i,并遍歷集合S,如果S為空,則返回上一步驟, 不為空則讀取與之相關(guān)的負樣本j,其中S為系統(tǒng)中與視頻相似的視頻按照相似度值從大到 小排序后的集合。
[0058] 由于一個視頻可能出現(xiàn)在多個用戶的正樣本中,如果對用戶正樣本進行遍歷時動 態(tài)獲取負樣本,將導(dǎo)致大量重復(fù)的運算,降低算法性能。為此可W維護一種系統(tǒng)視頻相似度 二維表,保存任意兩視頻之間的相似度,因此在針對每個正樣本獲取負樣本時,只需要讀取 二維表,選擇與正樣本相似度最高且用戶沒觀看過的視頻即可。
[0059] S204,判斷負樣本j是否符合兩者之間的相似度闊值,如果大于則判定j為i的負樣 本,如果不符合重新回到集合S;
[0060] S205,不斷遍歷迭代直到找到用戶U所有的負樣本集合,流程結(jié)束。
[0061] 在步驟S102中,根據(jù)所述正樣本數(shù)據(jù)和負樣本數(shù)據(jù)計算所述用戶之間的興趣相似 度值。
[0062] 具體的,所述用戶之間興趣相似度值,主要體現(xiàn)為用戶之間具有某種相同的屬性, 如年齡、性別、地區(qū);或則具有共同的行為,如購買了相同的物品、收藏了同一個網(wǎng)站。本發(fā) 明的興趣相似度可由用戶行為決定,它由正樣本數(shù)據(jù)貢獻的相似性和負樣本數(shù)據(jù)貢獻的相 似性組成。
[0063] 將用戶轉(zhuǎn)化為n維空間上的向量,n代表系統(tǒng)中視頻的數(shù)目。如果某個視頻在負樣 本中,則相應(yīng)位置的值為I,否則為0。那么負樣本決定的用戶之間相似性的計算公式可W 為
。
[0064] 其中,N'(U)表示用戶U的負樣本,N'(V)表示用戶V的負樣本,In'(U) UN'(V) I表示 用戶U與用戶V共同不喜歡的視頻數(shù)目。
[0065] 用戶正樣本決定的用戶之間相似性的計算公式可W為:
[0066]
[00671 (U)表示用戶U的已經(jīng)觀看過的視頻集合,N'(i)表示喜歡視頻i的用戶集 合 -表示視頻的熱口懲罰,因為熱口視頻對用戶相似度的貢獻小于冷口視頻。
[0068] 用戶間最終的相似值計算公式可W如下:
[0069] Su,v= 〇c*S"u,v+l-〇c巧,u,v
[0070] 其中,k<1-k,表示正樣本貢獻的相似值大于負樣本貢獻的相似值。
[0071] 在步驟S103中,根據(jù)用戶的好友數(shù)量值計算用戶之間的熟悉度值。
[0072] 熟悉度對于推薦系統(tǒng)是一個很重要的參考指標(biāo),因為用戶往往更容易接受自己更 熟悉的人做出的推薦,運好比現(xiàn)實中自己熟悉的朋友、家人,人們在猶豫不決,往往更青睞 熟悉人的建議。
[0073] 影響熟悉度的因素包括:當(dāng)前用戶的好友數(shù)量、目標(biāo)用戶的好友數(shù)量。如果當(dāng)前用 戶的好友數(shù)越多,那么他和目標(biāo)用戶的熟悉度越低;同理,如果目標(biāo)用戶的好友數(shù)越多,當(dāng) 前用戶對其它的熟悉度也越低。用戶之間熟悉的度量公式可W如下:
[0074]
[0075] 如果是關(guān)注關(guān)系,out(u)、in(v)分別表示用戶U關(guān)注的用戶數(shù)和關(guān)注用戶V的用戶 數(shù);如果是好友關(guān)系,〇ut(u)、in(v)分別表示用戶u、v的好友數(shù)目。
[0076] 在步驟S104中,根據(jù)所述熟悉度值和所述興趣相似度值,計算用戶之間的信任度 值。
[0077] 定義用戶之間的興趣相似度和用戶之間的熟悉度,他們共同組成用戶之間的信任 度,計算公式可W為:T'(U,V)=F(u,v)+S(u,v)。運里計算的信任度只存在于有直接社會關(guān)系 的用戶之間,運樣的信任度稱為直接信任度。
[0078] 社交關(guān)系具有一大特性就是傳遞性,無論是好消息還是壞消息,都能順著社會關(guān) 系進行傳遞擴展。信任度同樣如此,如圖3所示,A信任B,B信任C,那么A受B的影響也會信任 C,如果A有多個好友信任C,那么A對C的信任值傾向于多個好友信任值的平均值。
[0079] 圖中A對C的信任值為傳遞信任值,或則間接信任值,間接信任值主要取決于A的好 友集合對C的信任值的平均值。同時,每一條間接信任度受A和C之間的好友深度影響。好友 深度指用戶經(jīng)歷了幾層好友與目標(biāo)用戶相連,如果A和C之間直接相連,那么好友深度為0, 而上圖中因為只經(jīng)過了好友B與C相連,則好友深度為1。顯而易見,每一條間接信任度隨著 好友深度的加長而衰減。間接信任度的計算公式可W為:
其中,Cm不為 空,W為衰減因子,滿足0<(P<1.Cm表示與用戶U的好友深度為m并且信任V的用戶集合,T'(u, V)直接信任度值,F(xiàn)(u,v)表示用戶U與用戶V的熟悉度值,S(u,v)表示用戶U與V之間的興趣相似 度值。
[0080] 直接信任的用戶之間,也可能具有間接的信任度。同時,間接的信任度也可能包括 多條,需要對其取平均值。用戶之間最終的信任度計算公式為
其中,k表 示好友深度,i>Cv表示間接信任度之和。 m 二I
[0081] 在步驟S105中,根據(jù)所述信任度值計算用戶的信譽度值;
[0082] 社會化網(wǎng)絡(luò)存在所謂的名人效應(yīng)。名人效應(yīng),是指名人的出現(xiàn)所達成的引人注意、 強化事物、擴大影響的效應(yīng),名人效應(yīng)已經(jīng)在生活中的方方面面產(chǎn)生深遠影響。社會化網(wǎng)絡(luò) 中的名人效應(yīng),體現(xiàn)為更高的關(guān)注度、更大的影響力、更強的號召性。
[0083] 社會化網(wǎng)絡(luò)中的名人,是指影響力最大或者對整個網(wǎng)絡(luò)貢獻最大的一批人。衡量 一個人是否是名人的方法有很多種,信譽度就是其中一個指標(biāo)。信譽度高的人,說明他被許 多人所信任,那么他可能成為名人。信任度存在于用戶之間,用戶衡量兩用戶之間的信任關(guān) 系,而信譽度是用戶的屬性,用于衡量他在整個系統(tǒng)中的可信度。
[0084] 社會化網(wǎng)絡(luò)中一個人的信譽度由信任他的人數(shù)和每個人的信譽度決定。信任他的 人數(shù)越多,那么他的信譽度越高;當(dāng)中每個人的信譽度越高,那么他的信譽度越高。公式可 W如下:
[0085]
[0086] 其中,TSu代表信任用戶U的用戶集合,TS%代表用戶U信任的用戶集合,T表示信任 度值。
[0087] 在步驟S106中,根據(jù)所述信任度值、所述信譽度值、所述興趣相似度值計算用戶之 間的依賴度值,根據(jù)所述依賴度值進行視頻推薦。
[0088] 具體的,用戶間的依賴度由用戶行為和用戶社會關(guān)系兩大部分決定,用戶行為體 現(xiàn)為用戶之間的興趣相似度,用戶社會關(guān)系體現(xiàn)為用戶之間的信任度和目標(biāo)用戶在社會網(wǎng) 絡(luò)中的信譽度。用戶間的依賴度計算公式如下:
[0089] RLu,v=〇c*Tu,v+1-〇c*Rv+Su,v
[0090] 化U, V表示U對V的依賴度,Tu, V表示U對V的信任度,Rv表示V的信譽度,Su, V表示U、V之 間的興趣相似度,K表示為調(diào)節(jié)系數(shù),取值在0~1之間,調(diào)節(jié)兩部分的比重。
[0091] 其中,基于依賴度并計算得出用戶感興趣的視頻集合推薦給用戶可W具體包括:
[0092] 基于依賴度的社會化推薦算法,計算得出P(u,i)表示用戶U對視頻i的感興趣程度 (也可W理解為等分),計算公式如下:
[0093]
[0094] 其中,mostR(u)表示對U依賴度最高的前N個用戶,RLu,v表示對U來說V的依賴度,r (v,i)表示用戶V對視頻i的興趣程度,一般情況是單一反饋數(shù)據(jù),r(v,i) = l,即用戶V觀看 過視頻i,也可W表示為用戶V對視頻i的打分值。
[0095] 根據(jù)計算得出的P(u,i)值,從高到低排序,挑選前N個感興趣程度最高的視頻集合 推薦給用戶,推薦流程結(jié)束。
[0096] 本發(fā)明實施例通過獲取用戶的正樣本數(shù)據(jù)和負樣本數(shù)據(jù)進行推薦計算,將用戶隱 藏的負樣本數(shù)據(jù)增加至推薦因素,從而使得本發(fā)明采集的數(shù)據(jù)更為全面,推薦精度更高。并 且本發(fā)明結(jié)合用戶行為的相似度W及興趣的相似度進行推薦,有利于進一步提高推薦的準(zhǔn) 確性。
[0097] 圖4為本發(fā)明實施例提供的社會化網(wǎng)絡(luò)的視頻推薦裝置的結(jié)構(gòu)示意圖,如圖所示, 本發(fā)明實施例所述社會化網(wǎng)絡(luò)的視頻推薦裝置,包括:
[0098] 數(shù)據(jù)采集單元401,用于采集用戶的正樣本數(shù)據(jù)和用戶的負樣本數(shù)據(jù),其中所述正 樣本數(shù)據(jù)為用戶感興趣的數(shù)據(jù),負樣本數(shù)據(jù)為用戶不感興趣的數(shù)據(jù);
[0099] 相似度計算單元402,用于根據(jù)所述正樣本數(shù)據(jù)和負樣本數(shù)據(jù)計算所述用戶之間 的興趣相似度值;
[0100] 熟悉度計算單元403,用于根據(jù)用戶的好友數(shù)量值計算用戶之間的熟悉度值;
[0101] 信任度計算單元404,用于根據(jù)所述熟悉度值和所述興趣相似度值,計算用戶之間 的信任度值;
[0102] 信譽度計算單元405,用于根據(jù)所述信任度值計算用戶的信譽度值;
[0103] 依賴度計算和推薦單元406,用于根據(jù)所述信任度值、所述信譽度值、所述興趣相 似度值計算用戶之間的依賴度值,根據(jù)所述依賴度值進行視頻推薦。
[0104] 優(yōu)選的,所述數(shù)據(jù)采集單元包括:
[0105] 正樣本采集子單元,用于根據(jù)用戶的行為確定用戶的正樣本數(shù)據(jù);
[0106] 查找子單元,用于根據(jù)所述正樣本數(shù)據(jù),查找與所述正樣本數(shù)據(jù)相似的數(shù)據(jù)集合;
[0107] 負樣本確定子單元,用于在所述數(shù)據(jù)集合中查找所述用戶未發(fā)生行為,且相似度 超過預(yù)定闊值的樣本數(shù)據(jù)作為負樣本數(shù)據(jù)。
[0108] 優(yōu)選的,所述興趣相似度計算單元具體用于:
[0109] 根據(jù)公式Su,V=K巧"u,v+l-K*S Vv計算所述用戶之間的興趣相信度值,其中,
N'(U)表示用戶U的負樣本,N' (V)表示用戶V的負樣本,K表示為調(diào)節(jié)系數(shù),取值在0~1之間。
[0110] 圖4所述社會化網(wǎng)絡(luò)的視頻推薦裝置,與圖1所述社會化網(wǎng)絡(luò)的視頻推薦方法對 應(yīng),在此不作重復(fù)寶述。
[0111] W上所述僅為本發(fā)明的較佳實施例而已,并不用W限制本發(fā)明,凡在本發(fā)明的精 神和原則之內(nèi)所作的任何修改、等同替換和改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
【主權(quán)項】
1. 一種社會化網(wǎng)絡(luò)的視頻推薦方法,其特征在于,所述方法包括: 采集用戶的正樣本數(shù)據(jù)和用戶的負樣本數(shù)據(jù),其中所述正樣本數(shù)據(jù)為用戶感興趣的數(shù) 據(jù),負樣本數(shù)據(jù)為用戶不感興趣的數(shù)據(jù); 根據(jù)所述正樣本數(shù)據(jù)和負樣本數(shù)據(jù)計算所述用戶之間的興趣相似度值; 根據(jù)用戶的好友數(shù)量值計算用戶之間的熟悉度值; 根據(jù)所述熟悉度值和所述興趣相似度值,計算用戶之間的信任度值; 根據(jù)所述信任度值計算用戶的信譽度值; 根據(jù)所述信任度值、所述信譽度值、所述興趣相似度值計算用戶之間的依賴度值,根據(jù) 所述依賴度值進行視頻推薦。2. 根據(jù)權(quán)利要求1所述方法,其特征在于,采集用戶的負樣本數(shù)據(jù)的步驟包括: 根據(jù)用戶的行為確定用戶的正樣本數(shù)據(jù); 根據(jù)所述正樣本數(shù)據(jù),查找與所述正樣本數(shù)據(jù)相似的數(shù)據(jù)集合; 在所述數(shù)據(jù)集合中查找所述用戶未發(fā)生行為,且相似度超過預(yù)定閾值的樣本數(shù)據(jù)作為 負樣本數(shù)據(jù)。3. 根據(jù)權(quán)利要求1所述方法,其特征在于,所述根據(jù)所述正樣本數(shù)據(jù)和負樣本數(shù)據(jù)計算 所述用戶之間的興趣相似度值步驟包括: 根據(jù)公式Su,v=cx*S"u,v+l-cx*S' u,v計算所述用戶之間的興趣相信度值,其中,N'(u)表示用戶u的負樣本,Ν' (ν)表示用戶ν的負樣本,α表示為調(diào)節(jié)系數(shù),取值在0~1之間。4. 根據(jù)權(quán)利要求1所述方法,其特征在于,所述根據(jù)用戶的好友數(shù)量值計算用戶之間的 熟悉度值步驟包括: 根據(jù)公?十算計算用戶之間的熟悉度值,其中:〇ut(u)、in(v)分別 表示用戶u關(guān)注的用戶數(shù)和關(guān)注用戶v的用戶數(shù)。5. 根據(jù)權(quán)利要求1所述方法,其特征在于,所述根據(jù)所述熟悉度值和所述興趣相似度 值,計算用戶之間的信任度值步驟包括: 根據(jù)公式計算用戶之間的信任度值,其中: T,(u,v)=F(u;v)+S(u;v)(Cm 不為空),Φ為衰減因子,滿足 〇<φ<1,Cm 表示與用戶u的好友深度為m并且信任v的用戶集合,T'(u,v)直接信任度值,F(xiàn)(u,v)表示用戶u 與用戶v的熟悉度值,S(u,v)表示用戶u與v之間的興趣相似度值。6. 根據(jù)權(quán)利要求1所述方法,其特征在于,所述根據(jù)所述信任度值計算用戶的信譽度值 步驟包括: 根據(jù)公¥計算用戶的信譽度值,其中:TSU代表信任用戶u的用戶集 合,TS' 表用戶u信任的用戶集合,T表示信任度值。7. 根據(jù)權(quán)利要求1所述方法,其特征在于,所述根據(jù)所述信任度值、所述信譽度值、所述 興趣相似度值計算用戶之間的依賴度值,根據(jù)所述依賴度值進行視頻推薦步驟包括: 根據(jù)公式RLU, ν = 〇c *TU, ν+1 -〇c *RV+SU, ν計算用戶間的依賴度,其中:RLU, ν表示u對ν的依賴 度,Tu,v表示U對V的信任度,Rv表示4勺信譽度,Su, v表示1!、¥之間的興趣相似度,α表示為調(diào) 節(jié)系數(shù),取值在0~1之間。 根據(jù)公?f算用戶u對視頻i的感興趣程度,其中: mostR(u)表示對u依賴度最高的前N個用戶,RLU,V表示對u來說ν的依賴度,r(v,i)表示用戶ν 對視頻i的興趣程度。8. -種社會化網(wǎng)絡(luò)的視頻推薦裝置,其特征在于,所述裝置包括: 數(shù)據(jù)采集單元,用于采集用戶的正樣本數(shù)據(jù)和用戶的負樣本數(shù)據(jù),其中所述正樣本數(shù) 據(jù)為用戶感興趣的數(shù)據(jù),負樣本數(shù)據(jù)為用戶不感興趣的數(shù)據(jù); 相似度計算單元,用于根據(jù)所述正樣本數(shù)據(jù)和負樣本數(shù)據(jù)計算所述用戶之間的興趣相 似度值; 熟悉度計算單元,用于根據(jù)用戶的好友數(shù)量值計算用戶之間的熟悉度值; 信任度計算單元,用于根據(jù)所述熟悉度值和所述興趣相似度值,計算用戶之間的信任 度值; 信譽度計算單元,用于根據(jù)所述信任度值計算用戶的信譽度值; 依賴度計算和推薦單元,用于根據(jù)所述信任度值、所述信譽度值、所述興趣相似度值計 算用戶之間的依賴度值,根據(jù)所述依賴度值進行視頻推薦。9. 根據(jù)權(quán)利要求8所述裝置,其特征在于,所述數(shù)據(jù)采集單元包括: 正樣本采集子單元,用于根據(jù)用戶的行為確定用戶的正樣本數(shù)據(jù); 查找子單元,用于根據(jù)所述正樣本數(shù)據(jù),查找與所述正樣本數(shù)據(jù)相似的數(shù)據(jù)集合; 負樣本確定子單元,用于在所述數(shù)據(jù)集合中查找所述用戶未發(fā)生行為,且相似度超過 預(yù)定閾值的樣本數(shù)據(jù)作為負樣本數(shù)據(jù)。10. 根據(jù)權(quán)利要求8所述裝置,其特征在于,所述興趣相似度計算單元具體用于: 根據(jù)公式Su,v=cx*S"u,v+l-cx*S' u,v計算所述用戶之間的興趣相信度值,其中,(u)表示用戶u的負樣本,Ν' (ν)表示用戶ν的負樣本,α表示為調(diào)節(jié)系數(shù),取值在0~1之間。
【文檔編號】G06F17/30GK105956201SQ201610472336
【公開日】2016年9月21日
【申請日】2016年6月22日
【發(fā)明人】馮研
【申請人】Tcl集團股份有限公司