一種多媒體文件推薦方法和終端的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計算機數(shù)據(jù)挖掘技術(shù)領(lǐng)域,尤其涉及一種多媒體文件推薦方法和終 端。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,人們可以獲得和接觸的視頻資源越來越多,但是,找 到自己喜歡的視頻需要花費的時間也越來越長。由此,視頻推薦技術(shù)應(yīng)運而生,并且已經(jīng)成 為用戶發(fā)現(xiàn)相關(guān)視頻的主要途徑之一。
[0003] 目前,常用的視頻推薦方法是根據(jù)備選視頻的標簽與目標視頻的標簽之間的匹配 程度,對備選視頻進行排序,從而得到目標視頻的相關(guān)推薦列表。其中,備選視頻的標簽與 目標視頻的標簽之間的匹配程度一般是基于相匹配的標簽的數(shù)目,或者基于帶權(quán)重的標簽 匹配算法計算得到的。
[0004]上述視頻推薦方法中,均是從視頻與視頻之間的相關(guān)性進行推薦的,因此,為所有 用戶推薦的目標視頻的相關(guān)推薦列表是相同的;然而,不同用戶對視頻的關(guān)注焦點可能不 同,例如,對于目標視頻是電影《霸王別姬》而言,有些用戶希望推薦與該電影的導(dǎo)演相關(guān)的 視頻,有些用戶希望推薦與該電影的演員相關(guān)的視頻等。因此,利用上述視頻推薦方法所推 薦的視頻可能是某些用戶不喜歡的視頻,從而造成用戶體驗差。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的實施例提供一種多媒體文件推薦方法和終端,用以降低所推薦的視頻是 用戶不喜歡的視頻的概率,從而提高了用戶的體驗。
[0006] 為達到上述目的,本發(fā)明的實施例采用如下技術(shù)方案:
[0007] 第一方面,提供一種多媒體文件推薦方法,包括:
[0008] 確定用戶的特征信息和目標多媒體文件的相關(guān)多媒體文件集中的每個相關(guān)多媒 體文件的特征信息;
[0009] 根據(jù)所述用戶的特征信息和所述每個相關(guān)多媒體文件的特征信息,獲取所述用戶 對所述每個相關(guān)多媒體文件的偏好值;
[0010]根據(jù)所述用戶對所述每個相關(guān)多媒體文件的偏好值,從所述相關(guān)多媒體文件集中 選擇出所述目標多媒體文件的關(guān)于所述用戶的相關(guān)多媒體文件;
[0011] 向所述用戶推薦所述目標多媒體文件的關(guān)于所述用戶的相關(guān)多媒體文件。
[0012] 第二方面,提供一種終端,包括:
[0013] 確定單元,用于確定用戶的特征信息和目標多媒體文件的相關(guān)多媒體文件集中的 每個相關(guān)多媒體文件的特征信息;
[0014] 獲取單元,用于根據(jù)所述用戶的特征信息和所述每個相關(guān)多媒體文件的特征信 息,獲取所述用戶對所述每個相關(guān)多媒體文件的偏好值;
[0015] 選擇單元,用于根據(jù)所述用戶對所述每個相關(guān)多媒體文件的偏好值,從所述相關(guān) 多媒體文件集中選擇出所述目標多媒體文件的關(guān)于所述用戶的相關(guān)多媒體文件;
[0016]推薦單元,用于向所述用戶推薦所述目標多媒體文件的關(guān)于所述用戶的相關(guān)多媒 體文件。
[0017]上述技術(shù)方案,通過獲取用戶的特征信息和目標多媒體文件的相關(guān)多媒體文件集 中的每個相關(guān)多媒體文件的特征信息,然后根據(jù)這些信息,獲取用戶對目標多媒體文件的 相關(guān)多媒體文件集中的每個相關(guān)多媒體文件的偏好,以根據(jù)該偏好值,從相關(guān)多媒體文件 集中選擇出目標多媒體文件的關(guān)于該用戶的相關(guān)多媒體文件。該技術(shù)方案在確定目標多媒 體文件的相關(guān)多媒體文件集的基礎(chǔ)上,結(jié)合不同用戶對該相關(guān)多媒體文件集中的每個相關(guān) 多媒體文件的偏好值,從該相關(guān)多媒體文件集中選擇出關(guān)于不同用戶的相關(guān)多媒體文件, 也就是說,本技術(shù)方案可以結(jié)合用戶的偏好為不同的用戶推薦不同的多媒體文件,與現(xiàn)有 技術(shù)相比,能夠降低所推薦的視頻是用戶不喜歡的視頻的概率,從而提高了用戶的體驗。
【附圖說明】
[0018] 為了更清楚地說明本發(fā)明實施例的技術(shù)方案,下面將對本發(fā)明實施例中所需要使 用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于 本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其 他的附圖。
[0019] 圖1為本發(fā)明實施例提供的一種視頻推薦方法的流程示意圖;
[0020] 圖2為本發(fā)明實施例提供的一種獲取用戶的特征信息的方法的流程示意圖;
[0021] 圖3為本發(fā)明實施例提供的一種獲取用戶與各特定標簽之間的關(guān)聯(lián)程度的過程的 示意圖;
[0022] 圖4為本發(fā)明實施例提供的一種獲取視頻信息庫中的所有視頻在各特定主題上的 概率分布的過程的示意圖;
[0023] 圖5為本發(fā)明實施例提供的一種終端的結(jié)構(gòu)示意圖。
【具體實施方式】
[0024]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行示例性描 述,顯然所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中 的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例, 都屬于本發(fā)明保護的范圍。
[0025] 首先,本發(fā)明實施例中的技術(shù)方案的基本原理是:根據(jù)用戶對目標多媒體文件的 相關(guān)多媒體文件的偏好,得到目標多媒體文件的關(guān)于該用戶的相關(guān)多媒體文件,從而實現(xiàn) 為不同用戶提供目標多媒體文件的不同的相關(guān)多媒體文件,以實現(xiàn)個性化多媒體文件推 薦。
[0026] 其次,對本文中所涉及的部分術(shù)語進行解釋說明,以方便本領(lǐng)域技術(shù)人員的理解:
[0027] 1)、多媒體文件
[0028] 多媒體文件,具體可以是視頻,語音,圖片,文檔等。
[0029] 2)、標簽,標簽列表
[0030]標簽,可以理解為關(guān)鍵字。例如,一部電影的標簽可以是:導(dǎo)演的姓名、演員的姓 名、電影的類型(例如,動作、情感、歷史等)等。一個文檔的標簽可以是:作者的姓名,文檔的 類型等。
[0031] 一個多媒體文件的所有標簽構(gòu)成的集合,具體可以以列表或表格或其結(jié)合或其他 任意形式存儲,本文中均以其以列表的形式存儲為例進行說明。例如,將一個視頻的所有標 簽所構(gòu)成的集合稱為該視頻的標簽列表;又如,將一個文檔的所有標簽所構(gòu)成的集合稱為 該文檔的標簽列表。
[0032] 2)、主題
[0033] 主題,可以是一篇文章、一段話、一個句子所表達的中心思想。從統(tǒng)計模型的角度 來講,可以用一個特定的詞頻分布來刻畫主題,并認為一篇文章、一段話、一個句子是從一 個概率模型中生成的。
[0034] 本發(fā)明實施例提供的技術(shù)方案中,通過訓(xùn)練多媒體文件的簡介的LDA(Latent Dirichlet Allocation,潛在狄利克雷分配)主題模型得到該多媒體文件在各個主題上的 概率分布;其中,LDA主題模型是一種文檔主題生成模型,涉及貝葉斯理論、Dirichlet分布、 多項分布、圖模型、變分推斷、EM算法、Gibbs抽樣等知識,較為復(fù)雜,由于此模型已經(jīng)是成熟 的技術(shù),因此本發(fā)明實施例對此不進行過多描述。另外,具體實現(xiàn)時,還可以通過訓(xùn)練其他 主題模型,獲得多媒體文件在各主題上的概率分布,本發(fā)明實施例對此不進行限定。
[0035] 3)、相關(guān)多媒體文件、相關(guān)多媒體文件集
[0036]相關(guān)多媒體文件,是指與目標多媒體文件相關(guān)的多媒體文件,具體可以根據(jù)與目 標多媒體文件的標簽的匹配程度確定該目標多媒體文件的相關(guān)多媒體文件;其中,該匹配 程度可以是基于相匹配的標簽的數(shù)目,或者基于帶權(quán)重的標簽匹配算法計算得到的;當然 也可以是根據(jù)其他方式得到,本發(fā)明實施例對此不進行限定。目標多媒體文件的部分或全 部相關(guān)多媒體文件構(gòu)成的集合稱為"目標多媒體文件的相關(guān)多媒體文件集"。
[0037] 4)、歷史多媒體文件、歷史多媒體文件集
[0038] 歷史多媒體文件,可以包括用戶已經(jīng)觀看和/或用戶收藏的多媒體文件。用戶的部 分或全部歷史多媒體文件構(gòu)成的集合稱為歷史多媒體文件集。
[0039] 5)、和/或,多個
[0040]和/或,僅僅是一種描述關(guān)聯(lián)對象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,A和/ 或B,可以表示:單獨存在A,同時存在A和B,單獨存在B這三種情況。多個,是指兩種或兩種以 上。
[0041]需要說明的是,本發(fā)明實施例提供的視頻推薦方法的執(zhí)行主體可以是終端,例如, 智能電視、智能手機、平板電腦、筆記本電腦、臺式電腦等。
[0042] 另外需要說明的是,在多媒體文件推薦的過程中,一般為目標多媒體文件推薦同 一類型的多媒體文件,例如,為目標視頻推薦與目標視頻相關(guān)的視頻,為目標文檔推薦與目 標文檔相關(guān)的文檔等。下文中均以"多媒體文件是視頻",并且具體以"為目標視頻推薦針對 一用戶的相關(guān)視頻"為例進行說明。本領(lǐng)域技術(shù)人員應(yīng)當清楚,下文中的"視頻"可以替換為 語音、圖片、文檔等其他任一種多媒體文件。
[0043] 參見圖1,為本發(fā)明實施例提供的一種視頻推薦方法的流程示意圖。圖1所示的方 法包括以下步驟S101-S104:
[0044] S101:終端確定用戶的特征信息和目標視頻的相關(guān)視頻集中的每個相關(guān)視頻的特 征信息。
[004