本發(fā)明屬于互聯(lián)網(wǎng)技術(shù)領(lǐng)域,具體涉及一種基于用戶情境分析的多媒體內(nèi)容推薦方法。
背景技術(shù):
隨著互聯(lián)網(wǎng)和Web2.0的快速發(fā)展,多媒體社交網(wǎng)絡(luò)上用戶和多媒體內(nèi)容呈現(xiàn)爆炸式增長,在如此大量的多媒體資源中,如何使用戶在多媒體社交網(wǎng)絡(luò)中快速找到感興趣的內(nèi)容,提高用戶的體驗(yàn)質(zhì)量,是當(dāng)前多媒體社交網(wǎng)絡(luò)解決信息過載問題的嚴(yán)峻挑戰(zhàn)。為了在海量的信息中給用戶提供個(gè)性化的服務(wù),個(gè)性化推薦技術(shù)應(yīng)運(yùn)而生。
協(xié)同過濾推薦技術(shù)是目前推薦系統(tǒng)應(yīng)用最廣泛、最成熟的推薦技術(shù)。該推薦方法首先尋找與目標(biāo)用戶偏好相似的用戶,然后根據(jù)她們的偏好預(yù)測目標(biāo)用戶的偏好并實(shí)現(xiàn)推薦。傳統(tǒng)的協(xié)同過濾推薦技術(shù)分為基于用戶的協(xié)同過濾和基于項(xiàng)目的協(xié)同過濾。協(xié)同過濾技術(shù)從利用用戶的靜態(tài)歷史數(shù)據(jù)到用戶的歷史行為信息發(fā)現(xiàn)用戶的興趣,邢春曉等人【邢春曉,高鳳榮,戰(zhàn)思南等. 適應(yīng)用戶興趣變化的協(xié)同過濾推薦算法[J], 計(jì)算機(jī)研究與發(fā)展. 2007, 44(2): 296-301】提出了一種適應(yīng)用戶興趣變化的協(xié)同過濾推薦算法,引入了基于時(shí)間的數(shù)據(jù)權(quán)重和基于資源相似度的數(shù)據(jù)權(quán)重,通過把這兩種權(quán)重融合到協(xié)同過濾推薦算法中。傳統(tǒng)的推薦系統(tǒng)通過分析用戶的興趣、屬性或?yàn)g覽記錄等,從海量的信息中挖掘出用戶可能感興趣或符合用戶需求的資源。這種傳統(tǒng)的推薦方法推薦出的資源不能及時(shí)捕捉到用戶可能隨時(shí)變化的需求,給用戶推薦出來的內(nèi)容可能不是用戶需要的,這就降低了資源推薦的準(zhǔn)確度,將不利于數(shù)字內(nèi)容的傳播和用戶間的共享。并且用戶的意圖隨時(shí)可能發(fā)生變化,用戶的喜好可能會(huì)隨著周圍環(huán)境或用戶身份的不同產(chǎn)生變化,因此在多媒體社交網(wǎng)絡(luò)中,為了讓用戶快速發(fā)現(xiàn)可能感興趣的多媒體內(nèi)容,提高用戶的體驗(yàn),本專利提出一種在多媒體社交網(wǎng)絡(luò)中基于用戶情境分析的多媒體內(nèi)容推薦方法。通過分析當(dāng)前用戶在社交媒體網(wǎng)絡(luò)中的身份、行為、意圖和環(huán)境大數(shù)據(jù),以及當(dāng)前用戶的相似用戶喜歡的多媒體內(nèi)容,為當(dāng)前用戶及時(shí)推薦可能感興趣的內(nèi)容,幫助用戶從海量數(shù)據(jù)中解脫出來,提高用戶的滿意度。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是提供一種基于用戶情境分析的多媒體內(nèi)容推薦方法,及時(shí)發(fā)現(xiàn)用戶潛在需求的變化,在多媒體社交網(wǎng)絡(luò)海量的多媒體內(nèi)容資源中發(fā)現(xiàn)用戶潛在的感興趣的內(nèi)容,讓用戶及時(shí)快速找到自己喜歡的資源。
本發(fā)明為解決上述技術(shù)問題所采用的技術(shù)方案是:一種基于用戶情境分析的多媒體內(nèi)容推薦方法,其特征在于:包括以下步驟:
步驟一、采集互聯(lián)網(wǎng)中所有歷史用戶的瀏覽記錄,構(gòu)建用戶_項(xiàng)目播放矩陣R(m,n),如式(1)所示;
(1)
其中,m表示歷史用戶的個(gè)數(shù),n表示多媒體內(nèi)容的個(gè)數(shù),每一行表示一個(gè)用戶對(duì)所有多媒體內(nèi)容的播放情況,若瀏覽記錄中有某一用戶對(duì)某一內(nèi)容的記錄,則該用戶對(duì)應(yīng)的該內(nèi)容的位置為1,否則為0;
步驟二、尋找當(dāng)前用戶u的相似用戶:采用余弦相似度計(jì)算當(dāng)前用戶u與歷史用戶的相似度,如式(2)所示;
(2)
其中,表示當(dāng)前用戶u的播放記錄,表示用戶v的播放記錄,表示當(dāng)前用戶u和用戶v之間的余弦相似度,余弦值越大,當(dāng)前用戶u和用戶v越相似,按照相似度由高到低的順序進(jìn)行排序,取前K個(gè)作為當(dāng)前用戶u的相似用戶;
步驟三、任一用戶在面對(duì)一項(xiàng)多媒體內(nèi)容i時(shí)的行為用Behaviori表示,包括分享、收藏、下載、完整播放和跳過5種,將這些行為量化,各個(gè)行為量化的分值分別記為、、、和,其中,則,用戶行為表示用戶對(duì)瀏覽的多媒體內(nèi)容的真實(shí)喜歡程度;
步驟四、建立當(dāng)前用戶的興趣模型:
(1)預(yù)測當(dāng)前用戶對(duì)未瀏覽過的多媒體內(nèi)容的評(píng)分
根據(jù)相似用戶v對(duì)內(nèi)容i的評(píng)分以及該相似用戶在播放內(nèi)容i時(shí)的行為信息預(yù)測當(dāng)前用戶對(duì)內(nèi)容i的喜好程度,如式(3)所示,其中表示在瀏覽多媒體內(nèi)容時(shí)相似用戶v對(duì)內(nèi)容i的行為信息,表示相似用戶v對(duì)內(nèi)容i的平均行為分值,和分別表示當(dāng)前用戶u和相似用戶v對(duì)所有歷史評(píng)分內(nèi)容的平均評(píng)分,表示相似用戶v對(duì)內(nèi)容i的評(píng)分;
(3)
對(duì)從高到低進(jìn)行排序,得出待推薦的內(nèi)容集合;
(2)分析得出待推薦的內(nèi)容集合
通過對(duì)當(dāng)前用戶在多媒體網(wǎng)絡(luò)中的歷史信息進(jìn)行分析得出當(dāng)前用戶在特定意圖下的行為模式序列,針對(duì)當(dāng)前用戶當(dāng)前的行為序列與分析的結(jié)果進(jìn)行對(duì)比并預(yù)測其意圖,即如果當(dāng)前序列與某個(gè)歷史意圖下的行為序列模式相似度較高,則認(rèn)為該當(dāng)前用戶當(dāng)前的意圖為該歷史意圖,所有用戶的意圖最終是以其行為方式表現(xiàn)出來,因此根據(jù)步驟三中對(duì)用戶行為的量化分值對(duì)當(dāng)前用戶的當(dāng)前的意圖賦予權(quán)重W,W表示當(dāng)前用戶對(duì)當(dāng)前內(nèi)容的喜好程度;
根據(jù)當(dāng)前用戶u歷史瀏覽記錄中對(duì)所有瀏覽內(nèi)容的平均行為分值設(shè)置閾值,如果當(dāng)前用戶u當(dāng)前的意圖的權(quán)重,則表示當(dāng)前用戶很喜歡正在瀏覽的這類內(nèi)容,根據(jù)該內(nèi)容的著作權(quán)人和類型兩個(gè)屬性,計(jì)算其它多媒體內(nèi)容中這兩個(gè)屬性所占的權(quán)重,按照權(quán)重進(jìn)行排序,找出與該內(nèi)容相似的前N個(gè)內(nèi)容作為待推薦的多媒體內(nèi)容集合;
步驟五、為當(dāng)前用戶u推薦多媒體內(nèi)容:設(shè)定集合I,使,選擇I中的前N個(gè)多媒體內(nèi)容進(jìn)行推薦,如果I中的多媒體內(nèi)容個(gè)數(shù)小于N,則,即不夠N個(gè)內(nèi)容的從的集合中補(bǔ)足N個(gè)并把這些多媒體內(nèi)容推薦給當(dāng)前用戶u。
本發(fā)明所述步驟四中步驟(2)所述的歷史信息為SituEx(t)信息,其中SituEx(t)=(ID,d,A,E)t,表示用戶在t時(shí)刻的情境信息,ID表示用戶的身份,包括群組和角色,d表示t時(shí)刻用戶的意愿,A表示t時(shí)刻用戶為了實(shí)現(xiàn)意愿d采取的行為,E表示t時(shí)刻用戶的環(huán)境信息。
本發(fā)明所述步驟四中步驟(2)所述的根據(jù)步驟三中對(duì)用戶行為的量化分值對(duì)當(dāng)前用戶的當(dāng)前的意圖賦予權(quán)重W的方法為:與每個(gè)行為對(duì)應(yīng)的意圖賦予的權(quán)重與該行為的量化分值相同。
本發(fā)明所述分享、收藏、下載、完整播放和跳過5種行為對(duì)應(yīng)的意圖分別為分享、收藏、下載、播放和跳過。
本發(fā)明的有益效果是:通過本發(fā)明給出的技術(shù)方案可以為每個(gè)當(dāng)前用戶推薦其可能感興趣的多媒體內(nèi)容,使用戶快速方便的找到自己喜歡的內(nèi)容,提高推薦算法的準(zhǔn)確率,將用戶從海量的多媒體資源中解脫出來,節(jié)約用戶時(shí)間同時(shí)提高用戶在多媒體社交網(wǎng)絡(luò)中的體驗(yàn)質(zhì)量;通過分析當(dāng)前用戶的相似用戶對(duì)多媒體內(nèi)容的喜好以及當(dāng)前用戶對(duì)當(dāng)前多媒體內(nèi)容的喜好綜合為當(dāng)前用戶進(jìn)行多媒體內(nèi)容的推薦,不僅能考慮到用戶的整體興趣愛好,而且能夠根據(jù)用戶的角色、行為以及其周圍環(huán)境信息及時(shí)發(fā)現(xiàn)用戶潛在愛好的變化,為用戶進(jìn)行實(shí)時(shí)推薦,體現(xiàn)了本發(fā)明推薦方法的及時(shí)性;通過實(shí)驗(yàn)對(duì)比本發(fā)明推薦方法的準(zhǔn)確率、召回率和綜合指標(biāo)均較高。
附圖說明
圖1為本發(fā)明推薦方法與其它兩種推薦方法的準(zhǔn)確率對(duì)比圖;
圖2為本發(fā)明推薦方法與其它兩種推薦方法的召回率對(duì)比圖;
圖3為本發(fā)明推薦方法與其它兩種推薦方法的F-measure綜合指標(biāo)對(duì)比圖。
具體實(shí)施方式
一種基于用戶情境分析的多媒體內(nèi)容推薦方法,其特征在于:包括以下步驟:
步驟一、采集互聯(lián)網(wǎng)中所有歷史用戶的瀏覽記錄,構(gòu)建用戶_項(xiàng)目播放矩陣R(m,n),如式(1)所示;
(1)
其中,m表示歷史用戶的個(gè)數(shù),n表示多媒體內(nèi)容的個(gè)數(shù),每一行表示一個(gè)用戶對(duì)所有多媒體內(nèi)容的播放情況,若瀏覽記錄中有某一用戶對(duì)某一內(nèi)容的記錄,則該用戶對(duì)應(yīng)的該內(nèi)容的位置為1,否則為0;
步驟二、尋找當(dāng)前用戶u的相似用戶:采用余弦相似度計(jì)算當(dāng)前用戶u與歷史用戶的相似度,如式(2)所示;
(2)
其中,表示當(dāng)前用戶u的播放記錄,表示用戶v的播放記錄,表示當(dāng)前用戶u和用戶v之間的余弦相似度,余弦值越大,當(dāng)前用戶u和用戶v越相似,按照相似度由高到低的順序進(jìn)行排序,取前K個(gè)作為當(dāng)前用戶u的相似用戶;
步驟三、任一用戶在面對(duì)一項(xiàng)多媒體內(nèi)容i時(shí)的行為用Behaviori表示,包括分享、收藏、下載、完整播放和跳過5種,將這些行為量化,各個(gè)行為量化的分值分別記為、、、和,其中,則,用戶行為表示用戶對(duì)瀏覽的多媒體內(nèi)容的真實(shí)喜歡程度;
步驟四、建立當(dāng)前用戶的興趣模型:
(1)預(yù)測當(dāng)前用戶對(duì)未瀏覽過的多媒體內(nèi)容的評(píng)分
根據(jù)相似用戶v對(duì)內(nèi)容i的評(píng)分以及該相似用戶在播放內(nèi)容i時(shí)的行為信息預(yù)測當(dāng)前用戶對(duì)內(nèi)容i的喜好程度,如式(3)所示,其中表示在瀏覽多媒體內(nèi)容時(shí)相似用戶v對(duì)內(nèi)容i的行為信息,表示相似用戶v對(duì)內(nèi)容i的平均行為分值,和分別表示當(dāng)前用戶u和相似用戶v對(duì)所有歷史評(píng)分內(nèi)容的平均評(píng)分,表示相似用戶v對(duì)內(nèi)容i的評(píng)分;
(3)
對(duì)從高到低進(jìn)行排序,得出待推薦的內(nèi)容集合;
(2)分析得出待推薦的內(nèi)容集合
通過對(duì)當(dāng)前用戶在多媒體網(wǎng)絡(luò)中的歷史信息進(jìn)行分析得出當(dāng)前用戶在特定意圖下的行為模式序列,針對(duì)當(dāng)前用戶當(dāng)前的行為序列與分析的結(jié)果進(jìn)行對(duì)比并預(yù)測其意圖,即如果當(dāng)前序列與某個(gè)歷史意圖下的行為序列模式相似度較高,則認(rèn)為該當(dāng)前用戶當(dāng)前的意圖為該歷史意圖,所有用戶的意圖最終是以其行為方式表現(xiàn)出來,因此根據(jù)步驟三中對(duì)用戶行為的量化分值對(duì)當(dāng)前用戶的當(dāng)前的意圖賦予權(quán)重W,W表示當(dāng)前用戶對(duì)當(dāng)前內(nèi)容的喜好程度;
根據(jù)當(dāng)前用戶u歷史瀏覽記錄中對(duì)所有瀏覽內(nèi)容的平均行為分值設(shè)置閾值,如果當(dāng)前用戶u當(dāng)前的意圖的權(quán)重,則表示當(dāng)前用戶很喜歡正在瀏覽的這類內(nèi)容,根據(jù)該內(nèi)容的著作權(quán)人和類型兩個(gè)屬性,計(jì)算其它多媒體內(nèi)容中這兩個(gè)屬性所占的權(quán)重,按照權(quán)重進(jìn)行排序,找出與該內(nèi)容相似的前N個(gè)內(nèi)容作為待推薦的多媒體內(nèi)容集合;
步驟五、為當(dāng)前用戶u推薦多媒體內(nèi)容:設(shè)定集合I,使,選擇I中的前N個(gè)多媒體內(nèi)容進(jìn)行推薦,如果I中的多媒體內(nèi)容個(gè)數(shù)小于N,則,即不夠N個(gè)內(nèi)容的從的集合中補(bǔ)足N個(gè)并把這些多媒體內(nèi)容推薦給當(dāng)前用戶u。
進(jìn)一步,所述步驟四中步驟(2)所述的歷史信息為SituEx(t)信息,其中SituEx(t)=(ID,d,A,E)t,表示用戶在t時(shí)刻的情境信息,ID表示用戶的身份,包括群組和角色,d表示t時(shí)刻用戶的意愿,A表示t時(shí)刻用戶為了實(shí)現(xiàn)意愿d采取的行為,E表示t時(shí)刻用戶的環(huán)境信息。
進(jìn)一步,所述步驟四中步驟(2)所述的根據(jù)步驟三中對(duì)用戶行為的量化分值對(duì)當(dāng)前用戶的當(dāng)前的意圖賦予權(quán)重W的方法為:與每個(gè)行為對(duì)應(yīng)的意圖賦予的權(quán)重與該行為的量化分值相同。
進(jìn)一步,所述分享、收藏、下載、完整播放和跳過5種行為對(duì)應(yīng)的意圖分別為分享、收藏、下載、播放和跳過。
實(shí)驗(yàn)對(duì)比
將本發(fā)明推薦方法與混合推薦算法、流行推薦算法進(jìn)行實(shí)驗(yàn)對(duì)比,實(shí)驗(yàn)結(jié)果如圖1-3所示,圖1為三種推薦方法的準(zhǔn)確率對(duì)比圖,圖2為三種推薦方法的召回率對(duì)比圖,圖3為三種推薦方法的F-measure綜合指標(biāo)對(duì)比圖,由圖中數(shù)據(jù)可知,本發(fā)明推薦方法的準(zhǔn)確率、召回率和綜合指標(biāo)F-measure均遠(yuǎn)遠(yuǎn)高于其它兩種算法。