個(gè)性化推薦方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)數(shù)據(jù)處理技術(shù)領(lǐng)域,特別是涉及一種個(gè)性化推薦方法。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)的高速發(fā)展,人們的日常生活越來越多的與互聯(lián)網(wǎng)緊密聯(lián)系在一起, 例如聽音樂、看電影、購(gòu)物、閱讀、聊天等等。與此同時(shí),海量的用戶和物品數(shù)據(jù)每天都不斷 地在互聯(lián)網(wǎng)中產(chǎn)生,該導(dǎo)致互聯(lián)網(wǎng)用戶很難,甚至不可能快速地從中找到自己需要的或者 感興趣的未知信息。于是,個(gè)性化推薦技術(shù)應(yīng)運(yùn)而生,并不斷地推陳出新。個(gè)性化推薦技術(shù) 旨在根據(jù)用戶自身的特點(diǎn),對(duì)用戶的興趣偏好進(jìn)行建模,并進(jìn)而推薦符合用戶個(gè)性化偏好 的,且尚未使用過的物品。
[0003] 協(xié)同過濾是目前最主流、最有效的一類個(gè)性化推薦方法,該類方法通過獲取大量 的用戶對(duì)物品的行為數(shù)據(jù),對(duì)用戶與用戶、物品與物品、用戶與物品之間的關(guān)系分別進(jìn)行建 模,并行為相似的用戶擁有相似的偏好"為基本假設(shè)進(jìn)行個(gè)性化推薦。該類方法普遍存 在的一個(gè)較大的局限是:協(xié)同過濾方法假設(shè)用戶U已使用過的所有物品都均等地反映了用 戶U的個(gè)性化偏好。該個(gè)均等假設(shè)在用戶的個(gè)性化偏好可能快速動(dòng)態(tài)變化的推薦問題中是 不成立的,例如用戶一天之內(nèi)的情緒可能發(fā)生多次變化,那么用戶在不同情緒之下所偏好 的歌曲也一般有很大差異,開也的時(shí)候可能喜歡聽歡快的歌曲,悲傷的時(shí)候可能喜歡聽舒 緩、安靜的歌曲,那么用戶在開也的狀態(tài)下聽的歌曲就不能正確的反映用戶在也情低落、傷 感時(shí)的歌曲偏好。同樣,電影推薦、網(wǎng)站推薦等也有類似的情況。
[0004] 為了提升現(xiàn)有推薦方法的有效性,需要考慮用戶的偏好隨時(shí)間動(dòng)態(tài)變化的特點(diǎn)。 因此,用戶已使用過的物品不會(huì)均等的反映該用戶在給定的時(shí)刻下的偏好。
[0005] 因此,目前需要本領(lǐng)域技術(shù)人員迫切解決的一個(gè)技術(shù)問題就是:如何能夠創(chuàng)新地 提出一種有效方法,W滿足實(shí)際應(yīng)用中的更多需求,創(chuàng)造更多的應(yīng)用價(jià)值。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明所要解決的技術(shù)問題是提供一種個(gè)性化推薦方法,能夠更準(zhǔn)確的捕捉用戶 偏好的動(dòng)態(tài)變化,該樣的推薦方法就顯得更具有實(shí)用價(jià)值。
[0007] 為了解決上述技術(shù)問題,本發(fā)明實(shí)施例公開了一種個(gè)性化推薦方法,包括:
[0008] 獲取用戶對(duì)物品的使用行為數(shù)據(jù);
[0009] 按照所獲取的使用行為數(shù)據(jù)生成用戶使用行為子列表;
[0010] 遍歷所生成的用戶使用行為子列表,估算物品的一步轉(zhuǎn)移概率矩陣;
[0011] 基于用戶對(duì)物品的興趣的遺忘過程和馬爾科夫模型建立個(gè)性化推薦模型;
[0012] 使用梯度下降法,對(duì)興趣遺忘過程中用戶的個(gè)性化參數(shù)進(jìn)行估算,從而根據(jù)用戶 使用行為子列表,為用戶進(jìn)行推薦。
[0013] 優(yōu)選的,所述獲取用戶對(duì)物品的使用行為數(shù)據(jù)所獲取到用戶的使用行為均為正面 用戶反饋。
[0014] 優(yōu)選的,所述生成用戶使用行為子列表的依據(jù)為用戶動(dòng)態(tài)的使用行為過程中,用 戶的偏好的變化。
[0015] 優(yōu)選的,所述一步轉(zhuǎn)移概率矩陣為實(shí)數(shù)矩陣。
[0016] 優(yōu)選的,所述的個(gè)性化推薦模型為一個(gè)修正的一階馬爾科夫模型。
[0017] 優(yōu)選的,所述用戶對(duì)物品的使用行為為聽音樂。
[001引與現(xiàn)有技術(shù)相比,本發(fā)明具有W下優(yōu)點(diǎn):
[0019] 本發(fā)明通過引入用戶對(duì)已使用過的物品的興趣的遺忘過程,能夠更準(zhǔn)確的分析出 已使用過的各物品在影響用戶當(dāng)前的偏好的重要性,即能有效的捕捉到用戶偏好變化的動(dòng) 態(tài)特性,并將偏好的動(dòng)態(tài)變化應(yīng)用于個(gè)性化推薦中,提升了推薦結(jié)果的有效性。
【附圖說明】
[0020] 圖1是本發(fā)明的一種個(gè)性化推薦方法實(shí)施例的流程示意圖;
[0021] 圖2是【具體實(shí)施方式】中提到的方法實(shí)施的流程圖;
[0022] 圖3是【具體實(shí)施方式】中提到的列表示意圖;
[0023] 圖4是【具體實(shí)施方式】中提到的音樂推薦應(yīng)用實(shí)例音樂推薦涉及的示意圖。
【具體實(shí)施方式】
[0024] 為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí) 施方式對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說明。
[00巧]參見圖1,本方案所述的一種個(gè)性化推薦方法,具體包括:
[0026] 步驟S101,獲取用戶對(duì)物品的使用行為數(shù)據(jù);
[0027] 步驟S102,按照所獲取的使用行為數(shù)據(jù)生成用戶使用行為子列表;
[0028] 步驟S103,遍歷所生成的用戶使用行為子列表,估算物品的一步轉(zhuǎn)移概率矩陣;
[0029] 步驟S104,基于用戶對(duì)物品的興趣的遺忘過程和馬爾科夫模型建立個(gè)性化推薦模 型;
[0030] 步驟S105,使用梯度下降法,對(duì)興趣遺忘過程中用戶的個(gè)性化參數(shù)進(jìn)行估算,從而 根據(jù)用戶使用行為子列表,為用戶進(jìn)行推薦。
[0031] 為使本發(fā)明的方案便于理解和實(shí)現(xiàn)對(duì)技術(shù)做更為具體的介紹,方案實(shí)現(xiàn)是基于興 趣遺忘過程和馬爾科夫模型進(jìn)行個(gè)性化推薦方法,包括W下具體的實(shí)施步驟:
[0032] (1)本發(fā)明通過動(dòng)態(tài)地模擬用戶對(duì)物品的興趣的遺忘過程,來估計(jì)用戶在任意時(shí) 刻下對(duì)物品的個(gè)性化偏好,例如在音樂推薦中,更偏好舒緩、安靜的歌曲,還是動(dòng)感、快節(jié)奏 的歌曲,又例如在電影推薦中,更偏好動(dòng)作類型電影,還是浪漫愛情類型電影等,并在此基 礎(chǔ)上,為用戶在給定的時(shí)刻下,推薦符合其個(gè)性化偏好的物品;
[003引 似如附圖2所示,為本發(fā)明方法實(shí)施的流程圖,本發(fā)明方法一共包含6個(gè)主要的 實(shí)施階段;
[0034] (3)階段1,獲取用戶對(duì)物品的使用行為數(shù)據(jù),設(shè)獲取到M位用戶對(duì)N個(gè)物品的使 用行為數(shù)據(jù),記用戶集合為U = (ui,也…,%},物品集合為V = {ui,咕…,%},集合U和集 合V中每一個(gè)元素分別表示唯一的一個(gè)用戶和一個(gè)物品,記Hu= {Xu,i,Xu,2,…}表示用戶U 的原始的使用行為數(shù)據(jù)按其發(fā)生的時(shí)間的升序排列的列表,其中的任一元素表示用戶 u的第i次使用行為,并且Xuj E V,對(duì)任意的i< j,滿足行為X uj的發(fā)生時(shí)間早于行為X uj的 發(fā)生時(shí)間;
[0035] (4)在本發(fā)明中,默認(rèn)獲取到的用戶的使用行為均為正面用戶反饋,即用戶U在某 一時(shí)刻使用了物品V,則表示用戶U在那一時(shí)刻下偏好于物品V,而對(duì)含有負(fù)面用戶反饋的 使用行為數(shù)據(jù),可將其中所有負(fù)面用戶反饋均刪除后,再運(yùn)用本發(fā)明方法;
[0036] (5)階段2,根據(jù)不同數(shù)據(jù)類型的推薦問題,設(shè)定不同的時(shí)間闊值T,對(duì)每個(gè)用戶 的使用行為列表分別進(jìn)行劃分,形成多個(gè)子列表,闊值X定義了劃分在同一子列表中任意 發(fā)生時(shí)間相鄰的前后兩次行為的時(shí)間間隔的最大值,劃分子列表的原因是因?yàn)樵谟脩魟?dòng)態(tài) 的使用行為過程中,用戶的偏好可能會(huì)改變,因此,行為發(fā)生時(shí)間越接近,則用戶偏好改變 的概率越低,反則反之;
[0037] (6)闊值X的大小與具體的推薦問題相關(guān),例如在音樂推薦中,X的值可W取! 小時(shí),而在電影推薦中,T的值則可W取1天等等;
[003引(7)遍歷所有用戶U的原始使用行為列表Hu,將Hu中的使用行為按發(fā)生時(shí)間的升 序排列,若Hu中發(fā)生時(shí)間相鄰的前后兩次行為的時(shí)間間隔大于X,則將該兩次行為分別劃 分到前后兩個(gè)不同的子列表中,記由所有用戶的各個(gè)使用行為子列表構(gòu)成的集合為H ;
[003引 做附圖3舉例說明了根據(jù)用戶U原始的使用行為列表Hu,在時(shí)間闊值X為1小 時(shí)的情況下,生成U的使用行為子列表的過程,由于行為Xu,2與X u,3的發(fā)生時(shí)間的間隔超過 了 1個(gè)小時(shí),于是Xu,2與Xu,3被分別劃入了子列表Hu,郝Hu,2中,因此,H洛過劃分之后得到 兩個(gè)子列表化,1,咕,2};
[0040] (9)階段3,遍歷階段2中得到的所有用戶的使用行為子列表集合H,估算物品的一 步轉(zhuǎn)移概率矩陣S,S為NXN的實(shí)數(shù)矩陣,記S(v。Vj.)表示對(duì)普遍的用戶而言,在使用了物 品Vi之后,下一步緊接著使用物品V j.的概率,即一步轉(zhuǎn)移概率,在本發(fā)明中,用W下公式估 算S(v。Vj)的值:
[0041]
【主權(quán)項(xiàng)】
1. 一種個(gè)性化推薦方法,其特征在于,包括: 獲取用戶對(duì)物品的使用行為數(shù)據(jù); 按照所獲取的使用行為數(shù)據(jù)生成用戶使用行為子列表; 遍歷所生成的用戶使用行為子列表,估算物品的一步轉(zhuǎn)移概率矩陣; 基于用戶對(duì)物品的興趣的遺忘過程和馬爾科夫模型建立個(gè)性化推薦模型; 使用梯度下降法,對(duì)興趣遺忘過程中用戶的個(gè)性化參數(shù)進(jìn)行估算,從而根據(jù)用戶使用 行為子列表,為用戶進(jìn)行推薦。
2. 如權(quán)利要求1所述的個(gè)性化推薦方法,其特征在于,所述獲取用戶對(duì)物品的使用行 為數(shù)據(jù)所獲取到用戶的使用行為均為正面用戶反饋。
3. 如權(quán)利要求1所述的個(gè)性化推薦方法,其特征在于,所述生成用戶使用行為子列表 的依據(jù)為用戶動(dòng)態(tài)的使用行為過程中,用戶的偏好的變化。
4. 如權(quán)利要求1所述的個(gè)性化推薦方法,其特征在于,所述一步轉(zhuǎn)移概率矩陣為實(shí)數(shù) 矩陣。
5. 如權(quán)利要求1所述的個(gè)性化推薦方法,其特征在于,所述的個(gè)性化推薦模型為一個(gè) 修正的一階馬爾科夫模型。
6. 如權(quán)利要求1所述的個(gè)性化推薦方法,其特征在于,所述用戶對(duì)物品的使用行為為 聽音樂。
【專利摘要】本發(fā)明公開一種個(gè)性化推薦方法,涉及計(jì)算機(jī)數(shù)據(jù)處理技術(shù)領(lǐng)域,包括:獲取用戶對(duì)物品的使用行為數(shù)據(jù);按照所獲取的使用行為數(shù)據(jù)生成用戶使用行為子列表;遍歷所生成的用戶使用行為子列表,估算物品的一步轉(zhuǎn)移概率矩陣;基于用戶對(duì)物品的興趣的遺忘過程和馬爾科夫模型建立個(gè)性化推薦模型;使用梯度下降法,對(duì)興趣遺忘過程中用戶的個(gè)性化參數(shù)進(jìn)行估算,從而根據(jù)用戶使用行為子列表,為用戶進(jìn)行推薦。本發(fā)明提供的個(gè)性化推薦方法,能夠更準(zhǔn)確的捕捉用戶偏好的動(dòng)態(tài)變化,這樣的推薦方法就顯得更具有實(shí)用價(jià)值。
【IPC分類】G06F17-30, G06K9-62
【公開號(hào)】CN104537114
【申請(qǐng)?zhí)枴緾N201510030610
【發(fā)明人】王朝坤, 陳俊, 王建民
【申請(qǐng)人】清華大學(xué)
【公開日】2015年4月22日
【申請(qǐng)日】2015年1月21日