一種基于用戶特征及其信任度的協(xié)同過濾推薦方法
【專利摘要】本發(fā)明公開了一種基于用戶特征及其信任度的協(xié)同過濾推薦方法,根據(jù)用戶對項目的歷史評分和特征分別計算用戶之間的相似度;選取適當權值將兩種相似度結合得到用戶之間最終相似度;根據(jù)KNN(kNearestNeighbors,K最臨近方法)方法計算用戶最近鄰;將用戶歷史評分的數(shù)量作為信任度,利用用戶最近鄰矩陣和加入信任度的預測公式計算推薦結果。
【專利說明】一種基于用戶特征及其信任度的協(xié)同過濾推薦方法
【技術領域】
[0001]本發(fā)明涉及一種基于特征用戶及其信任度的協(xié)同過濾推薦方法,在協(xié)同過濾的基礎上引入用戶特征和用戶信任度,以緩解傳統(tǒng)協(xié)同過濾推薦算法的冷啟動問題及數(shù)據(jù)稀疏性問題,進一步提高推薦精度,屬于個性化推薦技術研究的領域。
【背景技術】
[0002]隨著互聯(lián)網(wǎng)的飛速發(fā)展,互聯(lián)網(wǎng)信息海量增長,帶來的問題正是用戶難以及時準確地找到自身需要的信息,用戶需要可以根據(jù)自身特點組織協(xié)調信息的解決方案,個性化推薦技術應運而生。
[0003]目前,在個性化推薦技術中,比較常用的推薦算法有2種:基于內容的推薦和協(xié)同過濾推薦?;趦热莸耐扑]算法是假定用戶的興趣不變,根據(jù)用戶以往的數(shù)據(jù)來構造出用戶喜歡項目的特征,然后根據(jù)用戶數(shù)據(jù)特征與內容特征的擬合,向用戶推薦項目。協(xié)同過濾源于“集體智慧”的思想,利用當前用戶或者其他用戶對部分項目的已知偏好數(shù)據(jù)來預測當前用戶對其他項目的潛在偏好,或者利用部分用戶對當前項目或者其他項目的已知偏好數(shù)據(jù)來預測其他用戶對當前項目的潛在偏好。
[0004]協(xié)同過濾是現(xiàn)今推薦系統(tǒng)中應用最為成熟的一個推薦算法系類,它利用興趣相投、擁有共同經(jīng)驗之群體的喜好來推薦使用者感興趣的資訊,個人透過合作的機制給予資訊相當程度的回應并記錄下來以達到過濾的目的進而幫助別人篩選資訊。但其缺陷也很明顯:推薦品質取決于歷史資料,對于新用戶或新項目系統(tǒng)開始時推薦品質較差或無法推薦一一冷啟動問題;系統(tǒng)歷史數(shù)據(jù)過少時,難以進行精確的模式查找匹配推薦——數(shù)據(jù)稀疏性問題;新增用戶或項目時,系統(tǒng)需要增加計算負荷量大——擴展性問題。
[0005]協(xié)同過濾推薦算法依賴系統(tǒng)內的其他用戶,其他用戶就是未來提供推薦的合作伙伴,用戶接受合作伙伴的建議,是基于對對方的一種信任,并且認為會從中獲益,支持協(xié)同過濾算法的原理就是一種信任機制。但傳統(tǒng)的協(xié)同過濾推薦算法并沒有考慮不同用戶之間的信任程度的問題。
【發(fā)明內容】
[0006]本發(fā)明目的是提出一種基于特征用戶和用戶信任度的協(xié)同過濾推薦方法,在協(xié)同過濾的基礎上引入用戶特征及其信任度對協(xié)同過傳統(tǒng)濾推薦算法進行改進,通過引入用戶特征緩解傳統(tǒng)協(xié)同過濾推薦算法中的冷啟動問題和數(shù)據(jù)稀疏性問題(利用用戶的特征計算便可脫離對歷史數(shù)據(jù)的依賴)以及通過引入用戶信任度來進一步提高推薦精度。
[0007]為實現(xiàn)上述發(fā)明目的,本發(fā)明采取如下技術方案:一種基于用戶特征及其信任度的協(xié)同過濾推薦方法,其特征在于:在協(xié)同過濾的基礎上引入用戶特征和用戶信任度對協(xié)同過傳統(tǒng)濾推薦算法進行改進,在計算相似度時結合評分數(shù)據(jù)和用戶特征因素,并在生成推薦時加入用戶信任度,包括如下步驟:
[0008]步驟1,獲取用戶的歷史評分數(shù)據(jù)和用戶特征信息;[0009]步驟2,在歷史評分數(shù)據(jù)上利用Pearson相關系數(shù)公式,在用戶特征數(shù)據(jù)上利用歐氏距離公式,分別構造基于用戶評分的用戶相似度矩陣SimUserl (x, y)和基于用戶特征的相似度矩陣SimUser2 (x, y):
[0010][0011]
【權利要求】
1.一種基于用戶特征和用戶信任度的協(xié)同過濾推薦方法,其特征在于:在協(xié)同過濾的基礎上引入用戶特征和用戶信任度對協(xié)同過傳統(tǒng)濾推薦算法進行改進,在計算相似度時結合評分數(shù)據(jù)和用戶特征因素,并在生成推薦時加入用戶信任度,包括如下步驟: 步驟1,獲取用戶的歷史評分數(shù)據(jù)和用戶特征信息; 步驟2,在歷史評分數(shù)據(jù)上利用Pearson相關系數(shù)公式,在用戶特征數(shù)據(jù)上利用歐氏距離公式,分別構造基于用戶評分的用戶相似度矩陣SimUserl (x, y)和基于用戶特征的相似度矩陣 SimUser2 (x, y):
【文檔編號】G06F17/30GK103761237SQ201310646099
【公開日】2014年4月30日 申請日期:2013年12月4日 優(yōu)先權日:2013年12月4日
【發(fā)明者】王曉軍, 馮旻遠 申請人:南京郵電大學