:
[0154] (1)如圖5、圖6、圖7、圖8、圖9所示,實(shí)驗(yàn)結(jié)果表明在不同驗(yàn)證方法的情況下基于 項(xiàng)目聚類和局部興趣改進(jìn)的用戶協(xié)同過濾推薦MAE小于傳統(tǒng)用戶協(xié)同過濾推薦、基于項(xiàng)目 聚類和局部最近鄰的用戶協(xié)同過濾推薦。其中在Allbut1驗(yàn)證方法下基于項(xiàng)目聚類和局 部興趣改進(jìn)的用戶協(xié)同過濾推薦MAE小于傳統(tǒng)用戶協(xié)同過濾推薦、基于項(xiàng)目聚類和局部最 近鄰的用戶協(xié)同過濾推薦,表明本發(fā)明在用戶數(shù)據(jù)量豐富的情況下可以提高推薦精度;在 Given2和Given10驗(yàn)證方法下基于項(xiàng)目聚類和局部興趣改進(jìn)的用戶協(xié)同過濾推薦MAE小 于傳統(tǒng)用戶協(xié)同過濾推薦、基于項(xiàng)目聚類和局部最近鄰的用戶協(xié)同過濾推薦,表明本發(fā)明 在用戶數(shù)據(jù)量小的情況下可以提高推薦精度。
[0155] (2)如圖5、圖10所示,實(shí)驗(yàn)結(jié)果表明不同評(píng)價(jià)指標(biāo)的情況下基于項(xiàng)目聚類和局部 興趣改進(jìn)的用戶協(xié)同過濾推薦精度優(yōu)于傳統(tǒng)用戶協(xié)同過濾推薦、基于項(xiàng)目聚類和局部最近 鄰的用戶協(xié)同過濾推薦;
[0156] (3)如圖5、圖11所示,實(shí)驗(yàn)結(jié)果表明不同數(shù)據(jù)集的情況下基于項(xiàng)目聚類和局部興 趣改進(jìn)的用戶協(xié)同過濾推薦精度優(yōu)于傳統(tǒng)用戶協(xié)同過濾推薦、基于項(xiàng)目聚類和局部最近鄰 的用戶協(xié)同過濾推薦。
[0157] 以上實(shí)驗(yàn)說明基于項(xiàng)目聚類和局部興趣改進(jìn)的用戶協(xié)同過濾推薦方法提高了推 薦精度。
[0158] 上述實(shí)施例僅是用來說明本發(fā)明,而并非用作對(duì)本發(fā)明的限定。只要是依據(jù)本發(fā) 明的技術(shù)實(shí)質(zhì),對(duì)上述實(shí)施例進(jìn)行變化、變型等都將落在本發(fā)明的權(quán)利要求的范圍內(nèi)。
【主權(quán)項(xiàng)】
1. 一種基于k-medoids項(xiàng)目聚類和局部興趣融合的用戶協(xié)同過濾推薦方法,其特征在 于,包括如下步驟: 1) 采用最小化最大相似度準(zhǔn)則確定K個(gè)初始聚類中屯、; 2)根據(jù)相似度和最大的k-medoids聚類算法對(duì)項(xiàng)目進(jìn)行聚類; 3) 在聚類基礎(chǔ)上,尋找用戶局部最近鄰; 4) 將用戶全局最近鄰與局部最近鄰W相似度和之比作為權(quán)值進(jìn)行融合,根據(jù)用戶全局 最近鄰與局部最近鄰對(duì)項(xiàng)目的評(píng)分,預(yù)測(cè)用戶對(duì)項(xiàng)目的評(píng)分,完成推薦。2. 根據(jù)權(quán)利要求1所述的基于k-medoids項(xiàng)目聚類和局部興趣融合的用戶協(xié)同過濾推 薦方法,其特征在于,步驟1)具體為: 1. 1)使用余弦相似度計(jì)算所有樣本點(diǎn)i,j之間的相似度sim(i,j),其中,i,j= 1,2,…,n,i聲j,將所有樣本點(diǎn)之間相似度最小的兩個(gè)樣本點(diǎn)作為前兩個(gè)初始聚類中屯、yI 和Ji2; 1.2) 計(jì)算未選為初始聚類中屯、的其它樣本點(diǎn)i到已經(jīng)被選定的每一個(gè)聚類中屯、 Jii, 1^2,…,的相似度Sim(i,Ji1),Sim(i,Ji2),…,Sim(i,Jik); 1.3) 選擇樣本點(diǎn)i到已經(jīng)被選定的聚類中屯、iii,y2,…的相似度中最大相似 度為樣本點(diǎn)i到聚類中屯、集的相似度sim(i,Ji) =max{sim(i,Ji1),sim(i,Ji2),… ,sim(i,Jik)}; 1.4) 選取到聚類中屯、集的相似度最小值的樣本點(diǎn)r為新增的第k+1個(gè)聚類中屯、yw, y ) =min{sim(l, ji),sim(2, y ),??? sim(i, ji)--*sim(n, y)}; 1.5)如果k+1<K,則賦值k = k+1,轉(zhuǎn)步驟2),否則利用最小化最大相似度準(zhǔn)則確定 K個(gè)初始聚類中屯、的過程結(jié)束。3.根據(jù)權(quán)利要求1所述的基于k-medoids項(xiàng)目聚類和局部興趣融合的用戶協(xié)同過濾推 薦方法,其特征在于,步驟2)中,W余弦相似度作為樣本點(diǎn)之間的度量,采用相似度和最大 作為聚類準(zhǔn)則函數(shù),聚類后使得K個(gè)劃分到達(dá)相似度和最大。4.根據(jù)權(quán)利要求3所述的基于k-medoids項(xiàng)目聚類和局部興趣融合的用戶協(xié)同過濾推 薦方法,其特征在于,步驟2)具體為: 2. 1)使用余弦相似度計(jì)算所有樣本點(diǎn)i,j之間的相似度sim(i,j),其中,i,j= 1,2,…,n,i聲j; 2. 2)確定K個(gè)初始聚類中屯、y。,每一個(gè)聚類C的聚類中屯、y。為樣本點(diǎn),C= 1,2,…,K; 2. 3)對(duì)于剩余的其他樣本點(diǎn)i,i= 1,2,…,n,i聲Uc, C= 1,2,…,K,則根據(jù) 樣本點(diǎn)1與步驟2.2)所述的聚類中屯、4。的相似度31111(1,^。),按相似度最大的 準(zhǔn)則,將樣本點(diǎn)1分配給與其最相似的聚類中屯、所代表的類(3>^中,31111(1,y。*)= max{sim(i, Ji2),*",sim(i,Jin)}; 2.4) 計(jì)算每個(gè)聚類的相似巧和i/, =X。."'"啦八):其中,r表示聚類C中的所有項(xiàng)目; 計(jì)算所有K個(gè)聚類的相似度和;計(jì)算聚類內(nèi)不同項(xiàng)目作為聚 類中屯、時(shí)的J值,按J值最大原則,選取J值最大的項(xiàng)目作為新的聚類中屯、;如果J值變大, 則返回步驟2. 2),否則聚類結(jié)束。5. 根據(jù)權(quán)利要求2或4所述的基于k-medoids項(xiàng)目聚類和局部興趣融合的用戶協(xié)同過 濾推薦方法,其特征在于,步驟1. 1)與步驟2. 1)中,余弦相似度計(jì)算的公式如下:其中,Ui,,表示項(xiàng)目i和項(xiàng)目j共同評(píng)分的項(xiàng)目集,U康示項(xiàng)目i有評(píng)分的項(xiàng)目集,U, 表示項(xiàng)目j有評(píng)分的項(xiàng)目集,r。,康示用戶U對(duì)項(xiàng)目i的評(píng)分,r。,,表示用戶U對(duì)項(xiàng)目j的 評(píng)分,聚類后使得K個(gè)聚類劃分的相似度和J值達(dá)到最大,利用皮爾森相似度、修正的余弦 相似度等其它相似度也在保護(hù)范圍內(nèi)。6. 根據(jù)權(quán)利要求1所述的基于k-medoids項(xiàng)目聚類和局部興趣融合的用戶協(xié)同過濾推 薦方法,其特征在于,步驟3)具體為: 3. 1)通過聚類的方式劃分用戶興趣,通過余弦相似度計(jì)算在每個(gè)聚類上用戶之間的相 似度sim。(U, V),公式如下:其中,C表示項(xiàng)目i所在的聚類,粗表示用戶U和用戶V在聚類C中共同評(píng)分的項(xiàng)目 集,表示用戶U在聚類C中有評(píng)分的項(xiàng)目集,表示用戶V在聚類C中有評(píng)分的項(xiàng)目集, ru,i表示用戶U對(duì)項(xiàng)目i的評(píng)分,r表示用戶V對(duì)項(xiàng)目i的評(píng)分; 3. 2)選擇與目標(biāo)用戶在項(xiàng)目i所在的聚類C上相似度最大的前N個(gè)用戶作為目標(biāo)用戶 的局部最近鄰。7. 根據(jù)權(quán)利要求6所述的基于k-medoids項(xiàng)目聚類和局部興趣融合的用戶協(xié)同過濾推 薦方法,其特征在于,步驟4)根據(jù)最近鄰對(duì)項(xiàng)目的評(píng)分預(yù)測(cè)目標(biāo)用戶對(duì)項(xiàng)目的評(píng)分,最近 鄰為全局最近鄰與局部最近鄰W相應(yīng)的權(quán)值進(jìn)行融合。8. 根據(jù)權(quán)利要求7所述的基于k-medoids項(xiàng)目聚類和局部興趣融合的用戶協(xié)同過濾推 薦方法,其特征在于,步驟4)中,基于用戶的全局最近鄰的預(yù)測(cè)評(píng)分公式如下:其中,P'。,1表示基于用戶的全局最近鄰的預(yù)測(cè)評(píng)分時(shí)用戶U對(duì)項(xiàng)目i的預(yù)測(cè)評(píng)分,心: 表示用戶U的平均評(píng)分,V表示用戶,nei曲bors。表示用戶U的全局最近鄰集合,Sim(U, V) 表不用戶U和用戶V的全局相似度,e。,、表不用戶U和用戶V的相似度相關(guān)加化ry,康不 用戶U對(duì)項(xiàng)目i的實(shí)際評(píng)分,;表示用戶V的平均評(píng)分;9. 根據(jù)權(quán)利要求7所述的基于k-medoids項(xiàng)目聚類和局部興趣融合的用戶協(xié)同過濾推 薦方法,其特征在于,步驟4)中,基于用戶的局部最近鄰的預(yù)測(cè)評(píng)分公式如下:其中,C表示項(xiàng)目i所在聚類,p"。,1表示基于用戶的局部最近鄰的評(píng)分計(jì)算得到的用 戶U對(duì)項(xiàng)目i的預(yù)測(cè)評(píng)分,;5^表示用戶U在聚類C上的平均評(píng)分,細(xì)幼細(xì)<表示用戶U在 聚類C上的局部最近鄰集合,Sinf(U,V)表示用戶U和用戶V在聚類C上的局部相似度, 表示用戶V對(duì)項(xiàng)目i的實(shí)際評(píng)分,^表示用戶V在聚類C上的平均評(píng)分;10.根據(jù)權(quán)利要求7所述的基于k-medoids項(xiàng)目聚類和局部興趣融合的用戶協(xié)同過濾 推薦方法,其特征在于,步驟4)中,局部最近鄰與全局最近鄰W相應(yīng)的權(quán)值結(jié)合后的預(yù)測(cè) 評(píng)分公式如下: Pu,i=P' +P"u,i*e"; 局部最近鄰和全局最近鄰預(yù)測(cè)評(píng)分的權(quán)值分配通過局部最近鄰相似度和與全局最近 鄰相似度和的比值設(shè)定e'和e",公式如下:其中,e' +e" = 1。
【專利摘要】本發(fā)明涉及一種基于k-medoids項(xiàng)目聚類和局部興趣融合的用戶協(xié)同過濾推薦方法,采用如下步驟:A、采用最小化最大相似度準(zhǔn)則確定K個(gè)初始聚類中心;B、根據(jù)相似度和最大的k-medoids聚類算法對(duì)項(xiàng)目進(jìn)行聚類;C、在聚類基礎(chǔ)上,尋找用戶局部最近鄰;D、將用戶全局最近鄰與局部最近鄰以相似度和之比作為權(quán)值進(jìn)行融合,根據(jù)用戶全局最近鄰與局部最近鄰對(duì)項(xiàng)目的評(píng)分預(yù)測(cè)用戶對(duì)項(xiàng)目的評(píng)分。本發(fā)明同現(xiàn)有技術(shù)相比,更大限度地利用了已有的數(shù)據(jù),緩解了數(shù)據(jù)極端稀疏性對(duì)推薦的影響,同時(shí)提高了評(píng)分預(yù)測(cè)的精度,為用戶提供更好的推薦結(jié)果。
【IPC分類】G06F17/30, G06K9/62
【公開號(hào)】CN105373597
【申請(qǐng)?zhí)枴緾N201510705659
【發(fā)明人】王成, 陳維斌, 蘇芳芳, 文詩(shī)琪, 王田, 鐘必能, 陳葉旺
【申請(qǐng)人】華僑大學(xué)
【公開日】2016年3月2日
【申請(qǐng)日】2015年10月27日