本發(fā)明涉及一種推薦方法,具體涉及一種基于用戶行為傾向概率的推薦系統(tǒng)評(píng)分預(yù)測(cè)與推薦方法。
背景技術(shù):
推薦系統(tǒng)作為個(gè)性化服務(wù)的一個(gè)內(nèi)容,能夠基于物品之間的相似性向用戶推薦感興趣的或適宜其自身的電影、商品等物品,使得用戶可以迅速得到符合喜歡和選擇傾向的物品信息。同時(shí),推薦系統(tǒng)能夠節(jié)省用戶在大量瀏覽物品的過程中所消耗的系統(tǒng)資源和帶寬等成本,使得推薦系統(tǒng)受到大量用戶的信任、青睞和使用。
現(xiàn)有技術(shù)中,推薦系統(tǒng)主要采用協(xié)同過濾推薦方法,該方法利用興趣相投的用戶群體的共同喜好來向目標(biāo)用戶推薦物品。
但是,上述協(xié)同過濾推薦方法存在兩方面問題。一方面是傳統(tǒng)推薦方法僅僅依靠用戶之間的相似度來選取目標(biāo)用戶的鄰居,導(dǎo)致推薦精度較低、推薦的物品的多樣性較差;另一方面是傳統(tǒng)推薦方法過度依賴用戶對(duì)物品的評(píng)分來進(jìn)行預(yù)測(cè),無法完全避免用戶的評(píng)分偏見和惡意評(píng)分?jǐn)?shù)據(jù),導(dǎo)致推薦的物品與用戶感興趣的物品有偏差。因此,需要一種更為有效的且具有適當(dāng)多樣性的推薦系統(tǒng),為用戶提供方便而高效的推薦服務(wù)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明是為了解決上述問題而進(jìn)行的,目的在于提供一種基于用戶行為傾向概率的推薦系統(tǒng)評(píng)分預(yù)測(cè)與推薦方法。
本發(fā)明提供了一種基于用戶行為傾向概率的推薦系統(tǒng)評(píng)分預(yù)測(cè)與推薦方法,用于對(duì)當(dāng)前推薦系統(tǒng)中的物品、物品的標(biāo)簽和用戶的傾向性評(píng)分之間的關(guān)系進(jìn)行評(píng)分計(jì)算,并在目標(biāo)用戶從當(dāng)前推薦系統(tǒng)中搜索物品時(shí)向該目標(biāo)用戶提供相似物品的推薦服務(wù),其特征在于,包括如下步驟:
步驟一,建立物品數(shù)據(jù)庫,該物品數(shù)據(jù)庫包括n個(gè)物品ii和用于描述物品ii性質(zhì)的l個(gè)標(biāo)簽tq,物品ii的集合設(shè)為
步驟二,建立用戶評(píng)分庫,該用戶評(píng)分庫包括m個(gè)用戶ur和每個(gè)用戶ur對(duì)k(ur)個(gè)已評(píng)價(jià)物品ii的評(píng)分,用戶ur的集合設(shè)為ur={ur,r=1,...,m},已評(píng)價(jià)物品ii的集合為i(ur)={ii|ii∈im,i=1,...,k(ur)},評(píng)分為r′(ur∈ur,ii∈im);
步驟三,根據(jù)預(yù)定規(guī)則計(jì)算用戶ur對(duì)標(biāo)簽tq的傾向性概率預(yù)測(cè)評(píng)分p(ur,tq);
步驟四,根據(jù)下式計(jì)算用戶ur對(duì)物品ii的傾向性評(píng)分r(ur,ii):
步驟五,在目標(biāo)用戶u*從當(dāng)前推薦系統(tǒng)中搜索物品ii時(shí),根據(jù)下式計(jì)算物品ii與物品ij的相似度s(ii,ij):
上式中,物品ii的度為d(ii),目標(biāo)用戶u*的度為d(ur),a(ur,ii)表示目標(biāo)用戶u*是否對(duì)物品ii進(jìn)行過評(píng)分,當(dāng)目標(biāo)用戶u*對(duì)物品ii評(píng)過分時(shí),a(ur,ii)=1,當(dāng)目標(biāo)用戶u*未對(duì)物品ii評(píng)過分時(shí),a(ur,ii)=0;
步驟六,計(jì)算目標(biāo)用戶u*對(duì)物品ii的預(yù)測(cè)評(píng)分值,物品ii與物品ij的已知平均評(píng)分分別是ri′和rj′,用戶ur對(duì)物品ij的評(píng)分值為r′(ur,ij),設(shè)定物品ii的鄰居物品的個(gè)數(shù)為n,根據(jù)下式計(jì)算每個(gè)鄰居物品的預(yù)測(cè)評(píng)分值為r(ur,ii):
步驟七,根據(jù)預(yù)測(cè)評(píng)分值r(ur,ii)從高到低對(duì)鄰居物品進(jìn)行排序,并將排在預(yù)定位數(shù)的鄰居物品推薦給目標(biāo)用戶u*。
本發(fā)明提供的基于用戶行為傾向概率的推薦系統(tǒng)評(píng)分預(yù)測(cè)與推薦方法,還可以具有這樣的特征,其中,在步驟一中,物品ii∈im。
本發(fā)明提供的基于用戶行為傾向概率的推薦系統(tǒng)評(píng)分預(yù)測(cè)與推薦方法,還可以具有這樣的特征,其中,l(ii)個(gè)標(biāo)簽tp之間互不相同,且l(ii)≤l。
本發(fā)明提供的基于用戶行為傾向概率的推薦系統(tǒng)評(píng)分預(yù)測(cè)與推薦方法,還可以具有這樣的特征,其中,在步驟一中,
當(dāng)tp=tq時(shí),δ(tp,tq)=1,
當(dāng)tp≠tq時(shí),δ(tp,tq)=0。
本發(fā)明提供的基于用戶行為傾向概率的推薦系統(tǒng)評(píng)分預(yù)測(cè)與推薦方法,還可以具有這樣的特征,包括:在步驟二中,r′(ur∈ur,ii∈im)的值為1~5,當(dāng)用戶ur對(duì)物品ii未評(píng)價(jià)過時(shí),r′(ur∈ur,ii∈im)=0。
本發(fā)明提供的基于用戶行為傾向概率的推薦系統(tǒng)評(píng)分預(yù)測(cè)與推薦方法,還可以具有這樣的特征,其中,在步驟三中,預(yù)定規(guī)則的公式如下:
當(dāng)用戶ur評(píng)價(jià)過物品ii時(shí),
當(dāng)用戶ur未評(píng)價(jià)過物品ii時(shí),p(ur,tq)=0。
本發(fā)明提供的基于用戶行為傾向概率的推薦系統(tǒng)評(píng)分預(yù)測(cè)與推薦方法,還可以具有這樣的特征,其中,在步驟五和步驟六中,物品ij∈im。
本發(fā)明提供的基于用戶行為傾向概率的推薦系統(tǒng)評(píng)分預(yù)測(cè)與推薦方法,還可以具有這樣的特征,其中,在步驟六中,r′(ur,ij)的值為1~5,當(dāng)用戶ur對(duì)物品ij未評(píng)價(jià)過時(shí),r′(ur,ij)=0。
本發(fā)明提供的基于用戶行為傾向概率的推薦系統(tǒng)評(píng)分預(yù)測(cè)與推薦方法,還可以具有這樣的特征,其中,在步驟六中,n∈{10,20,30,40}。
本發(fā)明提供的基于用戶行為傾向概率的推薦系統(tǒng)評(píng)分預(yù)測(cè)與推薦方法,還可以具有這樣的特征,其中,在步驟七中,預(yù)定位數(shù)為5~10位。
發(fā)明的作用與效果
根據(jù)本發(fā)明所涉及的基于用戶行為傾向概率的推薦系統(tǒng)評(píng)分預(yù)測(cè)與推薦方法,由于對(duì)推薦系統(tǒng)中的物品、標(biāo)簽和用戶的傾向性評(píng)分之間的關(guān)系進(jìn)行評(píng)分計(jì)算,并在計(jì)算目標(biāo)用戶對(duì)物品的預(yù)測(cè)評(píng)分值之前對(duì)物品ii與物品ij進(jìn)行了相似度計(jì)算,使得推薦系統(tǒng)向目標(biāo)用戶推薦的物品更加多元化。另外,因?yàn)樵摶谟脩粜袨閮A向概率的推薦系統(tǒng)評(píng)分預(yù)測(cè)與推薦方法不過度依賴用戶評(píng)分,使得推薦系統(tǒng)向用戶推薦的物品符合用戶的興趣,從而提高了推薦的準(zhǔn)確性。
附圖說明
圖1是本發(fā)明的實(shí)施例中基于用戶行為傾向概率的推薦系統(tǒng)評(píng)分預(yù)測(cè)與推薦方法的流程圖。
具體實(shí)施方式
為了使本發(fā)明實(shí)現(xiàn)的技術(shù)手段與功效易于明白了解,以下結(jié)合實(shí)施例及附圖對(duì)本發(fā)明作具體闡述。
<實(shí)施例>
圖1是本發(fā)明的實(shí)施例中基于用戶行為傾向概率的推薦系統(tǒng)評(píng)分預(yù)測(cè)與推薦方法的流程圖。
如圖1所示,基于用戶行為傾向概率的推薦系統(tǒng)評(píng)分預(yù)測(cè)與推薦方法包括如下步驟:
步驟一,建立物品數(shù)據(jù)庫,該物品數(shù)據(jù)庫包括n個(gè)物品ii和用于描述物品ii性質(zhì)的l個(gè)標(biāo)簽tq,物品ii的集合設(shè)為
在本實(shí)施例中,該物品數(shù)據(jù)庫為與電影相關(guān)的物品數(shù)據(jù)庫,包括6個(gè)物品ii(即電影1,電影2,電影3,電影4,電影5,電影6),和用于描述物品ii的6個(gè)標(biāo)簽tq(即愛情,恐怖,劇情,科幻,歷史,動(dòng)作)。其中,每個(gè)物品ii有多個(gè)互不相同的標(biāo)簽tp,每個(gè)物品ii與每個(gè)標(biāo)簽tq的關(guān)系為δ(tp,tq)。
6個(gè)電影ii分別與6個(gè)標(biāo)簽tq的關(guān)系δ(tp∈t(ii∈im),tq∈tg)如表1所示。例如,電影1有3個(gè)標(biāo)簽tp(即恐怖,科幻,動(dòng)作),所以,電影1與三個(gè)標(biāo)簽tq(即恐怖,科幻,動(dòng)作)的關(guān)系均為1,電影1與其它3個(gè)標(biāo)簽tq(即愛情,劇情,歷史)的關(guān)系均為0。
表1
步驟二,建立用戶評(píng)分庫,該用戶評(píng)分庫為與電影相關(guān)的用戶評(píng)分庫,包括m個(gè)用戶ur和每個(gè)用戶ur對(duì)k(ur)個(gè)已評(píng)價(jià)物品ii的評(píng)分,用戶ur的集合設(shè)為ur={ur,r=1,…,m},已評(píng)價(jià)物品ii的集合為i(ur)={ii|ii∈im,i=1,…,k(ur)},評(píng)分為r′(ur∈ur,ii∈im),該r′(ur∈ur,ii∈im)的值為1~5,當(dāng)用戶ur對(duì)物品ii未評(píng)價(jià)過時(shí),r′(ur∈ur,ii∈im)=0。
在本實(shí)施例中,用戶ur對(duì)每個(gè)電影ii的評(píng)分?jǐn)?shù)據(jù)r′(ur∈ur,ii∈im)如表2所示。用戶評(píng)分庫包括6個(gè)用戶ur(u1,u2,u3,u4,u5,目標(biāo)用戶u*),以及每個(gè)用戶ur對(duì)多個(gè)已評(píng)價(jià)電影ii的評(píng)分r′(ur∈ur,ii∈im),比如用戶u3對(duì)電影2的評(píng)分為5,用戶u3對(duì)電影4的評(píng)分為0。
表2
步驟三,根據(jù)預(yù)定規(guī)則計(jì)算用戶ur對(duì)標(biāo)簽tq的傾向性概率預(yù)測(cè)評(píng)分p(ur,tq),預(yù)定規(guī)則的公式如下:當(dāng)用戶ur評(píng)價(jià)過物品ii時(shí),
在本實(shí)施例中,通過上式可計(jì)算得到用戶ur對(duì)每個(gè)標(biāo)簽tq的傾向性概率p(ur∈ur,tq∈tg),如表3所示,例如用戶u3評(píng)價(jià)過電影2和電影3,電影2的標(biāo)簽為劇情、歷史和動(dòng)作以及電影3的標(biāo)簽為愛情、科幻和動(dòng)作,用戶u3未評(píng)價(jià)過包含標(biāo)簽2(恐怖)的電影,所以,用戶u3對(duì)標(biāo)簽1即用戶u3對(duì)屬于愛情類的電影的傾向性概率為1/6,用戶u3對(duì)標(biāo)簽2即用戶u3對(duì)屬于恐怖類的電影的傾向性概率為0。
表3
步驟四,根據(jù)下式計(jì)算用戶ur對(duì)物品ii的傾向性評(píng)分r(ur,ii):
在本實(shí)施例中,通過上式可計(jì)算得到用戶ur對(duì)電影ii的傾向性評(píng)分r(ur∈ur,ii∈im),如表4所示,例如通過計(jì)算可知用戶u3對(duì)電影2的傾向性評(píng)分為0.66。
表4
步驟五,在目標(biāo)用戶u*從當(dāng)前推薦系統(tǒng)中搜索物品ii時(shí),根據(jù)下式計(jì)算物品ii與物品ij的相似度s(ii,ij):
上式中,ij∈im,物品ii的度為d(ii),目標(biāo)用戶u*的度為d(ur),a(ur,ii)表示目標(biāo)用戶u*是否對(duì)物品ii進(jìn)行過評(píng)分,當(dāng)目標(biāo)用戶u*對(duì)物品ii評(píng)過分時(shí),a(ur,ii)=1,當(dāng)目標(biāo)用戶u*未對(duì)物品ii評(píng)過分時(shí),a(ur,ii)=0。
在本實(shí)施例中,在目標(biāo)用戶u*從當(dāng)前推薦系統(tǒng)中搜索電影ii時(shí),可通過上式計(jì)算電影ii與電影ij的相似性s(ii∈im,ij∈im),如表5所示。例如電影1與電影1的相似性為1,電影1與電影2的相似性為0.008333。
表5
步驟六,計(jì)算目標(biāo)用戶u*對(duì)物品ii的預(yù)測(cè)評(píng)分值,物品ii與物品ij的已知平均評(píng)分分別是ri′和rj′,用戶ur對(duì)物品ij的評(píng)分值為r′(ur,ij),r′(ur,ij)的值為1~5,當(dāng)用戶ur對(duì)物品ij未評(píng)價(jià)過時(shí),r′(ur,ij)=0,設(shè)定物品ii的鄰居物品的個(gè)數(shù)為n,n∈{10,20,30,40},根據(jù)下式計(jì)算每個(gè)鄰居物品的預(yù)測(cè)評(píng)分值為r(ur,ii),
在本實(shí)施例中,設(shè)定鄰居物品個(gè)數(shù)為10,通過上式計(jì)算目標(biāo)用戶u*對(duì)電影ii的預(yù)測(cè)評(píng)分值r(u*,ii(i=2,3,4)),如表6所示,例如目標(biāo)用戶u*對(duì)電影2的計(jì)算值為2.415,經(jīng)四舍五入后得預(yù)測(cè)評(píng)分值為2,其中,目標(biāo)用戶u*評(píng)價(jià)過電影1和電影6,所以目標(biāo)用戶u*對(duì)電影1和電影6的預(yù)測(cè)評(píng)分值為現(xiàn)有評(píng)分值分別為5和3。
表6
步驟七,根據(jù)預(yù)測(cè)評(píng)分值r(ur,ii)從高到低對(duì)鄰居物品進(jìn)行排序,并將排在預(yù)定位數(shù)的鄰居物品推薦給目標(biāo)用戶u*,預(yù)定位數(shù)為5~10位。
在本實(shí)施例中,電影2、電影3、電影4和電影5根據(jù)表6中的預(yù)測(cè)評(píng)分值排序分別為電影4,電影5,電影3,電影2。由于推薦預(yù)定位數(shù)為5位,而當(dāng)前推薦位數(shù)少于5位,故將電影4、電影5、電影3和電影2按順序推薦給目標(biāo)用戶u*。
實(shí)施例的作用與效果
根據(jù)本實(shí)施例所涉及的基于用戶行為傾向概率的推薦系統(tǒng)評(píng)分預(yù)測(cè)與推薦方法,由于對(duì)推薦系統(tǒng)中的物品、標(biāo)簽和用戶的傾向性評(píng)分之間的關(guān)系進(jìn)行評(píng)分計(jì)算,并在計(jì)算目標(biāo)用戶對(duì)物品的預(yù)測(cè)評(píng)分值之前對(duì)物品ii與物品ij進(jìn)行了相似度計(jì)算,使得推薦系統(tǒng)向目標(biāo)用戶推薦的物品更加多元化。另外,因?yàn)樵摶谟脩粜袨閮A向概率的推薦系統(tǒng)評(píng)分預(yù)測(cè)與推薦方法不過度依賴用戶評(píng)分,使得推薦系統(tǒng)向用戶推薦的物品符合用戶的興趣,從而提高了推薦的準(zhǔn)確性。