一種結(jié)合模糊權(quán)重相似性度量和聚類協(xié)同過濾的方法

文檔序號：6626468閱讀：583來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種結(jié)合模糊權(quán)重相似性度量和聚類協(xié)同過濾的方法
【專利摘要】本發(fā)明公開了一種結(jié)合模糊權(quán)重相似性度量和聚類協(xié)同過濾的方法，依據(jù)用戶—項目評分矩陣Rm×n，用fcos,fcor,fadj分別計算用戶三種不同的相似度矩陣FCOS,FCOR,FADJ，再根據(jù)k-means算法和分類個數(shù)kcluster對所有用戶進(jìn)行分類。確定用戶的最近鄰居集s(Ui)，然后利用ri,c計算預(yù)測評分；依照上述策略，直到對所有用戶評分進(jìn)行預(yù)測。本發(fā)明的模糊相似度聚類IBCF\UBCF在鄰居集s(Ui)查找準(zhǔn)確度上有了明顯提高；對評分值和評分偏差進(jìn)行模糊化，更接近于用戶對于項目的真實評價；相似度計算加入模糊權(quán)重wc后，用戶間的相似度更趨于精確，從而提高了推薦系統(tǒng)的性能。
【專利說明】一種結(jié)合模糊權(quán)重相似性度量和聚類協(xié)同過濾的方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于推薦系統(tǒng)【技術(shù)領(lǐng)域】，尤其涉及一種結(jié)合模糊權(quán)重相似性度量和聚類協(xié) 同過濾的方法。

【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)和信息技術(shù)的快速發(fā)展和普及，人們對信息的依賴程度與日俱增。信息技術(shù)的大量使用提高了信息的生產(chǎn)、處理和傳播的效率。互聯(lián)網(wǎng)作為信息時代的基礎(chǔ)平臺，承載了大量的信息資源。面對海量的信息資源，用戶無法篩選出對自己有用的信息，這就是信息過載問題。為了解決信息過載問題，推薦系統(tǒng)應(yīng)運而生。與傳統(tǒng)的信息過濾技術(shù) 搜索引擎相比，推薦系統(tǒng)不需要用戶提供搜索的關(guān)鍵詞，而是通過分析用戶歷史行為記錄發(fā)現(xiàn)用戶潛在愛好，從而產(chǎn)生推薦。因此，推薦系統(tǒng)滿足了用戶的個性化需求。
[0003] 協(xié)同過濾推薦算法是推薦系統(tǒng)的主流算法，這種算法的基本思想是：用戶會喜歡 (不喜歡）與他興趣相同（不相同）的用戶所喜歡的項目。協(xié)同過濾算法主要分為：基于內(nèi)存的算法和基于模型的算法。基于內(nèi)存的協(xié)同過濾算法可分為基于用戶的協(xié)同過濾算法 (user-basedcollaborativefiltering,UBCF)和基于項目的協(xié)同過濾算法（item-based collaborativefiltering,IBCF)。兩種算法的關(guān)鍵都在于相似度的計算，不同的相似度計算方法會對目標(biāo)用戶產(chǎn)生不同的鄰居集，進(jìn)而影響推薦結(jié)果。而傳統(tǒng)的相似度計算方法直接應(yīng)用用戶的評分值或評分偏差，沒有考慮用戶評分的不確定性和不同的評分習(xí)慣。因此，我們應(yīng)該給原始評分加上合適的權(quán)重值，以逼近用戶真實的評分意愿。文獻(xiàn)Improving Coll-aborativeFilteringRecommenderSystemResultsandPerformanceUsing GeneticAlgorithms研究了評分和權(quán)重線性組合以優(yōu)化相似度計算函數(shù)方法，其中權(quán)重通過遺傳算法（geneticalgorithm)迭代收斂到預(yù)定條件。文獻(xiàn)OptimizingCollaborative FilteringRecommenderSystems提出了對用戶和鄰近項目采用不同的權(quán)重方式來提高推薦的質(zhì)量° 文獻(xiàn)Clusterensemblesincollaborativefilteringrecommendation 提出了聚類融合技術(shù)，首先應(yīng)用兩個著名的聚類技術(shù)（self-organizingmaps(SOM) 和k-means)對用戶進(jìn)行聚類尋找相似用戶群，然后分別用三種聚類融合算法（the cluster-basedsimilaritypartitioningalgorithm(CSPA),hypergraphpartitioning algorithm(HGPA)和majorityvoting)對相似用戶群進(jìn)行融合得到綜合相似關(guān)系群。最后，利用綜合相似關(guān)系群為目標(biāo)用戶推薦項目。該方法改善了基于用戶的協(xié)同過濾推薦算法面臨的"冷啟動"問題，而且提高了推薦系統(tǒng)的推薦精度。文獻(xiàn)Afuzzyrecommender systembasedontheintegrationofsubjectivepreferencesandobjective information將模糊語義模型融入到協(xié)同過濾推薦中，并提出了組合主觀和客觀用戶觀點的協(xié)同過濾算法（aggregatedsubjectiveandobjectiveusers'viewpoint(ASOV)) 該算法在一定程度上解決了"冷啟動"和數(shù)據(jù)稀疏性問題。文獻(xiàn)Facingthecoldstart probleminrecommendersystems提出了改進(jìn)的相似度技術(shù)、預(yù)測機制，將人口統(tǒng)計信息應(yīng)用到相似關(guān)系群的查找，該方法改善了協(xié)同過濾推薦算法面臨的"冷啟動"問題。
[0004] 雖然國內(nèi)外的眾多學(xué)者對協(xié)同過濾推薦算法進(jìn)行了深入地研究，但協(xié)同過濾算法仍存在很多值得研究的問題，特別是大量數(shù)據(jù)導(dǎo)致的稀疏性問題，"冷啟動"問題和提高推薦精度等方面仍值得進(jìn)行探索。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明實施例的目的在于提供一種結(jié)合模糊權(quán)重相似性度量和聚類協(xié)同過濾的方法，旨在解決協(xié)同過濾算法中存在的提高推薦精度，數(shù)據(jù)稀疏性問題和"冷啟動"問題。
[0006] 本發(fā)明實施例是這樣實現(xiàn)的，一種結(jié)合模糊權(quán)重相似性度量和聚類協(xié)同過濾的方法，該結(jié)合模糊權(quán)重相似性度量和聚類協(xié)同過濾的方法根據(jù)用戶評分值和模糊權(quán)重《。，計算任意兩個用戶之間的相似度；利用k-means聚類方法對全部用戶分成若干類；對于目標(biāo) 用戶，在所屬的類中按相似度由高到底選取鄰居集；然后，根據(jù)鄰居集內(nèi)其他用戶對目標(biāo)項目的評分，預(yù)測目標(biāo)用戶對目標(biāo)項目的評分。
[0007] 進(jìn)一步，該結(jié)合模糊權(quán)重相似性度量和聚類協(xié)同過濾的方法包括以下步驟：
[0008] 步驟一，處理用戶一項目評分矩陣Rmxn，確定目標(biāo)用戶％、待評分的項目I。、最近鄰居查詢個數(shù)knear和分類數(shù)kcluster;
[0009] 步驟二，依據(jù)評分矩陣Rmxn，用fcos,fcor,fadj分別計算用戶三種不同的相似度矩陣FCOS，F(xiàn)COR，F(xiàn)ADJ，從相似度矩陣中知道任意兩個用戶之間的相似度；fcos:模糊加權(quán) 余弦相似性；fcor:模糊加權(quán)相關(guān)相似性；fadj:模糊加權(quán)修正余弦相似性；
[0010] 步驟三，由步驟二得出的相似度，再根據(jù)k-means算法和分類個數(shù)kcluster對所有用戶進(jìn)行分類；
[0011] 步驟四，選取用戶Ui所在的類index;確定用戶的最近鄰居集S(Ui);
[0012] 步驟五，然后利用計算預(yù)測評分；

【權(quán)利要求】
1. 一種結(jié)合模糊權(quán)重相似性度量和聚類協(xié)同過濾的方法，其特征在于，該結(jié)合模糊權(quán) 重相似性度量和聚類協(xié)同過濾的方法包括以下步驟：步驟一，處理用戶一項目評分矩陣Rmxn，確定目標(biāo)用戶Ui、待評分的項目I。、最近鄰居查詢個數(shù)knear和分類數(shù)kcluster; 步驟二，依據(jù)評分矩陣Rmxn，用fcos，fcor，fadj分別計算用戶三種不同的相似度矩陣FCOS，F(xiàn)COR，F(xiàn)ADJ，從相似度矩陣中知道任意兩個用戶之間的相似度；fcos:模糊加權(quán)余弦相似性；fcor:模糊加權(quán)相關(guān)相似性；fadj:模糊加權(quán)修正余弦相似性；步驟三，由步驟二得出的相似度，再根據(jù)k-means算法和分類個數(shù)kcluster對所有用戶進(jìn)行分類；步驟四，選取用戶Ui所在的類index;確定用戶的最近鄰居集s(Ui); 步驟五，然后利用
ιγ。計算預(yù)測評分； k。：用戶Ui對項目I。的評分；^ :用戶Ui的平均評分；s(Ui):用戶Ui的最近鄰居集；步驟六，循環(huán)步驟四和步驟五直到對測試集中的所有用戶的評分都進(jìn)行了預(yù)測。
2. 如權(quán)利要求1所述的結(jié)合模糊權(quán)重相似性度量和聚類協(xié)同過濾的方法，其特征在于，步驟二中的fcos,fcor,fadj通過引入模糊權(quán)重w。，模糊加權(quán)余弦相似性、模糊加權(quán)相關(guān) 相似性和模糊加權(quán)修正余弦相似性的定義如下：
表示用戶Ui對項目I。的評分，f和f分別表示用戶Ui和用戶％的平均評分。
3. 如權(quán)利要求2所述的結(jié)合模糊權(quán)重相似性度量和聚類協(xié)同過濾的方法，其特征在于，fcos中w。求得的方法：模糊向量中的元素個數(shù)是由模糊集的個數(shù)決定，評分的隸屬函數(shù)為：
r=4時，相應(yīng)的二元隸屬向量為？ =(0,75,0.25);任取用戶Ui和用戶％共同評價過的推薦項目I。e Iij,向量4和4關(guān)于推薦項目I。e Iij的模糊權(quán)重w。為：
其中《^(4 -孓）表示向量4和4之間的歐式距離，1為向量的維數(shù)，K為向量4中的第k個元素；在w。中，用萬減去其它值是因為為孓）的最大值（對于向量 4=(0，丨),孓=(丨，0)的乜8(·))。
4.如權(quán)利要求2所述的結(jié)合模糊權(quán)重相似性度量和聚類協(xié)同過濾的方法，其特征在于，fcor和fadj中w。的求得方法：用戶Ui和用戶％對共同評分過的推薦項目1。^Iu的評分與各自評分均值的偏差為devic 和（Ievjc ;分別用verybad(vb)、bad(b)、fair(f)、good(g)、verygood(vg)表不 5 個模糊集，由5個模糊集組成評分偏差的隸屬函數(shù)為：
devic; = 2. 7,根據(jù)隸屬函數(shù)的定義，隸屬向量為：?/?·τ/(. =(0,0,0,0.3,0.7);對于向量和^*關(guān)于推薦項目ceIu的模糊權(quán)重w。為：
其中-ifeVp)表示向量和￡/￡^/(；之間的歐式距離，1為向量的維數(shù)，i/evf為向量dev:c的第k個元素；在w。中，用▲減去其它值是因為萬為-辦v'A.)的最大值 (對于i/c，v，i; =(0,0,0,0,1),c/i，v/r =(1,0,0,0,0)的dis( ·))。
5.如權(quán)利要求1所述的結(jié)合模糊權(quán)重相似性度量和聚類協(xié)同過濾的方法，其特征在于，在步驟五中S(Ui)的更新方法包括：第一步，對用戶Ui與所在的類index中的其它用戶按照相似度大小降序排列；并與對目標(biāo)項目I。評分不為〇的用戶集USER。中用戶求交集組成用戶群Ci(Ui); 第二步，若|9(1^)|彡1〇16&1'，取9(1^)中前1〇16&1'個用戶組成8(1^) ; 第三步，當(dāng) 0 <Iq(Ui)I彡knear時,則S(Ui)為q(Ui); 第四步，當(dāng)Iq(Ui)I= 0時，對用戶Ui與所有用戶U按照相似度大小降序排列；并與USER。中用戶求交集組成新用戶群Ci(Ui); 第五步，若|9(1^)|彡1〇1631'，取9(1^)中前1〇1631'個用戶組成8(1^); 第六步，當(dāng) 〇 <Iq(Ui)I彡knear時，則S(Ui)為Q(Ui); 第七步，當(dāng)Iq(Ui)I=0時，對用戶集USER。按照相似度大小降序排列，取前knear個用戶作為s(Ui);如果〇<IusercJ彡knear，取IusercJ個用戶組成s(Ui);否則IusercJ=〇，則S(Ui)為空集。
【文檔編號】G06F17/30GK104239496SQ201410457937
【公開日】2014年12月24日申請日期:2014年9月10日優(yōu)先權(quán)日:2014年9月10日
【發(fā)明者】齊小剛, 張雅科, 鄭耿忠, 劉立芳, 馬軍艷, 李強, 楊國平, 馮海林申請人:西安電子科技大學(xué), 韓山師范學(xué)院

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：齊小剛;張雅科;鄭耿忠;劉立芳;馬軍艷;李強;楊國平;馮海林
技術(shù)所有人：西安電子科技大學(xué);韓山師范學(xué)院
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

聚類分析的相似性矩陣相關(guān)技術(shù)

相似性度量相關(guān)技術(shù)

時間序列相似性度量相關(guān)技術(shù)

圖像相似性度量相關(guān)技術(shù)

圖像相似性度量方法相關(guān)技術(shù)

相似性度量方法相關(guān)技術(shù)

直方圖相似性度量相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種結(jié)合模糊權(quán)重相似性度量和聚類協(xié)同過濾的方法