亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種混合雙向聚類好友推薦方法

文檔序號:6366105閱讀:398來源:國知局
專利名稱:一種混合雙向聚類好友推薦方法
技術(shù)領(lǐng)域
本發(fā)明涉及社交網(wǎng)絡(luò)中的好友推薦領(lǐng)域,特別是解決基于用戶與用戶推薦中的雙向性、公平性問題。
背景技術(shù)
推薦問題一直是機器學(xué)習(xí)領(lǐng)域內(nèi)的經(jīng)典問題,而隨著社交網(wǎng)絡(luò)、微博客等新興互聯(lián)網(wǎng)服務(wù)的興起,基于用戶與用戶的推薦,成為推薦領(lǐng)域研究的新趨勢。傳統(tǒng)的推薦方法主要包括基于內(nèi)容的推薦、基于協(xié)同過濾的推薦和兩者混合的推薦方法。在用戶與用戶的推薦中,有很多的推薦任務(wù)存在明顯的雙向性需求,即需要推薦與被推薦雙方需要對彼此都感興趣,才能夠進行成功的推薦。雙向性的需求,使得對每對推薦對象,方法必須計算用戶配對雙向的喜好程度,并考慮雙向喜好進行排序。
公平性指使得推薦機會盡可能平衡的分配給全體符合條件的用戶,既不出単一用戶被過度推薦的情況,又不出現(xiàn)新用戶或者合格的老用戶推薦次數(shù)過少的情況。在傳統(tǒng)的推薦系統(tǒng)中,往往允許出現(xiàn)熱門的推薦對象在基于內(nèi)容推薦中,條件較好的用戶往往出現(xiàn)在大部分用戶推薦列表的前排位置;而在基于協(xié)同過濾的推薦算法中,越受歡迎的用戶,往往出現(xiàn)在越多人的推薦列表中。這樣的推薦結(jié)果,導(dǎo)致推薦機會被集中在一群高質(zhì)量、受歡迎的用戶上,導(dǎo)致了推薦系統(tǒng)不公平現(xiàn)象的產(chǎn)生。專利方法,首先控制推薦的雙向性,要求推薦雙方彼此都感興趣,方可進行推薦,從而避免了受歡迎用戶被推薦給過多用戶的現(xiàn)象出現(xiàn)。同時通過二次篩選的方法,將活躍用戶的權(quán)重提升,重新分配推薦機會,保證最終推薦結(jié)果的公平性。

發(fā)明內(nèi)容
本發(fā)明要解決現(xiàn)有好友推薦方法所存在的雙向性差、公平性差的缺點,提供ー種解決基于用戶與用戶的推薦中雙向性、公平性等問題的混合聚類雙向推薦方法。本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案如下I)提取用戶的擇偶偏好特征,包括如下步驟a)將ー個用戶X的用戶資料,歸ー化后表示為Ux,找到用戶X曾經(jīng)發(fā)信(或其它社交網(wǎng)絡(luò)交互)的對象,用戶集合Mx;b)利用用戶集合Mx的屬性的分布,計算得到用戶X的擇偶偏好Px ;2)聚類得到品味相近的用戶分別針對男性和女性用戶,利用K-means聚類算法,將具有相近擇偶偏好的用戶聚類到一起,形成用戶聚類c ;3)計算用戶雙向性喜好a)在計算得到品味相近用戶的聚類c后,基于c中用戶的發(fā)信對象,計算集合c的候選用戶集S。,并計算出S。中用戶u的受歡迎程度Popularu ;b)對每ー對用戶U,V,計算兩者間雙向喜好值;4)針對任意用戶u計算u與其所在聚類c的候選用戶集合S。中每ー個用戶V的匹配度得分,并依據(jù)得分的高低對用戶V進行排序,并按照事先預(yù)定的閾值,將得分最高的前N個用戶V推薦給用戶U,作為用戶u的推薦列表;5)保證推薦的公平性對第一次的推薦結(jié)果進行二次處理,用活躍的推薦次數(shù)少的用戶,替代被推薦次數(shù)過多的用戶;


圖I是本發(fā)明的方法流程圖。
具體實施例方式本發(fā)明實施的具體步驟如下I、提取用戶的擇友偏好特征,包括如下步驟I)將ー個用戶X的用戶資料,歸ー化后表示為Ux,找到用戶X曾經(jīng)發(fā)信的對象,用戶集合Mx2)用戶集合Mx的屬性的分布,計算得到用戶X的擇偶偏好Px。2、聚類得到品味相近的用戶針對全體用戶,利用K-means等聚類算法,將一群具有相近擇友偏好的用戶,聚類到一起,形成用戶聚類C。3、計算用戶雙向性喜好I)在計算得到品味相近用戶的聚類c后,基于c中用戶的發(fā)信對象,計算集合c的候選用戶集S。。2)并根據(jù)S。中用戶收信數(shù)量的多少,計算出S。中用戶u的受歡迎程度PopUlaru。3)對任意c中的用戶V定義,Popular"u為用戶V對用戶u的感興趣程度,其值等同于Popularu,同理可以計算出用戶u對用戶v的感興趣程度Popularu —v。4)用戶u, V間的雙向喜好由Popularu —v與Popularv — u的加權(quán)加和得到。4、按評分排序得到推薦列表I)按照用戶顯示的推薦要求,篩選掉不相符的推薦候選對象,篩除已經(jīng)交流過的用戶和被列入黑名單的用戶。2) Score (x, u) = Popularu^ χ+α X Popularx _u+Random (I)按照評分公式I計算出每對用戶的得分,其中PopularUi代表用戶u對用戶x的感興趣程度,Popularpu代表用戶X對用戶u的感興趣程度,α為調(diào)節(jié)雙向性因素的常數(shù)權(quán)重系數(shù)。公式中前兩項代表了用戶間的雙向喜好,Random為ー隨機數(shù)的擾動值,目的在于為了避免推薦結(jié)果的過度集中,保證推薦的公平性。3)與用戶U配對得分越高的用戶出現(xiàn)在推薦列表的越前端。按照閾值N,篩選前N個用戶組成推薦列表。5、保證推薦結(jié)果的公平性I)在得到第一次的推薦結(jié)果后,提取所有展示次數(shù)小于α的用戶,將用戶分成展示次數(shù)小于α的用戶,
Ud i spl ay—I i 111 e,
與展示次數(shù)大于α的活躍用戶
"^Display—alot °2)對Ullisplay lit&用戶進行篩選,根據(jù)設(shè)定閾值,只保留活躍程度大于閾值的用戶。3)為每ー個來自Ullisplay al()t中的活躍用戶X,計算出一個與之屬性最為相似的非活躍用戶集合wx。4)第二次計算推薦候選集S。,聚類中受到推薦次數(shù)數(shù)量較多的對象X,替換成與之屬性最為相似的非活躍用戶集合Wx的用戶。按照之前的算法流程,得到新的推薦結(jié)果,新的推薦結(jié)果將全是之前推薦次數(shù)較少的用戶。5)將這些用戶,按照一定的比例插入到之前的推薦結(jié)果里,取代推薦次數(shù)過多的用戶。本說明書實施例所述的內(nèi)容僅僅是對發(fā)明構(gòu)思的實現(xiàn)形式的列舉,本發(fā)明的保護范圍的不應(yīng)當(dāng)被視為僅限于實施例所陳述的具體 形式,本發(fā)明的保護范圍也及于本領(lǐng)域技術(shù)人員根據(jù)本發(fā)明構(gòu)思所能夠想到的等同技術(shù)手段。
權(quán)利要求
1.一種基于用戶行為和用戶個人屬性的混合雙向聚類推薦方法,其特征在于 1)提取用戶的擇偶偏好特征,包括如下步驟 a)將ー個用戶X的用戶資料,歸ー化后表示為Ux,找到用戶X曾經(jīng)發(fā)信等交互行為的對象,用戶集合Mx ; b)利用用戶集合Mx的屬性的分布,計算得到用戶X的擇偶偏好Px; 2)聚類得到品味相近的用戶分別針對男性和女性用戶,利用K-means聚類算法,將具有相近擇偶偏好的用戶聚類到一起,形成用戶聚類c ; 3)計算用戶雙向性喜好 a)在計算得到品味相近用戶的聚類c后,基于c中用戶的發(fā)信(或其它社交網(wǎng)絡(luò)交互行為)的目標(biāo)對象,計算集合c的候選用戶集S。,并計算出S。中用戶u的受歡迎程度Popularu; b)對每ー對用戶U,V,計算兩者間雙向喜好值; 4)針對任意用戶u計算u與其所在聚類c的候選用戶集合S。中每ー個用戶V的匹配度得分,并依據(jù)得分的高低對用戶V進行排序,并按照事先預(yù)定的閾值,將得分最高的前N個用戶V推薦給用戶U,作為用戶u的推薦列表; 5)保證推薦的公平性 對第一次的推薦結(jié)果進行二次處理,將被推薦次數(shù)過多的用戶的部分推薦位置,用與之個人屬性相似,交友行為活躍但獲得推薦次數(shù)少的用戶替代。
2.根據(jù)權(quán)利要求I所述的基于用戶行為和用戶個人屬性的混合雙向聚類推薦方法,其特征在干步驟(I)中提取用戶擇友偏好并進行聚類的過程包括統(tǒng)計用戶交友中的發(fā)信交互對象,計算用戶發(fā)信對象的個人屬性分布,并將之定義為用戶的擇友偏好。之后利用K-Means算法(K-means算法是ー種應(yīng)用廣泛的典型基于距離的聚類算法,采用距離作為相似性的評價指標(biāo),即認為兩個對象的距離越近,其相似度就越大),基于用戶的擇友偏好向量,以余弦相似度作為度量方式,對用戶進行聚類。
3.根據(jù)權(quán)利要求I所述的ー種基于用戶行為和用戶個人屬性的混合雙向聚類推薦方法,其特征在于步驟(2)中的用戶u對其它用戶的喜好PopularUi等同于用戶u所在集合c對用戶V的喜愛程度,等同于集合c中有多少用戶對用戶V感興趣。集合c中用戶的推薦候選用戶集合S。定義為集合c中用戶發(fā)信對象的集合。
4.根據(jù)權(quán)利要求I所述的ー種基于用戶行為和用戶個人屬性的混合雙向聚類推薦方法,其特征在于步驟(4)中的兩用戶間匹配度得分由如下公式計算
5.根據(jù)權(quán)利要求I所述的ー種基于用戶行為和用戶個人屬性的混合雙向聚類推薦方法,其特征在干步驟(5)中的公平性,是指推薦結(jié)果的均勻性,即不會出現(xiàn)熱門用戶被過度推薦,冷門用戶得不到推薦機會的情況。公平性主要基于推薦結(jié)果的雙向性限制和為推薦排序增添隨機擾動和推薦結(jié)果的二次處理來實現(xiàn)。
全文摘要
本發(fā)明公開了一種基于用戶行為和個人屬性的混合雙向聚類好友推薦方法。本方法基于用戶的交友選擇行為與用戶屬性,計算用戶擇友偏好。依據(jù)用戶擇友偏好對全體用戶進行聚類,并計算得出每個用戶對其它用戶的喜愛程度。之后,基于每對用戶間的雙向喜好的大小,對用戶進行排序。同時通過保證推薦雙向性、在排序公式增加隨機擾動、針對推薦效果差用戶二次處理的方法,使最終推薦機會分布更為均勻。本方法的優(yōu)點在于綜合利用用戶屬性與用戶行為信息,增強推薦結(jié)果的準(zhǔn)確性;考慮用戶交友推薦過程中雙向性和公平性問題,從而取得更好的推薦效果。本方法可以應(yīng)用到具有雙向性需求的社交網(wǎng)絡(luò)、婚戀交友推薦系統(tǒng)、社會化問答系統(tǒng)等應(yīng)用場景。
文檔編號G06F17/30GK102662975SQ20121006375
公開日2012年9月12日 申請日期2012年3月12日 優(yōu)先權(quán)日2012年3月12日
發(fā)明者卜佳俊, 王北斗, 王燦, 鄭淼, 陳孝峰, 陳純 申請人:浙江大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1