專利名稱:基于偏好模型的社會化過濾方法
技術(shù)領(lǐng)域:
本發(fā)明屬于信息化處理技術(shù)領(lǐng)域,涉及協(xié)同過濾,特別是一種社會化過濾方法,可用于在網(wǎng)絡(luò)中的信息交互和共享。
背景技術(shù):
隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)已經(jīng)變成信息共享的平臺,在該平臺上用戶之間實現(xiàn)信息的交互和共享,所以對于信息的共享和交互處理就是急需解決的問題。如何讓人們在海量的數(shù)據(jù)中想要找到他們需要的信息,實現(xiàn)用戶之間的信息共享與交互,就需要采用協(xié)同過濾技術(shù)。該方法是不依賴于用戶的屬性信息和物品的內(nèi)容信息,而僅僅通過分析大量的用戶對物品的行為信息,從中找出特定的行為模式,據(jù)此來預(yù)測用戶的偏好。所謂偏好,表示的是用戶所感興趣的信息類型。近年,隨著以i^acebook和Twitter為代表的社會網(wǎng)絡(luò)的興起,社會化過濾逐漸成為協(xié)同過濾技術(shù)的研究熱點(diǎn)。社會化過濾方法利用用戶和他的好友偏好的共同點(diǎn),來分析好友的偏好,從而預(yù)測給定用戶的偏好。最簡單的社會化過濾算法是基于鄰域的算法。除了簡單的鄰域模型,還有其他社會化過濾算法。利用圖模型將用戶的社會網(wǎng)絡(luò)和用戶物品的偏好關(guān)系建模到一張圖中,然后利用隨機(jī)游走算法給用戶做社會化推薦。一個矩陣分解的算法來分解用戶的社會網(wǎng)絡(luò)矩陣和用戶物品偏好矩陣,計算出用戶的特征向量和物品的特征向量,并最終利用特征向量的點(diǎn)乘度量用戶對物品的偏好。但是以上這些社會化推薦方法,隨著用戶和商品的增多,系統(tǒng)的性能會越來越低; 都是針對單個用戶進(jìn)行偏好發(fā)現(xiàn),所以對于用戶比較多時,社交關(guān)系復(fù)雜的情況,推薦準(zhǔn)確性就會大大下降。
發(fā)明內(nèi)容
本發(fā)明的目的是針對已有方法的不足,提出一種基于偏好模型的社會化過濾方法,依據(jù)用戶之間的關(guān)系建立群體偏好特征,從而解決在用戶比較多,用戶的偏好相似度比較低的情況下,通過計算群體偏好特征的加權(quán)影響向量,提高對用戶偏好過濾方法的準(zhǔn)確性。為實現(xiàn)上述目的,本發(fā)明包括如下步驟(1)從網(wǎng)頁配置文件中獲取一個組G = Iu1, U2,…,ug},化為組員,1彡1彡g,g 為組G中組員的個數(shù);再從組內(nèi)獲取所有組員喜好對象的列表M= (HlljlIl2,…,mp},mi為組員喜好對象,Ι^ ^ρ,ρ為列表M中對象的個數(shù);(2)根據(jù)組G的特征,分別計算組員U1和組員喜好對象Hii對組的影響因子,得到對組G的加權(quán)影響向量=I = P1,#為組員喜好對象HIi對組G歸一化后的加權(quán)影響因子,1彡i彡P(guān) ;(3)使用關(guān)鍵字表示組員喜好對象Hii,得到組員喜好對象Hii的關(guān)鍵字向量Wi = {Wl,W2,…,wn},%為組員喜好對象HIi的關(guān)鍵字,1 < q<n,n為組員喜好對象叫的關(guān)鍵字
(4)將對象列表M的關(guān)鍵字向量表示為W = (W1, W2,…,ffp},Wi表示組員喜好對象叫的關(guān)鍵字向量,1彡i ^P ;(5)根據(jù)步驟O)中所述的加權(quán)影響向量χ和步驟中所述對象列表M的關(guān)鍵字向量W,計算組G的綜合加權(quán)影響向量={xlWl,~X2W2,-,~XpWp];(6)輸入待分析對象m',并使用關(guān)鍵字表示待分析對象m',得到待分析對象 m'的關(guān)鍵字向量W' =IV 1; w' 2,···, w' k},其中W' r為待分析對象m'的關(guān)鍵字
權(quán)利要求
1.一種基于偏好模型的社會化過濾方法,包括如下步驟(1)從網(wǎng)頁配置文件中獲取一個組G=K, U2,…,Ug},Ul*組員,1彡1彡g,g為組 G中組員的個數(shù);再從組內(nèi)獲取所有組員喜好對象的列表M= Itvm2,…,mp},Hii為組員喜好對象,1 ^ i ^ρ,ρ為列表M中對象的個數(shù);(2)根據(jù)組G的特征,分別計算組員U1和組員喜好對象Hii對組的影響因子,得到對組G 的加權(quán)影響向量3 = ·[ ···,&},無為組員喜好對象Hii對組G歸一化后的加權(quán)影響因子, 1 ^ i ^ ρ ;(3)使用關(guān)鍵字表示組員喜好對象Hli,得到組員喜好對象Hli的關(guān)鍵字向量Wi= Iw1, W2,…,WnI,Wq為組員喜好對象HIi的關(guān)鍵字,l≤q≤n, η為組員喜好對象Hii的關(guān)鍵字個數(shù);(4)將對象列表M的關(guān)鍵字向量表示為W= (W1, W2,…,WJ,Wi表示組員喜好對象Hii 的關(guān)鍵字向量,1≤i≤P;(5)根據(jù)步驟O)中所述的加權(quán)影響向量X和步驟中所述對象列表M的關(guān)鍵字向量W,計算組G的綜合加權(quán)影響向量
2.根據(jù)權(quán)利要求1所述的基于偏好模型的社會化過濾方法,其中步驟(1)所述的喜好對象,是指組員在其網(wǎng)頁上顯示其喜好的對象信息;所述的喜好對象列表,是取每個組員所喜好對象的一個并集。
3.根據(jù)權(quán)利要求1所述的基于偏好模型的社會化過濾方法,所述步驟O)中計算組員 U1和組員喜好對象Hli對組G的影響因子,包括如下步驟(2a)計算組員U1對組G的影響因子Zg,
全文摘要
本發(fā)明公開了一種基于偏好模型的社會化過濾方法,主要解決現(xiàn)有技術(shù)針對用戶比較多,社交關(guān)系復(fù)雜的情況,過濾方法準(zhǔn)確性不高的問題,其實現(xiàn)方案是通過分析組員之間社會化關(guān)系,計算組員對組的影響因子;通過分析組內(nèi)組員喜好對象分布情況,計算組員喜好對象對組的影響因子;綜合上述兩種影響因子,共同對組的偏好模型進(jìn)行特征表示,得到組的加權(quán)影響向量。然后計算過濾系數(shù),判斷推薦條件,來過濾出組的共同相似愛好,提高社會化過濾方法的準(zhǔn)確性和效率。本發(fā)明具有對組的偏好模型分析的優(yōu)點(diǎn),僅需修改獲取其領(lǐng)域內(nèi)關(guān)鍵字向量,即可在網(wǎng)絡(luò)上實現(xiàn)對不同領(lǐng)域?qū)ο蟮耐扑]。
文檔編號G06F17/30GK102521420SQ201210000228
公開日2012年6月27日 申請日期2012年1月4日 優(yōu)先權(quán)日2012年1月4日
發(fā)明者劉志鏡, 曲建銘, 朱旭東, 王煒華, 王縱虎, 王靜, 賀文華, 趙輝, 陳東輝 申請人:西安電子科技大學(xué)