專利名稱:一種社交網(wǎng)絡(luò)中的朋友關(guān)系傳遞樹的建立方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種社交網(wǎng)絡(luò)中的朋友關(guān)系傳遞樹的建立方法,屬于計算機(jī)數(shù)據(jù)挖掘技術(shù)領(lǐng)域。
背景技術(shù):
社交網(wǎng)絡(luò)在近些年得到了飛速的發(fā)展,也受到了許多研究人員的重視。其中社交網(wǎng)絡(luò)的形成與演化過程研究一直都是一項(xiàng)有意義而且有挑戰(zhàn)的工作。已有的工作主要從兩個方面來研究社交網(wǎng)絡(luò)的形成與演化。一方面,人們以社交網(wǎng)絡(luò)演化中在某一時刻的快照或者多個時刻的快照為對象,研究社交網(wǎng)絡(luò)的宏觀結(jié)構(gòu)特征變化;另一方面,人們關(guān)注社交網(wǎng)絡(luò)發(fā)展的微觀模式,并發(fā)現(xiàn)了許多的模式用以解釋和分析人們?nèi)绾谓慌笥选_@樣的模式包括偏好依附(Preferential Attachment)、三元閉合(triadic closure)、互惠(Reciprocity)、同質(zhì)性(Homophily)等等,其中三元閉合(triadic closure)是社交網(wǎng)絡(luò)的鏈接形成中最普遍的現(xiàn)象之一,其社會學(xué)原理是朋友關(guān)系的傳遞性(the transitivity offriendship),即兩個有公共朋友的人更可能成為朋友。朋友關(guān)系的傳遞性已經(jīng)被證明可以用于對網(wǎng)絡(luò)演化過程進(jìn)行建模以及預(yù)測未來的鏈接形成,然而這一性質(zhì)在網(wǎng)絡(luò)演化過程中所起的作用并沒有得到很深的探究。學(xué)者Simmel分析了在這樣三元結(jié)構(gòu)中三個參與者的角色,并且指出第三個人一般扮演著中介人或者協(xié)調(diào)者的作用。然而,其中還是不清楚第三個人是如何影響、促使另外兩個人成為朋友的。學(xué)者D. Yin等人在鏈接預(yù)測問題中考慮了中介人的作用,并且把鏈接產(chǎn)生看作是中間人“潛在的推薦”的結(jié)果。他們在矩陣分解中引入了中介人潛在推薦這一潛在的維度,然而這一分析是對于靜態(tài)網(wǎng)絡(luò)進(jìn)行的,沒有考慮到網(wǎng)絡(luò)的發(fā)展以及中介人在微觀上對于網(wǎng)絡(luò)中每一條鏈接形成的影響。好友推薦是交友網(wǎng)站中的一項(xiàng)重要的功能,許多交友網(wǎng)站依靠為用戶推薦好友來吸引用戶、增強(qiáng)用戶對交友網(wǎng)站的依賴性。目前研究者已經(jīng)提出了許多算法來解決好友推薦的問題,比如隨機(jī)游走算法、有監(jiān)督的隨機(jī)游走算法、矩陣分解算法等等,然而這些算法都把社交網(wǎng)絡(luò)當(dāng)作一個圖來處理,并沒有考慮到用戶的動機(jī)和行為在好友推薦中的重要作用。
發(fā)明內(nèi)容
本發(fā)明的目的是提出一種社交網(wǎng)絡(luò)中的朋友關(guān)系傳遞樹的建立方法,通過對用戶的行為進(jìn)行建模,基于朋友關(guān)系的傳遞性來推測和表達(dá)社交網(wǎng)絡(luò)的形成和演化過程,從而便于對社交網(wǎng)絡(luò)未來發(fā)展情況進(jìn)行預(yù)測。本發(fā)明提出的社交網(wǎng)絡(luò)中的朋友關(guān)系傳遞樹的建立方法,包括以下步驟(I)設(shè)社交網(wǎng)絡(luò)中有多個用戶,每個用戶有多個朋友,將用戶記為自我節(jié)點(diǎn)U,將該用戶的朋友記為朋友節(jié)點(diǎn)V,為社交網(wǎng)絡(luò)中的自我節(jié)點(diǎn)U,創(chuàng)建一個自我節(jié)點(diǎn)u的朋友關(guān)系傳遞樹,在該朋友關(guān)系傳遞樹中添加自我節(jié)點(diǎn)u和自我節(jié)點(diǎn)u的所有朋友節(jié)點(diǎn);
(2)按照時間,將自我節(jié)點(diǎn)與朋友節(jié)點(diǎn)之間的交互數(shù)據(jù)按交互的時間劃分為N段,對于與第i段交互對應(yīng)的時間段Ti,執(zhí)行步驟
權(quán)利要求
1.一種社交網(wǎng)絡(luò)中的朋友關(guān)系傳遞樹的建立方法,其特征在于該方法包括以下步驟: (1)設(shè)社交網(wǎng)絡(luò)中有多個用戶,每個用戶有多個朋友,將用戶記為自我節(jié)點(diǎn)U,將該用戶的朋友記為朋友節(jié)點(diǎn)V,為社交網(wǎng)絡(luò)中的自我節(jié)點(diǎn)U,創(chuàng)建一個自我節(jié)點(diǎn)u的朋友關(guān)系傳遞樹,在該朋友關(guān)系傳遞樹中添加自我節(jié)點(diǎn)u和自我節(jié)點(diǎn)u的所有朋友節(jié)點(diǎn); (2)按照時間,將自我節(jié)點(diǎn)與朋友節(jié)點(diǎn)之間的交互數(shù)據(jù)按交互的時間劃分為N段,對于與第i段交互對應(yīng)的時間段Ti,執(zhí)行步驟(3)- (9),i=l,2,……,N; (3)對于時間段Ti,建立如下社交行為概率生成模型: (3-1)設(shè)社交網(wǎng)絡(luò)中的總用戶數(shù)為U,社交網(wǎng)絡(luò)中每個自我節(jié)點(diǎn)u的交互行為數(shù)為\,社交網(wǎng)絡(luò)中每個自我節(jié)點(diǎn)u的新交朋友數(shù)為Nu ; (3-2)分別用先驗(yàn)參數(shù)為/Jfi)的狄利克雷分布表示社交網(wǎng)絡(luò)中每個自我節(jié)點(diǎn)u的好友關(guān)系強(qiáng)度分布的先驗(yàn)分布,從該狄利克雷分布中采樣得到社交網(wǎng)絡(luò)中自我節(jié)點(diǎn)u在時間段Ti的好友關(guān)系強(qiáng)度分布 (3-3)從上述好友關(guān)系強(qiáng)度分布中,采樣得到社交網(wǎng)絡(luò)中每個自我節(jié)點(diǎn)u的每次交互對象X ; (3-4)分別用先驗(yàn)參數(shù)為的狄利克雷分布表示社交網(wǎng)絡(luò)中每個自我節(jié)點(diǎn)u的中介偏好概率分布的先驗(yàn)分布,從該狄利克雷分布中采樣得到社交網(wǎng)絡(luò)中自我節(jié)點(diǎn)u在時間段Ti的中介偏好概率分布 (3-5)分別從上述中介偏好概率分布0^^中采樣得到社交網(wǎng)絡(luò)中每個自我節(jié)點(diǎn)u的中 介人z,從與中介人z對應(yīng)的好友關(guān)系強(qiáng)度分布中采樣得到社交網(wǎng)絡(luò)中自我節(jié)點(diǎn)u的新朋友節(jié)點(diǎn)I ; (3-6)用/7(^)(吣表示社交網(wǎng)絡(luò)中自我節(jié)點(diǎn)u在時間段Ti的朋友節(jié)點(diǎn)集合,用丨/3;5)表示在時間段Ti社交網(wǎng)絡(luò)自我節(jié)點(diǎn)u選擇z作為中介人的次數(shù),用表示在時間段Ti中介人z選擇z的朋友y'交互的次數(shù),用¥^;丨)表示在時間段Ti中介人z將朋友y'推薦給別人的次數(shù); (4)對于時間段Ti: 若上一時間段IV1之前,社交網(wǎng)絡(luò)自我節(jié)點(diǎn)u和朋友節(jié)點(diǎn)V已經(jīng)是朋友,則先驗(yàn)參數(shù) 和先驗(yàn)參數(shù)PS 分別為:(Ti) I (Ti1) I η (T1-1)^UfV — 2.^UfV + ^UtV β(Τ — I.β(Τ -ι) I 4Cr1-1) _L ψ(Τι-ι)Hu,v —八 Hu,V 1 Ilu,v 1 1 u,v 其中,表示在時間段Th自我節(jié)點(diǎn)u選擇朋友V作為中介人的次數(shù),O)表示在時間段IV1自我節(jié)點(diǎn)u作為中介人與朋友節(jié)點(diǎn)V交互的次數(shù),表示在時間段IV1自我節(jié)點(diǎn)u作為中介人將朋友節(jié)點(diǎn)V推薦給社交網(wǎng)絡(luò)中其他用戶的次數(shù),λ為衰減系數(shù),取值范圍為O 1,為在IV1時間段自我節(jié)點(diǎn)u的中介偏好概率分布的先驗(yàn)參數(shù)中與朋友節(jié)點(diǎn)V相應(yīng)的先驗(yàn)值,βΖ^1)為在TV1時間段自我節(jié)點(diǎn)u的好友關(guān)系強(qiáng)度分布先驗(yàn)參數(shù)中與朋友節(jié)點(diǎn)V相應(yīng)的先驗(yàn)值; 若自我節(jié)點(diǎn)u和朋友節(jié)點(diǎn)V是上一時間段IV1中的新朋友,則先驗(yàn)參數(shù)和先驗(yàn)參
全文摘要
本發(fā)明涉及一種社交網(wǎng)絡(luò)中的朋友關(guān)系傳遞樹的建立方法,屬于計算機(jī)數(shù)據(jù)挖掘技術(shù)領(lǐng)域。為每個自我節(jié)點(diǎn)建立朋友關(guān)系傳遞樹,添加自我節(jié)點(diǎn)和朋友節(jié)點(diǎn)。在每個時間段,建立社交行為概率生成模型,初始化自我節(jié)點(diǎn)的中介偏好概率分布和好友關(guān)系強(qiáng)度分布的先驗(yàn)參數(shù)以及每個自我節(jié)點(diǎn)和新朋友節(jié)點(diǎn)的候選中介人,并不斷迭代更新候選中介人,將迭代過程中被采樣次數(shù)最多的候選中介人z指定為自我節(jié)點(diǎn)u和新朋友節(jié)點(diǎn)y之間的中介人,并在自我節(jié)點(diǎn)u的社交網(wǎng)絡(luò)中添加z→y。本發(fā)明方法基于好友關(guān)系傳遞性對用戶在社交網(wǎng)絡(luò)中的行為進(jìn)行建模,提供扁平社交網(wǎng)絡(luò)的層次化呈現(xiàn)方法,便于深入分析社交網(wǎng)絡(luò)的成因與內(nèi)在結(jié)構(gòu),預(yù)測社交網(wǎng)絡(luò)未來的發(fā)展與變化。
文檔編號G06F17/30GK103077247SQ20131002696
公開日2013年5月1日 申請日期2013年1月17日 優(yōu)先權(quán)日2013年1月17日
發(fā)明者王建民, 王朝坤, 張君 申請人:清華大學(xué)