1, R,),在本實(shí)例中,目標(biāo)用戶第一條轉(zhuǎn)發(fā)鏈與第四條轉(zhuǎn)發(fā)鏈的相似度simd R4)計(jì)算結(jié)果為 〇,第四條轉(zhuǎn)發(fā)鏈與第五條轉(zhuǎn)發(fā)鏈的相似度sim(R4, R5)計(jì)算結(jié)果為1/9。
[0047] 至此,算法得到目標(biāo)用戶所有轉(zhuǎn)發(fā)鏈兩兩之間的相似度計(jì)算結(jié)果,
[0048]
[0049] 對相似度計(jì)算結(jié)果進(jìn)行可視化分析可以得到對稱的矩陣可視化熱度圖,通過可 視化熱度圖本實(shí)例中用戶的操作中信息流向的聚集行為得到直觀體現(xiàn)。在此給出實(shí)施例中 的可視化熱度圖結(jié)果說明,圖中每一個(gè)方形色塊代表一個(gè)轉(zhuǎn)發(fā)鏈對,對應(yīng)的橫縱坐標(biāo)表示 轉(zhuǎn)發(fā)鏈的編號值,當(dāng)相似度為〇時(shí)色塊顏色為純紅色,當(dāng)相似度越接近于1時(shí),色塊由紅變 黃逐漸變白,當(dāng)相似度為1時(shí),色塊顏色為純白,表明當(dāng)前兩條轉(zhuǎn)發(fā)鏈存在完全一致的信息 流向。由于專利不收彩圖,所以只能用灰度圖來表示。
[0050] C、根據(jù)B步計(jì)算的相似度計(jì)算值sim(Ri, Rj)獲取候選的推薦對象用戶,并計(jì)算每 一個(gè)候選的推薦對象的權(quán)重值。
[0051] 進(jìn)一步地,所述步驟C具體包括:
[0052] C1、確定候選的推薦對象用戶集合。
[0053] C2、根據(jù)轉(zhuǎn)發(fā)鏈相似度計(jì)算結(jié)果給每一條轉(zhuǎn)發(fā)鏈上的候選推薦對象計(jì)算權(quán)重值。
[0054] C3、加和所有轉(zhuǎn)發(fā)鏈上的權(quán)重值計(jì)算結(jié)果
[0055] 進(jìn)一步地,所述步驟Cl具體包括:
[0056] C11、設(shè)目標(biāo)用戶u的所有轉(zhuǎn)發(fā)鏈集合為Uu= {R p R2,…,RJ。根據(jù)Bl中對轉(zhuǎn)發(fā) 鏈數(shù)據(jù)的定義,轉(zhuǎn)發(fā)鏈R1和轉(zhuǎn)發(fā)鏈R i上的共同用戶集合S U可以由R i n R j得到,設(shè)S U表 示為= …
[0057] C12、設(shè)目標(biāo)用戶轉(zhuǎn)發(fā)鏈集合Uu中所有相似度不為0的轉(zhuǎn)發(fā)鏈中所有重復(fù)出現(xiàn)在2 個(gè)或以上轉(zhuǎn)發(fā)鏈數(shù)據(jù)中的用戶編號定義為候選的推薦對象用戶。設(shè)D1為轉(zhuǎn)發(fā)鏈R i上所有 候選的推薦對象用戶的集合,則D1可由如下公式計(jì)算:
[0059] C14、對目標(biāo)用戶所有轉(zhuǎn)發(fā)鏈上候選的推薦對象用戶構(gòu)成的集合?,則可以由如下 公式計(jì)算:
[0061] 所述步驟C2具體包括:
[0062] C21、給所有的存在與其它轉(zhuǎn)發(fā)鏈相似度不為0的轉(zhuǎn)發(fā)鏈1單位的分配權(quán)重。
[0063] C22、根據(jù)步驟B中所得的轉(zhuǎn)發(fā)鏈相似度計(jì)算結(jié)果,轉(zhuǎn)發(fā)鏈R1上的任意一個(gè)候選的
[0064] C23、反復(fù)執(zhí)行步驟C22直到所有轉(zhuǎn)發(fā)鏈上所有的候選的推薦對象所得的分配權(quán) 重值全部被單獨(dú)計(jì)算完畢。
[0065] 所述步驟C3具體包括:
[0066] C31、設(shè)I (u1,Di)為判定函數(shù),如果U1G Djj函數(shù)返回值為1,否則為0。
[0067] C32、根據(jù)步驟C2中計(jì)算得到的每個(gè)轉(zhuǎn)發(fā)鏈上候選推薦對象所得的權(quán)重值,進(jìn)行 求和操作,得到全體候選用戶集合?中每個(gè)用戶的最終權(quán)重值,可由如下公式計(jì)算:
[0069] 至此,所有候選的推薦對象所得的權(quán)重值全部計(jì)算完畢,所有候選的推薦對象獲 得的權(quán)重值保存在數(shù)據(jù)記錄文件中。
[0070] D、根據(jù)步驟C中計(jì)算得到的候選的推薦對象權(quán)重值大小,將候選的推薦對象用戶 進(jìn)行降序排序,權(quán)重值越大的用戶越靠前,也越可能被推薦,根據(jù)推薦系統(tǒng)的具體需求產(chǎn) 生前1、前5、前10等不同集合大小的推薦結(jié)果。在本實(shí)例中,前1的推薦結(jié)果為311860 號用戶,對應(yīng)的權(quán)重值為2. 125992。前5的推薦結(jié)果為311860號用戶,對應(yīng)的權(quán)重值為 2.125992、19930號用戶,對應(yīng)的權(quán)重值為0.9285714、788701號用戶,對應(yīng)的權(quán)重值為0.8、 6312241號用戶,對應(yīng)的權(quán)重值為0. 2、838588號用戶,對應(yīng)的權(quán)重值為0. 2。本算法與隨機(jī) 猜測算法、根據(jù)操作頻數(shù)產(chǎn)生的流行度推薦算法從查準(zhǔn)率、查全率和Fl指數(shù)三個(gè)指標(biāo)上進(jìn) 行對比,推薦效果取得了明顯的提升。
【主權(quán)項(xiàng)】
1. 一種基于轉(zhuǎn)發(fā)鏈相似度的用戶關(guān)注對象推薦計(jì)算方法,其特征在于包括: A、 根據(jù)目標(biāo)用戶的所有收藏條目進(jìn)行轉(zhuǎn)發(fā)數(shù)據(jù)的采集,根據(jù)收藏條目中轉(zhuǎn)發(fā)自何人的 數(shù)據(jù),獲取每一條收藏條目到原始收藏條目的數(shù)據(jù);從當(dāng)前收藏條目開始向父級爬取數(shù)據(jù); 根據(jù)轉(zhuǎn)發(fā)自何處這一數(shù)據(jù)作為指導(dǎo),一直追溯到原始收藏條目位置;在追溯過程中的每一 個(gè)結(jié)點(diǎn)都是原始收藏條目的一個(gè)拷貝,而由這些結(jié)點(diǎn)構(gòu)成了一條鏈狀的路徑圖,稱之為轉(zhuǎn) 發(fā)鏈;每個(gè)轉(zhuǎn)發(fā)鏈均由一個(gè)包含若干收藏條目的集合構(gòu)成;以每個(gè)轉(zhuǎn)發(fā)的收藏條目的創(chuàng)建 用戶來代表該轉(zhuǎn)發(fā)鏈上的一個(gè)結(jié)點(diǎn); B、 對于目標(biāo)用戶的所有轉(zhuǎn)發(fā)鏈數(shù)據(jù)構(gòu)成的集合,取集合中的所有兩兩轉(zhuǎn)發(fā)鏈組合,對 組合求取轉(zhuǎn)發(fā)鏈相似度值; C、 根據(jù)B步計(jì)算的相似度計(jì)算值獲取候選的推薦對象用戶,并計(jì)算每一個(gè)候選的推薦 對象的權(quán)重值; D、 根據(jù)步驟C中計(jì)算得到的候選的推薦對象權(quán)重值大小,將候選的推薦對象用戶進(jìn)行 降序排序,權(quán)重值越大的用戶越靠前,也越可能被推薦。2. 如權(quán)利要求1所述的方法,其特征在于,所述步驟B具體包括: B1、定義目標(biāo)用戶轉(zhuǎn)發(fā)鏈集合中轉(zhuǎn)發(fā)鏈數(shù)據(jù)的具體表達(dá)式;將一條轉(zhuǎn)發(fā)鏈數(shù)據(jù)以轉(zhuǎn)發(fā) 鏈上各個(gè)節(jié)點(diǎn)收藏條目的創(chuàng)建用戶的編號為標(biāo)記,以鏈表的形式表示為R = {Pl,P2, P3,… ,Pn I〈Pi,Pi+1> e Ej1G s} ;n表示轉(zhuǎn)發(fā)鏈的長度,Pn為當(dāng)前的收藏條目,E為轉(zhuǎn)發(fā)關(guān)系集合,S 為原始收藏條目集合;將每一條轉(zhuǎn)發(fā)鏈數(shù)據(jù)的最后兩個(gè)結(jié)點(diǎn)Pn :和Pn去除; B2、計(jì)算轉(zhuǎn)發(fā)鏈之間轉(zhuǎn)換的最小操作代價(jià);設(shè)在轉(zhuǎn)發(fā)鏈結(jié)構(gòu)的鏈表中存在插入一個(gè)結(jié) 點(diǎn)、刪除一個(gè)結(jié)點(diǎn)和以另一個(gè)結(jié)點(diǎn)替換當(dāng)前結(jié)點(diǎn)這三種基本操作,每個(gè)操作所要花費(fèi)的代 價(jià)均為1 ;則長度為k的轉(zhuǎn)發(fā)鏈民通過三種基本操作變?yōu)殚L度為1的轉(zhuǎn)發(fā)鏈R ,所需的最 小操作代價(jià)Cost (R1, R,)通過回溯搜索算法計(jì)算得到; B3、根據(jù)上一步的計(jì)算結(jié)果Cost (R1, Rj),計(jì)算轉(zhuǎn)發(fā)鏈民和轉(zhuǎn)發(fā)鏈R ^的相似度 SimdRj);相似度SimdRj)的計(jì)算公式如下:max{k, 1}表示求取k和1中的最大值。3. 如權(quán)利要求1所述的方法,其特征在于,所述步驟C具體包括: C1、確定候選的推薦對象用戶集合; C2、根據(jù)轉(zhuǎn)發(fā)鏈相似度計(jì)算結(jié)果給每一條轉(zhuǎn)發(fā)鏈上的候選推薦對象計(jì)算權(quán)重值; C3、加和所有轉(zhuǎn)發(fā)鏈上的權(quán)重值計(jì)算結(jié)果。4. 如權(quán)利要求3所述的方法,其特征在于,所述步驟Cl具體包括: C11、設(shè)目標(biāo)用戶u的所有轉(zhuǎn)發(fā)鏈集合為Tu= (R1, R2,…,RJ,其中η表示目標(biāo)用戶所包 含的所有收藏條目個(gè)數(shù);根據(jù)步驟Bl中對轉(zhuǎn)發(fā)鏈數(shù)據(jù)的定義,轉(zhuǎn)發(fā)鏈R1和轉(zhuǎn)發(fā)鏈Rj上的共 同用戶集合Sli R與到,設(shè)S u表示為,m表示Sli j中用戶 的總數(shù); C12、設(shè)D1為轉(zhuǎn)發(fā)鏈R i上所有候選的推薦對象用戶的集合,則D i由公式計(jì)算,其中η表示目標(biāo)用戶所包含的所有收藏條目個(gè)數(shù),U為求并集符號; C13、對目標(biāo)用戶所有轉(zhuǎn)發(fā)鏈集合Tu上候選的推薦對象用戶構(gòu)成的集合Θ,則由如下 公式計(jì)算:Θ二Ui1島,其中η表示目標(biāo)用戶所包含的所有收藏條目個(gè)數(shù),U為求并集符 號。5. 如權(quán)利要求3所述的方法,其特征在于,所述步驟C2具體包括: C21、給所有的存在與其它轉(zhuǎn)發(fā)鏈相似度不為O的轉(zhuǎn)發(fā)鏈1單位的分配權(quán)重; C22、根據(jù)步驟B中所得的轉(zhuǎn)發(fā)鏈相似度計(jì)算結(jié)果,轉(zhuǎn)發(fā)鏈R1上的任意一個(gè)候選的推薦 對象U1所得到的分配權(quán)重值weight (U1)為其中j為 枚舉用的臨時(shí)變量,η表示目標(biāo)用戶所包含的所有收藏條目個(gè)數(shù),Sli,表示轉(zhuǎn)發(fā)鏈R i和轉(zhuǎn)發(fā) 鏈1^上的共同用戶集合; C23、反復(fù)執(zhí)行步驟C22直到所有轉(zhuǎn)發(fā)鏈上所有的候選的推薦對象所得的分配權(quán)重值 全部被單獨(dú)計(jì)算完畢。6. 如權(quán)利要求3所述的方法,其特征在于,所述步驟C3具體包括: C31、設(shè)I(U11D1)為判定函數(shù),如果U1G D屬函數(shù)返回值為1,否則為O ; C32、根據(jù)步驟C2中計(jì)算得到的每個(gè)轉(zhuǎn)發(fā)鏈上候選推薦對象所得的權(quán)重值,進(jìn)行求和 操作,得到全體候選用戶集合Θ中每個(gè)用戶的最終權(quán)重值:其中,Θ表示目標(biāo)用戶所有轉(zhuǎn)發(fā)鏈上候選的推薦對象用戶構(gòu)成的集合,u表示等待計(jì) 算的候選用戶對象,U1表示當(dāng)前等待計(jì)算的候選對象u在第i條轉(zhuǎn)發(fā)鏈上環(huán)境下的標(biāo)記, weight (U1)表示當(dāng)前等待計(jì)算的候選對象在第i條轉(zhuǎn)發(fā)鏈上所得到的分配權(quán)重值,η表示 目標(biāo)用戶所包含的所有收藏條目個(gè)數(shù); 至此,所有候選的推薦對象所得的權(quán)重值全部計(jì)算完畢。
【專利摘要】一種基于轉(zhuǎn)發(fā)鏈相似度的用戶關(guān)注對象推薦計(jì)算方法,涉及網(wǎng)絡(luò)分析和推薦系統(tǒng)領(lǐng)域。本發(fā)明獲取收藏條目到原始收藏條目的數(shù)據(jù),以轉(zhuǎn)發(fā)的收藏條目的創(chuàng)建用戶來代表該轉(zhuǎn)發(fā)鏈上的結(jié)點(diǎn);引入最小操作代價(jià)函數(shù)作為相似度計(jì)算的初步輸入;結(jié)合轉(zhuǎn)發(fā)鏈長度以及轉(zhuǎn)發(fā)鏈的信息流向根據(jù)最小操作代價(jià)值計(jì)算轉(zhuǎn)發(fā)鏈間的相似度;根據(jù)轉(zhuǎn)發(fā)鏈之間相同用戶節(jié)點(diǎn)產(chǎn)生候選的推薦用戶,利用目標(biāo)用戶轉(zhuǎn)發(fā)鏈集合中轉(zhuǎn)發(fā)鏈數(shù)據(jù)兩兩之間的相似度,結(jié)合轉(zhuǎn)發(fā)鏈路徑長度以及轉(zhuǎn)發(fā)鏈上的候選用戶密度對候選推薦用戶目標(biāo)計(jì)算推薦權(quán)重值;對候選用戶權(quán)重值排序產(chǎn)生推薦結(jié)果。本發(fā)明利用用戶的轉(zhuǎn)發(fā)行為及轉(zhuǎn)發(fā)對應(yīng)的關(guān)系數(shù)據(jù)進(jìn)行用戶的潛在關(guān)注對象挖掘,實(shí)現(xiàn)用戶關(guān)注推薦。
【IPC分類】G06Q50/00, G06F17/30
【公開號】CN105069003
【申請?zhí)枴緾N201510331056
【發(fā)明人】毋立芳, 荊羽晨, 王丹, 馮澤猛, 張加楠
【申請人】北京工業(yè)大學(xué)
【公開日】2015年11月18日
【申請日】2015年6月15日