專利名稱:基于多重鏈接的微博網(wǎng)絡(luò)節(jié)點權(quán)重排序方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種微博網(wǎng)絡(luò)節(jié)點權(quán)重排序方法,特別是一種基于多重鏈接的微博網(wǎng)絡(luò)節(jié)點權(quán)重排序方法。
背景技術(shù):
微博網(wǎng)絡(luò)(Micro-Blogging Network)為用戶提供一個互動交流的平臺,豐富了用戶的業(yè)余生活,增強了朋友之間的交流。在傳統(tǒng)的社交網(wǎng)絡(luò)中,節(jié)點權(quán)值主要通過計算用戶好友數(shù)目以及分析用戶之間的結(jié)構(gòu)關(guān)系來計算。通常是分析網(wǎng)絡(luò)結(jié)構(gòu)中的節(jié)點度(Degree),單純考慮出度(Out-Degree) 精確率不高。在微博網(wǎng)絡(luò)中網(wǎng)絡(luò)節(jié)點構(gòu)成有向圖,僅僅考慮出度和入度αη-Degree)也達不到較高的精確度。文獻 1 "Discovering Important Bloggers based on Analyzing Blog Threads [WWW, Chiba, Japan, May 10-14,2005] ”公開了一種基于帖子內(nèi)容分析的博客重要用戶分析方法ThreadRank,該方法通過分析大量的博客內(nèi)容來判斷其用戶的重要性,需要耗費大量的時間用于內(nèi)容清理和分析,效率較低。文獻 2" Identifying Opinion Leaders in the Blogosphere [CIKM, pp. 971-974, 2007]”公開了一種意見領(lǐng)袖識別方法化打此?。、?^!^,該方法根據(jù)與其他博客相比較來判斷用戶的重要性,以及這些用戶對整個網(wǎng)絡(luò)所做的貢獻來計算用戶權(quán)值,該論文采用了余弦定理計算不同博客實體的相似性,復(fù)雜性較高,開銷大。文獻 3 "TwitterRank :Finding topic-sensitive Inuential Twitterers [WSDM, 2010],,公開了一種Twitter網(wǎng)絡(luò)節(jié)點計算方法TwitterRank,該方法根據(jù)Twitter中的用戶關(guān)系、粉絲與關(guān)注者之間的分布以及在信息傳播的過程中各種用戶群體所起到的作用進行權(quán)重計算,該算法主要基于話題進行分析,召回率不高。
發(fā)明內(nèi)容
為了克服現(xiàn)有的微博網(wǎng)絡(luò)節(jié)點權(quán)重排序方法召回率低的不足,本發(fā)明提供一種基于多重鏈接的微博網(wǎng)絡(luò)節(jié)點權(quán)重排序方法,該方法首先將微博網(wǎng)絡(luò)構(gòu)建成網(wǎng)絡(luò)有向圖G = (E,V),再通過定義用戶有效粉絲集合Ef (U),可以大幅度減小網(wǎng)絡(luò)圖規(guī)模,從而提高計算速度;其次,跟蹤節(jié)點消息,記錄節(jié)點消息的發(fā)布、轉(zhuǎn)發(fā)、回復(fù)、收藏等信息,確定節(jié)點附加鏈接關(guān)系,在這一部分中不去分析具體消息的內(nèi)容,從而提高網(wǎng)絡(luò)分析速度;最后,結(jié)合網(wǎng)絡(luò)動態(tài)性,識別并處理網(wǎng)絡(luò)節(jié)點交互,整體上可以降低系統(tǒng)開銷、提高計算方法的準確率和召回率。本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是一種基于多重鏈接的微博網(wǎng)絡(luò)節(jié)點權(quán)重排序方法,其特點是包括以下步驟(a)定義微博網(wǎng)絡(luò)有向圖G= (E,V)
式中,E表示用戶關(guān)系集合,V表示用戶節(jié)點集合。定義用戶的有效粉絲集合 式中,δ是非負常數(shù)閾值,表示用戶節(jié)點u的粉絲用戶ν對用戶u反饋的程度門限,超過該閾值且屬于用戶u的粉絲的用戶才能算作有效粉絲用戶。(b)根據(jù)公式
權(quán)利要求
1. 一種基于多重鏈接的微博網(wǎng)絡(luò)節(jié)點權(quán)重排序方法,其特征在于包括以下步驟(a)定義微博網(wǎng)絡(luò)有向圖G = (E,V)式中,E表示用戶關(guān)系集合,V表示用戶節(jié)點集合;定義用戶的有效粉絲集合Ef(U) = {ν I ν ^ Follower (u) Λ Response (u) > σ }式中,S是非負常數(shù)閾值,表示用戶節(jié)點U的粉絲用戶V對用戶U反饋的程度門限,超過該閾值且屬于用戶U的粉絲的用戶才能算作有效粉絲用戶;(b)根據(jù)公式
全文摘要
本發(fā)明公開了一種基于多重鏈接的微博網(wǎng)絡(luò)節(jié)點權(quán)重排序方法,用于解決現(xiàn)有的微博網(wǎng)絡(luò)節(jié)點權(quán)重排序方法召回率低的技術(shù)問題。技術(shù)方案是將微博網(wǎng)絡(luò)構(gòu)建成網(wǎng)絡(luò)有向圖G=(E,V),再通過定義用戶有效粉絲集合Ef(u),大幅度減小了網(wǎng)絡(luò)圖規(guī)模,從而提高了計算速度。其次,跟蹤節(jié)點消息,記錄節(jié)點消息的發(fā)布、轉(zhuǎn)發(fā)、回復(fù)、收藏等信息,確定節(jié)點附加鏈接關(guān)系,在這一部分中不去分析具體消息的內(nèi)容,從而提高了網(wǎng)絡(luò)分析速度。最后,結(jié)合網(wǎng)絡(luò)動態(tài)性,識別并處理網(wǎng)絡(luò)節(jié)點交互,整體上降低了系統(tǒng)開銷、提高了計算方法的準確率和召回率。
文檔編號G06F17/30GK102214212SQ20111013296
公開日2011年10月12日 申請日期2011年5月20日 優(yōu)先權(quán)日2011年5月20日
發(fā)明者彭冬, 李勇軍, 蔡皖東 申請人:西北工業(yè)大學(xué)