本發(fā)明涉及社交關系網(wǎng)絡技術,尤其涉及一種微博用戶影響力計算方法及裝置。
背景技術:
隨著互聯(lián)網(wǎng)的發(fā)展,微博應用越來越廣泛。微博平臺上用戶與用戶相互之間的關系構成了一個巨大的社交關系網(wǎng)絡,其中,每個微博用戶為所述社交關系網(wǎng)絡中的節(jié)點,點名關系、評論關系和轉發(fā)關系為所述社交關系網(wǎng)絡中的邊。這里,評論關系和轉發(fā)關系是微博用戶使用率最高的微博功能;一方面,微博用戶習慣于評論和轉發(fā)自己關注的微博用戶發(fā)布的相關微博;另一方面,微博用戶會不斷發(fā)現(xiàn)新的微博用戶發(fā)布的微博并進行評論和轉發(fā)。
現(xiàn)有技術中,計算微博用戶影響力時主要使用數(shù)據(jù)挖掘領域中的圖算法;這里,所謂微博用戶影響力為量化計算微博用戶之間的影響關系。需要說明的是,當數(shù)據(jù)量較大時,計算微博用戶影響力還需要使用并行的圖挖掘算法。具體地,計算所述微博用戶影響力的步驟如下:
首先,根據(jù)微博用戶之間的關系構建社交關系網(wǎng)絡圖,社交關系網(wǎng)絡圖一般為有向圖。這里,每個微博用戶作為所述社交關系網(wǎng)絡圖中的每個節(jié)點,且每個微博用戶都有一條有向邊指向他所關注的微博用戶。其中,所述有向邊代表微博用戶的影響力對他所關注的微博用戶的影響力有一定的支持作用。當一個微博用戶有很多影響力較大的粉絲時,毫無疑問所述微博用戶也具有較大的影響力,因此,所述社交關系網(wǎng)絡圖符合實際原理。
其次,在構建好的社交關系網(wǎng)絡圖中運行圖排序算法,以對社交關系網(wǎng)絡圖中的節(jié)點重要性進行分析,所述節(jié)點重要性即為微博用戶影響力。當數(shù)據(jù)量 較大時,需要運行并行圖排序算法在分布式系統(tǒng)中進行計算。計算出來的表征節(jié)點重要性的數(shù)值即為微博用戶影響力大小在數(shù)值上的體現(xiàn),這里,進行排序可以計算出微博用戶影響力的相對排名。
目前,比較流行的圖排序算法主要有佩奇排名(PageRank,PR)算法,PageRank算法是谷歌(Google)創(chuàng)始人之一拉里·佩奇(Larry Page)早期構建搜索引擎原型系統(tǒng)時提出的鏈接分析方法,許多早期的搜索引擎都采用了PageRank算法以識別網(wǎng)頁的權威性。PageRank算法不僅考慮了網(wǎng)頁的入鏈數(shù)量,還考慮了網(wǎng)頁入鏈的質量。PageRank算法主要基于兩個假設:第一,當一個網(wǎng)頁在網(wǎng)絡中被其他網(wǎng)頁鏈接的次數(shù)越多,則所述網(wǎng)頁的重要性越高。第二,指向網(wǎng)頁的入鏈質量有所不同。具體地,質量高的入鏈會給所述網(wǎng)頁帶來更高的權重,因此,指向網(wǎng)頁的入鏈質量越高,所述網(wǎng)頁的重要程度也越高。
在計算微博用戶影響力時,PageRank算法也完全適用,即,微博用戶的關注者越多,微博用戶影響力越大。此外,微博用戶的關注者中影響力高的關注者越多,微博用戶影響力越大。在PageRank算法的初始階段,每個網(wǎng)頁被賦予相同的權值。根據(jù)社交關系網(wǎng)絡的連接關系,每一輪PageRank值的計算都會更新節(jié)點的權值。在更新過程中,每個網(wǎng)頁將當前的PageRank值平均分配給網(wǎng)頁包含的出鏈上,同時每個網(wǎng)頁頁面得到其入鏈傳入的全部權值。如此迭代重復上述過程,當整個社交關系網(wǎng)絡中的權值基本穩(wěn)定,PageRank算法停止。此時,每個節(jié)點的權值就是網(wǎng)頁頁面最終的PageRank值。
尤其地,計算微博用戶影響力通常使用加權PageRank算法,加權PageRank算法使用微博用戶之間的聯(lián)系緊密度對社交關系網(wǎng)絡圖中的邊進行加權,這里,微博用戶之間的聯(lián)系緊密度主要根據(jù)微博用戶之間的相互轉發(fā)和評論的頻率進行衡量;將所述社交關系網(wǎng)絡圖中的每條邊加權之后得到加權有向圖,然后運行加權PageRank算法。在加權PageRank算法中,在每一次迭代時,各個節(jié)點不是將自己的PR值平均傳給自己的鄰居節(jié)點,而是根據(jù)邊的權值比例來分配PR值,即所述邊的權值占節(jié)點所有向外的邊權值之和的比例。加權PageRank算法體現(xiàn)了微博用戶之間交往的差異性,使得計算得出的微博用戶影響力更加 接近于現(xiàn)實中的微博用戶影響力。
現(xiàn)有技術中的微博用戶影響力計算方法的缺陷和不足,具體表現(xiàn)為如下幾點:首先,現(xiàn)有技術中的微博用戶影響力算法僅利用微博用戶和微博用戶之間的交往關系,并沒有考慮到微博的作用;這里,微博是信息傳播的主要媒介,因此對微博用戶影響力有很大的促進作用。利用微博和微博用戶的相互作用關系計算得到的微博用戶影響力比僅使用微博用戶和微博用戶之間的交往關系計算得到的微博用戶影響力更符合實際情況。
其次,現(xiàn)有技術中的微博用戶影響力算法只是單純的計算微博用戶的表象影響力,并沒有考慮到虛假用戶對計算結果的干擾。眾所周知,微博用戶中充斥著大量的虛假用戶,一般將虛假用戶分別命名為水軍用戶和僵尸用戶,水軍用戶雇傭大批僵尸用戶轉發(fā)和評論自己的微博,造成水軍用戶影響力很大的假象。這種現(xiàn)象會導致計算結果被假象干擾,從而導致計算出的微博用戶影響力不是微博用戶的真實影響力。
技術實現(xiàn)要素:
有鑒于此,本發(fā)明實施例期望提供一種微博用戶影響力計算方法及裝置,不僅能使計算得到的微博用戶影響力更加科學合理,而且能使計算得到的所述微博用戶的最終影響力更加接近微博用戶的真實影響力。
為達到上述目的,本發(fā)明實施例的技術方案是這樣實現(xiàn)的:
本發(fā)明實施例提供了一種微博用戶影響力計算方法,包括:
為微博用戶構建傳播模型;
根據(jù)所述傳播模型和加權佩奇排名PageRank算法計算所述微博用戶的影響力;
根據(jù)所述微博用戶的影響力計算所述微博用戶的影響力真實性系數(shù);
根據(jù)所述微博用戶的影響力真實性系數(shù)計算所述微博用戶的最終影響力。
上述方案中,所述傳播模型包括:用戶至用戶傳播模型、用戶至微博傳播模型和用戶至微博至用戶傳播模型。
上述方案中,所述根據(jù)所述傳播模型和加權PageRank算法計算所述微博用戶的影響力包括:
根據(jù)所述用戶至用戶傳播模型和所述加權PageRank算法計算所述微博用戶的第一影響力,根據(jù)所述用戶至微博傳播模型和所述加權PageRank算法計算所述微博用戶的第二影響力,根據(jù)所述用戶至微博至用戶傳播模型和所述加權PageRank算法計算所述微博用戶的第三影響力。
上述方案中,所述根據(jù)所述微博用戶的影響力計算所述微博用戶的影響力真實性系數(shù)包括:
根據(jù)所述微博用戶的第一影響力和所述微博用戶的第二影響力分別計算所述微博用戶的第一影響力排名和所述微博用戶的第二影響力排名;
根據(jù)所述微博用戶的第一影響力排名和所述微博用戶的第二影響力排名計算所述微博用戶的影響力真實性系數(shù),其中,所述微博用戶的影響力真實性系數(shù)為1與所述微博用戶的第一影響力排名減去所述微博用戶的第二影響力排名再除以微博用戶數(shù)目之后的平方再相減。
上述方案中,所述微博用戶的最終影響力為所述微博用戶的第三影響力與所述微博用戶的影響力真實性系數(shù)的乘積。
上述方案中,所述根據(jù)所述用戶至用戶傳播模型和所述加權PageRank算法計算所述微博用戶的第一影響力包括:
所述加權PageRank算法根據(jù)所有第一加權因子計算所述微博用戶的第一影響力,其中,每個所述第一加權因子為其他每個微博用戶點名所述微博用戶的次數(shù)和評論所述微博用戶發(fā)布的微博的次數(shù)之和與所述其他每個微博用戶點名和評論的總次數(shù)相除;
所述根據(jù)所述用戶至微博傳播模型和所述加權PageRank算法計算所述微博用戶的第二影響力包括:
所述加權PageRank算法根據(jù)所有第二加權因子計算所述微博用戶的第二影響力,其中,每個所述第二加權因子為所述其他每個微博用戶轉發(fā)和評論所述微博用戶發(fā)布的微博的次數(shù)之和與所述其他每個微博用戶轉發(fā)和評論的總次 數(shù)相除;
所述根據(jù)所述用戶至微博至用戶傳播模型和所述加權PageRank算法計算所述微博用戶的第三影響力包括:
所述加權PageRank算法根據(jù)所述所有第一加權因子和所述所有第二加權因子計算所述微博用戶的第三影響力。
本發(fā)明實施例還提供了一種微博用戶影響力計算裝置,包括:
傳播模型構建模塊,用于為微博用戶構建傳播模型;
影響力計算模塊,用于根據(jù)所述傳播模型和加權PageRank算法計算所述微博用戶的影響力;
影響力真實性系數(shù)計算模塊,用于根據(jù)所述微博用戶的影響力計算所述微博用戶的影響力真實性系數(shù);
最終影響力計算模塊,用于根據(jù)所述微博用戶的影響力真實性系數(shù)計算所述微博用戶的最終影響力。
上述方案中,所述傳播模型構建模塊為所述微博用戶構建的所述傳播模型包括:用戶至用戶傳播模型、用戶至微博傳播模型和用戶至微博至用戶傳播模型。
上述方案中,所述影響力計算模塊包括:
第一影響力計算單元,用于根據(jù)所述用戶至用戶傳播模型和所述加權PageRank算法計算所述微博用戶的第一影響力;
第二影響力計算單元,用于根據(jù)所述用戶至微博傳播模型和所述加權PageRank算法計算所述微博用戶的第二影響力;
第三影響力計算單元,用于根據(jù)所述用戶至微博至用戶傳播模型和所述加權PageRank算法計算所述微博用戶的第三影響力。
上述方案中,所述影響力真實性系數(shù)計算模塊包括:
影響力排名計算單元,用于根據(jù)所述微博用戶的第一影響力和所述微博用戶的第二影響力分別計算所述微博用戶的第一影響力排名和所述微博用戶的第二影響力排名;
影響力真實性系數(shù)計算單元,用于根據(jù)所述微博用戶的第一影響力排名和所述微博用戶的第二影響力排名計算所述微博用戶的影響力真實性系數(shù),其中,所述微博用戶的影響力真實性系數(shù)為1與所述微博用戶的第一影響力排名減去所述微博用戶的第二影響力排名再除以微博用戶數(shù)目之后的平方再相減。
本發(fā)明實施例所提供的微博用戶影響力計算方法及裝置,由微博用戶影響力計算裝置為微博用戶構建傳播模型;所述微博用戶影響力計算裝置先根據(jù)所述傳播模型和加權PageRank算法計算所述微博用戶的影響力;再根據(jù)所述微博用戶的影響力計算所述微博用戶的影響力真實性系數(shù);之后,根據(jù)所述微博用戶的影響力真實性系數(shù)計算所述微博用戶的最終影響力。由于本發(fā)明實施例基于傳播模型計算所述微博用戶的最終影響力,這樣,不但綜合考慮了微博用戶之間的交往關系和微博在信息傳播中的重要作用;而且,利用微博和微博用戶的相互支持作用使得計算出的微博用戶影響力更加科學、全面、合理;同時,本發(fā)明實施例根據(jù)用戶至用戶傳播模型、用戶至微博傳播模型計算所述微博用戶的影響力真實性系數(shù),使得微博用戶影響力得到修正,從而在一定程度上排除了虛假用戶對微博用戶影響力的干擾;消除了僵尸用戶和水軍用戶的影響,進而使得計算得到的所述微博用戶的最終影響力更加接近真實的微博用戶影響力。
附圖說明
圖1為本發(fā)明實施例1提供的微博用戶影響力計算方法的實現(xiàn)流程示意圖;
圖2為本發(fā)明實施例1提供的用戶關系網(wǎng)絡圖;
圖3為本發(fā)明實施例1提供的微博用戶影響力計算方法的另一實現(xiàn)流程示意圖;
圖4為本發(fā)明實施例2提供的微博用戶影響力計算裝置的組成結構示意圖。
具體實施方式
本發(fā)明實施例中,由微博用戶影響力計算裝置為微博用戶構建傳播模型; 所述微博用戶影響力計算裝置先根據(jù)所述傳播模型和加權PageRank算法計算所述微博用戶的影響力;再根據(jù)所述微博用戶的影響力計算所述微博用戶的影響力真實性系數(shù);之后,根據(jù)所述微博用戶的影響力真實性系數(shù)計算所述微博用戶的最終影響力。
下面結合附圖及具體實施例對本發(fā)明再做進一步詳細的說明。
實施例1
圖1為本發(fā)明實施例1提供的微博用戶影響力計算方法的實現(xiàn)流程示意圖,如圖1所示,所述方法包括:
步驟110:為微博用戶構建傳播模型。
在步驟110中,所述傳播模型包括:用戶至用戶傳播模型、用戶至微博傳播模型和用戶至微博至用戶傳播模型。
具體地,微博用戶影響力計算裝置分別為微博用戶構建用戶至用戶傳播模型、用戶至微博傳播模型和用戶至微博至用戶傳播模型。所述分別構建用戶至用戶傳播模型、用戶至微博傳播模型和用戶至微博至用戶傳播模型包括:
構建用戶關系網(wǎng)絡圖,根據(jù)所述用戶關系網(wǎng)絡圖構建所述用戶至用戶傳播模型;
構建用戶至微博關系網(wǎng)絡圖,根據(jù)所述用戶至微博關系網(wǎng)絡圖構建所述用戶至微博傳播模型;
根據(jù)所述用戶關系網(wǎng)絡圖和所述用戶至微博關系網(wǎng)絡圖構建用戶至微博至用戶網(wǎng)絡超圖,根據(jù)所述用戶至微博至用戶網(wǎng)絡超圖構建所述用戶至微博至用戶傳播模型。
如圖2所示,所述微博用戶影響力計算裝置根據(jù)所述用戶關系網(wǎng)絡圖,以構建所述用戶至用戶傳播模型。具體地,圖2中的節(jié)點A、B、C、D、E、F、G、H分別代表微博用戶,圖2中的有向邊代表一個微博用戶對另一個微博用戶的點名和評論,其中,所述有向邊的值為第一加權因子。
另外,所述微博用戶影響力計算裝置根據(jù)所述用戶至微博關系網(wǎng)絡圖,以構建所述用戶至微博傳播模型。例如,在用戶至微博關系網(wǎng)絡圖中,微博用戶 j與微博用戶j發(fā)布的微博v各自代表兩種不同類型的節(jié)點,微博用戶j節(jié)點與微博用戶j發(fā)布的微博v節(jié)點之間生成有向邊v→j。當微博用戶節(jié)點i評論或者轉發(fā)微博節(jié)點v會生成有向邊i→v,其中,所述有向邊的值為第二加權因子。微博至用戶邊v→j的權重均記為1,以便微博用戶j發(fā)布的微博生成的影響力快速被反饋給j。在用戶至微博關系網(wǎng)絡圖中,微博用戶和微博根據(jù)邊的方向和權重不斷傳播權重,直到形成穩(wěn)定的微博關系網(wǎng)絡結構。
最后,所述微博用戶影響力計算裝置根據(jù)微博用戶之間的互粉關系和微博用戶與微博的轉發(fā)評論關系,將所述用戶關系網(wǎng)絡圖和所述用戶至微博關系網(wǎng)絡圖融合為一個網(wǎng)絡超圖,即用戶至微博至用戶網(wǎng)絡超圖。其中,所述用戶至微博至用戶網(wǎng)絡超圖既包括微博用戶至微博用戶之間的有向邊,也包括微博用戶至微博、微博至微博用戶之間的有向邊。
步驟120:根據(jù)所述傳播模型和加權PageRank算法計算所述微博用戶的影響力。
如圖3所示,所述根據(jù)所述傳播模型和加權PageRank算法計算所述微博用戶的影響力包括:
根據(jù)所述用戶至用戶傳播模型和所述加權PageRank算法計算所述微博用戶的第一影響力,根據(jù)所述用戶至微博傳播模型和所述加權PageRank算法計算所述微博用戶的第二影響力,根據(jù)所述用戶至微博至用戶傳播模型和所述加權PageRank算法計算所述微博用戶的第三影響力。
進一步地,所述根據(jù)所述用戶至用戶傳播模型和所述加權PageRank算法計算所述微博用戶的第一影響力包括:
所述加權PageRank算法根據(jù)所有第一加權因子計算所述微博用戶的第一影響力,其中,每個所述第一加權因子為其他每個微博用戶點名所述微博用戶的次數(shù)和評論所述微博用戶發(fā)布的微博的次數(shù)之和與所述其他每個微博用戶點名和評論的總次數(shù)相除。
這里,每個所述第一加權因子的計算過程舉例如下:假設微博用戶i在微博應用中采用點名(@)和評論的方式對微博用戶j點名和評論所述微博用戶j 發(fā)布的微博的次數(shù)為Aij;同時,微博用戶i所有點名和評論總次數(shù)為A,則微博用戶i和微博用戶j有向邊的第一加權因子為
需要說明的是,所述微博用戶的第一影響力的取值范圍為0到1之間的小數(shù)。
所述根據(jù)所述用戶至微博傳播模型和所述加權PageRank算法計算所述微博用戶的第二影響力包括:
所述加權PageRank算法根據(jù)所有第二加權因子計算所述微博用戶的第二影響力,其中,每個所述第二加權因子為所述其他每個微博用戶轉發(fā)和評論所述微博用戶發(fā)布的微博的次數(shù)之和與所述其他每個微博用戶轉發(fā)和評論的總次數(shù)相除。
這里,每個所述第二加權因子的計算過程舉例如下:假設微博用戶i至微博用戶j發(fā)布的微博v的有向邊為i→v,微博用戶i所有的轉發(fā)和評論的總次數(shù)為,微博用戶i對于所述微博用戶j發(fā)布的微博v的轉發(fā)和評論次數(shù)之和為Siv,則有向邊i→v的第二加權因子為
需要說明的是,所述微博用戶的第二影響力的取值范圍為0到1之間的小數(shù)。
所述根據(jù)所述用戶至微博至用戶傳播模型和所述加權PageRank算法計算所述微博用戶的第三影響力包括:
所述加權PageRank算法根據(jù)所述所有第一加權因子和所述所有第二加權因子計算所述微博用戶的第三影響力。
需要說明的是,所述微博用戶的第三影響力的取值范圍為0到1之間的小數(shù)。
步驟130:根據(jù)所述微博用戶的影響力計算所述微博用戶的影響力真實性系數(shù)。
如圖3所示,所述根據(jù)所述微博用戶的影響力計算所述微博用戶的影響力 真實性系數(shù)包括:
根據(jù)所述微博用戶的第一影響力和所述微博用戶的第二影響力分別計算所述微博用戶的第一影響力排名和所述微博用戶的第二影響力排名;
根據(jù)所述微博用戶的第一影響力排名和所述微博用戶的第二影響力排名計算所述微博用戶的影響力真實性系數(shù),其中,所述微博用戶的影響力真實性系數(shù)為1與所述微博用戶的第一影響力排名減去所述微博用戶的第二影響力排名再除以微博用戶數(shù)目之后的平方再相減。
例如,所述微博用戶影響力計算裝置根據(jù)所述微博用戶j的第一影響力計算得到微博用戶j的第一影響力排名為UUj,根據(jù)所述微博用戶j的第二影響力計算得到微博用戶j的第二影響力排名為UVj,則所述微博用戶影響力計算裝置計算得到的所述微博用戶j的影響力真實性系數(shù)為:
其中,N為微博應用中的所有微博用戶節(jié)點個數(shù),所述Tj的取值范圍為0到1之間的小數(shù)。
需要說明的是,所述微博用戶的影響力真實性系數(shù)量化反映了所述微博用戶的第一影響力和所述微博用戶的第二影響力之間的差別。所述差別越大,則所述微博用戶的第一影響力和所述微博用戶的第二影響力的可信度越低,因此所述微博用戶的影響力真實性系數(shù)越小。這里,所述微博用戶的影響力真實性系數(shù)使得微博用戶的影響力得到正確的修正。
步驟140:根據(jù)所述微博用戶的影響力真實性系數(shù)計算所述微博用戶的最終影響力。
如圖3所示,根據(jù)所述微博用戶的第三影響力和所述微博用戶的影響力真實性系數(shù)計算所述微博用戶的最終影響力。
這里,所述微博用戶的最終影響力為所述微博用戶的第三影響力與所述微博用戶的影響力真實性系數(shù)的乘積。
例如,微博用戶j的第三影響力值為PRj,所述微博用戶影響力計算裝置使用所述微博用戶j的影響力真實性系數(shù)Tj加權后,得到微博用戶j的最終影響力 為:
至此,微博用戶影響力計算的過程就完成了。
本發(fā)明實施例1提供的微博用戶影響力計算方法并沒有直接根據(jù)用戶至用戶模型、用戶至微博模型進行所述微博用戶影響力的計算。一方面,因為微博應用中存在大量的僵尸用戶,這些僵尸用戶并不活躍,只是通過關注其他微博用戶使得其他微博用戶的影響力得到提高,因此僅根據(jù)微博用戶關系衡量微博用戶影響力會導致計算結果不準確。另一方面,用戶至微博模型中隱藏著大量的水軍用戶,水軍用戶大量轉發(fā)其他微博用戶發(fā)布的微博內容,但是水軍用戶很少發(fā)布微博,這樣將給微博用戶的真實影響力的計算帶來偏差。本發(fā)明實施例1提供的微博用戶影響力計算裝置分別計算所述微博用戶的第一影響力排名和所述微博用戶的第二影響力排名,分析所述微博用戶的第一影響力排名和所述微博用戶的第二影響力排名的偏差量,以衡量微博用戶影響力真實性。如果所述微博用戶的第一影響力排名和所述微博用戶的第二影響力排名較一致,則所述微博用戶的第一影響力排名和所述微博用戶的第二影響力排名較真實。如果所述微博用戶的第一影響力排名和所述微博用戶的第二影響力排名不一致,則所述微博用戶的第一影響力排名和所述微博用戶的第二影響力排名偏差較大,導致微博影響力的計算結果不真實。因此,微博用戶影響力計算裝置設定衡量微博用戶影響力真實性的影響力真實性系數(shù)。
所述微博用戶的影響力真實性系數(shù)反映了所述微博用戶的第一影響力和所述微博用戶的第二影響力之間的差別,差別越大,則微博用戶的影響力可信度越低,因此所述微博用戶的影響力真實性系數(shù)越小。隨后,微博用戶影響力計算裝置根據(jù)所述用戶至微博至用戶傳播模型計算微博用戶的最終影響力。所述用戶至微博至用戶傳播模型綜合考慮了微博用戶與微博用戶之間的關系、微博用戶和微博之間的關系,并使用所述微博用戶的影響力真實性系數(shù)為影響力加權來得到微博用戶的最終影響力??梢钥闯?,本發(fā)明實施例1提供的微博用戶影響力計算方法在一定程度上消除了僵尸用戶和水軍用戶對微博用戶影響力計 算結果的偏差。
需要說明的是,本發(fā)明實施例1提供的微博用戶影響力計算方法基于分布式文件系統(tǒng)(HDFS,Hadoop Distributed File System)和并行框架(HAMA BSP,HAMA Bulk Synchronous Parallel)對大規(guī)模的關系網(wǎng)絡圖進行計算,從而可以處理海量的微博數(shù)據(jù),突破了微博數(shù)據(jù)規(guī)模的限制。
實施例2
圖4為本發(fā)明實施例2提供的微博用戶影響力計算裝置的實現(xiàn)流程示意圖,如圖4所示,所述裝置包括:
傳播模型構建模塊210,用于為微博用戶構建傳播模型。
具體地,所述傳播模型構建模塊210為所述微博用戶構建的所述傳播模型包括:用戶至用戶傳播模型、用戶至微博傳播模型和用戶至微博至用戶傳播模型。
影響力計算模塊220,用于根據(jù)所述傳播模型和加權PageRank算法計算所述微博用戶的影響力。
具體地,所述影響力計算模塊220包括:
第一影響力計算單元221,用于根據(jù)所述用戶至用戶傳播模型和所述加權PageRank算法計算所述微博用戶的第一影響力;
第二影響力計算單元222,用于根據(jù)所述用戶至微博傳播模型和所述加權PageRank算法計算所述微博用戶的第二影響力;
第三影響力計算單元223,用于根據(jù)所述用戶至微博至用戶傳播模型和所述加權PageRank算法計算所述微博用戶的第三影響力。
影響力真實性系數(shù)計算模塊230,用于根據(jù)所述微博用戶的影響力計算所述微博用戶的影響力真實性系數(shù)。
具體地,所述影響力真實性系數(shù)計算模塊230包括:
影響力排名計算單元231,用于根據(jù)所述微博用戶的第一影響力和所述微博用戶的第二影響力分別計算所述微博用戶的第一影響力排名和所述微博用戶的第二影響力排名;
影響力真實性系數(shù)計算單元232,用于根據(jù)所述微博用戶的第一影響力排名和所述微博用戶的第二影響力排名計算所述微博用戶的影響力真實性系數(shù),其中,所述微博用戶的影響力真實性系數(shù)為1與所述微博用戶的第一影響力排名減去所述微博用戶的第二影響力排名再除以微博用戶數(shù)目之后的平方再相減。
最終影響力計算模塊240,用于根據(jù)所述微博用戶的影響力真實性系數(shù)計算所述微博用戶的最終影響力。
具體地,所述最終影響力計算模塊240計算得到的所述微博用戶的最終影響力為所述微博用戶的第三影響力與所述微博用戶的影響力真實性系數(shù)的乘積。
在實際應用中,所述傳播模型構建模塊210、所述影響力計算模塊220、所述影響力真實性系數(shù)計算模塊230、所述最終影響力計算模塊240、第一影響力計算單元221、第二影響力計算單元222、第三影響力計算單元223、影響力排名計算單元231和影響力真實性系數(shù)計算單元232均可由位于任意計算機設備中的中央處理器(CPU,Central Processing Unit)、數(shù)字信號處理器(DSP,Digital Signal Processor)、微處理器(MPU)、或可編程邏輯陣列(FPGA,F(xiàn)ield Programmable Gate Array)實現(xiàn)。
以上所述,僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范圍。