一種微博網(wǎng)絡(luò)中用戶(hù)影響力度量的方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種微博網(wǎng)絡(luò)中用戶(hù)影響力度量的方法,包括以下步驟:1)編寫(xiě)獲取微博用戶(hù)信息及所發(fā)布微博內(nèi)容的程序,再通過(guò)微博平臺(tái)提供的API接口獲取真實(shí)的微博用戶(hù)信息,從所述真實(shí)的微博用戶(hù)信息中提取用戶(hù)所發(fā)微博被閱讀、轉(zhuǎn)發(fā)及評(píng)論的數(shù)量信息;2)得到用戶(hù)的微博影響力It(u)值;3)獲取用戶(hù)的信息傳播影響力Id(u)值;4)根據(jù)用戶(hù)的微博影響力It(u)值及用戶(hù)的信息傳播影響力Id(u)值得用戶(hù)的影響力初始權(quán)值W(u);5)根據(jù)用戶(hù)的影響力初始權(quán)值W(u)迭代計(jì)算用戶(hù)的影響力值I(u),以用戶(hù)的影響力值I(u)度量用戶(hù)在微博網(wǎng)絡(luò)中的影響力。本發(fā)明能夠更加準(zhǔn)確的發(fā)現(xiàn)和識(shí)別微博網(wǎng)絡(luò)中的影響力個(gè)體。
【專(zhuān)利說(shuō)明】一種微博網(wǎng)絡(luò)中用戶(hù)影響力度量的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)與社交網(wǎng)絡(luò)研究領(lǐng)域,涉及一種用戶(hù)影響力度量的 方法,具體涉及一種微博網(wǎng)絡(luò)中用戶(hù)影響力度量的方法。
【背景技術(shù)】
[0002]微博服務(wù)目前已經(jīng)成為最受歡迎的社交網(wǎng)絡(luò)工具之一。截止2013年2月,微博服 務(wù)站點(diǎn)twitter注冊(cè)用戶(hù)數(shù)超過(guò)5億,月活躍用戶(hù)達(dá)到2億,截止2〇13年12月,最大的中文 微博平臺(tái)新浪微博注冊(cè)用戶(hù)數(shù)超過(guò)5億,月度活躍用戶(hù)數(shù)達(dá)到1. 291億。數(shù)以?xún)|計(jì)的活躍 用戶(hù)來(lái)自不同的社會(huì)文化背景,遍布全球,每時(shí)每刻都在這個(gè)平臺(tái)上發(fā)布和傳播各類(lèi)政策、 商業(yè)、文化、教育等社會(huì)生活相關(guān)的信息,這些信息包含著用戶(hù)的各種觀(guān)點(diǎn)、情緒、態(tài)度和狀 態(tài)等,并且能在短時(shí)間內(nèi)傳播到大范圍的人群。
[0003]隨著社交網(wǎng)絡(luò)服務(wù)的快速普及,人們?cè)絹?lái)越習(xí)慣通過(guò)網(wǎng)絡(luò)進(jìn)行交流、參與公眾話(huà) 題、市場(chǎng)營(yíng)銷(xiāo)等。所以研究和理解微博平臺(tái)中的消息傳播機(jī)制,識(shí)別具有話(huà)題影響力的用戶(hù) 變得非常重要。比如市場(chǎng)營(yíng)銷(xiāo)中,企業(yè)希望通過(guò)少數(shù)幾個(gè)甚至一個(gè)具有影響力的用戶(hù)來(lái)最 大化的提升品牌和廣品的推廣效果。搖言控制中,政府或企業(yè)希望能快速定位信息傳播中 有影響力的用戶(hù)并進(jìn)行信息的有效阻斷。但是,如何快速發(fā)現(xiàn)和識(shí)別這些影響力個(gè)體,是一 個(gè)困難并且具有挑戰(zhàn)性的研究。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的在于克服已有影響力個(gè)體識(shí)別方法的不足,提供了一種微博網(wǎng)絡(luò)中 用戶(hù)影響力度量的方法,該方法可以有效度量微博網(wǎng)絡(luò)中用戶(hù)的影響力。
[0005]為達(dá)到上述目的,本發(fā)明所述的微博網(wǎng)絡(luò)中用戶(hù)影響力度量的方法,其特征在于, 包括以下步驟:
[0006] 1)編寫(xiě)獲取微博用戶(hù)信息及用戶(hù)所發(fā)布微博的程序,通過(guò)微博平臺(tái)提供的API接 口獲取真實(shí)的微博用戶(hù)信息,從所述真實(shí)的微博用戶(hù)信息中提取用戶(hù)在微博網(wǎng)絡(luò)中的關(guān)注 關(guān)系及粉絲關(guān)系,并提取用戶(hù)所發(fā)微博被閱讀、轉(zhuǎn)發(fā)及評(píng)論的數(shù)量信息;
[0007] 2)根據(jù)用戶(hù)U所發(fā)微博被閱讀、轉(zhuǎn)發(fā)及評(píng)論的數(shù)量信息計(jì)算得到用戶(hù)U的微博影 響力值I? ;
[0008] 3)在微博粉絲關(guān)系網(wǎng)絡(luò)中,計(jì)算得到用戶(hù)u的信息傳播影響力值Id( u);
[0009] 4)將步驟2)得到的用戶(hù)U的微博影響力值It (u)及步驟3)得到的用戶(hù)u的信息 傳播影響力值Id(u)相加作為用戶(hù)u的影響力初始權(quán)值W(u); _0] 5)根據(jù)步驟4)得到的用戶(hù)U的影響力初始權(quán)值W(U)迭代計(jì)算用戶(hù)u的影響力值 I (u),然后以用戶(hù)u的影響力值I (u)作為用戶(hù)u在微博網(wǎng)絡(luò)中影響力的度量。
[0011]步驟2)中所述用戶(hù)u的微博影響力值Σ + 其中,Rr(x) 為微博X的轉(zhuǎn)發(fā)數(shù)量與閱讀數(shù)量的比值,Cr(x)為微博x的評(píng)論數(shù)量與閱讀數(shù)量的比值, TweetsOi)是用戶(hù)u發(fā)布的原始微博的集合,當(dāng)閱讀數(shù)量為零,則Rr(x)及Cr(x)均為0。 [0012] 步驟3)中用戶(hù)u的信息傳播影響力值Id(u) =D(u)+B(u)+C(u),其中,D(u)為用 戶(hù)u在微博粉絲關(guān)系網(wǎng)絡(luò)中的度中心度,B(u)為介中心度,C(u)是接近中心度,所述微博粉 絲關(guān)系網(wǎng)絡(luò)通過(guò)步驟1)得到的用戶(hù)關(guān)系信息抽取粉絲關(guān)系形成。
[0013] 步驟5 )中 所述用 戶(hù)u的 影 響 力 值 雄^ =喊。,的簡(jiǎn)讀' _咖續(xù)· v關(guān)注的用戶(hù)集合,F(xiàn)ollowers (u)為用戶(hù)u關(guān)注的用戶(hù)集合,U為微博網(wǎng)絡(luò)中所有用戶(hù)的集 合。
[0014] 本發(fā)明具有以下有益效果:
[0015]本發(fā)明所述的微博網(wǎng)絡(luò)中用戶(hù)影響力度量的方法在度量用戶(hù)影響力時(shí),先獲取用 戶(hù)的微博影響力以及用戶(hù)的信息傳播影響力,再根據(jù)用戶(hù)的微博影響力以及用戶(hù)的信息傳 播影響力得到用戶(hù)的影響力初始權(quán)值,然后根據(jù)所述用戶(hù)的影響力初始權(quán)值得到用戶(hù)的影 響力值,最后通過(guò)用戶(hù)的影響力值來(lái)度量用戶(hù)在微博網(wǎng)絡(luò)中的影響力,從而能夠更加準(zhǔn)確 的發(fā)現(xiàn)和識(shí)別微博網(wǎng)絡(luò)中的影響力個(gè)體以及個(gè)體在微博網(wǎng)絡(luò)中的影響力,識(shí)別的準(zhǔn)確率和 召回率好。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0016] 圖1為本發(fā)明的流程圖。
【具體實(shí)施方式】
[0017] 下面結(jié)合附圖對(duì)本發(fā)明做進(jìn)一步詳細(xì)描述:
[0018] 參考圖1,本發(fā)明所述的微博網(wǎng)絡(luò)中用戶(hù)影響力度量的方法包括以下步驟:
[0019] 1)編寫(xiě)獲取微博用戶(hù)信息及用戶(hù)所發(fā)布微博的程序,通過(guò)微博平臺(tái)提供的API接 口獲取真實(shí)的微博用戶(hù)信息,從所述真實(shí)的微博用戶(hù)信息中提取用戶(hù)在微博網(wǎng)絡(luò)中的關(guān)注 關(guān)系及粉絲關(guān)系,并提取用戶(hù)所發(fā)微博被閱讀、轉(zhuǎn)發(fā)及評(píng)論的數(shù)量信息;
[0020] 微博網(wǎng)絡(luò)中用戶(hù)是通過(guò)關(guān)注其他用戶(hù)來(lái)獲取信息的,關(guān)注的用戶(hù)就是被關(guān)注用戶(hù) 的粉絲,這種關(guān)注和被關(guān)注關(guān)系就形成了微博網(wǎng)絡(luò)中的關(guān)注關(guān)系網(wǎng)絡(luò)和粉絲關(guān)系網(wǎng)絡(luò)。
[0021] 用戶(hù)對(duì)某個(gè)微博閱讀后可以進(jìn)行轉(zhuǎn)發(fā)、評(píng)論和收藏等操作,轉(zhuǎn)發(fā)操作會(huì)引起微博 的二次傳播,評(píng)論操作發(fā)表用戶(hù)對(duì)此微博的觀(guān)點(diǎn),評(píng)論的同時(shí)可以選擇是否同時(shí)轉(zhuǎn)發(fā),收藏 操作只是對(duì)微博進(jìn)行記錄,不發(fā)表觀(guān)點(diǎn),也不引起二次傳播。
[0022] 2)根據(jù)用戶(hù)u所發(fā)微博被閱讀、轉(zhuǎn)發(fā)及評(píng)論的數(shù)量信息得到用戶(hù)u的微博影響力 It(u)值;
[0023]需要說(shuō)明的是,步驟2)中所述用戶(hù)u的微博影響力值 7 (w)=+,其中,Rr(x)為微博X的轉(zhuǎn)發(fā)數(shù)量與閱讀數(shù)量的比值, Cr(X) 為微博X的評(píng)論數(shù)量與閱讀數(shù)量的比值,Tweets (u)是用戶(hù)u發(fā)布的原始微博的集合,當(dāng)閱 讀數(shù)量為零,則Rr(x)及Cr(x)均為0。
[0024]微博本身所包含的信息和觀(guān)點(diǎn)越有用,越有價(jià)值,其被轉(zhuǎn)發(fā)、評(píng)論、支持和復(fù)制的 可能性就越高,用戶(hù)的交互也就越頻繁。反過(guò)來(lái),如果某個(gè)微博帶來(lái)了更多的轉(zhuǎn)發(fā)、評(píng)論、支 持和復(fù)制等行為,那么這個(gè)微博的影響力就越大,也就是微博用戶(hù)的影響力越大。微博的轉(zhuǎn) 發(fā)行為直接表明讀者支持微博所包含的觀(guān)點(diǎn)并愿意與自己的粉絲分享,傳播觀(guān)點(diǎn)。評(píng)論行 為是讀者對(duì)微博所包含觀(guān)點(diǎn)、情緒等發(fā)表自己的看法,并不一定是支持,但有明確意愿與自 己的粉絲進(jìn)一步討論和傳播這個(gè)觀(guān)點(diǎn)。一條微博被轉(zhuǎn)發(fā)和評(píng)論的越多,其傳播就越快,話(huà)題 持續(xù)時(shí)間就越久,被閱讀的機(jī)會(huì)就越多,影響力自然就越大。
[0025] 3)在微博粉絲關(guān)系網(wǎng)絡(luò)中,計(jì)算得到用戶(hù)u的信息傳播影響力Id( u)值;
[0026]需要說(shuō)明的是,步驟3)中用戶(hù)u的信息傳播影響力值Id(u) =D(U)+B(U)+C(u)j 中,D(u)為用戶(hù)u在微博粉絲關(guān)系網(wǎng)絡(luò)中的度中心度,D(u)在"Freeman L C. Centrality in social networks conceptual clarification[J]. Social Networks, 1979,1 (3) :215-239w 中給出了定義和計(jì)算方法;B(u)為介中心度,其在"Freeman,Linton. A set measures of centrality based upon betweenness[J]_Sociometry,1977,40:35-41" 中給出了定義和 計(jì)算方法,C(u)是接近中心度(出度),C(u)在"Sabidussi,G.The centrality index of graph[J]_ Psychometriks,1966,31 :581-6〇3"給出了定義和計(jì)算方法,所述微博粉絲關(guān)系 網(wǎng)絡(luò)通過(guò)步驟1)得到的用戶(hù)關(guān)系信息抽取粉絲關(guān)系形成。
[0027]其中,在用戶(hù)粉絲關(guān)系網(wǎng)絡(luò)中,用戶(hù)的度中心度越大,表明用戶(hù)發(fā)布的微博信息將 會(huì)有更高的概率被閱讀到,快速傳播的可能性就越大。如果用戶(hù)的介中心度越大,表明用戶(hù) 對(duì)消息傳播的掌控能力就越強(qiáng),將會(huì)有更大的機(jī)會(huì)將消息放大,更快傳播消息,也更容易將 信息截?cái)?。接近中心度越大,表明用?hù)可以依賴(lài)較少或不依賴(lài)其他節(jié)點(diǎn)就能將信息快速傳 播到整個(gè)網(wǎng)絡(luò),消息傳播的速度更快,范圍更廣。
[0028] 4)將步驟2)得到的用戶(hù)u的微博影響力It(u)值及步驟3)得到的用戶(hù)u的信息 傳播影響力Id(u)值相加,得用戶(hù)u的影響力初始權(quán)值W(u);
[0029] 5)根據(jù)步驟4)得到的用戶(hù)u的影響力初始權(quán)值w(u)迭代計(jì)算用戶(hù)u的影響力值 I(u),然后以用戶(hù)u的影響力值作為用戶(hù)u在微博網(wǎng)絡(luò)中的影響力的度量。
[0030] 需要說(shuō)明的是,步驟5)中所述用戶(hù)u的影響力值 7 (誦續(xù)(v)); iFo/Wr 韻 v關(guān)注的用戶(hù)集合,Followers(u)為用戶(hù)u關(guān)注的用戶(hù)集合,u為微博網(wǎng)絡(luò)中所有用戶(hù)的集 合。
【權(quán)利要求】
1. 一種微博網(wǎng)絡(luò)中用戶(hù)影響力度量的方法,其特征在于,包括以下步驟: 1) 編寫(xiě)獲取微博用戶(hù)信息及用戶(hù)所發(fā)布微博的程序,通過(guò)微博平臺(tái)提供的API接口獲 取真實(shí)的微博用戶(hù)信息,從所述真實(shí)的微博用戶(hù)信息中提取用戶(hù)在微博網(wǎng)絡(luò)中的關(guān)注關(guān)系 及粉絲關(guān)系,并提取用戶(hù)所發(fā)微博被閱讀、轉(zhuǎn)發(fā)及評(píng)論的數(shù)量信息; 2) 根據(jù)用戶(hù)u所發(fā)微博被閱讀、轉(zhuǎn)發(fā)及評(píng)論的數(shù)量信息計(jì)算得到用戶(hù)u的微博影響力 值I? ; 3) 在微博粉絲關(guān)系網(wǎng)絡(luò)中,計(jì)算得到用戶(hù)u的信息傳播影響力值Id(u); 4) 將步驟2)得到的用戶(hù)u的微博影響力值It (u)及步驟3)得到的用戶(hù)u的信息傳播 影響力值Id(u)相加作為用戶(hù)u的影響力初始權(quán)值W(u); 5) 根據(jù)步驟4)得到的用戶(hù)u的影響力初始權(quán)值W(u)迭代計(jì)算用戶(hù)u的影響力值 I (u),然后以用戶(hù)u的影響力值I (u)作為用戶(hù)u在微博網(wǎng)絡(luò)中影響力的度量。
2. 根據(jù)權(quán)利要求1所述的微博網(wǎng)絡(luò)中用戶(hù)影響力度量的方法,其特征在于,步驟2)中 所述用戶(hù)u的微博影響力值=
+ '其中,Rr(x)為微博X的轉(zhuǎn)發(fā)數(shù) 量與閱讀數(shù)量的比值,Cr(x)為微博X的評(píng)論數(shù)量與閱讀數(shù)量的比值,TweetsOi)是用戶(hù)u 發(fā)布的原始微博的集合,當(dāng)閱讀數(shù)量為零,則Rr (X)及Cr(x)均為0。
3. 根據(jù)權(quán)利要求1所述的微博網(wǎng)絡(luò)中用戶(hù)影響力度量的方法,其特征在于,步驟3)中 用戶(hù)11的信息傳播影響力值1?=0(11)+8(11)+(:(11),其中,0(11)為用戶(hù)11在微博粉絲關(guān) 系網(wǎng)絡(luò)中的度中心度,B(u)為介中心度,C(u)是接近中心度,所述微博粉絲關(guān)系網(wǎng)絡(luò)通過(guò) 步驟1)得到的用戶(hù)關(guān)系信息抽取粉絲關(guān)系形成。
4. 根據(jù)權(quán)利要求1所述的微博網(wǎng)絡(luò)中用戶(hù)影響力度量的方法,其特征在于,步驟5)中 所述用戶(hù) u 的影響力值 /(") =
(/(v)* W'(v))/|/^//m?,r.v(v)|+ min(f^/)),其中, Followers (v)表示用戶(hù)v關(guān)注的用戶(hù)集合,F(xiàn)ollowers (u)為用戶(hù)u關(guān)注的用戶(hù)集合,U為 微博網(wǎng)絡(luò)中所有用戶(hù)的集合。
【文檔編號(hào)】G06F17/30GK104298767SQ201410594290
【公開(kāi)日】2015年1月21日 申請(qǐng)日期:2014年10月29日 優(yōu)先權(quán)日:2014年10月29日
【發(fā)明者】桂小林, 趙建強(qiáng) 申請(qǐng)人:西安交通大學(xué)