本發(fā)明涉及一種網(wǎng)絡(luò)影響力度量方法,具體地說是一種度量社交網(wǎng)絡(luò)用戶相對影響力的方法。
技術(shù)背景
web2.0時代,ugc成為網(wǎng)絡(luò)內(nèi)容產(chǎn)生的主流渠道,越來越多的用戶通過互聯(lián)網(wǎng)主動地檢索、發(fā)布和傳播信息,有意識地積累自身網(wǎng)絡(luò)話語影響力。大量的研究成果表明,在社會化媒體平臺,具有影響力的網(wǎng)絡(luò)用戶無論在信息傳播還是信息引導(dǎo)方面都至關(guān)重要。互聯(lián)網(wǎng)的開放性和繁雜性意味著網(wǎng)絡(luò)用戶的差異性和網(wǎng)絡(luò)內(nèi)容的多樣性。不同網(wǎng)絡(luò)用戶因文化背景、知識建構(gòu)、經(jīng)歷經(jīng)驗、社會關(guān)系和社會活動能力等方面的差異,其關(guān)注的領(lǐng)域和話題也有所不同,導(dǎo)致其網(wǎng)絡(luò)影響力的作用范圍和作用強(qiáng)度也千差萬別。
目前關(guān)于網(wǎng)絡(luò)用戶影響力度量和識別的研究,主要集中于:(1)從物理學(xué)角度,深入研究用戶的網(wǎng)絡(luò)結(jié)構(gòu)、鏈接層次和社交關(guān)系,采用社會網(wǎng)絡(luò)分析的方法,描述其物理拓?fù)浣Y(jié)構(gòu)以及結(jié)點之間的關(guān)系,以計算獲得用戶的網(wǎng)絡(luò)影響力;(2)從信息傳播學(xué)角度,深入研究網(wǎng)絡(luò)用戶的信息選擇行為以及彼此間的關(guān)注關(guān)系,運(yùn)用pagerank算法計算獲得用戶的網(wǎng)絡(luò)影響力;(3)從傳播學(xué)角度,分析網(wǎng)絡(luò)用戶影響力的傳播特征和覆蓋范圍,建立網(wǎng)絡(luò)影響力傳播概率模型,以獲得用戶的網(wǎng)絡(luò)影響力;(4)從信息管理學(xué)角度,根據(jù)用戶之間的信息發(fā)布和選擇行為,刻畫其個人和社會性屬性特征,構(gòu)建用戶影響力多維信息熵測度模型,以計算獲得用戶的網(wǎng)絡(luò)影響力。
現(xiàn)有研究雖然從不同視角研究了網(wǎng)絡(luò)用戶影響力的度量方法,但大多是度量用戶影響力的整體大小,鮮少分析用戶影響力在作用范圍和作用強(qiáng)度上的相對性表現(xiàn),無法全面地評估用戶影響力的效用價值,增加了遴選網(wǎng)絡(luò)用戶的決策難度。
技術(shù)實現(xiàn)要素:
本發(fā)明為克服現(xiàn)有技術(shù)存在的不足,提供一種社交網(wǎng)絡(luò)用戶相對影響力度量方法,以期能界定網(wǎng)絡(luò)用戶影響力作用的領(lǐng)域范圍,度量用戶基于不同領(lǐng)域方向的影響力大小,從而識別用戶影響力的優(yōu)勢作用領(lǐng)域方向,進(jìn)而降低網(wǎng)絡(luò)用戶遴選難度,提升決策質(zhì)量。
為了達(dá)到上述目的,本發(fā)明采用如下技術(shù)方案:
本發(fā)明一種社交網(wǎng)絡(luò)用戶相對影響力的度量方法的特點是按如下步驟進(jìn)行:
步驟1、基于個人屬性特征、社會性屬性特征以及與各領(lǐng)域方向的相關(guān)度,構(gòu)建社交網(wǎng)絡(luò)用戶集中任一用戶ui的相對影響力測度指標(biāo)集為{pi,si,ri},其中,pi表示用戶ui的個人屬性,并有pi={pi1,pi2,…,pix,…,pih},pix表示用戶ui的第x項個人屬性指標(biāo),h為個人屬性指標(biāo)項的數(shù)量,且x=1,2,…,h;si表示用戶ui的社會性屬性,并有si={si1,si2,…,siy,…,sig},siy表示用戶ui的第y項社會性屬性指標(biāo),g為社會性屬性指標(biāo)項的數(shù)量,且y=1,2,…,g;ri表示用戶ui與各領(lǐng)域方向相關(guān)度集合,并有ri={ri1,ri2,…,rik,…,rim},rik表示用戶ui與領(lǐng)域f中第k個領(lǐng)域方向fk的相關(guān)度,m為領(lǐng)域方向的數(shù)量,且k=1,2,…,m;
步驟2、運(yùn)用主客觀綜合賦權(quán)方法,確定所述社交網(wǎng)絡(luò)中用戶ui的個人屬性pi和社會性屬性si的權(quán)重及其相應(yīng)指標(biāo)的權(quán)重:
步驟2.1、利用專家打分法分別對個人屬性和社會性屬性的重要程度進(jìn)行經(jīng)驗打分,得到所有專家打分的均值并進(jìn)行歸一化處理,獲得個人屬性的權(quán)重α和社會性屬性的權(quán)重β;
步驟2.2、基于所述用戶集的個人屬性指標(biāo)和社會性屬性指標(biāo),建立初始矩陣d,根據(jù)各項指標(biāo)效益的正負(fù),對初始矩陣d進(jìn)行無量綱化處理得到無量綱矩陣d',利用熵權(quán)法對所述無量綱矩陣d'進(jìn)行計算,得到個人屬性指標(biāo)項權(quán)重集合
步驟3、構(gòu)建用戶ui的文本特征向量vui和各領(lǐng)域方向文本特征向量vfk,計算用戶ui與各領(lǐng)域方向的相關(guān)度:
步驟3.1、獲取第k個領(lǐng)域方向fk下所有用戶發(fā)布的文本,利用分詞工具標(biāo)記和統(tǒng)計關(guān)鍵詞,得到第k個領(lǐng)域方向fk的特征詞項集合tk={tk1,tk2,…,tka,…,tka},其中,tka表示第k個領(lǐng)域方向fk的第a個特征詞項,a表示第k個領(lǐng)域方向fk的特征詞項數(shù)量;從而得到m個領(lǐng)域方向的特征詞項集合{t1,t2,…,tk,…,tm};
步驟3.2、對m個領(lǐng)域方向的特征詞項集合{t1,t2,…,tk,…,tm}中的特征詞項去重,構(gòu)造所述領(lǐng)域f的特征詞項集合t={t1,t2,…,tp,…tn},其中tp表示第p個特征詞項,則用n維向量表示第k個領(lǐng)域方向fk和用戶ui文本特征向量,記為
步驟3.3、利用式(1)和式(2)計算第p個特征詞項tp在第k個領(lǐng)域方向fk中的權(quán)重
式(1)中,nfk表示第k個領(lǐng)域方向fk下的用戶文本數(shù)量,dj表示第k個領(lǐng)域方向fk下的第j個用戶文本,tf-idf(tp,dj)表示利用tf-idf公式計算得到的第p個特征詞項tp在第j個用戶文本dj中的權(quán)重,
式(2)中,nui表示用戶ui發(fā)布的文本數(shù),dl為用戶ui發(fā)布的第l個文本,tf-idf(tp,dl)為利用tf-idf公式計算得到第p個特征詞項tp在第l個文本dl中的權(quán)重;
步驟3.4、利用式(3)計算用戶ui與第k個領(lǐng)域方向fk的相關(guān)度rik,從而得到用戶ui與m個領(lǐng)域方向的相關(guān)度集合ri:
步驟4、構(gòu)建所述社交網(wǎng)絡(luò)中用戶ui的相對影響力測度模型,計算用戶ui的相對影響力:
步驟4.1、利用式(4)和式(5)計算用戶ui的個人屬性值ip(ui)和社會性屬性值is(ui):
步驟4.2、利用式(6)構(gòu)建用戶ui的個人影響力總量測度模型:
c(ui)=ip(ui)+is(ui)(6)
式(6)中,c(ui)表示用戶ui的個人影響力總量大??;
步驟4.3、利用式(7)構(gòu)建用戶ui基于第k個領(lǐng)域方向fk的影響力測度模型:
式(7)中,
步驟4.4、利用式(8)和式(9)分別計算用戶ui的相對影響力:
式(8)中,rcu(i)表示用戶ui影響力總量的相對大小,
式(9)中,rcu(ik)表示用戶ui在第k個領(lǐng)域方向fk下的相對影響力,
相較于現(xiàn)有技術(shù),本發(fā)明的有益效果體現(xiàn)在:
1、本發(fā)明通過分析網(wǎng)絡(luò)用戶文本內(nèi)容與各領(lǐng)域方向的相關(guān)度,界定用戶關(guān)注或涉及的領(lǐng)域方向,并結(jié)合社交網(wǎng)絡(luò)用戶在個人屬性和社會性屬性方面的特征表現(xiàn),從用戶自身和網(wǎng)絡(luò)全局兩個角度,設(shè)計了網(wǎng)絡(luò)用戶相對影響力的度量模型,既考慮了用戶整體影響力大小,也明晰了用戶在不同領(lǐng)域方向下的影響力大小,提高了網(wǎng)絡(luò)用戶影響力的適用性,降低了影響力用戶挑選難度。
2、本發(fā)明基于各領(lǐng)域方向的特征詞項集合,構(gòu)建表征整體領(lǐng)域的特征詞項向量,通過該向量構(gòu)建用戶文本特征向量和各領(lǐng)域方向的文本特征向量,保證了準(zhǔn)確度的同時,也降低了操作復(fù)雜度。
3、本發(fā)明綜合考慮特征詞項在某一領(lǐng)域方向和整體領(lǐng)域中的重要程度,獲得特征詞項在各領(lǐng)域方向文本特征向量中的權(quán)重,凸顯了各領(lǐng)域方向間的關(guān)聯(lián)性,提高了權(quán)重計算準(zhǔn)確度。
4、本發(fā)明構(gòu)建的網(wǎng)絡(luò)用戶相對影響力度量模型,能夠從自身相對和全局相對兩個角度,評估用戶整體相對影響力及其在不同領(lǐng)域方向下的相對影響力,克服了傳統(tǒng)單一度量影響力大小的局限性,極大地提升了網(wǎng)絡(luò)用戶影響力的適用性和實用性,降低了挑選網(wǎng)絡(luò)用戶的決策難度。
附圖說明
圖1為本發(fā)明度量方法的流程圖;
圖2為用戶影響力總量大小分布效果曲線;
圖3為用戶基于不同領(lǐng)域方向的影響力分布效果圖。
具體實施方式
本實施例中,如圖1所示,一種社交網(wǎng)絡(luò)用戶相對影響力的度量方法,可有效界定網(wǎng)絡(luò)用戶影響力作用的領(lǐng)域范圍,并度量用戶在不同范圍內(nèi)的影響力大小,克服了以往僅考慮用戶影響力總量的局限,有助于識別網(wǎng)絡(luò)用戶的優(yōu)勢領(lǐng)域方向,降低網(wǎng)絡(luò)用戶的挑選難度,可用于社會化網(wǎng)絡(luò)廣告投放、社區(qū)管理、輿情監(jiān)測等領(lǐng)域。具體的說,該方法是按如下步驟進(jìn)行:
步驟1、基于個人屬性特征、社會性屬性特征以及與各領(lǐng)域方向的相關(guān)度,構(gòu)建社交網(wǎng)絡(luò)用戶集中任一用戶ui的相對影響力測度指標(biāo)集為{pi,si,ri},其中,pi表示用戶ui的個人屬性,并有pi={pi1,pi2,…,pix,…,pih},pix表示用戶ui的第x項個人屬性指標(biāo),h為個人屬性指標(biāo)項的數(shù)量,且x=1,2,…,h;si表示用戶ui的社會性屬性,并有si={si1,si2,…,siy,…,sig},siy表示用戶ui的第y項社會性屬性指標(biāo),g為社會性屬性指標(biāo)項的數(shù)量,且y=1,2,…,g;ri表示用戶ui與各領(lǐng)域方向相關(guān)度集合,并有ri={ri1,ri2,…,rik,…,rim},rik表示用戶ui與領(lǐng)域f中第k個領(lǐng)域方向fk的相關(guān)度,m為領(lǐng)域方向的數(shù)量,且k=1,2,…,m;
“汽車之家”論壇以品牌社區(qū)為組織方式,且各品牌社區(qū)間的界線比較清晰,本發(fā)明采用汽車之家jeep品牌社區(qū)數(shù)據(jù),將jeep品牌社區(qū)視為用戶話題聚焦的領(lǐng)域f,社區(qū)中的產(chǎn)品論壇視為各領(lǐng)域方向fk。通過網(wǎng)絡(luò)爬蟲,獲取統(tǒng)計時段內(nèi)各產(chǎn)品論壇中用戶發(fā)布的所有文本、用戶個人屬性指標(biāo)數(shù)據(jù)、用戶社會性屬性指標(biāo)數(shù)據(jù)以及用戶發(fā)布的文本。
本實施例中,構(gòu)建用戶ui的相對影響力測度指標(biāo)集為{pi,si,ri},其中,pi表示用戶ui的個人屬性,pi={pi1,pi2,…,pix,…,pi5},pi1表示用戶在jeep品牌社區(qū)中的網(wǎng)絡(luò)等級;pi2表示用戶身份認(rèn)證狀態(tài),通過記為1,未通過記為0;pi3表示用戶的粉絲數(shù);pi4表示發(fā)文數(shù)量,指用戶在統(tǒng)計時段內(nèi)發(fā)布的文本數(shù)量;pi5表示高質(zhì)量文本數(shù)量,指統(tǒng)計時段內(nèi)用戶發(fā)布的高質(zhì)量文本數(shù)量,本例指用戶發(fā)布的精華帖數(shù)量;si={si1,si2,si3},si表示用戶ui的社會性屬性,si1表示文本平均點擊量,指統(tǒng)計時段內(nèi)用戶發(fā)布文本的點擊總數(shù)/發(fā)文數(shù)量;si2表示文本平均回復(fù)量,指統(tǒng)計時段內(nèi)用戶發(fā)布文本的回復(fù)總數(shù)/發(fā)文數(shù)量;si3表示高等級用戶回復(fù)數(shù),指統(tǒng)計時段內(nèi)用戶發(fā)布文本的高等級用戶回復(fù)總數(shù);ri={ri1,ri2,ri3,ri4},ri1,ri2,ri3,ri4分別表示用戶與jeep品牌社區(qū)下牧馬人產(chǎn)品、指南者產(chǎn)品、大切諾基產(chǎn)品、自由光產(chǎn)品的相關(guān)度。
步驟2、運(yùn)用主客觀綜合賦權(quán)方法,確定所述社交網(wǎng)絡(luò)中用戶ui的個人屬性pi和社會性屬性si的權(quán)重及其相應(yīng)指標(biāo)的權(quán)重:
步驟2.1、利用專家打分法分別對個人屬性和社會性屬性的重要程度進(jìn)行經(jīng)驗打分,得到所有專家打分的均值并進(jìn)行歸一化處理,獲得個人屬性的權(quán)重α和社會性屬性的權(quán)重β;
步驟2.2、基于所述用戶集的個人屬性指標(biāo)和社會性屬性指標(biāo),建立初始矩陣d,根據(jù)各項指標(biāo)效益的正負(fù),對初始矩陣d進(jìn)行無量綱化處理得到無量綱矩陣d',利用熵權(quán)法對所述無量綱矩陣d'進(jìn)行計算,得到個人屬性指標(biāo)項權(quán)重集合
本實施例中,各指標(biāo)權(quán)重計算結(jié)果見表1。
表1各指標(biāo)權(quán)重計算結(jié)果
步驟3、構(gòu)建用戶ui的文本特征向量vui和各領(lǐng)域方向文本特征向量vfk,計算用戶ui與各領(lǐng)域方向的相關(guān)度:
步驟3.1、獲取第k個領(lǐng)域方向fk下所有用戶發(fā)布的文本,利用分詞工具標(biāo)記和統(tǒng)計關(guān)鍵詞,得到第k個領(lǐng)域方向fk的特征詞項集合tk={tk1,tk2,…,tka,…,tka},其中,tka表示第k個領(lǐng)域方向fk的第a個特征詞項,a表示第k個領(lǐng)域方向fk的特征詞項數(shù)量;從而得到m個領(lǐng)域方向的特征詞項集合{t1,t2,…,tk,…,tm};
步驟3.2、對m個領(lǐng)域方向的特征詞項集合{t1,t2,…,tk,…,tm}中的特征詞項去重,構(gòu)造所領(lǐng)域f的特征詞項集合t={t1,t2,…,tp,…tn},其中tp表示第p個特征詞項,則用n維向量表示第k個領(lǐng)域方向fk和用戶ui文本特征向量,記為
步驟3.3、利用式(1)和式(2)計算第p個特征詞項tp在第k個領(lǐng)域方向fk中的權(quán)重
式(1)中,nfk表示第k個領(lǐng)域方向fk下的用戶文本數(shù)量,dj表示第k個領(lǐng)域方向fk下的第j個用戶文本,tf-idf(tp,dj)表示利用tf-idf公式計算得到的第p個特征詞項tp在第j個用戶文本dj中的權(quán)重,
式(2)中,nui表示用戶ui發(fā)布的文本數(shù),dl為用戶ui發(fā)布的第l個文本,tf-idf(tp,dl)為利用tf-idf公式計算得到第p個特征詞項tp在第l個文本dl中的權(quán)重;
步驟3.4、利用式(3)計算用戶ui與第k個領(lǐng)域方向fk的相關(guān)度rik,從而得到用戶ui與m個領(lǐng)域方向的相關(guān)度集合ri:
本實施例中,用戶ui與各領(lǐng)域方向相關(guān)度計算結(jié)果見表2。
表2用戶ui與各領(lǐng)域方向相關(guān)度計算結(jié)果
步驟4、構(gòu)建所述社交網(wǎng)絡(luò)中用戶ui的相對影響力測度模型,計算用戶ui的相對影響力:
步驟4.1、利用式(4)和式(5)計算用戶ui的個人屬性值ip(ui)和社會性屬性值is(ui):
步驟4.2、利用式(6)構(gòu)建用戶ui的個人影響力總量測度模型:
c(ui)=ip(ui)+is(ui)(6)
式(6)中,c(ui)表示用戶ui的個人影響力總量大??;
本實施例中,各用戶的影響力總量計算結(jié)果見表3。
表3用戶ui的影響力總量計算結(jié)果
各用戶影響力總量大小分布曲線如圖2所示,不同用戶影響力總量具有相對性,此外,即使兩個用戶的影響力總量大小一致,其個人屬性值和社會性屬性值也可能存在差別,如用戶u7和u9。
步驟4.3、利用式(7)構(gòu)建用戶ui基于第k個領(lǐng)域方向fk的影響力測度模型:
式(7)中,
本實施例中,用戶基于各領(lǐng)域方向的影響力計算結(jié)果見表4。
表4用戶ui基于各領(lǐng)域方向的影響力計算結(jié)果
不同用戶基于各領(lǐng)域方向的影響力分布效果如圖3所示,結(jié)果顯示不同用戶其影響力的作用范圍和作用強(qiáng)度具有較大差異,用戶u10四個領(lǐng)域方向皆有涉及,且在大切諾基中影響力最大;而用戶u2、u7僅涉及一個領(lǐng)域方向,且影響力作用領(lǐng)域方向不一致;u7和u9影響力總量大小基本一致,但兩者影響力的作用范圍和作用強(qiáng)度也大相徑庭。同時,影響力總量高的用戶,具體到某一領(lǐng)域方向上,影響力作用效果未必最佳,以牧馬人為例,用戶影響力總量,由大到小依次是u2>u1>u9>u10,而在牧馬人方向下,用戶的影響力由大到小依次為:u1>u2>u10>u9。
步驟4.4、利用式(8)和式(9)分別計算用戶ui的相對影響力:
式(8)中,rcu(i)表示用戶ui影響力總量的相對大小,
式(9)中,rcu(ik)表示用戶ui在第k個領(lǐng)域方向fk下的相對影響力,
本實施例中,用戶ui整體相對影響力和基于各領(lǐng)域方向的相對影響力計算結(jié)果見表5和表6。
表5用戶ui整體相對影響力計算結(jié)果
表6用戶ui基于各領(lǐng)域方向的相對影響力計算結(jié)果
以上是本發(fā)明的較佳實施例,凡依本發(fā)明技術(shù)方案所作的改變,所產(chǎn)生的功能作用未超出本發(fā)明技術(shù)方案的范圍時,均屬于本發(fā)明的保護(hù)范圍。