一種基于遺忘規(guī)律的社會網(wǎng)絡(luò)信息傳播方法
【專利摘要】一種基于遺忘規(guī)律的社會網(wǎng)絡(luò)信息傳播方法,本發(fā)明涉及基于遺忘規(guī)律的社會網(wǎng)絡(luò)信息傳播方法。本發(fā)明的目的是為了解決現(xiàn)有技術(shù)沒有考慮到影響力會隨時(shí)間而不斷衰減、沒有考慮到人們第一次接收信息與之后每次接收信息的不同反應(yīng)的問題。具體過程為:一:設(shè)置初始的激活節(jié)點(diǎn)集合S;二:在時(shí)間tx時(shí),激活態(tài)節(jié)點(diǎn)對未激活態(tài)鄰居節(jié)點(diǎn)v進(jìn)行激活;三:如果未激活態(tài)鄰居節(jié)點(diǎn)v被激活成功,那么在tx+1時(shí)刻,未激活態(tài)鄰居節(jié)點(diǎn)v轉(zhuǎn)變?yōu)榧せ顮顟B(tài),并嘗試激活其鄰接的未激活節(jié)點(diǎn)x;否則未激活態(tài)鄰居節(jié)點(diǎn)v不發(fā)生變化;四:重復(fù)執(zhí)行二和三,直到不存在有未擴(kuò)散的激活節(jié)點(diǎn),傳播過程結(jié)束。本發(fā)明應(yīng)用于網(wǎng)絡(luò)信息傳播領(lǐng)域。
【專利說明】
一種基于遺忘規(guī)律的社會網(wǎng)絡(luò)信息傳播方法
技術(shù)領(lǐng)域
[0001 ]本發(fā)明涉及基于遺忘規(guī)律的社會網(wǎng)絡(luò)信息傳播方法。
【背景技術(shù)】
[0002] 信息傳播(Information Diffusion)是人們通過符號、信號,傳遞、接收與反饋信 息的活動,是人們彼此交換意見、思想、情感,以達(dá)到相互了解和影響的過程。社會網(wǎng)絡(luò)信息 傳播模型特指以社會網(wǎng)絡(luò)為媒介進(jìn)行的信息傳播過程 [1](方濱興等.在線社交網(wǎng)絡(luò)分析.電 子工業(yè)出版社,2014:302頁)。
[0003] 社會網(wǎng)絡(luò)信息傳播模型和社會網(wǎng)絡(luò)影響力最大化問題是社會網(wǎng)絡(luò)分析里兩個關(guān) 鍵的研究問題。社會網(wǎng)絡(luò)影響力最大化的主要目的,是要通過已有的社會網(wǎng)絡(luò)關(guān)系,挖掘出 網(wǎng)絡(luò)里影響力最大的Τ0Ρ-Κ節(jié)點(diǎn)集合,在市場營銷、疾病防治、謠言控制等各類重要的場景 里有著廣泛的應(yīng)用。而對社會網(wǎng)絡(luò)信息傳播過程的研究,有助于加深對社交系統(tǒng)的認(rèn)識,理 解社交現(xiàn)象,以及對復(fù)雜社會網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)和屬性、傳播能力、動力學(xué)行為等有進(jìn)一步的 認(rèn)識。此外,研究社會網(wǎng)絡(luò)傳播過程也有助于個性化推薦、影響力最大的節(jié)點(diǎn)識別、模式發(fā) 現(xiàn)等方面的研究。
[0004] 例如,在市場營銷領(lǐng)域,"病毒式營銷" [2] (Richardson Μ,Domingos P .Mining knowledge-sharing sites for viral marketing.Proceedings of the eighth ACM SIGKDD international conference on Knowledge discovery and data mining.ACM, New York,NY,USA,2002:61-70P)'[3](Goldenberg J,Libai B,Muller E.Using complex systems analysis to advance marketing theory development: Mode 1ing heterogeneity effects on new product growth through stochastic cellular automata.Academy of Marketing Science Review,2001,9(3): 1-18P)'[4] (Mahajan V, Muller E,Bass F M.New product diffusion models in marketing:A review and directions for research .The journal of marketing ,1990:1-26P)和"口碑效應(yīng)"[5] (Brown J J,Reingen P H. Social ties and word-〇f-mouth referral behavior.Journal of Consumer research,1987:350_362P)-[6](Goldenberg J,Libai B, Muller E.Talk of the network:A complex systems look at the underlying process of word-of-mouth.Marketing letters,2001,12(3) :211_223P)是對社會網(wǎng)絡(luò)信息傳播模 型和社會網(wǎng)絡(luò)影響力最大化最好的應(yīng)用。商業(yè)公司總是希望以最小的代價(jià)將新研制的產(chǎn)品 推廣到市場上并被大部分人群所接受。為此,商業(yè)公司會先針對少數(shù)有"影響力"的用戶,向 這一小部分用戶贈送新產(chǎn)品樣本供其免費(fèi)試用。這部分人試用之后,再通過稱為"口碑效 應(yīng)"的傳統(tǒng)口耳相傳方式推薦給周圍的人,周圍的人再推薦給他們周圍的人,最終將新產(chǎn)品 推廣給了市場上的大部分人。在這類場景里,信息的傳遞與病毒的傳染方式如出一轍,因而 經(jīng)濟(jì)學(xué)上稱此類信息傳遞方式為"病毒式營銷"。在此過程中,選擇少數(shù)最有"影響力"的用 戶,即是社會網(wǎng)絡(luò)影響力最大化的應(yīng)用,而要估計(jì)出信息如何在網(wǎng)絡(luò)里進(jìn)行傳播擴(kuò)散以及 最終可以影響的范圍或人數(shù),即是社會網(wǎng)絡(luò)信息傳播模型的應(yīng)用。
[0005]近些年社會網(wǎng)絡(luò)的迅猛發(fā)展,為社會網(wǎng)絡(luò)分析提供了海量真實(shí)的數(shù)據(jù),而社會網(wǎng) 絡(luò)信息傳播模型作為社會網(wǎng)絡(luò)分析研究的關(guān)鍵問題之一,在認(rèn)識信息傳播規(guī)律和研究信息 傳播機(jī)制上取得了階段性成果。其中,獨(dú)立級聯(lián)模型和線性閾值模型是最基礎(chǔ)的模型,其他 新型的傳播模型幾乎是基于獨(dú)立級聯(lián)模型和線性閾值模型之上提出的。
[0006]獨(dú)立級聯(lián)模型(Independent Cascade Model)[3](Goldenberg J,Libai B,Muller E.Using complex systems analysis to advance marketing theory development: Modeling heterogeneity effects on new product growth through stochastic cellular automata.Academy of Marketing Science Review,2001,9(3):1-18P),[6] (Goldenberg J,Libai B,Muller E.Talk of the network:A complex systems look at the underlying process of word-of-mouth.Marketing letters,2001,12(3):211-223P),是基于相互粒子系統(tǒng)而設(shè)計(jì)的概率模型,由Jacob Goldenberg等人在研究市場營銷 模型時(shí)提出。
[0007]獨(dú)立級聯(lián)模型的設(shè)定是已激活節(jié)點(diǎn)u嘗試激活其鄰接未激活節(jié)點(diǎn)v的行為是否成 功是一個概率為Puv的事件,且一個處于未激活狀態(tài)的節(jié)點(diǎn)被剛進(jìn)入激活狀態(tài)的鄰居節(jié)點(diǎn) 激活的概率獨(dú)立于之前曾嘗試過激活該節(jié)點(diǎn)的鄰居的活動。此外該模型還做出了這樣的設(shè) 定:處于激活狀態(tài)的節(jié)點(diǎn)有且僅有一次以激活概率P對相鄰未激活狀態(tài)的節(jié)點(diǎn)進(jìn)行激活的 機(jī)會,如果激活概率P大于被激活節(jié)點(diǎn)的閾值,則被影響節(jié)點(diǎn)由未激活狀態(tài)轉(zhuǎn)變?yōu)榧せ顮?態(tài),即激活行為成功;反之激活行為失敗,被影響的節(jié)點(diǎn)維持原狀態(tài)并且發(fā)起激活行為的節(jié) 點(diǎn)以后再無激活該被影響節(jié)點(diǎn)的機(jī)會。
[0008] 獨(dú)立級聯(lián)模型的主要特點(diǎn)是:針對同一次激活過程,盡管未激活節(jié)點(diǎn)同時(shí)有數(shù)個 已激活的鄰居節(jié)點(diǎn),但未激活節(jié)點(diǎn)每次僅受單一已激活節(jié)點(diǎn)的影響,多個已激活鄰居節(jié)點(diǎn) 的影響是相互獨(dú)立的;該次激活失敗,以后將不再對之前進(jìn)行激活的節(jié)點(diǎn)進(jìn)行再次激活;激 活節(jié)點(diǎn)v對未激活節(jié)點(diǎn)u的影響力PUV是隨機(jī)獲得的;由于獨(dú)立級聯(lián)模型是概率模型,因此對 于給定的同一初始節(jié)點(diǎn)集合每次的激活過程不確定從而產(chǎn)生不同的激活結(jié)果,而且結(jié)果之 間可能會有較大的差異,所以一般會進(jìn)行多次實(shí)驗(yàn)并計(jì)算平均值來評定最終的結(jié)果。獨(dú)立 級聯(lián)模型的缺點(diǎn)是,忽略了一個常見的傳播規(guī)律,即節(jié)點(diǎn)在第一次被嘗試激活與第一次被 激活失敗后的每一次被嘗試激活時(shí)的行為是不同的。
[0009] 線性閾值模型
[0010] 線性閾值模型(Linear Threshold Model)[7](Granovetter M.Threshold models of collective behavior.American journal of sociology,1978:1420-1443P廣[8] (Goyal A,Lu ff,Lakshmanan L V S.Simpath:An efficient algorithm for influence maximization under the linear threshold model.Data Mining(ICDM),2011 IEEE 11th International Conference on. IEEE Computer Society,Washington,DC,USA, 2011:211-220P),是一類合作激活的傳播模型。在傳播開始之前,所有的未激活節(jié)點(diǎn)v都存 在閾值θ ν,θν£[0, 1],該閾值指明節(jié)點(diǎn)受到外界影響之后被激活的難易程度,閾值越大說 明該節(jié)點(diǎn)越難被激活,閾值越小說明該節(jié)點(diǎn)越容易被激活。激活節(jié)點(diǎn)u對未激活的鄰居節(jié)點(diǎn) ν的影響力為buv,節(jié)點(diǎn)ν的受到所有鄰居節(jié)點(diǎn)的影響力總和不超過1,即
[0012]式中,ueN(v),N(v)是v所有的鄰居節(jié)點(diǎn)集合。
[0013]在任意時(shí)刻,如果未激活節(jié)點(diǎn)¥的所有激活節(jié)點(diǎn)u對v的綜合影響力不小于閾值Θ ⑷,即
[0015]式中,UeNA(v),NA(v)是u所有的激活鄰居節(jié)點(diǎn)集合,θ(ν)是節(jié)點(diǎn)v的閾值。則節(jié)點(diǎn) 4皮激活,節(jié)點(diǎn)ν將加入初始節(jié)點(diǎn)集合并對相鄰的未激活鄰居節(jié)點(diǎn)產(chǎn)生影響。
[0016] 線性閾值模型的主要特點(diǎn)是:針對同一次激活過程,未激活節(jié)點(diǎn)將受到所有已激 活鄰居節(jié)點(diǎn)的影響;若已激活節(jié)點(diǎn)這次沒有成功激活處于未激活狀態(tài)的鄰居節(jié)點(diǎn),在下次 激活過程中仍可對其產(chǎn)生影響;已激活節(jié)點(diǎn)對未激活節(jié)點(diǎn)的影響力是在傳播開始之前根據(jù) 某類算法確定的,而不是隨機(jī)獲得的;相對于獨(dú)立級聯(lián)模型來說,線性閾值模型的傳播結(jié)果 是確定的,即通過給定的同一初始激活節(jié)點(diǎn)集合開始傳播,最終激活的節(jié)點(diǎn)數(shù)量是相同的, 最后的傳播范圍也相同的。線性閾值模型的缺點(diǎn)同獨(dú)立級聯(lián)模型類似,也忽略了一個常見 的傳播規(guī)律,即節(jié)點(diǎn)在第一次被嘗試激活與第一次被激活失敗后的每一次被嘗試激活時(shí)的 行為是不同的;此外,線性閾值模型里節(jié)點(diǎn)累積的影響力是固定不變的,不符合遺忘規(guī)律。
【發(fā)明內(nèi)容】
[0017] 本發(fā)明的目的是為了解決現(xiàn)有技術(shù)沒有考慮到影響力會隨時(shí)間而不斷衰減、沒有 考慮到人們第一次接收信息與之后每次接收信息的不同反應(yīng)的問題,而提出一種基于遺 忘規(guī)律的社會網(wǎng)絡(luò)信息傳播方法。
[0018] 具體是按照以下步驟制備的:
[0019] 步驟一:設(shè)置初始的激活節(jié)點(diǎn)集合S;
[0020] 步驟二:在時(shí)間tx時(shí),網(wǎng)絡(luò)里激活態(tài)節(jié)點(diǎn)對網(wǎng)絡(luò)里未激活態(tài)鄰居節(jié)點(diǎn)ν進(jìn)行激活; [0021 ]步驟三:如果未激活態(tài)鄰居節(jié)點(diǎn)ν被激活成功,那么在tx+1時(shí)刻,未激活態(tài)鄰居節(jié)點(diǎn) ν轉(zhuǎn)變?yōu)榧せ顮顟B(tài),并嘗試激活其鄰接的未激活節(jié)點(diǎn)X;
[0022] 否則,未激活態(tài)鄰居節(jié)點(diǎn)ν在^+1時(shí)刻狀態(tài)不發(fā)生變化;
[0023] 步驟四:重復(fù)執(zhí)行步驟二和步驟三,直到網(wǎng)絡(luò)中不存在有未擴(kuò)散的激活節(jié)點(diǎn),傳播 過程結(jié)束。
[0024]發(fā)明效果
[0025] 混合式傳播模型,該模型通過吸收線性閾值模型和獨(dú)立級聯(lián)模型的優(yōu)點(diǎn),修改其 缺點(diǎn),引入遺忘規(guī)律和人們對待第一次接收信息和之后再次接收信息的不同態(tài)度這一現(xiàn) 象,提出更加符合影響力在現(xiàn)實(shí)人際關(guān)系社會網(wǎng)絡(luò)里的傳播規(guī)律的傳播模型。
[0026] 混合式傳播模型的基本思想來源于影響力在真實(shí)人際關(guān)系社會網(wǎng)絡(luò)的傳播的觀 察和思考:人們第一次聽說某個想法或觀念時(shí),因?yàn)橹皬奈唇佑|過,因而對其接受的可能 性完全是隨機(jī)的,主要取決于這一想法或觀念自身的屬性;如果人們第一次未接受該想法 或觀念,以后再次接觸這個想法或者觀念的時(shí)候,其接受的可能性就不是隨機(jī)的了,而是依 據(jù)之前周圍推薦(盡管失敗了)的人對其的影響力和現(xiàn)在推薦的人的影響力之和;此外,根 據(jù)遺忘規(guī)律,人們的記憶會隨著時(shí)間慢慢消失,因此,之前推薦失敗累積在人們身上的影響 力會隨著時(shí)間的推進(jìn)而不斷減小,直至消失。
[0027] 本發(fā)明依據(jù)對現(xiàn)實(shí)生活里信息傳播的觀察和思考,提出了一種新型的影響力傳播 模型,混合式傳播模型。該模型的基本思想是,節(jié)點(diǎn)在第一次和嘗試激活時(shí)激活概率是隨機(jī) 的,而之后每一次被嘗試激活時(shí)的激活概率依據(jù)之前所有嘗試激活該節(jié)點(diǎn)并失敗的節(jié)點(diǎn)對 其累積的影響力和現(xiàn)在嘗試激活該節(jié)點(diǎn)的節(jié)點(diǎn)對其的影響力之和;此外,按照遺忘規(guī)律,嘗 試激活失敗的節(jié)點(diǎn)留下的累積影響力會隨著時(shí)間的推進(jìn)而不斷衰減。在確定b uv、0v和b'uv函 數(shù)之后,基于Wikipedia數(shù)據(jù)集,分別使用Τ0Ρ-Κ重合率和Τ0Ρ-Κ影響節(jié)點(diǎn)重合率驗(yàn)證了混合 式傳播模型的有效性。Τ0Ρ-Κ的K值取500時(shí),本發(fā)明混合式傳播模型下Τ0Ρ-Κ節(jié)點(diǎn)的重合率 比線性閾值模型下Τ0Ρ-Κ影響范圍重合率提高了 16.2%,比獨(dú)立級聯(lián)模型下Τ0Ρ-Κ節(jié)點(diǎn)的重 合率提高了26.5%。
【附圖說明】
[0028] 圖1是混合傳播模型傳播過程示意圖;
[0029]圖2是不同傳播模型下Τ0Ρ-Κ節(jié)點(diǎn)的重合率,Η代表混合式傳播模型,IC代表獨(dú)立級 聯(lián)模型,LT代表線性閾值模型;
[0030] 圖3是不同模型下Τ0Ρ-Κ影響范圍重合率,Η代表混合式傳播模型,1C代表獨(dú)立級聯(lián) 模型,LT代表線性閾值模型。
【具體實(shí)施方式】
【具體實(shí)施方式】 [0031] 一:本實(shí)施方式的一種基于遺忘規(guī)律的社會網(wǎng)絡(luò)信息傳播方法,具 體是按照以下步驟制備的:
[0032] 步驟一:設(shè)置初始的激活節(jié)點(diǎn)集合S;
[0033] 步驟二:在時(shí)間tx時(shí),網(wǎng)絡(luò)里激活態(tài)節(jié)點(diǎn)對網(wǎng)絡(luò)里未激活態(tài)鄰居節(jié)點(diǎn)ν進(jìn)行激活; [0034]步驟三:如果未激活態(tài)鄰居節(jié)點(diǎn)ν被激活成功,那么在t x+1時(shí)刻,未激活態(tài)鄰居節(jié)點(diǎn) ν轉(zhuǎn)變?yōu)榧せ顮顟B(tài),并嘗試激活其鄰接的未激活節(jié)點(diǎn)X;
[0035] 否則,未激活態(tài)鄰居節(jié)點(diǎn)ν在tx+1時(shí)刻狀態(tài)不發(fā)生變化;
[0036] 步驟四:重復(fù)執(zhí)行步驟二和步驟三,直到網(wǎng)絡(luò)中不存在有未擴(kuò)散的激活節(jié)點(diǎn),傳播 過程結(jié)束。
【具體實(shí)施方式】 [0037] 二:本實(shí)施方式與一不同的是:步驟二所述在時(shí)間tx 時(shí),網(wǎng)絡(luò)里激活態(tài)節(jié)點(diǎn)對它的未激活態(tài)鄰居節(jié)點(diǎn)ν進(jìn)行激活;具體過程為:
[0038] 網(wǎng)絡(luò)里任意節(jié)點(diǎn)只能處于兩種狀態(tài):激活狀態(tài)或者未激活狀態(tài);處于激活狀態(tài)的 節(jié)點(diǎn)(或稱已激活節(jié)點(diǎn))對處于未激活狀態(tài)的節(jié)點(diǎn)(或稱未激活節(jié)點(diǎn))有影響力,這種影響力 會使處于未激活狀態(tài)的節(jié)點(diǎn)轉(zhuǎn)變?yōu)榧せ顮顟B(tài),并且節(jié)點(diǎn)的這種狀態(tài)改變是單向的,即只能 從未激活狀態(tài)轉(zhuǎn)變?yōu)榧せ顮顟B(tài);
[0039]所述影響力包括第一次的隨機(jī)影響力和第一次之后的固定影響力;
[0040] 隨機(jī)影響力:未激活節(jié)點(diǎn)在第一次被相鄰的已激活節(jié)點(diǎn)嘗試激活時(shí)受到的影響 力,是隨機(jī)產(chǎn)生的。
[0041] 固定影響力:根據(jù)某種特定的算法(比如我們文章里的buv=l/d),節(jié)點(diǎn)在第一次 被激活失敗之后累積的影響力就是固定影響力,在之后的每次嘗試激活時(shí)節(jié)點(diǎn)收到的影響 力就變成固定影響力了,之后累積的也是固定影響力。
[0042] 根據(jù)未激活態(tài)鄰居節(jié)點(diǎn)v是否是第一次被嘗試激活分為兩種情況:
[0043] 第一種,未激活態(tài)鄰居節(jié)點(diǎn)v是第一次被嘗試激活,則激活態(tài)節(jié)點(diǎn)u對未激活態(tài)鄰 居節(jié)點(diǎn)v激活成功的概率為隨機(jī)值PUV,如果P UV> = θν,則未激活態(tài)鄰居節(jié)點(diǎn)v被成功激活,被 成功激活的節(jié)點(diǎn)ν將加入激活節(jié)點(diǎn)集合S;
[0044] INFv=Puv
[0045] 如果puv〈0v,則未激活態(tài)鄰居節(jié)點(diǎn)ν激活失敗,未激活態(tài)鄰居節(jié)點(diǎn)ν記錄激活態(tài)節(jié)點(diǎn) u對未激活態(tài)鄰居節(jié)點(diǎn)ν的固定影響力buv、時(shí)間tx,然后將固定影響力buv累積到節(jié)點(diǎn)ν的累積 影響力總和INFv;
[0046] 所述,θν為混合式傳播模型為網(wǎng)絡(luò)里每個未激活態(tài)鄰居節(jié)點(diǎn)¥的閾值,0ve [0,1 ], 該閾值表示該節(jié)點(diǎn)受到影響的難易程度,且在傳播過程中不變化;
[0047] 第二種,未激活態(tài)鄰居節(jié)點(diǎn)ν不是第一次被嘗試激活,則激活態(tài)節(jié)點(diǎn)|對未激活態(tài) 鄰居節(jié)點(diǎn)ν激活成功的固定影響力為bwv,利用公式(3)和公式(4)計(jì)算累積影響力INFv,如果 INFV> = θν,則未激活態(tài)鄰居節(jié)點(diǎn)v被成功激活,否則激活失敗,未激活態(tài)鄰居節(jié)點(diǎn)v記錄激活 態(tài)節(jié)點(diǎn)W對未激活態(tài)鄰居節(jié)點(diǎn)ν的固定影響力b wv、時(shí)間tx,然后將固定影響力bwv累積到節(jié)點(diǎn)ν 的累積影響力總和INFv;bwv會隨著時(shí)間的推進(jìn)而不斷減小,直至影響力bwv無限接近0;
[0048] 所述,bwv為任意未激活態(tài)節(jié)點(diǎn)ν將受到鄰居節(jié)點(diǎn)W的固定影響力,節(jié)點(diǎn)W對節(jié)點(diǎn)ν的 這種固定影響力僅在節(jié)點(diǎn)W處于激活狀態(tài)時(shí)有效;b wv根據(jù)某種特定的算法計(jì)算得到,且任意 未激活態(tài)節(jié)點(diǎn)V受到其所有鄰居節(jié)點(diǎn)W的固定影響力之和不大于1;
[0049]累積影響力INFv的計(jì)算公式如下:
[0051]式中,F(xiàn)ail (ν)是所有激活態(tài)節(jié)點(diǎn)u嘗試激活未激活態(tài)鄰居節(jié)點(diǎn)ν但失敗的節(jié)點(diǎn)集 合,W是當(dāng)前正在嘗試激活未激活態(tài)鄰居節(jié)點(diǎn)ν的已激活節(jié)點(diǎn),tinit是激活態(tài)節(jié)點(diǎn)u第一次嘗 試激活未激活態(tài)鄰居節(jié)點(diǎn)ν的時(shí)間,t n?是當(dāng)前節(jié)點(diǎn)W嘗試激活節(jié)點(diǎn)ν的時(shí)間,b ' uv表示隨著時(shí) 間的推進(jìn)固定影響力buv衰減后的影響力大小,由公式⑶和公式⑷可知,b' uv是關(guān)于buv、 tinit和1:_的函數(shù)。
[0052 ]激活態(tài)節(jié)點(diǎn)u是泛指,包括之前激活失敗的激活態(tài)節(jié)點(diǎn)和現(xiàn)在的激活態(tài)節(jié)點(diǎn)w。
[0053]其它步驟及參數(shù)與【具體實(shí)施方式】一相同。
[0054]【具體實(shí)施方式】三:本實(shí)施方式與【具體實(shí)施方式】一或二不同的是:所述公式(4)的具 體過程為:
[0056]式中,e為自然底數(shù)。
[0057]其它步驟及參數(shù)與【具體實(shí)施方式】一或二相同。
[0058]【具體實(shí)施方式】四:本實(shí)施方式與【具體實(shí)施方式】一至三之一不同的是:其特征在于 所述
[0059] buv= 1/dv (5)
[0060]其中,dv表示未激活態(tài)鄰居節(jié)點(diǎn)v的度數(shù)。
[0061 ]其它步驟及參數(shù)與【具體實(shí)施方式】一至三之一相同。
【具體實(shí)施方式】 [0062] 五:本實(shí)施方式與一至四之一不同的是:步驟四所述 未擴(kuò)散的激活節(jié)點(diǎn)為節(jié)點(diǎn)處于激活狀態(tài),但是還未嘗試激活鄰居節(jié)點(diǎn);
[0063] 在網(wǎng)絡(luò)里的任意處于激活狀態(tài)的節(jié)點(diǎn)u只有一次機(jī)會嘗試激活其處于未激活狀態(tài) 的鄰居節(jié)點(diǎn)V,無論是否激活成功,在以后的傳播過程里,節(jié)點(diǎn)u仍將處于激活狀態(tài),但是失 去對其他節(jié)點(diǎn)的影響力,即不能再嘗試激活其他節(jié)點(diǎn),稱這類節(jié)點(diǎn)為已擴(kuò)散節(jié)點(diǎn),反之,如 果節(jié)點(diǎn)處于激活狀態(tài),但是還未向嘗試激活鄰居節(jié)點(diǎn),稱之為未擴(kuò)散節(jié)點(diǎn);已擴(kuò)散節(jié)點(diǎn)和未 擴(kuò)散節(jié)點(diǎn),都是激活狀態(tài)的節(jié)點(diǎn)。
[0064] 其它步驟及參數(shù)與【具體實(shí)施方式】一至四之一相同。
[0065] 實(shí)施例:
[0066] 為了加深對混合式傳播模型傳播過程的了解,本小節(jié)將通過在簡單的社會網(wǎng)絡(luò)圖 里演示混合式傳播模型的具體傳播過程。
[0067] 為了方便起見,假設(shè)任意節(jié)點(diǎn)v和節(jié)點(diǎn)u之間的固有影響力的計(jì)算公式為buv=l/ kmax,其中kmax是社會網(wǎng)絡(luò)了的最大度數(shù);buv隨著時(shí)間的不斷推進(jìn)之后計(jì)算公式為,b' uv = 131"/(^_411^+1)。注意,這里13_和13'1"的確定只是符合混合式傳播模型里規(guī)則的要求,僅 是為了演示混合式傳播模型的傳播過程,并不一定能夠取得比較好的實(shí)驗(yàn)結(jié)果。
[0068] 根據(jù)假設(shè)的buv的計(jì)算公式,圖1所示的網(wǎng)絡(luò)里,buv = 0.25。另外,假設(shè)各節(jié)點(diǎn)的閾 值分別為,93 = 〇.4,01) = 〇.7,0。= 〇.5,0(] = 〇.6,0(3 = 〇.5,0£ = 〇.3,且選定節(jié)點(diǎn)13為初始激活 節(jié)點(diǎn)。
[0069] 基于圖1的混合式傳播模型的傳播過程如下:
[0070] 第〇時(shí)間步:節(jié)點(diǎn)b被激活,未擴(kuò)散節(jié)點(diǎn)集合s= 。
[0071 ]第1時(shí)間步:未擴(kuò)散節(jié)點(diǎn)集合S ={ b}里的節(jié)點(diǎn)b依次去嘗試激活節(jié)點(diǎn)a、節(jié)點(diǎn)c、節(jié)點(diǎn) d 和節(jié)點(diǎn)f (節(jié)點(diǎn)a、c、d、f 第一次被嘗試激活),且 節(jié)點(diǎn)f被成功激活,加入集合S,節(jié)點(diǎn)d被激活失敗,INFd = b' bd,節(jié)點(diǎn)b的擴(kuò)散完成,從集合S 里移出b,第1時(shí)間步結(jié)束后,未擴(kuò)散節(jié)點(diǎn)集合S = {a,c,f}。
[0072]第2時(shí)間步:未擴(kuò)散節(jié)點(diǎn)集合S= {a,c,f}里的節(jié)點(diǎn)c去嘗試激活節(jié)點(diǎn)e并成功激活, 節(jié)點(diǎn) c 嘗試激活節(jié)點(diǎn) d,此時(shí) INFd = b'bd+b'cd = bbd*(2-l + l)+b'cd*(2-2+l)=O.375〈0d,激活 失敗;緊接著,節(jié)點(diǎn)f嘗試激活節(jié)點(diǎn)(1,1購=13、+13'。〇1+13'£〇1 = 0.625>9(:1,節(jié)點(diǎn)(1被成功激活。第 2時(shí)間步結(jié)束時(shí),未擴(kuò)散節(jié)點(diǎn)集合S = {e,d}。
[0073 ]第3時(shí)間步:未擴(kuò)散節(jié)點(diǎn)集合S ={ e,d}里的節(jié)點(diǎn)e和節(jié)點(diǎn)d沒有未激活的鄰居節(jié)點(diǎn), 無需再擴(kuò)散,此時(shí)未擴(kuò)散節(jié)點(diǎn)集合S =0,整個傳播過程結(jié)束。
[0074]仿真實(shí)驗(yàn):
[0075]確定混合式傳播模型里函數(shù)buv、0v和函數(shù)b'uv的過程為:并在Wikipedia數(shù)據(jù)集上 通過兩種方法來驗(yàn)證混合式傳播模型的有效性。
[0076] 混合式傳播模型在應(yīng)用到具體的實(shí)際應(yīng)用中之前需要先確定buv、0v和b'uv的計(jì)算 公式,b uv和b'uv計(jì)算公式的選擇,關(guān)乎到混合式傳播模型是否可以有效地模擬影響力在現(xiàn) 實(shí)的社會網(wǎng)絡(luò)里的傳播。
[0077] 在現(xiàn)實(shí)生活里,一般有這樣的一種認(rèn)同:在一個人所有的朋友對其影響相同的情 況下,如果一個人的朋友較少,僅有的這幾位朋友中單獨(dú)每一位的意見將對該人產(chǎn)生較大 的影響;如果一個人的朋友較多,那么這些朋友中單獨(dú)的每一位將對該人產(chǎn)生較小的影響。 此外,根據(jù)混合式傳播模型的規(guī)則,
[0078] 根據(jù)節(jié)點(diǎn)v受到的所有鄰居節(jié)點(diǎn)的固定影響力之和不大于1,此處,取固定影響力 之和等于1;假設(shè)節(jié)點(diǎn)V受到所有鄰居節(jié)點(diǎn)的固定影響力是相同,且所有固定影響力的總和 為1,因此,可以得出任一鄰居節(jié)點(diǎn)U對節(jié)點(diǎn)V的固定影響力b uv的計(jì)算公式[15](陳浩.基于閾 值的社會網(wǎng)絡(luò)影響力最大化算法.復(fù)旦大學(xué)碩士學(xué)位論文.2012:24-35頁)為:
[0079] buv=l/dv (5)
[0080]
[0081]其中,dv表示節(jié)點(diǎn)v的度數(shù);有人可能會有疑問,按照上面的buv的計(jì)算公式,如果節(jié) 點(diǎn)v只有一個已激活節(jié)點(diǎn)u,即buv=l,那不就意味著節(jié)點(diǎn)v-定會被激活嗎?實(shí)際上這種情況 是不存在的,因?yàn)楦鶕?jù)混合式傳播模型,節(jié)點(diǎn)v第一次被節(jié)點(diǎn)u嘗試激活時(shí),被激活的概率是 隨機(jī)概率p uv,而不是buv,又因?yàn)槔鄯e的影響力會發(fā)生衰減,當(dāng)節(jié)點(diǎn)v再被嘗試激活時(shí),即使 之前b uv= 1,但衰減之后的b'uv〈l,因此節(jié)點(diǎn)v不一定會被激活,而且節(jié)點(diǎn)v第二次被嘗試激 活失敗,則以后也不可能被激活。θ ν的取值一般有這樣幾種方法:第一種,隨機(jī)取值[16](田家 堂.在線社會網(wǎng)絡(luò)中影響最大化問題的研究.復(fù)旦大學(xué)碩士學(xué)位論文.2012:22-25頁),隨 機(jī)取0~1之間的一個數(shù);第二種,固定取值 [15](陳浩.基于閾值的社會網(wǎng)絡(luò)影響力最大化算 法.復(fù)旦大學(xué)碩士學(xué)位論文.2012 :24-35頁),如0.5,0.6;第三種,(按某種算法)特異性取 值。鑒于混合式傳播模型的重點(diǎn)主要在于buv函數(shù)和b' uv函數(shù),為簡單起見,給θν選擇隨機(jī)取 值的方式。最后是b'uv的取值,德國心理學(xué)家艾賓浩斯針對遺忘規(guī)律 [17](Ebbinghaus Η, ffozniak R H.Memory : a contribution to experimental phychology[M].Thoemmes Press,Maruzen,1998.)的研究,提出了著名的艾賓浩斯遺忘曲線,以描述人類對記憶的遺 忘隨著時(shí)間如何變化。遺忘曲線最主要的特征就是,遺忘的速度是先快后慢 [18](Mcdaniel M A,Einstein G 0. Strategic and automatic processes in prospective memory retrieval:a multiprocess framework[J].Applied Cognitive Psychology,2000,14 (7):S127-S144.)。但是遺忘曲線函數(shù)是以小時(shí)為變量單位并在1小時(shí)后就遺忘56%,這種 早期遺忘的速度太快以至于不太適用于信息的傳播過程。因此,為了遵循混合式傳播模型 關(guān)于節(jié)點(diǎn)在被激活失敗后累積的影響力不斷減小的規(guī)則,以及滿足遺忘規(guī)律關(guān)于遺忘的速 度先快后慢的特征,本文加入自然對數(shù)來模擬影響力在社會網(wǎng)絡(luò)里隨著時(shí)間的推進(jìn)而不斷 減小的過程,
[0082] b'uv的計(jì)算公式為:
[0084]式中,e為自然底數(shù);
[0085] 觀察f (x) = l/ln(x+e)這一函數(shù)可以發(fā)現(xiàn),當(dāng)x = 0時(shí),f (X) = 1;當(dāng)X逐漸勾速增大 時(shí),f(x)逐漸減小,且在X增大的早期階段,f(x)減小的幅度較大;但是X每增加 l,f(x)減小 的數(shù)值卻越來越小;最終,當(dāng)X趨近于正無窮時(shí),f(x)趨近于0。函數(shù)的這種變化恰好符合遺 忘規(guī)律關(guān)于遺忘速度先快后慢的特征。
[0086] Wikipedia是由全世界的志愿者協(xié)作編寫的免費(fèi)的百科全書。Wikipedia的貢獻(xiàn)者 里會有一小部分充當(dāng)管理員,這些管理員比一般的貢獻(xiàn)者在Wikipedia的維護(hù)上有額外的 權(quán)限。如果一般的貢獻(xiàn)者想要成為管理員,需要提出申請。通常,Wikipedia社區(qū)將通過公共 的討論或者投票來決定提升誰來當(dāng)管理員。
[0087] 表4Wikipedia數(shù)據(jù)集的基本參數(shù)
[0090]通過從截止到2008年1月3日以來最新完整版本的Wikipedia頁面編輯歷史數(shù)據(jù), 可以提取出所有的管理員選舉和投票歷史數(shù)據(jù)。在這些數(shù)據(jù)里,總共有2794次選舉和 103689次投票,共7115名用戶參與了選舉(投票或被投票),這些人里有1235人選舉成功如 愿成為了管理員。在這些投票里,以后大約一半的投票來自于已經(jīng)存在的管理員,另外一半 來自于普通的Wikipedia用戶。Wikipedia數(shù)據(jù)集里包含了從Wikipedia開始以來到2008年1 月的所有投票數(shù)據(jù),節(jié)點(diǎn)代表Wikipedia用戶,節(jié)點(diǎn)i到節(jié)點(diǎn)j的邊代表用戶i投給用戶j的選 票。Wikipedia數(shù)據(jù)集的一些基本參數(shù)如所示。
[0091 ]結(jié)果與分析
[0092]通過以單個節(jié)點(diǎn)作為初始激活節(jié)點(diǎn)集合,以混合式傳播模型進(jìn)行傳播,可以獲得 基于混合式傳播模型的單個節(jié)點(diǎn)的實(shí)際影響力大小;通過以規(guī)定的Τ0Ρ-Κ節(jié)點(diǎn)為初始激活 節(jié)點(diǎn)集合,通過混合式傳播模型可以獲得實(shí)際傳播范圍和被影響的節(jié)點(diǎn)集合。
[0093]因?yàn)樗褂玫氖荳ikipedia數(shù)據(jù)集是投票數(shù)據(jù)集,所以可以認(rèn)為,在投票過程里獲 得最多投票的人即是Wikipedia社區(qū)里最有影響力的人;此外還可以認(rèn)為,選舉者的支持 者,支持者的支持者,支持者的支持者等等都可以認(rèn)為是該選舉者在實(shí)際中可以直接或者 間接影響到的人。
[0094]綜合通過混合式傳播模型進(jìn)行傳播的結(jié)果以及Wikipedia數(shù)據(jù)集本身所攜帶的信 息,本文提出兩種方法來驗(yàn)證混合式傳播模型是否比獨(dú)立級聯(lián)模型和線性閾值模型更加符 合實(shí)際的傳播規(guī)律。
[0095] Τ0Ρ-Κ 重合率
[0096] Wikipedia數(shù)據(jù)集里的投票數(shù)據(jù)已經(jīng)反映出了整個Wikipedia社會網(wǎng)絡(luò)里最有影 響力的T0P-K節(jié)點(diǎn)的信息,根據(jù)節(jié)點(diǎn)獲得的投票結(jié)果可以知道,獲得的投票越多,其在 Wikipedia社區(qū)里影響力越大,因此可以獲得Wikipedia數(shù)據(jù)集的Τ0Ρ-Κ節(jié)點(diǎn)集合。在已知節(jié) 點(diǎn)影響力的情況下,以已知的Τ0Ρ-Κ節(jié)點(diǎn)結(jié)合為對比集,分別使用混合式傳播模型、獨(dú)立級 聯(lián)模型和線性閾值模型從Wi k i p e d i a數(shù)據(jù)里選擇影響力最大的Τ0Ρ-Κ節(jié)點(diǎn)集,并與已知節(jié)點(diǎn) 集合進(jìn)行比較??上攵?,如果某種傳播模型獲得的TOP-κ集合與已知集合的TOP-κ節(jié)點(diǎn)集 合的重復(fù)率最高,則該傳播模型理論上應(yīng)該是最符合實(shí)際的傳播規(guī)律的模型。
[0097] TOP-Κ的Κ值分別取50、100、150、200、250、300、350、400、450、500,可以在 Wikipedia數(shù)據(jù)集里依次找出對應(yīng)的最大影響力節(jié)點(diǎn)集合,以這些集合作為對比集,依次獲 得以混合式傳播模型、獨(dú)立級聯(lián)模型以及線性閾值模型進(jìn)行傳播獲得的對應(yīng)集合,對比三 種傳播模型獲得的傳播結(jié)果與實(shí)際的標(biāo)準(zhǔn)集合的重合率。Wikipedia數(shù)據(jù)集在三種傳播模 型下T0P50~T0P500的重合率如圖2所示,其中Η代表混合式傳播模型,1C代表獨(dú)立級聯(lián)模 型,LT代表線性閾值模型。
[0098]由圖2可知,不管在哪種傳播模型下,隨著Κ值的增加,TOP-Κ節(jié)點(diǎn)對應(yīng)的重合率在 逐漸升高,并且混合式傳播模型TOP-κ節(jié)點(diǎn)對應(yīng)的重合率明顯要比獨(dú)立級聯(lián)模型和線性閾 值模型對應(yīng)的重合率要高。由此,由觀察Wikipedia數(shù)據(jù)集的TOP-κ節(jié)點(diǎn)重合率可得出結(jié)論: 混合式傳播模型的準(zhǔn)確性要高于獨(dú)立級聯(lián)模型和線性閾值模型,即混合式傳播模型更加符 合實(shí)際的傳播規(guī)律。
[0099]由圖2可知,不管在哪種傳播模型下,隨著K值的增加,TOP-Κ節(jié)點(diǎn)對應(yīng)的重合率在 逐漸升高,并且混合式傳播模型TOP-κ節(jié)點(diǎn)對應(yīng)的重合率明顯要比獨(dú)立級聯(lián)模型和線性閾 值模型對應(yīng)的重合率要高。由此,由觀察Wikipedia數(shù)據(jù)集的TOP-κ節(jié)點(diǎn)重合率可得出結(jié)論: 混合式傳播模型的準(zhǔn)確性要高于獨(dú)立級聯(lián)模型和線性閾值模型,即混合式傳播模型更加符 合實(shí)際的傳播規(guī)律;由圖2可知,TOP-Κ的K值取50時(shí),獨(dú)立級聯(lián)模型下TOP-Κ節(jié)點(diǎn)的重合率為 17% ;線性閾值模型重合率為8% ;本發(fā)明混合式傳播模型下TOP-Κ節(jié)點(diǎn)的重合率為16% ; TOP-Κ的K值取100時(shí),獨(dú)立級聯(lián)模型下TOP-Κ節(jié)點(diǎn)的重合率為17%;線性閾值模型下TOP-Κ節(jié) 點(diǎn)的重合率為12% ;本發(fā)明混合式傳播模型下TOP-Κ節(jié)點(diǎn)的重合率為24% ;Τ0Ρ-Κ的K值取 500時(shí),獨(dú)立級聯(lián)模型下TOP-Κ節(jié)點(diǎn)的重合率為34% ;線性閾值模型下TOP-Κ節(jié)點(diǎn)的重合率為 37% ;本發(fā)明混合式傳播模型下TOP-Κ節(jié)點(diǎn)的重合率為43 %。
[0100] top-κ影響節(jié)點(diǎn)重合率
[0101]如前所述,通過Wikipedia數(shù)據(jù)集里所攜帶的信息,可以知道用戶之間相互支持的 情況,故而可以提取出由單個用戶出發(fā),該用戶最終直接或間接可以影響到的用戶群體。可 以這樣認(rèn)為,所有投票給某用戶u的用戶群體都是該用戶的支持者,因而也是該用戶可以直 接影響到的用戶群體;并且,用戶u的支持者也有自己對應(yīng)的支持者,這些支持者可以看做 是用戶U的間接支持者,也就是用戶U可以間接影響到的用戶群體;以此類推,用戶U的支持 者也有自己對應(yīng)的支持者,如此就可以獲得用戶U所有的直接和間接的支持者,即用戶U在 實(shí)際中可以影響到的用戶群體?,F(xiàn)在,Wikipedia數(shù)據(jù)集里影響力最大的TOP-κ節(jié)點(diǎn)集合以 及這些節(jié)點(diǎn)實(shí)際可以影響的節(jié)點(diǎn)集合都已經(jīng)已知,以此作為對比集,選定TOP-Κ節(jié)點(diǎn)作為 初始激活節(jié)點(diǎn)集合,分別用混合式傳播模型、獨(dú)立級聯(lián)模型和線性閾值模型作為傳播模型 進(jìn)行傳播實(shí)驗(yàn),記錄這三個模型最終可以影響到的節(jié)點(diǎn)集合,對比這三個傳播結(jié)果集合與 對比集合的節(jié)點(diǎn)重復(fù)率。如果哪個傳播模型對應(yīng)的傳播結(jié)果集合與已知對比集合重復(fù)的節(jié) 點(diǎn)最多,哪個傳播模型就更符合實(shí)際的傳播規(guī)律。Wikipedia數(shù)據(jù)集在三種傳播模型下 T0P50~T0P500節(jié)點(diǎn)的影響范圍的重合率如圖3所示,其中,1C代表獨(dú)立級聯(lián)模型,LT代表線 性閾值模型,Η代表混合式傳播模型。
[0102]由圖3可知,這三類傳播模型隨著Κ值的增加,TOP-κ節(jié)點(diǎn)的影響范圍重合率也在逐 漸增加,而針對同一 K值,混合式傳播模型對應(yīng)的影響范圍重合率始終要大于其他兩類模 型。因而,通過Wikipedia數(shù)據(jù)集Τ0Ρ50~Τ500的節(jié)點(diǎn)在三類傳播模型下與對比集的影響范 圍重合率可以知道:混合式傳播模型具有更高的準(zhǔn)確性。
[0103]由圖3可知,這三類傳播模型隨著K值的增加,Τ0Ρ-Κ節(jié)點(diǎn)的影響范圍重合率也在逐 漸增加,而針對同一 K值,混合式傳播模型對應(yīng)的影響范圍重合率始終要大于其他兩類模 型。因而,通過Wikipedia數(shù)據(jù)集T0P50~T500的節(jié)點(diǎn)在三類傳播模型下與對比集的影響范 圍重合率可以知道:混合式傳播模型具有更高的準(zhǔn)確性。由圖3可知,Τ0Ρ-Κ的K值取50時(shí),獨(dú) 立級聯(lián)模型下Τ0Ρ-Κ影響范圍重合率為20 %;線性閾值模型下Τ0Ρ-Κ影響范圍重合率為 22 % ;本發(fā)明混合式傳播模型下Τ0Ρ-Κ影響范圍重合率為25 % ; Τ0Ρ-Κ的K值取100時(shí),獨(dú)立級 聯(lián)模型下Τ0Ρ-Κ影響范圍重合率為27% ;線性閾值模型下Τ0Ρ-Κ影響范圍重合率為29% ;本 發(fā)明混合式傳播模型下Τ0Ρ-Κ影響范圍重合率為32%;T0P-K的K值取500時(shí),獨(dú)立級聯(lián)模型 下Τ0Ρ-Κ影響范圍重合率為51% ;線性閾值模型下Τ0Ρ-Κ影響范圍重合率為47% ;本發(fā)明混 合式傳播模型下Τ0Ρ-Κ影響范圍重合率為53 %。
【主權(quán)項(xiàng)】
1. 一種基于遺忘規(guī)律的社會網(wǎng)絡(luò)信息傳播方法,其特征在于一種基于遺忘規(guī)律的社會 網(wǎng)絡(luò)信息傳播方法具體是按照以下步驟進(jìn)行的: 步驟一:網(wǎng)絡(luò)中設(shè)置初始的激活節(jié)點(diǎn)集合S; 步驟二:在時(shí)間tx時(shí),網(wǎng)絡(luò)中激活態(tài)節(jié)點(diǎn)對網(wǎng)絡(luò)中未激活態(tài)鄰居節(jié)點(diǎn)V進(jìn)行激活; 步驟三:如果未激活態(tài)鄰居節(jié)點(diǎn)4皮激活成功,那么在tx+1時(shí)刻,未激活態(tài)鄰居節(jié)點(diǎn)v轉(zhuǎn) 變?yōu)榧せ顮顟B(tài),并嘗試激活其鄰接的未激活節(jié)點(diǎn)X; 否則,未激活態(tài)鄰居節(jié)點(diǎn)v在tx+1時(shí)刻狀態(tài)不發(fā)生變化; 步驟四:重復(fù)執(zhí)行步驟二和步驟三,直到網(wǎng)絡(luò)中不存在有未擴(kuò)散的激活節(jié)點(diǎn),傳播過程 結(jié)束。2. 根據(jù)權(quán)利要求1所述的一種基于遺忘規(guī)律的社會網(wǎng)絡(luò)信息傳播方法,其特征在于步 驟二所述在時(shí)間tx時(shí),網(wǎng)絡(luò)中激活態(tài)節(jié)點(diǎn)對它的未激活態(tài)鄰居節(jié)點(diǎn)v進(jìn)行激活;具體過程 為: 網(wǎng)絡(luò)里任意節(jié)點(diǎn)只能處于兩種狀態(tài):激活狀態(tài)或者未激活狀態(tài);處于激活狀態(tài)的節(jié)點(diǎn) 對處于未激活狀態(tài)的節(jié)點(diǎn)有影響力,這種影響力會使處于未激活狀態(tài)的節(jié)點(diǎn)轉(zhuǎn)變?yōu)榧せ顮?態(tài),并且節(jié)點(diǎn)的這種狀態(tài)改變是單向的,即只能從未激活狀態(tài)轉(zhuǎn)變?yōu)榧せ顮顟B(tài); 根據(jù)未激活態(tài)鄰居節(jié)點(diǎn)V是否是第一次被嘗試激活分為兩種情況: 第一種,未激活態(tài)鄰居節(jié)點(diǎn)V是第一次被嘗試激活,則激活態(tài)節(jié)點(diǎn)U對未激活態(tài)鄰居節(jié) 點(diǎn)V激活成功的概率為隨機(jī)值puv,如果puv> = θν,則未激活態(tài)鄰居節(jié)點(diǎn)V被成功激活,被成功 激活的節(jié)點(diǎn)V將加入激活節(jié)點(diǎn)集合S; INFv = Puv 如果puv〈0v,則未激活態(tài)鄰居節(jié)點(diǎn)V激活失敗,未激活態(tài)鄰居節(jié)點(diǎn)V記錄激活態(tài)節(jié)點(diǎn)U對 未激活態(tài)鄰居節(jié)點(diǎn)V的固定影響力buv和時(shí)間tx,然后將固定影響力buv累積到節(jié)點(diǎn)v的累積影 響力總和INF V; 所述,θν為混合式傳播模型為網(wǎng)絡(luò)里每個未激活態(tài)鄰居節(jié)點(diǎn)v的閾值,θνΕ[〇,1],該閾 值表示該節(jié)點(diǎn)受到影響的難易程度,且在傳播過程中不變化; 第二種,未激活態(tài)鄰居節(jié)點(diǎn)ν不是第一次被嘗試激活,則激活態(tài)節(jié)點(diǎn)W對未激活態(tài)鄰居 節(jié)點(diǎn)V激活成功的固定影響力為bwv,利用公式(3)和公式(4)計(jì)算累積影響力INFv,如果INFv > =θν,則未激活態(tài)鄰居節(jié)點(diǎn)v被成功激活,否則激活失敗,未激活態(tài)鄰居節(jié)點(diǎn)v記錄激活態(tài) 節(jié)點(diǎn)W對未激活態(tài)鄰居節(jié)點(diǎn)V的固定影響力b wv和時(shí)間tx,然后將固定影響力bwv累積到節(jié)點(diǎn)V 的累積影響力總和INFv; 所述,bwv為任意未激活態(tài)節(jié)點(diǎn)v將受到鄰居節(jié)點(diǎn)W的固定影響力,節(jié)點(diǎn)W對節(jié)點(diǎn)v的這種 固定影響力僅在節(jié)點(diǎn)W處于激活狀態(tài)時(shí)有效;任意未激活態(tài)節(jié)點(diǎn)v受到其所有鄰居節(jié)點(diǎn)w的 固定影響力之和不大于1; 累積影響力INFv的計(jì)算公式如下:(3) b uv - F ( buv , tinit, tnow) ( 4 ) 式中,F(xiàn)ail (v)是所有激活態(tài)節(jié)點(diǎn)u嘗試激活未激活態(tài)鄰居節(jié)點(diǎn)v但失敗的節(jié)點(diǎn)集合,W 是當(dāng)前正在嘗試激活未激活態(tài)鄰居節(jié)點(diǎn)v的已激活節(jié)點(diǎn),tinit是激活態(tài)節(jié)點(diǎn)u第一次嘗試激 活未激活態(tài)鄰居節(jié)點(diǎn)V的時(shí)間,tn?是當(dāng)前節(jié)點(diǎn)W嘗試激活未激活態(tài)鄰居節(jié)點(diǎn)V的時(shí)間,t/ 1?表 示隨著時(shí)間的推進(jìn)固定影響力buv衰減后的影響力大小,由公式(3)和公式(4)可知,1/_是 關(guān)于b uv、tinit和tn?的函數(shù)。3. 根據(jù)權(quán)利要求2所述的一種基于遺忘規(guī)律的社會網(wǎng)絡(luò)信息傳播方法,其特征在于所 述公式(4)的具體過程為:(6) 式中,e為自然底數(shù)。4. 根據(jù)權(quán)利要求3所述的一種基于遺忘規(guī)律的社會網(wǎng)絡(luò)信息傳播方法,其特征在于所 述 buv= 1/dv (5) 其中,dv表示未激活態(tài)鄰居節(jié)點(diǎn)v的度數(shù)。5. 根據(jù)權(quán)利要求4所述的一種基于遺忘規(guī)律的社會網(wǎng)絡(luò)信息傳播方法,其特征在于步 驟四所述未擴(kuò)散的激活節(jié)點(diǎn)為節(jié)點(diǎn)處于激活狀態(tài),但是還未嘗試激活鄰居節(jié)點(diǎn); 在網(wǎng)絡(luò)里的任意處于激活狀態(tài)的節(jié)點(diǎn)u只有一次機(jī)會嘗試激活其處于未激活狀態(tài)的鄰 居節(jié)點(diǎn)V,無論是否激活成功,在以后的傳播過程里,節(jié)點(diǎn)u仍將處于激活狀態(tài),但是失去對 其他節(jié)點(diǎn)的影響力,即不能再嘗試激活其他節(jié)點(diǎn),稱這類節(jié)點(diǎn)為已擴(kuò)散節(jié)點(diǎn),反之,如果節(jié) 點(diǎn)處于激活狀態(tài),但是還未向嘗試激活鄰居節(jié)點(diǎn),稱之為未擴(kuò)散節(jié)點(diǎn);已擴(kuò)散節(jié)點(diǎn)和未擴(kuò)散 節(jié)點(diǎn),都是激活狀態(tài)的節(jié)點(diǎn)。
【文檔編號】G06F17/30GK105868315SQ201610179681
【公開日】2016年8月17日
【申請日】2016年3月25日
【發(fā)明人】王紅濱, 印桂生, 劉紅麗, 陳曉龍, 馮夢園, 張玉鵬, 劉廣強(qiáng), 楊楠, 徐琳, 李華峰
【申請人】哈爾濱工程大學(xué)