亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于多層潛力和社區(qū)結(jié)構(gòu)的影響最大化方法與流程

文檔序號(hào):12125749閱讀:179來(lái)源:國(guó)知局

本發(fā)明屬于計(jì)算機(jī)數(shù)據(jù)挖掘領(lǐng)域,具體涉及一種利用社區(qū)結(jié)構(gòu)快速求解影響最大化問(wèn)題的方法,尤其涉及大規(guī)模網(wǎng)絡(luò)中的影響最大化求解問(wèn)題。



背景技術(shù):

影響最大化(Influence Maximization)是一個(gè)關(guān)于傳播的優(yōu)化問(wèn)題。不論是某個(gè)公司的新產(chǎn)品或者某種理念的有效推廣,還是對(duì)某種病毒或者災(zāi)害的有效控制,等一些其他同類(lèi)型的問(wèn)題,都避免不了考慮這樣的一個(gè)問(wèn)題,如何用有限的資源達(dá)到最好的效果。抽象為數(shù)學(xué)語(yǔ)言即為:對(duì)給定的網(wǎng)絡(luò)G(V,E,W),(其中V代表圖中的節(jié)點(diǎn)集合,E代表圖中邊的集合,W是從邊集E的邊到節(jié)點(diǎn)集V的節(jié)點(diǎn)對(duì)的映射所對(duì)應(yīng)的權(quán)值)在V中尋找k個(gè)種子節(jié)點(diǎn)組成的集合S,在某種擴(kuò)散模型下,最終的傳播范圍最廣,即使得V中影響的節(jié)點(diǎn)數(shù)目σ(S)最大。由此可見(jiàn),影響最大化的研究,具有很強(qiáng)的現(xiàn)實(shí)應(yīng)用背景。

在經(jīng)典的LT(Linear Threshold)和IC(Independent Cascade)傳播模型下,[1]不僅證明了影響最大化問(wèn)題是NP-C問(wèn)題,影響最大化函數(shù)σ(S)是次模函數(shù),而且還提出了結(jié)合次模的貪心算法來(lái)解決此問(wèn)題。該算法在理論上至少保證可達(dá)到最優(yōu)目標(biāo)的(1-1/e-ε)。其中,e是自然對(duì)數(shù),ε是任意小的正整數(shù)。簡(jiǎn)單的說(shuō),結(jié)合次模的貪心算法至少達(dá)到對(duì)應(yīng)最優(yōu)目標(biāo)的63%。(次模函數(shù)定義為:設(shè)集合對(duì)都有σ(U∪v)-σ(U)≥σ(T∪v)-σ(T),σ(S)≤σ(T)。也就是說(shuō),如果σ(·)是一個(gè)有限集合到非負(fù)整數(shù)的映射,且滿(mǎn)足遞增且邊界遞減效應(yīng),則σ(·)是次模函數(shù))由于其算法的時(shí)間復(fù)雜度,導(dǎo)致其很難適應(yīng)于大型網(wǎng)絡(luò)。隨后的研究主要分為,對(duì)已有模型下提出最適用的算法和通過(guò)現(xiàn)實(shí)建模并構(gòu)建出新的傳播模型。有的現(xiàn)有技術(shù)結(jié)合次模特性,在獨(dú)立級(jí)聯(lián)模型下提出了CELF算法,很大程度上降低了原算法的時(shí)間復(fù)雜度。在此基礎(chǔ)上,進(jìn)而又提出了CELF++算法,時(shí)間復(fù)雜度提高30%~50%。但是由于上述算法,在每次迭代過(guò)程中均要多次蒙特卡洛模擬產(chǎn)生的平均值作為影響力,時(shí)間復(fù)雜度相對(duì)比較高,導(dǎo)致其還是很難應(yīng)用于目前很多的大型網(wǎng)絡(luò)。

基于此,很多啟發(fā)式算法應(yīng)運(yùn)而生。一個(gè)直觀而又簡(jiǎn)單的想法是,選擇k個(gè)度最大的節(jié)點(diǎn),其中正是利用了此想法,但在每步選擇“未覆蓋”的節(jié)點(diǎn)中選擇度最大的。當(dāng)一個(gè)節(jié)點(diǎn)被選擇,它的鄰居節(jié)點(diǎn)被標(biāo)記為“覆蓋”。由于其標(biāo)記“覆蓋”的過(guò)程中也直接將激活和覆蓋等同,導(dǎo)致實(shí)驗(yàn)效果并不理想。有人提出了改進(jìn)的Degree-Discount算法來(lái)進(jìn)行初始節(jié)點(diǎn)的選擇,和CELF算法不同的是,當(dāng)一個(gè)節(jié)點(diǎn)被選擇,其鄰居節(jié)點(diǎn)的度減1,然后再此基礎(chǔ)上選擇度數(shù)最大的節(jié)點(diǎn)。然而它并不能解決將種子節(jié)點(diǎn)均衡分配到網(wǎng)絡(luò)中的任務(wù)。隨后結(jié)合種子節(jié)點(diǎn)的度和潛力提出了啟發(fā)式算法和貪心算法相結(jié)合的選擇策略,該類(lèi)方法,不僅考慮各個(gè)節(jié)點(diǎn)的度和潛力值,還要根據(jù)不同網(wǎng)絡(luò)選擇用啟發(fā)算法選擇的種子節(jié)點(diǎn)的比率,導(dǎo)致實(shí)驗(yàn)結(jié)果不太好控制。

近些年也出現(xiàn)了基于社區(qū)影響最大化的研究。其中定義社區(qū)結(jié)構(gòu)為一種相似性結(jié)構(gòu),即社區(qū)內(nèi)部鏈接緊密而社區(qū)之間鏈接稀疏?;诖?,很多研究就用節(jié)點(diǎn)在該社區(qū)內(nèi)的影響近似在整個(gè)網(wǎng)絡(luò)的影響,極大的縮小了時(shí)間復(fù)雜度。改進(jìn)的k-means聚類(lèi)算法將整個(gè)網(wǎng)絡(luò)聚類(lèi)為k個(gè)社區(qū),基于處于同一社區(qū)的相似性高,不同社區(qū)的相似性小的特性,從而在各個(gè)社區(qū)中選取處于中心的節(jié)點(diǎn)(社區(qū)影響力較大的節(jié)點(diǎn)),構(gòu)成初始種子節(jié)點(diǎn)集合S。這也導(dǎo)致忽略了社區(qū)間的差別,直接將各個(gè)社區(qū)看作同等地位,導(dǎo)致近似的誤差性過(guò)大。AMICS算法是根據(jù)已有的社區(qū)挖掘算法識(shí)別出社區(qū)結(jié)構(gòu),然后選擇跨社區(qū)最多的k個(gè)節(jié)點(diǎn),作為初始種子節(jié)點(diǎn)集合S。實(shí)驗(yàn)表明在小型或中等網(wǎng)絡(luò)結(jié)構(gòu)中有不錯(cuò)的效果,也是沒(méi)有考慮到社區(qū)間的區(qū)別。其中一種現(xiàn)有技術(shù),首先是利用提出的HClustering算法檢測(cè)社區(qū),然后利用網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)選取候種子節(jié)點(diǎn),最后在候選種子中選取種子節(jié)點(diǎn)。該算法并沒(méi)有在已有的獨(dú)立級(jí)聯(lián)模型或者線(xiàn)性閾值模型下驗(yàn)證。



技術(shù)實(shí)現(xiàn)要素:

有鑒于此,本發(fā)明的目的在于提供一種基于多層潛力和社區(qū)結(jié)構(gòu)的影響最大化方法。

本發(fā)明的目的是通過(guò)以下技術(shù)方案來(lái)實(shí)現(xiàn)的,一種基于多層潛力和社區(qū)結(jié)構(gòu)的影響最大化方法,其特征在于:包括兩個(gè)階段,第一階段:社區(qū)間基于多層潛力的種子擴(kuò)算;第二階段:社區(qū)內(nèi)的影響傳播;

在第一階段,種子節(jié)點(diǎn)v嘗試激活其處于未激活狀態(tài)的鄰居節(jié)點(diǎn){u|u∈N(v),active(u)=0},此過(guò)程中被激活的節(jié)點(diǎn)記為S1,則有其中N(S)=∪v∈SN(v),接下來(lái),S1又會(huì)嘗試激活其處于未激活狀態(tài)鄰居節(jié)點(diǎn){u|u∈N(S1)\S,active(u)=0},此過(guò)程中被激活的節(jié)點(diǎn)記為S2;

在第二階段,將節(jié)點(diǎn)影響的范圍限制在其所在的社區(qū)中,對(duì)任意的社區(qū)Ci∈C,影響規(guī)模取決于兩個(gè)因素:1)社區(qū)Ci的大小|Ci|,2)S2的節(jié)點(diǎn)落在該社區(qū)的個(gè)數(shù)|S2∩Ci|,當(dāng)|Ci|和|S2∩Ci|越大時(shí),該社區(qū)的影響范圍就越大;當(dāng)|Ci|>>|S2∩Ci|時(shí),該社區(qū)的影響取決于|S2∩Ci|的值;當(dāng)|Ci|≈|S2∩Ci|時(shí),該社區(qū)的影響取決于|Ci|的值。

進(jìn)一步,在第一階段中:

節(jié)點(diǎn)u∈N(S)\S的激活概率為:

節(jié)點(diǎn)v∈S的潛力為

節(jié)點(diǎn)v∈S1的潛力為

節(jié)點(diǎn)v∈N(S)\S的潛力為:

則表示|S1|,表示|S2|,

第一階段的總影響為:

進(jìn)一步,在第二階段中,社區(qū)Ci的影響函數(shù)如下:

其中,α,β是非負(fù)常參數(shù),第二階段S2在整個(gè)網(wǎng)絡(luò)的影響為:

把兩階段的影響相加,即為整個(gè)網(wǎng)絡(luò)的影響:

由于采用以上技術(shù)方案,本發(fā)明具有以下優(yōu)點(diǎn):

本發(fā)明提出的基于多層潛力和社區(qū)結(jié)構(gòu)的影響最大化方法,其效率不僅比已有最新的算法(如IPA算法)高,而且其準(zhǔn)確性也高于IPA算法及其他啟發(fā)式算法。

具體實(shí)施方式

下面對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行詳細(xì)的描述。

不失一般性,將一個(gè)無(wú)向無(wú)權(quán)圖定義為G=(V,E,W),其中V是節(jié)點(diǎn)集合,E是邊集合,W是對(duì)應(yīng)邊的鏈接權(quán)重。對(duì)于圖G,可以用一個(gè)鄰接矩陣A表示,如下:

對(duì)圖中的任意節(jié)點(diǎn)v,其鄰居節(jié)點(diǎn)集合表示為:

N(v)={u|Wv,u>0} (2)

在本發(fā)明中,用IC(Independent Cascade)模型,且對(duì)于圖G(V,E,W),定義則節(jié)點(diǎn)u對(duì)v的激活權(quán)重為puv如下:

由此可得對(duì)于無(wú)權(quán)圖G(V,E),則節(jié)點(diǎn)u對(duì)節(jié)點(diǎn)v的激活權(quán)重為kv表示v的度。進(jìn)一步的把圖G的社區(qū)結(jié)構(gòu)定義為圖G中節(jié)點(diǎn)的劃分C={C1,C2,...,Ck};∪iCi=V;Ci∩Cj=Φ,其中第i個(gè)社區(qū)Ci包含一個(gè)或多個(gè)節(jié)點(diǎn)(本發(fā)明只考慮非重疊社區(qū),即任意兩個(gè)社區(qū)間無(wú)同時(shí)包含的節(jié)點(diǎn))。給定任意節(jié)點(diǎn)v,用C(v)表示該節(jié)點(diǎn)所在社區(qū)。

在獨(dú)立級(jí)聯(lián)模型中,如果假定St表示第t步被激活的節(jié)點(diǎn)。則S0=S,因?yàn)殚_(kāi)始時(shí)種子節(jié)點(diǎn)集S中的所有元素都處于激活狀態(tài)。接下來(lái)從t=0到t=1,種子節(jié)點(diǎn)嘗試激活其處于未激活狀態(tài)的鄰居節(jié)點(diǎn){u|u∈N(v),active(u)=0}其中,active(u)=0表示節(jié)點(diǎn)u處于未激活狀態(tài)。因此有其中N(S)=∪v∈SN(v)。如此重復(fù),直到ST=Φ,得到整個(gè)網(wǎng)絡(luò)的擴(kuò)散范圍是問(wèn)題是,并不能確切得出S1,更別說(shuō)接下來(lái)的S2,S3,S4…。

為了解決上述問(wèn)題,本發(fā)明提出了基于多層潛力和社區(qū)結(jié)構(gòu)的影響最大化傳播方法。該方法假設(shè)影響力的傳播分為兩個(gè)階段,1)社區(qū)間基于多層潛力的種子擴(kuò)算,2)社區(qū)內(nèi)的影響傳播。

a)社區(qū)間基于多層潛力的種子擴(kuò)算

在這個(gè)階段,種子節(jié)點(diǎn)v嘗試激活其處于未激活狀態(tài)的鄰居節(jié)點(diǎn){u|u∈N(v),active(u)=0}。因此有其中N(S)=∪v∈SN(v)。接下來(lái),S1又會(huì)嘗試激活其處于未激活狀態(tài)鄰居節(jié)點(diǎn){u|u∈N(S1)\S,active(u)=0},此過(guò)程中被激活的節(jié)點(diǎn),記為S2。由于此過(guò)程,傳播很可能是跨越多個(gè)社區(qū),所以也稱(chēng)為種子節(jié)點(diǎn)的擴(kuò)散。

b)社區(qū)內(nèi)的影響傳播

在本階段考慮S2的影響力的過(guò)程中,在這里引入社區(qū)的概念,在每個(gè)社區(qū)中,節(jié)點(diǎn)就像開(kāi)始的種子節(jié)點(diǎn),其影響的范圍限制在其所在的社區(qū)中,先前的研究也支撐了這種假設(shè)。

為了實(shí)現(xiàn)本發(fā)明,有兩個(gè)問(wèn)題需要解決:

1)已知種子節(jié)點(diǎn)怎么求得被激活的鄰居節(jié)點(diǎn),這包括S→S1以及S1→S2

2)節(jié)點(diǎn)S2在以后社區(qū)內(nèi)的影響值。

問(wèn)題1),本發(fā)明給出潛力的定義和解決方法:

節(jié)點(diǎn)u∈N(S)\S的激活概率為:

為了更好的解決上面的問(wèn)題,本發(fā)明引入了多層潛力的概念,節(jié)點(diǎn)v∈S的潛力為:

那么在上面的基礎(chǔ)上再進(jìn)一步對(duì)節(jié)點(diǎn)v∈S1的潛力

公式(6)是基于S1和N(S1),但是不確切的知道S1以及N(S1)。由于節(jié)點(diǎn)v∈N(S)\S成為S1的激活概率為pSv;其隱含的表示了在考慮S的第二層鄰居節(jié)點(diǎn)(可能包含S的第一層鄰居節(jié)點(diǎn)和S)被激活時(shí),至于被重復(fù)考慮的其他節(jié)點(diǎn)被認(rèn)為是累加了更多的影響力。因此對(duì)v∈N(S)\S的潛力可以描述為:

就用表示|S1|,表示|S2|。

第一階段的總影響為:

問(wèn)題2)在該階段,考慮S2中節(jié)點(diǎn)在各自社區(qū)中后續(xù)的影響。對(duì)任意的社區(qū)影響范圍主要取決于兩個(gè)因素。1)社區(qū)Ci的大小|Ci|,2)S2的節(jié)點(diǎn)落在該社區(qū)的個(gè)數(shù)|S2∩Ci|。為了更好的估計(jì)S2在社區(qū)Ci的影響,應(yīng)該遵循以下規(guī)則:

當(dāng)|Ci|和|S2∩Ci|越大時(shí),該社區(qū)的影響范圍就越大。

當(dāng)|Ci|>>|S2∩Ci|時(shí),該社區(qū)的影響取決于|S2∩Ci|的值。

當(dāng)|Ci|≈|S2∩Ci|時(shí),該社區(qū)的影響取決于|Ci|的值。

該社區(qū)Ci的影響函數(shù)g(S2,Ci)是|S2∩Ci|的次模。

基于此,本發(fā)明定義該社區(qū)Ci的影響函數(shù)如下:

其中,α,β是非負(fù)常參數(shù)。

第二階段S2在整個(gè)網(wǎng)絡(luò)的影響就是:

把兩階段的影響相加,即為整個(gè)網(wǎng)絡(luò)的影響:

則公式(11)給出的目標(biāo)函f(S)滿(mǎn)足Submodularity。

為了證明f(S)是滿(mǎn)足Submodularity,要證明f1(S)和f2(S2)分別滿(mǎn)足Submodularity。

首先,證明f1(S)=|S|+|S1|+|S2|滿(mǎn)足Submodularity,即對(duì)網(wǎng)絡(luò)G=(V,E,W)中的節(jié)點(diǎn)v和節(jié)點(diǎn)集合V的子集T,R有:

f1(R∪v)-f1(R)≥f1(T∪v)-f1(T) (12)

當(dāng)?shù)玫絝1(R∪v)-f1(R)=f1(T∪v)-f1(T)=0,公式(12)滿(mǎn)足。

當(dāng)?shù)玫絝1(R∪v)-f1(R)>0=f1(T∪v)-f1(T),公式(12)滿(mǎn)足。

當(dāng)則|R∪v|-|R|=|T∪v|-|T|=1,

因?yàn)閯t對(duì)得到p(T∪v)u-pTu≤p(R∪v)u-pRu,p(N(T∪v)\(T∪v))u-p(N(T)\T)u≤p(N(R∪v)\(R∪v))u-p(N(R)\R)u;

由此可推出|(R∪v)1|-|R1|≥|(T∪v)1|-|T1|以及

|(R∪v)2|-|R2|≥|(T∪v)2|-|T2|。

因此f1(R∪v)-f1(R)≥f1(T∪v)-f1(T)。公式(12)滿(mǎn)足。

接下來(lái)證明f2(S2)滿(mǎn)足Submodularity。

由述可知,|S2|是關(guān)于S的次模函數(shù)。如果考慮社區(qū)可得出|S2∩Ci|也是關(guān)于S的次模函數(shù)。

設(shè)α≥0,β≥0,c≥0,其中α,β,c是人為設(shè)定的參數(shù)。

由微積分知識(shí)可得:

從而知道t(x)是關(guān)于x的單調(diào)遞增函數(shù),并且是隨著x的增大,t(x)增加的速度越來(lái)越慢。因此對(duì)g(S2,Ci)是關(guān)于|S2∩Ci|單調(diào)遞增的,且隨著|S2∩Ci|增大,g(S2,Ci)增的越來(lái)越慢。

所以,g(S2,Ci)是關(guān)于|S2∩Ci|,也是S的次模函數(shù)。繼而得出滿(mǎn)足Submodularity。

綜合1)和2),f(S)=f1(S)+f2(S2)滿(mǎn)足Submodularity,定理得證。

最后說(shuō)明的是,以上優(yōu)選實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案而非限制,盡管通過(guò)上述優(yōu)選實(shí)施例已經(jīng)對(duì)本發(fā)明進(jìn)行了詳細(xì)的描述,但本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,可以在形式上和細(xì)節(jié)上對(duì)其作出各種各樣的改變,而不偏離本發(fā)明權(quán)利要求書(shū)所限定的范圍。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1