本發(fā)明屬于復(fù)雜網(wǎng)絡(luò)鏈接預(yù)測
技術(shù)領(lǐng)域:
,特別涉及一種基于時(shí)間序列的復(fù)雜網(wǎng)絡(luò)鏈接預(yù)測方法。
背景技術(shù):
:復(fù)雜網(wǎng)絡(luò)模型是對(duì)各種真實(shí)存在網(wǎng)絡(luò)的抽象,比如社交網(wǎng)絡(luò)、科研合作網(wǎng)絡(luò)、生物代謝網(wǎng)絡(luò)等。鏈接預(yù)測,是根據(jù)觀察到的網(wǎng)絡(luò)中已有的鏈接和節(jié)點(diǎn)屬性信息,來估計(jì)兩個(gè)節(jié)點(diǎn)間鏈接存在的可能性,包括當(dāng)前存在但是觀察不到的鏈接,以及將來可能出現(xiàn)的鏈接。作為鏈接挖掘分析中最重要的問題之一,鏈接預(yù)測有著多種多樣的應(yīng)用:它可以用于推薦系統(tǒng),幫助人們找到新朋友或潛在的合作者,在網(wǎng)上購物中提供感興趣的商品;也能用來推斷完整的網(wǎng)絡(luò)結(jié)構(gòu),更好地理解網(wǎng)絡(luò)演化;在生物學(xué)領(lǐng)域,還能用來發(fā)現(xiàn)蛋白質(zhì)之間的交互情況?,F(xiàn)有的鏈接預(yù)測可以分為兩類:靜態(tài)網(wǎng)絡(luò)鏈接預(yù)測以及基于時(shí)間序列的網(wǎng)絡(luò)連接預(yù)測。靜態(tài)方法主要采用網(wǎng)絡(luò)拓?fù)湫畔⒁约肮?jié)點(diǎn)屬性信息進(jìn)行鏈接預(yù)測。時(shí)間序列預(yù)測方法主要采用不同時(shí)間點(diǎn)的網(wǎng)絡(luò)變化信息對(duì)鏈接進(jìn)行預(yù)測。預(yù)測的網(wǎng)絡(luò)變化需要滿足線性變化的條件。兩種方法對(duì)任意兩個(gè)不直接相連節(jié)點(diǎn)之間存在鏈接的概率進(jìn)行評(píng)分,最后通過評(píng)分閾值或整體預(yù)測比例進(jìn)行確定存在鏈接的節(jié)點(diǎn)對(duì)。然而這種方法對(duì)以下兩種情況不能很好的預(yù)測:第一種是兩個(gè)節(jié)點(diǎn)之間距離較近并且節(jié)點(diǎn)較為相似但是網(wǎng)絡(luò)比較穩(wěn)定的情況(即:預(yù)測出現(xiàn)不應(yīng)出現(xiàn)的鏈接);第二種是兩節(jié)點(diǎn)之間連接概率隨著時(shí)間點(diǎn)的推移不斷增大但是當(dāng)前結(jié)果并沒有達(dá)到閾值的情況(即:不能預(yù)測應(yīng)該出現(xiàn)的鏈接)。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的是解決現(xiàn)有網(wǎng)絡(luò)鏈接預(yù)測方法中預(yù)測出現(xiàn)不應(yīng)出現(xiàn)的鏈接和不能預(yù)測應(yīng)該出現(xiàn)的鏈接的缺陷,提供了一種基于時(shí)間序列的復(fù)雜網(wǎng)絡(luò)鏈接預(yù)測方法。本發(fā)明提供的技術(shù)方案為:一種基于時(shí)間序列的復(fù)雜網(wǎng)絡(luò)鏈接預(yù)測方法,包括如下步驟:步驟一、使用靜態(tài)方法對(duì)任意兩個(gè)節(jié)點(diǎn)的鏈接概率進(jìn)行評(píng)分;步驟二、使用時(shí)間序列的方法,獲取最近不相連的任意兩節(jié)點(diǎn)的鏈接出現(xiàn)概率;步驟三、對(duì)于使用靜態(tài)方法計(jì)算出的鏈接出現(xiàn)概率序列p1,p2,…pk,計(jì)算其權(quán)值:W(i)=α(pi-pi-1)+(1-α)W(i-1)i=2…kW(1)=1其中α為調(diào)整系數(shù),k為網(wǎng)絡(luò)快照個(gè)數(shù);得到最終的鏈接出現(xiàn)的概率P=W(k)pk+1;步驟四、對(duì)步驟三中計(jì)算得到的結(jié)果進(jìn)行排序,輸出預(yù)測的鏈接。優(yōu)選的是,步驟一中,任取節(jié)點(diǎn)A和節(jié)點(diǎn)B,節(jié)點(diǎn)A到節(jié)點(diǎn)B的鏈接概率為其中為從節(jié)點(diǎn)A到節(jié)點(diǎn)B的第i條無環(huán)路徑,為這條路徑的長度。優(yōu)選的是,步驟一中,節(jié)點(diǎn)A到節(jié)點(diǎn)B的鏈接概率評(píng)分為:εt是獨(dú)立同分布的隨機(jī)變量序列,滿足期望為0的條件,Φi是不同時(shí)刻網(wǎng)絡(luò)快照的權(quán)重。本發(fā)明的有益效果是:本發(fā)明提供了一種于時(shí)間序列的復(fù)雜網(wǎng)絡(luò)鏈接預(yù)測方法,通過加權(quán)算法,使預(yù)測結(jié)果更為精確。附圖說明圖1為本發(fā)明所述的基于時(shí)間序列的復(fù)雜網(wǎng)絡(luò)鏈接預(yù)測方法流程圖。圖2為第一時(shí)刻節(jié)點(diǎn)連接示意圖。圖3為第二時(shí)刻節(jié)點(diǎn)連接示意圖。圖4為第三時(shí)刻節(jié)點(diǎn)連接示意圖。圖5為第四時(shí)刻節(jié)點(diǎn)連接示意圖。具體實(shí)施方式下面結(jié)合附圖對(duì)本發(fā)明做進(jìn)一步的詳細(xì)說明,以令本領(lǐng)域技術(shù)人員參照說明書文字能夠據(jù)以實(shí)施。如圖1所示,本發(fā)明提供了一種基于時(shí)間序列的復(fù)雜網(wǎng)絡(luò)鏈接預(yù)測方法,包括如下步驟:步驟一:使用靜態(tài)方法對(duì)任意兩個(gè)節(jié)點(diǎn)的鏈接概率進(jìn)行評(píng)分。在該階段可以使用網(wǎng)絡(luò)拓?fù)?,?jié)點(diǎn)屬性等信息對(duì)。步驟二:使用時(shí)間序列的方法針對(duì)所有的靜態(tài)鏈接概率評(píng)分結(jié)果進(jìn)行計(jì)算,得出最近不相連的任意兩節(jié)點(diǎn)的鏈接出現(xiàn)概率。第三步:計(jì)算權(quán)值。具體方法如下:對(duì)于一個(gè)使用靜態(tài)方法計(jì)算出的一個(gè)鏈接出現(xiàn)概率序列p1,p2,…pk,其中k表示時(shí)間序列的中時(shí)間步的個(gè)數(shù),他的權(quán)值可以使用以下遞歸公式計(jì)算出來:W(i)=α((pi-pi-1)+(1-α)W(i-1)i=2…kW(1)=1對(duì)于最終的鏈接出現(xiàn)的概率計(jì)算加權(quán)得到:P=W(k)pk+1步驟四:排序所有結(jié)果,根據(jù)定義好的閾值或比例系數(shù)輸出預(yù)測的鏈接。其實(shí)現(xiàn)過程如下:靜態(tài)方法中使用了拓?fù)湫畔?,?jié)點(diǎn)A到節(jié)點(diǎn)B的鏈接概率為其中為從節(jié)點(diǎn)A到節(jié)點(diǎn)B的第i條無環(huán)路徑。為這條路徑的長度。在時(shí)間序列方法中使用了ARMA方法,得到概率評(píng)分:如圖2-圖5所示,通過靜態(tài)方法獲得的評(píng)分如表1-表4所示。表1:通過靜態(tài)方法計(jì)算出的圖2中兩個(gè)節(jié)點(diǎn)鏈接概率評(píng)分123456781NANANANA2/95/16NA1/82NA5/16NA5/162/91/834/2253NANA1/2NA5/162/94NANA1/22/95/165NANA5/16NA6NANA5/167NA34/2258NA表2:通過靜態(tài)方法計(jì)算出的圖3中兩個(gè)節(jié)點(diǎn)鏈接概率評(píng)分表3:通過靜態(tài)方法計(jì)算出的圖4中兩個(gè)節(jié)點(diǎn)鏈接概率評(píng)分123456781NANANANA118/22511/16NA11/362NA49/72NA5/9118/22519/363439/110253NANA49/72NA49/723782/110254NANA11/16118/22557/1445NANA5/9NA6NANA57/1447NA3439/110258NA表4:通過靜態(tài)方法計(jì)算出的圖5中兩個(gè)節(jié)點(diǎn)鏈接概率評(píng)分123456781NANANANA3013/3600131/144NA411/9002NA1319/1800NA1061/1200697/900683/90080749/1764003NANA523/600NA1447/180081337/1764004NANA131/1443013/3600571/12005NANA56/75NA6NANA571/12007NA25283/588008NA通過時(shí)間序列的方法獲得的評(píng)分如表5所示,其中其中εt取值為0,Φi={0.5,0.3,0.16,0.04}。表5:通過時(shí)間序列方法得出的最終評(píng)分根據(jù)時(shí)間序列的方法獲得的鏈接可能性排列為:<4,6>,<1,6>,<3,5>,<2,5>,<3,7>,<2,3>,<4,7>,<5,7>,<2,6>,<2,7>,<6,8>,<4,8>,<3,8>,<1,8>,<2,8>,<1,5>。權(quán)值為:123456781NANANANA0.3030.251NA0.1852NA0.180NA0.3160.2130.2910.0983NANA0.212NA0.1900.2604NANA0.2340.3090.1285NANA0.227NA6NANA0.1287NA0.0988NA最終的評(píng)分為:123456781NANANANA0.1066560.191764NA0.0663722NA0.11447NA0.2135480.1267350.121790.0346953NANA0.159NA0.1714020.100064NANA0.1804140.1968330.0541445NANA0.139151NA6NANA0.056197NA0.034508NA加權(quán)之后的鏈接可能性排列為:<2,5>,<4,7>,<1,6>,<4,6>,<3,7>,<3,5>,<5,7>,<2,6>,<2,7>,<2,3>,<1,5>,<3,8>,<1,8>,<6,8>,<4,8>,<2,8>,<7,8>。和之前的序列相比,節(jié)點(diǎn)2和節(jié)點(diǎn)5的鏈接概率以及節(jié)點(diǎn)4和節(jié)點(diǎn)7的鏈接概率被提升到最前方,而節(jié)點(diǎn)4和節(jié)點(diǎn)6的鏈接概率以及節(jié)點(diǎn)1和節(jié)點(diǎn)6的鏈接概率在序列中被后移。通過網(wǎng)絡(luò)演化可看出,我們解決了前文提及的兩個(gè)問題。盡管本發(fā)明的實(shí)施方案已公開如上,但其并不僅僅限于說明書和實(shí)施方式中所列運(yùn)用,它完全可以被適用于各種適合本發(fā)明的領(lǐng)域,對(duì)于熟悉本領(lǐng)域的人員而言,可容易地實(shí)現(xiàn)另外的修改,因此在不背離權(quán)利要求及等同范圍所限定的一般概念下,本發(fā)明并不限于特定的細(xì)節(jié)和這里示出與描述的圖例。當(dāng)前第1頁1 2 3