亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于馬爾科夫過(guò)程亞穩(wěn)性的復(fù)雜網(wǎng)絡(luò)簇結(jié)構(gòu)分析和識(shí)別方法

文檔序號(hào):6604752閱讀:240來(lái)源:國(guó)知局
專利名稱:基于馬爾科夫過(guò)程亞穩(wěn)性的復(fù)雜網(wǎng)絡(luò)簇結(jié)構(gòu)分析和識(shí)別方法
技術(shù)領(lǐng)域
本發(fā)明屬于模式識(shí)別和數(shù)據(jù)挖掘領(lǐng)域,尤其涉及社會(huì)網(wǎng)、萬(wàn)維網(wǎng)和生物網(wǎng)絡(luò)等復(fù) 雜網(wǎng)絡(luò)的分析。
背景技術(shù)
現(xiàn)實(shí)世界中的諸多系統(tǒng)都以網(wǎng)絡(luò)形式存在,如社會(huì)系統(tǒng)中的人際關(guān)系網(wǎng)、科學(xué)家 協(xié)作網(wǎng)和流行病傳播網(wǎng),生態(tài)系統(tǒng)中的神經(jīng)元網(wǎng)、基因調(diào)控網(wǎng)和蛋白質(zhì)交互網(wǎng),科技系統(tǒng)中 的電網(wǎng)、因特網(wǎng)和萬(wàn)維網(wǎng)等。由于這些網(wǎng)絡(luò)具有很高的復(fù)雜性,因此被稱為“復(fù)雜網(wǎng)絡(luò)”。與 小世界性和無(wú)標(biāo)度性并列,復(fù)雜網(wǎng)絡(luò)簇結(jié)構(gòu)(CNCS)是復(fù)雜網(wǎng)絡(luò)最普遍和最重要的拓?fù)浣Y(jié) 構(gòu)屬性之一,具有同簇節(jié)點(diǎn)相互連接緊密、異簇節(jié)點(diǎn)相互連接稀疏的特點(diǎn)。CNCS識(shí)別方法旨 在揭示出復(fù)雜網(wǎng)絡(luò)中真實(shí)存在的網(wǎng)絡(luò)簇結(jié)構(gòu)。CNCS識(shí)別方法對(duì)分析復(fù)雜網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)、理解其功能、發(fā)現(xiàn)其隱模式和預(yù)測(cè)其 行為都具有十分重要的意義,具有廣泛的應(yīng)用前景,目前已被應(yīng)用于恐怖組織識(shí)別、組織機(jī) 構(gòu)管理等社會(huì)網(wǎng)絡(luò)分析,新陳代謝網(wǎng)絡(luò)分析、蛋白質(zhì)交互網(wǎng)絡(luò)分析和未知蛋白質(zhì)功能預(yù)測(cè)、 基因調(diào)控網(wǎng)絡(luò)分析和主控基因識(shí)別等生物網(wǎng)絡(luò)分析,萬(wàn)維網(wǎng)社區(qū)挖掘和基于主題詞的萬(wàn)維 網(wǎng)文檔聚類,搜索引擎,空間數(shù)據(jù)聚類和圖像分割,關(guān)系數(shù)據(jù)分析等眾多領(lǐng)域。目前已存在多種CNCS識(shí)別算法,按照所采用的基本求解策略,它們中的大多數(shù)可 歸屬為兩大類基于優(yōu)化的識(shí)別方法和啟發(fā)式識(shí)別方法。前者將CNCS識(shí)別問(wèn)題轉(zhuǎn)化為優(yōu)化 問(wèn)題,通過(guò)最優(yōu)化預(yù)定義的目標(biāo)函數(shù)來(lái)計(jì)算復(fù)雜網(wǎng)絡(luò)的簇結(jié)構(gòu),后者基于預(yù)定義的啟發(fā)式 規(guī)則設(shè)計(jì)啟發(fā)式算法。譜方法和局部搜索方法是兩類主要的基于優(yōu)化的CNCS識(shí)別方法。譜方法和局部搜索方法是兩類主要的基于優(yōu)化的CNCS識(shí)別方法。譜方法將網(wǎng)絡(luò) 聚類問(wèn)題轉(zhuǎn)化為二次型優(yōu)化問(wèn)題,通過(guò)計(jì)算特殊矩陣的特征向量來(lái)優(yōu)化預(yù)定義的“截”函 數(shù)。譜方法具有嚴(yán)密的數(shù)學(xué)理論,已發(fā)展成聚類的一種重要方法(稱為譜聚類法),被廣 泛應(yīng)用于圖分割和空間點(diǎn)聚類等領(lǐng)域。但是,針對(duì)CNCS識(shí)別,譜方法的主要不足是需要 借助先驗(yàn)知識(shí)定義遞歸終止條件,即譜方法不具備自動(dòng)識(shí)別網(wǎng)絡(luò)簇總數(shù)的能力。1970年的 Kernighan-Lin算法、2004年的快速Newman算法和2005年的Guimera-Amaral算法是三個(gè) 典型的基于局部搜索優(yōu)化技術(shù)的CNCS識(shí)別算法。這類算法都包含三個(gè)基本部分目標(biāo)函 數(shù)、候選解的搜索策略和最優(yōu)解的搜索策略,但在具體實(shí)現(xiàn)上各不相同。其后提出的具有代 表性的基于優(yōu)化的CNCS識(shí)別算法有2008年提出的基于極大似然的CNCS識(shí)別算法、2009 年提出的改進(jìn)譜方法和2010年提出的基于蒙特卡洛方法的CNCS識(shí)別算法。采用優(yōu)化方法識(shí)別出的網(wǎng)絡(luò)簇結(jié)構(gòu)完全取決于優(yōu)化目標(biāo),因此“有偏”的目標(biāo)函數(shù) 會(huì)導(dǎo)致“有偏”的解(即得到的網(wǎng)絡(luò)簇結(jié)構(gòu)和真實(shí)存在的網(wǎng)絡(luò)簇結(jié)構(gòu)不符)。值得注意的是, 包括以上提到的快速Newman算法和Guimera-Amaral算法在內(nèi),很多基于優(yōu)化的CNCS識(shí)別 方法都以最大化2002年Newman提出的Q函數(shù)作為優(yōu)化目標(biāo)。然而研究發(fā)現(xiàn),Q函數(shù)是有偏 的,并不能完全準(zhǔn)確地刻畫真實(shí)的網(wǎng)絡(luò)簇結(jié)構(gòu)。例如,對(duì)于基準(zhǔn)測(cè)試數(shù)據(jù)Karate社會(huì)網(wǎng)絡(luò)而言,其真實(shí)的網(wǎng)絡(luò)簇結(jié)構(gòu)對(duì)應(yīng)的Q值是局部極大值,而非全局最大值。2004年,Guimera 等研究發(fā)現(xiàn),對(duì)于某些隨機(jī)網(wǎng)絡(luò),由于受到擾動(dòng)的影響,明顯不好的網(wǎng)絡(luò)簇結(jié)構(gòu)卻對(duì)應(yīng)相對(duì) 較高的Q值。2007年,F(xiàn)ortunato和Barthelemy系統(tǒng)地研究了 Q函數(shù)對(duì)識(shí)別精度的影響, 指出基于優(yōu)化Q函數(shù)的CNCS識(shí)別算法傾向于找到粗糙的而不是精細(xì)的網(wǎng)絡(luò)簇結(jié)構(gòu)。這意 味著,在多數(shù)情況下這類算法不能識(shí)別出網(wǎng)絡(luò)中真實(shí)存在的全部網(wǎng)絡(luò)簇。2002 年的 MFC (Maximum Flow Community)算法、2002 年的 Girvan-Newman (GN)算 法、2004 年的 Wu-Huberman(WH)算法和 2005 年的 CPM(Clique Percolation Method)算法 等是典型的啟發(fā)式CNCS識(shí)別算法。其后提出的具有代表性的啟發(fā)式算法還包括2008年 提出的層次聚類算法、2009年提出的基于信息論的CNCS識(shí)別算法、2010年提出的基于拉普 拉斯動(dòng)力性的多粒度CNCS識(shí)別算法等。這類算法的共同特點(diǎn)是基于某些直觀的假設(shè)來(lái)設(shè) 計(jì)算法采用的啟發(fā)式信息,對(duì)于大部分網(wǎng)絡(luò),它們能夠快速地找一個(gè)近似最優(yōu)解,但無(wú)法從 理論上嚴(yán)格保證它們對(duì)任何的輸入網(wǎng)絡(luò)都能找到令人滿意的解。綜上所述,盡管已存在多種方法,但都具有各自的局限性,CNCS識(shí)別問(wèn)題還遠(yuǎn)遠(yuǎn) 沒(méi)有被很好解決,集中體現(xiàn)在以下2個(gè)方面第一,從理論上我們還沒(méi)有客觀地認(rèn)識(shí)清楚網(wǎng)絡(luò)簇結(jié)構(gòu)的本質(zhì)含義。目前我們還 無(wú)法回答類似如下的基本問(wèn)題網(wǎng)絡(luò)簇結(jié)構(gòu)是怎么形成的?它與網(wǎng)絡(luò)的其它性質(zhì)有什么必 然聯(lián)系?它與網(wǎng)絡(luò)自身的哪些內(nèi)在屬性有關(guān)?因此,現(xiàn)階段我們不得不通過(guò)觀察有簇網(wǎng)絡(luò) 所展示出的“外在”現(xiàn)象去理解網(wǎng)絡(luò)簇概念,進(jìn)而借助“主觀”定義的目標(biāo)函數(shù)或啟發(fā)式規(guī)則 去刻畫和識(shí)別CNCS。如前分析,基于這些目標(biāo)函數(shù)或啟發(fā)式規(guī)則的算法常常會(huì)導(dǎo)致“有偏” 的計(jì)算結(jié)果,并且采用不同的目標(biāo)函數(shù)或啟發(fā)式規(guī)則常常會(huì)計(jì)算出不同的CNCS。因此,一個(gè) 基本問(wèn)題是從網(wǎng)絡(luò)的“內(nèi)在”屬性出發(fā),我們能否給出一種“客觀”的理論模型去解釋、刻 畫和識(shí)別CNCS。第二,現(xiàn)有的CNCS識(shí)別算法都具有各自的局限性,不能同時(shí)滿足無(wú)偏、計(jì)算速度 快、識(shí)別精度高、無(wú)監(jiān)督(即不依賴先驗(yàn)知識(shí)、對(duì)參數(shù)不敏感)等基本要求。通過(guò)定性和定 量的分析、比較現(xiàn)有的主要算法后發(fā)現(xiàn),識(shí)別精度高的算法往往具有很高時(shí)間復(fù)雜性(高 于0(n2)),而快速的識(shí)別算法往往以犧牲精度為代價(jià)并且需要較多的參數(shù)和先驗(yàn)知識(shí)。另 外特別需要指出的是,如何在沒(méi)有任何先驗(yàn)信息的情況下識(shí)別出真實(shí)的網(wǎng)絡(luò)簇總數(shù)仍是一 個(gè)未解決的難題。因此,如何設(shè)計(jì)出快速、高精度和無(wú)監(jiān)督的CNCS識(shí)別方法是當(dāng)前最期待 解決的問(wèn)題之一。

發(fā)明內(nèi)容
本發(fā)明的目的在于揭示復(fù)雜網(wǎng)絡(luò)分簇現(xiàn)象的本質(zhì),并提供一種用于定量分析和 快速識(shí)別復(fù)雜網(wǎng)絡(luò)簇結(jié)構(gòu)的方法。為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于馬爾科夫過(guò)程亞穩(wěn)性的復(fù)雜網(wǎng)絡(luò)簇結(jié)構(gòu) 分析和識(shí)別方法,其特征在于包括如下步驟構(gòu)造給定復(fù)雜網(wǎng)絡(luò)上的一個(gè)Markov過(guò)程;計(jì)算該過(guò)程的一步轉(zhuǎn)移概率矩陣,并計(jì)算該矩陣的特征值;通過(guò)分析特征值計(jì)算出網(wǎng)絡(luò)簇個(gè)數(shù);計(jì)算Markov過(guò)程的第一個(gè)亞穩(wěn)態(tài);
根據(jù)第一個(gè)亞穩(wěn)態(tài)識(shí)別出網(wǎng)絡(luò)的全部網(wǎng)絡(luò)簇及其層次結(jié)構(gòu)。


圖1所示的流程圖給出了基于Markov過(guò)程亞穩(wěn)性分析和識(shí)別復(fù)雜網(wǎng)絡(luò)簇結(jié)構(gòu)的 理論框架NAP ;圖2所示的流程圖給出了以上理論框架的一種快速實(shí)現(xiàn)方法fast_NAP,該方法能 夠在近似線性的時(shí)間內(nèi)識(shí)別出網(wǎng)絡(luò)中真實(shí)存在的全部網(wǎng)絡(luò)簇及其層次結(jié)構(gòu)。該方法免參 數(shù),且不需要網(wǎng)絡(luò)先驗(yàn)知識(shí);圖3-圖7給出了采用NAP和fast_NAP方法分析不同網(wǎng)絡(luò)的結(jié)果。
具體實(shí)施例方式
下面將對(duì)本發(fā)明進(jìn)行詳細(xì)說(shuō)明。參照?qǐng)D1,NAP方法的流程開始于步驟101。步驟102給出了構(gòu)造網(wǎng)絡(luò)上Markov過(guò)程的方法,具體如下假設(shè)網(wǎng)絡(luò)中存在一個(gè)Agent,該Agent能夠沿著網(wǎng)絡(luò)連接從一個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)隨機(jī)的 移動(dòng)到其它網(wǎng)絡(luò)節(jié)點(diǎn)。用P{xt = i,1彡i彡η}表示Agent經(jīng)過(guò)t時(shí)間到達(dá)網(wǎng)絡(luò)節(jié)點(diǎn)i的 概率,X = {Xt,t彡0}表示Agent在不同時(shí)刻位置構(gòu)成的隨機(jī)序列。由于Agent在t時(shí)刻 的位置唯一地由其在t-Ι時(shí)刻的位置決定而和t-Ι時(shí)刻之前的位置都無(wú)關(guān),即滿足P(Xt = it IX0 = i0, X1 = I1,…,Xh = it_J =P(Xt = iJX^ = it_J因此隨機(jī)序列X滿足馬爾科夫性,是一個(gè)離散、時(shí)齊的Markov過(guò)程。步驟103給出了構(gòu)造網(wǎng)絡(luò)上Markov過(guò)程轉(zhuǎn)移概率矩陣P的方法,具體如下P = D 1A其中矩陣A = (aij)nXn表示網(wǎng)絡(luò)的鄰接矩陣,D = diag(d1,…dn)表示網(wǎng)絡(luò)的度 矩陣,其中Cli=E步驟104給出了計(jì)算I-P矩陣特征值的方法,具體采用冪法,迭代地計(jì)算出矩陣 I-P的全部特征值。 步驟105給出了根據(jù)以上特征值計(jì)算出網(wǎng)絡(luò)簇個(gè)數(shù)K的方法,具體如下夂=argminCQ
K其中,CQk = λ κ/入K+1,A = U1,…,λ n)表示矩陣I-P的特征值。步驟106給出了計(jì)算出Markov過(guò)程第一個(gè)亞穩(wěn)態(tài)S1的方法,具體如下S1 = Ρυλκ+ι其中P表示步驟103計(jì)算出來(lái)的Markov過(guò)程一步轉(zhuǎn)移概率矩陣。λ K+1表示矩陣 I-P的第K+1小特征值。步驟107給出了從S1識(shí)別出K個(gè)網(wǎng)絡(luò)簇及其層次結(jié)構(gòu)的一般方法,其中一個(gè)具體 方法如下將矩陣S1中的每一行看作一個(gè)η維的向量,于是共有η個(gè)η-維向量,每個(gè)向量對(duì) 應(yīng)網(wǎng)絡(luò)中的一個(gè)節(jié)點(diǎn);采用基于相似度的向量聚類方法(如K-均值)將以上η個(gè)η-維向量聚成K個(gè)類,對(duì)應(yīng)網(wǎng)絡(luò)的K個(gè)簇。參照?qǐng)D2,fast NAP方法的流程開始于步驟201 ;步驟202給出了選擇網(wǎng)絡(luò)中最穩(wěn)定的狀態(tài)的方法,具體如下 其中Cli表示節(jié)點(diǎn)i的度。步驟203給出了計(jì)算c的不變序分布的方法,具體如下迭代計(jì)算所有狀態(tài)到達(dá)狀態(tài)c的t_步轉(zhuǎn)移概率 按照概率值ig)將所有狀態(tài)排序,得到t時(shí)刻狀的態(tài)索引序列St ;重復(fù)以上兩步直到狀態(tài)索引序列不變?yōu)橹?,即St = St^1 ;狀態(tài)索引序列不變時(shí)刻T對(duì)應(yīng)的狀態(tài)轉(zhuǎn)移概率分布PC(T) =(PZ],.0 C的 不變序分布0TD.步驟204給出根據(jù)c的不變序分布計(jì)算出網(wǎng)絡(luò)的一個(gè)最優(yōu)二分的方法,具體如 下根據(jù)計(jì)算出的不變序分布0TD,將網(wǎng)絡(luò)節(jié)點(diǎn)按照OTD各分量取值由小到大排序;按照以上節(jié)點(diǎn)次序?qū)⒕W(wǎng)絡(luò)N的鄰接矩陣A轉(zhuǎn)換為新的鄰接矩陣B ;令I(lǐng)w表示試性函數(shù),如果f為真則Iw取值1,否則取值0.令向量Xx(i)= 1 · 1{ }+(_1) · I{i>},l彡i彡n,表示網(wǎng)絡(luò)劃分(N1, N2),x^ η)表示網(wǎng)絡(luò)節(jié)點(diǎn)序 的分割點(diǎn),通過(guò)χ可將節(jié)點(diǎn)序分成兩個(gè)部分,進(jìn)而將整個(gè)網(wǎng)絡(luò)N分成兩個(gè)子網(wǎng)絡(luò)N1和N2.最 優(yōu)網(wǎng)絡(luò)劃分χ*滿足

其中向量Yx = (1-χ) (1+Xx)-χ (I-Xx),D表示步驟103計(jì)算出的網(wǎng)絡(luò)度矩陣,Qb = I-D-1B.
根據(jù)上式,可以依次計(jì)算出χ = l,x = 2,...,χ = η對(duì)應(yīng)的η個(gè)
值,其
中最小值對(duì)應(yīng)的X值即為待求的網(wǎng)絡(luò)最優(yōu)劃分X*,進(jìn)而將網(wǎng)絡(luò)N劃分為N1和N2兩個(gè)子網(wǎng)步驟205給出停止條件的判斷方法,具體如下EP (N1, N2)≥ 0. 5 Λ EP (N2,N1)彡 0. 5其中
表示從NjjN2的逃逸概率,(N1, N2)表示
網(wǎng)絡(luò)N的一個(gè)二分,滿足
,其中φ表示空集。P是由步驟103 計(jì)算出的Markov過(guò)程轉(zhuǎn)移概率矩陣。步驟207給出將網(wǎng)絡(luò)劃分為兩個(gè)子網(wǎng)絡(luò)方法,具體如下根據(jù)步驟204計(jì)算出來(lái)的最優(yōu)分割點(diǎn)χ*為向量Xx賦值
Xx分量值為1對(duì)應(yīng)的節(jié)點(diǎn)及其相互間的連接構(gòu)成第一個(gè)子網(wǎng)絡(luò),Xx分量值為-1 對(duì)應(yīng)的節(jié)點(diǎn)及其相互間的連接構(gòu)成第二個(gè)子網(wǎng)絡(luò)。步驟208給出遞歸處理第一個(gè)子網(wǎng)絡(luò)的方法,具體如下將207步驟得到的第一個(gè) 子網(wǎng)絡(luò)作為輸入從步驟202開始執(zhí)行。步驟209給出遞歸處理第二個(gè)子網(wǎng)絡(luò)的方法,具體如下將207步驟得到的第二個(gè) 子網(wǎng)絡(luò)作為輸入從步驟202開始執(zhí)行。以下采用不同的網(wǎng)絡(luò)對(duì)NAP和fast_NAP方法進(jìn)行了測(cè)試與評(píng)價(jià),進(jìn)一步說(shuō)明本發(fā) 明方法的原理和效果,具體如下例1采用NAP方法分析網(wǎng)絡(luò)中真實(shí)存在的網(wǎng)絡(luò)簇個(gè)數(shù)圖3 (a)表示一幅包括4個(gè)字符圖像。圖3 (b)表示該圖像對(duì)應(yīng)的網(wǎng)絡(luò),網(wǎng)絡(luò)建模 方法采用全連接法,網(wǎng)絡(luò)連接的權(quán)值采用高斯相似度公式計(jì)算。該網(wǎng)絡(luò)中,每個(gè)字符構(gòu)成一 個(gè)自然的網(wǎng)絡(luò)簇,因此該網(wǎng)絡(luò)的真實(shí)網(wǎng)絡(luò)簇個(gè)數(shù)為4。圖3 (c)表示采用NAP計(jì)算出來(lái)的各 個(gè)CQk值,其中CQ4最小,因此NAP計(jì)算出的網(wǎng)絡(luò)簇總數(shù)為4,和真實(shí)的網(wǎng)絡(luò)簇總數(shù)一致。例2圖4給出了實(shí)現(xiàn)fast_NAP方法的軟件界面。采用fast_NAP方法,該軟件能 夠識(shí)別網(wǎng)絡(luò)中的全部網(wǎng)絡(luò)簇及其層次結(jié)構(gòu),并采用鄰接矩陣和層次樹相結(jié)合的方式可視化 復(fù)雜網(wǎng)絡(luò)簇及其層次結(jié)構(gòu)。通過(guò)重新安排原始鄰接矩陣的行和列,將同簇節(jié)點(diǎn)排列在一起, 可以得到能夠清晰表示網(wǎng)絡(luò)簇結(jié)構(gòu)的轉(zhuǎn)換鄰接矩陣。如果網(wǎng)絡(luò)有分明的簇結(jié)構(gòu),其對(duì)應(yīng)的 轉(zhuǎn)換矩陣應(yīng)該是一個(gè)近似對(duì)角矩陣,主對(duì)角線的每一個(gè)塊子矩陣恰好對(duì)應(yīng)一個(gè)網(wǎng)絡(luò)簇。分 布在主對(duì)角線區(qū)域的非零元素(對(duì)應(yīng)簇內(nèi)邊)遠(yuǎn)遠(yuǎn)多于散落在主對(duì)角線區(qū)域之外的非零元 素(對(duì)應(yīng)簇間邊)。簇間的層次關(guān)系用樹形表示。例3采用fast_NAP方法分析美國(guó)大學(xué)足球盟網(wǎng)絡(luò)圖5(a)給出了 2000賽季美國(guó)大學(xué)足球聯(lián)盟網(wǎng)絡(luò)。該網(wǎng)絡(luò)包含115個(gè)節(jié)點(diǎn)和613 條邊。網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)表示一支大學(xué)足球隊(duì),每條邊表示兩個(gè)球隊(duì)間進(jìn)行的一場(chǎng)比賽。根 據(jù)地理位置,全部球隊(duì)組織成12個(gè)聯(lián)盟。根據(jù)比賽規(guī)則,聯(lián)盟內(nèi)的比賽遠(yuǎn)遠(yuǎn)多于聯(lián)盟間的 比賽。因此,按照比賽的關(guān)系,12個(gè)聯(lián)盟對(duì)應(yīng)12個(gè)網(wǎng)絡(luò)簇。圖5 (b)給出了 fast_NAP方法的計(jì)算結(jié)果,一個(gè)對(duì)角化的鄰接矩陣和一個(gè)網(wǎng)絡(luò)簇 層次結(jié)構(gòu)樹。分析比較后發(fā)現(xiàn),fast_NAP算法得到的12個(gè)網(wǎng)絡(luò)簇與12個(gè)實(shí)際的足球聯(lián)盟 基本吻合,只有6支隸屬于3個(gè)相對(duì)獨(dú)立的聯(lián)盟的球隊(duì)被錯(cuò)分。錯(cuò)分的原因在于,這些球隊(duì) 與聯(lián)盟外球隊(duì)的比賽過(guò)多。例4采用fast_NAP方法分析海豚網(wǎng)絡(luò)圖6 (a)給出了海豚社會(huì)網(wǎng)絡(luò)。該網(wǎng)絡(luò)包含62個(gè)節(jié)點(diǎn),160條邊。每個(gè)節(jié)點(diǎn)表示一 只海豚,每條邊表示兩只海豚之間的社會(huì)關(guān)系。這群海豚被跟蹤觀察7年。由于某種原因, 該群海豚最終分裂為2個(gè)子群,如圖6(a)所示。圖6 (b)給出了 fast_NAP方法的計(jì)算結(jié)果,一個(gè)對(duì)角化的鄰接矩陣和一個(gè)網(wǎng)絡(luò)簇 層次結(jié)構(gòu)樹。分析比較后發(fā)現(xiàn),fast_NAP方法得到的2個(gè)最大網(wǎng)絡(luò)簇準(zhǔn)確預(yù)測(cè)了海豚社會(huì) 的實(shí)際分裂情況。此外,fast_NAP方法還分析出了分裂后的2個(gè)海豚群可能進(jìn)一步發(fā)生的 分裂情況。例5采用fast_NAP方法進(jìn)行圖像模式識(shí)別
本節(jié)借助圖像模式識(shí)別問(wèn)題測(cè)試fast_NAP方法的有效性。當(dāng)圖像被建模成網(wǎng)絡(luò) 后,圖像中主要元素的識(shí)別就轉(zhuǎn)換為相應(yīng)的網(wǎng)絡(luò)簇識(shí)別。圖7的第一列給出了 3幅不同圖 像,它們對(duì)應(yīng)的網(wǎng)絡(luò)按照以下方法生成(1)每個(gè)像素看作是一個(gè)網(wǎng)絡(luò)節(jié)點(diǎn);(2)對(duì)于每一對(duì)像素i(Xi,yi)和j(Xj,yj),根據(jù)高斯相似度公式計(jì)算出連接(i,j) 的權(quán)值;(3)去除權(quán)值低于平均值的連接。圖7的第二列給出了按照以上方法得到的不同圖像對(duì)應(yīng)的網(wǎng)絡(luò)。圖7的第三列給出了應(yīng)用fast_NAP方法的識(shí)別結(jié)果,其中不同的圖像元素用不同 的顏色區(qū)分。如圖所示,所有圖像元素都被正確識(shí)別。特別指出的是,在第三幅圖像中,字 符“A”和“B ”能夠從噪聲中被正確識(shí)別。
1權(quán)利要求
一種復(fù)雜網(wǎng)絡(luò)簇結(jié)構(gòu)分析和識(shí)別方法,其特征在于,包括如下步驟構(gòu)造給定復(fù)雜網(wǎng)絡(luò)N上的一個(gè)Markov過(guò)程X;計(jì)算X的一步轉(zhuǎn)移概率矩陣P,并計(jì)算矩陣I P的特征值;通過(guò)特征值計(jì)算出N的網(wǎng)絡(luò)簇個(gè)數(shù)K;計(jì)算X的第一個(gè)亞穩(wěn)態(tài)S1;根據(jù)S1識(shí)別出N的K個(gè)網(wǎng)絡(luò)簇及其層次結(jié)構(gòu)。
2.根據(jù)權(quán)利要求1所述的復(fù)雜網(wǎng)絡(luò)簇結(jié)構(gòu)識(shí)別方法,其特征在于,該方法采用如下基 本原理識(shí)別復(fù)雜網(wǎng)絡(luò)中的網(wǎng)絡(luò)簇結(jié)構(gòu)普遍存在的復(fù)雜網(wǎng)絡(luò)分簇現(xiàn)象是復(fù)雜網(wǎng)絡(luò)內(nèi)在亞穩(wěn)性的外在表現(xiàn)形式。具有簇結(jié)構(gòu) 的復(fù)雜網(wǎng)絡(luò)上的Markov過(guò)程在向其全穩(wěn)態(tài)演化的極限過(guò)程中會(huì)經(jīng)歷某些亞穩(wěn)態(tài)。第一個(gè) 亞穩(wěn)態(tài)對(duì)應(yīng)的Markov過(guò)程轉(zhuǎn)移概率矩陣包含了網(wǎng)絡(luò)簇的大部分信息,從而通過(guò)計(jì)算、分析 Markov過(guò)程的第一個(gè)亞穩(wěn)態(tài)可以識(shí)別出網(wǎng)絡(luò)簇形態(tài)、個(gè)數(shù)和層次結(jié)構(gòu)等網(wǎng)絡(luò)簇結(jié)構(gòu)信息。
3.根據(jù)權(quán)利要求1所述的復(fù)雜網(wǎng)絡(luò)簇結(jié)構(gòu)識(shí)別方法,其特征在于,復(fù)雜網(wǎng)絡(luò)上的一個(gè) Markov過(guò)程是按照如下方法構(gòu)造的假設(shè)網(wǎng)絡(luò)中存在一個(gè)Agent,該Agent能夠沿著網(wǎng)絡(luò)連接從一個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)隨機(jī)的移動(dòng) 到其它網(wǎng)絡(luò)節(jié)點(diǎn)。X = {Xt,t彡0}表示Agent在不同時(shí)刻位置構(gòu)成的隨機(jī)序列,P{Xt = i, 1彡i彡η}表示Agent經(jīng)過(guò)t時(shí)間到達(dá)網(wǎng)絡(luò)節(jié)點(diǎn)i的概率。由于Agent在t時(shí)刻的位置唯 一地由其在t-Ι時(shí)刻的位置決定,而和t-Ι時(shí)刻之前的位置都無(wú)關(guān),即滿足 P(Xt = itIXo = icXi = “,...,Χη = it-J = P(Xt = it |Xt-i = it-J 因此隨機(jī)序列X滿足馬爾科夫性,是一個(gè)離散、時(shí)齊的Markov過(guò)程。
4.根據(jù)權(quán)利要求1所述的復(fù)雜網(wǎng)絡(luò)簇結(jié)構(gòu)識(shí)別方法,其特征在于,復(fù)雜網(wǎng)絡(luò)上的 Markov過(guò)程的一步轉(zhuǎn)移概率矩陣P是按照如下方法計(jì)算的P = D-1A其中矩陣A = (%)ηΧη表示網(wǎng)絡(luò)的鄰接矩陣,D = diag(d1,…。表示網(wǎng)絡(luò)的度矩陣, 其中Cli = Σ Jaij-表示節(jié)點(diǎn)i的度.矩陣I-P的特征值記為Λ = ( λ π…,λ n)。
5.根據(jù)權(quán)利要求1所述的復(fù)雜網(wǎng)絡(luò)簇結(jié)構(gòu)識(shí)別方法,其特征在于,復(fù)雜網(wǎng)絡(luò)簇結(jié)構(gòu)的 重要信息(如網(wǎng)絡(luò)是否具有簇結(jié)構(gòu)?每個(gè)網(wǎng)絡(luò)簇的形態(tài)如何?簇與簇的連接形態(tài)如何? 網(wǎng)絡(luò)簇的個(gè)數(shù)是多少)可按照如下方法獲得基于大偏差理論,可采用Markov過(guò)程一步轉(zhuǎn)移概率矩陣(專利要求4所計(jì)算的矩陣P) 的特征值計(jì)算出每個(gè)亞穩(wěn)態(tài)的進(jìn)入和退出時(shí)間?;谶@些時(shí)間的物理含義,按如下方式定 義出定量描述網(wǎng)絡(luò)簇結(jié)構(gòu)形態(tài)的各個(gè)物理量,包括簇的緊密程度、簇與簇的分離程度、網(wǎng) 絡(luò)簇結(jié)構(gòu)質(zhì)量。對(duì)于包含K個(gè)網(wǎng)絡(luò)簇的復(fù)雜網(wǎng)絡(luò)簇的緊密程度定義為=Compact degree = 1/λ K+1簇與簇的分離程度定義為s印erateddegree = 1/λ κ 網(wǎng)絡(luò)簇結(jié)構(gòu)質(zhì)量定義為 其中,Λ = (A1,…,λη)為矩陣I-P的特征值,P表示按照專利要求4中方法計(jì)算 出的Markov隨機(jī)過(guò)程一步轉(zhuǎn)移概率矩陣。compact degree越小各個(gè)簇的緊密程度越好;seperated degree越大各個(gè)簇的分離程度越好;0≤CQk≤1,CQk越接近于0,網(wǎng)絡(luò)簇結(jié)構(gòu) 的質(zhì)量越好,越接近1,網(wǎng)絡(luò)簇結(jié)構(gòu)的質(zhì)量越差。根據(jù)以上定義,最優(yōu)的網(wǎng)絡(luò)簇個(gè)數(shù)應(yīng)該對(duì)應(yīng)網(wǎng)絡(luò)簇結(jié)構(gòu)質(zhì)量最好的情況,即 其中CQk表示以上定義的網(wǎng)絡(luò)簇結(jié)構(gòu)質(zhì)量。
6.根據(jù)權(quán)利要求1所述的復(fù)雜網(wǎng)絡(luò)簇結(jié)構(gòu)識(shí)別方法,其特征在于,包含K個(gè)網(wǎng)絡(luò)簇的復(fù) 雜網(wǎng)絡(luò)的Markov過(guò)程的第一個(gè)亞穩(wěn)態(tài)是按照如下方法計(jì)算出來(lái)的 其中P表示采用專利要求4中方法計(jì)算出來(lái)的Markov過(guò)程一步轉(zhuǎn)移概率矩陣。K是采 用專利要求5中方法計(jì)算出來(lái)的網(wǎng)絡(luò)簇個(gè)數(shù)。λ K+1表示矩陣I-P的第K+1小特征值。
7.根據(jù)權(quán)利要求1所述的復(fù)雜網(wǎng)絡(luò)簇結(jié)構(gòu)識(shí)別方法,其特征在于,可以按照如下方法 快速計(jì)算出Markov過(guò)程的第一個(gè)亞穩(wěn)態(tài)并從中識(shí)別出全部網(wǎng)絡(luò)簇及其層次結(jié)構(gòu)。選擇網(wǎng)絡(luò)中最穩(wěn)定的狀態(tài)C;計(jì)算 c 的不變序分布 OTD (Ordering Time Distribution);根據(jù)c的不變序分布計(jì)算出網(wǎng)絡(luò)的一個(gè)最優(yōu)二分;如果滿足停止條件則停止算法,否則按照最優(yōu)分割標(biāo)準(zhǔn)將網(wǎng)絡(luò)分割成兩個(gè)子網(wǎng)絡(luò);遞歸處理這兩個(gè)子網(wǎng)絡(luò)。
8.根據(jù)權(quán)利要求7所述的快速計(jì)算Markov過(guò)程第一個(gè)亞穩(wěn)態(tài)并從中識(shí)別出全部網(wǎng)絡(luò) 簇及其層次結(jié)構(gòu),其特征在于,可以按照如下方法選擇網(wǎng)絡(luò)中最穩(wěn)定的狀態(tài)c,并計(jì)算最穩(wěn) 定狀態(tài)c的不變序分布OTD (1)選擇網(wǎng)絡(luò)中最穩(wěn)定的狀態(tài)c: 其中,JI i表示Markov過(guò)程到達(dá)狀態(tài)i的極限概率,(Ii表示節(jié)點(diǎn)i的度。(2)計(jì)算最穩(wěn)定狀態(tài)c的不變序分布OTD迭代計(jì)算所有狀態(tài)到達(dá)狀態(tài)c的t-步轉(zhuǎn)移概率 按照概率值將所有狀態(tài)排序,得到t時(shí)刻狀態(tài)索引序列St ;重復(fù)以上兩步直到狀態(tài)索引序列不變?yōu)橹?,即St = St-1 ;狀態(tài)索引序列不變時(shí)刻T對(duì)應(yīng)的狀態(tài)轉(zhuǎn)移概率分布 為C的不變 序分布OTD。
9.根據(jù)權(quán)利要求7所述的快速計(jì)算Markov過(guò)程第一個(gè)亞穩(wěn)態(tài)并從中識(shí)別出全部網(wǎng)絡(luò) 簇及其層次結(jié)構(gòu),其特征在于,可以按照如下方法計(jì)算出網(wǎng)絡(luò)的一個(gè)最優(yōu)二分令(N1, N2)表示網(wǎng)絡(luò)N的一個(gè)二分,其中N1和N2表示兩個(gè)子網(wǎng)絡(luò),且滿足N1 U N2 = N 且& Π N2 = Φ,Φ表示空集。令 表示從子網(wǎng)絡(luò)N1到子網(wǎng)絡(luò)N2的逃逸概率;其中,IN11表示子網(wǎng)絡(luò)N1中節(jié)點(diǎn)的個(gè)數(shù),P表示采用專利要求4中方法計(jì)算出來(lái)的Markov過(guò)程一 步轉(zhuǎn)移概率矩陣。 表示概率化的網(wǎng)絡(luò)簇結(jié)構(gòu)質(zhì)量; 令向量 (跳)表示網(wǎng)絡(luò)劃分(N1, N2),貝丨J有其中,P表示采用專利要求4中方法計(jì)算出來(lái)的Markov過(guò)程一步轉(zhuǎn)移概率矩陣,Y = 歷表示試性函數(shù),如果f為真則I{f}取值1,否則取值0.網(wǎng)絡(luò)的最優(yōu)劃分X*滿足 網(wǎng)絡(luò)的最優(yōu)劃分X*可按如下方法計(jì)算根據(jù)權(quán)利要求8計(jì)算出的不變序分布0TD,將網(wǎng)絡(luò)節(jié)點(diǎn)按照OTD各分量取值由小到大排序;按照以上節(jié)點(diǎn)次序?qū)⒕W(wǎng)絡(luò)N的鄰接矩陣A轉(zhuǎn)換為新的鄰接矩陣B ; 令向量Xx(i) = 1 ·Ι(^χ}+(-1) ·1{ >χ},1 彡 i 彡 η表示網(wǎng)絡(luò)劃分(NijN2) ,x(l ^ χ ^ η) 表示網(wǎng)絡(luò)節(jié)點(diǎn)序的分割點(diǎn),通過(guò)χ可將節(jié)點(diǎn)序分成兩個(gè)部分,進(jìn)而將整個(gè)網(wǎng)絡(luò)N分成兩個(gè)子 網(wǎng)絡(luò)N1, N2.最優(yōu)網(wǎng)絡(luò)劃分χ*滿足 其中向量Yx = (1-x) (l+Xx)-x(l-Xx),D表示按照權(quán)利要求4計(jì)算出來(lái)的網(wǎng)絡(luò)度矩陣, QB = I-D-1B.根據(jù)上式,可以依次計(jì)算出 對(duì)應(yīng)的η個(gè)值,其中最小值對(duì)應(yīng)的X值即為待求的網(wǎng)絡(luò)最優(yōu)劃分X*.根據(jù)X*可將節(jié)點(diǎn)序列分成兩個(gè)集合,分別對(duì)應(yīng)分割而成的兩個(gè)子網(wǎng)絡(luò)NJPN2,進(jìn)而根據(jù) ,巧分別計(jì)算從N1到N2和從N2到N1的逃逸概率。
10.根據(jù)權(quán)利要求7所述的快速計(jì)算Markov過(guò)程第一個(gè)亞穩(wěn)態(tài)并從中識(shí)別出全部網(wǎng)絡(luò) 簇及其層次結(jié)構(gòu),其特征在于,可按如下方法判斷遞歸二分的停止條件,并計(jì)算出網(wǎng)絡(luò)簇的 層次結(jié)構(gòu)(1)遞歸二分的停止條件為EP (N1, N2)≥ 0. 5 Λ EP (N2, N1)≥ 0. 5其中EP (N1, N2)表示根據(jù)專利要求9計(jì)算出來(lái)的從N1到N2的逃逸概率。(2)網(wǎng)絡(luò)簇的層次結(jié)構(gòu)可以按如下方法建立遞歸計(jì)算過(guò)程產(chǎn)生一個(gè)二叉樹結(jié)構(gòu),樹中每個(gè)節(jié)點(diǎn)表示一個(gè)子網(wǎng)絡(luò),樹的根節(jié)點(diǎn)表示 整個(gè)網(wǎng)絡(luò),每個(gè)葉節(jié)點(diǎn)表示一個(gè)網(wǎng)絡(luò)簇。該二叉樹結(jié)構(gòu)表示全部網(wǎng)絡(luò)簇構(gòu)成的層次結(jié)構(gòu)。
全文摘要
一種基于馬爾科夫(Markov)過(guò)程亞穩(wěn)性的復(fù)雜網(wǎng)絡(luò)簇結(jié)構(gòu)分析和識(shí)別方法,包括下列主要步驟構(gòu)造給定復(fù)雜網(wǎng)絡(luò)上的馬爾科夫過(guò)程;計(jì)算該馬爾科夫過(guò)程的轉(zhuǎn)移概率矩陣;計(jì)算矩陣的特征值;通過(guò)分析特征值計(jì)算出網(wǎng)絡(luò)簇個(gè)數(shù);計(jì)算馬爾科夫過(guò)程的第一個(gè)亞穩(wěn)態(tài);根據(jù)第一個(gè)亞穩(wěn)態(tài)識(shí)別出網(wǎng)絡(luò)的全部網(wǎng)絡(luò)簇及其層次結(jié)構(gòu)。本發(fā)明為復(fù)雜網(wǎng)絡(luò)簇分析和識(shí)別提供一種全新和高效的方法,與現(xiàn)有同類方法相比,具有無(wú)偏(不依賴主觀定義的優(yōu)化目標(biāo)或啟發(fā)式規(guī)則)、計(jì)算速度快(具有近似線性的計(jì)算時(shí)間復(fù)雜性)、識(shí)別精度高(能夠準(zhǔn)確識(shí)別出現(xiàn)實(shí)世界中復(fù)雜網(wǎng)絡(luò)的網(wǎng)絡(luò)簇及其層次結(jié)構(gòu))和無(wú)監(jiān)督(不需要先驗(yàn)知識(shí))的特性。
文檔編號(hào)G06F17/30GK101901251SQ201010210628
公開日2010年12月1日 申請(qǐng)日期2010年6月28日 優(yōu)先權(quán)日2010年6月28日
發(fā)明者劉大有, 楊博 申請(qǐng)人:吉林大學(xué)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1