亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種社交網(wǎng)絡(luò)中的多標(biāo)簽傳播重疊社區(qū)發(fā)現(xiàn)方法

文檔序號:6536758閱讀:744來源:國知局
一種社交網(wǎng)絡(luò)中的多標(biāo)簽傳播重疊社區(qū)發(fā)現(xiàn)方法
【專利摘要】本發(fā)明涉及社交網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,特別是一種社交網(wǎng)絡(luò)中的多標(biāo)簽傳播重疊社區(qū)發(fā)現(xiàn)方法,包括如下步驟:讀取社交網(wǎng)絡(luò)數(shù)據(jù),構(gòu)造以社交網(wǎng)絡(luò)用戶為節(jié)點,用戶關(guān)系為邊的社交網(wǎng)絡(luò)圖;根據(jù)社交網(wǎng)絡(luò)圖,進(jìn)行社交網(wǎng)絡(luò)的初步社區(qū)劃分,采用綜合考慮節(jié)點中心度以及標(biāo)簽度分布約束的標(biāo)簽傳播方法進(jìn)行社區(qū)發(fā)現(xiàn),獲得非重疊社區(qū)結(jié)構(gòu);根據(jù)獲得的非重疊社區(qū)結(jié)構(gòu)以及節(jié)點在所屬社區(qū)的中心度值,標(biāo)記節(jié)點所屬的層級;根據(jù)節(jié)點所屬層級,計算不同層級節(jié)點之間的標(biāo)簽傳播增益,并利用多標(biāo)簽傳播進(jìn)行重疊節(jié)點挖掘,得到社交網(wǎng)絡(luò)的重疊社區(qū)結(jié)構(gòu)。該方法可有效挖掘社交網(wǎng)絡(luò)中的重疊社區(qū)結(jié)構(gòu),有利于提高社區(qū)檢測的精度和效率,可應(yīng)用于目標(biāo)群體挖掘、精確營銷等領(lǐng)域。
【專利說明】—種社交網(wǎng)絡(luò)中的多標(biāo)簽傳播重疊社區(qū)發(fā)現(xiàn)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及社交網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,特別是一種社交網(wǎng)絡(luò)中的多標(biāo)簽傳播重疊社區(qū)發(fā)現(xiàn)方法。
【背景技術(shù)】
[0002]從社會網(wǎng)絡(luò)中檢測社區(qū)結(jié)構(gòu)是社會網(wǎng)絡(luò)分析中的一項重要任務(wù),無論是理論上還是實際應(yīng)用中都具有十分重要的意義。通過挖掘網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu),能夠發(fā)現(xiàn)網(wǎng)絡(luò)中隱含的組織結(jié)構(gòu)信息、社會功能以及社區(qū)成員之間隱含的有趣屬性,如共同愛好等。通過研究社會網(wǎng)絡(luò)中社區(qū)之間、個體之間以及個體與社區(qū)之間的關(guān)系,可以挖掘出大量有價值的信息,可應(yīng)用于許多領(lǐng)域。
[0003]針對社區(qū)發(fā)現(xiàn),已經(jīng)出現(xiàn)了很多經(jīng)典的方法。2002年Girvan和Newman基于邊介數(shù),提出GN方法,并最早提出模塊度Q值作為網(wǎng)絡(luò)社區(qū)劃分結(jié)果好壞的指標(biāo)??傮w上,社區(qū)發(fā)現(xiàn)的經(jīng)典方法包括模塊度優(yōu)化算法、譜分析法、信息論方法以及標(biāo)簽傳播方法等。在上述方法中,節(jié)點只能屬于一個社區(qū),但是真實的社會網(wǎng)絡(luò)的社區(qū)往往是相互重疊的,即允許節(jié)點屬于多個社區(qū),如在一個社交網(wǎng)站上,一個用戶會擁有多個朋友圈;科研工作者的研究領(lǐng)域經(jīng)常存在交叉;在生物系統(tǒng)中,一種蛋白質(zhì)通常存在于多種復(fù)合物。Palla,G.等基于CPM(Clique Percolation Method)思想,提出用于重疊社區(qū)發(fā)現(xiàn)的CFinder方法。方法將社區(qū)定義為相互連通的k-派系構(gòu)成的集合,歸屬于多個k-派系社區(qū)的節(jié)點即為社區(qū)間的重疊節(jié)點,之后通過節(jié)點社區(qū)歸屬情況輸出重疊社區(qū),該方法適用于社區(qū)內(nèi)聚強(qiáng)的網(wǎng)絡(luò),難以應(yīng)用在情況復(fù)雜的大規(guī)模復(fù)雜網(wǎng)絡(luò)。Ahn等基于邊劃分的思想,將原始網(wǎng)絡(luò)中的邊映射成新的網(wǎng)絡(luò)的節(jié)點,再利用非重疊社區(qū)發(fā)現(xiàn)方法劃分轉(zhuǎn)換后的網(wǎng)絡(luò),則原始網(wǎng)絡(luò)中連接不同社區(qū)的邊的節(jié)點即為重疊節(jié)點。Lancichinetti等利用局部優(yōu)化及拓展的方法,隨機(jī)選取種子節(jié)點集合,種子節(jié)點根據(jù)局部優(yōu)化策略不斷向外擴(kuò)張,直至獲得評價函數(shù)最大的社區(qū),但是方法對優(yōu)化函數(shù)以及種子節(jié)點的選擇敏感且算法時間復(fù)雜度在最壞情況下為0(n2)??紤]到節(jié)點與社區(qū)之間的隸屬度,Zhang等利用譜分析法將圖映射到低維的歐幾里得空間,利用模糊C均值聚類進(jìn)行重疊社區(qū)發(fā)現(xiàn),該方法需要每個節(jié)點的隸屬向量的維數(shù)做為算法參數(shù)。
[0004]上述重疊社區(qū)發(fā)現(xiàn)算法通常存在參數(shù)敏感或者時間復(fù)雜度高的問題,難以應(yīng)用于大規(guī)模復(fù)雜網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn),Raghavan等提出標(biāo)簽傳播方法用于社區(qū)發(fā)現(xiàn),該算法具有線性時間復(fù)雜度,但是只能用于非重疊社區(qū)發(fā)現(xiàn)。LPA的一些擴(kuò)展方法如COPRA、SLPA, MLPA等允許一個節(jié)點擁有多個標(biāo)簽,可用于重疊社區(qū)發(fā)現(xiàn),但是上述方法的魯棒性有待提高,當(dāng)網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu)不明顯或社區(qū)之間的重疊程度較高時,社區(qū)挖掘精度大大降低
綜上,現(xiàn)有的社會網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)方法從發(fā)現(xiàn)的社區(qū)結(jié)構(gòu)質(zhì)量以及時間效率上看都尚有很大的提升空間。面對大規(guī)模社交網(wǎng)絡(luò)的場景,現(xiàn)有方法無論實在效果和效率上都難以滿足要求。
【發(fā)明內(nèi)容】

[0005]本發(fā)明的目的在于提供一種社交網(wǎng)絡(luò)中的多標(biāo)簽傳播重疊社區(qū)發(fā)現(xiàn)方法,該方法有利于提聞社區(qū)檢測的精度和效率。
[0006]為實現(xiàn)上述目的,本發(fā)明的技術(shù)方案是:一種社交網(wǎng)絡(luò)中的多標(biāo)簽傳播重疊社區(qū)發(fā)現(xiàn)方法,包括以下步驟:
步驟A:讀取社交網(wǎng)絡(luò)數(shù)據(jù),構(gòu)造以社交網(wǎng)絡(luò)用戶為節(jié)點,用戶關(guān)系為邊的社交網(wǎng)絡(luò)
圖;
步驟B:初步社區(qū)劃分:根據(jù)社交網(wǎng)絡(luò)圖,采用綜合考慮節(jié)點中心度以及標(biāo)簽度分布約束的標(biāo)簽傳播方法進(jìn)行社區(qū)發(fā)現(xiàn),獲得非重疊社區(qū)結(jié)構(gòu);
步驟C:節(jié)點層級標(biāo)記:根據(jù)初步社區(qū)劃分獲得的非重疊社區(qū)結(jié)構(gòu)以及節(jié)點在所屬社區(qū)的中心度值,標(biāo)記節(jié)點所屬的層級;
步驟D:重疊社區(qū)細(xì)化:根據(jù)節(jié)點所屬的層級,計算不同層級節(jié)點之間的標(biāo)簽傳播增益,并利用多標(biāo)簽傳播進(jìn)行重疊節(jié)點挖掘,得到社交網(wǎng)絡(luò)的重疊社區(qū)結(jié)構(gòu)。
[0007]進(jìn)一步地,所述步驟B中,社交網(wǎng)絡(luò)的初步社區(qū)劃分具體包括以下步驟:
步驟B1:根據(jù)社交網(wǎng)絡(luò)圖,進(jìn)行節(jié)點標(biāo)簽初始化,為社交網(wǎng)絡(luò)圖中的每個節(jié)點分配一個全局唯一的標(biāo)簽號;
步驟B2:根據(jù)標(biāo)簽更新規(guī)則,對社交網(wǎng)絡(luò)圖中的每個節(jié)點進(jìn)行標(biāo)簽更新,同時根據(jù)鄰居節(jié)點信息更新節(jié)點的中心度值,反復(fù)迭代,直到滿足迭代終止條件;
步驟B3:根據(jù)迭代終止時節(jié)點所分配的標(biāo)簽,將具有相同標(biāo)簽的節(jié)點歸屬到同一社區(qū),輸出非重疊社區(qū)結(jié)構(gòu)。
[0008]進(jìn)一步地,所述步驟B2中,綜合考慮了節(jié)點中心度與標(biāo)簽度分布差異約束條件,進(jìn)行標(biāo)簽更新,標(biāo)簽更新規(guī)則為:
【權(quán)利要求】
1.一種社交網(wǎng)絡(luò)中的多標(biāo)簽傳播重疊社區(qū)發(fā)現(xiàn)方法,其特征在于,所述方法包括以下步驟: 步驟A:讀取社交網(wǎng)絡(luò)數(shù)據(jù),構(gòu)造以社交網(wǎng)絡(luò)用戶為節(jié)點,用戶關(guān)系為邊的社交網(wǎng)絡(luò)圖; 步驟B:初步社區(qū)劃分:根據(jù)社交網(wǎng)絡(luò)圖,采用綜合考慮節(jié)點中心度以及標(biāo)簽度分布約束的標(biāo)簽傳播方法進(jìn)行社區(qū)發(fā)現(xiàn),獲得非重疊社區(qū)結(jié)構(gòu); 步驟C:節(jié)點層級標(biāo)記:根據(jù)初步社區(qū)劃分獲得的非重疊社區(qū)結(jié)構(gòu)以及節(jié)點在所屬社區(qū)的中心度值,標(biāo)記節(jié)點所屬的層級; 步驟D:重疊社區(qū)細(xì)化:根據(jù)節(jié)點所屬的層級,計算不同層級節(jié)點之間的標(biāo)簽傳播增益,并利用多標(biāo)簽傳播進(jìn)行重疊節(jié)點挖掘,得到社交網(wǎng)絡(luò)的重疊社區(qū)結(jié)構(gòu)。
2.根據(jù)權(quán)利要求1所述的一種社交網(wǎng)絡(luò)中的多標(biāo)簽傳播重疊社區(qū)發(fā)現(xiàn)方法,其特征在于,所述步驟B中,社交網(wǎng)絡(luò)的初步社區(qū)劃分具體包括以下步驟: 步驟B1:根據(jù)社交網(wǎng)絡(luò)圖,進(jìn)行節(jié)點標(biāo)簽初始化,為社交網(wǎng)絡(luò)圖中的每個節(jié)點分配一個全局唯一的標(biāo)簽號; 步驟B2:根據(jù)標(biāo)簽更新規(guī)則,對社交網(wǎng)絡(luò)圖中的每個節(jié)點進(jìn)行標(biāo)簽更新,同時根據(jù)鄰居節(jié)點信息更新節(jié)點的中心度值,反復(fù)迭代,直到滿足迭代終止條件; 步驟B3:根據(jù)迭代終止時節(jié)點所分配的標(biāo)簽,將具有相同標(biāo)簽的節(jié)點歸屬到同一社區(qū),輸出非重疊社區(qū)結(jié)構(gòu)。
3.根據(jù)權(quán)利要求2所述的一種社交網(wǎng)絡(luò)中的多標(biāo)簽傳播重疊社區(qū)發(fā)現(xiàn)方法,其特征在于,所述步驟B2中,綜合考慮了節(jié)點中心度與標(biāo)簽度分布差異約束條件,進(jìn)行標(biāo)簽更新,標(biāo)簽更新規(guī)則為:
4.根據(jù)權(quán)利要求2所述的一種社交網(wǎng)絡(luò)中的多標(biāo)簽重疊社區(qū)發(fā)現(xiàn)方法,其特征在于,所述步驟C中,所述節(jié)點的層級定義為兩級:核心層級與邊界層級,用于層級劃分的方法包括顯式層級劃分和模糊層級劃分; 顯式層級劃分的節(jié)點層級映射函數(shù)定義為:
5.根據(jù)權(quán)利要求2所述的一種社交網(wǎng)絡(luò)中的多標(biāo)簽重疊社區(qū)發(fā)現(xiàn)方法,其特征在于,所述步驟D中,重疊社區(qū)細(xì)化具體包括以下步驟: 步驟Dl:標(biāo)簽初始化:每個節(jié)點的標(biāo)簽集合初始化為步驟B3迭代終止時所分配的唯一標(biāo)簽,同時設(shè)置該標(biāo)簽的隸屬度為I ; 步驟D2:按照隨機(jī)順序遍歷社交網(wǎng)絡(luò)中各節(jié)點,對每個節(jié)點K,遍歷其鄰居節(jié)點集合中的各節(jié)點,根據(jù)鄰居節(jié)點的標(biāo)簽集合,按照標(biāo)簽集合更新規(guī)則,更新節(jié)點r的標(biāo)簽集合;步驟D3:根據(jù)節(jié)點的標(biāo)簽集合中標(biāo)簽個數(shù)是否超過閾值,過濾與歸一化節(jié)點的標(biāo)簽集合; 步驟D4:判斷是否滿足迭代條件,若滿足迭代條件,則終止迭代,否則返回步驟D2執(zhí)行; 步驟D5:后處理:根據(jù)節(jié)點的標(biāo)簽集合輸出社交網(wǎng)絡(luò)的重疊社區(qū)結(jié)構(gòu)。
6.根據(jù)權(quán)利要求5所述的一種社交網(wǎng)絡(luò)中的多標(biāo)簽重疊社區(qū)發(fā)現(xiàn)方法,其特征在于,所述步驟D2中,采用的標(biāo)簽集合更新規(guī)則為:隨機(jī)獲取還未更新標(biāo)簽的節(jié)點^遍歷該節(jié)點的鄰居節(jié)點集合Ar(K),假定鄰居節(jié)點u的標(biāo)簽集合為labelset (u),則節(jié)點^的標(biāo)簽集合labelset {v)更新為鄰居節(jié)點的標(biāo)簽集合的并集,定義為:
7.根據(jù)權(quán)利要求5所述的一種社交網(wǎng)絡(luò)中的多標(biāo)簽重疊社區(qū)發(fā)現(xiàn)方法,其特征在于,所述步驟D3中,標(biāo)簽集合的過濾規(guī)則為:若節(jié)點r的標(biāo)簽集合中的標(biāo)簽個數(shù)超過給定的閾值^?/忍,則保留隸屬度最大的前個標(biāo)簽;若節(jié)點r的標(biāo)簽集合labelset {.V)中的標(biāo)簽個數(shù)未超過給定的閾值',則保留所有標(biāo)簽;標(biāo)簽集合過濾后,對節(jié)點r保留下來的標(biāo)簽進(jìn)行隸屬度歸一化,保證保留下來的標(biāo)簽的隸屬度之和為I。
8.根據(jù)權(quán)利要求5所述的一種社交網(wǎng)絡(luò)中的多標(biāo)簽重疊社區(qū)發(fā)現(xiàn)方法,其特征在于,所述步驟D4中,迭代終止條件為社交網(wǎng)絡(luò)中的標(biāo)簽數(shù)目不再發(fā)生變化終止迭代。
【文檔編號】G06F17/30GK103729475SQ201410034425
【公開日】2014年4月16日 申請日期:2014年1月24日 優(yōu)先權(quán)日:2014年1月24日
【發(fā)明者】陳羽中, 陳國龍, 郭文忠, 施松 申請人:福州大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1