亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種挖掘社交網(wǎng)絡中話題核心圈的方法及系統(tǒng)的制作方法

文檔序號:6371962閱讀:309來源:國知局
專利名稱:一種挖掘社交網(wǎng)絡中話題核心圈的方法及系統(tǒng)的制作方法
技術領域
本發(fā)明屬于社交網(wǎng)絡技術領域,尤其涉及一種挖掘社交網(wǎng)絡中話題核心圈的方法及系統(tǒng)。
背景技術
目前互聯(lián)網(wǎng)上的信息量越來越龐大,信息紛繁復雜,如何對其內容進行分析從而挖掘出人們所需要的內容呢?社交網(wǎng)絡挖掘技術可在一定程 度上解決這個問題?,F(xiàn)有技術提供了一種基于社區(qū)結構的社區(qū)挖掘方法,其具體步驟如下I)、在一個社交網(wǎng)絡中,根據(jù)所要挖掘社區(qū)的規(guī)模范圍劃定一個搜索區(qū)域;其中,搜索區(qū)域的左邊界L為當前期望挖掘的最大社區(qū)的大小,上邊界U為所述社交網(wǎng)絡中具有
最多鄰居的節(jié)點的鄰居節(jié)點數(shù),右邊界為g + l,下邊界為P (L-I),所述P表示一個預先
P
設定的比例;2)、在所述搜索區(qū)域內根據(jù)節(jié)點的鄰居節(jié)點數(shù)做剪枝操作,將鄰居節(jié)點數(shù)小于所要挖掘的社區(qū)的緊密度的節(jié)點從社交網(wǎng)絡中剪除;3)、在經(jīng)過剪枝操作的社交網(wǎng)絡的剩余節(jié)點中選定一個節(jié)點,在該節(jié)點的鄰居節(jié)點中搜索大小為Isl-I的社區(qū),找到后將該節(jié)點與搜索到的大小為Isl-I的社區(qū)形成所要挖掘的社區(qū),加到結果集中,其中所述|S|表示期望挖掘社區(qū)的大小;4)、將所述搜索區(qū)域的左邊界向左移動,然后在擴大后的搜索區(qū)域內重新執(zhí)行步驟2)和步驟3),直到搜索區(qū)域達到所要挖掘社區(qū)的規(guī)模的最小值。現(xiàn)有技術雖然可在一定程度上挖掘出人們所需的內容。然而,現(xiàn)有技術無法挖掘出話題相似、聯(lián)系緊密且影響力大的核心圈。

發(fā)明內容
本發(fā)明實施例提供一種挖掘社交網(wǎng)絡中話題核心圈的方法,以在社交網(wǎng)絡中挖掘出話題相似、聯(lián)系緊密的核心圈。本發(fā)明實施例是這樣實現(xiàn)的,一種挖掘社交網(wǎng)絡中話題核心圈的方法,所述方法包括構建社交網(wǎng)絡圖,所述社交網(wǎng)絡圖中包含多個相互連接的節(jié)點;從所述社交網(wǎng)絡圖中選擇一個節(jié)點作為核心圈的第一節(jié)點,將與所述第一節(jié)點連接最多的第二節(jié)點劃入所述核心圈,將核心圈外與所述核心圈內節(jié)點連接最多的第三節(jié)點劃入所述核心圈,依此執(zhí)行,直到核心圈外的第N節(jié)點劃入所述核心圈,所述N為預先設定的所述核心圈包含的節(jié)點數(shù);對所述包含N個節(jié)點的核心圈進行話題聚類,獲取所述包含N個節(jié)點的核心圈內每個節(jié)點的關注話題。本發(fā)明實施例還提供了一種挖掘社交網(wǎng)絡中話題核心圈的系統(tǒng),所述系統(tǒng)包括
構建單元,用于構建社交網(wǎng)絡圖,所述社交網(wǎng)絡圖中包含多個相互連接的節(jié)點;核心圈獲取單元,用于從所述構建單元構建的社交網(wǎng)絡圖中選擇一個節(jié)點作為核心圈的第一節(jié)點,將與所述第一節(jié)點連接最多的第二節(jié)點劃入所述核心圈,將核心圈外與所述核心圈內節(jié)點連接最多的第三節(jié)點劃入所述核心圈,依此執(zhí)行,直到核心圈外的第N節(jié)點劃入所述核心圈,所述N為預先設定的所述核心圈包含的節(jié)點數(shù);話題獲取單元,用于對所述核心圈獲取單元獲取的包含N個節(jié)點的核心圈進行話題聚類,獲取所述包含N個節(jié)點的核心圈內每個節(jié)點的關注話題。本發(fā)明實施例通過將社交網(wǎng)絡圖中核心圈外與核心圈內節(jié)點連接最多的節(jié)點劃入所述核心圈,由于節(jié)點(用戶)間連接關系多,說明用戶間的關系緊密,而且話題相識的可能性最大。通過對所獲取的核心圈進行話題聚類,獲取所述核心圈內每個節(jié)點的關注話題,考慮了社交網(wǎng)絡的話題。根據(jù)所述核心圈及關注話題,使得用戶可以通過關鍵詞搜索到話題相似、關系緊密的核心圈。


為了更清楚地說明本發(fā)明實施例中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖I是本發(fā)明一實施例提供的挖掘社交網(wǎng)絡中話題核心圈的方法的實現(xiàn)流程圖;圖2是本發(fā)明另一實施例提供的挖掘社交網(wǎng)絡中話題核心圈的方法的實現(xiàn)流程圖;圖3是本發(fā)明另一實施例提供的挖掘社交網(wǎng)絡中話題核心圈的方法的實現(xiàn)流程圖;圖4本發(fā)明另一實施例提供的核心圈與輔助社區(qū)的關系示例圖;圖5是本發(fā)明另一實施例提供的挖掘社交網(wǎng)絡中話題核心圈的系統(tǒng)的組成結構圖。
具體實施例方式為了使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,以下結合附圖及實施例,對本發(fā)明進行進一步詳細說明。應當理解,此處所描述的具體實施例用以解釋本發(fā)明,并不用于限定本發(fā)明。為了說明本發(fā)明所述的技術方案,下面通過具體實施例來進行說明。圖I示出了本發(fā)明一實施例提供的挖掘社交網(wǎng)絡中話題核心圈的方法的實現(xiàn)流程的實現(xiàn)流程,該方法過程詳述如下在步驟SlOl中,構建社交網(wǎng)絡圖,所述社交網(wǎng)絡圖中包含多個相互連接的節(jié)點。優(yōu)選的是,根據(jù)用戶之間的合作關系或者關注關系等構建社交網(wǎng)絡圖。例如對于學術論文合作關系網(wǎng)絡,首先搜集計算機不同研究領域近兩年發(fā)表的文章,所述研究領域包括人工智能(Al),數(shù)據(jù)庫(DB),分布式與并行計算(DP),圖形、視覺與人機交互(GV)以及網(wǎng)絡通信與性能分析(NC)。然后提取每篇文章的作者。根據(jù)用戶之間的合作關系構建社交網(wǎng)絡圖,將每個作者當做社交網(wǎng)絡圖中的一個節(jié)點,每兩個不同作者合作一篇或多篇文章當做社交網(wǎng)絡圖中的一條邊,由此形成包含多個相互連接節(jié)點的社交網(wǎng)絡圖。在步驟S102中,從所述社交網(wǎng)絡圖中隨機的選擇一個節(jié)點作為核心圈的第一節(jié)點,將與所述第一節(jié)點連接最多的第二節(jié)點劃入所述核心圈,將核心圈外與所述核心圈內節(jié)點連接最多的第三節(jié)點劃入所述核心圈,依此執(zhí)行,直到核心圈外的第N節(jié)點劃入所述核心圈,所述N為預先設定的所述核心圈包含的節(jié)點數(shù)。在本實施例中,建立核心圈并設定核心圈的大小(即核心圈包含的節(jié)點數(shù))。將該核心圈初始化為空,隨機的選擇一個節(jié)點作為該核心圈內的第一節(jié)點,查找與所述第一節(jié)點連接最多的第二節(jié)點,將查找到的所述第二節(jié)點也劃入所述核心圈,繼續(xù)將與所述核心圈內節(jié)點(即所述第一節(jié)點和第二節(jié)點)連接最多的第三節(jié)點也劃入所述核心圈,依此執(zhí)行,直到核心圈外的第N節(jié)點劃入所述核心圈,此時,所述核心圈內的節(jié)點數(shù)達到了預設的臨界值N,則停止節(jié)點的劃入。由于節(jié)點(用戶)間連接關系多,說明用戶間的關系緊密,而且話題相識的可能性最大,因此通過本實施例可以獲取關系緊密、話題相識的 核心圈。需要說明的是,如果與所述核心圈內節(jié)點連接最多的第n個節(jié)點有多個,則隨機的選擇其中一個劃入所述核心圈,所述n=l, 2, No優(yōu)選的是,為了獲取關系緊密、話題相識且影響力大的核心圈,本實施例在將所述第N節(jié)點劃入所述核心圈后還包括BI、計算所述包含N個節(jié)點的核心圈內外節(jié)點的所有邊的權重和,將核心圈外權重和最高的節(jié)點劃入該核心圈,將核心圈內權重和最低的節(jié)點劃出該核心圈;B2、重復步驟BI,直到重復次數(shù)達到預設值(例如5次)或者所述核心圈外節(jié)點邊的權重和小于或者等于所述核心圈內最低節(jié)點邊的權重和。需要說明的是,本實施例中每條邊的權重可以設置為相同也可以設置為不同。例如,對于學術論文合作關系網(wǎng)絡,可以根據(jù)文章所發(fā)表的期刊設定權重,對于發(fā)表在核心期刊的文章,其合作作者之間的邊權重設置較高。如表一所不,表一是本實施例針對上述學術論文合作關系網(wǎng)絡獲取的核心圈
權利要求
1.一種挖掘社交網(wǎng)絡中話題核心圈的方法,其特征在于,所述方法包括 構建社交網(wǎng)絡圖,所述社交網(wǎng)絡圖中包含多個相互連接的節(jié)點; 從所述社交網(wǎng)絡圖中選擇一個節(jié)點作為核心圈的第一節(jié)點,將與所述第一節(jié)點連接最多的第二節(jié)點劃入所述核心圈,將核心圈外與所述核心圈內節(jié)點連接最多的第三節(jié)點劃入所述核心圈,依此執(zhí)行,直到核心圈外的第N節(jié)點劃入所述核心圈,所述N為預先設定的所述核心圈包含的節(jié)點數(shù); 對所述包含N個節(jié)點的核心圈進行話題聚類,獲取所述包含N個節(jié)點的核心圈內每個節(jié)點的關注話題。
2.如權利要求I所述的方法,其特征在于,所述從所述社交網(wǎng)絡圖中選擇一個節(jié)點作為核心圈的第一節(jié)點,將與所述第一節(jié)點連接最多的第二節(jié)點劃入所述核心圈,將核心圈外與所述核心圈內節(jié)點連接最多的第三節(jié)點劃入所述核心圈,依此執(zhí)行直到核心圈外的第N節(jié)點劃入所述核心圈,所述N為預先設定的所述核心圈包含的節(jié)點數(shù)的步驟還包括 計算所述包含N個節(jié)點的核心圈內外節(jié)點的所有邊的權重和,將核心圈外權重和最高的節(jié)點劃入該核心圈,將核心圈內權重和最低的節(jié)點劃出該核心圈,依此執(zhí)行,直到計算的次數(shù)達到預設值或者所述核心圈外節(jié)點邊的權重和小于或者等于所述核心圈內最低節(jié)點邊的權重和。
3.如權利要求I或2所述的方法,其特征在于,在所述對所述包含N個節(jié)點的核心圈進行話題聚類,獲取所述包含N個節(jié)點的核心圈內每個節(jié)點的關注話題的步驟之后,還包括 判斷所述社交網(wǎng)絡圖中核心圈的個數(shù)是否達到預設的臨界值時,若是,停止所述核心圈的獲取,否則繼續(xù)獲取,直到所述核心圈的個數(shù)達到預設的臨界值,其中每個核心圈內的每個節(jié)點都存在其對應的關注話題。
4.如權利要求1-3任一項所述的方法,其特征在于,所述方法還包括 根據(jù)所獲取的核心圈KpK2.....Kn建立對應的輔助社區(qū)ApA2.....An,令Ri=Ki U Ai,i=l, 2, ... ,η, η為核心圈的個數(shù); 在所述核心圈外的節(jié)點與Ri中節(jié)點的連接數(shù)大于其與其他&中節(jié)點的連接數(shù)時,將該節(jié)點劃入Ai,其中i=l, 2,... ,n, j = I, 2, i-1, i+1,. . . , η,依此執(zhí)行,直到核心圈外的節(jié)點全部劃入所述輔助社區(qū)。
5.如權利要求I至4任一項所述的方法,其特征在于,所述方法還包括 接收用戶輸入的關鍵詞,輸出與所述關鍵詞對應的話題的核心圈和/或與所述核心圈對應的輔助社區(qū),所述話題為所述核心圈內節(jié)點的關注話題。
6.如權利要求I至5任一項所述的方法,其特征在于,所述構建社交網(wǎng)絡圖包括 根據(jù)用戶之間的合作關系或者關注關系構建社交網(wǎng)絡圖。
7.一種挖掘社交網(wǎng)絡中話題核心圈的系統(tǒng),其特征在于,所述系統(tǒng)包括 構建單元,用于構建社交網(wǎng)絡圖,所述社交網(wǎng)絡圖中包含多個相互連接的節(jié)點; 核心圈獲取單元,用于從所述構建單元構建的社交網(wǎng)絡圖中選擇一個節(jié)點作為核心圈的第一節(jié)點,將與所述第一節(jié)點連接最多的第二節(jié)點劃入所述核心圈,將核心圈外與所述核心圈內節(jié)點連接最多的第三節(jié)點劃入所述核心圈,依此執(zhí)行,直到核心圈外的第N節(jié)點劃入所述核心圈,所述N為預先設定的所述核心圈包含的節(jié)點數(shù); 話題獲取單元,用于對所述核心圈獲取單元獲取的包含N個節(jié)點的核心圈進行話題聚類,獲取所述包含N個節(jié)點的核心圈內每個節(jié)點的關注話題。
8.如權利要求7所述的系統(tǒng),其特征在于,所述核心圈獲取單元還包括 計算單元,用于計算所述包含N個節(jié)點的核心圈內外節(jié)點的所有邊的權重和,將核心圈外權重和最高的節(jié)點劃入該核心圈,將核心圈內權重和最低的節(jié)點劃出該核心圈; 第一控制單元,用于在所述計算單元計算的次數(shù)達到預設值或者所述核心圈外節(jié)點邊的權重和小于或者等于所述核心圈內最低節(jié)點邊的權重和時,停止所述計算單元的計算。
9.如權利要求7或8所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括 第二控制單元,用于判斷所述社交網(wǎng)絡圖中核心圈的個數(shù)是否達到預設的臨界值時,若是,停止所述核心圈的獲取,否則繼續(xù)獲取,直到所述核心圈的個數(shù)達到預設的臨界值,其中每個核心圈內的每個節(jié)點都存在其對應的關注話題。
10.如權利要求7-9任一項所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括 輔助社區(qū)建立單元,用于根據(jù)所獲取的核心圈Kp K2.....Kn建立對應的輔助社區(qū)ApA2.....An,令 Ri=Ki U Ai, i=l,2,...,η,η為核心圈的個數(shù); 劃入單元,用于在所述核心圈外的節(jié)點與Ri中節(jié)點的連接數(shù)大于其與其他I中節(jié)點的連接數(shù)時,將該節(jié)點劃入Ai,其中i=l,2, · · ·,n,j = 1,2,i-1, i+1, ... ,η ; 第三控制單元,用于在所述核心圈外的節(jié)點全部劃入所述輔助社區(qū)時,停止所述劃入單元節(jié)點的劃入。
11.如權利要求7-10任一項所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括 輸出單元,用于接收用戶輸入的關鍵詞,輸出與所述關鍵詞對應的話題的核心圈和/或與所述核心圈對應的輔助社區(qū),所述話題為所述核心圈內節(jié)點的關注話題。
12.如權利要求7-11任一項所述的系統(tǒng),其特征在于,所述構建單元具體用于,根據(jù)用戶之間的合作關系或者關注關系構建社交網(wǎng)絡圖。
全文摘要
本發(fā)明實施例適用于社交網(wǎng)絡領域,提供了一種挖掘社交網(wǎng)絡中話題核心圈的方法及系統(tǒng),所述方法包括構建社交網(wǎng)絡圖,所述社交網(wǎng)絡圖中包含多個相互連接的節(jié)點;從所述社交網(wǎng)絡圖中選擇一個節(jié)點作為核心圈的第一節(jié)點,將與所述第一節(jié)點連接最多的第二節(jié)點劃入所述核心圈,將核心圈外與所述核心圈內節(jié)點連接最多的第三節(jié)點劃入所述核心圈,依此執(zhí)行,直到核心圈外的第N節(jié)點劃入所述核心圈,所述N為預先設定的所述核心圈包含的節(jié)點數(shù);對所述包含N個節(jié)點的核心圈進行話題聚類,獲取所述包含N個節(jié)點的核心圈內每個節(jié)點的關注話題。通過本發(fā)明實施例可有效挖掘出社交網(wǎng)絡中話題相似、聯(lián)系緊密的核心圈。
文檔編號G06F17/30GK102799625SQ201210210349
公開日2012年11月28日 申請日期2012年6月25日 優(yōu)先權日2012年6月25日
發(fā)明者劉志容, 王靚偉 申請人:華為技術有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1