確定用戶的影響力排序的方法與裝置制造方法
【專利摘要】本發(fā)明的實施例提供了一種確定用戶的影響力的方法和裝置。該方法包括:獲取第一信息和第二信息,第一信息用于指示社交網絡中的N個用戶的相互關注關系,第二信息用于指示N個用戶中各用戶發(fā)布的消息數(shù),以及各用戶發(fā)布的消息的主題;根據(jù)第一信息和第二信息,確定目標主題對應的N維權重向量;獲取第三信息,第三信息用于指示N個用戶中具有消息轉發(fā)關系的用戶之間轉發(fā)消息的數(shù)量和轉發(fā)消息的主題;根據(jù)第三信息,確定目標主題對應的轉移概率矩陣;根據(jù)轉移概率矩陣和權值向量,利用佩奇排序算法確定在社交網絡中,N個用戶在目標主題領域的影響力的排序。由于反映了社交網絡中用戶之間實際的相關度,因此有效地提高了影響力排序結果的準確性。
【專利說明】確定用戶的影響力排序的方法與裝置
【技術領域】
[0001] 本發(fā)明涉及計算機網絡領域,并尤其涉及一種確定用戶的影響力排序的方法和裝 置。
【背景技術】
[0002] 隨著高速無線網絡的普及,網絡媒體在社會信息傳播和商業(yè)領域扮演著越來越重 要的角色。比如綜合信息門戶網站和社交網絡已逐步取代傳統(tǒng)媒體成為信息傳播的最重要 平臺,這些網絡信息和社交平臺上影響力較大的網站和用戶在事件的傳播中更是起到推動 的作用。
[0003] 從錯綜復雜以及用戶龐大的關系網絡中找到起重要影響的網絡節(jié)點(例如可以 是網站,手機用戶,微博或微信用戶,運營商網關等)是產品推廣或信息傳播監(jiān)控的關鍵。 因此找出有影響力的網絡節(jié)點并進行影響力排名是企業(yè)進行產品推廣或信息傳播監(jiān)控的 一種有效的方法。
[0004] PageRank(佩奇排序)算法是網絡節(jié)點影響力排名的通用算法,它最先由Google 提出。佩奇排序算法定義了隨機沖浪者模型,即想象網絡中存在著許多隨機沖浪者,它們從 某個網絡節(jié)點(例如,網頁)出發(fā),按照轉移概率矩陣在網絡節(jié)點間游走,那么隨機沖浪者 的位置概率分布即代表了網頁的重要性。
[0005] 佩奇排序算法有原始版本和面向主題的佩奇排序(Topic Sensitive PageRank) 版本。其中,面向主題的佩奇排序算法可應用于社交網絡中,用于確定社交網絡中各用戶在 某一目標主題的影響力。該算法采用如下公式迭代得到各用戶的影響力排序:
[0006] Pi+i = βΜΡ?+(1-β )es/ | S |
[0007] 其中,pi+1和Pi分別表示在第i+1次和第i次迭代計算時,各用戶的佩奇排序值 組成的向量,該向量的維度η表示待排序的用戶的個數(shù);β為介于0至1之間的轉移常 數(shù),通常取值〇. 15 ;Μ為轉移概率矩陣,是基于用戶之間的相互關注關系建立的;公式中 es/丨S丨為權重向量,其中,S為目標主題相關的節(jié)點的集合,es向量中各元素的值取決于 該元素對應的用戶是否屬于集合S,如果是,取1,否則,取0。
[0008] 但是,在社交網絡中,上述面向主題的佩奇排序算法存在以下缺點:權重向量的選 擇簡單的用〇或1,即相關或不相關表示,而實際中,與目標主題相關的用戶之間也存在相 關程度的不同,上述權值向量的表達不夠準確。此外,轉移概率矩陣中各元素僅通過用戶之 間的關注關系確定。不能反映出實際的社交關系中,從而使影響力排序結果的準確性較低。
【發(fā)明內容】
[0009] 本發(fā)明的實施例提供了一種確定用戶的影響力的方法和裝置,能夠有效地提高影 響力排序結果的準確性。
[0010] 第一方面,提供了一種方法,該方法包括:獲取第一信息和第二信息,第一信息用 于指示社交網絡中的N個用戶的相互關注關系,第二信息用于指示N個用戶中各用戶發(fā)布 的消息數(shù),以及各用戶發(fā)布的消息的主題;根據(jù)第一信息和第二信息,確定目標主題對應的 N維權重向量,權重向量中的第i元素是基于第一比重和第二比重確定的,其中,第一比重 為:第i用戶發(fā)布的消息中,關于目標主題的消息所占的比重,第二比重為:第i用戶關注 的用戶中,發(fā)布的消息包含關于目標主題的消息的用戶所占的比重,i為1至N中的任意整 數(shù);獲取第三信息,第三信息用于指示N個用戶中具有消息轉發(fā)關系的用戶之間轉發(fā)消息 的數(shù)量和轉發(fā)消息的主題;根據(jù)第三信息,確定目標主題對應的轉移概率矩陣,轉移概率矩 陣的第(j,k)元素是基于:第k用戶被第j用戶轉發(fā)的,關于目標主題的消息的數(shù)量,第j 用戶對應的轉發(fā)關聯(lián)用戶的數(shù)量,以及轉發(fā)關聯(lián)用戶發(fā)布的關于目標主題的消息的數(shù)量之 間的大小關系確定的,其中,轉發(fā)關聯(lián)用戶為N個用戶中,發(fā)布的消息被第j用戶轉發(fā)過的 用戶,j、k均為1至N中的任意整數(shù);根據(jù)轉移概率矩陣和權值向量,利用佩奇排序算法確 定在社交網絡中,N個用戶在目標主題領域的影響力的排序。
[0011] 結合第一方面,在第一方面的第一種可能的實現(xiàn)方式中,權重向量中的第i元素 是通過以下公式確定的A = x(a/b) + (l-x) (c/d),其中,&是權重向量中的第i元素;X為 預先設定的實數(shù),且〇 < X < 1 ;a為第i用戶發(fā)布的關于目標主題的消息的數(shù)量;b為第i 用戶發(fā)布的消息總數(shù);c為第i用戶關注的用戶中,發(fā)布的消息包含關于目標主題的消息的 用戶的數(shù)量;d為第i用戶關注的用戶總數(shù)。
[0012] 結合第一方面或第一方面的第一種可能的實現(xiàn)方式,在第一方面的第二種可能 的實現(xiàn)方式中,轉移概率矩陣的第(j,k)元素是通過以下公式確定的:B jk = max(e,l)/ max(f,g),其中,Bjk為轉移概率矩陣的第(j,k)元素;e為第k用戶被第j用戶轉發(fā)的,關 于目標主題的消息的數(shù)量;f為轉發(fā)關聯(lián)用戶發(fā)布的關于目標主題的消息的數(shù)量;g為第j 用戶對應的轉發(fā)關聯(lián)用戶的數(shù)量。
[0013] 結合第一方面、第一方面的第一種或第二種可能的實現(xiàn)方式,在第一方面的第三 種可能的實現(xiàn)方式中,根據(jù)轉移概率矩陣和權值向量,利用佩奇排序算法確定N個用戶的 影響力的排序,包括:根據(jù)轉移概率矩陣和權值向量,對N個用戶各自對應的佩奇排序值進 行第一次迭代,第一次迭代為迭代次數(shù)預先設定的有限次迭代;
[0014] 根據(jù)第一次迭代后,N個用戶各自對應的佩奇排序值,將N個用戶分為第一集合和 第二集合,其中,第二集合中的用戶對應的佩奇排序值小于第一集合中的用戶對應的佩奇 排序值;根據(jù)轉移概率矩陣和權值向量,對N個用戶各自對應的佩奇排序值進行第二次迭 代,在第二次迭代中,第一集合中的用戶對應的佩奇排序值的迭代停止閾值小于第二集合 中的用戶對應的佩奇排序值的迭代停止閾值;將第二次迭代后,N個用戶各自對應的佩奇 排序值的大小排序確定為N個用戶在目標主題領域的影響力的排序。
[0015] 第二方面,提供了一種方法,該方法包括:對N個網絡節(jié)點各自對應的佩奇排序值 進行第一次迭代,第一次迭代為迭代次數(shù)預先設定的有限次迭代;根據(jù)第一次迭代后,N個 網絡節(jié)點各自對應的佩奇排序值,將N個網絡節(jié)點分為第一集合和第二集合,其中,第二集 合中的網絡節(jié)點對應的佩奇排序值小于第一集合中的網絡節(jié)點對應的佩奇排序值;對N個 網絡節(jié)點各自對應的佩奇排序值進行第二次迭代,在第二次迭代中,第一集合中的網絡節(jié) 點對應的佩奇排序值的迭代停止閾值小于第二集合中的網絡節(jié)點對應的佩奇排序值的迭 代停止閾值;將第二次迭代后,N個網絡節(jié)點各自對應的佩奇排序值的大小排序確定為N個 網絡節(jié)點的影響力的排序。
[0016] 第三方面,提供了一種裝置,該裝置包括:第一獲取模塊,用于獲取第一信息和第 二信息,第一信息用于指示社交網絡中的N個用戶的相互關注關系,第二信息用于指示N個 用戶中各用戶發(fā)布的消息數(shù),以及各用戶發(fā)布的消息的主題;第一確定模塊,用于根據(jù)第一 獲取模塊獲取的第一信息和第二信息,確定目標主題對應的N維權重向量,權重向量中的 第i元素是基于第一比重和第二比重確定的,其中,第一比重為:第i用戶發(fā)布的消息中,關 于目標主題的消息所占的比重,第二比重為:第i用戶關注的用戶中,發(fā)布的消息包含關于 目標主題的消息的用戶所占的比重,i為1至N中的任意整數(shù);第二獲取模塊,用于獲取第 三信息,第三信息用于指示N個用戶中具有消息轉發(fā)關系的用戶之間轉發(fā)消息的數(shù)量和轉 發(fā)消息的主題;第二確定模塊,用于根據(jù)第二獲取模塊獲取的第三信息,確定目標主題對應 的轉移概率矩陣,轉移概率矩陣的第(j,k)元素是基于:第k用戶被第j用戶轉發(fā)的,關于 目標主題的消息的數(shù)量,第j用戶對應的轉發(fā)關聯(lián)用戶的數(shù)量,以及轉發(fā)關聯(lián)用戶發(fā)布的 關于目標主題的消息的數(shù)量之間的大小關系確定的,其中,轉發(fā)關聯(lián)用戶為N個用戶中,發(fā) 布的消息被第j用戶轉發(fā)過的用戶,j、k均為1至N中的任意整數(shù);第三確定模塊,用于根 據(jù)轉移概率矩陣和權值向量,利用佩奇排序算法確定在社交網絡中,N個用戶在目標主題領 域的影響力的排序。
[0017] 結合第三方面,在第三方面的第一種可能的實現(xiàn)方式中,權重向量中的第i元素 是通過以下公式確定的A = x(a/b) + (l-x) (c/d),其中,&是權重向量中的第i元素;X為 預先設定的實數(shù),且〇 < X < 1 ;a為第i用戶發(fā)布的關于目標主題的消息的數(shù)量;b為第i 用戶發(fā)布的消息總數(shù);c為第i用戶關注的用戶中,發(fā)布的消息包含關于目標主題的消息的 用戶的數(shù)量;d為第i用戶關注的用戶總數(shù)。
[0018] 結合第三方面或第三方面的第一種可能的實現(xiàn)方式,在第三方面的第二種可能 的實現(xiàn)方式中,轉移概率矩陣的第(j,k)元素是通過以下公式確定的:B jk = maX(e,l)/ max(f,g),其中,Bjk為轉移概率矩陣的第(j,k)元素;e為第k用戶被第j用戶轉發(fā)的,關 于目標主題的消息的數(shù)量;f為轉發(fā)關聯(lián)用戶發(fā)布的關于目標主題的消息的數(shù)量;g為第j 用戶對應的轉發(fā)關聯(lián)用戶的數(shù)量。
[0019] 結合第三方面、第三方面的第一種或第二種可能的實現(xiàn)方式,在第三方面的第三 種可能的實現(xiàn)方式中,第三確定單元具體用于根據(jù)轉移概率矩陣和權值向量,對N個用戶 各自對應的佩奇排序值進行第一次迭代,第一次迭代為迭代次數(shù)預先設定的有限次迭代; 根據(jù)第一次迭代后,N個用戶各自對應的佩奇排序值,將N個用戶分為第一集合和第二集 合,其中,第二集合中的用戶對應的佩奇排序值小于第一集合中的用戶對應的佩奇排序值 的迭代停止閾值;根據(jù)轉移概率矩陣和權值向量,對N個用戶各自對應的佩奇排序值進行 第二次迭代,在第二次迭代中,第一集合中的用戶對應的佩奇排序值的迭代停止閾值小于 第二集合中的用戶對應的佩奇排序值的迭代停止閾值;將第二次迭代后,N個用戶各自對 應的佩奇排序值的大小排序確定為N個用戶在目標主題領域的影響力的排序。
[0020] 第四方面,提供了一種裝置,該裝置包括:第一迭代模塊,對N個網絡節(jié)點各自對 應的佩奇排序值進行第一次迭代,第一次迭代為迭代次數(shù)預先設定的有限次迭代;確定模 塊,用于根據(jù)第一迭代模塊得到的N個網絡節(jié)點各自對應的佩奇排序值,將N個網絡節(jié)點分 為第一集合和第二集合,其中,第二集合中的網絡節(jié)點對應的佩奇排序值小于第一集合中 的網絡節(jié)點對應的佩奇排序值;第二迭代模塊,用于對第一迭代模塊得到的N個網絡節(jié)點 各自對應的佩奇排序值進行第二次迭代,在第二次迭代中,確定模塊確定的第一集合中的 網絡節(jié)點對應的佩奇排序值的迭代停止閾值小于第二集合中的網絡節(jié)點對應的佩奇排序 值的迭代停止閾值;確定模塊還用于將第二次迭代后,N個網絡節(jié)點各自對應的佩奇排序 值的大小排序確定為N個網絡節(jié)點的影響力的排序。
[0021] 本發(fā)明的實施例采用了基于用戶之間實際的社交關系(例如轉發(fā)關系、關注關系 以及目標主題)確定的轉移概率矩陣和權重向量來進行影響力排序。由于用戶之間的實際 的社交關系反映了社交網絡中用戶之間實際的相關度,因此有效地提高了影響力排序結果 的準確性。
【專利附圖】
【附圖說明】
[0022] 為了更清楚地說明本發(fā)明實施例的技術方案,下面將對本發(fā)明實施例中所需要使 用的附圖作簡單地介紹,顯而易見地,下面所描述的附圖僅僅是本發(fā)明的一些實施例,對于 本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他 的附圖。
[0023] 圖1是根據(jù)本發(fā)明實施例的確定用戶的影響力的方法的示意性流程圖。
[0024] 圖2是根據(jù)本發(fā)明另一實施例的確定用戶的影響力的裝置的示意性結構圖。
[0025] 圖3是根據(jù)本發(fā)明另一實施例的確定用戶的影響力的方法的示意性流程圖。
[0026] 圖4是根據(jù)本發(fā)明又一實施例的確定用戶的影響力的裝置的示意性結構圖。
[0027] 圖5是根據(jù)本發(fā)明另一實施例的確定網絡節(jié)點的影響力的方法的示意性流程圖。
[0028] 圖6是根據(jù)本發(fā)明另一實施例的確定網絡節(jié)點的影響力的裝置的示意性結構圖。
[0029] 圖7是根據(jù)本發(fā)明另一實施例的確定網絡節(jié)點的影響力的方法的示意性流程圖。
[0030] 圖8是根據(jù)本發(fā)明另一實施例的確定網絡節(jié)點的影響力的裝置的示意性結構圖。
【具體實施方式】
[0031] 下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完 整地描述,顯然,所描述的實施例是本發(fā)明的一部分實施例,而不是全部實施例?;诒景l(fā) 明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實 施例,都應屬于本發(fā)明保護的范圍。
[0032] 圖1是根據(jù)本發(fā)明實施例的確定用戶的影響力的方法的示意性流程圖。圖1的方 法由確定用戶的影響力的裝置執(zhí)行。圖1的方法包括:
[0033] 110、獲取第一信息和第二信息,第一信息用于指示社交網絡中的N個用戶的相互 關注關系,第二信息用于指示N個用戶中各用戶發(fā)布的消息數(shù),以及各用戶發(fā)布的消息的 主題;
[0034] 120、根據(jù)第一信息和第二信息,確定目標主題對應的N維權重向量,權重向量中 的第i元素是基于第一比重和第二比重確定的,其中,第一比重為:第i用戶發(fā)布的消息中, 關于目標主題的消息所占的比重,第二比重為:第i用戶關注的用戶中,發(fā)布的消息包含關 于目標主題的消息的用戶所占的比重,i為1至N中的任意整數(shù);
[0035] 130、獲取第三信息,第三信息用于指示N個用戶中具有消息轉發(fā)關系的用戶之間 轉發(fā)消息的數(shù)量和轉發(fā)消息的主題;
[0036] 140、根據(jù)第三信息,確定目標主題對應的轉移概率矩陣,轉移概率矩陣的第(j,k) 元素是基于:第k用戶被第j用戶轉發(fā)的,關于目標主題的消息的數(shù)量,第j用戶對應的轉 發(fā)關聯(lián)用戶的數(shù)量,以及轉發(fā)關聯(lián)用戶發(fā)布的關于目標主題的消息的數(shù)量之間的大小關系 確定的,其中,轉發(fā)關聯(lián)用戶為N個用戶中,發(fā)布的消息被第j用戶轉發(fā)過的用戶,j、k均為 1至N中的任意整數(shù);
[0037] 150、根據(jù)轉移概率矩陣和權值向量,利用佩奇排序算法確定在社交網絡中,N個用 戶在目標主題領域的影響力的排序。
[0038] 應理解,第二信息還可以指示各個用戶發(fā)布的消息總數(shù)。各用戶發(fā)布的消息的主 題可以是例如社會、教育、經濟、軍事、娛樂等中的一種或多種。
[0039] 本發(fā)明的實施例采用了基于用戶之間實際的社交關系(例如轉發(fā)關系、關注關系 以及目標主題)確定的轉移概率矩陣和權重向量來進行影響力排序。由于用戶之間的實際 的社交關系反映了社交網絡中用戶之間實際的相關度,因此有效地提高了影響力排序結果 的準確性。
[0040] 根據(jù)本發(fā)明的實施例,權重向量中的第i元素是通過以下公式確定的:Ai = x(a/ b) + (l_x) (c/d),其中,&是權重向量中的第i元素;x為預先設定的實數(shù),且0彡x彡1 ;a 為第i用戶發(fā)布的關于目標主題的消息的數(shù)量;b為第i用戶發(fā)布的消息總數(shù);c為第i用 戶關注的用戶中,發(fā)布的消息包含關于目標主題的消息的用戶的數(shù)量;d為第i用戶關注的 用戶總數(shù)。
[0041] 應理解,確定權重向量中的元素也可以采用基于a/b和c/d確定的其他的公式。例 如進行簡單的變形。
[0042] 根據(jù)本發(fā)明的實施例,轉移概率矩陣的第(j,k)元素是通過以下公式確定的:Bjk =max(e, l)/max(f, g),其中,Bjk為轉移概率矩陣的第(j,k)元素;e為第k用戶被第j用 戶轉發(fā)的,關于目標主題的消息的數(shù)量;f為轉發(fā)關聯(lián)用戶發(fā)布的關于目標主題的消息的 數(shù)量;g為第j用戶對應的轉發(fā)關聯(lián)用戶的數(shù)量。
[0043] 應理解,確定轉移概率矩陣中的元素也可以采用基于e、f和g確定的其他的公式。
[0044] 根據(jù)本發(fā)明的實施例,根據(jù)轉移概率矩陣和權值向量,利用佩奇排序算法確定N 個用戶的影響力的排序,包括:根據(jù)轉移概率矩陣和權值向量,對N個用戶各自對應的佩奇 排序值進行第一次迭代,第一次迭代為迭代次數(shù)預先設定的有限次迭代;根據(jù)第一次迭代 后,N個用戶各自對應的佩奇排序值,將N個用戶分為第一集合和第二集合,其中,第二集合 中的用戶對應的佩奇排序值小于第一集合中的用戶對應的佩奇排序值;根據(jù)轉移概率矩陣 和權值向量,對N個用戶各自對應的佩奇排序值進行第二次迭代,在第二次迭代中,第一集 合中的用戶對應的佩奇排序值的迭代停止閾值小于第二集合中的用戶對應的佩奇排序值 的迭代停止閾值;將第二次迭代后,N個用戶各自對應的佩奇排序值的大小排序確定為N個 用戶在目標主題領域的影響力的排序。
[0045] 應理解,迭代次數(shù)預先設定的有限次迭代,可以是根據(jù)六度空間理論設定的迭代 次數(shù),例如5次。也可以是其他的迭代次數(shù),例如少于10次。換句話說,第一次迭代為迭代 次數(shù)預先設定的有限次迭代,以便于根據(jù)第一次的迭代結果的排序值進行影響力的初步排 序,并根據(jù)需要將第一集合的用戶進行更加精確的排序。圖1的方法還可以包括:在第一次 迭代中,對N個用戶的佩奇排序值設定收斂停止閾值。根據(jù)第一次迭代后,N個用戶各自對 應的佩奇排序值,將N個用戶分為第一集合和第二集合,可以是,根據(jù)冪律分布規(guī)律確定兩 個集合,例如第一次迭代后的佩奇排序值中,按照大小順序,前20%的用戶為第一集合,后 80%的用戶為第二集合。也可以根據(jù)需要劃分不同的集合。
[0046] 由于對第一集合設定的收斂停止閾值小于第二集合設定的收斂停止閾值,因此在 對影響力排序時,對第二集合進行了更少次的運算,從而減少了計算的開銷。
[0047] 換句話說,社交網絡數(shù)據(jù)具有小世界和大數(shù)據(jù)屬性,用戶節(jié)點的影響力排序值呈 冪律分布,即絕大部分節(jié)點的影響力值都很低,只有少部分節(jié)點的影響力很高。在實際的 節(jié)點影響力排名應用中,并不需要對所有節(jié)點進行排名,只需對少量影響力大的節(jié)點進行 排名。大部分影響力小的節(jié)點在遞歸計算5次后,就可以忽略這些節(jié)點的變化,不再需要計 算,從而大量節(jié)省計算時間。
[0048] 上面描述了根據(jù)本發(fā)明實施例的確定用戶的影響力的方法,下面結合附圖描述根 據(jù)本發(fā)明實施例的確定用戶的影響力的裝置。
[0049] 圖2是根據(jù)本發(fā)明另一實施例的確定用戶的影響力的裝置的示意性結構圖。圖2 的裝置200包括:第一獲取模塊210,用于獲取第一信息和第二信息,第一信息用于指不社 交網絡中的N個用戶的相互關注關系,第二信息用于指示N個用戶中各用戶發(fā)布的消息數(shù), 以及各用戶發(fā)布的消息的主題;第一確定模塊220,用于根據(jù)第一獲取模塊210獲取的第一 信息和第二信息,確定目標主題對應的N維權重向量,權重向量中的第i元素是基于第一比 重和第二比重確定的,其中,第一比重為:第i用戶發(fā)布的消息中,關于目標主題的消息所 占的比重,第二比重為:第i用戶關注的用戶中,發(fā)布的消息包含關于目標主題的消息的用 戶所占的比重,i為1至N中的任意整數(shù);第二獲取模塊230,用于獲取第三信息,第三信息 用于指示N個用戶中具有消息轉發(fā)關系的用戶之間轉發(fā)消息的數(shù)量和轉發(fā)消息的主題;第 二確定模塊240,用于根據(jù)第二獲取模塊230獲取的第三信息,確定目標主題對應的轉移概 率矩陣,轉移概率矩陣的第(j,k)元素是基于:第k用戶被第j用戶轉發(fā)的,關于目標主題 的消息的數(shù)量,第j用戶對應的轉發(fā)關聯(lián)用戶的數(shù)量,以及轉發(fā)關聯(lián)用戶發(fā)布的關于目標 主題的消息的數(shù)量之間的大小關系確定的,其中,轉發(fā)關聯(lián)用戶為N個用戶中,發(fā)布的消息 被第j用戶轉發(fā)過的用戶,j、k均為1至N中的任意整數(shù);第三確定模塊250,用于根據(jù)轉 移概率矩陣和權值向量,利用佩奇排序算法確定在社交網絡中,N個用戶在目標主題領域的 影響力的排序。
[0050] 本發(fā)明的實施例采用了基于用戶之間實際的社交關系(例如轉發(fā)關系、關注關系 以及目標主題)確定的轉移概率矩陣和權重向量來進行影響力排序。由于用戶之間的實際 的社交關系反映了社交網絡中用戶之間實際的相關度,因此有效地提高了影響力排序結果 的準確性。
[0051] 根據(jù)本發(fā)明的實施例,權重向量中的第i元素是通過以下公式確定的:Ai = x(a/ b) + (l_x) (c/d),其中,&是權重向量中的第i元素;x為預先設定的實數(shù),且0彡x彡1 ;a 為第i用戶發(fā)布的關于目標主題的消息的數(shù)量;b為第i用戶發(fā)布的消息總數(shù);c為第i用 戶關注的用戶中,發(fā)布的消息包含關于目標主題的消息的用戶的數(shù)量;d為第i用戶關注的 用戶總數(shù)。
[0052] 根據(jù)本發(fā)明的實施例,轉移概率矩陣的第(j,k)元素是通過以下公式確定的:Bjk =max(e, l)/max(f, g),其中,Bjk為轉移概率矩陣的第(j,k)元素;e為第k用戶被第j用 戶轉發(fā)的,關于目標主題的消息的數(shù)量;f為轉發(fā)關聯(lián)用戶發(fā)布的關于目標主題的消息的 數(shù)量;g為第j用戶對應的轉發(fā)關聯(lián)用戶的數(shù)量。
[0053] 根據(jù)本發(fā)明的實施例,第三確定單元具體用于根據(jù)轉移概率矩陣和權值向量,對N 個用戶各自對應的佩奇排序值進行第一次迭代,第一次迭代為迭代次數(shù)預先設定的有限次 迭代;根據(jù)第一次迭代后,N個用戶各自對應的佩奇排序值,將N個用戶分為第一集合和第 二集合,其中,第二集合中的用戶對應的佩奇排序值小于第一集合中的用戶對應的佩奇排 序值的迭代停止閾值;根據(jù)轉移概率矩陣和權值向量,對N個用戶各自對應的佩奇排序值 進行第二次迭代,在第二次迭代中,第一集合中的用戶對應的佩奇排序值的迭代停止閾值 小于第二集合中的用戶對應的佩奇排序值的迭代停止閾值;將第二次迭代后,N個用戶各 自對應的佩奇排序值的大小排序確定為N個用戶在目標主題領域的影響力的排序。
[0054] 確定用戶的影響力的裝置200的各個模塊的操作和功能可以參考上述圖1的方 法,為了避免重復,在此不再贅述。下面結合具體例子,更加詳細地描述本發(fā)明的實施例。
[0055] 圖3是根據(jù)本發(fā)明另一實施例的確定用戶的影響力的方法的示意性流程圖。圖3 的方法是圖1的方法的例子。本實施例中的集合Z中的用戶對應圖1的實施例中的第二集 合中的用戶,集合Y中不屬于集合Z中的用戶對應圖1的實施例中的第一集合中的用戶;第 一閾值對應第一集合中的用戶對應的佩奇排序值的迭代停止閾值,第二閾值對應第一集合 中的用戶對應的佩奇排序值的迭代停止閾值。第一排序值用于排序值向量的初始化,其中 每個用戶的第一排序值為排序值向量的元素;第二排序值向量對應第一次迭代后N個用戶 各自對應的佩奇排序值構成的向量。具體的實現(xiàn)方式如下。
[0056] 310、設定迭代次數(shù)。
[0057] 例如基于六度空間理論,將迭代次數(shù)設定為5,換句話說,節(jié)點說影響力的傳遞最 多不超過5次就可以到達所有的節(jié)點。
[0058] 320、對所有用戶的佩奇排序值賦值。
[0059] 具體地,對所有的用戶設定相同的第一排序值,例如將多有用戶賦值為1。
[0060] 330、設定第一閾值。
[0061] 該第一閾值用于與用戶的影響力排序值的波動比較,影響力排序值的波動定義為 R = | pk-pk+1 | /pk。
[0062] 340、根據(jù)設定的迭代次數(shù)進行計算,并根據(jù)第一閾值確定部分用戶的影響力排序 值。
[0063] 例如,可以采用公式 3. l:pk+1 = βΒΡ--+(1-β)Α (3. 1)
[0064] 其中,Β為社會類主題的轉移概率矩陣,該矩陣為ΝΧΝ矩陣;Α為社會類主題的權 重向量,該向量為對應N個用戶的N維向量;β為常數(shù),例如可以為0. 15 ;pk和pk+1分別為 用戶的排序值經過第k次和第k+Ι次迭代后的排序值向量,該向量為對應N個用戶的N維 向量。權重向量A中的第i元素是通過以下公式確定的A = x(a/b) + (l-x) (c/d),其中, A是權重向量中的第i元素;x為預先設定的實數(shù),且0 < x < 1 ;a為第i用戶發(fā)布的關于 目標主題的消息的數(shù)量;b為第i用戶發(fā)布的消息總數(shù);c為第i用戶關注的用戶中,發(fā)布的 消息包含關于目標主題的消息的用戶的數(shù)量;d為第i用戶關注的用戶總數(shù)。轉移概率矩 陣B的第(j,k)元素是通過以下公式確定的:B jk = max(e, l)/max(f, g),其中,Bjk為轉移 概率矩陣的第(j,k)元素;e為第k用戶被第j用戶轉發(fā)的,關于目標主題的消息的數(shù)量; f為轉發(fā)關聯(lián)用戶發(fā)布的關于目標主題的消息的數(shù)量;g為第j用戶對應的轉發(fā)關聯(lián)用戶的 數(shù)量。
[0065] 具體而言,利用轉移概率矩陣B和主題的權重向量A對用戶的第一排序值向量進 行迭代計算,并在每次迭代計算后計算每個用戶的排序值的波動值R。將該波動值R與第一 閾值比較:如果在5次迭代計算內的波動值不大于第一閾值,則停止對該用戶的計算。同時 將該用戶的排序值確定為影響力排序值,并將該用戶確定為集合X中的元素。如果在5次 迭代計算后,用戶的排序值的波動值大于第一閾值,則將該用戶確定為集合Y中元素,并執(zhí) 行 350。
[0066] 350、確定用戶的第二排序值向量。
[0067] 具體地,通過對轉移概率矩陣和用戶的多個第一排序值向量進行5次迭代計算, 確定用戶的第二排序值向量,其中第二排序值向量中的元素為每個用戶的第二排序值。
[0068] 360、確定集合Y中低影響力用戶的集合Z。
[0069] 具體地,根據(jù)集合Y中每個用戶的第二排序值的大小進行初步排序,并根據(jù)排序 結果確定低影響力用戶的集合Z。例如,根據(jù)冪律分布將排序在后80%的用戶確定為低影 響力用戶。
[0070] 對于集合Y中不屬于集合Z中的用戶,與340相似,根據(jù)第一閾值和公式3. 1確定 該用戶的影響力排序值。對集合Z中的用戶執(zhí)行370。
[0071] 370、針對集合Z中的用戶設定第二閾值。
[0072] 具體地,設定大于第一閾值的第二閾值。由于排序在后80%的用戶為低影響力用 戶,因此使第二閾值大于第一閾值基本不會減少最終影響力排序的精確度。
[0073] 380、根據(jù)第二閾值確定集合Z中用戶的影響力排序值。
[0074] 例如,根據(jù)公式3. 1,利用轉移概率矩陣B和主題的權重向量A對用戶的第二排序 值向量進行迭代計算,并在每次迭代計算后計算集合Z中每個用戶的排序值的波動值。將 該波動值與第二閾值比較:如果該波動值不大于第二閾值,則停止對該用戶的計算。同時將 該用戶的排序值確定為集合Z中用戶的影響力排序值。
[0075] 390、根據(jù)所有用戶的影響力排序值確定所有用戶的影響力。
[0076] 具體地,由于影響力排序值大的用戶的影響力高,可以將用戶按照影響力排序值 從大到小排序來確定所有用戶的影響力。
[0077] 圖4是根據(jù)本發(fā)明另一實施例的確定用戶的影響力的裝置的示意性流程圖。圖4 的裝置400包括:處理器410、存儲器420、通信總線430。處理器410通過通信總線430調 用存儲器420中的代碼,并用于:獲取第一信息和第二信息,第一信息用于指示社交網絡中 的N個用戶的相互關注關系,第二信息用于指示N個用戶中各用戶發(fā)布的消息數(shù),以及各 用戶發(fā)布的消息的主題;根據(jù)第一信息和第二信息,確定目標主題對應的N維權重向量,權 重向量中的第i元素是基于第一比重和第二比重確定的,其中,第一比重為:第i用戶發(fā)布 的消息中,關于目標主題的消息所占的比重,第二比重為:第i用戶關注的用戶中,發(fā)布的 消息包含關于目標主題的消息的用戶所占的比重,i為1至N中的任意整數(shù);獲取第三信 息,第三信息用于指示N個用戶中具有消息轉發(fā)關系的用戶之間轉發(fā)消息的數(shù)量和轉發(fā)消 息的主題;根據(jù)第三信息,確定目標主題對應的轉移概率矩陣,轉移概率矩陣的第(j,k)元 素是基于:第k用戶被第j用戶轉發(fā)的,關于目標主題的消息的數(shù)量,第j用戶對應的轉發(fā) 關聯(lián)用戶的數(shù)量,以及轉發(fā)關聯(lián)用戶發(fā)布的關于目標主題的消息的數(shù)量之間的大小關系確 定的,其中,轉發(fā)關聯(lián)用戶為N個用戶中,發(fā)布的消息被第j用戶轉發(fā)過的用戶,j、k均為1 至N中的任意整數(shù);根據(jù)轉移概率矩陣和權值向量,利用佩奇排序算法確定在社交網絡中, N個用戶在目標主題領域的影響力的排序。
[0078] 本發(fā)明的實施例采用了基于用戶之間實際的社交關系(例如轉發(fā)關系、關注關系 以及目標主題)確定的轉移概率矩陣和權重向量來進行影響力排序。由于用戶之間的實際 的社交關系反映了社交網絡中用戶之間實際的相關度,因此有效地提高了影響力排序結果 的準確性。
[0079] 根據(jù)本發(fā)明的實施例,權重向量中的第i元素是通過以下公式確定的A = x(a/ b) + (l_x) (c/d),其中,&是權重向量中的第i元素;x為預先設定的實數(shù),且0彡x彡1 ;a 為第i用戶發(fā)布的關于目標主題的消息的數(shù)量;b為第i用戶發(fā)布的消息總數(shù);c為第i用 戶關注的用戶中,發(fā)布的消息包含關于目標主題的消息的用戶的數(shù)量;d為第i用戶關注的 用戶總數(shù)。
[0080] 根據(jù)本發(fā)明的實施例,轉移概率矩陣的第(j,k)元素是通過以下公式確定的:Bjk =max(e, l)/max(f, g),其中,Bjk為轉移概率矩陣的第(j,k)元素;e為第k用戶被第j用 戶轉發(fā)的,關于目標主題的消息的數(shù)量;f為轉發(fā)關聯(lián)用戶發(fā)布的關于目標主題的消息的 數(shù)量;g為第j用戶對應的轉發(fā)關聯(lián)用戶的數(shù)量。
[0081] 根據(jù)本發(fā)明的實施例,處理器410具體用于:根據(jù)轉移概率矩陣和權值向量,對N 個用戶各自對應的佩奇排序值進行第一次迭代,第一次迭代為迭代次數(shù)預先設定的有限次 迭代;根據(jù)第一次迭代后,N個用戶各自對應的佩奇排序值,將N個用戶分為第一集合和第 二集合,其中,第二集合中的用戶對應的佩奇排序值小于第一集合中的用戶對應的佩奇排 序值;根據(jù)轉移概率矩陣和權值向量,對N個用戶各自對應的佩奇排序值進行第二次迭代, 在第二次迭代中,第一集合中的用戶對應的佩奇排序值的迭代停止閾值小于第二集合中的 用戶對應的佩奇排序值的迭代停止閾值;將第二次迭代后,N個用戶各自對應的佩奇排序 值的大小排序確定為N個用戶在目標主題領域的影響力的排序。
[0082] 確定用戶的影響力的裝置400的各個模塊的操作和功能可以參考上述圖1的方 法,為了避免重復,在此不再贅述。
[0083] 此外,現(xiàn)有技術采用的佩奇排序方法或面向主題的佩奇排序方法來進行網絡節(jié)點 的影響力排序,利用隨機沖浪者模型,并通過迭代計算使排序值收斂至設定的閾值來進行 的影響力排序。然而,由于采用迭代計算使排序值收斂至設定的閾值需要多次計算,當網絡 節(jié)點數(shù)目過多時,計算開銷大。本發(fā)明另一實施例的確定網絡節(jié)點的影響力的方法,可以在 網絡節(jié)點數(shù)目過多時,減少計算的開銷。
[0084] 圖5是根據(jù)本發(fā)明另一實施例的確定網絡節(jié)點的影響力的方法的示意性流程圖。 圖5的方法由確定網絡節(jié)點的影響力的裝置執(zhí)行。包括:
[0085] 510、對N個網絡節(jié)點各自對應的佩奇排序值進行第一次迭代,第一次迭代為迭代 次數(shù)預先設定的有限次迭代;
[0086] 520、根據(jù)第一次迭代后,N個網絡節(jié)點各自對應的佩奇排序值,將N個網絡節(jié)點分 為第一集合和第二集合,其中,第二集合中的網絡節(jié)點對應的佩奇排序值小于第一集合中 的網絡節(jié)點對應的佩奇排序值;
[0087] 530、對N個網絡節(jié)點各自對應的佩奇排序值進行第二次迭代,在第二次迭代中, 第一集合中的網絡節(jié)點對應的佩奇排序值的迭代停止閾值小于第二集合中的網絡節(jié)點對 應的佩奇排序值的迭代停止閾值;
[0088] 540、將第二次迭代后,N個網絡節(jié)點各自對應的佩奇排序值的大小排序確定為N 個網絡節(jié)點的影響力的排序。
[0089] 應理解,網絡節(jié)點可以是網站,手機用戶,微博或微信用戶,運營商網關等。迭代次 數(shù)預先設定的有限次迭代,可以是根據(jù)六度空間理論設定的迭代次數(shù),例如5次。也可以是 其他的迭代次數(shù),例如少于10次。換句話說,第一次迭代為迭代次數(shù)預先設定的有限次迭 代,以便于根據(jù)第一次的迭代結果的排序值進行影響力的初步排序,并根據(jù)需要將第一集 合的網絡節(jié)點進行更加精確的排序。圖1的方法還可以包括:在第一次迭代中,對N個網絡 節(jié)點的佩奇排序值設定收斂停止閾值。根據(jù)第一次迭代后,N個網絡節(jié)點各自對應的佩奇 排序值,將N個網絡節(jié)點分為第一集合和第二集合,可以是,根據(jù)冪律分布規(guī)律確定兩個集 合,例如第一次迭代后的佩奇排序值中,按照大小順序,前20 %的網絡節(jié)點為第一集合,后 80%的網絡節(jié)點為第二集合。也可以根據(jù)需要劃分不同的集合。
[0090] 本發(fā)明的實施例可以根據(jù)需要針對不同的網絡節(jié)點設定不同的收斂停止閾值,由 于對于收斂停止閾值小的網絡節(jié)點可以進行更少次數(shù)的迭代計算,因此減少了計算的開 銷。
[0091] 上面描述了根據(jù)本發(fā)明實施例的確定網絡節(jié)點的影響力的方法,下面結合附圖描 述根據(jù)本發(fā)明實施例的確定網絡節(jié)點的影響力的裝置。
[0092] 圖6是根據(jù)本發(fā)明另一實施例的確定網絡節(jié)點的影響力的裝置的示意性結構圖。 圖6的裝置600包括:第一迭代模塊610,用于對N個網絡節(jié)點各自對應的佩奇排序值進行 第一次迭代,第一次迭代為迭代次數(shù)預先設定的有限次迭代;確定模塊620,用于根據(jù)第一 迭代模塊得到的N個網絡節(jié)點各自對應的佩奇排序值,將N個網絡節(jié)點分為第一集合和第 二集合,其中,第二集合中的網絡節(jié)點對應的佩奇排序值小于第一集合中的網絡節(jié)點對應 的佩奇排序值;第二迭代模塊630,用于對第一迭代模塊得到的N個網絡節(jié)點各自對應的佩 奇排序值進行第二次迭代,在第二次迭代中,確定模塊確定的第一集合中的網絡節(jié)點對應 的佩奇排序值的迭代停止閾值小于第二集合中的網絡節(jié)點對應的佩奇排序值的迭代停止 閾值;確定模塊620還用于將第二次迭代后,N個網絡節(jié)點各自對應的佩奇排序值的大小排 序確定為N個網絡節(jié)點的影響力的排序。
[0093] 本發(fā)明的實施例可以根據(jù)需要針對不同的網絡節(jié)點設定不同的收斂停止閾值,由 于對于收斂停止閾值小的網絡節(jié)點可以進行更少次數(shù)的迭代計算,因此減少了計算的開 銷。
[0094] 確定網絡節(jié)點的影響力的裝置600的各個模塊的操作和功能可以參考上述圖5的 方法,為了避免重復,在此不再贅述。下面結合具體例子,更加詳細地描述本發(fā)明的實施例。 [0095] 圖7是根據(jù)本發(fā)明另一實施例的確定網絡節(jié)點的影響力的方法的示意性流程圖。 圖7的方法是圖5的方法的例子。本實施例中的集合Z中的網絡節(jié)點對應圖5的實施例中 的第二集合中的網絡節(jié)點,集合Y中不屬于集合Z中的網絡節(jié)點對應圖5的實施例中的第 一集合中的網絡節(jié)點;第一閾值對應第一集合中的網絡節(jié)點對應的佩奇排序值的迭代停止 閾值,第二閾值對應第一集合中的網絡節(jié)點對應的佩奇排序值的迭代停止閾值。第一排序 值用于排序值向量的初始化,其中每個網絡節(jié)點的第一排序值為排序值向量的元素;第二 排序值向量對應第一次迭代后N個網絡節(jié)點各自對應的佩奇排序值構成的向量。具體的實 現(xiàn)方式如下。
[0096] 710、設定迭代次數(shù)。
[0097] 例如,以社交網絡為例,根據(jù)六度空間理論將迭代次數(shù)設定為5,換句話說,節(jié)點說 影響力的傳遞最多不超過5次就可以到達所有的節(jié)點。
[0098] 720、對所有網絡節(jié)點的佩奇排序值賦值。
[0099] 具體地,對所有的網絡節(jié)點設定相同的第一排序值,例如將多有網絡節(jié)點賦值為 1〇
[0100] 730、設定第一閾值。
[0101] 該第一閾值用于與網絡節(jié)點的影響力排序值的波動比較,影響力排序值的波動定 義為 R = I pk-pk+1 I /pk。
[0102] 740、根據(jù)第一閾值確定部分網絡節(jié)點的影響力排序值。
[0103] 例如,采用"抽稅模型"公式 7. l:pk+1 = i3Mpk+(l-i3)e/S (7. 1)
[0104] 其中,Μ為轉移概率矩陣,該矩陣為NXN矩陣;e為權重向量,該向量為對應N個網 絡節(jié)點的N維向量;β為常數(shù),例如可以為0. 15 ;pk和pk+1分別為網絡節(jié)點的排序值經過第 k次和第k+Ι次迭代后的排序值向量,該向量為對應N個網絡節(jié)點的N維向量。S為N個網 絡節(jié)點中與目標主題相關的網絡節(jié)點的數(shù)目。權重向量e中的元素取決于該節(jié)點是否與該 目標主題相關,若相關則為1,否則為0。具體而言,利用轉移概率矩陣Μ和權重向量e對網 絡節(jié)點的第一排序值向量進行迭代計算,并在每次迭代計算后計算每個網絡節(jié)點的排序值 的波動值R。將該波動值R與第一閾值比較:如果在5次迭代計算內的波動值不大于第一 閾值,則停止對該網絡節(jié)點的計算。同時將該網絡節(jié)點的排序值確定為影響力排序值,并將 該網絡節(jié)點確定為集合X中的元素。如果在5次迭代計算后,網絡節(jié)點的排序值的波動值 大于第一閾值,則將該網絡節(jié)點確定為集合Y中元素,并執(zhí)行750。
[0105] 750、確定網絡節(jié)點的第二排序值向量。
[0106] 具體地,通過對轉移概率矩陣和網絡節(jié)點的多個第一排序值向量進行5次迭代計 算,確定網絡節(jié)點的第二排序值向量,其中第二排序值向量中的元素為每個網絡節(jié)點的第 二排序值。
[0107] 760、確定集合Y中低影響力網絡節(jié)點的集合Z。
[0108] 具體地,根據(jù)集合Y中每個網絡節(jié)點的第二排序值的大小進行初步排序,并根據(jù) 排序結果確定低影響力網絡節(jié)點的集合Z。例如,根據(jù)冪律分布將排序在后80%的網絡節(jié) 點確定為低影響力網絡節(jié)點。
[0109] 對于集合Y中不屬于集合Z中的網絡節(jié)點,與740相似,根據(jù)第一閾值和公式7. 1 確定該網絡節(jié)點的影響力排序值。對集合Z中的網絡節(jié)點執(zhí)行770。
[0110] 770、針對集合Z中的網絡節(jié)點設定第二閾值。
[0111] 具體地,設定大于第一閾值的第二閾值。由于排序在后80%的網絡節(jié)點為低影響 力網絡節(jié)點,因此使第二閾值大于第一閾值基本不會減少最終影響力排序的精確度。
[0112] 780、根據(jù)第二閾值確定集合Z中網絡節(jié)點的影響力排序值。
[0113] 例如,根據(jù)公式7. 1,利用轉移概率矩陣Μ和權重向量e對網絡節(jié)點的第二排序值 向量進行迭代計算,并在每次迭代計算后計算集合Z中每個網絡節(jié)點的排序值的波動值。 將該波動值與第二閾值比較:如果該波動值不大于第二閾值,則停止對該網絡節(jié)點的計算。 同時將該網絡節(jié)點的排序值確定為集合Z中網絡節(jié)點的影響力排序值。
[0114] 790、根據(jù)所有網絡節(jié)點的影響力排序值確定所有網絡節(jié)點的影響力。
[0115] 具體地,由于影響力排序值大的網絡節(jié)點的影響力高,可以將網絡節(jié)點按照影響 力排序值從大到小排序來確定所有網絡節(jié)點的影響力。
[0116] 圖8是根據(jù)本發(fā)明另一實施例的確定網絡節(jié)點的影響力的裝置的示意性結構圖。
[0117] 圖8的裝置800包括:處理器810、存儲器820、通信總線830。處理器810通過通 信總線830調用存儲器820中的代碼,并用于:對N個網絡節(jié)點各自對應的佩奇排序值進行 第一次迭代,第一次迭代為迭代次數(shù)預先設定的有限次迭代;根據(jù)第一次迭代后,N個網絡 節(jié)點各自對應的佩奇排序值,將N個網絡節(jié)點分為第一集合和第二集合,其中,第二集合中 的網絡節(jié)點對應的佩奇排序值小于第一集合中的網絡節(jié)點對應的佩奇排序值;對N個網絡 節(jié)點各自對應的佩奇排序值進行第二次迭代,在第二次迭代中,第一集合中的網絡節(jié)點對 應的佩奇排序值的迭代停止閾值小于第二集合中的網絡節(jié)點對應的佩奇排序值的迭代停 止閾值;將第二次迭代后,N個網絡節(jié)點各自對應的佩奇排序值的大小排序確定為N個網絡 節(jié)點的影響力的排序。
[0118] 確定網絡節(jié)點的影響力的裝置800的各個模塊的操作和功能可以參考上述圖5的 方法,為了避免重復,在此不再贅述。
[0119] 另外,本文中術語"系統(tǒng)"和"網絡"在本文中常被可互換使用。本文中術語"和/ 或",僅僅是一種描述關聯(lián)對象的關聯(lián)關系,表示可以存在三種關系,例如,A和/或B,可以 表示:單獨存在A,同時存在A和B,單獨存在B這三種情況。另外,本文中字符"/",一般表 示前后關聯(lián)對象是一種"或"的關系。
[0120] 應理解,在本發(fā)明實施例中,"與A相應的B"表示B與A相關聯(lián),根據(jù)A可以確定 B。但還應理解,根據(jù)A確定B并不意味著僅僅根據(jù)A確定B,還可以根據(jù)A和/或其它信息 確定B。
[0121] 本領域普通技術人員可以意識到,結合本文中所公開的實施例描述的各示例的單 元及算法步驟,能夠以電子硬件、計算機軟件或者二者的結合來實現(xiàn),為了清楚地說明硬件 和軟件的可互換性,在上述說明中已經按照功能一般性地描述了各示例的組成及步驟。這 些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術方案的特定應用和設計約束條件。專 業(yè)技術人員可以對每個特定的應用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不 應認為超出本發(fā)明的范圍。
[0122] 所屬領域的技術人員可以清楚地了解到,為了描述的方便和簡潔,上述描述的系 統(tǒng)、裝置和單元的具體工作過程,可以參考前述方法實施例中的對應過程,在此不再贅述。
[0123] 在本申請所提供的幾個實施例中,應該理解到,所揭露的系統(tǒng)、裝置和方法,可以 通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的 劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件 可以結合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討 論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口、裝置或單元的間接耦合 或通信連接,也可以是電的,機械的或其它的形式連接。
[0124] 所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯 示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個 網絡單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本發(fā)明實施例方案 的目的。
[0125] 另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以 是各個單元單獨物理存在,也可以是兩個或兩個以上單元集成在一個單元中。上述集成的 單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。
[0126] 通過以上的實施方式的描述,所屬領域的技術人員可以清楚地了解到本發(fā)明可以 用硬件實現(xiàn),或固件實現(xiàn),或它們的組合方式來實現(xiàn)。當使用軟件實現(xiàn)時,可以將上述功能 存儲在計算機可讀介質中或作為計算機可讀介質上的一個或多個指令或代碼進行傳輸。計 算機可讀介質包括計算機存儲介質和通信介質,其中通信介質包括便于從一個地方向另一 個地方傳送計算機程序的任何介質。存儲介質可以是計算機能夠存取的任何可用介質。以 此為例但不限于:計算機可讀介質可以包括RAM、ROM、EEPROM、CD-ROM或其他光盤存儲、磁 盤存儲介質或者其他磁存儲設備、或者能夠用于攜帶或存儲具有指令或數(shù)據(jù)結構形式的期 望的程序代碼并能夠由計算機存取的任何其他介質。此外。任何連接可以適當?shù)某蔀橛嬎?機可讀介質。例如,如果軟件是使用同軸電纜、光纖光纜、雙絞線、數(shù)字用戶線(DSL)或者諸 如紅外線、無線電和微波之類的無線技術從網站、服務器或者其他遠程源傳輸?shù)模敲赐S 電纜、光纖光纜、雙絞線、DSL或者諸如紅外線、無線和微波之類的無線技術包括在所屬介質 的定影中。如本發(fā)明所使用的,盤(Disk)和碟(disc)包括壓縮光碟(CD)、激光碟、光碟、數(shù) 字通用光碟(DVD)、軟盤和藍光光碟,其中盤通常磁性的復制數(shù)據(jù),而碟則用激光來光學的 復制數(shù)據(jù)。上面的組合也應當包括在計算機可讀介質的保護范圍之內。
[0127] 總之,以上所述僅為本發(fā)明技術方案的較佳實施例而已,并非用于限定本發(fā)明的 保護范圍。凡在本發(fā)明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在 本發(fā)明的保護范圍之內。
【權利要求】
1. 一種確定用戶的影響力排序的方法,其特征在于,包括: 獲取第一信息和第二信息,所述第一信息用于指示社交網絡中的N個用戶的相互關注 關系,所述第二信息用于指示所述N個用戶中各用戶發(fā)布的消息數(shù),以及所述各用戶發(fā)布 的消息的主題; 根據(jù)所述第一信息和所述第二信息,確定所述目標主題對應的N維權重向量,所述權 重向量中的第i元素是基于第一比重和第二比重確定的,其中,所述第一比重為:第i用戶 發(fā)布的消息中,關于所述目標主題的消息所占的比重,所述第二比重為:所述第i用戶關注 的用戶中,發(fā)布的消息包含關于所述目標主題的消息的用戶所占的比重,i為1至N中的任 意整數(shù); 獲取第三信息,所述第三信息用于指示所述N個用戶中具有消息轉發(fā)關系的用戶之間 轉發(fā)消息的數(shù)量和所述轉發(fā)消息的主題; 根據(jù)所述第三信息,確定所述目標主題對應的轉移概率矩陣,所述轉移概率矩陣的第 (j,k)元素是基于:第k用戶被第j用戶轉發(fā)的,關于所述目標主題的消息的數(shù)量,所述第j 用戶對應的轉發(fā)關聯(lián)用戶的數(shù)量,以及所述轉發(fā)關聯(lián)用戶發(fā)布的關于所述目標主題的消息 的數(shù)量之間的大小關系確定的,其中,所述轉發(fā)關聯(lián)用戶為所述N個用戶中,發(fā)布的消息被 所述第j用戶轉發(fā)過的用戶,j、k均為1至N中的任意整數(shù); 根據(jù)所述轉移概率矩陣和所述權值向量,利用佩奇排序算法確定在所述社交網絡中, 所述N個用戶在所述目標主題領域的影響力的排序。
2. 根據(jù)權利要求1所述的方法,其特征在于,所述權重向量中的第i元素是通過以下公 式確定的: Aj = x(a/b) + (l-x) (c/d) 其中,A是所述權重向量中的第i元素;x為預先設定的實數(shù),且Ο < x < 1 ;a為第i 用戶發(fā)布的關于所述目標主題的消息的數(shù)量;b為所述第i用戶發(fā)布的消息總數(shù);c為所述 第i用戶關注的用戶中,發(fā)布的消息包含關于所述目標主題的消息的用戶的數(shù)量;d為所述 第i用戶關注的用戶總數(shù)。
3. 根據(jù)權利要求1或2所述的方法,其特征在于,所述轉移概率矩陣的第(j,k)元素 是通過以下公式確定的: BJk = max (e, 1) /max (f, g) 其中,ΒΛ為所述轉移概率矩陣的第(j,k)元素;e為第k用戶被第j用戶轉發(fā)的,關于 所述目標主題的消息的數(shù)量;f為所述轉發(fā)關聯(lián)用戶發(fā)布的關于所述目標主題的消息的數(shù) 量;g為所述第j用戶對應的轉發(fā)關聯(lián)用戶的數(shù)量。
4. 根據(jù)權利要求1-3中的任一項所述的方法,其特征在于,所述根據(jù)所述轉移概率矩 陣和所述權值向量,利用佩奇排序算法確定所述N個用戶的影響力的排序,包括: 根據(jù)所述轉移概率矩陣和所述權值向量,對所述N個用戶各自對應的佩奇排序值進行 第一次迭代,所述第一次迭代為迭代次數(shù)預先設定的有限次迭代; 根據(jù)所述第一次迭代后,所述N個用戶各自對應的佩奇排序值,將所述N個用戶分為第 一集合和第二集合,其中,所述第二集合中的用戶對應的佩奇排序值小于所述第一集合中 的用戶對應的佩奇排序值; 根據(jù)所述轉移概率矩陣和所述權值向量,對所述N個用戶各自對應的佩奇排序值進行 第二次迭代,在所述第二次迭代中,所述第一集合中的用戶對應的佩奇排序值的迭代停止 閾值小于所述第二集合中的用戶對應的佩奇排序值的迭代停止閾值; 將所述第二次迭代后,所述N個用戶各自對應的佩奇排序值的大小排序確定為所述N 個用戶在所述目標主題領域的影響力的排序。
5. -種確定網絡節(jié)點的影響力排序的方法,其特征在于,包括: 對N個網絡節(jié)點各自對應的佩奇排序值進行第一次迭代,所述第一次迭代為迭代次數(shù) 預先設定的有限次迭代; 根據(jù)所述第一次迭代后,所述N個網絡節(jié)點各自對應的佩奇排序值,將所述N個網絡節(jié) 點分為第一集合和第二集合,其中,所述第二集合中的網絡節(jié)點對應的佩奇排序值小于所 述第一集合中的網絡節(jié)點對應的佩奇排序值; 對所述N個網絡節(jié)點各自對應的佩奇排序值進行第二次迭代,在所述第二次迭代中, 所述第一集合中的網絡節(jié)點對應的佩奇排序值的迭代停止閾值小于所述第二集合中的網 絡節(jié)點對應的佩奇排序值的迭代停止閾值; 將所述第二次迭代后,所述N個網絡節(jié)點各自對應的佩奇排序值的大小排序確定為所 述N個網絡節(jié)點的影響力的排序。
6. -種確定用戶的影響力排序的裝置,其特征在于,包括: 第一獲取模塊,用于獲取第一信息和第二信息,所述第一信息用于指示社交網絡中的 N個用戶的相互關注關系,所述第二信息用于指示所述N個用戶中各用戶發(fā)布的消息數(shù),以 及所述各用戶發(fā)布的消息的主題; 第一確定模塊,用于根據(jù)所述第一獲取模塊獲取的所述第一信息和所述第二信息,確 定所述目標主題對應的N維權重向量,所述權重向量中的第i元素是基于第一比重和第二 比重確定的,其中,所述第一比重為:第i用戶發(fā)布的消息中,關于所述目標主題的消息所 占的比重,所述第二比重為:所述第i用戶關注的用戶中,發(fā)布的消息包含關于所述目標主 題的消息的用戶所占的比重,i為1至N中的任意整數(shù); 第二獲取模塊,用于獲取第三信息,所述第三信息用于指示所述N個用戶中具有消息 轉發(fā)關系的用戶之間轉發(fā)消息的數(shù)量和所述轉發(fā)消息的主題; 第二確定模塊,用于根據(jù)所述第二獲取模塊獲取的所述第三信息,確定所述目標主題 對應的轉移概率矩陣,所述轉移概率矩陣的第(j,k)元素是基于:第k用戶被第j用戶轉發(fā) 的,關于所述目標主題的消息的數(shù)量,所述第j用戶對應的轉發(fā)關聯(lián)用戶的數(shù)量,以及所述 轉發(fā)關聯(lián)用戶發(fā)布的關于所述目標主題的消息的數(shù)量之間的大小關系確定的,其中,所述 轉發(fā)關聯(lián)用戶為所述N個用戶中,發(fā)布的消息被所述第j用戶轉發(fā)過的用戶,j、k均為1至 N中的任意整數(shù); 第三確定模塊,用于根據(jù)所述轉移概率矩陣和所述權值向量,利用佩奇排序算法確定 在所述社交網絡中,所述N個用戶在所述目標主題領域的影響力的排序。
7. 根據(jù)權利要求6所述的裝置,其特征在于,所述權重向量中的第i元素是通過以下公 式確定的: Aj = x(a/b) + (l-x) (c/d) 其中,A是所述權重向量中的第i元素;x為預先設定的實數(shù),且Ο < x < 1 ;a為第i 用戶發(fā)布的關于所述目標主題的消息的數(shù)量;b為所述第i用戶發(fā)布的消息總數(shù);c為所述 第i用戶關注的用戶中,發(fā)布的消息包含關于所述目標主題的消息的用戶的數(shù)量;d為所述 第i用戶關注的用戶總數(shù)。
8. 根據(jù)權利要求6或7所述的裝置,其特征在于,所述轉移概率矩陣的第(j,k)元素 是通過以下公式確定的: BJk = max (e, 1) /max (f, g) 其中,ΒΛ為所述轉移概率矩陣的第(j,k)元素;e為第k用戶被第j用戶轉發(fā)的,關于 所述目標主題的消息的數(shù)量;f為所述轉發(fā)關聯(lián)用戶發(fā)布的關于所述目標主題的消息的數(shù) 量;g為所述第j用戶對應的轉發(fā)關聯(lián)用戶的數(shù)量。
9. 根據(jù)權利要求6-8中的任一項所述的裝置,其特征在于,所述第三確定單元具體用 于根據(jù)所述轉移概率矩陣和所述權值向量,對所述N個用戶各自對應的佩奇排序值進行第 一次迭代,所述第一次迭代為迭代次數(shù)預先設定的有限次迭代;根據(jù)所述第一次迭代后,所 述N個用戶各自對應的佩奇排序值,將所述N個用戶分為第一集合和第二集合,其中,所述 第二集合中的用戶對應的佩奇排序值小于所述第一集合中的用戶對應的佩奇排序值的迭 代停止閾值;根據(jù)所述轉移概率矩陣和所述權值向量,對所述N個用戶各自對應的佩奇排 序值進行第二次迭代,在所述第二次迭代中,所述第一集合中的用戶對應的佩奇排序值的 迭代停止閾值小于所述第二集合中的用戶對應的佩奇排序值的迭代停止閾值;將所述第二 次迭代后,所述N個用戶各自對應的佩奇排序值的大小排序確定為所述N個用戶在所述目 標主題領域的影響力的排序。
10. -種確定網絡節(jié)點的影響力排序的裝置,其特征在于,包括: 第一迭代模塊,對N個網絡節(jié)點各自對應的佩奇排序值進行第一次迭代,所述第一次 迭代為迭代次數(shù)預先設定的有限次迭代; 確定模塊,用于根據(jù)所述第一迭代模塊得到的所述N個網絡節(jié)點各自對應的佩奇排序 值,將所述N個網絡節(jié)點分為第一集合和第二集合,其中,所述第二集合中的網絡節(jié)點對應 的佩奇排序值小于所述第一集合中的網絡節(jié)點對應的佩奇排序值; 第二迭代模塊,用于對第一迭代模塊得到的所述N個網絡節(jié)點各自對應的佩奇排序值 進行第二次迭代,在所述第二次迭代中,所述確定模塊確定的所述第一集合中的網絡節(jié)點 對應的佩奇排序值的迭代停止閾值小于所述第二集合中的網絡節(jié)點對應的佩奇排序值的 迭代停止閾值; 所述確定模塊還用于將所述第二次迭代后,所述N個網絡節(jié)點各自對應的佩奇排序值 的大小排序確定為所述N個網絡節(jié)點的影響力的排序。
【文檔編號】H04L12/24GK104092567SQ201410294986
【公開日】2014年10月8日 申請日期:2014年6月26日 優(yōu)先權日:2014年6月26日
【發(fā)明者】陳凱, 周異, 周曲 申請人:華為技術有限公司