本發(fā)明實施例涉及計算機
技術領域:
,尤其涉及一種網(wǎng)絡鏈接預測方法及裝置。
背景技術:
:隨著社交網(wǎng)絡(如微博等)的興起,人們越來越傾向于使用在線社交網(wǎng)絡平臺溝通和交換信息。例如,用戶在社交平臺上進行發(fā)布一條消息之后,該用戶的社交平臺上的朋友也可能轉發(fā)這條消息,這個過程重復迭代就會出現(xiàn)社交網(wǎng)絡上的擴散現(xiàn)象。網(wǎng)絡鏈接預測是指通過已知的網(wǎng)絡結構等信息預測網(wǎng)絡中尚未產(chǎn)生連邊的兩個網(wǎng)絡節(jié)點之間產(chǎn)生網(wǎng)絡鏈接的概率。網(wǎng)絡鏈接預測在不同的場景中有不同的應用和價值。例如,在犯罪份子網(wǎng)絡中,鏈接預測可用來發(fā)現(xiàn)潛在的犯罪分子;在社交網(wǎng)絡中,鏈接預測可指示用戶間建立好友關系的可能性,為用戶提供好友推薦。在現(xiàn)有技術中,通常采用基于連續(xù)時間模型、或者基于點過程的模型確定兩個網(wǎng)絡節(jié)點之間產(chǎn)生網(wǎng)絡鏈接的概率。然而,在現(xiàn)有的網(wǎng)絡模型中,均假設網(wǎng)絡中節(jié)點間的鏈接關系單層同質,這種假設與網(wǎng)絡的多層異質結構相悖等,導致現(xiàn)有的網(wǎng)絡模型與實際網(wǎng)絡相差較多,導致根據(jù)現(xiàn)有的網(wǎng)絡模型進行網(wǎng)絡鏈接預測的準確性較低。技術實現(xiàn)要素:本發(fā)明實施例提供一種網(wǎng)絡鏈接預測方法及裝置,提高了網(wǎng)絡鏈接預測的準確性。第一方面,本發(fā)明實施例提供一種網(wǎng)絡鏈接預測方法,包括:根據(jù)用戶輸入的主題個數(shù)和網(wǎng)絡節(jié)點個數(shù),構建擴散網(wǎng)絡,所述擴散網(wǎng)絡包括多個網(wǎng)絡節(jié)點和多個主題,各所述網(wǎng)絡節(jié)點對應主動向量和被動向量,所述主動向量和所述被動向量中包括待求解參數(shù);根據(jù)各所述網(wǎng)絡節(jié)點的主動向量,生成擴散數(shù)據(jù);獲取預設時長內、所述擴散數(shù)據(jù)在所述擴散網(wǎng)絡中擴散的統(tǒng)計數(shù)據(jù);根據(jù)所述統(tǒng)計數(shù)據(jù),確定所述待求解參數(shù)的參數(shù)值;根據(jù)所述待求解參數(shù)的參數(shù)值,確定第一網(wǎng)絡節(jié)點的主動向量和第二網(wǎng)絡的被動向量,所述第一網(wǎng)絡節(jié)點和所述第二網(wǎng)絡節(jié)點為所述擴散網(wǎng)絡中的任意兩個節(jié)點;根據(jù)所述第一網(wǎng)絡節(jié)點的主動向量和所述第二網(wǎng)絡節(jié)點的被動向量,確定所述第一網(wǎng)絡節(jié)點和所述第二網(wǎng)絡節(jié)點之間發(fā)生網(wǎng)絡鏈接的概率。在一種可能的實施方式中,根根據(jù)用戶輸入的主題個數(shù)和網(wǎng)絡節(jié)點個數(shù),構建擴散網(wǎng)絡,包括:接收用戶輸入的主題個數(shù);根據(jù)所述主題個數(shù),創(chuàng)建多個主題,并生成主題活躍度向量;接收用戶輸入的網(wǎng)絡節(jié)點個數(shù);根據(jù)所述網(wǎng)絡節(jié)點個數(shù),創(chuàng)建多個網(wǎng)絡節(jié)點;生成各所述網(wǎng)絡節(jié)點的主動向量和被動向量;根據(jù)所述多個主題和所述多個網(wǎng)絡節(jié)點,構建所述擴散網(wǎng)絡。在另一種可能的實施方式中,獲取預設時長內、所述擴散數(shù)據(jù)在所述擴散網(wǎng)絡中擴散的統(tǒng)計數(shù)據(jù),包括:確定所述擴散數(shù)據(jù)的主題分布向量;根據(jù)所述主題分布向量,確定所述擴散數(shù)據(jù)的傳播通道;根據(jù)所述傳播通道,確定所述轉發(fā)所述擴散數(shù)據(jù)的次數(shù)、及轉發(fā)所述擴散數(shù)據(jù)的時刻;根據(jù)所述預設時長內、轉發(fā)所述擴散數(shù)據(jù)的次數(shù)、及轉發(fā)所述擴散數(shù)據(jù)的時刻,確定所述統(tǒng)計數(shù)據(jù)。在另一種可能的實施方式中,根據(jù)所述統(tǒng)計數(shù)據(jù),確定所述待求解參數(shù)的參數(shù)值,包括:根據(jù)Metropolis-within-gibbs算法、及所述統(tǒng)計數(shù)據(jù),對所述待求解參數(shù)進行求解,得到所述參數(shù)值。在另一種可能的實施方式中,根據(jù)所述第一網(wǎng)絡節(jié)點的主動向量和所述第二網(wǎng)絡節(jié)點的被動向量,確定所述第一網(wǎng)絡節(jié)點和所述第二網(wǎng)絡節(jié)點之間發(fā)生網(wǎng)絡鏈接的概率,包括:根據(jù)如下公式一,確定所述第一網(wǎng)絡節(jié)點和所述第二網(wǎng)絡節(jié)點之間發(fā)生網(wǎng)絡鏈接的概率P:P=Aik×Sjk×πk公式一;其中,所述Aik為用戶i的主動向量中的第k個分量,所述Sjk為用戶j的被動向量中的第k個分量,所述πk為第k主題的活躍度。第二方面,本發(fā)明實施例提供一種網(wǎng)絡鏈接預測裝置,包括構建模塊、生成模塊、獲取模塊、第一確定模塊、第二確定模塊和第三確定模塊,其中,所述構建模塊用于,根據(jù)用戶輸入的主題個數(shù)和網(wǎng)絡節(jié)點個數(shù),構建擴散網(wǎng)絡,所述擴散網(wǎng)絡包括多個網(wǎng)絡節(jié)點和多個主題,各所述網(wǎng)絡節(jié)點對應主動向量和被動向量,所述主動向量和所述被動向量中包括待求解參數(shù);所述生成模塊用于,根據(jù)各所述網(wǎng)絡節(jié)點的主動向量,生成擴散數(shù)據(jù);所述獲取模塊用于,獲取預設時長內、所述擴散數(shù)據(jù)在所述擴散網(wǎng)絡中擴散的統(tǒng)計數(shù)據(jù);所述第一確定模塊用于,根據(jù)所述統(tǒng)計數(shù)據(jù),確定所述待求解參數(shù)的參數(shù)值;所述第二確定模塊用于,根據(jù)所述待求解參數(shù)的參數(shù)值,確定第一網(wǎng)絡節(jié)點的主動向量和第二網(wǎng)絡的被動向量,所述第一網(wǎng)絡節(jié)點和所述第二網(wǎng)絡節(jié)點為所述擴散網(wǎng)絡中的任意兩個節(jié)點;所述第三確定模塊用于,根據(jù)所述第一網(wǎng)絡節(jié)點的主動向量和所述第二網(wǎng)絡節(jié)點的被動向量,確定所述第一網(wǎng)絡節(jié)點和所述第二網(wǎng)絡節(jié)點之間發(fā)生網(wǎng)絡鏈接的概率。在一種可能的實施方式中,所述構建模塊具體用于:接收用戶輸入的主題個數(shù);根據(jù)所述主題個數(shù),創(chuàng)建多個主題,并生成主題活躍度向量;接收用戶輸入的網(wǎng)絡節(jié)點個數(shù);根據(jù)所述網(wǎng)絡節(jié)點個數(shù),創(chuàng)建多個網(wǎng)絡節(jié)點;生成各所述網(wǎng)絡節(jié)點的主動向量和被動向量;根據(jù)所述多個主題和所述多個網(wǎng)絡節(jié)點,構建所述擴散網(wǎng)絡。在另一種可能的實施方式中,所述獲取模塊具體用于:確定所述擴散數(shù)據(jù)的主題分布向量;根據(jù)所述主題分布向量,確定所述擴散數(shù)據(jù)的傳播通道;根據(jù)所述傳播通道,確定所述轉發(fā)所述擴散數(shù)據(jù)的次數(shù)、及轉發(fā)所述擴散數(shù)據(jù)的時刻;根據(jù)所述預設時長內、轉發(fā)所述擴散數(shù)據(jù)的次數(shù)、及轉發(fā)所述擴散數(shù)據(jù)的時刻,確定所述統(tǒng)計數(shù)據(jù)。在另一種可能的實施方式中,所述第一確定模塊具體用于:根據(jù)Metropolis-within-gibbs算法、及所述統(tǒng)計數(shù)據(jù),對所述待求解參數(shù)進行求解,得到所述參數(shù)值。在另一種可能的實施方式中,所述第三確定模塊具體用于:根據(jù)如下公式一,確定所述第一網(wǎng)絡節(jié)點和所述第二網(wǎng)絡節(jié)點之間發(fā)生網(wǎng)絡鏈接的概率P:P=Aik×Sjk×πk公式一;其中,所述Aik為用戶i的主動向量中的第k個分量,所述Sjk為用戶j的被動向量中的第k個分量,所述πk為第k主題的活躍度。本發(fā)明實施例提供的網(wǎng)絡鏈接預測方法及裝置,在進行網(wǎng)絡鏈接預測的過程中,先基于預設條件假設,構建與實際網(wǎng)絡情況相符合的擴散網(wǎng)絡,該擴散網(wǎng)絡中包括多個節(jié)點,每一個節(jié)點有其對應的主動向量和被動向量,該主動向量和被動向量中包括待求解參數(shù)。然后,生成用于在擴散網(wǎng)絡上進行擴散的擴散數(shù)據(jù)。根據(jù)擴散數(shù)據(jù)及該擴散網(wǎng)絡中每一個網(wǎng)絡節(jié)點的主動向量和被動向量,可以確定擴散數(shù)據(jù)在擴散網(wǎng)絡中進行擴散的統(tǒng)計數(shù)據(jù)。根據(jù)該統(tǒng)計數(shù)據(jù)可以求解得到主動向量和被動向量中的待求解參數(shù)的參數(shù)值,根據(jù)待求解參數(shù)的參數(shù)值可以確定第一網(wǎng)絡節(jié)點的主動向量和第二網(wǎng)絡節(jié)點的被動向量,并根據(jù)第一網(wǎng)絡節(jié)點的主動向量和第二網(wǎng)絡節(jié)點的被動向量,確定第一網(wǎng)絡節(jié)點和第二網(wǎng)絡節(jié)點之間發(fā)生網(wǎng)絡鏈接的概率。由于構建的擴散網(wǎng)絡的特性與實際應用中的網(wǎng)絡的特性相符合,且擴散數(shù)據(jù)也與實際應用中傳輸?shù)臄?shù)據(jù)相符合,以使根據(jù)本申請所示的方法可以準確的確定兩個網(wǎng)絡節(jié)點之間產(chǎn)生網(wǎng)絡鏈接的概率,進而提高網(wǎng)絡鏈接預測的準確性。附圖說明為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明實施例提供的網(wǎng)絡鏈接預設方法的應用場景示意圖;圖2為本發(fā)明實施例提供的網(wǎng)絡鏈接預測方法的流程示意圖;圖3為本發(fā)明實施例提供的構建擴散網(wǎng)絡方法的流程示意圖;圖4為本發(fā)明實施例提供的確定統(tǒng)計數(shù)據(jù)方法的流程示意圖;圖5為本發(fā)明實施例提供的網(wǎng)絡鏈接預測裝置的結構示意圖。具體實施方式為使本發(fā)明實施例的目的、技術方案和優(yōu)點更加清楚,下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。圖1為本發(fā)明實施例提供的網(wǎng)絡鏈接預設方法的應用場景示意圖。請參見圖1,在擴散網(wǎng)絡中包括多個網(wǎng)絡節(jié)點(圖1中簡稱節(jié)點),該擴散網(wǎng)絡為本發(fā)明實施例構建的網(wǎng)絡,每一個網(wǎng)絡節(jié)點有其對應的主動向量和被動向量,該主動向量和被動向量中包括預設條件對應的假設參數(shù)。在本申請中,生成擴散數(shù)據(jù),并根據(jù)擴散數(shù)據(jù)及該擴散網(wǎng)絡中每一個網(wǎng)絡節(jié)點的主動向量和被動向量,可以確定擴散數(shù)據(jù)在擴散網(wǎng)絡中的傳輸情況。根據(jù)擴散數(shù)據(jù)在擴散網(wǎng)絡中的傳輸情況,可以求解得到主動向量和被動向量中的假設參數(shù)。在得到假設參數(shù)之后,可以確定每一個網(wǎng)絡節(jié)點的主動向量和被動向量。當需要確定兩個網(wǎng)絡節(jié)點之間產(chǎn)生網(wǎng)絡鏈接的概率時,根據(jù)該兩個網(wǎng)絡節(jié)點的主動向量和被動向量即可確定該兩個網(wǎng)絡節(jié)點之間產(chǎn)生網(wǎng)絡鏈接的概率。在本申請中,由于構建的擴散網(wǎng)絡的特性與實際應用中的網(wǎng)絡的特性相符合,且擴散數(shù)據(jù)也與實際應用中傳輸?shù)臄?shù)據(jù)相符合,以使根據(jù)本申請所示的方法可以準確的確定兩個網(wǎng)絡節(jié)點之間產(chǎn)生網(wǎng)絡鏈接的概率,進而提高網(wǎng)絡鏈接預測的準確性。下面,通過具體實施例,對本申請所示的技術方案進行詳細說明。需要說明的是,下面幾個具體實施例可以相互結合,對于相同或相似的內容在不同的實施例中不再進行贅述。圖2為本發(fā)明實施例提供的網(wǎng)絡鏈接預測方法的流程示意圖。請參見圖2,該方法可以包括:S201、根據(jù)用戶輸入的主題個數(shù)和網(wǎng)絡節(jié)點個數(shù),構建擴散網(wǎng)絡,擴散網(wǎng)絡包括多個網(wǎng)絡節(jié)點和多個主題,各網(wǎng)絡節(jié)點對應主動向量和被動向量,主動向量和被動向量中包括待求解參數(shù)。本發(fā)明實施例的執(zhí)行主體可以為網(wǎng)絡鏈接預測裝置(下文檢測預測裝置)。可選的,該預測裝置可以通過軟件和/或硬件實現(xiàn)。當用戶需要構建擴散網(wǎng)絡時,用戶可以在預測裝置中輸入主題個數(shù)和網(wǎng)絡節(jié)點個數(shù),相應的,預測裝置可以創(chuàng)建多個網(wǎng)絡節(jié)點、并確定多個主題。預測裝置還生成每一個網(wǎng)絡節(jié)點的主動向量和被動向量,并根據(jù)多個網(wǎng)絡節(jié)點和該多個主題構建擴散網(wǎng)絡。具體的,構建擴散網(wǎng)絡的過程可以參見圖3所示的實施例。在本發(fā)明實施例中,主動向量是指網(wǎng)絡節(jié)點在各主題上的主動性活躍程度,被動向量是指網(wǎng)絡節(jié)點在各主題上的被動活躍程度。主動向量中各數(shù)據(jù)之和為1,被動向量中的各數(shù)據(jù)之和也為1??蛇x的,當擴散網(wǎng)絡為與微博相關網(wǎng)絡時,擴散網(wǎng)絡的主題可以包括經(jīng)濟、科技、八卦、人文等。例如,主動向量可以為用戶在各主題上主動發(fā)布微博的概率。被動向量可以為用戶在各主題上轉發(fā)微博的概率。假設擴散網(wǎng)絡中包括三個主題,分別記為主題1-主題3。則網(wǎng)絡節(jié)點的主動向量可以為(P1,P2,P3),其中,P1、P2、及P3之和為1,P1表示該網(wǎng)絡節(jié)點對應的用戶在主題1上發(fā)布微博的概率,P2表示該網(wǎng)絡節(jié)點對應的用戶在主題2上發(fā)布微博的概率,P3表示該網(wǎng)絡節(jié)點對應的用戶在主題3上發(fā)布微博的概率。在本申請中,由于構建的網(wǎng)絡時基于預設假設構建的,因此,主動向量和被動向量中包括待求解參數(shù)。S202、根據(jù)各網(wǎng)絡節(jié)點的主動向量,生成擴散數(shù)據(jù)。在預測裝置確定得到擴散網(wǎng)絡之后,預測裝置根據(jù)可以根據(jù)網(wǎng)絡節(jié)點的主動向量,生成擴散數(shù)據(jù)。例如,假設擴散網(wǎng)絡為與微博相關網(wǎng)絡時,預測裝置可以根據(jù)各網(wǎng)絡節(jié)點對應的用戶發(fā)布各類微博的頻率,生成擴散數(shù)據(jù),相應的,擴散數(shù)據(jù)可以為發(fā)布的微博。需要說明的是,擴散數(shù)據(jù)的個數(shù)可以為1個,也可以為多個??梢愿鶕?jù)實際需要確定擴散數(shù)據(jù)的個數(shù)。S203、獲取預設時長內、擴散數(shù)據(jù)在擴散網(wǎng)絡中擴散的統(tǒng)計數(shù)據(jù)。在確定得到擴散網(wǎng)絡和擴散數(shù)據(jù)之后,可以根據(jù)各網(wǎng)絡節(jié)點的主動向量、被動向量、以及擴散數(shù)據(jù),確定擴散數(shù)據(jù)在擴散網(wǎng)絡中的擴散情況,并根據(jù)預設時長內擴散數(shù)據(jù)在擴散網(wǎng)絡中的擴散情況,得到統(tǒng)計數(shù)據(jù)。可選的,統(tǒng)計數(shù)據(jù)中可以轉發(fā)擴散數(shù)據(jù)的節(jié)點標識、及轉發(fā)時刻。例如,統(tǒng)計數(shù)據(jù)可以如表1所示:表1網(wǎng)絡節(jié)點的標識轉發(fā)時刻節(jié)點21:10:10節(jié)點41:10:30節(jié)點31:10:45節(jié)點51:11:12…………需要說明的是,表1只是以示例的形式示意統(tǒng)計數(shù)據(jù)中包括的內容。當然,在實際應用過程中,可以根據(jù)實際需要設置統(tǒng)計數(shù)據(jù)中包括的內容,本發(fā)明實施例對此不作具體限定。S204、根據(jù)統(tǒng)計數(shù)據(jù),確定待求解參數(shù)的參數(shù)值??蛇x的,預測裝置可以根據(jù)Metropolis-within-gibbs算法、及統(tǒng)計數(shù)據(jù),對待求解參數(shù)進行求解,得到參數(shù)值。例如,預測裝置可以每一次從Dirichlet分布中使用隨機游走采樣一個數(shù)據(jù)點,計算其Hastingsratio,然后以min{1,HastingRatio}的概率接受該點,經(jīng)過足夠長的迭代過程后,可以證明,采樣到的點接近真實的概率分布。S205、根據(jù)待求解參數(shù)的參數(shù)值,確定第一網(wǎng)絡節(jié)點的主動向量和第二網(wǎng)絡的被動向量,第一網(wǎng)絡節(jié)點和第二網(wǎng)絡節(jié)點為擴散網(wǎng)絡中的任意兩個節(jié)點。當需要確定第一網(wǎng)絡節(jié)點和第二網(wǎng)絡節(jié)點之間的發(fā)生網(wǎng)絡鏈接的概率時,可以將待求解參數(shù)的參數(shù)值代入第一網(wǎng)絡節(jié)點的主動向量、及第二網(wǎng)絡節(jié)點的被動向量,以確定得到第一網(wǎng)絡節(jié)點的主動向量和第二網(wǎng)絡的被動向量。S206、根據(jù)第一網(wǎng)絡節(jié)點的主動向量和第二網(wǎng)絡節(jié)點的被動向量,確定第一網(wǎng)絡節(jié)點和第二網(wǎng)絡節(jié)點之間發(fā)生網(wǎng)絡鏈接的概率??蛇x的,可以根據(jù)如下公式一,確定第一網(wǎng)絡節(jié)點和第二網(wǎng)絡節(jié)點之間發(fā)生網(wǎng)絡鏈接的概率P:P=Aik×Sjk×πk公式一;其中,Aik為用戶i的主動向量中的第k個分量,Sjk為用戶j的被動向量中的第k個分量,πk為第k主題的活躍度。本發(fā)明實施例提供的網(wǎng)絡鏈接預測方法,在進行網(wǎng)絡鏈接預測的過程中,先基于預設條件假設,構建與實際網(wǎng)絡情況相符合的擴散網(wǎng)絡,該擴散網(wǎng)絡中包括多個節(jié)點,每一個節(jié)點有其對應的主動向量和被動向量,該主動向量和被動向量中包括待求解參數(shù)。然后,生成用于在擴散網(wǎng)絡上進行擴散的擴散數(shù)據(jù)。根據(jù)擴散數(shù)據(jù)及該擴散網(wǎng)絡中每一個網(wǎng)絡節(jié)點的主動向量和被動向量,可以確定擴散數(shù)據(jù)在擴散網(wǎng)絡中進行擴散的統(tǒng)計數(shù)據(jù)。根據(jù)該統(tǒng)計數(shù)據(jù)可以求解得到主動向量和被動向量中的待求解參數(shù)的參數(shù)值,根據(jù)待求解參數(shù)的參數(shù)值可以確定第一網(wǎng)絡節(jié)點的主動向量和第二網(wǎng)絡節(jié)點的被動向量,并根據(jù)第一網(wǎng)絡節(jié)點的主動向量和第二網(wǎng)絡節(jié)點的被動向量,確定第一網(wǎng)絡節(jié)點和第二網(wǎng)絡節(jié)點之間發(fā)生網(wǎng)絡鏈接的概率。由于構建的擴散網(wǎng)絡的特性與實際應用中的網(wǎng)絡的特性相符合,且擴散數(shù)據(jù)也與實際應用中傳輸?shù)臄?shù)據(jù)相符合,以使根據(jù)本申請所示的方法可以準確的確定兩個網(wǎng)絡節(jié)點之間產(chǎn)生網(wǎng)絡鏈接的概率,進而提高網(wǎng)絡鏈接預測的準確性。在圖2所示實施例的基礎上,可選的,可以通過如下可行的實現(xiàn)方式根據(jù)用戶輸入的主題個數(shù)和網(wǎng)絡節(jié)點個數(shù),構建擴散網(wǎng)絡(圖2所示實施例中的S201),具體的,請參見圖3所示的實施例。圖3為本發(fā)明實施例提供的構建擴散網(wǎng)絡方法的流程示意圖。請參見圖3,該方法可以包括:S301、接收用戶輸入的主題個數(shù)??蛇x的,主題個數(shù)可以為大于2的正整數(shù)。S302、根據(jù)主題個數(shù),創(chuàng)建多個主題,并生成主題活躍度向量??蛇x的,預測裝置可以根據(jù)狄利克雷函數(shù)Dir(x),隨機生成多個主題。其中,生成的主題個數(shù)與用戶輸入的主題個數(shù)相同??蛇x的,預測裝置可以根據(jù)狄利克雷函數(shù)Dir(x),生成主題活躍度向量,該主題活躍度向量為n維向量,主題活躍度向量的各分量之和為1,n為主題個數(shù)。例如,若主題個數(shù)為3,則主體活躍度向量可以為(0.5,0.3,0.2)。S303、接收用戶輸入的網(wǎng)絡節(jié)點個數(shù)。可選的,網(wǎng)絡節(jié)點個數(shù)可以為大于2的正整數(shù)。S304、根據(jù)網(wǎng)絡節(jié)點個數(shù),創(chuàng)建多個網(wǎng)絡節(jié)點??蛇x的,預測裝置可以根據(jù)狄利克雷函數(shù)Dir(x),創(chuàng)建多個網(wǎng)絡節(jié)點。S305、生成各網(wǎng)絡節(jié)點的主動向量和被動向量??蛇x的,預測裝置可以根據(jù)狄利克雷函數(shù)Dir(x),生成各網(wǎng)絡節(jié)點的主動向量和被動向量。例如,預測裝置可以根據(jù)如下公式二生成主動向量:其中,k為主題的個數(shù),αi為第i個待求解參數(shù),xi為主動向量中第i個分向量。S306、根據(jù)多個主題和多個網(wǎng)絡節(jié)點,構建擴散網(wǎng)絡。構建得到的擴散網(wǎng)絡的似然度如公式三所示:其中,Gijk表示擴散網(wǎng)絡中第i個節(jié)點與第j個節(jié)點之間在第k個主題上是否存在邊。當Gijk為1時,表示第i個節(jié)點與第j個節(jié)點之間在第k個主題上存在邊,當Gijk為0時,表示第i個節(jié)點與第j個節(jié)點之間在第k個主題上不存在邊。在上述任意一個實施例的基礎上,可選的,可以通過如下可行的實現(xiàn)方式獲取預設時長內、擴散數(shù)據(jù)在擴散網(wǎng)絡中擴散的統(tǒng)計數(shù)據(jù)(圖2所示實施例中的S203),具體的,請參見圖4所示的實施例。圖4為本發(fā)明實施例提供的確定統(tǒng)計數(shù)據(jù)方法的流程示意圖。請參見圖4,該方法可以包括:S401、確定擴散數(shù)據(jù)的主題分布向量??蛇x的,預測裝置可以根據(jù)狄利克雷函數(shù)Dir(x)確定擴散數(shù)據(jù)的主題分布向量。該主題分布向量為n維向量,主題分布向量的各分量之和為1,n為主題個數(shù)。S402、根據(jù)主題分布向量,確定擴散數(shù)據(jù)的傳播通道??蛇x的,預測裝置可以根據(jù)k′~Discrete(θk′·Svk′)函數(shù),確定擴散數(shù)據(jù)的傳播通道。S403、根據(jù)傳播通道,確定轉發(fā)擴散數(shù)據(jù)的次數(shù)、及轉發(fā)擴散數(shù)據(jù)的時刻??蛇x的,對于任意一個傳播通道,可以根據(jù)n′~poisson(Wuvk)確定轉發(fā)擴散數(shù)據(jù)的次數(shù)??蛇x的,可以根據(jù)t~lognormal(0,1)確定轉發(fā)擴散數(shù)據(jù)的時刻。其中,lognormal函數(shù)為對數(shù)正太分布函數(shù),類似于random函數(shù),本模型利用該函數(shù)采樣0與1之間的一個隨機數(shù),特點是可以調整其參數(shù),使得概率在接近0或者1時比較小,在設定的峰值處概率較大。S404、根據(jù)預設時長內、轉發(fā)擴散數(shù)據(jù)的次數(shù)、及轉發(fā)擴散數(shù)據(jù)的時刻,確定統(tǒng)計數(shù)據(jù)。在上述過程中,擴散數(shù)據(jù)的似然度可以如公式四所示:其中,sm為擴散數(shù)據(jù)被轉發(fā)的時間,cm為擴散數(shù)據(jù)被轉發(fā)的網(wǎng)絡節(jié)點,ωm為第m次被轉發(fā)擴散數(shù)據(jù),λku為第u個節(jié)點在第k個主題上發(fā)布擴散數(shù)據(jù)的頻率,Wuvk為第u個網(wǎng)絡節(jié)點發(fā)布擴散數(shù)據(jù),第v個網(wǎng)絡節(jié)點在k個主題上轉發(fā)的概率,I[x]為示性函數(shù),當括號內數(shù)據(jù)為真時返回1,否則返回0。h(x)提到的lognormal函數(shù),θm為第m次轉發(fā)擴散數(shù)據(jù)的主題向量,Guvk為擴散網(wǎng)絡中第u個網(wǎng)絡節(jié)點與第v個網(wǎng)絡節(jié)點之間在第k個主題上是否存在邊,1表示存在,0表示不存在,Au為第u個網(wǎng)絡節(jié)點的主動向量,Sv為第v個網(wǎng)絡節(jié)點的被動向量,πk為各個主題的活躍程度向量,Auk為第u個網(wǎng)絡節(jié)點的主動向量中的第k個分量,Svk為第v個網(wǎng)絡節(jié)點的被動向量中的第k個分量。其中,上述公式四中,等號后邊的第一行對應生成的擴散網(wǎng)絡的似然度,第二行對應發(fā)布擴散數(shù)據(jù)的似然度,第三到第五行對應轉發(fā)擴散數(shù)據(jù)的似然度。其中的補償項和為在積分上下限的時間段內沒有發(fā)生事件的似然度。圖5為本發(fā)明實施例提供的網(wǎng)絡鏈接預測裝置的結構示意圖。請參見圖5,該裝置可以包括構建模塊11、生成模塊12、獲取模塊13、第一確定模塊14、第二確定模塊15和第三確定模塊16,其中,所述構建模塊11用于,根據(jù)用戶輸入的主題個數(shù)和網(wǎng)絡節(jié)點個數(shù),構建擴散網(wǎng)絡,所述擴散網(wǎng)絡包括多個網(wǎng)絡節(jié)點和多個主題,各所述網(wǎng)絡節(jié)點對應主動向量和被動向量,所述主動向量和所述被動向量中包括待求解參數(shù);所述生成模塊12用于,根據(jù)各所述網(wǎng)絡節(jié)點的主動向量,生成擴散數(shù)據(jù);所述獲取模塊13用于,獲取預設時長內、所述擴散數(shù)據(jù)在所述擴散網(wǎng)絡中擴散的統(tǒng)計數(shù)據(jù);所述第一確定模塊14用于,根據(jù)所述統(tǒng)計數(shù)據(jù),確定所述待求解參數(shù)的參數(shù)值;所述第二確定模塊15用于,根據(jù)所述待求解參數(shù)的參數(shù)值,確定第一網(wǎng)絡節(jié)點的主動向量和第二網(wǎng)絡的被動向量,所述第一網(wǎng)絡節(jié)點和所述第二網(wǎng)絡節(jié)點為所述擴散網(wǎng)絡中的任意兩個節(jié)點;所述第三確定模塊16用于,根據(jù)所述第一網(wǎng)絡節(jié)點的主動向量和所述第二網(wǎng)絡節(jié)點的被動向量,確定所述第一網(wǎng)絡節(jié)點和所述第二網(wǎng)絡節(jié)點之間發(fā)生網(wǎng)絡鏈接的概率。本發(fā)明實施例提供的網(wǎng)絡鏈接預測裝置可以執(zhí)行上述方法實施例所示的技術方案,其實現(xiàn)原理以及有益效果類似,此處不再進行贅述。在一種可能的實施方式中,所述構建模塊11具體用于:接收用戶輸入的主題個數(shù);根據(jù)所述主題個數(shù),創(chuàng)建多個主題,并生成主題活躍度向量;接收用戶輸入的網(wǎng)絡節(jié)點個數(shù);根據(jù)所述網(wǎng)絡節(jié)點個數(shù),創(chuàng)建多個網(wǎng)絡節(jié)點;生成各所述網(wǎng)絡節(jié)點的主動向量和被動向量;根據(jù)所述多個主題和所述多個網(wǎng)絡節(jié)點,構建所述擴散網(wǎng)絡。在另一種可能的實施方式中,所述獲取模塊13具體用于:確定所述擴散數(shù)據(jù)的主題分布向量;根據(jù)所述主題分布向量,確定所述擴散數(shù)據(jù)的傳播通道;根據(jù)所述傳播通道,確定所述轉發(fā)所述擴散數(shù)據(jù)的次數(shù)、及轉發(fā)所述擴散數(shù)據(jù)的時刻;根據(jù)所述預設時長內、轉發(fā)所述擴散數(shù)據(jù)的次數(shù)、及轉發(fā)所述擴散數(shù)據(jù)的時刻,確定所述統(tǒng)計數(shù)據(jù)。在另一種可能的實施方式中,所述第一確定模塊14具體用于:根據(jù)Metropolis-within-gibbs算法、及所述統(tǒng)計數(shù)據(jù),對所述待求解參數(shù)進行求解,得到所述參數(shù)值。在另一種可能的實施方式中,所述第三確定模塊16具體用于:根據(jù)如下公式一,確定所述第一網(wǎng)絡節(jié)點和所述第二網(wǎng)絡節(jié)點之間發(fā)生網(wǎng)絡鏈接的概率P:P=Aik×Sjk×πk公式一;其中,所述Aik為用戶i的主動向量中的第k個分量,所述Sjk為用戶j的被動向量中的第k個分量,所述πk為第k主題的活躍度。本發(fā)明實施例提供的網(wǎng)絡鏈接預測裝置可以執(zhí)行上述方法實施例所示的技術方案,其實現(xiàn)原理以及有益效果類似,此處不再進行贅述。本領域普通技術人員可以理解:實現(xiàn)上述各方法實施例的全部或部分步驟可以通過程序指令相關的硬件來完成。前述的程序可以存儲于一計算機可讀取存儲介質中。該程序在執(zhí)行時,執(zhí)行包括上述各方法實施例的步驟;而前述的存儲介質包括:ROM、RAM、磁碟或者光盤等各種可以存儲程序代碼的介質。最后應說明的是:以上各實施例僅用以說明本發(fā)明實施例的技術方案,而非對其限制;盡管參照前述各實施例對本發(fā)明實施例進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分或者全部技術特征進行等同替換;而這些修改或者替換,并不使相應技術方案的本質脫離本發(fā)明實施例方案的范圍。當前第1頁1 2 3