1.一種在可交換圖中基于博弈的鏈接預(yù)測(cè)方法,其特征在于:
(1)獲取數(shù)據(jù)集,將數(shù)據(jù)集中的元素通過(guò)圖表示,圖由節(jié)點(diǎn)集和邊集組成;所述節(jié)點(diǎn)代表待預(yù)測(cè)的實(shí)體,邊代表待預(yù)測(cè)實(shí)體之間的關(guān)系;所述數(shù)據(jù)集的節(jié)點(diǎn)和邊滿足可交換圖的要求;
(2)采用網(wǎng)絡(luò)演化模型,過(guò)濾所述圖中的不符合設(shè)定要求的邊,以過(guò)濾后的圖作為訓(xùn)練集;
(3)采用訓(xùn)練集對(duì)概率圖模型進(jìn)行迭代訓(xùn)練,得到具有最優(yōu)模型參數(shù)的概率圖模型;
(4)采用(3)中具有最優(yōu)模型參數(shù)的概率圖模型進(jìn)行鏈接預(yù)測(cè)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于:步驟(2)中選擇至少兩種網(wǎng)絡(luò)演化模型,采用各網(wǎng)絡(luò)演化模型的效用函數(shù),計(jì)算所述邊對(duì)兩個(gè)實(shí)體的效用值改變量,若所述邊對(duì)兩個(gè)實(shí)體的效用值改變量均呈下降趨勢(shì),則過(guò)濾所述邊,否則,保留所述邊。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于:當(dāng)采用兩種網(wǎng)絡(luò)演化模型時(shí),選擇鏈接模型和聯(lián)合作者模型。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于:步驟(3)中采用變分推斷對(duì)概率圖模型進(jìn)行迭代訓(xùn)練。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于:將步驟(2)中的訓(xùn)練集分為各個(gè)子訓(xùn)練集,子訓(xùn)練集是按照塊劃分的,每一個(gè)塊大小相同;在步驟(3)中同時(shí)采用多個(gè)所述子訓(xùn)練集對(duì)概率圖模型進(jìn)行迭代訓(xùn)練。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于:在步驟(1)中,若所述數(shù)據(jù)集的邊數(shù)目大于設(shè)定值,則對(duì)所述數(shù)據(jù)集進(jìn)行采樣,用于使數(shù)據(jù)集的邊數(shù)目減少,提高模型迭代訓(xùn)練速度。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于:所述采樣方法使用統(tǒng)一采樣、加權(quán)采樣或網(wǎng)格采樣。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于:所述概率圖模型的模型參數(shù)包括隱變量U的維度和學(xué)習(xí)速率。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于:提取步驟(1)中的數(shù)據(jù)集中的部分?jǐn)?shù)據(jù)構(gòu)成測(cè)試集,采用上述測(cè)試集對(duì)所述具有最優(yōu)模型參數(shù)的概率圖模型進(jìn)行預(yù)測(cè)測(cè)試。
10.一種基于權(quán)利要求1的在可交換圖中基于博弈的鏈接預(yù)測(cè)系統(tǒng),其特征在于包括:
獲取模塊,用于獲取數(shù)據(jù)集,將數(shù)據(jù)集中的元素通過(guò)圖表示,圖由節(jié)點(diǎn)集和邊集組成;所述節(jié)點(diǎn)代表待預(yù)測(cè)的實(shí)體,邊代表待預(yù)測(cè)實(shí)體之間的關(guān)系;
過(guò)濾模塊,用于采用網(wǎng)絡(luò)演化模型,過(guò)濾所述圖中的不符合設(shè)定要求的邊,以過(guò)濾后的圖作為訓(xùn)練集;
訓(xùn)練模塊,用于采用訓(xùn)練集對(duì)概率圖模型進(jìn)行迭代訓(xùn)練,得到具有最優(yōu)模型參數(shù)的概率圖模型;
預(yù)測(cè)模塊,用于采用所述具有最優(yōu)模型參數(shù)的概率圖模型進(jìn)行鏈接預(yù)測(cè)。