1.一種考慮節(jié)點局部標注特性的符號預測方法,其特征在于,包括以下步驟:
步驟1,獲取符號網絡的形式表達;
步驟2,分析符號網絡結構特征,獲取網絡鄰接矩陣的秩與結構平衡和弱結構平衡理論間的關系,利用低秩矩陣分解對低秩矩陣進行分解,且滿足矩陣秩最小的約束條件;
步驟3,根據(jù)符號網絡結構特征結論,將符號預測問題轉化為優(yōu)化問題;
步驟4,利用隨機梯度下降法對低秩矩陣分解,得到考慮網絡全局特征。
2.根據(jù)權利要求1所述的方法,其特征在于,步驟1的具體過程為:
定義符號網絡G為:G=(V,E,S),其中V={1,2,3,...,n}為節(jié)點集合,E={1,2,3,...,m}為邊集合,S={-1,0,1}表示邊的符號,O為已觀測到的邊集,
i,j∈V,e(i,j)∈E,s(i,j)∈S,若節(jié)點i與j的邊符號為正則s(i,j)=1,節(jié)點i與j的邊符號為負則s(i,j)=-1,節(jié)點i與j的邊符號未被觀測到時s(i,j)=0;
符號網絡G對應有鄰接矩陣A∈im×n,
3.根據(jù)權利要求2所述的方法,其特征在于,步驟2中符號網絡中三個節(jié)點間的關系共形成四種三角形模體,其中
結構平衡條件為:三符號積為正則平衡,
弱結構平衡條件為:三角形模體中不存在兩正一負;
當網絡滿足弱平衡結構時,將節(jié)點分成K個子集,且子集內節(jié)點間的邊全為正或子集間節(jié)點的邊全為負,對網絡節(jié)點編號排序,其鄰接矩陣A為分塊矩陣且具有低秩性且秩為K。
4.根據(jù)權利要求3所述的方法,其特征在于,步驟3的具體過程為:
步驟3.1,將鄰接矩陣A中為0的元素替換為1形成矩陣X;
步驟3.2,將符號預測問題轉化為優(yōu)化問題,形式化描述為
步驟3.3,將鄰接矩陣A分解為兩個K行n列的矩陣PT和Q,使得PT與Q的積與A之間的誤差最小;
步驟3.4,令為預測到的用戶i對用戶j的評價;
步驟3.5,將矩陣模型轉化為最優(yōu)化問題
其中,l為損失函數(shù),用于衡量原矩陣與預測結果矩陣PTQ間的誤差,Ω為用來防止過擬合的正則化項,λ為懲罰因子。
5.根據(jù)權利要求4所述的方法,其特征在于,步驟3中加入偏置項用以描述不同節(jié)點的標注行為,由全局和局部特征共同決定預測結果,偏置項為:
bij=μ+Uiout+Ujin
其中,μ為符號網絡平均評價傾向,μ為負表示當前網絡用戶更傾向于給其他用戶以負面評價,反之則表示相反的情況;Uiout表示節(jié)點i發(fā)出的邊符號的總和,表達了節(jié)點i對其他相鄰節(jié)點的評價特特征,當節(jié)點i發(fā)出的邊有一半以上為負時被預測邊符號為負的可能性就增加;Ujin表示節(jié)點j收到的邊符號的總和,當j的偏置項Ujin為負時表示節(jié)點j收到了更多的負面評價,因此被預測邊的符號為負的可能性也將增加。
6.根據(jù)權利要求4或5所述的方法,其特征在于損失函數(shù)l是Square_loss、Exp_loss函數(shù)或Hinge_loss中的任意一個。
7.根據(jù)權利要求6所述的方法,其特征在于,選擇Square_loss為損失函數(shù),改寫優(yōu)化目標函數(shù)為:
節(jié)點i對節(jié)點j的評價預測結果為
8.根據(jù)權利要求7所述的方法,其特征在于,步驟4的具體過程為:
步驟4.1,令通過求梯度以確定優(yōu)化函數(shù)下降方向并獲取目標函數(shù)對Uiout、Ujin的偏導數(shù):
步驟4.2,由于沿梯度方向相反的方向下降最快,于是得到如下迭代公式:
Pi←Pi+α(eij*Qj-λPi)
Qj←Qj+α(eij*Pi-λQj)
Uiout←Uiout+α(eij-λUiout)
Ujin←Ujin+α(eij-λUjin)
通過反復迭代并不斷優(yōu)化參數(shù),使矩陣A與分解后矩陣PTQ間的誤差小于設定的誤差值;
其中α為學習速度,α越大下降就越快,
隨機梯度下降的時間復雜度為O(t*m*K),t為迭代并收斂次數(shù)。
9.根據(jù)權利要求1所述的方法,其特征在于,在預測結果上利用互惠邊信息優(yōu)化預測效果。