1.一種基于異構(gòu)信息的評(píng)分推薦方法,其特征在于,包括以下步驟:
S1、獲取物品的用戶(hù)ID、物品ID、評(píng)分信息、評(píng)論信息和物品描述信息;
S2、將評(píng)分信息、評(píng)論信息和物品描述信息分別轉(zhuǎn)化成評(píng)分向量、評(píng)論向量和物品描述向量;
S3、將評(píng)分向量、評(píng)論向量和物品描述向量代入以下?lián)p失函數(shù)中,并通過(guò)梯度下降的方法進(jìn)行求解;其中,評(píng)論向量和物品描述向量為常量,評(píng)分向量為變量;
其中,u表示用戶(hù)特征向量,v表示物品特征向量,r表示評(píng)分向量,wr表示評(píng)分向量所處超平面的單位法向量;c表示評(píng)論向量,wc表示評(píng)論向量所處超平面的單位法向量;d表示物品描述向量,wd表示物品描述向量所處超平面的單位法向量,rp,rq分別指評(píng)分為p和q的評(píng)分向量,αr,αc,αd分別代表rp和rq、r、c、d所占損失函數(shù)的權(quán)重,Rr,Rc,Rd分別表示已經(jīng)存在的評(píng)分關(guān)系集合、評(píng)論關(guān)系集合、物品描述關(guān)系集合,e是超參數(shù),C(x)取sigmoid函數(shù);
進(jìn)一步地,損失函數(shù)中的函數(shù)F為:
其中,dis(x)表示向量x的歐幾里得距離,λc和λd是權(quán)重參數(shù),分別代表在函數(shù)F中評(píng)論信息和物品描述信息所占的比重;
S4、根據(jù)S3中的計(jì)算得到最終的變量u,v,wr,wc,wd,通過(guò)以下公式得到用戶(hù)u對(duì)于物品v的推薦度p:
2.根據(jù)權(quán)利要求1所述的基于異構(gòu)信息的評(píng)分推薦方法,其特征在于,還包括以下步驟:
S5、得到同一用戶(hù)u對(duì)于多個(gè)物品的推薦度,并按降序排序,最終得到同一用戶(hù)u對(duì)于所述多個(gè)物品的推薦度排序。
3.根據(jù)權(quán)利要求1所述的基于異構(gòu)信息的評(píng)分推薦方法,其特征在于,在S2中,將評(píng)論信息轉(zhuǎn)化成評(píng)論向量的方法為:
S211、使用word2vec工具對(duì)評(píng)論信息中的每一個(gè)單詞進(jìn)行詞向量訓(xùn)練;
S212、得到每個(gè)單詞的詞向量后對(duì)該條評(píng)論的所有詞向量求平均值,作為最終的評(píng)論向量。
4.根據(jù)權(quán)利要求1所述的基于異構(gòu)信息的評(píng)分推薦方法,其特征在于,在S2中,將物品描述信息轉(zhuǎn)化成物品描述向量的方法為:
S211、使用word2vec工具對(duì)物品描述信息中的每一個(gè)單詞進(jìn)行詞向量訓(xùn)練;
S212、得到每個(gè)單詞的詞向量后對(duì)該條物品描述的所有詞向量求平均值,作為最終的物品描述向量。
5.根據(jù)權(quán)利要求3或4所述的基于異構(gòu)信息的評(píng)分推薦方法,其特征在于,在使用word2vec工具進(jìn)行詞向量訓(xùn)練時(shí),采用skip-gram模型,向量維度大小取20。
6.根據(jù)權(quán)利要求3或4所述的基于異構(gòu)信息的評(píng)分推薦方法,其特征在于,其中,所有詞向量的平均值為:
其中,Q是所述評(píng)論信息的單詞合集或者所述物品描述信息的單詞集合,w是每一個(gè)單詞,vec(w)表示w的詞向量。
7.根據(jù)權(quán)利要求1所述的基于異構(gòu)信息的評(píng)分推薦方法,其特征在于,在S3中,
其中,num(x)表示x的個(gè)數(shù)。
8.根據(jù)權(quán)利要求1所述的基于異構(gòu)信息的評(píng)分推薦方法,其特征在于,在S2中,將評(píng)分信息轉(zhuǎn)化成評(píng)分向量的方法為:將每一個(gè)可能出現(xiàn)的不同評(píng)分值對(duì)應(yīng)映射成一個(gè)隨機(jī)的虛擬向量。