1.一種多媒體數(shù)據(jù)處理方法,其特征在于,包括:
根據(jù)歷史用戶群對預(yù)設(shè)的多媒體數(shù)據(jù)庫中的多個多媒體數(shù)據(jù)的操作行為,生成多媒體數(shù)據(jù)操作行為矩陣;
基于稀疏自編碼神經(jīng)網(wǎng)絡(luò),并根據(jù)所述多媒體數(shù)據(jù)操作行為矩陣計算各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量和各歷史用戶分別對應(yīng)的用戶特征向量;一個隱含特征向量表征所述歷史用戶群對一個多媒體數(shù)據(jù)的喜好程度信息;一個用戶特征向量表征一個歷史用戶對所述多個多媒體數(shù)據(jù)的喜好程度信息;
當接收到與目標用戶對應(yīng)的推薦請求,且所述歷史用戶群包含所述目標用戶時,獲取所述目標用戶的個人操作行為信息中的多個多媒體數(shù)據(jù),并根據(jù)所述目標用戶對應(yīng)的用戶特征向量以及所述個人操作行為信息中各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量對所述個人操作行為信息中的多個多媒體數(shù)據(jù)進行推薦處理。
2.如權(quán)利要求1所述的方法,其特征在于,所述基于稀疏自編碼神經(jīng)網(wǎng)絡(luò),并根據(jù)所述多媒體數(shù)據(jù)操作行為矩陣計算各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量和各歷史用戶分別對應(yīng)的用戶特征向量,包括:
將所述多媒體數(shù)據(jù)操作行為矩陣輸入到所述稀疏自編碼神經(jīng)網(wǎng)絡(luò)對應(yīng)的稀疏自編碼器的輸入層;所述稀疏自編碼器包括所述輸入層、隱藏層、輸出層以及所述隱藏層與所述輸出層之間的目標參數(shù);所述隱藏層包括預(yù)設(shè)數(shù)量的隱藏節(jié)點;
所述稀疏自編碼器根據(jù)所述輸入層中的參數(shù)以及預(yù)設(shè)的用于訓(xùn)練所述目標參數(shù)和所述隱藏節(jié)點的隱藏參數(shù)的目標函數(shù),對所述目標參數(shù)和所述隱藏節(jié)點的隱藏參數(shù)進行偏導(dǎo)數(shù)訓(xùn)練;
當所述稀疏自編碼器的所述輸出層中的參數(shù)與所述輸入層中的參數(shù)相近時,確定所述目標參數(shù)和所述隱藏節(jié)點的隱藏參數(shù)滿足收斂條件,并將滿足所述收斂條件的各隱藏節(jié)點的隱藏參數(shù)組合成隱含特征矩陣;所述隱含特征矩陣為所述多媒體數(shù)據(jù)操作行為矩陣對應(yīng)的壓縮矩陣,所述隱含特征矩陣包括各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量;
根據(jù)訓(xùn)練后的目標參數(shù)或所述隱含特征矩陣計算所述歷史用戶群中各歷史用戶分別對應(yīng)的用戶特征向量。
3.如權(quán)利要求2所述的方法,其特征在于,所述當所述稀疏自編碼器的所述輸出層中的參數(shù)與所述輸入層中的參數(shù)相近時,確定所述目標參數(shù)和所述隱藏節(jié)點的隱藏參數(shù)滿足收斂條件,并將滿足所述收斂條件的各隱藏節(jié)點的隱藏參數(shù)組合成隱含特征矩陣,包括:
當所述稀疏自編碼器的所述輸出層中的參數(shù)與所述輸入層中的參數(shù)相近時,確定所述目標參數(shù)和所述隱藏節(jié)點的隱藏參數(shù)滿足收斂條件,并將滿足所述收斂條件的各隱藏節(jié)點的隱藏參數(shù)確定為目標輸入源;
根據(jù)預(yù)設(shè)數(shù)量的稀疏自編碼器,將所述目標輸入源輸入到下一個稀疏自編碼器的輸入層,所述下一個稀疏自編碼器根據(jù)所述目標函數(shù)訓(xùn)練所述目標輸入源對應(yīng)的隱藏參數(shù),并將所述下一個稀疏自編碼器中訓(xùn)練后的隱藏參數(shù)作為目標輸入源,重復(fù)執(zhí)行本步驟,直至最后一個稀疏自編碼器訓(xùn)練出隱藏參數(shù);
將所述最后一個稀疏自編碼器訓(xùn)練出的隱藏參數(shù)組合為隱含特征矩陣。
4.如權(quán)利要求2所述的方法,其特征在于,所述目標函數(shù)包括預(yù)設(shè)的用戶興趣因子項,所述用戶興趣因子項包括所述各歷史用戶分別對所述多媒體數(shù)據(jù)庫中各多媒體數(shù)據(jù)的興趣值;
一個興趣值是基于一個歷史用戶對一個多媒體數(shù)據(jù)的操作行為類型、操作次數(shù)以及完整操作率計算得到的。
5.如權(quán)利要求3所述的方法,其特征在于,所述根據(jù)訓(xùn)練后的目標參數(shù)或所述隱含特征矩陣計算所述歷史用戶群中各歷史用戶分別對應(yīng)的用戶特征向量,包括:
當所述稀疏自編碼器的數(shù)量為一個時,從所述稀疏自編碼器中訓(xùn)練后的目標參數(shù)對應(yīng)的參數(shù)矩陣中提取出所述歷史用戶群中各歷史用戶分別對應(yīng)的用戶特征向量;
當所述稀疏自編碼器的數(shù)量為至少兩個時,獲取各歷史用戶分別對應(yīng)的個人操作行為信息,分別將各個人操作行為信息中已操作的多媒體數(shù)據(jù)對應(yīng)的隱含特征向量進行向量平均計算,并將計算出的各平均向量分別作為各歷史用戶分別對應(yīng)的用戶特征向量。
6.如權(quán)利要求1所述的方法,其特征在于,所述當接收到與目標用戶對應(yīng)的推薦請求,且所述歷史用戶群包含所述目標用戶時,獲取所述目標用戶的個人操作行為信息中的多個多媒體數(shù)據(jù),并根據(jù)所述目標用戶對應(yīng)的用戶特征向量以及所述個人操作行為信息中各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量對所述個人操作行為信息中的多個多媒體數(shù)據(jù)進行推薦處理,包括:
當接收到與目標用戶對應(yīng)的推薦請求,且所述歷史用戶群包含所述目標用戶時,檢測目標用戶對應(yīng)的個人操作行為信息中是否包含已收藏的多媒體數(shù)據(jù);
若檢測為包含已收藏的多媒體數(shù)據(jù),則獲取所述已收藏的多媒體數(shù)據(jù)對應(yīng)的第一相似多媒體數(shù)據(jù),并將所述第一相似多媒體數(shù)據(jù)作為所述目標用戶的推薦數(shù)據(jù);
若檢測為未包含已收藏的多媒體數(shù)據(jù),則進一步判斷所述個人操作行為信息中是否包含已完整操作的多媒體數(shù)據(jù);
當所述個人操作行為信息中包含已完整操作的多媒體數(shù)據(jù)時,將所述目標用戶對應(yīng)的用戶特征向量與所述已完整操作的多媒體數(shù)據(jù)對應(yīng)的隱含特征向量進行點乘運算,得到個性化特征值;
當所述個性化特征值大于預(yù)設(shè)特征值閾值時,獲取所述已完整操作的多媒體數(shù)據(jù)對應(yīng)的第二相似多媒體數(shù)據(jù),并將所述第二相似多媒體數(shù)據(jù)作為所述目標用戶的推薦數(shù)據(jù)。
7.如權(quán)利要求6所述的方法,其特征在于,還包括:
當所述個人操作行為信息不包含已完整操作的多媒體數(shù)據(jù)時,獲取多個候選多媒體數(shù)據(jù),將所述標用戶對應(yīng)的用戶特征向量分別與各候選多媒體數(shù)據(jù)對應(yīng)的隱含特征向量進行點乘運算,得到所述各候選多媒體數(shù)據(jù)分別對應(yīng)的個性化特征值;
按照各個性化特征值對所述多個候選多媒體數(shù)據(jù)進行排序,并根據(jù)排序結(jié)果將預(yù)設(shè)推薦數(shù)量的候選多媒體數(shù)據(jù)作為所述目標用戶的推薦數(shù)據(jù)。
8.一種多媒體數(shù)據(jù)處理裝置,其特征在于,包括:
矩陣生成模塊,用于根據(jù)歷史用戶群對預(yù)設(shè)的多媒體數(shù)據(jù)庫中的多個多媒體數(shù)據(jù)的操作行為,生成多媒體數(shù)據(jù)操作行為矩陣;
特征計算模塊,用于基于稀疏自編碼神經(jīng)網(wǎng)絡(luò),并根據(jù)所述多媒體數(shù)據(jù)操作行為矩陣計算各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量和各歷史用戶分別對應(yīng)的用戶特征向量;一個隱含特征向量表征所述歷史用戶群對一個多媒體數(shù)據(jù)的喜好程度信息;一個用戶特征向量表征一個歷史用戶對所述多個多媒體數(shù)據(jù)的喜好程度信息;
推薦模塊,用于當接收到與目標用戶對應(yīng)的推薦請求,且所述歷史用戶群包含所述目標用戶時,獲取所述目標用戶的個人操作行為信息中的多個多媒體數(shù)據(jù),并根據(jù)所述目標用戶對應(yīng)的用戶特征向量以及所述個人操作行為信息中各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量對所述個人操作行為信息中的多個多媒體數(shù)據(jù)進行推薦處理。
9.如權(quán)利要求8所述的裝置,其特征在于,所述特征計算模塊包括:
輸入單元,用于將所述多媒體數(shù)據(jù)操作行為矩陣輸入到所述稀疏自編碼神經(jīng)網(wǎng)絡(luò)對應(yīng)的稀疏自編碼器的輸入層;所述稀疏自編碼器包括所述輸入層、隱藏層、輸出層以及所述隱藏層與所述輸出層之間的目標參數(shù);所述隱藏層包括預(yù)設(shè)數(shù)量的隱藏節(jié)點;
訓(xùn)練單元,用于控制所述稀疏自編碼器根據(jù)所述輸入層中的參數(shù)以及預(yù)設(shè)的用于訓(xùn)練所述目標參數(shù)和所述隱藏節(jié)點的隱藏參數(shù)的目標函數(shù),對所述目標參數(shù)和所述隱藏節(jié)點的隱藏參數(shù)進行偏導(dǎo)數(shù)訓(xùn)練;
隱含特征生成單元,用于當所述稀疏自編碼器的所述輸出層中的參數(shù)與所述輸入層中的參數(shù)相近時,確定所述目標參數(shù)和所述隱藏節(jié)點的隱藏參數(shù)滿足收斂條件,并將滿足所述收斂條件的各隱藏節(jié)點的隱藏參數(shù)組合成隱含特征矩陣;所述隱含特征矩陣為所述多媒體數(shù)據(jù)操作行為矩陣對應(yīng)的壓縮矩陣,所述隱含特征矩陣包括各多媒體數(shù)據(jù)分別對應(yīng)的隱含特征向量;
用戶特征生成單元,用于根據(jù)訓(xùn)練后的目標參數(shù)或所述隱含特征矩陣計算所述歷史用戶群中各歷史用戶分別對應(yīng)的用戶特征向量。
10.如權(quán)利要求9所述的裝置,其特征在于,所述隱含特征生成單元包括:
確定子單元,用于當所述稀疏自編碼器的所述輸出層中的參數(shù)與所述輸入層中的參數(shù)相近時,確定所述目標參數(shù)和所述隱藏節(jié)點的隱藏參數(shù)滿足收斂條件,并將滿足所述收斂條件的各隱藏節(jié)點的隱藏參數(shù)確定為目標輸入源;
深度學(xué)習子單元,用于根據(jù)預(yù)設(shè)數(shù)量的稀疏自編碼器,將所述目標輸入源輸入到下一個稀疏自編碼器的輸入層,所述下一個稀疏自編碼器根據(jù)所述目標函數(shù)訓(xùn)練所述目標輸入源對應(yīng)的隱藏參數(shù),并將所述下一個稀疏自編碼器中訓(xùn)練后的隱藏參數(shù)作為目標輸入源,重復(fù)執(zhí)行本步驟,直至最后一個稀疏自編碼器訓(xùn)練出隱藏參數(shù);
組合子單元,用于將所述最后一個稀疏自編碼器訓(xùn)練出的隱藏參數(shù)組合為隱含特征矩陣。
11.如權(quán)利要求9所述的裝置,其特征在于,所述目標函數(shù)包括預(yù)設(shè)的用戶興趣因子項,所述用戶興趣因子項包括所述各歷史用戶分別對所述多媒體數(shù)據(jù)庫中各多媒體數(shù)據(jù)的興趣值;
一個興趣值是基于一個歷史用戶對一個多媒體數(shù)據(jù)的操作行為類型、操作次數(shù)以及完整操作率計算得到的。
12.如權(quán)利要求10所述的裝置,其特征在于,所述用戶特征生成單元包括:
提取子單元,用于當所述稀疏自編碼器的數(shù)量為一個時,從所述稀疏自編碼器中訓(xùn)練后的目標參數(shù)對應(yīng)的參數(shù)矩陣中提取出所述歷史用戶群中各歷史用戶分別對應(yīng)的用戶特征向量;
平均計算子單元,用于當所述稀疏自編碼器的數(shù)量為至少兩個時,獲取各歷史用戶分別對應(yīng)的個人操作行為信息,分別將各個人操作行為信息中已操作的多媒體數(shù)據(jù)對應(yīng)的隱含特征向量進行向量平均計算,并將計算出的各平均向量分別作為各歷史用戶分別對應(yīng)的用戶特征向量。
13.如權(quán)利要求8所述的裝置,其特征在于,所述推薦模塊包括:
檢測單元,用于當接收到與目標用戶對應(yīng)的推薦請求,且所述歷史用戶群包含所述目標用戶時,檢測目標用戶對應(yīng)的個人操作行為信息中是否包含已收藏的多媒體數(shù)據(jù);
相似推薦單元,用于若所述檢測單元檢測為包含已收藏的多媒體數(shù)據(jù),則獲取所述已收藏的多媒體數(shù)據(jù)對應(yīng)的第一相似多媒體數(shù)據(jù),并將所述第一相似多媒體數(shù)據(jù)作為所述目標用戶的推薦數(shù)據(jù);
獲取判斷單元,用于若所述檢測單元檢測為未包含已收藏的多媒體數(shù)據(jù),則進一步判斷所述個人操作行為信息中是否包含已完整操作的多媒體數(shù)據(jù);
點乘運算單元,用于當所述個人操作行為信息中包含已完整操作的多媒體數(shù)據(jù)時,將所述目標用戶對應(yīng)的用戶特征向量與所述已完整操作的多媒體數(shù)據(jù)對應(yīng)的隱含特征向量進行點乘運算,得到個性化特征值;
所述相似推薦單元,還用于當所述個性化特征值大于預(yù)設(shè)特征值閾值時,獲取所述已完整操作的多媒體數(shù)據(jù)對應(yīng)的第二相似多媒體數(shù)據(jù),并將所述第二相似多媒體數(shù)據(jù)作為所述目標用戶的推薦數(shù)據(jù)。
14.如權(quán)利要求13所述的裝置,其特征在于,所述推薦模塊還包括:
所述點乘運算單元,還用于當所述個人操作行為信息不包含已完整操作的多媒體數(shù)據(jù)時,獲取多個候選多媒體數(shù)據(jù),將所述標用戶對應(yīng)的用戶特征向量分別與各候選多媒體數(shù)據(jù)對應(yīng)的隱含特征向量進行點乘運算,得到所述各候選多媒體數(shù)據(jù)分別對應(yīng)的個性化特征值;
排序推薦單元,用于按照各個性化特征值對所述多個候選多媒體數(shù)據(jù)進行排序,并根據(jù)排序結(jié)果將預(yù)設(shè)推薦數(shù)量的候選多媒體數(shù)據(jù)作為所述目標用戶的推薦數(shù)據(jù)。