1.一種信息推薦方法,其特征在于,包括:
采集用戶在訪問目標(biāo)網(wǎng)站時(shí)所產(chǎn)生的行為數(shù)據(jù)和所述目標(biāo)網(wǎng)站的第一屬性數(shù)據(jù),其中,所述行為數(shù)據(jù)包括第一當(dāng)前行為數(shù)據(jù)和第一歷史行為數(shù)據(jù);
對(duì)所述第一歷史行為數(shù)據(jù)和所述第一屬性數(shù)據(jù)分別進(jìn)行處理得到第二歷史行為數(shù)據(jù)和第二屬性數(shù)據(jù),進(jìn)而根據(jù)所述第二歷史行為數(shù)據(jù)和所述第二屬性數(shù)據(jù)生成用戶信息數(shù)據(jù)庫,其中,所述用戶信息數(shù)據(jù)庫中包含多個(gè)數(shù)據(jù)樣本;
根據(jù)所述數(shù)據(jù)樣本對(duì)預(yù)設(shè)信息推薦模型進(jìn)行訓(xùn)練,得到第一信息推薦模型,其中,所述第一信息推薦模型為收斂后的所述預(yù)設(shè)信息推薦模型;
根據(jù)所述第一信息推薦模型對(duì)所述第一當(dāng)前行為數(shù)據(jù)進(jìn)行處理,從而生成所述目標(biāo)網(wǎng)站的推薦信息。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)所述第一歷史行為數(shù)據(jù)和所述第一屬性數(shù)據(jù)進(jìn)行處理得到第二歷史行為數(shù)據(jù)和第二屬性數(shù)據(jù)包括:
對(duì)所述第一歷史行為數(shù)據(jù)和所述第一屬性數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,得到第三歷史行為數(shù)據(jù)和第三屬性數(shù)據(jù);
對(duì)所述第三歷史行為數(shù)據(jù)和所述第三屬性數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,得到所述第二歷史行為數(shù)據(jù)和所述第二屬性數(shù)據(jù),其中,所述數(shù)據(jù)預(yù)處理的方式至少包括下述之一:數(shù)據(jù)抽取、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)加載。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述數(shù)據(jù)樣本對(duì)預(yù)設(shè)信息推薦模型進(jìn)行訓(xùn)練,得到第一信息推薦模型包括:
根據(jù)預(yù)設(shè)訓(xùn)練算法對(duì)所述數(shù)據(jù)樣本進(jìn)行處理,得到用戶特征向量,其中,所述預(yù)設(shè)訓(xùn)練算法至少包括下述之一:基于矩陣分解的協(xié)同過濾算法、數(shù)據(jù)并行算法和模型并行算法;
根據(jù)所述用戶特征向量得到所述第一信息推薦模型。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
對(duì)所述第一當(dāng)前行為數(shù)據(jù)進(jìn)行處理,得到第二當(dāng)前行為數(shù)據(jù);
根據(jù)所述第二當(dāng)前行為數(shù)據(jù)更新所述用戶信息數(shù)據(jù)庫;
根據(jù)更新后的所述用戶信息數(shù)據(jù)庫中包含的所述數(shù)據(jù)樣本對(duì)所述第一信息推薦模型進(jìn)行訓(xùn)練,得到第二信息推薦模型,其中,所述第二信息推薦模型為收斂后的所述第一信息推薦模型。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述根據(jù)所述數(shù)據(jù)樣本對(duì)預(yù)設(shè)信息推薦模型進(jìn)行訓(xùn)練之前,所述方法還包括:對(duì)所述預(yù)設(shè)信息推薦模型的模型參數(shù)進(jìn)行初始化處理。
6.一種信息推薦裝置,其特征在于,包括:
采集單元,用于采集用戶在訪問目標(biāo)網(wǎng)站時(shí)所產(chǎn)生的行為數(shù)據(jù)和所述目標(biāo)網(wǎng)站的第一屬性數(shù)據(jù),其中,所述行為數(shù)據(jù)包括第一當(dāng)前行為數(shù)據(jù)和第一歷史行為數(shù)據(jù);
第一處理單元,用于對(duì)所述第一歷史行為數(shù)據(jù)和所述第一屬性數(shù)據(jù)分別進(jìn)行處理得到第二歷史行為數(shù)據(jù)和第二屬性數(shù)據(jù),進(jìn)而根據(jù)所述第二歷史行為數(shù)據(jù)和所述第二屬性數(shù)據(jù)生成用戶信息數(shù)據(jù)庫,其中,所述用戶信息數(shù)據(jù)庫中包含多個(gè)數(shù)據(jù)樣本;
第二處理單元,用于根據(jù)所述數(shù)據(jù)樣本對(duì)預(yù)設(shè)信息推薦模型進(jìn)行訓(xùn)練,得到第一信息推薦模型,其中,所述第一信息推薦模型為收斂后的所述預(yù)設(shè)信息推薦模型;
第三處理單元,用于根據(jù)所述第一信息推薦模型對(duì)所述第一當(dāng)前行為數(shù)據(jù)進(jìn)行處理,從而生成所述目標(biāo)網(wǎng)站的推薦信息。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述第一處理單元包括:
第一處理子單元,用于對(duì)所述第一歷史行為數(shù)據(jù)和所述第一屬性數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,得到第三歷史行為數(shù)據(jù)和第三屬性數(shù)據(jù);
第二處理子單元,用于對(duì)所述第三歷史行為數(shù)據(jù)和所述第三屬性數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,得到所述第二歷史行為數(shù)據(jù)和所述第二屬性數(shù)據(jù),其中,所述數(shù)據(jù)預(yù)處理的方式至少包括下述之一:數(shù)據(jù)抽取、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)加載。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述第二處理單元包括:
第三處理子單元,用于根據(jù)預(yù)設(shè)訓(xùn)練算法對(duì)所述數(shù)據(jù)樣本進(jìn)行處理,得到用戶特征向量,其中,所述預(yù)設(shè)訓(xùn)練算法至少包括下述之一:基于矩陣分解的協(xié)同過濾算法、數(shù)據(jù)并行算法和模型并行算法;
獲取子單元,用于根據(jù)所述用戶特征向量得到所述第一信息推薦模型。
9.一種存儲(chǔ)介質(zhì),其特征在于,所述存儲(chǔ)介質(zhì)包括存儲(chǔ)的程序,其中,在所述程序運(yùn)行時(shí)控制所述存儲(chǔ)介質(zhì)所在設(shè)備執(zhí)行權(quán)利要求1至權(quán)利要求5中任意一項(xiàng)所述的信息推薦方法。
10.一種處理器,其特征在于,所述處理器用于運(yùn)行程序,其中,所述程序運(yùn)行時(shí)執(zhí)行權(quán)利要求1至權(quán)利要求5中任意一項(xiàng)所述的信息推薦方法。