一種基于群體用戶行為分析的個(gè)性化推薦方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)用技術(shù)領(lǐng)域,更具體地,設(shè)及一種基于群體用戶行為分 析的個(gè)性化推薦方法。
【背景技術(shù)】
[0002] 近年來,隨著電子商務(wù)的蓬勃發(fā)展,在整個(gè)社會(huì)商品零售額中,線上消費(fèi)的占比越 來越高。網(wǎng)絡(luò)購物給消費(fèi)者提供的巨大的購物優(yōu)勢(shì)主要體現(xiàn)在突破時(shí)空限制、購物方便、更 多的商品選擇、有競爭力的價(jià)格、豐富的商品信息、個(gè)性化和定制化上。同時(shí),與線下消費(fèi)相 比,電商平臺(tái)和廣告主能更方便、更準(zhǔn)確地記錄用戶的瀏覽路徑和購買歷史,從而積累海量 的用戶行為數(shù)據(jù)。用戶在電商平臺(tái)的行為有多種類型例如點(diǎn)擊、加入購物車、購買、評(píng)價(jià)或 者收藏。如何利用該些數(shù)據(jù)W提高電商運(yùn)營和廣告投放效率,被越來越多的電商企業(yè)和廣 告主所關(guān)注。而其中,用戶消費(fèi)行為預(yù)測就是一大研究熱點(diǎn)。電商消費(fèi)行為預(yù)測是指利用 大數(shù)據(jù)和云計(jì)算技術(shù),從海量的用戶行為數(shù)據(jù)中,挖掘用戶消費(fèi)模式,對(duì)每一個(gè)用戶精準(zhǔn)地 預(yù)測其消費(fèi)需求和興趣,從而為商品推薦系統(tǒng)、精準(zhǔn)廣告投放等提供依據(jù)。
[0003] 用戶行為預(yù)測的推薦算法與業(yè)務(wù)場景緊密聯(lián)系,推薦音樂視頻和電子商務(wù)中的推 薦商品的場景完全不一樣。在電商推薦系統(tǒng)領(lǐng)域,只要用戶夠買了一個(gè)東西沒有退貨,那么 有很大的概率可W相信用戶是喜歡該個(gè)東西的。然而,對(duì)于音樂和視頻,卻不能通過用戶聽 了該首歌或是看了該個(gè)視頻就武斷地覺得用戶是喜歡該首歌和該個(gè)視頻的。用戶行為預(yù)測 的推薦算法在電商領(lǐng)域預(yù)測的目的是推斷用戶購買某商品的概率。用戶的購買行為預(yù)測與 用戶的行為類型也非常相關(guān),用戶在電商平臺(tái)上對(duì)商品的點(diǎn)擊、加入購物車、購買、評(píng)價(jià)或 者收藏都是不同程度的反應(yīng)用戶對(duì)商品的偏好興趣。用戶對(duì)商品的興趣度隨著時(shí)間和環(huán)境 的改變,具有非線性的遺忘特性,需要度量時(shí)間因素對(duì)興趣度變化的影響程度。
[0004] 推薦預(yù)測是一種按不同維度排序的算法,一般分為共性化推薦和個(gè)性化推薦。共 性化推薦一般是推薦流行的東西,也許是大眾用戶喜好的,但也許會(huì)是用戶已知的東西。個(gè) 性化推薦需要分析用戶的個(gè)體喜好,推薦的物品都是符合用戶偏好的,但是用戶的偏好會(huì) 隨著時(shí)間和環(huán)境所改變。傳統(tǒng)的協(xié)同過濾算法利用用戶商品評(píng)分矩陣來進(jìn)行推薦計(jì)算,未 考慮用戶訪問項(xiàng)目的具體時(shí)間,未反應(yīng)用戶興趣隨時(shí)間的變化過程。當(dāng)用戶興趣發(fā)生改變 時(shí),現(xiàn)有的推薦系統(tǒng)不能及時(shí)反應(yīng),導(dǎo)致推薦的列表偏離了用戶的真實(shí)喜好?;旌纤惴蒞 通過一個(gè)單參數(shù)調(diào)節(jié)推薦結(jié)果的多樣性和熱口程度,在該種情況下就給不同用戶賦予不同 參數(shù)(從算法結(jié)果的個(gè)性化到算法本身的個(gè)性化)。盡管從理論上有很多種推薦組合方法, 但在某一具體問題中并不見得都有效,組合方式的選取也具有較大的挑戰(zhàn)。
【發(fā)明內(nèi)容】
[0005] 針對(duì)現(xiàn)有技術(shù)的W上缺陷或改進(jìn)需求,本發(fā)明提供一種基于群體用戶行為分析的 個(gè)性化推薦方法,針對(duì)現(xiàn)有推薦算法中沒有學(xué)習(xí)群體用戶行為的知識(shí)而導(dǎo)致推薦準(zhǔn)確度不 高W及對(duì)用戶興趣度的時(shí)序特征考慮不周全存在的問題,提出了一套基于群體用戶興趣變 化的個(gè)性化推薦方法,采用通過聚合海量個(gè)體用戶對(duì)商品的動(dòng)態(tài)興趣從而快速有效的獲得 更高準(zhǔn)確度的推薦列表。另外在定量分析時(shí)間因素對(duì)用戶興趣度的影響權(quán)重時(shí),通過擬合 大眾用戶從接觸商品到購買的時(shí)間分布曲線提高推薦的準(zhǔn)確性。
[0006] 本發(fā)明提供一種基于群體用戶行為分析的個(gè)性化推薦方法,包括W下步驟:
[0007] 步驟1通過數(shù)據(jù)分析及過濾原則對(duì)用戶日志行為數(shù)據(jù)進(jìn)行噪音過濾;
[0008] 步驟2根據(jù)用戶U在一段時(shí)間內(nèi)的對(duì)商品j的操作行為數(shù)據(jù),分析統(tǒng)計(jì)出用戶U 對(duì)商品j的操作行為分布,再采用樸素貝葉斯規(guī)則的條件概率方法,計(jì)算用戶U對(duì)商品j的 時(shí)序動(dòng)態(tài)興趣度pts(buy|user=U,item=j);
[0009] 步驟3根據(jù)群體用戶在整個(gè)時(shí)間段的操作行為數(shù)據(jù)分析時(shí)序特征,采用統(tǒng)計(jì)的方 式擬合用戶U對(duì)商品j的時(shí)間遺忘曲線f(t);
[0010] 步驟4根據(jù)用戶u在不同時(shí)間段對(duì)商品j的時(shí)序動(dòng)態(tài)興趣度pts化uyluser= U,item=j)W及用戶U對(duì)商品j的遺忘的時(shí)間曲線f(t),聚合用戶U在不同時(shí)間段對(duì)商 品j的興趣度來預(yù)測用戶的當(dāng)前興趣度Aw(t),計(jì)算公式如下:
[0011]
【主權(quán)項(xiàng)】
1. 一種基于群體用戶行為分析的個(gè)性化推薦方法,其特征在于,包括: 步驟1通過數(shù)據(jù)分析及過濾原則對(duì)用戶日志行為數(shù)據(jù)進(jìn)行噪音過濾; 步驟2根據(jù)用戶U在一段時(shí)間內(nèi)的對(duì)商品j的操作行為數(shù)據(jù),分析統(tǒng)計(jì)出用戶U對(duì)商 品j的操作行為分布,再采用樸素貝葉斯規(guī)則的條件概率方法,計(jì)算用戶u對(duì)商品j的時(shí)序 動(dòng)態(tài)興趣度 Pts (buy I user = u, item = j); 步驟3根據(jù)群體用戶在整個(gè)時(shí)間段的操作行為數(shù)據(jù)分析時(shí)序特征,采用統(tǒng)計(jì)的方式擬 合用戶u對(duì)商品j的時(shí)間遺忘曲線f (t); 步驟4根據(jù)用戶u在不同時(shí)間段對(duì)商品j的時(shí)序動(dòng)態(tài)興趣度pts (buy |user = u, item =j)以及用戶u對(duì)商品j的遺忘的時(shí)間曲線f(t),聚合用戶u在不同時(shí)間段對(duì)商品j的興 趣度來預(yù)測用戶的當(dāng)前興趣度Aiu. (t),計(jì)算公式如下:
其中,Al^t)是帶權(quán)時(shí)序二分網(wǎng)絡(luò)圖,每一個(gè)元素表示用戶u在時(shí)間t對(duì)商品j的興趣 度;ts表不一時(shí)間段; 步驟5采用群體性過濾方法,通過分析與用戶興趣類似的其他用戶的喜好來為用戶進(jìn) 行個(gè)性化推薦,然后再利用隨機(jī)游走進(jìn)行資源分配,以用戶對(duì)商品的評(píng)分值作為二部圖的 權(quán)重的加權(quán)網(wǎng)絡(luò)推斷,預(yù)測用戶u對(duì)商品j的潛在興趣度F l^t); 步驟6根據(jù)所述潛在興趣度Fiu (t),聚合群體用戶的興趣度& (t); 步驟7聯(lián)合所述群體用戶的興趣度& (t)和所述潛在興趣度Fiu (t),預(yù)測和推薦用戶u 在t時(shí)刻的商品偏好WRu(t),得出用戶感興趣的商品的排名結(jié)果:
其中,δ表示調(diào)節(jié)參數(shù);S表示平滑參數(shù)表示用戶u虛擬交互次數(shù);IF1J表示用戶u交 互商品集合的個(gè)數(shù);c和d均為控制所述調(diào)節(jié)參數(shù)δ的參數(shù)。
2. 如權(quán)利要求1所述的方法,其特征在于,所述步驟2包括以下子步驟: (2-1)計(jì)算每個(gè)用戶u在一定時(shí)間段ts內(nèi)已交互商品的操作行為分布:
其中,
表示用戶u對(duì)商品j在時(shí)間段ts內(nèi)進(jìn)行e類型行為的次數(shù);
表示用戶u對(duì)所有商品在所述時(shí)間段ts內(nèi)進(jìn)行e類型行為的總次數(shù);其 中,用戶對(duì)商品在t時(shí)刻的時(shí)序二部圖網(wǎng)絡(luò)定義為Gt= (Ut, Ot, E),Ut= {u i,u2, ...,uj、Ot ={〇1,〇2,. . .,〇n}分別表示網(wǎng)絡(luò)中t時(shí)刻所有的r個(gè)用戶集合、η個(gè)商品節(jié)點(diǎn)集合;E表示 網(wǎng)絡(luò)中所有節(jié)點(diǎn)之間多類型關(guān)系鏈接集合;rXnXE維時(shí)序二部圖鄰接矩陣數(shù)據(jù)結(jié)構(gòu)定義 為B(t),其中元素^〇表示用戶u在t時(shí)刻對(duì)商品j的e類型操作,且u e j e e e E ; (2-2)用戶u在所述時(shí)間段ts內(nèi)對(duì)商品j的興趣度可以定義為用戶將會(huì)購買商品j的 概率Pts (buy I user = u, item = j),根據(jù)樸素貝葉斯規(guī)則的條件概率原理,計(jì)算公式如下:
其中卬、1186『=11,;^6111=」|6)=0(11,6,七8)[」]表示用戶11以任意6行為操作商品 j的概率;Pts (e)表示用戶u的所有行為以e行為為類型的概率;Pts (user = u, item = j) 表示用戶u所有交互的商品中屬于商品j的概率;λ e表示操作類型的權(quán)重參數(shù)。
3. 如權(quán)利要求1或2所述的方法,其特征在于,所述步驟3包括以下子步驟: (3-1)統(tǒng)計(jì)所有用戶在整個(gè)時(shí)間段內(nèi)從接觸商品到購買商品的時(shí)間段及不同時(shí)間段內(nèi) 用戶計(jì)數(shù); (3-2)采用指數(shù)曲線擬合用戶對(duì)商品遺忘的時(shí)間曲線f(t),計(jì)算公式如下: f (t) = Θ X (tcur-th)b 其中,七_(dá)表示當(dāng)前時(shí)間;th表示用戶與商品的歷史交互時(shí)間;Θ表示遺忘系數(shù);b表示 控制曲線衰減的速度。
4. 如權(quán)利要求1或2所述的方法,其特征在于,所述步驟5包括以下子步驟: (5-1)根據(jù)用戶的當(dāng)前興趣度采用隨機(jī)游走模型計(jì)算商品與商品之間的資源 分配轉(zhuǎn)移矩陣Wm (t),計(jì)算公式如下:
其中,k^k。,分別表示與商品p、q連接所有用戶的邊權(quán)之和;ku u表示與用戶u連接的 所有商品的邊的權(quán)重之和;aup、auq分別表示所述當(dāng)前興趣度A u^t)的對(duì)應(yīng)元素值,μ是混 合調(diào)節(jié)參數(shù); (5-2)根據(jù)資源分配轉(zhuǎn)移矩陣W(t)計(jì)算用戶u對(duì)商品j的潛在興趣度: Fuj(t) = fu(t) [j], u e Ut 其中,
是用戶u對(duì)任意商品的興趣度評(píng)分向量。
5. 如權(quán)利要求1或2所述的方法,其特征在于,所述步驟6包括以下子步驟: (6-1)計(jì)算用戶u初始差異性
其中,Ou表示用戶u交互的所
有商品的集合;參數(shù)λ表示保證迭代的收斂;計(jì)算商品j的初始排序值 其中,L表示所有購買商品j的用戶集合; (6-2)迭代計(jì)算用戶的差異性和商品的排序,當(dāng)兩個(gè)連續(xù)不同迭代的商品排序距離小 于給定閾值時(shí),執(zhí)行所述步驟7,在迭代計(jì)算第k次用戶u的差異性和商品j的排序< 的 公式如下:
【專利摘要】本發(fā)明公開了一種基于群體用戶行為分析的個(gè)性化推薦方法,屬于計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)用技術(shù)領(lǐng)域。本發(fā)明提出了一套基于群體用戶興趣變化的個(gè)性化推薦方法,通過聚合海量個(gè)體用戶對(duì)商品的時(shí)序動(dòng)態(tài)興趣度從而快速有效的獲得準(zhǔn)確度更高的推薦列表。另外再定量分析時(shí)間因素對(duì)用戶興趣度的影響權(quán)重,通過擬合大眾用戶從接觸商品到購買的時(shí)間及不同時(shí)間段購買用戶數(shù)量分布圖,從而提高推薦的準(zhǔn)確性。在充分分析用戶行為數(shù)據(jù)及歸納總結(jié)出用戶的興趣后,計(jì)算出商品與用戶之間的興趣相關(guān)性。
【IPC分類】G06F17-30
【公開號(hào)】CN104866540
【申請(qǐng)?zhí)枴緾N201510220814
【發(fā)明人】謝夏, 何林海, 金海
【申請(qǐng)人】華中科技大學(xué)
【公開日】2015年8月26日
【申請(qǐng)日】2015年5月4日