一種適用于用戶偏好動(dòng)態(tài)演變的個(gè)性化推薦算法的制作方法

文檔序號(hào)：12124768閱讀：1299來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種適用于用戶偏好動(dòng)態(tài)演變的個(gè)性化推薦算法的制作方法與工藝

本發(fā)明涉及數(shù)據(jù)挖掘領(lǐng)域，具體涉及一種基于隱馬爾科夫模型的個(gè)性化推薦算法。

背景技術(shù)：

隨著電子商務(wù)規(guī)模的不斷擴(kuò)大、商品數(shù)量和種類的快速增長，用戶需要花費(fèi)大量的時(shí)間才能找到自己想要購買的商品。為了解決上述問題，個(gè)性化推薦算法得到了廣泛的研究，能夠?yàn)橛脩籼峁﹤€(gè)性化的決策支持和信息服務(wù)，一方面提升了用戶體驗(yàn)，另一方面幫助商品快速推廣到相關(guān)市場。

目前，主要的個(gè)性化推薦算法主要包括協(xié)同過濾算法、基于效用的推薦算法以及基于知識(shí)的推薦算法等一系列靜態(tài)的推薦算法。此類算法通過對(duì)用戶信息數(shù)據(jù)、商品信息數(shù)據(jù)以及用戶歷史行為數(shù)據(jù)分析得出用戶偏好信息，通過用戶偏好信息來推薦用戶可能夠感興趣或者可能購買的商品。

靜態(tài)推薦算法都是基于用戶偏好是靜態(tài)(即用戶偏好不會(huì)隨時(shí)間改變)的假設(shè)。但是，現(xiàn)實(shí)生活中用戶的偏好會(huì)隨著時(shí)間變化，即用戶的偏好是動(dòng)態(tài)演變的。因此，可以進(jìn)一步挖掘用戶偏好的演變信息，從而提高個(gè)性化推薦算法的準(zhǔn)確度。但現(xiàn)有的個(gè)性化推薦算法大都沒有利用用戶偏好的動(dòng)態(tài)演變信息，這是現(xiàn)有個(gè)性化推薦算法的一個(gè)不足。

此外，現(xiàn)有的基于概率模型的個(gè)性化推薦算法在進(jìn)行模型的參數(shù)估計(jì)時(shí)需要的用戶購買記錄的樣本數(shù)量較大。而在實(shí)際情況中，很多用戶的樣本數(shù)量都不足夠，尤其是新用戶或不活躍用戶。這是現(xiàn)有個(gè)性化推薦算法的另一個(gè)不足。

技術(shù)實(shí)現(xiàn)要素：

針對(duì)現(xiàn)有個(gè)性化推薦算法存在的不足，本發(fā)明提供了一種適用于用戶偏好動(dòng)態(tài)演變的個(gè)性化推薦算法，該算法包含參數(shù)估計(jì)算法和商品推薦算法兩個(gè)部分，其中參數(shù)估計(jì)算法中采用了本發(fā)明提出的一種新的似然函數(shù)，采用該似然函數(shù)可以解決用戶的樣本數(shù)量不足的問題。本發(fā)明所提供的個(gè)性化推薦算法實(shí)現(xiàn)了用戶偏好的動(dòng)態(tài)挖掘，與現(xiàn)有個(gè)性化推薦算法相比能夠得到更高的準(zhǔn)確度。

本發(fā)明的特征在于包含以下內(nèi)容：

1、一種新的似然函數(shù)，用于個(gè)性化推薦算法中的概率模型的參數(shù)估計(jì)

為了解決在模型的參數(shù)估計(jì)中用戶樣本不充分的問題，本發(fā)明提出在模型的參數(shù)估計(jì)時(shí)，對(duì)于給定用戶u，除了用戶u的樣本，還把與u相似的所有用戶的樣本也作為訓(xùn)練樣本來構(gòu)造似然函數(shù)，以進(jìn)行模型參數(shù)的最大似然估計(jì)。

本發(fā)明提出的樣本似然函數(shù)為：

其中，x是與用戶u有關(guān)的觀測樣本，為d(d≥1)維，x可以來源于用戶u，也可以來源于和u相似的用戶。所有的x構(gòu)成的集合為D_u。θ是待估計(jì)的參數(shù)集。p(x)是連續(xù)概率分布的(聯(lián)合)概率密度函數(shù)。w(x)表示觀測樣本x的權(quán)值，若x來源于用戶u，則w(x)＝1；若x來源于和u相似的用戶，則w(x)為相似程度的函數(shù)，具體計(jì)算表達(dá)式見式(3)。

2、一種基于隱馬爾科夫模型的參數(shù)估計(jì)算法

在本發(fā)明提供的個(gè)性化推薦算法中，為了挖掘用戶偏好動(dòng)態(tài)演變的信息，本發(fā)明提出在似然函數(shù)(1)中的p(x|θ)采用隱馬爾科夫模型。其中，對(duì)于特定用戶u，樣本為順序統(tǒng)計(jì)量，其中表示第i個(gè)時(shí)刻，用戶u所購買的商品集。

不同于原始隱馬爾科夫模型(在隱變量h^t條件下一個(gè)可觀測的變量為一維變量)，本發(fā)明提出，在某一時(shí)刻t，一個(gè)可觀測的變量為長度不定的多維變量，其在隱變量h^t條件下的概率密度函數(shù)為：

其中，為t時(shí)刻商品集合的勢，(z|θ,h^t)服從泊松分布，服從參數(shù)為B的多項(xiàng)式分布。

因此，涉及的參數(shù)包括：隱馬爾科夫模型中初始狀態(tài)分布π、狀態(tài)轉(zhuǎn)移概率分布矩陣A以及多項(xiàng)式分布參數(shù)B，即：θ＝{π,A,B}。

對(duì)于上述的參數(shù)估計(jì)，本發(fā)明提供了一種參數(shù)估計(jì)算法，如圖1所示。

該參數(shù)估計(jì)算法是一個(gè)參數(shù)θ循環(huán)迭代更新算法，參數(shù)θ＝{π,A,B}的更新的具體計(jì)算方法見公式(5)、公式(6)和公式(7)。

3、商品推薦算法

在得到模型參數(shù)的估計(jì)后，本發(fā)明提出的商品推薦算法如圖3所示。

基于用戶過去的一段時(shí)間的購物記錄，商品v的評(píng)分用該商品在下一時(shí)刻的概率來計(jì)算，其中是估計(jì)出的參數(shù)值。的具體計(jì)算方法見公式(8)。因此，本推薦的商品就是商品評(píng)分排名靠前的商品，根據(jù)實(shí)際情況，如果僅僅只需要推薦一個(gè)商品那么就是評(píng)分最高的商品，如果推薦需要推薦n個(gè)商品則將排名靠前的前n個(gè)商品作為集合推薦給用戶。

附圖說明

圖1是本發(fā)明所提供的一種適用于用戶偏好動(dòng)態(tài)演變的個(gè)性化推薦算法的流程圖；

圖2是圖1中S3“參數(shù)估計(jì)”的算法流程圖；

圖3是圖1中S4“商品推薦”的算法流程圖。

下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步的詳細(xì)描述。

Notation

n-推薦商品個(gè)數(shù)

m-商品個(gè)數(shù)

h-隱變量

ι-隱變量參數(shù)的維度

k-觀測樣本的時(shí)間段的長度

σ-用戶相似度閾值

t-觀測時(shí)刻

τ-迭代次數(shù)

g-計(jì)數(shù)函數(shù)名

w-權(quán)重函數(shù)名

具體實(shí)施方式

下面結(jié)合附圖，對(duì)本發(fā)明提供的一種適用于用戶偏好動(dòng)態(tài)演變的個(gè)性化推薦算法做具體說明。

本發(fā)明的具體實(shí)施方式包括兩個(gè)主要部分：參數(shù)估計(jì)(圖1中S3)和商品推薦(圖1中S4)。

參數(shù)估計(jì)的算法如圖2所示，采用基于本發(fā)明提供的一種新的似然概率函數(shù)的隱馬爾科夫模型。

U＝{u₁,u₂,...,u_l}表示所有觀測樣本中所涉及的用戶的集合，給定一個(gè)用戶u_i,向量v_i用于描述該用戶的基本屬性，在過去k個(gè)時(shí)間段內(nèi)的用戶u_i觀測樣本為表示第j個(gè)時(shí)間段的觀測樣本子集。用戶u_i的相似用戶集N(u_i)＝{u_j|||v_i-v_j||₂＜σ,u_j∈U}為屬性向量的歐式距離小于給定閾值的用戶集合，其中，σ是預(yù)先給定的閾值用于篩選屬性相似的用戶。用戶u_i的模型訓(xùn)練的訓(xùn)練樣本集為其中N(u_i)_j表示用戶u_i的第j個(gè)近鄰用戶，|N(u_i)|表示用戶u_i的近鄰用戶集的大小。

用戶u_i的訓(xùn)練樣本的似然函數(shù)用式(1)計(jì)算，其中表示樣本的樣本權(quán)值，樣本權(quán)值的計(jì)算公式如下：

在本發(fā)明提供的個(gè)性化推薦算法中，用戶觀測樣本的概率密度函數(shù)由隱馬爾科夫模型來計(jì)算，模型參數(shù)θ＝{π,A,υ}。

一個(gè)典型的隱馬爾科夫模型包括：隱變量和可見變量兩部分，對(duì)于每個(gè)時(shí)刻t，均有一個(gè)可見變量和隱變量，對(duì)于t時(shí)刻的隱變量只依賴于上一時(shí)刻t-1的隱變量，t時(shí)刻的可見變量只依賴于當(dāng)前時(shí)刻t的隱變量。其中，對(duì)于初始時(shí)刻的隱變量服從參數(shù)向量長度為ι的參數(shù)π＝{π₁,π₂,...,π_ι}的多項(xiàng)式分布，即：h^t＝1～Mutinomi(aπl(wèi))。對(duì)于t(t>1)時(shí)刻的隱變量，其分布依賴于前一時(shí)刻，即：

其中，A是從變量h^t|h^t-1的概率密度函數(shù)的參數(shù)，A中元素a_ij表示h^t-1＝i條件下h^t＝j(luò)的概率，即：p(h^t＝j(luò)|h^t-1＝i)＝a_ij。

本發(fā)明提供的基于隱馬爾可夫模型的個(gè)性化推薦算法中，可見變量的概率密度由公式(2)計(jì)算。因此，在上訴的似然函數(shù)和隱馬爾可夫模型前提下的參數(shù)估計(jì)算法(即本文提供的基于隱馬爾可夫模型的個(gè)性化推薦算法)包括參數(shù)更新和參數(shù)收斂判斷。其中，對(duì)于給定的用戶u_i，每次迭代的初始分布的參數(shù)更新計(jì)算如下：

其中，{π^τ,A^τ,B^τ}表示第τ次迭代參數(shù)計(jì)算的結(jié)果。由前向傳播算法^[1]，由前向傳播算法和后向傳播算法^[1]計(jì)算得出。

每次迭代的狀態(tài)轉(zhuǎn)移概率更新公式如下：

其中，表示觀測序列的長度。的計(jì)算方法由參考文獻(xiàn)[1]給出。

每次迭代的生成概率更新公式如下：

其中，函數(shù)g計(jì)算商品j在商品集中出現(xiàn)的次數(shù)。

在得到模型參數(shù)的估計(jì)后，基于用戶過去的一段時(shí)間的購物記錄，商品i的評(píng)分用該商品在下一時(shí)刻的概率來計(jì)算，的具體計(jì)算方法如下：

其中，的具體計(jì)算方法由參考文獻(xiàn)[1]給出。

因此，本推薦的商品就是商品評(píng)分排名靠前的商品，根據(jù)實(shí)際情況，如果僅僅只需要推薦一個(gè)商品那么就是評(píng)分最高的商品，如果推薦需要推薦n個(gè)商品則將排名靠前的前n個(gè)商品作為集合推薦給用戶。

下面結(jié)合附圖具體說明本發(fā)明提供的基于隱馬爾科夫模型的個(gè)性化推薦算法，算法具體包括如下步驟：

S1、初始化候選用戶集U‘，即把所有用戶都作為候選用戶；

S2、從候選用戶集U‘選擇一個(gè)用戶u；

S3、對(duì)于用戶u，執(zhí)行本發(fā)明提供的參數(shù)估計(jì)算法，具體包括如下步驟：

S3.1、初始化參數(shù)集，包括：初始狀態(tài)分布參數(shù)π、狀態(tài)轉(zhuǎn)移概率分布參數(shù)A、多項(xiàng)式分布參數(shù)B、參數(shù)收斂閾值σ、用戶u的觀測數(shù)據(jù)集D_u以及推薦商品集大小n；

S3.2、初始化迭代次數(shù)，即：τ＝0；

S3.3、更新參數(shù)π，具體更新公式見式(5)；

S3.4、更新參數(shù)A，具體更新公式見式(6)；

S3.5、更新參數(shù)B，具體更新公式見式(7)；

S3.6、迭代次數(shù)加一，即：τ＝τ+1；

S3.7、判斷參數(shù)估計(jì)算法是否收斂，如果算法收斂，則進(jìn)入步驟S4；否則進(jìn)入步驟S3.3；

S4、執(zhí)行本發(fā)明提供的商品推薦算法，具體包括如下步驟：

S4.1、初始化商品集；

S4.2、從商品集中選擇商品i；

S4.3、計(jì)算商品i的評(píng)分p(i|θ,D_u)，具體計(jì)算公式見式(8)；

S4.4、將商品i從商品集I中刪除；

S4.5、判斷商品集是否為空集，如果為空集，則進(jìn)入步驟S4.6；否則，進(jìn)入步驟S4.2；

S4.6、對(duì)所有的商品i，將p(i|θ,D_u)排序；

S4.7、p(i|θ,D_u)值最大的n個(gè)商品的集合即為推薦商品集；

S5、U‘＝U‘-u，即將用戶u從候選用戶集U‘中剔除；

S6、判斷候選用戶集U‘是否為空集，如果U‘為空集，則算法結(jié)束；如果U‘不為空集，則返回步驟S2.

參考文獻(xiàn)

[1]Rabiner L,Juang B.An introduction to hidden Markov models[J].IEEE ASSP Magazine,1986,3(1):4-16.

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：楊波;陳俊偉;
技術(shù)所有人：電子科技大學(xué);
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

用戶行為偏好指標(biāo)計(jì)算相關(guān)技術(shù)

用戶偏好相關(guān)技術(shù)

用戶偏好模型相關(guān)技術(shù)

用戶偏好分析相關(guān)技術(shù)

微信用戶閱讀偏好分析相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種適用于用戶偏好動(dòng)態(tài)演變的個(gè)性化推薦算法的制作方法