一種個性化消息推薦方法與流程

文檔序號：11919060閱讀：來源：國知局

技術(shù)特征：

1.一種個性化消息推薦方法，其特征在于，所述個性化消息推薦方法根據(jù)消息的發(fā)布時間，決定該消息由哪一類算法產(chǎn)生推薦；當瀏覽時間與當前時間的間隔不大于某個值時，采用基于內(nèi)容推薦和基于用戶的協(xié)同過濾推薦的混合推薦算法：(1)對歷史數(shù)據(jù)按照用戶瀏覽日期進行降序排序處理；(2)通過中文分詞方法以及加入時間因子，生成用戶特征配置文件和在添加截取因子的基礎(chǔ)上生成用戶當前興趣配置文件；(3)通過生成目標用戶當前興趣配置文件的新聞與生成其他用戶的用戶特征配置文件的文件進行相似度計算，獲得目標用戶的相似用戶集，然后生成目標用戶的潛在配置文件；(4)混合用戶的當前興趣配置文件和用戶的潛在配置文件生成用戶混合配置文件；否則，直接采用基于用戶的協(xié)同過濾推薦算法：在產(chǎn)生目標用戶潛在配置文件的相似用戶集中，若某個消息被里面的某個用戶數(shù)超過某個閾值且該消息沒有被目標用戶瀏覽，則該消息被推薦給目標用戶。

2.如權(quán)利要求1所述的個性化消息推薦方法，其特征在于，所述個性化消息推薦方法包括以下步驟：

現(xiàn)存用戶配置文件，在進行消息推薦時需要考慮到用戶的興趣偏好變化，采用截取因子、時間因子以及對用戶的歷史數(shù)據(jù)進行處理；

利用同時考慮行為相似和內(nèi)容相似的基于用戶的協(xié)同過濾方法來尋找目標用戶的相似用戶和潛在興趣；

用戶混合配置文件UBF能夠在獲得目標用戶的用戶當前興趣配置文件UCF和潛在用戶配置文件UMF后，通過對UCF,UMF上的每個主要特征詞加權(quán)得到；

推薦結(jié)果的生成，在推薦列表中，消息由兩部分組成：l₁,l₂；l₁部分有混合配置文件生成；即通過添加時間因子ε₁來限定消息是否采用混合推薦方法—看消息的發(fā)布時間與當前時間的時間間隔是否小于ε₁，若滿足則該文件采用混合推薦方法，否則將不采用。

3.如權(quán)利要求2所述的個性化消息推薦方法，其特征在于，所述現(xiàn)存用戶配置文件具體包括：

(1)向量空間模型，給定消息集F＝(f₁,f₂,…f_i,…,f_n)和主要特征詞序列K＝(k₁,k₂,…k_i,…,k_l)，f_i能夠被表示為向量空間模型(VSM)f_i＝(w_i1,w_i2,…,w_il)，其中w_ij表示特征詞k_j在新聞f_i中的權(quán)重；w_ij＝0表示k_j不在f_i中出現(xiàn)；利用TF-IDF方法來對文本信息進行處理，計算w_ij的公式如下：

w_ij＝tf(i,j)×log[1+n/n(j)]/maxOther(i,j)；

其中n(j)表示出現(xiàn)k_j的新聞的數(shù)量，tf(i,j)是出現(xiàn)在f_i中的k_j的數(shù)目，maxOther(i,j)是出現(xiàn)在f_i的其他特征詞的最大數(shù)目；新聞集F表示成一個權(quán)重矩陣；

(2)用戶現(xiàn)存配置文件，時間因子以及用戶當前興趣配置文件，在處理文本信息時對各個用戶瀏覽的消息的瀏覽時間進行升序排序，然后生成現(xiàn)存用戶配置文件UCF；文件選取最后瀏覽的s個消息用于生成用戶u的當前興趣配置文件UCF_us；用戶u按瀏覽時間降序排列的消息集表示為：所以最新瀏覽的s個消息集合為F_us＝{f_u1,f_u2,…,f_us}，t_i是用戶u閱讀消息f_ui的時間；時間因子能夠被定義為：

$<mrow> <msub> <mi>μ</mi> <mrow> <mi>i</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <mi>α</mi> <mo>|</mo> <msub> <mi>t</mi> <mrow> <mi>i</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>-</mo> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>|</mo> </mrow> </mfrac> <mo>;</mo> </mrow>$

α是時間衰減參數(shù)，通過實驗確定；F_u,F_us是F的子集；F_u,F_us表示為一個權(quán)重矩陣，獲得用戶u的現(xiàn)存配置文件UCF和當前興趣配置文件UCF_us的過程。

4.如權(quán)利要求2所述的個性化消息推薦方法，其特征在于，所述利用同時考慮行為相似和內(nèi)容相似的基于用戶的協(xié)同過濾方法來尋找目標用戶的相似用戶和潛在興趣包括：

(1)混合相似性的計算，給定新聞集F_us和F_v，用戶u的當前興趣文件用戶v的當前配置文件UCF_v＝(wc_v1,wc_v2,...,wc_vl)；則用戶u與用戶v的行為相似和內(nèi)容相似的計算下：

$<mrow> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mi>A</mi> <mi>c</mi> <mi>t</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>v</mi> <mo>)</mo> </mrow> <mo>=</mo> <mo>|</mo> <msub> <mi>F</mi> <mrow> <mi>u</mi> <mi>s</mi> </mrow> </msub> <mo>∩</mo> <msub> <mi>F</mi> <mi>v</mi> </msub> <mo>|</mo> <mo>/</mo> <msqrt> <mrow> <mo>|</mo> <msub> <mi>F</mi> <mrow> <mi>u</mi> <mi>s</mi> </mrow> </msub> <mo>|</mo> <mo>×</mo> <mo>|</mo> <msub> <mi>F</mi> <mi>v</mi> </msub> <mo>|</mo> </mrow> </msqrt> <mo>;</mo> </mrow>$

simCon(u,v)＝(CUF_us·CUF_v)/(|CUF_us|×|CUF_v|)；

混合相似計算公式如下：

sim(u,v)＝β×simAct(u,v)+(1-β)×simCon(u,v)；

(2)潛在用戶配置文件和相似用戶文件的生成，選擇相似性最大的h個用戶構(gòu)造相似用戶文件，通過加權(quán)計算獲得目標用戶u的潛在用戶配置文件UMF。給定相似用戶集U_u＝{v₁,v₂,…,v_h}，用戶v_i的UCF_vi＝(wc_vi1,wc_vi2,...,wc_vil)，用戶u和用戶v_i的相似性為sim(u,v_i)，利用下式計算在MUF_u中的k_j的權(quán)重：

$<mrow> <msub> <mi>wm</mi> <mrow> <mi>u</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <msub> <mi>Σ</mi> <mrow> <msub> <mi>v</mi> <mi>i</mi> </msub> <mi>j</mi> </mrow> </msub> <mo>[</mo> <msub> <mi>wc</mi> <mrow> <msub> <mi>v</mi> <mi>i</mi> </msub> <mi>j</mi> </mrow> </msub> <mo>×</mo> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <msub> <mi>v</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>/</mo> <msub> <mi>Σ</mi> <mrow> <msub> <mi>v</mi> <mi>a</mi> </msub> <mo>&Element;</mo> <msub> <mi>U</mi> <mi>u</mi> </msub> </mrow> </msub> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <msub> <mi>v</mi> <mi>a</mi> </msub> <mo>)</mo> </mrow> <mo>]</mo> <mo>.</mo> </mrow>$

5.如權(quán)利要求2所述的個性化消息推薦方法，其特征在于，目標用戶u的當前興趣配置文件UCF_us，潛在興趣配置文件UMF_u＝(wm_u1,wm_u2,...,wm_ul)，混合配置文件UBF_u＝(wb_u1,wb_u2,…,wb_ul)，利用下式計算wb_uj：

wb_uj＝γwc_uj+(1-γ)wm_uj。

6.如權(quán)利要求2所述的個性化消息推薦方法，其特征在于，所述推薦結(jié)果的生成具體包括：

目標用戶u的混合配置文件BUF_u＝(wb_u1,wb_u2,…,wb_ul)，新聞d₀＝(wd₁,wd₂,…,wd_l)，新聞d₀的發(fā)布時間為t₀，當前時間t_cur，閾值ε₁,ε₂，首先檢查：

t_cur-t₀≤ε₁；

若不等式成立，則檢查：

d₀·BUF_u≥ε₂；

若成立，則將新聞d₀放入l₁中；

l₂部分直接由基于內(nèi)容相似和行為相似的協(xié)同過濾算法生成包括：

用戶u的相似用戶集U_u＝{v₁,v₂,…,v_h}，用戶u和用戶v_i的相似性為sim(u,v_i)，對于消息d₀，設其在用戶u的相似用戶集上的權(quán)重為則消息d₀的相對于用戶u的權(quán)重為：

$<mrow> <msub> <mi>w</mi> <msub> <mi>u</mi> <msub> <mi>d</mi> <mn>0</mn> </msub> </msub> </msub> <mo>=</mo> <munderover> <mo>Σ</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>h</mi> </munderover> <msub> <mi>w</mi> <mrow> <msub> <mi>v</mi> <mi>j</mi> </msub> <msub> <mi>d</mi> <mn>0</mn> </msub> </mrow> </msub> <mo>*</mo> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <msub> <mi>v</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>;</mo> </mrow>$

選出相對于用戶u的權(quán)重較大的消息放入l₂部分。

7.一種應用權(quán)利要求1～6任意一項所述個性化消息推薦方法的個性化服務推薦系統(tǒng)。

完整全部詳細技術(shù)資料下載

當前第2頁1 2 3

相關(guān)技術(shù)