亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于在線論壇的信息實時推薦方法

文檔序號:6497210閱讀:492來源:國知局
專利名稱:用于在線論壇的信息實時推薦方法
技術領域
本發(fā)明涉及信息檢索領域,特別是涉及一種基于在線論壇的信息實時推薦方法。
背景技術
近年來,互聯網的快速發(fā)展和Web 2.0技術的成熟使得人們在網上更加方便地進 行社交活動,并某種程度上影響了現代人們的生活方式。在線論壇作為諸多應用中比較成 功的一種社交網絡,為人們提供了獲取信息、共享知識、交流興趣愛好和發(fā)表言論的便捷平 臺,頗受人們歡迎。有名的在線論壇,例如Apple Discussion和Slashdot,吸引了數以百萬 甚至千萬計的用戶使用,主題分布于政治、經濟、體育、科學、教育、娛樂、健康等不同領域。 每天登錄在線論壇搜索自己關心的主題或者發(fā)表言論成為了很多用戶的日常習慣,在線論 壇用作時事新聞的發(fā)布媒介,對人們生活和新聞傳媒起到了重要的作用。同時在線論壇作 為人們網上交互的便捷平臺,由于受眾面廣,用戶興趣相對集中,比較適合投放符合用戶品 味的通知和廣告信息,以及開展團體之間的互動交流,因此越來越受到大公司和社會組織 的重視。在線論壇中,用戶的交互一般以主題討論的形式展開。用戶可以發(fā)起新的主題,即 主題鏈源貼,也可以在已有的主題上發(fā)表或回復評論。某個主題的原始帖子可以衍生出很 多回復帖子以及回復帖子的回復帖子,這樣就形成了樹形結構的主題鏈,易于用戶交互。然 而,在實際中,非常受用戶歡迎的大規(guī)模論壇對討論的主題分門別類,將整個論壇圍繞相關 的主題語義分成多個板塊或社區(qū)。一方面,其中相對熱門的板塊每天實時更新的帖子數一 般非常多,更新速度快,內容也可能比較雜亂。另一方面,用戶往往希望盡快找到與其自身 社交和主題興趣愛好相關的帖子,而不希望在無關的主題上浪費時間。因此,在這種情況 下,構建實時的帖子推薦系統(tǒng),實時地給用戶推薦符合其興趣的帖子信息,對幫助用戶及時 獲取網上信息,增強用戶的網上體驗,具有重要的意義。

發(fā)明內容
為克服現有技術的無法快速尋找到與用戶自身社交和主題興趣愛好相關的帖子, 搜索耗時長、效率低的缺點,本發(fā)明提供了一種能快速尋找到與用戶自身社交和主題興趣 愛好相關的帖子,搜索耗時短、效率高的用于在線論壇的信息實時推薦方法。用于在線論壇的信息實時推薦方法,包括以下步驟
1)、獲取指定時間段內用戶參與討論過的所有主題鏈數據,分析主題鏈中的包含的潛 在主題;
2)、對不同的潛在主題分別衡量用戶參與討論的相互影響值和用戶自發(fā)興趣值;
3)、計算用戶參與新主題鏈的趨勢概率,并依此對用戶進行排序,并將排序后的主題鏈 推送給用戶。進一步,步驟1)中,獲取用戶參與過的主題鏈數據,分析潛在主題的方法包括以下 步驟
5(1.1)抽取 論壇網 頁中的 主題鏈 d,所有的主題鏈^構成主題鏈集合D ,^eD ;獲取分別每個主題鏈rf中的所有帖子,抽 取每個帖子P的時間戳(Timestamp)、發(fā)帖的用戶名(User Name)、用戶編碼(User ID)、被 回復的用戶名(Implied User Name)、文本信息(Message Text);
(1.2)分別統(tǒng)計每個主題鏈rf中、用戶 對主題鏈原帖的回復次數Cf},和用尸j對回
帖的用戶,的回復次數;
(1. 3)獲取主題鏈中的所有文本信息,所有的文本信息構成一個文檔,使用隱含狄利克 雷分配(Latent Dirichlet Allocation)對文檔進行潛在主題分析;所述的潛在主題分析 包括獲取給定詞w在一個文檔中的生成概率P(W)和采用吉布斯采樣(Gibbs Sampling)獲 取在潛在主題ζ下選取w的概率、以及潛在主題ζ在給定文檔下的概率; 其中P(W) = P(wIz)汽勻;
表示給定詞w在潛在主題ζ下的概率,PO)表示指定了文檔的情況下、在潛在 主題ζ下選取w的概率。 進一步,步驟2)中,用影響矩陣表示用戶對某個潛在主題ζ參與討論的相互 影響關系,用自發(fā)興趣向量Z表示用戶對某個潛在主題ζ的自發(fā)興趣值; 步驟2)中計算用戶參與討論的相互影響值和自發(fā)興趣值包括以下步驟 (2. 1)計算獲取影響矩陣中的每個元素, 表示用戶i對用戶j參與主題ζ討
論的影響,4 = 計算獲取自發(fā)興趣向量Z中的每個元素, ysi表示用戶i對潛在主題ζ的偏好程度, .Ff獨立于用戶之間的影響關系,=Z^cIr'; (2. 2)對影響矩陣中的每個元素正則化
X^ x^ ι Yi. x^ if 3 . Φ ο Xy < 1 /N otlierwise
其中,N表示用戶的數量;正則化后,影響矩陣Xs每一行的和為1 ;
對自發(fā)興趣向量y中的每個元素<正則化,W ^Ji ^iJi ;
(2. 3)用馬爾科夫鏈(Markov Chain)模擬用戶參加主題討論的動態(tài)過程,其中,馬爾科 夫鏈的節(jié)點表示用戶,邊權重表示用戶參與主題討論的轉變概率,即主題沿著節(jié)點之間的
邊從一個用戶流轉到另一用戶的概率;使用影響矩陣:JT的元素來表征馬爾科夫鏈的
邊權重,使用自發(fā)興趣向量Z中的元素7『表征主題在任意節(jié)點跳轉到相應節(jié)點、而非沿著 節(jié)點之間的邊進行轉變的概率,即主題在每個節(jié)點重新開始的概率;
6用戶參加主題討論闡述為用主題在用戶關系構成的馬爾科夫鏈上隨機走(random walk)的過程。進一步,步驟3)中,用戶參與新主題鏈的趨勢概率的計算方法包括以下步驟 (3. 1)對影響矩陣和自發(fā)興趣向量Z做線性組合、獲取概率轉變矩陣鏟,
權利要求
用于在線論壇的信息實時推薦方法,包括以下步驟1)、獲取指定時間段內用戶參與討論過的所有主題鏈數據,分析主題鏈中的包含的潛在主題;2)、對不同的潛在主題分別衡量用戶參與討論的相互影響值和用戶自發(fā)興趣值;3)、計算用戶參與新主題鏈的趨勢概率,并依此對用戶進行排序,并將排序后的主題鏈推送給用戶。
2.如權利要求1所述的用于在線論壇的信息實時推薦方法,其特征在于步驟1)中, 獲取用戶參與過的主題鏈數據,分析潛在主題的方法包括以下步驟(1.1)抽取 論壇網 頁中的 主題鏈 rf,所有的主題鏈/構成主題鏈集合D,rfe£);獲取分別每個主題鏈rf中的所有帖子,抽 取每個帖子&的時間戳(Timestamp)、發(fā)帖的用戶名(User Name)、用戶編碼(User ID)、被 回復的用戶名(Implied User Name)、文本信息(Message Text);(1.2)分別統(tǒng)計每個主題鏈J中、用戶,對主題鏈原帖的回復次數C嚴,和用尸對回帖的用戶,的回復次數;(1. 3)獲取主題鏈中的所有文本信息,所有的文本信息構成一個文檔,使用隱含狄利克 雷分配(Latent Dirichlet Allocation)對文檔進行潛在主題分析;所述的潛在主題分析 包括獲取給定詞w在一個文檔中的生成概率P(W)和采用吉布斯采樣(Gibbs Sampling)獲 取在潛在主題ζ下選取w的概率、以及潛在主題ζ在給定文檔下的概率; 其中=.尸(+)表示給定詞w在潛在主題ζ下的概率,Ρ(ζ)表示指定了文檔的情況下、在潛在主題ζ下選取w的概率。
3.如權利要求2所述的用于在線論壇的信息實時推薦方法,其特征在于步驟2)中,用影響矩陣JT表示用戶對某個潛在主題ζ參與討論的相互影響關系,用自發(fā)興趣向量Z表示用戶對某個潛在主題ζ的自發(fā)興趣值;步驟2)中計算用戶參與討論的相互影響值和自發(fā)興趣值包括以下步驟(2. 1)計算獲取影響矩陣中的每個元素Ig , 表示用戶i對用戶j參與主題ζ討 論的影響,4=Σ/,4^ ;計算獲取自發(fā)興趣向量.V2中的每個元素義,fi表示用戶i對潛在主題Z的偏好程度, 義獨立于用戶之間的影響關系,= ZAd)cid}; (2. 2)對影響矩陣JP中的每個元素正則化^Mi-- ^I-- / Jt - if y ..本0 y y I^Aj ι I^j ??X-.- -1/Ν otherwise其中,N表示用戶的數量;正則化后,影響矩陣X2每一行的和為1 ;對自發(fā)興趣向量7中的每個元素<正則化,
4.如權利要求3所述的用于在線論壇的信息實時推薦方法,其特征在于步驟3)中, 用戶參與新主題鏈的趨勢概率的計算方法包括以下步驟(3. 1)對影響矩陣和自發(fā)興趣向量Z做線性組合、獲取概率轉變矩陣浐, 其中1表示元素都為1的向量;α表示線性組合的平衡因子(0 < cr < 1), α可根據實際數據調節(jié),一般取ο. 5。α值越大,表示用戶相互影響機制越強,而自發(fā)興趣機制越弱;反之,則用戶相互影響機制越 弱,而自發(fā)興趣機制越強;概率轉變矩陣S11里的每個元素表達了兩個節(jié)點之間單步到達的轉變概率; (3. 2)假設節(jié)點之間通過m (=1,2,…)步到達進行轉變的概率是均勻分布的,即在 通過任意正整數值步驟轉變的概率是都是1/m。則最終的轉變概率矩陣可以有以下式子 替換算出
全文摘要
用于在線論壇的信息實時推薦方法,包括獲取指定時間段內用戶參與討論過的所有主題鏈數據,分析主題鏈中的包含的潛在主題;對不同的潛在主題分別衡量用戶參與討論的相互影響值和用戶自發(fā)興趣值;計算用戶參與新主題鏈的趨勢概率,并依此對用戶進行排序,并將排序后的主題鏈推送給用戶。本發(fā)明具有能快速尋找到與用戶自身社交和主題興趣愛好相關的帖子,搜索耗時短、效率高的優(yōu)點。
文檔編號G06F17/30GK101986298SQ201010522040
公開日2011年3月16日 申請日期2010年10月28日 優(yōu)先權日2010年10月28日
發(fā)明者卜佳俊, 吳昊, 張利軍, 鄭淼, 陳純 申請人:浙江大學
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1