專利名稱:一種應用于推薦系統(tǒng)的算法及其實現(xiàn)方法
技術(shù)領(lǐng)域:
本發(fā)明屬于互聯(lián)網(wǎng)計算技術(shù)領(lǐng)域。
背景技術(shù):
近年來,隨著互聯(lián)網(wǎng)和電子商務的發(fā)展,推薦系統(tǒng)得到了廣泛的發(fā)展。推薦系統(tǒng)的非形式化概念是在1997年由Varian和Resnick提出的“它是利用電子商務網(wǎng)站向客戶提供商品信息和建議,幫助用戶決定應該購買什么產(chǎn)品,模擬銷售人員幫助客戶完成購買的過程”。為了挖掘用戶的需求,根據(jù)用戶的興趣和愛好推薦他們滿意的商品成為了各大電子商務系統(tǒng)的重點。目前,不同形式的推薦系統(tǒng)被應用到了各個領(lǐng)域,如Amazon、EBay為代表的電子商務網(wǎng)站,Netflix、moviefinder為代表的電影網(wǎng)站,songtaste為代表的音樂網(wǎng)站。
·
推薦算法是整個推薦系統(tǒng)的核心部分,從很大程度上決定了推薦系統(tǒng)的準確性和效率。目前,主流的推薦算法包括基于內(nèi)容推薦、協(xié)同過濾推薦和組合推薦。雖然這些算法都從一定程度上解決了查詢專家的問題,但是在應用范圍上局限于封閉的機構(gòu),所有的數(shù)據(jù)需要用戶或者專家本身去更新,具行較差的維護性;其次,只考慮了專家作為個人的價值,而專家作為知識的載體,在知識的分享和利用的過程中并不是孤立的,他們的人際關(guān)系和社會地位也能從一定程度上反映專家與專家之間的差異性;第三,這些系統(tǒng)僅僅是查詢系統(tǒng),列出與查詢詞匹配的專家,但沒有排序功能,缺少推薦性。因此,需要一個能使推薦系統(tǒng)更具有開放性、推薦性和多指標的推薦算法,在用戶查詢專家的同時,根據(jù)一些因素對查詢的結(jié)果進行排序,為用戶提供更精準的搜索服務。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種應用于推薦系統(tǒng)的算法及其實現(xiàn)方法,實現(xiàn)基于用戶偏好的個性化專家推薦,使推薦系統(tǒng)更具有開放性、推薦性和多指標性。為達到以上目的,本發(fā)明采用了主成分分析法,直線型無量綱化方法中的極值法,實現(xiàn)評價專家的三個維度質(zhì)量指標、結(jié)構(gòu)指標、匹配指標。進一步,所述的一種應用于專家推薦的推薦算法具有如下特征對于質(zhì)量指標,采用主成分分析法(principal components analysis),對數(shù)據(jù)進行標準化,判斷變量間的相關(guān)性,將具有一定相關(guān)性的變量根據(jù)協(xié)方差重新組合成一組新的綜合指標,選擇不同的累計貢獻率大小來確定主成分個數(shù),最終質(zhì)量指標的因子分析僅包括活躍性因子和互助因子。對于結(jié)構(gòu)指標,基于網(wǎng)站中搜集的“關(guān)注”與“被關(guān)注”關(guān)系,我們將主要考慮社會網(wǎng)絡(luò)中三個比較關(guān)鍵的節(jié)點hub結(jié)點,bridge結(jié)點,Core結(jié)點,在結(jié)構(gòu)指標中只需提取一個因子作為專家衡量的依據(jù)。對于匹配指標,選擇加法合成法作為專家評價效用函數(shù)的公式,將四個因子做了相關(guān)性分析和公共因子提取,得出專家效用函數(shù)
U = w1*Y1+w2*Y2+w3*Y3+w4*T4o本發(fā)明對專家的匹配基于活躍性因子、互助因子、社會性因子和內(nèi)容匹配因子,這些因子能全面的反映出專家在某一個維度上的表現(xiàn)水平,是用戶在選取專家時可能會考慮的因素。
圖I是本發(fā)明所述的應用于推薦系統(tǒng)的算法的結(jié)構(gòu)指標分析流程。圖2是本發(fā)明所述的應用于推薦系統(tǒng)的算法的質(zhì)量指標分析流程。
具體實施例方式本發(fā)明的技術(shù)方案說明 本發(fā)明采用了主成分分析法,直線型無量綱化方法中的極值法,實現(xiàn)評價專家的三個維度質(zhì)量指標、結(jié)構(gòu)指標、匹配指標。首先根據(jù)質(zhì)量指標(相關(guān)性因子Y1,權(quán)威性因子Y2,活躍性因子Y3)和結(jié)構(gòu)指標(社會性因子Y4),初步找出專家,然后計算出以上專家的可達指標(可達性因子Y5),最后根據(jù)專家及其可達性得出最終推薦專家。上述各參數(shù)指標可由如下數(shù)據(jù)計算得出相關(guān)性因子Y1,特定會員在特定領(lǐng)域內(nèi)的發(fā)帖數(shù),回帖數(shù)可以體現(xiàn)出該會員在該領(lǐng)域內(nèi)的相關(guān)性,Yl =Average([發(fā)帖數(shù)]+ [回帖數(shù)]);權(quán)威性因子Y2,特定會員在特定領(lǐng)域內(nèi)的精華帖數(shù),推薦帖數(shù),以及是否為斑竹可以體現(xiàn)出該會員在該領(lǐng)域內(nèi)的權(quán)威性Y2 = a Average ([精華帖數(shù)]+ [推薦帖數(shù)])+ β * [是否為版主];活躍性因子Υ3,特定會員在某時間段(可自定義)內(nèi)的所有發(fā)帖數(shù),回帖數(shù),以及帖子回復總數(shù)可以反映出該會員的活躍性Υ3 = Average([發(fā)帖數(shù)]+ [回帖數(shù)]+ [帖子回復總數(shù)]);社會性因子Υ4,由特定會員的好友關(guān)系圖可以反映出(具體算法待定);可達性因子Υ5,特定會員與專家之間的距離(距離超過3以上可以視為關(guān)系太遠而不在推薦范圍之內(nèi))。其中Υ1,Υ2,Υ3,Υ4的權(quán)重系數(shù)可由多元線形回歸算法獲得。
權(quán)利要求
1.一種應用于專家推薦系統(tǒng)的算法及其實現(xiàn)方法,其特征在于本發(fā)明采用了主成分分析法,直線型無量綱化方法中的極值法,實現(xiàn)評價專家的三個維度質(zhì)量指標、結(jié)構(gòu)指標、匹配指標。
2.根據(jù)權(quán)利要求I所述的多指標專家推薦系統(tǒng)及其實現(xiàn)方法,其特征在于對于質(zhì)量指標,采用主成分分析法(principal components analysis),對數(shù)據(jù)進行標準化,判斷變量間的相關(guān)性,將具有一定相關(guān)性的變量根據(jù)協(xié)方差重新組合成ー組新的綜合指標,選擇不同的累計貢獻率大小來確定主成分個數(shù),最終質(zhì)量指標的因子分析僅包括活躍性因子和互助因子。
3.根據(jù)權(quán)利要求I所述的多指標專家推薦系統(tǒng)及其實現(xiàn)方法,其特征在于對于結(jié)構(gòu)指標,基于網(wǎng)站中搜集的“關(guān)注”與“被關(guān)注”關(guān)系,我們將主要考慮社會網(wǎng)絡(luò)中三個比較關(guān)鍵的節(jié)點hub結(jié)點,bridge結(jié)點,Core結(jié)點,在結(jié)構(gòu)指標中只需提取ー個因子作為專家衡量的依據(jù)。
4.根據(jù)權(quán)利要求I所述的多指標專家推薦系統(tǒng)及其實現(xiàn)方法,其特征在于對于匹配指標,選擇加法合成法作為專家評價效用函數(shù)的公式,將四個因子做了相關(guān)性分析和公共因子提取,得出專家效用函數(shù)。對專家的匹配基于活躍性因子、互助因子、社會性因子和內(nèi)容匹配因子。
全文摘要
本發(fā)明公開了一種應用于推薦系統(tǒng)的算法及其實現(xiàn)方法。本發(fā)明的目的是實現(xiàn)基于用戶偏好的個性化專家推薦,使推薦系統(tǒng)更具有開放性、推薦性和多指標性。為達到以上目的,本發(fā)明采用了主成分分析法,直線型無量綱化方法中的極值法,實現(xiàn)評價專家的三個維度質(zhì)量指標、結(jié)構(gòu)指標、匹配指標。首先根據(jù)質(zhì)量指標(相關(guān)性因子Y1,權(quán)威性因子Y2,活躍性因子Y3)和結(jié)構(gòu)指標(社會性因子Y4),初步找出專家,然后計算出以上專家的可達指標(可達性因子Y5),最后根據(jù)專家及其可達性得出最終推薦專家。
文檔編號G06Q30/00GK102855240SQ201110177698
公開日2013年1月2日 申請日期2011年6月28日 優(yōu)先權(quán)日2011年6月28日
發(fā)明者楊永玲 申請人:上海邁輝信息技術(shù)有限公司