專利名稱:推薦方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)信息檢索技術(shù)領(lǐng)域,具體地說是一種推薦方法及系統(tǒng)。
背景技術(shù):
隨著互聯(lián)網(wǎng)的普及和電子商務(wù)的發(fā)展,推薦系統(tǒng)被廣泛的應(yīng)用,成為網(wǎng)絡(luò)信息檢索技術(shù)的重要內(nèi)容。好的推薦系統(tǒng)的應(yīng)用為用戶節(jié)省了大量的時(shí)間,因?yàn)槠淇梢愿鶕?jù)推薦系統(tǒng)為其推薦的內(nèi)容迅速找到自己所需的,而不需要在海量商品或數(shù)據(jù)中進(jìn)行大量的搜索而浪費(fèi)時(shí)間。個(gè)性化推薦系統(tǒng)是建立在海量數(shù)據(jù)挖掘基礎(chǔ)上的一種高級商務(wù)智能平臺,以幫助電子商務(wù)網(wǎng)站為其顧客購物提供完全個(gè)性化的決策支持和信息服務(wù)。購物網(wǎng)站的推薦系統(tǒng)為客戶推薦商品,自動(dòng)完成個(gè)性化選擇商品的過程,滿足客戶的個(gè)性化需求。
目前的推薦系統(tǒng)使用的方法主要有如下幾種(I)基于關(guān)聯(lián)規(guī)則的推薦方法(Association Rule-based Recommendation),是比較傳統(tǒng)的方法?;谏唐吩谟脩糍徫镘囍械墓铂F(xiàn)率進(jìn)行推薦。由于有的團(tuán)購商品上線時(shí)間較短,因此導(dǎo)致共現(xiàn)信息很少或根本不存在,所以該方法不能適用于團(tuán)購商品的推薦。(2)基于內(nèi)容的推薦方法(Content-based Recommendation),內(nèi)容過濾主要采用自然語言處理、人工智能、概率統(tǒng)計(jì)和機(jī)器學(xué)習(xí)等技術(shù)進(jìn)行過濾。通過相關(guān)特征的屬性來定義項(xiàng)目或?qū)ο螅到y(tǒng)基于用戶評價(jià)對象的特征學(xué)習(xí)用戶的興趣,依據(jù)用戶資料與待預(yù)測項(xiàng)目的匹配程度進(jìn)行推薦,努力向客戶推薦與其以前喜歡的產(chǎn)品相似的產(chǎn)品。但相似度在計(jì)算時(shí)缺乏個(gè)性化的考慮。(3)協(xié)同過濾推薦方法(Collaborative Filtering Recommendation),協(xié)同過濾是在信息過濾和信息系統(tǒng)中正迅速成為一項(xiàng)很受歡迎的技術(shù)。與傳統(tǒng)的基于內(nèi)容過濾直接分析內(nèi)容進(jìn)行推薦不同,協(xié)同過濾分析用戶興趣,在用戶群中找到指定用戶的相似(興趣)用戶,綜合這些相似用戶對某一信息的評價(jià),形成系統(tǒng)對該指定用戶對此信息的喜好程度預(yù)測。其缺點(diǎn)是I)用戶對商品的評價(jià)非常稀疏,這樣基于用戶的評價(jià)所得到的用戶間的相似性可能不準(zhǔn)確(即稀疏性問題);2)隨著用戶和商品的增多,系統(tǒng)的性能會越來越低(即可擴(kuò)展性問題);3)如果從來沒有用戶對某一商品加以評價(jià),則這個(gè)商品就不可能被推薦(即最初評價(jià)問題)。由此可見,上述現(xiàn)有的推薦系統(tǒng)和方法存在的缺陷最終會影響推薦結(jié)果,導(dǎo)致不能完成推薦或推薦不準(zhǔn)確。有鑒于上述的推薦系統(tǒng)及方法存在的缺陷,本發(fā)明人基于多年豐富的實(shí)務(wù)經(jīng)驗(yàn)及專業(yè)知識,經(jīng)過不斷的研究、設(shè)計(jì),最終創(chuàng)設(shè)出一種完善的推薦系統(tǒng)及方法
發(fā)明內(nèi)容
為了解決現(xiàn)有技術(shù)中存在的上述問題,本發(fā)明提供了一種推薦方法。本發(fā)明的推薦方法不僅對購買量大的老用戶有效,同樣也適用于對新用戶和購買量較小的用戶推薦,具有推薦的準(zhǔn)確性高的特點(diǎn)。為了解決上述技術(shù)問題,本發(fā)明采用了如下技術(shù)方案推薦方法,包括I)計(jì)算目標(biāo)用戶對待推薦商品的各屬性的喜好度;2)綜合目標(biāo)用戶在該商品的各個(gè)屬性的喜好度得到目標(biāo)用戶對該商品的整體喜好度;3)根據(jù)目標(biāo)用戶對待推薦商品的喜好度向所述目標(biāo)用戶推薦相應(yīng)的商品。進(jìn)一步,其中步驟I)包括·1-1)根據(jù)商品的各個(gè)屬性的取值特點(diǎn)分別設(shè)定各個(gè)屬性的概率分布;1-2)根據(jù)歷史數(shù)據(jù)確定各個(gè)屬性的概率分布的參數(shù);1-3)將待推薦商品的某個(gè)屬性相對于目標(biāo)客戶在上述概率分布上的概率值作為目標(biāo)用戶對該待推薦商品的該屬性的喜好度。進(jìn)一步,所述各個(gè)屬性的概率分布為正態(tài)分布或多項(xiàng)式分布。進(jìn)一步,所述各個(gè)屬性的概率分布的參數(shù)通過目標(biāo)用戶的歷史數(shù)據(jù)或所有用戶的歷史數(shù)據(jù)來確定。進(jìn)一步,所述步驟2)通過線性加權(quán)和的方式綜合目標(biāo)用戶在待推薦商品的各個(gè)屬性上的喜好度來得到目標(biāo)用戶在該商品上的整體喜好度。進(jìn)一步,所述各個(gè)屬性的權(quán)重通過經(jīng)驗(yàn)設(shè)置,或者根據(jù)歷史數(shù)據(jù)進(jìn)行優(yōu)化,或者全部設(shè)置成I,表示均衡的權(quán)重。進(jìn)一步,所述商品的屬性包括商品描述信息、商品在線銷售起止時(shí)間、商品價(jià)格、商品折扣率、商品配送信息或商家地址信息、商品類別。本發(fā)明還提供了一種推薦系統(tǒng),其技術(shù)方案如下推薦系統(tǒng),包括(I)用戶識別模塊識別登錄的用戶,以便調(diào)用相應(yīng)的用戶信息;(2)用戶信息數(shù)據(jù)庫模塊存儲用戶信息;(3)商品信息數(shù)據(jù)庫模塊存儲商品信息,包括商品屬性信息;(4)商品喜好度生成模塊根據(jù)用戶識別模塊對用戶的識別結(jié)果,從用戶信息數(shù)據(jù)庫和商品信息庫調(diào)取相應(yīng)的信息,計(jì)算目標(biāo)用戶對待推薦商品的各屬性的喜好度;然后綜合目標(biāo)用戶在該商品的各個(gè)屬性的喜好度得到目標(biāo)用戶在該商品上的整體喜好度;(5)商品推薦模塊根據(jù)目標(biāo)用戶對商品的喜好度進(jìn)行排序,按排序結(jié)果向目標(biāo)用戶推薦相應(yīng)的商品,將排序結(jié)果發(fā)送給目標(biāo)用戶。與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于(I)本發(fā)明的推薦方法和系統(tǒng)能解決商品在線時(shí)間短,歷史經(jīng)驗(yàn)少的問題。(2)本發(fā)明的推薦方法和系統(tǒng)可以根據(jù)用戶的要求進(jìn)行有針對性的推薦。(3)本發(fā)明的推薦方法和系統(tǒng)適合給新用戶以及購買量較小的用戶進(jìn)行推薦。(4)本發(fā)明的推薦方法和系統(tǒng)推薦的準(zhǔn)確率高,針對性強(qiáng),節(jié)約了用戶的搜索及瀏覽時(shí)間。
圖I為本發(fā)明的推薦系統(tǒng)的結(jié)構(gòu)示意框圖;圖2為本發(fā)明的推薦方法的流程圖。
具體實(shí)施例方式下面結(jié)合附圖和具體實(shí)施例對本發(fā)明作進(jìn)一步詳細(xì)描述,但不作為對本發(fā)明的限定。實(shí)施例I :本實(shí)施例為本發(fā)明的推薦方法的較佳實(shí)施例。推薦方法,包括 I)計(jì)算目標(biāo)用戶對待推薦商品的各屬性的喜好度;2)綜合目標(biāo)用戶在該商品的各個(gè)屬性的喜好度得到目標(biāo)用戶對該商品的整體喜好度;3)根據(jù)目標(biāo)用戶對待推薦商品的喜好度向所述目標(biāo)用戶推薦相應(yīng)的商品。進(jìn)一步,其中步驟I)包括1-1)根據(jù)商品的各個(gè)屬性的取值特點(diǎn)分別設(shè)定各個(gè)屬性的概率分布;1-2)根據(jù)歷史數(shù)據(jù)確定各個(gè)屬性的概率分布的參數(shù);1-3)將待推薦商品的某個(gè)屬性相對于目標(biāo)客戶在上述概率分布上的概率值作為目標(biāo)用戶對該待推薦商品的該屬性的喜好度。作為本實(shí)施例的一個(gè)優(yōu)選,所述各個(gè)屬性的概率分布為正態(tài)分布或多項(xiàng)式分布。作為本實(shí)施例的一個(gè)優(yōu)選,所述各個(gè)屬性的概率分布的參數(shù)通過目標(biāo)用戶的歷史數(shù)據(jù)或所有用戶的歷史數(shù)據(jù)來確定。作為本實(shí)施例的一個(gè)優(yōu)選,步驟2)是通過線性加權(quán)和的方式綜合目標(biāo)用戶在待推薦商品的各個(gè)屬性上的喜好度來得到目標(biāo)用戶在該商品上的整體喜好度,通過公式表示如下Pr ef(u,g) = W1. score (g. A1, u) +w2. score (g. A2, u), ...,wd. score (g. Ad,u)其中,
A1 > A2......Ad表不商品的一組屬性值,score (g. Ak, u)表不用戶在商品g的第k個(gè)屬性上的
喜好度得分,wk表示該屬性的權(quán)重,該權(quán)重可以通過經(jīng)驗(yàn)設(shè)置,也可以根據(jù)既往數(shù)據(jù)進(jìn)行優(yōu)化,或者最簡單的,全部設(shè)置成1,表示均衡的權(quán)重。其中各個(gè)屬性的權(quán)重通過經(jīng)驗(yàn)設(shè)定,或者通過歷史數(shù)據(jù)優(yōu)化。通過歷史數(shù)據(jù)優(yōu)化可以采用機(jī)器學(xué)習(xí)的方法根據(jù)用戶的購買歷史以及瀏覽歷史進(jìn)行優(yōu)化。經(jīng)過優(yōu)化的權(quán)重相對于簡單設(shè)置的權(quán)重會得到更精確全面的結(jié)果。商品的屬性包括商品描述信息、商品在線銷售起止時(shí)間、商品價(jià)格、商品折扣率、商品配送信息或商品所述商家地址信息、商品類別等等。此處用到的特征不局限于上述特征,比如使用到的還有商品點(diǎn)擊購買率,商品銷量等。每個(gè)待推薦商品采用的屬性越多,那么綜合出來的目標(biāo)用戶在該待推薦商品上的喜好度也越準(zhǔn)確。作為一個(gè)前提,本發(fā)明中每個(gè)用戶已經(jīng)購買的以及將會購買的商品,在第k個(gè)商品的屬性上的取值符合某種分布。比如對于那些連續(xù)變量的屬性值,例如,商品的價(jià)格,所屬商家的地址坐標(biāo)以及折扣率等等,我們假設(shè)這些屬性值符合正態(tài)分布;對于那些離散變量的屬性值,例如,商品的類別,我們假設(shè)這些離散變量的屬性值符合多項(xiàng)式分布。假設(shè)用戶U在商品第k個(gè)屬性Ak上的分布為匕(·),那么對于商品g,我們假設(shè)g. Ak = ak, k = I,…,d 那么,score (g. Ak, u) = fuk(ak, u),即Pr ef (u, g) = W1. ful {av u) +W2. fu2 (a2, u), wd. fud(ad, u)對于那些新用戶以及購買量較少的老用戶,為了得到更穩(wěn)健的得分值,我們采用貝葉斯分析的方法,即假設(shè)各個(gè)分布函數(shù)的參數(shù)符合某種先驗(yàn)分布。假設(shè)第k個(gè)屬性上的先驗(yàn)分布的參數(shù)為9k,那么
Pr ef (u, g) = W1. ful (a1; u Θ ^+W2. fu2(a2, u θ 2),…,wd. fud(ad, u | Θ d)連續(xù)變量的屬性分為一維數(shù)值屬性和二維數(shù)值屬性,相應(yīng)的喜好度的計(jì)算如下一維數(shù)值屬性包括價(jià)格、折扣率等,其一維正態(tài)分布為^--L^exp -^{χ-μ)2
(2πσ2γ2 L 2σ」那么對于一個(gè)待推薦商品的該屬性x*在上述分布上的概率值p(x*| ·)為為尸(xT)= v/2 exP-^)2
(27Γ(Τη )_ 2 Crfi_將上述概率歸一化后得到該待推薦商品的該屬性的喜好度得分score(x*)= exp--^(x* - μΝ^
V 2σΗ_二維數(shù)值屬性以地址的坐標(biāo)為例,設(shè)定地址X的坐標(biāo)服從二維正態(tài)分布,如下式^--l=exP -務(wù)卜 _")Σ-'(X-")
2;rVFI l」其中,X=汶 j," =匕 _|,Σ = [2=_|,I Σ I = O11* O22-O12* O21,^^二-爿^^+那么對于一個(gè)待推薦商品的所屬商家的地址^在上述分布中出現(xiàn)的概率值Ρ(χ ·)可以通過下式計(jì)算,尸(4)=2;rj^exp -^(x*-^)^(^-^),其中 μΝ,ΣΗ是基于目標(biāo)用戶既往
訪問過的商品的所屬商家的地址得到的均值和協(xié)方差陣參數(shù)的后驗(yàn)估計(jì)。將上述的概率歸一化得到該地址的得分值,即目標(biāo)用戶在該待推薦商品的地址屬性上的喜好度Score(Xit)。score(X*) = exp _ |(x* _ μΝ)Σ-J(x* - μΝ)對于離散變量的屬性的相應(yīng)的喜好度的計(jì)算以商品類別為例,其服從多項(xiàng)式分布。假設(shè)共有C個(gè)屬性取值,Xi e {I,…,c,…,C}。目標(biāo)用戶歷史數(shù)據(jù)中取值的出現(xiàn)次數(shù)為Oi1, n2,…,n。),顯然,對于一個(gè)作為待推薦商品的新商品,在該屬性上的
取值為C,即X* = C,通過下式計(jì)算該取值出現(xiàn)的后驗(yàn)概率,即目標(biāo)用戶在該屬性上的喜好度 score (X*)。
權(quán)利要求
1.推薦方法,其特征在于,包括如下步驟 1)計(jì)算目標(biāo)用戶對待推薦商品的各屬性的喜好度; 2)綜合目標(biāo)用戶在該商品的各個(gè)屬性的喜好度得到目標(biāo)用戶對該商品的整體喜好度; 3)根據(jù)目標(biāo)用戶對待推薦商品的喜好度向所述目標(biāo)用戶推薦相應(yīng)的商品。
2.根據(jù)權(quán)利要求I所述的推薦方法,其特征在于,其中步驟I)包括 1-1)根據(jù)商品的各個(gè)屬性的取值特點(diǎn)分別設(shè)定各個(gè)屬性的概率分布; 1-2)根據(jù)歷史數(shù)據(jù)確定各個(gè)屬性的概率分布的參數(shù); 1-3)將待推薦商品的某個(gè)屬性相對于目標(biāo)客戶在上述概率分布上的概率值作為目標(biāo)用戶對該待推薦商品的該屬性的喜好度。
3.根據(jù)權(quán)利要求2所述的推薦方法,其特征在于,所述各個(gè)屬性的概率分布為正態(tài)分布或多項(xiàng)式分布。
4.根據(jù)權(quán)利要求2所述的推薦方法,其特征在于,所述各個(gè)屬性的概率分布的參數(shù)通過目標(biāo)用戶的歷史數(shù)據(jù)或所有用戶的歷史數(shù)據(jù)來確定。
5.根據(jù)權(quán)利要求I所述的推薦方法,其特征在于,所述步驟2)通過線性加權(quán)和的方式綜合目標(biāo)用戶在待推薦商品的各個(gè)屬性上的喜好度來得到目標(biāo)用戶在該商品上的整體喜好度。
6.根據(jù)權(quán)利要求5所述的推薦方法,其特征在于,所述各個(gè)屬性的權(quán)重通過經(jīng)驗(yàn)設(shè)置,或者根據(jù)歷史數(shù)據(jù)進(jìn)行優(yōu)化,或者全部設(shè)置成1,表示均衡的權(quán)重。
7.根據(jù)權(quán)利要求I所述的推薦方法,其特征在于,所述商品的屬性包括商品描述信息、商品在線銷售起止時(shí)間、商品價(jià)格、商品折扣率、商品配送信息或商家地址信息、商品類別。
8.推薦系統(tǒng),包括 (1)用戶識別模塊識別登錄的用戶,以便調(diào)用相應(yīng)的用戶信息; (2)用戶信息數(shù)據(jù)庫模塊存儲用戶信息; (3)商品信息數(shù)據(jù)庫模塊存儲商品信息,包括商品屬性信息; (4)商品喜好度生成模塊根據(jù)用戶識別模塊對用戶的識別結(jié)果,從用戶信息數(shù)據(jù)庫和商品信息庫調(diào)取相應(yīng)的信息,計(jì)算目標(biāo)用戶對待推薦商品的各屬性的喜好度;然后綜合目標(biāo)用戶在該商品的各個(gè)屬性的喜好度得到目標(biāo)用戶在該商品上的整體喜好度; (5)商品推薦模塊根據(jù)目標(biāo)用戶對商品的喜好度進(jìn)行排序,按排序結(jié)果向目標(biāo)用戶推薦相應(yīng)的商品,將排序結(jié)果發(fā)送給目標(biāo)用戶。
全文摘要
本發(fā)明公開了一種推薦方法及系統(tǒng),其中推薦方法,包括如下步驟1)計(jì)算目標(biāo)用戶對待推薦商品的各屬性的喜好度;2)綜合目標(biāo)用戶在該商品的各個(gè)屬性的喜好度得到目標(biāo)用戶對該商品的整體喜好度;3)根據(jù)目標(biāo)用戶對待推薦商品的喜好度向所述目標(biāo)用戶推薦相應(yīng)的商品。為了給新用戶以及購買量較小的用戶提供更準(zhǔn)確的推薦,我們利用貝葉斯分析綜合了全體用戶的整體傾向和單個(gè)用戶的個(gè)性化傾向。針對新用戶和小購買量用戶的推薦的優(yōu)化,有利于提服務(wù)質(zhì)量,節(jié)省用戶搜索時(shí)間。
文檔編號G06F17/30GK102902691SQ201110213618
公開日2013年1月30日 申請日期2011年7月28日 優(yōu)先權(quán)日2011年7月28日
發(fā)明者靳簡明, 沈志勇, 熊宇紅 申請人:上海拉手信息技術(shù)有限公司