基于少量用戶評價的物品流行度與喜好度聯(lián)合預(yù)測系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種計算機技術(shù)領(lǐng)域,具體地說,涉及的是一種利用計算機計算在僅獲取和利用極少量已知信息的情況下對物品的流行度與用戶喜好度聯(lián)合預(yù)測系統(tǒng)。
【背景技術(shù)】
[0002]在電子商務(wù)不斷興起的時代,用戶喜好度預(yù)測系統(tǒng)已經(jīng)成為了刺激顧客消費的重要組成部分。所謂喜好度預(yù)測,是指商家根據(jù)已經(jīng)購買了一部分商品的顧客的歷史購物清單,來猜測他對于網(wǎng)站中其他未購買商品或新商品的喜好程度或口味,并把預(yù)測評分較高的商品推薦給顧客,以促銷其購買。這種精準(zhǔn)式的個性化營銷已經(jīng)成為許多互聯(lián)網(wǎng)公司、電子商務(wù)網(wǎng)站、廣告提供商的不二法寶,在互聯(lián)網(wǎng)經(jīng)濟中扮演著十分重要的角色。
[0003]除了用戶個性化喜好預(yù)測以外,在商品營銷中廣告公司和購物網(wǎng)站還需要考評商品的潛在流行度這個重要指標(biāo),它反映了大眾整體對于一個商品的接受程度。舉一個簡單的例子,如果一款商品僅在很小范圍的顧客中有著比較高的喜好程度,那么它就可以看作一款小眾商品,對其傾斜過多的廣告促銷資源并不能夠帶來更大的利益。相比來說,如果另外一款商品能夠在較大規(guī)模的顧客中都獲得不錯的喜好度,那么針對他的營銷可能會更加有經(jīng)濟效益。這里所說的潛在流行度,本質(zhì)上并不局限于物品在一套系統(tǒng)或一個網(wǎng)站內(nèi)的人氣值,它可以用更大范圍內(nèi)的用戶接受程度來進(jìn)行衡量。
[0004]綜合以上兩點考慮,一款成功的商品預(yù)測系統(tǒng)不僅需要了解到針對每一個單一用戶的用戶習(xí)慣偏好、預(yù)測用戶評價,也需要了解物品在整體系統(tǒng)中的流行度情況。需要說明的是,該預(yù)測系統(tǒng)并不局限于互聯(lián)網(wǎng)公司,在任何實體商業(yè)經(jīng)濟體中,根據(jù)客戶喜好度而做出精準(zhǔn)化的銷售也是刺激顧客消費的重要環(huán)節(jié)。更加重要的是,流行度的預(yù)測和用戶評分的預(yù)測甚至可以是互聯(lián)網(wǎng)經(jīng)濟和實體經(jīng)濟的結(jié)合,比如一部電影在電影院票房中取得了非常不錯的成績,那么它就擁有了很高的流行度,而一個在線電影點播網(wǎng)站就可以利用這些流行度信息,并根據(jù)自己網(wǎng)站用戶的個性化喜好,綜合選取最優(yōu)的電影進(jìn)行廣告推銷。這種聯(lián)合化的預(yù)測模式有著非常重要的經(jīng)濟價值。
[0005]由于新商品的已有評價信息和屬性特征較少,這種稀疏性導(dǎo)致了用戶-物品的相似度趨向零的特征,無法準(zhǔn)確的獲取商品的模型參數(shù)。因此已有的預(yù)測系統(tǒng)需要通過搜集、市場調(diào)研等方法獲取較大范圍的用戶群體對新商品的評價,才能夠較好的計算用戶-物品相似度,從而進(jìn)行后續(xù)的預(yù)測工作。而這種模式需要非常大的經(jīng)濟和時間代價,數(shù)據(jù)處理復(fù)雜,計算處理效率低。
[0006]由于新商品層出不窮,目前物品流行度的預(yù)測和用戶喜好度預(yù)測系統(tǒng)中由于新商品的評價過少導(dǎo)致的無法準(zhǔn)確預(yù)測其流行度和在全體用戶群中的喜好度,急切的需要一種新的技術(shù)手段來應(yīng)對商品的流行度預(yù)測和用戶喜好度預(yù)測的問題。
【發(fā)明內(nèi)容】
[0007]本發(fā)明的目的在于針對現(xiàn)有技術(shù)的不足,提出了一種基于少量用戶評價的物品流行度與喜好度聯(lián)合預(yù)測系統(tǒng),該系統(tǒng)利用計算機技術(shù),基于事先選取的少量關(guān)鍵用戶對新商品的評價來進(jìn)行預(yù)測,降低了數(shù)據(jù)處理復(fù)雜,提高計算處理效率,能夠節(jié)省大量人力物力,且準(zhǔn)確度高。
[0008]本發(fā)明是通過以下技術(shù)方案實現(xiàn)的,所述預(yù)測系統(tǒng)包括:
[0009]數(shù)據(jù)準(zhǔn)備模塊:將用戶的原始評價數(shù)據(jù)預(yù)處理,生成用戶-物品評分矩陣、物品流行度向量;
[0010]特征建模模塊:根據(jù)數(shù)據(jù)準(zhǔn)備模塊的用戶-物品評分矩陣、物品流行度向量,采用功能性矩陣分解方法、線性回歸方法生成用戶對不同物品的喜好特征矩陣、物品屬性特征矩陣、物品屬性矩陣與流行度的回歸系數(shù)向量;
[0011]預(yù)測模塊:僅使用少量關(guān)鍵用戶對物品的評價,估算物品屬性的特征向量,從而預(yù)測預(yù)測物品的未來流行度、預(yù)測全體用戶對該物品的喜好程度;所述預(yù)測模塊把少量關(guān)鍵用戶的喜好特征矩陣、少量關(guān)鍵用戶對新物品的評價,映射為該新物品的屬性特征向量,然后使用新物品的屬性特征向量與全體用戶喜好特征矩陣相乘來預(yù)測全體用戶喜好程度,使用新物品的屬性特征向量與線性預(yù)測系數(shù)相乘得到未來流行度預(yù)測結(jié)果。
[0012]優(yōu)選地,所述數(shù)據(jù)準(zhǔn)備模塊、特征建模模塊,其中涉及的物品,是指現(xiàn)已存在于該系統(tǒng)中的商品;
[0013]所述預(yù)測模塊,其中涉及的物品包括現(xiàn)已存在于該系統(tǒng)中的商品、對不存在于目前系統(tǒng)的、可以被加入至當(dāng)前系統(tǒng)的新物品。
[0014]優(yōu)選地,所述數(shù)據(jù)準(zhǔn)備模塊、特征建模模塊,其中的預(yù)處理和建立數(shù)學(xué)模型時,將用戶對某物品的評價數(shù)值化、歸一化為用戶-物品評分矩陣中相交的元素(如不存在評價則視為空元素);將多維度物品屬性特征通過線性預(yù)測系數(shù)映射為一維的流行度向量,還可以對流行度向量進(jìn)行非線性變換處理使其處于一定的變化范圍之內(nèi)。
[0015]優(yōu)選地,所述預(yù)測模塊,包括選取少量關(guān)鍵用戶子模塊,該子模塊根據(jù)所述數(shù)據(jù)準(zhǔn)備模塊、特征建模模塊所得到的用戶喜好特征矩陣、物品屬性特征矩陣、回歸系數(shù)向量,從現(xiàn)有系統(tǒng)中全部用戶中選取出少量最優(yōu)(即使得預(yù)測錯誤率最低)的用戶作為關(guān)鍵用戶。隨后僅僅使用這些少量關(guān)鍵用戶對新物品的評價,來預(yù)測該物品的流行度和在全體用戶中的喜好程度,從而極大的降低了聯(lián)合預(yù)測時所需要的時間成本、人力成本等,并保持預(yù)測的準(zhǔn)確度。
[0016]優(yōu)選地,所述的選取少量關(guān)鍵用戶子模塊,可以把最優(yōu)化選取少量關(guān)鍵用戶的問題轉(zhuǎn)化為構(gòu)建三向決策樹模型中選取最優(yōu)分支節(jié)點的問題。該決策樹模型,構(gòu)建方法為:
[0017]I)決策樹中每個葉子節(jié)點包含一組屬性特征類似的物品。決策樹每層的每個分支節(jié)點包含一個用戶。根據(jù)每個用戶對子節(jié)點中物品的評價(好、壞、不確定),均可以把這些物品分劃為無交集的三個子集,作為當(dāng)前決策樹節(jié)點的三個兒子節(jié)點:左節(jié)點L(p)、中節(jié)點U(p)、右節(jié)點D(p)。在全部用戶中,必定有一個用戶P可以使得分劃后的三個子集里的物品流行度預(yù)測誤差與用戶喜好度誤差之和為最小,把該用戶P記為決策樹本分支的節(jié)點,并視為一個關(guān)鍵用戶;
[0018]2)對決策樹每層的每個兒子節(jié)點均采用相同的遞歸分割操作,可構(gòu)建最大層級為P層的決策樹。當(dāng)需要獲取待預(yù)測物品的屬性特征時,可以根據(jù)P個關(guān)鍵用戶對該物品的評價,選擇最合適的決策路徑,并到達(dá)相應(yīng)的的葉子節(jié)點之中,進(jìn)而得到該物品屬性特征,以便用于預(yù)測。
[0019]本發(fā)明系統(tǒng)實現(xiàn)了以下特征:
[0020]I)根據(jù)系統(tǒng)中已知的用戶對已有商品的評價與喜好,生成可以區(qū)分不同用戶對不同商品喜好度的數(shù)學(xué)模型,以及生成可以區(qū)分商品之間不同屬性特征的數(shù)學(xué)模型;
[0021]2)該系統(tǒng)可事先選取一組少量的關(guān)鍵用戶。針對待預(yù)測的新商品,可以僅僅利用該組用戶對該新商品的評價,來估算該商品的屬性特征模型,并依次預(yù)測該商品的流行度、系統(tǒng)中所有用戶對該新商品的喜好程度。
[0022]3)該系統(tǒng)結(jié)合功能性矩陣分解和線性預(yù)測方法,可以最優(yōu)化地選取上述關(guān)鍵用戶群,因此可以保證流行度預(yù)測準(zhǔn)確性和推薦準(zhǔn)確性。
[0023]相比于現(xiàn)有需要搜集更多用戶評價信息才能進(jìn)行預(yù)測的系統(tǒng),本發(fā)明具有如下的有益效果:本發(fā)明構(gòu)建最優(yōu)化選取少量關(guān)鍵評測用戶的決策樹,并利用少量但具有區(qū)分度的用戶對新商品的評價,來預(yù)測該新商品的流行度和全體用戶喜好程度。本系統(tǒng)包含的技術(shù)方法不僅極大地降低了數(shù)據(jù)量處理,提高了運行速度,減少系統(tǒng)代價,更可以同時對流行度和用戶喜好同時進(jìn)行聯(lián)合預(yù)測,且不會降低預(yù)測準(zhǔn)確率。
【附圖說明】
[0024]通過閱讀參照以下附圖對非限制性實施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯:
[0025]圖1是本發(fā)明一實施例中系統(tǒng)框圖;
[0026]圖2為本發(fā)明一實施例中系統(tǒng)的工作流程圖;
[0027]圖3是本發(fā)明一實施例中最優(yōu)化關(guān)鍵用戶的選擇方法的流程圖。
【具體實施方式】
[0028]下面結(jié)合具體實施例對本發(fā)明進(jìn)行詳細(xì)說明。以下實施例將有助于本領(lǐng)域的技術(shù)人員進(jìn)一步理解本發(fā)明,但不以任何形式限制本發(fā)明。應(yīng)當(dāng)指出的是,對本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn)。這些都屬于本發(fā)明的保護(hù)范圍。
[0029]如圖1所示,一種基于少量關(guān)鍵用戶評價的物品流行度與用戶喜好度聯(lián)合預(yù)測系統(tǒng),包括:
[0030]數(shù)據(jù)準(zhǔn)備模塊:用于將原始評價數(shù)據(jù)預(yù)處理,生成用戶-物品評分矩陣、物品流行度向量;
[0031]特征建模模塊:根據(jù)數(shù)據(jù)準(zhǔn)備模塊的用戶-物品評分矩陣、物品流行度向量,采用功能性矩陣分解方法、線性回歸方法生成用戶對不同物品的喜好特征矩陣、物品屬性特征矩陣、物品屬性矩陣與流行度的回歸系數(shù)向量;
[0032]預(yù)測模塊:僅使用少量關(guān)鍵用戶對物品的評價,估算物品屬性的特征向量,從而預(yù)測預(yù)測物品的未來流行度、預(yù)測全體用戶對該物品的喜好程度。
[0033]所述數(shù)據(jù)準(zhǔn)備模塊、特征建模模塊,其中涉及的物品,是指現(xiàn)已存在于該系統(tǒng)中的商品;
[0034]所述預(yù)測模塊,其中涉及的物品包括現(xiàn)已存在于該系統(tǒng)中的商品、對不存在于目前系統(tǒng)的、可以被加入至當(dāng)前系統(tǒng)的新物品。
[0035]本發(fā)明所述的物品流行度不局限于商品在單一系統(tǒng)中的銷售量等,可以