亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于組合學(xué)習(xí)的群組推薦方法與流程

文檔序號(hào):12121152閱讀:270來源:國知局
一種基于組合學(xué)習(xí)的群組推薦方法與流程

本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,更具體地,涉及一種基于組合學(xué)習(xí)的群組推薦方法。



背景技術(shù):

現(xiàn)如今,人類正處于信息大爆炸時(shí)代。為了有效地分析和利用這些數(shù)據(jù),推薦系統(tǒng)作為幫助電子商務(wù)網(wǎng)站為其顧客提供決策支持和信息服務(wù)的一種高級(jí)商務(wù)智能平臺(tái)被廣泛應(yīng)用。

隨著社交網(wǎng)絡(luò)的快速發(fā)展,越來越多的人們?cè)敢夥窒硭麄兊娜航M活動(dòng),例如和同事一起吃晚飯,和配偶一起看電影等。這激發(fā)了旨在為一組用戶進(jìn)行推薦的組推薦的研究學(xué)習(xí)。

群組推薦問題十分具有挑戰(zhàn)性,因?yàn)榻M內(nèi)不同用戶喜好不一樣,如何進(jìn)行推薦使得組內(nèi)平均滿意度最高仍是個(gè)難題。以往的群組推薦方法包括基于內(nèi)存的方法和基于模型的方法兩類?;趦?nèi)存的方法可繼續(xù)細(xì)分為三類:1)為組內(nèi)每個(gè)成員產(chǎn)生推薦物品列表,將這些列表進(jìn)行組合得到一個(gè)組的推薦列表;2)累加組內(nèi)每個(gè)用戶對(duì)每個(gè)物品的評(píng)分,取平均值,以此得到一個(gè)組的評(píng)分列表。根據(jù)評(píng)分產(chǎn)生組的推薦列表;3)構(gòu)建組的喜好模型,根據(jù)模型產(chǎn)生推薦列表?;趦?nèi)存的方法的主要缺點(diǎn)就是忽略了組內(nèi)成員的互相影響?;谀P偷姆椒▌t是利用一些概率模型來模擬群組推薦的過程,這類方法主要缺點(diǎn)是有些模型可能現(xiàn)實(shí)中并不存在。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明是在基于內(nèi)存的方法的三種推薦算法的基礎(chǔ)上提出一種基于組合學(xué)習(xí)的群組推薦方法,該方法可以產(chǎn)生更加準(zhǔn)確結(jié)果。

為了實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案為:

一種基于組合學(xué)習(xí)的群組推薦方法,設(shè)共有m個(gè)組,n個(gè)用戶,其中一個(gè)組用組A代表,推薦方法包括:

方式1:基于K最近鄰算法獲得所有用戶的個(gè)人推薦列表,挑選出組A內(nèi) 每個(gè)成員的推薦列表,將每個(gè)成員的推薦列表根據(jù)組合學(xué)習(xí)的方法得出一個(gè)組A的推薦列表;

假設(shè)組A中有3個(gè)成員的話,首先從n個(gè)用戶的推薦列表中將組A的3個(gè)成員的推薦列表挑出,最終借助組合學(xué)習(xí)的方法將這3個(gè)推薦列表組合成1個(gè)列表,此列表即組A的推薦列表。

組合學(xué)習(xí)的方法具體過程為:每個(gè)推薦列表中物品的排序與它們自身的影響力有關(guān),首先將每個(gè)物品的影響力歸一化,用0-1之間的數(shù)值表示,然后得到每個(gè)物品在不同列表中歸一化后的影響力組成向量r=(r1…,rn),rj代表在第j個(gè)推薦列表中物品的歸一化后的影響力,利用物品的影響力向量得出最終物品在列表中所應(yīng)占的影響力,并根據(jù)每個(gè)物品影響力的高低產(chǎn)生一個(gè)組合后的推薦列表;

方式2:將組A內(nèi)成員對(duì)每個(gè)物品的評(píng)分累加,取平均值以此代表組A對(duì)每個(gè)物品的評(píng)分,得到組A的評(píng)分列表,基于K最近鄰算法,根據(jù)不在組A中成員的評(píng)分列表產(chǎn)生組A的推薦列表;

方式3:構(gòu)建組的喜好模型,將每個(gè)用戶的喜好用特征因子向量表示,根據(jù)單個(gè)用戶的喜好向量得到表示組喜好的特征因子向量,根據(jù)此產(chǎn)生組A的推薦列表;

基于以上三種方式分別產(chǎn)生組A的三個(gè)推薦列表,并基于組合學(xué)習(xí)的方法組合出一個(gè)更準(zhǔn)確的推薦列表,具體過程為:

即將同一組中n個(gè)項(xiàng)排序的k個(gè)列表合并成一個(gè)完整列表的問題,合并后的列表最佳的描述了k個(gè)列表所代表的信息,具體采用的是排序整合中的魯棒排序整合算法(Robust Rank Aggregation)。

與上述方式1中的組合學(xué)習(xí)方法相同,首先每個(gè)推薦列表中物品的排序與它們自身的影響力有關(guān),先將每個(gè)物品的影響力歸一化,用0-1之間的數(shù)值表示。然后可以得到每個(gè)物品在不同列表中歸一化后的權(quán)重組成向量每個(gè)推薦列表中物品的排序與它們自身的影響力有關(guān),首先將每個(gè)物品的影響力歸一化,用0-1之間的數(shù)值表示。然后可以得到每個(gè)物品在不同列表中歸一化后的影響力組成向量r=(r1…,rn),rj代表在第j個(gè)推薦列表中物品的歸一化后的影響力。 利用物品的影響力向量得出最終物品在列表中所應(yīng)占的影響力,并根據(jù)每個(gè)物品影響力的高低產(chǎn)生一個(gè)組合后的推薦列表。,rj代表在第j個(gè)推薦列表中物品的歸一化后的權(quán)重。利用物品在每個(gè)推薦列表中的權(quán)重得出最終物品在列表中所占的影響力,并根據(jù)每個(gè)物品影響力的高低產(chǎn)生一個(gè)組合后的推薦列表。

更進(jìn)一步的,所述方式1的具體實(shí)現(xiàn)方式為:

11)用戶通過以下公式計(jì)算得到相似度Sim(u,v):

其中ruj表示用戶u對(duì)物品j的評(píng)分,rvj表示用戶v對(duì)物品j的評(píng)分,ruv表示用戶u對(duì)物品v的評(píng)分,rvj表示用戶v對(duì)物品j的評(píng)分,表示用戶u對(duì)所有物品評(píng)分的平均值,表示用戶v對(duì)所有物品評(píng)分的平均值,Iuv表示用戶u和用戶v共同評(píng)分過的物品集;

每個(gè)用戶u根據(jù)計(jì)算得到的相似度找出最相似的k個(gè)用戶,放在集合S中;

12)用戶u對(duì)物品i的評(píng)分r’uj由以下公式計(jì)算得到:

13)通過評(píng)分排名得出每個(gè)用戶的推薦列表,挑出組A中成員的推薦列表;

14)將組A中各成員的推薦列表通過組合學(xué)習(xí)的方法組合,得到組A的推薦列表,

組合學(xué)習(xí)的方法具體為:

每個(gè)推薦列表中物品的排序與它們自身的影響力有關(guān),首先將每個(gè)物品的影響力歸一化,用0-1之間的數(shù)值表示。然后可以得到每個(gè)物品在不同列表中歸一化后的影響力組成向量r=(r1…,rn),rj代表在第j個(gè)推薦列表中物品的歸一化后的影響力。利用物品的影響力向量得出最終物品在列表中所應(yīng)占的影響力,并根據(jù)每個(gè)物品影響力的高低產(chǎn)生一個(gè)組合后的推薦列表。

更進(jìn)一步的,所述方式2的具體實(shí)現(xiàn)方式為:

根據(jù)以下公式得到組A的評(píng)分列表Rij

其中ruj表示用戶u對(duì)物品j的評(píng)分,Ui表示第i個(gè)組的用戶總數(shù);

22)將組A看成一個(gè)虛擬人“A”,計(jì)算與其他不在組A內(nèi)成員的相似度Sim(A,v):

其中RAj表示組A對(duì)物品j的評(píng)分,表示組A對(duì)所有物品評(píng)分的平均值,IAv表示組A和用戶v共同評(píng)分過的物品集;

23)選出與“A”最相似的k個(gè)用戶,基于K最近鄰算法得到組A的推薦列表。

更進(jìn)一步的,所述方式3的具體實(shí)現(xiàn)方式為:

31)基于奇異值矩陣分解將用戶評(píng)分矩陣分解為用戶和物品的特征因子矩陣U∈Rf×s和M∈Rf×t,其中f表示特征數(shù),s表示用戶數(shù),t表示物品數(shù);

32)將用戶喜好表示成特征因子向量P=(f1,f2,...,fc);

33)合并用戶喜好特征因子向量,用距離概念來衡量兩個(gè)用戶喜好的不一致性;

根據(jù)該距離概念兩個(gè)點(diǎn)間距離有以下定義:

d(1,0)=d(0,1)=d(0,-1)=d(-1,0)=1

d(1,1)=d(0,0)=d(-1,-1)=0

d(1,-1)=d(-1,1)=2

應(yīng)用到本場景中,兩個(gè)用戶ui,uj間的分歧表示為:

其中Pi、Pj分別表示用戶i、j的喜好的特征因子向量,aq、bq分別表示不 同特征向量的第q個(gè)位置的值;

34)最終組喜好的特征因子向量G應(yīng)保證組內(nèi)成員分歧最?。?/p>

即:∑d(aij,aj)最小,其中i=1,2...N,j=1,2...K;

將每個(gè)特征的權(quán)重標(biāo)準(zhǔn)化:

其中Wmax表示在一個(gè)用戶的特征因子向量中最大的值,Wmin表示在一個(gè)用戶的特征因子向量中最小的值,Wj表示用戶的特征因子向量中第j個(gè)特征的值。

為每個(gè)特征重新賦值如下:

其中s代表組內(nèi)用戶數(shù),Wij'表示用戶j的特征因子向量中特征i的值;

35)將得到的組A的特征因子向量與物品的特征因子矩陣根據(jù)以下公式得出組A的評(píng)分矩陣:

36)最終組A的推薦列表通過評(píng)分高低排序得到。

與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果為:

本方法將三種典型的基于內(nèi)存的組推薦算法分別產(chǎn)生的推薦列表借助組合學(xué)習(xí)的方法得到了一個(gè)更加魯棒更加準(zhǔn)確的推薦結(jié)果。本方法最終采取NDCG做為評(píng)測指標(biāo),實(shí)驗(yàn)結(jié)果表明,當(dāng)KNN的K達(dá)到最優(yōu)時(shí),本方法產(chǎn)生的推薦列表相比方式1、方式2、方式3這三種方式產(chǎn)生的結(jié)果,效果更優(yōu),更加準(zhǔn)確。

附圖說明

圖1是根據(jù)本發(fā)明的流程圖。

圖2是根據(jù)本發(fā)明實(shí)施例的K最近鄰算法的示意圖。

圖3是根據(jù)本發(fā)明實(shí)施例的將稀疏的用戶評(píng)分矩陣填滿后給用戶進(jìn)行推薦的方法的示意圖。

圖4是根據(jù)本發(fā)明實(shí)施例的第三種產(chǎn)生組推薦方法中已知用戶評(píng)分矩陣通過矩陣分解得到用戶特征因子矩陣和物品特征因子矩陣的示意圖。

圖5是本發(fā)明實(shí)施例的第三種產(chǎn)生組推薦方法的過程示意圖。

具體實(shí)施方式

下面結(jié)合附圖對(duì)本發(fā)明做進(jìn)一步的描述,但本發(fā)明的實(shí)施方式并不限于此。

如圖1所示,為本發(fā)明的流程圖,本發(fā)明是基于組推薦的三種基本方法進(jìn)行應(yīng)用產(chǎn)生三種推薦結(jié)果,然后根據(jù)組合學(xué)習(xí)方法將三種結(jié)果組合得到最終結(jié)果。

一種基于組合學(xué)習(xí)的群組推薦方法,包括:

方式1:基于K最近鄰算法獲得所有用戶的個(gè)人推薦列表,挑選出組A成員的推薦列表,將組A成員的推薦列表中根據(jù)組合學(xué)習(xí)的方法得出組A的推薦列表;

方式2:將組A內(nèi)成員的評(píng)分列表累加,取平均值得到組A的評(píng)分列表,基于K最近鄰算法,根據(jù)不在組A中成員的評(píng)分列表產(chǎn)生組A的推薦列表;

方式3:構(gòu)建組的喜好模型,將每個(gè)用戶的喜好用特征因子向量表示,根據(jù)單個(gè)用戶的喜好向量得到表示組喜好的特征因子向量,根據(jù)此產(chǎn)生組A的推薦列表;

基于以上三種方式分別產(chǎn)生組A的三個(gè)推薦列表,并基于組合學(xué)習(xí)的方法組合出一個(gè)更準(zhǔn)確的推薦列表;

這是組合學(xué)習(xí)中的排序整合問題,即將關(guān)于同一組n個(gè)項(xiàng)排序的k個(gè)列表合并成一個(gè)完整列表的問題。合并后的列表最佳的描述了k個(gè)列表所代表的信息。具體采用的是排序整合中的魯棒排序整合算法(Robust Rank Aggregation)算法

在本實(shí)施例中,所述方式1的具體實(shí)現(xiàn)方式為:

11)用戶通過以下公式計(jì)算得到相似度Sim(u,v):

其中ruj表示用戶u對(duì)物品j的評(píng)分,rvj表示用戶v對(duì)物品j的評(píng)分,ruv表示用戶u對(duì)物品v的評(píng)分,rvj表示用戶v對(duì)物品j的評(píng)分,表示用戶u對(duì)所有物品評(píng)分的平均值,表示用戶v對(duì)所有物品評(píng)分的平均值,Iuv表示用戶u 和用戶v共同評(píng)分過的物品集;

每個(gè)用戶u根據(jù)計(jì)算得到的相似度找出最相似的k個(gè)用戶,放在集合S中;

12)用戶u對(duì)物品i的評(píng)分r’uj由以下公式計(jì)算得到:

13)通過評(píng)分排名得出每個(gè)用戶的推薦列表,挑出組A中成員的推薦列表;

14)將組A中各成員的推薦列表通過組合學(xué)習(xí)的方法組合,得到組A的推薦列表。

在本實(shí)施例中,所述方式2的具體實(shí)現(xiàn)方式為:

根據(jù)以下公式得到組A的評(píng)分列表Rij

其中ruj表示用戶u對(duì)物品j的評(píng)分,Ui表示第i個(gè)組的用戶總數(shù);

22)將組A看成一個(gè)虛擬人“A”,計(jì)算與其他不在組A內(nèi)成員的相似度Sim(A,v):

其中RAj表示組A對(duì)物品j的評(píng)分,表示組A對(duì)所有物品評(píng)分的平均值,IAv表示組A和用戶v共同評(píng)分過的物品集;

23)選出與“A”最相似的k個(gè)用戶,基于K最近鄰算法得到組A的推薦列表。

在本實(shí)施例中,所述方式3的具體實(shí)現(xiàn)方式為:

31)基于奇異值矩陣分解將用戶評(píng)分矩陣分解為用戶和物品的特征因子矩陣U∈Rf×s和M∈Rf×t,其中f表示特征數(shù),s表示用戶數(shù),t表示物品數(shù);

32)將用戶喜好表示成特征因子向量P=(f1,f2,…,fc);

33)合并用戶喜好特征因子向量,用距離概念來衡量兩個(gè)用戶喜好的不一致性;

根據(jù)該距離概念兩個(gè)點(diǎn)間距離有以下定義:

d(1,0)=d(0,1)=d(0,-1)=d(-1,0)=1

d(1,1)=d(0,0)=d(-1,-1)=0

d(1,-1)=d(-1,1)=2

應(yīng)用到本場景中,兩個(gè)用戶ui,uj間的分歧表示為:

其中Pi、Pj分別表示用戶i、j的喜好的特征因子向量,aq、bq分別表示不同特征向量的第q個(gè)位置的值;如兩個(gè)特征向量(1,0,-1)和(0,1,-1),a1代表(1,0,-1)中第一個(gè)位置的值1,b1代表(0,1,-1)中第一個(gè)位置的值0。這兩個(gè)向量間距離為

d(1,0)+d(1,1)+d(1,-1)+d(0,0)+d(0,1)+d(0,-1)+d(-1,0)+d(-1,1)+d(-1,-1);

34)最終組喜好的特征因子向量G應(yīng)保證組內(nèi)成員分歧最小:

即:∑d(aij,aj)最小,其中i=1,2...N,j=1,2...K;

將每個(gè)特征的權(quán)重標(biāo)準(zhǔn)化:

其中Wmax表示在一個(gè)用戶的特征因子向量中最大的值,Wmin表示在一個(gè)用戶的特征因子向量中最小的值,Wj表示用戶的特征因子向量中第j個(gè)特征的值。

為每個(gè)特征重新賦值如下:

其中s代表組內(nèi)用戶數(shù),Wij’表示用戶j的特征因子向量中特征i的值;

35)將得到的組A的特征因子向量與物品的特征因子矩陣根據(jù)以下公式得出組A的評(píng)分矩陣:

36)最終組A的推薦列表通過評(píng)分高低排序得到。

其中圖2展示了本發(fā)明中使用廣泛的K最近鄰算法。首先計(jì)算用戶間的相似度,然后根據(jù)相似度挑選出與用戶u1最相似的k個(gè)用戶。根據(jù)這k個(gè)用戶對(duì)物品i2的評(píng)分,預(yù)測出u1對(duì)i2的評(píng)分。

在本發(fā)明的第一種推薦方式中,首先利用K最近鄰算法補(bǔ)全每個(gè)用戶的評(píng)分列表,然后進(jìn)行圖3闡述的推薦過程。即,已知用戶對(duì)所有物品的評(píng)分后,選出評(píng)分列表中評(píng)分最高的n個(gè)物品,產(chǎn)生用戶的推薦列表。然后將每個(gè)用戶個(gè)人的推薦列表借助組合學(xué)習(xí)的方法得到組的推薦列表。

本發(fā)明的第二種推薦方式是先將組內(nèi)每個(gè)用戶不完整的評(píng)分列表累加,得到組對(duì)每個(gè)物品的不完整的評(píng)分列表。然后繼續(xù)采用圖2展示的K最近鄰算法,計(jì)算非組A成員與組A的相似度,然后根據(jù)相似度挑選出與組A最相似的k個(gè)用戶。根據(jù)這k個(gè)用戶對(duì)物品的評(píng)分,補(bǔ)全組A的評(píng)分列表,然后進(jìn)行圖3闡述的推薦過程。

本發(fā)明的第三種推薦方式的過程如圖5所示。首先借助圖4所示的矩陣分解方法,將不完整的用戶評(píng)分矩陣分解為用戶因子矩陣和物品因子矩陣。將用戶喜好用特征因子向量表示。根據(jù)組的喜好特征最大程度代表組內(nèi)每個(gè)人的喜好的原則,挑選出有價(jià)值的特征因子,并將用戶因子矩陣中每個(gè)用戶的該特征因子權(quán)重相加,作為組的特征因子向量中該特征的權(quán)重。然后設(shè)函數(shù)產(chǎn)生的結(jié)果為組的評(píng)分列表。然后進(jìn)行圖3闡述的推薦過程。

在得到三個(gè)推薦列表后,進(jìn)行組合學(xué)習(xí)過程。最終得出組A的推薦列表。

組合學(xué)習(xí)過程具體為:首先每個(gè)推薦列表中物品的排序與它們自身的影響力有關(guān),先將每個(gè)物品的影響力歸一化,用0-1之間的數(shù)值表示。然后可以得到每個(gè)物品在不同列表中歸一化后的權(quán)重組成向量每個(gè)推薦列表中物品的排序與它們自身的影響力有關(guān),首先將每個(gè)物品的影響力歸一化,用0-1之間的數(shù)值表示。然后可以得到每個(gè)物品在不同列表中歸一化后的影響力組成向量r=(r1…,rn),rj代表在第j個(gè)推薦列表中物品的歸一化后的影響力。利用物品的影響力向量得出最終物品在列表中所應(yīng)占的影響力,并根據(jù)每個(gè)物品影響力的高低產(chǎn)生一個(gè)組合后的推薦列表。,rj代表在第j個(gè)推薦列表中物品的歸一化后的權(quán)重。利用物品在每個(gè)推薦列表中的權(quán)重得出最終物品在列表中所占的影響力,并根據(jù)每個(gè)物品影響力的高低產(chǎn)生一個(gè)組合后的推薦列表。

以上所述的本發(fā)明的實(shí)施方式,并不構(gòu)成對(duì)本發(fā)明保護(hù)范圍的限定。任何在本發(fā)明的精神原則之內(nèi)所作出的修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā) 明的權(quán)利要求保護(hù)范圍之內(nèi)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1