專利名稱:一種融合項(xiàng)目相關(guān)性的基于pmf的協(xié)同過濾推薦系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種融合了協(xié)同標(biāo)簽項(xiàng)目相關(guān)性的基于PMFO^robabilisticMatrix !factorization,概率矩陣因式分解)的協(xié)同過濾推薦系統(tǒng),適用于推薦結(jié)果的優(yōu)化,屬于 數(shù)據(jù)挖掘的技術(shù)領(lǐng)域。
背景技術(shù):
社會(huì)標(biāo)簽網(wǎng)絡(luò)的提出,使協(xié)同過濾推薦系統(tǒng)有了除用戶-項(xiàng)目評(píng)分?jǐn)?shù)據(jù)矩陣以外 的另一個(gè)推薦參考標(biāo)準(zhǔn)?,F(xiàn)有的基于評(píng)分相似度的K近鄰模型和FR(F指社會(huì)標(biāo)簽網(wǎng)絡(luò)過 濾,R指推薦偏差移除)方法都對(duì)協(xié)同過濾推薦系統(tǒng)進(jìn)行了優(yōu)化?;陔[向量模型的協(xié)同過濾算法,與基于評(píng)分相似度的K近鄰模型相比,其存貯 和計(jì)算復(fù)雜度相對(duì)較低,并能較好地對(duì)已知的用戶-項(xiàng)目評(píng)分?jǐn)?shù)據(jù)中的潛在關(guān)系進(jìn)行詮 釋;同時(shí)具備較高的推薦精度。但是,現(xiàn)有的基于隱向量模型的協(xié)同過濾算法,其推薦結(jié)果 往往只基于已知的用戶-項(xiàng)目評(píng)分?jǐn)?shù)據(jù)產(chǎn)生;通過上一章的研究,我們可以看到,在基于評(píng) 分相似度的K近鄰模型中,融入社會(huì)標(biāo)簽數(shù)據(jù)的信息,將會(huì)有效地提高推薦結(jié)果的質(zhì)量 ’類 似地,我們同樣可以通過融入社會(huì)標(biāo)簽數(shù)據(jù)信息的方式,來提高基于隱向量模型的協(xié)同過 濾算法的推薦精度。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題克服現(xiàn)有技術(shù)的不足,提供一種融合了協(xié)同標(biāo)簽項(xiàng)目 相關(guān)性的基于PMF的協(xié)同過濾推薦系統(tǒng),著重于討論從社會(huì)化標(biāo)簽數(shù)據(jù)中挖掘項(xiàng)目間的聯(lián) 系,并將其與用戶-項(xiàng)目評(píng)分?jǐn)?shù)據(jù)中相結(jié)合,以達(dá)到提高推薦質(zhì)量的目的。本發(fā)明的技術(shù)解決方案一種融合了協(xié)同標(biāo)簽項(xiàng)目相關(guān)性的基于PMF的協(xié)同過濾 推薦系統(tǒng),包括對(duì)用戶-項(xiàng)目評(píng)分?jǐn)?shù)據(jù)的概率矩陣因式分解隱向量分析、融入社會(huì)標(biāo)簽因 素的使用PMF對(duì)社會(huì)標(biāo)簽網(wǎng)絡(luò)分析和基于不同數(shù)據(jù)源的隱向量融合三個(gè)部分。對(duì)用戶-項(xiàng) 目評(píng)分?jǐn)?shù)據(jù)的概率矩陣因式分解是基于已知的用戶-項(xiàng)目評(píng)分?jǐn)?shù)據(jù),利用PMF對(duì)用戶-項(xiàng) 目評(píng)分矩陣進(jìn)行隱向量分析,再使用構(gòu)造出的隱向量進(jìn)行推薦。PMF對(duì)社會(huì)標(biāo)簽網(wǎng)絡(luò)分析 是沿用之前提出的社會(huì)標(biāo)簽網(wǎng)絡(luò)模型從社會(huì)標(biāo)簽數(shù)據(jù)中抽取社會(huì)標(biāo)簽數(shù)據(jù)中項(xiàng)間的關(guān)系, 并使用PMF方法對(duì)社會(huì)標(biāo)簽網(wǎng)絡(luò)模型進(jìn)行隱向量分析,最后通過在基于不同數(shù)據(jù)源的隱向 量模型上共享隱向量空間的方式,將社會(huì)標(biāo)簽數(shù)據(jù)信息和用戶-項(xiàng)目評(píng)分?jǐn)?shù)據(jù)信息進(jìn)行融
I=I O下面對(duì)本發(fā)明的技術(shù)方案做詳細(xì)的說明一種融合了協(xié)同標(biāo)簽項(xiàng)目相關(guān)性的基于 PMF的協(xié)同過濾推薦系統(tǒng),具體如下(一)使用PMF對(duì)用戶-項(xiàng)目評(píng)分矩陣進(jìn)行隱向量分析系統(tǒng)首先在給定的包含I I I個(gè)項(xiàng)目的社會(huì)標(biāo)簽數(shù)據(jù)上建立的社會(huì)標(biāo)簽網(wǎng)絡(luò)模型, 使用鄰接矩陣Fe Rlllxl11表示,其中元素fy表示項(xiàng)目i和j之間的社會(huì)標(biāo)簽相關(guān)度。( 二)融入社會(huì)標(biāo)簽因素的使用PMF對(duì)社會(huì)標(biāo)簽網(wǎng)絡(luò)分析
系統(tǒng)使用PMF對(duì)鄰接矩陣F進(jìn)行因式分解,得到每個(gè)項(xiàng)目在社會(huì)標(biāo)簽數(shù)據(jù)中的特 征信息。令Y、Q均為IllXf的矩陣,各自代表f維的項(xiàng)目隱特征矩陣,其中Y是前置項(xiàng)目 隱特征矩陣,Q是后置項(xiàng)目隱特征矩陣,并使用yi -Qj對(duì)F中的元素進(jìn)行逼近,得到F中 的已知值關(guān)于Y和Q的條件分布。(三)基于兩種數(shù)據(jù)源的隱向量融合通過在基于不同數(shù)據(jù)源的隱向量模型上共享隱向量空間的方式,將社會(huì)標(biāo)簽數(shù)據(jù) 信息和用戶-項(xiàng)目評(píng)分?jǐn)?shù)據(jù)信息進(jìn)行融合,進(jìn)而構(gòu)造同時(shí)依賴于社會(huì)標(biāo)簽網(wǎng)絡(luò)信息和用 戶-項(xiàng)目特征信息的累積損失函數(shù),更好地通過已知數(shù)據(jù)預(yù)測(cè)出未知數(shù)據(jù)的評(píng)分信息,從 而達(dá)到提高推薦精度的目的。關(guān)鍵技術(shù)是PMF,即概率矩陣因式分解,是一種使用高斯函數(shù)對(duì)隱向量進(jìn)行擬和, 再使用似然構(gòu)造全局損失函數(shù),從而實(shí)現(xiàn)對(duì)指定矩陣進(jìn)行隱向量分析的因式分解技術(shù)。所 述(一)中使用PMF對(duì)用戶-項(xiàng)目評(píng)分矩陣進(jìn)行隱向量分析時(shí),令P、Q分別為|U|Xf和
11 χ f的矩陣,代表f維的用戶隱特征矩陣和項(xiàng)目隱特征矩陣;令ru, J e R代表用戶U對(duì) 項(xiàng)目j的評(píng)分;代入具備高斯觀測(cè)噪聲的線性似然模型,則使用用戶隱特征矩陣和項(xiàng)目 隱特征矩陣對(duì)用戶-項(xiàng)目評(píng)分矩陣R進(jìn)行逼近時(shí),可以得到用戶-項(xiàng)目評(píng)分矩陣R關(guān)于 用戶隱特征和項(xiàng)目隱特征的條件分布?;赑MF的隱向量模型(以下簡(jiǎn)稱PMF模型)由 Salakhutdinov等提出,其基本思想是基于已知的用戶-項(xiàng)目評(píng)分?jǐn)?shù)據(jù)T,利用PMF對(duì)用 戶-項(xiàng)目評(píng)分矩陣R進(jìn)行隱向量分析,再使用構(gòu)造出的隱向量進(jìn)行推薦。本發(fā)明的優(yōu)點(diǎn)及功效在于(1)采用社會(huì)標(biāo)簽網(wǎng)絡(luò)模型從社會(huì)標(biāo)簽數(shù)據(jù)中抽取社 會(huì)標(biāo)簽數(shù)據(jù)中項(xiàng)目的關(guān)系;( 使用PMF方法對(duì)社會(huì)標(biāo)簽網(wǎng)絡(luò)模型進(jìn)行隱向量分析,通過在 基于不同數(shù)據(jù)源的隱向量模型上共享隱向量空間的方式,將社會(huì)標(biāo)簽數(shù)據(jù)信息和用戶-項(xiàng) 目評(píng)分?jǐn)?shù)據(jù)信息進(jìn)行融合分析;(3)能夠充分挖掘用戶-項(xiàng)目之間的關(guān)系,提高了協(xié)同過濾 推薦系統(tǒng)推薦的精度。
圖1是使用PMF對(duì)用戶-項(xiàng)目評(píng)分矩陣進(jìn)行分解的模型圖示圖2是使用PMF對(duì)社會(huì)標(biāo)簽網(wǎng)絡(luò)進(jìn)行分解的模型圖示圖3是基于兩種不同數(shù)據(jù)源的隱向量模型融合后的模型圖示
具體實(shí)施例方式1.使用PMF對(duì)用戶-項(xiàng)目評(píng)分矩陣進(jìn)行隱向量分析使用PMF對(duì)用戶-項(xiàng)目評(píng)分矩陣進(jìn)行隱向量分析時(shí),令P、Q分別和 11 X f的矩陣,代表f維的用戶隱特征矩陣和項(xiàng)目隱特征矩陣;令ru, j e R代表用戶u對(duì)
項(xiàng)目j的評(píng)分;代入具備高斯觀測(cè)噪聲的線性似然模型,則使用用戶隱特征矩陣和項(xiàng)目隱 特征矩陣對(duì)用戶-項(xiàng)目評(píng)分矩陣R進(jìn)行逼近時(shí),可以得到用戶-項(xiàng)目評(píng)分矩陣R關(guān)于用戶 隱特征和項(xiàng)目隱特征的條件分布,如下所示
權(quán)利要求
1. 一種融合了協(xié)同標(biāo)簽項(xiàng)目相關(guān)性的基于PMF的協(xié)同過濾推薦系統(tǒng),其特征在于具 體如下(一)使用PMF對(duì)用戶-項(xiàng)目評(píng)分矩陣進(jìn)行隱向量分析系統(tǒng)首先在給定的包含|1|個(gè)項(xiàng)目的社會(huì)標(biāo)簽數(shù)據(jù)上建立的社會(huì)標(biāo)簽網(wǎng)絡(luò)模型,使用 鄰接矩陣F e Rlllxl11表示,其中元素fy表示項(xiàng)目i和j之間的社會(huì)標(biāo)簽相關(guān)度;使用PMF對(duì)用戶-項(xiàng)目評(píng)分矩陣進(jìn)行隱向量分析時(shí),令P、Q分別為|U| Xf和|l|Xf 的矩陣,代表f維的用戶隱特征矩陣和項(xiàng)目隱特征矩陣;令e R代表用戶u對(duì)項(xiàng)目j的 評(píng)分;代入具備高斯觀測(cè)噪聲的線性似然模型,則使用用戶隱特征矩陣和項(xiàng)目隱特征矩陣 對(duì)用戶-項(xiàng)目評(píng)分矩陣R進(jìn)行逼近時(shí),可以得到用戶-項(xiàng)目評(píng)分矩陣R關(guān)于用戶隱特征和 項(xiàng)目隱特
2.根據(jù)權(quán)利要求1所述的一種融合了協(xié)同標(biāo)簽項(xiàng)目相關(guān)性的基于PMF的協(xié)同過濾推 薦系統(tǒng),其特征在于所述的(一)中使用PMF對(duì)用戶-項(xiàng)目評(píng)分矩陣進(jìn)行隱向量分析時(shí), 令P、Q分別為|U| Xf和|l|Xf的矩陣,代表f維的用戶隱特征矩陣和項(xiàng)目隱特征矩陣;令 ru,j e R代表用戶u對(duì)項(xiàng)目j的評(píng)分;代入具備高斯觀測(cè)噪聲的線性似然模型,則使用用戶 隱特征矩陣和項(xiàng)目隱特征矩陣對(duì)用戶-項(xiàng)目評(píng)分矩陣R進(jìn)行逼近時(shí),可以得到用戶-項(xiàng)目 評(píng)分矩陣R關(guān)于用戶隱特征和項(xiàng)目隱特征的條件分布;得出已知的用戶-項(xiàng)目評(píng)分和已知項(xiàng)目社會(huì)標(biāo)簽相關(guān)度關(guān)于隱特征矩陣C、H、B、E、Q 的條件分布如下式所示
全文摘要
本發(fā)明公開了一種融合項(xiàng)目相關(guān)性的基于PMF的協(xié)同過濾推薦系統(tǒng),系統(tǒng)包括對(duì)用戶-項(xiàng)目評(píng)分?jǐn)?shù)據(jù)的概率矩陣因式分解隱向量分析、融入社會(huì)標(biāo)簽因素的使用PMF對(duì)社會(huì)標(biāo)簽網(wǎng)絡(luò)分析和基于兩種數(shù)據(jù)源的隱向量融合三個(gè)部分。對(duì)用戶-項(xiàng)目評(píng)分?jǐn)?shù)據(jù)的概率矩陣因式分解是基于已知的用戶-項(xiàng)目評(píng)分?jǐn)?shù)據(jù),利用PMF對(duì)用戶-項(xiàng)目評(píng)分矩陣進(jìn)行隱向量分析,再使用構(gòu)造出的隱向量進(jìn)行推薦。PMF對(duì)社會(huì)標(biāo)簽網(wǎng)絡(luò)分析是沿用之前提出的社會(huì)標(biāo)簽網(wǎng)絡(luò)模型從社會(huì)標(biāo)簽數(shù)據(jù)中抽取社會(huì)標(biāo)簽數(shù)據(jù)中項(xiàng)間的關(guān)系,并使用PMF方法對(duì)社會(huì)標(biāo)簽網(wǎng)絡(luò)模型進(jìn)行隱向量分析,最后通過在基于不同數(shù)據(jù)源的隱向量模型上共享隱向量空間的方式,將社會(huì)標(biāo)簽數(shù)據(jù)信息和用戶-項(xiàng)目評(píng)分?jǐn)?shù)據(jù)信息進(jìn)行融合,從而達(dá)到提高推薦精度的目的。
文檔編號(hào)G06F17/30GK102129463SQ20111005984
公開日2011年7月20日 申請(qǐng)日期2011年3月11日 優(yōu)先權(quán)日2011年3月11日
發(fā)明者歐陽(yáng)元新, 熊璋, 羅建輝, 羅辛, 顧毅 申請(qǐng)人:北京航空航天大學(xué)