獲取推薦對象的方法及裝置的制造方法

文檔序號：9217284閱讀：195來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

獲取推薦對象的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域，尤其涉及一種獲取推薦對象的方法及裝置。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展，人們進(jìn)入了信息過載的時(shí)代。在用戶訪問網(wǎng)站的過程中，大量的新聞、商品、視頻、音樂等等對象呈現(xiàn)在了用戶面前。怎樣篩選出用戶真正感興趣的內(nèi)容對提高網(wǎng)站的訪問量及收益有著非常重要的意義。推薦系統(tǒng)相關(guān)的技術(shù)在這樣的背景下得到了越來越廣泛的使用。
[0003] 近幾年來矩陣分解算法成為了推薦系統(tǒng)領(lǐng)域研宄的主流，研宄表明在個(gè)性化推薦中使用矩陣分解技術(shù)可以得到比傳統(tǒng)基于鄰域的協(xié)同過濾更好的結(jié)果。矩陣分解算法將用戶對對象的評分矩陣進(jìn)行分解，生成用戶矩陣U和對象矩陣V，這樣就將用戶和對象映射到了高維的潛語義空間。用戶矩陣及對象矩陣的每一行都是一個(gè)向量，表示相應(yīng)的用戶和對象。用戶向量與一個(gè)對象向量的內(nèi)積就是該用戶對對象的評分，內(nèi)積越大，評分越高，表示越是推薦。每個(gè)用戶的推薦對象可以取所有對象中K個(gè)內(nèi)積最大的對象向量對應(yīng)的對象作為推薦結(jié)果。
[0004] 在實(shí)際應(yīng)用場景中，用戶和對象的數(shù)量往往龐大，相當(dāng)于多達(dá)千萬的用戶都需要在千萬級對象構(gòu)成的高維空間中搜索K個(gè)最大的內(nèi)積，該計(jì)算過程非常耗時(shí)。因此需要一種方案能夠快速地完成用戶和對象向量間最大內(nèi)積的TopK計(jì)算。
[0005] 若采用最基本的線性搜索方法進(jìn)行最近鄰搜索，則時(shí)間復(fù)雜度較高，無法滿足海量數(shù)據(jù)下的需求。常用的解決方案是建立高維索引，利用高效的數(shù)據(jù)結(jié)構(gòu)和算法完成搜索。但是，由于內(nèi)積不滿足三角不等性且無法衡量向量間的相似性，導(dǎo)致常用的聚類、高維索引樹、局部感知哈希等建立高維索引的方案均無法直接適用于內(nèi)積空間的搜索。

【發(fā)明內(nèi)容】

[0006] 有鑒于此，本發(fā)明提供一種獲取推薦對象的方法及裝置，具有搜索速度快，適用范圍廣等優(yōu)點(diǎn)。
[0007] 為實(shí)現(xiàn)上述目的，根據(jù)本發(fā)明的一個(gè)方面，提供了一種獲取推薦對象的方法，包括：構(gòu)建原始用戶矩陣和原始對象矩陣，其中，所述原始用戶矩陣中的每一行為原始用戶向量，每個(gè)所述原始用戶向量表示一個(gè)用戶的多重屬性特征，所述原始對象矩陣中的每一行為原始對象向量，每個(gè)所述原始對象向量表示一個(gè)對象的多重屬性特征；對原始用戶矩陣和原始對象矩陣進(jìn)行保序變換，得到新用戶矩陣和新對象矩陣；對所述新對象矩陣中的新對象向量構(gòu)建對象高維索引結(jié)構(gòu)；對所述新用戶矩陣中的各個(gè)新用戶向量在所述對象高維索引結(jié)構(gòu)中進(jìn)行最近鄰搜索，得到所述新用戶向量對應(yīng)的最近鄰新對象向量；根據(jù)各個(gè)所述新用戶向量及其對應(yīng)的所述最近鄰新對象向量，輸出用戶與推薦對象的映射。
[0008] 可選地，所述對原始用戶矩陣和原始對象矩陣進(jìn)行保序變換，得到新用戶矩陣和新對象矩陣的步驟包括：對所述原始用戶矩陣的第i行向量\添加數(shù)值0作為一個(gè)新的維度，得到新用戶向量A= (O.xf)'從而得到所述新用戶矩陣；計(jì)算所述原始對象矩陣的第j行向量yj的2-范數(shù)以及該2-范數(shù)的最大值少，對所述yj添加_
作為一個(gè)新的維度，得到新對象向量
，從而得到所述新對象矩陣。
[0009] 可選地，所述對所述新對象矩陣中的新對象向量構(gòu)建對象高維索引結(jié)構(gòu)的步驟包括：將所述新對象矩陣中的新對象向量聚類得到多個(gè)對象子類，每個(gè)對象子類具有一個(gè)對象聚類中心；為每個(gè)所述對象子類建立vp-tree樹結(jié)構(gòu)。
[0010] 可選地，所述對所述新用戶矩陣中的各個(gè)新用戶向量在所述對象高維索引結(jié)構(gòu)中進(jìn)行最近鄰搜索，得到所述新用戶向量對應(yīng)的最近鄰新對象向量的步驟包括：將所述對象高維索引結(jié)構(gòu)序列化地保存為對象索引文件并發(fā)送給多個(gè)節(jié)點(diǎn)；在每個(gè)所述節(jié)點(diǎn)上，根據(jù) 所述新對象矩陣和所述對象索引文件重建出所述對象高維索引結(jié)構(gòu)；采用map-reduce技術(shù)，通過hadoop框架在所述多個(gè)節(jié)點(diǎn)中對所述新用戶矩陣中的各個(gè)新用戶向量進(jìn)行最近鄰搜索，得到所述新用戶向量對應(yīng)的最近鄰新對象向量。
[0011] 可選地，所述采用map-reduce技術(shù)，通過hadoop框架在所述多個(gè)節(jié)點(diǎn)中對所述新用戶矩陣中的各個(gè)新用戶向量進(jìn)行最近鄰搜索，得到所述新用戶向量對應(yīng)的所述最近鄰新對象向量的步驟包括：將所述新用戶矩陣均分成多個(gè)新用戶向量組并分發(fā)到所述多個(gè) 節(jié)點(diǎn)，所述hadoop為分發(fā)到各個(gè)節(jié)點(diǎn)的所述新用戶向量組分別建立mapper;在各個(gè)所述 mapper內(nèi)為對應(yīng)的所述新用戶向量組中各個(gè)新用戶向量執(zhí)行以下操作：計(jì)算所述新用戶向量與各個(gè)所述對象聚類中心的歐氏距離，找到歐氏距離最近的所述對象聚類中心，進(jìn)入該歐氏距離最近的對象聚類中心對應(yīng)的vp-tree，通過遞歸遍歷樹完成該vp-tree的最近鄰搜索，得到所述新用戶向量對應(yīng)的最近鄰新對象向量；在reducer中匯總并保存所述新用戶向量與對應(yīng)的所述最近鄰新向量對象的映射關(guān)系。
[0012] 為實(shí)現(xiàn)上述目的，根據(jù)本發(fā)明的另一方面，提供了一種獲取推薦對象的裝置，包括：矩陣構(gòu)建模塊，用于構(gòu)建原始用戶矩陣和原始對象矩陣，其中，所述原始用戶矩陣中的每一行為原始用戶向量，每個(gè)所述原始用戶向量表示一個(gè)用戶的多重屬性特征，所述原始對象矩陣中的每一行為原始對象向量，每個(gè)所述原始對象向量表示一個(gè)對象的多重屬性特征；保序變換模塊，用于對原始用戶矩陣和原始對象矩陣進(jìn)行保序變換，得到新用戶矩陣和新對象矩陣；索引構(gòu)建模塊，用于對所述新對象矩陣中的新對象向量構(gòu)建對象高維索引結(jié) 構(gòu)；搜索模塊，用于對所述新用戶矩陣中的各個(gè)新用戶向量在所述對象高維索引結(jié)構(gòu)中進(jìn) 行最近鄰搜索，得到所述新用戶向量對應(yīng)的最近鄰新對象向量；輸出模塊，用于根據(jù)各個(gè)所述新用戶向量及其對應(yīng)的所述最近鄰新對象向量，輸出用戶與推薦對象的映射。
[0013] 可選地，所述矩陣構(gòu)建模塊還用于：對所述原始用戶矩陣的第i行向量Xi添加數(shù) 值0作為一個(gè)新的維度，得到所述新用戶向量X; = (0,xD'從而得到所述新用戶矩陣；計(jì) 算所述原始對象矩陣的第j行向量h的2-范數(shù)以及該2-范數(shù)的最大值P，對所述h添加
作為一個(gè)新的維度，得到所述新對象向量
，從而得到所述新對象矩陣。
[0014] 可選地，所述索引構(gòu)建模塊還用于：將所述新對象矩陣中的新對象向量聚類，得到多個(gè)對象子類，每個(gè)對象子類具有一個(gè)對象聚類中心；為每個(gè)所述對象子類建立vp-tree 樹結(jié)構(gòu)。
[0015] 可選地，所述搜索模塊還用于：將所述對象高維索引結(jié)構(gòu)序列化地保存為對象索引文件并發(fā)送給多個(gè)節(jié)點(diǎn)；在每個(gè)所述節(jié)點(diǎn)上，根據(jù)所述新對象矩陣和所述對象索引文件重建出所述對象高維索引結(jié)構(gòu)；采用map-reduce技術(shù)，通過hadoop框架在所述多個(gè)節(jié)點(diǎn)中對所述新用戶矩陣中的各個(gè)新用戶向量進(jìn)行最近鄰搜索，得到所述新用戶向量對應(yīng)的所述最近鄰新對象向量。
[0016] 可選地，所述搜索模塊還用于：將所述新用戶矩陣均分成多個(gè)新用戶向量組并分發(fā)到所述多個(gè)節(jié)點(diǎn)，所述hadoop為分發(fā)到各個(gè)節(jié)點(diǎn)的所述新用戶向量組分別建立mapper; 在各個(gè)所述mapper內(nèi)為對應(yīng)的所述新用戶向量組中各個(gè)新用戶向量執(zhí)行以下操作：計(jì) 算所述新用戶向量與各個(gè)所述對象聚類中心的歐氏距離，

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3 4

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：楊德坤;鄭宸;賀煒;王彥明;
技術(shù)所有人：北京京東尚科信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

js獲取調(diào)用方法的對象相關(guān)技術(shù)

js獲取對象的方法相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

獲取推薦對象的方法及裝置的制造方法