并不排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。
[0193] 雖然通過參照本發(fā)明的某些優(yōu)選實施方式,已經對本發(fā)明進行了圖示和描述,但 本領域的普通技術人員應該明白,可W在形式上和細節(jié)上對其作各種改變,而不偏離本發(fā) 明的精神和范圍。
【主權項】
1. 一種基于計算機系統(tǒng)的推薦方法,其特征在于,該方法包括以下步驟: 獲取各用戶對各項目的項目評分記錄; 根據每個用戶的項目評分記錄進行聚類,將用戶特征數據劃分到R個類別中,R是大于 1的整數; 在每個所述類別的用戶特征數據中,基于項目為目標用戶推薦項目。2. 根據權利要求1所述的基于計算機系統(tǒng)的推薦方法,其特征在于,所述計算機系統(tǒng) 包括至少兩個計算節(jié)點; 所述"在每個所述類別的用戶特征數據中,基于項目為目標用戶推薦項目"的步驟中, 將各所述類別的用戶特征數據分配給多個計算節(jié)點,每個計算節(jié)點最多保存R - 1個所述 類別的用戶特征數據,每個計算節(jié)點在所保存的每個所述類別的用戶特征數據中基于項目 為目標用戶推薦項目。3. 根據權利要求1所述的基于計算機系統(tǒng)的推薦方法,其特征在于,所述"在每個所述 類別的用戶特征數據中,基于項目為目標用戶推薦項目"的步驟中,采用基于項目的協(xié)同過 濾算法為目標用戶推薦項目; 所述"在每個所述類別的用戶特征數據中,基于項目為目標用戶推薦項目"的步驟中包 括以下子步驟: 根據所述類別中每個用戶的項目評分記錄,計算所述類別中所有項目間相似度,并為 每個項目選取相似度最高的Μ個項目,Μ為預定義的整數; 根據所述類別中所述目標用戶的項目評分記錄,為所述目標用戶選取評分最高的Τ個 項目,Τ為預定義的整數; 將為所述目標用戶選取的Τ個項目與為所述Τ個項目中每個項目選取的Μ個項目相結 合,并從中去除所述目標用戶的項目列表中的項目,形成初始推薦結果。4. 根據權利要求3所述的基于計算機系統(tǒng)的推薦方法,其特征在于,在形成初始推薦 結果的子步驟后還包括以下子步驟: 判斷所述初始推薦結果中的項目數量是否大于Ν,Ν為預定義的整數; 若所述初始推薦結果中的項目數量大于Ν,則從所述初始推薦結果中選取相似度最高 的Ν個項目推薦給所述目標用戶; 若所述初始推薦結果中的項目數量小于Ν,則將所述目標用戶的項目列表中的所有項 目與為所述目標用戶的項目列表中每個項目選取的Μ個項目相結合,并從中去除所述目標 用戶的項目列表中的所有項目,形成用戶數據補全推薦結果。5. 根據權利要求4所述的基于計算機系統(tǒng)的推薦方法,其特征在于,在形成用戶數據 補全推薦結果的子步驟后還包括以下子步驟: 判斷所述用戶數據補全推薦結果中的項目數量是否大于Ν,Ν為預定義的整數; 若所述用戶數據補全推薦結果中的項目數量大于Ν,則從所述用戶數據補全推薦結果 中選取相似度最高的Ν個項目推薦給所述目標用戶; 若所述用戶數據補全推薦結果中的項目數量小于Ν,則將所述目標用戶的項目列表中 的所有項目與和所述目標用戶的項目列表中每個項目具有相似度關系的所有項目相結合, 并從中去除所述目標用戶的項目列表中的所有項目,形成項目數據補全推薦結果。6. 根據權利要求1所述的基于計算機系統(tǒng)的推薦方法,其特征在于,所述"在每個所述 類別的用戶特征數據中,基于項目為目標用戶推薦項目"的步驟后還包括以下步驟: 判斷數據稀疏度是否大于數據稀疏度閾值,所述數據稀疏房,其中k為 計算得到的所述類別中具有相似度關系的項目對的數量,1為所述類別中項目的數量,若所述數據稀疏度小于數據稀疏度閾值,則以第一項目、第二項目和第三項目為一組, 所述第一項目與所述第二項目間、所述第二項目與所述第三項目間具有相似度關系,通過 所述第二項目為所述第一項目和所述第三項目建立相似度關系,并根據補充的項目間相似 度關系在所述類別中再次基于項目為所述目標用戶推薦項目; 若所述數據稀疏度大于數據稀疏度閾值,則將基于項目計算得到的推薦項目推薦給所 述目標用戶。7. 根據權利要求1至6中任一項所述的基于計算機系統(tǒng)的推薦方法,其特征在于,所 述"根據每個用戶的項目評分記錄進行聚類,將用戶特征數據劃分到R個類別中,R是大于 1的整數"的步驟前還包括以下步驟: 判斷用戶數量是否大于用戶規(guī)模閾值; 若所述用戶數量小于用戶規(guī)模閾值,則直接在所有用戶特征數據中基于項目為目標用 戶推薦項目; 若所述用戶數量大于用戶規(guī)模閾值,則進入"根據每個用戶的項目評分記錄進行聚類, 將用戶特征數據劃分到R個類別中,R是大于1的整數"的步驟。8. -種基于計算機系統(tǒng)的推薦裝置,其特征在于,所述裝置包括: 用戶項目初始關系計算模塊,用于獲取各用戶對各項目的項目評分記錄; 聚類模塊,用于根據所述用戶項目初始關系計算模塊獲取的每個用戶的項目評分記錄 進行聚類,將用戶特征數據劃分到R個類別中,R是大于1的整數;以及 推薦模塊,用于在所述聚類模塊所劃分的每個所述類別的用戶特征數據中,基于項目 為目標用戶推薦項目。9. 根據權利要求8所述的基于計算機系統(tǒng)的推薦裝置,其特征在于,所述計算機系統(tǒng) 包括至少兩個計算節(jié)點; 所述推薦模塊用于將各所述類別的用戶特征數據分配給多個計算節(jié)點,每個計算節(jié)點 最多保存R - 1個所述類別的用戶特征數據,每個計算節(jié)點在所保存的每個所述類別的用 戶特征數據中基于項目為目標用戶推薦項目。10. 根據權利要求8所述的基于計算機系統(tǒng)的推薦裝置,其特征在于,所述推薦模塊采 用基于項目的協(xié)同過濾算法為目標用戶推薦項目; 所述推薦模塊包括: 項目相似度子模塊,用于根據所述類別中每個用戶的項目評分記錄,計算所述類別中 所有項目間相似度,并為每個項目選取相似度最高的Μ個項目,Μ為預定義的整數; 用戶推薦子模塊,用于根據所述類別中所述目標用戶的項目評分記錄,為所述目標用 戶選取評分最高的Τ個項目,Τ為預定義的整數;以及 初始推薦子模塊,用于將所述用戶推薦子模塊為所述目標用戶選取的Τ個項目與所述 項目相似度子模塊為所述T個項目中每個項目選取的Μ個項目相結合,并從中去除所述目 標用戶的項目列表中的項目,形成初始推薦結果。11. 根據權利要求10所述的基于計算機系統(tǒng)的推薦裝置,其特征在于,所述推薦模塊 還包括: 初始推薦判斷子模塊,用于判斷所述初始推薦子模塊所形成的初始推薦結果中的項目 數量是否大于Ν,Ν為預定義的整數; 初始推薦篩選子模塊,用于若所述初始推薦判斷子模塊確認所述初始推薦結果中的項 目數量大于Ν,從所述初始推薦結果中選取相似度最高的Ν個項目推薦給所述目標用戶;以 及 用戶數據規(guī)模還原子模塊,用于若所述初始推薦判斷子模塊確認所述初始推薦結果中 的項目數量小于Ν,則將所述目標用戶的項目列表中的所有項目與為所述目標用戶的項目 列表中每個項目選取的Μ個項目相結合,并從中去除所述目標用戶的項目列表中的所有項 目,形成用戶數據補全推薦結果。12. 根據權利要求11所述的基于計算機系統(tǒng)的推薦裝置,其特征在于,所述推薦模塊 還包括: 補全推薦判斷子模塊,用于判斷所述用戶數據規(guī)模還原子模塊所形成的用戶數據補全 推薦結果中的項目數量是否大于Ν,Ν為預定義的整數; 補全推薦篩選子模塊,用于若所述補全推薦判斷子模塊確認所述用戶數據補全推薦結 果中的項目數量大于Ν,從所述用戶數據補全推薦結果中選取相似度最高的Ν個項目推薦 給所述目標用戶;以及 項目數據規(guī)模還原子模塊,用于若所述補全推薦判斷子模塊確認所述用戶數據補全推 薦結果中的項目數量小于Ν,則將所述目標用戶的項目列表中的所有項目與和所述目標用 戶的項目列表中每個項目具有相似度關系的所有項目相結合,并從中去除所述目標用戶的 項目列表中的所有項目,形成項目數據補全推薦結果。13. 根據權利要求8所述的基于計算機系統(tǒng)的推薦裝置,其特征在于,所述裝置還包 括: 推薦結果數據稀疏度判斷模塊,用于判斷數據稀疏度是否大于數據稀疏度閾值,所述 數據稀疏度= ,其中k為計算得到的所述類別中具有相似度關系的項目對的數 量,1為所述類別中項目的數量以及 數據稀疏補全模塊,用于若所述推薦結果數據稀疏度判斷模塊確認所述數據稀疏度小 于數據稀疏度閾值,則以第一項目、第二項目和第三項目為一組,所述第一項目與所述第二 項目間、所述第二項目與所述第三項目間具有相似度關系,通過所述第二項目為所述第一 項目和所述第三項目建立相似度關系; 所述推薦模塊用于根據所述數據稀疏補全模塊所補充的項目間相似度關系在所述類 別中再次基于項目為所述目標用戶推薦項目,并且若所述推薦結果數據稀疏度判斷模塊確 認所述數據稀疏度大于數據稀疏度閾值,則將基于項目計算得到的推薦項目推薦給所述目 標用戶。14.根據權利要求8至13中任一項所述的基于計算機系統(tǒng)的推薦裝置,其特征在于,所 述裝置還包括用戶規(guī)模判斷模塊,用于在所述聚類模塊聚類前,判斷用戶數量是否大于用 戶規(guī)模閾值; 所述推薦模塊用于若所述用戶規(guī)模判斷模塊確認所述用戶數量小于用戶規(guī)模閾值,則 直接在所有用戶特征數據中基于項目為目標用戶推薦項目; 所述聚類模塊用于若所述用戶規(guī)模判斷模塊確認所述用戶數量大于用戶規(guī)模閾值,則 根據每個用戶的項目評分記錄進行聚類,將用戶特征數據劃分到R個類別中,R是大于1的 整數。
【專利摘要】本發(fā)明涉及以計算機系統(tǒng)實現的推薦技術,公開了一種基于計算機系統(tǒng)的推薦方法及其裝置。在本發(fā)明的推薦方法中,先根據每個用戶的項目評分記錄進行聚類,將用戶特征數據劃分到多個類別中,再在每個類別的用戶特征數據中基于項目為目標用戶推薦項目,可以在大數據下實現高效的推薦方法,保證了系統(tǒng)的穩(wěn)定性和推薦的多樣性。此外,每個計算節(jié)點不需要保存所有類別的用戶特征數據,避免了內存不足的問題。
【IPC分類】G06F17/30
【公開號】CN105718488
【申請?zhí)枴緾N201410736666
【發(fā)明人】潘曉彤, 金柯, 劉忠義, 魏虎
【申請人】阿里巴巴集團控股有限公司
【公開日】2016年6月29日
【申請日】2014年12月4日
【公告號】WO2016086802A1