一種確定推薦圖片的方法及裝置制造方法
【專利摘要】本發(fā)明提供了一種確定推薦圖片的方法及裝置,其中所述方法包括:預先獲取圖片集合中的圖片在預設的屬性下的特征以及網(wǎng)站中的頁面在所述屬性下的特征;預測當前用戶在所述網(wǎng)站訪問的當前頁面對應的后繼點擊頁面;根據(jù)所述當前用戶對歷史推薦圖片的評價對所述后繼點擊頁面的特征進行修正;計算所述后繼點擊頁面經(jīng)修正的特征與所述圖片集合中的圖片特征之間的相似度,并將所述相似度超過預設第一閾值的圖片作為向所述當前用戶提供的推薦圖片。通過上述方式,本發(fā)明可以實現(xiàn)用戶在網(wǎng)頁瀏覽時進行圖片的精準推薦。
【專利說明】一種確定推薦圖片的方法及裝置 【【技術領域】】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)技術,特別涉及一種確定推薦圖片的方法及裝置。 【【背景技術】】
[0002] 圖片推薦在圖片搜索領域有著廣泛應用,準確的推薦圖片能夠幫助用戶盡快找到 自己所需要的圖片,節(jié)約用戶的搜索時間。
[0003] 現(xiàn)有的圖片推薦技術,通常是根據(jù)圖片的文本信息與查詢關鍵詞之間的匹配程度 決定推薦圖片的,或者是根據(jù)用戶對圖片的歷史點擊記錄、興趣記錄來決定推薦圖片的。這 些方法無法結(jié)合用戶當前瀏覽網(wǎng)頁的情況實現(xiàn)精準的圖片推薦。 【
【發(fā)明內(nèi)容】
】
[0004] 本發(fā)明所要解決的技術問題是提供一種確定推薦圖片的方法及裝置,以實現(xiàn)用戶 在網(wǎng)頁瀏覽時進行圖片的精準推薦。
[0005] 本發(fā)明為解決技術問題而采用的技術方案是提供一種確定推薦圖片的方法,包 括:預先獲取圖片集合中的圖片在預設的屬性下的特征以及網(wǎng)站中的頁面在所述屬性下的 特征;預測當前用戶在所述網(wǎng)站訪問的當前頁面對應的后繼點擊頁面;根據(jù)所述當前用戶 對歷史推薦圖片的評價對所述后繼點擊頁面的特征進行修正;計算所述后繼點擊頁面經(jīng)修 正的特征與所述圖片集合中的圖片特征之間的相似度,并將所述相似度超過預設第一閾值 的圖片作為向所述當前用戶提供的推薦圖片。
[0006] 根據(jù)本發(fā)明之一優(yōu)選實施例,預測當前用戶訪問的當前頁面對應的后繼點擊頁面 的步驟包括:分別獲取對所述網(wǎng)站的訪問用戶進行聚類的結(jié)果和對所述網(wǎng)站中的頁面進行 聚類的結(jié)果,其中所述訪問用戶的聚類結(jié)果中,相同的用戶類別具有相同的訪問模式,所述 網(wǎng)站頁面的聚類結(jié)果中,相同的頁面類別被具有相同訪問模式的用戶所訪問;確定所述當 前用戶所屬的用戶類別,并將該類別用戶訪問的頁面作為第一頁面子集;確定所述當前頁 面所屬的頁面類別,并將該類別頁面作為第二頁面子集;確定所述當前頁面對應的各條頻 繁訪問路徑,并將各條頻繁訪問路徑的終止節(jié)點對應頁面作為第三頁面子集,其中所述當 前頁面對應的頻繁訪問路徑是指從所述當前頁面出發(fā)到所述網(wǎng)站的其他頁面的路徑中,終 止節(jié)點對應頁面通過最短路徑獲取到的點擊數(shù)與所述網(wǎng)站的所有頁面點擊數(shù)的和之間的 比值大于預設第二閾值的路徑;將所述第一頁面子集、第二頁面子集及第三頁面子集的交 集頁面作為所述當前頁面的后繼點擊頁面。
[0007] 根據(jù)本發(fā)明之一優(yōu)選實施例,根據(jù)所述當前用戶對歷史推薦圖片的評價對所述后 繼點擊頁面的特征進行修正的步驟中,采用下列公式對所述后繼點擊頁面的特征進行修 其中 T (page)' 表示修正后的后繼點擊頁面的特征,T(page)表示修正前的后繼點擊頁面的特征, ?\ (picture)表示歷史第i次向所述當前用戶推薦的圖片的特征,Si表示所述當前用戶對歷 史第i次推薦圖片的評價,η表示向所述當前用戶推薦圖片的總次數(shù),y為[0, 1]區(qū)間的實 數(shù)。
[0008] 根據(jù)本發(fā)明之一優(yōu)選實施例,所述方法進一步包括:在向所述當前用戶提供推薦 圖片前,獲取用戶的網(wǎng)絡條件,并將所述相似度超過所述第一閾值的圖片中與所述網(wǎng)絡條 件不匹配的圖片過濾掉。
[0009] 根據(jù)本發(fā)明之一優(yōu)選實施例,所述屬性至少包括以下類型中的一種:時間類型、地 理類型、領域類型和與時效相關的類型。
[0010] 本發(fā)明還提供了一種確定推薦圖片的裝置,包括:特征獲取單元,用于預先獲取圖 片集合中的圖片在預設的屬性下的特征以及網(wǎng)站中的頁面在所述屬性下的特征;預測單 元,用于預測當前用戶在所述網(wǎng)站訪問的當前頁面對應的后繼點擊頁面;修正單元,用于根 據(jù)所述當前用戶對歷史推薦圖片的評價對所述后繼點擊頁面的特征進行修正;相似度計算 單元,用于計算所述后繼點擊頁面經(jīng)修正的特征與所述圖片集合中的圖片特征之間的相似 度,并將所述相似度超過預設第一閾值的圖片作為向所述當前用戶提供的推薦圖片。
[0011] 根據(jù)本發(fā)明之一優(yōu)選實施例,所述預測單元包括:獲取聚類結(jié)果單元,用于分別獲 取對所述網(wǎng)站的訪問用戶進行聚類的結(jié)果和對所述網(wǎng)站中的頁面進行聚類的結(jié)果,其中所 述訪問用戶的聚類結(jié)果中,相同的用戶類別具有相同的訪問模式,所述網(wǎng)站頁面的聚類結(jié) 果中,相同的頁面類別被具有相同訪問模式的用戶所訪問;第一確定單元,用于確定所述當 前用戶所屬的用戶類別,并將該類別用戶訪問的頁面作為第一頁面子集;第二確定單元,用 于確定所述當前頁面所屬的頁面類別,并將該類別頁面作為第二頁面子集;第三確定單元, 用于確定所述當前頁面對應的各條頻繁訪問路徑,并將各條頻繁訪問路徑的終止節(jié)點對應 頁面作為第三頁面子集,其中所述當前頁面對應的頻繁訪問路徑是指從所述當前頁面出發(fā) 到所述網(wǎng)站的其他頁面的路徑中,終止節(jié)點對應頁面通過最短路徑獲取到的點擊數(shù)與所述 網(wǎng)站的所有頁面點擊數(shù)的和之間的比值大于預設第二閾值的路徑;交集單元,用于將所述 第一頁面子集、第二頁面子集及第三頁面子集的交集頁面作為所述當前頁面的后繼點擊頁 面。
[0012] 根據(jù)本發(fā)明之一優(yōu)選實施例,所述修正單元采用下列公式對所述后繼點擊頁面的 特征進行修正:
[0013]
【權利要求】
1. 一種確定推薦圖片的方法,包括: 預先獲取圖片集合中的圖片在預設的屬性下的特征以及網(wǎng)站中的頁面在所述屬性下 的特征; 預測當前用戶在所述網(wǎng)站訪問的當前頁面對應的后繼點擊頁面; 根據(jù)所述當前用戶對歷史推薦圖片的評價對所述后繼點擊頁面的特征進行修正; 計算所述后繼點擊頁面經(jīng)修正的特征與所述圖片集合中的圖片特征之間的相似度,并 將所述相似度超過預設第一閾值的圖片作為向所述當前用戶提供的推薦圖片。
2. 根據(jù)權利要求1所述的方法,其特征在于,預測當前用戶訪問的當前頁面對應的后 繼點擊頁面的步驟包括: 分別獲取對所述網(wǎng)站的訪問用戶進行聚類的結(jié)果和對所述網(wǎng)站中的頁面進行聚類的 結(jié)果,其中所述訪問用戶的聚類結(jié)果中,相同的用戶類別具有相同的訪問模式,所述網(wǎng)站頁 面的聚類結(jié)果中,相同的頁面類別被具有相同訪問模式的用戶所訪問; 確定所述當前用戶所屬的用戶類別,并將該類別用戶訪問的頁面作為第一頁面子集; 確定所述當前頁面所屬的頁面類別,并將該類別頁面作為第二頁面子集; 確定所述當前頁面對應的各條頻繁訪問路徑,并將各條頻繁訪問路徑的終止節(jié)點對應 頁面作為第三頁面子集,其中所述當前頁面對應的頻繁訪問路徑是指從所述當前頁面出發(fā) 到所述網(wǎng)站的其他頁面的路徑中,終止節(jié)點對應頁面通過最短路徑獲取到的點擊數(shù)與所述 網(wǎng)站的所有頁面點擊數(shù)的和之間的比值大于預設第二閾值的路徑; 將所述第一頁面子集、第二頁面子集及第三頁面子集的交集頁面作為所述當前頁面的 后繼點擊頁面。
3. 根據(jù)權利要求1所述的方法,其特征在于,根據(jù)所述當前用戶對歷史推薦圖片的評 價對所述后繼點擊頁面的特征進行修正的步驟中,采用下列公式對所述后繼點擊頁面的特 征進行修正:
其中 T (page)' 表示修正后的后繼點擊頁面的特征,T(page)表示修正前的后繼點擊頁面的特征, ?\ (picture)表示歷史第i次向所述當前用戶推薦的圖片的特征,Si表示所述當前用戶對歷 史第i次推薦圖片的評價,η表示向所述當前用戶推薦圖片的總次數(shù),y為[0, 1]區(qū)間的實 數(shù)。
4. 根據(jù)權利要求1所述的方法,其特征在于,所述方法進一步包括:在向所述當前用戶 提供推薦圖片前,獲取用戶的網(wǎng)絡條件,并將所述相似度超過所述第一閾值的圖片中與所 述網(wǎng)絡條件不匹配的圖片過濾掉。
5. 根據(jù)權利要求1所述的方法,其特征在于,所述屬性至少包括以下類型中的一種:時 間類型、地理類型、領域類型和與時效相關的類型。
6. -種確定推薦圖片的裝置,包括: 特征獲取單元,用于預先獲取圖片集合中的圖片在預設的屬性下的特征以及網(wǎng)站中的 頁面在所述屬性下的特征; 預測單元,用于預測當前用戶在所述網(wǎng)站訪問的當前頁面對應的后繼點擊頁面; 修正單元,用于根據(jù)所述當前用戶對歷史推薦圖片的評價對所述后繼點擊頁面的特征 進行修正; 相似度計算單元,用于計算所述后繼點擊頁面經(jīng)修正的特征與所述圖片集合中的圖片 特征之間的相似度,并將所述相似度超過預設第一閾值的圖片作為向所述當前用戶提供的 推薦圖片。
7. 根據(jù)權利要求6所述的裝置,其特征在于,所述預測單元包括: 獲取聚類結(jié)果單元,用于分別獲取對所述網(wǎng)站的訪問用戶進行聚類的結(jié)果和對所述網(wǎng) 站中的頁面進行聚類的結(jié)果,其中所述訪問用戶的聚類結(jié)果中,相同的用戶類別具有相同 的訪問模式,所述網(wǎng)站頁面的聚類結(jié)果中,相同的頁面類別被具有相同訪問模式的用戶所 訪問; 第一確定單元,用于確定所述當前用戶所屬的用戶類別,并將該類別用戶訪問的頁面 作為第一頁面子集; 第二確定單元,用于確定所述當前頁面所屬的頁面類別,并將該類別頁面作為第二頁 面子集; 第三確定單元,用于確定所述當前頁面對應的各條頻繁訪問路徑,并將各條頻繁訪問 路徑的終止節(jié)點對應頁面作為第三頁面子集,其中所述當前頁面對應的頻繁訪問路徑是指 從所述當前頁面出發(fā)到所述網(wǎng)站的其他頁面的路徑中,終止節(jié)點對應頁面通過最短路徑獲 取到的點擊數(shù)與所述網(wǎng)站的所有頁面點擊數(shù)的和之間的比值大于預設第二閾值的路徑; 交集單元,用于將所述第一頁面子集、第二頁面子集及第三頁面子集的交集頁面作為 所述當前頁面的后繼點擊頁面。
8. 根據(jù)權利要求6所述的裝置,其特征在于,所述修正單元采用下列公式對所述后繼 點擊頁面的特征進行修正:
其中 T(pageV表示修正后的后繼點擊頁面的特征,T(page)表示修正前的后繼點擊頁面的特 征,?\ (picture)表示歷史第i次向所述當前用戶推薦的圖片的特征,Si表示所述當前用戶 對歷史第i次推薦圖片的評價,η表示向所述當前用戶推薦圖片的總次數(shù),y為[0, 1]區(qū)間 的實數(shù)。
9. 根據(jù)權利要求6所述的裝置,其特征在于,所述裝置進一步包括: 過濾單元,用于在向所述當前用戶提供推薦圖片前,獲取用戶的網(wǎng)絡條件,并將所述相 似度超過預設第一閾值的圖片中與所述網(wǎng)絡條件不匹配的圖片過濾掉。
10. 根據(jù)權利要求6所述的裝置,其特征在于,所述屬性至少包括以下一類型中的一 種:時間類型、地理類型、領域類型和與時效相關的類型。
【文檔編號】G06F17/30GK104123321SQ201310156965
【公開日】2014年10月29日 申請日期:2013年4月28日 優(yōu)先權日:2013年4月28日
【發(fā)明者】劉鑫 申請人:百度在線網(wǎng)絡技術(北京)有限公司