一種網(wǎng)絡(luò)商品推薦方法及裝置制造方法
【專利摘要】本申請公開了一種網(wǎng)絡(luò)商品推薦方法及裝置,包括定位商品圖片的主商品區(qū)域,將主商品區(qū)域劃分為若干局部區(qū)域并分別提取顏色特征;根據(jù)各局部區(qū)域的顏色特征,查找與待查詢商品圖片具有共同性的待推薦商品圖片;在確定的待推薦商品圖片中,匹配出與待查詢商品圖片在顏色搭配上具有高相似度的商品圖片,并作為推薦商品圖片。本申請經(jīng)過兩次相似度篩選,實(shí)現(xiàn)了在顏色搭配上的相似性商品推薦,大大提高了推薦準(zhǔn)確率。進(jìn)一步地,本申請中依賴倒排索引通過搜索完成具有共同性的相似商品圖片的查找,大大提高了海量數(shù)據(jù)處理的速度;而對于耗費(fèi)時(shí)間的顏色搭配比較,僅在少量待推薦商品圖片中完成,因此,本申請方法查詢速度高。
【專利說明】一種網(wǎng)絡(luò)商品推薦方法及裝置
【技術(shù)領(lǐng)域】
[0001] 本申請涉及網(wǎng)絡(luò)購物技術(shù),尤指一種網(wǎng)絡(luò)商品推薦方法及裝置。
【背景技術(shù)】
[0002] 網(wǎng)絡(luò)購物已經(jīng)成為一種常用的購物手段,而在淘寶、天貓等購物網(wǎng)站上存在海量 商品,以供消費(fèi)者挑選,但是,這么海量的商品,消費(fèi)者要找到合意商品的代價(jià)通常很大。當(dāng) 消費(fèi)者對某些商品表達(dá)出傾向性(比如點(diǎn)擊或收藏某個(gè)商品)時(shí),如果能根據(jù)這些商品,自 動(dòng)為其在全網(wǎng)商品中發(fā)掘出相似的商品,將極大地提升消費(fèi)者的購物體驗(yàn),從而為其避免 反復(fù)找尋比價(jià)的過程,縮短購物路徑。特別是,當(dāng)消費(fèi)者選擇的原商品價(jià)位不合適,或尺碼 短缺,或某些細(xì)節(jié)尚不如意時(shí),消費(fèi)者能方便地在推薦商品中繼續(xù)逛起來,以避免跳失,提 高轉(zhuǎn)化率。
[0003] 對于購物網(wǎng)站運(yùn)營來說,經(jīng)常需要制作各種導(dǎo)購欄目、專輯,并要求這些欄目和專 輯中陳列的商品,在設(shè)計(jì)風(fēng)格上具有一致性,符合當(dāng)季營銷的主題。在沒有相似商品推薦引 擎之前,通常需要運(yùn)營手工地在海量商品池中選取,大量耗費(fèi)了人工,且不能保證一定召回 率。通過相似推薦技術(shù),運(yùn)營只需要指定種子商品,相似商品推薦引擎便能快速且準(zhǔn)確地為 其在全網(wǎng)中發(fā)掘相似商品,自動(dòng)形成專輯或欄目,極大地提高了運(yùn)營的工作效率。
[0004] 目前,相似商品推薦技術(shù)有多種實(shí)現(xiàn)方案。最傳統(tǒng)的是基于文本推薦,也就是通過 商品本身的描述文字來建立商品之間的關(guān)聯(lián)。通常,這些文本是由網(wǎng)站賣家自行填寫的,質(zhì) 量參差不齊,往往還會(huì)出現(xiàn)各種亂標(biāo)亂寫的欺詐行為,導(dǎo)致了推薦效果的有限性。
[0005] 另外還有一種業(yè)界流行的推薦解決方案,就是通過用戶行為的關(guān)聯(lián),如看了又看 或買了又買,來為消費(fèi)者推薦商品。其推薦的核心思想是:通過發(fā)掘歷史數(shù)據(jù),找到大部分 同類消費(fèi)者在對這件商品表達(dá)過傾向性行為之后,通常也會(huì)向哪些商品表達(dá)傾向性行為, 來作為推薦的商品。這種技術(shù)確實(shí)能提高轉(zhuǎn)化率,但是,由于其技術(shù)方案并不涉及對商品內(nèi) 容的理解,僅僅是對于消費(fèi)者慣常行為的模仿,導(dǎo)致了其推薦結(jié)果不可控,從而無法確保其 推薦商品的一致性或穩(wěn)定性。比如,無法獲知消費(fèi)者感興趣的商品與推薦商品間的關(guān)聯(lián)性 是由于顏色搭配上、或款式設(shè)計(jì)上、或人為導(dǎo)流量行為、或僅僅是兩個(gè)商品擺放位置相近等 所引起的。因此,這種推薦技術(shù)僅能為消費(fèi)者推薦商品,但無法作為運(yùn)營工具。特別地,這 種推薦技術(shù)需要依賴海量歷史數(shù)據(jù),還會(huì)碰到冷啟動(dòng)或稀疏性等問題,影響了推薦效果。
【發(fā)明內(nèi)容】
[0006] 為了解決上述技術(shù)問題,本申請?zhí)峁┝艘环N網(wǎng)絡(luò)商品推薦方法及裝置,能夠?qū)崿F(xiàn) 在顏色搭配上的相似性商品推薦,大大提高推薦準(zhǔn)確率。
[0007] 為了達(dá)到本申請目的,本申請?zhí)峁┮环N網(wǎng)絡(luò)商品推薦方法,包括:定位商品圖片的 主商品區(qū)域,將主商品區(qū)域劃分為若干局部區(qū)域并分別提取顏色特征;
[0008] 根據(jù)各局部區(qū)域的顏色特征,查找與待查詢商品圖片具有共同性的待推薦商品圖 片;
[0009] 在確定的待推薦商品圖片中,匹配出與待查詢商品圖片在顏色彳合配上具有1?相似 度的商品圖片,并作為推薦商品圖片。
[0010] 所述主商品區(qū)域由高維向量組成;
[0011] 其中,每一維向量對應(yīng)一個(gè)詞頻,并將其概率分布量化為〇?255 ;根據(jù)詞頻為所 述商品圖片建立倒排索引。
[0012] 所述查找與待查詢商品圖片具有共同性的待推薦商品圖片包括:
[0013] 對于待查詢商品圖片P中出現(xiàn)的詞頻,依次訪問對應(yīng)的所述倒排索引條目,根據(jù) 所述待查詢商品圖片P與可推薦商品圖片Q的詞頻所組成的兩個(gè)高維向量在高維空間中的 夾角的余弦值計(jì)算所述待查詢商品圖片P和可推薦商品圖片Q的相似性;
[0014] 根據(jù)計(jì)算得到的結(jié)果,選擇排名在前面的預(yù)設(shè)數(shù)量M個(gè)可推薦商品圖片作為待推 薦商品圖片;其中,M為大于1的整數(shù)。
[0015] 按照下面公式計(jì)算所述待查詢商品圖片P和可推薦商品圖片Q的相似性為:
【權(quán)利要求】
1. 一種網(wǎng)絡(luò)商品推薦方法,其特征在于,包括;定位商品圖片的主商品區(qū)域,將主商品 區(qū)域劃分為若干局部區(qū)域并分別提取顏色特征; 根據(jù)各局部區(qū)域的顏色特征,查找與待查詢商品圖片具有共同性的待推薦商品圖片; 在確定的待推薦商品圖片中,匹配出與待查詢商品圖片在顏色搭配上具有高相似度的 商品圖片,并作為推薦商品圖片。
2. 根據(jù)權(quán)利要求1所述的網(wǎng)絡(luò)商品推薦方法,其特征在于,所述主商品區(qū)域由高維向 量組成; 其中,每一維向量對應(yīng)一個(gè)詞頻,并將其概率分布量化為0?255 ;根據(jù)詞頻為所述商 品圖片建立倒排索引。
3. 根據(jù)權(quán)利要求2所述的網(wǎng)絡(luò)商品推薦方法,其特征在于,所述查找與待查詢商品圖 片具有共同性的待推薦商品圖片包括: 對于待查詢商品圖片P中出現(xiàn)的詞頻,依次訪問對應(yīng)的所述倒排索引條目,根據(jù)所述 待查詢商品圖片P與可推薦商品圖片Q的詞頻所組成的兩個(gè)高維向量在高維空間中的夾角 的余弦值計(jì)算所述待查詢商品圖片P和可推薦商品圖片Q的相似性; 根據(jù)計(jì)算得到的結(jié)果,選擇排名在前面的預(yù)設(shè)數(shù)量M個(gè)可推薦商品圖片作為待推薦商 品圖片;其中,M為大于1的整數(shù)。
4. 根據(jù)權(quán)利要求3所述的網(wǎng)絡(luò)商品推薦方法,其特征在于,按照下面公式計(jì)算所述待 查詢商品圖片P和可推薦商品圖片Q的相似性為:
其中W表示每幅商品圖片中包含的高維向量的數(shù)量,w=rXm,r表 示每幅圖片被劃分的局部區(qū)域數(shù)量,m表示每個(gè)局部區(qū)域包含的顏色數(shù)量;I I表示取模運(yùn) 算符,
,Pi表示待查詢商品圖片P中第i個(gè)高維向量元素對應(yīng)的 詞頻,表示待推薦商品圖片Q中第i個(gè)高維向量元素對應(yīng)的詞頻;背景區(qū)域的詞頻為0。
5. 根據(jù)權(quán)利要求3或4所述的網(wǎng)絡(luò)商品推薦方法,其特征在于,所述匹配出與待查詢商 品圖片在顏色搭配上具有高相似度的商品圖片包括: 對所述待推薦商品圖片一一進(jìn)行匹配計(jì)算,根據(jù)所述匹配的兩幅圖片共有的主色調(diào), 弱化其在該些顏色區(qū)間上的差異;根據(jù)所述匹配的兩幅圖片的細(xì)節(jié)或不同顏色部分,強(qiáng)化 其在該些顏色區(qū)間上的差異,W獲得各待推薦商品圖片Q與待查詢商品圖片P在顏色搭配 上的相似度colorsim化曲; 從所述待推薦商品圖片中獲取相似度排名在前的預(yù)先設(shè)置數(shù)量N個(gè)商品圖片,作為在 顏色搭配上與待查詢商品圖片相似的推薦商品圖片,其中N為大于1的整數(shù);或者,從所述 待推薦商品圖片中,選取與待查詢商品圖片的相似度大于預(yù)先設(shè)置的相似度闊值的商品圖 片作為推薦商品圖片。
6. 根據(jù)權(quán)利要求5所述的網(wǎng)絡(luò)商品推薦方法,其特征在于,所述得到各待推薦商品圖 片Q與待查詢商品圖片P在顏色搭配上的相似度colorsim化曲為:
芭數(shù)重。
7. -種網(wǎng)絡(luò)商品推薦裝置,其特征在于,至少包括預(yù)處理模塊、第一處理模塊和第二處 理模塊,其中, 預(yù)處理模塊,用于定位商品圖片的主商品區(qū)域,將主商品區(qū)域劃分為若干局部區(qū)域并 分別提取顏色特征; 第一處理模塊,用于根據(jù)各局部區(qū)域的顏色特征,查找與待查詢商品圖片具有共同性 的待推薦商品圖片,并輸出給第二處理模塊; 第二處理模塊,用于在待推薦商品圖片中,匹配出與待查詢商品圖片在顏色搭配上具 有高相似度的商品圖片,并作為推薦商品圖片。
8. 根據(jù)權(quán)利要求7所述的網(wǎng)絡(luò)商品推薦裝置,其特征在于,所述第一處理模塊,具體用 于: 對于待查詢商品圖片P中出現(xiàn)的詞頻,依次訪問對應(yīng)的所述倒排索引條目,根據(jù)所述 待查詢商品圖片P與可推薦商品圖片Q的詞頻所組成的兩個(gè)高維向量在高維空間中的夾角 的余弦值計(jì)算所述待查詢商品圖片P和可推薦商品圖片Q的相似性; 根據(jù)計(jì)算得到的結(jié)果,選擇排名在前面的預(yù)設(shè)數(shù)量M個(gè)可推薦商品圖片作為待推薦商 品圖片;其中,M為大于1的整數(shù)。
9. 根據(jù)權(quán)利要求8所述的網(wǎng)絡(luò)商品推薦裝置,其特征在于,按照下面公式計(jì)算所述待 查詢商品圖片P和可推薦商品圖片Q的相似性為:
其中W表示每幅商品圖片中包含的高維向量的數(shù)量,w=rXm,r表 示每幅圖片被劃分的局部區(qū)域數(shù)量,m表示每個(gè)局部區(qū)域包含的顏色數(shù)量;I I表示取模運(yùn) 算符:
Pi表示待查詢商品圖片P中第i個(gè)高維向量元素對應(yīng)的 詞頻,表示待推薦商品圖片Q中第i個(gè)高維向量元素對應(yīng)的詞頻;背景區(qū)域的詞頻為0。
10. 根據(jù)權(quán)利要求8或9所述的網(wǎng)絡(luò)商品推薦裝置,其特征在于,所述第二處理模塊,具 體用于: 對所述待推薦商品圖片一一進(jìn)行匹配,根據(jù)所述匹配的兩幅圖片共有的主色調(diào),弱化 其在該些顏色區(qū)間上的差異;根據(jù)所述匹配的兩幅圖片的細(xì)節(jié)或不同顏色部分,強(qiáng)化其在 該些顏色區(qū)間上的差異,W獲得各待推薦商品圖片Q與待查詢商品圖片P在顏色搭配上的 相似度colorsim化曲; 從所述待推薦商品圖片中獲取相似度排名在前的預(yù)先設(shè)置數(shù)量N個(gè)商品圖片,作為在 顏色搭配上與待查詢商品圖片相似的推薦商品圖片,其中N為大于1的整數(shù);或者,從所述 待推薦商品圖片中,選取與待查詢商品圖片的相似度大于預(yù)先設(shè)置的相似度闊值的商品圖 片作為推薦商品圖片。
11. 根據(jù)權(quán)利要求10所述的而網(wǎng)絡(luò)商品推薦裝置,其特征在于,所述得到各待推薦商
品圖片Q與待查詢商品圖片P在顏色搭配上的相似度colorsim化曲為:
,其中,r表示每幅圖片被劃分的局部區(qū)域數(shù)量;
m表示每個(gè)局部區(qū)域包含的顏色數(shù)量。
【文檔編號(hào)】G06F17/30GK104424230SQ201310376347
【公開日】2015年3月18日 申請日期:2013年8月26日 優(yōu)先權(quán)日:2013年8月26日
【發(fā)明者】曹陽 申請人:阿里巴巴集團(tuán)控股有限公司