本發(fā)明涉及大數(shù)據(jù)分析領(lǐng)域,特別是涉及一種個(gè)性化商品排序的方法及系統(tǒng)。
背景技術(shù):
現(xiàn)有特賣App的商品流展示方式,主要根據(jù)商品的檔期特征,每日特定時(shí)間發(fā)布新品,吸引用戶每日關(guān)注上新商品,沒有搜索的支撐,主要以新品搶購(gòu)為主要產(chǎn)品特征。隨著特賣商品的不斷豐富,每日商品流展示的上新商品多達(dá)幾千款并覆蓋服裝、鞋包、居家、美食、母嬰等多個(gè)類目,但用戶通常能夠有耐心看到的商品僅占10%不到,大量的商品由于位置靠后,查看不便,導(dǎo)致曝光量很低,很多用戶真正感興趣的商品難以被發(fā)現(xiàn),限制了整體銷量的增長(zhǎng)。
針對(duì)以上問題,特賣App端通常采用的解決方式有:
(1)用戶性別、年齡段(90后/85后/80后/70后等)、用戶地域、消費(fèi)能力等用戶的主要特征來區(qū)分人群,對(duì)不同人群展示不同的商品流列表。
(2)運(yùn)營(yíng)人員根據(jù)商品檔期的特征,人工挑選出可能帶來高轉(zhuǎn)化率的商品,將這些商品排序提前,并根據(jù)類目的整體銷量情況,將優(yōu)勢(shì)類目前置,并將類目進(jìn)行組合交叉展示。
(3)在固定坑位內(nèi)嵌廣告活動(dòng)位,通過活動(dòng)特惠提升檔期銷量。
現(xiàn)有解決方案主要缺陷在于:
(1)根據(jù)用戶自身的主要特征區(qū)分的人群數(shù)量有限,通??梢詣澐譃槟惺?,女士,80后,70后,高消費(fèi)等主要人群,但是由于商品檔期多達(dá)幾千,面對(duì)每日上百萬的海量用戶,僅僅少量的幾個(gè)人群并不能很好的滿足用戶的偏好。
(2)人工進(jìn)行檔期挑選并根據(jù)類目特征干預(yù)商品排序,這種方式一方面每日的運(yùn)營(yíng)工作量較大,另一方面,由于運(yùn)營(yíng)自身的能力限制,挑選的檔期質(zhì)量也參差不齊,導(dǎo)致效果往往差強(qiáng)人意。
(3)廣告活動(dòng)固定位有限,提升能力不高,對(duì)商品流整體銷量提升帶來效果不明顯。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是為了克服上述背景技術(shù)的不足,提供一種個(gè)性化的商品排序的方法及系統(tǒng),使其能更好的滿足用戶偏好,將用戶的偏好的商品優(yōu)先展示。
本發(fā)明提供的一種個(gè)性化商品排序的方法,其包括下列步驟:
S1:收集人群維度和商品維度的信息,對(duì)用戶維度和商品維度進(jìn)行聚類分析,得到含有人群信息的聚類商品集;
S2:為當(dāng)前人群劃分聚類商品集;
S3:獲取用戶的行為特點(diǎn),構(gòu)建用戶的特征集合,確定用戶所屬人群;
S4:為用戶選擇聚類商品集,采用二元邏輯回歸方式,分出用戶偏好和不偏好的聚類商品集,將用戶偏好的聚類商品集靠前;
S5:將用戶偏好的聚類商品集內(nèi)的商品按商品的曝光點(diǎn)擊率、點(diǎn)擊轉(zhuǎn)化率和商品價(jià)格綜合計(jì)算后按得分排序,按順序展示商品。
一種個(gè)性化商品排序的系統(tǒng),其特征在于:其包括:
用戶商品信息收集和聚類分析模塊:用于收集人群維度和商品維度的信息,對(duì)用戶維度和商品維度進(jìn)行聚類分析,得到含有人群信息的聚類商品集;
分聚類商品集劃分模塊:為當(dāng)前人群劃分聚類商品集;
用戶行為特點(diǎn)收集模塊:用于獲取用戶的行為特點(diǎn),構(gòu)建用戶的特征集合,確定用戶所屬人群;
聚類商品集分析模塊:用于為用戶選擇聚類商品集,采用二元邏輯回歸方式,分出用戶偏好和不偏好的聚類商品集,將用戶偏好的聚類商品集靠前;
聚類商品集內(nèi)部排序模塊:將用戶偏好的聚類商品集內(nèi)的商品按商品的曝光點(diǎn)擊率、點(diǎn)擊轉(zhuǎn)化率和商品價(jià)格綜合計(jì)算后按得分排序,按順序展示商品。
有益效果:本發(fā)明提供的一種個(gè)性化的商品排序的方法及系統(tǒng)收集用戶維度和商品維度的信息,為用戶選擇商品集,并對(duì)商品集內(nèi)部產(chǎn)品排序,能夠盡可能的將用戶偏好的檔期優(yōu)先展示,更準(zhǔn)確的圈定用戶偏好的商品集,提升用戶體驗(yàn),從而帶來整體商品流的銷量上漲。
附圖說明
圖1為本發(fā)明實(shí)施例提供的本發(fā)明提供的一種個(gè)性化的商品排序的方法及系統(tǒng)的方法流程圖。
具體實(shí)施方式
下面結(jié)合附圖及實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)描述,本部分的描述僅是示范性和解釋性,不應(yīng)對(duì)本發(fā)明的保護(hù)范圍有任何的限制作用。
如圖1所示,本發(fā)明實(shí)施方式提供一種個(gè)性化商品排序的方法,其包括下列步驟:
S1:收集人群維度和商品維度的信息,對(duì)用戶維度和商品維度進(jìn)行聚類分析,得到含有人群信息的聚類商品集;
S2:為當(dāng)前人群劃分聚類商品集;
S3:獲取用戶的行為特點(diǎn),構(gòu)建用戶的特征集合,確定用戶所屬人群;
S4:為用戶選擇聚類商品集,采用二元邏輯回歸方式,分出用戶偏好和不偏好的聚類商品集,將用戶偏好的聚類商品集靠前;
S5:將用戶偏好的聚類商品集內(nèi)的商品按商品的曝光點(diǎn)擊率、點(diǎn)擊轉(zhuǎn)化率和商品價(jià)格綜合計(jì)算后按得分排序,按順序展示商品。
具體地,所述用戶維度的信息包括:用戶性別、年齡段、用戶地域、消費(fèi)能力;所術(shù)商品維度包括類目、品牌、價(jià)格區(qū)間、風(fēng)格、款式。
具體地,所述聚類的方法為:先將收集到的人群維度信息和商品維度信息轉(zhuǎn)化為第一商品集信息,第一商品集信息轉(zhuǎn)化為SimHash值,根據(jù)SimHash值差值來作為聚類的距離度量參數(shù),采用k-means聚類算法得出聚類商品集,最終聚類數(shù)量可以根據(jù)聚類收斂程度具體定量。具體地,比如用戶的人群特征為:女士+70后+長(zhǎng)款連衣裙+母嬰哺乳期+北京+消費(fèi)能力300~500,第一商品集信息如下,其格式為<特征1,特征2,兩個(gè)特征關(guān)聯(lián)的權(quán)重>,<女士,70后,5>、<女士,長(zhǎng)款連衣裙,4>、<女士,母嬰哺乳期,5>、<女士,北京,6>、<女士,300-500,6>、<70后,長(zhǎng)款連衣裙,3>、<70后,母嬰哺乳期,3>、<70后,北京,3>、<70后,300-500,3>、<長(zhǎng)款連衣裙,母嬰哺乳期,2>、<長(zhǎng)款連衣裙,北京,2>、<長(zhǎng)款連衣裙,300-500,2>、<母嬰哺乳期,北京,1>、<母嬰哺乳期,300-500,1>、<北京,300-500,1>,因篇幅有限,這里采用簡(jiǎn)化的形式,將上述第一商品集信息投影到8位長(zhǎng)度的二進(jìn)制編碼中,具體的運(yùn)算方式如下:
(1)指定一種hash值的運(yùn)算方式,比如Java中HashMap中的SimHash方法,根據(jù)此方法產(chǎn)生一個(gè)8位二進(jìn)制碼,比如<女士,70后>的SimHash值為10001100,<女士,長(zhǎng)款連衣裙>的SimHash值為11001001。
(2)將上述8位二進(jìn)制編碼乘以對(duì)應(yīng)的權(quán)重,轉(zhuǎn)化為新的值(其中0在乘法運(yùn)算中為-1),比如<女士,70后>通過加權(quán)運(yùn)算為5,-5,-5,-5,5,5,-5,-5,<女士,長(zhǎng)款連衣裙>通過加權(quán)運(yùn)算為4,4,-4,-4,4,-4,-4,4。
(3)將所有特征加權(quán)后的值相加合并,比如<女士,70后>跟<女士,長(zhǎng)款連衣裙>加權(quán)合并之后為9,-1,-9,-9,9,1,-9,-1,然后做降維處理,大于0的轉(zhuǎn)為1,小于等于0的轉(zhuǎn)為0,等到最后的8位SimHash結(jié)果1,0,0,0,1,1,0,0。
(4)兩個(gè)Simhash對(duì)應(yīng)二進(jìn)制(01串)取值不同的數(shù)量為這兩個(gè)Simhash值的差值。舉例如下:10101和00110從第一位開始依次有第一位、第四、第五位不同,則Simhash值的差值為3。
具體地,為當(dāng)前人群劃分商品集的方法為優(yōu)先匹配類目范圍,然后在各個(gè)類目下選擇年齡特征、價(jià)格檔次、地域等相關(guān)度高的商品。
具體地,所述按商品的曝光點(diǎn)擊率、點(diǎn)擊轉(zhuǎn)化率和商品價(jià)格綜合計(jì)算方法為:提取每個(gè)商品的CTR、CVR,并做平滑處理,所述平滑處理公式為r=(C+alpha)/(I+alpha+beta)(其中C為CTR或者CVR,I為展示次數(shù),alpha、beta為平滑因子),然后根據(jù)公式:W=CTR*CVR*商品售價(jià),對(duì)每個(gè)商品進(jìn)行打分,根據(jù)得分情況對(duì)商品進(jìn)行排序,公式的目的是為了提升轉(zhuǎn)化率,曝光點(diǎn)擊率較高商品得分,并且突出高價(jià)格商品的權(quán)重,提升整體GMV產(chǎn)出。
本發(fā)明實(shí)施例還提供了一種個(gè)性化商品排序的系統(tǒng),其包括:
用戶商品信息收集和聚類分析模塊:用于收集人群維度和商品維度的信息,對(duì)用戶維度和商品維度進(jìn)行聚類分析,得到含有人群信息的聚類商品集;
聚類商品集劃分模塊:為當(dāng)前人群劃分聚類商品集;
用戶行為特點(diǎn)收集模塊:用于獲取用戶的行為特點(diǎn),構(gòu)建用戶的特征集合,確定用戶所屬人群;
聚類商品集分析模塊:用于為用戶選擇聚類商品集,采用二元邏輯回歸方式,分出用戶偏好和不偏好的聚類商品集,將用戶偏好的聚類商品集靠前;
聚類商品集內(nèi)部排序模塊:將用戶偏好的聚類商品集內(nèi)的商品按商品的曝光點(diǎn)擊率、點(diǎn)擊轉(zhuǎn)化率和商品價(jià)格綜合計(jì)算后按得分排序,按順序展示商品。
具體地,所述用戶商品信息收集和聚類分析模塊包括:
用戶維度的信息模塊,用于收集用戶性別、年齡段、用戶地域、消費(fèi)能力;
商品維度信息收集模塊:用于收集商品類目、品牌、價(jià)格區(qū)間、風(fēng)格、款式。
具體地,所述用戶商品信息收集和聚類分析模塊包括聚類分析模塊,所述聚類分析模塊用于將用戶維度和商品維度進(jìn)行聚類分析,聚類分析的方法為:先將收集到的人群維度信息和商品維度信息轉(zhuǎn)化為第一商品集信息,第一商品集信息轉(zhuǎn)化為SimHash值,根據(jù)SimHash值差值來作為聚類的距離度量參數(shù),采用k-means聚類算法得出聚類商品集,最終聚類數(shù)量可以根據(jù)聚類收斂程度具體定量,具體地,比如用戶的人群特征為:女士+70后+長(zhǎng)款連衣裙+母嬰哺乳期+北京+消費(fèi)能力300~500,第一商品集信息如下,其格式為<特征1,特征2,兩個(gè)特征關(guān)聯(lián)的權(quán)重>,<女士,70后,5>、<女士,長(zhǎng)款連衣裙,4>、<女士,母嬰哺乳期,5>、<女士,北京,6>、<女士,300-500,6>、<70后,長(zhǎng)款連衣裙,3>、<70后,母嬰哺乳期,3>、<70后,北京,3>、<70后,300-500,3>、<長(zhǎng)款連衣裙,母嬰哺乳期,2>、<長(zhǎng)款連衣裙,北京,2>、<長(zhǎng)款連衣裙,300-500,2>、<母嬰哺乳期,北京,1>、<母嬰哺乳期,300-500,1>、<北京,300-500,1>,因篇幅有限,這里采用簡(jiǎn)化的形式,將上述第一商品集信息投影到8位長(zhǎng)度的二進(jìn)制編碼中,具體的運(yùn)算方式如下:
(1)指定一種hash值的運(yùn)算方式,比如Java中HashMap中的SimHash方法,根據(jù)此方法產(chǎn)生一個(gè)8位二進(jìn)制碼,比如<女士,70后>的SimHash值為10001100,<女士,長(zhǎng)款連衣裙>的SimHash值為11001001。
(2)將上述8位二進(jìn)制編碼乘以對(duì)應(yīng)的權(quán)重,轉(zhuǎn)化為新的值(其中0在乘法運(yùn)算中為-1),比如<女士,70后>通過加權(quán)運(yùn)算為5,-5,-5,-5,5,5,-5,-5,<女士,長(zhǎng)款連衣裙>通過加權(quán)運(yùn)算為4,4,-4,-4,4,-4,-4,4。
(3)將所有特征加權(quán)后的值相加合并,比如<女士,70后>跟<女士,長(zhǎng)款連衣裙>加權(quán)合并之后為9,-1,-9,-9,9,1,-9,-1,然后做降維處理,大于0的轉(zhuǎn)為1,小于等于0的轉(zhuǎn)為0,等到最后的8位SimHash結(jié)果1,0,0,0,1,1,0,0。
(4)兩個(gè)Simhash對(duì)應(yīng)二進(jìn)制(01串)取值不同的數(shù)量為這兩個(gè)Simhash值的差值。舉例如下:10101和00110從第一位開始依次有第一位、第四、第五位不同,則Simhash值的差值為3。
具體地,所述商品集選擇模塊具體選擇商品集的方法為優(yōu)先匹配類目范圍,然后在各個(gè)類目下選擇年齡特征、價(jià)格檔次、地域等相關(guān)度高的商品。
具體地,所述商品集內(nèi)部排序模塊按產(chǎn)品的曝光點(diǎn)擊率、點(diǎn)擊轉(zhuǎn)化率和商品價(jià)格綜合計(jì)算方法為:提取每個(gè)商品的CTR、CVR,并做平滑處理,所述平滑處理公式為r=(C+alpha)/(I+alpha+beta)(其中C為CTR或者CVR,I為展示次數(shù),alpha、beta為平滑因子),然后根據(jù)公式:W=CTR*CVR*商品售價(jià),對(duì)每個(gè)商品進(jìn)行打分,根據(jù)得分情況對(duì)商品進(jìn)行排序,公式的目的是為了提升轉(zhuǎn)化率,曝光點(diǎn)擊率較高商品得分,并且突出高價(jià)格商品的權(quán)重,提升整體GMV產(chǎn)出。
本發(fā)明提供的一種個(gè)性化的商品排序的方法及系統(tǒng)收集用戶維度和商品維度的信息,為用戶選擇商品集,并對(duì)商品集內(nèi)部產(chǎn)品排序,能夠盡可能的將用戶偏好的檔期優(yōu)先展示,更準(zhǔn)確的圈定用戶偏好的商品集,提升用戶體驗(yàn),并且排序方式中突出了商品價(jià)格權(quán)重從而帶來整體商品流的銷量上漲。
顯然,本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。