電子商務(wù)推薦模型的品牌特征提取方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種電子商務(wù)推薦模型的品牌特征提取方法,包括:對進(jìn)行電子商務(wù)銷售的品牌的基礎(chǔ)數(shù)據(jù)進(jìn)行時(shí)間分片,從而構(gòu)造不同時(shí)間片的品牌特征序列;根據(jù)上述構(gòu)造的不同時(shí)間片的品牌特征序列,對品牌的交易數(shù)據(jù)進(jìn)行熱度和成本分析,提取品牌的特征。本發(fā)明還涉及一種電子商務(wù)推薦模型的品牌特征提取系統(tǒng)。本發(fā)明依據(jù)基本的用戶日志信息和品牌操作信息進(jìn)行維度擴(kuò)建,提取新的特征集合,構(gòu)建推薦模型的品牌特征體系。
【專利說明】電子商務(wù)推薦模型的品牌特征提取方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種電子商務(wù)推薦模型的品牌特征提取方法及系統(tǒng)。
【背景技術(shù)】
[0002] 互聯(lián)網(wǎng)和信息技術(shù)的發(fā)展引發(fā)了思維方法、生活方式和商業(yè)模式的巨大變革。在 全球商業(yè)語境下,"大數(shù)據(jù)時(shí)代"要求電商品牌運(yùn)用海量數(shù)據(jù)處理系統(tǒng)對消費(fèi)者從信息搜索 到產(chǎn)品購買甚至購買后行為的跟蹤和搜索,針對消費(fèi)者的需求做出更加實(shí)時(shí)和精細(xì)化的決 策?;緜€(gè)性化推薦技術(shù)都需要從網(wǎng)站行為的日志信息中提取出用戶和品牌的特征信息, 并通過特征選擇,消除無關(guān)和冗余特征,才能得到令人滿意的推薦效果。然而常規(guī)的網(wǎng)站日 志信息事無巨細(xì)地包含了每個(gè)請求的詳細(xì)信息,冗余的信息中真正可以進(jìn)行數(shù)據(jù)特征提取 的只有用戶行為數(shù)據(jù),包括點(diǎn)擊、購買、收藏、購物車等操作信息。
[0003] 數(shù)據(jù)特征提取在數(shù)據(jù)管理和機(jī)器學(xué)習(xí)領(lǐng)域發(fā)揮著重要的作用,但是現(xiàn)有的數(shù)據(jù)特 征化是指在保留數(shù)據(jù)特征的情況下減小原始數(shù)據(jù)的規(guī)模。數(shù)據(jù)特征化的工業(yè)背景隨著數(shù)據(jù) 大規(guī)模增長,產(chǎn)生隱含大量有效信息的高維海量數(shù)據(jù),若要在這些高價(jià)值總量,低價(jià)值密度 的數(shù)據(jù)中發(fā)現(xiàn)有價(jià)值的知識,需要通過數(shù)據(jù)特征提取保留復(fù)雜數(shù)據(jù)中的有效信息,將低價(jià) 值密度的信息轉(zhuǎn)化為高價(jià)值密度的信息。
[0004] 目前的特征提取方法可以在已知豐富的基礎(chǔ)信息上提取得到所需的隱性特征,或 者通過專業(yè)人事獲取業(yè)務(wù)相關(guān)的專業(yè)知識為背景。然而,在實(shí)際面臨的數(shù)據(jù)挖掘工程中,希 望通過最稀少的信息構(gòu)造出高維度且正交的數(shù)據(jù)特征是上述特征構(gòu)建方案所不能實(shí)現(xiàn)的。
【發(fā)明內(nèi)容】
[0005] 有鑒于此,有必要提供一種電子商務(wù)推薦模型的品牌特征提取方法及系統(tǒng)。
[0006] 本發(fā)明提供一種電子商務(wù)推薦模型的品牌特征提取方法,該方法包括如下步驟: 對進(jìn)行電子商務(wù)銷售的品牌的基礎(chǔ)數(shù)據(jù)進(jìn)行時(shí)間分片,從而構(gòu)造不同時(shí)間片的品牌特征序 列;根據(jù)上述構(gòu)造的不同時(shí)間片的品牌特征序列,對品牌的交易數(shù)據(jù)進(jìn)行熱度和成本分析, 提取品牌的特征。
[0007] 其中,該方法還包括:對上述提取的品牌的特征進(jìn)行數(shù)值修正。
[0008] 所述的時(shí)間分片包括:常規(guī)的時(shí)間分片和基于購買行為的時(shí)間分片,其中所述常 規(guī)的時(shí)間分片包括:按照自然日期分片、根據(jù)品牌每天的營銷狀況及時(shí)間懲罰因子分片、按 照日期從近至遠(yuǎn)間隔由短變長分片,所述基于購買行為的時(shí)間分片方式指把用戶對品牌的 時(shí)間行為序列以購買日期為切分點(diǎn)。
[0009] 所述的品牌的特征包括:品牌的轉(zhuǎn)化比、品牌的營銷周期、品牌的熱度、品牌再購 買概率。
[0010] 所述的數(shù)值修正指通過log函數(shù)的進(jìn)行數(shù)值修正。
[0011] 本發(fā)明還提供一種電子商務(wù)推薦模型的品牌特征提取系統(tǒng),包括時(shí)間分片模塊、 特征提取模塊,其中:所述時(shí)間分片模塊用于對進(jìn)行電子商務(wù)銷售的品牌的基礎(chǔ)數(shù)據(jù)進(jìn)行 時(shí)間分片,從而構(gòu)造不同時(shí)間片的品牌特征序列;所述特征提取模塊用于根據(jù)上述構(gòu)造的 不同時(shí)間片的品牌特征序列,對品牌的交易數(shù)據(jù)進(jìn)行熱度和成本分析,提取品牌的特征。
[0012] 其中,該系統(tǒng)還包括數(shù)值修正模塊,所述數(shù)值修正模塊用于對上述提取的品牌的 特征進(jìn)行數(shù)值修正。
[0013] 所述的時(shí)間分片包括:常規(guī)的時(shí)間分片和基于購買行為的時(shí)間分片,其中所述常 規(guī)的時(shí)間分片包括:按照自然日期分片、根據(jù)品牌每天的營銷狀況及時(shí)間懲罰因子分片、按 照日期從近至遠(yuǎn)間隔由短變長分片,所述基于購買行為的時(shí)間分片方式指把用戶對品牌的 時(shí)間行為序列以購買日期為切分點(diǎn)。
[0014] 所述的品牌的特征包括:品牌的轉(zhuǎn)化比、品牌的營銷周期、品牌的熱度、品牌再購 買概率。
[0015] 所述的數(shù)值修正指通過log函數(shù)的進(jìn)行數(shù)值修正。
[0016] 本發(fā)明電子商務(wù)推薦模型的品牌特征提取方法及系統(tǒng),能夠使電子商務(wù)網(wǎng)站在海 量數(shù)據(jù)基礎(chǔ)上,依據(jù)基本的用戶日志信息和品牌操作信息進(jìn)行維度擴(kuò)建,提取新的特征集 合,構(gòu)建推薦模型的品牌特征體系。本發(fā)明提取的數(shù)據(jù)價(jià)值高,提取效果好。
【專利附圖】
【附圖說明】
[0017] 圖1為本發(fā)明電子商務(wù)推薦模型的品牌特征提取方法的流程圖;
[0018] 圖2為基于購買行為的時(shí)間分片方式示意圖;
[0019] 圖3為本發(fā)明電子商務(wù)推薦模型的品牌特征提取系統(tǒng)的硬件架構(gòu)圖。
【具體實(shí)施方式】
[0020] 下面結(jié)合附圖及具體實(shí)施例對本發(fā)明作進(jìn)一步詳細(xì)的說明。
[0021] 參閱圖1所示,是本發(fā)明電子商務(wù)推薦模型的品牌特征提取方法較佳實(shí)施例的作 業(yè)流程圖。
[0022] 步驟S401,對進(jìn)行電子商務(wù)銷售的品牌的基礎(chǔ)數(shù)據(jù)進(jìn)行時(shí)間分片,構(gòu)造不同時(shí)間 片的品牌特征序列。具體如下:
[0023] 本實(shí)施例以天貓商城為例進(jìn)行說明。在天貓商城,每天都會有數(shù)千萬的用戶通過 品牌發(fā)現(xiàn)自己喜歡的商品,品牌是連接消費(fèi)者和商品的最重要的紐帶。在已有的歷史記錄 中,如何提取品牌的特征,第一個(gè)關(guān)鍵特征就在于品牌營銷狀況的時(shí)間序列特征。
[0024] 常規(guī)的時(shí)間分片有三種方式:
[0025] (1)按照自然日期分割,按周、半月、月分割,直接計(jì)算品牌不同時(shí)間跨度內(nèi)的點(diǎn) 擊、收藏等情況。以四個(gè)月總記錄,若按周可以分割為16片,每片的點(diǎn)擊、購買、收藏、購物 車為7天內(nèi)點(diǎn)擊、購買、收藏、購物車之和;若按半月可以分割為8片,每片的點(diǎn)擊、購買、收 藏、購物車為14天內(nèi)點(diǎn)擊、購買、收藏、購物車之和;若按月可以分割為4片,每片的點(diǎn)擊、購 買、收藏、購物車為30天內(nèi)點(diǎn)擊、購買、收藏、購物車之和。
[0026] (2)直接將品牌每天的營銷狀況乘以一個(gè)時(shí)間懲罰因子K,品牌最近被購買比前 一個(gè)月前被購買更為重要,所以時(shí)間懲罰與時(shí)間成反比,時(shí)間越近懲罰值越小,時(shí)間越遠(yuǎn)懲 罰值越大。
【權(quán)利要求】
1. 一種電子商務(wù)推薦模型的品牌特征提取方法,其特征在于,該方法包括如下步驟: 對進(jìn)行電子商務(wù)銷售的品牌的基礎(chǔ)數(shù)據(jù)進(jìn)行時(shí)間分片,從而構(gòu)造不同時(shí)間片的品牌特 征序列; 根據(jù)上述構(gòu)造的不同時(shí)間片的品牌特征序列,對品牌的交易數(shù)據(jù)進(jìn)行熱度和成本分 析,提取品牌的特征。
2. 如權(quán)利要求1所述的方法,其特征在于,該方法還包括:對上述提取的品牌的特征進(jìn) 行數(shù)值修正。
3. 如權(quán)利要求1所述的方法,其特征在于,所述的時(shí)間分片包括:常規(guī)的時(shí)間分片和基 于購買行為的時(shí)間分片,其中所述常規(guī)的時(shí)間分片包括:按照自然日期分片、根據(jù)品牌每天 的營銷狀況及時(shí)間懲罰因子分片、按照日期從近至遠(yuǎn)間隔由短變長分片,所述基于購買行 為的時(shí)間分片方式指把用戶對品牌的時(shí)間行為序列以購買日期為切分點(diǎn)。
4. 如權(quán)利要求1所述的方法,其特征在于,所述的品牌的特征包括:品牌的轉(zhuǎn)化比、品 牌的營銷周期、品牌的熱度、品牌再購買概率。
5. 如權(quán)利要求2所述的方法,其特征在于,所述的數(shù)值修正指通過log函數(shù)的進(jìn)行數(shù)值 修正。
6. -種電子商務(wù)推薦模型的品牌特征提取系統(tǒng),其特征在于,該系統(tǒng)包括時(shí)間分片模 塊、特征提取模塊,其中: 所述時(shí)間分片模塊用于對進(jìn)行電子商務(wù)銷售的品牌的基礎(chǔ)數(shù)據(jù)進(jìn)行時(shí)間分片,從而構(gòu) 造不同時(shí)間片的品牌特征序列; 所述特征提取模塊用于根據(jù)上述構(gòu)造的不同時(shí)間片的品牌特征序列,對品牌的交易數(shù) 據(jù)進(jìn)行熱度和成本分析,提取品牌的特征。
7. 如權(quán)利要求6所述的系統(tǒng),其特征在于,該系統(tǒng)還包括數(shù)值修正模塊,所述數(shù)值修正 模塊用于對上述提取的品牌的特征進(jìn)行數(shù)值修正。
8. 如權(quán)利要求6所述的系統(tǒng),其特征在于,所述的時(shí)間分片包括:常規(guī)的時(shí)間分片和基 于購買行為的時(shí)間分片,其中所述常規(guī)的時(shí)間分片包括:按照自然日期分片、根據(jù)品牌每天 的營銷狀況及時(shí)間懲罰因子分片、按照日期從近至遠(yuǎn)間隔由短變長分片,所述基于購買行 為的時(shí)間分片方式指把用戶對品牌的時(shí)間行為序列以購買日期為切分點(diǎn)。
9. 如權(quán)利要求6所述的系統(tǒng),其特征在于,所述的品牌的特征包括:品牌的轉(zhuǎn)化比、品 牌的營銷周期、品牌的熱度、品牌再購買概率。
10. 如權(quán)利要求7所述的系統(tǒng),其特征在于,所述的數(shù)值修正指通過log函數(shù)的進(jìn)行數(shù) 值修正。
【文檔編號】G06Q30/02GK104408641SQ201410593894
【公開日】2015年3月11日 申請日期:2014年10月29日 優(yōu)先權(quán)日:2014年10月29日
【發(fā)明者】沈慧, 范小朋, 趙東輝, 須成忠 申請人:深圳先進(jìn)技術(shù)研究院