基于電商銷售數(shù)據(jù)的商品分類提取及在該分類提取下的銷量預(yù)測(cè)方法
【專利摘要】本發(fā)明是一種基于電商銷售數(shù)據(jù)及外部相關(guān)數(shù)據(jù)的銷量預(yù)測(cè)方法,其特征在于:首先通過(guò)電商企業(yè)產(chǎn)品銷售的地域地域特征對(duì)所售區(qū)域進(jìn)行重新劃分,提高銷售數(shù)據(jù)密度。其次利用地域內(nèi)匯總的銷售數(shù)據(jù)建立時(shí)間序列擬合模型,通過(guò)歷史數(shù)據(jù)預(yù)測(cè)未來(lái)的銷售量。最后利用相關(guān)性分析,選取對(duì)于銷售影響較大的外部因素,通過(guò)隱馬爾科夫預(yù)測(cè)模型,將外部因素的變化對(duì)銷售量的概率影響加入到預(yù)測(cè)模型中,提高預(yù)測(cè)結(jié)果的可靠性。
【專利說(shuō)明】
基于電商銷售數(shù)據(jù)的商品分類提取及在該分類提取下的銷量預(yù)測(cè)方法
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及互聯(lián)網(wǎng)電商信息處理領(lǐng)域,具體地說(shuō),是涉及一種基于電商企業(yè)的銷售數(shù)據(jù)及綜合利用外部數(shù)據(jù)的商品銷量預(yù)測(cè)方法。
【背景技術(shù)】
[0002]隨著我國(guó)電商基礎(chǔ)設(shè)施的日漸完善,越來(lái)越多的電商企業(yè)逐漸發(fā)展?fàn)顟B(tài),形成了規(guī)模級(jí)的電商企業(yè),年銷售額上千萬(wàn)甚至上億元,隨著銷售量的增加,隨之帶來(lái)的就是庫(kù)存管理,個(gè)性化營(yíng)銷方面的問(wèn)題,由于電商企業(yè)的線上銷售特性,其產(chǎn)品是隨機(jī)的銷往全國(guó)各地,如何高效,準(zhǔn)確的給出未來(lái)某一地域的銷售預(yù)測(cè),能夠幫助企業(yè)合理規(guī)劃庫(kù)存,有針對(duì)性的進(jìn)行活動(dòng)策劃,降低企業(yè)運(yùn)營(yíng)成本,提高在同類電商企業(yè)中的競(jìng)爭(zhēng)力。
[0003]傳統(tǒng)的銷量預(yù)測(cè)技術(shù)主要采用的是對(duì)歷史銷售數(shù)據(jù)進(jìn)行回歸分析,建立回歸模型,這種預(yù)測(cè)方式在傳統(tǒng)的供大于求的銷售狀況中有著較好的應(yīng)用,但是電商企業(yè)的銷售存在著一下幾個(gè)傳統(tǒng)銷售不具有的特征:產(chǎn)品種類的多樣性;產(chǎn)品庫(kù)存的靈活性;銷售范圍的不確定性;例如:某電商企業(yè)在銷售某種商品后,貨源停止供應(yīng)該種商品而采用另一型號(hào)的商品重新供貨,在這種情況下,傳統(tǒng)的回歸分析就無(wú)法識(shí)別兩種產(chǎn)品之間的關(guān)系。此外,線上銷售更容易受到外部因素的影響,而傳統(tǒng)的回歸分析無(wú)法考量外部因素,當(dāng)外部因素發(fā)生較大改變時(shí),其對(duì)銷售預(yù)測(cè)存在著較大偏差。
【發(fā)明內(nèi)容】
[0004]鑒于以上所述現(xiàn)有技術(shù)存在的問(wèn)題和不足,本發(fā)明要解決的技術(shù)問(wèn)題是提供一種能夠綜合歷史銷售數(shù)據(jù)及外部影響因素的基于電商銷售數(shù)據(jù)的商品分類提取及在該分類提取下的銷量預(yù)測(cè)方法,該方法既能考量銷售歷史趨勢(shì),同時(shí)又能對(duì)當(dāng)前外部因素的變化產(chǎn)生響應(yīng),修正基于歷史數(shù)據(jù)的預(yù)測(cè)值。
[0005]為了解決上述問(wèn)題,本發(fā)明采用下述技術(shù)方案:
一種基于電商銷售數(shù)據(jù)及外部相關(guān)數(shù)據(jù)的銷量預(yù)測(cè)方法,其特征在于:首先利用外部信息對(duì)電商銷售地域SalesArea進(jìn)行重新劃分,在新的電商銷售地域SalesArea下對(duì)銷售數(shù)據(jù)進(jìn)行匯總,然后利用聚類技術(shù)將零散的商品類型重新聚合到一起,最后利用復(fù)合銷售預(yù)測(cè)技術(shù),預(yù)測(cè)聚合商品分類下的銷售量。
[0006]具體步驟如下:
(I)利用相關(guān)數(shù)據(jù)對(duì)電商銷售地域SalesArea進(jìn)行重新劃分。
[0007]a、地域相關(guān)要素提取。
[0008]不同地域間對(duì)于相同產(chǎn)品的銷售模式是不同的,因此在對(duì)電商企業(yè)銷售商品的銷量預(yù)測(cè)研究中,首先要區(qū)別對(duì)待不同地區(qū)的銷售模式。因此首先要通過(guò)相關(guān)性分析,選擇與銷售相關(guān)的外部因素。
[0009]b、地域重新劃分。
[0010]通過(guò)相關(guān)性分析得出的因素,例如經(jīng)濟(jì),人口等,利用這些外部因素序列通過(guò)聚類的方法,獲取新的地域分類集合Area= {a1、a2、a3、......an},其中an第n個(gè)新地域內(nèi)包含有的原始地域信息。
[0011](2)利用電商企業(yè)的銷售數(shù)據(jù)Sal esData按照商品銷售時(shí)間Time對(duì)所有商品進(jìn)行共性提取,獲取所有商品所屬Categoriesfg息。
[0012]a、商品銷量信息匯總。
[0013]在新的銷售地域劃分集合Area內(nèi),對(duì)所售產(chǎn)品按一定的時(shí)間間隔T進(jìn)行統(tǒng)計(jì)匯總,最終獲取所有商品在給定地域內(nèi)的銷售時(shí)間序列SalesTSi={ su、si2、si3、......Sin }。
[0014]b、利用聚類技術(shù)進(jìn)行商品聚類。
[0015]利用聚類技術(shù)將求出的商品銷售時(shí)間序列SalesTS1進(jìn)行聚類分析操作,獲取商品的新分類信息Categories。
[0016](3)在新的Categories下,利用復(fù)合預(yù)測(cè)模型對(duì)商品銷量進(jìn)行預(yù)測(cè)。
[0017]a、構(gòu)造基于歷史銷售數(shù)據(jù)的預(yù)測(cè)模型;
根據(jù)不同商品的銷售特征,具有季節(jié)特性的商品銷售序列選擇SARMA時(shí)間序列模型,不具有季節(jié)特性的商品銷售序列選擇ARMA時(shí)間序列模型,利用建立的時(shí)間序列模型擬合歷史數(shù)據(jù)并給出銷量預(yù)測(cè)值。
[0018]b、利用相關(guān)性分析獲取對(duì)于銷售數(shù)據(jù)有主要影響的外部因素;
由于在可獲得的眾多外部銷量相關(guān)的數(shù)據(jù)中存在大量的數(shù)據(jù),數(shù)據(jù)之間又會(huì)有各種各樣的先關(guān)性關(guān)系,因此,在進(jìn)行外部因素對(duì)于銷量數(shù)據(jù)的影響分析前,首先要通過(guò)二者的相關(guān)性分析確定二者的相關(guān)程度,篩選掉相關(guān)性較小的外部因素。這里采用皮爾森相關(guān)系數(shù)(Pearson correlat1n coefficient)作為相關(guān)性檢驗(yàn)的標(biāo)準(zhǔn)。
[0019]C、利用外部因素建立隱馬爾科夫預(yù)測(cè)模型;
利用外部因素的歷史變化數(shù)據(jù)生成,外部因素變化的預(yù)測(cè)矩陣即隱馬爾科夫模型中的轉(zhuǎn)移概率矩陣,再利用外部因素與銷售變化的歷史數(shù)據(jù)生成混淆矩陣。最后給定初始外部條件觀察值,通過(guò)轉(zhuǎn)移矩陣給出未來(lái)時(shí)段的外部因素概率分布,再通過(guò)混淆矩陣將外部因素的概率分布轉(zhuǎn)化為對(duì)銷量影響的概率分布。
[0020]基于電商銷售數(shù)據(jù)的商品分類提取及在該分類提取下的銷量預(yù)測(cè)方法到此結(jié)束。
[0021]本發(fā)明的基于電商銷售數(shù)據(jù)及外部相關(guān)數(shù)據(jù)的銷量預(yù)測(cè)方法,通過(guò)對(duì)電商銷售地域特征提取,商品特征提取等手段對(duì)電商銷售數(shù)據(jù)進(jìn)行重新整合,再利用復(fù)合銷售預(yù)測(cè)方法,結(jié)合歷史數(shù)據(jù)以及外部因素對(duì)在新分類下的商品銷量進(jìn)行準(zhǔn)確預(yù)測(cè),解決了電商銷售數(shù)據(jù)的零散問(wèn)題及預(yù)測(cè)結(jié)果對(duì)外部因素?zé)o反應(yīng)的缺點(diǎn),提高了預(yù)測(cè)結(jié)果的可靠性和實(shí)用性。
【附圖說(shuō)明】
[0022]圖1是本發(fā)明的基于電商銷售數(shù)據(jù)的商品分類提取及在該分類提取下的銷量預(yù)測(cè)方法的流程圖;
圖2是圖1所述的地域重劃分的流程圖;
圖3是圖1中產(chǎn)品分類提取的流程圖;
圖4是圖1中復(fù)合預(yù)測(cè)模型的流程圖。
【具體實(shí)施方式】
[0023]下面結(jié)合附圖和【具體實(shí)施方式】對(duì)本發(fā)明作進(jìn)一步詳細(xì)的描述。
[0024]參照?qǐng)D1,本發(fā)明的基于電商銷售數(shù)據(jù)的商品分類提取及在該分類提取下的銷量預(yù)測(cè)方法包括如下步驟:
步驟01、利用相關(guān)數(shù)據(jù)對(duì)電商銷售地域SalesArea進(jìn)行重新劃分,參照?qǐng)D2,其具體如下:
步驟101:地域相關(guān)要素提取;
不同地域間對(duì)于相同產(chǎn)品的銷售模式是不同的,因此在對(duì)電商企業(yè)銷售商品的銷量預(yù)測(cè)研究中,首先要區(qū)別對(duì)待不同地區(qū)的銷售模式。因此首先要通過(guò)相關(guān)性分析,選擇與銷售相關(guān)的外部因素。
[0025]步驟102:地域重新劃分;
通過(guò)相關(guān)性分析得出的因素,例如經(jīng)濟(jì),人口等,利用這些外部因素序列通過(guò)聚類的方法,獲取新的地域分類集合4^&={&1、32、33、......an},其中an第η個(gè)新地域內(nèi)包含有的原始地域信息。
[0026]步驟02、判利用電商企業(yè)的銷售數(shù)據(jù)SalesData按照商品銷售時(shí)間Time對(duì)所有商品進(jìn)行共性提取,獲取所有商品所屬Categories彳目息。參照?qǐng)D3,包括如下步驟:
步驟201:商品銷量信息匯總;
在新的銷售地域劃分集合Area內(nèi),對(duì)所售產(chǎn)品按一定的時(shí)間間隔T進(jìn)行統(tǒng)計(jì)匯總,最終獲取所有商品在給定地域內(nèi)的銷售時(shí)間序列SalesTSi={ su、si2、si3、......Sin }。
[0027]步驟202:利用聚類技術(shù)進(jìn)行商品聚類;
利用聚類技術(shù)將求出的商品銷售時(shí)間序列SalesTS1進(jìn)行聚類分析操作,獲取商品的新分類信息Categories。
[0028]步驟03、在新的Categories下,利用復(fù)合預(yù)測(cè)模型對(duì)商品銷量進(jìn)行預(yù)測(cè)。參照?qǐng)D4,包括如下步驟:
步驟301:構(gòu)造基于歷史銷售數(shù)據(jù)的預(yù)測(cè)模型;
根據(jù)不同商品的銷售特征,具有季節(jié)特性的商品銷售序列選擇SARMA時(shí)間序列模型,不具有季節(jié)特性的商品銷售序列選擇ARMA時(shí)間序列模型,利用建立的時(shí)間序列模型擬合歷史數(shù)據(jù)并給出銷量預(yù)測(cè)值。
[0029]步驟302:利用相關(guān)性分析獲取對(duì)于銷售數(shù)據(jù)有主要影響的外部因素;
由于在可獲得的眾多外部銷量相關(guān)的數(shù)據(jù)中存在大量的數(shù)據(jù),數(shù)據(jù)之間又會(huì)有各種各樣的先關(guān)性關(guān)系,因此,在進(jìn)行外部因素對(duì)于銷量數(shù)據(jù)的影響分析前,首先要通過(guò)二者的相關(guān)性分析確定二者的相關(guān)程度,篩選掉相關(guān)性較小的外部因素。這里采用皮爾森相關(guān)系數(shù)(Pearson correlat1n coefficient)作為相關(guān)性檢驗(yàn)的標(biāo)準(zhǔn)。
[0030]步驟303:利用外部因素建立隱馬爾科夫預(yù)測(cè)模型;
利用外部因素的歷史變化數(shù)據(jù)生成,外部因素變化的預(yù)測(cè)矩陣即隱馬爾科夫模型中的轉(zhuǎn)移概率矩陣,再利用外部因素與銷售變化的歷史數(shù)據(jù)生成混淆矩陣。最后給定初始外部條件觀察值,通過(guò)轉(zhuǎn)移矩陣給出未來(lái)時(shí)段的外部因素概率分布,再通過(guò)混淆矩陣將外部因素的概率分布轉(zhuǎn)化為對(duì)銷量影響的概率分布。
[0031]綜上所述,本發(fā)明提出了一種基于電商銷售數(shù)據(jù)及外部相關(guān)數(shù)據(jù)的銷量預(yù)測(cè)方法,提高了電商領(lǐng)域內(nèi)的商品銷量預(yù)測(cè)的可靠性。
【主權(quán)項(xiàng)】
1.一種基于電商銷售數(shù)據(jù)的商品分類提取及在該分類提取下的銷量預(yù)測(cè)方法,其特征在于:首先利用電商企業(yè)銷售數(shù)據(jù)SalesData按照商品銷售的時(shí)間Time對(duì)所有銷售商品進(jìn)行共性提取,獲取所有商品所屬Categoriesfg息; 再利用上述方法中提取的Categories信息匯總商品銷售數(shù)據(jù),對(duì)此類商品建立復(fù)合預(yù)測(cè)模型,獲取SalesForecast值; 具體步驟如下: (1)利用相關(guān)數(shù)據(jù)對(duì)電商銷售地域SalesArea進(jìn)行重新劃分; (2)利用電商企業(yè)的銷售數(shù)據(jù)SalesData按照商品銷售時(shí)間Time對(duì)所有商品進(jìn)行共性提取,獲取所有商品所屬Categories彳目息; (3)在新的Categories下,利用復(fù)合預(yù)測(cè)模型對(duì)商品銷量進(jìn)行預(yù)測(cè)。2.根據(jù)權(quán)利要求1所述的基于電商銷售數(shù)據(jù)的商品分類提取及在該分類提取下的銷量預(yù)測(cè)方法,其特征在于,其中步驟(I)中所述的利用相關(guān)數(shù)據(jù)對(duì)電商銷售地域SalesArea進(jìn)行重新劃分,其操作步驟如下: a、地域相關(guān)要素提取:不同地域間對(duì)于相同產(chǎn)品的銷售模式是不同的,因此在對(duì)電商企業(yè)銷售商品的銷量預(yù)測(cè)研究中,首先要區(qū)別對(duì)待不同地區(qū)的銷售模式;因此首先要通過(guò)相關(guān)性分析,選擇與銷售相關(guān)的外部因素; b、地域重新劃分:通過(guò)相關(guān)性分析得出的因素,例如經(jīng)濟(jì),人口,利用這些外部因素序列通過(guò)聚類的方法,獲取新的地域分類集合4^8={&1、&2、83、......an},其中an第η個(gè)新地域內(nèi)包含有的原始地域信息。3.根據(jù)權(quán)利要求1所述的基于電商銷售數(shù)據(jù)的商品分類提取及在該分類提取下的銷量預(yù)測(cè)方法,其特征在于,其中步驟(2)中所述的利用電商企業(yè)的銷售數(shù)據(jù)SalesData按照商品銷售時(shí)間Time對(duì)所有商品進(jìn)行共性提取,獲取所有商品所屬Categories信息,其操作步驟如下: a、商品銷量信息匯總:在新的銷售地域劃分集合Area內(nèi),對(duì)所售產(chǎn)品按一定的時(shí)間間隔T進(jìn)行統(tǒng)計(jì)匯總,最終獲取所有商品在給定地域內(nèi)的銷售時(shí)間序列SalesTS1H su、Sl2、Si3、......Sin }; b、利用聚類技術(shù)進(jìn)行商品聚類:利用聚類技術(shù)將求出的商品銷售時(shí)間序列行聚類分析操作,獲取商品的新分類信息Categories。4.根據(jù)權(quán)利要求1所述的基于電商銷售數(shù)據(jù)的商品分類提取及在該分類提取下的銷量預(yù)測(cè)方法,其特征在于,上述步驟(3)中所述的在新的Categories下,利用符合預(yù)測(cè)模型對(duì)商品銷量進(jìn)行預(yù)測(cè),其操作步驟如下: a、構(gòu)造基于歷史銷售數(shù)據(jù)的預(yù)測(cè)模型; 根據(jù)不同商品的銷售特征,具有季節(jié)特性的商品銷售序列選擇SARMA時(shí)間序列模型,不具有季節(jié)特性的商品銷售序列選擇ARMA時(shí)間序列模型,利用建立的時(shí)間序列模型擬合歷史數(shù)據(jù)并給出銷量預(yù)測(cè)值; b、利用相關(guān)性分析獲取對(duì)于銷售數(shù)據(jù)有主要影響的外部因素; 由于在可獲得的眾多外部銷量相關(guān)的數(shù)據(jù)中存在大量的數(shù)據(jù),數(shù)據(jù)之間又會(huì)有各種各樣的先關(guān)性關(guān)系,因此,在進(jìn)行外部因素對(duì)于銷量數(shù)據(jù)的影響分析前,首先要通過(guò)二者的相關(guān)性分析確定二者的相關(guān)程度,篩選掉相關(guān)性較小的外部因素;這里采用皮爾森相關(guān)系數(shù)(Pearson correlat1n coefficient)作為相關(guān)性檢驗(yàn)的標(biāo)準(zhǔn); c、利用外部因素建立隱馬爾科夫預(yù)測(cè)模型; 利用外部因素的歷史變化數(shù)據(jù)生成,外部因素變化的預(yù)測(cè)矩陣即隱馬爾科夫模型中的轉(zhuǎn)移概率矩陣,再利用外部因素與銷售變化的歷史數(shù)據(jù)生成混淆矩陣;最后給定初始外部條件觀察值,通過(guò)轉(zhuǎn)移矩陣給出未來(lái)時(shí)段的外部因素概率分布,再通過(guò)混淆矩陣將外部因素的概率分布轉(zhuǎn)化為對(duì)銷量影響的概率分布。
【文檔編號(hào)】G06K9/62GK105956699SQ201610276199
【公開(kāi)日】2016年9月21日
【申請(qǐng)日】2016年4月29日
【發(fā)明人】孫穎
【申請(qǐng)人】連云港天馬網(wǎng)絡(luò)發(fā)展有限公司