本申請涉及數(shù)據(jù)挖掘技術(shù)領(lǐng)域,具體涉及一種預(yù)測庫存分配比例的方法和裝置。本申請同時涉及一種電子設(shè)備。
背景技術(shù):
隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,出現(xiàn)了一種通過公共計算機通信網(wǎng)絡(luò)進行商務(wù)活動的現(xiàn)代商務(wù)方式,即:電子商務(wù)。電子商務(wù)突破了傳統(tǒng)商務(wù)在時間、地域上的限制,具有安全、可靠、快速、明確和方便的特點,已經(jīng)逐漸成為社會生活的主要方式。通過國際互連網(wǎng)絡(luò)(INTERNET)可隨時隨地開展電子商務(wù)活動。
B2C(Business to Consumer,企業(yè)對消費者)模式是一種典型的電子商務(wù)模式。B2C電子商務(wù)網(wǎng)站非常的多。通過B2C模式進行交易,主要涉及三個線上角色:平臺經(jīng)營者、站內(nèi)經(jīng)營者、消費者。其中,平臺經(jīng)營者負責(zé)電子商務(wù)平臺(以下簡稱交易平臺)的運營;站內(nèi)經(jīng)營者又稱企業(yè)或商家,負責(zé)提供商品;消費者通過交易平臺訂購商家提供的商品。除了線上角色,B2C模式還涉及線下角色,例如:物流配送。B2C模式實質(zhì)為線上訂購、線下配送。
與傳統(tǒng)商務(wù)相同,電子商務(wù)的各個商家所經(jīng)營的商品也是存放在全國各地的庫房中。傳統(tǒng)商務(wù)中的商家通常是依據(jù)其近期在各個倉庫的銷售數(shù)據(jù),為各個庫房配備合適數(shù)量的商品。目前,電子商務(wù)的各個商家像傳統(tǒng)商務(wù)一樣,也是根據(jù)其近期在各個倉庫的銷售數(shù)據(jù),為各個庫房配備合適數(shù)量的商品。然而,這種僅根據(jù)各個倉庫的近期銷售數(shù)據(jù),進行庫存分配的方法存在如下缺點:由于其所依據(jù)的歷史銷售數(shù)據(jù)過于簡單,導(dǎo)致庫存分配的準確度低,從而帶來商家供應(yīng)鏈效率低下且消費者體驗差的問題。
因此,現(xiàn)有技術(shù)存在根據(jù)商品在各個庫房的近期銷售數(shù)據(jù)進行庫存分配的分配數(shù)量準確度低的問題。
技術(shù)實現(xiàn)要素:
本申請?zhí)峁┮环N預(yù)測庫存分配比例的方法和裝置,以解決現(xiàn)有技術(shù)存在根據(jù)商品在各個庫房的近期銷售數(shù)據(jù)進行庫存分配的分配數(shù)量準確度低的問題。 本申請另外提供一種電子設(shè)備。
本申請?zhí)峁┮环N預(yù)測庫存分配比例的方法,包括:
獲取待分配商品在待分配倉庫的與銷量相關(guān)的特征數(shù)據(jù),作為預(yù)測用特征數(shù)據(jù);
根據(jù)所述預(yù)測用特征數(shù)據(jù)和預(yù)先生成的預(yù)測模型,生成所述待分配商品在所述待分配倉庫的庫存分配比例的預(yù)測值。
可選的,所述預(yù)測模型采用如下步驟生成:
獲取各個商品在各個倉庫的與銷量相關(guān)的歷史特征數(shù)據(jù)和與所述歷史特征數(shù)據(jù)相對應(yīng)的庫存分配比例--即實際銷售比例,作為訓(xùn)練集;
通過機器學(xué)習(xí)算法,從所述訓(xùn)練集中學(xué)習(xí)獲得所述預(yù)測模型。
可選的,所述機器學(xué)習(xí)算法包括回歸算法。
可選的,所述回歸算法包括線性回歸算法、回歸決策樹算法、迭代決策樹算法或隨機森林算法。
可選的,所述通過機器學(xué)習(xí)算法,從所述訓(xùn)練集中學(xué)習(xí)獲得所述預(yù)測模型,包括:
為所述訓(xùn)練集中的每條訓(xùn)練數(shù)據(jù)分別設(shè)置庫存分配比例的訓(xùn)練用初始預(yù)測值;
根據(jù)所述訓(xùn)練用初始預(yù)測值和所述訓(xùn)練集,采用迭代決策樹算法,生成所述預(yù)測模型。
可選的,所述訓(xùn)練用初始預(yù)測值采用當前次數(shù)之前的預(yù)設(shè)次數(shù)的實際銷售比例的平均值。
可選的,所述根據(jù)所述預(yù)測用特征數(shù)據(jù)和預(yù)先生成的預(yù)測模型,生成所述待分配商品在所述待分配倉庫的庫存分配比例的預(yù)測值,包括:
為所述待分配商品在所述待分配倉庫設(shè)置庫存分配比例的預(yù)測用初始預(yù)測值;
根據(jù)所述預(yù)測用特征數(shù)據(jù)、預(yù)測用初始預(yù)測值和預(yù)先生成的預(yù)測模型,生成所述待分配商品在所述待分配倉庫的庫存分配比例的預(yù)測值。
可選的,所述預(yù)測用初始預(yù)測值采用當前次數(shù)之前的預(yù)設(shè)次數(shù)的實際銷售比例的平均值。
可選的,所述通過機器學(xué)習(xí)算法,從所述訓(xùn)練集中學(xué)習(xí)獲得所述預(yù)測模型,采用如下方式:
根據(jù)預(yù)設(shè)的各種機器學(xué)習(xí)算法,從所述訓(xùn)練集中學(xué)習(xí)獲得與所述預(yù)設(shè)的各種機器學(xué)習(xí)算法分別對應(yīng)的預(yù)測模型。
可選的,所述根據(jù)所述預(yù)測用特征數(shù)據(jù)和預(yù)先生成的預(yù)測模型,生成所述待分配商品在所述待分配倉庫的庫存分配比例的預(yù)測值,包括:
對所述預(yù)測用特征數(shù)據(jù),分別采用學(xué)習(xí)獲得的各個預(yù)測模型進行所述庫存分配比例的預(yù)測,獲得各個預(yù)測模型預(yù)測出的所述庫存分配比例的預(yù)測值;
根據(jù)為各個預(yù)測模型預(yù)測出的預(yù)測值分別預(yù)設(shè)的權(quán)重,對所述各個預(yù)測模型預(yù)測出的所述庫存分配比例的預(yù)測值進行加權(quán)平均計算,作為所述待分配商品在所述待分配倉庫的庫存分配比例的預(yù)測值。
可選的,所述獲取待分配商品在待分配倉庫的與銷量相關(guān)的特征數(shù)據(jù),包括:
獲取預(yù)設(shè)時間范圍內(nèi)所述待分配商品在所述待分配倉庫與銷量相關(guān)的原始數(shù)據(jù);
根據(jù)所述與銷量相關(guān)的原始數(shù)據(jù)和所述特征數(shù)據(jù)的計算公式,計算獲取所述與銷量相關(guān)的特征數(shù)據(jù)。
可選的,所述與銷量相關(guān)的特征數(shù)據(jù)包括如下數(shù)據(jù)的至少一者:
預(yù)設(shè)倉庫中的預(yù)設(shè)商品在預(yù)設(shè)時間范圍內(nèi)的銷售點擊比例;所述銷售點擊比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品的銷售點擊次數(shù)在預(yù)設(shè)商品的總銷售點擊次數(shù)中的比例;
預(yù)設(shè)倉庫中的預(yù)設(shè)商品在預(yù)設(shè)時間范圍內(nèi)的銷售點擊買家比例;所述銷售點擊買家比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品的銷售點擊買家個數(shù)在預(yù)設(shè)商品的總銷售點擊買家個數(shù)中的比例;
預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬的預(yù)設(shè)商家在預(yù)設(shè)時間范圍內(nèi)的拍下點擊比例;所述拍下點擊比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬的預(yù)設(shè)商家的拍下點擊次數(shù),在預(yù)設(shè)商品所屬的預(yù)設(shè)商家的總拍下點擊次數(shù)中的比例;
預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬的預(yù)設(shè)商家在預(yù)設(shè)時間范圍內(nèi)的拍下點擊買家比例;所述拍下點擊買家比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬的預(yù)設(shè)商家的拍下點擊買家個數(shù),在預(yù)設(shè)商品所屬的預(yù)設(shè)商家的總拍下點擊買家個數(shù)中的比 例;
預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬預(yù)設(shè)商家的預(yù)設(shè)商品所屬的商品類別的銷售比例,作為第二銷售比例;所述第二銷售比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬預(yù)設(shè)商家的預(yù)設(shè)商品所屬的商品類別的銷售數(shù)量,在預(yù)設(shè)商品所屬預(yù)設(shè)商家的預(yù)設(shè)商品所屬的商品類別的總銷售數(shù)量中的比例;
預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬的商品類別的銷售比例,作為第三銷售比例;所述第三銷售比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬的商品類別的銷售數(shù)量,在預(yù)設(shè)商品所屬的商品類別的總銷售數(shù)量中的比例;
預(yù)設(shè)商品在預(yù)設(shè)時間范圍內(nèi)的總銷售數(shù)量;
預(yù)設(shè)倉庫中的預(yù)設(shè)商品在預(yù)設(shè)時間范圍內(nèi)的購物車點擊比例;所述購物車點擊比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品的購物車點擊次數(shù)在預(yù)設(shè)商品的總購物車點擊次數(shù)中的比例;
預(yù)設(shè)倉庫中的預(yù)設(shè)商品在預(yù)設(shè)時間范圍內(nèi)的購物車點擊買家比例;所述購物車點擊買家比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品的購物車點擊買家個數(shù)在預(yù)設(shè)商品的總購物車點擊買家個數(shù)中的比例;
預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬的預(yù)設(shè)商家在預(yù)設(shè)時間范圍內(nèi)的收藏夾點擊比例;所述收藏夾點擊比例,是指預(yù)設(shè)商品所屬的預(yù)設(shè)商家的收藏夾點擊次數(shù),在預(yù)設(shè)商品所屬的預(yù)設(shè)商家的總收藏夾點擊次數(shù)中的比例;
預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬的預(yù)設(shè)商家在預(yù)設(shè)時間范圍內(nèi)的收藏夾點擊買家比例;所述收藏夾點擊買家比例,是指預(yù)設(shè)商品所屬的預(yù)設(shè)商家的收藏夾點擊買家個數(shù),在預(yù)設(shè)商品所屬的預(yù)設(shè)商家的總收藏夾點擊買家個數(shù)中的比例;
預(yù)設(shè)倉庫中的預(yù)設(shè)商品的預(yù)定比例;所述預(yù)定比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品的預(yù)定數(shù)量在預(yù)設(shè)商品的總預(yù)定數(shù)量中的比例。
可選的,所述與銷量相關(guān)的特征數(shù)據(jù)還包括:
預(yù)設(shè)倉庫中的預(yù)設(shè)商品的銷售比例,作為第一銷售比例;所述第一銷售比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品的銷售數(shù)量在預(yù)設(shè)商品的總銷售數(shù)量中的比例。
相應(yīng)的,本申請還一種預(yù)測庫存分配比例的裝置,包括:
獲取單元,用于獲取待分配商品在待分配倉庫的與銷量相關(guān)的特征數(shù)據(jù),作為預(yù)測用特征數(shù)據(jù);
預(yù)測單元,用于根據(jù)所述預(yù)測用特征數(shù)據(jù)和預(yù)先生成的預(yù)測模型,生成所述待分配商品在所述待分配倉庫的庫存分配比例的預(yù)測值。
可選的,還包括:
訓(xùn)練單元,用于生成所述預(yù)測模型。
可選的,所述訓(xùn)練單元包括:
獲取子單元,用于獲取各個商品在各個倉庫的與銷量相關(guān)的歷史特征數(shù)據(jù)和與所述歷史特征數(shù)據(jù)相對應(yīng)的庫存分配比例--即實際銷售比例,作為訓(xùn)練集;
學(xué)習(xí)子單元,用于通過機器學(xué)習(xí)算法,從所述訓(xùn)練集中學(xué)習(xí)獲得所述預(yù)測模型。
可選的,所述學(xué)習(xí)子單元包括:
初始值設(shè)置子單元,用于為所述訓(xùn)練集中的每條訓(xùn)練數(shù)據(jù)分別設(shè)置庫存分配比例的訓(xùn)練用初始預(yù)測值;
生成子單元,用于根據(jù)所述訓(xùn)練用初始預(yù)測值和所述訓(xùn)練集,采用迭代決策樹算法,生成所述預(yù)測模型。
可選的,所述訓(xùn)練用初始預(yù)測值采用當前次數(shù)之前的預(yù)設(shè)次數(shù)的實際銷售比例的平均值。
可選的,所述預(yù)測單元包括:
初始值設(shè)置子單元,用于為所述待分配商品在所述待分配倉庫設(shè)置庫存分配比例的預(yù)測用初始預(yù)測值;
計算子單元,用于根據(jù)所述預(yù)測用特征數(shù)據(jù)、預(yù)測用初始預(yù)測值和預(yù)先生成的預(yù)測模型,生成所述待分配商品在所述待分配倉庫的庫存分配比例的預(yù)測值。
可選的,所述通過機器學(xué)習(xí)算法,從所述訓(xùn)練集中學(xué)習(xí)獲得所述預(yù)測模型,采用如下方式:
根據(jù)預(yù)設(shè)的各種機器學(xué)習(xí)算法,從所述訓(xùn)練集中學(xué)習(xí)獲得與所述預(yù)設(shè)的各種機器學(xué)習(xí)算法分別對應(yīng)的預(yù)測模型。
可選的,所述預(yù)測單元包括:
預(yù)測子單元,用于對所述預(yù)測用特征數(shù)據(jù),分別采用學(xué)習(xí)獲得的各個預(yù)測模型進行所述庫存分配比例的預(yù)測,獲得各個預(yù)測模型預(yù)測出的所述庫存分配 比例的預(yù)測值;
計算子單元,用于根據(jù)為各個預(yù)測模型預(yù)測出的預(yù)測值分別預(yù)設(shè)的權(quán)重,對所述各個預(yù)測模型預(yù)測出的所述庫存分配比例的預(yù)測值進行加權(quán)平均計算,作為所述待分配商品在所述待分配倉庫的庫存分配比例的預(yù)測值。
可選的,所述獲取單元包括:
獲取子單元,用于獲取預(yù)設(shè)時間范圍內(nèi)所述待分配商品在所述待分配倉庫與銷量相關(guān)的原始數(shù)據(jù);
計算子單元,用于根據(jù)所述與銷量相關(guān)的原始數(shù)據(jù)和所述特征數(shù)據(jù)的計算公式,計算獲取所述與銷量相關(guān)的特征數(shù)據(jù)。
此外,本申請還提供一種電子設(shè)備,包括:
顯示器;
處理器;以及
存儲器,用于存儲預(yù)測庫存分配比例的裝置,所述預(yù)測庫存分配比例的裝置被所述處理器執(zhí)行時,包括如下步驟:獲取待分配商品在待分配倉庫的與銷量相關(guān)的特征數(shù)據(jù),作為預(yù)測用特征數(shù)據(jù);根據(jù)所述預(yù)測用特征數(shù)據(jù)和預(yù)先生成的預(yù)測模型,生成所述待分配商品在所述待分配倉庫的庫存分配比例的預(yù)測值。
與現(xiàn)有技術(shù)相比,本申請具有以下優(yōu)點:
本申請?zhí)峁┑念A(yù)測庫存分配比例的方法、裝置及電子設(shè)備,通過獲取待分配商品在待分配倉庫的與銷量相關(guān)的特征數(shù)據(jù),并根據(jù)獲取的特征數(shù)據(jù)和預(yù)先生成的預(yù)測模型,生成待分配商品在待分配倉庫的庫存分配比例的預(yù)測值。由于本申請?zhí)峁┑姆椒ㄊ腔谏唐返臍v史銷售行為以及將來可能產(chǎn)生的購買需求等因素綜合評估待分配商品在待分配倉庫的分配比例,因此,提高了庫存分配比例的預(yù)測準確度,避免過多依賴人力進行庫存分配,從而達到降低商品缺貨率和配送時效,提高庫存周轉(zhuǎn)水平和消費者體驗的效果。
附圖說明
圖1是本申請的預(yù)測庫存分配比例的方法實施例的流程圖;
圖2是本申請的預(yù)測庫存分配比例的方法實施例的步驟S101的具體流程圖;
圖3是本申請的預(yù)測庫存分配比例的方法實施例的生成預(yù)測模型的流程圖;
圖4是本申請的預(yù)測庫存分配比例的方法實施例的步驟S303的具體流程圖;
圖5是本申請的預(yù)測庫存分配比例的方法實施例生成的預(yù)測模型的示意圖;
圖6是本申請的預(yù)測庫存分配比例的方法實施例預(yù)測過程的示意圖;
圖7是本申請的預(yù)測庫存分配比例的裝置實施例的示意圖;
圖8是本申請的預(yù)測庫存分配比例的裝置實施例的具體示意圖;
圖9是本申請的電子設(shè)備實施例的示意圖。
具體實施方式
在下面的描述中闡述了很多具體細節(jié)以便于充分理解本申請。但是本申請能夠以很多不同于在此描述的其它方式來實施,本領(lǐng)域技術(shù)人員可以在不違背本申請內(nèi)涵的情況下做類似推廣,因此本申請不受下面公開的具體實施的限制。
在本申請中,提供了一種預(yù)測庫存分配比例的方法和裝置。在下面的實施例中逐一進行詳細說明。
本申請?zhí)峁┑念A(yù)測庫存分配比例的方法,其基本思想是:根據(jù)商品在倉庫中的與銷量有關(guān)的特征數(shù)據(jù),使用預(yù)先訓(xùn)練生成的預(yù)測模型,預(yù)測商品在倉庫中未來一段時間的庫存分配比例。由于本申請?zhí)峁┑姆椒ㄊ歉鶕?jù)商品在倉庫中的多維度特征數(shù)據(jù)出發(fā),預(yù)測商品在倉庫中的庫存分配比例,因此能夠提高庫存分配比例的預(yù)測準確度。
請參考圖1,其為本申請的預(yù)測庫存分配比例的方法實施例的流程圖。所述方法包括如下步驟:
步驟S101:獲取待分配商品在待分配倉庫的與銷量相關(guān)的特征數(shù)據(jù),作為預(yù)測用特征數(shù)據(jù)。
本申請?zhí)峁┑念A(yù)測庫存分配比例的方法對將來庫存重分配比例的預(yù)估,既不是主觀臆斷的,也不是像現(xiàn)有技術(shù)一樣僅根據(jù)過去的庫存分配比例直接給出庫存重分配比例,而是建立在將來可能產(chǎn)生的購買需求的基礎(chǔ)上。由于在實際應(yīng)用中商品需求具有一定連續(xù)性的特點,發(fā)明人發(fā)現(xiàn),可以從商品交易日志以及庫存分配數(shù)據(jù)等數(shù)據(jù)源中加工出對銷量產(chǎn)生影響的數(shù)據(jù),即:與銷量相關(guān)的特征數(shù)據(jù),根據(jù)這些特征數(shù)據(jù)和預(yù)先生成的預(yù)測模型,能夠提高商品庫存分配 比例預(yù)測值的準確度。
本申請所述的與銷量相關(guān)的特征數(shù)據(jù),包括對庫存分配比例的預(yù)測值可能產(chǎn)生影響的各種特征數(shù)據(jù)。不同的特征數(shù)據(jù)對庫存分配比例的預(yù)測值的影響力是不相同的,其中有些特征數(shù)據(jù)對庫存分配比例的預(yù)測值產(chǎn)生較為主要的影響,而另一些特征數(shù)據(jù)對庫存分配比例的預(yù)測值產(chǎn)生較為次要的影響。下面列舉出本實施例中常用的特征數(shù)據(jù)。
1)與日常銷量相關(guān)的特征數(shù)據(jù)
本申請實施例所述的與日常銷量相關(guān)的特征數(shù)據(jù),包括每個商品在每個倉庫的歷史7天、14天、30天、60天銷售IPV/UV/件數(shù)占比;每個供應(yīng)商在每個倉庫的歷史7天、14天、30天、60天拍下IPV/UV/件數(shù)占比;每個供應(yīng)商二級類目在每個倉庫的歷史7天、14天、30天、60天銷售件數(shù)占比;商品的基本信息,如二級類目、葉子類目等;以及商品在歷史7天、14天、30天、60天總銷量等。
本申請實施例所述的UV(Unique Visitor)是指獨立訪問者的數(shù)量。訪問一個網(wǎng)店的一臺電腦客戶端為一個訪客,即:一個獨立訪問者,0:00-24:00同一臺電腦客戶只會被記錄一次。所述的IPV(Page Views)是商品詳情頁面的瀏覽次數(shù),即:買家找到店鋪的寶貝后,點擊進入寶貝詳情頁的次數(shù),也即單品的瀏覽量。所述的IPV_UV是瀏覽過商品詳情的獨立訪問者。
在實際應(yīng)用中,可以通過商家銷售行為和消費者購買行為以及網(wǎng)絡(luò)拓撲結(jié)構(gòu),獲取與日常銷量相關(guān)的特征數(shù)據(jù)所涉及的原始數(shù)據(jù),例如,商品在各個倉庫的拍下及銷售的IPV、UV數(shù)據(jù)、商品歷史銷售量數(shù)據(jù)、供貨商二級類目銷售數(shù)據(jù)以及商品的基本信息等。
2)與未來銷量相關(guān)的特征數(shù)據(jù)
本申請實施例所述的與未來銷量相關(guān)的特征數(shù)據(jù),包括每個商品在每個倉庫的歷史7天、14天、30天、60天購物車IPV/UV/占比;每個商品在每個倉庫的歷史7天、14天、30天、60天收藏夾IPV/UV/占比;預(yù)售商品預(yù)售定金在每個倉庫占比等。
要實施本申請?zhí)峁┑姆椒?,首先需要獲取待分配商品在待分配倉庫的與銷量相關(guān)的特征數(shù)據(jù),將其作為預(yù)測用的多維度特征數(shù)據(jù)。本申請實施例所述的待分配商品在待分配倉庫的與銷量相關(guān)的特征數(shù)據(jù),即可以是預(yù)先生成并存儲 好的特征數(shù)據(jù),還可以是根據(jù)與銷量相關(guān)的原始數(shù)據(jù)和特征數(shù)據(jù)計算公式,實時計算生成的特征數(shù)據(jù)。
在實際應(yīng)用中,如果已經(jīng)預(yù)先生成所述待分配商品在待分配倉庫的與銷量相關(guān)的特征數(shù)據(jù),則僅需以所述待分配商品和所述待分配倉庫為檢索條件,通過數(shù)據(jù)檢索方法,獲取所述待分配商品在待分配倉庫的與銷量相關(guān)的特征數(shù)據(jù)。如果沒有預(yù)先生成所述待分配商品在待分配倉庫的與銷量相關(guān)的特征數(shù)據(jù),則需要根據(jù)與所述待分配商品和所述待分配倉庫的銷量相關(guān)的原始數(shù)據(jù),按照所述特征數(shù)據(jù)的計算公式,生成所述待分配商品在待分配倉庫的與銷量相關(guān)的特征數(shù)據(jù)。
請參考圖2,其為本申請的預(yù)測庫存分配比例的方法實施例步驟S101的具體流程圖。具體地,所述獲取待分配商品在待分配倉庫的與銷量相關(guān)的特征數(shù)據(jù),包括如下步驟:
步驟S1011:獲取預(yù)設(shè)時間范圍內(nèi)所述待分配商品在所述待分配倉庫與銷量相關(guān)的原始數(shù)據(jù)。
數(shù)據(jù)具有一定的有效期,數(shù)據(jù)時間越久遠則對庫存分配比例預(yù)測值的影響越小,為了能夠準確預(yù)測庫存分配比例,并且盡可能減少計算量,通常選取預(yù)設(shè)時間范圍內(nèi)的原始數(shù)據(jù),用于計算與銷量相關(guān)的特征數(shù)據(jù)。在實際應(yīng)用中,可以按天、周、月的時間范圍選取計算用的原始數(shù)據(jù),例如,在本實施例中,選取商品在倉庫的歷史7天、14天、30天、60天銷售IPV/UV/件數(shù)占比等原始數(shù)據(jù)。不同時間范圍內(nèi)的原始數(shù)據(jù)形成的特征數(shù)據(jù)對最終預(yù)測值的影響效果不同,在實際應(yīng)用中,可以根據(jù)具體的需求,選取合適的特征數(shù)據(jù)。
步驟S1013:根據(jù)所述與銷量相關(guān)的原始數(shù)據(jù)數(shù)據(jù)和所述特征數(shù)據(jù)的計算公式,計算獲取所述與銷量相關(guān)的特征數(shù)據(jù)。
在獲取到與銷量相關(guān)的原始數(shù)據(jù)后,根據(jù)預(yù)設(shè)的特征數(shù)據(jù)的計算公式,計算出與銷量相關(guān)的各種特征數(shù)據(jù),以便根據(jù)這些特征數(shù)據(jù)對庫存分配比例進行預(yù)測。下面列舉本實施中所用的部分特征數(shù)據(jù)及其計算公式:
1)預(yù)設(shè)倉庫中的預(yù)設(shè)商品在預(yù)設(shè)時間范圍內(nèi)的銷售點擊比例。
所述銷售點擊比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品的銷售點擊次數(shù)在預(yù)設(shè)商品的總銷售點擊次數(shù)中的比例。
2)預(yù)設(shè)倉庫中的預(yù)設(shè)商品在預(yù)設(shè)時間范圍內(nèi)的銷售點擊買家比例。
所述銷售點擊買家比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品的銷售點擊買家個數(shù)在預(yù)設(shè)商品的總銷售點擊買家個數(shù)中的比例。
3)預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬的預(yù)設(shè)商家在預(yù)設(shè)時間范圍內(nèi)的拍下點擊比例。
所述拍下點擊比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬的預(yù)設(shè)商家的拍下點擊次數(shù),在預(yù)設(shè)商品所屬的預(yù)設(shè)商家的總拍下點擊次數(shù)中的比例。
4)預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬的預(yù)設(shè)商家在預(yù)設(shè)時間范圍內(nèi)的拍下點擊買家比例。
所述拍下點擊買家比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬的預(yù)設(shè)商家的拍下點擊買家個數(shù),在預(yù)設(shè)商品所屬的預(yù)設(shè)商家的總拍下點擊買家個數(shù)中的比例。
5)預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬預(yù)設(shè)商家的預(yù)設(shè)商品所屬的商品類別的銷售比例,作為第二銷售比例。
所述第二銷售比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬預(yù)設(shè)商家的預(yù)設(shè)商品所屬的商品類別的銷售數(shù)量,在預(yù)設(shè)商品所屬預(yù)設(shè)商家的預(yù)設(shè)商品所屬的商品類別的總銷售數(shù)量中的比例。
6)預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬的商品類別的銷售比例,作為第三銷售比例。
所述第三銷售比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬的商品類別的銷售數(shù)量,在預(yù)設(shè)商品所屬的商品類別的總銷售數(shù)量中的比例。
7)預(yù)設(shè)商品在預(yù)設(shè)時間范圍內(nèi)的總銷售數(shù)量。
8)預(yù)設(shè)倉庫中的預(yù)設(shè)商品在預(yù)設(shè)時間范圍內(nèi)的購物車點擊比例。
所述購物車點擊比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品的購物車點擊次數(shù)在預(yù)設(shè)商品的總購物車點擊次數(shù)中的比例。
9)預(yù)設(shè)倉庫中的預(yù)設(shè)商品在預(yù)設(shè)時間范圍內(nèi)的購物車點擊買家比例。
所述購物車點擊買家比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品的購物車點擊買家個數(shù)在預(yù)設(shè)商品的總購物車點擊買家個數(shù)中的比例。
10)預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬的預(yù)設(shè)商家在預(yù)設(shè)時間范圍內(nèi)的收藏夾點擊比例。
所述收藏夾點擊比例,是指預(yù)設(shè)商品所屬的預(yù)設(shè)商家的收藏夾點擊次數(shù),在預(yù)設(shè)商品所屬的預(yù)設(shè)商家的總收藏夾點擊次數(shù)中的比例。
11)預(yù)設(shè)倉庫中的預(yù)設(shè)商品所屬的預(yù)設(shè)商家在預(yù)設(shè)時間范圍內(nèi)的收藏夾點擊買家比例。
所述收藏夾點擊買家比例,是指預(yù)設(shè)商品所屬的預(yù)設(shè)商家的收藏夾點擊買家個數(shù),在預(yù)設(shè)商品所屬的預(yù)設(shè)商家的總收藏夾點擊買家個數(shù)中的比例。
12)預(yù)設(shè)倉庫中的預(yù)設(shè)商品的預(yù)定比例。
所述預(yù)定比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品的預(yù)定數(shù)量在預(yù)設(shè)商品的總預(yù)定數(shù)量中的比例。
13)預(yù)設(shè)倉庫中的預(yù)設(shè)商品的銷售比例,作為第一銷售比例。
所述第一銷售比例,是指預(yù)設(shè)倉庫中的預(yù)設(shè)商品的銷售數(shù)量在預(yù)設(shè)商品的總銷售數(shù)量中的比例。
上面列舉的都只是一些具體的特征數(shù)據(jù),在實際應(yīng)用中,還可以選擇其他形式的特征數(shù)據(jù),不同的特征數(shù)據(jù)都只是具體形式的變更,都不偏離本申請的核心,因此都在本申請的保護范圍之內(nèi)。
步驟S103:根據(jù)所述預(yù)測用特征數(shù)據(jù)和預(yù)先生成的預(yù)測模型,生成所述待分配商品在所述待分配倉庫的庫存分配比例的預(yù)測值。
本申請所述的預(yù)測模型是根據(jù)歷史特征數(shù)據(jù)和與其對應(yīng)的庫存分配比例(即實際銷售比例)學(xué)習(xí)出來的,因此生成預(yù)測模型的過程是一次機器學(xué)習(xí)的過程,并且本申請實施例的機器學(xué)習(xí)是有監(jiān)督的機器學(xué)習(xí)。要進行有監(jiān)督的機器學(xué)習(xí),可以采用的學(xué)習(xí)算法包括回歸算法。回歸算法屬于歸納學(xué)習(xí)的范疇,所謂歸納學(xué)習(xí)是指根據(jù)某概念的一些實例,通過歸納推理得出該概念的一般描述。對于預(yù)測商品在庫房中的庫存分配比例的應(yīng)用而言,能夠采用的回歸算法包括線性回歸、回歸決策樹、迭代決策樹,或者預(yù)設(shè)回歸算法的加權(quán)線性組合等算法。不同算法生成的預(yù)測值的準確度不同,不同算法的計算復(fù)雜度也不相同,在實際應(yīng)用中,根據(jù)具體應(yīng)用需求,可以選擇任意一種回歸算法對商品的庫存分配比例進行預(yù)測。
請參考圖3,其為本申請的預(yù)測庫存分配比例的方法實施例生成預(yù)測模型的具體流程圖。具體地,本申請所述的預(yù)測模型采用如下步驟生成:
步驟S301:獲取各個商品在各個倉庫的與銷量相關(guān)的歷史特征數(shù)據(jù)和與所述歷史特征數(shù)據(jù)相對應(yīng)的庫存分配比例--即實際銷售比例,作為訓(xùn)練集。
為了能夠準確的生成預(yù)測模型,需要獲取大量的訓(xùn)練數(shù)據(jù),即:各個商品 在各個倉庫的與銷量相關(guān)的歷史特征數(shù)據(jù)和與歷史特征數(shù)據(jù)相對應(yīng)的庫存分配比例。其中與歷史特征數(shù)據(jù)相對應(yīng)的所述庫存分配比例的實際值包括商品在倉庫中的真實銷售占比。采用商品在倉庫中的真實銷售占比,作為該商品在該倉庫中的歷史特征數(shù)據(jù)對應(yīng)的庫存分配比例的實際值,其原因在于:使得商品在倉庫中的庫存分配比例剛好與實際銷售比例相同,由此達到從訓(xùn)練集中學(xué)習(xí)獲得的預(yù)測模型的準確性較高的效果。
在實際應(yīng)用中,為減少計算量,同時又要保證依據(jù)的訓(xùn)練數(shù)據(jù)足夠多,需要從所有訓(xùn)練數(shù)據(jù)中隨機選取部分樣本作為訓(xùn)練數(shù)據(jù)。例如,所有訓(xùn)練數(shù)據(jù)100萬條,即有100萬條記錄,每條記錄里的信息記錄了某貨品在某倉庫的對應(yīng)特征,以及所對應(yīng)的庫存分配比例的實際值,隨機選取其中的10萬條記錄作為訓(xùn)練數(shù)據(jù)。本實施例的訓(xùn)練數(shù)據(jù)格式如表一所示:
表一、訓(xùn)練數(shù)據(jù)表
表一中最后一列之前的中間各列表示與銷量有關(guān)的各個特征數(shù)據(jù),最后一列為與特征數(shù)據(jù)相對應(yīng)的庫存分配比例,即實際銷售比例。
步驟S303:通過機器學(xué)習(xí)算法,從所述訓(xùn)練集中學(xué)習(xí)獲得所述預(yù)測模型。
在實際應(yīng)用中,根據(jù)訓(xùn)練集生成預(yù)測模型,可以采用多種具體訓(xùn)練算法,包括線性回歸算法、RDT(Regression Decision Tree,回歸決策樹)算法或GBDT(Gradient Boosting Decision Tree,迭代決策樹)算法等。通過上述各種算法,生成用于預(yù)測庫存分配比例的預(yù)測模型。上述各種不同的訓(xùn)練算法都只是具體實施方式的變更,都不偏離本申請的核心,因此都在本申請的保護范圍之內(nèi)。
通過上述各種不同的訓(xùn)練算法生成的預(yù)測值的準確度是不同的。本申請實施例提供的方法,特征數(shù)據(jù)較多,甚至高達幾十個特征數(shù)據(jù),因而特征數(shù)據(jù)與預(yù)測值之間的關(guān)系可能是非線性的,而線性回歸算法適用于線性的情況,因此采用線性回歸算法生成的預(yù)測值的準確度較差。RDT算法有著很多良好的特性,例如,訓(xùn)練時間復(fù)雜度較低、預(yù)測的過程比較快速,模型容易展示(容易將得到的決策樹做成圖片展示出來)等。但是,單決策樹可能出現(xiàn)過擬合的問題,雖然通過一些方法,如剪枝可以減少這種情況,但是還是不夠的。過擬合是指為了讓訓(xùn)練集精度更高,學(xué)到了很多“僅在訓(xùn)練集上成立的規(guī)律”,導(dǎo)致?lián)Q一個數(shù)據(jù)集當前規(guī)律就不適用了。其實只要允許一棵樹的葉子節(jié)點足夠多,訓(xùn)練集總是能訓(xùn)練到100%準確率的。在訓(xùn)練精度和實際精度(或測試精度)之間,后者才是真正需要達到的目標。
GBDT又叫MART(Multiple Additive Regression Tree),是一種迭代的決策樹算法,該算法由多棵決策樹組成,所有樹的結(jié)論累加起來做最終答案。它在被提出之初就和SVM一起被認為是泛化能力(generalization)較強的算法。GBDT幾乎可用于所有回歸問題(線性/非線性),相對logistic regression僅能用于線性回歸,GBDT的適用面非常廣。GBDT的核心就在于,每一棵樹學(xué)的是之前所 有樹結(jié)論和的殘差,這個殘差就是一個加預(yù)測值后能得到真實值的累加量。GBDT算法最終的結(jié)果是生成N(在本實施例中,實際會有幾百棵以上)棵樹,這樣可以大大的減少單決策樹帶來的缺點,雖然這幾百棵決策樹中的每一棵都很簡單(相對于C4.5這種單決策樹來說),但是他們組合起來確是很強大。
由于GBDT較RDT生成的模型預(yù)測準確度更高,因而本申請實施例采用GBDT算法生成預(yù)測模型。下面給出本實施例中應(yīng)用GBDT算法構(gòu)建預(yù)測模型的過程,以及與該算法對應(yīng)的預(yù)測過程。
請參考圖4,其為本申請的預(yù)測庫存分配比例的方法實施例步驟S303的具體流程圖。
步驟S3031:為所述訓(xùn)練集中的每條訓(xùn)練數(shù)據(jù)分別設(shè)置庫存分配比例的訓(xùn)練用初始預(yù)測值。
由于本申請實施例提供的方法所依據(jù)的特征數(shù)據(jù)較多,甚至高達幾十個特征數(shù)據(jù),因此,本申請實施例采用GBDT算法的時間復(fù)雜度和計算復(fù)雜度均較高。為了減少訓(xùn)練過程的時間復(fù)雜度和計算復(fù)雜度,使得預(yù)測模型盡快收斂,為訓(xùn)練集中的每條訓(xùn)練數(shù)據(jù)分別設(shè)置庫存分配比例的訓(xùn)練用初始預(yù)測值。在訓(xùn)練階段和預(yù)測階段,由于預(yù)先為預(yù)測值設(shè)置了一個初始值,因而計算時間將得到極大的提高。在本實施例中,為了合理的設(shè)置初始預(yù)測值,將當前次數(shù)之前的預(yù)設(shè)次數(shù)的實際銷售比例的平均值作為初始預(yù)測值,這是一種較為符合實際應(yīng)用的初始預(yù)測值選擇方法。
步驟S3033:根據(jù)所述訓(xùn)練用初始預(yù)測值和所述訓(xùn)練集,采用迭代決策樹算法,生成所述預(yù)測模型。
當為所述訓(xùn)練集中的每條訓(xùn)練數(shù)據(jù)分別設(shè)置庫存分配比例的訓(xùn)練用初始預(yù)測值后,根據(jù)所述訓(xùn)練用初始預(yù)測值和所述訓(xùn)練集,采用迭代決策樹算法,即可以生成所述預(yù)測模型。
根據(jù)訓(xùn)練集對預(yù)測模型進行訓(xùn)練,構(gòu)造出N顆決策樹。在構(gòu)造每顆決策樹時,需要尋找樹的最優(yōu)分裂點,對樹進行Y次葉子節(jié)點的分裂。經(jīng)過大量實驗表明,本申請實施例提供的方法,對于每顆決策樹進行8次葉子節(jié)點的分裂,能夠獲得較準確的預(yù)測模型。請參考圖5,其為本申請的預(yù)測庫存分配比例的方法實施例生成的預(yù)測模型的示意圖。當完成步驟S303后,訓(xùn)練結(jié)果為N棵樹。
通過GBDT算法構(gòu)建的每棵樹均是一顆回歸決策樹?;貧w決策樹是一個多 階段決策過程,它不是一次用訓(xùn)練樣本的所有特征進行決策,而是逐次地用各個特征分量進行決策?;貧w決策樹的構(gòu)造一般包括如下步驟:1)為每一個內(nèi)部節(jié)點選擇劃分規(guī)則;2)確定終節(jié)點(Terminal Nodes)?;貧w決策樹的在每個節(jié)點(不一定是葉子節(jié)點)都會得一個預(yù)測值,即:庫存分配比例,該預(yù)測值等于屬于這個節(jié)點的所有商品庫存分配比例的平均值。分枝時窮舉每一個特征的每個閾值找最好的分割點,衡量最好的標準是最小化均方差,即:(每個商品的庫存分配比例-預(yù)測庫存分配比例)^2的總和/N,或者說是每個商品的預(yù)測誤差平方和除以N。通過最小化均方差能夠找到最靠譜的分枝依據(jù)。分枝直到每個葉子節(jié)點上商品的庫存分配比例達到預(yù)設(shè)的終止條件(例如:葉子節(jié)點個數(shù)上限),若最終葉子節(jié)點上商品的庫存分配比例不唯一,則以該節(jié)點上所有商品的平均庫存分配比例做為該葉子節(jié)點的庫存分配比例的預(yù)測值。
回歸決策樹實際上是將空間用超平面進行劃分的一種方法,每次分割的時候,都將當前的空間一分為二,使得每一個葉子節(jié)點都是在空間中的一個不相交的區(qū)域,在進行決策的時候,會根據(jù)輸入的樣本每一維特征數(shù)據(jù)的值,一步一步往下,最后使得樣本落入N個區(qū)域中的一個(假設(shè)有N個葉子節(jié)點)。
綜上所述,構(gòu)造每棵樹時均需要尋找樹的最優(yōu)分裂點,對樹進行Y次葉子節(jié)點的分裂,即對當前樹的所有葉子節(jié)點,進行如下步驟的處理:1)計算每個葉子節(jié)點的最優(yōu)劃分以及其增益(增益是損失函數(shù)減少量,損失減少量可以定義為經(jīng)過該葉子節(jié)點的劃分的庫存分配比例預(yù)測值與庫存分配比例實際值之差的平方和);2)選擇增益最大的葉子節(jié)點及其劃分點進行分裂,將訓(xùn)練樣本劃分到子節(jié)點中;3)更新庫存分配比例預(yù)測值,即更新某商品在某倉庫的庫存分配比例預(yù)測值。
通過上述步驟S3031和步驟S3033生成了預(yù)測模型,該預(yù)測模型供預(yù)測階段使用。在預(yù)測階段,根據(jù)步驟S101獲取到的預(yù)測用特征數(shù)據(jù)和上述采用GBDT算法預(yù)先生成的預(yù)測模型,對所述待分配商品在所述待分配倉庫的庫存分配比例進行預(yù)測。例如,當要預(yù)測某商品Q在某倉庫E的未來兩周的庫存分配比例的預(yù)測值時,首先整理出商品Q在倉庫E的當前特征數(shù)據(jù),根據(jù)特征數(shù)據(jù)和預(yù)先生成的預(yù)測模型,即可得到商品Q在倉庫E的未來兩周的庫存分配比例的預(yù)測值,其中當前特征數(shù)據(jù)如下表二所示:
表二、預(yù)測用特征數(shù)據(jù)表
具體的,步驟S103包括兩個步驟:
步驟S1031:為所述待分配商品在所述待分配倉庫設(shè)置庫存分配比例的預(yù)測用初始預(yù)測值。
步驟S1032:根據(jù)所述預(yù)測用特征數(shù)據(jù)、預(yù)測用初始預(yù)測值和預(yù)先生成的預(yù)測模型,生成所述待分配商品在所述待分配倉庫的庫存分配比例的預(yù)測值。
上述預(yù)測階段的兩個具體步驟(步驟S1031和步驟S1033)與訓(xùn)練階段的兩個具體步驟(步驟S3031和步驟S3033)一一對應(yīng),二者相同之處不再贅述,不同之處在于預(yù)測階段是根據(jù)預(yù)測用特征數(shù)據(jù)、預(yù)測用初始預(yù)測值和預(yù)先生成的預(yù)測模型,生成所述待分配商品在所述待分配倉庫的庫存分配比例的預(yù)測值。
請參考圖6,其為本申請的預(yù)測庫存分配比例的方法實施例預(yù)測過程的示意圖。在本實施例中,根據(jù)貨品Q在倉庫E的前六周庫存分配比例的實際值,計算得到貨品Q在倉庫E未來兩周的庫存分配比例的初始預(yù)測值為20%,根據(jù)預(yù)測用特征數(shù)據(jù),使用訓(xùn)練階段生成的N棵樹,得到最終預(yù)測值:商品Q在倉庫E未來兩周的庫存分配比例的預(yù)測值=20%(初始預(yù)測值)+7%(第一棵樹的增益)-3%(第二棵樹的增益)+2%(第三棵樹的增益)-……=18%。
本申請實施例提供的預(yù)測庫存分配比例的方法,應(yīng)用機器學(xué)習(xí)思想對與銷量相關(guān)的數(shù)據(jù)進行分析,使用GBDT算法建立預(yù)測模型并使用其進行預(yù)測,帶 回驗證表明該預(yù)測模型具有較高精度。在機器已習(xí)得數(shù)據(jù)規(guī)律后,利用預(yù)測模型,對習(xí)得知識后的模型進行知識獲取的分析,得出由機器學(xué)習(xí)過程獲得的有意義的庫存分配比例預(yù)測值,為決策提供客觀依據(jù),具有很強的實用性。
在實際應(yīng)用中,為了提高預(yù)測準確性,還可以將多個回歸算法分別生成的各種具體的預(yù)測模型的組合作為最終的預(yù)測模型。具體的,采用所述通過機器學(xué)習(xí)算法,從所述訓(xùn)練集中學(xué)習(xí)獲得所述預(yù)測模型,采用如下方式:根據(jù)預(yù)設(shè)的各種機器學(xué)習(xí)算法,從所述訓(xùn)練集中學(xué)習(xí)獲得與所述預(yù)設(shè)的各種機器學(xué)習(xí)算法分別對應(yīng)的預(yù)測模型。
本申請實施例所述的預(yù)設(shè)的各種機器學(xué)習(xí)算法可以為各種回歸算法,具體包括線性回歸算法、回歸決策樹算法、迭代決策樹算法或隨機森林算法等算法。在實際應(yīng)用中,可根據(jù)具體的應(yīng)用需求選擇學(xué)習(xí)算法,例如:選擇線性回歸算法和迭代決策樹算法。
與上述訓(xùn)練階段生成的多個具體的預(yù)測模型相對應(yīng),在預(yù)測階段,所述根據(jù)所述預(yù)測用特征數(shù)據(jù)和預(yù)先生成的預(yù)測模型,生成所述待分配商品在所述待分配倉庫的庫存分配比例的預(yù)測值,包括如下步驟:1)對所述預(yù)測用特征數(shù)據(jù),分別采用學(xué)習(xí)獲得的各個預(yù)測模型進行所述庫存分配比例的預(yù)測,獲得各個預(yù)測模型預(yù)測出的所述庫存分配比例的預(yù)測值;2)根據(jù)為各個預(yù)測模型預(yù)測出的預(yù)測值分別預(yù)設(shè)的權(quán)重,對所述各個預(yù)測模型預(yù)測出的所述庫存分配比例的預(yù)測值進行加權(quán)平均計算,作為所述待分配商品在所述待分配倉庫的庫存分配比例的預(yù)測值。
1)對所述預(yù)測用特征數(shù)據(jù),分別采用學(xué)習(xí)獲得的各個預(yù)測模型進行所述庫存分配比例的預(yù)測,獲得各個預(yù)測模型預(yù)測出的所述庫存分配比例的預(yù)測值。
當根據(jù)預(yù)設(shè)的各種機器學(xué)習(xí)算法,從訓(xùn)練集中學(xué)習(xí)獲得與預(yù)設(shè)的各種機器學(xué)習(xí)算法分別對應(yīng)的預(yù)測模型后,在預(yù)測階段,就可以分別采用學(xué)習(xí)獲得的各個預(yù)測模型進行所述庫存分配比例的預(yù)測,從而獲得各個預(yù)測模型預(yù)測出的所述庫存分配比例的預(yù)測值。
2)根據(jù)為各個預(yù)測模型預(yù)測出的預(yù)測值分別預(yù)設(shè)的權(quán)重,對所述各個預(yù)測模型預(yù)測出的所述庫存分配比例的預(yù)測值進行加權(quán)平均計算,作為所述待分配商品在所述待分配倉庫的庫存分配比例的預(yù)測值。
由于各種不同的機器學(xué)習(xí)算法各有優(yōu)缺點,產(chǎn)生的預(yù)測值的精度也不相同, 為此可以預(yù)先為各個預(yù)測模型預(yù)測出的預(yù)測值分別預(yù)設(shè)權(quán)重,然后對各個預(yù)測模型預(yù)測出的庫存分配比例的預(yù)測值進行加權(quán)平均計算,作為待分配商品在待分配倉庫的庫存分配比例的最終預(yù)測值。簡單的,可以為各個預(yù)測模型預(yù)測出的預(yù)測值預(yù)設(shè)相同的權(quán)重。
在上述的實施例中,提供了一種預(yù)測庫存分配比例的方法,與之相對應(yīng)的,本申請還提供一種預(yù)測庫存分配比例的裝置。該裝置是與上述預(yù)測庫存分配比例的方法的實施例相對應(yīng)。
請參看圖7,其為本申請的預(yù)測庫存分配比例的裝置實施例的示意圖。由于裝置實施例基本相似于方法實施例,所以描述得比較簡單,相關(guān)之處參見方法實施例的部分說明即可。下述描述的裝置實施例僅僅是示意性的。
本實施例的一種預(yù)測庫存分配比例的裝置,包括:
獲取單元101,用于獲取待分配商品在待分配倉庫的與銷量相關(guān)的特征數(shù)據(jù),作為預(yù)測用特征數(shù)據(jù);
預(yù)測單元103,用于根據(jù)所述預(yù)測用特征數(shù)據(jù)和預(yù)先生成的預(yù)測模型,生成所述待分配商品在所述待分配倉庫的庫存分配比例的預(yù)測值。
請參看圖8,其為本申請的預(yù)測庫存分配比例的裝置實施例的具體示意圖??蛇x的,還包括:
訓(xùn)練單元201,用于生成所述預(yù)測模型。
可選的,所述訓(xùn)練單元201包括:
獲取子單元2011,用于獲取各個商品在各個倉庫的與銷量相關(guān)的歷史特征數(shù)據(jù)和與所述歷史特征數(shù)據(jù)相對應(yīng)的庫存分配比例--即實際銷售比例,作為訓(xùn)練集;
學(xué)習(xí)子單元2013,用于通過機器學(xué)習(xí)算法,從所述訓(xùn)練集中學(xué)習(xí)獲得所述預(yù)測模型。
可選的,所述學(xué)習(xí)子單元2013包括:
初始值設(shè)置子單元,用于為所述訓(xùn)練集中的每條訓(xùn)練數(shù)據(jù)分別設(shè)置庫存分配比例的訓(xùn)練用初始預(yù)測值;
生成子單元,用于根據(jù)所述訓(xùn)練用初始預(yù)測值和所述訓(xùn)練集,采用迭代決策樹算法,生成所述預(yù)測模型。
可選的,所述訓(xùn)練用初始預(yù)測值采用當前次數(shù)之前的預(yù)設(shè)次數(shù)的實際銷售比例的平均值。
可選的,所述預(yù)測單元103包括:
初始值設(shè)置子單元,用于為所述待分配商品在所述待分配倉庫設(shè)置庫存分配比例的預(yù)測用初始預(yù)測值;
計算子單元,用于所述根據(jù)所述預(yù)測用特征數(shù)據(jù)、預(yù)測用初始預(yù)測值和預(yù)先生成的預(yù)測模型,生成所述待分配商品在所述待分配倉庫的庫存分配比例的預(yù)測值。
可選的,所述通過機器學(xué)習(xí)算法,從所述訓(xùn)練集中學(xué)習(xí)獲得所述預(yù)測模型,采用如下方式:
根據(jù)預(yù)設(shè)的各種機器學(xué)習(xí)算法,從所述訓(xùn)練集中學(xué)習(xí)獲得與所述預(yù)設(shè)的各種機器學(xué)習(xí)算法分別對應(yīng)的預(yù)測模型。
可選的,所述預(yù)測單元103包括:
預(yù)測子單元,用于對所述預(yù)測用特征數(shù)據(jù),分別采用學(xué)習(xí)獲得的各個預(yù)測模型進行所述庫存分配比例的預(yù)測,獲得各個預(yù)測模型預(yù)測出的所述庫存分配比例的預(yù)測值;
計算子單元,用于根據(jù)為各個預(yù)測模型預(yù)測出的預(yù)測值分別預(yù)設(shè)的權(quán)重,對所述各個預(yù)測模型預(yù)測出的所述庫存分配比例的預(yù)測值進行加權(quán)平均計算,作為所述待分配商品在所述待分配倉庫的庫存分配比例的預(yù)測值。
可選的,所述獲取單元101包括:
獲取子單元,用于獲取預(yù)設(shè)時間范圍內(nèi)所述待分配商品在所述待分配倉庫與銷量相關(guān)的原始數(shù)據(jù);
計算子單元,用于根據(jù)所述與銷量相關(guān)的原始數(shù)據(jù)和所述特征數(shù)據(jù)的計算公式,計算獲取所述與銷量相關(guān)的特征數(shù)據(jù)。
在上述的實施例中,提供了一種預(yù)測庫存分配比例的方法和對應(yīng)裝置,本申請還提供一種電子設(shè)備。該設(shè)備是與上述方法和對應(yīng)裝置的實施例相對應(yīng)。
請參考圖9,其為本申請的電子設(shè)備實施例的流程圖。由于設(shè)備實施例基本相似于方法實施例,所以描述得比較簡單,相關(guān)之處參見方法實施例的部分說明即可。下述描述的設(shè)備實施例僅僅是示意性的。
本申請還提供一種電子設(shè)備,包括:顯示器901;處理器902;以及存儲器903,用于存儲預(yù)測庫存分配比例的裝置,所述預(yù)測庫存分配比例的裝置被所述處理器902執(zhí)行時,包括如下步驟:獲取待分配商品在待分配倉庫的與銷量相關(guān)的特征數(shù)據(jù),作為預(yù)測用特征數(shù)據(jù);根據(jù)所述預(yù)測用特征數(shù)據(jù)和預(yù)先生成的預(yù)測模型,生成所述待分配商品在所述待分配倉庫的庫存分配比例的預(yù)測值。
本申請?zhí)峁┑念A(yù)測庫存分配比例的方法、裝置及電子設(shè)備,通過獲取待分配商品在待分配倉庫的與銷量相關(guān)的特征數(shù)據(jù),并根據(jù)獲取的特征數(shù)據(jù)和預(yù)先生成的預(yù)測模型,生成待分配商品在待分配倉庫的庫存分配比例的預(yù)測值。由于本申請?zhí)峁┑姆椒ㄊ腔谏唐返臍v史銷售行為以及將來可能產(chǎn)生的購買需求等因素綜合評估待分配商品在待分配倉庫的分配比例,因此,提高了庫存分配比例的預(yù)測準確度,避免過多依賴人力進行庫存分配,從而達到降低商品缺貨率和配送時效,提高庫存周轉(zhuǎn)水平和消費者體驗的效果。
本申請雖然以較佳實施例公開如上,但其并不是用來限定本申請,任何本領(lǐng)域技術(shù)人員在不脫離本申請的精神和范圍內(nèi),都可以做出可能的變動和修改,因此本申請的保護范圍應(yīng)當以本申請權(quán)利要求所界定的范圍為準。
在一個典型的配置中,計算設(shè)備包括一個或多個處理器(CPU)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。
內(nèi)存可能包括計算機可讀介質(zhì)中的非永久性存儲器,隨機存取存儲器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲器(ROM)或閃存(flash RAM)。內(nèi)存是計算機可讀介質(zhì)的示例。
1、計算機可讀介質(zhì)包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術(shù)來實現(xiàn)信息存儲。信息可以是計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序的模塊或其他數(shù)據(jù)。計算機的存儲介質(zhì)的例子包括,但不限于相變內(nèi)存(PRAM)、靜態(tài)隨機存取存儲器(SRAM)、動態(tài)隨機存取存儲器(DRAM)、其他類型的隨機存取存儲器(RAM)、只讀存儲器(ROM)、電可擦除可編程只讀存儲器(EEPROM)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀存儲器(CD-ROM)、數(shù)字多功能光盤(DVD)或其他光學(xué)存儲、磁盒式磁帶,磁帶磁磁盤存儲或其他磁性存儲設(shè)備或任何其他非傳輸介質(zhì),可用于存儲可以被計算設(shè)備訪問的信息。按照本文中的界定,計算機可讀介質(zhì)不包括非暫存電腦可讀媒體(transitory media),如調(diào)制的數(shù)據(jù)信號和載波。
2、本領(lǐng)域技術(shù)人員應(yīng)明白,本申請的實施例可提供為方法、系統(tǒng)或計算機程序產(chǎn)品。因此,本申請可采用完全硬件實施例、完全軟件實施例或結(jié)合軟件和硬件方面的實施例的形式。而且,本申請可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上實施的計算機程序產(chǎn)品的形式。