本申請涉及數(shù)據(jù)建模技術(shù)領(lǐng)域,具體而言,涉及分品類電子券使用預(yù)測方法、裝置及電子設(shè)備。
背景技術(shù):
電子商務(wù)網(wǎng)站中,電子券的使用較為頻繁,隨著電子商務(wù)的蓬勃發(fā)展,電子券的使用量也越來越多。但是目前的精準(zhǔn)營銷中,電子券的使用比例較低。如何更精準(zhǔn)的提高電子券的使用率至關(guān)重要,其不僅可以為網(wǎng)站帶來一定的新用戶,而且能夠有效地提升網(wǎng)站的gmv(grossmerchandisevolume,商品交易總額),也能夠喚醒沉睡的用戶。
現(xiàn)有的技術(shù)方案是基于gbdt(gradientboostingdecisiontree,基于決策樹實(shí)現(xiàn)的分類回歸算法)分類模型進(jìn)行全分品類電子券使用預(yù)測。通過用戶的購物特征、瀏覽特征、搜索特征、加購特征和關(guān)注特征等,采用gbdt模型進(jìn)行預(yù)測用戶的全品類電子券使用概率,然后根據(jù)模型的準(zhǔn)確率與召回率發(fā)放相應(yīng)的電子券。
上述技術(shù)方案僅能針對全品類電子券進(jìn)行預(yù)測,但是目前基于gbdt單模型的全品類電子券預(yù)auc(areaunderroccurve,一個度量分類模型好壞的一個標(biāo)準(zhǔn)度量分類模型好壞的標(biāo)準(zhǔn))較低,而且全品類電子券的使用場景有限,更多的電子券均屬于限品類的電子券,導(dǎo)致全品類電子券使用率更低,不能滿足日益精細(xì)化的品類運(yùn)營與營銷。
技術(shù)實(shí)現(xiàn)要素:
本申請公開分品類電子券使用預(yù)測方法,使得能預(yù)測指定用戶對指定分品類電子券的使用概率。本發(fā)明的其他特性和優(yōu)點(diǎn)將通過下面的詳細(xì)描述變得顯然,或部分地通過本發(fā)明的實(shí)踐而習(xí)得。
根據(jù)本發(fā)明的第一方面,提供一種分品類電子券使用預(yù)測方法,包括:根據(jù)用戶領(lǐng)取分品類電子券的歷史信息確定模型訓(xùn)練樣本;獲取所述模型訓(xùn)練樣本中所述用戶的特征和所述分品類電子券的特征作為所述模型訓(xùn)練樣本的樣本信息;基于設(shè)定分類模型(例如堆集分類模型)對所述模型訓(xùn)練樣本根據(jù)所述樣本信息進(jìn)行模型訓(xùn)練;基于訓(xùn)練后的所述設(shè)定分類模型預(yù)測給定用戶對給定分品類電子券的使用概率。
根據(jù)一些實(shí)施例,所述用戶的特征包括所述用戶在所述分品類電子券所對應(yīng)品類下的購買特征、瀏覽特征、搜索特征、加購特征、以及關(guān)注特征中的至少一種。
根據(jù)一些實(shí)施例,所述購買特征包括購買sku數(shù)、購買訂單量、購買單價、使用電子券購買訂單量、使用電子券購買金額、以及使用電子券購買單價中的至少一種。
根據(jù)一些實(shí)施例,所述瀏覽特征包括瀏覽總量、預(yù)設(shè)時長的瀏覽量中的至少一種;所述加購特征包括加購sku量、預(yù)設(shè)時長的加購量中的至少一種;和/或所述關(guān)注特征包括關(guān)注sku數(shù)、預(yù)設(shè)時長的關(guān)注量中的至少一種。
根據(jù)一些實(shí)施例,所述分品類電子券的特征包括所述分品類電子券的明細(xì)特征、所述分品類電子券與商品的關(guān)聯(lián)特征。
根據(jù)一些實(shí)施例,所述分品類電子券的明細(xì)特征包括所述分品類電子券的限額、面額、折扣中的至少一種。
根據(jù)一些實(shí)施例,所述分品類電子券與商品的關(guān)聯(lián)特征包括:所述商品的價格與所述分品類電子券的限額的比值、所述商品的價格與所述分品類電子券的面額的比值、以及所述商品的價格與所述商品的當(dāng)前折扣相乘后減去所述分品類電子券的面額三者中的至少一種。
根據(jù)一些實(shí)施例,所述設(shè)定分類模型包括兩層分類模型,所述設(shè)定分類模型采用gbdt分類器進(jìn)行迭代。
根據(jù)一些實(shí)施例,在獲取所述樣本信息之后還包括:根據(jù)所述樣本信息對所述模型訓(xùn)練樣本進(jìn)行清洗。
根據(jù)一些實(shí)施例,根據(jù)所述樣本信息對所述模型訓(xùn)練樣本進(jìn)行清洗包括:根據(jù)所述樣本信息從所述模型訓(xùn)練樣本中剔除異常用戶、將所述樣本信息進(jìn)行標(biāo)準(zhǔn)化處理、以及對所述樣本信息中的異常值和缺失值進(jìn)行處理至少一種操作;其中所述異常用戶包括風(fēng)險用戶、企業(yè)用戶、以及刷單用戶中的至少一種。
根據(jù)一些實(shí)施例,在預(yù)測給定用戶對給定分品類電子券的使用概率之后還包括:根據(jù)所述使用概率確定營銷方案。
根據(jù)一些實(shí)施例,在基于訓(xùn)練后的所述設(shè)定分類模型預(yù)測給定用戶對給定分品類電子券的使用概率之前還包括:對訓(xùn)練后的所述設(shè)定分類模型進(jìn)行評價,根據(jù)評價結(jié)果對所述設(shè)定分類模型進(jìn)行修正。
根據(jù)一些實(shí)施例,對訓(xùn)練后的所述設(shè)定分類模型進(jìn)行評價包括:采用曲線下面積auc對訓(xùn)練后的所述設(shè)定分類模型進(jìn)行評價。
根據(jù)一些實(shí)施例,所述設(shè)定分類模型包括stacking堆集分類模型。
根據(jù)本發(fā)明的第二方面,提供一種分品類電子券使用預(yù)測裝置,其包括:訓(xùn)練樣本確定單元,用于根據(jù)用戶領(lǐng)取分品類電子券的歷史信息確定模型訓(xùn)練樣本;樣本信息獲取單元,用于獲取所述模型訓(xùn)練樣本中所述用戶的特征和所述分品類電子券的特征作為所述模型訓(xùn)練樣本的樣本信息;模型訓(xùn)練單元,用于基于設(shè)定分類模型對所述模型訓(xùn)練樣本根據(jù)所述樣本信息進(jìn)行模型訓(xùn)練;概率預(yù)測單元,用于基于訓(xùn)練后的所述設(shè)定分類模型預(yù)測給定用戶對給定分品類電子券的使用概率。
根據(jù)一些實(shí)施例,所述用戶的特征包括所述用戶在所述分品類電子券所對應(yīng)品類下的購買特征、瀏覽特征、搜索特征、加購特征、以及關(guān)注特征中的至少一種。
根據(jù)一些實(shí)施例,所述購買特征包括購買sku數(shù)、購買訂單量、購買單價、使用電子券購買訂單量、使用電子券購買金額、以及使用電子券購買單價中的至少一種。
根據(jù)一些實(shí)施例,所述瀏覽特征包括瀏覽總量、預(yù)設(shè)時長的瀏覽量中的至少一種;所述加購特征包括加購sku量、預(yù)設(shè)時長的加購量中的至少一種;和/或所述關(guān)注特征包括關(guān)注sku數(shù)、預(yù)設(shè)時長的關(guān)注量中的至少一種。
根據(jù)一些實(shí)施例,所述分品類電子券的特征包括所述分品類電子券的明細(xì)特征、所述分品類電子券與商品的關(guān)聯(lián)特征。
根據(jù)一些實(shí)施例,所述分品類電子券的明細(xì)特征包括所述分品類電子券的限額、面額、折扣中的至少一種。
根據(jù)一些實(shí)施例,所述分品類電子券與商品的關(guān)聯(lián)特征包括:所述商品的價格與所述分品類電子券的限額的比值、所述商品的價格與所述分品類電子券的面額的比值、以及所述商品的價格與所述商品的當(dāng)前折扣相乘后減去所述分品類電子券的面額三者中的至少一種。
根據(jù)一些實(shí)施例,所述設(shè)定分類模型包括兩層分類模型,所述設(shè)定分類模型采用gbdt分類器進(jìn)行迭代。
根據(jù)一些實(shí)施例,所述裝置還包括樣本信息清洗單元,用于在獲取所述樣本信息之后,根據(jù)所述樣本信息對所述模型訓(xùn)練樣本進(jìn)行清洗。
根據(jù)一些實(shí)施例,所述樣本信息清洗單元用于:根據(jù)所述樣本信息從所述模型訓(xùn)練樣本中剔除異常用戶、將所述樣本信息進(jìn)行標(biāo)準(zhǔn)化處理、以及對所述樣本信息中的異常值和缺失值進(jìn)行處理至少一種操作;其中所述異常用戶包括風(fēng)險用戶、企業(yè)用戶、以及刷單用戶中的至少一種。
根據(jù)一些實(shí)施例,所述裝置還包括營銷方案確定單元,用于在預(yù)測給定用戶對給定分品類電子券的使用概率之后,根據(jù)所述使用概率確定營銷方案。
根據(jù)一些實(shí)施例,所述裝置還包括模型評價與修正單元,用于在基于訓(xùn)練后的所述設(shè)定分類模型預(yù)測給定用戶對給定分品類電子券的使用概率之前,對訓(xùn)練后的所述設(shè)定分類模型進(jìn)行評價,根據(jù)評價結(jié)果對所述設(shè)定分類模型進(jìn)行修正。
根據(jù)一些實(shí)施例,所述模型評價與修正單元用于:采用曲線下面積auc對訓(xùn)練后的所述設(shè)定分類模型進(jìn)行評價。
根據(jù)一些實(shí)施例,所述設(shè)定分類模型包括stacking堆集分類模型。
根據(jù)本發(fā)明的第三方面,提供一種電子設(shè)備,包括:處理器;存儲器,存儲用于處理器控制如第一方面任面項(xiàng)操作的指令。
根據(jù)本發(fā)明的第四方面,提供一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,該程序被處理器執(zhí)行時實(shí)現(xiàn)如第一方面任一項(xiàng)所述操作的步驟。
本申請的實(shí)施例提供的技術(shù)方案可以包括以下有益效果:
本申請的實(shí)施例提供的技術(shù)方案能預(yù)測指定用戶對指定分品類電子券的使用概率,能對不同的用戶進(jìn)行不同種類的發(fā)券營銷,從而進(jìn)行精準(zhǔn)營銷,能提升復(fù)購效果,能降低復(fù)購營銷成本。
應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性的,并不能限制本發(fā)明。
附圖說明
通過參照附圖詳細(xì)描述其示例實(shí)施例,本發(fā)明的上述和其他特征及優(yōu)點(diǎn)將變得更加明顯。
圖1示出了根據(jù)本發(fā)明一實(shí)施例的分品類電子券使用預(yù)測方法;
圖2示出了根據(jù)本發(fā)明另一實(shí)施例的分品類電子券使用預(yù)測方法;
圖3示出了根據(jù)本發(fā)明一實(shí)施例一示例所述的stacking模型的架構(gòu);
圖4示出了根據(jù)本發(fā)明一實(shí)施例的分品類電子券使用預(yù)測裝置的框圖;
圖5示出了根據(jù)本發(fā)明另一實(shí)施例的分品類電子券使用預(yù)測裝置的框圖;
圖6示出了根據(jù)本發(fā)明一實(shí)施例的電子設(shè)備。
具體實(shí)施方式
現(xiàn)在將參考附圖更全面地描述示例實(shí)施例。然而,示例實(shí)施例能夠以多種形式實(shí)施,且不應(yīng)被理解為限于在此闡述的實(shí)施例;相反,提供這些實(shí)施例使得本發(fā)明將全面和完整,并將示例實(shí)施例的構(gòu)思全面地傳達(dá)給本領(lǐng)域的技術(shù)人員。在圖中相同的附圖標(biāo)記表示相同或類似的部分,因而將省略對它們的重復(fù)描述。
此外,所描述的特征、結(jié)構(gòu)或特性可以以任何合適的方式結(jié)合在一個或更多實(shí)施例中。在下面的描述中,提供許多具體細(xì)節(jié)從而給出對本發(fā)明的實(shí)施例的充分理解。然而,本領(lǐng)域技術(shù)人員將意識到,可以實(shí)踐本發(fā)明的技術(shù)方案而沒有特定細(xì)節(jié)中的一個或更多,或者可以采用其它的方法、組元、裝置、步驟等。在其它情況下,不詳細(xì)示出或描述公知方法、裝置、實(shí)現(xiàn)或者操作以避免模糊本發(fā)明的各方面。
附圖中所示的方框圖僅僅是功能實(shí)體,不一定必須與物理上獨(dú)立的實(shí)體相對應(yīng)。即,可以采用軟件形式來實(shí)現(xiàn)這些功能實(shí)體,或在一個或多個硬件模塊或集成電路中實(shí)現(xiàn)這些功能實(shí)體,或在不同網(wǎng)絡(luò)和/或處理器裝置和/或微控制器裝置中實(shí)現(xiàn)這些功能實(shí)體。
附圖中所示的流程圖僅是示例性說明,不是必須包括所有的內(nèi)容和操作/步驟,也不是必須按所描述的順序執(zhí)行。例如,有的操作/步驟還可以分解,而有的操作/步驟可以合并或部分合并,因此實(shí)際執(zhí)行的順序有可能根據(jù)實(shí)際情況改變。
圖1示出了根據(jù)本發(fā)明一實(shí)施例的分品類電子券使用預(yù)測方法,本實(shí)施例可適用于根據(jù)用戶領(lǐng)取分品類電子券的歷史信息進(jìn)行模型訓(xùn)練,以通過訓(xùn)練后的模型預(yù)測給定用戶對給定分品類電子券的使用概率的情況,如圖1所示,本實(shí)施例所述的分品類電子券使用預(yù)測方法包括:
在步驟s110中,根據(jù)用戶領(lǐng)取分品類電子券的歷史信息確定模型訓(xùn)練樣本。
需要說明的是,所述電子券包括但不限于優(yōu)惠券、電子紅包、代金券、電子禮金等。
在步驟s120中,獲取所述模型訓(xùn)練樣本中所述用戶的特征和所述分品類電子券的特征作為所述模型訓(xùn)練樣本的樣本信息。
所述用戶的特征主要用于分析用戶對分品類電子券使用的傾向性,具體信息本實(shí)施例對此并不作限定,例如可以是用戶在所述分品類電子券所對應(yīng)品類下的購買特征、瀏覽特征、搜索特征、加購特征、以及關(guān)注特征等一種或一種以上。
例如,所述購買特征可以是購買sku數(shù)、購買訂單量、購買單價、使用電子券購買訂單量、使用電子券購買金額、以及使用電子券購買單價中的一種或一種以上。
例如,所述瀏覽特征可以是瀏覽總量、預(yù)設(shè)時長的瀏覽量中的一種或一種以上。
例如,所述加購特征可以是加購sku量、預(yù)設(shè)時長的加購量中的一種或一種以上。所述關(guān)注特征可以是關(guān)注sku數(shù)、預(yù)設(shè)時長的關(guān)注量中的一種或一種以上。
例如,所述分品類電子券的特征可以是所述分品類電子券的明細(xì)特征、所述分品類電子券與商品的關(guān)聯(lián)特征中的一種或一種以上。
例如,所述分品類電子券的明細(xì)特征可以是所述分品類電子券的限額、面額、折扣中的至少一種或一種以上。
例如,所述分品類電子券與商品的關(guān)聯(lián)特征可以是:所述商品的價格與所述分品類電子券的限額的比值、所述商品的價格與所述分品類電子券的面額的比值、以及所述商品的價格與所述商品的當(dāng)前折扣相乘后減去所述分品類電子券的面額中的一種或一種以上。
需要說明的是,本實(shí)施例中,選定了具體方面的用戶特征之后,并非一成不變,隨著對模型進(jìn)行不斷迭代訓(xùn)練或評估等操作,可能還會對選定的用戶特征的具體方面進(jìn)行調(diào)整和修正,例如增加、刪除和/或替換特征,以進(jìn)一步提高模型評估能力的準(zhǔn)確性。
在步驟s130中,基于設(shè)定分類模型對所述模型訓(xùn)練樣本根據(jù)所述樣本信息進(jìn)行模型訓(xùn)練。
所述設(shè)定分類模型可以是stacking堆集分類模型,例如,所述stacking分類模型可為兩層分類模型,各分類模型可均采用gbdt分類器進(jìn)行迭代。
在步驟s140中,基于訓(xùn)練后的所述設(shè)定分類模型預(yù)測給定用戶對給定分品類電子券的使用概率。
至此,采用本實(shí)施例技術(shù)方案所述的方法可預(yù)測給定用戶對給定分品類電子券的使用概率,其預(yù)測結(jié)果具有較高的準(zhǔn)確性。
進(jìn)一步地,在步驟s120和步驟s130之間,即獲取所述樣本信息之后,根據(jù)所述樣本信息進(jìn)行模型訓(xùn)練之前,還可根據(jù)所述樣本信息對所述模型訓(xùn)練樣本進(jìn)行清洗,以提高訓(xùn)練樣本的質(zhì)量,從而提高預(yù)測的準(zhǔn)確性。
例如根據(jù)所述樣本信息從所述模型訓(xùn)練樣本中剔除異常用戶、將所述樣本信息進(jìn)行標(biāo)準(zhǔn)化處理、以及對所述樣本信息中的異常值和缺失值進(jìn)行處理等。其中剔除所述異常用戶可包括剔除風(fēng)險用戶、企業(yè)用戶、刷單用戶等。
本實(shí)施例的技術(shù)方案能預(yù)測指定用戶對指定分品類電子券的使用概率,能對不同的用戶進(jìn)行不同種類的發(fā)券營銷,從而進(jìn)行精準(zhǔn)營銷,能提升復(fù)購效果,能降低復(fù)購營銷成本。
圖2示出了根據(jù)本發(fā)明另一實(shí)施例的分品類電子券使用預(yù)測方法,如圖2所示,本實(shí)施例所述的分品類電子券使用預(yù)測方法包括:
在步驟s210中,根據(jù)用戶領(lǐng)取分品類電子券的歷史信息確定模型訓(xùn)練樣本。
例如,提取近1年領(lǐng)取過分品類電子券的用戶作為模型訓(xùn)練的樣本。其中已領(lǐng)取尚未使用的標(biāo)簽為0,已領(lǐng)取且已使用的標(biāo)簽為1。
在步驟s220中,獲取所述模型訓(xùn)練樣本中所述用戶的特征和所述分品類電子券的特征作為所述模型訓(xùn)練樣本的樣本信息。
所述用戶的特征可從如下幾個方面獲得,例如:
用戶購買特征:計算用戶在該品類下的購買明細(xì),如:購買sku數(shù),購買訂單量,購買金額,購買客單價,使用電子券購買訂單量,使用電子券購買金額,使用電子券購買客單價等,以及用戶在全站的購買明細(xì)。
用戶瀏覽特征:計算用戶在該品類下的瀏覽明細(xì),如:瀏覽總量,3天瀏覽量,7天瀏覽量,15天瀏覽量,30天瀏覽量等,以及用戶在全站的瀏覽明細(xì)。
用戶搜索特征:計算用戶搜索目標(biāo)品類的高相關(guān)詞的次數(shù),搜索電子券相關(guān)詞(電子券、活動等)的次數(shù),以及用戶在全站的搜索次數(shù)。
用戶加購特征:計算用戶在該品類下的加購明細(xì),如:加購sku數(shù),3天加購量,7天加購量,15天加購量,30天加購量等,以及用戶在全站的加購明細(xì)。
用戶關(guān)注特征:計算用戶在該品類下的關(guān)注明細(xì),如:關(guān)注sku數(shù),3天關(guān)注量,7天關(guān)注量,15天關(guān)注量,30天關(guān)注量等,以及用戶在全站的關(guān)注明細(xì)。
電子券特征:計算分品類電子券的明細(xì)特征,如:限額,面額,折扣等。
商品——券特征:計算商品與電子券相關(guān)聯(lián)的特征,例如獲取商品價/限額,商品價/面額,商品價*折扣-面額等。
在步驟s230中,根據(jù)所述樣本信息對所述模型訓(xùn)練樣本進(jìn)行清洗。
例如,首先根據(jù)具體的業(yè)務(wù)場景需求,需要排除刷單用戶、風(fēng)險用戶和企業(yè)用戶等異常用戶,確保模型的適用性和健壯性。其次,需要排除某些異常值,補(bǔ)全缺失值等。最后,需要對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。
在步驟s240中,基于stacking分類模型對所述模型訓(xùn)練樣本根據(jù)所述樣本信息進(jìn)行模型訓(xùn)練。
本實(shí)施例的步驟以stacking分類模型說明本實(shí)施例的技術(shù)方案,圖3示出了根據(jù)本發(fā)明一實(shí)施例一示例所述的stacking模型的架構(gòu),310為訓(xùn)練集。如圖3所示,本實(shí)施例示例的stacking分類模型可分為兩層,例如第一層中訓(xùn)練多個不同的模型,然后再以第一層訓(xùn)練的各個模型的輸出作為輸入來訓(xùn)練第二層的模型,以得到一個最終的輸出。例如該示例所述的模型的第一層有五個分類模型,第二層有一個分類模型。例如,在第一層中,對于不同的分類模型,分別將訓(xùn)練數(shù)據(jù)分為5份,接下來用gbdt分類器迭代5次。每次迭代時,將4份數(shù)據(jù)作為訓(xùn)練集對每個分類模型進(jìn)行訓(xùn)練,然后剩下1份數(shù)據(jù)在訓(xùn)練好的分類模型上進(jìn)行預(yù)測并且保留結(jié)果。當(dāng)5次迭代都完成以后,就獲得了一個完整的預(yù)測集。重復(fù)這個過程五次,每次都采用上述過程進(jìn)行迭代訓(xùn)練,可以得到5個完整的預(yù)測集。然后將這些預(yù)測集作為特征輸入到第二層的模型中進(jìn)行訓(xùn)練,此時全部模型訓(xùn)練完畢。
每次迭代均可采用gbdt分類器,該算法由多棵決策樹串行組成。傳統(tǒng)的boost算法在初始化時,為每一個樣本賦一個相等的權(quán)重。在每一棵樹訓(xùn)練后,增加錯誤分類點(diǎn)的權(quán)重,減少正確分類點(diǎn)的權(quán)重,這樣可使錯誤分類的點(diǎn)被賦上一個很高的權(quán)重,在進(jìn)行了n次迭代后,將會得到n個簡單的決策樹,將其組合起來得到一個最終的分類模型。而gbdt分類器與傳統(tǒng)的boost的區(qū)別是,每一次的計算是為了減少上一次的殘差,其在殘差減少的梯度方向上建立了一個新的模型。每個新的模型能使得之前模型的殘差往梯度方向減少。
需要說明的是,每次迭代所采用的分類器本實(shí)施例對此并不作限定。由于gbdt模型效果較好,所以第一層和第二層中均可使用gbdt模型。
在步驟s250中,對訓(xùn)練后的所述stacking分類模型進(jìn)行評價。
例如可采用曲線下面積auc對訓(xùn)練后的所述stacking分類模型進(jìn)行評價。例如可將auc(areaunderthecurveofroc)是roc(receiveroperatingcharacteristiccurve)曲線下方的面積,來作為判斷二分類預(yù)測模型優(yōu)劣的標(biāo)準(zhǔn)。roc曲線的橫坐標(biāo)是偽陽性率(也叫假正類率,falsepositiverate),縱坐標(biāo)是真陽性率(真正類率,truepositiverate)。
auc的計算可采用如下步驟執(zhí)行:
(1)對預(yù)測的概率值從大到小進(jìn)行排序;
(2)令最大概率值對應(yīng)的樣本的rank為n,第二大概率值對應(yīng)樣本的rank為n-1,以此類推;
(3)把所有的正類樣本的rank相加,再減去m-1種兩個正樣本組合的情況。得到的就是所有的樣本中有多少對正類樣本的概率值大于負(fù)類樣本的概率值。然后再除以m×n。
具體計算公式如下:
其中,m+表示正例樣本的數(shù)量。需要說明的是,使用auc可以避免把預(yù)測概率轉(zhuǎn)換成類別。
在步驟s260中,判斷評價結(jié)果是否滿足要求,若是則執(zhí)行步驟s280,否則執(zhí)行步驟s270。
在步驟s270中,根據(jù)評價結(jié)果對所述stacking分類模型進(jìn)行修正,執(zhí)行步驟s280。
在步驟s280中,基于訓(xùn)練后的所述stacking分類模型預(yù)測給定用戶對給定分品類電子券的使用概率。
在步驟s290中,根據(jù)所述使用概率確定營銷方案。
利用上述基于stacking分類模型的分品類電子券使用預(yù)測方法,可輸出每個用戶在相應(yīng)三級品類下各電子券折扣率的使用概率值,這些概率值即用戶在具體品類下的電子券促銷敏感度,例如在復(fù)購促銷場景中,業(yè)務(wù)方在篩選完潛在客戶后,利用該模型計算出各用戶對不同電子券的具體敏感度分值,之后可針對不同分值的用戶進(jìn)行不同種類的發(fā)券營銷,從而進(jìn)行精準(zhǔn)營銷,提升復(fù)購效果,降低復(fù)購營銷成本。
本實(shí)施例所述技術(shù)方案解決了分品類電子券促銷敏感度的預(yù)測問題,有效地提高了電子券促銷敏感度預(yù)測的準(zhǔn)確率。
圖4示出了根據(jù)本發(fā)明一實(shí)施例的分品類電子券使用預(yù)測裝置的框圖,如圖4所示,本實(shí)施例所述的分品類電子券使用預(yù)測裝置包括訓(xùn)練樣本確定單元410、樣本信息獲取單元420、模型訓(xùn)練單元430、以及概率預(yù)測單元440。
該訓(xùn)練樣本確定單元410被配置為,用于根據(jù)用戶領(lǐng)取分品類電子券的歷史信息確定模型訓(xùn)練樣本;
該樣本信息獲取單元420被配置為,用于獲取所述模型訓(xùn)練樣本中所述用戶的特征和所述分品類電子券的特征作為所述模型訓(xùn)練樣本的樣本信息;
該模型訓(xùn)練單元430被配置為,用于基于stacking分類模型對所述模型訓(xùn)練樣本根據(jù)所述樣本信息進(jìn)行模型訓(xùn)練;
該概率預(yù)測單元440被配置為,用于基于訓(xùn)練后的所述stacking分類模型預(yù)測給定用戶對給定分品類電子券的使用概率。
根據(jù)本發(fā)明的一些實(shí)施例,所述用戶的特征包括所述用戶在所述分品類電子券所對應(yīng)品類下的購買特征、瀏覽特征、搜索特征、加購特征、以及關(guān)注特征中的至少一種。
根據(jù)本發(fā)明的一些實(shí)施例,所述購買特征包括購買sku數(shù)、購買訂單量、購買單價、使用電子券購買訂單量、使用電子券購買金額、以及使用電子券購買單價中的至少一種。
根據(jù)本發(fā)明的一些實(shí)施例:所述瀏覽特征包括瀏覽總量、預(yù)設(shè)時長的瀏覽量中的至少一種;所述加購特征包括加購sku量、預(yù)設(shè)時長的加購量中的至少一種;和/或所述關(guān)注特征包括關(guān)注sku數(shù)、預(yù)設(shè)時長的關(guān)注量中的至少一種。
根據(jù)本發(fā)明的一些實(shí)施例,所述分品類電子券的特征包括所述分品類電子券的明細(xì)特征、所述分品類電子券與商品的關(guān)聯(lián)特征。
根據(jù)本發(fā)明的一些實(shí)施例,所述分品類電子券的明細(xì)特征包括所述分品類電子券的限額、面額、折扣中的至少一種。
根據(jù)本發(fā)明的一些實(shí)施例,所述分品類電子券與商品的關(guān)聯(lián)特征包括:所述商品的價格與所述分品類電子券的限額的比值、所述商品的價格與所述分品類電子券的面額的比值、以及所述商品的價格與所述商品的當(dāng)前折扣相乘后減去所述分品類電子券的面額三者中的至少一種。
根據(jù)本發(fā)明的一些實(shí)施例,所述設(shè)定分類模型包括兩層分類模型,所述設(shè)定分類模型采用gbdt分類器進(jìn)行迭代。
關(guān)于上述實(shí)施例中的裝置,其中各個單元執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實(shí)施例中進(jìn)行了詳細(xì)描述,此處將不做詳細(xì)闡述說明。
本實(shí)施例提供的分品類電子券使用預(yù)測裝置可執(zhí)行本發(fā)明方法實(shí)施例所提供的分品類電子券使用預(yù)測方法,具備執(zhí)行方法相應(yīng)的功能模塊和有益效果。
圖5示出了根據(jù)本發(fā)明另一實(shí)施例的分品類電子券使用預(yù)測裝置的框圖,如圖5所示,本實(shí)施例所述的分品類電子券使用預(yù)測裝置包括:訓(xùn)練樣本確定單元510、樣本信息獲取單元520、樣本信息清洗單元530、模型訓(xùn)練單元540、模型評價與修正單元550、概率預(yù)測單元560、以及概率預(yù)測單元570。
該訓(xùn)練樣本確定單元510被配置為,用于根據(jù)用戶領(lǐng)取分品類電子券的歷史信息確定模型訓(xùn)練樣本;
該樣本信息獲取單元520被配置為,用于獲取所述模型訓(xùn)練樣本中所述用戶的特征和所述分品類電子券的特征作為所述模型訓(xùn)練樣本的樣本信息;
該樣本信息清洗單元530被配置為,用于根據(jù)所述樣本信息對所述模型訓(xùn)練樣本進(jìn)行清洗。
該模型訓(xùn)練單元540被配置為,用于基于設(shè)定分類模型對所述模型訓(xùn)練樣本根據(jù)所述樣本信息進(jìn)行模型訓(xùn)練;
該模型評價與修正單元550被配置為,用于在基于訓(xùn)練后的所述設(shè)定分類模型預(yù)測給定用戶對給定分品類電子券的使用概率之前,對訓(xùn)練后的所述設(shè)定分類模型進(jìn)行評價,根據(jù)評價結(jié)果對所述設(shè)定分類模型進(jìn)行修正。
該概率預(yù)測單元560被配置為,用于基于訓(xùn)練后的所述設(shè)定分類模型預(yù)測給定用戶對給定分品類電子券的使用概率。
該營銷方案確定單元570被配置為,用于在預(yù)測給定用戶對給定分品類電子券的使用概率之后,根據(jù)所述使用概率確定營銷方案。
根據(jù)本發(fā)明的一些實(shí)施例,所述用戶的特征包括所述用戶在所述分品類電子券所對應(yīng)品類下的購買特征、瀏覽特征、搜索特征、加購特征、以及關(guān)注特征中的至少一種。
根據(jù)本發(fā)明的一些實(shí)施例,所述購買特征包括購買sku數(shù)、購買訂單量、購買單價、使用電子券購買訂單量、使用電子券購買金額、以及使用電子券購買單價中的至少一種。
根據(jù)本發(fā)明的一些實(shí)施例,所述瀏覽特征包括瀏覽總量、預(yù)設(shè)時長的瀏覽量中的至少一種;所述加購特征包括加購sku量、預(yù)設(shè)時長的加購量中的至少一種;和/或所述關(guān)注特征包括關(guān)注sku數(shù)、預(yù)設(shè)時長的關(guān)注量中的至少一種。
根據(jù)本發(fā)明的一些實(shí)施例,所述分品類電子券的特征包括所述分品類電子券的明細(xì)特征、所述分品類電子券與商品的關(guān)聯(lián)特征。
根據(jù)本發(fā)明的一些實(shí)施例,所述分品類電子券的明細(xì)特征包括所述分品類電子券的限額、面額、折扣中的至少一種。
根據(jù)本發(fā)明的一些實(shí)施例,所述分品類電子券與商品的關(guān)聯(lián)特征包括:所述商品的價格與所述分品類電子券的限額的比值、所述商品的價格與所述分品類電子券的面額的比值、以及所述商品的價格與所述商品的當(dāng)前折扣相乘后減去所述分品類電子券的面額三者中的至少一種。
根據(jù)本發(fā)明的一些實(shí)施例,所述設(shè)定分類模型包括兩層分類模型,所述設(shè)定分類模型采用gbdt分類器進(jìn)行迭代。
根據(jù)本發(fā)明的一些實(shí)施例,所述樣本信息清洗單元530用于:根據(jù)所述樣本信息從所述模型訓(xùn)練樣本中剔除異常用戶、將所述樣本信息進(jìn)行標(biāo)準(zhǔn)化處理、以及對所述樣本信息中的異常值和缺失值進(jìn)行處理至少一種操作;其中所述異常用戶包括風(fēng)險用戶、企業(yè)用戶、以及刷單用戶中的至少一種。
根據(jù)本發(fā)明的一些實(shí)施例,所述模型評價與修正單元550用于:采用曲線下面積auc對訓(xùn)練后的所述設(shè)定分類模型進(jìn)行評價。根據(jù)本發(fā)明的一些實(shí)施例,所述設(shè)定分類模型包括stacking堆集分類模型。
本實(shí)施例提供的分品類電子券使用預(yù)測裝置可執(zhí)行本發(fā)明方法實(shí)施例所提供的分品類電子券使用預(yù)測方法,具備執(zhí)行方法相應(yīng)的功能模塊和有益效果。
圖6示出了根據(jù)本發(fā)明一實(shí)施例的電子設(shè)備,如圖6所示,電子設(shè)備600可包括處理器610、存儲器620、發(fā)射器630及接收器640。
存儲器620可存儲用于處理器610控制操作處理的指令。存儲器620可包括易失性或非易失性存儲器,如靜態(tài)隨機(jī)存取存儲器(sram)、電可擦除可編程只讀存儲器(eeprom)、可擦除可編程只讀存儲器(eprom)、可編程只讀存儲器(prom)、只讀存儲器(rom)等,本發(fā)明對此沒有限制。
處理器610可調(diào)用存儲器620中存儲的指令控制相關(guān)操作。根據(jù)一實(shí)施例,存儲器620存儲用于處理器610控制以下操作的指令:根據(jù)用戶領(lǐng)取分品類電子券的歷史信息確定模型訓(xùn)練樣本;獲取所述模型訓(xùn)練樣本中所述用戶的特征和所述分品類電子券的特征作為所述模型訓(xùn)練樣本的樣本信息;基于設(shè)定分類模型對所述模型訓(xùn)練樣本根據(jù)所述樣本信息進(jìn)行模型訓(xùn)練;基于訓(xùn)練后的所述設(shè)定分類模型預(yù)測給定用戶對給定分品類電子券的使用概率。
易于理解,存儲器620還可存儲用于處理器610控制根據(jù)本發(fā)明實(shí)施例的其他操作的指令,這里不再贅述。
處理器610還可控制發(fā)射器630和接收器640進(jìn)行信號收發(fā)等。
通過以上的詳細(xì)描述,本領(lǐng)域的技術(shù)人員易于理解,根據(jù)本發(fā)明實(shí)施例的系統(tǒng)和方法具有以下優(yōu)點(diǎn)中的一個或多個。
根據(jù)本發(fā)明的實(shí)施例,所述用戶的特征包括所述用戶在所述分品類電子券所對應(yīng)品類下的購買特征、瀏覽特征、搜索特征、加購特征、以及關(guān)注特征中的至少一種。
根據(jù)本發(fā)明的一些實(shí)施例,在獲取所述樣本信息之后還包括:根據(jù)所述樣本信息對所述模型訓(xùn)練樣本進(jìn)行清洗。
例如根據(jù)所述樣本信息從所述模型訓(xùn)練樣本中剔除異常用戶、將所述樣本信息進(jìn)行標(biāo)準(zhǔn)化處理、以及對所述樣本信息中的異常值和缺失值進(jìn)行處理至少一種操作。其中所述異常用戶包括風(fēng)險用戶、企業(yè)用戶、以及刷單用戶中的至少一種。
根據(jù)一些實(shí)施例,本發(fā)明還提供一種非臨時性計算機(jī)可讀存儲介質(zhì),例如包括指令的存儲器,上述指令可由裝置的處理器執(zhí)行以完成上述方法。例如,非臨時性計算機(jī)可讀存儲介質(zhì)可以是rom、隨機(jī)存取存儲器(ram)、cd-rom、磁帶、軟盤和光數(shù)據(jù)存儲設(shè)備等。當(dāng)存儲介質(zhì)中的指令由終端的處理器執(zhí)行時,使得終端能夠執(zhí)行下述方法:根據(jù)用戶領(lǐng)取分品類電子券的歷史信息確定模型訓(xùn)練樣本;獲取所述模型訓(xùn)練樣本中所述用戶的特征和所述分品類電子券的特征作為所述模型訓(xùn)練樣本的樣本信息;基于設(shè)定分類模型對所述模型訓(xùn)練樣本根據(jù)所述樣本信息進(jìn)行模型訓(xùn)練;基于訓(xùn)練后的所述設(shè)定分類模型預(yù)測給定用戶對給定分品類電子券的使用概率。
本領(lǐng)域技術(shù)人員可以理解,附圖只是示例實(shí)施例的示意圖,附圖中的模塊或流程并不一定是實(shí)施本發(fā)明所必須的,因此不能用于限制本發(fā)明的保護(hù)范圍。
本領(lǐng)域技術(shù)人員可以理解上述各模塊可以按照實(shí)施例的描述分布于裝置中,也可以進(jìn)行相應(yīng)變化唯一不同于本實(shí)施例的一個或多個裝置中。上述實(shí)施例的模塊可以合并為一個模塊,也可以進(jìn)一步拆分成多個子模塊。
以上具體地示出和描述了本發(fā)明的示例性實(shí)施例。應(yīng)該理解,本發(fā)明不限于所公開的實(shí)施例,相反,本發(fā)明意圖涵蓋包含在所附權(quán)利要求的精神和范圍內(nèi)的各種修改和等效布置。