本發(fā)明涉及一種基于移動互聯(lián)網(wǎng)的動態(tài)定價技術(shù),尤其涉及一種共享經(jīng)濟(jì)下的基于數(shù)據(jù)挖掘的動態(tài)定價算法。
背景技術(shù):
隨著移動智能設(shè)備及移動支付的推廣和普及,使得供給和需求方的資源互換具備更高的實時性?;诖?,動態(tài)定價策略得到很大的發(fā)展:uber的動態(tài)定價策略獲得了較大的成功,引起了市場和業(yè)界的高度關(guān)注;airbnb于2015年對其民宿平臺實施了動態(tài)定價策略,用于提示供給方一個相對合理的房租價格,實現(xiàn)了基于數(shù)據(jù)的客觀市場指導(dǎo)和參考,并開源了其機(jī)器學(xué)習(xí)工程(aerosolve)代碼。
在全民共享經(jīng)濟(jì)資源模式興起的當(dāng)前,動態(tài)定價策略在一定程度上很好的解決了服務(wù)的合理定價問題,但其仍有許多需要改進(jìn)的問題,如定價變化過快、節(jié)日或應(yīng)急事件時定價過高、缺乏靈活性等等。
國內(nèi)動態(tài)定價的興起起步不久,目前已有使用案例,如滴滴打車、神州專車。然而其定價的策略較為單一,同時具備較強(qiáng)的局限性,動態(tài)定價并未在其價格制定上占據(jù)主要地位。本文基于特征篩選方法與機(jī)器學(xué)習(xí)方法,對影響定價的多因素及其權(quán)重進(jìn)行探索,并基于此構(gòu)建自動化的動態(tài)定價模型,通過多重定價策略的輔助使用,實現(xiàn)動態(tài)定價算法的優(yōu)化與應(yīng)用,解決了算法應(yīng)用單一、難以進(jìn)行因素干預(yù)、時效性低等問題。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是提供一種共享經(jīng)濟(jì)下的基于數(shù)據(jù)挖掘的動態(tài)定價算法,并基于實際效果,優(yōu)化實現(xiàn)較為靈活的動態(tài)定價策略。本發(fā)明所提出的定價方法分為三個層次,分別為初步定價策略、基于特征篩選進(jìn)行權(quán)重優(yōu)化的定價策略、以及基于機(jī)器學(xué)習(xí)建模測試進(jìn)行權(quán)重優(yōu)化的定價策略。
本發(fā)明所采用的技術(shù)方案是:
一種共享經(jīng)濟(jì)下的基于數(shù)據(jù)挖掘的動態(tài)定價算法,包括如下步驟過:
步驟1、采用初步定價策略,包括如下步驟:
初步定價策略可以有多種類型,且比較靈活,如供給方定價、個性化細(xì)分定價、拍賣定價等多種類型。
多數(shù)服務(wù)商具備服務(wù)端、交易、客戶信息等數(shù)據(jù),同時具備歷史同期及當(dāng)前產(chǎn)品的價格信息等數(shù)據(jù),將服務(wù)端、交易、客戶信息、歷史同期及當(dāng)前產(chǎn)品的價格信息數(shù)據(jù)進(jìn)行收集;基于數(shù)據(jù)挖掘技術(shù),可以實現(xiàn)基于訪問模式、購買模式、習(xí)慣偏好等特征進(jìn)行客戶分層;基于價格與需求之間、銷售商品之間的關(guān)聯(lián)特征進(jìn)行參考定價;基于商品關(guān)注人數(shù)、銷售量、庫存等的時間序列數(shù)據(jù)進(jìn)行預(yù)測定價。
初步定價策略存在個性化分群定價的公平問題、時間序列預(yù)測定價的突發(fā)時段定價不及時問題。因此,需要基于進(jìn)一步的定價策略進(jìn)行混合輔助。
步驟2、基于特征篩選的權(quán)重優(yōu)化
數(shù)據(jù)挖掘的特征提取步驟中,我們需要將盡可能多的信息整合到特征文件中,因此初始特征集包含所有選定特征。然而并非所有特征集中的特征都具有很好的代表性,且過多的特征會使信息冗余,使模型訓(xùn)練過擬合,反而會降低模型的判斷力,因此提取合適的特征則成為提高模型效果的重要環(huán)節(jié)。
有眾多的特征篩選算法可以用來評價不同場景下特征的優(yōu)劣,如主成分分析(principalcomponentanalysis,pca)、最小冗余最大相關(guān)算法(minimal-redundancy-maximal-relevance,mrmr)、方差分析(analysisofvariance,anova)、二項分布(binomialdistribution,bd)等等,本發(fā)明主要使用f-score方法實現(xiàn)特征篩選。
給定訓(xùn)練特征向量x,k=1,2,則第i個特征的f-score可表示為
這里
我們可以看出,在f-score定義中,分子表示當(dāng)前特征在不同數(shù)據(jù)集間的判別力,分母則表示其在各集內(nèi)部序列之間的判別力。可見,分子越大,類別判別越準(zhǔn)確;分母越小,類別判別錯誤率越小。也就是說,f-score值越大,當(dāng)前特征越具有判別力,因此這個分值即可作為特征篩選的評價依據(jù)。
基于產(chǎn)品的所有屬性,及市場的即時需求,轉(zhuǎn)化為樣本特征值,在大量特征集的情況下,基于實際數(shù)據(jù)中,其是否被購買或選定,來進(jìn)行樣本分類,作為后期建模的訓(xùn)練集。
通過f-score方法進(jìn)行特征篩選,找出得分高的特征,并進(jìn)行從高到低順序排列,作為對訂購與否影響依重至輕的特征。
通過歷史數(shù)據(jù)的分析,所有高于閾值的特征信息都考慮到模型中,與動態(tài)定價策略產(chǎn)生相關(guān)。
步驟3、基于機(jī)器學(xué)習(xí)的權(quán)重優(yōu)化
支持向量機(jī)是一種基于統(tǒng)計學(xué)理論的機(jī)器學(xué)習(xí)方法,它集成了學(xué)習(xí)理論vc維(vapnik-chervonenkisdimension)和結(jié)構(gòu)風(fēng)險最小原理,因在處理分類回歸方面表現(xiàn)出色,被廣泛應(yīng)用。其基本原理是通過引入核函數(shù),將輸入向量映射到一個高維的空間,在高維空間中構(gòu)造線性決策函數(shù)來實現(xiàn)回歸,從而很好地解決了非線性分類及回歸問題。
這里假設(shè)樣本集為
其中αi為lagrange因子,b是分類的閾值,而k(xi,xj)為核函數(shù),即實現(xiàn)非線性變換的內(nèi)積函數(shù)。
在支持向量機(jī)中通常有四種內(nèi)積函數(shù)可選用于非線性變換——線性內(nèi)積函數(shù),多項式內(nèi)積函數(shù),sigmoid內(nèi)積函數(shù)及徑向基內(nèi)積函數(shù)。其中以多項式內(nèi)積函數(shù),sigmoid內(nèi)積函數(shù)及徑向基內(nèi)積函數(shù)研究及使用最多,公式如下:
2)多項式形式的內(nèi)積函數(shù):
k(x,xi)=[(x·xi)+1]q(3)
參數(shù)q由用戶預(yù)先指定,這里產(chǎn)生的是一個q階的多項式分類器。
2)sigmoid內(nèi)積函數(shù):
k(x,xi)=tanh[v(x·xi)+c](4)
其中v>0,c<0。使用這個內(nèi)積函數(shù),則得到的就是一個雙層的感知機(jī)神經(jīng)網(wǎng)絡(luò),其權(quán)值及隱藏節(jié)點數(shù)均由算法自動確定。
3)徑向基內(nèi)積函數(shù):
采用上述內(nèi)積函數(shù),得到的支持向量機(jī)是一種區(qū)別于傳統(tǒng)徑向基函數(shù)(rbf)方法的分類器,其每一個內(nèi)積函數(shù)的中心對應(yīng)一個支持向量,其中參數(shù)σ越大,徑向基內(nèi)積函數(shù)的外推能力越弱。
使用支持向量機(jī)回歸(supportvectorregression,svr),通過對特征集的特征進(jìn)行調(diào)整,基于最近及同期的實際交易數(shù)據(jù)進(jìn)行訓(xùn)練,從而構(gòu)建各因素與適時價格的函數(shù)關(guān)系,實現(xiàn)價格預(yù)測。
為保持模型的時效性,每次定價通過動態(tài)的特征提取和數(shù)據(jù)準(zhǔn)備,進(jìn)行動態(tài)建模。并基于所建最優(yōu)模型,進(jìn)行模型的應(yīng)用和價格預(yù)測。
同時,通過將價格信息作為特征之一,進(jìn)行基于支持向量機(jī)的分類預(yù)測,實現(xiàn)成交是否成功的預(yù)測及概率輸出。系統(tǒng)提供靈活的定價,為供給方提供足夠的自由度去訂立價格,并可基于價格計算產(chǎn)品可以售出的概率,用作反饋提醒。
在獲得成功的定價數(shù)據(jù)基礎(chǔ)上,系統(tǒng)通過變動單一屬性特征的方式,進(jìn)行不同產(chǎn)品屬性的權(quán)重調(diào)整,從而實現(xiàn)基于屬性標(biāo)準(zhǔn)的自動參數(shù)設(shè)置,實現(xiàn)動態(tài)定價。
值得一提的是,在整個建模的過程中,需求比例作為重要參考值之一,與其他特征因素對定價產(chǎn)生的影響是不等價的,具體體現(xiàn)為需求的供給具有絕對的影響地位。因此,特征篩選過程中,需求量比例不應(yīng)作為淘汰特征之一。相反的,需要進(jìn)行對應(yīng)性的權(quán)重放大。即在特征集歸一化步驟中,需給予需求量更大的特征間距。
本發(fā)明的有益效果是,本發(fā)明公開的一種共享經(jīng)濟(jì)下的基于數(shù)據(jù)挖掘的動態(tài)定價算法,通過多重定價策略的輔助使用,實現(xiàn)動態(tài)定價算法的優(yōu)化與應(yīng)用,解決了算法應(yīng)用單一、難以進(jìn)行因素干預(yù)、時效性低等問題。
下面結(jié)合附圖對本發(fā)明作進(jìn)一步詳細(xì)描述。
附圖說明
圖1為本發(fā)明具體實施例的數(shù)據(jù)挖掘?qū)崿F(xiàn)過程示意圖;
圖2為支持向量機(jī)示意圖。
圖3為本發(fā)明共享經(jīng)濟(jì)下的基于數(shù)據(jù)挖掘的動態(tài)定價算法的動態(tài)定價策略架構(gòu)圖。
具體實施方式
為了加深對本發(fā)明的理解,下面結(jié)合附圖和實施例對本發(fā)明作進(jìn)一步詳細(xì)的說明。以下實施例僅用于更加清楚地說明本發(fā)明的技術(shù)方案,而不能以此來限制本發(fā)明的保護(hù)范圍。
一種共享經(jīng)濟(jì)下的基于數(shù)據(jù)挖掘的動態(tài)定價算法,包括如下步驟過:
步驟1、采用初步定價策略,包括如下步驟:
初步定價策略可以有多種類型,且比較靈活,如供給方定價、個性化細(xì)分定價、拍賣定價等多種類型。
多數(shù)服務(wù)商具備服務(wù)端、交易、客戶信息等數(shù)據(jù),同時具備歷史同期及當(dāng)前產(chǎn)品的價格信息等數(shù)據(jù)?;跀?shù)據(jù)挖掘技術(shù),可以實現(xiàn)基于訪問模式、購買模式、習(xí)慣偏好等特征進(jìn)行客戶分層;基于價格與需求之間、銷售商品之間的關(guān)聯(lián)特征進(jìn)行參考定價;基于商品關(guān)注人數(shù)、銷售量、庫存等的時間序列數(shù)據(jù)進(jìn)行預(yù)測定價等等。
然而初步定價策略同時存在一定的問題,如個性化分群定價的公平問題、時間序列預(yù)測定價的突發(fā)時段定價不及時問題等。因此,需要基于進(jìn)一步的定價策略進(jìn)行混合輔助。
步驟2、基于特征篩選的權(quán)重優(yōu)化
數(shù)據(jù)挖掘的特征提取步驟中,我們需要將盡可能多的信息整合到特征文件中,因此初始特征集包含所有選定特征。然而并非所有特征集中的特征都具有很好的代表性,且過多的特征會使信息冗余,使模型訓(xùn)練過擬合,反而會降低模型的判斷力,因此提取合適的特征則成為提高模型效果的重要環(huán)節(jié)。
有眾多的特征篩選算法可以用來評價不同場景下特征的優(yōu)劣,如主成分分析(principalcomponentanalysis,pca)、最小冗余最大相關(guān)算法(minimal-redundancy-maximal-relevance,mrmr)、方差分析(analysisofvariance,anova)、二項分布(binomialdistribution,bd)等等,本發(fā)明主要使用f-score方法實現(xiàn)特征篩選。
給定訓(xùn)練特征向量x,k=1,2,則第i個特征的f-score可表示為
這里
我們可以看出,在f-score定義中,分子表示當(dāng)前特征在不同數(shù)據(jù)集間的判別力,分母則表示其在各集內(nèi)部序列之間的判別力??梢姡肿釉酱?,類別判別越準(zhǔn)確;分母越小,類別判別錯誤率越小。也就是說,f-score值越大,當(dāng)前特征越具有判別力,因此這個分值即可作為特征篩選的評價依據(jù)。
基于產(chǎn)品的所有屬性,及市場的即時需求,轉(zhuǎn)化為樣本特征值,在大量特征集的情況下,基于實際數(shù)據(jù)中,其是否被購買或選定,來進(jìn)行樣本分類,作為后期建模的訓(xùn)練集。
通過f-score方法進(jìn)行特征篩選,找出得分高的特征,并進(jìn)行從高到低順序排列,作為對訂購與否影響依重至輕的特征。
通過歷史數(shù)據(jù)的分析,所有高于閾值的特征信息都考慮到模型中,與動態(tài)定價策略產(chǎn)生相關(guān)。
步驟3、基于機(jī)器學(xué)習(xí)的權(quán)重優(yōu)化
支持向量機(jī)是一種基于統(tǒng)計學(xué)理論的機(jī)器學(xué)習(xí)方法,它集成了學(xué)習(xí)理論vc維(vapnik-chervonenkisdimension)和結(jié)構(gòu)風(fēng)險最小原理,因在處理分類回歸方面表現(xiàn)出色,被廣泛應(yīng)用。其基本原理是通過引入核函數(shù),將輸入向量映射到一個高維的空間,在高維空間中構(gòu)造線性決策函數(shù)來實現(xiàn)回歸,從而很好地解決了非線性分類及回歸問題。
這里假設(shè)樣本集為
其中αi為lagrange因子,b是分類的閾值,而k(xi,xj)為核函數(shù),即實現(xiàn)非線性變換的內(nèi)積函數(shù)。
在支持向量機(jī)中通常有四種內(nèi)積函數(shù)可選用于非線性變換——線性內(nèi)積函數(shù),多項式內(nèi)積函數(shù),sigmoid內(nèi)積函數(shù)及徑向基內(nèi)積函數(shù)。其中以多項式內(nèi)積函數(shù),sigmoid內(nèi)積函數(shù)及徑向基內(nèi)積函數(shù)研究及使用最多,公式如下:
3)多項式形式的內(nèi)積函數(shù):
k(x,xi)=[(x·xi)+1]q(3)
參數(shù)q由用戶預(yù)先指定,這里產(chǎn)生的是一個q階的多項式分類器。
2)sigmoid內(nèi)積函數(shù):
k(x,xi)=tanh[v(x·xi)+c]
(4)
其中v>0,c<0。使用這個內(nèi)積函數(shù),則得到的就是一個雙層的感知機(jī)神經(jīng)網(wǎng)絡(luò),其權(quán)值及隱藏節(jié)點數(shù)均由算法自動確定。
3)徑向基內(nèi)積函數(shù):
采用這個內(nèi)積函數(shù),得到的支持向量機(jī)是一種區(qū)別于傳統(tǒng)徑向基函數(shù)(rbf)方法的分類器,其每一個內(nèi)積函數(shù)的中心對應(yīng)一個支持向量,其中參數(shù)σ越大,徑向基內(nèi)積函數(shù)的外推能力越弱。
使用支持向量機(jī)回歸(supportvectorregression,svr),通過對特征集的特征進(jìn)行調(diào)整,基于最近及同期的實際交易數(shù)據(jù)進(jìn)行訓(xùn)練,從而構(gòu)建各因素與適時價格的函數(shù)關(guān)系,實現(xiàn)價格預(yù)測。
為保持模型的時效性,每次定價通過動態(tài)的特征提取和數(shù)據(jù)準(zhǔn)備,進(jìn)行動態(tài)建模。并基于所建最優(yōu)模型,進(jìn)行模型的應(yīng)用和價格預(yù)測。
同時,通過將價格信息作為特征之一,進(jìn)行基于支持向量機(jī)的分類預(yù)測,實現(xiàn)成交是否成功的預(yù)測及概率輸出。系統(tǒng)提供靈活的定價,為供給方提供足夠的自由度去訂立價格,并可基于價格計算產(chǎn)品可以售出的概率,用作反饋提醒。
在獲得成功的定價數(shù)據(jù)基礎(chǔ)上,系統(tǒng)通過變動單一屬性特征的方式,進(jìn)行不同產(chǎn)品屬性的權(quán)重調(diào)整,從而實現(xiàn)基于屬性標(biāo)準(zhǔn)的自動參數(shù)設(shè)置,實現(xiàn)動態(tài)定價。
值得一提的是,在整個建模的過程中,需求比例作為重要參考值之一,與其他特征因素對定價產(chǎn)生的影響是不等價的,具體體現(xiàn)為需求的供給具有絕對的影響地位。因此,特征篩選過程中,需求量比例不應(yīng)作為淘汰特征之一。相反的,需要進(jìn)行對應(yīng)性的權(quán)重放大。即在特征集歸一化步驟中,需給予需求量更大的特征間距。
本發(fā)明的具體實施例,
以一款移動端的旅游共享經(jīng)濟(jì)應(yīng)用平臺為例,該平臺為個人旅游創(chuàng)業(yè)者提供資金、技術(shù)、營銷及交易撮合扶助,降低創(chuàng)業(yè)門檻。倡導(dǎo)個人共享閑置資源、技術(shù)、能力,創(chuàng)造額外收益,為用戶提供基于旅游的社交平臺及差異化、個性化旅游產(chǎn)品服務(wù)。該平臺以社交為入口,把握中國移動互聯(lián)網(wǎng)未來重要的流量入口,目前該項目已在張家界、鎮(zhèn)江、三亞等地落地。
該平臺的動態(tài)定價是以移動app為社交的溝通媒介,所展開的一種類拍賣的方式進(jìn)行的。拍賣機(jī)制是:賣家設(shè)置的一個起始價格,低起拍價格為10元。同時賣家可以自定義加價幅度,也可以使用系統(tǒng)自動代理加價;前者是固定不變的,而后者的加價幅度是隨著當(dāng)前出價金額的增加而增加的,但是對應(yīng)固定的“當(dāng)前價格”,其加價幅度也是固定的。買家可以在超越前一個人的出價記錄以及不小于賣家設(shè)置的加價幅度的情況下,自己出價或者采用代理出價的方式。代理出價是指系統(tǒng)根據(jù)買家所輸入的高價格,在有其他買家出價時,自動以小加價金額向上出價,以維持買家高出價者的位置,直到買家的高出價被其他買家超過為止。在系統(tǒng)自動代理加價的情況下,價格變動幅度是間接的由消費者需求決定的,有購買意愿的人越多,出價次數(shù)就越多,從而就導(dǎo)致了較高的“當(dāng)前價格”,這樣就隨之提升了加價幅度。也就是說,在app上拍賣的初始價格是賣家根據(jù)市場信息以及成本一收益而確定的,加價幅度是固定不變的或者是僅僅由需求間接決定的,而且是對所有商品都通用的。這種定價機(jī)制很簡單,但缺陷也很多。在現(xiàn)行的拍賣機(jī)制下,賣家很難搜集全面的客戶及競爭對手信息,不能對其進(jìn)行深度挖掘,也就不能依據(jù)客戶特征進(jìn)行差別化定價,也做不到對不同的商品依據(jù)時間變化、需求、庫存情況做出及時、適當(dāng)?shù)募觾r幅度的調(diào)整,從而不能達(dá)到客戶大滿意和賣家收入大化的目的。而基于數(shù)據(jù)挖掘的電子商務(wù)動態(tài)定價模型的引入則可以解決這個問題。系統(tǒng)可以搭建數(shù)據(jù)挖掘平臺完成模型中數(shù)據(jù)層和分析層的任務(wù),即通過搜集買賣雙方以及外部市場的數(shù)據(jù)、建立數(shù)據(jù)倉庫、進(jìn)行數(shù)據(jù)挖掘形成輔助定價決策的知識庫。然后賣家(包括企業(yè)和個人)依托該平臺,并結(jié)合自身信息掌握情況和技術(shù)實力進(jìn)行動態(tài)定價決策。
在c2c模式下,賣家是個人,不能完成龐大的數(shù)據(jù)搜集直至數(shù)據(jù)挖掘的任務(wù),那么基于動態(tài)競價的數(shù)據(jù)挖掘平臺就可以幫助完成這些信息搭建工作,然后運用統(tǒng)一的定價模型和算法依據(jù)各種動態(tài)定價策略對不同類型的商品做出相應(yīng)的定價決策,包括適當(dāng)?shù)某跏純r格的確定和加價幅度的調(diào)整,各個賣家可依據(jù)所銷售商品的不同選擇相應(yīng)的定價策略。另外,網(wǎng)絡(luò)平臺可以建立統(tǒng)一的標(biāo)準(zhǔn)幫助賣家對客戶進(jìn)行細(xì)分,并對不同的客戶實施不同的定價策略,尤其在拍賣中凸顯高忠誠度客戶的優(yōu)先機(jī)制,達(dá)到保存客戶、提高客戶滿意度的目的。當(dāng)然,為爭取新的買家,也可以采取一定的優(yōu)惠措施,增加客戶源,擴(kuò)大市場份額。
要說明的是,以上所述實施例是對本發(fā)明技術(shù)方案的說明而非限制,所屬技術(shù)領(lǐng)域普通技術(shù)人員的等同替換或者根據(jù)現(xiàn)有技術(shù)而做的其他修改,只要沒超出本發(fā)明技術(shù)方案的思路和范圍,均應(yīng)包含在本發(fā)明所要求的權(quán)利范圍之內(nèi)。