本發(fā)明屬于行為預(yù)測
技術(shù)領(lǐng)域:
,更為具體地講,涉及一種基于自動(dòng)擬合均值函數(shù)的泊松過程用戶到店行為預(yù)測方法。
背景技術(shù):
:隨著互聯(lián)網(wǎng)科技的發(fā)展,人們的購物方式也發(fā)生了很大的變化,實(shí)體商鋪的一些問題也因?yàn)殡娚痰陌l(fā)展日益凸顯。一方面,實(shí)體商鋪對供求信息的反映往往是通過經(jīng)驗(yàn)和人為預(yù)估,缺乏準(zhǔn)確性;另一方面,沒有一種合理的方法客觀反映客戶忠誠度,導(dǎo)致無法抓住核心客戶,提供針對性的服務(wù)。由此,如何解決供求信息反映不明中的商鋪數(shù)量、商品需求者供求信息關(guān)系不明的問題,以及部分解決無法評估客戶忠誠度的問題,從而達(dá)到全面而精準(zhǔn)預(yù)測的目的成為了商鋪經(jīng)營過程中的難題。在目前的預(yù)測方法中,時(shí)間序列分析是一種常用的方法,然而,時(shí)間序列分析存在過度依賴歷史數(shù)據(jù)量,需要人工定階,預(yù)測太過依賴預(yù)測時(shí)間尺度,無法等值準(zhǔn)確范圍等問題。在具體的用戶行為預(yù)測中,由于多數(shù)用戶并不會進(jìn)行很高頻次的購買,所以時(shí)間序列分析在總體上不適用。即使僅在購買頻次較多的用戶使用時(shí)間序列分析,也會面臨需要人工定階的問題,在龐大的用戶基數(shù)下耗時(shí)耗力,并不能確定預(yù)測結(jié)果的準(zhǔn)確范圍。此外,通常的預(yù)測方法沒有對預(yù)測結(jié)果的有效性進(jìn)行度量。并且沒有根據(jù)某個(gè)用戶的歷史到店特性,對泊松過程非常重要的參數(shù)--均值函數(shù)進(jìn)行合適的選取和匹配,降低了預(yù)測結(jié)果的可靠性以及有效性。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,考慮用戶某一天是否到店購買具有隨機(jī)性,提出一種基于自動(dòng)擬合均值函數(shù)的泊松過程用戶到店行為預(yù)測方法,以提高預(yù)測結(jié)果的可靠性以及有效性。為實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明基于自動(dòng)擬合均值函數(shù)的泊松過程用戶到店行為預(yù)測方法,其特征在于,包括以下步驟:(1)、將用戶一段時(shí)間到店購買的情況看作一個(gè)泊松過程,對其進(jìn)行非齊次泊松過程建模:k=0,1,2...,其中,k表示用戶到店并購買的次數(shù),p{n(t+s)-n(t)=k}表示用戶在t到t+s天內(nèi)到店購買k次的概率,m(t)和m(t+s)分別表示該用戶在t和t+s處均值函數(shù)的值,e為自然對數(shù),k!表示k的階乘;(2)、利用一次函數(shù)、冪函數(shù)和指數(shù)函數(shù)分別對過去n天用戶到店情況進(jìn)行擬合,得到對應(yīng)的擬合函數(shù)即擬合的一次函數(shù)、冪函數(shù)和指數(shù)函數(shù);(3)、計(jì)算擬合的一次函數(shù)、冪函數(shù)和指數(shù)函數(shù)的誤差平方和(sse)、復(fù)相關(guān)系數(shù)(r-square)和均方根誤差(rmse):其中,表示在第i天時(shí)用戶到店并購買的擬合累積次數(shù),yi表示在第i天時(shí)用戶到店并購買的實(shí)際累積次數(shù),表示yi的平均值:(4)、采用如下策略選取均值函數(shù):4.1)、選取復(fù)相關(guān)系數(shù)r-square中的最大值,并與第二大值進(jìn)行比較,如果差值超過設(shè)定的閾值t1,則選取復(fù)相關(guān)系數(shù)r-square最大值所對應(yīng)的擬合函數(shù)為均值函數(shù),否則,轉(zhuǎn)到步驟4.2);4.2)、選取誤差平方和sse中的最小值,并與第二小值進(jìn)行比較,如果差值超過設(shè)定的閾值t2,則選取誤差平方和sse最小值所對應(yīng)的擬合函數(shù)為均值函數(shù),否則,轉(zhuǎn)到步驟4.3);4.3)、選取均方根誤差rmse最小值所對應(yīng)的擬合函數(shù)為均值函數(shù);(5)、將均值函數(shù)代入步驟(1)構(gòu)建的模型中,分別計(jì)算k所對應(yīng)的概率,選取概率值大于設(shè)定閾值t3的用戶到店并購買的次數(shù),并作為該用戶未來s天的時(shí)間段內(nèi)到店并購買的預(yù)測。本發(fā)明的目的是這樣實(shí)現(xiàn)的。本發(fā)明基于自動(dòng)擬合均值函數(shù)的泊松過程用戶到店行為預(yù)測方法,用戶到店購買商品的行為具有很強(qiáng)的隨機(jī)性的情況下,利用自動(dòng)擬合均值函數(shù)的方法,進(jìn)行泊松過程建模預(yù)測,從而全面的分析用戶未來是否到店購買的預(yù)測方法。本發(fā)明可以解決供求信息反映不明中的商鋪數(shù)量、商品需求者供求信息關(guān)系不明的問題,以及部分解決無法評估客戶忠誠度的問題;同時(shí),制定了一套適應(yīng)商戶到店購買預(yù)測的,集合了數(shù)據(jù)采集、參數(shù)訓(xùn)練、訓(xùn)練結(jié)果分析、建模預(yù)測的預(yù)測算法,對指定的預(yù)測指標(biāo)設(shè)定最合適的預(yù)測參數(shù),達(dá)到精準(zhǔn)預(yù)測的目的;最后,本發(fā)明利用自動(dòng)擬合均值函數(shù)的方法解決了合理運(yùn)用歷史數(shù)據(jù)以及確定預(yù)測結(jié)果有效性的問題。附圖說明圖1是本發(fā)明基于自動(dòng)擬合均值函數(shù)的泊松過程用戶到店行為預(yù)測方法一種具體實(shí)施方式流程圖;圖2是某用戶到達(dá)某店并購買行為的預(yù)測曲線圖。具體實(shí)施方式下面結(jié)合附圖對本發(fā)明本發(fā)明的具體實(shí)施方式進(jìn)行描述,以便本領(lǐng)域的技術(shù)人員更好地理解本發(fā)明本發(fā)明。需要特別提醒注意的是,在以下的描述中,當(dāng)已知功能和設(shè)計(jì)的詳細(xì)描述也許會淡化本發(fā)明本發(fā)明的主要內(nèi)容時(shí),這些描述在這里將被忽略。圖1是本發(fā)明基于自動(dòng)擬合均值函數(shù)的泊松過程用戶到店行為預(yù)測方法一種具體實(shí)施方式流程圖。在本實(shí)施例中,如圖1所示,本發(fā)明基于自動(dòng)擬合均值函數(shù)的泊松過程用戶到店行為預(yù)測方法包括以下步驟:步驟s1:非齊次泊松過程建模將用戶一段時(shí)間到店購買的情況看作一個(gè)泊松過程,對其進(jìn)行非齊次泊松過程建模:k=0,1,2...,其中,k表示用戶到店并購買的次數(shù),p{n(t+s)-n(t)=k}表示用戶在t到t+s天內(nèi)到店購買k次的概率,m(t)和m(t+s)分別表示該用戶在t和t+s處均值函數(shù)的值,e為自然對數(shù),k!表示k的階乘。非齊次泊松過程屬于現(xiàn)有計(jì)算,在此不再贅述。步驟s2:用戶到店情況擬合利用一次函數(shù)、冪函數(shù)和指數(shù)函數(shù)分別對過去n天用戶到店情況進(jìn)行擬合,得到對應(yīng)的擬合函數(shù)即擬合的一次函數(shù)、冪函數(shù)和指數(shù)函數(shù)。在本實(shí)施例中,以某用戶在2014年1月1日至2014年12月31日到某店并購買的累積次數(shù)作為基礎(chǔ),利用一次函數(shù)、冪函數(shù)和指數(shù)函數(shù)分別對這過去的365天到店并購買的累積次數(shù)進(jìn)行擬合。該用戶實(shí)際到店并購買的天數(shù):[1113172335495779879299107115121127135149157163177193205211227231241243247259277289299309331339]。依據(jù)上述實(shí)際到店并購買日期,以時(shí)間為橫軸,到店并購買的累積次數(shù)為縱軸,繪制時(shí)間-累計(jì)次數(shù)點(diǎn)陣圖,然后,利用一次函數(shù)、冪函數(shù)和指數(shù)函數(shù)進(jìn)行擬合,得到擬合的一次函數(shù)、冪函數(shù)和指數(shù)函數(shù)。步驟s3:計(jì)算擬合函數(shù)的sse、r-square和rmse計(jì)算擬合的一次函數(shù)、冪函數(shù)和指數(shù)函數(shù)的誤差平方和(sse)、復(fù)相關(guān)系數(shù)(r-square)和均方根誤差(rmse):其中,表示在第i天時(shí)用戶到店并購買的擬合累積次數(shù),yi表示在第i天時(shí)用戶到店并購買的實(shí)際累積次數(shù),表示yi的平均值:擬合函數(shù)為一次函數(shù)即一條直線時(shí),根據(jù)上述公式,計(jì)算擬合的一次函數(shù)誤差平方和sse1、復(fù)相關(guān)系數(shù)r1和均方根誤差rmse1,其結(jié)果如表1所示:sse116.4r10.9954rmse10.7051表1擬合函數(shù)為冪函數(shù)時(shí),根據(jù)上述公式,計(jì)算擬合的冪函數(shù)誤差平方和sse2、復(fù)相關(guān)系數(shù)r2和均方根誤差rmse2,其結(jié)果如表2所示:sse214.07r20.9961rmse20.6631表2擬合函數(shù)為指數(shù)函數(shù)時(shí),根據(jù)上述公式,計(jì)算擬合的指數(shù)函數(shù)誤差平方和sse3、復(fù)相關(guān)系數(shù)r3和均方根誤差rmse3,其結(jié)果如表3所示:sse313r30.9964rmse30.6476表3步驟s4:選取一擬合函數(shù)作為均值函數(shù)a1、在本實(shí)施例中,擬合的一次函數(shù)的復(fù)相關(guān)系數(shù)r1=0.9954、擬合的冪函數(shù)的復(fù)相關(guān)系數(shù)r2=0.9961、擬合的指數(shù)函數(shù)的復(fù)相關(guān)系數(shù)r3=0.9964。復(fù)相關(guān)系數(shù)r-square中的最大值為0.9964,第二大值為0.9961,差值為0.0003。在本實(shí)施例中,閾值t1設(shè)定為0.01??梢姴钪敌∮陂撝祎1,則需要進(jìn)一步的判斷。a2)、在本實(shí)施例中,擬合的一次函數(shù)的誤差平方和sse1=16.4,擬合的冪函數(shù)的的誤差平方和sse2=14.07,擬合的指數(shù)函數(shù)的誤差平方和sse3=13。誤差平方和的最小值為13,第二小值為14.07,差值為1.07。在本實(shí)施例中,閾值t2設(shè)定為0.5??梢姴钪敌∮陂撝祎2,則選取誤差平方和sse最小值13所對應(yīng)的擬合函數(shù)即指數(shù)函數(shù)為均值函數(shù)。步驟s5:將均值函數(shù)代入步驟s1構(gòu)建的模型中,分別計(jì)算k所對應(yīng)的概率,選取概率值大于設(shè)定閾值t3的用戶到店并購買的次數(shù),并作為該用戶未來s天的時(shí)間段內(nèi)到店并購買的預(yù)測。在本實(shí)施例中,閾值t3=0.1。按照本發(fā)明步驟(4)選取指數(shù)函數(shù)作為該用戶非齊次泊松過程的均值函數(shù),在本實(shí)施例中,均值函數(shù)如下:m(t)=-2178000×e-0.0003288t+2178000×e-0.0003287。為了驗(yàn)證本發(fā)明的預(yù)測效果,在本實(shí)施例中,計(jì)算接下來30天該到店并購買情況如圖2所示,其中,概率值大于閾值t3=0.1的次數(shù)范圍為1次至4次,并且到店并購買2次的可能性最大,實(shí)際情況是2015年1月真實(shí)到店病購買次數(shù)為3次。由此可見,對該客戶2015年1月到店并購買情況與實(shí)際到店并購買情況的的對比可以發(fā)現(xiàn),一月到店兩次的概率最大,為0.22,而實(shí)際一月到店三次,預(yù)測結(jié)果與真實(shí)結(jié)果偏差不大,可以信賴。盡管上面對本發(fā)明本發(fā)明說明性的具體實(shí)施方式進(jìn)行了描述,以便于本
技術(shù)領(lǐng)域:
的技術(shù)人員理解本發(fā)明本發(fā)明,但應(yīng)該清楚,本發(fā)明本發(fā)明不限于具體實(shí)施方式的范圍,對本
技術(shù)領(lǐng)域:
的普通技術(shù)人員來講,只要各種變化在所附的權(quán)利要求限定和確定的本發(fā)明本發(fā)明的精神和范圍內(nèi),這些變化是顯而易見的,一切利用本發(fā)明本發(fā)明構(gòu)思的發(fā)明創(chuàng)造均在保護(hù)之列。當(dāng)前第1頁12