本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別是涉及一種來訪概率預(yù)測(cè)方法和系統(tǒng)。
背景技術(shù):對(duì)于電商網(wǎng)站運(yùn)營商等互聯(lián)網(wǎng)站,需要根據(jù)服務(wù)器中客戶端的來訪信息,如來訪的時(shí)間和次數(shù),預(yù)測(cè)客戶來訪的概率,進(jìn)而根據(jù)該來訪的概率將用戶分群歸類,然后針對(duì)不同類別的客戶制定相應(yīng)的營銷策略。傳統(tǒng)的來訪概率預(yù)測(cè)方法通過獲取服務(wù)器中客戶端在若干天內(nèi)的來訪天數(shù),將來訪天數(shù)除以所述若干天,確定客戶端當(dāng)日的來訪概率。這種預(yù)測(cè)方法中若干天的取值過小,無法準(zhǔn)確反映客戶端長期的訪問規(guī)律;若干天的取值過大,則降低了預(yù)測(cè)結(jié)果的區(qū)分度,導(dǎo)致預(yù)測(cè)的結(jié)果準(zhǔn)確性低。
技術(shù)實(shí)現(xiàn)要素:基于此,有必要針對(duì)現(xiàn)有技術(shù)的預(yù)測(cè)結(jié)果準(zhǔn)確性低問題,提供一種來訪概率預(yù)測(cè)方法和系統(tǒng)。一種來訪概率預(yù)測(cè)方法,包括步驟:獲取客戶端最近若干天內(nèi)的來訪天數(shù),根據(jù)所述來訪天數(shù)確定當(dāng)日所述客戶端來訪的第一概率值;獲取所述客戶端的歷史訪問記錄中的來訪日期,根據(jù)所述來訪日期確定該客戶端在每相鄰兩天中,首日來訪轉(zhuǎn)變成次日來訪的第二概率值和首日不來訪轉(zhuǎn)變成次日來訪的第三概率值;根據(jù)所述第一概率值、第二概率值及第三概率值確定所述客戶端下一日來訪的概率值。上述來訪概率預(yù)測(cè)方法,通過獲取客戶端最近若干天的來訪天數(shù),確定客戶端當(dāng)日來訪的第一概率值,反映了客戶端最近的訪問規(guī)律;通過獲取客戶端的歷史訪問中的來訪日期,確定每相鄰兩天中,客戶端首日來訪轉(zhuǎn)變成次日來訪的第二概率值以及首日不來訪轉(zhuǎn)變成次日來訪的第三概率值,代表了客戶端在每相鄰兩天中,從首日的不來訪狀態(tài)或者來訪狀態(tài)轉(zhuǎn)變成次日來訪狀態(tài)的概率,反映了客戶端歷史的訪問規(guī)律。最后通過第一概率值、第二概率值以及第三概率值便可以確定客戶端下一日來訪的概率值,全面描述了客戶端的來訪行為,提高了預(yù)測(cè)結(jié)果的區(qū)分度,達(dá)到提高預(yù)測(cè)結(jié)果準(zhǔn)確性的效果。一種來訪概率預(yù)測(cè)系統(tǒng),其特征在于,包括:當(dāng)日來訪概率預(yù)測(cè)模塊,用于獲取客戶端最近若干天內(nèi)的來訪天數(shù),根據(jù)所述來訪天數(shù)確定當(dāng)日所述客戶端來訪的第一概率值;狀態(tài)轉(zhuǎn)移概率預(yù)測(cè)模塊,用于獲取所述客戶端的歷史訪問記錄中的來訪日期,根據(jù)所述來訪日期確定該客戶端在每相鄰兩天中,首日來訪轉(zhuǎn)變成次日來訪的第二概率值和首日不來訪轉(zhuǎn)變成次日來訪的第三概率值;下一日來訪概率預(yù)測(cè)模塊,用于根據(jù)所述第一概率值、第二概率值及第三概率值確定所述客戶端下一日來訪的概率值。上述來訪概率預(yù)測(cè)系統(tǒng),通過當(dāng)日來訪概率預(yù)測(cè)模塊獲取客戶端最近若干天內(nèi)的來訪天數(shù),確定客戶端當(dāng)日來訪的第一概率值,反映了客戶端最近的來訪規(guī)律;通過狀態(tài)轉(zhuǎn)移概率預(yù)測(cè)模塊獲取客戶端歷史訪問記錄中的來訪日期,確定每相鄰兩天中,客戶端首日來訪轉(zhuǎn)變成次日來訪的第二概率值以及首日不來訪轉(zhuǎn)變成次日來訪的第三概率值,代表了客戶端在每相鄰兩天中,從首日的不來訪狀態(tài)或者來訪狀態(tài)轉(zhuǎn)變成次日來訪狀態(tài)的概率,反映了客戶端歷史的訪問規(guī)律。最后由下一日來訪概率預(yù)測(cè)模塊根據(jù)所述的第一概率值、第二概率值和第三概率值確定客戶端下一日來訪的概率值,全面描述了客戶端的來訪行為,提高了預(yù)測(cè)結(jié)果的區(qū)分度,達(dá)到提高預(yù)測(cè)結(jié)果準(zhǔn)確性的效果。附圖說明圖1為本發(fā)明的一個(gè)實(shí)施例的來訪概率預(yù)測(cè)方法的流程示意圖;圖2為本發(fā)明的一個(gè)實(shí)施例的來訪概率預(yù)測(cè)系統(tǒng)的結(jié)構(gòu)示意圖;圖3為當(dāng)日概率預(yù)測(cè)模塊的一個(gè)實(shí)施例的結(jié)構(gòu)示意圖;圖4為狀態(tài)轉(zhuǎn)移概率預(yù)測(cè)模塊的一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。具體實(shí)施方式以下針對(duì)本發(fā)明來訪概率預(yù)測(cè)方法及系統(tǒng)的實(shí)施例進(jìn)行詳細(xì)的描述。首先針對(duì)來訪概率預(yù)測(cè)方法進(jìn)行描述。參見圖1,是一個(gè)實(shí)施例的來訪概率預(yù)測(cè)方法的流程示意圖,包括步驟:步驟S101:獲取客戶端最近若干天內(nèi)的來訪天數(shù),根據(jù)所述來訪天數(shù)確定當(dāng)日所述客戶端來訪的第一概率值。其中,第一概率值是客戶端最近訪問規(guī)律的客觀反映。步驟S102:獲取所述客戶端的歷史訪問記錄中的來訪日期,根據(jù)所述來訪日期確定該客戶端在每相鄰兩天中,首日來訪轉(zhuǎn)變成次日來訪的第二概率值和首日不來訪轉(zhuǎn)變成次日來訪的第三概率值。其中,客戶端在歷史訪問記錄中每相鄰兩天中從來訪狀態(tài)轉(zhuǎn)變成來訪狀態(tài)的第二概率值和由不來訪狀態(tài)轉(zhuǎn)變成來訪狀態(tài)的第三概率值,它是客戶端從首次登陸至當(dāng)前的歷史訪問規(guī)律的客觀反映。步驟S103:根據(jù)所述第一概率值、第二概率值及第三概率值確定所述客戶端下一日來訪的概率值。其中,以當(dāng)日和下一日為相鄰兩天,即來當(dāng)日為相鄰兩天的首日,下一日為相鄰兩天的次日,結(jié)合第二概率值和第三概率值,預(yù)測(cè)出下一日的來訪的概率值,兼顧考慮了客戶端最近的來訪規(guī)律和歷史的來訪規(guī)律。而且第二概率值和第三概率值是基于客戶端從首次訪問至今的來訪日期,其值域取盡了實(shí)數(shù)區(qū)間[0,1]內(nèi)數(shù)值,因此根據(jù)第一概率值、第二概率值及第三概率值所確定的下一日來訪的概率值的取值會(huì)根據(jù)客戶端的來訪規(guī)律變化,更加詳細(xì)地反映了不同客戶端的來訪規(guī)律,提高了不同客戶端來訪概率值的區(qū)分度。需要聲明的是,此處對(duì)步驟S101和S102的執(zhí)行的順序并不作限制,可按照先后順序執(zhí)行或同時(shí)執(zhí)行,并且步驟S103為最后執(zhí)行的步驟。上述來訪概率預(yù)測(cè)方法,通過步驟S101獲取客戶端最近若干天的來訪天數(shù),確定客戶端當(dāng)日來訪的第一概率值,反映了客戶端最近的訪問規(guī)律;步驟S102通過獲取客戶端的歷史訪問中的來訪日期,確定每相鄰兩天中,客戶端首日來訪轉(zhuǎn)變成次日來訪的第二概率值以及首日不來訪轉(zhuǎn)變成次日來訪的第三概率值,代表了客戶端在每相鄰兩天中,從首日的不來訪狀態(tài)或者來訪狀態(tài)轉(zhuǎn)變成次日來訪狀態(tài)的概率,反映了客戶端歷史的訪問規(guī)律。最后步驟S103通過第一概率值、第二概率值以及第三概率值便可以確定客戶端下一日來訪的概率值,全面描述了客戶端的來訪行為,提高了預(yù)測(cè)結(jié)果的區(qū)分度,達(dá)到提高預(yù)測(cè)結(jié)果準(zhǔn)確性的效果。在其中一個(gè)實(shí)施例中,步驟S101包括:Pc=m/n;式中,Pc為當(dāng)日所述客戶端來訪的第一概率值,n為獲取來訪記錄的若干天的天數(shù),n≥2,m為若干天內(nèi)的來訪天數(shù)。需要聲明的是,此處n的優(yōu)選取值為7,即取客戶端最近7天內(nèi)的訪問數(shù)據(jù)。在上述函數(shù)關(guān)系式中,通過最近的n天內(nèi)的訪問天數(shù)m除以n,計(jì)算出客戶端當(dāng)日來訪的概率Pc,反映的是客戶端最近幾天的訪問頻率,借此預(yù)測(cè)出客戶端當(dāng)日的來訪概率。在其中一個(gè)實(shí)施例中,步驟S102包括:獲取所述來訪日期的每相鄰兩天中,首日來訪轉(zhuǎn)變成次日來訪的第一次數(shù),首日來訪轉(zhuǎn)變成次日不來訪的第二次數(shù),首日不來訪轉(zhuǎn)變成次日來訪的第三次數(shù)以及首日不來訪轉(zhuǎn)變成次日不來訪的第四次數(shù)。根據(jù)所獲取的客戶端從首次訪問至今的訪問日期中,獲取所述來訪日期的每相鄰兩天中,首日來訪轉(zhuǎn)變成次日來訪的第一次數(shù),首日來訪轉(zhuǎn)變成次日不來訪的第二次數(shù),首日不來訪轉(zhuǎn)變成次日來訪的第三次數(shù)以及首日不來訪轉(zhuǎn)變成次日不來訪的第四次數(shù)。通過上述方法,將客戶端在相鄰兩天中的來訪狀態(tài)劃分成了首日來訪至次日來訪,首日來訪至次日不來訪,首日不來訪至次日來訪,首日不來訪至次日不來訪等四種狀態(tài)變化,并分別得到第一次數(shù)、第二次數(shù)、第三次數(shù)以及第四次數(shù)。根據(jù)第一次數(shù)、第二次數(shù)、第三次數(shù)及第四次數(shù)確定第二概率值和第三概率值。其中,第二概率值反映了客戶端在相鄰兩天中,從首日來訪轉(zhuǎn)變成次日來訪的可能性;第三概率值反映了客戶端在相鄰兩天中,從首日來訪轉(zhuǎn)變成次日來訪的可能性。在其中一個(gè)實(shí)施例中,根據(jù)第一次數(shù)、第二次數(shù)、第三次數(shù)及第四次數(shù)確定第二概率值和第三概率值包括:P11=A11/(A11+A10),P01=A01/(A01+A00);式中,P11為首日來訪轉(zhuǎn)變成次日來訪的概率值,P01為首日不來訪轉(zhuǎn)變成次日來訪的概率值,A11為首日來訪轉(zhuǎn)變成次日來訪的第一次數(shù),A10為首日來訪轉(zhuǎn)變成次日不來訪的第二次數(shù),A01為首日不來訪轉(zhuǎn)變成次日來訪的第三次數(shù),A00為首日不來訪轉(zhuǎn)變成次日不來訪的第四次數(shù)。其中,在P11=A11/(A11+A10)中,反映了客戶端以來訪為首日的來訪狀態(tài),計(jì)算出客戶端次日也來訪的概率值;同理,,在P01=A01/(A01+A00)中,反映了客戶端以不來訪為首日的來訪狀態(tài),計(jì)算出客戶端次日來訪的概率值。上述式子均是反映了客戶端不管首日的來訪狀態(tài)如何,次日會(huì)來訪的概率。在其中一個(gè)實(shí)施例中,步驟S103包括:PN=Pc×P11+(1-Pc)×P01;式中,PN為客戶端下一日來訪的概率值,Pc為所述來訪天數(shù)確定當(dāng)日所述客戶端來訪的第一概率值,P11為首日來訪轉(zhuǎn)變成次日來訪的第二概率值,P01為首日不來訪轉(zhuǎn)變成次日來訪的第三概率值。上述式子中,客戶端下一日的來訪情況包含了兩種情況,其一,客戶端當(dāng)日來訪了,下一日也來訪了;其二,客戶端當(dāng)日沒有來訪,但是下一日來訪了。因此在計(jì)算客戶端下一日來訪的概率值為上述兩種情況的概率值之和。在此需要說明的是,在利用本發(fā)明的來訪概率預(yù)測(cè)方法獲得下一日來訪概率值后,可根據(jù)概率值的大小對(duì)客戶端進(jìn)行分群,方便分群后制定針對(duì)性的營銷策略。例如:當(dāng)PN在實(shí)數(shù)區(qū)間[0.7,1]內(nèi),客戶端劃分至高頻訪問客戶群之中;當(dāng)PN在實(shí)數(shù)區(qū)間[0.3,0.7)內(nèi),客戶端劃分至中頻訪問客戶群之中;當(dāng)PN在實(shí)數(shù)區(qū)間[0,0.3)內(nèi),客戶端劃分至低頻訪問客戶群之中。根據(jù)上述的來訪概率預(yù)測(cè)方法,本發(fā)明提供了一種來訪概率預(yù)測(cè)系統(tǒng)。參見圖2,是一個(gè)實(shí)施例的來訪概率預(yù)測(cè)系統(tǒng)的結(jié)構(gòu)示意圖,包括:當(dāng)日來訪概率預(yù)測(cè)模塊310,用于獲取客戶端最近若干天內(nèi)的來訪天數(shù),根據(jù)所述來訪天數(shù)確定當(dāng)日所述客戶端來訪的第一概率值。通過當(dāng)日來訪概率預(yù)測(cè)模塊310,獲取客戶端最近若干天內(nèi)的來訪天數(shù),根據(jù)所述來訪天數(shù)確定當(dāng)日所述客戶端來訪的第一概率值。所述當(dāng)日來訪的第一概率值反映了客戶端在最近的訪問規(guī)律。狀態(tài)轉(zhuǎn)移概率預(yù)測(cè)模塊320,用于獲取所述客戶端的歷史訪問記錄中的來訪日期,根據(jù)所述來訪日期確定該客戶端在每相鄰兩天中,首日來訪轉(zhuǎn)變成次日來訪的第二概率值和首日不來訪轉(zhuǎn)變成次日來訪的第三概率值。通過狀態(tài)轉(zhuǎn)移概率預(yù)測(cè)模塊320,獲取所述客戶端的歷史訪問記錄中的來訪日期,根據(jù)所述來訪日期確定該客戶端在每相鄰兩天中,首日來訪轉(zhuǎn)變成次日來訪的第二概率值和首日不來訪轉(zhuǎn)變成次日來訪的第三概率值。其中所述第二概率值和第三概率值反映了客戶端從首次訪問至今的歷史訪問規(guī)律。下一日來訪概率預(yù)測(cè)模塊330,用于根據(jù)所述第一概率值、第二概率值及第三概率值確定所述客戶端下一日來訪的概率值。以當(dāng)日和下一日為相鄰兩天,即來當(dāng)日為相鄰兩天的首日,下一日為相鄰兩天的次日,結(jié)合第二概率值和第三概率值,預(yù)測(cè)出下一日的來訪的概率值,兼顧考慮了客戶端最近的來訪規(guī)律和歷史的來訪規(guī)律。而且第二概率值和第三概率值是基于客戶端從首次訪問至今的來訪日期,其值域取盡了實(shí)數(shù)區(qū)間[0,1]內(nèi)數(shù)值,因此根據(jù)第一概率值、第二概率值及第三概率值所確定的下一日來訪的概率值的取值會(huì)根據(jù)客戶端的來訪規(guī)律變化,更加詳細(xì)地反映了不同客戶端的來訪規(guī)律,提高了不同客戶端來訪概率值的區(qū)分度。需要聲明的是,此處對(duì)當(dāng)日來訪概率預(yù)測(cè)模塊310和狀態(tài)轉(zhuǎn)移概率預(yù)測(cè)模塊320的執(zhí)行的順序并不作限制,可按照先后順序執(zhí)行工作或同時(shí)執(zhí)行工作,并且下一日來訪概率預(yù)測(cè)模塊330為最后執(zhí)行工作的模塊。上述來訪概率預(yù)測(cè)系統(tǒng),通過當(dāng)日來訪概率預(yù)測(cè)模塊310獲取客戶端最近若干天內(nèi)的來訪天數(shù),確定客戶端當(dāng)日來訪的第一概率值,反映了客戶端最近的來訪規(guī)律;通過狀態(tài)轉(zhuǎn)移概率預(yù)測(cè)模塊320獲取客戶端歷史訪問記錄中的來訪日期,確定每相鄰兩天中,客戶端首日來訪轉(zhuǎn)變成次日來訪的第二概率值以及首日不來訪轉(zhuǎn)變成次日來訪的第三概率值,代表了客戶端在每相鄰兩天中,從首日的不來訪狀態(tài)或者來訪狀態(tài)轉(zhuǎn)變成次日來訪狀態(tài)的概率,反映了客戶端歷史的訪問規(guī)律。最后由下一日來訪概率預(yù)測(cè)模塊330根據(jù)所述的第一概率值、第二概率值和第三概率值確定客戶端下一日來訪的概率值,全面描述了客戶端的來訪行為,提高了預(yù)測(cè)結(jié)果的區(qū)分度,達(dá)到提高預(yù)測(cè)結(jié)果準(zhǔn)確性的效果。參考圖3,在其中一個(gè)實(shí)施例中,當(dāng)日來訪概率預(yù)測(cè)模310包括:第一數(shù)據(jù)獲取單元311,用于獲取客戶端最近若干天內(nèi)的來訪次數(shù);第一計(jì)算單元312,根據(jù)所述來訪天數(shù)確定當(dāng)日所述客戶端來訪的第一概率值:Pc=m/n;式中,Pc為當(dāng)日所述客戶端來訪的第一概率值,n為獲取來訪記錄的若干天的天數(shù),n≥2,m為若干天內(nèi)的來訪天數(shù)。通過第一數(shù)據(jù)獲取單元311獲取最近若干天內(nèi)的訪問天數(shù)后,由第一計(jì)算單元312進(jìn)行計(jì)算,具體為:最近的n天內(nèi)的訪問天數(shù)m除以n,計(jì)算出客戶端當(dāng)日來訪的概率Pc,反映的是客戶端最近幾天的訪問頻率,借此預(yù)測(cè)出客戶端當(dāng)日的來訪概率。需要聲明的是,此處n的優(yōu)選取值為7,即取客戶端最近7天內(nèi)的訪問數(shù)據(jù)。參考圖4,在其中一個(gè)實(shí)施例中,狀態(tài)轉(zhuǎn)移概率預(yù)測(cè)模塊320包括:第二數(shù)據(jù)獲取單元321,用于獲取客戶端從首次來訪至當(dāng)前的來訪日期。第二數(shù)據(jù)獲取單元321獲取的客戶端從首次訪問至今的訪問日期。第三數(shù)據(jù)獲取單元322,用于獲取所述來訪日期的每相鄰兩天中,首日來訪轉(zhuǎn)變成次日來訪的第一次數(shù),首日來訪轉(zhuǎn)變成次日不來訪的第二次數(shù),首日不來訪轉(zhuǎn)變成次日來訪的第三次數(shù)以及首日不來訪轉(zhuǎn)變成次日不來訪的第四次數(shù)。第三數(shù)據(jù)獲取單元322獲取所述來訪日期的每相鄰兩天中,首日來訪轉(zhuǎn)變成次日來訪的第一次數(shù),首日來訪轉(zhuǎn)變成次日不來訪的第二次數(shù),首日不來訪轉(zhuǎn)變成次日來訪的第三次數(shù)以及首日不來訪轉(zhuǎn)變成次日不來訪的第四次數(shù)。通過上述方法,將客戶端在相鄰兩天中的來訪狀態(tài)劃分成了首日來訪至次日來訪,首日來訪至次日不來訪,首日不來訪至次日來訪,首日不來訪至次日不來訪等四種狀態(tài)變化,并分別得到第一次數(shù)、第二次數(shù)、第三次數(shù)以及第四次數(shù)。第二計(jì)算單元323,用于根據(jù)第一次數(shù)、第二次數(shù)、第三次數(shù)及第四次數(shù)確定第二概率值和第三概率值。第二概率值反映了客戶端在相鄰兩天中,從首日來訪轉(zhuǎn)變成次日來訪的可能性;第三概率值反映了客戶端在相鄰兩天中,從首日來訪轉(zhuǎn)變成次日來訪的可能性。在其中一個(gè)實(shí)施例中,所述的第二計(jì)算單元323的計(jì)算方式為:P11=A11/(A11+A10),P01=A01/(A01+A00);式中,P11為首日來訪轉(zhuǎn)變成次日來訪的概率值,P01為首日不來訪轉(zhuǎn)變成次日來訪的概率值,A11為首日來訪轉(zhuǎn)變成次日來訪的第一次數(shù),A10為首日來訪轉(zhuǎn)變成次日不來訪的第二次數(shù),A01為首日不來訪轉(zhuǎn)變成次日來訪的第三次數(shù),A00為首日不來訪轉(zhuǎn)變成次日不來訪的第四次數(shù)。其中,在P11=A11/(A11+A10)中,反映了客戶端以來訪為首日的來訪狀態(tài),計(jì)算出客戶端次日也來訪的概率值;同理,,在P01=A01/(A01+A00)中,反映了客戶端以不來訪為首日的來訪狀態(tài),計(jì)算出客戶端次日來訪的概率值。上述式子均是反映了客戶端不管首日的來訪狀態(tài)如何,次日會(huì)來訪的概率。在其中一個(gè)實(shí)施例中,所述下一日來訪概率預(yù)測(cè)模塊330的計(jì)算方式為:PN=Pc×P11+(1-Pc)×P01;式中,PN為客戶端下一日來訪的概率值,Pc為所述來訪天數(shù)確定當(dāng)日所述客戶端來訪的第一概率值,P11為首日來訪轉(zhuǎn)變成次日來訪的第二概率值,P01為首日不來訪轉(zhuǎn)變成次日來訪的第三概率值。上述式子中,客戶端下一日的來訪情況包含了兩種情況,其一,客戶端當(dāng)日來訪了,下一日也來訪了;其二,客戶端當(dāng)日沒有來訪,但是下一日來訪了。因此在計(jì)算客戶端下一日來訪的概率值為上述兩種情況的概率值之和。在此需要說明的是,在下一日來訪概率值預(yù)測(cè)模塊330后,可設(shè)置客戶端分群模塊,根據(jù)前述所得的下一日來訪概率值的大小對(duì)客戶端進(jìn)行分群,方便分群后制定針對(duì)性的營銷策略。例如:當(dāng)PN在實(shí)數(shù)區(qū)間[0.7,1]內(nèi),客戶端劃分至高頻訪問客戶群之中;當(dāng)PN在實(shí)數(shù)區(qū)間[0.3,0.7)內(nèi),客戶端劃分至中頻訪問客戶群之中;當(dāng)PN在實(shí)數(shù)區(qū)間[0,0.3)內(nèi),客戶端劃分至低頻訪問客戶群之中。以上所述實(shí)施例僅表達(dá)了本發(fā)明的幾種實(shí)施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對(duì)本發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對(duì)于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。