本發(fā)明涉及電子商務(wù)領(lǐng)域中的信息推送領(lǐng)域,具體來(lái)說(shuō),涉及一種個(gè)性化信息推送時(shí)間的確定方法及確定系統(tǒng)。
背景技術(shù):
目前,很多網(wǎng)站在關(guān)于會(huì)員精準(zhǔn)營(yíng)銷(例如電子郵件營(yíng)銷EDM,短信息服務(wù)SMS,服務(wù)信息PUSH等渠道)發(fā)送周期和頻次方面,僅僅是根據(jù)經(jīng)驗(yàn)主觀判斷決定發(fā)送時(shí)間和發(fā)送周期。這一方面造成成本浪費(fèi),另一方面在不恰當(dāng)?shù)臅r(shí)機(jī)推送信息,影響用戶體驗(yàn),導(dǎo)致客戶流失。為了避免無(wú)節(jié)制的EDM,SMS和PUSH等狂轟濫炸式的、無(wú)規(guī)律的營(yíng)銷方式,如何選擇合適的時(shí)間,向用戶推送信息成為本領(lǐng)域的一個(gè)技術(shù)難題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供一種個(gè)性化信息推送時(shí)間的確定方法及確定系統(tǒng),基于用戶行為反饋,選擇合適時(shí)間給用戶進(jìn)行信息推送,避免盲目推送信息,影響用戶體驗(yàn)。
為解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例根據(jù)如下的技術(shù)方案:
一方面,本實(shí)施例提供一種個(gè)性化信息推送時(shí)間的確定方法,該方法包括以下步驟:
S10采集用戶在電子商務(wù)網(wǎng)站的歷史訪問(wèn)記錄,構(gòu)建特征向量;
S20根據(jù)S10構(gòu)建的特征向量,利用生存分析模型對(duì)用戶進(jìn)行分類;
S30對(duì)S20分類后的每一類用戶,分別確定信息推送時(shí)間。
作為一種實(shí)施例,所述的步驟S10中,根據(jù)用戶注冊(cè)時(shí)間和訪問(wèn)的歷史記錄,將用戶分為老用戶和新用戶。
作為一種實(shí)施例,所述的步驟S10中,用戶在電子商務(wù)網(wǎng)站的歷史訪問(wèn)記錄包括用戶在PC端、APP端以及WAP端的歷史行為記錄。
作為一種實(shí)施例,所述的步驟S20中,運(yùn)用生存分析模型對(duì)老用戶和新用戶分別進(jìn)行分類,首先利用式(1)測(cè)算用戶的特征值:
COX=X1*B1+X2*B2+…+Xn*Bn 式(1)
式(1)中,COX表示用戶的特征值,X1表示該用戶的第一個(gè)特征向量,B1表示X1的對(duì)應(yīng)系數(shù),X2表示該用戶的第二個(gè)特征向量,B2表示X2的對(duì)應(yīng)系數(shù),Xn表示該用戶的第n個(gè)特征向量,Bn表示Xn的對(duì)應(yīng)系數(shù);n為大于等于3的整數(shù);
然后根據(jù)各用戶的特征值和事先設(shè)定的閾值,對(duì)老用戶和新用戶分別進(jìn)行分類。
作為一種實(shí)施例,所述的步驟S30,對(duì)于老用戶中每類用戶,利用邏輯回歸模型測(cè)算用戶未來(lái)W天最有可能回訪或者最有可能購(gòu)買的概率,然后按照事先設(shè)定的概率閾值,進(jìn)行比較后,選擇推送時(shí)間;對(duì)于新用戶中每類用戶,根據(jù)事先設(shè)定確定推送時(shí)間。
作為一種實(shí)施例,所述的邏輯回歸模型如式(2)所示,
P=exp(A0+Y1*A1+Y2*A2+…+Yn*An)/(1+exp(A0+Y1*A1+Y2*A2+…+Yn*An))式(2)
式(2)中,P表示用戶最有可能回訪或者最有可能購(gòu)買的概率,A0表示常數(shù)項(xiàng),Y1表示影響用戶購(gòu)買行為的第一因素,A1表示Y1的對(duì)應(yīng)系數(shù),Y2表示影響用戶購(gòu)買行為的第二因素,A2表示Y2的對(duì)應(yīng)系數(shù),Yn表示影響用戶購(gòu)買行為的第n因素,An表示Yn的對(duì)應(yīng)系數(shù);n為大于等于3的整數(shù)。
另一方面,本實(shí)施例提供一種個(gè)性化信息推送時(shí)間的確定系統(tǒng),該系統(tǒng)包括:
采集模塊:用于采集用戶在電子商務(wù)網(wǎng)站的歷史訪問(wèn)記錄;
構(gòu)建模塊:用于利用采集模塊采集的歷史訪問(wèn)記錄,構(gòu)建特征向量;
分類模塊:用于根據(jù)構(gòu)建模塊構(gòu)建的特征向量,利用生存分析模型對(duì)用戶進(jìn)行分類;
確定模塊:用于根據(jù)分類模塊對(duì)用戶的分類,確定向每一類用戶推送信息的時(shí)間。
作為一種實(shí)施例,所述的分類模塊運(yùn)用生存分析模型對(duì)用戶進(jìn)行分類:首先利用式(1)測(cè)算用戶的特征值:
COX=X1*B1+X2*B2+…+Xn*Bn 式(1)
式(1)中,COX表示用戶的特征值,X1表示該用戶的第一個(gè)特征向量,B1表示X1的對(duì)應(yīng)系數(shù),X2表示該用戶的第二個(gè)特征向量,B2表示X2的對(duì)應(yīng)系數(shù),Xn表示該用戶的第n個(gè)特征向量,Bn表示Xn的 對(duì)應(yīng)系數(shù);n為大于等于3的整數(shù);
然后根據(jù)各用戶的特征值和事先設(shè)定的閾值,對(duì)老用戶和新用戶分別進(jìn)行分類。
作為一種實(shí)施例,所述的確定模塊包括:
測(cè)算子模塊:用于對(duì)老用戶利用邏輯回歸模型測(cè)算用戶未來(lái)最有可能回訪或者最有可能購(gòu)買的概率;
比較子模塊:用于將測(cè)算子模塊測(cè)算的概率,與事先設(shè)定的概率閾值,進(jìn)行比較;
確定子模塊:用于根據(jù)比較子模塊的比較結(jié)果,確定推送時(shí)間。
作為一種實(shí)施例,所述的邏輯回歸模型如式(2)所示,
P=exp(A0+Y1*A1+Y2*A2+…+Yn*An)/(1+exp(A0+Y1*A1+Y2*A2+…+Yn*An))式(2)
式(2)中,A0表示常數(shù)項(xiàng),Y1表示影響用戶購(gòu)買行為的第一因素,A1表示Y1的對(duì)應(yīng)系數(shù),Y2表示影響用戶購(gòu)買行為的第二因素,A2表示Y2的對(duì)應(yīng)系數(shù),Yn表示影響用戶購(gòu)買行為的第n因素,An表示Yn的對(duì)應(yīng)系數(shù);n為大于等于3的整數(shù)。
本發(fā)明實(shí)施例提供的一種個(gè)性化信息推送時(shí)間的確定方法及確定系統(tǒng),根據(jù)用戶在電子商務(wù)網(wǎng)站的歷史訪問(wèn)記錄,構(gòu)建特征向量。利用該特征向量,對(duì)用戶進(jìn)行分類,以及測(cè)算其回訪或購(gòu)物概率,從而確定推送時(shí)間。本實(shí)施例對(duì)用戶進(jìn)行信息推送,是依據(jù)用戶的歷史行為測(cè)算得帶的,更符合用戶的需求。同時(shí),本實(shí)施例對(duì)用戶進(jìn)行信息推送,是依據(jù)不同分類的用戶分別進(jìn)行的,而不是所有用戶都采用同 一推送時(shí)間。這使得信息推送能夠因人而異,實(shí)現(xiàn)精準(zhǔn)推送,更符合用戶的需求,提高用戶體驗(yàn)。
附圖說(shuō)明
圖1是本發(fā)明實(shí)施例的流程框圖。
圖2是本發(fā)明實(shí)施例的結(jié)構(gòu)框圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚的描述。顯然,所描述的實(shí)施例僅僅是本發(fā)明的一部分實(shí)施例,而不是全部實(shí)施例。
如圖1所述,本發(fā)明實(shí)施例提供了一種個(gè)性化信息推送時(shí)間的確定方法,該方法包括以下步驟:
S10采集用戶在電子商務(wù)網(wǎng)站的歷史訪問(wèn)記錄,構(gòu)建特征向量;
S20根據(jù)S10構(gòu)建的特征向量,利用生存分析模型對(duì)用戶進(jìn)行分類;
S30對(duì)S20分類后的每一類用戶,分別確定信息推送時(shí)間。
上述方法中,確定信息推送時(shí)間時(shí),首先采集用戶在電子商務(wù)網(wǎng)站的歷史訪問(wèn)記錄,構(gòu)建特征向量。也就是說(shuō),推送時(shí)間的確定,需要依據(jù)用戶的歷史訪問(wèn)記錄,而不是人為任意設(shè)定一時(shí)間。正是基于構(gòu)建的特征向量,后續(xù)步驟對(duì)用戶進(jìn)行分類以及計(jì)算用戶的購(gòu)買或回訪概率。對(duì)用戶進(jìn)行分類后,對(duì)每類用戶分別確定推送時(shí)間,而不是 所有用戶都采用同一推送時(shí)間。這使得信息推送能夠因人而異,實(shí)現(xiàn)精準(zhǔn)推送,更符合用戶的需求,提高了用戶體驗(yàn)。
步驟S10中,用戶在電子商務(wù)網(wǎng)站的歷史訪問(wèn)記錄包括用戶在PC端、APP端以及WAP端的歷史行為記錄。用戶在電子商務(wù)網(wǎng)站的歷史訪問(wèn)記錄,例如:用戶根據(jù)用戶名/密碼等登錄電子商務(wù)網(wǎng)站,點(diǎn)擊、商品搜索與查詢、瀏覽、頁(yè)面停留、將商品放入購(gòu)物車、詢價(jià)、與客服人員交互、確認(rèn)支付、要求售后服務(wù)。步驟S10采集的歷史訪問(wèn)記錄來(lái)源于多終端。多終端的數(shù)據(jù)來(lái)源,確保了構(gòu)建特征向量更加豐富、完整,為后續(xù)步驟提供了良好的數(shù)據(jù)基礎(chǔ)。根據(jù)用戶注冊(cè)時(shí)間和訪問(wèn)的歷史記錄,將用戶分為老用戶和新用戶。新用戶是指當(dāng)天注冊(cè)的用戶,包括有歷史訪問(wèn)記錄或者沒(méi)有歷史訪問(wèn)記錄的。老用戶是指非當(dāng)天注冊(cè)的用戶,包括有歷史訪問(wèn)記錄或者沒(méi)有歷史訪問(wèn)記錄。
對(duì)于老用戶而言,構(gòu)建的特征向量,例如可以是:是否電話驗(yàn)證:IS_PHONE_VERIFY、是否郵箱驗(yàn)證:IS_EMAIL_VERIFY、注冊(cè)至今天數(shù):RGST_TIME、是否訪問(wèn)列表頁(yè):在最近2天是否訪問(wèn)列表頁(yè)、是否訪問(wèn)商品詳情頁(yè)、最近2天是否訪問(wèn)、是否訪問(wèn)促銷頁(yè)、是否訪問(wèn)注冊(cè)頁(yè)等等。
對(duì)于新用戶而言,構(gòu)建的特征向量,例如可以是:瀏覽頁(yè)面數(shù)、瀏覽四級(jí)頁(yè)面、瀏覽促銷頁(yè)、瀏覽訂單查詢頁(yè)、瀏覽來(lái)自app的占比、瀏覽時(shí)間在0點(diǎn)~7點(diǎn)的占比、瀏覽時(shí)間在19點(diǎn)到第二天0點(diǎn)的占比、購(gòu)買單品數(shù)等等。
顯然,上面所述的特征向量?jī)H僅是例舉。在實(shí)際中可以根據(jù)不同情形設(shè)置不同的特征向量。
為實(shí)現(xiàn)精準(zhǔn)推送信息,需要對(duì)各用戶分別推送信息。為提高推送效率,對(duì)老用戶和新用戶進(jìn)行分類,使得用戶的分類層次更多。信息向多種分類的用戶分別推送,實(shí)現(xiàn)在不同的時(shí)間向不同分類的用戶推送信息,在相同的時(shí)間向同一分類的用戶推送信息。對(duì)老用戶和新用戶進(jìn)行分類的方法有很多。本實(shí)施例優(yōu)選運(yùn)用生存分析模型對(duì)老用戶和新用戶分別進(jìn)行分類。具體方法如下:
首先利用式(1)測(cè)算用戶的特征值:
COX=X1*B1+X2*B2+…+Xn*Bn 式(1)
式(1)中,COX表示用戶的特征值,X1表示該用戶的第一個(gè)特征向量,B1表示X1的對(duì)應(yīng)系數(shù),X2表示該用戶的第二個(gè)特征向量,B2表示X2的對(duì)應(yīng)系數(shù),Xn表示該用戶的第n個(gè)特征向量,Bn表示Xn的對(duì)應(yīng)系數(shù);n為大于等于3的整數(shù);
然后根據(jù)各用戶的特征值和事先設(shè)定的閾值,對(duì)老用戶和新用戶分別進(jìn)行分類。
例如,將老用戶分成五類,具體如下:
TYPE_1:round(COX,1)≤-0.5
TYPE_2:-0.5<round(COX,1)≤-0.2
TYPE_3:-0.2<round(COX,1)≤0.3
TYPE_4:0.3<round(COX,1)≤2.3
TYPE_5:2.3<round(COX,1)
round(COX,1)表示利用式(1)測(cè)算出的老用戶的特征值,并保留一位小數(shù)。-0.5、-0.2、0.3、2.3均為事先設(shè)定的閾值。通過(guò)這些事先設(shè)定的閾值,將老用戶分為了五類。對(duì)這五類老用戶,將分別確定推送時(shí)間,以推送信息。對(duì)于老用戶中每類用戶,利用邏輯回歸模型測(cè)算用戶未來(lái)W天最有可能回訪或者最有可能購(gòu)買的概率,然后按照事先設(shè)定的概率閾值,進(jìn)行比較后,選擇推送時(shí)間。
邏輯回歸模型如式(2)所示,
P=exp(A0+Y1*A1+Y2*A2+…+Yn*An)/(1+exp(A0+Y1*A1+Y2*A2+…+Yn*An))式(2)
式(2)中,P表示用戶最有可能回訪或者最有可能購(gòu)買的概率,A0表示常數(shù)項(xiàng),Y1表示影響用戶購(gòu)買行為的第一因素,A1表示Y1的對(duì)應(yīng)系數(shù),Y2表示影響用戶購(gòu)買行為的第二因素,A2表示Y2的對(duì)應(yīng)系數(shù),Yn表示影響用戶購(gòu)買行為的第n因素,An表示Yn的對(duì)應(yīng)系數(shù);n為大于等于3的整數(shù)。影響用戶購(gòu)買行為的因素,例如第一因素、第二因素、第n因素,均由步驟S10采集。例如,這些因素可以為:是否訪問(wèn)加入購(gòu)物車頁(yè)面、是否訪問(wèn)咨詢服務(wù)頁(yè)、是否訪問(wèn)收藏頁(yè)、是否訪問(wèn)積分和券頁(yè)、是否訪問(wèn)退換貨頁(yè)、是否訪問(wèn)搜索頁(yè)、是否通過(guò)PC端訪問(wèn)、是否通過(guò)WAP端訪問(wèn)、是否通過(guò)APP端訪問(wèn)等。
在式(2)的邏輯回歸模型中,可建立如式(3)所示的回歸關(guān)系:
Log(P/1-P)=A0+Y1*A1+Y2*A2+…+Yn*An 式(3)
通過(guò)極大似然法,得到參數(shù)A0~An的估計(jì)值。再將A0~An的估計(jì)值代入式(2)中測(cè)算概率。
對(duì)上述五類老用戶分別計(jì)算概率,確定信息推送時(shí)間。例如,在上述五類老用戶中:
TYPE_1:計(jì)算未來(lái)D1天的概率。如果未來(lái)D2天的概率連續(xù)大于S,則僅在第D2天推送一次信息,否則將概率小于S的天數(shù),按照概率從大到小排,選擇D3天,分別推送一次信息,如果不夠D3天,再按概率從小到大排,選擇大于S的天數(shù),湊足D3天。其中,D2<D1,D3<D1,0.5≤S≤1。
對(duì)于TYPE_1來(lái)說(shuō),如果未來(lái)D2天的概率連續(xù)大于S,則說(shuō)明該老用戶經(jīng)常購(gòu)買或訪問(wèn),所以不需要經(jīng)常向其推送信息,僅在第D2天推送一次信息。如果未來(lái)D2天的概率不是連續(xù)大于S,則說(shuō)明該老用戶不是經(jīng)常購(gòu)買或訪問(wèn),則將在未來(lái)D1天內(nèi),概率小于S的天數(shù),按照概率從大到小排,選擇排在前面的D3天,向其推送信息。概率越大,說(shuō)明購(gòu)買概率越高,故從大到小進(jìn)行排序。如果不夠D3天,再按概率從小到大排列,選擇排在前面的天數(shù),湊足D3天。因?yàn)楦怕试叫?,?gòu)買或訪問(wèn)的可能性越低,所以選擇這些小概率的天數(shù)推送信息,有利于提醒用戶購(gòu)買商品或訪問(wèn)網(wǎng)站。作為優(yōu)選,S=0.7,D1=21,D2=3,D3=9。
TYPE_2:計(jì)算未來(lái)D4天的概率。如果未來(lái)D2天的概率連續(xù)大于S,則僅在第D2天推送一次;否則把概率小于S的天數(shù),按照概率從大到小排,選擇排在前面的D5天,向其推送信息。如果不夠D5天,再按概率從小到大排,選擇排在前面的天數(shù),湊足D5天。其中,D2<D4,D5<D4,0.5≤S≤1。
對(duì)于TYPE_2來(lái)說(shuō),如果未來(lái)D2天的概率連續(xù)大于S,則說(shuō)明該老用戶經(jīng)常購(gòu)買或訪問(wèn),所以不需要經(jīng)常向其推送信息,僅在第D2天推送一次信息。如果未來(lái)D2天的概率不是連續(xù)大于S,則說(shuō)明該老用戶不是經(jīng)常購(gòu)買或訪問(wèn),則將未來(lái)D4天內(nèi),概率小于S的天數(shù),按照概率從大到小排,選擇排在前面的D5天,向其推送信息。如果不夠D5天,再按概率從小到大排列,選擇排在前面的天數(shù),這些天數(shù)的概率都大于S,湊足D5天。因?yàn)楦怕试叫?,?gòu)買或訪問(wèn)的可能性越低,所以選擇這些小概率的天數(shù)推送信息,有利于提醒用戶購(gòu)買商品或訪問(wèn)網(wǎng)站。作為優(yōu)選,S=0.7,D4=14,D2=3,D5=4。
TYPE_3:計(jì)算未來(lái)D6天的概率。如果未來(lái)D2天的概率連續(xù)大于S,則僅在第D2天發(fā)一次;否則把概率小于S的天數(shù),按照概率從大到小排,選擇排在前面的D7天,向其推送信息;如果不夠D7天,再按概率從小到大排,選擇排在前面的天數(shù),湊足D7天。其中,D2<D6,D7<D6,0.5≤S≤1。
對(duì)于TYPE_3來(lái)說(shuō),如果未來(lái)D2天的概率連續(xù)大于S,則說(shuō)明該老用戶經(jīng)常購(gòu)買或訪問(wèn),所以不需要經(jīng)常向其推送信息,僅在第D2天推送一次信息。如果未來(lái)D2天的概率不是連續(xù)大于S,則說(shuō)明該老用戶不是經(jīng)常購(gòu)買或訪問(wèn),則將未來(lái)D6天內(nèi),概率小于S的天數(shù),按照概率從大到小排,挑出D7天,向其推送信息。如果不夠D7天,再按概率從小到大排列,選擇排在前面的天數(shù),這些天數(shù)的概率都大于S,湊足D7天。因?yàn)楦怕试叫。?gòu)買或訪問(wèn)的可能性越低,所以選擇這些小 概率的天數(shù)推送信息,有利于提醒用戶購(gòu)買商品或訪問(wèn)網(wǎng)站。作為優(yōu)選,S=0.7,D6=7,D2=3,D7=2。
TYPE_4:計(jì)算未來(lái)D8天的概率,按,選擇排在前面的D9天推送信息。其中,D9<D8。作為優(yōu)選,D8=14,D9=4。
TYPE_4中,概率從大到小排,可確保計(jì)算出來(lái)購(gòu)買概率高的時(shí)間,優(yōu)先推送信息。
TYPE_5:計(jì)算未來(lái)D10天的概率,按概率從大到小排,選擇排在前面的D11天推送信息。其中,D11<D10。作為優(yōu)選,D10=7,D11=2。
TYPE_5中,概率從大到小排,可確保計(jì)算出來(lái)購(gòu)買概率高的時(shí)間,優(yōu)先推送信息。
對(duì)新用戶而言,則依據(jù)事先設(shè)定的閾值,進(jìn)行分類后,直接確定信息推送時(shí)間。例如,新用戶在未來(lái)9天內(nèi),信息推送時(shí)間如下:
TYPE_11:round(COX,1)≤0.4 第2,3天推送;
TYPE_12:0.4<round(COX,1)≤1.6 第2天推送;
TYPE_13:1.6<round(COX,1) 第3天推送。
對(duì)新用戶,依據(jù)式(1)測(cè)算各個(gè)新用戶的特征值,然后依據(jù)事先設(shè)定的閾值,對(duì)新用戶進(jìn)行分類。上例中,設(shè)定的閾值為0.4和1.6,將新用戶分成三類。對(duì)三類新用戶,直接確定信息推送時(shí)間。上例中,對(duì)于round(COX,1)≤0.4的新用戶,則在第2天和第3天均推送信息。對(duì)于0.4<round(COX,1)≤1.6的新用戶,則在第2天推送信息。對(duì)于其他的新用戶,則在第3天推送信息。round(COX,1)≤0.4說(shuō)明這類用戶不是活躍用戶,則需要推送多次和連續(xù)推送;0.4<round(COX,1)≤1.6 說(shuō)明這類用戶是一般活躍用戶,所以需要發(fā)一天即可。1.6<round(COX,1)說(shuō)明該類用戶是活躍用戶,不需要很快給他們推送信息,在第三天推送即可。
如圖2所示,本實(shí)施例提供一種個(gè)性化信息推送時(shí)間的確定系統(tǒng),該系統(tǒng)包括:
采集模塊:用于采集用戶在電子商務(wù)網(wǎng)站的歷史訪問(wèn)記錄;
構(gòu)建模塊:用于利用采集模塊采集的歷史訪問(wèn)記錄,構(gòu)建特征向量;
分類模塊:用于根據(jù)構(gòu)建模塊構(gòu)建的特征向量,利用生存分析模型對(duì)用戶進(jìn)行分類;
確定模塊:用于根據(jù)分類模塊對(duì)用戶的分類,確定向每一類用戶推送信息的時(shí)間。
本確定系統(tǒng)中,利用采集模塊采集用戶在電子商務(wù)網(wǎng)站的歷史訪問(wèn)記錄,利用構(gòu)建模塊構(gòu)建特征向量。特征向量源于用戶在電子商務(wù)網(wǎng)站的歷史訪問(wèn)記錄。本確定系統(tǒng)中確定模塊確定的推送信息時(shí)間,正是基于這些特征向量。也就是說(shuō),本確定系統(tǒng)中確定的推送信息時(shí)間,是基于各用戶的歷史訪問(wèn)記錄。這樣確定的推送信息時(shí)間就具有個(gè)性化,而不是主觀統(tǒng)一向各用戶設(shè)定同一推送信息時(shí)間。另外,本確定系統(tǒng)中,分類模塊對(duì)用戶進(jìn)行分類。對(duì)同一分類中的用戶確定同一推送時(shí)間,有利于提高推送效率。
采集模塊采集的用戶在電子商務(wù)網(wǎng)站的歷史訪問(wèn)記錄,包括用戶在PC端、APP端以及WAP端的歷史行為記錄。歷史訪問(wèn)記錄來(lái)源于多終 端。多終端的數(shù)據(jù)來(lái)源,確保了構(gòu)建模塊構(gòu)建的特征向量更加豐富、完整,為后續(xù)步驟提供了良好的數(shù)據(jù)基礎(chǔ)。根據(jù)用戶注冊(cè)時(shí)間和訪問(wèn)的歷史記錄,可將用戶分為老用戶和新用戶。新用戶是指當(dāng)天注冊(cè)的用戶,包括有歷史訪問(wèn)記錄或者沒(méi)有歷史訪問(wèn)記錄的。老用戶是指非當(dāng)天注冊(cè)的用戶,包括有歷史訪問(wèn)記錄或者沒(méi)有歷史訪問(wèn)記錄。
構(gòu)建模塊的構(gòu)建特征向量,對(duì)于老用戶而言可以是:是否電話驗(yàn)證:IS_PHONE_VERIFY、是否訪問(wèn)列表頁(yè):在最近2天是否訪問(wèn)列表頁(yè)、是否訪問(wèn)商品詳情頁(yè)、最近2天是否訪問(wèn)、等等。對(duì)于新用戶而言可以是:瀏覽頁(yè)面數(shù)、瀏覽四級(jí)頁(yè)面、瀏覽促銷頁(yè)、瀏覽訂單查詢頁(yè)、購(gòu)買單品數(shù)等等。以上僅僅是例舉。
分類模型對(duì)用戶進(jìn)行分類的方式有很多。本實(shí)施例優(yōu)選運(yùn)用生存分析模型對(duì)老用戶和新用戶進(jìn)行分類:首先利用式(1)測(cè)算用戶的特征值:
COX=X1*B1+X2*B2+…+Xn*Bn 式(1)
式(1)中,COX表示用戶的特征值,X1表示該用戶的第一個(gè)特征向量,B1表示X1的對(duì)應(yīng)系數(shù),X2表示該用戶的第二個(gè)特征向量,B2表示X2的對(duì)應(yīng)系數(shù),Xn表示該用戶的第n個(gè)特征向量,Bn表示Xn的對(duì)應(yīng)系數(shù);n為大于等于3的整數(shù);
然后根據(jù)各用戶的特征值和事先設(shè)定的閾值,對(duì)老用戶和新用戶分別進(jìn)行分類。
將登陸用戶的回訪并加入購(gòu)物車行為定義為“死亡”,那么就可以應(yīng)用生存分析模型來(lái)區(qū)分用戶的“生存”狀態(tài)(即未加入購(gòu)物車)。 隨著時(shí)間延長(zhǎng),“生存”的用戶越來(lái)越少,即用戶的生存曲線是一條單調(diào)遞減的曲線。用S(x)表示生存曲線的函數(shù),如式(4)所示:
其中,λ(t)表示危險(xiǎn)率函數(shù),λ(t)由基準(zhǔn)風(fēng)險(xiǎn)率λ0(t)和特征向量Z決定,滿足式(5):
λ(t)=λ0(t)*eβZ 式(5)
其中,β表示特征值,用R軟件估計(jì)出來(lái)。R軟件是一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng),R語(yǔ)言是S語(yǔ)言的一種實(shí)現(xiàn)。將式(5)代入式(4)可得式(6):
其中,S0(x)表示基準(zhǔn)生存函數(shù)。對(duì)所有用戶而言,S0(x)都是相同的。用戶之間的差異通過(guò)特征向量Z的函數(shù)K(Z)=eβZ來(lái)決定。通過(guò)劃分函數(shù)K(Z)來(lái)實(shí)現(xiàn)對(duì)用戶的分類。
上述確定系統(tǒng)中,確定模塊包括:
測(cè)算子模塊:用于對(duì)老用戶利用邏輯回歸模型測(cè)算用戶未來(lái)最有可能回訪或者最有可能購(gòu)買的概率;
比較子模塊:用于將測(cè)算子模塊測(cè)算的概率,與事先設(shè)定的概率閾值,進(jìn)行比較;
確定子模塊:用于根據(jù)比較子模塊的比較結(jié)果,確定推送時(shí)間。
其中,測(cè)算子模塊中采用邏輯回歸模型如式(2)所示,
P=exp(A0+Y1*A1+Y2*A2+…+Yn*An)/(1+exp(A0+Y1*A1+Y2*A2+…+Yn*An))式(2)
式(2)中,A0表示常數(shù)項(xiàng),Y1表示影響用戶購(gòu)買行為的第一因素,A1表示Y1的對(duì)應(yīng)系數(shù),Y2表示影響用戶購(gòu)買行為的第二因素,A2表示Y2的對(duì)應(yīng)系數(shù),Yn表示影響用戶購(gòu)買行為的第n因素,An表示Yn的對(duì)應(yīng)系數(shù);n為大于等于3的整數(shù)。
確定模塊中,首先利用測(cè)算子模塊對(duì)老用戶利用邏輯回歸模型測(cè)算用戶未來(lái)最有可能回訪或者最有可能購(gòu)買的概率;然后利用比較子模塊將測(cè)算子模塊測(cè)算的概率,與事先設(shè)定的概率閾值,進(jìn)行比較;最后根據(jù)比較子模塊的比較結(jié)果,利用確定子模塊確定推送時(shí)間。對(duì)不同分類的老用戶,確定模塊對(duì)各類老用戶分別確定推送時(shí)間。每一類老用戶具有相同的推送時(shí)間。將所有用戶進(jìn)行分類,依據(jù)各分類中的用戶的歷史訪問(wèn)記錄,確定各類老用戶的推送時(shí)間,使得推送時(shí)間更符合各類用戶的歷史行為。
本確定系統(tǒng)中,基于用戶的歷史訪問(wèn)記錄,運(yùn)用生存分析模型對(duì)用戶進(jìn)行分類,運(yùn)用邏輯回歸模型計(jì)算老用戶的回訪或購(gòu)買概率,從而計(jì)算用戶最合適的信息推送時(shí)機(jī),提高用戶體驗(yàn)。
本領(lǐng)域技術(shù)人員應(yīng)該知曉,實(shí)現(xiàn)上述實(shí)施例的方法或者系統(tǒng),可以通過(guò)計(jì)算機(jī)程序指令來(lái)實(shí)現(xiàn)。該計(jì)算機(jī)程序指令裝載到可編程數(shù)據(jù)處理設(shè)備上,例如計(jì)算機(jī),從而在可編程數(shù)據(jù)處理設(shè)備上執(zhí)行相應(yīng)的指令,用于實(shí)現(xiàn)上述實(shí)施例的方法或者系統(tǒng)實(shí)現(xiàn)的功能。
本領(lǐng)域技術(shù)人員依據(jù)上述實(shí)施例,可以對(duì)本申請(qǐng)進(jìn)行非創(chuàng)造性的 技術(shù)改進(jìn),而不脫離本發(fā)明的精神實(shí)質(zhì)。這些改進(jìn)仍應(yīng)視為在本申請(qǐng)權(quán)利要求的保護(hù)范圍之內(nèi)。