亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種判斷用戶群體流失傾向的方法及裝置與流程

文檔序號:12803932閱讀:229來源:國知局
一種判斷用戶群體流失傾向的方法及裝置與流程

本發(fā)明涉及計算機(jī)技術(shù)領(lǐng)域,尤其涉及一種判斷用戶群體流失傾向的方法及裝置。



背景技術(shù):

隨著計算機(jī)技術(shù)的發(fā)展與大數(shù)據(jù)時代的到來,各個公司對于用戶的留存情況越來越重視,希望能夠?qū)τ脩舻牧魇нM(jìn)行預(yù)測。及早識別出其已擁有的但有可能流失的用戶對于各公司來說非常重要,因為如果能及早識別出這樣的用戶,就可以采取一些措施來防止用戶流失。但是在電商領(lǐng)域中對于預(yù)測某類用戶的流失傾向還是缺少明確、有效的預(yù)測機(jī)制。

目前,對于用戶流失的預(yù)測算法并沒有明確針對電商平臺上用戶的模型算法,所以目前的預(yù)測算法主要是通過用戶的人口統(tǒng)計信息、用戶的行為信息等數(shù)據(jù)源作為用戶模型構(gòu)建的因子。此外,目前的預(yù)測模型在預(yù)測用戶的流失傾向時,沒有根據(jù)用戶的購買行為數(shù)據(jù)等互聯(lián)網(wǎng)訪問數(shù)據(jù)對用戶進(jìn)行歸類,所以在預(yù)測流失率時,難以對某類用戶的整體流失傾向做出準(zhǔn)確預(yù)測,電商商家在得知流失傾向后也無法根據(jù)不同用戶的用戶特征和偏好模型做出反饋。



技術(shù)實現(xiàn)要素:

有鑒于此,本發(fā)明提供一種判斷用戶群體流失傾向的方法及裝置,主要目的在于針對互聯(lián)網(wǎng)電商用戶的購買行為數(shù)據(jù)判斷用戶群體流失的傾向概率。

為達(dá)到上述目的,本發(fā)明主要提供如下技術(shù)方案:

一方面,本發(fā)明提供了一種判斷用戶群體流失傾向的方法,該方法包括:

獲取產(chǎn)品購買用戶的瀏覽行為數(shù)據(jù),所述瀏覽行為數(shù)據(jù)是所述用戶進(jìn)行產(chǎn)品瀏覽時生成的數(shù)據(jù)信息;

根據(jù)預(yù)置的數(shù)據(jù)特征值為所述瀏覽行為數(shù)據(jù)對應(yīng)的用戶標(biāo)記標(biāo)簽,所述數(shù)據(jù)特征值為所述瀏覽行為數(shù)據(jù)中行為特征字段的值;

利用所述標(biāo)簽對所述瀏覽行為數(shù)據(jù)進(jìn)行分類,得到用戶群體集合;

根據(jù)所述用戶群體集合的購買行為數(shù)據(jù)與標(biāo)簽占比值,計算所述用戶群體集合的流失傾向,所述購買行為數(shù)據(jù)記錄有用戶在購買產(chǎn)品時生成的數(shù)據(jù)信息,所述標(biāo)簽占比值為所述用戶群體集合的所有用戶中含有的單個標(biāo)簽數(shù)量占總標(biāo)簽數(shù)量的比重值。

另一方面,本發(fā)明還提供了一種判斷用戶群體流失傾向的裝置,該裝置包括:

獲取單元,用于獲取產(chǎn)品購買用戶的瀏覽行為數(shù)據(jù),所述瀏覽行為數(shù)據(jù)是所述用戶進(jìn)行產(chǎn)品瀏覽時生成的數(shù)據(jù)信息;

標(biāo)記單元,用于根據(jù)預(yù)置的數(shù)據(jù)特征值為所述獲取單元獲取的瀏覽行為數(shù)據(jù)對應(yīng)的用戶標(biāo)記標(biāo)簽,所述數(shù)據(jù)特征值為所述瀏覽行為數(shù)據(jù)中行為特征字段的值;

分類單元,用于利用所述標(biāo)簽對所述標(biāo)記單元標(biāo)記有標(biāo)簽的瀏覽行為數(shù)據(jù)進(jìn)行分類,得到用戶群體集合;

計算單元,用于根據(jù)所述分類單元所劃分的用戶群體集合的購買行為數(shù)據(jù)與標(biāo)簽占比值,計算所述用戶群體集合的流失傾向,所述購買行為數(shù)據(jù)記錄有用戶在購買產(chǎn)品時生成的數(shù)據(jù)信息,所述標(biāo)簽占比值為所述用戶群體集合的所有用戶中含有的單個標(biāo)簽數(shù)量占總標(biāo)簽數(shù)量的比重值。

依據(jù)上述本發(fā)明所提出的判斷用戶群體流失傾向的方法及裝置,主要用于預(yù)測電商網(wǎng)站中具有相似特征的用戶群體的流失傾向概率。具體通過大數(shù)據(jù)的統(tǒng)計,獲取購買過電商網(wǎng)站產(chǎn)品的用戶數(shù)量,以及每個用戶的網(wǎng)絡(luò)瀏覽行為數(shù)據(jù),并且根據(jù)這些瀏覽行為數(shù)據(jù)中所具有的特征值為所有瀏覽行為數(shù)據(jù)標(biāo)記不同的信息標(biāo)簽,再根據(jù)預(yù)置的分類策略進(jìn)行數(shù)據(jù)分類,從而得到具有相似特征的用戶群體。再根據(jù)該群體中用戶購買行為數(shù)據(jù)的平均值,以及標(biāo)簽中的標(biāo)簽占比值綜合計算并判斷該用戶群體相對于該電 商網(wǎng)站的流失傾向。相對于現(xiàn)有的預(yù)測用戶流失的計算模型,本發(fā)明所采用的方法是針對電商領(lǐng)域中銷售產(chǎn)品網(wǎng)站或平臺進(jìn)行的用戶流失傾向的預(yù)測方法,因此,本方法中所采用的數(shù)據(jù)參數(shù)更加具有針對性,使得在電商領(lǐng)域中的預(yù)測準(zhǔn)確度更高。同時,本發(fā)明還能夠根據(jù)用戶之間所具有的相似特征對多名用戶同時進(jìn)行流失傾向的預(yù)測,相對于單個用戶的預(yù)測方式,大幅提高了預(yù)測效率。

附圖說明

通過閱讀下文優(yōu)選實施方式的詳細(xì)描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認(rèn)為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:

圖1示出了本發(fā)明實施例提出的一種判斷用戶群體流失傾向的方法的流程圖;

圖2示出了本發(fā)明實施例提出的另一種判斷用戶群體流失傾向的方法的流程圖;

圖3示出了本發(fā)明實施例提出的一種判斷用戶群體流失傾向的裝置的組成框圖;

圖4示出了本發(fā)明實施例提出的另一種判斷用戶群體流失傾向的裝置的組成框圖。

具體實施方式

下面將參照附圖更詳細(xì)地描述本發(fā)明的示例性實施例。雖然附圖中顯示了本發(fā)明的示例性實施例,然而應(yīng)當(dāng)理解,可以以各種形式實現(xiàn)本發(fā)明而不應(yīng)被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本發(fā)明,并且能夠?qū)⒈景l(fā)明的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。

本發(fā)明實施例提供了一種判斷用戶群體流失傾向的方法,如圖1所示,該方法主要應(yīng)用于電商網(wǎng)站或銷售平臺,通過篩選具有針對性的數(shù)據(jù)信息 綜合預(yù)測用戶群體的流失傾向,其具體步驟包括:

101、獲取產(chǎn)品購買用戶的瀏覽行為數(shù)據(jù)。

在電商領(lǐng)域中,用戶的概念是在電商網(wǎng)站或銷售平臺中進(jìn)行過消費行為的用戶,而對于沒有消費,只是瀏覽產(chǎn)品的用戶成為潛在用戶或準(zhǔn)用戶。因此,在本步驟中所獲取的瀏覽行為數(shù)據(jù),是在某個電商網(wǎng)站或銷售平臺中購買過產(chǎn)品的用戶所生成的瀏覽行為數(shù)據(jù)。對于該瀏覽行為數(shù)據(jù)的范圍,本發(fā)明實施例不做具體限定,該瀏覽行為可以是與用戶所購買產(chǎn)品同一電商中其他產(chǎn)品的瀏覽行為,也可以是其他電商平臺中的產(chǎn)品瀏覽行為。同時,以用戶為單位,統(tǒng)計該電商中所有用戶的或指定范圍內(nèi)的用戶的相關(guān)瀏覽行為數(shù)據(jù)。

其中,瀏覽行為數(shù)據(jù)的內(nèi)容包括有用戶的相關(guān)信息(如用戶名,用戶年齡、性別等基礎(chǔ)信息),產(chǎn)品的信息(產(chǎn)品名稱、種類、價格等信息),以及瀏覽信息(如瀏覽的時間、次數(shù)等信息)。

前述的用戶瀏覽行為數(shù)據(jù)的獲取方式可以是對大數(shù)據(jù)的采集、篩選獲取的,具體的,可以通過在電商網(wǎng)站的產(chǎn)品頁面中設(shè)置檢測代碼的方式獲取用戶的瀏覽行為數(shù)據(jù),這也是當(dāng)下最為流行普及的數(shù)據(jù)獲取方式,在本發(fā)明實施例中,對于數(shù)據(jù)獲取的具體方式并不限定。

102、根據(jù)預(yù)置的數(shù)據(jù)特征值為瀏覽行為數(shù)據(jù)對應(yīng)的用戶標(biāo)記標(biāo)簽。

在每一條的用戶瀏覽行為數(shù)據(jù)中,都包含有該用戶眾多的數(shù)據(jù)特征,通過將相同用戶的瀏覽行為數(shù)據(jù)進(jìn)行統(tǒng)計與分析,可以總結(jié)出該用戶的一些瀏覽習(xí)慣,關(guān)注產(chǎn)品的種類等行為規(guī)律,這也是當(dāng)前大數(shù)據(jù)分析的基本原理。通過數(shù)據(jù)分析,能夠提取出可以用于區(qū)別用戶的特征數(shù)據(jù),將這些數(shù)據(jù)按照不同的劃分標(biāo)準(zhǔn)以標(biāo)簽的形式預(yù)置在系統(tǒng)中,根據(jù)用戶在其瀏覽行為數(shù)據(jù)中所具有的特征數(shù)據(jù)對該用戶標(biāo)記不同的標(biāo)簽。例如,用戶a的瀏覽行為數(shù)據(jù)中瀏覽的產(chǎn)品多是高端產(chǎn)品,并且瀏覽的時間也都比較密集,則為用戶a標(biāo)記的標(biāo)簽就可以是高購買力標(biāo)簽以及高活躍度標(biāo)簽。其中,特征數(shù)據(jù)的具體內(nèi)容包括產(chǎn)品所屬分類,每個標(biāo)簽的占比數(shù)據(jù),用戶瀏覽時間、瀏覽間隔、次數(shù)等數(shù)據(jù)信息。

在為用戶標(biāo)記標(biāo)簽時不限定于只標(biāo)記一種標(biāo)簽,而是根據(jù)該用戶的瀏 覽行為數(shù)據(jù)中相應(yīng)的特征字段的值來綜合判斷該用戶是否應(yīng)該標(biāo)記該標(biāo)簽,當(dāng)一個用戶的瀏覽行為數(shù)據(jù)中具有多個特征字段,且值都符合標(biāo)記標(biāo)簽的要求時,則該用戶就具有多個標(biāo)簽。

本發(fā)明實施例中,標(biāo)簽的數(shù)量以及種類可以根據(jù)具體采集的數(shù)據(jù)內(nèi)容進(jìn)行不同的設(shè)置,并且在確定了標(biāo)簽的種類后,根據(jù)每個標(biāo)簽所標(biāo)記的數(shù)據(jù)信息的數(shù)量,為每個標(biāo)簽計算一個相應(yīng)的占比,即該標(biāo)簽在所有標(biāo)簽中所占的比重。需要特別說明的是,該占比值是一個動態(tài)值,根據(jù)是根據(jù)選定的數(shù)據(jù)信息的數(shù)量變化而改變的。

103、利用標(biāo)簽對瀏覽行為數(shù)據(jù)進(jìn)行分類,得到用戶群體集合。

根據(jù)瀏覽行為數(shù)據(jù)中標(biāo)注的標(biāo)簽,由于每條瀏覽行為數(shù)據(jù)中的標(biāo)簽可能標(biāo)注有多個,因此,根據(jù)標(biāo)簽之間的相似關(guān)系,以及不同的組合方式,可以形成不同分類策略將瀏覽行為數(shù)據(jù)進(jìn)行分類,將具有相似特征的瀏覽行為數(shù)據(jù)分為一類,例如,根據(jù)瀏覽產(chǎn)品的相似程度進(jìn)行分類,或者是通過對瀏覽行為數(shù)據(jù)中用戶的相關(guān)信息進(jìn)行分類,如用戶的年齡、地域、性別等。再提取同一類中各條瀏覽行為數(shù)據(jù)所對應(yīng)的用戶,去重后,就能夠得到一個用戶群體集合,而該集合中的各個用戶都具有相似的標(biāo)簽特征值。例如,根據(jù)產(chǎn)品種類劃分可以分成關(guān)注電子產(chǎn)品的用戶和關(guān)注食品的用戶等,按照產(chǎn)品的價格又可以分為關(guān)注奢侈品的用戶和關(guān)注日用品的用戶等,而綜合的劃分后就可以分為關(guān)注高端電子產(chǎn)品的用戶和關(guān)注高端日用品的用戶等。

104、根據(jù)用戶群體集合的購買行為數(shù)據(jù)與標(biāo)簽占比值,計算該用戶群體集合的流失傾向。

判斷用戶流失傾向,是判斷用戶相對于電商網(wǎng)站的流失傾向,而判斷的主要依據(jù)是看該用戶在該電商網(wǎng)站中的消費頻率是否降低。而導(dǎo)致消費頻率降低的因素可能是多種多樣的,在這些的因素中大部分是可以根據(jù)該用戶的瀏覽行為數(shù)據(jù)的分析結(jié)果來判斷的。所以,在本發(fā)明實施中,先通過獲取用戶群體集合中所有用戶的購買行為數(shù)據(jù),該購買行為數(shù)據(jù)中記錄有用戶在購買該電商網(wǎng)站中的產(chǎn)品時生成的數(shù)據(jù)信息,例如購買產(chǎn)品的時間,成交價格,產(chǎn)品的購買數(shù)量,以及該用戶的相關(guān)信息等。通過分析用 戶的購買行為數(shù)據(jù)就可以得到單個用戶的購買頻率,從而計算出用戶群體集合的平均購買頻率。再選取可能導(dǎo)致消費頻率降低的因素,即選擇帶有標(biāo)簽占比值的用戶標(biāo)簽。將得到的平均購買頻率賦上所選取的標(biāo)簽占比值之和的反值(由于計算的是用戶流失傾向,而標(biāo)簽占比值之和所表示的為該用戶群體所生成的購買行為的數(shù)據(jù)信息,可以理解為該用戶群體與網(wǎng)站的親近數(shù)值,即粘性。因此,要將該占比值之和取反值來計算用戶群體集合的流失傾向),將所得到的數(shù)值定義為該用戶群體集合的流失傾向得分,根據(jù)分?jǐn)?shù)的高低評價該用戶群體相對于該電商網(wǎng)站的流失傾向。其中,由于該用戶群體中的用戶具有相似性,所以可以認(rèn)為這些用戶在流失傾向上也具有相似性,因此,使用本方法對于用戶群體中的所有用戶均適用,不會產(chǎn)生過大的偏差,在判斷的準(zhǔn)確性上沒有影響。同時,由于本實施例中所采用的方式是根據(jù)用戶購買行為和用戶瀏覽行為進(jìn)行預(yù)測,由于這些行為數(shù)據(jù)本身就具有一定的客觀規(guī)律性,因此,該預(yù)測用戶流失傾向的方法能更準(zhǔn)確的對電商領(lǐng)域中的網(wǎng)站或平臺提供預(yù)測數(shù)據(jù)。

其中,標(biāo)簽占比值為該用戶群體集合內(nèi)的所有用戶中含有的單個標(biāo)簽數(shù)量占總標(biāo)簽數(shù)量的比重值。由于對每個用戶中所標(biāo)記的標(biāo)簽可能不只一個,因此,單個標(biāo)簽數(shù)量可以是指具有相同標(biāo)簽的用戶數(shù)量,也可以是與生成該標(biāo)簽相關(guān)的瀏覽行為數(shù)據(jù)的數(shù)量。而總標(biāo)簽數(shù)量則為該用戶群體集合中所有標(biāo)簽數(shù)量的總和。

結(jié)合上述的實現(xiàn)方式可以看出,本發(fā)明實施例所采用的判斷用戶群體流失傾向的方法,是通過對電商用戶的大數(shù)據(jù)統(tǒng)計,獲取購買過電商網(wǎng)站產(chǎn)品的用戶數(shù)量,以及每個用戶的網(wǎng)絡(luò)瀏覽行為數(shù)據(jù),并且根據(jù)這些瀏覽行為數(shù)據(jù)中所具有的特征值為所有瀏覽行為數(shù)據(jù)標(biāo)記不同的信息標(biāo)簽,再根據(jù)預(yù)置的分類策略進(jìn)行數(shù)據(jù)分類,從而得到具有相似特征的用戶群體。再根據(jù)該群體中用戶購買行為數(shù)據(jù)的平均值,以及標(biāo)簽中的標(biāo)簽占比值綜合計算并判斷該用戶群體相對于該電商網(wǎng)站的流失傾向。相對于現(xiàn)有的預(yù)測用戶流失的計算模型,本發(fā)明實施例所采用的方法是針對電商領(lǐng)域中銷售產(chǎn)品網(wǎng)站或平臺進(jìn)行的用戶流失傾向的預(yù)測方法,因此,本發(fā)明實施例中所采用的數(shù)據(jù)參數(shù)更加具有針對性,使得在電商領(lǐng)域中的預(yù)測準(zhǔn)確度更 高。同時,本發(fā)明實施例還能夠根據(jù)用戶之間所具有的相似特征對多名用戶同時進(jìn)行流失傾向的預(yù)測,相對于單個用戶的預(yù)測方式,大幅提高了預(yù)測效率。

為了更加詳細(xì)地說明上述的一種判斷用戶群體流失傾向的方法,本發(fā)明實施例還提供了一種判斷用戶群體流失傾向的方法加以具體說明,如圖2所示,該方法在判斷用戶群體流失傾向時所包括步驟為:

201、獲取產(chǎn)品購買用戶的瀏覽行為數(shù)據(jù)。

在電商網(wǎng)站中要獲取用戶的瀏覽行為數(shù)據(jù),首先需要獲取在該電商網(wǎng)站中注冊并購買過產(chǎn)品的用戶,這些用戶數(shù)據(jù)可以根據(jù)該網(wǎng)站中的銷售記錄進(jìn)行查找,統(tǒng)計出用戶的數(shù)量后,再獲取單位用戶的瀏覽行為數(shù)據(jù)。當(dāng)該網(wǎng)站中的用戶數(shù)量較大時,還可以設(shè)定用戶的范圍,來減少系統(tǒng)的處理壓力,比如根據(jù)年齡段選定要預(yù)測的用戶或根據(jù)用戶注冊的時間等。

需要說明的是,用戶的瀏覽行為數(shù)據(jù)不限于本電商網(wǎng)站中的產(chǎn)品,還包括其他電商或產(chǎn)品銷售網(wǎng)站的瀏覽行為數(shù)據(jù),通過分析大量的該用戶的瀏覽行為數(shù)據(jù),就能夠?qū)υ撚脩舻囊恍┗拘畔?、喜好、?xí)慣進(jìn)行大體的初步判斷。在用戶的瀏覽行為數(shù)據(jù)量過大時,同樣可以設(shè)置限定條件以縮小數(shù)據(jù)量,如設(shè)置一個時間段等。

202、根據(jù)預(yù)置的數(shù)據(jù)特征值為瀏覽行為數(shù)據(jù)對應(yīng)的用戶標(biāo)記標(biāo)簽。

在獲取到電商網(wǎng)站的用戶瀏覽行為數(shù)據(jù)后,需要選定給瀏覽行為數(shù)據(jù)標(biāo)記的標(biāo)簽。其中,該標(biāo)簽是根據(jù)用戶所瀏覽的產(chǎn)品所帶有的產(chǎn)品標(biāo)簽進(jìn)行綜合統(tǒng)計所得到的標(biāo)簽。而產(chǎn)品標(biāo)簽中主要是根據(jù)該產(chǎn)品的特定數(shù)所標(biāo)記的標(biāo)簽,如產(chǎn)品的價格、產(chǎn)品的分類等信息。通過統(tǒng)計相同標(biāo)簽下的用戶瀏覽行為數(shù)據(jù),可以計算出該標(biāo)簽在所有產(chǎn)品標(biāo)簽中所占的比重得到該產(chǎn)品標(biāo)簽的占比值。當(dāng)單位用戶中具有多個瀏覽產(chǎn)品的產(chǎn)品標(biāo)簽時,通過這些標(biāo)簽各自的占比值就可以為該用戶標(biāo)記相對應(yīng)的用戶標(biāo)簽。而在本發(fā)明實施例中針對電商領(lǐng)域的用戶標(biāo)簽一般有購買力標(biāo)簽、購買習(xí)慣標(biāo)簽、購買的主要產(chǎn)品類別標(biāo)簽、用戶活躍度等。其中,為瀏覽行為數(shù)據(jù)對應(yīng)的用戶標(biāo)記標(biāo)簽是根據(jù)該用戶的瀏覽行為數(shù)據(jù)中相應(yīng)的特征字段的值,如購買力標(biāo)簽要根據(jù)瀏覽行為數(shù)據(jù)中產(chǎn)品的總體價格決定的,瀏覽產(chǎn)品的總體 價格越高證明該用戶的購買力就越強(qiáng)。通過提取瀏覽行為數(shù)據(jù)中各標(biāo)簽對應(yīng)的特征字段的值,并綜合統(tǒng)計該特征字段的值來匹配標(biāo)簽中的數(shù)據(jù)特征值,以此來判斷該用戶是否能夠標(biāo)記標(biāo)簽,以及判斷標(biāo)記何種程度的標(biāo)簽。對于預(yù)置標(biāo)簽的種類以及標(biāo)簽程度的劃分則要根據(jù)電商網(wǎng)站的實際情況來設(shè)置,以達(dá)到更優(yōu)化的預(yù)測效果。

一個用戶根據(jù)其生成的瀏覽行為數(shù)據(jù)中所具有的特征字段的種類多少可以標(biāo)記多個標(biāo)簽。

203、利用聚類算法對瀏覽行為數(shù)據(jù)進(jìn)行分類,得到用戶群體集合。

在本發(fā)明實施例中,對瀏覽行為數(shù)據(jù)進(jìn)行的分類所采用的分類方式選用聚類算法,以對用戶標(biāo)記的標(biāo)簽作為質(zhì)點對瀏覽行為數(shù)據(jù)進(jìn)行聚類計算,將具有相同標(biāo)簽特征的瀏覽行為數(shù)據(jù)分為一類,組成瀏覽行為數(shù)據(jù)集合。在確定該集合中將每條瀏覽行為數(shù)據(jù)所對應(yīng)的用戶,經(jīng)過去重處理后,就得到了具有相似特征的一個用戶群體集合。

204、根據(jù)用戶群體集合的購買行為數(shù)據(jù)與標(biāo)簽占比值,計算該用戶群體集合的流失傾向。

在得到用戶群體集合后,將獲取該用戶群體集合中每個用戶在該電商網(wǎng)站中的購買行為數(shù)據(jù),該購買行為數(shù)據(jù)中包括有所購買產(chǎn)品的名稱、數(shù)量、價格等信息,通過統(tǒng)計購買行為數(shù)據(jù)就可以得到該用戶在該電商網(wǎng)站中的購買頻率。在獲得單位用戶的購買行為數(shù)據(jù)后,綜合所有用戶群體集合中用戶的購買行為數(shù)據(jù)并計算其平均值,如購買頻率的平均值、購買產(chǎn)品價格的平均值等。再通過該用戶群體集合所具有的標(biāo)簽占比值對該平均值進(jìn)行綜合計算,得出該用戶群體集合相對于該電商網(wǎng)站的流失傾向的分值。該分值的高低用于預(yù)測這個用戶群體流失傾向的大小。在實際的應(yīng)用中,預(yù)測用戶群體流失傾向的概率更多的是根據(jù)經(jīng)驗設(shè)置一個分值的判斷區(qū)間,將不同的區(qū)間段代表不同的流失傾向程度。通過判斷分值所在的區(qū)間段來預(yù)測用戶群體的流失傾向。

其中,需要說明的是上述計算過程中的標(biāo)簽占比值是動態(tài)可變的值,在用戶群體集合中,每個用戶根據(jù)獲取瀏覽行為數(shù)據(jù)的數(shù)量的增加,都會為該用戶生成不同的標(biāo)簽,因此,每個用戶所標(biāo)記的標(biāo)簽數(shù)量是可變的。 通過統(tǒng)計該用戶群體集合中所有用戶標(biāo)記的標(biāo)簽種類以及涉及到該標(biāo)簽的瀏覽行為數(shù)據(jù)數(shù)量,就可以得出每一個標(biāo)簽在用戶群體集合中出現(xiàn)的數(shù)量,經(jīng)過累加計算便可得到所有標(biāo)簽出現(xiàn)的總數(shù)量,通過計算每個標(biāo)簽的數(shù)量所占總標(biāo)簽數(shù)量的比值就可以得到每一個標(biāo)簽在該用戶群體集合中的標(biāo)簽占比值。而隨著用戶群體集合中用戶數(shù)量的變動,或采集每個用戶的瀏覽行為數(shù)據(jù)的增加,都會影響到該標(biāo)簽占比值的最終取值,進(jìn)而改變用戶群體集合的流失傾向計算的得分。

根據(jù)上述所描述的計算過程,本發(fā)明實施例能夠得出如下的計算公式:

其中,m為用戶群體集合中所有用戶標(biāo)記的標(biāo)簽總數(shù)量,n為用戶群體集合中的所有用戶數(shù)量。

進(jìn)一步的,作為對上述方法的實現(xiàn),本發(fā)明實施例提供了一種判斷用戶群體流失傾向的裝置,該裝置實施例與前述方法實施例對應(yīng),為便于閱讀,本裝置實施例不再對前述方法實施例中的細(xì)節(jié)內(nèi)容進(jìn)行逐一贅述,但應(yīng)當(dāng)明確,本實施例中的裝置能夠?qū)?yīng)實現(xiàn)前述方法實施例中的全部內(nèi)容。該裝置設(shè)置在分享視頻用戶端的視頻播放器中,如圖3所示,該裝置包括:

獲取單元31,用于獲取產(chǎn)品購買用戶的瀏覽行為數(shù)據(jù),所述瀏覽行為數(shù)據(jù)是所述用戶進(jìn)行產(chǎn)品瀏覽時生成的數(shù)據(jù)信息;

標(biāo)記單元32,用于根據(jù)預(yù)置的數(shù)據(jù)特征值為所述獲取單元31獲取的瀏覽行為數(shù)據(jù)對應(yīng)的用戶標(biāo)記標(biāo)簽,所述數(shù)據(jù)特征值為所述瀏覽行為數(shù)據(jù)中行為特征字段的值;

分類單元33,用于利用所述標(biāo)簽對所述標(biāo)記32單元標(biāo)記有標(biāo)簽的瀏覽行為數(shù)據(jù)進(jìn)行分類,得到用戶群體集合;

計算單元34,用于根據(jù)所述分類單元33所劃分的用戶群體集合的購買行為數(shù)據(jù)與標(biāo)簽占比值,計算所述用戶群體集合的流失傾向,所述購買行為數(shù)據(jù)記錄有用戶在購買產(chǎn)品時生成的數(shù)據(jù)信息,所述標(biāo)簽占比值為所述用戶群體集合的所有用戶中含有的單個標(biāo)簽數(shù)量占總標(biāo)簽數(shù)量的比重值。

進(jìn)一步的,如圖4所述,所述獲取單元31包括:

獲取模塊311,用于根據(jù)產(chǎn)品銷售的記錄獲取購買所述產(chǎn)品的用戶記錄;

統(tǒng)計模塊312,用于根據(jù)所述獲取模塊311獲取的用戶記錄統(tǒng)計單位用戶的瀏覽行為數(shù)據(jù),所述瀏覽行為數(shù)據(jù)至少包括:用戶相關(guān)數(shù)據(jù)信息、瀏覽產(chǎn)品的相關(guān)數(shù)據(jù)信息。

進(jìn)一步的,如圖4所述,所述標(biāo)記單元32包括:

提取模塊321,用于提取所述瀏覽行為數(shù)據(jù)中的行為特征字段;

匹配模塊322,用于根據(jù)所述提取模塊321提取的行為特征字段的值與預(yù)置的數(shù)據(jù)特征值相匹配;

標(biāo)記模塊323,用于當(dāng)所述匹配模塊322判斷所述行為特征字段的值與預(yù)置的數(shù)據(jù)特征值相匹配時,將具有所述數(shù)據(jù)特征的標(biāo)簽標(biāo)記在所述瀏覽行為數(shù)據(jù)對應(yīng)的用戶中。

進(jìn)一步的,如圖4所述,所述分類單元33包括:

分類模塊331,用于利用聚類算法對所述瀏覽行為數(shù)據(jù)進(jìn)行分類,得到瀏覽行為數(shù)據(jù)集合;

確定模塊332,用于確定所述分類模塊331所劃分集合中的每條瀏覽行為所對應(yīng)的用戶,組成用戶群體集合。

進(jìn)一步的,如圖4所述,所述計算單元34包括:

獲取模塊341,用于獲取所述用戶群體集合中單位用戶的購買行為數(shù)據(jù),所述購買行為數(shù)據(jù)至少包括購買產(chǎn)品的數(shù)量、價格,購買的次數(shù);

統(tǒng)計模塊342,用于統(tǒng)計所述獲取模塊341獲取的用戶群體集合中所有用戶的購買行為數(shù)據(jù)的平均值,得到所述用戶群體集合的平均購買行為數(shù)據(jù);

計算模塊343,用于利用標(biāo)簽占比值與所述統(tǒng)計模塊342統(tǒng)計的平均購買行為數(shù)據(jù),計算所述用戶群體集合的流失傾向得分;

判斷模塊344,用于根據(jù)所述計算模塊343計算的流失傾向得分落在預(yù)置分值區(qū)間中的位置判斷所述用戶群體集合的流失傾向。

綜上所述,本發(fā)明實施例所采用的判斷用戶群體流失傾向的方法及裝置,是通過對電商用戶的大數(shù)據(jù)統(tǒng)計,獲取購買過電商網(wǎng)站產(chǎn)品的用戶數(shù) 量,以及每個用戶的網(wǎng)絡(luò)瀏覽行為數(shù)據(jù),并且根據(jù)這些瀏覽行為數(shù)據(jù)中所具有的特征值為所有瀏覽行為數(shù)據(jù)標(biāo)記不同的信息標(biāo)簽,再根據(jù)預(yù)置的分類策略進(jìn)行數(shù)據(jù)分類,從而得到具有相似特征的用戶群體。再根據(jù)該群體中用戶購買行為數(shù)據(jù)的平均值,以及標(biāo)簽中的標(biāo)簽占比值綜合計算并判斷該用戶群體相對于該電商網(wǎng)站的流失傾向。相對于現(xiàn)有的預(yù)測用戶流失的計算模型,本發(fā)明實施例所采用的方法是針對電商領(lǐng)域中銷售產(chǎn)品網(wǎng)站或平臺進(jìn)行的用戶流失傾向的預(yù)測方法,因此,本發(fā)明實施例中所采用的數(shù)據(jù)參數(shù)更加具有針對性,使得在電商領(lǐng)域中的預(yù)測準(zhǔn)確度更高。同時,本發(fā)明實施例還能夠根據(jù)用戶之間所具有的相似特征對多名用戶同時進(jìn)行流失傾向的預(yù)測,相對于單個用戶的預(yù)測方式,大幅提高了預(yù)測效率。

所述判斷用戶群體流失傾向的裝置包括處理器和存儲器,上述獲取單元、標(biāo)記單元、分類單元和計算單元等均作為程序單元存儲在存儲器中,由處理器執(zhí)行存儲在存儲器中的上述程序單元來實現(xiàn)相應(yīng)的功能。

處理器中包含內(nèi)核,由內(nèi)核去存儲器中調(diào)取相應(yīng)的程序單元。內(nèi)核可以設(shè)置一個或以上,通過調(diào)整內(nèi)核參數(shù)來判斷用戶群體流失的傾向概率。

存儲器可能包括計算機(jī)可讀介質(zhì)中的非永久性存儲器,隨機(jī)存取存儲器(ram)和/或非易失性內(nèi)存等形式,如只讀存儲器(rom)或閃存(flashram),存儲器包括至少一個存儲芯片。

本申請還提供了一種計算機(jī)程序產(chǎn)品,當(dāng)在數(shù)據(jù)處理設(shè)備上執(zhí)行時,適于執(zhí)行初始化有如下方法步驟的程序代碼:獲取產(chǎn)品購買用戶的瀏覽行為數(shù)據(jù),所述瀏覽行為數(shù)據(jù)是所述用戶進(jìn)行產(chǎn)品瀏覽時生成的數(shù)據(jù)信息;根據(jù)預(yù)置的數(shù)據(jù)特征值為所述瀏覽行為數(shù)據(jù)對應(yīng)的用戶標(biāo)記標(biāo)簽,所述數(shù)據(jù)特征值為所述瀏覽行為數(shù)據(jù)中行為特征字段的值;利用所述標(biāo)簽對所述瀏覽行為數(shù)據(jù)進(jìn)行分類,得到用戶群體集合;根據(jù)所述用戶群體集合的購買行為數(shù)據(jù)與標(biāo)簽占比值,計算所述用戶群體集合的流失傾向,所述購買行為數(shù)據(jù)記錄有用戶在購買產(chǎn)品時生成的數(shù)據(jù)信息,所述標(biāo)簽占比值為所述用戶群體集合的所有用戶中含有的單個標(biāo)簽數(shù)量占總標(biāo)簽數(shù)量的比重值。

本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本申請的實施例可提供為方法、系統(tǒng)、 或計算機(jī)程序產(chǎn)品。因此,本申請可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本申請可采用在一個或多個其中包含有計算機(jī)可用程序代碼的計算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器、cd-rom、光學(xué)存儲器等)上實施的計算機(jī)程序產(chǎn)品的形式。

本申請是參照根據(jù)本申請實施例的方法、設(shè)備(系統(tǒng))、和計算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機(jī)程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機(jī)程序指令到通用計算機(jī)、專用計算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機(jī)器,使得通過計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。

這些計算機(jī)程序指令也可存儲在能引導(dǎo)計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機(jī)可讀存儲器中,使得存儲在該計算機(jī)可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。

這些計算機(jī)程序指令也可裝載到計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機(jī)實現(xiàn)的處理,從而在計算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。

在一個典型的配置中,計算設(shè)備包括一個或多個處理器(cpu)、輸入/輸出接口、網(wǎng)絡(luò)接口和內(nèi)存。

存儲器可能包括計算機(jī)可讀介質(zhì)中的非永久性存儲器,隨機(jī)存取存儲器(ram)和/或非易失性內(nèi)存等形式,如只讀存儲器(rom)或閃存(flashram)。存儲器是計算機(jī)可讀介質(zhì)的示例。

計算機(jī)可讀介質(zhì)包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術(shù)來實現(xiàn)信息存儲。信息可以是計算機(jī)可讀指令、數(shù)據(jù)結(jié) 構(gòu)、程序的模塊或其他數(shù)據(jù)。計算機(jī)的存儲介質(zhì)的例子包括,但不限于相變內(nèi)存(pram)、靜態(tài)隨機(jī)存取存儲器(sram)、動態(tài)隨機(jī)存取存儲器(dram)、其他類型的隨機(jī)存取存儲器(ram)、只讀存儲器(rom)、電可擦除可編程只讀存儲器(eeprom)、快閃記憶體或其他內(nèi)存技術(shù)、只讀光盤只讀存儲器(cd-rom)、數(shù)字多功能光盤(dvd)或其他光學(xué)存儲、磁盒式磁帶,磁帶磁磁盤存儲或其他磁性存儲設(shè)備或任何其他非傳輸介質(zhì),可用于存儲可以被計算設(shè)備訪問的信息。按照本文中的界定,計算機(jī)可讀介質(zhì)不包括暫存電腦可讀媒體(transitorymedia),如調(diào)制的數(shù)據(jù)信號和載波。

還需要說明的是,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、商品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、商品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括要素的過程、方法、商品或者設(shè)備中還存在另外的相同要素。

本領(lǐng)域技術(shù)人員應(yīng)明白,本申請的實施例可提供為方法、系統(tǒng)或計算機(jī)程序產(chǎn)品。因此,本申請可采用完全硬件實施例、完全軟件實施例或結(jié)合軟件和硬件方面的實施例的形式。而且,本申請可采用在一個或多個其中包含有計算機(jī)可用程序代碼的計算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器、cd-rom、光學(xué)存儲器等)上實施的計算機(jī)程序產(chǎn)品的形式。

以上僅為本申請的實施例而已,并不用于限制本申請。對于本領(lǐng)域技術(shù)人員來說,本申請可以有各種更改和變化。凡在本申請的精神和原理之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本申請的權(quán)利要求范圍之內(nèi)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1