一種用于客戶流失預(yù)測(cè)的方法和裝置制造方法
【專利摘要】本發(fā)明涉及一種用于客戶流失預(yù)測(cè)的方法和裝置,其中,該裝置包括:確定模塊,用于根據(jù)預(yù)先取得的與客戶行為相關(guān)的數(shù)據(jù),確定當(dāng)前仍未流失的客戶的反映其行為的多個(gè)參數(shù)各自在設(shè)定時(shí)間段內(nèi)的取值;獲取模塊,用于根據(jù)所確定的取值和所述當(dāng)前仍未流失的客戶的所述多個(gè)參數(shù)各自的均值,獲取所述當(dāng)前仍未流失的客戶的所述多個(gè)參數(shù)各自的變化率;以及,計(jì)算模塊,用于根據(jù)所獲取的變化率和指定的客戶流失預(yù)測(cè)模型,計(jì)算所述當(dāng)前仍未流失的客戶的流失概率,其中,所述多個(gè)參數(shù)各自的變化被用作所述指定的客戶流失預(yù)測(cè)模型的變量。利用該方法和裝置,能夠提高了客戶流失預(yù)測(cè)的準(zhǔn)確性。
【專利說明】一種用于客戶流失預(yù)測(cè)的方法和裝置
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明涉及一種用于客戶流失預(yù)測(cè)的方法和裝置。
【背景技術(shù)】
[0002]過去的二十年,移動(dòng)通信已經(jīng)變成主要的通信手段。在許多國(guó)家,同時(shí)存在多個(gè)移動(dòng)通信運(yùn)營(yíng)商向用戶提供通信服務(wù),因此,移動(dòng)通信運(yùn)營(yíng)商對(duì)移動(dòng)客戶的爭(zhēng)奪非常激烈。在這種情況下,對(duì)于每一個(gè)移動(dòng)通信運(yùn)營(yíng)商而言,及早地識(shí)別出其已擁有的但有可能流失到其他移動(dòng)通信運(yùn)營(yíng)商的移動(dòng)通信用戶非常重要,因?yàn)槿绻芗霸缱R(shí)別出這樣的用戶,就可以采取一些措施來防止流失掉。
[0003]目前,人們已經(jīng)提出很多用于客戶流失預(yù)測(cè)的方案,其通常采用分類分析技術(shù)來構(gòu)建預(yù)測(cè)模型。例如,文獻(xiàn)I (桂宏新,楊昌昊,程飛,基于貝葉斯網(wǎng)絡(luò)的移動(dòng)業(yè)務(wù)客戶流失預(yù)測(cè)研究,(中國(guó)聯(lián)通集團(tuán)有限公司合肥分公司),電信科學(xué),2009年第3期)和文獻(xiàn)2 (葉進(jìn),程澤凱,林士敏,基于貝葉斯網(wǎng)絡(luò)的電信客戶流失預(yù)測(cè)分析,(桂林電子工業(yè)學(xué)院通信與信息工程系),計(jì)算機(jī)工程與應(yīng)用,2005.14)使用貝葉斯網(wǎng)絡(luò)技術(shù)來構(gòu)建預(yù)測(cè)模型以進(jìn)行客戶流失預(yù)測(cè)。
[0004]然而,現(xiàn)有的方案通常都是直接使用移動(dòng)客戶的參數(shù)作為預(yù)測(cè)模型的變量,導(dǎo)致客戶流失預(yù)測(cè)的準(zhǔn)確性不是很好。
【發(fā)明內(nèi)容】
[0005]考慮到現(xiàn)有技術(shù)的上述問題,本發(fā)明實(shí)施例提出一種用于客戶流失預(yù)測(cè)的方法和裝置,其能夠提高客戶流失預(yù)測(cè)的準(zhǔn)確性。
[0006]按照本發(fā)明實(shí)施例的一種用于客戶流失預(yù)測(cè)的方法,包括:根據(jù)預(yù)先取得的與客戶行為相關(guān)的數(shù)據(jù),確定當(dāng)前仍未流失的客戶的反映其行為的多個(gè)參數(shù)各自在設(shè)定時(shí)間段內(nèi)的取值;根據(jù)所確定的取值和所述當(dāng)前仍未流失的客戶的所述多個(gè)參數(shù)各自的均值,獲取所述當(dāng)前仍未流失的客戶的所述多個(gè)參數(shù)各自的變化率;以及,根據(jù)所獲取的變化率和指定的客戶流失預(yù)測(cè)模型,計(jì)算所述當(dāng)前仍未流失的客戶的流失概率,其中,所述多個(gè)參數(shù)各自的變化被用作所述指定的客戶流失預(yù)測(cè)模型的變量。
[0007]在一種【具體實(shí)施方式】中,所述方法還包括:根據(jù)所述預(yù)先取得的與客戶行為相關(guān)的數(shù)據(jù),確定所述當(dāng)前仍未流失的客戶的反映其行為的至少一個(gè)參數(shù)在所述設(shè)定時(shí)間段內(nèi)的取值,其中,所述至少一個(gè)參數(shù)不同于所述多個(gè)參數(shù),其中,所述計(jì)算步驟進(jìn)一步包括:根據(jù)所述當(dāng)前仍未流失的客戶的所述多個(gè)參數(shù)各自的變化率、所述當(dāng)前仍未流失的客戶的所述至少一個(gè)參數(shù)的取值和所述指定的客戶流失預(yù)測(cè)模型,計(jì)算所述當(dāng)前仍未流失的客戶的流失概率,其中,所述多個(gè)參數(shù)各自的變化和所述至少一個(gè)參數(shù)被用作所述指定的客戶流失預(yù)測(cè)模型的變量。
[0008]在一種【具體實(shí)施方式】中,所述方法還包括:根據(jù)所述預(yù)先取得的與客戶行為相關(guān)的數(shù)據(jù),確定多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自在指定時(shí)間段內(nèi)的取值,其中,所述多個(gè)客戶包括已流失的客戶和當(dāng)前仍未流失的客戶;根據(jù)所確定的所述多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自的取值和所述多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自的均值,獲取所述多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自的變化率;以及,根據(jù)所獲取的所述多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自的變化率,創(chuàng)建基于指定預(yù)測(cè)技術(shù)的客戶流失預(yù)測(cè)模型,其中,所述多個(gè)參數(shù)各自的變化被用作所創(chuàng)建的客戶流失預(yù)測(cè)模型的變量,其中,所述指定的客戶流失預(yù)測(cè)模型是所述創(chuàng)建的客戶流失預(yù)測(cè)模型或者是所述創(chuàng)建的客戶流失預(yù)測(cè)模型的其中一個(gè)。
[0009]在一種【具體實(shí)施方式】中,所述設(shè)定時(shí)間段是剛過去的時(shí)間段。
[0010]在一種【具體實(shí)施方式】中,所述確定步驟進(jìn)一步包括:當(dāng)收到用戶終端發(fā)送的客戶流失預(yù)測(cè)請(qǐng)求時(shí),執(zhí)行所述確定,其中,所述方法還包括:根據(jù)所計(jì)算的所述當(dāng)前仍未流失的客戶的流失概率,檢索出其流失概率大于指定值的客戶,作為可能會(huì)流失的客戶;以及,向所述用戶終端發(fā)送關(guān)于所述可能會(huì)流失的客戶的信息。
[0011]在一種【具體實(shí)施方式】中,所述客戶流失預(yù)測(cè)請(qǐng)求包括期望使用的預(yù)測(cè)技術(shù),所述指定的客戶流失預(yù)測(cè)模型所基于的預(yù)測(cè)技術(shù)與所述客戶流失預(yù)測(cè)請(qǐng)求所包括的預(yù)測(cè)技術(shù)相同。
[0012]在一種【具體實(shí)施方式】中,所述客戶是移動(dòng)客戶,以及,所述多個(gè)參數(shù)包括以下的多個(gè):呼出累計(jì)時(shí)長(zhǎng)、呼入累計(jì)時(shí)長(zhǎng)、短信累計(jì)發(fā)送量、數(shù)據(jù)業(yè)務(wù)累計(jì)流量、漫游時(shí)長(zhǎng)、跨網(wǎng)時(shí)長(zhǎng)、消費(fèi)種類總數(shù)、用戶充值次數(shù)、用戶充值金額、消費(fèi)金額和投訴次數(shù)。
[0013]在另一種【具體實(shí)施方式】中,所述至少一個(gè)參數(shù)包括以下的至少一個(gè):入網(wǎng)時(shí)長(zhǎng)、是否集團(tuán)客戶和是否資費(fèi)捆綁。
[0014]在另一種【具體實(shí)施方式】中,所述指定預(yù)測(cè)技術(shù)包括貝葉斯網(wǎng)絡(luò)、樸素貝葉斯分類器和/或決策樹。
[0015]按照本發(fā)明實(shí)施例的一種用于客戶流失預(yù)測(cè)的裝置,包括:確定模塊,用于根據(jù)預(yù)先取得的與客戶行為相關(guān)的數(shù)據(jù),確定當(dāng)前仍未流失的客戶的反映其行為的多個(gè)參數(shù)各自在設(shè)定時(shí)間段內(nèi)的取值;獲取模塊,用于根據(jù)所確定的取值和所述當(dāng)前仍未流失的客戶的所述多個(gè)參數(shù)各自的均值,獲取所述當(dāng)前仍未流失的客戶的所述多個(gè)參數(shù)各自的變化率;以及,計(jì)算模塊,用于根據(jù)所獲取的變化率和指定的客戶流失預(yù)測(cè)模型,計(jì)算所述當(dāng)前仍未流失的客戶的流失概率,其中,所述多個(gè)參數(shù)各自的變化被用作所述指定的客戶流失預(yù)測(cè)模型的變量。
[0016]在一種【具體實(shí)施方式】中,所述確定模塊還用于根據(jù)所述預(yù)先取得的與客戶行為相關(guān)的數(shù)據(jù),確定所述當(dāng)前仍未流失的客戶的反映其行為的至少一個(gè)參數(shù)在所述設(shè)定時(shí)間段內(nèi)的取值,其中,所述至少一個(gè)參數(shù)不同于所述多個(gè)參數(shù),所述計(jì)算模塊進(jìn)一步用于:根據(jù)所述當(dāng)前仍未流失的客戶的所述多個(gè)參數(shù)各自的變化率、所述當(dāng)前仍未流失的客戶的所述至少一個(gè)參數(shù)的取值和所述指定的客戶流失預(yù)測(cè)模型,計(jì)算所述當(dāng)前仍未流失的客戶的流失概率,其中,所述多個(gè)參數(shù)各自的變化和所述至少一個(gè)參數(shù)被用作所述指定的客戶流失預(yù)測(cè)模型的變量。
[0017]在一種【具體實(shí)施方式】中,所述確定模塊還用于根據(jù)所述預(yù)先取得的與客戶行為相關(guān)的數(shù)據(jù),確定多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自在指定時(shí)間段內(nèi)的取值,其中,所述多個(gè)客戶包括已流失的客戶和當(dāng)前仍未流失的客戶,所述獲取模塊還用于根據(jù)所確定的所述多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自的取值和所述多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自的均值,獲取所述多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自的變化率,其中,所述裝置還包括創(chuàng)建模塊,用于根據(jù)所獲取的所述多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自的變化率,創(chuàng)建基于指定預(yù)測(cè)技術(shù)的客戶流失預(yù)測(cè)模型,其中,所述多個(gè)參數(shù)各自的變化被用作所創(chuàng)建的客戶流失預(yù)測(cè)模型的變量,其中,所述指定的客戶流失預(yù)測(cè)模型是所述創(chuàng)建的客戶流失預(yù)測(cè)模型或者是所述創(chuàng)建的客戶流失預(yù)測(cè)模型的其中一個(gè)。
[0018]在一種【具體實(shí)施方式】中,所述設(shè)定時(shí)間段是剛過去的時(shí)間段。
[0019]在一種【具體實(shí)施方式】中,所述確定模塊進(jìn)一步用于:當(dāng)收到用戶終端發(fā)送的客戶流失預(yù)測(cè)請(qǐng)求時(shí),執(zhí)行所述確定,其中,所述裝置還包括:檢索模塊,用于根據(jù)所計(jì)算的所述當(dāng)前仍未流失的客戶的流失概率,檢索出其流失概率大于指定值的客戶,作為可能會(huì)流失的客戶;以及,發(fā)送模塊,用于向所述用戶終端發(fā)送關(guān)于所述可能會(huì)流失的客戶的信息。
[0020]在一種【具體實(shí)施方式】中,所述客戶流失預(yù)測(cè)請(qǐng)求包括期望使用的預(yù)測(cè)技術(shù),所述指定的客戶流失預(yù)測(cè)模型所基于的預(yù)測(cè)技術(shù)與所述客戶流失預(yù)測(cè)請(qǐng)求所包括的預(yù)測(cè)技術(shù)相同。
[0021]在一種【具體實(shí)施方式】中,所述客戶是移動(dòng)客戶,以及,所述多個(gè)參數(shù)包括以下的多個(gè):呼出累計(jì)時(shí)長(zhǎng)、呼入累計(jì)時(shí)長(zhǎng)、短信累計(jì)發(fā)送量、數(shù)據(jù)業(yè)務(wù)累計(jì)流量、漫游時(shí)長(zhǎng)、跨網(wǎng)時(shí)長(zhǎng)、消費(fèi)種類總數(shù)、用戶充值次數(shù)、用戶充值金額、消費(fèi)金額和投訴次數(shù)。
[0022]在一種【具體實(shí)施方式】中,所述至少一個(gè)參數(shù)包括以下的至少一個(gè):入網(wǎng)時(shí)長(zhǎng)、是否集團(tuán)客戶和是否資費(fèi)捆綁。
[0023]在一種【具體實(shí)施方式】中,所述指定預(yù)測(cè)技術(shù)包括貝葉斯網(wǎng)絡(luò)、樸素貝葉斯分類器和/或決策樹。
[0024]從上面的描述可以看出,本發(fā)明實(shí)施例所提出的方案將反映客戶的行為的參數(shù)的變化作為客戶流失預(yù)測(cè)模型的變量,從而提高了客戶流失預(yù)測(cè)的準(zhǔn)確性。
【專利附圖】
【附圖說明】
[0025]本發(fā)明的其它特征、特點(diǎn)、優(yōu)點(diǎn)和益處通過以下結(jié)合附圖的詳細(xì)描述將變得更加顯而易見。其中:
[0026]圖1其示出了按照本發(fā)明一個(gè)實(shí)施例的客戶流失預(yù)測(cè)系統(tǒng)的示意圖;
[0027]圖2示出了按照本發(fā)明一個(gè)實(shí)施例的建立客戶流失預(yù)測(cè)模型的方法的流程圖;
[0028]圖3示出了按照本發(fā)明一個(gè)實(shí)施例的預(yù)測(cè)客戶流失的方法的流程圖;
[0029]圖4示出了按照本發(fā)明一個(gè)實(shí)施例的用于預(yù)測(cè)客戶流失的裝置的示意圖;以及
[0030]圖5示出了按照本發(fā)明一個(gè)實(shí)施例的用于預(yù)測(cè)客戶流失的設(shè)備的示意圖。
【具體實(shí)施方式】
[0031]發(fā)明人經(jīng)過大量的研究發(fā)現(xiàn),與未流失的移動(dòng)客戶相比,已流失的移動(dòng)客戶在即將流失的時(shí)間段內(nèi)反映移動(dòng)客戶的行為的參數(shù)的變化較大。
[0032]基于以上發(fā)現(xiàn),本發(fā)明實(shí)施例所提出的方案將反映客戶的行為的參數(shù)的變化作為客戶流失預(yù)測(cè)模型的變量,因此能夠提高客戶流失預(yù)測(cè)的準(zhǔn)確性。
[0033]下面,將結(jié)合附圖詳細(xì)本發(fā)明的各個(gè)實(shí)施例。[0034]現(xiàn)在參見圖1,其示出了按照本發(fā)明一個(gè)實(shí)施例的客戶流失預(yù)測(cè)系統(tǒng)的示意圖。如圖1所示,客戶流失預(yù)測(cè)系統(tǒng)100可以包括數(shù)據(jù)采集服務(wù)器110,其從移動(dòng)通信運(yùn)營(yíng)商的數(shù)據(jù)庫中收集各個(gè)移動(dòng)客戶的數(shù)據(jù),該數(shù)據(jù)例如包括但不局限于移動(dòng)客戶的基本信息、話單、充值信息和投訴信息。
[0035]客戶流失預(yù)測(cè)系統(tǒng)100還可以包括數(shù)據(jù)預(yù)處理服務(wù)器120,其過濾數(shù)據(jù)采集服務(wù)器110所采集的數(shù)據(jù)以提取各個(gè)移動(dòng)客戶的與其行為有關(guān)的數(shù)據(jù)。這里,與移動(dòng)客戶的行為有關(guān)的數(shù)據(jù)可以包括移動(dòng)客戶的各個(gè)呼入呼叫的信息(包括開始時(shí)間、截止時(shí)間、是否漫游、是否跨網(wǎng)和費(fèi)用)、移動(dòng)客戶的各個(gè)呼出呼叫的信息(包括開始時(shí)間、截止時(shí)間、是否漫游、是否跨網(wǎng)和費(fèi)用)、移動(dòng)客戶所發(fā)送的各條短信的信息(包括發(fā)送時(shí)間和費(fèi)用)、移動(dòng)客戶的各次數(shù)據(jù)業(yè)務(wù)的信息(包括開始時(shí)間、截止時(shí)間、是否漫游、費(fèi)用)、移動(dòng)客戶的各次充值的信息(包括充值時(shí)間和充值金額)和移動(dòng)客戶的各次投訴的信息(包括投訴時(shí)間)。其中,移動(dòng)客戶的各個(gè)呼入呼叫的信息、移動(dòng)客戶的各個(gè)呼出呼叫的信息、移動(dòng)客戶所發(fā)送的各條短信的信息和移動(dòng)客戶的各次數(shù)據(jù)業(yè)務(wù)的信息可以從移動(dòng)客戶的話單中提取,移動(dòng)客戶的各次充值的信息可以從移動(dòng)客戶的充值信息中提取,以及,移動(dòng)客戶的各次投訴的信息可以從移動(dòng)客戶的投訴信息中提取。
[0036]客戶流失預(yù)測(cè)系統(tǒng)100還可以包括預(yù)測(cè)模型學(xué)習(xí)服務(wù)器130,其利用數(shù)據(jù)預(yù)處理服務(wù)器120所提取的與移動(dòng)客戶的行為有關(guān)的數(shù)據(jù),建立客戶流失預(yù)測(cè)模型。
[0037]這里,反映移動(dòng)客戶的行為的參數(shù)的變化被用作預(yù)測(cè)模型的變量。反映移動(dòng)客戶的行為的參數(shù)可以包括:呼出累計(jì)時(shí)長(zhǎng)、呼入累計(jì)時(shí)長(zhǎng)、短信累計(jì)發(fā)送量、數(shù)據(jù)業(yè)務(wù)累計(jì)流量、漫游時(shí)長(zhǎng)、跨網(wǎng)時(shí)長(zhǎng)、消費(fèi)種類總數(shù)、用戶充值次數(shù)、用戶充值金額、消費(fèi)金額和投訴次數(shù)。其中,呼出累計(jì)時(shí)長(zhǎng)是移動(dòng)客戶的各個(gè)呼出呼叫的時(shí)長(zhǎng)的總和,其利用移動(dòng)客戶的各個(gè)呼出呼叫的信息計(jì)算得到。呼入累計(jì)時(shí)長(zhǎng)是移動(dòng)客戶的各個(gè)呼入呼叫的時(shí)長(zhǎng)的總和,其利用移動(dòng)客戶的各個(gè)呼入呼叫的信息計(jì)算得到。短信累計(jì)發(fā)送量是移動(dòng)客戶所發(fā)送的短信的總條數(shù),其通過統(tǒng)計(jì)移動(dòng)客戶所發(fā)送的各條短信的信息的數(shù)量計(jì)算得到。數(shù)據(jù)業(yè)務(wù)累計(jì)流量是移動(dòng)客戶的各次數(shù)據(jù)業(yè)務(wù)的流量的總和,其利用移動(dòng)客戶的各次數(shù)據(jù)業(yè)務(wù)的信息計(jì)算得到。漫游時(shí)長(zhǎng)是移動(dòng)客戶的在漫游狀態(tài)下進(jìn)行的各個(gè)呼入呼叫、各個(gè)呼出呼叫和各次數(shù)據(jù)業(yè)務(wù)的時(shí)長(zhǎng)的總和,其利用移動(dòng)客戶的各個(gè)呼入呼叫的信息、各個(gè)呼出呼叫的信息和各次數(shù)據(jù)業(yè)務(wù)的信息計(jì)算得到??缇W(wǎng)時(shí)長(zhǎng)是移動(dòng)客戶的跨越多個(gè)運(yùn)營(yíng)商網(wǎng)絡(luò)進(jìn)行的各個(gè)呼入呼叫和各個(gè)呼出呼叫的時(shí)長(zhǎng)的總和,其利用移動(dòng)客戶的各個(gè)呼入呼叫的信息和各個(gè)呼出呼叫的信息計(jì)算得到。消費(fèi)種類總數(shù)是移動(dòng)客戶所進(jìn)行的電信業(yè)務(wù)類型(語音業(yè)務(wù)、數(shù)據(jù)業(yè)務(wù)、短信業(yè)務(wù))的總和,其利用移動(dòng)客戶的各個(gè)呼入呼叫的信息、各個(gè)呼出呼叫的信息、各次數(shù)據(jù)業(yè)務(wù)的信息和移動(dòng)客戶所發(fā)送的各條短信的信息計(jì)算得到,其中:如果存在移動(dòng)客戶的呼入呼叫的信息或呼出呼叫的信息,則表明移動(dòng)客戶進(jìn)行了語音業(yè)務(wù);如果存在移動(dòng)客戶的數(shù)據(jù)業(yè)務(wù)的信息,則表明移動(dòng)客戶進(jìn)行了數(shù)據(jù)業(yè)務(wù);以及,如果存在移動(dòng)客戶發(fā)送的短信的信息,則表明移動(dòng)客戶進(jìn)行了短信業(yè)務(wù)。用戶充值次數(shù)是移動(dòng)客戶充值的總次數(shù),其通過統(tǒng)計(jì)移動(dòng)客戶的各次充值的信息的數(shù)量計(jì)算得到。用戶充值金額是移動(dòng)客戶的各次充值的金額的總和,其利用移動(dòng)客戶的各次充值的信息計(jì)算得到。消費(fèi)金額是移動(dòng)客戶的各個(gè)呼入呼叫、各個(gè)呼出呼叫、各次數(shù)據(jù)業(yè)務(wù)和所發(fā)出的各條短信的費(fèi)用的總和,其利用移動(dòng)客戶的各個(gè)呼入呼叫的信息、各個(gè)呼出呼叫的信息、各次數(shù)據(jù)業(yè)務(wù)的信息和移動(dòng)客戶所發(fā)送的各條短信的信息計(jì)算得到。投訴次數(shù)是移動(dòng)客戶的各次投訴的總和,其通過統(tǒng)計(jì)移動(dòng)客戶的各次投訴的信息的數(shù)量計(jì)算得到。
[0038]所建立的客戶流失預(yù)測(cè)模型可以包括各種基于不同預(yù)測(cè)技術(shù)(例如,貝葉斯網(wǎng)絡(luò)技術(shù)、樸素貝葉斯分類器技術(shù)、決策樹技術(shù)等)的模型。例如,基于貝葉斯網(wǎng)絡(luò)技術(shù)的客戶流失預(yù)測(cè)模型、基于決策樹的客戶流失預(yù)測(cè)模型等。
[0039]客戶流失預(yù)測(cè)系統(tǒng)100還可以包括預(yù)測(cè)服務(wù)器140,其在接收到請(qǐng)求者的客戶流失預(yù)測(cè)請(qǐng)求時(shí),利用數(shù)據(jù)預(yù)處理服務(wù)器120所提取的與移動(dòng)客戶的行為有關(guān)的數(shù)據(jù)和預(yù)測(cè)模型學(xué)習(xí)服務(wù)器130所建立的客戶流失預(yù)測(cè)模型,預(yù)測(cè)移動(dòng)客戶的流失概率,并向請(qǐng)求者發(fā)送關(guān)于可能會(huì)流失的移動(dòng)客戶的信息。
[0040]其中,數(shù)據(jù)采集服務(wù)器110、數(shù)據(jù)預(yù)處理服務(wù)器120、預(yù)測(cè)模型學(xué)習(xí)服務(wù)器130和預(yù)測(cè)服務(wù)器140可以通過連接線、有線網(wǎng)絡(luò)或無線網(wǎng)絡(luò)連接在一起。
[0041]客戶流失預(yù)測(cè)系統(tǒng)100還可以包括用戶終端150,其可通過無線網(wǎng)絡(luò)連接到預(yù)測(cè)服務(wù)器140,用于向預(yù)測(cè)服務(wù)器140發(fā)送客戶流失預(yù)測(cè)請(qǐng)求,以及在接收到預(yù)測(cè)服務(wù)器140發(fā)送的關(guān)于可能會(huì)流失的移動(dòng)客戶的信息時(shí),向用戶呈現(xiàn)可能會(huì)流失的移動(dòng)客戶。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,用戶終端150也可以通過有線網(wǎng)絡(luò)連接到預(yù)測(cè)服務(wù)器140。
[0042]現(xiàn)在參見圖2,其示出了按照本發(fā)明一個(gè)實(shí)施例的建立客戶流失預(yù)測(cè)模型的方法的流程圖。圖2所示的方法可以在需要時(shí)被手動(dòng)執(zhí)行,或者可以周期或不定期地被執(zhí)行。
[0043]如圖2所示,在步驟S200,預(yù)測(cè)模型學(xué)習(xí)服務(wù)器130從數(shù)據(jù)預(yù)處理服務(wù)器120所提取的與各個(gè)移動(dòng)客戶的行為有關(guān)的數(shù)據(jù)中,選擇多個(gè)移動(dòng)客戶T的與其行為有關(guān)的數(shù)據(jù)作為原始數(shù)據(jù),其中,該多個(gè)移動(dòng)客戶T包括已流失的移動(dòng)客戶和當(dāng)前仍未流失的移動(dòng)客戶。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,該多個(gè)移動(dòng)客戶的數(shù)量越大,所建立的客戶流失預(yù)測(cè)模型越準(zhǔn)確。這里,與移動(dòng)客戶的行為有關(guān)的數(shù)據(jù)包括移動(dòng)客戶的各個(gè)呼入呼叫的信息(包括開始時(shí)間、截止時(shí)間、是否是漫游 、是否是跨網(wǎng)和費(fèi)用)、移動(dòng)客戶的各個(gè)呼出呼叫的信息(包括開始時(shí)間、截止時(shí)間、是否是漫游、是否是跨網(wǎng)、是否是IP電話呼叫和費(fèi)用)、移動(dòng)客戶所發(fā)送的各個(gè)短信的信息(包括發(fā)送時(shí)間和費(fèi)用)、移動(dòng)客戶的各次數(shù)據(jù)業(yè)務(wù)的信息(包括開始時(shí)間、截止時(shí)間、是否漫游、費(fèi)用)、移動(dòng)客戶的各次充值的信息(包括充值時(shí)間和充值金額)和移動(dòng)客戶的各次投訴的信息(包括投訴時(shí)間)。
[0044]在步驟S204,預(yù)測(cè)模型學(xué)習(xí)服務(wù)器130利用該多個(gè)移動(dòng)客戶T中的每一個(gè)移動(dòng)客戶Ti的與其行為有關(guān)的數(shù)據(jù),計(jì)算移動(dòng)客戶Ti的反映其行為的多個(gè)參數(shù)K各自在指定月份的取值。其中,該指定月份可以是已經(jīng)過去的任一月份。
[0045]這里,該多個(gè)參數(shù)K包括呼出累計(jì)時(shí)長(zhǎng)、呼入累計(jì)時(shí)長(zhǎng)、短信累計(jì)發(fā)送量、數(shù)據(jù)業(yè)務(wù)累計(jì)流量、漫游時(shí)長(zhǎng)、跨網(wǎng)時(shí)長(zhǎng)、消費(fèi)種類總數(shù)、用戶充值次數(shù)、用戶充值金額、消費(fèi)金額和投訴次數(shù)。
[0046]在步驟S208,預(yù)測(cè)模型學(xué)習(xí)服務(wù)器130可以利用所計(jì)算的移動(dòng)客戶Ti的多個(gè)參數(shù)K各自在指定月份的取值和移動(dòng)客戶Ti的多個(gè)參數(shù)K各自的均值,計(jì)算移動(dòng)客戶Ti的多個(gè)參數(shù)K各自的變化率作為訓(xùn)練數(shù)據(jù),其計(jì)算公式如等式(I)所示。
[0047]Δχ = (x-x)/xI I J
[0048]其中,Λ X表示移動(dòng)客戶Ti的多個(gè)參數(shù)K中的每一個(gè)參數(shù)Ki的變化率,X表示移動(dòng)客戶Ti的參數(shù)Ki在指定月份的取值,以及,[表示移動(dòng)客戶Ti的參數(shù)Ki的均值。其中,I的計(jì)算公式如等式(2)所示。
【權(quán)利要求】
1.一種用于客戶流失預(yù)測(cè)的方法,包括: 根據(jù)預(yù)先取得的與客戶行為相關(guān)的數(shù)據(jù),確定當(dāng)前仍未流失的客戶的反映其行為的多個(gè)參數(shù)各自在設(shè)定時(shí)間段內(nèi)的取值; 根據(jù)所確定的取值和所述當(dāng)前仍未流失的客戶的所述多個(gè)參數(shù)各自的均值,獲取所述當(dāng)前仍未流失的客戶的所述多個(gè)參數(shù)各自的變化率;以及 根據(jù)所獲取的變化率和指定的客戶流失預(yù)測(cè)模型,計(jì)算所述當(dāng)前仍未流失的客戶的流失概率, 其中,所述多個(gè)參數(shù)各自的變化被用作所述指定的客戶流失預(yù)測(cè)模型的變量。
2.如權(quán)利要求1所述的方法,其中,還包括: 根據(jù)所述預(yù)先取得的與客戶行為相關(guān)的數(shù)據(jù),確定所述當(dāng)前仍未流失的客戶的反映其行為的至少一個(gè)參數(shù)在所述設(shè)定時(shí)間段內(nèi)的取值,其中,所述至少一個(gè)參數(shù)不同于所述多個(gè)參數(shù), 其中,所述計(jì)算步驟進(jìn)一步包括:根據(jù)所述當(dāng)前仍未流失的客戶的所述多個(gè)參數(shù)各自的變化率、所述當(dāng)前仍未流失的客戶的所述至少一個(gè)參數(shù)的取值和所述指定的客戶流失預(yù)測(cè)模型,計(jì)算所述當(dāng)前仍未流失的客戶的流失概率, 其中,所述多個(gè)參數(shù)各自的變化和所述至少一個(gè)參數(shù)被用作所述指定的客戶流失預(yù)測(cè)模型的變量。
3.如權(quán)利要求1所述的方法,其中,還包括: 根據(jù)所述預(yù)先取得的與客戶行為相關(guān)的數(shù)據(jù),確定多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自在指定時(shí)間段內(nèi)的取 值,其中,所述多個(gè)客戶包括已流失的客戶和當(dāng)前仍未流失的客戶; 根據(jù)所確定的所述多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自的取值和所述多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自的均值,獲取所述多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自的變化率;以及 根據(jù)所獲取的所述多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自的變化率,創(chuàng)建基于指定預(yù)測(cè)技術(shù)的客戶流失預(yù)測(cè)模型,其中,所述多個(gè)參數(shù)各自的變化被用作所創(chuàng)建的客戶流失預(yù)測(cè)模型的變量, 其中,所述指定的客戶流失預(yù)測(cè)模型是所述創(chuàng)建的客戶流失預(yù)測(cè)模型或者是所述創(chuàng)建的客戶流失預(yù)測(cè)模型的其中一個(gè)。
4.如權(quán)利要求1所述的方法,其中,所述設(shè)定時(shí)間段是剛過去的時(shí)間段。
5.如權(quán)利要求1或2所述的方法,其中,進(jìn)一步包括: 當(dāng)收到用戶終端發(fā)送的客戶流失預(yù)測(cè)請(qǐng)求時(shí),執(zhí)行所述確定步驟, 其中,所述方法還包括: 根據(jù)所計(jì)算的所述當(dāng)前仍未流失的客戶的流失概率,檢索出其流失概率大于指定值的客戶,作為可能會(huì)流失的客戶;以及 向所述用戶終端發(fā)送關(guān)于所述可能會(huì)流失的客戶的信息。
6.如權(quán)利要求5所述的方法,其中, 所述客戶流失預(yù)測(cè)請(qǐng)求包括期望使用的預(yù)測(cè)技術(shù), 所述指定的客戶流失預(yù)測(cè)模型所基于的預(yù)測(cè)技術(shù)與所述客戶流失預(yù)測(cè)請(qǐng)求所包括的預(yù)測(cè)技術(shù)相同。
7.如權(quán)利要求1-4的任意一個(gè)所述的方法,其中, 所述客戶是移動(dòng)客戶,以及 所述多個(gè)參數(shù)包括以下的多個(gè):呼出累計(jì)時(shí)長(zhǎng)、呼入累計(jì)時(shí)長(zhǎng)、短信累計(jì)發(fā)送量、數(shù)據(jù)業(yè)務(wù)累計(jì)流量、漫游時(shí)長(zhǎng)、跨網(wǎng)時(shí)長(zhǎng)、消費(fèi)種類總數(shù)、用戶充值次數(shù)、用戶充值金額、消費(fèi)金額和投訴次數(shù)。
8.如權(quán)利要求2或4的方法,其中, 所述至少一個(gè)參數(shù)包括以下的至少一個(gè):入網(wǎng)時(shí)長(zhǎng)、是否集團(tuán)客戶和是否資費(fèi)捆綁。
9.如權(quán)利要求3或4所述的方法,其中, 所述指定預(yù)測(cè)技術(shù)包括貝葉斯網(wǎng)絡(luò)、樸素貝葉斯分類器和/或決策樹。
10.一種用于客戶流失預(yù)測(cè)的裝置,包括: 確定模塊,用于根據(jù)預(yù)先取得的與客戶行為相關(guān)的數(shù)據(jù),確定當(dāng)前仍未流失的客戶的反映其行為的多個(gè)參數(shù)各自在設(shè)定時(shí)間段內(nèi)的取值; 獲取模塊,用于根據(jù)所確定的取值和所述當(dāng)前仍未流失的客戶的所述多個(gè)參數(shù)各自的均值,獲取所述當(dāng)前仍未流失的客戶的所述多個(gè)參數(shù)各自的變化率;以及 計(jì)算模塊,用于根據(jù)所獲取的變化率和指定的客戶流失預(yù)測(cè)模型,計(jì)算所述當(dāng)前仍未流失的客戶的流失概率,· 其中,所述多個(gè)參數(shù)各自的變化被用作所述指定的客戶流失預(yù)測(cè)模型的變量。
11.如權(quán)利要求10所述的裝置,其中, 所述確定模塊還用于根據(jù)所述預(yù)先取得的與客戶行為相關(guān)的數(shù)據(jù),確定所述當(dāng)前仍未流失的客戶的反映其行為的至少一個(gè)參數(shù)在所述設(shè)定時(shí)間段內(nèi)的取值,其中,所述至少一個(gè)參數(shù)不同于所述多個(gè)參數(shù), 所述計(jì)算模塊進(jìn)一步用于:根據(jù)所述當(dāng)前仍未流失的客戶的所述多個(gè)參數(shù)各自的變化率、所述當(dāng)前仍未流失的客戶的所述至少一個(gè)參數(shù)的取值和所述指定的客戶流失預(yù)測(cè)模型,計(jì)算所述當(dāng)前仍未流失的客戶的流失概率, 其中,所述多個(gè)參數(shù)各自的變化和所述至少一個(gè)參數(shù)被用作所述指定的客戶流失預(yù)測(cè)模型的變量。
12.如權(quán)利要求10所述的裝置,其中, 所述確定模塊還用于根據(jù)所述預(yù)先取得的與客戶行為相關(guān)的數(shù)據(jù),確定多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自在指定時(shí)間段內(nèi)的取值,其中,所述多個(gè)客戶包括已流失的客戶和當(dāng)前仍未流失的客戶, 所述獲取模塊還用于根據(jù)所確定的所述多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自的取值和所述多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自的均值,獲取所述多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自的變化率, 其中,所述裝置還包括創(chuàng)建模塊,用于根據(jù)所獲取的所述多個(gè)客戶的每一個(gè)的所述多個(gè)參數(shù)各自的變化率,創(chuàng)建基于指定預(yù)測(cè)技術(shù)的客戶流失預(yù)測(cè)模型,其中,所述多個(gè)參數(shù)各自的變化被用作所創(chuàng)建的客戶流失預(yù)測(cè)模型的變量, 其中,所述指定的客戶流失預(yù)測(cè)模型是所述創(chuàng)建的客戶流失預(yù)測(cè)模型或者是所述創(chuàng)建的客戶流失預(yù)測(cè)模型的其中一個(gè)。
13.如權(quán)利要求10所述的裝置,其中,所述設(shè)定時(shí)間段是剛過去的時(shí)間段。
14.如權(quán)利要求10或11所述的裝置,其中, 所述確定模塊進(jìn)一步用于:當(dāng)收到用戶終端發(fā)送的客戶流失預(yù)測(cè)請(qǐng)求時(shí),執(zhí)行所述確定, 其中,所述裝置還包括: 檢索模塊,用于根據(jù)所計(jì)算的所述當(dāng)前仍未流失的客戶的流失概率,檢索出其流失概率大于指定值的客戶,作為可能會(huì)流失的客戶;以及 發(fā)送模塊,用于向所述用戶終端發(fā)送關(guān)于所述可能會(huì)流失的客戶的信息。
15.如權(quán)利要求14所述的裝置,其中, 所述客戶流失預(yù)測(cè)請(qǐng)求包括期望使用的預(yù)測(cè)技術(shù), 所述指定的客戶流失預(yù)測(cè)模型所基于的預(yù)測(cè)技術(shù)與所述客戶流失預(yù)測(cè)請(qǐng)求所包括的預(yù)測(cè)技術(shù)相同。
16.如權(quán)利要求10-13的任意一個(gè)所述的裝置,其中, 所述客戶是移動(dòng)客戶,以及 所述多個(gè)參數(shù)包括以下的多個(gè):呼出 累計(jì)時(shí)長(zhǎng)、呼入累計(jì)時(shí)長(zhǎng)、短信累計(jì)發(fā)送量、數(shù)據(jù)業(yè)務(wù)累計(jì)流量、漫游時(shí)長(zhǎng)、跨網(wǎng)時(shí)長(zhǎng)、消費(fèi)種類總數(shù)、用戶充值次數(shù)、用戶充值金額、消費(fèi)金額和投訴次數(shù)。
17.如權(quán)利要求11或13所述的裝置,其中, 所述至少一個(gè)參數(shù)包括以下的至少一個(gè):入網(wǎng)時(shí)長(zhǎng)、是否集團(tuán)客戶和是否資費(fèi)捆綁。
18.如權(quán)利要求12或13所述的裝置,其中, 所述指定預(yù)測(cè)技術(shù)包括貝葉斯網(wǎng)絡(luò)、樸素貝葉斯分類器和/或決策樹。
19.一種用于客戶流失預(yù)測(cè)的設(shè)備,包括: 存儲(chǔ)器,用于存儲(chǔ)可執(zhí)行指令;以及 處理器,用于根據(jù)所述存儲(chǔ)器所存儲(chǔ)的可執(zhí)行指令,執(zhí)行權(quán)利要求1-9中的任意一個(gè)所包括的步驟。
20.一種機(jī)器可讀介質(zhì),其上存儲(chǔ)有可執(zhí)行指令,當(dāng)該可執(zhí)行指令被執(zhí)行時(shí),使得機(jī)器執(zhí)行權(quán)利要求1-9中的任意一個(gè)所包括的步驟。
【文檔編號(hào)】G06Q10/04GK103854065SQ201210506533
【公開日】2014年6月11日 申請(qǐng)日期:2012年11月30日 優(yōu)先權(quán)日:2012年11月30日
【發(fā)明者】劉彥, 陳世俊, 張勝, 尹雪 申請(qǐng)人:西門子公司