專利名稱:加油卡客戶流失預(yù)測(cè)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及客戶流失預(yù)測(cè)分析,具體涉及石化零售行業(yè)加油卡用戶的流失預(yù)測(cè)分析。
背景技術(shù):
中國(guó)的石化行業(yè)經(jīng)過多年的信息化建設(shè),取得了巨大的經(jīng)濟(jì)效益和良好的社會(huì)效益。然而經(jīng)過一輪高速發(fā)展之后,尤其是隨著行業(yè)內(nèi)競(jìng)爭(zhēng)的加劇,各運(yùn)營(yíng)商加油卡客戶的增長(zhǎng)逐漸放慢,客戶呈現(xiàn)出動(dòng)態(tài)亦增亦減趨勢(shì),在每月都有客戶新開卡的情況下,也有大量客戶停止使用。每個(gè)月都有出現(xiàn)的零充值、零消費(fèi)客戶,大量占用了客戶維護(hù)的信息資源, 客戶數(shù)量的增加卻不能帶來收入的增加,而發(fā)展新客戶的成本要遠(yuǎn)遠(yuǎn)大于挽留老客戶的成本,所以客戶流失分析的重要意義對(duì)石化運(yùn)營(yíng)商來說不言而喻。在當(dāng)前運(yùn)營(yíng)基礎(chǔ)設(shè)施不斷改善,服務(wù)意識(shí)也逐步提升的情況下,對(duì)有價(jià)值客戶的關(guān)注和流失防范成為關(guān)注的焦點(diǎn)。目前,未有任何石化公司對(duì)加油卡客戶的流失進(jìn)行系統(tǒng)化、規(guī)劃化分析并提出相應(yīng)預(yù)警信息。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題就是為了克服現(xiàn)有技術(shù)缺陷而提供一種加油卡客戶流失預(yù)測(cè)方法。本發(fā)明的目的通過以下技術(shù)方案來實(shí)現(xiàn),如
圖1所示一種加油卡客戶流失預(yù)測(cè)分析方法,包括步驟Si、收集一定期限內(nèi)每個(gè)加油卡客戶行為的原始數(shù)據(jù),建立數(shù)據(jù)庫(kù);S2、以顆粒度為月對(duì)所述原始數(shù)據(jù)進(jìn)行整理匯總,計(jì)算出和加油卡客戶流失行為相關(guān)的若干基本屬性;S3、對(duì)所述各基本屬性進(jìn)行離散化或布爾化處理;S4、利用信息增益參量對(duì)所述各基本屬性的重要性進(jìn)行評(píng)估,篩選出若干重要屬性;S5、對(duì)所述各重要屬性,利用多維關(guān)聯(lián)規(guī)則,得到屬性的頻繁項(xiàng)集,并以每個(gè)頻繁項(xiàng)集中的頻繁項(xiàng)與該頻繁維謂詞集合并起來作為新屬性;S6、針對(duì)所述多維頻繁項(xiàng)集的新屬性,采用決策樹方式建立模型;S7、將實(shí)際已經(jīng)流失的客戶的數(shù)據(jù)輸入所述決策樹模型進(jìn)行分析,比較分析結(jié)果和實(shí)際歷史結(jié)果的差異,對(duì)所述決策樹模型進(jìn)行修正;S7、根據(jù)修正后的決策樹模型進(jìn)行客戶流失預(yù)測(cè),發(fā)布預(yù)警信息。其中,步驟Sl中加油卡客戶行為的原始數(shù)據(jù)包括充值明細(xì)、圈存明細(xì)、加油明細(xì)、 積分明細(xì)、沉淀資金。其中,步驟S2中和加油卡客戶后續(xù)行為相關(guān)的若干基本屬性,至少包括一定期限內(nèi)的月平均消費(fèi)額,以往充值的平均金額,最后一次充值距當(dāng)前時(shí)間,最后一次的充值的金額,最后一次消費(fèi)距當(dāng)前的時(shí)間。其中,步驟S4包括以下步驟S41、計(jì)算任意基本屬性的期望信息
權(quán)利要求
1.一種加油卡客戶流失預(yù)測(cè)分析方法,其特征在于,包括步驟s1、收集一定期限內(nèi)每個(gè)加油卡客戶行為的原始數(shù)據(jù),建立數(shù)據(jù)庫(kù);s2、以顆粒度為月對(duì)所述原始數(shù)據(jù)進(jìn)行整理匯總,計(jì)算出和加油卡客戶流失行為相關(guān)的若干基本屬性;s3、對(duì)所述各基本屬性進(jìn)行離散化或布爾化處理;s4、利用信息增益參量對(duì)所述各基本屬性的重要性進(jìn)行評(píng)估,篩選出若干重要屬性;s5、對(duì)所述各重要屬性,利用多維關(guān)聯(lián)規(guī)則,得到屬性的頻繁項(xiàng)集,并以每個(gè)頻繁項(xiàng)集中的頻繁項(xiàng)與該頻繁維謂詞集合并起來作為新屬性;s6、針對(duì)所述多維頻繁項(xiàng)集的新屬性,采用決策樹方式建立模型;s7、將實(shí)際已經(jīng)流失的客戶的數(shù)據(jù)輸入所述決策樹模型進(jìn)行分析,比較分析結(jié)果和實(shí)際歷史結(jié)果的差異,對(duì)所述決策樹模型進(jìn)行修正;s8、根據(jù)修正后的決策樹模型進(jìn)行客戶流失預(yù)測(cè),發(fā)布預(yù)警信息。
2.如權(quán)利要求1所述的加油卡客戶流失預(yù)測(cè)分析方法,其特征在于,步驟Sl所述的加油卡客戶行為的原始數(shù)據(jù)包括充值明細(xì)、圈存明細(xì)、加油明細(xì)、積分明細(xì)、沉淀資金。
3.如權(quán)利要求1所述的加油卡客戶流失預(yù)測(cè)分析方法,其特征在于,步驟S2所述的和加油卡客戶后續(xù)行為相關(guān)的若干基本屬性,至少包括一定期限內(nèi)的月平均消費(fèi)額,以往充值的平均金額,最后一次充值距當(dāng)前的時(shí)間,最后一次充值的金額,最后一次消費(fèi)距當(dāng)前的時(shí)間。
4.如權(quán)利要求1所述的加油卡客戶流失預(yù)測(cè)分析方法,其特征在于,步驟S4包括以下步驟s41、計(jì)算任意基本屬性的期望信息
5.如權(quán)利要求1所述的加油卡客戶流失預(yù)測(cè)分析方法,其特征在于,所述步驟S6包括s61、對(duì)步驟S5中所述的每個(gè)新屬性計(jì)算信息增益,取信息增益最大的新屬性作為根節(jié)占.s62、為該新屬性的每一個(gè)取值建立一個(gè)樹的分叉;s63、對(duì)每一個(gè)分叉,選出樣本子集,對(duì)其余的新屬性計(jì)算信息增益,建立節(jié)點(diǎn);s64、遞歸以上過程,直到?jīng)]有其余的新屬性,該節(jié)點(diǎn)定義為葉子節(jié)點(diǎn);·565、將沒有樣本的葉子節(jié)點(diǎn)剪掉;·566、將該結(jié)點(diǎn)歸類為所含樣本中個(gè)數(shù)最多的類別。
6.如權(quán)利要求5所述的加油卡客戶流失預(yù)測(cè)分析方法,其特征在于,所述步驟S62包括如果該新屬性為布爾型,則取值為真或假。
全文摘要
本發(fā)明提供一種加油卡客戶流失預(yù)測(cè)分析方法,收集一定期限內(nèi)每個(gè)加油卡客戶行為的原始數(shù)據(jù),建立數(shù)據(jù)庫(kù);對(duì)原始數(shù)據(jù)進(jìn)行整理匯總,計(jì)算出和加油卡客戶流失行為相關(guān)的若干基本屬性并進(jìn)行布爾化處理,利用信息增益參量對(duì)屬性的重要性進(jìn)行評(píng)估,利用多維關(guān)聯(lián)規(guī)則,得到屬性的頻繁項(xiàng)集,并對(duì)各頻繁項(xiàng)集內(nèi)的屬性進(jìn)行合并,然后采用決策樹方式建立模型,并根據(jù)持續(xù)變化的加油卡客戶數(shù)據(jù)對(duì)決策樹模型進(jìn)行修正,從而預(yù)測(cè)客戶流失情況,并發(fā)布預(yù)警信息。本發(fā)明綜合并改進(jìn)了屬性關(guān)聯(lián)和決策樹模型,增加了決策樹生成效率和可理解性,屬性的合并具有石化行業(yè)特色,從而解決傳統(tǒng)決策樹模型無法解決的問題,為石化行業(yè)提出了一種可行的客戶流失預(yù)警方案。
文檔編號(hào)G06Q50/00GK102567807SQ20101060832
公開日2012年7月11日 申請(qǐng)日期2010年12月23日 優(yōu)先權(quán)日2010年12月23日
發(fā)明者張學(xué)東, 李強(qiáng), 趙楊 申請(qǐng)人:上海亞太計(jì)算機(jī)信息系統(tǒng)有限公司