本發(fā)明涉及通信技術(shù)領(lǐng)域,具體地,涉及一種移動用戶投訴的預測方法和預測系統(tǒng)。
背景技術(shù):
用戶投訴處理是運營商服務工作中尤為重要的一個環(huán)節(jié),在現(xiàn)有投訴處理中,普遍為接觸人員被動傾聽和記錄客戶訴求,這種方法效率低而且用戶體驗不好。
在目前運營商激烈的競爭環(huán)境中,不僅要求能夠?qū)σ呀?jīng)產(chǎn)生的用戶投訴進行高效處理,同時要求對用戶的業(yè)務使用感知進行實時觀測,對用戶的投訴傾向進行科學評估、對用戶的投訴行為進行預測,在此基礎(chǔ)上提前做好預處理措施。如何提前預測用戶投訴并實現(xiàn)提前回訪是一個亟待解決的問題。
技術(shù)實現(xiàn)要素:
本發(fā)明針對現(xiàn)有技術(shù)中存在的上述技術(shù)問題,提供一種移動用戶投訴的預測方法和預測系統(tǒng)。該預測方法通過對移動用戶的投訴傾向進行科學評估,能夠準確地預測用戶是否會投訴,從而提高了移動用戶投訴預測的準確度,有助于加快投訴的處理速度,提升用戶的滿意度。
本發(fā)明提供一種移動用戶投訴的預測方法,包括:
定義用戶特征為由用戶流量超出套餐的占比和通話超出套餐的占比組成的二維向量;
分析訓練樣本中用戶的特征和投訴情況;
根據(jù)所述訓練樣本中用戶的特征、投訴情況以及待測用戶的特征值,預測所述待測用戶是否會投訴。
優(yōu)選地,所述分析訓練樣本中用戶的特征和投訴情況包括:
提取所述訓練樣本,根據(jù)所述訓練樣本中所有用戶的投訴記錄,將所述訓練樣本中的用戶分為投訴用戶和未投訴用戶;
統(tǒng)計所述訓練樣本中所述投訴用戶和所述未投訴用戶各自的用戶數(shù),并根據(jù)統(tǒng)計結(jié)果計算所述投訴用戶在所述訓練樣本的用戶總數(shù)中所占的第一比例和所述未投訴用戶在所述訓練樣本的用戶總數(shù)中所占的第二比例;
計算所述訓練樣本中用戶的特征值,并將所述訓練樣本中用戶的特征值劃分為多個屬性范圍;
統(tǒng)計各個所述屬性范圍內(nèi)所述投訴用戶和所述未投訴用戶各自的用戶數(shù),并根據(jù)統(tǒng)計結(jié)果計算各個所述屬性范圍內(nèi)所述投訴用戶在所述訓練樣本的所述投訴用戶總數(shù)中所占的第三比例和各個所述屬性范圍內(nèi)所述未投訴用戶在所述訓練樣本的所述未投訴用戶總數(shù)中所占的第四比例。
優(yōu)選地,所述根據(jù)所述訓練樣本中用戶的特征、投訴情況以及待測用戶的特征值,預測所述預測用戶是否會投訴包括:
計算所述待測用戶的特征值;
假設(shè)所述待測用戶為所述投訴用戶,根據(jù)所述第一比例和所述待測用戶的特征值所在的所述屬性范圍內(nèi)的所述第三比例,采用貝葉斯定理計算獲得第一值;
假設(shè)所述待測用戶為所述未投訴用戶,根據(jù)所述第二比例和所述待測用戶的特征值所在的所述屬性范圍內(nèi)的所述第四比例,采用貝葉斯定理計算獲得第二值;
比較所述第一值和所述第二值的大小,如果所述第一值大于所述第二值,則所述待測用戶為會投訴用戶;如果所述第一值小于所述第二值,則所述待測用戶為不會投訴用戶。
優(yōu)選地,還包括:預測所述會投訴用戶的投訴時間;
對多個所述會投訴用戶的投訴時間進行排序,優(yōu)先回訪排序最小的所述會投訴用戶。
優(yōu)選地,所述預測所述會投訴用戶的投訴時間包括:
根據(jù)所述訓練樣本中用戶的特征值和投訴時間,計算確定Logistic模型中的常數(shù)參數(shù);
將所述會投訴用戶的特征值代入所述Logist ic模型中,計算所述會投訴用戶的投訴時間。
本發(fā)明還提供一種移動用戶投訴的預測系統(tǒng),包括:
定義模塊,用于定義用戶特征為由用戶流量超出套餐的占比和通話超出套餐的占比組成的二維向量;
分析模塊,用于分析訓練樣本中用戶的特征和投訴情況;
第一預測模塊,用于根據(jù)所述訓練樣本中用戶的特征、投訴情況以及待測用戶的特征值,預測所述待測用戶是否會投訴。
優(yōu)選地,所述分析模塊包括:
提取分類單元,用于提取所述訓練樣本,根據(jù)所述訓練樣本中所有用戶的投訴記錄,將所述訓練樣本中的用戶分為投訴用戶和未投訴用戶;
第一統(tǒng)計計算單元,用于統(tǒng)計所述訓練樣本中所述投訴用戶和所述未投訴用戶各自的用戶數(shù),并根據(jù)統(tǒng)計結(jié)果計算所述投訴用戶在所述訓練樣本的用戶總數(shù)中所占的第一比例和所述未投訴用戶在所述訓練樣本的用戶總數(shù)中所占的第二比例;
計算劃分單元,用于計算所述訓練樣本中用戶的特征值,并將所述訓練樣本中用戶的特征值劃分為多個屬性范圍;
第二統(tǒng)計計算單元,用于統(tǒng)計各個所述屬性范圍內(nèi)所述投訴用戶和所述未投訴用戶各自的用戶數(shù),并根據(jù)統(tǒng)計結(jié)果計算各個所述屬性范圍內(nèi)所述投訴用戶在所述訓練樣本的所述投訴用戶總數(shù)中所占的第三比例和各個所述屬性范圍內(nèi)所述未投訴用戶在所述訓練樣本的所述未投訴用戶總數(shù)中所占的第四比例。
優(yōu)選地,所述第一預測模塊包括:
第一計算單元,用于計算所述待測用戶的特征值;
第二計算單元,用于根據(jù)所述第一比例和所述待測用戶的特征值所在的所述屬性范圍內(nèi)的所述第三比例,采用貝葉斯定理計算獲得第一值;
第三計算單元,用于根據(jù)所述第二比例和所述待測用戶的特征值所在的所述屬性范圍內(nèi)的所述第四比例,采用貝葉斯定理計算獲得第二值;
比較確定單元,用于比較所述第一值和所述第二值的大小,并根據(jù)比較結(jié)果確定所述待測用戶是否為會投訴用戶。
優(yōu)選地,還包括第二預測模塊、排序模塊和回訪模塊;
所述第二預測模塊用于預測所述會投訴用戶的投訴時間;
所述排序模塊用于對多個所述會投訴用戶的投訴時間進行排序;
所述回訪模塊用于根據(jù)所述排序模塊的排序回訪所述會投訴用戶。
優(yōu)選地,所述第二預測模塊包括:
計算確定單元,用于根據(jù)所述訓練樣本中用戶的特征值和投訴時間,計算確定Logistic模型中的常數(shù)參數(shù);
第四計算單元,用于將所述會投訴用戶的特征值代入所述Logistic模型中,計算所述會投訴用戶的投訴時間。
本發(fā)明的有益效果:本發(fā)明所提供的移動用戶投訴的預測方法,通過對移動用戶的投訴傾向進行科學評估,能夠準確地預測用戶是否會投訴,從而提高了移動用戶投訴預測的準確度,有助于加快投訴的處理速度,提升用戶的滿意度。
本發(fā)明所提供的移動用戶投訴的預測系統(tǒng),能夠獲得與上述預測方法相同的技術(shù)效果。
附圖說明
圖1為本發(fā)明實施例1中移動用戶投訴的預測方法的流程圖;
圖2為本發(fā)明實施例2中移動用戶投訴的預測方法的流程圖;
圖3為本發(fā)明實施例2中步驟2的流程圖;
圖4為本發(fā)明實施例2中步驟3的流程圖;
圖5為本發(fā)明實施例3中移動用戶投訴的預測系統(tǒng)的原理框圖;
圖6為本發(fā)明實施例4中移動用戶投訴的預測系統(tǒng)的原理框圖。
其中的附圖標記說明:
1.定義模塊;2.分析模塊;21.提取分類單元;22.第一統(tǒng)計計算單元;23.計算劃分單元;24.第二統(tǒng)計計算單元;3.第一預測模塊;31.第一計算單元;32.第二計算單元;33.第三計算單元;34.比較確定單元;4.第二預測模塊;41.計算確定單元;42.第四計算單元;5.排序模塊;6.回訪模塊。
具體實施方式
為使本領(lǐng)域的技術(shù)人員更好地理解本發(fā)明的技術(shù)方案,下面結(jié)合附圖和具體實施方式對本發(fā)明所提供的一種移動用戶投訴的預測方法和預測系統(tǒng)作進一步詳細描述。
實施例1:
本實施例提供一種移動用戶投訴的預測方法,如圖1所示,包括:
步驟S1:定義用戶特征為由用戶流量超出套餐的占比和通話超出套餐的占比組成的二維向量。
步驟S2:分析訓練樣本中用戶的特征和投訴情況。
步驟S3:根據(jù)訓練樣本中用戶的特征、投訴情況以及待測用戶的特征值,預測待測用戶是否會投訴。
該預測方法能夠?qū)σ苿佑脩舻耐对V傾向進行科學評估,從而提高了移動用戶投訴預測的準確度,有助于加快投訴的處理速度,提升用戶的滿意度。
實施例2:
本實施例提供一種移動用戶投訴的預測方法,如圖2所示,包括:
步驟S1:定義用戶特征為由用戶流量超出套餐的占比和通話超出套餐的占比組成的二維向量。
該步驟中,如將用戶特征定義為一個二維向量(f,t),其中,f表示流量超出部分占流量套餐的比例;fd表示從客戶管理系統(tǒng)中查詢獲取的用戶當月的流量套餐;fr表示從用戶上網(wǎng)記錄系統(tǒng)中查詢獲取的用戶當月實際使用的流量;t表示通話超出部分占通話套餐的比例;td表示從客戶管理系統(tǒng)中查詢獲取的用戶當月的通話套餐;tr表示從BSS系統(tǒng)中查詢獲取的用戶當月的實際通話時間。
步驟S2:分析訓練樣本中用戶的特征和投訴情況。
該步驟具體包括:如圖3所示,
步驟S21:提取訓練樣本,根據(jù)訓練樣本中所有用戶的投訴記錄,將訓練樣本中的用戶分為投訴用戶和未投訴用戶。
該步驟中,如從上網(wǎng)記錄數(shù)據(jù)系統(tǒng)、BSS系統(tǒng)和客戶管理系統(tǒng)中提取流量超出套餐和通話超出套餐的多個用戶,將這些用戶作為訓練樣本;同時根據(jù)這些用戶的投訴記錄,將這些用戶分為兩類:即投訴用戶C1和未投訴用戶C2。
步驟S22:統(tǒng)計訓練樣本中投訴用戶和未投訴用戶各自的用戶數(shù),并根據(jù)統(tǒng)計結(jié)果計算投訴用戶在訓練樣本的用戶總數(shù)中所占的第一比例和未投訴用戶在訓練樣本的用戶總數(shù)中所占的第二比例。
該步驟中,如統(tǒng)計獲得訓練樣本中投訴用戶總數(shù)為M1,未投訴用戶總數(shù)為M2,則投訴用戶在訓練樣本的用戶總數(shù)中所占的第一比例為:未投訴用戶在訓練樣本的用戶總數(shù)中所占的第二比例為:
步驟S23:計算訓練樣本中用戶的特征值,并將訓練樣本中用戶的特征值劃分為多個屬性范圍。
該步驟中,如將訓練樣本中用戶特征值中的流量超出套餐的占比f劃分為以下四個屬性范圍:①.f≤0.01;②.0.01<f≤0.05;③.0.05<f≤0.5;④.f>0.5。將訓練樣本中用戶特征值中的通話超出套餐的占比t劃分為以下三個屬性范圍:①.t≤0.1;②.0.1<t≤0.5;③.t>0.5。
步驟S24:統(tǒng)計各個屬性范圍內(nèi)投訴用戶和未投訴用戶各自的用戶數(shù),并根據(jù)統(tǒng)計結(jié)果計算各個屬性范圍內(nèi)投訴用戶在訓練樣本的投訴用戶總數(shù)中所占的第三比例和各個屬性范圍內(nèi)未投訴用戶在訓練樣本的未投訴用戶總數(shù)中所占的第四比例。
該步驟中,如統(tǒng)計訓練樣本中在f的四個屬性范圍內(nèi)的投訴用戶的用戶數(shù)分別A11、A12、A13、A14;在f的四個屬性范圍內(nèi)的投訴用戶在訓練樣本的投訴用戶總數(shù)中所占的第三比例分別為:統(tǒng)計訓練樣本中在f的四個屬性范圍內(nèi)的未投訴用戶的用戶數(shù)分別A21、A22、A23、A24;在f的四個屬性范圍內(nèi)的未投訴用戶在訓練樣本的未投訴用戶總數(shù)中所占的第四比例分別為:統(tǒng)計訓練樣本中在t的三個屬性范圍內(nèi)的投訴用戶的用戶數(shù)分別B11、B12、B13;在t的三個屬性范圍內(nèi)的投訴用戶在訓練樣本的投訴用戶總數(shù)中所占的第三比例分別為:統(tǒng)計訓練樣本中在t的三個屬性范圍內(nèi)的未投訴用戶的用戶數(shù)分別B21、B22、B23;在t的三個屬性范圍內(nèi)的未投訴用戶在訓練樣本的未投訴用戶總數(shù)中所占的第四比例分別為:
步驟S3:根據(jù)訓練樣本中用戶的特征、投訴情況以及待測用戶的特征值,預測待測用戶是否會投訴。
該步驟具體包括:如圖4所示,
步驟S31:計算待測用戶的特征值。
該步驟中,計算待測用戶的流量超出套餐的占比f′和通話超出套餐的占比t′。
步驟S32:假設(shè)待測用戶為投訴用戶,根據(jù)第一比例和待測用戶的特征值所在的屬性范圍內(nèi)的第三比例,采用貝葉斯定理計算獲得第一值。
該步驟中,如假設(shè)待測用戶的流量超出套餐的占比f′在f≤0.01的屬性范圍內(nèi),待測用戶的通話超出套餐的占比t′在t>0.5的屬性范圍內(nèi),設(shè)第一值為X1,則X1=argmax(P(C1)P(f≤0.01|C1)P(t>0.5|C1))。
步驟S33:假設(shè)待測用戶為未投訴用戶,根據(jù)第二比例和待測用戶的特征值所在的屬性范圍內(nèi)的第四比例,采用貝葉斯定理計算獲得第二值。
該步驟中,與步驟S32中同樣,假設(shè)待測用戶的流量超出套餐的占比f′在f≤0.01的屬性范圍內(nèi),待測用戶的通話超出套餐的占比t′在t>0.5的屬性范圍內(nèi)。設(shè)第二值為X2,則X2=argmax(P(C2)P(f≤0.01|C2)P(t>0.5|C2))。
步驟S34:比較第一值和第二值的大小,如果第一值大于第二值,則執(zhí)行步驟S35:待測用戶為會投訴用戶。如果第一值小于第二值,則執(zhí)行步驟S36:待測用戶為不會投訴用戶。
如圖2所示,本實施例中的預測方法還包括:步驟S4:預測會投訴用戶的投訴時間。
該步驟具體包括:
步驟S41:根據(jù)訓練樣本中用戶的特征值和投訴時間,計算確定Logistic模型中的常數(shù)參數(shù)。
該步驟中,Logistic模型的公式為:其中,y為因變量,在本實施例中表示用戶在發(fā)生流量超出流量套餐或通話超出通話套餐后的投訴時間間隔(如天數(shù)),K為飽和參數(shù),表示投訴時間的上限,可根據(jù)經(jīng)驗設(shè)定。f和t為自變量,f表示流量超出部分占流量套餐的占比,t表示通話超出部分占通話套餐的占比;α和β為權(quán)重參數(shù),可根據(jù)經(jīng)驗值確定,a和b為Logistic模型中需要確定的常數(shù)參數(shù)。
將訓練樣本中各個用戶的特征值(f,t)以及投訴時間(即投訴時間間隔)y分別代入上述Logistic模型公式中,根據(jù)最小二乘法估算出Logistic模型中的常數(shù)參數(shù)a和b的值。
步驟S42:將會投訴用戶的特征值代入Logistic模型中,計算會投訴用戶的投訴時間。
該步驟中,從客戶管理系統(tǒng)中查詢獲取會投訴用戶的流量套餐和通話套餐,并從用戶上網(wǎng)記錄系統(tǒng)和BSS系統(tǒng)中分別查詢獲取會投訴用戶的實際使用流量和實際通話時間,根據(jù)公式(1)和公式(2)計算會投訴用戶的特征值(f,t),將會投訴用戶的特征值代入步驟S41中已確定常數(shù)參數(shù)的Logistic模型中,從而最終計算出會投訴用戶的投訴時間(即投訴時間間隔)。
步驟S5:對多個會投訴用戶的投訴時間進行排序,優(yōu)先回訪排序最小的會投訴用戶。
該步驟中,由于會投訴用戶往往包括多個,所以該步驟的設(shè)置能通過對投訴時間的排序,提前對投訴時間較近的會投訴用戶進行優(yōu)先回訪,從而改善了用戶體驗,提升了用戶的滿意度。
實施例1-2的有益效果:實施例1-2中所提供的移動用戶投訴的預測方法,通過對移動用戶的投訴傾向進行科學評估,能夠準確地預測用戶是否會投訴,從而提高了移動用戶投訴預測的準確度,有助于加快投訴的處理速度,提升用戶的滿意度。
實施例3:
本實施例提供一種移動用戶投訴的預測系統(tǒng),如圖5所示,包括:定義模塊1,用于定義用戶特征為由用戶流量超出套餐的占比和通話超出套餐的占比組成的二維向量。分析模塊2,用于分析訓練樣本中用戶的特征和投訴情況。第一預測模塊3,用于根據(jù)訓練樣本中用戶的特征、投訴情況以及待測用戶的特征值,預測待測用戶是否會投訴。
本實施例中,分析模塊2包括:提取分類單元21,用于提取訓練樣本,根據(jù)訓練樣本中所有用戶的投訴記錄,將訓練樣本中的用戶分為投訴用戶和未投訴用戶。第一統(tǒng)計計算單元22,用于統(tǒng)計訓練樣本中投訴用戶和未投訴用戶各自的用戶數(shù),并根據(jù)統(tǒng)計結(jié)果計算投訴用戶在訓練樣本的用戶總數(shù)中所占的第一比例和未投訴用戶在訓練樣本的用戶總數(shù)中所占的第二比例。計算劃分單元23,用于計算訓練樣本中用戶的特征值,并將訓練樣本中用戶的特征值劃分為多個屬性范圍。第二統(tǒng)計計算單元24,用于統(tǒng)計各個屬性范圍內(nèi)投訴用戶和未投訴用戶各自的用戶數(shù),并根據(jù)統(tǒng)計結(jié)果計算各個屬性范圍內(nèi)投訴用戶在訓練樣本的投訴用戶總數(shù)中所占的第三比例和各個屬性范圍內(nèi)未投訴用戶在訓練樣本的未投訴用戶總數(shù)中所占的第四比例。
本實施例中,第一預測模塊3包括:第一計算單元31,用于計算待測用戶的特征值。第二計算單元32,用于根據(jù)第一比例和待測用戶的特征值所在的屬性范圍內(nèi)的第三比例,采用貝葉斯定理計算獲得第一值。第三計算單元33,用于根據(jù)第二比例和待測用戶的特征值所在的屬性范圍內(nèi)的第四比例,采用貝葉斯定理計算獲得第二值。比較確定單元34,用于比較第一值和第二值的大小,并根據(jù)比較結(jié)果確定待測用戶是否為會投訴用戶。
本實施例中的預測系統(tǒng),能夠?qū)σ苿佑脩舻耐对V傾向進行科學評估,從而提高了移動用戶投訴預測的準確度,有助于加快投訴的處理速度,提升用戶的滿意度。
實施例4:
本實施例提供一種移動用戶投訴的預測系統(tǒng),與實施例3不同的是,如圖6所示,在實施例3中預測系統(tǒng)的基礎(chǔ)上,本實施例中的預測系統(tǒng)還包括:第二預測模塊4、排序模塊5和回訪模塊6。第二預測模塊4用于預測會投訴用戶的投訴時間。排序模塊5用于對多個會投訴用戶的投訴時間進行排序?;卦L模塊6用于根據(jù)排序模塊5的排序回訪會投訴用戶。
通過設(shè)置第二預測模塊4、排序模塊5和回訪模塊6,能夠提前對投訴時間較近的會投訴用戶進行優(yōu)先回訪,從而改善了用戶體驗,提升了用戶的滿意度。
本實施例中,第二預測模塊4包括:計算確定單元41,用于根據(jù)訓練樣本中用戶的特征值和投訴時間,計算確定Logistic模型中的常數(shù)參數(shù)。第四計算單元42,用于將會投訴用戶的特征值代入Logistic模型中,計算會投訴用戶的投訴時間。
本實施例中預測系統(tǒng)的其他原理模塊及其功能與實施例3中相同,此處不再贅述。
實施例3-4的有益效果:實施例3-4中所提供的移動用戶投訴的預測系統(tǒng),通過對移動用戶的投訴傾向進行科學評估,能夠準確地預測用戶是否會投訴,從而提高了移動用戶投訴預測的準確度,有助于加快投訴的處理速度,提升用戶的滿意度。
可以理解的是,以上實施方式僅僅是為了說明本發(fā)明的原理而采用的示例性實施方式,然而本發(fā)明并不局限于此。對于本領(lǐng)域內(nèi)的普通技術(shù)人員而言,在不脫離本發(fā)明的精神和實質(zhì)的情況下,可以做出各種變型和改進,這些變型和改進也視為本發(fā)明的保護范圍。