一種移動通信新業(yè)務沖擊預測方法和系統(tǒng)的制作方法
【技術領域】
[0001] 本發(fā)明屬于移動通信業(yè)務數(shù)據(jù)挖掘技術領域,更具體地,涉及一種移動通信新業(yè) 務沖擊預測方法和系統(tǒng)。
【背景技術】
[0002] 隨著移動互聯(lián)網(wǎng)的高速發(fā)展,通過移動互聯(lián)網(wǎng)向用戶提供通信類服務的新業(yè)務層 出不窮。這些新業(yè)務與移動運營商提供的傳統(tǒng)通信業(yè)務存在重疊部分,如微信提供的文字 內(nèi)容傳送服務與傳統(tǒng)移動運營商的短信業(yè)務,微信提供的語音內(nèi)容傳送服務與傳統(tǒng)移動運 營商的語音通話服務等,有些新業(yè)務能夠在用戶群體中很快流行,對移動運營商傳統(tǒng)業(yè)務 造成沖擊。運營商需要及時準確地評估新業(yè)務對傳統(tǒng)業(yè)務沖擊影響情況,以便做出相應的 業(yè)務優(yōu)化策略。現(xiàn)有的業(yè)務預測方法主要有業(yè)務使用趨勢分析、時間序列分析等方法,由于 新業(yè)務出現(xiàn)初期缺乏新業(yè)務相關使用數(shù)據(jù),這些方法無法對新出現(xiàn)的業(yè)務作出及時準確地 預測。
【發(fā)明內(nèi)容】
[0003] 針對現(xiàn)有技術的以上缺陷或改進需求,本發(fā)明提出一種一種移動通信新業(yè)務沖擊 預測方法和系統(tǒng)。利用用戶使用記錄數(shù)據(jù)與運營商運營統(tǒng)計數(shù)據(jù),訓練出用戶使用各業(yè)務 期間的用戶收益模型,使用進化博弈相關理論結合用戶收益模型對用戶使用業(yè)務利益動力 進行描述,從而及時準確地預測用戶新業(yè)務持續(xù)使用率和用戶群體新業(yè)務使用率,為運營 商優(yōu)化服務策略提供幫助。
[0004] 為了實現(xiàn)上述目的,按照本發(fā)明的一個方面,提供了一種移動通信新業(yè)務沖擊預 測方法,該方法包括以下步驟:
[0005] (1)從用戶使用業(yè)務記錄數(shù)據(jù)與運營商統(tǒng)計數(shù)據(jù)中提取出對于每個用戶U在時間 段t內(nèi)使用業(yè)務b的影響收益因素特征數(shù)據(jù)以及使用收益特征數(shù)據(jù)E (u,t,b),影響收益因 素特征數(shù)據(jù)包括業(yè)務技術因素特征集TE、業(yè)務服務能力因素特征集B0、業(yè)務交互因素特征 集ITR、業(yè)務價格因素特征集BL ;
[0006] (2)利用影響收益因素特征數(shù)據(jù)與使用收益特征數(shù)據(jù)E建立用戶收益模型,訓 練后對應得到業(yè)務技術收益C TE(u,t,b)、業(yè)務服務能力收益CB(](u,t,b)、業(yè)務交互收益 Citr (u, t, b)、業(yè)務價格收益Cbi (u, t, b)、綜合靜態(tài)收益Cs (u, t, b);
[0007] (3)將用戶劃分為不同的用戶群體g,利用用戶群體中每個用戶的影響收益因素 特征數(shù)據(jù)與使用收益特征數(shù)據(jù)E(u,t,b)建立用戶群體g隨時間t、用戶使用率UR影響的 用戶群體動態(tài)收益模型,訓練后得到用戶群體的動態(tài)收益C d (g,t,b),并結合用戶群體中每 個用戶的綜合靜態(tài)收益Cs(u,t,b),估計用戶群體g在時間段t使用各業(yè)務b的綜合收益 Csd (g,t,b);
[0008] (4)利用步驟⑵中得到的用戶收益模型與步驟⑴中得到的用戶使用業(yè)務的影 響收益因素特征數(shù)據(jù)對用戶使用新業(yè)務b n與傳統(tǒng)業(yè)務b t的影響收益因素特征數(shù)據(jù)的收益 分別進行預測,根據(jù)進化博弈靜態(tài)模型理論,判斷CB。(u,t,bn)+Citr (u,t,bn)-CB。(u,t,b)-Cit R(U,t,bt) > ε是否成立,其中ε為顯著參數(shù),若成立,則用戶u持續(xù)使用新業(yè)務1/的概率 P (u,bn)為:
[0009] P (u, bn) = fsigs (CB0 (u, t, bn), Citr (u, t, bn))
[0010] 其中,^*)為使用'(1!,11/)、(^(113,1/)通過邏輯回歸方法預測用戶使用 新業(yè)務的概率函數(shù);
[0011] 否則,用戶U持續(xù)使用新業(yè)務1/的概率P(u,bn)為:
[0012] P (un, b) = fsigl (CTE (u, t, bn), Cbl (u, t, bn), Cbo (u, t, bn), Citr (u, t, bn))
[0013] 其中,fsigl ( ·)為使用 Cte (u, t, bn)、Cbl (u, t, bn)、CB。(u, t, bn)、Citr (u, t, bn)通過邏 輯回歸方法預測用戶使用新業(yè)務的概率函數(shù);
[0014] (5)依據(jù)用戶群體中每個用戶的綜合靜態(tài)收益Cs (u,t,b),分別估計用戶群體g使 用新業(yè)務bn和傳統(tǒng)業(yè)務b t的群體平均靜態(tài)收益C s (g,t,bn)和Cs (g,t,b),同時,依據(jù)用戶 持續(xù)使用新業(yè)務的概率P (U,bn),估計用戶群體中用戶使用新業(yè)務的期望PE (g,bn)為:
[0016] 其中,G為一個用戶群體中用戶的集合;繼而,得到用戶群體使用新業(yè)務bn的持續(xù) 使用率LUR(g,b n)為:
[0017] LUR (g, bn) = fsigg (Cs (g, t, bn), Cs (g, t, b1), PE (g, bn))
[0018] 其中,fslgg( ·)為通過對數(shù)線性回歸方法預測用戶群體使用新業(yè)務的持續(xù)使用率 函數(shù);
[0019] (6)利用步驟(2)和(3)中的用戶收益模型和用戶群體動態(tài)收益模型對用戶群體 g在任一時間段t內(nèi)使用任一業(yè)務b的群體即時綜合收益Csd (g,t,b)進行預測,估計用戶 群體中使用所有同類業(yè)務的用戶平均使用收益ECsd(g,t),使用進化博弈動態(tài)復制方程得到 用戶群體中任一業(yè)務的用戶數(shù)量變化為:
[0022] 其中,η表示一個用戶群體g中的用戶數(shù)量,Csd (g, t,b)為用戶群體g在時間段t 內(nèi)使用業(yè)務b的群體平均動態(tài)收益,ECsd (g,t)為用戶群體中使用所有同類業(yè)務的用戶平均 使用收益;
[0023] 從而得到在時間段t內(nèi)用戶群體g中使用業(yè)務b的用戶數(shù)量nt;
[0024] 繼而,得到任一時間段t內(nèi)業(yè)務b在用戶群體g中的長期使用率UR(g,t,b),具體 為:
[0026] 其中,|g|為一個用戶群體的用戶數(shù)量。
[0027] 作為進一步優(yōu)選的,步驟(1)包括以下子步驟:
[0028] (1-1)根據(jù)用戶使用各業(yè)務技術質(zhì)量數(shù)據(jù)提取影響用戶U在時間段t使用業(yè)務b 收益的業(yè)務技術因素特征集TE,所述業(yè)務技術因素特征集TE包括:通過對用戶u在時間段 t內(nèi)使用業(yè)務b的平均通信時延、平均故障率、繁忙通信時延、繁忙故障率及繁忙時間比分 別加權平均得到的平均通信時延特征MD、平均故障率特征MF、繁忙通信時延特征BD、繁忙 故障率BF及繁忙時間比BTR ;
[0029] (1-2)根據(jù)用戶各業(yè)務使用記錄數(shù)據(jù)提取影響用戶u在時間段t使用業(yè)務b收益 的業(yè)務服務能力因素特征集B0,所述業(yè)務服務能力因素特征集BO包括:用戶u在時間段t 內(nèi)使用業(yè)務b的使用時間特征UT ;用戶u在時間段t對業(yè)務b的使用時間占同類業(yè)務總使 用時間比例特征UTR ;用戶u在時間段t使用業(yè)務b的使用量特征UC ;用戶u在時間段t對 業(yè)務b的使用量占同類業(yè)務總使用量比例特征UCR ;
[0030] (1-3)根據(jù)用戶各業(yè)務使用記錄數(shù)據(jù)提取影響用戶U在時間段t使用業(yè)務b收益 的業(yè)務交互因素特征集ITR,所述業(yè)務交互因素特征集ITR包括:用戶u使用業(yè)務b的學習 時間特征LT及持續(xù)使用率特征CUR ;
[0031] (1-4)提取用戶u在時間段t使用業(yè)務b的業(yè)務價格因素特征BL,所述業(yè)務價格 因素由用戶u在時間段t使用業(yè)務b的費用確定;
[0032] (1-5)通過估計用戶u在時間段t內(nèi)單位時間使用業(yè)務b的使用時間和次數(shù)得到 用戶u在時間段t使用業(yè)務b的使用時間特征UT和使用頻率特征UC ;提取用戶u在時間 段t使用業(yè)務b的使用時間占同類業(yè)務使用總時間特征RUT及提取用戶u在時間段t使用 業(yè)務b的使用頻率占同類業(yè)務使用總頻率特征RUC ;對上述四個特征進行標準化處理后加 權平均得到用戶u在時間段t內(nèi)使用業(yè)務b的使用收益特征數(shù)據(jù)E。
[0033] 作為進一步優(yōu)選的,步驟(2)中:所述用戶收益模型為回歸模型,所述業(yè)務技術 收益C te (u, t, b)、業(yè)務服務能力收益CB。(u, t, b)、業(yè)務交互收益Citr (u, t, b)、業(yè)務價格收益 (V (u, t, b)、綜合靜態(tài)收益Cs (u, t, b)具體為:
[0034] Cte (u, t, b) = fte (MD, MF, BD, BF, BTR)
[0035] Cbo (u, t, b) = fbo (UT, UTR, UC, UCR)
[0036] Citr (u, t, b) = fltr (LT, CUR)
[0037] Cbl (u, t, b) = fbl (BL)
[0038] Cs (u, t, b) = fs (TE, BO, ITR, BL)
[0039] 其中,fta( · ),fbc]( ·),fltr( · ),fbl( · ),fs( ·)為各類收益對應的回歸模型函數(shù)。
[0040] 作為進一步優(yōu)選的,步驟(3)的具體步驟如下:
[0041] (3-1)按照綜合靜態(tài)收益Cs中不同用戶使用業(yè)務的業(yè)務技術相關收益TE、業(yè)務服 務能力相關收益B0、業(yè)務交互相關收益ITR、業(yè)務價格相關收益BL各自所占的不同權值對 所有用戶采用聚類方法分為不同的用戶群體;
[0042] (3-2)通過估計用戶群體g中的用戶平均使用頻率提取用戶群體g在時間段t使 用業(yè)務b的使用頻率特征UC (g, t, b),具體為:
[0044] 其中,|g|為一個用戶群體的用戶數(shù)量;
[0045] (3-3)通過估計用戶群體g中的用戶平均使用收益得到用戶群體g在時間段t使 用業(yè)務b的群體收益特征E (g,t,b),具體為:
[0047] 其中,G為一個用戶群體中用戶的集合;
[0048] (3-4)利用用戶群體中用戶的影響收益因素特征數(shù)據(jù)與使用收益特征數(shù)據(jù)建立用 戶群體g的收益E (g,t,b)隨時間t、用戶群體使用頻率UC影響的用戶群體動態(tài)收益模型, 所述用戶群體動態(tài)收益模型為回歸模型,訓練后得到用戶群體g在時間段t使用業(yè)務b的 動態(tài)收益C d (g,t,b),具體為:
[0049] Cd (g, t, b) = fd(t, UC)
[0050] 其中,fd( ·)為動態(tài)收益的回歸模型函數(shù);
[0051] (3-5)使用用戶群體動態(tài)收益Cd (g,t,b)與用戶綜合靜態(tài)收益Cs (u,t,b),估計用 戶群體g在時間段t使用業(yè)務b的綜合收益Csd (g,t,b),具體為:
[0053] 按照本發(fā)明的另一方面,還提供了一種移動通信新業(yè)務沖擊預測系統(tǒng),包括數(shù)據(jù) 特征提取模塊、用戶靜態(tài)收益訓練模塊、用戶群體動態(tài)收益訓練模塊、用戶新業(yè)務使用預測 模塊、群體用戶新業(yè)務使用預測模塊和群體用戶業(yè)務長期使用預測模塊,其中:
[0054] 所述數(shù)據(jù)特征提取模塊,用于從用戶使用業(yè)務記錄數(shù)據(jù)與運營商統(tǒng)計數(shù)據(jù)中提取 出對于每個用戶u在時間段t內(nèi)使用業(yè)務b的影響收益因素特征數(shù)據(jù)以及使用收益特征數(shù) 據(jù)E (u,t,b),影響收益因素特征數(shù)據(jù)包括業(yè)務技術因素特征集TE、業(yè)務服務能力因素特征 集B0、業(yè)務交互因素特征集ITR、