基于鄰近海量數(shù)據(jù)快速分析的電信套餐優(yōu)化系統(tǒng)與方法
【專利摘要】本發(fā)明公開了基于鄰近海量數(shù)據(jù)快速分析的電信套餐優(yōu)化系統(tǒng)與方法,系統(tǒng)包括參數(shù)輸入模塊,參數(shù)輸入模塊將參數(shù)信息分別傳輸給數(shù)據(jù)生成模塊和套餐優(yōu)化模塊,數(shù)據(jù)生成模塊將數(shù)據(jù)傳輸給套餐優(yōu)化模塊,參數(shù)輸入模塊和數(shù)據(jù)生成模塊均從客戶信息數(shù)據(jù)庫中提取數(shù)據(jù);套餐優(yōu)化模塊用于根據(jù)參考歷史數(shù)據(jù)、目標歷史數(shù)據(jù)以及參數(shù)設置進行套餐優(yōu)化;所述進化算法模塊用于根據(jù)適應值不斷產(chǎn)生新的可行套餐并對套餐進行優(yōu)化;所述套餐適應值評估模塊采用基于鄰近數(shù)據(jù)的快速分析法,用于評價每一款可行套餐的好壞;所述相似度計算模塊用于度量兩個向量之間的向量相似度。本發(fā)明能夠實現(xiàn)對海量電信數(shù)據(jù)的自動化高速處理,得到與目標用戶群體需求高度匹配的套餐方案。
【專利說明】基于鄰近海量數(shù)據(jù)快速分析的電信套餐優(yōu)化系統(tǒng)與方法
【技術領域】
[0001]本發(fā)明涉及電信技術以及數(shù)據(jù)挖掘領域,具體的講,涉及基于鄰近海量數(shù)據(jù)快速分析的電信套餐優(yōu)化系統(tǒng)與方法。
【背景技術】
[0002]電信行業(yè)在國民經(jīng)濟中占有重要地位,并且滲透到人們生活的方方面面。一方面,電信運營商在推出新業(yè)務套餐時,不同的用戶群體具有不同的需求,導致用戶需求的多樣性和復雜性。另一方面,由于電信運營商的高滲透率以及信息交換與采集的高頻繁度,其擁有的數(shù)據(jù)量極為龐大。電信運營商擁有海量的用戶數(shù)據(jù)、信令數(shù)據(jù)、日志數(shù)據(jù)、流量數(shù)據(jù)、位置數(shù)據(jù)等。因此,急需一種自動化的優(yōu)化設計技術,使得可以根據(jù)已有的海量數(shù)據(jù),針對目標用戶群生成具有針對性的可靠的套餐組合。
[0003]然而,由于電信數(shù)據(jù)的數(shù)據(jù)量龐大、數(shù)據(jù)關系復雜、數(shù)據(jù)屬性多樣化,數(shù)據(jù)之間的隱含關系難以通過常規(guī)技術發(fā)現(xiàn)。此外,海量數(shù)據(jù)帶來的嚴重弊端是,其建模與仿真的時間復雜度較高,運算時間很長,在有限的時間內難以得到令人滿意的結果。目前基于復雜算法的建模方法因其高時間復雜度,難以被直接應用到套餐優(yōu)化;而人工分析法、基于線性回歸法與指數(shù)平滑法等簡單模型得到的結果則與用戶群體需求的匹配度不高。
[0004]因此,需要解決的問題是如何對海量電信數(shù)據(jù)進行快速分析處理,才能最短的時間內實現(xiàn)套餐的優(yōu)化設計,并得到與目標用戶群體需求高度匹配的可靠的套餐方案。
【發(fā)明內容】
[0005]本發(fā)明的目的就是為了解決上述問題,提供一種基于鄰近海量數(shù)據(jù)快速分析的電信套餐優(yōu)化系統(tǒng)與方法,它具有能夠實現(xiàn)對海量電信數(shù)據(jù)的自動化高速處理,得到與目標用戶群體需求高度匹配的套餐方案,避免因采用復雜模型來建模海量數(shù)據(jù)所引起的高時間復雜度難題,并提高優(yōu)化結果的可靠性優(yōu)點。
[0006]為了實現(xiàn)上述目的,本發(fā)明采用如下技術方案:
[0007]基于鄰近海量數(shù)據(jù)快速分析的電信套餐優(yōu)化系統(tǒng),包括
[0008]參數(shù)輸入模塊,所述參數(shù)輸入模塊將參數(shù)信息分別傳輸給數(shù)據(jù)生成模塊和套餐優(yōu)化模塊,所述數(shù)據(jù)生成模塊將數(shù)據(jù)傳輸給套餐優(yōu)化模塊,所述參數(shù)輸入模塊和數(shù)據(jù)生成模塊均從數(shù)據(jù)庫中提取數(shù)據(jù);
[0009]所述參數(shù)輸入模塊用于接收、存儲及傳輸使用者輸入的參數(shù);
[0010]所述數(shù)據(jù)生成模塊用于生成進行套餐優(yōu)化所必需的參考歷史數(shù)據(jù)和目標歷史數(shù)據(jù);
[0011]所述套餐優(yōu)化模塊用于根據(jù)參考歷史數(shù)據(jù)、目標歷史數(shù)據(jù)以及參數(shù)設置進行套餐優(yōu)化;
[0012]所述套餐優(yōu)化模塊包括彼此通信的進化算法模塊和套餐適應值評估模塊,所述套餐適應值評估模塊內包括相似度計算模塊;[0013]所述進化算法模塊用于根據(jù)適應值不斷產(chǎn)生新的可行套餐并對套餐進行優(yōu)化;
[0014]所述套餐適應值評估模塊用于評價每一款可行套餐的好壞;所述套餐適應值評估模塊采用基于鄰近數(shù)據(jù)的快速分析法,通過向量相似度測量篩選參考用戶來預測目標用戶接收可行套餐的概率,從而實現(xiàn)對用戶套餐選擇概率的快速分析;
[0015]所述相似度計算模塊用于度量兩個向量之間的向量相似度。
[0016]所述參數(shù)輸入模塊包括目標用戶選擇模塊、數(shù)據(jù)參數(shù)輸入模塊和算法參數(shù)輸入模塊;
[0017]所述目標用戶選擇模塊用于接收、存儲及傳輸系統(tǒng)使用者從數(shù)據(jù)庫中選擇的代表性目標用戶;
[0018]所述數(shù)據(jù)參數(shù)輸入模塊,用于接受、存儲及傳輸系統(tǒng)使用者設置的時間長度及數(shù)據(jù)大??;
[0019]所述算法參數(shù)輸入模塊,用于接受、存儲及傳輸系統(tǒng)使用者設置的進化算法參數(shù)及套餐。
[0020]所述數(shù)據(jù)生成模塊包括參考歷史數(shù)據(jù)生成模塊、目標歷史數(shù)據(jù)生成模塊和特征向量提取模塊。
[0021]所述參考歷史數(shù)據(jù)生成模塊用于接收參數(shù)輸入模塊傳輸來的參數(shù),生成并傳輸參考歷史數(shù)據(jù)。
[0022]所述目標歷史數(shù)據(jù)生成模塊用于接收參數(shù)輸入模塊傳輸來的參數(shù),生成并傳輸目標歷史數(shù)據(jù)。
[0023]所述特征向量提取模塊,接收參考歷史數(shù)據(jù)生成模塊和目標歷史數(shù)據(jù)生成模塊的數(shù)據(jù),用于從客戶信息數(shù)據(jù)庫中提取特征向量。
[0024]所述參數(shù)輸入模塊允許是計算機、手機、平板電腦和掌上上網(wǎng)設備。
[0025]所述數(shù)據(jù)庫中存儲有用戶數(shù)據(jù)信息、套餐數(shù)據(jù)信息。
[0026]基于鄰近海量數(shù)據(jù)快速分析的電信套餐優(yōu)化系統(tǒng)的工作方法,包括如下步驟:
[0027]步驟(I):通過輸入設備輸入數(shù)據(jù)參數(shù)和算法參數(shù),根據(jù)目標用戶群體選定代表性目標用戶、設定套餐的搜索范圍、設定時間長度、設定參考數(shù)據(jù)大小、設定進化算法的計算參數(shù);所述輸入設備包括計算機、手機、平板電腦和掌上上網(wǎng)設備;
[0028]步驟(2):根據(jù)步驟(I)中選定的代表性目標用戶,計算機以應用時間點之前設定時間長度內的用戶數(shù)據(jù)及其對應的套餐數(shù)據(jù)形成原始目標數(shù)據(jù);計算機進一步針對原始目標數(shù)據(jù),提取每個用戶特征向量,形成目標歷史數(shù)據(jù);
[0029]步驟(3):根據(jù)步驟(I)中設定的參考數(shù)據(jù)大小,計算機隨機地從整個數(shù)據(jù)庫范圍內提取距離應用時間點之前設定時間長度內的用戶數(shù)據(jù)及其對應的套餐數(shù)據(jù)作為參考,形成原始參考數(shù)據(jù);計算機進一步針對原始參考數(shù)據(jù),提取每個用戶特征向量,形成參考歷史數(shù)據(jù);
[0030]步驟(4):第一步,計算機首先對進化算法的種群進行初始化;第二步,對當前種群中的所有個體執(zhí)行適應值評估來評價每一款可行套餐的好壞,其中采用相似度測量發(fā)現(xiàn)鄰近數(shù)據(jù)來預測用戶接收可行套餐的概率并據(jù)此進一步計算可行套餐的適應值;第三步,基于得到的適應值,根據(jù)進化算法中的種群更新策略對種群進行更新;第四步,返回第二步繼續(xù)執(zhí)行,直到尋找到一款使得適應值針對目標用戶群體達到最大值的套餐方案。[0031]所述步驟(1)所提及的套餐搜索范圍包括套餐配置中各個項的期望范圍、及套餐資費的期望范圍。
[0032]所述步驟(2)和步驟(3)所提及的用戶特征向量均由用戶月度通信習慣、用戶月度消費、用戶所用套餐配置、用戶所用套餐資費組成;
[0033]所述用戶月度通信習慣是用戶按月統(tǒng)計的特征,包括用戶月均通話時長、用戶月均短信數(shù)目、用戶月均上網(wǎng)流量;
[0034]所述用戶所用套餐配置特征為套餐中包含的各個項的配置情況,包括月通話時長、月短信數(shù)目、月上網(wǎng)流量。
[0035]所述步驟(2)和步驟(3)的各特征向量在提取時需進行標準化。
[0036]所述步驟(1)和步驟(4)的進化算法包括進化計算家族的各種優(yōu)化算法,包括遺傳算法、粒子群算法、分布式估計算法等。
[0037]所述步驟(4)包括如下步驟:
[0038]步驟Al:隨機初始化進化算法的種群,種群中每一個體對應一個可行套餐;
[0039]步驟A2:計算每一個可行套餐的適應值;
[0040]步驟A3:根據(jù)當前采用的進化算法中的種群更新策略重新生成新的可行套餐種群;
[0041]步驟A4:若滿足結束條件則退出并輸出最優(yōu)套餐方案;否則返回步驟A2 ;
[0042]所述步驟A2包括如下步驟:
[0043]步驟B1:針對每一個目標用戶,執(zhí)行下述步驟:
[0044]B1.1:計算參考數(shù)據(jù)中通信習慣、月度消費形成的向量和該目標用戶的通信習慣、月度消費形成的向量之間的向量相似度;篩選出相似度優(yōu)于設定閾值的參考用戶記錄,并記錄下篩選后的參考用戶的記錄數(shù)M ;
[0045]B1.2:計算篩選后數(shù)據(jù)中所有所用套餐配置、所用套餐資費形成的向量與當前可行套餐的套餐配置、套餐資費形成的向量之間的向量相似度;從M條記錄范圍中篩選出相似度優(yōu)于設定閾值的參考用戶記錄,記錄篩選后的記錄數(shù)N;
[0046]B1.3:計算N/M作為該目標用戶使用該可行套餐的概率P。
[0047]步驟B2:匯總每個目標用戶使用該可行套餐的概率。將每個目標用戶使用該款套餐的概率乘以每個目標用戶的月均花費C,然后針對所有目標用戶進行求和,得到并返回該可行套餐的適應值。設目標用戶數(shù)為TDN,則適應值計算公式如下:
【權利要求】
1.基于鄰近海量數(shù)據(jù)快速分析的電信套餐優(yōu)化系統(tǒng),其特征是,包括 參數(shù)輸入模塊,所述參數(shù)輸入模塊將參數(shù)信息分別傳輸給數(shù)據(jù)生成模塊和套餐優(yōu)化模塊,所述數(shù)據(jù)生成模塊將數(shù)據(jù)傳輸給套餐優(yōu)化模塊,所述參數(shù)輸入模塊和數(shù)據(jù)生成模塊均從數(shù)據(jù)庫中提取數(shù)據(jù); 所述參數(shù)輸入模塊用于接收、存儲及傳輸用戶輸入的參數(shù); 所述數(shù)據(jù)生成模塊用于生成進行套餐優(yōu)化所必需的參考歷史數(shù)據(jù)和目標歷史數(shù)據(jù); 所述套餐優(yōu)化模塊用于根據(jù)參考歷史數(shù)據(jù)、目標歷史數(shù)據(jù)以及參數(shù)設置進行套餐優(yōu)化; 所述套餐優(yōu)化模塊包括彼此通信的進化算法模塊和套餐適應值評估模塊,所述套餐適應值評估模塊內包括相似度計算模塊; 所述進化算法模塊用于根據(jù)適應值不斷產(chǎn)生新的可行套餐并對套餐進行優(yōu)化; 所述套餐適應值評估模塊用于評價每一款可行套餐的好壞;所述套餐適應值評估模塊采用基于鄰近數(shù)據(jù)的快速分析法,通過向量相似度測量篩選參考用戶來預測目標用戶接收可行套餐的概率,從而實現(xiàn)對用戶套餐選擇概率的快速分析; 所述相似度計算模塊用于度量兩個向量之間的向量相似度。
2.如權利要求1所述的基于鄰近海量數(shù)據(jù)快速分析的電信套餐優(yōu)化系統(tǒng),其特征是, 所述參數(shù)輸入模塊包括目標用戶選擇模塊、數(shù)據(jù)參數(shù)輸入模塊和算法參數(shù)輸入模塊; 所述目標用戶選擇模塊用于接收、存儲及傳輸系統(tǒng)使用者從數(shù)據(jù)庫中選擇的代表性目標用戶; 所述數(shù)據(jù)參數(shù)輸入模塊,用于接受、存儲及傳輸系統(tǒng)使用者設置的時間長度及數(shù)據(jù)大小; 所述算法參數(shù)輸入模塊,用于接受、存儲及傳輸系統(tǒng)使用者設置的進化算法參數(shù)及套餐。
3.如權利要求1所述的基于鄰近海量數(shù)據(jù)快速分析的電信套餐優(yōu)化系統(tǒng),其特征是, 所述數(shù)據(jù)生成模塊包括參考歷史數(shù)據(jù)生成模塊、目標歷史數(shù)據(jù)生成模塊和特征向量提取豐吳塊; 所述參考歷史數(shù)據(jù)生成模塊用于接收參數(shù)輸入模塊傳輸來的參數(shù),生成并傳輸參考歷史數(shù)據(jù); 所述目標歷史數(shù)據(jù)生成模塊用于接收參數(shù)輸入模塊傳輸來的參數(shù),生成并傳輸目標歷史數(shù)據(jù); 所述特征向量提取模塊,接收參考歷史數(shù)據(jù)生成模塊和目標歷史數(shù)據(jù)生成模塊的數(shù)據(jù),用于從客戶信息數(shù)據(jù)庫中提取特征向量。
4.如權利要求1所述的基于鄰近海量數(shù)據(jù)快速分析的電信套餐優(yōu)化系統(tǒng),其特征是, 所述參數(shù)輸入模塊允許是計算機、手機、平板電腦和掌上上網(wǎng)設備。
5.如權利要求1所述的基于鄰近海量數(shù)據(jù)快速分析的電信套餐優(yōu)化系統(tǒng),其特征是, 所述數(shù)據(jù)庫存儲有用戶數(shù)據(jù)信息、套餐數(shù)據(jù)信息。
6.如上述任一權利要求所述的基于鄰近海量數(shù)據(jù)快速分析的電信套餐優(yōu)化系統(tǒng)的工作方法,其特征是,包括如下步驟: 步驟(1):通過輸入設備輸入數(shù)據(jù)參數(shù)和算法參數(shù),根據(jù)目標用戶群體選定代表性目標用戶、設定套餐的搜索范圍、設定時間長度、設定參考數(shù)據(jù)大小、設定進化算法的計算參數(shù);所述輸入設備包括計算機、手機、平板電腦和掌上上網(wǎng)設備; 步驟(2):根據(jù)步驟(1)中選定的代表性目標用戶,計算機以應用時間點之前設定時間長度內的用戶數(shù)據(jù)及其對應的套餐數(shù)據(jù)形成原始目標數(shù)據(jù);計算機進一步針對原始目標數(shù)據(jù),提取每個用戶特征向量,形成目標歷史數(shù)據(jù); 步驟(3):根據(jù)步驟(1)中設定的參考數(shù)據(jù)大小,計算機隨機地從整個數(shù)據(jù)庫范圍內提取距離應用時間點之前設定時間長度內的用戶數(shù)據(jù)及其對應的套餐數(shù)據(jù)作為參考,形成原始參考數(shù)據(jù);計算機進一步針對原始參考數(shù)據(jù),提取每個用戶特征向量,形成參考歷史數(shù)據(jù); 步驟(4): 第一步,計算機首先對進化算法的種群進行初始化; 第二步,對當前種群中的所有個體執(zhí)行適應值評估來評價每一款可行套餐的好壞,其中采用相似度測量發(fā)現(xiàn)鄰近數(shù)據(jù)來預測用戶接收可行套餐的概率并據(jù)此進一步計算可行套餐的適應值; 第三步,基于得到的適應值,根據(jù)進化算法中的種群更新策略對種群進行更新; 第四步,返回第二步繼續(xù)執(zhí)行,直到尋找到一款使得適應值針對目標用戶群體達到最大值的套餐方案。
7.如權利要求6所述的 方法,其特征是, 所述步驟(1)所提及的套餐搜索范圍包括套餐配置中各個項的期望范圍、及套餐資費的期望范圍; 所述步驟(2)和步驟(3)的各特征向量在提取時需進行標準化; 所述步驟(1)和步驟(4)的進化算法包括進化計算家族的各種優(yōu)化算法。
8.如權利要求6所述的方法,其特征是, 所述步驟(2)和步驟(3)所提及的用戶特征向量均由用戶月度通信習慣、用戶月度消費、用戶所用套餐配置、用戶所用套餐資費組成; 所述用戶月度通信習慣是用戶按月統(tǒng)計的特征,包括用戶月均通話時長、用戶月均短信數(shù)目、用戶月均上網(wǎng)流量; 所述用戶所用套餐配置特征為套餐中包含的各個項的配置情況,包括月通話時長、月短信數(shù)目、月上網(wǎng)流量。
9.如權利要求6所述的方法,其特征是, 所述步驟(4)包括如下步驟: 步驟Al:隨機初始化進化算法的種群,種群中每一個體對應一個可行套餐; 步驟A2:計算每一個可行套餐的適應值; 步驟A3:根據(jù)當前采用的進化算法中的種群更新策略重新生成新的可行套餐種群; 步驟A4:若滿足結束條件則退出并輸出最優(yōu)套餐方案;否則返回步驟A2。
10.如權利要求9所述的方法,其特征是, 所述步驟A2包括如下步驟: 步驟B1:針對每一個目標用戶,執(zhí)行下述步驟: B1.1:計算參考數(shù)據(jù)中通信習慣、月度消費形成的向量和該目標用戶的通信習慣、月度消費形成的向量之間的向量相似度;篩選出相似度優(yōu)于設定閾值的參考用戶記錄,并記錄下篩選后的參考用戶的記錄數(shù)M ; B1.2:計算篩選后數(shù)據(jù)中所有所用套餐配置、所用套餐資費形成的向量與當前可行套餐的套餐配置、套餐資費形成的向量之間的向量相似度;從M條記錄范圍中篩選出相似度優(yōu)于設定閾值的參考用戶記錄,記錄篩選后的記錄數(shù)N ; B1.3:計算N/M作為該目標用戶使用該可行套餐的概率P ; 步驟B2:匯總每個目標用戶使用該可行套餐的概率;將每個目標用戶使用該款套餐的概率乘以每個目標用戶的月均花費C,然后針對所有目標用戶進行求和,得到并返回該可行套餐的適應值;設目標用戶數(shù)為TDN,則適應值計算公式如下:
【文檔編號】G06F17/30GK103793513SQ201410046626
【公開日】2014年5月14日 申請日期:2014年2月10日 優(yōu)先權日:2014年2月10日
【發(fā)明者】王琳, 楊波 申請人:濟南大學