基于大數(shù)據(jù)回歸分析算法擴展最佳繳費渠道的方法和裝置的制造方法
【技術領域】
[0001] 本發(fā)明涉及擴展用戶最佳繳費渠道技術領域,是一種基于大數(shù)據(jù)回歸分析算法擴 展最佳繳費渠道的方法和裝置。
【背景技術】
[0002] 針對電力企業(yè)擴展最佳繳費渠道的建設,是有效提升企業(yè)優(yōu)質服務水平的重要舉 措,是加快轉變傳統(tǒng)營銷業(yè)務模式,推動企業(yè)營銷工作快速健康發(fā)展的重要方式。
[0003] 通過對電力企業(yè)管轄區(qū)域居民的海量繳費信息進行深度挖掘分析,可以了解居民 選擇日常繳費方式和繳費地點的習慣。例如:在電力營業(yè)廳,代理點,繳費終端,移動POS 機以及網絡繳費終端繳納電費。掌握各種電費繳納渠道所承載的業(yè)務量,計算用戶居住地 點與繳費網點的距離,為拓展繳費渠道提供了可靠的依據(jù)?,F(xiàn)有繳費渠道的擴展方式不規(guī) 范,只是針對簡單的繳費數(shù)據(jù)進行分析,導致現(xiàn)在的企業(yè)不能對海量數(shù)據(jù)進行快速的分析 處理,分析效率低,從而造成企業(yè)運營成本高。因此,急需一種規(guī)范、合理的擴展最佳繳費渠 道的方法。
【發(fā)明內容】
[0004] 本發(fā)明提供了一種基于大數(shù)據(jù)回歸分析算法擴展最佳繳費渠道的方法和系統(tǒng),克 服了上述現(xiàn)有技術之不足,其能有效解決現(xiàn)有繳費網點設置不合理造成因用戶繳費不方 便,以致不能及時繳費甚至長期欠繳電費的問題;根據(jù)數(shù)據(jù)回歸算法對居民繳費方式的選 擇比例數(shù)據(jù)、各繳費渠道承載業(yè)務量數(shù)據(jù)、用戶居住地點與繳費網點距離數(shù)據(jù)、區(qū)域人口密 度和各繳費渠道投資成本數(shù)據(jù)的計算分析,有效解決了電力企業(yè)現(xiàn)有技術針對海量數(shù)據(jù)分 析處理能力不夠,造成分析計算效率低,運營成本高的問題。
[0005] 本發(fā)明的技術方案之一是通過以下措施來實現(xiàn)的:一種基于大數(shù)據(jù)回歸分析算法 擴展最佳繳費渠道的方法,按照以下步驟進行: 步驟101,從大數(shù)據(jù)分布式數(shù)據(jù)庫中讀取存儲的用電單位特征數(shù)據(jù); 步驟201,在Map函數(shù)中進行數(shù)據(jù)回歸分析計算,得到多個不同用戶以數(shù)值形式存在的 繳費位置和繳費方式; 步驟301,將計算出的多個不同用戶以數(shù)值形式存在的繳費位置和繳費方式在Reduce 函數(shù)下進行數(shù)值合并歸一計算; 步驟401,通過數(shù)值歸一計算結果再計算出離差平方和Q值,將離差平方和Q值與給定 閾值進行對比,判斷離差平方和Q值是否滿足小于給定閾值; 步驟501,當離差平方和Q值小于給定閾值時,則在得出最佳繳費位置和最佳繳費方式 后結束;當離差平方和Q值大于給定閾值時,則進入步驟201再次進行回歸分析運算。
[0006] 下面是對上述發(fā)明技術方案的進一步優(yōu)化或/和改進: 上述在步驟101中,大數(shù)據(jù)分布式數(shù)據(jù)庫中的用電特征數(shù)據(jù)包括居民選擇繳費方式比 例數(shù)據(jù)、各類繳費渠道承載業(yè)務量數(shù)據(jù)、用戶居住地點與繳費網點距離數(shù)據(jù)、人口密度數(shù)據(jù) 以及各繳費渠道投資成本數(shù)據(jù)。
[0007] 上述在步驟201中,在Map函數(shù)中進行回歸分析運算,線性回歸方程通式為: Y^o+biXi+b^+baXa+··· +bkxk+u 其中,Y為因變量,即:繳費點位置或繳費方式,x :,?,?* · ·Χη為各個自變量,即:居 民選擇的繳費方式比例數(shù)據(jù)、各類繳費渠道承載業(yè)務量數(shù)據(jù)、用戶居住地點與繳費網點距 離數(shù)據(jù)、人口密度數(shù)據(jù)和各繳費渠道投資成本,b為各自變量的系數(shù),U為隨機擾動項觀測 值, 當樣本為i時,
η
[0008] 上述在步驟301中,用最小二乘法估算參數(shù)b。,!^,· · *bk,就是要選擇參數(shù) b。,!^,· · *,bk,使Y的觀測值¥1與相應函數(shù)值轉的離差平方和達到最小,即:
[0009] 本發(fā)明的技術方案之二是通過以下措施來實現(xiàn)的:一種基于大數(shù)據(jù)回歸分析算法 擴展最佳繳費渠道的裝置,包括居民繳費特征數(shù)據(jù)導入模塊、改進線性回歸分析算法并發(fā) 處理模塊和電力企業(yè)擴展繳費渠道的最佳投資分析結果輸出模塊,所述的改進線性回歸分 析算法并發(fā)處理模塊包括分布數(shù)據(jù)處理單元、回歸方程計算單元和離差平方和回歸分析計 算單元;居民繳費特征數(shù)據(jù)導入模塊實現(xiàn)用戶用電特征數(shù)據(jù)的讀取,并將數(shù)據(jù)傳輸至改進 線性回歸分析算法并發(fā)處理模塊中,改進線性回歸分析算法并發(fā)處理模塊用于將用戶用電 特征數(shù)據(jù)進行回歸分析計算,并將計算結果進行歸一后計算出離差平方和;所述的居民繳 費特征數(shù)據(jù)導入模塊的數(shù)據(jù)輸出端與分布數(shù)據(jù)處理單元的數(shù)據(jù)輸入端相連接,分布數(shù)據(jù)處 理單元的數(shù)據(jù)輸出端與回歸方程計算單元的數(shù)據(jù)輸入端相連接,回歸方程計算單元的數(shù)據(jù) 輸出端與離差平方和回歸分析計算單元的數(shù)據(jù)輸入端相連接,離差平方和回歸分析計算單 元的數(shù)據(jù)輸出端與電力企業(yè)擴展繳費渠道的最佳投資分析結果輸出模塊的數(shù)據(jù)輸入端相 連接。
[0010] 本發(fā)明利用大數(shù)據(jù)平臺進行技術改進,通過大數(shù)據(jù)處理平臺并發(fā)分析海量數(shù)據(jù), 可以通過供電單位提取5年以上的居民繳費方式信息明細數(shù)據(jù),實現(xiàn)更大的數(shù)據(jù)吞吐量, 獲取更為全面的用戶特征數(shù)據(jù)。適用于大數(shù)據(jù)平臺改進的回歸分析算法并發(fā)分析海量用戶 繳費數(shù)據(jù),分析效率更高,更加準確的統(tǒng)計出用戶繳納電費的行為習慣,實現(xiàn)電力企業(yè)擴展 繳費渠道的最佳投資分析。
【附圖說明】
[0011] 附圖1為本發(fā)明實施例一的組成原理圖。
[0012] 附圖2為本發(fā)明實施例二的使用方法流程圖。
[0013] 附圖中的編碼分別為:1為居民繳費特征數(shù)據(jù)導入模塊,2為分布數(shù)據(jù)處理單元,3 為回歸方程計算單元,4為離差平方和回歸分析計算單元,5為電力企業(yè)擴展繳費渠道的最 佳投資分析結果輸出模塊?!揪唧w實施方式】 本發(fā)明不受下述實施例的限制,可根據(jù)本發(fā)明的技術方案與實際情況來確定具體的實 施方式。
[0014] 在本發(fā)明中,為了便于描述,各部件的相對位置關系的描述均是根據(jù)說明書附圖1 的布圖方式來進行描述的,如:前、后、上、下、左、右等的位置關系是依據(jù)說明書附圖的布圖 方向來確定的。
[0015] 下面結合實施例及附圖對本發(fā)明作進一步描述: 實施例一:如附圖1所示,一種基于大數(shù)據(jù)回歸分析算法擴展最佳繳費渠道的方法,按 照以下步驟進行: 步驟101,從大數(shù)據(jù)分布式數(shù)據(jù)庫中讀取存儲的用電單位特征數(shù)據(jù);步驟201,在Map函 數(shù)中進行數(shù)據(jù)回歸分析計算,得到多個不同用戶以數(shù)值形式存在的繳費位置和繳費方式; 步驟301,將計算出的多個不同用戶以數(shù)值形式存在的繳費位置和繳費方式在Reduce函 數(shù)下進行數(shù)值合并歸一計算;步驟401,通過數(shù)值歸一計算結果計算出離差平方和Q值,將 離差平方和Q值與給定閾值進行對比,判斷離差平方和Q值是否滿足小于給定閾值;步驟 501,當離差平方和Q值小于給定閾值時,則在得出最佳繳費位置和最佳繳費方式后結束; 當離差平方和Q值大于給定閾值時,則進入步驟201再次進行回歸分析運算。MapReduce計 算模型為現(xiàn)有公知技術,由Map函數(shù)和Reduce函數(shù)組成。MapReduce計算模型程序中的輸 入、輸出和中間數(shù)據(jù)都是以鍵值對(key, value)的形式存在,本發(fā)明使用MapReduce程序來 計算回歸方程的矩陣系數(shù)和最后的離差平方和。本發(fā)明使用MapReduce計算模型改進線性 回歸分析算法并發(fā)處理大規(guī)模的用戶數(shù)據(jù),實現(xiàn)電力企業(yè)擴展繳費渠道的最佳投資分析。
[0016] 可根據(jù)實際需要,對上述基于大數(shù)據(jù)回歸分析算法擴展最佳繳費渠道的方法作進 一步優(yōu)化或/和改進: 如附圖1、2所示,在步驟101中,大數(shù)據(jù)分布式數(shù)據(jù)庫中的用電特征數(shù)據(jù)包括居民選擇 繳費方式比例數(shù)據(jù)、各類繳費渠道承載業(yè)務量數(shù)據(jù)、用戶居住地點與繳費網點距離數(shù)據(jù)、人 口密度數(shù)據(jù)以及各繳費渠道投資成本數(shù)據(jù)。
[0017] 如附圖1、2所示,在步驟201中,在Map函數(shù)中進行回歸分析運算,線性回歸方程 通式為: Y^o+biXi+b^+baXa+··· +bkxk+u 其中,Y為因變量,即:為繳費點位置或繳費方式,x i,x2, X3 ··· \為各個自變量,BP : 為居民選擇的繳費方式比例數(shù)據(jù)、各類繳費渠道承載業(yè)務量數(shù)據(jù)、用戶居住地點與繳費網 點距離數(shù)據(jù)、人口密度數(shù)據(jù)和各繳費渠道投資成本,b為各自變量的系數(shù),U為隨機擾動項 觀測值; 當樣本為i時,
[001 u」 旭過入m做Tn的Mapiteduce悮M進仃數(shù)做處埋,升田入數(shù)做TH ψ的HUFS模塊 進行分布式處理。將待處理的海量用電單位用電特征數(shù)據(jù)和