本發(fā)明涉及一種基于大數(shù)據(jù)的預(yù)測(cè)系統(tǒng)模型與算法,設(shè)計(jì)一種新的模型參數(shù)選擇準(zhǔn)則,從而提高預(yù)測(cè)處理的精度與泛化性,從而更好地讓企業(yè)進(jìn)行客戶管理。
背景技術(shù):
隨著信息時(shí)代的到來(lái),大數(shù)據(jù)分析已成為各個(gè)領(lǐng)域愈來(lái)愈重視與依賴的技術(shù)手段。大數(shù)據(jù)分析主要包括可視化分析、數(shù)據(jù)挖掘算法、預(yù)測(cè)分析以及數(shù)據(jù)質(zhì)量管理4個(gè)方面。其中,從大量數(shù)據(jù)中提取人們事先不知道的潛在有用信息從而預(yù)測(cè)事物未來(lái)的發(fā)展趨勢(shì)在宏觀的經(jīng)濟(jì)預(yù)測(cè)、市場(chǎng)營(yíng)銷、客流量分析、太陽(yáng)黑子數(shù)、月降水量、河流流量、股票價(jià)格變動(dòng)等眾多領(lǐng)域得到應(yīng)用。
目前,企業(yè)的觀念正逐漸變成以客戶為中心,為客戶提供有針對(duì)性的營(yíng)銷和服務(wù)變得越來(lái)越重要。特別是隨著網(wǎng)絡(luò)通訊的迅猛發(fā)展,企業(yè)可收集海量的關(guān)于客戶的信息和數(shù)據(jù),應(yīng)用這些數(shù)據(jù)去獲得有價(jià)值的信息,以對(duì)客戶購(gòu)買行為預(yù)測(cè),進(jìn)而對(duì)客戶關(guān)系管理都是企業(yè)急需攻克的難題。
大數(shù)據(jù)環(huán)境下,隨著企業(yè)間的競(jìng)爭(zhēng)加劇,企業(yè)越來(lái)越意識(shí)到客戶購(gòu)買行為預(yù)測(cè)的重要性。速鴻科技選擇利用改進(jìn)的決策樹(shù)模型對(duì)客戶購(gòu)買行為進(jìn)行預(yù)測(cè),進(jìn)而探索大數(shù)據(jù)環(huán)境下的客戶管理,這無(wú)論對(duì)于企業(yè)還是社會(huì)都有十分重要的意義。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種基于大數(shù)據(jù)的預(yù)測(cè)系統(tǒng)模型與算法,不只是局限于單純的分析客戶購(gòu)買行為方面,而是對(duì)客戶的各方面的信息進(jìn)行分析,然后對(duì)客戶進(jìn)行分類,以幫助企業(yè)對(duì)客戶的購(gòu)買行為進(jìn)行預(yù)測(cè),能更好,更實(shí)際的處理問(wèn)題。
為了實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下。
基于大數(shù)據(jù)的預(yù)測(cè)系統(tǒng)模型與算法,包括以下步驟。
(1)基于id3的決策樹(shù)模型構(gòu)建。建立一個(gè)樣本數(shù)據(jù)集,通過(guò)一定的方法,把這些數(shù)據(jù)有效的分類出來(lái),這里要用到信息熵這個(gè)概念,最終得到各個(gè)屬性的信息增益,將信息增益最大的作為根節(jié)點(diǎn)進(jìn)行分類。
(2)算法的優(yōu)化及優(yōu)化前后效果比較。id3算法只能從局部最優(yōu)來(lái)考慮,只會(huì)考慮每一步下的最優(yōu)情況。但是,因?yàn)楹芏嘣?,例如噪音?shù)據(jù)的影響等,往往不能得到全局最優(yōu),所以引入了屬性核的概念來(lái)考慮優(yōu)化問(wèn)題。比較可以發(fā)現(xiàn),利用id3算法做出的決策樹(shù)模型會(huì)有一個(gè)很明顯的缺陷,那就是做出的決策樹(shù)一般高度很大,但是寬度很小,這樣會(huì)讓決策樹(shù)變得非常的繁雜,而且解讀起來(lái)也很困難。但是優(yōu)化后算法做出的決策樹(shù)兼顧到了決策樹(shù)的高度和決策樹(shù)的深度,這樣能讓使用者更好的理解和解讀決策樹(shù)的結(jié)果,因而更能滿足企業(yè)對(duì)客戶的購(gòu)買行為進(jìn)行預(yù)測(cè)的現(xiàn)實(shí)需要。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果。
(1)本系統(tǒng)可以通過(guò)決策樹(shù)模型做出對(duì)客戶購(gòu)買行為的預(yù)測(cè),從而更好地讓企業(yè)進(jìn)行客戶管理。
(2)本系統(tǒng)可以讓決策樹(shù)模型更好更廣泛的適用于各類情況,并利用樣本數(shù)據(jù)對(duì)改進(jìn)的決策樹(shù)的算法進(jìn)行研究。
(3)本系統(tǒng)在商業(yè)上也有著巨大的應(yīng)用前景,可以通過(guò)海量數(shù)據(jù)來(lái)判斷客戶的開(kāi)戶年數(shù),進(jìn)而實(shí)現(xiàn)對(duì)客戶的放貸,融資等業(yè)務(wù)的更好的掌控。
(4)本系統(tǒng)通過(guò)大數(shù)據(jù)預(yù)測(cè)過(guò)程和引入企業(yè)營(yíng)銷者主體因素,打開(kāi)“消費(fèi)者黑箱”,最后使整個(gè)模型形成一個(gè)動(dòng)態(tài)的、互動(dòng)的自反饋系統(tǒng)。
(5)本系統(tǒng)通過(guò)案例系統(tǒng)地分析了企業(yè)通過(guò)大數(shù)據(jù)可以獲取并存儲(chǔ)客戶的個(gè)性化需求,從而重新?lián)碛幸粚?duì)一的客戶關(guān)系管理優(yōu)勢(shì),從而實(shí)現(xiàn)以客戶為中心來(lái)創(chuàng)造價(jià)值。
附圖說(shuō)明
圖1為本發(fā)明的流程圖。
圖2為結(jié)果的詳細(xì)解讀。