背景技術:
數(shù)據(jù)處理是指用適當?shù)慕y(tǒng)計分析方法對收集來的大量數(shù)據(jù)進行分析總結,提取有用信息和形成結論而對數(shù)據(jù)加以詳細研究和概括總結的過程。這一過程也是質(zhì)量管理體系的支持過程。在實用中,數(shù)據(jù)的分析處理可幫助人們作出判斷,以便采取適當行動。數(shù)據(jù)分析處理的數(shù)學基礎在20世紀早期就已確立,但直到計算機的出現(xiàn)才使得實際操作成為可能,并使得數(shù)據(jù)分析得以推廣。數(shù)據(jù)分析是數(shù)學與計算機科學相結合的產(chǎn)物。
數(shù)據(jù)多樣化的形成主要有兩方面的原因:一是數(shù)據(jù)來源多,有搜索引擎、社交網(wǎng)絡、通話記錄、傳感器等等;二是數(shù)據(jù)格式多,有結構數(shù)據(jù)、半結構數(shù)據(jù)和非結構數(shù)據(jù)。據(jù)相關數(shù)據(jù)統(tǒng)計,每秒鐘人們發(fā)送290封電子郵件;亞馬遜處理72.9筆訂單;每分鐘人們在You Tube上傳20小時的視頻;每月人們總共在facebook上瀏覽7000億分鐘。
目前的數(shù)據(jù)分析處理面臨的問題是數(shù)據(jù)量大、多種結構形式和實時性等多樣化要求,這些問題增加了數(shù)據(jù)分析和整合困難,傳統(tǒng)數(shù)據(jù)分析處理系統(tǒng)的架構設計結構復雜、效率低、針對性不強。
技術實現(xiàn)要素:
本發(fā)明的目的是克服現(xiàn)有技術的不足,提供一種一種數(shù)據(jù)分析處理系統(tǒng),該系統(tǒng)可以對數(shù)據(jù)進行針對性采集和整合,結構簡單、目的性強。
一種數(shù)據(jù)分析處理系統(tǒng),包括信息系統(tǒng)、數(shù)據(jù)挖掘應用服務器和行業(yè)客戶端;所述信息系統(tǒng)用于收集和處理用戶預設條件的行業(yè)數(shù)據(jù),并通過總線接入該系統(tǒng)中;所述數(shù)據(jù)挖掘應用服務器用于針對用戶所預設的行業(yè)數(shù)據(jù)進行數(shù)據(jù)抽取、轉換和裝載,并將數(shù)據(jù)挖掘結果導入行業(yè)客戶端;數(shù)據(jù)挖掘應用服務器包括探索數(shù)據(jù)倉庫、數(shù)據(jù)挖掘算法庫、模型庫和組件庫;所述探索數(shù)據(jù)倉庫用于讀取并儲存信息系統(tǒng)中的數(shù)據(jù);所述模型庫用于存儲各種計算模型和算法公式;所述組件庫用于儲存不同行業(yè)的客戶劃分資料、客戶流失資料和客戶產(chǎn)品資料;所述數(shù)據(jù)挖掘算法庫用于根據(jù)模型庫、探索數(shù)據(jù)倉庫和組件庫的信息對數(shù)據(jù)進行挖掘計算并將計算結果導入行業(yè)客戶端。所述行業(yè)客戶端用于為用戶提供分析處理后的最終數(shù)據(jù)。用戶可以根據(jù)自身需要預設不同的行業(yè)數(shù)據(jù),如銀行數(shù)據(jù)、基因序列、金融控制等,數(shù)據(jù)挖掘應用服務器再根據(jù)用戶的預設條件進行針對性分析處理,結構簡單、目的明確、效率高;另外,數(shù)據(jù)挖掘算法庫采用統(tǒng)計分析、決策樹、粗糙集、模糊集、基于范例的理、神經(jīng)網(wǎng)絡等數(shù)據(jù)挖掘方法對信息數(shù)據(jù)集中的海量數(shù)據(jù)進行分析、處理、推理、預測、最終根據(jù)用戶設定的條件,實現(xiàn)最優(yōu)方案的自動推送。
進一步地,所述信息系統(tǒng)包括管理信息系統(tǒng)、企業(yè)資源計劃系統(tǒng)、客戶關系管理系統(tǒng)和電子商務系統(tǒng);管理信息系統(tǒng)、企業(yè)資源計劃系統(tǒng)、客戶關系管理系統(tǒng)和電子商務系統(tǒng)均通過總線將數(shù)據(jù)傳送到所述數(shù)據(jù)挖掘應用服務器的探索數(shù)據(jù)倉庫。
進一步地,所述行業(yè)客戶端包括客戶應用端和知識儲存端;所述知識儲存端用于接收所述數(shù)據(jù)挖掘算法庫導入的數(shù)據(jù)并儲存;所述行業(yè)客戶端用于讀取知識儲存端的數(shù)據(jù)并供客戶查詢。
本發(fā)明的有益效果在于:用戶可以根據(jù)自身需要預設不同的行業(yè)數(shù)據(jù),數(shù)據(jù)挖掘應用服務器再根據(jù)用戶的預設條件進行針對性分析處理,結構簡單、目的明確、效率高;數(shù)據(jù)挖掘算法庫采用統(tǒng)計分析、決策樹、粗糙集、模糊集、基于范例的理、神經(jīng)網(wǎng)絡等數(shù)據(jù)挖掘方法對信息數(shù)據(jù)集中的海量數(shù)據(jù)進行分析、處理、推理、預測、最終根據(jù)用戶設定的條件,實現(xiàn)最優(yōu)方案的自動推送。
附圖說明
此處所說明的附圖用來提供對本發(fā)明實施例的進一步理解,構成本申請的一部分,并不構成對本發(fā)明實施例的限定。在附圖中:
圖1為本發(fā)明的結構示意圖。
具體實施方式
為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚明白,下面結合實施例和附圖,對本發(fā)明作進一步的詳細說明,本發(fā)明的示意性實施方式及其說明僅用于解釋本發(fā)明,并不作為對本發(fā)明的限定。
實施例1
如圖1所示,本實施例提供一種數(shù)據(jù)分析處理系統(tǒng),包括信息系統(tǒng)、數(shù)據(jù)挖掘應用服務器和行業(yè)客戶端;信息系統(tǒng)用于收集和處理用戶預設條件的行業(yè)數(shù)據(jù),并通過總線接入該系統(tǒng)中;數(shù)據(jù)挖掘應用服務器用于針對用戶所預設的行業(yè)數(shù)據(jù)進行數(shù)據(jù)抽取、轉換和裝載,并將數(shù)據(jù)挖掘結果導入行業(yè)客戶端;行業(yè)客戶端用于為用戶提供分析處理后的最終數(shù)據(jù)。
本實施例中,信息系統(tǒng)包括管理信息系統(tǒng)、企業(yè)資源計劃系統(tǒng)、客戶關系管理系統(tǒng)和電子商務系統(tǒng);數(shù)據(jù)挖掘應用服務器包括探索數(shù)據(jù)倉庫、數(shù)據(jù)挖掘算法庫、模型庫和組件庫;行業(yè)客戶端包括客戶應用端和知識儲存端。
探索數(shù)據(jù)倉庫用于讀取所述管理信息系統(tǒng)、企業(yè)資源計劃系統(tǒng)、客戶關系管理系統(tǒng)和電子商務系統(tǒng)中的數(shù)據(jù);模型庫用于存儲各種計算模型和算法公式;組件庫用于儲存不同行業(yè)的客戶劃分資料、客戶流失資料和客戶產(chǎn)品資料數(shù)據(jù);挖掘算法庫用于根據(jù)模型庫、組件庫和探索數(shù)據(jù)倉庫的信息對數(shù)據(jù)進行挖掘計算并將計算結果導入行業(yè)客戶端;知識儲存端用于接收所述數(shù)據(jù)挖掘算法庫導入的數(shù)據(jù)并儲存;行業(yè)客戶端用于讀取知識儲存端的數(shù)據(jù)并供客戶查詢。
以上所述的具體實施方式,對本發(fā)明的目的、技術方案和有益效果進行了進一步詳細說明,所應理解的是,以上所述僅為本發(fā)明的具體實施方式而已,并不用于限定本發(fā)明的保護范圍,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。