1.一種基于拓?fù)涞臄?shù)據(jù)挖掘系統(tǒng),其特征在于,包括:
多個業(yè)務(wù)處理拓?fù)?,用于不同的?shù)據(jù)挖掘處理工作,每個所述業(yè)務(wù)處理拓?fù)浒ǘ鄠€可以按預(yù)分的一項數(shù)據(jù)處理業(yè)務(wù)的步驟進(jìn)行配置并共同完成一項數(shù)據(jù)處理的數(shù)據(jù)處理模塊;
每個所述數(shù)據(jù)處理模塊包括有多個并行設(shè)置的用于并行運算處理每個數(shù)據(jù)處理模塊要處理的數(shù)據(jù)的計算單元以及與所述計算單元連接的用于實現(xiàn)所述計算單元處理后的數(shù)據(jù)在多個數(shù)據(jù)處理模塊之間進(jìn)行傳遞的數(shù)據(jù)處理中心;所述計算單元根據(jù)每個步驟中橫向劃分的用于并行處理數(shù)據(jù)的組來設(shè)置;
集群共用看板,與所述業(yè)務(wù)處理拓?fù)溥B接,記錄所述業(yè)務(wù)處理拓?fù)涞耐負(fù)湫畔ⅰ⑺鰯?shù)據(jù)處理模塊的數(shù)據(jù)處理屬性信息以及每項數(shù)據(jù)處理業(yè)務(wù)的業(yè)務(wù)處理步驟信息,對所述數(shù)據(jù)處理模塊以及計算單元的處理信息進(jìn)行配置,由所述數(shù)據(jù)處理模塊及計算單元根據(jù)配置信息進(jìn)行數(shù)據(jù)處理。
2.根據(jù)權(quán)利要求1所述基于拓?fù)涞臄?shù)據(jù)挖掘系統(tǒng),其特征在于,多個所述數(shù)據(jù)處理模塊與一項數(shù)據(jù)處理業(yè)務(wù)的多個數(shù)據(jù)處理步驟一一對應(yīng),分別完成每個數(shù)據(jù)處理步驟的數(shù)據(jù)處理工作。
3.根據(jù)權(quán)利要求1所述基于拓?fù)涞臄?shù)據(jù)挖掘系統(tǒng),其特征在于,每個所述數(shù)據(jù)處理模塊包括一套數(shù)據(jù)處理子單元,多套所述數(shù)據(jù)處理子單元可實現(xiàn)一個完整的數(shù)據(jù)處理流程。
4.根據(jù)權(quán)利要求1所述基于拓?fù)涞臄?shù)據(jù)挖掘系統(tǒng),其特征在于,所述計算單元可根據(jù)集群共用看板記錄的配置信息,在不同業(yè)務(wù)處理拓?fù)渲羞M(jìn)行處理數(shù)據(jù)。
5.根據(jù)權(quán)利要求1所述基于拓?fù)涞臄?shù)據(jù)挖掘系統(tǒng),其特征在于,所述數(shù)據(jù)處理中心使用密鑰進(jìn)行中間數(shù)據(jù)流的存儲。
6.根據(jù)權(quán)利要求1所述基于拓?fù)涞臄?shù)據(jù)挖掘系統(tǒng),其特征在于,所述計算單元在數(shù)據(jù)處理后,輸出處理結(jié)果以及標(biāo)識至相應(yīng)的數(shù)據(jù)交換中心,所述標(biāo)識用于指示下一數(shù)據(jù)處理步驟的數(shù)據(jù)交換中心的數(shù)據(jù)流名稱,供后續(xù)計算單元讀取處理相關(guān)的數(shù)據(jù)。