專利名稱:Olap系統(tǒng)維度異常聚合法的制作方法
技術領域:
本發(fā)明涉及一種OLAP系統(tǒng)維度異常聚合法,適用OLAP系統(tǒng)中指標在維度值之間非互斥時匯總時的情況,特別是生成大數(shù)據(jù)量同時有時間要求的多維分析過程中。
背景技術:
隨著各種行業(yè)的飛速發(fā)展,一些行業(yè)會積累了大量的歷史數(shù)據(jù),企業(yè)管理者已經(jīng)不滿足單純的進行業(yè)務操作甚至簡單的報表來分析,為了滿足市場的需要,他們需要從大量的歷史數(shù)據(jù)來發(fā)現(xiàn)數(shù)據(jù)的問題及規(guī)律,全方位分析數(shù)據(jù)的各種因素,達到分析的目的,至此OLAP分析應運而生。
OLAP聯(lián)機分析處理,是一種軟件技術,他使分析人員能夠迅速、一致、交互地從各個方面觀察信息,以達到深入理解數(shù)據(jù)的目的,這些信息是從原始數(shù)據(jù)直接轉換過來的,他們以用戶容易理解的方式反映企業(yè)的真實情況。
上述OLAP系統(tǒng)的缺點如下 現(xiàn)有OLAP多維分析工具在維度為非互斥下指標如果達到正確匯總,則需要事實表中提供明細的數(shù)據(jù),在OLAP工具中對該指標做排重匯總,方能得到正確的數(shù)據(jù),但是這樣,如果數(shù)據(jù)量非常大,從事實表提取數(shù)據(jù)到生成多維分析數(shù)據(jù)的時間就比較長,而對于數(shù)據(jù)倉庫及OLAP系統(tǒng),數(shù)據(jù)的及時性就很難保證。
上述缺點以移動通訊為例說明如下 因為通話客戶數(shù)中一些客戶可能會發(fā)生主叫,同時也可能發(fā)生被叫,主叫中和被叫中有同一些客戶,即維度值之間是非互斥的。此類聚集在OLAP工具中只有一種解決方案,生成的事實表數(shù)據(jù)中,帶明細的數(shù)據(jù),在得到全部通話客戶數(shù)級別的時候,做排重處理。此種方案在大量數(shù)據(jù)的情況下,生成多維分析的數(shù)據(jù)時候,生成的時間會很長,通常不能滿足要求。
發(fā)明內容
本發(fā)明所要解決的技術問題是針對上述現(xiàn)有技術中的缺點,而提供一種解決同一維度不同維度值之間的匯總,使生成多維分析數(shù)據(jù)的時間大大縮小的OLAP系統(tǒng)維度異常聚合法。
本發(fā)明解決其技術問題所采用的技術方案 本發(fā)明事先在數(shù)據(jù)庫中生成事實表的匯總數(shù)據(jù),OLAP工具的維度級別代碼指向已經(jīng)匯總好的代碼進行關聯(lián),從而達到生成正確匯總數(shù)據(jù)的要求。
本發(fā)明的方法步驟如下 (1)建立數(shù)據(jù)倉庫事實表和維表 數(shù)據(jù)倉庫中按照星型結構設計,維表的結構字段包括維度標識、維度描述兩個字段,展示數(shù)據(jù)時,事實表和維表通過維度標識字段得到前端展現(xiàn)時所要的描述; (2)數(shù)據(jù)倉庫事實表數(shù)據(jù)的生成規(guī)則 同一維度不同維度值之間的匯總,在維度值存在非互斥的情況下,在生成數(shù)據(jù)之前針對明細數(shù)據(jù)先做排重匯總,然后存儲到事實表中; (3)利用OLAP工具或自定義開發(fā)展現(xiàn)數(shù)據(jù) 當數(shù)據(jù)倉庫事實表按照上述建立并按規(guī)則生成數(shù)據(jù)后,當使用OLAP工具,則有其設置使其匯總指向一個已經(jīng)生成好的維度值,對應事實表中已排重后的數(shù)據(jù);當使用自定義界面展示時,匯總數(shù)據(jù)同樣指向數(shù)據(jù)庫中已經(jīng)生成的內容。
本發(fā)明的有益效果是徹底解決了現(xiàn)有OLAP系統(tǒng)對維度值為非互斥下指標匯總的時間過長的問題,保證了數(shù)據(jù)的及時性,并且本方法簡單易行。本方法通過在河北移動IMEI分析中的應用表明效果非常好。
具體實施例方式 現(xiàn)以移動通訊為例舉例說明如下 (1)建立數(shù)據(jù)倉庫事實表和維表 數(shù)據(jù)倉庫中按照星型結構設計,在本實施例中有一張事實表(見附表1),一張維表(見附表2); 事實表和維表通過CALL_TYPE_ID得到前端展現(xiàn)的描述。
(2)數(shù)據(jù)庫事實表數(shù)據(jù)的生成規(guī)則(見附表3) 從附表3內容得到2008年7月主叫通話客戶數(shù)為1000;被叫通話用戶數(shù)為1500,如果在BI工具中展現(xiàn),則展現(xiàn)為自動求和或其他計算方式。而主叫通話客戶數(shù)和被叫通話客戶數(shù)中有一部分用戶是重的,所以這種情況下做統(tǒng)計,需要把用戶主叫被叫的記錄排重得到全部的通話用戶數(shù),然后放入事實表,同時對全部通話類型進行編碼為A(自定義)。
(3)利用OLAP工具或自定義開發(fā)展現(xiàn)數(shù)據(jù) 當事實表按照上述建立并按規(guī)則生成數(shù)據(jù)后,當使用目前的OLAP工具,則有其設置使其“全部通話類型”這樣的匯總類型指向一個維度值,對應本例為通話類型中的A。當使用自定義界面展示時,在維度中的全部通話類型提取的指標數(shù)據(jù)是對應的A;即即附表3中的第三條記錄。
附表1(事實表) 邏輯結構 物理結構 通話客戶數(shù)事實表TB_OLP_CALL_PERSON 附表2(維表) 邏輯結構物理結構 通話類型 TB_CDE_CALL_TYPE 附表3(通話類型O主叫;T被叫;A全部通話類型)
權利要求
1、OLAP系統(tǒng)維度異常聚合法,其特征在于其方法步驟如下
(1)建立數(shù)據(jù)倉庫事實表和維表
數(shù)據(jù)倉庫中按照星型結構設計,維表的結構字段包括維度標識、維度描述兩個字段,展示數(shù)據(jù)時,事實表和維表通過維度標識字段得到前端展現(xiàn)時所要的描述;
(2)數(shù)據(jù)倉庫事實表數(shù)據(jù)的生成規(guī)則
同一維度不同維度值之間的匯總,在維度值存在非互斥的情況下,在生成數(shù)據(jù)之前針對明細數(shù)據(jù)先做排重匯總,然后存儲到事實表中;
(3)利用OLAP工具或自定義開發(fā)展現(xiàn)數(shù)據(jù)
當數(shù)據(jù)倉庫事實表按照上述建立并按規(guī)則生成數(shù)據(jù)后,當使用OLAP工具時,則有其設置使其匯總指向一個已經(jīng)生成好的維度值,對應事實表中已排重后的數(shù)據(jù);當使用自定義界面展示時,匯總數(shù)據(jù)同樣指向數(shù)據(jù)庫中已經(jīng)生成的內容。
全文摘要
本發(fā)明涉及一種OLAP系統(tǒng)維度異常聚合法,適用OLAP系統(tǒng)中指標在維度值之間非互斥時匯總時的情況,特別是生成大數(shù)據(jù)量同時有時間要求的多維分析過程中。本發(fā)明事先在數(shù)據(jù)庫中生成事實表的匯總數(shù)據(jù),OLAP工具的維度級別代碼指向已經(jīng)匯總好的代碼進行關聯(lián),從而達到生成正確匯總數(shù)據(jù)的要求。本發(fā)明的有益效果是徹底解決了現(xiàn)有OLAP系統(tǒng)對維度值為非互斥下指標匯總的時間過長的問題,保證了數(shù)據(jù)的及時性,并且本方法簡單易行。本方法通過在河北移動IMEI分析中的應用表明效果非常好。
文檔編號G06F17/30GK101609456SQ20091007484
公開日2009年12月23日 申請日期2009年7月9日 優(yōu)先權日2009年7月9日
發(fā)明者張文杰, 琳 張, 趙雪輝 申請人:河北全通通信有限公司