數(shù)據(jù)庫性能自動分析和預警系統(tǒng)的制作方法
【專利摘要】數(shù)據(jù)庫性能的人工分析評估成本很高且周期較長,發(fā)現(xiàn)問題時往往業(yè)務系統(tǒng)已經(jīng)造成了影響。本發(fā)明數(shù)據(jù)庫性能自動分析和預警系統(tǒng)通過數(shù)據(jù)庫性能數(shù)據(jù)定時采集工具周期性地采集數(shù)據(jù)庫性能數(shù)據(jù),通過數(shù)據(jù)庫性能自動分析工具對采集到的性能數(shù)據(jù)進行實時自動分析,將分析結果與數(shù)據(jù)庫性能基線對比及時發(fā)現(xiàn)性能隱患,并通過可配置的預警機制進行自動報警,從而及時進行人工干預,避免對業(yè)務系統(tǒng)的運行造成影響。對數(shù)據(jù)庫性能數(shù)據(jù)的自動分析分為兩階段,第一階段對單次性能數(shù)據(jù)進行分析,第二階段對連續(xù)多次性能數(shù)據(jù)進行綜合關聯(lián)分析并預測未來性能狀況。預警系統(tǒng)可提供電子郵件、手機短信、即時消息、日志、屏幕顯示、語音、指示燈等多種報警方法。
【專利說明】數(shù)據(jù)庫性能自動分析和預警系統(tǒng)
【技術領域】
[0001] 本發(fā)明的【技術領域】是計算機的數(shù)據(jù)庫系統(tǒng)。
【背景技術】
[0002] 對于廣大使用數(shù)據(jù)庫進行數(shù)據(jù)存儲和處理的應用系統(tǒng)來說,數(shù)據(jù)庫的性能狀況非 常關鍵,如果數(shù)據(jù)庫性能有問題將導致業(yè)務系統(tǒng)無法正常運行甚至中斷。而數(shù)據(jù)庫的性能 狀況又是動態(tài)變化的,隨著數(shù)據(jù)量的增加、業(yè)務系統(tǒng)的擴充、設備、網(wǎng)絡以及其他軟硬件環(huán) 境的變化而不斷改變,所以需要不斷監(jiān)控數(shù)據(jù)庫的性能狀況,一旦發(fā)生故障要及時處理。雖 然各種主流數(shù)據(jù)庫系統(tǒng)都提供了數(shù)據(jù)庫性能采集方法和工具,也有一些第三方的工具可以 使用,但對于數(shù)據(jù)庫性能的人工分析評估需要花費很大的工作量,成本很高且周期較長;另 一存在的問題是即使發(fā)現(xiàn)了性能故障馬上進行處理,已經(jīng)或多或少對業(yè)務系統(tǒng)造成了影響 甚至中斷。本發(fā)明數(shù)據(jù)庫性能自動分析和預警系統(tǒng)通過不間斷地采集數(shù)據(jù)庫性能數(shù)據(jù)并對 數(shù)據(jù)進行自動分析可大幅度提高數(shù)據(jù)庫性能分析的頻率,彌補人工分析的不足,并通過可 配置的預警機制在性能故障發(fā)生之前就提前捕捉到性能下降的跡象,及時進行人工干預, 避免對業(yè)務系統(tǒng)的運行造成影響。
【發(fā)明內容】
[0003] 本發(fā)明數(shù)據(jù)庫性能自動分析和預警系統(tǒng)包括以下幾部分:數(shù)據(jù)庫性能數(shù)據(jù)定時采 集、數(shù)據(jù)庫性能自動分析、數(shù)據(jù)庫性能基線定義、數(shù)據(jù)庫性能預警。
[0004] 數(shù)據(jù)庫性能數(shù)據(jù)定時采集通過數(shù)據(jù)庫性能數(shù)據(jù)采集工具進行,該工具可以是 數(shù)據(jù)庫系統(tǒng)自有的工具,比如Oracle的Statspack,SQL Server的Performance Data Collector,也可以是第三方工具或自己開發(fā)的工具,定時間隔可根據(jù)需要進行配置,如每 小時一次、每半小時一次、每五分鐘一次等。
[0005] 數(shù)據(jù)庫性能自動分析利用數(shù)據(jù)庫性能采集工具定時采集數(shù)據(jù)庫的性能數(shù)據(jù),對每 次采集到的性能數(shù)據(jù)進行兩階段自動分析,第一階段分析僅分析當次采集到的性能數(shù)據(jù), 第二階段分析則分析包括當次的此前連續(xù)η次(η可配置)性能數(shù)據(jù),通過分析一段時間內 的數(shù)據(jù)庫整體性能狀況和性能變化趨勢并與數(shù)據(jù)庫性能基線相比較,定期自動生成高可靠 的數(shù)據(jù)庫性能分析報告。
[0006] 數(shù)據(jù)庫性能基線定義由本系統(tǒng)管理員負責。系統(tǒng)管理員可根據(jù)業(yè)務狀況的典型性 和數(shù)據(jù)庫系統(tǒng)性能的穩(wěn)定性,指定或更改某一時間段采集到的數(shù)據(jù)庫性能數(shù)據(jù)作為數(shù)據(jù)庫 性能基線依據(jù),對這些數(shù)據(jù)采用前述兩階段分析方法進行分析,分析結果即定義為數(shù)據(jù)庫 性能基線。數(shù)據(jù)庫性能基線是以后性能分析和預警的對照和依據(jù)。
[0007] 數(shù)據(jù)庫性能預警則由系統(tǒng)管理員先預設性能報警指標、報警參數(shù)和報警方法,在 每次生成進行自動分析時,檢查預設的各項性能報警指標并與報警參數(shù)相比較,一旦有某 項指標滿足報警條件,則通過選定的報警方法進行報警。
[0008] 數(shù)據(jù)庫性能自動分析的第一階段分析主要方法是針對單次性能采集數(shù)據(jù)計算相 關性能指標計算并保存計算好的指標數(shù)據(jù)供第二階段分析和數(shù)據(jù)庫性能預警使用。具體定 義哪些性能指標及其計算方法依賴于所采用性能數(shù)據(jù)采集工具生成的數(shù)據(jù)內容和數(shù)據(jù)格 式,由本系統(tǒng)定義和實現(xiàn)。
[0009] 數(shù)據(jù)庫性能自動分析的第二階段分析方法是對連續(xù)多次的第一階段分析所保存 的指標數(shù)據(jù)進行二次綜合分析,具體分析方法根據(jù)各指標含義的不同有不同的方法,對同 一指標也可采用多種計算方法,如計算平均值、最大值、最小值、方差、中位數(shù)、波動率、各種 曲線擬合趨勢分析等等,并可對多個指標數(shù)據(jù)進行關聯(lián)分析。將第二階段性能自動分析的 結果同性能基線對比保存為數(shù)據(jù)庫性能分析報告供人工查閱,同時也提供給數(shù)據(jù)庫性能預 警使用。由于可以通過曲線擬合進行性能指標趨勢分析,可以定義某一性能指標一定時間 后的預測值作為第二階段性能分析結果的一部分,這樣可以提前預測數(shù)據(jù)庫的性能隱患, 而不是等到已經(jīng)發(fā)生數(shù)據(jù)庫性能問題之后再進行處理。
[0010] 波動率是本發(fā)明中提出的新概念,其計算公式如下:
[0011]
【權利要求】
1. 一種數(shù)據(jù)庫性能自動分析方法包含 定時采集數(shù)據(jù)庫性能數(shù)據(jù)并分兩階段進行分析:第一階段分析單次性能數(shù)據(jù),第二階 段分析連續(xù)多次性能數(shù)據(jù); 對單次采集到的數(shù)據(jù)庫性能數(shù)據(jù)的分析方法; 對連續(xù)多次數(shù)據(jù)庫性能指標的綜合關聯(lián)分析方法; 將數(shù)據(jù)分析結果與數(shù)據(jù)庫性能基線相比較的方法。
2. 權利要求1中的對連續(xù)多次數(shù)據(jù)庫性能指標的綜合關聯(lián)分析方法包含 計算同一性能指標的平均值、最大值、最小值、方差、中位數(shù)、波動率; 通過對同一性能指標數(shù)據(jù)進行曲線擬合預測該指標未來趨勢; 對多個指標數(shù)據(jù)進行關聯(lián)分析。
3. 權利要求2中的性能指標波動率計算方法。
4. 一種定義數(shù)據(jù)庫性能基線的方法。
5. -種數(shù)據(jù)庫性能自動預警方法包含 性能報警指標和報警參數(shù)的設置方法; 將自動分析得到的性能指標與數(shù)據(jù)庫性能基線相比較發(fā)現(xiàn)數(shù)據(jù)庫性能隱患的方法; 通過性能指標未來預測值發(fā)現(xiàn)數(shù)據(jù)庫性能隱患的方法; 多種報警手段相結合的報警方法。
6. 權利要求5中的報警參數(shù)設置方法包含 報警參數(shù)是一個區(qū)間值; 報警參數(shù)可設置為固定區(qū)間值,或基于性能基線上下各一定數(shù)值的浮動區(qū)間值,或基 于性能基線上下各一定比例的浮動區(qū)間值,或以上三種方法的結合。
7. 權利要求5中的報警手段包含以下手段的任意組合 電子郵件報警; 手機短信報警; 即時消息報警; 日志報警; 屏幕顯示報警; 語音報警; 指示燈報警。
【文檔編號】G06F17/30GK104102668SQ201310125628
【公開日】2014年10月15日 申請日期:2013年4月12日 優(yōu)先權日:2013年4月12日
【發(fā)明者】袁曉東 申請人:袁曉東