本發(fā)明涉及動態(tài)基線算法領域,特別涉及一種性能指標監(jiān)控方法和裝置。
背景技術:
:在很多領域中都需要對一些性能指標數(shù)據(jù)進行實時監(jiān)控,以判斷當前的數(shù)據(jù)是否異常,例如在移動通信領域中,經(jīng)常需要監(jiān)控業(yè)務處理延時、接通率、用戶容量、網(wǎng)絡流量等指標,以診斷網(wǎng)絡故障或進行性能優(yōu)化等。傳統(tǒng)的監(jiān)控方法一般是將需要告警的條件進行梳理,然后配置一些監(jiān)控規(guī)則,當某一性能指標的數(shù)據(jù)觸發(fā)了這些監(jiān)控規(guī)則時,向用戶告警。但是,對于大規(guī)模業(yè)務,就需要配置大量的規(guī)則,在這種情況下,從規(guī)則的獲取到規(guī)則的維護都是十分困難的。并且,所有的規(guī)則都是人為主觀設定的,不一定能客觀的反映被監(jiān)控指標的變化規(guī)律,同時由于監(jiān)控規(guī)則本身沒有學習能力,不能很好地適應業(yè)務的變化。目前也出現(xiàn)了一些根據(jù)歷史數(shù)據(jù)確定告警條件的方法,但是這些方案都較為簡單,考慮因素較少,以至于不能精準的給出判斷告警條件,不能滿足人們的要求。技術實現(xiàn)要素:為了解決上述問題,本發(fā)明提供了一種性能指標監(jiān)控方法和裝置。依據(jù)本發(fā)明的一個方面,本發(fā)明提供了一種性能指標監(jiān)控方法,包括:采集一定時期內所述性能指標的歷史性能數(shù)據(jù),并將所述歷史性能數(shù)據(jù)存儲在第一數(shù)據(jù)表中;從所述第一數(shù)據(jù)表中選取與所述性能指標的當前數(shù)據(jù)對應的同期歷史性能數(shù)據(jù),并存儲在第二數(shù)據(jù)表中;根據(jù)所述第二數(shù)據(jù)表中的歷史性能數(shù)據(jù)計算上基線和下基線;根據(jù)所述上基線、所述下基線和預先配置的相對容忍度比率計算出對應的上容忍度和下容忍度;若所述性能指標的當前數(shù)據(jù)大于所述上容忍度或小于所述下容忍度,則發(fā)出告警。其中,所述從所述第一數(shù)據(jù)表中選取與所述性能指標當前數(shù)據(jù)對應的同期歷史性能數(shù)據(jù),并存儲在第二數(shù)據(jù)表中,具體包括:當所述同期歷史性能數(shù)據(jù)存在于所述第一數(shù)據(jù)表中時,直接將其放入所述第二數(shù)據(jù)表中;當所述同期歷史性能數(shù)據(jù)不存在于所述第一數(shù)據(jù)表中時,選取與其上下相鄰的兩個時間點的歷史性能數(shù)據(jù),做數(shù)據(jù)平滑,估計所述同期歷史性能數(shù)據(jù)的近似值,放入所述第二數(shù)據(jù)表中。其中,所述根據(jù)所述第二數(shù)據(jù)表中的歷史性能數(shù)據(jù)計算上基線和下基線,具體包括:刪除所述第二數(shù)據(jù)表中的異常數(shù)據(jù),僅保留能反映所述性能指標變化規(guī)律的典型數(shù)據(jù);根據(jù)所述典型數(shù)據(jù),采用概率分布算法計算所述上基線和所述下基線。其中,所述刪除所述第二數(shù)據(jù)表中的異常數(shù)據(jù),僅保留能反映所述性能指標變化規(guī)律的典型數(shù)據(jù),包括:刪除所述第二數(shù)據(jù)表中的最小值和最大值;將剩余數(shù)據(jù)分配到若干個區(qū)間中,每個區(qū)間的長度為所述剩余數(shù)據(jù)的最大值除以區(qū)間的個數(shù)再向上取整,且第一個區(qū)間的左端點為零;取數(shù)據(jù)個數(shù)最多的區(qū)間和與其相鄰的區(qū)間中的數(shù)據(jù),作為所述典型數(shù)據(jù)。其中,所述根據(jù)所述典型數(shù)據(jù),采用概率分布算法計算所述上基線和所述下基線,包括:將所述典型數(shù)據(jù)從小到大排序;將所述典型數(shù)據(jù)的個數(shù)乘以預先設置的信度后向下取整,作為滑動窗口中數(shù)據(jù)的個數(shù);取數(shù)據(jù)波動程度最小的滑動窗口中數(shù)據(jù)的最大值作為所述上基線,最小值作為所述下基線。依據(jù)本發(fā)明的另一個方面,本發(fā)明提供了一種性能指標監(jiān)控裝置,包括:數(shù)據(jù)存儲模塊以及分別與其連接的數(shù)據(jù)采集模塊、數(shù)據(jù)選擇模塊、基線計算模塊和告警模塊;所述數(shù)據(jù)采集模塊,用于采集一定時期內所述性能指標的歷史性能數(shù)據(jù),并將所述歷史性能數(shù)據(jù)存儲在第一數(shù)據(jù)表中;所述數(shù)據(jù)選擇模塊,用于從所述第一數(shù)據(jù)表中選取與所述性能指標的當前數(shù)據(jù)對應的同期歷史性能數(shù)據(jù),并存儲在第二數(shù)據(jù)表中;所述基線計算模塊,用于根據(jù)所述第二數(shù)據(jù)表中的歷史性能數(shù)據(jù)計算上基線和下基線;所述告警模塊,用于根據(jù)所述上基線、所述下基線和預先配置的相對容忍度比率計算出對應的上容忍度和下容忍度;當所述性能指標的當前數(shù)據(jù)大于所述上容忍度或小于所述下容忍度時,發(fā)出告警;所述數(shù)據(jù)存儲模塊,用于存儲所述第一數(shù)據(jù)表和所述第二數(shù)據(jù)表。其中,所述裝置還包括數(shù)據(jù)平滑模塊;所述數(shù)據(jù)平滑模塊分別連接所述數(shù)據(jù)選擇模塊與所述數(shù)據(jù)存儲模塊,用于當與所述性能指標的當前數(shù)據(jù)對應的同期歷史性能數(shù)據(jù)不存在于所述第一數(shù)據(jù)表中時,選取與同期歷史性能數(shù)據(jù)上下相鄰的兩個時間點的歷史性能數(shù)據(jù),做數(shù)據(jù)平滑,估計所述同期歷史性能數(shù)據(jù)的近似值,放入所述第二數(shù)據(jù)表中。其中,所述基線計算模塊包括去雜單元和計算單元;所述去雜單元,用于刪除所述第二數(shù)據(jù)表中的異常數(shù)據(jù),僅保留能反映所述性能指標變化規(guī)律的典型數(shù)據(jù);所述計算單元,用于根據(jù)所述典型數(shù)據(jù),采用概率分布算法計算所述上基線和所述下基線。其中,所述去雜單元具體用于:刪除所述第二數(shù)據(jù)表中的最小值和最大值;將剩余數(shù)據(jù)分配到若干個區(qū)間中,每個區(qū)間的長度為所述剩余數(shù)據(jù)的最大值除以區(qū)間的個數(shù)再向上取整,且第一個區(qū)間的左端點為零;取數(shù)據(jù)個數(shù)最多的區(qū)間和與其相鄰的區(qū)間中的數(shù)據(jù),作為所述典型數(shù)據(jù)。其中,所述計算單元具體用于:將所述典型數(shù)據(jù)從小到大排序;將所述典型數(shù)據(jù)的個數(shù)乘以預先設置的信度后向下取整,作為滑動窗口中數(shù)據(jù)的個數(shù);取數(shù)據(jù)波動程度最小的滑動窗口中數(shù)據(jù)的最大值作為所述上基線,最小值作為所述下基線。本發(fā)明實施例的有益效果是:本發(fā)明根據(jù)同期歷史性能數(shù)據(jù)計算得到上下基線,相對于傳統(tǒng)方法可以更快更準確的計算出基線數(shù)據(jù),進而計算出告警條件對應的上下容忍度;由于告警條件是根據(jù)被監(jiān)控性能指標的歷史性能數(shù)據(jù)動態(tài)確定的,不需要人工確定和手動配置,降低了工作量,并且該監(jiān)控方法具備一定的學習能力,可以適應變化的業(yè)務。優(yōu)選方案中在計算上下基線之前,排除了歷史數(shù)據(jù)中可能為異常數(shù)據(jù)的部分,使計算出的基線數(shù)據(jù)更精準;并且當被監(jiān)控性能指標當前數(shù)據(jù)對應的同期歷史數(shù)據(jù)沒有采集到時,利用與該同期歷史數(shù)據(jù)時間上相鄰的歷史性能數(shù)據(jù)進行估計,充分利用了采集到的數(shù)據(jù),能更快更準確的確定告警條件。附圖說明圖1為本發(fā)明實施例提供的性能指標監(jiān)控方法的具體流程圖;圖2為本發(fā)明實施例提供的性能指標監(jiān)控裝置的結構示意圖。具體實施方式為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面將結合附圖對本發(fā)明實施方式作進一步地詳細描述。本實施例的方法可以在服務器或用戶端側 執(zhí)行,可以訪問數(shù)據(jù)庫獲取歷史性能數(shù)據(jù)。本發(fā)明的方法可以檢測的性能可以為多種,具體可以包括任務或數(shù)據(jù)/應用的響應或執(zhí)行時間、延時時間、執(zhí)行次數(shù)、調用次數(shù)、URL調用次數(shù)、內存大小等。圖1為本發(fā)明實施例提供的性能指標監(jiān)控方法的具體流程圖。如圖1所示,本發(fā)明實施例提供的性能指標監(jiān)控方法包括:步驟S110:采集一定時期內被監(jiān)控的性能指標的歷史性能數(shù)據(jù),并將采集到的歷史性能數(shù)據(jù)存儲在第一數(shù)據(jù)表中。該步驟可以由采集機執(zhí)行。數(shù)據(jù)獲得的方式有多種方式:主動采集和被動采集,而主動采集又分為整點采集與等間隔采集,這些就導致采集機采集上來的時間并不一定是整點數(shù)據(jù),而我們在動態(tài)基線計算的時候,又受到原動態(tài)基線獲取整點數(shù)據(jù)進行計算的限制,所以我們就需要將采集的歷史數(shù)據(jù)先進行平滑處理,將時間都換算為整點數(shù)據(jù),以方便動態(tài)基線的計算。采用整點采集方式,例如,從0點開始采集,每5分鐘采集一次,那么就是0點5分采集第1次、0點10分采集第2次,如果在0點10分的時候,第一次采集沒有結束,那么就停止第一次采集而后啟動第二次采集,作為5分開始采集的數(shù)據(jù),雖然這些數(shù)據(jù)有些可能是0點5分30秒采集到的,但是統(tǒng)一認為這是0點5分的數(shù)據(jù)。采用等間隔采集方式,例如,間隔5分鐘采集1次,那么當采集機啟動以后,采集機開始采集數(shù)據(jù),一直到采集結束的時候,采集機開始計時,當計時達到5分鐘的時候開始第2次采集。第1次采集的時間,是系統(tǒng)啟動的時間,這個時間很難控制在整點上,除非程序中加了整點的時間的判斷,即假設用戶是0點2分的時候啟動的采集機,采集機會等到0點5分開始采集,但就算開始的時間是整點的,在采集的時候,受到各種因素的影響,每次采集相同指標的數(shù)據(jù),時間也是不等的,這就導致下次開始采集的時間和上次采集的時間間隔不相等。采用被動采集的方式,由其他系統(tǒng)發(fā)送歷史性能數(shù)據(jù),采集的時間和間隔無法控制,只能被動接收。步驟S120:從第一數(shù)據(jù)表中選取與被監(jiān)控的性能指標的當前數(shù)據(jù)對應的同期歷史性能數(shù)據(jù),并存儲在第二數(shù)據(jù)表中。在進行基線數(shù)據(jù)計算時,首先從歷史性能數(shù)據(jù)表即上述的第一數(shù)據(jù)表中取到歷史性能數(shù)據(jù)。在本發(fā)明的一個優(yōu)選實施例中,該步驟S120具體包括:當該同期歷史性能數(shù)據(jù)不存在于第一數(shù)據(jù)表中時,選取與其上下相鄰的兩個時間點的歷史性能數(shù)據(jù),做數(shù)據(jù)平滑,估計該同期歷史性能數(shù)據(jù)的近似值,放入第二數(shù)據(jù)表中。例如,需要某一天8點的數(shù)據(jù),該時間點的數(shù)據(jù)不存在與第一數(shù)據(jù)表中,但是7點55分和8點05分的數(shù)據(jù)存在,那么就選取這兩個時間點的數(shù)據(jù)來估計8點的數(shù)據(jù),進行數(shù)據(jù)平滑,然后將估計出的數(shù)據(jù)放入第二數(shù)據(jù)表中。這樣就可以有效的利用已經(jīng)采集的數(shù)據(jù)來確定告警條件。步驟S130:根據(jù)第二數(shù)據(jù)表中的歷史性能數(shù)據(jù)計算上基線和下基線。動態(tài)基線數(shù)據(jù)計算主要分成兩大步:第一步:區(qū)間取數(shù)去雜,該步驟的區(qū)間選數(shù)去雜主要是為了去掉那些特別大特別小的數(shù)據(jù),在分布最多區(qū)間中抽取數(shù)據(jù),并且保證最大最小數(shù)盡量平滑。第二步:采用概率分布算法(標準差)方法計算出上下基線,本步驟經(jīng)過區(qū)間取數(shù)去雜之后,對去雜之后的這些數(shù)據(jù)再進行概率分布算法,取出上下基線數(shù)據(jù)。在本發(fā)明的一個優(yōu)選實施例中,該步驟S130具體分解為如下步驟:刪除第二數(shù)據(jù)表中的最小值和最大值;將剩余數(shù)據(jù)分配到若干個區(qū)間中,每個區(qū)間的長度為剩余數(shù)據(jù)的最大值減去最小值后除以區(qū)間的個數(shù)再向上取整,且第一個區(qū)間的左端點為零;取數(shù)據(jù)個數(shù)最多的區(qū)間和與其相鄰的區(qū)間中的數(shù)據(jù),作為能反映被監(jiān)控指標變化規(guī)律的典型數(shù)據(jù);將典型數(shù)據(jù)從小到大排序;將典型數(shù)據(jù)的個數(shù)乘以預先設置的信度后向下取整的數(shù)值作為滑動窗口數(shù)據(jù)個數(shù);取數(shù)據(jù)波動程度最小的滑動窗口中數(shù)據(jù)的最大值作為上基線,最小值作為下基線。步驟S140:根據(jù)上基線、下基線和預先配置的相對容忍度比率計算出對應的上容忍度和下容忍度。在得到上基線值和下基線值之后,再根據(jù)配置的相對容忍度,計算得到上下容忍度。步驟S150:判斷被監(jiān)控的性能指標的當前數(shù)據(jù)是否大于上容忍度或小于下容忍度。若是,則執(zhí)行步驟S160;否則結束性能指標監(jiān)控或者返回步驟S110或者返回步驟S120,繼續(xù)采集數(shù)據(jù)。步驟S160:向用戶發(fā)出告警。告警條件是根據(jù)與被監(jiān)控的性能指標的當前數(shù)據(jù)對應的同期歷史性能數(shù)據(jù)來確定的,由于采用的數(shù)據(jù)采集方式或系統(tǒng)故障等原因,可能與被監(jiān)控的性能指標的當前數(shù)據(jù)對應的某些歷史性能數(shù)據(jù)不存在于第一數(shù)據(jù)表中,這樣就會影響步驟S130中計算的上下基線的精準度。例如,采用整點采集的方式,從0點開始采集,每5分鐘采集一次,如果想要判斷0點3分的數(shù)據(jù)是否異常需要告警,由于沒有采集該點對應的同期歷史性能數(shù)據(jù),所以無法辦到。這樣想要實時監(jiān)控就必須采集每一個時間點的歷史性能數(shù)據(jù),這是很難辦到的,并且維護如此大量的歷史性能數(shù)據(jù),不僅浪費資源、工作量大,而且性能也不高。下面,以監(jiān)控某一性能指標2012年4月16日20點整是否需要告警為例,具體說明本發(fā)明實施例提供的性能指標監(jiān)控方法。由于告警條件是根據(jù)歷史數(shù)據(jù)動態(tài)確定的,因此首先要采集該性能指標在一定時期內的歷史性能數(shù)據(jù),具體的采集的期間和采集間隔可以根據(jù)被監(jiān)控性能指標本身的特性來確定,例如某一性能指標大致上是以一天為周期變化的,那么就可以采集過去若干天的性能數(shù)據(jù),與今天8點的數(shù)據(jù)對應的同期歷史性能數(shù)據(jù)就是過去這些天8點的數(shù)據(jù);再例如,某一性能指標大致上是以一小時為周期變化的,同樣可以采集過去若干天的性能數(shù)據(jù),與今天8點的數(shù)據(jù)對應的同期歷史性能數(shù)據(jù)就是過去的每個整點的數(shù)據(jù)。在本例中,假設被監(jiān)控的性能指標是以一天為周期變化的,采集了過去30天的歷史性能數(shù)據(jù),以表中數(shù)據(jù)為某一任務響應時間值為例,存儲在第一數(shù)據(jù)表中,如表1所示。表1時間歷史性能數(shù)據(jù)2012-3-1720:00562012-3-1820:00912012-3-1920:00792012-3-2020:00342012-3-2120:00542012-3-2220:00512012-3-2320:00532012-3-2420:00632012-3-2520:00392012-3-2620:00382012-3-2720:00242012-3-2820:00392012-3-2920:00412012-3-3020:00412012-3-3120:00392012-4-120:00782012-4-220:00792012-4-320:00672012-4-420:00662012-4-520:00692012-4-720:00632012-4-820:00872012-4-920:00812012-4-1021:00942012-4-1120:00992012-4-1220:00732012-4-1320:001032012-4-1420:001022012-4-15200079與2012年4月16日20點對應的同期歷史性能數(shù)據(jù)為過去30天每天20點的歷史性能數(shù)據(jù)。這些數(shù)據(jù)基本都存在,因此可以直接取這些歷史性能數(shù)據(jù)放入第二數(shù)據(jù)表中。由于2012-4-620:00:00的數(shù)據(jù)不存在,需要取該時間點的上下相鄰時間的歷史性能數(shù)據(jù),做數(shù)據(jù)平滑,假如2012-4-619:55:00的歷史性能數(shù)據(jù)為85、2012-4-620:05:00的歷史性能數(shù)據(jù)為94,平滑后得到2012-4-620:00:00的歷史性能數(shù)據(jù)為89,放入第二數(shù)據(jù)表中,如表2所示。表2第二數(shù)據(jù)表中的數(shù)據(jù)如下:[56,91,79,34,54,51,53,63,39,38,24,39,41,41,39,78,79,67,66,69,89,63,87,81,94,99,73,103,102,79]。按從小到大排序,刪除其中最小的數(shù)和最大的數(shù),因為這些數(shù)據(jù)有可能是異常大的數(shù)或異常小的數(shù),剩余的28個數(shù)為:[34,38,39,39,39,41,41,51,53,54,56,63,63,66,67,69,73,78,79,79,79,81,87,89,91,94,99,102]。在本例中,確定5個區(qū)間,每個區(qū)間的長度為102/5=21,五個區(qū)間分別是[0,21)、[21,42)、[42,63)、[63,84)、[84,105),將剩余數(shù)據(jù)分配到這些區(qū)間中,得到:區(qū)間1=[]區(qū)間2=[34,38,39,39,39,41,41]區(qū)間3=[51,53,54,56]區(qū)間4=[63,63,66,67,69,73,78,79,79,79,81]區(qū)間5=[87,89,91,94,99,102]區(qū)間4中的數(shù)據(jù)個數(shù)最多,所以取區(qū)間4以及上鄰區(qū)間3和下鄰區(qū)間5的數(shù)據(jù),如果它上、下鄰區(qū)間沒有數(shù)據(jù),可不取,取完的數(shù)為:[51,53,54,56,63,63,66,67,69,73,78,79,79,79,81,87,89,91,94,99,102],剩下21個數(shù)。通過以上步驟,第二數(shù)據(jù)表中可能存在的異常歷史性能數(shù)據(jù)被排除,僅保留了能反映被監(jiān)控的性能指標的變化規(guī)律的典型數(shù)據(jù),然后利用這些典型數(shù)據(jù)計算上下基線。在本例中,設置信度為0.8,信度可以根據(jù)需要任意設定,大小在0到1之間,通過置信度求出剩余的21個數(shù)據(jù)的滑動窗口的大小,即滑動窗口中數(shù)據(jù)的個數(shù)為21*0.8=16.8取整為16。將滑動窗口從左到右滑動,依次計算每一個窗口中數(shù)據(jù)的標準差,計算結果如下:第1個數(shù)到第16個數(shù):[51,53,54,56,63,63,66,67,69,73,78,79,79,79,81,87]的標準差為:10.95944227595547;第2個數(shù)到第17個數(shù):[53,54,56,63,63,66,67,69,73,78,79,79,79,81,87,89]標準差為:11;第3個數(shù)到第18個數(shù):[54,56,63,63,66,67,69,73,78,79,79,79,81,87,89,91]標準差為:10.95944227595547第4個數(shù)到第19個數(shù):[56,63,63,66,67,69,73,78,79,79,79,81,87,89,91,94]標準差為:10.815931536395745;第5個數(shù)到第20個數(shù):[63,63,66,67,69,73,78,79,79,79,81,87,89,91,94,99]標準差為:10.885591107055234;第6個數(shù)到第21個數(shù):[63,66,67,69,73,78,79,79,79,81,87,89,91,94,99,102]標準差為:11.478240283248997。標準差是一組數(shù)據(jù)平均值分散程度的一種度量。一個較大的標準差,代表大部分數(shù)值和其平均值之間差異較大;一個較小的標準差,代表這些數(shù)值較接近平均值。其中標準差最小為4~19窗口的10.815931536395745,因此該滑動窗口中的數(shù)據(jù)波動程度最小,取該窗口[56,63,63,66,67,69,73,78,79, 79,79,81,87,89,91,94]的最大值94作為上基線,56作為下基線。樣本置信度在概率算法中,為所選取的樣本空間中的歷史數(shù)據(jù)的可信程度,用來對要進行基線計算的樣本數(shù)據(jù)的選取進行擴大或縮小。樣本置信度默認為0.8,取值范圍為0.1~1。推薦使用默認的值0.8。置信度越大,取最大值也會越大,最小值也會越小。置信度取決于對于損失的容忍度,在本例中,相對容忍度配置為20%,該相對容忍度是根據(jù)需要設定的,大小在0到1之間,通過計算得到上下容忍度分別為:上容忍度=上基線值94*(1+20%)=112.8下容忍度=下基線值56*(1-20%)=44.8根據(jù)上下容忍度數(shù)據(jù)來判斷當前數(shù)據(jù)是否正常、是否需要告警,若當前數(shù)據(jù)的大小在上下容忍度之間,則認為當前數(shù)據(jù)是正常的;若當前數(shù)據(jù)大于上容忍度112.8或小于下容忍度44.8,則認為當前數(shù)據(jù)異常,發(fā)出告警?;谙嗤陌l(fā)明構思,本發(fā)明還提供了一種性能指標監(jiān)控裝置實施例。本實施例中的裝置可以設置在服務器或用戶端側,與數(shù)據(jù)庫連接,可以訪問數(shù)據(jù)庫獲取歷史數(shù)據(jù)。本發(fā)明中的裝置可以檢測的性能可以為多種,具體可以包括任務或數(shù)據(jù)/應用的響應或執(zhí)行時間、執(zhí)行次數(shù)、調用次數(shù)、URL調用次數(shù)、內存大小等。圖2為本發(fā)明實施例提供性能指標監(jiān)控裝置的結構示意圖。如圖2所示,本發(fā)明實施例提供性能指標監(jiān)控裝置包括:數(shù)據(jù)存儲模塊210以及與其連接的數(shù)據(jù)采集模塊220、數(shù)據(jù)選擇模塊230、基線計算模塊240和告警模塊250;數(shù)據(jù)采集模塊220,用于采集一定時期內被監(jiān)控性能指標的歷史性能數(shù)據(jù),并將采集到的歷史性能數(shù)據(jù)存儲在第一數(shù)據(jù)表中。數(shù)據(jù)選擇模塊230,用于從第一數(shù)據(jù)表中選取與被監(jiān)控的性能指標的當前數(shù)據(jù)對應的同期歷史性能數(shù)據(jù),并存儲在第二數(shù)據(jù)表中;基線計算模塊240,用于根據(jù)第二數(shù)據(jù)表中的歷史性能數(shù)據(jù)計算上基線和下基線;告警模塊250,用于根據(jù)計算出的上下基線和預先配置的相對容忍度比率計算出對應的上容忍度和下容忍度;當被監(jiān)控的性能指標當前數(shù)據(jù)大于上容忍度或小于下容忍度時,判斷當前數(shù)據(jù)異常,發(fā)出告警;數(shù)據(jù)存儲模塊210,用于存儲第一數(shù)據(jù)表和第二數(shù)據(jù)表。上述的數(shù)據(jù)采集模塊220和數(shù)據(jù)選擇模塊230可以由采集機執(zhí)行。在本發(fā)明提供的一個優(yōu)選實施例中,數(shù)據(jù)選擇模塊230包括平滑單元231。若與被監(jiān)控的性能指標的當前數(shù)據(jù)對應的某一個同期歷史性能數(shù)據(jù)不存在于第一數(shù)據(jù)表中,則平滑單元231選取與該同期歷史性能數(shù)據(jù)上下相鄰的兩個時間點的歷史性能數(shù)據(jù),做數(shù)據(jù)平滑,估計該同期歷史性能數(shù)據(jù)的近似值,放入第二數(shù)據(jù)表中。在另一優(yōu)選實施例中,仍如圖2所示,基線計算模塊240包括去雜單元241和計算單元242;去雜單元241用于刪除第二數(shù)據(jù)表的異常歷史性能數(shù)據(jù),僅保留能反映被監(jiān)控的性能指標變化規(guī)律的典型數(shù)據(jù)。作為優(yōu)選方案,去雜單元241具體用于刪除第二數(shù)據(jù)表中的最小值和最大值,并將剩余數(shù)據(jù)分配到若干個區(qū)間中,其中每個區(qū)間的長度為剩余數(shù)據(jù)的最大值除以區(qū)間的個數(shù)再向上取整,且第一個區(qū)間的左端點為零,取數(shù)據(jù)個數(shù)最多的區(qū)間和與其相鄰的區(qū)間中的數(shù)據(jù),作為保留的典型數(shù)據(jù)。計算單元242用于根據(jù)保留的典型數(shù)據(jù),采用概率分布算法計算上下基線。作為優(yōu)選方案,計算單元242具體用于:將剩余的典型數(shù)據(jù)從小到大排序;將剩余數(shù)據(jù)的個數(shù)乘以預先設置的信度后向下取整的數(shù)值作為滑動窗口數(shù)據(jù)個數(shù);取數(shù)據(jù)波動程度最小的滑動窗口中數(shù)據(jù)的最大值作為上基線,最小值作為下基線。在一優(yōu)選實施例中,采用計算滑動窗口中數(shù)據(jù)的標準差的方法來判斷數(shù)據(jù)波動程度,標準差是一組數(shù)據(jù)平均值分散程度的一種度量。一個較大的標準差,代表大部分數(shù)值和其平均值之間差異較大;一個較小的標準差,代表這些數(shù)值較接近平均值。綜上所述,本發(fā)明提供的性能指標監(jiān)控方法和裝置,根據(jù)同期歷史性能 數(shù)據(jù)計算得到上下基線,相對于傳統(tǒng)方法可以更快更準確的計算出基線數(shù)據(jù),進而計算出告警條件對應的上下容忍度;與現(xiàn)有技術相比,具有以下有益效果:1、告警條件是根據(jù)被監(jiān)控性能指標的歷史性能數(shù)據(jù)動態(tài)確定的,不需要人工確定和手動配置,降低了工作量,并且該監(jiān)控方法具備一定的學習能力,可以適應變化的業(yè)務。2、在計算上下基線之前,排除了歷史數(shù)據(jù)中可能為異常數(shù)據(jù)的部分,使計算出的基線數(shù)據(jù)更精準。3、當被監(jiān)控性能指標當前數(shù)據(jù)對應的同期歷史性能數(shù)據(jù)沒有采集到時,利用與該同期歷史性能數(shù)據(jù)時間上相鄰的歷史性能數(shù)據(jù)進行估計,充分利用了采集到的數(shù)據(jù),更快更準確的確定告警條件。以上所述僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護范圍。凡在本發(fā)明的精神和原則之內所作的任何修改、等同替換、改進等,均包含在本發(fā)明的保護范圍內。當前第1頁1 2 3