本發(fā)明涉及云平臺(tái)的監(jiān)控告警技術(shù)領(lǐng)域,具體地說是一種私有化云平臺(tái)的告警系統(tǒng)及其實(shí)現(xiàn)方法。
背景技術(shù):
云計(jì)算資源種類眾多,而云平臺(tái)肩負(fù)對(duì)各種資源進(jìn)行監(jiān)控。而面臨要各種使用場(chǎng)景的時(shí)候,需要花費(fèi)大量的人力和物力來開發(fā)云平臺(tái)業(yè)務(wù)功能來支撐監(jiān)控流程相似,但種類和細(xì)節(jié)不同的云平臺(tái)資源,無法快速響應(yīng)用戶的需求。
云平臺(tái)中的一類資源對(duì)于一些性能指標(biāo)的要求往往有一定的相同性;而不同的性能指標(biāo)在處理時(shí)卻有著優(yōu)先級(jí)之分;在處理這些性能指標(biāo)異常的狀況時(shí),不同的狀態(tài)往往需要不同的處理方式,且關(guān)注的人也可能不同。故如何能夠靈活的監(jiān)控各種資源的告警狀態(tài),減少人工配置過程,增強(qiáng)服務(wù)的可靠性是目前現(xiàn)有技術(shù)中存在的技術(shù)問題。
專利號(hào)為CN 105376100 A的專利文獻(xiàn)公開了一種適用于云平臺(tái)資源監(jiān)控的分布式告警規(guī)則評(píng)估方法,本發(fā)明首先定期收集監(jiān)控?cái)?shù)據(jù);然后設(shè)置監(jiān)控規(guī)則;接著啟動(dòng)所有分布式告警規(guī)則評(píng)估服務(wù);下一步每個(gè)告警規(guī)則評(píng)估服務(wù)廣播自身的服務(wù)狀態(tài)信息,每個(gè)判斷自己的服務(wù)啟動(dòng)時(shí)間是否最早,若啟動(dòng)時(shí)間最早則為主服務(wù)并執(zhí)行告警規(guī)則評(píng)估主服務(wù)的流程,若啟動(dòng)時(shí)間不是最早則執(zhí)行告警規(guī)則評(píng)估非主服務(wù)。但是該技術(shù)方案存在自動(dòng)化程度不高、告警處理的靈活性不夠等缺點(diǎn)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的技術(shù)任務(wù)是提供一種私有化云平臺(tái)的告警系統(tǒng)及其實(shí)現(xiàn)方法,來解決如何能夠靈活的監(jiān)控各種資源的告警狀態(tài),減少人工培植過程,增強(qiáng)服務(wù)的可靠性的問題。
本發(fā)明的技術(shù)任務(wù)是按以下方式實(shí)現(xiàn)的,一種私有化云平臺(tái)的告警系統(tǒng),該系統(tǒng)包括自定義告警模板模塊、自動(dòng)綁定資源模塊、評(píng)估告警模塊、告警處理模塊和事件處理模塊;
其中,自定義告警模板模塊的內(nèi)容包括資源特征、告警策略、告警級(jí)別、告警事件和告警通知;自定義告警模板模塊用于為資源創(chuàng)建時(shí)自動(dòng)綁定資源模塊提供基礎(chǔ);
自動(dòng)綁定資源模塊用于根據(jù)自定義告警模板模塊中的資源特征,在創(chuàng)建資源時(shí),滿足該資源特征的資源都將創(chuàng)建告警實(shí)例;
評(píng)估告警模塊用于評(píng)估告警級(jí)別,根據(jù)告警級(jí)別處理告警事件;
告警處理模塊用于根據(jù)不同的告警狀態(tài)采取不同的通知策略;
事件處理模塊用于處理告警事件。
作為優(yōu)選,所述告警策略包括性能指標(biāo)、閥值、比較策略、統(tǒng)計(jì)方法、統(tǒng)計(jì)周期和重復(fù)統(tǒng)計(jì)次數(shù),重復(fù)統(tǒng)計(jì)多個(gè)周期的指標(biāo)值進(jìn)行比較可以提高告警的準(zhǔn)確性。
作為優(yōu)選,所述告警級(jí)別分為緊急告警、重要告警和一般告警,優(yōu)先級(jí)由高到低,同一個(gè)資源發(fā)出多個(gè)告警時(shí),優(yōu)先處理緊急的告警。
作為優(yōu)選,所述告警處理模塊的通知策略包括URL通知、郵件通知以及短信通知。
一種私有化云平臺(tái)的告警實(shí)現(xiàn)方法,該方法包括如下步驟:
(1)、在自定義告警模板模塊編輯告警實(shí)例,告警實(shí)例的內(nèi)容包括告警實(shí)例的資源特征、告警策略、告警級(jí)別、告警事件和告警通知;
(2)、將告警實(shí)例傳輸?shù)阶詣?dòng)綁定資源模塊;
(3)、自動(dòng)綁定資源模塊將告警實(shí)例傳送到評(píng)估告警模塊,評(píng)估告警模塊對(duì)告警實(shí)例進(jìn)行評(píng)估,確定告警實(shí)例的告警級(jí)別以及評(píng)估告警實(shí)例;
(4)、評(píng)估告警模塊將告警實(shí)例傳送到告警處理模塊,告警處理模塊選擇告警通知的方式;
(5)、告警處理模塊將告警實(shí)例傳送到事件處理模塊,事件處理模塊對(duì)告警實(shí)例進(jìn)行處理。
作為優(yōu)選,所述步驟(4)中評(píng)估告警實(shí)例包括以下情況:無數(shù)據(jù)、有數(shù)據(jù)且滿足告警策略以及有數(shù)據(jù)但不滿足告警策略;
其中,無數(shù)據(jù)表示服務(wù)器沒有收到監(jiān)控?cái)?shù)據(jù);
有數(shù)據(jù)且滿足告警策略表示當(dāng)前資源的性能達(dá)到了用戶設(shè)置的閾值;
有數(shù)據(jù)但不滿足告警策略表示當(dāng)前資源還在正常運(yùn)行。
本發(fā)明的私有化云平臺(tái)的告警系統(tǒng)及其實(shí)現(xiàn)方法具有以下優(yōu)點(diǎn):
1、本發(fā)明能夠通過告警模板自動(dòng)的為資源綁定告警,靈活的監(jiān)控各種資源的告警狀態(tài),減少人工配置過程;能夠?qū)Σ煌母婢癄顟B(tài),設(shè)置不同的告警通知,靈活的應(yīng)對(duì)不同的狀況;能夠根據(jù)告警的不同級(jí)別,按照一定的優(yōu)先級(jí)處理告警;告警事件結(jié)合私有化云平臺(tái)本身的伸縮等功能更能夠增強(qiáng)應(yīng)用、服務(wù)的可靠性;
2、本發(fā)明支持自定義告警模板,為資源自動(dòng)綁定告警;支持多策略聯(lián)合告警;支持多種告警回調(diào)處理機(jī)制,包含告警事件處理,告警通知處理,其中,告警通知支持三種方式:URL通知,短信通知以及郵件通知;支持三種告警狀態(tài)模式(無數(shù)據(jù)、有數(shù)據(jù)且滿足告警策略、有數(shù)據(jù)但不滿足告警策略),針對(duì)不同的狀態(tài),可以進(jìn)行不同的告警通知處理;支持三種告警程度(緊急、重要、一般)選擇;
3、本發(fā)明可以通過自定義告警模板,對(duì)同一類資源自動(dòng)創(chuàng)建告警,減少人工參與,提高自動(dòng)化程度,適合云平臺(tái)系統(tǒng)資源整體配置;可以根據(jù)告警的嚴(yán)重程度定義告警級(jí)別,增加告警的優(yōu)先級(jí),增加告警處理的優(yōu)先性,以提高告警處理的靈活性;可以根據(jù)告警狀態(tài)定義不同的通知方式,增強(qiáng)告警處理的靈活性;
4、本發(fā)明的自定義告警模板模塊,為資源自動(dòng)創(chuàng)建告警實(shí)例,減少人工設(shè)置過程;自定義告警模板模塊中告警級(jí)別的設(shè)置以及不同告警狀態(tài)可以設(shè)置不同的告警通知,能夠提高告警處理的靈活性,增強(qiáng)告警處理的針對(duì)性;而且在設(shè)置自定義告警模板時(shí),可以設(shè)置多個(gè)告警策略,同時(shí),可以通過多個(gè)統(tǒng)計(jì)周期的值來確定是否觸發(fā)告警,提高了告警的準(zhǔn)確性;
5、本發(fā)明涉及云平臺(tái)的監(jiān)控告警技術(shù)領(lǐng)域,特別是一種適用于私有化云平臺(tái)的資源自動(dòng)化告警及多狀態(tài)、多級(jí)別的告警處理機(jī)制,通過自主研發(fā)的自動(dòng)化告警及告警處理機(jī)制,結(jié)合云平臺(tái)監(jiān)控,實(shí)現(xiàn)對(duì)云平臺(tái)資源的滿足一定策略條件進(jìn)行靈活有效的告警及處理。
故本發(fā)明具有設(shè)計(jì)合理、結(jié)構(gòu)簡(jiǎn)單、使用方便、一物多用等特點(diǎn),因而,具有很好的推廣使用價(jià)值。
附圖說明
下面結(jié)合附圖對(duì)本發(fā)明進(jìn)一步說明。
附圖1為基于云平臺(tái)的告警系統(tǒng)的結(jié)構(gòu)框圖。
具體實(shí)施方式
參照說明書附圖和具體實(shí)施例對(duì)本發(fā)明的私有化云平臺(tái)的告警系統(tǒng)及其實(shí)現(xiàn)方法作以下詳細(xì)地說明。
實(shí)施例1:
如附圖1所示,本發(fā)明的私有化云平臺(tái)的告警系統(tǒng),該系統(tǒng)包括自定義告警模板模塊、自動(dòng)綁定資源模塊、評(píng)估告警模塊、告警處理模塊和事件處理模塊;其中,自定義告警模板模塊的內(nèi)容包括資源特征、告警策略、告警級(jí)別、告警事件和告警通知;自定義告警模板模塊用于為資源創(chuàng)建時(shí)自動(dòng)綁定資源模塊提供基礎(chǔ);告警策略包括性能指標(biāo)、閥值、比較策略、統(tǒng)計(jì)方法、統(tǒng)計(jì)周期和重復(fù)統(tǒng)計(jì)次數(shù),重復(fù)統(tǒng)計(jì)多個(gè)周期的指標(biāo)值進(jìn)行比較可以提高告警的準(zhǔn)確性。告警級(jí)別分為緊急告警、重要告警和一般告警,優(yōu)先級(jí)由高到低,同一個(gè)資源發(fā)出多個(gè)告警時(shí),優(yōu)先處理緊急的告警。
自動(dòng)綁定資源模塊用于根據(jù)自定義告警模板模塊中的資源特征,在創(chuàng)建資源時(shí),滿足該資源特征的資源都將創(chuàng)建告警實(shí)例;
評(píng)估告警模塊用于評(píng)估告警級(jí)別,根據(jù)告警級(jí)別處理告警事件;
告警處理模塊用于根據(jù)不同的告警狀態(tài)采取不同的通知策略;告警處理模塊的通知策略包括URL通知、郵件通知以及短信通知。
事件處理模塊用于處理告警事件。
實(shí)施例2:
本發(fā)明的私有化云平臺(tái)的告警實(shí)現(xiàn)方法,該方法包括如下步驟:
(1)、在自定義告警模板模塊編輯告警實(shí)例,告警實(shí)例的內(nèi)容包括告警實(shí)例的資源特征、告警策略、告警級(jí)別、告警事件和告警通知;
(2)、將告警實(shí)例傳輸?shù)阶詣?dòng)綁定資源模塊;
(3)、自動(dòng)綁定資源模塊將告警實(shí)例傳送到評(píng)估告警模塊,評(píng)估告警模塊對(duì)告警實(shí)例進(jìn)行評(píng)估,確定告警實(shí)例的告警級(jí)別以及評(píng)估告警實(shí)例;
(4)、評(píng)估告警模塊將告警實(shí)例傳送到告警處理模塊,告警處理模塊選擇告警通知的方式;評(píng)估告警實(shí)例包括以下情況:無數(shù)據(jù)、有數(shù)據(jù)且滿足告警策略以及有數(shù)據(jù)但不滿足告警策略;其中,無數(shù)據(jù)表示服務(wù)器沒有收到監(jiān)控?cái)?shù)據(jù);有數(shù)據(jù)且滿足告警策略表示當(dāng)前資源的性能達(dá)到了用戶設(shè)置的閾值;有數(shù)據(jù)但不滿足告警策略表示當(dāng)前資源還在正常運(yùn)行;
(5)、告警處理模塊將告警實(shí)例傳送到事件處理模塊,事件處理模塊對(duì)告警實(shí)例進(jìn)行處理。
通過上面具體實(shí)施方式,所述技術(shù)領(lǐng)域的技術(shù)人員可容易的實(shí)現(xiàn)本發(fā)明。但是應(yīng)當(dāng)理解,本發(fā)明并不限于上述的兩種具體實(shí)施方式。在公開的實(shí)施方式的基礎(chǔ)上,所述技術(shù)領(lǐng)域的技術(shù)人員可任意組合不同的技術(shù)特征,從而實(shí)現(xiàn)不同的技術(shù)方案。
除說明書所述的技術(shù)特征外,均為本專業(yè)技術(shù)人員的已知技術(shù)。