本發(fā)明涉及分布式集群系統(tǒng)相關(guān)技術(shù)領(lǐng)域,具體涉及一種對分布式集群系統(tǒng)進行告警服務(wù)的方法及裝置。
背景技術(shù):
分布式集群系統(tǒng)一般包含多臺服務(wù)器(server)節(jié)點,這些服務(wù)器節(jié)點組成一個集群統(tǒng)一對外提供服務(wù)。告警管理模塊是分布式集群系統(tǒng)中很重要的模塊,該模塊可以實時的檢測分布式集群系統(tǒng)中各個服務(wù)器節(jié)點的軟硬件的健康和運行狀態(tài),一旦檢測到異常,可立即上報給系統(tǒng)管理員,方便系統(tǒng)管理員能及時獲知分布式集群系統(tǒng)中的異常。
由于分布式集群的服務(wù)器節(jié)點個數(shù)不是固定的,并且每個服務(wù)器節(jié)點上的軟硬件配置也有差異,比如電源、風(fēng)扇或網(wǎng)卡的個數(shù)不相同等,在利用傳統(tǒng)的分布式集群系統(tǒng)內(nèi)的告警管理模塊進行告警服務(wù)時,首先需要系統(tǒng)管理員手動在分布式集群系統(tǒng)中各個服務(wù)器節(jié)點的配置文件中添加告警服務(wù)項列表,告警管理模塊通過讀取各個服務(wù)器節(jié)點的配置文件中的告警服務(wù)列表得知分布式集群系統(tǒng)中需要進行告警服務(wù)的服務(wù)項,進而對各服務(wù)項進行實時監(jiān)控,若檢測到某一服務(wù)項出現(xiàn)異?;蚬收?,則會通過一些方式(郵件、短信、微信等)向系統(tǒng)管理員上報該服務(wù)項的告警信息。
但是,利用傳統(tǒng)的分布式集群系統(tǒng)內(nèi)的告警管理模塊進行告警服務(wù)時,需要系統(tǒng)管理員手動在分布式集群系統(tǒng)中各個服務(wù)器節(jié)點的配置文件中添加告警服務(wù)列表,比較繁瑣且容易出現(xiàn)失誤,降低了告警管理模塊的可靠性,影響了分布式集群系統(tǒng)的部署效率。
技術(shù)實現(xiàn)要素:
有鑒于此,本發(fā)明實施例提供一種對分布式集群系統(tǒng)進行告警服務(wù)的方法及裝置,能夠避免系統(tǒng)管理員手動在分布式集群系統(tǒng)中各個服務(wù)器節(jié)點的配置文件中添加告警服務(wù)列表,減小了人工操作的失誤率,增強了告警管理模塊的可靠性,提高了分布式集群系統(tǒng)的部署效率。
為實現(xiàn)上述目的,本發(fā)明實施例提供如下技術(shù)方案:
一種對分布式集群系統(tǒng)進行告警服務(wù)的方法,應(yīng)用于自動檢測告警服務(wù)項模塊,所述方法包括:
自動檢測并識別分布式集群系統(tǒng)中集群節(jié)點的軟硬件服務(wù)項;
從所述軟硬件服務(wù)項中確定目標(biāo)軟硬件服務(wù)項;
將所述目標(biāo)軟硬件服務(wù)項填充到告警管理模塊的配置文件中的告警服務(wù)項列表中,以使所述告警管理模塊啟動后根據(jù)所述配置文件中的告警服務(wù)項列表對所述分布式集群系統(tǒng)進行告警服務(wù)。
可選的,所述自動檢測并識別分布式集群系統(tǒng)中集群節(jié)點的軟硬件服務(wù)項,包括:
通過系統(tǒng)服務(wù)模塊和硬件管理模塊自動檢測并識別分布式集群系統(tǒng)中服務(wù)器節(jié)點的軟硬件服務(wù)項。
可選的,所述從所述軟硬件服務(wù)項中確定目標(biāo)軟硬件服務(wù)項,包括:
確定所述軟硬件服務(wù)項都為所述目標(biāo)軟硬件服務(wù)項。
可選的,所述從所述軟硬件服務(wù)項中確定目標(biāo)軟硬件服務(wù)項,包括:
將所述軟硬件服務(wù)項通過簡單網(wǎng)絡(luò)管理協(xié)議獲取類接口發(fā)送至簡單網(wǎng)絡(luò)管理協(xié)議客戶端;
通過簡單網(wǎng)絡(luò)管理協(xié)議獲取類接口接收用戶在簡單網(wǎng)絡(luò)管理協(xié)議客戶端選取的軟硬件服務(wù)項;
將所述用戶在簡單網(wǎng)絡(luò)管理協(xié)議客戶端選取的軟硬件服務(wù)項作為目標(biāo)軟硬件服務(wù)項。
可選的,如果所述分布式集群系統(tǒng)中集群節(jié)點添加了新的軟硬件服務(wù)項,則所述自動檢測并識別分布式集群系統(tǒng)中集群節(jié)點的軟硬件服務(wù)項,包括:
自動檢測并識別分布式集群系統(tǒng)中集群節(jié)點添加的新的軟硬件服務(wù)項。
一種對分布式集群系統(tǒng)進行告警服務(wù)的裝置,應(yīng)用于自動檢測告警服務(wù)項模塊,所述裝置包括:
檢測單元,用于自動檢測并識別分布式集群系統(tǒng)中集群節(jié)點的軟硬件服務(wù)項;
確定單元,用于從所述軟硬件服務(wù)項中確定目標(biāo)軟硬件服務(wù)項;
填充單元,用于將所述目標(biāo)軟硬件服務(wù)項填充到告警管理模塊的配置文件中的告警服務(wù)項列表中,以使所述告警管理模塊啟動后根據(jù)所述配置文件中的告警服務(wù)項列表對所述分布式集群系統(tǒng)進行告警服務(wù)。
可選的,所述檢測單元具體用于:
通過系統(tǒng)服務(wù)模塊和硬件管理模塊自動檢測并識別分布式集群系統(tǒng)中服務(wù)器節(jié)點的軟硬件服務(wù)項。
可選的,所述確定單元具體用于:
確定所述軟硬件服務(wù)項都為所述目標(biāo)軟硬件服務(wù)項。
可選的,所述確定單元具體用于:
將所述軟硬件服務(wù)項通過簡單網(wǎng)絡(luò)管理協(xié)議獲取類接口發(fā)送至簡單網(wǎng)絡(luò)管理協(xié)議客戶端;
通過簡單網(wǎng)絡(luò)管理協(xié)議獲取類接口接收用戶在簡單網(wǎng)絡(luò)管理協(xié)議客戶端選取的軟硬件服務(wù)項;
將所述用戶在簡單網(wǎng)絡(luò)管理協(xié)議客戶端選取的軟硬件服務(wù)項作為目標(biāo)軟硬件服務(wù)項。
可選的,如果所述分布式集群系統(tǒng)中集群節(jié)點添加了新的軟硬件服務(wù)項,則所述檢測單元還用于:
自動檢測并識別分布式集群系統(tǒng)中集群節(jié)點添加的新的軟硬件服務(wù)項。
基于上述技術(shù)方案,本發(fā)明實施例中公開了一種對分布式集群系統(tǒng)進行告警服務(wù)的方法及裝置,應(yīng)用于自動檢測告警服務(wù)項模塊,所述方法包括:自動檢測并識別分布式集群系統(tǒng)中集群節(jié)點的軟硬件服務(wù)項;從所述軟硬件服務(wù)項中確定目標(biāo)軟硬件服務(wù)項;將所述目標(biāo)軟硬件服務(wù)項填充到告警管理模塊的配置文件中的告警服務(wù)項列表中,以使所述告警管理模塊啟動后根據(jù)所述配置文件中的告警服務(wù)項列表對所述分布式集群系統(tǒng)進行告警服務(wù)。上述方法及裝置能夠避免系統(tǒng)管理員手動在分布式集群系統(tǒng)中各個服務(wù)器節(jié)點的配置文件中添加告警服務(wù)列表,減小了人工操作的失誤率,增強了告警管理模塊的可靠性,提高了分布式集群系統(tǒng)的部署效率。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。
圖1為本發(fā)明實施例公開的一種對分布式集群系統(tǒng)進行告警服務(wù)的方法的流程示意圖;
圖2為本發(fā)明實施例公開的一種告警管理模塊的結(jié)構(gòu)示意圖;
圖3為本發(fā)明實施例公開的一種對分布式集群系統(tǒng)進行告警服務(wù)的裝置的結(jié)構(gòu)示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
請參閱附圖1,圖1為本發(fā)明實施例公開的一種對分布式集群系統(tǒng)進行告警服務(wù)的方法的流程示意圖,所述方法包括如下步驟:
步驟s100,自動檢測并識別分布式集群系統(tǒng)中集群節(jié)點的軟硬件服務(wù)項;
需要說明的是,本發(fā)明中公開的對分布式集群系統(tǒng)進行告警服務(wù)的方法,執(zhí)行主體是自動告警服務(wù)項模塊,該自動告警服務(wù)項模塊具體可以為在分布式集群系統(tǒng)的集群節(jié)點上添加的自動檢測告警服務(wù)項(本發(fā)明后續(xù)說明中用auto_check指代)進程。目前,分布式集群系統(tǒng)能夠?qū)崿F(xiàn)選擇自動化部署,在自動化部署腳本中添加啟動auto_check進程的命令,在初始化部署分布式集群系統(tǒng)時,auto_check進程在分布式集群系統(tǒng)的各個服務(wù)器節(jié)點上被啟動,并在分布式集群系統(tǒng)后臺實時運行。在啟動自動檢測告警服務(wù)項模塊之后,自動檢測告警服務(wù)項模塊自動檢測并識別分布式集群系統(tǒng)中集群節(jié)點的軟硬件服務(wù)項。
具體的,可以通過系統(tǒng)服務(wù)模塊和硬件管理模塊自動檢測并識別分布式集群系統(tǒng)中服務(wù)器節(jié)點的軟硬件服務(wù)項。需要說明的是,硬件管理模塊具體可以為ipmi(intelligentplatformmanagementinterface智能平臺管理接口)工具。
步驟s110,從所述軟硬件服務(wù)項中確定目標(biāo)軟硬件服務(wù)項。
具體的,所述從所述軟硬件服務(wù)項中確定目標(biāo)軟硬件服務(wù)項,包括:確定所述軟硬件服務(wù)項都為所述目標(biāo)軟硬件服務(wù)項。自動檢測告警服務(wù)項模塊將檢測并識別出的分布式集群系統(tǒng)中集群節(jié)點的軟硬件服務(wù)項全部填充到告警管理模塊的配置文件中,能夠保證對分布式集群系統(tǒng)進行告警服務(wù)的全面性。
具體的,所述從所述軟硬件服務(wù)項中確定目標(biāo)軟硬件服務(wù)項,包括:將所述軟硬件服務(wù)項通過snmpget(simplenetworkmanagementprotocolget,簡單網(wǎng)絡(luò)管理協(xié)議獲取類)接口發(fā)送至snmpclient(簡單網(wǎng)絡(luò)管理協(xié)議客戶端);通過snmpset接口接收用戶在snmpclient選取的軟硬件服務(wù)項;將所述用戶在snmpclient選取的軟硬件服務(wù)項作為目標(biāo)軟硬件服務(wù)項。根據(jù)用戶的選擇確定目標(biāo)軟硬件服務(wù)項,能夠滿足用戶對分布式集群系統(tǒng)進行告警服務(wù)的個性化需求。
步驟s120,將所述目標(biāo)軟硬件服務(wù)項填充到告警管理模塊的配置文件中的告警服務(wù)項列表中,以使所述告警管理模塊啟動后根據(jù)所述配置文件中的告警服務(wù)項列表對所述分布式集群系統(tǒng)進行告警服務(wù)。
圖2為本發(fā)明實施例公開的一種告警管理模塊的結(jié)構(gòu)示意圖。
本實施例公開了一種對分布式集群系統(tǒng)進行告警服務(wù)的方法,應(yīng)用于自動檢測告警服務(wù)項模塊,所述方法包括:自動檢測并識別分布式集群系統(tǒng)中集群節(jié)點的軟硬件服務(wù)項;從所述軟硬件服務(wù)項中確定目標(biāo)軟硬件服務(wù)項;將所述目標(biāo)軟硬件服務(wù)項填充到告警管理模塊的配置文件中的告警服務(wù)項列表中,以使所述告警管理模塊啟動后根據(jù)所述配置文件中的告警服務(wù)項列表對所述分布式集群系統(tǒng)進行告警服務(wù)。上述方法能夠避免系統(tǒng)管理員手動在分布式集群系統(tǒng)中各個服務(wù)器節(jié)點的配置文件中添加告警服務(wù)列表,減小了人工操作的失誤率,增強了告警管理模塊的可靠性,提高了分布式集群系統(tǒng)的部署效率。
在上述實施例的基礎(chǔ)上,如果所述分布式集群系統(tǒng)中集群節(jié)點添加了新的軟硬件服務(wù)項,則所述自動檢測并識別分布式集群系統(tǒng)中集群節(jié)點的軟硬件服務(wù)項,包括:自動檢測并識別分布式集群系統(tǒng)中集群節(jié)點添加的新的軟硬件服務(wù)項。在分布式集群系統(tǒng)中集群節(jié)點添加了新的軟硬件服務(wù)項時,自動檢測告警服務(wù)項模塊能夠自動檢測并識別分布式集群系統(tǒng)中集群節(jié)點添加的新的軟硬件服務(wù)項,進而能夠保證對分布式集群系統(tǒng)進行告警服務(wù)的更新。
請參閱附圖3,圖3為本發(fā)明實施例公開的一種對分布式集群系統(tǒng)進行告警服務(wù)的裝置的結(jié)構(gòu)示意圖,該裝置應(yīng)用于自動檢測告警服務(wù)項模塊,所述裝置包括:
檢測單元100,用于自動檢測并識別分布式集群系統(tǒng)中集群節(jié)點的軟硬件服務(wù)項;
確定單元110,用于從所述軟硬件服務(wù)項中確定目標(biāo)軟硬件服務(wù)項;
填充單元120,用于將所述目標(biāo)軟硬件服務(wù)項填充到告警管理模塊的配置文件中的告警服務(wù)項列表中,以使所述告警管理模塊啟動后根據(jù)所述配置文件中的告警服務(wù)項列表對所述分布式集群系統(tǒng)進行告警服務(wù)。
可選的,所述檢測單元具體用于:
通過系統(tǒng)服務(wù)模塊和硬件管理模塊自動檢測并識別分布式集群系統(tǒng)中服務(wù)器節(jié)點的軟硬件服務(wù)項。
可選的,所述確定單元具體用于:
確定所述軟硬件服務(wù)項都為所述目標(biāo)軟硬件服務(wù)項。
可選的,所述確定單元具體用于:
將所述軟硬件服務(wù)項通過簡單網(wǎng)絡(luò)管理協(xié)議獲取類接口發(fā)送至簡單網(wǎng)絡(luò)管理協(xié)議客戶端;
通過簡單網(wǎng)絡(luò)管理協(xié)議獲取類接口接收用戶在簡單網(wǎng)絡(luò)管理協(xié)議客戶端選取的軟硬件服務(wù)項;
將所述用戶在簡單網(wǎng)絡(luò)管理協(xié)議客戶端選取的軟硬件服務(wù)項作為目標(biāo)軟硬件服務(wù)項。
可選的,如果所述分布式集群系統(tǒng)中集群節(jié)點添加了新的軟硬件服務(wù)項,則所述檢測單元還用于:
自動檢測并識別分布式集群系統(tǒng)中集群節(jié)點添加的新的軟硬件服務(wù)項。
綜上所述:
本發(fā)明實施例中公開了一種對分布式集群系統(tǒng)進行告警服務(wù)的方法及裝置,應(yīng)用于自動檢測告警服務(wù)項模塊,所述方法包括:自動檢測并識別分布式集群系統(tǒng)中集群節(jié)點的軟硬件服務(wù)項;從所述軟硬件服務(wù)項中確定目標(biāo)軟硬件服務(wù)項;將所述目標(biāo)軟硬件服務(wù)項填充到告警管理模塊的配置文件中的告警服務(wù)項列表中,以使所述告警管理模塊啟動后根據(jù)所述配置文件中的告警服務(wù)項列表對所述分布式集群系統(tǒng)進行告警服務(wù)。上述方法及裝置能夠避免系統(tǒng)管理員手動在分布式集群系統(tǒng)中各個服務(wù)器節(jié)點的配置文件中添加告警服務(wù)列表,減小了人工操作的失誤率,增強了告警管理模塊的可靠性,提高了分布式集群系統(tǒng)的部署效率。
本說明書中各個實施例采用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似部分互相參見即可。對于實施例公開的裝置而言,由于其與實施例公開的方法相對應(yīng),所以描述的比較簡單,相關(guān)之處參見方法部分說明即可。
專業(yè)人員還可以進一步意識到,結(jié)合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬件、計算機軟件或者二者的結(jié)合來實現(xiàn),為了清楚地說明硬件和軟件的可互換性,在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計約束條件。專業(yè)技術(shù)人員可以對每個特定的應(yīng)用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。
結(jié)合本文中所公開的實施例描述的方法或算法的步驟可以直接用硬件、處理器執(zhí)行的軟件模塊,或者二者的結(jié)合來實施。軟件模塊可以置于隨機存儲器(ram)、內(nèi)存、只讀存儲器(rom)、電可編程rom、電可擦除可編程rom、寄存器、硬盤、可移動磁盤、cd-rom、或技術(shù)領(lǐng)域內(nèi)所公知的任意其它形式的存儲介質(zhì)中。
對所公開的實施例的上述說明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對這些實施例的多種修改對本領(lǐng)域的專業(yè)技術(shù)人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實施例中實現(xiàn)。因此,本發(fā)明將不會被限制于本文所示的這些實施例,而是要符合與本文所公開的原理和新穎特點相一致的最寬的范圍。