本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別涉及一種檢查集群健康狀態(tài)的方法、系統(tǒng)及集群服務(wù)器。
背景技術(shù):
目前,隨著計(jì)算機(jī)技術(shù)的發(fā)展和越來(lái)越廣泛的應(yīng)用,越來(lái)越多的依賴于計(jì)算機(jī)技術(shù)的應(yīng)用系統(tǒng)走進(jìn)了人們的工作和生活。盡管隨著計(jì)算機(jī)技術(shù)以日新月異的速度發(fā)展,單臺(tái)計(jì)算機(jī)的性能和可靠性越來(lái)越好,但還是有很多現(xiàn)實(shí)的要求是單臺(tái)計(jì)算機(jī)難以達(dá)到的。比如很多行業(yè),諸如分子動(dòng)力,流體動(dòng)力等都需要高性能計(jì)算作為后臺(tái)支撐。高性能計(jì)算集群作為一個(gè)整體系統(tǒng),其架構(gòu)大多數(shù)是由很多服務(wù)器組建成集群使用,由于其需要提供強(qiáng)大的計(jì)算能力,服務(wù)器動(dòng)輒上百臺(tái)組合在一起,服務(wù)器數(shù)量多,整體的故障率也會(huì)上升,硬件故障很容易被發(fā)現(xiàn),但如何排查系統(tǒng)級(jí)故障,就是一個(gè)問(wèn)題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是提供一種檢查集群健康狀態(tài)的方法、系統(tǒng)及服務(wù)器,能夠通過(guò)檢測(cè)集群服務(wù)狀態(tài),硬件性能指標(biāo),應(yīng)用兼容性等方面來(lái)對(duì)集群做全方位的健康狀態(tài)檢查;便于技術(shù)人員對(duì)集群系統(tǒng)進(jìn)行故障排查。
為解決上述技術(shù)問(wèn)題,本發(fā)明提供一種檢查集群健康狀態(tài)的方法,包括:
設(shè)置集群健康狀態(tài)的檢測(cè)指標(biāo),其中,所述檢測(cè)指標(biāo)包括設(shè)備性能檢測(cè)指標(biāo)和集群環(huán)境狀態(tài)檢測(cè)指標(biāo);
采集所述檢測(cè)指標(biāo)對(duì)應(yīng)的狀態(tài)信息;
根據(jù)所述狀態(tài)信息,利用各所述集群環(huán)境狀態(tài)檢測(cè)指標(biāo)對(duì)應(yīng)的檢測(cè)腳本進(jìn)行檢測(cè),并根據(jù)檢測(cè)結(jié)果判定集群環(huán)境狀態(tài)的健康狀態(tài);
根據(jù)所述狀態(tài)信息,利用性能檢測(cè)程序和/或應(yīng)用性能檢測(cè)程序進(jìn)行測(cè)試,根據(jù)測(cè)試結(jié)果判定集群健康狀態(tài)。
其中,根據(jù)所述狀態(tài)信息,利用性能檢測(cè)程序和/或應(yīng)用性能檢測(cè)程序進(jìn)行測(cè)試,根據(jù)測(cè)試結(jié)果,包括:
當(dāng)判定集群環(huán)境狀態(tài)的健康狀態(tài)為健康時(shí),根據(jù)所述狀態(tài)信息,利用性能檢測(cè)程序和/或應(yīng)用性能檢測(cè)程序進(jìn)行測(cè)試,根據(jù)測(cè)試結(jié)果,判定集群健康狀態(tài)。
其中,該方法還包括:
將所述狀態(tài)信息和/或檢測(cè)結(jié)果和/或測(cè)試結(jié)果保存至日志文件中。
其中,利用性能檢測(cè)程序進(jìn)行測(cè)試,根據(jù)測(cè)試結(jié)果判定集群健康狀態(tài),包括:
利用性能檢測(cè)程序進(jìn)行單節(jié)點(diǎn)benchmark測(cè)試;
當(dāng)測(cè)試結(jié)果小于性能檢測(cè)閾值時(shí),集群健康狀態(tài)為不健康;
當(dāng)測(cè)試結(jié)果不小于性能檢測(cè)閾值時(shí),集群健康狀態(tài)為健康。
其中,利用應(yīng)用性能檢測(cè)程序進(jìn)行測(cè)試,根據(jù)測(cè)試結(jié)果判定集群健康狀態(tài)包括:
創(chuàng)建預(yù)定應(yīng)用的運(yùn)行環(huán)境;
在各運(yùn)行環(huán)境中,根據(jù)對(duì)應(yīng)狀態(tài)信息進(jìn)行小算例計(jì)算,得到測(cè)試結(jié)果;
當(dāng)測(cè)試結(jié)果小于應(yīng)用性能檢測(cè)閾值時(shí),集群健康狀態(tài)為不健康;
當(dāng)測(cè)試結(jié)果不小于應(yīng)用性能檢測(cè)閾值時(shí),集群健康狀態(tài)為健康。
本發(fā)明還提供一種檢查集群健康狀態(tài)的系統(tǒng),包括:
設(shè)置模塊,用于設(shè)置集群健康狀態(tài)的檢測(cè)指標(biāo),其中,所述檢測(cè)指標(biāo)包括設(shè)備性能檢測(cè)指標(biāo)和集群環(huán)境狀態(tài)檢測(cè)指標(biāo);
采集模塊,用于采集所述檢測(cè)指標(biāo)對(duì)應(yīng)的狀態(tài)信息;
集群環(huán)境狀態(tài)檢測(cè)模塊,用于根據(jù)所述狀態(tài)信息,利用各所述集群環(huán)境狀態(tài)檢測(cè)指標(biāo)對(duì)應(yīng)的檢測(cè)腳本進(jìn)行檢測(cè),并根據(jù)檢測(cè)結(jié)果判定集群環(huán)境狀態(tài)的健康狀態(tài);
集群性能檢測(cè)模塊,用于根據(jù)所述狀態(tài)信息,利用性能檢測(cè)程序和/或應(yīng)用性能檢測(cè)程序進(jìn)行測(cè)試,根據(jù)測(cè)試結(jié)果判定集群健康狀態(tài)。
其中,該系統(tǒng)還包括:
保存模塊,用于將所述狀態(tài)信息和/或檢測(cè)結(jié)果和/或測(cè)試結(jié)果保存至日志文件中。
其中,所述集群性能檢測(cè)模塊,包括:?jiǎn)喂?jié)點(diǎn)benchmark測(cè)試單元,用于利用性能檢測(cè)程序進(jìn)行單節(jié)點(diǎn)benchmark測(cè)試;當(dāng)測(cè)試結(jié)果小于性能檢測(cè)閾值時(shí),集群健康狀態(tài)為不健康;當(dāng)測(cè)試結(jié)果不小于性能檢測(cè)閾值時(shí),集群健康狀態(tài)為健康。
其中,所述集群性能檢測(cè)模塊,包括:應(yīng)用性能檢測(cè)單元,用于創(chuàng)建預(yù)定應(yīng)用的運(yùn)行環(huán)境;在各運(yùn)行環(huán)境中,根據(jù)對(duì)應(yīng)狀態(tài)信息進(jìn)行小算例計(jì)算,得到測(cè)試結(jié)果;當(dāng)測(cè)試結(jié)果小于應(yīng)用性能檢測(cè)閾值時(shí),集群健康狀態(tài)為不健康;當(dāng)測(cè)試結(jié)果不小于應(yīng)用性能檢測(cè)閾值時(shí),集群健康狀態(tài)為健康。
本發(fā)明還提供一種集群服務(wù)器,包括:根據(jù)上述任一項(xiàng)所述的檢查集群健康狀態(tài)的系統(tǒng)。
本發(fā)明所提供的一種檢查集群健康狀態(tài)的方法,包括:設(shè)置集群健康狀態(tài)的檢測(cè)指標(biāo),其中,所述檢測(cè)指標(biāo)包括設(shè)備性能檢測(cè)指標(biāo)和集群環(huán)境狀態(tài)檢測(cè)指標(biāo);采集所述檢測(cè)指標(biāo)對(duì)應(yīng)的狀態(tài)信息;根據(jù)所述狀態(tài)信息,利用各所述集群環(huán)境狀態(tài)檢測(cè)指標(biāo)對(duì)應(yīng)的檢測(cè)腳本進(jìn)行檢測(cè),并根據(jù)檢測(cè)結(jié)果判定集群環(huán)境狀態(tài)的健康狀態(tài);根據(jù)所述狀態(tài)信息,利用性能檢測(cè)程序和/或應(yīng)用性能檢測(cè)程序進(jìn)行測(cè)試,根據(jù)測(cè)試結(jié)果判定集群健康狀態(tài);
可見(jiàn),該方法能夠通過(guò)檢測(cè)集群服務(wù)狀態(tài),硬件性能指標(biāo),應(yīng)用兼容性等方面來(lái)對(duì)集群做全方位的健康狀態(tài)檢查;便于技術(shù)人員對(duì)集群系統(tǒng)進(jìn)行故障排查;本發(fā)明提供了一種檢查集群健康狀態(tài)的系統(tǒng)及服務(wù)器,具有上述有益效果,在此不再贅述。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例所提供的檢查集群健康狀態(tài)的方法的流程圖;
圖2為本發(fā)明實(shí)施例所提供的檢查集群健康狀態(tài)的系統(tǒng)的結(jié)構(gòu)框圖。
具體實(shí)施方式
本發(fā)明的核心是提供一種檢查集群健康狀態(tài)的方法、系統(tǒng)及服務(wù)器,能夠通過(guò)檢測(cè)集群服務(wù)狀態(tài),硬件性能指標(biāo),應(yīng)用兼容性等方面來(lái)對(duì)集群做全方位的健康狀態(tài)檢查;便于技術(shù)人員對(duì)集群系統(tǒng)進(jìn)行故障排查。
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
請(qǐng)參考圖1,圖1為本發(fā)明實(shí)施例所提供的檢查集群健康狀態(tài)的方法的流程圖;該方法可以包括:
S100、設(shè)置集群健康狀態(tài)的檢測(cè)指標(biāo),其中,所述檢測(cè)指標(biāo)包括設(shè)備性能檢測(cè)指標(biāo)和集群環(huán)境狀態(tài)檢測(cè)指標(biāo);
具體的,這里的檢測(cè)指標(biāo)要根據(jù)用戶的實(shí)際需求進(jìn)行設(shè)定,并不對(duì)該監(jiān)測(cè)指標(biāo)的具體內(nèi)容進(jìn)行限定,且用戶還可以根據(jù)實(shí)際需求的變化,對(duì)檢測(cè)指標(biāo)進(jìn)行適應(yīng)性修改;例如增加、刪除,修改檢測(cè)指標(biāo)等操作。
這里要分析高性能集群中需要檢測(cè)健康狀況的點(diǎn)即檢測(cè)指標(biāo),比如一些基礎(chǔ)服務(wù),如:NFS掛載是否正常,NIS服務(wù)是否正常,機(jī)器網(wǎng)絡(luò)是否為聯(lián)通的狀態(tài);再比如一些機(jī)器性能相關(guān),如:CPU性能,內(nèi)存性能,網(wǎng)絡(luò)性能,應(yīng)用性能等。
用戶可以選取需要檢測(cè)的健康狀況的點(diǎn),通過(guò)組合的方式來(lái)配置,這種配置用戶可以進(jìn)行修改,并且為了提高集群健康狀態(tài)的效果可以在每次登陸時(shí)進(jìn)行集群健康狀態(tài)檢測(cè),進(jìn)一步為了便于技術(shù)人員根據(jù)檢測(cè)結(jié)果排除集群系統(tǒng)故障或者及時(shí)了解集群系統(tǒng)狀態(tài),可以將檢測(cè)結(jié)果以報(bào)告的形式輸出給用戶。用戶可以根據(jù)輸出的報(bào)告進(jìn)行下一步處理。
進(jìn)一步為了節(jié)約技術(shù)人員查看報(bào)告的時(shí)間,可以將一些檢測(cè)結(jié)果以各種具體生動(dòng)的形式進(jìn)行表示。也可以僅僅輸出異常的信息進(jìn)一步節(jié)約用戶時(shí)間。
由于每一次開機(jī)時(shí)都可以對(duì)系統(tǒng)進(jìn)行檢測(cè),用戶可以根據(jù)每次檢測(cè)結(jié)果總結(jié)出集群系統(tǒng)的長(zhǎng)期狀態(tài),以便用戶及時(shí)預(yù)測(cè)或者根據(jù)歷史數(shù)據(jù)排查集群系統(tǒng)故障,可以將每次監(jiān)測(cè)結(jié)果記錄在日志中,以便備查。
S110、采集所述檢測(cè)指標(biāo)對(duì)應(yīng)的狀態(tài)信息;
具體的,采集操作可以是通過(guò)向集群中各服務(wù)器操作系統(tǒng)發(fā)送指令獲取,包括節(jié)點(diǎn)名稱,CPU,內(nèi)存,網(wǎng)絡(luò)等指標(biāo)的狀態(tài)信息,可選的,可以將這些狀態(tài)信息保存至日志文件。
S120、根據(jù)所述狀態(tài)信息,利用各所述集群環(huán)境狀態(tài)檢測(cè)指標(biāo)對(duì)應(yīng)的檢測(cè)腳本進(jìn)行檢測(cè),并根據(jù)檢測(cè)結(jié)果判定集群環(huán)境狀態(tài)的健康狀態(tài);
具體的,通過(guò)創(chuàng)建一系列腳本來(lái)對(duì)集群中各個(gè)節(jié)點(diǎn)的集群環(huán)境配置進(jìn)行健康檢測(cè),其中可以包括節(jié)點(diǎn)間ssh無(wú)密碼訪問(wèn),NIS服務(wù),NFS服務(wù),節(jié)點(diǎn)目錄掛載情況,以及各節(jié)點(diǎn)配置的一致性檢查等腳本信息,可選的,將這些信息以及對(duì)應(yīng)的檢測(cè)結(jié)果保存至日志文件。根據(jù)這些檢測(cè)結(jié)果可以判定集群環(huán)境狀態(tài)的健康狀態(tài),具體的判定規(guī)則可以根據(jù)用戶需求進(jìn)行實(shí)際設(shè)置,用戶可以考慮對(duì)集群環(huán)境狀態(tài)設(shè)置情況以及健康狀態(tài)的要求等來(lái)設(shè)定判定規(guī)則。
這里的判定結(jié)果可以僅僅包含集群環(huán)境狀態(tài)為健康和不健康,也可以對(duì)集群環(huán)境狀態(tài)劃分健康等級(jí)??蛇x的,可以將這些檢測(cè)結(jié)果保存至日志文件。
S130、根據(jù)所述狀態(tài)信息,利用性能檢測(cè)程序和/或應(yīng)用性能檢測(cè)程序進(jìn)行測(cè)試,根據(jù)測(cè)試結(jié)果判定集群健康狀態(tài)。
具體的,這里性能檢測(cè)程序和應(yīng)用性能檢測(cè)程序用戶可以選擇都進(jìn)行檢測(cè),也可以僅進(jìn)行其中一項(xiàng)檢測(cè)。且用戶可以根據(jù)自身的實(shí)際需求設(shè)定性能檢測(cè)程序和應(yīng)用性能檢測(cè)程序的實(shí)際內(nèi)容。可選的,可以將對(duì)應(yīng)的測(cè)試結(jié)果保存至日志文件。
可選的,利用性能檢測(cè)程序進(jìn)行測(cè)試,根據(jù)測(cè)試結(jié)果判定集群健康狀態(tài),包括:
利用性能檢測(cè)程序進(jìn)行單節(jié)點(diǎn)benchmark測(cè)試;
當(dāng)測(cè)試結(jié)果小于性能檢測(cè)閾值時(shí),集群健康狀態(tài)為不健康;
當(dāng)測(cè)試結(jié)果不小于性能檢測(cè)閾值時(shí),集群健康狀態(tài)為健康。
具體的,單節(jié)點(diǎn)benchmark檢測(cè),如檢測(cè)CPU性能的HPL(High Performance Linpack,一種用于測(cè)量CPU浮點(diǎn)運(yùn)算性能的基準(zhǔn)測(cè)試程序),檢測(cè)內(nèi)存性能的STREAM即一種用于測(cè)量?jī)?nèi)存帶寬性能的基準(zhǔn)測(cè)試程序,通過(guò)收集到的CPU,內(nèi)存信息,可以計(jì)算出benchmark相應(yīng)的理論值,根據(jù)百分比定義一個(gè)閾值即性能檢測(cè)閾值,通常設(shè)為80%即可(這是一個(gè)經(jīng)驗(yàn)值)當(dāng)然這里并不對(duì)具體的性能檢測(cè)閾值進(jìn)行限定,實(shí)際計(jì)算結(jié)果與閾值作對(duì)比,高于閾值為通過(guò)即集群健康狀態(tài)為健康,低于為不通過(guò)即集群健康狀態(tài)為不健康,并可以顯示檢測(cè)結(jié)果。用戶也可以進(jìn)行集群健康狀態(tài)等級(jí)設(shè)定即可以設(shè)定不同的等級(jí)對(duì)應(yīng)的閾值。這里當(dāng)用戶僅僅進(jìn)行性能檢測(cè)時(shí),該檢測(cè)結(jié)果即集群健康狀態(tài)結(jié)果,若用戶還需要進(jìn)行應(yīng)用性能檢測(cè)時(shí),該結(jié)果為集群的性能檢測(cè)健康狀況,最終集群的健康狀態(tài)還需要考慮應(yīng)用性能檢測(cè)的結(jié)果。
可選的,利用應(yīng)用性能檢測(cè)程序進(jìn)行測(cè)試,根據(jù)測(cè)試結(jié)果判定集群健康狀態(tài)包括:
創(chuàng)建預(yù)定應(yīng)用的運(yùn)行環(huán)境;
在各運(yùn)行環(huán)境中,根據(jù)對(duì)應(yīng)狀態(tài)信息進(jìn)行小算例計(jì)算,得到測(cè)試結(jié)果;
當(dāng)測(cè)試結(jié)果小于應(yīng)用性能檢測(cè)閾值時(shí),集群健康狀態(tài)為不健康;
當(dāng)測(cè)試結(jié)果不小于應(yīng)用性能檢測(cè)閾值時(shí),集群健康狀態(tài)為健康。
具體的,根據(jù)不同的應(yīng)用類型,創(chuàng)建典型應(yīng)用的運(yùn)行環(huán)境,提供小算例進(jìn)行計(jì)算,并設(shè)置一個(gè)經(jīng)驗(yàn)數(shù)據(jù)為閾值,通過(guò)對(duì)比閾值來(lái)判定集群在運(yùn)行應(yīng)用時(shí)是否通過(guò)健康性檢測(cè)。這里當(dāng)用戶僅僅進(jìn)行應(yīng)用性能檢測(cè)時(shí),該檢測(cè)結(jié)果即集群健康狀態(tài)結(jié)果,若用戶還需要進(jìn)行性能檢測(cè)時(shí),該結(jié)果為集群的應(yīng)用性能檢測(cè)健康狀況,最終集群的健康狀態(tài)還需要考慮性能檢測(cè)的結(jié)果。
其中,這里的測(cè)試結(jié)果可以為單個(gè)應(yīng)用的測(cè)試結(jié)果,也可以是多個(gè)應(yīng)用時(shí)的綜合測(cè)試結(jié)果。用戶也可以進(jìn)行集群健康狀態(tài)等級(jí)設(shè)定即可以設(shè)定不同的等級(jí)對(duì)應(yīng)的閾值。
若用戶兩種檢測(cè)都進(jìn)行時(shí),可以在每種檢測(cè)都為健康時(shí),判定集群健康狀態(tài)為健康。也可以是其他判定規(guī)則根據(jù)用戶配置的檢測(cè)內(nèi)容進(jìn)行確定。
進(jìn)一步為了提高集群健康狀態(tài)檢測(cè)速度,可以在判定集群環(huán)境狀態(tài)的健康狀態(tài)為健康時(shí),再執(zhí)行步驟S130。
即在初步搭建好的集群系統(tǒng)中實(shí)施該方法,對(duì)集群健康度進(jìn)行檢查,可通過(guò)配置文件來(lái)定制檢測(cè)內(nèi)容,一般的,進(jìn)行全面的健康度檢查,檢查完畢后,該方法會(huì)將檢測(cè)結(jié)果輸出到日志文件中,并提示不通過(guò)項(xiàng),以便維護(hù)人員發(fā)現(xiàn)問(wèn)題,解決問(wèn)題,確保集群正常穩(wěn)定運(yùn)行。但是當(dāng)S120已經(jīng)檢測(cè)出錯(cuò)誤時(shí),可以節(jié)約時(shí)間不再進(jìn)行步驟S130的檢測(cè)。
其中,S110到S130中的每一步驟得到的結(jié)果都可以顯示給用戶,用戶可以根據(jù)顯示的結(jié)果判定是否需要繼續(xù)進(jìn)行集群監(jiān)控狀態(tài)的檢測(cè)。且顯示的過(guò)程可以使用戶更好的了解檢測(cè)進(jìn)程。
基于上述技術(shù)方案,本發(fā)明實(shí)施例提供的檢查集群健康狀態(tài)的方法,通過(guò)檢測(cè)集群服務(wù)狀態(tài),硬件性能指標(biāo),應(yīng)用兼容性等方面來(lái)對(duì)集群做全方位的健康狀態(tài)檢查,同時(shí)輸出檢測(cè)報(bào)告,來(lái)解決集群系統(tǒng)級(jí)故障的排查問(wèn)題。
下面對(duì)本發(fā)明實(shí)施例提供的檢查集群健康狀態(tài)的系統(tǒng)及集群服務(wù)器進(jìn)行介紹,下文描述的檢查集群健康狀態(tài)的系統(tǒng)及集群服務(wù)器與上文描述的檢查集群健康狀態(tài)的方法可相互對(duì)應(yīng)參照。
請(qǐng)參考圖2,圖2為本發(fā)明實(shí)施例所提供的檢查集群健康狀態(tài)的系統(tǒng)的結(jié)構(gòu)框圖;該系統(tǒng)可以包括:
設(shè)置模塊100,用于設(shè)置集群健康狀態(tài)的檢測(cè)指標(biāo),其中,所述檢測(cè)指標(biāo)包括設(shè)備性能檢測(cè)指標(biāo)和集群環(huán)境狀態(tài)檢測(cè)指標(biāo);
采集模塊200,用于采集所述檢測(cè)指標(biāo)對(duì)應(yīng)的狀態(tài)信息;
集群環(huán)境狀態(tài)檢測(cè)模塊300,用于根據(jù)所述狀態(tài)信息,利用各所述集群環(huán)境狀態(tài)檢測(cè)指標(biāo)對(duì)應(yīng)的檢測(cè)腳本進(jìn)行檢測(cè),并根據(jù)檢測(cè)結(jié)果判定集群環(huán)境狀態(tài)的健康狀態(tài);
集群性能檢測(cè)模塊400,用于根據(jù)所述狀態(tài)信息,利用性能檢測(cè)程序和/或應(yīng)用性能檢測(cè)程序進(jìn)行測(cè)試,根據(jù)測(cè)試結(jié)果判定集群健康狀態(tài)。
基于上述實(shí)施例,該系統(tǒng)還包括:
保存模塊,用于將所述狀態(tài)信息和/或檢測(cè)結(jié)果和/或測(cè)試結(jié)果保存至日志文件中。
基于上述任意實(shí)施例,所述集群性能檢測(cè)模塊400,包括:?jiǎn)喂?jié)點(diǎn)benchmark測(cè)試單元,用于利用性能檢測(cè)程序進(jìn)行單節(jié)點(diǎn)benchmark測(cè)試;當(dāng)測(cè)試結(jié)果小于性能檢測(cè)閾值時(shí),集群健康狀態(tài)為不健康;當(dāng)測(cè)試結(jié)果不小于性能檢測(cè)閾值時(shí),集群健康狀態(tài)為健康。
基于上述任意實(shí)施例,所述集群性能檢測(cè)模塊400,包括:應(yīng)用性能檢測(cè)單元,用于創(chuàng)建預(yù)定應(yīng)用的運(yùn)行環(huán)境;在各運(yùn)行環(huán)境中,根據(jù)對(duì)應(yīng)狀態(tài)信息進(jìn)行小算例計(jì)算,得到測(cè)試結(jié)果;當(dāng)測(cè)試結(jié)果小于應(yīng)用性能檢測(cè)閾值時(shí),集群健康狀態(tài)為不健康;當(dāng)測(cè)試結(jié)果不小于應(yīng)用性能檢測(cè)閾值時(shí),集群健康狀態(tài)為健康。
基于上述任意實(shí)施例,該系統(tǒng)還包括:
顯示模塊,用于將所述狀態(tài)信息和/或檢測(cè)結(jié)果和/或測(cè)試結(jié)果及集群健康狀態(tài)進(jìn)行顯示。
本發(fā)明實(shí)施例還提供一種集群服務(wù)器,包括:根據(jù)上述任意實(shí)施例所述的檢查集群健康狀態(tài)的系統(tǒng)。
說(shuō)明書中各個(gè)實(shí)施例采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似部分互相參見(jiàn)即可。對(duì)于實(shí)施例公開的裝置而言,由于其與實(shí)施例公開的方法相對(duì)應(yīng),所以描述的比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法部分說(shuō)明即可。
專業(yè)人員還可以進(jìn)一步意識(shí)到,結(jié)合本文中所公開的實(shí)施例描述的各示例的單元及算法步驟,能夠以電子硬件、計(jì)算機(jī)軟件或者二者的結(jié)合來(lái)實(shí)現(xiàn),為了清楚地說(shuō)明硬件和軟件的可互換性,在上述說(shuō)明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來(lái)執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以對(duì)每個(gè)特定的應(yīng)用來(lái)使用不同方法來(lái)實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。
結(jié)合本文中所公開的實(shí)施例描述的方法或算法的步驟可以直接用硬件、處理器執(zhí)行的軟件模塊,或者二者的結(jié)合來(lái)實(shí)施。軟件模塊可以置于隨機(jī)存儲(chǔ)器(RAM)、內(nèi)存、只讀存儲(chǔ)器(ROM)、電可編程ROM、電可擦除可編程ROM、寄存器、硬盤、可移動(dòng)磁盤、CD-ROM、或技術(shù)領(lǐng)域內(nèi)所公知的任意其它形式的存儲(chǔ)介質(zhì)中。
以上對(duì)本發(fā)明所提供的檢查集群健康狀態(tài)的方法、系統(tǒng)及集群服務(wù)器進(jìn)行了詳細(xì)介紹。本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及其核心思想。應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明原理的前提下,還可以對(duì)本發(fā)明進(jìn)行若干改進(jìn)和修飾,這些改進(jìn)和修飾也落入本發(fā)明權(quán)利要求的保護(hù)范圍內(nèi)。