一種分散式機(jī)房綜合監(jiān)控及自動(dòng)應(yīng)急決策處理方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種分散式機(jī)房綜合監(jiān)控及自動(dòng)應(yīng)急決策處理方法及裝置。
[0002]
【背景技術(shù)】
[0003]隨著計(jì)算機(jī)行業(yè)的全面發(fā)展,大部分的企事業(yè)單位都已經(jīng)實(shí)施了信息化辦公。由于信息系統(tǒng)業(yè)務(wù)的不斷拓展,需要不斷加大系統(tǒng)硬件投入以及保證足夠的網(wǎng)絡(luò)傳輸帶寬,所以需要越來(lái)越多的服務(wù)器資源以及機(jī)房空間,很多企事業(yè)單位將服務(wù)器及網(wǎng)絡(luò)設(shè)備分散布置在不同的地點(diǎn),不同的機(jī)房,所以對(duì)于分散式機(jī)房的集中綜合監(jiān)控和管理也越來(lái)越重要。對(duì)于傳統(tǒng)的分散式機(jī)房監(jiān)控機(jī)制,有一些采用人工定時(shí)巡檢機(jī)制,這種方案需要投入大量的人力,而且也不能保障第一時(shí)間發(fā)現(xiàn)故障。另外一些采用傳統(tǒng)的自動(dòng)監(jiān)控系統(tǒng),由系統(tǒng)自動(dòng)監(jiān)測(cè)并提供故障信息,通過(guò)短信或郵件的方式通知值班人員進(jìn)行處理,但是由于機(jī)房一般會(huì)出現(xiàn)斷電故障,網(wǎng)絡(luò)故障,系統(tǒng)硬件故障等不同等級(jí)和類(lèi)別的故障,而且對(duì)于分散式機(jī)房在不同地點(diǎn)分布的多個(gè)機(jī)房,故障發(fā)生位置和機(jī)房的物理位置也有一定對(duì)照關(guān)聯(lián),傳統(tǒng)的自動(dòng)監(jiān)控系統(tǒng)無(wú)法分類(lèi)各種故障信息,無(wú)法分清故障嚴(yán)重程度,無(wú)法將機(jī)房故障類(lèi)別信息和物理位置信息結(jié)合起來(lái)綜合處理,系統(tǒng)本身也沒(méi)有故障處理和自動(dòng)應(yīng)急決策的能力,只能依靠值班人員做出決策后,再匯報(bào)相關(guān)領(lǐng)導(dǎo)進(jìn)行決策,然后通知相關(guān)工程師進(jìn)行故障處理;而且傳統(tǒng)的自動(dòng)監(jiān)控系統(tǒng)一般依靠單臺(tái)監(jiān)控服務(wù)器提供監(jiān)控功能,單臺(tái)短信服務(wù)器提供報(bào)警功能,當(dāng)監(jiān)控服務(wù)器和短信服務(wù)器本身出現(xiàn)故障時(shí)候無(wú)法繼續(xù)工作。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的在于提供一種分散式機(jī)房綜合監(jiān)控及自動(dòng)應(yīng)急決策處理方法及裝置,使用現(xiàn)有的成熟的網(wǎng)絡(luò)連接中斷檢測(cè)技術(shù)、信息顯示設(shè)備、斷電監(jiān)測(cè)器、不間斷電源、短信服務(wù)器、短信接收設(shè)備等,通過(guò)信息化手段和硬件設(shè)備的設(shè)計(jì),整合綜合監(jiān)控及自動(dòng)應(yīng)急決策處理流程,實(shí)現(xiàn)24小時(shí)機(jī)房綜合監(jiān)控及自動(dòng)應(yīng)急決策處理。
[0005]本發(fā)明為解決上述技術(shù)問(wèn)題所采用的技術(shù)方案如下。
[0006]—種分散式機(jī)房綜合監(jiān)控及自動(dòng)應(yīng)急決策處理方法,其特征在于:故障決策分析處理服務(wù)器按照系統(tǒng)設(shè)定的監(jiān)控時(shí)間間隔定時(shí)執(zhí)行以下步驟,具體為:
步驟S1、故障決策分析處理服務(wù)器判斷另一臺(tái)故障決策分析處理服務(wù)器是否出現(xiàn)故障,如果出現(xiàn)故障則轉(zhuǎn)入S2步驟,如果未出現(xiàn)故障則轉(zhuǎn)入S3步驟;
步驟S2、故障決策分析處理服務(wù)器將另一臺(tái)決策分析處理服務(wù)器的故障狀態(tài)發(fā)送給支持顯示功能的設(shè)備進(jìn)行顯示,并調(diào)用短信服務(wù)器發(fā)送另一臺(tái)決策分析處理服務(wù)器的故障狀態(tài)給相關(guān)人員;
步驟S3、故障決策分析處理服務(wù)器依次判斷兩臺(tái)短信服務(wù)器是否出現(xiàn)故障,如果出現(xiàn)故障則轉(zhuǎn)入S4步驟,如果未出現(xiàn)故障則轉(zhuǎn)入S5步驟;
步驟S4、故障決策分析處理服務(wù)器將出現(xiàn)故障的短信服務(wù)器狀態(tài)發(fā)送給支持顯示功能的設(shè)備進(jìn)行顯示,并調(diào)用未出現(xiàn)故障的短信服務(wù)器發(fā)送故障狀態(tài)給相關(guān)人員;
步驟S5、故障決策分析處理服務(wù)器判斷機(jī)房層不間斷電源是否啟動(dòng),如果不間斷電源啟動(dòng)則轉(zhuǎn)入S6步驟,如果不間斷電源未啟動(dòng)則轉(zhuǎn)入S7步驟;
步驟S6、故障決策分析處理服務(wù)器判定機(jī)房層斷電,調(diào)用短信服務(wù)器發(fā)送斷電故障狀態(tài)給相關(guān)人員,并轉(zhuǎn)入SI5步驟;
步驟S7、故障決策分析處理服務(wù)器依次判斷所有斷電監(jiān)測(cè)器是否報(bào)警,如果斷電監(jiān)測(cè)器報(bào)警則轉(zhuǎn)入S8步驟,如果所有斷電監(jiān)測(cè)器未報(bào)警則轉(zhuǎn)入S9步驟;
步驟S8、故障決策分析處理服務(wù)器判定斷電監(jiān)測(cè)器相對(duì)應(yīng)的服務(wù)器或網(wǎng)絡(luò)設(shè)備斷電,調(diào)用短信服務(wù)器發(fā)送相關(guān)斷電監(jiān)測(cè)器代碼給相關(guān)人員;
步驟S9、故障決策分析處理服務(wù)器依次測(cè)試所有網(wǎng)絡(luò)設(shè)備是否連通,如果網(wǎng)絡(luò)設(shè)備不連通則轉(zhuǎn)入SlO步驟,如果所有網(wǎng)絡(luò)設(shè)備連通則轉(zhuǎn)入Sll步驟;
步驟S10、故障決策分析處理服務(wù)器判定有不連通的網(wǎng)絡(luò)設(shè)備,調(diào)用短信服務(wù)器發(fā)送不連通的網(wǎng)絡(luò)設(shè)備代碼給相關(guān)人員;
步驟SI 1、故障決策分析處理服務(wù)器依次判斷所有服務(wù)器是否有故障,如果服務(wù)器有故障則轉(zhuǎn)入S12步驟,如果所有服務(wù)器沒(méi)有故障則轉(zhuǎn)入S15步驟;
步驟S12、故障決策分析處理服務(wù)器判斷出現(xiàn)故障的服務(wù)器是否有備用機(jī),如果出現(xiàn)故障的服務(wù)器有備用機(jī)則轉(zhuǎn)入S13步驟,如果出現(xiàn)故障的服務(wù)器沒(méi)有備用機(jī)則轉(zhuǎn)入S15步驟;步驟S13、故障決策分析處理服務(wù)器判斷備用機(jī)是否有故障,如果備用機(jī)沒(méi)有故障則轉(zhuǎn)入S14步驟,如果備用機(jī)有故障則轉(zhuǎn)入S15步驟;
步驟S14、故障決策分析處理服務(wù)器自動(dòng)啟動(dòng)備用機(jī);
步驟S15、故障決策分析處理服務(wù)器將當(dāng)前機(jī)房層的所有運(yùn)行狀態(tài)發(fā)送給支持顯示功能的設(shè)備進(jìn)行顯示。
[0007]一種分散式機(jī)房綜合監(jiān)控及自動(dòng)應(yīng)急決策處理裝置,其特征在于:包括應(yīng)用層、故障決策分析處理層和機(jī)房層;
所述應(yīng)用層設(shè)備有監(jiān)控屏幕、平板電腦、智能手機(jī)和短信接收設(shè)備;所述故障決策分析處理層包括獨(dú)立空間一和獨(dú)立空間二 ;
所述獨(dú)立空間一包括故障決策分析處理服務(wù)器一和短信服務(wù)器一;所述獨(dú)立空間二包括故障決策分析處理服務(wù)器二和短信服務(wù)器二;所述獨(dú)立空間一和獨(dú)立空間二是絕對(duì)獨(dú)立的兩個(gè)空間,采用獨(dú)立物理位置,獨(dú)立供電,獨(dú)立網(wǎng)絡(luò);
所述機(jī)房層有服務(wù)器、網(wǎng)絡(luò)設(shè)備、斷電監(jiān)測(cè)器、電源插座、不間斷電源和總電源;
所述監(jiān)控屏幕、平板電腦、智能手機(jī)分別與故障決策分析處理服務(wù)器一和故障決策分析處理服務(wù)器二通過(guò)LAN網(wǎng)連接;
所述故障決策分析處理服務(wù)器一、故障決策分析處理服務(wù)器二、短信服務(wù)器一、短信服務(wù)器二、服務(wù)器和網(wǎng)絡(luò)設(shè)備通過(guò)LAN網(wǎng)連接;
所述短信接收設(shè)備、短信服務(wù)器一和短信服務(wù)器二通過(guò)Internet網(wǎng)絡(luò)連接;
所述服務(wù)器、網(wǎng)絡(luò)設(shè)備和斷電監(jiān)測(cè)器通過(guò)電源線(xiàn)連接;
所述斷電監(jiān)測(cè)器和電源插座通過(guò)電源線(xiàn)連接;
所述電源插座和不間斷電源通過(guò)電源線(xiàn)連接;
所述不間斷電源和總電源通過(guò)電源線(xiàn)連接。
[0008]本發(fā)明具有有益效果。本發(fā)明不需要人工定時(shí)巡檢機(jī)制,保障第一時(shí)間發(fā)現(xiàn)故障。提供多重安全性保障,采用獨(dú)立空間隔離的雙故障決策分析處理服務(wù)器提供監(jiān)控功能,雙短信服務(wù)器提供報(bào)警功能,當(dāng)某一臺(tái)故障決策分析處理服務(wù)器或短信服務(wù)器本身出現(xiàn)故障,另一個(gè)獨(dú)立空間的另一臺(tái)故障決策分析處理服務(wù)器或短信服務(wù)器將繼續(xù)工作,提高系統(tǒng)健壯性。具有自動(dòng)應(yīng)急決策功能,當(dāng)發(fā)現(xiàn)某臺(tái)服務(wù)器出現(xiàn)故障時(shí),則自動(dòng)啟動(dòng)該服務(wù)器所對(duì)應(yīng)的備用服務(wù)器。分類(lèi)故障信息推送給相關(guān)人員,故障決策分析處理服務(wù)器分類(lèi)各種故障信息,分析某臺(tái)服務(wù)器出現(xiàn)故障的嚴(yán)重程度,根據(jù)系統(tǒng)定義的應(yīng)急決策方案,實(shí)時(shí)推送給顯示設(shè)備,并采用短信方式通知相關(guān)人員,提高了應(yīng)急處理的效率。
【附圖說(shuō)明】
[0009]圖1是本發(fā)明一種分散式機(jī)房綜合監(jiān)控及自動(dòng)應(yīng)急決策處理裝置的總體結(jié)構(gòu)示意圖。
[0010]圖中:1-監(jiān)控屏幕,2-平板電腦,3-智能手機(jī),4-短信接收設(shè)備,5-故障決策分析處理服務(wù)器一,6-故障決策分析處理服務(wù)器二,7-短信服務(wù)器一,8-短信服務(wù)器二,9-服務(wù)器,I O-網(wǎng)絡(luò)設(shè)備,11 -斷電監(jiān)測(cè)器,12-電源插座,13-不間斷電源,14-總電源。
[0011]圖2是一種分散式機(jī)房綜合監(jiān)控及自動(dòng)應(yīng)急決策處理方法的故障決策分析處理服務(wù)器工作流程圖。
【具體實(shí)施方式】
[0012]下面結(jié)合附圖和【具體實(shí)施方式】對(duì)本實(shí)用新型作進(jìn)一步詳細(xì)地說(shuō)明。
[0013]由圖1所示的本發(fā)明一種分散式機(jī)房綜合監(jiān)控及自動(dòng)應(yīng)急決策處理裝置的原理圖可知,它包括應(yīng)用層、故障決策分析處理層和機(jī)房層。
[0014]所述的應(yīng)用層設(shè)備有監(jiān)控屏幕1、平板電腦2、智能手機(jī)3和短信接收設(shè)備4。
[0015]所述的故障決策分析處理層包括獨(dú)立空間一和獨(dú)立空間二。
[0016]所述的獨(dú)立空間一包括故障決策分析處理服務(wù)器一 5和短信服務(wù)器一 7。
[0017]所述的獨(dú)立空間二包括故障決策分析處理服務(wù)器二 6和短信服務(wù)器二 8。
[0018]所述的獨(dú)立空間一和獨(dú)立空間二是絕對(duì)獨(dú)立的兩個(gè)空間,采用獨(dú)立物理位置,獨(dú)立供電,獨(dú)立網(wǎng)絡(luò)。
[0019]所述的機(jī)房層有服務(wù)器9、網(wǎng)絡(luò)設(shè)備10、斷電監(jiān)測(cè)器11、電源插座12、不間斷電源13和總電源14。
[0020]所述的監(jiān)控屏幕1、平板電腦2、智能手機(jī)3分別與故障決策分析處理服務(wù)器一5和故障決策分析處理服務(wù)器二 6通過(guò)LAN網(wǎng)連接。
[0021]所述的故障決策分析處理服務(wù)器一5、故障決策分析處理服務(wù)器二 6、短信服務(wù)器一 7、短信服務(wù)器二 8、服務(wù)器9和網(wǎng)絡(luò)設(shè)備10通過(guò)LAN網(wǎng)連接。
[0022]所述的短信接收設(shè)備4、短信服務(wù)器一7和短信服務(wù)器二 8通過(guò)Internet網(wǎng)絡(luò)連接。
[0023]所述的服務(wù)器9、網(wǎng)絡(luò)設(shè)備10和斷電監(jiān)測(cè)器11通過(guò)電源線(xiàn)連接。
[0024]所述的斷電監(jiān)測(cè)器11和電源插座12通過(guò)電源線(xiàn)連接。
[0025]所述的電源插座12和不間斷電源13通過(guò)電源線(xiàn)連接。
[0026]所述的不間斷電源13和總電源14通過(guò)電源線(xiàn)連接。
[0027]一種分散式機(jī)房綜合監(jiān)控及自動(dòng)應(yīng)急決策處理方法的故障決策分析處理服務(wù)器工作流程如圖2所示。本發(fā)明以故障決策分析處理服務(wù)器5為例具體工作過(guò)程如下:
故障決策分析處理服務(wù)器5按照系統(tǒng)設(shè)定的監(jiān)控時(shí)間間隔定時(shí)執(zhí)行以下步驟步驟S1、故障決策分析處理服務(wù)器5判斷故障決策分析處理服務(wù)器6是否出現(xiàn)故障,如果出現(xiàn)故障則轉(zhuǎn)入S2步驟,如果未出現(xiàn)故障則轉(zhuǎn)入S3步驟;
步驟S2、故障決策分析處理服務(wù)器5將決策分析處理服務(wù)器6的故障狀態(tài)發(fā)送給監(jiān)控屏幕1、平板電腦2和智能手機(jī)3進(jìn)行顯示,并調(diào)用短信服務(wù)器7發(fā)送決策分析處理服務(wù)器6的故障狀態(tài)給相關(guān)人員;
步驟S3、故障決策分析處理服務(wù)器5依次判斷短信服務(wù)器7和短信服務(wù)器8是否出現(xiàn)故障,如果出現(xiàn)故障則轉(zhuǎn)入S4步驟,如果未出現(xiàn)故障則轉(zhuǎn)入S5步驟;
當(dāng)前第1頁(yè)
1 
2