基于云計算的it運維管理系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供一種基于云計算的IT運維管理系統(tǒng),所述系統(tǒng)包括:一云中央控制器,復(fù)數(shù)個云節(jié)點監(jiān)測服務(wù)器以及復(fù)數(shù)個客戶端數(shù)據(jù)庫服務(wù)器,云中央控制器,負責(zé)對各個云節(jié)點監(jiān)測服務(wù)器調(diào)度監(jiān)控任務(wù),根據(jù)云節(jié)點監(jiān)測服務(wù)器的數(shù)量和監(jiān)測內(nèi)容將監(jiān)控任務(wù)分發(fā)給對應(yīng)的云節(jié)點監(jiān)測服務(wù)器,并檢測各云節(jié)點監(jiān)測服務(wù)器的工作狀態(tài);云節(jié)點監(jiān)測服務(wù)器,獲取客戶端數(shù)據(jù)庫服務(wù)器的監(jiān)測信息,隨著客戶端數(shù)據(jù)庫服務(wù)器的數(shù)量增加,能增加監(jiān)控云節(jié)點監(jiān)控服務(wù)器的數(shù)據(jù)量,且增加的云節(jié)點監(jiān)控服務(wù)器自動注冊到所述云中央控制器中,云中央控制器進行分配監(jiān)控任務(wù)。本發(fā)明能對數(shù)據(jù)中心的服務(wù)器、網(wǎng)絡(luò)和應(yīng)用進行集中監(jiān)控。
【專利說明】基于云計算的IT運維管理系統(tǒng)【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)監(jiān)控【技術(shù)領(lǐng)域】,尤其涉及一種基于云計算的IT運維管理系統(tǒng)。
【背景技術(shù)】
[0002]云計算是一個新興的商業(yè)計算模型。利用高速互聯(lián)網(wǎng)的傳輸能力,將數(shù)據(jù)的處理過程從個人計算機或服務(wù)器移到互聯(lián)網(wǎng)上的計算機集群中。這些計算機都是很普通的工業(yè)標(biāo)準(zhǔn)服務(wù)器,由一個大型的數(shù)據(jù)處理中心管理著,數(shù)據(jù)中心按客戶的需要分配計算資源,達到與超級計算機同樣的效果。
[0003]但現(xiàn)有的服務(wù)器管理軟件、硬件管理軟件卻在監(jiān)控實時性、管理便捷性、監(jiān)控對象廣泛性,以及智能預(yù)警等諸多方面未能符合要求,無法確保實時的預(yù)警策略及時落地。
[0004]早期的維護設(shè)備數(shù)量較少,型號也較單一,維護及管理起來比較簡單和耗費的時間較少,當(dāng)時的維護也只停留在基礎(chǔ),簡單來說,硬件的監(jiān)控也只是在本機上查看設(shè)備的名稱和了解一下硬件的使用情況,但是只是針對小規(guī)模設(shè)備的維護對象,小規(guī)模的維護團隊就能滿足要求,成本及效率的把控能夠得到控制。但是隨著設(shè)備的增加,規(guī)模的擴大及設(shè)備的改革換代,維護的復(fù)雜程度成倍增加及多樣化,硬件的大小程度耗損及定期的更新,一個維護團隊所耗費的時間及維護成本也會成倍的遞增。
[0005]無盤服務(wù)器,IDC機房等服務(wù)器的穩(wěn)定運行及便捷管理是至關(guān)重要、也是最為基礎(chǔ)的核心部分,直觀的列圖試、實時、單獨的預(yù)警報告、獨立的運行狀態(tài)報告及故障硬件報告在管理人員眼中占據(jù)了重要的位置。目前傳統(tǒng)的監(jiān)控管理軟件都存在著些許的不足,無法打破實時、智能預(yù)警、自動報警及云端監(jiān)控的瓶頸,如CPU故障、內(nèi)存故障、熱插拔面板其中一個接口的故障。
[0006]所有星能云監(jiān)控管理平臺實現(xiàn)了直觀智能的便捷式管理,打破了傳統(tǒng)尷尬的局面,用戶可以直觀的實時遠程監(jiān)控每一臺設(shè)備、每一個細小的變化及便捷管理,甚至包括運行時長,硬件的物理損傷程度,服務(wù)器帶機情況等實時信息。而且用戶還可以用中文漢字備注每臺設(shè)備在機房的哪個位置,例如A區(qū)機柜4號設(shè)備等信息。
[0007]云計算平臺服務(wù)端的復(fù)雜性和創(chuàng)新性,對于運維是個全新的挑戰(zhàn),運維思路和方式都為之發(fā)生改變。這種改變不是簡單的在傳統(tǒng)運維上的優(yōu)化,而是基于云計算特征孕育而生的運維重構(gòu);這種改變也并非一蹴而就,是隨著云計算平臺的發(fā)展過程不斷演進,許多都沒有最佳實踐可循,是在摸著石頭過河中不斷積累經(jīng)驗。相對傳統(tǒng)的網(wǎng)站運維,云計算平臺運維的主要特征如下。
[0008]集群是基本運維單位:組成云計算平臺的節(jié)點都是普通PC服務(wù)器,平臺的高可用性,不再借助傳統(tǒng)的高投入服務(wù)器硬件冗余方案(RAID、網(wǎng)絡(luò)雙上連、雙電源等)實現(xiàn),而是通過云計算平臺自身的魯棒性保障。這需要運維改變視角,從原來把服務(wù)器作為基本運維單位,轉(zhuǎn)變?yōu)橐约鹤鳛榛具\維單位。傳統(tǒng)運維場景下的“及時”維修服務(wù)器,在云計算場景下,可以“輕松”定期維修。而這種“輕松”,并不是對運維需求的降低,而是基于對集群整體容量和健康狀態(tài)的管理能力,即通過有效提煉和過濾各種服務(wù)器的個體運行狀態(tài),映射出集群的整體狀態(tài)的能力。集群的容量管理、部署、監(jiān)控、故障管理等運維任務(wù),都必須以集群為單位進行。
[0009]云計算集群的規(guī)模大:單集群的規(guī)模,是衡量云計算平臺能力的重要指標(biāo)之一。對于生產(chǎn)環(huán)境而言,云計算集群也必須達到一定規(guī)模,才能實現(xiàn)云計算平臺的高可用、低成本等真正價值。因此,在進行運維的規(guī)劃和實現(xiàn)時,都要以滿足大規(guī)模為必要條件。
[0010]可運維性是云平臺基本屬性:集群可運維性包括實現(xiàn)高效和大規(guī)模的部署、升級、遷移、擴容和故障管理等運維任務(wù),是集群必須具備的能力。云平臺從第一天設(shè)計開始,就必須包括該屬性。開發(fā)團隊和運維團隊需要緊密協(xié)同,結(jié)合平臺和運維特性加以實現(xiàn)。較之傳統(tǒng)運維,云計算平臺對于大規(guī)模集群的可運維性、可管理性等的要求高很多,是集群落地的剛性需求。
[0011]為了解決傳統(tǒng)二級架構(gòu)監(jiān)控方案中存在的弊端,更好地對大型數(shù)據(jù)中心和分布式廣域網(wǎng)進行集中監(jiān)控,將最新的云計算技術(shù)應(yīng)用到IT監(jiān)控領(lǐng)域,而設(shè)計了本發(fā)明專利文件。
[0012]現(xiàn)有技術(shù)中公開了一種“用于IT系統(tǒng)的分布式運維監(jiān)控系統(tǒng)”,見
【發(fā)明者】黃身錁, 林志建, 蘭晴 申請人:福州宙斯盾信息技術(shù)有限公司