基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng),包含有策略數(shù)據(jù)庫、策略引擎、數(shù)據(jù)處理裝置、設(shè)備控制裝置、監(jiān)控裝置;策略數(shù)據(jù)庫、數(shù)據(jù)處理裝置、設(shè)備控制裝置均與策略引擎通訊連接,監(jiān)控裝置與數(shù)據(jù)處理裝置通訊連接,可實現(xiàn)對電源功耗的有效監(jiān)控,及時、全面、準(zhǔn)確的對能耗情況進行監(jiān)控,以此為基礎(chǔ),進行數(shù)據(jù)中心工作情況的分析和判斷,進而實施管理和控制,以促使數(shù)據(jù)中心處于更合理的運行狀態(tài)。
【專利說明】基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及IT運維服務(wù)領(lǐng)域,尤其是一種基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng)。
【背景技術(shù)】
[0002]隨著IT技術(shù)的廣泛發(fā)展和應(yīng)用,人們對IT技術(shù)的依賴也越來越大,承載信息技術(shù)方案的設(shè)備實體的規(guī)模日益龐大,數(shù)據(jù)中心作為專業(yè)載體,可提高各設(shè)備的利用效率和維護水平,但在數(shù)據(jù)中心的建設(shè)和使用中也存在諸多問題,其中,高能耗問題不僅影響了運營成本,而且威脅到了系統(tǒng)的穩(wěn)定性,現(xiàn)有數(shù)據(jù)中心內(nèi)的設(shè)備如服務(wù)器一般長期開機運行,即使設(shè)計負載不飽和或者負載波谷時段,也難以實現(xiàn)停機管控,不利于降低能耗、節(jié)約供電成本;與此同時,長期高能耗帶導(dǎo)致熱能淤積,往往需要采取額外的制冷措施,這又一次增加了數(shù)據(jù)中心維護成本;再者,出于對服務(wù)器過密、無法及時散熱,威脅到設(shè)備穩(wěn)定工作的擔(dān)憂,數(shù)據(jù)中心機柜實際難以滿柜,影響了利用率而間接提高了成本;另外,供電異常會造成數(shù)據(jù)中心數(shù)據(jù)丟失,造成不必要的經(jīng)濟損失。
[0003]因此,如何對數(shù)據(jù)中心服務(wù)器平臺進行實時監(jiān)控以避免數(shù)據(jù)中心局部過熱,解決功耗狀態(tài)未知;如何在允許范圍內(nèi)提高數(shù)據(jù)中心機架的密度以減少成本;如何在供電異常的情況下提前告警,并自動降低數(shù)據(jù)中心功耗以獲取關(guān)鍵的時間進行數(shù)據(jù)搶救,均是當(dāng)下IT運維領(lǐng)域的管理人員面臨的迫切問題。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的在于提供一種基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng),實現(xiàn)對電源功耗的有效監(jiān)控,及時、全面、準(zhǔn)確的對能耗情況進行監(jiān)控,以此為基礎(chǔ),進行數(shù)據(jù)中心工作情況的分析和判斷,進而實施管理和控制,以促使數(shù)據(jù)中心處于更合理的運行狀態(tài),并克服現(xiàn)有技術(shù)中的前述不足。
[0005]本發(fā)明的目的采用如下方案實現(xiàn):基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng)包含有策略數(shù)據(jù)庫、策略引擎、數(shù)據(jù)處理裝置、設(shè)備控制裝置、監(jiān)控裝置;策略數(shù)據(jù)庫、數(shù)據(jù)處理裝置、設(shè)備控制裝置均與策略引擎通訊連接,監(jiān)控裝置與數(shù)據(jù)處理裝置通訊連接,其中:
策略數(shù)據(jù)庫:用于設(shè)置并保存電源和功耗的策略;
策略引擎:用于根據(jù)策略數(shù)據(jù)庫中的預(yù)設(shè)策略調(diào)用數(shù)據(jù)處理裝置和設(shè)備控制裝置;數(shù)據(jù)處理裝置:用于保存監(jiān)控裝置采集到得數(shù)據(jù),并進行策略計算和分析并將最終結(jié)果反饋給策略引擎;
設(shè)備控制裝置:用于根據(jù)策略引擎做出的判斷對數(shù)據(jù)中心各設(shè)備實施控制;
監(jiān)控裝置:用于對數(shù)據(jù)中心各設(shè)備實施監(jiān)控,并采集監(jiān)控所得原始數(shù)據(jù)報數(shù)據(jù)處理裝置。
[0006]更進一步的,所述基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng)可以集中部署,也可以根據(jù)數(shù)據(jù)中心能耗管控級別多層級部署??蛇m應(yīng)不同規(guī)模的數(shù)據(jù)中心,擴展容易。[0007]應(yīng)用上述裝置可以測量數(shù)據(jù)中心的實際功耗,從而實時提供數(shù)據(jù)中心實際的功耗數(shù)據(jù),利用策略引擎可以對數(shù)據(jù)中心的運行狀態(tài)進行評估和自動生成調(diào)整方案,并通過實施裝置,即所述設(shè)備控制裝置,將數(shù)據(jù)中心各設(shè)備設(shè)置為目標(biāo)狀態(tài),從而使平臺在限定功率下保持最佳狀態(tài)和最大利用率。
[0008]更進一步的,本發(fā)明所采用的優(yōu)化方法為基于電源功耗監(jiān)控的數(shù)據(jù)中心優(yōu)化方法:具體包括如下步驟:
1)、設(shè)定數(shù)據(jù)中心服務(wù)器的電源和功耗的策略;
2)、在策略引擎的調(diào)度下,設(shè)備控制裝置按照設(shè)定的策略對數(shù)據(jù)中心的運行實施控
制;
3)、實時監(jiān)控電源模塊工作情況,通過數(shù)據(jù)中心服務(wù)器的主板電源接口實施監(jiān)控;
4)、對第3)步中所獲取的數(shù)據(jù)進行分析計算;
5)、將第4)步中所得分析結(jié)果反饋策略引擎,策略引擎做出判斷并通過設(shè)備控制裝置調(diào)整數(shù)據(jù)中心的設(shè)備運行狀態(tài)。
[0009]采用這種方法,對數(shù)據(jù)中心的能耗情況進行了設(shè)備級的實時監(jiān)控,并對監(jiān)控結(jié)果實施分析判斷,還根據(jù)判斷結(jié)果對數(shù)據(jù)中心的設(shè)備實施了控制,以實現(xiàn)預(yù)期的工作狀態(tài),而且分析判斷的策略和規(guī)則可以自由定制,增強了調(diào)控的靈活性和豐富性。
[0010]更詳細的原理描述如下:將數(shù)據(jù)中心視為三層:
第一層為裝置層,包含基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng);
第二層為通信層,由網(wǎng)絡(luò)通信設(shè)施構(gòu)成;
第三層為硬件組件層,由需要優(yōu)化的數(shù)據(jù)中心平臺設(shè)備構(gòu)成。
[0011]裝置層的主要任務(wù)是負責(zé)監(jiān)控采集數(shù)據(jù)中心服務(wù)器平臺電源情況數(shù)據(jù),智能分析數(shù)據(jù),基于策略發(fā)出控制命令控制數(shù)據(jù)中心服務(wù)器平臺服務(wù)器的處理器主頻等參數(shù)。
[0012]裝置層的工作流程主要是第一步由運維工程師設(shè)置策略,監(jiān)控裝置通過通信層實時監(jiān)控電源模塊情況,并將數(shù)據(jù)反饋到數(shù)據(jù)處理裝置,由數(shù)據(jù)處理裝置對數(shù)據(jù)依據(jù)策略進行計算并得出結(jié)論,將相應(yīng)的結(jié)論發(fā)送給策略引擎,策略引擎根據(jù)監(jiān)控結(jié)論和預(yù)設(shè)策略調(diào)用設(shè)備控制裝置,設(shè)備控制裝置通過通信層控制數(shù)據(jù)中心服務(wù)器處理器的參數(shù)以適應(yīng)策略要求。
[0013]與此同時,運維工程師也可以根據(jù)數(shù)據(jù)處理中心分析的數(shù)據(jù)和結(jié)論以擴展數(shù)據(jù)中心機房機架的密度,也可由策略引擎給出調(diào)配建議。數(shù)據(jù)處理中心得出的結(jié)論無法由控制裝置處理時,如電源異常,策略引擎會發(fā)出告警或通知,通知運維工程進行相應(yīng)處理。
[0014]如上所述,可實現(xiàn)運維工程師設(shè)定策略、監(jiān)控裝置對數(shù)據(jù)中心服務(wù)器平臺進行電源和功耗監(jiān)控、數(shù)據(jù)中心保存數(shù)據(jù)并進行計算和分析、控制裝置依據(jù)數(shù)據(jù)處理裝置分析的結(jié)果對數(shù)據(jù)中心服務(wù)器進行控制。
[0015]綜上所述,和傳統(tǒng)技術(shù)方法相比,本發(fā)明方法優(yōu)點在于:第一、實時電源和功耗監(jiān)控,使得數(shù)據(jù)中心服務(wù)器平臺功耗狀態(tài)可預(yù)知,運維工程師根據(jù)監(jiān)控數(shù)據(jù)做出適當(dāng)調(diào)整以避免數(shù)據(jù)中心服務(wù)器平臺局部過熱而導(dǎo)致服務(wù)器性能降低或者損壞,減少經(jīng)濟損失;第二、運維工程師根據(jù)策略反饋情況提升數(shù)據(jù)中心服務(wù)器平臺機架密度,從而降低成本節(jié)約空間;第三、依據(jù)策略控制負載均衡狀態(tài)下使得數(shù)據(jù)中心服務(wù)器平臺隨時處于最佳功耗狀態(tài),忙時高功耗,閑時低功耗以降低用電和制冷成本;第四、智能告警和做出應(yīng)急處理,當(dāng)電源處于異常狀態(tài),例如緊急停電,該裝置可以降低功耗和電源消耗,及時告警,延長數(shù)據(jù)中心服務(wù)器因停電而關(guān)機的時間,為運維工程搶救數(shù)據(jù)贏得時間。
【專利附圖】
【附圖說明】
[0016]圖1是本發(fā)明的工作流程示意圖;
圖2是本發(fā)明的原理示意圖;
圖3是本發(fā)明中基于策略的電源管理流程示意圖;
圖4是本發(fā)明的一個大型部署示例的示意圖。
【具體實施方式】
[0017]本說明書中公開的所有特征,或公開的所有方法或過程中的步驟,除了互相排斥的特征和/或步驟以外,均可以以任何方式組合。
[0018]如圖2所示,本發(fā)明中將數(shù)據(jù)中心平臺分三層進行管理和交互通信,分別為:1)裝置層,裝置層由本發(fā)明所提供的基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng)構(gòu)成,是發(fā)明的核心所在,主要負責(zé)策略設(shè)置、數(shù)據(jù)分析和計算、監(jiān)控數(shù)據(jù)、控制服務(wù)器平臺功耗等任務(wù)。2)通信層,通信層是溝通數(shù)據(jù)中心服務(wù)器平臺和基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng)的橋梁,基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng)通過通信層獲取數(shù)據(jù)中心服務(wù)器平臺監(jiān)控數(shù)據(jù),同時通過通信層發(fā)送控制指令,控制數(shù)據(jù)中心服務(wù)器平臺各個服務(wù)器的功耗。3)硬件組件層,硬件組件層是本發(fā)明所針對的對象,硬件組件層提供監(jiān)控接口和控制接口以供本發(fā)明監(jiān)控數(shù)據(jù)和發(fā)出指令。
[0019]如圖1所示,本發(fā)明所包含的步驟為:1)設(shè)定數(shù)據(jù)中心服務(wù)器的電源和功耗的策略;2)控制數(shù)據(jù)中心運行,使其處于最佳的運行狀態(tài);3)電源模塊監(jiān)控,通過數(shù)據(jù)中心服務(wù)器的主板電源接口監(jiān)控電源情況;4)對第3)步中所獲取的數(shù)據(jù)進行智能分析計算;5)將分析結(jié)果反饋策略引擎,策略引擎做出判斷并通過裝置控制器控制數(shù)據(jù)中心的處理器功耗。
[0020]如圖3所示,本發(fā)明基于策略的電源管理步驟為:1)配置策略引擎和步驟,運維工程師首先配置策略引擎和初始化參數(shù)步驟;2)監(jiān)控裝置開始進行實時監(jiān)控,采集數(shù)據(jù)中心各個服務(wù)器的電源和功耗數(shù)據(jù);3)計算數(shù)據(jù)中心服務(wù)器平臺每一個機柜中的電源和功耗消耗情況;4)優(yōu)化數(shù)據(jù)中心服務(wù)器機柜策略,使其在一個給定電源范圍和服務(wù)器工作負載;5)判定是否進行新的策略設(shè)置,如果不需要則跳過步驟6),否則執(zhí)行步驟6) ;6)設(shè)定新數(shù)據(jù)中心服務(wù)器平臺策略;7)檢測并更新策略;8)告警并通知,根據(jù)策略做出告警并通知運維工程師做出相應(yīng)處理;9)處理告警,針對裝置的告警和通知做出相應(yīng)的處理和應(yīng)對。
[0021]如圖4所示,本發(fā)明的一個大型部署示例,具體情況如下:1)單機級別,數(shù)據(jù)中心服務(wù)器平臺的每個服務(wù)器可以部署一套本發(fā)明基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng),一套發(fā)明基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng)針對一個服務(wù)器,單獨監(jiān)控和控制每一個服務(wù)器。2)組級別,一套本發(fā)明可以同時監(jiān)控和控制一組數(shù)據(jù)中心服務(wù)器平臺,該組可以根據(jù)實際情況劃分,例如,按機架分組,按不同樓層分組,按不同功能分組等等。3)數(shù)據(jù)中心級別,針對大型數(shù)據(jù)中心,集成了單機級別和組級別,數(shù)據(jù)中心級別數(shù)據(jù)處理裝置收集單機級別和組級別采集到得數(shù)據(jù),并發(fā)出控制指令到達各個具體數(shù)據(jù)中心服務(wù)器控制其功耗主頻,使數(shù)據(jù)中心服務(wù)器處于最佳狀態(tài),由此使得本發(fā)明具有更廣的適用性和易拓展性。
【權(quán)利要求】
1.基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng),其特征在于,該系統(tǒng)包含有策略數(shù)據(jù)庫、策略引擎、數(shù)據(jù)處理裝置、設(shè)備控制裝置、監(jiān)控裝置;策略數(shù)據(jù)庫、數(shù)據(jù)處理裝置、設(shè)備控制裝置均與策略引擎通訊連接,監(jiān)控裝置與數(shù)據(jù)處理裝置通訊連接,其中: 策略數(shù)據(jù)庫:用于設(shè)置并保存電源和功耗的策略; 策略引擎:用于根據(jù)策略數(shù)據(jù)庫中的預(yù)設(shè)策略調(diào)用數(shù)據(jù)處理裝置和設(shè)備控制裝置;數(shù)據(jù)處理裝置:用于保存監(jiān)控裝置采集到得數(shù)據(jù),并進行策略計算和分析并將最終結(jié)果反饋給策略引擎; 設(shè)備控制裝置:用于根據(jù)策略引擎做出的判斷對數(shù)據(jù)中心各設(shè)備實施控制; 監(jiān)控裝置:用于對數(shù)據(jù)中心各設(shè)備實施監(jiān)控,并采集監(jiān)控所得原始數(shù)據(jù)報數(shù)據(jù)處理裝置。
2.根據(jù)權(quán)利要求1所述的基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng),其特征在于:所述策略數(shù)據(jù)庫、策略引擎、數(shù)據(jù)處理裝置、設(shè)備控制裝置、監(jiān)控裝置均設(shè)置在一臺優(yōu)化服務(wù)器上實現(xiàn),有多套監(jiān)控裝置和設(shè)備控制裝置集成在其中。
3.根據(jù)權(quán)利要求1所述的基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng),其特征在于:所述策略數(shù)據(jù)庫、策略引擎、數(shù)據(jù)處理裝置、設(shè)備控制裝置、監(jiān)控裝置按照數(shù)據(jù)中心級別多層級設(shè)置。
【文檔編號】G05B19/418GK103853107SQ201210496551
【公開日】2014年6月11日 申請日期:2012年11月29日 優(yōu)先權(quán)日:2012年11月29日
【發(fā)明者】王建軍 申請人:成都勤智數(shù)碼科技股份有限公司