管理計算系統(tǒng)的功耗和性能的制作方法
【專利摘要】本文描述了一種用于管理計算系統(tǒng)的功耗和性能的方法和系統(tǒng)。該方法包括監(jiān)視計算系統(tǒng)的總體功耗,以確定總體功耗高于還是低于總體功耗限制,并且監(jiān)視每個計算系統(tǒng)的性能,以確定該性能是否在性能容限內。該方法進一步包括調整計算系統(tǒng)的功耗限制或計算系統(tǒng)的性能以使總體功耗低于總體功耗限制并且每個計算系統(tǒng)的性能在該性能容限內。
【專利說明】管理計算系統(tǒng)的功耗和性能
【技術領域】
[0001]本發(fā)明總體上涉及多個計算系統(tǒng)操作的管理。更特別地,本發(fā)明涉及多個計算系統(tǒng)的功耗和性能特性的同時管理。
【背景技術】
[0002]在多種情況下,數(shù)據(jù)中心中計算系統(tǒng)的組被分配特定功率預算,例如,總體功耗限制。為保持總體功耗低于數(shù)據(jù)中心級的功率預算,數(shù)據(jù)中心中主控的多數(shù)服務器被提供有其自身的功率預算。這些服務器包括連續(xù)監(jiān)視由服務器消耗的功率的技術。當這種功耗超過給定功率預算時,服務器性能可被縮減或節(jié)流,以降低功率至低于功率預算。即使對于相同配置的(即同質的)運行相同工作負荷的計算系統(tǒng),計算系統(tǒng)消耗的功率也可發(fā)生變化。這主要是由于計算系統(tǒng)中組件特性和環(huán)境條件的變化。因此,服從相同的功率預算的同質計算系統(tǒng)的性能可顯著變化。例如,對于具有相同的功率預算的10000個同質計算系統(tǒng)的組,一些數(shù)量的計算系統(tǒng)可能不經受任何節(jié)流,而其他計算系統(tǒng)可節(jié)流多達20 %。
[0003]在一些情況下,工作負荷的計算可在多于一個的計算系統(tǒng)中發(fā)生。在這種情況下,工作負荷可分布橫跨多個計算系統(tǒng)。這些計算系統(tǒng)通常相互通信或與中央控制器通信,以交換信息,同步信息或保持工作負荷完整性。由計算系統(tǒng)的功率預算導致的計算系統(tǒng)之間的性能差值可導致多個問題。例如,在分布式計算環(huán)境中,可只有一個計算系統(tǒng),針對該系統(tǒng),性能被節(jié)流20%以滿足系統(tǒng)級的功率預算。然而,如果計算系統(tǒng)需要等待子任務的完成,則為保持足夠的同步,聚集體的性能還可能被節(jié)流20%。作為第二示例,先前經驗已經示出,個體計算系統(tǒng)的性能中的小變化可導致集合體的大的性能變化。這導致最小化執(zhí)行各種操作(諸如OS任務,中斷,背景任務等)的計算系統(tǒng)之間的變化的努力。因此,許多計算系統(tǒng)可操作于低于其功率預算所允許的性能下。
【專利附圖】
【附圖說明】
[0004]圖I為計算系統(tǒng)的框圖,計算系統(tǒng)可用于實現(xiàn)管理本文描述的計算系統(tǒng)的功耗和性能的技術;
[0005]圖2為計算環(huán)境的框圖,其可根據(jù)實施例使用;
[0006]圖3為過程流程圖,示出了一種用于管理計算系統(tǒng)的功耗和性能的方法;
[0007]圖4為過程流程圖,示出了一種用于基于計算系統(tǒng)的總體功耗調整計算系統(tǒng)的性能的方法;
[0008]圖5為過程流程圖,示出了一種用于確定計算系統(tǒng)的目標性能狀態(tài)的方法;
[0009]圖6為過程流程圖,示出了一種用于基于在指定時間段上收集的功耗和性能數(shù)據(jù)調整每個計算系統(tǒng)的功耗限制的方法;
[0010]圖7為過程流程圖,示出了一種用于基于使用測量的功耗和性能數(shù)據(jù)構建的表來確定每個計算系統(tǒng)的功耗限制的方法;
[0011]圖8為過程流程圖,示出了一種用于基于處于統(tǒng)一功耗的計算系統(tǒng)的操作期間收集的性能數(shù)據(jù)調整每個計算系統(tǒng)的功耗限制的方法;
[0012]圖9為過程流程圖,示出了一種用于基于處于統(tǒng)一性能的計算系統(tǒng)的操作期間收集的功耗數(shù)據(jù)調整每個計算系統(tǒng)的性能的方法;
[0013]圖10為過程流程圖,示出了一種用于基于計算系統(tǒng)達到特定邊界條件的時間調整每個計算系統(tǒng)的功耗限制的方法;以及
[0014]圖11為框圖,示出有形的,非暫存計算機可讀介質,其存儲用于管理計算系統(tǒng)的功耗和性能的代碼。
[0015]本公開和圖的全文中使用相同的數(shù)字來指代相似的組件和特征。100系列的數(shù)字指代最初在圖1中出現(xiàn)的特征;200系列的數(shù)字指代最初在圖2中出現(xiàn)的特征;等等。
【具體實施方式】
[0016]如上所討論的,本文描述的實施例涉及多個計算系統(tǒng)的功耗和性能特性的同時管理。該實施例可允許把計算系統(tǒng)組的總體功耗的保持在可接受級別,同時保持計算系統(tǒng)的性能處于指定性能容限內。在一些實施例中,保持計算系統(tǒng)的性能處于指定性能容限內保證了全部計算系統(tǒng)操作在接近統(tǒng)一的性能級別,并且因此,當執(zhí)行類似工作負荷時將具有類似的完成時間。
[0017]如本文所使用的,術語“性能”指代計算系統(tǒng)在執(zhí)行特定工作負荷期間以及在執(zhí)行特定工作負荷之后的響應。在各種實施例中,計算系統(tǒng)的性能根據(jù)特定性能度量來量化。性能度量可根據(jù)來自用戶經由用戶接口對計算設備的輸入來定義。性能度量可基于特定參數(shù)。該參數(shù)可包括,例如,平均頻率、特定工作負荷的完成時間、系統(tǒng)的響應性、幀速率、完成事務的數(shù)量、完成速率或通信速率(例如,帶寬)等等。此外,性能度量可基于多個個體參數(shù)或可基于統(tǒng)計操作,例如,多個參數(shù)的均值。
[0018]本文描述的實施例可實現(xiàn)于包括多個計算系統(tǒng)的數(shù)據(jù)中心中。在各種實施例中,數(shù)據(jù)中心中的計算系統(tǒng)為同質計算系統(tǒng),具有相同的硬件和軟件配置。然而,數(shù)據(jù)中心中的計算系統(tǒng)還可為異質計算系統(tǒng),具有不同的硬件和軟件配置。
[0019]本文描述的實施例可用于基于由計算系統(tǒng)執(zhí)行的特定工作負荷來管理計算系統(tǒng)的功耗和性能特性。此外,本文描述的實施例可特別用于執(zhí)行高性能計算(HPC)操作的數(shù)據(jù)中心,針對這種數(shù)據(jù)中心,由各種計算系統(tǒng)執(zhí)行的相關負荷的完成時間之間的小差值可對數(shù)據(jù)中心的總體操作具有大影響。
[0020]在下面的描述和權利要求中,術語“耦合”和“連接”及其派生詞可被使用。應當理解這些術語并非意圖作為相互的同義詞。相反,在特定實施例中,“連接”可用于指示兩個或多個元件相互直接物理或電接觸?!榜詈稀笨杀硎緝蓚€或更多元件直接物理或電接觸。然而,“耦合”還可表示兩個或更多元件不直接相互接觸,但仍相互協(xié)作或交互。
[0021]一些實施例可被實現(xiàn)于硬件,固件和軟件中的一個或組合中。一些實施例還可實現(xiàn)為存儲于機器可讀介質上的指令,該指令可被計算平臺讀取并執(zhí)行,以執(zhí)行本文描述的操作。機器可讀介質可包括用于以機器(例如計算機)可讀的形式存儲或傳輸信息的任何機構。例如,機器可讀介質可包括只讀存儲器(ROM);隨機存取存儲器(RAM);磁盤存儲介質;光存儲介質;閃存設備;或電,光,聲音或其它形式的傳播信號,例如,載波、紅外信號、數(shù)字信號或傳輸和/或接收信號的接口等等。
[0022]實施例為一種實現(xiàn)方式或示例。說明書中對“一實施例”、“一個實施例”、“一些實施例”、“各種實施例”或“其它實施例"的引用表示結合該實施例描述的特定特征、結構或特性包括在至少一些實施例中,但不一定包括在本發(fā)明的全部實施例中。“ 一實施例”、“一個實施例”或“一些實施例”的各種出現(xiàn)不一定全部指代同一實施例。
[0023]不是所有本文描述和說明的組件、特征、結構、特性等都需要包括于特定的一個或多個實施例中。如果說明書聲明了組件、特征、結構或特性“可以”,“可能”,“能”或“能夠”被包括,那么例如該特定組件、特征、結構或特性不必須被包括。如果說明書或權利要求提至IJ“一”或“一個”元件,其并非表示只有一個元件。如果說明書或權利要求提到“一個附加”元件,其不排除存在多于一個附加元件。
[0024]應當注意,盡管一些實施例已參考特定實現(xiàn)方式被描述,但其它實現(xiàn)方式根據(jù)一些實施例是可能的。另外,電路元件或附圖中圖示和/或本文描述的其它特征的布置和/或順序不必以所圖示和描述的特定方式布置。許多其它布置根據(jù)一些實施例也是可能的。
[0025]在圖中示出的每個系統(tǒng)中,各元件在一些情況下可各自具有相同的參考數(shù)字或不同的參考數(shù)字,以表明所表示的元件可能為不同的和/或類似的。然而,元件可足夠靈活以具有不同的實現(xiàn)方式并與本文示出或描述的系統(tǒng)中的一些或全部一起工作。圖中示出的各種元件可為相同的或不同的。哪一個稱為第一元件并且哪一個稱為第二元件是任意的。
[0026]圖I為計算設備100的框圖,其可用于實現(xiàn)管理本文描述的計算系統(tǒng)的功耗和性能的技術。計算設備100可為,例如,服務器、膝上型計算機、桌面計算機、平板電腦或移動設備等等。計算設備100可包括被適配為執(zhí)行存儲的指令的處理器102,,以及存儲器設備104,其存儲可由處理器102執(zhí)行的指令。處理器102可為單核處理器、多核處理器、計算集群或任何數(shù)量的其它配置。存儲器設備104可包括隨機存取存儲器(RAM)、只讀存儲器(ROM)、閃存或任何其他合適的存儲器系統(tǒng)。由處理器102執(zhí)行的指令可用于實現(xiàn)包括管理任何數(shù)量的計算系統(tǒng)的功耗和性能特性的過程。
[0027]處理器102可通過總線106連接至輸入/輸出(I/O)設備接口 108,輸入/輸出設備接口 108被適配為把計算設備100連接至一個或多個I/O設備110。I/O設備110可包括,例如:鍵盤和指點設備,其中指點設備可包括觸摸板或觸摸屏幕等。I/o設備110可為計算設備100的內建組件或可為在外部連接于計算設備100的設備。
[0028]處理器102還可通過總線106鏈接至顯示器接口 112,顯示器接口 112被適配為把計算設備100連接至顯示器設備114。顯示器設備114可包括作為計算設備100內建組件的顯示器屏幕。顯示器設備114還可包括在外部連接于計算設備100的計算機監(jiān)視器、電視或投影儀等等。
[0029]網絡接口控制器(NIC) 116可被適配為通過總線106把計算設備100連接至網絡118。網絡118可為廣域網(WAN)、局域網(LAN)或互聯(lián)網等等。通過網絡118,計算設備100可訪問數(shù)據(jù)120。計算設備100還可下載數(shù)據(jù)120中的任何并在計算設備100的存儲設備122中存儲數(shù)據(jù)120。
[0030]通過網絡118,計算設備100可以通信方式耦合于多個計算系統(tǒng)124。在各個實施例中,計算系統(tǒng)124被包括于分布式計算環(huán)境中。另外,在一些實施例中,計算系統(tǒng)124被包括于數(shù)據(jù)中心中。計算系統(tǒng)124可為服務器、膝上型計算機、桌面計算機、平板計算機、移動設備等。
[0031]存儲設備122可包括硬盤驅動器、光盤驅動器、閃存驅動器、驅動器陣列或其任何組合。存儲設備122可包括管理代理126,其被配置為管理計算系統(tǒng)124的操作。例如,計算設備100可為數(shù)據(jù)中心管理系統(tǒng),并且管理代理126可為數(shù)據(jù)中心管理代理,被配置為控制計算系統(tǒng)124的功耗和性能。管理代理126可使用經由網絡118接收自任何計算系統(tǒng)124的功耗數(shù)據(jù)128和性能數(shù)據(jù)130管理計算系統(tǒng)124的操作。在各個實施例中,管理代理126為被配置為執(zhí)行這種管理功能的任何類型的應用或程序,。
[0032]每個計算系統(tǒng)124可包括一個或多個局部管理代理(未示出),其可用于基于來自計算設備100中的管理代理126的輸入直接控制計算系統(tǒng)124的操作。該局部管理代理可包括節(jié)點管理代理(未示出)和組件管理代理(未示出),如進一步關于圖2討論的。
[0033]要理解圖1的框圖并非意圖指示計算設備100包括圖1中所示的全部組件。另外,取決于特定實現(xiàn)方式的細節(jié),計算設備100可包括圖1中未示出的任何數(shù)量的附加組件。
[0034]圖2為可根據(jù)實施例使用的計算環(huán)境200的框圖。計算環(huán)境200可為分布式計算環(huán)境,諸如分布式數(shù)據(jù)中心。計算環(huán)境200可包括多個計算系統(tǒng)202,諸如例如,圖2中所示的計算系統(tǒng)A 202A和計算系統(tǒng)B 202B。計算系統(tǒng)202可為能夠執(zhí)行本文描述的技術的任何類型的計算系統(tǒng)。例如,計算系統(tǒng)202可為服務器、膝上型計算機、桌面計算機、平板計算機、移動設備等。在各個實施例中,計算系統(tǒng)202為同質的,表示全部計算系統(tǒng)202包括相同的硬件和軟件配置。然而,在一些實施例中,計算系統(tǒng)202為異質的,表示計算系統(tǒng)202包括不同的硬件或軟件配置。
[0035]計算環(huán)境200還可包括數(shù)據(jù)中心管理系統(tǒng)204。數(shù)據(jù)中心管理系統(tǒng)204可包括數(shù)據(jù)中心管理代理(未示出)。數(shù)據(jù)中心管理代理可為硬件或軟件可管理代理或可為主機操作系統(tǒng)(OS)或虛擬化OS。在一些實施例中,數(shù)據(jù)中心管理系統(tǒng)204為上面關于圖1描述的計算設備100。數(shù)據(jù)中心管理系統(tǒng)204可被配置為監(jiān)視并管理計算系統(tǒng)202的操作。另外,在一些實施例中,每個計算系統(tǒng)202可包括數(shù)據(jù)中心管理系統(tǒng)204,其直接駐留在計算系統(tǒng)202 中。
[0036]在各個實施例中,數(shù)據(jù)中心管理系統(tǒng)204通過計算環(huán)境200中的每個計算系統(tǒng)202監(jiān)視功耗。數(shù)據(jù)中心管理系統(tǒng)204可使用功耗信息來動態(tài)地確定每個計算系統(tǒng)204的功耗限制,以使得計算環(huán)境200的總體功耗限制不被超過。例如,如果計算系統(tǒng)202為數(shù)據(jù)中心中的服務器,則該服務器的功耗限制可被確定以使得整個服務器框架的總體功耗限制不被超過。
[0037]此外,數(shù)據(jù)中心管理系統(tǒng)204可監(jiān)視每個計算系統(tǒng)202的性能。計算系統(tǒng)202的性能可根據(jù)多個性能度量中的任何來定義,如上所討論的。數(shù)據(jù)中心管理系統(tǒng)204可使用性能信息來確定計算系統(tǒng)的期望性能,以及計算系統(tǒng)204的性能容限。性能容限可定義計算系統(tǒng)202之間性能變化量的限制。
[0038]數(shù)據(jù)中心管理系統(tǒng)204可將功耗限制和性能信息傳送至每個計算系統(tǒng)202中的節(jié)點管理代理208,如由箭頭206指示的。在各個實施例中,數(shù)據(jù)中心管理系統(tǒng)204經由網絡(諸如WAN、LAN或互聯(lián)網)發(fā)送功耗限制、期望性能和性能容限至每個計算系統(tǒng)202中的節(jié)點管理代理208。
[0039]節(jié)點管理代理208可為被配置為執(zhí)行針對計算系統(tǒng)202的平臺級管理功能的任何類型的應用或程序。此外,節(jié)點管理代理208可為計算系統(tǒng)202中的具有多個刀片的系統(tǒng)或機箱。另外,節(jié)點管理代理208可為內部系統(tǒng)代理、基本輸入/輸出系統(tǒng)(BIOS)、固件或OS。
[0040]在各個實施例中,每個計算系統(tǒng)202中的節(jié)點管理代理208可確定針對計算系統(tǒng)202中每個中央處理單元(CPU) 210的插座的插座級功耗限制。節(jié)點管理代理208可將對應插座級功耗限制以及性能容限傳送至計算系統(tǒng)204中的每個中央處理單元(CPU)210,如由箭頭212指示的。
[0041]每個CPU 210可包括組件管理代理214,其被配置為動態(tài)地保持CPU 210的功耗處于或低于插座級功耗限制。組件管理代理214可為被配置為實現(xiàn)用于管理CPU 210的功耗的策略的任何類型的應用或程序。例如,組件管理代理214可為控制硬件、軟件或固件,其為CPU 210或輸入/輸出控制器的部分。此外,組件管理代理可包括一個或多個集成單元。組件管理代理214可被配置為將CPU 210的性能保持在性能容限內。
[0042]每個計算系統(tǒng)202中的組件管理代理214可將插座級功耗和性能信息傳送至節(jié)點管理代理208,如由箭頭212指示的。節(jié)點管理代理208可使用插座級功耗和性能信息來確定計算系統(tǒng)202的平臺級功耗和性能。此外,節(jié)點管理代理208可將計算系統(tǒng)202的平臺級功耗和性能傳送至數(shù)據(jù)中心管理系統(tǒng)204,如由箭頭216指示的。在一些實施例中,數(shù)據(jù)中心管理系統(tǒng)204包括聚合器(未示出),其被配置為編譯接收自計算系統(tǒng)202的節(jié)點管理代理208的平臺級功耗和性能信息。
[0043]在各個實施例中,數(shù)據(jù)中心管理系統(tǒng)204使用平臺級功耗和性能信息來管理計算系統(tǒng)202的操作。例如,數(shù)據(jù)中心管理系統(tǒng)204可基于計算系統(tǒng)202的總體功耗高于還是低于總體功耗限制來調整計算系統(tǒng)202的功耗限制。此外,數(shù)據(jù)中心管理系統(tǒng)204可基于平臺級功耗和性能信息調整計算系統(tǒng)202的性能。
[0044]數(shù)據(jù)中心管理系統(tǒng)204可根據(jù)以下關于圖3討論的方法300管理每個計算系統(tǒng)202的功耗和性能。此外,數(shù)據(jù)中心管理系統(tǒng)204可利用多個特定策略(例如,關于圖4-10討論的方法400-1000)中的任一個來管理每個計算系統(tǒng)202的功耗和性能。
[0045]要理解,圖2的框圖并非意圖指示計算環(huán)境200包括圖2中所示的全部組件。另夕卜,根據(jù)特定實現(xiàn)方式的細節(jié),計算環(huán)境200可包括任何數(shù)量的圖2中未示出的附加組件。例如,多個數(shù)據(jù)中心管理系統(tǒng)204可被包括于計算環(huán)境200中。此外,多個節(jié)點管理代理208可被包括在一個計算系統(tǒng)202中或多個組件管理代理214可被包括在一個插座中。在這種實例中,一個代理可作為其它代理的主導裝置或主人。這種所有權關系可以是固定的或可出于各種理由而改變。
[0046]在各個實施例中,數(shù)據(jù)中心管理系統(tǒng)204和任何節(jié)點管理代理208之間的通信以及任何節(jié)點管理代理208和對應組件管理代理214之間的通信可經由良好定義的協(xié)議促進。例如,這種通信可經由硬件信號或軟件機制傳輸。此外,這種通信可經由網絡傳輸。
[0047]圖3為過程流程圖,示出了用于管理計算系統(tǒng)的功耗和性能的方法300。計算系統(tǒng)可包括,例如:以上關于圖I討論的計算設備100和計算系統(tǒng)124或以上關于圖2討論的計算系統(tǒng)202。在各個實施例中,計算系統(tǒng)為同質計算系統(tǒng),具有相同的硬件和軟件配置。另夕卜,計算系統(tǒng)可包括數(shù)據(jù)中心中任何數(shù)量的計算系統(tǒng),諸如例如,數(shù)據(jù)中心中的一個或多個服務器框架。
[0048]此外,方法300可經由遠程計算系統(tǒng)中的數(shù)據(jù)中心管理代理執(zhí)行。數(shù)據(jù)中心管理代理可包括例如:以上關于圖1討論的管理代理126或以上關于圖2討論的數(shù)據(jù)中心管理系統(tǒng)204。
[0049]在各個實施例中,方法300用于將多個計算系統(tǒng)的總體功耗保持為低于功率預算,例如,總體功耗限制。此外,方法300可用于將計算系統(tǒng)的性能保持在指定性能容限內。這可根據(jù)用于定義計算系統(tǒng)的性能的特定性能度量來保證全部計算系統(tǒng)操作在類似響應性級別、幀速率、頻率、完成速率、帶寬等。
[0050]根據(jù)方法300,計算系統(tǒng)的總體功耗限制可被確定。在一些實施例中,總體功耗限制根據(jù)功率的可用量而由數(shù)據(jù)中心管理代理自動確定。在其它實施例中,總體功耗限制響應于來自數(shù)據(jù)中心管理代理駐留在其上的計算系統(tǒng)的用戶的輸入而確定。
[0051]方法在框302開始,在該處計算系統(tǒng)的總體功耗被監(jiān)視以確定總體功耗高于還是低于總體功耗限制。在一些實施例中,總體功耗由數(shù)據(jù)中心管理代理周期性地監(jiān)視。這例如可通過從對應節(jié)點管理代理接收與每個計算系統(tǒng)的功耗和性能有關的信息來執(zhí)行。這種信息可在數(shù)據(jù)中心管理代理的聚合器中被編譯,并且可被用于確定計算系統(tǒng)的總體功耗高于還是低于總體功耗限制。
[0052]在框304,每個計算系統(tǒng)的性能被監(jiān)視以確定每個計算系統(tǒng)的性能是否在性能容限內。取決于用于定義性能的特定性能度量,計算系統(tǒng)的性能可根據(jù)各種技術中的任一個而確定。
[0053]在框306,計算系統(tǒng)的功耗限制或計算系統(tǒng)的性能或兩者被調整以使的總體功耗低于總體功耗限制并且每個計算系統(tǒng)的性能處于性能容限內。在各個實施例中,對計算系統(tǒng)的功耗限制和性能的調整根據(jù)以下關于圖4-10描述的方法400-1000中的任一個來確定。
[0054]在同質計算系統(tǒng)的情況下,計算系統(tǒng)的性能可被統(tǒng)一調整,以使得總體功耗低于功耗限制。因此,計算系統(tǒng)可操作在相同的性能。
[0055]在一些實施例中,計算系統(tǒng)的功耗限制從遠程計算系統(tǒng)中的數(shù)據(jù)中心管理代理被發(fā)送至計算系統(tǒng)中的節(jié)點管理代理。節(jié)點管理代理可被配置為將計算系統(tǒng)的功耗保持為低于功耗限制并且將計算系統(tǒng)的性能保持在性能容限內。節(jié)點管理代理可通過確定針對計算系統(tǒng)中的每個CPU的插座的插座級功耗限制和期望性能來管理計算系統(tǒng)的功耗和性能。此夕卜,每個CPU插座的組件管理代理可被配置為將功耗保持為低于插座級功耗限制并且將性能保持在性能容限內。
[0056]要理解的是,圖3的過程流程圖并非意圖指示方法300的步驟要以任何特定順序執(zhí)行或在每種情況中都包括方法300的全部步驟。另外,取決于特定實現(xiàn)方式的細節(jié),任何數(shù)量的附加步驟可包括在方法300中。
[0057]圖4為過程流程圖,示出了用于基于計算系統(tǒng)的總體功耗調整計算系統(tǒng)的性能的方法400。在框402,方法開始為周期性監(jiān)視計算系統(tǒng)的總體功耗。此外,可針對總體功耗確定上下閾值功耗。保持總體功耗低于上閾值功耗并且高于下閾值功耗可保證計算系統(tǒng)高效地操作。
[0058]在框404,響應于確定總體功耗超過上閾值功耗,計算系統(tǒng)的性能被減小。在各個實施例中,計算系統(tǒng)的性能被減小以使得總體功耗低于上閾值功耗。另外,如果計算系統(tǒng)是同質的,則計算系統(tǒng)的性能可同時并且相同地被減小。
[0059]在框406,響應于確定總體功耗低于下閾值功耗,計算系統(tǒng)的性能被增加。在各個實施例中,計算系統(tǒng)的性能被增加以使得總體功耗高于下閾值功耗。另外,如果計算系統(tǒng)是同質的,計算系統(tǒng)的性能可同時并且相同地被增加。
[0060]要理解,圖4的過程流程圖并非意圖指示方法400的步驟要以任何特定順序執(zhí)行或在每種情況中都包括方法400的全部步驟。另外,取決于特定實現(xiàn)方式的細節(jié),任何數(shù)量的附加步驟可包括于方法400中。
[0061]圖5為過程流程圖,示出了用于確定計算系統(tǒng)的目標性能狀態(tài)的方法500。如本文所使用的,術語“性能狀態(tài)”指代在特定功耗操作或在特定功耗范圍內操作的特定計算系統(tǒng)的性能級別。
[0062]方法在框502開始,在該處針對計算系統(tǒng)中設備的每個性能狀態(tài)確定性能和最大功耗。設備可為例如包括在每個計算系統(tǒng)中的處理器。此外,設備可為包括在每個計算系統(tǒng)中的I/o設備。在一些實施例中,設備的性能狀態(tài)被分析以總體上確定計算系統(tǒng)的近似性能狀態(tài)。
[0063]在各個實施例中,根據(jù)高級配置和電源接口(ACPI)性能狀態(tài)表確定每個性能狀態(tài)的性能和最大功耗。ACPI性能狀態(tài)表是用于確定計算系統(tǒng)中特定設備的功率和性能特性的工業(yè)標準。例如,設備的性能狀態(tài)可指定特定設備的頻率和最大功率數(shù)量。
[0064]在框504,基于每個性能狀態(tài)的性能和最大功耗確定計算系統(tǒng)的目標性能狀態(tài)。目標性能狀態(tài)可被確定以使得總體功耗低于總體功耗限制并且計算系統(tǒng)的性能在性能容限內。此外,計算系統(tǒng)的性能狀態(tài)可根據(jù)目標性能狀態(tài)來調整。因為計算系統(tǒng)是同質的,所以計算系統(tǒng)的性能狀態(tài)可同時并且相同地被調整。
[0065]在各個實施例中,如果總體功耗超過總體功耗限制,數(shù)據(jù)中心管理代理可選擇負載周期,以在更高和更低的性能狀態(tài)之間操作計算系統(tǒng)。負載周期的時段可根據(jù)在初始性能狀態(tài)的理論功耗與在目標性能狀態(tài)的理論功耗的比率來計算。負載周期的時段還可根據(jù)在初始性能狀態(tài)的測量功耗與在目標性能狀態(tài)的測量功耗的比率來計算。
[0066]要理解,圖5的過程流程圖并非意圖指示方法500的步驟要以任何特定順序執(zhí)行或在每種情況中都包括方法500的全部步驟。另外,取決于特定實現(xiàn)方式的細節(jié),任何數(shù)量的附加步驟可包括于方法500中。
[0067]圖6為過程流程圖,示出了用于基于在指定時間段上收集的功耗和性能數(shù)據(jù)調整每個計算系統(tǒng)的功耗限制的方法600。方法在框602開始,在該處每個計算系統(tǒng)的功耗限制通過總體功耗限制除以計算系統(tǒng)的總數(shù)來確定。在各個實施例中,根據(jù)方法600利用的計算系統(tǒng)為同質計算系統(tǒng)。
[0068]在框604,計算系統(tǒng)被監(jiān)視,以確定在指定時間段上的每個計算系統(tǒng)的功耗和性能。指定時間段可通過數(shù)據(jù)中心管理代理來自動確定或可通過數(shù)據(jù)中心管理代理駐留在其上的計算系統(tǒng)的用戶確定。
[0069]在框606,基于特定時間段上的功耗和性能調整每個計算系統(tǒng)的功耗限制。每個計算設備的功耗限制可被調整以使得計算系統(tǒng)的性能保持在性能容限內。此外,數(shù)據(jù)中心管理代理可使用各種技術中的任一個來計算對每個計算設備的功耗限制的合適調整。例如,功耗限制可被增加或減小,以使得計算系統(tǒng)的操作一次僅由一個性能狀態(tài)改變。作為另一示例,功耗限制可基于使用計算系統(tǒng)的ACPI性能狀態(tài)表執(zhí)行的計算而被增加或減小。
[0070]要理解,圖6的過程流程圖并非意圖指示方法600的步驟要以任何特定順序執(zhí)行或在每種情況中都包括方法600的全部步驟。另外,取決于特定實現(xiàn)方式的細節(jié),任何數(shù)量的附加步驟可包括于方法600中。
[0071]圖7為過程流程圖,示出了用于基于使用測量的功耗和性能數(shù)據(jù)構建的表來確定每個計算系統(tǒng)的功耗限制的方法700。方法在框702開始,在其處每個計算系統(tǒng)操作于多個性能狀態(tài)中的每一個。每個性能狀態(tài)可包括性能和最大功耗。
[0072]在框704,與每個性能狀態(tài)中的每個計算系統(tǒng)的功耗和性能相關的數(shù)據(jù)被收集。這種功耗和性能信息可按照規(guī)則或不規(guī)則間隔被收集。
[0073]在框706,基于所述數(shù)據(jù)構建包括測量的性能狀態(tài)的表。每個測量的性能狀態(tài)可包括測量的性能和測量的平均功耗。該表可比ACPI性能狀態(tài)表更精確,這是因為該表基于收集自計算系統(tǒng)的實際數(shù)據(jù)。
[0074]在框708,該表被用于確定每個計算系統(tǒng)的功耗限制。功耗限制可被確定以使得計算系統(tǒng)的性能在性能容限內。
[0075]要理解,圖7的過程流程圖并非意圖指示方法700的步驟要以任何特定順序執(zhí)行或在每種情況中都包括方法700的全部步驟。另外,取決于特定實現(xiàn)方式的細節(jié),任何數(shù)量的附加步驟可包括于方法700中。
[0076]圖8為過程流程圖,示出了用于基于在處于統(tǒng)一功耗的各計算系統(tǒng)的操作期間收集的性能數(shù)據(jù)來調整每個計算系統(tǒng)功耗限制的方法800。在各個實施例中,根據(jù)方法800利用的計算系統(tǒng)為同質計算系統(tǒng)。例如,可執(zhí)行這樣的方法800,其中希望僅操作具有最高性能的指定數(shù)量的計算系統(tǒng)。
[0077]方法在框802開始,在其處計算系統(tǒng)以統(tǒng)一功耗操作。統(tǒng)一功耗可通過總體功耗限制除以計算系統(tǒng)的總數(shù)來確定。
[0078]在框804,計算系統(tǒng)被監(jiān)視,以確定在指定時間段上每個計算系統(tǒng)的性能。在框806,具有最高性能的指定數(shù)量的計算系統(tǒng)被確定。在框808,不在具有最高性能的指定數(shù)量的計算系統(tǒng)內的每個計算系統(tǒng)被斷電。
[0079]在框810,基于特定時間段上的每個計算系統(tǒng)的性能調整指定數(shù)量的計算系統(tǒng)的每一個的功耗限制。例如,因為多個計算系統(tǒng)已被斷電,針對指定數(shù)量的計算系統(tǒng)的每一個的功耗限制可被增加。這些計算系統(tǒng)的功耗限制可被確定以使得性能容限不被超過。
[0080]要理解,圖8的過程流程圖并非意圖指示方法800的步驟要以任何特定順序執(zhí)行或在每種情況中都包括方法800的全部步驟。另外,取決于特定實現(xiàn)方式的細節(jié),任何數(shù)量的附加步驟可包括于方法800中。
[0081]圖9為過程流程圖,示出了用于基于處于統(tǒng)一性能的計算系統(tǒng)的操作期間收集的功耗數(shù)據(jù)來調整每個計算系統(tǒng)的性能的方法900。在各個實施例中,根據(jù)方法900利用的計算系統(tǒng)為同質計算系統(tǒng)。例如,可執(zhí)行這樣的方法900,其中希望僅操作具有最低功耗的指定數(shù)量的計算系統(tǒng)。
[0082]方法在框902開始,在該處計算系統(tǒng)以統(tǒng)一性能被操作。可使用針對計算系統(tǒng)的ACPI性能狀態(tài)表來確定統(tǒng)一性能。此外,可基于來自數(shù)據(jù)中心管理代理駐留于其上的計算系統(tǒng)的用戶的輸入來確定統(tǒng)一性能。統(tǒng)一性能可被確定以使得總體功耗限制不被超過。
[0083]在框904,計算系統(tǒng)被監(jiān)視,以確定每個計算系統(tǒng)在指定時間段上的功耗。在框906,具有最低功耗的指定數(shù)量的計算系統(tǒng)被確定。在框908,不在具有最低功耗的指定數(shù)量的計算系統(tǒng)內的每個計算系統(tǒng)被斷電。
[0084]在框910,基于每個計算系統(tǒng)在特定時間段上的功耗來調整指定數(shù)量的計算系統(tǒng)中每一個的性能。例如,因為多個計算系統(tǒng)已被斷電,指定數(shù)量的計算系統(tǒng)中每一個的性能可被增加。然而,計算系統(tǒng)的性能可被確定以使得總體功耗限制不被超過。
[0085]要理解,圖9的過程流程圖并非意圖指示方法900的步驟要以任何特定順序執(zhí)行或在每種情況中都包括方法900的全部步驟。另外,取決于特定實現(xiàn)方式的細節(jié),任何數(shù)量的附加步驟可包括于方法900中。
[0086]圖10為過程流程圖,示出了用于基于計算系統(tǒng)達到特定邊界條件的時間來調整每個計算系統(tǒng)的功耗限制的方法1000。根據(jù)方法1000,每個計算系統(tǒng)的功耗限制通過總體功耗限制除以計算系統(tǒng)的總數(shù)來確定。
[0087]方法在框1002開始,在該處每個計算系統(tǒng)的功耗和每個計算系統(tǒng)達到特定邊界條件的時間被監(jiān)視。例如,每個計算系統(tǒng)可在其在執(zhí)行計算期間(例如,在執(zhí)行特定工作負荷期間)達到特定邊界條件時向數(shù)據(jù)中心管理代理報告。特定邊界條件可為,例如,期望橫跨各個計算系統(tǒng)的工作負荷同步的時間。此外,特定邊界條件可為特定系統(tǒng)調用,該調用對全部計算系統(tǒng)可見。
[0088]在框1004,在最慢時間段中達到特定邊界條件的計算系統(tǒng)子集的功耗限制被增力口。在框1006,在最快時間段中達到特定邊界條件的剩余數(shù)量的計算系統(tǒng)的功耗限制被減小。這可保證具有不同性能特性的計算系統(tǒng)行在類似時間(例如,在特定時間段內)結束特定工作負荷的執(zhí)行。
[0089]要理解,圖10的過程流程圖并非意圖指示方法1000的步驟要以任何特定順序執(zhí)行或在每種情況中都包括方法1000的全部步驟。另外,取決于特定實現(xiàn)方式的細節(jié),任何數(shù)量的附加步驟可包括于方法1000中。
[0090]在各個實施例中,方法400-1000中任一個可相互結合使用。換言之,取決于特定實現(xiàn)方式的細節(jié),方法400-1000中任一個可按照任何順序或按任何類型的組合執(zhí)行。例如,方法800或900可在其他方法400-700或1000中任一個的實現(xiàn)之前執(zhí)行。
[0091]方法300-1000可針對多個不同類型的計算系統(tǒng)中任一個被執(zhí)行。例如,計算系統(tǒng)可被包括于HPC環(huán)境中或計算系統(tǒng)可為超級計算機。此外,計算系統(tǒng)可包括用于實現(xiàn)搜索引擎或電子商務存儲等等的服務器或其它計算設備。因此,方法300-1000可根據(jù)方法300-1000正針對其執(zhí)行的計算系統(tǒng)的特定組的性質來合適地調整。
[0092]方法300-1000中的任一個可在計算系統(tǒng)的操作期間的各個時間點被執(zhí)行。例如,方法300-1000中的任一個可在計算系統(tǒng)正在被構建和配置時或在使用預先確定的工作負荷的計算系統(tǒng)啟動期間被執(zhí)行。在這種實例中,功耗和性能數(shù)據(jù)可例如存儲于易失性或非易失性存儲器中或外部數(shù)據(jù)庫中。方法300-1000中的任一個可在實際工作計算被執(zhí)行之前按需執(zhí)行。在這種實例中,工作負荷可被預裝載或可在運行中被提供。另外,方法300-1000中的任一個可在計算系統(tǒng)的操作期間被連續(xù)地或周期性地執(zhí)行。
[0093]圖11為示出有形的、非暫存計算機可讀介質1100的框圖,計算機可讀介質1100存儲用于管理計算系統(tǒng)的功耗和性能的代碼。有形的,非暫存計算機可讀介質1100可由處理器1102通過計算機總線1104訪問。此外,有形的,非暫存計算機可讀介質1100可包括被配置為指揮處理器1102執(zhí)行本文描述的方法的代碼。
[0094]本文討論的各個軟件組件可被存儲于有形的計算機可讀介質1100上,如圖11中指示的。例如,功耗監(jiān)視模塊1106可被配置為確定多個計算系統(tǒng)的功耗以及計算系統(tǒng)的總體功耗。性能監(jiān)視模塊1108可被配置為確定計算系統(tǒng)的性能。性能監(jiān)視模塊1108還可被配置為確定計算系統(tǒng)的性能的差值是否超過性能容限。另外,功耗和性能管理模塊1110可被配置為調整計算系統(tǒng)的功耗限制和性能,以使得總體功耗限制和性能容限不被超過。
[0095]應當理解,圖11的框圖并非意圖指示有形的、非暫存計算機可讀介質1100包括圖11中所示的全部組件。另外,取決于特定實現(xiàn)方式的細節(jié),圖11中未示出的任何數(shù)量的附加組件可被包括于有形的、非暫存計算機可讀介質1100中。
[0096]示例 I
[0097]本文提供了一種用于管理計算系統(tǒng)的功耗和性能的方法。方法包括監(jiān)視計算系統(tǒng)的總體功耗,以確定總體功耗高于還是低于總體功耗限制,并且監(jiān)視每個計算系統(tǒng)的性能以確定該性能是否在性能容限內。該方法進一步包括調整計算系統(tǒng)的功耗限制或計算系統(tǒng)的性能,以使得計算系統(tǒng)的總體功耗低于總體功耗限制并且每個計算系統(tǒng)的性能在性能容限內。
[0098]該方法可經由遠程計算系統(tǒng)中的數(shù)據(jù)中心管理代理來執(zhí)行。此外,計算系統(tǒng)的功耗限制可從遠程計算系統(tǒng)的數(shù)據(jù)中心管理代理被發(fā)送至計算系統(tǒng)中的節(jié)點管理代理。節(jié)點管理代理可被配置為將計算系統(tǒng)的功耗保持為低于功耗限制并且保持計算系統(tǒng)的性能在性能容限內。
[0099]該計算系統(tǒng)可包括具有相同的硬件配置和相同的軟件配置的同質計算系統(tǒng)。該計算系統(tǒng)的性能可被統(tǒng)一調整,以使得計算系統(tǒng)操作在相同的性能并且總體功耗低于總體功耗限制。
[0100]計算系統(tǒng)的總體功耗可被周期性地監(jiān)視。響應于確定總體功耗超過上閾值功耗,計算系統(tǒng)的性能可被減小,以使得總體功耗低于上閾值功耗。響應于確定總體功耗低于下閾值功耗,計算系統(tǒng)的性能可被增加,以使得總體功耗高于下閾值功耗。
[0101]可根據(jù)高級配置和電源接口(ACPI)性能狀態(tài)表來確定針對計算系統(tǒng)中的設備的每個性能狀態(tài)的性能和最大功耗。計算系統(tǒng)的目標性能狀態(tài)可基于針對每個性能狀態(tài)的性能和最大功耗來確定。目標性能狀態(tài)可被確定以使得總體功耗低于總體功耗限制并且計算系統(tǒng)的性能在性能各限內。
[0102]每個計算系統(tǒng)的功耗限制可通過總體功耗限制除以計算系統(tǒng)的總數(shù)來確定。計算系統(tǒng)可被監(jiān)視以確定在指定時間段上每個計算系統(tǒng)的功耗和性能。每個計算系統(tǒng)的功耗限制可基于特定時間段上的功耗和性能被調整。每個計算設備的功耗限制可被調整以使得計算系統(tǒng)的性能保持在性能容限內。
[0103]計算系統(tǒng)可在統(tǒng)一功耗操作。計算系統(tǒng)可被監(jiān)視以確定指定時間段上的每個計算系統(tǒng)的性能。具有最高性能的指定數(shù)量的計算系統(tǒng)可被確定。不在具有最高性能的指定數(shù)量的計算系統(tǒng)中的每個計算系統(tǒng)可被斷電。針對指定數(shù)量的計算系統(tǒng)中的每一個的功耗限制可基于特定時間段上的每個計算系統(tǒng)的性能被調整。
[0104]計算系統(tǒng)可操作在統(tǒng)一性能。計算系統(tǒng)可被監(jiān)視以確定每個計算系統(tǒng)在指定時間段上的功耗,并且具有最低功耗的指定數(shù)量的計算系統(tǒng)可被確定。不在具有最低功耗的指定數(shù)量的計算系統(tǒng)中的每個計算系統(tǒng)可被斷電。指定數(shù)量的計算系統(tǒng)中每一個的性能可基于特定時間段上每個計算系統(tǒng)的功耗來調整。
[0105]每個計算系統(tǒng)可操作于多個性能狀態(tài)的每一個中,其中每個性能狀態(tài)包括性能和最大功耗。與每個性能狀態(tài)中的每個計算系統(tǒng)的功耗和性能相關的數(shù)據(jù)可被收集。包括測量的性能狀態(tài)的表可基于該數(shù)據(jù)被構建,其中每個測量的性能狀態(tài)包括平均性能和平均功耗。該表可用于確定每個計算系統(tǒng)的功耗限制,其中功耗限制被確定以使得計算系統(tǒng)的性能在性能各限內。
[0106]每個計算系統(tǒng)的功耗以及每個計算系統(tǒng)達到特定邊界條件的時間可被監(jiān)視。針對在最慢時間段中達到特定邊界條件的計算系統(tǒng)子集的功耗限制可被增加。針對在最快時間段中達到特定邊界條件的剩余數(shù)量的計算系統(tǒng)的功耗限制可被減小。
[0107]示例2
[0108]本文提供了一種用于管理計算系統(tǒng)的功耗和性能的系統(tǒng)。該系統(tǒng)包括數(shù)據(jù)中心管理系統(tǒng),其被配置為基于計算系統(tǒng)的總體功耗限制和性能容限來確定針對數(shù)據(jù)中心中的多個計算系統(tǒng)中每一個的平臺級功耗限制。該系統(tǒng)還包括計算系統(tǒng)。每個計算系統(tǒng)包括節(jié)點管理代理,節(jié)點管理代理被配置為通過確定針對計算系統(tǒng)平臺中每個插座的插座級功耗限制來將計算系統(tǒng)的平臺級功耗保持為低于平臺級功耗限制。每個計算系統(tǒng)還包括多個組件管理代理,其中每個組件管理代理被配置為保持針對計算系統(tǒng)中對應插座的插座級功耗限制。
[0109]該性能容限可包括計算系統(tǒng)之間指定的最大性能差值。此外,計算系統(tǒng)可為具有相同的硬件配置和相同的軟件配置的同質計算系統(tǒng)。
[0110]該數(shù)據(jù)中心管理系統(tǒng)可被配置為根據(jù)高級配置和電源接口(ACPI)性能狀態(tài)表確定針對計算系統(tǒng)中設備每個性能狀態(tài)的性能和最大功耗。該數(shù)據(jù)中心管理系統(tǒng)還可被配置為基于針對每個性能狀態(tài)的性能和最大功耗來確定計算系統(tǒng)的目標性能狀態(tài)。目標性能狀態(tài)可被確定以使得總體功耗低于總體功耗限制并且計算系統(tǒng)的性能在性能容限內。
[0111]該數(shù)據(jù)中心管理系統(tǒng)可被配置為通過總體功耗限制除以計算系統(tǒng)的總數(shù)來確定每個計算系統(tǒng)的功耗限制并且監(jiān)視計算系統(tǒng)以確定每個計算系統(tǒng)在指定時間段上的功耗和性能。數(shù)據(jù)中心管理系統(tǒng)還可被配置為基于特定時間段上的功耗和性能來調整每個計算系統(tǒng)的功耗限制,其中每個計算設備的功耗限制被調整以使得計算系統(tǒng)的性能保持在性能容限內。
[0112]該數(shù)據(jù)中心管理系統(tǒng)可被配置為在多個性能狀態(tài)的每一個中操作每個計算系統(tǒng),其中每個性能狀態(tài)包含性能和最大功耗,并收集與每個性能狀態(tài)中的每個計算系統(tǒng)的功耗和性能相關的數(shù)據(jù)。數(shù)據(jù)中心管理系統(tǒng)還可被配置為基于該數(shù)據(jù)構建包括測量的性能狀態(tài)的表,其中每個測量的性能狀態(tài)包括平均性能和平均功耗。另外,數(shù)據(jù)中心管理系統(tǒng)可被配置為使用該表來確定每個計算系統(tǒng)的功耗限制,其中該功耗限制被確定以使得計算系統(tǒng)的性能在性能容限內。
[0113]該數(shù)據(jù)中心管理系統(tǒng)可被配置為調整每個計算系統(tǒng)的平臺級功耗限制以使得計算系統(tǒng)的總體功耗小于總體功耗限制并且計算系統(tǒng)的性能在性能容限內。
[0114]示例3
[0115]本文提供了至少一個機器可讀介質。該機器可讀介質包括存儲在其中的指令,響應于在計算設備上被執(zhí)行,使計算設備監(jiān)視計算系統(tǒng)的合并功耗,以確定合并的功耗高于還是低于合并的功耗限制,并且監(jiān)視計算系統(tǒng)的性能之間的差值以確定該差值高于還是低于性能差值限制。另外,該指令使計算設備調整計算系統(tǒng)的功耗限制或計算系統(tǒng)的性能,以使得該合并的功耗低于該合并功的耗限制并且性能之間的差值低于性能差值限制。
[0116]該計算系統(tǒng)可包括具有相同的硬件配置和相同的軟件配置的同質計算系統(tǒng)。該指令可使計算設備根據(jù)高級配置和電源接口(ACPI)性能狀態(tài)表確定針對計算系統(tǒng)中設備的每個性能狀態(tài)的性能和最大功耗。該指令還可使計算設備基于針對每個性能狀態(tài)的性能和最大功耗確定計算系統(tǒng)的目標性能狀態(tài)。該目標性能狀態(tài)可被確定以使得合并的功耗低于合并的功耗限制并且性能之間的差值低于性能差值限制。
[0117]該指令可使計算設備通過把合并的功耗限制除以計算系統(tǒng)的總數(shù)來確定每個計算系統(tǒng)的功耗限制,并監(jiān)視計算系統(tǒng)以確定每個計算系統(tǒng)在指定時間段上的功耗和性能。該指令還可使計算設備基于特定時間段上的功耗和性能來調整每個計算系統(tǒng)的功耗限制,其中每個計算設備的功耗限制被調整以使得計算系統(tǒng)的性能之間的差值低于性能差值限制。
[0118]該指令可使計算設備在多個性能狀態(tài)的每一個中操作每個計算系統(tǒng),其中每個性能狀態(tài)包含性能和最大功耗,并且收集與在每個性能狀態(tài)中的每個計算系統(tǒng)的功耗和性能相關的數(shù)據(jù)。該指令還可使計算設備基于該數(shù)據(jù)構建包括測量的性能狀態(tài)的表,其中每個測量的性能狀態(tài)包括平均性能和平均功耗。進一步,該指令可使計算設備使用該表來確定每個計算系統(tǒng)的功耗限制,其中該功耗限制被確定以使得性能之間的差值低于性能差值限制。要理解,前述示例中的細節(jié)可在一個或多個實施例中的任何地方使用。例如,上述計算設備的全部可選特征還可關于本文描述的方法或計算機可讀介質中的任一個被實現(xiàn)。此夕卜,盡管流程圖和/或狀態(tài)圖可在本文中用于描述實施例,但本發(fā)明不限于那些圖或不限于本文中對應的描述。例如,流程不必經過每個圖示的框或狀態(tài)或按照如本文所圖示和描述的完全相同的順序移動。
[0119]本發(fā)明不限于本文所列的特定細節(jié)。事實上,受益于本公開的本領域技術人員將會理解,在本發(fā)明的范圍內,根據(jù)在前描述和附圖可作出許多其它變化。因此,所附權利要求包括定義本發(fā)明的范圍的對其的任何修改。
【權利要求】
1.一種用于管理計算系統(tǒng)的功耗和性能的方法,包含: 監(jiān)視所述計算系統(tǒng)的總體功耗以確定所述總體功耗高于還是低于總體功耗限制; 監(jiān)視每個計算系統(tǒng)的性能以確定每個計算系統(tǒng)的性能是否在性能容限內;以及調整所述計算系統(tǒng)的功耗限制或所述計算系統(tǒng)的性能,以使所述計算系統(tǒng)的總體功耗低于總體功耗限制并且每個計算系統(tǒng)的性能處于所述性能容限內。
2.根據(jù)權利要求1的方法,其中所述方法經由遠程計算系統(tǒng)中的數(shù)據(jù)中心管理代理執(zhí)行。
3.根據(jù)權利要求2的方法,包含:從所述遠程計算系統(tǒng)中的數(shù)據(jù)中心管理代理發(fā)送計算系統(tǒng)的功耗限制至所述計算系統(tǒng)中的節(jié)點管理代理,所述節(jié)點管理代理被配置為將所述計算系統(tǒng)的功耗保持為低于所述功耗限制并且所述計算系統(tǒng)的性能在所述性能容限內。
4.根據(jù)權利要求1的方法,其中所述計算系統(tǒng)包含具有相同的硬件配置和相同的軟件配置的同質計算系統(tǒng),。
5.根據(jù)權利要求4的方法,包含:統(tǒng)一調整所述計算系統(tǒng)的性能,以使所述計算系統(tǒng)操作于相同的性能并且所述總體功耗低于所述總體功耗限制。
6.根據(jù)權利要求4的方法,包含: 周期性地監(jiān)視所述計算系統(tǒng)的總體功耗; 響應于確定所述總體功耗超過上閾值功耗,減小所述計算系統(tǒng)的性能,以使所述總體功耗低于所述上閾值功耗;以及 響應于確定所述總體功耗低于下閾值功耗,增加所述計算系統(tǒng)的性能,以使所述總體功耗高于所述下閾值功耗。
7.根據(jù)權利要求4的方法,包含: 根據(jù)高級配置和電源接口(ACPI)性能狀態(tài)表確定針對所述計算系統(tǒng)中設備每個性能狀態(tài)的性能和最大功耗;以及 基于針對每個性能狀態(tài)的性能和最大功耗確定所述計算系統(tǒng)的目標性能狀態(tài),其中所述目標性能狀態(tài)被確定,以使所述總體功耗低于所述總體功耗限制并且所述計算系統(tǒng)的性能在所述性能容限內。
8.根據(jù)權利要求4的方法,包含: 通過把所述總體功耗限制除以計算系統(tǒng)的總數(shù)確定每個計算系統(tǒng)的功耗限制; 監(jiān)視所述計算系統(tǒng)以確定每個計算系統(tǒng)在指定時間段上的功耗和性能;以及基于在所述特定時間段上的功耗和性能來調整每個計算系統(tǒng)的功耗限制,其中每個計算設備的功耗限制被調整,以使所述計算系統(tǒng)的性能保持在所述性能容限內。
9.根據(jù)權利要求4的方法,包含: 以統(tǒng)一功耗操作所述計算系統(tǒng); 監(jiān)視所述計算系統(tǒng)以確定在指定時間段上每個計算系統(tǒng)的性能; 確定具有最高性能的指定數(shù)量的計算系統(tǒng); 將不在具有所述最高性能的所述指定數(shù)量的計算系統(tǒng)中的每個計算系統(tǒng)斷電;以及基于所述特定時間段上每個計算系統(tǒng)的性能來調整所述指定數(shù)量的計算系統(tǒng)中每一個的功耗限制。
10.根據(jù)權利要求4的方法,包含: 以統(tǒng)一性能操作所述計算系統(tǒng); 監(jiān)視所述計算系統(tǒng)以確定在指定時間段上每個計算系統(tǒng)的功耗; 確定具有最低功耗的指定數(shù)量的計算系統(tǒng); 將不在具有所述最低功耗的所述指定數(shù)量的計算系統(tǒng)中的每個計算系統(tǒng)斷電;以及 基于在特定時間段上每個計算系統(tǒng)的功耗來調整指定數(shù)量的計算系統(tǒng)中每一個的性倉泛。
11.根據(jù)權利要求1的方法,包含: 在多個性能狀態(tài)的每一個中操作每個計算系統(tǒng),其中每個性能狀態(tài)包含性能和最大功耗; 收集與每個計算系統(tǒng)在每個性能狀態(tài)中的功耗和性能相關的數(shù)據(jù); 基于所述數(shù)據(jù)構建包含測量的性能狀態(tài)的表,其中每個測量的性能狀態(tài)包含平均性能和平均功耗;以及 使用所述表確定每個計算系統(tǒng)的功耗限制,其中所述功耗限制被確定以使所述計算系統(tǒng)的性能在所述性能容限內。
12.根據(jù)權利要求1的方法,包含: 監(jiān)視每個計算系統(tǒng)的功耗和每個計算系統(tǒng)達到特定邊界條件的時間; 增加在最慢時間段中達到所述特定邊界條件的計算系統(tǒng)子集的功耗限制;以及 減小在最快時間段中達到所述特定邊界條件的剩余數(shù)量的計算系統(tǒng)的功耗限制。
13.一種用于管理計算系統(tǒng)的功耗和性能的系統(tǒng),包含: 數(shù)據(jù)中心管理系統(tǒng),被配置為:基于多個計算系統(tǒng)的總體功耗限制和性能容限來確定數(shù)據(jù)中心中所述多個計算系統(tǒng)的每一個的平臺級功耗限制;以及所述多個計算系統(tǒng),其中每個計算系統(tǒng)包含: 節(jié)點管理代理,被配置為:通過確定所述計算系統(tǒng)的平臺中的每個插座的插座級功耗限制來將所述計算系統(tǒng)的平臺級功耗保持為低于所述平臺級功耗限制;以及 多個組件管理代理,其中每個組件管理代理被配置為保持所述計算系統(tǒng)中對應插座的插座級功耗限制。
14.根據(jù)權利要求13的系統(tǒng),其中所述性能容限包含所述多個計算系統(tǒng)之間的指定最大性能差值。
15.根據(jù)權利要求13的系統(tǒng),其中所述多個計算系統(tǒng)包含具有相同的硬件配置和相同的軟件配置的同質計算系統(tǒng)。
16.根據(jù)權利要求15的系統(tǒng),其中所述數(shù)據(jù)中心管理系統(tǒng)被配置為: 根據(jù)高級配置和電源接口(ACPI)性能狀態(tài)表確定所述計算系統(tǒng)中設備的每個性能狀態(tài)的性能和最大功耗;并且 基于每個性能狀態(tài)的所述性能和所述最大功耗確定所述計算系統(tǒng)的目標性能狀態(tài),其中所述目標性能狀態(tài)被確定以使所述總體功耗低于所述總體功耗限制并且所述計算系統(tǒng)的所述性能在所述性能容限內。
17.根據(jù)權利要求15的系統(tǒng),其中所述數(shù)據(jù)中心管理系統(tǒng)被配置為: 通過把所述總體功耗限制除以計算系統(tǒng)的總數(shù)來確定每個計算系統(tǒng)的功耗限制; 監(jiān)視所述計算系統(tǒng)以確定每個計算系統(tǒng)在指定時間段上的功耗和性能;以及 基于在所述特定時間段上的所述功耗和性能調整每個計算系統(tǒng)的功耗限制,其中每個計算設備的所述功耗限制被調整以使所述計算系統(tǒng)的所述性能保持在所述性能容限內。
18.根據(jù)權利要求13的系統(tǒng),其中所述數(shù)據(jù)中心管理系統(tǒng)被配置為: 在多個性能狀態(tài)的每一個中操作每個計算系統(tǒng),其中每個性能狀態(tài)包含性能和最大功耗; 收集與每個性能狀態(tài)中的每個計算系統(tǒng)的功耗和性能有關的數(shù)據(jù); 基于所述數(shù)據(jù)構建包含測量的性能狀態(tài)的表,其中每個所述測量的性能狀態(tài)包含平均性能和平均功耗;以及 使用所述表確定每個計算系統(tǒng)的所述功耗限制,其中所述功耗限制被確定以使所述計算系統(tǒng)的所述性能在所述性能容限內。
19.根據(jù)權利要求13的系統(tǒng),其中所述數(shù)據(jù)中心管理系統(tǒng)被配置為:調整針對所述多個計算系統(tǒng)中的每一個的平臺級功耗限制,以使所述多個計算系統(tǒng)的總體功耗小于所述總體功耗限制并且所述多個計算系統(tǒng)的性能在所述性能容限內。
20.至少一個機器可讀介質,具有存儲在其中的指令,響應于在計算設備上執(zhí)行,所述指令使所述計算設備: 監(jiān)視所述計算系統(tǒng)的合并功耗,以確定合并功耗高于還是低于合并功耗限制; 監(jiān)視所述計算系統(tǒng)的性能之間的差值,以確定所述差值高于還是低于性能差值限制;并且 調整所述計算系統(tǒng)的功耗限制或所述計算系統(tǒng)的性能,以使所述合并功耗低于所述合并功耗限制并且所述性能之間的所述差值低于所述性能差值限制。
21.根據(jù)權利要求20的至少一個機器可讀介質,其中所述計算系統(tǒng)包含具有相同的硬件配置和相同的軟件配置的同質計算系統(tǒng)。
22.根據(jù)權利要求21的至少一個機器可讀介質,其中所述指令使所述計算設備: 根據(jù)高級配置和電源接口(ACPI)性能狀態(tài)表確定針對所述計算系統(tǒng)中設備的每個性能狀態(tài)的性能和最大功耗;并且 基于每個性能狀態(tài)的性能和最大功耗確定所述計算系統(tǒng)的目標性能狀態(tài),其中所述目標性能狀態(tài)被確定以使所述合并功耗低于所述合并功耗限制并且所述性能之間的差值低于所述性能差值限制。
23.根據(jù)權利要求21的至少一個機器可讀介質,其中所述指令使所述計算設備: 通過把所述合并功耗限制除以計算系統(tǒng)的總數(shù)確定每個計算系統(tǒng)的功耗限制: 監(jiān)視所述計算系統(tǒng)以確定每個計算系統(tǒng)在指定時間段上的功耗和性能;以及 基于所述特定時間段上的所述功耗和所述性能調整每個計算系統(tǒng)的所述功耗限制,其中每個計算設備的所述功耗限制被調整以使所述計算系統(tǒng)的所述性能之間的差值低于所述性能差值限制。
24.根據(jù)權利要求20的至少一個機器可讀介質,其中所述指令使所述計算設備: 在多個性能狀態(tài)的每一個中操作每個計算系統(tǒng),其中每個性能狀態(tài)包含性能和最大功耗; 收集與每個性能狀態(tài)中的每個計算系統(tǒng)的功耗和性能相關的數(shù)據(jù); 基于所述數(shù)據(jù)構建包含測量的性能狀態(tài)的表,其中每個所述測量的性能狀態(tài)包含平均性能和平均功耗;以及 使用所述表確定每個計算系統(tǒng)的所述功耗限制,其中所述功耗限制被確定以使所述性能之間的所述差值低于所述性能差值限制。
【文檔編號】G06F1/28GK104335137SQ201280072500
【公開日】2015年2月4日 申請日期:2012年5月17日 優(yōu)先權日:2012年5月17日
【發(fā)明者】D·V·博達斯, J·H·克拉福德, A·G·加拉 申請人:英特爾公司