專利名稱:用于管理功率的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及在具有多個(gè)電子設(shè)備的電子系統(tǒng)中管理功率。
背景技術(shù):
通常在機(jī)架(rack)上將服務(wù)器和其他計(jì)算機(jī)硬件組合到一起,以保存 空間并將服務(wù)器和基礎(chǔ)結(jié)構(gòu)放在中央位置以便由管理員訪問(wèn)。管理這些"機(jī) 架系統(tǒng)"可能比分別管理多個(gè)分散的服務(wù)器更容易且更便宜。機(jī)架系統(tǒng)在尺 寸、密度和設(shè)計(jì)的范圍內(nèi)可用。可以在自支持的服務(wù)器周?chē)⒁恍C(jī)架系 統(tǒng),在該自支持的服務(wù)器中,每個(gè)服務(wù)器具有單獨(dú)的底架(chassis),板上 (on-board)電源、冷卻送風(fēng)機(jī)和其他支持設(shè)備??梢砸詸C(jī)架或塔狀配置來(lái)組 合自支持服務(wù)器,并且其相互聯(lián)網(wǎng)和聯(lián)網(wǎng)到客戶端計(jì)算機(jī)??梢允褂镁哂斜?連接在多刀片底架中的共享支持模塊的、更傾斜的"刀鋒服務(wù)器(blade server)"來(lái)實(shí)現(xiàn)更高密度的架上系統(tǒng)。刀鋒服務(wù)器通常實(shí)現(xiàn)更大的密度,這 是由于具有更窄的外形因素并共享了諸如送風(fēng)機(jī)和功率模塊的支持模塊。當(dāng) 前可用的一些更緊湊的架上系統(tǒng)服務(wù)器布置包括從IBM可得到的SYSTEM X 服務(wù)器和eServer BLADECENTER (IBM、 BLADECENTER、 SYSTEM X是 紐約阿芒克的國(guó)際商業(yè)機(jī)器^^司的注冊(cè)商標(biāo))。
功率管理對(duì)于操作架上系統(tǒng)的許多方面、諸如最小化操作服務(wù)器的花費(fèi)、 最小化由服務(wù)器產(chǎn)生的熱量并最優(yōu)化系統(tǒng)的性能和效率來(lái)說(shuō)是重要的。服務(wù) 器正日益受到根據(jù)用戶可設(shè)置的功率限制(可互換地稱為"功率蓋(cap)") 的功率封頂(capping)的監(jiān)視和限制??梢允褂没诜答伒墓β使芾硐到y(tǒng)來(lái) "調(diào)節(jié)(throttle )"在服務(wù)器上的處理器和/或存儲(chǔ)器,以強(qiáng)加功率限制。例如, 一些服務(wù)器包括底板管理控制器(Baseboard Management Controller, BMC ), 其中服務(wù)處理器可以使用該底板管理控制器(BMC)來(lái)監(jiān)視服務(wù)器的實(shí)時(shí)功 耗,并如需要?jiǎng)t調(diào)節(jié)處理器以實(shí)行(enforce)功率限制。為了實(shí)行功率限制, 向下調(diào)節(jié)處理器以犧牲性能。在由于相關(guān)數(shù)據(jù)中心的物理功率分布限制而選 擇了功率限制的情況下,功率封頂特征防止在功率分布路徑上的過(guò)重負(fù)擔(dān)。在其他情況下,用戶可以由于預(yù)算原因而選擇限制功率,在這種情況下,功 率封頂幫助控制運(yùn)行數(shù)據(jù)中心的花費(fèi)。功率封頂被用于限制功耗,即使數(shù)據(jù) 中心基礎(chǔ)結(jié)構(gòu)可能能夠支持額外的功率需求。
無(wú)論對(duì)于單個(gè)計(jì)算設(shè)備(例如服務(wù)器)還是對(duì)于多個(gè)設(shè)備的網(wǎng)絡(luò)(例如 聯(lián)網(wǎng)服務(wù)器的機(jī)架),計(jì)算功耗通常是動(dòng)態(tài)的,而不是恒定的。因?yàn)?,功率?求隨時(shí)間變化,因此將典型地存在數(shù)據(jù)中心或其子系統(tǒng)所需求的功率超過(guò)特 定功率限制的 一 些時(shí)段和功率需求小于特定功率限制的其他時(shí)間。當(dāng)需求超 過(guò)閾值時(shí),由功率封頂來(lái)限制功耗。但是,當(dāng)需求小于閾值時(shí),可能未充分 利用數(shù)據(jù)中心或其子系統(tǒng)。因此,將希望開(kāi)發(fā)一種功率管理方案,其補(bǔ)償未 充分利用的時(shí)段,以最大化服務(wù)器吞吐量。
發(fā)明內(nèi)容
一個(gè)實(shí)施例提供 一 種在具有多個(gè)電子的功耗設(shè)備的電子系統(tǒng)中管理功率 的方法。為每個(gè)設(shè)備選擇功率上限和小于所述功率上限的平均功率限制。確 定每個(gè)設(shè)備的瞬間功耗和平均功耗。防止每個(gè)設(shè)備的所述瞬間功耗超過(guò)各自 功率上限。標(biāo)識(shí)所述平均功耗小于所述平均功率限制的第一子組的設(shè)備,并 允許在所述第 一子組中的每個(gè)設(shè)備的瞬間功耗超過(guò)各自平均功率限制。標(biāo)識(shí) 所述平均功耗不小于所述平均功率限制的第二子組的設(shè)備。防止在所述第二 子組中的每個(gè)設(shè)備的瞬間功耗超過(guò)各自平均功率限制。
第二實(shí)施例提供一種在用于在具有多個(gè)電子的功耗設(shè)備的電子系統(tǒng)中管
理功率的計(jì)算機(jī)可讀介質(zhì)中的計(jì)算機(jī)程序產(chǎn)品。該計(jì)算機(jī)程序產(chǎn)品包括用 于為每個(gè)設(shè)備輸入功率上限和小于所述功率上限的平均功率限制的指令、用 于獲得每個(gè)設(shè)備的瞬間功耗和平均功耗的指令、用于防止每個(gè)設(shè)備的所述瞬 間功耗超過(guò)各自功率上限的指令、用于標(biāo)識(shí)所述平均功耗小于所述平均功率 限制的第 一子組的設(shè)備并允許在所述第 一子組中的每個(gè)設(shè)備的瞬間功耗超過(guò) 各自平均功率限制的指令、以及用于標(biāo)識(shí)所述平均功耗不小于所述平均功率 限制的第二子組的設(shè)備并防止在所述第二子組中的每個(gè)設(shè)備的瞬間功耗超過(guò) 各自平均功率限制的指令。
第三實(shí)施例提供一種功率管理的電子系統(tǒng)。多個(gè)功耗設(shè)備每個(gè)與電源通 信,用于接收變化量的功率。功率計(jì)量器檢測(cè)每個(gè)設(shè)備的功耗并輸出代表所 檢測(cè)的功耗的功耗信號(hào)。調(diào)節(jié)機(jī)構(gòu)被配置用于選擇地限制每個(gè)設(shè)備的功耗以
5與多個(gè)設(shè)備通
信的功率管理模塊從每個(gè)設(shè)備的所述功率計(jì)量器接收所述功耗信號(hào),確定每 個(gè)設(shè)備的瞬間功耗和平均功耗,并確定所述平均功耗小于各自平均功率限制 的第一子組的設(shè)備。在所述第一子組中的每個(gè)設(shè)備的瞬間功耗被允許超過(guò)各
自平均功率限制,并防止不在所述第 一子組中的每個(gè)設(shè)備的瞬間功耗超過(guò)各
自平均功率限制。
從以下的描述和所附權(quán)利要求中,本發(fā)明的其他實(shí)施例、方面和優(yōu)點(diǎn)將 變4尋明顯。
圖1是示范根據(jù)本發(fā)明的可被功率管理的、可安裝機(jī)架的多服務(wù)器計(jì)算 機(jī)系統(tǒng)的透視圖。
圖2是在多服務(wù)器計(jì)算機(jī)系統(tǒng)的環(huán)境下、根據(jù)本發(fā)明的一個(gè)實(shí)施例的功 率管理的計(jì)算機(jī)系統(tǒng)的示意圖。
圖3是大致概括根據(jù)本發(fā)明的一個(gè)實(shí)施例的、在計(jì)算機(jī)系統(tǒng)中管理功率 的方法的流程圖。
圖4是概括用于功率管理其多個(gè)設(shè)備包括服務(wù)器的計(jì)算機(jī)系統(tǒng)的方法的 一個(gè)例子的流程圖。
具體實(shí)施例方式
本發(fā)明提供用于在具有多個(gè)功耗電子設(shè)備的電子系統(tǒng)中管理功率的系 統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的實(shí)施例。本發(fā)明具體地可用于具有多個(gè)安裝機(jī) 架的服務(wù)器和支持硬件設(shè)備的計(jì)算機(jī)系統(tǒng)的領(lǐng)域。這種服務(wù)器可以包括精確 反饋控制系統(tǒng),用于選擇性地調(diào)節(jié)服務(wù)器以控制它們的功耗。通過(guò)在計(jì)算機(jī) 系統(tǒng)上運(yùn)行的方法來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明的功率管理方法,該計(jì)算機(jī)系統(tǒng)使用該 基于反饋的控制功能性來(lái)管理在計(jì)算機(jī)系統(tǒng)中的功率。因此,將在對(duì)具有多 個(gè)服務(wù)器的計(jì)算機(jī)系統(tǒng)來(lái)管理功率的環(huán)境下擴(kuò)展地討論本發(fā)明。受益于本公 開(kāi)的本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到,本發(fā)明還可以應(yīng)用于除了服務(wù)器以外的功耗 電子設(shè)備,以及應(yīng)用于具有多個(gè)功耗電子設(shè)備的其他電子系統(tǒng)。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,可以由系統(tǒng)管理員對(duì)于每個(gè)設(shè)備輸入兩個(gè)可 編程功耗閾值功率上限和小于功率上限的平均功率限制。通過(guò)防止每個(gè)設(shè)備的瞬間功耗超過(guò)其功率上限,同時(shí)還防止每個(gè)設(shè)備的平均功耗超過(guò)其平均 功率限制,來(lái)管理計(jì)算機(jī)系統(tǒng)的功率。計(jì)算平均功耗的時(shí)間間隔是用戶可選
擇的。例如,管理員可以選擇相對(duì)較長(zhǎng)的時(shí)間間隔(例如24小時(shí)),其中,
控制平均功耗以滿足日常功率預(yù)算,或選擇相對(duì)較短的時(shí)間間隔(例如,小
于l小時(shí)),其中,選擇平均功率限制以控制由服務(wù)器產(chǎn)生的熱量。可以使用 各種功率降低技術(shù)來(lái)實(shí)行平均功率限制和功率上限,包括,例如,選擇性地
調(diào)節(jié)設(shè)備、對(duì)未使用的電路斷電、降低處理器時(shí)鐘頻率、降低處理器操作電 壓、將等待或保持狀態(tài)引入到處理器活動(dòng)性中、進(jìn)行處理器時(shí)鐘選通(gating )、 或在設(shè)備之間移送工作量。在某些特定可允許的時(shí)間段期間,可以標(biāo)識(shí)其平 均功耗小于平均功率限制的設(shè)備,且可以允許那些設(shè)備的瞬間功率限制暫時(shí) 超過(guò)平均功率限制,除非且直到平均功耗達(dá)到平均功率限制,或直到超過(guò)平 均功率限制的可允許時(shí)間段結(jié)束。另外,可以被動(dòng)或主動(dòng)增加其平均功耗當(dāng)
前小于平均功率限制的功率。例如,可以通過(guò)將設(shè)備向上調(diào)節(jié)到瞬間功耗超 過(guò)平均功率限制的水平,同時(shí)意圖增加平均功耗直到其基本等于平均功率限 制,來(lái)主動(dòng)地增加設(shè)備的功率。
盡管本實(shí)施例的方法通常意圖用于防止平均功耗超過(guò)平均功率限制,但 是設(shè)備的平均功耗在某些情況下可以超過(guò)其平均功率限制,最顯著地包括當(dāng) 降低用于設(shè)備的平均功率限制時(shí)。例如在能量?jī)r(jià)位(energy price)相對(duì)高的 峰值時(shí)段期間,用于設(shè)備的平均功率限制可能降低。在這種情況下,這些設(shè) 備的瞬間功耗可以被向下調(diào)節(jié)到低于平均功率限制,直到平均功耗再次等于 降低的平均功率限制。通過(guò)選擇性地增加其平均功耗小于特定的平均功率限 制的設(shè)備的功耗,通常最大化了服務(wù)器和計(jì)算機(jī)系統(tǒng)的吞吐量,同時(shí)仍然符 合用于管理計(jì)算機(jī)系統(tǒng)的功耗在特定閾值內(nèi)的各種策略考慮。
圖1是示范根據(jù)本發(fā)明可被功率管理的、可安裝機(jī)架的多服務(wù)器計(jì)算機(jī) 系統(tǒng)10的透視圖。計(jì)算機(jī)系統(tǒng)10包括容納多個(gè)刀鋒服務(wù)器12和其他硬件設(shè) 備的底架11。每個(gè)刀鋒服務(wù)器12可以包括一個(gè)或多個(gè)微處理器、硬盤(pán)驅(qū)動(dòng) 器和存儲(chǔ)器,以服務(wù)一個(gè)或多個(gè)共同或獨(dú)立的網(wǎng)絡(luò)。計(jì)算機(jī)系統(tǒng)10還包括各 種共享的支持模塊,包括底架管理模塊15、 一個(gè)或多個(gè)電源模塊16、 一個(gè)或 多個(gè)送風(fēng)機(jī)模塊17和多個(gè)開(kāi)關(guān)模塊18。管理模塊15管理底架、刀鋒服務(wù)器 和其他模塊。功率模塊16向該系統(tǒng)提供功率。送風(fēng)機(jī)模塊17生成通過(guò)底架 ll的氣流,以冷卻計(jì)算機(jī)系統(tǒng)。開(kāi)關(guān)模塊18提供在刀鋒服務(wù)器I/0和網(wǎng)絡(luò)之間的網(wǎng)絡(luò)連接性??梢园晫W(xué)模塊(未示出)來(lái)降低噪聲。在底架11的前
側(cè)20安裝刀鋒服務(wù)器12,且在底架11的后側(cè)22安裝支持模塊15-18。刀鋒 服務(wù)器12和支持模塊15-18相會(huì)于已知為中間面(midplane)的內(nèi)部底架接 口 ,該內(nèi)部底架接口提供貫穿底架的刀鋒服務(wù)器12 、模塊、媒介盤(pán)(media tray ) 和DC功率分布之間的所有互連。在中間面處的連接器耦合刀鋒服務(wù)器12與 支持模塊15-18,以降低配線需要并幫助安裝和移除刀鋒^^務(wù)器12。
圖2是在多服務(wù)器計(jì)算機(jī)系統(tǒng)30的環(huán)境下、根據(jù)本發(fā)明的一個(gè)實(shí)施例的 功率管理的計(jì)算機(jī)系統(tǒng)的示意圖。計(jì)算機(jī)系統(tǒng)30可以示意地呈現(xiàn),例如圖1 的多服務(wù)器計(jì)算機(jī)系統(tǒng)10或其子系統(tǒng)。計(jì)算機(jī)系統(tǒng)30包括"N"個(gè)服務(wù)器 12。每個(gè)服務(wù)器12包括可以被選擇性地調(diào)節(jié)的一個(gè)或多個(gè)處理器或CPU 31 和存儲(chǔ)器33 (在此通常將調(diào)節(jié)服務(wù)器的處理器、存儲(chǔ)器或其他子系統(tǒng)描述為 調(diào)節(jié)該服務(wù)器)。電源36向計(jì)算機(jī)系統(tǒng)30供應(yīng)功率。在此將電源36描述為 在服務(wù)器12之間共享的單一電源模塊,比如圖1的功率模塊16??商鎿Q地, 電源36可以包括多個(gè)功率模塊,比如每個(gè)服務(wù)器12—個(gè)板上電源模塊。還 包括冷卻單元32用于冷卻服務(wù)器12。在此,將冷卻單元32描述為每個(gè)服務(wù) 器12包括一個(gè)冷卻風(fēng)扇??商鎿Q地,冷卻單元32可以是例如共享的送風(fēng)機(jī) 模塊,比如生成通過(guò)機(jī)架的氣流以冷卻多個(gè)服務(wù)器12的圖1的送風(fēng)機(jī)模塊 17。提供功率管理模塊38用于通過(guò)設(shè)置并動(dòng)態(tài)地調(diào)整每個(gè)服務(wù)器12的一個(gè) 或多個(gè)設(shè)備功率限制來(lái)管理對(duì)多個(gè)服務(wù)器12的功率。每個(gè)服務(wù)器12還包括 本地控制器,其與功率管理模塊38協(xié)作地工作,用于控制和管理功耗,包括 實(shí)行由功率管理模塊38動(dòng)態(tài)地選擇用于服務(wù)器12的設(shè)備功率限制。
可由功率管理模塊38和/或服務(wù)器12使用的功率管理軟件50提供用于 實(shí)現(xiàn)功率管理方法的邏輯。軟件50可以存在于計(jì)算機(jī)可讀物理介質(zhì)上。為了 該描述的目的,計(jì)算機(jī)可讀物理介質(zhì)可以是能夠包含或存儲(chǔ)由功率管理的計(jì) 算機(jī)使用或與其結(jié)合的軟件的任何裝置。計(jì)算機(jī)可讀介質(zhì)的例子包括半導(dǎo)體 或固態(tài)存儲(chǔ)器、磁帶、可移動(dòng)計(jì)算機(jī)磁盤(pán)、隨機(jī)存取存儲(chǔ)器(RAM)、只讀 存儲(chǔ)器(ROM)、硬磁盤(pán)和光盤(pán)。光盤(pán)的當(dāng)前例子包括緊致盤(pán)-只讀存儲(chǔ)器 (CD-ROM )、緊致盤(pán)-讀/寫(xiě)(CD-R/W)、和DVD。介質(zhì)可以是電子、磁的、 光的、電磁的、紅外的、或半導(dǎo)體系統(tǒng)(或裝置或設(shè)備)。可以由計(jì)算機(jī)系統(tǒng) 30將物理介質(zhì)讀取到管理模塊38、服務(wù)器12或兩者的系統(tǒng)存儲(chǔ)器,用于由 功率管理模塊38和服務(wù)器12存取和執(zhí)行。處理器31可以直接或通過(guò)系統(tǒng)總
8線間接耦合于存儲(chǔ)器33或其他存儲(chǔ)器元件。存儲(chǔ)器33可以包括在程序代碼 的實(shí)際執(zhí)行期間使用的本地存儲(chǔ)器、大容量存儲(chǔ)器和提供至少一些程序代碼 的暫時(shí)存儲(chǔ)以便減少在執(zhí)行期間必須從大容量存儲(chǔ)器檢索代碼的次數(shù)的高速 緩存。
諸如鍵盤(pán)、顯示器或定點(diǎn)設(shè)備的輸入/輸出(1/0)設(shè)備可以直接或通過(guò)居 間的I/O控制器耦合于該系統(tǒng)。網(wǎng)絡(luò)適配器還可以用于允許數(shù)據(jù)處理系統(tǒng)耦 合于其他數(shù)據(jù)處理系統(tǒng)或遠(yuǎn)程打印機(jī)或存儲(chǔ)設(shè)備,比如通過(guò)居間的私人或公 共網(wǎng)絡(luò)。調(diào)制解調(diào)器、電纜調(diào)制解調(diào)器、以太網(wǎng)卡和無(wú)線網(wǎng)絡(luò)適配器是網(wǎng)絡(luò) 適配器的例子。用戶可以通過(guò)諸如鍵盤(pán)和鼠標(biāo)的輸入設(shè)備向計(jì)算機(jī)系統(tǒng)鍵入 命令和信息。其他輸入設(shè)備可以包括麥克風(fēng)、操縱桿、游戲墊、觸摸墊、衛(wèi) 星盤(pán)(satellite dish )、掃描儀等等。這些和其他輸入設(shè)備通常通過(guò)耦合于系統(tǒng) 總線的USB (通用串行總線)而連接于處理單元,但可以通過(guò)其他接口、諸 如串行端口接口、并行端口、游戲端口等來(lái)連接。包括顯示設(shè)備的圖形用戶 界面(GUI)還可以經(jīng)由諸如視頻適配器的接口而連接于系統(tǒng)總線。因此, 用戶諸如系統(tǒng)。
在該實(shí)施例中的本地控制器40包括底板管理控制器(BMC )42。 BMC 42 是在母板中嵌入的專用微控制器,并且是智能平臺(tái)管理接口 (Intelligent Platform Management Interface, IPMI)結(jié)構(gòu)中的組件。BMC 42的功能傳統(tǒng)地 包括從傳感器接收輸入,并如果任何參數(shù)不停留在預(yù)定限制內(nèi)則向管理員發(fā) 送警告。BMC管理在系統(tǒng)管理軟件和平臺(tái)硬件之間的接口。在計(jì)算機(jī)系統(tǒng)內(nèi) 建立的傳感器向BMC報(bào)告諸如功率、溫度、冷卻風(fēng)扇速度和操作系統(tǒng)(OS) 狀態(tài)的參數(shù)。BMC監(jiān)視該傳感器,并如果任何參數(shù)不停留在預(yù)設(shè)限制內(nèi)則可 以經(jīng)由網(wǎng)絡(luò)向系統(tǒng)管理員發(fā)送警告,指示系統(tǒng)的潛在故障。管理員還可以遠(yuǎn) 程地與BMC通信,以采取某種正確的行動(dòng),比如復(fù)位或功率循環(huán)該系統(tǒng)以 使得掛機(jī)的OS再次運(yùn)行。嵌入的傳感器包括功率傳感器44,其傳感服務(wù)器 12的功耗并輸出代表其的信號(hào)。功率管理模塊38與功率計(jì)量器44通信,并 處理功耗信號(hào)以用由以下詳細(xì)描述的本發(fā)明指示的方式來(lái)控制服務(wù)器的功 率。
在一個(gè)示范結(jié)構(gòu)中,到BMC的物理接口可以包括系統(tǒng)管理總線(SMB)、 諸如RS-485串行控制臺(tái)的串行通信接口、地址和數(shù)據(jù)線、以及智能平臺(tái)管理 總線(IPMB),它使BMC能夠接受來(lái)自系統(tǒng)中其他管理控制器的IPMI請(qǐng)求通信。BMU通常是命令線接口 (CLI)應(yīng)用。取決于用戶的安全考慮,通過(guò) LAN到BMC的連接可以或可以不使用加密。除了 BMC 42的傳統(tǒng)功能性以 外,BMC42被配置以根據(jù)功率管理方法的實(shí)施例來(lái)對(duì)各自服務(wù)器12實(shí)行動(dòng) 態(tài)設(shè)備功率限制。雖然在此通過(guò)示例描述了具體結(jié)構(gòu),但本發(fā)明預(yù)期,該BMC 結(jié)構(gòu)經(jīng)歷隨時(shí)間改變,且本發(fā)明可以適用于用這種修改的結(jié)構(gòu)來(lái)工作。本發(fā) 明還預(yù)期,可以在不使用BMC的情況下實(shí)現(xiàn)功率管理方法的功率管理計(jì)算 機(jī)系統(tǒng)的替換實(shí)施例。
功率管理模塊38可以選擇,并動(dòng)態(tài)地、獨(dú)立地調(diào)制對(duì)每個(gè)服務(wù)器12的 設(shè)備功率限制,以由每個(gè)服務(wù)器12的本地控制器40來(lái)實(shí)行。每個(gè)服務(wù)器12 的設(shè)備功率限制的值可以在服務(wù)器的性能規(guī)定的范圍內(nèi)隨地改變,而不須改 變到該范圍的最大程度。例如,具體服務(wù)器的設(shè)計(jì)規(guī)定可以在5W的最小功 率和IOOW的最大功率之間變化,且功率管理模塊38可以在該范圍內(nèi)隨地改 變?cè)摲?wù)器的設(shè)備功率限制。
可以由本地控制器40使用各種技術(shù)來(lái)對(duì)服務(wù)器12實(shí)行設(shè)備功率限制。 這種技術(shù)可以包括選擇性地"調(diào)節(jié),,處理器31或存儲(chǔ)器33、將子系統(tǒng)置于 操作的功率節(jié)省模式、在設(shè)備之間移送工作量、或斷電未使用的電路。調(diào)節(jié) 技術(shù)的例子包括降低處理器34的時(shí)鐘頻率或操作電壓、將等待或保持狀態(tài)引 入處理器31的活動(dòng)中、進(jìn)行處理器時(shí)鐘選通和降低處理器供應(yīng)電壓。雖然在 服務(wù)器中處理器負(fù)荷和功耗之間可能存在一些相關(guān)性,但是由于底層微結(jié)構(gòu) (microarchitecture)的特性、基于每個(gè)芯片的晶體管變化和影響功耗的許多 其他復(fù)雜因素,處理器負(fù)荷不總是功耗的可靠指示符。因此,本地控制器40 典型地包括例如使用BMC可以實(shí)現(xiàn)的精確測(cè)量和反饋控制系統(tǒng)。本地控制 器40依賴BMC 42和功率計(jì)量器44,能夠在毫秒時(shí)間度量上調(diào)整功率,作 為堅(jiān)固的、實(shí)時(shí)的比例控制系統(tǒng)。可以由軟件50來(lái)使用該功能性以實(shí)現(xiàn)根據(jù) 本發(fā)明的功率管理。
圖3是通常概括根據(jù)本發(fā)明的一個(gè)實(shí)施例的、在計(jì)算機(jī)系統(tǒng)中管理功率 的方法的流程圖。本方法覆蓋了管理具有多個(gè)功耗設(shè)備的計(jì)算機(jī)系統(tǒng)的功率, 該多個(gè)功耗設(shè)備能夠確定并報(bào)告它們隨時(shí)間的功耗。例如,該設(shè)備可以是圖 2的服務(wù)器12,具有用于監(jiān)視和控制功率的功率計(jì)量器44和相關(guān)硬件。然而, 本方法還可以用于管理除了服務(wù)器以外的計(jì)算機(jī)系統(tǒng)設(shè)備的功率。可以單獨(dú)地報(bào)告設(shè)備的功耗,比如每個(gè)服務(wù)器的單獨(dú)的功耗,或按照設(shè)備的子組報(bào)告 設(shè)備的功耗,比如所選的服務(wù)器組的組功耗。
可以為每個(gè)設(shè)備選擇各種功率限制。本方法包括在步驟100中為每個(gè)設(shè)
備至少選擇功率上限("UPL")和在步驟102中的平均功率限制("APL")。 在某些情況下,也可以規(guī)定和施加除了平均功率限制和功率上限以外的另外 的功率限制。在步驟104中獲得每個(gè)設(shè)備的瞬間功庫(kù)毛("IPC"),并在步驟106 中確定平均功耗(APC)。功率上限是對(duì)服務(wù)器的瞬間功耗的限制。盡管該設(shè) 備可能物理上超過(guò)功率上限,但根據(jù)在此公開(kāi)的任何技術(shù)(調(diào)節(jié)、工作量移 送等)典型地功率管理該設(shè)備,以便優(yōu)選地對(duì)于任何可估計(jì)的時(shí)間長(zhǎng)度瞬間 功耗不超過(guò)功率上限。步驟108導(dǎo)向于控制設(shè)備的功率,以便瞬間功耗不超 過(guò)功率上限。平均功率限制是對(duì)設(shè)備的時(shí)間平均功^^的限制,且小于功率上 限。例如,可以控制功率,以便設(shè)備的瞬間功耗不超過(guò)100W的功率上限, 并且設(shè)備的平均功耗不超過(guò)70W的平均功率限制。盡管瞬間功耗不應(yīng)該超過(guò) 功率上限且平均功耗不應(yīng)該超過(guò)平均功率限制,但是功率管理方法預(yù)期在平 均功耗目前小于平均功率限制的情況下,被動(dòng)地允許瞬間功耗超過(guò)平均功率 限制或主動(dòng)地使得瞬間功耗超過(guò)平均功率限制。
用于選擇每個(gè)設(shè)備的功率上限(步驟100)的因素可以包括例如,物理 功率分布限制、安全考慮(例如,防止爆炸的電路或過(guò)度的溫度)或花費(fèi)考 慮。在由設(shè)備需要的功率將另外導(dǎo)致瞬間功耗超過(guò)功率上限的情況下,在步 驟108中可以使用調(diào)節(jié)機(jī)制或其他功率限制機(jī)制以限制設(shè)備的功耗,以便防 止瞬間功耗超過(guò)功率上限??梢允褂没诜答伒墓β使芾硐到y(tǒng)來(lái)調(diào)節(jié)該設(shè)備。 由于計(jì)算設(shè)施的某些限制,用于實(shí)行功率上限的這種功率調(diào)整可能落后于由 基于反饋的功率管理系統(tǒng)進(jìn)行的任何增加的功率的^r測(cè),以至于可能在很短 的時(shí)刻內(nèi)超過(guò)功率上限,直到調(diào)節(jié)或其他功率降低技術(shù)對(duì)設(shè)備產(chǎn)生效果。由 于這種振蕩(surge)的結(jié)果通常會(huì)是良性的,且主要效果仍然是防止瞬間功 耗在任何可估計(jì)的時(shí)間長(zhǎng)度內(nèi)超過(guò)功率上限,因此不考慮這種瞬時(shí)功率超額 而干擾步驟108。還可以在步驟100和102的每個(gè)重復(fù)期間周期性地調(diào)整功 率上限和平均功率限制,以便應(yīng)對(duì)時(shí)變的能量花費(fèi)。例如,在能量?jī)r(jià)位增加 的時(shí)段期間可以選擇性地降低平均功率限制,并在能量?jī)r(jià)位降低的時(shí)段期間 選擇性地增加平均功率限制。
在步驟110中,標(biāo)識(shí)第一子組的設(shè)備,其中對(duì)于該第一子組,每個(gè)設(shè)備
ii的平均功耗小于其平均功率限制。在步驟112中,標(biāo)識(shí)第二子組的設(shè)備,其 中對(duì)于該第二子組,每個(gè)設(shè)備的平均功耗不小于平均功率限制。通常,在任 何給定的時(shí)刻,每個(gè)設(shè)備將適合第一子組或第二子組,因此,可以容易地確 定第二子組作為不屬于第一子組的那些設(shè)備。因?yàn)榈谝蛔咏M的設(shè)備每個(gè)操作
在它們的平均功率限制以下,因此在步驟114中允許這些設(shè)備的瞬間功耗超
過(guò)它們的平均功率限制。如果功率需求偶然超過(guò)平均功率限制,則可以比如 通過(guò)簡(jiǎn)單地允許用于第 一子組的設(shè)備的瞬間功耗超過(guò)平均功率限制而被動(dòng)地
進(jìn)行步驟114??商鎿Q地,可以主動(dòng)地向上調(diào)節(jié)第一子組的設(shè)備,因此,它 們的瞬間功耗超過(guò)其平均功率限制。根據(jù)步驟108,雖然,這些服務(wù)器可以 被調(diào)節(jié)到它們各自的平均功率限制值以上,但仍然要當(dāng)心不要超過(guò)瞬間功耗。
制以上,并且根據(jù)步驟116,防止第二子組的設(shè)備的瞬間功耗超過(guò)它們各自 的平均功率限制。例如,可以向下調(diào)節(jié)第二子組的設(shè)備,以便每個(gè)設(shè)備的瞬 間功耗不超過(guò)其各自的平均功率限制。
可以按用于功率管理其多個(gè)設(shè)備包括服務(wù)器的計(jì)算機(jī)系統(tǒng)的方法的形式 來(lái)實(shí)現(xiàn)圖3的方法。圖4是概述這種方法的更詳細(xì)例子的流程圖??梢栽谟?jì) 算機(jī)系統(tǒng)上實(shí)現(xiàn)該方法作為圖2的計(jì)算機(jī)系統(tǒng)30的軟件50,用于管理多個(gè) 服務(wù)器12的功率。圖4的流程圖包括與如^^皮具體應(yīng)用于功率管理多個(gè)服務(wù)器 的圖3類似的那些步驟。給與這些類似的步驟相同的參考標(biāo)記。圖4的其他 步驟類似于圖3中的某些步驟的子步驟,且被給與了不同的參考標(biāo)記。
現(xiàn)在參考圖4,在步驟100中為每個(gè)設(shè)備選擇功率上限,并在步驟102 為每個(gè)設(shè)備選擇平均功率限制。功率上限和平均功率限制可以是由系統(tǒng)管理 員選擇并輸入到功率管理的計(jì)算機(jī)系統(tǒng)的用戶可選擇的參數(shù)。分別在步驟104 和106中確定瞬間功耗和平均功耗。例如,功率計(jì)量器可以向功率管理模塊 輸出指示瞬間功耗的實(shí)時(shí)功率信號(hào)。功率模塊可以將實(shí)時(shí)功率信號(hào)轉(zhuǎn)換為瞬 間功耗值。另外,功率模塊可以隨時(shí)間采樣實(shí)時(shí)功率信號(hào),以計(jì)算平均功耗 值。然后,功率管理模塊可以使用該動(dòng)態(tài)瞬間功耗和平均功耗數(shù)據(jù),作為用 于為每個(gè)服務(wù)器管理功率和實(shí)行功率上限和平均功率限制的反饋,如下。
根據(jù)圖3的方法步驟108,步驟120和122導(dǎo)向于防止瞬間功耗超過(guò)每 個(gè)設(shè)備的功率上限。條件步驟120詢問(wèn)對(duì)于具體服務(wù)器,服務(wù)器所需要的功 率是否將超過(guò)功率上限。如果在具體時(shí)刻的功率需求超過(guò)功率上限,則在步
12驟122中服務(wù)器被向下調(diào)節(jié)以保證瞬間功耗不超過(guò)功率上限。
條件步驟110用來(lái)標(biāo)識(shí)平均功耗小于平均功率限制的iE務(wù)器。如在條件 步驟124中所確定的,如果處于用于向上調(diào)節(jié)的可允許的時(shí)間段,則服務(wù)器 的該"第一子組"可以被向上調(diào)節(jié)。該用于向上調(diào)節(jié)的可允許時(shí)間段是可以 由管理員輸入的另一參數(shù)。該可允許時(shí)間段可以反映用于操作數(shù)據(jù)中心的某 些策略考慮。例如,功率的價(jià)位典型地隨時(shí)間改變,并且管理員可以指定某 些非尖峰(off-peak)時(shí)段,用于允許向上調(diào)節(jié)服務(wù)器。根據(jù)步驟114,在可 允許時(shí)間段期間,將允許第一子組的服務(wù)器的每個(gè)的瞬間功耗超過(guò)它們的平 均功率限制,而不是根據(jù)步驟122的超過(guò)功率上限??梢员粍?dòng)地允許這些服 務(wù)器超過(guò)它們的平均功率限制,或可以主動(dòng)地向上調(diào)節(jié)它們以故意使得它們 超過(guò)其平均功率限制。'
如圖3中所示,步驟112導(dǎo)向于選擇其平均功耗"不小于"平均功率限 制的設(shè)備的"第二子組"。圖4的方法對(duì)平均功耗基本等于平均功率限制的那 些服務(wù)器和平均功耗超過(guò)平均功率限制的服務(wù)器給出分別的處理。根據(jù)條件 步驟112A,如果平均功耗基本等于平均功率限制,則在步驟116A中向下調(diào) 節(jié)該服務(wù)器,以便瞬間功耗不超過(guò)平均功率限制。通過(guò)防止瞬間功耗超過(guò)平 均功率限制,防止平均功耗增加到平均功率限制以上,以將平均功耗維持在 平均功率限制或低于平均功率限制。
該方法被構(gòu)造為循環(huán),因此,重復(fù)條件步驟110和112以保證平均功率 限制通常不超過(guò)平均功耗。然而,在某些情況下,平均功耗仍然可能超過(guò)平 均功率限制。這可能發(fā)生在例如在步驟102的隨后重復(fù)中平均功率限制突然 降低的情況下。可以降低平均功率限制,以例如應(yīng)對(duì)能量的時(shí)變花費(fèi)。因此, 如果在條件步驟112B中服務(wù)器的平均功耗超過(guò)平均功率限制,則在步驟116B 中足夠地向下調(diào)節(jié)該服務(wù)器以降低隨時(shí)間的平均功耗的值,直到平均功耗不 再超過(guò)平均功率限制。越進(jìn)一步降低瞬間功耗,平均功耗值越快降低到平均 功率限制或低于平均功率限制。然而,在步驟112B中規(guī)定的條件不一定是緊 急情況或出錯(cuò)條件,并且對(duì)于平均功耗緩慢地降低直到再次等于平均功率限 制可能是可接受的。這可能成立的情形是為某個(gè)時(shí)間間隔、比如一天規(guī)定了 平均功率限制。例如,管理員可以指定意要在24小時(shí)周期中滿足的每個(gè)設(shè)備 的平均功率限制。因此,如果幾個(gè)小時(shí)仍然在24小時(shí)周期內(nèi),則在步驟112B 中其平均功耗暫時(shí)超過(guò)平均功率限制的設(shè)備的瞬間功耗可以被降低到如下水平計(jì)算該水平用于在24小時(shí)時(shí)段過(guò)期之前實(shí)現(xiàn)規(guī)定的平均功率限制。因此,
率限制,但該方法可以補(bǔ)償導(dǎo)致平均功耗暫時(shí)超過(guò)減少的平均功率限制的、 在步驟102中的平均功率限制的降低。
各種方法可用于管理員來(lái)選擇和實(shí)行平均功率限制。選擇和實(shí)行平均功 率限制的一個(gè)方面是時(shí)間框架(timeframe),通過(guò)該時(shí)間片匡架計(jì)算平均功庫(kù)毛。
能夠僅基于最近的歷史或另外基于長(zhǎng)期的歷史來(lái)計(jì)算平均功肆毛。例如,如果 選擇平均功率限制以在預(yù)算參數(shù)內(nèi)操作系統(tǒng),例如在日常功率預(yù)算內(nèi)操作每
個(gè)設(shè)備,則可以基于延長(zhǎng)的、24小時(shí)時(shí)間框架來(lái)計(jì)算平均功耗。在另一例子 中,可以選擇平均功率限制來(lái)控制溫度產(chǎn)生。例如,由服務(wù)器產(chǎn)生的熱量可 能主要依賴于其平均功耗,而不是其瞬間功耗的波動(dòng)。在這種情況下,可以 經(jīng)過(guò)相對(duì)短的時(shí)間間隔、比如少于一小時(shí)來(lái)計(jì)算平均功耗,并且在先前間隔
(例如,先前小時(shí))中的設(shè)備的性能可能對(duì)在當(dāng)前間隔中如何操作設(shè)備以控 制熱量產(chǎn)生具有可以忽略的影響。另外,管理員具有判斷力以使平均功耗基 于很少或很多的數(shù)據(jù)點(diǎn)。采集數(shù)據(jù)點(diǎn)的數(shù)量或頻率也可能取決于具體設(shè)備當(dāng) 前操作在平均功率限制以上還是以下而改變。例如,由于該系統(tǒng)通過(guò)降低設(shè) 備的瞬間功耗來(lái)補(bǔ)償并試圖使平均功耗與當(dāng)前平均功率限制相等,對(duì)操作于 平均功率限制以上的設(shè)備,可以用較大頻率釆集功耗數(shù)據(jù)點(diǎn)。
在權(quán)利要求和說(shuō)明書(shū)中使用的術(shù)語(yǔ)"包括"、"包含"和"具有"將被認(rèn) 為是指示可以包括未指定的其他元件的開(kāi)放組。術(shù)語(yǔ)"一個(gè)(a ),,、"一個(gè)(an") 和詞的單數(shù)形式將被采用以包括相同詞的復(fù)數(shù)形式,以便這些術(shù)語(yǔ)意味著提 供一個(gè)或多個(gè)某物。術(shù)語(yǔ)"一個(gè)(one)"或"單個(gè)(single)"可以被用于指 示意圖一個(gè)和僅一個(gè)某物。類似地,當(dāng)意圖具體數(shù)量的某物時(shí),可以使用其 他具體整數(shù)值,比如"兩個(gè)"。術(shù)語(yǔ)"優(yōu)選地"、"優(yōu)選的"、"優(yōu)選"、"可選地"、
"可以"和類似術(shù)語(yǔ)用于指示所涉及的項(xiàng)目、條件或步驟是本發(fā)明的可選(不 是必須的)特征。
盡管已經(jīng)參考有限數(shù)量的實(shí)施例來(lái)描述了本發(fā)明,但受益于本公開(kāi)的本 領(lǐng)域技術(shù)人員將理解,可以在不脫離在此公開(kāi)的本發(fā)明的范圍的情況下,設(shè) 計(jì)其他實(shí)施例。因此,本發(fā)明的范圍應(yīng)該僅由所附權(quán)利要求來(lái)限制。
權(quán)利要求
1. 一種在具有多個(gè)電子的功耗設(shè)備的電子系統(tǒng)中管理功率的方法,包括為每個(gè)設(shè)備選擇功率上限和小于所述功率上限的平均功率限制;確定每個(gè)設(shè)備的瞬間功耗和平均功耗;防止每個(gè)設(shè)備的所述瞬間功耗超過(guò)各自功率上限;標(biāo)識(shí)所述平均功耗小于所述平均功率限制的第一子組的設(shè)備,并允許在所述第一子組中的每個(gè)設(shè)備的瞬間功耗超過(guò)各自平均功率限制;以及標(biāo)識(shí)所述平均功耗不小于所述平均功率限制的第二子組的設(shè)備,并防止在所述第二子組中的每個(gè)設(shè)備的瞬間功耗超過(guò)各自平均功率限制。
2. 根據(jù)權(quán)利要求1的方法,還包括標(biāo)識(shí)所述平均功耗基本等于所述平均 功率限制的設(shè)備,并降低所標(biāo)識(shí)的服務(wù)器的瞬間功耗以維持基本等于所述平 均功率限制的所述平均功耗。
3. 根據(jù)權(quán)利要求l的方法,還包括標(biāo)識(shí)所述平均功耗大于所述平均功率 限制的設(shè)備,并降低所標(biāo)識(shí)的服務(wù)器的瞬間功耗低于所述平均功率限制。
4. 根據(jù)權(quán)利要求l的方法,還包括允許在所述第 一字組的設(shè)備中的每個(gè)設(shè)備的瞬間功耗暫時(shí)超過(guò)各自平均 功率限制,直到各自平均功耗基本等于各自平均功率限制。
5. 根據(jù)權(quán)利要求l的方法,還包括選擇所述第 一子組的設(shè)備的瞬間功耗被允許超過(guò)所述平均功率限制的時(shí) 間段;以及僅在所調(diào)度的時(shí)間段期間,允許在所述第一子組的設(shè)備中的每個(gè)設(shè)備的 瞬間功耗超過(guò)各自平均功率限制。
6. 根據(jù)權(quán)利要求l的方法,其中,所述防止所述設(shè)備的瞬間功耗超過(guò)各 自功率上限的步驟和所述防止所述第二子組的設(shè)備的瞬間功耗超過(guò)它們各自 的平均功率限制的步驟包括調(diào)節(jié)在所述設(shè)備上的處理器或存儲(chǔ)器,斷電不 使用的電路,降低處理器時(shí)鐘頻率,降低處理器操作電壓,將等待或保持狀 態(tài)引入處理器活動(dòng)中,進(jìn)行處理器時(shí)鐘選通,或在設(shè)備之間移送工作量。
7. 根據(jù)權(quán)利要求l的方法,其中,所述設(shè)備包括服務(wù)器。
8. —種功率管理的電子系統(tǒng),包括多個(gè)功耗設(shè)備,其每個(gè)與電源通信用于接收變化量的功率、與功率計(jì)量器通信用于檢測(cè)每個(gè)設(shè)備的功耗并輸出代表所檢測(cè)的功耗的功耗信號(hào)、和與 調(diào)節(jié)機(jī)構(gòu)通信,所述調(diào)節(jié)機(jī)構(gòu)被配置用于選擇性地限制每個(gè)設(shè)備的功耗以防功率管理模塊,其與所述多個(gè)設(shè)備通信,用于從每個(gè)設(shè)備的所述功率計(jì) 量器接收所述功耗信號(hào),確定每個(gè)設(shè)備的瞬間功耗和平均功耗,并確定所述平均功耗少于各自平均功率限制的第 一 子組的設(shè)備;以及其中,在所述第一子組中的每個(gè)設(shè)備的瞬間功耗被允許超過(guò)各自平均功 率限制,并且其中,防止不在所述第一子組中的每個(gè)設(shè)備的瞬間功耗超過(guò)各 自平均功率限制。
9. 根據(jù)權(quán)利要求8的功率管理的電子系統(tǒng),其中,所述管理模塊被配置 用于標(biāo)識(shí)所述平均功耗基本等于所述平均功率限制的每個(gè)設(shè)備,并指令每個(gè) 所標(biāo)識(shí)的設(shè)備降低各自瞬間功耗以維持基本等于所述平均功率限制的所述平 均功耗。
10. 根據(jù)權(quán)利要求8的功率管理的電子系統(tǒng),其中,所述管理模塊被配 置用于標(biāo)識(shí)所述平均功耗大于所述平均功率限制的每個(gè)設(shè)備,并指令每個(gè)所 標(biāo)識(shí)的設(shè)備將各自瞬間功耗降低到所述平均功率限制以下。
11. 根據(jù)權(quán)利要求8的功率管理的電子系統(tǒng),其中,所述功率管理模塊 被配置用于指令所述設(shè)備調(diào)節(jié)在所述設(shè)備上的處理器或存儲(chǔ)器,斷電不使用 的電路,降低處理器時(shí)鐘頻率,降低處理器操作電壓,將等待或保持狀態(tài)引 入處理器活動(dòng)中,進(jìn)行處理器時(shí)鐘選通,或在設(shè)備之間移送工作量,或這些 的組合,以防止每個(gè)設(shè)備的瞬間功耗超過(guò)各自功率上限,并防止不在所述第 一子組的設(shè)備中的每個(gè)設(shè)備的瞬間功耗超過(guò)各自平均功率限制。
12. 根據(jù)權(quán)利要求8的功率管理的電子系統(tǒng),其中,所述電子系統(tǒng)是計(jì) 算機(jī)系統(tǒng)。
13. 根據(jù)權(quán)利要求12的功率管理的電子系統(tǒng),其中,所述功耗設(shè)備包括 服務(wù)器。
全文摘要
在一個(gè)實(shí)施例中,為計(jì)算機(jī)系統(tǒng)的每個(gè)服務(wù)器規(guī)定功率上限和平均功率限制??刂泼總€(gè)服務(wù)器的功率,以便瞬間功耗不超過(guò)功率上限,且平均功耗不超過(guò)平均功率上限。標(biāo)識(shí)其平均功耗目前小于平均功率限制的服務(wù)器。每個(gè)所標(biāo)識(shí)的服務(wù)器的瞬間功耗暫時(shí)被允許超過(guò)其平均功率限制,以最大化服務(wù)器吞吐量。比如在峰值能量定價(jià)(pricing)時(shí)間期間可能發(fā)生的、設(shè)備的平均功率限制降低的情況下,設(shè)備的瞬間功耗可以被向下調(diào)節(jié)到平均功率限制以下,直到平均功耗不再超過(guò)平均功率限制。
文檔編號(hào)G06F1/32GK101430596SQ20081021296
公開(kāi)日2009年5月13日 申請(qǐng)日期2008年9月17日 優(yōu)先權(quán)日2007年11月7日
發(fā)明者布賴恩·C·托滕 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司