亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于數(shù)據(jù)處理系統(tǒng)的功率感知作業(yè)調(diào)度器和管理器的制作方法

文檔序號(hào):12142002閱讀:786來源:國(guó)知局
用于數(shù)據(jù)處理系統(tǒng)的功率感知作業(yè)調(diào)度器和管理器的制作方法與工藝

本申請(qǐng)要求2014年8月22日提交的題為“SIMPLE POWER-AWARE SCHEDULER TO LIMIT POWER CONSUMPTION BY HPC SYSTEM WITHIN A BUDGET”的先前美國(guó)臨時(shí)專利申請(qǐng)N0.62/040,576的權(quán)益,該申請(qǐng)由此通過引用整體結(jié)合于本文中。本申請(qǐng)涉及以下專利申請(qǐng):2014年12月24日提交的題為“METHODS AND APPARATUS TO ESTIMATE POWER PERFORMANCE OF A JOB THAT RUNS ON MULTIPLE NODES OF A DISTRIBUTED COMPUTER SYSTEM”的美國(guó)專利申請(qǐng)N0.14/582,795(代理人案號(hào)42P73498)、2014年12月24日提交的題為“METHOD AND APPARATUS TO GENERATE AND USE POWER,THERMAL AND PERFORMANCE CHARACTERISTICS OF NODES TO IMPROVE ENERGY EFFICIENCY AND REDUCING WAIT TIMEFOR JOBS IN THE QUEUE”的美國(guó)專利申請(qǐng)N0.14/582,783(代理人案號(hào)42P74562)、2014年12月24日提交的題為“ADJUSTMENT OF EXECUTION OF TASKS”的美國(guó)專利申請(qǐng)N0.14/582,979(代理人案號(hào)42P74563)、2014年12月24日提交的題為“CONTROL OF POWER CONSUMPTION”的美國(guó)專利申請(qǐng)N0.14/582,985(代理人案號(hào)42P74564)、2014年12月24日提交的題為“FORECAST FOR DEMAND OF ENERGY”的美國(guó)專利申請(qǐng)14/582,988(代理人案號(hào)42P74565)、2014年12月24日提交的題為“METHODS AND APPARATUS TO MANAGE JOBS THAT CAN AND CANNOT BE SUSPENDED WHEN THERE IS A CHANGE IN POWER ALLOCATION TO A DISTRIBUTED COMPUTER SYSTEM”的美國(guó)專利申請(qǐng)N0.14/582,772(代理人案號(hào)42P74566)、2014年12月24日提交的題為“MANAGING POWER PERFORMANCE OF DISTRIBUTED COMPUTING SYSTEMS”的美國(guó)專利申請(qǐng)14/582.743(代理人案號(hào)42P74567)及2014年12月24日提交的題為“PROFILING A JOB POWER AND ENERGY CONSUMPTION FOR A DATA PROCESSING SYSTEM”的美國(guó)專利申請(qǐng)N0.14/582,756(代理人案號(hào)42P74568)。

技術(shù)領(lǐng)域

如本文中描述的實(shí)施例涉及電子裝置制造領(lǐng)域,并且具體地說,涉及數(shù)據(jù)處理系統(tǒng)。



背景技術(shù):

一般地,高性能計(jì)算(HPC)系統(tǒng)通過同時(shí)使用多個(gè)節(jié)點(diǎn)執(zhí)行稱為作業(yè)的計(jì)算指派來執(zhí)行平行計(jì)算。每個(gè)節(jié)點(diǎn)通常包括處理器、存儲(chǔ)器、操作系統(tǒng)和I/O組件。節(jié)點(diǎn)通過高速網(wǎng)絡(luò)組構(gòu)相互進(jìn)行通信,并且可使用共享文件系統(tǒng)或存儲(chǔ)裝置。作業(yè)被分割成分布在成千上萬個(gè)節(jié)點(diǎn)的成千上萬個(gè)平行任務(wù)。這些任務(wù)每秒彼此同步成百上千次。通常,HPC系統(tǒng)消耗數(shù)兆瓦的功率。

常規(guī)高性能計(jì)算(HPC)系統(tǒng)HPC和其它大數(shù)據(jù)系統(tǒng)是功率的不可知論者。頂級(jí)HPC系統(tǒng)消耗大約20兆瓦(MW)功率,輸送33千兆次(PF)的性能。預(yù)期此性能大約以指數(shù)速率增長(zhǎng),而預(yù)期可用功率保持在或低于大約20MW。通常,功率分配不可能為20MW,并且可經(jīng)常到每15分鐘便更改。

現(xiàn)有HPC作業(yè)調(diào)度器不能通過確定性性能限制HPC作業(yè)功率。典型的作業(yè)調(diào)度器只設(shè)置用于作業(yè)的功率限額(power cap)。運(yùn)行相同作業(yè)的HPC系統(tǒng)的節(jié)點(diǎn)可在不同頻率運(yùn)行,導(dǎo)致不平衡和不確定的行為。

目前,作業(yè)的功率限額是固定的,盡管設(shè)施功率分配可更改,一些作業(yè)可完結(jié),并且一些作業(yè)可暫停。當(dāng)前HPC系統(tǒng)不會(huì)基于設(shè)施功率限制和暫停的作業(yè)優(yōu)先級(jí)而動(dòng)態(tài)更改作業(yè)的功率限額。

在常規(guī)HPC系統(tǒng)中,通過限制到作業(yè)的功率來實(shí)現(xiàn)系統(tǒng)級(jí)功率限制。通常,計(jì)算工作被分割成成千上萬個(gè)塊,并且分布到成千上萬個(gè)節(jié)點(diǎn)。在向前進(jìn)展前,這些節(jié)點(diǎn)每秒彼此同步成百上千次。系統(tǒng)中最慢的節(jié)點(diǎn)使所有其它節(jié)點(diǎn)要等待。解決此難題的傳統(tǒng)方案是在相同頻率運(yùn)行所有節(jié)點(diǎn)?;谟?jì)算,節(jié)點(diǎn)消耗的功率能夠上下起伏。在常規(guī)HPC系統(tǒng)中,為確保作業(yè)不消耗比為該作業(yè)分配的功率更多的功率,假設(shè)了所有節(jié)點(diǎn)將消耗最大功率,并且為所有節(jié)點(diǎn)選擇最低頻率。然而,這意味著即使系統(tǒng)具有功率余量,系統(tǒng)中的一些節(jié)點(diǎn)需要在降低的頻率操作。在常規(guī)系統(tǒng)中,作業(yè)不使用為該作業(yè)分配或預(yù)留的所有功率。此分配的且未使用的功率稱為擱淺功率(stranded power)。非零擱淺功率是對(duì)關(guān)鍵和稀有能源的浪費(fèi)。

附圖說明

通過參照用于示出本發(fā)明實(shí)施例的下面的描述和附圖,可最好地理解本發(fā)明的實(shí)施例。在圖中:

圖1是根據(jù)一個(gè)實(shí)施例示出到數(shù)據(jù)處理系統(tǒng)的功率輸入的框圖。

圖2是示出根據(jù)一個(gè)實(shí)施例的提供用戶輸入以調(diào)度作業(yè)的用戶界面的視圖。

圖3是根據(jù)一個(gè)實(shí)施例的提供功率管理的邏輯的示范框圖。

圖4是示出根據(jù)一個(gè)實(shí)施例的使用功率監(jiān)視信息管理作業(yè)的數(shù)據(jù)處理系統(tǒng)的框圖。

圖5A是示出根據(jù)一個(gè)實(shí)施例的包括功率感知啟動(dòng)時(shí)間作業(yè)調(diào)度器和運(yùn)行時(shí)作業(yè)管理器的數(shù)據(jù)處理系統(tǒng)的框圖。

圖5B是根據(jù)一個(gè)實(shí)施例的操作數(shù)據(jù)處理系統(tǒng)的方法的流程圖。

圖5C是根據(jù)一個(gè)實(shí)施例的提供功率感知作業(yè)調(diào)度器和管理器的方法的流程圖。

圖6顯示示出根據(jù)一個(gè)實(shí)施例的在功率監(jiān)視可用時(shí)為四種作業(yè)模式設(shè)置均勻頻率的算法的表格。

圖7顯示示出根據(jù)一個(gè)實(shí)施例的在功率監(jiān)視不可用時(shí)為四種作業(yè)模式設(shè)置均勻頻率的算法的表格。

圖8示出根據(jù)一個(gè)實(shí)施例的用于功率感知調(diào)度器和管理器的功率裕度(margin)。

圖9A是顯示根據(jù)一個(gè)實(shí)施例的用于為作業(yè)動(dòng)態(tài)分配功率的功率感知作業(yè)調(diào)度器和管理器的示范校準(zhǔn)表格的視圖。

圖9B是根據(jù)一個(gè)實(shí)施例的分配功率到作業(yè)的方法的流程圖。

圖9C是根據(jù)另一實(shí)施例的分配功率到作業(yè)的方法的流程圖。

圖9D是根據(jù)一個(gè)實(shí)施例的降低到作業(yè)的功率的方法的流程圖。

圖9E是根據(jù)一個(gè)實(shí)施例的終止作業(yè)的方法的流程圖。

圖9F是根據(jù)一個(gè)實(shí)施例的重新平衡功率以適應(yīng)更多作業(yè)的方法的流程圖。

圖9G是根據(jù)另一實(shí)施例的降低到作業(yè)的功率的方法的流程圖。

圖9H是根據(jù)一個(gè)實(shí)施例的提供功率感知作業(yè)調(diào)度器和作業(yè)管理器的方法的流程圖。

圖10顯示根據(jù)一個(gè)實(shí)施例的帶有和不帶有功率監(jiān)視的系統(tǒng)的性能的示例。

圖11顯示示出根據(jù)一個(gè)實(shí)施例的具有同時(shí)在不同模式中運(yùn)行的作業(yè)的混合模式配置的表格。

圖12顯示根據(jù)一個(gè)實(shí)施例的在圖11中顯示的混合模式配置的結(jié)果。

圖13顯示示出根據(jù)一個(gè)實(shí)施例的具有同時(shí)運(yùn)行的在不同模式中的兩個(gè)作業(yè)的配置的表格。

圖14示出根據(jù)一個(gè)實(shí)施例的在圖13中顯示的配置上時(shí)變系統(tǒng)功率限制(Psys)的效應(yīng)。

圖15顯示根據(jù)一個(gè)實(shí)施例的用于圖13中描繪的兩種情況的時(shí)變PSYS的效應(yīng)。

圖16示出根據(jù)一個(gè)實(shí)施例的在自動(dòng)模式中運(yùn)行的到變化的Psys的作業(yè)的可適應(yīng)性。

圖17是顯示根據(jù)一個(gè)實(shí)施例的對(duì)于相同工作負(fù)荷,用于在自動(dòng)模式中作業(yè)的頻率和用于在固定頻率模式中作業(yè)的頻率的比率對(duì)可用系統(tǒng)功率(Psys)的視圖。

圖18是顯示根據(jù)一個(gè)實(shí)施例的對(duì)于在自動(dòng)模式中的作業(yè)相對(duì)于在固定頻率模式中的作業(yè),完結(jié)時(shí)間的百分比增大的曲線圖。

圖19示出根據(jù)一個(gè)實(shí)施例的數(shù)據(jù)處理系統(tǒng)。

具體實(shí)施方式

本文中描述了提供功率感知作業(yè)調(diào)度器和管理器,以在功率限制內(nèi)以高能量效率操作HPC系統(tǒng)的方法和設(shè)備。為支持在功率限制(cap)下的操作,如本文中所描述的HPC作業(yè)啟動(dòng)時(shí)間調(diào)度器和運(yùn)行時(shí)管理器是功率感知的,以在固定功率預(yù)算內(nèi)輸送最佳性能。隨著設(shè)施功率分配更改,一些作業(yè)完結(jié)或被暫停,如本文中所描述的功率感知作業(yè)啟動(dòng)時(shí)間調(diào)度器和運(yùn)行時(shí)管理器有利地調(diào)整作業(yè)功率分配,以便為作業(yè)提供功率限額增大的臨時(shí)跨越(span)。

在下面的描述中,說明性實(shí)施的各種方面將使用本領(lǐng)域技術(shù)人員向本領(lǐng)域的其它技術(shù)人員傳達(dá)其工作內(nèi)容時(shí)通常采用的術(shù)語描述。然而,對(duì)本領(lǐng)域的技術(shù)人員將顯而易見的是,可僅通過一些所描述方面來實(shí)踐本發(fā)明。為了解釋的目的,陳述了特定的數(shù)字、材料和配置以便提供說明性實(shí)施的詳盡理解。然而,對(duì)本領(lǐng)域技術(shù)人員將顯而易見的是,可在不具有特定細(xì)節(jié)的情況下實(shí)踐本發(fā)明。在其它實(shí)例中,忽略或簡(jiǎn)化了熟知的特征以免模糊說明性實(shí)施。

各種操作將又以對(duì)理解本發(fā)明最有幫助的方式描述為多個(gè)離散操作;然而,描述的順序不應(yīng)視為暗示這些操作必需是順序相關(guān)的。具體地說,無需按呈現(xiàn)的順序執(zhí)行這些操作。

雖然描述并在附圖中顯示了某些示范實(shí)施例,但要理解,此類實(shí)施例只是說明性而不是限制性的,并且由于本領(lǐng)域技術(shù)人員可想到修改,因此,實(shí)施例并不限于所示和所描述的特定構(gòu)造和布置。

說明書通篇對(duì)“一個(gè)實(shí)施例”、“另一實(shí)施例”或“實(shí)施例”的引用意味著結(jié)合該實(shí)施例描述的具體特征、結(jié)構(gòu)或特性包括在至少一個(gè)實(shí)施例中。因此,在說明書通篇各個(gè)位置出現(xiàn)的諸如“一個(gè)實(shí)施例”或“實(shí)施例”短語不一定全部指相同實(shí)施例。此外,具體的特征、結(jié)構(gòu)或特性可在一個(gè)或多個(gè)實(shí)施例中以任何適宜的方式組合。

另外,發(fā)明的方面在于比單個(gè)公開實(shí)施例的所有特征更少的特征。因此,在具體實(shí)施方式后的權(quán)利要求由此明確結(jié)合在此具體實(shí)施方式中,其中每個(gè)權(quán)利要求項(xiàng)本身為單獨(dú)實(shí)施例。雖然示范實(shí)施例已在本文中描述,但本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到,通過如本文中所描述的修改和變化,能夠?qū)嵺`這些示范實(shí)施例。描述因此要視為是說明性的而不是限制。

本文中描述的提供功率感知作業(yè)調(diào)度器和管理器的方法和設(shè)備動(dòng)態(tài)分配功率預(yù)算到作業(yè),并且在作業(yè)壽命期期間提供功率預(yù)算的動(dòng)態(tài)控制,其與常規(guī)系統(tǒng)相比,有利地增大了更早啟動(dòng)作業(yè)的可能性,使作業(yè)更快地運(yùn)行,并且降低擱淺功率。在至少一些實(shí)施例中,用于作業(yè)的功率分配取決于用戶的選擇,例如,作業(yè)是否要遭受任何功率限制,在系統(tǒng)功率分配下降到低于預(yù)確定的閾值時(shí)作業(yè)是否能暫?;蚱淙魏谓M合。在至少一些實(shí)施例中,為開始作業(yè),使用如在2014年12月24日提交的題為“METHODS AND APPARATUS TO ESTIMATE POWER PERFORMANCE OF A JOB THAT RUNS ON MULTIPLE NODES OF A DISTRIBUTED COMPUTER SYSTEM”的美國(guó)專利申請(qǐng)No.14/582,795(代理人案號(hào)42P73498)中所描述的功率估計(jì)技術(shù)之一和使用如在2014年12月24日提交的題為“METHOD AND APPARATUS TO GENERATE AND USE POWER,THERMAL AND PERFORMANCE CHARACTERISTICS OF NODES TO IMPROVE ENERGY EFFICIENCY AND REDUCING WAIT TIMEFOR JOBS IN THE QUEUE”的美國(guó)專利申請(qǐng)No.14/582,783(代理人案號(hào)42P74562)中所述的功率校準(zhǔn)技術(shù)之一,估計(jì)作業(yè)需要的功率。

在至少一些實(shí)施例中,基于系統(tǒng)的功率余量(可用功率),動(dòng)態(tài)更改執(zhí)行作業(yè)的所有節(jié)點(diǎn)的均勻頻率。在運(yùn)行相同作業(yè)的每個(gè)節(jié)點(diǎn)上使用均勻頻率。HPC域?qū)<揖{(diào)諧在均勻頻率的其應(yīng)用。如下面進(jìn)一步詳細(xì)描述的一樣,功率感知調(diào)度器和管理器有利地不引起任何另外的不平衡。

在至少一些實(shí)施例中,如在2014年12月24日提交的題為“PROFILING A JOB POWER AND ENERGY CONSUMPTION FOR A DATA PROCESSING SYSTEM”的有關(guān)美國(guó)專利申請(qǐng)No.14/582,756(代理人案號(hào)42P74568)中所描述的,使用一個(gè)或更多個(gè)監(jiān)視技術(shù),監(jiān)視作業(yè)功率、系統(tǒng)功率、作業(yè)的完結(jié)和作業(yè)的暫停狀態(tài)?;诒O(jiān)視,動(dòng)態(tài)調(diào)整實(shí)時(shí)作業(yè)的功率限額。這有利于最大化了實(shí)時(shí)作業(yè)的性能。隨著HPC設(shè)施功率限制更改,作業(yè)的功率限額動(dòng)態(tài)調(diào)整有利地保證用于系統(tǒng)的最佳吞吐量。

在至少一些實(shí)施例中,如下面進(jìn)一步詳細(xì)所描述的,功率感知作業(yè)調(diào)度器和管理器與功率校準(zhǔn)器(2014年12月24日提交的題為“METHOD AND APPARATUS TO GENERATE AND USE POWER,THERMAL AND PERFORMANCE CHARACTERISTICS OF NODES TO IMPROVE ENERGY EFFICIENCY AND REDUCING WAIT TIMEFOR JOBS IN THE QUEUE”的有關(guān)美國(guó)專利申請(qǐng)No.14/582,783(代理人案號(hào)42P74562)中所描述)和功率估計(jì)器(2014年12月24日提交的題為“METHOD AND APPARATUS TO GENERATE AND USE POWER,THERMAL AND PERFORMANCE CHARACTERISTICS OF NODES TO IMPROVE ENERGY EFFICIENCY AND REDUCING WAIT TIME FOR JOBS IN THE QUEUE”的有關(guān)美國(guó)專利申請(qǐng)No.14/582,783(代理人案號(hào)42P74562)中所描述的)對(duì)接,以獲得工作負(fù)荷最大功率(Pmax)、工作負(fù)荷最低功率(Pmin)、工作負(fù)荷平均功率(Pavg)和平臺(tái)最大功率(PMP)。在功率感知作業(yè)調(diào)度器和管理器使用來自校準(zhǔn)器和估計(jì)器的現(xiàn)實(shí)輸入時(shí),功率調(diào)控保護(hù)帶(guard band)有利地最小化,并且系統(tǒng)的性能最大化。

在一個(gè)實(shí)施例中,提供每作業(yè)功率調(diào)控的均勻頻率。運(yùn)行作業(yè)的所有節(jié)點(diǎn)處在相同頻率,因此,不會(huì)引起不平衡。基于設(shè)施功率能力和暫停的作業(yè)優(yōu)先級(jí)至少之一,動(dòng)態(tài)設(shè)置每作業(yè)功率限額。功率感知作業(yè)調(diào)度器和管理器與啟動(dòng)時(shí)間和運(yùn)行時(shí)功率校準(zhǔn)器和估計(jì)器對(duì)接,以使功率感知調(diào)度相對(duì)于常規(guī)系統(tǒng)更準(zhǔn)確。

在至少一些實(shí)施例中,描述了限制用于數(shù)據(jù)處理系統(tǒng)和作業(yè)的功耗的方法。如下面進(jìn)一步詳細(xì)描述的一樣,在具有在同頻運(yùn)行的所有節(jié)點(diǎn)的系統(tǒng)中,限制用于作業(yè)的功率。

圖1是根據(jù)一個(gè)實(shí)施例的示出到數(shù)據(jù)處理系統(tǒng)101的功率輸入的框圖100。數(shù)據(jù)處理系統(tǒng)101包括耦合到高速組構(gòu)106的多個(gè)節(jié)點(diǎn)-例如,一個(gè)或更多個(gè)頭節(jié)點(diǎn)102、諸如中央處理單元(CPU)節(jié)點(diǎn)103和CPU節(jié)點(diǎn)104等一個(gè)或更多個(gè)計(jì)算節(jié)點(diǎn)、一個(gè)或更多個(gè)輸入輸出(IO)節(jié)點(diǎn)105、一個(gè)或更多個(gè)操作系統(tǒng)(OS)節(jié)點(diǎn)及其它節(jié)點(diǎn)。在一個(gè)實(shí)施例中,頭節(jié)點(diǎn)102包括一個(gè)或更多個(gè)操作系統(tǒng)(OS)節(jié)點(diǎn)。高速組構(gòu)可以是經(jīng)一個(gè)或更多個(gè)交換機(jī)互連的節(jié)點(diǎn)的網(wǎng)絡(luò)拓?fù)?。在一個(gè)實(shí)施例中,諸如節(jié)點(diǎn)103、104和105等每個(gè)節(jié)點(diǎn)包括耦合到存儲(chǔ)器的一個(gè)或更多個(gè)處理器、一個(gè)或更多個(gè)控制器,或兩者。頭節(jié)點(diǎn)102包括具有存儲(chǔ)在存儲(chǔ)器中的功率感知作業(yè)調(diào)度器和管理器113的至少一部分的資源管理器。在至少一些實(shí)施例中,資源管理器是在多個(gè)節(jié)點(diǎn)上運(yùn)行的分布式資源管理器。在備選實(shí)施例中,資源管理器在一個(gè)或更多個(gè)頭節(jié)點(diǎn)、一個(gè)或更多個(gè)CPU節(jié)點(diǎn)、一個(gè)或更多個(gè)IO節(jié)點(diǎn)或其任何組合上運(yùn)行。在一個(gè)實(shí)施例中,功率感知作業(yè)調(diào)度器和管理器113配置成接收用于作業(yè)的模式的指示,基于模式,確定用于作業(yè)的可用功率,以及基于可用功率,分配用于作業(yè)的功率。在一個(gè)實(shí)施例中,功率感知作業(yè)調(diào)度器和管理器113配置成基于可用功率,確定用于作業(yè)的均勻頻率。在一個(gè)實(shí)施例中,功率感知作業(yè)調(diào)度器和管理器113配置成基于監(jiān)視的功率、估計(jì)的功率和校準(zhǔn)的功率至少之一,確定用于作業(yè)的可用功率。如下面進(jìn)一步詳細(xì)描述的一樣,功率感知作業(yè)調(diào)度器和管理器113配置成接收有關(guān)功耗的信息,將功率預(yù)算分布到每個(gè)作業(yè),以及實(shí)現(xiàn)均勻頻率機(jī)制以限制功率。

在一個(gè)實(shí)施例中,頭節(jié)點(diǎn)102包括如2014年12月24日提交的題為“PROFILING A JOB POWER AND ENERGY CONSUMPTION FOR A DATA PROCESSING SYSTEM”的美國(guó)專利申請(qǐng)No.14/582,756(代理人案號(hào)42P74568)中所描述的功率監(jiān)視器(未顯示)、2014年12月24日提交的題為“METHODS AND APPARATUS TO ESTIMATE POWER PERFORMANCE OF A JOB THAT RUNS ON MULTIPLE NODES OF A DISTRIBUTED COMPUTER SYSTEM”的美國(guó)專利申請(qǐng)No.14/582,795(代理人案號(hào)42P73498)中所描述的功率估計(jì)器(未顯示)和2014年12月24日提交的題為“METHOD AND APPARATUS TO GENERATE AND USE POWER,THERMAL AND PERFORMANCE CHARACTERISTICS OF NODES TO IMPROVE ENERGY EFFICIENCY AND REDUCING WAIT TIME FOR JOBS IN THE QUEUE”的美國(guó)專利申請(qǐng)No.14/582,783(代理人案號(hào)42P74562)中所描述的功率校準(zhǔn)器(未顯示)。在一個(gè)實(shí)施例中,諸如CPU節(jié)點(diǎn)103等一個(gè)或更多個(gè)CPU節(jié)點(diǎn)包括在存儲(chǔ)器中存儲(chǔ)的功率感知作業(yè)調(diào)度器和管理器113的一部分(未顯示)。在一個(gè)實(shí)施例中,一個(gè)或更多個(gè)IO節(jié)點(diǎn)105包括在存儲(chǔ)器中存儲(chǔ)的功率感知作業(yè)調(diào)度器和管理器113的一部分(未顯示)。諸如輸入108、109、110、111等多個(gè)功率輸入和一個(gè)或更多個(gè)輸入112提供到系統(tǒng)101。輸入108包括有關(guān)系統(tǒng)功率分配(Psys)的數(shù)據(jù)。輸入109包括用于作業(yè)X的功率策略;輸入110包括用于作業(yè)Y的功率策略;輸入111包括用于來自例如用戶116等一個(gè)或更多個(gè)用戶的作業(yè)N的功率策略。輸入112包括用于作業(yè)的一個(gè)或更多個(gè)管理策略、作業(yè)調(diào)度器、作業(yè)啟動(dòng)器和剩余的資源管理器、數(shù)據(jù)處理系統(tǒng)或其任何組合。

在一個(gè)實(shí)施例中,高速組構(gòu)106是網(wǎng)絡(luò),例如,以太網(wǎng)、Omni-Path、InfiniBand或其它網(wǎng)絡(luò)。一個(gè)或更多個(gè)IO節(jié)點(diǎn)105耦合到一個(gè)或更多個(gè)存儲(chǔ)節(jié)點(diǎn)107。存儲(chǔ)節(jié)點(diǎn)104可包括非持久性存儲(chǔ)裝置,如易失性存儲(chǔ)器(例如,任何類型的隨機(jī)存取存儲(chǔ)器“RAM”)、持久性存儲(chǔ)裝置,如非易失性存儲(chǔ)器(例如,只讀存儲(chǔ)器“ROM”、功率備份(power-backed)RAM、閃存存儲(chǔ)器、相變存儲(chǔ)器等)、固態(tài)驅(qū)動(dòng)器、硬盤驅(qū)動(dòng)器、光盤驅(qū)動(dòng)器、便攜式存儲(chǔ)器裝置或其任何組合。

在一個(gè)實(shí)施例中,一個(gè)或更多個(gè)存儲(chǔ)節(jié)點(diǎn)107是系統(tǒng)100的一部分。在另一實(shí)施例中,一個(gè)或更多個(gè)存儲(chǔ)節(jié)點(diǎn)107經(jīng)網(wǎng)絡(luò)耦合到一個(gè)或更多個(gè)節(jié)點(diǎn)105。在一個(gè)實(shí)施例中,系統(tǒng)100是HPC系統(tǒng)。在另一實(shí)施例中,系統(tǒng)100是云計(jì)算系統(tǒng)。在一個(gè)實(shí)施例中,系統(tǒng)100是具有運(yùn)行作業(yè)的成千上萬個(gè)節(jié)點(diǎn)的HPC集群系統(tǒng)。在又一實(shí)施例中,系統(tǒng)100是企業(yè)網(wǎng)絡(luò)系統(tǒng)或任何其它數(shù)據(jù)處理系統(tǒng)。

頭節(jié)點(diǎn)102可提供訪問例如計(jì)算節(jié)點(diǎn)103和104等計(jì)算節(jié)點(diǎn)的網(wǎng)關(guān)。例如,在提交作業(yè)以便在計(jì)算節(jié)點(diǎn)上處理前,可要求用戶登錄到系統(tǒng)100,這可能通過頭節(jié)點(diǎn)102。在一個(gè)實(shí)施例中,頭節(jié)點(diǎn)102可接受用戶提交的作業(yè),并且?guī)椭鷨?dòng)和管理由計(jì)算節(jié)點(diǎn)在處理的作業(yè)。

在一個(gè)實(shí)施例中,計(jì)算節(jié)點(diǎn)提供大量的處理和計(jì)算能力。I/O節(jié)點(diǎn)可提供在計(jì)算節(jié)點(diǎn)與外部裝置(例如,單獨(dú)計(jì)算機(jī))之間的可提供輸入到系統(tǒng)100或接收來自HPC的輸出的接口。

系統(tǒng)功率分配(Psys)可例如由實(shí)用程序管理設(shè)施提供到系統(tǒng)100(例如,如由系統(tǒng)管理員或諸如數(shù)據(jù)中心管理器等管理軟件確定的一樣)。通常,Psys用于運(yùn)行一個(gè)或更多個(gè)用戶請(qǐng)求的一個(gè)或更多個(gè)作業(yè)。每個(gè)作業(yè)包括功率策略,以幫助系統(tǒng)分配用于作業(yè)的功率,并且?guī)椭芾碛上到y(tǒng)100運(yùn)行的一個(gè)或更多個(gè)作業(yè)。

另外,管理策略通過提供定義系統(tǒng)100的操作的總體(over-arching)策略,引導(dǎo)對(duì)運(yùn)行作業(yè)的管理??砂ㄔ诠芾聿呗?12中的策略的示例包括但不限于或限制于(1)最大化所有硬件和軟件資源的利用(例如,而不是以高功率運(yùn)行更少的作業(yè)并且留下資源未使用,運(yùn)行盡可能多的作業(yè)以使用盡可能多的資源);(2)賦予無功率限制的作業(yè)在所有在運(yùn)行的作業(yè)中的最高優(yōu)先級(jí);和/或(3)暫停的作業(yè)處于恢復(fù)的更高優(yōu)先級(jí)。此類管理策略管控系統(tǒng)100可調(diào)度,啟動(dòng),暫停和重新啟動(dòng)一個(gè)或更多個(gè)作業(yè)的方式。

在一個(gè)實(shí)施例中,確定用于系統(tǒng)100的功率可用性以預(yù)留用于已開始并且不能夠暫停的作業(yè)的功率。功率感知調(diào)度用于管理有和沒有功率限制的作業(yè)。功率感知調(diào)度器用于估計(jì)運(yùn)行作業(yè)所要求的功率。節(jié)點(diǎn)的功率性能校準(zhǔn)用于開發(fā)此類估計(jì)。在一個(gè)實(shí)施例中,基于在樣本工作負(fù)荷或作業(yè)的過去運(yùn)行上收集的功率性能數(shù)據(jù),確定功率估計(jì)。雖然估計(jì)可具有內(nèi)置保護(hù)帶,但作業(yè)的實(shí)際功耗能夠不同。作業(yè)級(jí)功率監(jiān)視評(píng)估在估計(jì)與實(shí)際功耗之間的差別。此類評(píng)估創(chuàng)建了精調(diào)諧到每個(gè)作業(yè)的功率分配的機(jī)會(huì)。

一般地,功率策略是用于確保作業(yè)消耗的功率保持在作業(yè)分配內(nèi)的控制機(jī)制。功率監(jiān)視影響功率策略。缺乏功率監(jiān)視可需要重功率分配保護(hù)帶,以便作業(yè)未消耗多于分配的功率。此重分配將需要等于或大于用于最差情況工作負(fù)荷的最大功率。

圖2是示出根據(jù)一個(gè)實(shí)施例的提供用戶輸入以調(diào)度作業(yè)的用戶界面200的視圖。用戶輸入包括用于作業(yè)的模式選擇。用于作業(yè)的模式選擇包括有關(guān)作業(yè)是否遭受功率限制的指示、有關(guān)用于作業(yè)的功率策略的指示、有關(guān)用于作業(yè)的暫停策略的指示或其任何組合。用戶界面200包括顯示區(qū)域210、220和230。顯示區(qū)域210允許用戶指定作業(yè)是否遭受功率限制。如圖2中所示的,選擇“是”201指示作業(yè)具有功率限制,并且選擇“否”202指示作業(yè)沒有功率限制。

顯示區(qū)域220與在用戶允許作業(yè)遭受功率限制時(shí)預(yù)確定的功率限制策略之一的選擇有關(guān)。選擇203指示限制功率的策略是固定頻率策略(“固定頻率”),其中,用戶指定具體頻率208,在該頻率208將運(yùn)行作業(yè)的一個(gè)或更多個(gè)節(jié)點(diǎn)應(yīng)進(jìn)行操作。選擇204指示策略是最低作業(yè)功率策略(“最低功率模式”),根據(jù)該策略,用戶指定要供應(yīng)到一個(gè)或更多個(gè)節(jié)點(diǎn)(在其上將運(yùn)行作業(yè))的最低功率211。選擇205指示策略是最大作業(yè)功率策略(“最大功率模式”),根據(jù)該策略,用戶指定要供應(yīng)到一個(gè)或更多個(gè)節(jié)點(diǎn)(在其上將運(yùn)行作業(yè))的最大功率212。選擇209指示策略是自動(dòng)模式(“自動(dòng)模式”),根據(jù)該策略,可基于用于作業(yè)的功率分配,對(duì)頻率(在該頻率一個(gè)或更多個(gè)節(jié)點(diǎn)操作以運(yùn)行作業(yè))、供應(yīng)到一個(gè)或更多個(gè)節(jié)點(diǎn)(作業(yè)在其上運(yùn)行)的功率或兩者進(jìn)行動(dòng)態(tài)調(diào)整。

顯示區(qū)域230與在處理期間是否可暫停作業(yè)的選擇有關(guān)。選擇“是”206指示作業(yè)能夠被暫停。選擇“否”207指示作業(yè)不能被暫停。在一個(gè)實(shí)施例中,使用在2014年12月24日提交的題為“METHODS AND APPARATUS TO MANAGE JOBS THAT CAN AND CANNOT BE SUSPENDED WHEN THERE IS A CHANGE IN POWER ALLOCATION TO A DISTRIBUTED COMPUTER SYSTEM”的有關(guān)美國(guó)專利申請(qǐng)No.14/582,772(代理人案號(hào)42P74566)中描述的作業(yè)暫停技術(shù)之一,暫停作業(yè)。

用戶界面屏幕不是用戶為數(shù)據(jù)處理系統(tǒng)100提供諸如功率策略、最低要求頻率、最低要求的功率、最大功率和/或是否可暫停作業(yè)等輸入?yún)?shù)的唯一方法。備選地,此類參數(shù)可作為作業(yè)提交的一部分,和/或作為配置文件(例如,文本文件)提供到系統(tǒng)100。在又一實(shí)施例中,此類參數(shù)由系統(tǒng)管理員、設(shè)施經(jīng)理/管理員設(shè)置,和/或通過系統(tǒng)100預(yù)確定為用戶賬戶的一部分。在又一實(shí)施例中,可使用作業(yè)設(shè)置此類參數(shù)。例如,如果作業(yè)不支持檢查定點(diǎn)(check pointing),則不能暫停作業(yè)。

在一個(gè)實(shí)施例中,可基于可用功率,確定用于作業(yè)的均勻頻率。在一個(gè)實(shí)施例中,可使用用戶選擇的模式之一,確定用于作業(yè)的均勻頻率。運(yùn)行相同作業(yè)的節(jié)點(diǎn)的所有處理器在相同的均勻頻率進(jìn)行操作。取決于如何選擇頻率和在整個(gè)作業(yè)期間是否保持相同頻率,能夠以不同方式運(yùn)用均勻頻率功率限制。用于在均勻頻率執(zhí)行作業(yè)的四個(gè)策略用于確定作業(yè)頻率:a)用戶選擇對(duì)于作業(yè)的持續(xù)時(shí)間操作的頻率(固定頻率模式),b)用戶指定要分配到作業(yè)的最低功率級(jí)別(最低功率模式),c)用戶指定要分配到作業(yè)的最大功率級(jí)別,d)用戶指定用于作業(yè)的自動(dòng)模式。通過自動(dòng)模式、最低功率和最大功率模式之一,功率感知作業(yè)調(diào)度器和工作負(fù)荷管理器基于功率余量,調(diào)整用于作業(yè)的均勻頻率。

圖3是根據(jù)一個(gè)實(shí)施例的提供功率管理的邏輯300的示范框圖。在一個(gè)實(shí)施例中,邏輯300是系統(tǒng)100的一部分。邏輯300包括調(diào)度和啟動(dòng)作業(yè)的資源管理器301、校準(zhǔn)器306、估計(jì)器305及一個(gè)或更多個(gè)作業(yè)管理器312。資源管理器301包括耦合到功率感知作業(yè)啟動(dòng)器303的功率感知作業(yè)調(diào)度器302。在一個(gè)實(shí)施例中,每個(gè)作業(yè)具有作業(yè)管理器。在一個(gè)實(shí)施例中,資源管理器301是諸如圖1中描繪的頭節(jié)點(diǎn)102等頭節(jié)點(diǎn)的一部分。在一個(gè)實(shí)施例中,圖1中描繪的功率感知作業(yè)調(diào)度器113表示資源管理器301的至少一部分。

資源管理器301接收多個(gè)輸入,例如,一個(gè)或更多個(gè)實(shí)用程序規(guī)則308、一個(gè)或更多個(gè)設(shè)施規(guī)則309、用戶策略輸入310和管理策略輸入311、來自節(jié)點(diǎn)307的估計(jì)器305、校準(zhǔn)器306及功率感知選擇器的輸入。

估計(jì)器305配置成估計(jì)例如作業(yè)304等作業(yè)的功率和性能。估計(jì)器305為資源管理器301提供用于每個(gè)作業(yè)的功耗的估計(jì),使資源管理器301能夠有效地調(diào)度和監(jiān)視一個(gè)或更多個(gè)作業(yè)擁有者(例如,用戶)請(qǐng)求的每個(gè)作業(yè)。估計(jì)器305可基于例如在校準(zhǔn)數(shù)據(jù)庫(kù)存儲(chǔ)的最大和平均功率值,提供功耗估計(jì),其中,通過校準(zhǔn)器306的處理器來填充校準(zhǔn)數(shù)據(jù)庫(kù)。另外,可考慮用于每個(gè)作業(yè)的要求的最低功率??捎晒烙?jì)器305用于創(chuàng)建功耗估計(jì)的其它因素包括但不限于或限制于作業(yè)的擁有者是否允許作業(yè)遭受功率限制、限制供應(yīng)到作業(yè)的功率的作業(yè)功率策略(例如,預(yù)確定的固定頻率(作業(yè)將自該頻率運(yùn)行)、用于作業(yè)的所要求的最低功率或資源管理器301確定的變化頻率和/或供應(yīng)的功率)、用于作業(yè)的起動(dòng)(startup)功率、頻率(作業(yè)將在該頻率運(yùn)行)、到系統(tǒng)100的可用功率、到系統(tǒng)100的分配的功率或兩者。在一個(gè)實(shí)施例中,估計(jì)器305表示在2014年12月24日提交的題為“METHODS AND APPARATUS TO ESTIMATE POWER PERFORMANCE OF A JOB THAT RUNS ON MULTIPLE NODES OF A DISTRIBUTED COMPUTER SYSTEM”的有關(guān)美國(guó)專利申請(qǐng)No.14/582,795(代理人案號(hào)42P73498)中描述的估計(jì)器之一。

校準(zhǔn)器306配置成校準(zhǔn)數(shù)據(jù)處理系統(tǒng)的節(jié)點(diǎn)的功率和性能。校準(zhǔn)器306校準(zhǔn)在數(shù)據(jù)處理系統(tǒng)100內(nèi)每個(gè)節(jié)點(diǎn)的功率、熱耗散和性能。校準(zhǔn)器306可提供用于校準(zhǔn)HPC系統(tǒng)306內(nèi)節(jié)點(diǎn)的多種方法。在一個(gè)實(shí)施例中,校準(zhǔn)器306可提供一種校準(zhǔn)方法,其中,系統(tǒng)100內(nèi)的每個(gè)節(jié)點(diǎn)運(yùn)行樣本工作負(fù)荷(例如,微型應(yīng)用和/或測(cè)試腳本),因此,校準(zhǔn)器306可以以預(yù)確定的時(shí)間間隔對(duì)各種參數(shù)(例如,消耗的功率)進(jìn)行采樣,以例如確定用于每個(gè)節(jié)點(diǎn)的(1)平均功率、(2)最大功率和(3)最低功率。另外,可在節(jié)點(diǎn)的每個(gè)操作頻率在每個(gè)節(jié)點(diǎn)上運(yùn)行樣本工作負(fù)荷。

在另一實(shí)施例中,校準(zhǔn)器306可提供一種校準(zhǔn)方法,其中,在作業(yè)的運(yùn)行時(shí)期間發(fā)生一個(gè)或更多個(gè)節(jié)點(diǎn)的校準(zhǔn)。在此類情況下,校準(zhǔn)器306可對(duì)一個(gè)或更多個(gè)節(jié)點(diǎn)(作業(yè)在其上運(yùn)行(例如,處理))進(jìn)行采樣。校準(zhǔn)器306獲得在實(shí)際運(yùn)行時(shí)期間每個(gè)節(jié)點(diǎn)的功率測(cè)量。在一個(gè)實(shí)施例中,校準(zhǔn)器306表示在2014年12月24日提交的題為“METHOD AND APPARATUS TO GENERATE AND USE POWER,THERMAL AND PERFORMANCE CHARACTERISTICS OF NODES TO IMPROVE ENERGY EFFICIENCY AND REDUCING WAIT TIME FOR JOBS IN THE QUEUE”的有關(guān)美國(guó)專利申請(qǐng)No.14/582,783(代理人案號(hào)42P74562)中描述的功率校準(zhǔn)器之一。

在一個(gè)實(shí)施例中,在功率校準(zhǔn)器與估計(jì)器之間的接口如下所述:PMP(PlatformMaxPower):對(duì)于每個(gè)可用頻率(例如,通過標(biāo)稱頻率(P1頻率)的1.2GHZ和Turbo頻率),確定用于節(jié)點(diǎn)(節(jié)點(diǎn)PMP)的最大功率。Pmax:是在作業(yè)壽命期上的最大節(jié)點(diǎn)功率。Pmin:是在作業(yè)壽命期上的最低節(jié)點(diǎn)功率。Pavg:是在作業(yè)壽命期上的平均節(jié)點(diǎn)功率。PMP與工作負(fù)荷無關(guān)。Pmax、Pmin和Pavg是工作負(fù)荷相關(guān)的。

用戶(例如,作業(yè)的所有者)請(qǐng)求的每個(gè)作業(yè)伴隨有用戶策略輸入310。用戶策略包括如相對(duì)于圖2所描述的,有關(guān)作業(yè)304是否可遭受功率限制;如果允許功率限制,限制功率的策略(例如,固定頻率、要求的最低頻率或資源管理器301確定的變化頻率和/或功率)及是否可暫停作業(yè)301的至少一個(gè)判定。

節(jié)點(diǎn)303的功率感知選擇器配置成選擇運(yùn)行例如作業(yè)304等作業(yè)的節(jié)點(diǎn)。在備選實(shí)施例中,節(jié)點(diǎn)303的功率感知選擇器基于作業(yè)來選擇節(jié)點(diǎn),例如,作業(yè)功率分配、作業(yè)配置參數(shù)、作業(yè)通信延時(shí)、距離、跳的數(shù)量、其它準(zhǔn)則或其任何組合。例如,用戶能夠指定運(yùn)行作業(yè)需要的核、線程或兩者的數(shù)量。例如,用戶能夠指明通信延時(shí)需要在某個(gè)界限內(nèi),使得選擇的節(jié)點(diǎn)需要在限制的距離(或網(wǎng)絡(luò)組構(gòu)的跳)內(nèi)。資源管理器301使用功率感知作業(yè)調(diào)度器302和功率感知作業(yè)啟動(dòng)器303,基于例如一個(gè)或更多個(gè)輸入305、306、307、308、309、310、311等接收到的輸入,調(diào)度和啟動(dòng)作業(yè)304。在一個(gè)實(shí)施例中,資源管理器301是軟件對(duì)象,其負(fù)責(zé)用于用戶想運(yùn)行的交互式和批量作業(yè)的計(jì)算和I/O資源的分配。通常,資源管理器301也負(fù)責(zé)從作業(yè)隊(duì)列調(diào)度作業(yè),并且根據(jù)調(diào)度啟動(dòng)要運(yùn)行的作業(yè)。

一般地,用戶提交要執(zhí)行的程序(“作業(yè)”)到隊(duì)列。作業(yè)隊(duì)列指包含要運(yùn)行的作業(yè)的數(shù)據(jù)結(jié)構(gòu)。在一個(gè)實(shí)施例中,功率感知作業(yè)調(diào)度器302以適當(dāng)?shù)拇螖?shù)(周期性地或者在例如以前運(yùn)行的作業(yè)終止等某些事件時(shí))檢查作業(yè)隊(duì)列,并且確定是否能夠分配包括運(yùn)行作業(yè)所需的功率的資源。在一些情況下,只能在將來的時(shí)間分配此類資源,并且在此類情況下,調(diào)度作業(yè)在將來的指定時(shí)間運(yùn)行。

在調(diào)度作業(yè)運(yùn)行時(shí),作業(yè)啟動(dòng)器303從隊(duì)列中挑選作業(yè),并且在確定分配適當(dāng)?shù)馁Y源(例如,計(jì)算節(jié)點(diǎn)、網(wǎng)絡(luò)、時(shí)間)后,作業(yè)啟動(dòng)器303使用分配的資源來派生(spawn)進(jìn)程,以根據(jù)用戶指定的輸入(例如,作業(yè)策略、功率模式和其它輸入?yún)?shù)),開始作業(yè)。作業(yè)啟動(dòng)器303也能夠具有分別在啟動(dòng)作業(yè)前和在作業(yè)終止時(shí)執(zhí)行的開端(prologue)和結(jié)尾(epilogue)任務(wù)。開端和結(jié)尾用于設(shè)定計(jì)算機(jī)的狀態(tài),并且在運(yùn)行后去除狀態(tài)。

如下面進(jìn)一步詳細(xì)所描述的,作業(yè)管理器312配置成控制作業(yè)304保持在用于作業(yè)的分配的功率預(yù)算內(nèi)。在一個(gè)實(shí)施例中,作業(yè)管理器312負(fù)責(zé)在作業(yè)已啟動(dòng)后在一個(gè)或更多個(gè)功率策略的約束內(nèi)操作作業(yè)。在一個(gè)實(shí)施例中,作業(yè)管理器312用于根據(jù)用戶和管理員至少之一指定的策略,控制涉及作業(yè)的執(zhí)行的所有組件(例如,節(jié)點(diǎn)或其它組件)的功率性能。

圖4是示出根據(jù)一個(gè)實(shí)施例的使用功率監(jiān)視信息管理作業(yè)的數(shù)據(jù)處理系統(tǒng)400的框圖。數(shù)據(jù)處理系統(tǒng)包括耦合到諸如節(jié)點(diǎn)402和節(jié)點(diǎn)403等一個(gè)或更多個(gè)節(jié)點(diǎn)的頭節(jié)點(diǎn)401。在一個(gè)實(shí)施例中,頭節(jié)點(diǎn)401表示頭節(jié)點(diǎn)102。在一個(gè)實(shí)施例中,節(jié)點(diǎn)402是計(jì)算節(jié)點(diǎn)。在一個(gè)實(shí)施例中,節(jié)點(diǎn)402表示計(jì)算節(jié)點(diǎn)103。在另一實(shí)施例中,節(jié)點(diǎn)102是IO節(jié)點(diǎn)。在另一實(shí)施例中,IO節(jié)點(diǎn)403表示IO節(jié)點(diǎn)105。頭節(jié)點(diǎn)401包括耦合到作業(yè)管理器404的資源管理器406。在一個(gè)實(shí)施例中,頭節(jié)點(diǎn)401充當(dāng)集群控制器以提供功率感知作業(yè)調(diào)度器和管理器。

一般地,資源管理器406和作業(yè)管理器404每個(gè)可只在頭節(jié)點(diǎn)上,或者跨多個(gè)節(jié)點(diǎn)分布。在一個(gè)實(shí)施例中,資源管理器406表示資源管理器301。在一個(gè)實(shí)施例中,作業(yè)管理器404表示作業(yè)管理器312的一部分。在一個(gè)實(shí)施例中,資源管理器406和作業(yè)管理器404每個(gè)在一個(gè)或更多個(gè)頭節(jié)點(diǎn)上。在另一實(shí)施例中,資源管理器406和作業(yè)管理器404每個(gè)分布在頭節(jié)點(diǎn)和計(jì)算節(jié)點(diǎn)上。在一個(gè)實(shí)施例中,如2014年12月24日提交的題為“PROFILING A JOB POWER AND ENERGY CONSUMPTION FOR A DATA PROCESSING SYSTEM”的美國(guó)專利申請(qǐng)No.14/582,756(代理人案號(hào)42P74568)中所描述的,資源管理器406和作業(yè)管理器404配置成收集作業(yè)功率數(shù)據(jù)。在一個(gè)實(shí)施例中,資源管理器406和作業(yè)管理器404配置成通過讀取傳感器來收集作業(yè)功率數(shù)據(jù)。在另一實(shí)施例中,資源管理器406和作業(yè)管理器404配置成通過從數(shù)據(jù)庫(kù)(例如,數(shù)據(jù)庫(kù)405)讀取來收集作業(yè)功率數(shù)據(jù)。在又一實(shí)施例中,資源管理器406和作業(yè)管理器404使用其它參數(shù),例如,開發(fā)用于功耗的估計(jì)的利用、帶寬、功率規(guī)范。在更特定的實(shí)施例中,資源管理器406使用智能平臺(tái)管理接口(IPMI)協(xié)議,收集功率信息。在更特定的實(shí)施例中,作業(yè)管理器404訪問作業(yè)功率數(shù)據(jù)庫(kù)405以存儲(chǔ)或獲得用于作業(yè)的功率信息。在一個(gè)實(shí)施例中,作業(yè)功率數(shù)據(jù)庫(kù)405是頭節(jié)點(diǎn)401的一部分。在另一實(shí)施例中,作業(yè)功率數(shù)據(jù)庫(kù)405經(jīng)網(wǎng)絡(luò)耦合到頭節(jié)點(diǎn)401。

節(jié)點(diǎn)402包括作業(yè)管理器407。在一個(gè)實(shí)施例中,作業(yè)管理器407在一個(gè)或更多個(gè)計(jì)算節(jié)點(diǎn)上。在另一實(shí)施例中,作業(yè)管理器407分布一個(gè)或更多個(gè)頭節(jié)點(diǎn)和一個(gè)或更多個(gè)計(jì)算節(jié)點(diǎn)上。作業(yè)管理器407耦合到作業(yè)管理器404和資源管理器406。在作業(yè)管理器404與作業(yè)管理器407之間傳遞包括作業(yè)功率和作業(yè)頻率的作業(yè)數(shù)據(jù)。在作業(yè)管理器407與作業(yè)管理器406之間傳遞包括節(jié)點(diǎn)功率、網(wǎng)絡(luò)利用、網(wǎng)絡(luò)帶寬的其它功率數(shù)據(jù)。在一個(gè)實(shí)施例中,作業(yè)管理器407表示作業(yè)管理器312的一部分。在一個(gè)實(shí)施例中,作業(yè)管理器404和作業(yè)管理器407每個(gè)包括在存儲(chǔ)器中存儲(chǔ)并且由處理器執(zhí)行以報(bào)告用于作業(yè)的輸入功率、輸出功率或兩者的代理(應(yīng)用程序或任何其它計(jì)算機(jī)程序)。作業(yè)管理器407耦合到接口412以獲得用于作業(yè)的功率數(shù)據(jù)。在一個(gè)實(shí)施例中,功率數(shù)據(jù)包括用于作業(yè)的節(jié)點(diǎn)功率、處理器功率和存儲(chǔ)器功率。在一個(gè)實(shí)施例中,接口412是IPMI接口。作業(yè)管理器407經(jīng)存儲(chǔ)裝置411耦合到處理器410。在一個(gè)實(shí)施例中,處理器410是CPU。在備選實(shí)施例中,處理器410是圖形處理單元(CPU)、數(shù)字信號(hào)處理器(DSP)或任何其它處理器。在一個(gè)實(shí)施例中,在作業(yè)管理器407與存儲(chǔ)裝置411之間傳遞處理器頻率值。在一個(gè)實(shí)施例中,存儲(chǔ)裝置411包括操作系統(tǒng)(OS)模型特定寄存器(MSR)模塊或其它存儲(chǔ)裝置。在一個(gè)實(shí)施例中,作業(yè)管理器407經(jīng)OS MSR模塊獲得和設(shè)置與處理器頻率有關(guān)的處理器寄存器值。

圖5A是示出根據(jù)一個(gè)實(shí)施例的包括功率感知啟動(dòng)時(shí)間作業(yè)調(diào)度器和運(yùn)行時(shí)作業(yè)管理器501的數(shù)據(jù)處理系統(tǒng)的框圖500。功率感知啟動(dòng)時(shí)間作業(yè)調(diào)度器和運(yùn)行時(shí)作業(yè)管理器501包括耦合到功率估計(jì)器508的節(jié)點(diǎn)選擇器507,而功率估計(jì)器508耦合到功率分配器509。功率感知作業(yè)調(diào)度器和管理器501接收設(shè)施功率和系統(tǒng)功率502及監(jiān)視的功率511至少之一。功率感知作業(yè)調(diào)度器和管理器501接收無功率限制505的一個(gè)或更多個(gè)作業(yè)和有功率限制和模式輸入506至少之一的一個(gè)或更多個(gè)作業(yè)。響應(yīng)于經(jīng)接口512的系統(tǒng)的請(qǐng)求,從能量產(chǎn)生器504接收設(shè)施功率和系統(tǒng)功率502。接口512例如能夠是需求/響應(yīng)接口或任何其它適當(dāng)?shù)慕涌?。在一個(gè)實(shí)施例中,功率估計(jì)器508使用功率校準(zhǔn)器503估計(jì)用于作業(yè)的功率。節(jié)點(diǎn)選擇器507至少基于設(shè)施功率和系統(tǒng)功率502和監(jiān)視的功率511之一,選擇運(yùn)行作業(yè)的一個(gè)或更多個(gè)節(jié)點(diǎn)。功率分配器509基于節(jié)點(diǎn)選擇和功率估計(jì)至少之一,分配用于作業(yè)的功率。功率感知作業(yè)調(diào)度器和管理器501控制作業(yè)510的功率性能。

在一個(gè)實(shí)施例中,包括功率感知作業(yè)調(diào)度器和管理器的資源管理器配置成管理作業(yè),保持功率預(yù)算和實(shí)時(shí)管理功率受約束的能量效率。

在一個(gè)實(shí)施例中,功率感知資源管理器的功能為:

·在將系統(tǒng)的平均功耗保持在或稍低于預(yù)備功率級(jí)別的同時(shí),運(yùn)行作業(yè);

·通過使用所有分配的功率,最大化作業(yè)的性能和能量效率;

·通過操作在睡眠狀態(tài)中的未使用資源,減少浪費(fèi);以及

·管理功耗升降以符合設(shè)施規(guī)范。

術(shù)語描述

系統(tǒng)的預(yù)備功率(PSYS)

PSYS是用于包括計(jì)算節(jié)點(diǎn)、IO節(jié)點(diǎn)、一個(gè)或更多個(gè)頭節(jié)點(diǎn)(例如,OS節(jié)點(diǎn))、網(wǎng)絡(luò)交換機(jī)及存儲(chǔ)系統(tǒng)的系統(tǒng)的功率分配。在一個(gè)實(shí)施例中,需求/響應(yīng)接口512確定PSYS。

用于系統(tǒng)的可用功率

功率感知調(diào)度器用于在各種作業(yè)之中分布PSYS。可用于分布的功率取決于預(yù)分配的功率和監(jiān)視。在無監(jiān)視的情況下:可用功率=(PSYS-分配的功率)。在有監(jiān)視的情況下:可用功率=(PSYS-系統(tǒng)消耗的功率-保護(hù)帶)。

平臺(tái)最大功率(PMP)

在未使用監(jiān)視時(shí),功率感知調(diào)度器被迫基于任何作業(yè)能夠使用的最大功率來分配功率。此最大作業(yè)功率是基于節(jié)點(diǎn)的平臺(tái)最大功率(PMP)。PMP是通過為最差情況工作負(fù)荷運(yùn)行程序來進(jìn)行測(cè)量。

用于作業(yè)的起動(dòng)功率

作業(yè)需要最低功率分配或起動(dòng)功率以開始或從暫停中恢復(fù)。功率感知調(diào)度器估計(jì)起動(dòng)功率。在無監(jiān)視的情況下,起動(dòng)功率是PMP。在有監(jiān)視的情況下,起動(dòng)功率能夠基于校準(zhǔn)來確定。在可用功率小于起動(dòng)功率時(shí),作業(yè)不能開始。

作業(yè)的最低要求的功率(MRP)

由于不適當(dāng)?shù)墓β?,調(diào)度器可能不能暫停或取消某些作業(yè)。有兩種類別的此類“特殊”作業(yè):無功率限制的作業(yè)和不能被暫停的作業(yè)。功率感知調(diào)度器在分布剩余功率到剩下的作業(yè)前,預(yù)留用于此類作業(yè)的功率。用于每個(gè)“特殊”作業(yè)的預(yù)留功率的量稱為最低要求的功率(MRP)。對(duì)于有功率限制的作業(yè),MRP是PMP或工作負(fù)荷最大功率之一。對(duì)于不能被暫停的作業(yè),MRP是在最低頻率操作作業(yè)所需的功率。對(duì)于所有其它作業(yè),MRP為0。在一個(gè)實(shí)施例中,無功率限制運(yùn)行的作業(yè)不受PSYS降低影響。在PSYS降低時(shí),可使能夠被暫停的作業(yè)暫停。不能被暫停的作業(yè)可降到最低頻率。PSYS甚至可降到低級(jí)別,使得系統(tǒng)不能繼續(xù)運(yùn)行“特殊”作業(yè)。在實(shí)用程序降低其功率分配或者在功率輸送或冷卻基礎(chǔ)設(shè)施中發(fā)生失效時(shí),此情況能夠發(fā)生。通過使用需求/響應(yīng)接口以傳遞用于系統(tǒng)的MRP,同時(shí)確保基礎(chǔ)設(shè)施的高度可靠性和可用性,能夠避免這些情況。

用于作業(yè)的分配的功率

資源管理器分配用于作業(yè)的功率預(yù)算。分配用于兩個(gè)目的:a)確定用于系統(tǒng)的可用功率,和b)對(duì)在消耗的功率與分配的功率顯著同時(shí)的那些情況采取措施。

擱淺功率

理想地,作業(yè)使用全部功率預(yù)算進(jìn)行計(jì)算。在現(xiàn)實(shí)中,消耗可能更少。在功率分配到作業(yè)時(shí),它不可用于其它作業(yè)。在作業(yè)未使用所有分配的功率時(shí),系統(tǒng)的性能受到影響。在分配的與實(shí)際消耗之間的差是擱淺功率。擱淺的功率未使用且不可用于生成系統(tǒng)的性能,并且因此被浪費(fèi)。本文中描述的功率感知作業(yè)調(diào)度器和管理器最小化擱淺功率。

為系統(tǒng)確定功率(PSYS)

在一個(gè)實(shí)施例中,從到設(shè)施的功率分配、在設(shè)施內(nèi)的分布損耗、在服務(wù)器外的電壓轉(zhuǎn)換損耗、冷卻系統(tǒng)所需功率或其任何組合中推導(dǎo)PSYS。在另一實(shí)施例中,將PSYS的值作為調(diào)度器參數(shù)提供。

運(yùn)行作業(yè)所需功率的估計(jì)

在調(diào)度器能夠開始作業(yè)前,估計(jì)需要的功率的量。功率估計(jì)由以下條件至少之一管控:a)節(jié)點(diǎn)的功率和性能校準(zhǔn),b)監(jiān)視作業(yè)級(jí)功率的能力,以及c)對(duì)限制用于作業(yè)的功率的功率策略的用戶選擇。

節(jié)點(diǎn)校準(zhǔn)

雖然數(shù)據(jù)處理系統(tǒng)可使用成千上萬個(gè)“相同”節(jié)點(diǎn),但功率和性能特性可在節(jié)點(diǎn)之間大不相同錯(cuò)誤!未找到引用源(Error!Reference source not found)。硬件和環(huán)境的變化能夠?qū)е略谙嗤l率運(yùn)行相同作業(yè)的在其它方面相同的節(jié)點(diǎn)的不同級(jí)別的功耗。

相反,在硬件功率限制機(jī)制強(qiáng)迫每個(gè)節(jié)點(diǎn)的消耗相同時(shí),那些節(jié)點(diǎn)的性能可不同。節(jié)點(diǎn)級(jí)功率和性能校準(zhǔn)使功率感知作業(yè)調(diào)度器能夠生成更不保守的功率估計(jì),以用于更佳的判定。在一個(gè)實(shí)施例中,為最差情況工作負(fù)荷運(yùn)行程序,并且測(cè)量在每個(gè)操作頻率的每個(gè)節(jié)點(diǎn)的PMP。在另一實(shí)施例中,跨多個(gè)代表性微型應(yīng)用改變處理器頻率。對(duì)于每個(gè)頻率,在數(shù)據(jù)庫(kù)中存儲(chǔ)作業(yè)的平均功率、最大功率、功率偏差及完結(jié)時(shí)間。

作業(yè)功率估計(jì)

節(jié)點(diǎn)校準(zhǔn)數(shù)據(jù)庫(kù)用于估計(jì)作業(yè)功率。在無動(dòng)態(tài)功率監(jiān)視的情況下,調(diào)度器要假設(shè)作業(yè)要求PMP。監(jiān)視提供閉環(huán)控制和小于PMP的功率估計(jì)。在有功率監(jiān)視的情況下,甚至使用受限控制旋鈕的不靈活策略能夠使估計(jì)基于工作負(fù)荷最大功率。靈活的控制實(shí)現(xiàn)動(dòng)態(tài)作業(yè)功率管理。起動(dòng)功率變成工作負(fù)荷平均功率。調(diào)度器將也需要估計(jì)用于不能被暫停的作業(yè)的最小要求的功率(MRP)。調(diào)度器只是將用于每個(gè)節(jié)點(diǎn)的估計(jì)求和以生成作業(yè)估計(jì)。此過程能夠通過考慮在樣本與實(shí)際工作負(fù)荷之間的差別而改進(jìn)。

對(duì)作業(yè)功率分配的用戶偏好

用戶能夠指定作業(yè)優(yōu)先級(jí)和功率與能量策略。示范策略為:a)作業(yè)是否應(yīng)遭受功率限制;b)作業(yè)是否能夠被暫停;以及c)對(duì)于帶有功率限制的作業(yè),用戶也選擇多個(gè)模式之一以執(zhí)行限制。

保持作業(yè)功率在限制內(nèi)的方法

用戶指示是否能夠限制作業(yè)功率。在一個(gè)實(shí)施例中,如相對(duì)于圖2所描述的,基于用戶進(jìn)行的模式選擇,保持作業(yè)功率在功率限制內(nèi)。

圖5B是根據(jù)一個(gè)實(shí)施例的操作數(shù)據(jù)處理系統(tǒng)的方法520的流程圖。在操作521,如上所描述的,接收用于作業(yè)的模式的選擇。在操作522,基于模式,確定用于作業(yè)的可用功率。在一個(gè)實(shí)施例中,基于監(jiān)視的功率、估計(jì)的功率和校準(zhǔn)的功率至少之一,確定可用功率。在操作523,基于可用功率,確定用于作業(yè)的頻率。在操作524,確定運(yùn)行作業(yè)的要求的功率量。在操作525,基于要求的功率,分配用于作業(yè)的功率。在一個(gè)實(shí)施例中,基于用于作業(yè)的平均功率,分配功率。在操作526,確定是否要調(diào)整分配的功率。在備選實(shí)施例中,如果到系統(tǒng)的功率分配更改,作業(yè)消耗的功率與功率分配不同(例如,超過保護(hù)帶),作業(yè)結(jié)束,發(fā)生失效或其任何組合,則需要調(diào)整。如果確定要調(diào)整分配的功率,則在操作527,調(diào)整分配的功率。如果確定不要調(diào)整分配的功率,則方法520返回操作522。

在一個(gè)實(shí)施例中,基于用戶輸入,功率感知調(diào)度器和管理器501確定開始作業(yè)要求的功率的估計(jì)(起動(dòng)功率)。此估計(jì)基于節(jié)點(diǎn)校準(zhǔn)和是否允許暫停作業(yè)。調(diào)度器隨后檢查可用功率。如果可用功率等于或大于起動(dòng)功率,則調(diào)度器開始作業(yè)。在動(dòng)態(tài)監(jiān)視可用時(shí),在例如自動(dòng)模式等某些功率策略中,可基于功率余量,周期性更改由系統(tǒng)的所有節(jié)點(diǎn)使用的均勻頻率。在一個(gè)實(shí)施例中,在更早時(shí)間開始的作業(yè)具有使用另外功率余量的更高優(yōu)先級(jí)。在運(yùn)行時(shí)期間,周期性執(zhí)行功率預(yù)算的重新評(píng)估和均勻頻率??捎霉β士上陆等绱酥嗍沟盟凶鳂I(yè)不能繼續(xù)運(yùn)行。在該情況下,功率感知作業(yè)調(diào)度器從能夠被暫停的作業(yè)列表中挑選在最低優(yōu)先級(jí)的作業(yè)。在一個(gè)實(shí)施例中,在作業(yè)暫停后分配的功率增大時(shí),恢復(fù)被暫停的作業(yè)。

在一個(gè)實(shí)施例中,在無監(jiān)視的情況下,只能夠通過分配用于作業(yè)的足夠功率,以便實(shí)際消耗不超過最差情況限制來確保功率和冷卻系統(tǒng)的完整性。對(duì)于此類情形,估計(jì)的作業(yè)功率基于PMP。

在一個(gè)實(shí)施例中,用戶可指定作業(yè)需要無中斷完結(jié)運(yùn)行,或者該作業(yè)不能被暫停。不實(shí)施檢查定點(diǎn)的作業(yè)一般落入此類別。功率感知調(diào)度器估計(jì)用于作業(yè)的持續(xù)操作的最低要求的功率(MRP)??捎霉β市枰?jì)及MRP。經(jīng)需求/響應(yīng)接口跟蹤和傳遞系統(tǒng)中要求的功率的總計(jì),以便PSYS不會(huì)下降到低于總計(jì)的MRP。

在一個(gè)實(shí)施例中,基于作業(yè)優(yōu)先級(jí),分配用于作業(yè)的功率。在一個(gè)實(shí)施例中,假設(shè)開始或最先調(diào)度的作業(yè)具有更高優(yōu)先級(jí)。在另一實(shí)施例中,由用戶指定作業(yè)優(yōu)先級(jí)。在備選實(shí)施例中,其它優(yōu)先級(jí)機(jī)制用于分配功率到作業(yè)。

在一個(gè)實(shí)施例中,功率感知作業(yè)調(diào)度器和管理器配置成將功耗的更改率保持在預(yù)確定的限制內(nèi)。在一個(gè)實(shí)施例中,功率感知作業(yè)調(diào)度器和管理器配置成最大化分配的功率的消耗,并且最小化擱淺功率。在一個(gè)實(shí)施例中,功率感知作業(yè)調(diào)度器和管理器配置成降低閑置資源使用的功率以改進(jìn)能量效率和增大用于計(jì)算的可用功率。在一個(gè)實(shí)施例中,功率感知作業(yè)調(diào)度器和管理器配置成深度檢查作業(yè)隊(duì)列以識(shí)別和調(diào)度在PSYS內(nèi)適合的最佳候選以調(diào)度盡可能多的作業(yè)。

圖5C是根據(jù)一個(gè)實(shí)施例的提供功率感知作業(yè)調(diào)度器和管理器的方法530的流程圖。在操作531,監(jiān)視一個(gè)或更多個(gè)作業(yè)。在操作532,確定用于作業(yè)的可用功率。在操作533,確定可用功率是否充足,以便作業(yè)能夠運(yùn)行。如果可用功率不足以使作業(yè)運(yùn)行,則方法530返回操作531。如果作業(yè)能夠運(yùn)行,則在操作534,基于可用功率,確定用于作業(yè)的頻率。在操作534,基于頻率,分配用于作業(yè)的功率。在操作536,確定分配的功率是否大于第一閾值。如果分配的功率大于第一閾值,則減小用于作業(yè)的頻率。如果分配的功率大于第一閾值,則方法530返回操作531。在操作538,確定分配的功率是否小于第二閾值。如果分配的功率小于第二閾值,則在操作539,增大用于作業(yè)的頻率。如果分配的功率不小于第二閾值,則方法530返回操作531。

圖6顯示示出根據(jù)一個(gè)實(shí)施例的在功率監(jiān)視可用時(shí)為四種作業(yè)模式設(shè)置均勻頻率的算法的表格600。列601包括作業(yè)參數(shù),例如,用于作業(yè)的可用功率606、不能開始作業(yè)的或什么時(shí)候暫停作業(yè)607的條件、用于作業(yè)的頻率608、用于不能被暫停的作業(yè)的最低要求的功率609、用于作業(yè)的分配的功率610及是否能夠重新調(diào)整用于作業(yè)的頻率的指示611。列602顯示用于固定頻率模式(模式A)的作業(yè)參數(shù);列603顯示用于最低功率模式(模式B)的作業(yè)參數(shù);列604顯示用于最大功率模式(模式C)的作業(yè)參數(shù),以及列605顯示用于自動(dòng)模式(模式D)的作業(yè)參數(shù)。在一個(gè)實(shí)施例中,在運(yùn)行相同作業(yè)的每個(gè)節(jié)點(diǎn)上使用均勻頻率設(shè)置。

在一個(gè)實(shí)施例中,對(duì)于模式A,用戶指定運(yùn)行作業(yè)的固定頻率。如果當(dāng)前系統(tǒng)功耗(Pconsumed)低于設(shè)施功率限制(Psys),并且系統(tǒng)能夠適應(yīng)在用戶指定的固定頻率運(yùn)行的作業(yè),則功率感知調(diào)度器和管理器向作業(yè)啟動(dòng)器指示啟動(dòng)作業(yè)。用于作業(yè)的可用功率被確定為在系統(tǒng)功率、消耗的功率與保護(hù)帶之間的差。如果可用功率(Pavailable)小于在用戶選擇的頻率用于作業(yè)的最大功率(Max),則作業(yè)不能開始或者需要被暫停。用于不能被暫停的作業(yè)的最低要求的功率是在選擇的頻率的最大功率。對(duì)于能被暫停的作業(yè),最低要求的功率為零。用于作業(yè)的分配的功率是在選擇的頻率的最大功率。在此模式中,由于用戶已選擇作業(yè)需要在用戶選擇的頻率運(yùn)行,因此,運(yùn)行作業(yè)的節(jié)點(diǎn)的頻率不更改。

對(duì)于模式1b:用戶指定運(yùn)行作業(yè)的所需最低功率(Pmin)。如果可用系統(tǒng)功率(系統(tǒng)的剩余功率余量)大于Pmin,則功率感知調(diào)度器和管理器向作業(yè)啟動(dòng)器指示啟動(dòng)作業(yè)。用于作業(yè)的可用功率被確定為在系統(tǒng)功率、消耗的功率與保護(hù)帶之間的差。如果可用功率(Pavailable)小于用戶設(shè)置的最低功率Pmin,或者如果作業(yè)在最低可能頻率狀態(tài)Pn運(yùn)行時(shí)可用功率小于平均功率,則作業(yè)不能開始或者需要被暫停。頻率是計(jì)算的頻率。在一個(gè)實(shí)施例中,頻率被計(jì)算為最大頻率(在該頻率,作業(yè)消耗的平均功率小于或等于Pavailable)。用于不能被暫停的作業(yè)的最低要求的功率是最低作業(yè)功率Pmin。對(duì)于能被暫停的作業(yè),最低要求的功率為零。用于作業(yè)的分配的功率是在計(jì)算的頻率的最低要求的功率和平均功率的最大值。只要在新頻率,作業(yè)消耗的功率小于或等于Pavailable,則作業(yè)的頻率便能夠調(diào)整。

對(duì)于模式C:用戶指定運(yùn)行作業(yè)的最大功率(Pmax)。

用于作業(yè)的可用功率被確定為在系統(tǒng)功率、消耗的功率與保護(hù)帶之間的差。如果在最低頻率狀態(tài)Pn操作的作業(yè)消耗的最大功率大于Pmax,則作業(yè)不能開始或者需要被暫停。頻率是計(jì)算的頻率。在一個(gè)實(shí)施例中,頻率被計(jì)算為最大頻率(在該頻率,工作負(fù)荷最大功率小于或等于Pavailable和Pmax的最小值)。對(duì)于能夠被暫停的作業(yè),最低要求的功率為零。對(duì)于不能被暫停的作業(yè),在最低頻率狀態(tài)Pn操作時(shí)最低要求的功率是工作負(fù)荷最大功率。對(duì)于能夠被暫停的作業(yè),最低要求的功率為零。用于作業(yè)的分配的功率是在計(jì)算的頻率的最大功率和Pmax的最小值。只要在新頻率消耗的工作負(fù)荷最大功率小于Pavailable和Pmax的最小值,便能夠調(diào)整在此模式中的作業(yè)的頻率。

對(duì)于模式D:功率感知調(diào)度器和管理器基于當(dāng)前系統(tǒng)功率分配和通過在系統(tǒng)上運(yùn)行的作業(yè)的功耗,選擇用于作業(yè)的頻率。功率感知調(diào)度器和管理器確定用于作業(yè)的剩余功率余量。有能夠影響余量的多個(gè)策略。在一個(gè)實(shí)施例中,最大吞吐量用作影響系統(tǒng)功率余量的策略。用于作業(yè)的可用功率被確定為在系統(tǒng)功率、消耗的功率與保護(hù)帶之間的差。當(dāng)作業(yè)在最低頻率狀態(tài)Pn運(yùn)行時(shí),如果Pavailable小于平均功率,則作業(yè)不能開始或者需要被暫停。頻率是計(jì)算的頻率。在一個(gè)實(shí)施例中,頻率被計(jì)算為最大頻率(在該頻率平均功率小于或等于Pavailable)。對(duì)于能夠被暫停的作業(yè),最低要求的功率為零。對(duì)于不能被暫停的作業(yè),在最低頻率狀態(tài)Pn中操作時(shí)最低要求的功率是工作負(fù)荷最大功率。用于作業(yè)的分配的功率是在計(jì)算的頻率的最低要求的功率和平均功率的最大值。作業(yè)的頻率能夠調(diào)整到最大頻率,在該頻率,作業(yè)的平均功率小于Pavailable。

圖7顯示示出根據(jù)一個(gè)實(shí)施例的在功率監(jiān)視不可用時(shí)為四種作業(yè)模式設(shè)置均勻頻率的算法的表格700。列701包括作業(yè)參數(shù),例如,用于作業(yè)的可用功率706、不能開始作業(yè)的或什么時(shí)候暫停作業(yè)707的條件、用于作業(yè)的頻率708、用于不能被暫停的作業(yè)的最低要求的功率709、用于作業(yè)的分配的功率710及是否能夠重新調(diào)整用于作業(yè)的頻率的指示711。列702顯示用于固定頻率模式(模式A)的作業(yè)參數(shù);列703顯示用于最低功率模式(模式B)的作業(yè)參數(shù);列704顯示用于最大功率模式(模式C)的作業(yè)參數(shù),以及列705顯示用于自動(dòng)模式(模式D)的作業(yè)參數(shù)。在一個(gè)實(shí)施例中,在運(yùn)行相同作業(yè)的每個(gè)節(jié)點(diǎn)上使用均勻頻率設(shè)置。

在一個(gè)實(shí)施例中,對(duì)于模式A,用戶指定運(yùn)行作業(yè)的固定頻率。用于作業(yè)的可用功率被確定為在系統(tǒng)功率與分配的功率之間的差。如果在用戶選擇的頻率可用功率(Pavailable)小于平臺(tái)最大功率(Max),則作業(yè)不能開始或者需要被暫停。用于不能被暫停的作業(yè)的最低要求的功率是在選擇的頻率的PMP功率。對(duì)于能被暫停的作業(yè),最低要求的功率為零。用于作業(yè)的分配的功率是在選擇的頻率的PMP功率。選擇的頻率不能調(diào)整。在此模式中,由于用戶已選擇作業(yè)需要在用戶選擇的頻率運(yùn)行,因此,運(yùn)行作業(yè)的節(jié)點(diǎn)的頻率不更改。

對(duì)于模式B:用戶指定運(yùn)行作業(yè)的所需最低功率(Pmin)。用于作業(yè)的可用功率被確定為在系統(tǒng)功率與分配的功率之間的差。如果可用功率(Pavailable)小于用戶設(shè)置的最低功率Pmin,或者如果可用功率小于用于在最低頻率狀態(tài)Pn中操作的作業(yè)的PMP,則作業(yè)不能開始或者需要被暫停。頻率是計(jì)算的頻率。在一個(gè)實(shí)施例中,頻率被計(jì)算為最大頻率(在該頻率,PMP小于或等于Pavailable)。用于不能被暫停的作業(yè)的最低要求的功率是最低作業(yè)功率Pmin。對(duì)于能被暫停的作業(yè),最低要求的功率為零。用于作業(yè)的分配的功率是在計(jì)算的頻率的最低要求的功率和PMP的最大值。頻率能夠調(diào)整到最大頻率(在該頻率,PMP小于Pavailable)。

對(duì)于模式C:用戶指定運(yùn)行作業(yè)的最大功率(Pmax)。用于作業(yè)的可用功率被確定為在系統(tǒng)功率與分配的功率之間的差。如果用于最低頻率狀態(tài)Pn的PMP大于Pavailable,或者如果在Pn的PMP大于Pmax,則作業(yè)不能開始或者需要被暫停。頻率是計(jì)算的頻率。在一個(gè)實(shí)施例中,頻率被計(jì)算為最大頻率(在該頻率,PMP小于或等于Pavailable和Pmax的最小值)。用于不能被暫停的作業(yè)的最低要求的功率是在最低頻率狀態(tài)Pn狀態(tài)的PMP。對(duì)于能被暫停的作業(yè),最低要求的功率為零。

用于作業(yè)的分配的功率是在計(jì)算的頻率的PMP和Pmax的最小值。頻率能夠調(diào)整到最大頻率(在該頻率,PMP小于Pavailable和Pmax的最小值)。

對(duì)于模式D:功率感知調(diào)度器和管理器基于當(dāng)前系統(tǒng)功耗和其它作業(yè)運(yùn)行條件,選擇運(yùn)行作業(yè)的頻率。功率感知調(diào)度器和管理器確定用于作業(yè)的剩余功率余量。有能夠影響余量的多個(gè)策略。在一個(gè)實(shí)施例中,最大吞吐量用作影響系統(tǒng)功率余量的策略。用于作業(yè)的可用功率被確定為在系統(tǒng)功率與分配的功率之間的差。如果Pavailable小于用于最低頻率狀態(tài)Pn的PMP,則作業(yè)不能開始或者需要被暫停。頻率是計(jì)算的頻率。在一個(gè)實(shí)施例中,頻率被計(jì)算為最大頻率(在該頻率,PMP小于或等于Pavailable)。用于不能被暫停的作業(yè)的最低要求的功率是在最低頻率狀態(tài)Pn狀態(tài)的PMP。對(duì)于能被暫停的作業(yè),最低要求的功率為零。用于作業(yè)的分配的功率是在計(jì)算的頻率的最低要求的功率和PMP的最大值。頻率能夠調(diào)整到最大頻率(在該頻率,PMP小于Pavailable)。

在一個(gè)實(shí)施例中,在功率感知調(diào)度器開始在一組計(jì)算節(jié)點(diǎn)上運(yùn)行的作業(yè)時(shí),作業(yè)可遭受最低和最大功率限制。工作負(fù)荷管理器配置成確保作業(yè)的功耗保持在規(guī)定的限制內(nèi)。在一個(gè)實(shí)施例中,使用精確高分辨率傳感器的功率監(jiān)視提供保護(hù)帶的降低。通常,在功率限制中使用的保護(hù)帶產(chǎn)生了擱淺功率和更低的能量效率。

在一個(gè)實(shí)施例中,用戶指定一些作業(yè)不被功率限制。功率感知作業(yè)調(diào)度器用于估計(jì)作業(yè)能夠消耗的最大功率,并且只在功率可用時(shí)才開始作業(yè)。工作負(fù)荷管理器用于在其它(例如,功率受限)作業(yè)中重新分布功率以降低擱淺功率和最大化效率。在一個(gè)實(shí)施例中,如果PSYS下降,工作負(fù)荷管理器要確保這些指定的作業(yè)的功率分配保持完好。

在一個(gè)實(shí)施例中,對(duì)于固定頻率模式,用戶指定用于作業(yè)的頻率。用戶選擇可基于指示用于每個(gè)頻率的性能和功率的表格。一旦作業(yè)在此模式中開始,頻率便被固定。固定頻率模式的優(yōu)點(diǎn)是作業(yè)不會(huì)引起與頻移關(guān)聯(lián)的開銷,并且因此可擴(kuò)展。用戶可基于在提交作業(yè)時(shí)的可用功率來選擇頻率。

在另一實(shí)施例中,用戶指定用于作業(yè)的功率的預(yù)確定量。在一個(gè)實(shí)施例中,功率的預(yù)確定量是用于作業(yè)的最低功率。在另一實(shí)施例中,功率的量是用于作業(yè)的最大功率。最低功率、最大功率或兩者均基于功率性能表格和用于作業(yè)的節(jié)點(diǎn)的請(qǐng)求數(shù)量來計(jì)算?;诳捎霉β?,調(diào)度器計(jì)算用于作業(yè)的最佳頻率。在使用動(dòng)態(tài)功率監(jiān)視時(shí),工作負(fù)荷管理器可升高或降低頻率,而作業(yè)基于可用功率的增大或減小運(yùn)行。如果可用功率下降到低于指定的最低功率閾值,則作業(yè)被暫停或終止。最低功率模式和最大功率模式的優(yōu)點(diǎn)是它們降低了關(guān)于用戶猜測(cè)正確頻率的負(fù)擔(dān)。其次,通過動(dòng)態(tài)功率監(jiān)視,工作負(fù)荷管理器能夠通過升高頻率來改進(jìn)性能。基于在運(yùn)行作業(yè)時(shí)工作負(fù)荷消耗的功率,能夠改變頻率。在一個(gè)實(shí)施例中,如上所描述的,為開始作業(yè),功率感知調(diào)度器依賴功率要求的校準(zhǔn)和估計(jì)。

在另一實(shí)施例中,自動(dòng)模式消除用戶估計(jì)要由其作業(yè)使用的功率或頻率的需要?;诳捎霉β?,使均勻頻率選擇自動(dòng)化。通過動(dòng)態(tài)功率監(jiān)視,工作負(fù)荷管理器基于功率余量,周期性調(diào)整均勻頻率。自動(dòng)模式允許作業(yè)在所有可用頻率操作。由于不存在用戶定義的最低作業(yè)功率要求,因此,只要有足夠的功率在最低頻率運(yùn)行作業(yè),作業(yè)便能夠開始和繼續(xù)。自動(dòng)模式的優(yōu)點(diǎn)是它降低了作業(yè)等待足夠功率或者作業(yè)由于功率可用性降低而被暫停的概率。自動(dòng)模式增大了資源使用和吞吐量。用戶能夠降低功率限制并且運(yùn)行更多作業(yè)以使用所有硬件資源。

除固定頻率和最低功率模式外,能夠存在使用最低和/或最大頻率和最低和/或最大功率的變化。能夠存在組合用于頻率和功率的設(shè)置的模式。所有這些要求進(jìn)行用戶計(jì)算和實(shí)驗(yàn)。自動(dòng)模式消除了此負(fù)擔(dān),并且在大量的情形中輸送最佳性能。

在一個(gè)實(shí)施例中,功率感知調(diào)度器和管理器在啟動(dòng)時(shí)間運(yùn)行,并且也在可編程間隔運(yùn)行。每次調(diào)用時(shí),功率感知調(diào)度器和管理器重新計(jì)算用于每個(gè)作業(yè)的功率限額(Pavailable)。如上所描述的,這實(shí)現(xiàn)動(dòng)態(tài)功率設(shè)限(capping)和調(diào)控。在一個(gè)實(shí)施例中,定義用于作業(yè)的保持平均功率的周期(Taverage)和控制周期(Tcontrol)。在每個(gè)控制周期中,重新評(píng)估功率預(yù)算、功率分配和頻率選擇至少之一。在一個(gè)實(shí)施例中,Tcontrol是Taverage的十分之一。Taverage是可編程的。假設(shè)設(shè)施需要保持平均功率超過15分鐘,則用于作業(yè)的Taverage結(jié)束為9秒。對(duì)于最低/最大功率和自動(dòng)模式,控制系統(tǒng)大約每900毫秒評(píng)估是否需要更改均勻頻率。

圖8示出根據(jù)一個(gè)實(shí)施例的用于功率感知調(diào)度器和管理器的功率裕度。如圖8中所示的,用于(例如,在操作頻率Fo運(yùn)行的)作業(yè)的功率分配903使得作業(yè)的實(shí)際功耗不超過上限閾值(高功率裕度)901。用于作業(yè)運(yùn)行的功率分配903使得作業(yè)的實(shí)際功耗不小于下限閾值(低功率裕度)902。如果作業(yè)功耗大于高裕度901,則減小操作頻率Fo。如果作業(yè)功耗小于低裕度902,則增大操作頻率Fo。

在一個(gè)實(shí)施例中,為防止頻率振蕩,低功率裕度902設(shè)置為在高一個(gè)區(qū)間(bin)的頻率的用于作業(yè)的平均功率P(Fo+1)與在當(dāng)前頻率Fo(Pfo)的用于作業(yè)的平均功率之間的差。高一個(gè)區(qū)間的頻率是比Fo高一個(gè)區(qū)間的頻率。如果從當(dāng)前頻率Fo到高一個(gè)區(qū)間頻率的跳產(chǎn)生超過功率限額的功耗,則功率感知調(diào)度器和管理器不選擇升高頻率。在一個(gè)實(shí)施例中,高功率裕度901設(shè)為在最大工作負(fù)荷功率與平均工作負(fù)荷功率之間的差。在另一實(shí)施例中,高功率裕度901設(shè)為在平均工作負(fù)荷功率上的平均偏差。在一個(gè)實(shí)施例中,功率裕度設(shè)為在平臺(tái)最大功率(PMP)與在當(dāng)前頻率Fo的平均功率Pavg之間的差。

在一個(gè)實(shí)施例中,高功率裕度901設(shè)成實(shí)質(zhì)上等于功率測(cè)量的準(zhǔn)確度的兩倍。在用于作業(yè)的功率分配降低時(shí),減小操作頻率Fo。在另一實(shí)施例中,高功率裕度901設(shè)成實(shí)質(zhì)上等于用于作業(yè)的當(dāng)前功耗級(jí)別加上比Fo低一個(gè)頻率區(qū)間的功耗。在一個(gè)實(shí)施例中,低功率裕度902設(shè)成實(shí)質(zhì)上等于用于作業(yè)的當(dāng)前功耗級(jí)別加上比Fo高一個(gè)頻率區(qū)間的功耗。

圖9A是顯示根據(jù)一個(gè)實(shí)施例的用于動(dòng)態(tài)分配用于作業(yè)的功率的功率感知作業(yè)調(diào)度器和管理器的校準(zhǔn)表格的示例的視圖。表格911是包括在不同頻率每工作負(fù)荷,每計(jì)算節(jié)點(diǎn)的用于作業(yè)的平均功率的校準(zhǔn)表格的示例。表格912是包括在不同頻率每工作負(fù)荷,每計(jì)算節(jié)點(diǎn)的用于作業(yè)的最大功率的校準(zhǔn)表格的示例。表格913是包括在不同頻率每計(jì)算節(jié)點(diǎn)的PMP的校準(zhǔn)表格的示例。在一個(gè)實(shí)施例中,PMP是節(jié)點(diǎn)能夠通過使用使所有平臺(tái)消耗最大功率量的特殊工作負(fù)荷而得出的平臺(tái)最大功率。有時(shí)此類工作負(fù)荷稱為功率病毒(power virus)。

圖9B是根據(jù)一個(gè)實(shí)施例的分配功率到作業(yè)的方法920的流程圖。在操作930,確定分配到系統(tǒng)的功率(Psys)。在操作931,確定系統(tǒng)消耗的功率(Pcsys)。在操作932,確定Pcsys是否大于在Psys與第一系統(tǒng)保護(hù)帶(SystemGurdband1)之間的差并且小于Psys與第二系統(tǒng)保護(hù)帶(SystemGuardband2)之和。如果Pcsys大于在Psys與第一系統(tǒng)保護(hù)帶(SystemGurdband1)之間的差并且小于Psys與第二系統(tǒng)保護(hù)帶(SystemGuardband2)之和,則在操作933,確定作業(yè)是否可用。如果作業(yè)可用,則在操作934,創(chuàng)建用于作業(yè)的功率余量。例如,創(chuàng)建用于作業(yè)的功率余量以最大化節(jié)點(diǎn)或其它硬件資源的使用。如果作業(yè)不可用,則方法930返回操作930。如果Pcsys不大于在Psys與第一系統(tǒng)保護(hù)帶(SystemGurdband1)之間的差并且不小于Psys與第二系統(tǒng)保護(hù)帶(SystemGuardband2)之和,則在操作935,確定Pcsys是否小于Psys。如果Pcsys小于Psys,則在操作937,選擇作業(yè)。在一個(gè)實(shí)施例中,基于可用功率來選擇作業(yè)。如果Pcsys不小于Psys,則在操作936,降低到作業(yè)的功率分配。

圖9C是根據(jù)另一實(shí)施例的分配功率到作業(yè)的方法940的流程圖。在操作941,識(shí)別在其它作業(yè)中具有最高優(yōu)先級(jí)的作業(yè)。在一個(gè)實(shí)施例中,識(shí)別作業(yè)涉及比較該作業(yè)的優(yōu)先級(jí)和另一作業(yè)的優(yōu)先級(jí)。在一個(gè)實(shí)施例中,基于在隊(duì)列中作業(yè)的位置來識(shí)別作業(yè)優(yōu)先級(jí)。在另一實(shí)施例中,基于頻率(作業(yè)在該頻率運(yùn)行)來識(shí)別作業(yè)優(yōu)先級(jí)。例如,具有預(yù)確定的頻率(例如,與其它作業(yè)相比的最低頻率、最高頻率或其它預(yù)確定的頻率)的作業(yè)能夠具有最高優(yōu)先級(jí)。在另一實(shí)施例中,基于節(jié)點(diǎn)(作業(yè)在其上運(yùn)行)的數(shù)量來識(shí)別作業(yè)優(yōu)先級(jí)。例如,將在預(yù)確定數(shù)量的節(jié)點(diǎn)(例如,最大數(shù)量的節(jié)點(diǎn)、最小數(shù)量的節(jié)點(diǎn)或其它預(yù)確定數(shù)量的節(jié)點(diǎn))上運(yùn)行的作業(yè)識(shí)別為具有最高優(yōu)先級(jí)。在又一實(shí)施例中,基于作業(yè)消耗的功率來識(shí)別作業(yè)優(yōu)先級(jí)。例如,將消耗預(yù)確定的功率(例如,最大功率量、最小功率量或其它預(yù)確定的功率量)的作業(yè)識(shí)別為具有最高優(yōu)先級(jí)。在又一實(shí)施例中,基于作業(yè)運(yùn)行的時(shí)間來識(shí)別作業(yè)優(yōu)先級(jí)。例如,將運(yùn)行預(yù)確定的時(shí)間(例如,最長(zhǎng)時(shí)間、最短時(shí)間或其它預(yù)確定的時(shí)間的持續(xù)時(shí)間)的作業(yè)識(shí)別為具有最高優(yōu)先級(jí)。在操作942,確定作業(yè)是否在最大頻率運(yùn)行。如果作業(yè)在最大頻率運(yùn)行,則方法940返回操作941。如果作業(yè)不在最大頻率運(yùn)行,則在操作943,分配另外的功率到作業(yè)。在操作944,增大作業(yè)的頻率。

圖9D是根據(jù)一個(gè)實(shí)施例的降低到作業(yè)的功率的方法950的流程圖。在操作951,確定用于系統(tǒng)的功率降低。在操作952,確定是否能夠降低用于當(dāng)前作業(yè)的功率分配。如果不能降低用于當(dāng)前作業(yè)的功率分配,則在操作955,暫停當(dāng)前作業(yè)。如果能夠降低用于當(dāng)前作業(yè)的功率分配,則在操作953,確定是否能夠降低一個(gè)或更多個(gè)其它作業(yè)的功率分配。如果不能降低用于一個(gè)或更多個(gè)其它作業(yè)的功率分配,則在操作956,基于用于系統(tǒng)的功率分配,降低用于當(dāng)前作業(yè)的功率分配。如果能夠降低用于一個(gè)或更多個(gè)其它作業(yè)的功率分配,則在操作954,降低用于包括當(dāng)前作業(yè)和一個(gè)或更多個(gè)其它作業(yè)的作業(yè)群組的功率分配。在一個(gè)實(shí)施例中,按一次一個(gè)作業(yè)來降低用于作業(yè)群組的功率分配。在另一實(shí)施例中,實(shí)質(zhì)上同時(shí)為群組中的所有作業(yè)降低功率分配。

圖9E是根據(jù)一個(gè)實(shí)施例的終止作業(yè)的方法960的流程圖。在操作961,監(jiān)視系統(tǒng)消耗的功率(Pcsys)。在操作962,確定系統(tǒng)消耗的功率(Pcsys)是否小于分配到系統(tǒng)的功率(Psys)。如果Pcsys不小于Psys,則在操作963,確定用于當(dāng)前作業(yè)的優(yōu)先級(jí)是否小于其它作業(yè)的優(yōu)先級(jí)。如果用于當(dāng)前作業(yè)的優(yōu)先級(jí)小于其它作業(yè)的優(yōu)先級(jí),則在操作965,停止作業(yè)。如果當(dāng)前作業(yè)的優(yōu)先級(jí)不小于其它作業(yè)的優(yōu)先級(jí),則在操作964,確定隊(duì)列中是否有下一作業(yè)。在一個(gè)實(shí)施例中,如果確定Pcsys大于Psys,則執(zhí)行操作964。如果隊(duì)列中有下一作業(yè),則方法960回到操作963。如果隊(duì)列中沒有下一作業(yè),則在操作966,系統(tǒng)關(guān)閉。在一個(gè)實(shí)施例中,基于在隊(duì)列中作業(yè)的位置來識(shí)別作業(yè)優(yōu)先級(jí)。在另一實(shí)施例中,基于頻率(作業(yè)以該頻率運(yùn)行)來識(shí)別作業(yè)優(yōu)先級(jí)。在又一實(shí)施例中,基于節(jié)點(diǎn)(作業(yè)在其上運(yùn)行)的數(shù)量來識(shí)別作業(yè)優(yōu)先級(jí)。在又一實(shí)施例中,基于作業(yè)消耗的功率來識(shí)別作業(yè)優(yōu)先級(jí)。在又一實(shí)施例中,如上所描述的,基于作業(yè)運(yùn)行的時(shí)間來識(shí)別作業(yè)優(yōu)先級(jí)。

圖9F是根據(jù)一個(gè)實(shí)施例的重新平衡功率以適應(yīng)更多作業(yè)的方法970的流程圖。在操作971,監(jiān)視一個(gè)或更多個(gè)作業(yè)。在操作972,確定是否能夠降低用于當(dāng)前作業(yè)的功率分配。如果能夠降低用于當(dāng)前作業(yè)的功率分配,則方法回到操作971。如果能夠降低用于當(dāng)前作業(yè)的功率分配,則在操作973,確定作業(yè)是否在大于最低頻率的頻率運(yùn)行。如果作業(yè)在不大于最低頻率的頻率運(yùn)行,則方法返回操作971。如果作業(yè)在大于最低頻率的頻率運(yùn)行,則在操作974,確定用于隊(duì)列中下一作業(yè)的功率估計(jì)。在操作975,確定功率余量是否可用于下一作業(yè)。如果功率余量可用于下一作業(yè),則在操作976,適應(yīng)下一作業(yè)。如果功率余量不可用于下一作業(yè),則方法970回到操作973。

圖9G是根據(jù)另一實(shí)施例的降低到作業(yè)的功率的方法980的流程圖。在操作981,確定消耗的系統(tǒng)功率(Pcsys)大于分配的系統(tǒng)功率(Psys)。在操作982,確定作業(yè)的操作頻率(Fo)是否大于最低操作頻率(Fmin),或者作業(yè)功率是否大于用于作業(yè)的最低功率。如果Fo不大于Fmin,則在操作987,暫停作業(yè)。如果Fo大于Fmin,則在操作983,確定用于作業(yè)的功率降低。在操作984,基于功率降低,降低用于作業(yè)的功率分配。在操作985,確定功率余量是否足以運(yùn)行作業(yè)。如果功率余量足以運(yùn)行作業(yè),則在操作986,確定是否有下一作業(yè)可用。如果功率余量不足以運(yùn)行作業(yè),則在操作988,暫停作業(yè)。如果有下一作業(yè),則方法980返回操作982。如果沒有下一作業(yè),則在操作999,系統(tǒng)斷開。

下面示出根據(jù)一個(gè)實(shí)施例的操作包括功率感知作業(yè)調(diào)度器和管理器的數(shù)據(jù)處理系統(tǒng)的示范設(shè)計(jì)工作流程。為簡(jiǎn)明起見,只使用了兩個(gè)作業(yè)管理器策略。本領(lǐng)域技術(shù)人員理解,能夠使用有不止兩個(gè)作業(yè)管理器策略的數(shù)據(jù)處理系統(tǒng)。

1.校準(zhǔn)器

1.1.1.輸入

1.1.2.工作負(fù)荷:命令運(yùn)行

1.1.3.節(jié)點(diǎn)列表(N1,N2...Nn)

1.1.2.基于每節(jié)點(diǎn)#個(gè)核和節(jié)點(diǎn)的數(shù)量,修改運(yùn)行命令

1.1.3.頻率列表(F1,F(xiàn)2,...Fn)

1.2.數(shù)據(jù)庫(kù)中保存的輸出

1.2.1.對(duì)于每個(gè)頻率

1.2.1.1功率(工作負(fù)荷-最大,工作負(fù)荷-平均)

1.2.1.2溫度(工作負(fù)荷-最大,工作負(fù)荷-平均)

1.2.1.3完結(jié)時(shí)間

2.估計(jì)器-P(助率估計(jì)器)

2.1輸入

2.1.1工作負(fù)荷:用戶指示工作負(fù)荷(從更接近應(yīng)用的樣本工作負(fù)荷列表中)

2.1.2節(jié)點(diǎn)列表(M1,M2...Mn)

2.1.3頻率列表(F1,F(xiàn)2,...Fn)

2.2輸出

2.2.1對(duì)于每個(gè)頻率

2.2.1.1功率(工作負(fù)荷-最大,工作負(fù)荷-平均,工作負(fù)荷-最小(預(yù)留功率));預(yù)留功率:保持作業(yè)在最低頻率運(yùn)行所要求的功率(最低功率)

2.2.1.2溫度(工作負(fù)荷-最大,工作負(fù)荷-平均)

2.2.1.3完結(jié)時(shí)間

3.估計(jì)器-F(頻率估計(jì)器)

3.1輸入

3.1.1工作負(fù)荷:用戶指示工作負(fù)荷(從更接近應(yīng)用的樣本工作負(fù)荷列表中)

3.1.2節(jié)點(diǎn)列表(N1,N2...Nn)

3.1.3可用功率

3.1.4功率級(jí)別(PMP,WorkloadMax,WorkloadAverage)

僅定義參數(shù)之一,其它參數(shù)為0

3.2輸出

3.2.1操作頻率FS

3.2.2 JobPower@FS,JobPower@F(S-1),JobPower@F(S+1);

FS=提議的頻率;F(S+1)=比提議的頻率高一個(gè)頻率;FS=比提議的頻率低一個(gè)頻率;

4.功率感知調(diào)度器和作業(yè)管理器

假設(shè):

1.功率監(jiān)視可用。

2.節(jié)點(diǎn)具有單個(gè)租用。在某個(gè)時(shí)間節(jié)點(diǎn)只運(yùn)行一個(gè)節(jié)點(diǎn)。在相同節(jié)點(diǎn)中,未跨多個(gè)作業(yè)分割核。

4.1輸入

4.1.1作業(yè)

4.1.1.1作業(yè)功率限制(是/否)

4.1.1.2作業(yè)是否能被暫停(是/否)

4.1.1.3在(1∶2)之間的JobManager策略#

在添加更多的功率策略時(shí)這將更改,

JobManager策略#1:用戶選擇用于作業(yè)的操作頻率

JobManager策略#2:自動(dòng)模式(JobManager基于功率余量,選擇/修改用于作業(yè)的頻率)

功率感知調(diào)度器

(A)PSYS:分配到系統(tǒng)的功率

(B)PCSYS:系統(tǒng)消耗的功率

(C)SystemGuardband(1∶2):抑制系統(tǒng)級(jí)控制事件的值

a.低于PSYS時(shí)的SysGuardband1裕度。示例低10%

b.高于PSYS時(shí)的SysGuardband2裕度。示例高1%。

(D)PJOB:分配到作業(yè)的功率

(E)PCJOB:作業(yè)消耗的功率

1.1 PSYS-SystemGuardband1<PCSYS<PSYS+SystemGuardband2?(系統(tǒng)消耗功率小于分配的功率?)

a.是→

i.隊(duì)列中有準(zhǔn)備運(yùn)行的作業(yè)(新或暫停的)?準(zhǔn)備運(yùn)行意味著它具有除功率外的所有資源

A.是轉(zhuǎn)到1.13以降低在運(yùn)行的作業(yè)的功率,以形成用于新/暫停的作業(yè)的余量

B.否轉(zhuǎn)到1.1并且繼續(xù)監(jiān)視

b.否→繼續(xù)到1.2

1.2 PCSYS<PSYS?

a.是;恢復(fù)(暫停的作業(yè)或開始新作業(yè)),或者分配更多功率到運(yùn)行的作業(yè);轉(zhuǎn)到1.3(可能有多個(gè)方案)

b.否;系統(tǒng)消耗更多功率;降低到作業(yè)的分配;轉(zhuǎn)到1.10。

1.3在有更多功率分配時(shí),選擇準(zhǔn)備運(yùn)行的最高優(yōu)先級(jí)作業(yè)(下一作業(yè))(可能有多個(gè)方案)(此處有兩種可能性,(a)比較新作業(yè)的優(yōu)先級(jí)和暫停的作業(yè)的優(yōu)先級(jí),并且開始/恢復(fù)有更高優(yōu)先級(jí)的無論哪個(gè)作業(yè),或者(b)恢復(fù)暫停的作業(yè),即,假設(shè)暫停的作業(yè)在更高優(yōu)先級(jí))。

a.是否想恢復(fù)暫停的作業(yè)?

i.是下一作業(yè)是最高優(yōu)先級(jí)暫停的作業(yè)轉(zhuǎn)到1.6

ii否繼續(xù)到1.4

1.4是否能夠開始新作業(yè)?(這假設(shè)使用某個(gè)策略,其指示最好使用盡可能多的節(jié)點(diǎn)運(yùn)行盡可能多的作業(yè)。這意味著分配的功率跨多個(gè)作業(yè)攤平(pancake))(可能有多個(gè)方案)

a.是繼續(xù)到1.5

b.否轉(zhuǎn)到1.9

1.5是否作業(yè)要服務(wù)功率限制?

a.是→繼續(xù)到1.6

b.否→設(shè)置JobProfile=PMP,JobFrequency=FMAx.;轉(zhuǎn)到1.7

1.6作業(yè)管理器策略

a.對(duì)于JobManager策略#1,設(shè)置JobProfile(用戶從列表中選擇,參閱0)JobFrequency=FUserSeiected;轉(zhuǎn)到1.7a

b.對(duì)于JobManager策略#2,設(shè)置JobProfile(用戶從列表中選擇,參閱0);轉(zhuǎn)到1.7c

1.7分配功率到作業(yè)并且選擇操作頻率

a.從估計(jì)器-P獲得功率(工作負(fù)荷=JobProfile,頻率=JobFrequency,節(jié)點(diǎn)列表);輸出JobPower

b.(JobPower>(PSYS+SystemGuardband2-PCSYS)?(用戶選擇用于JobManager策略#1的頻率,但無足夠功率以在該模式中運(yùn)行)

i.是,轉(zhuǎn)到降低運(yùn)行的作業(yè)的功率1.10(降低運(yùn)行的作業(yè)的功率,以便我們能夠適應(yīng)新作業(yè))如果該操作失敗,則我們說沒有開始新作業(yè)的足夠功率。(可能有多個(gè)方案)

ii否轉(zhuǎn)到1.8

c.對(duì)于在自動(dòng)模式中運(yùn)行的作業(yè)

i.從估計(jì)器-F獲得頻率(工作負(fù)荷=JobProfile,可用功率=(PSYS-SystemGuardband1-PCSYS),功率級(jí)別=WorkloadAverage),預(yù)期輸出JobFrequency和JobPower(這也提供在能夠升高或者應(yīng)降低頻率時(shí)用于作業(yè)的功率級(jí)別)。

1.8通過到作業(yè)的功率分配PJOB=JobPower;頻率=JobFrequency,啟動(dòng)作業(yè)。轉(zhuǎn)到1.1

1.9(不能開始新作業(yè),因此,分配更多功率到運(yùn)行的作業(yè))

a.多余(excess)功率=PSYS-SystemGuardband1-PCSYS

b.識(shí)別已經(jīng)在運(yùn)行和在自動(dòng)模式中運(yùn)行的更高優(yōu)先級(jí)作業(yè)(JobManager策略#2);比如說作業(yè)X

c.作業(yè)X頻率=FMAX?(作業(yè)已經(jīng)在最大頻率運(yùn)行?)

i.是,獲得優(yōu)先級(jí)中的下一作業(yè)并且轉(zhuǎn)到1.9c(如果您用盡所有此類作業(yè),則這意味著您具有不能用于以更高性能運(yùn)行任何新作業(yè)或現(xiàn)有作業(yè)的過多功率,在該情況下,在此處停止)。

ii.否,繼續(xù)

d.分配另外的功率到作業(yè)X,

i.通過增大用于作業(yè)的可用功率使用估計(jì)器-F獲得新頻率和新作業(yè)功率用于作業(yè)X的新可用功率=過多功率+用于作業(yè)X的原JobPower(可能有多個(gè)方案)(您能夠替代地增大頻率一步)

e.轉(zhuǎn)到1.7c.i.

1.10(降低到作業(yè)的功率的方法)您由于PCSYS>PSYS+SystemGuardband2(即,一個(gè)或更多個(gè)作業(yè)的功耗已超過預(yù)期)或從前一值降低的PSYS而在此處。(可能有多個(gè)方案)

a.要求的功率降低=PCSYS-PSYS

b.任何作業(yè)在自動(dòng)模式中運(yùn)行?

i.是;轉(zhuǎn)到1.10c以降低到自動(dòng)模式中作業(yè)的功率

ii否不存在降低到作業(yè)的功率的機(jī)會(huì)轉(zhuǎn)到1.11暫停作業(yè)

c.同時(shí)降低到所有作業(yè)的功率?

i.是;轉(zhuǎn)到1.14以降低到自動(dòng)模式中所有作業(yè)的功率分配

ii否,只是一次一個(gè)頻率一個(gè)作業(yè)降低功率繼續(xù)到下一步

d.識(shí)別已經(jīng)在運(yùn)行和在自動(dòng)模式中運(yùn)行的最低優(yōu)先級(jí)作業(yè)(JobManager策略#2);比如說作業(yè)Y

e.作業(yè)Y頻率=FMIN?(作業(yè)已經(jīng)在最低頻率運(yùn)行?)

i.是,獲得下一更高優(yōu)先級(jí)作業(yè),并且轉(zhuǎn)到1.10e(如果您用盡所有此類作業(yè),則這意味著您不能降低任何作業(yè)的功耗,并且您需要暫停作業(yè)以進(jìn)行該操作轉(zhuǎn)到1.11

ii否,繼續(xù)(作業(yè)Y在比FMIN更大的頻率運(yùn)行,因此,我們能夠降低頻率)。

f.降低到作業(yè)Y的功率分配

g.對(duì)于作業(yè)Y-作業(yè)YJobPower@F(S-1))→≥(PCSYS-PSYS)?

i.如果是,則用于作業(yè)Y的PJOB=用于作業(yè)Y的原PJOB-JobPower@F(S-1),

ii如果否,

A.作業(yè)Y(-JobPower@F(S-1))?<(PCSYS-PSYS)

B.逐一降低在自動(dòng)模式中運(yùn)行的所有作業(yè)的功率,直至(PCSYS<PSYS)

C.迭代此過程,直至一次一個(gè)頻率降低在自動(dòng)模式中作業(yè)的頻率,或者直至作業(yè)達(dá)到FMIN。

D.如果所有作業(yè)(在自動(dòng)模式中)降低到FMIN,并且仍是(PCSYS>PSYS),則轉(zhuǎn)到1.11以暫停一個(gè)或更多個(gè)作業(yè)。

1.11(暫停作業(yè))您由于(PCSYS>PSYS),并且在自動(dòng)模式中的所有作業(yè)在FMIN操作而在此處。您需要暫停作業(yè)以便降低PCSYS。(可能有多個(gè)方案)

a.識(shí)別能夠被暫停的更低優(yōu)先級(jí)作業(yè)(固定頻率或自動(dòng)模式),并且暫停作業(yè)。

b.新PCSYS=原PCSYS-被暫停的作業(yè)消耗的功率。

c.檢查新PCSYS以看其是否低于PSYS。如果否,則轉(zhuǎn)到1.11a。

d.如果您暫停所有作業(yè)(能夠被暫停的),并且仍是(PCSYS>PSYS),則您需要取消不能被暫停和恢復(fù)的作業(yè)。

1.12(終止不能被暫停的作業(yè))您由于需要停止不能被暫停的作業(yè)而在此處。假設(shè);能夠被暫停的所有作業(yè)已經(jīng)被暫停。

a.識(shí)別不能被暫停的更低優(yōu)先級(jí)作業(yè),并且停止(取消)該作業(yè)。

b.檢查新PCSYS以看其是否低于PSYS。如果否,則轉(zhuǎn)到1.12a。

c.如果您停止了所有作業(yè),并且仍是(PCSYS>PSYS),則您需要斷開系統(tǒng)。

1.13(重新平衡功率以適應(yīng)更多作業(yè)):您由于有節(jié)點(diǎn)可用于運(yùn)行作業(yè)(新或暫停的)但PCSYS接近PSYS而在此處。這不是功率余量。我們將檢查是否能夠創(chuàng)建功率余量以運(yùn)行作業(yè)。

a.有任何作業(yè)在自動(dòng)模式中運(yùn)行?

i.是繼續(xù)到1.13b

ii否轉(zhuǎn)到1.1

b.在自動(dòng)模式中的任何作業(yè)在大于FMIN的頻率運(yùn)行?

i.是繼續(xù)到1.13c

ii否轉(zhuǎn)到1.1

c.獲得用于隊(duì)列中下一作業(yè)(新或暫停的)的功率(JobPowerForNext)的估計(jì)(如果下一作業(yè)優(yōu)選自動(dòng)模式,用于FMIN狀態(tài)的功率)

d.我們需要降低到所有運(yùn)行的作業(yè)的功率分配,以便創(chuàng)建余量=JobPowerForNext。

i.獲得用于自動(dòng)模式中每個(gè)作業(yè)的頻率和消耗的功率

ii估計(jì)是否能夠?qū)⒌皆谧詣?dòng)模式中運(yùn)行的所有作業(yè)的功率按其當(dāng)前功耗成比例降低,以這種方式使得在新作業(yè)開始時(shí),所有運(yùn)行的作業(yè)將在FMIN或更高頻率操作(比例性能夠基于當(dāng)前功耗、節(jié)點(diǎn)的數(shù)量或優(yōu)先級(jí))

iii.有足夠的功率余量?

A.是 降低到自動(dòng)模式中作業(yè)的功率,并且轉(zhuǎn)到1.1。

B.否 檢查準(zhǔn)備運(yùn)行隊(duì)列中的下一作業(yè),并且轉(zhuǎn)到1.13c。詳盡地進(jìn)行此操作,直至隊(duì)列結(jié)束。在隊(duì)列結(jié)束時(shí),轉(zhuǎn)到1.1

1.14(由于PCSYS>PSYS,因此,降低到自動(dòng)模式中作業(yè)的功率)

a.在自動(dòng)模式中的任何作業(yè)在大于FMIN的頻率運(yùn)行?

i.是繼續(xù)到1.14b

ii否;無機(jī)會(huì)降低到自動(dòng)模式中作業(yè)的功率,轉(zhuǎn)到暫停作業(yè)以進(jìn)行該操作轉(zhuǎn)到1.11。

b.要求的功率降低,ReducePower=(PCSYS-PSYS-SytemGuardband1)

c.我們需要降低到所有運(yùn)行的作業(yè)的功率分配,以便創(chuàng)建余量=ReducePower。

i.獲得用于自動(dòng)模式中每個(gè)作業(yè)的頻率和消耗的功率

ii估計(jì)是否能夠?qū)⒌皆谧詣?dòng)模式中運(yùn)行的所有作業(yè)的功率按其當(dāng)前功耗成比例降低,以這種方式使得在新作業(yè)開始時(shí),所有運(yùn)行的作業(yè)將在FMIN或更高頻率操作(比例性能夠基于當(dāng)前功耗、節(jié)點(diǎn)的數(shù)量或優(yōu)先級(jí))

iii.是否有足夠的功率余量?

A.是降低到自動(dòng)模式中作業(yè)的功率,并且轉(zhuǎn)到1.1

B.否;我們需要暫停作業(yè)轉(zhuǎn)到1.11

圖9H是根據(jù)一個(gè)實(shí)施例的提供功率感知作業(yè)調(diào)度器和作業(yè)管理器的方法990的流程圖。方法990的一些操作引用上面描述的功率感知調(diào)度器工作流程的操作的項(xiàng)目。在操作991,接收來自用戶的一個(gè)或更多個(gè)輸入。在操作992,確定是否Pcsys大于在Psys與更低系統(tǒng)保護(hù)帶(SysGuardband1)之間的差,并且低于Psys與高系統(tǒng)保護(hù)帶(SysGuardband2)(功率感知調(diào)度器,項(xiàng)目1.1)之和。如果Psys-SysGuardband1<Pcsys<Psys+SysGuardband2,則在操作993,確定隊(duì)列中是否有作業(yè)。如果隊(duì)列中沒有作業(yè),則方法990返回操作991。如果Pcsys不大于在Psys與較低系統(tǒng)保護(hù)帶(SysGurdband1)之間的差并且不小于Psys與高系統(tǒng)保護(hù)帶(SysGuardband2)之和,則在操作994,確定Pcsys是否小于Psys(功率感知調(diào)度器,項(xiàng)目1.2)。

如果在操作993,確定隊(duì)列中有作業(yè),則執(zhí)行方法以重新平衡功率來創(chuàng)建功率余量以適應(yīng)更多作業(yè)(功率感知調(diào)度器,項(xiàng)目1.3)。這涉及在操作995確定是否有在自動(dòng)模式中的作業(yè)(功率感知調(diào)度器,項(xiàng)目1.13)。如果沒有在自動(dòng)模式中的作業(yè),則方法990返回操作991。如果有在自動(dòng)模式中的作業(yè),則在操作996,確定作業(yè)的操作頻率是否大于最低頻率Fmin(功率感知調(diào)度器,項(xiàng)目1.13b)。如果作業(yè)的操作頻率不大于最低頻率,則這意味著無機(jī)會(huì)降低用于運(yùn)行的作業(yè)的功率,方法990返回操作991。

如果作業(yè)的操作頻率大于最低頻率,則確定用于下一作業(yè)(新作業(yè)或暫停的作業(yè))的要求的功率余量額(功率感知調(diào)度器,項(xiàng)目1.13c)。在操作998,確定可用功率(Pheadroom)是否小于用于在自動(dòng)模式中作業(yè)的功率降低(功率感知調(diào)度器,項(xiàng)目1.13c)。如果可用功率(Pheadroom)小于用于作業(yè)的功率降低,則在操作1020,降低用于作業(yè)的分配的功率(Jauto power)。在操作999,啟動(dòng)作業(yè),并且方法返回操作991。

如果可用功率(Pheadroom)不小于用于作業(yè)的功率降低,則在操作997,確定是否有新作業(yè)或暫停的作業(yè)至少之一。如果無新作業(yè)或暫停的作業(yè),則方法990返回操作998(功率感知調(diào)度器,項(xiàng)目1.13c)。如果有新作業(yè)或暫停的作業(yè)至少之一,則方法990返回操作991。

如果在操作994,確定Pcsys不小于Psys,則執(zhí)行方法以降低到作業(yè)的功率(功率感知調(diào)度器,項(xiàng)目1.10)。功率降低Pred被確定為在Pcsys-Psys-SystemGuardband1之間的差,并且在操作1037,確定是否有在自動(dòng)模式中的作業(yè)(功率感知調(diào)度器,項(xiàng)目1.10b)。如果沒有在自動(dòng)模式中的作業(yè),則無機(jī)會(huì)降低到作業(yè)的功率,作業(yè)被暫停(功率感知調(diào)度器,項(xiàng)目1.11),并且方法轉(zhuǎn)到操作1033以識(shí)別要暫停的作業(yè)。

如果有在自動(dòng)模式中的作業(yè),則在操作1040,確定是否要降低到作業(yè)群組的功率。如果要降低到作業(yè)群組的功率,則執(zhí)行方法以降低到自動(dòng)模式中作業(yè)的功率(功率感知調(diào)度器,項(xiàng)目1.14)。在操作1041(功率感知調(diào)度器,項(xiàng)目1.14a),確定是否有在大于Fmin的頻率運(yùn)行的作業(yè)。如果有在大于頻率Fmin的頻率的作業(yè),則確定用于在自動(dòng)模式中運(yùn)行的所有作業(yè)的可能功率降低(Predauto)(功率感知調(diào)度器,項(xiàng)目1.14b)。

在操作1043,確定Predauto是否大于Pred,在操作1042,降低功率,方法990返回操作991。如果Predauto不大于Pred,則方法990轉(zhuǎn)到操作1033。如果沒有在大于Fmin的頻率運(yùn)行的作業(yè),則在操作1033,確定具有最低優(yōu)先級(jí)的活躍(運(yùn)行的)作業(yè)。在操作1033,暫停具有最低優(yōu)先級(jí)的作業(yè)。在操作1031,確定Pcsys是否小于Psys。如果是,則方法回到操作991。如果Pcsys不小于Psys,則在操作1034,檢查是否暫停其功率能夠被暫停的所有作業(yè)。如果并非能夠被暫停的所有作業(yè)被暫停,則方法返回操作1033以暫停隊(duì)列中的下一作業(yè)。如果能夠被暫停的所有作業(yè)已被暫停,則方法990回到操作1028,其涉及確定具有最低優(yōu)先級(jí)的作業(yè),以取消作業(yè),以便系統(tǒng)功耗Pcsys能夠被降低到低于系統(tǒng)分配Psys。

在操作1027A,取消具有最低優(yōu)先級(jí)的作業(yè),并且隨后方法990回到操作1027,其涉及確定是否Pcsys<Psys。如果Pcsys小于Psys,則方法990回到操作991。如果Pcsys不小于Psys,則在操作1029,確定是否有任何活躍作業(yè)。如果有活躍作業(yè),則方法990回到操作1028。如果沒有任何活躍作業(yè),則在操作1030,斷開系統(tǒng)。

如果在操作1040,確定不降低到所有作業(yè)的功率,則在操作1036,降低到具有最低優(yōu)先級(jí)的作業(yè)的功率。在操作1035,確定是否Pcsys<Psys。如果Pcsys小于Psys,則方法990返回操作991。如果Pcsys不小于Psys,則方法990轉(zhuǎn)到操作1033。

如果在操作994,確定Pcsys小于Psys,則執(zhí)行方法以分配更多功率到作業(yè)(功率感知調(diào)度器,項(xiàng)目1.3),其涉及在操作1021從新作業(yè)和暫停的作業(yè)的列表選擇最高優(yōu)先級(jí)作業(yè)。在操作1022,確定最高優(yōu)先級(jí)作業(yè)是否為暫停的作業(yè)(功率感知調(diào)度器,項(xiàng)目1.3.a.i)。如果作業(yè)最高優(yōu)先級(jí)作業(yè)是暫停的作業(yè),則在操作1023,確定作業(yè)的策略是否為自動(dòng)模式(功率感知調(diào)度器,項(xiàng)目1.6)。如果作業(yè)的策略是自動(dòng)模式,則確定用于作業(yè)的頻率估計(jì)和功率估計(jì)(功率感知調(diào)度器,項(xiàng)目1.7c),并且在操作1026,啟動(dòng)作業(yè)(功率感知調(diào)度器,項(xiàng)目1.8),并且方法990回到操作991。

如果在操作1023,確定作業(yè)的策略不是自動(dòng)模式,則確定用于作業(yè)的功率估計(jì)(工作負(fù)荷類型、頻率、節(jié)點(diǎn))(功率感知調(diào)度器,項(xiàng)目1.7a)。隨后,確定功率估計(jì)是否大于Psys+SysGuardBand2-Pcsys(功率感知調(diào)度器,項(xiàng)目1.7b)。如果功率估計(jì)大于Psys+SysGuardBand2-Pcsys,則方法990轉(zhuǎn)到操作1037,以執(zhí)行方法來降低到作業(yè)的功率(功率感知調(diào)度器,項(xiàng)目1.10)。如果功率估計(jì)不大于Psys+SysGuardBand2-Pcsys,則方法990轉(zhuǎn)到操作1026,以啟動(dòng)作業(yè)(功率感知調(diào)度器,項(xiàng)目1.8)。

如果在操作1022,確定最高優(yōu)先級(jí)作業(yè)不是暫停的作業(yè),則執(zhí)行操作1024,其涉及確定是否能夠開始新作業(yè)(功率感知調(diào)度器,項(xiàng)目1.4)。如果能夠開始新作業(yè),則在操作1025,確定作業(yè)是否要遭受功率限制(功率感知調(diào)度器,項(xiàng)目1.5)。如果作業(yè)要遭受功率限制,則方法990轉(zhuǎn)到操作1023。如果不能開始新作業(yè),則方法900轉(zhuǎn)到操作1044。在操作1044,檢查隊(duì)列中是否有任何其它新作業(yè)、暫停的作業(yè)或兩者。如果有,則執(zhí)行操作1021以按優(yōu)先級(jí)挑選下一作業(yè)。如果隊(duì)列中沒有其它作業(yè),則從操作1023,方法轉(zhuǎn)到操作1038。過多的功率被確定為Psys-SystemGuradBand1-Pcsys,并且方法990轉(zhuǎn)到操作1038,其涉及確定是否有作業(yè)。由于有多余功率,而不能開始新作業(yè),因此,多余功率被分配到已經(jīng)在系統(tǒng)上運(yùn)行的作業(yè)。如果有作業(yè),則在操作1039確定當(dāng)前作業(yè)的頻率是否等于最大頻率。如果當(dāng)前作業(yè)的頻率等于最大頻率,則方法990返回操作1038以檢查下一作業(yè)。

如果當(dāng)前作業(yè)頻率不等于最大頻率,則當(dāng)前作業(yè)頻率和分配的功率被增大,并且方法990轉(zhuǎn)到操作1026。如果在操作1038,所有作業(yè)已檢查,則方法990回到操作991。如果在操作1025,確定作業(yè)不遭受功率限制,則設(shè)置作業(yè)配置文件(PMP、作業(yè)頻率、在最大值),并且從估計(jì)器分配用于作業(yè)的功率(功率感知調(diào)度器,項(xiàng)目1.7a)。

圖10顯示根據(jù)一個(gè)實(shí)施例的帶有和不帶有功率監(jiān)視的系統(tǒng)的性能的示例。固定頻率模式、最低功率模式和自動(dòng)模式用于為作業(yè)選擇均勻頻率。曲線圖1001顯示用于作業(yè)的CPU頻率1002對(duì)有功率監(jiān)視和無功率監(jiān)視情況下的可用系統(tǒng)功率(Psys)1003。曲線圖1010顯示完結(jié)作業(yè)的時(shí)間1011對(duì)有功率監(jiān)視和無功率監(jiān)視情況的可用系統(tǒng)功率(Psys)1012。由于性能被測(cè)量為完結(jié)作業(yè)的掛鐘時(shí)間,因此,數(shù)字越小,性能越佳。實(shí)線1004、1005和1006顯示帶有監(jiān)視的CPU頻率,并且虛線1007、1008和1009顯示無監(jiān)視的CPU頻率。實(shí)線1016、1017和1018顯示帶有監(jiān)視的完結(jié)作業(yè)的時(shí)間,并且虛線1013、1014和1015顯示無監(jiān)視的完結(jié)作業(yè)的時(shí)間。

如曲線圖1010和1001中所示的,資源管理器在所有模式中在所有功率限制在帶有監(jiān)視的情況下獲得更佳性能。益處能夠高達(dá)40%。與固定頻率和最低功率模式相比,自動(dòng)模式使作業(yè)能夠在最低可用功率開始。自動(dòng)模式中的自動(dòng)均勻頻率調(diào)整最大化可用功率的使用。自動(dòng)模式中的作業(yè)能夠在均勻頻率操作(其比在固定頻率模式中的頻率大約高40%)。另外,所有三種情況下的實(shí)線比對(duì)應(yīng)虛線更靠近Y軸而開始。這指示監(jiān)視使調(diào)度器能夠以更低的系統(tǒng)功率限制開始作業(yè)。

圖11顯示示出根據(jù)一個(gè)實(shí)施例的具有同時(shí)在不同模式運(yùn)行的作業(yè)的混合模式配置的表格1100。列1102顯示作業(yè)1(工作負(fù)荷Lulesh(Pr 1))在無功率限制的情況下在兩個(gè)節(jié)點(diǎn)上運(yùn)行。列1103顯示作業(yè)2(工作負(fù)荷Qbox(Pr 2))在固定頻率模式中的兩個(gè)節(jié)點(diǎn)上運(yùn)行。列1104顯示作業(yè)3(工作負(fù)荷MCB(Pr 3))對(duì)于情況1(行1105)在固定頻率中和對(duì)于情況2(行1106)在自動(dòng)模式中在4個(gè)節(jié)點(diǎn)上運(yùn)行。

圖12顯示根據(jù)一個(gè)實(shí)施例的在圖11中顯示的混合模式配置的結(jié)果。曲線圖1200顯示對(duì)于情況1和情況2,用于三個(gè)作業(yè)的頻率對(duì)時(shí)間。曲線圖1201顯示對(duì)于情況1和情況2,用于三個(gè)作業(yè)的功耗對(duì)時(shí)間。曲線圖1202顯示對(duì)于情況1和情況2,用于三個(gè)作業(yè)的擱淺功率對(duì)時(shí)間。

如圖11和12中所示的,固定模式技術(shù)提供在相同時(shí)間為多個(gè)作業(yè)使用不同模式的靈活性,同時(shí)仍最大化作業(yè)性能。如圖11和12中所示的,作業(yè)3在情況1中在固定頻率模式中和在情況2中在自動(dòng)模式中運(yùn)行。在情況2中,作業(yè)1在38秒完結(jié)時(shí),由作業(yè)1騰出的功率提供了分配功率的另外功率余量,并且將作業(yè)3的頻率增大到2.9GHz。因此,作業(yè)3在自動(dòng)模式中比在固定頻率模式中更早完成(情況1)。曲線圖1201顯示在整個(gè)運(yùn)行上的功耗遵循類似于CPU頻率的模式。曲線圖1202顯示在情況1和情況2中的總功耗和產(chǎn)生的擱淺功率。如圖12中在情況1中所示的,系統(tǒng)未消耗所有可用功率,因此,擱淺功率高達(dá)620W,并且作業(yè)3遲完成。在情況2中,系統(tǒng)功耗穩(wěn)定并且接近1870W的PSYS值(其中擱淺功率只是大約340W),使得作業(yè)3更早完成。

圖13顯示示出根據(jù)一個(gè)實(shí)施例的具有同時(shí)運(yùn)行的在不同模式中的兩個(gè)作業(yè)的配置的表格1300。列1301顯示作業(yè)1對(duì)于情況1和2均在無功率限制的情況下在4個(gè)節(jié)點(diǎn)上運(yùn)行工作負(fù)荷MCB(Prl)。列1302顯示作業(yè)2在情況1中在固定頻率模式中(行1303)和在情況2在自動(dòng)模式中(行1304)在4個(gè)節(jié)點(diǎn)上運(yùn)行工作負(fù)荷MCB(Pr1)。如表格1300中所示的,情況1和2每個(gè)具有同時(shí)運(yùn)行的2個(gè)作業(yè)。兩種情況之間不同之處在于作業(yè)2在情況1中在2.0GHz的固定頻率中運(yùn)行和在情況2中在自動(dòng)模式中運(yùn)行。

圖14示出根據(jù)一個(gè)實(shí)施例的在圖13中顯示的配置上時(shí)變系統(tǒng)功率限制(Psys)的效應(yīng)。曲線圖1401示出對(duì)于情況1的頻率對(duì)時(shí)間。曲線圖1402示出對(duì)于情況2的頻率對(duì)時(shí)間。如圖14中所示的,在自動(dòng)模式中,在Psys隨時(shí)間更改時(shí),動(dòng)態(tài)調(diào)整用于每個(gè)作業(yè)的功率限額和均勻頻率設(shè)置。如曲線圖1401和1402中所示的,在Psys降低時(shí),在情況1中的作業(yè)2被暫停,而在情況2中的作業(yè)2繼續(xù)以在更低頻率運(yùn)行,并且比情況1中的作業(yè)2更早完結(jié)。

圖15顯示根據(jù)一個(gè)實(shí)施例的用于圖13中描繪的兩種情況的時(shí)變PSYS的效應(yīng)。曲線圖1501顯示對(duì)于情況1的消耗的總功率、擱淺功率和Psys對(duì)時(shí)間。曲線圖1502顯示對(duì)于情況2的消耗的總功率、擱淺功率和Psys對(duì)時(shí)間。如圖15中所示的,在情況2中,實(shí)際功耗更接近于時(shí)變PSYS,并且擱淺功率保持接近0。擱淺功率有時(shí)對(duì)于短的持續(xù)時(shí)間轉(zhuǎn)為負(fù)。PSYS是在較長(zhǎng)持續(xù)時(shí)間上保持的平均功率,而對(duì)于更短得多的持續(xù)時(shí)間監(jiān)視總功率。PSYS預(yù)期在更長(zhǎng)時(shí)間期上保持,并且只要更長(zhǎng)的時(shí)間平均值保持低于指定的系統(tǒng)功率限制,高于Psys的總功率的小漂移(excursion)是容許的。

圖16示出根據(jù)一個(gè)實(shí)施例的在自動(dòng)模式中運(yùn)行的到變化的Psys的作業(yè)的適應(yīng)性。曲線圖1601根據(jù)一個(gè)實(shí)施例的顯示用于在固定頻率中的作業(yè)的CPU頻率(曲線1604)、用于在自動(dòng)模式中的作業(yè)的CPU頻率(曲線1603)和Psys(曲線1605)對(duì)時(shí)間。如曲線圖1601中所示的,在Psys增大時(shí),增大了用于作業(yè)的CPU頻率。如曲線圖1601中所示的,在自動(dòng)模式中的作業(yè)比在固定頻率模式中的作業(yè)更早大約18%而完結(jié)。

曲線圖1602顯示根據(jù)一個(gè)實(shí)施例的總功耗(曲線1612)、在固定頻率模式中的作業(yè)的功耗(曲線1611)、在自動(dòng)模式中的作業(yè)的功耗(曲線1614)和Psys(曲線1613)對(duì)時(shí)間。如曲線圖1602中所示的,與在固定頻率模式中作業(yè)的完結(jié)時(shí)間相比,在自動(dòng)模式中作業(yè)的完結(jié)時(shí)間減小大約18%。與在固定頻率模式中作業(yè)的功耗相比,在自動(dòng)模式中作業(yè)的功耗增大大約17%。與在固定頻率模式中作業(yè)的能量相比,在自動(dòng)模式中與作業(yè)關(guān)聯(lián)的能量減小大約4%。

圖17是顯示根據(jù)一個(gè)實(shí)施例的對(duì)于相同工作負(fù)荷,用于在自動(dòng)模式中作業(yè)的頻率和用于在固定頻率模式中作業(yè)的頻率的比率對(duì)可用系統(tǒng)功率(Psys)的視圖。曲線1701、1702、1703、1704和1705對(duì)應(yīng)于具有不同工作負(fù)荷的不同作業(yè)。從無約束的工作負(fù)荷功率的大約50%到大約100%中選擇PSYS的范圍。如圖17中所示的,在自動(dòng)模式中運(yùn)行的作業(yè)使得頻率增大高達(dá)40%。在1200W與1700W之間無數(shù)據(jù)點(diǎn),這是因?yàn)樵谠摲秶凶鳂I(yè)只能夠在自動(dòng)模式中開始。如圖17中所示的,對(duì)于所有工作負(fù)荷,自動(dòng)模式性能優(yōu)于固定頻率模式。

圖18是顯示根據(jù)一個(gè)實(shí)施例的對(duì)于在自動(dòng)模式中的作業(yè)相對(duì)于在固定頻率模式中的作業(yè),完結(jié)時(shí)間的百分比增大的曲線圖1800。曲線1801、1802、1803、1804和1805對(duì)應(yīng)于具有不同工作負(fù)荷的不同作業(yè)。如圖18中所示的,所有工作負(fù)荷在自動(dòng)模式中比在固定頻率模式中更早完結(jié)。

圖19示出根據(jù)一個(gè)實(shí)施例的數(shù)據(jù)處理系統(tǒng)1900。數(shù)據(jù)處理系統(tǒng)處理1900表示如本文中相對(duì)于圖1-18所描述的,提供功率感知作業(yè)調(diào)度器和管理器的任何數(shù)據(jù)處理系統(tǒng)。在備選實(shí)施例中,數(shù)據(jù)處理系統(tǒng)1900可與局域網(wǎng)(LAN)、內(nèi)聯(lián)網(wǎng)、外聯(lián)網(wǎng)或因特網(wǎng)中其它機(jī)器連接(例如,聯(lián)網(wǎng))。數(shù)據(jù)處理系統(tǒng)1900可作為客戶端-服務(wù)器網(wǎng)絡(luò)環(huán)境中的服務(wù)器或客戶端機(jī)器操作,或者作為對(duì)等(或分布式)網(wǎng)絡(luò)環(huán)境中的對(duì)等機(jī)器操作。

數(shù)據(jù)處理系統(tǒng)1900可以是個(gè)人計(jì)算機(jī)(PC)、平板PC、機(jī)頂盒(STB)、個(gè)人數(shù)字助理(PDA)、蜂窩電話、web設(shè)備、服務(wù)器、網(wǎng)絡(luò)路由器、交換機(jī)或橋接器或能夠執(zhí)行要由該數(shù)據(jù)處理系統(tǒng)采取的動(dòng)作的指令集(有序或另外的)的任何機(jī)器。此外,雖然只示出單個(gè)數(shù)據(jù)處理系統(tǒng),但術(shù)語“數(shù)據(jù)處理系統(tǒng)”也應(yīng)視為包括單獨(dú)或聯(lián)合執(zhí)行指令集(或多個(gè)指令集)以執(zhí)行本文中所描述的任何一個(gè)或多個(gè)方法論的數(shù)據(jù)處理系統(tǒng)的任何集合。

處理器1904表示一個(gè)或更多個(gè)通用處理裝置,如微處理器、中央處理單元或其它處理裝置。更具體地說,處理器1904可以是復(fù)雜指令集計(jì)算(CISC)微處理器、精簡(jiǎn)指令集計(jì)算(RISC)微處理器、超長(zhǎng)指令字(VLIW)微處理器、實(shí)現(xiàn)其它指令集的處理器或?qū)崿F(xiàn)指令集的組合的處理器。處理器1904也可以是一個(gè)或多個(gè)專用處理裝置,如專用集成電路(ASIC)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、數(shù)字信號(hào)處理器(DSP)、網(wǎng)絡(luò)處理器或諸如此類。處理器1904配置成控制處理邏輯以便執(zhí)行本文中相對(duì)于圖1-18描述的操作。

數(shù)據(jù)處理系統(tǒng)1900可包括多個(gè)組件。在一個(gè)實(shí)施例中,這些組件附連到一個(gè)或更多個(gè)母板。在備選實(shí)施例中,這些組件制作在單個(gè)片上系統(tǒng)(SoC)管芯而不是母板上。數(shù)據(jù)處理系統(tǒng)1900中的組件包括但不限于集成電路管芯1902和至少一個(gè)通信芯片1908。在一些實(shí)施中,通信芯片1908制作為集成電路管芯1902的一部分。集成電路管芯1902可包括處理器1904、經(jīng)常用做高速緩沖存儲(chǔ)器的能夠通過諸如嵌入式DRAM(eDRAM)或自旋轉(zhuǎn)力矩存儲(chǔ)器(STTM或STTM-RAM)等技術(shù)提供的管芯上存儲(chǔ)器1906。

數(shù)據(jù)處理系統(tǒng)1900可包括其它組件,其可以或可以不物理和電耦合到母板,或者制作于SoC管芯內(nèi)。這些其它組件包括但不限于易失性存儲(chǔ)器1910(例如,DRAM)、非易失性存儲(chǔ)器1912(例如,ROM或閃存存儲(chǔ)器)、圖形處理單元1914(GPU)、數(shù)字信號(hào)處理器1916、密碼處理器1942(在硬件內(nèi)執(zhí)行加密算法的專用處理器)、芯片集1920、天線1922、顯示器或觸摸屏顯示器1924、觸摸屏控制器1926、電池1928或其它電源、功率放大器(PA)1944、全球定位系統(tǒng)(GPS)裝置1928、羅盤1930、一個(gè)或更多個(gè)傳感器1932(可包括功率傳感器以測(cè)量節(jié)點(diǎn)消耗的功率、系統(tǒng)消耗的功率或兩者;運(yùn)動(dòng)傳感器或其它傳感器)、揚(yáng)聲器1934、攝像頭1936、用戶輸入裝置1938(如鍵盤、鼠標(biāo)、輸入筆和觸摸板)及海量存儲(chǔ)裝置1940(如硬盤驅(qū)動(dòng)器、光盤(CD)、數(shù)字多功能盤(DVD)等等)。

通信芯片1908實(shí)現(xiàn)無線通信用于向數(shù)據(jù)處理系統(tǒng)1900傳送數(shù)據(jù)和傳送來自數(shù)據(jù)處理系統(tǒng)1900的數(shù)據(jù)。術(shù)語“無線”及其衍生詞可用于描述可通過非固態(tài)介質(zhì),使用調(diào)制的電磁輻射傳遞數(shù)據(jù)的電路、裝置、系統(tǒng)、方法、技術(shù)、通信信道等。該術(shù)語不暗示相關(guān)聯(lián)裝置不包含任何導(dǎo)線,盡管在一些實(shí)施例中,它們可能不包含。通信芯片1908可實(shí)現(xiàn)多種無線標(biāo)準(zhǔn)或協(xié)議的任何標(biāo)準(zhǔn)或協(xié)議,包括但不限于Wi-Fi(IEEE 802.11族)、WiMAX(IEEE 802.16族)、IEEE 802.20、長(zhǎng)期演進(jìn)(LTE)、Ev-DO、HSPA+、HSDPA+、HSUPA+、EDGE、GSM、GPRS、CDMA、TDMA、DECT、藍(lán)牙、其衍生物及指定為3G、4G、5G和之外的任何其它無線協(xié)議。數(shù)據(jù)處理系統(tǒng)1900可包括多個(gè)通信芯片1908。例如,第一通信芯片1908可專用于諸如Wi-Fi和藍(lán)牙等更短范圍的無線通信,并且第二通信芯片1908可專用于諸如GPS、EDGE、GPRS、CDMA、WiMAX、LTE、Ev-DO及其它等更遠(yuǎn)范圍的無線通信。

術(shù)語“處理器”可指處理來自寄存器和/或存儲(chǔ)器的電子數(shù)據(jù)以將該電子數(shù)據(jù)變換成可在寄存器和/或存儲(chǔ)器中存儲(chǔ)的其它電子數(shù)據(jù)的任何裝置或部分的裝置。

在各種實(shí)施例中,數(shù)據(jù)處理系統(tǒng)1900可以是膝上型計(jì)算機(jī)、上網(wǎng)本計(jì)算機(jī)、筆記本計(jì)算機(jī)、超級(jí)本計(jì)算機(jī)、智能電話、平板、個(gè)人數(shù)字助理(PDA)、超極移動(dòng)PC、移動(dòng)電話、桌上型計(jì)算機(jī)、服務(wù)器、打印機(jī)、掃描儀、監(jiān)視器、機(jī)頂盒、娛樂控制器、數(shù)碼相機(jī)、便攜式音樂播放器或數(shù)碼攝像機(jī)。在其它實(shí)施中,數(shù)據(jù)處理系統(tǒng)1900可以是處理數(shù)據(jù)的任何其它電子裝置。

海量存儲(chǔ)裝置1940可包括機(jī)器可存取的存儲(chǔ)介質(zhì)(或更具體地說,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì))1945,在該介質(zhì)上存儲(chǔ)有實(shí)施本文中描述的任何一個(gè)或更多個(gè)方法論或功能的一個(gè)或更多個(gè)指令集(例如,軟件)。軟件也可在其由數(shù)據(jù)處理系統(tǒng)1900執(zhí)行期間完全或至少部分駐留在存儲(chǔ)器1910、存儲(chǔ)器1912、存儲(chǔ)器1906內(nèi)和/或在處理器1904內(nèi),管芯上存儲(chǔ)器1906和處理器1904也構(gòu)成機(jī)器可讀存儲(chǔ)媒體。軟件可還經(jīng)網(wǎng)絡(luò)接口裝置通過網(wǎng)絡(luò)傳送或接收。

雖然機(jī)器可存取的存儲(chǔ)介質(zhì)1944在示范實(shí)施例中顯示為單個(gè)介質(zhì),但術(shù)語“機(jī)器可讀介質(zhì)”應(yīng)視為包括存儲(chǔ)一個(gè)或更多個(gè)指令集的單個(gè)介質(zhì)或多個(gè)媒體(例如,集中式或分布式數(shù)據(jù)庫(kù)和/或關(guān)聯(lián)的高速緩存和服務(wù)器)。術(shù)語“機(jī)器可讀存儲(chǔ)介質(zhì)”也應(yīng)視為包括能夠存儲(chǔ)或編碼指令集以便由機(jī)器執(zhí)行和使機(jī)器執(zhí)行本發(fā)明的任何一個(gè)或多個(gè)方法論的任何介質(zhì)。術(shù)語“機(jī)器可讀存儲(chǔ)介質(zhì)”應(yīng)相應(yīng)地視為包括但不限于固態(tài)存儲(chǔ)器和光與磁媒體。

本發(fā)明所示實(shí)施的上述描述,包括摘要中所描述的東西不打算是詳盡的或限制本發(fā)明到公開的準(zhǔn)確形式。雖然為了說明的目的而在本文描述了本發(fā)明的特定實(shí)施和示例,但如相關(guān)領(lǐng)域的技術(shù)人中將認(rèn)識(shí)到的,在本發(fā)明范圍內(nèi)各種等效修改是可能的。

考慮到以上詳細(xì)描述,可對(duì)本發(fā)明進(jìn)行這些修改。隨附權(quán)利要求中使用的術(shù)語不應(yīng)視為限制本發(fā)明到說明書和權(quán)利要求中公開的特定實(shí)施。相反,本發(fā)明的范圍要完全由隨附權(quán)利要求確定,權(quán)利要求要根據(jù)權(quán)利要求解釋的確立原則來理解。

以下示例涉及其它實(shí)施例:

一種操作數(shù)據(jù)處理系統(tǒng)的方法,包括接收用于作業(yè)的模式的指示,基于模式,確定用于作業(yè)的可用功率,以及基于可用功率,分配用于作業(yè)的第一功率。

一種操作數(shù)據(jù)處理系統(tǒng)的方法,包括接收用于作業(yè)的模式的指示,基于模式,確定用于作業(yè)的可用功率,并且基于可用功率,確定用于作業(yè)的第一頻率,以及基于第一頻率,分配用于作業(yè)的第一功率。

一種操作數(shù)據(jù)處理系統(tǒng)的方法,包括接收用于作業(yè)的模式的指示,基于模式,確定用于作業(yè)的可周功率,基于可用功率,分配用于作業(yè)的第一功率,以及調(diào)整第一功率。

一種操作數(shù)據(jù)處理系統(tǒng)的方法,包括接收用于作業(yè)的模式的指示,基于模式,確定用于作業(yè)的可周功率,確定用于作業(yè)的要求的功率的量,以及基于可用功率和要求的功率至少之一,分配用于作業(yè)的第一功率。

一種操作數(shù)據(jù)處理系統(tǒng)的方法,包括接收用于作業(yè)的模式的指示,基于模式,確定用于作業(yè)的可用功率,以及基于可用功率,分配用于作業(yè)的第一功率,其中基于監(jiān)視的功率、估計(jì)的功率和校準(zhǔn)的功率至少之一,確定可用功率。

一種操作數(shù)據(jù)處理系統(tǒng)的方法,包括接收用于作業(yè)的模式的指示,基于模式,確定用于作業(yè)的可用功率,以及基于可用功率,分配用于作業(yè)的第一功率,其中基于用于作業(yè)的平均功率,確定第一功率。

一種操作數(shù)據(jù)處理系統(tǒng)的方法,包括接收用于作業(yè)的模式的指示,基于模式,確定用于作業(yè)的可用功率,以及基于可用功率,分配用于作業(yè)的第一功率,其中模式包括有關(guān)作業(yè)是否遭受功率限制的指示、有關(guān)用于作業(yè)的功率策略的指示、有關(guān)用于作業(yè)的暫停策略的指示或其任何組合。

一種提供功率感知作業(yè)調(diào)度器和管理器的方法,包括確定用于第一作業(yè)的可用功率;基于可用功率,確定用于第一作業(yè)的第一頻率;以及基于第一頻率,分配用于第一作業(yè)的第一功率。

一種提供功率感知作業(yè)調(diào)度器和管理器的方法,包括確定用于第一作業(yè)的可用功率;基于可用功率,確定用于第一作業(yè)的第一頻率;以及基于第一頻率,分配用于第一作業(yè)的第一功率,其中第一頻率在運(yùn)行第一作業(yè)的多個(gè)節(jié)點(diǎn)上使用。

一種提供功率感知作業(yè)調(diào)度器和管理器的方法,包括確定用于第一作業(yè)的可用功率;基于可用功率,確定用于第一作業(yè)的第一頻率;以及基于第一頻率,分配用于第一作業(yè)的第一功率;監(jiān)視一個(gè)或更多個(gè)第二作業(yè);以及基于監(jiān)視,調(diào)整第一功率。

一種提供功率感知作業(yè)調(diào)度器和管理器的方法,包括接收用于第一作業(yè)的模式的指示;基于模式,確定用于第一作業(yè)的可用功率;基于可用功率,確定用于第一作業(yè)的第一頻率;以及基于第一頻率,分配用于第一作業(yè)的第一功率。

一種提供功率感知作業(yè)調(diào)度器和管理器的方法,包括確定用于第一作業(yè)的可用功率;基于可用功率,確定用于第一作業(yè)的第一頻率;以及基于第一頻率,分配用于第一作業(yè)的第一功率;如果分配的功率大于第一閾值,則減小第一頻率;以及如果分配的功率小于第二閾值,則增大第一頻率。

一種非暫時(shí)性機(jī)器可讀介質(zhì),包括使數(shù)據(jù)處理系統(tǒng)執(zhí)行操作的指令,操作包括接收用于作業(yè)的模式的指示,基于模式,確定用于作業(yè)的可用功率,以及基于可用功率,分配用于作業(yè)的第一功率。

一種非暫時(shí)性機(jī)器可讀介質(zhì),包括使數(shù)據(jù)處理系統(tǒng)執(zhí)行操作的指令,操作包括接收用于作業(yè)的模式的指示,基于模式,確定用于作業(yè)的可用功率,并且基于可用功率,確定用于作業(yè)的第一頻率,以及基于第一頻率,分配用于作業(yè)的第一功率。

一種非暫時(shí)性機(jī)器可讀介質(zhì),包括使數(shù)據(jù)處理系統(tǒng)執(zhí)行操作的指令,操作包括接收用于作業(yè)的模式的指示,基于模式,確定用于作業(yè)的可用功率,基于可用功率,分配用于作業(yè)的第一功率,以及調(diào)整第一功率。

一種非暫時(shí)性機(jī)器可讀介質(zhì),包括使數(shù)據(jù)處理系統(tǒng)執(zhí)行操作的指令,操作包括接收用于作業(yè)的模式的指示,基于模式,確定用于作業(yè)的可用功率,確定用于作業(yè)的要求的功率的量,以及基于可用功率和要求的功率至少之一,分配用于作業(yè)的第一功率。

一種非暫時(shí)性機(jī)器可讀介質(zhì),包括使數(shù)據(jù)處理系統(tǒng)執(zhí)行操作的指令,操作包括接收用于作業(yè)的模式的指示,基于模式,確定用于作業(yè)的可用功率,以及基于可用功率,分配用于作業(yè)的第一功率,其中基于監(jiān)視的功率、估計(jì)的功率和校準(zhǔn)的功率至少之一,確定可用功率。

一種非暫時(shí)性機(jī)器可讀介質(zhì),包括使數(shù)據(jù)處理系統(tǒng)執(zhí)行操作的指令,操作包括接收用于作業(yè)的模式的指示,基于模式,確定用于作業(yè)的可用功率,以及基于可用功率,分配用于作業(yè)的第一功率,其中基于用于作業(yè)的平均功率,確定第一功率。

一種非暫時(shí)性機(jī)器可讀介質(zhì),包括使數(shù)據(jù)處理系統(tǒng)執(zhí)行操作的指令,操作包括接收用于作業(yè)的模式的指示,基于模式,確定用于作業(yè)的可用功率,以及基于可用功率,分配用于作業(yè)的第一功率,其中模式包括有關(guān)作業(yè)是否遭受功率限制的指示、有關(guān)用于作業(yè)的功率策略的指示、有關(guān)用于作業(yè)的暫停策略的指示或其任何組合。

一種非暫時(shí)性機(jī)器可讀介質(zhì),包括使數(shù)據(jù)處理系統(tǒng)執(zhí)行操作的指令,操作包括確定用于第一作業(yè)的可用功率;基于可用功率,確定用于第一作業(yè)的第一頻率;以及基于第一頻率,分配用于第一作業(yè)的第一功率。

一種非暫時(shí)性機(jī)器可讀介質(zhì),包括使數(shù)據(jù)處理系統(tǒng)執(zhí)行操作的指令,操作包括確定用于第一作業(yè)的可用功率;基于可用功率,確定用于第一作業(yè)的第一頻率;以及基于第一頻率,分配用于第一作業(yè)的第一功率,其中第一頻率在運(yùn)行第一作業(yè)的多個(gè)節(jié)點(diǎn)上使用。

一種非暫時(shí)性機(jī)器可讀介質(zhì),包括使數(shù)據(jù)處理系統(tǒng)執(zhí)行操作的指令,操作包括確定用于第一作業(yè)的可用功率,基于可用功率,確定用于第一作業(yè)的第一頻率,基于第一頻率,分配用于第一作業(yè)的第一功率,監(jiān)視一個(gè)或更多個(gè)第二作業(yè),以及基于監(jiān)視,調(diào)整第一功率。

一種非暫時(shí)性機(jī)器可讀介質(zhì),包括使數(shù)據(jù)處理系統(tǒng)執(zhí)行操作的指令,操作包括接收用于第一作業(yè)的模式的指示;基于模式,確定用于第一作業(yè)的可用功率;基于可用功率,確定用于第一作業(yè)的第一頻率;以及基于第一頻率,分配用于第一作業(yè)的第一功率。

一種非暫時(shí)性機(jī)器可讀介質(zhì),包括使數(shù)據(jù)處理系統(tǒng)執(zhí)行操作的指令,操作包括確定用于第一作業(yè)的可用功率;基于可用功率,確定用于第一作業(yè)的第一頻率;以及基于第一頻率,分配用于第一作業(yè)的第一功率;如果分配的功率大于第一閾值,則減小第一頻率,以及如果分配的功率小于第二閾值,則增大第一頻率。

一種數(shù)據(jù)處理系統(tǒng),包括存儲(chǔ)器和耦合到存儲(chǔ)器的處理器,其中處理器配置成接收用于作業(yè)的模式的指示;基于模式,確定用于作業(yè)的可用功率;以及基于可用功率,分配用于作業(yè)的第一功率。

一種數(shù)據(jù)處理系統(tǒng),包括存儲(chǔ)器和耦合到存儲(chǔ)器的處理器,其中處理器將接收用于作業(yè)的模式的指示;基于模式,確定用于作業(yè)的可用功率;基于可用功率,確定用于作業(yè)的第一頻率;以及基于第一頻率,分配用于作業(yè)的第一功率。

一種數(shù)據(jù)處理系統(tǒng),包括存儲(chǔ)器和耦合到存儲(chǔ)器的處理器,其中處理器將接收用于作業(yè)的模式的指示;基于模式,確定用于作業(yè)的可用功率;基于可用功率,分配用于作業(yè)的第一功率;以及調(diào)整第一功率。

一種數(shù)據(jù)處理系統(tǒng),包括存儲(chǔ)器和耦合到存儲(chǔ)器的處理器,其中處理器將接收用于作業(yè)的模式的指示;基于模式,確定用于作業(yè)的可用功率;確定用于作業(yè)的要求的功率的量;以及基于可用功率和要求的功率至少之一,分配用于作業(yè)的第一功率。

一種數(shù)據(jù)處理系統(tǒng),包括存儲(chǔ)器和耦合到存儲(chǔ)器的處理器,其中處理器將接收用于作業(yè)的模式的指示;基于模式,確定用于作業(yè)的可用功率;基于可用功率,分配用于作業(yè)的第一功率,其中基于監(jiān)視的功率、估計(jì)的功率和校準(zhǔn)的功率至少之一,確定可用功率。

一種數(shù)據(jù)處理系統(tǒng),包括存儲(chǔ)器和耦合到存儲(chǔ)器的處理器,其中處理器將接收用于作業(yè)的模式的指示;基于模式,確定用于作業(yè)的可用功率;基于可用功率,分配用于作業(yè)的第一功率,其中基于用于作業(yè)的平均功率,確定第一功率。

一種數(shù)據(jù)處理系統(tǒng),包括存儲(chǔ)器和耦合到存儲(chǔ)器的處理器,其中處理器將接收用于作業(yè)的模式的指示;基于模式,確定用于作業(yè)的可用功率;基于可用功率,分配用于作業(yè)的第一功率,其中模式包括有關(guān)作業(yè)是否遭受功率限制的指示、有關(guān)用于作業(yè)的功率策略的指示、有關(guān)用于作業(yè)的暫停策略的指示或其任何組合。

一種數(shù)據(jù)處理系統(tǒng),包括存儲(chǔ)器和耦合到存儲(chǔ)器的處理器,其中處理器將確定用于第一作業(yè)的可用功率;基于可用功率,確定用于第一作業(yè)的第一頻率;以及基于第一頻率,分配用于第一作業(yè)的第一功率。

一種數(shù)據(jù)處理系統(tǒng),包括存儲(chǔ)器和耦合到存儲(chǔ)器的處理器,其中處理器將確定用于第一作業(yè)的可用功率;基于可用功率,確定用于第一作業(yè)的第一頻率;以及基于第一頻率,分配用于第一作業(yè)的第一功率;其中第一頻率在運(yùn)行第一作業(yè)的多個(gè)節(jié)點(diǎn)上使用。

一種數(shù)據(jù)處理系統(tǒng),包括存儲(chǔ)器和耦合到存儲(chǔ)器的處理器,其中處理器將確定用于第一作業(yè)的可用功率;基于可用功率,確定用于第一作業(yè)的第一頻率;基于第一頻率,分配用于第一作業(yè)的第一功率;監(jiān)視一個(gè)或更多個(gè)第二作業(yè);以及基于監(jiān)視,調(diào)整第一功率。

一種數(shù)據(jù)處理系統(tǒng),包括存儲(chǔ)器和耦合到存儲(chǔ)器的處理器,其中處理器將接收用于第一作業(yè)的模式的指示;基于模式,確定用于第一作業(yè)的可用功率;基于可用功率,確定用于第一作業(yè)的第一頻率;以及基于第一頻率,分配用于第一作業(yè)的第一功率。

一種數(shù)據(jù)處理系統(tǒng),包括存儲(chǔ)器和耦合到存儲(chǔ)器的處理器,其中處理器將確定用于第一作業(yè)的可用功率;基于可用功率,確定用于第一作業(yè)的第一頻率;基于第一頻率,分配用于第一作業(yè)的第一功率;如果分配的功率大于第一閾值,則減小第一頻率;以及如果分配的功率小于第二閾值,則增大第一頻率。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定分配到系統(tǒng)的功率;確定系統(tǒng)消耗的功率;識(shí)別作業(yè);以及至少基于系統(tǒng)消耗的功率,分配功率到識(shí)別的作業(yè)。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定分配到系統(tǒng)的功率;確定系統(tǒng)消耗的功率;如果系統(tǒng)消耗的功率小于分配到系統(tǒng)的功率,則識(shí)別作業(yè);以及至少基于系統(tǒng)消耗的功率,分配功率到識(shí)別的作業(yè)。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定分配到系統(tǒng)的功率;確定系統(tǒng)消耗的功率;識(shí)別作業(yè),其中識(shí)別作業(yè)包括確定相對(duì)于一個(gè)或更多個(gè)其它作業(yè)的用于作業(yè)的優(yōu)先級(jí),并且基于優(yōu)先級(jí),選擇作業(yè);以及至少基于系統(tǒng)消耗的功率,分配功率到作業(yè)。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定分配到系統(tǒng)的功率;確定系統(tǒng)消耗的功率;如果系統(tǒng)消耗的功率大于分配到系統(tǒng)的功率,則識(shí)別作業(yè);以及降低分配到識(shí)別的作業(yè)的功率。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定分配到系統(tǒng)的功率;確定系統(tǒng)消耗的功率;識(shí)別作業(yè);確定識(shí)別的作業(yè)的模式;以及至少基于系統(tǒng)消耗的功率和該模式,分配功率到識(shí)別的作業(yè)。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定用于系統(tǒng)的多余功率;確定作業(yè)消耗的當(dāng)前功率,以及基于多余功率和當(dāng)前功率至少之一,分配用于作業(yè)的另外功率。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定用于系統(tǒng)的多余功率;識(shí)別相對(duì)于其它運(yùn)行的作業(yè)的具有最高優(yōu)先級(jí)的作業(yè),確定識(shí)別的作業(yè)消耗的當(dāng)前功率,以及基于多余功率和當(dāng)前功率至少之一,分配用于識(shí)別的作業(yè)的另外功率。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定用于系統(tǒng)的多余功率;確定作業(yè)消耗的當(dāng)前功率;確定用于作業(yè)的當(dāng)前頻率;基于多余功率和當(dāng)前功率至少之一,分配用于作業(yè)的另外功率;以及增大當(dāng)前頻率。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定用于系統(tǒng)的多余功率,其中多余功率被確定為在分配到系統(tǒng)的功率、系統(tǒng)消耗的功率與功率保護(hù)帶之間的差;確定作業(yè)消耗的當(dāng)前功率,以及基于多余功率和當(dāng)前功率至少之一,分配用于作業(yè)的另外功率。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定用于系統(tǒng)的多余功率;確定第一作業(yè)消耗的當(dāng)前功率,并且基于多余功率和當(dāng)前功率至少之一,分配用于第一作業(yè)的另外功率,以及分配用于第二作業(yè)的另外功率。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定用于系統(tǒng)的功率降低;以及基于用于系統(tǒng)的功率降低,降低用于作業(yè)的功率分配。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定用于系統(tǒng)的功率降低;確定作業(yè)的模式;以及基于用于系統(tǒng)的功率降低和基于模式,降低用于作業(yè)的功率分配。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定用于系統(tǒng)的功率降低;識(shí)別相對(duì)于其它作業(yè)的具有最低優(yōu)先級(jí)的作業(yè),以及基于用于系統(tǒng)的功率降低,降低用于識(shí)別的作業(yè)的功率分配。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定用于系統(tǒng)的功率降低;確定用于作業(yè)的操作頻率,以及基于操作頻率,降低用于作業(yè)的功率分配。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定用于系統(tǒng)的功率降低;確定運(yùn)行作業(yè)的節(jié)點(diǎn)的數(shù)量;以及基于節(jié)點(diǎn)的數(shù)量,降低用于作業(yè)的功率分配。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括監(jiān)視一個(gè)或更多個(gè)第一作業(yè),確定用于第二作業(yè)的功率估計(jì);以及基于功率估計(jì),降低用于一個(gè)或更多個(gè)第一作業(yè)的功率分配以適應(yīng)第二作業(yè)。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括監(jiān)視一個(gè)或更多個(gè)第一作業(yè),確定用于第二作業(yè)的功率估計(jì);識(shí)別一個(gè)或更多個(gè)第一作業(yè)的優(yōu)先級(jí);基于優(yōu)先級(jí)和功率估計(jì),降低用于一個(gè)或更多個(gè)第一作業(yè)的功率分配以適應(yīng)第二作業(yè)。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括監(jiān)視一個(gè)或更多個(gè)第一作業(yè),確定一個(gè)或更多個(gè)第一作業(yè)的操作頻率;確定用于第二作業(yè)的功率估計(jì);以及基于操作頻率和功率估計(jì),降低用于一個(gè)或更多個(gè)第一作業(yè)的功率分配以適應(yīng)第二作業(yè)。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括監(jiān)視一個(gè)或更多個(gè)第一作業(yè),確定用于第二作業(yè)的功率估計(jì);確定用于系統(tǒng)的可用功率;以及基于功率估計(jì)和可用功率,降低用于一個(gè)或更多個(gè)第一作業(yè)的功率分配以適應(yīng)第二作業(yè)。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括監(jiān)視一個(gè)或更多個(gè)第一作業(yè),確定用于第二作業(yè)的功率估計(jì);以及基于功率估計(jì),降低用于一個(gè)或更多個(gè)第一作業(yè)的功率分配以適應(yīng)第二作業(yè),其中第二作業(yè)是新作業(yè)和暫停的作業(yè)之一。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定作業(yè)的操作頻率;確定用于作業(yè)的功率降低;以及基于功率降低,降低用于作業(yè)的分配的功率。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定作業(yè)的操作頻率;如果在消耗的系統(tǒng)功率與分配的系統(tǒng)功率之間的差小于預(yù)確定的閾值,則確定用于作業(yè)的功率降低;以及基于功率降低,降低用于作業(yè)的分配的功率。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定作業(yè)的操作頻率;如果操作頻率大于最低頻率,則確定用于作業(yè)的功率降低;以及基于功率降低,降低用于作業(yè)的分配的功率。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定第一作業(yè)的操作頻率;確定用于第一作業(yè)的功率降低;確定用于第二作業(yè)的功率降低,以及基于功率降低,降低用于第一作業(yè)和第二作業(yè)至少之一的分配的功率。

一種管理用于數(shù)據(jù)處理系統(tǒng)的功率的方法,包括確定作業(yè)的操作頻率;確定用于作業(yè)的功率降低,其中至少基于系統(tǒng)消耗的功率、分配到系統(tǒng)的功率和系統(tǒng)保護(hù)帶,確定功率降低;以及基于功率降低,降低用于作業(yè)的分配的功率。

在前面所述說明書中,方法和設(shè)備已參照其特定示范實(shí)施例描述。將明白的是,在不脫離如隨附權(quán)利要求中陳述的實(shí)施例的更廣的精神和范圍的情況下,可對(duì)其進(jìn)行各種修改。相應(yīng)地,說明書和附圖要以說明性而不是限制性的意義來理解。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1