專利名稱:控制計(jì)算資源的技術(shù)的制作方法
控制計(jì)算資源的技術(shù)
背景技術(shù):
本發(fā)明的實(shí)施方式一般涉及信息處理領(lǐng)域,更具體地涉及在計(jì)算系統(tǒng)和微處理器 中分配資源的領(lǐng)域。
背景技術(shù):
在計(jì)算機(jī)系統(tǒng)或者處理器中分配資源可能是困難的。例如,在某些計(jì)算機(jī)系統(tǒng)中, 如果資源諸如高速緩存空間、存儲(chǔ)器、執(zhí)行資源等以“靜態(tài)”方式(即,不響應(yīng)資源需求的變 化而改變)分配,則計(jì)算機(jī)系統(tǒng)或處理器會(huì)對(duì)某些進(jìn)程或線程服務(wù)不足而對(duì)其它進(jìn)程或線 程過度服務(wù)。然而,甚至于在某些現(xiàn)有技術(shù)的“動(dòng)態(tài)”資源分配方案中(即那些試圖對(duì)其所 服務(wù)的線程、進(jìn)程等的需求的變化做出響應(yīng)的),以與動(dòng)態(tài)資源分配相關(guān)聯(lián)的開銷得到由這 種分配所產(chǎn)生的性能利益可能并不值得。因此,改善的資源分配機(jī)制應(yīng)既能提高處理器或 計(jì)算系統(tǒng)性能又不引致可能使分配方案的利益被抹殺的開銷。附圖簡述本發(fā)明的實(shí)施例在各附圖的插圖中是作為示例而非作為限制而示出的,在附圖中 相同的附圖標(biāo)記指代相同的元件,其中
圖1是微處理器的方塊圖,本發(fā)明的至少一個(gè)實(shí)施方式可在其中使用;圖2是共享總線計(jì)算機(jī)系統(tǒng)的方塊圖,本發(fā)明的至少一個(gè)實(shí)施方式可在其中使 用;圖3是點(diǎn)對(duì)點(diǎn)互連計(jì)算機(jī)系統(tǒng)的方塊圖,本發(fā)明的至少一個(gè)實(shí)施方式可在其中使 用;圖4是邏輯的方塊圖,本發(fā)明的至少一個(gè)實(shí)施方式可在其中實(shí)現(xiàn);圖5是可以用來執(zhí)行本發(fā)明的至少一個(gè)實(shí)施方式的操作的流程圖。詳細(xì)描述本發(fā)明的實(shí)施方式涉及改善總體系統(tǒng)或處理性能而不引致會(huì)抹殺本文中描述的 資源分配技術(shù)的利益的開銷的動(dòng)態(tài)資源分配技術(shù)。在一些實(shí)施方式中,動(dòng)態(tài)資源分配方案 可以應(yīng)用于多種不同的處理資源如在線程間的高速緩存分配、存儲(chǔ)器資源、和執(zhí)行資源。為 了說明的目的,以下描述將主要集中于將依照本發(fā)明的至少一個(gè)實(shí)施方式的資源分配技術(shù) 應(yīng)用于由兩個(gè)或更多個(gè)線程共享的高速緩存資源的示例。然而,這里描述的實(shí)施方式也可 以應(yīng)用于除在此特別討論的那些以外的其它計(jì)算資源以及其它數(shù)目的線程。在一個(gè)實(shí)施方式中,用基于梯度的分割算法(GPA)在多個(gè)線程間分配高速緩存空 間。在一個(gè)實(shí)施方式中,GPA使用狀態(tài)機(jī)、每個(gè)數(shù)據(jù)類(例如流數(shù)據(jù)、重用數(shù)據(jù)等)三個(gè)寄存 器、以及四個(gè)不依賴于數(shù)據(jù)類的全局寄存器。在一個(gè)實(shí)施方式中,GPA使用梯度下降(或稱 “爬山”)算法的變型尋找共享資源的最優(yōu)分配,在該變型中,對(duì)于每一個(gè)數(shù)據(jù)類進(jìn)行實(shí)驗(yàn), 將所議資源先是遞增然后遞減地給予該數(shù)據(jù)類。GPA然后測定這兩種情景下的“全局良好 性”度量,并根據(jù)該實(shí)驗(yàn)給所議數(shù)據(jù)類分配該資源的額定配給量。在一個(gè)實(shí)施方式中,GPA 用切爾諾夫界(Chernoff bounds)來判定何時(shí)調(diào)整資源的分割,但在其它實(shí)施方式中,可以
4使用其它算法來確定何時(shí)調(diào)整資源的分割。此外,在一個(gè)實(shí)施方式中,可以通過將實(shí)驗(yàn)進(jìn)程 分割成跨處理循環(huán)來并發(fā)地針對(duì)每個(gè)數(shù)據(jù)類進(jìn)行上述實(shí)驗(yàn)(例如,對(duì)于帶寬或功率管理而 言是時(shí)間復(fù)用,而對(duì)于高速緩存或預(yù)取管理而言是存儲(chǔ)空間分割)。在一些實(shí)施方式中,將GPA應(yīng)用于共享資源的多處理器系統(tǒng)或多核處理器可以實(shí) 現(xiàn)比現(xiàn)有技術(shù)系統(tǒng)更高的性能和較低的功耗,部分是由于事實(shí)上一些實(shí)施方式在持續(xù)性 基礎(chǔ)上主動(dòng)地優(yōu)化資源管理。因此,這些實(shí)施方式可以使電池壽命延長、每個(gè)刀片處理器 (blade)有更高的性能、高密度云計(jì)算等。例如,在一些計(jì)算環(huán)境中,比如那些使用服務(wù)器處理器的系統(tǒng)中,有些數(shù)據(jù)被重用 (例如分組報(bào)頭、路由表、指令數(shù)據(jù)、操作系統(tǒng)狀態(tài)、其它像統(tǒng)計(jì)數(shù)據(jù)等元數(shù)據(jù),等等),而有 些數(shù)據(jù)被流化(例如分組主體信息)。使用不是依照有些實(shí)施方式管理的高速緩存會(huì)使重 用數(shù)據(jù)無用,因?yàn)樗械闹赜脭?shù)據(jù)會(huì)在其有機(jī)會(huì)被重用之前被流數(shù)據(jù)逐出。在一個(gè)實(shí)施方 式中,GPA可以動(dòng)態(tài)地確定哪些數(shù)據(jù)要保留在高速緩存中而哪些數(shù)據(jù)要進(jìn)行流化,甚至在某 個(gè)應(yīng)用中可以確定哪些數(shù)據(jù)是以不具備因知曉體系結(jié)構(gòu)而實(shí)現(xiàn)的優(yōu)化的情況下所寫的,這 在諸如虛擬機(jī)場(farm)等應(yīng)用中很有用,其中的應(yīng)用既不知處理體系結(jié)構(gòu)也不知在同一 機(jī)器運(yùn)行的其它應(yīng)用。圖1示出一種微處理器,本發(fā)明的至少一個(gè)實(shí)施方式可在其中使用。特別地,圖1 示出微處理器100具有一個(gè)或更多個(gè)處理器核105和110,各自分別具有與其相關(guān)聯(lián)的本地 高速緩存107和113。在圖1中還示出共享高速緩存存儲(chǔ)器115,其可以存儲(chǔ)在本地高速緩 存107和113各自中存儲(chǔ)的信息的至少一些信息的各版本。在一些實(shí)施方式中,微處理器 100還可包含其它未在圖1中示出的邏輯,比如集成式存儲(chǔ)器控制器、集成式圖形控制器、 以及在計(jì)算機(jī)系統(tǒng)中執(zhí)行其它功能的其它邏輯如I/O控件。在一個(gè)實(shí)施方式中,多處理器 系統(tǒng)中的每個(gè)微處理器或者多核處理器中的每個(gè)處理器核可以包含或者以其它方式與邏 輯119相關(guān)聯(lián)以依照至少一個(gè)實(shí)施方式啟用計(jì)算資源分配技術(shù)。邏輯可以包含電路、軟件 (實(shí)施在有形介質(zhì)中)、或二者兼而有之,以啟用比某些現(xiàn)有技術(shù)實(shí)現(xiàn)在多個(gè)核或處理器間 更高效的資源分配。例如,圖2示出一種前側(cè)總線(FSB)計(jì)算機(jī)系統(tǒng),本發(fā)明的一個(gè)實(shí)施方式可以在其 中使用。任意處理器201、205、210、或215可以從處理器核223、227、233、237、243、247、253、 257中之一內(nèi)的或者以其它方式與之相關(guān)聯(lián)的任意本地第1級(jí)(Li)高速緩存存儲(chǔ)器220、 225、230、235、240、245、250、255訪問信息。此外,任意處理器201、205、210、或215可以從 共享的第2級(jí)(L2)高速緩存203、207、213、217中的任何一個(gè)或經(jīng)由芯片組265從系統(tǒng)存 儲(chǔ)器260訪問信息。圖2中的處理器中的一個(gè)或更多個(gè)可以包含或者以其它方式關(guān)聯(lián)于邏 輯219以依照至少一個(gè)實(shí)施方式啟用資源分配技術(shù)。除圖2所示FSB計(jì)算機(jī)系統(tǒng)之外,其它系統(tǒng)配置可以結(jié)合本發(fā)明的各種實(shí)施方式 使用,包括點(diǎn)對(duì)點(diǎn)(P2P)互連系統(tǒng)和環(huán)互連系統(tǒng)。例如,圖3中的P2P系統(tǒng)可包含若干個(gè)處 理器,其中只示例性地畫出了兩個(gè)處理器370、380。處理器370、380可各自包括本地存儲(chǔ) 器控制器集線器(MCH) 372、382以與存儲(chǔ)器32、34連接。處理器370、380可以使用PtP接 口電路378、388經(jīng)由點(diǎn)對(duì)點(diǎn)(PtP)接口 350交換數(shù)據(jù)。處理器370、380可各自使用點(diǎn)對(duì)點(diǎn) 接口電路376、394、386、398經(jīng)由各PtP接口 352、354與芯片組390交換數(shù)據(jù)。芯片組390 還可經(jīng)由高性能圖形接口 339與高性能圖形電路338交換數(shù)據(jù)。本發(fā)明的實(shí)施方式可以置于具有任意數(shù)目的處理核的任意處理器中,或置于圖3所示各PtP總線代理中的每一個(gè)中。 在一個(gè)實(shí)施方式中,任意處理器核可包括或者以其它方式關(guān)聯(lián)于本地高速緩存存儲(chǔ)器(未 示出)中。此外,可以在這兩個(gè)處理器外部但經(jīng)由p2p互連與各存儲(chǔ)器連接的的任一處理 器中包含共享高速緩存(未示出),從而如果有處理器被置于低功率模式,則任一個(gè)或這兩 個(gè)處理器的本地高速緩存信息可以存儲(chǔ)在該共享的高速緩存中。圖3中的處理器或核中的 一個(gè)或更多個(gè)可以包含或者以其它方式關(guān)聯(lián)于邏輯319以依照至少一個(gè)實(shí)施方式啟用資 源分配技術(shù)。圖4a是依照本發(fā)明的至少一個(gè)實(shí)施方式進(jìn)行資源管理的高速緩存的概念化圖。 在一個(gè)實(shí)施方式中,高速緩存400a邏輯分割成兩個(gè)部分401a和405a,其各自劃分成三個(gè) 塊410a_412a,對(duì)應(yīng)于三個(gè)不同的線程。在一個(gè)實(shí)施方式中,每個(gè)分區(qū)中的這三個(gè)塊響應(yīng)于 對(duì)應(yīng)于特定數(shù)據(jù)類的每個(gè)線程變化著的需求通過使用油門(“T”:throttle)進(jìn)行控制。在 一個(gè)實(shí)施方式中,油門代表數(shù)據(jù)類得到對(duì)共享資源最高優(yōu)先級(jí)訪問權(quán)的時(shí)間分?jǐn)?shù)。在一個(gè) 實(shí)施方式中,相對(duì)于低優(yōu)先級(jí)訪問而言更偏向于高優(yōu)先級(jí)訪問的資源分配可以確保在給定 油門組的情況下實(shí)現(xiàn)共享資源的最優(yōu)分配。在一個(gè)實(shí)施方式中,油門420a和425a對(duì)應(yīng)于 高速緩存的這兩個(gè)邏輯部分中的有效油門(例如,組),并且在每一個(gè)部分中分別遞增或遞 減+Δ和-Δ,從而使初始油門CU + Δ的資源分配會(huì)比Ttl-A高。在圖4a中,我們說明了 給定針對(duì)三個(gè)線程的油門組(TyTnT2)時(shí)的高速緩存容量。在圖4b中,說明的是依照一個(gè)實(shí)施方式的資源分配測試。在一個(gè)實(shí)施方式中,圖 4b示出對(duì)高速緩存400a的兩個(gè)部分401a和405a的兩個(gè)性能測定,其中第一分區(qū)401a的 針對(duì)存儲(chǔ)在塊411a中的數(shù)據(jù)類的油門(此例中是T1)在朝第一方向(在本例中是正向)移 動(dòng),而第二分區(qū)405a的針對(duì)存儲(chǔ)在塊411a中的數(shù)據(jù)類的油門(T1)在朝第二方向(在本例 中是負(fù)向)移動(dòng)。所得性能度量隨后根據(jù)各種性能測定技術(shù)(包括使用性能計(jì)數(shù)器)來確 定(其結(jié)果示于圖4b)。這些資源分配測試可以持續(xù)地進(jìn)行,適應(yīng)程序、線程遷移/對(duì)換中 的相變等,以便持續(xù)地優(yōu)化油門,因此優(yōu)化分配給特定的一個(gè)或多個(gè)數(shù)據(jù)類的高速緩存容 量的大小。在一個(gè)實(shí)施方式中,存儲(chǔ)在高速緩存400a中的每一個(gè)數(shù)據(jù)類410a_412a對(duì)應(yīng)于 例如多線程程序中的不同線程。圖4c是可以根據(jù)至少一個(gè)實(shí)施方式使用的邏輯。圖4c中的邏輯400c示出處理 核401c、將該核接口到互連(例如環(huán)互連)和高速緩存410c的接口邏輯405c,高速緩存 410c可以是相容的最后一級(jí)高速緩存L2高速緩存等。在一個(gè)實(shí)施方式中,在持續(xù)性基礎(chǔ)上 用GPA模塊415c對(duì)高速緩存410c執(zhí)行上述的資源分配測試并根據(jù)測試結(jié)果向數(shù)據(jù)類(以 及相對(duì)應(yīng)的線程)分配高速緩存容量。在一個(gè)實(shí)施方式中,接口邏輯405c可以不存在或者 可以包括在該核或其它邏輯中。在一個(gè)實(shí)施方式中,對(duì)高速緩存的每一個(gè)測試的結(jié)果被送至GPA模塊,該模塊確 定如何調(diào)整高速緩存分配以優(yōu)化全局度量,比如高速緩存未命中率。除此之外,每次高速緩 存即將在高速緩存中為特定數(shù)據(jù)類分配額外的高速緩存塊大小時(shí),其可以向GPA模塊請(qǐng)求 建議(在信號(hào)“建議”上),后者用優(yōu)先級(jí)答復(fù)(在信號(hào)“優(yōu)先級(jí)”上)。例如,GPA模塊所作 的‘高優(yōu)先級(jí)’指示會(huì)使塊大小得到增大,而來自GPA模塊的‘低優(yōu)先級(jí)“指示會(huì)使高速緩 存不增大塊大小、或者將塊的大小增大較少的程度、或者將替換位置位,從而使塊或其一部 分成為接下來要被替換的。
6
為了指示并維護(hù)適當(dāng)?shù)馁Y源分配信息,GPA模塊可以包含針對(duì)每個(gè)數(shù)據(jù)類的狀態(tài) 位以及貫越各數(shù)據(jù)類的全局位。例如,對(duì)于每一個(gè)數(shù)據(jù)類,GPA模塊存儲(chǔ)共計(jì)38個(gè)狀態(tài)位, 包括18個(gè)位一對(duì)應(yīng)于第一性能計(jì)數(shù)器(“referencecoimter” )( “基準(zhǔn)計(jì)數(shù)器”)12個(gè)位一對(duì)應(yīng)于第二性能計(jì)數(shù)器( "randomffalkCounter")( “隨機(jī)游動(dòng)計(jì)數(shù)器”)8個(gè)位一對(duì)應(yīng)于油門控制。除此之外,可以用4個(gè)全局寄存器(共計(jì)24個(gè)位)將優(yōu)化算法參數(shù)化,包括4個(gè)位一對(duì)應(yīng)于分配給每一個(gè)數(shù)據(jù)類的不同高速緩存區(qū)CnumGradientRegionsLog")(梯度區(qū)數(shù)目記錄)8個(gè)位一對(duì)應(yīng)于第一油門Δ(,,gradientDelta” )( “梯度 Δ ”)8個(gè)位一對(duì)應(yīng)于第二油門Δ(”updateDelta”)( “更新 Δ,,)4個(gè)位一對(duì)應(yīng)于GPA模塊對(duì)潛在性能增益randomWalkThresholdMultiplier (隨機(jī)游動(dòng)閾值乘數(shù))作出響應(yīng)之靈敏度在一個(gè)實(shí)施方式中,GPA模塊使用這些位用梯度下降(或稱“爬山”)算法的變型 尋找共享資源的最優(yōu)分配,其中對(duì)于每一個(gè)數(shù)據(jù)類進(jìn)行實(shí)驗(yàn),將所議資源先是遞增然后遞 減地給予該數(shù)據(jù)類。GPA然后使用這些位測定這兩種情景下的“全局良好性”度量,并根據(jù) 實(shí)驗(yàn)給所議數(shù)據(jù)類分配額定配給量。在一個(gè)實(shí)施方式中,GPA用切爾諾夫界來判定何時(shí)調(diào) 整資源的分割,但在其它實(shí)施方式中,可以使用其它算法來確定何時(shí)調(diào)整資源的分割。在使用上述GPA模塊位實(shí)現(xiàn)狀態(tài)機(jī)的一種實(shí)施方式中,狀態(tài)轉(zhuǎn)移可以根據(jù)以下代 碼示例來描述void GRADIENT_PARTITI0N_ALG0RITHM_CLASS:Reference(bool_hitEqualsTrue,UINT32_setIndex){UINT32 setlndex = SetIndexHash(_setlndex);U I NT 3 2 gradientRegionlndex = setlndex&((l < < numGradientRegionsLog)-1);setlndex = setlndex > > numGradientRegionsLog ;bool setMap ;for (UINT32 i = gradientRegionlndex ;i < numDataClasses ;i = i+(l <<numGradientRegionsLog)){setMap = X0R(setIndex&((i >> numGradientRegionsLog) +1)) ;//+ Δ 或-Δdata[i]. referenceCounter++ ;
7
data[i]. randomWalk+ = (―hitEqualsTrue = = setMap) ? 1:_1 ;if((data[i]. referenceCounter^randomWalkThresholdMultiplier) <data[i]. randomWalk水data[i]. randomWalk){ //是否交越動(dòng)態(tài)閾值?如果是,則使油門朝獲勝的方向移動(dòng)。data[i]. throttle+ = (data[i]. randomWalk > 0) ? updateDelta:-updateDelta ;data[i]. throttle = (data[i]. throttle > throttleMask) ? throttleMask:data[i]· throttle ;data[i]. throttle = (data[i]. throttle < 0) 0:data[i]. throttle ;Reset (i) ;//為第i個(gè)數(shù)據(jù)類將referenceCounter (基準(zhǔn)計(jì)數(shù)器) 和randomWalk (隨機(jī)游動(dòng))復(fù)位}else if (data [i]. referenceCounter >= maxReferenceCount){ H套入,即在復(fù)位的同時(shí)保留來自前次實(shí)驗(yàn)的某些趨勢data[i]. referenceCounter = data[i]. referenceCounter >> 2 ;data[i]. randomWalk = data[i]. randomWalk >> 1 ;}}}bool GRADIENT_PARTITI0N_ALG0RITHM_CLASS:InstallAdvice (UINT32_dataClass,UINT32_setIndex){UINT32 setlndex = SetIndexHash(_setlndex);U I NT 3 2 gradientRegionlndex = setlndex&((l
<< numGradientRegionsLog)-1);setlndex = setlndex > > numGradientRegionsLog ;bool setMap = XOR (setlndex& ((_dataClass > > numGradientRegionsLog)+1));INT32randomThrottle = (INT32)(rand()&throttleMask);if (gradientRegionlndex = = (_dataClass&((l
<< numGradientRegionsLog)-1))){ //處在梯度區(qū)中return randomThrottle <= (data[_dataClass]. throttle+
8
((setMap = = true) ? gradientDelta:-gradientDelta));}else{return clock < = data[_dataClass]. throttle ;}}圖5是可以結(jié)合本發(fā)明的至少一個(gè)實(shí)施方式使用的操作的流程圖,不管該實(shí)施方 式是在什么處理器或系統(tǒng)配置中使用。在操作501,將高速緩存分割成至少兩部分,在其中 根據(jù)一個(gè)實(shí)施方式執(zhí)行資源分配實(shí)驗(yàn)。在操作505,每個(gè)部分被分割成與正針對(duì)其進(jìn)行優(yōu)化 的特定數(shù)據(jù)類(例如流數(shù)據(jù)和重用數(shù)據(jù))對(duì)應(yīng)的塊。在一個(gè)實(shí)施方式中,每一個(gè)高速緩存 分區(qū)中的每一個(gè)數(shù)據(jù)類分區(qū)對(duì)應(yīng)于不同的線程。在操作510,對(duì)每一個(gè)高速緩存分區(qū)根據(jù)上 述的實(shí)施方式執(zhí)行資源分配測試。在操作515,在程序執(zhí)行中的各個(gè)點(diǎn),高速緩存向GPA模 塊傳遞信息,GPA模塊持續(xù)地對(duì)性能進(jìn)行測量并向高速緩存提供優(yōu)化參數(shù)以改善性能。至少一個(gè)實(shí)施方式的一個(gè)或更多個(gè)方面可以用存儲(chǔ)在表示處理器內(nèi)各種邏輯的 機(jī)器可讀介質(zhì)上的代表性數(shù)據(jù)來實(shí)現(xiàn),其中的數(shù)據(jù)被機(jī)器讀取時(shí)促使機(jī)器編制邏輯來執(zhí)行 在此描述的技術(shù)。此類表示即所謂“IP核”可以存儲(chǔ)在有形的機(jī)器可讀介質(zhì)(“磁帶”)上 并提供給各種顧客或制造商,以加載到實(shí)際制作該邏輯或處理器的編制機(jī)器中去。因而,現(xiàn)已描述了用于指引微體系結(jié)構(gòu)存儲(chǔ)器區(qū)訪問的方法和裝置。應(yīng)當(dāng)理解,以 上描述是說明性的而非限制性的。在閱讀并理解了以上描述后,許多其它實(shí)施方式對(duì)于本 領(lǐng)域技術(shù)人員而言是顯而易見的。因此,本發(fā)明的范圍應(yīng)當(dāng)參照所附權(quán)利要求、連同賦予這 些權(quán)利要求的等效方案的完整范圍來確定。
9
權(quán)利要求
一種裝置,包括梯度分割算法(GPA)模塊,用于持續(xù)地控制至少一個(gè)處理資源向至少一個(gè)指令線程的分配,其中所述GPA模塊持續(xù)地對(duì)所述處理資源執(zhí)行測試以便確定最優(yōu)地滿足所述至少一個(gè)指令線程的處理需求的動(dòng)態(tài)油門設(shè)置。
2.如權(quán)利要求1所述的裝置,其特征在于,所述處理資源包括高速緩存存儲(chǔ)器。
3.如權(quán)利要求2所述的裝置,其特征在于,所述高速緩存存儲(chǔ)器被邏輯劃分成至少兩 個(gè)部分,所述GPA模塊可在其上執(zhí)行所述測試。
4.如權(quán)利要求3所述的裝置,其特征在于,所述兩個(gè)邏輯劃分的部分中的每一個(gè)包括 對(duì)應(yīng)于所述至少一個(gè)指令線程的至少一個(gè)塊。
5.如權(quán)利要求1所述的裝置,其特征在于,所述GPA模塊測試所述至少一個(gè)處理資源因 變于所述油門被設(shè)置為第一和第二設(shè)置時(shí)的性能,其中所述第一設(shè)置使所述處理資源的性 能在比第二設(shè)置時(shí)低的水平。
6.如權(quán)利要求5所述的裝置,其特征在于,所述GPA模塊向所述處理資源提供信息,以 指示導(dǎo)致最高性能水平的油門設(shè)置。
7.如權(quán)利要求4所述的裝置,其特征在于,所述GPA模塊包括對(duì)應(yīng)于所述至少一個(gè)指令 的類數(shù)據(jù)位。
8.如權(quán)利要求7所述的裝置,其特征在于,所述GPA模塊包括對(duì)應(yīng)于多個(gè)指令的全局?jǐn)?shù) 據(jù)位。
9.一種系統(tǒng),包括處理器核;高速緩存,耦合于所述處理器核;梯度分割算法(GPA)模塊,用于持續(xù)地對(duì)所述高速緩存執(zhí)行測試,以便確定最優(yōu)地滿 足多個(gè)指令訪問所述高速緩存的處理需求的動(dòng)態(tài)油門設(shè)置。
10.如權(quán)利要求9所述的系統(tǒng),其特征在于,所述高速緩存被邏輯劃分成至少兩個(gè)部 分,所述GPA模塊可在其上執(zhí)行所述測試。
11.如權(quán)利要求10所述的系統(tǒng),其特征在于,所述兩個(gè)邏輯劃分的部分中的每一個(gè)包 括對(duì)應(yīng)于所述多個(gè)指令的多個(gè)塊。
12.如權(quán)利要求11所述的系統(tǒng),其特征在于,取決于所述油門的值,所述多個(gè)塊的大小 可以增大或減小。
13.如權(quán)利要求12所述的系統(tǒng),其特征在于,所述測試包括測定對(duì)應(yīng)于第一塊的第一 線程在該塊的大小由油門增大時(shí)的性能。
14.如權(quán)利要求13所述的系統(tǒng),其特征在于,所述測試包括測定對(duì)應(yīng)于第一塊的第一 線程在該塊的大小由油門減小時(shí)的性能。
15.如權(quán)利要求14所述的系統(tǒng),其特征在于,所述GPA模塊根據(jù)在所述測試期間達(dá)成的 性能設(shè)置所述第一塊的大小。
16.如權(quán)利要求15所述的系統(tǒng),其特征在于,所述GPA模塊包括對(duì)應(yīng)于所述多個(gè)指令中 的每一個(gè)的類數(shù)據(jù)位。
17.如權(quán)利要求16所述的系統(tǒng),其特征在于,所述GPA模塊包括對(duì)應(yīng)于所述多個(gè)指令全 體的全局?jǐn)?shù)據(jù)位。
18.一種方法,包括將高速緩存分割成至少兩個(gè)部分,在其中執(zhí)行資源分配測試; 將所述至少兩個(gè)部分中的每一個(gè)分割成對(duì)應(yīng)于多個(gè)數(shù)據(jù)類的多個(gè)塊; 持續(xù)性地對(duì)所述至少兩個(gè)部分中的每一個(gè)執(zhí)行所述測試并比較其性能結(jié)果,其中所述 測試對(duì)所述至少兩個(gè)部分之一是以第一油門設(shè)置執(zhí)行的,而所述測試對(duì)所述至少兩個(gè)部分 之二是以第二油門設(shè)置執(zhí)行的;響應(yīng)于執(zhí)行結(jié)果的比較,調(diào)整所述多個(gè)塊中至少之一的大小。
19.如權(quán)利要求18所述的方法,其特征在于,取決于所述油門的設(shè)置,所述多個(gè)塊的大 小被增大或減小。
20.如權(quán)利要求19所述的方法,其特征在于,所述測試包括測定對(duì)應(yīng)于第一塊的第一 線程在該塊的大小由所述油門設(shè)置增大時(shí)的性能。
21.如權(quán)利要求20所述的方法,其特征在于,所述測試包括測定對(duì)應(yīng)于第一塊的第一 線程在該塊的大小由所述油門減小時(shí)的性能。
22.如權(quán)利要求21所述的方法,包括根據(jù)所述測試期間所達(dá)成的性能設(shè)置第一塊的大
23.如權(quán)利要求22所述的方法,其特征在于,對(duì)應(yīng)于所述多個(gè)數(shù)據(jù)類中的每一個(gè)的類 數(shù)據(jù)位得到維護(hù)。
24.如權(quán)利要求23所述的方法,其特征在于,對(duì)應(yīng)于所述多個(gè)數(shù)據(jù)類全體的全局?jǐn)?shù)據(jù) 位得到維護(hù)。
全文摘要
本發(fā)明是一種能夠在計(jì)算機(jī)系統(tǒng)中優(yōu)化資源分配的技術(shù)。在一個(gè)實(shí)施方式中,用梯度分割算法(GPA)模塊持續(xù)性地測定性能并調(diào)整共享資源在多個(gè)數(shù)據(jù)類間的分配,以便達(dá)到最優(yōu)性能。
文檔編號(hào)G06F9/50GK101901166SQ200910246179
公開日2010年12月1日 申請(qǐng)日期2009年12月2日 優(yōu)先權(quán)日2008年12月2日
發(fā)明者A·雅爾埃爾, J·艾默爾, S·斯特利, T·福瑟姆, W·哈森普勞伽 申請(qǐng)人:英特爾公司