此美國專利申請案主張2014年5月8日提出申請的第61/990,207號美國臨時申請案的優(yōu)先權(quán)權(quán)益,所述美國臨時申請案的內(nèi)容以全文引用的方式并入。
背景技術(shù):
多處理器系統(tǒng)可包含允許一個以上處理器對相同數(shù)據(jù)執(zhí)行操作的共享存儲器。對共享存儲器的存取可為緩慢的且可導(dǎo)致系統(tǒng)等待時間。為改進(jìn)存儲器存取時間,多處理器共享存儲器系統(tǒng)可包含相對較小但較快的存取高速緩沖存儲器。高速緩沖存儲器存儲可由處理器頻繁存取的數(shù)據(jù)的副本。為維持經(jīng)高速緩存數(shù)據(jù)的正確性,遵循高速緩沖存儲器一致性協(xié)議。高速緩沖存儲器一致性協(xié)議對通過處理器對經(jīng)高速緩存數(shù)據(jù)的存取施加規(guī)則以確保盡管存在數(shù)據(jù)的多個副本但數(shù)據(jù)跨越所有處理器均為正確的。然而,高速緩沖存儲器一致性協(xié)議可消耗先前系統(tǒng)帶寬且產(chǎn)生針對數(shù)據(jù)存取的不均勻等待時間。本發(fā)明發(fā)明者已認(rèn)識到需要多處理器共享存儲器系統(tǒng)中的經(jīng)改進(jìn)數(shù)據(jù)管理。
附圖說明
圖1圖解說明可用以實踐本發(fā)明的一些實施例的混合存儲器立方體的表示。
圖2是圖解說明可用以實踐本發(fā)明的一些實施例的混合存儲器立方體的四分之一的框圖。
圖3展示可用以實踐本發(fā)明的一些實施例的混合存儲器立方體的四個可能裝置拓?fù)涞目驁D。
圖4展示可用以實踐本發(fā)明的一些實施例的一致性目錄存儲器格式的實例。
圖5展示可用以實踐本發(fā)明的一些實施例的用HMC裝置實施的計算機(jī)系統(tǒng)的實例的框圖。
圖6展示操作計算機(jī)系統(tǒng)的方法的流程圖。
具體實施方式
在本發(fā)明的實例性實施例的以下詳細(xì)說明中,以圖式及圖解方式而參考本發(fā)明的特定實例性實施例。充分詳細(xì)地描述這些實例以使得所屬領(lǐng)域的技術(shù)人員能夠?qū)嵺`本發(fā)明,且所述實例用于圖解說明本發(fā)明可如何應(yīng)用于各種目的或?qū)嵤├4嬖诒景l(fā)明的其它實施例且所述實施例在本發(fā)明的范圍內(nèi),且可在不背離本發(fā)明的標(biāo)的或范圍的情況下做出邏輯、機(jī)械、電及其它改變。本文中所描述的本發(fā)明的各種實施例的特征或限制雖然對其中并入所述特征或限制的實例性實施例為必要的,但其并不限制本發(fā)明的其它實施例或作為整體的本發(fā)明,且對本發(fā)明的任何參考(其元件、操作及應(yīng)用)并不限制作為整體的本發(fā)明,而是僅用于定義這些實例性實施例。因此,以下詳細(xì)說明并不限制本發(fā)明的各種實施例的范圍,所述范圍僅由所附權(quán)利要求書界定。
在常規(guī)計算機(jī)系統(tǒng)中,存儲器以二維方式組織成行及列。為改進(jìn)存儲器存取等待時間做出的努力包含開發(fā)具有高帶寬接口的雙數(shù)據(jù)速率類型三(DDR3)或DDR4。DDR3及DDR4使用傳統(tǒng)行/列方法。
圖1圖解說明混合存儲器立方體105(HMC)的表示。HMC通過堆疊集成電路(IC)存儲器裸片110且使用實現(xiàn)在IC裸片的頂部及底部兩者上的存取的穿硅導(dǎo)通體(TSV)結(jié)構(gòu)(未展示)來使裸片互連而包含第三維度。TSV制造技術(shù)實現(xiàn)多個裸片層的互連,以便構(gòu)造三維裸片。使多個裸片層互連的此能力準(zhǔn)許建造具有存儲器存儲層與一或多個邏輯層的組合的存儲器裝置。以此方式,所述裝置在單個封裝中提供物理存儲器存儲及邏輯存儲器事務(wù)處理。圖1中所展示的布置是用以圖解說明概念且未必表示實際裸片布局。
HMC(例如,如混合存儲器立方體規(guī)范版本1.0中所規(guī)定)可提供具有高達(dá)每裝置320GB/s的可用帶寬容量的非常緊湊且功率高效封裝。HMC裝置經(jīng)由分層及平行設(shè)計方法而能夠具有此帶寬。裝置層次跨越邏輯層而垂直地發(fā)生且硬件平行跨越給定裸片層而發(fā)生。在HMC內(nèi),存儲器經(jīng)組織成存儲庫。每一存儲庫120使用穿硅導(dǎo)通體在裸片內(nèi)垂直地橫跨存儲器層中的每一者。在圖1的經(jīng)簡化實例中,HMC經(jīng)組織成16個存儲庫,其中每一存儲庫具有邏輯庫裸片層115或邏輯庫。
圖2是圖解說明HMC 205的四分之一的框圖。展示HMC的四個存儲庫,其中每一存儲庫220包含多個存儲器層。邏輯庫層215包含多個組件。舉例來說,每一存儲庫在邏輯庫中具有管理用于存儲庫的所有存儲器參考操作的存儲器控制器。存儲器控制器提供對3D存儲層的靈活存取。3D分層方法準(zhǔn)許存儲器事務(wù)不僅跨越目標(biāo)存儲陣列內(nèi)的存儲體,且亦跨越平行存儲陣列而平行地存在。邏輯庫層215可包含用以實施所描述的功能的一或多個處理器,且HMC可為存儲器中處理器(PIM)裝置。
邏輯庫層215提供對HMC裝置的存取的外部鏈路以及內(nèi)部路由及事務(wù)邏輯兩者。外部I/O鏈路由四個或八個邏輯鏈路提供。每一鏈路可包含十六個或八個串行I/O或SERDES雙向鏈路的群組。四個鏈路裝置具有在10Gbps、12.5Gbps及15Gbps下操作的能力。八個鏈路裝置具有在10Gbps下操作的能力。在內(nèi)部,鏈路附接到路由邏輯以便引導(dǎo)邏輯裝置處的控制每一垂直存儲器存儲單元的事務(wù)。在圖2的實例中,路由邏輯包含縱橫切換邏輯。
HMC鏈路結(jié)構(gòu)支持將裝置附接到主機(jī)(處理器)或其它HMC裝置兩者的能力。鏈結(jié)(chaining)的此概念準(zhǔn)許構(gòu)造需要比單個裝置大的容量而不擾動鏈路結(jié)構(gòu)及經(jīng)包化事務(wù)協(xié)議的存儲器子系統(tǒng)。鏈路可以眾多拓?fù)渑渲脼橹鳈C(jī)裝置鏈路或直通鏈路。
圖3展示基于基底四鏈路HMC配置的四個可能裝置拓?fù)涞目驁D。HMC存儲器裝置305可以傳統(tǒng)網(wǎng)絡(luò)拓?fù)?例如網(wǎng)狀、環(huán)面(torus)或縱橫)配置。將多個HMC裝置鏈結(jié)在一起增加可用于主機(jī)的總存儲器容量。
返回到圖2,針對存儲庫的邏輯庫層類似于針對每一獨立存儲庫的DIMM控制器單元。在圖2的實例中,存儲庫邏輯塊225及其相應(yīng)存儲庫存儲單元220可經(jīng)組織成四重單元。每一四重單元表示四個存儲庫單元。每一四重單元與最接近物理鏈路塊松散地相關(guān)聯(lián)。以此方式,主機(jī)裝置具有以下能力:通過邏輯上將請求包發(fā)送到其相關(guān)聯(lián)四重單元物理上最接近于所需存儲庫的鏈路而使HMC裝置的整個邏輯庫層的等待時間最小化。
一旦在目標(biāo)存儲器存儲庫內(nèi),存儲器存儲區(qū)便可分解成傳統(tǒng)概念的存儲體及動態(tài)隨機(jī)存取存儲器(DRAM)。穿過經(jīng)堆疊存儲器層的垂直存取類似于選擇適當(dāng)存儲器存儲體。下部存儲體可配置于下部裸片層中,而垂直上升(vertical ascension)選擇后續(xù)存儲體。一旦在存儲體層內(nèi),便可使用行及列以傳統(tǒng)方式組織DRAM。存儲庫控制器將DRAM分解成各自尋址16個字節(jié)的1兆位(1Mb)塊。針對每一列提取,可以32個字節(jié)來執(zhí)行到目標(biāo)存儲體的讀取或?qū)懭胝埱蟆?/p>
針對多主機(jī)多HMC系統(tǒng),使用經(jīng)包化格式來執(zhí)行主機(jī)裝置與HMC裝置之間的帶內(nèi)通信。此經(jīng)包化格式可包含三個主要包分類:請求包、響應(yīng)包及流量控制包。包可經(jīng)配置為單個16字節(jié)流量單元或FLIT的倍數(shù)。最大包大小含有9個FLIT或144個字節(jié)。最小16字節(jié)(一個FLIT)包含有包標(biāo)頭及包尾。用于所有存儲器有效負(fù)載大小的存儲器讀取請求包可僅需要包標(biāo)頭、包尾及相應(yīng)物理存儲器地址。因此,讀取請求可使用單個FLIT配置。然而,寫入請求及原子請求包也含有分別用于寫入及讀取-修改-寫入操作的所需輸入數(shù)據(jù)。因此,這些請求類型具有2個FLIT到9個FLIT的包寬度。
HMC系統(tǒng)實施方案可具有多個包重新排序點。經(jīng)指定用于輔助裝置的到達(dá)包可通過等待本地存儲庫存取的那些輔助裝置。本地存儲庫也可將已排列包重新排序以便最高效地利用去往及來自相應(yīng)存儲庫存儲體的帶寬。然而,給定HMC實施方案中呈現(xiàn)的重新排序點維持包流在存儲庫內(nèi)從特定鏈路到特定存儲體的次序。此確保后續(xù)接著存儲器讀取請求的存儲器寫入請求遞送正確及確定性存儲器行為。
如先前所解釋,HMC提供高帶寬裝置。然而,本發(fā)明系統(tǒng)互連規(guī)范通常缺少用以維持系統(tǒng)(其主存儲器是基于高帶寬裝置,例如HMC)中的適當(dāng)平衡所必需的充分功能性、靈活性及性能。舉例來說,系統(tǒng)架構(gòu)可包含用以維持芯片上系統(tǒng)(SoC)與本地存儲器之間的每秒數(shù)百吉字節(jié)帶寬的一或多個HMC,但所述系統(tǒng)架構(gòu)可提供僅具有此可用帶寬的小部分(例如,十分之一)的系統(tǒng)互連。所述結(jié)果可為極其不平衡的系統(tǒng)。
此外,如果附接到系統(tǒng)互連的處理器提供高速緩沖存儲器一致性機(jī)制,那么單獨邏輯塊可必須添加到所述系統(tǒng)以提供充分帶寬及功能性,以維持共享存儲器及高速緩沖存儲器子系統(tǒng)兩者中的并行性及正確性。此產(chǎn)生具有一組復(fù)雜外圍邏輯塊的處理器互連、存儲器互連及系統(tǒng)互連以及具有不同程度的等待時間的復(fù)雜協(xié)議規(guī)范。
低效高速緩沖存儲器一致性尤其是具有分布于多個SoC裝置或套接字當(dāng)中的多個執(zhí)行線程(或任務(wù))的應(yīng)用中的問題。如果核心SoC或處理器支持功能數(shù)據(jù)高速緩存,那么SoC套接字之間的高速緩沖存儲器一致性機(jī)制必須支持可比可用于系統(tǒng)互連上的帶寬高一個數(shù)量級的本地存儲器帶寬。再次,所述結(jié)果為極其不平衡的系統(tǒng)。
用以改進(jìn)系統(tǒng)層級等待時間的方法是提供具有實質(zhì)上高帶寬存儲器裝置的帶寬的存儲器一致性子系統(tǒng)。用以提供此的一種方式是使用一或多個HMC裝置來實施系統(tǒng)存儲器一致性。由于HMC具有執(zhí)行原位原子存儲器操作的能力,因此HMC可經(jīng)延伸以提供高帶寬及低等待時間存儲器一致性機(jī)制。
在常規(guī)系統(tǒng)中,用于高速緩沖存儲器一致性的一種方法是使用基于目錄的高速緩沖存儲器一致性協(xié)議。一致性目錄充當(dāng)篩選器,處理器透過所述篩選器尋求許可以將條目從主存儲器加載到其高速緩沖存儲器。當(dāng)條目改變時,所述目錄更新具有所述條目的其它高速緩沖存儲器或使所述其它高速緩沖存儲器失效?;谀夸浀母咚倬彌_存儲器一致性包含對將狀態(tài)指派給高速緩存線的“目錄”的維持。每一高速緩存線可被指派“主節(jié)點(home node)”作為高速緩存線的狀態(tài)的最終仲裁器。主節(jié)點擁有地址空間且準(zhǔn)許修改高速緩存線。目錄指派狀態(tài)且基于目錄的協(xié)議接著使用主機(jī)當(dāng)中的點對點通信來處理元數(shù)據(jù)。
處理器通常存儲目錄的顯著量的高速緩存線狀態(tài)信息且依賴于快速高速緩沖存儲器存取來讀取高速緩存元數(shù)據(jù)且確定高速緩存線的狀態(tài)。高速緩沖存儲器控制器記錄哪一主機(jī)簽出高速緩存線。在此配置中,高速緩存目錄本身必須經(jīng)高速緩存(通常完全相關(guān)聯(lián)地),從而形成維持于最后層級高速緩沖存儲器或存儲器控制器處的復(fù)雜且高耗電數(shù)據(jù)結(jié)構(gòu)。針對大的對稱多處理器(SMP)配置,這些數(shù)據(jù)結(jié)構(gòu)通常不適合于晶片上且必須由DRAM支持。
由于HMC裝置的物理存儲器存儲的分層性質(zhì),因此HMC裝置相較于傳統(tǒng)的存儲體式DRAM裝置(例如,DDR3或DDR4裝置)可具有不同物理尋址及交錯模型。HMC裝置的物理地址經(jīng)編碼到含有存儲庫、存儲體及地址位的34位字段中。具有四個鏈路裝置的實施方案利用所述字段的下部32個位,且具有八個鏈路裝置的實施方案利用所述字段的下部33個位。
與DDR3或DDR4裝置相比來說,HMC裝置可廉價地實施抽象存儲器存儲接口。舉例來說針對DDR類型裝置,當(dāng)處理器期望存取地址時,真實或?qū)嶋H物理地址經(jīng)置于總線上且被存取。在HMC協(xié)議中,物理地址可在其到達(dá)HMC處時重新映射到不同存儲器地址。因此,對于HMC,不存在對所寫入的實際存儲器位置的保證。另外,不需要HMC在設(shè)定時間處產(chǎn)生響應(yīng)。
可利用HMC的此地址重新映射能力來實施基于目錄的存儲器一致性。為提供對目錄存儲器一致性的支持,HMC的基底邏輯層可經(jīng)配置以將給定存儲器塊的位置抽象化成相關(guān)聯(lián)存儲器字或“高速緩存線”。因此,可將存儲器一致性目錄存儲于HMC存儲存儲庫內(nèi)。此提供使用相同HMC協(xié)議管理傳統(tǒng)存儲器業(yè)務(wù)及高速緩沖存儲器一致性業(yè)務(wù)兩者的方法;借此提供本地存儲器數(shù)據(jù)存取與系統(tǒng)存儲器數(shù)據(jù)存取的統(tǒng)一性。
圖4展示一致性目錄存儲器格式的實例。可就包含于基底物理地址字段中的物理地址來描述HMC的直接存儲器空間。在所展示的實例中,多達(dá)34個位的物理地址存儲是可用的。基底物理地址用作存儲器操作的目標(biāo)且可包含存儲庫、存儲體及DRAM地址位。地址延伸立方體ID(CUB)字段指示其中支持存儲器字的存儲器駐存的HMC裝置。目錄位字段提供存儲器一致性位以如同存儲器字是高速緩存線一般地維持存儲器字的狀態(tài)信息。如果存儲器一致性目錄使用MESI一致性協(xié)議,那么目錄位包含經(jīng)修改位、專屬位、共享位及無效位。通過存取與基底物理地址相關(guān)聯(lián)的存儲器字加上CUB偏移而執(zhí)行將數(shù)據(jù)字作為高速緩存線而存取。如果數(shù)據(jù)條目包含八個字節(jié),那么單個8GBHMC裝置可支持超過十億個并行目錄條目。
在以此方式組織存儲器一致性的情況下,可使用HMC原子存儲器操作對存儲器執(zhí)行查找及修改操作。在使用HMC本地的事務(wù)協(xié)議與目錄互動的同時維持目錄可變動性。此使得存儲器存取的類型較統(tǒng)一。
可使用原子請求執(zhí)行對目錄條目的存取。原子請求涉及:從DRAM讀取16個字節(jié)的數(shù)據(jù)(如依請求地址字段存取);通過使用16字節(jié)操作數(shù)(亦包含于請求包中)而對數(shù)據(jù)執(zhí)行操作;及接著將結(jié)果寫回到DRAM中的相同位置。讀取-更新-寫入序列以原子方式發(fā)生,此意指在完成原子請求的寫入之前無其它請求可存取相同存儲體。原子請求類似于16字節(jié)寫入請求,在于所述原子請求在請求包中具有16字節(jié)數(shù)據(jù)有效負(fù)載,且可或可不傳回寫入響應(yīng)(取決于所請求的是投遞(posted)請求還是非投遞請求)。由原子操作產(chǎn)生的數(shù)據(jù)在響應(yīng)命令中不傳回。可使用原子存儲器操作(例如(舉例來說)HMC協(xié)議的ADD即時請求命令)執(zhí)行對目錄條目的修改。也可使用原子存儲器操作(例如(舉例來說)其中目標(biāo)即時值為零的ADD即時請求命令)執(zhí)行對目錄條目的查找。
圖5展示用HMC裝置實施以包含基于HMC的存儲器一致性目錄的計算機(jī)系統(tǒng)500的實例的框圖。所述系統(tǒng)包含多個主機(jī)處理器。所述處理器可實施為SoC,其中每一處理器由SoC套接字502表示。所述實例展示四個處理器,但所述系統(tǒng)靈活地包含其它數(shù)目個處理器。
所述系統(tǒng)還包含經(jīng)配置為用于主機(jī)處理器的分布式共享存儲器的多個HMC裝置。所述HMC裝置中的一些HMC裝置用作端點裝置且一些HMC裝置用作集線器裝置。集線器裝置可提供直通通信能力以提供系統(tǒng)內(nèi)通信。
假定存儲器是用具有以三維方式布置的存儲器裸片的HMC裝置實施,那么針對3D存儲器存取而配置共享存儲器。HMC裝置505的存儲器裸片的存儲器的至少一部分經(jīng)映射以包含存儲器一致性目錄的至少一部分。此暗示常規(guī)高速緩沖存儲器一致性數(shù)據(jù)或元數(shù)據(jù)存儲于其中存儲器字所駐存的存儲器中。HMC裝置的邏輯庫裸片包含管理至少一個第二裝置(例如(舉例來說)處理器或另一HMC裝置)對HMC裝置存儲器的三維(3D)存取的至少一個存儲器控制器。邏輯庫裸片還包含針對存儲于多個存儲器裸片的存儲器中的數(shù)據(jù)而實施存儲器一致性協(xié)議的邏輯電路。
由于一致性目錄存儲于HMC裝置中,因此HMC裝置本身可用作用于其自身數(shù)據(jù)的主節(jié)點。存儲器一致性狀態(tài)信息可與所述數(shù)據(jù)存儲在一起。邏輯庫層在不將所述數(shù)據(jù)存儲于單獨高速緩沖存儲器中的情況下允許存儲器一致性狀態(tài)信息在處理器當(dāng)中傳遞。所存儲的數(shù)據(jù)為共享存儲器,基本上為高速緩存線。另外,假定存儲器一致性由HMC裝置實施,那么與維持存儲器一致性狀態(tài)信息相關(guān)聯(lián)的處理額外開銷從處理器移除。
如先前所解釋,針對多主機(jī)多HMC系統(tǒng),使用經(jīng)包化協(xié)議來執(zhí)行主機(jī)裝置與HMC裝置之間的I/O通信。存儲器一致性協(xié)議可包含于此I/O協(xié)議中。經(jīng)包化信息可包含存儲器一致性狀態(tài)信息。在一些實例中,存儲器一致性狀態(tài)信息可如同在圖4的實例中而與地址信息包含在一起。將存儲器一致性協(xié)議與I/O協(xié)議包含在一起將兩種功能組合到統(tǒng)一高效通信系統(tǒng)中。此使本地存儲器請求及系統(tǒng)存儲器請求兩者中的等待時間最小化且消除本地接口與系統(tǒng)接口之間的協(xié)議轉(zhuǎn)譯。
狀態(tài)信息確定處理器是否可安全地將數(shù)據(jù)寫入到存儲器字、存儲器字當(dāng)前是否保持有效數(shù)據(jù)且確定可如何將存儲器字轉(zhuǎn)變到其中可進(jìn)行對存儲器字的讀取或?qū)懭氲臓顟B(tài)中。在一些實例中,HMC裝置的邏輯電路實施MSI高速緩沖存儲器一致性協(xié)議且確定存儲器裸片的存儲器字的“經(jīng)修改”狀態(tài)信息、“共享”狀態(tài)信息及“無效”狀態(tài)信息且與存儲器裸片的存儲器字相關(guān)聯(lián)地存儲所述狀態(tài)信息。在特定變化中,經(jīng)修改狀態(tài)信息、共享狀態(tài)信息及無效狀態(tài)信息分別包含經(jīng)修改位、共享位及無效位。在特定實例中,HMC裝置的邏輯電路實施確定專屬權(quán)狀態(tài)信息的MESI高速緩沖存儲器。在特定實例中,HMC裝置的邏輯電路實施確定存儲器裸片的存儲器字的所有權(quán)狀態(tài)信息的MOSI高速緩沖存儲器。邏輯電路與共享存儲器數(shù)據(jù)字相關(guān)聯(lián)地存儲專屬權(quán)狀態(tài)信息及所有權(quán)狀態(tài)中的一者或兩者。在一些實例中,集線器HMC裝置將路由信息添加到經(jīng)包化消息。路由信息可用以(例如,通過接收HMC裝置)確定存儲器一致性狀態(tài)信息。
根據(jù)一些實例,“簽出/簽入”機(jī)制由希望更新特定存儲器字的處理器使用。在此情形中,處理器請求對存儲器位置X的專屬存取。一旦所述存取由其中存儲器字所駐存的HMC裝置準(zhǔn)予,存儲器字便可標(biāo)記為“經(jīng)簽出”(在裝置上的小關(guān)聯(lián)表中或作為存儲器中的狀態(tài)的額外位)。當(dāng)數(shù)據(jù)由處理器往回簽入時,HMC裝置推定所述數(shù)據(jù)被更新。因此,存儲器字本身將由處理器寫回(或“清空”)且存儲器中的空間可經(jīng)重新使用以存儲額外狀態(tài)信息(例如,指示簽出存儲器字的裝置的狀態(tài)信息)。對存儲器字X的進(jìn)一步請求可從組合兩條信息(例如,高速緩存線由處理器P簽出的狀態(tài)信息)的HMC裝置接收響應(yīng)?;谀夸浀囊恢滦詤f(xié)議接著通過使用存儲器一致性狀態(tài)更新(例如,可要求處理器P清空存儲器內(nèi)容等)而繼續(xù)進(jìn)行。當(dāng)處理器P將新數(shù)據(jù)清空回到主節(jié)點(存儲器字的HMC裝置)時,可簽入存儲器字且清除狀態(tài)信息。
在一些實例中,HMC裝置對于對目標(biāo)存儲器字的特定狀態(tài)請求作出響應(yīng)。舉例來說,目標(biāo)HMC裝置可從處理器接收對于對存儲器字的專屬存取的請求(例如,對專屬狀態(tài)的請求)。HMC裝置的邏輯電路可起始對存儲器字的狀態(tài)信息的讀取。如果狀態(tài)信息指示第二裝置已具有對存儲器字的專屬存取及所有權(quán),那么邏輯電路可使所述存儲器字無效且等待來自擁有的裝置的無效確認(rèn)。當(dāng)接收到確認(rèn)時,HMC裝置可將專屬存取賦予原始請求裝置。
圖6展示操作計算機(jī)系統(tǒng)(例如圖5中所展示的實例性系統(tǒng))的方法600的流程圖。在605處,例如(舉例來說)通過HMC協(xié)議來管理對所述計算機(jī)系統(tǒng)的分布式共享存儲器的存取。所述共享存儲器是針對三維存取而配置,且包含一或多個HMC裝置。
在610處,將存儲器一致性狀態(tài)信息存儲于分布式共享存儲器中作為存儲器一致性目錄。在一些實例中,存儲器一致性目錄分布于計算機(jī)系統(tǒng)的多個HMC裝置上。
在615處,在計算系統(tǒng)的多個處理器與共享存儲器之間傳遞經(jīng)包化信息,且在620處,將存儲器一致性狀態(tài)信息與所傳遞經(jīng)包化信息包含在一起。在一些實例中,620在計算機(jī)系統(tǒng)的處理器之間點對點地傳遞存儲器一致性狀態(tài)信息。
本文中所描述的實例性系統(tǒng)及方法提供優(yōu)于常規(guī)多處理器分布式共享存儲器系統(tǒng)的數(shù)個優(yōu)點。由HMC裝置提供的高帶寬產(chǎn)生高帶寬存儲器及高帶寬系統(tǒng)互連。HMC裝置在系統(tǒng)架構(gòu)中的分布使本地存儲器之間以及與HMC裝置互連的其它系統(tǒng)層級存儲器之間的帶寬及系統(tǒng)等待時間特性平衡。將存儲器一致性協(xié)議并入到系統(tǒng)I/O協(xié)議中提供維持本地存儲器與系統(tǒng)層級存儲器之間的存儲器請求的原子性的一個統(tǒng)一協(xié)議。所述統(tǒng)一協(xié)議通過減少或消除本地存儲器存取與系統(tǒng)層級存儲器存取之間的協(xié)議轉(zhuǎn)譯且通過使用用于本地存儲器存取及系統(tǒng)層級存儲器存取兩者的高效HMC包規(guī)范而使等待時間最小化。通過卸載存儲器一致性目錄的維持且通過由SoC簡化一致性目錄查找而簡化SoC設(shè)計。
盡管本文中已圖解說明且描述了特定實施例,但所屬領(lǐng)域的技術(shù)人員將了解,實現(xiàn)相同目的、結(jié)構(gòu)或功能的任何布置可替代所展示的特定實施例。本申請案打算涵蓋對本文中所描述的本發(fā)明的實例性實施例的任何改編或變化形式。本發(fā)明打算僅由權(quán)利要求書及其等效物的完整范圍限制。