亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

存儲器微分塊的制作方法

文檔序號:6560018閱讀:153來源:國知局
專利名稱:存儲器微分塊的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及計算機系統(tǒng);本發(fā)明尤其涉及訪問存儲器控制。
背景實現(xiàn)統(tǒng)一存儲器體系結(jié)構(gòu)(UMA)的計算機系統(tǒng)具有通過訪問主存儲器來訪問視頻存儲器的圖形控制器的特征。但是,由于CPU高速緩存線大小的要求,UMA圖形系統(tǒng)的存儲器效率可能受到限制。例如,理想的圖形存儲器訪問大小可能是4到16字節(jié),因為圖形控制器一次可對一個或數(shù)個像素或是紋理像素(texel)進行操作。但是,存儲器體系結(jié)構(gòu)常常是為64字節(jié)的CPU高速緩存線大小優(yōu)化的,目的是優(yōu)化CPU存儲器效率。結(jié)果是,平均而言,從存儲器讀取的相當(dāng)大量的數(shù)據(jù)可能從未被圖形控制器所使用。
分立圖形控制器的制造商通過使用較窄的存儲器通道來將此過度取出最小化。但是,這一解決方案對于基于UMA的集成圖形控制器是不可用的。
附圖簡述在附圖中通過示例而非限制示出了本發(fā)明,其中相同的附圖標(biāo)記表示相似的元件,其中

圖1是計算機系統(tǒng)的一個實施例的框圖;圖2示出了存儲器控制器的一個實施例;圖3示出了邏輯虛擬地址的一個實施例;圖4示出了存儲器控制器的另一個實施例;圖5A和5B示出了性能優(yōu)勢;圖6示出了相等子通道分配的一個實施例;圖7示出了相等子通道分配的另一個實施例;圖8示出了相等子通道分配的又一個實施例;圖9示出了存儲器控制器的另一個實施例;
圖10示出了不等子通道分配的一個實施例;以及圖11示出了計算機系統(tǒng)的另一個實施例。
詳細描述本文描述了一種存儲器請求組合機制。在以下對本發(fā)明的詳細描述中,闡述了許多特定細節(jié)以提供對本發(fā)明的詳盡理解。但是,本領(lǐng)域技術(shù)人員可顯見,無需這些特定實施例也可實施本發(fā)明。在其它實例中,以框圖形式而不是詳細地示出了公知的結(jié)構(gòu)和裝置,目的是避免使本發(fā)明模糊。
本說明書中對“一個實施例”或是“一實施例”的引用是指結(jié)合該實施例所描述的特定特征、結(jié)構(gòu)或特性被包括在本發(fā)明的至少一個實施例中。在本說明書中各處所出現(xiàn)的短語“在一個實施例中”未必全部都是指同一個實施例。
圖1是計算機系統(tǒng)100的一個實施例的框圖。計算機系統(tǒng)100包括耦合到接口105的中央處理器單元(CPU)102。在一個實施例中,CPU 102是可從加利福尼亞州Santa Clara市的Intel公司購買的PentiumIV處理器的Pentium家族中的處理器?;蛘?,也可使用其它CPU。例如,CPU 102可使用多個處理核心來實現(xiàn)。在另一個實施例中,計算機系統(tǒng)100可包括多個CPU 102。
在另一個實施例中,芯片組107也被耦合到接口105。芯片組107包括存儲器控制組件110。存儲器控制組件110可包括耦合到主系統(tǒng)存儲器115的存儲器控制器112。主系統(tǒng)存儲器115存儲數(shù)據(jù)以及由CPU 102或是系統(tǒng)100中所包括的任何其它裝置執(zhí)行的指令序列。在一個實施例中,主系統(tǒng)存儲器115包括動態(tài)隨機存取存儲器(DRAM);但是,主系統(tǒng)存儲器115可使用其它存儲器類型來實現(xiàn)。其它裝置也可被耦合到接口105,諸如多個CPU和/或多個系統(tǒng)存儲器等。
存儲器控制組件110可經(jīng)由接口被耦合到輸入/輸出(I/O)控制組件140。I/O控制組件140向計算機系統(tǒng)100內(nèi)的I/O設(shè)備提供接口。I/O控制組件140可支持諸如外圍部件互連(PCI)Express總線、加速圖形端口(AGP)、通用串行總線(USB)、低引腳數(shù)(LPC)總線或是任何其它類型的I/O總線(未示)等I/O總線上的標(biāo)準(zhǔn)I/O操作。
根據(jù)一個實施例,圖形控制器160與芯片組107通信,并被實現(xiàn)為向耦合到計算機系統(tǒng)100的顯示監(jiān)視器(未示)提供視頻圖形。圖形控制器160通過訪問主存儲器115來訪問視頻存儲器。如以上所討論的,既支持存儲器又支持CPU的存儲器設(shè)備的存儲效率是受到限制的,因為圖形的存儲器訪問大小通常理想為4到16字節(jié),而存儲器體系結(jié)構(gòu)是為64字節(jié)的CPU線大小優(yōu)化以優(yōu)化CPU存儲器效率的。
微分塊(Micro-Tiling)根據(jù)一個實施例,存儲器控制組件110具有微分塊的特征,目的是減少對圖形設(shè)備的存儲器請求大小,并且同時維持64字節(jié)的存儲器事務(wù)。諸如基于DDRDRAM等技術(shù)的標(biāo)準(zhǔn)存儲器通道具有m比特的某一物理寬度。存儲器事務(wù)包括T次傳遞,總計邏輯寬度為M=m*T/8字節(jié)。每個事務(wù)內(nèi)的字節(jié)被視為具有聯(lián)貫的地址。在以下討論中,術(shù)語寬度是指邏輯寬度。
微分塊將M字節(jié)寬的通道分成S個子通道,每個都是N=M/S字節(jié)寬,并且其中每個子通道上傳遞N字節(jié)數(shù)據(jù)。可給每個子通道一個地址,其中若干個(I個)獨立的地址位可與給其它子通道的地址中的對應(yīng)位不同。在每個子通道上傳遞的數(shù)據(jù)可被視為代表著相連的地址范圍。但是,每個子通道上的數(shù)據(jù)塊未必來自相連的地址范圍。每個子通道包括該通道的所有存儲器位置的一個子集。
圖2示出支持微分塊的存儲器控制組件110的一個實施例。在一個實施例中,多通道存儲器子系統(tǒng)每個信道有一個微分塊存儲器控制器。由此,如圖2中所示,存儲器控制組件110包括兩個存儲器控制器112(存儲器控制器1和2),對兩個通道中的每一個有一個存儲器控制器。每個通道包括S個子通道,每個子通道為N字節(jié)寬。由此,每個通道可以是M=N*S字節(jié)寬。
在此圖中,讀或?qū)懘鎯ζ鞯恼埱蟊幻枥L為2×2的正方形的陣列,它們可能表示2×2的像素或紋理像素陣列。圖中示出了被分配給子通道之前的請求。在子通道分配之后,請求從0到S-1編號以表示子通道分配。在讀事務(wù)的情形中,這N字節(jié)回到被耦合到存儲器控制器組件110的請求器205。
存儲器控制器組件110包括耦合到存儲器控制器112的通道分配邏輯210。通道分配210經(jīng)由存儲器控制器112將從請求器204接收的每個請求分配給一個存儲器通道240。此外,每個存儲器控制器112包括子通道分配215、重排緩沖器220和事務(wù)組裝器230。由此,請求被分配給圖2中所示的存儲器控制器1或是存儲器控制器2。
子通道分配215將每個請求分配給存儲器通道240內(nèi)的一個子通道。重排緩沖器220收集請求以使事務(wù)組裝器230能試圖為每個存儲器240子通道組裝存儲器訪問。根據(jù)一個實施例,每個子通道具有相等的N字節(jié)的寬度。
在圖2中所示的系統(tǒng)的工作期間,進入存儲器控制器(1或2)的在地址A處讀或?qū)慛字節(jié)的數(shù)據(jù)塊的請求可被分配給一個子通道,并可被放在重排緩沖器220中。在一個實施例中,可通過以下過程來定義相等子通道分配s將請求地址A右移P=log2(N)位,得到新的整數(shù)值 (例如,A~=A>>P]]>);并且s是 的最低Q=log2(S)位(例如, )。
存儲器控制器通過從重排緩沖器220選擇S個讀請求(對每個子通道一個請求)來構(gòu)成存儲器讀事務(wù)。存儲器控制器通過從重排緩沖器220選擇S個寫請求(對每個子通道一個請求)來構(gòu)成存儲器寫事務(wù)。地址中由共享地址線表示的部分對于事務(wù)中的所有子通道請求可以是相同的。
圖3示出詮釋物理地址中的地址位的一個實施例。圖3中所示的對共享和獨立地址位、以及子通道選擇位的選擇是出于說明性目的,因為將高于P個子通道數(shù)據(jù)地址位的那些地址位分為共享和獨立地址位,并且子通道選擇位可以是任意的。獨立地址位在諸子通道上是不同的,并且未必相連。發(fā)送到子通道的地址位是該子通道的共享地址位和獨立地址位。
圖4示出存儲器控制組件110用四個16字節(jié)的請求來組裝一個64字節(jié)的事務(wù)的實施例,其中僅示出了單個通道。圖4示出了被實現(xiàn)為對應(yīng)于每個子通道的重排序列的重排緩沖器220。但是,在其它實施例中,重排緩沖器220可經(jīng)由其它機制來實現(xiàn)。
在此實施例中,事務(wù)組裝器230用幾個16字節(jié)的請求(對每個子通道一個請求)來組裝一個64字節(jié)的存儲器請求。構(gòu)成該存儲器請求的所有16字節(jié)請求都具有相同的共享地址位。由此,組裝器230瀏覽隊列以基于請求是否具有共有的共享地址來尋找可被組裝為單個事務(wù)的請求。
注意,在圖4中所示的實施例中,組裝器230不能為子通道1c找到請求。當(dāng)試圖構(gòu)成事務(wù)時,存儲器控制器可能不能為每個子通道找到一個請求,以使所有請求都具有相同的共享地址段(例如,使得每個共享地址位的值在所有請求上可以是相同的)。
如果子通道不能被對應(yīng)隊列中的請求所填充,則結(jié)果是不會對該子通道執(zhí)行來/往的傳遞。在一個實施例中,如果子通道不能被請求填充,則任意位置可被讀取,并且結(jié)果被丟棄。在一個替換實施例中,每個子通道可包括一條附加控制線,當(dāng)對該通道沒有對應(yīng)的請求時,可使用該附加控制線來切斷子通道的電源。
微分塊存儲器子通道可訪問由共享地址位和I個獨立地址位所確定的某個地址范圍內(nèi)的不相連的存儲器地址。在對照將I個地址信號復(fù)制到每個子通道的成本進行權(quán)衡的情況下,審慎選擇的I可提高諸獨立子通道的并發(fā)性和帶寬效率。
圖5A和5B示出了微分塊的性能優(yōu)勢。每個圖都示出了分塊地址空間中三角形的柵格化,其中每個小正方形表示一個4字節(jié)的像素或紋理像素。圖5A示出當(dāng)每個請求為64字節(jié)時標(biāo)準(zhǔn)存儲器系統(tǒng)中的過度取出。每個4×4的像素塊表示一個64字節(jié)的對齊的存儲塊。三角形包圍了57個像素。使用標(biāo)準(zhǔn)存儲器子系統(tǒng),那57個像素將位于11個存儲塊(64字節(jié))中。由此,為了訪問那57個像素,可能會訪問相當(dāng)于額外的119個像素的數(shù)據(jù),而它們可能不會被使用(例如,導(dǎo)致32%的效率)。
圖5B示出了每個請求是16字節(jié)并且所有此類請求都可被微分塊組裝器64用來構(gòu)建64字節(jié)的存儲器事務(wù)而沒有任何未被使用的子通道情況下的過度取出。在此情形中,三角形觸及23個2×2像素陣列,從而導(dǎo)致相當(dāng)于額外的35個像素的數(shù)據(jù)被訪問(例如,導(dǎo)致62%的效率)。微分塊的有效性取決于組裝器構(gòu)造完全填充的存儲器事務(wù)的能力。
微分塊請求映射如以上所討論的,相等子通道分配s可如下來定義將請求地址A右移P=log2(N)位,得到新的整數(shù)值 (例如,A~=A>>P]]>);并且s是 的最低Q=log2(S)位(例如, )。圖6示出了線性地址空間的情形中相等子通道分配的一個實施例。在此實施例中,一個通道可包括四個子通道(S=4)。
圖6示出了線性地址空間的一部分相對于某個地址A的子通道分配,其中每個小塊表示N個字節(jié)。塊0表示將被分配給子通道0的地址范圍,塊2表示將被分配給子通道2的地址范圍,而塊3表示將被分配給子通道3的地址范圍。
圖7示出了示例性2D分塊空間的情形中同樣是相對于某個地址A的相等子通道分配的另一個實施例。注意,存在著許多種可能的2D地址空間分塊,并且更高維的分塊也是可能的。
如果請求地址不是均勻分布在諸子通道上,則相等子通道分配的實現(xiàn)可能效果不佳。例如,圖8示出了示例性分塊地址空間(諸如在圖形應(yīng)用中可能使用的)上的相等子通道分配的一個實施例。
圖8包括三角形的輪廓以表示在呈現(xiàn)三角形期間被訪問的N字節(jié)的塊。注意,沿著三角形的左邊和底邊訪問各個塊的請求在諸子通道中間不是均勻分布的。因此,事務(wù)組裝器230可能無法組裝包括對所有子通道的請求的完整的事務(wù)。
根據(jù)一個實施例,可向微分塊體系結(jié)構(gòu)提供不等子通道分配,以將請求地址在諸子通道上均勻分布的可能性最大化,并由此來增加微分塊帶寬(BW)減少。
圖9示出了實現(xiàn)微分塊的存儲器控制器的另一個實施例。此實施例在每個存儲器控制器中提供被耦合到子通道分配215的映射邏輯950。與前文中類似,圖9示出了被實現(xiàn)為用于每個子通道的重排隊列的重排緩沖器220。此配置具有兩個通道,由此具有兩個存儲器控制器。每個通道包括四個子通道,每個為16字節(jié)寬。由此,每個通道可以是64字節(jié)寬。
在一個實施例中,映射邏輯950向子通道分配215發(fā)送指示如何將請求分配給諸子通道的輸入信號以減少模式重復(fù)性。由此,可改變映射以使對象在諸子通道上被平均地繪制,從而來避免形成熱點。在另一個實施例中,映射邏輯950向其地址空間的不同區(qū)域提供不同的映射。被應(yīng)用于地址空間中的某個區(qū)域的映射可隨時間推移在每當(dāng)該區(qū)域內(nèi)的數(shù)據(jù)不再受到關(guān)注時改變。
圖10示出不等子通道映射的一個實施例,其中各個塊具有與以上參考圖8所描述的相同的意義。在此情形中,沿三角形左邊和底邊訪問各個塊的請求在諸子通道中間被更均勻地分布。這種子通道分配的效果是通過更高效地將微分塊請求填充到存儲器信道中來減少帶寬。類似地,在線性地址空間的情形中,適當(dāng)?shù)剡x擇的不等子通道分配映射可導(dǎo)致帶寬減小,尤其是在存儲器訪問通常具有為M字節(jié)的倍數(shù)的跨距的情形中。
圖11示出計算機系統(tǒng)100的另一個實施例。在此實施例中,芯片組107包括單個控制中心1120,這與單獨的存儲器控制組件和I/O控制組件形成對比。由此,存儲器控制器112可被包括在CPU 102內(nèi),而存儲器115被耦合到CPU 102。在這一實施例中,圖形控制器160可被耦合到控制中心1120,并經(jīng)由CPU 102來訪問主存儲器115。
盡管毫無疑問,本發(fā)明的許多變更和修改在本領(lǐng)域普通技術(shù)人員閱讀了以上描述后將是顯見的,但是應(yīng)當(dāng)理解,通過示例方式所示出和記載的任何特定實施例從任何意義上都不應(yīng)被視為是限定性的。因此,對各個實施例的詳細參考并不旨在限定所附權(quán)利要求的范圍,權(quán)利要求書本身僅引用本發(fā)明的必要技術(shù)特征。
權(quán)利要求
1.一種存儲器控制器,包括分配邏輯,用于接收訪問存儲器位置的請求;以及事務(wù)組裝器,用于用訪問通道內(nèi)的兩個或多個可獨立尋址的子通道的一個或多個其它請求來組合所述請求。
2.如權(quán)利要求1所述的存儲器控制器,其特征在于,每個所述子通道請求包括獨立地址分量和共享地址分量。
3.如權(quán)利要求2所述的存儲器控制器,其特征在于,所述子通道請求的獨立地址分量與一子通道相關(guān)聯(lián)。
4.如權(quán)利要求1所述的存儲器控制器,其特征在于,向第一子通道呈遞的第一子通道請求包括第一地址,所述第一地址與向第二子通道呈遞的第二子通道請求具有不同的獨立地址位。
5.如權(quán)利要求1所述的存儲器控制器,其特征在于,傳遞給每個子通道的數(shù)據(jù)表示相連的數(shù)據(jù)塊。
6.如權(quán)利要求5所述的存儲器控制器,其特征在于,所述在每個子通道處的數(shù)據(jù)塊不是來自相連的數(shù)據(jù)塊。
7.如權(quán)利要求1所述的存儲器控制器,其特征在于,還包括重排緩沖器,用于存儲所述子通道請求。
8.如權(quán)利要求6所述的存儲器控制器,其特征在于,所述重排緩沖器包括與所述兩個或多個子通道中的每一個相關(guān)聯(lián)的隊列。
9.如權(quán)利要求8所述的存儲器控制器,其特征在于,每個隊列存儲要被傳遞給相關(guān)聯(lián)的子通道的子通道請求。
10.如權(quán)利要求8所述的存儲器控制器,其特征在于,還包括事務(wù)組裝器,用于組裝存儲在每個所述隊列中的子通道請求,并用于將所述子通道請求轉(zhuǎn)發(fā)到所述相關(guān)聯(lián)的子通道。
11.如權(quán)利要求1所述的存儲器控制器,其特征在于,還包括被耦合到所述分配邏輯的映射邏輯,用于提供對所述子通道的不等分配。
12.如權(quán)利要求1所述的存儲器控制器,其特征在于,還包括被耦合到每個所述子通道的控制線,其中每根控制線在每當(dāng)沒有任何對所述通道的對應(yīng)請求時切斷相關(guān)聯(lián)的子通道的電源。
13,一種方法,包括在存儲器控制器處接收訪問被耦合到所述存儲器控制器的存儲器通道的請求;將所述請求分配給所述存儲器通道內(nèi)的一個相關(guān)聯(lián)的可獨立尋址的子通道;以及用訪問所述子通道的一個或多個其它請求來組合所述請求。
14.如權(quán)利要求13所述的方法,其特征在于,還包括所述存儲器控制器通過為每個子通道選擇一個寫子通道請求來構(gòu)成寫事務(wù)。
15.如權(quán)利要求13所述的方法,其特征在于,還包括所述存儲器控制器通過為每個子通道選擇一個讀子通道請求來構(gòu)成寫事務(wù)。
16.如權(quán)利要求13所述的方法,其特征在于,還包括在將所述請求分配給子通道之后將所述請求存儲在重排緩沖器中。
17.如權(quán)利要求16所述的方法,其特征在于,還包括組裝存儲在所述重排緩沖器中的子通道請求;以及將所述請求轉(zhuǎn)發(fā)到相關(guān)聯(lián)的子通道。
18.一種系統(tǒng),包括具有一個或多個通道的存儲器裝置;以及被耦合到所述存儲器裝置的芯片組,所述芯片組具有存儲器控制器,用于接收訪問存儲器位置的請求,以及用訪問通道內(nèi)的兩個或多個可獨立尋址的子通道的一個或多個其它請求來組合所述請求。
19.如權(quán)利要求18所述的系統(tǒng),其特征在于,所述存儲器控制器還包括分配邏輯,用于將所述請求分配給子通道;以及重排緩沖器,用于存儲所述子通道請求。
20.如權(quán)利要求19所述的系統(tǒng),其特征在于,所述存儲器控制器還包括事務(wù)組裝器,用于基于共享地址來組合存儲在每個所述隊列中的子通道請求,并將所述子通道請求轉(zhuǎn)發(fā)到所述相關(guān)聯(lián)的子通道。
21.如權(quán)利要求20所述的系統(tǒng),其特征在于,所述存儲器控制器還包括被耦合到所述分配邏輯的映射邏輯,用于提供對所述子通道的不等分配。
全文摘要
根據(jù)一個實施例,公開了一種存儲器控制器。該存儲器控制器包括分配邏輯和事務(wù)組裝器。分配邏輯接收訪問存儲器通道的請求。事務(wù)組裝器將請求組合到訪問通道內(nèi)一個或多個可獨立尋址的子通道的一個或多個其它請求中。
文檔編號G06F13/16GK1892629SQ20061010039
公開日2007年1月10日 申請日期2006年6月22日 優(yōu)先權(quán)日2005年6月23日
發(fā)明者J·阿基雅瑪, R·奧斯勃尼, W·克理福德 申請人:英特爾公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1