專利名稱:圖形處理器的交織虛擬本地存儲(chǔ)器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖形處理器的虛擬本地存儲(chǔ)器。更具體來(lái)說(shuō),本發(fā)明 涉及將包括系統(tǒng)存儲(chǔ)器以及圖形本地存儲(chǔ)器中的地址位置的物理地址 空間用于圖形處理器。
背景技術(shù):
對(duì)于當(dāng)今的圖形處理器,著重圖形和視頻的許多計(jì)算設(shè)備應(yīng)用變 得復(fù)雜和存儲(chǔ)器密集型。另外,由于移動(dòng)性以及其它很多原因,許多 計(jì)算設(shè)備的大小和價(jià)格大幅減少。即使性能和價(jià)格因素表面上相互有 分歧,終端用戶仍然期望適度^介;f各上的高圖形性能。由于許多原因,適當(dāng)價(jià)位的計(jì)算設(shè)備通常比高端設(shè)備的圖形性能 低。 一個(gè)原因在于,設(shè)備中的中央處理器可能與圖形處理器共享系統(tǒng) 存儲(chǔ)器,從而節(jié)省存儲(chǔ)器組件成本。高端圖形系統(tǒng)通常具有它們自己 獨(dú)立的圖形本地存儲(chǔ)器,圖形本地存儲(chǔ)器的存儲(chǔ)大小比較小,但通常 具有遠(yuǎn)高于系統(tǒng)存儲(chǔ)器的帶寬。此外,圖形密集應(yīng)用越來(lái)越多地不僅 要求高性能存儲(chǔ)器,而且還要求更大量的存儲(chǔ)器。因此,當(dāng)今的計(jì)算機(jī)用戶在涉及計(jì)算設(shè)備上的圖形性能時(shí)可以進(jìn)行選擇支付與圖形本地存儲(chǔ)器相關(guān)聯(lián)的高費(fèi)用,或者支付只有系統(tǒng) 存儲(chǔ)器的計(jì)算設(shè)備的較少費(fèi)用而損失圖形性能。
作為實(shí)例來(lái)說(shuō)明本發(fā)明,但本發(fā)明不受附圖限制,圖中相似的參 考標(biāo)號(hào)表示相似的要素,附圖包括圖1是實(shí)現(xiàn)圖形處理器的虛擬本地存儲(chǔ)器的一個(gè)實(shí)施例的計(jì)算機(jī)系統(tǒng)的框圖。圖2是實(shí)現(xiàn)圖形處理器的虛擬本地存儲(chǔ)器的另一個(gè)實(shí)施例的計(jì)算 機(jī)系統(tǒng)的框圖。圖3是實(shí)現(xiàn)圖形處理器的虛擬本地存儲(chǔ)器的再一個(gè)實(shí)施例的計(jì)算機(jī)系統(tǒng)的框圖。圖4是實(shí)現(xiàn)圖形處理器的虛擬本地存儲(chǔ)器的又一個(gè)實(shí)施例的計(jì)算 機(jī)系統(tǒng)的框圖。圖5描述實(shí)現(xiàn)圖形處理器的虛擬本地存儲(chǔ)器的計(jì)算機(jī)系統(tǒng)的存儲(chǔ) 器使用的一個(gè)實(shí)施例。圖6是用于令圖形處理器以隨機(jī)、交織順序來(lái)訪問(wèn)系統(tǒng)存儲(chǔ)器和 圖形本地存儲(chǔ)器的方法的一個(gè)實(shí)施例的流程圖。圖7描述采用50%的圖形本地存4諾器和50%的系統(tǒng)存儲(chǔ)器分配的 虛擬圖形本地存儲(chǔ)器的一個(gè)實(shí)施例。圖8描述采用75%的圖形本地存儲(chǔ)器和25%的系統(tǒng)存儲(chǔ)器分配的 虛擬圖形本地存儲(chǔ)器的一個(gè)實(shí)施例。圖9描述采用67%的圖形本地存儲(chǔ)器和33%的系統(tǒng)存儲(chǔ)器分配的 虛擬圖形本地存儲(chǔ)器的 一 個(gè)實(shí)施例。
具體實(shí)施方式
公開(kāi)了圖形處理器的虛擬本地存儲(chǔ)器的實(shí)施例。在以下描述中, 闡述了許多具體細(xì)節(jié)。但是要理解,即使沒(méi)有這些具體細(xì)節(jié)也可實(shí)施 這些實(shí)施例。在其它情況下,沒(méi)有詳細(xì)論述7>知的元件、規(guī)范和協(xié)議, 以免影響對(duì)本發(fā)明的理解。實(shí)現(xiàn)圖形處理器的虛擬本地存儲(chǔ)器可有效地減輕要求用戶在具有 圖形本地存儲(chǔ)器的計(jì)算設(shè)備的高費(fèi)用或者僅具有系統(tǒng)存儲(chǔ)器的計(jì)算設(shè) 備的低性能之間作出選擇的問(wèn)題。虛擬本地存儲(chǔ)器的實(shí)施例允許圖形 處理器具有同時(shí)利用圖形本地存儲(chǔ)器和系統(tǒng)存儲(chǔ)器來(lái)建立圖形成本與 性能的良好平衡的能力。通過(guò)使用例如1個(gè)通道的較少量圖形存儲(chǔ)器 以及系統(tǒng)存儲(chǔ)器,虛擬本地存儲(chǔ)器綜合了例如2個(gè)通道的純圖形本地存儲(chǔ)器的等效帶寬。在最簡(jiǎn)單的VLM選擇中, 一半所需帶寬來(lái)自圖 形本地存儲(chǔ)器通道,以及一半所需帶寬來(lái)自系統(tǒng)存儲(chǔ)器。虛擬本地存儲(chǔ)器的概念與統(tǒng)一存儲(chǔ)器體系結(jié)構(gòu)(系統(tǒng)+圖形存儲(chǔ)器) 相同,利用處理器和圖形不會(huì)始終同時(shí)需要峰值帶寬的事實(shí),它將共 享處理器與圖形之間的物理資源以降低成本。然而,虛擬本地存儲(chǔ)器 與統(tǒng)一存儲(chǔ)器體系結(jié)構(gòu)具有兩個(gè)重要的差別。首先,虛擬本地存儲(chǔ)器增加可專用于圖形的某種物理存儲(chǔ)器,以 便減少所需的雙倍數(shù)據(jù)速率(DDR)通道的數(shù)量。 一個(gè)圖形雙倍數(shù)據(jù)速 率(GDDR)通道處于1.5x與2X的DDR通道的速度(對(duì)于可比較的技術(shù)) 之間,并且易于適應(yīng)平臺(tái)以及具有比DDR存儲(chǔ)器的2個(gè)替換通道更低 的成本。其次,雖然虛擬本地存儲(chǔ)器共享處理器與圖形之間的物理資 源,但它不共享地址空間。處理器和圖形具有分離的地址空間。圖1是實(shí)現(xiàn)圖形處理器的虛擬本地存儲(chǔ)器的一個(gè)實(shí)施例的計(jì)算機(jī) 系統(tǒng)的框圖。在一個(gè)實(shí)施例中,計(jì)算機(jī)系統(tǒng)包含中央處理器100和芯 片組102。耦合到中央處理器100以及芯片組102的互連104用于這 兩個(gè)代理之間的通信。互連104包括發(fā)送仲裁、地址、數(shù)據(jù)和控制信 息的特定互連線(未示出)。在另一個(gè)實(shí)施例中,存在耦合到互連104 的多個(gè)中央處理器(在這個(gè)圖中沒(méi)有示出多個(gè)處理器)。在一個(gè)實(shí)施例中,集成到芯片組102上的系統(tǒng)存儲(chǔ)控制器106對(duì) 中央處理器IOO提供通過(guò)互連110對(duì)系統(tǒng)存^l器子系統(tǒng)108的訪問(wèn)。 在一個(gè)實(shí)施例中,圖形處理器112集成在芯片組102上。此外,在一 個(gè)實(shí)施例中,同樣集成到芯片組102上的圖形本地存儲(chǔ)控制器114對(duì) 圖形處理器112提供通過(guò)互連118對(duì)圖形本地存儲(chǔ)器子系統(tǒng)116的訪 問(wèn)。在一個(gè)實(shí)施例中,計(jì)算機(jī)系統(tǒng)具有系統(tǒng)存儲(chǔ)器108的兩個(gè)通道(Ch 1和Ch2)以及圖形本地存儲(chǔ)器116的兩個(gè)通道(Ch 1和Ch 2)。在不同 的實(shí)施例中,系統(tǒng)存儲(chǔ)控制器106可耦合到系統(tǒng)存儲(chǔ)器的一個(gè)、兩個(gè)、 三個(gè)、四個(gè)或更多通道,以及圖形本地存儲(chǔ)控制器114可耦合到圖形 本地存儲(chǔ)器的一個(gè)、兩個(gè)、三個(gè)、四個(gè)或更多通道?;ミB110和118包括發(fā)送仲裁、地址、數(shù)據(jù)和控制信息的特定互連線(未示出)。信息、指令和其它數(shù)據(jù)可存儲(chǔ)在系統(tǒng)存儲(chǔ)器108的通道1和2中,供中夾處 理器100、圖形處理器112以及其它許多可能的設(shè)備使用。此外,信 息、指令和其它數(shù)據(jù)可存儲(chǔ)在圖形本地存儲(chǔ)器114的通道1和2中, 供圖形處理器110使用。在另一個(gè)實(shí)施例中,不存在圖形本地存儲(chǔ)器 114,因此,系統(tǒng)存儲(chǔ)器108的通道1和2是圖形處理器112可使用的 唯一存儲(chǔ)器存儲(chǔ)。這種配置對(duì)于圖形存儲(chǔ)器性能不是最佳的,因?yàn)榛?連110是圖形處理器112與系統(tǒng)存儲(chǔ)器108之間的唯一鏈路。在這個(gè) 實(shí)施例中,互連IIO和系統(tǒng)存儲(chǔ)器108與中央處理器共享,因此,圖 形處理器112沒(méi)有任何專用存儲(chǔ)器通道,也沒(méi)有快速存儲(chǔ)器(對(duì)于相等 寬度的接口,系統(tǒng)存儲(chǔ)器一般具有比圖形本地存儲(chǔ)器低的帶寬)。因此, 有益的是令圖形處理器112將一個(gè)或多個(gè)專用圖形本地存儲(chǔ)器通道用 于性能目的。因此,在一個(gè)實(shí)施例中,計(jì)算機(jī)系統(tǒng)具有圖形本地存儲(chǔ)器,以及 圖形處理器112僅將圖形本地存儲(chǔ)器116用于信息存儲(chǔ)。為了對(duì)圖形 處理器提供足夠的存儲(chǔ)器帶寬,可能需要兩個(gè)或兩個(gè)以上圖形本地存 儲(chǔ)器通道,因而沒(méi)有來(lái)自存儲(chǔ)器的性能限制。對(duì)于相等寬度的接口, 圖形本地存儲(chǔ)器一般具有比系統(tǒng)存儲(chǔ)器更高的帶寬(如上所述),因此 它的每兆字節(jié)通常比等量的系統(tǒng)存儲(chǔ)器更昂貴。因此,這種解決方案 對(duì)于圖形存儲(chǔ)器性能是有益的,但一般比僅實(shí)現(xiàn)系統(tǒng)存儲(chǔ)器的實(shí)施例 具有更高的成本。因此,在另一個(gè)實(shí)施例中,圖形處理器112利用系統(tǒng)存儲(chǔ)器108 以及圖形本地存儲(chǔ)器116來(lái)存儲(chǔ)信息。在這個(gè)實(shí)施例中,圖形處理器 112獲益于通過(guò)一個(gè)或多個(gè)系統(tǒng)存儲(chǔ)器通道所補(bǔ)充的一個(gè)或多個(gè)圖形 本地存儲(chǔ)器通道的速度,從而降低所需圖形本地存儲(chǔ)器通道的整體數(shù) 量。因此,利用系統(tǒng)存儲(chǔ)器帶寬來(lái)補(bǔ)充圖形本地存儲(chǔ)器帶寬允許計(jì)算 機(jī)系統(tǒng)具有較少的圖形本地存儲(chǔ)器,同時(shí)保持相同的總圖形帶寬要求 來(lái)維持性能。圖2是實(shí)現(xiàn)圖形處理器的虛擬本地存儲(chǔ)器的另一個(gè)實(shí)施例的計(jì)算機(jī)系統(tǒng)的框圖。圖1中的計(jì)算機(jī)系統(tǒng)的描述在大多數(shù)情況下也適用于圖2。此外,圖2描述單芯片系統(tǒng)。在這個(gè)實(shí)施例中,中央處理器202 和芯片組204駐留在同一個(gè)芯片200上。否則,圖2中的計(jì)算機(jī)系統(tǒng) 以類似于圖1中詳細(xì)描述的計(jì)算機(jī)系統(tǒng)的方式運(yùn)行。圖3是實(shí)現(xiàn)圖形處理器的虛擬本地存儲(chǔ)器的再一個(gè)實(shí)施例的計(jì)算 機(jī)系統(tǒng)的框圖。圖1中的計(jì)算機(jī)系統(tǒng)的描述在大多數(shù)情況下也適用于 圖3。此外,圖3描述在單芯片300上結(jié)合了中央處理器302和圖形 處理器304的計(jì)算機(jī)系統(tǒng)。中央處理器302和圖形處理器304通過(guò)互 連308與芯片組306進(jìn)行通信。系統(tǒng)存儲(chǔ)控制器310和圖形本地存儲(chǔ) 控制器316均設(shè)置在芯片組306上,以便分別提供通過(guò)互連314對(duì)系 統(tǒng)存儲(chǔ)器的訪問(wèn)以及通過(guò)互連320對(duì)圖形本地存儲(chǔ)器318的訪問(wèn)。圖4是實(shí)現(xiàn)圖形處理器的虛擬本地存儲(chǔ)器的又一個(gè)實(shí)施例的計(jì)算 機(jī)系統(tǒng)的框圖。在一個(gè)實(shí)施例中,計(jì)算機(jī)系統(tǒng)包含中央處理器400。 在這個(gè)實(shí)施例中,系統(tǒng)存儲(chǔ)控制器402集成到中央處理器400上,以 便提供通過(guò)互連406對(duì)系統(tǒng)存儲(chǔ)器404的訪問(wèn)。在一個(gè)實(shí)施例中,計(jì) 算機(jī)系統(tǒng)還包含芯片組408?;ミB410提供中央處理器400與芯片組 408之間的通信鏈路。在一個(gè)實(shí)施例中,圖形處理器412集成在芯片 組408上。在一個(gè)實(shí)施例中,圖形本地存儲(chǔ)控制器也集成到芯片組408 上,以便提供通過(guò)互連418對(duì)圖形本地存儲(chǔ)器416的訪問(wèn)?;ミB406、 410和418全部用于代理之間的通信。這些互連包括發(fā)送仲裁、地址、 數(shù)據(jù)和控制信息的特定互連線(未示出)。同樣在另一個(gè)實(shí)施例中,存 在設(shè)置于計(jì)算機(jī)系統(tǒng)中并耦合到互連406、 410的多個(gè)中央處理器(在 這個(gè)圖中沒(méi)有示出多個(gè)處理器)。在另 一個(gè)實(shí)施例中,圖形處理器和圖形本地存儲(chǔ)控制器均與中央 處理器設(shè)置在相同的集成芯片上(未示出)。在這個(gè)實(shí)施例中,圖形本 地存儲(chǔ)器具有到這個(gè)集成芯片的直接互連。在這個(gè)實(shí)施例中,系統(tǒng)存 儲(chǔ)控制器設(shè)置在芯片組上,以及系統(tǒng)存儲(chǔ)器具有到該芯片組的直接互 連。另外,在這個(gè)實(shí)施例中,集成芯片(包含中央處理器、圖形處理器 和圖形本地存儲(chǔ)控制器)通過(guò)耦合到兩種設(shè)備的公共互連與芯片組(包含系統(tǒng)存儲(chǔ)控制器)進(jìn)行通信。圖5描述實(shí)現(xiàn)圖形處理器的虛擬本地存儲(chǔ)器的計(jì)算機(jī)系統(tǒng)的存儲(chǔ) 器使用的一個(gè)實(shí)施例。在這個(gè)示例實(shí)施例中,圖形處理器具有對(duì)圖形 本地存儲(chǔ)器通道1以及圖形本地存儲(chǔ)器通道2(如對(duì)于兩個(gè)通道采用交 叉陰影線的位置O到X表示)的單獨(dú)使用權(quán)。另外,圖形處理器具有對(duì)系統(tǒng)存儲(chǔ)器的一部分(如對(duì)于兩個(gè)通道采用交叉陰影線的位置m到 m+n表示)的單獨(dú)使用權(quán)。因此,在這個(gè)實(shí)施例中,在各系統(tǒng)存儲(chǔ)器通 道中以位置m開(kāi)始,n個(gè)系統(tǒng)存儲(chǔ)位置的塊被保留,供圖形處理器單 獨(dú)使用。圖形虛擬本地存儲(chǔ)器地址空間表明在左側(cè)的、圖形處理器知 道的虛擬地址位置(在這個(gè)實(shí)例中為0-z)以及在右側(cè)的、與圖形本地存 儲(chǔ)器通道和系統(tǒng)存儲(chǔ)器通道中的實(shí)際位置相對(duì)應(yīng)的物理地址位置。因 此,虛擬地址0對(duì)應(yīng)于圖形本地存4諸器通道1-地址0,虛擬地址1對(duì) 應(yīng)于圖形本地存儲(chǔ)器通道2-地址0,虛擬地址3對(duì)應(yīng)于系統(tǒng)存儲(chǔ)器通 道1-地址m,依此類推。在這種情況下 n=x。 在這個(gè)實(shí)例中,對(duì)于線 性訪問(wèn)流,圖形處理器訪問(wèn)圖形本地存儲(chǔ)器平均占所有存儲(chǔ)器存取的 50%,以及訪問(wèn)系統(tǒng)存儲(chǔ)器占所有存儲(chǔ)器存取的其余50%。百分比根 據(jù)在這個(gè)示例實(shí)施例中實(shí)現(xiàn)的虛擬存儲(chǔ)空間使用情況來(lái)估計(jì)。對(duì)系統(tǒng) 存儲(chǔ)器和圖形本地存儲(chǔ)器的訪問(wèn)才莫式是平均的,因?yàn)闆](méi)有使它們準(zhǔn)確 的基于時(shí)間的順序才莫式。如果所有虛擬存儲(chǔ)位置被裝載,并且存在對(duì) 所有虛擬存儲(chǔ)位置訪問(wèn)相同次數(shù)的均勻訪問(wèn)模式,則存儲(chǔ)器通道訪問(wèn) 百分比通常是準(zhǔn)確的。在現(xiàn)實(shí)世界應(yīng)用中,均勻訪問(wèn)模式很少是這種 情況,因此平均訪問(wèn)百分比根據(jù)虛擬地址空間中的圖形本地存儲(chǔ)器通 道位置和系統(tǒng)存儲(chǔ)器通道位置的分布來(lái)估計(jì)。因此,這些平均訪問(wèn)百 分比表示由圖形處理器對(duì)一個(gè)或多個(gè)系統(tǒng)存儲(chǔ)器通道和一個(gè)或多個(gè)圖 形本地存儲(chǔ)器通道的交織訪問(wèn)才莫式。圖形本地存儲(chǔ)器與系統(tǒng)存儲(chǔ)器之 間的帶寬的分配是其結(jié)果。本領(lǐng)域的技術(shù)人員會(huì)理解,地址交織可一 般化為超過(guò)所示的單元位置粒度而包括其它交織粒度,例如超過(guò)所示 的單元位置粒度2個(gè)位置的塊。圖6是用于令圖形處理器以隨機(jī)、交織順序來(lái)訪問(wèn)系統(tǒng)存儲(chǔ)器和圖形本地存儲(chǔ)器的方法的一個(gè)實(shí)施例的流程圖。該方法通過(guò)可包括硬 件(電路、專用邏輯等)、軟件(例如運(yùn)行于通用計(jì)算機(jī)系統(tǒng)或?qū)S脵C(jī)器 上的)或者它們兩者的結(jié)合的處理邏輯來(lái)執(zhí)行。在一個(gè)實(shí)施例中,處理邏輯設(shè)置在具有集成圖形處理器的芯片組中。參照?qǐng)D6,該方法通過(guò) 處理邏輯接收對(duì)圖形虛擬本地存儲(chǔ)器地址空間中的位置的存儲(chǔ)器存取 請(qǐng)求開(kāi)始(處理框600)。隨后,處理邏輯通過(guò)查找虛擬本地存儲(chǔ)器地址 所表示的物理地址來(lái)處理存取請(qǐng)求(處理框602)。上文中參照?qǐng)D5描述 了物理地址與虛擬本地存儲(chǔ)器地址之間的關(guān)系。然后,處理邏輯獲得 查找結(jié)果,并確定所請(qǐng)求存取是對(duì)于系統(tǒng)存儲(chǔ)器通道還^^"于圖形本 地存儲(chǔ)器通道(處理框604)。如果處理邏輯確定該存取是對(duì)于圖形本地 存儲(chǔ)器通道,則處理邏輯將虛擬地址轉(zhuǎn)換為對(duì)應(yīng)的圖形本地存儲(chǔ)器地 址并完成存儲(chǔ)器存取(處理框606)。否則,如果處理邏輯確定該存取是 對(duì)于系統(tǒng)存儲(chǔ)器通道,則處理邏輯將虛擬地址轉(zhuǎn)換為對(duì)應(yīng)的圖形本地 存儲(chǔ)器地址并完成存儲(chǔ)器存取(處理框608),然后該過(guò)程完成。圖7至圖9描述虛擬地址空間中的圖形本地存儲(chǔ)器和系統(tǒng)存儲(chǔ)器 可能的分配的不同示例實(shí)施例。圖4中的計(jì)算^L系統(tǒng)的描述也適用于 圖7-9中的計(jì)算機(jī)系統(tǒng)。圖7-9具有圖4所示的所有存儲(chǔ)控制器和功能 性,但為了方便起見(jiàn)將它們進(jìn)行簡(jiǎn)化。圖7描述采用50%的圖形本地存儲(chǔ)器和50%的系統(tǒng)存儲(chǔ)器分配的 虛擬圖形本地存^f渚器的一個(gè)實(shí)施例。在這個(gè)實(shí)施例中,圖形帶寬的一 半來(lái)自圖形處理器本地的存儲(chǔ)器,以及另一半通過(guò)互連700來(lái)自系統(tǒng) 存儲(chǔ)器。在一個(gè)實(shí)施例中,系統(tǒng)存儲(chǔ)器702由DDR3(雙倍數(shù)據(jù)速率3) 存儲(chǔ)器的兩個(gè)通道組成,以及圖形本地存儲(chǔ)器704由GDDR(圖形雙倍 數(shù)據(jù)速率)存儲(chǔ)器的一個(gè)通道組成。在這個(gè)實(shí)施例的一個(gè)例示中,GDDR通道具有DDR3的各通道的雙倍帶寬容量供圖形處理器使用 (即,如果GDDR為1個(gè)單位的帶寬,則各DDR3為0.5個(gè)單位的帶寬)。 因此,在這個(gè)例示中,50。/。的圖形處理器的存儲(chǔ)器帶寬來(lái)自兩個(gè)DDR3 系統(tǒng)存儲(chǔ)器通道,以及另外50%來(lái)自一個(gè)GDDR圖形本地存儲(chǔ)器通道。 這個(gè)具體例示具有兩個(gè)缺點(diǎn)各個(gè)圖形存儲(chǔ)器通道的峰值帶寬必須是系統(tǒng)存儲(chǔ)器的各通道的峰值帶寬的兩倍;以及當(dāng)圖形正使用全帶寬時(shí), 沒(méi)有系統(tǒng)帶寬可用于CPU??赏ㄟ^(guò)采用系統(tǒng)存儲(chǔ)器通道(例如DDR3) 和圖形存儲(chǔ)器通道(例如GDDR)速度的任何組合來(lái)解決第 一個(gè)缺點(diǎn)。 但是,在這種情況下,根據(jù)圖形對(duì)系統(tǒng)存儲(chǔ)器帶寬的定量,系統(tǒng)存儲(chǔ) 器或者圖形存儲(chǔ)器可能未充分利用??赏ㄟ^(guò)使系統(tǒng)存儲(chǔ)器通道的峰值 帶寬大于圖形存儲(chǔ)器通道的峰值帶寬的一半,來(lái)解決第二個(gè)缺點(diǎn)。這 樣,當(dāng)圖形本地存儲(chǔ)器^皮完全利用時(shí),仍然存在從系統(tǒng)存儲(chǔ)器通道可 得到的帶寬容量來(lái)為CPU提供服務(wù)。圖8描述采用75%的圖形本地存儲(chǔ)器和25%的系統(tǒng)存儲(chǔ)器分配的 虛擬圖形本地存儲(chǔ)器的一個(gè)實(shí)施例。在這個(gè)示例實(shí)施例中,四分之三的帶寬來(lái)自圖形處理器本地的存儲(chǔ)器,以及四分之一通過(guò)互連800來(lái) 自系統(tǒng)存儲(chǔ)器。在這個(gè)示例實(shí)施例中,系統(tǒng)存儲(chǔ)器802由DDR3存儲(chǔ) 器的兩個(gè)通道組成,以及圖形本地存儲(chǔ)器804由DDR存儲(chǔ)器的一個(gè)通 道和GDDR存儲(chǔ)器的一個(gè)通道組成。這個(gè)實(shí)施例增加了圖形處理器本 地的更多存儲(chǔ)器帶寬,以便降低中央處理器上的干擾。在這個(gè)示例實(shí)施例中,GDDR通道具有圖形本地存儲(chǔ)器DDR通 道的雙倍帶寬容量供圖形處理器使用(即,如果GDDR為1個(gè)單位的帶 寬,則圖形本地存儲(chǔ)器DDR為0.5個(gè)單位的帶寬)。這個(gè)本地存儲(chǔ)器 DDR可能比GDDR更便宜,因?yàn)樗哂懈?,同時(shí)也比系統(tǒng)存 儲(chǔ)器通道便宜,因?yàn)楸认到y(tǒng)存儲(chǔ)器需要更小的容量,因而需要更少的 存儲(chǔ)設(shè)備。此外,各DDR3系統(tǒng)存儲(chǔ)器通道提供圖形本地存儲(chǔ)器DDR 通道的一半帶寬供圖形處理器使用(即,如果圖形本地存儲(chǔ)器DDR為 0.5個(gè)單位的帶寬,則各DDR3系統(tǒng)存儲(chǔ)器通道提供0.25個(gè)單位的帶 寬)。因此,在這個(gè)示例實(shí)施例中,25%的圖形處理器的存儲(chǔ)器帶寬來(lái) 自兩個(gè)DDR3系統(tǒng)存儲(chǔ)器通道,以及另外75%來(lái)自GDDR圖形本地存 儲(chǔ)器通道和DDR圖形本地存儲(chǔ)器通道。在這個(gè)實(shí)例中,由于DDR3 通道僅提供總圖形存儲(chǔ)器帶寬的25%,所以可能存在更多帶寬可用于 CPU,因?yàn)镈DR3通道峰值存儲(chǔ)器帶寬大約為GDDR通道峰值存儲(chǔ)器 帶寬的一半。其它變形例也是可行的,在其中,DDR本地圖形存儲(chǔ)器是比系統(tǒng)存儲(chǔ)器更慢、更便宜的存儲(chǔ)器,由此降低系統(tǒng)成本。圖9描述采用67%的圖形本地存儲(chǔ)器和33%的系統(tǒng)存儲(chǔ)器分配的 虛擬圖形本地存儲(chǔ)器的一個(gè)實(shí)施例。因此,在這個(gè)示例實(shí)施例中,三 分之二的帶寬來(lái)自圖形處理器本地的存儲(chǔ)器,以及三分之一通過(guò)互連 900來(lái)自系統(tǒng)存儲(chǔ)器。在這個(gè)示例實(shí)施例中,系統(tǒng)存儲(chǔ)器902由DDR3 存儲(chǔ)器的兩個(gè)通道組成,以及圖形本地存儲(chǔ)器904由GDDR存儲(chǔ)器的 兩個(gè)通道組成。這個(gè)實(shí)施例又增加了圖形處理器本地的更多存儲(chǔ)器帶 寬,以便改進(jìn)圖形性能。在這個(gè)示例實(shí)施例中,各個(gè)GDDR圖形本地存儲(chǔ)器通道具有各 DDR3系統(tǒng)存儲(chǔ)器通道的雙倍帶寬容量供圖形處理器使用(即,如果一 個(gè)GDDR通道為1個(gè)單位的帶寬,則各DDR3通道為0.5個(gè)單位的帶 寬)。因此,在這個(gè)示例實(shí)施例中,33%的圖形處理器的存儲(chǔ)器帶寬來(lái) 自兩個(gè)DDR3系統(tǒng)存儲(chǔ)器通道,以及另外67%來(lái)自兩個(gè)GDDR圖形本 地存儲(chǔ)器通道。如結(jié)合圖7所述,這個(gè)實(shí)施例可一般化為具有GDDR 對(duì)DDR3通道帶寬的任何比率。所示的所有選擇可對(duì)于圖1至圖4所示并結(jié)合那些附圖描述的拓 樸結(jié)構(gòu)的任一個(gè)重復(fù)進(jìn)行。這樣,公開(kāi)了圖形處理器的虛擬本地存儲(chǔ)器的實(shí)施例。參照其中 具體的示范性實(shí)施例描述了這些實(shí)施例。但是,獲益于本公開(kāi)的技術(shù) 人員很清楚,可在不背離本文所述實(shí)施例的廣義精神及范圍的前提下, 對(duì)這些實(shí)施例進(jìn)行各種修改和改變。因此,說(shuō)明書(shū)和附圖要看作^Jlf 釋性的而不是限制性的。
權(quán)利要求
1.一種設(shè)備,包括一個(gè)或多個(gè)圖形本地存儲(chǔ)器通道;一個(gè)或多個(gè)系統(tǒng)存儲(chǔ)器通道;以及圖形處理器,可用于以交織方式來(lái)訪問(wèn)所述一個(gè)或多個(gè)圖形本地存儲(chǔ)器通道以及所述一個(gè)或多個(gè)系統(tǒng)存儲(chǔ)器通道。
2. 如權(quán)利要求l所述的設(shè)備,其特征在于,還包括中央處理器, 可用于訪問(wèn)所述一個(gè)或多個(gè)系統(tǒng)存^f諸器通道。
3. 如權(quán)利要求2所述的設(shè)備,其特征在于,所述圖形處理器和所 述中央處理器各具有互斥的系統(tǒng)存儲(chǔ)器地址空間。
4. 如權(quán)利要求l所述的設(shè)備,其特征在于,還包括耦合到所述圖 形處理器和所述中央處理器的互連。
5. 如權(quán)利要求4所述的設(shè)備,其特征在于,所述一個(gè)或多個(gè)圖形 本地存儲(chǔ)器通道和所述一個(gè)或多個(gè)系統(tǒng)存儲(chǔ)器通道耦合到所述圖形處 理器。
6. 如權(quán)利要求4所述的設(shè)備,其特征在于,所述一個(gè)或多個(gè)圖形 本地存儲(chǔ)器通道和所述一個(gè)或多個(gè)系統(tǒng)存儲(chǔ)器通道耦合到所述中央處 理器。
7. 如權(quán)利要求4所述的設(shè)備,其特征在于,所述一個(gè)或多個(gè)圖形 本地存儲(chǔ)器通道耦合到所述圖形處理器,以及所述一個(gè)或多個(gè)系統(tǒng)存 儲(chǔ)器通道耦合到所述中央處理器。
8. 如權(quán)利要求l所述的設(shè)備,其特征在于,還包括存儲(chǔ)控制器, 可用于為所述圖形處理器4是供對(duì)所述存儲(chǔ)器通道的訪問(wèn)。
9. 如權(quán)利要求l所述的設(shè)備,其特征在于,所述圖形處理器在物 理上設(shè)置在芯片組中。
10. 如權(quán)利要求1所述的設(shè)備,其特征在于,還包括兩個(gè)或兩個(gè) 以上圖形本地存儲(chǔ)器通道,其中,至少一個(gè)通道包括圖形雙倍數(shù)據(jù)速 率存儲(chǔ)器,以及至少一個(gè)通道包括雙倍數(shù)據(jù)速率存儲(chǔ)器。
11. 一種方法,包括以下步驟圖形處理器以交織方式來(lái)訪問(wèn)一 個(gè)或多個(gè)圖形本地存儲(chǔ)器通道以及一個(gè)或多個(gè)系統(tǒng)存儲(chǔ)器通道。
12. 如權(quán)利要求11所述的方法,其特征在于,還包括以下步驟 中央處理器訪問(wèn)所述一個(gè)或多個(gè)系統(tǒng)存儲(chǔ)器通道。
13. 如權(quán)利要求12所述的方法,其特征在于,所述圖形處理器和 所述中央處理器各具有互斥的系統(tǒng)存儲(chǔ)器地址空間。
14. 一種系統(tǒng),包括 第一總線;耦合到所述總線的系統(tǒng)存儲(chǔ)器; 笫二總線;耦合到所述第二總線的圖形本地存儲(chǔ)器; 耦合到所述第一總線和第二總線的圖形處理器;以及 存儲(chǔ)控制器,可用于通過(guò)以交織方式訪問(wèn)所述圖形本地存儲(chǔ)器和 所述系統(tǒng)存儲(chǔ)器,來(lái)對(duì)所述圖形處理器提供存儲(chǔ)器存取。
15. 如權(quán)利要求14所述的系統(tǒng),其特征在于,還包括可用于訪問(wèn) 所述一個(gè)或多個(gè)系統(tǒng)存儲(chǔ)器通道的中央處理器。
16. 如權(quán)利要求15所述的系統(tǒng),其特征在于,所述圖形處理器和 所述中央處理器各具有互斥的系統(tǒng)存儲(chǔ)器地址空間。
17. 如權(quán)利要求14所述的系統(tǒng),其特征在于,所述系統(tǒng)存儲(chǔ)器和 所述圖形本地存儲(chǔ)器還各包括一個(gè)或多個(gè)存儲(chǔ)器通道。
全文摘要
公開(kāi)了一種設(shè)備、方法和系統(tǒng)。在一個(gè)實(shí)施例中,設(shè)備包括一個(gè)或多個(gè)圖形本地存儲(chǔ)器通道;一個(gè)或多個(gè)系統(tǒng)存儲(chǔ)器通道;以及圖形處理器,可用于以交織方式來(lái)訪問(wèn)一個(gè)或多個(gè)圖形本地存儲(chǔ)器通道以及一個(gè)或多個(gè)系統(tǒng)存儲(chǔ)器通道。
文檔編號(hào)G06T1/60GK101273380SQ200680035206
公開(kāi)日2008年9月24日 申請(qǐng)日期2006年9月26日 優(yōu)先權(quán)日2005年9月30日
發(fā)明者R·奧斯博恩 申請(qǐng)人:英特爾公司