專利名稱:分立的圖形系統(tǒng)與方法
技術(shù)領(lǐng)域:
本發(fā)明一般而言涉及計(jì)算機(jī)實(shí)現(xiàn)的圖形。更具體而言,本發(fā)明專注用于圖形應(yīng)用的高度可擴(kuò)展的圖形處理器。本發(fā)明公開了一種獨(dú)立于計(jì)算機(jī)系統(tǒng)波形因數(shù)的獨(dú)立圖形的方法與系統(tǒng)。
背景技術(shù):
三維(3D)圖形圖像的繪制(rendering)是多種電子游戲和其他應(yīng)用感興趣的內(nèi)容。繪制是一個(gè)通用術(shù)語,其描述了從3D對(duì)象的數(shù)據(jù)庫表示轉(zhuǎn)換到在觀察面上的所述對(duì)象的偽二維投影的全部多步處理。
所述繪制處理包括多個(gè)步驟,諸如,例如,建立包含了隨后進(jìn)行明暗和紋理處理所需的信息的多邊形模型,將線性變換應(yīng)用于所述多邊形網(wǎng)格模型,挑選背面多邊形,對(duì)照視體對(duì)所述多邊形進(jìn)行裁減,掃描轉(zhuǎn)換/光柵化(rasterizing)所述多邊形為象素坐標(biāo)集,以及利用插值或增量的明暗技術(shù)對(duì)單個(gè)象素進(jìn)行明暗/光照處理。
圖形處理單元(GPU)為專用集成電路裝置,其通常被用在圖形系統(tǒng)中以加速3D繪制應(yīng)用的性能。通常將GPU與中央處理單元(CPU)配合使用,從而為在計(jì)算機(jī)系統(tǒng)上執(zhí)行的一個(gè)或多個(gè)應(yīng)用生成3D圖像?,F(xiàn)代GPU典型地利用用于處理數(shù)據(jù)的圖形流水線。
現(xiàn)代GPU子系統(tǒng)(例如,內(nèi)插式圖形卡等等)的影響力日益包括臺(tái)式機(jī)系統(tǒng)全部?jī)r(jià)值的更大部分,并且能夠與計(jì)算機(jī)系統(tǒng)的CPU的復(fù)雜性和完善性相匹敵?,F(xiàn)代GPU可以包括具有2億個(gè)晶體管并且以幾百M(fèi)Hz運(yùn)行的集成電路裝置。這種現(xiàn)代GPU可以消耗幾百瓦的功率并且需要仔細(xì)設(shè)計(jì)的熱防護(hù)組件(例如,散熱風(fēng)扇,足夠的通風(fēng)等等)。
一般而言,GPU子系統(tǒng)(例如,GPU圖形卡)的布圖和性能受到很多整個(gè)系統(tǒng)的設(shè)計(jì)因素的約束。GPU子系統(tǒng)通常被設(shè)計(jì)為用接口與ATX兼容計(jì)算機(jī)系統(tǒng)主板連接。所述ATX波形因數(shù)是指由主導(dǎo)產(chǎn)業(yè)制造商支持的被廣泛使用的產(chǎn)業(yè)標(biāo)準(zhǔn)主板波形因數(shù)。這種制造商包括,例如,CPU制造商、芯片組制造商、主板制造商等等。
例如,所述ATX波形因數(shù)允許用于插卡式GPU的有限數(shù)量的空間。典型的插卡式GPU經(jīng)由AGP插槽連接到所述主板。所述AGP插槽具有用于所述插卡式GPU的組件的有限數(shù)量的空間。所述有限數(shù)量的空間直接影響所述插卡式GPU的熱防護(hù)組件的效率。另外,由于已經(jīng)提高了插卡式GPU的性能,所述AGP連接的可用功率(例如,額定電壓或電流)已經(jīng)逐漸變得不足。
BTX波形因數(shù)是指更新近的產(chǎn)業(yè)標(biāo)準(zhǔn)主板波形因數(shù)。所述BTX波形因數(shù)通常被認(rèn)為是遵循“臺(tái)式”PC機(jī)殼規(guī)范的下一代ATX,與更早的ATX波形因數(shù)一樣,其得到所述主導(dǎo)產(chǎn)業(yè)制造商的廣泛支持。不幸的是,所述BTX波形因數(shù)關(guān)于高性能GPU子系統(tǒng)甚至存在更多的問題。
所述BTX波形因數(shù)的問題在于,所述BTX設(shè)計(jì)規(guī)則設(shè)置了多個(gè)關(guān)于GPU子系統(tǒng)的型式和性能的約束。例如,BTX設(shè)計(jì)規(guī)則將所述臺(tái)式機(jī)系統(tǒng)的CPU置于冷卻氣流的前入口點(diǎn),而將所述GPU子系統(tǒng)(例如,圖形卡)置于其下游氣流中,并且對(duì)所述GPU子系統(tǒng)的物理尺寸(例如x-y-z大小)、可用氣流、可用散熱、以及功率輸送加以限制。
類似的約束存在于膝上型計(jì)算機(jī)系統(tǒng)波形因數(shù)中。例如,用于膝上型計(jì)算機(jī)的GPU子系統(tǒng)的未來演進(jìn)受到這樣的事實(shí)的約束,即為了CPU及其相關(guān)芯片組的需要而優(yōu)化膝上型機(jī)殼(例如,主板平臺(tái),外殼,氣流等等)。該優(yōu)化限制了對(duì)于任何圖形子系統(tǒng)的實(shí)現(xiàn)的可用散熱預(yù)算、功率輸送、以及物理尺寸(例如x-y-z大小)。
通過一些最近出現(xiàn)的產(chǎn)業(yè)標(biāo)準(zhǔn)還將約束置于GPU子系統(tǒng)的未來性能演進(jìn)上。PCI Express是一種這樣的標(biāo)準(zhǔn)。一些版本的PCI Express標(biāo)準(zhǔn)規(guī)定了耦合器件(coupled device)的最大可用功率(例如,由用于PCI Express圖形系統(tǒng)的PCI SIG規(guī)范所規(guī)定的150W)。當(dāng)GPU子系統(tǒng)性能繼續(xù)發(fā)展時(shí),高端GPU的實(shí)現(xiàn)的需要可能大大超過規(guī)定的最大可用功率。除了功率不足,一些版本的PCI Express標(biāo)準(zhǔn)在所述GPU子系統(tǒng)和所述計(jì)算機(jī)系統(tǒng)平臺(tái)的其余部分(例如,系統(tǒng)存儲(chǔ)器,CPU等等)之間規(guī)定的帶寬不夠。所述不足的帶寬通過阻塞在所述GPU子系統(tǒng)和所述計(jì)算機(jī)平臺(tái)資源之間的數(shù)據(jù)通路,限制了所述GPU子系統(tǒng)性能的向上可擴(kuò)展性。
發(fā)明內(nèi)容
本發(fā)明的實(shí)施例提供了一種獨(dú)立于計(jì)算機(jī)系統(tǒng)波形因數(shù)的獨(dú)立圖形的方法與系統(tǒng)。本發(fā)明的實(shí)施例應(yīng)該消除限制了GPU子系統(tǒng)的向上可擴(kuò)展性的數(shù)據(jù)傳輸帶寬約束和波形因數(shù)約束。
在一個(gè)實(shí)施例中,本發(fā)明被實(shí)現(xiàn)為用于執(zhí)行計(jì)算機(jī)系統(tǒng)的3D圖形指令的分立的圖形系統(tǒng)(discrete graphics system,DGS)。所述分立的圖形系統(tǒng)包括用于執(zhí)行3D圖形指令的一個(gè)或多個(gè)GPU以及被配置以封裝所述GPU的DGS系統(tǒng)機(jī)殼(system chassis)。串行總線連接器嵌入到所述DGS系統(tǒng)機(jī)殼并且被配置以連接到所述GPU。所述串行總線連接器被配置以將所述DGS和所述GPU可拆卸地連接到所述計(jì)算機(jī)系統(tǒng)。所述DGS的GPU經(jīng)由所述串行總線連接器訪問所述計(jì)算機(jī)系統(tǒng)以執(zhí)行所述計(jì)算機(jī)系統(tǒng)的3D圖形指令。在一個(gè)實(shí)施例中,然后所述被繪制的3D數(shù)據(jù)被傳送回所述計(jì)算機(jī)系統(tǒng),以在連接到所述計(jì)算機(jī)系統(tǒng)的顯示器上顯示。在另一個(gè)實(shí)施例中,所述被繪制的3D數(shù)據(jù)被發(fā)送到直接連接到所述DGS的用于向用戶顯示的顯示器。在一個(gè)實(shí)施例中,所述DGS使用多個(gè)插卡式GPU。所述GPU能夠被實(shí)現(xiàn)為單GPU內(nèi)插式圖形卡(例如,每個(gè)卡一個(gè)GPU),多GPU內(nèi)插式圖形卡(例如,每個(gè)卡兩個(gè)或多個(gè)GPU)。在一個(gè)實(shí)施例中,使用了多個(gè)內(nèi)插式圖形卡,其中每個(gè)卡具有兩個(gè)或多個(gè)GPU。
在一個(gè)實(shí)施例中,本發(fā)明被實(shí)現(xiàn)為DGS(分立的圖形系統(tǒng))單元。所述DGS單元包括被配置以封裝GPU的系統(tǒng)機(jī)殼,以及連接到所述系統(tǒng)機(jī)殼并且被配置以接納所述GPU的GPU安裝單元。串行總線連接器被連接到所述機(jī)殼并且被連接到所述GPU安裝單元,其中,所述串行總線連接器被配置為將所述GPU可拆卸地連接到計(jì)算機(jī)系統(tǒng),以使得所述GPU能夠經(jīng)由所述串行總線連接器訪問所述計(jì)算機(jī)系統(tǒng)并執(zhí)行所述計(jì)算機(jī)系統(tǒng)的3D圖形指令。連接到所述系統(tǒng)機(jī)殼的電源用于向獨(dú)立于所述計(jì)算機(jī)系統(tǒng)的所述GPU供電。在一個(gè)實(shí)施例中,所述DGS單元包括用于冷卻所述GPU和所述電源的熱管理系統(tǒng)。在另一個(gè)實(shí)施例中,所述DGS單元包括用于控制所述熱管理系統(tǒng)和所述電源的操作以限制由所述DGS單元產(chǎn)生的噪聲的聲音管理系統(tǒng)。在一個(gè)實(shí)施例中,所述DGS使用多個(gè)插卡式GPU。所述GPU能夠被實(shí)現(xiàn)為單GPU內(nèi)插式圖形卡(例如,每個(gè)卡一個(gè)GPU),多GPU內(nèi)插式圖形卡(例如,每個(gè)卡兩個(gè)或多個(gè)GPU)。在一個(gè)實(shí)施例中,使用了多個(gè)插卡式GPU,其中每個(gè)卡具有兩個(gè)或更多GPU。
在一個(gè)實(shí)施例中,本發(fā)明被實(shí)現(xiàn)為可擴(kuò)展的分立圖形系統(tǒng)(DGS)。所述DGS包括串行總線橋(例如,PCI Express),其被配置以將多個(gè)GPU連接到串行總線。串行總線連接器被連接到所述串行總線橋。系統(tǒng)機(jī)殼被連接到所述串行總線橋和所述串行總線連接器并且被配置以封裝所述GPU。所述串行總線連接器被配置以可拆卸地連接到計(jì)算機(jī)系統(tǒng)。所述GPU經(jīng)由所述串行總線橋和所述串行總線連接器訪問所述計(jì)算機(jī)系統(tǒng),以協(xié)同地執(zhí)行來自所述計(jì)算機(jī)系統(tǒng)的3-D圖形指令。在一個(gè)實(shí)施例中,所述串行總線橋被配置以通過將至少一個(gè)新的GPU與現(xiàn)有的GPU在功能上相連接,使得能夠向上擴(kuò)展所述計(jì)算機(jī)系統(tǒng)的3D繪制性能。所述新的GPU和現(xiàn)有的GPU協(xié)同地執(zhí)行來自所述計(jì)算系統(tǒng)的圖形指令。在一個(gè)實(shí)施例中,所述多GPU圖形系統(tǒng)使用了多個(gè)插卡式GPU。所述GPU能夠被實(shí)現(xiàn)為單GPU內(nèi)插式圖形卡(例如,每個(gè)卡一個(gè)GPU),多GPU內(nèi)插式圖形卡(例如,每個(gè)卡兩個(gè)或多個(gè)GPU)。在一個(gè)實(shí)施例中,使用了多個(gè)內(nèi)插式圖形卡,其中每個(gè)卡具有兩個(gè)或多個(gè)GPU。
作為舉例,而不是限制,通過
本發(fā)明,并且,在其中相似的參考數(shù)字指示相似的元件。
圖1示出了依照本發(fā)明一個(gè)實(shí)施例的計(jì)算機(jī)系統(tǒng);圖2示出了依照本發(fā)明一個(gè)實(shí)施例的DGS,其中所述DGS被連接以驅(qū)動(dòng)顯示器;圖3示出了依照本發(fā)明一個(gè)實(shí)施例的DGS,其中所述DGS被配置以利用所述直接連接到計(jì)算機(jī)系統(tǒng)的顯示器;圖4示出了依照本發(fā)明一個(gè)實(shí)施例的計(jì)算機(jī)系統(tǒng)的某些組件和總線;圖5示出了依照本發(fā)明一個(gè)實(shí)施例的計(jì)算機(jī)系統(tǒng)的某些組件;圖6示出了用于描述依照本發(fā)明一個(gè)實(shí)施例的DGS經(jīng)由PCI Express連接器連接到計(jì)算機(jī)系統(tǒng)的方式的圖示;圖7示出了依照本發(fā)明一個(gè)實(shí)施例的DGS的內(nèi)部組件;圖8示出了依照本發(fā)明一個(gè)實(shí)施例的所述DGS的所述內(nèi)部組件的示例性結(jié)構(gòu);圖9示出了依照本發(fā)明一個(gè)實(shí)施例的可擴(kuò)展的DGS;圖10示出了這樣的示圖,其說明了隨著額外的GPU被加入到依照本發(fā)明一個(gè)實(shí)施例的DGS中,繪制性能得到提高;
圖11示出了依照本發(fā)明一個(gè)實(shí)施例的基于AGP的卡式安裝的GPU;圖12示出了依照本發(fā)明一個(gè)實(shí)施例的基于PCI Express的卡式安裝的GPU;圖13示出了用于描述依照本發(fā)明一個(gè)實(shí)施例的多GPU(圖形處理單元)圖形系統(tǒng)的內(nèi)部組件的框圖;圖14示出了這樣的示圖,其描述了可用于依照本發(fā)明一個(gè)實(shí)施例的多GPU圖形系統(tǒng)的操作范圍;圖15示出了這樣的示圖,其描述了由所述GPU的每一個(gè)執(zhí)行各自的圖形指令工作量的方式;圖16示出了依照本發(fā)明一個(gè)實(shí)施例的DGS的側(cè)視圖;圖17示出了依照本發(fā)明一個(gè)實(shí)施例的DGS的正視圖;圖18示出了依照本發(fā)明一個(gè)實(shí)施例的所述機(jī)殼蓋被打開的DGS的視圖;圖19示出了依照本發(fā)明一個(gè)實(shí)施例的DGS的機(jī)殼蓋正被合上時(shí)的視圖;圖20示出了依照本發(fā)明一個(gè)實(shí)施例的經(jīng)由PCI Express電纜被連接到膝上型計(jì)算機(jī)系統(tǒng)的DGS的視圖;圖21示出了依照本發(fā)明一個(gè)實(shí)施例的用于驅(qū)動(dòng)所述膝上型計(jì)算機(jī)系統(tǒng)的顯示器的DGS的視圖。
具體實(shí)施例方式
現(xiàn)在將詳細(xì)地介紹本發(fā)明優(yōu)選的實(shí)施例,在附圖中對(duì)其中的例子進(jìn)行說明。當(dāng)結(jié)合所述優(yōu)選實(shí)施例描述本發(fā)明時(shí),應(yīng)當(dāng)理解的是,它們并不意在將本發(fā)明限制于這些實(shí)施例。相反,本發(fā)明意在覆蓋替換、修改和等同,其可以被包括在由所附權(quán)利要求所定義的本發(fā)明的精神和范圍內(nèi)。此外,在本發(fā)明實(shí)施例的如下詳細(xì)的描述中,為了提供對(duì)本發(fā)明的徹底理解,闡明了許多具體的細(xì)節(jié)。然而,本領(lǐng)域一般技術(shù)人員可以認(rèn)識(shí)到,本發(fā)明可以被實(shí)施而無需這些具體的細(xì)節(jié)。在其他情況下,沒有對(duì)眾所周知的方法、程序、組件以及電路進(jìn)行詳細(xì)地描述,以不至于不必要地使得本發(fā)明實(shí)施例的特征不明顯。
記法和名稱接下來,將依照對(duì)計(jì)算機(jī)存儲(chǔ)器中的數(shù)據(jù)比特的操作的程序、步驟、邏輯塊、處理、以及其他符號(hào)表示來提出所述詳細(xì)描述的一些部分。這些描述和表示是數(shù)據(jù)處理領(lǐng)域的一般技術(shù)人員所常用的以最有效地將他們工作的主旨傳達(dá)給本領(lǐng)域其他技術(shù)人員的方式。程序、計(jì)算機(jī)執(zhí)行的步驟、邏輯塊、處理等等,在這里,通常被設(shè)想為導(dǎo)出所要結(jié)果的自相一致的一系列步驟或指令。所述步驟是需要對(duì)物理量進(jìn)行物理操作的步驟。通常,盡管不是必須地,這些量采取能夠在計(jì)算機(jī)系統(tǒng)中被存儲(chǔ)、傳送、組合、比較,以及進(jìn)行其它操作的電或磁信號(hào)的形式。已經(jīng)證明,主要因?yàn)楣餐褂玫脑?,稱這些信號(hào)為比特、值、元素、符號(hào)、字符、術(shù)語、數(shù)字等等有時(shí)是方便的。
應(yīng)當(dāng)記住的是,然而,所有這些以及類似的術(shù)語與適當(dāng)?shù)奈锢砹坑嘘P(guān),并且僅僅是應(yīng)用于這些量的方便的標(biāo)記。除非具體地聲明,否則,從如下討論中明顯地,值得注意的是,貫穿本發(fā)明,諸如“處理”或“訪問”或“執(zhí)行”或“存儲(chǔ)”或“繪制”等等的用于討論的術(shù)語,指示計(jì)算機(jī)系統(tǒng)(例如,圖1的計(jì)算機(jī)系統(tǒng)100)或類似的電子計(jì)算裝置的動(dòng)作或處理,所述動(dòng)作或處理用于,將被表示為所述計(jì)算機(jī)系統(tǒng)的寄存器或存儲(chǔ)器中的物理量的數(shù)據(jù),操控或變換到相似地被表示為所述計(jì)算機(jī)系統(tǒng)存儲(chǔ)器或寄存器或其他這種信息存儲(chǔ)、傳輸、或顯示裝置中的物理量的其他數(shù)據(jù)。
計(jì)算機(jī)系統(tǒng)平臺(tái)現(xiàn)在參照?qǐng)D1,示出了依照本發(fā)明一個(gè)實(shí)施例的計(jì)算機(jī)系統(tǒng)100。依照本發(fā)明一個(gè)實(shí)施例的計(jì)算機(jī)系統(tǒng)100提供了用于實(shí)現(xiàn)本發(fā)明的某些基于軟件的功能性的執(zhí)行平臺(tái)。如圖1所描述的,計(jì)算機(jī)系統(tǒng)100包括CPU 101和系統(tǒng)存儲(chǔ)器102。分立圖形系統(tǒng)(例如,下文中的DGS)110被經(jīng)由總線115和橋120連接到CPU 101和系統(tǒng)存儲(chǔ)器102。在系統(tǒng)100的實(shí)施例中,系統(tǒng)存儲(chǔ)器102存儲(chǔ)用于CPU 101和DGS 110兩者的指令和數(shù)據(jù)。DGS110經(jīng)由橋120訪問系統(tǒng)存儲(chǔ)器102。橋120經(jīng)由總線115與DGS 110通信并且起到對(duì)總線115和計(jì)算機(jī)系統(tǒng)100各自的數(shù)據(jù)格式進(jìn)行橋接的功能。應(yīng)當(dāng)注意的是,計(jì)算機(jī)系統(tǒng)100包括任意類型的計(jì)算裝置,包括而沒有限制,臺(tái)式計(jì)算機(jī)、服務(wù)器、工作站、膝上型計(jì)算機(jī)、基于計(jì)算機(jī)的仿真器、掌上計(jì)算機(jī)和其他諸如個(gè)人數(shù)字助理的便攜式/手持裝置、平板計(jì)算機(jī)、游戲控制臺(tái)、蜂窩電話、智能手機(jī)、手持游戲系統(tǒng)等等。
如上所述,本發(fā)明的某些處理和步驟,在一個(gè)實(shí)施例中,被實(shí)現(xiàn)為駐留在計(jì)算機(jī)系統(tǒng)(例如,系統(tǒng)100)的計(jì)算機(jī)可讀存儲(chǔ)器(例如,系統(tǒng)存儲(chǔ)器102)中,并且由系統(tǒng)100的CPU 101和DGS 110執(zhí)行的一系列指令(例如,軟件程序)。當(dāng)其被執(zhí)行時(shí),所述指令使得計(jì)算機(jī)系統(tǒng)100實(shí)現(xiàn)如下所述的本發(fā)明的功能性。
圖1的計(jì)算機(jī)系統(tǒng)100的實(shí)施例示出了被連接以利用DGS 100執(zhí)行3D圖形指令的計(jì)算機(jī)系統(tǒng)的基本組件。DGS 110包括至少一個(gè)用于執(zhí)行3D圖形指令的GPU。所述GPU被裝入被配置以封裝所述GPU并且提供用于其最佳操作的必要資源的DGS系統(tǒng)機(jī)殼。DGS 110包括連接到總線115的串行總線連接器,并由此將DGS 110連接到橋組件120。在一個(gè)實(shí)施例中,總線115是PCI Express串行總線。DGS 110的所述GPU經(jīng)由串行總線115訪問所述計(jì)算機(jī)系統(tǒng),以執(zhí)行所述計(jì)算機(jī)系統(tǒng)的3D圖形指令。如此,DGS 110提供分離的并且獨(dú)立于計(jì)算機(jī)系統(tǒng)100的約束/資源的分立圖形系統(tǒng)。后面更詳細(xì)地描述DGS 110的內(nèi)部組件(例如,圖7等等)。
圖2示出了依照本發(fā)明一個(gè)實(shí)施例的DGS 110,其中DGS 110被連接以直接驅(qū)動(dòng)顯示器201(例如,LCD顯示器,CRT顯示器等等)。在這個(gè)實(shí)施例中,DGS 110包括驅(qū)動(dòng)顯示器201所必須的組件(例如,幀緩沖器,DAC等等)。顯示器201經(jīng)由,例如,顯示適配器電纜202(例如,模擬視頻電纜,數(shù)字視頻電纜等等),被連接到DGS 110。
圖2的DGS 110實(shí)施例提供了這樣的優(yōu)點(diǎn),即被繪制的視頻數(shù)據(jù)(例如,被繪制的3D視頻的幀)能夠被直接發(fā)送到顯示器201,所述數(shù)據(jù)被假設(shè)經(jīng)過總線115發(fā)送到計(jì)算機(jī)系統(tǒng)100。這具有減少對(duì)總線115上的帶寬的要求的效果。
圖3示出了依照本發(fā)明一個(gè)實(shí)施例的DGS 310,其中所述DGS 310被配置以利用被直接連接到計(jì)算機(jī)系統(tǒng)300的顯示器201(例如,與圖2的實(shí)施例中顯示器201被連接到所述DGS相對(duì)比)。DGS 310的實(shí)施例被配置以利用總線115的可用帶寬將被繪制的視頻數(shù)據(jù)傳送回計(jì)算機(jī)系統(tǒng)300。DGS 310與計(jì)算機(jī)系統(tǒng)300的組件(例如,CPU 301、系統(tǒng)存儲(chǔ)器302、橋320以及計(jì)算機(jī)系統(tǒng)GPU 330)一起起作用以在顯示器201上呈現(xiàn)所述被繪制的視頻數(shù)據(jù)。因而,在這種情況下,計(jì)算機(jī)系統(tǒng)GPU 330的資源(例如,幀緩沖器、DAC等等)被用于驅(qū)動(dòng)顯示器201。
圖3的DGS 310實(shí)施例提供了這樣的優(yōu)點(diǎn),即在典型臺(tái)式計(jì)算機(jī)或膝上型計(jì)算機(jī)系統(tǒng)中的可用資源能夠被用于驅(qū)動(dòng)顯示器201。這使得DGS 301可以被典型計(jì)算機(jī)系統(tǒng)更容易地連接和使用。例如,當(dāng)需要強(qiáng)大的3D繪制系統(tǒng)的性能利益,DGS 301能夠熱插到計(jì)算機(jī)系統(tǒng)300并且立即開始驅(qū)動(dòng)其顯示器201,與其形成對(duì)比的是,迫使用戶從計(jì)算機(jī)系統(tǒng)300斷開顯示器201并將所述顯示器重新連接到DGS 310。
圖4示出了依照本發(fā)明一個(gè)實(shí)施例的計(jì)算機(jī)系統(tǒng)400的某些組件和總線415。在本實(shí)施例中,總線415為PCI Express總線。PCI Express總線415將DGS 410連接到計(jì)算機(jī)系統(tǒng)400的PCI Express橋420。PCI Express橋420提供了在CPU 401、系統(tǒng)存儲(chǔ)器402以及個(gè)人裝置(例如,磁盤驅(qū)動(dòng)器421、DVD驅(qū)動(dòng)器422等等)之間的內(nèi)部數(shù)據(jù)傳輸帶寬。
PCI Express總線415的使用提供了多個(gè)優(yōu)點(diǎn)。例如,PCI Express包括串行總線標(biāo)準(zhǔn),其用于將數(shù)據(jù)串行化,以獲得與較老的并行總線標(biāo)準(zhǔn)(例如,AGP等等)相比更有效率的傳輸。此外,所述PCI Express標(biāo)準(zhǔn)定義了增大的帶寬傳輸模式,由此多個(gè)“通道(lane)”能夠被結(jié)合以擴(kuò)展數(shù)據(jù)傳輸帶寬。例如,用于將圖形子系統(tǒng)連接到系統(tǒng)存儲(chǔ)器的典型的PCIExpress總線被指定為“16通道”的總線,由此16串行PCI Express數(shù)據(jù)路徑被鏈接以提供相當(dāng)于單通道PCI Express總線16倍的數(shù)據(jù)傳輸帶寬。如果需要更多的帶寬,可將額外數(shù)目的PCI Express通道用于實(shí)現(xiàn)總線415。
PCI Express總線415能夠比較老的并行總線更長(zhǎng)。例如,現(xiàn)有技術(shù)的AGP總線不冒數(shù)據(jù)偏斜和數(shù)據(jù)敗壞的風(fēng)險(xiǎn),則不能長(zhǎng)于幾個(gè)毫米。這有效地迫使所述GPU被直接設(shè)置于,或被插入到計(jì)算機(jī)系統(tǒng)的主板上。相反,PCI Express總線電纜能夠長(zhǎng)于一米,允許從計(jì)算機(jī)系統(tǒng)400的機(jī)殼上完全移開DGS 410(例如,置于某一距離之外)。
圖5示出了依照本發(fā)明一個(gè)實(shí)施例的計(jì)算機(jī)系統(tǒng)500的某些組件。在計(jì)算機(jī)系統(tǒng)500的實(shí)施例中,PCI Express北橋424和PCI Express南橋425被用于替代圖4計(jì)算機(jī)系統(tǒng)400中的單橋420。計(jì)算機(jī)系統(tǒng)500示出了典型的北橋/南橋結(jié)構(gòu),其中,北橋424提供了用于系統(tǒng)存儲(chǔ)器402的存儲(chǔ)器主控器/存儲(chǔ)器控制器功能性,并且南橋425提供了用于外圍裝置(例如,磁盤驅(qū)動(dòng)器421、DVD驅(qū)動(dòng)器422等等)的數(shù)據(jù)傳輸帶寬。
圖6示出了用于描述依照本發(fā)明一個(gè)實(shí)施例的DGS經(jīng)由PCI Express連接器601和602連接到計(jì)算機(jī)系統(tǒng)的方式的示圖。所述PCI Express標(biāo)準(zhǔn)提供了熱插拔能力,由此可以在保持開啟時(shí)將裝置從PCI Express總線連接和斷開。這允許在請(qǐng)求時(shí)實(shí)際地將DGS 410插入計(jì)算機(jī)系統(tǒng)400。例如,當(dāng)需要高性能3D繪制(例如,對(duì)于高保真實(shí)時(shí)3D繪制應(yīng)用)時(shí),能夠?qū)GS 410簡(jiǎn)單地插入以提供必要的性能。另外,如上所述,PCI Express總線電纜415可以長(zhǎng)于一米,使得能夠從計(jì)算機(jī)系統(tǒng)500的機(jī)殼中完全移除DGS 410。
圖7示出了依照本發(fā)明一個(gè)實(shí)施例的DGS 710的內(nèi)部組件。如圖7中所描述的,DGS 710包括與所述計(jì)算機(jī)系統(tǒng)機(jī)殼相分離的機(jī)殼。該機(jī)殼包括用于連接PCI Express總線415的DGS橋720、一個(gè)或多個(gè)GPU 730、電源721、熱管理系統(tǒng)722,以及聲音管理系統(tǒng)723。
如圖7所描述的,DGS 710實(shí)施例包括一個(gè)或多個(gè)用于執(zhí)行來自所連接的計(jì)算機(jī)系統(tǒng)(例如,計(jì)算機(jī)系統(tǒng)500等)的圖形指令的GPU。如上所述,經(jīng)由PCI Express總線415從所述計(jì)算機(jī)系統(tǒng)接收所述圖形指令。
獨(dú)立電源721用于獨(dú)立于計(jì)算機(jī)系統(tǒng)的電源向DGS組件提供電力。因而,對(duì)于未來GPU性能提高的電源需求能夠獨(dú)立于任何工業(yè)標(biāo)準(zhǔn)計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)(例如,ATX波形因數(shù)標(biāo)準(zhǔn),BTX波形因數(shù)標(biāo)準(zhǔn)等等)的任何外部約束而發(fā)展。
熱管理系統(tǒng)722用于提供獨(dú)立于計(jì)算機(jī)系統(tǒng)的冷卻結(jié)構(gòu)的冷卻源。因而,對(duì)于未來GPU性能提高的冷卻需求能夠獨(dú)立于任何外部約束(例如,BTX冷卻標(biāo)準(zhǔn)等等)而發(fā)展。例如,熱管理系統(tǒng)722可以包括散熱風(fēng)扇、熱管機(jī)制、液冷機(jī)制等等。
相似地,聲音管理系統(tǒng)723用于提供聲音管理機(jī)制/算法,其獨(dú)立于計(jì)算機(jī)系統(tǒng)的冷卻、電力或操作約束起作用。例如,專門的聲音吸收材料可以被用在DGS 710的機(jī)殼中。相似地,特殊的操作模式能夠被用于控制DGS 710的電源721和DGS 710的熱管理系統(tǒng)722的速度/操作以減小噪聲。
圖8示出了依照本發(fā)明一個(gè)實(shí)施例的DGS 710的內(nèi)部組件的示例性結(jié)構(gòu)。如圖8中所描述的,DGS 710包括用于為GPU 730和電源721提供散熱的散熱風(fēng)扇(HSF)801和電源風(fēng)扇(PSF)802。在圖8的實(shí)施例中,這些組件受到聲音管理系統(tǒng)723的控制。在圖8的實(shí)施例中,示出了分立的電源連接803(例如,AC電源)連接到電源721并且示出了用于顯示器201的專用連接。
圖9示出了依照本發(fā)明一個(gè)實(shí)施例的可擴(kuò)展的DGS 910。如圖9所描述的,DGS 910包括其功能是將多個(gè)GPU連接到PCI Express總線415的DGS橋720。示出了多個(gè)GPU被連接到橋720。這如GPU 1901、GPU2902以及GPU X 904所示。所述GPU(GPU 1到GPU X)的每一個(gè)具有各自的到DGS橋720的總線鏈路(如鏈路911-914所示)。
DGS 910的實(shí)施例示出了依照本發(fā)明一個(gè)實(shí)施例的DGS的可擴(kuò)展性特征。DGS橋720的功能為在鏈路911-914中協(xié)同地共享PCI Express總線415的數(shù)據(jù)傳輸帶寬。所述共享被配置為允許所述GPU協(xié)同地執(zhí)行來自所連接的計(jì)算機(jī)系統(tǒng)(例如,計(jì)算機(jī)系統(tǒng)500)的3D圖形指令。
如上所述,具有多通道PCI Express總線連接(例如,16通道PCIExpress總線)的可用數(shù)據(jù)傳輸帶寬消除了存在于先有技術(shù)類型的并行總線連接中的關(guān)鍵的性能瓶頸。所述可用數(shù)據(jù)傳輸帶寬使得圖形子系統(tǒng)的性能能夠迅速地?cái)U(kuò)展。本發(fā)明的實(shí)施例通過利用在協(xié)同的執(zhí)行陣列中的GPU來運(yùn)用這個(gè)增大的數(shù)據(jù)傳輸帶寬。
可在可用的GPU中分配圖形處理工作量,從而使得能夠并行執(zhí)行所述工作量。這種協(xié)同的執(zhí)行使得圖形子系統(tǒng)的繪制性能能夠迅速擴(kuò)展。另外,因?yàn)橐勒毡景l(fā)明實(shí)施例的DGS系統(tǒng)的特征,所述擴(kuò)展不受任何所連接的計(jì)算機(jī)系統(tǒng)的約束(例如,電力約束,熱約束等等)的限制。
例如,因?yàn)镈GS系統(tǒng)910可以包括其自己的專用電源(例如,圖8的電源721),并且因?yàn)镈GS系統(tǒng)910可以包括其自己的熱管理系統(tǒng)(例如,圖8的HSF 801和PSF 802),整個(gè)圖形子系統(tǒng)的性能可以不受約束地隨技術(shù)變化而迅速發(fā)展。此外,這種計(jì)算機(jī)系統(tǒng)相關(guān)的約束的消除,允許如圖9中所示包括多個(gè)GPU,這提供了圖形子系統(tǒng)性能的快速向上擴(kuò)展。
在一個(gè)實(shí)施例中,DGS橋720的功能為以循環(huán)的方式將PCI Express總線415的帶寬順序地分配給所述GPU的每一個(gè)。例如,當(dāng)所述GPU工作于和完成所述整個(gè)圖形執(zhí)行工作量的部分時(shí),能夠?qū)?6通道PCIExpress總線415的全部帶寬循環(huán)地分配給所述GPU??蛇x地,在一個(gè)實(shí)施例中,橋720能夠?qū)崿F(xiàn)仲裁機(jī)制,由此基于需要將總線415分配給所述GPU。
圖10示出了這樣的示圖,其說明了隨著額外的GPU被加入到依照本發(fā)明一個(gè)實(shí)施例的DGS 910中,繪制性能得到提高。如圖10中所示,增加額外的GPU引起了DGS 910的繪制性能的快速提高。例如,從單GPUDGS轉(zhuǎn)變到雙GPU DGS產(chǎn)生了將近100%的繪制能力增加。應(yīng)當(dāng)注意的是,由于需要一些額外的開銷以確保所述圖形處理工作量的正確的協(xié)同執(zhí)行,所述增加的繪制能力不完全是100%。
圖11示出了依照本發(fā)明一個(gè)實(shí)施例的基于AGP的卡式安裝的GPU1101。GPU 1101包括圖形處理器1105、圖形存儲(chǔ)器1106、以及AGP邊緣連接(AGP edge connect)1107。因而GPU 1101包括在典型的零售插口(retail outlet)中可用的典型的GPU。依照本發(fā)明實(shí)施例的DGS系統(tǒng)能夠?qū)⑦@種GPU作為現(xiàn)貨(off-the-shelf)利用。所述DGS的機(jī)殼將包括被配置為接受邊緣連接GPU 1101的AGP邊緣連接插口。
例如,用戶可以購買GPU 1101以替換較老的GPU。通過簡(jiǎn)單地從所述DGS移去較老的GPU和簡(jiǎn)單地插入新的GPU 110可以完成所述升級(jí)。需要用戶打開或進(jìn)入所述計(jì)算機(jī)系統(tǒng)的機(jī)殼來完成所述移去和替換。
相似地,例如,用戶可以購買GPU 1101以補(bǔ)充安裝在所述DGS中的已有GPU。這允許用戶通過利用如上所述的DGS的協(xié)同圖形指令執(zhí)行特征來立即擴(kuò)展所述用戶的圖形子系統(tǒng)的性能。
圖12示出了依照本發(fā)明一個(gè)實(shí)施例的基于PCI Express的卡式安裝的GPU 1201。GPU 1201基本上類似于GPU 1101。相比于圖11的AGP邊緣連接,GPU 1201包括圖形處理器1205、圖形存儲(chǔ)器1206以及PCIExpress連接1207。另外,GPU 1201具有一個(gè)或多個(gè)用于將電源直接連接到GPU 1201的分離的電源連接器1208。這種電源連接器1208對(duì)于現(xiàn)代高性能的GPU正變得日益普遍。除了PCI Express連接GPU 1201之外,所述DGS的機(jī)殼將包括被配置的PCI Express連接插口,并且還將包括用于電源連接器1208的適當(dāng)?shù)牟蹇凇?br>
應(yīng)當(dāng)注意的是,在一個(gè)實(shí)施例中,DGS能夠接受不同類型的卡式安裝的GPU。例如,所述DGS的機(jī)殼能夠包括用于接受基于AGP的GPU和/或基于PCI Express的GPU的供應(yīng)品。
圖13示出了用于描述依照本發(fā)明一個(gè)實(shí)施例的多GPU(圖形處理器單元)圖形系統(tǒng)1300的內(nèi)部組件的框圖。所述多GPU圖形系統(tǒng)包括多個(gè)GPU 901-904,其被配置以執(zhí)行來自計(jì)算機(jī)系統(tǒng)的圖形指令。GPU輸出多路復(fù)用器1302和控制器單元,包括幀同步主控器1301和各自的時(shí)鐘控制單元1311-1313,被連接到GPU 901-904。多GPU圖形系統(tǒng)1300可以被用于實(shí)現(xiàn)DGS的協(xié)同的GPU執(zhí)行處理。
在本實(shí)施例中,幀同步主控器1301和各自的時(shí)鐘控制單元1311-1313被配置以控制GPU 901-904和輸出多路復(fù)用器1302,從而使得GPU901-904協(xié)同地執(zhí)行來自所述計(jì)算機(jī)系統(tǒng)的圖形指令。時(shí)鐘控制單元1311-1313的功能為啟用或禁用各自的GPU 901-904。幀同步主控器1301的功能為使得由各GPU 901-904產(chǎn)生的被繪制的3D圖形幀同步。通過輸出多路復(fù)用器1302來結(jié)合各GPU 901-904的輸出,以產(chǎn)生得到的GPU輸出流1330。存儲(chǔ)器主控器1320(例如,圖4的橋420)控制到存儲(chǔ)器1321(例如,圖4的系統(tǒng)存儲(chǔ)器402)的訪問。
因而,多GPU圖形系統(tǒng)1300說明了依照本發(fā)明一個(gè)實(shí)施例的示例性結(jié)構(gòu),在其中能夠?qū)崿F(xiàn)和控制在多個(gè)GPU(例如,GPU 901-904)之間的協(xié)同執(zhí)行。應(yīng)當(dāng)注意的是,盡管系統(tǒng)1300示出了一種示例性結(jié)構(gòu),但用于在多個(gè)GPU之間的密切地協(xié)同執(zhí)行的其他結(jié)構(gòu)是可能的。
圖14示出了用于描述可用于依照本發(fā)明一個(gè)實(shí)施例的多GPU圖形系統(tǒng)1300的操作范圍的示圖。圖形系統(tǒng)1300能夠采用低功率模式和高功率模式。例如,為了實(shí)現(xiàn)低功率模式,所述控制單元關(guān)閉GPU 901-904中的一個(gè)或多個(gè)。這節(jié)省了功率同時(shí)也降低了圖形系統(tǒng)1300的最佳性能。為了實(shí)現(xiàn)高功率模式,所述控制器單元開啟額外的GPU以送出額外的繪制性能。這提高了最佳繪制性能同時(shí)也增加了功率消耗。
這種實(shí)現(xiàn)關(guān)于功率和性能的不同工作模式的能力,使得多GPU圖形系統(tǒng)1300能夠在多個(gè)不同的功率/性能點(diǎn)工作。該特征在圖14中圖示說明,GPU圖形系統(tǒng)1300的工作范圍1401如圖所示遠(yuǎn)大于標(biāo)稱的現(xiàn)有技術(shù)GPU架構(gòu)的范圍1402。
圖15示出了用于描述由所述GPU 901-904的每一個(gè)執(zhí)行各自的圖形指令工作量的方式的圖示。例如,在一個(gè)實(shí)施例中,繪制工作量的順序的幀被分配給GPU 901-904(例如,幀1,幀2等等到幀N+N)。所述順序的幀能夠被以關(guān)于時(shí)間的交錯(cuò)方式分配給GPU 901-904,從而使得所述幀基本上被并行執(zhí)行并且能夠被所述輸出多路復(fù)用器結(jié)合成不中斷的GPU輸出流,如線1501所示。如此,GPU 901-904的每一個(gè)各自的圖形指令工作量由所述GPU并行執(zhí)行。
應(yīng)當(dāng)注意的是,盡管多GPU圖形系統(tǒng)1300能夠被用于實(shí)現(xiàn)連接到所述計(jì)算機(jī)系統(tǒng)的DGS的功能性,多GPU圖形系統(tǒng)1300也能被直接嵌入到計(jì)算機(jī)系統(tǒng)的機(jī)殼中(例如,被直接并入到臺(tái)式計(jì)算機(jī)系統(tǒng)中)。
在一個(gè)實(shí)施例中,GPU 901-903的每一個(gè)具有其自己的時(shí)鐘,從而使得圍繞所述芯片或系統(tǒng)的時(shí)鐘分布和GPU到GPU的時(shí)滯不像在其他設(shè)計(jì)中一樣關(guān)鍵。這能夠顯著地減小芯片或電路板布圖的成本和復(fù)雜性。每一個(gè)GPU與其相鄰GPU一起,負(fù)責(zé)生成輸出流1330的一部分(例如,幀、系列幀等等)。在一個(gè)實(shí)施例中,GPU 901-903整體上以比應(yīng)用(例如,3D繪制應(yīng)用)所需的幀速率略微快的幀速率運(yùn)行,以消除合成圖像序列的不流暢。如圖13中所示,通過輸出多路復(fù)用器1302對(duì)這些幀進(jìn)行結(jié)合,以最終的每秒N幀進(jìn)行輸送。這顯著地?cái)U(kuò)大了系統(tǒng)1300的填充率和幀速率性能,而不必重新設(shè)計(jì)GPU內(nèi)核或使用“尖端(bleeding edge)”半導(dǎo)體制造工藝和超高頻。在一個(gè)實(shí)施例中,GPU陣列共享存儲(chǔ)器,從而使得整個(gè)系統(tǒng)成本遠(yuǎn)少于其他架構(gòu)。所述GPU到GPU的時(shí)滯、幀分布以及輸出多路復(fù)用器1302由幀同步主控器1301進(jìn)行管理。
如此,系統(tǒng)1300架構(gòu)提供了很多好處。例如,對(duì)于受到AC約束的超高性能的圖形實(shí)現(xiàn),諸如工作站和桌面應(yīng)用,通過再使用GPU內(nèi)核的超級(jí)擴(kuò)展的(super-scaled)芯片級(jí)設(shè)計(jì)或利用PCB上芯片(chip-on-PCB)方案,能夠獲得非常高的性能。相似地,對(duì)于來自相同的基本的可重定目標(biāo)之GPU構(gòu)件塊(例如,對(duì)于諸如移動(dòng)電話、PDA和移動(dòng)PC的便攜式應(yīng)用)的超低功率的圖形方案,能夠提供圖形性能。在發(fā)布每一代具有極限性能和極限移動(dòng)圖形方案的GPU產(chǎn)品時(shí),這個(gè)特征產(chǎn)生了快速上市和NRE(非復(fù)現(xiàn)工程)的成本優(yōu)勢(shì)。能夠以顯著降低的時(shí)鐘頻率,提供相當(dāng)?shù)奶畛渎屎蛶俾剩虼艘詷O低的功率送出了性能。例如,如上所述,所述每GPU時(shí)鐘(clock-per-GPU)的特性使得未使用的GPU可以如應(yīng)用所指示的動(dòng)態(tài)地開啟和關(guān)閉。簡(jiǎn)單的2D界面和DVD或mgeg再現(xiàn)只需要整個(gè)系統(tǒng)1300的一小部分進(jìn)行活動(dòng),由此顯著地減小了所使用的功率。
應(yīng)當(dāng)注意的是,盡管已經(jīng)在基于DGS機(jī)殼的系統(tǒng)的語境下描述了圖形系統(tǒng)1300,圖形系統(tǒng)1300的架構(gòu)能夠在多種計(jì)算機(jī)系統(tǒng)平臺(tái),包括,例如,臺(tái)式機(jī)、工作站、移動(dòng)PC、移動(dòng)電話、PDA、芯片組等等中實(shí)現(xiàn)。
參照?qǐng)D16至圖21,示出了依照本發(fā)明一個(gè)實(shí)施例的DGS的多個(gè)視圖。圖16示出了依照本發(fā)明一個(gè)實(shí)施例的DGS的側(cè)視圖。圖17示出了所述DGS的正視圖。圖18示出了機(jī)殼蓋被拆開的DGS的視圖。該視圖示出了兩個(gè)連接到所述DGS的機(jī)殼的內(nèi)部GPU卡。圖19示出了所述DGS的機(jī)殼蓋正被合上時(shí)的視圖。圖20示出了經(jīng)由PCI Express電纜被連接到膝上型計(jì)算機(jī)系統(tǒng)的DGS的視圖。圖21示出了用于驅(qū)動(dòng)所述膝上型計(jì)算機(jī)系統(tǒng)的顯示器的DGS的視圖。
為了說明和描述的目的,已經(jīng)提出了對(duì)本發(fā)明具體實(shí)施例的前述描述。它們的目的不在于將本發(fā)明窮盡或限制到所公開的精確形式,并且明顯地,根據(jù)以上講解,許多修改和變型是可能的。為了最好地解釋本發(fā)明的原理及其實(shí)際應(yīng)用,選擇和描述了所述實(shí)施例,以由此使得本領(lǐng)域其他技術(shù)人員能夠最好地利用本發(fā)明以及具有適合于預(yù)期的特定用途的各種修改的各種實(shí)施例。其意在使得本發(fā)明的范圍由所附權(quán)利要求及其等同所定義。
包括,例如,臺(tái)式機(jī)、工作站、移動(dòng)PC、移動(dòng)電話、PDA、芯片組等等。
參照?qǐng)D16至圖21,示出了依照本發(fā)明一個(gè)實(shí)施例的DGS的多個(gè)視圖。圖16示出了依照本發(fā)明一個(gè)實(shí)施例的DGS的側(cè)視圖。圖17示出了所述DGS的正視圖。圖18示出了機(jī)殼蓋被拆開的DGS的視圖。該視圖示出了兩個(gè)連接到所述DGS的機(jī)殼的內(nèi)部GPU卡。圖19示出了所述DGS的機(jī)殼蓋正被合上時(shí)的視圖。圖20示出了經(jīng)由PCI Express電纜被連接到膝上型計(jì)算機(jī)系統(tǒng)的DGS的視圖。圖21示出了用于驅(qū)動(dòng)所述膝上型計(jì)算機(jī)系統(tǒng)的顯示器的DGS的視圖。
寬泛地,本文講解了以下內(nèi)容。公開了用于執(zhí)行計(jì)算機(jī)系統(tǒng)的3D圖形指令的分立的圖形系統(tǒng)(DGS),DGS單元,以及可擴(kuò)展的DGS。所述分立的圖形系統(tǒng)包括用于執(zhí)行3D圖形指令的GPU以及被配置以封裝所述GPU的DGS系統(tǒng)機(jī)殼。串行總線連接器被連接到所述GPU和所述DGS機(jī)殼。所述串行總線連接器被配置以將所述DGS和所述GPU可拆卸地連接到所述計(jì)算機(jī)系統(tǒng)。所述DGS的所述GPU經(jīng)由所述總線連接器訪問所述計(jì)算機(jī)系統(tǒng)以執(zhí)行所述計(jì)算機(jī)系統(tǒng)的3D圖形指令。
寬泛地,本文公開了一種可擴(kuò)展的分立的圖形系統(tǒng)(DGS)。所述DGS包括被配置以將多個(gè)GPU連接到串行總線的串行總線橋。串行總線連接器被連接到所述串行總線橋。系統(tǒng)機(jī)殼被連接到所述串行總線橋和所述串行總線連接器,并被配置以封裝所述GPU。所述串行總線連接器被配置以可拆卸地連接到所述計(jì)算機(jī)系統(tǒng)。所述GPU經(jīng)由所述串行總線橋和所述串行總線連接器訪問所述計(jì)算機(jī)系統(tǒng),以協(xié)同地執(zhí)行來自所述計(jì)算機(jī)系統(tǒng)的3-D圖形指令。
寬泛地,本文公開了一種DGS(分立的圖形系統(tǒng))單元。所述DGS單元包括被配置以封裝GPU的系統(tǒng)機(jī)殼,用于執(zhí)行3-D圖形指令的GPU,以及被連接到所述系統(tǒng)機(jī)殼并被配置以接納所述GPU的GPU安裝單元。串行總線連接器被連接到所述機(jī)殼并且被連接到所述GPU安裝單元,其中所述串行總線連接器被配置以將所述GPU可拆卸地連接到計(jì)算機(jī)系統(tǒng),從而使得所述GPU能夠經(jīng)由所述串行總線連接器訪問所述計(jì)算機(jī)系統(tǒng)并且執(zhí)行所述計(jì)算機(jī)系統(tǒng)的3-D圖形指令。被連接到所述系統(tǒng)機(jī)殼的電源用于向獨(dú)立于所述計(jì)算機(jī)系統(tǒng)的所述GPU供電。
寬泛地,本文公開了一種用于執(zhí)行計(jì)算機(jī)系統(tǒng)的3D圖形指令的分立的圖形系統(tǒng)(DGS)。所述分立的圖形系統(tǒng)包括用于執(zhí)行3D圖形指令的GPU和被配置以封裝所述GPU的DGS系統(tǒng)機(jī)殼。串行總線連接器被連接到所述GPU和所述GDS機(jī)殼。所述串行總線連接器被配置以將所述DGS和所述GPU可拆卸地連接到所述計(jì)算機(jī)系統(tǒng)。所述DGS的所述GPU經(jīng)由所述總線連接器訪問所述計(jì)算機(jī)系統(tǒng)以執(zhí)行所述計(jì)算機(jī)系統(tǒng)的3D圖形指令。
為了說明和描述的目的,已經(jīng)提出了對(duì)本發(fā)明具體實(shí)施例的前述描述。它們的目的不在于將本發(fā)明窮盡或限制到所公開的精確形式,并且明顯地,根據(jù)以上講解,許多修改和變型是可能的。為了最好地解釋本發(fā)明的原理及其實(shí)際應(yīng)用,選擇和描述了所述實(shí)施例,以由此使得本領(lǐng)域其他技術(shù)人員能夠最好地利用本發(fā)明以及具有適合于預(yù)期的特定用途的各種修改的各種實(shí)施例。其意在使得本發(fā)明的范圍由所附權(quán)利要求及其等同所定義。
權(quán)利要求
1.一種分立的圖形系統(tǒng),包括用于執(zhí)行3D圖形指令的GPU;被配置以封裝所述GPU的系統(tǒng)機(jī)殼;以及被連接到所述GPU和所述機(jī)殼的串行總線連接器,其中,所述串行總線連接器被配置以將所述GPU可拆卸地連接到計(jì)算機(jī)系統(tǒng),并且其中,所述GPU經(jīng)由所述串行總線連接器訪問所述計(jì)算機(jī)系統(tǒng)以執(zhí)行所述計(jì)算機(jī)系統(tǒng)的所述3D圖形指令。
2.根據(jù)權(quán)利要求1的系統(tǒng),其中,所述系統(tǒng)是為分立的圖形繪制系統(tǒng)配置的計(jì)算機(jī)系統(tǒng),進(jìn)一步包括計(jì)算機(jī)系統(tǒng)。
3.根據(jù)權(quán)利要求1的分立的圖形系統(tǒng),其中,所述串行總線連接器為PCI Express連接器。
4.根據(jù)權(quán)利要求1的分立的圖形系統(tǒng),其中,所述GPU被可拆卸地連接到所述串行總線連接器和所述系統(tǒng)機(jī)殼。
5.根據(jù)權(quán)利要求1的分立的圖形系統(tǒng),其中,所述GPU是被連接到所述串行總線連接器的卡式安裝的GPU。
6.根據(jù)權(quán)利要求1或2的分立的圖形系統(tǒng),其中,所述GPU被配置以執(zhí)行所述計(jì)算機(jī)系統(tǒng)的所述3D圖形指令,從而驅(qū)動(dòng)被連接到所述計(jì)算機(jī)系統(tǒng)的顯示器。
7.根據(jù)權(quán)利要求1或2的分立的圖形系統(tǒng),其中,所述GPU被配置以執(zhí)行來自所述計(jì)算機(jī)系統(tǒng)的所述3D圖形指令,從而驅(qū)動(dòng)被連接到所述GPU的顯示器。
8.根據(jù)權(quán)利要求1或2的分立的圖形系統(tǒng),進(jìn)一步包括多個(gè)GPU,其被連接到所述系統(tǒng)機(jī)殼和所述串行總線連接器,并且被配置以協(xié)同地執(zhí)行來自所述計(jì)算機(jī)系統(tǒng)的所述3D圖形指令。
9.根據(jù)權(quán)利要求1的分立的圖形系統(tǒng),進(jìn)一步包括電源,其被連接到所述系統(tǒng)機(jī)殼以向獨(dú)立于所述計(jì)算機(jī)系統(tǒng)的所述GPU供電。
10.一種用于分立的圖形系統(tǒng)的方法,包括以下步驟利用GPU執(zhí)行3D圖形指令;將所述GPU封裝在系統(tǒng)機(jī)殼中;以及通過使用所述GPU經(jīng)由串行總線連接器訪問計(jì)算機(jī)系統(tǒng)以執(zhí)行所述計(jì)算機(jī)系統(tǒng)的所述3D圖形指令,其中,所述串行總線連接器被連接到所述GPU和所述機(jī)殼,并且其中,所述串行總線連接器被配置以將所述GPU可拆卸地連接到所述計(jì)算機(jī)系統(tǒng)。
11.根據(jù)權(quán)利要求10的方法,其中,所述串行總線連接器為PCIExpress連接器。
12.根據(jù)權(quán)利要求10的方法,其中,所述GPU被可拆卸地連接到所述串行總線連接器和所述系統(tǒng)機(jī)殼。
13.根據(jù)權(quán)利要求10的方法,其中,所述GPU是被連接到所述串行總線連接器的卡式安裝的GPU。
14.根據(jù)權(quán)利要求10的方法,其中,所述GPU被配置以執(zhí)行所述計(jì)算機(jī)系統(tǒng)的所述3D圖形指令,從而驅(qū)動(dòng)被連接到所述計(jì)算機(jī)系統(tǒng)的顯示器。
15.根據(jù)權(quán)利要求10的方法,其中,所述GPU被配置以執(zhí)行來自所述計(jì)算機(jī)系統(tǒng)的所述3D圖形指令,從而驅(qū)動(dòng)被連接到所述GPU的顯示器。
16.根據(jù)權(quán)利要求10的方法,進(jìn)一步包括通過利用被連接到所述系統(tǒng)機(jī)殼和所述串行總線連接器的多個(gè)GPU,協(xié)同地執(zhí)行來自所述計(jì)算機(jī)系統(tǒng)的所述3D圖形指令。
17.根據(jù)權(quán)利要求10的方法,進(jìn)一步包括通過利用被連接到所述系統(tǒng)機(jī)殼的電源,向獨(dú)立于所述計(jì)算機(jī)系統(tǒng)的所述GPU供電。
18.一種DGS(分立的圖形系統(tǒng))單元,包括被配置以封裝GPU的系統(tǒng)機(jī)殼,用于執(zhí)行所述3-D圖形指令的所述GPU;被連接到所述系統(tǒng)機(jī)殼并被配置以接納所述GPU的GPU安裝單元;被連接到所述機(jī)殼并且被連接到所述GPU安裝單元的串行總線連接器,其中所述串行總線連接器被配置為將所述GPU可拆卸地連接到計(jì)算機(jī)系統(tǒng),以使得所述GPU能夠經(jīng)由所述串行總線連接器訪問所述計(jì)算機(jī)系統(tǒng)并執(zhí)行所述計(jì)算機(jī)系統(tǒng)的3-D圖形指令;以及被連接到所述系統(tǒng)機(jī)殼用于向獨(dú)立于所述計(jì)算機(jī)系統(tǒng)的所述GPU供電的電源。
19.根據(jù)權(quán)利要求18的DGS單元,其中,所述系統(tǒng)機(jī)殼包括適合于包含所述GPU并使得能夠訪問所述GPU的可拆卸的外殼。
20.根據(jù)權(quán)利要求18的DGS單元,進(jìn)一步包括被連接到所述機(jī)殼用于冷卻所述GPU的散熱單元,其中,獨(dú)立于所述計(jì)算機(jī)系統(tǒng)提供所述冷卻。
21.根據(jù)權(quán)利要求18的DGS,其中,所述串行總線連接器是適合于經(jīng)由PCI Express電纜連接到所述計(jì)算機(jī)系統(tǒng)的PCI Express連接器。
22.根據(jù)權(quán)利要求18的DGS,其中,所述GPU安裝單元被配置以可拆卸地連接到所述GPU并將所述GPU連接到所述串行總線連接器和所述系統(tǒng)機(jī)殼。
23.根據(jù)權(quán)利要求22的DGS,其中,所述GPU安裝單元被配置為接受基于AGP的卡式安裝的GPU。
24.根據(jù)權(quán)利要求22的DGS,其中,所述GPU安裝單元被配置以接受基于PCI-express的卡式安裝的GPU。
25.根據(jù)權(quán)利要求22的DGS,其中,所述GPU安裝單元被配置以熱插拔卡式安裝的GPU。
26.根據(jù)權(quán)利要求18的分立的圖形系統(tǒng),其中,所述GPU被配置以執(zhí)行來自所述計(jì)算機(jī)系統(tǒng)的所述3-D圖形指令,從而驅(qū)動(dòng)被連接到所述計(jì)算機(jī)系統(tǒng)的顯示器。
27.根據(jù)權(quán)利要求18的分立的圖形系統(tǒng),進(jìn)一步包括顯示器連接器,其被配置以被連接到顯示器并且使得所述GPU能夠執(zhí)行來自所述計(jì)算機(jī)系統(tǒng)的所述3-D圖形指令以驅(qū)動(dòng)所述顯示器。
28.根據(jù)權(quán)利要求18的獨(dú)立的圖形系統(tǒng),其中,所述GPU安裝單元被配置以接納多個(gè)GPU并且將所述GPU連接到所述串行總線連接器,使得所述GPU能夠協(xié)同地執(zhí)行來自所述計(jì)算機(jī)系統(tǒng)的所述3-D圖形指令。
29.一種DGS(分立的圖形系統(tǒng))外殼,包括具有被配置以封裝GPU的上半部分和下半部分的鉸接的系統(tǒng)機(jī)殼,用于執(zhí)行3-D圖形指令的所述GPU;被連接到所述系統(tǒng)機(jī)殼并被配置以接納所述GPU的GPU連接器;被連接到所述機(jī)殼并且被連接到所述GPU連接器的串行總線連接器,其中,所述串行總線連接器被配置為將所述GPU可拆卸地連接到計(jì)算機(jī)系統(tǒng),以使得所述GPU能夠經(jīng)由所述串行總線連接器訪問所述計(jì)算機(jī)系統(tǒng)并執(zhí)行所述計(jì)算機(jī)系統(tǒng)的所述3-D圖形指令;被連接到所述系統(tǒng)機(jī)殼用于向獨(dú)立于所述計(jì)算機(jī)系統(tǒng)的所述GPU供電的電源;以及被連接到所述機(jī)殼用于冷卻所述GPU的散熱單元,其中,獨(dú)立于所述計(jì)算機(jī)系統(tǒng)提供所述冷卻。
30.根據(jù)權(quán)利要求29的DGS外殼,其中,所述系統(tǒng)機(jī)殼包括適合于包含所述GPU并使得能夠訪問所述GPU的可拆卸的外殼。
31.根據(jù)權(quán)利要求29的DGS外殼,其中,所述串行總線連接器是適合于經(jīng)由PCI Express電纜連接到所述計(jì)算機(jī)系統(tǒng)的PCI Express連接器。
32.根據(jù)權(quán)利要求29的DGS外殼,其中,所述GPU安裝單元被配置以可拆卸地連接到所述GPU并將所述GPU連接到所述串行總線連接器和所述系統(tǒng)機(jī)殼。
33.根據(jù)權(quán)利要求32的DGS外殼,其中,所述GPU安裝單元被配置以熱插拔卡式安裝的GPU。
34.根據(jù)權(quán)利要求29的DGS外殼,其中,所述GPU被配置以執(zhí)行來自所述計(jì)算機(jī)系統(tǒng)的所述3-D圖形指令,從而驅(qū)動(dòng)被連接到所述計(jì)算機(jī)系統(tǒng)的顯示器。
35.根據(jù)權(quán)利要求29的DGS外殼,進(jìn)一步包括顯示器連接器,其被配置以被連接到顯示器并且使得所述GPU能夠執(zhí)行來自所述計(jì)算機(jī)系統(tǒng)的所述3-D圖形指令以驅(qū)動(dòng)所述顯示器。
36.根據(jù)權(quán)利要求29的DGS外殼,其中,所述GPU安裝單元被配置以接納多個(gè)GPU并且將所述GPU連接到所述串行總線連接器,使得所述GPU能夠協(xié)同地執(zhí)行來自所述計(jì)算機(jī)系統(tǒng)的所述3-D圖形指令。
37.一種DGS(分立的圖形系統(tǒng))單元,包括被配置以封裝GPU的系統(tǒng)機(jī)殼,用于執(zhí)行3-D圖形指令的所述GPU;被連接到所述系統(tǒng)機(jī)殼并被配置以接納所述GPU的GPU連接器;被連接到所述機(jī)殼并且被連接到所述GPU連接器的PCI Express連接器,其中,所述PCI Express連接器被配置為將所述GPU可拆卸地連接到計(jì)算機(jī)系統(tǒng),以使得所述GPU能夠經(jīng)由串行總線連接器訪問所述計(jì)算機(jī)系統(tǒng)并執(zhí)行所述計(jì)算機(jī)系統(tǒng)的所述3-D圖形指令;被連接到所述系統(tǒng)機(jī)殼用于向獨(dú)立于所述計(jì)算機(jī)系統(tǒng)的所述GPU供電的電源;被連接到所述機(jī)殼用于冷卻所述GPU的散熱單元,其中,獨(dú)立于所述計(jì)算機(jī)系統(tǒng)提供所述冷卻;以及其中,GPU安裝單元被配置以接納多個(gè)GPU并且將所述GPU連接到所述PCI Express連接器,使得所述GPU能夠協(xié)同地執(zhí)行來自所述計(jì)算機(jī)系統(tǒng)的所述3-D圖形指令。
38.一種可擴(kuò)展的分立的圖形系統(tǒng),包括被配置以將多個(gè)GPU連接到串行總線的串行總線橋;被連接到所述串行總線橋的串行總線連接器;以及被連接到所述串行總線橋和串行總線連接器,并且被配置以封裝所述GPU的系統(tǒng)機(jī)殼,其中,所述串行總線連接器被配置以可拆卸地連接到計(jì)算機(jī)系統(tǒng),并且其中,所述GPU經(jīng)由所述串行總線橋和所述串行總線連接器訪問所述計(jì)算機(jī)系統(tǒng),以執(zhí)行來自所述計(jì)算機(jī)系統(tǒng)的3-D圖形指令。
39.根據(jù)權(quán)利要求38的可擴(kuò)展的分立的圖形系統(tǒng),其中,所述串行總線橋被配置以經(jīng)由PCI Express總線連接到所述計(jì)算機(jī)系統(tǒng),并且經(jīng)由所述PCI Express總線將多個(gè)GPU的每一個(gè)連接到所述計(jì)算機(jī)系統(tǒng)。
40.根據(jù)權(quán)利要求39的可擴(kuò)展的分立的圖形系統(tǒng),其中,在所述串行總線橋和所述計(jì)算機(jī)系統(tǒng)之間的所述PCI Express總線是至少16通道的PCI Express總線連接。
41.根據(jù)權(quán)利要求39的可擴(kuò)展的分立的圖形系統(tǒng),其中,所述串行總線橋經(jīng)由至少16通道的PCI Express總線連接被連接到所述多個(gè)GPU的每一個(gè)。
42.根據(jù)權(quán)利要求38的可擴(kuò)展的分立的圖形系統(tǒng),其中,所述串行總線橋被配置以通過連接至少一個(gè)新的GPU和至少一個(gè)被連接到所述串行總線橋的現(xiàn)有的GPU,使得所述計(jì)算機(jī)系統(tǒng)的3-D繪制性能能夠向上擴(kuò)展,其中,所述新的GPU和所述現(xiàn)有的GPU協(xié)同地執(zhí)行來自所述計(jì)算機(jī)系統(tǒng)的圖形指令。
43.根據(jù)權(quán)利要求42的可擴(kuò)展的分立的圖形系統(tǒng),其中,所述新的GPU和所述現(xiàn)有的GPU為卡式安裝的GPU。
44.根據(jù)權(quán)利要求38的可擴(kuò)展的分立的圖形系統(tǒng),其中,所述GPU被配置以執(zhí)行所述計(jì)算機(jī)系統(tǒng)的所述3-D圖形指令,從而驅(qū)動(dòng)被連接到所述計(jì)算機(jī)系統(tǒng)的顯示器。
45.根據(jù)權(quán)利要求38的可擴(kuò)展的分立的圖形系統(tǒng),進(jìn)一步包括被連接到所述系統(tǒng)機(jī)殼用于向獨(dú)立于所述計(jì)算機(jī)系統(tǒng)的所述GPU供電的電源。
46.一種用于可擴(kuò)展的分立的圖形系統(tǒng)的方法,包括經(jīng)由串行總線并且通過利用串行總線橋來訪問多個(gè)GPU;訪問被連接到所述串行總線橋的串行總線連接器;以及執(zhí)行來自計(jì)算機(jī)系統(tǒng)的3-D圖形指令,其中,所述GPU經(jīng)由所述串行總線橋和所述串行總線連接器訪問所述計(jì)算機(jī)系統(tǒng),并且其中,所述串行總線連接器被配置以可拆卸地連接到所述計(jì)算機(jī)系統(tǒng)。
47.根據(jù)權(quán)利要求46的方法,其中,所述串行總線橋被配置以經(jīng)由PCI Express總線連接到所述計(jì)算機(jī)系統(tǒng),并且經(jīng)由所述PCI Express總線將所述多個(gè)GPU的每一個(gè)連接到所述計(jì)算機(jī)系統(tǒng)。
48.根據(jù)權(quán)利要求47的方法,其中,在所述串行總線橋和所述計(jì)算機(jī)系統(tǒng)之間的所述PCI Express總線是至少16通道的PCI Express總線連接。
49.根據(jù)權(quán)利要求47的方法,其中,所述串行總線橋經(jīng)由至少16通道的PCI Express總線連接被連接到所述多個(gè)GPU的每一個(gè)。
50.根據(jù)權(quán)利要求46的可擴(kuò)展的分立的圖形系統(tǒng),其中,所述串行總線橋被配置以通過連接至少一個(gè)新的GPU和至少一個(gè)被連接到所述串行總線橋的現(xiàn)有的GPU,使得所述計(jì)算機(jī)系統(tǒng)的3-D繪制性能能夠向上擴(kuò)展,其中,所述新的GPU和所述現(xiàn)有的GPU協(xié)同地執(zhí)行來自所述計(jì)算機(jī)系統(tǒng)的圖形指令。
51.根據(jù)權(quán)利要求50的方法,其中,所述新的GPU和所述現(xiàn)有的GPU為卡式安裝的GPU。
52.根據(jù)權(quán)利要求46的方法,其中,所述GPU被配置以執(zhí)行所述計(jì)算機(jī)系統(tǒng)的所述3-D圖形指令,從而驅(qū)動(dòng)被連接到所述計(jì)算機(jī)系統(tǒng)的顯示器。
53.根據(jù)權(quán)利要求46的方法,進(jìn)一步包括通過利用被連接到所述系統(tǒng)機(jī)殼的電源,向獨(dú)立于所述計(jì)算機(jī)系統(tǒng)的所述GPU供電。
54.一種用于實(shí)現(xiàn)可擴(kuò)展的分立圖形的系統(tǒng),進(jìn)一步包括計(jì)算機(jī)系統(tǒng);被配置以將多個(gè)GPU連接到PCI Express總線的PCI Express橋;被連接到PCI Express橋的PCI Express連接器;以及被連接到所述PCI Express橋和PCI Express連接器,并且被配置以封裝所述GPU的系統(tǒng)機(jī)殼,其中,所述PCI Express連接器被配置以可拆卸地連接到所述計(jì)算機(jī)系統(tǒng),并且其中,所述GPU經(jīng)由所述PCI Express橋和所述PCI Express連接器訪問所述計(jì)算機(jī)系統(tǒng),以執(zhí)行來自所述計(jì)算機(jī)系統(tǒng)的3-D圖形指令。
55.根據(jù)權(quán)利要求54的系統(tǒng),其中,所述PCI Express橋被配置以經(jīng)由PCI Express總線連接到所述計(jì)算機(jī)系統(tǒng),并且經(jīng)由所述PCI Express總線將所述多個(gè)GPU的每一個(gè)連接到所述計(jì)算機(jī)系統(tǒng)。
56.根據(jù)權(quán)利要求54的系統(tǒng),其中,所述PCI Express橋被配置以通過連接至少一個(gè)新的GPU和至少一個(gè)被連接到所述PCI Express橋的現(xiàn)有的GPU,使得所述計(jì)算機(jī)系統(tǒng)的3-D繪制性能能夠向上擴(kuò)展,其中,所述新的GPU和所述現(xiàn)有的GPU協(xié)同地執(zhí)行來自所述計(jì)算機(jī)系統(tǒng)的圖形指令。
57.根據(jù)權(quán)利要求54的系統(tǒng),進(jìn)一步包括被連接到所述系統(tǒng)機(jī)殼用于向獨(dú)立于所述計(jì)算機(jī)系統(tǒng)的所述GPU供電的電源。
全文摘要
公開了一種用于執(zhí)行計(jì)算機(jī)系統(tǒng)的3D圖形指令的分立的圖形系統(tǒng)(DGS)、DGS單元以及可擴(kuò)展的DGS。所述分立的圖形系統(tǒng)包括用于執(zhí)行3D圖形指令的GPU以及被配置以封裝所述GPU的DGS系統(tǒng)機(jī)殼。串行總線連接器被連接到所述GPU和所述DGS機(jī)殼。所述串行總線連接器被配置以將所述DGS和所述GPU可拆卸地連接到所述計(jì)算機(jī)系統(tǒng)。所述DGS的所述GPU經(jīng)由所述串行總線連接器訪問所述計(jì)算機(jī)系統(tǒng),以執(zhí)行所述計(jì)算機(jī)系統(tǒng)的3D圖形指令。
文檔編號(hào)G06T15/00GK1922596SQ200580001178
公開日2007年2月28日 申請(qǐng)日期2005年6月24日 優(yōu)先權(quán)日2004年6月25日
發(fā)明者M·B·戴蒙德, C·卡雷拉 申請(qǐng)人:恩維迪亞公司