專利名稱:圖形管線中基于瓦片的精度的光柵化的制作方法
技術領域:
本發(fā)明大體上涉及硬件加速圖形計算機系統(tǒng)。
技術背景計算機性能的最近進展已使得圖形系統(tǒng)能夠通過使用個人計算機、家用視頻游戲計 算機、手持裝置等來提供更逼真的圖形圖像。在此類圖形系統(tǒng)中,執(zhí)行多個程序以向系 統(tǒng)屏幕"渲染"或繪制圖形圖元。"圖形圖元"是圖形圖片的基本組成部分,例如頂點、 多邊形等。經(jīng)渲染的圖像由這些圖形圖元的組合形成??衫迷S多程序來執(zhí)行3-D圖形 渲染。已研發(fā)出多種專用圖形處理單元(例如,GPU等)以優(yōu)化執(zhí)行圖形渲染程序所需的 計算。GPU經(jīng)配置以進行高速操作且通常并入有一個或一個以上渲染管線。每一管線包 括多個基于硬件的功能單元,所述功能單元經(jīng)優(yōu)化以高速執(zhí)行圖形指令/數(shù)據(jù),其中將指 令/數(shù)據(jù)饋入到管線的前端中,且在管線的后端處出現(xiàn)計算結果。GPU的基于硬件的功能 單元、高速緩沖存儲器、固件等經(jīng)優(yōu)化以對低級圖形圖元(例如,包含"點"、"線"、"三 角形"等)進行操作且產(chǎn)生經(jīng)實時渲染的3-D圖像。使用光柵顯示技術來產(chǎn)生經(jīng)實時渲染的3-D圖像。光柵顯示技術廣泛用于計算機圖 形系統(tǒng)中,且一般指代組成圖像的多個像素的柵格受圖形圖元影響的機制。對于每個圖 元,典型的光柵化系統(tǒng)一般逐像素步進,且按照圖元的貢獻來確定是否要"渲染"給定 像素或將其寫入到幀緩沖器或像素映射中。這又確定如何將數(shù)據(jù)寫入代表每個像素的顯 示緩沖器。己研發(fā)出各種遍歷算法和各種光柵化方法,用于以覆蓋組成給定3-D場景的圖元內(nèi) 所有像素的方式從基于圖形圖元的描述計算為基于像素的描述(例如,對于每個圖元進 行逐像素光柵化)。典型的解決方案涉及以單向方式通過系統(tǒng)地逐行步進越過場景(例如,從左到右) 來產(chǎn)生像素,且訪問所述場景的每一像素。按照組成所述場景的各個圖元的貢獻來確定 每個像素的覆蓋度。其它傳統(tǒng)的解決方案涉及利用每像素評估技術來精密評估組成顯示 器的像素中的每一者,且確定哪些像素由哪些圖元覆蓋。一旦圖元被光柵化為其組成像素,便接著在光柵化級隨后的管線級中尋址這些像素,
其中執(zhí)行渲染操作。 一般來說,這些渲染操作根據(jù)組成場景的圖元的覆蓋度來向顯示器 的像素中的每一者分配顏色。還根據(jù)分配給圖元的紋理映射信息、光照信息等來確定每 像素的顏色。然而,現(xiàn)有技術3-D渲染結構在符合處理當今應用的日益復雜的3-D場景的能力方 面存在問題。計算機屏幕現(xiàn)通常具有1920X1200個像素或更大的屏幕分辨率。現(xiàn)有技術 光柵化解決方案越來越成為3-D渲染過程的瓶頸。由于顯示屏幕的尺寸不可動搖地增加 到(例如)1920個像素寬或更大,因而現(xiàn)有技術的用于光柵化的逐行步進和每像素評估 解決方案越來越需要更大的資源來處理計算負荷。為了處理此類大屏幕尺寸,GPU的光 柵化資源需要在每時鐘周期基礎上處理較大數(shù)目的每圖元評估操作(例如,多邊形邊緣 等式),且需要每圖元評估操作處理相應較大數(shù)目的像素。因此,典型的現(xiàn)有技術GPU 不具有足夠的光柵化資源來符合大屏幕尺寸且同時維持可接受的實時3-D渲染性能。增加3-D渲染性能的傳統(tǒng)方法(例如,增加時鐘速度)具有例如增加功率消耗和增 加由GPU集成電路小芯片產(chǎn)生的熱量的負面影響。用于增加性能的其它方法(例如并入 較大數(shù)目的并行執(zhí)行單元來并行執(zhí)行GPU操作)具有例如增加集成電路小芯片尺寸、減 少GPU制造過程的產(chǎn)率、增加功率需求等負面影響。因此,需要一種光柵化過程,其能夠符合圖形應用需求的要求并提供增加的性能, 而不會招致例如功率消耗增加和/或制作產(chǎn)率降低的不利結果。 發(fā)明內(nèi)容本發(fā)明實施例提供一種用于光柵化過程的方法和系統(tǒng),其能夠符合圖形應用需求的 要求并提供增加的性能,而不會招致例如功率消耗增加和/或制作產(chǎn)率降低的不利結果。在一個實施例中,本發(fā)明實施為一種用于在圖形處理器的光柵級中進行基于瓦片的 精度的光柵化的方法。所述方法包括接收圖形圖元以在圖形處理器的光柵級中進行光柵 化,以及以第一級別精度來光柵化圖形圖元以產(chǎn)生多個像素瓦片。接著以第二級別精度 來光柵化所述瓦片,以產(chǎn)生覆蓋的像素。接著輸出所述覆蓋的像素,以在圖形處理器的 隨后級中進行渲染操作。第一級別精度通常高于第二級別精度,以使得用于以第一級別 精度尋址所述多個瓦片的整數(shù)值大于用于以第二級別精度尋址多個像素的整數(shù)值。以此方式,可根據(jù)需要處理的各個像素或樣品的數(shù)目來調(diào)節(jié)所需精度。舉例來說, 在一個實施例中,以第一級別精度來光柵化圖形圖元,以尋址組成屏幕圖像的多個像素。 相應地,在一個實施例中,以第二級別精度來光柵化圖形圖元,以尋址組成所述多個瓦 片中的每一者的多個像素。通過這種做法,本發(fā)明實施例有效利用GPU的光柵化資源來在每時鐘周期基礎上尋
址每圖元評估操作(例如,多邊形邊緣等式),以有效符合大屏幕尺寸且同時維持可接受的實時3-D渲染性能。
在附式中以實例方式而非以限制方式來說明本發(fā)明,其中相同參考標號指代類 似元件。圖1展示根據(jù)本發(fā)明一個實施例的計算機系統(tǒng)。圖2展示根據(jù)本發(fā)明一個實施例描繪位于屏幕上用于光柵化的多邊形201的圖。 圖3展示根據(jù)本發(fā)明一個實施例的三角形和沿著光柵化線產(chǎn)生的覆蓋瓦片。 圖4展示根據(jù)本發(fā)明一個實施例描繪示范性瓦片的尺度的圖。圖5展示根據(jù)本發(fā)明一個實施例在光柵級內(nèi)實施的基于瓦片的精度的光柵化過程的圖。圖6展示根據(jù)本發(fā)明實施例描繪包括擴展位的示范性整數(shù)操作數(shù)的圖。 圖7展示根據(jù)本發(fā)明一個實施例的GPU的內(nèi)部組件的圖。
具體實施方式
現(xiàn)將詳細參看本發(fā)明的優(yōu)選實施例,附圖中說明了所述優(yōu)選實施例的實例。盡管將 結合優(yōu)選實施例來描述本發(fā)明,但將了解不希望其將本發(fā)明限于這些實施例。相反,希 望本發(fā)明涵蓋可包含在如所附權利要求書所界定的本發(fā)明精神和范圍內(nèi)的替代物、修改 和等效物。此外,在本發(fā)明實施例的以下詳細描述中,陳述多個特定細節(jié)以提供對本發(fā) 明的徹底理解。然而,所屬領域的技術人員將認識到可在不存在這些特定細節(jié)的情況下 實踐本發(fā)明。在其它例子中,未詳細描述眾所周知的方法、程序、組件和電路以免不必 要地混淆本發(fā)明實施例的方面。符號和術語從計算機存儲器內(nèi)對數(shù)據(jù)位所進行的操作的程序、步驟、邏輯塊、處理和其他符號 表示的角度來展現(xiàn)以下詳細描述的某些部分。這些描述和表示是數(shù)據(jù)處理領域的技術人 員用以將其作品實質最有效地傳達給所屬領域的其他技術人員的方式。程序、計算機執(zhí) 行步驟、邏輯塊、處理等在此處且一般被認為是導致希望結果的自相容歩驟或指令序列。 所述步驟是需要對物理量進行物理操作的步驟。通常(盡管不必要),這些量采用能在計算 機系統(tǒng)中存儲、傳遞、組合、比較和以其他方式操縱的電信號或磁信號的形式。已多次 證實將這些信號稱為位、值、元素、符號、字符、項、數(shù)字或類似形式是便利的,主要 是因為常見用法的緣故。然而,應記住所有這些和類似術語與適當物理量相關聯(lián)且僅僅是應用于這些量的方
便標記。除非從以下論述中容易看出另有特別規(guī)定,否則理解為在本發(fā)明中,使用例如 "處理"或"存取"或"執(zhí)行"或"存儲"或"渲染"等術語的論述始終指代計算機系 統(tǒng)(例如圖1的計算機系統(tǒng)100)或類似電子計算裝置的行為和處理,其操縱表示為計 算機系統(tǒng)的寄存器和存儲器內(nèi)的物理(電子)量的數(shù)據(jù)并將其變換為類似地表示為計算 機系統(tǒng)存儲器或寄存器或其它此類信息存儲、傳輸或顯示裝置內(nèi)的物理量的其它數(shù)據(jù)。 計算機系統(tǒng)平臺圖1展示根據(jù)本發(fā)明的一個實施例的計算機系統(tǒng)100。計算機系統(tǒng)100描繪根據(jù)本 發(fā)明實施例的基本計算機系統(tǒng)的組件,其為特定的基于硬件和基于軟件的功能性提供執(zhí) 行平臺。 一般來說,計算機系統(tǒng)100包含至少一個CPU 101、系統(tǒng)存儲器115和至少一 個圖形處理器單元(GPU) 110。所述CPU 101可經(jīng)由橋接器組件/存儲器控制器(未圖 示)耦合到系統(tǒng)存儲器115,或可經(jīng)由在CPU 101內(nèi)部的存儲器控制器(未圖示)直接 耦合到系統(tǒng)存儲器115。 GPU 110耦合到顯示器112。 一個或一個以上額外GPU可視情 況耦合到系統(tǒng)100,以進一步增加其計算能力。GPU 110耦合到CPU 101和系統(tǒng)存儲器 115。系統(tǒng)100可實施為(例如)桌上型計算機系統(tǒng)或服務器計算機系統(tǒng),其具有耦合到 專用圖形渲染GPU 110的強大的通用CPU 101。在此一實施例中,可包括添加外圍總線、 專門圖形存儲器、IO裝置等的組件。類似地,系統(tǒng)100可實施為手持裝置(例如,手機 等)或置頂視頻游戲控制臺裝置(例如可從Microsoft Corporation of Redmond, Washington 得至U的Xbox⑧或可從Sony Computer Entertainment Corporation of Tokyo, Japan亍導至!j的 PIayStation3 )。應理解,GPU 110可實施為離散組件、經(jīng)設計以經(jīng)由連接器(例如,AGP插槽、 PCI-Express插槽等)耦合到計算機系統(tǒng)100的離散圖形卡、離散集成電路小芯片(例如, 直接安裝在母板上)或作為包括在計算機系統(tǒng)芯片組組件(未圖示)的集成電路小芯片 內(nèi)的集成GPU。另外,可針對GPU110包括本地圖形存儲器114以用于高帶寬圖形數(shù)據(jù)存儲。本發(fā)明實施例圖2展示根據(jù)本發(fā)明的一個實施例描繪位于屏幕250上用于光柵化的多邊形201的 圖200。圖2描繪根據(jù)本發(fā)明實施例執(zhí)行的光柵化過程。在所述光柵化過程期間,多邊形(在 此情況下為三角形201)的覆蓋范圍在具有一個或一個以上瓦片的個別部分上方分解為 其各個貢獻部分(例如,每瓦片32X32個像素、每瓦片16X16個像素、每瓦片8X8個 像素等)。對于覆蓋較大數(shù)目像素的非常大的三角形,界定三角形且因此界定覆蓋哪些像 素的邊緣等式可用完較大數(shù)目的位來表示其整數(shù)操作數(shù)。這是由于這樣的事實需要以 足夠的精度界定三角形邊緣等式,以便允許確定哪些像素由三角形(或其它類型圖形圖 元)覆蓋》圖2描繪比較大的屏幕250,在此情況下其橫越8k個像素(例如,8192個像素)。 使用此類大屏幕250,需要較大數(shù)目的位來界定并尋址組成屏幕250的像素,如由示范 性線202描繪,其中光柵化器在屏幕250的寬度上從左到右步進越過一行瓦片。圖3展示根據(jù)本發(fā)明一個實施例的三角形201和沿著光柵化線202產(chǎn)生的覆蓋瓦片。 如上所述,三角形邊緣等式的較大整數(shù)操作數(shù)用于評估較大三角形(例如,三角形201), 并確定哪些瓦片具有覆蓋。三角形邊緣等式的較大整數(shù)操作數(shù)用于為所述三角形切割出 具有至少某些覆蓋的那些瓦片。沿著光柵化線202說明這些瓦片。根據(jù)本發(fā)明實施例, 一且確定了這些瓦片,便可使用較小整數(shù)操作數(shù)來評估每一所述瓦片內(nèi)有哪些像素具有 覆蓋。此屬性利用這樣的事實步進越過瓦片所需的位數(shù)目比步進越過大屏幕(例如, 屏幕250)所需的位數(shù)目小得多。圖4展示根據(jù)本發(fā)明的一個實施例描繪示范性瓦片400的尺度的圖。如上所述,組 成瓦片400的像素的數(shù)目比組成大屏幕(例如,屏幕250)的像素的數(shù)目小得多。舉例 來說,在一個實施例中,瓦片400具有32像素的寬度和32像素的高度。在另一實施例 中,瓦片400具有16像素的寬度和16像素的高度。對于圖2的全屏幕圖像250,三角形邊緣等式需要能夠尋址相對較大數(shù)目的像素(例 如,4096或8192個像素)。這意味著三角形邊緣等式操作數(shù)使用13或14個位(例如, 13位x維度操作數(shù)和13位y維度操作數(shù))。在后續(xù)光柵化操作中(例如,在細光柵化期 間),計算僅需要尋址各個瓦片(例如瓦片400 (例如,16X16個像素))內(nèi)所所發(fā)生的 事物。對于這些情形,在每個維度上僅尋址16個像素是足夠的。因而,舉例來說,所述 算法僅需要提供三或四位整數(shù)像素地址而不是13或14位。因此,對于這些稍后光柵化 操作,通過消除最高有效10位(舉例來說),給定光柵化器級可節(jié)省大量硅面積而不會 損失有用精度。舉例來說,在一個實施方案中,光柵化過程被劃分為粗光柵化和細光柵 化。在細光柵化期間,當在32X32瓦片內(nèi)工作時,精度從13或14位調(diào)節(jié)到5位。節(jié)省的硅面積提供許多優(yōu)點。舉例來說,節(jié)省的硅面積可用于其它用途,例如較大 的存儲器超高速緩存、更強大的ALU等。類似地,較小整數(shù)操作數(shù)降低了存儲操作數(shù)所 需的硅面積。節(jié)省的硅面積還會改進整個GPU制作過程的產(chǎn)率,且降低所得GPU小芯 片的功率消耗。因此,舉例來說,在光柵化器與大屏幕250 —起作用的情況下,為了執(zhí)行初始光柵
化,光柵化器需要能夠尋址屏幕250的8K范圍內(nèi)的各個像素,從而導致較大整數(shù)操作數(shù) (例如,14、 15位或更多)。 一旦切割出各個瓦片,光柵化器便僅需要在組成瓦片400 的所述數(shù)目的像素內(nèi)工作。因此,在瓦片400為32個像素寬的情況下,光柵化器僅需要 在寬度維度上尋址32個像素,這僅需要5個位。類似地,在瓦片為8個像素寬的情況下, 光柵化器級僅需要在每一維度上尋址8個像素,這僅需要每維度3個位。換句話說, 一旦光柵化過程進行到瓦片級別,精度的整數(shù)級別便可降低為足以覆蓋 界定所述瓦片的像素范圍。對于執(zhí)行多級別光柵化的光柵化級,隨著瓦片尺寸進一步沿 著光柵化管線向下而變小,重復此過程。精度相應地降低以匹配組成所述瓦片的像素數(shù) 目乃至組成所述瓦片的樣品數(shù)目。圖5展示根據(jù)本發(fā)明一個實施例在光柵級500內(nèi)實施的基于瓦片的精度的光柵化過 程的圖。如圖5描繪,當光柵級以屏幕相關的精度尺度(例如,圖2的屏幕250)進行 操作時,三角形邊緣等式操作數(shù)具有第一整數(shù)精度級別,展示為整數(shù)精度級別501。當 光柵級(例如)在組成各個瓦片(例如,圖4的瓦片400)的像素內(nèi)以第二級別瓦片相 關的精度進行操作時,三角形邊緣等式操作數(shù)向下調(diào)節(jié)到第二精度級別,從而產(chǎn)生較小 的整數(shù)操作數(shù),展示為整數(shù)精度級別502。因此,當光柵級(例如)在瓦片400的子部 分(例如,在瓦片400被進一步劃分成較小子瓦片的情況下)內(nèi)或用各個像素的樣品以 第三級別瓦片相關的精度進行操作時,三角形邊緣等式操作數(shù)向下調(diào)節(jié)到第三精度級別, 從而產(chǎn)生較小的整數(shù)操作數(shù),展示為整數(shù)精度級別503。以此方式,每當降低瓦片尺寸時,可相應地降低尋址組成所述瓦片的像素所需的精 度。在計算樣品時類似地降低精度。圖6展示根據(jù)本發(fā)明實施例描繪包括擴展位601的示范性整數(shù)操作數(shù)的圖600。圖6 描繪擴展位601的可選使用的使用,所述擴展位601可添加為操作數(shù)的最高有效位,以 指示三角形(例如,三角形201)的邊緣位于瓦片邊界以外的那些情況。舉例來說,在 一個實施例中,擴展位601將由光柵級的硬件用以指示覆蓋范圍延伸超過瓦片邊界,就 好像邊緣在無限遠處一樣。圖7展示根據(jù)本發(fā)明一個實施例的GPU 110的內(nèi)部組件的圖。如圖7所示,GPU 110 包括設置引擎701和光柵化器單元702。在本實施例中,本發(fā)明的功能性在光柵化器單 元702的硬件和軟件內(nèi)實施。 一般來說,光柵化器單元702通過將從設置引擎701接收 到的基于頂點的描述轉換為基于邊緣描述的描述來起作用。光柵化器單元702隨后將這 些邊緣描述轉換為組成實際像素描述的填充區(qū)域(例如,像素區(qū)域、像素子樣品等)。隨 后將像素描述傳遞到GPU 110內(nèi)的其它單元以供進一步處理和渲染。在本實施例中,光柵化器單元702包括粗光柵組件703和細光柵組件704。粗光柵 組件703在快速搜索瓦片柵格以識別所關注的瓦片(例如,由圖元覆蓋的瓦片)時實施 第一少許精度瓦片光柵化過程(如上所述)。 一旦識別到所關注的瓦片群組,細光柵組件 704單獨識別由圖元覆蓋的像素。因此,在此類實施例中,粗光柵組件703通過使用瓦 片來快速搜索像素柵格,且細光柵組件704使用由粗光柵組件703產(chǎn)生的信息,并通過 單獨識別由圖元覆蓋的像素來實施第二級別精度細粒度光柵化。仍參看圖7, CPU110進一步包括高速緩沖存儲器721,其通過針對最頻繁使用的圖 形渲染數(shù)據(jù)實施高速低等待時間存儲來起作用。此類數(shù)據(jù)通常包含紋理信息、頂點信息、 顏色等。高速緩沖存儲器721展示為耦合到本地圖形存儲器114。高速緩沖存儲器721 利用一個或一個以上高速緩沖維持機制來維持與本地圖形存儲器114的一致性。箭頭740 展示GPU 110與系統(tǒng)存儲器(例如,圖1所示的存儲器115)之間的通信路徑。在一個實施例中,包含光柵單元702的硬件經(jīng)優(yōu)化以在每時鐘基礎上進行操作。舉 例來說,為了提供高處理量且因此維持高渲染幀速率,粗光柵組件703和細光柵組件704 包含經(jīng)設計以在每時鐘周期基礎上實施第一級別精度光柵化和第二級別精度光柵化的硬 件。光柵化器單元702可經(jīng)實施以使得在粗光柵組件703中實施第一級別光柵化,所述 粗光柵組件703在單個時鐘周期內(nèi)"切割出"覆蓋給定圖元的瓦片。隨后,在細光柵組 件704中實施具有第二級別精度的光柵化,所述細光柵組件704在單個時鐘周期中切割 出瓦片的覆蓋的像素。因此,舉例來說,可每時鐘處理64個像素的硬件將使用64像素 占地面積(例如,四個每一者具有16個像素的瓦片),而可每時鐘處理128個像素的硬 件將使用128個像素占地面積(例如,八個每一者具有16個像素的瓦片、四個每一者具 有32個像素的瓦片等)。出于說明和描述目的展現(xiàn)了對本發(fā)明特定實施例的以上描述。不希望它們?yōu)樵敱M的 或將本發(fā)明限于所揭示的精確形式,且能夠根據(jù)以上教示作出多種修改和改變。選擇并 描述所述實施例是為了最好地解釋本發(fā)明原理和其實際應用,因而使得所屬領域的技術 人員能夠最好地利用本發(fā)明和具有適合于所希望的特定使用的各種修改的各種實施例。 希望本發(fā)明范圍由所附權利要求書和其等效物界定。
權利要求
1.一種在圖形處理器的光柵級中用于基于瓦片的精度的光柵化的方法,其包含接收圖形圖元以在圖形處理器的光柵級中進行光柵化;以第一級別精度來光柵化所述圖形圖元以產(chǎn)生多個像素瓦片;以及以第二級別精度來光柵化所述瓦片以產(chǎn)生覆蓋的像素;以及輸出所述覆蓋的像素以在所述圖形處理器的隨后級中進行渲染操作。
2. 根據(jù)權利要求l所述的方法,其中所述第一級別精度高于所述第二級別精度。
3. 根據(jù)權利要求2所述的方法,其中用于以所述第一級別精度尋址所述多個瓦片的整 數(shù)值大于用于以所述第二級別精度尋址多個像素的整數(shù)值。
4. 根據(jù)權利要求l所述的方法,其中以所述第一級別精度來光柵化所述圖形圖元,以 尋址組成屏幕圖像的多個像素。
5. 根據(jù)權利要求l所述的方法,其中以所述第二級別精度來光柵化所述圖形圖元,以 尋址組成所述多個瓦片中的每一者的多個像素。
6. 根據(jù)權利要求5所述的方法,其中將所述多個瓦片中的每一者劃分為至少兩個部分, 且其中以第三級別精度來光柵化所述至少兩個部分以尋址組成每個部分的多個像 素。
7. 根據(jù)權利要求1所述的方法,其中在每時鐘周期基礎上實施所述具有所述第一級別 精度的光柵化。
8. 根據(jù)權利要求1所述的方法,其中在每時鐘周期基礎上實施所述具有所述第二級別 精度的光柵化。
9. 根據(jù)權利要求1所述的方法,其中在粗光柵單元中實施具有所述第一級別精度的光 柵化,且在細光柵單元中實施具有所述第二級別精度的光柵化。
10. —種GPU (圖形處理器單元),其包含設置單元,其用于產(chǎn)生多邊形描述;光柵化器單元,其耦合到所述設置單元,用于光柵化所述多邊形描述; 粗光柵單元,其位于所述光柵化器單元內(nèi),用于以第一級別精度來光柵化圖形圖元,以產(chǎn)生多個像素瓦片;以及細光柵單元,其位于所述光柵化器單元內(nèi),用于以第二級別精度來光柵化所述圖形圖元以產(chǎn)生覆蓋的像素,以在所述圖形處理器的隨后級中進行渲染操作。
11. 根據(jù)權利要求9所述的GPU,其中所述第一級別精度高于所述第二級別精度。
12. 根據(jù)權利要求10所述的GPU,其中用于以所述第一級別精度尋址所述多個瓦片的 整數(shù)值大于用于以所述第二級別精度尋址多個像素的整數(shù)值。
13. 根據(jù)權利要求10所述的GPU,其中以所述第一級別精度來光柵化所述圖形圖元, 以尋址組成屏幕圖像的多個像素。
14. 根據(jù)權利要求10所述的GPU,其中以所述第二級別精度來光柵化所述圖形圖元, 以尋址組成所述多個瓦片中的每一者的多個像素。
15. 根據(jù)權利要求14所述的GPU,其中將所述多個瓦片中的每一者劃分為至少兩個部 分,且其中以第三級別精度來光柵化所述至少兩個部分以尋址組成每個部分的多個 像素。
16. 根據(jù)權利要求10所述的GPU,其中在每時鐘周期基礎上實施所述具有所述第一級 別精度的光柵化。
17. 根據(jù)權利要求10所述的GPU,其中在每時鐘周期基礎上實施所述具有所述第二級 別精度的光柵化。
18. —種計算機系統(tǒng),其包含-系統(tǒng)存儲器;中央處理器單元,其耦合到所述系統(tǒng)存儲器;以及 圖形處理器單元,其以通信方式耦合到所述中央處理器單元; 設置單元,其位于所述圖形處理器單元內(nèi),用于產(chǎn)生多邊形描述; 光柵化器單元,其位于所述圖形處理器單元內(nèi)且耦合到所述設置單元,用于光柵化所述多邊形描述;以及粗光柵組件,其位于所述光柵單元內(nèi),其中所述粗光柵化器組件經(jīng)配置以接收 圖形圖元以在圖形處理器的光柵級中進行光柵化;以第一級別精度來光柵化所述圖 形圖元以產(chǎn)生多個像素瓦片及以第二級別精度來光柵化所述瓦片以產(chǎn)生覆蓋的像 素;且其中輸出所述覆蓋的像素以在所述圖形處理器的隨后級中進行渲染操作。
19. 根據(jù)權利要求18所述的計算機系統(tǒng),其中所述第一級別精度高于所述第二級別精 度。
20. 根據(jù)權利要求19所述的計算機系統(tǒng),其中用于以所述第一級別精度尋址所述多個 瓦片的整數(shù)值大于用于以所述第二級別精度尋址多個像素的整數(shù)值。
全文摘要
本發(fā)明提供一種在圖形處理器的光柵級中用于基于瓦片的精度的光柵化的方法。所述方法包括接收圖形圖元以在圖形處理器的光柵級中進行光柵化;及以第一級別精度來光柵化所述圖形圖元以產(chǎn)生多個像素瓦片。接著以第二級別精度來光柵化所述瓦片,以產(chǎn)生覆蓋的像素。接著輸出所述覆蓋的像素,以在所述圖形處理器的隨后級中進行渲染操作。
文檔編號G06T15/00GK101131768SQ20071013004
公開日2008年2月27日 申請日期2007年7月25日 優(yōu)先權日2006年7月26日
發(fā)明者富蘭克林·C·克羅, 布萊茲·A·維尼翁 申請人:輝達公司