亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

加速的起始瓦片搜索的制作方法

文檔序號:6611198閱讀:253來源:國知局
專利名稱:加速的起始瓦片搜索的制作方法
技術領域
本發(fā)明大體上涉及硬件加速圖形計算機系統(tǒng)。
背景技術
計算機性能的最近進展已使得圖形系統(tǒng)能夠通過使用個人計算機、家用視頻游戲計 算機、手持裝置等來提供更逼真的圖形圖像。在此類圖形系統(tǒng)中,執(zhí)行多個程序以向系 統(tǒng)屏幕"渲染"或繪制圖形圖元。"圖形圖元"是圖形圖片的基本組成部分,例如頂點、 多邊形等。經(jīng)渲染的圖像由這些圖形圖元的組合形成。可利用許多程序來執(zhí)行3-D圖形 渲染。
已研發(fā)出多種專用圖形處理單元(例如,GPU等)以優(yōu)化執(zhí)行圖形渲染程序所需的 計算。GPU經(jīng)配置以進行高速操作且通常并入有一個或一個以上渲染管線。每一管線包 括多個基于硬件的功能單元,所述功能單元經(jīng)優(yōu)化以高速執(zhí)行圖形指令/數(shù)據(jù),其中將指 令/數(shù)據(jù)饋入到管線的前端中,且在管線的后端處出現(xiàn)計算結果。GPU的基于硬件的功能 單元、高速緩沖存儲器、固件等經(jīng)優(yōu)化以對低級圖形圖元(例如,包含"點"、"線"、"三 角形"等)進行操作且產(chǎn)生經(jīng)實時渲染的3-D圖像。
使用光柵顯示技術來產(chǎn)生經(jīng)實時渲染的3-D圖像。光柵顯示技術廣泛用于計算機圖 形系統(tǒng)中,且一般指代組成圖像的多個像素的柵格受圖形圖元影響的機制。對于每個圖 元,典型的光柵化系統(tǒng)一般逐像素步進,且按照圖元的貢獻來確定是否要"渲染"給定 像素或將其寫入到幀緩沖器或像素映射中。這又確定如何將數(shù)據(jù)寫入代表每個像素的顯 示緩沖器。
己研發(fā)出多種遍歷算法,以通過覆蓋圖元內的所有像素的方式來逐像素地移動。所 述遍歷算法需要考慮其中待渲染組成圖像的圖元的裁剪窗口。
一般來說,裁剪窗口包含用于代表圖像的可見區(qū)域的數(shù)據(jù)結構(例如,三角形數(shù)據(jù) 結構、窗口裁剪平面等)。GPU包括特殊硬件和/或軟件來保持裁剪信息以便恰當?shù)夭眉?圖形圖元。察看、透視和裁剪級對于所接收的每一多邊形的頂點和邊緣需要較大數(shù)目的 算法操作。
然而,在對僅部分駐留在裁剪窗口內的圖元進行光柵化時存在問題。典型的現(xiàn)有技
術解決方法涉及以單向方式光柵化圖元并產(chǎn)生所得的覆蓋的像素。此類傳統(tǒng)的單向解決 方法涉及在恒定方向上逐行產(chǎn)生像素。傳統(tǒng)的解決方法在裁剪窗口的一個邊緣處開始, 且橫穿所述裁剪窗口直到遇上所述圖元為止,并接著步進越過所述圖元直到光柵化線完 成為止。這需要序列移動越過圖像以找到圖元邊緣。當圖元邊緣在裁剪窗口外部時,需 要傳統(tǒng)的解決方法從起始邊緣處開始步進且橫穿圖元,直到其步進到圖元的可見區(qū)(例 如,裁剪窗口內的部分)中為止。
因此,消耗大量工作和相應較大數(shù)目的時鐘周期來光柵化圖像內最終將不被渲染的 像素。這對整個3-D渲染過程造成非常大的負面性能影響。所述負面性能影響對于大部 分區(qū)域位于裁剪窗口外部的那些圖元(例如,在遮蔽應用中經(jīng)常遇到的狹長三角形)甚 至更為顯著。
因此,需要一種光柵化過程,其可確保有效利用所需的圖形渲染硬件和由所述渲染 硬件消耗的時鐘周期來產(chǎn)生與正被建立的圖像相關的像素。

發(fā)明內容
本發(fā)明實施例提供一種用于光柵化過程的方法和系統(tǒng),其確保有效利用所需的圖形 渲染硬件和由所述渲染硬件消耗的時鐘周期來產(chǎn)生與正被建立的窗口裁剪圖像相關的像 素。
在一個實施例中,本發(fā)明實施為一種用于在圖形管線(例如,GPU)的光柵級中實 現(xiàn)加速的起始瓦片光柵化的方法。所述方法包括界定用于裁剪產(chǎn)生圖像的窗口和接收圖 形圖元以在圖形處理器的光柵級中進行光柵化。執(zhí)行與所述窗口相關的二分搜索以確定 至少具有圖形圖元的部分覆蓋范圍的起始瓦片?;谒銎鹗纪咂?,光柵級通過產(chǎn)生多
個至少具有圖形圖元的部分覆蓋范圍的鄰近瓦片來光柵化所述圖形圖元。起始瓦片和鄰 近瓦片每一者包含多個像素(例如,16X16個像素、32X32個像素等)。
所述二分搜索包含用于通過在每一步驟處沿著所述窗口的與圖形圖元(例如,三角 形、四邊形、線等)相交的邊緣排除可能起始瓦片范圍的一半來沿著所述邊緣尋找特定 瓦片(例如,起始瓦片)的算法。舉例來說,二分搜索找到所述范圍的中部,進行比較 以確定所需起始瓦片在所述中部之前還是之后,且接著以相同方式搜索剩余半部,以此 類推,直到定位起始瓦片為止。
以此方式,本發(fā)明實施例在較困難情況(例如,大部分圖形圖元駐留在裁剪窗口外 部的那些情況)下將用于定位駐留在裁剪窗口內部的圖形圖元的邊緣的搜索時間加速100
倍或更多倍。經(jīng)加速的搜索時間可因此使得二分搜索過程能夠相對于后續(xù)光柵化操作并 行或以重疊方式執(zhí)行,從而大大增加實時3-D圖形渲染的效率。


在附式中以實例方式而并非以限制方式來說明本發(fā)明,其中相同參考標號指代 類似元件。
圖1展示根據(jù)本發(fā)明一個實施例的計算機系統(tǒng)。
圖2展示根據(jù)本發(fā)明一個實施例描繪圖形圖元和裁剪窗口 202的圖。
圖3展示說明由本發(fā)明實施例執(zhí)行的用于光柵化三角形201的二分搜索的圖。
圖4展示根據(jù)本發(fā)明一個實施例說明頂點等式的操作的圖,所述頂點等式由GPU評
估以確定特定瓦片或特定像素是在三角形的左側、右側還是內部。
圖5展示根據(jù)本發(fā)明一個實施例說明通過二分搜索定位起始瓦片的方式和在三角形
外部迭代連續(xù)瓦片的方式的圖。
圖6展示根據(jù)本發(fā)明一個實施例描繪瓦片的尺度的圖。 圖7展示根據(jù)本發(fā)明一個實施例的GPU的內部組件的圖。
具體實施例方式
現(xiàn)將詳細參看本發(fā)明的優(yōu)選實施例,附圖中說明了所述優(yōu)選實施例的實例。盡管將 結合優(yōu)選實施例來描述本發(fā)明,但將了解不希望其將本發(fā)明限于這些實施例。相反,希 望本發(fā)明涵蓋可包含在如所附權利要求書所界定的本發(fā)明精神和范圍內的替代物、修改 和等效物。此外,在本發(fā)明實施例的以下詳細描述中,陳述多個特定細節(jié)以提供對本發(fā) 明的徹底理解。然而,所屬領域的技術人員將認識到可在不存在這些特定細節(jié)的情況下 實踐本發(fā)明。在其它例子中,未詳細描述眾所周知的方法、程序、組件和電路以免不必 要地混淆本發(fā)明實施例的方面。
符號和術語
從計算機存儲器內對數(shù)據(jù)位所進行的操作的程序、步驟、邏輯塊、處理和其他符號 表示的角度來展現(xiàn)以下詳細描述的某些部分。這些描述和表示是數(shù)據(jù)處理領域的技術人 員用以將其作品實質最有效地傳達給所屬領域的其他技術人員的方式。程序、計算機執(zhí) 行步驟、邏輯塊、處理等在此處且一般被認為是導致希望結果的自相容步驟或指令序列。 所述步驟是需要對物理量進行物理操作的步驟。通常(盡管不必要),這些量采用能在計算
機系統(tǒng)中存儲、傳遞、組合、比較和以其他方式操縱的電信號或磁信號的形式。已多次 證實將這些信號稱為位、值、元素、符號、字符、項、數(shù)字或類似形式是便利的,主要 是因為常見用法的緣故。
然而,應記住所有這些和類似術語與適當物理量相關聯(lián)且僅僅是應用于這些量的方 便標記。除非從以下論述中容易看出另有特別規(guī)定,否則理解為在本發(fā)明中,使用例如 "處理"或"存取"或"執(zhí)行"或"存儲"或"渲染"等術語的論述始終指代計算機系 統(tǒng)(例如圖1的計算機系統(tǒng)100)或類似電子計算裝置的行為和處理,其操縱表示為計 算機系統(tǒng)的寄存器和存儲器內的物理(電子)量的數(shù)據(jù)并將其變換為類似地表示為計算 機系統(tǒng)存儲器或寄存器或其它此類信息存儲、傳輸或顯示裝置內的物理量的其它數(shù)據(jù)。
計算機系統(tǒng)平臺
圖1展示根據(jù)本發(fā)明的一個實施例的計算機系統(tǒng)100。計算機系統(tǒng)100描繪根據(jù)本 發(fā)明實施例的基本計算機系統(tǒng)的組件,其為特定的基于硬件和基于軟件的功能性提供執(zhí) 行平臺。 一般來說,計算機系統(tǒng)100包含至少一個CPU 101、系統(tǒng)存儲器115和至少一 個圖形處理器單元(GPU) 110。所述CPU 101可經(jīng)由橋接器組件/存儲器控制器(未圖 示)耦合到系統(tǒng)存儲器115,或可經(jīng)由在CPU 101內部的存儲器控制器(未圖示)直接 耦合到系統(tǒng)存儲器115。 GPU 110耦合到顯示器112。 一個或一個以上額外GPU可視情 況耦合到系統(tǒng)100,以進一步增加其計算能力。GPU 110耦合到CPU 101和系統(tǒng)存儲器 115。系統(tǒng)100可實施為(例如)桌上型計算機系統(tǒng)或服務器計算機系統(tǒng),其具有耦合到 專用圖形渲染GPU 110的強大的通用CPU 101。在此類實施例中,可包括添加外圍總線、 專門圖形存儲器、IO裝置等的組件。類似地,系統(tǒng)100可實施為手持裝置(例如,手機 等)或置頂視頻游戲控制臺裝置(例如可從Microsoft Corporation of Redmond, Washington 得到的Xbox⑧或可從Sony'Computer Entertainment Corporation of Tokyo, Japan得至!j的 PlayStation3 )。
應理解,GPU 110可實施為離散組件、經(jīng)設計以經(jīng)由連接器(例如,AGP插槽、 PCI-Express插槽等)耦合到計算機系統(tǒng)100的離散圖形卡、離散集成電路晶粒(例如, 直接安裝在母板上)或作為包括在計算機系統(tǒng)芯片組組件(未圖示)的集成電路晶粒內 的集成GPU。視情況,可針對GPU110包括本地圖形存儲器114以用于高帶寬圖形數(shù)據(jù) 存儲。
本發(fā)明實施例
圖2展示根據(jù)本發(fā)明一個實施例描繪圖形圖元201和裁剪窗口 202的圖200。如圖2
描繪,圖形圖元201與裁剪窗口 202相交,但大部分位于裁剪窗口 202外部。
圖形圖元201 (在此情況下為三角形型圖形圖元)和裁剪窗口 202說明GPU圖形管
線的光柵化中的典型問題情況。當光柵化圖形圖元(例如,三角形、四邊形、線等)時,
GPU (例如,GPU110)的光柵化硬件需要決定在給定三角形(例如,三角形201)內的
何處開始光柵化過程。GPU需要為其光柵化過程確定起始點。
一般來說,所述光柵化過程涉及以訪問由三角形201影響、接觸且/或覆蓋的組成所
述圖像的2D像素柵格(例如,以及組成裁剪窗口 202的像素柵格)的組成像素的方式遍
歷三角形201。 GPU的光柵化功能性可使用多個不同遍歷型式來系統(tǒng)地確定哪些像素由
三角形201覆蓋。
所述不同的遍歷型式一般共同具有以下常見特征以大體上循序的方式評估由三角 形201覆蓋的連續(xù)像素。舉例來說,在一個實施例中,以來回、從左到右或從右到左、 線性掃描方式(例如,每次一行、每次一列等)來檢查像素?;蛘?,在一個實施例中, 可使用右行左行交互的遍歷型式,其中術語"右行左行交互"指的是一種遍歷型式,其 通過隨著每一遍沿著一個軸線向前移動時沿著正交軸線來回掃描來訪問2D區(qū)域上的所 有像素,就像農(nóng)夫犁地或鏟地那樣。
不管GPU 110所實施的遍歷型式的類型如何,均需要確定用于光柵化三角形201的 像素的起始點。在三角形(例如,或者其它類型的圖形圖元)完全駐留在裁剪窗口 202 內的情況下,挑選起始點是容易的。起始點確定將涉及(例如)使用三角形頂點中的一 者作為起始點。在頂點不位于所裁剪的邊界框中且邊界框的通常將用于起始點的隅角處 于三角形外部時會產(chǎn)生困難。
在一個實施例中,GPU 110在其遍歷型式中利用瓦片或像素群組。舉例來說,遍歷 線將涉及GPU 110沿著所述遍歷線步進越過連續(xù)瓦片(例如,8X8個像素、16X16個像 素、32X32個像素等)。與三角形相交的第一瓦片成為起始點?;蛘?,GPU110可利用包 含多個樣品點的瓦片,其中每個像素包括4、 8、 16等個樣品點。
本發(fā)明實施例特別適用于處理更有問題的情況,所述情況涉及部分地由裁剪窗口 202 裁剪的經(jīng)裁剪的圖形圖元(例如,三角形201)。舉例來說,在三角形大部分位于裁剪窗 口 202外部的情況下,即使所述三角形的邊界框覆蓋大得多的屏幕區(qū)域,也只有小部分 所述三角形實際上可處于屏幕內部。這在圖2中說明為三角形201的小部分203,其可 在裁剪窗口 202的頂部看見,而三角形201的邊界框205覆蓋裁剪窗口 202頂部的大部 分。
本發(fā)明實施例能夠快速地為三角形201的位于裁剪窗口 202內的部分203的光柵化 找到起始瓦片。在現(xiàn)有技術中,光柵化過程將必須開始步進越過三角形的邊界框的遠左 邊緣以到達裁剪窗口 202的左邊緣,且接著步進越過窗口 202的頂部并逐瓦片越過屏幕 頂部直到遇到三角形201為止。這導致浪費過量時間,因為GPU光柵化器在遇到三角形 之前步進越過屏幕寬度的一半以上。現(xiàn)有技術解決方法需要(通常)通過走過屏幕頂部 來核對每個瓦片,直到遇到實際上包括三角形的部分的瓦片為止。相反,本發(fā)明實施例 執(zhí)行一種加速的起始瓦片搜索算法,其快速地識別起始瓦片而不會浪費GPU周期或光柵 化硬件。
仍參看圖2,在一個實施例中,在圖形管線(例如,GPU110)的光柵級內實施加速 的起始瓦片光柵化過程。舉例來說,在涉及三角形201的情況下,在界定用于裁剪所產(chǎn) 生圖像的裁剪窗口 202時,且在接收圖形圖元201來在光柵級中進行光柵化時,實施二 分搜索以快速地識別起始瓦片。所述二分搜索與裁剪窗口相關,因為其搜索組成裁剪窗 口 (例如,1024X768、 1600X1200、 1920X1200等)的瓦片來確定起始瓦片。如上所述, 起始瓦片至少具有三角形201的部分覆蓋范圍。基于起始瓦片,光柵級通過沿著遍歷線 產(chǎn)生多個瓦片來光柵化三角形201。這些瓦片中的每一者至少部分覆蓋或接觸三角形 201。
圖3展示說明由本發(fā)明實施例執(zhí)行的用于光柵化三角形201的二分搜索的圖。所述 二分搜索包含多步驟算法,其用于通過在每一步驟處沿著裁剪窗口 202的與三角形201 相交的邊緣排除可能起始瓦片范圍的一半來沿著所述邊緣尋找特定瓦片(例如,起始瓦 片)。舉例來說,在圖3實施例中,二分搜索找到包含遍歷線301的瓦片范圍中部,進行 比較以確定所需起始瓦片在所述中部之前還是之后,且接著以相同方式搜索剩余半部, 以此類推,直到定位起始瓦片為止。在每一步驟中,當二分搜索算法瞄準所需起始瓦片 時,剩余范圍被一分為二。這在圖3中說明為二分搜索檢査第一中部(如中線305所示), 確定所需起始瓦片位于右側,檢査第二中部(如線306所示),確定起始瓦片進一步位于 右側,等等。
以此方式,如由本發(fā)明實施例實施的沿著遍歷線的二分搜索在較困難情況(例如, 大部分圖形圖元駐留在裁剪窗口外部的那些情況)下將用于定位駐留在裁剪窗口內部的 圖形圖元(例如,三角形201的部分203)的邊緣的搜索時間加速IOO倍或更多倍。經(jīng) 加速的搜索時間可因此使得二分搜索過程能夠相對于后續(xù)光柵化操作以并行或以重疊方 式執(zhí)行,從而大大增加實時3-D圖形渲染的效率。另外,經(jīng)加速的搜索時間確保有效利
用所需的圖形渲染硬件和所述渲染硬件所消耗的時鐘周期來產(chǎn)生與窗口裁剪圖像相關的 像素,而不是浪費在步進越過空像素上。
應注意,如由本發(fā)明實施例實施的二分搜索為對數(shù)性質的,且以lOgn時間執(zhí)行。具
體地說,需要l+log2N個迭代來返回所需起始瓦片,其中N對應于沿著遍歷線的瓦片總 數(shù)(例如,在沿著1920X1200窗口或圖像的頂部邊緣存在60個32X32瓦片的情況下)。 所述二分搜索比現(xiàn)有技術線性搜索快得多,其中在所需起始瓦片隨機分布的那些情況下, 平均將需要N/2次比較,且其中在起始瓦片是最后測試的瓦片的最壞情況下,需要N次 比較。
圖4展示根據(jù)本發(fā)明一個實施例說明頂點等式的操作的圖,所述頂點等式由GPU110 評估以確定特定瓦片或特定像素是在三角形201的左側、右側還是內部。在一個實施例 中,使用基于三角形201頂點的頂點等式來計算三角形201的邊緣的位置。這些頂點等 式指示沿著遍歷線的給定像素是在三角形201的給定邊緣的左側、右側還是內部。因此, 舉例來說,邊緣等式將指示在所述遍歷線的401部分上的像素(例如,或者瓦片、樣品 等)將在三角形201的左側,在遍歷線的402部分上的像素將在三角形201內部,且在 遍歷線的403部分上的像素將在三角形201的右側。
應注意,盡管在沿著窗口 202的頂部邊緣執(zhí)行二分搜索的情形下描述本實施例,但 本發(fā)明實施例可沿著窗口 202的多個邊緣來執(zhí)行二分搜索。這將使得二分搜索能夠在圖 形圖元延伸出窗口 202的左邊緣、右邊緣或底部的那些情況下有效進行。舉例來說,在 一個實施例中,可在第一邊緣(例如,窗口 202的頂部或底部邊緣)上執(zhí)行二分搜索, 且隨后可在第二邊緣(例如,窗口 202的左邊緣或右邊緣)上執(zhí)行二分搜索以最有效地 定位所需起始瓦片。
圖5展示根據(jù)本發(fā)明一個實施例說明通過二分搜索定位起始瓦片501的方式和針對 三角形201迭代連續(xù)的鄰近瓦片的方式的圖。如上所述,使用二分搜索來為三角形201 的位于裁剪窗口 202內部的部分定位起始瓦片501。隨后,基于所述起始瓦片501,通過 沿著遍歷線產(chǎn)生多個瓦片來光柵化三角形201的剩余部分,如圖所示。后續(xù)產(chǎn)生的瓦片 中的每一者至少具有三角形201的部分覆蓋范圍。應注意,圖5實施例說明右行左行交 互遍歷型式。
因此,如上所述,經(jīng)加速的搜索時間可使得二分搜索過程能夠相對于后續(xù)光柵化操 作以并行或以重疊方式執(zhí)行。舉例來說, 一旦定位了起始瓦片501, 二分搜索算法便可 在光柵化三角形201的剩余部分時繼續(xù)為后續(xù)圖形圖元定位后續(xù)起始瓦片。針對后續(xù)起 始瓦片的二分搜索可與切割出三角形201的剩余瓦片同時發(fā)生。此功能性重疊防止在完 成一個光柵化功能(例如,起始瓦片搜索)且同時正在進行后續(xù)光柵化功能(例如,從 三角形中光柵化多個瓦片)時圖形硬件處于閑置狀態(tài)。
圖6展示根據(jù)本發(fā)明一個實施例描繪瓦片601的尺度的圖。如屈6描繪,瓦片601 包括隅角602-605。依據(jù)給定應用的特定要求而定,可在二分搜索期間在所述隅角602-605 中的任一者處評估瓦片602。在一個實施例中,沿著將在二分搜索過程中首先與圖形圖 元相交的最可能邊緣(例如邊緣607)來評估瓦片。舉例來說,根據(jù)上文所述的三角形 邊緣等式來評估瓦片607的邊緣,以確定下一個二分搜索中部是在左側還是右側,在上 方還是下方,如上文所述。
應注意,本發(fā)明實施例除了像素瓦片之外還可對個別像素乃至像素內的樣品陣列進 行操作,且可根據(jù)特定應用的需要來定制瓦片尺寸(例如,可由圖形驅動器等編程)。另 外,應注意,可根據(jù)特定應用的需要來編程待搜索的給定裁剪窗口的邊緣數(shù)目、待搜索 的第一和第二裁剪窗口邊緣和待評估的瓦片的邊緣或隅角(例如,可由圖形驅動器等編 程)。
圖7展示根據(jù)本發(fā)明一個實施例的GPU 110的內部組件的圖700。如圖7所示,GPU 110包括設置引擎701和光柵化器單元702。在本實施例中,在光柵化器單元702的硬件 和軟件內實施本發(fā)明的功能性。 一般來說,光柵化器單元702通過將從設置引擎701接 收到的基于頂點的描述轉換為基于邊緣描述的描述來起作用。光柵化器單元702隨后將 這些邊緣描述轉換為包含實際像素描述的填充區(qū)域(例如,像素區(qū)域、像素子樣品等)。 像素描述隨后被傳遞到GPU110內的其它單元,以供進一步處理和渲染。
在一個實施例中,光柵化器單元702包括細光柵組件703和粗光柵組件704。在粗 光柵組件704內實施步進器單元705,以實施經(jīng)加速的起始瓦片搜索功能性(如上所述)。 一旦識別到起始瓦片,粗光柵單元703便快速搜索瓦片柵格來識別所關注的瓦片(例如, 由圖元覆蓋的瓦片)。 一旦識別到所關注的瓦片,細光柵組件703便單獨識別由圖元覆蓋 的像素。因此,在此類實施例中,步進器705識別所需的起始瓦片,粗光柵組件704通 過使用瓦片來快速搜索像素柵格,且細光柵組件703使用由粗光柵組件704產(chǎn)生的信息, 并通過單獨識別由圖元覆蓋的像素來實施細粒度光柵化。
仍參看圖7, GPU110進一步包括高速緩沖存儲器721,其通過針對最頻繁使用的圖 形渲染數(shù)據(jù)實施高速度低等待時間的存儲來起作用。此類數(shù)據(jù)通常包含紋理信息、頂點 信息、顏色等。高速緩沖存儲器721展示為耦合到本地圖形存儲器112。高速緩沖存儲器
721利用一個或一個以上高速緩沖維持機制來維持與本地圖形存儲器112的一致性。箭頭 740展示GPU 110與系統(tǒng)存儲器(例如,圖1所示的存儲器115)之間的通信路徑。
出于說明和描述目的展現(xiàn)了對本發(fā)明特定實施例的以上描述。不希望它們?yōu)樵敱M的 或將本發(fā)明限于所揭示的精確形式,且能夠根據(jù)以上教示作出多種修改和改變。選擇并 描述所述實施例是為了最好地解釋本發(fā)明原理和其實際應用,因而使得所屬領域的技術 人員能夠最好地利用本發(fā)明和具有適合于所希望的特定使用的各種修改的各種實施例。 希望本發(fā)明范圍由所附權利要求書和其等效物界定。
權利要求
1.一種在圖形管線的光柵級中用于加速的起始瓦片光柵化的方法,其包含界定用于裁剪所產(chǎn)生圖像的窗口;接收圖形圖元以在圖形處理器的光柵級中進行光柵化;執(zhí)行與所述窗口相關的二分搜索,以確定至少具有所述圖形圖元的部分覆蓋范圍的起始瓦片,所述起始瓦片包含多個像素;以及基于所述起始瓦片,通過產(chǎn)生多個至少具有所述圖形圖元的部分覆蓋范圍的鄰近瓦片來光柵化所述圖形圖元。
2. 根據(jù)權利要求l所述的方法,其中所述圖形圖元的一部分駐留在所述窗口的外部。
3. 根據(jù)權利要求l所述的方法,其中對所述窗口的第一邊緣執(zhí)行所述二分搜索,且隨 后對所述窗口的第二邊緣執(zhí)行所述二分搜索。
4. 根據(jù)權利要求l所述的方法,其中所述窗口的所述第一邊緣是所述窗口的頂部。
5. 根據(jù)權利要求4所述的方法,其中所述窗口的所述第二邊緣是所述窗口的左邊緣或 所述窗口的右邊緣。
6. 根據(jù)權利要求1所述的方法,其中使用所述光柵級內的步進器單元來實施所述二分 搜索。
7. 根據(jù)權利要求6所述的方法,其中所述步進器單元經(jīng)配置以與所述圖形圖元的所述 光柵化并行地實施所述二分搜索。
8. 根據(jù)權利要求7所述的方法,其中并行地實施所述二分搜索以與所述圖形圖元的先 前部分的同時光柵化重疊。
9. 根據(jù)權利要求l所述的方法,其中在粗光柵單元中實施所述二分搜索,且在細光柵 單元中實施第二級別光柵化,以從至少部分覆蓋所述圖形圖元的多個瓦片中確定所 覆蓋的像素。
10. —種GPU (圖形處理器單元),其包含設置單元,其用于產(chǎn)生包含圖形圖元的多邊形描述;以及光柵單元,其耦合到所述設置單元以光柵化所述圖形圖元,其中所述光柵單元執(zhí) 行與裁剪窗口相關的二分搜索以確定至少具有所述圖形圖元的部分覆蓋范圍的起 始瓦片,所述起始瓦片包含多個像素,且其中所述光柵單元基于所述起始瓦片通過 產(chǎn)生多個至少具有所述圖形圖元的部分覆蓋范圍的鄰近瓦片來光柵化所述圖形圖 元。
11. 根據(jù)權利要求IO所述的GPU,其中所述圖形圖元的一部分駐留在所述窗口的外部。
12. 根據(jù)權利要求10所述的GPU,其中對所述窗口的第一邊緣執(zhí)行所述二分搜索,且 隨后對所述窗口的第二邊緣執(zhí)行所述二分搜索。
13. 根據(jù)權利要求10所述的GPU,其進一步包含步進器單元,其位于所述光柵級內,用以實施所述二分搜索。
14. 根據(jù)權利要求13所述的GPU,其中所述步進器單元并行地執(zhí)行所述二分搜索以與 所述圖形圖元的先前部分的同時光柵化重疊。
15. 根據(jù)權利要求14所述的GPU,其進一步包含-粗光柵單元;以及細光柵單元,其中所述步進器單元在所述粗光柵單元內實施,且所述細光柵單元 執(zhí)行第二級別光柵化,以從至少部分覆蓋所述圖形圖元的多個瓦片中確定所覆蓋的 像素。
16. —種計算機系統(tǒng),其包含系統(tǒng)存儲器;中央處理器單元,其耦合到所述系統(tǒng)存儲器;以及 圖形處理器單元,其以通信方式耦合到所述中央處理器單元; 設置單元,其用于產(chǎn)生包含圖形圖元的多邊形描述;以及光柵單元,其耦合到所述設置單元以光柵化所述圖形圖元,其中所述光柵單元執(zhí) 行與裁剪窗口相關的二分搜索以確定至少具有所述圖形圖元的部分覆蓋范圍的起 始瓦片,所述起始瓦片包含多個像素,且其中所述光柵單元基于所述起始瓦片通過 產(chǎn)生多個至少具有所述圖形圖元的部分覆蓋范圍的鄰近瓦片來光柵化所述圖形圖 元。
17. 根據(jù)權利要求16所述的計算機系統(tǒng),其中所述圖形圖元的一部分駐留在所述窗口 的外部。
18. 根據(jù)權利要求17所述的計算機系統(tǒng),其中對所述窗口的第一邊緣執(zhí)行所述二分搜 索,且隨后對所述窗口的第二邊緣執(zhí)行所述二分搜索。
19. 根據(jù)權利要求18所述的計算機系統(tǒng),其進一步包含-步進器單元,其位于所述光柵級內,用以實施所述二分搜索,且其中并行地執(zhí)行 所述二分搜索以與所述圖形圖元的先前部分的同時光柵化重疊。
20. 根據(jù)權利要求19所述的計算機系統(tǒng),其進一步包含-粗光柵單元;以及細光柵單元,其中所述步進器單元在所述粗光柵單元內實施,且所述細光柵單元 執(zhí)行第二級別光柵化,以從至少部分覆蓋所述圖形圖元的多個瓦片中確定所覆蓋的 像素。
全文摘要
本發(fā)明提供一種在圖形管線的光柵級中用于加速的起始瓦片光柵化的方法。所述方法包括界定用于裁剪產(chǎn)生的圖像的窗口和接收圖形圖元以在圖形處理器的光柵級中進行光柵化。執(zhí)行與所述窗口相關的二分搜索以確定至少具有所述圖形圖元的部分覆蓋范圍的起始瓦片,其中所述起始瓦片包含多個像素。基于所述起始瓦片,所述光柵級通過產(chǎn)生多個至少具有所述圖形圖元的部分覆蓋范圍的鄰近瓦片來光柵化所述圖形圖元。
文檔編號G06T1/00GK101114375SQ200710136338
公開日2008年1月30日 申請日期2007年7月24日 優(yōu)先權日2006年7月26日
發(fā)明者富蘭克林·C·克羅, 杰弗里·R·休厄爾 申請人:輝達公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1