專利名稱:使用多圖形處理單元的改進(jìn)的圖形去階梯的制作方法
技術(shù)領(lǐng)域:
0001本發(fā)明總體上涉及圖形處理系統(tǒng)。特別地,本發(fā)明涉及 在實(shí)現(xiàn)多圖形處理單元(GPU)的圖形處理系統(tǒng)中用于執(zhí)行圖形去階 梯操作的方法。
背景技術(shù):
0002已知的用于增加圖形處理系統(tǒng)的處理能力的方法是并行 地操作多圖形處理單元(GPU)或者視頻處理單元(VPU),其中每 個(gè)處理單元與其它的單元在共用總線上進(jìn)行通信。在此,詞語(yǔ)GPU和 VPU可互換使用。多GPU系統(tǒng)的一個(gè)優(yōu)點(diǎn)是它可以補(bǔ)充現(xiàn)有微處理 技術(shù)以實(shí)現(xiàn)增強(qiáng)的性能,因此提供了更便宜的替代方案以投資新的、 更快的GPU。多GPU系統(tǒng)通過(guò)在多圖形元件上并行地執(zhí)行計(jì)算實(shí)現(xiàn) 增強(qiáng)的性能。
0003使用圖形處理系統(tǒng)的一個(gè)例子是利用多GPU以提供提 高的性能,在共有的、同時(shí)待審的U.S.專利申請(qǐng)No.11/140,156 (公開(kāi) 號(hào)20060267991 )中描述,標(biāo)題是"Antialiasing Method and System", 發(fā)明人為Preetham等人,于2005年5月27日提交,這里引入?yún)⒖?其全部?jī)?nèi)容。前述的申請(qǐng)部分地描述了一種圖形處理系統(tǒng),其中多
GPU被并行地操作以在相同的圖形畫面上執(zhí)行圖形去階梯。
0004階梯是在所顯示的畫面中由繪制過(guò)程的不希望的缺陷的 出現(xiàn)所造成的公知效應(yīng)。邊緣階梯是一種特定類型的階梯,其在應(yīng)當(dāng) 看上去平滑的邊緣造成階梯?,F(xiàn)有的用于減輕邊緣階梯效應(yīng)的圖形去 階梯技術(shù)是多采樣技術(shù)。多采樣技術(shù)通過(guò)獲得被用于在像素之間生成 中間點(diǎn)的像素的多個(gè)采樣解決了邊緣階梯。釆樣(或者"子像素") 被平均以確定所顯示的像素顏色值。所顯示的在多釆樣圖像中的邊緣具有柔和化的階梯效應(yīng)。
0005前述的U,S,專利申請(qǐng)No.ll/140,156描述了一種圖形處 理系統(tǒng),其中兩個(gè)GPU分別對(duì)相同的畫面應(yīng)用不同的多采樣模式。即 每個(gè)GPU使用不同的采樣位置用于在相同的畫面中采樣和繪制像素。 然后這種采樣/繪制的結(jié)果在總線上(例如PCI-Express總線)從一個(gè) GPU被傳送到另一個(gè)GPU,其結(jié)果被混合以生成將被顯示的畫面。 最終結(jié)果是將被顯示的畫面的圖形去階梯采樣因子被有效地加倍了 。 例如,如果每個(gè)GPU執(zhí)行2X多采樣,將被顯示的畫面包括4X多采 樣。
0006關(guān)于上述方法,其中結(jié)果在總線上從一個(gè)GPU被傳送 到另一個(gè)GPU的步驟可能由于在連接這兩個(gè)GPU的總線上可獲得的 帶寬量有限而造成瓶頸。例如,在其中總線是PCI Express ( PCIE ) 總線的實(shí)施例中,帶寬可以被限制于大約1千兆比特每秒(Gb/sec)。 然而,在執(zhí)行該方法的系統(tǒng)中在總線上傳送的數(shù)據(jù)量是非常大的,特 別是當(dāng)將被顯示的畫面是由大量像素組成的高解析率畫面時(shí)。此外, 上述方法本身是低效率的,因?yàn)楸M管基于多采樣的圖形去階梯是一種 用于邊緣增強(qiáng)的技術(shù),但在兩個(gè)GPU之間傳送的大量數(shù)據(jù)與邊緣像素 完全無(wú)關(guān)。
0007那么想要的是一種用于在使用多GPU的圖形處理系統(tǒng) 中執(zhí)行圖形去階梯的改進(jìn)的方法和設(shè)備。改進(jìn)的方法和設(shè)備應(yīng)該減少 在多個(gè)GPU之間所傳送的數(shù)據(jù)量和/或提高這種數(shù)據(jù)傳送的效率。改 進(jìn)了的方法和設(shè)備應(yīng)該還提供區(qū)分與邊緣像素相關(guān)聯(lián)的數(shù)據(jù)和與邊緣 數(shù)據(jù)不相關(guān)聯(lián)的數(shù)據(jù)的手段。
發(fā)明內(nèi)容
0008本發(fā)明提供了一種用于在使用多GPU的圖形處理系統(tǒng) 中執(zhí)行圖形去階梯的改進(jìn)了的方法和設(shè)備。改進(jìn)了的方法和設(shè)備減少 了在多GPU之間所傳送的數(shù)據(jù)量并且提高了這種數(shù)據(jù)傳送的效率。本 發(fā)明還提供了 一種區(qū)分在所繪制的圖像中的邊緣和非邊緣像素的手
8段。
0009
一種根據(jù)本發(fā)明的特別實(shí)施例的方法可以被用于在包括 第一 GPU和第二 GPU的系統(tǒng)中執(zhí)行基于多采樣的圖形去階梯。該方 法包括在第一 GPU中使用第 一多采樣模式繪制畫面的第 一版本,在第 二 GPU中使用第二多采樣模式繪制該畫面的第二版本。然后邊緣像素 在該畫面的第二版本中被識(shí)別。然后在該畫面的第一版本中的像素僅 與那些在該畫面的第二版本中的已經(jīng)被識(shí)別為邊緣像素的像素相結(jié)合 以生成結(jié)合的畫面。
0010
一種根據(jù)本發(fā)明的特別實(shí)施例的系統(tǒng)包括被配置為使用 第 一多采樣模式繪制畫面的第 一版本的第一 GPU、被配置為使用第二 多采樣模式繪制畫面的第二版本的第二 GPU和連接第一 GPU和第二 GPU的總線。第二 GPU還被配置為識(shí)別在該畫面的第二版本中的邊 緣像素并且僅把那些在該畫面的第二版本中已經(jīng)識(shí)別為邊緣像素的像 素通過(guò)總線傳送到第一 GPU。第一 GPU還被配置為把在畫面的第一 版本中的像素與從第二GPU傳送的像素結(jié)合以生成結(jié)合的畫面。
0011
一種根據(jù)本發(fā)明的特別實(shí)施例的方法可以被用于識(shí)別在 由多個(gè)矩形塊組成的繪制圖像中的邊緣像素,所述多個(gè)矩形塊中的每 個(gè)由多個(gè)像素組成。該方法包括訪問(wèn)數(shù)據(jù)以確定在多個(gè)矩形塊中所選 擇的矩形塊是否被完全壓縮,識(shí)別所選擇的矩形塊為僅包括對(duì)應(yīng)于確 定所選擇的矩形塊完全壓縮的非邊緣像素,和識(shí)別所選擇的矩形塊為 包括對(duì)應(yīng)于確定所選擇的矩形塊未完全壓縮的一個(gè)或多個(gè)非邊緣像 素。
0012
一種根據(jù)本發(fā)明的特別實(shí)施例的方法可以被用于在包括 第一 GPU和第二 GPU的系統(tǒng)中執(zhí)行基于多采樣的圖形去階梯。該方 法包括在第一 GPU中使用第一多采樣模式繪制畫面的第一版本和在 第二 GPU中使用第二多采樣模式繪制與畫面的第二版本相關(guān)聯(lián)的邊 緣像素。然后邊緣像素從第二 GPU被傳送到第一 GPU。然后從第二 GPU傳送的邊緣像素與在該畫面的第一版本中的像素結(jié)合以生成結(jié) 合的畫面。0013本發(fā)明的其它特征和優(yōu)點(diǎn)以及本發(fā)明的各實(shí)施例的結(jié)構(gòu) 和操作將在以下參考附圖詳細(xì)描述。需要注意的是本發(fā)明不限于這里 所描述的特定實(shí)施例。這里呈現(xiàn)的這些實(shí)施例僅是為了說(shuō)明的目的。 對(duì)于本領(lǐng)域和相關(guān)領(lǐng)域的技術(shù)人員來(lái)說(shuō)附加的實(shí)施例基于這里包含的 指導(dǎo)是清楚的。
0014這里引入并作為說(shuō)明書的一部分的附圖和描述了本發(fā) 明,還用于解釋本發(fā)明的主旨并使本領(lǐng)域的技術(shù)人員能夠?qū)崿F(xiàn)和使用 本發(fā)明。
0015圖1是在包括多GPU的圖形處理系統(tǒng)中用于執(zhí)行圖形 去階梯的方法的流程圖。
0016圖2是根據(jù)本發(fā)明的實(shí)施例的執(zhí)行圖形去階梯的圖形處 理系統(tǒng)的框圖。
0017圖3是根據(jù)本發(fā)明的實(shí)施例的在包括多GPU的圖形處
理系統(tǒng)中用于執(zhí)行圖形去階梯的方法的流程圖。
0018圖4是根據(jù)本發(fā)明的實(shí)施例的第一多采樣模式的例子。0019圖5是根據(jù)本發(fā)明的實(shí)施例的第二多采樣模式的例子。0020圖6是根據(jù)本發(fā)明的實(shí)施例的結(jié)合的第一和第二多采樣
模式的例子。
0021圖7是根據(jù)本發(fā)明的實(shí)施例的用于壓縮多采樣的圖形去 階梯的顏色數(shù)據(jù)的示例性處理器和存儲(chǔ)器配置。
0022圖8是根據(jù)本發(fā)明的實(shí)施例的用于部分壓縮多釆樣的圖 形去階梯顏色數(shù)據(jù)的指針格式的例子。
0023圖9是根據(jù)本發(fā)明的實(shí)施例的用于確定一個(gè)矩形塊是否 僅包含非邊緣像素或者包含至少 一個(gè)邊緣像素的方法的流程圖。
0024圖10A和10B分別是根據(jù)本發(fā)明的實(shí)施例對(duì)在2 -采樣 邊緣檢測(cè)圖形去階梯緩沖器中像素的矩形塊進(jìn)行解析操作的應(yīng)用。
0025圖11描述了可以被用于實(shí)現(xiàn)本發(fā)明的示例計(jì)算機(jī)系統(tǒng)。與附圖結(jié)合將變得更加明顯,其中相似的附圖標(biāo)記表示通篇中對(duì)應(yīng)的 元件。在附圖中,相似的附圖標(biāo)記總體上表示相同、功能相似的和/ 或結(jié)構(gòu)相似的元件。其中元件第一次出現(xiàn)的附圖由在對(duì)應(yīng)的附圖標(biāo)記 中最左邊的數(shù)字表示。
具體實(shí)施例方式
A. —種用于在包括多GPU的圖形處理系統(tǒng)中執(zhí)行圖形去階梯的方法0027圖1的流程圖100表示在包括多GPU的圖形處理系統(tǒng) 中執(zhí)行圖形去階梯的方法。在圖1中,流程圖的左手邊代表由第一GPU 執(zhí)行的處理步驟,由"GPU0"表示,而右手邊代表由第二GPU執(zhí)行 的處理步驟,由"GPU1"表示。為了該例子的目的,假設(shè)每個(gè)GPU 都具有到它自己的本地存儲(chǔ)器的訪問(wèn)入口,用于緩沖諸如在繪制過(guò)程 期間使用的采樣數(shù)據(jù)的數(shù)據(jù)。
0028現(xiàn)在將描述由GPU 0執(zhí)行的頭三個(gè)步驟。首先,在步 驟102, GPU 0建立用于在所要繪制的畫面中堆每個(gè)像素進(jìn)行多采樣 的第一模式,其中該模式由"多釆樣模式A"表示。其次,在步驟106, GPU 0繪制畫面,其中繪制畫面包括在GPU 0的本地多釆樣圖形去階 梯(AA )緩沖器中存儲(chǔ)對(duì)應(yīng)于每個(gè)像素的多個(gè)采樣。如在此所使用的, 詞組"存儲(chǔ)采樣"是指存儲(chǔ)如顏色值等與每個(gè)采樣相關(guān)聯(lián)的數(shù)據(jù)?;?于多采樣模式A選擇每個(gè)像素的多個(gè)采樣位置。第三,在步驟110, GPU 0把在AA緩沖器中存儲(chǔ)的多個(gè)釆樣的每個(gè)集合解析為存儲(chǔ)在 GPUO的由"繪圖緩沖器A"表示的本地繪圖緩沖器中的單個(gè)采樣。 一種把多個(gè)采樣解析成單個(gè)采樣的方法需要在線性空間中平均多個(gè)樣 品點(diǎn)。
0029除了使用由"多采樣模式B"表示的多采樣模式來(lái)繪制 畫面外,由GPU1執(zhí)行的頭三個(gè)處理步驟(步驟104、 108和112)與 由GPU 0執(zhí)行的頭三個(gè)處理步驟并行地執(zhí)行并且基本上相同,多個(gè) 采樣的集合被存儲(chǔ)在位于GPU 1的本地存儲(chǔ)器中的AA緩沖器中,并且該畫面被解析到由"繪圖緩沖器B"表示的也位于GPU1的本地存 儲(chǔ)器中的繪圖緩沖器中。
0030在步驟114, GPU 1把繪圖緩沖器B的內(nèi)容復(fù)制到由"臨 時(shí)緩沖器A"表示的GPUO的本地臨時(shí)緩沖器。在步驟116,和GPU 0位于相同的圖形卡上的合成器執(zhí)行把在繪圖緩沖器A中呈現(xiàn)的每個(gè) 像素與在臨時(shí)緩沖器A中呈現(xiàn)的對(duì)應(yīng)像素線性混合以生成將被顯示的 畫面。作為替代,這種線性混合可以由沒(méi)有位于圖像卡上但是GPU 0 和GPU 1都與之相通信的獨(dú)立部件的合成器來(lái)執(zhí)行。在步驟118,將 被顯示的畫面被輸出到顯示裝置。畫面有效地把由每個(gè)單個(gè)GPU應(yīng)用 的多采樣的數(shù)量加倍。
0031關(guān)于上述的方法,步驟114 (其中繪圖緩沖器B的內(nèi)容 被復(fù)制到臨時(shí)緩沖器A)可能由于在把GPU O連接到GPU 1的總線 上可獲得的帶寬的數(shù)量有限而造成瓶頸。例如,在其中總線是PIC Express ( PCIE )總線的實(shí)施例中,帶寬可以被限制在大約1兆比特 每秒(Gb/sec)。然而,在執(zhí)行流程圖100的方法的系統(tǒng)中在總線上 傳送的數(shù)據(jù)的量是非常大的,特別是當(dāng)將被顯示的畫面是由大量的像 素組成的高解析率畫面時(shí)。此外,上述的流程圖100的方法本身是低 效率的,因?yàn)楸M管基于多釆樣的圖形去階梯是一種用于邊緣增強(qiáng)的技
術(shù),在兩個(gè)GPU之間傳送的大量數(shù)據(jù)與邊緣像素完全無(wú)關(guān)。
0032以下描述一種用于在使用多GPU的圖形處理系統(tǒng)中執(zhí) 行圖形去階梯的改進(jìn)的方法和設(shè)備。改進(jìn)的方法和設(shè)備減少了在多個(gè) GPU之間所傳送的數(shù)據(jù)量和/或改進(jìn)了這種數(shù)據(jù)傳送的效率。改進(jìn)了的
關(guān)聯(lián)的數(shù)據(jù)的手段。
B.根椐本發(fā)明的實(shí)施例的圖形處理系統(tǒng)
0033圖2是根據(jù)本發(fā)明的實(shí)施例的使用多GPU執(zhí)行圖形去 階梯的示例圖形處理系統(tǒng)200的框圖。圖形處理系統(tǒng)200包括各種在 主機(jī)計(jì)算機(jī)系統(tǒng)上執(zhí)行并且與圖形硬件單元、如第一GPU A208和第 二 GPU B210交互以繪制用于輸出到顯示器230的畫面的軟件單元,
12如應(yīng)用程序202、應(yīng)用程序編程接口 (API) 204和驅(qū)動(dòng)程序206。圖 形硬件單元位于安裝在主機(jī)計(jì)算機(jī)系統(tǒng)上的一個(gè)或多個(gè)圖形卡上,盡 管本發(fā)明不僅局限與此?,F(xiàn)在將詳細(xì)描述系統(tǒng)200的各個(gè)單元。
0034如在圖2中所示,系統(tǒng)200包括應(yīng)用程序202。應(yīng)用程 序202是需要圖形處理能力的終端用戶應(yīng)用程序,如視頻游戲應(yīng)用程 序。應(yīng)用程序202使用API 204通信。在圖形處理環(huán)境中多個(gè)API是 可用的。API作為應(yīng)用程序軟件、如應(yīng)用程序202和其上運(yùn)4亍應(yīng)用程 序軟件的圖形硬件之間的中介而被開(kāi)發(fā)。使用新的芯片集和甚至以增 長(zhǎng)的速度顯現(xiàn)的全新的硬件技術(shù),對(duì)于應(yīng)用程序開(kāi)發(fā)者來(lái)說(shuō)考慮并且 利用最新的硬件特征是困難的。特別是為每個(gè)可預(yù)知的硬件的集合編 寫應(yīng)用程序變得不可能。API避免了應(yīng)用程序變得太過(guò)對(duì)于硬件特定。 應(yīng)用程序可以把圖形數(shù)據(jù)和命令以標(biāo)準(zhǔn)化的格式輸出到API,而不是 直接輸出到硬件。可用的API的例子包括DirectX⑧或者OpenGL⑧。 API204可以是用于運(yùn)行圖形應(yīng)用程序的可用的API中的任意一種。
0035API 204與驅(qū)動(dòng)程序206相通信。驅(qū)動(dòng)程序206通常由 圖形硬件的制造商編寫的,并且把從API接收的標(biāo)準(zhǔn)代碼翻譯成可被 圖形硬件理解的本機(jī)格式。驅(qū)動(dòng)程序還接收輸入以指導(dǎo)圖形硬件的性 能設(shè)置。例如,用戶可以通過(guò)用戶接口 (UI)、如和驅(qū)動(dòng)程序206 — 起被提供給用戶的圖形用戶接口 (GUI)提供輸入。與這里描述的實(shí) 施例特別相關(guān)的一個(gè)性能設(shè)置是圖形硬件使用用于執(zhí)行圖形去階梯的 多采樣因子。
0036圖形硬件包括兩個(gè)圖形處理單元,GPU A 208和GPU B 210。在該實(shí)施例中,GPU A 208和GUP B 210是分別包括一個(gè)圖形 處理器和其它相關(guān)聯(lián)硬件的圖形卡,盡管本發(fā)明不僅局限于此。而是, 如在此所使用的,詞語(yǔ)GPU泛指任何裝置、裝置的集合或者被配置為 執(zhí)行圖形處理任務(wù)的裝置的子集(例如在集成電路芯片中的處理內(nèi) 核)c
0037驅(qū)動(dòng)器206發(fā)布命令和數(shù)據(jù)到GPU A 208和GPU B 210。 GPU A 208和GPU B 210從驅(qū)動(dòng)器206通過(guò)各自的環(huán)形緩沖器A 222和B 224接收命令和數(shù)據(jù)。這些命令指示GPU A 208和GPU B 210執(zhí) 行各種對(duì)數(shù)椐的操作,從而最終產(chǎn)生用于輸出到顯示器230的繪制畫 面。如在圖2中所示,GPU A 208和GPUB210均具有到各自的本地 圖形存儲(chǔ)器A 226和B 228的訪問(wèn)入口,用于執(zhí)行這種操作。此外, 驅(qū)動(dòng)程序206、 GPU A 208和GPU B 210均具有到共享存儲(chǔ)器205的 訪問(wèn)入口 。 GUP和共享存儲(chǔ)器205之間的通信在PCI Express( PCIE ) 總線234上被執(zhí)行。此外,GPUA 208和GPUB210彼此間可以使用 點(diǎn)到點(diǎn)協(xié)議在PCIE總線234上直接通信。
0038這里將更加詳細(xì)地進(jìn)行描迷,由GPU A 208和GPU B 210在驅(qū)動(dòng)程序206的指令下執(zhí)行地操作包括基于多采樣圖形去階梯 地操作。根據(jù)這個(gè)操作,GPUA 208和GPUB210中的每個(gè)并行地處 理將要顯示的相同畫面。特別地,GPU A 208和GPUB210中的每個(gè) 通過(guò)不同的多采樣模式的各個(gè)應(yīng)用程序繪制相同畫面的不同版本,其 中由驅(qū)動(dòng)器206選擇不同的多釆樣模式。在該實(shí)施例中,驅(qū)動(dòng)器206 可編程為指導(dǎo)GPU A 208和GPU B 210通過(guò)可選擇的加倍因子執(zhí)行多 采樣。
0039還根據(jù)該基于多采樣的圖形去階梯操作,由GPU B 210 所執(zhí)行的繪制過(guò)程得到的畫面數(shù)據(jù)通過(guò)PCIE總線234被傳送到GPU A 208。作為位于GPU A 208上的互連模塊(IM ) 212的部件的合成 器操作用于經(jīng)由線性混合把從GPU B 210傳送的畫面數(shù)據(jù)與由GUP A 208生成的畫面數(shù)據(jù)相結(jié)合,以獲得將要顯示的最終畫面。在將要 被顯示的畫面中,多采樣因子由GPU的數(shù)目有效地相乘。例如,如果 每個(gè)GPU執(zhí)行2X多采樣,將被顯示的畫面包括4X多釆樣。
0040這里將更加詳細(xì)地進(jìn)行描述,在PCIE總線234上傳送 由繪制過(guò)程產(chǎn)生的畫面數(shù)據(jù)之前,GPU B 210首先在繪制畫面中執(zhí)行 識(shí)別邊緣像素和非邊緣(或者"內(nèi)部")像素的操作。當(dāng)畫面數(shù)據(jù)被 從GPU B 210傳送到GPU A 208時(shí),與邊緣像素相關(guān)聯(lián)的采樣數(shù)據(jù)被 傳送但是與非邊緣像素相關(guān)聯(lián)的采樣數(shù)據(jù)不被傳送。與非邊緣像素相 關(guān)聯(lián)的采樣數(shù)據(jù)可以被排除,因?yàn)檫@里描述的多釆樣操作被用于邊緣增強(qiáng),這樣僅影響邊緣像素的呈現(xiàn)。因此,在由GPUB210所繪制的 畫面中的非邊緣像素將與在由GPU A 208所繪制的畫面中的非邊緣像 素相同。因此,沒(méi)有必要傳送和結(jié)合與這些像素相關(guān)聯(lián)的數(shù)據(jù)。
0041上述把與邊緣像素相關(guān)聯(lián)的釆樣數(shù)據(jù)從GPU B 210傳送 到GPU A 208、但是排除了與非邊緣像素相關(guān)聯(lián)的采樣數(shù)據(jù)的技術(shù)將 在以下更加詳細(xì)地描述。該技術(shù)是有益的,因?yàn)樗刹僮饔糜跍p少將 要在PCIE總線234上傳送的數(shù)據(jù)量,從而增加了傳送操作的速度, 使得該操作不會(huì)變成處理瓶頸。另外,通過(guò)減少將要在PCIE總線234 上傳送的數(shù)據(jù)量,其它共用相同總線的部件可使用更多帶寬。
0042需要注意的是,示例圖形處理系統(tǒng)200已經(jīng)通過(guò)例子的 方式進(jìn)行了描述,并且不試圖限制本發(fā)明?;谶@里提供的指導(dǎo),本 領(lǐng)域的技術(shù)人員應(yīng)理解本發(fā)明可以在任何多GPU彼此通信并且被用 于執(zhí)行圖形去階梯的系統(tǒng)中實(shí)現(xiàn)。該類型的各種系統(tǒng)詳細(xì)地在共有的、 同時(shí)待審的U.S.專利申請(qǐng)No.11/140,156中描述,其標(biāo)題是 "Antialiasing System and Method",發(fā)明人為Preetham等,申請(qǐng)日 為2005年5月27日,這里引入?yún)⒖计淙績(jī)?nèi)容?;谶@里提供的指
里描述的圖形去階梯技術(shù)。
C.根據(jù)本發(fā)明的實(shí)施例的圖形去階梯方法0043圖3是根據(jù) 本發(fā)明的實(shí)施例的在使用多GPU的圖形處理系統(tǒng)中用于執(zhí)行圖形去 階梯的方法300的流程圖。將參考以上參考圖2描述的示例圖形處理 系統(tǒng)200描述方法300,盡管本發(fā)明不僅局限于此。在圖3中,流程 圖的左手邊表示由GPU A 208執(zhí)行的處理步驟,而右手邊表示由GPU B 210執(zhí)行的處理步驟。
0044現(xiàn)在將描述由GPU A 208執(zhí)行的頭四個(gè)處理步驟。在步 驟302中,GPU A 208建立在將要繪制的畫面中對(duì)每個(gè)像素進(jìn)行多采 樣的第一模式,其中該模式由"多采樣模式A"表示。圖4表示可以 用作多采樣模式A的多采樣模式400。多釆樣模式400用于對(duì)由12 x 12個(gè)釆樣位置組成的像素進(jìn)行2X多采樣。在圖4中,像素的中心被表示為固體黑框,而為2X采樣所選擇的采樣位置用斜線填充。本領(lǐng) 域的技術(shù)人員應(yīng)理解可以使用其它多種像素尺寸和采樣位置。
0045在步驟306, GPUA繪制畫面,其中繪制畫面包括把針 對(duì)多采樣圖形去階梯(AA )緩沖器中的每個(gè)像素所選擇的采樣存儲(chǔ)到 本地圖形存儲(chǔ)器A中。如在此所使用的,詞組"存儲(chǔ)采樣"包括存儲(chǔ) 諸如與采樣相關(guān)聯(lián)的顏色數(shù)據(jù)等的數(shù)據(jù)。
0046在步驟310, GPU A 208把存儲(chǔ)在AA緩沖器中的多個(gè) 采樣的每個(gè)集合解析成由"繪圖緩沖器A"表示的位于本地圖形存儲(chǔ) 器A 226內(nèi)的繪圖緩沖器中的單個(gè)采樣。 一種用于把多個(gè)采樣解析成 單個(gè)采樣的方法需要在線性空間中平均多個(gè)采樣,盡管本發(fā)明不僅局 限于此。該操作的更多細(xì)節(jié)在共有的、同時(shí)待審的U.S.專利申請(qǐng) No.11/140,156中提供,標(biāo)題是"Antialiasing Method and System", 發(fā)明人為Preetham,申請(qǐng)日為2005年5月27日,這里引入?yún)⒖计淙?部?jī)?nèi)容。
0047在步驟314, GPUA 208執(zhí)行識(shí)別在繪圖緩沖器A中所 呈現(xiàn)的像素中哪些是邊緣像素的操作。下面將參考圖7-9,10A和10B 詳細(xì)描述用于執(zhí)行這種操作的一種特定方法,盡管本發(fā)明不僅局限于 該特定方法。該操作的輸出是一個(gè)數(shù)據(jù)集合,這里稱為"邊緣數(shù)據(jù)掩 碼",其被存儲(chǔ)在本地圖形存儲(chǔ)器A 226中并且識(shí)別在繪圖緩沖器A 中存儲(chǔ)的畫面中哪些像素是邊緣像素。如在此所使用的,詞組"識(shí)別
邊緣像素"可以包括在一個(gè)像素接一個(gè)像素的基礎(chǔ)上識(shí)別邊緣像素或 者識(shí)別包括至少一個(gè)邊緣像素的像素的矩形方塊或者"矩形塊"。
0048現(xiàn)在將描迷由GPUB210執(zhí)行的頭四個(gè)處理步驟。優(yōu)選 地,這頭四個(gè)步驟基本上與由GPU A 208執(zhí)行的頭四個(gè)處理步驟并行 地被執(zhí)行。盡管本發(fā)明不僅局限于此。
0049由GPU B 210執(zhí)行的頭三個(gè)處理步驟(步驟304、 308 和312 )與由GPU A 208執(zhí)行的頭三個(gè)處理步驟(步驟302、 306和 310)基本上相同,除了使用由"采樣模式B"表示的不同的多采樣模 式來(lái)繪制畫面,對(duì)每個(gè)像素所選擇的采樣被存儲(chǔ)在位于本地圖形存儲(chǔ)
16器B 228內(nèi)的AA緩沖器中,并且畫面被解析到由"繪圖緩沖器B" 表示的繪圖緩沖器其位于本地圖形存儲(chǔ)器B 228內(nèi)。圖5表示可以被 用作多采樣模式B的示例多采樣模式500。多采樣才莫式500用于對(duì)由 12xl2個(gè)采樣位置組成的像素進(jìn)行2X多采樣。在圖5中,像素的中 心被表示為實(shí)心的黑框,而為2X多采樣所選擇的采樣位置用棋盤形 圖案填充。
0050在步驟316, GPUB210執(zhí)行識(shí)別在繪圖緩沖器B中呈 現(xiàn)的哪些像素是邊緣像素的操作。下面將參考圖7-9, IOA和IOB詳 細(xì)描述用于執(zhí)行這種操作的一種特別方法,盡管本發(fā)明不僅局限于該 特別方法。該操作的輸出是存儲(chǔ)在本地圖形存儲(chǔ)器B 228中的邊緣數(shù) 據(jù)掩碼并且識(shí)別存儲(chǔ)在繪圖緩沖器B中的畫面中哪些像素是邊緣像 素。
0051在此處,GPUA 208已經(jīng)生成識(shí)別存儲(chǔ)在繪圖緩沖器A 中的畫面中哪些像素是邊緣像素的邊緣像素掩碼,并且GPUB210已 經(jīng)生成識(shí)別存儲(chǔ)在繪圖緩沖器B中的畫面中哪些像素是邊緣像素的邊 緣像素掩碼。在步驟318, GPU A 208把它的邊緣像素掩碼傳送到GPU B210,以及在步驟320,來(lái)自GPU A 208的邊緣像素掩碼與來(lái)自GPU B210的邊緣掩碼在本地存儲(chǔ)器中結(jié)合,以生成結(jié)合的邊緣像素掩碼。 該結(jié)合的邊緣像素掩碼是單個(gè)邊緣像素掩碼的合并(與相交相反), 因?yàn)樗岩粋€(gè)像素識(shí)別為邊緣像素,如果該像素已經(jīng)由GPU A 208或 者GPUB210識(shí)別為邊緣像素。在優(yōu)選實(shí)施例中,這種結(jié)合通過(guò)把從 GPU A 208傳送的邊緣像素掩碼直接疊加到由GPU B 210存儲(chǔ)在本地 存儲(chǔ)器中的邊緣像素上來(lái)實(shí)現(xiàn),使得步驟318和320實(shí)際上結(jié)合成一 個(gè)步驟。
0052在步驟322, GPU A 208在位于本地圖形存儲(chǔ)器A 226 內(nèi)的臨時(shí)緩沖器(由"臨時(shí)緩沖器A"表示)中存儲(chǔ)繪圖緩沖器A的 內(nèi)容的拷貝。在步驟324, GPUB210僅經(jīng)由PCIE總線234傳送在繪 圖緩沖器B中由結(jié)合的邊緣像素掩碼識(shí)別為邊緣像素的那些像素的拷 貝以疊加到存儲(chǔ)在臨時(shí)緩沖器A中的數(shù)據(jù)上。實(shí)際上,GPU B 210從對(duì)應(yīng)于由結(jié)合的邊緣像素掩碼所指定的非邊緣像素的該傳送數(shù)據(jù)排除
或者"屏蔽"。該處理步驟的最終結(jié)果是臨時(shí)緩沖器A保持由GPUB 210繪制的畫面的完整表示。這是因?yàn)橛蒅PU A 208繪制的非邊緣像 素,其拷貝位于臨時(shí)緩沖器A并且在步驟318期間不被重疊,這些非 邊緣像素與由GPUB210繪制的非邊緣像素相同,因?yàn)槎嗖蓸?解析操 作僅改變邊緣像素的顏色。
0053現(xiàn)在將描述由GPUA210執(zhí)行的最后兩個(gè)步驟。在步驟 326,位于與GPU A 208相同的圖形卡上的IM 212的合成器部分執(zhí)行 在繪圖緩沖器A中呈現(xiàn)的每個(gè)像素與在臨時(shí)緩沖器A中呈現(xiàn)的對(duì)應(yīng)像 素的線性混合以生成將被顯示的畫面。在步驟328,將被顯示的畫面 被輸出到顯示裝置230。畫面有效地把由每個(gè)GPU應(yīng)用的多釆樣的數(shù) 目加倍。這在圖6中被示出,其示出了從把使用2X多采樣模式400 的像素與使用2X多采樣模式500的結(jié)合得到的4X多采樣模式600。
0054因?yàn)榉椒?00不把與非邊緣像素相關(guān)聯(lián)的采樣數(shù)據(jù)從 GPU B 210傳送到GPU A 208,它有益地減少了在PCIE總線234上 傳送的數(shù)據(jù)量。因此,傳送操作的速度被加快了,使得操作不會(huì)變成 處理的瓶頸。此外,該方法使其它共用相同總線的部件可使用更多帶 寬。
D.根據(jù)本發(fā)明的實(shí)施例識(shí)別邊緣像素的方法
0055如上述參考圖3的流程圖所討論的,在步驟314, GPU A 208執(zhí)行識(shí)別存儲(chǔ)在繪圖緩沖器A中的畫面中的邊緣像素的操作,以 及在步驟316, GPU B 210執(zhí)行識(shí)別存儲(chǔ)在繪圖緩沖器B中的畫面中 的邊緣像素的操作。在一個(gè)實(shí)施例中,GPU A 208和GPU B 210均使 用圖形處理器內(nèi)部的存儲(chǔ)器、這里被稱為矩形塊格式表(TFT)執(zhí)行 該操作,其跟蹤在與將被顯示的畫面中的每個(gè)像素相關(guān)聯(lián)的釆樣顏色 數(shù)據(jù)是被完全壓縮、部分壓縮還是未壓縮。該壓縮方案的完整描述和 TFT的使用在共有的、同時(shí)待審的U.S.專利申請(qǐng)No.10/672,707中闡 述,標(biāo)題是"Method and Apparatus for Compression of Multi-Sample Anti-Aliasing Color Data",申請(qǐng)日為2003年9月26日,這里引入?yún)⒖计淙績(jī)?nèi)容。
1.根據(jù)本發(fā)明的實(shí)施例的采樣顏色數(shù)據(jù)壓縮
0056圖7示出了根據(jù)U.S,專利申請(qǐng)No.10/672,707的指導(dǎo)的 示例性處理器和存儲(chǔ)器配置700。在本發(fā)明的一個(gè)實(shí)施例中,該配置 未由多GPU系統(tǒng)中的至少一個(gè)GPU使用并且^皮補(bǔ)充以通過(guò)將在下面 更加詳細(xì)描述的方式把邊緣像素從非邊緣像素區(qū)分出來(lái)。
0057如在圖7中所示,圖形處理器703可通信地被連接到高 速緩沖存儲(chǔ)器702,其接著可通信地被連接到主存儲(chǔ)器701。在繪制用 于顯示的畫面的過(guò)程期間,像素?cái)?shù)據(jù)被從主存儲(chǔ)器701傳送到高速緩 沖存儲(chǔ)器702供圖形處理器703使用。如U.S.專利申請(qǐng)No.腸72,707 中所闡述的,像素?cái)?shù)據(jù)被作為多個(gè)相鄰像素的矩形方塊或者"矩形塊" 傳送。在圖7中所示的例子中,像素以相鄰像素的2x2矩形塊傳送, 其中像素由A、 B、 C和D表示。然而,對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō), 明顯可以使用其它尺寸的矩形塊。
0058在矩形塊中的每個(gè)像素都已經(jīng)被多釆樣了,這樣與每個(gè) 像素相關(guān)聯(lián)的數(shù)據(jù)包括對(duì)應(yīng)于在像素中的每個(gè)釆樣的顏色值。在U.S. 專利申請(qǐng)No.10/672,707中闡述的一個(gè)例子中,每個(gè)像素包括四個(gè)采 樣,并且每個(gè)采樣與一個(gè)顏色值相關(guān)聯(lián)。顏色值的長(zhǎng)度可以是一個(gè)字。
0059在從主存儲(chǔ)器701到高度緩沖存儲(chǔ)器702的傳送期間, 每個(gè)矩形塊被分析,并且基于分析的結(jié)果,在矩形塊中與每個(gè)像素相 關(guān)聯(lián)的顏色值可以被壓縮。根據(jù)申請(qǐng)No.10/672,707中所描述的實(shí)施 例,所分析的矩形塊可以以三種方式之一處理它可以是"完全壓縮"、 "部分壓縮,,或者它可以保持未壓縮。
0060如果在每個(gè)多采樣的像素中的所有采樣顏色相同,選擇 完全壓縮。例如,這可能是當(dāng)矩形塊被單個(gè)三角形完全覆蓋時(shí)發(fā)生。 當(dāng)矩形塊被完全壓縮時(shí),為矩形塊中的每個(gè)像素僅存儲(chǔ)一個(gè)顏色值。
0061如果在每個(gè)多采樣的像素中的所有采樣是僅有的兩種顏 色之一,選擇部分壓縮。例如,這可能是當(dāng)矩形塊由不多于兩個(gè)三角 形覆蓋時(shí)發(fā)生。當(dāng)矩形塊被部分壓縮時(shí),由矩形塊中的每個(gè)像素存儲(chǔ)
19兩個(gè)顏色值,并且使用指針對(duì)壓縮進(jìn)行編碼。圖8示出了 4x多采樣 像素A、 B、 C和D的部分壓縮2x2的矩形塊的示例指針的比特位。 在指針中的每個(gè)比特或者是"0",其意味對(duì)于那個(gè)像素使用第一顏色 (稱為"原始顏色"),或者是"1",其意味對(duì)于那個(gè)像素使用第二 顏色(稱為"替代顏色")。例如在像素A中,對(duì)于像素A所有四個(gè) 采樣都是原始顏色。因此所有四個(gè)比特位被編碼為"0"。在像素C 中,對(duì)于像素C頭三個(gè)采樣都是原始顏色。這樣頭三個(gè)比特位被編碼 為"0"。最后一位被編碼為'T,,以表示像素C的第四個(gè)采樣使用 替代顏色。同樣的邏輯對(duì)于像素B和C適用。使用該指針,每個(gè)像素 僅需存儲(chǔ)兩個(gè)顏色值,其中一個(gè)顏色值針對(duì)原始顏色和另一個(gè)針對(duì)替 代顏色。
0062如果在多釆樣的像素的任何一個(gè)中的子像素可以多于兩
種顏色,顏色數(shù)據(jù)保持未壓縮。例如,如果矩形塊由超過(guò)兩種顏色覆
蓋這可能會(huì)發(fā)生。在該例子中,為矩形塊中的每個(gè)像素中的每個(gè)采樣 存儲(chǔ)單個(gè)顏色值。
0063根據(jù)申請(qǐng)No.10/672,707的指導(dǎo),圖形處理器"703包括 稱作矩形塊格式表(TFT) 704的片上存儲(chǔ)器,以跟蹤存儲(chǔ)在高速緩 沖存儲(chǔ)器702中的矩形塊數(shù)據(jù)的格式。存儲(chǔ)在高速緩沖存儲(chǔ)器702中 的矩形塊當(dāng)需要處理時(shí)被傳送到圖形處理器703。在圖形處理器703 中矩形塊不需要解壓縮,因?yàn)閳D形處理器703使用TFT7(M跟蹤到來(lái) 的矩形塊的格式。圖形處理器703可以對(duì)矩形塊以它的壓縮格式操作, 從而加速整個(gè)操作。
0064在一個(gè)實(shí)施例中,對(duì)于給定畫面中的每個(gè)矩形塊存在 TFT 704中的條目。每個(gè)條目具有兩位比特壓縮編碼,以表明特定矩 形塊的格式。在一個(gè)實(shí)施例中,兩位比特對(duì)以下四個(gè)狀態(tài)進(jìn)行編碼
1. 清零
2. 完全壓縮
3. 部分壓縮
4. 未壓縮。0065在TFT中的兩位比特壓縮編碼提醒處理器來(lái)自高速緩 沖存儲(chǔ)器的矩形塊數(shù)據(jù)的格式。第一狀態(tài)表明其中高速緩沖存儲(chǔ)器被 置于對(duì)應(yīng)于缺省空數(shù)據(jù)狀態(tài)的"清零值"的狀態(tài)。TFT條目的第二、 第三和第四狀態(tài)描迷矩形塊的前述三種壓縮級(jí)別完全壓縮、部分壓 縮和未壓縮。通過(guò)兩比特編碼,圖形處理器703可以適當(dāng)?shù)靥幚韽母?速緩沖存儲(chǔ)器702接收到的數(shù)據(jù)。
0066如上所述,在圖2中所示的實(shí)施例種的GPU A 208和 GPU B 210執(zhí)行解析操作以把多個(gè)采樣結(jié)合在一起以得到代表給定像 素的單個(gè)采樣(例如參見(jiàn)圖3中的步驟310和312和相關(guān)的文本)。 換句話說(shuō),在解析操作期間,數(shù)據(jù)從本地存儲(chǔ)器被拉出,然后把每個(gè) 像素僅剩余的像素?cái)?shù)據(jù)寫回本地存儲(chǔ)器(即沒(méi)有子像素或者采樣數(shù)據(jù) 剩余)
0067使用上迷的壓縮方案,解析操作更加有效地被執(zhí)行。其 中解析操作被執(zhí)行的方式取決于矩形塊的壓縮級(jí)別。第一,如果矩形
塊被完全壓縮,即每個(gè)像素僅有一種顏色,不需要作什么,并且在矩 形塊中的每個(gè)像素被簡(jiǎn)單地寫回到存儲(chǔ)器中。第二,如果矩形塊被部 分地壓縮或者未壓縮,即在每個(gè)像素中存在不同的顏色釆樣,那么采 樣被結(jié)合以解析成最終像素顏色。在一個(gè)實(shí)施例中,具有相同顏色的 采樣對(duì)被處理一次。例如,對(duì)于由圖8的指針?biāo)硎镜木匦螇K,像素 C具有一種顏色的三個(gè)釆樣和另一種顏色的另一個(gè)采樣。解析操作將 把與頭三個(gè)采樣相關(guān)聯(lián)的單個(gè)顏色值乘以三,并且把它與剩余采樣的 顏色值結(jié)合一次。然后,把所結(jié)合的值除以四,以荻得最終像素顏色 值。這節(jié)省了不得不讀取相同的顏色值多次的過(guò)程。對(duì)于未壓縮的矩 形塊,與每個(gè)采樣相關(guān)聯(lián)的顏色值被加在一起并且結(jié)果以常規(guī)的方式
被釆樣的數(shù)目除。
2.根據(jù)本發(fā)明的實(shí)施例的矩形塊格式表(TFT)的使用和區(qū)分邊緣和 非邊緣像素的解析操作
0068在本發(fā)明的一個(gè)實(shí)施例中,在多GPU系統(tǒng)中的至少一 個(gè)GPU補(bǔ)充TFT和解析在上述部分中討論的用于區(qū)分在將被顯示的畫面中的邊緣和非邊緣像素的解析操作。該區(qū)分允許GPU的避免當(dāng)執(zhí) 行如這里其它部分所描述的基于多GPU圖形去階梯操作時(shí)把與非邊 緣像素相關(guān)聯(lián)的數(shù)據(jù)發(fā)送到另一個(gè)GPU。
0069TFT 704包括關(guān)于將在將被顯示的畫面中的矩形塊是完 全壓縮、部分壓縮或者未壓縮的信息。當(dāng)矩形塊被完全壓縮時(shí),保證 在那個(gè)矩形塊中的所有像素是內(nèi)部的或者非邊緣像素。相反,當(dāng)矩形 塊僅是部分壓縮或者未壓縮時(shí),這意味在那個(gè)矩形塊中的至少一些像 素是邊緣像素。因此,存儲(chǔ)在TFT中的信息可以輔助確定矩形塊是否 僅包含非邊緣像素或者包含一個(gè)或多個(gè)邊緣像素。然而,因?yàn)門FT 704 作為圖形處理器703的片上存儲(chǔ)器被實(shí)現(xiàn),不容易直接讀取。
0070圖9示出了用于使用前述的解析命令從TFT 704獲取用 于確定矩形塊是否僅包含非邊緣像素或者包含至少一個(gè)邊緣像素的信 息的方法的流程圖900。流程圖900的方法可以由圖2的GPU A 208 使用,以執(zhí)行流程圖300的步驟314,和/或由圖2的GPU A210使用, 以執(zhí)行流程圖300的步驟316。
0071在步驟902,"邊緣檢測(cè)"圖形去階梯(AA)緩沖器被 置入到本地圖形存儲(chǔ)器中。邊緣檢測(cè)AA緩沖器不被置入表示要顯示 的實(shí)際畫面的數(shù)據(jù)(其被存儲(chǔ)在繪圖緩沖器A或者繪圖緩沖器B中)。
而是,邊緣檢測(cè)AA緩沖器被置入預(yù)定的多采樣的像素?cái)?shù)據(jù),其當(dāng)根 據(jù)存儲(chǔ)在TFT 704中數(shù)椐解析時(shí),如果在TFT 704中的矩形塊條目表 明矩形塊被完全壓縮,則將導(dǎo)致某種特定的顏色值,以及如果在TFT 704中的矩形塊條目表明矩形塊被部分壓縮,則或者未壓縮將導(dǎo)致不 同的顏色值。因?yàn)檫吘墮z測(cè)AA緩沖器不包含代表要顯示的實(shí)際畫面 的數(shù)椐,它還可以被認(rèn)為是"偽(dummy)"緩沖器。
0072根據(jù)本發(fā)明的一個(gè)實(shí)施例,2-采樣邊緣檢測(cè)AA緩沖 器被用作與將被顯示的畫面具有相同的尺寸和深度。對(duì)于在2-采樣
邊緣檢測(cè)AA緩沖器中的每個(gè)像素,"0"被存儲(chǔ)在第一采樣位置"1" 被存儲(chǔ)在第二采樣位置。2 -釆樣邊緣檢測(cè)AA緩沖器可以被使用,不 管其中將被顯示的畫面被存儲(chǔ)的繪圖緩沖器B的采樣深度。盡管這里20078
2 -采樣邊緣檢測(cè)AA緩沖器已經(jīng)通過(guò)例子被描述了 ,這種描述不試圖 局限本發(fā)明,并且本領(lǐng)域的技術(shù)人員應(yīng)理解也可以使用具有不同采樣 深度的邊緣緩沖器(例如4-采樣邊緣檢測(cè)緩沖器)。
0073在步驟904, GPUB210使用存儲(chǔ)在TFT 704中的數(shù)據(jù) 把邊緣檢測(cè)AA緩沖器解析到位于本地圖形存儲(chǔ)器中的臨時(shí)緩沖器。 為了更好地解釋該步驟,圖IOA示出了在上述的2-釆樣邊緣檢測(cè)AA 緩沖器中的像素1002的2 x 2矩形塊的解析操作的應(yīng)用,其中在TFT 704中的條目表明在將被顯示的畫面中的相應(yīng)矩形塊被完全壓縮。如 在圖10A中所示,其中兩個(gè)采樣位置中的第一個(gè)具有分配的顏色值 "0",兩個(gè)采樣位置中的第二個(gè)具有分配的顏色值"1"。在解析操 作的應(yīng)用之后,每對(duì)采樣被解析成在臨時(shí)緩沖器內(nèi)的所解析的2x2矩 形塊1004中的對(duì)應(yīng)的代表性采樣。因?yàn)門FT 704表明將被顯示的畫 面中的對(duì)應(yīng)的矩形塊被壓縮,圖形處理器703通過(guò)假設(shè)與第一采樣位 置相關(guān)聯(lián)的顏色值也是第二釆樣位置的顏色值而應(yīng)用解析命令,這樣 每個(gè)像素的所解析的采樣顏色是零。
0074相反,圖10B示出了在上述的2-采樣邊緣檢測(cè)AA緩 沖器中的像素1006的2 x 2矩形塊的解析操作的應(yīng)用,其中在TFT 704
者未壓縮。就像圖10A的矩形塊1002,在矩形塊1006中的每個(gè)像素 A、 B、 C和D具有2個(gè)采樣位置,其中兩個(gè)采樣位置中的第一個(gè)具有 分配的顏色值"O",兩個(gè)采樣位置中的第二個(gè)具有分配的顏色值"1"。 在解析操作應(yīng)用之后,每對(duì)采樣被解析成在臨時(shí)緩沖器內(nèi)的所解析的 2x2矩形塊1008中的對(duì)應(yīng)的代表性采樣。因?yàn)門FT 704表明在將被 顯示的畫面中對(duì)應(yīng)的矩形塊被部分壓縮或者未壓縮,由圖形處理器702 對(duì)解析命令的應(yīng)用包括把與第二采樣位置相關(guān)聯(lián)的顏色值與第一釆樣
位置的顏色值平均。結(jié)果,在所解析的矩形塊1008中的每個(gè)像素的至 少一個(gè)所得到的顏色將為非零。圖IOB表示其中在將被顯示的畫面中 的對(duì)應(yīng)的矩形塊中的每個(gè)像素是邊緣像素。結(jié)果,在所解析的矩形塊 1008中的每個(gè)像素的每個(gè)顏色值是非零。
20075在步驟906,存儲(chǔ)在臨時(shí)緩沖器中的數(shù)據(jù)被用作邊緣像 素掩碼。如上參考圖3所述,GPU A 208和GPU B 210中的每個(gè)生成 一個(gè)這樣的邊緣像素掩碼。通過(guò)把由GPU A 208所生成的邊緣像素掩 碼疊加到由GPU B 210生成的邊緣像素掩碼上從而將前一個(gè)邊緣像素 掩碼與后一個(gè)邊緣像素掩碼結(jié)合起來(lái)。然后所結(jié)合的邊緣像素掩碼被 用于把矩形塊從存儲(chǔ)在繪圖緩沖器B中的畫面復(fù)制到位于本地圖形存 儲(chǔ)A 226中的臨時(shí)緩沖器A。如果在所結(jié)合的邊緣像素掩碼中的矩形 塊具有全零的顏色值,鄱么在繪圖緩沖器B中對(duì)應(yīng)的矩形塊從從繪圖 緩沖器B到臨時(shí)緩沖器A的復(fù)制中被"屏蔽"或者被排除。相反,如 果在所結(jié)合的邊緣像素掩碼中的矩形塊具有至少一個(gè)非零顏色值,那 么在繪圖緩沖器B中的對(duì)應(yīng)的矩形塊被從繪圖緩沖器B "傳遞"或復(fù) 制到臨時(shí)緩沖器A。這一步驟的最終結(jié)果是只有在包含一個(gè)或多個(gè)邊 緣像素的繪圖緩沖器B中的矩形塊或者對(duì)應(yīng)于包含一個(gè)或多個(gè)邊緣像 素的繪圖緩沖器A的矩形塊的矩形塊被從繪圖緩沖器B復(fù)制到臨時(shí)緩 沖器A上。需要注意的是,在其中TFT 704不包含在將被顯示的畫面 中的每個(gè)矩形塊的條目的實(shí)施例中,沒(méi)有條目的矩形塊應(yīng)該被當(dāng)作它 們包括邊緣像素來(lái)對(duì)待,并且應(yīng)該整體地從繪圖緩沖器B被傳送到臨 時(shí)緩沖器A上。
0076如上所述,本發(fā)明的實(shí)施例分配具有繪制目標(biāo)的尺寸和 深度的2-采樣邊緣檢測(cè)AA緩沖器。然而,這種實(shí)施例可能消耗大 量的存儲(chǔ)資源。據(jù)此,替代實(shí)施例使用具有小于繪制目標(biāo)的尺寸的2 -釆樣邊緣檢測(cè)AA緩沖器。例如,2 -采樣邊緣檢測(cè)AA緩沖器可能 只有128xl28像素。根據(jù)這種實(shí)施例,步驟卯4被重復(fù)多次,有效地 滑動(dòng)解析"窗口"以生成臨時(shí)緩沖器的每個(gè)128 x 128部分。另一個(gè)替 代實(shí)施例使用小的2-采樣邊緣檢測(cè)AA緩沖器并且使用存儲(chǔ)器映射 硬件把該緩沖器映射到較大的解析緩沖器上(即臨時(shí)緩沖器)。
0077在本發(fā)明的一個(gè)特別的實(shí)施例中,為了減少在圖3的流 程圖的步驟318中種GPU A 208和GPU B 210之間發(fā)送的數(shù)據(jù)量,由 GPU A 208和GPU B 210所生成的邊緣像素掩碼被置于高壓縮數(shù)據(jù)格式中。例如,假設(shè)為GPU A 208存儲(chǔ)邊緣像素掩碼的臨時(shí)緩沖器是32 比特每像素(bpp)。根據(jù)使用2x2矩形塊的示例性實(shí)施例,以及其 中圖形硬件不能夠簡(jiǎn)單地辨別在每個(gè)2x2矩形塊中的哪些像素是邊 緣像素,這種緩沖器被下采樣,使得每個(gè)2 x 2矩形塊由單個(gè)像素代表。 然后黑色的像素將對(duì)應(yīng)于不包含邊緣像素的2x2矩形塊。當(dāng)下釆樣 時(shí),還進(jìn)行從32bpp到8bpp的格式轉(zhuǎn)換,以在后續(xù)保留帶寬。然后 第二下采樣被執(zhí)行,使得現(xiàn)在單個(gè)像素對(duì)應(yīng)于在原始像素掩碼中的4 x4矩形塊。在一個(gè)實(shí)施例中,希望其中壓縮在4x4矩形塊上進(jìn)行并 且在單個(gè)矩形塊中的像素以一種與原始AA緩沖器中相似的方式被編 碼。然后這種雙下采樣和所轉(zhuǎn)換的緩沖器被用作在步驟318中從GPU A 208傳送到GPUB210的邊緣像素掩碼。當(dāng)然,只傳送非零的像素, 因?yàn)檫@種非零像素代表具有邊緣的4x4矩形塊。這種傳送的目標(biāo)是包 括GPU B 210自己的雙下采樣和所轉(zhuǎn)換的邊緣像素掩碼的臨時(shí)緩沖 器,使得GPU A 208的邊緣被加到GPU B 210的邊緣。這種重疊導(dǎo)致 在圖3的流程圖300的步驟324中被用于從GPU A 208到GPU B 210 傳送顏色數(shù)據(jù)的結(jié)合的邊緣像素掩碼。
0078需要注意的是,把邊緣像素從非邊緣像素中區(qū)別開(kāi)來(lái)的 上述方法的有效性不局限于在多GPU系統(tǒng)中執(zhí)行基于多抽樣的圖形 去階梯。例如,該方法可以被有益地用在任何試圖在所繪制的圖像中 有效地辨別和增強(qiáng)邊緣的圖形處理系統(tǒng)中。此外,該方法可以被用于 收集關(guān)于在給定畫面中邊緣的數(shù)量的統(tǒng)計(jì)。這些例子不試圖限制,對(duì) 于本領(lǐng)域的技術(shù)人員來(lái)說(shuō)前述方法的其它應(yīng)用應(yīng)該是明顯的。 E.示例計(jì)算機(jī)系統(tǒng)實(shí)施例
0079圖11描述了可以被利用以實(shí)現(xiàn)本發(fā)明的示例計(jì)算機(jī)系 統(tǒng)1100。示例計(jì)算機(jī)系統(tǒng)1100可以包括例如基于標(biāo)準(zhǔn)個(gè)人計(jì)算機(jī) (PC)的系統(tǒng)或者如筆記本或者手提計(jì)算機(jī)裝置的移動(dòng)裝置。然而, 僅通過(guò)例子但不局限于此,提供計(jì)算機(jī)系統(tǒng)1100的以下描述。
0080如在圖11中所示,示例計(jì)算機(jī)系統(tǒng)IIOO包括用于執(zhí)行
軟件例程的處理器no4。盡管為了清楚起見(jiàn)示出單個(gè)處理器,但計(jì)算機(jī)系統(tǒng)1100也可以包括多處理器系統(tǒng)。處理器1104被連接到通信基 礎(chǔ)設(shè)施1106,用于與計(jì)算機(jī)系統(tǒng)1100的其它部件通信。通信基礎(chǔ)設(shè) 施1106可以例如包括通信總線、交叉開(kāi)關(guān)(crossbar)或者網(wǎng)絡(luò)。
0081計(jì)算機(jī)系統(tǒng)IOO還包括主存儲(chǔ)器1108,如隨機(jī)訪問(wèn)存儲(chǔ) 器(RAM)和輔助存儲(chǔ)器1110。輔助存儲(chǔ)器1110例如可以包括硬盤 驅(qū)動(dòng)器1112和/或可移動(dòng)存儲(chǔ)器驅(qū)動(dòng)器1114,其可以包括軟盤驅(qū)動(dòng)器、 磁帶驅(qū)動(dòng)器、光盤驅(qū)動(dòng)器或類似設(shè)備??梢苿?dòng)存儲(chǔ)器驅(qū)動(dòng)器1114以一 種公知的方式從可移動(dòng)存儲(chǔ)單元1118讀取和/或?qū)懭肫渲?。可移?dòng)存 儲(chǔ)單元1118可以包括軟盤、磁帶、光盤或者類似的被從可移動(dòng)存儲(chǔ)器 驅(qū)動(dòng)器1114讀取或者寫入其中的介質(zhì)。本領(lǐng)域的技術(shù)人員應(yīng)該理解可 移動(dòng)存儲(chǔ)單元1118包括計(jì)算機(jī)可用存儲(chǔ)介質(zhì),其中存儲(chǔ)計(jì)算機(jī)軟件和 /或數(shù)據(jù)。
0082在替代實(shí)施例中,輔助存儲(chǔ)器1110可以包括其它類似 的用于允許計(jì)算機(jī)程序或者其它指令被栽入計(jì)算機(jī)系統(tǒng)1100的裝置。 這種裝置例如可以包括可移動(dòng)存儲(chǔ)單元1122和接口 1120。可移動(dòng)存 儲(chǔ)單元1122和接口 1120的例子包括程序盒和盒式接口 (如在視頻游 戲控制臺(tái)裝置中所使用的),可移動(dòng)存儲(chǔ)芯片(如EPROM或者 PROM),以及相關(guān)聯(lián)的插槽和其它可移動(dòng)存儲(chǔ)單元1122和允許軟件 和數(shù)據(jù)從可移動(dòng)存儲(chǔ)單元1122被傳送到計(jì)算機(jī)系統(tǒng)1100的接口 1120。
0083計(jì)算機(jī)系統(tǒng)1100還包括至少一個(gè)通信接口 ll24。通信 接口 1124允許軟件和數(shù)據(jù)在計(jì)算機(jī)系統(tǒng)1100和外部裝置之間經(jīng)由通 信路徑1126傳送。特別地,通信接口 1124允許數(shù)據(jù)在計(jì)算機(jī)系統(tǒng)1100 和如公共數(shù)據(jù)或私有數(shù)據(jù)通信網(wǎng)絡(luò)的數(shù)椐通信網(wǎng)絡(luò)之間被傳送。通信 接口 1124的例子可以包括調(diào)制解調(diào)器、網(wǎng)絡(luò)接口 (如以太網(wǎng)卡)、通 信端口等。經(jīng)由通信接口 1124傳送的軟件和數(shù)據(jù)以可以是電子的、電 磁的、光的或能夠由通信接口 1124接收的其它信號(hào)的信號(hào)形式。這些 信號(hào)經(jīng)由通信路徑1126被提供給通信接口 。
0084如在圖U中所示,計(jì)算機(jī)系統(tǒng)1100包括音頻接口 1132, 用于執(zhí)行用于經(jīng)由相關(guān)聯(lián)的揚(yáng)聲器1134播放音頻內(nèi)容的操作。0085計(jì)算機(jī)系統(tǒng)1100還包括圖形處理系統(tǒng)1102,其執(zhí)行用 于把圖像繪制到相關(guān)聯(lián)的顯示器1130上的操作。圖形處理系統(tǒng)1102 可以包括上述參考圖2描述的圖形硬件單元,如第一GPU A 208和第 二GPUB210,盡管本發(fā)明不僅局限于此。在一個(gè)實(shí)施例中,圖形處 理系統(tǒng)1102被配置為執(zhí)行本發(fā)明的特征,如圖3的流程圖300的步驟 和/或圖9的流程圖900的步驟。圖形處理系統(tǒng)1102可以在由處理器 1104執(zhí)行的計(jì)算機(jī)程序的指導(dǎo)下和/或在由圖形處理系統(tǒng)1102中的一 個(gè)或者多個(gè)圖形處理器執(zhí)行的計(jì)算機(jī)程序的指導(dǎo)下執(zhí)行這些步驟。
0086如在此使用的,術(shù)語(yǔ)"計(jì)算機(jī)程序產(chǎn)品"可以部分指可 移動(dòng)存儲(chǔ)單元1118、可移動(dòng)存儲(chǔ)單元1122、在硬盤驅(qū)動(dòng)器1112中安 裝的硬盤或者在通信路徑1126 (無(wú)線鏈接或者電纜)上有把軟件加載 到通信接口 1124的栽波。計(jì)算機(jī)可用介質(zhì)可以包括磁介質(zhì)、光介質(zhì)或 者其它可讀介質(zhì)或發(fā)送載波或者其它信號(hào)的介質(zhì)。這些計(jì)算機(jī)產(chǎn)品是 用于給計(jì)算機(jī)1100提供軟件的裝置。
0087計(jì)算機(jī)程序(也被稱作計(jì)算機(jī)控制邏輯)可以被存儲(chǔ)在 主存儲(chǔ)器1108、輔助存儲(chǔ)器1110或者在圖形處理系統(tǒng)1102內(nèi)的存儲(chǔ) 器中。計(jì)算機(jī)程序還可以經(jīng)由通信接口 11M被接收。當(dāng)執(zhí)行這種計(jì)算 機(jī)程序時(shí)能夠使計(jì)算機(jī)系統(tǒng)1100、特別是圖形處理系統(tǒng)1102執(zhí)行這 里討論的本發(fā)明的一個(gè)或多個(gè)特征。特別地,當(dāng)執(zhí)行計(jì)算機(jī)程序時(shí)能 夠使計(jì)算機(jī)系統(tǒng)1100、特別是圖形處理系統(tǒng)1102執(zhí)行本發(fā)明的特征。 因此,這種計(jì)算機(jī)程序代表計(jì)算機(jī)系統(tǒng)1100的控制器。
0088用于實(shí)現(xiàn)本發(fā)明的軟件可以使用可移動(dòng)存儲(chǔ)驅(qū)動(dòng)器 1114、硬盤驅(qū)動(dòng)器1112或者接口 1120被存儲(chǔ)在計(jì)算機(jī)產(chǎn)品中并且被 載入到計(jì)算機(jī)系統(tǒng)IIOO中。作為替代,計(jì)算機(jī)程序產(chǎn)品可以在通信路 徑1126上被下載到計(jì)算機(jī)系統(tǒng)1100。當(dāng)由處理器1104和/或在圖形處 理系統(tǒng)1102中的部件執(zhí)行軟件時(shí),使得那些部件執(zhí)行在此描述的本發(fā) 明的功能。 F.結(jié)論
0089已經(jīng)描述了本發(fā)明的各種實(shí)施例,應(yīng)該理解它們僅通過(guò)
27例子的方式被呈現(xiàn),而不局限于此。相關(guān)領(lǐng)域的技術(shù)人員應(yīng)該理解這 里可以進(jìn)行各種形式和細(xì)節(jié)的改變而不偏離如在附加的權(quán)利要求中所 限定的本發(fā)明的實(shí)質(zhì)或者范圍。因此,本發(fā)明的外延和范圍應(yīng)該不由 任何上述的示例性實(shí)施例限制,但是僅應(yīng)該根據(jù)以下的權(quán)利要求和它 們的等價(jià)被定義。
權(quán)利要求
1. 一種用于在系統(tǒng)中執(zhí)行基于多采樣圖形去階梯的方法,所述系統(tǒng)包括第一圖形處理單元(GPU)和第二GPU,包括在所述第一GPU中使用第一多采樣模式繪制畫面的第一版本;在所述第二GPU中使用第二多采樣模式繪制所述畫面的第二版本;識(shí)別所述畫面的所述第二版本中的邊緣像素;和把在所述畫面的所述第一版本中的像素與那些僅在所述畫面的所述第二版本中已經(jīng)被識(shí)別為邊緣像素的像素結(jié)合起來(lái),以生成結(jié)合的畫面。
2. 如權(quán)利要求1中所述的方法,其中在所述第一 GPU中使用 所述第一多釆樣模式繪制所述畫面的所述第一版本的包括根據(jù)所述第 一多采樣模式采樣所述畫面的每個(gè)像素,以獲得每個(gè) 像素的多個(gè)第一釆樣;和為每個(gè)像素解析所述多個(gè)第 一采樣,以生成所述畫面的所述笫一 版本的像素。
3. 如權(quán)利要求2中所述的方法,其中在所述第二 GPU中使用 所述第二多采樣模式繪制所述畫面的所述第二版本包括根據(jù)所述第二多采樣模式釆樣所述畫面中的每個(gè)像素,以獲得每個(gè)像素的多個(gè)第二采樣;和為每個(gè)像素解析所述多個(gè)第二采樣,以生成所述畫面的所述第二 版本的像素。
4. 如上述權(quán)利要求中任一項(xiàng)中所述的方法,其中識(shí)別所述畫面 的所述第二版本中的邊緣像素包括訪問(wèn)表明在所述畫面的所述第二版本中的 一 個(gè)像素是否被壓縮的 數(shù)據(jù);和如果所訪問(wèn)的數(shù)椐表明在所述畫面該第二版本中的所述像素沒(méi)有 被壓縮,則把在所述畫面的所述第二版本中的該像素識(shí)別為邊緣像素。
5. 如上述權(quán)利要求中任一項(xiàng)中所述的方法,其中把在所述畫面 的所述第一版本中的像素與那些僅在所述畫面的所述第二版本中已經(jīng) 被識(shí)別為邊緣像素的像素結(jié)合起來(lái)包括基于與在所述第二畫面的所述第二版本中的所述像素相關(guān)聯(lián)的壓縮數(shù)據(jù)生成掩碼;把所述掩碼應(yīng)用到所述畫面的所述第二版本上;和 僅在總線上傳送那些在所述畫面的所述第二版本中的沒(méi)有被掩碼所覆蓋的像素,從而與所述畫面的所述第一版本中的像素結(jié)合
6. 如權(quán)利要求1到4中任何一項(xiàng)中所述的方法,其中把在所述 畫面的所述第一版本中的像素與那些僅在所述第二畫面的所述第二版 本中的已經(jīng)被識(shí)別為邊緣像素的像素結(jié)合起來(lái)包括把在所述畫面的所述第一版本中的像素像素與那些僅在所述第二 畫面的所述第二版本中的已經(jīng)被識(shí)別為邊緣像素的像素線性混合。
7. —種圖形處理系統(tǒng),包括第一圖形處理單元(GPU),被配置為使用第一多采樣模式繪制 畫面的第一版本;第二圖形處理單元(GPU),被配置為使用第二多采樣模式繪制 所述畫面的第二版本;和連接所述第一 GPU和所述第二 GPU的總線;其中所述第二 GPU還被配置為識(shí)別在所述畫面的所述第二版本 中的邊緣像素,并且僅把那些在所述畫面的所述第二版本中已經(jīng)被識(shí) 別為邊緣像素的像素在所述總線上傳送到所述第一 GPU,和其中所述第一 GPU還被配置為把在所述畫面的所述第一版本中 的像素與從所述第二GPU傳送的像素結(jié)合起來(lái)以生成結(jié)合畫面。
8. 如權(quán)利要求7中所述的系統(tǒng),其中所述總線包括PCI-Express總線。
9. 如權(quán)利要求7或8中所述的系統(tǒng),其中所述第一GPU被配 置為根據(jù)所述第一采樣模式采樣所述畫面中的每個(gè)像素以獲得每個(gè)像 素的多個(gè)第一采樣,并且解析每個(gè)像素的所述多個(gè)第一像素以生成所述畫面的所述第 一版本的像素。
10. 如權(quán)利要求9中所述的系統(tǒng),其中所述第二GPU被配置 為根據(jù)所述第二采樣模式采樣所示畫面中的每個(gè)像素以獲得每個(gè)像素 的多個(gè)第二采樣,并且解析每個(gè)像素的所述多個(gè)第二采樣以生成所述 畫面的所述第二版本的像素。
11. 如權(quán)利要求7到10中任一項(xiàng)中所述的系統(tǒng),其中所述第 二 GPU包括存儲(chǔ)器;其中所述第二 GPU還被配置為訪問(wèn)存儲(chǔ)在所述存儲(chǔ)器中的表, 并且如果所述表表明在所述畫面中的所述第二版本中的像素沒(méi)有被壓 縮,則把所述畫面的所述第二版本中的該像素識(shí)別為邊緣像素。
12. 如權(quán)利要求7到11中任一項(xiàng)中所述的系統(tǒng),其中所述第 二 GPU還被配置為基于與在所述畫面的所述第二版本中的像素相關(guān) 聯(lián)的壓縮數(shù)據(jù)生成掩碼,對(duì)所述畫面的所述第二版本應(yīng)用所述掩碼并 且僅把那些在所述畫面的所述第二版本中沒(méi)有被所述掩碼所覆蓋的像 素在所述總線上傳送到所述第一 GPU。
13. 如權(quán)利要求7到12中任一項(xiàng)中所述的系統(tǒng),其中第一 GPU包括合成器,所述合成器被配置為把所述畫面的所述第一版本中 的像素與從所述第二GPU傳送的像素線性混合以生成所迷結(jié)合畫面。
14. 一種用于在所繪制的圖像中識(shí)別邊緣像素的方法,所繪制 的圖像由多個(gè)矩形塊組成,其中每個(gè)多個(gè)矩形塊由多個(gè)像素組成,所 述方法包括壓縮;響應(yīng)于確定所選擇的矩形塊被完全壓縮,把所選擇的矩形塊識(shí)別為僅包含非邊緣像素;和響應(yīng)于確定所選擇矩形塊未被完全壓縮,把所選擇的矩形塊識(shí)別 為包含一個(gè)或多個(gè)邊緣像素。
15. 如權(quán)利要求14中所述的方法,其中訪問(wèn)數(shù)據(jù)以確定所選擇的矩形塊是否被完全壓縮包括訪問(wèn)對(duì)應(yīng)于所選擇的矩形塊的表中的條目,其中所述條目表明所 迷選擇的矩形塊是被完全壓縮、部分壓縮還是未壓縮。
16. 如權(quán)利要求15中所述的方法,其中訪問(wèn)數(shù)據(jù)以確定是否 所選擇的像素塊被完全壓縮還包括過(guò)解析的矩形塊;和 "、 '、 、 、基于與在經(jīng)過(guò)解析的矩形塊中的像素相關(guān)聯(lián)的一個(gè)或多個(gè)顏色值 確定選擇的矩形塊是否被完全壓縮。
17. —種計(jì)算機(jī)程序產(chǎn)品,包括有形的計(jì)算機(jī)可用介質(zhì),在所 述計(jì)算機(jī)可用介質(zhì)中存儲(chǔ)有控制邏輯,所述控制邏輯用于使圖形處理 器識(shí)別由多個(gè)矩形塊組成的繪制的圖像中的邊緣像素,所述多個(gè)矩形 塊中的每個(gè)由多個(gè)像素組成,所述控制邏輯包括計(jì)算機(jī)可讀程序代碼 裝置,用于使所述圖形處理器實(shí)現(xiàn)根據(jù)權(quán)利要求14到16中的任何一 項(xiàng)所述的方法。
18. —種用于在系統(tǒng)執(zhí)行基于多釆樣圖形去階梯的方法,所述 系統(tǒng)包括第一圖形處理單元(GPU)和第二圖形處理器單元GPU,所 述方法包括在所述第一 GPU中使用第 一多采樣模式繪制畫面的第 一版本; 在所述第二 GPU中使用第二多采樣模式繪制與畫面的第二版本相關(guān)聯(lián)的邊緣像素;把所述邊緣像素從所述第二 GPU傳送到所述第一 GPU;和 把從所述第二 GPU傳送的邊緣像素與所述畫面的所述第一版本中的像素結(jié)合起來(lái)以生成結(jié)合的畫面。
19. 一種計(jì)算機(jī)程序產(chǎn)品,包括有形的計(jì)算機(jī)可用介質(zhì),在所 述計(jì)算機(jī)可用中存儲(chǔ)有控制邏輯,所述控制邏輯用于使第一圖形處理 單元(GPU)和第二 GPU執(zhí)行基于多采樣的圖形去階梯,所述控制 邏輯包括第一計(jì)算機(jī)可讀程序編碼裝置,用于使所述第一 GPU使用第一多采樣模式繪制畫面的第 一版本;第二計(jì)算機(jī)可讀程序編碼裝置,用于使所述第二 GPU使用第二多釆樣模式繪制畫面的第二版本;第三計(jì)算機(jī)可讀程序編碼裝置,用于使所述第二 GPU識(shí)別在所 述畫面的所述第二版本中的邊緣像素;和第四計(jì)算機(jī)可讀程序編碼裝置,用于使所述第一 GPU和/或所述 第二 GPU把在所述畫面的所述第一版本中的像素與那些僅在所述畫 面的所述第二版本中已經(jīng)被識(shí)別為邊緣像素的像素結(jié)合起來(lái)以生成結(jié) 合的畫面。
全文摘要
一種用于在系統(tǒng)中執(zhí)行基于多采樣圖形去階梯的方法和設(shè)備,所述系統(tǒng)包括第一和第二圖形處理單元(GPU),其減少在GPU之間所傳送的數(shù)據(jù)量并且提高了這種數(shù)據(jù)傳送的效率。所述第一GPU使用第一多采樣模式繪制畫面的第一版本,所述第二GPU使用第二多采樣模式繪制第二GPU中的畫面的第二版本。所述第二GPU在所述畫面的所述第二版本中識(shí)別非邊緣像素。然后在所述畫面的所述第一版本中的所述像素與那些僅在所述畫面的所述第二版本中已經(jīng)被識(shí)別為邊緣像素的像素結(jié)合起來(lái)以生成結(jié)合的畫面。
文檔編號(hào)G06T11/20GK101438319SQ200780016634
公開(kāi)日2009年5月20日 申請(qǐng)日期2007年5月1日 優(yōu)先權(quán)日2006年5月8日
發(fā)明者G·艾爾德, J·高爾德斯, R·柯杜里 申請(qǐng)人:Ati技術(shù)無(wú)限責(zé)任公司