快速視頻編解碼變換實現(xiàn)的制作方法

文檔序號：7617871閱讀：223來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：快速視頻編解碼變換實現(xiàn)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及用于數(shù)字地對信號進(jìn)行編碼和處理的技術(shù)。更具體地說，本發(fā)明涉及信號(例如，圖像和視頻)的編碼和解碼過程中的一類在計算上有效率的變換的快速實現(xiàn)。
背景技術(shù)：
變換編碼是一種被用于許多音頻、圖像和視頻壓縮系統(tǒng)中的壓縮技術(shù)。未被壓縮的數(shù)字圖像和視頻通常被表現(xiàn)或捕捉，作為被排列在二維格柵中的圖像或視頻幀內(nèi)的各個位置處的圖元或顏色的樣值。例如，關(guān)于圖像的典型格式包括被排列為格柵的24位彩色圖元樣值流。每個樣值是表示色彩空間(例如，RGB或YIQ等)內(nèi)的格柵中的像素位置處的彩色成分的數(shù)字。各種圖像和視頻系統(tǒng)可以使用采樣的各種不同的顏色、空間和時間分辨率。
未被壓縮的數(shù)字圖像和視頻信號會消耗相當(dāng)大的存儲和傳輸容量。通過將該信號的空間域表示轉(zhuǎn)換成頻域(或其它相似的變換域)表示，然后降低該變換域表示的某些一般不太能察覺的頻率分量的分辨率，變換編碼可以減小數(shù)字圖像和視頻的尺寸。與降低空間域中的圖像或視頻的顏色或空間分辨率相比，這一般會產(chǎn)生該數(shù)字信號的不太能察覺的。
更明確地說，典型的變換編碼技術(shù)將該未被壓縮的數(shù)字圖像的像素劃分成有固定尺寸的二維塊，每個塊可能與其它塊重疊。執(zhí)行空間頻率分析的線性變換被應(yīng)用于每個塊，這將那個塊內(nèi)的這些彼此間隔的樣值轉(zhuǎn)換成一組頻率(或變換)系數(shù)，該組頻率(或變換)系數(shù)通常表示閉塞間隔上的對應(yīng)的頻帶內(nèi)的數(shù)字信號的強(qiáng)度。對于壓縮，這些變換系數(shù)可以被選擇性地量化(即，降低分辨率，例如，通過丟棄這些系數(shù)值的最低位或者將較高分辨率數(shù)集中的值映射到較低分辨率)，并且，熵或可變長度也被編碼成被壓縮的數(shù)據(jù)流。在解碼時，這些變換系數(shù)將進(jìn)行逆變換，以便差不多重建該原始顏色/空間采樣的圖像/視頻信號。
許多圖像和視頻壓縮系統(tǒng)(例如，MPEG和Windows Media等)利用基于“離散余弦變換”(DCT)的變換。已知該DCT具有導(dǎo)致幾乎最佳的數(shù)據(jù)壓縮的有利的能量壓縮屬性。在這些壓縮系統(tǒng)中，在用于重建單獨的圖像塊的壓縮系統(tǒng)的編碼器和解碼器中的這些重建回路內(nèi)使用逆向DCT(IDCT)。在“關(guān)于8×8逆向離散余弦變換的實現(xiàn)的IEEE標(biāo)準(zhǔn)規(guī)范(IEEE Standard Specification for theImplementations of 8×8 Inverse Discrete Consine Transform)”(IEEE標(biāo)準(zhǔn)1180-1990，1990年12月6日)中，描述了該IDCT的示例性實現(xiàn)。
該IEEE標(biāo)準(zhǔn)1180-1990中所定義的IDCT變換的缺點是該變換的計算涉及64位浮點數(shù)的矩陣乘法，這在計算上花費(fèi)昂貴。這會限制該圖像或視頻壓縮系統(tǒng)的性能，尤其在流媒體和相似的媒體重放應(yīng)用程序中——其中，在實時的基礎(chǔ)上或在其它相似的時間約束下，對大量壓縮數(shù)據(jù)執(zhí)行該IDCT。
Windows Media Video 9編解碼(WMV9)標(biāo)準(zhǔn)(已被提議以通過“電影與電視工程師學(xué)會”(SMPTE)C24技術(shù)委員會標(biāo)準(zhǔn)化為視頻編解碼9(VC-9))定義四種類型的二維數(shù)據(jù)變換——它們是8×8、8×4、4×8和4×4變換。這些VC-9標(biāo)準(zhǔn)變換具有類似于DCT的能量壓縮屬性，但具有基于對整數(shù)的矩陣乘法運(yùn)算的實現(xiàn)，用于獲得計算上的效率。在2003年2月28日提交的序列號為10/376,147的美國專利申請(其揭示說明被包括于此，用作參考)中，更充分地描述了這些WMV9/VC-9變換的矩陣實現(xiàn)。該WMV9規(guī)范要求這些逆變換的位精確(bit-exact)實現(xiàn)。
線性變換的快速實現(xiàn)具有漫長的歷史。快速變換的一個眾所周知的例子是J.W.Cooley和J.W.Tukey的《關(guān)于綜合傅立葉級數(shù)的機(jī)器計算的算法(An AlgorithmFor The Machine Calculation Of Complex Fourier Series)》(數(shù)學(xué)計算第19卷，第297-301頁，1965年)中所描述的“快速傅立葉變換”(FFT)。該FFT使用O(NlogN)運(yùn)算來實現(xiàn)N點傅立葉變換。傅立葉變換定義的固有對稱性允許這個簡化。通過W.Chen、C.H.Smith和S.C.Fralick的《關(guān)于離散余弦變換的快速計算算法(A FastComputational Algorithm For The Discrete Consines Transfrom)》(IEEE Trans.Commun.，第25卷，第1004-1009頁，1977年9月)以及H.Malvar的《離散余弦變換和離散哈特利變換的快速計算(Fast Computation Of The Discrete ConsineTransform And The Discrete Hartly Transform)》(IEEE Trans.Acoust.，語音、信號處理，第ASSP-35卷，第1484-1485頁，1987年10月)，類似的快速實現(xiàn)已被示出存在，用于“離散余弦變換”(DCT)。
快速變換已將變換的矩陣乘法定義分解成涉及“蝶式”運(yùn)算的一系列步驟。該蝶式運(yùn)算是兩個變量之間的加權(quán)數(shù)據(jù)交換，這兩個變量要么是空間域、頻域，要么是中間變量。例如，圖3中示出對應(yīng)于該矩陣乘法的蝶式運(yùn)算。
y=cs-scx]]>這對應(yīng)于原始二維矢量x在繞原點的旋轉(zhuǎn)，具有可能的比例因數(shù)。如果c2+s2＝1，那么，該比例因數(shù)是單位元素。具有實值輸入的蝶式運(yùn)算可以只利用三個實值乘法來加以實現(xiàn)。一般而言，矩陣不需要對應(yīng)于純旋轉(zhuǎn)——可能存在比例縮放和剪切，而無額外的復(fù)雜性。
如剛剛所描述的，經(jīng)由該蝶式運(yùn)算的直接應(yīng)用，四點WMV9/VC-9變換許可快速實現(xiàn)。
如上所述，已知8點DCT具有快速變換實現(xiàn)。但是，它無法容易地轉(zhuǎn)化為8點WMV9/VC-9變換。WMV9/VC-9變換類似于DCT，但位精確性的整數(shù)實現(xiàn)和要求使從任何已知快速實現(xiàn)的直接映射成為不可能。
如2003年2月28日提交的序列號為10/376,147的美國專利申請中所描述的，8點WMV9/VC-9變換可以由使用一對偶數(shù)和奇數(shù)矩陣的運(yùn)算來實現(xiàn)。已知在其后跟隨四點DCT的輸入處，可以由一系列蝶式運(yùn)算來平凡地實現(xiàn)DCT的這些偶基函數(shù)(即基函數(shù)0、2、4和8)。DCT的這個已知快速實現(xiàn)可很好地轉(zhuǎn)化為8點WMV9/VC-9變換的偶數(shù)矩陣。
但是，這些已知的快速實現(xiàn)沒有提供方法來導(dǎo)出8點WMV9/VC-9變換的奇數(shù)矩陣的快速實現(xiàn)。盡管WMV9/VC-9變換類似于DCT，但WMV9/VC-9中的位精確性的整數(shù)實現(xiàn)和要求使從任何已知快速變換實現(xiàn)的直接映射成為不可能。無法參照這些已知的快速變換實現(xiàn)來解決這些變換的各個奇基函數(shù)的分析與合成。

發(fā)明內(nèi)容
這里描述了8點WMV9/VC-9變換的快速實現(xiàn)。所描述的實現(xiàn)包括8點WMV9/VC-9變換的快速前向與逆向變換實現(xiàn)，以及每一項的替換實現(xiàn)。這些快速實現(xiàn)許可將縮放比例并入過濾的兩個維度結(jié)束時的階段，或分開地并入每個階段。這些快速實現(xiàn)也可以用于使用WMV9/VC-9變換、以及圖像壓縮和其它信號處理系統(tǒng)的編解碼器的編碼器和解碼器側(cè)上。
通過以下參照附圖而進(jìn)行的對實施例的詳細(xì)說明，本發(fā)明的額外的特點和優(yōu)點將變得一目了然。

圖1是使用這里所描述的WMV9/VC-9變換的快速實現(xiàn)的視頻編碼器的框圖。
圖2是使用這里所描述的WMV9/VC-9變換的快速實現(xiàn)的視頻解碼器的框圖。
圖3是對應(yīng)于標(biāo)準(zhǔn)正交旋轉(zhuǎn)的現(xiàn)有技術(shù)的蝶式運(yùn)算的圖表。
圖4是無比例縮放的4點WMV9/VC-9前向變換的快速實現(xiàn)的框圖。
圖5是無比例縮放的4點WMV9/VC-9反變換的快速實現(xiàn)的框圖。
圖6是無比例縮放的8點WMV9/VC-9前向變換的快速實現(xiàn)的框圖。
圖7是無比例縮放的8點WMV9/VC-9反變換的快速實現(xiàn)的框圖。
圖8是無比例縮放的8點WMV9/VC-9反變換的替換快速實現(xiàn)的框圖。
圖9是無比例縮放的8點WMV9/VC-9前向變換的替換快速實現(xiàn)的框圖。
圖10是關(guān)于圖1和圖2中的視頻編碼器/解碼器的合適的計算環(huán)境的框圖。
具體實施例方式
以下說明針對WMV9和VC-9編解碼中所定義的一組變換的快速實現(xiàn)，并且，它可以被應(yīng)用于服從WMV9/VC-9的編解碼以及其它二維媒體(例如，視頻和圖像)編解碼中。這些媒體編碼變換的快速實現(xiàn)的示例性應(yīng)用是在圖像或視頻編碼器和解碼器中。但是，如這里所描述的那樣來構(gòu)造的這些變換不局限于圖像或視頻編解碼，并且可以被應(yīng)用于其它媒體處理系統(tǒng)。因此，這些變換的快速實現(xiàn)可以在概括的圖像或視頻編碼器和解碼器的環(huán)境中加以描述，但作為選擇，可以被并入使用這些變換的各種類型的媒體信號處理系統(tǒng)中。
1.概括的視頻編碼器和解碼器圖1是概括的視頻編碼器(100)的框圖；并且，圖2是概括的視頻解碼器(200)的框圖，其中，可以并入WMV9/VC-9變換。
編碼器和解碼器內(nèi)的各個模塊之間所示的各種關(guān)系指出編碼器和解碼器中的主要信息流；為簡單起見，沒有示出其它關(guān)系。特別是，圖1和圖2通常不示出指出用于視頻序列、幀、宏塊、塊等的編碼器設(shè)置、模式、表格等的輔助信息。通常在該輔助信息的熵編碼之后，在該輸出位流中發(fā)送這類輔助信息。該輸出位流的格式可以是Windows Media Video格式或另一格式。
編碼器(100)和解碼器(200)是基于塊的，并且使用4:2:0宏塊格式——每個宏塊包括4個8×8的亮度塊(有時被視作一個16×16宏塊)和兩個8×8的色度塊。作為選擇，編碼器(100)和解碼器(200)是基于對象的，并且使用不同的宏塊或塊格式，或者對不同于8×8塊和16×16宏塊的尺寸或配置的像素集執(zhí)行運(yùn)算。
根據(jù)所需壓縮的實現(xiàn)和類型，編碼器或解碼器的模塊可以被添加、省略、分成多個模塊、與其它模塊結(jié)合、并且/或者用相似的模塊來取代。在替換實現(xiàn)例中，具有不同的模塊和/或其它模塊配置的編碼器或解碼器執(zhí)行所描述的技術(shù)中的一項或多項技術(shù)。
A.視頻編碼器圖1是一般的視頻編碼器系統(tǒng)(100)的框圖。該編碼器系統(tǒng)(100)接收包括當(dāng)前幀(105)的視頻幀序列，并且產(chǎn)生作為輸出的被壓縮的視頻信息(195)。視頻編碼器的特定實施例通常使用該概括的編碼器(100)的變更或補(bǔ)充版本。
編碼器系統(tǒng)(100)壓縮預(yù)測幀和關(guān)鍵幀。為呈現(xiàn)起見，圖1示出了關(guān)鍵幀通過編碼器系統(tǒng)(100)的路徑、以及前向預(yù)測幀的路徑。編碼器系統(tǒng)(100)的許多組件被用于壓縮關(guān)鍵幀和預(yù)測幀兩者。由那些組件執(zhí)行的精確運(yùn)算可以根據(jù)正在被壓縮的信息類型而變化。
預(yù)測幀[也被稱作“p幀”、“對于雙向預(yù)測的b幀”或“幀間編碼幀”]在從一個或多個其它的幀的預(yù)測(或差異)方面被加以表現(xiàn)。預(yù)測殘余是預(yù)測幀與原始幀之間的差異。相反，不參考其它幀來壓縮關(guān)鍵幀[也被稱作“i幀”、“幀內(nèi)編碼幀”]。
如果當(dāng)前幀(105)是前向預(yù)測幀，那么，運(yùn)動估計器(110)估計該當(dāng)前幀(105)的宏塊或其它像素集相對于參考幀的運(yùn)動，該參考幀是在該幀存儲(120)中被緩沖的被重建的前一幀(125)。在替換實施例中，參考幀是后一幀，或者，當(dāng)前幀被進(jìn)行雙向預(yù)測。運(yùn)動估計器(110)輸出運(yùn)動信息(115)(例如，運(yùn)動矢量)，作為輔助信息。運(yùn)動補(bǔ)償器(130)將運(yùn)動信息(115)應(yīng)用于重建的前一幀(125)，以形成經(jīng)運(yùn)動補(bǔ)償?shù)漠?dāng)前幀(135)。但是，該預(yù)測很少是完美的，經(jīng)運(yùn)動補(bǔ)償?shù)漠?dāng)前幀(135)與原始當(dāng)前幀(105)之間的差異是預(yù)測殘余(145)。作為選擇，運(yùn)動估計器和運(yùn)動補(bǔ)償器應(yīng)用另一種類型的運(yùn)動估計/補(bǔ)償。
頻率變換器(160)將該空間域視頻信息轉(zhuǎn)換成頻域(即頻譜)數(shù)據(jù)。對于基于塊的視頻幀，頻率變換器(160)應(yīng)用以下各個章節(jié)中所描述的變換，這些變換具有類似于離散余弦變換[“DCT”]的屬性。在某些實施例中，頻率變換器(160)將頻率變換應(yīng)用于關(guān)鍵幀的空間預(yù)測殘余的塊。頻率變換器(160)可以應(yīng)用8×8、8×4、4×8或其它尺寸頻率變換。
然后，量化器(170)對頻譜數(shù)據(jù)系數(shù)塊進(jìn)行量化。量化器將統(tǒng)一的標(biāo)量量化應(yīng)用于具有步長的頻譜數(shù)據(jù)，該步長在逐幀的基礎(chǔ)或其它基礎(chǔ)上變化。作為選擇，量化器將另一種類型的量化應(yīng)用于頻譜數(shù)據(jù)系數(shù)(例如，非均勻矢量或非自適應(yīng)量化)，或者在不使用頻率變換的編碼器系統(tǒng)中直接量化空間域數(shù)據(jù)。除自適應(yīng)量化以外，編碼器(100)還可以使用幀丟棄、自適應(yīng)過濾、或關(guān)于速率控制的其它技術(shù)。
當(dāng)隨后的運(yùn)動估計/補(bǔ)償需要被重建的當(dāng)前幀時，反量化器(176)對這些被量化的頻譜數(shù)據(jù)系數(shù)執(zhí)行反量化。然后，反頻率變換器(166)執(zhí)行頻率變換器(160)的運(yùn)算的逆運(yùn)算，從而產(chǎn)生被重建的預(yù)測殘余(對于被預(yù)測的幀)或被重建的關(guān)鍵幀。如果當(dāng)前幀(105)是關(guān)鍵幀，那么，被重建的關(guān)鍵幀被視作該被重建的當(dāng)前幀(未示出)。如果當(dāng)前幀(105)是被預(yù)測的幀，那么，將被重建的預(yù)測殘余加入經(jīng)運(yùn)動補(bǔ)償?shù)漠?dāng)前幀(135)，以形成被重建的當(dāng)前幀。幀存儲(120)緩沖被重建的當(dāng)前幀，用于預(yù)測下一個幀。在某些實施例中，編碼器將分塊濾波器(deblockingfilter)應(yīng)用于被重建的幀，以便自適應(yīng)地平滑幀塊中的不連續(xù)性。
熵編碼器(180)壓縮量化器(170)的輸出、以及某些輔助信息(例如，運(yùn)動信息(115)、量化步長)。典型的熵編碼技術(shù)包括算術(shù)編碼、差分編碼、霍夫曼編碼技術(shù)、運(yùn)行長度編碼、LZ編碼、詞典編碼、以及以上編碼的組合。熵編碼器(180)通常對不同種類信息(例如，DC系數(shù)、AC系數(shù)、不同種類的輔助信息)使用不同的編碼技術(shù)，并且可以從特定編碼技術(shù)內(nèi)的多個碼表之中進(jìn)行選擇。
熵編碼器(180)將被壓縮的視頻信息(195)放入緩沖器(190)中。緩沖水平指示器被反饋給比特率自適應(yīng)模塊。被壓縮的視頻信息(195)按恒定或相對恒定的比特率來從緩沖器(190)中被放空，并且被存儲，用于按那個比特率的隨后的流傳送。作為選擇，編碼器系統(tǒng)(100)在壓縮之后立即流傳送被壓縮的視頻信息。
在緩沖器(190)前面或后面，被壓縮的視頻信息(195)可以進(jìn)行信道編碼，用于通過網(wǎng)絡(luò)傳輸。信道編碼可以將誤差檢測和糾正數(shù)據(jù)應(yīng)用于被壓縮的視頻信息(195)。
B.視頻解碼器圖2是一般的視頻解碼器系統(tǒng)(200)的框圖。解碼器系統(tǒng)(200)接收被壓縮的視頻幀序列的信息(295)，并產(chǎn)生包括被重建的幀(205)的輸出。視頻解碼器的特定實施例通常使用該概括的解碼器(200)的變更或補(bǔ)充版本。
解碼器系統(tǒng)(200)解壓被預(yù)測的幀和關(guān)鍵幀。為呈現(xiàn)起見，圖2示出了關(guān)鍵幀通過解碼器系統(tǒng)(200)的路徑、以及前向預(yù)測幀的路徑。解碼器系統(tǒng)(200)的許多組件用于壓縮關(guān)鍵幀和預(yù)測幀兩者。由那些組件執(zhí)行的精確運(yùn)算可以根據(jù)正在被壓縮的信息類型而變化。
緩沖器(290)接收被壓縮的視頻序列的信息(295)，并且使接收的信息對熵解碼器(280)可用。緩沖器(290)通常按隨時間推移而相當(dāng)恒定的速率來接收信息，并且包括抖動緩沖器，以平滑帶寬或傳輸中的短期變更。緩沖器(290)也可以包括重放緩沖器和其它緩沖器。作為選擇，緩沖器(290)按變化的速率來接收信息。在緩沖器(290)前面或后面，被壓縮的視頻信息可以進(jìn)行信道解碼和處理，用于誤差檢測和糾正。
熵解碼器(280)對經(jīng)熵編碼的量化數(shù)據(jù)以及經(jīng)熵編碼的輔助信息(例如，運(yùn)動信息、量化步長)進(jìn)行熵解碼，它通常應(yīng)用編碼器中所執(zhí)行的熵編碼的逆暈眩。熵解碼技術(shù)包括算術(shù)解碼、差分解碼、霍夫曼解碼、運(yùn)行長度解碼、LZ解碼、詞典解碼、以及以上解碼的組合。熵解碼器(280)通常對不同種類的信息(例如，DC系數(shù)、AC系數(shù)、不同種類的輔助信息)使用不同的解碼技術(shù)，并且可以從特定解碼技術(shù)內(nèi)的多個代表之中進(jìn)行選擇。
如果將要被重建的幀(205)是前向預(yù)測幀，那么，運(yùn)動補(bǔ)償器(230)將運(yùn)動信息(215)應(yīng)用于參考幀(225)，以形成正在被重建的幀(205)的預(yù)測(235)。例如，運(yùn)動補(bǔ)償器(230)使用宏塊運(yùn)動矢量來發(fā)現(xiàn)參考幀(225)中的宏塊。幀緩沖器(220)存儲先前被重建的幀，用作參考幀。作為選擇，運(yùn)動補(bǔ)償器應(yīng)用另一種類型的運(yùn)動補(bǔ)償。運(yùn)動補(bǔ)償器所執(zhí)行的預(yù)測很少是完美的，所以，解碼器(200)也重建預(yù)測殘余。
當(dāng)解碼器需要被重建的幀用于隨后的運(yùn)動補(bǔ)償時，幀存儲器(220)緩沖被重建的幀，用于預(yù)測下一個幀。在某些實施例中，編碼器將分塊濾波器應(yīng)用于被重建的幀，以便自適應(yīng)地平滑幀塊中的不連續(xù)性。
反量化器(270)對經(jīng)熵解碼的數(shù)據(jù)進(jìn)行反量化。一般而言，反量化器將均勻的標(biāo)量反量化應(yīng)用于具有步長的經(jīng)熵解碼的數(shù)據(jù)，該步長在逐幀的基礎(chǔ)或其它基礎(chǔ)上變化。作為選擇，反量化器將另一種類型的反量化應(yīng)用于數(shù)據(jù)(例如，非均勻矢量或非自適應(yīng)量化)，或者在不使用反頻率變換的解碼器系統(tǒng)中直接反量化空間域數(shù)據(jù)。
反頻率變換器(260)將經(jīng)量化的頻域數(shù)據(jù)轉(zhuǎn)換成空間域視頻信息。對于基于塊的視頻幀，反頻率變換器(260)應(yīng)用以下各個章節(jié)中所描述的反變換。在某些實施例中，反頻率變換器(260)將反頻率變換應(yīng)用于關(guān)鍵幀的空間預(yù)測殘余塊。反頻率變換器(260)可以應(yīng)用8×8、8×4、4×8或其它尺寸反頻率變換。
2.WMV9/VC-9變換WMV9/VC-9標(biāo)準(zhǔn)定義了可以被用作視頻編碼器100(圖1)和視頻解碼器200(圖2)中的頻率變換160和反頻率變換260的變換。WMV9/VC-9標(biāo)準(zhǔn)定義了四種類型的二維數(shù)據(jù)變換——它們是8×8、8×4、4×8和4×4變換。按照以下概括的定義，該規(guī)范要求這些反變換的位精確實現(xiàn)。
A.WMV9/VC-9變換定義WMV9/VC-9中所使用的這些2D變換是可分離的，并且，使用被適當(dāng)定義的經(jīng)比例縮放的接近標(biāo)準(zhǔn)正交的乘數(shù)矩陣而在每個方向上執(zhí)行變換。兩個矩陣(一個矩陣用于4點一維變換，另一個矩陣用于8點一維變換)被定義如下。所有變量被假設(shè)為整數(shù)。
T4=171717172210-10-2217-17-171710-2222-10]]>T8=1212121212121212161594-4-9-15-16166-6-16-16-661615-4-16-99164-1512-12-121212-12-12129-16415-15-416-96-1616-6-616-1664-915-1616-159-4]]>在格式說明中詳細(xì)解釋反變換，因為所有服從解碼器被要求提供位精確輸出。該變換被定義如下首先，對解除量化的變換矩陣的各行進(jìn)行反變換。此后是列的反變換。
設(shè)D表示被解除量化的變換矩陣，D1表示變換的第一階段的輸出，R表示行和列范圍反變換之后的被重建的輸出。D、D1和R是與所需的變換尺寸相同的同構(gòu)8×8、8×4、4×8和4×4矩陣。在對符號的濫用中，涉及矩陣和標(biāo)量的運(yùn)算在這個文檔中被定義為該矩陣的條目范圍(entrywise)運(yùn)算。同樣，具有矩陣自變量的標(biāo)量運(yùn)算被定義為對矩陣的條目范圍標(biāo)量運(yùn)算。矩陣和矢量的和是對矩陣和標(biāo)量的條目范圍和的簡化符號，該標(biāo)量的值從矢量的協(xié)同定位(co-located)的行或列中被導(dǎo)出(根據(jù)該矢量是否分別是列矢量或行矢量)。
m×n反變換的正則公式是R=(Tn′·D·Tm)1024]]>分母被選擇是最接近于1D變換(它是{4×288，4×289，4×292}之一)的基函數(shù)的平方范數(shù)的2的冪。由于實際范數(shù)與分母之間的比率(大約是1.12)接近于1，因此，在用于IDCT的量化參數(shù)與用于WMV9/VC-9變換的量化參數(shù)之間有緊密的對應(yīng)性。這里沒有引入額外的誤差，因為在前向變換過程中執(zhí)行所有剩余的歸一化(本質(zhì)上通過1024/基函數(shù)的平方范數(shù))——這一點在該文檔的后面有進(jìn)一步的描述。
在實踐中，除以1024的除法被實現(xiàn)為舍入運(yùn)算，該舍入運(yùn)算跨越兩個1D變換過程而被分開。另外，通過將第二階段矩陣分成偶分量和奇分量，可以利用最大精確度保持力來實現(xiàn)16位反變換，如以下定義T8=2·T8e+T8o]]>T4=2·T4e+T4o]]>這些奇分量T8o和T4o只被許可具有0、1和-1作為條目。由于T8的大多數(shù)條目是偶數(shù)，因此，T8o是稀疏矩陣。同樣，T4o具有與T4e高度相關(guān)的結(jié)構(gòu)。該反變換過程的WMV9/VC-9正則表示現(xiàn)在被定義如下D1=(D·Tm)8]]>D=(Tn′e·D1+Tn′o·D12)64]]>由于奇分量具有該Tn范圍的一半，并且由于奇分量Tno局限于具有0、1和-1條目，因此，變換的第二階段中的所得的分子可以被示出在范圍上局限于16個比特。有較小的計算性能損失，來償還這個額外的比特。然而，該變換矩陣的分解以微不足道的代價而導(dǎo)致改善的算術(shù)精確度。
以下示出4和8點變換的這些奇、偶分量
T4e=8888115-5-118-8-885-1111-5]]>T4o=111100001-1-110000]]>T8e=666666668742-2-4-7-883-3-8-8-3387-2-8-5582-76-6-666-6-664-827-7-28-43-88-3-38-832-57-88-75-2]]>T8o=0000000001100-1-10000000001001-100-1000000001001-100-10000000001100-1-10]]>以T4o的自右乘可以被簡化為W·T4o=W1W2W2W1]]>其中W1W2=W·11001-100]]>它是平凡的蝶式運(yùn)算。同樣，以T8o的自右乘相當(dāng)于僅僅兩個加法(和求反)W·T8o=W1W2W2W1-W1-W2-W2-W1]]>其中W1W2=W·0001001000100001]]>
B.8×8反變換行范圍的反變換首先被如下執(zhí)行D1＝(D·T8+4)＞＞3通過查看T8的奇分量來計算8個元素的這兩個共同的行，可以定義列范圍的反變換。在該結(jié)果被下舍入6個比特之前，這些被右移一個比特，然后添加到偶分量乘積(或從偶分量乘積中減去)。該運(yùn)算如下所示D1aD1b=D1′·0001001000100001]]>D′2a＝D1a＞＞1D′2b＝D1b＞＞1R=(T8′e·D1+D2aD2bD2bD2a-D2a-D2b-D2b-D2a+32)>>6---(1)]]>C.4×8反變換根據(jù)WMV9/VC-9約定，“4×8”指的是具有4列和8行的數(shù)組。行范圍的反變換是4點運(yùn)算，它被定義如下D1＝(D·T4+4)＞＞3沿這些列的變換的第二部分等同于8×8變換的第二部分，并且在以上的方程式(1)中被加以定義。
D.8×4反變換根據(jù)WMV9/VC-9約定，“8×4”指的是具有8列和4行的數(shù)組。8×4變換的第一階段根據(jù)以下公式來在這4行的8個條目中的每個條目上運(yùn)算
D1＝(D·T8+4)＞＞3關(guān)于第二階段的列范圍的4點反變換被定義如下D1aD1b=D1′·11001-100]]>D′2a＝D1a＞＞1D′2b＝D1b＞＞1 (2)R=(T4′e·D1+D2aD2bD2bD2a+32)>>6]]>E.4×4反變換4×4反變換的第一階段是行范圍的運(yùn)算，它是4點反變換，被定義如下D1＝(D·T4+4)＞＞3沿這些列的變換的第二部分等同于8×4變換的第二部分，并且在以上的方程式(2)中被加以定義。
F.反變換的替換實現(xiàn)使用變換矩陣的奇分量和偶分量的反變換的第二階段的定義被要求用最大精確度保持力來達(dá)到16位實現(xiàn)。如果16位字長不是問題(例如，在專用集成電路或ASIC上)，那么，可以使用17位中間結(jié)果來簡化部分的基礎(chǔ)算術(shù)?？梢詫?dǎo)出與前一章節(jié)中的這些定義相比較的產(chǎn)生位精確結(jié)果的變換的替換定義。由于這些實現(xiàn)的第一階段等同于原始定義的第一階段，因此，只有第二階段被定義如下8×8和4×8反變換具有第二階段R=(T8t·D1+6464646465656565)>>7]]>8×4和4×4反變換具有第二階段
R=(T4t·D1+64646464)>>7]]>G.前向變換定義前向變換通過類似的過程來獲得，除了以下兩點以外(i)變換矩陣被轉(zhuǎn)置；以及(ii)比例因數(shù)是不同的。由于前向變換不需要在編碼器側(cè)上按位精確方式來加以執(zhí)行，因此，不再要求整數(shù)變量的假定——確實可以使用浮點或經(jīng)縮放的定點算術(shù)來執(zhí)行前向變換。以下所示的前向變換的矩陣乘法表示純粹是分析表示，與反變換不同——在反變換中，矩陣乘法明確地指具有16位寄存器的整數(shù)乘法?？梢栽诒匾獣r執(zhí)行各個階段之間的舍入，并且，這個選擇留給該編碼器。以下給出前向變換的各個原型定義可以使用以下關(guān)于這四種情況的方程式組，來計算數(shù)據(jù)矩陣D的4×4、4×8、8×4和8×8變換其中，算子°是分量范圍(componentwise)乘法。該歸一化矩陣Nij由以下公式給出Nij＝cjc′i其中，列矢量c是c4=8289829282898292′]]>c8=82888289829282898288828982928289′]]>再有，可以在所有乘法的結(jié)尾處一次執(zhí)行歸一化，或者可以在每個階段分開地執(zhí)行歸一化。這是編碼器的選擇?？梢酝ㄟ^2的冪來按比例增加輸出，以提高前矢量化過程中的精確度。
3.WMV9/VC-9變換的快速實現(xiàn)本章節(jié)描述上述WMV9/VC-9變換的快速實現(xiàn)。本質(zhì)上，由于每個變換階段是這個形式的矩陣乘法，因此，可以通過加速矩陣乘法T4D和T8D，來實現(xiàn)前向變換過程的加速。同樣，通過加速矩陣乘法T4D和T8D，可以加速反變換。
四點WMV9/VC-9變換(它是矩陣乘法T4D)許可經(jīng)由如圖4所示的蝶式運(yùn)算的直接應(yīng)用的快速實現(xiàn)。圖5示出了4點反變換(即矩陣乘法T4D)的快速實現(xiàn)。如所預(yù)期的，從前向變換的流向圖翻轉(zhuǎn)該信號流向圖。在這些圖中忽視比例縮放——如果在前向變換中使用浮點運(yùn)算，則可以將比例縮放合為乘數(shù)。另外，如果需要整數(shù)實現(xiàn)，那么，較佳地在前向變換的兩個階段的結(jié)尾處(若不在量化階段中)執(zhí)行比例縮放。對于反變換，必須如在這個文檔的較前面的各個章節(jié)中所定義的那樣來執(zhí)行比例縮放，以便成為服從WMV9/VC-9的。
雖然已知8點DCT具有快速變換實現(xiàn)，但是，它沒有容易地轉(zhuǎn)化為8點WMV9/VC-9變換。WMV9/VC-9變換類似于DCT，但位精確性的整數(shù)實現(xiàn)和要求使從任何已知快速實現(xiàn)的直接映射成為不可能。也已知DCT的偶基函數(shù)(即基函數(shù)0、2、4和8)可以在其后跟隨四點DCT的輸入處通過一系列蝶式來平凡地實現(xiàn)——這個事實也轉(zhuǎn)化為8點WMV9/VC-9變換。所以，在獲得8點WMV9變換的快速實現(xiàn)的過程中，實際難題是奇基函數(shù)的分析與合成。以下解決這個難題。
圖6示出了8點前向WMV9/VC-9變換的快速實現(xiàn)。(空間域)輸入在左邊，而(變換域)輸出在右邊。右上角的四個輸出對應(yīng)于偶底數(shù)，它們具有與圖4中的4點變換的相似性。對應(yīng)于奇底數(shù)的矩陣乘數(shù)如下所示T8odd=161594-4-9-15-1615-4-16-99164-159-16515-15-416-94-915-1616-159-4]]>可見，這些行關(guān)于中心奇對稱，這被第一蝶式階段利用。四個蝶式的這些“差異”項的所得的矩陣乘法采用以下公式Todd=16159415-4-16-99-164154-915-16]]>該4×4矩陣可以被分解如下Todd=1000011001-100001·43003-20000-230034·400105300-350100-4]]>以上分解產(chǎn)生圖6中所示的蝶式表示。由于這些分量矩陣也是整數(shù)值，因此，維持位精確性。
反變換通過兩種方法中的一種來加以分解。第一種替換方案是翻轉(zhuǎn)前向變換的流向圖。倒置蝶式運(yùn)算。特別是，類型的蝶式是其自己的逆，而形式的蝶式是的逆——在這兩種情況中都忽視比例縮放。所以，通過翻轉(zhuǎn)前向變換的流向圖，獲得圖7中所示的快速反變換實現(xiàn)。
第二種替換方案是指出“Todd是對稱矩陣”。所以，反變換也涉及與前向變換相同的矩陣乘法，即，可以為關(guān)于前向變換的奇基函數(shù)維持相同的蝶式和排序。圖8中示出這項實現(xiàn)。
也可以生成基于以上內(nèi)容的翻轉(zhuǎn)的前向變換。這提供了圖9中所示的前向變換的替換快速實現(xiàn)。
5.計算環(huán)境WMV9/VC-9變換的上述快速實現(xiàn)可以在其中執(zhí)行圖像與視頻信號處理的各種設(shè)備上執(zhí)行，包括計算機(jī)；圖像與視頻記錄、傳輸和接收設(shè)備；便攜式視頻播放器；視頻會議；Web視頻流應(yīng)用程序等等，以及其它例子。圖像與視頻編碼技術(shù)可以在硬件電路中(例如，在ASIC、FPGA等的電路中)加以執(zhí)行，也可以在圖像與視頻處理軟件中加以執(zhí)行，該圖像與視頻處理軟件在如圖10中所示的計算機(jī)或其它計算環(huán)境內(nèi)執(zhí)行(不管是在中央處理單元(CPU)上執(zhí)行，還是在專用圖形處理器、視頻卡或類似物上執(zhí)行)。
圖10展示了可以在其中實現(xiàn)所描述的快速WMV9/VC-9變換的合適的計算環(huán)境(1000)的概括例子。計算環(huán)境(1000)并不意在對本發(fā)明的使用范圍或功能提出任何限制，因為本發(fā)明可以在各種不同的通用或?qū)Ｓ糜嬎悱h(huán)境中加以執(zhí)行。
參照圖10，計算環(huán)境(1000)包括至少一個處理單元(1010)和存儲器(1020)。在圖10中，這個最基本的配置(1030)被包括在虛線內(nèi)。處理單元(1010)執(zhí)行計算機(jī)可執(zhí)行指令，并且可能是真實或虛擬處理器。在多處理系統(tǒng)中，多個處理單元執(zhí)行計算機(jī)可執(zhí)行指令，以提高處理能力。存儲器(1020)可以是易失存儲器(例如，寄存器、高速緩存、RAM)、非易失存儲器(例如，ROM、EEPROM、閃存等)、或兩者的某個組合。存儲器(1020)存儲實現(xiàn)所描述的快速WMV9/VC-9變換的軟件(1080)。
計算環(huán)境可以具有額外的特點。例如，計算環(huán)境(1000)包括存儲(1040)、一個或多個輸入設(shè)備(1050)、一個或多個輸出設(shè)備(1060)、以及一個或多個通信連接(1070)。諸如總線、控制器或網(wǎng)絡(luò)等互連機(jī)制(未示出)對計算環(huán)境(1000)的各個組件進(jìn)行互連。通常，操作系統(tǒng)軟件(未示出)為在計算環(huán)境(1000)中執(zhí)行的其它軟件提供操作環(huán)境，并協(xié)調(diào)計算環(huán)境(1000)的各個組件的活動。
存儲(1040)可以是可移動的或不可移動的，它包括磁盤、磁帶或盒式磁帶、CD-ROM、CD-RW、DVD、或可以被用來存儲信息并且可以在計算環(huán)境(1000)內(nèi)被存取的任何其它的介質(zhì)。存儲(1040)儲存用于實現(xiàn)生成并壓縮量化矩陣的音頻編碼器的軟件(1080)的指令。
(多個)輸入設(shè)備(1050)可以是觸摸式輸入設(shè)備(例如，鍵盤、鼠標(biāo)、筆或跟蹤球)、語音輸入設(shè)備、掃描設(shè)備、或為計算環(huán)境(1000)提供輸入的另一設(shè)備。對于音頻，(輸入)輸入設(shè)備(1050)可以是接受模擬或數(shù)字形式的音頻輸入的聲卡或類似的設(shè)備、或為計算環(huán)境提供音頻樣值的CD-ROM閱讀器。(多個)輸出設(shè)備(1060)可以是顯示器、打印機(jī)、揚(yáng)聲器、CD刻錄機(jī)、或提供來自計算環(huán)境(1000)的輸出的另一設(shè)備。
(多個)通信連接(1070)啟用通過通信介質(zhì)與另一計算實體的通信。通信介質(zhì)傳達(dá)信息(例如，計算機(jī)可執(zhí)行指令、被壓縮的音頻或視頻信息、或已調(diào)制數(shù)據(jù)信號中的其它數(shù)據(jù))。已調(diào)制數(shù)據(jù)信號是一種信號，其一個或多個特征按為該信號中的信息編碼的這樣一種方式來加以設(shè)置或更改。舉例來講(不作限制)，通信介質(zhì)包括利用電、光學(xué)、RF、紅外、聲學(xué)或其它載波來實現(xiàn)的有線或無線技術(shù)。
可以在計算機(jī)可讀介質(zhì)的一般上下文中描述本發(fā)明的變換和編碼/解碼技術(shù)。計算機(jī)可讀介質(zhì)是可以在計算環(huán)境內(nèi)被存取的任何可用介質(zhì)。舉例來講(不作限制)，對于計算環(huán)境(1000)，計算機(jī)可讀介質(zhì)包括存儲器(1020)、存儲(1040)、通信介質(zhì)、以及以上任何內(nèi)容的組合。
可以在諸如正在目標(biāo)真實或虛擬處理器上的計算環(huán)境中執(zhí)行的計算機(jī)可執(zhí)行指令(例如，程序模塊中所包括的指令)的一般上下文中描述本發(fā)明的快速WMV9/VC-9變換。通常，程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定的抽象數(shù)據(jù)類型的例程、程序、庫、對象、類、組件、數(shù)據(jù)結(jié)構(gòu)等。這些程序模塊的功能可以如各種實現(xiàn)例中所需的在各個程序模塊之間加以結(jié)合或分割?？梢栽诒镜鼗蚍植际接嬎悱h(huán)境內(nèi)執(zhí)行關(guān)于程序模塊的計算機(jī)可執(zhí)行指令。
為呈現(xiàn)起見，本詳細(xì)說明使用如同“確定”、“生成”、“調(diào)整”和“應(yīng)用”等術(shù)語來描述計算環(huán)境中的計算機(jī)操作。這些術(shù)語是對于計算機(jī)所執(zhí)行的操作的高級抽象概念，不應(yīng)該與人類執(zhí)行的動作混淆。對應(yīng)于這些術(shù)語的實際計算機(jī)操作根據(jù)實現(xiàn)而變化。
鑒于可以對其應(yīng)用本發(fā)明的原理的許多可能的實施例，將本發(fā)明要求保護(hù)為可以歸入所附權(quán)利要求書及其等效技術(shù)方案的范圍和精神以內(nèi)的所有這類實施例。
權(quán)利要求
1.一種方法，使用基于變換矩陣的塊維度中的至少一個內(nèi)的8點塊變換的快速變換實現(xiàn)來對二維塊中的媒體數(shù)據(jù)進(jìn)行變換編碼，所述變換矩陣被表示為T8=1212121212121212161594-4-9-15-16166-6-16-16-661615-4-16-99164-1512-12-121212-12-12129-16415-15-416-96-1616-6-616-1664-915-1616-159-4,]]>所述方法包括執(zhí)行一蝶式運(yùn)算的多個階段，所述蝶式運(yùn)算在空間域系數(shù)的8點集合與至少一個8點維度中的8點變換域系數(shù)之間進(jìn)行轉(zhuǎn)換，所述多個階段包括奇變換域系數(shù)，并執(zhí)行與矩陣的矩陣乘法。
2.一種提供媒體數(shù)據(jù)的變換編碼的媒體系統(tǒng)，其特征在于，包括前向變換階段，對于所述媒體數(shù)據(jù)的二維塊，它用于執(zhí)行所述塊的前向變換，以將所述塊轉(zhuǎn)換到變換域；量化階段，它用于量化所述變換域塊；解除量化階段，它用于對所述變換域塊解除量化；以及反變換階段，用于執(zhí)行所述變換域塊的反變換，以產(chǎn)生形式R=(Tn′·D·Tm)1024]]>的重建塊，其中，所述反變換的至少一個維度Tn或Tm是8點矩陣T8=1212121212121212161594-4-9-15-16166-6-16-16-661615-4-16-99164-1512-12-121212-12-12129-16415-15-416-96-1616-6-616-1664-915-1616-159-4,]]>所述反變換被實現(xiàn)為一連串蝶式運(yùn)算，以及與矩陣的矩陣乘法。
3.一種在其上攜帶用于實現(xiàn)一種方法的計算機(jī)可執(zhí)行軟件指令的計算機(jī)可讀介質(zhì)，所述方法使用基于變換矩陣的塊維度中的至少一個維度內(nèi)的8點塊變換的快速變換實現(xiàn)來對二維塊中的媒體數(shù)據(jù)進(jìn)行變換編碼，所述變換矩陣被表示為T8=1212121212121212161594-4-9-15-16166-6-16-16-661615-4-16-99164-1512-12-121212-12-12129-16415-15-416-96-1616-6-616-1664-915-1616-159-4,]]>所述方法包括執(zhí)行一蝶式運(yùn)算的多個階段，所述蝶式運(yùn)算在空間域系數(shù)的8點集合與所述至少一個8點維度中的8點變換域系數(shù)之間進(jìn)行轉(zhuǎn)換，所述多個階段包括奇變換域系數(shù)，并執(zhí)行與矩陣的矩陣乘法。
4.一種快速變換方法，用于變換空間域表示與變換域表示之間的圖像數(shù)據(jù)的二維塊，其中，所述塊的至少一個維度是8個點，對于前向變換，包括對變量0～7的集合執(zhí)行類型的一連串蝶式運(yùn)算，至少包括，變量0和7的蝶式運(yùn)算，其中，值c和s是1；變量1和6的蝶式運(yùn)算，其中，值c和s是1；變量2和5的蝶式運(yùn)算，其中，值c和s是1；變量3和4的蝶式運(yùn)算，其中，值c和s是1；變量0和3的蝶式運(yùn)算，其中，值c和s是1；變量1和2的蝶式運(yùn)算，其中，值c和s是1；變量0和1的蝶式運(yùn)算，其中，值c和s是1，按12來進(jìn)行比例縮放；變量3和2的蝶式運(yùn)算，其中，值c和s是16和6；變量4和7的蝶式運(yùn)算，其中，值c和s是4和1；變量5和6的蝶式運(yùn)算，其中，值c和s是5和3，隨后對變量6進(jìn)行求反；變量5和6的第二蝶式運(yùn)算，其中，值c和s是1；以及在變量5和6的第二蝶式運(yùn)算之前，執(zhí)行變量4和5以及變量7和6與矩陣的矩陣乘法；由此，變量0～3產(chǎn)生偶系數(shù)，并且，變量4～7產(chǎn)生該變換域內(nèi)的奇系數(shù)。
5.如權(quán)利要求4的快速變換方法，其特征在于，對于反變換，包括以前向變換的逆流執(zhí)行所述蝶式運(yùn)算的逆運(yùn)算。
6.一種快速變換方法，用于變換空間域表示與變換域表示之間的圖像數(shù)據(jù)的二維塊，其中，所述塊的至少一個維度是8個點，對于反變換，包括對變量0～7的集合執(zhí)行類型的一連串蝶式運(yùn)算，其中，變量0～3是偶變換系數(shù)，變量4～7是奇變換系數(shù)，至少包括，變量5和6的蝶式運(yùn)算，其中，值c和s是1；變量6和5的第二蝶式運(yùn)算，其中，值c和s是5和3，隨后對變量5進(jìn)行求反；變量4和7的蝶式運(yùn)算，其中，值c和s是4和1；變量0和1的蝶式運(yùn)算，其中，值c和s是1，按12來進(jìn)行比例縮放；變量3和2的蝶式運(yùn)算，其中，值c和s是16和6；變量1和2的蝶式運(yùn)算，其中，值c和s是1；變量0和3的蝶式運(yùn)算，其中，值c和s是1；變量3和4的蝶式運(yùn)算，其中，值c和s是1；變量2和5的蝶式運(yùn)算，其中，值c和s是1；變量1和6的蝶式運(yùn)算，其中，值c和s是1；變量0和7的蝶式運(yùn)算，其中，值c和s是1；以及在變量5和6的第二蝶式運(yùn)算之前，執(zhí)行變量4和5以及變量7和6與矩陣的矩陣乘法。
7.一種快速變換方法，用于變換空間域表示與變換域表示之間的圖像數(shù)據(jù)的二維塊，其中，所述塊的至少一個維度是8個點，對于反變換，包括對變量0～7的集合執(zhí)行類型的一連串蝶式運(yùn)算，其中，變量0～3是偶變換系數(shù)，變量4～7是奇變換系數(shù)，至少包括變量5和6的蝶式運(yùn)算，其中，值c和s是5和3，隨后對變量6進(jìn)行求反；變量4和7的蝶式運(yùn)算，其中，值c和s是4和1；變量5和6的第二蝶式運(yùn)算，其中，值c和s是1；變量0和1的蝶式運(yùn)算，其中，值c和s是1，按12來進(jìn)行比例縮放；變量3和2的蝶式運(yùn)算，其中，值c和s是16和6；變量1和2的蝶式運(yùn)算，其中，值c和s是1；變量0和3的蝶式運(yùn)算，其中，值c和s是1；變量3和4的蝶式運(yùn)算，其中，值c和s是1；變量2和5的蝶式運(yùn)算，其中，值c和s是1；變量1和6的蝶式運(yùn)算，其中，值c和s是1；變量0和7的蝶式運(yùn)算，其中，值c和s是1；以及在變量4和7的蝶式運(yùn)算之后和在變量5和6的第二蝶式運(yùn)算之前，執(zhí)行變量4和5以及變量7和6與矩陣的矩陣乘法。
8.如權(quán)利要求7所述的快速變換方法，其特征在于，對于前向變換，包括以所述前向變換的逆向流執(zhí)行所述蝶式運(yùn)算的逆運(yùn)算。
9.一種快速變換方法，用于變換空間域表示與變換域表示之間的圖像數(shù)據(jù)的二維塊，其中，所述塊的至少一個維度是8個點，對于前向變換，包括對變量0～7的集合執(zhí)行類型的一連串蝶式運(yùn)算，至少包括，變量0和7的蝶式運(yùn)算，其中，值c和s是1；變量1和6的蝶式運(yùn)算，其中，值c和s是1；變量2和5的蝶式運(yùn)算，其中，值c和s是1；變量3和4的蝶式運(yùn)算，其中，值c和s是1；變量0和3的蝶式運(yùn)算，其中，值c和s是1；變量1和2的蝶式運(yùn)算，其中，值c和s是1；變量0和1的蝶式運(yùn)算，其中，值c和s是1，按12來進(jìn)行比例縮放；變量3和2的蝶式運(yùn)算，其中，值c和s是16和6；變量5和6的第一蝶式運(yùn)算，其中，值c和s是1；變量4和7的蝶式運(yùn)算，其中，值c和s是4和1；變量6和5的第二蝶式運(yùn)算，其中，值c和s是5和3，隨后對變量5進(jìn)行求反；以及在變量5和6的第一蝶式運(yùn)算之后和在變量4和7的蝶式運(yùn)算之前，執(zhí)行變量4和5以及變量7和6與矩陣的矩陣乘法；由此，變量0～3產(chǎn)生偶系數(shù)，并且，變量4～7產(chǎn)生變換域內(nèi)的奇系數(shù)。
10.一種用于執(zhí)行二維媒體塊的基于變換的壓縮/解壓的二維媒體壓縮處理器，其中，所述塊的至少一個8點維度中的變換基于變換矩陣T8=1212121212121212161594-4-9-15-16166-6-16-16-661615-4-16-99164-1512-12-121212-12-12129-16415-15-416-96-1616-6-616-1664-915-1616-159-4]]>所述處理器包括用于對變量0～7的集合執(zhí)行類型的一連串蝶式運(yùn)算的裝置，其中，變量0～3是偶變換系數(shù)，變量4～7是奇變換系數(shù)，至少包括，變量0和7的蝶式運(yùn)算，其中，值c和s是1；變量1和6的蝶式運(yùn)算，其中，值c和s是1；變量2和5的蝶式運(yùn)算，其中，值c和s是1；變量3和4的蝶式運(yùn)算，其中，值c和s是1；變量0和3的蝶式運(yùn)算，其中，值c和s是1；變量1和2的蝶式運(yùn)算，其中，值c和s是1；變量0和1的蝶式運(yùn)算，其中，值c和s是1，按12來進(jìn)行比例縮放；變量3和2的蝶式運(yùn)算，其中，值c和s是16和6；變量4和7的蝶式運(yùn)算，其中，值c和s是4和1；變量5和6的蝶式運(yùn)算，其中，值c和s是5和3，隨后對變量6進(jìn)行求反；變量5和6的第二蝶式運(yùn)算，其中，值c和s是1；以及用于在變量5和6的第二蝶式運(yùn)算之前執(zhí)行變量4和5以及變量7和6與矩陣的矩陣乘法的裝置。
11.一種用于執(zhí)行二維媒體塊的基于變換的壓縮/解壓的二維媒體壓縮處理器，其中，所述塊的至少一個8點維度中的變換基于變換矩陣T8=1212121212121212161594-4-9-15-16166-6-16-16-661615-4-16-99164-1512-12-121212-12-12129-16415-15-416-96-1616-6-616-1664-915-1616-159-4,]]>所述處理器包括用于對變量0～7的集合執(zhí)行類型的一連串蝶式運(yùn)算的裝置，其中，變量0～3是偶變換系數(shù)，變量4～7是奇變換系數(shù)，至少包括，變量5和6的蝶式運(yùn)算，其中，值c和s是1；變量6和5的第二蝶式運(yùn)算，其中，值c和s是5和3，隨后對變量5進(jìn)行求反；變量4和7的蝶式運(yùn)算，其中，值c和s是4和1；變量0和1的蝶式運(yùn)算，其中，值c和s是1，按12來進(jìn)行比例縮放；變量3和2的蝶式運(yùn)算，其中，值c和s是16和6；變量1和2的蝶式運(yùn)算，其中，值c和s是1；變量0和3的蝶式運(yùn)算，其中，值c和s是1；變量3和4的蝶式運(yùn)算，其中，值c和s是1；變量2和5的蝶式運(yùn)算，其中，值c和s是1；變量1和6的蝶式運(yùn)算，其中，值c和s是1；變量0和7的蝶式運(yùn)算，其中，值c和s是1；以及用于在變量5和6的第二蝶式運(yùn)算之前執(zhí)行變量4和5以及變量7和6與矩陣的矩陣乘法的裝置。
12.一種用于執(zhí)行二維媒體塊的基于變換的壓縮/解壓的二維媒體壓縮處理器，其中，所述塊的至少一個8點維度中的變換基于變換矩陣T8=1212121212121212161594-4-9-15-16166-6-16-16-661615-4-16-99164-1512-12-121212-12-12129-16415-15-416-96-1616-6-616-1664-915-1616-159-4,]]>所述處理器包括用于對變量0～7的集合執(zhí)行類型的一連串蝶式運(yùn)算的裝置，其中，變量0～3是偶變換系數(shù)，變量4～7是奇變換系數(shù)，至少包括，變量5和6的蝶式運(yùn)算，其中，值c和s是5和3，隨后對變量6進(jìn)行求反；變量4和7的蝶式運(yùn)算，其中，值c和s是4和1；變量5和6的第二蝶式運(yùn)算，其中，值c和s是1；變量0和1的蝶式運(yùn)算，其中，值c和s是1，按12來進(jìn)行比例縮放；變量3和2的蝶式運(yùn)算，其中，值c和s是16和6；變量1和2的蝶式運(yùn)算，其中，值c和s是1；變量0和3的蝶式運(yùn)算，其中，值c和s是1；變量3和4的蝶式運(yùn)算，其中，值c和s是1；變量2和5的蝶式運(yùn)算，其中，值c和s是1；變量1和6的蝶式運(yùn)算，其中，值c和s是1；變量0和7的蝶式運(yùn)算，其中，值c和s是1；以及用于在變量4和7的蝶式運(yùn)算之后和在變量5和6的第二蝶式運(yùn)算之前執(zhí)行變量4和5以及變量7和6與矩陣的矩陣乘法的裝置。
13.一種用于執(zhí)行二維媒體塊的基于變換的壓縮/解壓的二維媒體壓縮處理器，其中，所述塊的至少一個8點維度中的變換基于變換矩陣T8=1212121212121212161594-4-9-15-16166-6-16-16-661615-4-16-99164-1512-12-121212-12-12129-16415-15-416-96-1616-6-616-1664-915-1616-159-4,]]>所述處理器包括用于對變量0～7的集合執(zhí)行類型的一連串蝶式運(yùn)算的裝置，其中，變量0～3是偶變換系數(shù)，變量4～7是奇變換系數(shù)，至少包括，變量0和7的蝶式運(yùn)算，其中，值c和s是1；變量1和6的蝶式運(yùn)算，其中，值c和s是1；變量2和5的蝶式運(yùn)算，其中，值c和s是1；變量3和4的蝶式運(yùn)算，其中，值c和s是1；變量0和3的蝶式運(yùn)算，其中，值c和s是1；變量1和2的蝶式運(yùn)算，其中，值c和s是1；變量0和1的蝶式運(yùn)算，其中，值c和s是1，按12來進(jìn)行比例縮放；變量3和2的蝶式運(yùn)算，其中，值c和s是16和6；變量5和6的第一蝶式運(yùn)算，其中，值c和s是1；變量4和7的蝶式運(yùn)算，其中，值c和s是4和1；變量6和5的第二蝶式運(yùn)算，其中，值c和s是5和3，隨后對變量5進(jìn)行求反；以及用于在變量5和6的第一蝶式運(yùn)算之后和在變量4和7的蝶式運(yùn)算之前執(zhí)行變量4和5以及變量7和6與矩陣的矩陣乘法的裝置。
全文摘要
使用一連串蝶式運(yùn)算和矩陣乘法，來實現(xiàn)8點WMV9/VC－9變換的快速實現(xiàn)。通過以逆向流應(yīng)用蝶式運(yùn)算的逆運(yùn)算以及矩陣乘法可實現(xiàn)反變換的快速實現(xiàn)。這些快速實現(xiàn)許可或者在兩個維度的過濾結(jié)束時的變換階段、或者分開地在每個階段并入比例縮放。該變換的快速實現(xiàn)可以被用于基于圖像壓縮與其它信號處理系統(tǒng)內(nèi)的這個變換的編碼器和解碼器中。
文檔編號H04N7/30GK1697328SQ20051006889
公開日2005年11月16日申請日期2005年5月13日優(yōu)先權(quán)日2004年5月14日
發(fā)明者S·斯里尼瓦桑, J·梁申請人:微軟公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：Ｓ.斯里尼瓦桑;Ｊ.梁
技術(shù)所有人：微軟公司
我是此專利的發(fā)明人

上一篇：用于數(shù)字圖像的自動化校正的系統(tǒng)和方法
上一篇：用于移動通訊裝置中的體溫測量模組的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機(jī)構(gòu)動力學(xué)與控制
5、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

asn1編解碼實現(xiàn)方法相關(guān)技術(shù)

h265編解碼實現(xiàn)相關(guān)技術(shù)

c語言url編解碼實現(xiàn)相關(guān)技術(shù)

小波變換c語言實現(xiàn)相關(guān)技術(shù)

matlab實現(xiàn)傅里葉變換相關(guān)技術(shù)

matlab實現(xiàn)小波變換相關(guān)技術(shù)

hilbert變換c語言實現(xiàn)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

快速視頻編解碼變換實現(xiàn)的制作方法