用于基于小波的編碼中的運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間濾波的既有被濾波區(qū)域又有未濾波區(qū)域的l幀的制作方法

文檔序號(hào)：7871145閱讀：225來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：用于基于小波的編碼中的運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間濾波的既有被濾波區(qū)域又有未濾波區(qū)域的l幀的制作方法
技術(shù)領(lǐng)域：
本發(fā)明要求美國(guó)臨時(shí)申請(qǐng)序列號(hào)60/395,921的權(quán)益，該申請(qǐng)?zhí)峤蝗諡?002年7月15日，特此引用其教導(dǎo)作為參考。
本發(fā)明總體涉及視頻壓縮，更具體來(lái)說(shuō)，涉及利用產(chǎn)生既有被濾波區(qū)域又有未濾波區(qū)域的L幀的運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間濾波的基于小波(wavelet)的編碼。
許多當(dāng)前的視頻編碼算法以運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)測(cè)編碼為基礎(chǔ)，這些算法被認(rèn)為是混合方案。在這種混合方案中，時(shí)間冗余是利用運(yùn)動(dòng)補(bǔ)償來(lái)減少的，而空間冗余則是通過(guò)變換編碼運(yùn)動(dòng)補(bǔ)償?shù)臍堄喽鴾p少的。一般使用的變換包括離散余弦變換(DCT)或子帶/小波分解。然而這種方案在提供真正可縮放的(scalable)比特流方面缺少靈活性。
另一類被稱為基于3D子帶/小波(以下稱為“3D小波”)編碼的方案，特別在當(dāng)前通過(guò)異類網(wǎng)絡(luò)的視頻傳輸?shù)那闆r中已經(jīng)得到流行。這些方案在這種應(yīng)用中是合乎需要的，因?yàn)樘峁┓浅ｌ`活的可縮放比特流和更高的錯(cuò)誤復(fù)原能力(error resilience)。在3D小波編碼中，整個(gè)幀被一次性變換，而不是如基于DCT的編碼中那樣被逐塊地變換。
3D小波方案的一個(gè)組成部分是運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間濾波(MCTF)，進(jìn)行運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間濾波是為了減少時(shí)間冗余。在標(biāo)題為″Motion-Compensated 3-D Subband Coding of Video(對(duì)視頻的運(yùn)動(dòng)補(bǔ)償?shù)?D子帶編碼)″(IEEE Transactions On Image Processing，Volume 8，No.2，1999年2月，作者Seung-Jong Choi和John Woods)的文章中描述了MCTF的一個(gè)例子，以下簡(jiǎn)稱該文為″Woods″。
在Woods中，在進(jìn)行空間分解之前，在運(yùn)動(dòng)的方向上對(duì)幀進(jìn)行時(shí)間上的濾波。在時(shí)間濾波期間，由于場(chǎng)景中的運(yùn)動(dòng)的性質(zhì)和對(duì)象的覆蓋/暴露(covering/uncovering)，有些像素或者不被參考或者被多次參考。這種像素被稱為不連接的(unconnected)像素，并且需要特殊的處理，這導(dǎo)致降低的編碼效率。

圖1中顯示了取自Woods中的不連接的和連接的像素的例子。
本發(fā)明涉及一種用于編碼視頻的方法和裝置。按照本發(fā)明，將第一幀中的第一區(qū)域與第二幀中的第二區(qū)域匹配。生成一個(gè)包括第一與第二區(qū)域的像素值之間的差的第一部分編碼的幀。生成一個(gè)包括或者第一區(qū)域或者第二區(qū)域的像素值的第二部分編碼的幀。此外，將第一和第二部分編碼的幀變換成小波系數(shù)。
在一個(gè)例子中，如果第一和第二區(qū)域之間的匹配的質(zhì)量高于預(yù)定的閾值，則生成包括或者第一區(qū)域或者第二區(qū)域的像素值的第二部分編碼的幀。在另一個(gè)例子中，如果用來(lái)編碼第二部分解碼的幀的比特的個(gè)數(shù)小于將第一和第二區(qū)域的像素值的平均包括在第二部分編碼的幀中的的情況，則產(chǎn)生包括或者第一區(qū)域或者第二區(qū)域的像素值的第二部分編碼的幀。
本發(fā)明涉及一種解碼一個(gè)比特流的方法和裝置。按照本發(fā)明，該比特流被熵解碼以便生成小波系數(shù)。
小波系數(shù)被變換成包括一個(gè)被濾波區(qū)域的第一部分解碼的幀和包括一個(gè)未濾波區(qū)域的第二部分解碼的幀。生成包括通過(guò)或者加法或者減法而組合的被濾波區(qū)域和未濾波區(qū)域的像素值的第一幀。此外，生成包括未濾波區(qū)域的像素值的第二幀。
現(xiàn)在參看附圖，附圖中同樣的附圖標(biāo)記始終代表對(duì)應(yīng)的部件。
圖1是表示一個(gè)已知的運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間濾波技術(shù)的各方面的圖示；圖2是表示按照本發(fā)明的時(shí)間濾波的一個(gè)例子的圖示；圖3是按照本發(fā)明的編碼器的一個(gè)例子的框圖；圖4是表示2D小波變換的一個(gè)例子的框圖；圖5是按照本發(fā)明的解碼器的一個(gè)例子的框圖；以及圖6是按照本發(fā)明的系統(tǒng)的一個(gè)例子。
如前文所述，3D小波方案的一個(gè)組成部分是運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間濾波(MCTF)，執(zhí)行運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間濾波是為了減少時(shí)間冗余。在常規(guī)的MCTF中，幀是成對(duì)地被濾波的。特別地，利用如下所示的匹配每對(duì)幀中的相似區(qū)域的運(yùn)動(dòng)矢量(Vy，Vx)，每對(duì)幀(A，B)被濾波成L和H幀
L(y+vy，x+vx)＝c1(A(y+vy，x+vx)+B(y，x))(1)H(y，x)＝c2(B(y，x)-A(y+vy，x+vx)) (2)在等式1中，L對(duì)應(yīng)于每對(duì)的經(jīng)縮放的平均，c1代表縮放因子。在等式2中，H對(duì)應(yīng)于每對(duì)的經(jīng)縮放的差，c2代表縮放因子。由于L幀代表按時(shí)間平均的幀，一般來(lái)說(shuō)，只有在視頻以較低的幀速率被解碼時(shí)，才顯示L幀。因此，L幀應(yīng)當(dāng)質(zhì)量好，因?yàn)樵诮獯a的L幀中產(chǎn)生的任何偽像(artifacts)都可能導(dǎo)致在較低幀速率下不良的視頻質(zhì)量。
當(dāng)運(yùn)動(dòng)估計(jì)的質(zhì)量良好時(shí)(即找到好的匹配時(shí))，L幀的質(zhì)量一般相當(dāng)好。然而，有在視頻序列中對(duì)于兩個(gè)幀之間的區(qū)域可能找不到良好的匹配的情況。這種情況包括場(chǎng)景變化、快速運(yùn)動(dòng)或在特定場(chǎng)景中的對(duì)象的遮蓋和暴露。因此，按照本發(fā)明，對(duì)應(yīng)于不良匹配的L幀的部分不被濾波，它們被定義為A區(qū)域。即使不能找到良好的匹配，這也使這些區(qū)域的視覺質(zhì)量能不受影響。此外，通過(guò)不在不良匹配的區(qū)域上進(jìn)行濾波而可以改善編碼效率也是有可能的。
圖2中表示按照本發(fā)明的時(shí)間濾波的一個(gè)例子。
在這個(gè)例子中，兩個(gè)區(qū)域(有陰影的)被顯示為被濾波，以便產(chǎn)生L和H區(qū)域。此外，兩個(gè)其它區(qū)域(沒有陰影的)被顯示為被濾波，以便產(chǎn)生A和H區(qū)域。如前文所述的那樣，A區(qū)域是一個(gè)幀的未濾波的一部分。由于在濾波期間L區(qū)域被縮放，也可能需要縮放未濾波的區(qū)域，以便具有相同的大小。A區(qū)域的這個(gè)縮放，可以以下式表達(dá)L(y+vy，x+vx)＝c3(A(y+vy，x+vx)) (3)圖3中表示一個(gè)按照本發(fā)明的編碼器的例子。圖中可見，編碼器包括一個(gè)分割單元2，用于把輸入視頻劃分成被作為一個(gè)單元編碼的畫面組(GOP)。按照本發(fā)明，分割單元2進(jìn)行操作，以使得GOP包括一個(gè)預(yù)定數(shù)目的幀，或者在操作期間根據(jù)諸如帶寬、編碼效率和視頻內(nèi)容之類的參數(shù)被動(dòng)態(tài)地確定。例如，如果視頻由快速場(chǎng)景變化和高度運(yùn)動(dòng)組成，則有一個(gè)較短的GOP是更高效的，而如果視頻大部分由靜止的對(duì)象組成，則有一個(gè)較長(zhǎng)的GOP是更高效的。
圖中可見，所包括的MCTF單元4由運(yùn)動(dòng)估計(jì)單元6和時(shí)間濾波單元8組成。在操作期間，每個(gè)GOP的幀將成對(duì)地被處理，其中每一對(duì)包括一個(gè)源幀和一個(gè)參考幀。這樣，運(yùn)動(dòng)估計(jì)單元6將對(duì)每個(gè)源幀中的區(qū)域與每個(gè)參考幀中的相似的區(qū)域進(jìn)行匹配。在一個(gè)例子中，運(yùn)動(dòng)估計(jì)單元6將進(jìn)行后向預(yù)測(cè)。因此在這個(gè)例子中，源幀將是較晚的幀，參考幀將是較早的幀。在另一個(gè)例子中，運(yùn)動(dòng)估計(jì)單元6將進(jìn)行前向預(yù)測(cè)。因此在這個(gè)例子中，源幀將是較早的幀，參考幀將是較晚的幀。作為上述的匹配的結(jié)果，運(yùn)動(dòng)估計(jì)單元6將為正被處理的當(dāng)前幀中的每個(gè)被匹配區(qū)域提供一個(gè)運(yùn)動(dòng)矢量MV和一個(gè)幀號(hào)。
在操作期間，時(shí)間濾波單元8去除每個(gè)幀對(duì)之間的時(shí)間冗余。為了執(zhí)行這個(gè)操作，時(shí)間濾波單元8按照由運(yùn)動(dòng)估計(jì)單元6提供的運(yùn)動(dòng)矢量和幀參考號(hào)為每個(gè)幀對(duì)檢索兩個(gè)對(duì)應(yīng)的被匹配區(qū)域。時(shí)間濾波單元8然后將為正被處理的每個(gè)幀對(duì)產(chǎn)生一個(gè)L和H幀。
為了產(chǎn)生H幀，時(shí)間濾波單元8計(jì)算每個(gè)幀對(duì)的兩個(gè)相應(yīng)的被匹配區(qū)域中的每一個(gè)的像素值之間的差。優(yōu)選地，然后將該差乘以一個(gè)縮放因子。合適的縮放因子的例子包括2的平方根的倒數(shù)(1/√2)。
為了產(chǎn)生L幀，時(shí)間濾波單元8將為每個(gè)幀對(duì)中的兩個(gè)相應(yīng)的被匹配區(qū)域中的每一個(gè)確定其應(yīng)當(dāng)是未濾波的A區(qū)域，還是應(yīng)當(dāng)作為L(zhǎng)區(qū)域被濾波。對(duì)于被確定是L區(qū)域的兩個(gè)相應(yīng)的被匹配區(qū)域中的每一個(gè)，時(shí)間濾波單元8計(jì)算該兩個(gè)區(qū)域的像素值的平均值。優(yōu)選地，然后將該平均值乘以一個(gè)縮放因子。合適的縮放因子的例子包括2的平方根(√2)。
對(duì)于被確定是A區(qū)域的兩個(gè)相應(yīng)的被匹配區(qū)域中的每一個(gè)，時(shí)間濾波單元8將選擇要被包含在每個(gè)L幀中的該兩個(gè)區(qū)域的其中之一的像素值。優(yōu)選地，時(shí)間濾波單元8將從參考幀中選擇該區(qū)域。然而，按照本發(fā)明，也可以從源幀中選擇該區(qū)域。為了確保正確的解碼，可能有必要向解碼器指出每個(gè)A區(qū)域究竟是從參考幀中還是從源幀中選擇的。這可以通過(guò)與每個(gè)L幀相關(guān)聯(lián)的某種標(biāo)志或報(bào)頭來(lái)完成。此外，優(yōu)選地也將所選擇的區(qū)域乘以一個(gè)縮放因子。合適的縮放因子的例子包括2的平方根的倒數(shù)(1/√2)。
如上所述，時(shí)間濾波單元8將為每個(gè)幀對(duì)中的兩個(gè)相應(yīng)的被匹配區(qū)域中的每一個(gè)確定究竟應(yīng)當(dāng)是未濾波的A區(qū)域，還是應(yīng)當(dāng)作為L(zhǎng)區(qū)域而被濾波。按照本發(fā)明，這可以以許多不同方式進(jìn)行。在一個(gè)實(shí)施例中，這將根據(jù)兩個(gè)對(duì)應(yīng)區(qū)域之間的匹配質(zhì)量而確定。匹配質(zhì)量可以通過(guò)使用一個(gè)匹配質(zhì)量指標(biāo)(indication)而確定。合適的匹配質(zhì)量指標(biāo)標(biāo)包括兩個(gè)相應(yīng)的被匹配區(qū)域之間的平均絕對(duì)差(MAD)或均方差(MSE)。兩個(gè)N×N區(qū)域xij和yij之間的MAD是由絕對(duì)像素差的平均計(jì)算的，如下式所示MAD=1N2&Sum;i=1N&Sum;j=1N|xij-yij|---(4)]]>按照等式4，MAD越小，意味著兩個(gè)區(qū)域之間的差越小，并且可以推斷這兩個(gè)區(qū)域是更好地匹配的。這個(gè)值是序列相關(guān)的，低的運(yùn)動(dòng)序列平均來(lái)說(shuō)具有更小的MAD值，高的運(yùn)動(dòng)序列具有更大的平均MAD。平均起來(lái)，一個(gè)相當(dāng)優(yōu)良質(zhì)量的匹配具有小于五(5)的MAD值。因此，可以用這個(gè)閾值來(lái)確定兩個(gè)相應(yīng)的被匹配區(qū)域中的每一個(gè)是否是個(gè)良好的匹配。如果MAD值小于五(5)，則這兩個(gè)特定的相應(yīng)的被匹配區(qū)域?qū)⒈蛔鳛長(zhǎng)區(qū)域?yàn)V波。如果MAD值大于這個(gè)閾值，則這兩個(gè)特定的被匹配區(qū)域?qū)⒆鳛锳區(qū)域而不被濾波。
在另一個(gè)例子中，將根據(jù)編碼L幀所用的比特的數(shù)目來(lái)確定兩個(gè)相應(yīng)的被匹配區(qū)域中的每一個(gè)究竟應(yīng)當(dāng)是A區(qū)域還是應(yīng)當(dāng)作為L(zhǎng)區(qū)域而被濾波。特別地，對(duì)于兩個(gè)相應(yīng)的被匹配區(qū)域中的每一個(gè)，將計(jì)算帶有以及不帶有A區(qū)域時(shí)編碼每個(gè)L幀所需的比特的數(shù)目。如果帶有A區(qū)域時(shí)比特的數(shù)目較小，則這兩個(gè)特定的相應(yīng)的被匹配區(qū)域?qū)⒆鳛锳區(qū)域而不被濾波。如果帶有A區(qū)域時(shí)比特的數(shù)目并非較小，則這兩個(gè)特定的相應(yīng)的被匹配區(qū)域?qū)⒆鳛長(zhǎng)區(qū)域而被濾波。在這個(gè)例子中，可以提高編碼效率。
編碼L幀所需的比特的數(shù)目，可能受到所用的特定熵編碼技術(shù)的影響。例如，嵌入式零樹塊編碼(the embedded zerotree block coding(EZBC))技術(shù)，是用于基于小波的視頻編碼器的更流行的熵編碼技術(shù)的一種。這樣的方案的特點(diǎn)之一是，與具有展開的數(shù)據(jù)的區(qū)域相對(duì)比，這種方案編碼帶有局部化的數(shù)據(jù)的區(qū)域需要更少的比特。如果(時(shí)間濾波和空間分解之后的)變換的系數(shù)是非常群集的(clustered)，并且許多大區(qū)域具有很少的非零系數(shù)，則EZBC需要較少的比特來(lái)壓縮數(shù)據(jù)。另一方面，如果系數(shù)更展開，則EZBC需要更多的比特。因此，對(duì)于兩個(gè)相應(yīng)的被匹配區(qū)域中的每一個(gè)究竟是作為A區(qū)域而不被濾波還是作為L(zhǎng)區(qū)域而被濾波的確定，要根據(jù)所用的熵編碼技術(shù)而定。
上述的MCTF也可產(chǎn)生不連接的像素。因此，時(shí)間濾波單元8將處理這些不連接的像素，如Woods中所述的那樣。
圖中可見，包括一個(gè)空間分解單元10，用于減少由MCTF單元4所提供的幀中的空間冗余。在操作期間，按照2D小波變換，將從MCTF單元4接收的幀被變換成小波系數(shù)。有許多不同類型的濾波器和小波變換的實(shí)現(xiàn)方式。
圖4中表示一個(gè)合適的2D小波變換的例子。圖中可見，一個(gè)幀被用小波變換分解成低頻和高頻子帶。由于這是一個(gè)2D變換，因此有三個(gè)高頻子帶(橫向、縱向、對(duì)角)。低頻子帶被標(biāo)記為L(zhǎng)L子帶(橫向和縱向頻率二者都低)。這些高頻子帶被標(biāo)記為L(zhǎng)H、HL和HH，對(duì)應(yīng)于橫向高頻、縱向高頻以及橫向和縱向高頻。低頻子帶可以進(jìn)一步被遞歸地分解。在圖3中，WT代表小波變換。在Stephane Mallat所著的名為″A Wavelet Tour of Signal Processing(信號(hào)處理的小波導(dǎo)引)″(Academic Press，1997)一書中有對(duì)其它著名的小波變換方案的描述。
回頭參看圖3，編碼器也可包括一個(gè)重要性(significance)編碼單元12，用來(lái)按照重要性信息編碼空間分解單元10的輸出。在這個(gè)例子中，重要性的意思可以是小波系數(shù)的大小，其中較大的系數(shù)比較小的系數(shù)更重要。在這個(gè)例子中，重要性編碼單元10將察看從空間分解單元10接收的小波系數(shù)，然后按照大小對(duì)小波系數(shù)重新排序。因此，最大的小波系數(shù)將被首先發(fā)送。重要性編碼的一個(gè)例子是分級(jí)樹中的集合分割(Set Partitioning in Hierarchical Trees，即SPIHT)。這在名為″A New Fast and Efficient Image Codec Based on SetPartitioning in Hierarchical Tress(基于分級(jí)樹中的集合分割的一種新的快速高效的圖像編解碼器)″(作者A.Said和W.Pearlman，IEEETransactions on Circuits and Systems for Video Technology，vol.6，1996年6月)的文章中有描述。
如圖3中可見，圖中包括的虛線用來(lái)指示一些操作之間的依賴關(guān)系。在一個(gè)例子中，運(yùn)動(dòng)估計(jì)6依賴于重要性編碼12的性質(zhì)。例如，由運(yùn)動(dòng)估計(jì)所產(chǎn)生的運(yùn)動(dòng)矢量，可被用來(lái)確定小波系數(shù)的哪些是更重要的。在另一個(gè)例子中，空間分解10也可能依賴于重要性編碼12的類型。例如，小波分解的層數(shù)可能與重要系數(shù)的個(gè)數(shù)有關(guān)。
如圖進(jìn)一步可見，包括一個(gè)熵編碼單元14，用來(lái)產(chǎn)生輸出比特流。在操作期間，采用熵編碼技術(shù)把小波系數(shù)編碼成輸出比特流。熵編碼技術(shù)也被應(yīng)用于由運(yùn)動(dòng)估計(jì)單元6提供的運(yùn)動(dòng)矢量和幀號(hào)。這個(gè)信息被包括在輸出比特流中，以便能夠進(jìn)行解碼。合適的熵編碼技術(shù)的例子包括可變長(zhǎng)度編碼和算術(shù)編碼。
圖5中表示按照本發(fā)明的解碼器的一個(gè)例子。如前文關(guān)于圖3所述的那樣，輸入視頻被劃分成GOP，每個(gè)GOP被作為一個(gè)單元編碼。因此，輸入比特流可包括一個(gè)或多個(gè)也將作為一個(gè)單元解碼的GOP。比特流將也包括對(duì)應(yīng)于先前被運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間濾波的GOP中的每個(gè)幀的若干個(gè)運(yùn)動(dòng)矢量MV和幀號(hào)。
圖中可見，解碼器包括一個(gè)熵解碼單元16，用于解碼輸入的比特流。在操作期間，將按照在編碼側(cè)所執(zhí)行的熵編碼技術(shù)的逆技術(shù)(inverse)對(duì)輸入比特流解碼。這個(gè)熵解碼將產(chǎn)生對(duì)應(yīng)于每個(gè)GOP的小波系數(shù)。此外，熵解碼還產(chǎn)生將在以后被使用的若干個(gè)運(yùn)動(dòng)矢量和幀號(hào)。還包括一個(gè)重要性解碼單元18，以便按照重要性信息解碼來(lái)自熵解碼單元16的小波系數(shù)。因此，在操作期間，通過(guò)使用在編碼器側(cè)所使用的技術(shù)的逆技術(shù)，小波系數(shù)將被按照正確的空間順序排序。
圖中進(jìn)一步可見，包括一個(gè)空間重組單元20，用于把來(lái)自重要性解碼單元18的小波系數(shù)變換成部分解碼的幀。在操作期間，將按照在編碼器側(cè)所執(zhí)行的2D小波變換的逆變換，對(duì)對(duì)應(yīng)于每個(gè)GOP的小波系數(shù)進(jìn)行變換。這將產(chǎn)生已經(jīng)按照本發(fā)明被運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間濾波的部分解碼的幀。如前文所述的那樣，運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間濾波為所處理的每個(gè)幀對(duì)產(chǎn)生一對(duì)H和L幀。此外，如前文所述的那樣，按照本發(fā)明，L幀既可包括不濾波的A區(qū)域，又可包括濾波的L區(qū)域。
包括了一個(gè)逆時(shí)間濾波單元22，以便用來(lái)重構(gòu)來(lái)自空間重組單元20的部分解碼的幀。在操作期間，逆時(shí)間濾波單元22如下地處理包含在每個(gè)GOP中的每對(duì)H和L幀。首先，按照由熵解碼單元16所提供的運(yùn)動(dòng)矢量和幀號(hào)，檢索每對(duì)H和L幀中的對(duì)應(yīng)區(qū)域。按照本發(fā)明，所檢索的對(duì)應(yīng)區(qū)域中的每一個(gè)將包括一個(gè)來(lái)自L幀的L區(qū)域或A區(qū)域和一個(gè)來(lái)自H幀的區(qū)域。如前文所述，A區(qū)域代表一個(gè)幀對(duì)之間的兩個(gè)對(duì)應(yīng)的被匹配區(qū)域之一的未濾波的像素值，L區(qū)域代表兩個(gè)對(duì)應(yīng)的被匹配區(qū)域的像素值的平均，來(lái)自H幀中的區(qū)域代表兩個(gè)對(duì)應(yīng)的被匹配區(qū)域之間的差。此外，被檢索的對(duì)應(yīng)區(qū)域中的每一個(gè)都被除以在編碼器側(cè)所使用的縮放因子。
對(duì)于L幀中所包含的每個(gè)L-區(qū)域，計(jì)算每個(gè)L區(qū)域與H幀中的對(duì)應(yīng)區(qū)域的像素值的和與差。然后將每個(gè)和與差除以另一個(gè)縮放因子。合適的縮放因子的一個(gè)例子是值二(2)。然后將每個(gè)經(jīng)縮放的和與差置于適當(dāng)?shù)闹貥?gòu)幀中。
對(duì)于L幀中所包含的每個(gè)A區(qū)域，如上文所述的那樣，A區(qū)域在被初始縮放之后將被不加改變地傳送到合適的重構(gòu)幀。如前文所述的那樣，每個(gè)L幀可以有一個(gè)相關(guān)聯(lián)的、表明特定A區(qū)域是從一個(gè)參考幀還是從一個(gè)源幀中選擇的報(bào)頭或標(biāo)志。因此，可以按照相關(guān)聯(lián)的報(bào)頭或標(biāo)志中的信息將每個(gè)A區(qū)域置于適當(dāng)?shù)闹貥?gòu)幀中?；蛘?，可以按照一個(gè)預(yù)定的約定將A區(qū)域置于適當(dāng)?shù)闹貥?gòu)幀中。例如，可能決定對(duì)于整個(gè)視頻序列從參考幀中選擇所有的A區(qū)域。
此外，也將把每個(gè)A區(qū)域的像素值與來(lái)自H幀中的對(duì)應(yīng)區(qū)域的像素值組合。按照本發(fā)明，可以通過(guò)加法或者減法來(lái)組合這些像素值。例如，如果在編碼器側(cè)采用后向預(yù)測(cè)，且A區(qū)域源自參考幀，則減法可能是更優(yōu)選的?；蛘撸绻诰幋a器側(cè)采用后向預(yù)測(cè)，且A區(qū)域源自源幀，則加法可能是更優(yōu)選的。從組合A區(qū)域與H幀中的區(qū)域?qū)С龅闹抵械拿恳粋€(gè)然后被置于適當(dāng)?shù)闹貥?gòu)幀中。
圖6示出了可以在其中實(shí)現(xiàn)按照本發(fā)明的基于小波的編碼的系統(tǒng)的一個(gè)例子，所述編碼利用產(chǎn)生既帶有濾波的區(qū)域又帶有未濾波的區(qū)域的L幀的運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間濾波。舉例來(lái)說(shuō)，該系統(tǒng)可代表電視、機(jī)頂盒、臺(tái)式電腦、膝上型電腦、掌上型電腦、個(gè)人數(shù)字助理(PDA)、視頻/圖像存儲(chǔ)裝置(諸如錄像機(jī)(VCR)、數(shù)碼錄像機(jī)(DVR)、TiVO裝置等等)，以及這些或其它裝置的部分或組合。該系統(tǒng)包括一個(gè)或多個(gè)視頻源26、一個(gè)或多個(gè)輸入/輸出裝置34、處理器28、存儲(chǔ)器30和顯示裝置36。
(一個(gè)或多個(gè))視頻/圖像源26可代表例如電視接收機(jī)、VCR或其它視頻/圖像存儲(chǔ)裝置。源26或者可以代表一個(gè)或多個(gè)網(wǎng)絡(luò)連接，其用于通過(guò)諸如因特網(wǎng)的全球計(jì)算機(jī)通信網(wǎng)絡(luò)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、陸地廣播系統(tǒng)、有線電視網(wǎng)絡(luò)、衛(wèi)星網(wǎng)絡(luò)、無(wú)線網(wǎng)絡(luò)、電話網(wǎng)絡(luò)以及這些或其它類型的網(wǎng)絡(luò)的部分或組合，從一個(gè)或多個(gè)服務(wù)器接收視頻。
輸入/輸出裝置34、處理器28、存儲(chǔ)器30通過(guò)通信介質(zhì)32通信。通信介質(zhì)32例如可以代表總線、通信網(wǎng)絡(luò)和電路、電路卡或其它裝置的一個(gè)或多個(gè)內(nèi)部連接，以及這些或其它通信介質(zhì)的部分或組合。來(lái)自源26的輸入視頻數(shù)據(jù)，按照一個(gè)或多個(gè)存儲(chǔ)在存儲(chǔ)器30中并被處理器28執(zhí)行的軟件程序被處理，以便生成向顯示裝置36提供的輸出視頻/圖像。
特別地，在存儲(chǔ)器30中存儲(chǔ)的軟件程序包括如前文關(guān)于圖3和圖5所描述的基于小波的編碼。在這個(gè)實(shí)施例中，基于小波的編碼由該系統(tǒng)所執(zhí)行的計(jì)算機(jī)可讀代碼實(shí)現(xiàn)。該代碼可以存儲(chǔ)在存儲(chǔ)器30中，或者被從諸如CD-ROM或軟盤的存儲(chǔ)介質(zhì)中讀取/下載。在其它實(shí)施例中，可以用硬件電路代替軟件指令或與軟件指令組合，以實(shí)現(xiàn)本發(fā)明。
盡管以上是就特定例子描述了本發(fā)明的，應(yīng)當(dāng)明白，這并非要把本發(fā)明局限于或限定于本文中所公開的例子。因此，本發(fā)明要包括包含在所附權(quán)利要求書的精神和范圍內(nèi)的各種結(jié)構(gòu)及其修改。
權(quán)利要求
1.一種用于編碼視頻的方法，包含以下步驟將第一幀中的第一區(qū)域與第二幀中的第二區(qū)域相匹配；產(chǎn)生包括第一與第二區(qū)域的像素值之間的差的第一部分編碼的幀；產(chǎn)生包括或者第一區(qū)域或者第二區(qū)域的像素值的第二部分編碼的幀；和將第一和第二部分編碼的幀變換成小波系數(shù)。
2.權(quán)利要求1的方法，進(jìn)一步包括按照重要性信息編碼所述小波系數(shù)。
3.權(quán)利要求1的方法，進(jìn)一步包括熵編碼所述小波系數(shù)。
4.權(quán)利要求1的方法，進(jìn)一步包括把第一與第二區(qū)域的像素值之間的差乘以一個(gè)縮放因子。
5.權(quán)利要求1的方法，進(jìn)一步包括把或者第一區(qū)域或者第二區(qū)域的像素值乘以一個(gè)縮放因子。
6.權(quán)利要求1的方法，進(jìn)一步包括將第一幀中的第三區(qū)域與第二幀中的第四區(qū)域相匹配；在第二部分編碼的幀中包括第三和第四區(qū)域的像素值的平均。
7.權(quán)利要求6的方法，進(jìn)一步包括把第三和第四區(qū)域的像素值的平均乘以一個(gè)縮放因子。
8.權(quán)利要求1的方法，其中，如果匹配指標(biāo)的質(zhì)量高于預(yù)定的閾值，則產(chǎn)生包括或者第一區(qū)域或者第二區(qū)域的像素值的第二部分編碼的幀。
9.權(quán)利要求1的方法，其中，如果用來(lái)編碼第二部分解碼的幀的比特的個(gè)數(shù)小于將第一和第二區(qū)域的像素值的平均包括在第二部分編碼的幀中的情況，則產(chǎn)生包括或者第一區(qū)域或者第二區(qū)域的像素值的第二部分編碼的幀。
10.一種包括用于編碼視頻的代碼的存儲(chǔ)器介質(zhì)，該代碼包含用于將第一幀中的第一區(qū)域與第二幀中的第二區(qū)域相匹配的代碼；用于產(chǎn)生包括第一與第二區(qū)域的像素值之間的差的第一部分編碼的幀的代碼；用于產(chǎn)生包括或者第一區(qū)域或者第二區(qū)域的像素值的第二部分編碼的幀的代碼；和用于將第一和第二部分編碼的幀變換成小波系數(shù)的代碼。
11.一種用于編碼視頻的裝置，包含運(yùn)動(dòng)估計(jì)單元，用于將第一幀中的第一區(qū)域與第二幀中的第二區(qū)域相匹配；時(shí)間濾波單元，用于產(chǎn)生包括第一與第二區(qū)域的像素值之間的差的第一部分編碼的幀以及包括或者第一區(qū)域或者第二區(qū)域的像素值的第二部分編碼的幀；和空間分解單元，用于將第一和第二部分編碼的幀變換成小波系數(shù)。
12.一種用于解碼比特流的方法，包含熵解碼比特流，以產(chǎn)生小波系數(shù)；把小波系數(shù)變換成包括一個(gè)被濾波的區(qū)域的第一部分解碼的幀和包括一個(gè)未濾波的區(qū)域的第二部分解碼的幀；產(chǎn)生包括組合的被濾波區(qū)域和未濾波區(qū)域的像素值的第一幀；和產(chǎn)生包括未濾波區(qū)域的像素值的第二幀。
13.權(quán)利要求12的方法，進(jìn)一步包括把被濾波區(qū)域按一個(gè)縮放因子進(jìn)行分割。
14.權(quán)利要求12的方法，進(jìn)一步包括把未濾波區(qū)域按一個(gè)縮放因子進(jìn)行分割。
15.權(quán)利要求12的方法，其中，被濾波區(qū)域和未濾波區(qū)域的像素值通過(guò)減法而被組合。
16.權(quán)利要求12的方法，其中，被濾波區(qū)域和未濾波區(qū)域的像素值通過(guò)加法而被組合。
17.權(quán)利要求12的方法，其中，未濾波區(qū)域包括兩個(gè)被匹配區(qū)域之一的像素值。
18.權(quán)利要求12的方法，其中，被濾波區(qū)域包括來(lái)自兩個(gè)被匹配區(qū)域的像素值的差。
19.權(quán)利要求12的方法，進(jìn)一步包括按照重要性信息解碼所述小波系數(shù)。
20.一種用于解碼比特流的裝置，包含熵解碼單元，用于將比特流解碼成小波系數(shù)；空間分解單元，用于把小波系數(shù)變換成包括一個(gè)被濾波的區(qū)域的第一部分解碼的幀和包括一個(gè)未濾波的區(qū)域的第二部分解碼的幀；以及逆時(shí)間濾波單元，用于產(chǎn)生包括組合的被濾波區(qū)域和未濾波區(qū)域的像素值的第一幀和包括未濾波區(qū)域的像素值的第二幀。
21.一種包括用于解碼比特流的代碼的存儲(chǔ)器介質(zhì)，該代碼包含用于熵解碼比特流以產(chǎn)生小波系數(shù)的代碼；用于把小波系數(shù)變換成包括一個(gè)被濾波的區(qū)域的第一部分解碼的幀和包括一個(gè)未濾波的區(qū)域的第二部分解碼的幀的代碼；用于產(chǎn)生包括組合的被濾波區(qū)域和未濾波區(qū)域的像素值的第一幀的代碼；和用于產(chǎn)生包括未濾波區(qū)域的像素值的第二幀的代碼。
全文摘要
本發(fā)明涉及一種用于編碼視頻的方法和裝置。按照本發(fā)明，將第一幀中的第一區(qū)域與第二幀中的第二區(qū)域相匹配。產(chǎn)生包括第一與第二區(qū)域的像素值之間的差的第一部分編碼的幀。產(chǎn)生包括或者第一區(qū)域或者第二區(qū)域的像素值的第二部分編碼的幀。此外，將第一和第二部分編碼的幀變換成小波系數(shù)。
文檔編號(hào)H04N7/36GK1689045SQ03823594
公開日2005年10月26日申請(qǐng)日期2003年9月22日優(yōu)先權(quán)日2002年10月4日
發(fā)明者D·S·圖拉加, M·范德沙爾申請(qǐng)人:皇家飛利浦電子股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：D.S.圖拉加;M.范德沙爾
技術(shù)所有人：皇家飛利浦電子股份有限公司
我是此專利的發(fā)明人

上一篇：圖像輸出裝置、方法和介質(zhì)的制作方法
上一篇：使用嵌入的唯一通信標(biāo)識(shí)符建立通信連接的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

小波濾波相關(guān)技術(shù)

小波濾波器相關(guān)技術(shù)

小波變換濾波器相關(guān)技術(shù)

小波變換濾波相關(guān)技術(shù)

小波濾波方法及應(yīng)用相關(guān)技術(shù)

matlab小波濾波器相關(guān)技術(shù)

小波濾波器系數(shù)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于基于小波的編碼中的運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間濾波的既有被濾波區(qū)域又有未濾波區(qū)域的l幀的制作方法