專利名稱:一種基于運動補(bǔ)償精化的分布式視頻編碼方法
技術(shù)領(lǐng)域:
本發(fā)明屬于視頻壓縮技術(shù)領(lǐng)域,尤其是一種基于運動補(bǔ)償精化的分布式視頻編碼方法。
背景技術(shù):
隨著網(wǎng)絡(luò)技術(shù)、無線技術(shù)和計算機(jī)技術(shù)的飛速發(fā)展,近來涌現(xiàn)出許多具有嶄新特點的多媒體應(yīng)用設(shè)備,如無線視頻傳感器監(jiān)控網(wǎng)絡(luò)、移動攝像手機(jī)和便攜式攝像機(jī)等,這些多媒體應(yīng)用設(shè)備在存儲容量、計算能力和功率資源等方面都受到很大的限制,需要簡單的編碼器以節(jié)省功率。分布式視頻編碼(Distributed Video Coding, DVC)將耗時耗功率的運動估計 /補(bǔ)償從編碼端移到解碼端,具有與傳統(tǒng)的幀內(nèi)編碼方式相似的低編碼復(fù)雜度以及遠(yuǎn)遠(yuǎn)高于幀內(nèi)壓縮性能的特點,為以上應(yīng)用場合提供了很好的解決方案。DVC是基于Skpian和 Wolf提出的分布式無損編碼理論與Wyner和Ziv提出的使用解碼端邊信息的有損編碼理論,前者的主要思想是對視頻幀在編碼端進(jìn)行獨立編碼而在解碼端進(jìn)行聯(lián)合譯碼,這樣就避免了在編碼端進(jìn)行幀間預(yù)測編碼,從而降低編碼端的復(fù)雜度;后者的主要思想是在解碼端使用已譯碼的視頻幀來產(chǎn)生邊信息,使用邊信息來利用當(dāng)前幀與邊信息之間的相關(guān)性來對當(dāng)前幀進(jìn)行譯碼。目前比較典型的分布式視頻編解碼方案,如
圖1所示,主要是基于像素域的Wyner-Ziv視頻編解碼框架、基于DCT變換域的Wyner-Ziv視頻編解碼框架和PRISM 視頻編解碼框架。前兩種編碼方案是由斯坦福大學(xué)的Bernd Girod研究小組提出的,其分布式視頻編碼方案主要是基于幀層并在解碼端通過反饋信道來進(jìn)行速率控制的;第三種編碼方案是由加利福尼亞大學(xué)的Karman Ramehandran研究小組提出的,其分布式視頻編碼方案raiSM是根據(jù)該視頻編碼的幾個特點命名的,其中P表示高效(Power-efficient), R表示魯棒(Robust),I表示高壓縮率(high-compression),SM表示綜合多媒體編碼 (Syndrome-basedMultimedia coding),PRISM視頻編碼是基于塊層并在編碼端進(jìn)行碼率控制的。DVC的技術(shù)難點在于如何在解碼端生成精確的邊信息。一方面,在Skpian-Wolf 壓縮環(huán)節(jié),邊信息越精確,需要的信道碼的校驗比特越少,因而壓縮性能越好;另一方面,在量化重構(gòu)中,DVC中的量化重構(gòu)值取期望值E (χ I y),當(dāng)邊信息y在χ的量化區(qū)間時,將y作為χ的重構(gòu)值,否則,在χ的量化區(qū)間中取與y最接近的值為χ的重構(gòu),所以說,邊信息越精確,量化重構(gòu)值越接近于主信息的原始值。目前提出了很多算法用來提高DVC系統(tǒng)的性能 Dong Yoon Kim等提出了一種使用種子塊生成邊信息的算法,當(dāng)SI接近于目標(biāo)圖像,在解碼端可以取得圖像更好的重建圖像,從而提高壓縮比;Marco Cagnazzo等提出了一個新穎的差分運動估計算法,它可以應(yīng)用于WZ視頻編碼方案的解碼端,而無需增加編碼速率;雖然這些算法可以在一定程度上提高DVC的壓縮性能,但是,在仍然存在邊信息質(zhì)量差和率失真性能低等問題。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提出一種能夠提高邊信息質(zhì)量和率失真性能的基于運動補(bǔ)償精化的分布式視頻編解碼方法。本發(fā)明解決其技術(shù)問題是采取以下技術(shù)方案實現(xiàn)的—種基于運動補(bǔ)償精化的分布式視頻編碼方法,包括以下步驟(1)在編碼端將視頻序列分成關(guān)鍵幀和WZ幀,然后對WZ幀進(jìn)行DCT變換、量化和 Turbo編碼;(2)在解碼端,關(guān)鍵幀采用H. 264幀內(nèi)解碼,使用改進(jìn)的三維遞歸運動搜索方法產(chǎn)生前向和后向運動補(bǔ)償圖像,然后采用運動補(bǔ)償內(nèi)插法生成邊信息解碼WZ幀。而且,所述WZ幀為棋盤格式分割的WZ巾貞,WZ幀內(nèi)包括間隔分布的子集Ai1和而且,所述改進(jìn)的三維遞歸運動搜索方法用于對解碼端運動矢量進(jìn)行搜索,包括以下步驟(1)在關(guān)鍵幀;^.―1和關(guān)鍵幀12;+1之間進(jìn)行前向遞歸搜索,關(guān)鍵幀;為當(dāng)前預(yù)測幀,I2M為參考幀,擁有最小SAD值的參考塊對應(yīng)運動矢量即為當(dāng)前預(yù)測塊的前向運動矢量 Vf;(2)在關(guān)鍵幀I2,爿和關(guān)鍵幀I2,+1之間進(jìn)行后向遞歸搜索,關(guān)鍵幀;為參考幀, I2M為當(dāng)前預(yù)測幀,通過遞歸搜索得到預(yù)測塊的后向運動矢量Vb ;(3)在獲得了前向運動矢量和后向運動矢量后,按照如下公式計算處于可信度較低區(qū)域的邊信息宏塊的新運動矢量V
權(quán)利要求
1.一種基于運動補(bǔ)償精化的分布式視頻編碼方法,其特征在于包括以下步驟(1)在編碼端將視頻序列分成關(guān)鍵幀和WZ幀,然后對WZ幀進(jìn)行DCT變換、量化和Turbo 編碼;(2)在解碼端,關(guān)鍵幀采用H.264幀內(nèi)解碼,使用改進(jìn)的三維遞歸運動搜索方法產(chǎn)生前向和后向運動補(bǔ)償圖像,然后采用運動補(bǔ)償內(nèi)插法生成邊信息解碼WZ幀。
2.根據(jù)權(quán)利要求1所述的一種基于運動補(bǔ)償精化的分布式視頻編碼方法,其特征在于所述WZ幀為棋盤格式分割的WZ巾貞,WZ幀內(nèi)包括間隔分布的子集Ai1和)(2i2,且
3.根據(jù)權(quán)利要求1所述的一種基于運動補(bǔ)償精化的分布式視頻編碼方法,其特征在于所述改進(jìn)的三維遞歸運動搜索方法用于對解碼端運動矢量進(jìn)行搜索,包括以下步驟(1)在關(guān)鍵幀;^.―jp關(guān)鍵幀之間進(jìn)行前向遞歸搜索,關(guān)鍵幀;^.+1為當(dāng)前預(yù)測幀, I2M為參考幀,擁有最小SAD值的參考塊對應(yīng)運動矢量即為當(dāng)前預(yù)測塊的前向運動矢量Vf ;(2)在關(guān)鍵幀I2,爿和關(guān)鍵幀I2,+1之間進(jìn)行后向遞歸搜索,關(guān)鍵幀;為參考幀,U 當(dāng)前預(yù)測幀,通過遞歸搜索得到預(yù)測塊的后向運動矢量Vb ;(3)在獲得了前向運動矢量和后向運動矢量后,按照如下公式計算處于可信度較低區(qū)域的邊信息宏塊的新運動矢量V
4.根據(jù)權(quán)利要求1所述的一種基于運動補(bǔ)償精化的分布式視頻編碼方法,其特征在于所述的生成邊信息解碼WZ幀包括以下步驟(1)從編碼端傳來的信息與Ii1 一起進(jìn)行解碼得到;,進(jìn)而得到一個新的邊信息 & =總+ ,其中,Li1和Li2分別表示知1和Ai2的邊信息,X2i1和X2i2分別表示間隔分布的子集Ai1和)(2i2 ;⑵在已知總、I2^1 >之.+1、1和Y' 2i的情況下,采用時空邊界匹配算法對)(2/進(jìn)行運動補(bǔ)償精化,得到新的邊信息;(3)將新的邊信息進(jìn)行解碼得到;;(4)將總和;^合并得到重建的WZ幀。
5.根據(jù)權(quán)利要求4所述的一種基于運動補(bǔ)償精化的分布式視頻編碼方法,其特征在于所述時空邊界匹配算法用來獲取精確的運動矢量,該算法采用如下描述時間和空間平滑特性的失真函數(shù) 16Ατ=Σαχ 1Wtial { + (l-^)x Dt^poral (ζ) /=1上式中DlTpora' (0 = ^g \γ (腳cn)°.υτ (O -Υ°υτ(OD^ana' (O = ^Zjv(AYf (O) ·T 卜 kj (/)
全文摘要
本發(fā)明涉及一種基于運動補(bǔ)償精化的分布式視頻編碼方法,包括以下步驟(1)在編碼端將視頻序列分成關(guān)鍵幀和WZ幀,然后對WZ幀進(jìn)行DCT變換、量化和Turbo編碼;(2)在解碼端,關(guān)鍵幀采用H.264幀內(nèi)解碼,使用改進(jìn)的三維遞歸運動搜索方法產(chǎn)生前向和后向運動補(bǔ)償圖像,然后采用運動補(bǔ)償內(nèi)插法生成邊信息解碼WZ幀。本發(fā)明設(shè)計合理,采用改進(jìn)的三維遞歸搜索運動方法(3DRS),能夠有效地善初始邊信息(SI)質(zhì)量;同時采用時空邊界匹配算法(STBMA)實現(xiàn)對邊信息的精化,其充分利用空間和時間的平滑性能來獲取更精確的運動矢量,具有更好的率失真性能。
文檔編號H04N7/26GK102291582SQ20111028153
公開日2011年12月21日 申請日期2011年9月21日 優(yōu)先權(quán)日2011年9月21日
發(fā)明者葉鋒, 張鑫明, 楊波, 秦雯, 肖賀, 范曼曼, 邸金紅, 門愛東, 陳曉博 申請人:北京郵電大學(xué)