專利名稱:一種面向無線多媒體傳感器網(wǎng)絡(luò)的視頻壓縮方法
技術(shù)領(lǐng)域:
本發(fā)明是一種針對無線多媒體傳感器網(wǎng)絡(luò)(Wireless Multimedia SensorNetworks, WMSN)中多媒體數(shù)據(jù)壓縮的技術(shù)方案。主要用于解決視頻壓縮編碼的問 題,并盡可能提高解碼圖像的質(zhì)量,屬于計(jì)算機(jī)無線通信技術(shù)領(lǐng)域。
背景技術(shù):
近年來,隨著無線多媒體通信技術(shù)的發(fā)展,出現(xiàn)了越來越多的視頻應(yīng)用需求,如 無線多媒體傳感器網(wǎng)絡(luò)、移動可視電話、無線視頻監(jiān)控、無線PC攝像機(jī)等。在無線多媒體 傳感器網(wǎng)絡(luò)中,視頻應(yīng)用需要處理大量的數(shù)據(jù),由于節(jié)點(diǎn)計(jì)算能力或節(jié)點(diǎn)能量受限,傳統(tǒng)視 頻編碼標(biāo)準(zhǔn)不再適用于無線視頻場合。一種全新的視頻編解碼框架一分布式視頻編碼 (Distributed Video Coding, DVC)被應(yīng)用到無線多媒體傳感器網(wǎng)絡(luò)中。傳統(tǒng)的視頻編碼標(biāo)準(zhǔn)(如MPEG、H. 26x)采用了混合編碼框架,編碼采用運(yùn)動補(bǔ)償 技術(shù),充分利用視頻序列的時間和空間相關(guān)性進(jìn)行預(yù)測編碼,一般情況下,編碼復(fù)雜度是解 碼復(fù)雜度的5 10倍。而分布式視頻編碼具有編碼簡單、解碼復(fù)雜的特點(diǎn)。此外,分布式 視頻編碼具有較好的魯棒性、較高的壓縮效率,且易形成分級編碼的碼流,適用于編碼復(fù)雜 度較低的無線視頻場合。目前比較經(jīng)典的分布式編解碼方案主要包括斯坦福大學(xué)Girod和Aaron等提出 的Wyner-Ziv視頻編碼,加州大學(xué)伯克利分校的Ramchandran等提出的PRISM視頻編碼, Zixiang Xiong提出的分層Wyner-Ziv視頻編碼,Sehgal等提出的state-free分布式視頻 編碼,基于小波編碼的分布式視頻編碼以及多視角分布式視頻編碼等。Wyner-Ziv分布式視 頻編碼由關(guān)鍵幀(Key幀)和Wyner-Ziv幀(WZ幀)兩種幀組成。其中Key幀采用傳統(tǒng)的 幀內(nèi)編解碼的方式,而WZ幀采用幀內(nèi)編碼和幀間解碼相結(jié)合的方式。WZ幀編碼時,先進(jìn)行 基于塊的DCT變換和量化,然后采用S1印ian-Wolf編碼器進(jìn)行編碼。編碼器將編碼生成的 校驗(yàn)位存儲在編碼端的緩沖器中,根據(jù)解碼端的解碼反饋請求,將校驗(yàn)位發(fā)送給解碼器進(jìn) 行糾錯解碼。解碼時,Slepian-Wolf解碼器根據(jù)解碼邊信息和接收到的校驗(yàn)位進(jìn)行解碼,根 據(jù)解碼端的解碼的正確性,不斷反饋請求bit數(shù),編碼端緩存器不斷發(fā)送校驗(yàn)位,直到能夠 正確解碼為止。接著對解碼后的系數(shù)進(jìn)行IDCT和反量化以及解碼重建。這些方案都是基于 turbo或LDPC對Wyner-Ziv幀的所有區(qū)域不加區(qū)別的編碼,這種編碼處理方式,適應(yīng)于運(yùn) 動平緩的情況,但對于運(yùn)動比較劇烈的區(qū)域和運(yùn)動對象的邊緣區(qū)域,運(yùn)動估計(jì)和運(yùn)動補(bǔ)償 技術(shù)就不能夠準(zhǔn)確預(yù)測,解碼時需要向編碼端請求較多的反饋信息,這樣不僅增加了碼率, 而且解碼的部分圖像仍不夠精確。針對該問題,本發(fā)明提出了像素域感興趣區(qū)(Region of Intrest, R0I)區(qū)分算法。在Wyne-Ziv分布式視頻編碼理論的基礎(chǔ)上,提出了一種改進(jìn)的 Wyner-Ziv分布式視頻編碼算法,該算法基于圖像梯度場,通過感興趣區(qū)域判定準(zhǔn)則提取運(yùn) 動劇烈區(qū)域并基于熵編碼壓縮,其余區(qū)域則基于LDPC分布式編解碼,最終實(shí)現(xiàn)視頻的優(yōu)化 傳輸。此外,對解碼后的圖像進(jìn)行后處理,采用塊效應(yīng)濾波,進(jìn)一步提高了圖像的質(zhì)量,滿足 了人們對圖像的主觀要求。
發(fā)明內(nèi)容
技術(shù)問題本發(fā)明的目的是提出一種面向無線多媒體傳感器網(wǎng)絡(luò)的視頻壓縮方 法,來解決視頻應(yīng)用中數(shù)據(jù)量大的問題。通過使用本發(fā)明提出的方法在降低碼率的同時提 高了解碼圖像的質(zhì)量,最終降低傳感器節(jié)點(diǎn)能耗,從而延長了網(wǎng)絡(luò)生存周期。技術(shù)方案本發(fā)明的一種面向無線多媒體傳感器網(wǎng)絡(luò)的視頻壓縮方法是一種改進(jìn) 性的方法,分布式視頻壓縮算法主要的任務(wù)是將視頻應(yīng)用中較大的數(shù)據(jù)量進(jìn)行壓縮,從而 降低節(jié)點(diǎn)的能耗,延長網(wǎng)絡(luò)生存周期,此外,為了進(jìn)一步提高解碼圖像的主觀質(zhì)量,對解碼 后的圖像采用后處理濾波以減少方塊效應(yīng)。一、體系結(jié)構(gòu)本方法在Wyner-Ziv分布式視頻編碼方案的基礎(chǔ)上,基于圖像梯度場,通過R0I判 定準(zhǔn)則提取運(yùn)動劇烈區(qū)域并基于Huffman編解碼壓縮,其余區(qū)域則基于LDPC分布式編解 碼,在降低碼率的同時提高解碼圖像質(zhì)量,降低節(jié)點(diǎn)的處理和傳輸能耗,實(shí)現(xiàn)視頻的優(yōu)化傳 輸,延長整個網(wǎng)絡(luò)的生存周期。對解碼后的圖像采用去塊效應(yīng)濾波,提高了圖像的主觀質(zhì) 量,滿足了人們對圖像的視覺要求。本方法基于Wyner-Ziv分布式視頻編碼方案,將視頻序列分為兩種不同的幀關(guān) 鍵字(Key Frame, K)和非關(guān)鍵幀(Wyner-Ziv frame, WZ)0對關(guān)鍵幀采用傳統(tǒng)的JPEG編碼 方式,利用R0I區(qū)分算法將Wyner-Ziv幀分為R0I區(qū)域和非R0I區(qū)域,對Wyner-Ziv幀的 R0I區(qū)域采用Huffman編解碼的方式,其余的非R0I區(qū)域采用LPDC的編解碼方式。對解碼 后的圖像采用去塊效應(yīng)濾波處理,進(jìn)一步提高了解碼圖像的質(zhì)量。具體步驟如下(1)在編碼端a)幀分離器將編碼端輸入的視頻序列分為關(guān)鍵 幀(Key幀)和Wyner-Ziv幀(WZ幀);b)空間變換對W幀進(jìn)行基于塊的離散余弦變換 (Discrete Cosine Transform,DCT) ;c)量化對每個DCT變換后的系數(shù)進(jìn)行量化;d)編碼 使用傳統(tǒng)的JPEG技術(shù)編碼Key幀,利用R0I提取算法將Wyner-Ziv幀區(qū)分為R0I區(qū)域和非 R0I區(qū)域?qū)0I區(qū)域采用Huffman編碼,對非R0I區(qū)域采用LDPC編碼;(2)在解碼端a) 生成邊信息使用解碼出的幀,進(jìn)行運(yùn)動補(bǔ)償幀內(nèi)插(或外推)生成邊信息;b)相關(guān)噪聲模 型WZ幀和邊信息之間對應(yīng)的DCT系數(shù)的殘差統(tǒng)計(jì)當(dāng)作一個拉普拉斯分布進(jìn)行建模;c)解 碼對Key幀,使用傳統(tǒng)的JPEG技術(shù)解碼,對Wyner-Ziv幀的R0I區(qū)域采用Huffman解碼,其 余的非R0I區(qū)域采用LDPC解碼;d)重構(gòu)在邊信息的輔助下,重建所有的DCT系數(shù);e)反變 換對重建后的系數(shù)執(zhí)行反離散余弦變換(Inverse Discrete Cosine Transform, IDCT); (3)解碼圖像后處理對解碼后的圖像采用去塊效應(yīng)濾波;(4)幀混合將解碼后的Key幀 和WZ幀整合為視頻流。二、方法流程本方法包括以上所述4個步驟,詳細(xì)論述如下(一)在編碼端a)幀分離器視頻序列被分為Wyner-Ziv幀(WZ幀)和關(guān)鍵幀(Key幀),其中關(guān) 鍵幀周期性的插入,取決于GOP (Group of Pictures)大小。利用幀分離器將視頻序列分為 不同的幀,對于每個不同的視頻序列,由于編碼結(jié)構(gòu)的不同,每幀的被賦予的屬性不同,因 而,采用的編碼處理方式也不同。
b)空間變換基于塊的變換,特別地把DCT變換應(yīng)用到每個WZ幀。依據(jù)每個塊的 DCT系數(shù)所處的位置,將整個WZ幀的DCT系數(shù)被分為不同的組,從而形成不同的DCT系數(shù)集。c)量化每個DCT集被統(tǒng)一的量化,這些量化級依賴于所要得到圖像的質(zhì)量。對 于一個給定的集合,量化信號的位流被一起分組,形成位平面,然后獨(dú)立地進(jìn)行編碼。d)編碼對于Key幀,使用傳統(tǒng)的JPEG技術(shù)編碼,利用R0I區(qū)分算法將Wyner-Ziv 幀分為R0I區(qū)域和非R0I區(qū)域?qū)τ赗0I區(qū)域采用Huffman編碼,對于非R0I區(qū)域采用LDPC 編碼。R0I區(qū)域采用Huffman編碼的過程如下將待編碼的灰度級按出現(xiàn)的次數(shù)排序,出 現(xiàn)次數(shù)多的在前面,次數(shù)少的在后面;取出現(xiàn)次數(shù)最少的兩個數(shù)的次數(shù)相加,之和作為一 個新的出現(xiàn)次數(shù)的集合元素并重新排序,新出現(xiàn)的次數(shù)在新集合中仍遵循降序規(guī)則以確定 所處的位置,相加的兩個次數(shù)最少所對應(yīng)的灰度級成為Huffman樹的一個葉結(jié)點(diǎn),這兩個 結(jié)點(diǎn)構(gòu)造一個雙親結(jié)點(diǎn),重復(fù)該步驟,直到所有的灰度級都被用來構(gòu)造Huffman樹為止; 設(shè)所有結(jié)點(diǎn)的左孩子為“0”,右孩子為“1”,則從根開始,經(jīng)各中間結(jié)點(diǎn)到葉結(jié)點(diǎn)的路徑代 碼即是該葉結(jié)點(diǎn)的Huffman碼。對于非R0I區(qū)域的每個DCT集,從最重要的位平面(Most Significant Bit-plane,MSB)進(jìn)行LDPC編碼。對于每個位平面(bit-plane),所生成的奇 偶檢驗(yàn)信息被存儲在緩沖器中,在解碼端的請求下,通過反饋機(jī)制,不斷地發(fā)送校驗(yàn)信息。(二)在解碼端a)生成邊信息解碼端使用最近的已解碼幀,通過執(zhí)行運(yùn)動補(bǔ)償幀內(nèi)插(或外推) 的方式生成每個WZ幀的邊信息(Side Information,SI)。每個WZ幀的邊信息被當(dāng)作原始 WZ幀的一種估計(jì)值。估計(jì)值的質(zhì)量越好,LDPC解碼端需要改正的“錯誤”越少,并且向緩沖 器所請求的奇偶校驗(yàn)位(或位流)越少。b)相關(guān)噪聲模型在WZ幀和邊信息中對應(yīng)的DCT系數(shù)的殘差統(tǒng)計(jì)被假定當(dāng)作一 個服從拉普拉斯分布的模型,其參數(shù)使用離線(off-line)的訓(xùn)練階段進(jìn)行初始化估計(jì)。
c) LDPC解碼關(guān)鍵幀使用傳統(tǒng)的JPEG技術(shù)進(jìn)行解碼;WZ幀的R0I區(qū)域使用 Huffman進(jìn)行解碼復(fù)原;對于WZ幀的非R0I區(qū)域,一旦知道了邊信息DCT系數(shù)和一個給定 DCT系數(shù)的殘差統(tǒng)計(jì),每個位平面可以進(jìn)行LDPC解碼(從MSB解碼)。在LDPC解碼器的請 求下,編碼器通過反饋信道發(fā)送一些奇偶校驗(yàn)消息。為了判定正確的解碼某個特定的位平 面是否需要更多的校驗(yàn)位,解碼器采用一個請求停止標(biāo)準(zhǔn)。當(dāng)成功地LDPC解碼一個DCT集 的MSB位平面之后,LDPC解碼器以一個統(tǒng)一的的方式處理其余相關(guān)的集。一旦所有的DCT 集的位平面被成功地LDPC解碼,LDPC解碼器開始解碼下一個集。d)重構(gòu)在LDPC解碼后,所有的位平面及每個DCT集被一起分組,以形成解碼的 量化信號流和每個集。一旦可以獲得所有的解碼量化信號,在相應(yīng)的邊信息系數(shù)的輔助下, 便可重構(gòu)所有的DCT系數(shù)。對于所傳輸?shù)牟缓琖Z位流的DCT系數(shù)集由邊信息對應(yīng)的DCT 集來代替。e)反變換當(dāng)所有的DCT集被重建以后,執(zhí)行IDCT,由此便可得到解碼的WZ幀。(三)解碼圖像后處理對解碼后的圖像使用濾波器,從而削弱由量化帶來的方 塊效應(yīng)。去塊效應(yīng)濾波器是一維濾波器,為了得到二維效果,對一個塊要進(jìn)行兩次濾波,第 一次是在水平方向,第二次在垂直方向。由于塊效應(yīng)產(chǎn)生的原因是量化誤差將原來相鄰像 素值的連續(xù)變化變成了 “臺階”變化,看起來就有“偽邊緣”的方塊現(xiàn)象。去塊效應(yīng)就是在盡量使圖像總的能量保持不變的條件下,把那些“臺階”很高的階躍型的灰度變化重新變成 “臺階”很小或接近連續(xù)的灰度變化。(四)幀混合最后,對于已經(jīng)正確解碼的各幀,即利用傳統(tǒng)JPEG編解碼Key幀 和利用LDPC及Huffman混合編解碼的WZ幀,根據(jù)在編碼端所采用的編碼結(jié)構(gòu)G0P的大小, 將Key幀和WZ幀按G0P次序混合成視頻流,恢復(fù)成解碼后的視頻序列。至此,視頻編解碼 壓縮處理結(jié)束。該方法采用R0I區(qū)分算法,加強(qiáng)對運(yùn)動劇烈區(qū)域和運(yùn)動邊緣區(qū)域的編碼,并且對 解碼后的圖像采用去塊效應(yīng)濾波后處理,進(jìn)一步提高解碼圖像的主觀質(zhì)量,該方法具體如 下1)在編碼端a)幀分離器視頻序列被分為關(guān)鍵幀和非關(guān)鍵幀,其中關(guān)鍵幀周期性的插入,取 決于圖像組的大小,幀分離器將視頻序列分為不同的幀,每兩個關(guān)鍵幀之間所分配的非關(guān) 鍵幀的數(shù)目不同,關(guān)鍵幀采用幀內(nèi)編碼,非關(guān)鍵幀采用低密度奇偶校驗(yàn)碼編碼;b)空間變換基于塊的變換,特別地把離散余弦變換應(yīng)用到每個非關(guān)鍵幀上,非 關(guān)鍵幀被劃分為互不重疊的塊,依據(jù)每個塊的離散余弦變換系數(shù)所處的位置,形成不同的 離散余弦變換系數(shù)集;c)量化每個離散余弦變換集被統(tǒng)一的量化,這些量化級依賴于所要得到圖像的 質(zhì)量,對于一個給定的集合,量化信號的位流被一起分組,形成位平面,然后獨(dú)立地進(jìn)行編 碼;d)編碼對于關(guān)鍵幀,使用傳統(tǒng)的聯(lián)合圖像專家組進(jìn)行編碼,利用感興趣區(qū)域區(qū) 分算法將非關(guān)鍵幀分為感興趣區(qū)域和非感興趣區(qū)域?qū)τ诟信d趣區(qū)域采用霍夫曼編碼,對 于非感興趣區(qū)域采用低密度奇偶校驗(yàn)碼編碼;2)在解碼端a)生成邊信息解碼端使用最近的已解碼幀,通過采用運(yùn)動補(bǔ)償幀內(nèi)插或外推的 方式生成每個非關(guān)鍵幀的邊信息,每個非關(guān)鍵幀的邊信息被當(dāng)作原始非關(guān)鍵幀的估計(jì)值, 估計(jì)值的質(zhì)量越好,低密度奇偶校驗(yàn)碼解碼端需要改正的“錯誤”越少,并且向緩沖器所請 求的奇偶校驗(yàn)位或位流越少;b)相關(guān)噪聲模型非關(guān)鍵幀和邊信息中對應(yīng)的離散余弦變換系數(shù)的殘差統(tǒng)計(jì)被 假定為一個服從拉普拉斯分布的模型,其參數(shù)使用離線的訓(xùn)練模式進(jìn)行初始化估計(jì);c)低密度奇偶校驗(yàn)碼解碼關(guān)鍵幀使用傳統(tǒng)的聯(lián)合圖像專家組技術(shù)進(jìn)行解碼;非 關(guān)鍵幀的感興趣區(qū)域使用霍夫曼進(jìn)行解碼復(fù)原;對于非關(guān)鍵幀的非感興趣區(qū)域,一旦知道 了邊信息離散余弦變換系數(shù)和一個給定離散余弦變換系數(shù)的殘差統(tǒng)計(jì),每個位平面可以進(jìn) 行低密度奇偶校驗(yàn)碼解碼,從最重要的位平面開始解碼;在低密度奇偶校驗(yàn)碼解碼器的請 求下,編碼器通過反饋信道發(fā)送一些奇偶校驗(yàn)消息,為了判定解碼某個特定的位平面是否 需要更多的校驗(yàn)位,解碼器采用一個請求停止標(biāo)準(zhǔn),當(dāng)?shù)兔芏绕媾夹r?yàn)碼正確地解碼一個 離散余弦變換集的最重要位平面之后,低密度奇偶校驗(yàn)碼解碼器將以統(tǒng)一的方式處理其余 相關(guān)的集合,當(dāng)所有的離散余弦變換集合的位平面都被低密度奇偶校驗(yàn)碼正確地解碼時, 解碼器則開始解碼下一個集合;d)重構(gòu)在低密度奇偶校驗(yàn)碼解碼后,所有的位平面及每個離散余弦變換集合被一起分組,以形成解碼的量化信號流和集合,一旦可以獲得所有的解碼量化信號,在相應(yīng)的邊信息系數(shù)的輔助下,便可重構(gòu)所有的離散余弦變換系數(shù),對于所傳輸?shù)牟缓顷P(guān)鍵幀位流的離散余弦變換系數(shù)集合,由邊信息對應(yīng)的離散余弦變換集合宋代替;
e)反變換當(dāng)所有的離散余弦變換集被重建以后,執(zhí)行反離散余弦變換,由此便可得到解碼的非關(guān)鍵幀;
3)解碼圖像后處理
對解碼后的圖像使用濾波器,從而削弱由量化帶來的方塊效應(yīng),去塊效應(yīng)濾波器是一維濾波器,為了得到二維效果,對一個塊要進(jìn)行兩次濾波,第一次是在水平方向,第二次在垂直方向,由于塊效應(yīng)產(chǎn)生的原因是量化誤差將原來相鄰像素值的連續(xù)變化變成了“臺階”變化,看起來就有“偽邊緣”的方塊現(xiàn)象,去塊效應(yīng)就是在盡量使圖像總的能量保持不變的條件下,把那些“臺階”很高的階躍型的灰度變化重新變成“臺階”很小或接近連續(xù)的灰度變化;
4)幀混合
對于已經(jīng)正確解碼的各幀,即利用傳統(tǒng)的聯(lián)合圖像專家組編解碼的關(guān)鍵幀和利用低密度奇偶校驗(yàn)碼及霍夫曼混合編解碼的非關(guān)鍵幀,根據(jù)在編碼端所采用的編碼圖像組的大小,將關(guān)鍵幀和非關(guān)鍵幀按圖像組的相應(yīng)次序混合成視頻流,進(jìn)而恢復(fù)成解碼后的視頻序列,至此,視頻編解碼壓縮處理結(jié)束。
所述感興趣區(qū)域采用霍夫曼編碼的過程如下將待編碼的灰度級按出現(xiàn)的次數(shù)排序,出現(xiàn)次數(shù)多的在前面,次數(shù)少的在后面;取出現(xiàn)次數(shù)最少的兩個數(shù)的次數(shù)相加,之和作為一個新的出現(xiàn)次數(shù)的集合元素并重新排序,新出現(xiàn)的次數(shù)在新集合中仍遵循降序規(guī)則以確定所處的位置,相加的兩個次數(shù)最少所對應(yīng)的灰度級成為霍夫曼樹的一個葉結(jié)點(diǎn),這兩個結(jié)點(diǎn)構(gòu)造一個雙親結(jié)點(diǎn),重復(fù)該步驟,直到所有的灰度級都被用來構(gòu)造霍夫曼樹為止;設(shè)所有結(jié)點(diǎn)的左孩子為“o”,右孩子為“l(fā)”,則從根開始,經(jīng)各中間結(jié)點(diǎn)到葉結(jié)點(diǎn)的路徑代碼即是該葉結(jié)點(diǎn)的霍夫曼碼;對于非感興趣區(qū)域的每個離散余弦變換集合,從最重要的位平面進(jìn)行低密碼奇偶校驗(yàn)碼編碼;對于每個位平面,所生成的奇偶檢驗(yàn)信息被存儲在緩沖器中,在解碼端的請求下,通過反饋機(jī)制,不斷地發(fā)送校驗(yàn)信息。
對于關(guān)鍵幀,使用傳統(tǒng)的聯(lián)合圖像專家組進(jìn)行編碼,利用感興趣區(qū)域區(qū)分算法將非關(guān)鍵幀分為感興趣區(qū)域和非感興趣區(qū)域?qū)τ诟信d趣區(qū)域采用霍夫曼編解碼,對于非感興趣區(qū)域采用低密度奇偶校驗(yàn)碼進(jìn)行編解碼,具體步驟如下
步驟1)將每幀分成大小相等且互不重疊的8×8宏塊;
步驟2)將關(guān)鍵幀和非關(guān)鍵幀進(jìn)行梯度變化;
步驟3)計(jì)算關(guān)鍵幀和非關(guān)鍵幀相同位置宏塊的絕對差值之和;
步驟4)根據(jù)感興趣區(qū)域宏塊的判定準(zhǔn)則,對非關(guān)鍵幀每個宏塊進(jìn)行感興趣區(qū)域區(qū)分;
步驟5)對非關(guān)鍵幀的感興趣區(qū)域宏塊采用霍夫曼編解碼壓縮;
步驟6)對非關(guān)鍵幀的其它宏塊則采用低密度奇偶校驗(yàn)碼編解碼壓縮。
有益效果本發(fā)明方法提出了一種改進(jìn)的wyner—ZiV分布式視頻壓縮方法,主要是用來解決無線多媒體傳感器網(wǎng)絡(luò)中視頻數(shù)據(jù)量大所帶來的網(wǎng)絡(luò)節(jié)點(diǎn)能耗大,網(wǎng)絡(luò)生存周期短的問題,并滿足人們對解碼圖像質(zhì)量以及視頻實(shí)時性的需求。無線多媒體傳感器網(wǎng)絡(luò)通過使用本發(fā)明提出的方法,可以解決因大數(shù)據(jù)量傳輸帶來的網(wǎng)絡(luò)節(jié)點(diǎn)能耗大、網(wǎng)絡(luò)生存 周期短,由運(yùn)動劇烈?guī)淼倪\(yùn)動估計(jì)失效及由量化步長帶來的方塊效應(yīng)的問題,以及對視 頻的實(shí)時性和主觀質(zhì)量的要求高的問題。達(dá)到減少網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)量,降低節(jié)點(diǎn)傳輸能耗, 延長網(wǎng)絡(luò)生存周期,確保多媒體視頻數(shù)據(jù)傳輸?shù)膶?shí)時性和圖像的高質(zhì)量。下面給出具體的 說明1.編碼簡單相對于傳統(tǒng)的視頻編碼標(biāo)準(zhǔn)(如MPEG系列,H. 26x),本發(fā)明由于采 用Wyner-Ziv分布式視頻編碼方案,編碼端簡單,解碼端復(fù)雜。分布式視頻編碼將運(yùn)動估計(jì) 和及運(yùn)動補(bǔ)償所帶來的編碼端的高復(fù)雜性、大計(jì)算量轉(zhuǎn)移到解碼端,而解碼端一般位于匯 聚節(jié)點(diǎn)或網(wǎng)絡(luò)中心,充分利用匯聚節(jié)點(diǎn)和網(wǎng)絡(luò)中心計(jì)算能力強(qiáng)、存儲能力大、持續(xù)供電的優(yōu) 點(diǎn),完成對視頻的壓縮編碼。2.低碼率本發(fā)明可以設(shè)置圖像的G0P的大小,并對WZ幀采用了 LDPC和Huffman 相結(jié)合的編解碼方式,向緩沖器所請求的奇偶校驗(yàn)位較少,從而大大降低了編碼的碼率。3.能耗低本發(fā)明由于可以改變Key幀之間WZ幀的數(shù)量,減少了待處理的視頻流 的數(shù)據(jù)量,從而降低了每個傳感器節(jié)點(diǎn)的編碼處理能耗,進(jìn)而延長了整個網(wǎng)絡(luò)的生命周期。4.實(shí)時性本發(fā)明由于對視頻數(shù)據(jù)的壓縮率高,壓縮編碼后的數(shù)據(jù)量小,因此減 少了傳輸?shù)臄?shù)據(jù)量,優(yōu)化了實(shí)時傳輸,進(jìn)而保證了視頻流傳輸?shù)膶?shí)時性。5.可靠性本發(fā)明由于采用了 R0I提取算法,將WZ幀分為R0I區(qū)域和非R0I區(qū)域, 對R0I區(qū)域采用Huffman編解碼方式,實(shí)現(xiàn)了無失真壓縮,提高了解碼的準(zhǔn)確性,此外,對解 碼后的圖像采取去塊效應(yīng)濾波,進(jìn)一步提高了解碼圖像的主觀質(zhì)量,進(jìn)而實(shí)現(xiàn)了對視頻編 碼壓縮可靠性的要求。
圖1是分布式視頻編碼示意圖。如圖,分布式視頻編碼框架包括低復(fù)雜度編碼器 和高復(fù)雜度解碼器。圖2是點(diǎn)對點(diǎn)無線移動視頻通信的示意圖。如圖,發(fā)送方采用Wyner-Ziv分布式 視頻編碼并將編碼的視頻流發(fā)送至基站或網(wǎng)絡(luò)中心節(jié)點(diǎn),在基站或網(wǎng)絡(luò)中心結(jié)點(diǎn)設(shè)置碼流 轉(zhuǎn)換器,將分布式碼率轉(zhuǎn)換為H. 26x/MPEG碼流,然后由基站或網(wǎng)絡(luò)中心結(jié)點(diǎn)將轉(zhuǎn)換后的視 頻流傳送給接收方。對于發(fā)送方和接收方終端而言,僅需要進(jìn)行較低復(fù)雜度的編碼和解碼。圖3是分布式編解碼示意圖。如圖,采用幀內(nèi)編碼和幀間解碼相結(jié)合的方式,在編 碼端,采用幀內(nèi)編碼技術(shù)相互獨(dú)立地編碼兩個或者多個相關(guān)的信源,將編碼位流發(fā)送到接 收端;在解碼端,利用各個信源間的相關(guān)性,進(jìn)行聯(lián)合預(yù)測解碼。圖4是本發(fā)明基于梯度域的R0I區(qū)分的Wyner-Ziv分布式視頻編碼示意圖。利用 R0I區(qū)分算法將WZ幀區(qū)分為R0I區(qū)域和非R0I區(qū)域,然后分別采用Huffman和LDPC進(jìn)行編解碼。圖5是解碼圖像后處理流程圖。去塊效應(yīng)濾波僅在圖像被解碼之后進(jìn)行濾波。圖6是本發(fā)明方法的整個流程圖。如圖所示,描述了基于梯度域R0I區(qū)分的 ffyner-Ziv分布式視頻編解碼的全過程。
具體實(shí)施例方式本方法在Wyner-Ziv分布式視頻編碼方案的基礎(chǔ)上,基于圖像梯度場域,通過R0 判定準(zhǔn)則提取運(yùn)動劇烈區(qū)域并基于Huffman編解碼壓縮,其余區(qū)域則基于LDPC分布式編解 碼,在降低碼率的同時提高解碼圖像質(zhì)量,降低節(jié)點(diǎn)的處理和傳輸能耗,實(shí)現(xiàn)視頻的優(yōu)化傳 輸,延長整個網(wǎng)絡(luò)的生存周期。對解碼后的圖像采用去塊效應(yīng)濾波處理,進(jìn)一步提高了解碼 圖像的質(zhì)量。本方法基于Wyner-Ziv分布式視頻編碼方案,將視頻序列分為兩種不同的幀關(guān) 鍵幀(Key Frame,K幀)和Wyner-Ziv幀(WZ幀)。對關(guān)鍵幀采用傳統(tǒng)的JPEG編碼方式,利 用R0I區(qū)分算法將Wyner-Ziv幀分為R0I區(qū)域和非R0I區(qū)域,對Wyner_Ziv幀的R0I區(qū)域 采用Huffman編解碼的方式,其余的非R0I區(qū)域LPDC的編解碼方式。對解碼后的圖像進(jìn)行 后處理,采用去塊效應(yīng)濾波,進(jìn)一步提高了解碼圖像的質(zhì)量。本方法的實(shí)施分為4個階段 i)在編碼端;ii)在解碼端;iii)解碼圖像后處理;iv)幀混合,具體描述如下第一階段在編碼端該階段分為以下幾個處理過程a)幀分離器視頻序列被分為Wyner-Ziv幀(WZ幀)和關(guān)鍵幀(Key幀),其中關(guān) 鍵幀周期性的插入,取決于GOP (Group of Pictures)大小。利用幀分離器將視頻序列分為 不同的幀,對于每個不同的視頻序列,由于編碼結(jié)構(gòu)的不同,每幀的被賦予的屬性不同,因 而,采用的編碼處理方式也不同。b)空間變換基于塊的變換,特別地把DCT變換應(yīng)用到每個WZ幀。依據(jù)每個塊的 DCT系數(shù)所處的位置,將整個WZ幀的DCT系數(shù)被分為不同的組,從而形成不同的DCT系數(shù)集。c)量化每個DCT集被統(tǒng)一的量化,這些量化級依賴于所要得到圖像的質(zhì)量。對 于一個給定的集合,量化信號的位流被一起分組,形成位平面,然后獨(dú)立地進(jìn)行編碼。d)編碼對于Key幀,使用傳統(tǒng)的JPEG技術(shù)編碼,利用R0I區(qū)分算法將Wyner-Ziv 幀分為R0I區(qū)域和非R0I區(qū)域?qū)τ赗0I區(qū)域采用Huffman編碼,對于非R0I區(qū)域采用LDPC 編碼。R0I區(qū)域采用Huffman編碼的過程如下將待編碼的灰度級按出現(xiàn)的次數(shù)排序,出 現(xiàn)次數(shù)多的在前面,次數(shù)少的在后面;取出現(xiàn)次數(shù)最少的兩個數(shù)的次數(shù)相加,之和作為一 個新的出現(xiàn)次數(shù)的集合元素并重新排序,新出現(xiàn)的次數(shù)在新集合中仍遵循降序規(guī)則以確定 所處的位置,相加的兩個次數(shù)最少所對應(yīng)的灰度級成為Huffman樹的一個葉結(jié)點(diǎn),這兩個 結(jié)點(diǎn)構(gòu)造一個雙親結(jié)點(diǎn),重復(fù)該步驟,直到所有的灰度級都被用來構(gòu)造Huffman樹為止; 設(shè)所有結(jié)點(diǎn)的左孩子為“0”,右孩子為“1”,則從根開始,經(jīng)各中間結(jié)點(diǎn)到葉結(jié)點(diǎn)的路徑代 碼即是該葉結(jié)點(diǎn)的Huffman碼。對于非R0I區(qū)域的每個DCT集,從最重要的位平面(Most Significant Bit-plane,MSB)開始進(jìn)行LDPC編碼。對于每個位平面(bit-plane),所生成 的奇偶檢驗(yàn)信息被存儲在緩沖器中,在解碼端的請求下,通過反饋機(jī)制,不斷地發(fā)送校驗(yàn)信 肩、o通過這個階段對視頻序列進(jìn)行了編碼的相關(guān)處理,為下一階段的解碼作好了準(zhǔn) 備。第二階段在解碼端該階段分為以下幾個處理過程a)生成邊信息解碼端使用最近的已解碼幀,通過執(zhí)行運(yùn)動補(bǔ)償幀內(nèi)插(或外推) 的方式生成每個WZ幀的邊信息(Side Information,SI)。每個WZ幀的邊信息被當(dāng)作原始WZ幀的一種估計(jì)值。估計(jì)值的質(zhì)量越好,LDPC解碼端需要改正的“錯誤”越少,并且向緩沖 器所請求的奇偶校驗(yàn)位(或位流)越少。b)相關(guān)噪聲模型在WZ幀和邊信息中對應(yīng)的DCT系數(shù)的殘差統(tǒng)計(jì)被假定當(dāng)作一 個服從拉普拉斯分布的模型,其參數(shù)使用離線(off-line)的訓(xùn)練階段進(jìn)行初始化估計(jì)。c) LDPC解碼關(guān)鍵幀使用傳統(tǒng)的JPEG技術(shù)進(jìn)行解碼;WZ幀的R0I區(qū)域使用 Huffman進(jìn)行解碼復(fù)原;對于WZ幀的非R0I區(qū)域,一旦知道了邊信息DCT系數(shù)和一個給定 DCT系數(shù)的殘差統(tǒng)計(jì),每個位平面可以進(jìn)行LDPC解碼(從MSB解碼)。在LDPC解碼器的請 求下,編碼器通過反饋信道發(fā)送一些奇偶校驗(yàn)消息。為了判定正確的解碼某個特定的位平 面是否需要更多的校驗(yàn)位,解碼器采用一個請求停止標(biāo)準(zhǔn)。當(dāng)成功地LDPC解碼一個DCT集 的MSB位平面之后,LDPC解碼器以一個統(tǒng)一的的方式處理其余相關(guān)的集。一旦所有的DCT 集的位平面被成功地LDPC解碼,LDPC解碼器開始解碼下一個集。d)重構(gòu)在LDPC解碼后,所有的位平面及每個DCT集被一起分組,以形成解碼的 量化信號流和每個集。一旦可以獲得所有的解碼量化信號,在相應(yīng)的邊信息系數(shù)的輔助下, 便可重構(gòu)所有的DCT系數(shù)。對于所傳輸?shù)牟缓琖Z位流的DCT系數(shù)集由邊信息對應(yīng)的DCT 集來代替。e)反變換當(dāng)所有的DCT集被重建以后,執(zhí)行IDCT,由此便可得到解碼的WZ幀。通過以上幾個處理過程,完成了對Key幀和WZ幀的正確解碼。第三階段解碼圖像后處理對解碼后的圖像使用濾波器,從而削弱由量化帶來的方塊效應(yīng)。去塊效應(yīng)濾波器 是一維濾波器,為了得到二維效果,對一個塊要進(jìn)行兩次濾波,第一次是在水平方向,第二 次在垂直方向。由于塊效應(yīng)產(chǎn)生的原因是量化誤差將原來相鄰像素值的連續(xù)變化變成了 “臺階”變化,看起來就有“偽邊緣”的方塊現(xiàn)象。去塊效應(yīng)就是在盡量使圖像總的能量保持 不變的條件下,把那些“臺階”很高的階躍型的灰度變化重新變成“臺階”很小或接近連續(xù) 的灰度變化。第四階段幀混合最后,對于已經(jīng)正確解碼的各幀,即利用傳統(tǒng)JPEG編解碼Key幀和利用LDPC及 Huffman混合編解碼的WZ幀,根據(jù)在編碼端所采用的編碼結(jié)構(gòu)G0P的大小,將Key幀和WZ 幀按G0P次序混合成視頻流,恢復(fù)成解碼后的視頻序列。至此,視頻編解碼壓縮處理結(jié)束。
權(quán)利要求
一種面向無線多媒體傳感器網(wǎng)絡(luò)的視頻壓縮方法,其特征是采用ROI區(qū)分算法,加強(qiáng)對運(yùn)動劇烈區(qū)域和運(yùn)動邊緣區(qū)域的編碼,并且對解碼后的圖像采用去塊效應(yīng)濾波后處理,進(jìn)一步提高解碼圖像的主觀質(zhì)量,該方法具體如下1)在編碼端a)幀分離器視頻序列被分為關(guān)鍵幀和非關(guān)鍵幀,其中關(guān)鍵幀周期性的插入,取決于圖像組的大小,幀分離器將視頻序列分為不同的幀,每兩個關(guān)鍵幀之間所分配的非關(guān)鍵幀的數(shù)目不同,關(guān)鍵幀采用幀內(nèi)編碼,非關(guān)鍵幀采用低密度奇偶校驗(yàn)碼編碼;b)空間變換基于塊的變換,特別地把離散余弦變換應(yīng)用到每個非關(guān)鍵幀上,非關(guān)鍵幀被劃分為互不重疊的塊,依據(jù)每個塊的離散余弦變換系數(shù)所處的位置,形成不同的離散余弦變換系數(shù)集;c)量化每個離散余弦變換集被統(tǒng)一的量化,這些量化級依賴于所要得到圖像的質(zhì)量,對于一個給定的集合,量化信號的位流被一起分組,形成位平面,然后獨(dú)立地進(jìn)行編碼;d)編碼對于關(guān)鍵幀,使用傳統(tǒng)的聯(lián)合圖像專家組進(jìn)行編碼,利用感興趣區(qū)域區(qū)分算法將非關(guān)鍵幀分為感興趣區(qū)域和非感興趣區(qū)域?qū)τ诟信d趣區(qū)域采用霍夫曼編碼,對于非感興趣區(qū)域采用低密度奇偶校驗(yàn)碼編碼;2)在解碼端a)生成邊信息解碼端使用最近的已解碼幀,通過采用運(yùn)動補(bǔ)償幀內(nèi)插或外推的方式生成每個非關(guān)鍵幀的邊信息,每個非關(guān)鍵幀的邊信息被當(dāng)作原始非關(guān)鍵幀的估計(jì)值,估計(jì)值的質(zhì)量越好,低密度奇偶校驗(yàn)碼解碼端需要改正的“錯誤”越少,并且向緩沖器所請求的奇偶校驗(yàn)位或位流越少;b)相關(guān)噪聲模型非關(guān)鍵幀和邊信息中對應(yīng)的離散余弦變換系數(shù)的殘差統(tǒng)計(jì)被假定為一個服從拉普拉斯分布的模型,其參數(shù)使用離線的訓(xùn)練模式進(jìn)行初始化估計(jì);c)低密度奇偶校驗(yàn)碼解碼關(guān)鍵幀使用傳統(tǒng)的聯(lián)合圖像專家組技術(shù)進(jìn)行解碼;非關(guān)鍵幀的感興趣區(qū)域使用霍夫曼進(jìn)行解碼復(fù)原;對于非關(guān)鍵幀的非感興趣區(qū)域,一旦知道了邊信息離散余弦變換系數(shù)和一個給定離散余弦變換系數(shù)的殘差統(tǒng)計(jì),每個位平面可以進(jìn)行低密度奇偶校驗(yàn)碼解碼,從最重要的位平面開始解碼;在低密度奇偶校驗(yàn)碼解碼器的請求下,編碼器通過反饋信道發(fā)送一些奇偶校驗(yàn)消息,為了判定解碼某個特定的位平面是否需要更多的校驗(yàn)位,解碼器采用一個請求停止標(biāo)準(zhǔn),當(dāng)?shù)兔芏绕媾夹r?yàn)碼正確地解碼一個離散余弦變換集的最重要位平面之后,低密度奇偶校驗(yàn)碼解碼器將以統(tǒng)一的方式處理其余相關(guān)的集合,當(dāng)所有的離散余弦變換集合的位平面都被低密度奇偶校驗(yàn)碼正確地解碼時,解碼器則開始解碼下一個集合;d)重構(gòu)在低密度奇偶校驗(yàn)碼解碼后,所有的位平面及每個離散余弦變換集合被一起分組,以形成解碼的量化信號流和集合,一旦可以獲得所有的解碼量化信號,在相應(yīng)的邊信息系數(shù)的輔助下,便可重構(gòu)所有的離散余弦變換系數(shù),對于所傳輸?shù)牟缓顷P(guān)鍵幀位流的離散余弦變換系數(shù)集合,由邊信息對應(yīng)的離散余弦變換集合來代替;e)反變換當(dāng)所有的離散余弦變換集被重建以后,執(zhí)行反離散余弦變換,由此便可得到解碼的非關(guān)鍵幀;3)解碼圖像后處理對解碼后的圖像使用濾波器,從而削弱由量化帶來的方塊效應(yīng),去塊效應(yīng)濾波器是一維濾波器,為了得到二維效果,對一個塊要進(jìn)行兩次濾波,第一次是在水平方向,第二次在垂直方向,由于塊效應(yīng)產(chǎn)生的原因是量化誤差將原來相鄰像素值的連續(xù)變化變成了“臺階”變化,看起來就有“偽邊緣”的方塊現(xiàn)象,去塊效應(yīng)就是在盡量使圖像總的能量保持不變的條件下,把那些“臺階”很高的階躍型的灰度變化重新變成“臺階”很小或接近連續(xù)的灰度變化;4)幀混合對于已經(jīng)正確解碼的各幀,即利用傳統(tǒng)的聯(lián)合圖像專家組編解碼的關(guān)鍵幀和利用低密度奇偶校驗(yàn)碼及霍夫曼混合編解碼的非關(guān)鍵幀,根據(jù)在編碼端所采用的編碼圖像組的大小,將關(guān)鍵幀和非關(guān)鍵幀按圖像組的相應(yīng)次序混合成視頻流,進(jìn)而恢復(fù)成解碼后的視頻序列,至此,視頻編解碼壓縮處理結(jié)束。
2.根據(jù)權(quán)利要求1所述的面向無線多媒體傳感器網(wǎng)絡(luò)的視頻壓縮方法,其特征是所述 感興趣區(qū)域采用霍夫曼編碼的過程如下將待編碼的灰度級按出現(xiàn)的次數(shù)排序,出現(xiàn)次數(shù) 多的在前面,次數(shù)少的在后面;取出現(xiàn)次數(shù)最少的兩個數(shù)的次數(shù)相加,之和作為一個新的出 現(xiàn)次數(shù)的集合元素并重新排序,新出現(xiàn)的次數(shù)在新集合中仍遵循降序規(guī)則以確定所處的位 置,相加的兩個次數(shù)最少所對應(yīng)的灰度級成為霍夫曼樹的一個葉結(jié)點(diǎn),這兩個結(jié)點(diǎn)構(gòu)造一 個雙親結(jié)點(diǎn),重復(fù)該步驟,直到所有的灰度級都被用來構(gòu)造霍夫曼樹為止;設(shè)所有結(jié)點(diǎn)的左 孩子為“0”,右孩子為“1”,則從根開始,經(jīng)各中間結(jié)點(diǎn)到葉結(jié)點(diǎn)的路徑代碼即是該葉結(jié)點(diǎn) 的霍夫曼碼;對于非感興趣區(qū)域的每個離散余弦變換集合,從最重要的位平面進(jìn)行低密碼 奇偶校驗(yàn)碼編碼;對于每個位平面,所生成的奇偶檢驗(yàn)信息被存儲在緩沖器中,在解碼端的 請求下,通過反饋機(jī)制,不斷地發(fā)送校驗(yàn)信息。
3.根據(jù)權(quán)利要求1所述的面向無線多媒體傳感器網(wǎng)絡(luò)的視頻壓縮方法,其特征是對于 關(guān)鍵幀,使用傳統(tǒng)的聯(lián)合圖像專家組進(jìn)行編碼,利用感興趣區(qū)域區(qū)分算法將非關(guān)鍵幀分為 感興趣區(qū)域和非感興趣區(qū)域?qū)τ诟信d趣區(qū)域采用霍夫曼編解碼,對于非感興趣區(qū)域采用 低密度奇偶校驗(yàn)碼進(jìn)行編解碼,具體步驟如下步驟1)將每幀分成大小相等且互不重疊的8X8宏塊;步驟2)將關(guān)鍵幀和非關(guān)鍵幀進(jìn)行梯度變化;步驟3)計(jì)算關(guān)鍵幀和非關(guān)鍵幀相同位置宏塊的絕對差值之和;步驟4)根據(jù)感興趣區(qū)域宏塊的判定準(zhǔn)則,對非關(guān)鍵幀每個宏塊進(jìn)行感興趣區(qū)域區(qū)分;步驟5)對非關(guān)鍵幀的感興趣區(qū)域宏塊采用霍夫曼編解碼壓縮; 步驟6)對非關(guān)鍵幀的其它宏塊則采用低密度奇偶校驗(yàn)碼編解碼壓縮。
全文摘要
本發(fā)明是一種面向無線多媒體傳感器網(wǎng)絡(luò)的視頻壓縮方法,提出一種面向無線多媒體傳感器網(wǎng)絡(luò)的視頻壓縮方法,來解決視頻應(yīng)用中數(shù)據(jù)量大的問題。通過使用本發(fā)明提出的方法在降低碼率的同時提高了解碼圖像的質(zhì)量,最終降低傳感器節(jié)點(diǎn)能耗,從而延長了網(wǎng)絡(luò)生存周期。該方法采用ROI區(qū)分算法,加強(qiáng)對運(yùn)動劇烈區(qū)域和運(yùn)動邊緣區(qū)域的編碼,并且對解碼后的圖像采用去塊效應(yīng)濾波后處理,進(jìn)一步提高解碼圖像的主觀質(zhì)量,本方法在Wyner-Ziv分布式視頻編碼方案的基礎(chǔ)上,基于圖像梯度場域,通過ROI判定準(zhǔn)則提取運(yùn)動劇烈區(qū)域并基于Huffman編解碼壓縮,其余區(qū)域則基于LDPC分布式編解碼,在降低碼率的同時提高解碼圖像質(zhì)量,降低節(jié)點(diǎn)的處理和傳輸能耗,實(shí)現(xiàn)視頻的優(yōu)化傳輸,延長整個網(wǎng)絡(luò)的生存周期。
文檔編號H04N7/50GK101854548SQ201010182470
公開日2010年10月6日 申請日期2010年5月25日 優(yōu)先權(quán)日2010年5月25日
發(fā)明者葉曉國, 孫力娟, 王汝傳, 肖甫, 郭劍, 馬子平 申請人:南京郵電大學(xué)