專利名稱:一種頻率域分布式視頻編碼中的分類組合方法
技術領域:
本發(fā)明涉及到一種視頻編碼壓縮方法,尤其涉及頻域Wyner-ZiV視頻編碼方法。
背景技術:
隨著無線多媒體通信及無線視頻傳感網(wǎng)絡等新技術的出現(xiàn),一種新的視頻壓縮編 解碼技術——Wyner-Ziv視頻編碼引起人們廣泛關注。它主要滿足一些無線終端設備編碼 復雜度低、存儲容量有限、要求能在信道質量差的網(wǎng)絡中傳輸?shù)忍匦?。該方法有別于傳統(tǒng) 的視頻編解碼技術,具有編碼簡單,解碼復雜,高壓縮率,抗誤碼性強等特點。然而,壓縮率 低下、重構圖像質量不高是當前Wyner -Ziv視頻編解碼技術所面臨的難題。其主要原因在 于與傳統(tǒng)視頻編碼方法在編碼端進行運動估計有所不同Wyner-Ziv視頻編碼方法在解碼 端實施運動估計,由于解碼端的運動估計中不可能得到當前幀的原始幀,因而運動估計的 準確性受到影響,使得其后的僅僅通過運動估計插值獲得的邊信息與原始幀相差較大,解 碼端不得不請求編碼端發(fā)送大量的校驗比特,從而造成Wyner-Ziv視頻編碼方法的率失真 性能不高。而無線傳感網(wǎng)絡中移動終端設備有著以下不同于傳統(tǒng)網(wǎng)絡視頻壓縮編碼與傳輸 的特點1、由于無線網(wǎng)絡中的終端設備如手機、無線PC相機等數(shù)據(jù)處理能力和存儲能力、 功耗等資源受限的特點,難以完成復雜度高的幀間預測等編碼技術。2、考慮到無線傳感網(wǎng)絡中帶寬受限,通信能力不強,傳輸速率限制,要求編碼器最 大程度的挖掘數(shù)據(jù)相關性,具有較高的壓縮編碼效率。3、在Wyner-Ziv視頻編碼中,為了保證圖像重構質量,必須估計出最接近真實圖 像的邊信息,保證邊信息的準確性。針對以上無線傳感網(wǎng)絡終端設備和網(wǎng)絡特性,本發(fā)明對頻域Wyner-Ziv視頻編碼 算法進行改進,在保證重建圖像質量情況下,既能實現(xiàn)高效壓縮,又不增加編碼端的存儲負 擔,更適合無線傳感網(wǎng)絡中的終端設備。
發(fā)明內容
技術問題本發(fā)明要解決的技術問題是在Bernd Girod提出的頻域Wyner-Ziv視 頻編碼方案基礎上提出一種頻率域分布式視頻編碼中的分類組合方法,使其更適應無線傳 感網(wǎng)絡及其終端的特點。本發(fā)明主要解決兩部分的技術問題提高邊信息生成圖像精確的 同時和增大壓縮效率。技術方案本發(fā)明解決上述技術問題所采用的方法如下該方法在編碼器添加模塊分類功能,將圖像分為跳過編碼模式、低頻模式和全頻 模式三個編碼模式;在解碼端對應不同的編碼模式提出三個相應的邊信息估算方法獲得邊 信息輔助分布式解碼器解碼,該方法處理包括以下步驟步驟1 將輸入圖像視頻偶數(shù)序列視為W幀,奇數(shù)幀視為關鍵幀;關鍵幀采用傳統(tǒng)視頻編碼中的幀內編碼方式編碼,其解碼重建幀有兩個用途,一是還原視頻流,一是用于邊 信息插值估計出邊信息,步驟2 對于W幀,首先做進行離散余弦變換DCT,采用絕對值差MAD準則判斷該 W幀每一宏塊的編碼模式后進行預處理,其編碼為Skip模式、低頻模式或全頻模式中的一 種,步驟3 對圖像宏塊預處理后依次經(jīng)過量化、Turbo編碼器編碼,編碼后的校驗位傳送至解碼端,其傳至解碼端的校驗位數(shù)量視邊信息的準確度而定,步驟4 在解碼端,通過解碼重建后的關鍵幀估算邊信息,分別對應Skip模式、低 頻模式和全頻模式的編碼方法采用平均插值、自適應搜索運動估計插值和自適應搜索運動 估計精細插值邊信息的估算方法獲得準確的邊信息,步驟5 =Turbo解碼端的校驗位聯(lián)合步驟4獲得的邊信息,經(jīng)過反量化,反離散余弦 變換DCT變換重構W幀,步驟6 將W幀和關鍵幀合并輸出即得到解碼碼流。W幀編碼方法是依據(jù)圖像內容的運動特征劃分為Skip模式、低頻模式和全頻模式 三種編碼模式。MAD準則是利用視頻序列相鄰幀中運動緩和區(qū)以及背景相似區(qū)的離散余弦變換 DCT高頻系數(shù)基本相同這一特性進行加權獲得。Skip模式是指當前宏塊判斷為背景塊,在編碼端丟棄當前宏塊,在解碼端通過其 相鄰關鍵幀相同位置的宏塊進行平均插值獲得邊信息,此時邊信息即為解碼端當前需要解 碼宏塊的重建宏塊。低頻模式是指當前宏塊判斷為運動緩和塊時,編碼端抽取其DCT低頻系數(shù)進行量 化后送入Turbo編碼器,解碼端采用自適應搜索運動估計插值法生成邊信息輔助Turbo解 碼器解碼。全頻模式是指當前宏塊判斷為運動劇烈塊時,編碼端對當前宏塊所有DCT系數(shù)編 碼,解碼端采用自適應搜索精細運動估計插值法生成邊信息輔助Turbo解碼器解碼。自適應搜索運動估計插值方法是指在當前W幀的相鄰關鍵幀中根據(jù)圖像運動特 性進行自適應搜索范圍的運動估計尋找當前宏塊的最佳匹配塊的運動矢量,進行非線性插值。自適應搜索運動估計精細插值方法是指將當前W幀的相鄰關鍵幀中根據(jù)圖像運 動特性進行自適應搜索范圍的運動估計搜索出當前宏塊的運動矢量作為初始運動矢量,然 后在相鄰關鍵幀中進一步進行小范圍運動估計匹配搜索,尋找最佳匹配塊的運動矢量后進 行非線性插值。1、系統(tǒng)壓縮率的改進方法由于視頻序列相鄰幀中運動緩和區(qū)以及背景相似區(qū)的DCT高頻系數(shù)基本相同,因 此,本發(fā)明利用這一特性挖掘Wyner-Ziv編碼系統(tǒng)的冗余信息,對系統(tǒng)壓縮效率提出改進, 滿足無線傳感網(wǎng)絡終端存儲能力受限的特點。其改進方案是①通過MAD準則判斷編碼 端相鄰關鍵幀與Wyner-Ziv幀基于塊的運動劇烈程度,分別采用三種不同的編碼模式進行 Wyner-Ziv編碼傳輸。②當運動劇烈程度判斷編碼塊為Skip模式時,F(xiàn)lag編碼模式判斷參 數(shù)置0,編碼端舍棄不傳,解碼端相應的重建塊用相鄰關鍵幀幀相同位置塊平均插值生成的邊信息填補。③當運動劇烈程序判斷編碼塊為低頻模式,F(xiàn)lag = 1,編碼該類圖像塊時只抽取少量低頻分量進行Wyner-Ziv編碼,解碼端根據(jù)下文邊信息生成方法步驟③獲得的邊 帶信息的低頻分量重構解碼,利用生成邊信息的高頻分量和已解碼的Wyner-Ziv幀低頻分 量進行DCT反變換生成解碼Wyner-Ziv幀。④當運動劇烈程度判斷編碼塊為全頻模式時, Flag = 2,編碼端將該類塊的全部頻域信息進行Wyner-Ziv編碼,傳輸解碼端,然后根據(jù)下 文邊信息生成方法步驟④估算的邊信息聯(lián)合解碼重構圖像。2、邊信息生成方法Wyner-Ziv幀的壓縮效率主要來自于解碼端對邊信息的估計和聯(lián)合解碼重建。由 于K幀的編碼一般采用幀內編碼(也有學者采用幀間預測編碼,以降低K幀編碼碼率),因 此,準確的邊信息估值方法直接影響Wyner-Ziv視點或Wyner-Ziv幀的圖像質量。本發(fā)明 在分析變換域邊信息生成的基礎上,在不明顯增加編碼復雜度的同時得到更加準確的邊信 息,其技術方案如下邊信息生成方法技術關鍵在于根據(jù)圖像運動劇烈程度采用三種不同 的邊信息生成模式。①基于編碼端傳至解碼端的Flag參數(shù)判斷當前塊采用何種邊信息的 估算方法。②對于Flag = 0的待解碼圖像塊,其邊信息通過采用平均插值,即相鄰關鍵幀 相應位置圖像像素值加權平均獲得。③對于Flag = 1的待解碼圖像塊,通過對相鄰關鍵塊 計算運動劇烈程度獲取可取的搜索窗口尺寸,在此范圍內進行運動估計,得到最佳匹配塊, 并進行非線性內插估算邊信息。④對于Flag = 2的待解碼圖像塊,在步驟③獲得最佳匹配 塊的基礎上,在第一次運動匹配的附近進行小范圍的精細運動估計,最終獲得更接近真實 圖像目標運動軌跡的邊信息。上述的Flag參數(shù)通過對相鄰的Wyner-Ziv幀和關鍵幀相應位置塊的DCT系數(shù)作 簡單地比較運算并經(jīng)過閾值判斷獲得。上述搜索窗口尺寸是當前關鍵塊的全局運動矢量和其左、上、右上塊的運動矢量 濾波后獲得的的運動矢量作為窗口尺寸大小,其全局運動矢量是指全局運動矢量簡化為由 于鏡頭移動或者場景轉移運動矢量。上述非線性內插估算法是利用前后相鄰關鍵幀各塊所得到的運動矢量來推算當 前幀的運動矢量。該運動矢量獲得的前提是假定當前幀中各塊與前后相鄰幀位置相同各塊 的運動矢量是相同的。顯然,這一假設在背景塊和運動緩慢和圖像采樣頻率較高的情況下 是適用的。上述精細運動估計是以內插塊的真實前后向運動矢量的對稱性作為前提,首先以 非線性內插估算法得到的運動矢量作為初始運動矢量,然后在前后關健幀相應位置進行小 范圍搜索。上述三種不同的編碼模式判斷是首先根據(jù)Flag參數(shù)判斷編碼塊采用何種編碼模 式,然后通過相應的編碼模式編碼,解碼端根據(jù)相應的編碼模式采用不同的解碼方法重構 解碼圖像。有益效果本發(fā)明針對無線傳感網(wǎng)及其終端存儲能力受限,功耗低,信道質量不穩(wěn) 定等特性,提出了基于頻率Wyner-Ziv視頻編碼方案的改進方法。本發(fā)明通過對圖像塊合 理的分類組合,在實現(xiàn)低碼率傳輸?shù)耐瑫r,又能以最小的解碼代價獲得更精確的邊信息,從 而有效地避免圖像解碼質量下降。
圖IBernd Girod提出的頻域Wyner-Ziv視頻編碼系統(tǒng)框圖,圖2本發(fā)明提出的頻率域Wyner-Ziv視頻編碼系統(tǒng)圖,圖3頻域Wyner-Ziv視頻編碼分類組合算法流程圖,圖4平均插值算法,圖5自適應搜索運動估計插值估計算法,圖6自適應搜索精細運動估計插值算法,圖7基于頻域Wyner-Ziv視頻編碼分類組合算法的m0ther_daughter率失真曲 線,圖8基于頻域Wyner-Ziv視頻編碼分類組合算法的foreman率失真曲線圖。
具體實施例方式步驟1 將輸入圖像視頻偶數(shù)序列視為W幀,奇數(shù)幀視為關鍵幀;關鍵幀采用傳統(tǒng) 視頻編碼中的幀內編碼方式編碼,其解碼重建幀有兩個用途,一是還原視頻流,一是用于邊 信息插值估計出邊信息,步驟2 對于W幀,首先做進行離散余弦變換DCT,采用絕對值差MAD準則判斷該 W幀每一宏塊的編碼模式后進行預處理,其編碼為Skip模式、低頻模式或全頻模式中的一 種,步驟3 對圖像宏塊預處理后依次經(jīng)過量化、Turbo編碼器編碼,編碼后的校驗位 傳送至解碼端,其傳至解碼端的校驗位數(shù)量視邊信息的準確度而定,步驟4 在解碼端,通過解碼重建后的關鍵幀估算邊信息,分別對應Skip模式、低 頻模式和全頻模式的編碼方法采用平均插值、自適應搜索運動估計插值和自適應搜索運動 估計精細插值邊信息的估算方法獲得準確的邊信息,步驟5 =Turbo解碼端的校驗位聯(lián)合步驟4獲得的邊信息,經(jīng)過反量化,反離散余弦 變換DCT變換重構W幀,步驟6 將W幀和關鍵幀合并輸出即得到解碼碼流。W幀編碼方法是依據(jù)圖像內容的運動特征劃分為Skip模式、低頻模式和全頻模式 三種編碼模式。MAD準則是利用視頻序列相鄰幀中運動緩和區(qū)以及背景相似區(qū)的離散余弦變換 DCT高頻系數(shù)基本相同這一特性進行加權獲得。Skip模式是指當前宏塊判斷為背景塊,在編碼端丟棄當前宏塊,在解碼端通過其 相鄰關鍵幀相同位置的宏塊進行平均插值獲得邊信息,此時邊信息即為解碼端當前需要解 碼宏塊的重建宏塊。低頻模式是指當前宏塊判斷為運動緩和塊時,編碼端抽取其DCT低頻系數(shù)進行量 化后送入Turbo編碼器,解碼端采用自適應搜索運動估計插值法生成邊信息輔助Turbo解 碼器解碼。全頻模式是指當前宏塊判斷為運動劇烈塊時,編碼端對當前宏塊所有DCT系數(shù)編碼,解碼端采用自適應搜索精細運動估計插值法生成邊信息輔助Turbo解碼器解碼。自適應搜索運動估計插值方法是指在當前W幀的相鄰關鍵幀中根據(jù)圖像運動特性進行自適應搜索范圍的運動估計尋找當前宏塊的最佳匹配塊的運動矢量,進行非線性插值。自適應搜索運動估計精細插值方法是指將當前W幀的相鄰關鍵幀中根據(jù)圖像運 動特性進行自適應搜索范圍的運動估計搜索出當前宏塊的運動矢量作為初始運動矢量,然 后在相鄰關鍵幀中進一步進行小范圍運動估計匹配搜索,尋找最佳匹配塊的運動矢量后進 行非線性插值。圖1為Bernd Girod提出的頻域Wyner-Ziv視頻編碼方案,該方案采用兩種編碼 方式一種是關鍵幀(K幀),采用傳統(tǒng)視頻編碼中的幀內編碼方式(H. 263)編碼;另一種是 Wyner-Ziv幀(W幀),采用基于Turbo碼的Wyner-Ziv編碼器進行編解碼。在Wyner-Ziv 編碼端首先對圖像進行DCT變換,將DCT低頻分量(通常DCT8X8變換的低頻分量取前16 個系數(shù),DCT4X4變換的低頻分量取前4個系數(shù))量化(量化系數(shù)為2、4、8、16)后通過基于 Turbo碼的Wyner-Ziv編碼器編碼,將Turbo編碼器輸出端的校驗位保存到緩存中傳至解碼 端;DCT高頻分量(DCT4X4變換后12個系數(shù)、DCT8X8變換后48個系數(shù)均視為高頻分量) 通過與關鍵幀K的編碼系數(shù)進行類似幀間預測,對其熵編碼并傳輸至解碼端。在解碼端利 用幀間相關性,對相鄰關鍵幀進行運動估計,獲得運動矢量并進行插值生成相應Wyner-Ziv 幀的邊信息。依據(jù)Wyner-Ziv幀與邊信息符合拉普拉斯信道這已先驗條件,Turbo解碼器 聯(lián)合編碼端緩存中的校驗位和經(jīng)過DCT變換后的邊信息進行Turbo解碼,反量化,反DCT變 換,繼而重構出Wyner-Ziv幀。圖2中是本發(fā)明提出的頻率域Wyner-Ziv視頻編碼系統(tǒng)圖。由于圖1中編碼端的 運算復雜度和對編碼端的存儲空間均有很高的要求。另外考慮到無線傳感網(wǎng)絡中帶寬受 限,需要較高碼率壓縮率的特點,本發(fā)明針對圖1中的編碼方案進行改進,采用分類組合的 編碼方法,提出基于宏塊的SKIP編碼模式、低頻編碼模式和全頻編碼模式,并根據(jù)塊的運 動劇烈程度進行模式選擇。解碼端相應選擇平均插值、自適應搜索運動估計、自適應搜索精 細運動估計獲取邊信息輔助Wyner-ZiV解碼器解碼。圖3為頻域Wyner-Ziv視頻編碼分類組合算法流程圖。其算法步驟為(1)首先對Wyner-Ziv幀的當前宏塊進行DCT變換,然后與其相鄰K幀相同位置塊 的DCT高頻系數(shù)作簡單地比較運算,其比較方法采用圖中所示MAD準則
N
r πy \ w, ~ κ t\D 二 么 __ ⑴
N - η其中Wi, Ki分別表示W(wǎng)幀和K幀宏塊DCT系數(shù),i e (η, N),當采用8 X 8DCT變換 時,N = 64,η = 17,當采用 4X4DCT 變換時,N = 16,η = 4。(2)通過MAD準則得出的D與閾值Ttl和T1比較,如果D <閾值Τ。,則該宏塊為背 景塊,采用SKIP編碼Mskip模式,將FLAG標志位置0,丟棄不編碼不傳輸,解碼端相應的重建 塊用相鄰K幀相同位置塊平均插值生成的邊信息填補。(3)如果Ttl < D < T1,則判斷為低頻M1模式,F(xiàn)LAG標志位置1,抽取DCT變換的 低頻系數(shù)進行Wyner-Ziv編碼,由于此類塊一般為運動緩和區(qū)或只是場景的緩慢移動的區(qū) 域,因此,解碼端采用自適應搜索運動估計插值獲得準確邊信息;(4)如果D > T1,則判斷為全頻M2模式,F(xiàn)LAG標志位置2,將該圖像塊的全部DCT系數(shù)通過基于Turbo碼的Sl印ian-Wolf編碼器編碼,解碼端利用邊信息聯(lián)合解碼進行反量 化反DCT變換解碼W塊。由于全頻模式塊與參考塊的相關性小,運動幅度大,采用自適應搜 索的精細運動估計法獲取更精確的邊信息。(5)其中對FLAG標志位采用熵編碼的方式傳輸至解碼端。圖4是平均插值算法。為了減少碼率,對編碼端已判斷為Mskip模式的Wyner-Ziv 塊,其邊信息采用相鄰關鍵幀相同位置塊的像素值加權平均獲得Wi2 一彳一 、⑵其中W(2n,MSkip)為2η時刻Wyner-Ziv幀相應位置塊Mskip的像素值。圖5是自適應搜索運動估計算法。對于判斷為M1低頻模式的Wyner-Ziv ±夬,其邊 信息獲取的步驟為(1)確定搜索起點。取與當前塊相鄰(包括左、上、右上位置)的塊運動矢量經(jīng)過 中值濾波(即取中間值)作為當前塊的搜索起始點。當前塊為左邊界時,左邊相鄰塊運動 矢量置零;當前塊為上邊界,上邊相鄰塊的運動矢量置零;當前塊為右邊界時,右上相鄰塊 的運動矢量置零。(2)確定搜索范圍。設相鄰關鍵幀的全局運動矢量為(GM_x,GM_y),當前塊左邊、 上邊和右上宏塊進行一維X和y方向的中值濾波作為搜索起始點,記為(Ini_MVx,Ini_MVy), 其搜索范圍L = max (16,GMV > MV ? GMV :MV+1)(3)其中GMV = max (GM_x, GM_y)MV = max (MV_x, MV_y)(4)MV_x = max(MV_xi-Ini_MVx)MV_y = max (MV_yi-Ini_MVy)(3)獲取最佳匹配運動矢量。以步驟(1)獲得的搜索起始點為搜索中心,根據(jù)式 (3)、(4)獲得搜索范圍L,(x,y)為宏塊M1中像素坐標,以SAD為評價準則獲取M1塊最佳運
動矢量MV0=^ri Jj | ,,+w(x,力—冬2 _丨叫(x+MP;’少MVx e L,MVy e L (5)(4)生成M1邊信息。利用步驟(3)獲得的矢量MVtl進行插值生成邊信息塊
W(2nMi)腦(Μ, (χ, JO) = K{2n_lMi) (M1 (X,力 + ^Yl) / 2 + Κ(2η+ΚΜ]) (Μ, (X,力-/ 2
(6)其中,M1(^y)為邊信息幀宏塊虬中各像素的坐標。圖6為自適應搜索精細運動估計差值算法。若Wyner-Ziv宏塊判斷為Μ2全頻模 式塊,則表示該宏塊運動劇烈,為了更接近實際運動,在邊信息估計過程中,需要在自適應 搜索運動估計的基礎上進一步的精細運動匹配。(1)以圖4中獲得的MVtl為精細估計的初始運動矢量,在相鄰關鍵幀之間以T為第二次搜索范圍的對稱性精細運動估計
<formula>formula see original document page 9</formula>
(2)通過非線性運動估計內插估算出編碼模式M2的邊信息塊<formula>formula see original document page 9</formula>(8)其中,M2 (X,y)為邊信息幀宏塊M2中各像素的坐標。圖7、8為采用本發(fā)明提出的分類組合視頻編碼方法的率失真曲線圖。其中 H. 263+IBI為采用傳統(tǒng)視頻編碼方法得到的試驗結果。原始頻域Wyner-Ziv視頻編碼方法 為Bernd Girod提出的頻域Wyner-Ziv視頻編碼方案的試驗結果?;贒CT幀內編碼為視頻 流采用幀內DCT量化編碼的試驗結果。本發(fā)明提出的頻域Wyner-Ziv視頻編碼分類組合算 法中分別采用DCT8X8和DCT4X4的DCT變換尺度,將其與上述三種實驗方法進行參照比 較。從mother_daughter和foreman的率失真曲線圖中可以看出,在PSNR相同的情況下,與 原始頻域Wyner-Ziv視頻編碼方法相比,本發(fā)明提出的基于8 X 8DCT域變換的分類組合算 法中大大降低了碼率,在低碼率時效果非常明顯。由于mother_dUghter序列運動緩慢,全 頻模式塊占比重較小,大量背景塊和平緩塊的冗余信息被消除,且解碼端對運動塊采用更 精確的自適應搜索窗的邊信息精細估計技術,因此在降低碼率的同時,重構圖像質量也具 有很好的恢復效果。而foreman序列由于鏡頭移動,運動劇烈,壓縮率比m0ther_daughter 序列略低,但是原始頻域Wyner-Ziv視頻編碼算法相比,碼率降低時,并未影響重構圖像質 量。本文提出的頻域改進算法分別采用大尺度(8X8)和小尺度(4X4)的DCT域變 換,從圖7中可看出,當采用相同量化系數(shù)時,小尺度域變換的碼率比大尺度有很大提高, 且圖像質量也相應提高0. 71dB,這是因為小尺度域變換中4X4塊相關性大造成全頻模塊 大量增加,使得碼率上升,從而引起圖像質量隨之上升。而圖8中,小尺度域變換下碼率雖 然增加,但由于圖像運動比較劇烈,邊信息生成相對不精確,所以圖像信噪比未能顯著提 高。整體而言,在運動平緩的視頻流中,本文提出的改進算法采用小尺度域變換能取得較好 的效果,但是以耗費更多解碼時間時間為代價。但對兩幅序列而言,根據(jù)圖像的運動情況來 自適應的選擇編碼模式,都具有更好的率失真曲線圖綜上所述,本發(fā)明針對Bernd Girod提出的頻域Wyner-Ziv視頻編碼方案進行擴 展和改進,在此基礎上發(fā)明了一種分類組合的視頻編碼算法。本發(fā)明利用頻域相似性和運 動劇烈程度,從實際應用角度考慮,消除了編碼端大量冗余數(shù)據(jù),并根據(jù)運動劇烈程度采用 不同的方法獲得準確的邊信息,不僅大大降低圖像壓縮率,也使得在同一碼率下,圖像解碼 質量得到提高。
權利要求
一種頻率域分布式視頻編碼中的分類組合方法,其特征在于該方法在編碼器添加模塊分類功能,將圖像分為跳過編碼模式、低頻模式和全頻模式三個編碼模式;在解碼端對應不同的編碼模式提出三個相應的邊信息估算方法獲得邊信息輔助分布式解碼器解碼,該方法處理包括以下步驟步驟1將輸入圖像視頻偶數(shù)序列視為W幀,奇數(shù)幀視為關鍵幀;關鍵幀采用傳統(tǒng)視頻編碼中的幀內編碼方式編碼,其解碼重建幀有兩個用途,一是還原視頻流,一是用于邊信息插值估計出邊信息,步驟2對于W幀,首先做進行離散余弦變換DCT,采用絕對值差MAD準則判斷該W幀每一宏塊的編碼模式后進行預處理,其編碼為Skip模式、低頻模式或全頻模式中的一種,步驟3對圖像宏塊預處理后依次經(jīng)過量化、Turbo編碼器編碼,編碼后的校驗位傳送至解碼端,其傳至解碼端的校驗位數(shù)量視邊信息的準確度而定,步驟4在解碼端,通過解碼重建后的關鍵幀估算邊信息,分別對應Skip模式、低頻模式和全頻模式的編碼方法采用平均插值、自適應搜索運動估計插值和自適應搜索運動估計精細插值邊信息的估算方法獲得準確的邊信息,步驟5Turbo解碼端的校驗位聯(lián)合步驟4獲得的邊信息,經(jīng)過反量化,反離散余弦變換DCT變換重構W幀,步驟6將W幀和關鍵幀合并輸出即得到解碼碼流。
2.如權利要求1所述頻率域分布式視頻編碼中的分類組合方法,其特征在于W幀編碼 方法是依據(jù)圖像內容的運動特征劃分為Skip模式、低頻模式和全頻模式三種編碼模式。
3.如權利要求1所述頻率域分布式視頻編碼中的分類組合方法,其特征在于MAD準則 是利用視頻序列相鄰幀中運動緩和區(qū)以及背景相似區(qū)的離散余弦變換DCT高頻系數(shù)基本 相同這一特性進行加權獲得。
4.如權利要求1所述頻率域分布式視頻編碼中的分類組合方法,其特征在于Skip模 式是指當前宏塊判斷為背景塊,在編碼端丟棄當前宏塊,在解碼端通過其相鄰關鍵幀相同 位置的宏塊進行平均插值獲得邊信息,此時邊信息即為解碼端當前需要解碼宏塊的重建宏 塊。
5.如權利要求1所述頻率域分布式視頻編碼中的分類組合方法,其特征在于低頻模式 是指當前宏塊判斷為運動緩和塊時,編碼端抽取其DCT低頻系數(shù)進行量化后送入Turbo編 碼器,解碼端采用自適應搜索運動估計插值法生成邊信息輔助Turbo解碼器解碼。
6.如權利要求1所述頻率域分布式視頻編碼中的分類組合方法,其特征在于全頻模式 是指當前宏塊判斷為運動劇烈塊時,編碼端對當前宏塊所有DCT系數(shù)編碼,解碼端采用自 適應搜索精細運動估計插值法生成邊信息輔助Turbo解碼器解碼。
7.如權利要求1所述頻率域分布式視頻編碼中的分類組合方法,其特征在于自適應搜 索運動估計插值方法是指在當前W幀的相鄰關鍵幀中根據(jù)圖像運動特性進行自適應搜索 范圍的運動估計尋找當前宏塊的最佳匹配塊的運動矢量,進行非線性插值。
8.如權利要求1所述頻率域分布式視頻編碼中的分類組合方法,其特征在于自適應搜 索運動估計精細插值方法是指將當前W幀的相鄰關鍵幀中根據(jù)圖像運動特性進行自適應 搜索范圍的運動估計搜索出當前宏塊的運動矢量作為初始運動矢量,然后在相鄰關鍵幀中 進一步進行小范圍運動估計匹配搜索,尋找最佳匹配塊的運動矢量后進行非線性插值。
全文摘要
一種頻率域分布式視頻編碼中的分類組合方法依據(jù)無線傳感網(wǎng)絡終端設備編碼復雜度低、存儲容量有限、要求能在信道質量差的網(wǎng)絡中傳輸?shù)忍匦约癢yner-Ziv視頻編碼特點,針對國外研究學者斯坦福大學教授Bernd Girod的頻域Wyner-Ziv視頻編碼方案提出改進。本發(fā)明提出在編碼端將圖像幀劃分三種編碼模式,分別為Skip(跳過)模式、低頻模式和全頻模式,在解碼端根據(jù)相應的編碼模式分別選擇平均插值、自適應搜索運動估計插值和自適應搜索精細運動估計插值的邊信息估算方法聯(lián)合解碼。本文算法既能通過消除大量的幀間預測與熵編碼實現(xiàn)低碼率傳輸,又能以很小的解碼代價獲得更精確的邊信息,從而有效地避免圖像解碼質量下降。
文檔編號H04N7/26GK101835044SQ20101015592
公開日2010年9月15日 申請日期2010年4月23日 優(yōu)先權日2010年4月23日
發(fā)明者劉峰, 肖艷 申請人:南京郵電大學