用于變換系數(shù)等級的熵編碼和熵解碼的參數(shù)更新方法以及使用該方法的變換系數(shù)等級的 ...的制作方法
【專利摘要】提供了一種更新在對變換系數(shù)等級的熵編碼和熵解碼中使用的參數(shù)的方法。通過使用參數(shù)對指示變換系數(shù)等級的語法元素進行二值化。基于將先前變換系數(shù)的大小與基于先前參數(shù)而獲得的預定臨界值進行比較的結(jié)果,更新或保持所述參數(shù),其中,先前參數(shù)在對先前變換系數(shù)等級語法元素的反二值化中被使用。預定臨界值被設置為具有與先前參數(shù)成比例的值,當先前參數(shù)被更新時,更新后的參數(shù)與先前參數(shù)相比具有逐漸增加的值。
【專利說明】用于變換系數(shù)等級的熵編碼和熵解碼的參數(shù)更新方法以及 使用該方法的變換系數(shù)等級的熵編碼裝置和熵解碼裝置
【技術(shù)領(lǐng)域】
[0001] 本申請涉及視頻編碼和解碼,更具體地講,涉及用于對在變換系數(shù)的尺寸信息的 熵編碼和熵解碼中使用的參數(shù)進行更新的方法和設備。
【背景技術(shù)】
[0002] 根據(jù)圖像壓縮方法(諸如,MPEG-1、MPEG-2或MPEG-4H. 264/MPEG-4高級視頻編 碼(AVC)),將圖像劃分為具有預定尺寸的多個塊,隨后通過幀間預測或幀內(nèi)預測獲得多個 塊的殘差數(shù)據(jù)。通過變換、量化、掃描、游程編碼和熵編碼來對殘差數(shù)據(jù)進行壓縮。在熵編 碼中,對諸如變換系數(shù)或運動矢量的語法元素進行熵編碼以輸出比特流。在解碼器端,從比 特流提取語法元素并基于提取出的語法元素執(zhí)行解碼。
【發(fā)明內(nèi)容】
[0003] 技術(shù)問題
[0004] 本發(fā)明提供一種更新參數(shù)的方法,通過該方法,使在對變換系數(shù)的熵編碼和熵解 碼中使用的參數(shù)逐漸被改變,同時防止所述參數(shù)的驟變。
[0005] 本發(fā)明還提供一種對在通過使用二值化方法(諸如Golomb-rice方法或級聯(lián)碼方 法)來對諸如變換系數(shù)等級的語法元素的二值化中使用的參數(shù)進行更新的方法。
[0006] 解決方案
[0007] 根據(jù)本發(fā)明的實施例,提供了一種逐漸更新在對變換系數(shù)等級的二值化中使用的 參數(shù)的參數(shù)更新方法。
[0008] 有益效果
[0009] 根據(jù)本發(fā)明的實施例,通過逐漸改變在變換系數(shù)的等級信息的熵編碼中使用的參 數(shù),在編碼期間產(chǎn)生的比特量可被減少,圖像的增益可被增加。
【專利附圖】
【附圖說明】
[0010] 圖1是根據(jù)本發(fā)明的實施例的用于對視頻進行編碼的設備的框圖;
[0011] 圖2是根據(jù)本發(fā)明的實施例的用于對視頻進行解碼的設備的框圖;
[0012] 圖3是用于描述根據(jù)本發(fā)明的實施例的編碼單元的概念的示圖;
[0013] 圖4是根據(jù)本發(fā)明的實施例的基于具有分層結(jié)構(gòu)的編碼單元的視頻編碼器的框 圖;
[0014] 圖5是根據(jù)本發(fā)明的實施例的基于具有分層結(jié)構(gòu)的編碼單元的視頻解碼器的框 圖;
[0015] 圖6是示出根據(jù)本發(fā)明的實施例的根據(jù)深度的較深層編碼單元和分區(qū) (partition)的不圖;
[0016]圖7是用于描述根據(jù)本發(fā)明的實施例的編碼單元和變換單元之間的關(guān)系的示圖;
[0017] 圖8是用于描述根據(jù)本發(fā)明的實施例的與編碼深度相應的編碼單元的編碼信息 的示圖;
[0018] 圖9是根據(jù)本發(fā)明的實施例的根據(jù)深度的較深層編碼單元的示圖;
[0019] 圖10至圖12是用于描述根據(jù)本發(fā)明的實施例的編碼單元、預測單元和頻率變換 單元之間的關(guān)系的示圖;
[0020] 圖13是用于描述根據(jù)表1的編碼模式信息的編碼單元、預測單元和變換單元之間 的關(guān)系的不圖;
[0021] 圖14是示出根據(jù)本發(fā)明的實施例的對變換單元中包括的變換系數(shù)信息進行熵編 碼和熵解碼的操作的流程圖;
[0022] 圖15示出根據(jù)本發(fā)明的實施例的被熵編碼的變換單元;
[0023] 圖16不出根據(jù)本發(fā)明的實施例的與圖15的變換單兀相應的有效圖;
[0024] 圖17不出與圖15的4X4變換單兀相應的coeff_abs_level_greaterl_flag ;
[0025] 圖18不出與圖15的4X4變換單兀相應的coeff_abs_level_greater2_flag ;
[0026] 圖19不出與圖15的4X4變換單兀相應的coeff_abs_level_remaining ;
[0027] 圖20示出顯示與圖15至圖19中示出的變換單元相關(guān)的語法元素的表;
[0028] 圖21示出根據(jù)本發(fā)明的實施例的被二值化的coeff_abs_level_remaining的另 一示例;
[0029] 圖22是示出根據(jù)本發(fā)明的實施例的熵編碼設備的結(jié)構(gòu)的框圖;
[0030] 圖23是示出根據(jù)本發(fā)明的實施例的二值化設備的結(jié)構(gòu)的框圖;
[0031] 圖24是示出根據(jù)本發(fā)明的實施例的對指示變換系數(shù)等級的語法元素進行熵編碼 的方法的流程圖;
[0032] 圖25是示出根據(jù)本發(fā)明的實施例的熵解碼設備的框圖;
[0033] 圖26是示出根據(jù)本發(fā)明的實施例的反二值化設備的結(jié)構(gòu)的框圖;
[0034] 圖27是示出根據(jù)本發(fā)明的實施例的對變換系數(shù)等級進行熵解碼方法的流程圖。
[0035] 最佳模式
[0036] 根據(jù)本發(fā)明的一方面,提供了一種更新用于對變換系數(shù)等級進行熵解碼的參數(shù)的 方法,所述方法包括:從比特流解析指示包括在變換單元中的變換系數(shù)的大小的變換系數(shù) 等級語法元素;通過將在當前變換系數(shù)之前被恢復的先前變換系數(shù)的大小與基于先前參數(shù) 而獲得的預定臨界值進行比較,來確定是否更新先前參數(shù),其中,先前參數(shù)在對指示先前變 換系數(shù)的大小的先前變換系數(shù)等級語法元素的反二值化中被使用;通過基于確定的結(jié)果更 新或保持先前參數(shù),來獲得在對指示當前變換系數(shù)的大小的當前變換系數(shù)等級語法元素的 反二值化中使用的參數(shù);通過使用獲得的參數(shù)對當前變換系數(shù)等級語法元素進行反二值化 來獲得當前變換系數(shù)的大小,其中,所述預定臨界值被設置為具有與先前參數(shù)成比例的值, 當先前參數(shù)被更新時,更新后的參數(shù)與先前參數(shù)相比具有逐漸增加的值。
[0037] 根據(jù)本發(fā)明的另一方面,提供了一種用于對變換系數(shù)等級進行熵解碼的設備,所 述設備包括:解析單元,從比特流解析指示包括在變換單元中的變換系數(shù)的大小的變換系 數(shù)等級語法元素;參數(shù)確定單元,通過將在當前變換系數(shù)之前被恢復的先前變換系數(shù)的大 小與基于先前參數(shù)而獲得的預定臨界值進行比較,來確定是否更新先前參數(shù),并通過基于 確定的結(jié)果更新或保持先前參數(shù),來獲得在對指示當前變換系數(shù)的大小的當前變換系數(shù)等 級語法元素的反二值化中使用的參數(shù),其中,先前參數(shù)在對指示先前變換系數(shù)的大小的先 前變換系數(shù)等級語法元素的反二值化中被使用;語法元素恢復單元,通過使用獲得的參數(shù) 對當前變換系數(shù)等級語法元素進行反二值化來獲得當前變換系數(shù)的大小,其中,所述預定 臨界值被設置為具有與先前參數(shù)成比例的值,當先前參數(shù)被更新時,更新后的參數(shù)與先前 參數(shù)相比具有逐漸增加的值。
[0038] 根據(jù)本發(fā)明的另一方面,提供了一種更新用于對變換系數(shù)等級進行熵編碼的參數(shù) 的方法,所述方法包括:以預定掃描順序獲得指示包括在變換單元中的變換系數(shù)的大小的 變換系數(shù)等級語法元素;通過將在當前變換系數(shù)之前被編碼的先前變換系數(shù)的大小與基于 先前參數(shù)而獲得的預定臨界值進行比較,來確定是否更新先前參數(shù),其中,先前參數(shù)在對指 示先前變換系數(shù)的大小的先前變換系數(shù)等級語法元素的二值化中被使用;通過基于確定的 結(jié)果更新或保持先前參數(shù),來獲得在對指示當前變換系數(shù)的大小的當前變換系數(shù)等級語法 元素的二值化中使用的參數(shù);通過使用獲得的參數(shù)對當前變換系數(shù)的變換系數(shù)等級語法元 素進行二值化來輸出與當前變換系數(shù)的變換系數(shù)等級語法元素相應的比特串,其中,所述 預定臨界值被設置為具有與先前參數(shù)成比例的值,當先前參數(shù)被更新時,更新后的參數(shù)與 先前參數(shù)相比具有逐漸增加的值。
[0039] 根據(jù)本發(fā)明的另一方面,一種用于對變換系數(shù)等級進行熵編碼的設備,所述設備 包括:參數(shù)確定單元,以預定掃描順序獲得指示包括在變換單元中的變換系數(shù)的大小的變 換系數(shù)等級語法元素,通過將在當前變換系數(shù)之前被編碼的先前變換系數(shù)的大小與基于先 前參數(shù)而獲得的預定臨界值進行比較,來確定是否更新先前參數(shù),通過基于確定的結(jié)果更 新或保持先前參數(shù),來獲得在對指示當前變換系數(shù)的大小的當前變換系數(shù)等級語法元素的 二值化中使用的參數(shù),其中,先前參數(shù)在對指示先前變換系數(shù)的大小的先前變換系數(shù)等級 語法元素的二值化中被使用;比特串產(chǎn)生單元,通過使用獲得的參數(shù)對當前變換系數(shù)的變 換系數(shù)等級語法元素進行二值化來輸出與當前變換系數(shù)的變換系數(shù)等級語法元素相應的 比特串,其中,所述預定臨界值被設置為具有與先前參數(shù)成比例的值,當先前參數(shù)被更新 時,更新后的參數(shù)與先前參數(shù)相比具有逐漸增加的值。
【具體實施方式】
[0040] 以下,將參照附圖詳細描述本發(fā)明的實施例。
[0041] 以下,將參照圖1至圖13描述根據(jù)本發(fā)明的實施例的用于更新在對變換單元的尺 寸信息進行熵編碼和解碼時使用的參數(shù)的方法和設備。另外,將參照圖14至圖29詳細地 描述對語法元素進行熵編碼和熵解碼的方法,其中,通過使用參照圖1至圖13描述的對視 頻進行熵編碼和解碼的方法來獲得所述語法元素。當諸如"…中的至少一個"的表達在一 列元件之后時,其修飾整列元件而不修飾列出的單個元件。
[0042] 圖1是根據(jù)本發(fā)明的實施例的視頻編碼設備100的框圖。
[0043] 視頻編碼設備100包括分層編碼器110和熵編碼器120。
[0044] 分層編碼器110以預定數(shù)據(jù)單元為單位劃分被編碼的當前畫面,以對每個數(shù)據(jù)單 元執(zhí)行編碼。詳細地,分層編碼器110可基于最大編碼單元劃分當前畫面,其中,最大編碼 單元是最大尺寸的編碼單元。根據(jù)本發(fā)明的實施例的最大編碼單元可以是尺寸為32X32、 64X64、128X128、256X256等的數(shù)據(jù)單元,其中,數(shù)據(jù)單元的形狀是寬度和長度是2的若 干次方并大于8的正方形。
[0045] 根據(jù)本發(fā)明的實施例的編碼單元可由最大尺寸和深度來表征。深度表示編碼單元 在空間上從最大編碼單元被劃分的次數(shù),并且隨著深度加深,根據(jù)深度的較深層編碼單元 可從最大編碼單元被劃分到最小編碼單元。最大編碼單元的深度是最高深度,最小編碼單 元的深度是最低深度。由于與每個深度相應的編碼單元的尺寸隨著最大編碼單元的深度加 深而減小,因此與較高深度相應的編碼單元可包括與較低深度相應的多個編碼單元。
[0046] 如上所述,根據(jù)編碼單元的最大尺寸將當前畫面的圖像數(shù)據(jù)劃分為最大編碼單 元,每個最大編碼單元可包括根據(jù)深度劃分的較深層編碼單元。由于根據(jù)本發(fā)明的實施例 的最大編碼單元根據(jù)深度被劃分,因此包括在最大編碼單元中的空間域的圖像數(shù)據(jù)可根據(jù) 深度被分層地分類。
[0047] 可預先確定編碼單元的最大深度和最大尺寸,其中,所述最大深度和最大尺寸限 制最大編碼單元的高度和寬度被分層劃分的總次數(shù)。
[0048] 分層編碼器110對通過根據(jù)深度劃分最大編碼單元的區(qū)域而獲得的至少一個劃 分的區(qū)域進行編碼,并根據(jù)所述至少一個劃分的區(qū)域確定用于輸出最終編碼的圖像數(shù)據(jù)的 深度。換句話說,分層編碼器110通過根據(jù)當前畫面的最大編碼單元按照根據(jù)深度的較深 層編碼單元對圖像數(shù)據(jù)進行編碼并選擇具有最小編碼誤差的深度,來確定編碼深度。確定 的編碼深度和根據(jù)最大編碼單元的編碼的圖像數(shù)據(jù)被輸出到熵編碼器120。
[0049] 基于與等于或低于最大深度的至少一個深度相應的較深層編碼單元來對最大編 碼單元中的圖像數(shù)據(jù)進行編碼,并基于每個較深層編碼單元來比較對圖像數(shù)據(jù)進行編碼的 結(jié)果??稍诒容^較深層編碼單元的編碼誤差之后選擇具有最小編碼誤差的深度??舍槍γ?個最大編碼單元選擇至少一個編碼深度。
[0050] 隨著編碼單元根據(jù)深度被分層劃分并隨著編碼單元的數(shù)量增加,最大編碼單元的 尺寸被劃分。另外,即使在一個最大編碼單元中編碼單元相應于同一深度,仍通過單獨測量 每個編碼單元的圖像數(shù)據(jù)的編碼誤差來確定是否將與同一深度相應的每個編碼單元劃分 到更低深度。因此,即使在圖像數(shù)據(jù)被包括在一個最大編碼單元中時,圖像數(shù)據(jù)仍根據(jù)深度 被劃分成區(qū)域,并且在所述一個最大編碼單元中編碼誤差也會根據(jù)區(qū)域而不同,因此編碼 深度可根據(jù)圖像數(shù)據(jù)中的區(qū)域而不同。因此,可在一個最大編碼單元中確定一個或更多個 編碼深度,并可根據(jù)至少一個編碼深度的編碼單元來劃分最大編碼單元的圖像數(shù)據(jù)。
[0051] 因此,分層編碼器110可確定包括在最大編碼單元中的具有樹結(jié)構(gòu)的編碼單元。 根據(jù)本發(fā)明的實施例的"具有樹結(jié)構(gòu)的編碼單元"包括最大編碼單元中所包括的所有較深 層編碼單元中的與被確定為編碼深度的深度相應的編碼單元??稍谧畲缶幋a單元的同一區(qū) 域中根據(jù)深度分層地確定具有編碼深度的編碼單元,并可在不同區(qū)域中獨立地確定具有編 碼深度的編碼單元。類似地,當前區(qū)域中的編碼深度可與另一區(qū)域中的編碼深度獨立地被 確定。
[0052] 根據(jù)本發(fā)明的實施例的最大深度是與從最大編碼單元到最小編碼單元的執(zhí)行的 劃分次數(shù)相關(guān)的索引。根據(jù)本發(fā)明的實施例的第一最大深度可表示從最大編碼單元到最小 編碼單元的總劃分次數(shù)。根據(jù)本發(fā)明的實施例的第二最大深度可表示從最大編碼單元到最 小編碼單元的深度級別的總數(shù)。例如,當最大編碼單元的深度是0時,最大編碼單元被劃分 一次的編碼單元的深度可被設置為1,最大編碼單元被劃分兩次的編碼單元的深度可被設 置為2。這里,如果最小編碼單元是最大編碼單元被劃分四次的編碼單元,則存在深度0、深 度1、深度2、深度3、深度4這5個深度級別,因此,第一最大深度可被設置為4,第二最大深 度可被設置為5。
[0053] 可根據(jù)最大編碼單元執(zhí)行預測編碼和變換。還根據(jù)最大編碼單元,基于根據(jù)等于 最大深度的深度或小于最大深度的深度的較深層編碼單元來執(zhí)行預測編碼和變換。
[0054] 由于每當最大編碼單元根據(jù)深度被劃分時較深層編碼單元的數(shù)量增加,因此對隨 著深度加深而產(chǎn)生的所有較深層編碼單元執(zhí)行包括預測編碼和變換的編碼。為了便于描 述,現(xiàn)在將在最大編碼單元中基于當前深度的編碼單元來描述預測編碼和變換。
[0055] 視頻編碼設備100可不同地選擇用于對圖像數(shù)據(jù)進行編碼的數(shù)據(jù)單元的尺寸或 形狀。為了對圖像數(shù)據(jù)進行編碼,執(zhí)行諸如預測編碼、變換和熵編碼的操作,此時,可針對所 有操作使用相同的數(shù)據(jù)單元,或者可針對每個操作使用不同的數(shù)據(jù)單元。
[0056] 例如,視頻編碼設備100可不僅選擇用于對圖像數(shù)據(jù)進行編碼的編碼單元,還可 選擇與該編碼單元不同的數(shù)據(jù)單元以對編碼單元中的圖像數(shù)據(jù)執(zhí)行預測編碼。
[0057] 為了在最大編碼單元中執(zhí)行預測編碼,可基于與編碼深度相應的編碼單元(即, 基于不再被劃分為與更低深度相應的編碼單元的編碼單元)執(zhí)行預測編碼。在下文中,不 再被劃分并且成為用于預測編碼的基本單元的編碼單元現(xiàn)在將被稱為"預測單元"。通過劃 分預測單元而獲得的分區(qū)可包括預測單元或通過劃分預測單元的高度和寬度中的至少一 個而獲得的數(shù)據(jù)單元。
[0058] 例如,當2NX2N(其中,N是正整數(shù))的編碼單元不再被劃分并且成為2NX2N的 預測單元時,分區(qū)的尺寸可以是2NX2N、2NXN、NX2N或NXN。分區(qū)類型的示例包括通過 對稱地劃分預測單元的高度或?qū)挾榷@得的對稱分區(qū)、通過非對稱地劃分預測單元的高度 或?qū)挾龋ㄖT如,l:n或n:l)而獲得的分區(qū)、通過幾何地劃分預測單元而獲得的分區(qū)以及具有 任意形狀的分區(qū)。
[0059] 預測單元的預測模式可以是幀內(nèi)模式、幀間模式和跳過模式中的至少一個。例如, 可對2NX2N、2NXN、NX2N或NXN的分區(qū)執(zhí)行幀內(nèi)模式或幀間模式。另外,可僅對2NX2N 的分區(qū)執(zhí)行跳過模式??瑟毩⒌貙幋a單元中的一個預測單元執(zhí)行編碼,從而選擇具有最 小編碼誤差的預測模式。
[0060] 視頻編碼設備100還可不僅基于用于對圖像數(shù)據(jù)進行編碼的編碼單元對編碼單 元中的圖像數(shù)據(jù)執(zhí)行變換,還可基于與編碼單元不同的數(shù)據(jù)單元對編碼單元中的圖像數(shù)據(jù) 執(zhí)行變換。
[0061] 為了在編碼單元中執(zhí)行變換,可基于具有小于或等于編碼單元的尺寸的數(shù)據(jù)單元 執(zhí)行變換。例如,用于變換的數(shù)據(jù)單元可包括用于幀內(nèi)模式的數(shù)據(jù)單元以及用于幀間模式 的數(shù)據(jù)單元。
[0062] 用作變換的基礎的數(shù)據(jù)單元現(xiàn)將被稱為"變換單元"。與編碼單元類似,編碼單元 中的變換單元可被遞歸地劃分為更小尺寸的區(qū)域,從而變換單元可以以區(qū)域為單位被獨立 確定。因此,可根據(jù)具有根據(jù)變換深度的樹結(jié)構(gòu)的變換單元來劃分編碼單元中的殘差數(shù)據(jù)。 [0063] 也可在變換單元中設置變換深度,變換深度指示通過劃分編碼單元的高度和寬度 來達到變換單元而執(zhí)行的劃分次數(shù)。例如,在2NX2N的當前編碼單元中,當變換單元的尺 寸是2NX2N時,變換深度可以是0,當變換單元的尺寸是NXN時,變換深度可以是1,當變 換單元的尺寸是N/2XN/2時,變換深度可以是2。也就是說,還可根據(jù)變換深度設置具有樹 結(jié)構(gòu)的變換單元。
[0064] 根據(jù)與編碼深度相應的編碼單元的編碼信息不僅需要關(guān)于編碼深度的信息,還需 要與預測編碼和變換相關(guān)的信息。因此,分層編碼器110不僅確定具有最小編碼誤差的編 碼深度,還可確定預測單元中的分區(qū)類型、根據(jù)預測單元的預測模式以及用于變換的變換 單元的尺寸。
[0065] 稍后將參照圖3至圖12來對根據(jù)本發(fā)明的實施例的最大編碼單元中的根據(jù)樹結(jié) 構(gòu)的編碼單元和確定分區(qū)的方法進行詳細描述。
[0066] 分層編碼器110可通過使用基于拉格朗日乘子(Lagrangianmultiplier)的率失 真優(yōu)化,測量根據(jù)深度的較深層編碼單元的編碼誤差。
[0067] 熵編碼器120在比特流中輸出最大編碼單元的圖像數(shù)據(jù)以及關(guān)于根據(jù)編碼深度 的編碼模式的信息,其中,最大編碼單元的圖像數(shù)據(jù)基于由分層編碼器110確定的至少一 個編碼深度被編碼。編碼圖像數(shù)據(jù)可以是圖像的殘差數(shù)據(jù)的編碼結(jié)果。關(guān)于根據(jù)編碼深度 的編碼模式的信息可包括關(guān)于編碼深度的信息、關(guān)于預測單元中的分區(qū)類型的信息、預測 模式信息和變換單元的尺寸信息。具體地,如稍后將描述,熵編碼器120在對指示變換單元 的尺寸的語法元素進行熵編碼時,通過使用被逐漸更新的參數(shù),根據(jù)比特串對指示變換系 數(shù)的大小的語法元素進行二值化。稍后將詳細描述通過使用熵編碼單元120對變換單元進 行熵編碼的操作。
[0068] 可通過使用根據(jù)深度的劃分信息來定義關(guān)于編碼深度的信息,其中,所述根據(jù)深 度的劃分信息指示是否對更低深度而非當前深度的編碼單元執(zhí)行編碼。如果當前編碼單元 的當前深度是編碼深度,則當前編碼單元中的圖像數(shù)據(jù)被編碼和輸出,因此劃分信息可被 定義為不將當前編碼單元劃分至更低深度??蛇x擇地,如果當前編碼單元的當前深度不是 編碼深度,則對更低深度的編碼單元執(zhí)行編碼,因此,劃分信息可被定義為對當前編碼單元 進行劃分以獲得更低深度的編碼單元。
[0069] 如果當前深度不是編碼深度,則對被劃分為更低深度的編碼單元的編碼單元執(zhí)行 編碼。由于在當前深度的一個編碼單元中存在更低深度的至少一個編碼單元,因此對更低 深度的每個編碼單元重復執(zhí)行編碼,因此,可針對具有同一深度的編碼單元遞歸地執(zhí)行編 碼。
[0070] 由于針對一個最大編碼單元確定具有樹結(jié)構(gòu)的編碼單元,并且針對編碼深度的編 碼單元確定關(guān)于至少一個編碼模式的信息,因此可針對一個最大編碼單元確定關(guān)于至少一 個編碼模式的信息。另外,由于根據(jù)深度分層地劃分圖像數(shù)據(jù),因此最大編碼單元的圖像數(shù) 據(jù)的編碼深度可根據(jù)位置而不同,因此,可針對圖像數(shù)據(jù)設置關(guān)于編碼深度和編碼模式的 信息。
[0071] 因此,熵編碼器120可將關(guān)于相應的編碼深度和編碼模式的編碼信息分配給包括 在最大編碼單元中的編碼單元、預測單元和最小單元中的至少一個。
[0072] 根據(jù)本發(fā)明的實施例的最小單元是通過將構(gòu)成最低深度的最小編碼單元劃分為4 份而獲得的正方形形狀的數(shù)據(jù)單元。可選擇地,最小單元可以是可被包括在最大編碼單元 中包括的所有編碼單元、預測單元、分區(qū)單元和變換單元中的最大正方形形狀的數(shù)據(jù)單元。
[0073] 例如,通過熵編碼器120輸出的編碼信息可被分類為根據(jù)編碼單元的編碼信息和 根據(jù)預測單元的編碼信息。根據(jù)編碼單元的編碼信息可包括關(guān)于預測模式的信息以及關(guān)于 分區(qū)的尺寸的信息。根據(jù)預測單元的編碼信息可包括關(guān)于幀間模式的估計方向的信息、關(guān) 于幀間模式的參考圖像索引的信息、關(guān)于運動矢量的信息、關(guān)于幀內(nèi)模式的色度分量的信 息以及關(guān)于幀內(nèi)模式的插值方法的信息。此外,關(guān)于根據(jù)畫面、條帶或GOP定義的編碼單元 的最大尺寸的信息以及關(guān)于最大深度的信息可被插入到比特流的頭中。
[0074] 在視頻編碼設備100中,較深層編碼單元可以是通過將作為上一層的更高深度的 編碼單元的高度或?qū)挾葎澐譃?份而獲得的編碼單元。換句話說,在當前深度的編碼單元 的尺寸是2NX2N時,更低深度的編碼單元的尺寸是NXN。另外,尺寸為2NX2N的當前深度 的編碼單元可包括最多4個更低深度的編碼單元。
[0075] 因此,基于考慮當前畫面的特性而確定的最大編碼單元的尺寸和最大深度,視頻 編碼設備100可通過針對每個最大編碼單元確定具有最佳形狀和最佳尺寸的編碼單元,來 形成具有樹結(jié)構(gòu)的編碼單元。另外,由于可通過使用各種預測模式和變換中的任意一種來 對每個最大編碼單元執(zhí)行編碼,因此可考慮各種圖像尺寸的編碼單元的特性來確定最佳編 碼模式。
[0076] 因此,如果按照傳統(tǒng)的宏塊對具有高分辨率或大數(shù)據(jù)量的圖像進行編碼,則每個 畫面的宏塊的數(shù)量急劇增加。因此,針對每個宏塊產(chǎn)生的壓縮信息的條數(shù)增加,因而難以發(fā) 送壓縮信息并且數(shù)據(jù)壓縮效率下降。然而,通過使用視頻編碼設備1〇〇,因為在考慮圖像的 特征的同時調(diào)整了編碼單元,同時,在考慮圖像的尺寸的同時增大了編碼單元的最大尺寸, 所以圖像壓縮效率可增加。
[0077] 圖2是根據(jù)本發(fā)明的實施例的視頻解碼設備200的框圖。
[0078] 視頻解碼設備200包括解析器210、熵解碼器220和分層解碼器230。用于視頻解 碼設備200的各種操作的各種術(shù)語(諸如編碼單元、深度、預測單元、變換單元以及關(guān)于各 種編碼模式的信息)的定義與參照圖1和視頻編碼設備100所描述的那些術(shù)語的定義相 同。
[0079] 解析器210接收編碼的視頻的比特流并對語法元素進行解析。熵解碼器220通過 對解析后的語法元素執(zhí)行熵解碼來提取指示基于具有樹結(jié)構(gòu)的編碼單元的編碼圖像數(shù)據(jù) 的語法元素,并將提取的語法元素輸出到分層解碼器230。也就是說,熵解碼器220對以0 和1的比特串的形式接收的語法元素執(zhí)行熵解碼,從而恢復該語法元素。
[0080] 另外,熵解碼器220從解析的比特流提取根據(jù)每個最大編碼單元的具有樹結(jié)構(gòu)的 編碼單元的關(guān)于編碼深度的信息、編碼模式、顏色分量信息和預測模式信息等。提取的關(guān)于 編碼深度和編碼模式的信息被輸出到分層解碼器230。比特流中的圖像數(shù)據(jù)被劃分為最大 編碼單元,從而分層解碼器230可針對每個最大編碼單元對圖像數(shù)據(jù)進行解碼。
[0081] 可針對關(guān)于與編碼深度相應的至少一個編碼單元的信息設置關(guān)于根據(jù)最大編碼 單元的編碼深度和編碼模式的信息,關(guān)于編碼模式的信息可包括關(guān)于與編碼深度相應的相 應編碼單元的分區(qū)類型的信息、關(guān)于預測模式的信息以及變換單元的尺寸的信息。另外,根 據(jù)深度的劃分信息可被提取作為關(guān)于編碼深度的信息。
[0082] 由熵解碼器220提取的關(guān)于根據(jù)每個最大編碼單元的編碼深度和編碼模式的信 息是關(guān)于這樣的編碼深度和編碼模式的信息,即:所述編碼深度和編碼模式被確定為當編 碼器(諸如視頻編碼設備100)根據(jù)每個最大編碼單元針對根據(jù)深度的每個較深層編碼單 元重復執(zhí)行編碼時產(chǎn)生最小編碼誤差。因此,視頻解碼設備200可通過根據(jù)產(chǎn)生最小編碼 誤差的編碼深度和編碼模式對圖像數(shù)據(jù)進行解碼來恢復圖像。
[0083] 由于關(guān)于編碼深度和編碼模式的編碼信息可被分配給相應的編碼單元、預測單元 和最小單元中的預定數(shù)據(jù)單元,因此熵解碼器220可提取關(guān)于根據(jù)預定數(shù)據(jù)單元的編碼深 度和編碼模式的信息。當關(guān)于相應最大編碼單元的編碼深度和編碼模式的信息被分配給每 個預定數(shù)據(jù)單元時,被分配有相同的關(guān)于編碼深度和編碼模式的信息的預定數(shù)據(jù)單元可被 推斷為包括在同一最大編碼單元中的數(shù)據(jù)單元。
[0084] 此外,如稍后將描述,熵解碼器220通過使用被逐漸更新的參數(shù)來對指示變換系 數(shù)的大小的語法元素進行反二值化。稍后將詳細描述通過使用熵解碼器220對與指示變換 單元的尺寸的語法元素相應的比特串進行反二值化,來獲得變換系數(shù)的尺寸信息的操作。
[0085] 分層解碼器230可通過基于關(guān)于根據(jù)最大編碼單元的編碼深度和編碼模式的信 息,對每個最大編碼單元中的圖像數(shù)據(jù)進行解碼來恢復當前畫面。換句話說,分層解碼器 230可針對包括在每個最大編碼單元中的具有樹結(jié)構(gòu)的編碼單元中的每個編碼單元,基于 提取的關(guān)于分區(qū)類型、預測模式和變換單元的信息對編碼的圖像數(shù)據(jù)進行解碼。解碼處理 可包括預測和逆變換,其中,所述預測包括幀內(nèi)預測和運動補償。
[0086] 分層解碼器230可基于關(guān)于根據(jù)編碼深度的編碼單元的預測單元的分區(qū)類型和 預測模式的信息,根據(jù)每個編碼單元的分區(qū)和預測模式執(zhí)行幀內(nèi)預測或運動補償。
[0087] 此外,分層解碼器230可基于關(guān)于根據(jù)編碼深度的編碼單元的變換單元的尺寸的 信息,根據(jù)編碼單元中的每個變換單元執(zhí)行逆變換,以便執(zhí)行根據(jù)最大編碼單元的逆變換。 [0088] 分層解碼器230可通過使用根據(jù)深度的劃分信息確定當前最大編碼單元的至少 一個編碼深度。如果劃分信息指示在當前深度中圖像數(shù)據(jù)不再被劃分,則當前深度是編碼 深度。因此,分層解碼器230可通過使用關(guān)于預測單元的分區(qū)類型、預測模式和變換單元的 尺寸的信息,針對當前最大編碼單元的圖像數(shù)據(jù)對當前深度的編碼單元進行解碼。
[0089] 換句話說,可通過觀察為編碼單元、預測單元和最小單元中的預定數(shù)據(jù)單元分配 的編碼信息集,收集包含編碼信息(所述編碼信息包括相同的劃分信息)的數(shù)據(jù)單元,收集 的數(shù)據(jù)單元可被認為是將由分層解碼器230以相同編碼模式解碼的一個數(shù)據(jù)單元。
[0090] 視頻解碼設備200可獲得與在對每個最大編碼單元遞歸地執(zhí)行編碼時產(chǎn)生最小 編碼誤差的至少一個編碼單元有關(guān)的信息,并且視頻解碼設備200可使用所述信息來對當 前畫面進行解碼。換句話說,可以對每個最大編碼單元中被確定為最佳編碼單元的具有樹 結(jié)構(gòu)的編碼單元的編碼圖像數(shù)據(jù)進行解碼。
[0091] 因此,即使圖像數(shù)據(jù)具有高分辨率和大數(shù)據(jù)量,也可通過使用編碼單元的尺寸和 編碼模式有效地對所述圖像數(shù)據(jù)進行解碼和恢復,其中,通過使用從編碼器接收的關(guān)于最 佳編碼模式的信息,根據(jù)圖像數(shù)據(jù)的特性來自適應地確定編碼單元的尺寸和編碼模式。
[0092] 現(xiàn)將參照圖3至圖13描述根據(jù)本發(fā)明的實施例的確定具有樹結(jié)構(gòu)的編碼單元、預 測單元和變換單元的方法。
[0093] 圖3是用于描述根據(jù)本發(fā)明的實施例的編碼單元的概念的示圖。
[0094] 編碼單元的尺寸可按照寬度X高度來表示,并可以是64X64、32X32、16X16和 8X8。64X64的編碼單元可被劃分為64X64、64X32、32X64或32X32的分區(qū),32X32的 編碼單元可被劃分為32X32、32X16、16X32或16X16的分區(qū),16X16的編碼單元可被劃 分為16父16、16\8、8\16或8\8的分區(qū),8\8的編碼單元可被劃分為8\8、8\4、4父8或 4X4的分區(qū)。
[0095] 關(guān)于視頻數(shù)據(jù)310,設置了分辨率是1920X1080,編碼單元的最大尺寸是64,并且 最大深度是2。關(guān)于視頻數(shù)據(jù)320,設置了分辨率是1920X1080,編碼單元的最大尺寸是64, 并且最大深度是3。關(guān)于視頻數(shù)據(jù)330,設置了分辨率是352X288,編碼單元的最大尺寸是 16,并且最大深度是1。圖3中示出的最大深度表示從最大編碼單元到最小解碼單元的劃分 總數(shù)。
[0096] 如果分辨率高或者數(shù)據(jù)量大,則編碼單元的最大尺寸可以較大以便不僅提高編碼 效率還精確地地反映圖像的特性。因此,分辨率比視頻數(shù)據(jù)330更高的視頻數(shù)據(jù)310和視 頻數(shù)據(jù)320的編碼單元的最大尺寸可以是64。
[0097] 由于視頻數(shù)據(jù)310的最大深度是2,因此由于通過劃分最大編碼單元兩次深度被 加深到兩層,視頻數(shù)據(jù)310的編碼單元315可包括長軸尺寸為64的最大編碼單元以及長軸 尺寸為32和16的編碼單元。同時,由于視頻數(shù)據(jù)330的最大深度是1,因此由于通過劃分 最大編碼單元一次深度被加深到一層,視頻數(shù)據(jù)330的編碼單元335可包括長軸尺寸為16 的最大編碼單元以及長軸尺寸為8的編碼單元。
[0098] 由于視頻數(shù)據(jù)320的最大深度是3,因此由于通過劃分最大編碼單元三次深度被 加深到3層,視頻數(shù)據(jù)320的編碼單元325可包括長軸尺寸為64的最大編碼單元以及長軸 尺寸為32、16和8的編碼單元。隨著深度加深,可精確地表示詳細的信息。
[0099] 圖4是根據(jù)本發(fā)明的實施例的基于具有分層結(jié)構(gòu)的編碼單元的視頻編碼器400的 框圖。
[0100] 幀內(nèi)預測器410針對當前幀405,對幀內(nèi)模式下的編碼單元執(zhí)行幀內(nèi)預測,運動估 計器420和運動補償器425通過使用當前幀405和參考幀495,對幀間模式下的編碼單元執(zhí) 行幀間估計和運動補償。
[0101] 從幀內(nèi)預測器410、運動估計器420和運動補償器425輸出的數(shù)據(jù)通過變換器430 和量化器440被輸出為量化后的變換系數(shù)。量化后的變換系數(shù)通過反量化器460和逆變換 器470被恢復為空間域中的數(shù)據(jù),并且恢復的空間域中的數(shù)據(jù)在通過去塊單元480和環(huán)路 濾波單元490被后處理之后被輸出為參考幀495。量化的變換系數(shù)可通過熵編碼器450被 輸出為比特流455。
[0102] 熵編碼單元450對如下的與變換單元的語法元素進行算術(shù)編碼:諸如,指示非0的 變換單元的位置的有效圖、指示變換單元是否具有大于1的值的第一臨界值標記(C〇eff_ abs_level_greaterl_flag)、指示變換單元是否具有大于2的值的第二臨界值(coeff_ abs_level_greather2_flag)、變換系數(shù)的大小信息(coeff_abs_level_remaining),其中, 所述大小信息與基于第一臨界值和第二臨界值確定的基本等級(baseLevel)和實際的變 換系數(shù)(abscoeff)之間的差相應。
[0103] 為了使視頻編碼器400被應用到視頻編碼設備100中,視頻編碼器400的所有元 件(即,幀內(nèi)預測器410、運動估計器420、運動補償器425、變換器430、量化器440、熵編碼 器450、反量化器460、逆變換器470、去塊單元480和環(huán)路濾波單元490)必需在考慮每個最 大編碼單元的最大深度的同時,基于具有樹結(jié)構(gòu)的多個編碼單元中的每個編碼單元執(zhí)行操 作。
[0104] 具體地講,幀內(nèi)預測器410、運動估計器420和運動補償器425在考慮當前最大編 碼單元的最大尺寸和最大深度的同時,確定具有樹結(jié)構(gòu)的多個編碼單元中的每個編碼單元 的分區(qū)和預測模式,并且變換器430確定具有樹結(jié)構(gòu)的多個編碼單元中的每個編碼單元中 的變換單元的尺寸。
[0105] 圖5是根據(jù)本發(fā)明的實施例的基于編碼單元的視頻解碼器500的框圖。
[0106] 解析器510從比特流505解析將被解碼的編碼圖像數(shù)據(jù)以及解碼所需的關(guān)于編碼 的信息。編碼圖像數(shù)據(jù)通過解碼器520和反量化器530被輸出為反量化的數(shù)據(jù)。熵解碼器 520從比特流獲得如下的與變換單元相關(guān)的元素并對獲得的語法元素進行算術(shù)解碼以便恢 復語法元素:即,指示非0的變換單元的位置的有效圖、指示變換單元是否具有大于1的值 的第一臨界值標記(coeff_abs_level_greaterl_flag)、指示變換單元是否具有大于2的 值的第二臨界值(coeff_abs_level_greather2_flag)、變換系數(shù)的大小信息(coeff_abs_ level_remaining),其中,所述大小信息與基于第一臨界值和第二臨界值確定的基本等級 (baseLevel)和實際的變換系數(shù)(abscoeff)之間的差相應。
[0107] 逆變換器540將反量化的數(shù)據(jù)恢復為空間域中的圖像數(shù)據(jù)。幀內(nèi)預測器550針對 空間域中的圖像數(shù)據(jù)對幀內(nèi)模式下的編碼單元執(zhí)行幀內(nèi)預測,運動補償器560通過使用參 考幀585對幀間模式下的編碼單元執(zhí)行運動補償。
[0108] 已經(jīng)過幀內(nèi)預測器550和運動補償器560的空間域中的圖像數(shù)據(jù)在通過去塊單元 570和環(huán)路濾波單元580被后處理之后,可被輸出為恢復的幀595。另外,經(jīng)過去塊單元570 和環(huán)路濾波單元580被后處理的圖像數(shù)據(jù)可被輸出為參考幀585。
[0109] 為了使圖像解碼器500被應用到視頻解碼設備200中,圖像解碼器500的所有元 件(即,解析器510、熵解碼器520、反量化器530、逆變換器540、幀內(nèi)預測器550、運動補償 器560、去塊單元570和環(huán)路濾波單元580)基于每個最大編碼單元的具有樹結(jié)構(gòu)的編碼單 元執(zhí)行操作。
[0110] 幀內(nèi)預測器550和運動補償器560針對具有樹結(jié)構(gòu)的每個編碼單元確定分區(qū)和預 測模式,并且逆變換器540必需針對每個編碼單元確定變換單元的尺寸。
[0111] 圖6是示出根據(jù)本發(fā)明的實施例的根據(jù)深度的較深層編碼單元和分區(qū)的示圖。
[0112] 視頻編碼設備100和視頻解碼設備200使用分層的編碼單元以考慮圖像的特性。 編碼單元的最大高度、最大寬度和最大深度可根據(jù)圖像的特性被自適應地確定,或者可由 用戶不同地設置。根據(jù)深度的較深層編碼單元的尺寸可根據(jù)編碼單元的預定最大尺寸被確 定。
[0113] 在根據(jù)本發(fā)明的實施例的編碼單元的分層結(jié)構(gòu)600中,編碼單元的最大高度和最 大寬度都是64,并且最大深度是4。由于深度沿著分層結(jié)構(gòu)600的縱軸加深,因此較深層編 碼單元的高度和寬度都被劃分。另外,作為用于每個較深層編碼單元的預測編碼的基礎的 預測單元和分區(qū)沿分層結(jié)構(gòu)600的橫軸被示出。
[0114] 換句話說,編碼單元610是分層結(jié)構(gòu)600中的最大編碼單元,其中,深度是0,尺寸 (即,高度乘寬度)是64X64。深度沿縱軸加深,并且存在尺寸為32X32且深度為1的編 碼單元620、尺寸為16X16且深度為2的編碼單元630、尺寸為8X8且深度為3的編碼單 元640以及尺寸為4X4且深度為4的編碼單元650。尺寸為4X4且深度為4的編碼單元 650是最小編碼單元。
[0115]編碼單元的預測單元和分區(qū)根據(jù)每個深度沿橫軸排列。換句話說,如果尺寸為 64X64且深度為0的編碼單元610是預測單元,則該預測單元可被劃分為包括在編碼單元 610中的分區(qū)(即,尺寸為64X64的分區(qū)610、尺寸為64X32的分區(qū)612、尺寸為32X64的 分區(qū)614、或者尺寸為32X32的分區(qū)616)。
[0116] 類似地,尺寸為32X32且深度為1的編碼單元620的預測單元可被劃分為包括在 編碼單元620中的分區(qū)(S卩,尺寸為32X32的分區(qū)620、尺寸為32X16的分區(qū)622、尺寸為 16X32的分區(qū)624以及尺寸為16X16的分區(qū)626)。
[0117] 類似地,尺寸為16X16且深度為2的編碼單元630的預測單元可被劃分為包括在 編碼單元630中的分區(qū)(S卩,包括在編碼單元630中的尺寸為16X16的分區(qū)、尺寸為16X8 的分區(qū)632、尺寸為8X16的分區(qū)634以及尺寸為8X8的分區(qū)636)。
[0118] 類似地,尺寸為8X8且深度為3的編碼單元640的預測單元可被劃分為包括在編 碼單元640中的分區(qū)(S卩,包括在編碼單元640中的尺寸為8X8的分區(qū)、尺寸為8X4的分 區(qū)642、尺寸為4X8的分區(qū)644以及尺寸為4X4的分區(qū)646)。
[0119]尺寸為4X4且深度為4的編碼單元650是最小編碼單元以及最低深度的編碼單 元。編碼單元650的預測單元僅被分配給尺寸為4X4的分區(qū)。
[0120] 為了確定構(gòu)成最大編碼單元610的編碼單元的至少一個編碼深度,視頻編碼設備 100的分層編碼器110對包括在最大編碼單元610中的與每個深度相應的編碼單元執(zhí)行編 碼。
[0121] 隨著深度加深,包括相同范圍和相同尺寸的數(shù)據(jù)的根據(jù)深度的較深層編碼單元的 數(shù)量增加。例如,需要四個與深度2相應的編碼單元以覆蓋包括在一個與深度1相應的編 碼單元中的數(shù)據(jù)。因此,為了根據(jù)深度對相同數(shù)據(jù)的多個編碼結(jié)果進行比較,與深度1相應 的編碼單元以及與深度2相應的四個編碼單元都被編碼。
[0122] 為了針對多個深度中的當前深度執(zhí)行編碼,通過沿分層結(jié)構(gòu)600的橫軸,對與當 前深度相應的多個編碼單元中的每個預測單元執(zhí)行編碼來針對當前深度選擇最小編碼誤 差??蛇x擇地,隨著深度沿分層結(jié)構(gòu)600的縱軸加深,可通過針對每個深度執(zhí)行編碼,通過 根據(jù)深度比較最小編碼誤差,從而搜索最小編碼誤差。在最大編碼單元610中的具有最小 編碼誤差的深度和分區(qū)可被選為最大編碼單元610的編碼深度和分區(qū)類型。
[0123]圖7是用于描述根據(jù)本發(fā)明的實施例的編碼單元710和變換單元720之間的關(guān)系 的示圖。
[0124]視頻編碼設備100或視頻解碼設備200針對每個最大編碼單元根據(jù)尺寸小于或等 于最大編碼單元的編碼單元來對圖像進行編碼或解碼??苫诓淮笥谙鄳幋a單元的數(shù)據(jù) 單元來選擇在編碼期間用于變換的變換單元的尺寸。
[0125]例如,在視頻編碼設備100或視頻解碼設備200中,如果編碼單元710的尺寸是 64X64,則可通過使用尺寸為32X32的變換單元720來執(zhí)行變換。
[0126]另外,可通過對小于64X64的尺寸為32X32、16X16、8X8和4X4的每個變換單 元執(zhí)行變換,來對尺寸為64X64的編碼單元710的數(shù)據(jù)進行編碼,并且隨后可選擇具有最 小編碼誤差的變換單元。
[0127]圖8是用于描述根據(jù)本發(fā)明的實施例的與編碼深度相應的編碼單元的編碼信息 的示圖。
[0128] 視頻編碼設備100的輸出單元130可對關(guān)于分區(qū)類型的信息800、關(guān)于預測模式 的信息810以及關(guān)于與編碼深度相應的每個編碼單元的變換單元的尺寸的信息820進行編 碼,并將信息800、信息810和信息820作為關(guān)于編碼模式的信息來發(fā)送。
[0129] 信息800指示關(guān)于通過劃分當前編碼單元的預測單元而獲得的分區(qū)的形狀的信 息,其中,所述分區(qū)是用于對當前編碼單元進行預測編碼的數(shù)據(jù)單元。例如,尺寸為2NX2N 的當前編碼單元CU_0可被劃分為如下分區(qū)中的任何一個:尺寸為2NX2N的分區(qū)802、尺寸 為2NXN的分區(qū)804、尺寸為NX2N的分區(qū)806以及尺寸為NXN的分區(qū)808。這里,關(guān)于分 區(qū)類型的信息800被設置為指示尺寸為2NX2N的分區(qū)802、尺寸為2NXN的分區(qū)804、尺寸 為NX2N的分區(qū)806以及尺寸為NXN的分區(qū)808中的一個。
[0130] 信息810指示每個分區(qū)的預測模式。例如,信息810可指示對由信息800指示的 分區(qū)執(zhí)行的預測編碼的模式(即,幀內(nèi)模式812、幀間模式814或跳過模式816)。
[0131] 信息820指示當對當前編碼單元執(zhí)行變換時所基于的變換單元。例如,變換單元 可以是第一幀內(nèi)變換單元822、第二幀內(nèi)變換單元824、第一幀間變換單元826或第二幀內(nèi) 變換單元828。
[0132] 視頻解碼設備200的圖像數(shù)據(jù)和編碼信息提取器210可根據(jù)每個較深層編碼單元 來提取并使用關(guān)于編碼單元的信息800、關(guān)于預測模式的信息810、關(guān)于變換單元的尺寸的 信息820,以用于解碼。
[0133] 圖9是根據(jù)本發(fā)明的實施例的根據(jù)深度的較深層編碼單元的示圖。
[0134] 劃分信息可用于指示深度的改變。劃分信息指示當前深度的編碼單元是否被劃分 為更低深度的編碼單元。
[0135] 用于對深度為0且尺寸為2N_0X2N_0的編碼單元900進行預測編碼的預測單元 910可包括如下分區(qū)類型的分區(qū):尺寸為2N_0X2N_0的分區(qū)類型912、尺寸為2N_0XN_0的 分區(qū)類型914、尺寸為N_0X2N_0的分區(qū)類型916以及尺寸為Ν_0ΧΝ_0的分區(qū)類型918。圖 9僅示出通過對預測單元910進行對稱劃分而獲得的分區(qū)類型912至918,但是分區(qū)類型不 限于此,并且預測單元910的分區(qū)可包括非對稱分區(qū)、具有預定形狀的分區(qū)以及具有幾何 形狀的分區(qū)。
[0136] 根據(jù)每個分區(qū)類型對如下分區(qū)重復地執(zhí)行預測編碼:尺寸為2N_0X2N_0的一個 分區(qū)、尺寸為2N_0XN_0的兩個分區(qū)、尺寸為N_0X2N_0的兩個分區(qū)以及尺寸為Ν_0ΧΝ_0 的四個分區(qū)。可對尺寸為2N_0X2N_0、N_0X2N_0、2N_0XN_0以及Ν_0ΧΝ_0的分區(qū)執(zhí)行幀 內(nèi)模式和幀間模式下的預測編碼。僅對尺寸為2N_0X2N_0的分區(qū)執(zhí)行跳過模式下的預測 編碼。
[0137] 如果在尺寸為2N_0X2N_0、2N_0XN_0和N_0X2N_0的分區(qū)類型912至分區(qū)類型 916之一中的編碼誤差最小,則預測單元910可不被劃分為更低深度。
[0138] 如果在尺寸為Ν_0ΧΝ_0的分區(qū)類型918中編碼誤差最小,則在操作920,深度從0 改變?yōu)?以劃分分區(qū)類型918,并且對深度為2且尺寸為Ν_0ΧΝ_0的分區(qū)類型編碼單元重 復地執(zhí)行編碼以搜索最小編碼誤差。
[0139] 用于對深度為1且尺寸為2N_1X2N_1( =Ν_0ΧΝ_0)的(分區(qū)類型)編碼單元 930進行預測編碼的預測單元940可包括如下分區(qū)類型的分區(qū):尺寸為2N_1X2N_1的分區(qū) 類型942、尺寸為2N_1XN_1的分區(qū)類型944、尺寸為N_1X2N_1的分區(qū)類型946以及尺寸 為N_1XN_1的分區(qū)類型948。
[0140] 如果在尺寸為N_1XN_1的分區(qū)類型948中編碼誤差最小,則在操作950,深度從1 改變?yōu)?以劃分分區(qū)類型948,并且對深度為2且尺寸為N_2XN_2的編碼單元960重復地 執(zhí)行編碼以搜索最小編碼誤差。
[0141] 當最大深度是d時,根據(jù)每個深度的劃分操作可被執(zhí)行直到深度變?yōu)閐-Ι時,并且 劃分信息可被編碼直到深度是〇至d-2之一。換句話說,當執(zhí)行編碼直到在操作970與深度 d-2相應的編碼單元被劃分之后深度是d-Ι時,用于對深度為d-Ι且尺寸為2N_(d-l)X2N_ (d-1)的編碼單元980進行預測編碼的預測單元990可包括如下分區(qū)類型的分區(qū):尺寸為 2N_(d-l)X2N_(d-l)的分區(qū)類型992、尺寸為2N_(d-l)XN_(d-l)的分區(qū)類型994、尺寸為 N_(d-1)X2N_(d-Ι)的分區(qū)類型996以及尺寸為N_(d-1)XN_(d-Ι)的分區(qū)類型998。
[0142] 可對分區(qū)類型992至998中的如下分區(qū)重復地執(zhí)行預測編碼以搜索具有最小編碼 誤差的分區(qū)類型:尺寸為2N_(d-l)X2N_(d-l)的一個分區(qū)、尺寸為2N_(d-l)XN_(d-l)的 兩個分區(qū)、尺寸SN_(d-l)X2N_(d-l)的兩個分區(qū)、尺寸SN_(d-l)XN_(d-l)的四個分區(qū)。
[0143] 即使在尺寸為N_(d-1)XN_(d-Ι)日分區(qū)類型998具有最小編碼誤差時,由于最大 深度是d,因此深度為d-Ι的編碼單元CU_(d-Ι)不再被劃分到更低深度,并且構(gòu)成當前最大 編碼單元900的編碼單元的編碼深度被確定為d-Ι并且當前最大編碼單元900的分區(qū)類型 可被確定為N_(d_l)XN_(d_l)。另外,由于最大深度是d,因此最小編碼單兀952的劃分/[目 息不被設置。
[0144] 數(shù)據(jù)單元999可以是當前最大編碼單元的"最小單元"。根據(jù)本發(fā)明的實施例的最 小單元可以是通過將最小編碼單元980劃分為4份而獲得的矩形數(shù)據(jù)單元。通過重復地執(zhí) 行編碼,視頻編碼設備100可通過比較根據(jù)編碼單元900的多個深度的編碼誤差來選擇具 有最小編碼誤差的深度以確定編碼深度,并且將相應分區(qū)類型以及預測模式設置為編碼深 度的編碼模式。
[0145] 這樣,根據(jù)深度的最小編碼誤差在所有的深度1至d中被比較,并且具有最小編碼 誤差的深度可被確定為編碼深度。可對編碼深度、預測單元的分區(qū)類型以及預測模式進行 編碼并將其作為關(guān)于編碼模式的信息發(fā)送。另外,由于編碼單元從深度〇被劃分到編碼深 度,因此僅該編碼深度的劃分信息被設置為0,除了編碼深度之外的深度的劃分信息被設置 為1。
[0146] 視頻解碼設備200的熵解碼器220可提取并使用關(guān)于編碼單元900的編碼深度和 預測單元的信息以對編碼單元912進行解碼。視頻解碼設備200可通過使用根據(jù)深度的劃 分信息來將劃分信息是〇的深度確定為編碼深度,并且使用關(guān)于相應深度的編碼模式的信 息用于解碼。
[0147] 圖10至圖12是用于描述根據(jù)本發(fā)明的實施例的編碼單元1010、預測單元1060和 變換單元1070之間的關(guān)系的示圖。
[0148] 編碼單元1010是最大編碼單元中的與由視頻編碼設備100確定的編碼深度相應 的具有樹結(jié)構(gòu)的編碼單元。預測單元1060是每個編碼單元1010的預測單元的分區(qū),變換 單元1070是每個編碼單元1010的變換單元。
[0149] 當在編碼單元1010中最大編碼單元的深度是0時,編碼單元1012和1054的深度 是 1,編碼單元 1014、1016、1018、1028、1050 和 1052 的深度是 2,編碼單元 1020、1022、1024、 1026、1030、1032和1048的深度是3,編碼單元1040、1042、1044和1046的深度是4。
[0150]在預測單元 1060 中,一些編碼單元 1014、1016、1022、1032、1048、1050、1052 和 1054通過劃分編碼單元而獲得。換句話說,編碼單元1014、1022、1050和1054中的分區(qū)類 型的尺寸為2NXN,編碼單元1016、1048和1052中的分區(qū)類型的尺寸為NX2N,編碼單元 1032的分區(qū)類型的尺寸為NXN。編碼單元1010的預測單元和分區(qū)小于或等于每個編碼單 JLi〇
[0151] 以小于編碼單元1052的數(shù)據(jù)單元對變換單元1070中的編碼單元1052的圖像數(shù) 據(jù)執(zhí)行變換或逆變換。另外,變換單元1070中的編碼單元1014、1016、1022、1032、1048、 1050、1052和1054在尺寸和形狀上與預測單元1060中的編碼單元1014、1016、1022、1032、 1048、1050、1052和1054不同。換句話說,視頻編碼設備100和視頻解碼設備200可對相同 編碼單元中的數(shù)據(jù)單元單獨地執(zhí)行幀內(nèi)預測、運動估計、運動補償、變換和逆變換。
[0152] 因此,對最大編碼單元的每個區(qū)域中的具有分層結(jié)構(gòu)的每個編碼單元遞歸地執(zhí)行 編碼,以確定最佳編碼單元,因此可獲得具有遞歸樹結(jié)構(gòu)的編碼單元。編碼信息可包括關(guān)于 編碼單元的劃分信息、關(guān)于分區(qū)類型的信息、關(guān)于預測模式的信息以及關(guān)于變換單元的尺 寸的信息。
[0153] 表1顯示可由視頻編碼設備100和視頻解碼設備200設置的編碼信息。
[0154]表1
[0155]
【權(quán)利要求】
1. 一種更新用于對變換系數(shù)等級進行熵解碼的參數(shù)的方法,所述方法包括: 從比特流解析指示包括在變換單元中的變換系數(shù)的大小的變換系數(shù)等級語法元素; 通過將在當前變換系數(shù)之前被恢復的先前變換系數(shù)的大小與基于先前參數(shù)而獲得的 預定臨界值進行比較,確定是否更新先前參數(shù),其中,先前參數(shù)在對指示先前變換系數(shù)的大 小的先前變換系數(shù)等級語法元素的反二值化中被使用; 通過基于確定的結(jié)果更新或保持先前參數(shù),獲得在對指示當前變換系數(shù)的大小的當前 變換系數(shù)等級語法元素的反二值化中使用的參數(shù); 通過使用獲得的參數(shù)對當前變換系數(shù)等級語法元素進行反二值化來獲得當前變換系 數(shù)的大小, 其中,所述預定臨界值被設置為具有與先前參數(shù)成比例的值,當先前參數(shù)被更新時,更 新后的參數(shù)與先前參數(shù)相比具有逐漸增加的值。
2. 如權(quán)利要求1所述的方法,其中,當變換系數(shù)的大小是absCoeff,指示變換系數(shù)是 否具有大于1的值的語法元素是coeff_abs_level_greaterl_flag,并且指示變換系數(shù)是 否具有大于2的值的語法元素是coeff_abs_level_greather2_flag時,并且當根據(jù)等式 baseLevel = l+coefT_abs_level_greatherl_flag+coefT_abs_level_greather2_flag 石角 定的基本等級值是baseLevel時,變換系數(shù)等級語法元素指示(abs-baseLevel)的大小,其 中,(abs-baseLevel)是變換系數(shù)的大小absCoeff與確定的基本等級值baseLevel之間的 差。
3. 如權(quán)利要求1所述的方法,其中,在確定是否更新先前參數(shù)的步驟中,當先前變 換系數(shù)的大小是cLastAbsCoeff并且先前參數(shù)是cLastRiceParam時,將基于等式th = 3* (l〈〈cLastRiceParam)獲得的臨界值th與先前參數(shù)cLastRiceParam進行比較;當 cLastAbsCoeff大于th時,確定更新先前參數(shù);當cLastAbsCoeff不大于th時,確定保持 先前參數(shù)。
4. 如權(quán)利要求3所述的方法,其中,在獲得參數(shù)的步驟中,當確定更新先前參數(shù)時,通 過在預定范圍內(nèi)將先前參數(shù)增加1來更新先前參數(shù)。
5. 如權(quán)利要求4所述的方法,其中,更新后的參數(shù)不超過值4。
6. 如權(quán)利要求1所述的方法,其中,獲得當前變換系數(shù)的大小的步驟包括: 基于通過使用獲得的參數(shù)確定的預定參數(shù),將具有當前變換系數(shù)的等級語法元素的比 特串分類為前綴比特串和后綴比特串; 通過針對前綴比特串和后綴比特串中的每個比特串應用先前設置的反二值化方法來 恢復當前變換系數(shù)的變換系數(shù)等級語法元素。
7. 如權(quán)利要求6所述的方法,其中,在當前變換系數(shù)的大小是coeff_abs_level_ remaining,獲得的參數(shù)是cRiceParam并且所述預定參數(shù)是cTrMax時,根據(jù)等式cTrMax = 4〈〈cRiceParam確定參數(shù)cTrMax,并且前綴比特串相應于通過使用截斷一元二值化方法對 與Min(cTrMax, coeff_abs_level_remaining)相應的值進行二值化而獲得的比特串,后綴 比特串相應于通過使用k階指數(shù)哥倫布方法對與(coeff_abs_level_remaining_cTrMax) 相應的值進行二值化而獲得的比特串,其中,k等于(cRiceParam+1)。
8. -種用于對變換系數(shù)等級進行熵解碼的設備,所述設備包括: 解析單元,從比特流解析指示包括在變換單元中的變換系數(shù)的大小的變換系數(shù)等級語 法元素; 參數(shù)確定單元,通過將在當前變換系數(shù)之前被恢復的先前變換系數(shù)的大小與基于先前 參數(shù)而獲得的預定臨界值進行比較,確定是否更新先前參數(shù),并通過基于確定的結(jié)果更新 或保持先前參數(shù),獲得在對指示當前變換系數(shù)的大小的當前變換系數(shù)等級語法元素的反二 值化中使用的參數(shù),其中,先前參數(shù)在對指示先前變換系數(shù)的大小的先前變換系數(shù)等級語 法元素的反二值化中被使用; 語法元素恢復單元,通過使用獲得的參數(shù)對當前變換系數(shù)等級語法元素進行反二值化 來獲得當前變換系數(shù)的大小, 其中,所述預定臨界值被設置為具有與先前參數(shù)成比例的值,當先前參數(shù)被更新時,更 新后的參數(shù)與先前參數(shù)相比具有逐漸增加的值。
9. 一種更新用于對變換系數(shù)等級進行熵編碼的參數(shù)的方法,所述方法包括: 以預定掃描順序獲得指示包括在變換單元中的變換系數(shù)的大小的變換系數(shù)等級語法 元素; 通過將在當前變換系數(shù)之前被編碼的先前變換系數(shù)的大小與基于先前參數(shù)而獲得的 預定臨界值進行比較,確定是否更新先前參數(shù),其中,先前參數(shù)在對指示先前變換系數(shù)的大 小的先前變換系數(shù)等級語法元素的二值化中被使用; 通過基于確定的結(jié)果更新或保持先前參數(shù),獲得在對指示當前變換系數(shù)的大小的當前 變換系數(shù)等級語法元素的二值化中使用的參數(shù); 通過使用獲得的參數(shù)對當前變換系數(shù)的變換系數(shù)等級語法元素進行二值化來輸出與 當前變換系數(shù)的變換系數(shù)等級語法元素相應的比特串, 其中,所述預定臨界值被設置為具有與先前參數(shù)成比例的值,當先前參數(shù)被更新時,更 新后的參數(shù)與先前參數(shù)相比具有逐漸增加的值。
10. 如權(quán)利要求9所述的方法,其中,當變換系數(shù)的大小是absCoeff,指示變換系數(shù)是 否具有大于1的值的語法元素是coeff_abs_level_greaterl_flag,并且指示變換系數(shù)是 否具有大于2的值的語法元素是coeff_abs_level_greather2_flag時,并且當根據(jù)等式 baseLevel = l+coefT_abs_level_greatherl_flag+coefT_abs_level_greather2_flag 石角 定的基本等級值是baseLevel時,變換系數(shù)等級語法元素指示(abs-baseLevel)的大小,其 中,(abs-baseLevel)是變換系數(shù)的大小absCoeff與確定的基本等級值baseLevel之間的 差。
11. 如權(quán)利要求9所述的方法,其中,在確定是否更新先前參數(shù)的步驟中,當先前變 換系數(shù)的大小是cLastAbsCoeff并且先前參數(shù)是cLastRiceParam時,將基于等式th = 3* (l〈〈cLastRiceParam)獲得的臨界值th與先前參數(shù)cLastRiceParam進行比較;當 cLastAbsCoeff大于th時,確定更新先前參數(shù);當cLastAbsCoeff不大于th時,確定保持 先前參數(shù)。
12. 如權(quán)利要求11所述的方法,其中,在獲得參數(shù)的步驟中,當確定更新先前參數(shù)時, 通過在預定范圍內(nèi)將先前參數(shù)增加1來更新先前參數(shù)。
13. 如權(quán)利要求9所述的方法,其中,輸出比特串的步驟包括: 基于通過使用獲得的參數(shù)確定的預定參數(shù)將當前變換系數(shù)等級語法元素分類為前綴 和后綴; 通過針對前綴比特串和后綴比特串中的每個比特串應用先前設置的二值化方法來產(chǎn) 生前綴比特串和后綴比特串,并輸出與當前變換系數(shù)的變換系數(shù)等級語法元素相應的比特 串。
14. 如權(quán)利要求13所述的方法,其中,在當前變換系數(shù)的大小是coeff_abs_level_ remaining,獲得的參數(shù)是cRiceParam并且所述預定參數(shù)是cTrMax時,根據(jù)等式cTrMax = 4〈〈cRiceParam確定參數(shù)cTrMax,并且前綴比特串相應于通過使用截斷一元二值化方法對 與Min(cTrMax, coeff_abs_level_remaining)相應的值進行二值化而獲得的比特串,后綴 比特串相應于通過使用k階指數(shù)哥倫布方法對與(coeff_abs_level_remaining_cTrMax) 相應的值進行二值化而獲得的比特串,其中,k等于(cRiceParam+1)。
15. -種用于對變換系數(shù)等級進行熵編碼的設備,所述設備包括: 參數(shù)確定單元,以預定掃描順序獲得指示包括在變換單元中的變換系數(shù)的大小的變換 系數(shù)等級語法元素,通過將在當前變換系數(shù)之前被編碼的先前變換系數(shù)的大小與基于先前 參數(shù)而獲得的預定臨界值進行比較,確定是否更新先前參數(shù),通過基于確定的結(jié)果更新或 保持先前參數(shù),獲得在對指示當前變換系數(shù)的大小的當前變換系數(shù)等級語法元素的二值化 中使用的參數(shù),其中,先前參數(shù)在對指示先前變換系數(shù)的大小的先前變換系數(shù)等級語法元 素的二值化中被使用; 比特串產(chǎn)生單元,通過使用獲得的參數(shù)對當前變換系數(shù)的變換系數(shù)等級語法元素進行 二值化來輸出與當前變換系數(shù)的變換系數(shù)等級語法元素相應的比特串, 其中,所述預定臨界值被設置為具有與先前參數(shù)成比例的值,當先前參數(shù)被更新時,更 新的參數(shù)與先前參數(shù)相比具有逐漸增加的值。
【文檔編號】H04N19/18GK104365099SQ201380031658
【公開日】2015年2月18日 申請日期:2013年4月15日 優(yōu)先權(quán)日:2012年4月15日
【發(fā)明者】金贊烈, 金宰賢, 樸正輝 申請人:三星電子株式會社