專利名稱:用于對(duì)視頻進(jìn)行解碼的設(shè)備的制作方法
技術(shù)領(lǐng)域:
示例性實(shí)施例涉及對(duì)視頻進(jìn)行編碼和解碼。
背景技術(shù):
隨著用于再現(xiàn)和存儲(chǔ)高分辨率或高質(zhì)量視頻內(nèi)容的硬件的發(fā)展和提供,對(duì)有效地對(duì)高分辨率或高質(zhì)量視頻內(nèi)容進(jìn)行編碼或解碼的視頻編解碼器的需求正在增加。在傳統(tǒng)的視頻編解碼器中,基于具有預(yù)定大小的宏塊,根據(jù)受限的編碼方法對(duì)視頻進(jìn)行編碼。由所述視頻編解碼器執(zhí)行的現(xiàn)有的幀間預(yù)測(cè)來(lái)估計(jì)運(yùn)動(dòng)矢量,并通過(guò)使用2NX 2N大小的宏塊的具有2NX2N、2NXN、NX2N和NXN的大小的分區(qū)來(lái)估計(jì)所述宏塊的運(yùn)動(dòng)。
發(fā)明內(nèi)容
技術(shù)問(wèn)題示例性實(shí)施例提供通過(guò)使用任意形狀的分區(qū)執(zhí)行幀間預(yù)測(cè)來(lái)對(duì)視頻進(jìn)行編碼和解碼。技術(shù)方案根據(jù)示例性實(shí)施 例的一方面,提供了一種對(duì)視頻進(jìn)行編碼的方法,所述方法包括:將視頻數(shù)據(jù)劃分為最大編碼單元;基于根據(jù)最大編碼單元的至少一個(gè)劃分的區(qū)域的分層結(jié)構(gòu)的較深層編碼單元,對(duì)最大編碼單元的視頻數(shù)據(jù)進(jìn)行編碼,確定編碼的結(jié)果將被輸出的編碼深度,其中,在分層結(jié)構(gòu)中,隨著深度的加深,上層深度的編碼單元被劃分,所述確定包括使用通過(guò)根據(jù)任意比例劃分上層深度的編碼單元而獲得的分區(qū)執(zhí)行幀間預(yù)測(cè);輸出比特流,所述比特流包括與針對(duì)最大編碼單元的至少一個(gè)劃分的區(qū)域的編碼深度相應(yīng)的編碼視頻數(shù)據(jù)以及關(guān)于編碼深度和編碼模式的信息。有益效果根據(jù)示例性實(shí)施例,由于在考慮圖像的大小的同時(shí)增大了編碼單元的最大大小,同時(shí)在考慮圖像的特征時(shí)調(diào)整編碼單元,因此可提高圖像壓縮效率。即使圖像數(shù)據(jù)具有高分辨率和大數(shù)據(jù)量,也可通過(guò)使用編碼單元的大小和編碼模式來(lái)有效地解碼和恢復(fù)圖像數(shù)據(jù),其中,通過(guò)使用從編碼器接收的關(guān)于最佳編碼模式的信息根據(jù)圖像數(shù)據(jù)的特征自適應(yīng)地確定所述編碼單元的大小和編碼模式。
圖1是根據(jù)示例性實(shí)施例的用于對(duì)視頻進(jìn)行編碼的設(shè)備的框圖;圖2是根據(jù)示例性實(shí)施例的用于對(duì)視頻進(jìn)行解碼的設(shè)備的框圖;圖3是用于描述根據(jù)示例性實(shí)施例的編碼單元的概念的示圖4是根據(jù)示例性實(shí)施例的基于編碼單元的圖像編碼器的框圖;圖5是根據(jù)示例性實(shí)施例的基于編碼單元的圖像解碼器的框圖;圖6是示出根據(jù)示例性實(shí)施例的根據(jù)深度的較深層編碼單元以及分區(qū)的示圖;圖7是用于描述根據(jù)示例性實(shí)施例的編碼單元和變換單元之間的關(guān)系的示圖;圖8是用于描述根據(jù)示例性實(shí)施例的與編碼深度相應(yīng)的編碼單元的編碼信息的示圖;圖9是根據(jù)示例性實(shí)施例的根據(jù)深度的較深層編碼單元的示圖;圖10至圖12是用于描述根據(jù)示例性實(shí)施例的編碼單元、預(yù)測(cè)單元和變換單元之間的關(guān)系的不圖;圖13是用于描述根據(jù)表I的編碼模式信息的編碼單元、預(yù)測(cè)單元或分區(qū)以及變換單元之間的關(guān)系的示圖;圖14是示出根據(jù)示例性實(shí)施例的對(duì)視頻進(jìn)行編碼的方法的流程圖;圖15是示出根據(jù)示例性實(shí)施例的對(duì)視頻進(jìn)行解碼的方法的流程圖;圖16是根據(jù)另一示例性實(shí)施例的關(guān)于使用根據(jù)任意比例劃分的分區(qū)進(jìn)行的幀間預(yù)測(cè)的視頻編碼設(shè)備的框圖;圖17是根據(jù)另一示例性實(shí)施例的關(guān)于使用根據(jù)任意比例劃分的分區(qū)進(jìn)行的幀間預(yù)測(cè)的視頻解碼設(shè)備的框圖;圖18是根據(jù)示例性實(shí)施例的通過(guò)根據(jù)任意比例劃分編碼單元而獲得的示例性分區(qū)的框圖;圖19示出根據(jù)示例性實(shí)施例的序列參數(shù)集的語(yǔ)法,其中,序列參數(shù)集包括關(guān)于用于幀間預(yù)測(cè)的分區(qū)類型是否包括通過(guò)根據(jù)任意比例劃分編碼單元而獲得的分區(qū)的信息;圖20是示出根據(jù)另一示例性實(shí)施例的關(guān)于使用根據(jù)任意比例劃分的分區(qū)進(jìn)行的幀間預(yù)測(cè)的視頻編碼方法的流程圖;圖21是示出根據(jù)另一示例性實(shí)施例的關(guān)于使用根據(jù)任意比例劃分的分區(qū)進(jìn)行的幀間預(yù)測(cè)的視頻編碼方法的流程圖。最佳實(shí)施方式根據(jù)示例性實(shí)施例的一方面,提供了一種對(duì)視頻進(jìn)行編碼的方法,所述方法包括:將視頻數(shù)據(jù)劃分為最大編碼單元;基于根據(jù)最大編碼單元的至少一個(gè)劃分的區(qū)域的分層結(jié)構(gòu)的較深層編碼單元,對(duì)最大編碼單元的視頻數(shù)據(jù)進(jìn)行編碼,確定編碼的結(jié)果將被輸出的編碼深度,其中,在分層結(jié)構(gòu)中,隨著深度加深,上層深度的編碼單元被劃分,所述確定包括使用通過(guò)根據(jù)任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行幀間預(yù)測(cè);輸出比特流,所述比特流包括與針對(duì)根據(jù)最大編碼單元的至少一個(gè)劃分的區(qū)域的編碼深度相應(yīng)的編碼視頻數(shù)據(jù)以及關(guān)于編碼深度和編碼模式的信息。深度表示編碼單元被分層劃分的次數(shù),隨著深度加深,根據(jù)深度的較深層編碼單元可從最大編碼單元被劃分以獲得最小編碼單元。深度從上層深度被加深到下層深度。隨著深度加深,最大編碼單元被劃分的次數(shù)增加,最大編碼單元被劃分的可能次數(shù)的總數(shù)相應(yīng)于最大深度。編碼單元的最大大小和最大深度可被預(yù)先確定。
確定編碼深度的步驟可包括:選擇性地確定是否使用通過(guò)根據(jù)任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行幀間預(yù)測(cè)。
輸出比特流的步驟可包括:包括指示用于幀間預(yù)測(cè)的分區(qū)類型是否包括通過(guò)根據(jù)任意比例劃分編碼單元而獲得的分區(qū)的信息。通過(guò)根據(jù)任意比例劃分編碼單元而獲得的分區(qū)可以是通過(guò)根據(jù)1:3或3:1的比例劃分編碼單元的高和寬而獲得的分區(qū)。最大編碼單元可被選擇性地設(shè)置為大小為16X16、32X32、64X64、128X128和256X256的塊中的至少一個(gè)。編碼深度可被確定為根據(jù)相應(yīng)劃分的區(qū)域的分層結(jié)構(gòu)的較深層編碼單元的編碼結(jié)果中具有最高編碼效率的較深層編碼單元的深度,并針對(duì)最大編碼單元內(nèi)的所述至少一個(gè)劃分的區(qū)域被獨(dú)立地確定。根據(jù)示例性實(shí)施例的另一方面,提供了一種對(duì)視頻進(jìn)行解碼的方法,所述方法包括:接收并解析編碼視頻數(shù)據(jù)的比特流;從比特流提取根據(jù)最大編碼單元的編碼視頻數(shù)據(jù)以及關(guān)于根據(jù)最大編碼單元的編碼深度和編碼模式的信息;基于關(guān)于根據(jù)最大編碼單元的編碼深度和編碼模式的信息,針對(duì)根據(jù)最大編碼單元的至少一個(gè)編碼深度的編碼單元,執(zhí)行解碼,所述解碼包括使用通過(guò)根據(jù)任意比例劃分編碼單元而獲得的分區(qū)進(jìn)行的運(yùn)動(dòng)補(bǔ)償,其中,所述至少一個(gè)編碼深度的編碼單元被確定為最大編碼單元的至少一個(gè)劃分的區(qū)域的分層結(jié)構(gòu)的較深層編碼單元的深度之一。提取編碼視頻數(shù)據(jù)的步驟可包括:進(jìn)一步從比特流提取指示用于幀間預(yù)測(cè)的分區(qū)類型是否包括通過(guò)根據(jù)任意比例劃分編碼單元而獲得的分區(qū)的信息。執(zhí)行解碼的步驟可包括:基于從比特流提取的指示用于幀間預(yù)測(cè)的分區(qū)類型是否包括通過(guò)根據(jù)任意比例劃分編碼單元而獲得的分區(qū)的信息,選擇性地確定是否使用通過(guò)根據(jù)任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行運(yùn)動(dòng)補(bǔ)償。根據(jù)示例性實(shí)施 例的另一方面,提供了一種用于對(duì)視頻進(jìn)行編碼的設(shè)備,所述設(shè)備包括:最大編碼單元?jiǎng)澐制?,將視頻數(shù)據(jù)劃分為最大編碼單元;編碼器,基于根據(jù)最大編碼單元的至少一個(gè)劃分的區(qū)域的分層結(jié)構(gòu)的較深層編碼單元,對(duì)最大編碼單元的視頻數(shù)據(jù)進(jìn)行編碼,確定編碼的結(jié)果將被輸出的編碼深度,其中,在分層結(jié)構(gòu)中,隨著深度加深,上層深度的編碼單元被劃分,所述確定包括使用通過(guò)根據(jù)任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行幀間預(yù)測(cè);輸出單元,輸出比特流,所述比特流包括與針對(duì)根據(jù)最大編碼單元的至少一個(gè)劃分的區(qū)域的編碼深度相應(yīng)的編碼視頻數(shù)據(jù)以及關(guān)于編碼深度和編碼模式的信息。根據(jù)示例性實(shí)施例的另一方面,提供了一種用于對(duì)視頻進(jìn)行解碼的設(shè)備,所述設(shè)備包括:解析器,接收并解析編碼視頻數(shù)據(jù)的比特流;提取器,從比特流提取根據(jù)最大編碼單元的編碼視頻數(shù)據(jù)以及關(guān)于根據(jù)最大編碼單元的編碼深度和編碼模式的信息;解碼器,基于關(guān)于根據(jù)最大編碼單元的編碼深度和編碼模式的信息,針對(duì)根據(jù)最大編碼單元的至少一個(gè)編碼深度的編碼單元,執(zhí)行解碼,所述解碼包括使用通過(guò)根據(jù)任意比例劃分編碼單元而獲得的分區(qū)進(jìn)行的運(yùn)動(dòng)補(bǔ)償,其中,所述至少一個(gè)編碼深度的編碼單元被確定為最大編碼單元的至少一個(gè)劃分的區(qū)域的分層結(jié)構(gòu)的較深層編碼單元的深度之一。根據(jù)示例性實(shí)施例的另一方面,提供了一種計(jì)算機(jī)可讀記錄介質(zhì),所述計(jì)算機(jī)可讀記錄介質(zhì)記錄有用于執(zhí)行對(duì)視頻進(jìn)行編碼的方法的程序。根據(jù)示例性實(shí)施例的另一方面,提供了一種計(jì)算機(jī)可讀記錄介質(zhì),所述計(jì)算機(jī)可讀記錄介質(zhì)記錄有用于執(zhí)行對(duì)視頻進(jìn)行解碼的方法的程序。
具體實(shí)施例方式以下,將參照附圖更充分地描述示例性實(shí)施例,其中,示例性實(shí)施例顯示在附圖中。在示例性實(shí)施例中,“單元”根據(jù)其上下文可表示大小的單位或可不表示大小的單位。以下,根據(jù)示例性實(shí)施例,“編碼單元”是進(jìn)行編碼的數(shù)據(jù)單元以及被編碼后的數(shù)據(jù)單元,其中,按照所述進(jìn)行編碼的數(shù)據(jù)單元,圖像數(shù)據(jù)在編碼器端被編碼,按照所述被編碼后的數(shù)據(jù)單元,編碼圖像數(shù)據(jù)在解碼器端被解碼。此外,“編碼深度”表示編碼單元被編碼的深度。以下,“圖像”可表示視頻的靜止圖像或者運(yùn)動(dòng)圖像(S卩,視頻本身)。將參照?qǐng)D1至圖15描述根據(jù)示例性實(shí)施例的基于空間分層的數(shù)據(jù)單元對(duì)視頻進(jìn)行的編碼和解碼,將參照?qǐng)D16至圖21描述根據(jù)示例性實(shí)施例的通過(guò)使用按照任意比例劃分的分區(qū)進(jìn)行幀間預(yù)測(cè)來(lái)對(duì)視頻進(jìn)行的編碼和解碼。圖1是根據(jù)示例性實(shí)施例的視頻編碼設(shè)備100的框圖。視頻編碼設(shè)備100包括最大編碼單元?jiǎng)澐制?10、編碼單元確定器120和輸出單元130。最大編碼單元?jiǎng)澐制?10可基于圖像的當(dāng)前畫面的最大編碼單元對(duì)當(dāng)前畫面進(jìn)行劃分。如果當(dāng)前畫面大于最大編碼單元,則當(dāng)前畫面的圖像數(shù)據(jù)可被劃分為至少一個(gè)最大編碼單元。根據(jù)示例性實(shí)施例的最大編碼單元可以是具有32X32,64X64,128X 128、256 X 256等大小的數(shù)據(jù)單元,其中,數(shù)據(jù)單元的形狀是寬和高為2的平方的方形。圖像數(shù)據(jù)可根據(jù)所述至少一個(gè)最大編碼單元被輸出到編碼單元確定器120。根據(jù)示例性實(shí)施例的編碼單元可由最大大小以及深度來(lái)表征。深度表示編碼單元從最大編碼單元被空間劃分 的次數(shù),并且隨著深度加深或增加,根據(jù)深度的較深層編碼單元可從最大編碼單元被劃分為最小編碼單元。最大編碼單元的深度是最上層深度,最小編碼單元的深度是最下層深度。由于與每個(gè)深度相應(yīng)的編碼單元的大小隨著最大編碼單元的深度加深而減小,因此,與上層深度相應(yīng)的編碼單元可包括多個(gè)與下層深度相應(yīng)的編碼單
J Li ο如上所述,當(dāng)前畫面的圖像數(shù)據(jù)根據(jù)編碼單元的最大大小而被劃分為最大編碼單元,所述最大編碼單元中的每一個(gè)可包括根據(jù)深度被劃分的較深層編碼單元。由于根據(jù)示例性實(shí)施例的最大編碼單元根據(jù)深度被劃分,因此包括在最大編碼單元中的空間域的圖像數(shù)據(jù)可根據(jù)深度被分層劃分??深A(yù)定編碼單元的最大深度和最大大小,所述最大深度和最大大小限定最大編碼單元的高和寬被分層劃分的總次數(shù)。編碼單元確定器120對(duì)通過(guò)根據(jù)深度劃分最大編碼單元的區(qū)域而獲得的至少一個(gè)劃分的區(qū)域進(jìn)行編碼,并根據(jù)所述至少一個(gè)劃分的區(qū)域確定用于輸出最終編碼的圖像數(shù)據(jù)的深度。換句話說(shuō),編碼單元確定器120通過(guò)根據(jù)當(dāng)前畫面的最大編碼單元按照根據(jù)深度的較深層編碼單元對(duì)圖像數(shù)據(jù)進(jìn)行編碼,并選擇具有最小編碼誤差的深度,來(lái)確定編碼深度。因此,與確定的編碼深度相應(yīng)的編碼單元的編碼圖像數(shù)據(jù)被最終輸出。此外,與編碼深度相應(yīng)的編碼單元可被視為被編碼的編碼單元。確定的編碼深度和根據(jù)確定的編碼深度的編碼圖像數(shù)據(jù)被輸出到輸出單元130。
基于與等于或低于最大深度的至少一個(gè)深度相應(yīng)的較深層編碼單元對(duì)最大編碼單元中的圖像數(shù)據(jù)進(jìn)行編碼,基于較深層編碼單元中的每一個(gè)來(lái)比較對(duì)圖像數(shù)據(jù)進(jìn)行編碼的結(jié)果。在比較較深層編碼單元的編碼誤差之后,可選擇具有最小編碼誤差的深度??舍槍?duì)每個(gè)最大編碼單元選擇至少一個(gè)編碼深度。隨著編碼單元根據(jù)深度而被分層劃分,并且隨著編碼單元的數(shù)量增加,最大編碼單元的大小被劃分。此外,即使在一個(gè)最大編碼單元中編碼單元相應(yīng)于相同深度,也通過(guò)分別測(cè)量每個(gè)編碼單元的圖像數(shù)據(jù)的編碼誤差來(lái)確定是否將與相同深度相應(yīng)的編碼單元中的每一個(gè)劃分到下層深度。因此,即使當(dāng)圖像數(shù)據(jù)被包括在一個(gè)最大編碼單元中時(shí),圖像數(shù)據(jù)也根據(jù)多個(gè)深度被劃分為多個(gè)區(qū)域,并且在所述一個(gè)最大編碼單元中,編碼誤差可根據(jù)區(qū)域而不同,因此,編碼深度可根據(jù)圖像數(shù)據(jù)中的區(qū)域而不同。因此,在一個(gè)最大編碼單元中可確定一個(gè)或多個(gè)編碼深度,可根據(jù)至少一個(gè)編碼深度的編碼單元來(lái)劃分最大編碼單元的圖像數(shù) 據(jù)。因此,編碼單元確定器120可確定包括在最大編碼單元中的具有樹結(jié)構(gòu)的編碼單元。根據(jù)示例性實(shí)施例的“具有樹結(jié)構(gòu)的編碼單元”包括在最大編碼單元中包括的所有較深層編碼單元中與被確定為編碼深度的深度相應(yīng)的編碼單元。在最大編碼單元的相同區(qū)域中,編碼深度的編碼單元可根據(jù)深度被分層確定,在不同的區(qū)域中,編碼深度的編碼單元可被獨(dú)立地確定。類似地,當(dāng)前區(qū)域中的編碼深度可獨(dú)立于另一區(qū)域中的編碼深度被確定。根據(jù)示例性實(shí)施例的最大深度是關(guān)于從最大編碼單元到最小編碼單元的劃分次數(shù)的索引,即,關(guān)于最大編碼單元被劃分到最小編碼單元的次數(shù)的索引。根據(jù)示例性實(shí)施例的第一最大深度可表示從最大編碼單元到最小編碼單元的總劃分次數(shù)。根據(jù)示例性實(shí)施例的第二最大深度可表示從最大編碼單元到最小編碼單元的深度級(jí)的總數(shù)。例如,當(dāng)最大編碼單元的深度為O時(shí),最大編碼單元被劃分一次的編碼單元的深度可被設(shè)置為1,最大編碼單元被劃分兩次的編碼單元的深度可被設(shè)置為2。這里,如果最小編碼單元是最大編碼單元被劃分四次的編碼單元,則存在深度0、1、2、3和4這5個(gè)深度級(jí),因此,第一最大深度可被設(shè)置為4,第二最大深度可被設(shè)置為5??筛鶕?jù)最大編碼單元執(zhí)行預(yù)測(cè)編碼和變換。還可根據(jù)最大編碼單元,基于根據(jù)等于最大深度的深度或小于最大深度的深度的較深層編碼單元來(lái)執(zhí)行預(yù)測(cè)編碼和變換??筛鶕?jù)正交變換或整數(shù)變換的方法來(lái)執(zhí)行變換。由于每當(dāng)最大編碼單元根據(jù)深度被劃分時(shí)較深層編碼單元的數(shù)量增加,因此可針對(duì)隨著深度加深而產(chǎn)生的所有較深層編碼單元執(zhí)行包括預(yù)測(cè)編碼和變換的編碼。為了便于描述,現(xiàn)在將基于最大編碼單元中的當(dāng)前深度的編碼單元來(lái)描述預(yù)測(cè)編碼和變換。視頻編碼設(shè)備100可變化地選擇用于對(duì)圖像數(shù)據(jù)進(jìn)行編碼的數(shù)據(jù)單元的大小或形狀。為了對(duì)圖像數(shù)據(jù)進(jìn)行編碼,執(zhí)行諸如預(yù)測(cè)編碼、變換和熵編碼的操作,此時(shí),可針對(duì)所有操作使用相同的數(shù)據(jù)單元,或者可針對(duì)每個(gè)操作使用不同的數(shù)據(jù)單元。例如,視頻編碼設(shè)備100不僅可選擇用于對(duì)圖像數(shù)據(jù)進(jìn)行編碼的編碼單元,還可選擇與編碼單元不同的數(shù)據(jù)單元,以便對(duì)編碼單元中的圖像數(shù)據(jù)執(zhí)行預(yù)測(cè)編碼。為了在最大編碼單元中執(zhí)行預(yù)測(cè)編碼,可基于與編碼深度相應(yīng)的編碼單元(S卩,基于不再被劃分為與下層深度相應(yīng)的編碼單元的編碼單元)執(zhí)行預(yù)測(cè)編碼。以下,現(xiàn)將不再被劃分并且變成用于預(yù)測(cè)編碼的基本單元的編碼單元稱為“預(yù)測(cè)單元”。通過(guò)對(duì)預(yù)測(cè)單元進(jìn)行劃分所獲得的分區(qū)可包括通過(guò)對(duì)預(yù)測(cè)單元的高和寬中的至少一個(gè)進(jìn)行劃分所獲得的預(yù)測(cè)單元或數(shù)據(jù)單元。例如,當(dāng)2NX2N (其中,N是正整數(shù))的編碼單元不再被劃分,并且變成2NX2N的預(yù)測(cè)單元時(shí),分區(qū)的大小可以是2NX 2N、2NX N、NX 2N或NX N。分區(qū)類型的示例包括通過(guò)對(duì)預(yù)測(cè)單元的高或?qū)掃M(jìn)行對(duì)稱劃分所獲得的對(duì)稱分區(qū)、通過(guò)對(duì)預(yù)測(cè)單元的高或?qū)掃M(jìn)行不對(duì)稱劃分(諸如l:n或η:1)所獲得的分區(qū)、通過(guò)對(duì)預(yù)測(cè)單元進(jìn)行幾何劃分所獲得的分區(qū)以及具有任意形狀的分區(qū)。預(yù)測(cè)單元的預(yù)測(cè)模式可以是幀內(nèi)模式、幀間模式和跳過(guò)模式中的至少一個(gè)。例如,可針對(duì)2ΝX 2Ν、2ΝX N、NX 2Ν或NX N的分區(qū)執(zhí)行幀內(nèi)模式或幀間模式。此外,可僅針對(duì)2ΝΧ2Ν的分區(qū)執(zhí)行跳過(guò)模式。針對(duì)編碼單元中的一個(gè)預(yù)測(cè)單元獨(dú)立地執(zhí)行編碼,從而選擇具有最小編碼誤差的預(yù)測(cè)模式。視頻編碼設(shè)備100還可不僅基于用于對(duì)圖像數(shù)據(jù)進(jìn)行編碼的編碼單元,還基于不同于編碼單元的數(shù)據(jù)單元,對(duì)編碼單元中的圖像數(shù)據(jù)執(zhí)行變換。為了在編碼單元中執(zhí)行變換,可基于具有小于或等于編碼單元的大小的數(shù)據(jù)單元來(lái)執(zhí)行變換。例如,用于變換的數(shù)據(jù)單元可包括用于幀內(nèi)模式的數(shù)據(jù)單元和用于幀間模式的數(shù)據(jù)單元。現(xiàn)將用作變換的基礎(chǔ)的數(shù)據(jù)單元稱為“變換單元”。還可在變換單元中設(shè)置指示通過(guò)對(duì)編碼單元的高和寬進(jìn)行劃分來(lái)達(dá)到變換單元的劃分次數(shù)的變換深度。例如,在2ΝΧ 2Ν的當(dāng)前編碼單元中,當(dāng)變換單元的大小也為2ΝΧ2Ν時(shí),變換深度可以是0,當(dāng)所述當(dāng)前編碼單元的高和寬中的每一個(gè)被劃分為兩等份,總共被劃分為4~1個(gè)變換單元,從而變換單元的大小是NXN時(shí),變換深度可以是1,當(dāng)所述當(dāng)前編碼單元的高和寬的每一個(gè)被劃分為四等份,總共被劃分為4~2個(gè)變換單元,從而變換單元的大小是Ν/2ΧΝ/2時(shí),變換深度可以是
2。例如,可根據(jù)分層樹結(jié)構(gòu)來(lái)設(shè)置變換單元,其中,根據(jù)變換深度的分層特性,上層變換深度的變換單元被劃分為下層變換深度的四個(gè)變換單元。與編碼單元類似,編碼單元中的變換單元可被遞歸地劃分為大小更小的區(qū)域,從而可以以區(qū)域?yàn)閱挝华?dú)立地確定變換單元。因此,可根據(jù)具有根據(jù)變換深度的樹結(jié)構(gòu)的變換,來(lái)劃分編碼單元中的殘差數(shù)據(jù)。根據(jù)與編碼深度相應(yīng)的編碼單元的編碼信息不僅需要關(guān)于編碼深度的信息,還需要關(guān)于與預(yù)測(cè)編碼和變換有關(guān)的信息的信息。因此,編碼單元確定器120不僅確定具有最小編碼誤差的編碼深度,還確定預(yù)測(cè)單元中的分區(qū)類型、根據(jù)預(yù)測(cè)單元的預(yù)測(cè)模式和用于變換的變換單元的大小。稍后將參照?qǐng)D3至圖12詳細(xì)描述根據(jù)示例性實(shí)施例的根據(jù)最大編碼單元中的樹結(jié)構(gòu)的編碼單元以及確定分區(qū)的方法。編碼單元確定器120可通過(guò)使用基于拉格朗日乘子的率失真優(yōu)化來(lái)測(cè)量根據(jù)深度的較深層編碼單元的編碼誤差。輸出單元130在比特流中輸出最大編碼單元的圖像數(shù)據(jù)以及關(guān)于根據(jù)編碼深度的編碼模式的信息,其中,所述圖像數(shù)據(jù)基于由編碼單元確定器120確定的至少一個(gè)編碼深度被編碼。 通過(guò)對(duì)圖像的殘差數(shù)據(jù)進(jìn)行編碼來(lái)獲得編碼圖像數(shù)據(jù)。
關(guān)于根據(jù)編碼深度的編碼模式的信息可包括關(guān)于編碼深度的信息、關(guān)于預(yù)測(cè)單元中的分區(qū)類型的信息、預(yù)測(cè)模式以及變換單元的大小??赏ㄟ^(guò)使用根據(jù)深度的劃分信息來(lái)定義關(guān)于編碼深度的信息,關(guān)于編碼深度的信息指示是否針對(duì)下層深度而不是當(dāng)前深度的編碼單元來(lái)執(zhí)行編碼。如果當(dāng)前編碼單元的當(dāng)前深度是編碼深度,則當(dāng)前編碼單元中的圖像數(shù)據(jù)被編碼并被輸出,因此劃分信息可被定義為不將當(dāng)前編碼單元?jiǎng)澐值较聦由疃???蛇x地,如果當(dāng)前編碼單元的當(dāng)前深度不是編碼深度,則針對(duì)下層深度的編碼單元來(lái)執(zhí)行編碼,因此,劃分信息可被定義為劃分當(dāng)前編碼單元以獲得下層深度的編碼單元。如果當(dāng)前深度不是編碼深度,則針對(duì)被劃分為下層深度的至少一個(gè)編碼單元的編碼單元來(lái)執(zhí)行編碼。由于在當(dāng)前深度的一個(gè)編碼單元中存在下層深度的至少一個(gè)編碼單元,因此針對(duì)下層深度的每個(gè)編碼單元重復(fù)執(zhí)行編碼,因此,可針對(duì)具有相同深度的編碼單元遞歸地執(zhí)行編碼。由于針對(duì)一個(gè)最大編碼單元確定具有樹結(jié)構(gòu)的編碼單元,并且針對(duì)編碼深度的編碼單元確定關(guān)于至少一個(gè)編碼模式的信息,因此,可針對(duì)一個(gè)最大編碼單元確定關(guān)于至少一個(gè)編碼模式的信息。此外,由于圖像數(shù)據(jù)根據(jù)深度被分層劃分,因此,最大編碼單元的圖像數(shù)據(jù)的編碼深度可根據(jù)位置而不同,因此,可針對(duì)圖像數(shù)據(jù)設(shè)置關(guān)于編碼深度和編碼模式的信息。因此,輸出單元130可將關(guān)于相應(yīng)的編碼深度和編碼模式的編碼信息分配給包括在最大編碼單元中的編碼單元、預(yù)測(cè)單元和最小單元中的至少一個(gè)。根據(jù)示例性實(shí)施例的最小單元是通過(guò)將具有最低深度的最小編碼單元?jiǎng)澐?次所獲得的矩形數(shù)據(jù)單元。 可選地,最小單元可以是最大矩形數(shù)據(jù)單元,所述最大矩形數(shù)據(jù)單元可包括在最大編碼單元中所包括的所有編碼單元、預(yù)測(cè)單元、分區(qū)單元和變換單元中。例如,通過(guò)輸出單元130輸出的編碼信息可被分為根據(jù)編碼單元的編碼信息和根據(jù)預(yù)測(cè)單元的編碼信息。根據(jù)編碼單元的編碼信息可包括關(guān)于預(yù)測(cè)模式的信息和關(guān)于分區(qū)大小的信息。根據(jù)預(yù)測(cè)單元的編碼信息可包括關(guān)于幀間模式的估計(jì)方向的信息、關(guān)于幀間模式的參考圖像索引的信息、關(guān)于運(yùn)動(dòng)矢量的信息、關(guān)于幀內(nèi)模式的色度分量的信息和關(guān)于幀內(nèi)模式的插值方法的信息。此外,關(guān)于根據(jù)畫面、像條或GOP定義的編碼單元的最大大小的信息以及關(guān)于最大深度的信息可被插入比特流的SPS (序列參數(shù)集)或頭中。在視頻編碼設(shè)備100中,較深層編碼單元可以是通過(guò)將作為上一層的上層深度的編碼單元的高或?qū)拕澐謨纱嗡@得的編碼單元。換句話說(shuō),當(dāng)當(dāng)前深度的編碼單元的大小為2NX 2N時(shí),下層深度的編碼單元的大小可以是NX N。此外,大小為2NX 2N的當(dāng)前深度的編碼單元可最多包括下層深度的4個(gè)編碼單元。因此,視頻編碼設(shè)備100可通過(guò)基于考慮當(dāng)前畫面的特征所確定的最大編碼單元的大小和最大深度,針對(duì)每個(gè)最大編碼單元確定具有最佳形狀和最佳大小的編碼單元,來(lái)形成具有樹結(jié)構(gòu)的編碼單元。此外,由于可通過(guò)使用各種預(yù)測(cè)模式和變換中的任何一個(gè)來(lái)針對(duì)每個(gè)最大編碼單元執(zhí)行編碼,因此可考慮各種圖像大小的編碼單元的特征來(lái)確定最佳編碼模式。因此,如果以傳統(tǒng)的宏塊對(duì)具有高分辨率或大數(shù)據(jù)量的圖像進(jìn)行編碼,則每個(gè)畫面的宏塊數(shù)量過(guò)度增加。因此,針對(duì)每個(gè)宏塊產(chǎn)生的壓縮信息的條數(shù)增加,因此難以發(fā)送壓縮信息,數(shù)據(jù)壓縮效率降低。然而,通過(guò)使用視頻編碼設(shè)備100,由于在考慮圖像大小的同時(shí)增加編碼單元的最大大小,同時(shí)在考慮圖像特征的同時(shí)調(diào)整編碼單元,因此可提高圖像壓縮效率。圖2是根據(jù)示例性實(shí)施例的視頻解碼設(shè)備200的框圖。視頻解碼設(shè)備200包括接收器210、圖像數(shù)據(jù)和編碼信息提取器220和圖像數(shù)據(jù)解碼器230。用于視頻解碼設(shè)備200的各種操作的各種術(shù)語(yǔ)(諸如編碼單元、深度、預(yù)測(cè)單元、變換單元和關(guān)于各種編碼模式的信息)的定義與以上參照?qǐng)D1和視頻編碼設(shè)備100描述的那些術(shù)語(yǔ)相同。接收器210接收并解析編碼視頻的比特流。圖像數(shù)據(jù)和編碼信息提取器220從解析的比特流提取每個(gè)編碼單元的編碼圖像數(shù)據(jù),并將提取的圖像數(shù)據(jù)輸出到圖像數(shù)據(jù)解碼器230,其中,編碼單元具有根據(jù)每個(gè)最大編碼單元的樹結(jié)構(gòu)。圖像數(shù)據(jù)和編碼信息提取器220可從關(guān)于當(dāng)前畫面的頭或SPS提取關(guān)于當(dāng)前畫面的編碼單元的最大大小的信息。此外,圖像數(shù)據(jù)和編碼信息提取器220從解析的比特流提取關(guān)于根據(jù)每個(gè)最大編碼單元的具有樹結(jié)構(gòu)的編碼單元的編碼深度和編碼模式的信息。提取的關(guān)于編碼深度和編碼模式的信息被輸出到圖像數(shù)據(jù)解碼器230。換句話說(shuō),比特流中的圖像數(shù)據(jù)被劃分為最大編碼單元,從而圖像數(shù)據(jù)解碼器230對(duì)每個(gè)最大編碼單元的圖像數(shù)據(jù)進(jìn)行解碼??舍槍?duì)關(guān)于與編碼深度相應(yīng)的 至少一個(gè)編碼單元的信息,來(lái)設(shè)置關(guān)于根據(jù)最大編碼單元的編碼深度和編碼模式的信息,關(guān)于編碼模式的信息可包括關(guān)于與編碼深度相應(yīng)的相應(yīng)編碼單元的分區(qū)類型的信息、關(guān)于預(yù)測(cè)模式的信息和變換單元的大小。此外,根據(jù)深度的劃分信息可被提取作為關(guān)于編碼深度的信息。由圖像數(shù)據(jù)和編碼信息提取器220提取的關(guān)于根據(jù)每個(gè)最大編碼單元的編碼深度和編碼模式的信息是關(guān)于編碼深度和編碼模式的信息,其中,所述編碼深度和編碼模式被確定為用于當(dāng)編碼器(諸如視頻編碼設(shè)備100)根據(jù)每個(gè)最大編碼單元對(duì)每個(gè)根據(jù)深度的較深層編碼單元重復(fù)執(zhí)行編碼時(shí)產(chǎn)生最小編碼誤差。因此,視頻解碼設(shè)備200可通過(guò)根據(jù)產(chǎn)生最小編碼誤差的編碼深度和編碼模式對(duì)圖像數(shù)據(jù)進(jìn)行解碼來(lái)恢復(fù)圖像。由于關(guān)于編碼深度和編碼模式的編碼信息可被分配給相應(yīng)編碼單元、預(yù)測(cè)單元和最小單元中的預(yù)定數(shù)據(jù)單元,因此圖像數(shù)據(jù)和編碼信息提取器220可提取關(guān)于根據(jù)預(yù)定數(shù)據(jù)單元的編碼深度和編碼模式的信息。被分配關(guān)于編碼深度和編碼模式的相同信息的預(yù)定數(shù)據(jù)單元可被推斷為包括在相同最大編碼單元中的數(shù)據(jù)單元。圖像數(shù)據(jù)解碼器230通過(guò)基于關(guān)于根據(jù)最大編碼單元的編碼深度和編碼模式的信息對(duì)每個(gè)最大編碼單元中的圖像數(shù)據(jù)進(jìn)行解碼,來(lái)恢復(fù)當(dāng)前畫面。換句話說(shuō),圖像數(shù)據(jù)解碼器230可基于提取的關(guān)于包括在每個(gè)最大編碼單元中的具有樹結(jié)構(gòu)的編碼單元中的每個(gè)編碼單元的分區(qū)類型、預(yù)測(cè)模式和變換單元的信息,來(lái)對(duì)編碼圖像數(shù)據(jù)進(jìn)行解碼。解碼處理可包括預(yù)測(cè)(包括幀內(nèi)預(yù)測(cè)和運(yùn)動(dòng)補(bǔ)償)和反變換。可根據(jù)反正交變換或反整數(shù)變換的方法來(lái)執(zhí)行反變換。圖像數(shù)據(jù)解碼器230可基于關(guān)于根據(jù)編碼深度的編碼單元的預(yù)測(cè)單元的分區(qū)類型和預(yù)測(cè)模式的信息,根據(jù)每個(gè)編碼單元的分區(qū)和預(yù)測(cè)模式執(zhí)行幀內(nèi)預(yù)測(cè)或運(yùn)動(dòng)補(bǔ)償。此外,圖像數(shù)據(jù)解碼器230可基于關(guān)于根據(jù)編碼深度的編碼單元的變換單元的大小的信息,根據(jù)編碼單元中的每個(gè)變換單元執(zhí)行反變換,從而根據(jù)最大編碼單元執(zhí)行反變換。圖像數(shù)據(jù)解碼器230可通過(guò)使用根據(jù)深度的劃分信息來(lái)確定當(dāng)前最大編碼單元的至少一個(gè)編碼深度。如果劃分信息指示圖像數(shù)據(jù)在當(dāng)前深度下不再被劃分,則當(dāng)前深度是編碼深度。因此,圖像數(shù)據(jù)解碼器230可通過(guò)使用與編碼深度相應(yīng)的每個(gè)編碼單元的關(guān)于預(yù)測(cè)單元的分區(qū)類型、預(yù)測(cè)模式和變換單元大小的信息,對(duì)當(dāng)前最大編碼單元中與每個(gè)編碼深度相應(yīng)的至少一個(gè)編碼單元的編碼數(shù)據(jù)進(jìn)行解碼,并輸出當(dāng)前最大編碼單元的圖像數(shù)據(jù)。換句話說(shuō),可通過(guò)觀察為編碼單元、預(yù)測(cè)單元和最小單元中的預(yù)定數(shù)據(jù)單元分配的編碼信息集來(lái)收集包括編碼信息(包括相同劃分信息)的數(shù)據(jù)單元,收集的數(shù)據(jù)單元可被視為將由圖像數(shù)據(jù)解碼器230以相同的編碼模式進(jìn)行解碼的一個(gè)數(shù)據(jù)單元。視頻解碼設(shè)備200可獲得關(guān)于當(dāng)針對(duì)每個(gè)最大編碼單元遞歸執(zhí)行編碼時(shí)產(chǎn)生最小編碼誤差的至少一個(gè)編碼單元的信息,并可使用所述信息來(lái)對(duì)當(dāng)前畫面進(jìn)行解碼。換句話說(shuō),可對(duì)每個(gè)最大編碼單元中被確定為最佳編碼單元的具有樹結(jié)構(gòu)的編碼單元進(jìn)行解碼。此外,可在考慮分辨率和圖像數(shù)據(jù)量的同時(shí)來(lái)確定編碼單元的最大大小。因此,即使圖像數(shù)據(jù)具有高分辨率和大數(shù)據(jù)量,也可通過(guò)使用編碼單元的大小和編碼模式來(lái)有效地對(duì)圖像數(shù)據(jù)進(jìn)行解碼和恢復(fù),其中,通過(guò)使用從編碼器接收的關(guān)于最佳編碼模式的信息,根據(jù)圖像數(shù)據(jù)的特征來(lái)適應(yīng)性地確定所述編碼單元的大小和所述編碼模式。現(xiàn)在將參照?qǐng)D3至圖13描述根據(jù)示例性實(shí)施例的確定具有樹結(jié)構(gòu)的編碼單元、預(yù)測(cè)單元和變換單元的方法。圖3是用于描述根據(jù)示例性實(shí)施例的編碼單元的概念的示圖。編碼單元的大小 可被表示為寬X高,可以是64X64、32X32、16X16和8X8。64X64的編碼單元可被劃分為64X64、64X32、32X64或32X32的分區(qū),32X32的編碼單元可被劃分為32X32、32X16、16X32或16X16的分區(qū),16X16的編碼單元可被劃分為16X16、16X8、8X16或8X8的分區(qū),8X8的編碼單元可被劃分為8X8、8X4、4X8或4X4的分區(qū)。在視頻數(shù)據(jù)310中,分辨率為1920X1080,編碼單元的最大大小為64X64,最大深度為2。在視頻數(shù)據(jù)320中,分辨率為1920X1080,編碼單元的最大大小為64X64,最大深度為3。在視頻數(shù)據(jù)330中,分辨率為352 X 288,編碼單元的最大大小為16 X 16,最大深度為I。圖3中示出的最大深度指示從最大編碼單元到最小解碼單元的總劃分次數(shù)。如果分辨率高或數(shù)據(jù)量大,則編碼單元的最大大小可較大,從而不僅提高了編碼效率還精確地反映出圖像的特征。因此,分辨率高于視頻數(shù)據(jù)330的視頻數(shù)據(jù)310和視頻數(shù)據(jù)320的編碼單元的最大大小可以是64。由于視頻數(shù)據(jù)310的最大深度是2,因此,由于通過(guò)將最大編碼單元?jiǎng)澐謨纱危疃缺患由顑蓪?,因此視頻數(shù)據(jù)310的編碼單元315可包括長(zhǎng)軸大小為64的最大編碼單元以及長(zhǎng)軸大小為32和16的編碼單元。同時(shí),由于視頻數(shù)據(jù)330的最大深度是1,因此,由于通過(guò)將最大編碼單元?jiǎng)澐忠淮?,深度被加深一層,因此視頻數(shù)據(jù)330的編碼單元335可包括長(zhǎng)軸大小為16的最大編碼單元以及長(zhǎng)軸大小為8的編碼單元。由于視頻數(shù)據(jù)320的最大深度為3,因此,由于通過(guò)將最大編碼單元?jiǎng)澐秩?,深度被加?層,因此視頻數(shù)據(jù)320的編碼單元325可包括長(zhǎng)軸大小為64的最大編碼單元以及長(zhǎng)軸大小為32、16和8的編碼單元。隨著深度加深,可精確地表達(dá)詳細(xì)信息。圖4是根據(jù)示例性實(shí)施例的基于編碼單元的圖像編碼器400的框圖。圖像編碼器400執(zhí)行視頻編碼設(shè)備100的編碼單元確定器120的操作以對(duì)圖像數(shù)據(jù)進(jìn)行編碼。換句話說(shuō),幀內(nèi)預(yù)測(cè)器410在幀內(nèi)模式下對(duì)當(dāng)前幀405中的編碼單元執(zhí)行幀內(nèi)預(yù)測(cè),運(yùn)動(dòng)估計(jì)器420和運(yùn)動(dòng)補(bǔ)償器425在幀間模式下通過(guò)使用當(dāng)前幀405和參考幀495,對(duì)當(dāng)前幀405中的編碼單元分別執(zhí)行幀間估計(jì)和運(yùn)動(dòng)補(bǔ)償。從幀內(nèi)預(yù)測(cè)器410、運(yùn)動(dòng)估計(jì)器420和運(yùn)動(dòng)補(bǔ)償器425輸出的數(shù)據(jù)通過(guò)變換器430和量化器440被輸出作為量化的變換系數(shù)。量化的變換系數(shù)通過(guò)反量化器460和反變換器470被恢復(fù)為空間域中的數(shù)據(jù),恢復(fù)的空間域中的數(shù)據(jù)在通過(guò)去塊單元480和環(huán)路濾波單元490進(jìn)行后處理之后被輸出為參考幀495。量化的變換系數(shù)可通過(guò)熵編碼器450被輸出為比特流455。為了將圖像編碼器400應(yīng)用在視頻編碼設(shè)備100中,圖像編碼器400的所有元件(即,幀內(nèi)預(yù)測(cè)器410、運(yùn)動(dòng)估計(jì)器420、運(yùn)動(dòng)補(bǔ)償器425、變換器430、量化器440、熵編碼器450、反量化器460、反變換器470、去塊單元480和環(huán)路濾波單元490)在考慮每個(gè)最大編碼單元的最大深度的同時(shí),基于具有樹結(jié)構(gòu)的編碼單元中的每個(gè)編碼單元來(lái)執(zhí)行操作。具體地,幀內(nèi)預(yù)測(cè)器410、運(yùn)動(dòng)估計(jì)器420和運(yùn)動(dòng)補(bǔ)償器425在考慮當(dāng)前最大編碼單元的最大大小和最大深度的同時(shí)確定具有樹結(jié)構(gòu)的編碼單元中的每個(gè)編碼單元的分區(qū)和預(yù)測(cè)模式,變換器430確定具有樹結(jié)構(gòu)的編碼單元中的每個(gè)編碼單元中的變換單元的大小。圖5是根據(jù)示例性實(shí)施例的基于編碼單元的圖像解碼器500的框圖。解析器510從比特流505解析將被解碼的編碼圖像數(shù)據(jù)以及解碼所需的關(guān)于編碼的信息。編碼圖像數(shù)據(jù)通過(guò)熵解碼器520和反量化器530被輸出為反量化的數(shù)據(jù),反量化的數(shù)據(jù)通過(guò)反變換器540被恢復(fù)為空間域中的圖像數(shù)據(jù)。幀內(nèi)預(yù)測(cè)器550針對(duì)空間域中的圖像數(shù)據(jù),在幀內(nèi)模式下對(duì)編碼單元執(zhí)行幀內(nèi)預(yù)測(cè),運(yùn)動(dòng)補(bǔ)償器560通過(guò)使用參考幀585在幀間模式下對(duì)編碼單元執(zhí)行運(yùn)動(dòng)補(bǔ)償。通過(guò)幀內(nèi)預(yù)測(cè)器550和運(yùn)動(dòng)補(bǔ)償器560的空間域中的圖像數(shù)據(jù)可在通過(guò)去塊單元570和環(huán)路濾波器單元580進(jìn)行后處理之后被輸出為恢復(fù)幀595。此外,通過(guò)去塊單元570和環(huán)路濾波器單元580進(jìn)行后處理的圖像數(shù)據(jù)可被輸出為參考幀585。為了在視頻解碼設(shè)備200的圖像數(shù)據(jù)解碼器230中對(duì)圖像數(shù)據(jù)進(jìn)行解碼,圖像解碼器500可執(zhí)行在解析器510之后執(zhí)行的操作。為了將圖像解碼器500應(yīng)用在視頻解碼設(shè)備200中,圖像解碼器500的所有元件(即,解析器510、熵解碼器520、反量化器530、反變換器540、幀內(nèi)預(yù)測(cè)器550、運(yùn)動(dòng)補(bǔ)償器560、去塊單元570和環(huán)路濾波單元580)針對(duì)每個(gè)最大編碼單元基于具有樹結(jié)構(gòu)的編碼單元執(zhí)行操作。具體地,幀內(nèi)預(yù)測(cè)器550和運(yùn)動(dòng)補(bǔ)償器560基于每個(gè)具有樹結(jié)構(gòu)的編碼單元的分區(qū)和預(yù)測(cè)模式執(zhí)行操作,反變換器540基于每個(gè)編碼單元的變換單元的大小執(zhí)行操作。圖6是 示出根據(jù)示例性實(shí)施例的根據(jù)深度的較深層編碼單元以及分區(qū)的示圖。視頻編碼設(shè)備100和視頻解碼設(shè)備200使用分層編碼單元以考慮圖像的特征。可根據(jù)圖像的特征自適應(yīng)地確定編碼單元的最大高度、最大寬度和最大深度,或可由用戶不同地設(shè)置編碼單元的最大高度、最大寬度和最大深度??筛鶕?jù)編碼單元的預(yù)定最大大小來(lái)確定根據(jù)深度的較深層編碼單元的大小。在根據(jù)示例性實(shí)施例的編碼單元的分層結(jié)構(gòu)600中,編碼單元的最大高度和最大寬度均為64,最大深度為4。由于深度沿分層結(jié)構(gòu)600的縱軸加深,因此較深層編碼單元的高度和寬度均被劃分。此外,沿分層結(jié)構(gòu)600的橫軸示出作為每個(gè)較深層編碼單元的預(yù)測(cè)編碼的基礎(chǔ)的預(yù)測(cè)單元和分區(qū)。換句話說(shuō),編碼單元610是分層結(jié)構(gòu)600中的最大編碼單元,其中,深度為0,大小(即,高度乘寬度)為64X64。深度沿縱軸加深,從而存在大小為32X32且深度為I的編碼單元620、大小為16X16且深度為2的編碼單元630、大小為8X8且深度為3的編碼單元640以及大小為4X4且深度為4的編碼單元650。大小為4X4且深度為4的編碼單元650
是最小編碼單元。編碼單元的預(yù)測(cè)單元和分區(qū)根據(jù)每個(gè)深度沿橫軸排列。換句話說(shuō),如果大小為64X64且深度為O的編碼單元610是預(yù)測(cè)單元,則預(yù)測(cè)單元可被劃分為包括在編碼單元610中的分區(qū),即,大小為64X64的分區(qū)610、大小為64X32的分區(qū)612、大小為32X64的分區(qū)614或大小為32X32的分區(qū)616。類似地,大小為32X32且深度為I的編碼單元620的預(yù)測(cè)單元可被劃分為包括在編碼單元620中的分區(qū),即,大小為32X32的分區(qū)620、大小為32X16的分區(qū)622、大小為16X32的分區(qū)624和大小為16X16的分區(qū)626。類似地,大小為16X16且深度為2的編碼單元630的預(yù)測(cè)單元可被劃分為包括在編碼單元630中的分區(qū), 即,包括在編碼單元630中的大小為16X16的分區(qū)630、大小為16X8的分區(qū)632、大小為8X16的分區(qū)634和大小為8X8的分區(qū)636。類似地,大小為8X8且深度為3的編碼單元640的預(yù)測(cè)單元可被劃分為包括在編碼單元640中的分區(qū),即,包括在編碼單元640中的大小為8X8的分區(qū)640、大小為8 X 4的分區(qū)642、大小為4X8的分區(qū)644或大小為4X4的分區(qū)646。大小為4X4且深度為4的編碼單元650是最小編碼單元和最下層深度的編碼單元。編碼單元650的預(yù)測(cè)單元僅被分配給大小為4X4的分區(qū)。為了確定組成最大編碼單元610的編碼單元的至少一個(gè)編碼深度,視頻編碼設(shè)備100的編碼單元確定器120針對(duì)包括在最大編碼單元610中的與每個(gè)深度相應(yīng)的編碼單元執(zhí)行編碼。隨著深度加深,以相同范圍和相同大小包括數(shù)據(jù)的根據(jù)深度的較深層編碼單元的數(shù)量增加。例如,需要四個(gè)與深度2相應(yīng)的編碼單元,以覆蓋包括在與深度I相應(yīng)的一個(gè)編碼單元中的數(shù)據(jù)。因此,為了比較相同數(shù)據(jù)根據(jù)深度的編碼結(jié)果,與深度I相應(yīng)的編碼單元和四個(gè)與深度2相應(yīng)的編碼單元各自被編碼。為了針對(duì)深度中的當(dāng)前深度執(zhí)行編碼,可通過(guò)沿分層結(jié)構(gòu)600的橫軸,針對(duì)與當(dāng)前深度相應(yīng)的編碼單元中的每個(gè)預(yù)測(cè)單元執(zhí)行編碼,來(lái)針對(duì)當(dāng)前深度選擇最小編碼誤差??蛇x地,可通過(guò)隨著深度沿分層結(jié)構(gòu)600的縱軸加深針對(duì)每個(gè)深度執(zhí)行編碼來(lái)比較根據(jù)深度的最小編碼誤差,從而搜索最小編碼誤差。編碼單元610中具有最小編碼誤差的深度和分區(qū)可被選為編碼單元610的編碼深度和分區(qū)類型。
圖7是用于描述根據(jù)示例性實(shí)施例的編碼單元710和變換單元720之間的關(guān)系的示圖。視頻編碼設(shè)備100或視頻解碼設(shè)備200針對(duì)每個(gè)最大編碼單元,根據(jù)具有小于或等于最大編碼單元的大小的編碼單元來(lái)對(duì)圖像進(jìn)行編碼或解碼。可基于不大于相應(yīng)編碼單元的數(shù)據(jù)單元來(lái)選擇編碼期間用于變換的變換單元的大小。例如,在視頻編碼設(shè)備100或視頻解碼設(shè)備200中,如果編碼單元710的大小是64 X 64,則可通過(guò)使用大小為32X32的變換單元720來(lái)執(zhí)行變換。此外,可通過(guò)對(duì)小于64X64的大小為32X32、16X 16、8X8和4X4的變換單元中的每一個(gè)執(zhí)行變換,來(lái)對(duì)大小為64X64的編碼單元710的數(shù)據(jù)進(jìn)行編碼,隨后可選擇具有最小編碼誤差的變換單元。圖8是用于描述根據(jù)示例性實(shí)施例的與編碼深度相應(yīng)的編碼單元的編碼信息的示圖。視頻編碼設(shè)備100的輸出單元130可對(duì)與編碼深度相應(yīng)的每個(gè)編碼單元的關(guān)于分區(qū)類型的信息800、關(guān)于預(yù)測(cè)模式的信息810和關(guān)于變換單元的大小的信息820進(jìn)行編碼和發(fā)送,以作為關(guān)于編碼模式 的信息。信息800指示關(guān)于通過(guò)對(duì)當(dāng)前編碼單元的預(yù)測(cè)單元進(jìn)行劃分而獲得的分區(qū)的形狀的信息,其中,所述分區(qū)是用于對(duì)當(dāng)前編碼單元進(jìn)行預(yù)測(cè)編碼的數(shù)據(jù)單元。例如,大小為2NX2N的當(dāng)前編碼單元CU_0可被劃分為大小為2NX2N的分區(qū)802、大小為2NXN的分區(qū)804、大小為NX 2N的分區(qū)806和大小為NXN的分區(qū)808中的任意一個(gè)。這里,關(guān)于分區(qū)類型的信息800被設(shè)置為指示大小為2NXN的分區(qū)804、大小為NX2N的分區(qū)806和大小為NXN的大小的分區(qū)808之一。信息810指示每個(gè)分區(qū)的預(yù)測(cè)模式。例如,信息810可指示對(duì)由信息800指示的分區(qū)執(zhí)行的預(yù)測(cè)編碼的模式,即,幀內(nèi)模式812、幀間模式814或跳過(guò)模式816。信息820指示當(dāng)針對(duì)當(dāng)前編碼單元執(zhí)行變換時(shí)所基于的變換單元。例如,變換單元可以是第一幀內(nèi)變換單元822、第二幀內(nèi)變換單元824、第一幀間變換單元826或第二幀內(nèi)變換單元828。視頻解碼設(shè)備200的圖像數(shù)據(jù)和編碼信息提取器220可根據(jù)每個(gè)較深層編碼單元提取和使用用于解碼的信息800、810和820。圖9是根據(jù)示例性實(shí)施例的根據(jù)深度的較深層編碼單元的示圖。劃分信息可被用于指示深度的改變。劃分信息指示當(dāng)前深度的編碼單元是否被劃分為下層深度的編碼單元。用于對(duì)深度為O且大小為2N_0X2N_0的編碼單元900進(jìn)行預(yù)測(cè)編碼的預(yù)測(cè)單元910可包括以下分區(qū)類型的分區(qū):大小為2N_0X2N_0的分區(qū)類型912、大小為2N_0XN_0的分區(qū)類型914、大小為N_0X2N_0的分區(qū)類型916、大小為Ν_0ΧΝ_0的分區(qū)類型918。圖9僅示出通過(guò)對(duì)預(yù)測(cè)單元910進(jìn)行對(duì)稱劃分而獲得的分區(qū)類型912至918,但應(yīng)理解分區(qū)類型不限于此,預(yù)測(cè)單元910的分區(qū)可包括不對(duì)稱分區(qū)、具有預(yù)定形狀的分區(qū)和具有幾何形狀的分區(qū)。根據(jù)每個(gè)分區(qū)類型,對(duì)一個(gè)大小為2N_0X2N_0的分區(qū)、兩個(gè)大小為2N_0XN_0的分區(qū)、兩個(gè)大小為N_0X2N_0的分區(qū)和四個(gè)大小為Ν_0ΧΝ_0的分區(qū)重復(fù)執(zhí)行預(yù)測(cè)編碼??蓪?duì)大小為2N_0 X 2N_0、N_0 X 2N_0、2N_0 X N_0和N_0 X N_0的分區(qū)執(zhí)行幀內(nèi)模式和幀間模式下的預(yù)測(cè)編碼。可僅對(duì)大小為2N_0X2N_0的分區(qū)執(zhí)行跳過(guò)模式下的預(yù)測(cè)編碼。比較包括分區(qū)類型912至918中的預(yù)測(cè)編碼的編碼的誤差,在分區(qū)類型中確定最小編碼誤差。如果在分區(qū)類型912至916之一中編碼誤差最小,則預(yù)測(cè)單元910可不被劃分到下層深度。如果在分區(qū)類型918中編碼誤差最小,則深度從O改變到I以在操作920對(duì)分區(qū)類型918進(jìn)行劃分,對(duì)深度為2且 大小為Ν_0ΧΝ_0的編碼單元930重復(fù)執(zhí)行編碼,以搜索
最小編碼誤差。用于對(duì)深度為I且大小為2N_1X2N_1 (= Ν_0ΧΝ_0)的編碼單元930進(jìn)行預(yù)測(cè)編碼的預(yù)測(cè)單元940可包括以下分區(qū)類型的分區(qū):大小為2N_1X2N_1的分區(qū)類型942、大小為2N_1XN_1的分區(qū)類型944、大小為N_1X2N_1的分區(qū)類型946、大小為N_1 XN_1的分區(qū)類型948。如果在分區(qū)類型948中編碼誤差最小,則深度從I改變到2以在操作950對(duì)分區(qū)類型948進(jìn)行劃分,對(duì)深度為2且大小為N_2XN_2的編碼單元960重復(fù)執(zhí)行編碼,以搜索
最小編碼誤差。當(dāng)最大深度為d時(shí),可執(zhí)行根據(jù)每個(gè)深度的劃分操作,直到深度變?yōu)閐-Ι,劃分信息可被編碼直到深度為O到d-2中的一個(gè)。換句話說(shuō),當(dāng)編碼被執(zhí)行直到在操作970與深度d-2相應(yīng)的編碼單元被劃分之后深度為d-Ι時(shí),用于對(duì)深度為d-Ι且大小為2N_(d-l) X2N_(d-1)的編碼單元980進(jìn)行預(yù)測(cè)編碼的預(yù)測(cè)單元990可包括以下分區(qū)類型的分區(qū):大小為2N_(d-l) X2N_(d-l)的分區(qū)類型992、大小為2N_(d_l) XN_(d_l)的分區(qū)類型994、大小為N_(d-1) X2N_(d-l)的分區(qū)類型996、大小為N_(d-1) XN_(d-l)的分區(qū)類型998??稍诜謪^(qū)類型992至998中對(duì)一個(gè)大小為2N_(d_l) X2N_(d_l)的分區(qū)、兩個(gè)大小為2N_(d-l) XN_(d-l)的分區(qū)、兩個(gè)大小為N_(d-1) X2N_(d-l)的分區(qū)、四個(gè)大小為N_(d-1) XN_(d-l)的分區(qū)重復(fù)執(zhí)行預(yù)測(cè)編碼,以搜索具有最小編碼誤差的分區(qū)類型。即使當(dāng)分區(qū)類型998具有最小編碼誤差時(shí),但由于最大深度為d,因此深度為d-1的編碼單元cu_(d-l)不再被劃分到下層深度,用于組成當(dāng)前最大編碼單元900的編碼單元的編碼深度被確定為d-Ι,當(dāng)前最大編碼單元900的分區(qū)類型可被確定為N_(d-1) XN_(d-1)。此外,由于最大深度為d并且具有最下層深度d-Ι的最小編碼單元980不再被劃分到下層深度,因此不設(shè)置最小編碼單元980的劃分信息。數(shù)據(jù)單元999可以為當(dāng)前最大編碼單元的‘最小單元’。根據(jù)示例性實(shí)施例的最小單元可以是通過(guò)將最小編碼單元980劃分4次而獲得的矩形數(shù)據(jù)單元。通過(guò)重復(fù)執(zhí)行編碼,視頻編碼設(shè)備100可通過(guò)比較根據(jù)編碼單元900的深度的編碼誤差來(lái)選擇具有最小編碼誤差的深度以確定編碼深度,將相應(yīng)的分區(qū)類型和預(yù)測(cè)模式設(shè)置為編碼深度的編碼模式。這樣,在I至d的所有深度中比較根據(jù)深度的最小編碼誤差,具有最小編碼誤差的深度可被確定為編碼深度。編碼深度、預(yù)測(cè)單元的分區(qū)類型和預(yù)測(cè)模式可被編碼和發(fā)送,作為關(guān)于編碼模式的信息。此外,由于編碼單元從深度O被劃分到編碼深度,因此僅編碼深度的劃分信息被設(shè)置為0,除了編碼深度之外的深度的劃分信息被設(shè)置為I。視頻解碼設(shè)備200的圖像數(shù)據(jù)和編碼信息提取器220可提取并使用關(guān)于編碼單元900的編碼深度和預(yù)測(cè)單元的信息以對(duì)分區(qū)912進(jìn)行解碼。視頻解碼設(shè)備200可通過(guò)使用根據(jù)深度的劃分信息將劃分信息為O的深度確定為編碼深度,并使用關(guān)于相應(yīng)深度的編碼模式的信息以進(jìn)行解碼。圖10至圖12是用于描述根據(jù)示例性實(shí)施例的編碼單元1010、預(yù)測(cè)單元1060和變換單元1070之間的關(guān)系的示圖。編碼單元1010是最大編碼單元中與由視頻編碼設(shè)備100確定的編碼深度相應(yīng)的具有樹結(jié)構(gòu)的編碼單元。預(yù)測(cè)單元1060是編碼單元1010中的每一個(gè)的預(yù)測(cè)單元的分區(qū),變換單元1070是編碼單元1010中的每一個(gè)的變換單元。當(dāng)編碼單元1010中的最大編碼單元的深度是O時(shí),編碼單元1012和1054的深度是 1,編碼單元 1014、1016、1018、1028、1050 和 1052 的深度是 2,編碼單元 1020、1022、1024、1026、1030、1032和1048的深度是3,編碼單元1040、1042、1044和1046的深度是4。在預(yù)測(cè)單元1060中,通過(guò)對(duì)編碼單元1010中的編碼單元進(jìn)行劃分來(lái)獲得某些編碼單元 1014、1016、1022、1032、1048、1050、1052 和 1054。換句話說(shuō),編碼單元 1014、1022、1050和1054中的分區(qū)類型具有2NXN的大小,編碼單元1016、1048和1052中的分區(qū)類型具有NX2N的大小,編碼單元1032的分區(qū)類型具有NXN的大小。編碼單元1010的預(yù)測(cè)單元和分區(qū)小于或等于每個(gè)編碼單元。對(duì)小于編碼單元1052的數(shù)據(jù)單元中的變換單元1070中的編碼單元1052的圖像數(shù)據(jù)執(zhí)行變換或反變換。此外,變換單元1070中的編碼單元1014、1016、1022、1032、1048、1050和1052在大小和形狀方面與預(yù)測(cè)單元1060中的編碼單元1014、1016、1022、1032、1048,1050和1052不同。換句話說(shuō),視頻編碼設(shè)備100和視頻解碼設(shè)備200可對(duì)相同編碼單元中的數(shù)據(jù)單元分別執(zhí)行幀內(nèi)預(yù)測(cè)、運(yùn)動(dòng)估計(jì)、運(yùn)動(dòng)補(bǔ)償、變換和反變換。因此,對(duì)最大編碼單元的每個(gè)區(qū)域中具有分層結(jié)構(gòu)的編碼單元中的每一個(gè)遞歸地執(zhí)行編碼,以確定最佳編碼單元,從而可獲得具有遞歸樹結(jié)構(gòu)的編碼單元。編碼信息可包括關(guān)于編碼單元的劃 分信息、關(guān)于分區(qū)類型的信息、關(guān)于預(yù)測(cè)模式的信息和關(guān)于變換單元的大小的信息中。表I示出可由視頻編碼設(shè)備100和視頻解碼設(shè)備200設(shè)置的編碼信息。表I
權(quán)利要求
1.一種對(duì)視頻進(jìn)行解碼的設(shè)備,所述設(shè)備包括: 接收器,接收并解析編碼圖像的比特流; 處理器,通過(guò)使用從接收到的比特流解析的指示編碼單元的劃分形狀的信息和關(guān)于編碼單元的預(yù)測(cè)單元的信息,確定作為數(shù)據(jù)單元的具有分層結(jié)構(gòu)的編碼單元以及用于對(duì)編碼單元進(jìn)行預(yù)測(cè)的子單元,其中,按所述數(shù)據(jù)單元對(duì)編碼的圖像進(jìn)行解碼,其中,子單元包括通過(guò)根據(jù)任意比例對(duì)編碼單元的高度和寬度中的至少一個(gè)進(jìn)行劃分而獲得的分區(qū), 解碼器,使用從接收到的比特流解析的編碼信息,通過(guò)執(zhí)行解碼來(lái)重建圖像,其中,解碼包括使用針對(duì)編碼單元的分區(qū)的運(yùn)動(dòng)補(bǔ)償, 其中,具有分層結(jié)構(gòu)的編碼單元包括根據(jù)編碼深度并獨(dú)立于鄰近編碼單元而分層劃分的編碼深度的編碼單元。
2.如權(quán)利要求1所述的設(shè)備,其中,處理器基于針對(duì)具有分層結(jié)構(gòu)的編碼單元的關(guān)于編碼深度和編碼模式的編碼信息,在編碼深度的編碼單元之中確定當(dāng)前編碼單元的分區(qū)類型和預(yù)測(cè)模式,如果確定的分區(qū)類型和預(yù)測(cè)模式是通過(guò)根據(jù)任意比例對(duì)當(dāng)前編碼單元進(jìn)行劃分而獲得的用于幀間預(yù)測(cè)的分區(qū)的類型,則處理器確定通過(guò)根據(jù)任意比例對(duì)當(dāng)前編碼單元的高度和寬度中的至少一個(gè)進(jìn)行劃分而獲得的子分區(qū)。
3.如權(quán)利要求1所述的設(shè)備,其中,解碼器選擇性地確定是否使用從比特流提取的通過(guò)基于指示用于幀間預(yù)測(cè)的分區(qū)類型的信息根據(jù)任意比例對(duì)編碼單元進(jìn)行劃分而獲得的分區(qū)以及通過(guò)根據(jù)任意比例對(duì)編碼單元進(jìn)行劃分而獲得的分區(qū),來(lái)執(zhí)行運(yùn)動(dòng)補(bǔ)償。
4.如權(quán)利要求1所述的設(shè)備,其中,分區(qū)包括大小等于當(dāng)前編碼單元或分區(qū)的大小的預(yù)測(cè)單元、通過(guò)對(duì)當(dāng)前編碼單元的高度和寬度中的至少一個(gè)進(jìn)行對(duì)稱劃分而獲得的子分區(qū)、以及通過(guò)對(duì)當(dāng)前編碼單元的高度和寬度中的至少一個(gè)進(jìn)行不對(duì)稱劃分而獲得的子分區(qū)。
5.如權(quán)利要求1所述的設(shè)備,其中,基于關(guān)于編碼單元被分層劃分到的編碼單元的最大大小的信息以及編碼單元被分層劃分到的編碼單元的深度的信息,編碼圖像的圖像被編碼。
全文摘要
公開了一種對(duì)視頻進(jìn)行編碼的方法和設(shè)備,所述方法包括基于根據(jù)最大編碼單元的至少一個(gè)劃分的區(qū)域的分層結(jié)構(gòu)的較深層編碼單元,對(duì)最大編碼單元的視頻數(shù)據(jù)進(jìn)行編碼,并使用通過(guò)根據(jù)任意比例劃分編碼單元而獲得的分區(qū)執(zhí)行幀間預(yù)測(cè),來(lái)確定編碼深度;輸出比特流,所述比特流包括與根據(jù)最大編碼單元的編碼深度相應(yīng)的編碼視頻數(shù)據(jù)以及關(guān)于編碼深度和編碼模式的信息。
文檔編號(hào)H04N7/26GK103220523SQ201310091250
公開日2013年7月24日 申請(qǐng)日期2010年12月8日 優(yōu)先權(quán)日2009年12月8日
發(fā)明者李善一, 千岷洙, 韓宇鎮(zhèn) 申請(qǐng)人:三星電子株式會(huì)社