專利名稱:用于對(duì)視頻進(jìn)行解碼的設(shè)備的制作方法
技術(shù)領(lǐng)域:
示例性實(shí)施例涉及對(duì)視頻進(jìn)行編碼和解碼。
背景技術(shù):
隨著用于再現(xiàn)和存儲(chǔ)高分辨率或高質(zhì)量視頻內(nèi)容的硬件的開發(fā)和提供,對(duì)用于對(duì)高分辨率或高質(zhì)量視頻內(nèi)容進(jìn)行有效地編碼或解碼的視頻編解碼器的需求正在增加。在傳統(tǒng)的視頻編解碼器中,基于具有預(yù)定大小的宏塊根據(jù)有限的編碼方法對(duì)視頻進(jìn)行編碼。
發(fā)明內(nèi)容
技術(shù)問題示例性實(shí)施例提供了基于各種大小的分層編碼單元對(duì)圖像進(jìn)行的編碼和解碼。技術(shù)方案根據(jù)示例性實(shí)施例的 一方面,提供了一種對(duì)視頻進(jìn)行編碼的方法,所述方法包括:將當(dāng)前畫面劃分為至少一個(gè)最大編碼單元;基于與每個(gè)最大編碼單元的區(qū)域被劃分的次數(shù)成比例地加深的深度,通過對(duì)至少一個(gè)劃分區(qū)域進(jìn)行編碼來確定用于輸出根據(jù)所述至少一個(gè)劃分區(qū)域的最終編碼結(jié)果的編碼深度,其中,通過根據(jù)深度對(duì)所述至少一個(gè)最大編碼單元中的每一個(gè)的區(qū)域進(jìn)行劃分來獲得所述至少一個(gè)劃分區(qū)域;根據(jù)每個(gè)最大編碼單元,輸出構(gòu)成根據(jù)所述至少一個(gè)劃分區(qū)域的最終編碼結(jié)果的圖像數(shù)據(jù),以及關(guān)于編碼深度和預(yù)測(cè)模式的編碼息。有益效果當(dāng)圖像數(shù)據(jù)具有高分辨率和大數(shù)據(jù)量時(shí),可通過使用編碼單元的大小和編碼模式,有效地解碼并恢復(fù)圖像數(shù)據(jù),其中,通過使用從編碼器接收的關(guān)于最佳編碼模式的信息,根據(jù)圖像數(shù)據(jù)的特性自適應(yīng)地確定所述編碼單元的大小和所述編碼模式。
通過參照附圖詳細(xì)地描述本發(fā)明的示例性實(shí)施例,示例性實(shí)施例的以上和其它特征將變得更清楚,其中:圖1是根據(jù)示例性實(shí)施例的用于對(duì)視頻進(jìn)行編碼的設(shè)備的框圖;圖2是根據(jù)示例性實(shí)施例的用于對(duì)視頻進(jìn)行解碼的設(shè)備的框圖;圖3是用于描述根據(jù)示例性實(shí)施例的編碼單元的概念的示圖;圖4是根據(jù)示例性實(shí)施例的基于編碼單元的圖像編碼器的框圖;圖5是根據(jù)示例性實(shí)施例的基于編碼單元的圖像解碼器的框圖;圖6是示出根據(jù)示例性實(shí)施例的根據(jù)深度的更深編碼單元以及分區(qū)(partition)的示圖;圖7是用于描述根據(jù)示例性實(shí)施例的編碼單元和變換單元之間的關(guān)系的示圖;圖8是用于描述根據(jù)示例性實(shí)施例的與編碼深度相應(yīng)的編碼單元的編碼信息的示圖;圖9是根據(jù)示例性實(shí)施例的根據(jù)深度的更深編碼單元的示圖;圖10至圖12是用于描述根據(jù)示例性實(shí)施例的編碼單元、預(yù)測(cè)單元和變換單元之間的關(guān)系的不圖;圖13是用于根據(jù)表I的編碼模式信息描述編碼單元、預(yù)測(cè)單元或分區(qū),和變換單兀之間的關(guān)系的不圖;圖14是示出根據(jù)示例性實(shí)施例對(duì)視頻進(jìn)行編碼的方法的流程圖;圖15是示出根據(jù)示例性實(shí)施例對(duì)視頻進(jìn)行解碼的方法的流程圖。最佳實(shí)施方式根據(jù)示例性實(shí)施例的一方面,提供了一種對(duì)視頻進(jìn)行編碼的方法,所述方法包括:將當(dāng)前畫面劃分為至少一個(gè)最大編碼單元;通過基于與每個(gè)最大編碼單元的區(qū)域被劃分的次數(shù)成比例地加深的深度對(duì)至少一個(gè)劃分區(qū)域進(jìn)行編碼來確定用于輸出根據(jù)所述至少一個(gè)劃分區(qū)域的最終編碼結(jié)果的編碼深度,其中,通過根據(jù)深度對(duì)所述至少一個(gè)最大編碼單元中的每一個(gè)的區(qū)域進(jìn)行劃分來獲得所述至少一個(gè)劃分區(qū)域;根據(jù)每個(gè)最大編碼單元,輸出構(gòu)成根據(jù)所述至少一個(gè)劃分區(qū)域的最終編碼結(jié)果的圖像數(shù)據(jù),以及關(guān)于編碼深度和預(yù)測(cè)模式的編碼息。編碼單元可由最大 大小和深度來表征。深度指示編碼單元被分層劃分的次數(shù),并且隨著深度加深,根據(jù)深度的更深編碼單元可從最大編碼單元被劃分以獲得最小編碼單元。深度從更高深度被加深到更低深度。隨著深度加深,最大編碼單元被劃分的次數(shù)增加,最大編碼單元被劃分的可能的總次數(shù)相應(yīng)于最大深度。編碼單元的最大大小和最大深度可被預(yù)先確定。所述方法還可包括:預(yù)先確定所述至少一個(gè)最大編碼單元的最大深度和最大大小,最大深度指示所述至少一個(gè)最大編碼單元的高和寬被分層劃分的總次數(shù)??舍槍?duì)所述至少一個(gè)最大編碼單元中的每一個(gè),基于根據(jù)至少一個(gè)深度的更深編碼單元對(duì)圖像數(shù)據(jù)進(jìn)行編碼,隨著深度加深,編碼單元可從每個(gè)最大編碼單元被分層劃分。確定編碼深度的步驟可包括:根據(jù)針對(duì)每個(gè)最大編碼單元的根據(jù)深度的更深編碼單元,根據(jù)與當(dāng)前深度相應(yīng)的編碼單元以及通過對(duì)與當(dāng)前深度相應(yīng)的編碼單元的高和寬中的至少一個(gè)進(jìn)行劃分而獲得的分區(qū),執(zhí)行預(yù)測(cè)編碼。確定編碼深度的步驟可包括:根據(jù)針對(duì)最大編碼單元的根據(jù)深度的更深編碼單元,對(duì)具有比與當(dāng)前深度相應(yīng)的編碼單元的高和寬更小的高或?qū)挼臄?shù)據(jù)單元執(zhí)行變換。確定編碼深度的步驟還可包括:通過比較根據(jù)每個(gè)最大編碼單元的多個(gè)深度進(jìn)行編碼的結(jié)果,確定具有最小編碼誤差的編碼深度,并且確定以下項(xiàng)中的至少一個(gè):每個(gè)與編碼深度相應(yīng)的編碼單元中執(zhí)行預(yù)測(cè)編碼的數(shù)據(jù)單元的分區(qū)類型和預(yù)測(cè)模式、與編碼深度相應(yīng)的編碼單元中執(zhí)行變換的數(shù)據(jù)單元的大小。可根據(jù)與編碼深度相應(yīng)的編碼單元獨(dú)立地確定預(yù)測(cè)模式,預(yù)測(cè)模式包括幀內(nèi)模式、幀間模式和跳過模式中的至少一個(gè)。
關(guān)于編碼模式的信息可包括以下項(xiàng)中的至少一個(gè):針對(duì)每個(gè)最大編碼單元的編碼深度、關(guān)于根據(jù)與編碼深度相應(yīng)的編碼單元的執(zhí)行預(yù)測(cè)編碼的數(shù)據(jù)單元的分區(qū)類型的信息、關(guān)于根據(jù)與編碼深度相應(yīng)的編碼單元的分區(qū)的預(yù)測(cè)模式的信息、以及關(guān)于根據(jù)與編碼深度相應(yīng)的編碼單元的執(zhí)行變換的數(shù)據(jù)單元的大小的信息。所述方法還可包括:對(duì)劃分信息進(jìn)行編碼,劃分信息指示是否根據(jù)每個(gè)最大編碼單元中的多個(gè)深度對(duì)更低深度而不是當(dāng)前深度的編碼單元執(zhí)行編碼。所述方法還可包括:如果基于當(dāng)前深度的劃分信息,對(duì)更低深度的編碼單元執(zhí)行編碼,則對(duì)通過對(duì)與當(dāng)前深度相應(yīng)的編碼單元進(jìn)行劃分而獲得的每個(gè)部分編碼單元重復(fù)執(zhí)行編碼。最大編碼單元的深度可以是最高深度,構(gòu)成根據(jù)深度的劃分區(qū)域的根據(jù)深度的更深編碼單元可以是通過對(duì)更高深度的編碼單元的高和寬劃分兩次而獲得的編碼單元。與當(dāng)前深度相應(yīng)的分區(qū)可以是通過對(duì)與當(dāng)前深度相應(yīng)的數(shù)據(jù)單元的高和寬中的至少一個(gè)劃分兩次而獲得的數(shù)據(jù)單元??赏ㄟ^使用基于拉格朗日乘子的率失真優(yōu)化方法來測(cè)量編碼誤差??筛鶕?jù)通過對(duì)與當(dāng)前深度相應(yīng)的編碼單元?jiǎng)澐謨纱位驅(qū)εc當(dāng)前深度相應(yīng)的編碼單元的高和寬中的至少一個(gè)劃分兩次而獲得的數(shù)據(jù)單元來執(zhí)行幀內(nèi)模式下的預(yù)測(cè)編碼和幀間模式下的預(yù)測(cè)編碼。根據(jù)示例性實(shí)施例的另一方面,提供了一種對(duì)視頻進(jìn)行解碼的方法,所述方法包括:接收并解析編碼視頻的比特流;從比特流提取分配給至少一個(gè)最大編碼單元的當(dāng)前畫面的圖像數(shù)據(jù)以及關(guān)于根據(jù)所述至少一個(gè)最大編碼單元的編碼深度和編碼模式的信息;基于關(guān)于針對(duì)每個(gè)最大編碼單元的編碼深度和編碼模式的編碼信息,對(duì)所述至少一個(gè)最大編碼單元中的每一個(gè)中的圖像數(shù)據(jù)進(jìn)行解碼,其中,深度與每個(gè)最大編碼單元的區(qū)域被劃分的次數(shù)成比例地加深,通過在對(duì)當(dāng)前畫面進(jìn)行編碼的同時(shí)對(duì)每個(gè)最大編碼單元的至少一個(gè)劃分區(qū)域進(jìn)行編碼,根據(jù)所述至少一個(gè)劃分區(qū)域輸出最終編碼結(jié)果的深度被確定為針對(duì)每個(gè)最大編碼單元的至少一個(gè)編碼深度,其中,通過根據(jù)深度對(duì)每個(gè)最大編碼單元的區(qū)域進(jìn)行劃分來獲得所述至少一個(gè)劃分區(qū)域。所述方法還可包括:從比特流提取關(guān)于每個(gè)最大編碼單元的最大深度的信息和關(guān)于每個(gè)最大編碼單元的最大大小的信息,最大深度指示每個(gè)最大編碼單元的高和寬被分層劃分的總次數(shù)。解碼的步驟可包括:基于提取的關(guān)于每個(gè)最大編碼單元的編碼模式的信息中的關(guān)于編碼深度的信息以及關(guān)于用于執(zhí)行預(yù)測(cè)解碼的數(shù)據(jù)單元的分區(qū)類型和預(yù)測(cè)模式的信息,對(duì)每個(gè)最大編碼單元的與編碼深度相應(yīng)的編碼單元執(zhí)行預(yù)測(cè)編碼。解碼的步驟可包括:基于關(guān)于每個(gè)最大編碼單元的編碼深度和用于執(zhí)行反變換的數(shù)據(jù)單元的大小的信息,針對(duì)最大編碼單元對(duì)每個(gè)與編碼深度相應(yīng)的編碼單元執(zhí)行反變換。所述方法還可包括:從比特流提取劃分信息,劃分信息指示是否根據(jù)每個(gè)最大編碼單元的多個(gè)深度對(duì)與更低深度而不是當(dāng)前深度相應(yīng)的編碼單元執(zhí)行解碼。 根據(jù)示例性實(shí)施例的另一方面,提供了一種用于對(duì)視頻進(jìn)行編碼的設(shè)備,所述設(shè)備包括:最大編碼單元?jiǎng)澐制鳎糜趯?dāng)前畫面劃分為至少一個(gè)最大編碼單元;編碼單元確定器,用于通過基于與每個(gè)最大編碼單元的區(qū)域被劃分的次數(shù)成比例地加深的深度,對(duì)至少一個(gè)劃分區(qū)域進(jìn)行編碼來確定用于輸出根據(jù)所述至少一個(gè)劃分的區(qū)域的最終編碼結(jié)果的編碼深度,其中,通過根據(jù)深度對(duì)所述至少一個(gè)最大編碼單元中的每一個(gè)的區(qū)域進(jìn)行劃分來獲得所述至少一個(gè)劃分區(qū)域;輸出單元,根據(jù)每個(gè)最大編碼單元,用于輸出構(gòu)成根據(jù)所述至少一個(gè)劃分區(qū)域的最終編碼結(jié)果的圖像數(shù)據(jù),以及關(guān)于編碼深度和預(yù)測(cè)模式的編碼信息。根據(jù)示例性實(shí)施例的另一方面,提供了一種用于對(duì)視頻進(jìn)行解碼的設(shè)備,所述設(shè)備包括:接收器,用于接收并解析編碼視頻的比特流;圖像數(shù)據(jù)和編碼信息提取器,用于從比特流提取被分配給至少一個(gè)最大編碼單元的當(dāng)前畫面的圖像數(shù)據(jù)以及關(guān)于根據(jù)所述至少一個(gè)最大編碼單元的編碼深度和編碼模式的信息;解碼器,用于基于關(guān)于針對(duì)所述至少一個(gè)最大編碼單元中的每一個(gè)的編碼深度和編碼模式的信息,對(duì)每個(gè)最大編碼單元中的圖像數(shù)據(jù)進(jìn)行解碼,其中,深度與每個(gè)最大編碼單元的區(qū)域被劃分的次數(shù)成比例地加深,通過在對(duì)當(dāng)前畫面進(jìn)行編碼的同時(shí)對(duì)每個(gè)最大編碼單元的至少一個(gè)劃分區(qū)域進(jìn)行編碼,根據(jù)所述至少一個(gè)劃分區(qū)域輸出最終編碼結(jié)果的深度被確定為針對(duì)每個(gè)最大編碼單元的至少一個(gè)編碼深度,其中,通過 根據(jù)深度對(duì)每個(gè)最大編碼單元的區(qū)域進(jìn)行劃分來獲得所述至少一個(gè)劃分區(qū)域。根據(jù)示例性實(shí)施例的另一方面,提供了一種計(jì)算機(jī)可讀記錄介質(zhì),所述計(jì)算機(jī)可讀記錄介質(zhì)記錄有用于執(zhí)行對(duì)視頻進(jìn)行編碼的方法的程序。根據(jù)示例性實(shí)施例的另一方面,提供了一種計(jì)算機(jī)可讀記錄介質(zhì),所述計(jì)算機(jī)可讀記錄介質(zhì)記錄有用于執(zhí)行對(duì)視頻進(jìn)行解碼的方法的程序。
具體實(shí)施例方式以下,將參照附圖更充分地描述示例性實(shí)施例,其中,示例性實(shí)施例在附圖中示出。在示例性實(shí)施例中,“單元”可表示取決于其上下文的大小的單位,或可不表示取決于其上下文的大小的單位。以下,“編碼單元”是根據(jù)示例性實(shí)施例的編碼數(shù)據(jù)單元(encoding data unit)以及被編碼的數(shù)據(jù)單元(encoded data unit),其中,圖像數(shù)據(jù)在編碼器側(cè)按照所述編碼數(shù)據(jù)單元被編碼,被編碼的圖像數(shù)據(jù)在解碼器側(cè)按照被編碼的數(shù)據(jù)單元被解碼。此外,“編碼深度(coded depth) ”指示編碼單元被編碼的深度。以下,“圖像”可表示視頻的靜止圖像或運(yùn)動(dòng)圖像(即,視頻本身)。圖1是根據(jù)示例性實(shí)施例的視頻編碼設(shè)備100的框圖。視頻編碼設(shè)備100包括最大編碼單元?jiǎng)澐制?10、編碼單元確定器120和輸出單元130。最大編碼單元?jiǎng)澐制?10可基于針對(duì)圖像的當(dāng)前畫面的最大編碼單元對(duì)當(dāng)前畫面進(jìn)行劃分。如果當(dāng)前畫面大于最大編碼單元,則當(dāng)前畫面的圖像數(shù)據(jù)可被劃分為至少一個(gè)最大編碼單元。根據(jù)示例性實(shí)施例的最大編碼單元可以是具有32X32、64X64、128X128、256X256等大小的數(shù)據(jù)單元,其中,數(shù)據(jù)單元的形狀是寬和高為2的平方的方形。圖像數(shù)據(jù)可根據(jù)所述至少一個(gè)最大編碼單元被輸出到編碼單元確定器120。根據(jù)示例性實(shí)施例的編碼單元可由最大大小和深度來表征。深度表示編碼單元從最大編碼單元被空間劃分的次數(shù)。因此,隨著深度加深或增加,根據(jù)深度的更深編碼單元可從最大編碼單元被劃分為最小編碼單元。最大編碼單元的深度是最高深度,最小編碼單元的深度是最低深度。由于與每個(gè)深度相應(yīng)的編碼單元的大小隨著最大編碼單元的深度加深而減小,因此,與更高深度相應(yīng)的編碼單元可包括多個(gè)與更低深度相應(yīng)的編碼單元。如上所述,當(dāng)前畫面的圖像數(shù)據(jù)根據(jù)編碼單元的最大大小被劃分為最大編碼單元,所述最大編碼單元中的每一個(gè)可包括根據(jù)深度被劃分的更深編碼單元。由于根據(jù)示例性實(shí)施例的最大編碼單元根據(jù)深度被劃分,因此包括在最大編碼單元中的空間域的圖像數(shù)據(jù)可根據(jù)深度被分層劃分??深A(yù)先確定編碼單元的最大深度和最大大小,所述最大深度和最大大小限定最大編碼單元的高和寬被分層劃分的總次數(shù)。編碼單元確定器120對(duì)通過根據(jù)深度劃分最大編碼單元的區(qū)域而獲得的至少一個(gè)劃分區(qū)域進(jìn)行編碼,并確定用于輸出根據(jù)所述至少一個(gè)劃分區(qū)域的最終編碼的圖像數(shù)據(jù)的深度。換句話說,編碼單元確定器120通過根據(jù)當(dāng)前畫面的最大編碼單元以根據(jù)深度的更深編碼單元對(duì)圖像數(shù)據(jù)進(jìn)行編碼,并選擇具有最小編碼誤差的深度,來確定編碼深度。因此,最終輸出與確定的編碼深度相應(yīng)的編碼單元的編碼圖像數(shù)據(jù)。此外,與編碼深度相應(yīng)的編碼單元可被視為被編碼的編碼單元。確定的編碼深度和根據(jù)確定的編碼深度的編碼圖像數(shù)據(jù)被輸出到輸出單元130?;谂c等于或低于最大深度的至少一個(gè)深度相應(yīng)的更深編碼單元對(duì)最大編碼單元中的圖像數(shù)據(jù)進(jìn)行編碼,并基于更深編碼單元中的每一個(gè)來比較對(duì)圖像數(shù)據(jù)進(jìn)行編碼的結(jié)果。在比較更深編碼單元的編碼誤差之后,可選擇具有最小編碼誤差的深度??蔀槊總€(gè)最大編碼單元選擇至少一個(gè)編碼深度。隨著編碼單元根據(jù)深度被分層劃分,并隨著編碼單元的數(shù)量增加,最大編碼單元的大小被劃分。此外,即使在一個(gè)最大編碼單元中多個(gè)編碼單元相應(yīng)于相同深度,也通過分別測(cè)量每個(gè)編碼單元的圖像數(shù)據(jù)的編碼誤差來確定是否將與相同深度相應(yīng)的編碼單元中的每一個(gè)劃分至更低的深度。因此,即使當(dāng)圖像數(shù)據(jù)被包括在一個(gè)最大編碼單元中時(shí),圖像數(shù)據(jù)也根據(jù)深度被劃分到多個(gè)區(qū)域,在一個(gè)最大編碼單元中編碼誤差可根據(jù)區(qū)域而不同,因此,編碼深度可根據(jù)圖像數(shù)據(jù)中的區(qū)域而不同。因此,在一個(gè)最大編碼單元中可確定一個(gè)或多個(gè)編碼深度,并可根據(jù)至少一個(gè)編碼深度的編碼單元來劃分最大編碼單元的圖像數(shù)據(jù)。因此,編碼單元確定器120可確定包括在最大編碼單元中的具有樹結(jié)構(gòu)的編碼單元。根據(jù)示例性實(shí)施例的“具有樹結(jié)構(gòu)的編碼單元”包括最大編碼單元中所包括的所有更深編碼單元中與被確定為編碼深度的深度相應(yīng)的編碼單元。在最大編碼單元的相同區(qū)域中,編碼深度的編碼單元可根據(jù)深度被分層地確定,在不同的區(qū)域中,編碼深度的編碼單元可被獨(dú)立地確定。類似地,當(dāng)前區(qū)域中的編碼深度可獨(dú)立于另一區(qū)域中的編碼深度被確定。根據(jù)示例性實(shí)施例的最大深度是與從最大編碼單元到最小編碼單元的劃分次數(shù)相關(guān)的索引。根據(jù)示例性實(shí)施例的第一最大深度可表示從最大編碼單元到最小編碼單元的總劃分次數(shù)。根據(jù)示例性實(shí)施例的第二最大深度可表示從最大編碼單元到最小編碼單元的深度級(jí)的總數(shù)。例如,當(dāng)最大編碼單元的深度為O時(shí),最大編碼單元被劃分一次的編碼單元的深度可被設(shè)置為1, 最大編碼單元被劃分兩次的編碼單元的深度可被設(shè)置為2。這里,如果最小編碼單元是最大編碼單元被劃分四次的編碼單元,則存在深度0、1、2、3和4的5個(gè)深度級(jí),因此,第一最大深度可被設(shè)置為4,第二最大深度可被設(shè)置為5。可根據(jù)最大編碼單元執(zhí)行預(yù)測(cè)編碼和變換。還可根據(jù)最大編碼單元,基于根據(jù)等于或小于最大深度的深度的更深編碼單元來執(zhí)行預(yù)測(cè)編碼和變換??筛鶕?jù)正交變換或整數(shù)變換的方法來執(zhí)行變換。由于每當(dāng)最大編碼單元根據(jù)深度被劃分時(shí)更深編碼單元的數(shù)量增加,因此可針對(duì)隨著深度加深而產(chǎn)生的所有更深編碼單元執(zhí)行包括預(yù)測(cè)編碼和變換的編碼。為了便于描述,現(xiàn)在將基于最大編碼單元中的當(dāng)前深度的編碼單元來描述預(yù)測(cè)編碼和變換。視頻編碼設(shè)備100可不同地選擇用于對(duì)圖像數(shù)據(jù)進(jìn)行編碼的數(shù)據(jù)單元的大小或形狀。為了對(duì)圖像數(shù)據(jù)進(jìn)行編碼,執(zhí)行諸如預(yù)測(cè)編碼、變換和熵編碼的操作,此時(shí),可針對(duì)所有操作使用相同的數(shù)據(jù)單元,或者可針對(duì)每個(gè)操作使用不同的數(shù)據(jù)單元。例如,視頻編碼設(shè)備100不僅可選擇用于對(duì)圖像數(shù)據(jù)進(jìn)行編碼的編碼單元,還可選擇與編碼單元不同的數(shù)據(jù)單元以對(duì)編碼單元中的圖像數(shù)據(jù)執(zhí)行預(yù)測(cè)編碼。為了在最大編碼單元中執(zhí)行預(yù)測(cè)編碼,可基于與編碼深度相應(yīng)的編碼單元(即,基于不再被劃分為與更低深度相應(yīng)的編碼單元的編碼單元)執(zhí)行預(yù)測(cè)編碼。以下,不再被劃分并且變成用于預(yù)測(cè)編碼的基本單元的編碼單元現(xiàn)在將被稱為“預(yù)測(cè)單元”。通過對(duì)預(yù)測(cè)單元進(jìn)行劃分所獲得的分 區(qū)(partition)可包括通過對(duì)預(yù)測(cè)單元的高和寬中的至少一個(gè)進(jìn)行劃分所獲得的預(yù)測(cè)單元或數(shù)據(jù)單元。例如,當(dāng)2NX2N(其中,N是正整數(shù))的編碼單元不再被劃分,并且變成2NX2N的預(yù)測(cè)單元時(shí),分區(qū)的大小可以是2NX 2N、2NX N、NX 2N或NX N。分區(qū)類型的示例包括通過對(duì)預(yù)測(cè)單元的高或?qū)掃M(jìn)行對(duì)稱劃分所獲得的對(duì)稱分區(qū)、通過對(duì)預(yù)測(cè)單元的高或?qū)掃M(jìn)行不對(duì)稱劃分(諸如1: η或η:1)所獲得的分區(qū)、通過對(duì)預(yù)測(cè)單元進(jìn)行幾何劃分所獲得的分區(qū)以及具有任意形狀的分區(qū)。預(yù)測(cè)單元的預(yù)測(cè)模式可以是幀內(nèi)模式、幀間模式和跳過模式中的至少一個(gè)。例如,可針對(duì)2ΝX 2Ν、2ΝX N、NX 2Ν或NX N的分區(qū)執(zhí)行幀內(nèi)模式或幀間模式。此外,可僅針對(duì)2ΝΧ2Ν的分區(qū)執(zhí)行跳過模式。針對(duì)編碼單元中的一個(gè)預(yù)測(cè)單元獨(dú)立地執(zhí)行編碼,從而選擇具有最小編碼誤差的預(yù)測(cè)模式。視頻編碼設(shè)備100還可不僅基于用于對(duì)圖像數(shù)據(jù)進(jìn)行編碼的編碼單元,還基于不同于編碼單元的數(shù)據(jù)單元,對(duì)編碼單元中的圖像數(shù)據(jù)執(zhí)行變換。為了在編碼單元中執(zhí)行變換,可基于具有小于或等于編碼單元的大小的數(shù)據(jù)單元來執(zhí)行變換。例如,用于變換的數(shù)據(jù)單元可包括用于幀內(nèi)模式的數(shù)據(jù)單元和用于幀間模式的數(shù)據(jù)單元。用作變換的基礎(chǔ)的數(shù)據(jù)單元將被稱為“變換單元”。還可在變換單元中設(shè)置指示通過對(duì)編碼單元的高和寬進(jìn)行劃分以達(dá)到變換單元的劃分次數(shù)的變換深度。例如,在2ΝΧ2Ν的當(dāng)前編碼單元中,當(dāng)變換單元的大小也為2ΝΧ 2Ν時(shí),變換深度可以是0,在當(dāng)前編碼單元的高和寬中的每一個(gè)被劃分為兩等份,總共被劃分為4~1個(gè)變換單元,從而變換單元的大小是NXN時(shí),變換深度可以是1,在當(dāng)前編碼單元的高和寬中的每一個(gè)被劃分為四等份,總共被劃分為4~2個(gè)變換單元,從而變換單元的大小是Ν/2ΧΝ/2時(shí),變換深度可以是2。例如,可根據(jù)分層樹結(jié)構(gòu)來設(shè)置變換單元,其中,根據(jù)變換深度的分層特性,更高變換深度的變換單元被劃分為四個(gè)更低變換深度的變換單元。
與編碼單元類似,編碼單元中的變換單元可被遞歸地劃分為大小更小的區(qū)域,從而可以以區(qū)域?yàn)閱挝华?dú)立地確定變換單元。因此,可根據(jù)具有根據(jù)變換深度的樹結(jié)構(gòu)的變換,來劃分編碼單元中的殘差數(shù)據(jù)。根據(jù)與編碼深度相應(yīng)的編碼單元的編碼信息不僅需要關(guān)于編碼深度的信息,還需要關(guān)于與預(yù)測(cè)編碼和變換有關(guān)的信息的信息。因此,編碼單元確定器120不僅確定具有最小編碼誤差的編碼深度,還確定預(yù)測(cè)單元中的分區(qū)類型、根據(jù)預(yù)測(cè)單元的預(yù)測(cè)模式和用于變換的變換單元的大小。稍后將參照?qǐng)D3至圖12詳細(xì)描述根據(jù)示例性實(shí)施例的最大編碼單元中的根據(jù)樹結(jié)構(gòu)的編碼單元以及確定分區(qū)的方法。編碼單元確定器120可通過使用基于拉格朗日乘子的率失真優(yōu)化來測(cè)量根據(jù)深度的更深編碼單元的編碼誤差。輸出單元130在比特流中輸出最大編碼單元的圖像數(shù)據(jù)以及關(guān)于根據(jù)編碼深度的編碼模式的信息,其中,所述圖像數(shù)據(jù)基于由編碼單元確定器120確定的至少一個(gè)編碼深度被編碼。通過對(duì)圖像的殘差數(shù)據(jù)進(jìn)行編碼來獲得編碼圖像數(shù)據(jù)。關(guān)于根據(jù)編碼深度的編碼模式的信息可包括關(guān)于編碼深度的信息、關(guān)于預(yù)測(cè)單元中的分區(qū)類型、預(yù)測(cè)模式和變換單元的大小的信息。可通過使用根據(jù)深度的劃分信息來定義關(guān)于編碼深度的信息,關(guān)于編碼深度的信息指示是否針對(duì)更低深度而不是當(dāng)前深度的編碼單元來執(zhí)行編碼。如果當(dāng)前編碼單元的當(dāng)前深度是編碼深度,則當(dāng)前編碼單元中的圖像數(shù)據(jù)被編碼并被輸出,因此劃分信息可被定義為不將當(dāng)前編碼單元?jiǎng)澐种粮蜕疃???蛇x地,如果當(dāng)前編碼單元的當(dāng)前深度不是編碼深度,則針對(duì)更低深度的編碼單元來執(zhí)行編碼,因此劃分信息可被定義為劃分當(dāng)前編碼單元以獲得更低深度的編碼單 元。如果當(dāng)前深度不是編碼深度,則針對(duì)被劃分為更低深度的編碼單元的編碼單元來執(zhí)行編碼。由于在當(dāng)前深度的一個(gè)編碼單元中存在更低深度的至少一個(gè)編碼單元,因此針對(duì)更低深度的每個(gè)編碼單元重復(fù)執(zhí)行編碼,因此,可針對(duì)具有相同深度的編碼單元遞歸地執(zhí)行編碼。由于針對(duì)一個(gè)最大編碼單元確定具有樹結(jié)構(gòu)的編碼單元,并且針對(duì)編碼深度的編碼單元確定關(guān)于至少一個(gè)編碼模式的信息,因此,可針對(duì)一個(gè)最大編碼單元確定關(guān)于至少一個(gè)編碼模式的信息。此外,由于圖像數(shù)據(jù)根據(jù)深度被分層劃分,因此最大編碼單元的圖像數(shù)據(jù)的編碼深度可根據(jù)位置而不同,因此,可針對(duì)圖像數(shù)據(jù)設(shè)置關(guān)于編碼深度和編碼模式的信息。因此,輸出單元130可將關(guān)于相應(yīng)的編碼深度和編碼模式的編碼信息分配給包括在最大編碼單元中的編碼單元、預(yù)測(cè)單元和最小單元中的至少一個(gè)。根據(jù)示例性實(shí)施例的最小單元是通過將構(gòu)成最低深度的最小編碼單元?jiǎng)澐?次所獲得的矩形數(shù)據(jù)單元??蛇x地,最小單元可以是最大矩形數(shù)據(jù)單元,所述最大矩形數(shù)據(jù)單元可包括在最大編碼單元中所包括的所有編碼單元、預(yù)測(cè)單元、分區(qū)單元和變換單元中。例如,通過輸出單元130輸出的編碼信息可被分為根據(jù)編碼單元的編碼信息和根據(jù)預(yù)測(cè)單元的編碼信息。根據(jù)編碼單元的編碼信息可包括關(guān)于預(yù)測(cè)模式的信息和關(guān)于分區(qū)的大小的信息。根據(jù)預(yù)測(cè)單元的編碼信息可包括關(guān)于幀間模式的估計(jì)方向的信息、關(guān)于幀間模式的參考圖像索引的信息、關(guān)于運(yùn)動(dòng)矢量的信息、關(guān)于幀內(nèi)模式的色度分量的信息和關(guān)于幀內(nèi)模式的插值方法的信息。此外,關(guān)于根據(jù)畫面、像條或GOP定義的編碼單元的最大大小的信息以及關(guān)于最大深度的信息可被插入比特流的頭或SPS(序列參數(shù)集)中。在視頻編碼設(shè)備100中,更深編碼單元可以是通過將作為上一層的更高深度的編碼單元的高或?qū)拕澐謨纱嗡@得的編碼單元。換句話說,在當(dāng)前深度的編碼單元的大小為2NX2N時(shí),更低深度的編碼單元的大小可以是NXN。此外,具有2NX 2N的大小的當(dāng)前深度的編碼單元可包括最多4個(gè)更低深度的編碼單元。因此,視頻編碼設(shè)備100可通過基于考慮當(dāng)前畫面的特征所確定的最大編碼單元的大小和最大深度,針對(duì)每個(gè)最大編碼單元確定具有最佳形狀和最佳大小的編碼單元,來形成具有樹結(jié)構(gòu)的編碼單元。此外,由于可通過使用各種預(yù)測(cè)模式和變換中的任意一個(gè)來針對(duì)每個(gè)最大編碼單元執(zhí)行編碼,因此可考慮各種圖像大小的編碼單元的特征來確定最佳編碼模式。因此,如果以現(xiàn)有技術(shù)的宏塊對(duì)具有高分辨率或大數(shù)據(jù)量的圖像進(jìn)行編碼,則每個(gè)畫面的宏塊的數(shù)量過度增加。因此,針對(duì)每個(gè)宏塊產(chǎn)生的壓縮信息的條數(shù)增加,因此難以發(fā)送壓縮信息并且數(shù)據(jù)壓縮效率降低。然而,通過使用視頻編碼設(shè)備100,在考慮圖像的大小的同時(shí)增加編碼單元的最大大小時(shí),由于在考慮圖像的特征的同時(shí)調(diào)整編碼單元,因此可提聞圖像壓縮效率 。圖2是根據(jù)示例性實(shí)施例的視頻解碼設(shè)備200的框圖。視頻解碼設(shè)備200包括接收器210、圖像數(shù)據(jù)和編碼信息提取器220以及圖像數(shù)據(jù)解碼器230。用于視頻解碼設(shè)備200的各種操作的各種術(shù)語(諸如編碼單元、深度、預(yù)測(cè)單元、變換單元和關(guān)于各種編碼模式的信息)的定義與參照?qǐng)D1和視頻編碼設(shè)備100描述的那些術(shù)語相同。接收器210接收并解析編碼視頻的比特流。圖像數(shù)據(jù)和編碼信息提取器220從解析的比特流提取每個(gè)編碼單元的編碼圖像數(shù)據(jù),并將提取的圖像數(shù)據(jù)輸出到圖像數(shù)據(jù)解碼器230,其中,所述編碼單元具有根據(jù)每個(gè)最大編碼單元的樹結(jié)構(gòu)。圖像數(shù)據(jù)和編碼信息提取器220可從關(guān)于當(dāng)前畫面的頭或者SPS中提取關(guān)于當(dāng)前畫面的編碼單元的最大大小的信
肩、O此外,圖像數(shù)據(jù)和編碼信息提取器220從解析的比特流提取關(guān)于具有根據(jù)每個(gè)最大編碼單元的樹結(jié)構(gòu)的編碼單元的編碼深度和編碼模式的信息。提取的關(guān)于編碼深度和編碼模式的信息被輸出到圖像數(shù)據(jù)解碼器230。換句話說,比特流中的圖像數(shù)據(jù)被劃分為最大編碼單元,從而圖像數(shù)據(jù)解碼器230針對(duì)每個(gè)最大編碼單元對(duì)圖像數(shù)據(jù)進(jìn)行解碼。可針對(duì)關(guān)于與編碼深度相應(yīng)的至少一個(gè)編碼單元的信息,來設(shè)置關(guān)于根據(jù)最大編碼單元的編碼深度和編碼模式的信息,并且關(guān)于編碼模式的信息可包括關(guān)于與編碼深度相應(yīng)的相應(yīng)編碼單元的分區(qū)類型的信息、關(guān)于預(yù)測(cè)模式和變換單元的大小的信息。此外,根據(jù)深度的劃分信息可被提取作為關(guān)于編碼深度的信息。由圖像數(shù)據(jù)和編碼信息提取器220提取的關(guān)于根據(jù)每個(gè)最大編碼單元的編碼深度和編碼模式的信息是關(guān)于這樣的編碼深度和編碼模式的信息:所述編碼深度和編碼模式被確定用于當(dāng)編碼器(諸如視頻編碼設(shè)備100)根據(jù)每個(gè)最大編碼單元針對(duì)根據(jù)深度的每個(gè)更深編碼單元重復(fù)執(zhí)行編碼時(shí)產(chǎn)生最小編碼誤差。因此,視頻解碼設(shè)備200可通過根據(jù)產(chǎn)生最小編碼誤差的編碼深度和編碼模式對(duì)圖像數(shù)據(jù)進(jìn)行解碼來恢復(fù)圖像。由于關(guān)于編碼深度和編碼模式的編碼信息可被分配給相應(yīng)編碼單元、預(yù)測(cè)單元和最小單元中的預(yù)定數(shù)據(jù)單元,因此圖像數(shù)據(jù)和編碼信息提取器220可提取關(guān)于根據(jù)預(yù)定數(shù)據(jù)單元的編碼深度和編碼模式的信息。被分配有關(guān)于編碼深度和編碼模式的相同信息的預(yù)定數(shù)據(jù)單元可被推斷是包括在相同最大編碼單元中的數(shù)據(jù)單元。圖像數(shù)據(jù)解碼器230通過基于關(guān)于根據(jù)最大編碼單元的編碼深度和編碼模式的信息對(duì)每個(gè)最大編碼單元中的圖像數(shù)據(jù)進(jìn)行解碼,來恢復(fù)當(dāng)前畫面。換句話說,圖像數(shù)據(jù)解碼器230可基于提取的關(guān)于包括在每個(gè)最大編碼單元中的具有樹結(jié)構(gòu)的編碼單元中的每個(gè)編碼單元的分區(qū)類型、預(yù)測(cè)模式和變換單元的信息,來對(duì)編碼圖像數(shù)據(jù)進(jìn)行解碼。解碼處理可包括預(yù)測(cè)(所述預(yù)測(cè)包括幀內(nèi)預(yù)測(cè)和運(yùn)動(dòng)補(bǔ)償)和反變換??筛鶕?jù)反正交變換或反整數(shù)變換的方法來執(zhí)行反變換。圖像數(shù)據(jù)解碼器230可基于關(guān)于根據(jù)編碼深度的編碼單元的預(yù)測(cè)單元的分區(qū)類型和預(yù)測(cè)模式的信息,根據(jù)每個(gè)編碼單元的分區(qū)和預(yù)測(cè)模式執(zhí)行幀內(nèi)預(yù)測(cè)或運(yùn)動(dòng)補(bǔ)償。此外,圖像 數(shù)據(jù)解碼器230可基于關(guān)于根據(jù)編碼深度的編碼單元的變換單元的大小的信息,根據(jù)編碼單元中的每個(gè)變換單元執(zhí)行反變換,從而根據(jù)最大編碼單元執(zhí)行反變換。圖像數(shù)據(jù)解碼器230可通過使用根據(jù)深度的劃分信息來確定當(dāng)前最大編碼單元的至少一個(gè)編碼深度。如果劃分信息指示圖像數(shù)據(jù)在當(dāng)前深度中不再被劃分,則當(dāng)前深度是編碼深度。因此,圖像數(shù)據(jù)解碼器230可通過使用關(guān)于與編碼深度相應(yīng)的每個(gè)編碼單元的預(yù)測(cè)單元的分區(qū)類型、預(yù)測(cè)模式和變換單元的大小的信息,對(duì)當(dāng)前最大編碼單元中與每個(gè)編碼深度相應(yīng)的至少一個(gè)編碼單元的編碼數(shù)據(jù)進(jìn)行解碼,并輸出當(dāng)前最大編碼單元的圖像數(shù)據(jù)。換句話說,可通過觀察為編碼單元、預(yù)測(cè)單元和最小單元中的預(yù)定數(shù)據(jù)單元分配的編碼信息集來收集包含編碼信息(所述編碼信息包括相同的劃分信息)的數(shù)據(jù)單元,收集的數(shù)據(jù)單元可被視為是將由圖像數(shù)據(jù)解碼器230以相同的編碼模式進(jìn)行解碼的一個(gè)數(shù)據(jù)單元。視頻解碼設(shè)備200可獲得關(guān)于當(dāng)針對(duì)每個(gè)最大編碼單元遞歸執(zhí)行編碼時(shí)產(chǎn)生最小編碼誤差的至少一個(gè)編碼單元的信息,并可使用所述信息來對(duì)當(dāng)前畫面進(jìn)行解碼。換句話說,可對(duì)每個(gè)最大編碼單元中被確定為最佳編碼單元的具有樹結(jié)構(gòu)的編碼單元進(jìn)行解碼。此外,可考慮分辨率和圖像數(shù)據(jù)量來確定編碼單元的最大大小。因此,即使圖像數(shù)據(jù)具有高分辨率和大數(shù)據(jù)量,也可通過使用編碼單元的大小和編碼模式來對(duì)圖像數(shù)據(jù)進(jìn)行有效地解碼和恢復(fù),其中,通過使用從編碼器接收的關(guān)于最佳編碼模式的信息,根據(jù)圖像數(shù)據(jù)的特征來自適應(yīng)地確定所述編碼單元的大小和所述編碼模式。現(xiàn)在將參照?qǐng)D3至圖13描述根據(jù)示例性實(shí)施例的確定具有樹結(jié)構(gòu)的編碼單元、預(yù)測(cè)單元和變換單元的方法。圖3是用于描述根據(jù)示例性實(shí)施例的編碼單元的概念的示圖。編碼單元的大小可被表示為寬X高,并且可以是64\64、32父32、16\16和8父8。64X64的編碼單元可被劃分為64X64、64X32、32X64或32X32的分區(qū),32X32的編碼單元可被劃分為32X32、32X16、16X32或16X16的分區(qū),16X16的編碼單元可被劃分為16X16、16X8、8X16或8X8的分區(qū),8X8的編碼單元可被劃分為8X8、8X4、4X8或4X4的分區(qū)。在視頻數(shù)據(jù)310中,分辨率為1920 X 1080,編碼單元的最大大小為64,并且最大深度為2。在視頻數(shù)據(jù)320中,分辨率為1920 X 1080,編碼單元的最大大小為64,并且最大深度為3。在視頻數(shù)據(jù)330中,分辨率為352 X 288,編碼單元的最大大小為16,并且最大深度為I。圖3中示出的最大深度指示從最大編碼單元到最小解碼單元的劃分總次數(shù)。如果分辨率高或數(shù)據(jù)量大,則 編碼單元的最大大小可以較大,從而不僅提高了編碼效率,還精確地反映出圖像的特征。因此,具有比視頻數(shù)據(jù)330更高的分辨率的視頻數(shù)據(jù)310和320的編碼單元的最大大小可以是64。由于第一視頻數(shù)據(jù)310的最大深度是2,因此,由于通過對(duì)最大編碼單元?jiǎng)澐謨纱?,深度被加深到兩層,因此視頻數(shù)據(jù)310的編碼單元315可包括具有64的長(zhǎng)軸大小的最大編碼單元以及具有32和16的長(zhǎng)軸大小的編碼單元。同時(shí),由于視頻數(shù)據(jù)330的最大深度是1,因此,由于通過對(duì)最大編碼單元?jiǎng)澐忠淮?,深度被加深到一層,因此視頻數(shù)據(jù)330的編碼單元335可包括具有16的長(zhǎng)軸大小的最大編碼單元以及具有8的長(zhǎng)軸大小的編碼單
J Li ο由于視頻數(shù)據(jù)320的最大深度為3,因此,由于通過對(duì)最大編碼單元?jiǎng)澐秩?,深度被加深?層,因此視頻數(shù)據(jù)320的編碼單元325可包括具有64的長(zhǎng)軸大小的最大編碼單元以及具有32、16和8的長(zhǎng)軸大小的編碼單元。隨著深度加深,可精確地表示詳細(xì)信息。圖4是根據(jù)示例性實(shí)施例的基于編碼單元的圖像編碼器400的框圖。圖像編碼器400執(zhí)行視頻編碼設(shè)備100的編碼單元確定器120的操作以對(duì)圖像數(shù)據(jù)進(jìn)行編碼。換句話說,幀內(nèi)預(yù)測(cè)器410在幀內(nèi)模式下對(duì)當(dāng)前幀405中的編碼單元執(zhí)行幀內(nèi)預(yù)測(cè),運(yùn)動(dòng)估計(jì)器420和運(yùn)動(dòng)補(bǔ)償器425在幀間模式下通過使用當(dāng)前幀405和參考幀495,對(duì)當(dāng)前幀405中的編碼單元執(zhí)行幀間估計(jì)和運(yùn)動(dòng)補(bǔ)償。從幀內(nèi)預(yù)測(cè)器410、運(yùn)動(dòng)估計(jì)器420和運(yùn)動(dòng)補(bǔ)償器425輸出的數(shù)據(jù)通過變換器430和量化器440被輸出為量化的變換系數(shù)。量化的變換系數(shù)通過反量化器460和反變換器470被恢復(fù)為空間域中的數(shù)據(jù),恢復(fù)的空間域中的數(shù)據(jù)在通過去塊單元480和環(huán)路濾波單元490進(jìn)行后處理之后被輸出為參考幀495。量化的變換系數(shù)可通過熵編碼器450被輸出為比特流455。為了將圖像編碼器400應(yīng)用在視頻編碼設(shè)備100中,圖像編碼器400的所有元件(即,幀內(nèi)預(yù)測(cè)器410、運(yùn)動(dòng)估計(jì)器420、運(yùn)動(dòng)補(bǔ)償器425、變換器430、量化器440、熵編碼器450、反量化器460、反變換器470、去塊單元480和環(huán)路濾波單元490)在考慮每個(gè)最大編碼單元的最大深度的同時(shí),基于具有樹結(jié)構(gòu)的編碼單元中的每個(gè)編碼單元來執(zhí)行操作。具體地,幀內(nèi)預(yù)測(cè)器410、運(yùn)動(dòng)估計(jì)器420和運(yùn)動(dòng)補(bǔ)償器425在考慮當(dāng)前最大編碼單元的最大大小和最大深度的同時(shí),確定具有樹結(jié)構(gòu)的編碼單元中的每個(gè)編碼單元的分區(qū)和預(yù)測(cè)模式,變換器430確定具有樹結(jié)構(gòu)的編碼單元中的每個(gè)編碼單元中的變換單元的大小。圖5是根據(jù)示例性實(shí)施例的基于編碼單元的圖像解碼器500的框圖。
解析器510從比特流505中解析將被解碼的編碼圖像數(shù)據(jù)以及解碼所需要的關(guān)于編碼的信息。編碼圖像數(shù)據(jù)通過熵解碼器520和反量化器530被輸出為反量化的數(shù)據(jù),反量化的數(shù)據(jù)通過反變換器540被恢復(fù)為空間域中的圖像數(shù)據(jù)。幀內(nèi)預(yù)測(cè)器550針對(duì)空間域中的圖像數(shù)據(jù),在幀內(nèi)模式下對(duì)編碼單元執(zhí)行幀內(nèi)預(yù)測(cè),運(yùn)動(dòng)補(bǔ)償器560通過使用參考幀585在幀間模式下對(duì)編碼單元執(zhí)行運(yùn)動(dòng)補(bǔ)償。經(jīng)過幀內(nèi)預(yù)測(cè)器550和運(yùn)動(dòng)補(bǔ)償器560的空間域中的圖像數(shù)據(jù)可在通過去塊單元570和環(huán)路濾波單元580進(jìn)行后處理之后被輸出為恢復(fù)的幀595。此外,通過去塊單元570和環(huán)路濾波單元580進(jìn)行后處理的圖像數(shù)據(jù)可被輸出為參考幀585。為了在視頻解碼設(shè)備200的圖像數(shù)據(jù)解碼器230中對(duì)圖像數(shù)據(jù)進(jìn)行解碼,圖像解碼器500可執(zhí)行在解析器510之后執(zhí)行的操作。為了將圖像解碼器500應(yīng)用在視頻解碼設(shè)備200中,圖像解碼器500的所有元件(即,解析器510、熵解碼器520、反量化器530、反變換器540、幀內(nèi)預(yù)測(cè)器550、運(yùn)動(dòng)補(bǔ)償器560、去塊單元570和環(huán)路濾波單元580)針對(duì)每個(gè)最大編碼單元基于具有樹結(jié)構(gòu)的編碼單元執(zhí)行操作。具體地,幀內(nèi)預(yù)測(cè)器550和運(yùn)動(dòng)補(bǔ)償器560基于具有樹結(jié)構(gòu)的每個(gè)編碼單元的分區(qū)和預(yù)測(cè)模式執(zhí)行操作,反變換器540基于每個(gè)編碼單元的變換單元的大小執(zhí)行操作。
圖6是示出根據(jù)示例性實(shí)施例的根據(jù)深度的更深編碼單元以及分區(qū)的示圖。視頻編碼設(shè)備100和視頻解碼設(shè)備200使用分層編碼單元以考慮圖像的特征??筛鶕?jù)圖像的特征自適應(yīng)地確定編碼單元的最大高度、最大寬度和最大深度,或可由用戶不同地設(shè)置編碼單元的最大高度、最大寬度和最大深度??筛鶕?jù)編碼單元的預(yù)定最大大小來確定根據(jù)深度的更深編碼單元的大小。在根據(jù)示例性實(shí)施例的編碼單元的分層結(jié)構(gòu)600中,編碼單元的最大高度和最大寬度均為64,并且最大深度為4。由于深度沿分層結(jié)構(gòu)600的縱軸加深,因此更深編碼單元的高度和寬度均被劃分。此外,沿分層結(jié)構(gòu)600的橫軸示出作為用于每個(gè)更深編碼單元的預(yù)測(cè)編碼的基礎(chǔ)的預(yù)測(cè)單元和分區(qū)。換句話說,編碼單元610是分層結(jié)構(gòu)600中的最大編碼單元,其中,深度為0,大小(即,高度乘寬度)為64X64。深度沿縱軸加深,從而存在大小為32X32且深度為I的編碼單元620、大小為16X16且深度為2的編碼單元630、大小為8X8且深度為3的編碼單元640以及大小為4X4且深度為4的編碼單元650。大小為4X4且深度為4的編碼單元650是最小編碼單元。編碼單元的預(yù)測(cè)單元和分區(qū)根據(jù)每個(gè)深度沿橫軸排列。換句話說,如果大小為64X64且深度為O的編碼單元610是預(yù)測(cè)單元,則預(yù)測(cè)單元可被劃分為包括在編碼單元610中的分區(qū),即,大小為64X64的分區(qū)610、大小為64X32的分區(qū)612、大小為32X64的分區(qū)614或大小為32X32的分區(qū)616。類似地,大小為32X32且深度為I的編碼單元620的預(yù)測(cè)單元可被劃分為包括在編碼單元620中的分區(qū),即,大小為32X32的分區(qū)620、大小為32X16的分區(qū)622、大小為16X32的分區(qū)624和大小為16X16的分區(qū)626。類似地,大小為16 X 16且深度為2的編碼單元630的預(yù)測(cè)單元可被劃分為包括在編碼單元630中的分區(qū),即,包括在編碼單元630中的大小為16X16的分區(qū)、大小為16X8的分區(qū)632、大小為8X16的分區(qū)634和大小為8X8的分區(qū)636。類似地,大小為8X8且深度為3的編碼單元640的預(yù)測(cè)單元可被劃分為包括在編碼單元640中的分區(qū),即,包括在編碼單元640中的大小為8X8的分區(qū)、大小為8X4的分區(qū)642、大小為4X8的分區(qū)634和大小為4X4的分區(qū)646。大小為4X4且深度為4的編碼單元650是最小編碼單元和最低深度的編碼單元。編碼單元650的預(yù)測(cè)單元僅被分配給大小為4X4的分區(qū)。為了確定構(gòu)成最大編碼單元610的編碼單元的至少一個(gè)編碼深度,視頻編碼設(shè)備100的編碼單元確定器120針對(duì)包括在最大編碼單元610中的與每個(gè)深度相應(yīng)的編碼單元執(zhí)行編碼。隨著深度加深,以相同范圍中和相同大小包括數(shù)據(jù)的根據(jù)深度的更深編碼單元的數(shù)量增加。例如,覆蓋包括在一個(gè)與深度I相應(yīng)的編碼單元中的數(shù)據(jù)需要四個(gè)與深度2相應(yīng)的編碼單元。因此,為了比較相同數(shù)據(jù)的根據(jù)深度的編碼結(jié)果,與深度I相應(yīng)的編碼單元和四個(gè)與深度2相應(yīng)的編碼單元均被編碼。為了針對(duì)深度中的當(dāng)前深度執(zhí)行編碼,可通過沿分層結(jié)構(gòu)600的橫軸,針對(duì)與當(dāng)前深度相應(yīng)的編碼單元中的每個(gè)預(yù)測(cè)單元執(zhí)行編碼,來針對(duì)當(dāng)前深度選擇最小編碼誤差??蛇x地,可通過隨著深度沿分層結(jié)構(gòu)600的縱軸加深針對(duì)每個(gè)深度執(zhí)行編碼來比較根據(jù)深度的最小編碼誤差,從而搜索最小編碼誤差。編碼單元610中具有最小編碼誤差的深度和分區(qū)可被選為編碼單元610的編碼深度和分區(qū)類型。圖7是用于描述根據(jù)示例性實(shí)施例的編碼單元710和變換單元720之間的關(guān)系的示圖。視頻編碼設(shè)備100或200針對(duì)每個(gè)最大編碼單元,根據(jù)具有小于或等于最大編碼單元的大小的編碼單元來對(duì)圖像進(jìn)行編碼或解碼??苫诓淮笥谙鄳?yīng)編碼單元的數(shù)據(jù)單元來選擇編碼期間用于變換的變換單元的大小。例如,在視頻編碼設(shè)備100或200中,如果編碼單元710的大小是64X64,則可通過使用大小為32X32的變換單元720來執(zhí)行變換。此外,可通過對(duì)小于64X64的大小為32X32、16X 16、8X8和4X4的變換單元中的每一個(gè)執(zhí)行變換,來對(duì)大小為64X64的編碼單元710的數(shù)據(jù)進(jìn)行編碼,隨后可選擇具有最小編碼誤差的變換單元。圖8是用于描述根據(jù)示例性實(shí)施例的與編碼深度相應(yīng)的編碼單元的編碼信息的示圖。視頻編碼設(shè)備100的輸出單元130可對(duì)用于與編碼深度相應(yīng)的每個(gè)編碼單元的關(guān)于分區(qū)類型的信息800、關(guān)于預(yù)測(cè)模式的信息810和關(guān)于變換單元的大小的信息820進(jìn)行編碼和發(fā)送,作為關(guān)于編碼模式的信息。 信息800指示關(guān)于通過對(duì)當(dāng)前編碼單元的預(yù)測(cè)單元進(jìn)行劃分而獲得的分區(qū)的形狀的信息,其中,所述分區(qū)是用于對(duì)當(dāng)前編碼單元進(jìn)行預(yù)測(cè)編碼的數(shù)據(jù)單元。例如,大小為2NX2N的當(dāng)前編碼單元CU_0可被劃分為大小為2NX2N的分區(qū)802、大小為2NXN的分區(qū)804、大小為NX 2N的分區(qū)806和大小為NXN的分區(qū)808中的任意一個(gè)。這里,關(guān)于分區(qū)類型的信息800被設(shè)置為指示大小為2NXN的分區(qū)804、大小為NX2N的分區(qū)806和大小為NXN的分區(qū)808之一。
信息810指示每個(gè)分區(qū)的預(yù)測(cè)模式。例如,信息810可指示對(duì)由信息800指示的分區(qū)執(zhí)行的預(yù)測(cè)編碼的模式,即,幀內(nèi)模式812、幀間模式814或跳過模式816。信息820指示當(dāng)針對(duì)當(dāng)前編碼單元執(zhí)行變換時(shí)所基于的變換單元。例如,變換單元可以是第一幀內(nèi)變換單元822、第二幀內(nèi)變換單元824、第一幀間變換單元826或第二幀內(nèi)變換單元828。視頻解碼設(shè)備200的圖像數(shù)據(jù)和編碼信息提取器220可根據(jù)每個(gè)更深編碼單元提取和使用用于解碼的信息800、810和820。圖9是根據(jù)示例性實(shí)施例的根據(jù)深度的更深編碼單元的示圖。劃分信息可被用于指示深度的改變。劃分信息指示當(dāng)前深度的編碼單元是否被劃分為更低深度的編碼單元。用于對(duì)深度為O且大小為2N_0X2N_0的編碼單元900進(jìn)行預(yù)測(cè)編碼的預(yù)測(cè)單元910可包括以下分區(qū)類型的分區(qū):大小為2N_0X2N_0的分區(qū)類型912、大小為2N_0XN_0的分區(qū)類型914、大小為N_0X2N_0的分區(qū)類型916、大小為Ν_0ΧΝ_0的分區(qū)類型918。圖9僅示出通過對(duì)預(yù)測(cè)單元910進(jìn)行對(duì)稱劃分而獲得的分區(qū)類型910至918,但分區(qū)類型不限于此,預(yù)測(cè)單元910的分區(qū)可包括不對(duì)稱分區(qū)、具有預(yù)定形狀的分區(qū)和具有幾何形狀的分區(qū)。根據(jù)每個(gè)分區(qū)類型,對(duì)一個(gè)大小為2N_0X2N_0的分區(qū)、兩個(gè)大小為2N_0XN_0的分區(qū)、兩個(gè)大小為N_0X2N_0的分區(qū)和四個(gè)大小為Ν_0ΧΝ_0的分區(qū)重復(fù)執(zhí)行預(yù)測(cè)編碼。可對(duì)大小為2N_0 X 2N_0、N_0 X 2N_0、2N_0 X N_0和N_0 X N_0的分區(qū)執(zhí)行幀內(nèi)模式和幀間模式下的預(yù)測(cè)編碼??蓛H對(duì)大小為2N_0X2N_0的分區(qū)執(zhí)行跳過模式下的預(yù)測(cè)編碼。比較包括分區(qū)類型912至918中的預(yù)測(cè)編碼的編碼的誤差,在分區(qū)類型中確定最小編碼誤差。如果在分區(qū)類 型912至916之一中編碼誤差最小,則預(yù)測(cè)單元910可不被劃分到更低深度。如果在分區(qū)類型918中編碼誤差最小,則深度從O改變到I以在操作920對(duì)分區(qū)類型918進(jìn)行劃分,對(duì)深度為2且大小為Ν_0ΧΝ_0的編碼單元930重復(fù)執(zhí)行編碼,以搜索
最小編碼誤差。用于對(duì)深度為I且大小為2N_1 X 2N_1 ( = Ν_0ΧN_0)的編碼單元930進(jìn)行預(yù)測(cè)編碼的預(yù)測(cè)單元940可包括以下分區(qū)類型的分區(qū):大小為2N_1X2N_1的分區(qū)類型942、大小為2N_1XN_1的分區(qū)類型944、大小為N_1X2N_1的分區(qū)類型946、大小為N_1 XN_1的分區(qū)類型948。如果在分區(qū)類型948中編碼誤差最小,則深度從I改變到2以在操作950對(duì)分區(qū)類型948進(jìn)行劃分,對(duì)深度為2且大小為N_2XN_2的編碼單元960重復(fù)執(zhí)行編碼,以搜索
最小編碼誤差。當(dāng)最大深度為d時(shí),根據(jù)每個(gè)深度的劃分操作可被執(zhí)行,直到深度變?yōu)閐-Ι時(shí),并且劃分信息可被編碼直到深度為O到d-2中的一個(gè)。換句話說,當(dāng)編碼被執(zhí)行直到在操作970中與深度d-2相應(yīng)的編碼單元被劃分之后深度為d-Ι時(shí),用于對(duì)深度為d-Ι且大小為2N_(d-l) X2N_(d-l)的編碼單元980進(jìn)行預(yù)測(cè)編碼的預(yù)測(cè)單元990可包括以下分區(qū)類型的分區(qū):大小為2N_(d-l) X2N_(d-l)的分區(qū)類型992、大小為2N_(d_l) XN_(d_l)的分區(qū)類型994、大小為N_(d-1) X2N_(d-l)的分區(qū)類型996、大小為N_(d_l) XN_(d_l)的分區(qū)類型998。
可在分區(qū)類型992至998中對(duì)一個(gè)大小為2N_(d_l) X2N_(d_l)的分區(qū)、兩個(gè)大小為2N_(d-l) XN_(d-l)的分區(qū)、兩個(gè)大小為N_(d-1) X2N_(d-l)的分區(qū)、四個(gè)大小為N_(d-1) XN_(d-l)的分區(qū)重復(fù)執(zhí)行預(yù)測(cè)編碼,以搜索具有最小編碼誤差的分區(qū)類型。即使分區(qū)類型998具有最小編碼誤差,但由于最大深度為d,因此深度為d-Ι的編碼單元cu_(d-l)不再被劃分到更低深度,用于構(gòu)成當(dāng)前最大編碼單元900的編碼單元的編碼深度被確定為d-Ι,當(dāng)前最大編碼單元900的分區(qū)類型可被確定為N_(d-1) XN_(d-l)。此外,由于最大深度為d,并且具有最低深度d-Ι的最小編碼單元980不再被劃分到更低深度,因此不設(shè)置用于最小編碼單元980的劃分信息。數(shù)據(jù)單元999可以是針對(duì)當(dāng)前最大編碼單元的“最小單元”。根據(jù)示例性實(shí)施例的最小單元可以是通過對(duì)最小編碼單元980劃分4次而獲得的矩形數(shù)據(jù)單元。通過重復(fù)執(zhí)行編碼,視頻編碼設(shè)備100可通過比較根據(jù)編碼單元900的深度的編碼誤差來選擇具有最小編碼誤差的深度,以確定編碼深度,并將相應(yīng)的分區(qū)類型和預(yù)測(cè)模式設(shè)置為編碼深度的編碼模式。
這樣,在I至d的所有深度中比較根據(jù)深度的最小編碼誤差,具有最小編碼誤差的深度可被確定為編碼深度。編碼深度、預(yù)測(cè)單元的分區(qū)類型和預(yù)測(cè)模式可作為關(guān)于編碼模式的信息而被編碼和發(fā)送。此外,由于編碼單元從深度O被劃分到編碼深度,因此僅編碼深度的劃分信息被設(shè)置為0,除了編碼深度之外的深度的劃分信息被設(shè)置為I。視頻解碼設(shè)備200的圖像數(shù)據(jù)和編碼信息提取器220可提取并使用關(guān)于編碼單元900的編碼深度和預(yù)測(cè)單元的信息,以對(duì)分區(qū)912進(jìn)行解碼。視頻解碼設(shè)備200可通過使用根據(jù)深度的劃分信息來將劃分信息為O的深度確定為編碼深度,并使用關(guān)于相應(yīng)深度的編碼模式的信息以進(jìn)行解碼。圖10至圖12是用于描述根據(jù)示例性實(shí)施例的編碼單元1010、預(yù)測(cè)單元1060和變換單元1070之間的關(guān)系的示圖。編碼單元1010是最大編碼單元中與由視頻編碼設(shè)備100確定的編碼深度相應(yīng)的具有樹結(jié)構(gòu)的編碼單元。預(yù)測(cè)單元1060是編碼單元1010中的每一個(gè)的預(yù)測(cè)單元的分區(qū),變換單元1070是編碼單元1010中的每一個(gè)的變換單元。當(dāng)編碼單元1010中的最大編碼單元的深度是O時(shí),編碼單元1012和1054的深度是 1,編碼單元 1014、1016、1018、1028、1050 和 1052 的深度是 2,編碼單元 1020、1022、1024、1026、1030、1032和1048的深度是3,編碼單元1040、1042、1044和1046的深度是4。在預(yù)測(cè)單元1060中,通過對(duì)編碼單元1010中的編碼單元進(jìn)行劃分來獲得某些編碼單元 1014、1016、1022、1032、1048、1050、1052 和 1054。換句話說,編碼單元 1014、1022、1050和1054中的分區(qū)類型具有2NXN的大小,編碼單元1016、1048和1052中的分區(qū)類型具有NX2N的大小,編碼單元1032的分區(qū)類型具有NXN的大小。編碼單元1010的預(yù)測(cè)單元和分區(qū)小于或等于每個(gè)編碼單元。對(duì)小于編碼單元1052的數(shù)據(jù)單元中的變換單元1070中的編碼單元1052的圖像數(shù)據(jù)執(zhí)行變換或反變換。此外,變換單元1070中的編碼單元1014、1016、1022、1032、1048、1050和1052在大小和形狀方面與預(yù)測(cè)單元1060中的編碼單元1014、1016、1022、1032、1048,1050和1052不同。換句話說,視頻編碼設(shè)備100和視頻解碼設(shè)備200可對(duì)相同編碼單元中的數(shù)據(jù)單元分別執(zhí)行幀內(nèi)預(yù)測(cè)、運(yùn)動(dòng)估計(jì)、運(yùn)動(dòng)補(bǔ)償、變換和反變換。
因此,對(duì)最大編碼單元的每個(gè)區(qū)域中具有分層結(jié)構(gòu)的編碼單元中的每一個(gè)遞歸地執(zhí)行編碼,以確定最佳編碼單元,從而可獲得具有遞歸樹結(jié)構(gòu)的編碼單元。編碼信息可包括關(guān)于編碼單元的劃分信息、關(guān)于分區(qū)類型的信息、關(guān)于預(yù)測(cè)模式的信息和關(guān)于變換單元的大小的信息。表I示出可由視頻編碼設(shè)備100和視頻解碼設(shè)備200設(shè)置的編碼信息。表I
權(quán)利要求
1.一種對(duì)視頻進(jìn)行解碼的設(shè)備,所述設(shè)備包括: 接收器,接收并解析編碼視頻的比特流; 處理器,從比特流提取關(guān)于作為數(shù)據(jù)單元的編碼單元的最大大小的信息,以及關(guān)于針對(duì)圖像的編碼單元的編碼深度和編碼模式的編碼信息,其中,按數(shù)據(jù)單元對(duì)圖像進(jìn)行解碼; 解碼器,使用提取的關(guān)于編碼單元的最大大小的信息以及提取的關(guān)于編碼深度和編碼模式的編碼信息,確定樹結(jié)構(gòu)的編碼單元并基于確定的樹結(jié)構(gòu)的編碼單元對(duì)圖像進(jìn)行解碼, 其中,根據(jù)提取的關(guān)于編碼單元的最大大小的信息,圖像從多個(gè)最大編碼單元分層被劃分為根據(jù)深度的編碼深度的編碼單元, 其中,當(dāng)前深度的編碼單元是從更高深度的編碼單元?jiǎng)澐值木匦螖?shù)據(jù)單元之一, 其中,當(dāng)前深度的編碼單元獨(dú)立于鄰近編碼單元而被劃分為更低深度的編碼單元,直到相應(yīng)編碼深度的編碼單元, 其中,確定的樹結(jié)構(gòu)的編碼單元包括從最大編碼單元?jiǎng)澐值木幋a單元之中的編碼深度的編碼單元。
2.如權(quán)利要求1所述的設(shè)備,其中: 解碼器通過基于劃分信息確定編碼單元不再被劃分來確定樹結(jié)構(gòu)的編碼單元; 其中,劃分信息被包括在提取的關(guān)于編碼深度和編碼模式的編碼信息中,并指示每個(gè)編碼單元是否被劃分為更低深度的編碼單元。
3.如權(quán)利要求2所述的設(shè)備,其中,解碼器還基于針對(duì)確定的樹結(jié)構(gòu)的編碼單元的提取的關(guān)于編碼深度和編碼模式的編碼信息,在編碼深度的編碼單元之中確定當(dāng)前編碼單元的分區(qū)類型和預(yù)測(cè)模式,確定大小等于當(dāng)前編碼單元的大小的預(yù)測(cè)單元或者基于確定的分區(qū)類型對(duì)當(dāng)前編碼單元的高度和寬度中的至少一個(gè)進(jìn)行劃分的分區(qū),并基于確定的預(yù)測(cè)模式對(duì)確定的預(yù)測(cè)單元或確定的分區(qū)中的每個(gè)分區(qū)執(zhí)行幀內(nèi)預(yù)測(cè)或幀間預(yù)測(cè)。
4.如權(quán)利要求1所述的設(shè)備,其中,處理器從比特流提取關(guān)于最大編碼單元的高度和寬度的信息以及關(guān)于最大深度的信息,其中,最大編碼單元是具有編碼單元的最大大小的編碼單元,最大深度指示最大編碼單元被分層劃分的總次數(shù)。
全文摘要
本發(fā)明公開了一種對(duì)視頻進(jìn)行編碼的方法,所述方法包括將當(dāng)前畫面劃分為至少一個(gè)最大編碼單元;通過基于與最大編碼單元的區(qū)域被劃分的次數(shù)成比例地加深的深度對(duì)至少一個(gè)劃分區(qū)域進(jìn)行編碼,來確定用于輸出根據(jù)所述至少一個(gè)劃分區(qū)域的最終編碼結(jié)果的編碼深度,其中,通過根據(jù)深度對(duì)最大編碼單元的區(qū)域進(jìn)行劃分來獲得所述至少一個(gè)劃分區(qū)域;根據(jù)所述至少一個(gè)最大編碼單元,輸出構(gòu)成根據(jù)所述至少一個(gè)劃分區(qū)域的最終編碼結(jié)果的圖像數(shù)據(jù),以及關(guān)于編碼深度和預(yù)測(cè)模式的編碼信息。
文檔編號(hào)H04N7/26GK103220524SQ201310091738
公開日2013年7月24日 申請(qǐng)日期2010年8月13日 優(yōu)先權(quán)日2009年8月14日
發(fā)明者陳建樂, 千岷洙, 李再出, 閔正惠, 鄭海慶, 金壹求, 李相來, 李教爀 申請(qǐng)人:三星電子株式會(huì)社