視頻的編碼方法和裝置及視頻的解碼方法和裝置與流程

文檔序號：12294684閱讀：262來源：國知局

視頻的編碼方法和裝置及視頻的解碼方法和裝置本申請是向中國知識產(chǎn)權局提交的申請日為2012年1月6日的標題為“使用分層結構的數(shù)據(jù)單元的視頻的編碼方法和裝置及其解碼方法和裝置”的第201280012098.1號申請的分案申請。技術領域本發(fā)明涉及對視頻進行編碼和解碼，更具體地講，涉及對視頻編解碼器的符號進行編碼和解碼。

背景技術：
根據(jù)圖像壓縮方法(諸如MPEG-1、MPEG-2或MPEG-4H.264/MPEG-4先進視頻編碼(AVC))，圖像被劃分為具有預定尺寸的塊，然后，通過幀間預測或幀內(nèi)預測來獲得塊的殘差數(shù)據(jù)。通過變換、量化、掃描、游程長度編碼和熵編碼來壓縮殘差數(shù)據(jù)。在熵編碼中，語法元素(諸如離散余弦變換(DCT)系數(shù)或運動矢量)被熵編碼以輸出比特流。在解碼器端，從比特流提取語法元素，并基于提取的語法元素執(zhí)行解碼。

技術實現(xiàn)要素：
技術問題本發(fā)明提供一種用于通過使用分層結構信息，基于分層構造的數(shù)據(jù)單元從圖像編解碼器選擇上下文模型來對作為圖像信息的符號進行有效熵編碼和熵解碼的方法和裝置。技術方案根據(jù)本發(fā)明的一方面，通過基于分層結構信息和除分層結構信息以外與編碼相關的附加信息的組合選擇上下文模型來執(zhí)行熵編碼和熵解碼。有益效果根據(jù)本發(fā)明，可提高基于分層構造的數(shù)據(jù)單元的視頻的壓縮效率。附圖說明圖1是根據(jù)本發(fā)明的實施例的對視頻進行編碼的裝置的框圖；圖2是根據(jù)本發(fā)明的實施例的對視頻進行解碼的裝置的框圖；圖3是用于描述根據(jù)本發(fā)明的實施例的編碼單元的概念的示圖；圖4是根據(jù)本發(fā)明的實施例的基于具有分層結構的編碼單元的視頻編碼器的框圖；圖5是根據(jù)本發(fā)明的實施例的基于具有分層結構的編碼單元的視頻解碼器的框圖；圖6是示出根據(jù)本發(fā)明的實施例的根據(jù)深度的編碼單元和分區(qū)的示圖；圖7是用于描述根據(jù)本發(fā)明的實施例的編碼單元與變換單元之間的關系的示圖；圖8是用于描述根據(jù)本發(fā)明的實施例的根據(jù)深度的編碼信息的示圖；圖9是用于描述根據(jù)本發(fā)明的實施例的根據(jù)深度的編碼單元的示圖；圖10、圖11和圖12是用于描述根據(jù)本發(fā)明的實施例的編碼單元、預測單元和頻率變換單元之間的關系的示圖；圖13是用于根據(jù)表1的編碼模式信息描述編碼單元、預測單元和變換單元之間的關系的示圖；圖14是示出根據(jù)本發(fā)明的實施例的熵編碼裝置的結構的框圖；圖15示出根據(jù)本發(fā)明的實施例的分層構造的數(shù)據(jù)單元和分層構造的數(shù)據(jù)單元劃分信息。圖16和圖17是示出根據(jù)本發(fā)明的實施例的指示分層構造的數(shù)據(jù)單元的符號的參考示圖；圖18是用于描述根據(jù)本發(fā)明的實施例的變換系數(shù)的熵編碼的處理的參考示圖；圖19示出根據(jù)本發(fā)明的實施例的用于基于數(shù)據(jù)單元的尺寸確定上下文模型的上下文索引；圖20是示出根據(jù)本發(fā)明的實施例的上下文模型的參考示圖；圖21是根據(jù)本發(fā)明的實施例的MPS出現(xiàn)概率值的圖表；圖22示出根據(jù)本發(fā)明的另一實施例的用于基于數(shù)據(jù)單元的尺寸確定上下文模型的上下文索引；圖23和圖24是示出根據(jù)本發(fā)明的實施例的基于關于數(shù)據(jù)單元的位置的信息而設置的上下文索引映射表的參考示圖；圖25是示出根據(jù)本發(fā)明的實施例的基于分層信息和除分層信息以外的附加信息的組合來確定上下文索引的參考示圖；圖26是用于描述通過圖14的常規(guī)編碼器執(zhí)行的二進制算術編碼處理的示圖；圖27是根據(jù)本發(fā)明的實施例的使用分層構造的數(shù)據(jù)單元的視頻編碼方法的流程圖；圖28是示出根據(jù)本發(fā)明的實施例的熵解碼裝置的結構的框圖；圖29是根據(jù)本發(fā)明的另一實施例的使用分層構造的數(shù)據(jù)單元的視頻解碼方法的流程圖。最佳模式根據(jù)本發(fā)明的一方面，提供了一種視頻編碼方法，包括：基于分層構造的數(shù)據(jù)單元對形成視頻的畫面進行編碼；基于編碼的畫面的符號所屬的數(shù)據(jù)單元的分層信息來確定用于所述符號的熵編碼的上下文模型；以及使用確定的上下文模型對所述符號進行熵編碼。根據(jù)本發(fā)明的另一方面，提供了一種視頻編碼裝置，包括：分層編碼器，用于基于分層構造的數(shù)據(jù)單元對形成視頻的畫面進行編碼；以及熵編碼器，用于基于編碼的畫面的符號所屬的數(shù)據(jù)單元的分層信息來確定用于所述符號的熵編碼的上下文模型，并使用確定的上下文模型對所述符號進行編碼。根據(jù)本發(fā)明的另一方面，提供了一種視頻解碼方法，包括：通過對編碼的比特流進行解析，提取基于分層構造的數(shù)據(jù)單元而編碼的畫面的符號；基于所述符號所屬的數(shù)據(jù)單元的分層信息來確定用于所述符號的熵解碼的上下文模型；以及使用確定的上下文模型來對所述符號進行熵解碼。根據(jù)本發(fā)明的另一方面，提供了一種視頻解碼裝置，包括：符號提取單元，用于通過對編碼的比特流進行解析，提取基于分層構造的數(shù)據(jù)單元而編碼的畫面的符號；以及熵解碼器，用于基于所述符號所屬的數(shù)據(jù)單元的分層信息來確定用于所述符號的熵解碼的上下文模型，并使用確定的上下文模型來對所述符號進行熵解碼。具體實施方式在下文中，在本申請的各種實施例中描述的“圖像”可以是包含性的概念，不僅指靜止圖像，還指視頻圖像。當對與圖像相關的數(shù)據(jù)執(zhí)行各種操作時，與圖像相關的數(shù)據(jù)被劃分為數(shù)據(jù)組，并且可對包括在相同數(shù)據(jù)組中的數(shù)據(jù)執(zhí)行相同的操作。在本說明書中，根據(jù)預定標準形成的數(shù)據(jù)組被稱為“數(shù)據(jù)單元”。在下文中，對每個“數(shù)據(jù)單元”執(zhí)行的操作被理解為使用包括在數(shù)據(jù)單元中的數(shù)據(jù)來執(zhí)行。在下文中，將參照圖1至圖13描述根據(jù)本發(fā)明的實施例的用于對視頻進行編碼和解碼的方法和裝置，其中，在所述方法和裝置中，基于具有樹結構的變換單元和編碼單元對具有樹結構的符號進行編碼或解碼。此外，將參照圖14至圖29詳細描述在參照圖1至圖13描述的視頻的編碼和解碼中使用的熵編碼和熵解碼的方法。圖1是根據(jù)本發(fā)明的實施例的視頻編碼裝置100的框圖。視頻編碼裝置100包括分層編碼器110和熵編碼器120。分層編碼器110可以以預定數(shù)據(jù)單元為單位對將被編碼的當前畫面進行劃分，以對所述數(shù)據(jù)單元中的每一個執(zhí)行編碼。詳細地講，分層編碼器110可基于作為最大尺寸的編碼單元的最大編碼單元來對當前畫面進行劃分。根據(jù)本發(fā)明的實施例的最大編碼單元可以是具有32×32、64×64、128×128、256×256等尺寸的數(shù)據(jù)單元，其中，數(shù)據(jù)單元的形狀是寬和高為2的平方并且大于8的方形。根據(jù)本發(fā)明的實施例的編碼單元可由最大尺寸和深度來表征。深度表示編碼單元從最大編碼單元被空間劃分的次數(shù)，并且隨著深度加深，根據(jù)深度的編碼單元可從最大編碼單元被劃分為最小編碼單元。最大編碼單元的深度是最高深度，最小編碼單元的深度是最低深度。由于與每個深度相應的編碼單元的尺寸隨著最大編碼單元的深度加深而減小，因此，與更高深度相應的編碼單元可包括多個與更低深度相應的編碼單元。如上所述，當前畫面的圖像數(shù)據(jù)根據(jù)編碼單元的最大尺寸被劃分為最大編碼單元，所述最大編碼單元中的每一個可包括根據(jù)深度被劃分的編碼單元。由于根據(jù)本發(fā)明的實施例的最大編碼單元根據(jù)深度被劃分，因此包括在最大編碼單元中的空間域的圖像數(shù)據(jù)可根據(jù)深度被分層分類?？深A先確定編碼單元的最大深度和最大尺寸，所述最大深度和最大尺寸限定最大編碼單元的高和寬被分層劃分的總次數(shù)。分層編碼器120對通過根據(jù)深度劃分最大編碼單元的區(qū)域而獲得的至少一個劃分區(qū)域進行編碼，并確定用于輸出根據(jù)所述至少一個劃分區(qū)域的最終編碼的圖像數(shù)據(jù)的深度。換句話說，分層編碼器110通過根據(jù)當前畫面的最大編碼單元，按照根據(jù)深度的編碼單元對圖像數(shù)據(jù)進行編碼，并選擇具有最小編碼誤差的深度，來確定編碼深度。根據(jù)最大編碼單元的已編碼的圖像數(shù)據(jù)和確定的編碼深度被輸出到熵編碼器120。基于與等于或小于最大深度的至少一個深度相應的編碼單元對最大編碼單元中的圖像數(shù)據(jù)進行編碼，并基于根據(jù)深度的編碼單元中的每一個來比較對圖像數(shù)據(jù)進行編碼的結果。在比較根據(jù)深度的編碼單元的編碼誤差之后，可選擇具有最小編碼誤差的深度?？蔀槊總€最大編碼單元選擇至少一個編碼深度。隨著編碼單元根據(jù)深度被分層劃分，并隨著編碼單元的數(shù)量增加，最大編碼單元的尺寸被劃分。此外，即使在一個最大編碼單元中多個編碼單元相應于相同深度，也通過分別測量每個編碼單元的圖像數(shù)據(jù)的編碼誤差來確定是否將與相同深度相應的編碼單元中的每一個劃分至更低的深度。因此，即使當圖像數(shù)據(jù)被包括在一個最大編碼單元中時，圖像數(shù)據(jù)也根據(jù)深度被劃分到多個區(qū)域，并且在一個最大編碼單元中編碼誤差可根據(jù)區(qū)域而不同，因此，編碼深度可根據(jù)圖像數(shù)據(jù)中的區(qū)域而不同。因此，在一個最大編碼單元中可確定一個或多個編碼深度，并可根據(jù)至少一個編碼深度的編碼單元來劃分最大編碼單元的圖像數(shù)據(jù)。因此，分層編碼器110可確定包括在最大編碼單元中的具有樹結構的編碼單元。根據(jù)本發(fā)明的實施例的“具有樹結構的編碼單元”包括最大編碼單元中所包括的所有根據(jù)深度的編碼單元之中的與被確定為編碼深度的深度相應的編碼單元。在最大編碼單元的相同區(qū)域中，具有編碼深度的編碼單元可根據(jù)深度被分層地確定，并且在不同的區(qū)域中，具有編碼深度的編碼單元可被獨立地確定。類似地，當前區(qū)域中的編碼深度可獨立于另一區(qū)域中的編碼深度被確定。根據(jù)本發(fā)明的實施例的最大深度是與從最大編碼單元到最小編碼單元執(zhí)行劃分的次數(shù)相關的索引。根據(jù)本發(fā)明的實施例的第一最大深度可表示從最大編碼單元到最小編碼單元執(zhí)行劃分的總次數(shù)。根據(jù)本發(fā)明的實施例的第二最大深度可表示從最大編碼單元到最小編碼單元的深度級的總數(shù)。例如，當最大編碼單元的深度為0時，最大編碼單元被劃分一次的編碼單元的深度可被設置為1，最大編碼單元被劃分兩次的編碼單元的深度可被設置為2。這里，如果最小編碼單元是最大編碼單元被劃分四次的編碼單元，則存在深度0、1、2、3和4的5個深度級，因此，第一最大深度可被設置為4，第二最大深度可被設置為5?？筛鶕?jù)最大編碼單元執(zhí)行預測編碼和變換。還可根據(jù)最大編碼單元，基于根據(jù)等于最大深度的深度或小于最大深度的深度的編碼單元來執(zhí)行預測編碼和變換。由于每當最大編碼單元根據(jù)深度被劃分時根據(jù)深度的編碼單元的數(shù)量增加，因此對隨著深度加深而產(chǎn)生的所有根據(jù)深度的編碼單元執(zhí)行包括預測編碼和變換的編碼。為了便于描述，現(xiàn)在將基于最大編碼單元中的當前深度的編碼單元來描述預測編碼和變換。視頻編碼裝置100可不同地選擇用于對圖像數(shù)據(jù)進行編碼的數(shù)據(jù)單元的尺寸或形狀。為了對圖像數(shù)據(jù)進行編碼，執(zhí)行諸如預測編碼、變換和熵編碼的操作，此時，可針對所有操作使用相同的數(shù)據(jù)單元，或者可針對每個操作使用不同的數(shù)據(jù)單元。例如，視頻編碼裝置100不僅可選擇用于對圖像數(shù)據(jù)進行編碼的編碼單元，還可選擇與編碼單元不同的數(shù)據(jù)單元以對編碼單元中的圖像數(shù)據(jù)執(zhí)行預測編碼。為了在最大編碼單元中執(zhí)行預測編碼，可基于與編碼深度相應的編碼單元(即，基于不再被劃分為與更低深度相應的編碼單元的編碼單元)執(zhí)行預測編碼。在下文中，不再被劃分并且變成用于預測編碼的基本單元的編碼單元現(xiàn)在將被稱為“預測單元”。通過對預測單元進行劃分所獲得的分區(qū)(partition)可包括通過對預測單元的高和寬中的至少一個進行劃分而獲得的預測單元或數(shù)據(jù)單元。例如，當2N×2N(其中，N是正整數(shù))的編碼單元不再被劃分，并且變成2N×2N的預測單元時，分區(qū)的尺寸可以是2N×2N、2N×N、N×2N或N×N。分區(qū)類型的示例包括通過對預測單元的高或?qū)掃M行對稱劃分所獲得的對稱分區(qū)、通過對預測單元的高或?qū)掃M行不對稱劃分(諸如1:n或n:1)所獲得的分區(qū)、通過對預測單元進行幾何劃分所獲得的分區(qū)以及具有任意形狀的分區(qū)。預測單元的預測模式可以是幀內(nèi)模式、幀間模式和跳過模式中的至少一個。例如，可對2N×2N、2N×N、N×2N或N×N的分區(qū)執(zhí)行幀內(nèi)模式或幀間模式。此外，可僅對2N×2N的分區(qū)執(zhí)行跳過模式。對編碼單元中的一個預測單元獨立地執(zhí)行編碼，從而選擇具有最小編碼誤差的預測模式。視頻編碼裝置100還可不僅基于用于對圖像數(shù)據(jù)進行編碼的編碼單元，還基于不同于編碼單元的數(shù)據(jù)單元，來對編碼單元中的圖像數(shù)據(jù)執(zhí)行變換。為了在編碼單元中執(zhí)行變換，可基于具有小于或等于編碼單元的尺寸的數(shù)據(jù)單元來執(zhí)行變換。例如，用于變換的數(shù)據(jù)單元可包括用于幀內(nèi)模式的數(shù)據(jù)單元和用于幀間模式的數(shù)據(jù)單元。用作變換的基礎的數(shù)據(jù)單元現(xiàn)在將被稱為“變換單元”。與編碼單元類似，編碼單元中的變換單元可被遞歸地劃分為更小尺寸的區(qū)域，使得可以以區(qū)域為單位獨立地確定變換單元。因此，可根據(jù)具有根據(jù)變換深度的樹結構的變換單元來劃分編碼單元中的殘差數(shù)據(jù)。還可在變換單元中設置指示通過對編碼單元的高和寬進行劃分以達到變換單元而執(zhí)行劃分的次數(shù)的變換深度。例如，在2N×2N的當前編碼單元中，當變換單元的尺寸為2N×2N時，變換深度可以是0，當變換單元的尺寸是N×N時，變換深度可以是1，當變換單元的尺寸是N/2×N/2時，變換深度可以是2。也就是說，還可根據(jù)變換深度設置具有樹結構的變換單元。根據(jù)與編碼深度相應的編碼單元的編碼信息不僅需要關于編碼深度的信息，還需要與預測編碼和變換有關的信息。因此，分層編碼器110不僅確定具有最小編碼誤差的編碼深度，還確定預測單元中的分區(qū)類型、根據(jù)預測單元的預測模式和用于變換的變換單元的尺寸。稍后將參照圖3至圖12詳細描述根據(jù)本發(fā)明的實施例的最大編碼單元中的根據(jù)樹結構的編碼單元以及確定分區(qū)的方法。分層編碼器110可通過使用基于拉格朗日乘子的率失真優(yōu)化來測量根據(jù)深度的編碼單元的編碼誤差。熵編碼器120在比特流中輸出最大編碼單元的圖像數(shù)據(jù)以及關于根據(jù)編碼深度的編碼模式的信息，其中，所述圖像數(shù)據(jù)基于由分層編碼器110確定的至少一個編碼深度被編碼。編碼的圖像數(shù)據(jù)可以是圖像的殘差數(shù)據(jù)的編碼結果。關于根據(jù)編碼深度的編碼模式的信息可包括關于編碼深度的信息、關于預測單元中的分區(qū)類型的信息、預測模式信息和關于變換單元的尺寸的信息。具體地講，如稍后將描述的，當對最大編碼單元的圖像數(shù)據(jù)和與根據(jù)深度的編碼模式相關的符號進行編碼時，熵編碼器120可通過基于上述分層構造的數(shù)據(jù)單元的分層結構信息和關于除分層結構以外的在視頻編碼方法中使用的顏色分量的信息來選擇上下文模型，以執(zhí)行熵編碼?？赏ㄟ^使用根據(jù)深度的劃分信息來定義關于編碼深度的信息，其中，根據(jù)深度的劃分信息指示是否對更低深度而不是當前深度的編碼單元執(zhí)行編碼。如果當前編碼單元的當前深度是編碼深度，則當前編碼單元中的圖像數(shù)據(jù)被編碼并被輸出，因此劃分信息可被定義為不將當前編碼單元劃分至更低深度?？蛇x擇地，如果當前編碼單元的當前深度不是編碼深度，則對更低深度的編碼單元執(zhí)行編碼，因此劃分信息可被定義為劃分當前編碼單元以獲得更低深度的編碼單元。如果當前深度不是編碼深度，則對被劃分為更低深度的編碼單元的編碼單元執(zhí)行編碼。由于在當前深度的一個編碼單元中存在更低深度的至少一個編碼單元，因此對更低深度的每個編碼單元重復執(zhí)行編碼，因此，可針對具有相同深度的編碼單元遞歸地執(zhí)行編碼。由于針對一個最大編碼單元確定具有樹結構的編碼單元，并且針對編碼深度的編碼單元確定關于至少一個編碼模式的信息，因此，可針對一個最大編碼單元確定關于至少一個編碼模式的信息。此外，由于圖像數(shù)據(jù)根據(jù)深度被分層劃分，因此最大編碼單元的圖像數(shù)據(jù)的編碼深度可根據(jù)位置而不同，因此，可針對圖像數(shù)據(jù)設置關于編碼深度和編碼模式的信息。因此，熵編碼器120可將關于相應的編碼深度和編碼模式的編碼信息分配給包括在最大編碼單元中的編碼單元、預測單元和最小單元中的至少一個。根據(jù)本發(fā)明的實施例的最小單元是通過將組成最低深度的最小編碼單元劃分為4所獲得的方形數(shù)據(jù)單元?？蛇x擇地，最小單元可以是最大方形數(shù)據(jù)單元，其中，所述最大方形數(shù)據(jù)單元可包括在最大編碼單元中所包括的所有編碼單元、預測單元、分區(qū)單元和變換單元中。例如，通過熵編碼器120輸出的編碼信息可被分類為根據(jù)編碼單元的編碼信息和根據(jù)預測單元的編碼信息。根據(jù)編碼單元的編碼信息可包括關于預測模式的信息和關于分區(qū)的尺寸的信息。根據(jù)預測單元的編碼信息可包括關于幀間模式的估計方向的信息、關于幀間模式的參考圖像索引的信息、關于運動矢量的信息、關于幀內(nèi)模式的色度分量的信息和關于幀內(nèi)模式的插值方法的信息。此外，關于根據(jù)畫面、條帶或畫面組(GOP)定義的編碼單元的最大尺寸的信息以及關于最大深度的信息可被插入比特流的頭部。在視頻編碼裝置100中，根據(jù)深度的編碼單元可以是通過將作為上一層的更高深度的編碼單元的高或?qū)拕澐譃槎@得的編碼單元。換句話說，在當前深度的編碼單元的尺寸為2N×2N時，更低深度的編碼單元的尺寸是N×N。此外，具有2N×2N的尺寸的當前深度的編碼單元可包括最多四個更低深度的編碼單元。因此，視頻編碼裝置100可通過基于考慮當前畫面的特征所確定的最大編碼單元的尺寸和最大深度，針對每個最大編碼單元確定具有最佳形狀和最佳尺寸的編碼單元，來形成具有樹結構的編碼單元。此外，由于可通過使用各種預測模式和變換中的任意一個來對每個最大編碼單元執(zhí)行編碼，因此可考慮各種圖像尺寸的編碼單元的特征來確定最佳編碼模式。因此，如果以傳統(tǒng)的宏塊對具有高分辨率或大數(shù)據(jù)量的圖像進行編碼，則每個畫面的宏塊的數(shù)量過度增加。因此，針對每個宏塊產(chǎn)生的壓縮信息的條數(shù)增加，從而難以發(fā)送壓縮信息并且數(shù)據(jù)壓縮效率降低。然而，通過使用視頻編碼裝置100，由于在考慮圖像的特征的同時調(diào)整編碼單元，并在考慮圖像的尺寸的同時增加編碼單元的最大尺寸，因此可提高圖像壓縮效率。圖2是根據(jù)本發(fā)明的實施例的視頻解碼裝置200的框圖。視頻解碼裝置200包括符號提取單元210、熵解碼器220和分層解碼器230。用于視頻解碼裝置200的各種操作的各種術語(諸如編碼單元、深度、預測單元、變換單元和關于各種編碼模式的信息)的定義與參照圖1和視頻編碼裝置100描述的那些相同。符號提取單元210接收并解析已編碼的視頻的比特流。熵解碼器220從解析的比特流提取每個編碼單元的已編碼的圖像數(shù)據(jù)，并將提取的圖像數(shù)據(jù)輸出到分層解碼器230，其中，所述編碼單元具有根據(jù)每個最大編碼單元的樹結構。熵解碼器220可從當前畫面的頭提取關于當前畫面的編碼單元的最大尺寸的信息。此外，熵解碼器220從解析的比特流提取根據(jù)每個最大編碼單元的關于用于具有樹結構的編碼單元的編碼深度和編碼模式的信息。提取的關于編碼深度和編碼模式的信息被輸出到分層解碼器230。換句話說，比特流中的圖像數(shù)據(jù)被劃分為最大編碼單元，使得分層解碼器230可針對每個最大編碼單元對圖像數(shù)據(jù)進行解碼?？舍槍﹃P于與編碼深度相應的至少一個編碼單元的信息，設置根據(jù)最大編碼單元的關于編碼深度和編碼模式的信息，并且關于編碼模式的信息可包括關于與編碼深度相應的相應編碼單元的分區(qū)類型的信息、關于預測模式的信息和變換單元的尺寸。此外，根據(jù)深度的劃分信息可被提取作為關于編碼深度的信息。由熵解碼器220提取的根據(jù)每個最大編碼單元的關于編碼深度和編碼模式的信息是關于這樣的編碼深度和編碼模式的信息：所述編碼深度和編碼模式被確定用于當編碼器(諸如視頻編碼裝置100)根據(jù)每個最大編碼單元針對根據(jù)深度的每個編碼單元重復執(zhí)行編碼時產(chǎn)生最小編碼誤差。因此，視頻解碼裝置200可通過根據(jù)產(chǎn)生最小編碼誤差的編碼深度和編碼模式對圖像數(shù)據(jù)進行解碼來恢復圖像。由于關于編碼深度和編碼模式的編碼信息可被分配給相應編碼單元、預測單元和最小單元中的預定數(shù)據(jù)單元，因此熵解碼器器220可提取根據(jù)預定數(shù)據(jù)單元的關于編碼深度和編碼模式的信息。被分配有關于編碼深度和編碼模式的相同信息的預定數(shù)據(jù)單元可被推斷為是包括在相同最大編碼單元中的數(shù)據(jù)單元。此外，如稍后將描述的，當對最大編碼單元的圖像數(shù)據(jù)和與根據(jù)深度的編碼模式相關的符號進行解碼時，熵解碼器220可基于上述分層構造的數(shù)據(jù)單元的分層結構信息和關于各種信息(諸如除分層結構以外的顏色分量)的信息選擇上下文模型來執(zhí)行熵解碼。分層解碼器230通過基于根據(jù)最大編碼單元的關于編碼深度和編碼模式的信息對每個最大編碼單元中的圖像數(shù)據(jù)進行解碼，來恢復當前畫面。換句話說，分層解碼器230可基于提取的關于包括在每個最大編碼單元中的具有樹結構的編碼單元之中的每個編碼單元的分區(qū)類型、預測模式和變換單元的信息，來對已編碼的圖像數(shù)據(jù)進行解碼。解碼處理可包括預測(所述預測包括幀內(nèi)預測和運動補償)和逆變換。分層解碼器230可基于關于根據(jù)編碼深度的編碼單元的預測單元的分區(qū)類型和預測模式的信息，根據(jù)每個編碼單元的分區(qū)和預測模式執(zhí)行幀內(nèi)預測或運動補償。此外，分層解碼器230可基于關于根據(jù)編碼深度的編碼單元的變換單元的尺寸的信息，根據(jù)編碼單元中的每個變換單元執(zhí)行逆變換，從而根據(jù)最大編碼單元執(zhí)行逆變換。分層解碼器230可通過使用根據(jù)深度的劃分信息來確定當前最大編碼單元的至少一個編碼深度。如果劃分信息指示圖像數(shù)據(jù)在當前深度中不再被劃分，則當前深度是編碼深度。因此，分層解碼器230可通過使用關于預測單元的分區(qū)類型、預測模式和變換單元的尺寸的信息，針對當前最大編碼單元中的圖像數(shù)據(jù)對當前深度的編碼單元進行解碼。換句話說，可通過觀察為編碼單元、預測單元和最小單元之中的預定數(shù)據(jù)單元分配的編碼信息集來收集包含編碼信息(所述編碼信息包括相同的劃分信息)的數(shù)據(jù)單元，收集的數(shù)據(jù)單元可被視為是將由分層解碼器230以相同的編碼模式進行解碼的一個數(shù)據(jù)單元。視頻解碼裝置200可獲得關于當針對每個最大編碼單元遞歸執(zhí)行編碼時產(chǎn)生最小編碼誤差的至少一個編碼單元的信息，并可使用所述信息來對當前畫面進行解碼。換句話說，可對每個最大編碼單元中被確定為最佳編碼單元的具有樹結構的編碼單元的已編碼的圖像數(shù)據(jù)進行解碼。因此，即使圖像數(shù)據(jù)具有高分辨率和大數(shù)據(jù)量，也可通過使用編碼單元的尺寸和編碼模式來對圖像數(shù)據(jù)進行有效地解碼和恢復，其中，根據(jù)圖像數(shù)據(jù)的特征，通過使用從編碼器接收的關于最佳編碼模式的信息來自適應地確定所述編碼單元的尺寸和所述編碼模式?，F(xiàn)在將參照圖3至圖13描述根據(jù)本發(fā)明的實施例的確定具有樹結構的編碼單元、預測單元和變換單元的方法。圖3是用于描述根據(jù)本發(fā)明的實施例的編碼單元的概念的示圖。編碼單元的尺寸可以以為寬×高來表示，并且可以是64×64、32×32、16×16和8×8。64×64的編碼單元可被劃分為64×64、64×32、32×64或32×32的分區(qū)，32×32的編碼單元可被劃分為32×32、32×16、16×32或16×16的分區(qū)，16×16的編碼單元可被劃分為16×16、16×8、8×16或8×8的分區(qū)，8×8的編碼單元可被劃分為8×8、8×4、4×8或4×4的分區(qū)。在視頻數(shù)據(jù)310中，分辨率為1920×1080，編碼單元的最大尺寸為64且最大深度為2。在視頻數(shù)據(jù)320中，分辨率為1920×1080，編碼單元的最大尺寸為64且最大深度為3。在視頻數(shù)據(jù)330中，分辨率為352×288，編碼單元的最大尺寸為16且最大深度為1。圖3中示出的最大深度表示從最大編碼單元到最小編碼單元的劃分總次數(shù)。如果分辨率高或數(shù)據(jù)量大，則編碼單元的最大尺寸可以較大，從而不僅提高了編碼效率，還精確地反映出圖像的特征。因此，比視頻數(shù)據(jù)330具有更高的分辨率的視頻數(shù)據(jù)310和視頻數(shù)據(jù)320的編碼單元的最大尺寸可以是64。由于視頻數(shù)據(jù)310的最大深度是2，因此，由于通過對最大編碼單元劃分兩次，深度被加深到兩層，從而視頻數(shù)據(jù)310的編碼單元315可包括具有64的長軸尺寸的最大編碼單元以及具有32和16的長軸尺寸的編碼單元。同時，由于視頻數(shù)據(jù)330的最大深度是1，因此，由于通過對最大編碼單元劃分一次，深度被加深到一層，從而視頻數(shù)據(jù)330的編碼單元335可包括具有16的長軸尺寸的最大編碼單元以及具有8的長軸尺寸的編碼單元。由于視頻數(shù)據(jù)320的最大深度為3，因此，由于通過對最大編碼單元劃分三次，深度被加深到3層，從而視頻數(shù)據(jù)320的編碼單元325可包括具有64的長軸尺寸的最大編碼單元以及具有32、16和8的長軸尺寸的編碼單元。隨著深度加深，可精確地表示細節(jié)信息。圖4是根據(jù)本發(fā)明的實施例的基于具有分層結構的編碼單元的視頻編碼器400的框圖。幀內(nèi)預測器410針對當前幀405在幀內(nèi)模式下對編碼單元執(zhí)行幀內(nèi)預測，運動估計器420和運動補償器425在幀間模式下通過使用當前幀405和參考幀495，分別對編碼單元執(zhí)行幀間估計和運動補償。從幀內(nèi)預測器410、運動估計器420和運動補償器425輸出的數(shù)據(jù)通過變換器430和量化器440被輸出為量化的變換系數(shù)。量化的變換系數(shù)通過反量化器460和逆變換器470被恢復為空間域中的數(shù)據(jù)，恢復的空間域中的數(shù)據(jù)在通過去塊單元480和環(huán)路濾波單元490進行后處理之后被輸出為參考幀495。量化的變換系數(shù)可通過熵編碼器450被輸出為比特流455。當對最大編碼單元的圖像數(shù)據(jù)和與根據(jù)深度的編碼模式相關的符號進行編碼時，熵編碼器450可通過基于分層構造的數(shù)據(jù)單元的分層結構信息和除分層結構以外的各種信息(諸如顏色分量)選擇上下文模型來執(zhí)行熵解碼。為了將視頻編碼器400應用在視頻編碼裝置100中，視頻編碼器400的所有元件(即，幀內(nèi)預測器410、運動估計器420、運動補償器425、變換器430、量化器440、熵編碼器450、反量化器460、逆變換器470、去塊單元480和環(huán)路濾波單元490)在考慮每個最大編碼單元的最大深度的同時，基于具有樹結構的編碼單元之中的每個編碼單元來執(zhí)行操作。具體地，幀內(nèi)預測器410、運動估計器420和運動補償器425在考慮當前最大編碼單元的最大尺寸和最大深度的同時，確定具有樹結構的編碼單元之中的每個編碼單元的分區(qū)和預測模式，變換器430確定具有樹結構的編碼單元之中的每個編碼單元中的變換單元的尺寸。此外，根據(jù)本實施例的熵編碼器450可根據(jù)相應符號的類型，通過基于分層構造的數(shù)據(jù)單元的分層結構信息和除分層結構以外的各種信息(諸如顏色分量)選擇用于熵編碼的上下文模型來執(zhí)行熵編碼。圖5是根據(jù)本發(fā)明的實施例的基于編碼單元的視頻解碼器500的框圖。解析器510從比特流505中解析將被解碼的已編碼的圖像數(shù)據(jù)以及用于解碼所需的關于編碼的信息。已編碼的圖像數(shù)據(jù)通過熵解碼器520和反量化器530被輸出為反量化的數(shù)據(jù)，反量化的數(shù)據(jù)通過逆變換器540被恢復為空間域中的圖像數(shù)據(jù)。幀內(nèi)預測器550針對空間域中的圖像數(shù)據(jù)，在幀內(nèi)模式下對編碼單元執(zhí)行幀內(nèi)預測，運動補償器560通過使用參考幀585在幀間模式下對編碼單元執(zhí)行運動補償。經(jīng)過幀內(nèi)預測器550和運動補償器560的空間域中的圖像數(shù)據(jù)可在通過去塊單元570和環(huán)路濾波單元580進行后處理之后被輸出為恢復的幀595。此外，通過去塊單元570和環(huán)路濾波單元580進行后處理的圖像數(shù)據(jù)可被輸出為參考幀585。為了將視頻解碼器500應用在視頻解碼裝置200中，視頻解碼器500的所有元件(即，解析器510、熵解碼器520、反量化器530、逆變換器540、幀內(nèi)預測器550、運動補償器560、去塊單元570和環(huán)路濾波單元580)針對每個最大編碼單元基于具有樹結構的編碼單元執(zhí)行操作。具體地，幀內(nèi)預測器550和運動補償器560確定具有樹結構的每個編碼單元的分區(qū)和預測模式，逆變換器540不得不確定每個編碼單元的變換單元的尺寸。此外，根據(jù)本實施例的熵解碼器520可根據(jù)相應符號的類型，通過基于分層構造的數(shù)據(jù)單元的分層結構信息和除分層結構以外的各種信息(諸如顏色分量)，選擇用于對將被解碼的已編碼的圖像數(shù)據(jù)和指示解碼所需的關于編碼的信息的符號進行熵解碼的上下文模型，以執(zhí)行熵解碼。圖6是示出根據(jù)本發(fā)明的實施例的根據(jù)深度的編碼單元以及分區(qū)的示圖。視頻編碼裝置100和視頻解碼裝置200使用分層編碼單元以考慮圖像的特征。可根據(jù)圖像的特征自適應地確定編碼單元的最大高度、最大寬度和最大深度，或可由用戶不同地設置編碼單元的最大高度、最大寬度和最大深度?？筛鶕?jù)編碼單元的預定最大尺寸來確定根據(jù)深度的編碼單元的尺寸。在根據(jù)本發(fā)明的實施例的編碼單元的分層結構600中，編碼單元的最大高度和最大寬度均為64，并且最大深度為4。由于深度沿分層結構600的縱軸加深，因此根據(jù)深度的編碼單元的高和寬均被劃分。此外，沿分層結構600的橫軸示出作為用于根據(jù)深度的每個編碼單元的預測編碼的基礎的預測單元和分區(qū)。換句話說，編碼單元610是分層結構600中的最大編碼單元，其中，深度為0，尺寸(即，高乘寬)為64×64。深度沿縱軸加深，存在尺寸為32×32且深度為1的編碼單元620、尺寸為16×16且深度為2的編碼單元630、尺寸為8×8且深度為3的編碼單元640以及尺寸為4×4且深度為4的編碼單元650。尺寸為4×4且深度為4的編碼單元650是最小編碼單元。編碼單元的預測單元和分區(qū)根據(jù)每個深度沿橫軸排列。換句話說，如果尺寸為64×64且深度為0的編碼單元610是預測單元，則預測單元可被劃分為包括在編碼單元610中的分區(qū)，即，尺寸為64×64的分區(qū)610、尺寸為64×32的分區(qū)612、尺寸為32×64的分區(qū)614或尺寸為32×32的分區(qū)616。類似地，尺寸為32×32且深度為1的編碼單元620的預測單元可被劃分為包括在編碼單元620中的分區(qū)，即，尺寸為32×32的分區(qū)620、尺寸為32×16的分區(qū)622、尺寸為16×32的分區(qū)624和尺寸為16×16的分區(qū)626。類似地，尺寸為16×16且深度為2的編碼單元630的預測單元可被劃分為包括在編碼單元630中的分區(qū)，即，包括在編碼單元630中的尺寸為16×16的分區(qū)、尺寸為16×8的分區(qū)632、尺寸為8×16的分區(qū)634和尺寸為8×8的分區(qū)636。類似地，尺寸為8×8且深度為3的編碼單元640的預測單元可被劃分為包括在編碼單元640中的分區(qū)，即，包括在編碼單元640中的尺寸為8×8的分區(qū)、尺寸為8×4的分區(qū)642、尺寸為4×8的分區(qū)644和尺寸為4×4的分區(qū)646。尺寸為4×4且深度為4的編碼單元650是最小編碼單元和最低深度的編碼單元。編碼單元650的預測單元僅被分配給尺寸為4×4的分區(qū)。為了確定組成最大編碼單元610的編碼單元的至少一個編碼深度，視頻編碼裝置100的分層編碼器110針對包括在最大編碼單元610中的與每個深度相應的編碼單元執(zhí)行編碼。隨著深度加深，包括相同范圍和相同尺寸的數(shù)據(jù)的根據(jù)深度的編碼單元的數(shù)量增加。例如，需要四個與深度2相應的編碼單元來覆蓋包括在一個與深度1相應的編碼單元中的數(shù)據(jù)。因此，為了比較相同數(shù)據(jù)的根據(jù)深度的編碼結果，與深度1相應的編碼單元和四個與深度2相應的編碼單元均被編碼。為了針對多個深度中的當前深度執(zhí)行編碼，可通過沿分層結構600的橫軸，針對與當前深度相應的編碼單元中的每個預測單元執(zhí)行編碼，來針對當前深度選擇最小編碼誤差?？蛇x擇地，隨著深度沿分層結構600的縱軸加深，可通過針對每個深度比較根據(jù)深度的最小編碼誤差并執(zhí)行編碼，從而搜索最小編碼誤差。編碼單元610中具有最小編碼誤差的深度和分區(qū)可被選為編碼單元610的編碼深度和分區(qū)類型。圖7是用于描述根據(jù)本發(fā)明的實施例的編碼單元710和變換單元720之間的關系的示圖。視頻編碼裝置100或視頻解碼裝置200針對每個最大編碼單元，根據(jù)具有小于或等于最大編碼單元的尺寸的編碼單元來對圖像進行編碼或解碼。可基于不大于相應編碼單元的數(shù)據(jù)單元來選擇編碼期間用于變換的變換單元的尺寸。例如，在視頻編碼裝置100或視頻解碼裝置200中，如果編碼單元710的尺寸是64×64，則可通過使用尺寸為32×32的變換單元720來執(zhí)行變換。此外，可通過對小于64×64的尺寸為32×32、16×16、8×8和4×4的變換單元中的每一個執(zhí)行變換，來對尺寸為64×64的編碼單元710的數(shù)據(jù)進行編碼，然后可選擇具有最小編碼誤差的變換單元。圖8是用于描述根據(jù)本發(fā)明的實施例的與編碼深度相應的編碼單元的編碼信息的示圖。視頻編碼裝置100的輸出單元130可對用于與編碼深度相應的每個編碼單元的關于分區(qū)類型的信息800、關于預測模式的信息810和關于變換單元的尺寸的信息820進行編碼和發(fā)送，作為關于編碼模式的信息。信息800指示關于通過對當前編碼單元的預測單元進行劃分而獲得的分區(qū)的形狀的信息，其中，所述分區(qū)是用于對當前編碼單元進行預測編碼的數(shù)據(jù)單元。例如，尺寸為2N×2N的當前編碼單元CU_0可被劃分為尺寸為2N×2N的分區(qū)802、尺寸為2N×N的分區(qū)804、尺寸為N×2N的分區(qū)806和尺寸為N×N的分區(qū)808中的任意一個。這里，關于分區(qū)類型的信息800被設置為指示尺寸為2N×N的分區(qū)804、尺寸為N×2N的分區(qū)806和尺寸為N×N的分區(qū)808中的一個。信息810指示每個分區(qū)的預測模式。例如，信息810可指示對由信息800指示的分區(qū)執(zhí)行的預測編碼的模式，即，幀內(nèi)模式812、幀間模式814或跳過模式816。信息820指示當對當前編碼單元執(zhí)行變換時所基于的變換單元。例如，變換單元可以是第一幀內(nèi)變換單元822、第二幀內(nèi)變換單元824、第一幀間變換單元826或第二幀間變換單元828。視頻解碼裝置200的熵解碼器220可基于根據(jù)深度的每個編碼單元提取和使用用于解碼的信息800、810和820。圖9是根據(jù)本發(fā)明的實施例的根據(jù)深度的編碼單元的示圖。劃分信息可被用于指示深度的改變。劃分信息指示當前深度的編碼單元是否被劃分為更低深度的編碼單元。用于對深度為0且尺寸為2N_0×2N_0的編碼單元900進行預測編碼的預測單元910可包括以下分區(qū)類型的分區(qū)：尺寸為2N_0×2N_0的分區(qū)類型912、尺寸為2N_0×N_0的分區(qū)類型914、尺寸為N_0×2N_0的分區(qū)類型916、尺寸為N_0×N_0的分區(qū)類型918。圖9僅示出通過對預測單元910進行對稱劃分而獲得的分區(qū)類型912至918，但分區(qū)類型不限于此，預測單元910的分區(qū)可包括不對稱分區(qū)、具有預定形狀的分區(qū)和具有幾何形狀的分區(qū)。根據(jù)每個分區(qū)類型，對一個尺寸為2N_0×2N_0的分區(qū)、兩個尺寸為2N_0×N_0的分區(qū)、兩個尺寸為N_0×2N_0的分區(qū)和四個尺寸為N_0×N_0的分區(qū)重復執(zhí)行預測編碼?？蓪Τ叽鐬?N_0×2N_0、N_0×2N_0、2N_0×N_0和N_0×N_0的分區(qū)執(zhí)行幀內(nèi)模式和幀間模式下的預測編碼。僅對尺寸為2N_0×2N_0的分區(qū)執(zhí)行跳過模式下的預測編碼。如果在尺寸為2N_0×2N_0、2N_0×N_0和N_0×2N_0的分區(qū)類型912至916之一中編碼誤差最小，則預測單元910可不被劃分到更低深度。如果在尺寸為N_0×N_0的分區(qū)類型918中編碼誤差最小，則深度從0改變到1以在操作920對分區(qū)類型918進行劃分，并且對深度為2且尺寸為N_0×N_0的分區(qū)類型編碼單元重復執(zhí)行編碼，以搜索最小編碼誤差。用于對深度為1且尺寸為2N_1×2N_1(＝N_0×N_0)的(分區(qū)類型)編碼單元930進行預測編碼的預測單元940可包括以下分區(qū)類型的分區(qū)：尺寸為2N_1×2N_1的分區(qū)類型942、尺寸為2N_1×N_1的分區(qū)類型944、尺寸為N_1×2N_1的分區(qū)類型946和尺寸為N_1×N_1的分區(qū)類型948。如果在尺寸為N_1×N_1的分區(qū)類型948中編碼誤差最小，則深度從1改變到2以在操作950對分區(qū)類型948進行劃分，并且對深度為2且尺寸為N_2×N_2的編碼單元960重復執(zhí)行編碼，以搜索最小編碼誤差。當最大深度為d時，根據(jù)每個深度的劃分操作可被執(zhí)行，直到深度變?yōu)閐-1時，并且劃分信息可被編碼直到深度為0到d-2中的一個時。換句話說，當編碼被執(zhí)行直到在操作970中與深度d-2相應的編碼單元被劃分之后深度為d-1時，用于對深度為d-1且尺寸為2N_(d-1)×2N_(d-1)的編碼單元980進行預測編碼的預測單元990可包括以下分區(qū)類型的分區(qū)：尺寸為2N_(d-1)×2N_(d-1)的分區(qū)類型992、尺寸為2N_(d-1)×N_(d-1)的分區(qū)類型994、尺寸為N_(d-1)×2N_(d-1)的分區(qū)類型996和尺寸為N_(d-1)×N_(d-1)的分區(qū)類型998。可在分區(qū)類型992至998之中對一個尺寸為2N_(d-1)×2N_(d-1)的分區(qū)、兩個尺寸為2N_(d-1)×N_(d-1)的分區(qū)、兩個尺寸為N_(d-1)×2N_(d-1)的分區(qū)、四個尺寸為N_(d-1)×N_(d-1)的分區(qū)重復執(zhí)行預測編碼，以搜索具有最小編碼誤差的分區(qū)類型。即使在尺寸為N_(d-1)×N_(d-1)的分區(qū)類型998具有最小編碼誤差時，由于最大深度為d，因此深度為d-1的編碼單元CU_(d-1)不再被劃分到更低深度，組成當前最大編碼單元900的編碼單元的編碼深度被確定為d-1，并且當前最大編碼單元900的分區(qū)類型可被確定為N_(d-1)×N_(d-1)。此外，由于最大深度為d，因此不設置用于最小編碼單元980的劃分信息。數(shù)據(jù)單元999可以是針對當前最大編碼單元的“最小單元”。根據(jù)本發(fā)明的實施例的最小單元可以是通過將最小編碼單元980劃分為4而獲得的矩形數(shù)據(jù)單元。通過重復執(zhí)行編碼，視頻編碼裝置100可通過比較根據(jù)編碼單元900的深度的編碼誤差來選擇具有最小編碼誤差的深度，以確定編碼深度，并將相應的分區(qū)類型和預測模式設置為編碼深度的編碼模式。這樣，在1至d的所有深度中比較根據(jù)深度的最小編碼誤差，具有最小編碼誤差的深度可被確定為編碼深度。編碼深度、預測單元的分區(qū)類型和預測模式可作為關于編碼模式的信息而被編碼和發(fā)送。此外，由于編碼單元從深度0被劃分到編碼深度，因此僅編碼深度的劃分信息被設置為0，并且除了編碼深度之外的深度的劃分信息被設置為1。視頻解碼裝置200的熵解碼器220可提取并使用關于編碼單元900的編碼深度和預測單元的信息，以對編碼單元912進行解碼。視頻解碼裝置200可通過使用根據(jù)深度的劃分信息來將劃分信息為0的深度確定為編碼深度，并使用關于相應深度的編碼模式的信息以進行解碼。圖10至圖12是用于描述根據(jù)本發(fā)明的實施例的編碼單元1010、預測單元1060和變換單元1070之間的關系的示圖。編碼單元1010是最大編碼單元中與由視頻編碼裝置100確定的編碼深度相應的、具有樹結構的編碼單元。預測單元1060是編碼單元1010中的每一個的預測單元的分區(qū)，變換單元1070是編碼單元1010中的每一個的變換單元。當在編碼單元1010中最大編碼單元的深度是0時，編碼單元1012和1054的深度是1，編碼單元1014、1016、1018、1028、1050和1052的深度是2，編碼單元1020、1022、1024、1026、1030、1032和1048的深度是3，編碼單元1040、1042、1044和1046的深度是4。在預測單元1060中，通過對編碼單元進行劃分來獲得某些編碼單元1014、1016、1022、1032、1048、1050、1052和1054。換句話說，編碼單元1014、1022、1050和1054中的分區(qū)類型具有2N×N的尺寸，編碼單元1016、1048和1052中的分區(qū)類型具有N×2N的尺寸，編碼單元1032的分區(qū)類型具有N×N的尺寸。編碼單元1010的預測單元和分區(qū)小于或等于每個編碼單元。按照小于編碼單元1052的數(shù)據(jù)單元對變換單元1070中的編碼單元1052的圖像數(shù)據(jù)執(zhí)行變換或逆變換。此外，變換單元1070中的編碼單元1014、1016、1022、1032、1048、1050和1052在尺寸和形狀方面與預測單元1060中的編碼單元1014、1016、1022、1032、1048、1050和1052不同。換句話說，視頻編碼裝置100和視頻解碼裝置200可對相同編碼單元中的數(shù)據(jù)單元分別執(zhí)行幀內(nèi)預測、運動估計、運動補償、變換和逆變換。因此，對最大編碼單元的每個區(qū)域中具有分層結構的編碼單元中的每一個遞歸地執(zhí)行編碼，以確定最佳編碼單元，從而可獲得具有遞歸樹結構的編碼單元。編碼信息可包括關于編碼單元的劃分信息、關于分區(qū)類型的信息、關于預測模式的信息和關于變換單元的尺寸的信息。表1示出可由視頻編碼裝置100和視頻解碼裝置200設置的編碼信息。表1視頻編碼裝置100的熵編碼器120可輸出關于具有樹結構的編碼單元的編碼信息，視頻解碼裝置200的熵解碼器220可從接收的比特流提取關于具有樹結構的編碼單元的編碼信息。劃分信息指示當前編碼單元是否被劃分為更低深度的編碼單元。如果當前深度d的劃分信息為0，則當前編碼單元不再被劃分到更低深度的深度是編碼深度，因此可針對編碼深度定義關于分區(qū)類型、預測模式和變換單元的尺寸的信息。如果當前編碼單元根據(jù)劃分信息被進一步劃分，則對更低深度的四個劃分的編碼單元獨立地執(zhí)行編碼。預測模式可以是幀內(nèi)模式、幀間模式和跳過模式中的一個?？稍谒蟹謪^(qū)類型中定義幀內(nèi)模式和幀間模式，可僅在尺寸為2N×2N的分區(qū)類型中定義跳過模式。關于分區(qū)類型的信息可指示通過對預測單元的高或?qū)掃M行對稱劃分而獲得的尺寸為2N×2N、2N×N、N×2N和N×N的對稱分區(qū)類型，以及通過對預測單元的高或?qū)掃M行不對稱劃分而獲得的尺寸為2N×nU、2N×nD、nL×2N和nR×2N的不對稱分區(qū)類型。可通過按照1:n和n:1(其中，n是大于1的整數(shù))對預測單元的高進行劃分來分別獲得尺寸為2N×nU和2N×nD的不對稱分區(qū)類型，可通過按照1:n和n:1對預測單元的寬進行劃分來分別獲得尺寸為nL×2N和nR×2N的不對稱分區(qū)類型。變換單元的尺寸可被設置為幀內(nèi)模式下的兩種類型和幀間模式下的兩種類型。換句話說，如果變換單元的劃分信息是0，則變換單元的尺寸可以是2N×2N，這是當前編碼單元的尺寸。如果變換單元的劃分信息是1，則可通過對當前編碼單元進行劃分來獲得變換單元。此外，如果尺寸為2N×2N的當前編碼單元的分區(qū)類型是對稱分區(qū)類型，則變換單元的尺寸可以是N×N，如果當前編碼單元的分區(qū)類型是不對稱分區(qū)類型，則變換單元的尺寸可以是N/2×N/2。關于具有樹結構的編碼單元的編碼信息可包括與編碼深度相應的編碼單元、預測單元和最小單元中的至少一個。與編碼深度相應的編碼單元可包括：包括相同編碼信息的預測單元和最小單元中的至少一個。因此，通過比較鄰近數(shù)據(jù)單元的編碼信息來確定鄰近數(shù)據(jù)單元是否包括在與編碼深度相應的相同編碼單元中。此外，通過使用數(shù)據(jù)單元的編碼信息來確定與編碼深度相應的相應編碼單元，從而可確定最大編碼單元中的編碼深度的分布。因此，如果基于鄰近數(shù)據(jù)單元的編碼信息來預測當前編碼單元，則可直接參考和使用與當前編碼單元鄰近的根據(jù)深度的編碼單元中的數(shù)據(jù)單元的編碼信息?？蛇x擇地，如果基于鄰近數(shù)據(jù)單元的編碼信息來預測當前編碼單元，則使用數(shù)據(jù)單元的編碼信息來搜索與當前編碼單元鄰近的數(shù)據(jù)單元，可參考搜索到的鄰近編碼單元來預測當前編碼單元。圖13是根據(jù)的表1的編碼模式信息描述編碼單元、預測單元、和變換單元之間的關系的示圖。最大編碼單元1300包括多個編碼深度的編碼單元1302、1304、1306、1312、1314、1316和1318。這里，由于編碼單元1318是編碼深度的編碼單元，因此劃分信息可被設置為0。關于尺寸為2N×2N的編碼單元1318的分區(qū)類型的信息可被設置為以下分區(qū)類型之一：尺寸為2N×2N的分區(qū)類型1322、尺寸為2N×N的分區(qū)類型1324、尺寸為N×2N的分區(qū)類型1326、尺寸為N×N的分區(qū)類型1328、尺寸為2N×nU的分區(qū)類型1332、尺寸為2N×nD的分區(qū)類型1334、尺寸為nL×2N的分區(qū)類型1336和尺寸為nR×2N的分區(qū)類型1338。當分區(qū)類型被設置為對稱(即，分區(qū)類型1322、1324、1326或1328)時，如果變換單元的劃分信息(TU尺寸標記)為0，則設置尺寸為2N×2N的變換單元1342，如果TU尺寸標記為1，則設置尺寸為N×N的變換單元1344。當分區(qū)類型被設置為不對稱(即，分區(qū)類型1332、1334、1336或1338)時，如果TU尺寸標記為0，則設置尺寸為2N×2N的變換單元1352，如果TU尺寸標記為1，則設置尺寸為N/2×N/2的變換單元1354。TU尺寸標記是一種變換索引，與變換索引相應的變換單元的尺寸可根據(jù)預測單元類型或編碼單元的分區(qū)類型來修改。當分區(qū)類型被設置為對稱(即，分區(qū)類型1322、1324、1326或1328)時，如果變換單元的TU尺寸標記為0，則尺寸為2N×2N的變換單元1342被設置，如果TU尺寸標記為1，則尺寸為N×N的變換單元1344被設置。當分區(qū)類型被設置為不對稱(即，分區(qū)類型1332(2N×nU)、1334(2N×nD)、1336(nL×2N)或1338(nR×2N))時，如果TU尺寸標記為0，則尺寸為2N×2N的變換單元1352被設置，如果TU尺寸標記為1，則尺寸為N/2×N/2的變換單元1354被設置。參照圖13，上述TU尺寸標記是具有值0或1的標記，但TU尺寸標記不限于1比特，在TU尺寸標記從0增加的同時，變換單元可被分層劃分。變換單元劃分信息(TU尺寸標記)可用作變換索引的示例。在這種情況下，當以變換單元的最大尺寸和最小尺寸來使用根據(jù)實施例的TU尺寸標記時，實際使用的變換單元的尺寸可被表示。視頻編碼裝置100可對最大變換單元尺寸信息、最小變換單元尺寸信息和最大變換單元劃分信息進行編碼。編碼的最大變換單元尺寸信息、最小變換單元尺寸信息和最大變換單元劃分信息可被插入序列參數(shù)集(SPS)。視頻解碼裝置200可使用最大變換單元尺寸信息、最小變換單元尺寸信息和最大變換單元劃分信息以進行視頻解碼。例如，(a)如果當前編碼單元的尺寸是64×64并且最大變換單元是32×32，則(a-1)如果TU尺寸標記為0，則變換單元的尺寸是32×32；(a-2)如果TU尺寸標記為1，則變換單元的尺寸是16×16；(a-3)如果TU尺寸標記為2，則變換單元的尺寸是8×8?？蛇x擇地，(b)如果當前編碼單元的尺寸是32×32并且最小變換單元是32×32，則(b-1)如果TU尺寸標記為0，則變換單元的尺寸是32×32，并且由于變換單元的尺寸不能夠小于32×32，因此不可設置更多的TU尺寸標記?？蛇x擇地，(c)如果當前編碼單元的尺寸是64×64并且最大TU尺寸標記為1，則TU尺寸標記可以是0或1，不可設置其它TU尺寸標記。因此，當定義最大TU尺寸標記為“MaxTransformSizeIndex”，最小TU尺寸標記為“MinTransformSize”，并且在TU尺寸標記為0時的情況下的變換單元(即，基本變換單元RootTu)為“RootTuSize”時，可通過下面的等式(1)來定義在當前編碼單元中可用的最小變換單元的尺寸“CurrMinTuSize”：CurrMinTuSize＝max(MinTransformSize,RootTuSize/(2∧MaxTransformSizeIndex))……(1)與在當前編碼單元中可用的最小變換單元的尺寸“CurrMinTuSize”相比，當TU尺寸標記為0時作為變換單元的尺寸的基本變換單元尺寸“RootTuSize”可指示可關于系統(tǒng)選擇的最大變換單元。也就是說，根據(jù)等式(1)，“RootTuSize/(2∧MaxTransformSizeIndex)”是通過將作為當變換單元劃分信息為0時的變換單元的尺寸的“RootTuSize”劃分與最大變換單元劃分信息相應的劃分次數(shù)而獲得的變換單元的尺寸，并且“MinTransformSize”是最小變換單元的尺寸，因此，這些值中較小的值可以是作為在當前編碼單元中可用的最小變換單元的尺寸的“CurrMinTuSize”。根據(jù)本發(fā)明的實施例的基本變換單元的尺寸“RootTuSize”可根據(jù)預測模式而改變。例如，如果當前預測模式是幀間模式，則可根據(jù)以下的等式(2)來確定RootTuSize。在等式(2)中，“MaxTransformSize”是指最大變換單元尺寸，“PUSize”是指當前預測單元尺寸。RootTuSize＝min(MaxTransformSize,PUSize).........(2)換句話說，如果當前預測模式是幀間模式，則TU尺寸標記為0時作為變換單元的基本變換單元尺寸的尺寸“RootTuSize”可被設置為最大變換單元尺寸和當前預測單元尺寸之中的較小值。如果當前分區(qū)單元的預測模式是幀內(nèi)模式，則可根據(jù)以下的等式(3)來確定“RootTuSize”?！癙artitionSize”是指當前分區(qū)單元的尺寸。RootTuSize＝min(MaxTransformSize,PartitionSize)……(3)換句話說，如果當前預測模式是幀內(nèi)模式，則基本變換單元尺寸“RootTuSize”可被設置為最大變換單元尺寸和當前分區(qū)單元尺寸中較小的值。然而，應該注意，作為根據(jù)本發(fā)明的實施例的當前最大變換單元尺寸且根據(jù)分區(qū)單元的預測模式而改變的基本變換單元的尺寸“RootTuSize”是示例，用于確定當前最大變換單元尺寸的因素不限于此。在下文中，將詳細描述在圖1的視頻編碼裝置100的熵編碼器120中執(zhí)行的符號的熵編碼操作以及在圖2的視頻解碼裝置200的熵解碼器220中執(zhí)行的符號的熵解碼操作。如上所述，視頻編碼裝置100和視頻解碼裝置200通過將最大編碼單元劃分為小于或等于最大編碼單元的編碼單元來執(zhí)行編碼和解碼?？苫谂c其它數(shù)據(jù)單元獨立的成本來確定在預測和變換中使用的預測單元和變換單元。由于可通過對包括在最大編碼單元中的具有分層結構的每個編碼單元進行遞歸編碼來確定最佳編碼單元，因此具有樹結構的數(shù)據(jù)單元可被配置。換句話說，對于每個最大編碼單元，具有樹結構的編碼單元以及均具有樹結構的預測單元和變換單元可被配置。對于解碼，作為指示具有分層結構的數(shù)據(jù)單元的結構信息的信息的分層信息以及除分層信息以外的用于解碼的非分層信息需要被發(fā)送。與分層結構相關的信息是如以上參照圖10至圖12所描述的用于確定具有樹結構的編碼單元、具有樹結構的預測單元和具有樹結構的變換單元所需的信息，并且包括最大編碼單元的尺寸、編碼深度、預測單元的分區(qū)信息、指示編碼單元是否被劃分的劃分標記、關于變換單元的尺寸的信息和指示變換單元是否被劃分的變換單元劃分標記“TU尺寸標記”。除分層結構信息以外的編碼信息的示例包括應用于每個預測單元的幀內(nèi)/幀間預測的預測模式信息、運動矢量信息、預測方向信息、在多個顏色分量被使用時的情況下應用于每個數(shù)據(jù)單元的顏色分量信息、以及諸如變換系數(shù)的紋理信息。圖14是示出根據(jù)本發(fā)明的實施例的熵編碼裝置1400的結構的框圖。圖14的熵編碼裝置1400與圖1的視頻編碼裝置100的熵編碼器120對應。熵編碼裝置1400執(zhí)行符號的熵編碼，其中，所述符號指示與作為編碼目標的分層結構相關的信息以及除分層結構信息以外的編碼信息。參照圖14，根據(jù)本實施例的熵編碼裝置1400包括上下文建模單元1410、概率估計器1420和常規(guī)編碼器1430。上下文建模單元1410基于編碼的畫面的符號所屬的數(shù)據(jù)單元的分層信息來確定用于對符號進行熵編碼的上下文模型。詳細地講，假設與當前編碼的目標符號所屬的分層構造的數(shù)據(jù)單元相關的分層信息具有I個狀態(tài)值(其中，I是正整數(shù))，上下文建模單元1410可根據(jù)分層信息的狀態(tài)值設置I個或更少數(shù)量的上下文模型，并可通過根據(jù)分層信息的狀態(tài)值分配指示所述I個或更少數(shù)量的上下文模型中的一個的上下文索引，以確定將被用于對當前符號進行編碼的上下文模型。例如，當前編碼的目標符號所屬的數(shù)據(jù)單元的尺寸具有總共五個狀態(tài)值2×2、4×4、8×8、16×16、32×32和64×64。假設以上數(shù)據(jù)單元尺寸被用作分層信息，上下文建模單元1410可根據(jù)數(shù)據(jù)單元尺寸設置五個或更少數(shù)量的上下文模型，并可基于當前符號所屬的數(shù)據(jù)單元的尺寸來確定并輸出指示將被用于對當前符號進行熵編碼的上下文模型的上下文索引。除了上述絕對數(shù)據(jù)單元尺寸信息以外，可使用指示符號所屬的數(shù)據(jù)單元相對于更高數(shù)據(jù)單元的相對尺寸的相對分層信息。例如，在當前數(shù)據(jù)單元是具有N×N尺寸的數(shù)據(jù)單元時，可通過指示具有2N×2N的尺寸的更高數(shù)據(jù)單元是否被劃分的劃分標記來確定當前符號所屬的數(shù)據(jù)單元的尺寸，其中，從所述具有2N×2N尺寸的數(shù)據(jù)單元劃分出所述具有N×N尺寸的數(shù)據(jù)單元。因此，上下文建模單元1410可通過指示關于更高數(shù)據(jù)單元的尺寸的信息以及更高數(shù)據(jù)單元是否被劃分的劃分標記來確定當前符號所屬的數(shù)據(jù)單元的尺寸，并隨后基于關于確定的數(shù)據(jù)單元尺寸的信息來確定適合于當前符號的上下文模型。此外，指示當前符號所屬的數(shù)據(jù)單元的尺寸與更高數(shù)據(jù)單元的尺寸的比率的信息可被用作分層信息。例如，在當前數(shù)據(jù)單元具有按照具有2N×2N尺寸的更高數(shù)據(jù)單元的1/2比率的尺寸時，可從上述比率信息確定作為當前符號所屬的數(shù)據(jù)單元的尺寸的N×N尺寸。因此，上下文建模單元1410可使用指示當前符號所屬的數(shù)據(jù)單元相對于更高數(shù)據(jù)單元的相對尺寸的相對分層信息來確定當前符號所屬的數(shù)據(jù)單元的尺寸作為分層信息，并隨后基于確定的數(shù)據(jù)單元尺寸來確定上下文模型。此外，上下文建模單元1410可根據(jù)經(jīng)歷熵編碼的目標符號的類型，基于分層信息和除分層信息以外的附加信息的組合來確定用于對目標符號進行熵編碼的上下文模型。詳細地講，假設與當前編碼的目標符號所屬的分層構造的數(shù)據(jù)單元相關的分層信息具有I個狀態(tài)值，除分層信息以外的其它非分層信息具有J個狀態(tài)值，其中，J是正整數(shù)，則分層信息和非分層信息的可用情況的數(shù)量總共是I×J。上下文建模單元1410可根據(jù)I×J個狀態(tài)值的組合來設置I×J或更少數(shù)量的上下文模型，并通過根據(jù)當前符號所屬的數(shù)據(jù)單元的分層信息和非分層信息的狀態(tài)值來分配指示所述I×J或更少數(shù)量的上下文模型中的一個的上下文索引，以確定將用于對當前符號進行編碼的上下文模型。例如，假設關于具有總共五個狀態(tài)值2×2、4×4、8×8、16×16、32×32和64×64的符號所屬的數(shù)據(jù)單元的尺寸的信息被用作分層信息并且具有亮度分量和色度分量的兩個狀態(tài)值的符號所屬的數(shù)據(jù)單元的顏色分量信息被用作非分層信息的情況。在這種情況下，總共5×2(即，10)個組合可作為分層信息和非分層信息的狀態(tài)值。上下文建模單元1410設置與所述十個狀態(tài)值組合相應的十個或更少數(shù)量的上下文模型，并且確定并輸出根據(jù)與當前符號相關的狀態(tài)值確定的上下文索引。不限于上述示例，上下文建模單元1410可通過根據(jù)編碼的符號的類型按照各種方式組合分層信息和非分層信息來選擇多個上下文模型中的一個。換句話說，n條分層信息和非分層信息(其中，n是整數(shù))被用于確定上下文模型。假設所述n條分層信息和非分層信息均具有Si個狀態(tài)值(其中，Si是整數(shù)并且i是從1到n的整數(shù))，則上下文建模單元1410可基于與當前編碼的符號相關的狀態(tài)值，確定并輸出指示與S1×S2×...×Sn個狀態(tài)值組合相應的多個上下文模型中的一個的上下文索引。所述S1×S2×...×Sn個狀態(tài)值組合被分組，因此可使用S1×S2×...×Sn或更少數(shù)量的上下文模型。返回參照圖14，概率估計器1420使用從上下文建模單元1410輸出的上下文索引信息，確定并輸出關于二進制信號0和1之中的與最可能符號(MPS)和最不可能符號(LPS)相應的二進制信號的信息以及關于MPS或LPS的概率值信息?？赏ㄟ^從預設查找表讀取由上下文索引指示的概率值來確定MPS或LPS的概率值。此外，可基于二進制信號的出現(xiàn)統(tǒng)計累積值來更新MPS和LPS的概率值。常規(guī)編碼器1430基于與MPS或LPS相應的概率值信息和二進制信號信息來對當前符號進行熵編碼和輸出。除了基于MPS和LPS的概率值對符號進行編碼的上下文自適應二進制算數(shù)編碼(CABAC)方法以外，熵編碼裝置1400可通過根據(jù)分層信息和非分層信息的組合分配預設碼字的可變長編碼方法對每個符號進行編碼。以下描述使用基于分層信息的上下文建模執(zhí)行符號的熵編碼的處理。詳細地講，描述執(zhí)行與變換系數(shù)相關的符號、具有變換單元的分層結構的符號和具有分層結構的編碼單元的符號的熵編碼的處理。圖15示出根據(jù)本發(fā)明的實施例的分層構造的數(shù)據(jù)單元和分層構造的數(shù)據(jù)單元劃分信息。在以下描述中，假設數(shù)據(jù)單元是變換單元。如上所述，根據(jù)本實施例，使用具有分層結構的編碼單元、預測單元和變換單元來執(zhí)行編碼。在圖15中，具有作為最高層級的層級0的N×N的尺寸的變換單元1500被劃分為作為比所述最高層級低一層級的較低層級的層級1的變換單元31a、31b、31c、和31d。層級1的某些變換單元31a和31d均被劃分為作為低一層級的較低層級的層級2的變換單元32a、32b、32c、32d、32e、32f、32g和32h。指示每個變換單元是否被劃分為低一層級的較低層級的變換單元的變換單元劃分標記“TU尺寸標記”可被用作用于指示變換單元的分層結構的符號。例如，在當前變換單元的TU尺寸標記是1時，可示出當前變換單元被劃分為更低層級的變換單元。在當前變換單元的TU尺寸標記是0時，可示出當前變換單元不再被劃分。當從層級0的變換單元劃分的變換單元31a、31b、31c、31d、32a、32b、32c、32d、32e、32f、32g和32h形成分層結構時，每個變換單元的變換單元劃分信息可形成分層結構。換句話說，具有分層結構的變換單元劃分信息33包括最高層級0的變換單元劃分信息34、層級1的變換單元劃分信息35a、35b、35c和35d、以及層級2的變換單元劃分信息36a、36b、36c、36d、36e、36f、36g、36h。在具有分層結構的變換單元劃分信息33中，層級0的變換單元劃分信息34可表示最高層級0的變換單元被劃分。按照相似的方式，層級1的變換單元劃分信息35a和35d可表示層級1的變換單元31a和31d被劃分為層級2的變換單元32a、32b、32c、32d、32e、32f、32g和32h。層級1的某些變換單元31b和31c不再被劃分并且與樹結構中不具有子節(jié)點的葉節(jié)點相應。類似地，層級2的變換單元32a、32b、32c、32d、32e、32f、32g和32h與不再被劃分為更低層級的變換單元的葉節(jié)點相應。這樣，指示更高層級的變換單元是否被劃分為更低層級的變換單元的TU尺寸標記可被用作指示變換單元的分層結構的符號。當指示變換單元的分層結構的TU尺寸標記被熵編碼時，根據(jù)本實施例的視頻編碼裝置100可對所有節(jié)點的TU尺寸標記進行編碼，或者僅對不具有子節(jié)點的葉節(jié)點的TU尺寸標記進行編碼。圖16和圖17是示出根據(jù)本發(fā)明的實施例的指示分層構造的數(shù)據(jù)單元的符號的參考示圖。在圖16和圖17中，標記被假設為在圖15的變換單元劃分信息33的樹結構中指示每個節(jié)點的變換單元是否被劃分為更低層級的變換單元的TU尺寸標記。參照圖16，根據(jù)作為指示變換單元的分層結構的符號的本實施例的視頻編碼裝置100可針對所有層級的變換單元30、31a、31b、31c、31d、32a、32b、32c、32d、32e、32f、32g和32h執(zhí)行所有變換單元劃分標記信息flag0、flag1a、flag1b、flag1c、flag1d、flag2a、flag2b、flag2c、flag2d、flag2e、flag2f、flag2g和flag2h的熵編碼，作為指示變換單元的分層結構的符號。此外，如圖17中所示，視頻編碼裝置100可僅對與不具有子節(jié)點的葉節(jié)點相應的變換單元的變換單元劃分標記信息flag1b、flag1c、flag2a、flag2b、flag2c、flag2d、flag2e、flag2f、flag2g和flag2h進行熵編碼。這是因為可根據(jù)較低層級的變換單元劃分標記信息的存在來確定是否對較高層級的變換單元進行劃分。例如，在圖17中，當存在層級2的變換單元36a、36b、36c和36d的變換單元劃分標記flag2a、flag2b、flag2c和flag2d時，作為層級2的變換單元36a、36b、36c和36d的更高層級的層級1的變換單元35a必須被劃分為作為較低層級的層級2的變換單元，使得層級1的變換單元35a的變換單元劃分標記信息flag1a不需要被單獨編碼。根據(jù)本實施例的視頻解碼裝置200可根據(jù)符號分層解碼模式，針對所有層級的變換單元30、31a、31b、31c、31d、32a、32b、32c、32d、32e、32f、32g和32h提取并讀取所有變換單元劃分標記flag0、flag1a、flag1b、flag1c、flag1d、flag2a、flag2b、flag2c、flag2d、flag2e、flag2f、flag2g和flag2h，從而確定變換單元的分層結構。此外，當僅針對與葉節(jié)點相應的變換單元31b、31c、32a、32b、32c、32d、32e、32f、32g和32h的變換單元劃分標記flag1b、flag1c、flag2a、flag2b、flag2c、flag2d、flag2e、flag2f、flag2g和flag2h被編碼時，根據(jù)本實施例的視頻解碼裝置200基于提取的變換單元劃分標記flag1b、flag1c、flag2a、flag2b、flag2c、flag2d、flag2e、flag2f、flag2g和flag2h確定其它變換單元劃分標記flag0、flag1a、flag1b、flag1c和flag1d，從而確定變換單元的分層結構。如上所述，上下文建模單元1410可基于根據(jù)分層信息或分層信息和非分層信息的組合的狀態(tài)值來確定多個上下文模型中的一個以對指示變換單元的分層結構的變換單元劃分標記進行熵編碼。具體地講，上下文建模單元1410可基于將被編碼的當前變換單元劃分標記所屬的變換單元的分層信息來確定用于當前變換單元劃分標記的熵編碼的上下文模型。圖19示出根據(jù)本發(fā)明的實施例的用于基于數(shù)據(jù)單元的尺寸來確定上下文模型的上下文索引的示例。參照圖19，上下文建模單元1410可通過基于當前變換單元標記所屬的變換單元的尺寸的信息分配指示多個預設上下文模型的上下文索引中的一個來確定用于對當前變換單元標記進行熵編碼的上下文模型。例如，在當前變換單元標記所屬的變換單元的尺寸是16×16時，具有上下文索引值6的上下文模型被選擇。圖20是示出根據(jù)本發(fā)明的實施例的上下文模型的參考示圖。如上所述，概率估計器1420使用從上文建模單元1410輸出的上下文索引信息，確定并輸出關于二進制信號“0”和“1”中的與MPS和LPS相應的二進制信號的信息以及關于MPS或LPS的概率值的信息。參照圖20，概率估計器1420以查找表的形式包括多個二進制信號的出現(xiàn)概率，并且根據(jù)當前編碼的符號和周圍狀況改變二進制信號的出現(xiàn)概率并將確定的概率值信息輸出到常規(guī)編碼器1430。具體地講，當從上下文建模單元1410接收指示將被應用于當前符號的上下文模型的上下文索引IndexNO.(索引NO.)時，概率估計器1420可確定與相應的上下文索引IndexNO.相應的出現(xiàn)概率表的索引pStateIdx和與MPS相應的二進制信號。圖21是根據(jù)本發(fā)明的實施例的MPS出現(xiàn)概率值的圖表。出現(xiàn)概率值指示MPS的概率值。當出現(xiàn)概率表的索引pStateIdx被分配時，相應的MPS的概率值被確定。例如，當上下文建模單元1410確定用于當前符號的編碼的上下文模型的索引的值為1并輸出確定的值時，概率估計器1420確定與圖20中的上下文模型的上下文索引1相應的pStateIdx值7和MPS值0。此外，概率估計器1420確定根據(jù)pStateIdx值預設的MPS的概率值之中的與pStateIdx＝7相應的MPS的概率值。由于MPS和LPS的概率值之和為1，因此如果MPS和LPS中的一個的概率值已知，則其余二進制信號的概率值可被確定。每當單個bin被常規(guī)編碼器1430編碼時，概率估計器1420可通過根據(jù)MPS或LPS是否被編碼更新pStateIdx值，以更新考慮二進制信號的出現(xiàn)的統(tǒng)計的MPS和LPS的概率值。例如，考慮常規(guī)編碼器1430進行編碼的結果的概率估計器1420可以以預定查找表的形式，在MPS被編碼時在進行更新之后設置作為pStateIdx的值的transIdxMPS，并且可在LPS被編碼時在進行更新之后設置作為pStateIdx的值的tranIdxLPS。然后，概率估計器1420可通過針對每次編碼更新pStateIdx值來改變MPS的概率值。常規(guī)編碼器1430基于關于概率值的信息和關于與MPS或LPS相應的二進制信號的信息來執(zhí)行熵編碼并輸出與當前符號相應的二進制信號。圖26是用于描述由圖14的常規(guī)編碼器1430執(zhí)行的二進制算數(shù)編碼處理的示圖。在圖26中，假設指示變換單元的分層結構的TU尺寸標記是二進制值“010”并且1的出現(xiàn)概率和0的出現(xiàn)概率分別是0.2和0.8。這里，基于當前TU尺寸標記所屬的變換單元的分層信息(例如，關于變換單元的尺寸的信息)來確定1和0的出現(xiàn)概率。參照圖26，當二進制值“010”的初始bin值“0”被編碼時，作為初始區(qū)段[0.0～1.0]的較低80％的部分的區(qū)段[0.0～0.8]被更新為新的區(qū)段。接下來，當下一個bin值“1”被編碼時，作為區(qū)段[0.0～0.8]的較高20％的部分的區(qū)段[0.64～0.8]被更新為新的區(qū)段。當下一個“0”被編碼時，作為區(qū)段[0.64～0.8]的較低80％的部分的區(qū)段[0.64～0.768]被更新為新的區(qū)段。在與屬于最終的區(qū)段[0.64-0.768]的真實數(shù)值“0.75”對應的二進制數(shù)“0.11”中，作為0.11的小數(shù)部分的“11”被輸出作為與TU尺寸標記的二進制值“010”相應的比特流。當基于關于變換單元的尺寸的信息的用于TU尺寸標記的熵編碼的上下文模型被確定時，如圖22中所示，上下文建模單元1410可對變換單元的尺寸進行分組，并設置上下文索引以確定上下文模型。上下文建模單元1410可使用指示符號所屬的數(shù)據(jù)單元相對于更高變換單元的相對尺寸的相對分層信息而不是絕對變換單元尺寸信息。例如，當前變換單元是具有相對于具有2N×2N的尺寸的更高變換單元的1/2的比率的尺寸的變換單元，上下文建模單元1410可從比率信息確定當前TU尺寸標記所屬的變換單元具有N×N的尺寸，并基于確定的變換單元的尺寸來確定上下文模型。上下文建模單元1410可根據(jù)將被熵編碼的目標符號的類型，基于分層信息和除分層信息以外的附加信息的組合來確定用于TU尺寸標記的熵編碼的上下文模型。圖25是示出根據(jù)本發(fā)明的實施例的基于分層信息和除分層信息以外的附加信息的組合確定上下文索引的參考示圖。參照圖25，上下文建模單元1410根據(jù)具有I個狀態(tài)值的第一信息條p1至pI(其中，I是整數(shù))以及具有J個狀態(tài)值的第二信息條q1至qJ(其中，J是整數(shù))的組合來設置指示多個上下文模型中的一個的上下文索引，并根據(jù)與當前編碼的符號相關的第一信息和第二信息來確定并輸出上下文索引。例如，當關于總共具有五個狀態(tài)值2×2、4×4、8×8、16×16、32×32和64×64的符號所屬的數(shù)據(jù)單元的尺寸的信息被用作第一信息，并且具有亮度分量和色度分量的兩個狀態(tài)值的顏色分量信息被用作非分層信息時，十個組合可用，并且上下文建模單元1410設置與所述十個狀態(tài)值組合相應的十個或更少數(shù)量的上下文模型，并且確定并輸出根據(jù)與當前符號相關的狀態(tài)值確定的上下文索引。此外，上下文建模單元1410可如圖22中對狀態(tài)值進行分組以根據(jù)分組的狀態(tài)值設置上下文索引。這樣，根據(jù)本實施例的上下文建模單元1410可根據(jù)將被編碼的符號的類型，通過對分層信息和非分層信息進行各種組合來選擇多個上下文模型中的一個。對用于指示變換單元的分層結構的符號進行編碼的上述處理可被同樣應用于對指示編碼單元或預測單元的分層結構的符號進行編碼的處理。指示每個編碼單元是否被劃分為低一層級的較低層級的編碼單元的劃分標記可被用作指示編碼單元的分層結構的符號。與上述TU尺寸標記的熵編碼類似，根據(jù)通過對分層信息和非分層信息進行各種組合獲得的狀態(tài)值，基于選擇的上下文模型來對劃分標記進行熵編碼。下面描述與變換系數(shù)相關的符號的熵編碼的處理。圖18是用于描述根據(jù)本發(fā)明的實施例的變換系數(shù)的熵編碼的處理的參考示圖。與基于變換單元的分層結構而變換的變換系數(shù)相關的符號包括：標記“coded_block_flag”，指示在變換單元中包括的變換系數(shù)中是否存在不為0的變換系數(shù)值；標記“significant_coeff_flag”，指示不為0的變換系數(shù)的位置；標記“l(fā)ast_significant_coeff_flag”，指示不為0的最后變換系數(shù)的位置；以及不為0的變換系數(shù)的絕對值。當標記coded_block_flag為0時，即，在當前變換單元中不存在不為0的變換系數(shù)的情況，表示沒有更多將被發(fā)送的信息被余下。具有二進制值0或1的標記coded_block_flag針對每個變換單元被確定?？膳c指示圖15的變換單元的分層結構的TU尺寸標記類似地對標記coded_block_flag進行熵編碼。當與更高節(jié)點相應的變換單元的標記coded_block_flag為0時，與子節(jié)點相應的變換單元的標記coded_block_flag均具有值0，因此，僅更高節(jié)點的標記coded_block_flag被熵編碼。參照圖18，根據(jù)zigzag掃描順序來掃描變換單元2000中的變換系數(shù)。掃描順序可被改變。在圖18中，假設與空白空間相應的所有變換系數(shù)具有0。在圖18中，最終的有效變換系數(shù)是具有值“-1”的變換系數(shù)2010。在掃描變換單元2000中的每個變換系數(shù)時，熵編碼裝置1400對指示每個變換系數(shù)是否是不為0的變換系數(shù)的標記“significant_coeff_flag”以及指示不為0的變換系數(shù)是否是掃描順序中處于最后的位置的不為0的變換系數(shù)的標記“l(fā)ast_significant_coeff_flag”進行編碼。換句話說，當標記significant_coeff_flag為1時，處于相應位置的變換系數(shù)是具有不為0的值的有效變換系數(shù)。當標記significant_coeff_flag為0時，處于相應位置的變換系數(shù)是具有為0的值的有效變換系數(shù)。當標記last_significant_coeff_flag為0時，在掃描順序中隨后的有效變換系數(shù)保留。當標記last_significant_coeff_flag為1時，處于相應位置的變換系數(shù)是最后的有效變換系數(shù)。為了指示最后的有效變換系數(shù)的位置，指示最后的有效變換系數(shù)的相對位置的坐標信息可取代標記last_significant_coeff_flag而被使用。例如，如圖18中所示，由于作為最后的有效變換系數(shù)的變換系數(shù)“-1”2010相對于處于圖18中的左側最上位置的變換系數(shù)位于水平軸方向的第五個位置和垂直軸方向的第五個位置，因此熵編碼裝置1400可將值x＝5且y＝5編碼為最后的有效變換系數(shù)的位置信息。上下文建模單元1410可基于根據(jù)分層信息或分層信息與非分層信息的組合的狀態(tài)值來確定用于與變換系數(shù)相關的符號的熵編碼的上下文模型。換句話說，與確定用于指示變換單元的上述分層結構的TU尺寸標記的熵編碼的上下文模型的處理類似，上下文建模單元1410可基于將被編碼的當前變換系數(shù)所屬的變換單元的分層信息來確定用于與變換系數(shù)相關的符號的熵編碼的上下文模型。例如，如圖19或22中所示，上下文建模單元1410可使用關于當前變換系數(shù)所屬的變換單元的尺寸的信息來確定用于與變換系數(shù)相關的符號的熵編碼的上下文模型。此外，上下文建模單元1410可使用指示符號所屬的數(shù)據(jù)單元相對于更高變換單元的相對尺寸的相對分層信息，而不是絕對變換單元尺寸信息。上下文建模單元1410可基于分層信息和除分層信息以外的附加信息的組合來確定用于與變換系數(shù)相關的符號的熵編碼的上下文模型。例如，上下文建模單元1410可基于關于變換單元的尺寸的信息和作為非分層信息的顏色分量信息來設置上下文索引。此外，上下文建模單元1410可使用關于每個像素的位置的信息作為用于以像素為單位設置的符號的熵編碼的非分層信息，諸如指示變換系數(shù)是否是不為0的變換系數(shù)的標記“significant_coeff_flag”以及指示不為0的變換系數(shù)是否是在掃描順序中處于最后位置的不為0的變換系數(shù)的標記“l(fā)ast_significant_coeff_flag”。圖23和圖24是示出根據(jù)本發(fā)明的實施例的基于關于數(shù)據(jù)單元的位置的信息設置的上下文索引映射表的參考示圖。參照圖23和24，上下文建模單元1410可在以像素為單位設置的符號的熵編碼期間根據(jù)每個像素的位置來分配如參考標號2500和2600指示的上下文索引，并可使用根據(jù)當前符號的位置確定的上下文索引來確定上下文模型。此外，上下文建模單元1410可在以像素為單位設置的符號的熵編碼期間通過分層信息的組合來確定上下文模型。例如，可通過對根據(jù)變換單元的尺寸的第一信息和根據(jù)變換系數(shù)的位置的第二信息進行組合，確定指示變換系數(shù)是否是不為0的變換系數(shù)的標記“significant_coeff_flag”以及指示不為0的變換系數(shù)是否是在掃描順序中處于最后位置的不為0的變換系數(shù)的標記“l(fā)ast_significant_coeff_flag”。如圖25中所示，上下文建模單元1410可根據(jù)具有I個狀態(tài)值的第一信息條p1至pI(其中，I是整數(shù))與具有J個狀態(tài)值的第二信息條q1至qJ(其中，J是整數(shù))的組合來設置指示多個上下文模型中的一個的上下文索引，并可根據(jù)關于當前變換系數(shù)所屬的變換單元的尺寸和當前變換系數(shù)的位置的信息確定并輸出上下文索引。盡管在以上描述中通過使用CABAC對符號進行編碼和解碼，但熵編碼裝置1400可通過可變長編碼方法來對每個符號進行編碼，其中，在所述可變長編碼方法中，根據(jù)分層信息和非分層信息的組合來分配預設碼字。根據(jù)本實施例的熵編碼裝置1400不限于以上描述，而可通過從以下信息選擇的至少一個信息的組合來確定多個上下文模型中的一個：編碼單元的分層信息、預測單元的分層信息、變換單元的分層信息、顏色分量信息、預測模式信息、編碼單元的最大尺寸、編碼深度、關于預測單元的分區(qū)的信息、指示編碼單元是否被劃分的劃分標記、關于變換單元的尺寸的信息、指示變換單元是否被劃分的TU尺寸標記、應用于每個預測單元的幀內(nèi)/幀間預測的預測模式信息、運動矢量信息、預測方向信息和與符號的位置相關的信息，并且所述熵編碼裝置1400使用確定的上下文模型來對符號執(zhí)行熵編碼。圖27是根據(jù)本發(fā)明的實施例的使用分層構造的數(shù)據(jù)單元的視頻編碼方法的流程圖。參照圖27，在操作2910，分層編碼器110基于分層構造的數(shù)據(jù)單元對形成視頻的畫面進行編碼。在基于分層構造的數(shù)據(jù)單元對畫面進行編碼的處理中，與每個深度相應的分層構造的編碼單元、包括編碼深度的編碼單元的根據(jù)樹結構的編碼單元、用于編碼深度的每個編碼單元的預測編碼的分區(qū)以及變換單元的分層結構可針對每個最大編碼單元被確定。在操作2920，基于編碼的畫面的符號所屬的數(shù)據(jù)單元的分層信息來確定用于確定符號的熵編碼的上下文模型的熵編碼器120。此外，熵編碼器120可通過與分層結構相關的信息與除分層結構信息以外的附加信息的組合來確定多個上下文模型中適合于當前符號的上下文模型。分層信息可以是關于符號所屬的數(shù)據(jù)單元的尺寸的信息和指示符號所述的數(shù)據(jù)單元相對于更高層級的數(shù)據(jù)單元的相對尺寸的相對分層信息中的一個，其中，所述更高層級的數(shù)據(jù)單元比符號所屬的數(shù)據(jù)單元具有更大尺寸。相對分層信息可包括關于更高數(shù)據(jù)單元的尺寸的信息、指示更高數(shù)據(jù)單元是否被劃分的劃分標記、或關于符號所屬的數(shù)據(jù)單元相對于更高數(shù)據(jù)單元的尺寸的相對比率的信息。在操作2930，熵編碼器120使用確定的上下文模型執(zhí)行符號的熵編碼。所述符號可包括關于變換系數(shù)的信息、關于用于使用分層構造的數(shù)據(jù)單元進行編碼的變換單元的分層結構的信息、以及關于畫面的分層結構的信息。圖28是示出根據(jù)本發(fā)明的實施例的熵解碼裝置3000的結構的框圖。圖28的熵解碼裝置3000與圖2的視頻解碼裝置200的熵解碼器220相應。熵解碼裝置3000對作為由圖2的符號提取單元210提取出的編碼目標的指示與分層結構相關的信息和除分層結構信息以外的關于編碼的信息的符號進行熵解碼。參照圖28，根據(jù)本實施例的熵解碼裝置3000包括上下文建模單元3010、概率估計器3020和常規(guī)解碼器3030。上下文建模單元3010基于符號所屬的數(shù)據(jù)單元的分層信息來確定用于符號的熵編碼的上下文模型。具體地講，假設與當前解碼的目標符號所屬的分層構造的數(shù)據(jù)單元相關的分層信息具有I個狀態(tài)值(其中，I是正整數(shù))，上下文建模單元3010可根據(jù)分層信息的狀態(tài)值設置I個或更少數(shù)量的上下文模型，并可通過根據(jù)分層信息的狀態(tài)值分配指示所述I個或更少數(shù)量的上下文模型中的一個的上下文索引來確定將被用于當前符號的解碼的上下文模型。此外，除了上述絕對數(shù)據(jù)單元尺寸信息以外，可使用指示符號所屬的數(shù)據(jù)單元相對于更高數(shù)據(jù)單元的相對尺寸的相對分層信息。指示當前符號所屬的數(shù)據(jù)單元的尺寸相比于更高數(shù)據(jù)單元的尺寸的比率的信息可被用作分層信息。上下文建模單元3010可使用作為分層信息的指示當前符號所屬的數(shù)據(jù)單元相對于更高數(shù)據(jù)單元的相對尺寸的相對分層信息來確定當前符號所屬的數(shù)據(jù)單元的尺寸，并可基于確定的數(shù)據(jù)單元的尺寸來確定上下文模型。此外，上下文建模單元3010可根據(jù)符號的類型，基于分層信息和除分層信息以外的附加信息的組合來確定用于目標符號的熵解碼的上下文模型。具體地講，假設與當前解碼的目標符號所屬的分層構造的數(shù)據(jù)單元相關的分層信息具有I個狀態(tài)值，并且除分層信息以外的其它非分層信息具有J個狀態(tài)值(其中，J是正整數(shù))，上下文建模單元3010可根據(jù)I×J個狀態(tài)值的組合設置I×J個或更少數(shù)量的上下文模型，并可通過根據(jù)當前符號所屬的數(shù)據(jù)單元的分層信息和非分層信息的狀態(tài)值分配指示所述I×J個或更少數(shù)量的上下文模型中的一個的上下文索引來設置用于當前符號的解碼的上下文模型。此外，由上下文建模單元3010基于分層信息和非分層信息的組合確定的上下文模型被設置為在熵編碼裝置1400的上下文建模單元1410中。上下文建模單元3010不限于上述實施例，可通過根據(jù)將被解碼的符號的類型對分層信息和非分層信息進行各種組合來選擇多個上下文模型中的一個。概率估計器3020使用從上下文建模單元3010輸出的上下文索引信息來確定并輸出關于MPS和LPS的概率值的信息以及關于二進制信號0和1之中的與MPS和LPS相應的二進制信號的信息?？赏ㄟ^從預設查找表讀取由上下文索引指示的概率值來確定MPS或LPS的概率值。此外，可基于二進制信號的出現(xiàn)統(tǒng)計累計值來更新MPS或LPS的概率值。常規(guī)解碼器3030基于二進制信號信息以及與MPS或LPS相應的概率信息來執(zhí)行包括在比特流中的當前符號的熵解碼，并輸出解碼的符號信息。圖29是根據(jù)本發(fā)明的另一實施例的使用分層構造的數(shù)據(jù)單元的視頻解碼方法的流程圖。參照圖29，在操作3110，符號提取單元210通過對編碼的比特流進行解析來提取基于分層構造的數(shù)據(jù)單元編碼的畫面的符號。在操作3120，熵解碼器220基于符號所屬的數(shù)據(jù)單元的分層信息來確定用于符號的熵解碼的上下文模型。此外，熵解碼器220可通過與分層結構相關的信息和除分層結構信息以外的附加信息的組合來確定多個上下文模型之中將被應用于當前符號的上下文模型。分層信息可以是關于符號所屬的數(shù)據(jù)單元的尺寸的信息和指示符號所屬的數(shù)據(jù)單元相對于更高層級的數(shù)據(jù)單元的相對尺寸的相對分層信息中的一個，其中，所述更高層級的數(shù)據(jù)單元比符號所屬的數(shù)據(jù)單元具有更大的尺寸。相對分層信息可包括關于更高數(shù)據(jù)單元的尺寸的信息、指示更高數(shù)據(jù)單元是否被劃分的劃分標記、或關于符號所屬的數(shù)據(jù)單元相對于更高數(shù)據(jù)單元的尺寸的相對比率的信息。在操作3130，熵解碼器220使用確定的上下文模型對符號進行解碼。所述符號可包括關于變換系數(shù)的信息、關于用于使用分層構造的數(shù)據(jù)單元進行編碼的變換單元的分層結構的信息、以及關于畫面的分層結構的信息。本發(fā)明示也可實現(xiàn)為計算機可讀記錄介質(zhì)上的計算機可讀代碼。計算機可讀記錄介質(zhì)是可存儲其后可由計算機系統(tǒng)讀出的數(shù)據(jù)的任意數(shù)據(jù)存儲裝置。計算機可讀記錄介質(zhì)的示例包括：只讀存儲器(ROM)、隨機存取存儲器(RAM)、CD-ROM、磁帶、軟盤、光數(shù)據(jù)存儲裝置等。計算機可讀記錄介質(zhì)也可分布于連接網(wǎng)絡的計算機系統(tǒng)，從而計算機可讀代碼以分布式存儲和執(zhí)行。盡管已經(jīng)參照本發(fā)明的優(yōu)選實施例具體顯示和描述了本發(fā)明，但是本領域的普通技術人員將理解，在不脫離權利要求所限定的本發(fā)明的精神和范圍的情況下，可以在此進行形式和細節(jié)上的各種改變。優(yōu)選實施例應被視為僅是描述性的意義，而不是為了限制的目的。因此，本發(fā)明的范圍不由本發(fā)明的詳細描述來限定，而是由權利要求來限定，所述范圍內(nèi)的所有差異將被解釋為包括在本發(fā)明中。

完整全部詳細技術資料下載

當前第1頁1 2 3