視頻解碼方法與流程

文檔序號：12042030閱讀：257來源：國知局

視頻解碼方法本申請是申請日為2011年8月17日、申請?zhí)枮?01180049473.5、題為“使用可變樹結構變換單元的視頻編碼方法和設備以及視頻解碼方法和設備”的專利申請的分案申請。技術領域本發(fā)明涉及在空間域和變換域之間執(zhí)行變換的視頻編碼和視頻解碼。

背景技術：
隨著再現(xiàn)和存儲高分辨率或高質(zhì)量視頻內(nèi)容的硬件被開發(fā)和提供，對于用于有效地對高分辨率或高質(zhì)量視頻內(nèi)容進行編碼或解碼的視頻編解碼器的需求增加。在現(xiàn)有的視頻編解碼器中，根據(jù)有限的基于預定尺寸的宏塊的視頻編碼方法對視頻進行編碼。另外，現(xiàn)有視頻編解碼器通過使用具有與宏塊相同尺寸的塊對宏塊進行變換和逆變換，從而對視頻數(shù)據(jù)編碼和解碼。

技術實現(xiàn)要素：
技術問題本發(fā)明提供一種通過使用可變分層結構中的數(shù)據(jù)單元執(zhí)行變換和逆變換來對視頻進行編碼和解碼的方法和設備。技術方案根據(jù)本發(fā)明的一方面，提供了一種為了對視頻的當前區(qū)域進行編碼的視頻編碼方法，該視頻編碼方法包括以下操作：通過使用可變樹結構的變換單元來對當前區(qū)域執(zhí)行變換，并從可變樹結構的變換單元中確定針對當前區(qū)域的變換單元，其中，所述可變樹結構的變換單元從針對當前區(qū)域的基礎變換單元分層劃分的多個變換單元中確定并且基于變換單元的最大劃分級別產(chǎn)生；輸出經(jīng)由包括基于確定的變換單元的變換的編碼而產(chǎn)生的當前區(qū)域的編碼數(shù)據(jù)、關于在針對當前區(qū)域的編碼中確定的編碼模式的信息、以及包括針對視頻的變換單元的最大尺寸信息和最小尺寸信息的變換單元分層結構信息。有益效果在對視頻進行編碼和解碼的處理中，通過使用樹結構的具有各種尺寸和形狀的變換單元執(zhí)行變換和逆變換，從而可考慮圖像特性，有效地對視頻進行編碼和解碼。附圖說明圖1是根據(jù)本發(fā)明實施例的使用可變樹結構的變換單元的視頻編碼設備的框圖。圖2是根據(jù)本發(fā)明實施例的使用可變樹結構的變換單元的視頻解碼設備的框圖。圖3示出根據(jù)本發(fā)明實施例的樹結構的變換單元的分層模型。圖4示出根據(jù)本發(fā)明實施例的可變樹結構的變換單元的分層模型。圖5至圖8示出根據(jù)本發(fā)明實施例的基礎變換單元。圖9和圖10示出根據(jù)本發(fā)明實施例的可變樹結構的變換單元。圖11是根據(jù)本發(fā)明實施例的使用可變樹結構的變換單元的視頻編碼方法的流程圖。圖12是根據(jù)本發(fā)明實施例的使用可變樹結構的變換單元的視頻解碼方法的流程圖。圖13是根據(jù)本發(fā)明實施例的使用樹結構的編碼單元和可變樹結構的變換單元的視頻編碼設備的框圖。圖14是根據(jù)本發(fā)明實施例的使用樹結構的編碼單元和可變樹結構的變換單元的視頻解碼設備的框圖。圖15是用于描述根據(jù)本發(fā)明實施例的編碼單元的概念的示圖。圖16是根據(jù)本發(fā)明實施例的基于編碼單元的圖像編碼器的框圖。圖17是根據(jù)本發(fā)明實施例的基于編碼單元的圖像解碼器的框圖。圖18是根據(jù)本發(fā)明實施例的根據(jù)深度的較深層編碼單元和分區(qū)的示圖。圖19是用于描述根據(jù)本發(fā)明實施例的編碼單元和變換單元之間的關系的示圖。圖20是用于描述根據(jù)本發(fā)明實施例的與編碼深度對應的編碼單元的編碼信息的示圖。圖21是根據(jù)本發(fā)明實施例的根據(jù)深度的較深層編碼單元的示圖。圖22到圖24是用于描述根據(jù)本發(fā)明實施例的編碼單元、預測單元和變換單元之間的關系的示圖。圖25是用于描述根據(jù)本發(fā)明實施例的根據(jù)表1的編碼模式信息的編碼單元、預測單元或分區(qū)與變換單元之間的關系的示圖。圖26是示出根據(jù)本發(fā)明實施例的使用樹結構的編碼單元和可變樹結構的變換單元的視頻編碼方法的流程圖。圖27是示出根據(jù)本發(fā)明實施例的使用樹結構的編碼單元和可變樹結構的變換單元的視頻解碼方法的流程圖。最佳方式據(jù)本發(fā)明的一方面，提供了一種為了對視頻的當前區(qū)域進行編碼的視頻編碼方法，該視頻編碼方法包括以下操作：通過使用可變樹結構的變換單元來對當前區(qū)域執(zhí)行變換，并且從可變樹結構的變換單元確定針對當前區(qū)域的變換單元，其中，所述可變樹結構的變換單元從針對當前區(qū)域的基礎變換單元分層劃分的多個變換單元中確定并且基于變換單元的最大劃分級別產(chǎn)生；輸出經(jīng)由包括基于確定的變換單元的變換的編碼而產(chǎn)生的當前區(qū)域的編碼數(shù)據(jù)、關于在針對當前區(qū)域的編碼中確定的編碼模式的信息以及包括針對視頻的變換單元的最大尺寸信息和最小尺寸信息的變換單元分層結構信息。根據(jù)本發(fā)明的另一方面，提供了一種視頻解碼方法，包括以下操作：接收包括通過對視頻編碼獲得的數(shù)據(jù)的比特流；解析比特流，并且從所述比特流中提取當前區(qū)域的編碼數(shù)據(jù)、關于在針對當前區(qū)域的編碼中確定的編碼模式的信息以及包括針對視頻的變換單元的最大尺寸信息和最小尺寸信息的變換單元分層結構信息；通過使用可變樹結構的變換單元來對當前區(qū)域執(zhí)行逆變換，對當前區(qū)域的編碼數(shù)據(jù)進行解碼并恢復視頻，其中，所述可變樹結構的變換單元從針對當前區(qū)域的基礎變換單元分層劃分的多個變換單元中確定并且基于變換單元的最大劃分級別產(chǎn)生。變換單元分層結構信息可還包括指示變換單元的最大劃分級別的最大劃分信息。針對當前區(qū)域的基礎變換單元的尺寸可等于或小于針對視頻的變換單元的最大尺寸。變換單元可被劃分一次，從而下一更低級別的變換單元可被產(chǎn)生，預定變換單元的級別可指示劃分的總數(shù)，以便通過逐步地劃分基礎變換單元來產(chǎn)生預定變換單元，并且針對當前區(qū)域的基礎變換單元可以是針對當前區(qū)域可用的最大最高級別的變換單元?；卺槍Ξ斍皡^(qū)域的變換單元的最大劃分級別產(chǎn)生的可變樹結構的變換單元可包括基礎變換單元以及根據(jù)通過將基礎變換單元逐步地劃分為最大劃分級別而產(chǎn)生的級別的變換單元。針對當前區(qū)域的變換單元的最小尺寸可被確定為針對視頻的變換單元的最小尺寸和通過將基礎變換單元劃分到最大劃分級別而獲得的最低級別的變換單元的尺寸中的較大的一個。變換單元的最大劃分級別可等于或小于從與針對視頻的變換單元的最大尺寸對應的最大編碼單元到與針對視頻的變換單元的最小尺寸對應的最小編碼單元的級別的總數(shù)?？苫谠诋斍皡^(qū)域的編碼中使用的預測模式和分區(qū)尺寸中的至少一個來確定基礎變換單元的尺寸。針對當前區(qū)域的變換單元的最大劃分級別可針對處于包括畫面序列、畫面、條帶和用于視頻的編碼的數(shù)據(jù)單元的數(shù)據(jù)級別中的一個數(shù)據(jù)級別的數(shù)據(jù)組的每一個被設置，并且變換單元的最大劃分信息可被編碼為針對確定最大劃分級別的數(shù)據(jù)級別的參數(shù)?？稍趯Ξ斍皡^(qū)域執(zhí)行編碼時使用的每個預測模式中單獨地確定針對當前區(qū)域的變換單元的最大劃分級別?？稍趯Ξ斍皡^(qū)域執(zhí)行編碼時使用的每個條帶類型中單獨地確定針對當前區(qū)域的變換單元的最大劃分級別。關于當前區(qū)域的基礎變換單元的尺寸可以是恒定的。關于當前區(qū)域的基礎變換單元可被確定為具有包括在分區(qū)中的形狀的數(shù)據(jù)單元，以不跨越作為用于針對當前區(qū)域的預測編碼的數(shù)據(jù)單元的分區(qū)之間的邊界。處于通過劃分針對當前區(qū)域的基礎變換單元獲得的較低級別的變換單元可被確定為具有包括在分區(qū)中的形狀的數(shù)據(jù)單元，以不跨越作為用于針對當前區(qū)域的預測編碼的數(shù)據(jù)單元的分區(qū)之間的邊界。根據(jù)本發(fā)明的另一方面，提供了一種視頻編碼設備，包括：變換單元確定單元，為了對視頻的當前區(qū)域進行編碼，通過使用可變樹結構的變換單元來對當前區(qū)域執(zhí)行變換，并且從可變樹結構的變換單元確定針對當前區(qū)域的變換單元，其中，所述可變樹結構的變換單元從針對當前區(qū)域的基礎變換單元分層劃分的多個變換單元被確定并且基于變換單元的最大劃分級別產(chǎn)生；輸出單元，輸出經(jīng)由包括基于確定的變換單元的變換的編碼而產(chǎn)生的當前區(qū)域的編碼數(shù)據(jù)、關于在針對當前區(qū)域的編碼中確定的編碼模式的信息以及包括針對視頻的變換單元的最大尺寸信息和最小尺寸信息的變換單元分層結構信息。根據(jù)本發(fā)明的另一方面，提供了一種視頻解碼設備，包括：接收單元，接收包括通過對視頻編碼獲得的數(shù)據(jù)的比特流；提取單元，解析比特流，并且從所述比特流中提取當前區(qū)域的編碼數(shù)據(jù)、關于在針對當前區(qū)域的編碼中確定的編碼模式的信息以及包括針對視頻的變換單元的最大尺寸信息和最小尺寸信息的變換單元分層結構信息；解碼單元，通過使用可變樹結構的變換單元來對當前區(qū)域執(zhí)行逆變換，對當前區(qū)域的編碼數(shù)據(jù)進行解碼并且恢復視頻，其中，所述可變樹結構的變換單元從針對當前區(qū)域的基礎變換單元分層劃分的多個變換單元中確定并且基于變換單元的最大劃分級別產(chǎn)生。根據(jù)本發(fā)明的另一方面，提供了一種在其上記錄有用于執(zhí)行視頻編碼方法的程序的計算機可讀記錄介質(zhì)。根據(jù)本發(fā)明的另一方面，提供了一種在其上記錄有用于執(zhí)行視頻解碼方法的程序的計算機可讀記錄介質(zhì)。具體實施方式下文中，在下面描述的一個或更多實施例中，“圖像”可統(tǒng)一地不僅表示靜止圖像還表示包括視頻的運動圖像。當執(zhí)行涉及多個圖像的各種操作時，可將涉及圖像的數(shù)據(jù)劃分為多個數(shù)據(jù)組，并且可對包括在相同的數(shù)據(jù)組中的多條數(shù)據(jù)執(zhí)行相同的操作。以下，在整個說明書中，根據(jù)預定標準形成的數(shù)據(jù)組被稱為“數(shù)據(jù)單元”。以下，在整個說明書中，對每個“數(shù)據(jù)單元”執(zhí)行的操作是指通過使用包括在數(shù)據(jù)單元中的多條數(shù)據(jù)來執(zhí)行操作。以下，參照圖1至圖12，將描述使用可變樹結構的變換單元的視頻編碼和解碼。以下，參照圖13至圖17，將描述使用樹結構的編碼單元和可變樹結構的變換單元的視頻編碼和解碼。以下，參照圖1至圖12，將描述使用可變樹結構的變換單元的視頻編碼設備和視頻解碼設備、視頻編碼方法和視頻解碼方法。圖1是根據(jù)本發(fā)明實施例的使用可變樹結構的變換單元的視頻編碼設備10的框圖。使用可變樹結構的變換單元的視頻編碼設備包括變換單元確定單元11和輸出單元13。以下，為了便于描述，使用可變樹結構的變換單元的視頻編碼設備10被稱為“視頻編碼設備10”。視頻編碼設備10的變換單元確定單元11和輸出單元13的操作可由視頻編碼處理器、中央處理器、圖形處理器等協(xié)同控制。為了對輸入視頻的當前畫面進行編碼，視頻編碼設備10將當前畫面劃分為具有預定尺寸的數(shù)據(jù)單元，隨后對每個數(shù)據(jù)單元執(zhí)行編碼。例如，當前畫面由空間域的像素構成。為了允許預定范圍中的相鄰像素形成組以便允許當前畫面中的空間上彼此相鄰的像素被一起編碼，當前畫面可被劃分為具有預定尺寸的像素組。通過對劃分的具有預定尺寸的像素組的像素執(zhí)行的一系列的編碼操作，可執(zhí)行針對當前畫面的編碼。由于作為畫面的編碼目標的初始數(shù)據(jù)是空間域的像素值，因此具有預定尺寸的每個像素組可用作作為編碼目標的數(shù)據(jù)單元。另外，對空間域的像素組的像素值執(zhí)行用于視頻編碼的變換，從而產(chǎn)生變換域的變換系數(shù)，在這點上，變換系數(shù)維持具有與空間域的像素組相同的尺寸的系數(shù)組。因此，變換域的變換系數(shù)的系數(shù)也可被用作用于畫面的編碼的數(shù)據(jù)單元。因此，在整個空間域和變換域，具有預定尺寸的數(shù)據(jù)組可用作用于編碼的數(shù)據(jù)單元。這里，數(shù)據(jù)單元的尺寸可被定義為包括在數(shù)據(jù)單元中的數(shù)據(jù)的總條數(shù)。例如，空間域的像素的總數(shù)或變換域的變換系數(shù)的總數(shù)可指示數(shù)據(jù)單元的尺寸。以下，“當前區(qū)域”可指示具有數(shù)據(jù)級別(數(shù)據(jù)級別是作為視頻中的編碼目標的數(shù)據(jù)單元、條帶、畫面和畫面序列之一)的數(shù)據(jù)組。視頻編碼設備10可對每個區(qū)域執(zhí)行包括幀間預測和幀內(nèi)預測的預測編碼、變換和量化以及熵編碼，從而對當前畫面執(zhí)行編碼。變換單元確定單元11確定作為對當前畫面的當前區(qū)域執(zhí)行變換的數(shù)據(jù)單元的變換單元。變換單元可被確定為具有的尺寸等于或小于當前區(qū)域的數(shù)據(jù)單元以被包括在當前區(qū)域中。例如，變換單元確定單元11可通過將當前區(qū)域的高度和寬度二等分來產(chǎn)生變換單元。另外，變換單元確定單元11可通過不對稱地劃分當前區(qū)域的高度和寬度中的至少一個來產(chǎn)生變換單元。變換單元確定單元11可通過根據(jù)任意比例劃分當前區(qū)域的高度和寬度中的至少一個來產(chǎn)生變換單元。變換單元可以是包括在當前區(qū)域中的多邊形數(shù)據(jù)單元。變換單元確定單元11可通過再次劃分變換單元的高度和寬度中的至少一個來產(chǎn)生更低級別的變換單元。變換單元確定單元11可確定用于當前區(qū)域的變換的樹結構的變換單元。樹結構的變換單元包括被確定為輸出變換結果以及從當前區(qū)域的變換單元中被確定的最終變換單元。為了確定樹結構的變換單元，變換單元確定單元11可通過重復地劃分當前區(qū)域中的變換單元中的預定變換單元的高度和寬度中的至少一個來產(chǎn)生較低級別的變換單元。另外，變換單元確定單元11可確定是否將每個變換單元劃分為較低級別的變換單元，可在具有相同級別并且通過從較高級別變換單元劃分而產(chǎn)生的每個變換單元中獨立地執(zhí)行所述確定。在一個實施例中，將具有預定級別的變換單元劃分為較低級別的變換單元的操作可包括劃分具有預定級別的至少一個變換單元的操作。例如，從當前區(qū)域的最高變換單元到預定級別，所有的變換單元在每個劃分級別可被劃分或者可不被劃分。在另一實施例中，當變換單元從預定級別劃分為較低級別時，可在每個預定級別獨立地確定是否在特定級別劃分變換單元，從而較低級別的變換單元的尺寸可能不是恒定的。變換單元確定單元11通過對當前區(qū)域執(zhí)行幀間預測或幀內(nèi)預測來產(chǎn)生殘差數(shù)據(jù)，并且基于變換單元確定單元11確定的變換單元來對殘差數(shù)據(jù)執(zhí)行變換，從而變換單元確定單元11對當前區(qū)域進行編碼。也就是，通過使用由變換單元確定單元11確定的變換單元來對用于當前區(qū)域的預測的每個分區(qū)的殘差數(shù)據(jù)進行再次劃分，從而可對每個變換單元的殘差數(shù)據(jù)執(zhí)行變換。在本實施例中，用于視頻編碼的“變換”指示用于將空間域的視頻數(shù)據(jù)變換為變換域的數(shù)據(jù)的數(shù)據(jù)處理技術。由變換單元確定單元11執(zhí)行的用于視頻編碼的變換可包括頻率變換、正交變換、整數(shù)變換等。變換單元確定單元11可通過使用根據(jù)級別的變換單元對包括在當前區(qū)域中并且處于根據(jù)分層結構的所有級別的變換單元重復地執(zhí)行變換，可按照根據(jù)級別的變換單元比較變換的誤差，因此可選擇引起最小誤差的級別的變換單元。產(chǎn)生引起最小誤差的變換系數(shù)的級別的變換單元可被確定為具有作為輸出變換結果的級別的變換深度的變換單元。因此，變換單元確定單元11可確定包括被確定為輸出變換結果的變換單元的樹結構的變換單元。根據(jù)本實施例，可預先設置關于視頻的變換單元的最大尺寸和最小尺寸。變換單元確定單元11可針對當前畫面的每個區(qū)域確定等于或小于關于視頻的變換單元的最大尺寸的基礎變換單元?；A變換單元是在當前區(qū)域中可使用的最大且最高級別變換單元。變換單元確定單元11可限制當前區(qū)域中的變換單元的級別的總數(shù)。變換單元被劃分一次，從而較低級別的變換單元被產(chǎn)生，并且預定變換單元的級別可指示直到在基礎變換單元根據(jù)級別被劃分之后產(chǎn)生預定變換單元時執(zhí)行的總劃分次數(shù)。因此，當前區(qū)域中的變換單元的最大劃分級別可涉及從當前區(qū)域的基礎變換單元到最低級別的變換單元的劃分的最大總次數(shù)。根據(jù)基礎變換單元以及可針對當前區(qū)域不同設置的變換單元的最大劃分級別，級別的總數(shù)以及變換單元的分層結構可被改變。因此，變換單元確定單元11可基于變換單元的最大劃分級別來使用可變樹結構的變換單元?？勺儤浣Y構的變換單元可包括基礎變換單元、以及根據(jù)通過從基礎變換單元到變換單元的最大劃分級別逐步劃分而產(chǎn)生的級別的變換單元。變換單元確定單元11可基于可變樹結構的變換單元對當前區(qū)域執(zhí)行變換，該可變樹結構的變換單元基于變換單元的最大劃分級別產(chǎn)生并且從關于當前區(qū)域的基礎變換單元逐步劃分的變換單元中確定。變換單元確定單元11可最終確定這樣的變換單元，所述變換單元來自可變樹結構中的變換單元并且將用于輸出當前區(qū)域的變換系數(shù)。關于當前區(qū)域的變換單元的最小尺寸可被確定為關于視頻的變換單元的最小尺寸以及通過將基礎變換單元劃分為變換單元的最大劃分級別而獲得的最低級別的變換單元的尺寸中的較大的一個。變換單元的劃分的最大總次數(shù)可等于或小于從與關于當前區(qū)域的變換單元的最大尺寸對應的最大變換單元劃分為與關于當前區(qū)域的變換單元的最小尺寸對應的最小變換單元的總劃分次數(shù)。因此，變換單元的最大劃分級別可等于或小于從與關于當前區(qū)域的變換單元的最大尺寸對應的最大變換單元劃分為與關于當前區(qū)域的變換單元的最小尺寸對應的最小變換單元的總劃分次數(shù)。關于當前區(qū)域的基礎變換單元的尺寸可以是恒定的。另外，可根據(jù)區(qū)域的特性來設置具有不同尺寸的基礎變換單元。例如，可基于用于當前區(qū)域的編碼的預測模式和分區(qū)尺寸中的至少一個來確定基礎變換單元的尺寸。可針對包括視頻的畫面序列、畫面、條帶和編碼數(shù)據(jù)單元的數(shù)據(jù)級別中的預定級別的每個數(shù)據(jù)組設置變換單元的最大劃分級別。也就是，例如，關于當前畫面序列的最大劃分級別可被設置，或者最大劃分級別可針對每個畫面、每個條帶或每個數(shù)據(jù)單元被設置。在另一示例中，可在編碼系統(tǒng)和解碼系統(tǒng)之間預先隱含地設置變換單元的最大劃分級別?？蓪τ谟糜诋斍皡^(qū)域的編碼的每個條帶類型單獨地確定關于當前區(qū)域的變換單元的最大劃分級別。關于當前區(qū)域的基礎變換單元可被確定為具有包括在分區(qū)(所述分區(qū)是包括在用于當前區(qū)域的預測編碼的數(shù)據(jù)單元)中的形狀的數(shù)據(jù)單元，從而數(shù)據(jù)單元可不跨越所述分區(qū)之間的邊界。此外，通過劃分關于當前區(qū)域的基礎變換單元而獲得的較低級別的變換單元可被確定為具有包括在分區(qū)(所述分區(qū)是用于當前區(qū)域的預測編碼的數(shù)據(jù)單元)中的形狀的數(shù)據(jù)單元，從而數(shù)據(jù)單元可不跨越所述分區(qū)之間的邊界。稍后參照圖5至圖10來描述與基礎變換單元和較低級別的變換單元的確定相關的示例。輸出單元13可輸出包括當前區(qū)域的編碼數(shù)據(jù)的比特流、關于編碼模式的信息以及關于變換單元的各種類型的信息。輸出單元13可輸出在各種編碼操作之后產(chǎn)生的當前區(qū)域的編碼數(shù)據(jù)，所述各種編碼操作包括基于由變換單元確定單元11確定的變換單元的變換、以及量化、幀間預測、幀內(nèi)預測、熵編碼等。輸出單元13可輸出關于與用于各種編碼操作的編碼方案相關的編碼模式的各種類型的信息，所述各種編碼操作包括基于由變換單元確定單元11確定的變換單元的變換、以及量化、幀間預測、幀內(nèi)預測、熵編碼等。輸出單元13可輸出指示關于視頻的變換單元的分層結構的變換單元分層結構信息。變換單元分層結構信息可包括關于視頻的變換單元的最大尺寸和最小尺寸的信息以及變換索引信息。在實施例中，變換索引信息可指示關于用于當前區(qū)域的變換的變換單元的結構的信息。例如，變換索引信息可包括從當前區(qū)域劃分為最低級別的變換單元的總劃分次數(shù)、變換單元的尺寸以及變換單元的形狀。在另一實施例中，根據(jù)在每個級別將較高級別的變換單元劃分為具有相同尺寸的變換單元的情況，變換索引信息可指示當前區(qū)域到最低級別的變換單元的總劃分次數(shù)。輸出單元13可輸出關于針對視頻的變換單元的最大尺寸和最小尺寸的信息。在實施例中，關于針對視頻的變換單元的最大尺寸和最小尺寸的信息可在被包括在視頻流的序列參數(shù)集或圖像參數(shù)集中時被輸出。變換單元分層結構信息可包括指示變換單元的最大劃分級別的變換單元最大劃分信息。因此，輸出單元13可對變換單元最大劃分信息進行編碼和輸出。在實施例中，變換單元最大劃分信息可在被包括在序列參數(shù)集或圖像參數(shù)集中時被輸出，或者可針對具有預定尺寸的每個條帶或每個區(qū)域設置該變換單元最大劃分信息。在另一實施例中，當在編碼系統(tǒng)和解碼系統(tǒng)之間變換單元的最大劃分級別預先隱含地被設置時，不需要對變換單元最大劃分信息進行編碼和輸出。輸出單元13可針對當前區(qū)域確定可變樹結構中的每個變換單元的變換單元子劃分信息，隨后可輸出變換單元子劃分信息，所述變換單元子劃分信息指示特定變換單元是否被劃分為下一較低級別的變換單元。輸出單元13可跳過針對具有最小尺寸的變換單元的變換單元子劃分信息，所述具有最小尺寸的變換單元來自針對當前區(qū)域確定的多個變換單元并且針對當前區(qū)域被允許。輸出單元13可確定并輸出多個變換單元的每個變換單元的分層變換單元模式信息(針對當前區(qū)域確定所述多個變換單元)，并且分層變換單元模式信息可指示包括非零系數(shù)并且來自于較低級別的變換單元的變換單元的存在。圖2是根據(jù)本發(fā)明實施例的使用可變樹結構的變換單元的視頻解碼設備20的框圖。使用可變樹結構的變換單元的視頻解碼設備20包括接收單元21、提取單元23和解碼單元25。以下，為了便于描述，使用可變樹結構的變換單元的視頻解碼設備20被稱為“視頻解碼設備20”。視頻解碼設備20的接收單元21、提取單元23和解碼單元25進行的操作可由視頻編碼處理器、中央處理器、圖形處理器等協(xié)同控制。為了從比特流恢復圖像，視頻解碼設備20可執(zhí)行包括熵解碼、反量化、逆變換、幀間預測/補償和幀內(nèi)預測/補償?shù)牟僮?，從而對比特流的編碼圖像數(shù)據(jù)進行解碼。接收單元21接收并解析關于編碼視頻的比特流。提取單元23從由接收單元21解析的比特流提取針對當前畫面的每個區(qū)域編碼的數(shù)據(jù)、關于編碼模式的信息以及關于變換單元的各種類型的信息。提取單元23可將當前區(qū)域的編碼數(shù)據(jù)、關于編碼模式的信息以及關于變換單元的各種類型的信息傳遞給解碼單元25。解碼單元25可根據(jù)各種解碼方法(根據(jù)關于編碼模式的信息來確定各種解碼方案)來對編碼數(shù)據(jù)執(zhí)行包括熵解碼、反量化、逆變換、幀間預測/補償和幀內(nèi)預測/補償，可恢復當前區(qū)域的像素值，隨后可恢復當前畫面。提取單元23可從比特流中提取變換單元分層結構信息(諸如涉及變換單元的分層結構的變換單元的最大尺寸信息和最小尺寸信息、變換單元的最大尺寸信息和最小尺寸信息等)。解碼單元25可基于由提取單元23提取的關于變換單元的各種類型的信息來確定針對當前區(qū)域的逆變換所需的變換單元，并可基于所述變換單元來針對當前區(qū)域執(zhí)行逆變換。由解碼單元25為視頻的解碼而執(zhí)行的逆變換可指示將變換域的數(shù)據(jù)變換為空間域的數(shù)據(jù)的處理。由解碼單元25進行的逆變換可包括逆頻率變換、逆正交變換、逆整數(shù)變換等。變換單元、基礎變換單元和變換單元的分層結構的概念與參照圖1和視頻編碼設備10的前述描述相同。也就是，在本實施例中，通過根據(jù)任意比例劃分當前區(qū)域或者較高級別的變換單元的高度和寬度中的至少一個來產(chǎn)生變換單元。具體地講，可基于針對當前區(qū)域的變換單元的最大劃分級別或者變換單元的最大劃分次數(shù)來確定可變樹結構的變換單元。也就是，可變樹結構的變換單元可包括基礎變換單元以及較低級別的變換單元，較低級別的變換單元是從基礎變換單元到在當前視頻中允許的最大劃分級別的被劃分的變換單元。提取單元23可從變換單元分層結構信息提取針對視頻的變換單元的最大尺寸信息和最小尺寸信息。在實施例中，可從視頻流的序列參數(shù)集或畫面參數(shù)集中提取關于視頻的變換單元的最大尺寸信息和最小尺寸信息。提取單元23可從變換單元分層結構信息提取變換單元最大劃分信息。在實施例中，可從序列參數(shù)集或畫面參數(shù)集中提取變換單元最大劃分信息，或者可從條帶或者對于每個區(qū)域設置的參數(shù)中提取變換單元最大劃分信息。在另一實施例中，當在編碼系統(tǒng)和解碼系統(tǒng)之間變換單元的最大劃分級別被預先隱含地設置時，不需要單獨地提取變換單元最大劃分信息。解碼單元25可分析當前區(qū)域的從基礎變換單元到最低級別變換單元的可允許的級別總數(shù)或者可允許的總劃分次數(shù)。解碼單元25可讀取針對視頻的畫面序列設置的變換單元的最大劃分級別?？蛇x擇地，可根據(jù)各種數(shù)據(jù)級別(諸如畫面、條帶或數(shù)據(jù)單元)來讀取變換單元的最大劃分級別。在另一實施例中，可基于在編碼系統(tǒng)和解碼系統(tǒng)之間預先隱含設置的變換單元的最大劃分級別來確定可變樹結構的變換單元。提取單元23可從變換單元分層結構信息中提取變換索引信息。提取單元23可從變換索引信息分析用于當前區(qū)域的變換的變換單元的結構。例如，可從變換索引信息中提取從當前區(qū)域到最低級別變換單元的總劃分次數(shù)、變換單元的尺寸以及變換單元的形狀。當根據(jù)變換索引信息，在每個級別較高級別的變換單元被劃分為具有相同尺寸的變換單元時，從當前區(qū)域到最低級別變換單元的總劃分次數(shù)可被讀取。提取單元23可提取針對多個變換單元中的每個變化單元的變換單元子劃分信息，其中針對當前區(qū)域來確定所述多個變換單元。解碼單元25可基于變換單元子劃分信息來確定是否將當前級別的變換單元劃分為下一更低級別的變換單元。當不再針對預定級別的變換單元提取變換單元子劃分信息時，預定級別的變換單元可被分析為針對當前區(qū)域允許的最小尺寸變換單元。提取單元23可從針對當前區(qū)域確定的多個變換單元中的每個變化單元提取分層變換單元模式信息。解碼單元25可從分層變換單元模式信息中分析變換單元的存在，該變換單元包括非零系數(shù)并且來自于當前變換單元的較低級別的多個變換單元。在實施例中，基于變換單元分層結構信息，可從分層結構的變換單元分析逆變換所需的信息，所述分層結構的變換單元從當前區(qū)域的最高級別變換單元到預定劃分級別被統(tǒng)一地劃分為在每個級別具有恒定的尺寸的變換單元。在另一實施例中，是否將較高級別的變換單元劃分為較低級別的變換單元被單獨地確定，基于變換單元分層結構信息被確定為逆變換所需的變換級別的變換單元不限于具有恒定的尺寸的變換單元。因此，解碼單元25可通過使用基于由提取單元23提取的變換單元相關信息確定的變換單元來對當前區(qū)域執(zhí)行逆變換。具體地講，解碼單元25可基于針對當前區(qū)域的變換單元的最大劃分級別(基于變換單元最大劃分信息來確定針對當前區(qū)域的變換單元的最大劃分級別)來分析針對當前區(qū)域允許的可變樹結構的變換單元，并可檢測將用于變換系數(shù)的逆變換的并且從可變樹結構的變換單元中確定的變換單元。解碼單元25可通過使用基于最大劃分級別檢測的變換單元來對當前區(qū)域執(zhí)行逆變換。解碼單元25可基于關于對應編碼模式的信息以及變換單元相關信息來對配置視頻的預定區(qū)域的每個圖像執(zhí)行解碼，因此可對視頻進行解碼。在視頻編碼和解碼過程中，視頻編碼設備10和視頻解碼設備20可通過使用具有各種尺寸和形狀的樹結構變換單元來執(zhí)行變換和逆變換，從而視頻編碼設備10和視頻解碼設備20可考慮到圖像特性來有效地對視頻進行編碼和解碼。另外，由于通過基于樹結構的多個變換單元中的可變樹結構的變換單元使用變換來執(zhí)行編碼和解碼，因此可跳過使用根據(jù)圖像特性和編碼特性不需要的級別的變換單元的編碼和解碼過程，從而計算量會減小。另外，基于最大劃分級別可預測針對當前區(qū)域允許的變換單元的最大劃分次數(shù)量或級別的總數(shù)，從而可減小關于包括變換單元子劃分信息的信息的傳輸量，在將用于視頻解碼的變換單元的確定中需要所述變換單元子劃分信息。圖3示出根據(jù)本發(fā)明實施例的樹結構的變換單元的分層模型?？捎梢曨l編碼設備10和視頻解碼設備20基于在當前視頻中允許的變換單元的最大尺寸和最小尺寸來確定將用于當前視頻的編碼的樹結構的變換單元。視頻編碼設備10可將在當前視頻中允許的變換單元的最大尺寸信息“MaxTransformSize”和最小尺寸信息“MinTransformSize”包括在序列參數(shù)集或圖像參數(shù)集中并可輸出它們。例如，當變換單元的最大尺寸信息“MaxTransformSize”和最小尺寸信息“MinTransformSize”分別指示32×32和4×4時，關于64×64尺寸的區(qū)域(即，編碼單元(CU)30)的變換單元可包括32×32尺寸變換單元35a、35b、35c和35d至4×4尺寸變換單元38a和38b。為了便于描述，變換單元的分層關系被假設，其中，當前變換單元的高度和高度被二等分，從而從當前變換單元產(chǎn)生下一較低級別的四個變換單元。由于在當前視頻中允許的變換單元的最大尺寸是32×32，因此最高級別的零級別的變換單元的尺寸可以是32×32，第一級別的變換單元的尺寸可以是16×16，第二級別的變換單元的尺寸可以是8×8，第三級別的變換單元的尺寸可以是4×4。更詳細地，零級別的32×32尺寸的變換單元35a、35b、35c和35d可被劃分為第一級別的16×16尺寸的變換單元36a、36b、36c、36d、36e、36h、36i、36l、36m和36p。另外，第一級別的16×16尺寸的變換單元36a、36b、36c、36d、36e、36h、36i、36l、36m和36p可被劃分為第二級別的8×8尺寸的變換單元37a、37b、37c、37d、37e和37f。另外，第二級別的8×8尺寸的變換單元37a、37b、37c、37d、37e和37f可被劃分為第三級別的4×4尺寸的變換單元38a和38b。由于空間限制，雖然沒有示出關于第一級別的變換單元36a、36b、36c、36d、36e、36h、36i、36l、36m和36p、第二級別的8×8尺寸的變換單元37a、37b、37c、37d、37e和37f以及第三級別的4×4尺寸的變換單元38a和38b的所有可用變換單元，但是可從當前變換單元產(chǎn)生下一較低級別的四個變換單元。更加詳細地，根據(jù)可用于當前區(qū)域(即，CU30)的變換的級別的變換單元的總數(shù)可以是包括零級別的變換單元35a、35b、35c和35d的4個變換單元、包括第一級別的變換單元36a、36b、36c、36d、36e、36h、36i、36l、36m和36p的16個變換單元、包括第二級別的變換單元37a、37b、37c、37d、37e和37f的64個變換單元以及第三級別的變換單元38a和38b的256個變換單元。為了確定針對當前區(qū)域30的樹結構的變換單元，視頻編碼設備10可通過使用在當前視頻中允許的以下變換單元來對當前區(qū)域30重復地執(zhí)行變換：32×32尺寸的變換單元35a、35b、35c和35d、16×16尺寸的變換單元36a、36b、36c、36d、36e、36h、36i、36l、36m和36p、8×8尺寸的變換單元37a、37b、37c、37d、37e和37f以及4×4尺寸的變換單元38a和38b。在視頻編碼設備10針對零級別、第一級別、第二級別和第三級別的所有變換單元執(zhí)行變換之后，視頻編碼設備10可針對當前區(qū)域30的內(nèi)部區(qū)域中的每個區(qū)域獨立地選擇變換單元，其中，該變換單元處于這樣的級別：從該級別輸出具有最小誤差的變換系數(shù)。在實施例中，樹結構的變換單元可包括選擇的級別的變換單元。為了對關于當前區(qū)域30的樹結構的變換單元的信息進行編碼，視頻編碼設備10可對關于變換深度的變換深度信息進行編碼和輸出，所述變換深度指示產(chǎn)生具有最小誤差的變換系數(shù)的變換單元的級別。視頻解碼設備20通過使用從比特流提取的變換深度信息來讀取用于輸出當前區(qū)域30的變換系數(shù)的變換單元的級別，并可確定用于當前區(qū)域30的變換系數(shù)的逆變換的樹結構的變換單元。圖4示出根據(jù)本發(fā)明實施例的可變樹結構的變換單元的分層模型。視頻編碼設備10可與在當前視頻中允許的變換單元的最大尺寸信息“MaxTransformSize”和最小尺寸信息“MinTransformSize”一起輸出當前區(qū)域的變換單元的最大劃分信息“MaxTuDepth”。當前區(qū)域的變換單元的最大劃分信息可指示針對當前區(qū)域的變換單元的最大變換級別，即可允許的級別的總數(shù)。針對當前區(qū)域的當前區(qū)域40，可允許從最上級別的基礎變換單元到作為最大變換級別的最低級別的變換單元的多個變換單元。例如，針對當前區(qū)域的最大變換級別可被設置為2?；A變換單元可包括零級別的32×32尺寸的變換單元45a、45b、45c和45d。因此，針對具有64×64尺寸的當前區(qū)域40的變換單元可包括零級別的32×32尺寸的變換單元45a、45b、45c和45d以及第一級別的16×16尺寸的變換單元46a、46b、46c、46d、46e、46h、46i、46l、46m和46p?；谠诋斍耙曨l中允許的變換單元的最大尺寸信息“MaxTransformSize”和最小尺寸信息“MinTransformSize”以及當前區(qū)域的變換單元的最大劃分信息“MaxTuDepth”，可通過使用等式1來計算可在當前區(qū)域中使用的變換單元的最小尺寸?！镜仁?】MinimumpossibleleafTUzise＝Max(MinTransformSize,RootTUSize/(2^(MaxTuDepth-1)))也就是，當前區(qū)域的變換單元的最小尺寸“MinimumpossibleleafTUzise”可以是在當前視頻中允許的變換單元的最小尺寸信息“MinTransformSize”以及通過按照最大劃分次數(shù)劃分基礎變換單元而獲得的最低級別的變換單元的尺寸RootTUSize/(2^(MaxTuDepth-1))中的較大的一個。在等式1中，與最大劃分次數(shù)對應的“MaxTuDepth-1”的范圍滿足等式2?！镜仁?】MaxTuDepth-1≤Log2(MaxTransformSize)-Log2(MinTransformSize)也就是，最大劃分次數(shù)可等于或小于基于在當前視頻中允許的變換單元的最大尺寸信息“MaxTransformSize”和最小尺寸信息“MinTransformSize”確定的從最大變換單元到最小變換單元的總劃分次數(shù)。根據(jù)可被用于對當前區(qū)域40執(zhí)行變換的級別的變換單元的總數(shù)可以是零級別的四個變換單元45a、45b、45c和45d以及第一級別的16個變換單元46a、46b、46c、46d、46e、46h、46i、46l、46m和46p。因此，盡管零級別、第一級別、第二級別和第三級別的所有的變換單元根據(jù)針對當前視頻的變換單元的最大尺寸信息和最小尺寸信息會是可用的，但是視頻編碼設備10可基于針對當前區(qū)域40設置的最大劃分級別或者最大劃分次數(shù)，通過僅使用第一級別和第二級別的變換單元來對當前區(qū)域40執(zhí)行變換。也就是，如上所述，針對圖3的當前區(qū)域30，基于針對當前視頻的變換單元的最大尺寸信息和最小尺寸信息，通過使用零級別的4個變換單元、第一級別的16個變換單元、第二級別的64個變換單元以及第三級別的256個變換單元來執(zhí)行變換。相反，針對圖4的當前區(qū)域40，可基于變換單元的最大劃分級別或者最大劃分次數(shù)，通過僅使用零級別的4個變換單元以及第一級別的16個變換單元來執(zhí)行變換。另外，視頻編碼設備10可對每個變換單元的變換單元子劃分信息進行編碼(每個變換單元的變換單元子劃分信息指示對應的變換單元是否被劃分為下一更低級別的變換單元)，隨后可輸出該信息。由于具有最小尺寸的變換單元不再被劃分為下一更低級別的變換單元，因此針對最低級別的變換單元不需要對變換單元子劃分信息進行編碼。因此，針對圖3的當前區(qū)域30，可針對零級別的4個變換單元、第一級別的16個變換單元以及第二級別的64個變換單元來對變換單元子劃分信息進行編碼。相反，針對圖4的當前區(qū)域40，基于變換單元的最大劃分級別或者最大劃分次數(shù)，僅針對零級別的4個變換單元對變換單元子劃分信息進行編碼。另外，如上所述，變換單元的最大劃分次數(shù)可等于或小于分別與視頻允許的最大尺寸和最小尺寸對應的從最大變換單元到最小變換單元的總劃分次數(shù)，并且變換單元的最大劃分級別可根據(jù)其結果而被預測。以這種方式，基于最大劃分級別的可預測性，最大劃分信息的比特會減少。例如，當根據(jù)截斷一元最大編碼方案(TruncatedUnaryMaxCodingscheme)對最大劃分信息進行編碼時，將從視頻允許的最大變換單元到最小變換單元的總劃分次數(shù)設置為最大劃分級別的最大值，從而當對與最大值對應的最大劃分級別進行編碼時，可減少一比特。作為圖3的樹結構的變換單元與圖4的可變樹結構的變換單元之間的比較的結果，由于可用于變換的變換單元級別的總數(shù)根據(jù)最大劃分級別或者最大劃分次數(shù)被改變，因此變換單元的分層結構被改變。視頻編碼設備10可通過使用可變樹結構的變換單元來對當前區(qū)域40的每個區(qū)域執(zhí)行變換，并且根據(jù)變換的結果，視頻編碼設備10可針對每個區(qū)域獨立地選擇變換單元，其中，變換單元處于輸出具有最小誤差的變換系數(shù)的級別。視頻編碼設備10可對變換深度信息和變換單元最大劃分信息進行編碼和輸出，其中，視頻編碼設備10需要所述變換深度信息和變換單元最大劃分信息來確定當前區(qū)域40的可變樹結構的變換單元。視頻解碼設備20可通過使用從比特流提取的變換深度信息以及變換單元最大劃分信息，來讀取在當前區(qū)域40的編碼中使用的變換單元的變換深度以及變換單元的最大劃分級別。基于讀取的變換深度或級別，可確定用于對當前區(qū)域40的變換系數(shù)進行逆變換的可變樹結構的變換單元?？筛鶕?jù)當前區(qū)域的特性確定變換單元的最大劃分級別或者最大劃分次數(shù)。因此，根據(jù)圖像特性，如果不需要通過使用各種類型的變換單元來執(zhí)行變換，則通過使用可變樹結構的變換單元來執(zhí)行視頻編碼和解碼，從而可減少通過使用具有各種級別和尺寸的變換單元執(zhí)行變換引起的計算量。另外，由于可基于變換單元的最大劃分級別預測可用變換單元的分層結構，因此用于與變換單元的分層結構相關的編碼信息的比特率會減少，從而編碼結果的傳輸效率會提高。參照圖3和圖4，描述了變換單元的高度和寬度被二等分并被劃分為較低級別的變換單元的實施例。然而，分層結構的變換單元不限于圖3和圖4的實施例，因此在其它實施例中，可根據(jù)任意比例劃分變換單元的高度和寬度中的至少一個，從而可產(chǎn)生較低級別的變換單元。圖5至圖8示出根據(jù)本發(fā)明實施例的基礎變換單元。在實施例中，可變樹結構的變換單元包括從基礎變換單元劃分的較低級別的變換單元，從而可根據(jù)基礎變換單元的形狀或尺寸來確定可變樹結構的變換單元的形狀和尺寸?；旧希A變換單元的尺寸等于或小于針對當前視頻的最大變換單元?；趨^(qū)域的編碼模式之一，該區(qū)域的基礎變換單元的形狀可被確定。例如，可根據(jù)該區(qū)域的編碼模式中的預測模式確定當前區(qū)域的基礎變換單元的形狀。例如，可基于當前區(qū)域的預測模式是幀間模式還是幀內(nèi)模式確定基礎變換單元的尺寸。例如，可根據(jù)當前區(qū)域的編碼模式中的分區(qū)的尺寸來確定該區(qū)域的基礎編碼單元的形狀。分區(qū)指示通過劃分該區(qū)域以便對該區(qū)域執(zhí)行幀間預測或幀內(nèi)預測而獲得的數(shù)據(jù)單元，并且分區(qū)的尺寸可指示該分區(qū)的形狀或尺寸。參照圖5，可確定具有與用于區(qū)域的預測的數(shù)據(jù)單元相同的形狀的基礎變換單元。例如針對2N×2N尺寸的區(qū)域50的2N×2N尺寸的分區(qū)51是用于幀間預測或幀內(nèi)預測的數(shù)據(jù)單元，并且2N×2N尺寸的區(qū)域50的基礎變換單元可被確定為2N×2N尺寸的變換單元。在另一實施例中，基礎變換單元可被確定為具有的尺寸等于或小于區(qū)域的分區(qū)的尺寸的變換單元。在這種情況下，由于基礎變換單元被包括在位于對應區(qū)域的分區(qū)中，因此基礎變換單元可被確定為不跨越當前區(qū)域的分區(qū)之間的邊界。參照圖6，當針對2N×2N尺寸的區(qū)域60確定N×2N尺寸的分區(qū)61a和61b時，可針對2N×2N尺寸的區(qū)域60來確定2N×2N尺寸的基礎變換單元65a、65b、65c和65d。2N×2N尺寸的基礎變換單元65a、65b、65c和65d小于N×2N尺寸的分區(qū)61a和61b，從而2N×2N尺寸的基礎變換單元65a、65b、65c和65d被包括在N×2N尺寸的分區(qū)61a和61b并且不跨越N×2N尺寸的分區(qū)61a和61b之間的邊界。參照圖7，可針對4M×4M尺寸的區(qū)域70來確定其寬度被不對稱劃分的分區(qū)71a和71b。也就是，可針對4M×4M尺寸的區(qū)域70來確定M×4M尺寸的分區(qū)71a和3M×4M尺寸的分區(qū)71b。在這種情況下，針對4M×4M尺寸的區(qū)域70的基礎變換單元可被確定為M×M尺寸的變換單元75a、75b、75c和75d以及2M×2M尺寸的變換單元75i和75j以不跨越分區(qū)71a和71b之間的邊界。M×M尺寸的變換單元75a、75b、75c和75d以及2M×2M尺寸的變換單元75i和75j可被包括在對應區(qū)域的分區(qū)71a或71b中。另外，針對當前區(qū)域，可將基礎變換單元的尺寸限制為恒定的。參照圖8，可針對4M×4M尺寸的區(qū)域80來確定M×4M尺寸的分區(qū)81a和3M×4M尺寸的分區(qū)81b。在這種情況下，可針對4M×4M尺寸的區(qū)域80來確定不跨越分區(qū)81a和81b之間的邊界并具有恒定的尺寸的M×M尺寸的變換單元85a、85b、85c、85d、85e、85f、85g、85h、85i、85j、85k、85l、85m、85n、85o和85p。在實施例中，可對于該區(qū)域的編碼模式中的每個編碼模式來單獨地確定最大劃分級別?？蓪τ谠搮^(qū)域的每個預測模式確定最大劃分級別。例如，對于每個預測模式可以以對于幀間模式的區(qū)域確定最大劃分信息“MaxTUDepthOfInter”或者以對于幀內(nèi)模式的區(qū)域確定最大劃分信息“MaxTUDepthOfIntra”等的方式來單獨地確定最大劃分級別?？蓪γ總€條帶類型來單獨地確定最大劃分級別。例如，對于每個條帶類型可以以對于幀內(nèi)類型條帶確定最大劃分級別值“MaxTUDepthOfIntraSlice”、對于幀間P類型條帶確定最大劃分級別值“MaxTUDepthOfInterP”、對于幀間B類型條帶確定最大劃分級別值“MaxTUDepthOfInterB”等的方式來單獨地確定最大劃分級別。在這種情況下，在條帶頭包括針對每個條帶類型的最大劃分信息的同時條帶頭被編碼。圖9和圖10示出根據(jù)本發(fā)明實施例的可變樹結構的變換單元?？勺儤浣Y構的變換單元可包括基礎變換單元以及從基礎變換單元劃分并且具有的級別比基礎變換單元低至少一個級別的多個變換單元。例如，雖然基礎變換單元與分區(qū)尺寸不相關，但可基于分區(qū)尺寸來確定從基礎變換單元劃分的較低級別的多個變換單元。例如，參照圖9，2N×2N尺寸的區(qū)域90的分區(qū)類型可被確定為N×2N尺寸的分區(qū)91a和91b。不管N×2N尺寸的分區(qū)91a和91b的尺寸，零級別的基礎變換單元95的尺寸可被確定為與2N×2N尺寸的區(qū)域90相同的2N×2N尺寸。作為低于基礎變換單元95一個級別的第一級別的變換單元97a、97b、97c和97d可被確定為N×N尺寸的變換單元，所述N×N尺寸的變換單元不跨越N×2N尺寸的分區(qū)91a和91b之間的邊界并且小于N×2N尺寸的分區(qū)91a和91b。參照圖10，4M×4M尺寸的區(qū)域92的分區(qū)類型可被確定為作為不對稱分區(qū)類型的分區(qū)93a和93b。不管分區(qū)93a和93b的尺寸，零級別的基礎變換單元94的尺寸可被確定為等于4M×4M尺寸的區(qū)域92的4M×4M。在實施例中，作為低于零級別的基礎變換單元94一個級別的第一級別的變換單元可被確定為M×M尺寸的變換單元96a、96b、96c、96d、96e、96f、96g和96h以及2M×2M尺寸的變換單元96i和96j以便不跨越分區(qū)93a和93b之間的邊界。在另一實施例中，作為低于零級別的基礎變換單元94一個級別的第一級別的變換單元可被確定為M×M尺寸的變換單元98a、98b、98c、98d、98e、98f、98g、98h、98i、98j、98k、98l、98m、98n、98o和98p，以便具有恒定的尺寸，同時他們不跨越分區(qū)93a和93b之間的邊界。以上參照圖5至圖8描述根據(jù)本發(fā)明實施例的基礎變換單元，并且以上參照圖9和圖10描述根據(jù)本發(fā)明實施例的可變樹結構的變換單元。盡管上述變換單元是通過將較高級別的變換單元的高度和寬度二等分而獲得的方形數(shù)據(jù)單元，但是變換單元的形狀不限于方形的數(shù)據(jù)單元。圖11是根據(jù)本發(fā)明實施例的使用可變樹結構的變換單元的視頻編碼方法的流程圖。在操作111，將視頻劃分為多個區(qū)域并且隨后對每個區(qū)域進行編碼。為了在視頻中對具有預定尺寸的當前區(qū)域進行編碼，可基于可變樹結構的變換單元來對當前區(qū)域執(zhí)行變換，其中，基于從當前區(qū)域的基礎變換單元分層劃分的多個變換單元中的一個變換單元的最大劃分級別來產(chǎn)生所述可變樹結構的變換單元。當前區(qū)域可以是用于編碼操作的數(shù)據(jù)單元、宏塊、畫面、條帶等。當前區(qū)域單元的基礎變換單元可以是針對當前區(qū)域可用的最大尺寸和最高級別的變換單元。基礎變換單元的尺寸可等于或小于針對視頻的變換單元的最大尺寸。變換單元的最大劃分級別可指示針對當前區(qū)域允許的變換單元的級別的總數(shù)，并可與從當前區(qū)域的基礎變換單元到針對當前區(qū)域允許的最低級別的變換單元的總劃分次數(shù)對應?？勺儤浣Y構的變換單元可包括根據(jù)變換單元的最大劃分級別的基礎變換單元以及根據(jù)通過逐步地從基礎變換單元劃分到變換單元的最大劃分級別而產(chǎn)生的級別的多個變換單元?？蓪Πㄓ糜诋斍皡^(qū)域的編碼的預測模式、條帶類型等的每個編碼模式單獨地確定變換單元的最大劃分級別。可根據(jù)圖像特性不同地設置針對當前區(qū)域的基礎變換單元?；诳杀徊煌卦O置的基礎變換單元或者可被不同的設置的最大劃分級別，可變樹結構的變換單元可用于針對當前區(qū)域的變換。引起最小誤差并且根據(jù)操作(在該操作中，通過使用可變樹結構的變換單元對當前區(qū)域執(zhí)行變換)的結果的變換單元可被確定為針對當前區(qū)域的具有變換深度的變換單元，從而變換系數(shù)可被輸出。在操作112，當前區(qū)域的編碼數(shù)據(jù)以及關于在當前區(qū)域的編碼中確定的編碼模式的信息以比特流的形式被輸出，其中，經(jīng)過由包括基于在操作111確定的變換單元的變換的編碼產(chǎn)生所述編碼數(shù)據(jù)。另外，針對視頻的變換單元的最大尺寸信息和最小尺寸信息以及指示變換單元的最大劃分級別的變換單元最大劃分信息在被包括在比特流中時被輸出。對于多個變換單元(所述多個變換單元自于被確定為針對當前區(qū)域的最終變換單元的變換單元并且排除具有當前區(qū)域的最小尺寸的變換單元)中的每個變換單元，指示所述多個變換單元中的每個變換單元是否被劃分為下一更低級別的變換單元的變換單元子劃分信息可被編碼并且可被輸出。另外，對于所述多個變換單元的每個、指示變換單元(該變換單元包括非零系數(shù)并且來自較低級別的多個變換單元)的存在的分層變換單元模式信息可被編碼并可被輸出。圖12是根據(jù)本發(fā)明實施例的使用可變樹結構的變換單元的視頻解碼方法的流程圖。在操作121，接收包括視頻的編碼數(shù)據(jù)的比特流。在操作122，解析在操作121接收的比特流，從而從比特流中提取當前區(qū)域的編碼數(shù)據(jù)以及關于在當前區(qū)域的編碼中確定的編碼模式的信息。另外，從比特流中提取針對視頻的變換單元的最大尺寸信息和最小尺寸信息以及變換單元最大劃分信息。對于使用在當前區(qū)域的編碼中的每個預測模式或每個條帶類型，可單獨地讀取關于針對當前區(qū)域的變換單元的變換單元最大劃分信息?？蓮谋忍亓髦刑崛∽儞Q單元子劃分信息或分層變換單元模式信息。在操作123，可從提取的關于編碼模式的信息中讀取當前區(qū)域的編碼模式，并且可基于編碼模式來對當前區(qū)域的編碼數(shù)據(jù)進行解碼。具體地講，可基于變換單元最大劃分信息來讀取針對當前區(qū)域的變換單元的最大劃分級別?？苫谧畲髣澐旨墑e來確定可變樹結構的變換單元，其中，可基于變換單元的最大劃分級別來產(chǎn)生可變樹結構的變換單元，并且從針對當前區(qū)域的基礎變換單元分層劃分的多個變換單元確定所述可變樹結構的變換單元?？蓮目勺儤浣Y構的變換單元確定具有變換深度的變換單元，并且可通過使用具有變換深度的變換單元對當前區(qū)域的變換系數(shù)執(zhí)行逆變換。隨后，可通過針對圖像將編碼的結果進行組合來恢復視頻?？筛鶕?jù)圖像的空間域特性來單獨地確定變換單元的最大劃分級別或最大劃分次數(shù)?？苫诰幋a系統(tǒng)或解碼系統(tǒng)的能力或數(shù)據(jù)通信環(huán)境來確定變換單元的最大劃分級別或最大劃分次數(shù)。由于從基礎變換單元選擇性地限制最大劃分次數(shù)或最大劃分級別，因此編碼計算量和傳輸比特量會減少。下文中，參照圖13至圖27，將對使用樹結構的變換單元以及可變樹結構的變換單元的視頻編碼設備和視頻解碼設備以及視頻編碼方法和視頻解碼方法進行描述。圖13是根據(jù)本發(fā)明實施例的使用樹結構的編碼單元和可變樹結構的變換單元的視頻編碼設備100的框圖。使用樹結構的變換單元和可變樹結構的變換單元的視頻編碼設備100包括最大編碼單元劃分器110、編碼單元確定器120和輸出單元130。下文中，為了便于描述，使用樹結構的變換單元和可變樹結構的變換單元的視頻編碼設備100被稱為“視頻編碼設備100”。最大編碼單元劃分器110可基于圖像的當前畫面的最大編碼單元對當前畫面進行劃分。如果當前畫面大于最大編碼單元，則當前畫面的圖像數(shù)據(jù)可被劃分為至少一個最大編碼單元。最大編碼單元可以是具有32×32、64×64、128×128、256×256等尺寸的數(shù)據(jù)單元，其中，數(shù)據(jù)單元的形狀是寬和高為2的平方的方形。圖像數(shù)據(jù)可根據(jù)所述至少一個最大編碼單元被輸出到編碼單元確定器120。編碼單元可由最大尺寸和深度表征。深度表示編碼單元從最大編碼單元開始被空間劃分的次數(shù)。因此，隨著深度加深，根據(jù)深度的較深層編碼單元可從最大編碼單元被劃分到最小編碼單元。最大編碼單元的深度是最高深度，最小編碼單元的深度是最低深度。由于與每個深度對應的編碼單元的尺寸隨著最大編碼單元的深度加深而減小，因此與較高深度對應的編碼單元可包括與更低深度對應的多個編碼單元。如上所述，根據(jù)編碼單元的最大尺寸將當前畫面的圖像數(shù)據(jù)劃分為一個或多個最大編碼單元，每個最大編碼單元可包括根據(jù)深度劃分的較深層編碼單元。由于最大編碼單元根據(jù)深度被劃分，因此包括在最大編碼單元中的空間域的圖像數(shù)據(jù)可根據(jù)深度被分層地分類?？深A先確定編碼單元的最大深度和最大尺寸，其中，所述最大深度和最大尺寸限制最大編碼單元的高度和寬度被分層劃分的總次數(shù)。編碼單元確定器120對通過根據(jù)深度劃分最大編碼單元的區(qū)域而獲得的至少一個劃分的區(qū)域進行編碼，并根據(jù)所述至少一個劃分的區(qū)域確定輸出最終編碼圖像數(shù)據(jù)的深度。例如，編碼單元確定器120通過根據(jù)當前畫面的最大編碼單元以根據(jù)深度的較深層編碼單元對圖像數(shù)據(jù)進行編碼并選擇具有最小編碼誤差的深度，來確定編碼深度。因此，由編碼單元確定器120輸出與確定的編碼深度對應的編碼單元的編碼圖像數(shù)據(jù)。另外，與編碼深度對應的編碼單元可被視作編碼的編碼單元。確定的編碼深度和根據(jù)確定的編碼深度的編碼圖像數(shù)據(jù)被輸出到輸出單元130?；谂c等于或低于最大深度的至少一個深度對應的較深層編碼單元對最大編碼單元中的圖像數(shù)據(jù)進行編碼，并基于每個較深層編碼單元來比較對圖像數(shù)據(jù)進行編碼的結果?？稍诒容^所述較深層編碼單元的編碼誤差之后選擇具有最小編碼誤差的深度?？舍槍γ總€最大編碼單元選擇至少一個編碼深度。隨著編碼單元根據(jù)深度被分層劃分并隨著編碼單元的數(shù)量增加，最大編碼單元的尺寸被劃分。另外，即使編碼單元在一個最大編碼單元中對應于相同深度，仍通過單獨測量每個編碼單元的圖像數(shù)據(jù)的編碼誤差來確定是否將與相同深度對應的每個編碼單元劃分為更低深度。因此，即使在圖像數(shù)據(jù)被包括在一個最大編碼單元中時，圖像數(shù)據(jù)也根據(jù)深度被劃分為區(qū)域并且在一個最大編碼單元中編碼誤差會根據(jù)區(qū)域而不同。因此，編碼深度會根據(jù)圖像數(shù)據(jù)中的區(qū)域而不同。因此，可在一個最大編碼單元中確定一個或多個編碼深度，并可根據(jù)至少一個編碼深度的編碼單元來劃分最大編碼單元的圖像數(shù)據(jù)。因此，編碼單元確定器120可確定包括在最大編碼單元中的具有樹結構的編碼單元。具有樹結構的編碼單元包括最大編碼單元中所包括的所有較深層編碼單元中與確定為編碼深度的深度對應的編碼單元?？稍谧畲缶幋a單元的相同區(qū)域中根據(jù)深度分層地確定編碼深度的編碼單元，并可在不同區(qū)域中獨立地確定所述編碼深度的編碼單元。類似地，當前區(qū)域中的編碼深度可與另一區(qū)域中的編碼深度獨立地被確定。最大深度是與從最大編碼單元到最小編碼單元的劃分次數(shù)相關的索引。第一最大深度可表示從最大編碼單元到最小編碼單元的總的劃分次數(shù)。第二最大深度可表示從最大編碼單元到最小編碼單元的深度級別總數(shù)。例如，當最大編碼單元的深度是0時，最大編碼單元被劃分一次的編碼單元的深度可被設置為1，最大編碼單元被劃分兩次的編碼單元的深度可被設置為2。這里，如果最小編碼單元是最大編碼單元被劃分四次的編碼單元，則存在深度0、深度1、深度2、深度3、深度4這5個深度級別。在這種情況下，第一最大深度可被設置為4，第二最大編碼深度可被設置為5?？筛鶕?jù)最大編碼單元執(zhí)行預測編碼和變換。還根據(jù)最大編碼單元，基于根據(jù)等于最大深度的深度或小于最大深度的深度的較深層編碼單元來執(zhí)行預測編碼和變換?？筛鶕?jù)正交變換或整數(shù)變換的方法來執(zhí)行變換。由于每當最大編碼單元根據(jù)深度被劃分時較深層編碼單元的數(shù)量就增加，因此對隨著深度加深而產(chǎn)生的所有較深層編碼單元執(zhí)行包括預測編碼和變換的編碼。為了便于描述，現(xiàn)在將基于最大編碼單元中的當前深度的編碼單元描述預測編碼和變換。視頻編碼設備100可不同地選擇用于對圖像數(shù)據(jù)進行編碼的數(shù)據(jù)單元的尺寸或形狀。為了對圖像數(shù)據(jù)進行編碼，執(zhí)行諸如預測編碼、變換和熵編碼的操作，同時，相同的數(shù)據(jù)單元可用于所有操作，或者不同的數(shù)據(jù)單元可用于每個操作。例如，視頻編碼設備100可不僅選擇用于對圖像數(shù)據(jù)進行編碼的編碼單元，還可選擇與該編碼單元不同的數(shù)據(jù)單元以對編碼單元中的圖像數(shù)據(jù)執(zhí)行預測編碼。為了在最大編碼單元中執(zhí)行預測編碼，可基于與編碼深度對應的編碼單元(即，基于不再被劃分為與更低深度對應的編碼單元的編碼單元)執(zhí)行預測編碼。以下，不再被劃分并且成為用于預測編碼的基本單元的編碼單元將被稱為預測單元。通過劃分預測單元獲得的分區(qū)可包括預測單元或通過劃分預測單元的高度和寬度中的至少一個而獲得的數(shù)據(jù)單元。例如，當尺寸為2N×2N(其中，N是正整數(shù))的編碼單元不再被劃分并且成為2N×2N的預測單元時，分區(qū)的尺寸可以是2N×2N、2N×N、N×2N或N×N。分區(qū)類型的示例包括通過對稱地劃分預測單元的高度或?qū)挾榷@得的對稱分區(qū)、通過不對稱地劃分預測單元的高度或?qū)挾?諸如，1:n或n:1)而獲得的分區(qū)、通過幾何地劃分預測單元而獲得的分區(qū)以及具有任意形狀的分區(qū)。預測單元的預測模式可以是幀內(nèi)模式、幀間模式和跳過模式中的至少一個。例如，可對2N×2N、2N×N、N×2N或N×N的分區(qū)執(zhí)行幀內(nèi)模式或幀間模式。另外，可僅對2N×2N的分區(qū)執(zhí)行跳過模式?？瑟毩⒌貙幋a單元中的多個預測單元執(zhí)行編碼，從而選擇具有最小編碼誤差的預測模式。視頻編碼設備100可不僅基于用于對圖像數(shù)據(jù)進行編碼的編碼單元對編碼單元中的圖像數(shù)據(jù)執(zhí)行變換，還可基于與編碼單元不同的數(shù)據(jù)單元對編碼單元中的圖像數(shù)據(jù)執(zhí)行變換。如以上參照圖1至圖12進行的描述，為了在編碼單元中執(zhí)行變換，可基于具有等于或小于變換單元的尺寸的數(shù)據(jù)單元執(zhí)行變換。例如，用于變換的變換單元可包括用于幀內(nèi)模式的變換單元以及用于幀間模式的變換單元。與根據(jù)先前實施例的樹結構的變換單元類似，編碼單元中的變換單元可被遞歸地劃分為更小尺寸的變換單元，從而根據(jù)變換深度根據(jù)樹結構的變換單元來劃分編碼單元中的殘差數(shù)據(jù)。還可對變換單元設置指示通過劃分編碼單元的寬度和高度而達到變換單元的劃分次數(shù)的變換深度。例如，在2N×2N的當前編碼單元中，當變換單元的尺寸是2N×2N時，變換深度可以是0，當變換單元的尺寸是N×N時，變換深度可以是1，當變換單元的尺寸是N/2×N/2時，變換深度可以是2。換句話說，可根據(jù)變換深度來對于變換單元設置具有樹結構的變換單元。根據(jù)與編碼深度對應的編碼單元對信息編碼不僅使用關于編碼深度的信息，還使用與預測編碼和變換相關的信息。因此，編碼單元確定器120可確定具有最小編碼誤差的編碼深度，還可確定預測單元中的分區(qū)類型、根據(jù)預測單元的預測模式以及用于變換的變換單元的尺寸。另外，編碼單元確定器120可基于對于最大編碼單元或當前編碼單元中的每一個預先有限地設置的變換單元的最大劃分級別，在針對編碼單元的編碼處理中通過使用可變樹結構的變換單元來執(zhí)行變換?；谧儞Q單元的最大劃分級別的可變樹結構的變換單元對應于參照圖1至圖12的以上描述。也就是，可變樹結構的編碼單元可包括基礎變換單元、以及從基礎變換單元劃分到編碼單元允許的最大劃分級別的較低級別的變換單元?；A變換單元和最大劃分級別可根據(jù)編碼模式被不同地設置。例如，當前圖像的基礎變換單元的形狀可根據(jù)分區(qū)的尺寸或者來自編碼單元的編碼模式的預測模式被確定。分區(qū)可指示通過將編碼單元的預測單元進行劃分獲得的數(shù)據(jù)單元，并且預測單元可以是具有與編碼單元相同的尺寸的分區(qū)。在實施例中，基礎變換單元可被確定為具有與編碼單元的預測單元相同形狀。在另一實施例中，基礎變換單元可被確定為具有的尺寸等于或小于分區(qū)的尺寸以不跨越分區(qū)之間的邊界。另外，在基礎變換單元大于分區(qū)的同時，低于基礎變換單元的級別的變換單元可被確定為具有的尺寸小于分區(qū)的尺寸以便不跨越分區(qū)之間的邊界。編碼單元確定器120可通過使用可變樹結構的變換單元來對每個編碼單元執(zhí)行變換，因此可確定樹結構的變換單元。稍后將參照圖15至圖25來對根據(jù)一個或多個實施例的根據(jù)最大編碼單元的樹結構的編碼單元以及確定樹結構的分區(qū)和變換單元的方法進行詳細描述。編碼單元確定器120可通過使用基于拉格朗日乘子(Lagrangianmultiplier)的率失真最優(yōu)化，測量根據(jù)深度的較深層編碼單元的編碼誤差。輸出單元130在比特流中輸出最大編碼單元的圖像數(shù)據(jù)、關于根據(jù)編碼深度的編碼模式的信息，其中，最大編碼單元的圖像數(shù)據(jù)基于由編碼單元確定器120確定的至少一個編碼深度被編碼?？赏ㄟ^對圖像的殘差數(shù)據(jù)進行編碼來獲得編碼的圖像數(shù)據(jù)。關于根據(jù)編碼深度的編碼模式的信息可包括關于編碼深度的信息、關于預測單元中的分區(qū)類型的信息、預測模式和變換單元的尺寸中的至少一個。可通過使用根據(jù)深度的劃分信息來定義關于編碼深度的信息，其中，所述根據(jù)深度的劃分信息指示是否對更低深度而非當前深度的編碼單元執(zhí)行編碼。如果當前編碼單元的當前深度是編碼深度，則當前編碼單元中的圖像數(shù)據(jù)被編碼和輸出，因此劃分信息可被定義為不將當前編碼單元劃分至更低深度?？蛇x擇地，如果當前編碼單元的當前深度不是編碼深度，則對更低深度的編碼單元執(zhí)行編碼。因此，劃分信息可被定義為對當前編碼單元進行劃分以獲得更低深度的編碼單元。如果當前深度不是編碼深度，則對被劃分為更低深度的編碼單元的編碼單元執(zhí)行編碼。因為在當前深度的一個編碼單元中存在更低深度的至少一個編碼單元，所以對更低深度的每個編碼單元重復執(zhí)行編碼。因此，可針對具有相同深度的編碼單元遞歸地執(zhí)行編碼。因為針對一個最大編碼單元確定具有樹結構的編碼單元，并且針對編碼深度的編碼單元確定關于至少一個編碼模式的信息，所以可針對一個最大編碼單元確定關于至少一個編碼模式的信息。另外，因為根據(jù)深度分層地劃分圖像數(shù)據(jù)，所以最大編碼單元的圖像數(shù)據(jù)的編碼深度可根據(jù)位置而不同。因此，可針對圖像數(shù)據(jù)設置關于編碼深度和編碼模式的信息。因此，輸出單元130可將關于對應的編碼深度和編碼模式的編碼信息分配給包括在最大編碼單元中的編碼單元、預測單元和最小單元中的至少一個。最小單元可以是通過將具有最低深度的最小編碼單元劃分為4份而獲得的矩形數(shù)據(jù)單元。可選擇地，最小單元可以是最大矩形數(shù)據(jù)單元，其中，所述最大矩形數(shù)據(jù)單元可被包括在最大編碼單元中包括的所有編碼單元、預測單元、分區(qū)單元和變換單元中。例如，通過輸出單元130輸出的編碼信息可被分類為根據(jù)編碼單元的編碼信息和根據(jù)預測單元的編碼信息。根據(jù)編碼單元的編碼信息可包括關于預測模式的信息以及關于分區(qū)的尺寸的信息中的至少一個。根據(jù)預測單元的編碼信息可包括關于幀間模式的估計方向的信息、關于幀間模式的參考圖像索引的信息、關于運動矢量的信息、關于幀內(nèi)模式的色度分量的信息以及關于幀內(nèi)模式的插值方法的信息中的至少一個。關于根據(jù)畫面、條帶或畫面組(GOP)定義的編碼單元的最大尺寸的信息以及關于最大深度的信息可被插入到比特流的頭、序列參數(shù)集(SPS)或圖像參數(shù)集中。另外，可經(jīng)由比特流的頭、SPS或圖像參數(shù)集來輸出當前視頻允許的變換單元的最大尺寸信息和變換單元的最小尺寸信息。輸出單元130可輸出以上參照圖1至圖12描述的變換單元最大劃分信息、變換索引信息、變換單元子劃分信息、分層變換單元模式信息等。在視頻編碼設備100中，較深層編碼單元可以是通過將作為上一層的較高深度的編碼單元的高度和寬度中的至少一個劃分為2個而獲得的編碼單元。換而言之，在當前深度的編碼單元的尺寸是2N×2N時，更低深度的編碼單元的尺寸可以是N×N。另外，具有2N×2N的尺寸的當前深度的編碼單元可包括4個更低深度的編碼單元。因此，基于考慮當前畫面的特性而確定的最大編碼單元的尺寸和最大深度兩者，視頻編碼設備100可通過針對每個最大編碼單元確定具有最佳形狀和最佳尺寸的編碼單元，來形成具有樹結構的編碼單元。另外，因為可通過使用各種預測模式和變換中的任意一種來對每個最大編碼單元執(zhí)行編碼，所以可考慮各種圖像尺寸的編碼單元的特性來確定最佳編碼模式。因此，如果以傳統(tǒng)的宏塊為單位對具有高分辨率或大數(shù)據(jù)量的圖像進行編碼，則每個畫面的宏塊的數(shù)量會急劇增加。因此，針對每個宏塊產(chǎn)生的壓縮信息的條數(shù)增加，因此難以發(fā)送壓縮的信息并且數(shù)據(jù)壓縮效率下降。然而，通過使用視頻編碼設備100，因為在考慮圖像的特征的同時調(diào)整了編碼單元，同時，在考慮圖像的尺寸的同時增大了編碼單元的最大尺寸，所以圖像壓縮效率可提高。圖13的視頻編碼設備100可對應于以上參照圖1描述的視頻編碼設備10。也就是，在視頻編碼設備10中，當前區(qū)域可指示作為通過將視頻的當前畫面劃分以對視頻進行編碼而獲得編碼單元之一的當前編碼單元。視頻編碼設備10的變換單元確定單元11可將當前畫面劃分為最大編碼單元，可基于根據(jù)深度的編碼單元對每個最大編碼單元執(zhí)行變換，可選擇具有編碼深度的編碼單元(從該編碼深度輸出產(chǎn)生最小誤差的編碼結果)，隨后可確定樹結構的編碼單元。當視頻編碼設備10的變換單元確定單元11基于編碼單元執(zhí)行變換時，變換單元確定單元11可基于變換單元執(zhí)行變換。具體地講，可基于設置最大編碼單元或每個當前編碼單元的變換單元的最大劃分級別來配置可變樹結構的變換單元。視頻編碼設備10的變換單元確定單元11可基于可變樹結構的變換單元來對每個編碼單元執(zhí)行變換，因此可確定作為變換單元的級別的變換深度以及引起最佳編碼結果的編碼單元的編碼深度。因此，變換單元確定單元11可針對每個最大編碼單元確定樹結構的編碼單元以及可變樹結構的變換單元。視頻編碼設備10的輸出單元13可輸出針對每個最大編碼單元根據(jù)樹結構的編碼單元編碼的畫面的編碼數(shù)據(jù)，可對關于樹結構的編碼單元的編碼模式和編碼深度的信息進行編碼，可對變換單元最大劃分信息進行編碼，并且可輸出它們。圖14是根據(jù)本發(fā)明實施例的使用樹結構的編碼單元和可變樹結構的變換單元的視頻編碼設備200的框圖。使用樹結構的編碼單元和可變樹結構的變換單元的視頻編碼設備200包括接收器210、圖像數(shù)據(jù)和編碼信息提取器220以及圖像數(shù)據(jù)解碼器230。下文中，為了便于描述，使用樹結構的編碼單元和可變樹結構的變換單元的視頻編碼設備200被稱為“視頻解碼設備200”。用于視頻解碼設備200的各種操作的各種術語(諸如編碼單元、深度、預測單元、變換單元以及關于各種編碼模式的信息)的定義與以上參照圖13和視頻編碼設備100所描述的術語的定義相同或類似。接收器210接收并解析編碼的視頻的比特流。圖像數(shù)據(jù)和編碼信息提取器220從解析的比特流提取每個編碼單元的編碼圖像數(shù)據(jù)，并將提取的圖像數(shù)據(jù)輸出到圖像數(shù)據(jù)解碼器230，其中，編碼單元具有根據(jù)每個最大編碼單元的樹結構。圖像數(shù)據(jù)和編碼信息提取器220可從關于與當前畫面對應的頭、SPS或圖像參數(shù)集中提取關于當前畫面的編碼單元的最大尺寸的信息。另外，圖像數(shù)據(jù)和編碼信息提取器220從解析的比特流提取關于根據(jù)每個最大編碼單元具有樹結構的編碼單元的編碼深度和編碼模式的信息。提取的關于編碼深度和編碼模式的信息被輸出到圖像數(shù)據(jù)解碼器230。因此，比特流中的圖像數(shù)據(jù)被劃分為最大編碼單元，從而圖像數(shù)據(jù)解碼器230針對每個最大編碼單元對圖像數(shù)據(jù)進行解碼。可針對關于與編碼深度對應的至少一個編碼單元的信息設置關于根據(jù)最大編碼單元的編碼深度和編碼模式的信息。此外，關于編碼模式的信息可包括關于與編碼深度對應的對應編碼單元的分區(qū)類型的信息、關于預測模式的信息以及變換單元的尺寸的信息。另外，根據(jù)深度的劃分信息可被提取作為關于編碼深度的信息。由圖像數(shù)據(jù)和編碼信息提取器220提取的關于根據(jù)每個最大編碼單元的編碼深度和編碼模式的信息是關于這樣的編碼深度和編碼模式的信息，即：所述編碼模式和編碼深度被確定為當編碼器(諸如視頻編碼設備100)根據(jù)每個最大編碼單元針對根據(jù)深度的每個較深層編碼單元重復執(zhí)行編碼時產(chǎn)生最小編碼誤差。因此，視頻解碼設備200可通過根據(jù)產(chǎn)生最小編碼誤差的編碼深度和編碼模式對圖像數(shù)據(jù)進行解碼來恢復圖像。另外，圖像數(shù)據(jù)和編碼信息提取器220可從比特流的頭、SPS或圖像參數(shù)集中提取當前視頻允許的變換單元的最大尺寸信息以及變換單元的最小尺寸信息。圖像數(shù)據(jù)和編碼信息提取器220可提取以上參照圖1至圖12描述的涉及變換單元的變換單元最大劃分信息、變換索引信息、變換單元子劃分信息、分層變換單元模式信息等，作為編碼信息。由于關于編碼深度和編碼模式的編碼信息可被分配給對應的編碼單元、預測單元和最小單元中的預定數(shù)據(jù)單元，因此圖像數(shù)據(jù)和編碼信息提取器220可提取關于根據(jù)預定數(shù)據(jù)單元的編碼深度和編碼模式的信息。被分配有相同的關于編碼深度和編碼模式的信息的預定數(shù)據(jù)單元可被推斷為包括在同一最大編碼單元中的數(shù)據(jù)單元。圖像數(shù)據(jù)解碼器230通過基于關于根據(jù)最大編碼單元的編碼深度和編碼模式的信息，對每個最大編碼單元中的圖像數(shù)據(jù)進行解碼來恢復當前畫面。換而言之，圖像數(shù)據(jù)解碼器230可基于提取的與包括在每個最大編碼單元中的具有樹結構的編碼單元中的每個編碼單元的分區(qū)類型、預測模式和變換單元有關的信息，來對編碼的圖像數(shù)據(jù)進行解碼。解碼處理可包括預測和逆變換中的至少一個，其中，所述預測包括幀內(nèi)預測和運動補償?？筛鶕?jù)逆正交變換或逆整數(shù)變換來執(zhí)行逆變換?；陉P于根據(jù)編碼深度的編碼單元的預測單元的分區(qū)類型和預測模式的信息，圖像數(shù)據(jù)解碼器230可根據(jù)每個編碼單元的分區(qū)和預測模式執(zhí)行幀內(nèi)預測或運動補償。此外，為了根據(jù)最大編碼單元執(zhí)行逆變換，圖像數(shù)據(jù)解碼器230可讀取包括關于根據(jù)編碼深度的編碼單元的變換單元的尺寸信息的樹結構的變換單元，隨后可基于該變換單元對每個編碼單元執(zhí)行逆變換。圖像數(shù)據(jù)解碼器230可基于針對每個編碼單元的變換單元的最大劃分級別來從基礎變換單元確定包括可允許較低級別的可變樹結構的變換單元。圖像數(shù)據(jù)解碼器230可確定具有對變換系數(shù)執(zhí)行逆變換所需的變換深度的變換單元(其中，從可變樹結構的變換單元中確定變換單元)，可對變換系數(shù)執(zhí)行逆變換，因此可恢復像素值。圖像數(shù)據(jù)解碼器230可通過使用根據(jù)深度的劃分信息來確定當前最大變換單元的至少一個編碼深度。如果劃分信息指示圖像數(shù)據(jù)在當前深度不再被劃分，則當前深度是編碼深度。因此，圖像數(shù)據(jù)解碼器230可通過使用關于與編碼深度對應的每個編碼單元的預測單元的分區(qū)類型、預測模式以及變換單元尺寸的信息來對當前最大編碼單元中的與每個編碼深度對應的至少一個編碼單元的編碼數(shù)據(jù)進行解碼，并且輸出當前最大編碼單元的圖像數(shù)據(jù)。換而言之，可通過觀察為編碼單元、預測單元和最小單元中的預定數(shù)據(jù)單元分配的編碼信息集，收集包括編碼信息(所述編碼信息包括相同的劃分信息)的數(shù)據(jù)單元。此外，收集的數(shù)據(jù)單元可被認為是將由圖像數(shù)據(jù)解碼器230以相同編碼模式進行解碼的一個數(shù)據(jù)單元。視頻解碼設備200可獲得與在對每個最大編碼單元遞歸地執(zhí)行編碼時產(chǎn)生最小編碼誤差的至少一個編碼單元有關的信息，并且視頻解碼設備200可使用所述信息來對當前畫面進行解碼。換而言之，可以對在每個最大編碼單元中被確定為最佳編碼單元的具有樹結構的編碼單元進行解碼。另外，可考慮圖像數(shù)據(jù)的分辨率和數(shù)據(jù)量來確定編碼單元的最大尺寸。因此，即使圖像數(shù)據(jù)具有高分辨率和大數(shù)據(jù)量，也可通過使用編碼單元的尺寸和編碼模式對所述圖像數(shù)據(jù)進行有效地解碼和恢復，其中，通過使用從編碼器接收的關于最佳編碼模式的信息，根據(jù)圖像數(shù)據(jù)的特性來自適應地確定編碼單元的尺寸和編碼模式。圖14的視頻解碼設備200可對應于以上參照圖2描述的視頻解碼設備20。也就是，在視頻解碼設備20中，當前區(qū)域可指示作為通過將視頻的當前畫面進行劃分以對視頻編碼而獲得編碼單元之一的當前編碼單元。視頻解碼設備20的提取單元23可從解析的比特流中提取根據(jù)包括在最大編碼單元中的每個中的樹結構的編碼單元而編碼的畫面的編碼數(shù)據(jù)，并且可提取關于用于每個編碼單元的編碼深度和編碼模式的信息。另外，視頻解碼設備20的提取單元23可提取對于每個畫面、每個條帶、每個最大編碼單元或每個編碼單元設置的變換單元最大劃分信息。視頻解碼設備20的解碼單元25可通過使用樹結構的變換單元來對每個最大編碼單元執(zhí)行逆變換。具體地講，解碼單元25可通過使用變換單元(該變換單元從基于變換單元最大劃分信息配置的可變樹結構的變換單元中確定)來執(zhí)行逆變換，可對每個編碼單元中的編碼數(shù)據(jù)進行解碼，因此可恢復畫面。圖15是用于描述根據(jù)本發(fā)明實施例的編碼單元的概念的示圖。可以以寬度×高度來表示編碼單元的尺寸，并且編碼單元的尺寸可以是64×64、32×32、16×16和8×8，盡管應該理解另一實施例不限于此。64×64的編碼單元可被劃分為64×64、64×32、32×64或32×32的分區(qū)，32×32的編碼單元可被劃分為32×32、32×16、16×32或16×16的分區(qū)，16×16的編碼單元可被劃分為16×16、16×8、8×16或8×8的分區(qū)，8×8的編碼單元可被劃分為8×8、8×4、4×8或4×4的分區(qū)。參照圖15，第一視頻數(shù)據(jù)310具有分辨率1920×1080、編碼單元的最大尺寸64以及最大深度2。第二視頻數(shù)據(jù)320具有分辨率1920×1080、編碼單元的最大尺寸64以及最大深度3。第三視頻數(shù)據(jù)330具有分辨率352×288、編碼單元的最大尺寸16以及最大深度1。圖15中示出的最大深度表示從最大編碼單元到最小編碼單元的總劃分次數(shù)。如果分辨率高或者數(shù)據(jù)量大，則編碼單元的最大尺寸可以很大，從而不僅提高編碼效率，還精確地反映圖像的特性。因此，具有比第三視頻數(shù)據(jù)330更高的分辨率的第一視頻數(shù)據(jù)310和第二視頻數(shù)據(jù)320的編碼單元的最大尺寸可以為64。由于第一視頻數(shù)據(jù)310的最大深度是2，所以第一視頻數(shù)據(jù)310的編碼單元315可包括具有64的長軸(longaxis)尺寸的最大編碼單元，還包括由于通過將最大編碼單元劃分兩次使深度加深兩層而具有32和16的長軸尺寸的編碼單元。同時，因為第三視頻數(shù)據(jù)330的最大深度是1，所以第三視頻數(shù)據(jù)330的編碼單元335可包括具有16的長軸尺寸的最大編碼單元，還包括由于通過將最大編碼單元劃分一次使深度加深一層而具有8的長軸尺寸的編碼單元。因為第二視頻數(shù)據(jù)320的最大深度是3，所以第二視頻數(shù)據(jù)320的編碼單元325可包括具有64的長軸尺寸的最大編碼單元，以及由于通過將最大編碼單元劃分三次使深度加深3層而具有32、16和8的長軸尺寸的編碼單元。隨著深度加深(即，增加)，詳細信息可被精確地表示。圖16是根據(jù)本發(fā)明實施例的基于編碼單元的圖像編碼器400的框圖。參照圖16，圖像編碼器400執(zhí)行視頻編碼設備100的編碼單元確定器120的操作，以對圖像數(shù)據(jù)進行編碼。例如，幀內(nèi)預測器410對當前幀405中的幀內(nèi)模式的編碼單元執(zhí)行幀內(nèi)預測，運動估計器420和運動補償器425通過使用當前幀405和參考幀495，對當前幀405中的幀間模式的編碼單元分別執(zhí)行幀間估計和運動補償。從幀內(nèi)預測器410、運動估計器420和運動補償器425輸出的數(shù)據(jù)通過變換器430和量化器440被輸出為量化的變換系數(shù)。量化的變換系數(shù)通過反量化器460和逆變換器470被恢復為空間域中的數(shù)據(jù)?；謴偷目臻g域中的數(shù)據(jù)在通過去塊單元480和環(huán)路濾波單元490進行后處理之后，被輸出為參考幀495。量化的變換系數(shù)可通過熵編碼器450被輸出為比特流455。為了在視頻編碼設備100中應用圖像編碼器400，圖像編碼器400的部件(即，幀內(nèi)預測器410、運動估計器420、運動補償器425、變換器430、量化器440、熵編碼器450、反量化器460、逆變換器470、去塊單元480和環(huán)路濾波器490)在考慮每個最大編碼單元的最大深度的同時，基于具有樹結構的編碼單元中的每個編碼單元執(zhí)行操作。具體地說，幀內(nèi)預測器410、運動估計器420以及運動補償器425在考慮當前最大編碼單元的最大尺寸和最大深度的同時，確定具有樹結構的編碼單元中的每個編碼單元的分區(qū)和預測模式，變換器430確定在具有樹結構的編碼單元中的每個編碼單元中的變換單元的尺寸。圖17是根據(jù)本發(fā)明實施例的基于編碼單元的圖像解碼器500的框圖。參照圖17，解析器510從比特流505解析將被解碼的編碼圖像數(shù)據(jù)和用于解碼的關于編碼的信息。編碼圖像數(shù)據(jù)通過熵解碼器520和反量化器530被輸出為反量化的數(shù)據(jù)，并且反量化的數(shù)據(jù)通過逆變換器540被恢復為空間域中的圖像數(shù)據(jù)。幀內(nèi)預測器550針對空間域中的圖像數(shù)據(jù)，對幀內(nèi)模式的編碼單元執(zhí)行幀內(nèi)預測，運動補償器560通過使用參考幀585，對幀間模式的編碼單元執(zhí)行運動補償。經(jīng)過幀內(nèi)預測器550和運動補償器560的空間域中的圖像數(shù)據(jù)可在通過去塊單元570和環(huán)路濾波單元580進行后處理之后，被輸出為恢復的幀595。另外，通過去塊單元570和環(huán)路濾波單元580進行后處理的圖像數(shù)據(jù)可被輸出為參考幀585。為了在視頻解碼設備200的圖像數(shù)據(jù)解碼器230中對圖像數(shù)據(jù)進行解碼，圖像解碼器500可執(zhí)行在解析器510之后執(zhí)行的操作。為了在視頻解碼設備200中應用圖像解碼器500，圖像解碼器500的部件(即，解析器510、熵解碼器520、反量化器530、逆變換器540、幀內(nèi)預測器550、運動補償器560、去塊單元570以及循環(huán)濾波單元580)針對每個最大編碼單元基于具有樹結構的編碼單元來執(zhí)行操作。具體地說，幀內(nèi)預測器550和運動補償器560需要確定具有樹結構的編碼單元中的每個編碼單元的分區(qū)和預測模式，逆變換器540需要確定每個編碼單元的變換單元的尺寸。圖18是根據(jù)本發(fā)明實施例的根據(jù)深度的較深層編碼單元和分區(qū)的示圖。視頻編碼設備100和視頻解碼設備200使用分層的編碼單元以考慮圖像的特性?？筛鶕?jù)圖像的特性自適應地確定編碼單元的最大高度、最大寬度和最大深度，或可由用戶不同地設置編碼單元的最大高度、最大寬度和最大深度。可根據(jù)編碼單元的預定最大尺寸來確定根據(jù)深度的較深層編碼單元的尺寸。在編碼單元的分層結構600中，編碼單元的最大高度和最大寬度都是64，最大深度是4。這里，最大深度指示從最大編碼單元到最小編碼單元的總劃分次數(shù)。由于深度沿著分層結構600的垂直軸加深(即，增加)，因此較深層編碼單元的高度和寬度均被劃分。此外，沿分層結構600的水平軸示出了作為用于每個較深層編碼單元的預測編碼的基礎的預測單元和分區(qū)。例如，第一編碼單元610是分層結構600中的最大編碼單元，其中，其深度是0，尺寸(即高度×寬度)是64×64。深度沿著垂直軸加深，從而分層結構600包括尺寸為32×32且深度為1的第二編碼單元620、尺寸為16×16且深度為2的第三編碼單元630、尺寸為8×8且深度為3的第四編碼單元640。尺寸為8×8且深度為3的編碼單元640是最小編碼單元。編碼單元610、620、630和640的預測單元和分區(qū)根據(jù)每個深度沿著水平軸布置。換而言之，如果尺寸為64×64且深度為0的第一編碼單元610是預測單元，則所述預測單元可被劃分為包括在第一編碼單元610中的分區(qū)，即：尺寸為64×64的分區(qū)610、尺寸為64×32的分區(qū)612、尺寸為32×64的分區(qū)614或尺寸為32×32的分區(qū)616。類似地，尺寸為32×32且深度為1的第二編碼單元620的預測單元可以被劃分為包括在第二編碼單元620中的分區(qū)，即：尺寸為32×32的分區(qū)620、尺寸為32×16的分區(qū)622、尺寸為16×32的分區(qū)624和尺寸為16×16的分區(qū)626。類似地，尺寸為16×16且深度為2的第三編碼單元630的預測單元可以被劃分為包括在第三編碼單元630中的分區(qū)，即：包括在第三編碼單元630中的尺寸為16×16的分區(qū)、尺寸為16×8的分區(qū)632、尺寸為8×16的分區(qū)634和尺寸為8×8的分區(qū)636。類似地，尺寸為8×8且深度為3的第四編碼單元640的預測單元可以被劃分為包括在第四編碼單元640中的分區(qū)，即：包括在第四編碼單元640中的尺寸為8×8的分區(qū)、尺寸為8×4的分區(qū)642、尺寸為4×8的分區(qū)644和尺寸為4×4的分區(qū)646。為了確定最大編碼單元610的編碼單元的至少一個編碼深度，需要視頻編碼設備100的編碼單元確定器120對包括在最大編碼單元610中的與每個深度對應的編碼單元執(zhí)行編碼。隨著深度加深，包括相同范圍和相同尺寸的數(shù)據(jù)的根據(jù)深度的較深層編碼單元的總數(shù)增加。例如，需要4個與深度2對應的編碼單元以覆蓋與深度1對應的一個編碼單元中包括的數(shù)據(jù)。因此，為了比較根據(jù)深度的相同數(shù)據(jù)的編碼結果，與深度1對應的編碼單元和與深度2對應的四個編碼單元均被編碼。為了對深度中的當前深度執(zhí)行編碼，可通過沿著分層結構600的水平軸對與當前深度對應的編碼單元中的每個預測單元執(zhí)行編碼來針對當前深度選擇最小編碼誤差。可選擇地，可通過隨著深度沿分層結構600的垂直軸加深對每個深度執(zhí)行編碼來比較根據(jù)深度的最小編碼誤差，從而搜索最小編碼誤差。第一編碼單元610中具有最小編碼誤差的深度和分區(qū)可被選擇為第一編碼單元610的編碼深度和分區(qū)類型。圖19是描述根據(jù)本發(fā)明實施例的編碼單元710和變換單元720之間的關系的示圖。針對每個最大編碼單元，視頻編碼設備100和視頻解碼設備200根據(jù)具有小于或等于最大編碼單元的尺寸的編碼單元對圖像分別進行編碼和解碼。可基于不大于對應編碼單元的數(shù)據(jù)單元來選擇編碼期間用于變換的變換單元的尺寸。例如，在視頻編碼設備100中，如果編碼單元710的尺寸是64×64，則可通過使用尺寸為32×32的變換單元720來執(zhí)行變換。此外，可通過對尺寸為小于64×64的32×32、16×16、8×8和4×4的變換單元中的每一個執(zhí)行變換來對尺寸為64×64的編碼單元710的數(shù)據(jù)進行編碼，然后可選擇具有最小編碼誤差的變換單元。圖20是用于描述根據(jù)本發(fā)明實施例的對應于編碼深度的編碼單元的編碼信息的示圖。視頻編碼設備100的輸出單元130可將與編碼深度對應的每個編碼單元的關于分區(qū)類型的第一信息800、關于預測模式的第二信息810和關于變換單元的尺寸的第三信息820編碼為關于編碼模式的信息，并將其發(fā)送。第一信息800表示關于通過劃分當前編碼單元的預測單元而獲得的分區(qū)的形狀的信息，其中，所述分區(qū)是用于對當前編碼單元進行預測編碼的數(shù)據(jù)單元。例如，尺寸為2N×2N的當前編碼單元CU_0可被劃分為尺寸為2N×2N的分區(qū)802、尺寸為2N×N的分區(qū)804、尺寸為N×2N的分區(qū)806和尺寸為N×N的分區(qū)808中的任意一個。這里，關于分區(qū)類型的第一信息800被設置為表示尺寸為2N×N的分區(qū)804、尺寸為N×2N的分區(qū)806和尺寸為N×N的分區(qū)808中的一個。第二信息810表示每個分區(qū)的預測模式。例如，第二信息810可表示對由第一信息800表示的分區(qū)執(zhí)行的預測編碼的模式，即：幀內(nèi)模式812、幀間模式814或跳過模式816。第三信息820表示當對當前編碼單元執(zhí)行變換時將作為基礎的變換單元。例如，變換單元可以是第一幀內(nèi)變換單元822、第二幀內(nèi)變換單元824、第一幀間變換單元826或第二幀間變換單元828。視頻解碼設備200的圖像數(shù)據(jù)和編碼信息提取器220可根據(jù)每個較深層編碼單元提取和使用用于解碼的信息800、810和820。圖21是根據(jù)本發(fā)明實施例的根據(jù)深度的較深層編碼單元的示圖。劃分信息可被用于表示深度的改變。劃分信息表示當前深度的編碼單元是否被劃分為更低深度的編碼單元。用于對深度為0且尺寸為2N_0×2N_0的編碼單元900進行預測編碼的預測單元910可包括尺寸為2N_0×2N_0的分區(qū)類型912的分區(qū)、尺寸為2N_0×N_0的分區(qū)類型914的分區(qū)、尺寸為N_0×2N_0的分區(qū)類型916的分區(qū)和尺寸為N_0×N_0的分區(qū)類型918的分區(qū)。圖9只示出了通過對稱地劃分預測單元910獲得的分區(qū)類型912至分區(qū)類型918，但是應該理解在另一實施例中分區(qū)類型不限于此。例如，預測單元910的分區(qū)可包括非對稱分區(qū)、具有預定形狀的分區(qū)和具有幾何形狀的分區(qū)。根據(jù)每個分區(qū)類型，可對尺寸為2N_0×2N_0的一個分區(qū)、尺寸為2N_0×N_0的兩個分區(qū)、尺寸為N_0×2N_0的兩個分區(qū)、尺寸為N_0×N_0的四個分區(qū)重復地執(zhí)行預測編碼?？蓪Τ叽鐬?N_0×2N_0、N_0×2N_0、2N_0×N_0和N_0×N_0的分區(qū)執(zhí)行幀內(nèi)模式下和幀間模式下的預測編碼。僅對尺寸為2N_0×2N_0的分區(qū)執(zhí)行跳過模式下的預測編碼。對包括在分區(qū)類型912至分區(qū)類型916中的預測編碼的編碼的誤差進行比較，并且在多個分區(qū)類型之間確定最小編碼誤差。如果在分區(qū)類型912至分區(qū)類型916之一中，編碼誤差最小，則預測單元910可不被劃分為更低深度。如果在分區(qū)類型918中編碼誤差最小，則在操作920，深度從0改變?yōu)?以劃分分區(qū)類型918，并對深度為2且尺寸為N_0×N_0的編碼單元930重復執(zhí)行編碼以搜索最小編碼誤差。用于對深度為1且尺寸為2N_1×2N_1(＝N_0×N_0)的編碼單元930進行預測編碼的預測單元940可包括尺寸為2N_1×2N_1的分區(qū)類型942的分區(qū)、尺寸為2N_1×N_1的分區(qū)類型944的分區(qū)、尺寸為N_1×2N_1的分區(qū)類型946的分區(qū)和尺寸為N_1×N_1的分區(qū)類型948的分區(qū)。如果在分區(qū)類型948中編碼誤差最小，則在操作950，深度從1改變?yōu)?以劃分分區(qū)類型948，并對深度為2且尺寸為N_2×N_2的編碼單元960重復執(zhí)行編碼以搜索最小編碼誤差。當最大深度為d時，根據(jù)每個深度的編碼單元可被執(zhí)行直到當深度變?yōu)閐-1，并且劃分信息可被編碼直到當深度為0至d-2中的一個。例如，當在操作970將與深度d-2對應的編碼單元劃分之后，執(zhí)行編碼直到當深度為d-1時，用于對深度為d-1且尺寸為2N_(d-1)×2N_(d-1)的編碼單元980進行預測編碼的預測單元990可包括尺寸為2N_(d-1)×2N_(d-1)的分區(qū)類型992的分區(qū)、尺寸為2N_(d-1)×N_(d-1)的分區(qū)類型994的分區(qū)、尺寸為N_(d-1)×2N_(d-1)的分區(qū)類型996的分區(qū)以及尺寸為N_(d-1)×N_(d-1)的分區(qū)類型998的分區(qū)?？蓪Ψ謪^(qū)類型992至分區(qū)類型998中的尺寸為2N_(d-1)×2N_(d-1)的一個分區(qū)、尺寸為2N_(d-1)×N_(d-1)的兩個分區(qū)、尺寸為N_(d-1)×2N_(d-1)的兩個分區(qū)、尺寸為N_(d-1)×N_(d-1)的四個分區(qū)重復執(zhí)行預測編碼，以搜索具有最小編碼誤差的分區(qū)類型。即使當分區(qū)類型998具有最小編碼誤差時，由于最大深度為d，所以深度為d-1的編碼單元CU_(d-1)不再被劃分為更低深度，當前最大編碼單元900的編碼單元的編碼深度被確定為d-1，并且當前最大編碼單元900的分區(qū)類型可被確定為N_(d-1)×N_(d-1)。此外，由于最大深度為d，并且最低深度為d-1的最小編碼單元980不再被劃分為更低深度，所以不設置最小編碼單元980的劃分信息。數(shù)據(jù)單元999可被認為是用于當前最大編碼單元的最小單元。最小單元可以是通過將最小編碼單元980劃分為4部分而獲得的矩形數(shù)據(jù)單元。通過重復地執(zhí)行編碼，視頻編碼設備100可通過對根據(jù)編碼單元900的深度的編碼誤差進行比較來選擇具有最小編碼誤差的深度以確定編碼深度，并且可將對應的分區(qū)類型和預測模式設置為編碼深度的編碼模式。這樣，在深度1至深度d的所有深度中對根據(jù)深度的最小編碼誤差進行比較，并且可將具有最小編碼誤差的深度確定為編碼深度?？蓪⒕幋a深度、預測單元的分區(qū)類型、預測模式中的至少一個編碼為關于編碼模式的信息并將其發(fā)送。此外，由于從深度0至編碼深度來劃分編碼單元，所以只有編碼深度的劃分信息被設置為0，并且除了編碼深度之外的深度的劃分信息被設置為1。視頻解碼設備200的圖像數(shù)據(jù)和編碼信息提取器220可提取并使用關于編碼單元900的編碼深度和預測單元的信息，以對分區(qū)912進行解碼。視頻解碼設備200可通過使用根據(jù)深度的劃分信息將劃分信息為0的深度確定為編碼深度，并可使用關于對應深度的編碼模式的信息，以用于解碼。圖22到圖24是用于描述根據(jù)本發(fā)明實施例的編碼單元1010、預測單元1060和變換單元1070之間的關系的示圖。編碼單元1010是最大編碼單元中的與由視頻編碼設備100確定的編碼深度對應的具有樹結構的編碼單元。預測單元1060是每個編碼單元1010的預測單元的分區(qū)，變換單元1070是每個編碼單元1010的變換單元。當編碼單元1010中的最大編碼單元的深度為0時，編碼單元1012和1054的深度為1，編碼單元1014、1016、1018、1028、1050和1052的深度為2，編碼單元1020、1022、1024、1026、1030、1032和1048的深度為3，編碼單元1040、1042、1044和1046的深度為4。在預測單元1060中，通過在編碼單元1010中劃分編碼單元來獲得一些編碼單元1014、1016、1022、1032、1048、1050、1052和1054。例如，編碼單元1014、1022、1050和1054中的分區(qū)類型的尺寸為2N×N，編碼單元1016、1048和1052的分區(qū)類型的尺寸為N×2N，編碼單元1032的分區(qū)類型的尺寸為N×N。編碼單元1010的預測單元和分區(qū)小于或等于每個編碼單元。以小于編碼單元1052的數(shù)據(jù)單元對變換單元1070中的編碼單元1052的圖像數(shù)據(jù)執(zhí)行變換或逆變換。另外，變換單元1070中的編碼單元1014、1016、1022、1032、1048、1050和1052與預測單元1060中的那些編碼單元在尺寸和形狀上不同。例如，視頻編碼設備100和視頻解碼設備200可對相同的編碼單元中的數(shù)據(jù)單元單獨地執(zhí)行幀內(nèi)預測、運動估計、運動補償、變換和逆變換。因此，對最大編碼單元的每個區(qū)域中具有分層結構的編碼單元中的每個編碼單元遞歸地執(zhí)行編碼以確定最佳編碼單元，因此可獲得具有遞歸樹結構的編碼單元。編碼信息可包括關于編碼單元的劃分信息、關于分區(qū)類型的信息、關于預測模式的信息以及關于變換單元的尺寸的信息。表1示出了可由視頻編碼設備100和視頻解碼設備200設置的編碼信息?！颈?】視頻編碼設備100的輸出單元130可輸出關于具有樹結構的編碼單元的編碼信息，并且視頻解碼設備200的圖像數(shù)據(jù)和提取單元220可從接收的比特流提取關于具有樹結構的編碼單元的編碼信息。劃分信息指示當前編碼單元是否被劃分為更低深度的多個編碼單元。如果當前深度d的劃分信息是0，則當前編碼單元不再被劃分為更低深度的深度是編碼深度，因此可針對編碼深度定義關于分區(qū)類型、預測模式以及變換單元的尺寸的信息。如果當前編碼單元根據(jù)劃分信息被進一步劃分，則對更低深度的四個劃分編碼單元獨立地執(zhí)行編碼。預測模式可以是幀內(nèi)模式、幀間模式和跳過模式中的一個?？稍谒蟹謪^(qū)類型中定義幀內(nèi)模式和幀間模式，并且可僅在具有尺寸2N×2N的分區(qū)類型定義跳過模式。關于分區(qū)類型的信息可指示通過對稱地劃分預測單元的高度和寬度中的至少一個而獲得的具有尺寸2N×2N、2N×N、N×2N和N×N的對稱分區(qū)類型、以及通過不對稱地劃分預測單元的高度和寬度中的至少一個而獲得的具有尺寸2N×nU、2N×nD、nL×2N和nR×2N的多個不對稱分區(qū)類型?？赏ㄟ^以1:3和3:1劃分預測單元的高度來分別地獲得具有尺寸2N×nU和2N×nD的不對稱分區(qū)類型，可通過以1:3和3:1劃分預測單元的寬度來分別地獲得具有尺寸nL×2N和nR×2N的不對稱分區(qū)類型。變換單元的尺寸可被設置為幀內(nèi)模式的兩種類型和幀間模式的兩種類型。例如，如果變換單元的劃分信息是0，則變換單元的尺寸可以是作為當前編碼單元的尺寸的2N×2N。如果變換單元的劃分信息是1，則可通過劃分當前編碼單元來獲得變換單元。另外，如果具有尺寸2N×2N的當前編碼單元的分區(qū)類型是對稱分區(qū)類型，則變換單元的尺寸可以是N×N，如果當前編碼單元的分區(qū)類型是不對稱分區(qū)類型，則變換單元的尺寸可以是N/2×N/2。關于具有樹結構的編碼單元的編碼信息可包括與編碼深度對應的編碼單元、預測單元以及最小單元中的至少一個。與編碼深度對應的編碼單元可包括包含相同編碼信息的最小單元和預測單元中的至少一個。因此，通過比較相鄰數(shù)據(jù)單元的編碼信息來確定相鄰數(shù)據(jù)單元是否包括在與編碼深度對應的相同編碼單元中。另外，通過使用數(shù)據(jù)單元的編碼信息來確定與編碼深度對應的對應編碼單元，因此可確定最大編碼單元中的編碼深度的分布。因此，如果基于相鄰數(shù)據(jù)單元的編碼信息來預測當前編碼單元，則可直接參考和使用與當前編碼單元相鄰的較深層編碼單元中的數(shù)據(jù)單元的編碼信息。在另一實施例中，如果基于相鄰數(shù)據(jù)單元的編碼信息來預測當前編碼單元，則使用所述數(shù)據(jù)單元的編碼信息來搜索與當前編碼單元相鄰的數(shù)據(jù)單元，并且可參考搜索到的相鄰編碼單元來預測當前編碼單元。圖25是根據(jù)本發(fā)明實施例的用于描述根據(jù)表1的編碼模式信息的編碼單元、預測單元或分區(qū)以及變換單元之間的關系的示圖。最大編碼單元1300包括多種編碼深度的編碼單元1302、1304、1306、1312、1314、1316和1318。這里，由于編碼單元1318是編碼深度的編碼單元，所以劃分信息可被設置為0。關于尺寸為2N×2N的編碼單元1318的分區(qū)類型的信息可被設置為尺寸為2N×2N的分區(qū)類型1322、尺寸為2N×N的分區(qū)類型1324、尺寸為N×2N的分區(qū)類型1326、尺寸為N×N的分區(qū)類型1328、尺寸為2N×nU的分區(qū)類型1332、尺寸為2N×nD的分區(qū)類型1334、尺寸為nL×2N的分區(qū)類型1336或尺寸為nR×2N的分區(qū)類型1338。變換單元劃分信息TU尺寸標志可以是變換索引之一，并且與變換索引對應的變換單元的尺寸可根據(jù)編碼單元的預測單元類型或分區(qū)類型而改變。例如，當分區(qū)類型被設置為對稱(即，分區(qū)類型1322、1324、1326或1328)時，如果變換單元劃分信息為0，則設置尺寸為2N×2N的變換單元1342，如果變換單元劃分信息為1，則設置尺寸為N×N的變換單元1344。當分區(qū)類型被設置為非對稱(即，分區(qū)類型1332、1334、1336或1338)時，如果變換單元劃分信息為0，則設置尺寸為2N×2N的變換單元1352，如果變換單元劃分信息為1，則設置尺寸為N/2×N/2的變換單元1354。參照圖21，變換單元劃分信息TU尺寸標志是具有值0或1的標志，但是應該理解另一實施例不限于1比特標志，并且在另一實施例中在變換單元劃分信息從0開始增加時，變換單元可被具有樹結構地分層劃分。變換單元劃分信息可被用作變換索引的實施例。在這種情況下，當變換單元索引信息與變換單元的最大尺寸和變換單元的最小尺寸一起使用時，實際使用的變換單元的尺寸可被表示。視頻編碼設備100可對最大變換單元的尺寸信息、最小變換單元的尺寸信息以及變換單元的最大劃分信息進行編碼。編碼的最大變換單元的尺寸信息、編碼的最小變換單元的尺寸信息以及變換單元的最大劃分信息可被插入SPS中。視頻解碼設備200可通過使用最大變換單元的尺寸信息、最小變換單元的尺寸信息以及變換單元的最大劃分信息來執(zhí)行視頻解碼。例如，當當前編碼單元具有尺寸64×64，最大變換單元具有尺寸32×32并且變換單元劃分信息是0時，變換單元可被設置為具有尺寸32×32。當當前編碼單元具有尺寸64×64，最大變換單元具有尺寸32×32并且變換單元劃分信息是1時，變換單元可被設置為具有尺寸16×16。當當前編碼單元具有尺寸64×64，最大變換單元具有尺寸32×32并且變換單元劃分信息是2時，變換單元可被設置為具有尺寸8×8。例如，當當前編碼單元具有尺寸32×32，最小變換具有尺寸32×32并且變換單元劃分信息是0時，變換單元可被設置為具有尺寸32×32。由于變換單元的尺寸不能小于32×32，因此變換單元劃分信息不能被設置。例如，當當前編碼單元具有尺寸64×64，變換單元的最大劃分信息是1時，變換單元劃分信息可以是0或1，并且其他變換單元劃分信息不能被設置。因此，當變換單元的最大劃分信息被定義為“MaxTransformSizeIndex”，最小變換單元的尺寸被定義為“MinTransformSize”并且變換單元的尺寸在變換單元劃分信息是0時被定義為“RootTuSize”時，當前編碼單元中可能的最小變換單元尺寸“CurrMinTuSize”可被定義為下面的關系等式(1)：CurrMinTuSize＝max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex))...(1)與當前編碼單元中可能的最小變換單元尺寸“CurrMinTuSize”相比，當TU尺寸標志是0時的變換單元尺寸“RootTuSize”可表示可由系統(tǒng)采用的最大變換單元尺寸。換句話說，根據(jù)關系等式(1)，由于“RootTuSize/(2^MaxTransformSizeIndex)”表示通過按照與變換單元的最大劃分信息對應的次數(shù)劃分當變換單元劃分信息是0時的變換單元尺寸“RootTuSize”而獲得的變換單元尺寸，“MinTransformSize”表示最小變換單元尺寸，兩個尺寸中的較小尺寸可以是在當前編碼單元中可能的最小變換單元尺寸“CurrMinTuSize”。當前最大變換單元尺寸RootTuSize可根據(jù)預測模式的類型而改變。例如，當當前預測模式是幀間模式時，RootTuSize可根據(jù)以下的關系等式(2)而被確定，其中，“MaxTransformSize”指示最大變換單元尺寸，“PUSize”指示當前預測單元尺寸：RootTuSize＝min(MaxTransformSize,PUSize).........(2)換句話說，當當前預測模式是幀間模式時，當變換單元劃分信息是0的變換單元尺寸“RootTuSize”可被設置為最大變換單元尺寸和當前預測單元尺寸中的較小的尺寸。當當前預測模式是幀內(nèi)模式時，“RootTuSize”可根據(jù)以下的關系等式(3)而被確定，其中，“PartitionSize”指示當前預測單元的尺寸：RootTuSize＝min(MaxTransformSize,PartitionSize)...........(3)換句話說，當當前預測模式是幀內(nèi)模式時，當變換單元劃分信息是0的變換單元尺寸“RootTuSize”可被設置為最大變換單元尺寸和當前預測單元尺寸中的較小的尺寸。然而，應該注意根據(jù)分區(qū)單元的預測模式改變的當前最大變換單元尺寸“RootTuSize”僅是實施例，并且用于確定當前最大變換單元尺寸“RootTuSize”的因素不限于該實施例。圖26是示出根據(jù)本發(fā)明實施例的使用樹結構的編碼單元和可變樹結構的變換單元的視頻編碼方法的流程圖。在操作1210，當前畫面被劃分為至少一個最大編碼單元?？深A先設置指示可能的總劃分次數(shù)的最大深度。在操作1220，對通過根據(jù)深度劃分最大編碼單元的區(qū)域而獲得的至少一個劃分區(qū)域進行編碼，從而對于至少一個劃分區(qū)域的每個劃分區(qū)域確定用于輸出最終編碼結果的編碼深度，并且確定樹結構的編碼單元和可變樹結構的變換單元。每當深度加深時，最大編碼單元在空間上被劃分，因此被劃分為更低深度的編碼單元。每個編碼單元可通過與相鄰編碼單元獨立地在空間上被劃分而被劃分為另一更低深度的編碼單元。根據(jù)深度對每個編碼單元重復地執(zhí)行編碼。另外，對于每個較深層編碼單元確定具有最小編碼誤差的分區(qū)類型和變換單元。為了在每個最大編碼單元中確定具有最小編碼誤差的編碼深度，可在根據(jù)深度的所有較深層編碼單元中測量和比較編碼誤差。當每個編碼單元被確定時，用于編碼單元的變換的變換單元可被確定。該變換單元可被確定為使得通過對編碼單元進行編號引起的誤差最小化的數(shù)據(jù)單元。作為根據(jù)在當前編碼單元中根據(jù)變換深度的級別執(zhí)行變換的結果，可確定這樣的樹結構的變換單元，其中，所述樹結構的變換單元獨立于相鄰區(qū)域中的另一變換單元并且在相同區(qū)域中形成具有根據(jù)深度的變換單元的分層結構。另外，對于每個最大編碼單元或者每個編碼單元可預先設置變換單元的最大劃分級別。根據(jù)當前編碼單元的最大劃分級別，可通過使用包括當前編碼單元允許的基礎變換單元至最小變換單元的可變樹結構的變換單元來執(zhí)行變換。可針對當前編碼單元從可變樹結構的變換單元確定具有輸出具有最小誤差的編碼結果的變換深度的變換單元，從而可確定樹結構的變換單元。在操作1230，作為每個最大編碼單元的至少一個劃分區(qū)域的編碼的最終結果的圖像數(shù)據(jù)與關于編碼深度和編碼模式的編碼信息一起被輸出。關于編碼模式的編碼信息可包括關于編碼深度的信息或劃分信息、關于預測單元的分區(qū)類型的信息、預測模式以及變換單元分層結構信息。關于編碼模式的編碼信息可與編碼的圖像數(shù)據(jù)一起被發(fā)送到解碼器。圖27是示出根據(jù)本發(fā)明實施例的使用樹結構的編碼單元和可變樹結構的變換單元的視頻解碼方法的流程圖。在操作1310，接收和解析編碼的視頻的比特流。在操作1320，從解析的比特流中獲取分配給最大編碼單元的當前畫面的編碼的圖像數(shù)據(jù)，并且從解析的比特流中提取關于根據(jù)最大編碼單元的編碼深度和編碼模式的信息。每個最大編碼單元的編碼深度是在每個最大編碼單元中具有最小編碼誤差的深度。在對每個最大編碼單元的編碼中，基于通過根據(jù)深度分層地劃分每個最大編碼單元獲得的至少一個數(shù)據(jù)單元來對圖像數(shù)據(jù)編碼。根據(jù)關于編碼深度和編碼模式的信息，最大編碼單元可被劃分為具有樹結構的編碼單元。具有樹結構的編碼單元的每個編碼單元被確定為與編碼深度對應的編碼單元，并且被最優(yōu)編碼以輸出最小編碼誤差。因此，可通過在根據(jù)編碼單元確定至少一個編碼深度之后在具有樹結構的編碼單元對每條編碼的圖像數(shù)據(jù)進行解碼，來提高圖像的編碼效率和解碼效率。另外，根據(jù)提取的變換單元分層結構信息，可在編碼單元中確定樹結構的變換單元。例如，可基于變換單元最大劃分信息來讀取從當前編碼單元允許的基礎變換單元到最低級別的變換的級別的總數(shù)?？蛇x擇地，可基于在編碼系統(tǒng)和解碼系統(tǒng)之間預先設置的最大劃分級別來確定從基礎變換單元到最低級別的變換單元之間的級別的總數(shù)。可基于預設方案根據(jù)編碼模式來不同地確定基礎變換單元。因此，可基于變換單元最大劃分信息來確定關于當前編碼單元的可變樹結構的變換單元，可從可變樹結構的變換單元確定將用于針對當前編碼單元的逆變換的具有變換深度的變換單元。在操作1330，基于根據(jù)最大編碼單元的關于編碼深度和編碼模式的信息來對每個最大編碼單元的編碼的圖像數(shù)據(jù)進行解碼。在這點上，可通過使用從可變樹結構的變換單元中確定的變換單元來對當前編碼單元執(zhí)行逆變換，同時基于關于編碼深度和編碼模式的信息來對當前編碼單元執(zhí)行解碼。由于對每個編碼單元和每個最大編碼單元執(zhí)行解碼，因此空間區(qū)域的圖像數(shù)據(jù)可被恢復并且隨后畫面和作為畫面序列的視頻可被恢復?；謴偷囊曨l可由再現(xiàn)設備再現(xiàn)、可被存儲在存儲介質(zhì)中或者可經(jīng)由網(wǎng)絡被發(fā)送。本發(fā)明實施例可被編寫作計算機程序并且可被實現(xiàn)在使用計算機可讀記錄介質(zhì)執(zhí)行程序的通用數(shù)字計算機中。此外，用于本發(fā)明實施例的數(shù)據(jù)結構可通過各種手段被編寫在計算機可讀記錄介質(zhì)中。計算機可讀記錄介質(zhì)的示例包括磁存儲介質(zhì)(諸如，ROM、軟盤、硬盤等)、光記錄介質(zhì)(諸如，CD-ROM或DVD)等。盡管已經(jīng)參照本發(fā)明的示例性實施例具體顯示和描述了本發(fā)明，但是本領域的普通技術人員將理解，在不脫離由權利要求限定的本發(fā)明的精神和范圍的情況下，可在其中做出形式和細節(jié)上的各種改變。示例性實施例應被僅被認為描述性意義，而不是限制的目的。因此，本發(fā)明的范圍不是由本發(fā)明的詳細描述來限定而是由權利要求來限定，并且該范圍內(nèi)的所有差別將被解釋為包括在本發(fā)明中。

完整全部詳細技術資料下載

當前第1頁1 2 3