專利名稱:通過使用大變換單元對圖像進行編碼和解碼的方法和設備的制作方法
技術(shù)領(lǐng)域:
示例性實施例涉及一種用于對圖像進行編碼和解碼的方法和設備,更具體地講,涉及一種用于通過將像素域圖像變換為頻域的系數(shù)對圖像進行編碼和解碼的方法和設備。
背景技術(shù):
在用于對圖像進行編碼和解碼的大多數(shù)方法和設備中,像素域的圖像被變換到頻域,并且變換后的圖像被編碼以壓縮圖像。離散余弦變換(DCT)是用于對音頻/視頻(AV)數(shù)據(jù)壓縮的公知技術(shù)。近年,己進行了找尋更有效編碼方法的許多嘗試。在音頻編碼中,參數(shù)編碼比DCT執(zhí)行得更好,并且在二維數(shù)據(jù)中,Karhunen Loeve變換(KLT)具有最小的比特大小但具有大開銷(overhead)大小。
發(fā)明內(nèi)容
技術(shù)方案示例性實施例提供一種用于通過使用有效變換對圖像進行編碼和解碼的方法和設備,以及其上記錄有用于執(zhí)行編碼和解碼的計算機程序的計算機可讀記錄介質(zhì)。有益效果根據(jù)示例性實施例,由于變換單元可被設置為具有比預測單元更大的尺寸,并且可對所述變換單元執(zhí)行變換,因此可對圖像進行更有效地壓縮和編碼,。
通過參照附圖描述特定示例性實施例,以上和/或其他方面將變得更加清楚,其中圖I是根據(jù)示例性實施例的用于對圖像進行編碼的設備的框圖;圖2是根據(jù)示例性實施例的用于對圖像進行解碼的設備的框圖;圖3示出根據(jù)示例性實施例的分層編碼單元;圖4是根據(jù)示例性實施例的基于編碼單元的圖像編碼器的框圖;圖5是根據(jù)示例性實施例的基于編碼單元的圖像解碼器的框圖;圖6示出根據(jù)示例性實施例的最大編碼單元、子編碼單元和預測單元;圖7示出根據(jù)示例性實施例的編碼單元和變換單元;圖8a、圖8b、圖8c和圖8d示出根據(jù)示例性實施例的編碼單元、預測單元和變換單元的劃分形狀;圖9是根據(jù)另一示例性實施例的用于對圖像進行編碼的設備的框圖;圖10是根據(jù)示例性實施例的用于描述預測方法的示圖;圖11是根據(jù)示例性實施例的變換器的框圖;圖12a到圖12c是根據(jù)示例性實施例的變換單元的類型的示圖;圖13a到圖13d是根據(jù)其他示例性實施例的變換單元的類型的示圖14是根據(jù)示例性實施例的不同變換單元的示圖;圖15是根據(jù)另一示例性實施例的用于對圖像進行解碼的設備的框圖;圖16是示出根據(jù)示例性實施例的對圖像進行編碼的方法的流程圖;
圖17是示出根據(jù)示例性實施例的對圖像進行解碼的方法的流程圖。最佳實施方式根據(jù)示例性實施例的一方面,提供一種對圖像進行編碼的方法,所述方法包括對圖像的多個編碼單元執(zhí)行預測,并基于預測的多個編碼單元產(chǎn)生多個預測單元;將所述多個預測單元組合為變換單元;基于變換單元將包括在組合的多個預測單元中的殘差值變換到頻域,并變換為頻域的頻率分量系數(shù);對頻率分量系數(shù)進行量化;以及對量化的頻率分量系數(shù)進行熵編碼。所述組合步驟可包括基于指示將最大編碼單元分層減小到所述多個編碼單元的程度的所述多個預測單元的深度,組合所述多個預測單元。所述組合步驟可包括選擇所述多個預測單元中的根據(jù)預測模式的類型被執(zhí)行預測的相鄰預測單元。所述執(zhí)行預測步驟可包括通過基于所述多個預測單元中的至少一個相鄰預測單元的預測值,對所述多個預測單元中被預測的預測單元進行幀內(nèi)預測來產(chǎn)生所述多個編碼單元的殘差值。所述執(zhí)行預測步驟可包括通過對包括在所述多個編碼單元中的所有預測單元進行幀間預測來產(chǎn)生所述多個編碼單元的殘差值。根據(jù)示例性實施例的另一方面,提供一種用于對圖像進行編碼的設備,所述設備包括預測器,對圖像的多個編碼單元執(zhí)行預測,并基于預測的多個編碼單元產(chǎn)生多個預測單元;變換器,將所述多個預測單元組合為變換單元,基于變換單元將包括在組合的多個預測單元中的殘差值變換到頻域,并變換為頻域的頻率分量系數(shù);量化器,對頻率分量系數(shù)進行量化;以及熵編碼器,對量化的頻率分量系數(shù)進行熵編碼。根據(jù)示例性實施例的另一方面,提供一種對圖像進行解碼的方法,所述方法包括對從變換單元的多個預測單元的變換的殘差值產(chǎn)生的頻域的頻率分量系數(shù)進行熵解碼,其中,所述多個預測單元包括在圖像的多個編碼單元中;對經(jīng)過熵解碼的頻率分量系數(shù)進行反量化;將反量化的頻率分量系數(shù)逆變換到像素域,作為包括在變換單元中的所述多個編碼單元的恢復的殘差值;以及基于恢復的殘差值,恢復所述多個編碼單元。根據(jù)示例性實施例的另一方面,提供一種用于對圖像進行解碼的設備,所述設備包括熵解碼器,對從變換單元的多個預測單元的變換的殘差值產(chǎn)生的頻域的頻率分量系數(shù)進行熵編碼,其中,所述多個預測單元包括在圖像的多個編碼單元中;反量化器,對經(jīng)過熵解碼的頻率分量系數(shù)進行反量化;逆變換器,將反量化的頻率分量系數(shù)逆變換到像素域,作為包括在變換單元中的所述多個編碼單元的恢復的殘差值;以及恢復器,基于恢復的殘差值,恢復所述多個編碼單元。根據(jù)示例性實施例的另一方面,提供一種其上記錄有用于執(zhí)行解碼方法和編碼方法的程序的計算機可讀記錄介質(zhì)。
具體實施方式
以下,參照附圖更詳細地描述特定示例性實施例。諸如“…中的至少一個”的表達在元素列表之后時,修飾整個元素列表,而不修飾列表中的單個元素。在本說明書中,“圖像”可表示視頻的靜止圖像或運動圖像(即,視頻自身)。在以下描述中,即使在不同附圖中,相同的附圖標號也用于表示相同的元件。提供描述中定義的內(nèi)容(諸如詳細的構(gòu)造和元件)以幫助全面理解示例性實施例。然而,可在沒有那些具體定義的內(nèi)容的情況下實施示例性實施例。圖I是根據(jù)示例性實施例的用于對圖像進行編碼的圖像編碼設備100的框圖。作為示例,圖像編碼設備100可實現(xiàn)為硬件設備(諸如計算機的 處理器或者計算機系統(tǒng))。圖像編碼設備100還可實現(xiàn)為駐存在計算機系統(tǒng)上的軟件模塊。參照圖1,圖像編碼設備100包括最大編碼單元劃分器110、編碼深度確定器120、圖像數(shù)據(jù)編碼器130和編碼信息編碼器140,其中,以上項可實現(xiàn)為例如集成在圖像編碼設備100內(nèi)或與圖像編碼設備100分離的硬件或者軟件模塊。最大編碼單元劃分器110可基于作為具有最大尺寸的編碼單元的最大編碼單元劃分當前幀或像條(slice)。也就是說,最大編碼單元劃分器110可將當前幀或像條劃分為至少一個最大編碼單元。根據(jù)示例性實施例,編碼單元可使用最大編碼單元和深度來表示。如上所述,最大編碼單元指示當前幀的編碼單元之中具有最大尺寸的編碼單元,深度指示分層減小編碼單元的程度。隨著深度增加,編碼單元可從最大編碼單元減小到最小編碼單元,其中,最大編碼單元的深度被定義為最小深度,最小編碼單元的深度被定義為最大深度。由于隨著深度增加編碼單元的尺寸從最大編碼單元減小,因此第k深度的子編碼單元可包括第k+n(k和η是大于等于I的整數(shù))深度的多個子編碼單元。根據(jù)將被編碼的幀的尺寸的增大,以更大的編碼單元對圖像編碼可導致更高的圖像壓縮率。然而,如果更大的編碼單元被固定,則通過反映連續(xù)改變圖像特征無法對圖像進行有效地編碼。例如,當諸如海洋或天空的平滑區(qū)域被編碼時,編碼單元越大,壓縮率可增加得越多。但是,當諸如大或建筑物的復雜區(qū)域被編碼時,編碼單元越小,壓縮率可增加得越多。因此,在示例性實施例中,為每個幀或像條設置不同的最大圖像編碼單元和不同的最大深度。由于最大深度指示編碼單元可減小的最大次數(shù),因此,包括在最大圖像編碼單元中的每個最小編碼單元的尺寸可根據(jù)最大深度不同地設置。可為每個幀或像條或者為每個最大編碼單元不同地確定最大深度。編碼深度確定器120確定最大編碼單元的劃分形狀。可基于率失真(RD)代價的計算來確定劃分形狀。最大編碼單元的確定的劃分形狀被提供給編碼信息編碼器140,根據(jù)最大編碼單元的圖像數(shù)據(jù)被提供給圖像數(shù)據(jù)編碼器130。最大編碼單元可被劃分為根據(jù)不同深度具有不同尺寸的子編碼單元,并且包括在最大編碼單元中的具有不同尺寸的子編碼單元可基于具有不同尺寸的處理單元被預測或進行頻率變換。換言之,圖像編碼設備100可基于具有各種尺寸和各種形狀的處理單元執(zhí)行用于圖像編碼的多個處理操作。為了對圖像數(shù)據(jù)進行編碼,執(zhí)行諸如預測、變換和熵編碼的處理操作,其中,具有相同尺寸或不同尺寸的處理單元可被用于每個操作。例如,圖像編碼設備100可選擇與編碼單元不同的處理單元以用于預測所述編碼單元。當編碼單元的尺寸是2NX2N(其中,N是正整數(shù))時,用于預測的處理單元可以是2NX2N、2NXN、NX2N和NXN。換言之,可基于具有編碼單元的高和寬中的至少一個被二等分的形狀的處理單元執(zhí)行運動預測。以下,將作為預測的基礎(chǔ)的處理單元定義為預測單元。預測模式可以是幀內(nèi)模式、幀間模式和跳過模式中的至少一個,并且可僅針對具有特定尺寸或特定形狀的預測單元執(zhí)行特定預測模式。例如,可僅針對尺寸為2NX2N或NXN且形狀為正方形的預測單元執(zhí)行幀內(nèi)模式。此外,可僅針對尺寸為2NX2N的預測單元執(zhí)行跳過模式。如果在編碼單元中存在多個預測單元,則可在針對每個預測單元執(zhí)行預測之后選擇具有最小編碼誤差的預測模式??蛇x擇地,圖像編碼設備100可基于尺寸與編碼單元的尺寸不同的處理單元對圖像數(shù)據(jù)執(zhí)行頻率變換。對于編碼單元中的頻率變換,可基于尺寸小于等于編碼單元的尺寸的處理單元執(zhí)行頻率變換。以下,將作為頻率變換的基礎(chǔ)的處理單元定義為變換單元。所述頻率變換可以是離散余弦變換(DCT)或者Karhunen Loeve變換(KLT)。 編碼深度確定器120可基于拉格朗日乘數(shù)使用RD優(yōu)化來確定包括在最大編碼單元中的子編碼單元。換言之,編碼深度確定器120可確定從最大編碼單元劃分的多個子編碼單元的形狀,其中,子編碼單元根據(jù)子編碼單元的深度具有不同的尺寸。圖像數(shù)據(jù)編碼器130通過基于由編碼深度確定器120確定的劃分形狀對最大編碼單元進行編碼來輸出比特流。編碼信息編碼器140對關(guān)于由編碼深度確定器120確定的最大編碼單元的編碼模式的信息進行編碼。換言之,編碼信息編碼器140通過對關(guān)于最大編碼單元的劃分形狀的信息、關(guān)于最大深度的信息以及關(guān)于每個深度的子編碼單元的編碼模式的信息進行編碼來輸出比特流。關(guān)于子編碼單元的編碼模式的信息可包括關(guān)于子編碼單元的預測單元的信息、關(guān)于每個預測單元的預測模式的信息以及關(guān)于子編碼單元的變換單元的信息。關(guān)于最大編碼單元的劃分形狀的信息可以是指示每個編碼單元是否被劃分的標記信息。例如,當最大編碼單元被劃分和編碼時,指示最大編碼單元是否被劃分的信息被編碼。此外,當從最大編碼單元劃分的子編碼單元被劃分和編碼時,指示子編碼單元是否被劃分的信息被編碼。由于針對每個最大編碼單元存在具有不同尺寸的子編碼單元并且針對每個子編碼單元確定關(guān)于編碼模式的信息,因此,可針對一個最大編碼單元確定關(guān)于至少一個編碼模式的信息。圖像編碼設備100可通過根據(jù)深度的增加將最大編碼單元的高和寬二等分來產(chǎn)生子編碼單元。也就是說,當?shù)趉深度的編碼單元的尺寸是2NX2N時,第k+Ι深度的編碼單元的尺寸是NXN。因此,圖像編碼設備100可考慮圖像特征基于最大編碼單元的尺寸和最大深度來確定針對每個最大編碼單元的最佳劃分形狀。通過考慮圖像特征可變地調(diào)整最大編碼單元的尺寸并且通過將最大編碼單元劃分為不同深度的子編碼單元對圖像進行編碼,可對具有各種分辨率的圖像進行更有效地編碼。圖2是根據(jù)示例性實施例的用于對圖像進行解碼的圖像解碼設備200的框圖。作為示例,圖像解碼設備200可實現(xiàn)為硬件設備(諸如計算機的處理器或者計算機系統(tǒng))。圖像解碼設備200還可實現(xiàn)為駐存在計算機系統(tǒng)上的軟件模塊。參照圖2,圖像解碼設備200包括圖像數(shù)據(jù)獲取單元210、編碼信息提取器220和圖像數(shù)據(jù)解碼器230,其中,以上項可實現(xiàn)為例如集成在圖像解碼設備200內(nèi)或與圖像解碼設備200分離的硬件或者軟件模塊。圖像數(shù)據(jù)獲取單元210通過解析由圖像解碼設備200接收的比特流來獲取根據(jù)最大編碼單元的圖像數(shù)據(jù),并將圖像數(shù)據(jù)輸出到圖像數(shù)據(jù)解碼器230。圖像數(shù)據(jù)獲取單元210可從當前像條或當前幀的頭部提取關(guān)于當前幀或像條的最大編碼單元的信息。換言之,圖像數(shù)據(jù)獲取單元210在最大編碼單元中劃分比特流,使得圖像數(shù)據(jù)解碼器230可根據(jù)最大編碼單元對圖像數(shù)據(jù)進行解碼。編碼信息提取器220通過解析由圖像解碼設備200接收的比特流從當前幀的頭部提取關(guān)于最大編碼單元、最大深度、最大編碼單元的劃分形狀、子編碼單元的編 碼模式的信息。關(guān)于劃分形狀的信息和關(guān)于編碼模式的信息被提供給圖像數(shù)據(jù)解碼器230。關(guān)于最大編碼單元的劃分形狀的信息可包括關(guān)于具有根據(jù)深度的不同尺寸并包括在最大編碼單元中的子編碼單元的信息,并且可以是指示每個編碼單元是否被劃分的標記信息。關(guān)于編碼模式的信息可包括關(guān)于根據(jù)子編碼單元的預測單元的信息、關(guān)于預測模式的信息以及關(guān)于變換單元的信息。圖像數(shù)據(jù)解碼器230通過基于由編碼信息提取器220提取的信息對每個最大編碼單元的圖像數(shù)據(jù)進行解碼來恢復當前幀。圖像數(shù)據(jù)解碼器230可基于關(guān)于最大編碼單元的劃分形狀的信息對包括在最大編碼單元中的子編碼單元進行解碼。解碼處理可包括預測處理(包括幀內(nèi)預測和運動補償)和逆變換處理。圖像數(shù)據(jù)解碼器230可基于關(guān)于預測單元的信息和關(guān)于預測模式的信息來執(zhí)行幀內(nèi)預測或幀間預測,以預測所述預測單元。圖像數(shù)據(jù)解碼器230還可基于關(guān)于子編碼單元的變換單元的信息來針對每個子編碼單元執(zhí)行逆變換。圖3示出根據(jù)示例性實施例的分層編碼單元。參照圖3,分層編碼單元可包括寬和高為64X64、32X32、16X16、8X8和4X4的編碼單元。除了具有完全正方形形狀的這些編碼單元之外,還可存在寬和高為64X32、32X64、32X16、16X32、16X8、8X16、8X4 和 4X8 的編碼單元。參照圖3,對于分辨率為1920 X 1080的圖像數(shù)據(jù)集310,最大編碼單元的尺寸被設置為64 X 64,最大深度被設置為2。對于分辨率為1920X1080的圖像數(shù)據(jù)集320,最大編碼單元的尺寸被設置為64X64,最大深度被設置為3。對于分辨率為352X288的圖像數(shù)據(jù)集330,最大編碼單元的尺寸被設置為16X 16,最大深度被設置為I。當分辨率較高或數(shù)據(jù)量較大時,編碼單元的最大尺寸可被設置為相對較大以增加壓縮率并更加精確地反映圖像特征。因此,對于具有比圖像數(shù)據(jù)集330更高分辨率的圖像數(shù)據(jù)集310和320,,64X64可被選為最大編碼單元的尺寸。最大深度指示分層編碼單元中的層的總數(shù)。由于圖像數(shù)據(jù)集310的最大深度是2,因此,圖像數(shù)據(jù)集310的編碼單元315可包括長軸尺寸為64的最大編碼單元以及根據(jù)深度的增加長軸尺寸為32和16的子編碼單元。另一方面,由于圖像數(shù)據(jù)集330的最大深度是1,因此,圖像數(shù)據(jù)集330的編碼單元335可包括長軸尺寸為16的最大編碼單元以及根據(jù)深度的增加長軸尺寸為8的編碼單元。然而,由于圖像數(shù)據(jù)集320的最大深度是3,因此,圖像數(shù)據(jù)集320的編碼單元325可包括長軸尺寸為64的最大編碼單元以及根據(jù)深度的增加長軸尺寸為32、16、8和4的子編碼單元。由于基于隨著深度增加的更小的子編碼單元對圖像進行編碼,因此示例性實施例適合用于對包括更小場景的圖像進行編碼。圖4是根據(jù)示例性實施例的基于編碼單元的圖像編碼器400的框圖。作為示例,圖像編碼器400可實現(xiàn)為硬件裝置(諸如計算機的處理器)或者實現(xiàn)為駐存在計算機系統(tǒng)上的軟件模塊。幀內(nèi)預測器410對當前幀405中的幀內(nèi)模式的預測單元執(zhí)行幀內(nèi)預測,運動估計 器420和運動補償器425使用當前幀405和參考幀495對幀間模式的預測單元執(zhí)行幀間預測和運動補償。作為示例,幀內(nèi)預測器410、運動估計器420、運動補償器425和參考幀495可實現(xiàn)為集成在圖像編碼器400內(nèi)或與圖像編碼器400分離的硬件或軟件模塊?;趶膸瑑?nèi)預測器410、運動估計器420和運動補償器425輸出的預測單元產(chǎn)生殘差值。產(chǎn)生的殘差值經(jīng)過變換器430和量化器440輸出為量化的變換系數(shù)。量化的變換系數(shù)經(jīng)過反量化器460和逆變換器470恢復為殘差值,恢復的殘差值經(jīng)過去塊單元480和環(huán)路濾波單元490被后處理并輸出為參考幀495。所述量化的變換系數(shù)可經(jīng)過熵編碼器450輸出為比特流455。為了基于根據(jù)示例性實施例的編碼方法執(zhí)行編碼,圖像編碼器400的幀內(nèi)預測器410、運動估計器420、運動補償器425、變換器430、量化器440、熵編碼器450、反量化器460、逆變換器470、去塊單元480和環(huán)路濾波單元490基于最大編碼單元、根據(jù)深度的子編碼單元、預測單元和變換單元執(zhí)行圖像編碼處理。圖5是根據(jù)示例性實施例的基于編碼單元的圖像解碼器500的框圖。作為示例,圖像解碼器500可實現(xiàn)為硬件裝置(諸如計算機的處理器)或者駐存在計算機系統(tǒng)上的軟件模塊。比特流505經(jīng)過解析器510,使得將被解碼的編碼的圖像數(shù)據(jù)和解碼所必需的編碼信息被解析。所述編碼的圖像數(shù)據(jù)經(jīng)過熵解碼器520和反量化器530輸出為反量化的數(shù)據(jù),并經(jīng)過逆變換器540恢復為殘差值。根據(jù)被添加到幀內(nèi)預測器550的幀內(nèi)預測結(jié)果或運動補償器560的運動補償結(jié)果的編碼單元來恢復殘差值?;謴偷木幋a單元585、595經(jīng)過去塊單元570和環(huán)路濾波單元580用于預測下一編碼單元或下一幀。作為示例,解析器510、熵解碼器520、反量化器530、逆變換器540、幀內(nèi)預測器550、補償器560、去塊單元570和環(huán)路濾波單元580可實現(xiàn)為集成在圖像解碼器500內(nèi)或與圖像解碼器500分離的硬件或軟件模塊。為了基于根據(jù)示例性實施例的解碼方法執(zhí)行解碼,圖像解碼器500的解析器510、熵解碼器520、反量化器530、逆變換器540、幀內(nèi)預測器550、運動補償器560、去塊單元570和環(huán)路濾波單元580基于最大編碼單元、根據(jù)深度的子編碼單元、預測單元和變換單元執(zhí)行圖像解碼處理。尤其是,幀內(nèi)預測器550和運動補償器560通過考慮最大編碼單元和深度來確定子編碼單元中的預測單元和預測模式,逆變換器540通過考慮變換單元的尺寸來執(zhí)行逆變換。圖6示出根據(jù)示例性實施例的最大編碼單元、子編碼單元和預測單元。圖I示出的圖像編碼設備100和圖2示出的圖像解碼設備200考慮圖像特征而使用分層編碼單元來執(zhí)行編碼和解碼??筛鶕?jù)圖像特征自適應地設置最大編碼單元和最大深度,或者可根據(jù)用戶的需要可變地設置最大編碼單元和最大深度。在圖6中,分層編碼單元結(jié)構(gòu)600具有作為高和寬為64且最大深度為4的最大編碼單元的最大編碼單元610。深度沿著分層編碼單元結(jié)構(gòu)600的縱軸增加,而隨著深度增力口,子編碼單元620至650的高和寬減小。沿著分層編碼單元結(jié)構(gòu)600的橫軸示出最大編碼單元610和子編碼單元620至650的預測單元。最大編碼單元610具有深度O以及編碼單元的尺寸(或者高和寬)64X64。深度沿著縱軸增加,并存在尺寸為32X32且深度為I的第一子編碼單元620、尺寸為16X16且深度為2的第二子編碼單元630、尺寸為8X8且深度為3的第三子編碼單元640以及尺寸為4X4且深度為4的最小編碼單元650。尺寸為4X4且深度為4的最小編碼單元650是最小編碼單元,并且最小編碼單元可被劃分為預測單元,其中,每個預測單元的尺寸小于最小編碼單元。參照圖6,根據(jù)每個深度沿著橫軸示出預測單元的示例。也就是說,深度為O的最大編碼單元610的預測單元可以是尺寸等于最大編碼單元的尺寸64X64的預測單元或者尺寸小于尺寸為64X64的最大編碼單元的尺寸的尺寸為64X32的預測單元612、尺寸為32X64的預測單元614或尺寸為32X32的預測單元616。深度為I且尺寸為32X32的第一子編碼單元620的預測單元可以是尺寸等于第一子編碼單元的尺寸32X32的預測單元或者尺寸小于尺寸為32X32的第一子編碼單元620的尺寸的尺寸為32X16的預測單元622、尺寸為16X32的預測單元624或尺寸為16X16的預測單元626。深度為2且尺寸為16X16的第二子編碼單元630的預測單元可以是尺寸等于第二子編碼單元630的尺寸16X16的預測單元或者尺寸小于尺寸為16X16的第二子編碼單元630的尺寸的尺寸為16X8的預測單元632、尺寸為8X16的預測單元634或尺寸為8X8的預測單元636。深度為3且尺寸為8X8的第三子編碼單元640的預測單元可以是尺寸等于第三子編碼單元640的尺寸8X8的預測單元或者尺寸小于尺寸為8X8的第三子編碼單元640的尺寸的尺寸為8X4的預測單元642、尺寸為4X8的預測單元644或尺寸為4X4的預測單元646。深度為4且尺寸為4X4的最小編碼單元650是最小編碼單元和最大深度的編碼單元。最小編碼單元650的預測單元可以是尺寸為4X4的預測單元650、尺寸為4X2的預測單元652、尺寸為2X4的預測單元654或尺寸為2X2的預測單元656。圖7示出根據(jù)示例性實施例的編碼單元和變換單元。圖I示出的圖像編碼設備100和圖2示出的圖像解碼設備200使用最大編碼單、元或使用從最大編碼單元劃分的尺寸小于等于最大編碼單元的子編碼單元來執(zhí)行編碼和解碼。在編碼和解碼處理中,用于頻率變換的變換單元的尺寸被選擇為不大于相應編碼單元的尺寸。例如,如果當前編碼單元710具有尺寸64X64,則可使用尺寸為32X32的變換單元720執(zhí)行頻率變換。圖8a、圖8b、圖8c和圖8d示出根據(jù)示例性實施例的編碼單元、預測單元和變換單元的劃分形狀。圖8a和圖8b分別示出根據(jù)示例性實施例的編碼單元和預測單元。圖8a示出由圖I示出的圖像編碼設備100選擇的用于對最大編碼單元810進行編碼的劃分形狀。圖像編碼設備100將最大編碼單元810劃分為各種形狀,執(zhí)行編碼,并通過基于RD代價將各種劃分形狀的編碼結(jié)果互相比較來選擇最佳劃分形狀。當將被編碼的最大編碼單元810最佳時,如圖8a到圖8d所示,可在不劃分最大編碼單元810的情況下,對最大編碼單元810進行編碼。參照圖8a,通過將深度為O的最大編碼單元810劃分為深度大于等于I的子編碼 單元812、854,最大編碼單元810被編碼。也就是說,最大編碼單元810被劃分為深度為I的4個子編碼單元,并且深度為I的全部子編碼單元或一些子編碼單元被劃分為深度為2的子編碼單元 814、816、818、828、850 和 852。深度為I的子編碼單元中位于右上方的子編碼單元和位于左下方的子編碼單元被劃分為深度大于等于2的子編碼單元。深度大于等于2的一些子編碼單元可被進一步劃分為深度大于等于3的子編碼單元820、822、824、826、830、832、840、842、844、846和848。圖8b示出最大編碼單元810的預測單元的劃分形狀。參照圖Sb,最大編碼單元810的預測單元860可不同于最大編碼單元810而被劃分。換言之,每個子編碼單元的預測單元可小于相應子編碼單元。例如,深度為I的子編碼單元812、854中位于右下方的子編碼單元854的預測單元可小于子編碼單元854。另外,深度為2的子編碼單元814、816、818、828、850和852中的子編碼單元814、816、850和852的預測單元可分別小于子編碼單元814、816、850和852。另外,深度為3的子編碼單元822、832和848的預測單元可分別小于子編碼單元822,832和848。預測單元可具有各個子編碼單元沿高或?qū)挿较虮欢确值男螤罨蛘呔哂懈鱾€子編碼單元沿高和寬方向被四等分的形狀。圖8c和圖8d示出根據(jù)示例性實施例的預測單元和變換單元。圖8c示出在圖8b中示出的最大編碼單元810的預測單元的劃分形狀,圖8d示出最大編碼單元810的變換單元的劃分形狀。參照圖8d,變換單元870的劃分形狀可不同于預測單元860被設置。例如,即使深度為I的子編碼單元854的預測單元被選為具有子編碼單元854的高被二等分的形狀,變換單元也可被選為具有子編碼單元854的原始尺寸。同樣,即使深度為2的子編碼單元814和850的預測單元被選為具有子編碼單元814和850中的每一個的高被二等分的形狀,變換單元也可被選為具有與子編碼單元814和850中的每一個的原始尺寸相同的尺寸。變換單元可被選為具有比預測單元更小的尺寸。例如,當深度為2的子編碼單元852的預測單元被選為具有子編碼單元852的寬被二等分的形狀時,變換單元可被選為具有子編碼單元852沿高和寬方向被四等分的形狀,其中,所述形狀具有比預測單元的形狀更小的尺寸。
可選擇地,如將參照圖13a到圖13d所述,不管編碼單元為何,變換單元可被設置為具有比編碼單元更大的尺寸。圖9是根據(jù)另一示例性實施例的用于對圖像進行編碼的設備900的框圖。參照圖9,根據(jù)當前示例性實施例的圖像編碼設備900包括預測器910、變換器920、量化器930和熵編碼器940。預測器910通過對一個或多個編碼單元執(zhí)行幀內(nèi)預測或幀間預測來產(chǎn)生殘差值。將如稍后所述,包括在多個預測單元中的殘差值可被組合為一個變換單元,并隨后被變換到頻域,由此,通過基于所述多個預測單元預測一個或多個編碼單元來產(chǎn)生殘差值。到頻域的變換可以是DCT或KLT。如以上參照圖8a所述,在根據(jù)示例性實施例的圖像編碼方法中,一個編碼單元可包括多個預測單元。因此,預測器910可預測每個預測單元,并產(chǎn)生包括在所述一個編碼單 元中的預測單元的殘差值??蛇x擇地,預測單元910可一次預測所述多個編碼單元。將如稍后所述,根據(jù)示例性實施例,包括在多個編碼單元中的多個預測單元可被組合為一個變換單元,并由此通過預測包括在編碼單元中的每個預測單元來產(chǎn)生殘差值。例如,包括在一個最大編碼單元中的所有子編碼單元可被預測以產(chǎn)生編碼單元的殘差值。根據(jù)傳統(tǒng)技術(shù),由于以小于等于預測單元的尺寸執(zhí)行變換(例如,DCT或KLT),因此,預定的預測單元被獨立地編碼、恢復,并隨后用于預測下一預測單元。然而,根據(jù)稍后將描述的根據(jù)示例性實施例的對圖像進行編碼的方法,由于通過將包括在一個或多個編碼單元中的預測單元組合為一個變換單元來執(zhí)行變換,因此預定的預測單元不能被獨立地編碼和恢復。這將參照圖10進行詳細描述。
圖10是根據(jù)示例性實施例的用于描述預測方法的示圖。參照圖10,一個編碼單元1000可包括多個預測單元1010到1040。如果按照傳統(tǒng)技術(shù)以小于等于預測單元的尺寸執(zhí)行變換,則預測單元1010到1030可在對右下方的預測單元1040進行編碼之前被編碼和恢復。因此,如果根據(jù)傳統(tǒng)技術(shù)預測單元1040將經(jīng)由幀內(nèi)預測被預測,則通過使用通過對預測單元1010到1030進行編碼并隨后恢復預測單元1010到1030產(chǎn)生的像素中與預測單元1040相鄰的像素來對預測單元1040進行幀內(nèi)預測。另一方面,根據(jù)示例性實施例,多個預測單元被組合為一個變換單元,并隨后執(zhí)行變換。這里,如果圖10的預測單元1010到1040被組合為一個變換單元,則使用其他預測單元1010到1030對右下方的預測單元1040進行編碼,并由此在對預測單元1040進行編碼之前,不對預測單元1010到1030進行編碼。因此,不能通過使用通過對預測單元1010到1030進行編碼并隨后恢復預測單元1010到1030產(chǎn)生的像素來對預測單元1040進行幀內(nèi)預測。因此,圖9的預測單元910可通過使用預測單元1010到1030的預測值來預測所述預測單元1040。通過使用預測單元1010到1030的預測值,而不使用通過對預測單元1010到1030進行編碼并隨后恢復預測單元1010到1030產(chǎn)生的像素,來預測右下方的預測單元1040。換言之,如果在組合為一個變換單元的預測單元中存在經(jīng)由幀內(nèi)預測而預測的第一預測單元,則可通過使用至少一個相鄰預測單元的預測值來對第一預測單元進行幀內(nèi)預測??蛇x擇地,組合為一個變換單元的預測單元可全部經(jīng)由幀間預測被預測。如參照圖10所述,由于在將多個預測單元組合為一個變換單元時經(jīng)由幀內(nèi)預測所預測的預測單元待解決(at issue),因此,可僅使用幀間預測來預測組合為變換單元的所有預測單元。參照回圖9,變換器920接收像素域中的圖像處理單元,并將所述圖像處理單元變換到頻域,變換器920將由預測單元910產(chǎn)生的殘差值變換到頻域。如上所述,變換器920將預測單元組合為一個變換單元,并根據(jù)變換單元執(zhí)行DCT或KLT。殘差值可以是包括在一個或多個編碼單元中的多個預測單元的殘差值。作為將像素域變換到頻域的結(jié)果,頻率分量的系數(shù)被產(chǎn)生。根據(jù)示例性實施例,可經(jīng)由DCT或KLT執(zhí)行到頻域的變換,作為DCT或KLT的結(jié)果,
離散余弦系數(shù)被產(chǎn)生。然而,可使用用于將像素域中的圖像變換到頻域的任何變換。圖11是根據(jù)示例性實施例的變換器920的框圖。參照圖11,變換器920包括選擇器1110和變換執(zhí)行器1120。選擇器1110通過選擇多個相鄰預測單元來設置一個變換單元。根據(jù)以上描述的傳統(tǒng)圖像編碼設備,根據(jù)預定的預測單元執(zhí)行幀內(nèi)預測或幀間預測,并以小于等于預定預測單元的尺寸執(zhí)行DCT或KLT。換言之,傳統(tǒng)圖像編碼設備基于具有小于等于預測單元的尺寸的變換單元來執(zhí)行DCT或KLT。然而,由于附加的開銷隨著由于為每個變換單元添加的頭部信息所導致的變換單元的尺寸減小而增加,所以圖像編碼的壓縮率退化。因此,根據(jù)當前示例性實施例的圖像編碼設備900將相鄰預測單元組合為一個變換單元,并隨后根據(jù)變換單元執(zhí)行DCT或KLT。具體地說,由于相鄰預測單元極有可能具有相似的殘差值,所以當根據(jù)通過組合相鄰預測單元產(chǎn)生的變換單元來執(zhí)行DCT或KLT時,編碼的壓縮率可顯著增加。因此,選擇器1110選擇將被組合為一個變換單元并將被執(zhí)行DCT或KLT的預測單元。所述預測單元可彼此相鄰。這將參照圖12a到圖12c以及圖13a到圖13d進行詳細描述。圖12a到圖12c是根據(jù)示例性實施例的變換單元1230到1250的類型的示圖。參照圖12a到圖12c,預測單元1220可具有編碼單元1210沿寬方向被二等分的形狀。編碼單元1210可以是如上所述的最大編碼單元或者具有比最大編碼單元更小尺寸的子編碼單元。即使編碼單元1210和預測單元1220相同,變換單元1230到1250也可不同。如圖12a所示,變換單元1230的尺寸可小于預測單元1220的尺寸,或者如圖12b所示,變換單元1240的尺寸可等于預測單元1220的尺寸??蛇x擇地,如圖12c所示,變換單元1250的尺寸可大于預測單元1220的尺寸。被組合為一個變換單元的預測單元可以是如圖12a到圖12c所示的包括在一個編碼單元中的多個預測單元,或者可以是包括在不同編碼單元中的多個預測單元。換言之,包括在至少一個編碼單元中的多個預測單元可被組合為一個變換單元并隨后被變換到頻域。圖13a到圖13d是根據(jù)示例性實施例的變換單元的類型的示圖。一個最大編碼單元1300可被劃分為如圖13a所示的具有不同尺寸并隨后被編碼的子編碼單元1302到1308,并且如圖13b所示,子編碼單元1302到1308中的每一個可包括至少一個預測單元1310到1340。選擇器1110可將圖13b中示出的預測單元1310到1340組合為圖13c中示出的一個變換單元1350,并隨后將變換單元1350變換到頻域??蛇x擇地,如圖13d所示,選擇器1110可將左側(cè)的子編碼單元1302和1306的預測單元1310以及預測單元1330到1339組合為一個變換單元1360,并將右側(cè)的子編碼單元1304和1308的預測單元1320到1328以及預測單元1340組合為一個變換單元1362。參照回圖11,用于選擇器1110選擇多個相鄰預測單元的準則是不受限的。然而,根據(jù)示例性實施例,選擇器1110可基于深度選擇變換單元。如上所述,深度指示將編碼單元從當前像條或幀的最大編碼單元分層減小到子編碼單元的程度。如以上參照圖3和圖6所示,隨著深度增加,子編碼單元的尺寸減小,由此,包括在子編碼單元中的預測單元的尺寸減小。這里,當根據(jù)具有小于等于預測單元的尺寸的變換單元執(zhí)行DCT或KLT時,因為如上所述為每個變換單元添加了頭部信息,所以圖像編碼的壓縮率降低。 因此,包括在深度大于等于預定值的子編碼單元中的預測單元可被組合為一個變換單元,并隨后可基于變換單元執(zhí)行DCT或KLT。因此,選擇器1110可基于子編碼單元的深度來設置變換單元。例如,當圖12c的編碼單元1210的深度高于k時,選擇器1110將預測單元1220組合為一個變換單元1250??蛇x擇地,當最大編碼單元包括深度大于等于預定值的多個子編碼單元時,選擇器1110可將子編碼單元的預測單元組合為一個變換單元。圖13c示出將深度大于最大編碼單元(即,深度大于I)的子編碼單元的預測單元組合為一個變換單元的示例。根據(jù)另一示例性實施例,選擇器1110可將多個相鄰預測單元設置為一個變換單元,其中,根據(jù)相同的預測模式的類型對所述多個相鄰預測單元執(zhí)行預測。通過使用幀內(nèi)預測或幀間預測所預測的相鄰預測單元可被組合為一個變換單元。由于根據(jù)相同的預測模式的類型預測的相鄰預測單元極有可能具有相似的殘差值,因此,可通過將所述相鄰預測單元組合為一個變換單元來執(zhí)行DCT或KLT。當選擇器1110設置變換單元時,變換執(zhí)行器1120根據(jù)設置的變換單元將所述相鄰預測單元變換到頻域。通過將選擇的預測單元變換為一個變換單元來產(chǎn)生頻域的系數(shù)(例如,離散余弦系數(shù))。參照回圖9,量化器930對由變換器920產(chǎn)生的頻率分量系數(shù)進行量化。量化器930可對根據(jù)預定的量化處理輸入的系數(shù)進行量化。熵編碼器940對由量化器930量化的系數(shù)進行熵編碼。這里,可通過使用基于上下文的自適應二進制算術(shù)編碼(CABAC)或基于上下文的自適應可變長度編碼(CAVLC)對離散余弦系數(shù)進行熵編碼。圖像編碼單元900可對指示通過組合預測單元產(chǎn)生的變換單元是否包括系數(shù)的標記信息進行編碼。如果不存在將被熵編碼的系數(shù)(即,當量化的系數(shù)全部為“O”時),則對指示變換單元不包括系數(shù)的標記信息進行編碼,并且不對量化的系數(shù)單獨地進行熵編碼。根據(jù)當前示例性實施例的圖像編碼設備900可通過對不同的變換單元重復地執(zhí)行變換、量化和熵編碼來確定最佳變換單元。可通過機械地重復通過使用各種方法選擇多個預測單元(而不是基于預定準則(諸如深度或相同的預測模式的類型)選擇預測單元)的處理來確定最佳變換單元??苫赗D代價的計算來確定最佳變換單元,這將參照圖14進行詳細描述。圖14是根據(jù)示例性實施例的不同的變換單元1430到1460的示圖。參照圖14,圖像編碼設備900對不同的變換單元1430到1460重復地進行編碼。如圖14所示,編碼單元1410可基于具有小于編碼單元1410的尺寸的預測單元1420被預測并編碼。對作為預測結(jié)果產(chǎn)生的殘差值執(zhí)行DCT或KLT,并且這里,可基于如圖14所示的不同的變換單元1430到1460執(zhí)行DCT或KLT。變換單元1430具有與編碼單元1410相同的尺寸,并且通過組合包括在編碼單元1410中的所有預測單元來產(chǎn)生變換單元1430。變換單元1440具有編碼單元1410沿寬方向被二等分的尺寸,并且通過組合縱向 相鄰的預測單元來產(chǎn)生變換單元1440。變換單元1450具有編碼單元1410沿高方向被二等分的尺寸,并且通過組合橫向相鄰的預測單元來產(chǎn)生變換單元1450。變換單元1460具有與預測單元1420相同的尺寸。圖像編碼設備900可通過對變換單元1430到1460重復地執(zhí)行變換、量化和熵編
碼來確定最佳變換單元??蛇x擇地,圖像編碼設備900可對指示通過組合包括在一個還是多個編碼單元中的多個預測單元產(chǎn)生了變換單元的標記信息進行編碼。例如,當如圖12a到圖12c所示通過組合包括在一個編碼單元中的多個預測單元來設置變換單元時,標記信息被設置為“0”,而當如圖13a到圖13d所示通過組合包括在多個編碼單元中的多個預測單元來設置變換單元時,標記信息被設置為“ I ”。圖14示出當通過組合包括在一個編碼單元中的預測單元來設置一個變換單元時確定最佳變換單元的示例。然而,即使當通過組合包括在多個編碼單元中的預測單元來設置一個變換單元時,也可通過如圖14所示對不同的變換單元重復地執(zhí)行DCT、量化和熵編碼來確定最佳變換單元。圖15是根據(jù)另一示例性實施例的用于對圖像進行解碼的設備1500的框圖。參照圖15,圖像解碼設備1500包括熵解碼器1510、反量化器1520、逆變換器1530和恢復器1540。熵解碼器1510對預定變換單元的頻率分量系數(shù)進行熵解碼。如以上參照圖12a到圖12c以及圖13a到圖13d所述,可通過組合多個預測單元來產(chǎn)生變換單元。如上所述,預測單元可彼此相鄰,并可包括在一個編碼單元或多個不同的編碼單元中。如以上參照圖像編碼設備900所述,可通過基于深度組合多個相鄰預測單元來產(chǎn)生變換單元,或者可通過組合根據(jù)相同的預測模式的類型(即,根據(jù)幀內(nèi)預測模式或幀間預測模式)被執(zhí)行預測的多個相鄰預測單元來產(chǎn)生變換單元??蛇x擇地,如參照圖14所述,可通過機械地重復組合多個預測單元的處理對不同的變換單元重復地執(zhí)行變換、量化和熵解碼來選擇最佳變換單元。如果變換單元不包括系數(shù)(例如,離散余弦系數(shù)),則熵解碼器1510可不對量化的系數(shù)單獨地進行熵解碼。如果變換單元不包括量化的系數(shù),則不通過參考預定的標記信息對量化的系數(shù)單獨地進行熵編碼。
反量化器1520對由熵解碼器1510進行熵解碼后的頻率分量系數(shù)進行反量化。根據(jù)在對變換單元進行編碼時使用的量化步長對被熵解碼的頻率分量系數(shù)進行反量化。逆變換器1530將反量化的頻率分量系數(shù)逆變換到像素域。對反量化的離散余弦系數(shù)執(zhí)行逆DCT或逆KLT,以恢復像素域中的變換單元。作為逆變換的結(jié)果,變換單元的殘差值被恢復?;謴偷淖儞Q單元包括多個預測單元,并且如上所述,預測單元可包括在一個編碼單元或多個不同的編碼單元中?;謴推?540通過預測包括在恢復的變換單元中的多個預測單元來產(chǎn)生預測值。如果被組合為一個變換單元的預測單元包括在一個編碼單元中,則產(chǎn)生一個編碼單元的預測值,而如果被組合為一個變換單元的預測單元包括在多個編碼單元中,則產(chǎn)生多個編碼單元的預測值。通過將產(chǎn)生的預測值與由逆變換器1530恢復的殘差值相加來恢復一個編碼單元或多個編碼單元?!た苫谥甘緢D像編碼設備900通過組合包括在一個編碼單元還是多個編碼單元中的多個預測單元產(chǎn)生了變換單元的標記信息,來確定針對一個編碼單元還是多個編碼單元產(chǎn)生了預測值。根據(jù)一示例性實施例,如果被組合為一個變換單元的預測單元包括被幀內(nèi)預測的預測單元,則可如參照圖10所述,基于至少一個相鄰預測單元的預測值來執(zhí)行幀內(nèi)預測??蛇x擇地,被組合為一個變換單元的多個預測單元可全部通過使用幀間預測被預測。圖16是示出根據(jù)示例性實施例的對圖像進行編碼的方法的流程圖。參照圖16,在操作1610,用于對圖像進行編碼的設備通過對一個或多個編碼單元執(zhí)行預測來產(chǎn)生殘差值。被組合為一個變換單元的多個預測單元可包括在一個編碼單元或多個編碼單元中。因此,當預測單元包括在一個編碼單元中時,通過對所述一個編碼單元執(zhí)行預測來產(chǎn)生殘差值,而當預測單元包括在多個編碼單元中時,通過對所述多個編碼單元執(zhí)行預測來產(chǎn)生殘差值。以上已參照圖10描述了通過一次預測多個預測單元來產(chǎn)生殘差值的方法。在操作1620,所述設備通過選擇多個預測單元來設置一個變換單元。預測單元可包括在一個編碼單元或多個編碼單元中。可基于深度選擇相鄰預測單元,或者可選擇按照相同的預測模式的類型被執(zhí)行預測的相鄰預測單元。在操作1630,所述設備根據(jù)在操作1620設置的變換單元將預測單元變換到頻域。通過對通過組合預測單元設置的變換單元執(zhí)行變換來產(chǎn)生頻域的系數(shù)。在操作1640,所述設備根據(jù)預定的量化處理對頻率分量系數(shù)(例如,在操作1630產(chǎn)生的離散余弦系數(shù))進行量化。在操作1650,所述設備對在操作1640量化的頻率分量系數(shù)進行熵編碼。經(jīng)由CABAC或CAVLC執(zhí)行熵編碼。如參照圖14所述,所述方法還可包括通過對不同的變換單元重復操作1610到1640來設置最佳變換單元??扇鐖D14所示通過對不同的變換單元重復地執(zhí)行變換、量化和熵編碼來設置最佳變換單元。圖17是根據(jù)示例性實施例的對圖像進行解碼的方法的流程圖。
參照圖17,在操作1710,所述設備對預定變換單元的頻率分量系數(shù)進行熵解碼。所述頻率分量系數(shù)可以是離散余弦系數(shù)??赏ㄟ^組合多個預測單元來設置變換單元。如上所述,預測單元可彼此相鄰,并可包括在一個編碼單元或多個不同的編碼單元中。在操作1720,所述設備對在操作1710被熵解碼后的頻率分量系數(shù)進行反量化。通過使用編碼期間使用的量化步長對離散余弦系數(shù)進行反量化。在操作1730,所述設備將在操作1720被反量化后的頻率分量系數(shù)逆變換到像素域,以恢復變換單元。恢復的變換單元通過組合多個預測單元被設置。包括在變換單元中的殘差值被恢復。如果預測單元包括在一個編碼單元中,則恢復所述一個編碼單元的殘差值,而如果預測單元包括在多個編碼單元中,則恢復所述多個編碼單元的殘差值。如上所述,可通過基于深度組合相鄰預測單元來設置變換單元,或者可通過組合根據(jù)相同的預測模式的類型被執(zhí)行預測的相鄰預測單元來設置變換單元。
在操作1740,所述設備基于包括在操作1730中所恢復的變換單元中的殘差值來恢復一個或多個編碼單元。通過預測所述一個或多個編碼單元來產(chǎn)生預測值,并且通過將產(chǎn)生的預測值與在操作1730恢復的殘差值相加來恢復所述一個或多個編碼單元。以上已參照圖10描述了預測包括在一個或多個編碼單元中的預測值的方法。如果通過組合包括在一個編碼單元中的預測單元來設置變換單元,則恢復所述一個編碼單元,而如果通過組合包括在多個編碼單元中的預測單元來設置變換單元,則恢復所述多個編碼單元。根據(jù)示例性實施例,由于變換單元可被設置為具有大于預測單元的尺寸,并且可對變換單元執(zhí)行變換,因此圖像被更加有效地壓縮和編碼。盡管已參照本發(fā)明的示例性實施例具體示出和描述了本發(fā)明,但是本領(lǐng)域普通技術(shù)人員將理解,在不脫離由權(quán)利要求及其等同物限定的本發(fā)明的精神和范圍的情況下,這里可進行形式和細節(jié)上的各種改變。此外,示例性實施例還可實現(xiàn)為計算機可讀記錄介質(zhì)上的計算機可讀代碼。在圖I、2、4、5、9、11或15中示出的圖像編碼設備或圖像解碼設備或圖像編碼器或圖像解碼器可包括連接到所述設備或編碼器或解碼器的每個單元的總線、連接到總線并用于執(zhí)行命令的至少一個處理器以及連接到總線以存儲命令、接收的消息和產(chǎn)生的消息的存儲器。計算機可讀記錄介質(zhì)是可存儲其后可被計算機系統(tǒng)讀取的數(shù)據(jù)的任何數(shù)據(jù)存儲裝置。計算機可讀記錄介質(zhì)的示例包括只讀存儲器(ROM)、隨機存取存儲器(RAM)、CD-R0M、磁帶、軟盤以及光學數(shù)據(jù)存儲裝置。計算機可讀記錄介質(zhì)還可分布于聯(lián)網(wǎng)的計算機系統(tǒng)中,以使計算機可讀代碼以分布方式被存儲和執(zhí)行。可選擇地,示例性實施例可實現(xiàn)為以載波或用于通過網(wǎng)絡(諸如互聯(lián)網(wǎng))傳輸?shù)男盘柕挠嬎銠C可讀傳輸介質(zhì)。
權(quán)利要求
1.一種對圖像進行編碼的方法,所述方法包括 對圖像的多個編碼單元執(zhí)行預測,并基于預測的多個編碼單元產(chǎn)生多個預測單元; 將所述多個預測單元組合為變換單元; 基于變換單元將包括在組合的多個預測單元中的殘差值變換到頻域,并變換為頻域的頻率分量系數(shù); 對頻率分量系數(shù)進行量化;以及 對量化的頻率分量系數(shù)進行熵編碼。
2.如權(quán)利要求I所述的方法,其中,所述組合步驟包括基于指示將最大編碼單元分層減小到所述多個編碼單元的程度的所述多個預測單元的深度,組合所述多個預測單元。
3.如權(quán)利要求I所述的方法,其中,所述組合步驟包括選擇所述多個預測單元中的根據(jù)預測模式的類型被執(zhí)行預測的相鄰預測單元。
4.如權(quán)利要求I所述的方法,其中,所述執(zhí)行預測的步驟包括通過基于所述多個預測單元中的至少一個相鄰預測單元的預測值,對所述多個預測單元中被預測的預測單元進行幀內(nèi)預測來產(chǎn)生所述多個編碼單元的殘差值。
5.如權(quán)利要求I所述的方法,其中,所述執(zhí)行預測的步驟包括通過對包括在所述多個編碼單元中的所有預測單元進行幀間預測來產(chǎn)生所述多個編碼單元的殘差值。
6.一種用于對圖像進行編碼的設備,所述設備包括 預測器,對圖像的多個編碼單元執(zhí)行預測,并基于預測的多個編碼單元產(chǎn)生多個預測單元; 變換器,將所述多個預測單元組合為變換單元,基于變換單元將包括在組合的多個預測單元中的殘差值變換到頻域,并變換為頻域的頻率分量系數(shù); 量化器,對頻率分量系數(shù)進行量化;以及 熵編碼器,對量化的頻率分量系數(shù)進行熵編碼。
7.一種對圖像進行解碼的方法,所述方法包括 對從變換單元的多個預測單元的變換的殘差值產(chǎn)生的頻域的頻率分量系數(shù)進行熵解碼,其中,所述多個預測單元包括在圖像的多個編碼單元中; 對經(jīng)過熵解碼的頻率分量系數(shù)進行反量化; 將反量化的頻率分量系數(shù)逆變換到像素域,作為包括在變換單元中的所述多個編碼單元的恢復的殘差值;以及 基于恢復的殘差值,恢復所述多個編碼單元。
8.如權(quán)利要求7所述的方法,其中,基于指示將最大編碼單元分層減小到所述多個編碼單元的程度的所述多個預測單元的深度,變換單元的所述多個預測單元在變換單元中被組合在一起。
9.如權(quán)利要求7所述的方法,其中,通過選擇所述多個預測單元中的根據(jù)預測模式的類型被執(zhí)行預測的相鄰預測單元,所述多個預測單元在變換單元中被組合在一起。
10.如權(quán)利要求7所述的方法,其中,所述恢復步驟包括基于恢復的殘差值和預測值來恢復所述多個編碼單元,其中,所述預測值通過基于至少一個相鄰預測單元的預測值,對包括在所述多個編碼單元中的所述多個預測單元中被預測的預測單元進行幀內(nèi)預測而產(chǎn)生。
11.一種用于對圖像進行解碼的設備,所述設備包括 熵解碼器,對從變換單元的多個預測單元的變換的殘差值產(chǎn)生的頻域的頻率分量系數(shù)進行熵編碼,其中,所述多個預測單元包括在圖像的多個編碼單元中; 反量化器,對經(jīng)過熵解碼的頻率分量系數(shù)進行反量化; 逆變換器,將反量化的頻率分量系數(shù)逆變換到像素域,作為包括在變換單元中的所述多個編碼單元的恢復的殘差值;以及 恢復器,基于恢復的殘差值,恢復所述多個編碼單元。
12.如權(quán)利要求11所述的設備,其中,基于指示將最大編碼單元分層減小到所述多個編碼單元的程度的所述多個預測單元的深度,變換單元的所述多個預測單元在變換單元中被組合在一起。
13.如權(quán)利要求11所述的設備,其中,通過選擇所述多個預測單元中的根據(jù)預測模式的類型被執(zhí)行預測的相鄰預測單元,所述多個預測單元在變換單元中被組合在一起。
14.如權(quán)利要求13所述的設備,其中,恢復器基于恢復的殘差值和預測值來恢復所述多個編碼單元,其中,所述預測值通過基于至少一個相鄰預測單元的預測值,對包括在所述多個編碼單元中的所述多個預測單元中被預測的預測單元進行幀內(nèi)預測而產(chǎn)生。
15.一種其上記錄有用于執(zhí)行權(quán)利要求I到5以及權(quán)利要求7到10之一的方法的程序的計算機可讀記錄介質(zhì)。
全文摘要
一種通過將一組預測單元變換到頻域?qū)D像進行編碼的方法??赏ㄟ^使用所述一組預測單元中的預測單元的預測值,而不使用通過對所述一組預測單元中的其他預測單元進行編碼并隨后恢復所述其他預測單元而產(chǎn)生的像素來預測所述預測單元。因此,作為組合預測單元的結(jié)果,可提高編碼壓縮率。
文檔編號H04N7/32GK102792695SQ201180013432
公開日2012年11月21日 申請日期2011年1月14日 優(yōu)先權(quán)日2010年1月14日
發(fā)明者千岷洙, 李泰美, 鄭海慶, 金壹求, 陳建樂, 韓宇鎮(zhèn) 申請人:三星電子株式會社