專利名稱:用于對變換系數(shù)進(jìn)行熵編碼/熵解碼的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及變換系數(shù)的熵編碼和熵解碼,更具體地講,涉及一種對關(guān)于變換塊中的最后有效變換系數(shù)的位置的信息進(jìn)行有效的熵編碼和熵解碼的方法和設(shè)備。
背景技術(shù):
根據(jù)諸如H.264和MPEG-4的國際視頻編碼標(biāo)準(zhǔn),視頻信號被分層劃分為序列、幀、條帶、宏塊和塊,并且塊是最小處理單元。在編碼處理中,通過執(zhí)行幀內(nèi)預(yù)測或幀間預(yù)測獲得塊的殘差數(shù)據(jù)。此外,通過執(zhí)行變換、量化、掃描、行程編碼和熵編碼來壓縮殘差數(shù)據(jù)。解碼處理是編碼處理的逆處理。首先,從比特流提取在熵編碼處理中產(chǎn)生的變換塊的系數(shù)。然后,通過執(zhí)行反量化和逆變換來重構(gòu)塊的殘差數(shù)據(jù),預(yù)測信息用于重構(gòu)塊的視頻數(shù)據(jù)。
發(fā)明內(nèi)容
技術(shù)問題本發(fā)明提供一種對關(guān)于具有大尺寸的變換塊中的最后有效變換系數(shù)的位置的信息進(jìn)行有效的熵編碼和熵解碼的方法和設(shè)備。技術(shù)方案根據(jù)本發(fā)明的實(shí)施例,通過使用變換塊中的最后有效變換系數(shù)的橫軸方向位置和縱軸方向位置來對關(guān)于變換塊中的最后有效變換系數(shù)的位置的信息進(jìn)行編碼。有益效果根據(jù)本發(fā)明,可有效地表示包括在具有大尺寸的變換塊中的最后有效變換系數(shù)的位置,并且可獨(dú)立于對變換系數(shù)進(jìn)行解碼的處理來對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行解碼。
圖1是根據(jù)本發(fā)明實(shí)施例的圖像編碼設(shè)備的框圖。圖2是根據(jù)本發(fā)明實(shí)施例的圖像解碼設(shè)備的框圖。圖3是示出根據(jù)本發(fā)明實(shí)施例的分層編碼單元的示圖。圖4是根據(jù)本發(fā)明實(shí)施例的基于編碼單元的圖像編碼器的框圖。圖5是根據(jù)本發(fā)明實(shí)施例的基于編碼單元的圖像解碼器的框圖。圖6是示出根據(jù)本發(fā)明實(shí)施例的最大編碼單元、子編碼單元和預(yù)測單元的示圖。圖7是示出根據(jù)本發(fā)明實(shí)施例的編碼單元和變換單元的示圖。圖8A和圖SB是示出根據(jù)本發(fā)明實(shí)施例的編碼單元、預(yù)測單元和變換單元的劃分形狀的示圖。圖9是根據(jù)本發(fā)明實(shí)施例的對變換系數(shù)進(jìn)行熵編碼的方法的流程圖。圖10是用于描述根據(jù)本發(fā)明實(shí)施例的對變換系數(shù)進(jìn)行熵編碼的處理的參考示圖。
圖11是根據(jù)本發(fā)明實(shí)施例的熵編碼設(shè)備的框圖。圖12是根據(jù)本發(fā)明實(shí)施例的上下文自適應(yīng)二進(jìn)制算術(shù)編碼(CABAC)裝置的框圖。圖13是用于描述根據(jù)本發(fā)明實(shí)施例的選擇用于對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行編碼的上下文的處理的參考示圖。圖14示出與圖10相應(yīng)的有效映射。圖15是用于描述在圖10中示出的對包括在變換塊中的有效變換系數(shù)的級別值進(jìn)行編碼的處理的參考示圖。圖16是示出根據(jù)本發(fā)明實(shí)施例使用的多個可變長度編碼(VLC)表的示例的示圖。圖17是用于描述根據(jù)本發(fā)明另一實(shí)施例的對變換系數(shù)進(jìn)行熵編碼的方法的參考示圖。圖1SA和圖18B是用于描述根據(jù)本發(fā)明另一實(shí)施例的對變換系數(shù)進(jìn)行熵編碼的方法的參考示圖。圖19是根據(jù)本發(fā)明實(shí)施例的對變換系數(shù)進(jìn)行熵解碼的方法的流程圖。圖20是根據(jù)本發(fā)明實(shí)施例的熵解碼設(shè)備的框圖。最佳模式根據(jù)本發(fā)明的一方面,提供一種對變換系數(shù)進(jìn)行熵編碼的方法,所述方法包括:根據(jù)特定掃描順序,確定包括在具有特定尺寸的變換塊中的變換系數(shù)之中具有非零值的最后有效變換系數(shù)的位置;通過使用變換塊中的最后有效變換系數(shù)的橫軸方向位置和最后有效變換系數(shù)的縱軸方向位置來對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行編碼。根據(jù)本發(fā)明的另一方面,提供一種對變換系數(shù)進(jìn)行熵解碼的方法,所述方法包括:根據(jù)特定掃描順序,從接收的比特流提取關(guān)于具有非零值且包括在變換塊中的最后有效變換系數(shù)的橫軸方向位置和縱軸方向位置的信息;通過對關(guān)于橫軸方向位置和縱軸方向位置的信息進(jìn)行解碼來確定最后有效變換系數(shù)的位置。根據(jù)本發(fā)明的另一方面,提供一種對變換系數(shù)進(jìn)行熵編碼的設(shè)備,所述設(shè)備包括:熵編碼器,根據(jù)特定掃描順序,確定包括在具有特定尺寸的變換塊中的變換系數(shù)之中具有非零值的最后有效變換系數(shù)的位置,并通過使用變換塊中的最后有效變換系數(shù)的橫軸方向位置和最后有效變換系數(shù)的縱軸方向位置來對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行編碼。根據(jù)本發(fā)明的另一方面,提供一種對變換系數(shù)進(jìn)行熵解碼的設(shè)備,所述設(shè)備包括:熵解碼器,根據(jù)特定掃描順序,從接收的比特流提取關(guān)于具有非零值且包括在變換塊中的最后有效變換系數(shù)的橫軸方向位置和縱軸方向位置的信息,并通過對關(guān)于橫軸方向位置和縱軸方向位置的信息進(jìn)行解碼來確定最后有效變換系數(shù)的位置。
具體實(shí)施例方式在下文中,將通過參照附圖解釋本發(fā)明的實(shí)施例來詳細(xì)描述本發(fā)明。圖1是根據(jù)本發(fā)明實(shí)施例的圖像編碼設(shè)備100的框圖。參照圖1,圖像編碼設(shè)備100包括最大編碼單元劃分器110、編碼深度確定器120、圖像數(shù)據(jù)編碼器130和編碼信息編碼器140。最大編碼單元劃分器110可基于作為最大尺寸的編碼單元的最大編碼單元對當(dāng)前幀或當(dāng)前條帶進(jìn)行劃分??蓪?dāng)前幀或當(dāng)前條帶劃分為至少一個最大編碼單元。根據(jù)本發(fā)明實(shí)施例,可使用最大編碼單元和深度來表示編碼單元。如上所述,最大編碼單元表示在當(dāng)前幀的編碼單元中具有最大尺寸的編碼單元,深度表示編碼單元在尺寸上如何分層地減小。隨著深度增大,編碼單元在尺寸上可從最大編碼單元減小到最小編碼單元,最大編碼單元的深度可被定義為最小深度,而最小編碼單元的深度可被定義為最大深度。由于編碼單元在尺寸上隨著深度增大而從最大編碼單元減小,因此深度為k的子編碼單元可包括多個具有大于k的深度的子編碼單元。當(dāng)將被編碼的幀具有大尺寸時,如果以大的單元對圖像進(jìn)行編碼,則可以以高的圖像壓縮率對圖像進(jìn)行編碼。然而如果編碼單元的尺寸增大并且被固定,則無法通過反映圖像的連續(xù)改變特性來有效地對圖像進(jìn)行編碼。例如,當(dāng)對諸如海洋或天空的圖像的平滑圖像進(jìn)行編碼時,如果編碼單元尺寸增大,則壓縮率可提高。然而,當(dāng)對諸如人或建筑物的圖像的復(fù)雜圖像進(jìn)行編碼時,如果編碼單元尺寸減小,則壓縮率提高。為此,根據(jù)本發(fā)明實(shí)施例,將不同尺寸的最大編碼單元和不同的最大深度設(shè)置到不同的幀或條帶。因?yàn)樽畲笊疃缺硎揪幋a單元在尺寸上可減小的最大次數(shù),所以包括在最大編碼單元中的最小編碼單元的尺寸可根據(jù)最大深度被可變地設(shè)置。編碼深度確定器120確定最大深度。可基于率失真(R-D)成本來確定最大深度。最大深度可被不同地確定到每個幀或條帶或者每個最大編碼單元。關(guān)于確定的最大深度的信息被輸出到編碼信息編碼器140,每個最大編碼單元的圖像數(shù)據(jù)被輸出到圖像數(shù)據(jù)編碼器 130。最大深度表示在最大編碼單元中具有最小尺寸的編碼單元,即,最小編碼單元。換句話說,可根據(jù)不同深度將最大編碼單元劃分為不同尺寸的子編碼單元。以下將參照圖8A和圖SB對此進(jìn)行詳細(xì)描述。此外,可基于不同尺寸的處理單元對包括在最大編碼單元中的不同尺寸的子編碼單元進(jìn)行預(yù)測或正交變換。換句話說,圖像編碼設(shè)備100可基于各種尺寸和各種形狀的處理單元執(zhí)行多種用于圖像編碼的處理。當(dāng)諸如預(yù)測、正交變換和熵編碼的三種處理被執(zhí)行以對圖像數(shù)據(jù)進(jìn)行編碼時,可在所有處理中使用相同尺寸的處理單元,或者可在不同處理中使用不同尺寸的處理單元。例如,圖像編碼設(shè)備100可選擇與特定編碼單元不同的處理單元以預(yù)測編碼單
J Li ο如果編碼單元具有2NX2N(其中,N是正整數(shù))的尺寸,則用于預(yù)測的處理單元可具有2NX2N、2NXN、NX2N、NXN等的尺寸。換句話說,可基于具有通過將編碼單元的高度和寬度中的至少一個二等分而獲得的尺寸的處理單元來執(zhí)行運(yùn)動預(yù)測。在下文中,用于預(yù)測的處理單元被稱為“預(yù)測單元”。預(yù)測模式可以是幀內(nèi)模式、幀間模式和跳過模式中的至少一個,并且可僅對特定尺寸或特定形狀的預(yù)測單元執(zhí)行特定的預(yù)測模式。例如,可僅對具有2NX2N或NXN的尺寸的正方形的預(yù)測單元執(zhí)行幀內(nèi)模式。此外,可僅對具有2NX2N的尺寸的預(yù)測單元執(zhí)行跳過模式。如果編碼單元包括多個預(yù)測單元,則可對每個預(yù)測單元執(zhí)行預(yù)測,并可選擇具有最小編碼誤差的預(yù)測單元。此外,圖像編碼設(shè)備100可基于具有與編碼單元的尺寸不同的尺寸的處理單元對圖像數(shù)據(jù)進(jìn)行正交變換??苫诔叽缧∮诨虻扔诰幋a單元的尺寸的數(shù)據(jù)單元對編碼單元進(jìn)行正交變換。在下文中,用于正交變換的處理單元被稱為“變換單元”。編碼深度確定器120可通過使用基于拉格朗日乘數(shù)(Lagrangian multiplier)的率失真最優(yōu)化來確定包括在最大編碼單元中的子編碼單元。換句話說,可確定最大編碼單元被劃分為多個子編碼單元的劃分形狀。這里,多個子編碼單元根據(jù)深度具有不同的尺寸。其后,圖像數(shù)據(jù)編碼器130通過基于由編碼深度確定器120確定的劃分形狀對最大編碼單元進(jìn)行編碼來輸出比特流。編碼信息編碼器140對關(guān)于由編碼深度確定器120確定的最大編碼單元的編碼模式的信息進(jìn)行編碼。通過對關(guān)于最大編碼單元的劃分形狀的信息、關(guān)于最大深度的信息以及關(guān)于根據(jù)深度的子編碼單元的編碼模式的信息進(jìn)行編碼來輸出比特流。關(guān)于子編碼單元的編碼模式的信息可包括例如關(guān)于子編碼單元的預(yù)測單元的信息、關(guān)于預(yù)測單元的預(yù)測模式的信息和關(guān)于子編碼單元的變換單元的信息。關(guān)于最大編碼單元的劃分形狀的信息可以是表示每個編碼單元是否被劃分的信息。例如,當(dāng)最大編碼單元被劃分和編碼時,表示最大編碼單元是否被劃分的信息被編碼。此外,當(dāng)通過劃分最大編碼單元而產(chǎn)生的子編碼單元被劃分和編碼時,表示每個子編碼單元是否被劃分的信息被編碼。表示編碼單元是否被劃分的信息可以是表示編碼單元是否被劃分的標(biāo)志信息。因?yàn)樽畲缶幋a單元包括不同尺寸的子編碼單元,并且關(guān)于每個子編碼單元的編碼模式的信息必須被確定,所以針對一個最大編碼單元可確定關(guān)于至少一個編碼模式的信
肩、O隨著深度加深,圖像編碼設(shè)備100可通過劃分最大編碼單元的高度和寬度來產(chǎn)生子編碼單元。也就是說,如果深度為k的編碼單元具有2NX2N的尺寸,則深度為k+Ι的編碼單元具有NXN的尺寸。因此,圖像編碼設(shè)備100可基于考慮圖像特性的最大編碼單元的尺寸和最大深度來確定每個最大編碼單元的最優(yōu)劃分形狀。通過考慮圖像特性可變地調(diào)整最大編碼單元的尺寸并通過將最大編碼單元劃分成具有不同深度的子編碼單元來對圖像進(jìn)行編碼,可有效地對具有各種分辨率的圖像進(jìn)行編碼。圖2是根據(jù)本發(fā)明實(shí)施例的圖像解碼設(shè)備200的框圖。參照圖2,圖像解碼設(shè)備200包括圖像數(shù)據(jù)獲取器210、編碼信息提取器220和圖像數(shù)據(jù)解碼器230。圖像數(shù)據(jù)獲取器210解析圖像解碼設(shè)備200接收的比特流,獲得每個最大編碼單元的圖像數(shù)據(jù)并將每個最大編碼單元的圖像數(shù)據(jù)輸出到圖像數(shù)據(jù)解碼器230。圖像數(shù)據(jù)獲取器210可從當(dāng)前幀或當(dāng)前條帶的頭提取關(guān)于當(dāng)前幀或當(dāng)前條帶的最大編碼單元的信息。換句話說,比特流被劃分為最大編碼單元,以允許圖像數(shù)據(jù)解碼器230對每個最大編碼單元的圖像數(shù)據(jù)進(jìn)行解碼。編碼信息提取器220解析圖像解碼設(shè)備200接收的比特流,并從當(dāng)前幀的頭提取關(guān)于最大編碼單元、最大深度、最大編碼單元的劃分形狀和子編碼單元的編碼模式的信息。關(guān)于劃分形狀和編碼模式的信息被輸出到圖像數(shù)據(jù)解碼器230。關(guān)于最大編碼單元的劃分形狀的信息可包括關(guān)于包括在最大編碼單元中并且根據(jù)深度具有不同尺寸的子編碼單元的信息。如上關(guān)于圖1所述,關(guān)于劃分形狀的信息可以是編碼的表示每個編碼單元是否被劃分的信息(例如,標(biāo)志信息)。關(guān)于編碼模式的信息可包括例如關(guān)于預(yù)測單元的信息、關(guān)于預(yù)測模式的信息、關(guān)于子編碼單元的變換單元的信息。圖像數(shù)據(jù)解碼器230通過基于編碼信息提取器220提取的信息對每個最大編碼單元的圖像數(shù)據(jù)進(jìn)行解碼,來恢復(fù)當(dāng)前幀。圖像數(shù)據(jù)解碼器230可基于關(guān)于最大編碼單元的劃分形狀的信息對包括在最大編碼單元中的子編碼單元進(jìn)行解碼。解碼處理可包括幀間預(yù)測處理(包括幀內(nèi)預(yù)測和運(yùn)動補(bǔ)償)以及逆正交變換處理。圖像數(shù)據(jù)解碼器230可基于關(guān)于預(yù)測單元的信息和關(guān)于子編碼單元的預(yù)測模式的信息執(zhí)行幀內(nèi)預(yù)測和幀間預(yù)測,以預(yù)測子編碼單元。此外,圖像數(shù)據(jù)解碼器230可基于關(guān)于子編碼單元的變換單元的信息對每個子編碼單元執(zhí)行逆正交變換。圖3是示出根據(jù)本發(fā)明實(shí)施例的分層編碼單元的示圖。參照圖3,分層編碼單元可包括寬度X高度為64X64、32X32、16X16、8X8和4X4的編碼單元。除了正方形的編碼單元,還可存在寬度X高度為64X32、32X64、32X16、16X32、16X8、8X16、8X4 和 4X8 的編碼單元。在圖3中,對于分辨率為1920X 1080的圖像數(shù)據(jù)310,最大編碼單元的尺寸被設(shè)置為64 X 64,最大深度被設(shè)置為2。對于分辨率為1920X1080的另一圖像數(shù)據(jù)320,最大編碼單元的尺寸被設(shè)置為64X 64,最大深度被設(shè)置為4。對于分辨率為352X288的圖像數(shù)據(jù)330,最大編碼單元的尺寸被設(shè)置為16 X 16,最大深度被設(shè)置為2。如果分辨率高或者數(shù)據(jù)量大,則為了提高壓縮率并且為了準(zhǔn)確反映圖像特性,最大編碼尺寸可以相對大。因此,對于分辨率高于圖像數(shù)據(jù)330的分辨率的圖像數(shù)據(jù)310和320,最大編碼單元的尺寸可以被選擇為64X64。最大深度表示分層編碼單元的總層數(shù)。因?yàn)閳D像數(shù)據(jù)310的最大深度為2,所以圖像數(shù)據(jù)310的編碼單元315可包括具有長軸大小64的最大編碼單元以及隨著深度加深而具有長軸大小32和16的子編碼單元。同時,因?yàn)閳D像數(shù)據(jù)330的最大深度為2,所以圖像數(shù)據(jù)330的編碼單元335可包括具有長軸大小16的最大編碼單元以及隨著深度加深而具有長軸大小8和4的子編碼單
J Li ο因?yàn)閳D像數(shù)據(jù)320的最大深度為4,所以圖像數(shù)據(jù)320的編碼單元325可包括具有長軸大小64的最大編碼單元以及隨著深度加深而具有長軸大小32、16、8和4的子編碼單元。這樣,因?yàn)殡S著深度加深基于小的子編碼單元對圖像進(jìn)行編碼,所以可適當(dāng)?shù)貙Πㄔ敿?xì)場景的圖像進(jìn)行編碼。圖4是根據(jù)本發(fā)明實(shí)施例的基于編碼單元的圖像編碼器400的框圖。幀內(nèi)預(yù)測器410對當(dāng)前幀405中的幀內(nèi)模式的預(yù)測單元執(zhí)行幀內(nèi)預(yù)測,運(yùn)動估計(jì)器420和運(yùn)動補(bǔ)償器425通過使用當(dāng)前幀405以及參考幀495分別對幀間模式的預(yù)測單元執(zhí)行幀間預(yù)測和運(yùn)動補(bǔ)償?;趶膸瑑?nèi)預(yù)測器410、運(yùn)動估計(jì)器420和運(yùn)動補(bǔ)償器425輸出的預(yù)測單元來產(chǎn)生殘差值,產(chǎn)生的殘差值經(jīng)過正交變換器430和量化器440,從而被輸出為量化的變換系數(shù)。
量化的變換系數(shù)經(jīng)過反量化器460和逆頻率變換器470,從而被恢復(fù)為殘差值,恢復(fù)的殘差值通過去塊器480和環(huán)路濾波單元490被后處理,從而被輸出為參考幀495。量化的變換系數(shù)還可經(jīng)過熵編碼器450,從而被輸出為比特流455。為了基于根據(jù)本發(fā)明實(shí)施例的圖像編碼方法對圖像進(jìn)行編碼,圖像編碼器400的所有組件(即,幀內(nèi)預(yù)測器410、運(yùn)動估計(jì)器420、運(yùn)動補(bǔ)償器425、正交變換器430、量化器440、熵編碼器450、反量化器460、逆頻率變換器470、去塊器480和環(huán)路濾波單元490)基于最大編碼單元、根據(jù)深度的子編碼單元、預(yù)測單元和變換單元執(zhí)行圖像編碼處理。圖5是根據(jù)本發(fā)明實(shí)施例的基于編碼單元的圖像解碼器500的框圖。比特流505經(jīng)過解析器510,從而被解析為將被解碼的編碼的圖像數(shù)據(jù)以及對編碼的圖像數(shù)據(jù)進(jìn)行解碼所需要的編碼信息。編碼的圖像數(shù)據(jù)經(jīng)過熵解碼器520和反量化器530,從而被輸出為反量化的數(shù)據(jù),并經(jīng)過逆頻率變換器540,從而被恢復(fù)為殘差值。殘差值與幀內(nèi)預(yù)測器550執(zhí)行的幀內(nèi)預(yù)測的結(jié)果以及運(yùn)動補(bǔ)償器560執(zhí)行的運(yùn)動補(bǔ)償?shù)慕Y(jié)果相力口,從而被恢復(fù)為編碼單元?;謴?fù)的編碼單元經(jīng)過去塊器570和環(huán)路濾波單元580,從而被用于對下一編碼單元進(jìn)行解碼或預(yù)測下一幀。為了基于根據(jù)本發(fā)明實(shí)施例的圖像解碼方法對圖像進(jìn)行解碼,圖像解碼器500的所有組件(即,解析器510、熵解碼器520、反量化器530、逆頻率變換器540、幀內(nèi)預(yù)測器550、運(yùn)動補(bǔ)償器560、去塊器570和環(huán)路濾波單元580)基于最大編碼單元、根據(jù)深度的子編碼單元、預(yù)測單元和變換單元執(zhí)行圖像解碼處理。具體地講,幀內(nèi)預(yù)測器550和運(yùn)動補(bǔ)償器560考慮最大編碼單元和深度來確定子編碼單元中的預(yù)測單元和預(yù)測模式,逆頻率變換器540考慮變換單元的尺寸來執(zhí)行逆正交變換。圖6是示出根據(jù)本發(fā)明實(shí)施例的最大編碼單元、子編碼單元和預(yù)測單元的示圖。圖1中示出的圖像編碼設(shè)備100和圖2中示出的圖像解碼設(shè)備200使用分層編碼單元,以考慮圖像特性來執(zhí)行編碼和解碼??筛鶕?jù)圖像特性自適應(yīng)地設(shè)置最大編碼單元和最大深度,或者可根據(jù)用戶的請求不同地設(shè)置最大編碼單元和最大深度。圖6示出編碼單元的分層結(jié)構(gòu)600,在該編碼單元中,最大編碼單元610的高度和寬度均為64,最大深度為4。深度根據(jù)編碼單元的分層結(jié)構(gòu)600的縱軸加深,子編碼單元620、630、640和650的寬度和高度隨著深度加深而減小。此外,沿著編碼單元的分層結(jié)構(gòu)600的橫軸,示出最大編碼單元610以及子編碼單元620、630、640和650的預(yù)測單元。最大編碼單元610具有深度0,并且具有尺寸(S卩,寬度X高度)64 X 64。深度沿著縱軸加深,并且存在尺寸為32 X 32、深度為I的子編碼單元620、尺寸為16 X 16、深度為2的子編碼單元630、尺寸為8 X 8、深度為3的子編碼單元640以及尺寸為4X 4、深度為4的子編碼單元650。尺寸為4X4、深度為4的子編碼單元650是最小編碼單元。參照圖6,沿著橫軸示出根據(jù)深度的預(yù)測單元的示例。也就是說,深度為O的最大編碼單元610可包括尺寸為64X64的預(yù)測單元610、尺寸為64X32的預(yù)測單元612、尺寸為32X64的預(yù)測單元614、尺寸為32X32的預(yù)測單元616,這些預(yù)測單元的尺寸等于或小于編碼單元610的尺寸(S卩,64 X 64)。深度為1、尺寸為32X32的編碼單元620可包括尺寸為32X32的預(yù)測單元620、尺寸為32X16的預(yù)測單元622、尺寸為16X32的預(yù)測單元624、尺寸為16X16的預(yù)測單元626,這些預(yù)測單元的尺寸等于或小于編碼單元620的尺寸(即,32 X 32)。深度為2、尺寸為16X16的編碼單元630可包括尺寸為16X16的預(yù)測單元630、尺寸為16X8的預(yù)測單元632、尺寸為8X16的預(yù)測單元634、尺寸為8X8的預(yù)測單元636,這些預(yù)測單元的尺寸等于或小于編碼單元630的尺寸(S卩,16 X 16)。深度為3、尺寸為8X8的編碼單元640可包括尺寸為8X8的預(yù)測單元640、尺寸為8X4的預(yù)測單元642、尺寸為4X8的預(yù)測單元644、尺寸為4X4的預(yù)測單元646,這些預(yù)測單元的尺寸等于或小于編碼單元640的尺寸(即,8X8)。最后,深度為4、尺寸為4 X 4的編碼單元650具有最大深度,并包括尺寸為4 X 4的預(yù)測單元650。然而,具有最大深度的編碼單元650不是必然需要包括尺寸等于編碼單元的尺寸的預(yù)測單元,而是可以像其它編碼單元610、620、630和640那樣,為了預(yù)測被劃分為尺寸小于編碼單元的尺寸的預(yù)測單元。圖7是示出根據(jù)本發(fā)明實(shí)施例的編碼單元和變換單元的示圖。圖1中示出的圖像編碼設(shè)備100和圖2中示出的圖像解碼設(shè)備200對最大編碼單元或從最大編碼單元劃分且尺寸小于最大編碼單元的尺寸的子編碼單元進(jìn)行編碼。可選擇用于在編碼處理中執(zhí)行正交變換的變換單元的尺寸以實(shí)現(xiàn)最高的壓縮率,而不管編碼單元和預(yù)測單元。例如,如果當(dāng)前編碼單元710具有64X64的尺寸,則可通過使用具有32X32的尺寸的變換單元720來執(zhí)行正交變換。此外,可設(shè)置尺寸大于編碼單元的尺寸的變換單
J Li ο圖8A和圖SB是示出根據(jù)本發(fā)明實(shí)施例的編碼單元、預(yù)測單元和變換單元的劃分形狀的示圖。圖8A示出根據(jù)本發(fā)明實(shí)施例的編碼單元和預(yù)測單元。圖8A的左側(cè)示出圖1中示出的圖像編碼設(shè)備100選擇以對最大編碼單元810進(jìn)行編碼的劃分形狀。圖像編碼設(shè)備100將最大編碼單元810劃分為各種形狀并對各種形狀進(jìn)行編碼,基于R-D成本比較編碼的劃分形狀,并選擇最優(yōu)的劃分形狀。如果最優(yōu)的劃分形狀對應(yīng)于最大編碼單元810,則可直接對最大編碼單元810進(jìn)行編碼,而無需如圖8A所示劃分最大編碼單元810。參照圖8A的左側(cè),深度為O的最大編碼單元810被劃分并編碼為深度等于或大于I的子編碼單元。最大編碼單元810被劃分為四個深度為I的子編碼單元,然后所有或部分深度為I的子編碼單元被劃分為深度為2的子編碼單元。在深度為I的子編碼單元中,右上方子編碼單元和左下方子編碼單元被劃分為深度等于或大于2的子編碼單元。部分深度等于或大于2的子編碼單元可被劃分為深度等于或大于3的子編碼單元。圖8A的右側(cè)示出關(guān)于最大編碼單元810的預(yù)測單元860的劃分形狀。參照圖8A的右側(cè),關(guān)于最大編碼單元810的預(yù)測單元860可與最大編碼單元810不同地被劃分。換句話說,關(guān)于每個子編碼單元的預(yù)測單元可小于子編碼單元。例如,在深度為I的子編碼單元中,關(guān)于右下方子編碼單元854的預(yù)測單元可以小于子編碼單元854。在深度為2的子編碼單元814、816、818、828、850和852中,關(guān)于部分子編碼單元814、816、850和852的預(yù)測單元可小于子編碼單元814、816、850和852。此外,關(guān)于深度為3的子編碼單元822、832和848的預(yù)測單元可小于子編碼單元822、832和848。預(yù)測單元可具有通過將每個子編碼單元沿高度或?qū)挾确较騽澐譃閮蓚€單元而獲得的形狀,或者具有通過將每個子編碼單元沿高度和寬度方向劃分為四個單元而獲得的形狀。圖SB示出根據(jù)本發(fā)明實(shí)施例的預(yù)測單元和變換單元。圖8B的左側(cè)示出關(guān)于最大編碼單元810的預(yù)測單元860的劃分形狀,圖8B的右側(cè)示出關(guān)于最大編碼單元810的變換單元870的劃分形狀。參照圖8B的右側(cè),變換單元870可以與預(yù)測單元860不同地被劃分。例如,雖然關(guān)于深度為I的編碼單元854的預(yù)測單元被選擇為通過將編碼單元854的高度二等分獲得的形狀,但是關(guān)于編碼單元854的變換單元可以被選擇為尺寸等于編碼單元854的尺寸。同樣地,雖然關(guān)于深度為2的編碼單元814和850的預(yù)測單元被選擇為通過將編碼單元814和850的高度二等分獲得的形狀,但是關(guān)于編碼單元814和850的變換單元可以被選擇為尺寸等于編碼單元814和850的尺寸。變換單元可以被選擇為尺寸小于預(yù)測單元的尺寸。例如,如果關(guān)于深度為2的編碼單元852的預(yù)測單元被選擇為通過將編碼單元852的寬度二等分獲得的形狀,則變換單元可以被選擇為尺寸小于預(yù)測單元的尺寸且通過將編碼單元852的高度和寬度二等分獲得形狀。還可設(shè)置尺寸為2X2的最小變換單元。還可不管編碼單元的尺寸來設(shè)置變換單元(例如,尺寸大于編碼單元的尺寸)?,F(xiàn)在將詳細(xì)描述圖4中示出的圖像編碼設(shè)備400的熵編碼器450執(zhí)行的熵編碼處理和圖5中示出的圖像解碼設(shè)備500的熵解碼器520執(zhí)行的熵解碼處理。如上關(guān)于圖4和圖5所述,圖像編碼設(shè)備400和圖像解碼設(shè)備500對最大編碼單元或從最大編碼單元劃分的尺寸小于最大編碼單元的尺寸的子編碼單元進(jìn)行編碼。可選擇用于在編碼處理中執(zhí)行正交變換的變換單元的尺寸以實(shí)現(xiàn)最高壓縮率,而不管編碼單元和預(yù)測單元。例如,如果當(dāng)前編碼單元具有64X64的尺寸,則可通過使用具有32X32的尺寸的變換單元來執(zhí)行正交變換。此外,可設(shè)置尺寸大于編碼單元的尺寸的變換單元。在傳統(tǒng)的編碼處理(例如,H.264)中,對基于具有相對小尺寸(例如4X4)的變換單元變換和量化的殘差數(shù)據(jù)進(jìn)行熵編碼。然而,根據(jù)本發(fā)明實(shí)施例,因?yàn)閷⒈混鼐幋a的變換單元(以下稱為“變換塊”)可具有相對大的尺寸16X16、32X32、64X64或128X128以及4X4或8X8,所以表示在具有非零值的有效變換系數(shù)之間具有值O的連續(xù)系數(shù)的數(shù)量的行程的長度可增加,需要對大行程值進(jìn)行適當(dāng)?shù)木幋a。此外,根據(jù)傳統(tǒng)技術(shù),為了對包括在變換塊中的系數(shù)的信息進(jìn)行編碼,作為表示每個有效變換系數(shù)是否是最后有效變換系數(shù)的語法元素的last_signifiCant_COeff_flag連同表示具有非零值的有效變換系數(shù)的位置的有效映射一起被熵編碼。然而,如果變換塊連同有效映射和last_significant_coeff_flag —起被熵編碼,則應(yīng)該在熵解碼處理中確定每個有效變換系數(shù)是否是最后有效變換系數(shù)。因此,根據(jù)傳統(tǒng)技術(shù),無法從接收的比特流容易地、直接地識別表示全部有效變換系數(shù)的數(shù)據(jù)。因此,根據(jù)本發(fā)明實(shí)施例,提供了對關(guān)于具有大尺寸的變換塊中的最后有效變換系數(shù)的位置的信息進(jìn)行有效的熵編碼和熵解碼的方法。圖9是根據(jù)本發(fā)明實(shí)施例的對變換系數(shù)進(jìn)行熵編碼的方法的流程圖。參照圖9,在操作910,熵編碼器450根據(jù)特定掃描順序,從具有非零值且包括在具有特定尺寸的變換塊中的有效變換系數(shù)中確定最后有效變換系數(shù)的位置。更具體地講,如果包括通過執(zhí)行變換和量化處理而獲得的變換系數(shù)的變換塊被輸入,則熵編碼器450根據(jù)特定掃描順序(例如,Z字形掃描順)確定包括在變換塊中的有效變換系數(shù),并確定最后掃描到的最后有效變換系數(shù)的位置。在操作920,熵編碼器450通過使用變換塊中的最后有效變換系數(shù)的橫軸方向位置和縱軸方向位置對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行編碼。如果最后有效變換系數(shù)位于從變換塊的左上位置開始的橫軸方向的第X位置(X是等于或大于O的整數(shù))和縱軸方向的第y位置(y是等于或大于O的整數(shù)),則熵編碼器450對表示最后有效變換系數(shù)的位置的值X和I進(jìn)行編碼。根據(jù)傳統(tǒng)技術(shù),對表示每個有效變換系數(shù)是否是最后有效變換系數(shù)的last_significant_coeff_flag進(jìn)行編碼。然而,根據(jù)本發(fā)明實(shí)施例,僅對表示變換塊中的最后有效變換系數(shù)的位置的坐標(biāo)信息進(jìn)行編碼??赏ㄟ^使用上下文自適應(yīng)二進(jìn)制算術(shù)編碼(CABAC)方法或可變長度編碼(VLC)方法對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行編碼。以下將描述通過使用CABAC或VLC對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行編碼的方法。在對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行編碼之后,熵編碼器450對位于變換塊中的每個有效變換系數(shù)的級別信息進(jìn)行編碼。熵編碼器450可對每個有效變換系數(shù)的符號值和絕對值進(jìn)行編碼,作為級別信息。圖10是用于描述根據(jù)本發(fā)明實(shí)施例的對變換系數(shù)進(jìn)行熵編碼的處理的參考示圖。參照圖10,熵編碼器450根據(jù)Z字形掃描順序掃描變換塊1000中的變換系數(shù)。假設(shè)圖10中所有空的空間表示具有值“O”的變換系數(shù)。在圖10中,最后有效變換系數(shù)是具有值“-1”的變換系數(shù)1010。如圖10所示,具有值“-1”的最后有效變換系數(shù)1010位于從左上變換系數(shù)開始的橫軸方向的第5位置和縱軸方向的第5位置。因此,熵編碼器450將值X = 5和y = 5編碼為關(guān)于最后有效變換系數(shù)1010的位置的信息。圖11是根據(jù)本發(fā)明實(shí)施例的熵編碼設(shè)備1100的框圖。參照圖11,熵編碼設(shè)備1100包括開關(guān)1110、上下文自適應(yīng)二進(jìn)制算術(shù)編碼器(CABAC) 1120和可變長度編碼器(VLC) 1130。如上關(guān)于圖9所述,如果最后有效變換系數(shù)的位置被確定,則通過使用CABAC或VLC來對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行編碼。開關(guān)1110控制關(guān)于最后有效變換系數(shù)的位置的信息被輸出到CABAC 1120或VLC 1130,其中,以條帶、畫面或畫面組為單位對所述信息進(jìn)行編碼。還可通過比較通過使用CABAC或VLC獲得的R-D成本來確定是使用CABAC還是使用VLC來對所述信息進(jìn)行編碼?,F(xiàn)在將描述通過使用CABAC對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行編碼的方法。圖12是根據(jù)本發(fā)明實(shí)施例的CABAC裝置1200的框圖。參照圖12,CABAC裝置1200主要包括二進(jìn)制化編碼器(binarizer) 1210、上下文建模器1220和二進(jìn)制算術(shù)編碼器1230。此外,二進(jìn)制算術(shù)編碼器1230包括常規(guī)編碼引擎1232和旁路編碼引擎1234。二進(jìn)制化編碼器1210將表示最后有效變換系數(shù)的位置的變換塊中的橫軸方向位置X和縱軸方向位置y轉(zhuǎn)換為二進(jìn)制值并輸出bin串。bin表示bin串的每個比特。二進(jìn)制化關(guān)于最后有效變換系數(shù)的位置的信息的方法包括各種二進(jìn)制化方法,諸如一元二進(jìn)制化、截?cái)嘁辉M(jìn)制化、級聯(lián)一元/k階指數(shù)Golomb 二進(jìn)制化和固定長度二進(jìn)制化。例如,在圖10中,如果最后有效變換系數(shù)的位置被表示為X = 5,Y = 5,則通過使用截?cái)嘁辉M(jìn)制化可將值X和Y 二進(jìn)制化為X = 0000001和Y = 000001。通過二進(jìn)制化編碼器1210映射到二進(jìn)制值的關(guān)于最后有效變換系數(shù)的位置的信息被輸入到上下文建模器1220。上下文建模器1220基于輸入的bin值或先前編碼的語法元素確定對當(dāng)前輸入的bin進(jìn)行編碼所需的概率模型(即,上下文)。具體地講,根據(jù)本發(fā)明實(shí)施例,可根據(jù)最后有效變換系數(shù)的位置選擇一個先前確定的上下文。常規(guī)編碼引擎1232通過基于由上下文建模器1220確定的概率模型對輸入的bin值進(jìn)行算術(shù)編碼來產(chǎn)生比特流。旁路編碼引擎1234是用于輸出輸入值而不壓縮輸入值的引擎,并且對諸如脈沖編碼調(diào)制(PCM)數(shù)據(jù)的數(shù)據(jù)進(jìn)行編碼。圖13是用于描述根據(jù)本發(fā)明實(shí)施例的選擇用于對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行編碼的上下文的處理的參考示圖。上下文建模器1220根據(jù)最后有效變換系數(shù)的位置選擇多個先前編寫的上下文之一。所述多個上下文根據(jù)最后有效變換系數(shù)的位置將二進(jìn)制信號的“O”和“I”分類為最大可能符號(MPS)和最小可能符號(LPS),并設(shè)置MPS和LPS的概率值?!癘”和“I”中的哪個符號被設(shè)置為MPS或LPS,以及如何設(shè)置MPS和LPS的概率值,這可根據(jù)需要來設(shè)計(jì)。圖13示出當(dāng)根據(jù)Z字形掃描順序掃描變換塊中的變換系數(shù)時,根據(jù)除了與DC相應(yīng)的左上位置之外的最后有效變換系數(shù)的位置選擇的上下文。參照圖13,上下文建模器1220包括關(guān)于4X4變換塊的具有索引O、1、2的三個上下文,并且根據(jù)除了左上位置之外的4 X 4變換塊中的位置之中的最后有效變換系數(shù)的位置來選擇具有索引0、1、2的三個上下文之一。也就是說,如果最后有效變換系數(shù)位于4 X 4變換塊中的(I,O),則選擇具有索引O的上下文,如果最后有效變換系數(shù)位于(0,I),則選擇具有索引I的上下文,如果最后有效變換系數(shù)位于(1,I),則選擇具有索引2的上下文。同樣,上下文建模器1220包括關(guān)于8X8變換塊的具有索引O至6的七個上下文,并且根據(jù)除了左上位置之外的8X8變換塊中的位置之中的最后有效變換系數(shù)的位置來選擇具有索引O至6的七個上下文之一。相似地,上下文建模器1220包括關(guān)于16X16變換塊的具有索引O至11的十二個上下文,并且根據(jù)除了左上位置之外的16X16變換塊中的位置之中的最后有效變換系數(shù)的位置來選擇具有索引O至11的十二個上下文之一。常規(guī)編碼引擎1232通過基于由上下文建模器1220確定上下文對表示最后有效變換系數(shù)的位置的輸入的bin值進(jìn)行算術(shù)編碼來產(chǎn)生比特流。例如,假設(shè)最后有效變換系數(shù)的橫軸方向位置(即,X)具有值3,二進(jìn)制化編碼器1210通過對值3 二進(jìn)制化產(chǎn)生bin串“010”。還假設(shè),基于上下文建模器1220根據(jù)最后有效變換系數(shù)的位置選擇的上下文,MPS是具有概率值0.8的“0”,LPS是具有概率值0.2的“I”。常規(guī)編碼引擎1232通過根據(jù)作為用于形成bin串“010”的初始bin的“O”的概率值分割區(qū)間
來將區(qū)間
更新為區(qū)間
,并且根據(jù)作為下一 bin的“I”的概率值將區(qū)間
更新為新的區(qū)間
。此外,常規(guī)編碼引擎1232根據(jù)作為最后bin的“O”的概率值將區(qū)間
更新為區(qū)間
。常規(guī)編碼引擎1232將通過從“0.11”排除初始數(shù)字而獲得的“11”輸出為與表示最后有效變換系數(shù)的橫軸方向位置的值3相應(yīng)的碼字,其中,“0.11”是包括在區(qū)間
中的實(shí)數(shù)0.75的二進(jìn)制數(shù)。同樣,常規(guī)編碼引擎1232對表示最后有效變換系數(shù)的縱軸方向位置的坐標(biāo)值Y 二進(jìn)制化,并通過根據(jù)選擇的上下文對二進(jìn)制化的坐標(biāo)值Y進(jìn)行編碼來產(chǎn)生比特流。除上述關(guān)于最后有效變換系數(shù)的位置的信息之外,圖11中示出的CABACl 120對表示具有非零值的有效變換系數(shù)是否存在于變換塊中的c0ded_bl0ck_flag以及表示變換塊中的每個有效變換系數(shù)的位置的significant_coeff_flag進(jìn)行編碼。coded_block_flag和significant_coeff_flag的編碼處理可以與傳統(tǒng)的H.264的編碼處理相同。例如,參照示出與圖10相應(yīng)的有效映射1400的圖14,可通過如果具有第i掃描順序的變換系數(shù)是有效變換系數(shù)則將signif icant_c0eff_f lag[i]設(shè)置為1,如果具有第i掃描順序的變換系數(shù)是O則將signif icant_coeff_f lag[i]設(shè)置為0,來表示有效映射1400??赏ㄟ^使用如
H.264中的十五個概率模型來對有效映射1400進(jìn)行編碼。在對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行編碼之后,熵編碼器450對位于變換塊中的每個有效變換系數(shù)的級別信息進(jìn)行編碼。圖15是用于描述在圖10中示出的對包括在變換塊1000中的有效變換系數(shù)的級別值進(jìn)行編碼的處理的參考示圖。參照圖10和圖15,熵編碼器450根據(jù)Z字形掃描順序,從左上變換系數(shù)到最后有效變換系數(shù)掃描圖10中示出的變換系數(shù),并獲得如圖15所示的一維對齊的變換系數(shù)。熵編碼器450通過使用如H.264中的表示在有效變換系數(shù)之間具有值O的連續(xù)系數(shù)的數(shù)量的行程以及表示每個有效變換系數(shù)的值的級別來對一維對齊的變換系數(shù)進(jìn)行編碼。更詳細(xì)地講,熵編碼器450以與掃描順序相反的順序(即,圖15的從右側(cè)到左側(cè)的方向)確定行程和級別,并通過使用特定VLC表對行程和級別進(jìn)行編碼。圖16是示出根據(jù)本發(fā)明實(shí)施例使用的多個VLC表VLCO至VLC8的示例的示圖。熵編碼器450可根據(jù)最后有效變換系數(shù)的位置選擇VLC表VLCO至VLC8之一,并可通過使用選擇的VLC表對行程和級別進(jìn)行編碼。例如,如圖15所示,通過使用VLC表,從具有值“-1”的最后有效變換系數(shù)1510開始,對表示在有效變換系數(shù)之間具有值O的連續(xù)變換系數(shù)的數(shù)量的行程 1530、1540、1550 和 1560 執(zhí)行 VLC。因?yàn)楦鶕?jù)本發(fā)明的變換塊可具有等于或大于16X16的大尺寸,所以行程值可能增大。例如,如果VLC表僅包括從O至63的行程值并且行程值大于63,則不可通過使用VLC表對該值進(jìn)行編碼。因此,根據(jù)本發(fā)明實(shí)施例,考慮VLC表可用的最大行程值,如果變換塊具有大于最大行程值的行程值,則熵編碼器450對等于或小于最大行程值的行程值進(jìn)行編碼,然后對其他行程值進(jìn)行編碼。例如,如果最大行程值是63,并且將被編碼的行程值是70,則行程值70被分割為63和7,并且行程值63和7被分別編碼為行程信息。根據(jù)本發(fā)明另一實(shí)施例,除了上述CABAC以外,還可通過使用VLC對最后有效變換系數(shù)的位置(x,y)進(jìn)行編碼。也就是說,熵編碼器450可參考根據(jù)值X和y先前編寫的VLC表來對值X和y執(zhí)行VLC。圖17是用于描述根據(jù)本發(fā)明另一實(shí)施例的對變換系數(shù)進(jìn)行熵編碼的方法的參考示圖。根據(jù)當(dāng)前實(shí)施例,熵編碼器450將變換塊劃分為具有特定尺寸的子塊,并將關(guān)于包括最后有效變換系數(shù)的子塊中的最后有效變換系數(shù)的位置的信息連同該子塊的索引一起進(jìn)行編碼。在圖17中,假設(shè)(Sa,b)表示子塊a中的具有第b掃描索引的變換系數(shù)。參照圖17,如果假設(shè)最后有效變換系數(shù)是子塊11771中的(SI,12),則熵編碼器450將表示子塊11771中的最后有效變換系數(shù)(SI,12)的位置的(2,2)(作為關(guān)于子塊中的最后有效變換系數(shù)的位置的信息)連同表示子塊11771的特定索引一起編碼。返回參照圖10,根據(jù)本發(fā)明另一實(shí)施例,通過使用變換塊1000中的最后有效變換系數(shù)1010 (以下稱為“第一最后有效變換系數(shù)”)以及在第一最后有效變換系數(shù)1010之前的有效變換系數(shù)1020 (以下稱為“第二最后有效變換系數(shù)”)對變換系數(shù)進(jìn)行編碼。更詳細(xì)地講,如上所述,熵編碼器450對表示第二最后有效變換系數(shù)1020的(3,4)進(jìn)行編碼。然后,熵編碼器450對第一最后有效變換系數(shù)1010和第二最后有效變換系數(shù)1020之間的行程值進(jìn)行編碼。如上所述,如果第二最后有效變換系數(shù)1020的位置已知,則可通過將第一最后有效變換系數(shù)1010和第二最后有效變換系數(shù)1020之間的行程值加到第二最后有效變換系數(shù)1020的位置來獲得第一最后有效變換系數(shù)1010的位置。圖18A和圖18B是用于描述根據(jù)本發(fā)明另一實(shí)施例的對變換系數(shù)進(jìn)行熵編碼的方法的參考示圖。熵編碼器450可根據(jù)最后有效變換系數(shù)以哪種順序被首先掃描(即,根據(jù)最后有效變換系數(shù)是接近變換塊的左上位置還是接近變換塊的右下位置),來選擇與Z字形掃描順序和反Z字形掃描順序之一相應(yīng)的掃描方向,并可將關(guān)于最后有效變換系數(shù)的位置的信息連同表不選擇的掃描方向的索引一起編碼。例如,如圖18A所不,如果標(biāo)號1812表不中心位置,則最后有效變換系數(shù)1811更接近左上位置。在這種情況下,熵編碼器450可將關(guān)于最后有效變換系數(shù)1811的位置的信息連同表示從左上位置開始的掃描方向的索引(正向掃描索引)一起編碼。此外,如圖18B所示,如果標(biāo)號1822表示中心位置并且最后有效變換系數(shù)1821更接近右下位置,則熵編碼器450可將關(guān)于最后有效變換系數(shù)1821的位置的信息連同表不從右下位置開始的掃描方向的索引(反向掃描索引)一起編碼。根據(jù)本發(fā)明另一實(shí)施例,為了對行程值進(jìn)行編碼,可設(shè)置特定全局行程,并且當(dāng)行程值除以全局行程時,可通過使用商和余數(shù)來表示行程值(行程細(xì)化)。例如,假設(shè)行程值是78并且全局行程具有值16。在這種情況下,當(dāng)78除以16時,商是4,余數(shù)是14。因此,可通過使用作為全局行程的值的16、作為商的值的4和作為余數(shù)的值的14來表示行程值78。熵編碼器450可通過使用VLC或CABAC對關(guān)于全局行程、商和余數(shù)的信息進(jìn)行編碼。如果編碼器和解碼器預(yù)先設(shè)置相同的全局行程,則可不額外地對關(guān)于全局行程的信息進(jìn)行編碼。此外,根據(jù)本發(fā)明另一實(shí)施例,熵編碼器450可根據(jù)包括最后有效變換系數(shù)的變換塊的尺寸,通過應(yīng)用不同的VLC表來對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行編碼。圖19是根據(jù)本發(fā)明實(shí)施例的對變換系數(shù)進(jìn)行熵解碼的方法的流程圖。參照圖19,在操作1910,熵解碼器520根據(jù)特定掃描順序,從接收的比特流提取關(guān)于具有非零值且包括在變換塊中的最后有效變換系數(shù)的橫軸方向位置和縱軸方向位置的信息。如上關(guān)于圖9所述,如果最后有效變換系數(shù)位于從變換塊的左上位置開始的橫軸方向的第X位置(X是等于或大于O的整數(shù))和縱軸方向的第y位置(y是等于或大于O的整數(shù)),則關(guān)于最后有效變換系數(shù)的位置的信息包括值X和y。在操作1920,熵解碼器520通過對關(guān)于橫軸方向位置和縱軸方向位置的信息進(jìn)行解碼來確定最后有效變換系數(shù)的位置。熵解碼器520通過使用上下文自適應(yīng)二進(jìn)制算術(shù)解碼(CABAD)或可變長度解碼(VLD)對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行解碼,并確定最后有效變換系數(shù)的位置,其中,CABAD和VLD是熵編碼器450執(zhí)行的編碼處理的逆處理。更詳細(xì)地講,熵解碼器520可參考特定VLC查找表對最后有效變換系數(shù)的橫軸方向位置和縱軸方向位置執(zhí)行VLD。此外,熵解碼器520可根據(jù)最后有效變換系數(shù)的位置選擇多個上下文之一,并可根據(jù)選擇的上下文對關(guān)于最后有效變換系數(shù)的位置的信息執(zhí)行CABAD。在操作1930,熵解碼器520通過使用最后有效變換系數(shù)的位置對包括在比特流中的行程和級別信息進(jìn)行解碼。如果行程的長度大于特定閾值,則熵解碼器520對等于該閾值的長度的行程信息進(jìn)行解碼,然后對大于該閾值的長度的行程信息進(jìn)行解碼。如上關(guān)于圖16所述,如果對行程值進(jìn)行編碼的閾值被設(shè)置為63,則行程值70被分割為行程值63和7,然后行程值63和7被分別編碼。因此,熵解碼器520可通過對行程值63和7分別進(jìn)行解碼,然后將它們組合,來對行程值70進(jìn)行解碼。圖20是根據(jù)本發(fā)明實(shí)施例的熵解碼設(shè)備2000的框圖。參照圖20,熵解碼設(shè)備2000包括開關(guān)2010、CABAD 2020和VLD 2030。開關(guān)2010通過使用以條帶、畫面或畫面組為單位設(shè)置的變換系數(shù)的編碼模式信息,將關(guān)于編碼的變換系數(shù)的信息輸出到CABAD 2020和VLD 2030之一。VLD 2030可參考特定VLC查找表對最后有效變換系數(shù)的橫軸方向位置和縱軸方向位置執(zhí)行VLD。此外,CABAD 2020可根據(jù)最后有效變換系數(shù)的位置選擇多個上下文之一,并可根據(jù)選擇的上下文對關(guān)于最后有效變換系數(shù)的位置的信息執(zhí)行CABAD。本發(fā)明還可實(shí)施為計(jì)算機(jī)可讀記錄介質(zhì)上的計(jì)算機(jī)可讀編碼。計(jì)算機(jī)可讀記錄介質(zhì)是任何可存儲其后可由計(jì)算機(jī)系統(tǒng)讀取的數(shù)據(jù)的數(shù)據(jù)存儲裝置。計(jì)算機(jī)可讀記錄介質(zhì)的示例包括只讀存儲器(ROM)、隨機(jī)存取存儲器(RAM)、CD-ROM、磁帶、軟盤、光學(xué)數(shù)據(jù)存儲裝置等。計(jì)算機(jī)可讀記錄介質(zhì)還可分布于聯(lián)網(wǎng)的計(jì)算機(jī)系統(tǒng)上,從而以分布式方式存儲和執(zhí)行計(jì)算機(jī)可讀代碼。雖然已經(jīng)參照本發(fā)明的示例性實(shí)施例具體顯示和描述了本發(fā)明,但是本領(lǐng)域普通技術(shù)人員將理解,在不脫離權(quán)利要求限定的本發(fā)明的精神和范圍的情況下,可以在形式和細(xì)節(jié)上進(jìn)行各種改變。因此,本發(fā)明的范圍不是由本發(fā)明的詳細(xì)描述限定,而是由權(quán)利要求限定,并且所述范圍內(nèi)的所有不同將被解釋為包括在本發(fā)明中。
權(quán)利要求
1.一種對變換系數(shù)進(jìn)行熵編碼的方法,所述方法包括: 根據(jù)特定掃描順序,確定包括在具有特定尺寸的變換塊中的變換系數(shù)之中具有非零值的最后有效變換系數(shù)的位置; 通過使用變換塊中的最后有效變換系數(shù)的橫軸方向位置和最后有效變換系數(shù)的縱軸方向位置來對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行編碼。
2.按權(quán)利要求1所述的方法,其中,對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行編碼的步驟包括:如果最后有效變換系數(shù)位于從變換塊的左上位置開始的橫軸方向的第X位置和縱軸方向的第I位置,則對表示最后有效變換系數(shù)的位置的值X和I進(jìn)行編碼,其中,X是等于或大于O的整數(shù),y是等于或大于O的整數(shù)。
3.按權(quán)利要求1所述的方法,其中,對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行編碼的步驟包括:對關(guān)于最后有效變換系數(shù)的橫軸方向位置和縱軸方向位置的信息執(zhí)行可變長度編碼(VLC)。
4.按權(quán)利要求3所述的方法,其中,對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行編碼的步驟包括:參照特定VLC查找表來對關(guān)于最后有效變換系數(shù)的橫軸方向位置和縱軸方向位置的信息執(zhí)行VLC。
5.按權(quán)利要求3所述的方法,還包括:根據(jù)反向掃描順序,對表示在有效變換系數(shù)之間具有值O的連續(xù)系數(shù)的數(shù)量的行程信息以及有效變換系數(shù)的級別信息進(jìn)行編碼, 其中,對行程信息進(jìn)行編碼的步驟包括:如果行程的長度大于特定閾值,則對等于該閾值的長度的行程信息進(jìn)行編碼,然后對大于該閾值的長度的行程信息進(jìn)行編碼。
6.按權(quán)利要求1所述的方法,其中,對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行編碼的步驟還包括: 二進(jìn)制化關(guān)于最后有效變換系數(shù)的橫軸方向位置和縱軸方向位置的信息; 選擇用于對二進(jìn)制化的信息進(jìn)行編碼的上下文; 根據(jù)選擇的上下文對二進(jìn)制化的信息執(zhí)行上下文自適應(yīng)二進(jìn)制算術(shù)編碼(CABAC)。
7.按權(quán)利要求6所述的方法,其中,選擇上下文的步驟包括:根據(jù)最后有效變換系數(shù)的位置選擇先前確定的上下文之一。
8.一種對變換系數(shù)進(jìn)行熵解碼的方法,所述方法包括: 根據(jù)特定掃描順序,從接收的比特流提取關(guān)于具有非零值且包括在變換塊中的最后有效變換系數(shù)的橫軸方向位置和縱軸方向位置的信息; 通過對關(guān)于橫軸方向位置和縱軸方向位置的信息進(jìn)行解碼來確定最后有效變換系數(shù)的位置。
9.按權(quán)利要求8所述的方法,其中,確定最后有效變換系數(shù)的位置的步驟包括:如果最后有效變換系數(shù)位于從變換塊的左上位置開始的橫軸方向的第X位置和縱軸方向的第y位置,則對表示最后有效變換系數(shù)的位置的值X和I進(jìn)行解碼,其中,X是等于或大于O的整數(shù),y是等于或大于O的整數(shù)。
10.按權(quán)利要求8所述的方法,其中,確定最后有效變換系數(shù)的位置的步驟包括:對關(guān)于最后有效變換系數(shù)的橫軸方向位置和縱軸方向位置的信息執(zhí)行可變長度解碼(VLD)。
11.按權(quán)利要求10所述的方法,其中,確定最后有效變換系數(shù)的位置的步驟包括: 參照特定可變長度編碼(VLC)查找表對關(guān)于最后有效變換系數(shù)的橫軸方向位置和縱軸方向位置的信息執(zhí)行VLD。
12.按權(quán)利要求10所述的方法,還包括:根據(jù)反向掃描順序,對表示在有效變換系數(shù)之間具有值O的連續(xù)系數(shù)的數(shù)量的行程信息以及有效變換系數(shù)的級別信息進(jìn)行解碼, 其中,對行程信息進(jìn)行解碼的步驟包括:如果行程的長度大于特定閾值,則對等于該閾值的長度的行程信息進(jìn)行解碼,然后對大于該閾值的長度的行程信息進(jìn)行解碼。
13.按權(quán)利要求8所述的方法,其中,確定最后有效變換系數(shù)的位置的步驟還包括: 選擇用于對關(guān)于最后有效變換系數(shù)的橫軸方向位置和縱軸方向位置的二進(jìn)制化的信息進(jìn)行解碼的上下文; 根據(jù)選擇的上下文對二進(jìn)制化的信息執(zhí)行上下文自適應(yīng)二進(jìn)制算術(shù)解碼(CABAD)。
14.按權(quán)利要求13所述的方法,其中,選擇上下文的步驟包括:根據(jù)最后有效變換系數(shù)的位置選擇先前確定的上下文之一。
15.按權(quán)利要求13所述的方法,還包括:對表示變換塊中的有效變換系數(shù)的位置的有效映射以及有效變換 系數(shù)的級別值進(jìn)行解碼。
全文摘要
一種用于對變換塊進(jìn)行熵編碼和熵解碼的方法和設(shè)備。對變換塊進(jìn)行熵編碼的方法包括根據(jù)特定掃描順序,確定包括在具有特定尺寸的變換塊中的變換系數(shù)之中具有非零值的最后有效變換系數(shù)的位置;通過使用變換塊中的最后有效變換系數(shù)的橫軸方向位置和最后有效變換系數(shù)的縱軸方向位置來對關(guān)于最后有效變換系數(shù)的位置的信息進(jìn)行編碼。
文檔編號H04N7/50GK103098469SQ201180043638
公開日2013年5月8日 申請日期2011年7月8日 優(yōu)先權(quán)日2010年7月9日
發(fā)明者李培根, 孫有美 申請人:三星電子株式會社