亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

使用聯(lián)合上下文模型對系數(shù)進(jìn)行熵譯碼的制作方法

文檔序號:7885740閱讀:204來源:國知局
專利名稱:使用聯(lián)合上下文模型對系數(shù)進(jìn)行熵譯碼的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及視頻譯碼,且更明確地說,涉及用于視頻譯碼的熵譯碼。
背景技術(shù)
數(shù)字視頻能力可并入到較寬范圍的裝置中,包含數(shù)字電視、數(shù)字直播系統(tǒng)、無線廣播系統(tǒng)、個人數(shù)字助理(PDA)、膝上型或桌上型計算機、數(shù)字相機、數(shù)字記錄裝置、數(shù)字媒體播放器、視頻游戲裝置、視頻游戲控制臺、蜂窩式或衛(wèi)星無線電電話、視頻電話會議裝置等。數(shù)字視頻裝置實施視頻壓縮技術(shù),例如由MPEG-2、MPEG-4、ITU-T H.263,ITU-T H.264/MPEG-4,第10部分,高級視頻譯碼(AVC)界定的標(biāo)準(zhǔn)或新興的高效視頻譯碼(HEVC)標(biāo)準(zhǔn)或此些標(biāo)準(zhǔn)的擴(kuò)展中所描述的那些技術(shù)。視頻壓縮技術(shù)執(zhí)行空間預(yù)測和/或時間預(yù)測以減少或去除視頻序列中固有的冗余。對于基于塊的視頻譯碼,可將視頻幀或切片分割成視頻塊或譯碼單元(CU)。CU可進(jìn)一步分割成一個或一個以上預(yù)測單元(PU)以確定用于CU的預(yù)測視頻數(shù)據(jù)。視頻壓縮技術(shù)還可將CU分割成殘余視頻塊數(shù)據(jù)的一個或一個以上變換單元(TU),其表示待譯碼的視頻塊與預(yù)測視頻數(shù)據(jù)之間的差異。可將線性變換(例如二維離散余弦變換(DCT))應(yīng)用于TU,以將殘余視頻塊數(shù)據(jù)從像素域變換到頻域以實現(xiàn)進(jìn)一步壓縮。在變換之后,TU內(nèi)的變換系數(shù)可經(jīng)由量化進(jìn)一步壓縮。在量化之后,熵譯碼單元可應(yīng)用與TU的大小相關(guān)聯(lián)的Z字形掃描或另一掃描次序以掃描TU中的二維系數(shù)陣列,以產(chǎn)生可經(jīng)熵編碼的串行化向量。熵譯碼單元接著對系數(shù)的串行化向量進(jìn)行熵譯碼。舉例來說,熵譯碼單元可執(zhí)行上下文自適應(yīng)可變長度譯碼(CAVLC)、上下文自適應(yīng)二進(jìn)制算術(shù)譯碼(CABAC)或另一熵譯碼技術(shù)。在上下文自適應(yīng)熵譯碼的情況下,熵譯碼單元可根據(jù)與TU的大小相關(guān)聯(lián)的上下文模型為TU內(nèi)的系數(shù)中的每一者選擇上下文。接著可基于選定上下文對所述系數(shù)進(jìn)行熵編碼。

發(fā)明內(nèi)容
一般來說,本發(fā)明描述用于使用在具有不同大小的變換單元之間共享的聯(lián)合上下文模型執(zhí)行與殘余視頻數(shù)據(jù)塊相關(guān)聯(lián)的變換系數(shù)的熵編碼和解碼的技術(shù)。舉例來說,所述聯(lián)合上下文模型可在具有第一大小32x32的變換單元與具有第二大小16x16的變換單元之間共享。在一些情況下,兩個以上大小的變換單元可共享同一聯(lián)合上下文模型。作為一個實例,聯(lián)合上下文模型可為用于變換單元的重要性圖的聯(lián)合上下文模型。在其它實例中,聯(lián)合上下文模型可與其它譯碼信息或語法元素相關(guān)聯(lián)。在新興的高效視頻譯碼(HEVC)標(biāo)準(zhǔn)中,譯碼單元(⑶)可包含一個或一個以上變換單元(TU),其包含用于變換的殘余視頻數(shù)據(jù)。已提出額外變換單元大小(例如,32x32直到128x128)以改進(jìn)視頻譯碼效率,但也導(dǎo)致增加的存儲器和計算要求以維持用于額外變換單元大小中的每一者的上下文模型。使用在具有不同大小的變換單元之間共享的聯(lián)合上下文模型執(zhí)行熵譯碼可減少在視頻編碼和解碼裝置上存儲上下文和概率所必需的存儲器的量,且降低在視頻編碼和解碼裝置上維持上下文模型的計算成本。在一些實例中,所述技術(shù)還可降低執(zhí)行二維變換時對較大變換單元大小的中間緩沖要求。在所述情況下,所述技術(shù)包含在應(yīng)用二維變換的每一方向之后,使包含在第一大小的變換單元中的變換系數(shù)的較高頻率子集歸零,即將值設(shè)定為零,以產(chǎn)生所保持系數(shù)塊。在此實例中,用于熵譯碼的聯(lián)合上下文模型可在具有第一大小的變換單元與原始具有第二大小的變換單元之間共享,所述具有第一大小的變換單元具有經(jīng)歸零以產(chǎn)生所保持系數(shù)塊的系數(shù)。在一些情況下,所保持系數(shù)塊可具有等于第二大小的大小。在其它實例中,用于熵譯碼的聯(lián)合上下文模型可在具有第一大小的變換單元與具有第二大小的變換單元之間共享。在一個實例中,本發(fā)明描述一種解碼視頻數(shù)據(jù)的方法,其包括:維持由具有第一大小的變換單元與具有第二大小的變換單元共享的聯(lián)合上下文模型,所述具有第一大小的變換單元具有經(jīng)歸零以產(chǎn)生所保持系數(shù)塊的系數(shù),其中所述第一大小與所述第二大小是不同的。所述方法還包含根據(jù)聯(lián)合上下文模型為與具有具所保持系數(shù)塊的第一大小和第二大小中的一者的變換單元相關(guān)聯(lián)的系數(shù)選擇上下文,以及基于選定上下文根據(jù)譯碼過程來對與所述變換單元相關(guān)聯(lián)的系數(shù)進(jìn)行熵譯碼。在另一實例中,本發(fā)明描述一種視頻譯碼裝置,其包括:存儲器,其存儲由具有第一大小的變換單元與具有第二大小的變換單元共享的聯(lián)合上下文模型,所述具有第一大小的變換單元具有經(jīng)歸零以產(chǎn)生所保持系數(shù)塊的系數(shù),其中所述第一大小和所述第二大小是不同的。所述視頻譯碼裝置進(jìn)一步包含處理器,其經(jīng)配置以維持聯(lián)合上下文模型,根據(jù)聯(lián)合上下文模型為與具有具所保持系數(shù)塊的第一大小和第二大小中的一者的變換單元相關(guān)聯(lián)的系數(shù)選擇上下文,且基于選定上下文根據(jù)譯碼過程來對與所述變換單元相關(guān)聯(lián)的系數(shù)進(jìn)行熵譯碼。在另一實例中,本發(fā)明描述一種視頻譯碼裝置,其包括:用于維持由具有第一大小的變換單元與具有第二大小的變換單元共享的聯(lián)合上下文模型的裝置,所述具有第一大小的變換單元具有經(jīng)歸零以產(chǎn)生所保持系數(shù)塊的系數(shù),其中所述第一大小和所述第二大小是不同的。所述視頻譯碼裝置還包括用于根據(jù)聯(lián)合上下文模型為與具有具所保持系數(shù)塊的第一大小和第二大小中的一者的變換單元相關(guān)聯(lián)的系數(shù)選擇上下文的裝置,以及用于基于選定上下文根據(jù)譯碼過程來對與所述變換單元相關(guān)聯(lián)的系數(shù)進(jìn)行熵譯碼的裝置。在另一實例中,本發(fā)明描述一種計算機可讀媒體,其包括用于譯碼視頻數(shù)據(jù)的指令,所述指令在被執(zhí)行時致使處理器維持由具有第一大小的變換單元與具有第二大小的變換單元共享的聯(lián)合上下文模型,所述具有第一大小的變換單元具有經(jīng)歸零以產(chǎn)生所保持系數(shù)塊的系數(shù),其中所述第一大小和所述第二大小是不同的。所述指令還致使所述處理器根據(jù)聯(lián)合上下文模型為與具有具所保持系數(shù)塊的第一大小和第二大小中的一者的變換單元相關(guān)聯(lián)的系數(shù)選擇上下文,以及基于選定上下文根據(jù)譯碼過程來對與所述變換單元相關(guān)聯(lián)的系數(shù)進(jìn)行熵譯碼。在另一實例中,本發(fā)明描述一種譯碼視頻數(shù)據(jù)的方法,其包括維持由具有第一大小的變換單元與具有第二大小的變換單元共享的聯(lián)合上下文模型,其中所述第一大小與所述第二大小是不同的。所述方法還包含根據(jù)聯(lián)合上下文模型為與具有第一大小和第二大小中的一者的變換單元相關(guān)聯(lián)的系數(shù)選擇上下文,以及基于選定上下文根據(jù)譯碼過程來對所述變換單元的系數(shù)進(jìn)行熵譯碼。
在額外實例中,本發(fā)明描述一種視頻譯碼裝置,其包括:存儲器,所述存儲器存儲由具有第一大小的變換單元與具有第二大小的變換單元共享的聯(lián)合上下文模型,其中所述第一大小與所述第二大小是不同的;以及處理器,其經(jīng)配置以維持所述聯(lián)合上下文模型,根據(jù)所述聯(lián)合上下文模型為與具有第一大小和第二大小中的一者的變換單元相關(guān)聯(lián)的系數(shù)選擇上下文,且基于所述選定上下文根據(jù)譯碼過程對變換單元的系數(shù)進(jìn)行熵譯碼。在另一實例中,本發(fā)明描述一種視頻譯碼裝置,其包括用于維持由具有第一大小的變換單元與具有第二大小的變換單元共享的聯(lián)合上下文模型的裝置,其中所述第一大小與所述第二大小是不同的。所述視頻譯碼裝置還包含用于根據(jù)聯(lián)合上下文模型為與具有第一大小和第二大小中的一者的變換單元相關(guān)聯(lián)的系數(shù)選擇上下文的裝置,以及用于基于選定上下文根據(jù)譯碼過程來對所述變換單元的系數(shù)進(jìn)行熵譯碼的裝置。在另一實例中,本發(fā)明描述一種計算機可讀媒體,其包括用于譯碼視頻數(shù)據(jù)的指令,所述指令在被執(zhí)行時致使處理器:維持由具有第一大小的變換單元與具有第二大小的變換單元共享的聯(lián)合上下文模型,其中所述第一大小與所述第二大小是不同的;根據(jù)所述聯(lián)合上下文模型為與具有第一大小和第二大小中的一者的變換單元相關(guān)聯(lián)的系數(shù)選擇上下文;且基于所述選定上下文根據(jù)譯碼過程對變換單元的系數(shù)進(jìn)行熵譯碼。


圖1是說明可利用使用在具有不同大小的變換單元之間共享的聯(lián)合上下文模型執(zhí)行視頻系數(shù)的熵譯碼的技術(shù)的實例視頻編碼和解碼系統(tǒng)的框圖。圖2是說明可實施用于使用聯(lián)合上下文模型對視頻系數(shù)進(jìn)行熵編碼的技術(shù)的實例視頻編碼器的框圖。圖3A和3B是分別說明來自具有第一大小的變換單元的具有第二大小的所保持系數(shù)塊的正方形和矩形區(qū)域的概念圖。圖4是說明可實施用于使用聯(lián)合上下文模型對視頻系數(shù)進(jìn)行熵解碼的技術(shù)的實例視頻解碼器的框圖。圖5是說明經(jīng)配置以根據(jù)聯(lián)合上下文模型為視頻系數(shù)選擇上下文的實例熵編碼單元的框圖。圖6是說明經(jīng)配置以根據(jù)聯(lián)合上下文模型為視頻系數(shù)選擇上下文的實例熵解碼單元的框圖。圖7是說明使用在具有第一大小的第一變換單元與具有第二大小的第二變換單元之間共享的聯(lián)合上下文模型來對視頻系數(shù)進(jìn)行熵編碼和熵解碼的實例操作的流程圖。圖8是說明使用在具有第一大小的第一變換單元與具有第二大小的第二變換單元之間共享的聯(lián)合上下文模型來對視頻系數(shù)進(jìn)行熵編碼和解碼的實例操作的流程圖,所述具有第一大小的變換單元具有經(jīng)歸零以產(chǎn)生所保持系數(shù)塊的系數(shù)。
具體實施例方式一般來說,本發(fā)明描述用于使用在具有不同大小的變換單元之間共享的聯(lián)合上下文模型執(zhí)行與殘余視頻數(shù)據(jù)塊相關(guān)聯(lián)的變換系數(shù)的熵編碼和解碼的技術(shù)。舉例來說,所述聯(lián)合上下文模型可在具有第一大小32x32的變換單元與具有第二大小16x16的變換單元之間共享。在新興的高效視頻譯碼(HEVC)標(biāo)準(zhǔn)中,譯碼單元(CU)可包含一個或一個以上變換單元(TU),其包含殘余視頻數(shù)據(jù)。在變換之前,殘余視頻數(shù)據(jù)在空間域中包含殘余像素值。在變換之后,殘余視頻數(shù)據(jù)在變換域中包含殘余變換系數(shù)。已提出額外變換單元大小(例如,32x32直到128x128)以改進(jìn)視頻譯碼效率,但也導(dǎo)致增加的存儲器和計算要求以維持用于額外變換單元大小中的每一者的上下文模型。使用在具有不同大小的變換單元之間共享的聯(lián)合上下文模型執(zhí)行熵譯碼可減少在視頻編碼和解碼裝置上存儲上下文和概率所必需的存儲器的量,且降低在視頻編碼和解碼裝置上維持上下文模型的計算成本。在一些實例中,所述技術(shù)還可降低執(zhí)行二維變換時對較大變換單元大小的中間緩沖要求。所述技術(shù)包含在已應(yīng)用二維變換的每一方向之后,使包含在第一大小的變換單元中的變換系數(shù)的較高頻率子集歸零,即將值設(shè)定為零,以產(chǎn)生所保持系數(shù)塊。視頻編碼和解碼裝置可接著在應(yīng)用二維變換的每一方向(即,行和列)之間緩沖減少數(shù)目的系數(shù)。當(dāng)較高頻率系數(shù)從具有第一大小的變換單元歸零時,包含在所保持系數(shù)塊中的系數(shù)具有與包含在原始具有第二大小的變換單元中的系數(shù)類似的概率統(tǒng)計。在此情況下,用于熵譯碼的聯(lián)合上下文模型可在具有第一大小的變換單元與原始具有第二大小的變換單元之間共享,所述具有第一大小的變換單元具有經(jīng)歸零以產(chǎn)生所保持系數(shù)塊的系數(shù)。在一些情況下,所保持系數(shù)塊可具有等于第二大小的大小。在其它情況下,所保持系數(shù)塊可具有等于第三大小的大小,所述第三大小不同于第一大小和第二大小兩者。在其它實例中,包含在具有第一大小的第一變換單元中的系數(shù)可具有與包含在第二大小的第二變換單元中的系數(shù)類似的概率統(tǒng)計,即使在不使第一變換單元內(nèi)的較高頻率系數(shù)歸零的情況下也是如此。這是可能的,因為較高頻率系數(shù)可表示殘余視頻數(shù)據(jù)很少,以致對用于熵譯碼的相鄰系數(shù)的概率統(tǒng)計的影響是可忽略的。在此情況下,用于熵譯碼的聯(lián)合上下文模型可在具有第一大小的變換單元與具有第二大小的變換單元之間共享。圖1是說明可利用使用在具有不同大小的變換單元之間共享的聯(lián)合上下文模型執(zhí)行視頻系數(shù)的熵譯碼的技術(shù)的實例視頻編碼和解碼系統(tǒng)的框圖。如圖1中所示,系統(tǒng)10包含源裝置12,其可存儲經(jīng)編碼視頻,且/或經(jīng)由通信信道16將經(jīng)編碼視頻發(fā)射到目的地裝置14。源裝置12和目的地裝置14可能不一定參與彼此的實時活動通信。在一些情況下,源裝置12可將經(jīng)編碼視頻數(shù)據(jù)存儲到存儲媒體,目的地裝置14可在需要時經(jīng)由磁盤存取來存取所述存儲媒體,或源裝置12可將經(jīng)編碼視頻數(shù)據(jù)存儲到目的地裝置14可在需要時經(jīng)由流式傳輸來存取的文件服務(wù)器。源裝置12及目的地裝置14可包括各種各樣的裝置中的任一者。在一些情況下,源裝置12和目的地裝置14可包括無線通信裝置,其可經(jīng)由通信信道16傳送視頻信息,在此情況下,通信信道16是無線的。然而,涉及使用聯(lián)合上下文模型來對視頻系數(shù)進(jìn)行熵譯碼的本發(fā)明的技術(shù)不一定限于無線應(yīng)用或設(shè)定。舉例來說,這些技術(shù)可適用于空中電視廣播、有線電視發(fā)射、衛(wèi)星電視發(fā)射、因特網(wǎng)視頻發(fā)射、編碼到存儲媒體上的經(jīng)編碼的數(shù)字視頻,或其它情況。因此,通信信道16可包括適合發(fā)射經(jīng)編碼視頻數(shù)據(jù)的無線或有線媒體的任何組合,且裝置12、14可包括多種有線或無線媒體裝置中的任一者,例如移動電話、智能電話、數(shù)字媒體播放器、機頂盒、電視機、顯示器、桌上型計算機、便攜式計算機、平板計算機、游戲控制臺、便攜式游戲裝置等。在圖1的實例中,源裝置12包含視頻源18、視頻編碼器20、調(diào)制器/解調(diào)器(調(diào)制解調(diào)器)22以及發(fā)射器24。目的地裝置14包含接收器26、調(diào)制解調(diào)器28、視頻解碼器30以及顯示裝置32。在其它實例中,源裝置和目的地裝置可包含其它組件或布置。舉例來說,源裝置12可從外部視頻源18 (例如外部相機、視頻存儲檔案、計算機圖形源等)接收視頻數(shù)據(jù)。同樣地,目的地裝置14可與外部顯示裝置介接,而不是包含集成顯示裝置。圖1所說明的系統(tǒng)10僅為一個實例。在其它實例中,任何數(shù)字視頻編碼和/或解碼裝置可執(zhí)行用于使用聯(lián)合上下文模型來對視頻系數(shù)進(jìn)行熵譯碼的所揭示技術(shù)。所述技術(shù)還可由視頻編碼器/解碼器(通常稱為“CODEC”)來執(zhí)行。此外,本發(fā)明的技術(shù)還可由視頻預(yù)處理器執(zhí)行。源裝置12和目的地裝置14僅為此些譯碼裝置的實例,其中源裝置12產(chǎn)生用于發(fā)射到目的地裝置14的經(jīng)譯碼視頻數(shù)據(jù)。在一些實例中,裝置12、14可以大體上對稱的方式操作,使得裝置12、14中的每一者包含視頻編碼和解碼組件。因此,系統(tǒng)10可支持視頻裝置12、14之間的單向或雙向視頻發(fā)射,例如用于視頻流式傳輸、視頻重放、視頻廣播或視頻電話。源裝置12的視頻源18可包含視頻捕獲裝置,例如攝像機、含有先前捕獲的視頻的視頻檔案,和/或從視頻內(nèi)容提供者饋入的視頻。作為另一替代方案,視頻源18可產(chǎn)生基于計算機圖形的數(shù)據(jù)作為源視頻,或直播視頻(live video)、存檔視頻與計算機產(chǎn)生的視頻的組合。在一些情況下,如果視頻源18為攝像機,那么源裝置12及目的地裝置14可形成所謂的相機電話或視頻電話。然而,如上文所提到,本發(fā)明中所描述的技術(shù)一般可適用于視頻譯碼,且可應(yīng)用于無線和/或有線應(yīng)用。在每一情況下,可由視頻編碼器20來編碼經(jīng)捕獲的、經(jīng)預(yù)先捕獲的或計算機產(chǎn)生的視頻。經(jīng)編碼的視頻信息可接著由調(diào)制解調(diào)器22根據(jù)通信標(biāo)準(zhǔn)來調(diào)制,且經(jīng)由發(fā)射器24而發(fā)射到目的地裝置14。調(diào)制解調(diào)器22可包含經(jīng)設(shè)計以用于信號調(diào)制的各種混頻器、濾波器、放大器或其它組件。發(fā)射器24可包含經(jīng)設(shè)計以用于發(fā)射數(shù)據(jù)的電路,包含放大器、濾波器及一個或一個以上天線。根據(jù)本發(fā)明,源裝置12的視頻編碼器20可經(jīng)配置以應(yīng)用用于使用聯(lián)合上下文模型來對視頻系數(shù)進(jìn)行熵編碼的技術(shù)。待編碼的視頻幀的譯碼單元(CU)可包含一個或一個以上變換單元(TU),其包含殘余視頻數(shù)據(jù)。在變換之前,殘余視頻數(shù)據(jù)在空間域中包含殘余像素值。在變換之后,殘余視頻數(shù)據(jù)在變換域中包含殘余變換系數(shù)。視頻編碼器20可維持在具有不同大小的變換單元之間共享的聯(lián)合上下文模型,且根據(jù)所述聯(lián)合上下文模型為與所述變換單元中的一者相關(guān)聯(lián)的系數(shù)選擇上下文。視頻編碼器20可接著基于選定上下文對系數(shù)進(jìn)行熵編碼。舉例來說,所述聯(lián)合上下文模型可在具有第一大小32x32的變換單元與具有第二大小16x16的變換單元之間共享。在其它實例中,兩個以上大小的變換單元可共享同一聯(lián)合上下文模型。另外,兩個或兩個以上大小的變換單元可共享用于TU的上下文模型中的一些或全部。在一種情況下,聯(lián)合上下文模型可為用于TU的重要性圖的聯(lián)合上下文模型。在其它情況下,聯(lián)合上下文模型可與其它譯碼信息或語法元素相關(guān)聯(lián)。因此,所述技術(shù)可減少將上下文和概率存儲在視頻編碼器20上所必需的存儲器的量,且降低維持視頻編碼器20上的上下文模型的計算成本。在一個實例中,在應(yīng)用二維變換的每一方向之后,視頻編碼器20可使包含在第一大小的變換單元中的變換系數(shù)的較高頻率子集歸零,即將值設(shè)定為零,以產(chǎn)生所保持系數(shù)塊。在此情況下,所述技術(shù)可減少將在應(yīng)用二維變換的每一方向(即,行和列)之間緩沖的系數(shù)的數(shù)目。當(dāng)高頻率系數(shù)從變換單元歸零時,包含在所保持系數(shù)塊中的系數(shù)具有與包含在原始具有第二大小的變換單元中的系數(shù)類似的概率統(tǒng)計。在此實例中,視頻編碼器20可維持由具有第一大小的變換單元與具有第二大小的變換單元共享的聯(lián)合上下文模型,所述具有第一大小的變換單元具有經(jīng)歸零以產(chǎn)生所保持系數(shù)塊的系數(shù),且視頻編碼器20可根據(jù)所述聯(lián)合上下文模型為具有所保持系數(shù)塊的第一大小以及第二大小中的一者的變換單元的系數(shù)選擇上下文。在一些情況下,所保持系數(shù)塊可具有等于第二大小的大小。在其它情況下,所保持系數(shù)塊可具有等于第三大小的大小,所述第三大小不同于第一大小和第二大小兩者。在另一實例中,包含在具有第一大小的第一變換單元中的系數(shù)可具有與包含在具有第二大小的第二變換單元中的系數(shù)類似的概率統(tǒng)計,即使在不使第一變換單元內(nèi)的高頻率系數(shù)歸零的情況下也是如此。這是可能的,因為高頻率系數(shù)可表示殘余視頻數(shù)據(jù)很少,以致對用于熵譯碼的相鄰系數(shù)的概率統(tǒng)計的影響是可忽略的。在此實例中,視頻編碼器20可維持由具有第一大小和第二大小的變換單元共享的聯(lián)合上下文模型,且根據(jù)所述聯(lián)合上下文模型為具有第一和第二大小中的一者的變換單元內(nèi)的系數(shù)選擇上下文。在一些情況下,僅第一大小和第二大小的變換單元內(nèi)的高頻率系數(shù)可共享聯(lián)合上下文模型。第一大小的變換內(nèi)的低頻率系數(shù)(例如,DC分量和相鄰系數(shù))可使用與第二大小的變換內(nèi)的低頻率系數(shù)不同的上下文模型。目的地裝置14的接收器26經(jīng)由信道16接收信息,且調(diào)制解調(diào)器28對所述信息進(jìn)行解調(diào)。經(jīng)由信道16傳送的信息可包含由視頻編碼器20界定的語法信息,其也由視頻解碼器30使用,所述語法信息包含語法元素,其描述經(jīng)譯碼視頻的譯碼單元(CU)、預(yù)測單元(PU)、變換單元(TU)或其它單元(例如,視頻切片、視頻幀以及視頻序列或圖片群組(GOP))的特性和/或處理。顯示裝置32向用戶顯示經(jīng)解碼的視頻數(shù)據(jù),且可包括多種顯示裝置中的任一者,例如陰極射線管(CRT)、液晶顯示器(LCD)、等離子體顯示器、有機發(fā)光二極管(OLED)顯示器或另一類型的顯示裝置。根據(jù)本發(fā)明,目的地裝置14的視頻解碼器30可經(jīng)配置以應(yīng)用用于使用聯(lián)合上下文模型來對視頻系數(shù)進(jìn)行熵解碼的技術(shù)。待解碼的視頻幀的CU可包含一個或一個以上TU,其包含變換之前和之后的殘余視頻數(shù)據(jù)。視頻解碼器30可維持在具有不同大小的變換單元之間共享的聯(lián)合上下文模型,且根據(jù)所述聯(lián)合上下文模型為與所述變換單元中的一者相關(guān)聯(lián)的系數(shù)選擇上下文。視頻解碼器30可接著基于選定上下文對系數(shù)進(jìn)行熵解碼。舉例來說,所述聯(lián)合上下文模型可在具有第一大小32x32的變換單元與具有第二大小16x16的變換單元之間共享。如上文所述,在其它實例中,兩個以上大小的變換單元可共享同一聯(lián)合上下文模型。另外,兩個或兩個以上大小的變換單元可共享用于TU的上下文模型中的一些或全部。在一種情況下,聯(lián)合上下文模型可為用于TU的重要性圖的聯(lián)合上下文模型。在其它情況下,聯(lián)合上下文模型可與其它譯碼信息或語法元素相關(guān)聯(lián)。因此,所述技術(shù)可減少將上下文和概率存儲在視頻解碼器30上所必需的存儲器的量,且降低維持視頻解碼器30上的上下文模型的計算成本。在一個實例中,視頻解碼器30可接收表示與所保持系數(shù)塊相關(guān)聯(lián)的經(jīng)編碼系數(shù)以及來自具有第一大小的變換單元的經(jīng)歸零系數(shù)的位流。當(dāng)高頻率系數(shù)從變換單元歸零時,包含在所保持系數(shù)塊中的系數(shù)具有與包含在原始具有第二大小的變換單元中的系數(shù)類似的概率統(tǒng)計。在此實例中,視頻解碼器30可維持由具有第一大小的變換單元與具有第二大小的變換單元共享的聯(lián)合上下文模型,所述具有第一大小的變換單元具有經(jīng)歸零以產(chǎn)生所保持系數(shù)塊的系數(shù),且視頻解碼器30可根據(jù)所述聯(lián)合上下文模型為與具有所保持系數(shù)塊的第一大小以及第二大小中的一者的變換單元相關(guān)聯(lián)的經(jīng)編碼系數(shù)選擇上下文。在一些情況下,所保持系數(shù)塊可具有等于第二大小的大小。在其它情況下,所保持系數(shù)塊可具有等于第三大小的大小,所述第三大小不同于第一大小和第二大小兩者。在另一實例中,視頻解碼器30可接收表示與具有第一大小和第二大小中的一者的變換單元相關(guān)聯(lián)的經(jīng)編碼系數(shù)的位流。包含在具有第一大小的第一變換單元中的系數(shù)可具有與包含在第二大小的第二變換單元中的系數(shù)類似的概率統(tǒng)計,即使在不使第一變換單元內(nèi)的較高頻率系數(shù)歸零的情況下也是如此。在此實例中,視頻解碼器30可維持由具有第一大小和第二大小的變換單元共享的聯(lián)合上下文模型,且根據(jù)所述聯(lián)合上下文模型為與具有第一和第二大小中的一者的變換單元相關(guān)聯(lián)的經(jīng)編碼系數(shù)選擇上下文。在一些情況下,僅第一大小和第二大小的變換單元內(nèi)的高頻率系數(shù)可共享聯(lián)合上下文模型。第一大小的變換內(nèi)的低頻率系數(shù)(例如,DC分量和相鄰系數(shù))可使用與第二大小的變換內(nèi)的低頻率系數(shù)不同的上下文模型。在圖1的實例中,通信信道16可包括任何無線或有線通信媒體,例如,射頻(RF)頻譜或一個或一個以上物理傳輸線、或無線和有線媒體的任何組合。通信信道16可形成例如局域網(wǎng)、廣域網(wǎng)或例如因特網(wǎng)的全球網(wǎng)絡(luò)等基于包的網(wǎng)絡(luò)的部分。通信信道16大體表示用于將視頻數(shù)據(jù)從源裝置12發(fā)射到目的地裝置14的任何合適的通信媒體或不同通信媒體的集合,包含有線或無線媒體的任何合適組合。通信信道16可包含可用于促進(jìn)從源裝置12到目的地裝置14的通信的路由器、交換器、基站或任何其它設(shè)備。如上文所述,在一些情況下,源裝置12和目的地裝置14可不參與經(jīng)由通信信道16的實時活動通信。舉例來說,源裝置12可代替地將經(jīng)編碼視頻數(shù)據(jù)存儲到存儲媒體,目的地裝置14可在需要時經(jīng)由磁盤存取來存取所述存儲媒體,或源裝置12將經(jīng)編碼視頻數(shù)據(jù)存儲到目的地裝置14在需要時可經(jīng)由流式傳輸來存取的文件服務(wù)器。視頻編碼器20和視頻解碼器30可根據(jù)視頻壓縮標(biāo)準(zhǔn)來操作,例如新興的高效視頻譯碼(HEVC)標(biāo)準(zhǔn)或ITU-T H.264標(biāo)準(zhǔn),或者稱為MPEG-4,第10部分,高級視頻譯碼(AVC)。然而,本發(fā)明的技術(shù)不限于任何特定譯碼標(biāo)準(zhǔn)。其它實例包含MPEG-2和ITU-TH.263。盡管圖1中未展示,但在一些方面中,視頻編碼器20和視頻解碼器30可各自與音頻編碼器和解碼器集成,且可包含適當(dāng)?shù)亩嗦窂?fù)用器-多路分用器(MUX-DEMUX)單元或其它硬件及軟件,以處置對共用數(shù)據(jù)流或單獨數(shù)據(jù)流中的音頻與視頻兩者的編碼。如果適用,MUX-DEMUX單元可符合ITU H.223多路復(fù)用器協(xié)議或例如用戶數(shù)據(jù)報協(xié)議(UDP)等其它協(xié)議。HEVC標(biāo)準(zhǔn)化努力是基于視頻譯碼裝置的模型,稱為HEVC測試模型(HM)。HM假定視頻譯碼裝置相對于根據(jù)例如ITU-T H.264/AVC的現(xiàn)存裝置的若干額外能力。HM將視頻數(shù)據(jù)塊稱為譯碼單元(CU)。位流中的語法數(shù)據(jù)可界定最大譯碼單元(LCU),其為依據(jù)像素數(shù)據(jù)的最大譯碼單元。一般來說,CU具有與H.264標(biāo)準(zhǔn)的宏塊類似的目的,只是CU不具有大小差別。因此,CU可分割為若干子CU。一般來說,本發(fā)明中對CU的參考可指代圖片的最大譯碼單元或IXU的子⑶??蓪XU分割為若干子⑶,且每一子⑶可進(jìn)一步分割為若干子CU。用于位流的語法數(shù)據(jù)可界定LCU可分割的最大次數(shù),稱為CU深度。因此,位流還可界定最小譯碼單元(SCT)。不進(jìn)一步分割的⑶(即IXU的葉節(jié)點)可包含一個或一個以上預(yù)測單元(PU)。一般來說,PU表示對應(yīng)CU的全部或一部分,且包含用于檢索PU的參考樣本的數(shù)據(jù)。舉例來說,當(dāng)PU經(jīng)幀內(nèi)模式編碼時,可包含描述的幀內(nèi)預(yù)測模式的數(shù)據(jù)。作為另一實例,當(dāng)PU經(jīng)幀間模式編碼時,PU可包含界定的運動向量的數(shù)據(jù)。界定運動向量的數(shù)據(jù)可描述(例如)運動向量的水平分量、運動向量的垂直分量、運動向量的分辨率(例如,二分之一像素精度、四分之一像素精度或八分之一像素精度)、運動向量指向的參考幀,和/或運動向量的參考幀列表(例如,列表O或列表I)。界定PU的CU的數(shù)據(jù)還可描述(例如)將CU分割為一個或一個以上PU。分割模式可在CU是被跳過或直接模式編碼、經(jīng)幀內(nèi)預(yù)測模式編碼還是經(jīng)幀間預(yù)測模式編碼之間不同。具有一個或一個以上I3U的⑶還可包含一個或一個以上變換單元(TU)。在使用PU的預(yù)測后,視頻編碼器可計算CU的對應(yīng)于的部分的殘余值。包含在TU中的殘余值對應(yīng)于像素差值,其可變換為變換系數(shù),接著經(jīng)量化,且經(jīng)掃描以產(chǎn)生經(jīng)串行化變換系數(shù)以用于熵譯碼。TU不一定限于PU的大小。因此,TU可大于或小于同一⑶的對應(yīng)PU。在一些實例中,TU的最大大小可為對應(yīng)CU的大小。本發(fā)明使用術(shù)語“視頻塊”來指代CU、PU或TU中的任一者。視頻編碼器20和視頻解碼器30各自可實施為多種合適編碼器電路中的任一者,例如一個或一個以上微處理器、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)、離散邏輯、軟件、硬件、固件或其任何組合。視頻編碼器20和視頻解碼器30中的每一者可包含于一個或一個以上編碼器或解碼器中,視頻編碼器20和視頻解碼器30中的任一者可作為組合式編碼器/解碼器(CODEC)的一部分而集成于相應(yīng)相機、計算機、移動裝置、訂戶裝置、廣播裝置、機頂盒、服務(wù)器等中。視頻序列或圖片群組(GOP)通常包含一系列視頻幀。GOP可在GOP的標(biāo)頭、GOP的一個或一個以上幀的標(biāo)頭或其它地方中包含語法數(shù)據(jù),其描述包含于GOP中的幀的數(shù)目。每一幀可包含幀語法數(shù)據(jù),其描述相應(yīng)幀的編碼模式。視頻編碼器20通常對個別視頻幀內(nèi)的視頻塊進(jìn)行操作以便對視頻數(shù)據(jù)進(jìn)行編碼。視頻塊可對應(yīng)于CU或CU的PU。視頻塊可具有固定或不同大小,且其大小可根據(jù)指定譯碼標(biāo)準(zhǔn)而不同。每一視頻幀可包含多個切片。每一切片可包含多個⑶,其可包含一個或一個以上PU。舉例來說,HEVC測試模型(HM)支持各種⑶大小的預(yù)測。IXU的大小可由語法信息界定。假定特定⑶的大小為2Nx2N,HM支持2Nx2N或NxN大小的幀內(nèi)預(yù)測,以及2Nx2N、2NxN、Nx2N或NxN對稱大小的幀間預(yù)測。HM還支持2NxnU、2NxnD、nLx2N和nRx2N的幀間預(yù)測的不對稱分割。在不對稱分割中,CU的一個方向不分割,而另一方向分割成25 %和75 %。⑶的對應(yīng)于25%分割的部分由“η”后接“上”、“下”、“左”或“右”的指示來指示。因此,例如,“2NxnU”指代水平分割的2Nx2N CU,其中2ΝχΟ.5Ν PU在頂部,且2Nxl.5Ν PU在底部。在本發(fā)明中,“ΝχΝ”與“N乘N”可互換使用,以指代依據(jù)垂直和水平尺寸的視頻塊(例如,⑶、PU或TU)的像素尺寸,例如16x16像素或16乘16像素。16x16塊將在垂直方向上具有16個像素(y = 16),且在水平方向上具有16個像素(x = 16)。同樣地,NxN塊在垂直方向上具有N個像素,且在水平方向上具有N個像素,其中N表示非負(fù)整數(shù)值。一塊中的像素可布置成若干行和若干列。此外,塊無需必定在水平方向上與在垂直方向上具有相同數(shù)目的像素。舉例來說,塊可包括具有NxM像素的矩形區(qū)域,其中M不一定等于N。在用以產(chǎn)生CU的PU的幀內(nèi)預(yù)測或幀間預(yù)測譯碼之后,視頻編碼器20可計算殘余數(shù)據(jù)以產(chǎn)生⑶的一個或一個以上TU。殘余數(shù)據(jù)可對應(yīng)于未經(jīng)編碼圖片的像素與⑶的的預(yù)測值之間的像素差。視頻編碼器20可形成一個或一個以上TU,包含用于⑶的殘余數(shù)據(jù)。視頻編碼器20可接著變換所述TU。在應(yīng)用變換(例如離散余弦變換(DCT)、整數(shù)變換、小波變換或概念上類似的變換)之前,CU的TU可包括殘余視頻數(shù)據(jù),其在像素域中包括像素差值。在應(yīng)用變換之后,TU可包括表示頻域中的殘余視頻數(shù)據(jù)的變換系數(shù)。在任何變換以產(chǎn)生變換系數(shù)后,可執(zhí)行變換系數(shù)的量化。量化一般指代將變換系數(shù)量化以可能地減少用于表示系數(shù)的數(shù)據(jù)量的過程。量化過程可減少與系數(shù)中的一些或全部相關(guān)聯(lián)的位深度。舉例來說,在量化期間,可將η位值向下舍入到m位值,其中η大于m。視頻編碼器20可應(yīng)用與TU的大小相關(guān)聯(lián)的Z字形掃描、水平掃描、垂直掃描或另一掃描次序來掃描經(jīng)量化變換系數(shù),以產(chǎn)生可熵編碼的串行化向量。在一些實例中,視頻編碼器20可利用預(yù)定義掃描次序來掃描經(jīng)量化變換系數(shù)。在其它實例中,視頻編碼器20可執(zhí)行自適應(yīng)掃描。在掃描經(jīng)量化變換系數(shù)以形成一維向量之后,視頻編碼器20可例如根據(jù)上下文自適應(yīng)可變長度譯碼(CAVLC)、上下文自適應(yīng)二進(jìn)制算術(shù)譯碼(CABAC)或另一熵編碼方法來對一維向量進(jìn)行熵編碼。為了執(zhí)行上下文自適應(yīng)熵譯碼,視頻編碼器20必須根據(jù)上下文模型將上下文指派給每一系數(shù),所述模型可與(例如)相鄰系數(shù)的值是否為非零有關(guān)。視頻編碼器20接著確定與上下文模型中的所指派上下文相關(guān)聯(lián)的系數(shù)的譯碼過程。按照慣例,視頻編碼器20必須為由所實施視頻壓縮標(biāo)準(zhǔn)支持的TU的不同大小中的每一者維持單獨的上下文模型。對于HEVC標(biāo)準(zhǔn),已提出額外變換單元大小(例如,32x32直到128x128)以改進(jìn)視頻譯碼效率,但額外TU大小也導(dǎo)致增加的存儲器和計算要求以維持用于額外變換單元大小中的每一者的上下文模型。根據(jù)本發(fā)明的技術(shù),為了執(zhí)行上下文自適應(yīng)熵譯碼,視頻編碼器20可根據(jù)在不同大小的TU之間共享的聯(lián)合上下文模型為系數(shù)選擇上下文。更具體地說,視頻編碼器20可基于TU的先前經(jīng)編碼相鄰系數(shù)的值將聯(lián)合上下文模型中的上下文指派給TU的給定系數(shù)?;谟蒚U所共享的聯(lián)合上下文模型界定的準(zhǔn)則來選擇所指派上下文。視頻編碼器20可確定與聯(lián)合上下文模型中的所指派上下文相關(guān)聯(lián)的系數(shù)的譯碼過程。視頻編碼器20接著基于所確定的概率估計對系數(shù)進(jìn)行熵編碼。舉例來說,在CABAC的情況下,視頻編碼器20可確定與聯(lián)合上下文模型中的所指派上下文相關(guān)聯(lián)的系數(shù)的值(例如O或I)的概率估計。視頻編碼器20接著基于所述系數(shù)的實際經(jīng)譯碼值來更新與聯(lián)合上下文模型中的所指派上下文相關(guān)聯(lián)的概率估計。舉例來說,視頻編碼器20可使用同一聯(lián)合上下文模型為與原始具有第一大小的第一變換單元內(nèi)的所保持系數(shù)塊或原始具有第二大小的第二變換單元相關(guān)聯(lián)的系數(shù)選擇上下文。另外,視頻編碼器20可基于原始具有第一大小的第一變換單元內(nèi)的所保持系數(shù)塊或原始具有第二大小的第二變換單元的系數(shù)的實際經(jīng)譯碼值來更新與聯(lián)合上下文模型中的選定上下文相關(guān)聯(lián)的概率估計。作為另一實例,視頻編碼器20可使用同一聯(lián)合上下文模型為與具有第一大小的第一變換單元或具有第二大小的第二變換單元相關(guān)聯(lián)的系數(shù)選擇上下文。在此情況下,視頻編碼器20可接著基于第一大小的第一變換單元或第二大小的第二變換單元的系數(shù)的實際經(jīng)譯碼值來更新與聯(lián)合上下文模型中的選定上下文相關(guān)聯(lián)的概率估計。在任一情況下,在兩個或兩個以上大小的變換單元之間共享聯(lián)合上下文模型可減少將上下文和概率存儲在視頻編碼器20上所必需的存儲器的量。另外,共享聯(lián)合上下文模型還可降低維持視頻編碼器20上的上下文模型(包含在視頻切片的開始處使所有上下文模型復(fù)位)的計算成本。視頻編碼器20還可對指示預(yù)測信息的語法元素進(jìn)行熵編碼。舉例來說,視頻編碼器20可對指示視頻塊信息的語法元素進(jìn)行熵編碼,所述信息包含CU、PU和TU的大小、用于幀內(nèi)模式預(yù)測的運動向量信息以及重要系數(shù)圖信息,即對于CABAC指示重要系數(shù)的位置的若干一和若干零的圖。視頻解碼器30可以基本上與視頻編碼器20的操作方式對稱的方式操作。圖2是說明可實施用于使用聯(lián)合上下文模型對視頻系數(shù)進(jìn)行熵編碼的技術(shù)的實例視頻編碼器的框圖。視頻編碼器20可執(zhí)行視頻幀內(nèi)的譯碼單元的幀內(nèi)和幀間譯碼。幀內(nèi)譯碼依靠空間預(yù)測來減少或去除給定視頻幀內(nèi)的視頻中的空間冗余。幀間譯碼依靠時間預(yù)測來減少或去除視頻序列的鄰近幀內(nèi)的視頻中的時間冗余。幀內(nèi)模式(I模式)可涉及若干基于空間的壓縮模式中的任一者。例如單向預(yù)測(P模式)、雙向預(yù)測(B模式)或一般化P/B預(yù)測(GPB模式)等幀間模式可涉及若干基于時間的壓縮模式中的任一者。在圖2的實例中,視頻編碼器20包含模式選擇單元38、預(yù)測單元40、求和單元50、變換單元52、量化單元54、熵編碼單元56以及參考幀存儲器64。預(yù)測單元40包含運動估計單元42、運動補償單元44以及幀內(nèi)預(yù)測單元46。對于視頻塊重構(gòu),視頻編碼器20還包含逆量化單元58、逆變換單元60以及求和單元62。還可包含去塊濾波器或其它環(huán)內(nèi)濾波器(例如自適應(yīng)環(huán)路濾波器(ALF)和樣本自適應(yīng)偏移(SAO)(圖2中未展示)),以對塊邊界進(jìn)行濾波以去除來自經(jīng)重構(gòu)視頻的成塊假象。在需要時,去塊濾波器通常將對求和器62的輸出進(jìn)行濾波。如圖2中所示,視頻編碼器20接收待編碼視頻幀或切片內(nèi)的視頻塊。可將幀或切片分為多個視頻塊或CU。模式選擇單元38可基于誤差結(jié)果為視頻塊選擇譯碼模式中的一者,幀內(nèi)或幀間。預(yù)測單元40接著將所得經(jīng)幀內(nèi)或幀間譯碼的預(yù)測塊提供給求和單元50以產(chǎn)生殘余塊數(shù)據(jù),且提供給求和單元62以重構(gòu)經(jīng)編碼塊以供用作參考幀中的參考塊。預(yù)測單元40內(nèi)的幀內(nèi)預(yù)測單元46相對于與待譯碼視頻塊在同一幀中的一個或一個以上相鄰塊執(zhí)行對所述視頻塊的幀內(nèi)預(yù)測譯碼。預(yù)測單元40內(nèi)的運動估計單元42和運動補償單元44相對于存儲在參考幀存儲器64中的一個或一個以上參考幀中的一個或一個以上參考塊執(zhí)行視頻塊的幀間預(yù)測譯碼。運動估計單元42與運動補償單元44可高度集成,但出于概念上的目的而分開予以說明。由運動估計單元42執(zhí)行的運動估計是產(chǎn)生運動向量的過程,所述運動向量估計視頻塊的運動。舉例來說,運動向量可指示當(dāng)前視頻幀內(nèi)的視頻塊或PU相對于參考巾貞內(nèi)的參考塊或PU的移位。參考塊是所找到的依據(jù)像素差與待譯碼的視頻塊或PU接近匹配的塊,像素差可由絕對差和(SAD)、平方差和(SSD)或其它差度量確定。運動估計單元42將所計算的運動向量發(fā)送到運動補償單元44。由運動補償單元44執(zhí)行的運動補償可涉及基于由運動估計確定的運動向量來取或產(chǎn)生預(yù)測塊。視頻編碼器20通過將預(yù)測塊從正譯碼的視頻塊減去來形成殘余視頻塊。求和單元50表示執(zhí)行此減法運算的組件。運動補償單元44可產(chǎn)生語法元素,其經(jīng)定義以表示視頻序列級、視頻幀級、視頻切片級、視頻CU級或視頻PU級中的一者或一者以上處的預(yù)測信息。舉例來說,運動補償單元44可產(chǎn)生語法元素,其指示視頻塊信息,包含CU、PU和TU的大小,以及用于幀內(nèi)模式預(yù)測的運動向量信息。在視頻編碼器20通過將預(yù)測塊從當(dāng)前視頻塊減去而形成殘余視頻塊之后,變換單元52可從殘余塊形成一個或一個以上TU。變換單元52對TU應(yīng)用變換(例如離散余弦變換(DCT)、整數(shù)變換、小波變換或概念上類似的變換),以產(chǎn)生包括殘余變換系數(shù)的視頻塊。所述變換可將殘余塊從像素域轉(zhuǎn)換到變換域,例如頻域。更具體地說,在應(yīng)用變換之前,TU可在像素域中包括殘余視頻數(shù)據(jù),且在應(yīng)用變換之后,TU可在頻域中包括表示所述殘余視頻數(shù)據(jù)的變換系數(shù)。在一些實例中,變換單元52可包括二維可分離變換。變換單元52可通過首先將一維變換應(yīng)用于TU內(nèi)的殘余視頻數(shù)據(jù)的行(即在第一方向上)且接著將一維變換應(yīng)用于TU內(nèi)的殘余視頻數(shù)據(jù)的列(即在第二方向上)或反之亦然,來將二維變換應(yīng)用于TU。舉例來說,TU可包括32X32TU。變換單元52可首先將32點一維變換應(yīng)用于TU中的像素數(shù)據(jù)的每一行以產(chǎn)生中間變換系數(shù)的32x32TU,且其次將32點一維變換應(yīng)用于TU中的中間變換系數(shù)的每一列以產(chǎn)生變換系數(shù)的32x32TU。在于第一方向上將一維變換應(yīng)用于TU中的殘余視頻數(shù)據(jù)之后,視頻編碼器20緩沖中間變換系數(shù)以在第二方向上應(yīng)用一維變換。如上文所述,在HEVC標(biāo)準(zhǔn)中,已提出較大變換單元大小(例如,32x32直到128x128)以改進(jìn)視頻譯碼效率。然而,較大TU大小也將導(dǎo)致對二維變換的增加的中間緩沖要求。舉例來說,在32x32TU的情況下,視頻編碼器20在第一方向上的一維變換之后將必須緩沖1024個中間變換系數(shù)。為了降低對較大TU大小的中間緩沖要求,本發(fā)明中所描述的技術(shù)包含在已應(yīng)用二維變換的每一方向之后使包含在第一大小的TU中的變換系數(shù)的高頻率子集歸零。以此方式,變換單元52可在具有小于TU的第一大小的第二大小的TU內(nèi)產(chǎn)生所保持系數(shù)塊。歸零的過程包括將TU內(nèi)的變換系數(shù)子集的值設(shè)定為等于零。不計算或丟棄歸零的變換系數(shù);代替地,歸零的變換系數(shù)被簡單地設(shè)定為等于零,且不具有要存儲或編碼的值。根據(jù)本發(fā)明,歸零的變換系數(shù)通常為相對于TU中所保持的較低頻率變換系數(shù)的較高頻率變換系數(shù)。高頻率變換系數(shù)表示正常對應(yīng)于待編碼視頻塊與預(yù)測塊之間的非常小的像素差的殘余視頻數(shù)據(jù)。因此,高頻率變換系數(shù)可含有很少的殘余視頻數(shù)據(jù),以致將值設(shè)定為等于零對經(jīng)解碼視頻質(zhì)量具有可忽略的影響。舉例來說,變換單元52可在第一方向上(例如,逐行)將一維變換應(yīng)用于32x32TU中的殘余視頻數(shù)據(jù),且使從所述變換輸出的中間變換系數(shù)的一半歸零。視頻編碼器20接著僅需要緩沖中間變換系數(shù)的所保持的一半。變換單元52可接著在第二方向上(例如,逐列)將一維變換應(yīng)用于32x32TU中的所保持中間變換系數(shù),且再次使從所述變換輸出的所保持變換系數(shù)的一半歸零。以此方式,變換單元52可產(chǎn)生原始大小為32x32的TU內(nèi)具有大小16x16的重要系數(shù)的所保持系數(shù)塊。
在上文所述的實例中,變換單元52經(jīng)配置以產(chǎn)生16x16所保持系數(shù)塊,即TU的原始大小的四分之一。在其它情況下,變換單元52可經(jīng)配置以通過依據(jù)對譯碼過程的譯碼復(fù)雜性要求使較大或較小百分比的系數(shù)歸零來產(chǎn)生具有不同大小的所保持系數(shù)塊。此外,在一些情況下,變換單元52可經(jīng)配置以產(chǎn)生具有矩形區(qū)域的所保持系數(shù)塊。在此情況下,所述技術(shù)通過首先在矩形區(qū)域的較短邊(即,較少所保持變換系數(shù))的方向上應(yīng)用一維變換來提供中間緩沖要求的進(jìn)一步降低。以此方式,在于矩形區(qū)域的較長邊的方向上應(yīng)用一維變換之前,視頻編碼器20可緩沖少于中間變換系數(shù)的一半。相對于圖3A和3B更詳細(xì)地描述正方形和矩形區(qū)域所保持系數(shù)塊兩者的歸零過程。變換單元52可將所得變換系數(shù)發(fā)送到量化單元54。量化單元54量化變換系數(shù)以進(jìn)一步減小位速率。量化過程可減少與系數(shù)中的一些或全部相關(guān)聯(lián)的位深度??赏ㄟ^調(diào)整量化參數(shù)來修改量化程度。熵編碼單元56或量化單元54可接著執(zhí)行對包含經(jīng)量化變換系數(shù)的TU的掃描。熵編碼單元56可應(yīng)用與TU的大小相關(guān)聯(lián)的Z字形掃描或另一掃描次序來掃描經(jīng)量化變換系數(shù),以產(chǎn)生可熵編碼的串行化向量。在一個實例中,其中原始為第一大小的TU的系數(shù)已歸零以產(chǎn)生具有第二大小的所保持系數(shù)塊,熵編碼單元56可使用第二大小的TU的掃描次序來掃描所保持系數(shù)。在此情況下,熵編碼單元56可將16x16掃描次序應(yīng)用于原始大小為32x32的TU內(nèi)具有大小16x16的所保持系數(shù)塊。在另一實例中,其中原始為第一大小的TU的系數(shù)已歸零以產(chǎn)生具有第二大小的所保持系數(shù)塊,熵編碼單元56可使用第一大小的TU的掃描次序來掃描所保持系數(shù),所述第一大小已經(jīng)修改以跳過TU的不包含在所保持系數(shù)塊中的系數(shù)。在此情況下,熵編碼單元可通過跳過原始大小為32x32的TU內(nèi)的所有歸零系數(shù),來將32x32掃描次序應(yīng)用于具有大小16x16的所保持系數(shù)塊。在掃描經(jīng)量化變換系數(shù)以形成一維向量之后,熵編碼單元56對經(jīng)量化變換系數(shù)的向量進(jìn)行熵譯碼。舉例來說,熵編碼單元56可執(zhí)行上下文自適應(yīng)熵譯碼,例如CABAC、CAVLC或另一熵譯碼技術(shù)。在由熵編碼單元56進(jìn)行熵編碼之后,可將經(jīng)編碼位流發(fā)射到視頻解碼器(例如,視頻解碼器30),或存檔以供以后發(fā)射或檢索。為了執(zhí)行上下文自適應(yīng)熵譯碼,熵編碼單元56根據(jù)上下文模型將上下文指派給每一系數(shù),所述模型可與(例如)相鄰系數(shù)的值是否為非零有關(guān)。熵編碼單元56還確定與上下文模型中的所指派上下文相關(guān)聯(lián)的系數(shù)的譯碼過程。熵編碼單元56接著基于所指派的上下文對系數(shù)進(jìn)行熵編碼。舉例來說,在CABAC的情況下,熵編碼單元56可確定與聯(lián)合上下文模型中的所指派上下文相關(guān)聯(lián)的系數(shù)的值(例如O或I)的概率估計。熵編碼單元56接著基于所述系數(shù)的實際經(jīng)編碼值來更新與上下文模型中的所指派上下文相關(guān)聯(lián)的概率估計。按照慣例,視頻編碼器20為由所實施視頻壓縮標(biāo)準(zhǔn)支持的TU的不同大小中的每一者維持單獨的上下文模型。對于HEVC標(biāo)準(zhǔn),已提出額外變換單元大小(例如,32x32直到128x128)以改進(jìn)視頻譯碼效率,但額外TU大小也導(dǎo)致增加的存儲器和計算要求以維持用于額外變換單元大小中的每一者的上下文模型。在一些情況下,較大TU大小可使用較多上下文,這可導(dǎo)致增加的存儲器和計算要求以對于較大TU大小維持增加數(shù)目的上下文。根據(jù)本發(fā)明的技術(shù),熵編碼單元56可經(jīng)配置以使用在具有不同大小的變換單元之間共享的聯(lián)合上下文模型來執(zhí)行視頻系數(shù)的熵編碼。大部分相對于CABAC的熵編碼技術(shù)來描述所述技術(shù)。然而,在一些情況下,所述技術(shù)還可應(yīng)用于其它上下文自適應(yīng)熵譯碼技術(shù)。在兩個或兩個以上大小的變換單元之間共享聯(lián)合上下文模型可減少將上下文和概率存儲在視頻編碼器20上所必需的存儲器的量。另外,共享聯(lián)合上下文模型還可降低維持視頻編碼器20上的上下文模型(包含在視頻切片的開始處使所有上下文模型復(fù)位)的計算成本。在CABAC的情況下,所述技術(shù)還可基于系數(shù)的實際經(jīng)譯碼值而降低連續(xù)更新上下文模型的概率估計的計算成本。根據(jù)本發(fā)明,熵編碼單元56可維持在具有不同大小的變換單元之間共享的聯(lián)合上下文模型,且根據(jù)所述聯(lián)合上下文模型為與所述變換單元中的一者相關(guān)聯(lián)的系數(shù)選擇上下文。熵編碼單元56可接著基于選定上下文來對變換單元內(nèi)的重要系數(shù)進(jìn)行熵編碼。舉例來說,所述聯(lián)合上下文模型可在具有第一大小32x32的變換單元與具有第二大小16x16的變換單元之間共享。在一些情況下,兩個以上大小的變換單元可共享同一聯(lián)合上下文模型。在一個實例中,聯(lián)合上下文模型可為用于變換單元的重要性圖的聯(lián)合上下文模型。在其它實例中,聯(lián)合上下文模型可與其它譯碼信息或語法元素相關(guān)聯(lián)。相對于圖5更詳細(xì)地描述使用聯(lián)合上下文模型的CABAC編碼過程。在一個實例中,熵編碼單元56可維持由具有第一大小的TU與原始具有第二大小的TU共享的聯(lián)合上下文模型,所述具有第一大小的TU具有經(jīng)歸零以產(chǎn)生所保持系數(shù)塊的系數(shù)。在一些情況下,所保持系數(shù)塊可具有等于第二大小的大小。舉例來說,當(dāng)高頻率系數(shù)從第一大小的TU歸零時,包含在第二大小的所保持系數(shù)塊中的系數(shù)具有與包含在原始具有第二大小的TU中的系數(shù)類似的概率統(tǒng)計。在此情況下,當(dāng)已通過使原始具有第一大小的TU的系數(shù)歸零而產(chǎn)生第二大小的所保持系數(shù)塊時,熵編碼單元56可根據(jù)聯(lián)合上下文模型為所保持系數(shù)塊的系數(shù)選擇上下文。熵編碼單元56接著基于選定上下文來對所保持系數(shù)塊內(nèi)的重要系數(shù)進(jìn)行熵編碼。在CABAC的情況下,熵編碼單元56還基于系數(shù)的實際經(jīng)譯碼值來更新與聯(lián)合上下文模型中的選定上下文相關(guān)聯(lián)的概率估計。在另一實例中,熵編碼單元56可維持由具有第一大小的第一 TU與具有第二大小的第二 TU共享的聯(lián)合上下文模型。在一些情況下,包含在具有第一大小的第一 TU中的系數(shù)可具有與包含在具有第二大小的第二 TU中的系數(shù)類似的概率統(tǒng)計,即使在不使第一 TU內(nèi)的高頻率系數(shù)歸零的情況下也是如此。這是可能的,因為高頻率系數(shù)可表示殘余視頻數(shù)據(jù)很少,以致對用于熵譯碼的相鄰系數(shù)的概率統(tǒng)計的影響是可忽略的。在此實例中,熵編碼單元56可根據(jù)聯(lián)合上下文模型為具有第一和第二大小中的一者的TU內(nèi)的系數(shù)選擇上下文。熵編碼單元56接著基于選定上下文來對TU內(nèi)的重要系數(shù)進(jìn)行熵編碼。在CABAC的情況下,熵編碼單元56可接著基于系數(shù)的實際經(jīng)譯碼值來更新與聯(lián)合上下文模型中的選定上下文相關(guān)聯(lián)的概率估計。熵編碼單元56還可對指示運動向量的語法元素以及用于正譯碼的視頻塊的其它預(yù)測信息進(jìn)行熵編碼。舉例來說,熵編碼單元56可使用本發(fā)明中所描述的技術(shù)對指示重要性圖(即指示重要系數(shù)在TU中的位置的若干一和若干零的圖)的語法元素進(jìn)行熵編碼。熵編碼單元56還可構(gòu)造標(biāo)頭信息,其包含由運動補償單元44產(chǎn)生的適當(dāng)語法元素以在經(jīng)編碼位流中發(fā)射。視頻編碼器20可對語法元素進(jìn)行熵編碼,語法元素指示視頻塊信息,包含CU、PU和TU的大小,以及用于幀內(nèi)模式預(yù)測的運動向量信息。為了對語法元素進(jìn)行熵編碼,熵編碼單元56可通過將語法元素二值化為一個或一個以上二進(jìn)制位并根據(jù)上下文模型為每一二進(jìn)制位選擇上下文來執(zhí)行CABAC。逆量化單元58和逆變換單元60分別應(yīng)用逆量化和逆變換,以在像素域中重構(gòu)殘余塊,以供稍后用作參考幀的參考塊。求和單元62將所重構(gòu)的殘余塊與由運動補償單元44產(chǎn)生的預(yù)測塊相加以產(chǎn)生參考塊,以存儲在參考巾貞存儲器64中。參考塊可由運動估計單元42和運動補償單元44用作用以對后續(xù)視頻幀中的塊進(jìn)行幀間預(yù)測的參考塊。圖3A和3B是分別說明具有第一大小的變換單元內(nèi)的具有第二大小的所保持系數(shù)塊的正方形和矩形區(qū)域的概念圖。在圖3A和3B的概念說明中,不同框表示在應(yīng)用變換之后TU內(nèi)的變換系數(shù)。影線標(biāo)記區(qū)域內(nèi)的系數(shù)包括所保持變換系數(shù),且未包含在影線標(biāo)記區(qū)域內(nèi)(即,白色或陰影框)的系數(shù)包括在二維變換期間已歸零的系數(shù)。如上文所述,本發(fā)明的技術(shù)通過使在每一方向的二維變換之后包含在第一大小的TU中的變換系數(shù)的高頻率子集歸零來降低對較大TU大小(例如32x32直到128x128)的中間緩沖要求。以此方式,來自圖2的變換單元52可在TU內(nèi)產(chǎn)生具有小于TU的第一大小的第二大小的所保持系數(shù)塊。歸零的過程包括將TU內(nèi)的變換系數(shù)子集的值設(shè)定為等于零。不計算或丟棄歸零的變換系數(shù);代替地,歸零的變換系數(shù)被簡單地設(shè)定為等于零,且不具有要存儲或編碼的值。根據(jù)本發(fā)明,歸零的變換系數(shù)通常為相對于TU中所保持變換系數(shù)的高頻率變換系數(shù)。高頻率變換系數(shù)表示對應(yīng)于待編碼視頻塊與預(yù)測塊之間的非常小的像素差的殘余視頻數(shù)據(jù)。因此,高頻率變換系數(shù)可含有很少的殘余視頻數(shù)據(jù),以致將值設(shè)定為等于零對經(jīng)解碼視頻質(zhì)量具有可忽略的影響。圖3A說明具有第一大小16x16的TU70以及TU70內(nèi)具有第二大小8x8的最終正方形區(qū)域的所保持系數(shù)塊74??苫趯ψg碼過程的譯碼復(fù)雜性要求來選擇所保持系數(shù)塊74的大小和形狀。在此實例中,來自圖2的變換單元52可經(jīng)配置以產(chǎn)生原始具有大小16x16的TU70內(nèi)具有大小為8x8的正方形區(qū)域的所保持系數(shù)塊74。為了產(chǎn)生所保持系數(shù)塊74,變換單元52可在應(yīng)用二維變換的每一方向(即行和列)之后使較高頻率系數(shù)的一半歸零。在其它情況下,變換單元52可經(jīng)配置以依據(jù)對譯碼過程的譯碼復(fù)雜性要求使系數(shù)的較大或較小子集歸零。首先,變換單元52可將一維變換應(yīng)用于TU70中的殘余視頻數(shù)據(jù)的行,且使從所述變換輸出的中間變換系數(shù)的子集(在此情況下為一半)歸零。在圖3A的所說明實例中,所保持的中間變換系數(shù)包含于所保持中間系數(shù)塊73(即,TU70中的陰影塊)中,其具有等于TU70的原始16x16大小的一半的16x8的矩形區(qū)域。歸零的子集(即,TU70中的白色塊)可包含具有高于TU70的所保持中間系數(shù)塊73內(nèi)的系數(shù)的頻率值的系數(shù)。在所說明的實例中,變換單元52使TU70的每一行中具有8個最高頻率值的系數(shù)的一半歸零。此歸零過程產(chǎn)生TU70內(nèi)具有16x8的矩形區(qū)域的所保持中間系數(shù)塊73。在其它實例中,所保持中間系數(shù)塊73的區(qū)域可包括不同的大小或形狀。變換單元52可使16xl6TU70中的所有系數(shù)之中具有最高頻率值的系數(shù)的一半歸零。此歸零過程可得出TU70的左上角中具有三角形區(qū)域的所保持中間系數(shù)塊。通過使從第一方向上的變換輸出的中間變換系數(shù)的一半歸零,視頻編碼器20在于第二方向上應(yīng)用變換之前僅需要緩沖所保持中間系數(shù)塊73內(nèi)的系數(shù)。經(jīng)歸零子集(即,TU70中的白色塊)內(nèi)的系數(shù)不具有要存儲、變換或編碼的值。以此方式,所述技術(shù)可降低執(zhí)行二維變換時的中間緩沖要求。這對已提出用于HEVC標(biāo)準(zhǔn)的較大變換單元大小(例如32x32直到128x128)可能尤其有用。在緩沖之后,變換單元52可接著將一維變換應(yīng)用于所保持中間系數(shù)塊73中的所保持中間變換系數(shù)的列,且使從所述變換輸出的變換系數(shù)的子集(在此情況下為一半)歸零。在圖3A的所說明實例中,所保持的變換系數(shù)包含在所保持系數(shù)塊74(即,TU70中的影線標(biāo)記塊)中,其具有等于TU70的原始16x16大小的四分之一的大小8x8的正方形區(qū)域。歸零的子集(即,所保持中間系數(shù)塊73中的無影線標(biāo)記正方形)可包含具有高于TU70的所保持系數(shù)塊74內(nèi)的系數(shù)的頻率值的系數(shù)。在所說明的實例中,變換單元52使所保持中間系數(shù)塊73的每一列中具有8個最高頻率值的系數(shù)的一半歸零。在其它實例中,變換單元52可使16x8所保持中間系數(shù)塊73中的所有系數(shù)之中具有最高頻率值的系數(shù)的一半歸零。在任一情況下,歸零過程產(chǎn)生TU70內(nèi)具有8x8正方形區(qū)域的所保持系數(shù)塊74。圖3B說明具有第一大小16x16的TU76以及TU76內(nèi)具有第二大小4x16的最終矩形區(qū)域的所保持系數(shù)塊78??苫趯ψg碼過程的譯碼復(fù)雜性要求來選擇所保持系數(shù)塊78的大小和形狀。更具體地說,可基于用于所保持系數(shù)塊78的幀內(nèi)譯碼模式、掃描模式和最后一個重要系數(shù)的位置中的至少一者來選擇所保持系數(shù)塊78的最終矩形區(qū)域。在圖3B的所說明實例中,變換單元52可經(jīng)配置以產(chǎn)生原始具有大小16x16的TU76內(nèi)具有大小為4x16的矩形區(qū)域的所保持系數(shù)塊78。變換單元52可首先在所保持系數(shù)塊78的最終矩形區(qū)域的最短邊(例如,列)的方向上應(yīng)用于TU76。為了產(chǎn)生所保持系數(shù)塊78,變換單元52可在于第一方向(例如列)上應(yīng)用二維變換之后使所述系數(shù)中的四分之三歸零。在其它情況下,變換單元52可經(jīng)配置以依據(jù)對譯碼過程的譯碼復(fù)雜性要求使系數(shù)的較大或較小子集歸零。當(dāng)為所保持系數(shù)塊選擇矩形區(qū)域時,所述技術(shù)可通過在矩形區(qū)域的較短邊(即,較少所保持變換系數(shù))的方向上應(yīng)用一維變換來提供中間緩沖要求的進(jìn)一步降低。以此方式,在于矩形區(qū)域的較長邊的方向上應(yīng)用一維變換之前,視頻編碼器20可緩沖少于中間變換系數(shù)的一半。在圖3B的所說明實例中,所保持系數(shù)塊78的最終矩形區(qū)域的高度(H)小于矩形區(qū)域的寬度(W),因此將在垂直方向上保持較少的中間變換系數(shù)。因此,變換單元52可首先將變換應(yīng)用于TU76的列,使得視頻編碼器20可在將變換應(yīng)用于TU76的行之前緩沖少于中間變換系數(shù)的一半(在此情況下為四分之一)。更具體地說,變換單元52可將一維變換應(yīng)用于TU76中的殘余視頻數(shù)據(jù)的列,且使從所述變換輸出的中間變換系數(shù)的子集(在此情況下為四分之三)歸零。在圖3B的所說明實例中,所保持的中間變換系數(shù)包含于所保持中間系數(shù)塊77(即,TU76中的陰影塊)中,其具有等于TU76的原始16x16大小的四分之一的4x16的矩形區(qū)域。歸零的子集(即,TU76中的白色塊)可包含具有高于TU76的所保持中間系數(shù)塊77內(nèi)的系數(shù)的頻率值的系數(shù)。在所說明的實例中,變換單元52使TU76的每一列中具有12個最高頻率值的系數(shù)中的四分之三歸零。此歸零過程產(chǎn)生TU76內(nèi)具有4x16的矩形區(qū)域的所保持中間系數(shù)塊77。通過使從第一方向上的變換輸出的中間變換系數(shù)中的四分之三歸零,視頻編碼器20在于第二方向上應(yīng)用變換之前僅需要緩沖所保持中間系數(shù)塊77內(nèi)的系數(shù)。經(jīng)歸零子集(SP,TU76中的白色塊)內(nèi)的系數(shù)不具有要存儲、變換或編碼的值。以此方式,所述技術(shù)可降低執(zhí)行二維變換時的中間緩沖要求。這對已針對HEVC標(biāo)準(zhǔn)提出的較大變換單元大小(例如32x32直到128x128)可能尤其有用。在緩沖之后,變換單元52可接著將一維變換應(yīng)用于所保持中間系數(shù)塊77中的系數(shù)的行。在此實例中,變換單元52可不使從所述變換輸出的變換系數(shù)中的任一者歸零,因為TU76已經(jīng)歸零到16x16的原始大小的四分之一。在圖3A的所說明實例中,所保持變換系數(shù)包含于所保持系數(shù)塊78 (即,TU76中的影線標(biāo)記塊)中,其具有與所保持中間系數(shù)塊77相同的4x16的矩形區(qū)域。歸零過程產(chǎn)生TU70內(nèi)具有4x16的矩形區(qū)域的所保持系數(shù)塊78。圖4是說明可實施用于使用聯(lián)合上下文模型對視頻系數(shù)進(jìn)行熵解碼的技術(shù)的實例視頻解碼器的框圖。在圖4的實例中,視頻解碼器30包含熵解碼單元80、預(yù)測單元81、逆量化單元86、逆變換單元88、求和單元90以及參考巾貞存儲器92。預(yù)測單元81包含運動補償單元82和幀內(nèi)預(yù)測單元84。視頻解碼器30在一些實例中可執(zhí)行一般與關(guān)于視頻編碼器20 (圖2)所描述的編碼遍次互逆的解碼遍次。在解碼過程期間,視頻解碼器30接收表示經(jīng)編碼視頻幀或切片的經(jīng)編碼視頻位流以及表示來自視頻編碼器20的譯碼信息的語法元素。熵解碼單元80對位流進(jìn)行熵解碼以產(chǎn)生TU內(nèi)的經(jīng)量化變換系數(shù)。舉例來說,熵解碼單元80可執(zhí)行上下文自適應(yīng)熵解碼,例如CABAC、CAVLC或另一熵譯碼技術(shù)。熵解碼單元80還使用本發(fā)明中所描述的技術(shù)對包含重要性圖(即指示重要系數(shù)在TU中的位置的若干一和若干零的圖)的語法元素進(jìn)行熵解碼。熵解碼單元80還可對運動向量和其它預(yù)測語法元素進(jìn)行熵解碼。為了執(zhí)行上下文自適應(yīng)熵解碼,熵解碼單元80根據(jù)上下文模型將上下文指派給位流中表示的每一經(jīng)編碼系數(shù),所述上下文模型可與(例如)先前解碼的相鄰系數(shù)的值是否為非零有關(guān)。熵解碼單元80還確定與上下文模型中的所指派上下文相關(guān)聯(lián)的經(jīng)編碼系數(shù)的譯碼過程。熵解碼單元80接著基于所指派的上下文對系數(shù)進(jìn)行熵解碼。在CABAC的情況下,熵解碼單元80確定與上下文模型中的所指派上下文相關(guān)聯(lián)的經(jīng)編碼系數(shù)的值(例如O或I)的概率估計。熵解碼單元80接著基于所述系數(shù)的實際經(jīng)解碼值來更新與上下文模型中的所指派上下文相關(guān)聯(lián)的概率估計。按照慣例,視頻解碼器30必須為由所實施視頻壓縮標(biāo)準(zhǔn)支持的TU的不同大小中的每一者維持單獨的上下文模型。對于HEVC標(biāo)準(zhǔn),已提出額外變換單元大小(例如,32x32直到128x128)以改進(jìn)視頻譯碼效率,但額外TU大小也導(dǎo)致增加的存儲器和計算要求以維持用于額外變換單元大小中的每一者的上下文模型。根據(jù)本發(fā)明的技術(shù),熵解碼單元80可經(jīng)配置以使用在具有不同大小的變換單元之間共享的聯(lián)合上下文模型來執(zhí)行視頻系數(shù)的熵解碼。主要相對于CABAC的熵解碼技術(shù)來描述所述技術(shù)。然而,在一些情況下,所述技術(shù)還可應(yīng)用于其它上下文自適應(yīng)熵譯碼技術(shù)。在兩個或兩個以上大小的變換單元之間共享聯(lián)合上下文模型可減少將上下文和概率存儲在視頻解碼器30上所必需的存儲器的量。另外,共享聯(lián)合上下文模型還可降低維持視頻解碼器30上的上下文模型(包含在視頻切片的開始處使所有上下文模型復(fù)位)的計算成本。在CABAC的情況下,所述技術(shù)還可基于系數(shù)的實際經(jīng)譯碼值而降低連續(xù)更新上下文模型的概率估計的計算成本。根據(jù)本發(fā)明,熵解碼單元80可維持在具有不同大小的變換單元之間共享的聯(lián)合上下文模型,且根據(jù)所述聯(lián)合上下文模型為與所述變換單元中的一者相關(guān)聯(lián)的系數(shù)選擇上下文。熵解碼單元80可接著基于選定上下文來對與變換單元相關(guān)聯(lián)的重要系數(shù)進(jìn)行熵解碼。舉例來說,所述聯(lián)合上下文模型可在具有第一大小32x32的變換單元與具有第二大小16x16的變換單元之間共享。在一些情況下,兩個以上大小的變換單元可共享同一聯(lián)合上下文模型。在一個實例中,聯(lián)合上下文模型可為用于變換單元的重要性圖的聯(lián)合上下文模型。在其它實例中,聯(lián)合上下文模型可與其它譯碼信息或語法元素相關(guān)聯(lián)。相對于圖6更詳細(xì)地描述使用聯(lián)合上下文模型的CABAC解碼過程。在一個實例中,熵解碼單元80可維持由具有第一大小的TU與原始具有第二大小的TU共享的聯(lián)合上下文模型,所述具有第一大小的TU具有經(jīng)歸零以產(chǎn)生所保持系數(shù)塊的系數(shù)。在一些情況下,所保持系數(shù)塊可具有等于第二大小的大小。舉例來說,在此情況下,熵解碼單元80可根據(jù)聯(lián)合上下文模型為原始具有第一大小的TU內(nèi)具有第二大小的所保持系數(shù)塊的系數(shù)選擇上下文。熵解碼單元80接著基于選定上下文在算術(shù)上將經(jīng)編碼的重要系數(shù)解碼為具有第一大小的TU內(nèi)的所保持系數(shù)塊。在CABAC的情況下,熵解碼單元80還基于系數(shù)的實際經(jīng)解碼值來更新與聯(lián)合上下文模型中的選定上下文相關(guān)聯(lián)的概率估計。在另一實例中,熵解碼單元80可維持由具有第一大小的第一 TU與具有第二大小的第二 TU共享的聯(lián)合上下文模型。在此實例中,熵解碼單元80可根據(jù)聯(lián)合上下文模型為與具有第一和第二大小中的一者的TU相關(guān)聯(lián)的經(jīng)編碼系數(shù)選擇上下文。熵解碼單元80接著基于選定上下文來將經(jīng)編碼重要系數(shù)熵解碼為TU。在CABAC的情況下,熵解碼單元80可接著基于系數(shù)的實際經(jīng)解碼值來更新與聯(lián)合上下文模型中的選定上下文相關(guān)聯(lián)的概率估計。在任一情況下,熵解碼單元80將第一大小或第二大小的TU內(nèi)的經(jīng)解碼經(jīng)量化變換系數(shù)轉(zhuǎn)發(fā)到逆量化單元86。逆量化單元86使如上文所述由熵解碼單元80解碼為TU的經(jīng)量化變換系數(shù)逆量化(即去量化)。逆量化過程可包含針對每一視頻塊或CU使用由視頻編碼器20計算的量化參數(shù)QP來確定量化程度以及同樣確定應(yīng)當(dāng)應(yīng)用逆量化的程度。逆變換單元88對TU內(nèi)的變換系數(shù)應(yīng)用逆變換(例如,逆DCT、逆整數(shù)變換、逆小波變換或概念上類似的逆變換過程),以便產(chǎn)生像素域中的殘余視頻數(shù)據(jù)。在一些實例中,逆變換單元88可包括二維可分離變換。逆變換單元88可通過首先將一維逆變換應(yīng)用于TU內(nèi)的變換系數(shù)的行,且接著將一維逆變換應(yīng)用于TU內(nèi)的變換系數(shù)的列,或反之亦然,來將二維變換應(yīng)用于TU。在于第一方向上將一維逆變換應(yīng)用于TU中的變換系數(shù)之后,視頻解碼器30緩沖中間殘余數(shù)據(jù)以在第二方向上應(yīng)用一維逆變換。如上文所述,在HEVC標(biāo)準(zhǔn)中,已提出較大變換單元大小(例如,32x32直到128x128)以改進(jìn)視頻譯碼效率。然而,較大TU大小也將導(dǎo)致對二維變換的增加的中間緩沖要求。為了降低對較大TU大小的中間緩沖要求,本發(fā)明中所描述的技術(shù)可包含用來自圖2的視頻編碼器20使包含于TU中的變換系數(shù)的高頻率子集歸零。簡單地將TU內(nèi)經(jīng)歸零的變換系數(shù)設(shè)定為等于零,且所述系數(shù)不具有要存儲、變換或編碼的值。因此,熵解碼單元80接收表示與原始具有第一大小的TU內(nèi)具有第二大小的所保持系數(shù)塊相關(guān)聯(lián)的經(jīng)編碼系數(shù)的經(jīng)編碼位流。熵解碼單元80將系數(shù)解碼為具有第一大小的TU內(nèi)的所保持系數(shù)塊。TU接著包含第二大小的所保持系數(shù)塊內(nèi)的系數(shù),以及表示TU內(nèi)的剩余系數(shù)的若干零。以此方式,使視頻編碼器20中的變換系數(shù)歸零的過程還可降低在視頻解碼器30中執(zhí)行逆變換時對較大TU大小的中間緩沖要求。舉例來說,逆變換單元88可在第一方向上(例如,逐行)將一維逆變換應(yīng)用于具有大小32x32的TU內(nèi)具有大小16x16的所保持系數(shù)塊中的變換系數(shù)。在行逆變換之后,視頻解碼器30可僅需要緩沖從僅包括TU的一半(即,32x16個系數(shù))的所保持系數(shù)塊內(nèi)的系數(shù)變換的中間殘余數(shù)據(jù)。逆變換單元88可接著在第二方向上(例如,逐列)將一維逆變換應(yīng)用于TU中的中間殘余數(shù)據(jù)。以此方式,逆變換單元88可通過將殘余數(shù)據(jù)包含于具有大小16x16的所保持系數(shù)塊中且添加若干零以表示TU中的剩余殘余數(shù)據(jù)來產(chǎn)生原始大小為32x32的TU。熵解碼單元80還將經(jīng)解碼運動向量和其它預(yù)測語法元素轉(zhuǎn)發(fā)到預(yù)測單元81。視頻解碼器30可在視頻預(yù)測單元級、視頻譯碼單元級、視頻切片級、視頻幀級和/或視頻序列級處接收語法元素。當(dāng)將視頻幀譯碼為經(jīng)幀內(nèi)譯碼幀時,預(yù)測單元81的幀內(nèi)預(yù)測單元84基于來自當(dāng)前幀的先前解碼塊的數(shù)據(jù)而產(chǎn)生用于當(dāng)前視頻幀的視頻塊的預(yù)測數(shù)據(jù)。當(dāng)將視頻幀譯碼為經(jīng)幀間譯碼幀時,預(yù)測單元81的運動補償單元82基于從熵解碼單元80接收到的經(jīng)解碼運動向量而產(chǎn)生用于當(dāng)前視頻幀的視頻塊的預(yù)測塊??上鄬τ诖鎯υ趨⒖紟鎯ζ?2中的參考幀的一個或一個以上參考塊產(chǎn)生預(yù)測塊。運動補償單元82通過剖析運動向量和其它預(yù)測語法來確定用于待解碼視頻塊的預(yù)測信息,且使用所述預(yù)測信息來產(chǎn)生用于正解碼的當(dāng)前視頻塊的預(yù)測塊。舉例來說,運動補償單元82使用所接收語法元素中的一些來確定用以編碼當(dāng)前幀的CU的大小、描述幀的每一 CU如何分割的分割信息、指示如何編碼每一分割的模式(例如,幀內(nèi)或幀間預(yù)測)、幀間預(yù)測切片類型(例如,B切片、P切片或GPB切片)、參考幀列表構(gòu)造命令、應(yīng)用于參考幀的內(nèi)插濾波器、用于所述幀的每一視頻塊的運動向量、與所述運動向量相關(guān)聯(lián)的視頻參數(shù)值,以及用以解碼當(dāng)前視頻幀的其它信息。視頻解碼器30通過將來自逆變換單元88的殘余塊與由運動補償單元82產(chǎn)生的對應(yīng)預(yù)測塊求和來形成經(jīng)解碼視頻塊。求和單元90表示執(zhí)行此求和運算的組件。如果需要的話,還可應(yīng)用去塊濾波器以對經(jīng)解碼塊進(jìn)行濾波,以便去除成塊假象。經(jīng)解碼視頻塊接著存儲在參考幀存儲器92中的參考幀中,參考幀存儲器92提供參考幀的參考塊以供進(jìn)行后續(xù)運動補償。參考幀存儲器92還產(chǎn)生經(jīng)解碼視頻以供在顯示裝置(例如,圖1的顯示裝置32)上呈現(xiàn)。圖5是說明經(jīng)配置以根據(jù)聯(lián)合上下文模型為視頻系數(shù)選擇上下文的來自圖2的熵編碼單元56的實例的框圖。熵編碼單元56包含上下文建模單元94、算術(shù)編碼單元96以及聯(lián)合上下文模型存儲裝置98。如上文所述,本發(fā)明的技術(shù)是針對使用在具有不同大小的變換單元之間共享的聯(lián)合上下文模型來執(zhí)行視頻系數(shù)的熵編碼。具體地說,本文相對于CABAC編碼過程來描述所述技術(shù)。熵編碼單元56將在具有不同大小的變換單元之間共享的聯(lián)合上下文模型維持在聯(lián)合上下文模型存儲裝置98內(nèi)。作為一個實例,聯(lián)合上下文模型存儲裝置98可存儲由具有第一大小的TU與原始具有第二大小的TU共享的聯(lián)合上下文模型,所述具有第一大小的TU具有經(jīng)歸零以產(chǎn)生具有第二大小的所保持系數(shù)塊的系數(shù)。作為另一實例,聯(lián)合上下文模型存儲裝置98可存儲由具有第一大小的TU與具有第二大小的TU共享的聯(lián)合上下文模型。在一些情況下,第一大小可包括32x32,且第二大小可包括16x16。上下文建模單元94接收已掃描到用于熵編碼的向量中的與具有第一大小或第二大小的TU相關(guān)聯(lián)的變換系數(shù)。上下文建模單元94接著根據(jù)聯(lián)合上下文模型基于TU的先前編碼的相鄰系數(shù)的值將上下文指派給TU的系數(shù)中的每一者。更具體地說,上下文建模單元94可根據(jù)先前編碼的相鄰系數(shù)的值是否為非零而指派上下文。所指派的上下文可指代聯(lián)合上下文模型中的上下文索引,例如上下文(i),其中i = 0,1,2,..., N0在將上下文指派給系數(shù)之后,上下文建模單元94可確定對與聯(lián)合上下文模型中的所指派上下文相關(guān)聯(lián)的系數(shù)的值(例如,O或I)的概率估計。每一不同上下文索引與對具有所述上下文索引的系數(shù)的值的概率估計相關(guān)聯(lián)。由上下文建模單元94針對CABAC執(zhí)行的概率估計可基于使用有限狀態(tài)機(FSM)的表驅(qū)動估計器。對于每一上下文,F(xiàn)SM通過跟蹤過去的上下文值且提供當(dāng)前狀態(tài)作為給定系數(shù)具有值O或I的概率的最佳估計來維持相關(guān)聯(lián)概率估計。舉例來說,如果概率狀態(tài)的范圍是從O到127,那么狀態(tài)O可表示系數(shù)具有值O的概率為0.9999,且狀態(tài)127可表示系數(shù)具有值O的概率為0.0001。算術(shù)編碼單元96基于與所指派上下文相關(guān)聯(lián)的系數(shù)的所確定概率估計對系數(shù)進(jìn)行算術(shù)編碼。以此方式,算術(shù)編碼單元96根據(jù)聯(lián)合上下文模型產(chǎn)生經(jīng)編碼位流,其表示與具有第一大小或第二大小的TU相關(guān)聯(lián)的經(jīng)算術(shù)編碼的系數(shù)。在編碼之后,算術(shù)編碼單元96將系數(shù)的實際經(jīng)編碼值反饋到上下文建模單元94以更新與聯(lián)合上下文模型存儲裝置98內(nèi)的聯(lián)合上下文模型中的所指派上下文相關(guān)聯(lián)的概率估計。上下文建模單元94通過在概率狀態(tài)之間轉(zhuǎn)變來執(zhí)行對聯(lián)合上下文模型中的所指派上下文的概率更新。舉例來說,如果系數(shù)的實際經(jīng)譯碼值為0,那么系數(shù)值等于O的概率可通過轉(zhuǎn)變到較低狀態(tài)來增加。通過連續(xù)更新聯(lián)合上下文模型的概率估計以反映系數(shù)的實際經(jīng)編碼值,對指派給聯(lián)合上下文模型中的相同上下文的未來系數(shù)的概率估計可更準(zhǔn)確,且導(dǎo)致算術(shù)編碼單元96的位編碼進(jìn)一步減少。在第一實例中,聯(lián)合上下文模型存儲裝置98可存儲由具有第一大小的TU與原始具有第二大小的TU共享的聯(lián)合上下文模型,所述具有第一大小的TU具有經(jīng)歸零以產(chǎn)生具有第二大小的所保持系數(shù)塊的系數(shù)。舉例來說,聯(lián)合上下文模型存儲裝置98可存儲由原始具有大小32x32的TU內(nèi)的具有大小16x16的所保持系數(shù)塊與原始具有大小16x16的TU共享的聯(lián)合上下文模型。大小為32x32的第一 TU內(nèi)大小為16x16的所保持系數(shù)塊內(nèi)的第一系數(shù)可被指派由大小為32x32的TU與大小為16x16的TU共享的聯(lián)合上下文模型中的上下文(5),所述大小為32x32的TU具有經(jīng)歸零以產(chǎn)生大小為16x16的所保持系數(shù)塊的系數(shù)。上下文建模單元94接著確定對與聯(lián)合上下文模型中的所指派上下文(5)相關(guān)聯(lián)的第一系數(shù)的值的概率估計,且基于第一系數(shù)的實際經(jīng)編碼值來更新與聯(lián)合上下文模型中的所指派上下文(5)相關(guān)聯(lián)的概率估計。大小為16x16的第二 TU內(nèi)的第二系數(shù)也可被指派聯(lián)合上下文模型中與第一 TU內(nèi)的所保持系數(shù)塊中的系數(shù)相同的上下文(5)。上下文建模單元94接著確定對與聯(lián)合上下文模型中的所述相同所指派上下文(5)相關(guān)聯(lián)的第二系數(shù)的值的概率估計,且基于第二系數(shù)的實際經(jīng)編碼值來更新與聯(lián)合上下文模型中的所述相同所指派上下文(5)相關(guān)聯(lián)的概率估計。在第二實例中,聯(lián)合上下文模型存儲裝置98可存儲由具有第一大小的TU與具有第二大小的TU共享的聯(lián)合上下文模型。舉例來說,聯(lián)合上下文模型存儲裝置98可存儲由具有大小32x32和16x16的TU共享的聯(lián)合上下文模型。大小為32x32的第一 TU內(nèi)的第一系數(shù)可被指派由大小32x32和16x16的TU共享的聯(lián)合上下文模型中的上下文(5)。上下文建模單元94接著確定對與聯(lián)合上下文模型中的所指派上下文(5)相關(guān)聯(lián)的第一系數(shù)的值的概率估計,且基于第一系數(shù)的實際經(jīng)編碼值來更新與聯(lián)合上下文模型中的所指派上下文(5)相關(guān)聯(lián)的概率估計。大小為16x16的第二 TU內(nèi)的第二系數(shù)也可被指派聯(lián)合上下文模型中與第一 TU中的系數(shù)相同的上下文(5)。上下文建模單元94接著確定對與聯(lián)合上下文模型中的所述相同所指派上下文(5)相關(guān)聯(lián)的第二系數(shù)的值的概率估計,且基于第二系數(shù)的實際經(jīng)編碼值來更新與聯(lián)合上下文模型中的所述相同所指派上下文(5)相關(guān)聯(lián)的概率估計。圖6是說明經(jīng)配置以根據(jù)聯(lián)合上下文模型為視頻系數(shù)選擇上下文的熵解碼單元80的實例的框圖。熵解碼單元80包含算術(shù)編碼單元102、上下文建模單元104以及聯(lián)合上下文模型存儲裝置106。如上文所述,本發(fā)明的技術(shù)是針對使用在具有不同大小的變換單元之間共享的聯(lián)合上下文模型來執(zhí)行視頻系數(shù)的熵解碼。具體地說,本文相對于CABAC解碼過程來描述所述技術(shù)。熵解碼單元80可以基本上與來自圖5的熵編碼單元56的操作方式對稱的方式操作。熵解碼單元80將在具有不同大小的變換單元之間共享的聯(lián)合上下文模型維持在聯(lián)合上下文模型存儲裝置106內(nèi)。存儲在聯(lián)合上下文模型存儲裝置106內(nèi)的聯(lián)合上下文模型大體上類似于存儲在來自圖5的熵編碼單元56中的聯(lián)合上下文模型存儲裝置98中的聯(lián)合上下文模型。作為一個實例,聯(lián)合上下文模型存儲裝置106可存儲由具有第一大小的TU與原始具有第二大小的TU共享的聯(lián)合上下文模型,所述具有第一大小的TU具有經(jīng)歸零以產(chǎn)生具有第二大小的所保持系數(shù)塊的系數(shù)。作為另一實例,聯(lián)合上下文模型存儲裝置106可存儲由具有第一大小的TU與具有第二大小的TU共享的聯(lián)合上下文模型。在一些情況下,第一大小可包括32x32,且第二大小可包括16x16。算術(shù)解碼單元102接收表示與第一大小或第二大小的TU相關(guān)聯(lián)的經(jīng)編碼變換系數(shù)的經(jīng)編碼位流。算術(shù)解碼單元102對包含在位流中的第一系數(shù)進(jìn)行解碼。上下文建模單元104接著基于第一經(jīng)解碼系數(shù)的值將上下文指派給包含在位流中的后續(xù)經(jīng)編碼系數(shù)。以類似方式,上下文建模單元104根據(jù)聯(lián)合上下文模型基于TU的先前解碼的相鄰系數(shù)的值將上下文指派給包含于位流中的經(jīng)編碼系數(shù)中的每一者。更具體地說,上下文建模單元104可根據(jù)先前解碼的相鄰系數(shù)的值是否為非零而指派上下文。所指派的上下文可指代聯(lián)合上下文模型中的上下文索引。在將上下文指派給經(jīng)編碼系數(shù)之后,上下文建模單元104可確定對與聯(lián)合上下文模型中的所指派上下文相關(guān)聯(lián)的經(jīng)編碼系數(shù)的值(例如,O或I)的概率估計。每一不同上下文索引與一概率估計相關(guān)聯(lián)。上下文建模單元104將經(jīng)編碼系數(shù)的所確定概率估計反饋到算術(shù)解碼單元102。算術(shù)解碼單元102接著基于與所指派上下文相關(guān)聯(lián)的系數(shù)的所確定概率估計對經(jīng)編碼系數(shù)進(jìn)行算術(shù)解碼。以此方式,算術(shù)解碼單元102根據(jù)聯(lián)合上下文模型產(chǎn)生具有第一大小或第二大小的TU內(nèi)的經(jīng)解碼變換系數(shù)。在解碼之后,算術(shù)解碼單元102將系數(shù)的實際經(jīng)解碼值饋送到上下文建模單元104以更新與聯(lián)合上下文模型存儲裝置106內(nèi)的聯(lián)合上下文模型中的所指派上下文相關(guān)聯(lián)的概率估計。通過連續(xù)更新聯(lián)合上下文模型的概率估計以反映系數(shù)的實際經(jīng)解碼值,對指派給聯(lián)合上下文模型中的相同上下文的未來系數(shù)的概率估計可更準(zhǔn)確,且導(dǎo)致算術(shù)解碼單元102的位解碼進(jìn)一步減少。
在第一實例中,聯(lián)合上下文模型存儲裝置106可存儲由具有第一大小的TU與原始具有第二大小的TU共享的聯(lián)合上下文模型,所述具有第一大小的TU具有經(jīng)歸零以產(chǎn)生具有第二大小的所保持系數(shù)塊的系數(shù)。舉例來說,聯(lián)合上下文模型存儲裝置106可存儲由原始具有大小32x32的TU內(nèi)的具有大小16x16的所保持系數(shù)塊與原始具有大小16x16的TU共享的聯(lián)合上下文模型。與大小為32x32的第一 TU內(nèi)大小為16x16的所保持系數(shù)塊相關(guān)聯(lián)的第一經(jīng)編碼系數(shù)可被指派由大小為32x32的TU與大小為16x16的TU共享的聯(lián)合上下文模型中的上下文(5),所述大小為32x32的TU具有經(jīng)歸零以產(chǎn)生具有大小16x16的所保持系數(shù)塊的系數(shù)。上下文建模單元104接著確定對與聯(lián)合上下文模型中的所指派上下文(5)相關(guān)聯(lián)的第一經(jīng)編碼系數(shù)的值的概率估計,且基于第一系數(shù)的實際經(jīng)解碼值來更新與聯(lián)合上下文模型中的所指派上下文(5)相關(guān)聯(lián)的概率估計。與大小為16x16的第二 TU相關(guān)聯(lián)的第二經(jīng)編碼系數(shù)可被指派聯(lián)合上下文模型中與同第一 TU內(nèi)的所保持系數(shù)塊相關(guān)聯(lián)的第一經(jīng)編碼系數(shù)相同的上下文(5)。上下文建模單元104接著確定對與聯(lián)合上下文模型中的所述相同所指派上下文(5)相關(guān)聯(lián)的第二經(jīng)編碼系數(shù)的值的概率估計,且基于第二系數(shù)的實際經(jīng)解碼值來更新與聯(lián)合上下文模型中的相同所指派上下文(5)相關(guān)聯(lián)的概率估計。在第二實例中,聯(lián)合上下文模型存儲裝置106可存儲由具有第一大小的TU與具有第二大小的TU共享的聯(lián)合上下文模型。舉例來說,聯(lián)合上下文模型存儲裝置106可存儲由具有大小32x32和16x16的TU共享的聯(lián)合上下文模型。與大小為32x32的第一 TU相關(guān)聯(lián)的第一經(jīng)編碼系數(shù)可被指派由大小32x32的TU與大小16x16的TU共享的聯(lián)合上下文模型中的上下文(5)。上下文建模單元104接著確定對與聯(lián)合上下文模型中的所指派上下文(5)相關(guān)聯(lián)的第一經(jīng)編碼系數(shù)的值的概率估計,且基于第一系數(shù)的實際經(jīng)解碼值來更新與聯(lián)合上下文模型中的所指派上下文(5)相關(guān)聯(lián)的概率估計。與大小為16x16的第二 TU相關(guān)聯(lián)的第二經(jīng)編碼系數(shù)可被指派聯(lián)合上下文模型中與同第一 TU相關(guān)聯(lián)的第一經(jīng)編碼系數(shù)相同的上下文(5)。上下文建模單元104接著確定對與聯(lián)合上下文模型中的所述相同所指派上下文(5)相關(guān)聯(lián)的第二經(jīng)編碼系數(shù)的值的概率估計,且基于第二系數(shù)的實際經(jīng)解碼值來更新與聯(lián)合上下文模型中的所述相同所指派上下文(5)相關(guān)聯(lián)的概率估計。圖7是說明使用在具有第一大小的第一變換單元與具有第二大小的第二變換單元之間共享的聯(lián)合上下文模型來對視頻系數(shù)進(jìn)行熵編碼和解碼的實例操作的流程圖。參考圖2的視頻編碼器20內(nèi)的圖5的熵編碼單元56以及圖3的視頻解碼器30內(nèi)的圖6的熵解碼單元80來描述所說明的操作,但其它裝置可實施類似技術(shù)。在所說明的操作中,視頻編碼器20內(nèi)的熵編碼單元56以及視頻解碼器30內(nèi)的熵編碼單元80可維持由具有第一大小的TU與具有第二大小的TU共享的聯(lián)合上下文模型。在此情況下,包含在具有第一大小(例如32x32)的第一 TU中的系數(shù)可具有與包含在第二大小(例如16x16)的第二 TU中的系數(shù)類似的概率統(tǒng)計,即使在不使第一 TU內(nèi)的高頻率系數(shù)歸零的情況下也是如此。這在高頻率系數(shù)表示殘余視頻數(shù)據(jù)很少以致對用于熵譯碼的相鄰系數(shù)的概率統(tǒng)計的影響是可忽略的時可為可能的。在一種情況下,視頻編碼器20可使用變換單元52來將殘余視頻數(shù)據(jù)變換為具有第一大小的TU內(nèi)的變換系數(shù)(120)。在另一情況下,視頻編碼器20可使用變換單元52來將殘余視頻數(shù)據(jù)變換為具有第二大小的TU內(nèi)的變換系數(shù)(121)。不管TU是具有第一大小還是第二大小,本發(fā)明的技術(shù)均使熵編碼單元56能夠根據(jù)同一聯(lián)合上下文模型對TU內(nèi)的系數(shù)進(jìn)行熵編碼。因此,所述技術(shù)減少將上下文和概率存儲在視頻編碼器20上所必需的存儲器的量,且降低維持視頻編碼器20上的上下文模型的計算成本。熵編碼單元56內(nèi)的上下文建模單元94根據(jù)由具有第一大小和第二大小兩者的TU共享的聯(lián)合上下文模型為TU內(nèi)的每一系數(shù)選擇上下文(122)。更具體地說,上下文建模單元94根據(jù)聯(lián)合上下文模型基于TU的先前經(jīng)編碼相鄰系數(shù)的值將上下文指派給TU的給定系數(shù)。上下文建模單元94接著可確定對與聯(lián)合上下文模型存儲裝置98內(nèi)的聯(lián)合上下文模型中的所指派上下文相關(guān)聯(lián)的系數(shù)的值(例如O或I)的概率估計。算術(shù)編碼單元96接下來基于為所述系數(shù)選定的上下文對所述系數(shù)進(jìn)行算術(shù)編碼(124)。在編碼之后,算術(shù)編碼單元96將系數(shù)的實際經(jīng)編碼值反饋到上下文建模單元94。上下文模型單元94可接著基于具有第一大小或第二大小的TU內(nèi)的系數(shù)的實際經(jīng)編碼值來更新聯(lián)合上下文模型的概率估計(126)。視頻編碼器20將表示與具有第一大小或第二大小的TU相關(guān)聯(lián)的經(jīng)編碼系數(shù)的位流發(fā)射到視頻解碼器30 (128)。視頻解碼器30可接收表示與具有第一大小或第二大小的TU相關(guān)聯(lián)的經(jīng)編碼系數(shù)的位流(130)。不管TU是具有第一大小還是第二大小,本發(fā)明的技術(shù)均使熵解碼單元80能夠基于同一聯(lián)合上下文模型對與TU相關(guān)聯(lián)的系數(shù)進(jìn)行熵解碼。因此,所述技術(shù)可減少將上下文和概率存儲在視頻解碼器30上所必需的存儲器的量,且降低維持視頻解碼器30上的上下文模型的計算成本。熵解碼單元80內(nèi)的上下文建模單元104根據(jù)由具有第一大小和第二大小兩者的TU共享的聯(lián)合上下文模型為與TU相關(guān)聯(lián)的每一經(jīng)編碼系數(shù)選擇上下文(132)。更具體地說,上下文建模單元104可根據(jù)聯(lián)合上下文模型基于TU的先前經(jīng)解碼相鄰系數(shù)的值將上下文指派給與TU相關(guān)聯(lián)的后續(xù)經(jīng)編碼系數(shù)。上下文建模單元104接著可確定對與聯(lián)合上下文模型存儲裝置106內(nèi)的聯(lián)合上下文模型中的所指派上下文相關(guān)聯(lián)的經(jīng)編碼系數(shù)的值(例如O或I)的概率估計。上下文建模單元104將與為經(jīng)編碼系數(shù)選定的上下文相關(guān)聯(lián)的所確定概率估計反饋到算術(shù)編碼單元102。算術(shù)編碼單元102接下來基于選定上下文將經(jīng)編碼系數(shù)算術(shù)解碼為具有第一大小或第二大小的TU(134)。在解碼之后,算術(shù)解碼單元102將系數(shù)的實際經(jīng)解碼值饋送到上下文建模單元104。上下文模型單元104可接著基于具有第一大小或第二大小的TU內(nèi)的系數(shù)的實際經(jīng)解碼值來更新聯(lián)合上下文模型的概率估計(136)。在一種情況下,視頻解碼器30可使用逆變換單元88來將具有第一大小的TU內(nèi)的系數(shù)逆變換為殘余視頻數(shù)據(jù)(138)。在另一情況下,視頻解碼器30可使用逆變換單元88來將具有第二大小的TU內(nèi)的系數(shù)逆變換為殘余視頻數(shù)據(jù)(139)。圖8是說明使用在具有第一大小的第一變換單元與具有第二大小的第二變換單元之間共享的聯(lián)合上下文模型來對視頻系數(shù)進(jìn)行熵編碼和解碼的實例操作的流程圖,所述具有第一大小的第一變換單元具有經(jīng)歸零以產(chǎn)生具有第二大小的所保持系數(shù)塊的系數(shù)。參考圖2的視頻編碼器20內(nèi)的圖4的熵編碼單元56以及圖3的視頻解碼器30內(nèi)的圖5的熵解碼單元80來描述所說明的操作,但其它裝置可實施類似技術(shù)。在所說明的操作中,視頻編碼器20內(nèi)的熵編碼單元56以及視頻解碼器30內(nèi)的熵編碼單元80可維持由具有第一大小的TU與具有第二大小的TU共享的聯(lián)合上下文模型,所述具有第一大小的TU具有經(jīng)歸零以產(chǎn)生具有第二大小的所保持系數(shù)塊的系數(shù)。在此情況下,包含在具有第一大小(例如32x32)的第一 TU內(nèi)的具有第二大小(例如16x16)的所保持系數(shù)塊中的系數(shù)可具有與包含在具有第二大小(例如16x16)的第二 TU中的系數(shù)類似的概率統(tǒng)計。在一種情況下,視頻編碼器20可使用變換單元52來將殘余視頻數(shù)據(jù)變換為具有第一大小的TU內(nèi)的變換系數(shù)(140)。視頻編碼器20在變換之后使包含在第一 TU中的系數(shù)的子集歸零,以產(chǎn)生第一 TU內(nèi)具有第二大小的所保持系數(shù)塊(141)。經(jīng)歸零變換系數(shù)的所述子集通常包含相對于所保持系數(shù)塊內(nèi)的系數(shù)的高頻率變換系數(shù)。高頻率變換系數(shù)可含有很少的殘余視頻數(shù)據(jù),以致將值設(shè)定為等于零對經(jīng)解碼視頻質(zhì)量具有可忽略的影響。在另一情況下,視頻編碼器20可使用變換單元52來將殘余視頻數(shù)據(jù)變換為具有第二大小的TU內(nèi)的變換系數(shù)(142)。不管TU是原始具有第一大小還是第二大小,本發(fā)明的技術(shù)均使熵編碼單元56能夠根據(jù)同一聯(lián)合上下文模型對TU內(nèi)的所保持系數(shù)進(jìn)行熵編碼。因此,所述技術(shù)減少將上下文和概率存儲在視頻編碼器20上所必需的存儲器的量,且降低維持視頻編碼器20上的上下文模型的計算成本。熵編碼單元56內(nèi)的上下文建模單元94根據(jù)由具有歸零到第二大小的系數(shù)的具有第一大小的TU與具有第二大小的TU共享的聯(lián)合上下文模型為TU內(nèi)的每一所保持系數(shù)選擇上下文(144)。更具體地說,上下文建模單元94根據(jù)聯(lián)合上下文模型基于所保持系數(shù)塊的先前經(jīng)編碼相鄰系數(shù)的值將上下文指派給第一 TU的所保持系數(shù)塊內(nèi)的給定系數(shù)。上下文建模單元94接著可確定對與聯(lián)合上下文模型存儲裝置98內(nèi)的聯(lián)合上下文模型中的所指派上下文相關(guān)聯(lián)的系數(shù)的值(例如O或I)的概率估計。算術(shù)編碼單元96接下來基于為所述系數(shù)選定的上下文對所述系數(shù)進(jìn)行算術(shù)編碼(146)。在編碼之后,算術(shù)編碼單元96將系數(shù)的實際經(jīng)編碼值反饋到上下文建模單元94。上下文模型單元94可接著基于第一大小的TU內(nèi)第二大小的所保持系數(shù)塊或原始為第二大小的TU中的系數(shù)的實際經(jīng)編碼值來更新聯(lián)合上下文模型的概率估計(148)。視頻編碼器20將表示與第一大小的TU內(nèi)的所保持系數(shù)塊或第二大小的TU相關(guān)聯(lián)經(jīng)編碼系數(shù)的位流發(fā)射到視頻解碼器30(150)。視頻解碼器30可接收表示與第一大小的TU內(nèi)第二大小的所保持系數(shù)塊或原始為第二大小的TU相關(guān)聯(lián)的經(jīng)編碼系數(shù)的位流(152)。不管TU是具有第一大小還是第二大小,本發(fā)明的技術(shù)均使熵解碼單元80能夠基于同一聯(lián)合上下文模型對與TU相關(guān)聯(lián)的系數(shù)進(jìn)行熵解碼。因此,所述技術(shù)減少將上下文和概率存儲在視頻解碼器30上所必需的存儲器的量,且降低維持視頻解碼器30上的上下文模型的計算成本。熵解碼單元80內(nèi)的上下文建模單元104根據(jù)由具有第一大小的TU與具有第二大小的TU共享的聯(lián)合上下文模型為與TU相關(guān)聯(lián)的每一系數(shù)選擇上下文,所述具有第一大小的TU具有經(jīng)歸零以產(chǎn)生具有第二大小的所保持系數(shù)塊的系數(shù)(154)。更具體地說,上下文建模單元104可根據(jù)聯(lián)合上下文模型基于所保持系數(shù)塊的先前經(jīng)解碼相鄰系數(shù)的值將上下文指派給與第一 TU的所保持系數(shù)塊相關(guān)聯(lián)的后續(xù)經(jīng)編碼系數(shù)。上下文建模單元104接著可確定對與聯(lián)合上下文模型存儲裝置106內(nèi)的聯(lián)合上下文模型中的所指派上下文相關(guān)聯(lián)的經(jīng)編碼系數(shù)的值(例如O或I)的概率估計。上下文建模單元104將與為經(jīng)編碼系數(shù)選定的上下文相關(guān)聯(lián)的所確定概率反饋到算術(shù)編碼單元102。算術(shù)編碼單元102接下來基于選定上下文將經(jīng)編碼系數(shù)算術(shù)解碼為第一大小的TU內(nèi)的所保持系數(shù)塊或第二大小的TU(156)。在解碼之后,算術(shù)解碼單元102將系數(shù)的實際經(jīng)解碼值饋送到上下文建模單元104。上下文模型單元104可接著基于第一大小的TU內(nèi)第二大小的所保持系數(shù)塊或原始為第二大小的TU內(nèi)的系數(shù)的實際經(jīng)解碼值來更新聯(lián)合上下文模型的概率估計(158)。在一種情況下,視頻解碼器30可使用逆變換單元88來將具有第一大小的TU內(nèi)具有第二大小的所保持系數(shù)塊的系數(shù)逆變換為殘余視頻數(shù)據(jù)(160)。以此方式,逆變換單元88可通過將殘余數(shù)據(jù)包含于具有第二大小的所保持系數(shù)塊中且添加若干零以表示TU中的剩余殘余數(shù)據(jù)來產(chǎn)生具有第一大小的TU。在另一情況下,視頻解碼器30可使用逆變換單元88來將具有第二大小的TU內(nèi)的系數(shù)逆變換為殘余視頻數(shù)據(jù)(162)。在一個或一個以上實例中,所描述的功能可以硬件、軟件、固件或其任何組合來實施。如果以軟件來實施,那么所述功能可作為一個或一個以上指令或代碼存儲在計算機可讀媒體上或經(jīng)由計算機可讀媒體而傳輸,且由基于硬件的處理單元執(zhí)行。計算機可讀媒體可包含計算機可讀存儲媒體,其對應(yīng)于例如數(shù)據(jù)存儲媒體等有形媒體,或包含例如根據(jù)通信協(xié)議促進(jìn)計算機程序從一處到另一處的傳送的任何媒體的通信媒體。以此方式,計算機可讀媒體通常可對應(yīng)于(I)非暫時性的有形計算機可讀存儲媒體,或(2)例如信號或載波的通信媒體。數(shù)據(jù)存儲媒體可為可由一個或一個以上計算機或一個或一個以上處理器存取以檢索指令、代碼和/或數(shù)據(jù)結(jié)構(gòu)以供實施本發(fā)明中所描述的技術(shù)的任何可用媒體。計算機程序產(chǎn)品可包含計算機可讀媒體。作為實例(而非限制),所述計算機可讀存儲媒體可包括RAM、ROM、EEPROM、CD-R0M或其它光盤存儲裝置、磁盤存儲裝置,或其它磁性存儲裝置、快閃存儲器,或可用于存儲呈指令或數(shù)據(jù)結(jié)構(gòu)的形式的所要程序代碼且可由計算機存取的任何其它媒體。同樣,恰當(dāng)?shù)貙⑷魏芜B接稱作計算機可讀媒體。舉例來說,如果使用同軸電纜、光纖纜線、雙絞線、數(shù)字訂戶線(DSL)或例如紅外線、無線電及微波等無線技術(shù)從網(wǎng)站、服務(wù)器或其它遠(yuǎn)程源傳輸指令,那么同軸電纜、光纖纜線、雙絞線、DSL或例如紅外線、無線電及微波等無線技術(shù)包含于媒體的定義中。然而,應(yīng)理解,計算機可讀存儲媒體和數(shù)據(jù)存儲媒體不包含連接、載波、信號或其它瞬態(tài)媒體,而是針對非瞬態(tài)有形存儲媒體。如本文中所使用,磁盤及光盤包含壓縮光盤(CD)、激光光盤、光學(xué)光盤、數(shù)字多功能光盤(DVD)、軟磁盤及藍(lán)光光盤,其中磁盤通常磁性地再生數(shù)據(jù),而光盤使用激光光學(xué)地再生數(shù)據(jù)。以上各項的組合也應(yīng)包含在計算機可讀媒體的范圍內(nèi)。指令可由一個或一個以上處理器執(zhí)行,例如一個或一個以上數(shù)字信號處理器(DSP)、通用微處理器、專用集成電路(ASIC)、現(xiàn)場可編程邏輯陣列(FPGA),或其它等效集成或離散邏輯電路。因此,如本文中所使用的術(shù)語“處理器”可指上述結(jié)構(gòu)或適合于實施本文中所描述的技術(shù)的任一其它結(jié)構(gòu)中的任一者。另外,在一些方面中,本文所述的功能性可提供于經(jīng)配置以用于編碼和解碼的專用硬件和/或軟件模塊內(nèi),或并入在組合式編解碼器中。并且,可將所述技術(shù)完全實施于一個或一個以上電路或邏輯元件中。本發(fā)明的技術(shù)可在各種各樣的裝置或設(shè)備中實施,包含無線手持機、集成電路(IC)或一組IC(例如,芯片組)。本發(fā)明中描述各種組件、模塊或單元,以強調(diào)經(jīng)配置以執(zhí)行所揭示技術(shù)的裝置的功能方面,但不一定要求由不同硬件單元來實現(xiàn)。相反,如上文所述,各種單元可組合在編解碼器硬件單元中,或由互操作硬件單元(包含如上文所述的一個或一個以上處理器)的集合結(jié)合合適的軟件和/或固件來提供。
權(quán)利要求
1.一種譯碼視頻數(shù)據(jù)的方法,其包括: 維持由具有第一大小的變換單元與具有第二大小的變換單元共享的聯(lián)合上下文模型,其中所述第一大小與所述第二大小是不同的; 根據(jù)所述聯(lián)合上下文模型為與具有所述第一大小和所述第二大小中的一者的所述變換單元相關(guān)聯(lián)的系數(shù)選擇上下文;以及 基于所述選定上下文根據(jù)譯碼過程對所述變換單元的所述系數(shù)進(jìn)行熵譯碼。
2.根據(jù)權(quán)利要求1所述的方法,其中所述聯(lián)合上下文模型包括重要性圖的所述聯(lián)合上下文模型,所述方法進(jìn)一步包括: 根據(jù)所述聯(lián)合上下文模型為與具有所述第一大小和所述第二大小中的一者的所述變換單元相關(guān)聯(lián)的所述重要性圖的分量選擇上下文;以及 基于所述選定上下文對與所述變換單元相關(guān)聯(lián)的所述重要性圖的所述分量進(jìn)行熵譯碼。
3.根據(jù)權(quán)利要求1所述的方法,其中根據(jù)所述聯(lián)合上下文模型為所述系數(shù)中的每一者選擇上下文包括: 基于所述變換單元的先前經(jīng)譯碼相鄰系數(shù)的值將所述聯(lián)合上下文模型中的上下文指派給所述系數(shù);以及 確定用于與所述聯(lián)合上下文模型中的所述所指派上下文相關(guān)聯(lián)的所述系數(shù)的所述譯碼過程。
4.根據(jù)權(quán)利要求3所述的方法,其中確定譯碼過程包括確定對所述系數(shù)的值的概率估計,所述方法進(jìn)一步包括基于具有所述第一大小的所述變換單元和具有所述第二大小的所述變換單元的系數(shù)的實際經(jīng)譯碼值來更新與所述聯(lián)合上下文模型中的所述所指派上下文相關(guān)聯(lián)的所述概率估計。
5.根據(jù)權(quán)利要求1所述的方法,其中所述方法包括解碼視頻數(shù)據(jù)的方法,所述方法進(jìn)一步包括: 接收表示與具有所述第一大小和所述第二大小中的所述一者的所述變換單元相關(guān)聯(lián)的經(jīng)編碼系數(shù)的位流; 根據(jù)所述聯(lián)合上下文模型為所述經(jīng)編碼系數(shù)選擇上下文;以及 基于所述選定上下文將所述經(jīng)編碼系數(shù)熵解碼為所述變換單元。
6.根據(jù)權(quán)利要求5所述的方法,其進(jìn)一步包括將具有第一大小和第二大小中的所述一者的所述變換單元的所述系數(shù)逆變換為殘余視頻數(shù)據(jù)。
7.根據(jù)權(quán)利要求1所述的方法,其中所述方法包括編碼視頻數(shù)據(jù)的方法,所述方法進(jìn)一步包括: 將殘余視頻數(shù)據(jù)變換為具有所述第一大小和所述第二大小中的所述一者的所述變換單元內(nèi)的系數(shù); 根據(jù)所述聯(lián)合上下文模型為所述變換單元的所述系數(shù)選擇上下文;以及 基于所述選定上下文對所述變 換單元的所述系數(shù)進(jìn)行熵編碼。
8.根據(jù)權(quán)利要求1所述的方法,其中所述第一大小的變換單元包括32x32變換單元,且其中所述第二大小的變換單元包括16x16變換單元。
9.根據(jù)權(quán)利要求1所述的方法,其中根據(jù)所述聯(lián)合上下文模型選擇上下文包括:基于具有所述第一大小的第一變換單元的先前經(jīng)譯碼相鄰系數(shù)的值將所述聯(lián)合上下文模型中的上下文指派給所述第一變換單元的第一系數(shù); 確定對與所述聯(lián)合上下文模型中的所述所指派上下文相關(guān)聯(lián)的所述第一系數(shù)的值的概率估計; 基于所述第一系數(shù)的實際經(jīng)譯碼值來更新與所述聯(lián)合上下文模型中的所述所指派上下文相關(guān)聯(lián)的所述概率估計; 基于具有所述第二大小的第二變換單元的先前經(jīng)譯碼相鄰系數(shù)的值將所述聯(lián)合上下文模型中的所述同一上下文指派給所述第二變換單元的第二系數(shù); 確定對與所述聯(lián)合上下文模型中的所述同一所指派上下文相關(guān)聯(lián)的所述第二系數(shù)的值的概率估計;以及 基于所述第二系數(shù)的實際經(jīng)譯碼值來更新與所述聯(lián)合上下文模型中的所述同一所指派上下文相關(guān)聯(lián)的所述概率估計。
10.一種視頻譯碼裝置,其包括: 存儲器,其存儲由具有第一大小的變換單元與具有第二大小的變換單元共享的聯(lián)合上下文模型,其中所述第一大小與所述第二大小是不同的;以及 處理器,其經(jīng)配置以維持所述聯(lián)合上下文模型,根據(jù)所述聯(lián)合上下文模型為與具有所述第一大小和所述第二大小中的一者的所述變換單元相關(guān)聯(lián)的系數(shù)選擇上下文,且基于所述選定上下文根據(jù)譯碼過程來對所述變換單元的所述系數(shù)進(jìn)行熵譯碼。
11.根據(jù)權(quán)利要求10所述的視頻譯碼裝置,其中所述聯(lián)合上下文模型包括重要性圖的所述聯(lián)合上下文模型,其中所述處理器經(jīng)配置以: 根據(jù)所述聯(lián)合上下文模型為與具有所述第一大小和所述第二大小中的一者的所述變換單元相關(guān)聯(lián)的所述重要性圖的分量選擇上下文;以及 基于所述選定上下文對與所述變換單元相關(guān)聯(lián)的所述重要性圖的所述分量進(jìn)行熵譯碼。
12.根據(jù)權(quán)利要求10所述的視頻譯碼裝置,其中所述處理器經(jīng)配置以: 基于所述變換單元的先前經(jīng)譯碼相鄰系數(shù)的值將所述聯(lián)合上下文模型中的上下文指派給所述系數(shù);以及 確定用于與所述聯(lián)合上下文模型中的所述所指派上下文相關(guān)聯(lián)的所述系數(shù)的所述譯碼過程。
13.根據(jù)權(quán)利要求12所述的視頻譯碼裝置,其中所述處理器經(jīng)配置以確定對所述系數(shù)的值的概率估計,且基于具有所述第一大小的所述變換單元和具有所述第二大小的所述變換單元的系數(shù)的實際經(jīng)譯碼值來更新與所述聯(lián)合上下文模型中的所述所指派上下文相關(guān)聯(lián)的所述概率估計。
14.根據(jù)權(quán)利要求10所述的視頻譯碼裝置,其中所述視頻譯碼裝置包括視頻解碼裝置,其中所述處理器經(jīng)配置以: 接收表示與具有所述第一大小和所述第二大小中的所述一者的所述變換單元相關(guān)聯(lián)的經(jīng)編碼系數(shù)的位流; 根據(jù)所述聯(lián)合上下文模型為所述經(jīng)編碼系數(shù)選擇上下文;以及 基于所述選定上下文將所述經(jīng)編碼系數(shù)熵解碼為所述變換單元。
15.根據(jù)權(quán)利要求14所述的視頻譯碼裝置,其中所述處理器經(jīng)配置以將具有第一大小和第二大小中的所述一者的所述變換單元的所述系數(shù)逆變換為殘余視頻數(shù)據(jù)。
16.根據(jù)權(quán)利要求10所述的視頻譯碼裝置,其中所述視頻譯碼裝置包括視頻編碼裝置,其中所述處理器經(jīng)配置以: 將殘余視頻數(shù)據(jù)變換為具有所述第一大小和所述第二大小中的所述一者的所述變換單元內(nèi)的系數(shù); 根據(jù)所述聯(lián)合上下文模型為所述變換單元的所述系數(shù)選擇上下文;以及 基于所述選定上下文對所述變換單元的所述系數(shù)進(jìn)行熵編碼。
17.根據(jù)權(quán)利要求10所述的視頻譯碼裝置,其中所述第一大小的變換單元包括32x32變換單元,且其中所述第二大小的變換單元包括16x16變換單元。
18.根據(jù)權(quán)利要求10所述的視頻譯碼裝置,其中所述處理器經(jīng)配置以: 基于具有所述第一大小的第一變換單元的先前經(jīng)譯碼相鄰系數(shù)的值將所述聯(lián)合上下文模型中的上下文指派給所述第一變換單元的第一系數(shù); 確定對與所述聯(lián)合上下文模型中的所述所指派上下文相關(guān)聯(lián)的所述第一系數(shù)的值的概率估計; 基于所述第一系數(shù)的實際經(jīng)譯碼值來更新與所述聯(lián)合上下文模型中的所述所指派上下文相關(guān)聯(lián)的所述概率估計; 基于具有所述第二大小的第二變換單元的先前經(jīng)譯碼相鄰系數(shù)的值將所述聯(lián)合上下文模型中的所述同一 上下文指派給所述第二變換單元的第二系數(shù); 確定對與所述聯(lián)合上下文模型中的所述同一所指派上下文相關(guān)聯(lián)的所述第二系數(shù)的值的概率估計;以及 基于所述第二系數(shù)的實際經(jīng)譯碼值來更新與所述聯(lián)合上下文模型中的所述同一所指派上下文相關(guān)聯(lián)的所述概率估計。
19.一種視頻譯碼裝置,其包括: 用于維持由具有第一大小的變換單元與具有第二大小的變換單元共享的聯(lián)合上下文模型的裝置,其中所述第一大小與所述第二大小是不同的; 用于根據(jù)所述聯(lián)合上下文模型為與具有所述第一大小和所述第二大小中的一者的所述變換單元相關(guān)聯(lián)的系數(shù)選擇上下文的裝置;以及 用于基于所述選定上下文根據(jù)譯碼過程對所述變換單元的所述系數(shù)進(jìn)行熵譯碼的裝置。
20.根據(jù)權(quán)利要求19所述的視頻譯碼裝置,其中所述聯(lián)合上下文模型包括重要性圖的所述聯(lián)合上下文模型,所述視頻譯碼裝置進(jìn)一步包括: 用于根據(jù)所述聯(lián)合上下文模型為與具有所述第一大小和所述第二大小中的一者的所述變換單元相關(guān)聯(lián)的所述重要性圖的分量選擇上下文的裝置;以及 用于基于所述選定上下文對與所述變換單元相關(guān)聯(lián)的所述重要性圖的所述分量進(jìn)行熵譯碼的裝置。
21.根據(jù)權(quán)利要求19所述的視頻譯碼裝置,其進(jìn)一步包括: 用于基于所述變換單元的先前經(jīng)譯碼相鄰系數(shù)的值將所述聯(lián)合上下文模型中的上下文指派給所述系數(shù)的裝置;以及用于確定用于與所述聯(lián)合上下文模型中的所述所指派上下文相關(guān)聯(lián)的所述系數(shù)的所述譯碼過程的裝置。
22.根據(jù)權(quán)利要求21所述的視頻譯碼裝置,其中所述用于確定譯碼過程的裝置包括用于確定對所述系數(shù)的值的概率估計的裝置,以及用于基于具有所述第一大小的所述變換單元和具有所述第二大小的所述變換單元的系數(shù)的實際經(jīng)譯碼值來更新與所述聯(lián)合上下文模型中的所述所指派上下文相關(guān)聯(lián)的所述概率估計的裝置。
23.根據(jù)權(quán)利要求19所述的視頻譯碼裝置,其中所述視頻譯碼裝置包括視頻解碼裝置,所述視頻譯碼裝置進(jìn)一步包括: 用于接收表示與具有所述第一大小和所述第二大小中的所述一者的所述變換單元相關(guān)聯(lián)的經(jīng)編碼系數(shù)的位流的裝置; 用于根據(jù)所述聯(lián)合上下文模型為所述經(jīng)編碼系數(shù)選擇上下文的裝置;以及 用于基于所述選定上下文將所述經(jīng)編碼系數(shù)熵解碼為所述變換單元的裝置。
24.根據(jù)權(quán)利要求23所述的視頻譯碼裝置,其進(jìn)一步包括用于將具有第一大小和第二大小中的所述一者的所述變換單元的所述系數(shù)逆變換為殘余視頻數(shù)據(jù)的裝置。
25.根據(jù)權(quán)利要求19所述的視頻譯碼裝置,其中所述視頻譯碼裝置包括視頻編碼裝置,所述視頻譯碼裝置進(jìn)一步包括: 用于將殘余視頻數(shù)據(jù)變換為具有所述第一大小和所述第二大小中的所述一者的所述變換單元內(nèi)的系數(shù)的裝置; 用于根據(jù)所述聯(lián)合上下文模型為所述變換單元的所述系數(shù)選擇上下文的裝置;以及 用于基于所述選定上下文對所述變換單元的所述系數(shù)進(jìn)行熵編碼的裝置。
26.根據(jù)權(quán)利要求19所述的視頻譯碼裝置,其中所述第一大小的變換單元包括32x32變換單元,且其中所述第二大小的變換單元包括16x16變換單元。
27.一種計算機可讀媒體,其包括用于譯碼視頻數(shù)據(jù)的指令,所述指令在被執(zhí)行時致使處理器: 維持由具有第一大小的變換單元與具有第二大小的變換單元共享的聯(lián)合上下文模型,其中所述第一大小與所述第二大小是不同的; 根據(jù)所述聯(lián)合上下文模型為與具有所述第一大小和所述第二大小中的一者的所述變換單元相關(guān)聯(lián)的系數(shù)選擇上下文;以及 基于所述選定上下文根據(jù)譯碼過程對所述變換單元的所述系數(shù)進(jìn)行熵譯碼。
28.根據(jù)權(quán)利要求27所述的計算機可讀媒體,其中所述聯(lián)合上下文模型包括重要性圖的所述聯(lián)合上下文模型,所述計算機可讀媒體進(jìn)一步包括致使所述處理器進(jìn)行以下操作的指令: 根據(jù)所述聯(lián)合上下文模型為與具有所述第一大小和所述第二大小中的一者的所述變換單元相關(guān)聯(lián)的所述重要性圖的分量選擇上下文;以及 基于所述選定上下文對與所述變換單元相關(guān)聯(lián)的所述重要性圖的所述分量進(jìn)行熵譯碼。
29.根據(jù)權(quán)利要求27所述的計算機可讀媒體,其中所述指令致使所述處理器: 基于所述變換單元的先前經(jīng)譯碼相鄰系數(shù)的值將所述聯(lián)合上下文模型中的上下文指派給所述系數(shù);以及確定用于與所述聯(lián)合上下文模型中的所述所指派上下文相關(guān)聯(lián)的所述系數(shù)的所述譯碼過程。
30.根據(jù)權(quán)利要求29所述的計算機可讀媒體,其中所述指令致使所述處理器: 確定對所述系數(shù)的值的概率估計;以及 基于具有所述第一大小的所述變換單元和具有所述第二大小的所述變換單元的系數(shù)的實際經(jīng)譯碼值來更新與所述聯(lián)合上下文模型中的所述所指派上下文相關(guān)聯(lián)的所述概率估計。
31.根據(jù)權(quán)利要求27所述的計算機可讀媒體,其中所述指令包括用于解碼視頻數(shù)據(jù)的指令,所述計算機可讀媒體進(jìn)一步包括致使所述處理器進(jìn)行以下操作的指令: 接收表示與具有所述第一大小和所述第二大小中的所述一者的所述變換單元相關(guān)聯(lián)的經(jīng)編碼系數(shù)的位流; 根據(jù)所述聯(lián)合上下文模型為所述經(jīng)編碼系數(shù)選擇上下文;以及 基于所述選定上下文將所述經(jīng)編碼系數(shù)熵解碼為所述變換單元。
32.根據(jù)權(quán)利要求31所述的計算機可讀媒體,其進(jìn)一步包括致使所述處理器將具有第一大小和第二大小中的所述一者的所述變換單元的所述系數(shù)逆變換為殘余視頻數(shù)據(jù)的指令。
33.根據(jù)權(quán)利要求27所述的計算機可讀媒體,其中所述指令包括用于編碼視頻數(shù)據(jù)的指令,所述計算機可讀媒體進(jìn)一步包括致使所述處理器進(jìn)行以下操作的指令: 將殘余視頻數(shù)據(jù)變換為具有所 述第一大小和所述第二大小中的所述一者的所述變換單元內(nèi)的系數(shù); 根據(jù)所述聯(lián)合上下文模型為所述變換單元的所述系數(shù)選擇上下文;以及 基于所述選定上下文對所述變換單元的所述系數(shù)進(jìn)行熵編碼。
34.根據(jù)權(quán)利要求27所述的計算機可讀媒體,其中所述第一大小的變換單元包括32x32變換單元,且其中所述第二大小的變換單元包括16x16變換單元。
全文摘要
本發(fā)明描述用于使用在具有不同大小的變換單元之間共享的聯(lián)合上下文模型來執(zhí)行視頻系數(shù)的熵編碼和解碼的技術(shù)。舉例來說,所述聯(lián)合上下文模型可在具有第一大小32x32的變換單元與具有第二大小16x16的變換單元之間共享。使用在具有不同大小的變換單元之間共享的聯(lián)合上下文模型執(zhí)行熵譯碼可減少存儲上下文和概率所必需的存儲器的量,且降低維持上下文模型的計算成本。在一個實例中,所述聯(lián)合上下文模型可在具有第一大小的變換單元與具有第二大小的變換單元之間共享,所述具有第一大小的變換單元具有經(jīng)歸零以產(chǎn)生具有第二大小的所保持系數(shù)塊的系數(shù)。在另一實例中,所述聯(lián)合上下文模型可在具有所述第一大小的變換單元與具有所述第二大小的變換單元之間共享。
文檔編號H04N7/50GK103181169SQ201180050442
公開日2013年6月26日 申請日期2011年9月30日 優(yōu)先權(quán)日2010年10月1日
發(fā)明者霍埃爾·索賴羅哈斯, 拉詹·L·喬希, 馬爾塔·卡切維奇 申請人:高通股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1