專利名稱:用于上下文自適應可變長度譯碼(cavlc)的速率-失真量化的制作方法
技術領域:
本發(fā)明涉及數(shù)字視頻譯碼,且更特定來說涉及用于視頻譯碼的量化技術。
背景技術:
可將數(shù)字視頻能力并入到較廣范圍的裝置中,包括數(shù)字電視、數(shù)字直播系統(tǒng)、 無線廣播系統(tǒng)、個人數(shù)字助理(PDA)、膝上型或臺式計算機、數(shù)碼相機、數(shù)字記錄裝 置、視頻游戲裝置、視頻游戲控制臺、蜂窩式或衛(wèi)星無線電電話等。數(shù)字視頻裝置實施 例如MPEG-2、MPEG-4或ITU-TH.264/MPEG-4、第10部分、高級視頻譯碼(AVC)等 視頻壓縮技術以較有效地發(fā)射和接收數(shù)字視頻信息。視頻壓縮技術執(zhí)行空間預測和時間 預測以減少或移除視頻序列中固有的冗余。幀內譯碼依賴于空間預測以減少或移除給定經譯碼單元內視頻塊之間的空間冗 余,給定經譯碼單元可包含視頻幀、視頻幀的片段、圖片的群組或視頻塊的另一所定義 單元。相比之下,幀間譯碼依賴于時間預測以減少或移除視頻序列的連續(xù)經譯碼單元的 視頻塊之間的時間冗余。對于幀內譯碼來說,視頻編碼器可執(zhí)行空間預測以基于相同經 譯碼單元內的其它數(shù)據(jù)來壓縮數(shù)據(jù)。對于幀間譯碼來說,視頻編碼器執(zhí)行運動估計和運 動補償以追蹤兩個或兩個以上相鄰經譯碼單元的對應視頻塊的移動。經譯碼視頻塊可由可用以創(chuàng)建或識別預測塊和指示正經譯碼的塊與預測塊之間 的差異的數(shù)據(jù)的殘余塊的預測信息來表示。在幀間譯碼的情形下,一個或一個以上運動 向量用以識別數(shù)據(jù)的預測塊,而在幀內譯碼的情形下,預測模式可用以產生預測塊。幀 內譯碼和幀間譯碼兩者可定義若干不同預測模式,其可定義不同塊大小和/或譯碼中使 用的預測技術。還可包括額外類型的語法元素作為經編碼視頻數(shù)據(jù)的一部分以便控制或 定義譯碼過程中使用的譯碼技術或參數(shù)。在基于塊的預測譯碼之后,視頻編碼器可應用變換、量化和熵譯碼過程以進一 步減少與殘余塊的通信相關聯(lián)的位速率。變換技術可包含離散余弦變換或概念上相似的 過程?;蛘撸墒褂米硬ㄗ儞Q、整數(shù)變換或其它類型的變換。在離散余弦變換(DCT) 過程中,作為一實例,變換過程將一組像素值轉換成變換系數(shù),所述變換系數(shù)可表示頻 域中像素值的能量。將量化應用于變換系數(shù),且量化通常涉及限制與任何給定變換系數(shù) 相關聯(lián)的位數(shù)目的過程。熵譯碼包含共同地壓縮經量化變換系數(shù)的序列的一個或一個以 上過程。上下文自適應可變長度譯碼(CAVLC)是當前在一些譯碼標準中支持的一 種類型的熵譯碼技術,例如國際電信聯(lián)盟標準化組(ITU-T)H.264/移動圖片專家組(MPEG) _4、第10部分高級視頻譯碼(AVC)(下文中為“H.264/MPEG-4第10部分AVC 標準”)。根據(jù)如H.264/MPEG-4、第10部分AVC標準中所定義的CAVLC,編碼器編
碼表示系數(shù)向量的多個語法元素。語法元素可包括系數(shù)向量中的系數(shù)的總數(shù)、系數(shù)向量 中尾隨一(trailing one)的數(shù)目、尾隨一中的每一者的正負號、除了尾隨一之外的非零系 數(shù)的量值(或層級)、所有行程(run)的總和(即,最后非零系數(shù)之前的行程的總數(shù)), 已經每一非零系數(shù)之前的零的行程長度。由于編碼器基于系數(shù)向量的特定特性而自適應 地選擇VLC譯碼表而用于編碼語法元素,所以CAVLC是自適應的。
發(fā)明內容
大體來說,本發(fā)明描述用于以可實現(xiàn)速率與失真的所要平衡的方式來量化視頻 塊的系數(shù)的技術。所描述的技術可分析與每一個別系數(shù)相關聯(lián)的多個量化層級以為個別 系數(shù)選擇導致最低譯碼成本的量化層級。由于CAVLC不獨立編碼每一系數(shù),所以所述技 術可基于為先前經量化系數(shù)選擇的量化層級和用于系數(shù)向量的隨后系數(shù)的所估計(或預 測)的量化層級而計算與個別系數(shù)相關聯(lián)的候選量化層級中的每一者的譯碼成本。系數(shù) 中的每一者的量化層級基于所計算的譯碼成本進行選擇以獲得最小化速率_失真模型的 一組經量化系數(shù)。在一個實例中,本發(fā)明提供在視頻譯碼過程中量化視頻塊的系數(shù)的至少一部分 的方法。所述方法包括為視頻塊的系數(shù)的部分中的每一者確定與相應系數(shù)相關聯(lián)的多個 候選量化層級的譯碼成本,以及基于譯碼成本為系數(shù)中的每一者選擇所述多個候選量化
層級中的一者以獲得一組經量化系數(shù)。在另一實例中,本發(fā)明提供用于在視頻譯碼過程中量化視頻塊的系數(shù)的至少一 部分的設備。所述設備包括量化單元,其為視頻塊的系數(shù)的部分中的每一者確定與相應 系數(shù)相關聯(lián)的多個候選量化層級的譯碼成本,且基于譯碼成本為系數(shù)中的每一者選擇所 述多個候選量化層級中的一者以獲得一組經量化系數(shù)。在另一實例中,提供用于在視頻譯碼過程中量化視頻塊的系數(shù)的至少一部分的 裝置。所述裝置包含用于為視頻塊的系數(shù)的部分中的每一者確定與相應系數(shù)相關聯(lián)的 多個候選量化層級的譯碼成本的裝置;以及用于基于譯碼成本為系數(shù)中的每一者選擇所 述多個候選量化層級中的一者以獲得一組經量化系數(shù)的裝置。本發(fā)明中所描述的技術可以硬件、軟件、固件或其任何組合來實施。如果以 軟件實施,那么軟件可執(zhí)行于一個或一個以上處理器(例如,微處理器、專用集成電路 (ASIC)、現(xiàn)場可編程門陣列(FPGA)或數(shù)字信號處理器(DSP))中。執(zhí)行所述技術的軟 件最初可存儲于計算機可讀媒體中且經載入并執(zhí)行于處理器中。因此,本發(fā)明還預期包含指令的計算機可讀媒體,所述指令在執(zhí)行時使裝置在 視頻譯碼過程中量化視頻塊的系數(shù)的至少一部分。所述指令使所述裝置為視頻塊的系 數(shù)的部分中的每一者確定與相應系數(shù)相關聯(lián)的多個候選量化層級的譯碼成本;且基于譯 碼成本為系數(shù)中的每一者選擇所述多個候選量化層級中的一者以獲得一組經量化系數(shù)。在附圖和以下描述中闡述本發(fā)明的一個或一個以上方面的細節(jié)。本發(fā)明中所描 述的技術的其它特征、目的和優(yōu)點將從所述描述和圖式以及從權利要求書而顯而易見。
圖1是說明可實施本發(fā)明的技術中的一者或一者以上的視頻編碼和解碼系統(tǒng)的 示范性框圖。圖2是說明符合本發(fā)明的視頻編碼器的實例的框圖。圖3是說明4X4視頻塊的Z字形(zig-zag)掃描的概念圖。圖4是說明符合本發(fā)明的量化網格(trellis)的框圖。圖5-8是說明符合本發(fā)明的技術的流程圖。
具體實施例方式圖1是說明可實施本發(fā)明的技術的示范性視頻編碼和解碼系統(tǒng)10的框圖。如圖 1中所展示,系統(tǒng)10包括將經編碼視頻經由通信信道16發(fā)射到目的地裝置14的源裝置 12。源裝置12和目的地裝置14可包含廣泛范圍的有線或無線裝置中的任一者。在一些 情況下,源裝置12和目的地裝置14包含無線通信裝置,例如無線手持機、所謂的蜂窩式 或衛(wèi)星無線電電話,或可在通信信道16上傳遞視頻信息的任何無線裝置。雖然貫穿本發(fā) 明在無線應用或設定的上下文中進行了描述,但本發(fā)明的技術不應限于此。所述技術還 可用于有線應用或設定中。在圖1的實例中,源裝置12可包括視頻源20、視頻編碼器22、調制器/解調器 (調制解調器)23和發(fā)射器24。目的地裝置14可包括接收器26、調制解調器27、視頻 解碼器28和顯示裝置30。根據(jù)本發(fā)明,源裝置12的視頻編碼器22可經配置以應用本 發(fā)明中描述的量化技術。以此方式,源裝置12可實現(xiàn)量化的所要層級且借此改進編碼過程。大體來說,源裝置12產生用于發(fā)射到目的地裝置14的經譯碼視頻數(shù)據(jù)。然而, 在一些情況下,裝置12、14可以大體上對稱的方式進行操作。舉例來說,裝置12、14 中的每一者可包括視頻編碼和解碼組件以及發(fā)射和接收組件。因此,系統(tǒng)10(例如)對 于視頻串流、視頻重放、視頻廣播或視頻電話可支持裝置12、14之間的單向或雙向視頻 發(fā)射。源裝置12的視頻源20可包括視頻俘獲裝置,例如攝像機、含有先前俘獲的視頻 的視頻檔案或來自視頻內容提供者的視頻饋入(例如,經由衛(wèi)星)。作為另一替代實施 例,視頻源20可產生基于計算機圖形的數(shù)據(jù)作為源視頻,或實時視頻、所存檔視頻與計 算機產生的視頻的組合。在一些情況下,如果視頻源20為攝像機,那么源裝置12和目 的地裝置14可形成所謂的相機電話或視頻電話。在每一情形下,經俘獲、預先俘獲或計 算機產生的視頻可由視頻編碼器22進行編碼。經編碼視頻信息可接著由調制解調器23 根據(jù)通信標準(例如,碼分多址(CDMA)或另一通信標準)進行調制,且經由發(fā)射器24 發(fā)射到目的地裝置14。調制解調器23可包括各種混頻器、濾波器、放大器或經設計用于 信號調制的其它組件。發(fā)射器24可包括經設計用于發(fā)射數(shù)據(jù)的電路,包括放大器、濾波 器和一個或一個以上天線。目的地裝置14的接收器26在信道16上接收信息,且調制解調器27解調所述信 息。視頻解碼器28可解碼經編碼的視頻數(shù)據(jù)以重建視頻序列。顯示裝置30將經解碼視 頻數(shù)據(jù)顯示給用戶,且可包含例如陰極射線管、液晶顯示器(LCD)、等離子顯示器、有機發(fā)光二極管(OLED)顯示器或另一類型的顯示裝置等各種顯示裝置中的任一者。在圖1的實例中,通信信道16可包含任何無線或有線通信媒體,例如射頻(RF) 頻譜或一個或一個以上物理發(fā)射線,或無線媒體與有線媒體的任何組合。通信信道16可 形成例如局域網、廣域網或例如因特網等全球網絡等基于包的網絡的一部分。通信信道 16通常表示任何合適的通信媒體,或不同通信媒體的集合,以用于將視頻數(shù)據(jù)從源裝置 12發(fā)射到目的地裝置14。視頻編碼器22和視頻解碼器28可根據(jù)例如H.264/MPEG-4第10部分AVC標 準等視頻壓縮標準進行操作。ITU-T H.264/MPEG-4第10部分AVC標準由ITU-T視頻 譯碼專家組(VCEG)連同ISO/IEC移動圖片專家組(MPEG) —起闡明為被稱為聯(lián)合視頻 小組(JVT)的集體合作的產品。在一些方面中,本發(fā)明中描述的技術可應用于大體遵守 H.264標準的裝置。視頻編碼器22和視頻解碼器28各自可經實施為一個或一個以上微處理器、數(shù)字 信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)、離散邏輯、軟 件、硬件、固件或其任何組合。視頻編碼器22和視頻解碼器28中的每一者可包括于一 個或一個以上編碼器或解碼器中,其任一者可在相應移動裝置、訂戶裝置、廣播裝置、 服務器等中集成為組合編碼器/解碼器(CODEC)的一部分。視頻序列通常包括一系列視頻幀。視頻編碼器22對個別視頻幀內的視頻塊操作 以便編碼視頻數(shù)據(jù)。所述視頻塊可具有固定或變化的大小,且可根據(jù)規(guī)定的譯碼標準而 在大小上不同。每一視頻幀可包括一系列片段,其可為視頻幀的可獨立解碼的單元。每 一片段可包括一系列宏塊,其可經布置為子塊。作為一實例,H.264標準支持各種塊大 小(例如亮度(Iuma)分量的16x16、8X8或4X4,以及色度(chroma)分量的8X8)的幀 內預測,以及各種塊大小(例如亮度分量的16x16、16x8、8x16、8X8、8x4、4x8和4X4 以及色度分量的對應經縮放大小)的幀間預測。較小視頻塊可提供較好分辨率,且可用 于包括較高層級細節(jié)的視頻幀的位置。大體來說,宏塊(MB)和各種子塊可被看作為視 頻塊。視頻塊可包含像素數(shù)據(jù)的塊,或變換系數(shù)的塊(例如,在例如離散余弦變換 (DCT)或其它變換過程等變換過程之后)。如本發(fā)明中使用的術語“系數(shù)”大體指代變 換系數(shù),但可替代地指代其它類型的系數(shù)或值,例如像素值,或另一類型的系數(shù)。本發(fā) 明的量化技術通常適用于經變換視頻塊的變換系數(shù),有時稱為殘余變換系數(shù)。為編碼視頻塊,視頻編碼器22執(zhí)行幀內或幀間預測以產生預測塊。視頻編碼器 22從待編碼的原始視頻塊減去預測塊以產生殘余塊。因此,殘余塊指示正經譯碼的塊與 預測塊之間的差異。視頻編碼器22可對殘余塊執(zhí)行變換以產生變換系數(shù)的塊。在基于 幀內或幀間的預測譯碼和變換技術之后,視頻編碼器22執(zhí)行量化。下文更詳細地論述 量化,但其大體指代系數(shù)經量化以可能地減少用以表示系數(shù)的數(shù)據(jù)量的過程。在量化之 后,可根據(jù)例如CAVLC等熵譯碼方法執(zhí)行熵譯碼。由視頻編碼器22執(zhí)行的編碼過程的 每一步驟的更多細節(jié)將在下文圖2中更詳細地加以描述。本發(fā)明提供用于以可實現(xiàn)速率與失真的所要平衡的方式來量化視頻塊的系數(shù)的 技術。換句話說,所述技術改進編碼過程的量化步階(quantization step)以在通信速率的 給定位預算下實現(xiàn)所要質量等級。根據(jù)本發(fā)明的技術,視頻編碼器22可為塊的系數(shù)的至少一部分分析多個量化層級,以為個別系數(shù)選擇具有最低譯碼成本的量化層級。在一個實例中,視頻編碼器22可例如使用與速率_失真模型相關聯(lián)的拉格朗日 (Lagrange)成本函數(shù)循序地為與個別系數(shù)相關聯(lián)的候選量化層級中的每一者計算譯碼成 本。由于CAVLC不獨立編碼每一系數(shù),所以視頻編碼器22可基于系數(shù)向量的所有其它 系數(shù)的量化層級而計算與個別系數(shù)相關聯(lián)的候選量化層級中的每一者的譯碼成本。當前 和之前系數(shù)的量化層級是已知的;當前系數(shù)的量化層級等于候選量化層級中的一者,且 之前系數(shù)的量化層級先前已選擇。當前系數(shù)之后的系數(shù)的量化層級是未知的,且可因此 如下文所詳細描述進行估計。視頻編碼器22為當前正經分析的個別系數(shù)選擇具有最低譯 碼成本的候選量化層級。視頻編碼器22以上文描述的方式為塊的所有系數(shù)選擇量化層 級。此方法稱為一次通過或單次通過方法。或者,視頻編碼器22可為與個別系數(shù)相關聯(lián)的候選量化層級中的每一者計算一 個以上譯碼成本(或多個譯碼成本)??苫谂c先前系數(shù)相關聯(lián)的先前選定的量化層級 的幸存路徑以及隨后系數(shù)的將來(隨后)量化層級的估計而計算多個譯碼成本。如下文 關于圖2和圖4更詳細地加以描述,幸存路徑表示對塊中的先前系數(shù)的量化決策的序列。 視頻編碼器22繼續(xù)以上文描述的方式為塊的所有系數(shù)選擇量化層級直到單一幸存路徑存 在為止。單一幸存路徑表示對塊中所有系數(shù)的量化決策的序列。本發(fā)明的量化技術可使得視頻編碼器22能夠在通信速率的給定位預算下實現(xiàn)所 要質量等級。根據(jù)本發(fā)明的技術,視頻編碼器22可在逐系數(shù)(coefficient by coefficient) 基礎上實施速率-失真模型且實現(xiàn)所要的量化層級。相比之下,常規(guī)量化技術在如與逐 系數(shù)基礎相對的逐塊基礎上實施速率-失真模型。換句話說,常規(guī)量化技術在計算整個 塊的譯碼成本時僅分析系數(shù)中的每一者的單一量化層級。此類技術在選擇量化系數(shù)或量 化層級上不可與本發(fā)明的技術一樣有效,以使得失真量度在最大目標譯碼位速率約束的 條件下最小化,或等效地,譯碼位速率在最大可允許失真約束的條件下最小化。圖2是說明包括符合本發(fā)明的執(zhí)行視頻塊的系數(shù)的量化的速率_失真(RD)量化 單元40的視頻編碼器50的實例的框圖。舉例來說,視頻編碼器50可對應于源裝置12 的視頻編碼器22。視頻編碼器50可執(zhí)行視頻幀內的塊的幀內和幀間譯碼。幀內譯碼依 賴于空間預測以減少或移除給定視頻幀內的視頻中的空間冗余。幀間譯碼依賴于時間預 測以減小或移除視頻序列的相鄰幀內的視頻中的時間冗余。對于幀間譯碼來說,視頻編 碼器50可執(zhí)行運動估計以追蹤在兩個或兩個以上相鄰幀之間的匹配視頻塊的移動。幀內 模式(I-模式)可指代基于空間的壓縮模式,且例如預測(P-模式)或雙向(B-模式)等 幀間模式可指代基于時間的壓縮模式。在圖2的實例中,視頻編碼器50包括預測單元32,參考幀存儲裝置34、變換單 元38、RD量化單元40、逆量化單元42,逆變換單元44和CAVLC譯碼單元46。還可 包括解塊濾波器(未圖示)以對塊邊界進行濾波以移除塊狀(blockiness)假影。視頻編碼 器50還包括加法器48和加法器51。如圖2中所展示,視頻編碼器50接收待編碼的視頻幀的當前視頻塊或視頻幀的 片段。預測單元32執(zhí)行預測譯碼技術以產生預測塊。預測單元32可表示幀內預測單元 和/或幀間預測單元。對于幀間譯碼來說,預測單元32將待編碼的當前視頻塊與一個或 一個以上參考視頻幀或片段中的各種塊進行比較以便定義預測塊。對于幀內譯碼來說,預測單元32基于例如視頻幀或片段等相同經譯碼單元內的鄰近數(shù)據(jù)而產生預測塊。對于幀間譯碼來說,預測單元32可包含識別各自指向參考幀中的塊的一個或一 個以上運動向量的運動估計,和基于運動向量產生預測塊的運動補償單元。因而,運動 估計可被視作產生運動向量(其估計運動)的過程。舉例來說,運動向量可指示參考幀 內的預測塊相對于當前幀內的正經譯碼的當前塊的位移。參考幀可在時間上位于當前視 頻塊所屬于的視頻幀或片段之前或之后。運動補償可被視作基于由運動估計確定的運動 向量提取或產生預測塊的過程。如前所述,對于幀內譯碼來說,預測單元32基于相同經譯碼單元內的鄰近數(shù)據(jù) 產生預測塊。一個或一個以上幀內預測模式可定義可如何定義幀內預測塊。根據(jù)H.264/ MPEG-4第10部分AVC標準,舉例來說,預測單元32可使用九個可能的幀內預測模式中 的一者產生4X4或8X8預測塊垂直預測模式、水平預測模式、DC預測模式、對角向 下/向左預測模式、對角向下/向右預測模式、垂直向右預測模式、水平向下預測模式、 垂直向左預測模式和水平向上預測模式?;蛘?,預測單元32可使用H.264/MPEG-4第 10部分AVC標準中定義的四個可能的幀內預測模式中的一者來產生16x16預測塊垂直 預測模式、水平預測模式、DC預測模式和平面預測模式。視頻編碼器50通過從待編碼的原始視頻塊減去由預測單元32產生的預測視頻塊 來形成殘余視頻塊(標記為“殘余塊(RESID BLOCK),,)。加法器48執(zhí)行此減法運算 以獲得殘余塊。變換單元38對殘余塊應用例如離散余弦變換(DCT)等變換,從而產生 殘余變換系數(shù)的視頻塊。變換單元38可在8X8 (N = 8)或4X4 (N = 4)塊基礎上應用 變換。然而,變換單元38可執(zhí)行由H.264標準定義的其它變換,其概念上類似于DCT。 還可使用子波變換、整數(shù)變換、子頻帶變換或其它類型的變換。在任何情形下,變換單 元38向殘余塊應用變換,從而產生殘余變換系數(shù)的塊。變換可將殘余信息從像素域轉換 為頻域。RD量化單元40(本文中也稱為“量化單元40”)量化殘余變換系數(shù)以進一步 減少位速率。特定來說,量化單元40執(zhí)行下文更詳細描述的量化技術中的一者或一者以 上,從而致力于在通信速率的給定位預算下實現(xiàn)所要的質量等級。以此方式,量化單元 40可實施速率-失真模型且實現(xiàn)所要的量化層級,例如實現(xiàn)給定速率或位預算的所要數(shù) 目的位。經量化變換系數(shù)連同預測語法(例如,運動向量、預測模式或其它控制信息)一 起可形成元素的完整經譯碼序列。CAVLC編碼單元46對經量化變換系數(shù)和預測語法進行 熵譯碼以便進一步減少其表示所需要的位數(shù)目。在CAVLC編碼單元46的熵譯碼之后, 可將經編碼視頻發(fā)射到另一裝置或存檔以供隨后發(fā)射或檢索。還將所述經量化系數(shù)提供到逆量化單元42。逆量化單元42和逆變換單元44 分別應用逆量化和逆變換,以在像素域中重建殘余塊(標記為“經重建的殘余(RECON RESID),,)而用作參考塊。加法器51將由逆變換單元44輸出的重建的殘余塊添加到由 預測單元32產生的預測塊,以產生重建的視頻塊用于存儲于參考幀存儲裝置34中。存 儲于參考幀存儲裝置34中的重建的視頻塊可由預測單元32用作參考塊,以對隨后視頻幀 中的塊進行幀間譯碼或對相同幀中的塊進行幀內譯碼??蓪㈩A測誤差或殘余塊E(X,y)(即,待編碼塊I(x,y)與預測塊P(x,y)之間的差異)表示為變換基底函數(shù)^ (X,y)的加權和
權利要求
1.一種在視頻譯碼過程中量化視頻塊的系數(shù)的至少一部分的方法,所述方法包含 為所述視頻塊的所述系數(shù)的所述部分中的每一者確定與所述相應系數(shù)相關聯(lián)的多個候選量化層級的譯碼成本;以及基于所述譯碼成本來為所述系數(shù)中的每一者選擇所述多個候選量化層級中的一者以 獲得一組經量化系數(shù)。
2.根據(jù)權利要求1所述的方法,其中確定所述譯碼成本包含基于與所述相應系數(shù)相關聯(lián)的所述候選量化層級中的每 一者、與先前經量化系數(shù)相關聯(lián)的先前選定的量化層級以及與隨后未經量化系數(shù)相關聯(lián) 的預測的量化層級來為所述相應候選量化層級計算譯碼成本;且其中選擇所述多個候選量化層級中的所述一者包含為所述相應系數(shù)選擇所述多個候 選量化層級中對應于最低譯碼成本的一者。
3.根據(jù)權利要求1所述的方法,其中確定所述譯碼成本包含基于與先前系數(shù)相關聯(lián)的幸存路徑、與當前系數(shù)相關聯(lián) 的所述相應候選量化層級以及與隨后未經量化系數(shù)相關聯(lián)的預測的量化層級來為與所述 相應系數(shù)相關聯(lián)的所述候選量化層級中的每一者計算多個譯碼成本,其中所述幸存路徑 表示用于所述塊中先于所述當前系數(shù)的系數(shù)的量化決策的序列;其中選擇所述多個候選量化層級中的所述一者包含為與所述當前系數(shù)相關聯(lián)的所述 候選量化層級中對應于最低譯碼成本的每一者選擇一幸存路徑。
4.根據(jù)權利要求3所述的方法,其進一步包含為所述視頻塊的最后系數(shù)從與所述最后 系數(shù)相關聯(lián)的候選量化層級的多個幸存路徑中選擇所述幸存路徑中具有最低譯碼成本的 “"者 ο
5.根據(jù)權利要求1所述的方法,其中確定所述譯碼成本包含使用與速率_失真模型相 關聯(lián)的拉格朗日成本函數(shù)來計算譯碼成本。
6.根據(jù)權利要求1所述的方法,其進一步包含基于所述視頻塊的所述相應個別系數(shù)的 絕對值、量化參數(shù)和量化矩陣來計算相應個別系數(shù)的所述多個候選量化層級中的至少一者ο
7.根據(jù)權利要求6所述的方法,其中所述多個候選量化層級包括量化層級零。
8.根據(jù)權利要求7所述的方法,其進一步包含在所述經量化系數(shù)中的一當前者與量 化層級一相比更靠近所述量化層級零的情形下跳過確定所述多個候選量化層級的譯碼成 本。
9.根據(jù)權利要求1所述的方法,其進一步包含對所述組經量化系數(shù)執(zhí)行上下文自適應可變長度譯碼(CAVLC)以將所述組經量化系 數(shù)熵譯碼為位流;以及 輸出所述經編碼位流。
10.一種用于在視頻譯碼過程中量化視頻塊的系數(shù)的至少一部分的設備,所述設備包含量化單元,其為所述視頻塊的所述系數(shù)的所述部分中的每一者確定與所述相應系數(shù)相關聯(lián)的多個 候選量化層級的譯碼成本;以及基于所述譯碼成本來為所述系數(shù)中的每一者選擇所述多個候選量化層級中的一者以 獲得一組經量化系數(shù)。
11.根據(jù)權利要求10所述的設備,其中所述量化單元基于與所述相應系數(shù)相關聯(lián)的所述候選量化層級中的一者、與先前經量化系數(shù)相關 聯(lián)的先前選定的量化層級以及與隨后未經量化系數(shù)相關聯(lián)的所預測的量化層級來為所述 相應候選量化層級計算譯碼成本;以及為所述相應系數(shù)選擇所述多個候選量化層級中對應于最低譯碼成本的一者。
12.根據(jù)權利要求10所述的設備,其中所述量化單元基于與先前系數(shù)相關聯(lián)的幸存路徑、與當前系數(shù)相關聯(lián)的所述相應候選量化層級以 及與隨后未經量化系數(shù)相關聯(lián)的所預測的量化層級來為與所述相應系數(shù)相關聯(lián)的所述候 選量化層級中的每一者計算多個譯碼成本,其中所述幸存路徑表示用于所述塊中先于所 述當前系數(shù)的系數(shù)的量化決策的序列;為與所述當前系數(shù)相關聯(lián)的所述候選量化層級中對應于最低譯碼成本的每一者選擇 一幸存路徑。
13.根據(jù)權利要求12所述的設備,其中所述量化單元為所述視頻塊的最后系數(shù)從與所 述最后系數(shù)相關聯(lián)的候選量化層級的多個幸存路徑中選擇所述幸存路徑中具有最低譯碼 成本的一者。
14.根據(jù)權利要求10所述的設備,其中所述量化單元使用與速率_失真模型相關聯(lián)的 拉格朗日成本函數(shù)來計算譯碼成本。
15.根據(jù)權利要求10所述的設備,其中所述量化單元基于所述視頻塊的所述相應個別 系數(shù)的絕對值、量化參數(shù)和量化矩陣來計算相應個別系數(shù)的所述多個候選量化層級中的至少一者。
16.根據(jù)權利要求15所述的設備,其中所述多個候選量化層級包括量化層級零。
17.根據(jù)權利要求16所述的設備,其中在所述經量化系數(shù)中的一當前者與量化層級一 相比更靠近所述量化層級零的情形下所述量化單元跳過確定所述多個候選量化層級的譯 碼成本。
18.根據(jù)權利要求10所述的設備,其進一步包含熵編碼器,其對所述組經量化系數(shù)執(zhí)行上下文自適應可變長度譯碼(CAVLC)以將所 述組經量化系數(shù)熵譯碼為位流;以及發(fā)射器,其發(fā)射所述經編碼位流。
19.根據(jù)權利要求10所述的設備,其中所述設備并入于無線通信裝置內。
20.根據(jù)權利要求10所述的設備,其中所述設備包含集成電路。
21.一種包含指令的計算機可讀媒體,所述指令在執(zhí)行時使一裝置在視頻譯碼過程中 量化視頻塊的系數(shù)的至少一部分,其中所述指令使所述裝置為所述視頻塊的所述系數(shù)的所述部分中的每一者確定與所述相應系數(shù)相關聯(lián)的多個 候選量化層級的譯碼成本;以及基于所述譯碼成本來為所述系數(shù)中的每一者選擇所述多個候選量化層級中的一者以 獲得一組經量化系數(shù)。
22.根據(jù)權利要求21所述的計算機可讀媒體,其中使所述裝置確定所述譯碼成本的指令包含使所述裝置進行以下操作的指令基于與所述相應系數(shù)相關聯(lián)的所述候選量化層級中的每一者、與先前經量化系數(shù)相 關聯(lián)的先前選定的量化層級以及與隨后未經量化系數(shù)相關聯(lián)的預測的量化層級來為所述 相應候選量化層級計算譯碼成本;且其中使所述裝置選擇所述多個候選量化層級中的所述一者的指令包含使所述裝置進 行以下操作的指令為所述相應系數(shù)選擇所述多個候選量化層級中對應于最低譯碼成本 的一者。
23.根據(jù)權利要求21所述的計算機可讀媒體,其中使所述裝置確定所述譯碼成本的指令包含使所述裝置進行以下操作的指令基于與先前系數(shù)相關聯(lián)的幸存路徑、與當前系數(shù)相關聯(lián)的所述相應候選量化層級以 及與隨后未經量化系數(shù)相關聯(lián)的預測的量化層級來為與所述相應系數(shù)相關聯(lián)的所述候選 量化層級中的每一者計算多個譯碼成本,其中所述幸存路徑表示用于所述塊中先于所述 當前系數(shù)的系數(shù)的量化決策的序列;其中使所述裝置選擇所述多個候選量化層級中的所述一者的指令包含使所述裝置進 行以下操作的指令為與所述當前系數(shù)相關聯(lián)的所述候選量化層級中對應于最低譯碼成 本的每一者選擇一幸存路徑。
24.根據(jù)權利要求23所述的計算機可讀媒體,其進一步包含使所述裝置進行以下操作 的指令為所述視頻塊的最后系數(shù)從與所述最后系數(shù)相關聯(lián)的候選量化層級的多個幸存 路徑中選擇所述幸存路徑中具有最低譯碼成本的一者。
25.根據(jù)權利要求21所述的計算機可讀媒體,其中使所述裝置確定所述譯碼成本的指 令包含使所述裝置進行以下操作的指令使用與速率-失真模型相關聯(lián)的拉格朗日成本 函數(shù)來計算譯碼成本。
26.根據(jù)權利要求21所述的計算機可讀媒體,其進一步包含使所述裝置進行以下操作 的指令基于所述視頻塊的所述相應個別系數(shù)的絕對值、量化參數(shù)和量化矩陣來計算相 應個別系數(shù)的所述多個候選量化層級中的至少一者。
27.根據(jù)權利要求26所述的計算機可讀媒體,其中所述多個候選量化層級包括量化層 級零。
28.根據(jù)權利要求27所述的計算機可讀媒體,其進一步包含使所述裝置進行以下操作 的指令在所述經量化系數(shù)中的一當前者與量化層級一相比更靠近所述量化層級零的情 形下跳過確定所述多個候選量化層級的譯碼成本。
29.根據(jù)權利要求21所述的計算機可讀媒體,其進一步包含使所述裝置進行以下操作 的指令對所述組經量化系數(shù)執(zhí)行上下文自適應可變長度譯碼(CAVLC)以將所述組經量化系 數(shù)熵譯碼為位流;以及輸出所述經編碼位流。
30.一種用于在視頻譯碼過程中量化視頻塊的系數(shù)的至少一部分的裝置,所述裝置包含確定裝置,其用于為所述視頻塊的所述系數(shù)的所述部分中的每一者確定與所述相應 系數(shù)相關聯(lián)的多個候選量化層級的譯碼成本;以及選擇裝置,其用于基于所述譯碼成本來為所述系數(shù)中的每一者選擇所述多個候選量 化層級中的一者以獲得一組經量化系數(shù)。
31.根據(jù)權利要求30所述的裝置,其中所述確定裝置基于與所述相應系數(shù)相關聯(lián)的所述候選量化層級中的每一者、與 先前經量化系數(shù)相關聯(lián)的先前選定的量化層級以及與隨后未經量化系數(shù)相關聯(lián)的預測的 量化層級來為所述相應候選量化層級計算譯碼成本;且其中所述選擇裝置為所述相應系數(shù)選擇所述多個候選量化層級中對應于最低譯碼成 本的一者。
32.根據(jù)權利要求30所述的裝置,其中所述確定裝置基于與先前系數(shù)相關聯(lián)的幸存路徑、與當前系數(shù)相關聯(lián)的所述相 應候選量化層級以及與隨后未經量化系數(shù)相關聯(lián)的預測的量化層級來為與所述相應系數(shù) 相關聯(lián)的所述候選量化層級中的每一者計算多個譯碼成本,其中所述幸存路徑表示用于 所述塊中先于所述當前系數(shù)的系數(shù)的量化決策的序列;其中所述選擇裝置為與所述當前系數(shù)相關聯(lián)的所述候選量化層級中對應于最低譯碼 成本的每一者選擇一幸存路徑。
33.根據(jù)權利要求32所述的裝置,其中所述選擇裝置為所述視頻塊的最后系數(shù)從與所 述最后系數(shù)相關聯(lián)的候選量化層級的多個幸存路徑中選擇所述幸存路徑中具有最低譯碼 成本的一者。
34.根據(jù)權利要求30所述的裝置,其中所述確定裝置使用與速率_失真模型相關聯(lián)的 拉格朗日成本函數(shù)來計算譯碼成本。
35.根據(jù)權利要求30所述的裝置,其進一步包含用于基于所述視頻塊的所述相應個別 系數(shù)的絕對值、量化參數(shù)和量化矩陣來計算相應個別系數(shù)的所述多個候選量化層級中的 至少一者的裝置。
36.根據(jù)權利要求35所述的裝置,其中所述多個候選量化層級包括量化層級零。
37.根據(jù)權利要求36所述的裝置,其進一步包含用于在所述經量化系數(shù)中的一當前者 與量化層級一相比更靠近所述量化層級零的情形下跳過確定所述多個候選量化層級的譯 碼成本的裝置。
38.根據(jù)權利要求30所述的裝置,其進一步包含用于對所述組經量化系數(shù)執(zhí)行上下文自適應可變長度譯碼(CAVLC)以將所述組經量 化系數(shù)熵譯碼為位流的裝置;以及用于輸出所述經編碼位流的裝置。
全文摘要
大體來說,本發(fā)明提供用于以可實現(xiàn)速率與失真的所要平衡的方式量化視頻塊的系數(shù)的技術。所述所描述技術可分析與每一個別系數(shù)相關聯(lián)的多個量化層級,以為所述個別系數(shù)選擇導致最低譯碼成本的量化層級。由于CAVLC不獨立編碼每一系數(shù),所以所述技術可基于為先前經量化系數(shù)所選擇的量化層級和用于系數(shù)向量的隨后系數(shù)的所估計(或預測)的量化層級來為與所述個別系數(shù)相關聯(lián)的候選量化層級中的每一者計算所述譯碼成本。所述系數(shù)中的每一者的所述量化層級基于所計算的譯碼成本來進行選擇,以獲得最小化速率-失真模型的一組經量化系數(shù)。
文檔編號H04N7/26GK102017633SQ200980116373
公開日2011年4月13日 申請日期2009年4月10日 優(yōu)先權日2008年4月11日
發(fā)明者葉琰, 陳培松, 馬爾塔·卡切維奇 申請人:高通股份有限公司