根據(jù)運動信息壓縮方案通過層間運動信息預(yù)測對圖像進行編碼或解碼的方法和設(shè)備的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明通常涉及可分級視頻編碼和解碼領(lǐng)域,尤其涉及將擴展高效率視頻編碼 (HEVC)標準的可分級視頻編碼和解碼。更特別地,本發(fā)明涉及用于可分級視頻編碼器和解 碼器中的運動矢量預(yù)測的方法、裝置和計算機程序。
【背景技術(shù)】
[0002] 視頻編碼是將一系列視頻圖像變換成緊湊的數(shù)字化位流以使得可以傳輸或存儲 這些視頻圖像的方式。編碼裝置用于對視頻圖像進行編碼,而關(guān)聯(lián)的解碼裝置可用于對位 流進行重建以供顯示和觀看。一般目的是將位流形成為具有與原始視頻信息相比更小的大 小。這樣有利地降低了針對傳送網(wǎng)絡(luò)或存儲裝置所要求的用以傳輸或存儲位流碼的容量。
[0003] 特別是關(guān)于解碼部分,已將常見的標準化方法用于編碼處理的格式和方法。絕大 多數(shù)的過去視頻標準將視頻圖像分割成較小的段(被稱為宏塊或塊)。在最終確定的新高 效率視頻編碼(HEVC)視頻壓縮標準中,根據(jù)考慮中的原始圖像片段的特性,宏塊被所謂的 最大編碼單位(LCU)(還被稱為編碼樹塊(CTB))替代,并且被分區(qū)并調(diào)整成現(xiàn)在被稱為編 碼單位(CU)的塊。這樣使得能夠?qū)σ曨l圖像的包含相對較多信息的區(qū)域進行更詳細的編 碼,并且使得針對特征較少的區(qū)域的編碼工作較少。注意,根據(jù)視頻壓縮文獻的以下不同術(shù) 語,圖像區(qū)域也是已知的:像素塊、像素的塊、塊、編碼單位(CU)和宏塊。
[0004] 現(xiàn)在正定義HEVC的可分級擴展。在該擴展中,圖像被視為包括多個層級層。層級 層包括基本層(等同于原始視頻序列的低質(zhì)量版本的圖像(或幀)的集合)以及一個或多 個增強層(還已知為細化層)。
[0005] 原本通過以類似于靜止圖像或圖片的數(shù)字編碼的方式單獨對各宏塊進行編碼來 處理視頻圖像。隨后的編碼模型允許根據(jù)相鄰宏塊(空間或INTRA(幀內(nèi))預(yù)測)或者通 過與相鄰幀中的相似宏塊相關(guān)聯(lián)(時間預(yù)測)來預(yù)測一個幀中的特征。這樣使得能夠使用 已可用的編碼信息,由此縮短整體所需的編碼位率的量。在值的殘差集合中捕獲到要編碼 的原始塊和預(yù)測所使用的塊之間的差。然后,以殘差和預(yù)測所使用的塊的標識符的形式對 原始塊進行編碼。許多不同類型的預(yù)測是可能的。有效編碼在考慮到各預(yù)測模式用以在位 流中代表將要編碼的塊所引起的位流大小的情況下,選擇在解碼時針對該塊提供最佳質(zhì)量 的最佳預(yù)測模式。解碼后的圖片質(zhì)量和所需位率的降低之間的權(quán)衡(還已知為率/失真權(quán) 衡)是整體目標。
[0006] 在時間預(yù)測的情況下,可以進行多種預(yù)測,并且可以聚集為單向預(yù)測和雙向預(yù)測 這兩個主要類型。在單向預(yù)測的情況下,要預(yù)測的塊與一個預(yù)測結(jié)果相關(guān)聯(lián)。將該預(yù)測結(jié)果 的位置編碼作為運動信息。該運動信息由包含預(yù)測結(jié)果的參考幀的索引(在標準中被稱為 ref_idX)和如下的矢量構(gòu)成,其中該矢量是由垂直位移和給出所參考的幀中的預(yù)測結(jié)果塊 的位置的水平位移所定義的。在雙向預(yù)測的情況下,要編碼的塊與在兩個不同的參考幀中 所獲取到的兩個預(yù)測結(jié)果相關(guān)聯(lián)。結(jié)果,運動信息包括兩個矢量和參考幀的兩個索引。
[0007] 可以以預(yù)測方式對運動信息自身進行編碼??梢允褂冕槍ο嗤瑤械南噜従幋a單 位所獲得的運動信息作為空間運動信息預(yù)測結(jié)果??梢允褂脧钠渌鼛械耐恢镁幋a單位 所獲得的運動信息作為時間運動信息預(yù)測結(jié)果。然后,利用與所使用的運動信息預(yù)測結(jié)果 有關(guān)的索引以及表示所選擇的運動信息預(yù)測結(jié)果和要編碼的運動信息之間的差的殘差信 息來對針對要編碼的塊所要編碼的運動信息進行編碼。
[0008] 根據(jù)與先前圖像相對應(yīng)的運動信息所進行的運動信息的預(yù)測要求編碼器和解碼 器存儲先前編碼圖像的運動場。該運動場可以表示用以更能存儲如4k2k或8k4k視頻那樣 的分辨率大的視頻的大量數(shù)據(jù)。為了限制HEVC編解碼器的存儲要求,HEVC標準采用了代 替整個運動場而是使用壓縮運動場來進行運動信息預(yù)測的策略。
[0009] 僅在使用先前圖像的運動信息的情況下才要求存儲運動場。在HEVC中,可以使得 時間運動信息預(yù)測結(jié)果的使用變得無效。在這種情況下,可以通過防止存儲運動信息來進 一步降低HEVC編解碼器的存儲要求。
[0010] 可分級編解碼器的主要思路其中之一是重復(fù)使用來自使用給定編解碼器(例如, HEVC)進行編碼后的參考層(RL)的信息,以對增強層的信息進行編碼。
[0011] 將期望如下:使用在參考層中所確定的運動信息來對增強層中的運動信息進行預(yù) 測編碼。特別地,如果在參考層中使得時間運動信息預(yù)測結(jié)果的使用變得無效,則可能發(fā)生 以下情況:可能不存在可用的運動信息以用于進行增強層中的運動信息預(yù)測。
【發(fā)明內(nèi)容】
[0012] 本發(fā)明是為了解決前述擔心中的一個或多個而設(shè)計的。本發(fā)明涉及用以確定可分 級編碼方案的增強層中的運動信息預(yù)測結(jié)果的處理(還已知為運動推導(dǎo)處理)。該處理包 括對挑選由于壓縮方案而可用的更相關(guān)的運動信息所使用的參考層中的位置進行校正。
[0013] 根據(jù)本發(fā)明的第一方面,提供一種用于根據(jù)可分級的編碼格式來對圖像進行編碼 或解碼的方法,所述編碼格式至少包括參考層和增強層,基于運動信息來對所述圖像的至 少一部分進行預(yù)測編碼,基于運動信息預(yù)測結(jié)果的集合來對所述運動信息自身進行預(yù)測編 碼,所述方法至少針對所述增強層中的圖像區(qū)域包括以下步驟:基于圖像中屬于所述參考 層的其它部分的運動信息來確定運動信息預(yù)測結(jié)果的集合;以及確定所述增強層中的要編 碼的圖像區(qū)域在所述參考層中的同位位置,以選擇與所述同位位置相關(guān)聯(lián)的運動信息作為 運動信息預(yù)測結(jié)果的所述集合的一部分,其中,所述方法還包括以下步驟:考慮到應(yīng)用于所 述參考層的運動信息的壓縮方案來校正所述同位位置。因此,改進了運動信息預(yù)測。
[0014] 在實施例中,校正所述同位位置的步驟包括:向所述同位位置的坐標至少之一應(yīng) 用舍入函數(shù)。
[0015] 在實施例中,句法元素表示舍入函數(shù)(roundingfunction)中所使用的舍入值。
[0016] 在實施例中,校正所述同位位置的步驟包括:基于利用所述同位位置的坐標至少 之一編索引后的查找表,來針對該坐標挑選校正值。
[0017] 在實施例中,所述方法還包括以下步驟:測試校正值是否匹配預(yù)定的標準;以及 在所述校正值匹配所述標準的情況下,改變所述校正值。
[0018] 在實施例中,所述標準是與校正后的位置相對應(yīng)的運動信息的可用性;以及改變 后的校正值是具有相關(guān)聯(lián)的運動信息的相鄰值。
[0019] 在實施例中,所述標準是與沿著坐標其中之一的圖像尺寸相對應(yīng)的閾值;以及改 變后的校正值是原始值。
[0020] 在實施例中,所述標準是與存儲器區(qū)域的極限相對應(yīng)的閾值;以及改變后的校正 值是原始值。
[0021] 根據(jù)本發(fā)明的另一方面,提供一種用于根據(jù)可分級的編碼格式來對圖像進行編碼 或解碼的裝置,所述編碼格式至少包括參考層和增強層,基于運動信息來對所述圖像的至 少一部分進行預(yù)測編碼,基于運動信息預(yù)測結(jié)果的集合來對所述運動信息自身進行預(yù)測編 碼,所述裝置至少針對所述增強層中的圖像區(qū)域包括:預(yù)測結(jié)果確定模塊,用于基于圖像中 屬于所述參考層的其它部分的運動信息來確定運動信息預(yù)測結(jié)果的集合;以及位置確定模 塊,用于確定所述增強層中的要編碼的圖像區(qū)域在所述參考層中的同位位置,以選擇與所 述同位位置相關(guān)聯(lián)的運動信息作為運動信息預(yù)測結(jié)果的所述集合的一部分,其中,所述裝 置還包括:位置校正模塊,用于考慮到應(yīng)用于所述參考層的運動信息的壓縮方案來校正所 述同位位置。
[0022] 在實施例中,所述位置校正模塊包括:舍入模塊,用于向所述同位位置的坐標至少 之一應(yīng)用舍入函數(shù)。
[0023] 在實施例中,句法元素表示舍入函數(shù)中所使用的舍入值。
[0024] 在實施例中,所述位置校正模塊包括:用于基于利用所述同位位置的坐標至少之 一編索引后的查找表來針對該坐標挑選校正值的部件。
[0025] 在實施例中,所述裝置還包括:用于測試校正值是否匹配預(yù)定的標準的部件;以 及用于在所述校正值匹配所述標準的情況下改變所述校正值的部件。
[0026] 在實施例中,所述標準是與校正后的位置相對應(yīng)的運動信息的可用性;以及改變 后的校正值是具有相關(guān)聯(lián)的運動信息的相鄰值。
[0027] 在實施例中,所述標準是與沿著坐標其中之一的圖像尺寸相對應(yīng)的閾值;以及改 變后的校正值是原始值。
[0028] 在實施例中,所述標準是與存儲器區(qū)域的極限相對應(yīng)的閾值;以及改變后的校正 值是原始值。
[0029] 根據(jù)本發(fā)明的另一方面,提供一種可編程設(shè)備所用的計算機程序產(chǎn)品,所述計算 機程序產(chǎn)品包括指令序列,所述指令序列用于在被載入所述可編程設(shè)備并且由所述可編程 設(shè)備執(zhí)行的情況下,實現(xiàn)根據(jù)本發(fā)明的方法。
[0030] 根據(jù)本發(fā)明的另一方面,提供一種計算機可讀存儲介質(zhì),用于存儲計算機程序的 指令,所述指令用于實現(xiàn)根據(jù)本發(fā)明的方法。
[0031] 根據(jù)本發(fā)明的方法的至少一部分可以通過計算機來實現(xiàn)。因此,本發(fā)明可以采用 完全硬件實施例、(包括固件、常駐軟件、微代碼等的)完全軟件實施例、或者組合這里通常 可以全部稱為"電路"、"模塊"或"系統(tǒng)"的軟件和硬件方面的實施例的形式。此外,本發(fā)明 可以采用以介質(zhì)中嵌入有計算機可用程序代碼的表現(xiàn)的任何有形介質(zhì)中所體現(xiàn)的計算機 程序產(chǎn)品的形式。
[0032] 由于本發(fā)明可以以軟件來實現(xiàn),因此本發(fā)明可以體現(xiàn)為計算機可讀代碼以提供至 可編程設(shè)備的任何適當載體介質(zhì)上。有形載體介質(zhì)可以包括諸如軟盤、CD-ROM、硬盤驅(qū)動 器、磁帶裝置或固態(tài)存儲器裝置等的存儲介質(zhì)。瞬態(tài)載體介質(zhì)可以包括諸如電信號、電子信 號、光學(xué)信號、聲學(xué)信號、磁信號或者例如微波或RF信號的電磁信號等的信號。
【附圖說明】
[0033] 現(xiàn)在將僅通過示例的方式并且參考以下附圖來說明本發(fā)明的各實施例,其中:
[0034] 圖1示出傳統(tǒng)的可分級視頻編碼器的框圖;
[0035] 圖2示出本發(fā)明實施例中的運動信息預(yù)測結(jié)果的空間位置和時間位置;
[0036] 圖3示出本發(fā)明實施例中的、使用參考層的運動信息來預(yù)測增強層中的運動信 息;
[0037] 圖4示出本發(fā)明實施例中的解碼處理所用的流程圖;
[0038] 圖5示出本發(fā)明實施例中的運動信息的粒度;
[0039] 圖6示意性示出本發(fā)明實施例中的TextureRL方法的原理;
[0040] 圖7示出本發(fā)明實施例中的、針對增強層中的AMVP模式和合并模式這兩者在 TextureRL方法的情形下的改寫的運動信息預(yù)測結(jié)果推導(dǎo)處理;
[0041] 圖8示出本發(fā)明實施例中的在參考幀索引(referenceframeindex)方法的情形 下的改寫的處理;
[0042] 圖9是本發(fā)明實施例中的合并模式中的運動信息推導(dǎo)處理的流程圖;
[0043] 圖10呈現(xiàn)本發(fā)明實施例中的可分級解碼器的框圖;
[0044] 圖11是用于實現(xiàn)本發(fā)明的一個或多個實施例的計算裝置的示意框圖;
[0045] 圖12示出本發(fā)明實施例中的AMVP運動信息預(yù)測結(jié)果集合推導(dǎo);
[0046] 圖13示出本發(fā)明實施例中的存儲器區(qū)域的詳情。
【具體實施方式】
[0047] 圖1示出可以包括多個子部分或階段并且代表HEVC的可分級擴展的傳統(tǒng)的可分 級視頻編碼器的框圖。這里示出兩個子部分或階段A10和B10,其中這些子部分或階段A10 和B10生成與基本層相對應(yīng)的數(shù)據(jù)1. 13和與一個增強層相對應(yīng)的數(shù)據(jù)1. 14。子部分A10 和B10各自遵循標準視頻編碼器的原理,其中在兩個單獨路徑(一個路徑對應(yīng)于每一層) 中應(yīng)用變換、量化和熵編碼的步驟。
[004