亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

多層視頻譯碼中的符合性和不可操作性改進的制作方法

文檔序號:12290268閱讀:264來源:國知局
多層視頻譯碼中的符合性和不可操作性改進的制作方法與工藝

本發(fā)明涉及多層視頻譯碼。更確切地說,本發(fā)明涉及用于多層視頻譯碼中符合性和互操作性的方法,包含用信號發(fā)送簡檔、層次和層級信息,用信號發(fā)送輸出層集合的,使用假想?yún)⒖冀獯a器(HRD)參數(shù),以及位流符合性測試。



背景技術:

數(shù)字視頻能力可以并入到多種多樣的裝置中,包含數(shù)字電視、數(shù)字直播系統(tǒng)、無線廣播系統(tǒng)、個人數(shù)字助理(PDA)、膝上型或桌上型計算機、平板計算機、電子圖書閱讀器、數(shù)碼相機、數(shù)字記錄裝置、數(shù)字媒體播放器、視頻游戲裝置、視頻游戲控制臺、蜂窩式或衛(wèi)星無線電電話(所謂的“智能電話”)、視頻電話會議裝置、視頻流式傳輸裝置及其類似者。數(shù)字視頻裝置實施一或多種視頻譯碼技術。視頻裝置可通過實施此類視頻譯碼技術來更有效率地發(fā)射、接收、編碼、解碼和/或存儲數(shù)字視頻信息。

視頻譯碼技術包含(但不限于)在由ITU-T H.261、ISO/IEC MPEG-1視覺、ITU-T H.262或ISO/IEC MPEG-2視覺、ITU-T H.263、ISO/IEC MPEG-4視覺及ITU-T H.264或ISO/IEC MPEG-4高級視頻譯碼(AVC)(包含其可縮放視頻譯碼(SVC)及多視圖視頻譯碼(MVC)擴展)及相對新的高效視頻譯碼(HEVC)標準定義的標準中所描述的技術。HEVC標準最近被國際電信聯(lián)盟電信標準化部門(ITU-T)的視頻譯碼專家組(VCEG)與由國際標準化組織(ISO)及國際電工委員會(IEC)形成的移動圖片專家組(MPEG)的視頻譯碼聯(lián)合合作小組(JCT-VC)定案??蓮膒henix.int-evry.fr/jct/doc_end_user/documents/12_Geneva/wg11/JCTVC-L1003-v34.zip獲得HEVC規(guī)范的最新工作草案(WD)(被稱為HEVC WD10)。HEVC的多視圖擴展(即MV-HEVC)也正由JCT-3V開發(fā)。下文中的最近工作草案MV-HEVC WD3可從phenix.it-sudparis.eu/jct2/doc_end_user/documents/3_Geneva/wg11/JCT3V-C1004-v4.zip獲得。被稱為SHVC的對HEVC的可縮放擴展也正由JCT-VC開發(fā)。下文中被稱為SHVC WD2的最近SHVC工作草案可從phenix.int-evry.fr/jct/doc_end_user/documents/13_Incheon/wg11/JCTVC-M1008-v1.zip獲得。

視頻譯碼技術包含空間(圖片內(nèi))預測和/或時間(圖片間)預測以減少或去除視頻序列中固有的冗余。對于基于塊的視頻譯碼,視頻切片((例如,視頻幀或視頻幀的一部分)可以分割成視頻塊,所述視頻塊也可被稱為樹塊、譯碼單元(CU)和/或譯碼節(jié)點。使用相對于同一圖片中的相鄰塊中的參考樣本的空間預測對圖片的經(jīng)幀內(nèi)譯碼(I)切片中的視頻塊進行編碼。圖片的經(jīng)幀間譯碼(P或B)切片中的視頻塊可使用相對于同一圖片中的相鄰塊中的參考樣本的空間預測或相對于其它參考圖片中的參考樣本的時間預測。圖片可被稱為幀,且參考圖片可被稱為參考幀。

空間或時間預測產(chǎn)生用于待譯碼塊的預測塊。殘余數(shù)據(jù)表示待譯碼原始塊與預測塊之間的像素差。經(jīng)幀間譯碼塊是根據(jù)指向形成預測塊的參考樣本塊的運動向量和指示經(jīng)譯碼塊與預測塊之間的差的殘余數(shù)據(jù)經(jīng)編碼。經(jīng)幀內(nèi)譯碼塊是根據(jù)幀內(nèi)譯碼模式和殘余數(shù)據(jù)經(jīng)編碼。為了進一步壓縮,可將殘余數(shù)據(jù)從像素域變換到變換域,從而產(chǎn)生殘余變換系數(shù),接著可量化所述殘余變換系數(shù)??蓲呙枰婚_始按二維陣列排列的經(jīng)量化變換系數(shù),以便產(chǎn)生變換系數(shù)的一維向量,且可應用熵譯碼以實現(xiàn)更多壓縮。

可通過(例如)從多個視角編碼視圖來產(chǎn)生多視圖譯碼位流。已經(jīng)開發(fā)使用多視圖譯碼方面的一些三維(3D)視頻標準。舉例來說,不同視圖可傳輸左眼和右眼視圖以支持3D視頻。替代地,一些3D視頻譯碼過程可應用所謂的多視圖加深度譯碼。在多視圖加深度譯碼中,3D視頻位流可不僅含有紋理視圖分量,而且含有深度視圖分量。舉例來說,每一視圖可包括一個紋理視圖分量和一個深度視圖分量。



技術實現(xiàn)要素:

一般來說,本發(fā)明描述與多層視頻譯碼中的位流符合性和互操作性改進有關的系統(tǒng)和方法。本發(fā)明的系統(tǒng)、方法和裝置各自具有若干創(chuàng)新方面,其中沒有單個方面單獨負責本文中所揭示的合乎需要的屬性。

本發(fā)明的一個方面提供一種處理視頻數(shù)據(jù)的方法。所述方法可包含接收具有多個輸出操作點的經(jīng)譯碼視頻數(shù)據(jù)。所述方法也可包含從所述多個輸出操作點提取選定輸出操作點。響應于所述選定輸出操作點對應于整個位流和所述整個位流的時間子集中的一者,其中將僅輸出基礎層,所述方法也可包含對所述選定輸出操作點執(zhí)行第一位流符合性測試,所述第一位流符合性測試是基于基礎層的活動序列參數(shù)集(SPS)中的序列層級假想?yún)⒖冀獯a器(HRD)參數(shù)的集合,以及一或多個非嵌套式補充增強信息(SEI)消息。響應于所述選定輸出操作點對應于由活動視頻參數(shù)集(VPS)的基礎VPS規(guī)定的層集合和所述層集合的時間子集中的一者,其中將僅輸出所述基礎層,所述方法也可包含對所述選定輸出操作點執(zhí)行第二位流符合性測試,所述第二位流符合性測試是基于所述基礎VPS中的序列層級HRD參數(shù)的集合以及直接嵌套式SEI消息。響應于所述選定輸出操作點對應于由所述活動VPS的VPS擴展規(guī)定的輸出層集合(OLS)和所述OLS的時間子集中的一者,所述方法也可包含對所述選定輸出操作點執(zhí)行第三位流符合性測試,所述第三位流符合性測試是基于所述活動VPS中的序列層級HRD參數(shù)的集合以及間接嵌套式SEI消息。

本發(fā)明的另一態(tài)樣提供一種用于處理視頻數(shù)據(jù)的裝置。所述裝置可具有經(jīng)配置以存儲經(jīng)譯碼視頻數(shù)據(jù)的存儲器,所述經(jīng)譯碼視頻數(shù)據(jù)具有多個輸出操作點。所述裝置也可具有處理器,所述處理器可操作地耦合到所述存儲器且經(jīng)配置以從所述多個輸出操作點提取選定輸出操作點。響應于所述選定輸出操作點對應于整個位流和所述整個位流的時間子集中的一者,其中將僅輸出基礎層,所述處理器可經(jīng)進一步配置以對所述選定輸出操作點執(zhí)行第一位流符合性測試,所述第一位流符合性測試是基于基礎層的活動序列參數(shù)集(SPS)中的序列層級假想?yún)⒖冀獯a器(HRD)參數(shù)的集合,以及一或多個非嵌套式補充增強信息(SEI)消息。響應于所述選定輸出操作點對應于由活動視頻參數(shù)集(VPS)的基礎VPS規(guī)定的層集合和所述層集合的時間子集中的一者,其中將僅輸出所述基礎層,所述處理器可經(jīng)進一步配置以對所述選定輸出操作點執(zhí)行第二位流符合性測試,所述第二位流符合性測試是基于所述基礎VPS中的序列層級HRD參數(shù)的集合以及直接嵌套式SEI消息。響應于所述選定輸出操作點對應于由所述活動VPS的VPS擴展規(guī)定的輸出層集合(OLS)和所述OLS的時間子集中的一者,所述處理器可經(jīng)進一步配置以對所述選定輸出操作點執(zhí)行第三位流符合性測試,所述第三位流符合性測試是基于所述活動VPS中的序列層級HRD參數(shù)的集合以及間接嵌套式SEI消息。

本發(fā)明的另一方面提供一種用于處理視頻數(shù)據(jù)的設備。所述設備可具有用于存儲經(jīng)譯碼視頻數(shù)據(jù)的存儲器裝置,所述視頻數(shù)據(jù)具有多個輸出操作點。所述設備也可具有解碼器裝置,所述解碼器裝置可操作地耦合到所述存儲器裝置以用于從所述多個輸出操作點提取選定輸出操作點。響應于所述選定輸出操作點對應于整個位流和所述整個位流的時間子集中的一者,其中將僅輸出基礎層,所述解碼器裝置也可對所述選定輸出操作點執(zhí)行第一位流符合性測試,所述第一位流符合性測試是基于基礎層的活動序列參數(shù)集(SPS)中的序列層級假想?yún)⒖冀獯a器(HRD)參數(shù)的集合,以及一或多個非嵌套式補充增強信息(SEI)消息。響應于所述選定輸出操作點對應于由活動視頻參數(shù)集(VPS)的基礎VPS規(guī)定的層集合和所述層集合的時間子集中的一者,其中將僅輸出所述基礎層,所述解碼器裝置也可對所述選定輸出操作點執(zhí)行第二位流符合性測試,所述第二位流符合性測試是基于所述基礎VPS中的序列層級HRD參數(shù)的集合以及直接嵌套式SEI消息。響應于所述選定輸出操作點對應于由所述活動VPS的VPS擴展規(guī)定的輸出層集合(OLS)和所述OLS的時間子集中的一者,所述解碼器裝置也可對所述選定輸出操作點執(zhí)行第三位流符合性測試,所述第三位流符合性測試是基于所述活動VPS中的序列層級HRD參數(shù)的集合以及間接嵌套式SEI消息。

本發(fā)明的另一態(tài)樣提供一種用于處理視頻數(shù)據(jù)的非暫時性計算機可讀媒體。所述非暫時性計算機可讀媒體可含有指令,所述指令在由處理器執(zhí)行時致使計算機接收具有多個輸出操作點的經(jīng)譯碼視頻數(shù)據(jù)。所述指令也可致使計算機從所述多個輸出操作點提取選定輸出操作點。響應于所述選定輸出操作點對應于整個位流和所述整個位流的時間子集中的一者,其中將僅輸出基礎層,所述指令也可致使計算機對所述選定輸出操作點執(zhí)行第一位流符合性測試,所述第一位流符合性測試是基于基礎層的活動序列參數(shù)集(SPS)中的序列層級假想?yún)⒖冀獯a器(HRD)參數(shù)的集合,以及一或多個非嵌套式補充增強信息(SEI)消息。響應于所述選定輸出操作點對應于由活動視頻參數(shù)集(VPS)的基礎VPS規(guī)定的層集合和所述層集合的時間子集中的一者,其中將僅輸出所述基礎層,所述指令也可致使計算機對所述選定輸出操作點執(zhí)行第二位流符合性測試,所述第二位流符合性測試是基于所述基礎VPS中的序列層級HRD參數(shù)的集合以及直接嵌套式SEI消息。響應于所述選定輸出操作點對應于由所述活動VPS的VPS擴展規(guī)定的輸出層集合(OLS)和所述OLS的時間子集中的一者,所述指令也可致使計算機對所述選定輸出操作點執(zhí)行第三位流符合性測試,所述第三位流符合性測試是基于所述活動VPS中的序列層級HRD參數(shù)的集合以及間接嵌套式SEI消息。

本發(fā)明的其它特征和優(yōu)點應從以實例方式說明本發(fā)明的各方面的以下描述顯而易見。

附圖說明

本發(fā)明的實施例的關于其結構與操作兩者的細節(jié)可通過研究附圖而被部分地搜集,其中相同參考標號指代相同部分,且在附圖中:

圖1是視頻譯碼系統(tǒng)的功能框圖;

圖2是圖1的視頻編碼器的功能框圖;

圖3是說明圖1的視頻解碼器的框圖;和

圖4是描述符合性測試實施方法的流程圖。

具體實施方式

一般來說,本發(fā)明描述與多層視頻譯碼中的位流符合性和互操作性改進有關的系統(tǒng)和方法。所述方法中的一些包含用信號發(fā)送簡檔、層次和層級信息,用信號發(fā)送輸出層集合,使用HRD參數(shù),以及位流符合性測試。

本發(fā)明標識當前HEVC規(guī)范關于用信號發(fā)送簡檔、層次和層級信息、用信號發(fā)送輸出層集合、使用HRD參數(shù)以及位流符合性測試的某些缺點。這些缺點中的一些包含以下各項:

可在視頻參數(shù)集(VPS)的擴展部分中用信號發(fā)送除了第0輸出層集合(OLS)以外的其它僅輸出基礎層的OLS的最優(yōu)層次和層級。僅輸出基礎層的OLS是其中僅存在一個輸出層且僅有輸出層是基礎層的OLS。不需要此類用信號發(fā)送,這是因為HEVC不需要針對在基礎VPS中用信號發(fā)送的每一層集合而在VPS擴展中用信號發(fā)送僅輸出基礎層的OLS。替代地在基礎VPS中用信號發(fā)送整個位流的簡檔、層次和層級信息。因而,從HEVC版本1的視角,在僅檢查對整個位流的僅層次和層級的約束時,對所有操作點使用其自身HRD參數(shù)執(zhí)行位流符合性測試是不理想的。這可允許除對應于整個位流的操作點以外的所有操作點的HRD參數(shù)在仍然滿足符合性測試的同時遠遠“高于”最優(yōu)。

HEVC允許在VPS擴展中用信號發(fā)送僅輸出基礎層的OLS。然而,基礎VPS已經(jīng)滿足此類作用。因此,VPS擴展中的此類用信號發(fā)送是不必要,從而引起增加的開銷。

HEVC標準不清楚非嵌套式和直接嵌套式緩沖周期(BP)、圖片時序(PT)以及關于應選擇哪些補充增強信息(SEI)消息以供在某些位流符合性測試中使用的解碼單元信息(DUI)SEI消息的適用性。

在位流符合性測試期間未清楚地規(guī)定簡檔、層次、層級(PTL)語法結構的使用。舉例來說,缺失針對僅輸出基礎層的OLS的某些位流符合性測試。hrd_parameters()語法結構和BP、PT和DUI SEI消息的使用對于某些符合性測試來說是不清楚的。

下文結合附圖闡述的詳細描述既定作為各種實施例的描述,且無意表示可實踐本發(fā)明的僅有實施例。所述詳細描述為了提供對實施例的透徹理解而包括特定細節(jié)。然而,所屬領域的技術人員將在無這些具體細節(jié)的情況下明白本發(fā)明。在一些情況下,為描述的簡潔起見,以簡化形式示出眾所周知的結構和組件。

視頻譯碼系統(tǒng)

圖1是視頻譯碼系統(tǒng)的功能框圖。視頻譯碼系統(tǒng)(“系統(tǒng)”)10可使用根據(jù)本發(fā)明中描述的方面的方法。如本文中所描述地使用,術語“視頻譯碼器”通常是指視頻編碼器和視頻解碼器兩者。在本發(fā)明中,術語“視頻譯碼”或“譯碼”通??芍敢曨l編碼和視頻解碼。

如圖1中所示,系統(tǒng)10包含源裝置12,所述源裝置可以產(chǎn)生稍后將由目的地裝置14進行解碼的經(jīng)編碼視頻數(shù)據(jù)。源裝置12和目的地裝置14可包括廣泛范圍的裝置中的任一者,包含桌上型計算機、筆記本型(即,膝上型)計算機、平板計算機、機頂盒、電話手持機(例如所謂的“智能”手機)、所謂的“智能”板、電視、相機、顯示裝置、數(shù)字媒體播放器、視頻游戲控制臺、視頻流式傳輸裝置或類似者。在一些情況下,源裝置12和目的地裝置14可經(jīng)裝備以用于無線通信。

目的地裝置14可經(jīng)由鏈路16接收待解碼的經(jīng)編碼視頻數(shù)據(jù)。鏈路16可包括能夠?qū)⒔?jīng)編碼視頻數(shù)據(jù)從源裝置12移動到目的地裝置14的任何類型的媒體或裝置。在一個實例中,鏈路16可包括使得源裝置12能夠?qū)崟r地將經(jīng)編碼視頻數(shù)據(jù)直接傳輸?shù)侥康牡匮b置14的通信媒體。源裝置12可根據(jù)例如無線通信協(xié)議的通信標準調(diào)制經(jīng)編碼視頻數(shù)據(jù),且將其傳輸?shù)侥康牡匮b置14。通信媒體可包括任何無線或有線通信媒體,例如射頻(RF)頻譜或一或多個物理傳輸線。通信媒體可形成分組網(wǎng)絡(例如,局域網(wǎng)、廣域網(wǎng)或全球網(wǎng)絡,例如因特網(wǎng))的一部分。通信媒體可包含路由器、交換機、基站或可用于促進從源裝置12到目的地裝置14的通信的任一其它設備。

可將經(jīng)編碼數(shù)據(jù)從輸出接口22輸出到存儲裝置34。類似地,可由目的地裝置14的輸入接口28從存儲裝置34存取經(jīng)編碼數(shù)據(jù)。存儲裝置34可包含多種分布式或本地存取的數(shù)據(jù)存儲媒體中的任一者,例如硬盤驅(qū)動器、藍光光盤、DVD、CD-ROM、快閃存儲器、易失性或非易失性存儲器,或用于存儲經(jīng)編碼視頻數(shù)據(jù)的任何其它合適數(shù)字存儲媒體。在另一實例中,存儲裝置34可對應于可保存由源裝置12產(chǎn)生的經(jīng)編碼視頻的文件服務器或另一中間存儲裝置。目的地裝置14可經(jīng)由流式傳輸或下載而從存儲裝置34存取所存儲的視頻數(shù)據(jù)。文件服務器可為能夠存儲經(jīng)編碼視頻數(shù)據(jù)且將所述經(jīng)編碼視頻數(shù)據(jù)傳輸?shù)侥康牡匮b置14的任何類型的服務器。實例文件服務器包含網(wǎng)絡服務器(例如,用于網(wǎng)站)、FTP服務器、網(wǎng)絡附接存儲(NAS)裝置或本地磁盤驅(qū)動器。目的地裝置14可以通過任何標準數(shù)據(jù)連接(包含因特網(wǎng)連接)來存取經(jīng)編碼視頻數(shù)據(jù)。這可包含無線信道(例如,Wi-Fi連接)、有線連接(例如,DSL、電纜調(diào)制解調(diào)器等),或適合于存取存儲在文件服務器上的經(jīng)編碼視頻數(shù)據(jù)的兩者的組合。經(jīng)編碼視頻數(shù)據(jù)從存儲裝置34的傳輸可為流式傳輸、下載傳輸或兩者的組合。

本發(fā)明的方法不必限于無線應用或設置。所述方法可應用于支持例如以下各項的多種多媒體應用中的任一者的視頻譯碼:空中電視廣播、有線電視傳輸、衛(wèi)星電視傳輸、流式視頻傳輸(例如,經(jīng)由因特網(wǎng))、對數(shù)字視頻進行編碼以存儲于數(shù)據(jù)存儲媒體上、對存儲于數(shù)據(jù)存儲媒體上的數(shù)字視頻進行解碼,或其它應用。在一些實例中,系統(tǒng)10可經(jīng)配置以支持單向或雙向視頻傳輸,以支持例如視頻流式傳輸、視頻重放、視頻廣播和/或視頻電話等應用。

在圖1的實例中,源裝置12包含視頻源18、視頻編碼器20和輸出接口22。在一些情況下,輸出接口22可包含調(diào)制器/解調(diào)器(調(diào)制解調(diào)器)和/或發(fā)射器。在源裝置12中,視頻源18可包含例如以下各項的源:視頻捕獲裝置(例如,攝像機)、含有先前所捕獲的視頻的視頻存檔、用以從視頻內(nèi)容提供者接收視頻的視頻饋送接口和/或用于產(chǎn)生計算機圖形數(shù)據(jù)以作為源視頻的計算機圖形系統(tǒng),或此類源的組合。作為一個實例,如果視頻源18是攝像機,那么源裝置12和目的地裝置14可形成所謂的相機電話或視頻電話。然而,本發(fā)明中描述的方法一般可適用于視頻譯碼,且可應用于無線和/或有線應用。

視頻編碼器20可以對所捕獲、預捕獲或計算機產(chǎn)生的視頻進行編碼。另外,在一些實施例中,視頻解碼器30可基于第一位流的參數(shù)集ID和唯一參數(shù)集ID區(qū)分第一位流與第二位流。在其它實例中,源裝置12的輸出接口22可經(jīng)由鏈路16將經(jīng)編碼視頻數(shù)據(jù)直接傳輸?shù)侥康牡匮b置14。經(jīng)編碼視頻數(shù)據(jù)還可(或替代地)存儲到存儲裝置34上以供稍后被目的地裝置14或其它裝置存取,以用于解碼和/或重放。

目的地裝置14包含輸入接口28、視頻解碼器30和顯示裝置32。在一些情況下,輸入接口28可包含接收器和/或調(diào)制解調(diào)器。目的地裝置14的輸入接口28經(jīng)由鏈路16接收經(jīng)編碼視頻數(shù)據(jù)。經(jīng)由鏈路16傳送或提供于存儲裝置34上的經(jīng)編碼視頻數(shù)據(jù)可包含由視頻編碼器20產(chǎn)生的多種語法元素以供例如視頻解碼器30的視頻解碼器在解碼視頻數(shù)據(jù)時使用。此類語法元素可與在通信媒體上傳輸、存儲于存儲媒體上或存儲文件服務器的經(jīng)編碼視頻數(shù)據(jù)包含在一起。

顯示裝置32可與目的地裝置14集成或者在目的地裝置14外部。在一些實例中,目的地裝置14可包含集成顯示裝置,并且還經(jīng)配置以與外部顯示裝置介接。在其它實例中,目的地裝置14可為顯示裝置。一般來說,顯示裝置32將經(jīng)解碼視頻數(shù)據(jù)顯示給用戶,且可包括多種顯示裝置中的任一者,例如液晶顯示器(LCD)、等離子顯示器、有機發(fā)光二極管(OLED)顯示器或另一類型的顯示裝置。

視頻編碼器20和視頻解碼器30各自可實施為多種合適的編碼器電路中的任一者,例如一或多個微處理器、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)、離散邏輯、軟件、硬件、固件或其任何組合。當所述方法部分地實施于軟件中時,裝置可將軟件的指令存儲于適合的非暫時性計算機可讀媒體上并且使用一或多個處理器執(zhí)行硬件中的指令以執(zhí)行本發(fā)明的方法。視頻編碼器20和視頻解碼器30中的每一者可包含在一或多個編碼器或解碼器中,其中的任一者可集成為相應裝置中的組合式編碼器/解碼器(編碼解碼器)的一部分。

HEVC標準化努力是基于被稱為HEVC測試模型(HM)的視頻譯碼裝置的進化的模型。HM假設視頻譯碼裝置相對于根據(jù)例如ITU-T H.264/AVC的現(xiàn)有裝置的若干額外能力。舉例來說,雖然H.264提供了九種幀內(nèi)預測編碼模式,但HM可提供多達三十三種幀內(nèi)預測編碼模式。

一般來說,HM的工作模型描述視頻幀或圖片可以分成包含明度和色度樣本兩者的樹塊或最大譯碼單元(LCU)序列。樹塊具有與H.264標準的宏塊類似的目的。切片包含按譯碼次序的若干連續(xù)樹塊。視頻幀或圖片可以被分割成一或多個切片。每一樹塊可以根據(jù)四叉樹拆分成譯碼單元(CU)。舉例來說,作為四叉樹的根節(jié)點的樹塊可拆分成四個子節(jié)點,且每一子節(jié)點又可為父代節(jié)點且可拆分成另外四個子節(jié)點。最后的未經(jīng)拆分的子節(jié)點(作為四叉樹的葉節(jié)點)包括譯碼節(jié)點,即經(jīng)譯碼視頻塊。與經(jīng)譯碼位流相關聯(lián)的語法數(shù)據(jù)可界定樹塊可拆分的最大次數(shù),且還可界定譯碼節(jié)點的最小大小。

CU包含譯碼節(jié)點和與所述譯碼節(jié)點相關聯(lián)的預測單元(PU)和變換單元(TU)。CU的大小對應于譯碼節(jié)點的大小并且形狀必須是正方形。CU的大小可介于從8×8像素到高達具有64×64像素或更大像素的最大值的樹塊的大小的范圍內(nèi)。每一CU可以含有一或多個PU和一或多個TU。舉例來說,與CU相關聯(lián)的語法數(shù)據(jù)可描述CU分割成一或多個PU。分割模式可在CU是被跳過還是經(jīng)直接模式編碼、幀內(nèi)預測模式編碼或幀間預測模式編碼之間不同。PU可以分割成非正方形形狀。舉例來說,與CU相關聯(lián)的語法數(shù)據(jù)還可描述CU根據(jù)四叉樹分割成一或多個TU。TU可為正方形或非正方形形狀。

HEVC標準允許根據(jù)TU的變換,TU可針對不同CU而有所不同??苫卺槍?jīng)分割LCU定義的給定CU內(nèi)的PU的大小而對TU進行大小設定,但是情況可能并不總是如此。TU可與PU大小相同或小于PU。在一些實例中,可以使用被稱為“殘余四叉樹”(RQT)的四叉樹結構將對應于CU的殘余樣本細分成較小單元。RQT的葉節(jié)點可被稱為變換單元(TU)。可以變換與TU相關聯(lián)的像素差值以產(chǎn)生變換系數(shù),所述變換系數(shù)可經(jīng)量化。

一般來說,PU包含與預測程序有關的數(shù)據(jù)。舉例來說,當PU經(jīng)幀內(nèi)模式編碼時,PU可以包含描述PU的幀內(nèi)預測模式的數(shù)據(jù)。作為另一實例,當PU經(jīng)幀間模式編碼時,PU可包含定義PU的運動向量的數(shù)據(jù)。舉例來說,定義PU的運動向量的數(shù)據(jù)可以描述運動向量的水平分量、運動向量的垂直分量、運動向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、運動向量指向的參考圖片和/或運動向量的參考圖片列表(例如,列表0、列表1或列表C)。

一般來說,TU用于變換和量化過程。具有一或多個PU的給定CU還可以包含一或多個變換單元(TU)。在預測之后,視頻編碼器20可計算對應于PU的殘余值。殘余值包括像素差值,所述像素差值可變換成變換系數(shù)、經(jīng)量化且使用TU進行掃描以產(chǎn)生串行化變換系數(shù)以用于熵譯碼。如本文所使用,術語“視頻塊”通??芍窩U的譯碼節(jié)點。在一些特定情況下,本發(fā)明還可使用術語“視頻塊”指代包含譯碼節(jié)點以及PU和TU的樹塊,即LCU或CU。

視頻編碼器20可產(chǎn)生包含經(jīng)編碼視頻數(shù)據(jù)的位流。位流可包含一系列網(wǎng)絡抽象層(NAL)單元。位流的NAL單元可包含視頻譯碼層(VCL)NAL單元和非VCL NAL單元。VCL NAL單元可包含圖片的經(jīng)譯碼切片。非VCL NAL單元可包含VPS、序列參數(shù)集(SPS)、圖片參數(shù)集(PPS)、SEI或其它類型的數(shù)據(jù)。VPS是可含有適用于0或大于0個完整經(jīng)譯碼視頻序列的語法元素的語法結構。SPS是可含有適用于0或大于0個完整經(jīng)譯碼視頻序列的語法元素的語法結構。單個VPS可適用于多個SPS。PPS為可含有適用于0或大于0個完整經(jīng)譯碼圖片的語法元素的語法結構。單個SPS可適用于多個PPS。VPS、SPS和PPS的各個方面可大體上如HEVC標準所定義地形成。視頻編碼器20可使用SEI消息以在位流中包含正確解碼圖片的樣本值所不需要的元數(shù)據(jù)。然而,視頻解碼器30或其它裝置可將包含于SEI消息中的元數(shù)據(jù)用于各種其它目的。舉例來說,視頻解碼器30可將SEI消息中的元數(shù)據(jù)用于圖片輸出時序、圖片顯示、丟失檢測和差錯隱藏。

高層級語法

NAL單元可含有由視頻編碼器20進行編碼并且傳輸?shù)揭曨l解碼器30的語法元素。描述位流的結構或提供適用于多個圖片或適用于圖片內(nèi)的多個經(jīng)譯碼塊區(qū)域的信息的語法元素(例如參數(shù)集(例如,SPS、VPS、PPS等))、參考圖片管理語法以及SEI消息被稱為HEVC的“高層級語法”(HLS)部分。

特定來說,HEVC采用與本發(fā)明相關的以下方面:

參數(shù)集結構:參數(shù)集含有可被共享以用于對經(jīng)解碼視頻的數(shù)個區(qū)域的解碼的信息。參數(shù)集結構提供用于傳達解碼過程所必需的數(shù)據(jù)的穩(wěn)固機制。

補充增強信息(SEI):語法包含對被稱為SEI的各種類型的元數(shù)據(jù)的支持。此類數(shù)據(jù)提供關于視頻圖片的時序的信息、對在視頻信號中使用的色彩空間的適當解釋、3-D立體幀填充信息、其它顯示提示信息等。

圖2是圖1的視頻編碼器的功能框圖。視頻編碼器20可包含分割模塊35,所述分割模塊經(jīng)配置以接收所捕獲的視頻數(shù)據(jù)并且將所述視頻數(shù)據(jù)分割成視頻塊。分割模塊35可將視頻數(shù)據(jù)分割成切片、圖塊或其它較大單元。分割模塊35也可例如根據(jù)LCU和CU的四叉樹結構來分割視頻塊。視頻編碼器20可將切片分成多個視頻塊(并且可能分成被稱為圖塊的視頻塊的集合)。

視頻編碼器20也可具有可操作地耦合到分割模塊35且經(jīng)配置以接收經(jīng)分割的視頻數(shù)據(jù)的預測模塊41。預測模塊41可基于差錯結果(例如,譯碼速率和失真的水平)選擇多個可能的譯碼模式中的一者(例如,多個幀內(nèi)譯碼模式中的一者或多個幀間譯碼模式中的一者)以用于當前視頻塊。預測模塊41可允許視頻編碼器20執(zhí)行視頻切片內(nèi)的視頻塊的幀內(nèi)和幀間譯碼。幀內(nèi)譯碼依賴于空間預測來減少或去除給定視頻幀或圖片內(nèi)的視頻中的空間冗余。幀間譯碼依賴于時間預測來減少或去除視頻序列的鄰近幀或圖片內(nèi)的視頻中的時間冗余。幀內(nèi)模式(I模式)可指若干基于空間壓縮模式中的任一者。例如單向預測(P模式)或雙向預測(B模式)的幀間模式可指代若干基于時間的壓縮模式中的任一者。

預測模塊41可包含運動估計模塊42、運動補償模塊44和幀內(nèi)預測模塊46。這些組件中的每一者可以可操作地連接或集成在視頻編碼器20內(nèi)的一或多個處理器中。雖然出于概念性目的單獨地論述,但是運動估計模塊42、運動補償模塊44和幀內(nèi)預測模塊46可高度集成。

運動估計模塊42可經(jīng)配置以根據(jù)用于視頻序列的預定模式確定用于視頻切片的幀間預測模式。當前視頻塊相對于一或多個參考圖片中的一或多個預測塊的此類幀間預測或幀間預測譯碼可以提供時間壓縮。預定模式可將序列中的視頻切片標明為P切片、B切片或GPB切片。如本文所使用,運動估計通??芍府a(chǎn)生運動向量的過程,所述過程估計視頻塊的運動。舉例來說,運動向量可指示當前視頻幀或圖片內(nèi)的視頻塊的PU相對于參考幀或參考圖片內(nèi)的預測塊的位移。參考幀可存儲在可操作地耦合到預測模塊41的參考圖片存儲器64中。參考幀存儲器64可進一步包含或在本文中被稱為經(jīng)解碼圖片緩沖器(DPB)。參考幀存儲器64或DPB可在濾波器模塊63對經(jīng)重構譯碼塊執(zhí)行解塊操作之后存儲經(jīng)重構的譯碼塊。

預測塊是被發(fā)現(xiàn)在像素差方面與待譯碼視頻塊的PU密切匹配的塊,所述像素差可通過絕對差總和(SAD)、平方差總和(SSD)或其它差異度量來確定。在一些實例中,運動預測模塊(“預測模塊”)41可計算存儲在參考圖片存儲器64中的參考圖片的子整數(shù)像素位置的值。舉例來說,預測模塊41可內(nèi)插參考圖片的四分之一像素位置、八分之一像素位置或其它分數(shù)像素位置的值。因此,運動估計模塊42可執(zhí)行相對于全像素位置和分數(shù)像素位置的運動搜索并且輸出具有分數(shù)像素精度的運動向量。

運動估計模塊42可通過比較PU的位置與參考圖片的預測塊的位置來計算經(jīng)幀間譯碼切片中的視頻塊的PU的運動向量。參考圖片可選自第一參考圖片列表(列表0)或第二參考圖片列表(列表1),其中的每一者標識存儲在參考圖片存儲器64中的一或多個參考圖片。運動估計模塊42可將所計算的運動向量發(fā)送到運動補償模塊44和熵編碼模塊56。

運動補償可涉及基于通過運動估計確定的運動向量提取或產(chǎn)生預測塊。這可包含到子像素精度的內(nèi)插。在接收到當前視頻塊的PU的運動向量后,運動補償模塊44可在參考圖片列表中的一者中定位運動向量指向的預測塊。運動補償模塊44還可產(chǎn)生與視頻塊和視頻切片相關聯(lián)的語法元素以供視頻解碼器30在對視頻切片的視頻塊進行解碼時使用。

預測模塊41內(nèi)的幀內(nèi)預測模塊46可執(zhí)行當前視頻塊相對于同一幀或切片中的一或多個相鄰塊的幀內(nèi)預測譯碼以提供空間壓縮。作為對如上文所描述的通過運動估計模塊42和運動補償模塊44執(zhí)行的幀間預測的替代方案,幀內(nèi)預測模塊46可對當前塊進行幀內(nèi)預測。特定來說,幀內(nèi)預測模塊46可確定用來對當前塊進行編碼的幀內(nèi)預測模式。在一些實例中,幀內(nèi)預測模塊46可例如在單獨的編碼遍次期間使用各種幀內(nèi)預測模式對當前塊進行編碼。舉例來說,幀內(nèi)預測模塊46可使用速率-失真分析計算各個經(jīng)測試幀內(nèi)預測模式的速率-失真值,并且從所述經(jīng)測試模式當中選擇具有最優(yōu)速率-失真特性的幀內(nèi)預測模式。速率-失真分析可確定經(jīng)編碼塊與經(jīng)編碼以產(chǎn)生所述經(jīng)編碼塊的原始的未經(jīng)編碼塊之間的失真(或誤差)的量,以及用于產(chǎn)生經(jīng)編碼塊的位速率(即,位數(shù))。幀內(nèi)預測模塊46可從各個經(jīng)編碼塊的失真和速率計算比率,以確定哪個幀內(nèi)預測模式對于所述塊呈現(xiàn)最優(yōu)速率失真值。

幀內(nèi)預測模塊46可將指示用于所述塊的選定幀內(nèi)預測模式的信息提供到熵編碼模塊56。熵編碼模塊56可對指示選定幀內(nèi)預測模式的信息進行編碼。視頻編碼器20可在傳輸?shù)奈涣髦邪渲脭?shù)據(jù),所述配置數(shù)據(jù)可包含多個幀內(nèi)預測模式索引表和多個經(jīng)修改的幀內(nèi)預測模式索引表(也被稱作碼字映射表)、對各種塊的編碼上下文的定義,以及對將用于所述上下文中的每一者的最可能幀內(nèi)預測模式、幀內(nèi)預測模式索引表和經(jīng)修改的幀內(nèi)預測模式索引表的指示。

在預測模塊41經(jīng)由幀間預測或幀內(nèi)預測產(chǎn)生用于當前視頻塊的預測塊之后,視頻編碼器20通過從當前視頻塊減去預測塊來形成殘余視頻塊。此過程可產(chǎn)生像素差值。所述像素差值形成所述塊的殘余數(shù)據(jù),并且可包含明度和色度差分量兩者。可操作地耦合到預測模塊41和分割模塊35的求和器50表示可經(jīng)配置以執(zhí)行此減法運算的一或多個組件。

殘余塊中的殘余視頻數(shù)據(jù)可包含在一或多個TU中且應用到可操作地耦合到求和器50的變換模塊52。變換模塊52可使用例如離散余弦變換(DCT)或概念上類似的變換的變換將殘余視頻數(shù)據(jù)變換成殘余變換系數(shù)。變換模塊52可將殘余視頻數(shù)據(jù)從像素域轉(zhuǎn)換到變換域,例如頻域。預測模塊41可將所得的經(jīng)幀內(nèi)或幀間譯碼塊提供到求和器50以產(chǎn)生殘余塊數(shù)據(jù)。所得的經(jīng)幀內(nèi)或幀間譯碼塊可另外提供到求和器62以重構經(jīng)編碼塊用作參考圖片。

視頻編碼器20也可包含可操作地耦合到求和器62的濾波器模塊63。濾波器模塊63可表示一或多個環(huán)路濾波器,例如解塊濾波器、自適應環(huán)路濾波器(ALF)和樣本自適應偏移(SAO)濾波器。盡管濾波器模塊63在圖2中展示為環(huán)內(nèi)濾波器,但在其它配置中,濾波器模塊63可實施為環(huán)路后濾波器(post loop filter)。濾波器模塊63可將參考圖片提供到參考圖片存儲器64。

變換模塊52可將所得變換系數(shù)發(fā)送到量化模塊54。量化模塊54可對變換系數(shù)進行量化以進一步降低位速率。量化過程可減少與系數(shù)中的一些或全部相關聯(lián)的位深度??赏ㄟ^調(diào)整量化參數(shù)修改量化的程度。在一些實例中,量化模塊54接著可執(zhí)行對包含對經(jīng)量化變換系數(shù)的矩陣的掃描。在一些實施例中,熵編碼模塊56可執(zhí)行所述掃描。

在量化之后,熵編碼模塊56可對經(jīng)量化的變換系數(shù)進行熵編碼。舉例來說,熵編碼模塊56可執(zhí)行上下文自適應可變長度譯碼(CAVLC)、上下文自適應二進制算術譯碼(CABAC)、基于語法的上下文自適應二進制算術譯碼(SBAC)、概率區(qū)間分割熵(PIPE)譯碼或另一熵編碼方法。視頻編碼器20還可對與經(jīng)編碼視頻數(shù)據(jù)相關聯(lián)的語法元素進行熵編碼以供視頻解碼器30在解碼視頻數(shù)據(jù)時使用。

在通過熵編碼模塊56進行熵編碼之后,經(jīng)編碼位流可傳輸?shù)揭曨l解碼器30。位流也可存檔以用于稍后的傳輸或由視頻解碼器30檢索。熵編碼模塊56還可對正被譯碼的當前視頻切片的運動向量和其它語法元素進行熵編碼。

視頻編碼器20也可包含可操作地耦合到熵編碼模塊56的逆量化模塊58。逆變換模塊60也可以可操作地耦合到逆量化模塊58和求和器62。逆量化模塊58和逆變換模塊60可分別應用逆量化和逆變換以在像素域中重構殘余塊,以供稍后用作參考圖片的參考塊。運動補償模塊44可通過將殘余塊添加到參考圖片列表中的一者內(nèi)的參考圖片中的一者的預測塊中來計算參考塊。求和器62可將經(jīng)重構的殘余塊添加到由運動補償模塊44產(chǎn)生的經(jīng)運動補償預測塊以產(chǎn)生參考塊用于存儲在參考圖片存儲器64中。參考塊可由運動估計模塊42和運動補償模塊44用作參考塊以對后續(xù)視頻幀或圖片中的塊進行幀間預測。

在一些實例中,視頻編碼器20產(chǎn)生位流。由視頻編碼器20產(chǎn)生的位流可包含可作為子位流從位流中提取的多個操作點。操作點可包含例如多個層和/或視圖以及多個幀速率。視頻編碼器20可對指示VPS中的輸出操作點的信息進行編碼。在一些實例中,對于視頻編碼器20在VPS中用信號發(fā)送的與位流相關聯(lián)的操作點中的每一者,操作點語法結構規(guī)定用以標識位流中的屬于給定操作點的子位流的NAL單元的層標識符(ID)的集合。以此方式,可基于NAL單元的層標識符從原始位流提取組成給定操作點的子位流的NAL單元。

在一些情況下,如下文更詳細地論述,視頻編碼器20可進一步對與所述操作點中的一或多者有關的HRD參數(shù)進行編碼。在此情況下,視頻編碼器20在VPS中用信號發(fā)送HRD參數(shù)信息。視頻編碼器20可含有HRD的實施方案以確保所產(chǎn)生的每一位流是相符位流。HRD實施方案也可為例如解碼器(例如,視頻解碼器30)和位流分析器的其它實體的一部分以檢查位流是否為相符位流。如下文更詳細地論述,對于具有HRD參數(shù)的一或多個操作點中的每一者,HRD參數(shù)語法結構可規(guī)定定義用以檢查給定操作點的子位流的符合性的HRD的HRD參數(shù)的集合。

如本文所使用,操作點是通過將另一位流、目標最高temporal_ID和目標層標識符列表作為輸入的子位流提取過程的操作從另一位流形成的位流。更具體來說,“操作點”是可從在時間上可縮放以及/或具有多個層和/或視圖的原始位流中提取的子位流。也就是說,操作點是通過將另一位流、目標最高時間ID和目標層標識符列表作為輸入的子位流提取過程的操作從另一位流形成的位流。所述位流包含一或多個視圖,其包含操作點的一或多個視圖。目標最高temporal_ID定義時間子集。目標層列表包含層的集合:針對操作點的待解碼的層的集合,以及針對輸出操作點的待輸出的層的集合。輸出操作點尤其是與輸出層(即,在輸出層集合中標識的層,其為待輸出的層)的集合相關聯(lián)。一般來說,每一位流可含有一或多個輸出層集合。每一輸出層集合可含有一或多個輸出操作點。對每一輸出操作點執(zhí)行位流符合性測試以確保對應的子位流是相符位流。

術語“層集合”用以指代待解碼的層的集合。“層集合”類似于操作點,不同之處在于層集合并不與時間ID的特定值相關聯(lián)。實情為,存在于所述層中的時間子層全部關于所述層集合。類似地,層集合可被稱為與最高可能的時間ID相關聯(lián)。因此,存在于所述層中的時間子層全部屬于所述層集合??梢耘c可從位流導出操作點的方式相同的方式從位流導出層集合,其中最高時間ID為最高的可能值。

術語“輸出層集合”是指規(guī)定輸出層的層集合。因此,雖然待解碼的層的集合被規(guī)定為層集合,但是待輸出的層的集合是針對輸出層集合規(guī)定的。在一些實例中,輸出層集合通過包含到對應的層集合的索引來標識對應的層集合,其中對應的層集合標識待解碼的層。在其它實例中,輸出層集合以某一其它方式標識對應的層集合。

不為輸出為目標的層集合中的層例如在用于層間(或視圖間)預測時仍然可被解碼。以輸出為目標的層是待解碼的層的子集:待解碼的層中的一個、一些或全部可以輸出為目標。應理解,術語“子集”不一定意味著待輸出的層是待解碼的層的嚴格的子集。也就是說,在一些實例中,待解碼的層與待輸出的層是相同的。因此,如上文所描述,輸出層集合與輸出操作點之間的區(qū)別類似于層集合與操作點之間的區(qū)別。

可基于標識位流的輸出操作點的層標識符(標識輸出操作點的層)和時間子層標識符(標識輸出操作點的時間子集)的值從位流中提取子位流??稍谖涣鲀?nèi)的VPS中用信號發(fā)送輸出操作點。對于操作點中的每一者,操作點語法結構規(guī)定用以標識位流中的屬于給定操作點的子位流的網(wǎng)絡抽象層(NAL)單元的層標識符的集合。以此方式,可基于NAL單元的層標識符和與輸出操作點相關聯(lián)最高時間ID從原始位流提取組成給定輸出操作點的子位流的NAL單元。NAL單元是經(jīng)譯碼視頻數(shù)據(jù)的組分;經(jīng)譯碼視頻數(shù)據(jù)經(jīng)組織成NAL單元。

圖3是說明圖1的視頻解碼器的框圖。出于解釋的目的,本發(fā)明描述在HEVC譯碼的上下文中的視頻解碼器30。然而,本發(fā)明可適用于其它譯碼標準或方法。

視頻解碼器30可包含熵解碼模塊70、預測模塊71、逆量化模塊76、逆變換模塊78、求和器80、濾波器模塊84和經(jīng)解碼圖片緩沖器(DPB)82。預測模塊71可包含運動補償模塊72和幀內(nèi)預測模塊74。在其它實例中,視頻解碼器30可包含更多、更少或不同功能組件。

經(jīng)譯碼圖片緩沖器(CPB)90可接收且存儲位流的經(jīng)編碼視頻數(shù)據(jù)(例如,NAL單元)。熵解碼模塊70可從CPB 90接收NAL單元,且解析NAL單元以解碼語法元素。熵解碼模塊70可對NAL單元中的經(jīng)熵編碼語法元素進行熵解碼。預測模塊71、逆量化模塊76、逆變換模塊78、求和器80和濾波器模塊84可基于從位流提取的語法元素產(chǎn)生經(jīng)解碼視頻數(shù)據(jù)。

位流的NAL單元可包含經(jīng)譯碼切片NAL單元。作為對位流進行解碼的一部分,熵解碼模塊70可從經(jīng)譯碼切片NAL單元提取語法元素并且對所述語法元素進行熵解碼。經(jīng)譯碼切片中的每一者可包含切片標頭和切片數(shù)據(jù)。切片標頭可含有關于切片的語法元素。切片標頭中的語法元素可包含標識與含有切片的圖片相關聯(lián)的PPS的語法元素。

除了對來自位流的語法元素進行解碼之外,視頻解碼器30還可對未經(jīng)分割的CU執(zhí)行重構操作。為了對未分割的CU執(zhí)行重構操作,視頻解碼器30可對CU的每一TU執(zhí)行重構操作。通過對CU的每一TU執(zhí)行重構操作,視頻解碼器30可重構CU的殘余塊。

作為對CU的TU執(zhí)行重構操作的一部分,逆量化模塊76可逆量化(即,解量化)與TU相關聯(lián)的系數(shù)塊。逆量化模塊76可使用與TU的CU相關聯(lián)的量化參數(shù)(QP)值確定量化的程度,以及同樣地逆量化單元模塊76將應用的逆量化的程度。也就是說,可通過調(diào)整在量化變換系數(shù)時所使用的QP的值來控制壓縮比,即用以表示原始序列與經(jīng)壓縮序列的位的數(shù)目的比率。壓縮比還可取決于所采用的熵譯碼的方法。

在逆量化模塊76逆量化系數(shù)塊之后,逆變換模塊78可將一或多個逆變換應用于系數(shù)塊以便產(chǎn)生與TU相關聯(lián)的殘余塊。舉例來說,逆變換模塊78可將逆DCT、逆整數(shù)變換、逆定向變換或另一逆變換應用于系數(shù)塊。

如果使用幀內(nèi)預測對PU進行編碼,那么幀內(nèi)預測模塊74可執(zhí)行幀內(nèi)預測以產(chǎn)生用于PU的預測塊。幀內(nèi)預測模塊74可使用幀內(nèi)預測模式,以基于空間上相鄰的PU的預測塊產(chǎn)生PU的預測性亮度、Cb和Cr塊。幀內(nèi)預測模塊74可基于從位流解碼的一或多個語法元素確定用于PU的幀內(nèi)預測模式。

預測模塊71可基于從位流提取的語法元素來構建第一參考圖片列表(RefPicList0)和第二參考圖片列表(RefPicList1)。此外,如果使用幀間預測對PU進行編碼,那么熵解碼模塊70可提取用于PU的運動信息。運動補償模塊72可基于PU的運動信息確定用于PU的一或多個參考區(qū)。運動補償模塊72可基于PU的一或多個參考塊處的樣本塊產(chǎn)生用于PU的預測性亮度、Cb和Cr塊。

求和器80可在適當時使用與CU的TU相關聯(lián)的亮度、Cb和Cr變換塊以及CU的PU的預測性亮度、Cb和Cr塊(即,幀內(nèi)預測數(shù)據(jù)或幀間預測數(shù)據(jù))來重構CU的亮度、Cb和Cr譯碼塊。舉例來說,求和器80可將亮度、Cb和Cr變換塊的樣本添加到預測性亮度、Cb和Cr塊的對應的樣本以重構CU的亮度、Cb和Cr譯碼塊。

濾波器模塊84可為例如解塊濾波器,并且執(zhí)行解塊操作以減小與CU的亮度、Cb和Cr譯碼塊相關聯(lián)的成塊假象。視頻解碼器30接著可將CU的亮度、Cb和Cr譯碼塊存儲在經(jīng)解碼圖片緩沖器82中。經(jīng)解碼圖片緩沖器82可提供參考圖片以用于后續(xù)運動補償、幀內(nèi)預測和呈現(xiàn)在顯示裝置(例如,圖1的顯示裝置32)上。舉例來說,視頻解碼器30可基于經(jīng)解碼圖片緩沖器82中的亮度、Cb和Cr塊對其它CU的PU執(zhí)行幀內(nèi)預測或幀間預測操作。因此,視頻解碼器30可從位流解碼顯著亮度系數(shù)塊的變換系數(shù)層級,逆量化變換系數(shù)層級,對變換系數(shù)層級應用變換以產(chǎn)生變換塊、至少部分基于變換塊而產(chǎn)生譯碼塊,且輸出譯碼塊以用于顯示。

子位流提取

視頻譯碼標準可包含支持子位流提取過程的各種特征。舉例來說,位流的視頻數(shù)據(jù)可分成層的集合。對于所述層中的每一者,較低層中的數(shù)據(jù)可在不參考任何較高層中的數(shù)據(jù)的情況下被解碼。個別NAL單元僅封裝單個層的數(shù)據(jù)。因此,可將封裝位流的剩余的最高層的數(shù)據(jù)的NAL單元從位流去除,而不影響位流的剩余的較低層中的數(shù)據(jù)的可解碼性。在SVC、SHVC和其它可縮放視頻譯碼方法中,較高層可包含改進較低層中的圖片的質(zhì)量(質(zhì)量可縮放性)、放大較低層中的圖片的空間格式(空間可縮放性)或增加較低層中的圖片的時間速率(時間可縮放性)的增強數(shù)據(jù)。在MVC、MV-HEVC和其它三維視頻譯碼中,較高層可包含額外視圖。

NAL單元可規(guī)定NAL單元的時間標識符。如果第一NAL單元的時間標識符小于第二NAL單元的時間標識符,那么可在不參考由第二NAL單元封裝的數(shù)據(jù)的情況下解碼由第一NAL單元封裝的數(shù)據(jù)。

位流的每一操作點與層標識符的集合和時間標識符相關聯(lián)。層標識符的集合可標示為OpLayerIdSet,且時間標識符可標示為TemporalId。如果NAL單元的層標識符在操作點的層標識符的集合中,且NAL單元的時間標識符小于或等于所述操作點的時間標識符,那么所述NAL單元與所述操作點相關聯(lián)。子位流是與操作點相關聯(lián)的位流子集。子位流可包含與操作點相關聯(lián)的每一NAL單元。子位流不包含不與操作點相關聯(lián)的VCL NAL單元。

假想?yún)⒖冀獯a器

視頻譯碼標準規(guī)定視頻緩沖模型(其也被稱為HRD)。HRD描述資料經(jīng)緩沖以用于解碼的方式和經(jīng)解碼資料經(jīng)緩沖以用于輸出的方式。舉例來說,HRD描述視頻譯碼系統(tǒng)10的CPB和DPB的操作。CPB和DPB可分別包括CPB 90(圖3)和參考圖片存儲器64(圖2)。在一些實施例中,所述DPB也可類似于DPB 82(圖3)。CPB可為含有按HRD所規(guī)定的解碼次序的存取單元的先進先出緩沖器。DPB為保存經(jīng)解碼圖片以用于由HRD規(guī)定的參考、輸出重排序或輸出延遲的緩沖器。

視頻編碼器20可用信號發(fā)送序列層級HRD參數(shù)的集合。序列層級HRD參數(shù)控制HRD的各個方面。序列層級HRD參數(shù)包含初始CPB去除延遲、CPB大小、位速率、初始DPB輸出延遲和DPB大小。這些序列層級HRD參數(shù)在VPS和/或SPS中規(guī)定的hrd_parameters()語法結構中經(jīng)譯碼??稍贐P、PT或DUI SEI消息中規(guī)定圖片層級或子圖片層級HRD參數(shù)。

(例如操作點的)子位流可具有不同于其原始位流的幀速率和/或位速率。這是因為子位流可不包含一些圖片和/或原始位流的一些數(shù)據(jù)。因此,如果視頻解碼器20以處理原始位流的特定速率從CPB和/或DPB去除數(shù)據(jù)以及如果視頻解碼器30以與處理子位流相同的速率從CPB和/或DPB去除數(shù)據(jù),那么視頻解碼器30可從CPB和/或DPB去除太多或太少數(shù)據(jù)。因此,視頻編碼器20可用信號發(fā)送不同操作點的不同HRD參數(shù)的集合。在HEVC中,視頻編碼器20可在VPS中用信號發(fā)送HRD參數(shù)的集合,或視頻編碼器20可在SPS中用信號發(fā)送HRD參數(shù)的集合。

在HEVC的某些版本中,僅選擇VPS中的HRD參數(shù)的集合以用于HRD操作。也就是說,雖然可在SPS中提供HRD參數(shù),但是HEVC視頻解碼器不選擇SPS中的HRD參數(shù)的集合用于HRD操作。視頻解碼器30可解析和解碼位流的VPS。因此,視頻解碼器30可解析和解碼VPS的HRD參數(shù)的集合。這不管位流是否包含非基礎層NAL單元都可能發(fā)生。

視頻編碼器20可產(chǎn)生包含適用于圖片序列的SPS的位流。在一些實施例中,SPS包含HRD參數(shù)的集合。HRD參數(shù)的集合適用于位流的具有匹配目標層標識符的集合的層標識符的集合的每一操作點。因此,SPS中的HRD參數(shù)的集合不被浪費,而是實際上可用于HRD操作。舉例來說,裝置可從VPS中的HRD參數(shù)的集合和SPS中的HRD參數(shù)的集合當中選擇適用于特定操作點的HRD參數(shù)的集合。視頻編碼器20可至少部分地基于適用于特定操作點的HRD參數(shù)的集合執(zhí)行位流符合性測試,其測試與特定操作點相關聯(lián)的位流子集符合視頻譯碼標準。

視頻編碼器20、視頻解碼器30或另一類型的裝置(例如內(nèi)容遞送網(wǎng)絡(CDN)裝置、媒體感知網(wǎng)絡元件(MANE))可對操作點的子位流執(zhí)行位流符合性測試。所述位流符合性測試可驗證子位流符合視頻譯碼標準,例如HEVC。

在H.264/AVC和HEVC中,將位流符合性和解碼器符合性規(guī)定為HRD規(guī)范的一部分。HRD模型規(guī)定用以確定位流是否符合標準的測試以及用以確定解碼器是否符合標準的測試。雖然HRD被稱為一種的解碼器,但視頻編碼器20可使用HRD保證位流符合性,而視頻解碼器30可實際上不需要HRD。

兩種類型(即I型和II型)的位流子集經(jīng)歷HRD符合性。I型位流為僅含有用于位流中的所有存取單元的VCL NAL單元和填充數(shù)據(jù)NAL單元的NAL單元流。II型位流是除用于位流中的所有存取單元的VCL NAL單元和填充符數(shù)據(jù)NAL單元之外還含有以下各項中的至少一者的NAL單元流:不同于填充符數(shù)據(jù)NAL單元的額外非VCL NAL單元;和從NAL單元流形成字節(jié)流的所有l(wèi)eading_zero_8bits、zero_byte、start_coded_prefix_one_3bytes和trailing_zero_8bits語法元素。

當裝置(例如,視頻編碼器20)執(zhí)行確定位流是否符合視頻譯碼標準的位流符合性測試時,所述裝置可選擇位流的操作點。所述裝置接著可確定適用于選定操作點的HRD參數(shù)的集合。所述裝置可使用適用于選定操作點的HRD參數(shù)的集合配置HRD的行為。更特定來說,所述裝置可使用適用的HRD參數(shù)的集合來配置HRD的特定組件的行為,例如假想流調(diào)度程序(HSS)、CPB、解碼過程、DPB等。

此外,所述裝置可調(diào)用對CPB 90中的經(jīng)譯碼視頻數(shù)據(jù)進行解碼的解碼過程。所述解碼過程可將經(jīng)解碼圖片輸出到DPB 82。在所述裝置移動數(shù)據(jù)通過HRD時,所述裝置可確定特定約束的集合是否保持被滿足。舉例來說,所述裝置可確定在HRD對選定操作點的子位流進行解碼時在CPB 90或DPB 82中是否會發(fā)生溢出或下溢狀況。所述裝置可以此方式選擇和處理位流的每一操作點。如果沒有位流的操作點會致使違反約束條件,那么所述裝置可確定位流符合視頻譯碼標準。

H.264/AVC和HEVC二者都規(guī)定兩種類型的解碼器符合性,即輸出時序解碼器符合性和輸出次序解碼器符合性。符合具體簡檔、層次和層級(PTL)的解碼器(例如,視頻解碼器30)能夠成功地解碼符合視頻譯碼標準(例如HEVC)的位流符合性要求的所有位流。如本文中所使用,“簡檔”通??芍肝涣髡Z法的子集??稍诿恳缓啓n內(nèi)規(guī)定“層次”和“層級”。層次的級可為強加于位流中的語法元素的值的經(jīng)規(guī)定的約束的集合。此類約束可為對各種值的簡單限制。替代地,其可呈對值的算術組合的約束形式(例如,圖片寬度乘以圖片高度乘以每秒解碼的圖片的數(shù)目)。針對較低層次規(guī)定的層級比針對較高層次規(guī)定的層級受到更多約束。

HEVC標準基于視頻數(shù)據(jù)的內(nèi)容規(guī)定位流符合性測試的兩個集合。位流符合性測試的第一集合是用于測試整個位流和其時間子集的符合性,而不管是否存在由活動VPS所規(guī)定的含有存在于整個位流中的VCL NAL單元的所有nuh_layer_id值的層集合。位流符合性測試的第二集合是用于測試由活動VPS規(guī)定的層集合和其時間子集的符合性。對于所有這些測試,當調(diào)用解碼過程時,解碼器僅解碼基礎層圖片(即,具有等于0的nuh_layer_id的圖片)且忽略其它圖片。

在基礎VPS中用信號發(fā)送的層集合

在一些實例中,視頻編碼器20可在VPS中用信號發(fā)送一或多個層集合。如由HEVC標準定義的VPS是含有適用于如由video_parameter_set_id語法元素的內(nèi)容所確定的0或大于0的全部經(jīng)譯碼視頻序列的語法元素的語法結構,所述video_parameter_set_id語法元素發(fā)現(xiàn)于由seq_parameter_set_id語法元素所指代的SPS中,所述seq_parameter_set_id語法元素發(fā)現(xiàn)于由在每一切片片段標頭中發(fā)現(xiàn)的pic_parameter_set_id語法元素所指代的PPS中。

因為VPS適用于全部經(jīng)譯碼視頻序列,所以VPS包含不頻繁發(fā)生改變的語法元素。某些版本的HEVC中的VPS、SPS和PPS機制使不頻繁發(fā)生改變的信息的傳輸與經(jīng)譯碼視頻塊數(shù)據(jù)的傳輸分離。在HEVC中,可針對每一參數(shù)集譯碼VPS、SPS或PPS的標識符(ID)。每一SPS包含SPS ID和VPS ID,每一PPS包含PPS ID和SPS ID,且每一切片標頭包含PPS ID和可能地APS ID。因此,ID可用以標識用于不同情況的適當參數(shù)集。

VPS含有兩個部分,即基礎VPS和VPS擴展。如第一版本中定義的基礎VPS含有與HEVC版本1兼容層有關的信息,以及對應于層集合的操作點?;AVPS也含有時間可縮放性信息,其包含最大數(shù)目的時間層。VPS擴展含有與除基礎層以外的額外層有關的信息。

在MV-HEVC WD8和SHVC WD6中,在基礎VPS中用信號發(fā)送的所有層集合相當于其中僅有一個輸出層是基礎層的輸出層集合(OLS)。這在本文中通常被稱為“僅輸出基礎層的OLS”。一般來說,第0醇是僅輸出基礎層的OLS中的一者,然而,可存在也為僅輸出基礎層的OLS的其它OLS。這是因為符合在HEVC規(guī)范的附件A中定義的簡檔的視頻解碼器30和其對應的HRD僅解碼基礎層,忽略增強層,即使在解碼OLS時在CPB操作中對增強層的所有位進行計數(shù),情況仍會如此。

在一些實例中,也允許在VPS擴展中用信號發(fā)送僅輸出基礎層的OLS。然而,由于這已經(jīng)在基礎VPS中實現(xiàn),因此在VPS擴展中的此類用信號發(fā)送可相當于位的浪費。因此,在一些實施例中,HEVC標準可能不允許在VPS擴展中用信號發(fā)送僅輸出基礎層的OLS。

另外,不管整個位流是否對應于在基礎VPS中用信號發(fā)送的層集合,其還是相當于僅輸出基礎層的OLS。為方便起見,其中存在至少一個不為基礎層的輸出層的OLS在本文中通常被稱為“并非僅輸出基礎層的OLS”。

簡檔、層次、層級

PTL信息規(guī)定用于跨越各種具有類似功能要求的應用以可互操作方式實施標準(例如,HEVC)的符合性點。簡檔定義可在產(chǎn)生相符位流時使用的譯碼工具或算法的集合,而層級將約束置于位流的某些關鍵參數(shù)(對應于解碼器處理負載和存儲器能力)上。在最大取樣率、最大圖片大小、最大位速率、最小壓縮比和DPB的能力方面建立層級限定,且經(jīng)譯碼圖片緩沖器(CPB)出于數(shù)據(jù)流管理目的在經(jīng)壓縮數(shù)據(jù)解碼之前保存所述經(jīng)壓縮數(shù)據(jù)。在HEVC的設計中,確定存在僅在最大位速率和CPB能力方面具有不同要求的某些應用。

所述簡檔對于所有僅輸出基礎層的OLS(包含對應于整個位流的OLS)是相同的。這即使在基礎層是從外部提供時(在此情況下,不規(guī)定簡檔)仍為正確的。舉例來說,在此情況下,基礎VPS中的PTL語法結構僅含有所有零位。

當基礎層處于位流中時,在基礎層的活動SPS的PTL語法結構中以及在活動VPS的第一PTL語法結構(也就是說,在活動VPS的基礎部分中的PTL語法結構)中用信號發(fā)送用于所有僅輸出基礎層的OLS的簡檔。

在基礎層的活動SPS的PTL語法結構中和在活動VPS的第一PTL語法結構中用信號發(fā)送的層次和層級是用于整個位流,其可或可不對應于在VPS中用信號發(fā)送的層集合或OLS。然而,如上所述,整個位流可對應于僅輸出基礎層的OLS。

在此實例中,基礎VPS不含有用于其它用信號發(fā)送的僅輸出基礎層的OLS(包含僅在層集合中含有基礎層本身的第0OLS)的層次和層級信息。因此,整個位流的層次和層級還將適用于除對應于整個位流的僅輸出基礎層的OLS以外但潛在地處于次優(yōu)速率的僅輸出基礎層的OLS中的任一者。這可因為用于所述位流的層次和層級信息被標識。因此,對于整個位流的子集,所述層次和簡檔信息可為次優(yōu)的。舉例來說,整個位流的子集的最優(yōu)層級可低于整個位流的最優(yōu)層級。

除了第0OLS以外,可在VPS擴展中用信號發(fā)送其它僅輸出基礎層的OLS的最優(yōu)層次和層級信息,但這并非必需。這可因為不存在針對在基礎VPS中用信號發(fā)送的每一層集合在VPS擴展中用信號發(fā)送一個僅輸出基礎層的OLS的要求。

從HEVC版本1視角,使用其自身HRD參數(shù)以及用于整個位流的僅層次和層級信息的位流符合性測試并非最優(yōu)。這可允許除對應于整個位流的操作點以外的所有操作點的HRD參數(shù)在仍然通過符合性測試的同時為次優(yōu)的。因此,應考慮到對符合性測試的某些改變。這在下文結合圖4進行描述。

hrd_parameters()語法結構中的HRD參數(shù)

HEVC規(guī)定用以處置位速率波動以及在以恒定或幾乎恒定的位速率進行傳輸時經(jīng)壓縮視頻的變化的視頻緩沖模型。因此,視頻編碼器20和視頻解碼器30可將數(shù)據(jù)緩存于分別使用HRD的CPB或DPB中。HRD描述資料經(jīng)緩沖以用于解碼的方式和經(jīng)解碼資料經(jīng)緩沖以用于輸出的方式。

HRD可用以檢查各個操作點處的位流和解碼器符合性。如上所述,操作點定義用于子位流提取的參數(shù),其包含目標層列表和目標最高時間層。可規(guī)定特定位流的多個操作點。規(guī)定其輸出層的操作點在本文中通常被稱為輸出操作點。

在視頻譯碼標準中,兼容位流必須可通過連接到視頻編碼器20的輸出且由至少一預解碼器緩沖器、解碼器和輸出/顯示單元(例如,顯示裝置32)組成的HRD解碼。

位流在其可通過HRD解碼而無緩沖器溢出或下溢的情況下為兼容的。緩沖器溢出在當緩沖器已滿時仍有更多位放置到所述緩沖器中的情況下發(fā)生。緩沖器下溢在當將從緩沖器提取位以用于解碼/重放時某些位不處于緩沖器中的情況下發(fā)生。

視頻編碼器20可用信號發(fā)送HRD參數(shù)的集合以將約束強加到圖片的經(jīng)編碼大小以及輔助決定必需的緩沖器大小和啟動延遲。

對于HRD,可使用兩種類型的HRD參數(shù)集(NAL HRD參數(shù)和VCL HRD參數(shù))。在一些實例中,通過hrd_parameters()語法結構(其可為SPS語法結構或VPS語法結構的一部分)用信號發(fā)送序列層級HRD參數(shù)集。

在hrd_parameters()語法結構內(nèi)部,僅三個語法元素與DPB操作有關。其它元素僅用于CPB操作。這三個DPB相關語法元素是:

fixed_pic_rate_general_flag[i],

fixed_pic_rate_within_cvs_flag[i],和

elemental_duration_in_tc_minus1[i],針對TemporalId的每一值的一個集合。

當圖片經(jīng)交叉層對準(也就是說,每一存取單元(AU)具有針對層集合中的每一層的圖片,且使用固定圖片速率)時,適用于層集合的hrd_parameters()語法結構將適用于與層集合相關聯(lián)的所有OLS。然而,在其它情況下,適用于層集合的hrd_parameters()語法結構可不適用于與除僅輸出基礎層的OLS外的層集合相關聯(lián)的所有其它OLS。

換句話說,有必要啟用在VPS擴展中針對在VPS擴展中規(guī)定的OLS的hrd_parameters()語法結構的用信號發(fā)送。

非嵌套式和直接嵌套式BP/PT/DUI SEI消息的適用性

SEI消息可含有關于視頻圖片的時序的信息、對在視頻信號中使用的色彩空間的適當解釋、3-D立體幀填充信息、其它顯示提示信息等。BP、PT和DUI SEI消息含有圖片層級和子圖片層級HRD參數(shù)。非嵌套式BP、PT和DUI SEI消息可適用于整個位流,而不管其是否對應于在VPS中用信號發(fā)送的層集合或OLS。

直接嵌套式BP、PT和DUI SEI消息是指直接含于可縮放嵌套SEI消息中而非間接嵌套的BP、PT和DUI SEI消息。間接嵌套式是指含于位流分割區(qū)嵌套SEI消息中繼而含于可縮放嵌套SEI消息中的SEI消息。非嵌套式SEI消息是直接包含在SEI NAL單元中,其并非直接或間接嵌套式。

根據(jù)HEVC版本1,直接嵌套式BP、PT和DUI SEI消息適用于對應于在基礎VPS中用信號發(fā)送的層集合(其相當于僅輸出基礎層的OLS)的操作點。在一些實例中,直接嵌套式BP、PT和DUI SEI消息不適用于并非僅輸出基礎層的OLS,這是由于不存在通過直接嵌套這些SEI消息來使這些SEI消息與并非僅輸出基礎層的OLS相關聯(lián)的方式。

然而,在一些實例中,基于當前標準,非嵌套式和直接嵌套式BP、PT和DUI SEI消息的適用性并非清楚的。因此,通常不清楚應選擇此類SEI消息中的哪些以供在某些位流符合性測試中使用。

在一些實施例中,可為有利的是規(guī)定哪些SEI消息與何種符合性測試相關。因此,可選擇直接嵌套式SEI消息以供與對應于僅輸出基礎層的OLS的操作點一起使用。在一些實施例中,可僅選擇直接嵌套式SEI消息以供與對應于僅輸出基礎層的OLS的操作點一起使用。這可消除某些多義性。在一些其它實施例中,SEI消息可為BP、PT和DUI SEI消息中的一者。

在一些實施例中,間接嵌套式SEI消息可應用于在VPS擴展中規(guī)定的并非僅輸出基礎層的OLS。在一些其它實施例中,間接嵌套式SEI消息可為BP、PT和DUI SEI消息中的一者。

位流符合性測試

在一些實例中,除了第0OLS以外,可在VPS擴展中用信號發(fā)送僅輸出基礎層的的OLS的最優(yōu)層次和層級信息。在HEVC中,這可能不是必需的。這是因為視頻編碼器20無需在VPS擴展中針對在基礎VPS中用信號發(fā)送的每一層集合用信號發(fā)送僅輸出基礎層的OLS。在基礎VPS中,用信號發(fā)送PTL信息的僅一個集合,但可用信號發(fā)送多個hrd_parameters()結構,例如,一個hrd_parameters()結構針對每一僅輸出基礎層的OLS。因此,僅輸出基礎層的OLS的符合性點的位流符合性針對其自身HRD參數(shù)進行測試。然而,僅針對整個位流的層次和層級信息檢查約束。這是在基礎VPS中用信號發(fā)送的僅PTL信息,所述PTL信息由VPS基礎所規(guī)定的所有僅輸出基礎層的OLS共享?,F(xiàn)有要求接著可允許除對應于整個位流的操作點以外的所有操作點的HRD參數(shù)在仍然通過符合性測試的同時“高于”最優(yōu)。在一些實例中,層次和層級信息提供HRD參數(shù)中的許多的上限。因而,整個位流的層次或?qū)蛹壙筛哂趦H輸出基礎層的OLS的最優(yōu)層次或?qū)蛹?。因此,對不同的僅輸出基礎層的OLS根據(jù)其相應內(nèi)容實施位流符合性測試可為有利的。這可通過用信號發(fā)送不同的僅輸出基礎層的OLS的不同層次和層級信息來實現(xiàn)。

在一些實施例中,可存在所實施的位流符合性測試的三個集合。位流符合性測試的第一集合是用于測試整個位流和其時間子集的符合性,而不管是否存在由含有存在于整個位流中的VCL NAL單元的所有nuh_layer_id值的活動VPS規(guī)定的層集合。位流符合性測試的第二集合是用于測試由活動VPS的基礎部分(例如,VPS基礎)規(guī)定的層集合和其時間子集的符合性。對于所有這些測試,在調(diào)用解碼過程時,解碼器僅解碼基礎層圖片(即,具有等于0的nuh_layer_id的圖片)且忽略其它圖片。位流符合性測試的第三集合可經(jīng)實施以用于測試由活動VPS的VPS擴展規(guī)定的OLS和所述OLS的時間子集的符合性。

在一些實施例中,對一或多個輸出操作點進行三個符合性測試。所述輸出操作點可從構成位流的經(jīng)譯碼視頻數(shù)據(jù)選擇和提取。在一些實施例中,所述輸出操作點的選擇是基于參數(shù)集(例如,SPS、VPS、PPS)的內(nèi)容和位流的內(nèi)容。

在一些情況下,可通過選擇層標識符列表(OpLayerIdList)和目標最高時間ID(OpTid)將選定輸出操作點標識為受測試的輸出操作點(還標示為“目標Op”)。所述層標識符列表包含存在于位流中的VCL NAL單元的所有層ID(nuh_layer_id)或包含由活動VPS規(guī)定的層集合的層ID。在此類實例中,第一或第二位流符合性測試中的一者應用于選定輸出操作點。

如上所述,第三位流符合性測試應用于由活動VPS的VPS擴展部分規(guī)定的OLS和其時間子集。對于位流符合性測試的第三集合中的每一測試,可以稍微不同于第一和第二位流符合性測試的方式選擇一或多個輸出操作點。通過標識VPS擴展中的目標OLS和OLS內(nèi)的最高時間ID(HighestTid)來選擇選定輸出操作點(例如,受測試的輸出操作點,或TargetOp)。

圖4是描述符合性測試實施方法的流程圖。在框410處,譯碼系統(tǒng)10可接收包含多個輸出操作點的經(jīng)譯碼視頻數(shù)據(jù)。經(jīng)譯碼視頻數(shù)據(jù)也可包含將針對輸出操作點中的每一者輸出哪些層的指示。所述指示可包含在參數(shù)集(例如,VPS、SPS)中。當輸出操作點對應于整個位流或整個位流的時間子集;或由VPS基礎規(guī)定的層集合或?qū)蛹系臅r間子集時,所述指示也可為隱式的。在隱式情況下,將僅輸出基礎層。在框415處,譯碼系統(tǒng)10可根據(jù)位流符合性測試提取待測試的輸出操作點。可基于對OLS、OLS的時間子集、整個位流的時間子集的標識或以在VPS基礎或VPS擴展中指示的其它方式選擇所述輸出操作點。包括視頻編碼器20和視頻解碼器30的一或多個處理器接著可對輸出操作點(例如,經(jīng)譯碼視頻數(shù)據(jù))基于其內(nèi)容實施給定符合性測試。

舉例來說,在決策框420處,如果選定輸出操作點對應于整個位流或整個位流的時間子集,其中僅基礎層作為輸出,那么方法400可移動到框430。在框430處,處理器(例如,HRD)可基于基礎層的活動SPS中的序列層級HRD參數(shù)的集合和非嵌套式SEI消息(例如,BP、PT和DUI)對選定輸出操作點執(zhí)行第一位流符合性測試??稍诨顒覵PS中的hrd_parameters()語法結構中規(guī)定序列層級HRD參數(shù)的集合。在一些實施例中,第一位流符合性測試可進一步基于活動SPS中的PTL語法結構。

如果在決策框420處,選定輸出操作點不對應于整個位流或整個位流的時間子集,其中僅基礎層作為輸出,那么方法400移動到?jīng)Q策框440。如果在決策框440處,選定輸出操作點對應于由活動VPS基礎規(guī)定的層集合或?qū)蛹系臅r間子集中的一者,其中將僅輸出基礎層,那么處理器可在框450處執(zhí)行第二位流符合性測試。可基于基礎VPS中的序列層級HRD參數(shù)的集合和直接嵌套式BP、PT或DUI SEI消息,對選定輸出操作點執(zhí)行第二位流符合性測試??稍诨顒拥幕AVPS中的hrd_parameters()語法結構中規(guī)定序列層級HRD參數(shù)的集合。

如果在決策框440處,經(jīng)譯碼視頻數(shù)據(jù)不對應于由活動VPS的基礎部分規(guī)定的層集合或?qū)蛹系臅r間子集中的一者,其中將僅輸出基礎層,那么經(jīng)譯碼視頻數(shù)據(jù)對應于由活動VPS的VPS擴展規(guī)定的OLS或OLS的時間子集中的一者,如在框460中所展示。在框470處,處理器(例如,HRD)可基于活動VPS的基礎或擴展部分中的序列層級HRD參數(shù)的集合和間接嵌套式BP、PT或DUI SEI消息,對選定輸出操作點執(zhí)行第三位流符合性測試??稍诨顒覸PS的基礎或擴展部分中的hrd_parameters()語法結構中規(guī)定序列層級HRD參數(shù)的集合。因此,對于三種單獨類型的符合性測試,用于不同類型的輸出操作點的位流符合性測試以向后兼容HEVC版本1的規(guī)范的方式經(jīng)清楚且有效地規(guī)定。

在一些實施例中,對于在VPS擴展中規(guī)定的所有OLS當中的僅輸出基礎層的OLS(如果存在的話),使用活動VPS的基礎部分中的適用hrd_parameters()語法結構,以及適用的直接嵌套式BP、PT和DUI SEI消息?,F(xiàn)有語法和過程以向后兼容HEVC版本1的方式允許此情況,然而,在VPS擴展中規(guī)定的其它OLS并不允許此情況。

應注意,如果并非僅輸出基礎層的OLS含有整個位流中的所有層,那么仍然可僅使用間接嵌套式BP、PT和DUI SEI消息,而不是非嵌套式BP、PT和DUI SEI消息,這是因為非嵌套式BP、PT和DUI SEI消息是針對含有整個位流中的所有層的僅輸出基礎層的OLS。

PTL語法結構的使用對于在VPS擴展中規(guī)定的所有OLS當中的僅輸出基礎層的OLS和并非僅輸出基礎層的OLS兩者是相同的。使用基礎VPS中的或VPS擴展中的最恰當?shù)剡m用的PTL語法結構。

應注意,如果并非僅輸出基礎層的OLS含有整個位流中的所有層,那么仍然可僅使用VPS中的PTL語法結構,而非基礎層的活動SPS中的PTL語法結構,這是因為所述PTL語法結構是用于含有整個位流中的所有層的僅輸出基礎層的OLS。

可使用多種不同技術和方法中的任一者來表示本文中所揭示的信息和信號。舉例來說,可通過電壓、電流、電磁波、磁場或磁粒子、光場或光粒子或其任何組合來表示在整個以上描述中參考的數(shù)據(jù)、指令、命令、信息、信號、位、符號以及碼片。

結合本文中所揭示的實施例描述的各種說明性邏輯塊、模塊、電路和算法步驟可實施為電子硬件、計算機軟件或兩者的組合。為清晰地說明硬件與軟件的此可互換性,上文已大體就其功能性描述了各種說明性組件、塊、模塊、電路和步驟。此功能性是實施為硬件還是軟件取決于特定應用和施加于整個系統(tǒng)的設計約束。熟練的技術人員可針對每一特定應用以不同方式實施所描述的功能性,但此類實施決策不應被解釋為引起偏離本發(fā)明的范圍。

本文中所描述的實施例可實施于硬件、軟件、固件或其任何組合中。此類實施例可實施于多種裝置中的任一者中,例如通用目的計算機、無線通信裝置手持機,或具有包含在無線通信裝置手持機和其它裝置中的應用的多個用途的集成電路裝置。被描述為模塊或組件的任何特征可一起實施于集成邏輯裝置中或分開來實施為離散但可互操作的邏輯裝置。如果以軟件實施,那么所述方法可至少部分地由包括程序代碼的計算機可讀數(shù)據(jù)存儲媒體來實現(xiàn),所述程序代碼包含在執(zhí)行時會執(zhí)行上文所描述的方法中的一或多者的指令。計算機可讀數(shù)據(jù)存儲媒體可形成計算機程序產(chǎn)品的一部分,所述計算機程序產(chǎn)品可包含封裝材料。計算機可讀媒體可包括存儲器或數(shù)據(jù)存儲媒體,例如隨機存取存儲器(RAM)(例如,同步動態(tài)隨機存取存儲器(SDRAM))、只讀存儲器(ROM)、非易失性隨機存取存儲器(NVRAM)、電可擦除可編程只讀存儲器(EEPROM)、快閃存儲器、磁性或光學數(shù)據(jù)存儲媒體等等。另外或替代地,所述方法可至少部分地由計算機可讀通信媒體來實現(xiàn),所述計算機可讀通信媒體以指令或數(shù)據(jù)結構的形式攜載或傳送程序代碼且可由計算機存取、讀取和/或執(zhí)行,例如傳播的信號或波。

程序代碼可由可包含一或多個處理器的處理器執(zhí)行,所述處理器例如一或多個數(shù)字信號處理器(DSP)、通用微處理器、專用集成電路(ASIC)、現(xiàn)場可編程邏輯陣列(FPGA),或其它等效的集成或離散邏輯電路。此類處理器可經(jīng)配置以執(zhí)行本發(fā)明中所描述的方法和過程中的任一者。通用處理器可為微處理器;但在替代方案中,處理器可為任何常規(guī)的處理器、控制器、微控制器或狀態(tài)機。處理器還可實施為計算裝置的組合,例如DSP與微處理器的組合、多個微處理器、一或多個微處理器結合DSP核心,或任何其它此類配置。相應地,如本文所使用術語“處理器”可指上述結構中的任一者、上述結構的任何組合或適用于本文中所描述的方法的實施的任何其它結構或設備。另外,在一些方面,可將本文中所描述的功能性提供于經(jīng)配置以用于編碼和解碼的專用軟件模塊或硬件模塊內(nèi)或并入于組合式視頻編碼器-解碼器(編碼解碼器)中。

雖然本發(fā)明的實施例是在上文中針對特定實施例描述的,但是本發(fā)明的許多變化是可能的。舉例來說,各種組件的數(shù)目可增加或減少,確定電源電壓的模塊和步驟可經(jīng)修改以確定頻率、另一系統(tǒng)參數(shù)或參數(shù)的組合。另外,可不同于上文所描述的那些組合的組合對各種實施例的特征進行組合。

所屬領域的技術人員將理解,結合本文中所揭示的實施例描述的各種說明性塊和模塊可以各種形式實施。上文已經(jīng)大體上就其功能性描述了一些塊和模塊。如何實施此類功能性取決于施加于整個系統(tǒng)的設計約束。所屬領域的技術人員可針對每一特定應用以不同方式實施所描述的功能性,但此類實施決策不應被解釋為引起對本發(fā)明的范圍的偏離。另外,模塊、塊或步驟內(nèi)的功能的分組是為了易于描述。具體功能或步驟可從一個模塊或塊中移動或跨越模塊或塊分布而不會脫離本發(fā)明。

提供對所揭示的實施例的先前描述以使得所屬領域的技術人員能夠制作或使用本發(fā)明的標的物。所屬領域的技術人員將易于理解對這些實施例的各種修改,且可在不脫離本發(fā)明的精神或范圍的情況下將本文中描述的一般原理應用到其它實施例。因此,應理解,本文中呈現(xiàn)的描述和圖式表示本發(fā)明的當前優(yōu)選的實施方案,且因此表示廣泛地由本發(fā)明涵蓋的標的物。進一步理解,本發(fā)明的范圍充分涵蓋對所屬領域的技術人員來說可能顯而易見的其它實施例,且本發(fā)明的范圍因此僅受到所附權利要求書的限制。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1