在視頻譯碼中從清晰隨機存取圖片的全面隨機存取的制作方法
【專利摘要】本發(fā)明的技術提供關于執(zhí)行從位流中的特定存取單元的隨機存取是否要求從先前存取單元提取參數(shù)集的指示。清晰隨機存取CRA圖片可定位于經(jīng)譯碼視頻序列內的任何點處且不清除視頻解碼器的經(jīng)解碼圖片緩沖器DPB。為了執(zhí)行從所述CRA圖片的隨機存取解碼,視頻解碼器可能需要提取包含于在所述CRA圖片之前的不可用的存取單元中的一或多個參數(shù)集。所述技術針對每一CRA圖片提供指示是否需要包含于先前存取單元中的參數(shù)集以執(zhí)行從所述圖片的隨機存取的指示。當不需要來自先前存取單元的參數(shù)集以進行從特定CRA圖片的隨機存取時,視頻解碼器可確定執(zhí)行從該圖片的隨機存取。
【專利說明】在視頻譯碼中從清晰隨機存取圖片的全面隨機存取
[0001]相關申請案
[0002]本申請案主張2012年4月27日申請的第61/639,823號美國臨時申請案的權利,所述案的全文特此以引用方式并入本文中。
【技術領域】
[0003]本發(fā)明大體來說涉及處理視頻數(shù)據(jù)。
【背景技術】
[0004]可將數(shù)字視頻能力并入到廣泛范圍的裝置中,包含數(shù)字電視、數(shù)字直播系統(tǒng)、無線廣播系統(tǒng)、個人數(shù)字助理(PDA)、膝上型或桌上型計算機、數(shù)碼相機、數(shù)字記錄裝置、數(shù)字媒體播放器、視頻游戲裝置、視頻游戲主機、蜂窩式或衛(wèi)星無線電電話、視頻電話會議裝置及其類似者。視頻譯碼標準包含ITU-T H.261、IS0/IEC MPEG-1視覺、ITU-T H.262或ISO/IEC MPEG-2 視覺、ITU-T H.263、IS0/IEC MPEG-4 視覺及 ITU-T H.264 (也被稱為 IS0/IECMPEG-4AVC),包含其可縮放視頻譯碼(SVC)及多視角視頻譯碼(MVC)擴展。另外,高效率視頻譯碼(HEVC)為由ITU-T視頻譯碼專家組(VCEG)與IS0/IEC動畫專家組(MPEG)的關于視頻譯碼的聯(lián)合合作團隊(JCT-VC)開發(fā)的視頻譯碼標準。視頻裝置可通過實施這些視頻譯碼技術而更有效率地發(fā)射、接收、編碼、解碼及/或存儲數(shù)字視頻信息。
[0005]視頻譯碼技術包含空間(圖片內)預測及/或時間(圖片間)預測以減少或移除視頻序列中固有的冗余。對于基于塊的預測性視頻譯碼,可將視頻切片(例如,視頻幀或視頻幀的一部分)分割成視頻塊,視頻塊也可被稱作宏塊、樹塊、譯碼單元(CU)及/或譯碼節(jié)點??墒褂孟鄬τ趫D片中的相鄰塊中的參考樣本的空間預測來編碼同一圖片的幀內譯碼(I)切片中的視頻塊。圖片的幀間譯碼(P或B)切片中的視頻塊可使用相對于同一圖片中的相鄰塊中的參考樣本的空間預測或相對于其它參考圖片中的參考樣本的時間預測。圖片可被稱作幀,且參考圖片可被稱作參考幀。
[0006]空間預測或時間預測導致針對待譯碼塊的預測性塊。殘余數(shù)據(jù)表示待譯碼的原始塊與預測性塊之間的像素差。像素也可被稱作圖片元素、pel,或樣本。根據(jù)指向形成預測性塊的參考樣本的塊的運動向量及指示經(jīng)譯碼塊與預測性塊之間的差異的殘余數(shù)據(jù)來編碼幀間譯碼塊。根據(jù)幀內譯碼模式及殘余數(shù)據(jù)來編碼幀內譯碼塊。為了進行進一步壓縮,可將殘余數(shù)據(jù)從像素域變換到變換域,從而引起殘余變換系數(shù),可接著量化殘余變換系數(shù)。可掃描最初以二維陣列布置的經(jīng)量化變換系數(shù)以便產(chǎn)生變換系數(shù)的一維向量,且可應用熵譯碼以達成甚至更多壓縮。
【發(fā)明內容】
[0007]一般來說,本發(fā)明描述用以提供關于執(zhí)行從位流中的特定存取單元的隨機存取是否要求從先前存取單元提取參數(shù)集的指示的技術。常規(guī)地,隨機存取點(RAP)圖片為瞬時解碼刷新(IDR)圖片,其指示經(jīng)譯碼視頻序列的開始且總是清除視頻解碼器的經(jīng)解碼圖片緩沖器(DPB)。高效率視頻譯碼(HEVC)標準引入了可定位于經(jīng)譯碼視頻序列內的任何點處且不清除DPB的清晰隨機存取(CRA)圖片,此提供改進的譯碼效率。因此,CRA圖片在無較低譯碼效率的情況下提供對位流的隨機存取的更多選項。
[0008]在從CRA圖片的隨機存取的狀況下,將不解碼按輸出或解碼次序在所述CRA圖片之前的所有圖片且所述圖片不可用作參考圖片。在此狀況下,為了解碼CRA圖片或按輸出或解碼次序的任何后繼圖片,視頻解碼器可需要提取包含于不可用的先前圖片中的一者的存取單元中的一或多個參數(shù)集,此為繁重的操作。本發(fā)明的技術針對每一 CRA圖片提供指示,其指示是否需要包含于先前存取單元中的參數(shù)集以執(zhí)行從所述圖片的隨機存取。當不需要來自先前存取單元的參數(shù)集以進行從特定CRA圖片的隨機存取時,視頻解碼器可確定在無提取操作的情況下執(zhí)行從那一圖片的隨機存取。相反地,當需要來自先前存取單元的參數(shù)集以進行從特定CRA圖片的隨機存取時,視頻解碼器可確定不執(zhí)行從那一圖片的隨機存取以便避免提取操作。
[0009]在一些狀況下,指示可包括包含于位流中的每一 CRA圖片的存取單元中的特定類型的網(wǎng)絡抽象層(NAL)單元。在其它狀況下,指示可包括包含于NAL單元有效負載中的語法元素(例如,旗標),所述NAL單元有效負載包含在位流中的每一 CRA圖片的存取單元中。在一個實例中,指示可包括包含于CRA圖片的存取單元中的補充增強信息(SEI)NAL單元中的語法元素(例如,旗標)。盡管主要關于CRA圖片予以描述,但本發(fā)明的技術可類似地用于其它類型的RAP圖片,包含IDR圖片及漸進解碼刷新(GDR)圖片。
[0010]在一個實例中,本發(fā)明針對一種解碼視頻數(shù)據(jù)的方法,所述方法包括:解碼指示符,所述指示符指示從特定CRA存取單元對位流的隨機存取是否要求來自先前存取單元的一或多個參數(shù)集以解碼所述特定CRA存取單元或后續(xù)存取單元,其中所述特定CRA存取單元定位于所述位流的經(jīng)譯碼視頻序列內的任何點處且不清除DPB。所述方法進一步包括:基于所述指示符指示無需來自先前存取單元的參數(shù)集,在不從所述先前存取單元提取參數(shù)集的情況下執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取。
[0011]在另一實例中,本發(fā)明針對一種編碼視頻數(shù)據(jù)的方法,所述方法包括:編碼位流的經(jīng)譯碼視頻序列中的一或多個CRA存取單元,其中所述CRA存取單元定位于所述位流的所述經(jīng)譯碼視頻序列內的任何點處且不清除DPB ;以及編碼指示符,所述指示符指示從特定CRA存取單元對所述位流的隨機存取是否要求來自先前存取單元的一或多個參數(shù)集以解碼所述特定CRA存取單元或后續(xù)存取單元,其中基于所述指示符指示無需來自先前存取單元的參數(shù)集,可在不從所述先前存取單元提取參數(shù)集的情況下執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取。
[0012]在一另外實例中,本發(fā)明針對一種用于譯碼視頻數(shù)據(jù)的視頻譯碼裝置,所述裝置包括:存儲器,其經(jīng)配置以存儲視頻數(shù)據(jù);以及一或多個處理器,其經(jīng)配置以譯碼指示符,所述指示符指示從特定CRA存取單元對位流的隨機存取是否要求來自先前存取單元的一或多個參數(shù)集以解碼所述特定CRA存取單元或后續(xù)存取單元,其中所述特定CRA存取單元定位于所述位流的經(jīng)譯碼視頻序列內的任何點處且不清除DPB?;谒鲋甘痉甘緹o需來自先前存取單元的參數(shù)集,所述裝置的所述處理器經(jīng)進一步配置以在不從所述先前存取單元提取參數(shù)集的情況下執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取。
[0013]在另一實例中,本發(fā)明針對一種用于譯碼視頻數(shù)據(jù)的視頻譯碼裝置,所述裝置包括:用于譯碼指示符的裝置,所述指示符指示從特定CRA存取單元對位流的隨機存取是否要求來自先前存取單元的一或多個參數(shù)集以解碼所述特定CRA存取單元或后續(xù)存取單元,其中所述特定CRA存取單元定位于所述位流的經(jīng)譯碼視頻序列內的任何點處且不清除DPB ;以及基于所述指示符指示無需來自先前存取單元的參數(shù)集,用于在不從所述先前存取單元提取參數(shù)集的情況下執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取的裝置。
[0014]在一額外實例中,本發(fā)明針對一種包括用于譯碼視頻數(shù)據(jù)的指令的計算機可讀媒體,所述指令在經(jīng)執(zhí)行時致使一或多個處理器:譯碼指示符,所述指示符指示從特定CRA存取單元對位流的隨機存取是否要求來自先前存取單元的一或多個參數(shù)集以解碼所述特定CRA存取單元或后續(xù)存取單元,其中所述特定CRA存取單元定位于所述位流的經(jīng)譯碼視頻序列內的任何點處且不清除DPB?;谒鲋甘痉甘緹o需來自先前存取單元的參數(shù)集,所述指令還致使所述處理器在不從所述先前存取單元提取參數(shù)集的情況下執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取。
[0015]在隨附圖式及以下描述中闡述一或多個實例的細節(jié)。其它特征、目標及優(yōu)點將從所述描述及所述圖式以及從權利要求書顯而易見。
【專利附圖】
【附圖說明】
[0016]圖1為說明可利用本發(fā)明中所描述的技術的實例視頻編碼及解碼系統(tǒng)的框圖。
[0017]圖2為說明可實施本發(fā)明中所描述的技術的實例視頻編碼器的框圖。
[0018]圖3為說明可實施本發(fā)明中所描述的技術的實例視頻解碼器的框圖。
[0019]圖4為說明根據(jù)預測性視頻譯碼技術而譯碼的視頻序列的概念圖。
[0020]圖5為說明經(jīng)譯碼視頻序列的實例的概念圖。
[0021]圖6為說明確定在位流的部分中是否可發(fā)生參數(shù)集更新的操作的流程圖。
[0022]圖7為說明確定是否可執(zhí)行從CRA存取單元的隨機存取而不必從先前的不可用的存取單元提取參數(shù)集的操作的流程圖。
[0023]圖8為說明形成網(wǎng)絡的部分的實例裝置集合的框圖。
【具體實施方式】
[0024]本發(fā)明的技術提供關于執(zhí)行從位流中的特定存取單元的隨機存取是否要求從先前存取單元提取參數(shù)集的指示。常規(guī)地,隨機存取點(RAP)圖片為瞬時解碼刷新(IDR)圖片,其指示經(jīng)譯碼視頻序列的開始且總是清除視頻解碼器的經(jīng)解碼圖片緩沖器(DPB)。高效率視頻譯碼(HEVC)標準引入了可定位于經(jīng)譯碼視頻序列內的任何點處且不清除DPB的清晰隨機存取(CRA)圖片,此提供改進的譯碼效率。因此,CRA圖片在無較低譯碼效率的情況下提供對位流的隨機存取的更多選項。
[0025]在從CRA圖片的隨機存取的狀況下,將不解碼按輸出或解碼次序在所述CRA圖片之前的所有圖片且所述圖片不可用作參考圖片。在此狀況下,為了解碼CRA圖片或按輸出或解碼次序的任何后繼圖片,視頻解碼器可需要提取包含于不可用的先前圖片中的一者的存取單元中的一或多個參數(shù)集,此為繁重的操作。本發(fā)明的技術針對每一 CRA圖片提供指示,其指示是否需要包含于先前存取單元中的參數(shù)集以執(zhí)行從圖片的隨機存取。當不需要來自先前存取單元的參數(shù)集以進行從特定CRA圖片的隨機存取時,視頻解碼器可確定在無提取操作的情況下執(zhí)行從那一圖片的隨機存取。相反地,當需要來自先前存取單元的參數(shù)集以進行從特定CRA圖片的隨機存取時,視頻解碼器可確定不執(zhí)行從那一圖片的隨機存取以便避免提取操作。
[0026]在一些狀況下,指示可包括包含于位流中的每一 CRA圖片的存取單元中的特定類型的網(wǎng)絡抽象層(NAL)單元。在其它狀況下,指示可包括包含于NAL單元有效負載中的語法元素(例如,旗標),所述NAL單元有效負載包含在位流中的每一 CRA圖片的存取單元中。在一個實例中,指示可包括包含于CRA圖片的存取單元中的補充增強信息(SEI)NAL單元中的語法元素(例如,旗標)。盡管主要關于CRA圖片予以描述,但本發(fā)明的技術可類似地用于其它類型的RAP圖片,包含IDR圖片及漸進解碼刷新(GDR)圖片。
[0027]圖1為說明可利用本發(fā)明中所描述的技術的實例視頻編碼及解碼系統(tǒng)10的框圖。如圖1所示,系統(tǒng)10包含源裝置12,源裝置12提供稍后待由目的地裝置14解碼的經(jīng)編碼視頻數(shù)據(jù)。明確地說,源裝置12經(jīng)由計算機可讀媒體16將視頻數(shù)據(jù)提供到目的地裝置14。源裝置12及目的地裝置14可包括廣泛范圍的裝置中的任一者,包含桌上型計算機、筆記型(即,膝上型)計算機、平板型計算機、機頂盒、電話手持機(例如,所謂“智能”手機)、所謂“智能”平板(smart pad)、電視、相機、顯示裝置、數(shù)字媒體播放器、視頻游戲主機、視頻流式傳輸裝置,或其類似者。在一些狀況下,源裝置12及目的地裝置14可經(jīng)配備以用于無線通?目。
[0028]目的地裝置14可經(jīng)由計算機可讀媒體16接收待解碼的經(jīng)編碼視頻數(shù)據(jù)。計算機可讀媒體16可包括能夠將經(jīng)編碼視頻數(shù)據(jù)從源裝置12移到目的地裝置14的任何類型的媒體或裝置。在一個實例中,計算機可讀媒體16可包括通信媒體以使源裝置12能夠將經(jīng)編碼視頻數(shù)據(jù)直接實時發(fā)射到目的地裝置14。可根據(jù)通信標準(例如,無線通信協(xié)議)調制經(jīng)編碼視頻數(shù)據(jù),且將經(jīng)編碼視頻數(shù)據(jù)發(fā)射到目的地裝置14。通信媒體可包括任何無線或有線通信媒體,例如,射頻(RF)頻譜或一或多個物理傳輸線。通信媒體可形成基于封包的網(wǎng)絡(例如,局域網(wǎng)、廣域網(wǎng)或例如因特網(wǎng)等全球網(wǎng)絡)的部分。通信媒體可包含路由器、交換器、基站,或可用以促進從源裝置12到目的地裝置14的通信的任何其它設備。
[0029]在一些實例中,可將經(jīng)編碼數(shù)據(jù)從輸出接口 22輸出到存儲裝置。類似地,可通過輸入接口從存儲裝置存取經(jīng)編碼數(shù)據(jù)。存儲裝置可包含多種分散式或本地存取式數(shù)據(jù)存儲媒體中的任一者,例如,磁盤驅動器、藍光光盤、DVD、CD-ROM、快閃存儲器、易失性或非易失性存儲器,或用于存儲經(jīng)編碼視頻數(shù)據(jù)的任何其它合適數(shù)字存儲媒體。在另外實例中,存儲裝置可對應于文件服務器或可存儲由源裝置12產(chǎn)生的經(jīng)編碼視頻的另一中間存儲裝置。目的地裝置14可經(jīng)由流式傳輸或下載而從存儲裝置存取經(jīng)存儲視頻數(shù)據(jù)。文件服務器可為能夠存儲經(jīng)編碼視頻數(shù)據(jù)且將那一經(jīng)編碼視頻數(shù)據(jù)發(fā)射到目的地裝置14的任何類型的服務器。實例文件服務器包含網(wǎng)頁服務器(例如,對于網(wǎng)站)、FTP服務器、網(wǎng)絡附接存儲(NAS)裝置,或本地磁盤機。目的地裝置14可經(jīng)由包含因特網(wǎng)連接的任何標準數(shù)據(jù)連接而存取經(jīng)編碼視頻數(shù)據(jù)。此數(shù)據(jù)連接可包含適合于存取存儲于文件服務器上的經(jīng)編碼視頻數(shù)據(jù)的無線信道(例如,W1-Fi連接)、有線連接(例如,DSL、纜線調制解調器,等等),或兩者的組合。經(jīng)編碼視頻數(shù)據(jù)從存儲裝置的發(fā)射可為流式傳輸、下載發(fā)射,或其組合。
[0030]本發(fā)明的技術未必限于無線應用或設定。所述技術可應用于支持多種多媒體應用中的任一者的視頻譯碼,所述多媒體應用例如,空中電視廣播、有線電視發(fā)射、衛(wèi)星電視發(fā)射、(例如)作為經(jīng)由HTTP的動態(tài)自適應性流式傳輸(DASH)的經(jīng)由因特網(wǎng)的流式視頻發(fā)射、用于存儲于數(shù)據(jù)存儲媒體上的數(shù)字視頻的編碼、存儲于數(shù)據(jù)存儲媒體上的數(shù)字視頻的解碼,或其它應用。在一些實例中,系統(tǒng)10可經(jīng)配置以支持單向或雙向視頻發(fā)射以支持例如視頻流式傳輸、視頻回放、視頻廣播及/或視頻電話等應用。
[0031]在圖1的實例中,源裝置12包含視頻源18、視頻編碼器20及輸出接口 22。目的地裝置14包含輸入接口 28、視頻解碼器30及顯示裝置32。在其它實例中,源裝置及目的地裝置可包含其它組件或布置。舉例來說,源裝置12可從外部視頻源18 (例如,外部相機)接收視頻數(shù)據(jù)。同樣地,目的地裝置14可與外部顯示裝置介接,而非包含集成式顯示裝置。
[0032]圖1的所說明系統(tǒng)10僅僅為一實例??赏ㄟ^任何數(shù)字視頻編碼及/或解碼裝置來執(zhí)行本發(fā)明的技術。盡管大體上所述技術是通過視頻編碼裝置來執(zhí)行,但所述技術還可通過視頻編碼器/解碼器(通常被稱作“編碼解碼器(CODEC)”)來執(zhí)行。此外,還可通過視頻預處理器來執(zhí)行本發(fā)明的技術。源裝置12及目的地裝置14僅僅為這些譯碼裝置的實例,其中源裝置12產(chǎn)生供發(fā)射到目的地裝置14的經(jīng)譯碼視頻數(shù)據(jù)。在一些實例中,裝置12、14可以實質上對稱的方式操作,使得裝置12、14中的每一者包含視頻編碼及解碼組件。因此,系統(tǒng)10可支持視頻裝置12、14之間的單向或雙向視頻發(fā)射,例如,用于視頻流式傳輸、視頻回放、視頻廣播或視頻電話。
[0033]源裝置12的視頻源18可包含例如視頻相機等視頻俘獲裝置、含有先前經(jīng)俘獲視頻的視頻存檔,及/或用以從視頻內容提供者接收視頻的視頻饋入接口。作為另外替代例,視頻源18可產(chǎn)生基于計算機圖形的數(shù)據(jù)作為源視頻,或產(chǎn)生實況視頻、封存視頻及計算機產(chǎn)生的視頻的組合。在一些狀況下,如果視頻源18為視頻相機,則源裝置12及目的地裝置14可形成所謂相機電話或視頻電話。然而,如上文所提及,本發(fā)明中所描述的技術可大體上適用于視頻譯碼,且可應用于無線及/或有線應用。在每一狀況下,可通過視頻編碼器20編碼經(jīng)俘獲、被預俘獲或計算機產(chǎn)生的視頻??山又ㄟ^輸出接口 22將經(jīng)編碼視頻信息輸出到計算機可讀媒體16上。
[0034]計算機可讀媒體16可包含暫時性媒體,例如,無線廣播或有線網(wǎng)絡發(fā)射;或存儲媒體(即,非暫時性存儲媒體),例如,硬盤、隨身碟、光盤、數(shù)字影音光盤、藍光光盤或其它計算機可讀媒體。在一些實例中,網(wǎng)絡服務器(圖中未展示)可從源裝置12接收經(jīng)編碼視頻數(shù)據(jù),且(例如)經(jīng)由網(wǎng)絡發(fā)射將所述經(jīng)編碼視頻數(shù)據(jù)提供到目的地裝置14。類似地,媒體生產(chǎn)設施(例如,光盤壓印設施)的計算裝置可從源裝置12接收經(jīng)編碼視頻數(shù)據(jù)且產(chǎn)生含有所述經(jīng)編碼視頻數(shù)據(jù)的光盤。因此,在各種實例中,可將計算機可讀媒體16理解成包含各種形式的一或多個計算機可讀媒體。
[0035]目的地裝置14的輸入接口28從計算機可讀媒體16接收信息。計算機可讀媒體16的信息可包含由視頻編碼器20定義的語法信息,所述語法信息還由視頻解碼器30使用,且包含描述塊及其它經(jīng)譯碼單元(例如,G0P)的特性及/或處理的語法元素。顯示裝置32向用戶顯示經(jīng)解碼視頻數(shù)據(jù),且可包括多種顯示裝置中的任一者,例如,陰極射線管(CRT)、液晶顯示器(LCD)、等離子體顯示器、有機發(fā)光二極管(OLED)顯示器或另一類型的顯示裝置。
[0036]視頻編碼器20及視頻解碼器30可根據(jù)視頻譯碼標準而操作,視頻譯碼標準例如,作為被稱為聯(lián)合視頻團隊(JVT)的集體合作的產(chǎn)物的目前由ITU-T視頻譯碼專業(yè)團體(VCEG)及ISO/IEC動畫專業(yè)團體(MPEG)的關于視頻譯碼的聯(lián)合合作團隊(JCT-VC)開發(fā)的高效率視頻譯碼(HEVC)標準。HEVC標準可符合HEVC測試模型(HM)。在Bross等人的文件JCTVC-H1003 “High efficiency video coding (HEVC) text specificat1n draft6”(ITU-TSG16WP3及ISO/IEC JTC1/SC29/WG11的關于視頻譯碼的聯(lián)合合作團隊(JCT-VC),第8次會議:San Jose, California, USA, 2012 年 2 月)中描述了被稱作“HEVC 工作草案 6”或“WD6”的HEVC HM的最新草案。
[0037]然而,本發(fā)明的技術不限于任何特定譯碼標準。盡管未展示于圖1中,但在一些方面中,視頻編碼器20及視頻解碼器30可各自與音頻編碼器及解碼器集成,且可包含適當多路復用器-多路分用器(MUX-DEMUX)單元或其它硬件及軟件以處置共同數(shù)據(jù)流或分離數(shù)據(jù)流中的音頻及視頻兩者的編碼。如果適用,則MUX-DEMUX單元可符合ITU H.223多路復用器協(xié)議或例如用戶數(shù)據(jù)報協(xié)議(UDP)等其它協(xié)議。
[0038]視頻編碼器20及視頻解碼器30可各自實施為多種合適編碼器電路中的任一者,例如一或多個微處理器、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)、離散邏輯、軟件、硬件、固件或其任何組合。當所述技術部分地在軟件中實施時,裝置可將軟件的指令存儲于合適的非暫時性計算機可讀媒體中,且在硬件中使用一或多個處理器來執(zhí)行所述指令以執(zhí)行本發(fā)明的技術。視頻編碼器20及視頻解碼器30中的每一者可包含于一或多個編碼器或解碼器中,其中任一者可集成為相應裝置中的組合編碼器/解碼器(編碼解碼器)的部分。
[0039]JCT-VC正致力于HEVC標準的開發(fā)。HEVC標準化努力是基于視頻譯碼裝置的演進模型,其被稱作HEVC測試模型(HM)。HM假設相對于現(xiàn)有標準的若干額外能力。舉例來說,H.264提供九個幀內預測編碼模式,而HM可提供多達三十三個幀內預測編碼模式。
[0040]一般來說,HM描述視頻幀或圖片可劃分成包含明度樣本及色度樣本兩者的樹塊或最大譯碼單元(LCU)的序列。位流內的語法數(shù)據(jù)可定義LCU的大小,LCU就像素的數(shù)目來說為最大譯碼單元。切片包含按譯碼次序的數(shù)個連續(xù)樹塊。視頻幀或圖片可分割成一或多個切片。每一樹塊可根據(jù)四分樹而分裂成若干譯碼單元(CU)。一般來說,四分樹數(shù)據(jù)結構對于每CU包含一個節(jié)點,其中根節(jié)點對應于樹塊。如果CU分裂成四個子CU,則對應于所述CU的節(jié)點包含四個葉節(jié)點,所述四個葉節(jié)點中的每一者對應于所述子CU中的一者。
[0041]四分樹數(shù)據(jù)結構的每一節(jié)點可提供對應CU的語法數(shù)據(jù)。舉例來說,四分樹中的節(jié)點可包含分裂旗標,其指示對應于節(jié)點的CU是否被分裂成若干子CU。用于CU的語法元素可被遞歸式地定義,且可視CU是否被分裂成子CU而定。如果CU不被進一步分裂,則其被稱作葉CU。在本發(fā)明中,即使不存在原始葉CU的明確分裂,葉CU的四個子CU也將被稱作葉⑶。舉例來說,如果16X16大小的⑶不進一步分裂,則盡管16 X 16⑶永不分裂,但四個8 X 8子⑶還將被稱作葉⑶。
[0042]除了 CU不具有大小區(qū)別之外,CU具有類似于H.264標準的宏塊的用途。舉例來說,樹塊可分裂成四個子節(jié)點(也被稱作子CU),且每一子節(jié)點又可為父節(jié)點并分裂成另外四個子節(jié)點。最后的未分裂的子節(jié)點(被稱作四分樹的葉節(jié)點)包括譯碼節(jié)點(也被稱作葉CU)。與經(jīng)譯碼位流相關聯(lián)的語法數(shù)據(jù)可定義樹塊可被分裂的最大次數(shù)(被稱作最大CU深度),且也可定義譯碼節(jié)點的最小大小。因此,位流也可定義最小譯碼單元(SCU)。本發(fā)明使用術語“塊”指代在HEVC的內容脈絡中的CU、PU或TU中的任一者,或在其它標準的內容脈絡中的類似數(shù)據(jù)結構(例如,在H.264/AVC中的宏塊及其子塊)。
[0043]CU包含譯碼節(jié)點及與所述譯碼節(jié)點相關聯(lián)的若干預測單元(PU)及變換單元(TU)。⑶的大小對應于譯碼節(jié)點的大小,且形狀必須為正方形。⑶的大小的范圍可從8X8像素直到具有最大64X64像素或大于64X64像素的樹塊的大小。每一⑶可含有一或多個I3U及一或多個TU。與CU相關聯(lián)的語法數(shù)據(jù)可描述(例如)CU到一或多個I3U的分割。分割模式可視CU是經(jīng)跳過或直接模式編碼、經(jīng)幀內預測模式編碼抑或經(jīng)幀間預測模式編碼而不同。PU可被分割成非正方形。與CU相關聯(lián)的語法數(shù)據(jù)還可描述(例如)將CU根據(jù)四分樹分割成一或多個TU。TU的形狀可為正方形或非正方形(例如,矩形)。
[0044]HEVC標準允許根據(jù)TU的變換,所述變換對于不同⑶可不同。通常基于針對經(jīng)分割LCU所定義的給定CU內的PU的大小而設定TU大小,但可能并非總是如此狀況。TU通常具有與PU相同的大小,或小于PU。在一些實例中,可使用稱為“殘余四分樹”(RQT)的四分樹結構將對應于CU的殘余樣本再分成若干較小單元。RQT的葉節(jié)點可被稱作變換單元(TU)。可變換與TU相關聯(lián)的像素差值以產(chǎn)生可量化的變換系數(shù)。
[0045]葉⑶可包含一或多個預測單元(PU)。一般來說,I3U表示對應于對應⑶的全部或一部分的空間區(qū)域,且可包含用于檢索PU的參考樣本的數(shù)據(jù)。此外,PU包含與預測有關的數(shù)據(jù)。舉例來說,當PU經(jīng)幀內模式編碼時,用于的數(shù)據(jù)可包含于殘余四分樹(RQT)中,殘余四分樹可包含描述對應于PU的TU的幀內預測模式的數(shù)據(jù)。作為另一實例,當PU經(jīng)幀間模式編碼時,PU可包含定義所述的一或多個運動向量的數(shù)據(jù)。定義的運動向量的數(shù)據(jù)可描述(例如)運動向量的水平分量、運動向量的垂直分量、運動向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、運動向量所指向的參考圖片,及/或運動向量的參考圖片列表(例如,列表O或列表I)。
[0046]具有一或多個I3U的葉⑶還可包含一或多個變換單元(TU)??墒褂肦QT (也被稱作TU四分樹結構)指定變換單元,如上文所論述。舉例來說,分裂旗標可指示葉CU是否分裂成四個變換單元。接著,每一變換單元可進一步分裂成另外的子TU。當TU不被進一步分裂時,其可被稱作葉TU。通常,對于幀內譯碼,屬于葉CU的所有葉TU共享相同幀內預測模式。即,一般將相同幀內預測模式應用于計算葉CU的所有TU的預測值。對于幀內譯碼,視頻編碼器可使用幀內預測模式計算每一葉TU的殘余值,作為對應于TU的CU的部分與原始塊之間的差。TU未必限于PU的大小。因此,TU可能大于或小于PU。對于幀內譯碼,I3U可能與相同CU的對應葉TU設在同一位置。在一些實例中,葉TU的最大大小可對應于對應葉⑶的大小。
[0047]此外,葉⑶的TU還可與被稱作殘余四分樹(RQT)的相應四分樹數(shù)據(jù)結構相關聯(lián)。SP,葉CU可包含指示如何將葉CU分割成TU的四分樹。TU四分樹的根節(jié)點一般對應于葉⑶,而⑶四分樹的根節(jié)點一般對應于樹塊(或IXU)。RQT的不被分裂的TU被稱作葉TU。一般來說,除非另外提及,否則本發(fā)明分別使用術語CU及TU來指代葉CU及葉TU。
[0048]視頻序列通常包含一系列視頻幀或圖片。圖片群組(GOP) —般包括視頻圖片中的一系列的一或多者。GOP可在GOP的標頭、圖片中的一或多者的標頭中或在別處包含描述包含于GOP中的圖片數(shù)目的語法數(shù)據(jù)。圖片的每一切片可包含描述所述相應切片的編碼模式的切片語法數(shù)據(jù)。視頻編碼器20通常對個別視頻切片內的視頻塊進行操作,以便編碼視頻數(shù)據(jù)。視頻塊可對應于CU內的譯碼節(jié)點。視頻塊可具有固定或變化的大小,且可根據(jù)指定譯碼標準而具有不同大小。
[0049]作為一個實例,HM支持以各種I3U大小進行預測。假定特定CU的大小為2NX 2N,則HM支持以2NX2N或NXN的I3U大小進行幀內預測,及以2NX2N、2NXN、NX2N或NXN的對稱I3U大小進行幀間預測。HM還支持以2NX nU、2NX nD、nL X 2N及nRX 2N的PU大小的不對稱分割以進行巾貞間預測。在不對稱分割中,CU的一個方向未被分割,而另一方向被分割成25%及75%。CU的對應于25%分割區(qū)的部分由“η”繼之以“上”、“下”、“左”或“右”的指示來指示。因此,例如,“2NXnU”指代被水平分割而具有頂部的2ΝΧ0.5Ν I3U及底部的 2NX 1.5N PU 的 2NX2N CU。
[0050]在本發(fā)明中,“NXN”與“N乘N”可互換地使用以指代視頻塊的在垂直維度與水平維度上的像素尺寸,例如,16X16像素或16乘16像素。一般來說,16x16塊在垂直方向中將具有16個像素(y = 16)且在水平方向中將具有16個像素(x = 16)。同樣地,NXN塊一般在垂直方向上具有N個像素,且在水平方向上具有N個像素,其中N表示非負整數(shù)值??砂炊嘈屑岸嗔衼聿贾脡K中的像素。另外,塊未必需要在水平方向上與在垂直方向上具有相同數(shù)目個像素。舉例來說,塊可包括NxM個像素,其中M未必等于N。
[0051 ] 在使用⑶的PU進行幀內預測性或幀間預測性譯碼之后,視頻編碼器20可計算⑶的TU的殘余數(shù)據(jù)。PU可包括描述在空間域(也被稱作像素域)中產(chǎn)生預測性像素數(shù)據(jù)的方法或模式的語法數(shù)據(jù),且TU可包括在將(例如)離散余弦變換(DCT)、整數(shù)變換、小波變換或概念上類似的變換應用于殘余視頻數(shù)據(jù)之后在變換域中的系數(shù)。殘余數(shù)據(jù)可對應于未經(jīng)編碼圖片的像素與對應于PU的預測值之間的像素差。視頻編碼器20可形成包含CU的殘余數(shù)據(jù)的TU,且接著變換所述TU以產(chǎn)生CU的變換系數(shù)。
[0052]在應用任何變換以產(chǎn)生變換系數(shù)之后,視頻編碼器20可執(zhí)行變換系數(shù)的量化。量化一般指代如下過程:將變換系數(shù)量化以可能地減少用以表示所述系數(shù)的數(shù)據(jù)量,從而提供進一步壓縮。所述量化過程可減少與所述系數(shù)中的一些或全部相關聯(lián)的位深度。舉例來說,可在量化期間將η位值降值舍位到m位值,其中η大于m。
[0053]在量化之后,視頻編碼器可掃描變換系數(shù),從而從包含經(jīng)量化變換系數(shù)的二維矩陣產(chǎn)生一維向量。掃描可設計成將較高能量(且因此較低頻率)系數(shù)置于陣列前部,且將較低能量(且因此較高頻率)系數(shù)置于陣列后部。在一些實例中,視頻編碼器20可利用預定義掃描次序來掃描經(jīng)量化變換系數(shù),以產(chǎn)生可被熵編碼的串列化向量。在其它實例中,視頻編碼器20可執(zhí)行自適應性掃描。在掃描經(jīng)量化變換系數(shù)以形成一維向量之后,視頻編碼器20可(例如)根據(jù)上下文自適應性可變長度譯碼(CAVLC)、上下文自適應性二進制算術譯碼(CABAC)、基于語法的上下文自適應性二進制算術譯碼(SBAC)、機率區(qū)間分割熵(PIPE)譯碼或另一熵編碼方法而熵編碼所述一維向量。視頻編碼器20還可熵編碼與經(jīng)編碼視頻數(shù)據(jù)相關聯(lián)的語法元素以供視頻解碼器30用于解碼視頻數(shù)據(jù)。
[0054]為了執(zhí)行CABAC,視頻編碼器20可將上下文模型內的上下文指派給待發(fā)射的符號。所述上下文可能是關于(例如)符號的相鄰值是否為非零。為了執(zhí)行CAVLC,視頻編碼器20可針對待發(fā)射的符號選擇可變長度碼??山媀LC中的碼字使得相對較短碼對應于更有可能的符號,而較長碼對應于較不可能的符號。以此方式,使用VLC可達成位節(jié)省(與(例如)針對待發(fā)射的每一符號使用等長度碼字相比較)??苫谥概山o符號的上下文而進行機率確定。
[0055]視頻編碼器20可進一步在(例如)幀標頭、塊標頭、切片標頭或GOP標頭中將語法數(shù)據(jù)(例如,基于塊的語法數(shù)據(jù)、基于幀的語法數(shù)據(jù)及基于GOP的語法數(shù)據(jù))發(fā)送到視頻解碼器30。GOP語法數(shù)據(jù)可描述相應GOP中的幀數(shù)目,且?guī)Z法數(shù)據(jù)可指示用以編碼對應幀的編碼/預測模式。
[0056]視頻編碼器20及視頻解碼器30可各自實施為多種合適編碼器或解碼器電路中的任一者(在適用時),例如,一或多個微處理器、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)、離散邏輯電路、軟件、硬件、固件或其任何組合。視頻編碼器20及視頻解碼器30中的每一者可包含于一或多個編碼器或解碼器中,其中任一者可集成為組合式視頻編碼器/解碼器(編碼解碼器)的部分。包含視頻編碼器20及/或視頻解碼器30的裝置可包括集成電路、微處理器及/或無線通信裝置(例如,蜂窩式電話)。
[0057]視頻編碼器20及視頻解碼器30可經(jīng)配置以實施本發(fā)明中所描述的技術中的一或多者。作為一個實例,視頻編碼器20可經(jīng)配置以編碼關于在位流的部分中是否可發(fā)生參數(shù)集更新的指示。視頻解碼器30可經(jīng)配置以解碼所述指示以在不執(zhí)行經(jīng)存儲參數(shù)集與具有相同識別值的相同類型的新參數(shù)集之間的內容比較的情況下確定是否可發(fā)生所述經(jīng)存儲參數(shù)集的更新。當發(fā)生參數(shù)集更新時,視頻解碼器30存儲具有給定識別值的當前參數(shù)集以替換具有相同類型且具有相同識別值的先前參數(shù)集。所述指示所應用于的位流部分可為位流的經(jīng)譯碼視頻序列或位流的經(jīng)譯碼視頻序列中的G0P。
[0058]在一個狀況下,指示可包括在位流中的語法元素(例如,旗標),其指示在位流的部分中是否可更新任何類型的任何參數(shù)集。在另一狀況下,指示可包括在位流中的若干不同旗標,其中每一者指示在位流的部分中是否可更新特定類型的參數(shù)集。在任一狀況下,當旗標指示不能夠發(fā)生參數(shù)集更新時,視頻解碼器30可針對位流的整個部分存儲且啟動給定類型的單個參數(shù)集。在接收到具有與初始參數(shù)集相同的類型且具有與初始參數(shù)集相同的識別值之后續(xù)參數(shù)集時,視頻解碼器30可忽略所述后續(xù)參數(shù)集。相反地,當旗標指示可發(fā)生參數(shù)集更新時,視頻解碼器30可自動啟動新參數(shù)集且去啟動給定類型的經(jīng)存儲參數(shù)集,或可(例如)通過執(zhí)行內容比較來確定是否更新經(jīng)存儲參數(shù)。
[0059]作為另一實例,視頻編碼器20可經(jīng)配置以編碼指示,所述指示是關于在位流中執(zhí)行從特定CRA存取單元的隨機存取是否要求從先前存取單元提取參數(shù)集。視頻解碼器30可經(jīng)配置以解碼所述指示以確定是否需要包含于先前存取單元中的參數(shù)集以執(zhí)行從特定CRA圖片的隨機存取。在一些狀況下,指示可包括包含于NAL單元有效負載中的語法元素(例如,旗標),所述NAL單元有效負載包含在位流中的每一 CRA圖片的存取單元中。
[0060]CRA存取單元可出現(xiàn)于經(jīng)譯碼視頻序列內的任何點處且不清除DPB,此在無較低譯碼效率的情況下提供對位流的隨機存取的更多選項。在從CRA圖片進行隨機存取的狀況下,將不解碼按輸出或解碼次序在所述CRA圖片之前的所有圖片且所述圖片不可用作參考圖片。為了解碼CRA圖片或按輸出或解碼次序的任何后繼圖片,視頻解碼器可需要提取包含于不可用先前圖片中的一者的存取單元中的一或多個參數(shù)集,此為繁重的操作。根據(jù)本發(fā)明的一些技術,當旗標指示不需要來自先前存取單元的參數(shù)集以進行從特定CRA圖片的隨機存取時,視頻解碼器30可確定執(zhí)行從那一圖片的隨機存取,因為不需要提取操作。相反地,當旗標指示需要來自先前存取單元的參數(shù)集以進行從特定CRA圖片的隨機存取時,視頻解碼器30可確定不執(zhí)行從那一圖片的隨機存取以便避免提取操作。盡管主要關于CRA圖片予以描述,但技術可類似地用于其它類型的RAP圖片,包含IDR圖片及漸進解碼刷新(O)R)圖片。
[0061]圖2為說明可實施本發(fā)明中所描述的技術的視頻編碼器20的實例的框圖。視頻編碼器20可執(zhí)行視頻切片內的視頻塊的幀內譯碼及幀間譯碼。幀內譯碼依賴于空間預測以減少或移除給定視頻幀或圖片內的視頻的空間冗余。幀間譯碼依賴于時間預測以減少或移除視頻序列的鄰近幀或圖片內的視頻的時間冗余。幀內模式(I模式)可指代若干基于空間的譯碼模式中的任一者。例如單向預測(P模式)或雙向預測(B模式)的幀間模式可指代若干基于時間的譯碼模式中的任一者。
[0062]如圖2所示,視頻編碼器20接收待編碼的視頻圖幀內的當前視頻塊。在圖2的實例中,視頻編碼器20包含模式選擇單元40、參考圖片存儲器64、求和器50、變換處理單元52、量化單元54,及熵編碼單元56。模式選擇單元40又包含運動補償單元44、運動估計單元42、幀內預測處理單元46,及分割單元48。對于視頻塊重建構,視頻編碼器20還包含反量化單元58、反變換處理單元60,及求和器62。
[0063]在編碼過程期間,視頻編碼器20接收待譯碼的視頻幀或切片??蓪蚯衅瑒澐殖啥鄠€視頻塊。運動估計單元42及運動補償單元44執(zhí)行所接收的視頻塊相對于一或多個參考幀中的一或多個塊的幀間預測性譯碼,以提供時間預測?;蛘撸瑤瑑阮A測處理單元46可執(zhí)行經(jīng)接收視頻塊相對于與待譯碼的塊處于同一幀或切片中的一或多個相鄰塊的幀內預測性譯碼,以提供空間預測。視頻編碼器20可執(zhí)行多個譯碼遍次(例如)以選擇用于視頻數(shù)據(jù)的每一塊的適當譯碼模式。
[0064]此外,分割單元48可基于在先前譯碼遍次中對先前分割方案的評估而將視頻數(shù)據(jù)的塊分割成若干子塊。舉例來說,分割單元48可最初將幀或切片分割成若干LCU,且基于位率-失真分析(例如,位率-失真最佳化)而將所述LCU中的每一者分割成若干子CU。模式選擇單元40可進一步產(chǎn)生指示LCU到子CU的分割的四分樹數(shù)據(jù)結構。四分樹的葉節(jié)點⑶可包含一或多個I3U及一或多個TU。
[0065]模式選擇單元40可選擇譯碼模式(幀內或幀間)中的一者(例如,基于誤差結果),且將所得經(jīng)幀內或幀間譯碼塊提供到求和器50以產(chǎn)生殘余塊數(shù)據(jù),且提供到求和器62以重建構經(jīng)編碼塊以用作參考幀。模式選擇單元40還將例如運動向量、幀內模式指示符、分割信息及其它此類語法信息等語法元素提供到熵編碼單元56。
[0066]運動估計單元42與運動補償單元44可高度集成,但出于概念性目的而對所述單元分別加以說明。由運動估計單元42執(zhí)行的運動估計為產(chǎn)生運動向量的過程,運動向量估計視頻塊的運動。舉例來說,運動向量可指示當前視頻巾貞或圖片內的視頻塊的PU相對于參考幀(或其它經(jīng)譯碼單元)內的預測性塊相對于當前幀(或其它經(jīng)譯碼單元)內的正被譯碼的當前塊的位移。預測性塊為被發(fā)現(xiàn)在像素差方面與待譯碼的塊緊密匹配的塊,可通過絕對差和(SAD)、平方差和(SSD)或其它差量度來確定像素差。在一些實例中,視頻編碼器20可計算存儲于參考圖片存儲器64(其也可被稱作經(jīng)解碼圖片緩沖器(DPB))中的參考圖片的次整數(shù)像素位置的值。舉例來說,視頻編碼器20可內插參考圖片的四分之一像素位置、八分之一像素位置或其它分數(shù)像素位置的值。因此,運動估計單元42可執(zhí)行相對于完整像素位置及分數(shù)像素位置的運動搜索,且以分數(shù)像素精度輸出運動向量。
[0067]運動估計單元42通過比較幀間譯碼切片中的視頻塊的PU的位置與參考圖片的預測性塊的位置而計算所述PU的運動向量。參考圖片可選自第一參考圖片列表(列表O)或第二參考圖片列表(列表I),所述列表中的每一者識別存儲于參考圖片存儲器64中的一或多個參考圖片。運動估計單元42將經(jīng)計算的運動向量發(fā)送到熵編碼單元56及運動補償單元44。
[0068]由運動補償單元44執(zhí)行的運動補償可涉及基于由運動估計單元42確定的運動向量來提取或產(chǎn)生預測性塊。再次,在一些實例中,運動估計單元42及運動補償單元44可在功能上集成。在接收到當前視頻塊的PU的運動向量時,運動補償單元44可在參考圖片列表中的一者中探尋運動向量所指向的預測性塊。求和器50通過從正被譯碼的當前視頻塊的像素值中減去預測性塊的像素值來形成殘余視頻塊,從而形成像素差值,如下文所論述。一般來說,運動估計單元42執(zhí)行相對于明度分量的運動估計,且運動補償單元44將基于明度分量所計算的運動向量用于色度分量及明度分量兩者。模式選擇單元40還可產(chǎn)生與視頻塊及視頻切片相關聯(lián)的語法元素以供視頻解碼器30用于解碼視頻切片的視頻塊。
[0069]如上文所描述,作為由運動估計單元42及運動補償單元44執(zhí)行的幀間預測的替代例,幀內預測處理單元46可對當前塊進行幀內預測。明確地說,幀內預測處理單元46可確定用以編碼當前塊的幀內預測模式。在一些實例中,幀內預測處理單元46可(例如)在單獨編碼遍次期間使用各種幀內預測模式編碼當前塊,且?guī)瑑阮A測處理單元46 (或在一些實例中,模式選擇單元40)可從經(jīng)測試模式中選擇要使用的適當幀內預測模式。
[0070]舉例來說,幀內預測處理單元46可對于各種經(jīng)測試的幀內預測模式使用位率-失真分析來計算位率-失真值,且在經(jīng)測試模式當中選擇具有最佳位率-失真特性的幀內預測模式。位率-失真分析大體上確定經(jīng)編碼塊與原始未經(jīng)編碼塊之間的失真(或誤差)的量以及用以產(chǎn)生經(jīng)編碼塊的位率(即,位數(shù)目),所述原始未經(jīng)編碼塊經(jīng)編碼以產(chǎn)生所述經(jīng)編碼塊。幀內預測處理單元46可根據(jù)各種經(jīng)編碼塊的失真及位率計算比率,以確定哪一幀內預測模式針對所述塊展現(xiàn)最佳位率-失真值。
[0071]在選擇塊的幀內預測模式之后,幀內預測處理單元46可將指示塊的選定幀內預測模式的信息提供到熵編碼單元56。熵編碼單元56可編碼指示選定幀內預測模式的信息。視頻編碼器20可在經(jīng)發(fā)射的位流中包含配置數(shù)據(jù),所述配置數(shù)據(jù)可包含:多個幀內預測模式索引表及多個經(jīng)修改的幀內預測模式索引表(也被稱作碼字映射表)、各種塊的編碼上下文的定義,及將用于所述上下文中的每一者的最有可能的幀內預測模式、幀內預測模式索弓I表及經(jīng)修改的幀內預測模式索弓I表的指示。
[0072]視頻編碼器20通過從正被譯碼的原始視頻塊減去來自模式選擇單元40的預測數(shù)據(jù)而形成殘余視頻塊。求和器50表示執(zhí)行此減法運算的一或多個組件。變換處理單元52將例如離散余弦變換(DCT)或概念上類似的變換等變換應用于殘余塊,從而產(chǎn)生包括殘余變換系數(shù)值的視頻塊。變換處理單元52可執(zhí)行概念上類似于DCT的其它變換。還可使用小波變換、整數(shù)變換、子帶變換或其它類型的變換。在任何狀況下,變換處理單元52將變換應用于殘余塊,從而產(chǎn)生殘余變換系數(shù)的塊。所述變換可將殘余信息從像素值域轉換到變換域(例如,頻域)。變換處理單元52可將所得變換系數(shù)發(fā)送到量化單元54。量化單元54量化所述變換系數(shù)以進一步減小位率。量化過程可減小與所述系數(shù)中的一些或全部相關聯(lián)的位深度??赏ㄟ^調整量化參數(shù)而修改量化程度。在一些實例中,量化單元54可接著執(zhí)行對包含經(jīng)量化變換系數(shù)的矩陣的掃描。或者,熵編碼單元56可執(zhí)行所述掃描。
[0073]在量化之后,熵編碼單元56熵譯碼經(jīng)量化變換系數(shù)。舉例來說,熵編碼單元56可執(zhí)行上下文自適應性可變長度譯碼(CAVLC)、上下文自適應性二進制算術譯碼(CABAC)、基于語法的上下文自適應性二進制算術譯碼(SBAC)、機率區(qū)間分割熵(PIPE)譯碼或另一熵譯碼技術。在基于上下文的熵譯碼的狀況下,上下文可基于相鄰塊。在通過熵編碼單元56進行的熵譯碼之后,可將經(jīng)編碼位流發(fā)射到另一裝置(例如,視頻解碼器30)或經(jīng)封存以供稍后發(fā)射或檢索。
[0074]反量化單元58及反變換處理單元60分別應用反量化及反變換,以在像素域中重建構殘余塊(例如)供稍后用作參考塊。運動補償單元44可通過將殘余塊添加到參考圖片存儲器64的幀中的一者的預測性塊來計算參考塊。運動補償單元44還可對所述經(jīng)重建構的殘余塊應用一或多個內插濾波器以計算用于在運動估計中使用的次整數(shù)像素值。求和器62將經(jīng)重建構的殘余塊加到由運動補償單元44產(chǎn)生的經(jīng)運動補償?shù)念A測塊,以產(chǎn)生經(jīng)重建構的視頻塊以供存儲于參考圖片存儲器64中。
[0075]圖2的視頻編碼器20表示經(jīng)配置以實施本發(fā)明中所描述的技術中的一或多者的視頻編碼器的實例。在所述技術的一個實例中,視頻編碼器20可經(jīng)配置以編碼關于在位流的部分中是否可發(fā)生參數(shù)集更新的指示。所述指示可由視頻編碼器20產(chǎn)生以便向視頻解碼器通知是否可發(fā)生經(jīng)存儲參數(shù)集的更新。以此方式,基于所述指示,視頻解碼器首先確定在位流的部分中究竟是否允許參數(shù)集更新,之后才確定是否實際地執(zhí)行更新(例如,通過執(zhí)行經(jīng)存儲的作用中參數(shù)集與具有相同識別值的相同類型的新參數(shù)集之間的內容比較)。
[0076]在一些狀況下,指示可包括關于是否可更新針對位流的部分(例如,經(jīng)譯碼視頻序列或G0P)的參數(shù)集中的任一者的單個指示。在此狀況下,相同指示可用于所有類型的參數(shù)集,包含視頻參數(shù)集(VPS)、序列參數(shù)集(SPS)、圖片參數(shù)集(PPS),及/或自適應性參數(shù)集(APS)。在其它狀況下,指示可包括若干不同指示,其中每一者指示在位流的部分中是否可更新特定類型的參數(shù)集。指示可為位流層級指示(例如,包含于位流的部分中的語法元素)。舉例來說,指示可為包含于位流中的補充增強信息(SEI)網(wǎng)絡抽象層(NAL)單元中的語法元素(例如,旗標)。作為另一實例,指示可為包含于位流中的序列參數(shù)集(SPS)NAL單元中的語法元素(例如,旗標)。
[0077]在其它實例中,指示可為簡檔定義中的要求。在額外實例中,當將視頻位流用于基于實時輸送協(xié)議(RTP)的發(fā)射環(huán)境(例如,用于媒體數(shù)據(jù)輸送的使用RTP的流式傳輸或多播)中時,指示可被定義為媒體類型參數(shù)且包含于會話描述協(xié)議(SDP)中。在此狀況下,指示可用于會話協(xié)商階段(也被稱為能力交換)中。在又其它實例中,指示可被定義為包含于超文本傳送協(xié)議(HTTP)流式傳輸環(huán)境(例如,DASH)中的媒體呈現(xiàn)描述(MPD)中的流性質。
[0078]在技術的另一實例中,視頻編碼器20可經(jīng)配置以針對每一 CRA圖片編碼關于執(zhí)行從CRA存取單元對位流的隨機存取是否要求從先前存取單元提取參數(shù)集的指示。所述指示可由視頻編碼器20產(chǎn)生以便向視頻解碼器通知是否需要包含于先前存取單元中的參數(shù)集以執(zhí)行從特定CRA存取單元的隨機存取。以此方式,基于所述指示,視頻解碼器首先確定從特定CRA存取單元的隨機存取解碼是否要求提取操作,且可通過選擇供執(zhí)行隨機存取的不同RAP圖片而避免執(zhí)行提取操作。所述指示對于在HEVC標準中引入的CRA存取單元尤其有用,因為CRA圖片可定位于經(jīng)譯碼視頻序列內的任何點處且不清除DPB,此在無較低譯碼效率的情況下提供對位流的隨機存取的更多選項。
[0079]在一些狀況下,指示可包括特定類型的NAL單元,例如,特定類型的SPS、SEI或存取單元定界符NAL單元,其包含于位流中的每一 CRA圖片的存取單元中。在其它狀況下,指示可包括語法元素(例如,旗標),其包含于NAL單元有效負載(例如,SPS、SEI或存取單元定界符NAL單元有效負載)中;或包含于NAL單元標頭中,NAL單元標頭包含于位流中的每一 CRA圖片的存取單元中。在一個實例中,指示可包括包含于CRA圖片的存取單元中的SEINAL單元中的旗標。盡管主要關于CRA圖片予以描述,但視頻編碼器20可針對其它類型的RAP圖片編碼類似指示,其它類型的RAP圖片包含IDR圖片及漸進解碼刷新(GDR)圖片。
[0080]圖3為說明解碼經(jīng)編碼視頻序列的視頻解碼器30的實例的框圖。在圖3的實例中,視頻解碼器30包含熵解碼單元70、運動補償單元72、幀內預測處理單元74、反量化單元76、反變換處理單元78、求和器80,及參考圖片存儲器82。在一些實例中,視頻解碼器30可執(zhí)行大體上與關于視頻編碼器20 (圖2)所描述的編碼遍次互逆的解碼遍次。
[0081]在解碼過程期間,視頻解碼器30從視頻編碼器20接收經(jīng)編碼的視頻流,所述流表示經(jīng)編碼視頻切片的視頻塊及關聯(lián)的語法元素。視頻解碼器30可從網(wǎng)絡實體29接收經(jīng)編碼視頻位流。舉例來說,網(wǎng)絡實體29可為流服務器、媒體感知網(wǎng)絡元件(MANE)、視頻編輯器/接合器、中間網(wǎng)絡元件,或經(jīng)配置以實施上文所描述的技術中的一或多者的其它此類裝置。網(wǎng)絡實體29可包含經(jīng)配置以執(zhí)行本發(fā)明的一些技術之外部裝置。本發(fā)明中所描述的一些技術可在網(wǎng)絡實體29將經(jīng)編碼視頻位流發(fā)射到視頻解碼器30之前由網(wǎng)絡實體29來實施。在一些視頻解碼系統(tǒng)中,網(wǎng)絡實體29及視頻解碼器30可為單獨裝置的部分,而在其它情況下,關于網(wǎng)絡實體29所描述的功能性可通過包括視頻解碼器30的相同裝置來執(zhí)行。
[0082]視頻解碼器30的熵解碼單元70熵解碼位流以產(chǎn)生經(jīng)量化系數(shù)、運動向量或幀內預測模式指示符及其它語法元素。熵解碼單元70將運動向量及其它語法元素轉遞到運動補償單元72。視頻解碼器30可在視頻切片層級及/或視頻塊層級處接收語法元素。
[0083]當視頻切片經(jīng)譯碼為幀內譯碼⑴切片時,幀內預測處理單元74可基于所傳訊的幀內預測模式及來自當前幀或圖片的先前經(jīng)解碼塊的數(shù)據(jù)而產(chǎn)生當前視頻切片的視頻塊的預測數(shù)據(jù)。當視頻幀經(jīng)譯碼為幀間譯碼(即,B或P)切片時,運動補償單元72基于從熵解碼單元70接收的運動向量及其它語法元素而產(chǎn)生當前視頻切片的視頻塊的預測性塊。可從參考圖片列表中的一者內的參考圖片中的一者產(chǎn)生預測性塊。視頻解碼器30可基于存儲于參考幀存儲器82 (其可被稱作經(jīng)解碼圖片緩沖器(DPB))中的參考圖片來建構參考幀列表:列表O及列表I。
[0084]運動補償單元72通過剖析運動向量及其它語法元素而確定當前視頻切片的視頻塊的預測信息,且使用所述預測信息以產(chǎn)生正被解碼的當前視頻塊的預測性塊。舉例來說,運動補償單元72使用一些所接收的語法元素以確定用以譯碼視頻切片的視頻塊的預測模式(例如,幀內預測或幀間預測)、幀間預測切片類型(例如,B切片或P切片)、切片的參考圖片列表中的一或多者的建構信息、切片的每一幀間編碼視頻塊的運動向量、切片的每一幀間譯碼視頻塊的幀間預測狀態(tài),及用以解碼當前視頻切片中的視頻塊的其它信息。
[0085]運動補償單元72還可基于內插濾波器執(zhí)行內插。運動補償單元72可使用如由視頻編碼器20在視頻塊的編碼期間使用的內插濾波器,以計算參考塊的次整數(shù)像素的內插值。在此狀況下,運動補償單元72可從所接收的語法元素確定由視頻編碼器20使用的內插濾波器且使用所述內插濾波器以產(chǎn)生預測性塊。
[0086]反量化單元76將位流中所提供且由熵解碼單元70解碼的經(jīng)量化變換系數(shù)反量化(即,解量化)。反量化過程可包含使用由視頻解碼器30針對視頻切片中的每一視頻塊計算的量化參數(shù)QPY,以確定量化程度及(同樣)應應用的反量化的程度。反變換處理單元78將反轉換(例如,反DCT、反整數(shù)變換或概念上類似的反變換過程)應用于變換系數(shù)以便在像素域中產(chǎn)生殘余塊。
[0087]在運動補償單元72基于運動向量及其它語法元素產(chǎn)生當前視頻塊的預測性塊之后,視頻解碼器30通過對來自反變換單元78的殘余塊與由運動補償單元72產(chǎn)生的對應預測性塊求和而形成經(jīng)解碼視頻塊。求和器80表示執(zhí)行此求和運算的(多個)組件。如果需要,還可應用解塊濾波器來對經(jīng)解碼塊濾波以便移除方塊效應假影(blockinessartifact)。其它迴路濾波器(譯碼迴路中抑或譯碼迴路后)還可用以使像素轉變平滑,或以其它方式改進視頻質量。接著將給定幀或圖片中的經(jīng)解碼視頻塊存儲于參考圖片存儲器82中,參考圖片存儲器82存儲用于后續(xù)運動補償?shù)膮⒖紙D片。參考幀存儲器82還存儲經(jīng)解碼視頻以用于稍后在顯示裝置(例如,圖1的顯示裝置32)上呈現(xiàn)。
[0088]圖3的視頻解碼器30表示經(jīng)配置以實施本發(fā)明中所描述的技術中的一或多者的視頻解碼器的實例。在所述技術的一個實例中,視頻解碼器30可經(jīng)配置以解碼關于在位流的部分中是否可發(fā)生參數(shù)集更新的指示。當所述指示指示在位流的部分中不能夠發(fā)生參數(shù)集更新時,視頻解碼器30針對位流的整個部分啟動給定類型的初始參數(shù)集。在此狀況下,在接收到具有與初始參數(shù)集相同的類型且具有與初始參數(shù)集相同的識別值之后續(xù)參數(shù)集時,視頻解碼器30無需確定是否更新經(jīng)譯碼視頻序列的初始參數(shù)集且可忽略后續(xù)參數(shù)集。
[0089]HEVC HM包含參數(shù)集的概念。參數(shù)集為包含語法元素的語法結構,所述語法元素經(jīng)配置以指示使視頻解碼器能夠重建構經(jīng)譯碼視頻的信息??苫谟烧Z法元素指示的信息及預期語法元素在位流中改變的頻率而使語法元素包含于特定類型的參數(shù)集中。舉例來說,視頻參數(shù)集(VPS)包含描述經(jīng)譯碼視頻序列的總體特性(包含時間子層之間的相依性)的語法元素。序列參數(shù)集(SPS)包含被預期對于圖片序列內的圖片來說保持不變的語法元素(例如,圖片次序、參考圖片數(shù)目及圖片大小)。圖片參數(shù)集(PPS)包含可在序列內在圖片間改變的語法元素(例如,熵譯碼模式、量化參數(shù)及位深度)。自適應性參數(shù)集(APS)包含被預期在序列的圖片內改變的語法元素(例如,塊大小及解塊濾波)。
[0090]參數(shù)集概念將不頻繁改變的信息的發(fā)射與經(jīng)譯碼視頻數(shù)據(jù)的發(fā)射解耦。在一些實例中,可“帶外”傳遞參數(shù)集(即,不將其與含有經(jīng)譯碼視頻數(shù)據(jù)的單元一起輸送)??赡苄枰趲獾匕l(fā)射參數(shù)集,因為相比于數(shù)據(jù)信道內的“帶內”發(fā)射,帶外發(fā)射通常更為可靠。在HEVC HM中,每一 VPS包含VPS識別(ID)值,每一 SPS包含SPS ID且參考使用VPS ID的VPS’且每一 PPS包含PPS ID且參考使用SPS ID的SPS。另外,每一切片標頭參考使用PPS ID 的 PPS。
[0091]在位流中,當具有特定參數(shù)集ID值的特定類型的參數(shù)集具有與具有相同ID值的相同類型的先前參數(shù)集(按位流次序或解碼次序)的內容不同的內容時,可更新具有那一特定ID值的特定類型的參數(shù)集。當發(fā)生參數(shù)集更新時,視頻解碼器30存儲具有給定ID值的當前參數(shù)集以替換具有相同類型且具有相同ID值的先前參數(shù)集。
[0092]當需要特定類型的新參數(shù)集,但已使用所有可能ID值時,可發(fā)生參數(shù)集更新。在經(jīng)接合的位流中,即使在未完全利用參數(shù)集ID值空間時也可發(fā)生參數(shù)集更新。位流接合指代兩個或兩個以上位流或位流的部分的組合。第一位流可由第二位流附加,可能地對所述位流中的一者或兩者進行一些修改以產(chǎn)生經(jīng)接合的位流。第二位流中的第一經(jīng)譯碼圖片也被稱作接合點。經(jīng)接合的位流中的接合點處的圖片起源自第二位流,而經(jīng)接合的位流中的緊接在接合點之前的圖片起源自第一位流。
[0093]位流通常使用每一類型的幾個參數(shù)集(例如,幾個SPS及幾個PPS),且有時使用每一類型的僅一個參數(shù)集。另外,位流中的每一者通常針對不同類型的參數(shù)集中的每一者以最小參數(shù)集ID值O開始。以此方式,如果兩個位流被接合,則很可能針對特定類型的參數(shù)集的同一 ID值(例如,具有ID值O的SPS)由接合點及緊接在所述接合點圖片之前的圖片兩者參考,但所述兩個參數(shù)集包含不同內容。因此,由所述接合點之前的圖片所參考的參數(shù)集需要用由接合點圖片參考的具有相同ID值的相同類型的參數(shù)集更新。在此狀況下,在經(jīng)接合的位流開始時不能夠發(fā)射所述經(jīng)接合的位流的參數(shù)集,且因此,不能夠相對于位流的經(jīng)譯碼視頻序列在帶外地發(fā)射所述經(jīng)接合的位流的參數(shù)集。
[0094]常規(guī)地,為了確定是否應啟動具有特定ID值的任何類型的當前參數(shù)集以更新具有相同ID值的先前參數(shù)集,視頻解碼器比較所述當前參數(shù)集的內容與所述先前參數(shù)集的內容以確定內容是否不同。當當前參數(shù)集的內容不同于先前參數(shù)集時,視頻解碼器針對位流啟動當前參數(shù)集且去啟動先前參數(shù)集。視頻解碼器每當在其接收到具有與較早所接收的參數(shù)集的ID值相同的特定ID值的特定類型的新參數(shù)集時就執(zhí)行此內容比較。當在帶內發(fā)射參數(shù)集(即,與位流的經(jīng)譯碼視頻序列一起發(fā)射)時,視頻解碼器可接收所述參數(shù)集的重復發(fā)射以實現(xiàn)改進的誤差恢復。視頻解碼器接著執(zhí)行針對每一重復的參數(shù)集的內容比較。此內容比較是不必要的且將計算負擔強加給視頻解碼器。
[0095]本發(fā)明中所描述的技術提供經(jīng)配置以指示在位流的部分(例如,經(jīng)譯碼視頻序列或經(jīng)譯碼視頻序列中的G0P)中是否可發(fā)生參數(shù)集更新的指示符。當所述指示符指示在位流的部分中不能夠發(fā)生參數(shù)集更新時,視頻解碼器30僅針對位流的整個部分存儲且啟動具有特定ID值的第一參數(shù)集。另外,當指示符指示不能夠發(fā)生參數(shù)集更新時,視頻解碼器30將不執(zhí)行任何參數(shù)集更新,且因此無需比較第一參數(shù)集的內容與具有相同ID值的相同類型的第二參數(shù)集的內容。以此方式,視頻解碼器30可操作,就好像第一參數(shù)集的內容與具有相同ID值的相同類型的任何其它參數(shù)集中所包含的內容等同一樣。
[0096]當指示符指示在位流的部分中可發(fā)生參數(shù)集更新時,視頻解碼器30存儲且啟動具有特定ID值的第一參數(shù)集,但可使用具有相同ID值的相同類型的第二參數(shù)集來更新經(jīng)存儲的第一參數(shù)集以替換所述經(jīng)存儲的第一參數(shù)集。在一些狀況下,視頻解碼器30可針對位流的部分自動啟動第二參數(shù)集,且去啟動第一參數(shù)集。在其它狀況下,視頻解碼器30可比較第一參數(shù)集的內容與第二參數(shù)集的內容。當?shù)诙?shù)集的內容不同于第一參數(shù)集的內容時,視頻解碼器30針對位流的部分啟動第二參數(shù)集,且去啟動第一參數(shù)集。
[0097]指示可包括包含于位流中的位流層級語法元素,例如,旗標。舉例來說,指示可包括包含于與位流中的經(jīng)譯碼視頻序列相關聯(lián)的一或多個補充增強信息(SEI)網(wǎng)絡抽象層(NAL)單元中的旗標。作為另一實例,指示可包括包含于位流中的經(jīng)譯碼視頻序列的一或多個序列參數(shù)集(SPS)NAL單元中的旗標。
[0098]在一個實例中,旗標可指示在位流的部分中是否可更新任何參數(shù)集。因此,單個旗標可用以指示不同類型的參數(shù)集的更新狀態(tài)。在此狀況下,相同旗標可用于所有類型的參數(shù)集,包含VPS、SPS、PPS及/或APS。當旗標等于I時,可更新參數(shù)集。當旗標等于O時,不應更新參數(shù)集,且視頻解碼器30不執(zhí)行具有相同類型且具有相同參數(shù)集ID值的參數(shù)集之間的內容比較。當旗標等于O時,內容比較沒有必要,因為視頻解碼器30可進行操作就好像具有相同類型且具有相同ID值的參數(shù)集具有相同內容一樣。
[0099]在另一實例中,旗標可指示在位流的部分中是否可更新特定類型的參數(shù)集。在此狀況下,不同旗標可用于不同類型的參數(shù)集中的每一者,包含VPS、SPS、PPS及/或APS。因此,每一類型的參數(shù)集實際上可具有其自身的用以指示其是否可被更新的旗標。當旗標等于I時,可更新所述特定類型的參數(shù)集。當旗標等于O時,不應更新特定類型的參數(shù)集,且視頻解碼器30不執(zhí)行具有所述特定類型且具有相同參數(shù)集ID值的參數(shù)集之間的內容比較。當旗標等于O時,內容比較沒有必要,因為視頻解碼器30可進行操作就好像具有所述特定類型且具有相同ID值的參數(shù)集具有相同內容一樣。
[0100]在另外實例中,旗標可指示在位流的部分中是否可更新不同類型的兩個或兩個以上參數(shù)集。在此狀況下,一個旗標可用于不同類型的參數(shù)集中的兩者或兩者以上(例如,SPS及PPS),且另一旗標可用于不同類型的參數(shù)集中的一或多者(例如,VPS)。因此,一些類型的參數(shù)集可共享旗標以指示聯(lián)合更新狀態(tài),而其它類型的參數(shù)集可具有個別旗標以指示個別更新狀態(tài)。另外,在一些狀況下,指示可包括為具有多個位的單個語法元素的位遮罩或碼字,其中每一位對應于參數(shù)集中的一或多者的更新狀態(tài),或碼字具有特定值以指示不同參數(shù)集的更新狀態(tài)的不同組合。
[0101]在一些狀況下,關于在位流的部分中是否可發(fā)生參數(shù)集更新的指示可確定如何將參數(shù)集發(fā)射到視頻解碼器30。舉例來說,當在位流的部分中可發(fā)生參數(shù)集更新時,不可相對于位流的經(jīng)譯碼視頻序列在帶外地發(fā)射參數(shù)集,因為針對位流的不同部分(例如,在經(jīng)接合的位流的接合點圖片處)可發(fā)生更新。
[0102]根據(jù)所述技術,在一個實例中,當指示符指示在位流的部分中不能夠發(fā)生參數(shù)集更新時,視頻解碼器30可在帶外發(fā)射(即,與位流的經(jīng)譯碼視頻序列分離的發(fā)射)中接收第一參數(shù)集。在此狀況下,因為第一參數(shù)集為針對整個位流所啟動的唯一參數(shù)集,所以例如視頻編碼器20等視頻編碼器可在帶外編碼所述第一參數(shù)集,使得所述第一參數(shù)集與經(jīng)譯碼視頻序列數(shù)據(jù)分離。在另一實例中,當指示符指示在位流的部分中不能夠發(fā)生參數(shù)集更新時,視頻解碼器30可在帶內發(fā)射(即,與位流的經(jīng)譯碼視頻序列一起的發(fā)射)中接收第一參數(shù)集,而不比較所述第一參數(shù)集的任何重復的發(fā)射的內容。在此狀況下,當例如視頻編碼器20等視頻編碼器編碼第一參數(shù)集的重復的發(fā)射以實現(xiàn)改進的誤差恢復時,視頻解碼器30不執(zhí)行針對所述重復的參數(shù)集的內容比較。內容比較沒有必要,因為根據(jù)指示,視頻解碼器30可進行操作就好像具有相同類型且具有相同ID值的參數(shù)集具有相同內容一樣。
[0103]在一些實例中,指示可為包含于位流中(例如,包含于VPS、SPS、PPS或APS中)的語法元素,例如,旗標。作為一個實例,指示可為包含于經(jīng)譯碼視頻序列中的語法元素。作為另一實例,指示可為簡檔定義中的要求。在其它實例中,當將視頻位流用于基于實時輸送協(xié)議(RTP)的發(fā)射環(huán)境(例如,使用RTP用于媒體數(shù)據(jù)輸送的流式傳輸或多播)中時,指示可被定義為媒體類型參數(shù)且包含于會話描述協(xié)議(SDP)中。在此狀況下,指示可用于會話協(xié)商階段(也被稱為能力交換)中。在又其它實例中,指示可被定義為包含于超文本傳送協(xié)議(HTTP)流式傳輸環(huán)境(例如,DASH)中的媒體呈現(xiàn)描述(MPD)中的流性質。
[0104]在技術的另一實例中,視頻解碼器30可經(jīng)配置以解碼針對每一 CRA圖片的關于執(zhí)行從CRA存取單元對位流的隨機存取是否要求從先前存取單元提取參數(shù)集的指示。所述指示對于在HEVC標準中引入的CRA存取單元尤其有用,因為CRA圖片可定位于經(jīng)譯碼視頻序列內的任何點處且不清除DPB,此在無較低譯碼效率的情況下提供對位流的隨機存取的更多選項。
[0105]當所述指示指示了不需要來自先前存取單元的參數(shù)集來進行從特定CRA圖片的隨機存取時,視頻解碼器30可確定在無提取操作的情況下執(zhí)行從那一 CRA圖片的隨機存取。當所述指示指示了需要來自先前存取單元的參數(shù)集來進行從特定CRA圖片的隨機存取時,視頻解碼器30可確定不執(zhí)行從那一圖片的隨機存取以便避免提取操作。在一些狀況下,視頻解碼器30可解碼針對位流的部分(例如,經(jīng)譯碼視頻序列)內的若干不同CRA圖片的指示以便識別存取單元,可在不執(zhí)行參數(shù)集提取操作的情況下執(zhí)行從所述存取單元的隨機存取。以此方式,視頻解碼器30可通過選擇供執(zhí)行隨機存取的不同CRA圖片而避免執(zhí)行提取操作。
[0106]隨機存取指代從不為位流中的第一經(jīng)譯碼圖片的經(jīng)譯碼圖片開始的解碼視頻位流。在例如廣播及流式傳輸?shù)仍S多視頻應用中需要對位流的隨機存取,例如,供用戶在不同信道之間切換、跳轉到視頻的特定部分、用于不同位流的接合,或切換到不同位流以用于對位率、幀速率、空間分辨率及其類似者的流調適。通過以規(guī)則時間間隔將隨機存取圖片或隨機存取點插入到視頻位流中來啟用此特征。瞬時解碼器刷新(IDR)圖片可用于隨機存取。IDR圖片開始經(jīng)譯碼視頻序列且總是清除經(jīng)解碼圖片緩沖器(DPB),因此按解碼次序在所述IDR圖片之后的圖片不能夠將在所述IDR圖片之前解碼的圖片用于參考。因此,依賴于IDR圖片以供隨機存取的位流可具有顯著較低譯碼效率。
[0107]為了改進譯碼效率,將清晰隨機存取(CRA)圖片的概念引入HEVC HM中。不同于IDR圖片,CRA圖片可定位于經(jīng)譯碼視頻序列內的任何點處且不清除DPB,其在無較低譯碼效率的情況下提供對位流的隨機存取的更多選項。因為CRA圖片不清除DPB,所以允許按解碼次序在CRA圖片之后但按輸出次序在CRA圖片之前的圖片將在所述CRA圖片之前解碼的圖片用于參考。按解碼次序在CRA圖片之后但按輸出次序在CRA圖片之前的圖片被稱作CRA圖片之前導圖片。如果解碼從在當前CRA圖片之前的IDR或CRA圖片開始,則可正確地解碼CRA圖片之前導圖片。然而,當發(fā)生從當前CRA圖片的隨機存取時,不能夠正確地解碼CRA圖片之前導圖片。因此,通常在隨機存取解碼期間從DPB舍棄前導圖片。為了防止從取決于解碼開始之處可能不可用的參考圖片的誤差傳播,在解碼次序及輸出次序兩方面皆在CRA圖片之后的所有圖片可受約束而不將按解碼次序或輸出次序在所述CRA圖片之前的任何圖片(其包含前導圖片)用作參考。
[0108]在H.264/AVC標準中通過復原點SEI消息來支持類似隨機存取功能性。H.264/AVC解碼器實施可能或可能不支持復原點SEI消息功能性。在HEVC標準中,以CRA圖片開始的位流被認為是符合的位流。當位流以CRA圖片開始時,所述CRA圖片之前導圖片可指代不可用參考圖片,且因此不可解碼。HEVC標準指定開始CRA圖片之前導圖片不被輸出。然而,為了建立位流符合性,HEVC標準指定了解碼過程以產(chǎn)生用于解碼非輸出前導圖片的不可用參考圖片。符合的解碼器實施不必須遵循那一解碼過程,只要與從經(jīng)譯碼視頻序列的開始執(zhí)行解碼過程的情況相比可產(chǎn)生等同輸出即可。
[0109]另外,HEVC標準中的符合的位流可能根本不含有IDR圖片,且因此,可含有經(jīng)譯碼視頻序列的子集或不完整的經(jīng)譯碼視頻序列。在HEVC標準中,經(jīng)譯碼視頻序列被定義為存取單元序列,其按解碼次序包含IDR存取單元、繼之以零個或零個以上非IDR存取單元(包含直到(但不包含)任何后續(xù)IDR存取單元的所有后續(xù)存取單元)。包含于經(jīng)譯碼視頻序列中的存取單元對應于視頻序列的圖片。存取單元中的每一者包含一或多個網(wǎng)絡抽象層(NAL)單元。HEVC標準定義視頻經(jīng)譯碼層(VCL) NAL單元及非VCL NAL單元。VCL NAL單元含有圖片的視頻數(shù)據(jù)的切片。非VCL NAL單元含有除了視頻數(shù)據(jù)切片以外的信息。舉例來說,非VCL NAL單元可含有定界符數(shù)據(jù)或參數(shù)集,例如,VPS、SPS或PPS。非VCL NAL單元的另一實例為SEI NAL單元,其可包含由視頻解碼器在解碼位流時使用的圖片定時消息。
[0110]當視頻解碼器30執(zhí)行從包含于位流中的CRA圖片的隨機存取時,將不解碼按輸出或解碼次序在所述CRA圖片之前的所有圖片且所述圖片不可用作參考圖片。在此狀況下,為了解碼CRA圖片或按輸出或解碼次序的任何后繼圖片,視頻解碼器30可需要提取包含于不可用的先前圖片中的一者的存取單元中的一或多個參數(shù)集,此為繁重的操作。
[0111]作為一個實例,SPS可包含于位流的第一 CRA圖片的存取單元中,且SPS不可包含于位流之后續(xù)第二 CRA圖片中。在此狀況下,如果執(zhí)行從第二 CRA圖片的隨機存取且所有先前圖片(包含第一 CRA圖片)不可用,則SPS也不可用于解碼第二 CRA圖片及位流中的任何后續(xù)圖片。為了執(zhí)行從第二 CRA圖片的隨機存取,視頻解碼器30需要從不可用的第一CRA圖片提取SPS。
[0112]常規(guī)地,為了避免提取操作,視頻解碼器可執(zhí)行貫穿經(jīng)接收位流的檢查以確定將哪些參數(shù)集用于位流的不同部分且確定是否可從位流中的RAP圖片進行隨機存取。對于視頻解碼器來說,提取操作及位流檢查操作皆可為處理器密集型的繁重操作,且將需要避免這些操作。
[0113]本發(fā)明的技術提供關于執(zhí)行從位流中的特定CRA存取單元的隨機存取是否要求從先前存取單元提取參數(shù)集的指示。當不需要先前參數(shù)集來進行從特定CRA存取單元的隨機存取時,視頻解碼器30可在無提取操作的情況下執(zhí)行從那一特定CRA存取單元的隨機存取。相反地,當需要先前參數(shù)集來進行從特定CRA存取單元的隨機存取時,視頻解碼器30不可執(zhí)行從那一特定CRA存取單元的隨機存取以便避免提取操作。在一些實例中,當需要先前參數(shù)集來進行從特定CRA存取單元的隨機存取時,視頻解碼器30可在從先前存取單元提取參數(shù)集之后執(zhí)行從那一 CRA存取單元的隨機存取。
[0114]根據(jù)本發(fā)明中所描述的技術,可針對每一 CRA存取單元在位流中包含指示,所述指示用以指示是否需要包含于按輸出或解碼次序的先前存取單元中的參數(shù)集以解碼所述CRA存取單元及按輸出或解碼次序的所有后續(xù)存取單元。如果不需要先前參數(shù)集來進行從一個CRA存取單元的隨機存取,則視頻解碼器30可執(zhí)行從那一存取單元對位流的隨機存取,而不依賴于包含于先前存取單元中的任何參數(shù)集NAL單元。以此方式,可簡單地跳過或忽略所有較早NAL單元。
[0115]與在上文所闡述的實例中一樣,SPS NAL單元可包含于視頻序列的第一 CRA圖片的存取單元中,且SPS NAL單元不可包含于視頻序列之后續(xù)第二 CRA圖片中。根據(jù)本發(fā)明中所描述的技術,在第一 CRA圖片的存取單元中可包含指示,所述指示用以指示不需要來自按輸出或解碼次序的先前存取單元的參數(shù)集以解碼所述第一 CRA圖片或按輸出或解碼次序的任何后續(xù)圖片。另外,在第二 CRA圖片的存取單元中可包含指示,所述指示用以指示需要來自按輸出或解碼次序的先前存取單元的參數(shù)集(即,第一 CRA圖片的存取單元中的SPS)以解碼所述第二 CRA圖片或按輸出或解碼次序的任何后續(xù)圖片。在此實例中,基于所述指示,視頻解碼器30可確定執(zhí)行從第一 CRA圖片的隨機存取,但不執(zhí)行從第二 CRA圖片的隨機存取以便避免提取操作。
[0116]盡管主要關于CRA圖片予以描述,但本發(fā)明的技術可類似地用于其它類型的RAP圖片,包含IDR圖片及漸進解碼刷新(GDR)圖片。在一些狀況下,指示可包括包含于經(jīng)譯碼視頻序列中的每一 IDR或CRA圖片的存取單元中的特定類型的網(wǎng)絡抽象層(NAL)單元。在其它狀況下,指示可包括包含于NAL單元有效負載中的語法元素(例如,旗標),所述NAL單元有效負載包含于經(jīng)譯碼視頻序列中的每一 IDR或CRA圖片的存取單元中。在一個實例中,指示可包括包含于CRA圖片的存取單元中的補充增強信息(SEI)NAL單元中的旗標。
[0117]另外,舉例來說,可使用具有相異NAL單元類型的特定類型的SPS來傳訊關于給定圖片的指示。在此實例中,可需要使所述特定類型的SPS包含于所述圖片的存取單元中的第一 NAL單元中,或包含于在存取單元定界符NAL單元(如果存在)之后的第一 NAL單元中。在另一實例中,可使用具有相異NAL單元類型的特定類型的存取單元定界符或包含于給定圖片的存取單元中的存取單元定界符NAL單元的有效負載中的旗標來傳訊針對所述圖片的指示。在另外實例中,可使用包含于給定圖片的存取單元中的NAL單元標頭中的旗標來傳訊關于所述圖片的指示。另外,可使用特定類型的SEI消息或SEI消息中的旗標來傳訊關于給定圖片的指示。在HEVC HM中,SEI消息可包含于圖片的存取單元中的SEI NAL單元中。
[0118]圖4為說明根據(jù)預測性視頻譯碼技術而譯碼的視頻序列100的概念圖。如圖4中所說明,視頻序列100包含圖片Pic1到Picicitj根據(jù)圖片Pic1到Picltl待顯示的次序來布置且順次地編號所述圖片。如下文中更詳細地描述,輸出或顯示次序未必對應于解碼次序。如圖4中所說明,視頻序列100包含GOP1及GOP2,其中圖片Pic1到Pic5包含于GOP1中且圖片Pic6到Picltl包含于GOP2中。圖4進一步說明Pic5被分割成切片i及切片2,其中切片!及切片2中的每一者包含根據(jù)從左到右從上到下光柵掃描的連續(xù)IXU。另外,Pic5中的最后LCU被說明為根據(jù)四分樹進一步分裂成多個CU。盡管未展示,但圖4中所說明的其它圖片可以類似方式分割成一或多個切片。
[0119]如下文更詳細地描述,HEVC HM包含兩種類型的切片分割方案,即:規(guī)則切片及熵切片。另外,除了切片分割方案以外,HM還包含瓦片(tile)分割方案及波前并行處理(WPP)分割方案。可基于最大發(fā)射單元(MTU)大小匹配及/或并行處理來選擇及應用分割方案。Pic5的切片i及切片2或其它圖片中的任一者可為規(guī)則切片或熵切片。另外,在其它實例中,可使用瓦片或WPP來分割Pic1到Picltl中的每一者。
[0120]另外,圖4關于視頻序列100的GOP2說明I切片、P切片及B切片的概念。與GOP2中的Pic6到Picltl中的每一者相關聯(lián)的箭頭基于由所述箭頭指不的經(jīng)參考圖片而指不圖片包含I切片、P切片抑或B切片。在視頻序列100中,Pic6及Pic9表示包含I切片(即,基于圖片自身內的參考的經(jīng)幀內預測切片)的圖片,圖片Pic7及Picltl表示包含P切片(即,基于先前圖片中的參考的經(jīng)幀間預測切片)的圖片,且Pic8表示包含B切片(S卩,基于先前及后續(xù)圖片兩者中的參考的經(jīng)幀間預測切片)的圖片。
[0121]圖5為說明對應于圖4中所說明的GOP2的經(jīng)譯碼視頻序列120的實例的概念圖。HEVC HM將經(jīng)譯碼視頻序列定義為存取單元序列,其按解碼次序由瞬時解碼刷新(IDR)存取單元、繼之以零個或零個以上非IDR存取單元(包含直到(但不包含)任何后續(xù)IDR存取單元的所有后續(xù)存取單元)組成。經(jīng)譯碼圖片為含有圖片的所有樹塊的圖片的經(jīng)譯碼表示。存取單元為在解碼次序上為連續(xù)的且表示一個經(jīng)譯碼圖片的網(wǎng)絡抽象層(NAL)單元的集合。存取單元可包含表示經(jīng)譯碼圖片的經(jīng)譯碼切片的視頻譯碼層(VCL)NAL單元,及包含定界符數(shù)據(jù)、參數(shù)集及補充增強信息(SEI)消息的非VCL NAL單元。
[0122]如圖5中所說明,經(jīng)譯碼視頻序列120包含對應于Picf^IjPicltl中的每一者的存取單元。根據(jù)解碼次序來順次地布置視頻數(shù)據(jù)流120的存取單元。應注意,對應于Pic9的存取單元位于對應于Pic8的存取單元之前。因此,解碼次序不對應于圖4中所說明的輸出次序。在此實例中,輸出次序與解碼次序之間的差異是歸因于Pic8參考?^9的事實。因此,在可解碼Pic8之前必須解碼Pic9。
[0123]如圖5中所說明,對應于Pic9的存取單元包含存取單元(AU)定界符NAL單元122、圖片參數(shù)集(PPS) NAL單元124、切片0AL單元126,及切片2NAL單元128。切片0AL單元126及切片2NAL單元128各自含有視頻數(shù)據(jù)切片且為VCL NAL單元的實例。如上文關于圖4所描述,Pic9表示包含I切片的圖片。因此,在圖5的實例中,對應于Pic9的存取單元的切片0AL單元126及切片2NAL單元128中的每一者可表示I切片。
[0124]非VCL NAL單元包含除了視頻數(shù)據(jù)切片以外的信息。舉例來說,非VCL可含有定界符數(shù)據(jù)、參數(shù)集,或SEI消息。在圖5中所說明的實例中,AU定界符NAL單元122包含用以將對應于Pic9的存取單元相對于對應于Pic7的存取單元定界的信息。另外,PPS NAL單元124包含圖片參數(shù)集。AU定界符NAL單元122及PPS NAL單元124為非VCL NAL單元的實例。非VCL NAL單元的另一實例為SEI NAL單元。SEI NAL單元可包含圖片定時SEI消息或緩沖周期SEI消息,其由視頻解碼器在解碼位流時使用。圖片定時SEI消息可包含指示何時視頻解碼器應開始解碼VCL NAL單元的信息。緩沖周期SEI消息可包含經(jīng)譯碼圖片緩沖器(CPB)移除延遲信息,其指示何時視頻解碼器應從CPB移除圖片以避免溢位。
[0125]在HEVC HM中,視頻序列、G0P、圖片、切片、CU、PU及TU中的每一者可與被定義成指示那一視頻數(shù)據(jù)結構的視頻譯碼性質的語法元素相關聯(lián)。HM進一步使用參數(shù)集概念。參數(shù)集為包含語法元素的語法結構,所述語法元素被定義成指示應用于參考所述參數(shù)集的任何視頻數(shù)據(jù)結構的視頻譯碼性質。HM使用階層式參數(shù)集機制,其中基于預期視頻譯碼性質將改變的頻率而使語法元素包含于某類型的參數(shù)集中。因此,參數(shù)集機制將不頻繁改變的信息的發(fā)射與經(jīng)譯碼塊數(shù)據(jù)的發(fā)射解耦。在一些應用中,可“帶外”地傳遞參數(shù)集(即,并不將其與經(jīng)譯碼視頻數(shù)據(jù)一起輸送),因為帶外發(fā)射相比于帶內發(fā)射通常更可靠。
[0126]HM定義若干不同類型的參數(shù)集,包含視頻參數(shù)集(VPS)、序列參數(shù)集(SPS)、圖片參數(shù)集(PPS)及自適應性參數(shù)集(APS)中的一或多者。位流可包含每一類型的若干不同參數(shù)集。特定參數(shù)集是使用參數(shù)集識別符(ID)予以識別。每一 VPS包含VPS ID,每一 SPS包含SPS ID且可參考VPS ID,每一 PPS包含PPS ID且參考SPS ID,且每一切片標頭參考PPS ID,且可能參考APS ID。另外,每一緩沖周期補充增強信息(SEI)消息還參考SPS ID,且可能參考VPS ID。在這些實例中的每一者中,可使用可變長度無正負號整數(shù)指數(shù)哥倫布(ue(v))譯碼方法將參數(shù)集ID譯碼為語法元素。
[0127]VPS為包含適用于零個或零個以上完整經(jīng)譯碼視頻序列的語法元素的語法結構。更特定而言,VPS包含描述經(jīng)譯碼視頻序列的總體特性的語法元素,所述特性包含簡檔、階層及層級信息及時間子層之間的相依性。特定VPS是使用編碼為SPS或SEI消息中的語法元素的特定VPS ID予以識別。SPS為包含適用于零個或零個以上完整經(jīng)譯碼視頻序列的語法元素的語法結構。更特定而言,SPS包含被定義成指示被預期在幀序列中保持不變的視頻譯碼性質(例如,圖片次序、參考幀數(shù)目及圖片大小)的語法元素。特定SPS是使用編碼為PPS或SEI消息中的語法元素的特定SPS ID予以識別。
[0128]PPS為包含適用于零個或零個以上完整經(jīng)譯碼圖片的語法元素的語法結構。更特定而言,PPS包含經(jīng)定義以指示可在序列內在圖片間改變的視頻譯碼性質(例如,熵譯碼模式、量化參數(shù)及位深度)的語法元素。特定PPS是使用編碼為切片標頭中的語法元素的特定PPS ID予以識別。APS為包含適用于零個或零個以上完整經(jīng)譯碼圖片的語法元素的語法結構。APS (如果經(jīng)譯碼)可包含經(jīng)定義以指示相比于PPS中所指示的其它性質改變更頻繁的視頻譯碼性質的語法元素。特定APS是使用編碼為切片標頭中的語法元素的APS ID予以識別。
[0129]位流接合指代兩個或兩個以上位流或位流的若干部分的串接或組合。舉例來說,第一位流可由第二位流附加,可能地對所述位流中的一者或兩者進行一些修改以產(chǎn)生經(jīng)接合的位流。第二位流中的第一經(jīng)譯碼圖片也被稱作接合點。因此,在經(jīng)接合的位流中在接合點之后的圖片起源自第二位流,而在經(jīng)接合的位流中在接合點之前的圖片起源自第一位流。在一些狀況下,位流接合器可執(zhí)行位流接合。位流接合器可能為輕量型的且不如視頻編碼器智慧。舉例來說,位流接合器可能未配備有熵解碼能力及熵編碼能力。位流接合可對可縮放性應用(例如,針對位率、幀速率或空間分辨率可縮放性)有用。
[0130]如上文所描述,位流可包含每一類型的一或多個不同參數(shù)集,例如,SPS及PPS。特定類型的參數(shù)集是使用參數(shù)集識別符(ID)予以識別。在一些狀況下,視頻解碼器可接收具有特定參數(shù)集ID的特定類型的參數(shù)集,所述參數(shù)集具有與具有相同參數(shù)集ID的相同類型的先前參數(shù)集(按位流或解碼次序)的內容不同的內容。在此狀況下,更新具有所述特定參數(shù)集ID(例如,SPS O)的所述特定類型的參數(shù)集。參數(shù)集更新包含存儲具有特定參數(shù)集ID的經(jīng)接收參數(shù)集的內容以替換具有相同類型且具有相同參數(shù)集ID值的先前參數(shù)集。
[0131]當需要特定類型的新參數(shù)集,但已使用參數(shù)集ID的所有可能值時,可發(fā)生參數(shù)集更新。在經(jīng)接合的位流中,甚至在未完全利用參數(shù)集ID值空間時,也可發(fā)生參數(shù)集更新。位流常常僅使用幾個SPS及幾個PPS,或甚至僅僅一個SPS及一個PPS,且使用最小SPS ID值及最小PPS ID值(即,O)。因此,當兩個位流或位流的部分被接合時,很可能地是:起源自第二位流的接合點與起源自第一位流的緊接在接合點圖片之前的圖片參考同一 SPS ID或PPS ID。在此狀況下,由接合點圖片參考的SPS或PPS的內容與由緊接在所述接合點圖片之前的圖片參考的SPS或PPS的內容很可能不同。
[0132]在SPS參數(shù)集的特定狀況下,當接合點圖片與緊接在所述接合點之前的圖片參考同一 SPS ID且實際上使用兩個不同SPS時,則在經(jīng)接合的位流中,具有由緊接在所述接合點之前的圖片參考的特定SPS ID的SPS是實際上被由所述接合點圖片參考的SPS更新。在此狀況下,經(jīng)接合的位流的SPS不能夠置于所述經(jīng)接合的位流的開始。盡管上文關于SPS予以描述,但對于VPS、PPS及APS也是如此情況。已基于在經(jīng)接合的位流中僅存在一個接合點的假定來描述位流接合及相關聯(lián)的參數(shù)集更新。然而,位流可包含多個接合點,且本文所描述的技術可個別地應用于所述接合點中的每一者。
[0133]隨機存取指代從不為位流中的第一經(jīng)譯碼圖片的經(jīng)譯碼圖片開始解碼視頻位流。在例如廣播及流式傳輸?shù)仍S多視頻應用中,對位流的隨機存取是有用的。舉例來說,隨機存取有用于使用戶在不同信道之間切換、跳轉到視頻的特定部分,或切換到不同位流以用于流調適(例如,針對位率、幀速率或空間分辨率可縮放性)。通過以規(guī)則時間間隔多次將隨機存取點(RAP)圖片或存取單元插入到視頻位流中來實現(xiàn)隨機存取。
[0134]瞬時解碼刷新(IDR)圖片可用于對位流的隨機存取。IDR圖片開始經(jīng)譯碼視頻序列且僅包含經(jīng)幀內預測的切片(即,I切片)。另外,IDR圖片總是清除經(jīng)解碼圖片緩沖器(DPB)。因此,按解碼次序在IDR之后的圖片不能夠將在所述IDR圖片之前解碼的圖片用作參考。因此,依賴于IDR圖片來進行隨機存取的位流可具有顯著較低譯碼效率。
[0135]為了改進譯碼效率,將清晰隨機存取(CRA)圖片的概念引入HEVC HM中。與IDR圖片一樣,CRA圖片僅包含經(jīng)幀內預測的切片,S卩,I切片。CRA圖片不同于IDR圖片,因為CRA圖片不清除DPB且可位于經(jīng)譯碼視頻序列內的任何位置處。因此,允許按解碼次序在CRA圖片之后但按輸出次序在CRA圖片之前的圖片使用在CRA圖片之前解碼的圖片作為參考。按解碼次序在CRA圖片之后但按輸出次序在CRA圖片之前的圖片被稱作關聯(lián)于CRA圖片之前導圖片(或CRA圖片之前導圖片)。
[0136]如果解碼從在當前CRA圖片之前的IDR或CRA圖片開始,則可正確地解碼CRA圖片之前導圖片。然而,當隨機存取從當前CRA圖片開始時,可能不正確地解碼CRA圖片之前導圖片。因此,通常在從當前CRA圖片的隨機存取解碼期間舍棄前導圖片。參看圖4及圖5中所說明的實例,Pic9可為CRA圖片且pic8可為pic9之前導圖片。如果在pic6處存取GOP2,則可正確地解碼Pic8,但如果在Pic9處存取GOP2,則可能不正確地解碼Pic8。歸因于在Pic9處存取GOP2的情況下Pic7可能不可用的事實。為了防止從取決于解碼開始之處而不可用的參考圖片的誤差傳播,在解碼次序及輸出次序兩方面皆在CRA圖片之后的所有圖片可受約束而不將按解碼次序或輸出次序在所述CRA圖片之前的任何圖片(其包含前導圖片)用作參考。
[0137]在HEVC HM中,以CRA圖片開始的位流被認為是符合的位流。當位流以CRA圖片開始時,所述CRA圖片之前導圖片可參考不可用的參考圖片,且因此可能不能夠被正確地解碼。然而,HM指定開始CRA圖片之前導圖片不被輸出,因此名稱為“清晰隨機存取”。在圖4及圖5中所說明的實例中,如果位流在Pic9處開始,則Pic8不被輸出。為了建立位流符合性要求,HM指定解碼過程以產(chǎn)生用于解碼非輸出前導圖片的不可用參考圖片。然而,符合的解碼器實施不必遵循那一解碼過程,只要所述符合的解碼器可產(chǎn)生與從經(jīng)譯碼視頻序列的開始執(zhí)行解碼過程的情況相比等同的輸出即可。
[0138]應注意,在H.264/AVC中通過復原點SEI消息來支持與HEVC HM中的那些隨機存取功能性類似的隨機存取功能性。H.264/AVC解碼器實施可能或可能不支持隨機存取功能性。應進一步注意,在HEVC HM中,符合的位流可能根本不含有IDR圖片。HM將經(jīng)譯碼視頻序列定義為存取單元序列,其按解碼次序由IDR存取單元、繼之以零個或零個以上非IDR存取單元(包含直到(但不包含)任何后續(xù)IDR存取單元的所有后續(xù)存取單元)組成。因此,不含有IDR圖片的符合的位流可含有經(jīng)譯碼視頻序列的子集或不完整的經(jīng)譯碼視頻序列。
[0139]現(xiàn)在將描述與位流中的參數(shù)集更新有關的問題及所提議技術。常規(guī)地,為了確定是否執(zhí)行參數(shù)集更新,解碼器在每當接收到具有特定參數(shù)集ID的特定類型的新參數(shù)集(其具有與相同類型的較早所接收的參數(shù)集的參數(shù)集ID相同的參數(shù)集ID)時就比較參數(shù)集內容。執(zhí)行所述參數(shù)集比較以驗證所述參數(shù)集是包含相同內容抑或不同內容?;趨?shù)集是否具有相同內容,解碼器確定是否啟動當前所接收的參數(shù)集且去啟動先前作用中參數(shù)集。在與經(jīng)譯碼視頻數(shù)據(jù)一起在帶內發(fā)射參數(shù)集的狀況下,可重復地發(fā)射所述參數(shù)集以實現(xiàn)改進的誤差恢復。在此狀況下,解碼器可進行每一重復的參數(shù)集的參數(shù)集內容的比較。進行重復的參數(shù)集的比較可將不必要負擔強加于解碼器上。
[0140]本發(fā)明描述了可尤其在參數(shù)集更新的狀況下提供對解碼處理資源的更有效率使用的技術。在一個實例中,本發(fā)明描述視頻處理裝置,所述視頻處理裝置經(jīng)配置以使用位流層級指示符以確定在位流的部分中是否可更新參數(shù)集。在一些狀況下,位流層級指示可用以指示是否可更新參數(shù)集。所述指示可為包含于位流中(例如,SPS中)的旗標,且所述旗標在所有SPS中可等同。當旗標等于I時,可更新參數(shù)集。當旗標等于O時,不可更新參數(shù)集。在此狀況下,視頻解碼器無需比較具有相同類型且具有相同參數(shù)集ID值的兩個參數(shù)集的內容以確定所述參數(shù)集是否具有相同內容,因為當旗標等于O時,不可發(fā)生參數(shù)集更新且視頻解碼器進行操作就好像所述兩個參數(shù)集具有相同內容一樣。
[0141]在其它狀況下,位流層級指示可用以指示是否可更新特定類型的參數(shù)集(例如,VPS、SPS、PPS或APS)。所述指示可為包含于位流中(例如,SPS中)的旗標,且所述旗標在所有SPS中可等同。當旗標等于I時,可更新所述特定類型的參數(shù)集。當旗標等于O時,不可更新所述特定類型的參數(shù)集。在此狀況下,視頻解碼器無需比較具有所述特定類型且具有相同參數(shù)集ID值的兩個參數(shù)集的內容以確定所述參數(shù)集是否具有相同內容,因為當旗標等于O時,不可發(fā)生參數(shù)集更新且視頻解碼器進行操作就好像所述兩個參數(shù)集具有相同內容一樣。當存在三種類型的參數(shù)集(例如,SPS、PPS及APS)時,使用三個此種指示,一種指示用于每一類型的參數(shù)集。
[0142]在上文所描述的實例中,指示包含于參數(shù)集中的位流層級。在另一實例中,指示可包含于SEI消息中。在又另一實例中,指示可作為要求而包含于簡檔的定義中。在一些實例中,指示可包含于經(jīng)譯碼視頻序列層級處而非位流層級處。在其它實例中,指示可不包含于位流中,而是在視頻位流在會話協(xié)商或能力交換階段期間用于基于實時輸送協(xié)議(RTP)的發(fā)射環(huán)境(例如,使用RTP用于媒體數(shù)據(jù)輸送的流式傳輸或多播)中時,指示可改為被定義為媒體類型參數(shù)且包含于會話描述協(xié)議(SDP)中。作為一額外實例,在例如經(jīng)由HTTP的動態(tài)自適應性流式傳輸(DASH)的HTTP流式傳輸環(huán)境中,指示可被定義為包含于媒體呈現(xiàn)描述(MPD)中的流性質。
[0143]現(xiàn)在將描述與在IDR圖片處啟動新參數(shù)集有關的問題及所提議技術。如上文所描述,在許多狀況下,位流接合點圖片為IDR圖片。接合點圖片通常具有與經(jīng)接合的位流中的緊接在接合點之前的圖片的視頻特性不同的視頻特性。因此,通常在接合點處需要每一類型的不同參數(shù)集,且比較與接合點圖片相關聯(lián)的參數(shù)集的內容是否等同于與先前圖片相關聯(lián)的參數(shù)集將為對解碼處理資源的浪費。在此狀況下,可能更有效率地是啟動與接合點圖片相關聯(lián)的每一類型的新參數(shù)集,而不比較參數(shù)集內容。另外,當IDR圖片為接合點圖片時,為了避免DPB溢位,可能有必要不輸出在所述IDR圖片之前的任何圖片(即使在解碼所述IDR圖片時所述圖片尚未被輸出)。
[0144]本發(fā)明描述了可尤其在位流接合點處的參數(shù)集更新的狀況下提供對解碼處理資源的更有效率使用的技術。在一個實例中,本發(fā)明描述視頻處理裝置,所述視頻處理裝置經(jīng)配置以自動啟動與經(jīng)接合的位流的接合點圖片相關聯(lián)的每一類型的新參數(shù)集。明確地說,在許多狀況下,位流接合點圖片為IDR圖片。根據(jù)所述技術,在每一 IDR圖片處,視頻解碼器可啟動每一類型的參數(shù)集(且因此,去啟動先前作用中參數(shù)集),即使所述新近經(jīng)啟動的參數(shù)集可能與先前作用中參數(shù)集完全相同(包含參數(shù)集ID值及內容)。在每一 IDR圖片處啟動新參數(shù)集的一個潛在缺點在于:可能執(zhí)行一些不必要的參數(shù)集啟動。
[0145]在另一實例中,可針對每一 IDR圖片在位流中包含用以指示所述IDR圖片是否為接合IDR(SIDR)圖片的指示。在此實例中,當指示SIDR圖片時,視頻解碼器可啟動每一類型的參數(shù)集(且因此,去啟動先前作用中參數(shù)集),即使所述新近啟動的參數(shù)集可能與先前作用中參數(shù)集完全相同(包含參數(shù)集ID值及內容)。通過僅在SIDR圖片處而非在每一 IDR圖片處啟動新參數(shù)集,可減少不必要的參數(shù)集啟動。另外,當指示SIDR圖片時,圖片輸出行為可就像如下情況一樣:存在 no_output_of_pr1r_pics_f lag 且 no_output_of_pr1r_pics_flag等于I,其指示將不輸出在SIDR圖片之前的圖片。no_output_of_pr1r_pics_flag可能或可能不存在于(例如)切片標頭中。在一些狀況下,指示可為特殊的相異NAL單元類型。在其它狀況下,指示可為切片標頭、PPS或APS中的圖片層級旗標。
[0146]現(xiàn)在將描述與從RAP存取單元對位流的全面隨機存取有關的問題及所提議技術。當與經(jīng)譯碼視頻數(shù)據(jù)一起在帶內輸送參數(shù)集(即,在經(jīng)譯碼視頻位流中輸送)時,從IDR圖片或CRA圖片的存取單元對位流的隨機存取可要求從按解碼次序早于IDR或CRA存取單元的存取單元提取參數(shù)集。當無需從按解碼次序早于IDR或CRA存取單元的存取單元提取參數(shù)集時,通知視頻解碼器以便避免不必要的提取操作將為有利的。
[0147]本發(fā)明描述的技術可用于提供對解碼處理資源的更有效率使用,尤其是隨機存取的狀況下。在一個實例中,本發(fā)明描述視頻處理裝置,所述視頻處理裝置經(jīng)配置以使用位流中的指示以確定是否需要在IDR或CRA存取單元之前的存取單元中的參數(shù)集NAL單元以解碼所述IDR或CRA存取單元。明確地說,位流可包含針對每一 IDR或CRA存取單元的指示,以指示是否需要所述IDR或CRA存取單元之前的參數(shù)集NAL單元(按位流或解碼次序)以解碼所述IDR或CRA存取單元及任何后續(xù)存取單元(按位流或解碼次序)。
[0148]如果所述指示對于一個IDR或CRA存取單元正確,則視頻解碼器可從所述IDR或CRA存取單元隨機地存取位流,而不依賴于所述IDR或CRA存取單元之前的任何參數(shù)集NAL單元。在此狀況下,可簡單地跳過或忽略所有較早NAL單元。在一個實例中,可使用特定類型的SPS (例如,具有相異NAL單元類型)來傳訊針對IDR圖片或CRA圖片的指示,其中SPS可為存取單元的第一 NAL單元或在存取單元定界符NAL單元(如果存在于存取單元中)之后的第一 NAL單元。在另一實例中,可使用特定類型的存取單元定界符來傳訊所述指示,所述存取單元定界符具有相異存取單元定界符NAL單元類型抑或具有在存取單元定界符NAL單元的NAL單元有效負載內的旗標。在另一實例中,可使用存取單元中的NAL單元標頭中的旗標來傳訊所述指示。作為一額外實例,可使用存取單元中的特定類型的SEI消息或存取單元中的SEI消息中的旗標來傳訊所述指示。
[0149]現(xiàn)在將描述與位流中的CRA圖片之前導圖片有關的問題及所提議技術。當位流從CRA圖片開始且與所述CRA圖片相關聯(lián)之前導圖片不存在于視頻解碼器處時,經(jīng)譯碼圖片緩沖器(CPB)可溢位。因此,可需要應用不同集合的假想?yún)⒖冀獯a器(HRD)參數(shù)以便避免緩沖器溢位。S.Deshpande 等人的 “Signaling of CRA Pictures”(第 9 次會議,Geneva,CH,2012年4月27日到5月7日,文件,JCTVC-10278 (下文中“Deshpande”))描述了針對CRA圖片的指示(例如,新NAL單元類型或切片標頭中的旗標)以指示是否存在相關聯(lián)之前導圖片,使得視頻解碼器可確定將應用哪一 HRD參數(shù)集。然而,由Deshpande描述的指示要求外部網(wǎng)絡實體(例如,流服務器或媒體感知網(wǎng)絡元件(MAME))對CRA圖片的NAL單元標頭或切片標頭作出改變,此情形對外部網(wǎng)絡實體來說可為繁重的或不可能的。
[0150]本發(fā)明描述可被使用以便避免潛在緩沖器溢位的技術。在一個實例中,本發(fā)明描述視頻處理裝置,所述視頻處理裝置經(jīng)配置以使用指示來確定是否存在與開始位流的CRA圖片相關聯(lián)的前導圖片。明確地說,在一個實例中,當不存在開始位流的CRA圖片之前導圖片時,外部網(wǎng)絡實體可改變NAL單元類型以將所述CRA圖片指示為IDR圖片。在另一實例中,外部網(wǎng)絡實體可向視頻解碼器通知與開始位流的CRA圖片相關聯(lián)的前導圖片的存在或不存在。
[0151]外部網(wǎng)絡實體可針對基于實時流式傳輸協(xié)議(RTSP)的流式傳輸系統(tǒng)產(chǎn)生RTSP消息,或產(chǎn)生在基于RTSP的流及基于會話宣告協(xié)議(SAP)的廣播/多播兩者的會話協(xié)商期間所發(fā)送的會話描述協(xié)議(SDP)參數(shù)作為靜態(tài)配置。在例如經(jīng)由HTTP的動態(tài)自適應性流式傳輸(DASH)的HTTP流式傳輸中,可通過如下操作來實現(xiàn)指示:分配不同統(tǒng)一資源定位器(URL)或分配針對CRA圖片及前導圖片具有不同字節(jié)偏移的URL。在此狀況下,因為由視頻解碼器確定是否請求CRA圖片之前導圖片,故視頻解碼器可獨自確定是否存在所述前導圖片。
[0152]現(xiàn)在將描述與時間運動向量預測有關的問題及所提議技術。再次參看圖4,Pic6,Pic7&Pic9中的每一者用作參考圖片。如上文所描述,運動信息語法元素可識別參考圖片中的預測性視頻塊的位置以用于當前圖片中的視頻塊的幀間預測。運動預測可指代相對于先前經(jīng)譯碼視頻塊的運動信息(例如,運動向量及參考圖片索引)而定義給定視頻塊的運動信息的過程。舉例來說,運動預測可涉及使用先前經(jīng)譯碼⑶的運動信息以產(chǎn)生正被譯碼的當前CU的運動信息??蓱眠\動預測以減少傳達當前CU的運動向量所需要的數(shù)據(jù)量。
[0153]運動預測的一個實例為合并模式運動預測。在合并模式運動預測中,從先前經(jīng)譯碼相鄰視頻塊繼承當前CU的運動信息。運動預測技術可使用索引值以識別相鄰視頻塊,當前視頻塊從所述相鄰視頻塊導出其運動信息。舉例來說,可能的相鄰視頻塊可包含當前圖片中的鄰近于當前CU(例如,在當前CU上方、下方、左側或右側)的視頻塊。另外,可能的相鄰視頻塊還可包含位于除了當前圖片以外的圖片中的視頻塊(例如,與時間上鄰近圖片同置的視頻塊)。當可能的相鄰視頻塊位于除了當前圖片以外的圖片中時,其被稱作時間運動向量預測(TMVP)。舉例來說,在圖4中所說明的實例中,如果Pic8 WPiC7繼承運動向量,則此為TMVP。在一些情況下,可有利地是允許一些圖片、切片及⑶使用TMVP而不允許其它者使用TMVP。
[0154]HEVC HM允許逐個圖片地啟用或停用TMVP,且可使用PPS中的旗標enable—temporal_mvp_flag來傳訊TMPV的啟用。如上文所描述,每一切片標頭參考使用特定PPSID的特定PPS,且基于所述特定PPS中的旗標值而確定針對圖片是否啟用TMVP。舉例來說,當切片參考enable_temporal_mvp_f lag值等于O的PPS且具有等于O的temporal_id時,調用對DPB中的參考圖片的標記過程。即,經(jīng)解碼圖片緩沖器(DPB)中的所有圖片被標記為“不用于時間運動向量預測”且不允許從較早參考圖片的TMVP。
[0155]作為對將enable_temporal_mvp_flag包含于PPS 中的替代例,在 Lim、Chong Soon等人的“High-level Syntax:Proposed fix on signaling of TMVP disabling flag”(第9次會議,Geneva,CH,2012年4月27日到5月7日,文件,JCTVC-10420 (在下文中“Lim”))中已描述了在每個P及B切片標頭處明確地傳訊enable_temporal_mvp_f lag。雖然Lim中所描述的技術移除了對標記過程的需要,且獨立地確定TMVP圖片而非依賴于逐圖片更新,但當經(jīng)譯碼視頻序列中的許多圖片或所有圖片不使用TMVP時,Lim中所描述的技術并不有效率。根據(jù)Lim中所描述的技術,圖片或序列內的所有P及B切片的切片標頭皆將包含enabIe_temporal_mvp_flag,即使所述切片皆不使用TMVP也是如此。
[0156]本發(fā)明描述可被使用以便減少每個P及B切片標頭的enable_temporal_mvp_f lag的傳訊的技術。在一個實例中,本發(fā)明描述視頻處理裝置,所述視頻處理裝置經(jīng)配置以識別SPS中的旗標以確定是否啟用時間運動向量預測。明確地說,在一些實例中,可將旗標(例如,enable_temporal_mvp_ps_f lag)添加到SPS或PPS中。當在特定SPS或PPS中此旗標等于O時,enable_temporal_mvp_flag不存在于參考所述特定SPS或PPS的任何切片標頭中。當在特定SPS或PPS中此旗標等于I時,enable_temporal_mvp_flag存在于參考所述特定SPS或PPS的每一切片標頭中。切片標頭中的enable_temporal_mvp_flag的語義可與在Lim提議中的語義相同。
[0157]現(xiàn)在將描述與位流中的經(jīng)譯碼圖片的參考圖片集合傳訊有關的問題及所提議技術。如上文所描述,除了運動向量以外,運動信息語法元素還可包含參考圖片索引。HEVC HM使用基于參考圖片集合(RPS)的機制以管理參考圖片。RPS指代與圖片相關聯(lián)的參考圖片集合,其由按解碼次序在相關聯(lián)圖片之前的所有參考圖片組成,其可用于相關聯(lián)的圖片或按解碼次序在相關聯(lián)的圖片之后的任何圖片的幀間預測。在HM中,直接傳訊針對每一經(jīng)譯碼圖片的RPS。用于傳訊RPS的語法元素包含于SPS及切片標頭兩者中。針對特定經(jīng)譯碼圖片,RPS可為如由切片標頭中的旗標所指示或直接在切片標頭中傳訊的包含于SPS中的可能的圖片集合中的一者。
[0158]每一圖片的RPS包括五個不同的參考圖片列表,其也被稱作五個RPS子集。五個 RPS 子集包含:RefPicSetStCurrBefore、RefPicSetStCurrAfter^ RefPicSetStFolI>RefPicSetLtCurr,及 RefPicSetLtFoll。RefPicSetStCurrBefore 包含在解碼次序及輸出次序兩方面皆在當前圖片之前且可用于當前圖片的幀間預測的所有短期參考圖片(STRP)。RefPicSetStCurrAfter由按解碼次序在當前圖片之前且按輸出次序在當前圖片之后且可用于當前圖片的幀間預測的所有短期參考圖片組成。RefPicSetStFoll由可用于按解碼次序在當前圖片之后的圖片中的一或多者的幀間預測且不用于當前圖片的幀間預測的所有短期參考圖片組成。RefPicSetLtCurr是由可用于當前圖片的幀間預測的所有長期參考圖片(LTRP)組成。RefPicSetLtFoll是由可用于按解碼次序在當前圖片之后的圖片中的一或多者的幀間預測且不用于當前圖片的幀間預測的所有長期參考圖片組成。
[0159]在K.Suehring等人的“用于無錯誤環(huán)境的長期圖片傳訊(Long-term PictureSignaling for error-free environments),,(第 9 次會議,Geneva, CH, 2012 年 4 月 27 日到5月7日,文件,JCTVC-10112(在下文中“Suehring”))中已描述了通過到經(jīng)解碼圖片緩沖器(DPB)中的I)被標記為“用于參考”及2)不包含于短期參考圖片集合中的參考圖片的圖片次序計數(shù)(POC)排序列表的索引來識別LTRP。Suehring陳述了在無誤差環(huán)境中,LTRP的此傳訊是有效率的。然而,在無誤差環(huán)境中,STRP還可通過到DPB中的參考圖片的POC排序列表的索引來識別。
[0160]本發(fā)明描述可用于識別STRP的技術。在一個實例中,本發(fā)明描述視頻處理裝置,所述視頻處理裝置經(jīng)配置以通過到DPB中的參考圖片的POC排序列表的索引來識別STRP。明確地說,在一些實例中,每一 STRP可通過到DPB中的參考圖片的POC排序列表的索引來識別。在一些狀況下,次序可呈POC值的遞增次序。在其它狀況下,次序可呈POC值的遞減次序。對于第一個經(jīng)指示的STRP,(例如)使用無正負號整數(shù)指數(shù)哥倫布(ue(v))譯碼、截斷式整數(shù)指數(shù)哥倫布(te(v))譯碼或無正負號整數(shù)(ue(v))譯碼中的一者來直接譯碼索弓I。如果進行U(V)譯碼,則索引的按位計的長度為頂值(log2 (N)),其中N為DPB中的參考圖片的數(shù)目。對于其它經(jīng)指示的STRP,傳訊當前STRP的索引與先前STRP的索引之間的差?;蛘?,DPB中的參考圖片可分裂成兩個列表。在此實例中,列表中的一者包含POC小于當前圖片的POC的參考圖片且可按POC值的遞減次序排序。列表中的另一者包含POC值大于當前圖片的POC值的參考圖片且可按POC值的遞增次序排序。接著,待包含于短期參考圖片集合中的每一 STRP可通過列表(即,兩個列表中的一者)及到那一列表的索引來識別。
[0161]現(xiàn)在將描述與瓦片及波前并行處理(WPP)的圖片分割方案的種類前綴數(shù)據(jù)批次處理有關的問題及所提議技術。如上文所描述,HEVC HM包含四個不同圖片分割方案,SP:規(guī)則切片、熵切片、瓦片,及WPP。規(guī)則切片是與H.264/AVC中的規(guī)則切片類似。每一規(guī)則切片囊封于其自有NAL單元中,且停用圖片內預測(例如,幀內樣本預測、運動信息預測、譯碼模式預測)及跨越切片邊界的熵譯碼相依性。因此,可獨立于同一圖片內的其它規(guī)則切片來重建構規(guī)則切片(但歸因于迴路濾波操作仍可存在相互相依性)。因為HEVC中的基本單元(即,樹塊)可具有相對大的大小(例如,樹塊可為64X64),所以在HM中包含“精細粒度切片”(作為特殊形式的規(guī)則切片)的概念以允許經(jīng)由樹塊內的切片邊界的MTU大小匹配。在圖片參數(shù)集中傳訊切片粒度,而仍在切片標頭中傳訊精細粒度切片的地址。
[0162]熵切片(類似規(guī)則切片)破壞熵解碼相依性,但允許圖片內預測(及濾波)跨越熵切片邊界。因此,熵切片可用作輕量型機制以使熵解碼并行化,而對其它解碼步驟沒有影響。盡管每一熵切片囊封于其自有NAL單元中,但其相比于規(guī)則切片具有短得多的切片標頭,因為大多數(shù)切片標頭語法元素不存在且必須從之前的完整切片標頭繼承大多數(shù)切片標頭語法元素。歸因于允許圖片內的相鄰熵切片之間的圖片內預測,為了實現(xiàn)圖片內預測所需之處理器間/核心間通信可相當大。不推薦在易發(fā)生誤差的環(huán)境中將熵切片用于MTU大小匹配,因為歸因于圖片內預測,一個熵切片的損失還會造成按解碼次序的下一熵切片的解碼的失敗。對于在多核心或多CPU架構上執(zhí)行熵解碼過程但在專用信號處理硬件上執(zhí)行剩余解碼功能性的系統(tǒng)架構來說,熵切片表現(xiàn)得具有有限用途。
[0163]在WPP中,圖片被分割成樹塊的若干行。允許熵解碼及預測使用來自其它分割區(qū)中的樹塊的數(shù)據(jù)。經(jīng)由對樹塊的行的并行解碼,可能實現(xiàn)并行處理,其中行的解碼的開始被延遲達兩個樹塊,以便確保在主體樹塊被解碼之前可獲得與在所述主體樹塊上方且在所述主體樹塊右側的樹塊有關的數(shù)據(jù)。通過使用此交錯式開始(其當以圖形方式來表示時看起來像波前),可能通過高達與圖片含有的樹塊行一樣多的處理器/核心進行并行化。HEVCHM包含用以組織不同樹塊行的經(jīng)譯碼位以便有益于特定數(shù)目個并行處理器/核心的機制。舉例來說,偶數(shù)編號的樹塊行(樹塊行0、2、4...)的經(jīng)譯碼位有可能全部在奇數(shù)編號的樹塊行(樹塊行1、3、5…)的經(jīng)譯碼位之前,使得位流可由兩個并行處理器/核心解碼,但較早出現(xiàn)的樹塊行(例如,樹塊行2)的解碼參考較晚出現(xiàn)的樹塊行(例如,樹塊行I)。與熵切片類似,歸因于允許圖片內的相鄰樹塊行之間的圖片內預測,為了實現(xiàn)圖片內預測所需之處理器間/核心間通信可相當大。相比于不應用WPP分割時的情況,WPP分割不會導致更多NAL單元;因此,WPP不能夠用于MTU大小匹配。
[0164]瓦片界定將圖片分割成瓦片列及行的水平邊界及垂直邊界。在按圖片的瓦片光柵掃描的次序解碼下一瓦片的左上樹塊之前,樹塊的掃描次序被改變成在瓦片內局部的(按瓦片的樹塊光柵掃描的次序)。與規(guī)則切片類似,瓦片破壞圖片內預測相依性以及熵解碼相依性。然而,瓦片無需包含到個別NAL單元內(就此來說與WPP—樣),且因此不能夠用于MTU大小匹配。每一瓦片可由一個處理器/核心處理,且在解碼相鄰瓦片之處理單元之間的進行圖片內預測所需要之處理器間/核心間通信限于傳遞共享切片標頭(在一切片橫跨一個以上瓦片的狀況下)及對經(jīng)重建構樣本及后設數(shù)據(jù)的與迴路濾波相關的共享。因此,與WPP相比,歸因于兩個相鄰分割區(qū)之間的圖片內獨立性,瓦片在存儲器帶寬方面為要求較少的。
[0165]在HEVC HM中,規(guī)則切片為可用于并行化且還在H.264/AVC中可以實際上等同形式使用的唯一工具?;谝?guī)則切片的并行化不需要很多處理器間或核心間通信(惟在解碼預測性譯碼的圖片時用于運動補償之處理器間或核心間數(shù)據(jù)共享(其通常比歸因于圖片內預測之處理器間或核心間數(shù)據(jù)共享繁重得多)除外)。然而,出于相同原因,規(guī)則切片可需要一些譯碼耗用。另外,規(guī)則切片(與上文所提及的一些其它分割方案相對照)還歸因于規(guī)則切片的圖片內獨立性及每一規(guī)則切片囊封于其自有NAL單元中而用作用于進行位流分割以與MTU大小要求匹配的關鍵機制。在許多狀況下,并行化的目標與MTU大小匹配的目標可對圖片中的切片怖局提出矛盾的需求。
[0166]為簡單起見,在HM中指定四個不同圖片分割方案的限制。舉例來說,在HM中,不可同時應用熵切片、瓦片及WPP中的任兩者的組合。此外,在HM中,對于每一切片及瓦片,必須實現(xiàn)以下條件中的任一者或兩者:1) 一切片中的所有經(jīng)譯碼樹塊皆屬于同一瓦片,及2) —瓦片中的所有經(jīng)譯碼樹塊皆屬于同一切片。
[0167]已在S.Kanumuri等人的“用于瓦片及波前的分類前綴數(shù)據(jù)分批(Category-prefixed data batching for tiles and wavefronts),,(第 9 次會議,Geneva,CH,2012年4月27日到5月7日,文件,JCTVC-10427 (下文中稱為“Kanumuri ”))中描述瓦片及WPP的交插數(shù)據(jù)次序(其還使兩個入口點傳訊方法的有用性降低)。與Kanumuri中所提議的途徑相關聯(lián)的一個問題在于:所支持種類的最大數(shù)目為32。然而,有可能存在32個以上WPP子流(例如,當每一樹塊行為子流且存在32個以上樹塊行時)或32個以上瓦片,且要求知曉每一 WPP子流或瓦片入口點(例如)以用于通過單核心解碼器按圖片的樹塊光柵掃描來處理樹塊(剖析且解碼兩者)。此外,Kanumuri中所提議的途徑強加對單核心解碼的負擔,因為需要用以合并交插數(shù)據(jù)的合并過程或在NAL單元的位流中來回跳轉(視處理次序而定)。
[0168]本發(fā)明描述可用以指示是否應用種類前綴數(shù)據(jù)批次處理的技術。在一個實例中,本發(fā)明描述視頻處理裝置,所述視頻處理裝置經(jīng)配置以通過指示符識別是否應用種類前綴數(shù)據(jù)批次處理。明確地說,在一些實例中,可將用以指示是否應用種類前綴數(shù)據(jù)批次處理的指示添加于SPS或PPS中。如果指示了不應用種類前綴數(shù)據(jù)批次處理,則可應用處置瓦片的常規(guī)方式。在其它實例中,種類的最大數(shù)目可變化,且可在SPS或PPS中傳訊種類的最大數(shù)目的值。在另外實例中,可(例如)在SPS或PPS中傳訊瓦片或WPP子流到種類的映射(即,哪些瓦片或WPP子流屬于各種類)。
[0169]圖6為說明確定在位流的部分中是否可發(fā)生參數(shù)集更新的操作的流程圖。所說明操作被描述為由來自圖3的視頻解碼器30基于由來自圖2的視頻編碼器20產(chǎn)生的指示來執(zhí)行。
[0170]視頻解碼器30可從視頻編碼器20接收具有一或多個經(jīng)譯碼視頻序列的位流,所述一或多個經(jīng)譯碼視頻序列包含表示經(jīng)譯碼視頻切片及經(jīng)譯碼參數(shù)集的多個存取單元。視頻解碼器30解碼被定義成指示在位流的部分(例如,經(jīng)譯碼視頻序列中的一者)中是否可發(fā)生參數(shù)集更新的旗標(130)。在一個實例中,旗標可包含于SEI NAL單元中,所述SEI NAL單元包含在經(jīng)譯碼視頻序列的至少一個存取單元中。在另一實例中,旗標可包含于SPS NAL單元中,所述SPS NAL單元包含在經(jīng)譯碼視頻序列的至少一個存取單元中。
[0171]在一些狀況下,旗標可指示在經(jīng)譯碼視頻序列中是否可更新任何類型的參數(shù)集,使得僅一個旗標可用于所有類型的參數(shù)集。在其它狀況下,旗標可指示在經(jīng)譯碼視頻序列中是否可更新特定類型的參數(shù)集,使得不同旗標可用于每一類型的參數(shù)集。在又其它狀況下,旗標可指示在經(jīng)譯碼視頻序列中是否可更新兩種或兩種以上類型的參數(shù)集,使得一個旗標可用以指示所述兩種或兩種以上類型的參數(shù)集的更新狀態(tài)且另一旗標可用以指示額外類型的參數(shù)集的更新狀態(tài)。
[0172]視頻解碼器30接著從包含于經(jīng)譯碼視頻序列的存取單元中的一者中的參數(shù)集NAL單元解碼具有特定ID值的特定類型的第一參數(shù)集(132)。當旗標指示在經(jīng)譯碼視頻序列中不可發(fā)生針對特定類型的參數(shù)集的參數(shù)集更新(134的否分支)時,視頻解碼器30針對位流的整個部分(即,此實例中的經(jīng)譯碼視頻序列)啟動第一參數(shù)集(136)。在此狀況下,在解碼了具有與第一參數(shù)集相同的類型且具有與第一參數(shù)集相同的識別值之后續(xù)參數(shù)集時,視頻解碼器30無需確定是否更新經(jīng)譯碼視頻序列的第一參數(shù)集且可忽略后續(xù)參數(shù)集。因此,視頻解碼器30可進行操作就好像第一參數(shù)集的內容與具有相同ID值的相同類型的任何其它參數(shù)集中所包含的內容等同一樣。
[0173]當旗標指示在經(jīng)譯碼視頻序列中可發(fā)生針對特定類型的參數(shù)集的參數(shù)集更新(134的是分支)時,視頻解碼器30啟動第一參數(shù)集(138)。視頻解碼器30接著從包含于經(jīng)譯碼視頻序列的存取單元中的一者中的參數(shù)集NAL單元解碼具有與第一參數(shù)集相同的類型且具有與第一參數(shù)集相同的ID值的第二參數(shù)集(140)。在此狀況下,因為可發(fā)生參數(shù)集更新,所以視頻解碼器30確定是否存儲第二參數(shù)集以替換第一參數(shù)集(142)。
[0174]在一些狀況下,視頻解碼器30可針對經(jīng)譯碼視頻序列自動啟動第二參數(shù)集,且去啟動第一參數(shù)集。在其它狀況下,視頻解碼器30可比較第一參數(shù)集的內容與第二參數(shù)集的內容。當?shù)诙?shù)集的內容不同于第一參數(shù)集的內容時,視頻解碼器30針對經(jīng)譯碼視頻序列啟動第二參數(shù)集,且去啟動第一參數(shù)集。
[0175]圖7為說明確定是否可執(zhí)行從CRA存取單元的隨機存取而不必從先前的不可用存取單元提取參數(shù)集的操作的流程圖。所說明操作被描述為由來自圖3的視頻解碼器30基于由來自圖2的視頻編碼器20產(chǎn)生的指示來執(zhí)行。
[0176]HEVC HM引入CRA圖片以在無較低譯碼效率的情況下提供對位流的隨機存取的更多選項,與在使用IDR圖片的情況下發(fā)生的一樣。CRA存取單元可定位于經(jīng)譯碼視頻序列內的任何點處且不清除經(jīng)解碼圖片緩沖器(DPB),此允許給定CRA存取單元之前導圖片(即,按解碼次序在CRA存取單元之后但按輸出次序在CRA存取單元之前的圖片)將在所述CRA存取單元之間解碼的圖片用作參考圖片。然而,僅當隨機存取從在給定CRA存取單元之前解碼的RAP圖片開始時,才可正確地解碼前導圖片。在隨機存取從特定CRA圖片開始的狀況下,將不解碼按輸出或解碼次序在所述CRA圖片之前的所有圖片且所述圖片不可用作參考圖片。為了解碼CRA圖片或按輸出或解碼次序的任何后續(xù)存取單元,視頻解碼器30可需要提取包含于不可用的先前圖片中的一者的存取單元中的一或多個參數(shù)集,此為繁重的操作。
[0177]視頻解碼器30可從視頻編碼器20接收具有一或多個經(jīng)譯碼視頻序列的位流,所述一或多個經(jīng)譯碼視頻序列包含表示經(jīng)譯碼視頻切片及經(jīng)譯碼參數(shù)集的多個存取單元。視頻解碼器30從位流的經(jīng)譯碼視頻序列解碼一或多個CRA存取單元(150)。視頻解碼器30還解碼被定義成指示從特定CRA存取單元對位流的隨機存取是否要求來自先前的不可用存取單元的參數(shù)集的旗標(152)。在一個實例中,旗標可包含于SEI NAL單元中,所述SEINAL單元包含在位流的經(jīng)譯碼視頻序列中的特定CRA存取單元中。
[0178]當旗標指示無需提取來自先前存取單元的參數(shù)集(即,不需要提取)以用于進行從特定CRA存取單元的隨機存取時(154的否分支),視頻解碼器30在不執(zhí)行提取操作的情況下執(zhí)行從特定CRA存取單元對位流的隨機存取(156)。相反地,當旗標指示需要提取來自先前存取單元的參數(shù)集(即,需要提取)以用于進行從特定CRA圖片的隨機存取時(154的是分支),視頻解碼器30確定是否按次序執(zhí)行從特定CRA存取單元對位流的隨機存取
(158)。在一些狀況下,視頻解碼器30可確定可在不執(zhí)行提取操作的情況下從另一 RAP圖片進行對位流的隨機存取,且進一步確定不執(zhí)行從特定CRA存取單元對位流的隨機存取以便避免從先前存取單元提取參數(shù)集。在其它狀況下,視頻解碼器30可確定不可進行從另一RAP圖片對位流的隨機存取,且進一步確定在從先前存取單元提取參數(shù)集之后執(zhí)行從特定CRA存取單元對位流的隨機存取。
[0179]以此方式,基于所述旗標,視頻解碼器30首先確定是否需要提取操作以用于進行從特定CRA存取單元的隨機存取解碼,且可通過選擇供執(zhí)行隨機存取的不同RAP圖片而避免執(zhí)行提取操作。所述指示對于CRA存取單元尤其有用,因為CRA存取單元可定位于經(jīng)譯碼視頻序列內的任何點處且不清除DPB,此在無較低譯碼效率的情況下提供對位流的隨機存取的更多選項。
[0180]圖8為說明形成網(wǎng)絡300的部分的實例裝置集合的框圖。在此實例中,網(wǎng)絡300包含路由裝置304A、304B (集體地被稱作“路由裝置304”)及轉碼裝置306。路由裝置304及轉碼裝置306意欲表示可形成網(wǎng)絡300的部分的少數(shù)裝置。例如交換器、集線器、網(wǎng)關、防火墻、橋接器及其它此類裝置等其它網(wǎng)絡裝置還可包含于網(wǎng)絡300內。此外,可沿著服務器裝置302與客戶端裝置308之間的網(wǎng)絡路徑提供額外網(wǎng)絡裝置。在一些實例中,服務器裝置302可對應于來自圖1的源裝置12,而客戶端裝置308可對應于來自圖1的目的地裝置14。
[0181]一般來說,路由裝置304實施一或多個路由協(xié)議以經(jīng)由網(wǎng)絡300交換網(wǎng)絡數(shù)據(jù)。在一些實例中,路由裝置304可經(jīng)配置以執(zhí)行代理或快取操作。因此,在一些實例中,還可將路由裝置304稱作代理裝置。一般來說,路由裝置304執(zhí)行路由協(xié)議以發(fā)現(xiàn)經(jīng)由網(wǎng)絡300的路由。通過執(zhí)行這些路由協(xié)議,路由裝置304B可發(fā)現(xiàn)從其自身經(jīng)由路由裝置304A到服務器裝置302的網(wǎng)絡路由。
[0182]本發(fā)明的技術可由例如路由裝置304及轉碼裝置306等網(wǎng)絡裝置實施,但還可由客戶端裝置308實施。以此方式,路由裝置304、轉碼裝置306及客戶端裝置308表示經(jīng)配置以實施本發(fā)明中所描述的技術中的一或多者的裝置的實例。
[0183]在一或多個實例中,所描述功能可以硬件、軟件、固件或其任何組合予以實施。如果以軟件實施,則所述功能可作為一或多個指令或程序代碼而存儲于計算機可讀媒體上或經(jīng)由計算機可讀媒體進行發(fā)射,且由基于硬件之處理單元執(zhí)行。計算機可讀媒體可包含計算機可讀存儲媒體(其對應于例如數(shù)據(jù)存儲媒體等有形媒體)或通信媒體,通信媒體包含促進(例如)根據(jù)通信協(xié)議將計算機程序從一處傳送到另一處的任何媒體。以此方式,計算機可讀媒體一般可對應于(I)非暫時性的有形計算機可讀存儲媒體,或(2)例如信號或載波等通信媒體。數(shù)據(jù)存儲媒體可為可由一或多個計算機或一或多個處理器存取以檢索指令、程序代碼及/或數(shù)據(jù)結構以用于實施本發(fā)明中所描述的技術的任何可用媒體。計算機程序產(chǎn)品可包含計算機可讀媒體。
[0184]通過實例而非限制,這些計算機可讀存儲媒體可包括RAM、ROM、EEPROM、CD-ROM或其它光盤存儲器、磁盤存儲器或其它磁性存儲裝置、快閃存儲器,或可用以存儲呈指令或數(shù)據(jù)結構的形式的所要程序代碼且可由計算機存取的任何其它媒體。而且,任何連接被適當?shù)胤Q為計算機可讀媒體。舉例來說,如果使用同軸電纜、光纖纜線、雙絞線、數(shù)字用戶線(DSL)或例如紅外線、無線電及微波等無線技術而從網(wǎng)站、服務器或其它遠程源發(fā)射指令,則同軸電纜、光纖纜線、雙絞線、DSL或例如紅外線、無線電及微波等無線技術包含于媒體的定義中。然而,應理解,計算機可讀存儲媒體及數(shù)據(jù)存儲媒體不包含連接、載波、信號或其它暫時性媒體,而是針對非暫時性有形存儲媒體。如本文所使用的磁盤及光盤包含光盤(CD)、激光光盤、光學碟片、數(shù)字影音光盤(DVD)、軟性磁盤及藍光光盤,其中磁盤通常以磁性方式再現(xiàn)數(shù)據(jù),而光盤通過激光以光學方式再現(xiàn)數(shù)據(jù)。以上各者的組合也應包含于計算機可讀媒體的范圍內。
[0185]可由例如一或多個數(shù)字信號處理器(DSP)、通用微處理器、專用集成電路(ASIC)、現(xiàn)場可編程邏輯陣列(FPGA)或其它等效集成或離散邏輯電路等一或多個處理器來執(zhí)行指令。因此,本文所使用的術語“處理器”可指代上述結構或適于實施本文所描述的技術的任何其它結構中的任一者。另外,在一些方面中,可將本文所描述的功能性提供于經(jīng)配置以用于編碼及解碼的專用硬件及/或軟件模塊內,或并入于組合式編碼解碼器中。而且,所述技術可完全實施于一或多個電路或邏輯元件中。
[0186]本發(fā)明的技術可在廣泛多種裝置或設備中實施,所述裝置或設備包含無線手持機、集成電路(IC)或IC集合(例如,芯片組)。在本發(fā)明中描述各種組件、模塊或單元以強調經(jīng)配置以執(zhí)行所揭示技術的裝置的功能方面,但未必要求通過不同硬件單元來實現(xiàn)。更確切來說,如上文所描述,各種單元可組合于編碼解碼器硬件單元中或由交互操作的硬件單元的集合(包含如上文所描述的一或多個處理器)結合合適軟件及/或固件來提供。
[0187]已描述各種實例。這些及其它實例在所附權利要求書的范圍內。
【權利要求】
1.一種解碼視頻數(shù)據(jù)的方法,其包括: 解碼指示符,所述指示符指示從特定清晰隨機存取CRA存取單元對位流的隨機存取是否要求來自先前存取單元的一或多個參數(shù)集以解碼所述特定CRA存取單元或后續(xù)存取單元,其中所述特定CRA存取單元定位于所述位流的經(jīng)譯碼視頻序列內的任何點處且不清除經(jīng)解碼圖片緩沖器DPB;以及 基于所述指示符指示無需來自先前存取單元的參數(shù)集,在不從所述先前存取單元提取參數(shù)集的情況下執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取。
2.根據(jù)權利要求1所述的方法,其進一步包括基于所述指示符指示需要來自先前存取單元的參數(shù)集,確定是否執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取。
3.根據(jù)權利要求2所述的方法,其進一步包括基于在不從先前存取單元提取參數(shù)集的情況下可從另一隨機存取點RAP圖片進行對所述位流的隨機存取,確定不執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取,以避免從所述先前存取單元提取所述參數(shù)集。
4.根據(jù)權利要求2所述的方法,其進一步包括基于不可進行從另一隨機存取點RAP圖片對所述位流的隨機存取,確定在從所述先前存取單元提取所述參數(shù)集之后執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取。
5.根據(jù)權利要求1所述的方法,其中基于所述指示符指示無需先前存取單元的參數(shù)集,所述特定CRA存取單元包含解碼所述特定CRA存取單元或后續(xù)存取單元所需的所有參數(shù)集。
6.根據(jù)權利要求1所述的方法,其中所述指示符包括針對包含于所述位流中的一或多個CRA存取單元中的每一者的指示符。
7.根據(jù)權利要求1所述的方法,其中所述指示符包括包含于所述位流的所述經(jīng)譯碼視頻序列中的所述特定CRA存取單元的補充增強信息SEI消息中的語法元素。
8.根據(jù)權利要求1所述的方法,其中所述指示符包括包含于所述位流的所述經(jīng)譯碼視頻序列中的所述特定CRA存取單元中的特定類型的網(wǎng)絡抽象層NAL單元。
9.根據(jù)權利要求1所述的方法,其中所述指示符包括包含于網(wǎng)絡抽象層NAL單元有效負載中的語法元素,所述網(wǎng)絡抽象層NAL單元有效負載包含在所述位流的所述經(jīng)譯碼視頻序列中的所述特定CRA存取單元中。
10.根據(jù)權利要求1所述的方法,其中解碼所述指示符包括解碼來自以下各項之一的所述指示符:包含于具有第一相異網(wǎng)絡抽象層NAL單元類型的NAL單元中的特定類型的序列參數(shù)集SPS、包含于具有第二相異NAL單元類型的NAL單元中的特定類型的存取單元定界符、特定類型的補充增強信息SEI消息、包含于存取單元定界符NAL單元的有效負載中的語法元素、包含于NAL單元標頭中的語法元素,或包含于SEI消息中的語法元素。
11.根據(jù)權利要求1所述的方法,其中所述先前存取單元為按解碼次序或輸出次序之一在所述特定CRA存取單元之前的存取單元。
12.根據(jù)權利要求11所述的方法,其中基于執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取,不解碼所述先前存取單元且所述先前存取單元不可在所述DPB中用作按解碼次序或輸出次序之一在所述特定CRA存取單元之后的存取單元的參考圖片。
13.根據(jù)權利要求11所述的方法,其中基于執(zhí)行從在所述經(jīng)譯碼視頻序列中在所述特定CRA存取單元之前的隨機存取點RAP圖片對所述位流的隨機存取,解碼所述先前存取單元且所述先前存取單元可在所述DPB中用作按解碼次序或輸出次序之一在所述特定CRA存取單元之后的存取單元的參考圖片。
14.一種編碼視頻數(shù)據(jù)的方法,其包括: 編碼位流的經(jīng)譯碼視頻序列中的一或多個清晰隨機存取CRA存取單元,其中所述CRA存取單元定位于所述位流的所述經(jīng)譯碼視頻序列內的任何點處且不清除經(jīng)解碼圖片緩沖器DPB ;以及 編碼指示符,所述指示符指示從特定CRA存取單元對所述位流的隨機存取是否要求來自先前存取單元的一或多個參數(shù)集以解碼所述特定CRA存取單元或后續(xù)存取單元,其中基于所述指示符指示無需來自先前存取單元的參數(shù)集,可在不從所述先前存取單元提取參數(shù)集的情況下執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取。
15.根據(jù)權利要求14所述的方法,其中基于所述指示符指示需要來自先前存取單元的參數(shù)集,可在從所述先前存取單元提取所述參數(shù)集之后執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取。
16.根據(jù)權利要求14所述的方法,其中基于所述指示符指示無需先前存取單元的參數(shù)集,所述特定CRA存取單元包含解碼所述特定CRA存取單元或后續(xù)存取單元所需的所有參數(shù)集。
17.根據(jù)權利要求14所述的方法,其中所述指示符包括針對包含于所述位流中的一或多個CRA存取單元中的每一者的指示符。
18.根據(jù)權利要求14所述的方法,其中所述指示符包括包含于所述位流的所述經(jīng)譯碼視頻序列中的所述特定CRA存取單元的補充增強信息SEI消息中的語法元素。
19.根據(jù)權利要求14所述的方法,其中所述指示符包括包含于所述位流的所述經(jīng)譯碼視頻序列中的所述特定CRA存取單元中的特定類型的網(wǎng)絡抽象層NAL單元。
20.根據(jù)權利要求14所述的方法,其中所述指示符包括包含于網(wǎng)絡抽象層NAL單元有效負載中的語法元素,所述網(wǎng)絡抽象層NAL單元有效負載包含在所述位流的所述經(jīng)譯碼視頻序列中的所述特定CRA存取單兀中。
21.根據(jù)權利要求14所述的方法,其中編碼所述指示符包括編碼以下各項之一中的所述指示符:包含于具有第一相異NAL單元類型的網(wǎng)絡抽象層NAL單元中的特定類型的序列參數(shù)集SPS、包含于具有第二相異NAL單元類型的NAL單元中的特定類型的存取單元定界符、特定類型的補充增強信息SEI消息、包含于存取單元定界符NAL單元的有效負載中的語法元素、包含于NAL單元標頭中的語法元素,或包含于SEI消息中的語法元素。
22.根據(jù)權利要求14所述的方法,其中所述先前存取單元為按解碼次序或輸出次序之一在所述特定CRA存取單元之前的存取單元。
23.一種用于譯碼視頻數(shù)據(jù)的視頻譯碼裝置,所述裝置包括: 存儲器,其經(jīng)配置以存儲視頻數(shù)據(jù);以及 一或多個處理器,其經(jīng)配置以譯碼指示符,所述指示符指示從特定清晰隨機存取CRA存取單元對位流的隨機存取是否要求來自先前存取單元的一或多個參數(shù)集以解碼所述特定CRA存取單元或后續(xù)存取單元,其中所述特定CRA存取單元定位于所述位流的經(jīng)譯碼視頻序列內的任何點處且不清除經(jīng)解碼圖片緩沖器DPB ;且基于所述指示符指示無需來自先前存取單元的參數(shù)集,在不從所述先前存取單元提取參數(shù)集的情況下執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取。
24.根據(jù)權利要求23所述的裝置,其中基于所述指示符指示需要來自先前存取單元的參數(shù)集,所述處理器經(jīng)配置以確定是否執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取。
25.根據(jù)權利要求24所述的裝置,其中基于在不從先前存取單元提取參數(shù)集的情況下可從另一隨機存取點RAP圖片進行對所述位流的隨機存取,所述處理器經(jīng)配置以確定不執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取以避免從所述先前存取單元提取所述參數(shù)集。
26.根據(jù)權利要求24所述的裝置,其中基于不可從另一隨機存取點RAP圖片進行對所述位流的隨機存取,所述處理器經(jīng)配置以確定在從所述先前存取單元提取所述參數(shù)集之后執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取。
27.根據(jù)權利要求23所述的裝置,其中所述視頻譯碼裝置包括視頻解碼裝置,且其中所述處理器經(jīng)配置以: 解碼所述位流的所述經(jīng)譯碼視頻序列中的一或多個CRA存取單元,包含所述特定CRA存取單元;以及 解碼針對所述CRA存取單元中的每一者的所述指示符,所述指示符指示從所述特定CRA存取單元對所述位流的隨機存取是否要求來自先前存取單元的一或多個參數(shù)集以解碼所述特定CRA存取單元或后續(xù)存取單元。
28.根據(jù)權利要求23所述的裝置,其中所述視頻譯碼裝置包括視頻編碼裝置,且其中所述處理器經(jīng)配置以: 編碼所述位流的所述經(jīng)譯碼視頻序列中的一或多個CRA存取單元,包含所述特定CRA存取單元;以及 編碼針對所述CRA存取單元中的每一者的所述指示符,所述指示符指示從所述特定CRA存取單元對所述位流的隨機存取是否要求來自先前存取單元的一或多個參數(shù)集以解碼所述特定CRA存取單元或后續(xù)存取單元。
29.根據(jù)權利要求23所述的裝置,其中基于所述指示符指示無需先前存取單元的參數(shù)集,所述特定CRA存取單元包含解碼所述特定CRA存取單元或后續(xù)存取單元所需的所有參數(shù)集。
30.根據(jù)權利要求23所述的裝置,其中所述指示符包括針對包含于所述位流中的一或多個CRA存取單元中的每一者的指示符。
31.根據(jù)權利要求23所述的裝置,其中所述指示符包括包含于所述位流的所述經(jīng)譯碼視頻序列中的所述特定CRA存取單元的補充增強信息SEI消息中的語法元素。
32.根據(jù)權利要求23所述的裝置,其中所述指示符包括包含于所述位流的所述經(jīng)譯碼視頻序列中的所述特定CRA存取單元中的特定類型的網(wǎng)絡抽象層NAL單元。
33.根據(jù)權利要求23所述的裝置,其中所述指示符包括包含于網(wǎng)絡抽象層NAL單元有效負載中的語法元素,所述網(wǎng)絡抽象層NAL單元有效負載包含在所述位流的所述經(jīng)譯碼視頻序列中的所述特定CRA存取單兀中。
34.根據(jù)權利要求23所述的裝置,其中譯碼所述指示符包括譯碼來自以下各項之一的所述指示符:包含于具有第一相異NAL單元類型的網(wǎng)絡抽象層NAL單元中的特定類型的序列參數(shù)集SPS、包含于具有第二相異NAL單元類型的NAL單元中的特定類型的存取單元定界符、特定類型的補充增強信息SEI消息、包含于存取單元定界符NAL單元的有效負載中的語法元素、包含于NAL單元標頭中的語法元素,或包含于SEI消息中的語法元素。
35.根據(jù)權利要求23所述的裝置,其中所述先前存取單元為按解碼次序或輸出次序之一在所述特定CRA存取單元之前的存取單元。
36.根據(jù)權利要求35所述的裝置,其中基于執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取,不解碼所述先前存取單元且所述先前存取單元不可在所述DPB中用作按解碼次序或輸出次序之一在所述特定CRA存取單元之后的存取單元的參考圖片。
37.根據(jù)權利要求35所述的裝置,其中基于執(zhí)行從在所述經(jīng)譯碼視頻序列中在所述特定CRA存取單元之前的隨機存取點RAP圖片對所述位流的隨機存取,所述先前存取單元經(jīng)解碼且可在所述DPB中用作按解碼次序或輸出次序之一在所述特定CRA存取單元之后的存取單元的參考圖片。
38.一種用于譯碼視頻數(shù)據(jù)的視頻譯碼裝置,所述裝置包括: 用于譯碼指示符的裝置,所述指示符指示從特定清晰隨機存取CRA存取單元對位流的隨機存取是否要求來自先前存取單元的一或多個參數(shù)集以解碼所述特定CRA存取單元或后續(xù)存取單元,其中所述特定CRA存取單元定位于所述位流的經(jīng)譯碼視頻序列內的任何點處且不清除經(jīng)解碼圖片緩沖器DPB ;以及 基于所述指示符指示無需來自先前存取單元的參數(shù)集,用于在不從所述先前存取單元提取參數(shù)集的情況下執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取的裝置。
39.根據(jù)權利要求38所述的裝置,其進一步包括基于所述指示符指示需要來自先前存取單元的參數(shù)集,用于確定是否執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取的裝置。
40.根據(jù)權利要求38所述的裝置,其中基于所述指示符指示無需先前存取單元的參數(shù)集,所述特定CRA存取單元包含解碼所述特定CRA存取單元或后續(xù)存取單元所需的所有參數(shù)集。
41.根據(jù)權利要求38所述的裝置,其中所述指示符包括針對包含于所述位流中的一或多個CRA存取單元中的每一者的指示符。
42.根據(jù)權利要求38所述的裝置,其中所述指示符包括包含于所述位流的所述經(jīng)譯碼視頻序列中的所述特定CRA存取單元的補充增強信息SEI消息中的語法元素。
43.根據(jù)權利要求38所述的裝置,其中所述指示符包括包含于所述位流的所述經(jīng)譯碼視頻序列中的所述特定CRA存取單元中的特定類型的網(wǎng)絡抽象層NAL單元。
44.根據(jù)權利要求38所述的裝置,其中所述指示符包括包含于網(wǎng)絡抽象層NAL單元有效負載中的語法元素,所述網(wǎng)絡抽象層NAL單元有效負載包含在所述位流的所述經(jīng)譯碼視頻序列中的所述特定CRA存取單兀中。
45.根據(jù)權利要求38所述的裝置,其中所述先前存取單元為按解碼次序或輸出次序之一在所述特定CRA存取單元之前的存取單元。
46.一種包括用于譯碼視頻數(shù)據(jù)的指令的計算機可讀媒體,所述指令在經(jīng)執(zhí)行時致使一或多個處理器: 譯碼指示符,所述指示符指示從特定清晰隨機存取CRA存取單元對位流的隨機存取是否要求來自先前存取單元的一或多個參數(shù)集以解碼所述特定CRA存取單元或后續(xù)存取單元,其中所述特定CRA存取單元定位于所述位流的經(jīng)譯碼視頻序列內的任何點處且不清除經(jīng)解碼圖片緩沖器DPB;以及 基于所述指示符指示無需來自先前存取單元的參數(shù)集,在不從所述先前存取單元提取參數(shù)集的情況下執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取。
47.根據(jù)權利要求46所述的計算機可讀媒體,其進一步包括基于所述指示符指示需要來自先前存取單元的參數(shù)集,致使所述處理器確定是否執(zhí)行從所述特定CRA存取單元對所述位流的隨機存取的指令。
【文檔編號】H04N19/70GK104396265SQ201380022304
【公開日】2015年3月4日 申請日期:2013年4月26日 優(yōu)先權日:2012年4月27日
【發(fā)明者】王益魁 申請人:高通股份有限公司