對視頻譯碼發(fā)信長期參考圖片的制作方法
【專利摘要】一種視頻解碼器可經(jīng)配置以:解碼第一值,所述第一值表示視頻數(shù)據(jù)的當(dāng)前圖片的圖片次序計(jì)數(shù)POC值的基本最高有效位MSB值與所述視頻數(shù)據(jù)的第一長期參考圖片的第一POC值的第一MSB值之間的差;解碼第二值,所述第二值表示所述視頻數(shù)據(jù)的第二長期參考圖片的第二POC值的第二MSB值與所述第一MSB值之間的差,其中所述第一POC值與所述第二POC值具有不同的最低有效位值;以及解碼所述視頻數(shù)據(jù)的當(dāng)前圖片中的與所述第一長期參考圖片和所述第二長期參考圖片中的至少一者有關(guān)的至少一部分。
【專利說明】對視頻譯碼發(fā)信長期參考圖片
[0001] 本申請案主張2012年6月28日申請的美國臨時(shí)申請案第61/665, 784號的權(quán)益, 所述臨時(shí)申請案的全部內(nèi)容以引用的方式并入本文中。
【技術(shù)領(lǐng)域】
[0002] 本發(fā)明涉及視頻譯碼。
【背景技術(shù)】
[0003] 數(shù)字視頻能力可并入到廣泛范圍的裝置中,所述裝置包含數(shù)字電視、數(shù)字直播系 統(tǒng)、無線廣播系統(tǒng)、個(gè)人數(shù)字助理(PDA)、膝上型或桌上型計(jì)算機(jī)、平板計(jì)算機(jī)、電子書閱 讀器、數(shù)字?jǐn)z影機(jī)、數(shù)字記錄裝置、數(shù)字媒體播放器、視頻游戲裝置、視頻游戲控制臺、蜂窩 式或衛(wèi)星無線電電話、所謂的"智能型手機(jī)"、視頻電傳會(huì)議裝置、視頻流式傳輸裝置,和類 似者。數(shù)字視頻裝置實(shí)施視頻譯碼技術(shù),例如,在由MPEG-2、MPEG-4、ITU-TH. 263、ITU-T H. 264/MPEG-4第10部分先進(jìn)視頻譯碼(AVC)所定義的標(biāo)準(zhǔn)、目前正在開發(fā)中的高效率視 頻譯碼01EVC)標(biāo)準(zhǔn)和這些標(biāo)準(zhǔn)的擴(kuò)展中所描述的視頻譯碼技術(shù)。ITU-TSG16WP3和ISO/ IECJTC1/SC29/WG11的視頻譯碼聯(lián)合協(xié)作小組(JCT-VC)于2012年4月27日到5月7日 在美國加州圣何塞市(SanJose)召開的第9次會(huì)議上布羅斯(Bross)等人的"高效率視頻 譯碼(HEVC)文本規(guī)范草案7"的文件LCTVC-I1003中描述即將到來的HEVC標(biāo)準(zhǔn)的最新草 案(被稱作"HEVC工作草案7"或"WD7"),從2013年5月13日起,其可從吐丨口://^611^. int-evry.fr/jct/doc_end_user/documents/8_San% 20Jose/wgll/JCTVC-H1003-v22.zip 下載而得。視頻譯碼裝置可通過實(shí)施這些視頻譯碼技術(shù)來更有效率地發(fā)射、接收、編碼、解 碼和/或存儲數(shù)字視頻信息。
[0004] 視頻譯碼技術(shù)包含空間(圖片內(nèi))預(yù)測和/或時(shí)間(圖片間)預(yù)測以減少或去除 視頻序列中固有的冗余。對于基于塊的視頻譯碼,可將視頻切片(例如,視頻幀或視頻幀的 一部分)分割成視頻塊,其也可被稱作樹型塊、譯碼單元(CU)和/或譯碼節(jié)點(diǎn)??墒褂孟?對于圖片中的相鄰塊中的參考樣本的空間預(yù)測來編碼同一圖片的幀內(nèi)譯碼(I)切片中的 視頻塊。圖片的幀間譯碼(P或B)切片中的視頻塊可使用相對于同一圖片中的相鄰塊中的 參考樣本的空間預(yù)測,或相對于其它參考圖片中的參考樣本的時(shí)間預(yù)測。圖片可被稱作幀, 且參考圖片可被稱作參考幀。
[0005] 空間或時(shí)間預(yù)測導(dǎo)致用于待譯碼的塊的預(yù)測性塊。殘余數(shù)據(jù)表示待譯碼的原始塊 與預(yù)測性塊之間的像素差。根據(jù)指向形成預(yù)測性塊的參考樣本的塊的運(yùn)動(dòng)向量和指示經(jīng)譯 碼塊與預(yù)測性塊之間的差的殘余數(shù)據(jù)來編碼幀間譯碼塊。根據(jù)幀內(nèi)譯碼模式和殘余數(shù)據(jù)來 編碼經(jīng)幀內(nèi)譯碼塊。為了進(jìn)一步壓縮,可將殘余數(shù)據(jù)從像素域變換到變換域,從而產(chǎn)生殘余 變換系數(shù),可接著量化殘余變換系數(shù)??蓲呙枰婚_始布置成二維陣列的經(jīng)量化變換系數(shù)以 便產(chǎn)生變換系數(shù)的一維向量,且可應(yīng)用熵譯碼以達(dá)成甚至更多壓縮。
【發(fā)明內(nèi)容】
[0006] -般來說,本發(fā)明描述用于對視頻譯碼發(fā)信長期參考圖片的技術(shù)。參考圖片大體 上對應(yīng)于可用于其它圖片的數(shù)據(jù)的時(shí)間預(yù)測性譯碼的參考的圖片。一般來說,長期參考圖 片存儲于經(jīng)解碼圖片緩沖器中,比其它參考圖片(例如,短期參考圖片)長。本發(fā)明描述與 涉及長期參考圖片的發(fā)信有關(guān)的各種技術(shù),例如在圖片的切片的切片標(biāo)頭中發(fā)信長期參考 圖片。本發(fā)明的技術(shù)可提供切片標(biāo)頭中的長期參考圖片的發(fā)信方法(例如)在效率和/或 適用性方面的改善。
[0007] 在一個(gè)實(shí)例中,一種方法包含:解碼第一值,所述第一值表示視頻數(shù)據(jù)的當(dāng)前圖片 的圖片次序計(jì)數(shù)(P0C)值的基本最高有效位(MSB)值與所述視頻數(shù)據(jù)的第一長期參考圖片 的第一P0C值的第一MSB值之間的差;解碼第二值,所述第二值表示所述視頻數(shù)據(jù)的第二長 期參考圖片的第二P0C值的第二MSB值與所述第一MSB值之間的差,其中所述第一P0C值 與所述第二P0C值具有不同的最低有效位(LSB)值;以及解碼所述視頻數(shù)據(jù)的當(dāng)前圖片中 的與使用所述第一值的所述第一長期參考圖片和使用所述第一值與所述第二值的所述第 二長期參考圖片中的至少一者有關(guān)的至少一部分。
[0008] 在另一實(shí)例中,一種用于解碼視頻數(shù)據(jù)的裝置包含視頻解碼器,其經(jīng)配置以:解碼 第一值,所述第一值表示視頻數(shù)據(jù)的當(dāng)前圖片的圖片次序計(jì)數(shù)(P0C)值的基本最高有效位 (MSB)值與所述視頻數(shù)據(jù)的第一長期參考圖片的第一P0C值的第一MSB值之間的差;解碼 第二值,所述第二值表示所述視頻數(shù)據(jù)的第二長期參考圖片的第二P0C值的第二MSB值與 所述第一MSB值之間的差,其中所述第一P0C值與所述第二P0C值具有不同的最低有效位 (LSB)值;以及解碼所述視頻數(shù)據(jù)的當(dāng)前圖片中與使用所述第一值的所述第一長期參考圖 片和使用所述第一值與所述第二值的所述第二長期參考圖片中的至少一者有關(guān)的至少一 部分。
[0009] 在另一實(shí)例中,一種裝置包含:用于解碼第一值的裝置,所述第一值表示視頻數(shù)據(jù) 的當(dāng)前圖片的圖片次序計(jì)數(shù)(P0C)值的基本最高有效位(MSB)值與所述視頻數(shù)據(jù)的第一長 期參考圖片的第一P0C值的第一MSB值之間的差;用于解碼第二值的裝置,所述第二值表 示所述視頻數(shù)據(jù)的第二長期參考圖片的第二P0C值的第二MSB值與所述第一MSB值之間的 差,其中所述第一P0C值與所述第二P0C值具有不同的最低有效位(LSB)值;以及用于解碼 所述視頻數(shù)據(jù)的當(dāng)前圖片中與使用所述第一值的所述第一長期參考圖片和使用所述第一 值與所述第二值的所述第二長期參考圖片中的至少一者有關(guān)的至少一部分的裝置。
[0010] 在另一實(shí)例中,一種計(jì)算機(jī)可讀存儲媒體于其上存儲有指令,所述指令在被執(zhí)行 時(shí)使處理器:解碼第一值,所述第一值表示視頻數(shù)據(jù)的當(dāng)前圖片的圖片次序計(jì)數(shù)(P0C)值 的基本最高有效位(MSB)值與所述視頻數(shù)據(jù)的第一長期參考圖片的第一P0C值的第一MSB 值之間的差;解碼第二值,所述第二值表示所述視頻數(shù)據(jù)的第二長期參考圖片的第二P0C 值的第二MSB值與所述第一MSB值之間的差,其中所述第一P0C值與所述第二P0C值具有 不同的最低有效位(LSB)值;以及解碼所述視頻數(shù)據(jù)的當(dāng)前圖片中與使用所述第一值的所 述第一長期參考圖片和使用所述第一值與所述第二值的所述第二長期參考圖片中的至少 一者有關(guān)的至少一部分。
[0011] 在另一實(shí)例中,一種編碼視頻數(shù)據(jù)的方法包含:編碼視頻數(shù)據(jù)的當(dāng)前圖片中與第 一長期參考圖片有關(guān)的至少第一部分和所述當(dāng)前圖片中與第二長期參考圖片有關(guān)的至少 第二部分;編碼第一值,所述第一值表示所述視頻數(shù)據(jù)的當(dāng)前圖片的圖片次序計(jì)數(shù)(P0C) 值的基本最高有效位(MSB)值與所述視頻數(shù)據(jù)的所述第一長期參考圖片的第一POC值的第 一MSB值之間的差;以及編碼第二值,所述第二值表示所述視頻數(shù)據(jù)的所述第二長期參考 圖片的第二P0C值的第二MSB值與所述第一MSB值之間的差,其中所述第一P0C值與所述 第二P0C值具有不同的最低有效位(LSB)值。
[0012] 在另一實(shí)例中,一種用于編碼視頻數(shù)據(jù)的裝置包含視頻編碼器,其經(jīng)配置以:編碼 視頻數(shù)據(jù)的當(dāng)前圖片中與第一長期參考圖片有關(guān)的至少第一部分和所述當(dāng)前圖片中與第 二長期參考圖片有關(guān)的至少第二部分;編碼第一值,所述第一值表示所述視頻數(shù)據(jù)的當(dāng)前 圖片的圖片次序計(jì)數(shù)(P0C)值的基本最高有效位(MSB)值與所述視頻數(shù)據(jù)的所述第一長期 參考圖片的第一P0C值的第一MSB值之間的差;以及編碼第二值,所述第二值表示所述視頻 數(shù)據(jù)的所述第二長期參考圖片的第二P0C值的第二MSB值與所述第一MSB值之間的差,其 中所述第一P0C值與所述第二P0C值具有不同的最低有效位(LSB)值。
[0013] 在另一實(shí)例中,一種用于編碼視頻數(shù)據(jù)的裝置包含:用于編碼視頻數(shù)據(jù)的當(dāng)前圖 片中與第一長期參考圖片有關(guān)的至少一第一部分和所述當(dāng)前圖片中與第二長期參考圖片 有關(guān)的至少一第二部分的裝置;用于編碼第一值的裝置,所述第一值表示所述視頻數(shù)據(jù)的 當(dāng)前圖片的圖片次序計(jì)數(shù)(P0C)值的基本最高有效位(MSB)值與所述視頻數(shù)據(jù)的所述第一 長期參考圖片的第一P0C值的第一MSB值之間的差;以及用于編碼第二值的裝置,所述第二 值表示所述視頻數(shù)據(jù)的所述第二長期參考圖片的第二P0C值的第二MSB值與所述第一MSB 值之間的差,其中所述第一P0C值與所述第二P0C值具有不同的最低有效位(LSB)值。
[0014] 在另一實(shí)例中,一種計(jì)算機(jī)可讀存儲媒體于其上存儲有指令,所述指令使處理器: 編碼視頻數(shù)據(jù)的當(dāng)前圖片中與第一長期參考圖片有關(guān)的至少第一部分和所述當(dāng)前圖片中 與第二長期參考圖片有關(guān)的至少第二部分;編碼第一值,所述第一值表示所述視頻數(shù)據(jù)的 當(dāng)前圖片的圖片次序計(jì)數(shù)(P0C)值的基本最高有效位(MSB)值與所述視頻數(shù)據(jù)的所述第一 長期參考圖片的第一P0C值的第一MSB值之間的差;以及編碼第二值,所述第二值表示所 述視頻數(shù)據(jù)的所述第二長期參考圖片的第二P0C值的第二MSB值與所述第一MSB值之間的 差,其中所述第一P0C值與所述第二P0C值具有不同的最低有效位(LSB)值。
[0015] 一或多個(gè)實(shí)例的細(xì)節(jié)陳述于隨附圖式和以下描述中。其它特征、目標(biāo)和優(yōu)勢將從 所述描述和所述圖式以及從權(quán)利要求書顯而易見。
【專利附圖】
【附圖說明】
[0016] 圖1為說明實(shí)例視頻編碼與解碼系統(tǒng)的框圖,所述視頻編碼與解碼系統(tǒng)可利用用 于切片標(biāo)頭中的長期參考圖片的改善式發(fā)信的技術(shù)。
[0017] 圖2為說明視頻編碼器的實(shí)例的框圖,所述視頻編碼器可實(shí)施用于切片標(biāo)頭中的 長期參考圖片的改善式發(fā)信的技術(shù)。
[0018] 圖3為說明視頻解碼器的實(shí)例的框圖,所述視頻解碼器可實(shí)施用于切片標(biāo)頭中的 長期參考圖片的改善式發(fā)信的技術(shù)。
[0019] 圖4為說明經(jīng)譯碼視頻圖片的序列的概念圖。
[0020] 圖5為根據(jù)本發(fā)明技術(shù)的說明用于編碼長期參考圖片的圖片次序計(jì)數(shù)(P0C)值的 實(shí)例方法的流程圖。
[0021] 圖6為根據(jù)本發(fā)明技術(shù)的說明用于解碼長期參考圖片的P0C值的實(shí)例方法的流程 圖。
【具體實(shí)施方式】
[0022] -般來說,視頻數(shù)據(jù)由經(jīng)快速連續(xù)俘獲或顯示的一連串圖片來表示。應(yīng)理解,在一 些實(shí)例中,圖片或圖片的部分可(例如)使用計(jì)算機(jī)圖形來產(chǎn)生,而非被俘獲(或除被俘獲 外)。圖片將經(jīng)顯示的次序(其可大體上與圖片經(jīng)俘獲或產(chǎn)生的次序相同)可與圖片經(jīng)譯 碼的次序不同。圖片的顯示次序大體上由圖片次序計(jì)數(shù)(P0C)值表示,而圖片的譯碼次序 大體上由巾貞數(shù)目(frame_num)值表示。
[0023] 圖片的譯碼一般涉及利用圖片中出現(xiàn)的冗余數(shù)據(jù)。例如,空間譯碼(也被稱作幀 內(nèi)預(yù)測性譯碼)利用共同圖片的像素值的空間相鄰塊之間所出現(xiàn)的冗余。作為另一實(shí)例, 時(shí)間譯碼(也被稱作幀間預(yù)測性譯碼)利用在不同時(shí)間執(zhí)行個(gè)體俘獲、產(chǎn)生或顯示的不同 圖片之間出現(xiàn)的冗余。更明確地說,可將圖片劃分為切片,其可指定用于幀內(nèi)預(yù)測或幀間預(yù) 測。此外,可將每一切片劃分為塊(例如,最大譯碼單元(LCU)),且可基于對應(yīng)切片是否已 經(jīng)指定用于幀內(nèi)預(yù)測或幀間預(yù)測而進(jìn)一步分割或譯碼所述塊中的每一者。
[0024] 關(guān)于幀間預(yù)測性譯碼的實(shí)例,可從參考圖片預(yù)測當(dāng)前正經(jīng)譯碼的圖片(也被稱作 "當(dāng)前圖片")的塊。WD7將"參考圖片"定義為具有等于1的nal_ref_flag的圖片。nal_ ref_flag為網(wǎng)絡(luò)提取層(NAL)單元中指示包含在NAL單元中的數(shù)據(jù)是否作為參考圖片的語 法元素對待。WD7也提供,參考圖片含有在后續(xù)圖片按解碼次序的解碼過程中可用于幀間預(yù) 測的樣本(即,像素值)。
[0025] 此外,WD7區(qū)分長期參考圖片與短期參考圖片。例如,WD7將長期參考圖片定義為 標(biāo)記成"用于長期參考"的參考圖片。WD7提供,序列參數(shù)集(SPS)中指示是否向經(jīng)譯碼視 頻序列發(fā)信全部的長期參考圖片的旗標(biāo)。根據(jù)WD7,視頻譯碼器在切片的切片標(biāo)頭中發(fā)信長 期參考圖片的P0C值的最低有效位(LSB)。相對于發(fā)信完整P0C值,發(fā)信LSB可能達(dá)成位節(jié) 省。根據(jù)WD7,如果解碼圖片緩沖器(DPB)中存在具有與長期參考圖片相同LSB位的一個(gè)以 上參考圖片,那么視頻譯碼器可發(fā)信長期參考圖片的P0C值的最高有效位(MSB)。此外,根 據(jù)WD7,視頻譯碼器可使用旗標(biāo)以指示經(jīng)發(fā)信的長期參考圖片是否可由當(dāng)前圖片用于參考。
[0026] 視頻譯碼器可維持當(dāng)前圖片的MSB(本文中被稱作"基本MSB值"),且使用與基本 MSB值有關(guān)的偏移值(例如,使用圖片i的語法元素delta_p〇C_mSb_CyCle_lt[i])來發(fā)信 長期參考圖片i的MSB。此語法元素在下文中被稱作"MSB循環(huán)"值。換句話說,為計(jì)算特 定圖片的P0C值,視頻譯碼器可計(jì)算:(基本MSB+圖片的MSB循環(huán))串接(圖片的LSB)。
[0027] 在WD7中,MSB循環(huán)值經(jīng)譯碼為基本MSB值與經(jīng)發(fā)信的MSB循環(huán)的圖片(S卩,圖片 i)的MSB之間的差。僅當(dāng)發(fā)信具有相同LSB值的兩個(gè)或兩個(gè)以上長期參考圖片時(shí),會(huì)同樣 發(fā)信第一個(gè)此類長期參考圖片的MSB循環(huán),且將剩余長期參考圖片的MSB循環(huán)值作為彼此 的相對偏移而發(fā)信。然而,根據(jù)WD7,此長期參考圖片的發(fā)信可能經(jīng)歷一或多個(gè)缺點(diǎn)。例如, 如果存在具有不同LSB值但均發(fā)信delta_poc_msb_cycle_lt[i]的兩個(gè)長期參考圖片,那 么當(dāng)前語法將如上文所述(即,將delta_poc_msb_cycle_lt[i]作為相對于基本MSB值的 偏移)而發(fā)信。然而,本發(fā)明認(rèn)識到發(fā)信圖片的MSB循環(huán)值之間的差可更有效率。
[0028] 根據(jù)WD7,在切片標(biāo)頭中發(fā)信長期參考圖片的識別數(shù)據(jù)可能經(jīng)歷一或多個(gè) 缺點(diǎn)。例如,如果當(dāng)前圖片的P0C值等于MaxPicOrderCntLsb*N-l,且P0C值等于 MaxPicOrderCntLsb*N的圖片為經(jīng)發(fā)信delta_poc_msb_cycle_lt[i]的第一個(gè)長期參考圖 片,那么WD7不提供用于發(fā)信delta_poc_msb_cycle_lt[i]的技術(shù)。在此狀況下,delta_ poc_msb_cycle_lt[i]的值應(yīng)為-1 (負(fù)一),但不可能為-1 (負(fù)一)。
[0029] 作為另一實(shí)例,如果存在具有不同LSB值但均發(fā)信delta_poc_msb_cycle_lt[i] 的兩個(gè)長期參考圖片,那么當(dāng)前語法將同樣發(fā)信delta_p〇C_msb_CyCle_lt[i]。然而,本發(fā) 明認(rèn)識到對圖片中的一者發(fā)信差可更有效率。
[0030] 作為另一實(shí)例,當(dāng)DPB中存在具有與所發(fā)信的長期參考圖片相同的LSB的一個(gè)以 上參考圖片時(shí),WD7委托也使用delta_poc_msb_cycle_lt[i]語法元素來發(fā)信LTRP的MSB 循環(huán)。然而,本發(fā)明認(rèn)識到,如果DPB中存在將由當(dāng)前圖片標(biāo)記為短期參考圖片的圖片,那 么于長期參考圖片的候選集中包含所述短期參考圖片可能以相比所需要的而發(fā)信更多MSB 位而結(jié)束。
[0031] 作為另一實(shí)例,當(dāng)DPB中存在POCLSB等于poc_lsb_lt[i]的n個(gè)參考圖片時(shí),且 在LSB等于p〇C_lsb_lt[i]的當(dāng)前圖片中發(fā)信k個(gè)長期參考圖片(其中k小于或等于n) 的情況下,WD7中所定義的語法委托所有k個(gè)圖片將使delta_poc_msb_present_flag[i]設(shè) 定為1。然而,如果k=n,那么本發(fā)明認(rèn)識到,視頻譯碼器無需將所有k個(gè)長期參考圖片的 delta_poc_msb_present_flag[i]設(shè)定為 1,而是將n_l個(gè)圖片的delta_poc_msb_present_ flag[i]設(shè)定為1便足夠。如下文關(guān)于圖式更詳細(xì)描述,本發(fā)明的技術(shù)可克服這些缺點(diǎn)中的 任一者或全部。一般來說,本發(fā)明描述可改善切片標(biāo)頭中的長期參考圖片的發(fā)信的各種技 術(shù)。
[0032] 圖1為說明實(shí)例視頻編碼與解碼系統(tǒng)10的框圖,所述視頻編碼與解碼系統(tǒng)10可 利用用于切片標(biāo)頭中的長期參考圖片的改善式發(fā)信的技術(shù)。如圖1所示,系統(tǒng)10包含源裝 置12,所述源裝置12提供稍后由目的地裝置14解碼的經(jīng)編碼視頻數(shù)據(jù)。明確地說,源裝置 12經(jīng)由計(jì)算機(jī)可讀媒體16向目的地裝置14提供視頻數(shù)據(jù)。源裝置12與目的地裝置14可 包括廣泛范圍的裝置中的任一者,所述裝置包含桌上型計(jì)算機(jī)、筆記型(即,膝上型)計(jì)算 機(jī)、平板計(jì)算機(jī)、機(jī)頂盒、例如所謂的"智能型"手機(jī)的電話手機(jī)、所謂的"智能型"板、電視、 攝影機(jī)、顯示裝置、數(shù)字媒體播放器、視頻游戲控制臺、視頻流式傳輸裝置或類似者。在一些 狀況下,源裝置12和目的地裝置14可經(jīng)裝備用于無線通信。
[0033]目的地裝置14可經(jīng)由計(jì)算機(jī)可讀媒體16接收待解碼的經(jīng)編碼視頻數(shù)據(jù)。計(jì)算機(jī) 可讀媒體16可包括能夠?qū)⒔?jīng)編碼視頻數(shù)據(jù)從源裝置12移動(dòng)到目的地裝置14的任何類型 的媒體或裝置。在一個(gè)實(shí)例中,計(jì)算機(jī)可讀媒體16可包括通信媒體,從而使源裝置12能夠 實(shí)時(shí)地將經(jīng)編碼視頻數(shù)據(jù)直接傳輸?shù)侥康牡匮b置14??筛鶕?jù)通信標(biāo)準(zhǔn)(例如,無線通信協(xié) 議)調(diào)制經(jīng)編碼視頻數(shù)據(jù),且將經(jīng)編碼視頻數(shù)據(jù)傳輸?shù)侥康牡匮b置14。通信媒體可包括任 何無線或有線通信媒體,例如,射頻(RF)頻譜或一或多個(gè)物理傳輸線。通信媒體可形成基 于封包的網(wǎng)絡(luò)(例如,局域網(wǎng)、廣域網(wǎng)或例如因特網(wǎng)的全球網(wǎng)絡(luò))的部分。通信媒體可包含 路由器、交換器、基站或可用以促進(jìn)從源裝置12到目的地裝置14的通信的任何其它裝備。
[0034] 在一些實(shí)例中,可將經(jīng)編碼數(shù)據(jù)從輸出接口 22輸出到存儲裝置。類似地,可由輸 入接口從存儲裝置存取經(jīng)編碼數(shù)據(jù)。存儲裝置可包含多種分散式或本地存取式數(shù)據(jù)存儲媒 體中的任一者,例如,硬盤機(jī)、藍(lán)光光盤、DVD、CD-ROM、快閃存儲器、易失性或非易失性存儲 器或用于存儲經(jīng)編碼視頻數(shù)據(jù)的任何其它合適的數(shù)字存儲媒體。在另一實(shí)例中,存儲裝置 可對應(yīng)于文件服務(wù)器或可存儲源裝置12所產(chǎn)生的經(jīng)編碼視頻的另一中間存儲裝置。
[0035]目的地裝置14可經(jīng)由流式傳輸或下載而從存儲裝置存取所存儲的視頻數(shù)據(jù)。文 件服務(wù)器可為能夠存儲經(jīng)編碼視頻數(shù)據(jù)且將那個(gè)經(jīng)編碼視頻數(shù)據(jù)傳輸?shù)侥康牡匮b置14的 任何類型的服務(wù)器。實(shí)例文件服務(wù)器包含網(wǎng)絡(luò)服務(wù)器(例如,用于網(wǎng)站)、FTP服務(wù)器、網(wǎng)絡(luò) 附接式存儲(NAS)裝置或本地磁盤機(jī)。目的地裝置14可經(jīng)由任何標(biāo)準(zhǔn)數(shù)據(jù)連接(包含因 特網(wǎng)連接)而存取經(jīng)編碼視頻數(shù)據(jù)。此數(shù)據(jù)連接可包含適合于存取存儲于文件服務(wù)器上的 經(jīng)編碼視頻數(shù)據(jù)的無線信道(例如,Wi-Fi連接)、有線連接(例如,DSL、纜線調(diào)制解調(diào)器, 等等)或兩者的組合。經(jīng)編碼視頻數(shù)據(jù)從存儲裝置的傳輸可為流式傳輸、下載傳輸,或其組 合。
[0036] 本發(fā)明的技術(shù)并不限于無線應(yīng)用或設(shè)定。所述技術(shù)可應(yīng)用于支持例如以下應(yīng)用的 多種多媒體應(yīng)用中的任一者的視頻譯碼:空中電視廣播、有線電視傳輸、衛(wèi)星電視傳輸、例 如HTTP動(dòng)態(tài)自適應(yīng)流式傳輸(DASH)的因特網(wǎng)流式傳輸視頻傳輸、經(jīng)編碼到數(shù)據(jù)存儲媒體 上的數(shù)字視頻、存儲于數(shù)據(jù)存儲媒體上的數(shù)字視頻的解碼或其它應(yīng)用。在一些實(shí)例中,系統(tǒng) 10可經(jīng)配置以支持單向或雙向視頻傳輸以支持例如視頻流式傳輸、視頻播放、視頻廣播和 /或視頻電話的應(yīng)用。
[0037] 在圖1的實(shí)例中,源裝置12包含視頻源18、視頻編碼器20和輸出接口 22。目的 地裝置14包含輸入接口 28、視頻解碼器30和顯示裝置32。根據(jù)本發(fā)明,源裝置12的視 頻編碼器20可經(jīng)配置以應(yīng)用用于切片標(biāo)頭中的長期參考圖片的改善式發(fā)信的技術(shù)。在其 它實(shí)例中,源裝置和目的地裝置可包含其它組件或布置。例如,源裝置12可從外部視頻源 18(例如,外部攝影機(jī))接收視頻數(shù)據(jù)。類似地,目的地裝置14可與外部顯示裝置介接,而 非包含集成式顯示裝置。
[0038] 圖1的所說明系統(tǒng)10僅為一個(gè)實(shí)例。用于切片標(biāo)頭中的長期參考圖片的改善式 發(fā)信的技術(shù)可由任一數(shù)字視頻編碼和/或解碼裝置執(zhí)行。雖然一般由視頻編碼裝置執(zhí)行本 發(fā)明的技術(shù),但也可由視頻編碼器/解碼器(通常被稱作"CODEC")執(zhí)行所述技術(shù)。此外, 也可由視頻預(yù)處理器來執(zhí)行本發(fā)明的技術(shù)。源裝置12和目的地裝置14僅僅為這些譯碼裝 置的實(shí)例,在所述譯碼裝置中,源裝置12產(chǎn)生用于傳輸?shù)侥康牡匮b置14的經(jīng)譯碼視頻數(shù) 據(jù)。在一些實(shí)例中,裝置12、14可按實(shí)質(zhì)上對稱的方式進(jìn)行操作,使得裝置12、14中的每一 者包含視頻編碼和解碼組件。因此,系統(tǒng)10可支持視頻裝置12、14之間的單向或雙向視頻 傳輸,例如,用于視頻流式傳輸、視頻播放、視頻廣播或視頻電話。
[0039] 源裝置12的視頻源18可包含例如視頻攝影機(jī)的視頻俘獲裝置、含有先前俘獲的 視頻的視頻存檔和/或用以從視頻內(nèi)容提供者接收視頻的視頻饋入接口。作為另一替代, 視頻源18可產(chǎn)生基于計(jì)算機(jī)圖形的數(shù)據(jù)作為源視頻、或產(chǎn)生實(shí)況視頻、存檔視頻和計(jì)算機(jī) 產(chǎn)生的視頻的組合。在一些狀況下,如果視頻源18為視頻攝影機(jī),那么源裝置12和目的地 裝置14可形成所謂的攝影機(jī)電話或視頻電話。然而,如上文所提及,本發(fā)明中所描述的技 術(shù)大體上可適用于視頻譯碼,且可適用于無線和/或有線應(yīng)用。在每一狀況下,所俘獲的、 預(yù)先俘獲的或計(jì)算機(jī)產(chǎn)生的視頻可由視頻編碼器20編碼。經(jīng)編碼視頻信息接著可由輸出 接口 22輸出到計(jì)算機(jī)可讀媒體16上。
[0040] 計(jì)算機(jī)可讀媒體16可包含:暫時(shí)性媒體,例如,無線廣播或有線網(wǎng)絡(luò)傳輸;或存儲 媒體(即,非暫時(shí)性存儲媒體),例如,硬盤、隨身碟、壓縮光盤、數(shù)字視頻光盤、藍(lán)光光盤或 其它計(jì)算機(jī)可讀媒體。在一些實(shí)例中,網(wǎng)絡(luò)服務(wù)器(圖中未展示)可從源裝置12接收經(jīng)編 碼視頻數(shù)據(jù),且(例如,經(jīng)由網(wǎng)絡(luò)傳輸)將經(jīng)編碼視頻數(shù)據(jù)提供到目的地裝置14。類似地, 媒體生產(chǎn)設(shè)施(例如,光盤壓印設(shè)施)的計(jì)算裝置可從源裝置12接收經(jīng)編碼視頻數(shù)據(jù)且產(chǎn) 生含有經(jīng)編碼視頻數(shù)據(jù)的光盤。因此,在各種實(shí)例中,可將計(jì)算機(jī)可讀媒體16理解成包含 各種形式的一或多個(gè)計(jì)算機(jī)可讀媒體。
[0041]目的地裝置14的輸入接口 28從計(jì)算機(jī)可讀媒體16接收信息。計(jì)算機(jī)可讀媒體 16的信息可包含由視頻編碼器20定義、也由視頻解碼器30使用的語法信息,所述語法信 息包含描述塊和其它經(jīng)譯碼單元(例如,G0P)的特性和/或處理的語法元素。顯示裝置32 向用戶顯示經(jīng)解碼視頻數(shù)據(jù),且可包括多種顯示裝置中的任一者,例如,陰極射線管(CRT)、 液晶顯示器(LCD)、等離子顯示器、有機(jī)發(fā)光二極管(0LED)顯示器或另一類型的顯示裝置。
[0042] 視頻編碼器20和視頻解碼器30可根據(jù)例如目前在開發(fā)中的高效率視頻譯碼 (HEVC)標(biāo)準(zhǔn)的視頻譯碼標(biāo)準(zhǔn)而操作,且可遵照HEVC測試模型(腿)。替代地,視頻編碼器20 和視頻解碼器30可根據(jù)例如ITU-TH. 264標(biāo)準(zhǔn)替代地被稱作MPEG-4第10部分先進(jìn)視頻 譯碼(AVC)的其它專有或行業(yè)標(biāo)準(zhǔn)或這些標(biāo)準(zhǔn)的擴(kuò)展而操作。然而,本發(fā)明的技術(shù)不限于 任何特定譯碼標(biāo)準(zhǔn)。視頻譯碼標(biāo)準(zhǔn)的其它實(shí)例包含MPEG-2和ITU-TH. 263。雖然圖1中 未展示,但在一些方面中,視頻編碼器20和視頻解碼器30可各自與音頻編碼器和解碼器集 成,且可包含適當(dāng)MUX-DEMUX單元或其它硬件和軟件以處置共同數(shù)據(jù)流或單獨(dú)數(shù)據(jù)流中的 音頻和視頻兩者的編碼。如果適用,那么MUX-DEMUX單元可遵照ITUH. 223多路復(fù)用器協(xié) 議或例如用戶數(shù)據(jù)報(bào)協(xié)議(UDP)的其它協(xié)議。
[0043]ITU-TH. 264/MPEG-4(AVC)標(biāo)準(zhǔn)由ITU-T視頻譯碼專家群(VCEG)連同IS0/IEC動(dòng) 畫專家群(MPEG) -起制定為被稱作聯(lián)合視頻小組(JVT)的集體合作的產(chǎn)物。在一些方面 中,本發(fā)明中所描述的技術(shù)可應(yīng)用于大體上遵照H. 264標(biāo)準(zhǔn)的裝置。H. 264標(biāo)準(zhǔn)由ITU-T研 究小組且在日期為2005年3月描述于ITU-T推薦H. 264 (用于一般視聽服務(wù)的先進(jìn)視頻譯 碼)中,其在本文中可被稱作H. 264標(biāo)準(zhǔn)或H. 264規(guī)范,或H. 264/AVC標(biāo)準(zhǔn)或規(guī)范。聯(lián)合視 頻小組(JVT)繼續(xù)致力于對H. 264/MPEG-4AVC的擴(kuò)展。
[0044] 視頻編碼器20和視頻解碼器30可各自實(shí)施為多種合適的編碼器電路中的任一 者,例如,一或多個(gè)微處理器、數(shù)字信號處理器OSP)、專用集成電路(ASIC)、現(xiàn)場可編程門 陣列(FPGA)、離散邏輯、軟件、硬件、固件或其任何組合。當(dāng)所述技術(shù)部分地以軟件實(shí)施時(shí), 裝置可將用于軟件的指令存儲于合適的非暫時(shí)性計(jì)算機(jī)可讀媒體中,且在硬件中使用一或 多個(gè)處理器來執(zhí)行所述指令以執(zhí)行本發(fā)明的技術(shù)。視頻編碼器20和視頻解碼器30中的每 一者可包含于一或多個(gè)編碼器或解碼器中,其中的任一者可集成為相應(yīng)裝置中的組合編碼 器/解碼器(CODEC)的部分。
[0045]JCT-VC正致力于HEVC標(biāo)準(zhǔn)的開發(fā)。HEVC標(biāo)準(zhǔn)化努力是基于視頻譯碼裝置的演進(jìn) 模型,其被稱作ffiVC測試模型(HM)。冊假設(shè)視頻譯碼裝置相對于根據(jù)(例如)ITU-TH. 264/ AVC的現(xiàn)有裝置的若干額外能力。例如,H. 264提供九個(gè)幀內(nèi)預(yù)測編碼模式,而HM可提供多 達(dá)三十三個(gè)幀內(nèi)預(yù)測編碼模式。
[0046] -般來說,HM的工作模型描述視頻幀或圖片可劃分成包含亮度樣本和色度樣本兩 者的樹型塊或最大譯碼單元(LCU)的序列。位流內(nèi)的語法數(shù)據(jù)可定義LCU的大小,LCU就 像素的數(shù)目來說為最大譯碼單元。切片包含按譯碼次序的許多連續(xù)樹型塊??蓪⒁曨l幀或 圖片分割成一或多個(gè)切片。每一樹型塊可根據(jù)四分樹而分裂成譯碼單元(CU)。一般來說, 四分樹數(shù)據(jù)結(jié)構(gòu)中針對每一CU包含一個(gè)節(jié)點(diǎn),其中根節(jié)點(diǎn)對應(yīng)于樹型塊。如果將CU分裂 成四個(gè)子CU,那么對應(yīng)于所述CU的節(jié)點(diǎn)包含四個(gè)葉節(jié)點(diǎn),所述葉節(jié)點(diǎn)中的每一者對應(yīng)于所 述子⑶中的一者。
[0047] 所述四分樹數(shù)據(jù)結(jié)構(gòu)中的每一節(jié)點(diǎn)可提供針對對應(yīng)CU的語法數(shù)據(jù)。例如,在四分 樹中的節(jié)點(diǎn)可包含分裂旗標(biāo),其指示是否將對應(yīng)于所述節(jié)點(diǎn)的CU分裂成子CU??蛇f歸地定 義用于CU的語法元素,且用于CU的語法元素可取決于CU是否分裂成子CU。如果CU未經(jīng) 進(jìn)一步分裂,那么其被稱作葉CU。在本發(fā)明中,即使不存在原始葉CU的明顯分裂,葉CU的 四個(gè)子⑶也將被稱作葉⑶。例如,如果16X16大小的⑶未經(jīng)進(jìn)一步分裂,那么四個(gè)8X8 子⑶也會(huì)被稱作葉⑶,盡管所述16X16⑶從未經(jīng)分裂。
[0048] 除了CU不具有大小區(qū)別之外,CU具有與H. 264標(biāo)準(zhǔn)的宏塊類似的用途。例如,樹 型塊可分裂成四個(gè)子節(jié)點(diǎn)(也被稱作子CU),且每一子節(jié)點(diǎn)可又為母節(jié)點(diǎn)并分裂成另外四 個(gè)子節(jié)點(diǎn)。被稱作四分樹的葉節(jié)點(diǎn)的最終的未分裂子節(jié)點(diǎn)包括譯碼節(jié)點(diǎn),所述譯碼節(jié)點(diǎn)也 被稱作葉CU。與經(jīng)譯碼位流相關(guān)聯(lián)的語法數(shù)據(jù)可定義可分裂樹型塊的最大次數(shù)(其被稱作 最大CU深度),且也可定義所述譯碼節(jié)點(diǎn)的最小大小。因此,位流也可定義最小譯碼單元 (SCU)。本發(fā)明使用術(shù)語"塊"指在HEVC的上下文中的CU、PU或TU中的任一者,或在其它 標(biāo)準(zhǔn)的上下文中的類似數(shù)據(jù)結(jié)構(gòu)(例如,在H. 264/AVC中的宏塊和其子塊)。
[0049] CU包含譯碼節(jié)點(diǎn)和與所述譯碼節(jié)點(diǎn)相關(guān)聯(lián)的若干預(yù)測單元(PU)和變換單元 (TU)。⑶的大小對應(yīng)于譯碼節(jié)點(diǎn)的大小,且形狀必須為正方形。⑶的大小的范圍可從8X8 像素直到具有最大64X64像素或大于64X64像素的樹型塊的大小。每一⑶可含有一或 多個(gè)PU和一或多個(gè)TU。與CU相關(guān)聯(lián)的語法數(shù)據(jù)可描述(例如)CU到一或多個(gè)PU的分割。 分割模式可視CU經(jīng)跳過或直接模式編碼、經(jīng)幀內(nèi)預(yù)測模式編碼抑或幀間預(yù)測模式編碼而 不同。PU可分割成非正方形形狀。與CU相關(guān)聯(lián)的語法數(shù)據(jù)也可描述(例如)CU根據(jù)四分 樹而分割成一或多個(gè)TU。TU的形狀可為正方形或非正方形(例如,矩形)。
[0050] HEVC標(biāo)準(zhǔn)允許根據(jù)TU的變換,所述變換對于不同⑶可不同。通常基于針對經(jīng)分 割LCU所定義的給定CU內(nèi)的PU的大小而設(shè)定TU大小,但可能并非總是如此狀況。TU通 常具有與PU相同的大小,或小于PU。在一些實(shí)例中,可使用已知為"殘余四分樹"(RQT)的 四分樹結(jié)構(gòu)而將對應(yīng)于CU的殘余樣本再分成較小單元。RQT的葉節(jié)點(diǎn)可被稱作變換單元 (TU)??勺儞Q與TU相關(guān)聯(lián)的像素差值以產(chǎn)生變換系數(shù),變換系數(shù)可被量化。
[0051] 葉⑶可包含一或多個(gè)預(yù)測單元(PU)。一般來說,PU表示對應(yīng)于對應(yīng)⑶的全部或 一部分的空間區(qū)域,且可包含用于檢索PU的參考樣本的數(shù)據(jù)。此外,PU包含與預(yù)測有關(guān)的 數(shù)據(jù)。例如,當(dāng)PU經(jīng)幀內(nèi)模式編碼時(shí),用于TO的數(shù)據(jù)可包含于殘余四分樹(RQT)中,殘余 四分樹可包含描述對應(yīng)于PU的TU的幀內(nèi)預(yù)測模式的數(shù)據(jù)。作為另一實(shí)例,當(dāng)PU經(jīng)幀間模 式編碼時(shí),TO可包含定義所述PU的一或多個(gè)運(yùn)動(dòng)向量的數(shù)據(jù)。定義PU的運(yùn)動(dòng)向量的數(shù)據(jù) 可描述(例如)運(yùn)動(dòng)向量的水平分量、運(yùn)動(dòng)向量的垂直分量、運(yùn)動(dòng)向量的分辨率(例如,四 分之一像素精度或八分之一像素精度)、運(yùn)動(dòng)向量所指向的參考圖片和/或用于運(yùn)動(dòng)向量 的參考圖片列表(例如,列表〇、列表1或列表C)。
[0052] 具有一或多個(gè)TO的葉⑶也可包含一或多個(gè)變換單元(TU)??墒褂肦QT(也被稱 作TU四分樹結(jié)構(gòu))指定變換單元,如上文所論述。例如,分裂旗標(biāo)可指示葉CU是否分裂成 四個(gè)變換單元。接著,每一變換單元可進(jìn)一步分裂成其它子TU。當(dāng)TU未進(jìn)一步分裂時(shí),其 可被稱作葉TU。一般來說,對于幀內(nèi)譯碼,屬于葉CU的所有葉TU共享相同幀內(nèi)預(yù)測模式。 艮P,大體上應(yīng)用相同幀內(nèi)預(yù)測模式來計(jì)算葉CU的所有TU的預(yù)測值。對于幀內(nèi)譯碼,視頻編 碼器可使用幀內(nèi)預(yù)測模式將每一葉TU的殘余值計(jì)算為在CU的對應(yīng)于所述TU的部分與原 始塊之間的差。TU未必限于PU的大小。因此,TU可能大于或小于PU。對于幀內(nèi)譯碼,PU 可與用于同一⑶的對應(yīng)葉TU共置。在一些實(shí)例中,葉TU的最大大小可對應(yīng)于對應(yīng)葉⑶ 的大小。
[0053] 此外,葉⑶的TU也可與被稱作殘余四分樹(RQT)的相應(yīng)四分樹數(shù)據(jù)結(jié)構(gòu)相關(guān)聯(lián)。 艮P,葉CU可包含指示如何將葉CU分割成TU的四分樹。TU四分樹的根節(jié)點(diǎn)大體上對應(yīng)于 葉CU,而CU四分樹的根節(jié)點(diǎn)大體上對應(yīng)于樹型塊(或LCU)。RQT的不分裂的TU被稱作葉 TU。一般來說,除非另有指示,否則本發(fā)明分別使用術(shù)語CU和TU來指葉CU和葉TU。
[0054] 視頻序列通常包含一系列視頻幀或圖片。圖片群組(G0P)大體包括一系列一或多 個(gè)視頻圖片。G0P可在G0P的標(biāo)頭、圖片中的一或多者的標(biāo)頭中或在別處包含描述包含于 G0P中的圖片數(shù)目的語法數(shù)據(jù)。圖片的每一切片可包含描述所述相應(yīng)切片的編碼模式的切 片語法數(shù)據(jù)。視頻編碼器20通常對個(gè)別視頻切片內(nèi)的視頻塊進(jìn)行操作,以便編碼視頻數(shù) 據(jù)。視頻塊可對應(yīng)于CU內(nèi)的譯碼節(jié)點(diǎn)。視頻塊可具有固定或變化的大小,且可根據(jù)指定譯 碼標(biāo)準(zhǔn)而在大小方面不同。
[0055] 作為實(shí)例,HM支持以各種TO大小進(jìn)行預(yù)測。假定特定⑶的大小為2NX2N,那么 HM支持以2NX2N或NXN的PU大小進(jìn)行幀內(nèi)預(yù)測,和以2NX2N、2NXN、NX2N或NXN的 對稱PU大小進(jìn)行幀間預(yù)測。HM也支持以2NXnU、2NXnD、nLX2N和nRX2N的PU大小針 對中貞間預(yù)測進(jìn)行不對稱分割。在不對稱分割中,CU的一個(gè)方向未分割,而另一方向被分割 成25%和75%。CU的對應(yīng)于25%分割區(qū)的部分由"n"繼之以"上(Up)"、"下(Down) "、"左 (Left) "或"右(Right) "的指示來指示。因此,例如,"2NXnU"指被水平分割而在頂部具 有 2NX0. 5NPU和在底部具有 2NX1. 5NPU的 2NX2NCU。
[0056] 在本發(fā)明中,"NXN"與"N乘N"可互換地使用以指視頻塊在垂直維度與水平維度 方面的像素尺寸,例如,16X16像素或16乘16像素。一般來說,16X16塊在垂直方向中將 具有16個(gè)像素(y= 16)且在水平方向中將具有16個(gè)像素(x= 16)。類似地,NXN塊通 常在垂直方向上具有N個(gè)像素,且在水平方向上具有N個(gè)像素,其中N表示非負(fù)整數(shù)值???按行和列來布置塊中的像素。另外,塊未必需要在水平方向中具有與在垂直方向中相同數(shù) 目個(gè)像素。例如,塊可包括NXM個(gè)像素,其中M未必等于N。
[0057] 在使用CU的PU進(jìn)行幀內(nèi)預(yù)測性或幀間預(yù)測性譯碼之后,視頻編碼器20可計(jì)算CU 的TU的殘余數(shù)據(jù)。PU可包括描述于空間域(也被稱作像素域)中產(chǎn)生預(yù)測性像素?cái)?shù)據(jù)的 方法或模式的語法數(shù)據(jù),且TU可在將變換(例如,離散余弦變換(DCT)、整數(shù)變換、小波變換 或概念上類似的變換)應(yīng)用于殘余視頻數(shù)據(jù)之后包括變換域中的系數(shù)。殘余數(shù)據(jù)可對應(yīng)于 未經(jīng)編碼圖片的像素與對應(yīng)于PU的預(yù)測值之間的像素差。視頻編碼器20可形成包含CU 的殘余數(shù)據(jù)的TU,且接著變換所述TU以產(chǎn)生CU的變換系數(shù)。
[0058] 在用以產(chǎn)生變換系數(shù)的任何變換之后,視頻編碼器20可執(zhí)行變換系數(shù)的量化。量 化大體上指如下過程:將變換系數(shù)量化以可能地減少用以表示所述系數(shù)的數(shù)據(jù)量,從而提 供進(jìn)一步壓縮。所述量化過程可減少與所述系數(shù)中的一些或所有系數(shù)相關(guān)聯(lián)的位深度。例 如,可在量化期間將n位值向下舍位到m位值,其中n大于m。
[0059] 在量化之后,視頻編碼器可掃描變換系數(shù),從而從包含經(jīng)量化變換系數(shù)的二維矩 陣產(chǎn)生一維向量。掃描可經(jīng)設(shè)計(jì)成將較高能量(且因此較低頻率)系數(shù)置于陣列前部,且 將較低能量(且因此較高頻率)系數(shù)置于陣列后部。在一些實(shí)例中,視頻編碼器20可利用 預(yù)定義掃描次序來掃描經(jīng)量化變換系數(shù),以產(chǎn)生可經(jīng)熵編碼的序列化向量。在其它實(shí)例中, 視頻編碼器20可執(zhí)行自適應(yīng)掃描。在掃描經(jīng)量化變換系數(shù)以形成一維向量之后,視頻編碼 器20可(例如)根據(jù)上下文自適應(yīng)可變長度譯碼(CAVLC)、上下文自適應(yīng)二進(jìn)制算術(shù)譯碼 (CABAC)、基于語法的上下文自適應(yīng)二進(jìn)制算術(shù)譯碼(SBAC)、概率區(qū)間分割熵(PIPE)譯碼 或另一熵編碼方法而熵編碼所述一維向量。視頻編碼器20也可熵編碼與經(jīng)編碼視頻數(shù)據(jù) 相關(guān)聯(lián)的語法元素以供視頻解碼器30用于解碼視頻數(shù)據(jù)。
[0060] 為了執(zhí)行CABAC,視頻編碼器20可將上下文模型內(nèi)的上下文指派給待傳輸?shù)姆?號。所述上下文可能涉及(例如)符號的相鄰值是否為非零。為了執(zhí)行CAVLC,視頻編碼 器20可針對待傳輸?shù)姆栠x擇可變長度碼??蓸?gòu)建VLC中的碼字使得相對較短碼對應(yīng)于 更有可能的符號,而較長碼對應(yīng)于較不可能的符號。以此方式,使用VLC可達(dá)成位節(jié)省(與 (例如)針對待傳輸?shù)拿恳环柺褂玫乳L度碼字相比較)。概率確定可基于指派給符號的 上下文而進(jìn)行。
[0061] 根據(jù)本發(fā)明的技術(shù),視頻編碼器20與視頻解碼器30可經(jīng)配置以利用用于發(fā)信數(shù) 據(jù)以供(例如)在切片標(biāo)頭、參數(shù)集(包含圖片參數(shù)集(PPS)和序列參數(shù)集(SPS))或類似 者中識別長期參考圖片的改善式技術(shù)。一般來說,視頻編碼器20與視頻解碼器30可經(jīng)配 置以單獨(dú)地或以任何組合來執(zhí)行本發(fā)明技術(shù)中的任一者或全部。在一些實(shí)例中,視頻編碼 器20與視頻解碼器30可經(jīng)配置以執(zhí)行用于對長期參考圖片發(fā)信APOCMSB循環(huán)的負(fù)值的 方法。在一些實(shí)例中,視頻編碼器20與視頻解碼器30可經(jīng)配置以使用差分譯碼來執(zhí)行用 于更有效地對具有不同LSB值的長期參考圖片發(fā)信APOCMSB循環(huán)值的方法。
[0062] 在一些實(shí)例中,可將作為當(dāng)前圖片的短期參考圖片而發(fā)信(或包含在當(dāng)前圖片的 短期參考圖片集中)的參考圖片排除在決定是否對長期參考圖片發(fā)送APOCMSB循環(huán)值所 利用的參考圖片之外,以避免發(fā)送不必要的APOCMSB循環(huán)值。在一些實(shí)例中,當(dāng)DPB中存 在POCLSB等于poc_lsb_lt[i]的n個(gè)參考圖片(包含或排除短期參考圖片)時(shí),且當(dāng)在 LSB值等于p〇C_lsb_lt[i]的當(dāng)前圖片中發(fā)信n個(gè)長期參考圖片時(shí),視頻編碼器20可僅對 n_l個(gè)長期參考圖片發(fā)送APOCMSB循環(huán)值,且視頻解碼器30可僅對n-1個(gè)長期參考圖片 接收此數(shù)據(jù),但對所有n個(gè)長期參考圖片發(fā)送此數(shù)據(jù)是可能的。
[0063] 上文各種技術(shù)中的任一者或全部可根據(jù)以下實(shí)例實(shí)施方案來實(shí)施。如下文所示, 可修改WD7中描述長期參考圖片的MSB循環(huán)的語法元素。本發(fā)明也描述用于導(dǎo)出陣列DeltaPocMSBCycleLt□的實(shí)例方法。本發(fā)明進(jìn)一步描述用于參考圖片集的實(shí)例解碼過程。 此外,本發(fā)明描述語法元素delta_poc_msb_present_flag[i]和poc_lsb_lt[i]的語義。 WD7的其它語法元素的語法和語義可保持不變。
[0064] 表1表示切片標(biāo)頭的語法的實(shí)例集合。加底線文字表示相對于WD7的切片標(biāo)頭語 法的改變。在下文論述改變的語法元素的語義以及其它語法元素的改變的語義。
[0065] 表 1
[0066]
【權(quán)利要求】
1. 一種解碼視頻數(shù)據(jù)的方法,所述方法包括: 解碼第一值,所述第一值表示視頻數(shù)據(jù)的當(dāng)前圖片的圖片次序計(jì)數(shù)POC值的基本最高 有效位MSB值與所述視頻數(shù)據(jù)的第一長期參考圖片的第一 POC值的第一 MSB值之間的差; 解碼第二值,所述第二值表示所述視頻數(shù)據(jù)的第二長期參考圖片的第二POC值的第二 MSB值與所述第一 MSB值之間的差,其中所述第一 POC值與所述第二POC值具有不同的最低 有效位LSB值;以及 解碼所述視頻數(shù)據(jù)的當(dāng)前圖片中的與使用所述第一值的所述第一長期參考圖片和使 用所述第一值與所述第二值的所述第二長期參考圖片中的至少一者有關(guān)的至少一部分。
2. 根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括: 使用所述第一值將所述第一長期參考圖片的第一 MSB循環(huán)值計(jì)算為 DeltaPocMSBCycleLt[i_l];以及 將所述第二長期參考圖片的第二MSB循環(huán)值計(jì)算為De 1 taPocMSBCyc 1 eLt [ i ],其 中計(jì)算所述第二MSB循環(huán)值包括基于DeltaPocMSBCycleLt[i_l]與所述第二值而計(jì)算 DeltaPocMSBCycleLt[i]〇
3. 根據(jù)權(quán)利要求1所述的方法,其中所述第一長期參考圖片對應(yīng)于索引j,其中所述第 二長期參考圖片對應(yīng)于索引i,其中所述第一值包括delta_poc_msb_cycle_lt_plusl [j], 其中所述第二值包括delta_poc_msb_cycle_lt_plusl [i],且其中j處于從包含0到包含 i_l的范圍中。
4. 根據(jù)權(quán)利要求1所述的方法,其中所述第一值與所述第二值中的至少一者包括負(fù)整 數(shù)值。
5. 根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括至少部分基于標(biāo)記為所述當(dāng)前圖片的短 期參考圖片的許多參考圖片而確定所述第一 P0C值與所述第二P0C值中的至少一者。
6. -種用于解碼視頻數(shù)據(jù)的裝置,所述裝置包括視頻解碼器,其經(jīng)配置以:解碼第一 值,所述第一值表示視頻數(shù)據(jù)的當(dāng)前圖片的圖片次序計(jì)數(shù)P0C值的基本最高有效位MSB值 與所述視頻數(shù)據(jù)的第一長期參考圖片的第一 P0C值的第一 MSB值之間的差;解碼第二值, 所述第二值表示所述視頻數(shù)據(jù)的第二長期參考圖片的第二P0C值的第二MSB值與所述第一 MSB值之間的差,其中所述第一 P0C值與所述第二P0C值具有不同的最低有效位LSB值;以 及解碼所述視頻數(shù)據(jù)的當(dāng)前圖片中的與使用所述第一值的所述第一長期參考圖片和使用 所述第一值與所述第二值的所述第二長期參考圖片中的至少一者有關(guān)的至少一部分。
7. 根據(jù)權(quán)利要求6所述的裝置,其中所述視頻解碼器經(jīng)進(jìn)一步配置以:使用所述 第一值將所述第一長期參考圖片的第一 MSB循環(huán)值計(jì)算為DeltaPocMSBCycleLt [i-1]; 以及將所述第二長期參考圖片的第二MSB循環(huán)值計(jì)算為DeltaPocMSBCycleLt [i],其 中計(jì)算所述第二MSB循環(huán)值包括基于DeltaPocMSBCycleLt[i_l]與所述第二值來計(jì)算 DeltaPocMSBCycleLt[i]〇
8. 根據(jù)權(quán)利要求6所述的裝置,其中所述第一長期參考圖片對應(yīng)于索引i-1,其中 所述第二長期參考圖片對應(yīng)于索引i,其中所述第一值包括delta_poc_msb_cycle_lt_ plusl [i_l],且其中所述第二值包括 delta_poc_msb_cycle_lt_plusl [i]。
9. 根據(jù)權(quán)利要求6所述的裝置,其中所述第一值與所述第二值中的至少一者包括負(fù)整 數(shù)值。
10. 根據(jù)權(quán)利要求6所述的裝置,其中所述視頻解碼器經(jīng)進(jìn)一步配置以:至少部分基于 標(biāo)記為所述當(dāng)前圖片的短期參考圖片的許多參考圖片來確定所述第一 POC值與所述第二 POC值中的至少一者。
11. 一種用于解碼視頻數(shù)據(jù)的裝置,所述裝置包括: 用于解碼第一值的裝置,所述第一值表示視頻數(shù)據(jù)的當(dāng)前圖片的圖片次序計(jì)數(shù)POC值 的基本最高有效位MSB值與所述視頻數(shù)據(jù)的第一長期參考圖片的第一 POC值的第一 MSB值 之間的差; 用于解碼第二值的裝置,所述第二值表示所述視頻數(shù)據(jù)的第二長期參考圖片的第二 POC值的第二MSB值與所述第一 MSB值之間的差,其中所述第一 POC值與所述第二POC值具 有不同的最低有效位LSB值;以及 用于解碼所述視頻數(shù)據(jù)的當(dāng)前圖片中的與使用所述第一值的所述第一長期參考圖片 和使用所述第一值與所述第二值的所述第二長期參考圖片中的至少一者有關(guān)的至少一部 分的裝置。
12. 根據(jù)權(quán)利要求11所述的裝置,其進(jìn)一步包括: 用于使用所述第一值將所述第一長期參考圖片的第一 MSB循環(huán)值計(jì)算為 DeltaPocMSBCycleLt[i_l]的裝置;以及 用于將所述第二長期參考圖片的第二MSB循環(huán)值計(jì)算為DeltaPocMSBCycleLt [i]的裝 置,其中計(jì)算所述第二MSB循環(huán)值包括基于DeltaPocMSBCycleLt [i-1]與所述第二值來計(jì) 算 DeltaPocMSBCycleLt[i]。
13. 根據(jù)權(quán)利要求11所述的裝置,其中所述第一長期參考圖片對應(yīng)于索引j,其中 所述第二長期參考圖片對應(yīng)于索引i,其中所述第一值包括delta_poc_msb_cycle_lt_ plusl [ j],其中所述第二值包括delta_poc_msb_cycle_lt_plusl [i],且其中j處于從包含 〇到包含i_l的范圍中。
14. 根據(jù)權(quán)利要求11所述的裝置,其中所述第一值與所述第二值中的至少一者包括負(fù) 整數(shù)值。
15. 根據(jù)權(quán)利要求11所述的裝置,其進(jìn)一步包括用于至少部分基于標(biāo)記為所述當(dāng)前圖 片的短期參考圖片的許多參考圖片來確定所述第一 P0C值與所述第二P0C值中的至少一者 的裝置。
16. -種計(jì)算機(jī)可讀存儲媒體,其上存儲有指令,所述指令在被執(zhí)行時(shí)使處理器: 解碼第一值,所述第一值表示視頻數(shù)據(jù)的當(dāng)前圖片的圖片次序計(jì)數(shù)P0C值的基本最高 有效位MSB值與所述視頻數(shù)據(jù)的第一長期參考圖片的第一 P0C值的第一 MSB值之間的差; 解碼第二值,所述第二值表示所述視頻數(shù)據(jù)的第二長期參考圖片的第二P0C值的第二 MSB值與所述第一 MSB值之間的差,其中所述第一 P0C值與所述第二P0C值具有不同的最低 有效位LSB值;以及 解碼所述視頻數(shù)據(jù)的當(dāng)前圖片中的與使用所述第一值的所述第一長期參考圖片和使 用所述第一值與所述第二值的所述第二長期參考圖片中的至少一者有關(guān)的至少一部分。
17. 根據(jù)權(quán)利要求16所述的計(jì)算機(jī)可讀存儲媒體,其進(jìn)一步包括使得所述處理器執(zhí)行 以下動(dòng)作的指令: 使用所述第一值將所述第一長期參考圖片的第一 MSB循環(huán)值計(jì)算為 DeltaPocMSBCycleLt[i_l];以及 將所述第二長期參考圖片的第二MSB循環(huán)值計(jì)算為DeltaP〇CMSBCyCleLt[i],其 中計(jì)算所述第二MSB循環(huán)值包括基于DeltaPocMSBCycleLt[i_l]與所述第二值來計(jì)算 DeltaPocMSBCycleLt[i]〇
18. 根據(jù)權(quán)利要求16所述的計(jì)算機(jī)可讀存儲媒體,其中所述第一長期參考圖片對應(yīng) 于索引j,其中所述第二長期參考圖片對應(yīng)于索引i,其中所述第一值包括delta_p〇C_msb_ cycle_lt_plusl [j],其中所述第二值包括 delta_poc_msb_cycle_lt_plusl [i],且其中 j 處于從〇到包含i_l的范圍中。
19. 根據(jù)權(quán)利要求16所述的計(jì)算機(jī)可讀存儲媒體,其中所述第一值與所述第二值中的 至少一者包括負(fù)整數(shù)值。
20. 根據(jù)權(quán)利要求16所述的計(jì)算機(jī)可讀存儲媒體,其進(jìn)一步包括使所述處理器執(zhí)行以 下操作的指令:至少部分基于標(biāo)記為所述當(dāng)前圖片的短期參考圖片的許多參考圖片來確定 所述第一 P0C值與所述第二P0C值中的至少一者。
21. -種編碼視頻數(shù)據(jù)的方法,所述方法包括: 編碼視頻數(shù)據(jù)的當(dāng)前圖片中與第一長期參考圖片有關(guān)的至少第一部分和所述當(dāng)前圖 片中與第二長期參考圖片有關(guān)的至少第二部分; 編碼第一值,所述第一值表示所述視頻數(shù)據(jù)的當(dāng)前圖片的圖片次序計(jì)數(shù)P0C值的基本 最高有效位MSB值與所述視頻數(shù)據(jù)的所述第一長期參考圖片的第一 P0C值的第一 MSB值之 間的差;以及 編碼第二值,所述第二值表示所述視頻數(shù)據(jù)的所述第二長期參考圖片的第二P0C值的 第二MSB值與所述第一 MSB值之間的差,其中所述第一 P0C值與所述第二P0C值具有不同 的最低有效位LSB值。
22. 根據(jù)權(quán)利要求21所述的方法,其進(jìn)一步包括: 將所述第一值計(jì)算為所述第一長期參考圖片的作為DeltaP〇CMSBCyCleLt[i-l]的第 一 MSB循環(huán)值與所述基本MSB值之間的差;以及 將所述第二值計(jì)算為所述第二長期參考圖片的作為DeltaPocMSBCycleLt [i]的第二 MSB循環(huán)值與所述第一 MSB值之間的差。
23. 根據(jù)權(quán)利要求21所述的方法,其中所述第一長期參考圖片對應(yīng)于索引j,其中 所述第二長期參考圖片對應(yīng)于索引i,其中所述第一值包括delta_poc_msb_cycle_lt_ plusl [ j],其中所述第二值包括delta_poc_msb_cycle_lt_plusl [i],且其中j處于從包含 〇到包含i_l的范圍中。
24. 根據(jù)權(quán)利要求21所述的方法,其中所述第一值與所述第二值中的至少一者包括負(fù) 整數(shù)值。
25. 根據(jù)權(quán)利要求21所述的方法,其中編碼所述第一值與編碼所述第二值包括至少部 分基于標(biāo)記為所述當(dāng)前圖片的短期參考圖片的許多參考圖片來編碼所述第一值且編碼所 述第二值。
26. -種用于編碼視頻數(shù)據(jù)的裝置,所述裝置包括視頻編碼器,其經(jīng)配置以:編碼視頻 數(shù)據(jù)的當(dāng)前圖片中與第一長期參考圖片有關(guān)的至少第一部分和所述當(dāng)前圖片中與第二長 期參考圖片有關(guān)的至少第二部分;編碼第一值,所述第一值表示所述視頻數(shù)據(jù)的當(dāng)前圖片 的圖片次序計(jì)數(shù)POC值的基本最高有效位MSB值與所述視頻數(shù)據(jù)的所述第一長期參考圖片 的第一 P0C值的第一 MSB值之間的差;以及編碼第二值,所述第二值表示所述視頻數(shù)據(jù)的所 述第二長期參考圖片的第二P0C值的第二MSB值與所述第一 MSB值之間的差,其中所述第 一 P0C值與所述第二P0C值具有不同的最低有效位LSB值。
27. 根據(jù)權(quán)利要求26所述的裝置,其中所述視頻編碼器經(jīng)配置以:將所述第一值 計(jì)算為所述第一長期參考圖片的作為De 1 taPocMSBCyc 1 eLt [ i-1 ]的第一 MSB循環(huán)值 與所述基本MSB值之間的差;以及將所述第二值計(jì)算為所述第二長期參考圖片的作為 DeltaPocMSBCycleLt [i]的第二MSB循環(huán)值與所述第一 MSB值之間的差。
28. 根據(jù)權(quán)利要求26所述的裝置,其中所述第一長期參考圖片對應(yīng)于索引j,其中 所述第二長期參考圖片對應(yīng)于索引i,其中所述第一值包括delta_poc_msb_cycle_lt_ plusl [ j],其中所述第二值包括delta_poc_msb_cycle_lt_plusl [i],且其中j處于從包含 〇到包含i_l的范圍中。
29. 根據(jù)權(quán)利要求26所述的裝置,其中所述第一值與所述第二值中的至少一者包括負(fù) 整數(shù)值。
30. 根據(jù)權(quán)利要求26所述的裝置,其中為了編碼所述第一值與所述第二值,所述視頻 編碼器經(jīng)配置以至少部分基于標(biāo)記為所述當(dāng)前圖片的短期參考圖片的許多參考圖片來編 碼所述第一值與所述第二值。
【文檔編號】H04N19/58GK104412599SQ201380034109
【公開日】2015年3月11日 申請日期:2013年6月24日 優(yōu)先權(quán)日:2012年6月28日
【發(fā)明者】阿達(dá)許·克里許納·瑞瑪蘇布雷蒙尼安, 王益魁, 瑞珍·雷克斯曼·喬許, 陳穎 申請人:高通股份有限公司