用于多層譯碼的多分辨率經(jīng)解碼圖片緩沖器管理的制作方法
【專利說(shuō)明】
[0001] 本申請(qǐng)案要求2013年1月4日申請(qǐng)的第61/749, 105號(hào)美國(guó)臨時(shí)專利申請(qǐng)案的權(quán) 益。
技術(shù)領(lǐng)域
[0002] 本發(fā)明涉及用于視頻譯碼的技術(shù),且更特定來(lái)說(shuō)涉及用于多層視頻譯碼的技術(shù)。
【背景技術(shù)】
[0003] 數(shù)字視頻能力可并入到廣泛范圍的裝置中,包含數(shù)字電視、數(shù)字直播系統(tǒng)、無(wú)線廣 播系統(tǒng)、個(gè)人數(shù)字助理(PDA)、膝上型或桌上型計(jì)算機(jī)、數(shù)碼攝影機(jī)、數(shù)字記錄裝置、數(shù)字媒 體播放器、視頻游戲裝置、視頻游戲控制臺(tái)、蜂窩式或衛(wèi)星無(wú)線電電話、視頻電話會(huì)議裝置 和其類似者。數(shù)字視頻裝置實(shí)施視頻壓縮技術(shù),例如由MPEG-2、MPEG-4、ITU-T H. 263、ITU-T H. 264/MPEG-4第10部分、高級(jí)視頻譯碼(AVC)、目前正在開發(fā)的高效率視頻譯碼(HEVC)標(biāo) 準(zhǔn)和此類標(biāo)準(zhǔn)的擴(kuò)展定義的標(biāo)準(zhǔn)中所描述的技術(shù),以更有效地發(fā)射、接收和存儲(chǔ)數(shù)字視頻 信息。
[0004] 前述標(biāo)準(zhǔn)中的一些的擴(kuò)展(包含H. 264/AVC)提供用于多層視頻譯碼的技術(shù)。多 層視頻譯碼技術(shù)可包含可縮放視頻譯碼技術(shù)、多視圖視頻譯碼技術(shù)和多視圖加上深度視頻 譯碼技術(shù)。為了產(chǎn)生立體或三維("3D")視頻,舉例來(lái)說(shuō),已提出用于AVC的多視圖譯碼 技術(shù)以及可縮放視頻譯碼(SVC)標(biāo)準(zhǔn)(其為H.264/AVC的可縮放擴(kuò)展)和多視圖視頻譯碼 (MVC)標(biāo)準(zhǔn)(其已變成H. 264/AVC的多視圖擴(kuò)展)。
[0005] 通常,使用兩個(gè)視圖(例如,左視圖和右視圖)達(dá)成立體視頻。左視圖的圖片實(shí)質(zhì) 上可與右視圖的圖片同時(shí)顯示以達(dá)成三維視頻效果。舉例來(lái)說(shuō),用戶可佩戴偏光被動(dòng)式眼 鏡,其將左視圖從右視圖濾波掉。替代性地,可快速連續(xù)展示兩個(gè)視圖的圖片,且用戶可佩 戴主動(dòng)式眼鏡,其以相同頻率但具有90度的相位移位快速遮光左眼和右眼。
【發(fā)明內(nèi)容】
[0006] -般來(lái)說(shuō),本發(fā)明描述用于多層視頻譯碼的技術(shù)。具體來(lái)說(shuō),本發(fā)明是關(guān)于用于多 層視頻譯碼的經(jīng)解碼圖片緩沖器OPB)管理。
[0007] 在本發(fā)明的一或多個(gè)實(shí)例中,視頻譯碼器(例如,視頻編碼器或視頻解碼器)可經(jīng) 配置以執(zhí)行以下方法。
[0008] 在本發(fā)明的一個(gè)實(shí)例中,一種譯碼視頻數(shù)據(jù)的方法包括解碼視頻數(shù)據(jù)以產(chǎn)生多個(gè) 經(jīng)解碼層分量、將所述經(jīng)解碼層分量存儲(chǔ)于DPB的一或多個(gè)子單元中,和對(duì)所述一或多個(gè) 子單元執(zhí)行DPB管理過(guò)程,其中針對(duì)所述一或多個(gè)子單元中的每一者單獨(dú)地管理所述DPB 管理過(guò)程。
[0009] 在本發(fā)明的另一實(shí)例中,一種經(jīng)配置以譯碼視頻數(shù)據(jù)的設(shè)備包括視頻譯碼器,其 經(jīng)配置以解碼視頻數(shù)據(jù)以產(chǎn)生多個(gè)經(jīng)解碼層分量、將所述經(jīng)解碼層分量存儲(chǔ)于DPB的一或 多個(gè)子單元中和對(duì)所述一或多個(gè)子單元執(zhí)行DPB管理過(guò)程,其中針對(duì)所述一或多個(gè)子單元 中的每一者單獨(dú)地管理所述DPB管理過(guò)程。
[0010] 在本發(fā)明的另一實(shí)例中,一種經(jīng)配置以譯碼視頻數(shù)據(jù)的設(shè)備包括用于解碼視頻數(shù) 據(jù)以產(chǎn)生多個(gè)經(jīng)解碼層分量的裝置、用于將所述經(jīng)解碼層分量存儲(chǔ)于DPB的一或多個(gè)子單 元中的裝置和用于對(duì)所述一或多個(gè)子單元執(zhí)行DPB管理過(guò)程的裝置,其中針對(duì)所述一或多 個(gè)子單元中的每一者單獨(dú)地管理所述DPB管理過(guò)程。
[0011] 在另一個(gè)實(shí)例中,本發(fā)明描述一種存儲(chǔ)指令的計(jì)算機(jī)可讀存儲(chǔ)媒體,所述指令在 執(zhí)行時(shí)致使經(jīng)配置以譯碼視頻數(shù)據(jù)的裝置的一或多個(gè)處理器進(jìn)行如下操作:解碼視頻數(shù)據(jù) 以產(chǎn)生多個(gè)經(jīng)解碼層分量、將所述經(jīng)解碼層分量存儲(chǔ)于DPB的一或多個(gè)子單元中和對(duì)所述 一或多個(gè)子單元執(zhí)行DPB管理過(guò)程,其中針對(duì)所述一或多個(gè)子單元中的每一者單獨(dú)地管理 所述DPB管理過(guò)程。
[0012] 一或多個(gè)實(shí)例的細(xì)節(jié)闡述于隨附圖式和下文描述中。其它特征、目標(biāo)和優(yōu)勢(shì)將從 描述和圖式并從權(quán)利要求書中顯而易見(jiàn)。
【附圖說(shuō)明】
[0013] 圖1為說(shuō)明可利用本發(fā)明中描述的技術(shù)的實(shí)例視頻編碼和解碼系統(tǒng)的框圖。
[0014] 圖2為說(shuō)明實(shí)例多視圖解碼順序的概念圖。
[0015] 圖3為說(shuō)明用于多視圖譯碼的實(shí)例預(yù)測(cè)結(jié)構(gòu)的概念圖。
[0016] 圖4為說(shuō)明實(shí)例可縮放視頻譯碼層的概念圖。
[0017] 圖5為說(shuō)明可實(shí)施本發(fā)明中描述的技術(shù)的實(shí)例視頻編碼器的框圖。
[0018] 圖6為說(shuō)明可實(shí)施本發(fā)明中描述的技術(shù)的實(shí)例視頻解碼器的框圖。
[0019] 圖7為展示根據(jù)本發(fā)明的第一實(shí)例的實(shí)例DPB的概念圖。
[0020] 圖8為展示根據(jù)本發(fā)明的第二實(shí)例的實(shí)例DPB的概念圖。
[0021] 圖9為展示根據(jù)本發(fā)明的第三實(shí)例的實(shí)例DPB的概念圖。
[0022] 圖10為展示根據(jù)本發(fā)明的第四實(shí)例的實(shí)例DPB的概念圖。
[0023] 圖11為展示根據(jù)本發(fā)明的技術(shù)的實(shí)例方法的流程圖。
【具體實(shí)施方式】
[0024] 一般來(lái)說(shuō),本發(fā)明描述用于管理多層視頻譯碼中的經(jīng)解碼圖片的技術(shù),其中不同 層可具有不同空間分辨率。在本發(fā)明的上下文中,層可為可縮放視頻譯碼過(guò)程(例如, H. 264/SVC或新出現(xiàn)的高效率視頻譯碼(HEVC)標(biāo)準(zhǔn)的可縮放擴(kuò)展)中的層、多視圖或3D視 頻譯碼中的紋理視圖或3D視頻譯碼中的深度視圖。作為另一實(shí)例,層可對(duì)應(yīng)于包含紋理視 圖分量和深度視圖分量?jī)烧叩膯我灰晥D。因此,術(shù)語(yǔ)"層"可在本發(fā)明中總體上用于在SVC 意義上指層或在MVC意義上指視圖。本發(fā)明的技術(shù)可適用于任何此類視頻譯碼情境,包含 HEVC和H. 264/AVC的多視圖擴(kuò)展、3D視頻擴(kuò)展和可縮放擴(kuò)展。
[0025] 下文所描述的技術(shù)可應(yīng)用于基于高級(jí)編解碼器的可縮放、多視圖和3D視頻譯碼, 包含譯碼具有深度圖的圖片的兩個(gè)或兩個(gè)以上視圖。視頻譯碼標(biāo)準(zhǔn)包含ITU-T H. 261、 ISO/IEC MPEG-1 Visual、ITU-T H.262 或 ISO/IEC MPEG-2 Visual、ITU-T H.263、ISO/IEC MPEG-4 Visual和ITU-T H. 264 (也被稱為ISO/IEC MPEG-4 AVC),包含其可縮放視頻譯碼 (SVC)和多視圖視頻譯碼(MVC)擴(kuò)展。另外,當(dāng)前正由ITU-T視頻譯碼專家組(VCEG)和ISO/ IEC動(dòng)畫專家組(MPEG)的視頻譯碼聯(lián)合合作小組(JCT-VC)開發(fā)新視頻譯碼標(biāo)準(zhǔn)(即,高效 率視頻譯碼OlEVC))。HEVC的新近WD描述于JCTVC-K1003"高效率視頻譯碼(HEVC)文本規(guī) 范草案9"中(第11次會(huì)議:中國(guó)上海,2012年10月10日到19日),且到2012年12月17 曰為止可在http://Dhenix.int-evry.fr/ict/doc end user/documents/11 Shanghai/ wgll/TCTVC-K1003-V12. zip處下裁所述草案,其全部?jī)?nèi)容以引用的方式并入本文中。
[0026] HEVC的更為新近草案描述于ITU-T H. 265,系列H中:視聽和多媒體系 統(tǒng)(AUDIOVISUAL AND MULTIMEDIA SYSTEMS),移動(dòng)視頻視聽服務(wù)譯碼基礎(chǔ)結(jié)構(gòu) (Infrastructure of Audiovisual Services-Coding of Moving Video),"高效率視頻譯 碼",2013年4月(下文中稱為"HEVC")。HEVC以全文引用的方式并入本文中。已提出對(duì) HEVC的各種擴(kuò)展。一個(gè)此類擴(kuò)展為描述于"高效率視頻譯碼(HEVC)范圍擴(kuò)展文本規(guī)范: 草案 4"(JCTVC-N1005_vl,2013 年 4 月(下文中稱為"JCTVC-N1005"))中的 HEVC 范圍擴(kuò) 展。標(biāo)題為"高效率視頻譯碼(HEVC)可縮放擴(kuò)展草案3"的可縮放HEVC (SHEVC)的新近工 作草案(WD) (ITU-T SG 16 WP 3和IS0/IEC JTC 1/SC 29/WG 11的視頻譯碼聯(lián)合合作小組 (JCT-VC),第14次會(huì)議:奧地利維也納,2013年7月25日到8月2日,且在下文中被稱為 SHEVC WD3)可得自 http://phenix. it-sudparis. eu/jct/doc_end_user/documents/14_ Vienna/wgll/JCTVC-N1008-v3. zip,其以全文引用的方式并入本文中。
[0027] 用于經(jīng)解碼圖片緩沖器(DPB)管理的當(dāng)前解決方案僅涉及存儲(chǔ)具有相同分辨率 的不同層的情況。即,用于DPB管理的當(dāng)前技術(shù)假定每一層包含相同數(shù)目個(gè)像素(即,分辨 率),從而當(dāng)層具有不同數(shù)目個(gè)像素時(shí)帶來(lái)低效率。鑒于此缺點(diǎn),本發(fā)明描述用于當(dāng)需要存 儲(chǔ)具有不同分辨率的多個(gè)經(jīng)解碼層分量時(shí)的DPB管理的各種方法和技術(shù)。
[0028] 圖1為說(shuō)明可利用本發(fā)明中描述的用于多層視頻譯碼中的經(jīng)解碼圖片緩沖器管 理的技術(shù)的實(shí)例視頻編碼和解碼系統(tǒng)10的框圖。如圖1中所展示,系統(tǒng)10包含源裝置12, 其產(chǎn)生稍后由目的地裝置14解碼的經(jīng)編碼視頻數(shù)據(jù)。源裝置12和目的地裝置14可包括 廣泛范圍裝置中的任一者,包含桌上型計(jì)算機(jī)、筆記型(即,膝上型)計(jì)算機(jī)、平板計(jì)算機(jī)、 機(jī)頂盒、電話手持機(jī)(例如,所謂的"智能"電話)、所謂的"智能"平板計(jì)算機(jī)、電視機(jī)、攝 像機(jī)、顯示裝置、數(shù)字媒體播放器、視頻游戲控制臺(tái)、視頻串流裝置或其類似者。在一些情況 下,源裝置12和目的地裝置14可經(jīng)裝備以用于無(wú)線通信。
[0029] 目的地裝置14可經(jīng)由鏈路16接收待解碼的經(jīng)編碼視頻數(shù)據(jù)。鏈路16可包括能 夠?qū)⒔?jīng)編碼視頻數(shù)據(jù)從源裝置12移動(dòng)到目的地裝置14的任何類型媒體或裝置。在一個(gè)實(shí) 例中,鏈路16可包括使得源裝置12能夠?qū)崟r(shí)地將經(jīng)編碼視頻數(shù)據(jù)直接發(fā)射到目的地裝置 14的通信媒體。經(jīng)編碼視頻數(shù)據(jù)可根據(jù)通信標(biāo)準(zhǔn)(例如,無(wú)線通信協(xié)議)加以調(diào)制,并發(fā)射 到目的地裝置14。通信媒體可包括任何無(wú)線或有線通信媒體,例如射頻(RF)頻譜或一或 多個(gè)物理發(fā)射線。通信媒體可形成分組網(wǎng)絡(luò)(例如,局域網(wǎng)、廣域網(wǎng)或全球網(wǎng)絡(luò),例如因特 網(wǎng))的部分。通信媒體可包含路由器、交換器、基站或任何其它可用于促進(jìn)從源裝置12到 目的地裝置14的通信的設(shè)備。
[0030] 替代性地,可將經(jīng)編碼數(shù)據(jù)從輸出接口 22輸出到存儲(chǔ)裝置34。類似地,可由輸入 接口從存儲(chǔ)裝置34存取經(jīng)編碼數(shù)據(jù)。存儲(chǔ)裝置34可包含多種分布式或本地存取的數(shù)據(jù)存 儲(chǔ)媒體中的任一者,例如硬盤驅(qū)動(dòng)器、藍(lán)光光盤、DVD、CD-ROM、快閃存儲(chǔ)器、易失性或非易失 性存儲(chǔ)器或用于存儲(chǔ)經(jīng)編碼視頻數(shù)據(jù)的任何其它合適數(shù)字存儲(chǔ)媒體。在另一實(shí)例中,存儲(chǔ) 裝置34可對(duì)應(yīng)于文件服務(wù)器或可保存由源裝置12產(chǎn)生的經(jīng)編碼視頻的另一中間存儲(chǔ)裝 置。目的地裝置14可經(jīng)由串流或下載從存儲(chǔ)裝置34存取所存儲(chǔ)視頻數(shù)據(jù)。文件服務(wù)器 可為能夠存儲(chǔ)經(jīng)編碼視頻數(shù)據(jù)并將經(jīng)編碼視頻數(shù)據(jù)發(fā)射到目的地裝置14的任何類型服務(wù) 器。實(shí)例文件服務(wù)器包含網(wǎng)絡(luò)服務(wù)器(例如,用于網(wǎng)站)、FTP服務(wù)器、網(wǎng)絡(luò)附接存儲(chǔ)(NAS) 裝置或本地磁盤驅(qū)動(dòng)器。目的地裝置14可經(jīng)由任何標(biāo)準(zhǔn)數(shù)據(jù)連接(包含因特網(wǎng)連接)來(lái) 存取經(jīng)編碼視頻數(shù)據(jù)。此連接可包含適于存取存儲(chǔ)于文件服務(wù)器上的經(jīng)編碼視頻數(shù)據(jù)的無(wú) 線信道(例如,Wi-Fi連接)、有線連接(例如,DSL、電纜調(diào)制解調(diào)器等)或兩者的組合。經(jīng) 編碼視頻數(shù)據(jù)從存儲(chǔ)裝置34的發(fā)射可為串流發(fā)射、下載發(fā)射或兩者的組合。
[0031] 用于多層視頻解碼中的經(jīng)解碼圖片緩沖器管理的本發(fā)明技術(shù)未必限于無(wú)線應(yīng)用 或設(shè)定。所述技術(shù)可應(yīng)用于視頻譯碼以支持多種多媒體應(yīng)用中的任一者,例如空中電視廣 播、有線電視發(fā)射、衛(wèi)星電視發(fā)射、串流視頻發(fā)射(例如,經(jīng)由因特網(wǎng))、編碼數(shù)字視頻以存 儲(chǔ)于數(shù)據(jù)存儲(chǔ)媒體上、解碼存儲(chǔ)于數(shù)據(jù)存儲(chǔ)媒體上的數(shù)字視頻,或其它應(yīng)用。在一些實(shí)例 中,系統(tǒng)10可經(jīng)配置以支持單向或雙向視頻發(fā)射,以支持例如視頻串流、視頻重放、視頻廣 播和/或視頻電話的應(yīng)用。
[0032] 在圖1的實(shí)例中,源裝置12包含視頻源18、視頻編碼器20和輸出接口 22。在一 些狀況下,輸出接口 22可包含調(diào)制器/解調(diào)器(調(diào)制解調(diào)器)和/或發(fā)射器。在源裝置12 中,視頻源18可包含例如視頻俘獲裝置(例如,攝像機(jī))、含有先前俘獲視頻的視頻存檔、用 以從視頻內(nèi)容提供者接收視頻的視頻饋入接口和/或用于產(chǎn)生計(jì)算機(jī)圖形數(shù)據(jù)作為源視 頻的計(jì)算機(jī)圖形系統(tǒng)或此類源的組合的源。作為一個(gè)實(shí)例,如果視頻源18是攝像機(jī),那么 源裝置12和目的地裝置14可形成所謂的攝像機(jī)電話或視頻電話。然而,本發(fā)明中描述的 技術(shù)一般可適用于視頻譯碼,且可應(yīng)用于無(wú)線和/或有線應(yīng)用。
[0033] 可由視頻編碼器20編碼所俘獲視頻、預(yù)俘獲視頻或計(jì)算機(jī)產(chǎn)生的視頻??山?jīng)由源 裝置12的輸出接口 22將經(jīng)編碼視頻數(shù)據(jù)直接發(fā)射到目的地裝置14。還可(或替代性地) 將經(jīng)編碼視頻數(shù)據(jù)存儲(chǔ)到存儲(chǔ)裝置34上以供稍后由目的地裝置14或其它裝置存取以用于 解碼和/或重放。
[0034] 目的地裝置14包含輸入接口 28、視頻解碼器30和顯示裝置32。在一些狀況下, 輸入接口 28可包含接收器和/或調(diào)制解調(diào)器。目的地裝置14的輸入接口 28經(jīng)由鏈路16 接收經(jīng)編碼視頻數(shù)據(jù)。經(jīng)由鏈路16傳達(dá)或在存儲(chǔ)裝置34上提供的經(jīng)編碼視頻數(shù)據(jù)可包含 由視頻編碼器20所產(chǎn)生的多種語(yǔ)法元素以供由例如視頻解碼器30的視頻解碼器用于解碼 視頻數(shù)據(jù)。此類語(yǔ)法元素可與在通信媒體上發(fā)射、存儲(chǔ)于存儲(chǔ)媒體上或存儲(chǔ)文件服務(wù)器的 經(jīng)編碼視頻數(shù)據(jù)包含在一起。
[0035] 顯示裝置32可與目的地裝置14 一起集成或在目的地裝置外部。在一些實(shí)例中, 目的地裝置14可包含集成式顯示裝置,且還經(jīng)配置以與外部顯示裝置介接。在其它實(shí)例 中,目的地裝置14可為顯示裝置。一般來(lái)說(shuō),顯示裝置32將經(jīng)解碼視頻數(shù)據(jù)顯示給用戶, 且可包括多種顯示裝置中的任一者,例如液晶顯示器(LCD)、等離子顯示器、有機(jī)發(fā)光二極 管(OLED)顯示器或另一類型的顯示裝置。
[0036] 視頻編碼器20和視頻解碼器30可根據(jù)視頻壓縮標(biāo)準(zhǔn)(例如,目前正在開發(fā)的高 效率視頻譯碼(HEVC)標(biāo)準(zhǔn))來(lái)操作,且可符合HEVC測(cè)試模型(HM)。具體來(lái)說(shuō),在一些實(shí)例 中,視頻編碼器20和視頻解碼器可根據(jù)支持多視圖或多視圖加上深度視頻譯碼的HEVC擴(kuò) 展來(lái)操作。在其它實(shí)例中,視頻編碼器20和視頻解碼器30可根據(jù)其它專有或行業(yè)標(biāo)準(zhǔn)來(lái) 操作,例如ITU-T H. 264標(biāo)準(zhǔn)(替代性地被稱為MPEG-4第10部分)、高級(jí)視頻譯碼(AVC), 或此類標(biāo)準(zhǔn)的擴(kuò)展(包含H.264/SVC)。然而,本發(fā)明的技術(shù)不限于任何特定譯碼標(biāo)準(zhǔn)。視 頻壓縮標(biāo)準(zhǔn)的其它實(shí)例包含MPEG-2和ITU-T H. 263。具體來(lái)說(shuō),根據(jù)本發(fā)明的技術(shù),視頻 編碼器20和視頻解碼器30可根據(jù)能夠3DV和/或多視圖編碼(例如,3D-HEVC、H. 264/MVC 等)的視頻譯碼標(biāo)準(zhǔn)來(lái)操作。
[0037] 盡管圖1中未展示,但在一些方面中,視頻編碼器20和視頻解碼器30可各自與音 頻編碼器和解碼器一起集成,且可包含適當(dāng)多路復(fù)用器-多路分用器(MUX-DEMUX)單元或 其它硬件和軟件,以處理對(duì)共同數(shù)據(jù)流或單獨(dú)數(shù)據(jù)流中的音頻與視頻兩者的編碼。在一些 實(shí)例中,如果適用,那么多路復(fù)用器-多路分用器單元可符合ITU H. 223多路復(fù)用器協(xié)議, 或例如用戶數(shù)據(jù)報(bào)協(xié)議(UDP)的其它協(xié)議。
[0038] 視頻編碼器20和視頻解碼器30各自可經(jīng)實(shí)施為例如一或多個(gè)微處理器、數(shù)字信 號(hào)處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、離散邏輯、軟件、硬件、 固件或其任何組合的多種合適編碼器電路中的任一者。當(dāng)部分以軟件實(shí)施所述技術(shù)時(shí),裝 置可將用于軟件的指令存儲(chǔ)于合適非暫時(shí)性計(jì)算機(jī)可讀媒體中并使用一或多個(gè)處理器以 硬件執(zhí)行所述指令來(lái)執(zhí)行本發(fā)明的技術(shù)。視頻編碼器20和視頻解碼器30中的每一者可包 含在一或多個(gè)編碼器或解碼器中,所述編碼器或解碼器中的任一者可集成為相應(yīng)裝置中的 組合編碼器/解碼器(編解碼器)的部分。
[0039] 本發(fā)明的以下章節(jié)將提供HEVC標(biāo)準(zhǔn)的背景。HEVC標(biāo)準(zhǔn)化努力是基于被稱作HEVC 測(cè)試模型(HM)的視頻譯碼裝置的演進(jìn)模型。HM根據(jù)(例如)ITU-T H.264/AVC假設(shè)視頻譯 碼裝置相對(duì)于現(xiàn)存裝置的若干額外能力。舉例來(lái)說(shuō),雖然H. 264提供九種幀內(nèi)預(yù)測(cè)編碼模 式,但HM可提供多達(dá)三十三種幀內(nèi)預(yù)測(cè)編碼模式。
[0040] 一般來(lái)說(shuō),HM的工作模型描述視頻幀或圖片可劃分成包含明度和色度樣本兩者的 一序列樹塊或最大譯碼單元(LCU)。樹塊具有與H. 264標(biāo)準(zhǔn)的宏塊類似的目的。切片包含 按譯碼順序的多個(gè)連續(xù)樹塊。視頻幀或圖片可分割成一或多個(gè)切片。每一樹塊可根據(jù)四叉 樹而分裂成譯碼單元(CU)。舉例來(lái)說(shuō),作為四叉樹的根節(jié)點(diǎn)的樹塊可分裂成四個(gè)子節(jié)點(diǎn),且 每一子節(jié)點(diǎn)又可為父節(jié)點(diǎn)并分裂成另外四個(gè)子節(jié)點(diǎn)。最后未經(jīng)分裂子節(jié)點(diǎn)(作為四叉樹的 葉節(jié)點(diǎn))包括譯碼節(jié)點(diǎn)(即,經(jīng)譯碼視頻塊)。與經(jīng)譯碼位流相關(guān)聯(lián)的語(yǔ)法數(shù)據(jù)可定義樹塊 可分裂的最大次數(shù),且還可定義譯碼節(jié)點(diǎn)的最小大小。
[0041] CU包含譯碼節(jié)點(diǎn)和與所述譯碼節(jié)點(diǎn)相關(guān)聯(lián)的預(yù)測(cè)單元(PU)和變換單元(TU)。CU 的大小總體上對(duì)應(yīng)于譯碼節(jié)點(diǎn)的大小,且通常必須為正方形形狀。⑶的大小可介于8X8像 素至多具有最大64X64像素或更大的樹塊大小的范圍內(nèi)。每一 CU可含有一或多個(gè)PU和一 或多個(gè)TU。舉例來(lái)說(shuō),與CU相關(guān)聯(lián)的語(yǔ)法數(shù)據(jù)可描述將CU分割成一或多個(gè)PU。分割模式 可在CU被跳過(guò)或經(jīng)直接模式編碼、幀內(nèi)預(yù)測(cè)模式編碼或幀間預(yù)測(cè)模式編碼之間有所不同。 PU可分割成非正方形形狀。舉例來(lái)說(shuō),與CU相關(guān)聯(lián)的語(yǔ)法數(shù)據(jù)還可描述根據(jù)四叉樹將CU 分割成一或多個(gè)TU。TU可為正方形或非正方形形狀。
[0042] HEVC標(biāo)準(zhǔn)允許根據(jù)TU進(jìn)行變換,TU可針對(duì)不同⑶而有所不同。TU的大小通常是 基于針對(duì)經(jīng)分割LCU定義的給定CU內(nèi)的PU的大小而設(shè)定,但狀況可并不總是如此。TU通 常與PU大小相同或小于PU。在一些實(shí)例中,可使用被稱為"殘余四叉樹"(RQT)的四叉樹 結(jié)構(gòu)將對(duì)應(yīng)于CU的殘余樣本再分成較小單元。RQT的葉節(jié)點(diǎn)可被稱為變換單元(TU)???變換與TU相關(guān)聯(lián)的像素差值以產(chǎn)生可經(jīng)量化的變換系數(shù)。
[0043] -般來(lái)說(shuō),PU包含與預(yù)測(cè)過(guò)程有關(guān)的數(shù)據(jù)。舉例來(lái)說(shuō),當(dāng)PU經(jīng)幀內(nèi)模式編碼時(shí), PU可包含描述PU的幀內(nèi)預(yù)測(cè)模式的數(shù)據(jù)。作為另一實(shí)例,當(dāng)PU經(jīng)幀間模式編碼時(shí),PU可 包含定義PU的運(yùn)動(dòng)向量的數(shù)據(jù)。定義PU的運(yùn)動(dòng)向量的數(shù)據(jù)可描述(例如)運(yùn)動(dòng)向量的水 平分量、運(yùn)動(dòng)向量的垂直分量、運(yùn)動(dòng)向量的分辨率(例如,四分之一像素精度或八分之一像 素精度)、運(yùn)動(dòng)向量指向的參考圖片和/或可由預(yù)測(cè)方向指示的運(yùn)動(dòng)向量的參考圖片列表 (例如,列表0、列表1或列表C)。
[0044] -般來(lái)說(shuō),TU用于變換和量化過(guò)程。具有一或多個(gè)PU的給定⑶還可包含一或多 個(gè)變換單元(TU)。在預(yù)測(cè)后,視頻編碼器20可根據(jù)PU從由譯碼節(jié)點(diǎn)所識(shí)別的視頻塊計(jì)算 殘余值。接著更新譯碼節(jié)點(diǎn)以參考?xì)堄嘀?