用于視頻譯碼的層間紋理預(yù)測(cè)的制作方法
【專利摘要】本發(fā)明揭示一種根據(jù)某些方面用于對(duì)視頻信息進(jìn)行譯碼的設(shè)備??蓪?duì)包含基層及增強(qiáng)層的多層視頻流進(jìn)行譯碼。針對(duì)所述基層及所述增強(qiáng)層產(chǎn)生的預(yù)測(cè)子可組合以形成所述增強(qiáng)層的最終預(yù)測(cè)子??蓪?duì)每一預(yù)測(cè)子進(jìn)行加權(quán)以使得可在所述最終預(yù)測(cè)子中將更有可能產(chǎn)生高質(zhì)量結(jié)果的那些預(yù)測(cè)子作為更重要的因素進(jìn)行考慮??蓮乃鲱A(yù)測(cè)子或其特性隱含地導(dǎo)出確定增強(qiáng)層預(yù)測(cè)子及基層預(yù)測(cè)子的相應(yīng)權(quán)重的條件。或者,可產(chǎn)生對(duì)指示所述權(quán)重或提供可確定所述權(quán)重的信息進(jìn)行解釋的數(shù)據(jù)。
【專利說明】用于視頻譯碼的層間紋理預(yù)測(cè)
[0001]相關(guān)申請(qǐng)案的交叉參考
[0002]本申請(qǐng)案主張2012年3月22日申請(qǐng)的第61/614,450號(hào)美國臨時(shí)申請(qǐng)案、2012年9月28日申請(qǐng)的第61/707,620號(hào)美國臨時(shí)申請(qǐng)案及2013年3月15日申請(qǐng)的第13/838,270號(hào)美國專利申請(qǐng)案的優(yōu)先權(quán),所述申請(qǐng)案的全部內(nèi)容以引用的方式并入本文中且其全部揭示內(nèi)容形成為本說明書的一部分。
【技術(shù)領(lǐng)域】
[0003]本發(fā)明通常涉及視頻譯碼及壓縮的領(lǐng)域,且更明確地說,涉及可縮放視頻譯碼(SVC)及用于層間紋理預(yù)測(cè)的技術(shù)。
【背景技術(shù)】
[0004]數(shù)字視頻能力可以并入到多種多樣的裝置中,包含數(shù)字電視、數(shù)字直播系統(tǒng)、無線廣播系統(tǒng)、個(gè)人數(shù)字助理(PDA)、膝上型或桌上型計(jì)算機(jī)、平板計(jì)算機(jī)、電子圖書閱讀器、數(shù)碼相機(jī)、數(shù)字記錄裝置、數(shù)字媒體播放器、視頻游戲裝置、視頻游戲控制臺(tái)、蜂窩式或衛(wèi)星無線電電話(所謂的“智能電話”)、視頻電話會(huì)議裝置、視頻串流裝置及其類似物。數(shù)字視頻裝置實(shí)施視頻壓縮技術(shù),例如,由MPEG-2、MPEG-4、ITU-T H.263或ITU-T H.264/MPEG-4第10部分高級(jí)視頻譯碼(AVC)所定義的標(biāo)準(zhǔn)、目前正在開發(fā)的高效率視頻譯碼(HEVC)標(biāo)準(zhǔn)及這些標(biāo)準(zhǔn)的擴(kuò)展中所描述的視頻壓縮技術(shù)。視頻裝置通過實(shí)施這些視頻壓縮技術(shù)可以更有效地發(fā)射、接收、編碼、解碼和/或存儲(chǔ)數(shù)字視頻信息。
[0005]視頻壓縮技術(shù)執(zhí)行空間(圖片內(nèi))預(yù)測(cè)和/或時(shí)間(圖片間)預(yù)測(cè)來減少或移除視頻序列中固有的冗余。對(duì)于基于塊的視頻譯碼來說,視頻切片(即,視頻幀或視頻幀的一部分)可以分割成視頻塊,視頻塊也可被稱作樹塊、譯碼單元(CU)和/或譯碼節(jié)點(diǎn)。圖片的經(jīng)幀內(nèi)譯碼(I)切片中的視頻塊是使用相對(duì)于同一圖片中的相鄰塊中的參考樣本的空間預(yù)測(cè)來編碼。圖片的經(jīng)幀間譯碼(P或B)切片中的視頻塊可使用相對(duì)于同一圖片中的相鄰塊中的參考樣本的空間預(yù)測(cè)或相對(duì)于其它參考圖片中的參考樣本的時(shí)間預(yù)測(cè)。圖片可被稱為幀,且參考圖片可被稱為參考幀。
[0006]空間或時(shí)間預(yù)測(cè)產(chǎn)生用于待譯碼塊的預(yù)測(cè)塊。殘余數(shù)據(jù)表示待譯碼原始?jí)K與預(yù)測(cè)性塊之間的像素差。經(jīng)幀間譯碼塊是根據(jù)指向形成預(yù)測(cè)性塊的參考樣本塊的運(yùn)動(dòng)向量及指示經(jīng)譯碼塊與預(yù)測(cè)性塊之間的差的殘余數(shù)據(jù)編碼的。經(jīng)幀內(nèi)譯碼塊是根據(jù)幀內(nèi)譯碼模式及殘余數(shù)據(jù)編碼的。為了進(jìn)一步壓縮,可以將殘余數(shù)據(jù)從像素域變換到變換域,從而產(chǎn)生殘余變換系數(shù),接著可以對(duì)殘余變換系數(shù)進(jìn)行量化??梢話呙杵鸪跤枚S陣列布置的經(jīng)量化變換系數(shù),以便產(chǎn)生變換系數(shù)的一維向量,并且可以應(yīng)用熵譯碼以實(shí)現(xiàn)更多的壓縮。
【發(fā)明內(nèi)容】
[0007]本發(fā)明的系統(tǒng)、方法及裝置各自具有若干創(chuàng)新方面,其中沒有單個(gè)方面單獨(dú)負(fù)責(zé)本文所揭示的合乎需要的屬性。
[0008]本發(fā)明的一個(gè)方面提供一種用于對(duì)視頻信息進(jìn)行譯碼的設(shè)備。所述設(shè)備包含經(jīng)配置以存儲(chǔ)與基層及對(duì)應(yīng)增強(qiáng)層相關(guān)聯(lián)的視頻信息的存儲(chǔ)器。所述設(shè)備進(jìn)一步包含與所述存儲(chǔ)器通信的處理器。所述處理器經(jīng)配置以至少部分基于所述視頻信息確定與所述基層中的視頻單元相關(guān)聯(lián)的第一權(quán)重及與所述增強(qiáng)層中的視頻單元相關(guān)聯(lián)的第二權(quán)重。所述處理器經(jīng)進(jìn)一步配置以至少部分基于所述第一及第二權(quán)重對(duì)所述增強(qiáng)層中的所述視頻單元進(jìn)行譯碼。
[0009]本發(fā)明的另一方面提供一種用于對(duì)視頻信息進(jìn)行譯碼的方法。所述方法包含獲得與基層及對(duì)應(yīng)增強(qiáng)層相關(guān)聯(lián)的視頻信息。所述方法還包含至少部分基于所述視頻信息確定與所述基層中的視頻單元相關(guān)聯(lián)的第一權(quán)重及與所述增強(qiáng)層中的視頻單元相關(guān)聯(lián)的第二權(quán)重。所述方法進(jìn)一步包含至少部分基于所述第一及第二權(quán)重對(duì)所述增強(qiáng)層中的所述視頻單元進(jìn)行譯碼。
[0010]本發(fā)明的又一方面提供一種包含可由設(shè)備的處理器執(zhí)行的指令的計(jì)算機(jī)可讀媒體。所述指令可致使所述設(shè)備獲得與基層及對(duì)應(yīng)增強(qiáng)層相關(guān)聯(lián)的視頻信息。所述指令還可致使所述設(shè)備至少部分基于所述視頻信息確定與所述基層中的視頻單元相關(guān)聯(lián)的第一權(quán)重及與所述增強(qiáng)層中的視頻單元相關(guān)聯(lián)的第二權(quán)重。所述指令可進(jìn)一步致使所述設(shè)備至少部分基于所述第一及第二權(quán)重對(duì)所述增強(qiáng)層中的所述視頻單元進(jìn)行譯碼。
[0011]本發(fā)明的另一方面提供一種用于對(duì)視頻信息進(jìn)行譯碼的設(shè)備。所述設(shè)備包含用于獲得與基層及對(duì)應(yīng)增強(qiáng)層相關(guān)聯(lián)的視頻信息的裝置。所述設(shè)備還包含用于至少部分基于所述視頻信息確定與所述基層中的視頻單元相關(guān)聯(lián)的第一權(quán)重及與所述增強(qiáng)層中的視頻單元相關(guān)聯(lián)的第二權(quán)重的裝置。所述設(shè)備進(jìn)一步包含用于至少部分基于所述第一及第二權(quán)重對(duì)所述增強(qiáng)層中的所述視頻單元進(jìn)行譯碼的裝置。
【專利附圖】
【附圖說明】
[0012]圖1為可利用根據(jù)本發(fā)明中描述的方面的技術(shù)的說明性視頻編碼及解碼系統(tǒng)的框圖。
[0013]圖2為用于實(shí)施本發(fā)明中描述的譯碼技術(shù)的說明性過程的流程圖。
[0014]圖3為說明可實(shí)施本發(fā)明中描述的譯碼技術(shù)的實(shí)例視頻編碼器的框圖。
[0015]圖4為說明可實(shí)施本發(fā)明中描述的譯碼技術(shù)的實(shí)例視頻解碼器的框圖。
[0016]圖5為說明性幀內(nèi)預(yù)測(cè)模式的圖。
[0017]圖6為預(yù)測(cè)過程的說明性表示。
[0018]圖7為待譯碼的說明性當(dāng)前增強(qiáng)塊的圖,其中當(dāng)前增強(qiáng)塊的某些像素被識(shí)別為相對(duì)靠近于相鄰塊的邊界。
[0019]圖8A及SB為待譯碼的說明性當(dāng)前增強(qiáng)塊的圖,其中當(dāng)前增強(qiáng)塊的某些像素被識(shí)別為相對(duì)靠近于基于預(yù)測(cè)方向的相鄰塊的邊界。
[0020]圖9為待譯碼的說明性當(dāng)前增強(qiáng)塊的圖,其中加權(quán)參數(shù)基于預(yù)測(cè)方向而變化。
[0021]圖10為用于使用加權(quán)的基層預(yù)測(cè)子及增強(qiáng)層預(yù)測(cè)子對(duì)視頻進(jìn)行譯碼的說明性方法的流程圖。
[0022]圖11為用于基于像素位置加權(quán)及組合基層預(yù)測(cè)子及增強(qiáng)層預(yù)測(cè)子的說明性方法的流程圖。
[0023]圖12為用于基于基層及增強(qiáng)層的特定特性加權(quán)及組合基層預(yù)測(cè)子及增強(qiáng)層預(yù)測(cè)子的說明性方法的流程圖。
【具體實(shí)施方式】
[0024]按通常描述,本發(fā)明涉及可縮放視頻譯碼。本發(fā)明的方面將關(guān)于用以產(chǎn)生增強(qiáng)層的最終預(yù)測(cè)子的加權(quán)的基層預(yù)測(cè)子與增強(qiáng)層預(yù)測(cè)子的組合使用進(jìn)行描述。在一些實(shí)例中,對(duì)于整個(gè)切片譯碼塊或位流,權(quán)重可為常量。在額外實(shí)例中,用于特定像素、切片、譯碼塊等的權(quán)重可變化。在確定變化的權(quán)重時(shí)可考慮的因數(shù)除了別的之外還包含像素到經(jīng)先前譯碼或經(jīng)解碼塊的接近性及幀內(nèi)預(yù)測(cè)方向。其它因數(shù)包含量化參數(shù)及空間縮放比。
[0025]在其它實(shí)例中,確定用于增強(qiáng)層預(yù)測(cè)子及基層預(yù)測(cè)子的相應(yīng)權(quán)重的條件可從預(yù)測(cè)子或從其特性隱含地導(dǎo)出。因此,不需要將額外數(shù)據(jù)發(fā)射到解碼器;而是,解碼器可動(dòng)態(tài)地導(dǎo)出加權(quán)。在又其它實(shí)例中,位流中可包含解碼器可用以確定加權(quán)的數(shù)據(jù)。
[0026]隨附圖式及以下描述中陳述一或多個(gè)實(shí)例的細(xì)節(jié)。其它特征、目標(biāo)及優(yōu)點(diǎn)將從所述描述及圖式以及權(quán)利要求書而顯而易見。
[0027]例如視頻圖像、TV圖像、靜態(tài)圖像或由視頻記錄器或計(jì)算機(jī)產(chǎn)生的圖像等數(shù)字圖像由布置成水平及垂直線的像素構(gòu)成。單個(gè)圖像中的像素的數(shù)目對(duì)于較小圖像來說通常為數(shù)萬個(gè),且對(duì)于高清晰度圖像來說通常為數(shù)百萬個(gè)。每一像素通常含有亮度及色度信息。在無壓縮的情況下,從圖像編碼器傳達(dá)到圖像解碼器的信息數(shù)量太大以致于其可使實(shí)時(shí)發(fā)射不切實(shí)際。為了減少待發(fā)射的信息量,已開發(fā)了例如JPEG、MPEG及H.263標(biāo)準(zhǔn)等數(shù)個(gè)不同壓縮方法。
[0028]在典型視頻編碼器中,原始視頻序列的幀可分割成矩形區(qū)或塊,所述矩形區(qū)或塊是在幀內(nèi)模式(I模式)或幀間模式(P模式)中經(jīng)編碼的。可使用例如DCT譯碼等某一種類的變換譯碼對(duì)塊進(jìn)行譯碼。然而,純基于變換的譯碼僅減少特定塊內(nèi)的像素間相關(guān),而不考慮像素的塊間相關(guān),且通常仍產(chǎn)生高位率以用于發(fā)射。當(dāng)前數(shù)字圖像譯碼標(biāo)準(zhǔn)也采用減少塊之間的像素值的相關(guān)的某些方法。
[0029]總的來說,從經(jīng)先前譯碼的幀及發(fā)射的幀中的一者中預(yù)測(cè)在P模式中編碼的塊。塊的預(yù)測(cè)信息由二維(2D)運(yùn)動(dòng)向量表示。對(duì)于在I模式中編碼的塊,經(jīng)預(yù)測(cè)的塊可使用從相同幀內(nèi)的已經(jīng)編碼的相鄰塊的空間預(yù)測(cè)而形成。預(yù)測(cè)誤差(即,正被編碼的塊與經(jīng)預(yù)測(cè)的塊之間的差別)表示為某一離散變換的一組加權(quán)基底函數(shù)。通常在8x8或4x4塊的基礎(chǔ)上執(zhí)行變換。隨后量化權(quán)重(例如,變換系數(shù))。量化引入信息的損耗,且因此經(jīng)量化系數(shù)可具有比原始精度低的精度。
[0030]經(jīng)量化變換系數(shù)與運(yùn)動(dòng)向量及某一控制信息一起形成完整譯碼序列表示,且被稱作語法元素。在從編碼器發(fā)射到解碼器之前,可對(duì)語法元素進(jìn)行熵譯碼以便進(jìn)一步減少其表示所需要的位的數(shù)目。
[0031]在視頻解碼器處,可通過首先以與在編碼器中相同的方式建構(gòu)其預(yù)測(cè)及通過將經(jīng)壓縮預(yù)測(cè)誤差添加到預(yù)測(cè)而獲得當(dāng)前幀中的塊??赏ㄟ^使用經(jīng)量化系數(shù)加權(quán)變換基底函數(shù)而發(fā)現(xiàn)經(jīng)壓縮預(yù)測(cè)誤差。經(jīng)重建構(gòu)幀與原始幀之間的差別常常被稱作重建構(gòu)誤差。
[0032]本發(fā)明中描述的技術(shù)通常涉及可縮放視頻譯碼(SVC)及3D視頻譯碼。舉例來說,技術(shù)可與高效率視頻譯碼(HEVC)可縮放視頻譯碼(SVC)擴(kuò)展相關(guān),及供所述HEVC SVC擴(kuò)展使用或在所述HEVC SVC擴(kuò)展內(nèi)使用。在SVC擴(kuò)展中,可存在多個(gè)視頻信息層。在極底層級(jí)處的層可充當(dāng)基層(BL),且在極頂部的層可充當(dāng)增強(qiáng)型層(EL)?!霸鰪?qiáng)型層”有時(shí)被稱作“增強(qiáng)層”,且這些術(shù)語可互換地使用。所有在中間的層可充當(dāng)EL或BL,或EL及BL兩者。舉例來說,在中間的層可為在其下方的層(例如基層或任何介入增強(qiáng)層)的EL,且同時(shí)充當(dāng)在其上方的增強(qiáng)層的BL。
[0033]僅出于說明的目的,本發(fā)明中描述的技術(shù)是關(guān)于僅包含兩個(gè)層(例如,例如基層等較低層級(jí)的層及例如增強(qiáng)型層等較高層級(jí)的層)的實(shí)例進(jìn)行描述的。應(yīng)理解本發(fā)明中描述的實(shí)例也可擴(kuò)展到具有多個(gè)基層及增強(qiáng)層的實(shí)例。
[0034]視頻譯碼標(biāo)準(zhǔn)包含ITU-T H.261、IS0/IEC MPEG-1 Visual, ITU-T H.262 或IS0/IEC MPEG-2 Visual, ITU-T H.263、IS0/IEC MPEG-4 Visual 及 ITU-T H.264 (也稱為IS0/IEC MPEG-4 AVC),包含其可縮放視頻譯碼(SVC)及多視圖視頻譯碼(MVC)擴(kuò)展。在“用于通用視聽服務(wù)的高級(jí)視頻譯碼(Advanced video coding for genericaud1visual services) ”(ITU-T 規(guī)范 H.264,2010 年 3 月)中描述 SVC 及 MVC 的最新聯(lián)合草案。另外,ITU-T視頻譯碼專家組(VCEG)及IS0/IEC運(yùn)動(dòng)圖片專家組(MPEG)的視頻譯碼聯(lián)合協(xié)作小組(JCT-VC)正開發(fā)新視頻譯碼標(biāo)準(zhǔn),即高效率視頻譯碼(HEVC)。新近高效率視頻譯碼(HEVC)文本規(guī)范草案可自http://phenix.1nt-evry.fr/jct/doc_end_user/documents/12_Geneva/wglI/JCTVC-L1003-vl3.zip 獲得。HEVC 的另一新近工作草案(WD)(且其被稱作 HEVC WD9)可在 http://phenix.1nt-evry.fr/jet/doc_end_user/documents/1l_Shanghai/wglI/JCTVC-K1003-vl3.zip 處獲得。被稱作 HEVC WD8 (或WD8)的 HEVC 的另一工作草案可在 http://phenix.1nt-evry.f r/jet/doc_end_user/documents/ 10_Stockholm/wglI/JCTVC-J1003-v8.zip 處獲得。HEVC 的另一工作草案(且其在下文中被稱作 HEVC WD7)可自 http://phenix.1nt-evry.fr/jet/doc_end_user/documents/9_Geneva/wgl 1/JCTVC-11003-V5.zip獲得。所有這些文件的全文是以引用的方式并入。
[0035]在可縮放視頻譯碼(SVC)中,將來自每一層(例如,基層及增強(qiáng)層)的位流一起多路復(fù)用成單個(gè)位流。在增強(qiáng)層位流在被解碼時(shí)可將某些增強(qiáng)提供到基層的意義上,此位流是可縮放的。此些增強(qiáng)包含關(guān)于基層的空間分辨率、時(shí)間分辨率、質(zhì)量增強(qiáng)及其類似者?;鶎涌膳c增強(qiáng)層獨(dú)立地解碼。對(duì)應(yīng)地,此些增強(qiáng)也分別被稱作空間可縮放性、時(shí)間可縮放性及信噪比(SNR)可縮放性。
[0036]SVC的目標(biāo)通常為利用層間相關(guān)來改進(jìn)譯碼效率,而不管可縮放性的類型。此層間相關(guān)可存在于不同層中的對(duì)應(yīng)塊的不同語法(例如,預(yù)測(cè)模式、運(yùn)動(dòng)向量、預(yù)測(cè)殘余等)中。
[0037]為了利用此些相關(guān),在過去已提出數(shù)個(gè)譯碼工具。在H.264/AVC的可縮放擴(kuò)展中,舉例來說,定義了例如幀內(nèi)基層(BL)模式、殘余預(yù)測(cè)、模式繼承及運(yùn)動(dòng)向量預(yù)測(cè)等若干譯碼工具。在幀內(nèi)BL模式中,將基層重建構(gòu)塊的紋理用作在預(yù)測(cè)對(duì)應(yīng)增強(qiáng)層塊時(shí)的預(yù)測(cè)子。在殘余預(yù)測(cè)的情況下,基層塊的預(yù)測(cè)殘余用以預(yù)測(cè)對(duì)應(yīng)增強(qiáng)層塊的預(yù)測(cè)殘余。在模式繼承的情況下,基層塊的預(yù)測(cè)模式(包含分割模式)用以預(yù)測(cè)增強(qiáng)層塊的預(yù)測(cè)模式。在運(yùn)動(dòng)向量預(yù)測(cè)的情況下,基層塊的運(yùn)動(dòng)向量用以預(yù)測(cè)增強(qiáng)層塊的運(yùn)動(dòng)向量。
[0038]在SVC中,層為基層還是增強(qiáng)層通常可被看作相對(duì)的。舉例來說,第一層與最后層之間的任何層可為用于一或多個(gè)較低層的增強(qiáng)層,且同時(shí)可充當(dāng)用于一或多個(gè)較高層的基層。
[0039]SVC可用以提供質(zhì)量(還被稱作信噪比(SNR))可縮放性、空間可縮放性和/或時(shí)間可縮放性。增強(qiáng)型層可具有不同于基層的空間分辨率。舉例來說,EL與BL之間的空間寬高比可為1.0、1.5、2.0或其它不同比。換句話說,EL的空間寬高比可等于BL的空間寬高比的1.0、1.5或2.0倍。在一些實(shí)例中,EL的縮放因數(shù)可大于BL。舉例來說,EL中的圖片的大小可大于BL中的圖片的大小。以此方式,EL的空間分辨率大于BL的空間分辨率是有可能的,但并不限于此。
[0040]本發(fā)明的方面涉及基于來自EL及BL兩者的預(yù)測(cè)子使用組合的預(yù)測(cè)子產(chǎn)生經(jīng)預(yù)測(cè)EL塊。在對(duì)EL進(jìn)行譯碼時(shí),可如上文所通常描述般產(chǎn)生預(yù)測(cè)子。其后,EL預(yù)測(cè)子可與BL預(yù)測(cè)子組合以便改進(jìn)用于EL像素的層間預(yù)測(cè)的最終預(yù)測(cè)子的質(zhì)量。在組合EL預(yù)測(cè)子與BL預(yù)測(cè)子時(shí),可應(yīng)用加權(quán)以使得在EL預(yù)測(cè)子很可能更準(zhǔn)確的狀況下,EL預(yù)測(cè)子對(duì)最終預(yù)測(cè)子的影響超過BL預(yù)測(cè)子?;蛘?,可應(yīng)用加權(quán)以使得在BL預(yù)測(cè)子很可能更準(zhǔn)確的狀況下,BL預(yù)測(cè)子對(duì)最終預(yù)測(cè)子的影響超過EL預(yù)測(cè)子。在并不知道哪一預(yù)測(cè)子更有可能準(zhǔn)確的狀況下,BL預(yù)測(cè)子及EL預(yù)測(cè)子可均勻地進(jìn)行加權(quán)。
[0041]下文中參考隨附圖式更全面描述新穎系統(tǒng)、設(shè)備及方法的各種方面。然而,本發(fā)明可以許多不同形式體現(xiàn),且不應(yīng)解釋為限于遍及本發(fā)明所呈現(xiàn)的任何特定結(jié)構(gòu)或功能。而是,提供這些方面以使得本發(fā)明將為全面的及完整的,且將向所屬領(lǐng)域的技術(shù)人員完全地傳達(dá)本發(fā)明的范圍?;诒疚闹械慕淌荆鶎兕I(lǐng)域的技術(shù)人員應(yīng)了解本發(fā)明的范圍既定涵蓋新穎本文中揭示的系統(tǒng)、設(shè)備及方法的任何方面,不管是獨(dú)立于本發(fā)明的任何其它方面實(shí)施還是與本發(fā)明的任何其它方面組合地實(shí)施。舉例來說,可使用本文中所闡述的任何數(shù)目的方面來實(shí)施設(shè)備或?qū)嵺`方法。另外,本發(fā)明的范圍既定涵蓋使用其它結(jié)構(gòu)、功能性或除了本文中所闡述的本發(fā)明的各種方面之外或不同于本文中所闡述的本發(fā)明的各種方面的結(jié)構(gòu)及功能性來實(shí)踐的此設(shè)備或方法。應(yīng)理解,可由權(quán)利要求的一或多個(gè)要素來體現(xiàn)本文中揭示的任何方面。
[0042]盡管本文描述了特定方面,但這些方面的許多變化和排列屬于本發(fā)明的范圍。盡管提及了較佳方面的一些益處及優(yōu)點(diǎn),但本發(fā)明的范圍不欲限于特定益處、用途或目標(biāo)。而是,本發(fā)明的方面意在廣泛地適用于不同無線技術(shù)、系統(tǒng)配置、網(wǎng)絡(luò)和發(fā)射協(xié)議,其中的一些是作為實(shí)例而在圖中以及在優(yōu)選實(shí)施例的以下描述中得以說明。詳細(xì)描述和圖式僅說明本發(fā)明,而不是限制由所附權(quán)利要求書及其等效者界定的本發(fā)明的范圍。
[0043]圖1為說明可利用根據(jù)本發(fā)明中描述的方面的技術(shù)的實(shí)例視頻編碼及解碼系統(tǒng)的框圖。如圖1中所示,系統(tǒng)10包含源裝置12,其提供稍后將由目的地裝置14解碼的經(jīng)編碼的視頻數(shù)據(jù)。明確地說,源裝置12經(jīng)由計(jì)算機(jī)可讀媒體16將視頻數(shù)據(jù)提供到目的地裝置14。源裝置12和目的地裝置14可包括多種多樣的裝置中的任一者,包含桌上型計(jì)算機(jī)、筆記型(例如,膝上型)計(jì)算機(jī)、平板計(jì)算機(jī)、機(jī)頂盒、電話手持機(jī)(例如所謂的“智能”電話)、所謂的“智能”平板電腦、電視機(jī)、相機(jī)、顯示裝置、數(shù)字媒體播放器、視頻游戲控制臺(tái)、視頻串流裝置或類似者。在一些狀況下,源裝置12和目的地裝置14可能經(jīng)裝備以用于無線通信。
[0044]目的地裝置14可經(jīng)由計(jì)算機(jī)可讀媒體16接收待解碼的經(jīng)編碼的視頻數(shù)據(jù)。計(jì)算機(jī)可讀媒體16可包括能夠?qū)⒔?jīng)編碼的視頻數(shù)據(jù)從源裝置12移動(dòng)到目的地裝置14的任何類型的媒體或裝置。在一個(gè)實(shí)例中,計(jì)算機(jī)可讀媒體16可包括使得源裝置12能夠?qū)崟r(shí)將經(jīng)編碼的視頻數(shù)據(jù)直接發(fā)射到目的地裝置14的通信媒體。經(jīng)編碼的視頻數(shù)據(jù)可以根據(jù)通信標(biāo)準(zhǔn)(例如無線通信協(xié)議)得到調(diào)制,并且被發(fā)射到目的地裝置14。通信媒體可包括任何無線或有線通信媒體,例如射頻(RF)頻譜或一或多個(gè)物理發(fā)射線路。通信媒體可能形成分組網(wǎng)絡(luò)(例如局域網(wǎng)。廣域網(wǎng)或全球網(wǎng)絡(luò),例如因特網(wǎng))的一部分。通信媒體可包含路由器、交換器、基站或任何其它可以用于促進(jìn)從源裝置12到目的地裝置14的通信的設(shè)備。
[0045]在一些實(shí)例中,經(jīng)編碼數(shù)據(jù)可以從輸出接口 22輸出到存儲(chǔ)裝置。類似地,可以通過輸入接口從存儲(chǔ)裝置存取經(jīng)編碼數(shù)據(jù)。存儲(chǔ)裝置可包含多種分布式或本地存取的數(shù)據(jù)存儲(chǔ)媒體中的任一者,例如硬盤驅(qū)動(dòng)器、藍(lán)光光盤、DVD、CD-ROM、快閃存儲(chǔ)器、易失性或非易失性存儲(chǔ)器或任何其它用于存儲(chǔ)經(jīng)編碼的視頻數(shù)據(jù)的合適的數(shù)字存儲(chǔ)媒體。在另一實(shí)例中,存儲(chǔ)裝置可以對(duì)應(yīng)于文件服務(wù)器或另一可存儲(chǔ)源裝置12產(chǎn)生的經(jīng)編碼視頻的中間存儲(chǔ)裝置。目的地裝置14可經(jīng)由串流或下載從存儲(chǔ)裝置存取經(jīng)存儲(chǔ)的視頻數(shù)據(jù)。文件服務(wù)器可以是任何類型的能夠存儲(chǔ)經(jīng)編碼的視頻數(shù)據(jù)并且將經(jīng)編碼的視頻數(shù)據(jù)發(fā)射到目的地裝置14的服務(wù)器。實(shí)例文件服務(wù)器包含萬維網(wǎng)服務(wù)器(例如,用于網(wǎng)站)、FTP服務(wù)器、網(wǎng)絡(luò)連接存儲(chǔ)(NAS)裝置或本地磁盤驅(qū)動(dòng)器。目的地裝置14可通過任何標(biāo)準(zhǔn)數(shù)據(jù)連接(包含因特網(wǎng)連接)來存取經(jīng)編碼視頻數(shù)據(jù)。這可包含適合于存取存儲(chǔ)于文件服務(wù)器上的經(jīng)編碼的視頻數(shù)據(jù)的無線信道(例如,W1-Fi連接)、有線連接(例如,DSL、電纜調(diào)制解調(diào)器等)或兩者的組合。經(jīng)編碼的視頻數(shù)據(jù)從存儲(chǔ)裝置的發(fā)射可能是流式發(fā)射、下載發(fā)射或兩者的組合。
[0046]本發(fā)明的技術(shù)不必限于無線應(yīng)用或設(shè)置。所述技術(shù)可以應(yīng)用于視頻譯碼并且支持多種多媒體應(yīng)用中的任一者,例如空中協(xié)議電視廣播、有線電視發(fā)射、衛(wèi)星電視發(fā)射、因特網(wǎng)串流視頻發(fā)射(例如動(dòng)態(tài)自適應(yīng)HTTP串流(DASH))、經(jīng)編碼到數(shù)據(jù)存儲(chǔ)媒體上的數(shù)字視頻,存儲(chǔ)在數(shù)據(jù)存儲(chǔ)媒體上的數(shù)字視頻的解碼,或其它應(yīng)用。在一些實(shí)例中,系統(tǒng)10可經(jīng)配置以支持單向或雙向視頻發(fā)射,以支持例如視頻流式傳輸、視頻回放、視頻廣播和/或視頻電話等應(yīng)用。
[0047]在圖1的實(shí)例中,源裝置12包含視頻源18、視頻編碼器20和輸出接口 22。目的地裝置14包括輸入接口 28、視頻解碼器30和顯示裝置32。根據(jù)本發(fā)明,源裝置12的視頻編碼器20可經(jīng)配置以應(yīng)用用于對(duì)包含符合多個(gè)標(biāo)準(zhǔn)或標(biāo)準(zhǔn)擴(kuò)展的視頻數(shù)據(jù)的位流進(jìn)行譯碼的技術(shù)。在其它實(shí)例中,源裝置和目的地裝置可包含其它組件或布置。舉例來說,源裝置12可以從外部視頻源18 (例如外部相機(jī))接收視頻數(shù)據(jù)。同樣,目的地裝置14可以與外部顯示裝置介接,而非包括集成顯示裝置。
[0048]圖1的所說明系統(tǒng)10只是一個(gè)實(shí)例。用于確定當(dāng)前塊的運(yùn)動(dòng)向量預(yù)測(cè)子的候選列表的候選的技術(shù)可由任何數(shù)字視頻編碼和/或解碼裝置執(zhí)行。盡管本發(fā)明的技術(shù)總體上通過視頻編碼裝置來執(zhí)行,但是所述技術(shù)還可通過視頻編碼器/解碼器(通常被稱作“編解碼器”)執(zhí)行。此外,本發(fā)明的技術(shù)還可通過視頻預(yù)處理器執(zhí)行。源裝置12及目的地裝置14僅為源裝置12在其中產(chǎn)生經(jīng)譯碼視頻數(shù)據(jù)以供發(fā)射到目的地裝置14的此些譯碼裝置的實(shí)例。在一些實(shí)例中,裝置12、14可以實(shí)質(zhì)上對(duì)稱的方式操作,使得裝置12、14中的每一者包含視頻編碼及解碼組件。因此,系統(tǒng)10可支持視頻裝置12、14之間的單向或雙向視頻傳播以例如用于視頻流式傳輸、視頻回放、視頻廣播或視頻電話。
[0049]源裝置12的視頻源18可包含視頻俘獲裝置,例如攝像機(jī)、含有先前所俘獲視頻的視頻檔案和/或用于從視頻內(nèi)容提供者接收視頻的視頻饋送接口。作為另一替代方案,視頻源18可產(chǎn)生基于計(jì)算機(jī)圖形的數(shù)據(jù)作為源視頻,或?qū)崨r視頻、存檔視頻與計(jì)算機(jī)產(chǎn)生的視頻的組合。在一些情況下,如果視頻源18是攝像機(jī),則源裝置12及目的地裝置14可形成所謂的相機(jī)電話或視頻電話。然而,如上文所提及,本發(fā)明中所描述的技術(shù)可大體上適用于視頻譯碼,且可應(yīng)用于無線和/或有線應(yīng)用。在每一狀況下,可由視頻編碼器20編碼所俘獲、預(yù)先俘獲或計(jì)算機(jī)產(chǎn)生的視頻。經(jīng)編碼視頻信息可接著通過輸出接口 22輸出到計(jì)算機(jī)可讀媒體16上。
[0050]計(jì)算機(jī)可讀媒體16可包含瞬時(shí)媒體,例如無線廣播或有線網(wǎng)絡(luò)發(fā)射,或存儲(chǔ)媒體(也就是說,非暫時(shí)存儲(chǔ)媒體),例如硬盤、快閃驅(qū)動(dòng)器、壓縮光盤、數(shù)字視頻光盤、藍(lán)光光盤或其它計(jì)算機(jī)可讀媒體。在一些實(shí)例中,網(wǎng)絡(luò)服務(wù)器(未圖示)可從源裝置12接收經(jīng)編碼的視頻數(shù)據(jù)及例如經(jīng)由網(wǎng)絡(luò)發(fā)射、直接有線通信等將經(jīng)編碼的視頻數(shù)據(jù)提供到目的地裝置14。類似地,媒體生產(chǎn)設(shè)施(例如光盤沖壓設(shè)施)的計(jì)算裝置可以從源裝置12接收經(jīng)編碼的視頻數(shù)據(jù)并且生產(chǎn)容納經(jīng)編碼的視頻數(shù)據(jù)的光盤。因此,在各種實(shí)例中,計(jì)算機(jī)可讀媒體16可以理解為各種形式的一或多個(gè)計(jì)算機(jī)可讀媒體。
[0051 ]目的地裝置14的輸入接口 28從計(jì)算機(jī)可讀媒體16接收信息。計(jì)算機(jī)可讀媒體16的信息可包含通過視頻編碼器20定義的語法信息,所述語法信息還由視頻解碼器30使用,包含描述塊和其它經(jīng)譯碼單元(例如G0P)的特性和/或處理的語法元素。顯示裝置32將經(jīng)解碼視頻數(shù)據(jù)顯示給用戶,且可包括多種顯示裝置中的任一者,例如陰極射線管(CRT)、液晶顯示器(LCD)、等離子顯示器、有機(jī)發(fā)光二極管(OLED)顯示器或另一類型的顯示裝置。
[0052]視頻編碼器20和視頻解碼器30可以根據(jù)一種視頻譯碼標(biāo)準(zhǔn)(例如目前正在開發(fā)的高效率視頻譯碼(HEVC)標(biāo)準(zhǔn))來操作,并且可以符合HEVC測(cè)試模型(HM)?;蛘撸曨l編碼器20和視頻解碼器30可根據(jù)其它專屬或業(yè)界標(biāo)準(zhǔn)來操作,所述標(biāo)準(zhǔn)例如是ITU-TH.264標(biāo)準(zhǔn),也被稱為MPEG-4第10部分高級(jí)視頻譯碼(AVC),或此類標(biāo)準(zhǔn)的擴(kuò)展。然而,本發(fā)明的技術(shù)不限于任何特定譯碼標(biāo)準(zhǔn),包含但不限于上文所列的標(biāo)準(zhǔn)中的任一者。視頻譯碼標(biāo)準(zhǔn)的其它實(shí)例包含MPEG-2和ITU-T H.263。盡管圖1中未展示,但在一些方面中,視頻編碼器20及視頻解碼器30可各自與音頻編碼器及解碼器集成,且可包含適當(dāng)多路復(fù)用器-多路分用器單元或其它硬件及軟件以處置對(duì)共同數(shù)據(jù)流或單獨(dú)數(shù)據(jù)流中的音頻或視頻兩者的編碼。如果適用的話,多路復(fù)用器-多路分用器單元可符合ITU H.223多路復(fù)用器協(xié)議,或例如用戶數(shù)據(jù)報(bào)協(xié)議(UDP)等其它協(xié)議。
[0053]視頻編碼器20及視頻解碼器30各自可實(shí)施為多種合適的編碼器電路中的任一者,例如一或多個(gè)微處理器、數(shù)字信號(hào)處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、離散邏輯、軟件、硬件、固件或其任何組合。當(dāng)部分地用軟件實(shí)施所述技術(shù)時(shí),裝置可將用于所述軟件的指令存儲(chǔ)于合適的非暫時(shí)性計(jì)算機(jī)可讀媒體中且使用一或多個(gè)處理器用硬件執(zhí)行所述指令以執(zhí)行本發(fā)明的技術(shù)。視頻編碼器20及視頻解碼器30中的每一者可包含在一或多個(gè)編碼器或解碼器中,所述編碼器或解碼器中的任一者可集成為相應(yīng)裝置中的組合編碼器/解碼器(編解碼器)的部分。包含視頻編碼器20和/或視頻解碼器30的裝置可包括集成電路、微處理器和/或無線通信裝置,例如蜂窩式電話。
[0054]JCT-VC正在努力開發(fā)HEVC標(biāo)準(zhǔn)。所述HEVC標(biāo)準(zhǔn)化努力是基于被稱作HEVC測(cè)試模型(麗)的視頻譯碼裝置的進(jìn)化的模型。HM假設(shè)視頻譯碼裝置根據(jù)例如ITU-TH.264/AVC相對(duì)于現(xiàn)存裝置的幾個(gè)額外能力。舉例來說,雖然H.264提供了九種幀內(nèi)預(yù)測(cè)編碼模式,但是HM可提供多達(dá)三十三種幀內(nèi)預(yù)測(cè)編碼模式。
[0055]總的來說,HM的工作模型描述視頻幀或圖片可以分成包含明度和色度樣本兩者的一連串樹塊或最大譯碼單元(LCU)。位流內(nèi)的語法數(shù)據(jù)可以界定最大譯碼單位(LCU,其是就像素?cái)?shù)目來說的最大譯碼單位)的大小。切片包含譯碼次序的多個(gè)連續(xù)樹塊。視頻幀或圖片可分割成一或多個(gè)切片。每一樹塊可以根據(jù)四叉樹分裂成譯碼單元(CU)??偟膩碚f,四叉樹數(shù)據(jù)結(jié)構(gòu)包含每個(gè)CU —個(gè)節(jié)點(diǎn),其中一個(gè)根節(jié)點(diǎn)對(duì)應(yīng)于所述樹塊。如果一個(gè)CU分裂成4個(gè)子CU,那么對(duì)應(yīng)于⑶的節(jié)點(diǎn)包含4個(gè)葉節(jié)點(diǎn),其中的每一者對(duì)應(yīng)于所述子⑶中的一者O
[0056]四叉樹數(shù)據(jù)結(jié)構(gòu)的每一節(jié)點(diǎn)可提供用于對(duì)應(yīng)CU的語法數(shù)據(jù)。舉例來說,四叉樹中的一個(gè)節(jié)點(diǎn)可包含一個(gè)分裂旗標(biāo),這表明對(duì)應(yīng)于所述節(jié)點(diǎn)的所述CU是否分裂成子CU。可以取決于所述CU是否分裂成子CU來遞歸地定義CU的語法元素。如果CU不進(jìn)一步分裂,那么將其稱為葉CU。在本發(fā)明中,葉CU的子CU也將被稱作葉CU,即使不存在原始葉CU的明確分裂時(shí)也是如此。舉例來說,如果16x16大小的⑶不進(jìn)一步分裂,那么這四個(gè)8x8子⑶將也被稱作葉⑶,雖然16x16⑶從未分裂。
[0057]⑶具有類似于H.264標(biāo)準(zhǔn)的宏塊的用途,但是⑶并不具有大小區(qū)別。舉例來說,樹塊可以分裂成四個(gè)子節(jié)點(diǎn)(還稱為子CU),并且每一子節(jié)點(diǎn)又可以是父節(jié)點(diǎn)并且可以分裂成另外四個(gè)子節(jié)點(diǎn)。最終的未分裂子節(jié)點(diǎn)(被稱作四叉樹的葉節(jié)點(diǎn))包括譯碼節(jié)點(diǎn),還稱為葉CU。與經(jīng)譯碼位流相關(guān)聯(lián)的語法數(shù)據(jù)可以界定樹塊可以分裂的最大次數(shù),被稱作最大CU深度,并且還可界定譯碼節(jié)點(diǎn)的最小大小。所以,位流還可定義最小譯碼單元(SCU)。本發(fā)明使用術(shù)語“塊”指代HEVC的上下文中的CU、PU或TU中的任一者,或者其它標(biāo)準(zhǔn)的上下文中的類似數(shù)據(jù)結(jié)構(gòu)(例如,其在H.264/AVC中的宏塊和子塊)。
[0058]CU包含譯碼節(jié)點(diǎn)和與所述譯碼節(jié)點(diǎn)相關(guān)聯(lián)的預(yù)測(cè)單元(PU)和變換單元(TU)。CU的大小對(duì)應(yīng)于譯碼節(jié)點(diǎn)的大小并且形狀必須是正方形。CU的大小可以從8x8像素到具有最大64x64像素或更大的樹塊的大小變動(dòng)。每一⑶可含有一或多個(gè)I3U及一或多個(gè)TU。舉例來說,與CU相關(guān)聯(lián)的語法數(shù)據(jù)可描述CU分割成一或多個(gè)TO。分割模式可以在CU被跳過或經(jīng)直接模式編碼、幀內(nèi)預(yù)測(cè)模式編碼或幀間預(yù)測(cè)模式編碼之間有區(qū)別。PU可以分割成非正方形形狀。舉例來說,與CU相關(guān)聯(lián)的語法數(shù)據(jù)還可描述CU根據(jù)四叉樹分割成一或多個(gè)TU0 TU可以是正方形或非正方形(例如,矩形)形狀。
[0059]HEVC標(biāo)準(zhǔn)允許根據(jù)TU變換,TU可以針對(duì)不同⑶而有所不同。TU的大小通常是基于針對(duì)經(jīng)分割LCU定義的給定CU內(nèi)的PU的大小而確定,但是情況可能并不總是如此。TU通常與PU大小相同或小于PU。在一些實(shí)例中,對(duì)應(yīng)于CU的殘余樣本可使用被稱為“殘余四叉樹”(RQT)的四叉樹結(jié)構(gòu)細(xì)分成較小單元。RQT的葉節(jié)點(diǎn)可被稱為變換單元(TU)??梢宰儞Q與TU相關(guān)聯(lián)的像素差值以產(chǎn)生變換系數(shù),所述變換系數(shù)可以經(jīng)量化。
[0060]葉⑶可包含一或多個(gè)預(yù)測(cè)單元(PU)??偟膩碚f,I3U表示對(duì)應(yīng)于對(duì)應(yīng)⑶的全部或一部分的空間區(qū)域,并且可包含用于檢索PU的參考樣本的數(shù)據(jù)。此外,PU包含與預(yù)測(cè)有關(guān)的數(shù)據(jù)。舉例來說,當(dāng)PU經(jīng)幀內(nèi)模式編碼時(shí),用于的數(shù)據(jù)可以包含在殘余四叉樹(RQT)中,殘余四叉樹可包含描述用于對(duì)應(yīng)于PU的TU的幀內(nèi)預(yù)測(cè)模式的數(shù)據(jù)。作為另一實(shí)例,當(dāng)PU經(jīng)幀間模式編碼時(shí),PU可包含界定I3U的一或多個(gè)運(yùn)動(dòng)向量的數(shù)據(jù)。舉例來說,定義PU的運(yùn)動(dòng)向量的數(shù)據(jù)可以描述運(yùn)動(dòng)向量的水平分量、運(yùn)動(dòng)向量的垂直分量、運(yùn)動(dòng)向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、運(yùn)動(dòng)向量指向的參考圖片和/或運(yùn)動(dòng)向量的參考圖片列表(例如,列表O、列表I或列表C)。
[0061]具有一或多個(gè)I3U的葉⑶還可包含一或多個(gè)變換單元(TU)。變換單元可以使用RQT(還稱為TU四叉樹結(jié)構(gòu))來指定,如上文所論述。舉例來說,分裂旗標(biāo)可以指示葉CU是否分裂成四個(gè)變換單元。接著,每一變換單元可以進(jìn)一步分裂成更多個(gè)子TU。當(dāng)TU不進(jìn)一步分裂時(shí),其可被稱為葉TU??傮w上,對(duì)于幀內(nèi)譯碼,所有屬于一個(gè)葉CU的葉TU共用相同的幀內(nèi)預(yù)測(cè)模式。也就是說,總體上應(yīng)用相同幀內(nèi)預(yù)測(cè)模式來計(jì)算葉CU的所有TU的預(yù)測(cè)值。對(duì)于幀內(nèi)譯碼,視頻編碼器可以使用幀內(nèi)預(yù)測(cè)模式針對(duì)每一葉TU計(jì)算殘余值,作為CU的對(duì)應(yīng)于TU的部分與原始?jí)K之間的差。TU不必限于I3U的大小。因而,TU比PU大或小。對(duì)于幀內(nèi)譯碼,PU可以與相同⑶的對(duì)應(yīng)葉TU設(shè)在同一位置。在一些實(shí)例中,葉TU的最大大小可以對(duì)應(yīng)于對(duì)應(yīng)葉CU的大小。
[0062]此外,葉⑶的TU還可與相應(yīng)四叉樹數(shù)據(jù)結(jié)構(gòu)(被稱作殘余四叉樹(RQT))相關(guān)聯(lián)。也就是說,葉CU可包含指示葉CU如何分割成TU的四叉樹。TU四叉樹的根節(jié)點(diǎn)總體上對(duì)應(yīng)于葉CU,而CU四叉樹的根節(jié)點(diǎn)總體上對(duì)應(yīng)于樹塊(或LCU)。未分裂的RQT的TU被稱作葉TU0總的來說,本發(fā)明分別使用術(shù)語CU和TU指代葉CU和葉TU,除非以其它方式指出。
[0063]視頻序列通常包含一系列視頻幀或圖片。圖片群組(GOP)總體上包括一系列視頻圖片中的一或多者。GOP可包含GOP的標(biāo)頭、圖片中的一或多者的標(biāo)頭或其它地方中的語法數(shù)據(jù),其描述GOP中包含的圖片的數(shù)目。圖片的每一切片可包含切片語法數(shù)據(jù),其描述用于相應(yīng)切片的編碼模式。視頻編碼器20通常對(duì)各個(gè)視頻切片內(nèi)的視頻塊進(jìn)行操作以便對(duì)視頻數(shù)據(jù)進(jìn)行編碼。視頻塊可以對(duì)應(yīng)于CU內(nèi)的譯碼節(jié)點(diǎn)。視頻塊可以具有固定或變化的大小,并且根據(jù)指定譯碼標(biāo)準(zhǔn)可以有不同大小。
[0064]作為實(shí)例,HM支持各種I3U大小的預(yù)測(cè)。假設(shè)特定CU的大小是2Nx2N,則HM支持2Nx2N或NxN的PU大小的幀內(nèi)預(yù)測(cè),及2Nx2N、2NxN、Nx2N或NxN的對(duì)稱I3U大小的幀間預(yù)測(cè)。HM還支持用于2NxnU、2NxnD、nLx2N和nRx2N的PU大小的幀間預(yù)測(cè)的不對(duì)稱分割。在不對(duì)稱分割中,不分割⑶的一個(gè)方向,但是另一方向分割成25 %和75 %。⑶的對(duì)應(yīng)于25 %分割區(qū)的部分表示成“n”,接著是用“上方”、“下方”、“左側(cè)”或“右側(cè)”指示。因此,舉例來說,“2NxnU”是指水平地分割的2Nx2N CU,其中上方有2Nx0.5N PU,而下方有2Nxl.5N PU。
[0065]在本發(fā)明中,“NxN”和“N乘N”可以互換使用來指代在垂直和水平尺寸方面的視頻塊的像素尺寸,例如,16x16像素或16乘16像素??偟膩碚f,16x16塊將在垂直方向上具有16個(gè)像素(y = 16),且在水平方向上具有16個(gè)像素(x = 16)。同樣,NxN塊總體上在垂直方向上具有N個(gè)像素,并且在水平方向上具有N個(gè)像素,其中N表示非負(fù)整數(shù)值。塊中的像素可布置成行及列。此外,塊可能不一定在水平方向與垂直方向上具有相同數(shù)目的像素。舉例來說,塊可包括NxM像素,其中M未必等于N。
[0066]在使用CU的PU的幀內(nèi)預(yù)測(cè)性或幀間預(yù)測(cè)性譯碼之后,視頻編碼器20可以計(jì)算⑶的TU的殘余數(shù)據(jù)??砂枋鲈诳臻g域(還稱為像素域)中產(chǎn)生預(yù)測(cè)性像素?cái)?shù)據(jù)的方法或模式的語法數(shù)據(jù),并且TU可包括在對(duì)殘余視頻數(shù)據(jù)應(yīng)用了變換(例如離散余弦變換(DCT)、整數(shù)變換、小波變換或概念上類似的變換)變換域中的系數(shù)。所述殘余數(shù)據(jù)可以對(duì)應(yīng)于未編碼圖片的像素與對(duì)應(yīng)于PU的預(yù)測(cè)值之間的像素差。視頻編碼器20可以形成包含用于CU的殘余數(shù)據(jù)的TU,并且接著變換TU以產(chǎn)生用于CU的變換系數(shù)。
[0067]在任何用于產(chǎn)生變換系數(shù)的變換之后,視頻編碼器20可以執(zhí)行變換系數(shù)的量化。量化為既定具有其最廣泛一般含義的廣義術(shù)語。在一個(gè)實(shí)施例中,量化是指變換系數(shù)經(jīng)量化以可能減少用于表示系數(shù)的數(shù)據(jù)量從而提供進(jìn)一步壓縮的過程。量化過程可減少與變換系數(shù)中的一些或全部相關(guān)聯(lián)的位深度。舉例來說,η位值可在量化期間被下舍入到m位值,其中η大于m。
[0068]在量化之后,視頻編碼器可以掃描變換系數(shù),從包括經(jīng)量化變換系數(shù)的二維矩陣產(chǎn)生一維向量。掃描可以經(jīng)過設(shè)計(jì)以將較高能量(并且因此較低頻率)的系數(shù)放置在陣列正面,并且將較低能量(并且因此較高頻率)的系數(shù)放置在陣列的背面。在一些實(shí)例中,視頻編碼器20可以利用預(yù)定義掃描次序來掃描經(jīng)量化變換系數(shù)以產(chǎn)生可被熵編碼的串行化向量。在其它實(shí)例中,視頻編碼器20可以執(zhí)行自適應(yīng)掃描。在掃描經(jīng)量化變換系數(shù)以形成一維向量之后,視頻編碼器20可以例如根據(jù)上下文自適應(yīng)可變長度譯碼(CAVLC)、上下文自適應(yīng)二進(jìn)制算術(shù)譯碼(CABAC)、基于語法的上下文自適應(yīng)二進(jìn)制算術(shù)譯碼(SBAC)、概率區(qū)間分割熵(PIPE)譯碼或另一熵編碼方法對(duì)一維向量進(jìn)行編碼。視頻編碼器還20可對(duì)與經(jīng)編碼的視頻數(shù)據(jù)相關(guān)聯(lián)的語法元素進(jìn)行熵編碼以供視頻解碼器30在對(duì)視頻數(shù)據(jù)解碼時(shí)使用。
[0069]為了執(zhí)行CABAC,視頻編碼器20可以向待發(fā)射的符號(hào)指派上下文模型內(nèi)的一個(gè)上下文。舉例來說,所述上下文可與符號(hào)的相鄰值是否為非零有關(guān)。為了執(zhí)行CAVLC,視頻編碼器20可以選擇用于待發(fā)射的符號(hào)的可變長度碼。VLC中的碼字可經(jīng)建構(gòu)而使得相對(duì)短的代碼對(duì)應(yīng)于更有可能的符號(hào),而較長的代碼對(duì)應(yīng)于不太可能的符號(hào)。以此方式,使用VLC可以舉例來說實(shí)現(xiàn)優(yōu)于對(duì)待發(fā)射的每一符號(hào)使用等長碼字的位節(jié)省。概率確定可基于指派給符號(hào)的上下文。
[0070]視頻編碼器20可例如在幀標(biāo)頭、塊標(biāo)頭、切片標(biāo)頭或GOP標(biāo)頭中進(jìn)一步將例如基于塊的語法數(shù)據(jù)、基于幀的語法數(shù)據(jù)及基于GOP的語法數(shù)據(jù)等語法數(shù)據(jù)發(fā)送到視頻解碼器30。GOP語法數(shù)據(jù)可描述相應(yīng)GOP中的數(shù)個(gè)幀,及幀語法數(shù)據(jù)可指示用以對(duì)對(duì)應(yīng)幀進(jìn)行編碼的編碼/預(yù)測(cè)模式。
[0071]圖2說明可由各種視頻譯碼器(例如圖3的視頻編碼器20、圖4的視頻解碼器30或一些其它視頻譯碼器)實(shí)施的實(shí)例過程流程。在以下描述中,為說明方便起見,基層塊經(jīng)重建構(gòu)紋理被稱作BL預(yù)測(cè)子(表示為Pb)。在增強(qiáng)層處使用增強(qiáng)層塊的信息形成的預(yù)測(cè)子被稱作EL預(yù)測(cè)子(表示為Pe)。由BL預(yù)測(cè)子及EL預(yù)測(cè)子兩者的自適應(yīng)組合形成的預(yù)測(cè)被稱作最終預(yù)測(cè)子(表示為Pf),根據(jù)本發(fā)明的技術(shù),所述最終預(yù)測(cè)子為實(shí)際上用以預(yù)測(cè)當(dāng)前增強(qiáng)層塊的預(yù)測(cè)子。圖2中說明的過程可用于在產(chǎn)生層間預(yù)測(cè)時(shí)組合BL預(yù)測(cè)子與EL預(yù)測(cè)子。
[0072]基層視頻信息300及增強(qiáng)層視頻信息302可由視頻譯碼器獲得。在框310處,例如BL塊等基層視頻的譯碼可開始。BL預(yù)測(cè)子(例如,在基層處的經(jīng)重建構(gòu)塊)可根據(jù)本文中所描述的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)、幀內(nèi)預(yù)測(cè)及殘余預(yù)測(cè)技術(shù)來產(chǎn)生。在框312處,例如EL塊等增強(qiáng)層視頻的譯碼也可開始。EL預(yù)測(cè)子可根據(jù)運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)及幀內(nèi)預(yù)測(cè)而產(chǎn)生。另外,在框310處產(chǎn)生的BL預(yù)測(cè)子可與在框312處產(chǎn)生的EL預(yù)測(cè)子組合以便產(chǎn)生最終EL預(yù)測(cè)子。在產(chǎn)生最終EL預(yù)測(cè)子時(shí),可將加權(quán)因數(shù)應(yīng)用于BL預(yù)測(cè)子及EL預(yù)測(cè)子以便將更多權(quán)重給予更有可能準(zhǔn)確的預(yù)測(cè)子,如下文所描述。
[0073]在一些實(shí)施例中,對(duì)于基層預(yù)測(cè)子的所有像素,第一加權(quán)因數(shù)可為常量,及對(duì)于基層預(yù)測(cè)子的所有像素,第二加權(quán)因數(shù)可為常量。在額外實(shí)施例中,第一加權(quán)因數(shù)可依據(jù)像素位置而變化,及第二加權(quán)因數(shù)可依據(jù)像素位置而變化。在其它實(shí)施例中,加權(quán)因數(shù)可基于量化參數(shù)或空間縮放比而變化。對(duì)于給出的實(shí)例中的任一者,可確定加權(quán)因數(shù)以使得第一加權(quán)因數(shù)與第二加權(quán)因數(shù)的總和等于常量。
[0074]舉例來說,對(duì)于在當(dāng)前增強(qiáng)層塊(例如,當(dāng)前正譯碼的EL塊)的邊界處或靠近于所述邊界的像素,對(duì)應(yīng)于EL預(yù)測(cè)子的第二加權(quán)因數(shù)可大于對(duì)應(yīng)于BL預(yù)測(cè)子的第一加權(quán)因數(shù)??稍谄渲朽徑袼鼗蚓o密接近于當(dāng)前EL塊的像素的像素提供比來自基層的像素更好的預(yù)測(cè)子的狀況下使用此加權(quán)。對(duì)于并非在當(dāng)前增強(qiáng)層塊的邊界處及并非靠近于所述邊界的像素,對(duì)應(yīng)于BL預(yù)測(cè)子的第一加權(quán)因數(shù)可大于對(duì)應(yīng)于EL預(yù)測(cè)子的第二加權(quán)因數(shù)。在這些狀況下,可確定來自對(duì)應(yīng)于當(dāng)前增強(qiáng)層塊的基層塊的像素提供比來自其它增強(qiáng)層塊的像素更好的預(yù)測(cè)子??捎梢曨l譯碼器基于當(dāng)前增強(qiáng)層塊的幀內(nèi)預(yù)測(cè)方向確定像素何時(shí)足夠地靠近于鄰近增強(qiáng)層塊以影響到應(yīng)用于預(yù)測(cè)子的加權(quán)的確定。
[0075]視頻譯碼器還可依據(jù)像素與當(dāng)前增強(qiáng)層塊的邊界之間的距離確定第一加權(quán)因數(shù)。對(duì)于更靠近于邊界的像素,第二加權(quán)因數(shù)通??稍黾?,且對(duì)于距邊界較遠(yuǎn)的像素,第一加權(quán)因數(shù)通常增加。
[0076]視頻譯碼器還可基于基層預(yù)測(cè)子的量化參數(shù)及增強(qiáng)層預(yù)測(cè)子的量化參數(shù)確定第一加權(quán)因數(shù)及第二加權(quán)因數(shù)。舉例來說,如果BL的量化參數(shù)實(shí)質(zhì)上等于EL的量化參數(shù)或在EL的量化參數(shù)的某一閾值內(nèi),那么BL預(yù)測(cè)子及EL預(yù)測(cè)子的權(quán)重可比在EL及BL量化參數(shù)中的差很大的情況下更接近。如果BL量化參數(shù)比EL量化參數(shù)大得多,那么視頻譯碼器指派給EL預(yù)測(cè)子的權(quán)重可實(shí)質(zhì)上大于指派給BL預(yù)測(cè)子的權(quán)重(例如,指派給EL預(yù)測(cè)子的權(quán)重隨著QP1-QP2的差增加而增加,其中QPl表示BL的量化參數(shù),且QP2表示EL的量化參數(shù))。同樣,如果BL量化參數(shù)比EL量化參數(shù)小得多,那么視頻譯碼器指派給EL預(yù)測(cè)子的權(quán)重可實(shí)質(zhì)上低于指派給BL預(yù)測(cè)子的權(quán)重。
[0077]視頻譯碼器還可基于縮放比選擇第一加權(quán)因數(shù)及第二加權(quán)因數(shù)。舉例來說,較大縮放比通??蓪?duì)應(yīng)于第二加權(quán)因數(shù)的較高值。
[0078]在框320處,可對(duì)表示原始BL塊與如上文所描述產(chǎn)生的預(yù)測(cè)性BL塊之間的像素差的殘余數(shù)據(jù)進(jìn)行譯碼。舉例來說,在對(duì)視頻進(jìn)行編碼時(shí),可以將殘余數(shù)據(jù)從像素域變換到變換域,從而產(chǎn)生殘余變換系數(shù),接著可以對(duì)殘余變換系數(shù)進(jìn)行量化。在框322處,可對(duì)表示原始EL塊與如上文所描述產(chǎn)生的預(yù)測(cè)性EL塊之間的像素差的殘余數(shù)據(jù)進(jìn)行譯碼。
[0079]在框330處,基層的運(yùn)動(dòng)向量的預(yù)測(cè)子可根據(jù)運(yùn)動(dòng)預(yù)測(cè)技術(shù)(例如本文中所描述的技術(shù))而產(chǎn)生。在框332處,增強(qiáng)層的運(yùn)動(dòng)向量的預(yù)測(cè)子也可根據(jù)運(yùn)動(dòng)預(yù)測(cè)技術(shù)產(chǎn)生。另夕卜,基層運(yùn)動(dòng)向量可用作增強(qiáng)層運(yùn)動(dòng)向量的預(yù)測(cè)子。
[0080]在框340處,可從視頻譯碼器輸出經(jīng)譯碼BL視頻。在框342處,可從視頻譯碼器輸出經(jīng)譯碼EL視頻。在由視頻編碼器執(zhí)行過程時(shí),可對(duì)BL殘余及其它語法元素進(jìn)行熵譯碼,從而進(jìn)一步減少所得位流的大小,且可以類似方式對(duì)EL殘余及其它語法元素進(jìn)行熵譯碼。接著可多路復(fù)用對(duì)應(yīng)于每一層的位流以用于輸出(例如,發(fā)射或存儲(chǔ))。在由視頻解碼器執(zhí)行過程時(shí),經(jīng)譯碼EL視頻及BL視頻可用以輸出視頻信號(hào)以供呈現(xiàn)(例如,經(jīng)由與解碼器相關(guān)聯(lián)的顯示器)。
[0081]圖3為說明可實(shí)施根據(jù)本發(fā)明中描述的方面的譯碼技術(shù)的視頻編碼器20的實(shí)例的框圖。視頻編碼器20可經(jīng)配置以執(zhí)行本發(fā)明的技術(shù)中的任一者或全部。作為一個(gè)實(shí)例,模式選擇單元40可經(jīng)配置以執(zhí)行本發(fā)明中描述的技術(shù)中的任一者或全部,例如基于像素位置、BL及EL特性及其類似者確定BL及EL權(quán)重。然而,本發(fā)明的方面不限于此。在一些實(shí)例中,可在視頻編碼器20的各種組件當(dāng)中共享本發(fā)明中描述的技術(shù)。在一些實(shí)例中,另外或替代性地,處理器(未圖示)可經(jīng)配置以執(zhí)行本發(fā)明中描述的技術(shù)中的任一者或全部。
[0082]視頻編碼器20可對(duì)視頻切片內(nèi)的視頻塊執(zhí)行幀內(nèi)及幀間譯碼。幀內(nèi)譯碼依賴于空間預(yù)測(cè)來減少或移除給定視頻幀或圖片內(nèi)的視頻中的空間冗余。幀間譯碼依賴于時(shí)間預(yù)測(cè)來減少或移除視頻序列的鄰接幀或圖片內(nèi)的視頻中的時(shí)間冗余。幀內(nèi)模式(I模式)可以指若干基于空間的譯碼模式中的任一者。例如單向預(yù)測(cè)(P模式)或雙向預(yù)測(cè)(B模式)等幀間模式可以指代若干基于時(shí)間的譯碼模式中的任一者。
[0083]如圖3中所示,視頻編碼器20接收待編碼視頻幀內(nèi)的當(dāng)前視頻塊。在圖3的實(shí)例中,視頻編碼器20包含模式選擇單元40、參考幀存儲(chǔ)器64、求和器50、變換處理單元52、量化單元54及熵編碼單元56。模式選擇單元40又包含運(yùn)動(dòng)補(bǔ)償單元44、運(yùn)動(dòng)估計(jì)單元42幀內(nèi)預(yù)測(cè)單元46及分割單元48。為了視頻塊重建構(gòu),視頻編碼器20還包含逆量化單元58、逆變換單元60及求和器62。還可包含去塊濾波器(圖3中未圖示)以對(duì)塊邊界進(jìn)行濾波,從而從經(jīng)重建構(gòu)視頻移除成塊假影。必要時(shí),去塊濾波器通常將對(duì)求和器62的輸出進(jìn)行濾波。除了去塊濾波器之外,還可使用額外濾波器(環(huán)路內(nèi)或環(huán)路后)。此些濾波器為簡(jiǎn)潔起見未圖示,但必要時(shí)可對(duì)求和器50的輸出進(jìn)行濾波(作為環(huán)路內(nèi)濾波器)。
[0084]在編碼過程期間,視頻編碼器20接收待譯碼的視頻幀或切片。所述幀或切片可劃分成多個(gè)視頻塊。運(yùn)動(dòng)估計(jì)單元42及運(yùn)動(dòng)補(bǔ)償單元44可相對(duì)于一或多個(gè)參考幀中的一或多個(gè)塊執(zhí)行所接收視頻塊的幀間預(yù)測(cè)性譯碼以提供時(shí)間預(yù)測(cè)。幀內(nèi)預(yù)測(cè)單元46可替代地相對(duì)于與待譯碼塊相同的幀或切片中的一或多個(gè)相鄰塊執(zhí)行對(duì)所接收的視頻塊的幀內(nèi)預(yù)測(cè)性譯碼以提供空間預(yù)測(cè)。視頻編碼器20可以執(zhí)行多個(gè)譯碼遍次,例如,為了為每一視頻數(shù)據(jù)塊選擇一種適當(dāng)?shù)淖g碼模式。
[0085]此外,分割單元48可以基于前述譯碼遍次中的前述分割方案的評(píng)估將視頻數(shù)據(jù)塊分割成子塊。舉例來說,分割單元48可以首先將幀或切片分割成LCU,并且基于速率失真分析(例如,速率失真優(yōu)化)將LCU中的每一者分割成子CU。模式選擇單元40可以進(jìn)一步產(chǎn)生指示LCU分割成子CU的四叉樹數(shù)據(jù)結(jié)構(gòu)。四叉樹的葉節(jié)點(diǎn)CU可包含一或多個(gè)PU和一或多個(gè)TU。
[0086]模式選擇單元40可以基于錯(cuò)誤結(jié)果選擇譯碼模式中的一者(幀內(nèi)或幀間),并且將所得的經(jīng)幀內(nèi)譯碼或經(jīng)幀間譯碼塊提供到求和器50以便產(chǎn)生殘余塊數(shù)據(jù),并且提供到求和器62以便重建經(jīng)編碼塊用作參考幀。模式選擇單元40還將語法元素(例如運(yùn)動(dòng)向量、幀內(nèi)模式指示符、分割信息和其它這些語法信息)提供到熵編碼單元56。
[0087]運(yùn)動(dòng)估計(jì)單元42和運(yùn)動(dòng)補(bǔ)償單元44可以高度集成,但出于概念目的分開加以圖解說明。由運(yùn)動(dòng)估計(jì)單元42執(zhí)行的運(yùn)動(dòng)估計(jì)是產(chǎn)生運(yùn)動(dòng)向量的過程,所述運(yùn)動(dòng)向量估計(jì)視頻塊的運(yùn)動(dòng)。舉例來說,運(yùn)動(dòng)向量可以指不當(dāng)如視頻巾貞或圖片內(nèi)的視頻塊的PU相對(duì)于參考幀(或其它經(jīng)譯碼單元)內(nèi)的預(yù)測(cè)塊相對(duì)于當(dāng)前幀(或其它經(jīng)譯碼單元)內(nèi)正經(jīng)譯碼的當(dāng)前塊的移位。預(yù)測(cè)性塊是被發(fā)現(xiàn)在像素差方面與待譯碼塊緊密匹配的塊,像素差可通過絕對(duì)差總和(SAD)、平方差總和(SSD)或其它差異度量來確定。在一些實(shí)例中,視頻編碼器20可以計(jì)算存儲(chǔ)在參考幀存儲(chǔ)器64中的參考圖片的子整數(shù)像素位置的值。舉例來說,視頻編碼器20可內(nèi)插四分之一像素位置、八分之一像素位置或參考圖片的其它分?jǐn)?shù)像素位置的值。因此,運(yùn)動(dòng)估計(jì)單元42可以相對(duì)于整數(shù)像素位置和分?jǐn)?shù)像素位置執(zhí)行運(yùn)動(dòng)搜索并且輸出具有分?jǐn)?shù)像素精確度的運(yùn)動(dòng)向量。
[0088]運(yùn)動(dòng)估計(jì)單元42通過比較PU的位置與參考圖片的預(yù)測(cè)性塊的位置來計(jì)算用于經(jīng)幀間譯碼切片中的視頻塊的PU的運(yùn)動(dòng)向量。參考圖片可以選自第一參考圖片列表(列表O)或第二參考圖片列表(列表I),其中的每一者識(shí)別存儲(chǔ)在參考幀存儲(chǔ)器64中的一或多個(gè)參考圖片。運(yùn)動(dòng)估計(jì)單元42將計(jì)算出來的運(yùn)動(dòng)向量發(fā)送到熵編碼單元56和運(yùn)動(dòng)補(bǔ)償單元44。
[0089]運(yùn)動(dòng)補(bǔ)償單元44執(zhí)行的運(yùn)動(dòng)補(bǔ)償可以包括基于運(yùn)動(dòng)估計(jì)單元42確定的運(yùn)動(dòng)向量來取出或生成預(yù)測(cè)性塊。再次,在一些實(shí)例中,運(yùn)動(dòng)估計(jì)單元42與運(yùn)動(dòng)補(bǔ)償單元44可在功能上集成。在接收到當(dāng)前視頻塊的PU的運(yùn)動(dòng)向量后,運(yùn)動(dòng)補(bǔ)償單元44即刻可以在參考圖片列表中的一者中定位所述運(yùn)動(dòng)向量指向的預(yù)測(cè)性塊。求和器50通過從經(jīng)譯碼的當(dāng)前視頻塊的像素值減去預(yù)測(cè)性塊的像素值從而形成像素差值來形成殘余視頻塊,如下文所論述??偟膩碚f,運(yùn)動(dòng)估計(jì)單元42相對(duì)于明度分量執(zhí)行運(yùn)動(dòng)估計(jì),并且運(yùn)動(dòng)補(bǔ)償單元44對(duì)于色度分量和明度分量兩者使用基于明度分量計(jì)算的運(yùn)動(dòng)向量。模式選擇單元40還可產(chǎn)生與視頻塊和視頻切片相關(guān)聯(lián)的供視頻解碼器30在對(duì)視頻切片的視頻塊進(jìn)行解碼時(shí)使用的語法元素。
[0090]作為如上文所描述由運(yùn)動(dòng)估計(jì)單元42和運(yùn)動(dòng)補(bǔ)償單元44執(zhí)行的幀間預(yù)測(cè)的替代方案,幀內(nèi)預(yù)測(cè)單元46可以對(duì)當(dāng)前塊進(jìn)行幀內(nèi)預(yù)測(cè)或計(jì)算。明確地說,幀內(nèi)預(yù)測(cè)單元46可以確定用來對(duì)當(dāng)前塊進(jìn)行編碼的幀內(nèi)預(yù)測(cè)模式。在一些實(shí)例中,幀內(nèi)預(yù)測(cè)單元46可以例如在分開的編碼編次期間使用各種幀內(nèi)預(yù)測(cè)模式對(duì)當(dāng)前塊進(jìn)行編碼,并且?guī)瑑?nèi)預(yù)測(cè)單元46 (或在一些實(shí)例中為模式選擇單元40)可以從所述測(cè)試模式中選擇適當(dāng)幀內(nèi)預(yù)測(cè)模式來使用。
[0091]舉例來說,幀內(nèi)預(yù)測(cè)單元46可以使用速率失真分析計(jì)算用于各種經(jīng)測(cè)試幀內(nèi)預(yù)測(cè)模式的速率失真值,并且從所述經(jīng)測(cè)試模式當(dāng)中選擇具有最佳速率失真特性的幀內(nèi)預(yù)測(cè)模式。速率失真分析總體上確定經(jīng)編碼塊與經(jīng)編碼以產(chǎn)生所述經(jīng)編碼塊的原始未編碼塊之間的失真(或誤差)的量,以及用于產(chǎn)生經(jīng)編碼塊的位率(也就是說,位數(shù)目)。幀內(nèi)預(yù)測(cè)單元46可依據(jù)用于各種經(jīng)編碼塊的失真及速率計(jì)算成本值,以確定哪個(gè)幀內(nèi)預(yù)測(cè)模式對(duì)于所述塊展現(xiàn)最佳的速率-失真值(或最低成本值)。
[0092]在針對(duì)塊選擇幀內(nèi)預(yù)測(cè)模式之后,幀內(nèi)預(yù)測(cè)單元46可將指示用于所述塊的選定幀內(nèi)預(yù)測(cè)模式的信息提供到熵編碼單元56。熵編碼單元56可以對(duì)指示所選幀內(nèi)預(yù)測(cè)模式的信息進(jìn)行編碼。視頻編碼器20在發(fā)射的位流中可包含配置數(shù)據(jù),其可包含多個(gè)幀內(nèi)預(yù)測(cè)模式索引表和多個(gè)修改的巾貞內(nèi)預(yù)測(cè)模式索引表(也稱為碼字映射表),對(duì)用于各種塊的上下文進(jìn)行編碼的定義,和對(duì)最可能幀內(nèi)預(yù)測(cè)模式、幀內(nèi)預(yù)測(cè)模式索引表和修改的幀內(nèi)預(yù)測(cè)模式索引表的指示以用于所述上下文中的每一者。
[0093]視頻編碼器20通過從經(jīng)譯碼原始視頻塊減去來自模式選擇單元40的預(yù)測(cè)數(shù)據(jù)而形成殘余視頻塊。求和器50表示可執(zhí)行此減法運(yùn)算的一或多個(gè)組件。變換處理單元52將例如離散余弦變換(DCT)或概念上類似的變換等變換應(yīng)用于殘余塊,從而產(chǎn)生包括殘余變換系數(shù)值的視頻塊。變換處理單元52可以執(zhí)行概念上類似于DCT的其它變換。還可使用小波變換、整數(shù)變換、子帶變換或其它類型的變換。在任何情況下,變換處理單元52向殘余塊應(yīng)用所述變換,從而產(chǎn)生殘余變換系數(shù)的塊。所述變換可將殘余信息從像素值域轉(zhuǎn)換到變換域,例如頻域。變換處理單元52可將所得變換系數(shù)發(fā)送到量化單元54。量化單元54可量化所述變換系數(shù)以進(jìn)一步減小位率。量化過程可減少與變換系數(shù)中的一些或全部相關(guān)聯(lián)的位深度??赏ㄟ^調(diào)整量化參數(shù)來修改量化程度。在一些實(shí)例中,量化單元54可以接著執(zhí)行對(duì)包含經(jīng)量化變換系數(shù)的矩陣的掃描。或者,熵編碼單元56可以執(zhí)行所述掃描。
[0094]在量化之后,熵編碼單元56對(duì)經(jīng)量化的變換系數(shù)進(jìn)行熵譯碼。舉例來說,熵編碼單元56可以執(zhí)行上下文自適應(yīng)可變長度譯碼(CAVLC)、上下文自適應(yīng)二進(jìn)制算術(shù)譯碼(CABAC)、基于語法的上下文自適應(yīng)二進(jìn)制算術(shù)譯碼(SBAC)、概率區(qū)間分割熵(PIPE)譯碼或另一熵譯碼技術(shù)。就基于上下文的熵譯碼而論,上下文可以基于相鄰塊。在熵編碼單元56的熵譯碼之后,可以將經(jīng)編碼位流發(fā)射到另一裝置(例如視頻解碼器30),或者將所述視頻存檔用于以后發(fā)射或檢索。
[0095]逆量化單元58和逆變換單元60分別應(yīng)用逆量化和逆變換以在像素域中重構(gòu)殘余塊,例如以供稍后用作參考?jí)K。運(yùn)動(dòng)補(bǔ)償單元44可以通過將殘余塊添加到參考幀存儲(chǔ)器64的幀中的一者的預(yù)測(cè)性塊中來計(jì)算參考?jí)K。運(yùn)動(dòng)補(bǔ)償單元44還可將一或多個(gè)內(nèi)插濾波器應(yīng)用于所重構(gòu)的殘余塊以計(jì)算子整數(shù)像素值用于運(yùn)動(dòng)估計(jì)。求和器62將經(jīng)重建的殘余塊添加到由運(yùn)動(dòng)補(bǔ)償單元44產(chǎn)生的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)塊以產(chǎn)生經(jīng)重建視頻塊用于存儲(chǔ)在參考幀存儲(chǔ)器64中。經(jīng)重構(gòu)視頻塊可由運(yùn)動(dòng)估計(jì)單元42和運(yùn)動(dòng)補(bǔ)償單元44使用作為參考?jí)K以對(duì)后續(xù)視頻幀中的塊進(jìn)行幀間譯碼。
[0096]以此方式,圖3的視頻編碼器20表示經(jīng)配置以執(zhí)行本發(fā)明的技術(shù)的視頻編碼器的實(shí)例。舉例來說,視頻編碼器20可組合基層預(yù)測(cè)子與增強(qiáng)層預(yù)測(cè)子以形成最終預(yù)測(cè)子,及基于最終預(yù)測(cè)子執(zhí)行用于當(dāng)前增強(qiáng)層塊的層間預(yù)測(cè)。執(zhí)行層間預(yù)測(cè)可包含執(zhí)行層間紋理預(yù)測(cè)。在組合基層預(yù)測(cè)子與增強(qiáng)層預(yù)測(cè)子時(shí),視頻編碼器20可將第一加權(quán)因數(shù)指派給基層預(yù)測(cè)子,及將第二加權(quán)因數(shù)指派給增強(qiáng)層預(yù)測(cè)子。
[0097]圖4為說明可實(shí)施根據(jù)本發(fā)明中描述的方面的技術(shù)的視頻解碼器的實(shí)例的框圖。視頻解碼器30可經(jīng)配置以執(zhí)行本發(fā)明的技術(shù)中的任一者或全部。作為一個(gè)實(shí)例,運(yùn)動(dòng)補(bǔ)償單元72和/或幀內(nèi)預(yù)測(cè)單元74可經(jīng)配置以執(zhí)行本發(fā)明中描述的技術(shù)中的任一者或全部,例如基于像素位置、BL及EL特性及其類似者確定BL及EL權(quán)重。然而,本發(fā)明的方面不限于此。在一些實(shí)例中,可在視頻解碼器30的各種組件當(dāng)中共享本發(fā)明中描述的技術(shù)。在一些實(shí)例中,另外或替代性地,處理器(未圖示)可經(jīng)配置以執(zhí)行本發(fā)明中描述的技術(shù)中的任一者或全部。
[0098]在圖4的實(shí)例中,視頻解碼器30包含熵解碼單元70、運(yùn)動(dòng)補(bǔ)償單元72、幀內(nèi)預(yù)測(cè)單元74、逆量化單元76、逆變換單元78、參考幀存儲(chǔ)器82及求和器80。在一些實(shí)例中,視頻解碼器30可執(zhí)行大體上與關(guān)于視頻編碼器20 (圖3A)描述的編碼遍次互逆的解碼遍次。運(yùn)動(dòng)補(bǔ)償單元72可基于從熵解碼單元70接收的運(yùn)動(dòng)向量產(chǎn)生預(yù)測(cè)數(shù)據(jù),而幀內(nèi)預(yù)測(cè)單元74可基于從熵解碼單元70接收的幀內(nèi)預(yù)測(cè)模式指示符產(chǎn)生預(yù)測(cè)數(shù)據(jù)。
[0099]在解碼過程期間,視頻解碼器30從視頻編碼器20接收表示經(jīng)編碼視頻切片的視頻塊和相關(guān)聯(lián)語法元素的經(jīng)編碼視頻位流。視頻解碼器30的熵解碼單元70對(duì)位流進(jìn)行熵解碼以產(chǎn)生經(jīng)量化系數(shù)、運(yùn)動(dòng)向量或幀內(nèi)預(yù)測(cè)模式指示符及其它語法元素。熵解碼單元70將運(yùn)動(dòng)向量及其它語法元素轉(zhuǎn)發(fā)到運(yùn)動(dòng)補(bǔ)償單元72。視頻解碼器30可在視頻切片層級(jí)和/或視頻塊層級(jí)處接收語法元素。
[0100]當(dāng)視頻切片經(jīng)譯碼為經(jīng)幀內(nèi)譯碼⑴切片時(shí),幀內(nèi)預(yù)測(cè)單元74可以基于用信號(hào)表示的幀內(nèi)預(yù)測(cè)模式和來自當(dāng)前圖片的先前經(jīng)解碼塊的數(shù)據(jù)產(chǎn)生用于當(dāng)前視頻切片的視頻塊的預(yù)測(cè)數(shù)據(jù)。在視頻幀經(jīng)譯碼為經(jīng)幀間譯碼(例如,B、P或GPB)切片時(shí),運(yùn)動(dòng)補(bǔ)償單元72基于從熵解碼單元70接收的運(yùn)動(dòng)向量及其它語法元素產(chǎn)生用于當(dāng)前視頻切片的視頻塊的預(yù)測(cè)性塊。預(yù)測(cè)性塊可以從參考圖片列表中的一者內(nèi)的參考圖片中的一者產(chǎn)生。視頻解碼器30可以基于存儲(chǔ)在參考圖片存儲(chǔ)器92中的參考圖片使用默認(rèn)建構(gòu)技術(shù)建構(gòu)參考幀列表,即列表O和列表I。運(yùn)動(dòng)補(bǔ)償單元72通過剖析運(yùn)動(dòng)向量和其它語法元素確定用于當(dāng)前視頻切片的視頻塊的預(yù)測(cè)信息,并且使用所述預(yù)測(cè)信息產(chǎn)生用于經(jīng)解碼當(dāng)前視頻塊的預(yù)測(cè)性塊。舉例來說,運(yùn)動(dòng)補(bǔ)償單元72使用一些接收到的語法元素確定用于對(duì)視頻切片的視頻塊進(jìn)行譯碼的預(yù)測(cè)模式(例如,幀內(nèi)預(yù)測(cè)或幀間預(yù)測(cè))、幀間預(yù)測(cè)切片類型(例如,B切片、P切片或GPB切片)、切片的參考圖片列表中的一或多者的建構(gòu)信息、切片的每一經(jīng)幀間編碼的視頻塊的運(yùn)動(dòng)向量、切片的每一經(jīng)幀間譯碼的視頻塊的幀間預(yù)測(cè)狀態(tài)和用以對(duì)當(dāng)前視頻切片中的視頻塊進(jìn)行解碼的其它信息。
[0101]運(yùn)動(dòng)補(bǔ)償單元72還可基于內(nèi)插濾波器執(zhí)行內(nèi)插。運(yùn)動(dòng)補(bǔ)償單元72可使用由視頻編碼器20在視頻塊的編碼期間使用的內(nèi)插濾波器來計(jì)算參考?jí)K的子整數(shù)像素的內(nèi)插值。在此狀況下,運(yùn)動(dòng)補(bǔ)償單元72可根據(jù)接收的語法信息元素而確定由視頻編碼器20使用的內(nèi)插濾波器且使用所述內(nèi)插濾波器來產(chǎn)生預(yù)測(cè)性塊。
[0102]逆量化單元76將在位流中提供且由熵解碼單元80解碼的經(jīng)量化變換系數(shù)逆量化,例如去量化。逆量化過程可包含使用視頻解碼器30針對(duì)視頻切片中的每一視頻塊計(jì)算以確定應(yīng)應(yīng)用的量化程度和同樣逆量化程度的量化參數(shù)QPY。
[0103]逆變換單元78對(duì)變換系數(shù)應(yīng)用逆變換,例如逆DCT、逆整數(shù)變換或概念上類似的逆變換過程,以便產(chǎn)生像素域中的殘余塊。
[0104]在運(yùn)動(dòng)補(bǔ)償單元82基于運(yùn)動(dòng)向量和其它語法元素產(chǎn)生了當(dāng)前視頻塊的預(yù)測(cè)性塊之后,視頻解碼器30通過將來自逆變換單元78的殘余塊與運(yùn)動(dòng)補(bǔ)償單元72產(chǎn)生的對(duì)應(yīng)預(yù)測(cè)性塊求和來形成經(jīng)解碼視頻塊。求和器90表示可以執(zhí)行此求和運(yùn)算的一或多個(gè)組件。必要時(shí),去塊濾波器還可應(yīng)用于對(duì)經(jīng)解碼塊進(jìn)行濾波以便移除成塊假影。其它環(huán)路過濾器(在譯碼環(huán)路中或在譯碼環(huán)路之后)也可用于平滑化像素轉(zhuǎn)變或以其它方式改善視頻質(zhì)量。接著將給定幀或圖片中的經(jīng)解碼視頻塊存儲(chǔ)在參考圖片存儲(chǔ)器92中,參考圖片存儲(chǔ)器92存儲(chǔ)參考圖片用于后續(xù)運(yùn)動(dòng)補(bǔ)償。參考幀存儲(chǔ)器82還存儲(chǔ)經(jīng)解碼視頻用于以后在顯示裝置(例如圖1的顯示裝置32)上呈現(xiàn)。
[0105]以此方式,圖4的視頻解碼器30表示經(jīng)配置以執(zhí)行本發(fā)明的技術(shù)的視頻解碼器的實(shí)例。舉例來說,視頻解碼器30可組合基層預(yù)測(cè)子與增強(qiáng)層預(yù)測(cè)子以形成最終預(yù)測(cè)子,及基于最終預(yù)測(cè)子執(zhí)行用于當(dāng)前增強(qiáng)層塊的層間預(yù)測(cè)。執(zhí)行層間預(yù)測(cè)可包含執(zhí)行層間紋理預(yù)測(cè)。在組合基層預(yù)測(cè)子與增強(qiáng)層預(yù)測(cè)子時(shí),視頻解碼器30可將第一加權(quán)因數(shù)指派給基層預(yù)測(cè)子及將第二加權(quán)因數(shù)指派給增強(qiáng)層預(yù)測(cè)子。在一些情況下,對(duì)于基層預(yù)測(cè)子的所有像素,第一加權(quán)因數(shù)可為常量,及對(duì)于基層預(yù)測(cè)子的所有像素,第二加權(quán)因數(shù)可為常量。
[0106]視頻解碼器30可依據(jù)經(jīng)解碼的增強(qiáng)層塊內(nèi)的像素的特性及BL預(yù)測(cè)子及EL預(yù)測(cè)子的特性等等來確定加權(quán)因數(shù)。視頻解碼器30可經(jīng)配置以類似于上文所描述的視頻編碼器20的方式的方式確定加權(quán)因數(shù)。以此方式,視頻解碼器30可確定用以對(duì)視頻塊進(jìn)行編碼而不需要例如關(guān)于使用哪些權(quán)重的數(shù)據(jù)等額外數(shù)據(jù)的相同或?qū)嵸|(zhì)上類似的加權(quán)參數(shù)。
[0107]如上文關(guān)于視頻編碼器20所描述,第一加權(quán)因數(shù)可依據(jù)像素位置而變化,且第二加權(quán)因數(shù)可依據(jù)像素位置而變化。舉例來說,對(duì)于在當(dāng)前增強(qiáng)層塊的邊界處或靠近于所述邊界的像素,第二加權(quán)因數(shù)可大于第一加權(quán)因數(shù)。對(duì)于并非在當(dāng)前增強(qiáng)層塊的邊界處及并非靠近于所述邊界的像素,第一加權(quán)因數(shù)可大于第二加權(quán)因數(shù)??捎梢曨l解碼器30基于當(dāng)前增強(qiáng)層塊的幀內(nèi)預(yù)測(cè)方向來確定哪些建構(gòu)靠近于邊界的確定。
[0108]視頻解碼器30還可依據(jù)像素與當(dāng)前增強(qiáng)塊的邊界之間的距離確定第一加權(quán)因數(shù)。對(duì)于更靠近于邊界的像素,第二加權(quán)因數(shù)通常可增加,且對(duì)于距邊界較遠(yuǎn)的像素,第一加權(quán)因數(shù)通常增加。
[0109]視頻解碼器30還可以類似于上文關(guān)于圖3所描述的方式的方式基于基層預(yù)測(cè)子的量化參數(shù)及增強(qiáng)層預(yù)測(cè)子的量化參數(shù)確定第一加權(quán)因數(shù)及第二加權(quán)因數(shù)。
[0110]視頻解碼器30還可基于縮放比選擇第一加權(quán)因數(shù)及第二加權(quán)因數(shù)。舉例來說,較大縮放比通??蓪?duì)應(yīng)于第二加權(quán)因數(shù)的較高值。
[0111]現(xiàn)轉(zhuǎn)而參看圖5,如下描述了用于H.264譯碼器中的空間預(yù)測(cè)(即幀內(nèi)預(yù)測(cè))的實(shí)例。為了執(zhí)行空間預(yù)測(cè),H.264譯碼器提供用于預(yù)測(cè)4x4塊的9個(gè)模式,包含DC預(yù)測(cè)(模式O)及標(biāo)記為I到8的8個(gè)方向模式,如圖5中所示。圖6中說明預(yù)測(cè)過程。如圖6中所示,將對(duì)塊600中從a到P的像素進(jìn)行編碼,且來自相鄰塊602到608的像素A到R已經(jīng)進(jìn)行編碼且可用于預(yù)測(cè)。如果例如選擇模式1,那么像素a、e、i及m是通過將其設(shè)定成等于像素A來預(yù)測(cè)的,且像素b、f、j及η是通過將其設(shè)定成等于像素B來預(yù)測(cè)的,等等。類似地,如果選擇模式2,那么像素a、b、c及d是通過將其設(shè)定成等于像素I來預(yù)測(cè)的,且像素e、f、g及h是通過將其設(shè)定成等于像素J來預(yù)測(cè)的,等等。因此,在此實(shí)例中,模式I為在垂直方向上的預(yù)測(cè)子;及模式2為在水平方向上的預(yù)測(cè)子。
[0112]圖5和6中所說明幀內(nèi)模式定義及實(shí)例僅為說明性的,及并不意欲為限制性的??墒褂闷渌鼛瑑?nèi)模式定義,例如HEVC中的定義。在HEVC中,預(yù)測(cè)模式的數(shù)目進(jìn)一步增加。舉例來說,35個(gè)預(yù)測(cè)模式分別可以用于4x4塊、8x8塊及更大的塊。HEVC中針對(duì)每一模式定義的模式索引也可為不同的。舉例來說,在HEVC中,平面預(yù)測(cè)被定義為模式O及DC預(yù)測(cè)被定義為模式I。
[0113]在如幀內(nèi)BL模式中所描述的層間紋理預(yù)測(cè)中,來自基層塊的經(jīng)重建構(gòu)紋理可以用作用以預(yù)測(cè)對(duì)應(yīng)增強(qiáng)層塊的紋理的預(yù)測(cè)子。然而,在某些狀況下,在來自基層塊的經(jīng)重建構(gòu)紋理中并非所有的像素為用于增強(qiáng)層塊中的對(duì)應(yīng)像素的最佳或優(yōu)選預(yù)測(cè)子。所屬領(lǐng)域內(nèi)的當(dāng)前方案并不提供在形成用于增強(qiáng)層塊的預(yù)測(cè)子時(shí)僅使用像素的一部分或減輕來自基層的像素的一部分的權(quán)重的靈活性。本發(fā)明描述了用于使得此靈活性能夠達(dá)成較好譯碼效率的技術(shù)。
[0114]在一些實(shí)施例中,可使用預(yù)測(cè)子的常量加權(quán)組合。根據(jù)此技術(shù),可在EL預(yù)測(cè)子Pe與BL預(yù)測(cè)子Pb組合從而形成最終預(yù)測(cè)子Pf時(shí)分別將某些加權(quán)指派給EL預(yù)測(cè)子Pe及BL預(yù)測(cè)子Pb。對(duì)于預(yù)測(cè)子內(nèi)的所有像素,此些加權(quán)可為常量。舉例來說,可基于以下等式而形成最終預(yù)測(cè)子。
[0115]Pf = cl*Pb+c2*Pe (I)
[0116]在等式(I)中,Cl及c2表示加權(quán)系數(shù)。Cl及c2的總和可等于常量,例如I。對(duì)于Pb及Pe內(nèi)的所有像素,Cl及c2兩者可保持為常量。
[0117]在一些實(shí)施例中,用于每一預(yù)測(cè)子的加權(quán)系數(shù)可基于像素位置而變化,而不是使用常量加權(quán)。舉例來說,對(duì)于預(yù)測(cè)子內(nèi)的不同像素位置,加權(quán)系數(shù)可不同。更確切地說,可基于以下等式形成最終預(yù)測(cè)子。
[0118]Pf [i, j] = cl[i, j]*Pb[i, j]+c2[i, j]*Pe[i, j] (2)
[0119]在等式(2)中,i及j表示分別指示行及列的在預(yù)測(cè)子內(nèi)的二維坐標(biāo)。加權(quán)參數(shù)Cl及c2可在不同位置[i,j]處不同。然而,cl[i,j]及c2[i,j]的總和可等于常量,例如I?;诘仁?2),如果cl[i,j] = I且c2[i,j] =0,那么最終預(yù)測(cè)子中的對(duì)應(yīng)像素全部由BL預(yù)測(cè)子中的像素形成。或者,如果cl[i,j] =0且c2[i,j] = 1,那么最終預(yù)測(cè)子中的對(duì)應(yīng)像素全部由EL預(yù)測(cè)子中的像素形成。
[0120]在一些實(shí)施例中,在使用幀內(nèi)預(yù)測(cè)形成EL預(yù)測(cè)子時(shí),位于當(dāng)前EL層塊(例如,當(dāng)前正譯碼的塊)的邊界處且靠近于經(jīng)重建構(gòu)像素的相鄰塊的在EL預(yù)測(cè)子中的像素可在其與BL預(yù)測(cè)子組合以形成最終預(yù)測(cè)子時(shí)被給予較高加權(quán)。對(duì)于其它像素位置,可將較高加權(quán)給予來自BL預(yù)測(cè)子的像素。
[0121]在增強(qiáng)層處的經(jīng)重建構(gòu)像素通常比在基層處的對(duì)應(yīng)像素更準(zhǔn)確(例如,具有更接近于其原始像素值的值)。結(jié)果,在EL預(yù)測(cè)子中,歸因于相鄰像素之間的強(qiáng)相關(guān),位于靠近于相鄰塊的經(jīng)重建構(gòu)像素處的像素可用以產(chǎn)生較高質(zhì)量預(yù)測(cè)(例如,EL預(yù)測(cè)子可被給予比對(duì)應(yīng)BL預(yù)測(cè)子高的權(quán)重)。然而,對(duì)于位于距用于預(yù)測(cè)的相鄰塊經(jīng)重建構(gòu)像素很遠(yuǎn)處的在EL預(yù)測(cè)子中的其它像素,預(yù)測(cè)質(zhì)量可在一些情況下較低。在這些情況下,BL預(yù)測(cè)子可用以產(chǎn)生較高質(zhì)量最終預(yù)測(cè)子(例如,BL預(yù)測(cè)子可被給予比對(duì)應(yīng)EL預(yù)測(cè)子高的權(quán)重)。
[0122]圖7中說明此想法。在圖7中,EL塊700為待預(yù)測(cè)及譯碼的當(dāng)前EL塊。區(qū)域720 (用“/”線條圖形標(biāo)記)為可用于預(yù)測(cè)當(dāng)前EL塊700的相鄰EL塊702到708的經(jīng)重建構(gòu)像素區(qū)域。展示為陰影的區(qū)域710為靠近于相鄰EL塊702到708的區(qū)域,其中可將相對(duì)較高加權(quán)指派給EL預(yù)測(cè)子。舉例來說,基于等式(2),對(duì)于陰影區(qū)域710中的像素來說,cl[i,j]可小于0.5,且c2[i,j]大于0.5。對(duì)于陰影區(qū)域710內(nèi)的在相鄰EL塊702到708的邊界上的像素來說,cl[i,j]可取值0,且c2[i,j]取值1,使得最終預(yù)測(cè)子中的預(yù)測(cè)值全部基于用于這些像素的EL預(yù)測(cè)子。
[0123]圖7中所示的狀況僅為實(shí)例,且并不意欲為限制性的。實(shí)際上,陰影區(qū)域710的形狀可自適應(yīng)地定義,例如基于為當(dāng)前塊700選定的幀內(nèi)預(yù)測(cè)方向。圖8A及8B說明兩個(gè)其它實(shí)例,其中陰影區(qū)域可不同地定義。圖8A說明其中預(yù)測(cè)方向?yàn)榇怪钡臓顩r。在此狀況下,較高加權(quán)可被給予在垂直方向上實(shí)質(zhì)上在相鄰EL塊的邊界上或靠近所述邊界的在陰影區(qū)域810a中的像素的EL預(yù)測(cè)子。圖SB展示其中預(yù)測(cè)方向?yàn)樗降膶?shí)例。在此狀況下,較高加權(quán)可被給予在水平方向上實(shí)質(zhì)上在相鄰EL塊的邊界上或靠近所述邊界的在陰影區(qū)域810b中的像素的EL預(yù)測(cè)子。
[0124]盡管在上文所描述的實(shí)例中指示陰影區(qū)域,但加權(quán)參數(shù)在陰影區(qū)域之內(nèi)或之外仍可變化。陰影區(qū)域僅用作用以說明其中可在形成最終預(yù)測(cè)子時(shí)將比BL預(yù)測(cè)子多的加權(quán)給予EL預(yù)測(cè)子的區(qū)的實(shí)例。在一些實(shí)施例中,用于某一像素位置的加權(quán)因數(shù)可基于幀內(nèi)預(yù)測(cè)方向及基本上像素位置距用于預(yù)測(cè)的對(duì)應(yīng)邊界像素的距離來確定。舉例來說,對(duì)于某一像素位置的較短距離來說,可將較高加權(quán)因數(shù)指派給EL預(yù)測(cè)子中的對(duì)應(yīng)像素。
[0125]在額外實(shí)施例中,可使用基于量化參數(shù)或空間縮放比的預(yù)測(cè)子的加權(quán)組合。在確定用于組合來自基層及增強(qiáng)層的預(yù)測(cè)子的系數(shù)(例如,加權(quán)參數(shù))時(shí),也可考慮量化參數(shù)(QP)0總的來說,QP值越低,預(yù)測(cè)子的質(zhì)量越高。結(jié)果,如果增強(qiáng)層塊具有與用于基層塊中的QP相比顯著較低的QP,那么可在形成用于當(dāng)前增強(qiáng)層塊的最終預(yù)測(cè)子時(shí)將更多的加權(quán)指派給EL預(yù)測(cè)子。舉例來說,基層塊與增強(qiáng)層塊之間的QP差可以用作用于確定加權(quán)參數(shù)的因數(shù)。
[0126]也可在確定加權(quán)參數(shù)時(shí)考慮空間縮放比。在空間可縮放性中,增強(qiáng)幀具有比基層幀高的空間分辨率。在此狀況下,在基層經(jīng)重建構(gòu)紋理可用作用于對(duì)應(yīng)增強(qiáng)層塊的預(yù)測(cè)子之前必須相應(yīng)地對(duì)基層經(jīng)重建構(gòu)紋理進(jìn)行升取樣。紋理質(zhì)量可在升取樣過程期間降級(jí)。較大的縮放比通常產(chǎn)生質(zhì)量的較大降級(jí)。因此,縮放比可被認(rèn)為是用于確定加權(quán)參數(shù)的因數(shù)??偟膩碚f,縮放比越大,在產(chǎn)生最終預(yù)測(cè)子時(shí)就越應(yīng)將更多權(quán)重指派給EL預(yù)測(cè)子。
[0127]對(duì)于迄今所描述的技術(shù),可取決于某些條件或內(nèi)容而隱含地確定或?qū)С黾訖?quán)參數(shù)。以此方式,在編碼器及解碼器兩者皆使用相同方案來導(dǎo)出加權(quán)參數(shù)時(shí),針對(duì)加權(quán)參數(shù)的從編碼器到解碼器的額外發(fā)信號(hào)可能并非所需要的。
[0128]如上文所描述,用以隱含地導(dǎo)出加權(quán)參數(shù)的條件或內(nèi)容可包含幀內(nèi)預(yù)測(cè)方向(或幀內(nèi)模式)、像素位置距用于預(yù)測(cè)的對(duì)應(yīng)邊界像素的距離、基層QP及增強(qiáng)層QP以及不同層之間的空間縮放比。也可使用其它因數(shù),例如運(yùn)動(dòng)向量差、塊大小等。
[0129]作為加權(quán)參數(shù)的隱含導(dǎo)出的替代方案,編碼器還可將某些信息用信號(hào)發(fā)出到解碼器以用于確定加權(quán)參數(shù)。舉例來說,編碼器可用信號(hào)發(fā)出當(dāng)前塊中的坐標(biāo)以指示應(yīng)如何計(jì)算加權(quán)參數(shù)。
[0130]圖9中提供實(shí)例。在幀內(nèi)預(yù)測(cè)方向?yàn)榇怪睍r(shí),可將行坐標(biāo)910用信號(hào)發(fā)出到解碼器,所述行坐標(biāo)指示其中相等加權(quán)(例如,0.5)經(jīng)指派于EL預(yù)測(cè)子與BL預(yù)測(cè)子之間的位置。假定頂部行具有來自EL預(yù)測(cè)子的加權(quán)I ( S卩,來自BL的加權(quán)O),且底部行具有來自BL預(yù)測(cè)子的加權(quán)I (即,來自EL的加權(quán)O),因此可基于某一方案(例如線性內(nèi)插法)來內(nèi)插用于當(dāng)前增強(qiáng)層塊900內(nèi)的所有其它像素位置的加權(quán)參數(shù)??稍陬A(yù)測(cè)方向?yàn)樗綍r(shí)應(yīng)用相同技術(shù)。此想法可擴(kuò)展到二維狀況。在一些實(shí)施例中,可將行及列坐標(biāo)兩者用信號(hào)發(fā)出到解碼器,使得以二維方式執(zhí)行加權(quán)參數(shù)的內(nèi)插。在一些實(shí)施例中,行和/或列坐標(biāo)并不指示給予BL預(yù)測(cè)子及EL預(yù)測(cè)子的加權(quán)均勻的點(diǎn),而是可指示用于BL預(yù)測(cè)子或EL預(yù)測(cè)子的加權(quán)將形成用于最終預(yù)測(cè)子的整個(gè)基底的點(diǎn)。在此類狀況下,指派給位置的剩余部分的權(quán)重可以類似方式進(jìn)行推斷。
[0131]現(xiàn)轉(zhuǎn)而參看圖10,將描述用于對(duì)視頻進(jìn)行譯碼的說明性過程??稍诒疚闹兴枋龅难b置(例如,源裝置12或目的地裝置14)中的一或多者中實(shí)施過程。
[0132]過程在框1002處開始,其中接收數(shù)字視頻的第一層及數(shù)字視頻的第二層。在由目的地裝置14或某一其它解碼器實(shí)施時(shí),可經(jīng)由有線和/或無線裝置(例如,USB、PSTN、以太網(wǎng)、蜂窩式電話、衛(wèi)星、WiF1、藍(lán)牙等)將層發(fā)射為數(shù)字信號(hào)??蓡为?dú)地或作為相同發(fā)射的一部分接收層。在一些實(shí)施例中,可直接從源裝置12或經(jīng)由一或多個(gè)中間裝置從源裝置接收層。也可接收多個(gè)源裝置接收層或其部分。接收過程還可包含將接收的層存儲(chǔ)于存儲(chǔ)器中。
[0133]在一些實(shí)施例中,過程可由源裝置12或一些其它編碼器實(shí)施。在一些狀況下,可從存儲(chǔ)器獲得包含第一層及第二層的數(shù)字視頻(例如,存儲(chǔ)于磁盤、DVD、藍(lán)光光盤等上的視頻)。存儲(chǔ)器可包含于實(shí)施所述過程的裝置中,或存儲(chǔ)器可為可由實(shí)施所述方法的裝置接入的單獨(dú)的裝置(例如,聯(lián)網(wǎng)存儲(chǔ)裝置)。在一些實(shí)施例中,可從傳感器(例如,相機(jī))獲得數(shù)字視頻。
[0134]在框1004處,實(shí)施所述過程的裝置可確定與第一層相關(guān)聯(lián)的預(yù)測(cè)子(例如,基層預(yù)測(cè)子)及與第二層相關(guān)聯(lián)的預(yù)測(cè)子(例如,增強(qiáng)層預(yù)測(cè)子)的權(quán)重。舉例來說,目的地裝置14可基于加權(quán)的EL預(yù)測(cè)子及BL預(yù)測(cè)子從所述視頻的特定幀解碼增強(qiáng)層塊??梢呀?jīng)對(duì)相鄰EL塊進(jìn)行解碼。對(duì)于靠近相鄰塊的像素,解碼器可將比指派給對(duì)應(yīng)BL預(yù)測(cè)子(例如,基層中的并置預(yù)測(cè)子)的權(quán)重大的權(quán)重指派給所述像素的EL預(yù)測(cè)子。對(duì)于距先前經(jīng)解碼相鄰EL塊很遠(yuǎn)的像素,解碼器可將比指派給EL預(yù)測(cè)子的權(quán)重大的權(quán)重指派給對(duì)應(yīng)于像素的BL預(yù)測(cè)子。下文關(guān)于圖11描述用于基于像素位置將權(quán)重指派給EL及BL預(yù)測(cè)子的說明性過程。在確定權(quán)重時(shí)也可考慮其它因數(shù)。舉例來說,可考慮預(yù)測(cè)方向。在此類狀況下,與靠近于相鄰塊但并不與當(dāng)前預(yù)測(cè)方向一致的像素相關(guān)聯(lián)的EL預(yù)測(cè)子可能不一定被指派大于對(duì)應(yīng)BL預(yù)測(cè)子的權(quán)重??梢钥紤]的其它因數(shù)包含QP值、空間縮放比及其類似者。下文關(guān)于圖12描述用于基于EL及BL特性將權(quán)重指派給EL及BL預(yù)測(cè)子的說明性過程。
[0135]在框1006處,實(shí)施所述過程的裝置可基于框1004中所確定的加權(quán)預(yù)測(cè)子對(duì)增強(qiáng)層視頻單元(例如,塊或像素)進(jìn)行譯碼。舉例來說,根據(jù)上文所描述的等式(I)及(2),用以對(duì)特定增強(qiáng)層像素進(jìn)行解碼的最終預(yù)測(cè)子可基于對(duì)應(yīng)于像素的EL預(yù)測(cè)子與同EL預(yù)測(cè)子相關(guān)聯(lián)的權(quán)重的乘積,并且還基于對(duì)應(yīng)于像素的BL預(yù)測(cè)子與同BL預(yù)測(cè)子相關(guān)聯(lián)的權(quán)重的乘積??蓪?duì)相應(yīng)加權(quán)的預(yù)測(cè)子進(jìn)行求和以提供用于特定像素的最終預(yù)測(cè)子。
[0136]圖11說明用于基于EL塊內(nèi)或相對(duì)于經(jīng)先前譯碼相鄰EL塊的像素位置將權(quán)重指派給EL及BL預(yù)測(cè)子的過程。過程可實(shí)施于本文中所描述的裝置(例如,源裝置12的視頻編碼器20或目的地裝置14的視頻解碼器)中的一或多者中。
[0137]過程在框1102處開始,其中確定了 EL中的特定像素的位置。確切地說,在用于當(dāng)前EL塊的預(yù)測(cè)方向上從所述位置到經(jīng)先前譯碼EL塊(例如,鄰近于當(dāng)前正譯碼的EL塊的EL塊)中的像素的距離可與被給予EL預(yù)測(cè)子的權(quán)重成反比。
[0138]在框1104處,執(zhí)行過程的裝置可基于位置及距經(jīng)先前譯碼EL塊的距離將權(quán)重指派給用于當(dāng)前像素(或行,或列)的EL預(yù)測(cè)子,如上文所確定的。示意性地,指派給EL預(yù)測(cè)子的權(quán)重可接近或等于1,其中當(dāng)前像素在預(yù)測(cè)方向上與經(jīng)先前譯碼像素直接相鄰。EL預(yù)測(cè)子可隨著在預(yù)測(cè)方向上的當(dāng)前像素與經(jīng)先前譯碼像素之間的距離增加而變小或接近零。
[0139]在框1106處,執(zhí)行所述過程的裝置可基于指派給EL預(yù)測(cè)子的權(quán)重將權(quán)重指派給BL預(yù)測(cè)子。示意性地,任何像素的指派給EL預(yù)測(cè)子及BL預(yù)測(cè)子的權(quán)重可加總為常量,例如I。在一些實(shí)施例中,基于當(dāng)前EL像素的位置指派BL預(yù)測(cè)子的權(quán)重,及指派給EL預(yù)測(cè)子的權(quán)重是基于指派給BL預(yù)測(cè)子的權(quán)重。
[0140]在框1108處,執(zhí)行所述過程的裝置可針對(duì)當(dāng)前EL塊中的每一像素重復(fù)確定像素位置及基于所述位置指派權(quán)重的過程。
[0141]圖12說明用于基于基層及增強(qiáng)層的特性確定或指派BL及EL預(yù)測(cè)子權(quán)重的過程。可在本文中所描述的裝置(例如,源裝置12或目的地裝置14)中的一或多者中實(shí)施過程。
[0142]過程在框1202處開始,其中確定基層及增強(qiáng)層的相關(guān)特性。特性可為量化參數(shù)、縮放因數(shù)或與加權(quán)預(yù)測(cè)子相關(guān)的一些其它特性。
[0143]在框1204處,基于上文確定的特性確定或指派EL預(yù)測(cè)子的權(quán)重。舉例來說,如果增強(qiáng)層及基層的量化參數(shù)或縮放因數(shù)之間的差別很大,那么可指派相對(duì)較大的EL預(yù)測(cè)子權(quán)重。此大差別可指示經(jīng)先前譯碼EL塊為當(dāng)前EL塊提供比BL塊更好的預(yù)測(cè)子,因?yàn)槔鏐L塊的質(zhì)量可顯著低于EL塊的質(zhì)量。
[0144]在框1206處,執(zhí)行所述過程的裝置可基于指派給EL預(yù)測(cè)子的權(quán)重將權(quán)重指派給BL預(yù)測(cè)子。示意性地,指派給EL預(yù)測(cè)子及BL預(yù)測(cè)子的權(quán)重可加總為常量,例如I。在一些實(shí)施例中,基于EL塊及BL塊的特性指派BL預(yù)測(cè)子的權(quán)重,及指派給EL預(yù)測(cè)子的權(quán)重是基于指派給BL預(yù)測(cè)子的權(quán)重。
[0145]在一或多個(gè)實(shí)例中,所描述功能可以硬件、軟件、固件或其任何組合來實(shí)施。如果用軟件實(shí)施,則所述功能可作為一或多個(gè)指令或代碼在計(jì)算機(jī)可讀媒體上存儲(chǔ)或傳輸,且由基于硬件的處理單元執(zhí)行。計(jì)算機(jī)可讀媒體可包含計(jì)算機(jī)可讀存儲(chǔ)媒體,其對(duì)應(yīng)于有形媒體,例如數(shù)據(jù)存儲(chǔ)媒體,或包含任何促進(jìn)將計(jì)算機(jī)程序從一處傳送到另一處的媒體(例如,根據(jù)一種通信協(xié)議)的通信媒體。以此方式,計(jì)算機(jī)可讀媒體大體上可對(duì)應(yīng)于(I)有形計(jì)算機(jī)可讀存儲(chǔ)媒體,其是非暫時(shí)形的,或(2)通信媒體,例如信號(hào)或載波。數(shù)據(jù)存儲(chǔ)媒體可以是可由一或多個(gè)計(jì)算機(jī)或一或多個(gè)處理器存取以檢索用于實(shí)施本發(fā)明中描述的技術(shù)的指令、代碼和/或數(shù)據(jù)結(jié)構(gòu)的任何可用的媒體。計(jì)算機(jī)程序產(chǎn)品可包括計(jì)算機(jī)可讀媒體。
[0146]借助于實(shí)例而非限制,此類計(jì)算機(jī)可讀存儲(chǔ)媒體可包括RAM、ROM、EEPROM、CD-ROM或其它光盤存儲(chǔ)裝置、磁盤存儲(chǔ)裝置或其它磁性存儲(chǔ)裝置、快閃存儲(chǔ)器或任何其它可用來存儲(chǔ)指令或數(shù)據(jù)結(jié)構(gòu)的形式的期望程序代碼并且可由計(jì)算機(jī)存取的媒體。而且,可恰當(dāng)?shù)貙⑷魏芜B接稱作計(jì)算機(jī)可讀媒體。舉例來說,如果使用同軸電纜、光纖纜線、雙絞線、數(shù)字訂戶線(DSL)或例如紅外線、無線電和微波等無線技術(shù)從網(wǎng)站、服務(wù)器或其它遠(yuǎn)程源傳輸指令,那么同軸電纜、光纖纜線、雙絞線、DSL或例如紅外線、無線電和微波等無線技術(shù)包含在媒體的定義中。然而,應(yīng)理解,所述計(jì)算機(jī)可讀存儲(chǔ)媒體和數(shù)據(jù)存儲(chǔ)媒體并不包含連接、載波、信號(hào)或其它暫時(shí)媒體,而是實(shí)際上針對(duì)于非暫時(shí)性有形存儲(chǔ)媒體。如本文所使用,磁盤和光盤包含壓縮光盤(CD)、激光光盤、光學(xué)光盤、數(shù)字多功能光盤(DVD)、軟性磁盤和藍(lán)光光盤,其中磁盤通常以磁性方式再現(xiàn)數(shù)據(jù),而光盤用激光以光學(xué)方式再現(xiàn)數(shù)據(jù)。以上各者的組合也應(yīng)包含在計(jì)算機(jī)可讀媒體的范圍內(nèi)。
[0147]指令可以由一或多個(gè)處理器執(zhí)行,所述一或多個(gè)處理器例如是一或多個(gè)數(shù)字信號(hào)處理器(DSP)、通用微處理器、專用集成電路(ASIC)、現(xiàn)場(chǎng)可編程邏輯陣列(FPGA)、或其它等效的集成或離散邏輯電路。因此,如本文中所使用的術(shù)語“處理器”可指上述結(jié)構(gòu)或適合于實(shí)施本文中所描述的技術(shù)的任一其它結(jié)構(gòu)中的任一者。另外,在一些方面中,本文所述的功能性可以在經(jīng)配置用于編碼和解碼的專用硬件和/或軟件模塊內(nèi)提供,或者并入在組合編解碼器中。并且,可將所述技術(shù)完全實(shí)施于一或多個(gè)電路或邏輯元件中。
[0148]本發(fā)明的技術(shù)可在廣泛多種裝置或設(shè)備中實(shí)施,包含無線手持機(jī)、集成電路(IC)或一組IC(例如,芯片組)。本發(fā)明中描述各種組件、模塊或單元是為了強(qiáng)調(diào),其經(jīng)配置以執(zhí)行所揭示的技術(shù)的裝置的功能方面,但未必需要通過不同硬件單元實(shí)現(xiàn)。實(shí)際上,如上文所描述,各種單元可以配合合適的軟件和/或固件組合在一個(gè)編解碼器硬件單元中,或者通過互操作硬件單元的集合來提供,所述硬件單元包含如上文所描述的一或多個(gè)處理器。
[0149]已描述各種實(shí)例。這些及其它實(shí)例在所附權(quán)利要求書的范圍內(nèi)。
【權(quán)利要求】
1.一種用于對(duì)數(shù)字視頻進(jìn)行譯碼的設(shè)備,所述設(shè)備包括: 存儲(chǔ)器,其經(jīng)配置以存儲(chǔ)與基層及對(duì)應(yīng)增強(qiáng)層相關(guān)聯(lián)的視頻信息;及 與所述存儲(chǔ)器通信的處理器,所述處理器經(jīng)配置以: 至少部分基于所述視頻信息確定與所述基層中的視頻單元相關(guān)聯(lián)的第一權(quán)重及與所述增強(qiáng)層中的視頻單元相關(guān)聯(lián)的第二權(quán)重;及 至少部分基于所述第一和第二權(quán)重對(duì)所述增強(qiáng)層中的所述視頻單元進(jìn)行譯碼。
2.根據(jù)權(quán)利要求1所述的設(shè)備,其中所述第一和第二權(quán)重中的至少一者不等于I。
3.根據(jù)權(quán)利要求1所述的設(shè)備,其中所述處理器經(jīng)進(jìn)一步配置以至少部分基于最終預(yù)測(cè)子對(duì)所述增強(qiáng)層中的所述視頻單元進(jìn)行譯碼,且其中所述最終預(yù)測(cè)子包括根據(jù)所述第一權(quán)重加權(quán)的基層預(yù)測(cè)子與根據(jù)所述第二權(quán)重加權(quán)的增強(qiáng)層預(yù)測(cè)子的組合。
4.根據(jù)權(quán)利要求3所述的設(shè)備,其中對(duì)于經(jīng)組合以確定用于當(dāng)前增強(qiáng)層塊的最終預(yù)測(cè)子的所有基層預(yù)測(cè)子及增強(qiáng)層預(yù)測(cè)子,所述第一權(quán)重及所述第二權(quán)重加總為預(yù)定常量。
5.根據(jù)權(quán)利要求1所述的設(shè)備,其中對(duì)于在預(yù)測(cè)方向上實(shí)質(zhì)上鄰近于經(jīng)先前譯碼增強(qiáng)層塊的增強(qiáng)層視頻單元來說,所述第二權(quán)重大于所述第一權(quán)重。
6.根據(jù)權(quán)利要求1所述的設(shè)備,其中對(duì)于在預(yù)測(cè)方向上距經(jīng)先前譯碼增強(qiáng)層塊最遠(yuǎn)的增強(qiáng)層視頻單元來說,所述第一權(quán)重大于所述第二權(quán)重。
7.根據(jù)權(quán)利要求1所述的設(shè)備,其中所述視頻信息包括幀內(nèi)預(yù)測(cè)方向、像素位置、量化參數(shù)及空間縮放比中的一或多者。
8.根據(jù)權(quán)利要求7所述的設(shè)備,其中依據(jù)所述基層的量化參數(shù)QPl及所述增強(qiáng)層的量化參數(shù)QP2兩者確定所述第二權(quán)重。
9.根據(jù)權(quán)利要求8所述的設(shè)備,其中所述第二權(quán)重通常隨著QP1-QP2的值增加而增加。
10.根據(jù)權(quán)利要求7所述的設(shè)備,其中依據(jù)所述空間縮放比確定所述第二權(quán)重。
11.根據(jù)權(quán)利要求10所述的設(shè)備,其中所述第二權(quán)重通常隨著所述空間縮放比增加而增加。
12.根據(jù)權(quán)利要求1所述的設(shè)備,其中所述增強(qiáng)層中的所述視頻單元包括在當(dāng)前增強(qiáng)層塊中的像素,且其中依據(jù)在預(yù)測(cè)方向上在所述像素與相鄰增強(qiáng)層塊的邊界之間的距離確定所述第二權(quán)重。
13.根據(jù)權(quán)利要求12所述的設(shè)備,其中對(duì)于更靠近于所述邊界的像素,所述第二權(quán)重通常增加,且對(duì)于距所述邊界較遠(yuǎn)的像素,所述第一權(quán)重通常增加。
14.根據(jù)權(quán)利要求1所述的設(shè)備,其中所述視頻信息并不包括所述第一和第二權(quán)重。
15.根據(jù)權(quán)利要求1所述的設(shè)備,其中所述視頻信息包括關(guān)于所述第一和第二權(quán)重的加權(quán)數(shù)據(jù)。
16.根據(jù)權(quán)利要求15所述的設(shè)備,其中所述加權(quán)數(shù)據(jù)包括在當(dāng)前增強(qiáng)層塊內(nèi)的位置,在所述位置處所述第一權(quán)重及所述第二權(quán)重相等。
17.根據(jù)權(quán)利要求16所述的設(shè)備,其中所述處理器經(jīng)進(jìn)一步配置以至少部分基于所述第一和第二權(quán)重相等的所述位置確定與所述當(dāng)前增強(qiáng)層塊相關(guān)聯(lián)的多個(gè)視頻單元的所述第一和第二權(quán)重。
18.根據(jù)權(quán)利要求1所述的設(shè)備,其中對(duì)數(shù)字視頻進(jìn)行譯碼包括對(duì)數(shù)字視頻進(jìn)行編碼。
19.根據(jù)權(quán)利要求1所述的設(shè)備,其中對(duì)數(shù)字視頻進(jìn)行譯碼包括對(duì)數(shù)字視頻進(jìn)行解碼。
20.一種對(duì)數(shù)字視頻進(jìn)行譯碼的方法,所述方法包括: 獲得與基層及對(duì)應(yīng)增強(qiáng)層相關(guān)聯(lián)的視頻信息; 至少部分基于所述視頻信息確定與所述基層中的視頻單元相關(guān)聯(lián)的第一權(quán)重及與所述增強(qiáng)層中的視頻單元相關(guān)聯(lián)的第二權(quán)重;及 至少部分基于所述第一和第二權(quán)重對(duì)所述增強(qiáng)層中的所述視頻單元進(jìn)行譯碼。
21.根據(jù)權(quán)利要求20所述的方法,其中對(duì)所述增強(qiáng)層中的所述視頻單元進(jìn)行譯碼至少部分基于最終預(yù)測(cè)子,且其中所述最終預(yù)測(cè)子包括根據(jù)所述第一權(quán)重加權(quán)的基層預(yù)測(cè)子與根據(jù)所述第二權(quán)重加權(quán)的增強(qiáng)層預(yù)測(cè)子的組合。
22.根據(jù)權(quán)利要求21所述的方法,其中對(duì)于經(jīng)組合以確定用于當(dāng)前增強(qiáng)層塊的最終預(yù)測(cè)子的所有基層預(yù)測(cè)子及增強(qiáng)層預(yù)測(cè)子,所述第一權(quán)重及所述第二權(quán)重加總為預(yù)定常量。
23.根據(jù)權(quán)利要求20所述的方法,其中對(duì)于實(shí)質(zhì)上鄰近于經(jīng)先前譯碼增強(qiáng)層塊的增強(qiáng)層視頻單元來說,所述第二權(quán)重大于所述第一權(quán)重。
24.根據(jù)權(quán)利要求20所述的方法,其中對(duì)于距經(jīng)先前譯碼增強(qiáng)層塊最遠(yuǎn)的增強(qiáng)層視頻單元來說,所述第一權(quán)重大于所述第二權(quán)重。
25.根據(jù)權(quán)利要求20所述的方法,其中所述視頻信息包括幀內(nèi)預(yù)測(cè)方向、像素位置、量化參數(shù)及空間縮放比中的一或多者。
26.根據(jù)權(quán)利要求25所述的方法,其中依據(jù)所述基層的量化參數(shù)QPl及所述增強(qiáng)層的量化參數(shù)QP2兩者確定所述第二權(quán)重。
27.根據(jù)權(quán)利要求26所述的方法,其中所述第二權(quán)重通常隨著QP1-QP2的值增加而增加。
28.根據(jù)權(quán)利要求25所述的方法,其中依據(jù)所述空間縮放比確定所述第二權(quán)重。
29.根據(jù)權(quán)利要求28所述的方法,其中所述第二權(quán)重通常隨著所述空間縮放比增加而增加。
30.根據(jù)權(quán)利要求20所述的方法,其中所述增強(qiáng)層中的所述視頻單元包括在當(dāng)前增強(qiáng)層塊中的像素,且其中依據(jù)所述像素與相鄰增強(qiáng)層塊的邊界之間的距離確定所述第二權(quán)重。
31.根據(jù)權(quán)利要求30所述的方法,其中對(duì)于更靠近于所述邊界的像素,所述第二權(quán)重通常增加,且對(duì)于距所述邊界較遠(yuǎn)的像素,所述第一權(quán)重通常增加。
32.根據(jù)權(quán)利要求20所述的方法,其中所述視頻信息并不包括所述第一和第二權(quán)重。
33.根據(jù)權(quán)利要求20所述的方法,其中所述視頻信息包括關(guān)于所述第一和第二權(quán)重的加權(quán)數(shù)據(jù)。
34.根據(jù)權(quán)利要求33所述的方法,其中所述加權(quán)數(shù)據(jù)包括在當(dāng)前增強(qiáng)層塊內(nèi)的位置,在所述位置處所述第一權(quán)重及所述第二權(quán)重相等。
35.根據(jù)權(quán)利要求34所述的方法,其進(jìn)一步包括至少部分基于所述第一和第二權(quán)重相等的所述位置確定與所述當(dāng)前增強(qiáng)層塊相關(guān)聯(lián)的多個(gè)視頻單元的所述第一和第二權(quán)重。
36.一種包括可由設(shè)備的處理器執(zhí)行的指令的計(jì)算機(jī)可讀存儲(chǔ)媒體,所述指令致使所述設(shè)備: 獲得與基層及對(duì)應(yīng)增強(qiáng)層相關(guān)聯(lián)的視頻信息; 至少部分基于所述視頻信息確定與所述基層中的視頻單元相關(guān)聯(lián)的第一權(quán)重及與所述增強(qiáng)層中的視頻單元相關(guān)聯(lián)的第二權(quán)重;及 至少部分基于所述第一和第二權(quán)重對(duì)所述增強(qiáng)層中的所述視頻單元進(jìn)行譯碼。
37.一種用于對(duì)視頻進(jìn)行譯碼的設(shè)備,所述設(shè)備包括: 用于獲得與基層及對(duì)應(yīng)增強(qiáng)層相關(guān)聯(lián)的視頻信息的裝置; 用于至少部分基于所述視頻信息確定與所述基層中的視頻單元相關(guān)聯(lián)的第一權(quán)重及與所述增強(qiáng)層中的視頻單元相關(guān)聯(lián)的第二權(quán)重的裝置;及 用于至少部分基于所述第一和第二權(quán)重對(duì)所述增強(qiáng)層中的所述視頻單元進(jìn)行譯碼的>j-U ρ?α裝直。
【文檔編號(hào)】H04N19/154GK104255027SQ201380015150
【公開日】2014年12月31日 申請(qǐng)日期:2013年3月20日 優(yōu)先權(quán)日:2012年3月22日
【發(fā)明者】翔林·王, 馬爾塔·卡切維奇 申請(qǐng)人:高通股份有限公司