用于可縮放視頻譯碼中的預(yù)測的層間模式導(dǎo)出的制作方法
【專利摘要】在視頻譯碼器的一些實施例中,如果一些預(yù)測信息不可用于當(dāng)前層中的第一塊,那么所述視頻譯碼器使用來自基礎(chǔ)層中的與所述第一塊相同位置的第二塊的對應(yīng)信息(例如,幀內(nèi)預(yù)測方向及運動信息)(如果可用的話),如同所述對應(yīng)信息為所述第一塊的預(yù)測信息。接著可將所述對應(yīng)信息用于所述當(dāng)前層中以確定所述當(dāng)前層中的隨后塊的預(yù)測信息。
【專利說明】用于可縮放視頻譯碼中的預(yù)測的層間模式導(dǎo)出
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及視頻譯碼及壓縮,且確切地說,涉及可縮放視頻譯碼(SVC)。
【背景技術(shù)】
[0002]數(shù)字視頻能力可并入到廣泛范圍的裝置中,包含數(shù)字電視、數(shù)字直播系統(tǒng)、無線廣播系統(tǒng)、個人數(shù)字助理(PDA)、膝上型或桌上型計算機、數(shù)碼相機、數(shù)字記錄裝置、數(shù)字媒體播放器、視頻游戲裝置、視頻游戲控制臺、蜂窩式或衛(wèi)星無線電電話、視頻電話會議裝置及其類似者。數(shù)字視頻裝置實施視頻壓縮技術(shù),例如通過MPEG-2、MPEG-4、ITU-T H.263、ITU-T
H.264/MPEG-4第10部分、高級視頻譯碼(AVC)、目前正在開發(fā)的高效率視頻譯碼(HEVC)標(biāo)準(zhǔn)及此類標(biāo)準(zhǔn)的擴展部分定義的標(biāo)準(zhǔn)中描述的技術(shù),以便更有效地發(fā)射、接收及存儲數(shù)字視頻息。
[0003]視頻壓縮技術(shù)執(zhí)行空間(圖片內(nèi))預(yù)測及/或時間(圖片間)預(yù)測來減少或移除視頻序列中固有的冗余。對于基于塊的視頻譯碼,可將視頻切片分割成視頻塊,視頻塊還可被稱作樹塊、譯碼單元(CU)及/或譯碼節(jié)點。圖片的經(jīng)幀內(nèi)譯碼(I)切片中的視頻塊是使用相對于同一圖片中的相鄰塊中的參考樣本的空間預(yù)測來編碼。圖片的經(jīng)幀間譯碼(P或B)切片中的視頻塊可使用相對于同一圖片中的相鄰塊中的參考樣本的空間預(yù)測,或相對于其它參考圖片中的參考樣本的時間預(yù)測。圖片可被稱為幀,且參考圖片可被稱為參考幀。
[0004]空間或時間預(yù)測產(chǎn)生用于待譯碼塊的預(yù)測性塊。殘余數(shù)據(jù)表示待譯碼原始塊與預(yù)測性塊之間的像素差。經(jīng)幀間譯碼塊是根據(jù)指向形成預(yù)測性塊的參考樣本塊的運動向量及指示經(jīng)譯碼塊與預(yù)測性塊之間的差的殘余數(shù)據(jù)編碼的。經(jīng)幀內(nèi)譯碼塊是根據(jù)幀內(nèi)譯碼模式及殘余數(shù)據(jù)編碼的。為了進一步壓縮,可以將殘余數(shù)據(jù)從像素域變換到變換域,從而產(chǎn)生殘余變換系數(shù),接著可以對殘余變換系數(shù)進行量化??梢話呙枳畛跤枚S陣列布置的經(jīng)量化變換系數(shù),以便產(chǎn)生變換系數(shù)的一維向量,并且可以應(yīng)用熵譯碼以實現(xiàn)更多的壓縮。
[0005]某一基于塊的視頻譯碼及壓縮利用可縮放技術(shù)。可縮放視頻譯碼(SVC)指使用基礎(chǔ)層及一或多個可縮放增強層的視頻譯碼。對于SVC來說,基礎(chǔ)層通常載運具有基礎(chǔ)質(zhì)量水平的視頻數(shù)據(jù)。一或多個增強層載運額外的視頻數(shù)據(jù)以支持(例如)較高的空間、時間及/或SNR水平。在一些情況下,可以比增強層的發(fā)射更可靠的方式來發(fā)射基礎(chǔ)層。在下文論述中,“基礎(chǔ)層”可意味著可能由不可縮放編解碼器(例如H.264)產(chǎn)生的絕對基礎(chǔ)層,或其可意味著在編碼當(dāng)前增強層中用作基礎(chǔ)的經(jīng)先前編碼的增強層。基礎(chǔ)層也可被稱作較低層,及增強層也可被稱作較高層。
【專利附圖】
【附圖說明】
[0006]圖1為根據(jù)本發(fā)明的技術(shù)的說明用于確定預(yù)測參數(shù)的實例過程的流程圖。
[0007]圖2為說明可利用本發(fā)明的技術(shù)的實例視頻譯碼系統(tǒng)的框圖。
[0008]圖3為說明幀內(nèi)模式的實施例的概念圖。
[0009]圖4為說明幀間模式的實施例的概念圖。
[0010]圖5為說明可縮放視頻譯碼的實施例的概念圖。
[0011]圖6為說明INTRA_BL模式的實施例的概念圖。
[0012]圖7為說明跨越層的預(yù)測信息的傳播的實例實施例的概念圖。
[0013]圖8為說明可實施本發(fā)明的技術(shù)的視頻編碼器的實例實施例的框圖。
[0014]圖9為說明可實施本發(fā)明的技術(shù)的視頻解碼器的實例實施例的框圖。
【具體實施方式】
[0015]視頻譯碼器可支持多個預(yù)測模式以用于減少經(jīng)編碼視頻的不同方面中的冗余,如上文所描述。舉例來說,幀間模式可減小不同幀中的塊之間的冗余,幀內(nèi)模式可減小同一幀中的塊之間的冗余,及幀內(nèi)BL模式可減小不同層中的塊之間的冗余。一些或全部預(yù)測模式可具有與其相關(guān)聯(lián)的參數(shù)。舉例來說,預(yù)測參數(shù)可包含用于經(jīng)幀間譯碼塊的運動向量或用于經(jīng)幀內(nèi)譯碼塊的預(yù)測方向。
[0016]編碼器可基于每一塊的內(nèi)容來選擇預(yù)測模式及參數(shù)集合以提供可用于所述塊的最佳預(yù)測。在許多情況下,彼此接近的塊可具有類似預(yù)測參數(shù)。因此,預(yù)測參數(shù)可基于來自相鄰塊的參數(shù)而經(jīng)自身預(yù)測。然而,如果相鄰塊使用不同于當(dāng)前塊的預(yù)測模式,那么相鄰塊的參數(shù)可能不可用于預(yù)測當(dāng)前塊的參數(shù)。因此,識別可能類似于當(dāng)前塊的參數(shù)的參數(shù)的替代源可為有益的。
[0017]在可縮放視頻譯碼中,基礎(chǔ)層塊的預(yù)測參數(shù)可類似于對應(yīng)增強層塊的預(yù)測參數(shù)。術(shù)語“對應(yīng)”為廣義術(shù)語,并且對所屬領(lǐng)域的普通技術(shù)人員給出其普通且慣例的含義(即,其不限于特殊或自定義的含義),并且可包含(但不限于)各種層中的相同位置的塊?;A(chǔ)層及增強層中的對應(yīng)塊之間的預(yù)測參數(shù)的可能類似性可結(jié)合上文描述的同一層中的相鄰塊的預(yù)測參數(shù)的可能類似性來采用。具體來說,當(dāng)增強層中的當(dāng)前塊的參數(shù)由于鄰近塊使用不同預(yù)測模式而不能從所述鄰近塊的參數(shù)預(yù)測時,其可能從對應(yīng)于鄰近塊的基礎(chǔ)層塊來獲得參數(shù)集合。接著可將所獲得參數(shù)用作預(yù)測當(dāng)前塊的參數(shù)的基礎(chǔ)。具體地說,此方法可在來自增強層的當(dāng)前塊的預(yù)測模式匹配基礎(chǔ)層塊的預(yù)測模式時為有用的。
[0018]本發(fā)明的特征可通過允許將較多預(yù)測參數(shù)表示為殘余數(shù)來幫助改進譯碼效率。此類殘余數(shù)可包括經(jīng)表示的預(yù)測參數(shù)與參考參數(shù)集合之間的差異。所述差異在大多數(shù)情況下可為較小的,這是因為所述參考參數(shù)針對其與所表示預(yù)測參數(shù)的可能類似性來被選擇。因此,可預(yù)期殘余數(shù)占據(jù)比預(yù)測參數(shù)本身少的位。結(jié)果,可以相同位速率來提供較佳視頻質(zhì)量,或可以較低位速率來提供相同質(zhì)量的視頻。
[0019]【專利附圖】
【附圖說明】若干實例。由附圖中的參考標(biāo)號指示的元件對應(yīng)于在以下描述中由相同參考標(biāo)號指示的元件。在本發(fā)明中,名稱以序數(shù)詞(例如,“第一”、“第二”、“第三”,等)開始的元件未必暗示所述元件具有特定次序。確切地說,此類序數(shù)詞僅用于指代相同或類似類型的不同元件。
[0020]圖1為根據(jù)本發(fā)明的技術(shù)的說明用于確定預(yù)測參數(shù)的實例過程的流程圖。所述過程可供圖2、8及9中所描繪的類別的視頻譯碼器使用。具體來說,所述過程可用以基于與當(dāng)前視頻單元的相鄰者相同位置的基礎(chǔ)層視頻單元所關(guān)聯(lián)的預(yù)測參數(shù)來確定增強層中的當(dāng)前視頻單元的預(yù)測參數(shù),如上文所描述。所述過程可如下進行。在方框110,視頻譯碼器可確定當(dāng)前視頻單元的預(yù)測模式是否與相鄰視頻單元的預(yù)測模式相同。如果預(yù)測模式匹配,那么過程繼續(xù)到方框120,其中視頻譯碼器基于相鄰視頻單元的預(yù)測參數(shù)來確定當(dāng)前視頻單元的預(yù)測參數(shù)。如果預(yù)測模式不匹配,那么過程繼續(xù)到方框130,其中視頻譯碼器確定當(dāng)前視頻單元的預(yù)測模式是否與增強層中的當(dāng)前視頻單元的相鄰者相同位置的基礎(chǔ)層中的視頻單元的預(yù)測模式相同。視頻譯碼器可檢查在增強層下方的若干基礎(chǔ)層中的相同位置塊的預(yù)測模式,直到找到具有匹配預(yù)測模式的相同位置塊為止。如果在方框130找到預(yù)測模式匹配,那么所述過程繼續(xù)到方框140,其中根據(jù)相關(guān)基礎(chǔ)層中的匹配視頻單元的預(yù)測參數(shù)來確定當(dāng)前視頻單元的預(yù)測參數(shù)。如果在方框130未找到預(yù)測模式匹配,那么所述過程繼續(xù)到方框150,其中不參考增強層中的相鄰視頻單元且不參考與相鄰視頻單元相同位置的基礎(chǔ)層中的視頻單元來確定當(dāng)前視頻單元的預(yù)測參數(shù)。
[0021]圖2為說明可利用本發(fā)明的技術(shù)的實例視頻譯碼系統(tǒng)10的框圖。如本文中所描述地使用,術(shù)語“視頻譯碼器”一般指視頻編碼器及視頻解碼器兩者。在本發(fā)明中,術(shù)語“視頻譯碼”或“譯碼”可一般地指視頻編碼及視頻解碼。
[0022]如圖2中所示,視頻譯碼系統(tǒng)200包含源裝置210及目的地裝置220。源裝置210產(chǎn)生經(jīng)編碼的視頻數(shù)據(jù)。目的地裝置220可解碼源裝置210所產(chǎn)生的經(jīng)編碼的視頻數(shù)據(jù)。源裝置210及目的地裝置220可包括廣泛范圍的裝置,包含桌上型計算機、筆記型(例如,膝上型)計算機、平板計算機、機頂盒、例如所謂的“智能”電話等電話手持機、所謂的“智能”板、電視、相機、顯示裝置、數(shù)字媒體播放器、視頻游戲控制臺、車載計算機或其類似者。在一些實例中,源裝置210及目的地裝置220可經(jīng)裝備以用于無線通信。
[0023]目的地裝置220可經(jīng)由信道230接收來自源裝置210的經(jīng)編碼的視頻數(shù)據(jù)。信道230可包括能夠?qū)⒔?jīng)編碼的視頻數(shù)據(jù)從源裝置210移動到目的地裝置220的任何類型的媒體或裝置。在一個實例中,信道230可包括使源裝置210能夠?qū)⒔?jīng)編碼的視頻數(shù)據(jù)實時直接發(fā)射到目的地裝置220的通信媒體。在此實例中,源裝置210可根據(jù)通信標(biāo)準(zhǔn)(例如無線通信協(xié)議)來調(diào)制經(jīng)編碼的視頻數(shù)據(jù),且可將經(jīng)調(diào)制視頻數(shù)據(jù)發(fā)射到目的地裝置220。通信媒體可包括無線或有線通信媒體,例如射頻(RF)頻譜或一或多個物理發(fā)射線路。通信媒體可能形成分組網(wǎng)絡(luò)(例如局域網(wǎng)、廣域網(wǎng)或全球網(wǎng)絡(luò),例如因特網(wǎng))的一部分。通信媒體可包含路由器、交換器、基站或促進從源裝置210到目的地裝置220的通信的其它裝備。
[0024]在另一實例中,信道230可對應(yīng)于存儲源裝置210所產(chǎn)生的經(jīng)編碼的視頻數(shù)據(jù)的存儲媒體。在此實例中,目的地裝置220可經(jīng)由磁盤存取或卡存取來存取所述存儲媒體。存儲媒體可包含多種本地存取的數(shù)據(jù)存儲媒體,例如藍光光盤、DVD、CD-ROM、快閃存儲器或用于存儲經(jīng)編碼的視頻數(shù)據(jù)的其它合適數(shù)字存儲媒體。在另一實例中,信道230可包含文件服務(wù)器或存儲源裝置210所產(chǎn)生的經(jīng)編碼視頻的另一中間存儲裝置。在此實例中,目的地裝置220可經(jīng)由流式傳輸或下載而存取存儲在文件服務(wù)器或其它中間存儲裝置處的經(jīng)編碼的視頻數(shù)據(jù)。文件服務(wù)器可為能夠存儲經(jīng)編碼的視頻數(shù)據(jù)并且將經(jīng)編碼的視頻數(shù)據(jù)發(fā)射到目的地裝置220的服務(wù)器類型。實例文件服務(wù)器包含網(wǎng)絡(luò)服務(wù)器(例如,用于網(wǎng)站)、FTP服務(wù)器、網(wǎng)絡(luò)連接存儲(NAS)裝置,及本地磁盤驅(qū)動器。目的地裝置220可以經(jīng)由任何標(biāo)準(zhǔn)數(shù)據(jù)連接(包含因特網(wǎng)連接)來存取經(jīng)編碼的視頻數(shù)據(jù)。數(shù)據(jù)連接的實例類型可包含適合于存取存儲于文件服務(wù)器上的經(jīng)編碼的視頻數(shù)據(jù)的無線信道(例如,W1-Fi連接)、有線連接(例如,DSL、電纜調(diào)制解調(diào)器等)或兩者的組合。經(jīng)編碼的視頻數(shù)據(jù)從文件服務(wù)器的傳輸可為流式傳輸、下載傳輸或兩者的組合。
[0025]本發(fā)明的技術(shù)不限于無線應(yīng)用或設(shè)置。所述技術(shù)可應(yīng)用于視頻譯碼以支持多種多媒體應(yīng)用,例如空中電視廣播、有線電視發(fā)射、衛(wèi)星電視發(fā)射、流式視頻傳輸(例如,經(jīng)由因特網(wǎng))、編碼數(shù)字視頻以存儲于數(shù)據(jù)存儲媒體上、解碼存儲于數(shù)據(jù)存儲媒體上的數(shù)字視頻,或其它應(yīng)用。在一些實例中,視頻譯碼系統(tǒng)10可經(jīng)配置以支持單向或雙向視頻傳輸以支持例如視頻流式傳輸、視頻播放、視頻廣播及/或視頻電話等應(yīng)用。
[0026]在圖2的實例中,源裝置210包含視頻源240、視頻編碼器250及輸出接口 260。在一些情況下,輸出接口 260可包含調(diào)制器/解調(diào)器(調(diào)制解調(diào)器)及/或發(fā)射器。在源裝置210中,視頻源240可包含例如視頻俘獲裝置(例如,視頻攝像機)、含有先前俘獲的視頻數(shù)據(jù)的視頻存檔、從視頻內(nèi)容提供者接收視頻數(shù)據(jù)的視頻饋入接口及/或用于產(chǎn)生視頻數(shù)據(jù)的計算機圖形系統(tǒng)等來源,或此類來源的組合。
[0027]視頻編碼器250可編碼所俘獲、預(yù)俘獲或計算機產(chǎn)生的視頻數(shù)據(jù)。經(jīng)編碼視頻數(shù)據(jù)可經(jīng)由源裝置210的輸出接口 260直接發(fā)射到目的地裝置220。經(jīng)編碼的視頻數(shù)據(jù)還可存儲到存儲媒體或文件服務(wù)器上以供稍后由目的地裝置220存取以用于解碼及/或播放。
[0028]在圖2的實例中,目的地裝置220包含輸入接口 270、視頻解碼器280及顯示裝置290。在一些情況下,輸入接口 270可包含接收器及/或調(diào)制解調(diào)器。目的地裝置220的輸入接口 270經(jīng)由信道230接收經(jīng)編碼的視頻數(shù)據(jù)。經(jīng)編碼的視頻數(shù)據(jù)可包含由視頻編碼器250產(chǎn)生的表示視頻數(shù)據(jù)的多種語法元素。此類語法元素可與在通信媒體上發(fā)射、存儲在存儲媒體上或存儲在文件服務(wù)器中的經(jīng)編碼的視頻數(shù)據(jù)包含在一起。
[0029]顯示裝置290可與目的地裝置220集成在一起或可在其外部。在一些實例中,目的地裝置220可包含集成顯示裝置,且還可經(jīng)配置以與外部顯示裝置介接。在其它實例中,目的地裝置220可為顯示裝置。大體來說,顯示裝置290向用戶顯示經(jīng)解碼視頻數(shù)據(jù)。顯示裝置290可包括多種顯示裝置中的任一者,例如液晶顯示器(LCD)、等離子顯示器、有機發(fā)光二極管(OLED)顯示器或另一類型的顯示裝置。
[0030]視頻編碼器250及視頻解碼器280可根據(jù)視頻壓縮標(biāo)準(zhǔn)(例如目前正在開發(fā)的高效率視頻譯碼(HEVC)標(biāo)準(zhǔn))來操作,且可符合HEVC測試模型(HM)?;蛘撸曨l編碼器250及視頻解碼器280可以根據(jù)其它專有或業(yè)界標(biāo)準(zhǔn)來操作,例如ITU-T H.264標(biāo)準(zhǔn),或者被稱為MPEG-4,第10部分,高級視頻譯碼(AVC),或此類標(biāo)準(zhǔn)的擴展。然而,本發(fā)明的技術(shù)不限于任何特定譯碼標(biāo)準(zhǔn)。視頻壓縮標(biāo)準(zhǔn)的其它實例包含MPEG-2和ITU-TH.263。
[0031]盡管圖2的實例中未展示,但視頻編碼器250及視頻解碼器280可各自與音頻編碼器及解碼器集成,且可包含適當(dāng)多路復(fù)用器-多路分用器(MUX-DEMUX)單元或其它硬件及軟件以處置對共同數(shù)據(jù)流或單獨數(shù)據(jù)流中的音頻及視頻兩者的編碼。在一些實例中,如果適用的話,多路復(fù)用器-多路分用器單元可符合ITU H.223多路復(fù)用器協(xié)議,或例如用戶數(shù)據(jù)報協(xié)議(UDP)等其它協(xié)議。
[0032]此外,圖2僅為實例,且本發(fā)明的技術(shù)可適用于未必包含編碼裝置與解碼裝置之間的任何數(shù)據(jù)通信的視頻譯碼設(shè)置(例如,視頻編碼或視頻解碼)。在其它實例中,數(shù)據(jù)可從本地存儲器檢索、經(jīng)由網(wǎng)絡(luò)流式傳輸,或其類似者。編碼裝置可編碼數(shù)據(jù)且將數(shù)據(jù)存儲到存儲器,及/或解碼裝置可從存儲器檢索數(shù)據(jù)且解碼數(shù)據(jù)。在許多實例中,通過并不彼此通信而是簡單地編碼數(shù)據(jù)到存儲器及/或從存儲器檢索數(shù)據(jù)且解碼數(shù)據(jù)的裝置來執(zhí)行編碼及解碼。
[0033]視頻編碼器250及視頻解碼器280各自可實施為例如以下各者的多種合適電路中的任一者:一或多個微處理器、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)、離散邏輯、硬件或其任何組合。當(dāng)部分地以軟件實施技術(shù)時,裝置可將軟件的指令存儲于合適的非暫時性計算機可讀存儲媒體中且可使用一或多個處理器以硬件執(zhí)行指令從而執(zhí)行本發(fā)明的技術(shù)。視頻編碼器250和視頻解碼器280中的每一者可以包含在一或多個編碼器或解碼器中,所述編碼器或解碼器中的任一者可以集成為相應(yīng)裝置中的組合式編碼器/解碼器(編解碼器)的一部分。
[0034]如上文簡要提及,視頻編碼器250對視頻數(shù)據(jù)進行編碼。視頻數(shù)據(jù)可包括一或多個圖片。圖片中的每一者為形成視頻的一部分的靜態(tài)圖像。在一些情況下,圖片可被稱為視頻“幀”。當(dāng)視頻編碼器250對視頻數(shù)據(jù)進行編碼時,視頻編碼器250可產(chǎn)生位流。位流可包含形成視頻數(shù)據(jù)的經(jīng)譯碼表示的位序列。位流可包含經(jīng)譯碼圖片及相關(guān)聯(lián)的數(shù)據(jù)。經(jīng)譯碼圖片為圖片的經(jīng)譯碼表示。
[0035]為產(chǎn)生位流,視頻編碼器250可對視頻數(shù)據(jù)中的每一圖片執(zhí)行編碼操作。當(dāng)視頻編碼器250對所述圖片執(zhí)行編碼操作時,視頻編碼器250可產(chǎn)生一連串經(jīng)譯碼圖片及相關(guān)聯(lián)數(shù)據(jù)。相關(guān)聯(lián)數(shù)據(jù)可包含序列參數(shù)集、圖片參數(shù)集、自適應(yīng)參數(shù)集及其它語法結(jié)構(gòu)。序列參數(shù)集(SPS)可含有適用于零或更多個圖片序列的參數(shù)。圖片參數(shù)集(PPS)可含有適用于零或更多個圖片的參數(shù)。自適應(yīng)參數(shù)集(APS)可含有適用于零或更多個圖片的參數(shù)。
[0036]為產(chǎn)生經(jīng)譯碼圖片,視頻編碼器250可將圖片分割為大小相等的視頻塊。視頻塊中的每一者與樹塊相關(guān)聯(lián)。在一些情況下,樹塊還可稱為最大譯碼單元(LCU)。HEVC的樹塊可大致類似于例如H.264/AVC等前述標(biāo)準(zhǔn)的宏塊。然而,樹塊不必限于特定大小,且可包含一或多個譯碼單元(CU)。視頻編碼器250可使用四叉樹分割來將樹塊的視頻塊分割成與CU相關(guān)聯(lián)的視頻塊(因此名稱為“樹塊”)。
[0037]CU可指充當(dāng)基本單元的矩形圖像區(qū),將各種譯碼工具應(yīng)用于所述基本單元以用于視頻壓縮。為實現(xiàn)較好的譯碼效率,譯碼單元可取決于視頻內(nèi)容而具有可變大小。為減小冗余,預(yù)測CU且用信號發(fā)送預(yù)測殘余。CU可分裂成較小塊以用于預(yù)測(預(yù)測單元或W)。根據(jù)HEVC或HM(用于HEVC的參考軟件),CU可具有兩預(yù)測模式中的一者:幀內(nèi)(INTRA)模式及幀間(INTER)模式。CU還可分裂成較小塊以用于變換,及將這些塊中的每一者稱作變換單元(TU)。
[0038]在一些實例中,視頻編碼器250可將一圖片分割成多個切片。所述切片中的每一者可包含整數(shù)數(shù)目個CU。在一些情況下,一切片包括整數(shù)數(shù)目個樹塊。在其它情況下,切片的邊界可在樹塊內(nèi)。
[0039]作為對圖片執(zhí)行編碼操作的部分,視頻編碼器250可對圖片的每一切片執(zhí)行編碼操作。當(dāng)視頻編碼器250對切片執(zhí)行編碼操作時,視頻編碼器250可產(chǎn)生與切片相關(guān)聯(lián)的經(jīng)編碼數(shù)據(jù)。與切片相關(guān)聯(lián)的經(jīng)編碼數(shù)據(jù)可被稱為“經(jīng)譯碼切片”。
[0040]為產(chǎn)生經(jīng)譯碼切片,視頻編碼器250可對切片中的每一樹塊執(zhí)行編碼操作。當(dāng)視頻編碼器250對樹塊執(zhí)行編碼操作時,視頻編碼器250可產(chǎn)生經(jīng)譯碼樹塊。經(jīng)譯碼樹塊可包括表示樹塊的經(jīng)編碼版本的數(shù)據(jù)。
[0041]為產(chǎn)生經(jīng)譯碼樹塊,視頻編碼器250可對樹塊的視頻塊遞歸地執(zhí)行四叉樹分割以將所述視頻塊劃分成逐漸變小的視頻塊。較小視頻塊中的每一者可與不同CU相關(guān)聯(lián)。舉例來說,視頻編碼器250可將樹塊的視頻塊分割成四個大小相等的子塊、將所述子塊中的一或多者分割成四個大小相等的子子塊,以此類推。位流中的一或多個語法元素可指示視頻編碼器250可分割樹塊的視頻塊的最大次數(shù)。CU的視頻塊在形狀上可為正方形。CU的視頻塊的大小(即,CU的大小)范圍可從8X8像素直到具有64X64個像素或更大的最大值的樹塊的視頻塊的大小(即,樹塊的大小)。
[0042]當(dāng)視頻編碼器250編碼未分割⑶時,視頻編碼器250可產(chǎn)生用于⑶的一或多個預(yù)測單元(PU)。未分割CU為其視頻塊未分割成用于其它CU的視頻塊的CU。CU的PU中的每一者可與CU的視頻塊內(nèi)的不同視頻塊相關(guān)聯(lián)。視頻編碼器250可產(chǎn)生用于CU的每一PU的經(jīng)預(yù)測視頻塊。的經(jīng)預(yù)測視頻塊可為樣本塊。視訊編碼器250可使用幀內(nèi)預(yù)測或幀間預(yù)測來產(chǎn)生用于PU的經(jīng)預(yù)測視頻塊。
[0043]當(dāng)視頻編碼器250使用幀內(nèi)預(yù)測來產(chǎn)生的經(jīng)預(yù)測視頻塊時,視頻編碼器250可基于與PU相關(guān)聯(lián)的圖片的經(jīng)解碼樣本來產(chǎn)生PU的經(jīng)預(yù)測視頻塊。當(dāng)視頻編碼器250使用幀間預(yù)測來產(chǎn)生PU的經(jīng)預(yù)測視頻塊時,視頻編碼器250可基于不同于與所述相關(guān)聯(lián)的圖片的圖片的經(jīng)解碼值來產(chǎn)生所述PU的經(jīng)預(yù)測視頻塊。如果視頻編碼器250使用幀內(nèi)預(yù)測來產(chǎn)生⑶的PU的經(jīng)預(yù)測視頻塊,那么⑶為經(jīng)幀內(nèi)預(yù)測的⑶。
[0044]圖3為說明幀內(nèi)模式的實施例的概念圖??筛鶕?jù)來自同一幀或切片的已重建構(gòu)相鄰像素對INTRA CU中的PU 305進行空間預(yù)測。允許有多個幀內(nèi)預(yù)測方向且在所述位流中用信號發(fā)送最佳方向。INTRA CU中的不同PU可具有不同預(yù)測方向。
[0045]當(dāng)視頻編碼器250對PU使用幀內(nèi)預(yù)測時,視頻編碼器250可產(chǎn)生候選幀內(nèi)預(yù)測模式列表。候選幀內(nèi)預(yù)測模式列表可基于在空間或在時間上與PU相鄰的PU的幀內(nèi)預(yù)測模式。另外,如下文所描述,候選幀內(nèi)預(yù)測模式列表可包含來自基礎(chǔ)層的幀內(nèi)預(yù)測模式。視頻編碼器250可選擇來自所述列表的候選者中的一者,且產(chǎn)生指示所述列表中的選定候選者的位置的索引。視頻編碼器250可通過輸出索引來用信號發(fā)送PU的幀內(nèi)預(yù)測模式。在一些情況下,視頻編碼器250可通過輸出選定候選者的索引以及輸出選定候選者的幀內(nèi)預(yù)測模式與PU的幀內(nèi)預(yù)測模式之間的差異來用信號發(fā)送PU的幀內(nèi)預(yù)測模式。
[0046]當(dāng)視頻編碼器250使用幀間預(yù)測來產(chǎn)生的經(jīng)預(yù)測視頻塊時,視頻編碼器250可產(chǎn)生所述PU的運動信息。的運動信息可指示對應(yīng)于的視頻塊的另一圖片的一部分。換句話說,PU的運動信息可指示的“參考樣本”。視頻編碼器250可基于由的運動信息指示的其它圖片的部分而產(chǎn)生PU的經(jīng)預(yù)測視頻塊。如果視頻編碼器250使用幀間預(yù)測來產(chǎn)生⑶的PU的經(jīng)預(yù)測視頻塊,那么所述⑶為經(jīng)幀間預(yù)測的⑶。
[0047]圖4為說明幀間模式的實施例的概念圖??筛鶕?jù)已解碼的先前一或多個幀(按解碼次序)中的最佳匹配塊或加權(quán)塊在時間上對INTER⑶410中的PU 405進行預(yù)測。此類塊可被稱作參考塊415。識別一或多個參考塊的運動信息420可在所述位流中用信號發(fā)送。此說明于圖4中。INTER⑶中的不同PU可具有不同運動信息。
[0048]可鑒于H.264/AVC的以上論述來考慮新出現(xiàn)的HEVC工作草案(WD)。在HEVC WD中,存在用于運動參數(shù)預(yù)測的兩模式。一個模式可被稱為“合并模式”,而另一模式可被稱為“高級運動向量預(yù)測”模式或“AMVP”模式。
[0049]合并模式為視頻譯碼模式,其中針對正經(jīng)譯碼的當(dāng)前視頻塊繼承相鄰視頻塊的運動信息(例如運動向量、參考幀索引、預(yù)測方向或其它信息)。索引值可用以識別當(dāng)前視頻塊從其繼承其運動信息的相鄰者(例如,在時間鄰近幀的頂部、右上角、左邊、左下角或相同位置)。
[0050]在當(dāng)前視頻塊的譯碼中使用鄰近視頻塊的運動向量的另一情況為所謂的運動向量預(yù)測。在此情況下,應(yīng)用運動向量的預(yù)測性譯碼以減小傳達所述運動向量所需的數(shù)據(jù)量。舉例來說,并非編碼及傳達所述運動向量本身,編碼器編碼及傳達相對于已知(或可知)運動向量的運動向量差(MVD)。高級運動向量預(yù)測(AMVP)允許用于界定MVD的許多可能候選者。
[0051]合并及AMVP模式兩者建立用于參考圖片列表零或“RefPicListO”的候選列表及用于參考圖片列表一或“RefPicListI”的候選列表。這些參考圖片列表中的每一者可用于單向或雙向預(yù)測,且指定用于執(zhí)行時間及/或空間運動預(yù)測的潛在圖片或幀的列表。將用于運動參數(shù)的譯碼的AMVP的候選者是來自空間及時間相鄰塊。在AMVP模式中,用信號發(fā)送參考索引值。在合并模式中,由于當(dāng)前預(yù)測單元(PU)共享所選擇候選運動向量預(yù)測值的參考索引值而未用信號發(fā)送參考索引值。在一些情況下,可實施合并模式而使得僅創(chuàng)建一個候選列表。
[0052]在視頻編碼器250產(chǎn)生用于⑶的一或多個的預(yù)測視頻塊之后,視頻編碼器250可基于用于CU的所述PU的預(yù)測視頻塊而產(chǎn)生CU的殘余數(shù)據(jù)。CU的殘余數(shù)據(jù)可指示用于CU的PU的預(yù)測視頻塊中的樣本與CU的原始視頻塊之間的差異。
[0053]此外,作為對未經(jīng)分割⑶執(zhí)行編碼操作的部分,視頻編碼器250可對⑶的殘余數(shù)據(jù)執(zhí)行遞回四叉樹分割以將CU的殘余數(shù)據(jù)分割成與CU的變換單元(TU)相關(guān)聯(lián)的一或多個殘余數(shù)據(jù)塊(即,殘余視頻塊)。CU的每一 TU可與不同殘余視頻塊相關(guān)聯(lián)。視頻譯碼器250可對⑶的每一 TU執(zhí)行變換操作。
[0054]當(dāng)視頻編碼器250對TU執(zhí)行變換操作時,視頻編碼器250可將一或多個變換應(yīng)用到與TU相關(guān)聯(lián)的殘余視頻塊以產(chǎn)生與TU相關(guān)聯(lián)的一或多個變換系數(shù)塊(即,變換系數(shù)的塊)。在概念上,變換系數(shù)塊可為變換系數(shù)的二維(2D)矩陣。
[0055]在產(chǎn)生變換系數(shù)塊之后,視頻編碼器250可對變換系數(shù)塊執(zhí)行量化操作。量化大體上指對變換系數(shù)進行量化以可能減少用以表示變換系數(shù)的數(shù)據(jù)的量從而提供進一步壓縮的過程。量化過程可減少與變換系數(shù)中的一些或全部相關(guān)聯(lián)的位深度。舉例來說,可在量化期間將η位變換系數(shù)向下舍入到m位變換系數(shù),其中η大于m。
[0056]視頻編碼器250可使每一⑶與量化參數(shù)(QP)值相關(guān)聯(lián)。與⑶相關(guān)聯(lián)的QP值可確定視頻編碼器250量化與CU相關(guān)聯(lián)的變換系數(shù)塊的方式。視頻編碼器250可通過調(diào)整與CU相關(guān)聯(lián)的QP值來調(diào)整應(yīng)用于與CU相關(guān)聯(lián)的變換系數(shù)塊的量化的程度。
[0057]在視頻編碼器250量化變換系數(shù)塊之后,視頻編碼器250可掃描經(jīng)量化變換系數(shù)以產(chǎn)生變換系數(shù)等級的一維向量。視頻編碼器250可熵編碼所述一維向量。視頻編碼器250還可熵編碼與視頻數(shù)據(jù)相關(guān)聯(lián)的其它語法元素。
[0058]由視頻編碼器250產(chǎn)生的位流可包含一系列網(wǎng)絡(luò)抽象層(NAL)單元。所述NAL單元中的每一者可為含有NAL單元中的數(shù)據(jù)類型的指示和含有所述數(shù)據(jù)的字節(jié)的語法結(jié)構(gòu)。舉例來說,NAL單元可含有表示序列參數(shù)集、圖片參數(shù)集、經(jīng)譯碼切片、補充增強信息(SEI)、存取單元定界符、填充數(shù)據(jù)或另一類型的數(shù)據(jù)的數(shù)據(jù)。NAL單元中的數(shù)據(jù)可包含熵編碼的語法結(jié)構(gòu),例如熵編碼的變換系數(shù)塊、運動信息等。
[0059]視頻解碼器280可接收視頻編碼器250所產(chǎn)生的位流。位流可包含由視頻編碼器250編碼的視頻數(shù)據(jù)的經(jīng)譯碼表示。當(dāng)視頻解碼器280接收位流時,視頻解碼器280可對所述位流執(zhí)行剖析操作。當(dāng)視頻解碼器280執(zhí)行剖析操作時,視頻解碼器280可從所述位流提取語法元素。視頻解碼器280可基于從位流提取的語法元素來重建視頻數(shù)據(jù)的圖片?;谡Z法元素重建視頻數(shù)據(jù)的過程可與通過視頻編碼器250執(zhí)行以產(chǎn)生語法元素的過程大體上互逆。
[0060]在視頻解碼器280提取與CU相關(guān)聯(lián)的語法元素之后,視頻解碼器280可基于所述語法元素產(chǎn)生用于CU的PU的預(yù)測視頻塊。另外,視頻解碼器280可逆量化與CU的TU相關(guān)聯(lián)的變換系數(shù)塊。視頻解碼器280可對變換系數(shù)塊執(zhí)行逆變換以重建與CU的TU相關(guān)聯(lián)的殘余視頻塊。在產(chǎn)生預(yù)測視頻塊且重建殘余視頻塊之后,視頻解碼器280可基于所述預(yù)測視頻塊及所述殘余視頻塊來重建CU的視頻塊。以此方式,視頻解碼器280可基于位流中的語法元素來確定CU的視頻塊。
[0061]在一些情況下,視頻編碼器250及視頻解碼器280可使用可縮放視頻譯碼(SVC)。在SVC中,存在一個絕對基礎(chǔ)層(層O)及一或多個增強層(層1、2、3…)。每一增強層可充當(dāng)其上方其它層的基礎(chǔ)層。舉例來說,層I為相對于層O的增強層,但層I還可充當(dāng)層2的基礎(chǔ)層。相對于其基礎(chǔ)層,每一增強層可提供較佳質(zhì)量及/或空間或時間分辨率。對應(yīng)地,所述可縮放性稱作質(zhì)量(或SNR)可縮放性、空間可縮放性及時間可縮放性。圖5展示用于3層可縮放視頻編解碼器的實例設(shè)置。
[0062]圖6為說明INTRA_BL模式的實施例的概念圖。當(dāng)視頻解碼器280解碼層i 605時,大體上較低層(O、…、1-l)610已經(jīng)解碼,及來自較低層的全部信息可用且用以對層i進行譯碼。舉例來說,對于增強層塊,除了上述常規(guī)INTRA及INTER模式以外,可存在另一預(yù)測模式:INTRA_BL模式。在INTRA_BL模式中,從塊615的基礎(chǔ)層610的經(jīng)重建相同位置的塊620來預(yù)測塊615,如圖6中所示。舉例而言,如果視頻編碼器250使用INTRA_BL模式對塊進行編碼,那么視頻解碼器280可采用相同位置基礎(chǔ)層塊的幀內(nèi)預(yù)測模式作為所述塊的幀內(nèi)預(yù)測模式。換句話說,如果所述塊以INTRA_BL模式來編碼,那么視頻解碼器280可基于相同位置基礎(chǔ)層的幀內(nèi)預(yù)測模式來預(yù)測所述塊的幀內(nèi)預(yù)測模式。
[0063]如果較低層在解碼當(dāng)前層之前經(jīng)充分解碼,那么較低層處的所有單元或塊為當(dāng)前層的原因而不管其在所述幀或切片內(nèi)部的位置。在基礎(chǔ)層幀或切片不必在解碼當(dāng)前層處的塊之前經(jīng)充分解碼的低延遲應(yīng)用中,在當(dāng)前塊的非因果相鄰者的基礎(chǔ)層處的相同位置的塊已經(jīng)解碼且因此為當(dāng)前塊的原因也是可能的。
[0064]預(yù)測信息(例如,幀內(nèi)預(yù)測方向及運動信息)可在空間上高度相關(guān)。為了這類預(yù)測信息的較佳譯碼效率,可使用來自相鄰PU的相同預(yù)測信息來預(yù)測此類預(yù)測信息,及視頻編碼器250僅用信號發(fā)送預(yù)測差到視頻解碼器280。如果相鄰具有不同于當(dāng)前的模式(例如,一個為幀內(nèi)模式及另一個為幀間模式),那么相鄰PU的預(yù)測信息可不用來預(yù)測當(dāng)前PU的預(yù)測信息。此可能損壞譯碼性能。
[0065]在SVC中,當(dāng)相鄰PU具有某一預(yù)測模式時,設(shè)置的預(yù)測信息的方式可影響隨后塊的譯碼性能,這是因為預(yù)測信息可用于預(yù)測那些隨后塊的預(yù)測信息。
[0066]在SVC中,用于較低層塊中的預(yù)測信息可充當(dāng)應(yīng)用于當(dāng)前正經(jīng)譯碼的層(S卩,當(dāng)前層)中的對應(yīng)塊的預(yù)測模式的良好估計。因此,如果一些預(yù)測信息不可用于當(dāng)前層中的塊,那么視頻譯碼器可傳播來自基礎(chǔ)層中的相同位置的塊的相同預(yù)測信息(例如幀內(nèi)預(yù)測方向及運動信息)(在可用的情況下),且使用所述預(yù)測信息如同所述預(yù)測信息為當(dāng)前層中的塊的預(yù)測信息。視頻譯碼器可使用當(dāng)前層中的所傳播預(yù)測信息來預(yù)測當(dāng)前層中的隨后塊的預(yù)測信息。此可幫助改良譯碼效率。
[0067]圖7為說明跨越層的預(yù)測信息的傳播的實例實施例的概念圖。舉例來說,視頻譯碼器(例如,視頻編碼器250或視頻解碼器280)可確定增強層相鄰塊不具有與當(dāng)前塊相同的預(yù)測模式。在此實例中,增強層相鄰塊及當(dāng)前塊可處于一增強層中。另外,視頻譯碼器可確定基礎(chǔ)層相鄰塊具有與當(dāng)前塊相同的預(yù)測模式。在此實例中,基礎(chǔ)層相鄰塊處于基礎(chǔ)層中,且與增強層相鄰塊在相同位置。在傳統(tǒng)實施方案下,當(dāng)增強層相鄰塊及當(dāng)前塊不具有相同預(yù)測模式時,傳統(tǒng)系統(tǒng)使用來自增強層相鄰塊的預(yù)測信息而跳過去從而確定當(dāng)前塊的預(yù)測信息。然而,在圖7的實施例中,響應(yīng)于確定增強層相鄰塊不具有與當(dāng)前塊相同的預(yù)測模式且基礎(chǔ)層相鄰塊具有與當(dāng)前塊相同的預(yù)測模式,視頻譯碼器可使用基礎(chǔ)層相鄰塊的預(yù)測信息來確定當(dāng)前塊的預(yù)測信息。在一些情況下,基礎(chǔ)層相鄰塊的預(yù)測信息為幀內(nèi)預(yù)測模式,及當(dāng)前塊的預(yù)測信息也為幀內(nèi)預(yù)測模式。在其它情況下,基礎(chǔ)層相鄰塊的預(yù)測信息及當(dāng)前塊的預(yù)測信息為運動信息。
[0068]在先前段落的實例中,視頻譯碼器可通過包含基礎(chǔ)層相鄰塊的預(yù)測信息作為當(dāng)前塊的候選列表中的候選者來預(yù)測當(dāng)前塊的預(yù)測信息。在視頻譯碼器編碼視頻數(shù)據(jù)的實例中,預(yù)測當(dāng)前塊的預(yù)測信息可包括從所述候選列表中的候選者中選擇給定候選者。在此類實例中,視頻編碼器可輸出選定候選者的索引。在視頻譯碼器解碼視頻數(shù)據(jù)的實例中,視頻解碼器可接收候選列表中的給定候選者的索引。在此類實例中,預(yù)測當(dāng)前塊的預(yù)測信息可包括使用給定候選者的預(yù)測信息作為當(dāng)前塊的預(yù)測信息。
[0069]根據(jù)本發(fā)明的技術(shù),存在至少三種情況,其中增強層塊可借用來自基礎(chǔ)層中的相同位置塊的預(yù)測信息,使得此類借用預(yù)測信息可用于譯碼當(dāng)前增強層處的隨后塊。
[0070]在第一情況下,給定塊705在INTRA_BL模式中經(jīng)譯碼且因此不具有原生幀內(nèi)預(yù)測方向或運動信息。(圖7,左上)。在此第一,清況下,對于當(dāng)前層710中的給定塊705的每一4X4子部分,從其基礎(chǔ)層的相同位置的子部分725復(fù)制幀內(nèi)預(yù)測方向715及運動信息720。由于子部分725經(jīng)幀內(nèi)譯碼,所以其不具有任何原生運動信息。因此從其基礎(chǔ)層的相同位置的子部分730復(fù)制子部分725的運動信息,子部分730經(jīng)幀間譯碼。幀內(nèi)預(yù)測方向及運動信息按以上方式的傳播可有益于隨后塊的預(yù)測(在隨后塊以幀內(nèi)或幀間模式譯碼的情況下)。隨后塊可為當(dāng)前層中的根據(jù)譯碼次序在給定塊之后發(fā)生的塊。
[0071]舉例來說,增強層相鄰塊的預(yù)測模式可為INTRA_BL,及當(dāng)前塊的預(yù)測模式可為幀間模式或幀內(nèi)模式。在此實例中,基礎(chǔ)層相鄰塊的預(yù)測信息為幀內(nèi)預(yù)測模式或運動信息。在此實例中,視頻譯碼器可使用基礎(chǔ)層相鄰塊的預(yù)測信息來確定當(dāng)前塊的預(yù)測信息。
[0072]在第二情況下,給定塊735在幀內(nèi)模式中經(jīng)譯碼,因此其不具有原生運動信息(圖7,頂部中心)。在此第二情況下,對于每一 4X4子部分,從其基礎(chǔ)層的相同位置子部分745復(fù)制運動信息740,子部分745經(jīng)幀間譯碼。請注意在此情況下盡管幀內(nèi)預(yù)測方向是從子部分750傳播到子部分745,但其不傳播到子部分735,這是因為子部分735具有更準(zhǔn)確的原生幀內(nèi)預(yù)測信息。運動信息按以上方式的傳播可有益于隨后塊的預(yù)測(在隨后塊以幀間模式譯碼的情況下)。隨后塊可為當(dāng)前層中的根據(jù)譯碼次序在給定塊之后發(fā)生的塊。舉例來說,增強層相鄰塊的預(yù)測模式可為幀內(nèi)模式,及當(dāng)前塊的預(yù)測模式可為幀間模式。在此實例中,視頻譯碼器可使用基礎(chǔ)層相鄰塊的預(yù)測信息來確定當(dāng)前塊的預(yù)測信息。
[0073]在第三情況下,當(dāng)前塊755在幀間模式中經(jīng)譯碼。(圖7,右上方)。在此第三情況下,對于每一 4X4子部分,可從其基礎(chǔ)層的相同位置子部分765復(fù)制幀內(nèi)預(yù)測方向760(在可用的情況下)。由于子部分765作為INTRA_BL而經(jīng)譯碼,所以其不具有原生幀內(nèi)預(yù)測信息,因此從其基礎(chǔ)層的相同位置子部分770復(fù)制幀內(nèi)預(yù)測信息。幀內(nèi)預(yù)測信息按以上方式的傳播可有益于隨后塊的預(yù)測(在隨后塊以幀內(nèi)模式譯碼的情況下)。隨后塊可為當(dāng)前層中的根據(jù)譯碼次序在給定塊之后發(fā)生的塊。舉例來說,增強層相鄰塊的預(yù)測模式可為幀間模式,及當(dāng)前塊的預(yù)測模式可為幀內(nèi)模式。在此實例中,視頻譯碼器可使用基礎(chǔ)層相鄰塊的預(yù)測信息來確定當(dāng)前塊的預(yù)測信息。
[0074]此外,根據(jù)本發(fā)明的技術(shù),可在跨越層傳播預(yù)測信息的同時執(zhí)行以下內(nèi)容:
[0075]第一,倘若基礎(chǔ)層及增強層不具有相同空間分辨率(例如,空間可縮放性情形),視頻譯碼器可需要相應(yīng)地處理預(yù)測信息。舉例來說,視頻譯碼器可能需要在此情況下基于兩層之間的空間縮放比來縮放運動向量。
[0076]以此方式,增強層及基礎(chǔ)層可具有不同的空間分辨率,且基礎(chǔ)層相鄰塊的預(yù)測信息可包括運動向量。視頻譯碼器可至少部分通過縮放運動向量來確定當(dāng)前塊的預(yù)測信息。
[0077]第二,如果基礎(chǔ)層中的相同位置塊的參考圖片也在當(dāng)前層參考圖片列表中,那么可將信息從基礎(chǔ)層中的相同位置塊直接傳播到當(dāng)前層。否則,可能需要適當(dāng)?shù)挠成洹Ee例來說,視頻譯碼器可基于基礎(chǔ)層塊中的參考圖片相對于當(dāng)前圖片的圖片次序計數(shù)(POC)距離以及當(dāng)前增強層中的參考圖片相對于當(dāng)前圖片的POC距離而相應(yīng)地縮放運動向量。
[0078]舉例來說,基礎(chǔ)層相鄰塊的預(yù)測信息可包括運動向量以及指示基礎(chǔ)層參考圖片列表中的參考圖片的參考圖片索引。在此實例中,基礎(chǔ)層參考圖片列表可為與基礎(chǔ)層相鄰塊相關(guān)聯(lián)的參考圖片列表。此外,在此實例中,增強層參考圖片列表不同于基礎(chǔ)層參考圖片列表。增強層參考圖片列表為與增強層相鄰塊相關(guān)聯(lián)的參考圖片列表。在此實例中,視頻譯碼器可至少部分通過基于參考圖片相對于當(dāng)前圖片的圖片次序計數(shù)(POC)距離以及增強層參考圖片列表中的參考圖片相對于當(dāng)前圖片的POC距離而縮放運動向量來確定當(dāng)前塊的預(yù)測信息。
[0079]在形成用于譯碼給定塊的預(yù)測信息的預(yù)測值時,從基礎(chǔ)層傳播的預(yù)測信息可經(jīng)指派比從當(dāng)前層獲得的預(yù)測信息低的權(quán)重。舉例來說,確定當(dāng)前塊的預(yù)測信息可包括相對于增強層中的塊的預(yù)測信息而指派較低權(quán)重到基礎(chǔ)層相鄰塊的預(yù)測信息。
[0080]圖8為說明經(jīng)配置以實施本發(fā)明的技術(shù)的視頻編碼器250的實例實施例的框圖。圖8是出于解釋的目的而提供,且不應(yīng)被視為將技術(shù)限制為本發(fā)明中所大致例示及描述的。出于解釋的目的,本發(fā)明在HEVC譯碼的上下文中描述視頻編碼器250。然而,本發(fā)明的技術(shù)可適用于其它譯碼標(biāo)準(zhǔn)或方法。
[0081]在圖8的實例中,視頻編碼器250包含多個功能組件。視頻編碼器250的功能組件包含預(yù)測模塊800、殘差產(chǎn)生模塊802、變換模塊804、量化模塊806、逆量化模塊808、逆變換模塊810、重建模塊812、濾波器模塊813、經(jīng)解碼圖片緩沖器814及熵編碼模塊816。預(yù)測模塊800包含運動估計模塊822、運動補償模塊824及幀內(nèi)預(yù)測模塊826。在其它實例中,視頻編碼器250可包含更多、更少或不同功能組件。此外,運動估計模塊822與運動補償模塊824可高度集成,但出于解釋的目的而在圖8的實例中分開表示。
[0082]視頻編碼器250可接收視頻數(shù)據(jù)。視頻編碼器250可從各種源接收視頻數(shù)據(jù)。舉例來說,視頻編碼器250可接收來自視頻源240(圖2)或另一源的視頻數(shù)據(jù)。視頻數(shù)據(jù)可表示一系列圖片。為編碼視頻數(shù)據(jù),視頻編碼器250可對圖片中的每一者執(zhí)行編碼操作。
[0083]作為對圖片執(zhí)行編碼操作的部分,視頻編碼器250可對圖片的每一切片執(zhí)行編碼操作。作為對切片執(zhí)行編碼操作的部分,視頻編碼器250可對切片中的樹塊執(zhí)行編碼操作。
[0084]作為對樹塊執(zhí)行編碼操作的部分,預(yù)測模塊800可對樹塊的視頻塊執(zhí)行四叉樹分割以將所述視頻塊劃分成逐漸變小的視頻塊。較小視頻塊中的每一者可與不同CU相關(guān)聯(lián)。舉例來說,預(yù)測模塊800可將樹塊的視頻塊分割成四個大小相等的子塊、將所述子塊中的一或多者分割成四個大小相等的子子塊,以此類推。
[0085]與⑶相關(guān)聯(lián)的視頻塊的大小范圍可從8X8樣本高達最大64X64像素或更大的樹塊大小。在本發(fā)明中,“NXN”及“N乘N”可互換使用來指在垂直及水平尺寸方面的視頻塊的樣本尺寸,例如,16X16樣本或16乘16樣本。一般來說,16X16視頻塊在垂直方向上具有十六個樣本(y = 16),且在水平方向上具有十六個樣本(X = 16)。同樣,NXN塊一般在垂直方向上具有N個樣本,且在水平方向上具有N個樣本,其中N表示非負整數(shù)值。
[0086]此外,作為對樹塊執(zhí)行編碼操作的部分,預(yù)測模塊800可產(chǎn)生用于所述樹塊的階層式四叉樹數(shù)據(jù)結(jié)構(gòu)。舉例來說,樹塊可對應(yīng)于四叉樹數(shù)據(jù)結(jié)構(gòu)的根節(jié)點。如果預(yù)測模塊800將樹塊的視頻塊分割成四個子塊,則根節(jié)點在四叉樹數(shù)據(jù)結(jié)構(gòu)中具有四個子節(jié)點。所述子節(jié)點中的每一者對應(yīng)于與子塊中的一者相關(guān)聯(lián)的CU。如果預(yù)測模塊800將子塊中的一者分割成四個子子塊,則對應(yīng)于與子塊相關(guān)聯(lián)的CU的節(jié)點可具有四個子節(jié)點,每一子節(jié)點對應(yīng)于與所述子子塊中的一者相關(guān)聯(lián)的CU。
[0087]四叉樹數(shù)據(jù)結(jié)構(gòu)的每一節(jié)點可含有用于對應(yīng)樹塊或CU的語法數(shù)據(jù)(例如,語法元素)。舉例來說,四叉樹中的節(jié)點可包含分裂旗標(biāo),其指示對應(yīng)于所述節(jié)點的CU的視頻塊是否被分割(例如,分裂)成四個子塊。CU的語法元素可經(jīng)遞歸地界定,且可取決于CU的視頻塊是否分裂成子塊。視頻塊未被分割的CU可對應(yīng)于四叉樹數(shù)據(jù)結(jié)構(gòu)中的葉節(jié)點。經(jīng)譯碼樹塊可包含基于用于對應(yīng)樹塊的四叉樹數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)。
[0088]視頻編碼器250可對樹塊中的每一未分割⑶執(zhí)行編碼操作。當(dāng)視頻編碼器250對未分割CU執(zhí)行編碼操作時,視頻編碼器250產(chǎn)生表示未分割CU的經(jīng)編碼表示的數(shù)據(jù)。
[0089]作為對⑶執(zhí)行編碼操作的部分,預(yù)測模塊800可在⑶的一或多個I3U中分割⑶的視頻塊。視頻編碼器250及視頻解碼器280可支持各種PU大小。假定特定CU的大小為2NX2N,視頻編碼器250及視頻解碼器280可支持2NX2N或NXN的PU大小,及2NX2N、2N X N、N X 2N、N X N、2N X nU、nL X 2N、nR X 2N或類似的對稱I3U大小的幀間預(yù)測。視頻編碼器250及視頻解碼器280還可支持用于2NXnU、2NXnD、nLX2N和nRX2N的PU大小的不對稱分割。在一些實例中,預(yù)測模塊800可執(zhí)行幾何分割以沿并不按直角與CU的視頻塊的側(cè)相交的邊界來在CU的PU中分割CU的視頻塊。
[0090]運動估計模塊822及運動補償模塊824可對⑶的每一 PU執(zhí)行幀間預(yù)測。幀間預(yù)測可提供時間壓縮。為了對PU執(zhí)行幀間預(yù)測,運動估計模塊822可產(chǎn)生用于所述的運動信息。運動補償模塊824可基于不同于與CU相關(guān)聯(lián)的圖片(例如,參考圖片)的圖片的運動信息及經(jīng)解碼樣本來產(chǎn)生用于PU的預(yù)測視頻塊。在本發(fā)明中,由運動補償模塊824產(chǎn)生的預(yù)測視頻塊可被稱為經(jīng)幀間預(yù)測視頻塊。
[0091]切片可為I切片、P切片,或B切片。運動估計模塊822及運動補償模塊824可取決于I3U處于I切片、P切片還是B切片中而對CU的PU執(zhí)行不同操作。在I切片中,所有PU均經(jīng)幀內(nèi)預(yù)測。因此,如果I3U在I切片中,那么運動估計模塊822及運動補償模塊824不對PU執(zhí)行幀間預(yù)測。
[0092]如果PU處于P切片中,那么含有的圖片與稱為“列表O”的參考圖片列表相關(guān)聯(lián)。列表O中的參考圖片中的每一者含有可用于按解碼次序?qū)罄m(xù)圖片進行幀間預(yù)測的樣本。當(dāng)運動估計模塊822關(guān)于P切片中的PU執(zhí)行運動估計操作時,運動估計模塊822可搜索列表O中的參考圖片以找出用于F1U的參考樣本。PU的參考樣本可為最接近對應(yīng)于F1U的視頻塊中的樣本的一組樣本,例如樣本塊。運動估計模塊822可使用多種度量來確定參考圖片中的一組樣本對應(yīng)于I3U的視頻塊中的樣本的接近程度。舉例來說,運動估計模塊822可通過絕對差總和(SAD)、平方差總和(SSD)或其它差異度量來確定參考圖片中的一組樣本對應(yīng)于I3U的視頻塊中的樣本的接近程度。
[0093]在識別出P切片中的的參考樣本之后,運動估計模塊822可產(chǎn)生指示列表O中的參考圖片含有參考樣本的參考索引及指不PU與參考樣本之間的空間位移的運動向量。在各種實例中,運動估計模塊822可以變化的精確度產(chǎn)生運動向量。舉例來說,運動估計模塊822可以四分之一樣本精度、八分之一樣本精度或其它分?jǐn)?shù)樣本精度產(chǎn)生運動向量。在分?jǐn)?shù)樣本精度的情況下,參考樣本值可從整數(shù)位置樣本值內(nèi)插在參考圖片中。運動估計模塊822可將參考索引及運動向量輸出為的運動信息。運動補償模塊824可基于PU的運動信息所識別的參考樣本來產(chǎn)生PU的經(jīng)預(yù)測視頻塊。
[0094]如果PU在B切片中,那么含有的圖片可與稱為“列表O”及“列表I”的兩參考圖片列表相關(guān)聯(lián)。列表O中的參考圖片中的每一者含有可用于按解碼次序?qū)罄m(xù)圖片進行幀間預(yù)測的樣本。列表I中的參考圖片按解碼次序出現(xiàn)在所述圖片之前但按呈現(xiàn)次序在所述圖片之后。在一些實例中,含有B切片的圖片可與為列表O與列表I的組合的列表組合相關(guān)聯(lián)。
[0095]此外,如果I3U在B切片中,那么運動估計模塊822可對PU執(zhí)行單向預(yù)測或雙向預(yù)測。當(dāng)運動估計模塊822對PU執(zhí)行單向預(yù)測時,運動估計模塊822可搜索列表O或列表I的參考圖片以找出用于所述PU的參考樣本。運動估計模塊822可接著產(chǎn)生指示列表O或列表I中的含有所述參考樣本的參考圖片的參考索引以及指不PU與所述參考樣本之間的空間位移的運動向量。運動估計模塊822可輸出參考索引、預(yù)測方向指示符及運動向量作為PU的運動信息。預(yù)測方向指示符可指示參考索引指示列表O還是列表I中的參考圖片。運動補償模塊824可基于PU的運動信息所指示的參考樣本來產(chǎn)生的經(jīng)預(yù)測視頻塊。
[0096]當(dāng)運動估計模塊822對PU執(zhí)行雙向預(yù)測時,運動估計模塊822可搜索列表O中的參考圖片以找出用于所述PU的參考樣本,且還可搜索列表I中的參考圖片以找出用于所述PU的另一參考樣本。運動估計|旲塊822可接著廣生指不列表O或列表I中的含有參考樣本的參考圖片的參考索引以及指示所述參考樣本與PU之間的空間位移的運動向量。運動估計模塊822可將PU的參考索引及運動向量輸出為的運動信息。運動補償模塊824可基于PU的運動信息所指示的參考樣本來產(chǎn)生的經(jīng)預(yù)測視頻塊。
[0097]在一些情況下,運動估計模塊822未將用于的運動信息的全部集合輸出到熵編碼模塊816。而是,運動估計模塊822可參考另一的運動信息而用信號發(fā)送的運動信息。舉例來說,運動估計模塊822可確定PU的運動信息足夠類似于相鄰的運動信息。在此實例中,運動估計模塊822可在與PU相關(guān)聯(lián)的CU的四叉樹節(jié)點中指示一值,所述值向視頻解碼器280指示PU具有與相鄰相同的運動信息。在另一實例中,運動估計模塊822可在與PU所關(guān)聯(lián)的CU相關(guān)聯(lián)的四叉樹節(jié)點中識別相鄰PU及運動向量差(MVD)。運動向量差指示PU的運動向量與所指示的相鄰PU的運動向量之間的差。視頻解碼器280可使用所指示的相鄰PU的運動向量及運動向量差來預(yù)測PU的運動向量。
[0098]或者,如果運動向量不可用于相鄰PU (例如,由于相鄰I3U經(jīng)幀內(nèi)譯碼),那么運動向量可從對應(yīng)于相鄰PU的基礎(chǔ)層I3U獲得。來自基礎(chǔ)層I3U的運動向量接著可用以預(yù)測I3U的運動向量。通過在用信號發(fā)送第二 PU的運動信息時參考第一的運動信息,運動估計模塊822可能夠使用較少位來用信號發(fā)送第二的運動信息,無論第一為相鄰PU還是基礎(chǔ)層PU。
[0099]作為對CU執(zhí)行編碼操作的部分,幀內(nèi)預(yù)測模塊826可對CU的PU執(zhí)行幀內(nèi)預(yù)測。幀內(nèi)預(yù)測可提供空間壓縮。當(dāng)幀內(nèi)預(yù)測模塊826對PU執(zhí)行幀內(nèi)預(yù)測時,幀內(nèi)預(yù)測模塊826可基于同一圖片中的其它PU的經(jīng)解碼樣本來產(chǎn)生用于的預(yù)測數(shù)據(jù)。用于的預(yù)測數(shù)據(jù)可包含預(yù)測視頻塊及各種語法元素。幀內(nèi)預(yù)測模塊826可對I切片、P切片及B切片中的I3U執(zhí)行幀內(nèi)預(yù)測。
[0100]為對PU執(zhí)行幀內(nèi)預(yù)測,幀內(nèi)預(yù)測模塊826可使用多個幀內(nèi)預(yù)測模式來產(chǎn)生用于的多個預(yù)測數(shù)據(jù)集合。當(dāng)幀內(nèi)預(yù)測模塊826使用幀內(nèi)預(yù)測模式來產(chǎn)生用于的預(yù)測數(shù)據(jù)集合時,幀內(nèi)預(yù)測模塊826可在與幀內(nèi)預(yù)測模式相關(guān)聯(lián)的方向及/或梯度上將樣本從相鄰PU的視頻塊跨越I3U的視頻塊進行擴展。相鄰I3U可在所述I3U的上方、右上方、左上方或左方,假定對于PU、CU及樹塊采用從左到右、從上到下的編碼次序。幀內(nèi)預(yù)測模塊826可取決于PU的大小而使用各種數(shù)目個幀內(nèi)預(yù)測模式,例如33方向幀內(nèi)預(yù)測模式。
[0101]預(yù)測模塊800可從由運動補償模塊824針對PU產(chǎn)生的預(yù)測數(shù)據(jù)或由幀內(nèi)預(yù)測模塊826針對PU產(chǎn)生的預(yù)測數(shù)據(jù)當(dāng)中選擇用于的預(yù)測數(shù)據(jù)。在一些實例中,預(yù)測模塊800基于預(yù)測數(shù)據(jù)集合的速率/失真度量來選擇用于PU的預(yù)測數(shù)據(jù)。
[0102]如果預(yù)測模塊800選擇由幀內(nèi)預(yù)測模塊826產(chǎn)生的預(yù)測數(shù)據(jù),那么預(yù)測模塊800可用信號發(fā)送用以產(chǎn)生用于PU的預(yù)測數(shù)據(jù)的幀內(nèi)預(yù)測模式,例如選定幀內(nèi)預(yù)測模式。預(yù)測模塊800可以各種方式用信號發(fā)送選定幀內(nèi)預(yù)測模式。舉例來說,有可能選定幀內(nèi)預(yù)測模式與相鄰PU的幀內(nèi)預(yù)測模式相同。換句話說,相鄰PU的幀內(nèi)預(yù)測模式可為當(dāng)前的最可能模式。因此,預(yù)測模塊800可產(chǎn)生語法元素以指示選定幀內(nèi)預(yù)測模式與相鄰的幀內(nèi)預(yù)測模式相同。
[0103]如果幀內(nèi)預(yù)測模式不可用于相鄰例如,由于相鄰經(jīng)幀間譯碼),那么幀內(nèi)預(yù)測模式可從對應(yīng)于相鄰PU的基礎(chǔ)層獲得。來自基礎(chǔ)層的模式信息可接著用以預(yù)測當(dāng)前PU的模式信息。通過在用信號發(fā)送第二 PU的模式信息時參考第一的模式信息,預(yù)測模塊800可能夠使用較少位來用信號發(fā)送第二的運動信息,無論第一為相鄰PU還是基礎(chǔ)層W。
[0104]在預(yù)測模塊800選擇用于⑶的的預(yù)測數(shù)據(jù)之后,殘余產(chǎn)生模塊802可通過從CU的視頻塊減去CU的PU的預(yù)測視頻塊來產(chǎn)生用于CU的殘余數(shù)據(jù)。CU的殘余數(shù)據(jù)可包含對應(yīng)于CU的視頻塊中的樣本的不同樣本分量的2D殘余視頻塊。舉例來說,殘余數(shù)據(jù)可包含對應(yīng)于CU的PU的預(yù)測視頻塊中的樣本的明度分量與CU的原始視頻塊中的樣本的明度分量之間的差的殘余視頻塊。另外,CU的殘余數(shù)據(jù)可包含對應(yīng)于CU的PU的預(yù)測視頻塊中的樣本的色度分量與CU的原始視頻塊中的樣本的色度分量之間的差的殘余視頻塊。
[0105]預(yù)測模塊800可執(zhí)行四叉樹分割以將CU的殘余視頻塊分割成子塊。每一未劃分殘余視頻塊可與CU的不同TU相關(guān)聯(lián)。與CU的TU相關(guān)聯(lián)的殘余視頻塊的大小及位置可或可不基于與CU的PU相關(guān)聯(lián)的視頻塊的大小及位置。被稱為“殘余四叉樹”(RQT)的四叉樹結(jié)構(gòu)可包含與殘余視頻塊中的每一者相關(guān)聯(lián)的節(jié)點。CU的未分割TU可對應(yīng)于RQT的葉節(jié)點。
[0106]如果與TU相關(guān)聯(lián)的殘余視頻塊分割為多個較小殘余視頻塊,那么TU可具有一或多個子TU。較小殘余視頻塊中的每一者可與子TU中的不同一者相關(guān)聯(lián)。
[0107]變換模塊804可通過將一或多個變換應(yīng)用到與TU相關(guān)聯(lián)的殘余視頻塊而產(chǎn)生用于CU的每一未分割TU的一或多個變換系數(shù)塊。所述變換系數(shù)塊中的每一者可為變換系數(shù)的2D矩陣。變換模塊804可將各種變換應(yīng)用到與TU相關(guān)聯(lián)的殘余視頻塊。舉例來說,變換模塊804可將離散余弦變換(DCT)、定向變換或概念上類似的變換應(yīng)用到與TU相關(guān)聯(lián)的殘余視頻塊。
[0108]在變換模塊804產(chǎn)生與TU相關(guān)聯(lián)的變換系數(shù)塊之后,量化模塊806可量化變換系數(shù)塊中的變換系數(shù)。量化模塊806可基于與CU相關(guān)聯(lián)的QP值而量化與CU的TU相關(guān)聯(lián)的變換系數(shù)塊。
[0109]視頻編碼器250可以各種方式使QP值與⑶相關(guān)聯(lián)。舉例來說,視頻編碼器250可對與CU相關(guān)聯(lián)的樹塊執(zhí)行速率失真分析。在速率-失真分析中,視頻編碼器250可通過對樹塊執(zhí)行多次編碼操作而產(chǎn)生所述樹塊的多個經(jīng)譯碼表示。當(dāng)視頻編碼器250產(chǎn)生樹塊的不同經(jīng)編碼表示時,視頻編碼器250可使不同QP值與CU相關(guān)聯(lián)。當(dāng)給定QP值與具有最低位速率及失真度量的樹塊的經(jīng)譯碼表示中的CU相關(guān)聯(lián)時,視頻編碼器250可用信號發(fā)送所述給定QP值與CU相關(guān)聯(lián)。
[0110]逆量化模塊808及逆變換模塊810可分別應(yīng)用逆量化及逆變換到變換系數(shù)塊以從變換系數(shù)塊重建殘余視頻塊。重建模塊812可將經(jīng)重建殘余視頻塊添加到來自由預(yù)測模塊800產(chǎn)生的一或多個預(yù)測視頻塊的對應(yīng)樣本以產(chǎn)生與TU相關(guān)聯(lián)的經(jīng)重建視頻塊。通過以此方式重建⑶的每一 TU的視頻塊,視頻編碼器250可重建⑶的視頻塊。
[0111]在重建模塊812重建⑶的視頻塊之后,濾波器模塊813可執(zhí)行解塊操作以減小與所述CU相關(guān)聯(lián)的視頻塊中的成塊假影。在執(zhí)行一或多個解塊操作之后,濾波器模塊813可將⑶的經(jīng)重建視頻塊存儲到經(jīng)解碼圖片緩沖器814中。運動估計模塊822及運動補償模塊824可使用含有所述經(jīng)重建視頻塊的參考圖片來對后續(xù)圖片的執(zhí)行幀間預(yù)測。另外,幀內(nèi)預(yù)測模塊826可使用經(jīng)解碼圖片緩沖器814中的經(jīng)重建視頻塊來對處于與CU同一圖片中的其它I3U執(zhí)行幀內(nèi)預(yù)測。
[0112]以此方式,在濾波器模塊813將解塊濾波器應(yīng)用到與邊緣相關(guān)聯(lián)的樣本之后,預(yù)測模塊800可至少部分基于與邊緣相關(guān)聯(lián)的樣本而產(chǎn)生經(jīng)預(yù)測視頻塊。視頻編碼器250可輸出包含一或多個語法元素的位流,所述語法元素的值是至少部分基于經(jīng)預(yù)測視頻塊。
[0113]熵編碼模塊816可接收來自視頻編碼器250的其它功能組件的數(shù)據(jù)。舉例來說,熵編碼模塊816可接收來自量化模塊806的變換系數(shù)塊及可接收來自預(yù)測模塊800的語法元素。當(dāng)熵編碼模塊816接收數(shù)據(jù)時,熵編碼模塊816可執(zhí)行一或多個熵編碼操作以產(chǎn)生熵編碼數(shù)據(jù)。舉例來說,視頻編碼器250可對所述數(shù)據(jù)執(zhí)行上下文自適應(yīng)可變長度譯碼(CAVLC)操作、CABAC操作、可變到可變(V2V)長度譯碼操作、基于語法的上下文自適應(yīng)二進制算術(shù)譯碼(SBAC)操作、概率區(qū)間分割熵(PIPE)譯碼操作,或另一類型的熵編碼操作。熵編碼模塊816可輸出包含所述熵編碼數(shù)據(jù)的位流。
[0114]作為對數(shù)據(jù)執(zhí)行熵編碼操作的部分,熵編碼模塊816可選擇上下文模型。如果熵編碼模塊816正執(zhí)行CABAC操作,那么上下文模型可指示特定二進制數(shù)(bin)具有特定值的概率估計。在CABAC的上下文中,術(shù)語“二進制數(shù)”用于指語法元素的二進制化版本的位。
[0115]如果熵編碼模塊816正執(zhí)行CAVLC操作,那么上下文模型可將系數(shù)映射到對應(yīng)碼字。CAVLC中的碼字可經(jīng)建構(gòu)而使得相對較短的代碼對應(yīng)于可能性較高的符號,而相對較長的代碼對應(yīng)于可能性較低的符號。適當(dāng)上下文模型的選擇可影響熵編碼操作的譯碼效率。
[0116]圖9為說明可實施本發(fā)明的技術(shù)的視頻解碼器280的實例實施例的框圖。圖9是出于解釋的目的而提供,且并不將技術(shù)限制為本發(fā)明中所大致例示及描述的。出于解釋的目的,本發(fā)明在HEVC譯碼的上下文中描述視頻解碼器280。然而,本發(fā)明的技術(shù)可適用于其它譯碼標(biāo)準(zhǔn)或方法。
[0117]在圖9的實例中,視頻解碼器280包含多個功能組件。視頻解碼器280的功能組件包含熵解碼模塊950、預(yù)測模塊952、逆量化模塊954、逆變換模塊956、重建模塊958、濾波器模塊959、及經(jīng)解碼圖片緩沖器960。預(yù)測模塊952包含運動補償模塊962及幀內(nèi)預(yù)測模塊964。在一些實例中,視頻解碼器280可執(zhí)行大體上與關(guān)于圖8的視頻編碼器250所描述的編碼遍次互逆的解碼遍次。在其他實例中,視訊解碼器280可包含較多、較少或不同的功能組件。
[0118]視頻解碼器280可接收包括經(jīng)編碼的視頻數(shù)據(jù)的位流。所述位流可包含多個語法元素。當(dāng)視頻解碼器280接收位流時,熵解碼模塊950可對所述位流執(zhí)行剖析操作。作為對位流執(zhí)行解析操作的結(jié)果,熵解碼模塊950可從所述位流提取語法元素。作為執(zhí)行剖析操作的部分,熵解碼模塊950可對位流中的熵編碼語法元素進行熵解碼。預(yù)測模塊952、逆量化模塊954、逆變換模塊956、重建模塊958及濾波器模塊959可執(zhí)行重建操作,所述重建操作基于從位流提取的語法元素產(chǎn)生經(jīng)解碼視頻數(shù)據(jù)。
[0119]如上文所論述,位流可包括一系列NAL單元。位流的NAL單元可包含序列參數(shù)集NAL單元、圖片參數(shù)集NAL單元、SEI NAL單元,等。作為對位流執(zhí)行剖析操作的部分,熵解碼模塊950可執(zhí)行剖析操作,所述剖析操作從序列參數(shù)集NAL單元提取且熵解碼序列參數(shù)集、從圖片參數(shù)集NAL單元提取且熵解碼圖片參數(shù)集、從SEI NAL單元提取且熵解碼SEI數(shù)據(jù),等。
[0120]另外,位流的NAL單元可包含經(jīng)譯碼切片NAL單元。作為對位流執(zhí)行剖析操作的部分,熵解碼模塊950可執(zhí)行剖析操作,所述剖析操作從經(jīng)譯碼切片NAL單元提取且熵解碼經(jīng)譯碼切片。經(jīng)寫碼切片中之每一者可包括切片標(biāo)頭及切片數(shù)據(jù)。切片標(biāo)頭可含有關(guān)于切片的語法元素。切片標(biāo)頭中的語法元素可包含識別與含有所述切片的圖片相關(guān)聯(lián)的圖片參數(shù)集的語法元素。熵解碼模塊950可對經(jīng)譯碼切片標(biāo)頭執(zhí)行熵解碼操作(例如CAVLC解碼操作),以恢復(fù)所述切片標(biāo)頭。
[0121]在從經(jīng)譯碼切片NAL單元提取切片數(shù)據(jù)之后,熵解碼模塊950可從所述切片數(shù)據(jù)提取經(jīng)譯碼樹塊。熵解碼模塊950可接著從經(jīng)譯碼樹塊提取經(jīng)譯碼CU。熵解碼模塊950可執(zhí)行剖析操作,所述剖析操作從經(jīng)譯碼CU提取語法元素。經(jīng)提取語法元素可包含經(jīng)熵編碼的變換系數(shù)塊。熵解碼模塊950可接著對語法元素執(zhí)行熵解碼操作。舉例來說,熵解碼模塊950可對變換系數(shù)塊執(zhí)行CABAC操作。
[0122]在熵解碼模塊950對未分割CU執(zhí)行剖析操作之后,視頻解碼器280可對所述未分割⑶執(zhí)行重建操作。為對未分割⑶執(zhí)行重建操作,視頻解碼器280可對⑶的每一 TU執(zhí)行重建操作。通過對CU的每一 TU執(zhí)行重建操作,視頻解碼器280可重建與CU相關(guān)聯(lián)的殘余視頻塊。
[0123]作為對TU執(zhí)行重建操作的部分,逆量化模塊954可逆量化(S卩,解量化)與TU相關(guān)聯(lián)的變換系數(shù)塊。逆量化模塊954可以類似于針對HEVC所提議或由H.264解碼標(biāo)準(zhǔn)界定的逆量化過程的方式來對變換系數(shù)塊進行逆量化。逆量化模塊954可使用由視頻編碼器250針對變換系數(shù)塊的CU所計算的量化參數(shù)QP來確定量化程度,且同樣地確定逆量化程度來供逆量化模塊954應(yīng)用。
[0124]在逆量化模塊954對變換系數(shù)塊進行逆量化之后,逆變換模塊956可產(chǎn)生用于與變換系數(shù)塊相關(guān)聯(lián)的TU的殘余視頻塊。逆變換模塊956可將逆變換應(yīng)用到變換系數(shù)塊以便產(chǎn)生用于TU的殘余視頻塊。舉例來說,逆變換模塊956可將逆DCT、逆整數(shù)變換、逆卡胡南-洛夫(Karhunen-Loeve)變換(KLT)、逆旋轉(zhuǎn)變換、逆定向變換,或另一逆變換應(yīng)用到變換系數(shù)塊。
[0125]在一些實例中,逆變換模塊956可基于來自視頻編碼器250的信令來確定一逆變換以應(yīng)用于變換系數(shù)塊。在此類實例中,逆變換模塊956可基于在用于與變換系數(shù)塊相關(guān)聯(lián)的樹塊的四叉樹的根節(jié)點處用信號發(fā)送的變換來確定逆變換。在其它實例中,逆變換模塊956可從一或多個譯碼特性(例如塊大小、譯碼模式,或其類似者)推斷逆變換。在一些實例中,逆變換模塊956可應(yīng)用級聯(lián)的逆變換。
[0126]如果⑶的PU是使用幀間預(yù)測進行編碼,那么運動補償模塊962可執(zhí)行運動補償以產(chǎn)生用于PU的預(yù)測視頻塊。運動補償模塊962可使用用于的運動信息來識別所述的參考樣本。PU的參考樣本可與PU處于不同時間圖片中。的運動信息可包含運動向量、參考圖片索引及預(yù)測方向。運動補償模塊962可使用PU的參考樣本來產(chǎn)生用于的預(yù)測視頻塊。在一些實例中,運動補償模塊962可基于與所述相鄰的PU的運動信息來預(yù)測所述PU的運動信息?;蛘?,如果相鄰未經(jīng)幀間譯碼,那么運動補償模塊962可基于對應(yīng)于相鄰I3U的基礎(chǔ)層I3U的運動信息來確定運動信息。在本發(fā)明中,如果視頻編碼器250使用幀間預(yù)測來產(chǎn)生PU的預(yù)測視頻塊,那么所述為經(jīng)幀間預(yù)測W。
[0127]在一些實例中,運動補償模塊962可通過基于內(nèi)插濾波器執(zhí)行內(nèi)插而改進PU的預(yù)測視頻塊。用于將用于以子樣本精度進行運動補償?shù)膬?nèi)插濾波器的識別符可包含在語法元素中。運動補償模塊962可使用由視頻編碼器250在產(chǎn)生PU的預(yù)測視頻塊期間使用的相同內(nèi)插濾波器來計算參考塊的子整數(shù)樣本的內(nèi)插值。運動補償模塊962可根據(jù)所接收的語法信息而確定由視頻編碼器250使用的內(nèi)插濾波器且使用所述內(nèi)插濾波器來產(chǎn)生預(yù)測視頻塊。
[0128]如果PU是使用幀內(nèi)預(yù)測進行編碼,那么幀內(nèi)預(yù)測模塊964可執(zhí)行幀內(nèi)預(yù)測以產(chǎn)生用于PU的預(yù)測視頻塊。舉例來說,幀內(nèi)預(yù)測模塊964可基于位流中的語法元素來確定用于PU的幀內(nèi)預(yù)測模式。位流可包含幀內(nèi)預(yù)測模塊964可用以預(yù)測PU的幀內(nèi)預(yù)測模式的語法元素。
[0129]在一些情況下,語法元素可指示幀內(nèi)預(yù)測模塊964將使用另一的幀內(nèi)預(yù)測模式來確定當(dāng)前PU的幀內(nèi)預(yù)測模式。舉例來說,可能有可能當(dāng)前PU的幀內(nèi)預(yù)測模式與相鄰的幀內(nèi)預(yù)測模式相同。換句話說,相鄰PU的幀內(nèi)預(yù)測模式可為當(dāng)前的最可能模式。因此,在此實例中,位流可包含小語法元素,所述小語法元素指示PU的幀內(nèi)預(yù)測模式與相鄰PU的幀內(nèi)預(yù)測模式相同。幀內(nèi)預(yù)測模塊964可接著使用所述幀內(nèi)預(yù)測模式來基于空間相鄰PU的視頻塊產(chǎn)生所述的預(yù)測數(shù)據(jù)(例如,預(yù)測樣本)。或者,如果相鄰未經(jīng)幀內(nèi)譯碼,那么幀內(nèi)預(yù)測模塊964可參考對應(yīng)于相鄰的基礎(chǔ)層而非參考相鄰本身來確定幀內(nèi)預(yù)測模式。
[0130]重建模塊958可使用與CU的TU相關(guān)聯(lián)的殘余視頻塊及CU的PU的預(yù)測視頻塊(例如,幀內(nèi)預(yù)測數(shù)據(jù)或幀間預(yù)測數(shù)據(jù),如果適用)來重建⑶的視頻塊。因此,視頻解碼器280可基于位流中的語法元素產(chǎn)生預(yù)測視頻塊及殘余視頻塊,且可基于所述預(yù)測視頻塊及所述殘余視頻塊產(chǎn)生視頻塊。
[0131 ] 在重建模塊958重建⑶的視頻塊之后,濾波器模塊959可執(zhí)行解塊操作以減小與所述CU相關(guān)聯(lián)的成塊假影。在濾波器模塊959執(zhí)行解塊操作以減小與CU相關(guān)聯(lián)的成塊假影之后,視頻解碼器280可將所述CU的視頻塊存儲在經(jīng)解碼圖片緩沖器960中。經(jīng)解碼圖片緩沖器960可提供參考圖片以用于后續(xù)運動補償、幀內(nèi)預(yù)測和呈現(xiàn)在顯示裝置(例如圖2的顯示裝置290)上。舉例來說,視頻解碼器280可基于經(jīng)解碼圖片緩沖器960中的視頻塊而執(zhí)行對其它CU的PU的幀內(nèi)預(yù)測或幀間預(yù)測操作。
[0132]在一或多個實例中,所描述功能可以硬件、軟件、固件或其任何組合來實施。如果用軟件實施,那么所述功能可以作為一或多個指令或代碼在計算機可讀媒體上存儲或傳輸,并且由基于硬件的處理單元執(zhí)行。計算機可讀媒體可包含計算機可讀存儲媒體,其對應(yīng)于有形媒體,例如數(shù)據(jù)存儲媒體,或包含促進將計算機程序從一處傳送到另一處的任何媒體(例如,根據(jù)通信協(xié)議)的通信媒體。以此方式,計算機可讀媒體大體上可以對應(yīng)于(I)非暫時性的有形計算機可讀存儲媒體,或(2)通信媒體,例如信號或載波。數(shù)據(jù)存儲媒體可以是可由一或多個計算機或一或多個處理器存取以檢索用于實施本發(fā)明中描述的技術(shù)的指令、代碼及/或數(shù)據(jù)結(jié)構(gòu)的任何可用媒體。計算機程序產(chǎn)品可包含計算機可讀媒體。
[0133]借助于實例而非限制,此類計算機可讀存儲媒體可包括RAM、ROM、EEPROM、CD-ROM或其它光盤存儲裝置、磁盤存儲裝置或其它磁性存儲裝置、快閃存儲器或任何其它可用來存儲呈指令或數(shù)據(jù)結(jié)構(gòu)的形式的所要程序代碼并且可由計算機存取的媒體。而且,任何連接被恰當(dāng)?shù)胤Q為計算機可讀媒體。舉例來說,如果使用同軸電纜、光纖電纜、雙絞線、數(shù)字訂戶線(DSL)或例如紅外線、無線電及微波等無線技術(shù)從網(wǎng)站、服務(wù)器或其它遠程源發(fā)射指令,那么同軸電纜、光纖電纜、雙絞線、DSL或例如紅外線、無線電及微波等無線技術(shù)包含在媒體的定義中。然而,應(yīng)理解,所述計算機可讀存儲媒體及數(shù)據(jù)存儲媒體并不包含連接、載波、信號或其它暫時媒體,而是實際上針對于非暫時性有形存儲媒體。如本文所使用,磁盤及光盤包含壓縮光盤(CD)、激光光盤、光學(xué)光盤、數(shù)字多功能光盤(DVD)、軟性磁盤及藍光光盤,其中磁盤通常以磁性方式復(fù)制數(shù)據(jù),而光盤使用激光以光學(xué)方式復(fù)制數(shù)據(jù)。以上各項的組合也應(yīng)包含在計算機可讀媒體的范圍內(nèi)。
[0134]指令可以由一或多個處理器執(zhí)行,所述一或多個處理器例如是一或多個數(shù)字信號處理器(DSP)、通用微處理器、專用集成電路(ASIC)、現(xiàn)場可編程邏輯陣列(FPGA)、或其它等效的集成或離散邏輯電路。因此,如本文中所使用的術(shù)語“處理器”可指上述結(jié)構(gòu)或適合于實施本文中所描述的技術(shù)的任何其它結(jié)構(gòu)中的任一者。另外,在一些方面中,本文所述的功能性可以在經(jīng)配置用于編碼及解碼的專用硬件及/或軟件模塊內(nèi)提供,或者并入在組合式編解碼器中。而且,可將所述技術(shù)完全實施于一或多個電路或邏輯元件中。
[0135]本發(fā)明的技術(shù)可以在廣泛多種裝置或設(shè)備中實施,包括無線手持機、集成電路(IC)或一組IC(例如,芯片組)。本發(fā)明中描述各種組件、模塊或單元是為了強調(diào)經(jīng)配置以執(zhí)行所揭示的技術(shù)的裝置的功能方面,但未必需要通過不同硬件單元實現(xiàn)。實際上,如上文所描述,各種單元可以結(jié)合合適的軟件及/或固件而組合在編解碼器硬件單元中,或者通過互操作硬件單元的集合來提供,所述硬件單元包含如上文所描述的一或多個處理器。
[0136]已描述各種實例。這些及其它實例在所附權(quán)利要求書的范圍內(nèi)。
【權(quán)利要求】
1.一種用于解碼視頻數(shù)據(jù)的方法,所述方法包括: 識別增強層中的第一視頻分區(qū)中的第一視頻單元,所述第一視頻分區(qū)對應(yīng)于基礎(chǔ)層中的第二視頻分區(qū); 識別緊密地鄰近于所述第一視頻分區(qū)中的所述第一視頻單元的第二視頻單元,其中所述第二視頻單元具有與所述第一視頻單元的預(yù)測模式不同的預(yù)測模式;以及 使用定位在所述第二視頻分區(qū)中的對應(yīng)于所述第一視頻分區(qū)中的所述第二視頻單元的位置的位置處的基礎(chǔ)層視頻單元的預(yù)測信息來確定所述第一視頻單元的預(yù)測信息,其中所述基礎(chǔ)層視頻單元具有與第一視頻單元的所述預(yù)測模式相同的預(yù)測模式。
2.根據(jù)權(quán)利要求1所述的方法,其中所述基礎(chǔ)層視頻單元的所述預(yù)測信息包括幀內(nèi)預(yù)測方向,及所述第一視頻單元的所述預(yù)測信息也包括幀內(nèi)預(yù)測方向。
3.根據(jù)權(quán)利要求2所述的方法,其中所述第二視頻單元的所述預(yù)測模式為幀間模式,及所述第一視頻單元的所述預(yù)測模式為幀內(nèi)模式。
4.根據(jù)權(quán)利要求1所述的方法,其中所述基礎(chǔ)層視頻單元的所述預(yù)測信息及所述第一視頻單元的所述預(yù)測信息兩者包括運動信息。
5.根據(jù)權(quán)利要求4所述的方法,其中所述第二視頻單元的所述預(yù)測模式為幀內(nèi)模式,及所述第一視頻單元的所述預(yù)測模式為幀間模式。
6.根據(jù)權(quán)利要求1所述的方法, 其中所述第二視頻單元的所述預(yù)測模式為INTRA_BL ; 其中所述第一視頻單元的所述預(yù)測模式為幀間模式或幀內(nèi)模式;以及 其中所述基礎(chǔ)層視頻單元的所述預(yù)測信息為幀內(nèi)預(yù)測方向或運動信息。
7.根據(jù)權(quán)利要求1所述的方法,其中包含所述基礎(chǔ)層視頻單元的所述預(yù)測信息作為用于所述第一視頻單元的候選列表中的候選者,且其中確定所述第一視頻單元的所述預(yù)測信息包括接收所述候選列表中的所述所包含候選者的索引。
8.根據(jù)權(quán)利要求1所述的方法, 其中所述增強層及所述基礎(chǔ)層具有不同空間分辨率; 其中所述基礎(chǔ)層視頻單元的所述預(yù)測信息包括運動向量;以及 其中確定所述第一視頻單元的所述預(yù)測信息包括縮放所述運動向量。
9.根據(jù)權(quán)利要求1所述的方法, 其中第一 POC距離包括當(dāng)前圖片與所述第一視頻單元所關(guān)聯(lián)的第一參考圖片之間的圖片次序計數(shù)的差異; 其中第二 POC距離包括所述當(dāng)前圖片與所述基礎(chǔ)層視頻單元所關(guān)聯(lián)的第二參考圖片之間的圖片次序計數(shù)的差異;以及 其中確定所述第一視頻單元的所述預(yù)測信息包括至少部分基于包括所述第一 POC距離及所述第二 POC距離的比率來縮放所述基礎(chǔ)層視頻單元的運動向量。
10.根據(jù)權(quán)利要求1所述的方法,其中確定所述第一視頻單元的所述預(yù)測信息包括相對于所述增強層中的視頻單元的預(yù)測信息而指派較低權(quán)重到所述基礎(chǔ)層視頻單元的所述預(yù)測信息。
11.一種用于編碼視頻數(shù)據(jù)的方法,所述方法包括: 識別增強層中的第一視頻分區(qū)中的第一視頻單元,所述第一視頻分區(qū)對應(yīng)于基礎(chǔ)層中的第二視頻分區(qū); 確定緊密地鄰近于所述第一視頻分區(qū)中的所述第一視頻單元的第二視頻單元是否具有與所述第一視頻單元的預(yù)測模式不同的預(yù)測模式;以及 響應(yīng)于確定所述第二視頻單元具有不同于所述第一視頻單元的預(yù)測模式,使用定位在所述第二視頻分區(qū)中的對應(yīng)于所述第一視頻分區(qū)中的所述第二視頻單元的位置的位置處的基礎(chǔ)層視頻單元的預(yù)測信息來確定所述第一視頻單元的預(yù)測信息,其中所述基礎(chǔ)層視頻單元具有與所述第一視頻單元的所述預(yù)測模式相同的預(yù)測模式。
12.根據(jù)權(quán)利要求11所述的方法,其中所述基礎(chǔ)層視頻單元的所述預(yù)測信息包括幀內(nèi)預(yù)測方向,及所述第一視頻單元的所述預(yù)測信息也包括幀內(nèi)預(yù)測方向。
13.根據(jù)權(quán)利要求12所述的方法,其中所述第二視頻單元的所述預(yù)測模式為幀間模式,及所述第一視頻單元的所述預(yù)測模式為幀內(nèi)模式。
14.根據(jù)權(quán)利要求11所述的方法,其中所述基礎(chǔ)層視頻單元的所述預(yù)測信息及所述第一視頻單元的所述預(yù)測信息兩者包括運動信息。
15.根據(jù)權(quán)利要求14所述的方法,其中所述第二視頻單元的所述預(yù)測模式為幀內(nèi)模式,及所述第一視頻單元的所述預(yù)測模式為幀間模式。
16.根據(jù)權(quán)利要求11所述的方法, 其中所述第二視頻單元的所述預(yù)測模式為INTRA_BL ; 其中所述第一視頻單元的所述預(yù)測模式為幀間模式或幀內(nèi)模式;以及 其中所述基礎(chǔ)層視頻單元的所述預(yù)測信息為幀內(nèi)預(yù)測方向或運動信息。
17.根據(jù)權(quán)利要求11所述的方法,其進一步包括輸出索引,其中所述索引指示與所述第一視頻單元相關(guān)聯(lián)的候選列表中的基礎(chǔ)層候選者,且其中所述基礎(chǔ)層候選者包括所述基礎(chǔ)層視頻單元的所述預(yù)測信息。
18.根據(jù)權(quán)利要求11所述的方法, 其中所述增強層及所述基礎(chǔ)層具有不同空間分辨率; 其中所述基礎(chǔ)層視頻單元的所述預(yù)測信息包括運動向量;以及 其中確定所述第一視頻單元的所述預(yù)測信息包括縮放所述運動向量。
19.根據(jù)權(quán)利要求11所述的方法, 其中第一 POC距離包括當(dāng)前圖片與所述第一視頻單元所關(guān)聯(lián)的第一參考圖片之間的圖片次序計數(shù)的差異; 其中第二 POC距離包括所述當(dāng)前圖片與所述基礎(chǔ)層視頻單元所關(guān)聯(lián)的第二參考圖片之間的圖片次序計數(shù)的差異;以及 其中確定所述第一視頻單元的所述預(yù)測信息包括至少部分基于包括所述第一 POC距離及所述第二 POC距離的比率來縮放所述基礎(chǔ)層視頻單元的運動向量。
20.根據(jù)權(quán)利要求11所述的方法,其中確定所述第一視頻單元的所述預(yù)測信息包括相對于所述增強層中的視頻單元的預(yù)測信息而指派較低權(quán)重到所述基礎(chǔ)層視頻單元的所述預(yù)測信息。
21.一種用于譯碼視頻數(shù)據(jù)的設(shè)備,所述設(shè)備包括: 存儲器單元,其經(jīng)配置以存儲與增強層及基礎(chǔ)層相關(guān)聯(lián)的預(yù)測信息,所述增強層包含第一視頻分區(qū)中的第一視頻單元及緊密地鄰近于所述第一視頻分區(qū)中的所述第一視頻單元的第二視頻單元,所述基礎(chǔ)層包含對應(yīng)于所述第一視頻分區(qū)的第二視頻分區(qū); 處理器,其與所述存儲器單元通信,所述處理器經(jīng)配置以使用定位在所述第二視頻分區(qū)中的對應(yīng)于所述第一視頻分區(qū)中的所述第二視頻單元的位置的位置處的基礎(chǔ)層視頻單元的預(yù)測信息來確定所述第一視頻單元的預(yù)測信息; 其中所述第二視頻單元具有與所述第一視頻單元的預(yù)測模式不同的預(yù)測模式;以及 其中所述基礎(chǔ)層視頻單元具有與所述第一視頻單元的所述預(yù)測模式相同的預(yù)測模式。
22.根據(jù)權(quán)利要求21所述的設(shè)備,其中所述基礎(chǔ)層視頻單元的所述預(yù)測信息包括幀內(nèi)預(yù)測方向,及所述第一視頻單元的所述預(yù)測信息也包括幀內(nèi)預(yù)測方向。
23.根據(jù)權(quán)利要求22所述的設(shè)備,其中所述第二視頻單元的所述預(yù)測模式為幀間模式,及所述第一視頻單元的所述預(yù)測模式為幀內(nèi)模式。
24.根據(jù)權(quán)利要求21所述的設(shè)備,其中所述基礎(chǔ)層視頻單元的所述預(yù)測信息及所述第一視頻單元的所述預(yù)測信息兩者為運動信息。
25.根據(jù)權(quán)利要求24所述的設(shè)備,其中所述第二視頻單元的所述預(yù)測模式為幀內(nèi)模式,及所述第一視頻單元的所述預(yù)測模式為幀間模式。
26.根據(jù)權(quán)利要求21所述的設(shè)備, 其中所述第二視頻單元的所述預(yù)測模式為INTRA_BL ; 其中所述第一視頻單元的所述預(yù)測模式為幀間模式或幀內(nèi)模式;以及 其中所述基礎(chǔ)層視頻單元的所述預(yù)測信息為幀內(nèi)預(yù)測方向或運動信息。
27.根據(jù)權(quán)利要求21所述的設(shè)備,其中所述處理器經(jīng)配置以將包括所述基礎(chǔ)層視頻單元的所述預(yù)測信息的候選者包含在所述第一視頻單元的候選列表中。
28.根據(jù)權(quán)利要求27所述的設(shè)備,其中所述處理器經(jīng)進一步配置以部分通過接收指定所述候選列表中的所述候選者的索引的輸入而確定所述第一視頻單元的所述預(yù)測信息。
29.根據(jù)權(quán)利要求27所述的設(shè)備,其中所述處理器經(jīng)進一步配置以輸出所述候選列表中的所述候選者的索引。
30.根據(jù)權(quán)利要求21所述的設(shè)備, 其中所述增強層及所述基礎(chǔ)層具有不同空間分辨率, 其中所述基礎(chǔ)層視頻單元的所述預(yù)測信息包括運動向量,以及其中所述處理器經(jīng)配置以通過縮放所述運動向量來確定所述第一視頻單元的所述預(yù)測信息。
31.根據(jù)權(quán)利要求21所述的設(shè)備, 其中第一 POC距離包括當(dāng)前圖片與所述第一視頻單元所關(guān)聯(lián)的第一參考圖片之間的圖片次序計數(shù)的差異; 其中第二 POC距離包括所述當(dāng)前圖片與所述基礎(chǔ)層視頻單元所關(guān)聯(lián)的第二參考圖片之間的圖片次序計數(shù)的差異;以及 其中確定所述第一視頻單元的所述預(yù)測信息包括至少部分基于包括所述第一 POC距離及所述第二 POC距離的比率來縮放所述基礎(chǔ)層視頻單元的運動向量。
32.—種視頻譯碼裝置,其包括: 用于識別增強層中的第一視頻分區(qū)中的第一視頻單元的裝置,所述第一視頻分區(qū)對應(yīng)于基礎(chǔ)層中的第二視頻分區(qū); 用于識別緊密地鄰近于所述第一視頻分區(qū)中的所述第一視頻單元的第二視頻單元的裝置,其中所述第二視頻單元具有與所述第一視頻單元的預(yù)測模式不同的預(yù)測模式;以及用于使用定位在所述第二視頻分區(qū)中的對應(yīng)于所述第一視頻分區(qū)中的所述第二視頻單元的位置的位置處的基礎(chǔ)層視頻單元的預(yù)測信息來確定所述第一視頻單元的預(yù)測信息的裝置,其中所述基礎(chǔ)層視頻單元具有與所述第一視頻單元的所述預(yù)測模式相同的預(yù)測模式。
33.根據(jù)權(quán)利要求32所述的視頻譯碼裝置, 其中所述增強層及所述基礎(chǔ)層具有不同空間分辨率; 其中所述基礎(chǔ)層視頻單元的所述預(yù)測信息包括運動向量;以及 其中確定所述第一視頻單元的所述預(yù)測信息包括縮放所述運動向量。
34.根據(jù)權(quán)利要求32所述的視頻譯碼裝置, 其中第一 POC距離包括當(dāng)前圖片與所述第一視頻單元所關(guān)聯(lián)的第一參考圖片之間的圖片次序計數(shù)的差異; 其中第二 POC距離包括所述當(dāng)前圖片與所述基礎(chǔ)層視頻單元所關(guān)聯(lián)的第二參考圖片之間的圖片次序計數(shù)的差異;以及 其中確定所述第一視頻單元的所述預(yù)測信息包括至少部分基于包括所述第一 POC距離及所述第二 POC距離的比率來縮放所述基礎(chǔ)層視頻單元的運動向量。
35.根據(jù)權(quán)利要求32所述的視頻譯碼裝置,其中所述用于確定所述第一視頻單元的所述預(yù)測信息的裝置包括用于相對于所述增強層中的視頻單元的預(yù)測信息而指派較低權(quán)重到所述基礎(chǔ)層視頻單元的所述預(yù)測信息的裝置。
36.一種非暫時性計算機存儲器,其上存儲有指令,所述指令在由具有計算機存儲器的計算機系統(tǒng)執(zhí)行時致使所述計算機系統(tǒng)進行以下操作: 識別增強層中的第一視頻分區(qū)中的第一視頻單元,所述第一視頻分區(qū)對應(yīng)于基礎(chǔ)層中的第二視頻分區(qū); 識別緊密地鄰近于所述第一視頻分區(qū)中的所述第一視頻單元的第二視頻單元,其中所述第二視頻單元具有不同于所述第一視頻單元的預(yù)測模式的預(yù)測模式;以及 使用定位在所述第二視頻分區(qū)中的對應(yīng)于所述第一視頻分區(qū)中的所述第二視頻單元的位置的位置處的基礎(chǔ)層視頻單元的預(yù)測信息來確定所述第一視頻單元的預(yù)測信息,其中所述基礎(chǔ)層視頻單元具有與所述第一視頻單元相同的預(yù)測模式。
37.根據(jù)權(quán)利要求36所述的非暫時性計算機存儲器, 其中所述增強層及所述基礎(chǔ)層具有不同空間分辨率; 其中所述基礎(chǔ)層視頻單元的所述預(yù)測信息包括運動向量;以及 其中確定所述第一視頻單元的所述預(yù)測信息包括縮放所述運動向量。
38.根據(jù)權(quán)利要求36所述的非暫時性計算機存儲器, 其中第一 POC距離包括當(dāng)前圖片與所述第一視頻單元所關(guān)聯(lián)的第一參考圖片之間的圖片次序計數(shù)的差異; 其中第二 POC距離包括所述當(dāng)前圖片與所述基礎(chǔ)層視頻單元所關(guān)聯(lián)的第二參考圖片之間的圖片次序計數(shù)的差異;以及 其中確定所述第一視頻單元的所述預(yù)測信息包括至少部分基于包括所述第一 POC距離及所述第二 POC距離的比率來縮放所述基礎(chǔ)層視頻單元的運動向量。
39.根據(jù)權(quán)利要求36所述的非暫時性計算機存儲器,其進一步包括相對于所述增強層中的視頻單元的預(yù)測信息而指派較低權(quán)重到所述基礎(chǔ)層視頻單元的所述預(yù)測信息的指令。
【文檔編號】H04N19/159GK104205839SQ201380017543
【公開日】2014年12月10日 申請日期:2013年4月11日 優(yōu)先權(quán)日:2012年4月12日
【發(fā)明者】涂承杰, 翔林·王, 馬爾塔·卡切維奇 申請人:高通股份有限公司