用于上下文自適應(yīng)二進(jìn)制算術(shù)譯碼的上下文縮減的制作方法
【專利摘要】圖6是圖解說明本發(fā)明的實(shí)例性視頻編碼方法的流程圖。圖6的方法可由視頻編碼器20實(shí)施。視頻編碼器20可經(jīng)配置以確定P切片中的視頻數(shù)據(jù)塊的第一預(yù)測類型(602),且將第一預(yù)測類型表示為P切片預(yù)測類型語法元素(604)。視頻編碼器20可進(jìn)一步經(jīng)配置以確定B切片中的視頻數(shù)據(jù)塊的第二預(yù)測類型(606),且將第二預(yù)測類型表示為B切片預(yù)測類型語法元素(608)。P切片預(yù)測類型語法元素和B切片預(yù)測類型語法元素指定預(yù)測模式和分區(qū)類型。預(yù)測模式可包含幀間預(yù)測和幀內(nèi)預(yù)測中的一者。分區(qū)類型可包含對稱分區(qū)和不對稱分區(qū)中的一者。視頻編碼器20可進(jìn)一步經(jīng)配置以確定用于P切片預(yù)測類型語法元素的P切片二進(jìn)制化(610),且確定用于B切片預(yù)測類型語法元素的B切片二進(jìn)制化,其中P切片預(yù)測類型語法元素和B切片預(yù)測類型語法元素是使用相同的二進(jìn)制化邏輯確定(612)。視頻編碼器20可隨后基于所述P切片預(yù)測類型語法元素和所述B切片預(yù)測類型語法元素的所述二進(jìn)制化對視頻數(shù)據(jù)進(jìn)行編碼(614)。
【專利說明】 用于上下文自適應(yīng)二進(jìn)制算術(shù)譯碼的上下文縮減
[0001]本申請案主張2011年11月8日申請的第61/557,325號美國臨時申請案和2011年11月20日申請的第61/561,911號美國臨時申請案的權(quán)益,以上兩個美國臨時申請案以全文引用方式并入本文。
【技術(shù)領(lǐng)域】
[0002]本發(fā)明涉及視頻譯碼,且特定來說涉及在視頻譯碼中使用的上下文自適應(yīng)二進(jìn)制算術(shù)譯碼(CABAC)。
【背景技術(shù)】
[0003]數(shù)字視頻能力可并入到廣泛多種裝置中,包含數(shù)字電視機(jī)、數(shù)字直播系統(tǒng)、無線廣播系統(tǒng)、個人數(shù)字助理(PDA)、膝上型或桌上型計算機(jī)、平板計算機(jī)、電子書閱讀器、數(shù)碼相機(jī)、數(shù)字記錄裝置、數(shù)字媒體播放器、視頻游戲裝置、視頻游戲控制臺、蜂窩式或衛(wèi)星無線電電話、所謂的“智能電話”、視頻電話會議裝置、視頻流式傳輸裝置和類似裝置。數(shù)字視頻裝置實(shí)施視頻壓縮技術(shù),例如由 MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4 第 10 部分高級視頻譯碼(AVC)界定的標(biāo)準(zhǔn)、當(dāng)前在開發(fā)的高效視頻譯碼(HEVC)標(biāo)準(zhǔn)以及此些標(biāo)準(zhǔn)的擴(kuò)展中描述的那些技術(shù)。視頻裝置可通過實(shí)施此些視頻壓縮技術(shù)來較有效地發(fā)射、接收、編碼、解碼和/或存儲數(shù)字視頻信息。
[0004]視頻壓縮技術(shù)執(zhí)行空間(圖片內(nèi))預(yù)測和/或時間(圖片間)預(yù)測以減少或移除視頻序列中固有的冗余。對于基于塊的視頻譯碼,可將視頻切片(即,視頻圖片或視頻圖片的一部分)分割為若干視頻塊,所述視頻塊也可稱為樹塊、譯碼單元(CU)和/或譯碼節(jié)點(diǎn)。圖片的經(jīng)幀內(nèi)譯碼(I)切片中的視頻塊是使用相對于同一圖片中的相鄰塊中的參考樣本的空間預(yù)測來編碼。圖片的經(jīng)幀間譯碼(P或B)切片中的視頻塊可使用相對于同一圖片中的相鄰塊中的參考樣本的空間預(yù)測或相對于其它參考圖片中的參考樣本的時間預(yù)測。圖片可稱為幀,且參考圖片可稱為參考幀。
[0005]空間或時間預(yù)測得到待譯碼塊的預(yù)測塊。殘余數(shù)據(jù)表示待譯碼的原始塊與預(yù)測塊之間的像素差。經(jīng)幀間譯碼塊是根據(jù)指向形成預(yù)測塊的參考樣本的塊的運(yùn)動向量以及指示經(jīng)譯碼塊與預(yù)測塊之間的差的殘余數(shù)據(jù)來編碼。經(jīng)幀內(nèi)譯碼塊是根據(jù)幀內(nèi)譯碼模式和殘余數(shù)據(jù)來編碼。為了進(jìn)一步壓縮,可將殘余數(shù)據(jù)從像素域變換到變換域,從而得到殘余變換系數(shù),所述系數(shù)隨后可經(jīng)量化??蓲呙璩跏家远S陣列布置的經(jīng)量化變換系數(shù)以便產(chǎn)生變換系數(shù)的一維向量,且可應(yīng)用熵譯碼以實(shí)現(xiàn)甚至更多的壓縮。
【發(fā)明內(nèi)容】
[0006]大體上,本發(fā)明描述用于視頻譯碼過程中的上下文自適應(yīng)二進(jìn)制算術(shù)譯碼(CABAC)的技術(shù)。特定來說,本發(fā)明提出用于一個或多個語法元素的CABAC上下文的數(shù)目的縮減,所述語法元素的非限制性實(shí)例包含pred_type、merge_idx、inter_pred_flag、ref_idx_lx> cbf_cb> cbf_cr> coeff_abs_level_greaterl_flag 和 coeff_abs_level_greater2_flago所述修改可縮減多達(dá)56個上下文,其中譯碼效率改變可忽略。所提出的語法元素的上下文縮減可單獨(dú)使用或以任一組合使用。
[0007]在本發(fā)明的一個實(shí)例中,一種對視頻進(jìn)行編碼的方法可包含:確定P切片中的視頻數(shù)據(jù)塊的第一預(yù)測類型,將第一預(yù)測類型表示為P切片預(yù)測類型語法元素,確定B切片中的視頻數(shù)據(jù)塊的第二預(yù)測類型,將第二預(yù)測類型表示為B切片預(yù)測類型語法元素,確定P切片預(yù)測類型語法元素的P切片二進(jìn)制化,確定B切片預(yù)測類型語法元素的B切片二進(jìn)制化,其中P切片預(yù)測類型語法元素和B切片預(yù)測類型語法元素是使用相同二進(jìn)制化邏輯來確定,且基于P切片預(yù)測類型語法元素和B切片預(yù)測語法元素的二進(jìn)制化對所述視頻數(shù)據(jù)進(jìn)行編碼。
[0008]在本發(fā)明的另一實(shí)例中,一種對視頻進(jìn)行解碼的方法可包含:使用P切片中的視頻數(shù)據(jù)塊的二進(jìn)制化映射將經(jīng)二進(jìn)制化P切片預(yù)測類型語法元素映射到預(yù)測類型,使用B切片中的視頻數(shù)據(jù)塊的相同二進(jìn)制化映射將經(jīng)二進(jìn)制化B切片預(yù)測類型語法元素映射到預(yù)測類型,且基于經(jīng)映射預(yù)測類型對所述視頻數(shù)據(jù)進(jìn)行解碼。
[0009]在本發(fā)明的另一實(shí)例中,一種對視頻數(shù)據(jù)進(jìn)行編碼的方法包括:確定視頻數(shù)據(jù)塊的預(yù)測模式的分區(qū)類型,使用具有單個上下文的CABAC對視頻數(shù)據(jù)塊的預(yù)測類型語法元素的分區(qū)類型二進(jìn)位進(jìn)行編碼,其中所述單個上下文對于任一分區(qū)類型是相同的,且在旁路模式中使用CABAC對視頻數(shù)據(jù)塊的預(yù)測類型語法元素的分區(qū)大小二進(jìn)位進(jìn)行編碼。
[0010]在本發(fā)明的另一實(shí)例中,一種對視頻數(shù)據(jù)進(jìn)行解碼的方法包括:接收已使用CABAC譯碼的視頻數(shù)據(jù)塊的預(yù)測類型語法元素,所述預(yù)測類型語法元素包含表示分區(qū)類型的分區(qū)類型二進(jìn)位和表示分區(qū)大小的分區(qū)大小二進(jìn)位,使用具有單個上下文的上下文自適應(yīng)二進(jìn)制算術(shù)譯碼對預(yù)測類型語法元素的分區(qū)類型二進(jìn)位進(jìn)行解碼,其中所述單個上下文對于任一分區(qū)類型是相同的,且在旁路模式中使用CABAC對所述預(yù)測類型語法元素的分區(qū)大小二進(jìn)位進(jìn)行解碼。
[0011]在本發(fā)明的另一實(shí)例中,一種對視頻數(shù)據(jù)進(jìn)行譯碼的方法包括:使用CABAC對視頻數(shù)據(jù)塊的Cb色度經(jīng)譯碼塊旗標(biāo)進(jìn)行譯碼,其中對Cb色度經(jīng)譯碼塊旗標(biāo)進(jìn)行譯碼包括使用包含一個或多個上下文的上下文集合作為CABAC的部分,且使用CABAC對Cr色度經(jīng)譯碼塊進(jìn)行譯碼,其中對Cr色度經(jīng)譯碼塊旗標(biāo)進(jìn)行譯碼包括使用與Cb色度經(jīng)譯碼塊旗標(biāo)相同的上下文集合作為CABAC的部分。
[0012]本發(fā)明還鑒于經(jīng)配置以執(zhí)行所述技術(shù)的設(shè)備以及鑒于存儲指令的計算機(jī)可讀存儲媒體來描述上述技術(shù),所述指令在執(zhí)行時致使一個或多個處理器執(zhí)行所述技術(shù)。
[0013]在附圖和以下描述中陳述一個或一個以上實(shí)例的細(xì)節(jié)。從描述和圖式以及從權(quán)利要求書將明了其它特征、目的和優(yōu)點(diǎn)。
【專利附圖】
【附圖說明】
[0014]圖1是圖解說明可利用本發(fā)明中描述的技術(shù)的實(shí)例性視頻編碼和解碼系統(tǒng)的框圖。
[0015]圖2是圖解說明可實(shí)施本發(fā)明中描述的技術(shù)的實(shí)例性視頻編碼器的框圖。
[0016]圖3是圖解說明可實(shí)施本發(fā)明中描述的技術(shù)的實(shí)例性視頻解碼器的框圖。
[0017]圖4是展示正方形和非正方形分區(qū)類型的概念圖。[0018]圖5是展示不對稱分區(qū)類型的概念圖。
[0019]圖6是圖解說明本發(fā)明的實(shí)例性視頻編碼方法的流程圖。
[0020]圖7是圖解說明本發(fā)明的實(shí)例性視頻解碼方法的流程圖。
[0021]圖8是圖解說明本發(fā)明的實(shí)例性視頻編碼方法的流程圖。
[0022]圖9是圖解說明本發(fā)明的實(shí)例性視頻解碼方法的流程圖。
[0023]圖10是圖解說明本發(fā)明的實(shí)例性視頻譯碼方法的流程圖。
【具體實(shí)施方式】
[0024]本發(fā)明描述用于對例如視頻數(shù)據(jù)等數(shù)據(jù)進(jìn)行譯碼的技術(shù)。特定來說,本發(fā)明描述可促進(jìn)使用上下文自適應(yīng)熵譯碼過程對視頻數(shù)據(jù)的有效譯碼的技術(shù)。更具體來說,本發(fā)明提出用于對語法元素進(jìn)行譯碼的CABAC上下文的數(shù)目的縮減,所述語法元素例如pred_type、merge_idx、inter_pred_flag> ref_idx_lx> cbf_cb> cbf_cr> coeff_abs_level_greaterl_f lag 和 coeff_abs_level_greater2_f lag。所述修改縮減多達(dá) 56 個上下文,其中譯碼效率改變可忽略。本發(fā)明為了說明而描述視頻譯碼。然而,本發(fā)明中描述的技術(shù)也可適用于對其它類型數(shù)據(jù)進(jìn)行譯碼。
[0025]圖1是圖解說明根據(jù)本發(fā)明的實(shí)例可經(jīng)配置以利用用于上下文自適應(yīng)二進(jìn)制算術(shù)譯碼(CABAC)的技術(shù)的實(shí)例性視頻編碼和解碼系統(tǒng)10的框圖。如圖1所示,系統(tǒng)10包含源裝置12,所述源裝置12經(jīng)由通信信道16將經(jīng)編碼視頻發(fā)射到目的地裝置14。經(jīng)編碼視頻數(shù)據(jù)也可存儲在存儲媒體34或文件服務(wù)器36上,且可按需要由目的地裝置14存取。當(dāng)存儲到存儲媒體或文件服務(wù)器時,視頻編碼器20可將經(jīng)譯碼視頻數(shù)據(jù)提供到另一裝置,例如網(wǎng)絡(luò)接口、壓縮光盤(CD)、藍(lán)光或數(shù)字視頻光盤(DVD)燒錄器或沖壓設(shè)施裝置,或其它裝置,用于將經(jīng)譯碼視頻數(shù)據(jù)存儲到存儲媒體。同樣,與視頻解碼器30分離的裝置,例如網(wǎng)絡(luò)接口、CD或DVD讀取器或類似物,可從存儲媒體檢索經(jīng)譯碼視頻數(shù)據(jù)且將所檢索數(shù)據(jù)提供到視頻解碼器30。
[0026]源裝置12和目的地裝置14可包括廣泛多種裝置中的任一者,包含桌上型計算機(jī)、筆記型(即,膝上型)計算機(jī)、平板計算機(jī)、機(jī)頂盒、例如所謂的智能電話等電話手持機(jī)、電視機(jī)、相機(jī)、顯示裝置、數(shù)字媒體播放器、視頻游戲控制臺或類似裝置。在許多情況下,此些裝置可經(jīng)裝備以用于無線通信。因此,通信信道16可包括適合于發(fā)射經(jīng)編碼視頻數(shù)據(jù)的無線信道、有線信道或無線與有線信道的組合。類似地,文件服務(wù)器36可由目的地裝置14通過任何標(biāo)準(zhǔn)數(shù)據(jù)連接(包含因特網(wǎng)連接)存取。這可包含適于存取存儲在文件服務(wù)器上的經(jīng)編碼視頻數(shù)據(jù)的無線信道(例如,W1-Fi連接)、有線連接(例如,DSL、電纜調(diào)制解調(diào)器等等)或兩者的組合。
[0027]根據(jù)本發(fā)明的實(shí)例的用于CABAC的技術(shù)可應(yīng)用于視頻譯碼以支持多種多媒體應(yīng)用中的任一種,例如空中電視廣播、閉路電視發(fā)射、衛(wèi)星電視發(fā)射、流式視頻發(fā)射(例如,經(jīng)由因特網(wǎng))、為存儲在數(shù)據(jù)存儲媒體上對數(shù)字視頻的編碼、對存儲在數(shù)據(jù)存儲媒體上的數(shù)字視頻的解碼,或其它應(yīng)用。在一些實(shí)例中,系統(tǒng)10可經(jīng)配置以支持單向或雙向視頻發(fā)射以支持例如視頻流式傳輸、視頻重放、視頻廣播和/或視頻電話等應(yīng)用。
[0028]在圖1的實(shí)例中,源裝置12包含視頻源18、視頻編碼器20、調(diào)制器/解調(diào)器22和發(fā)射器24。在源裝置12中,視頻源18可包含例如以下各項(xiàng)的源:例如攝像機(jī)等視頻俘獲裝置、含有先前俘獲視頻的視頻檔案、用以從視頻內(nèi)容提供者接收視頻的視頻饋送接口,和/或用于產(chǎn)生計算機(jī)圖形作為源視頻的計算機(jī)圖形系統(tǒng),或此些源的組合。作為一個實(shí)例,如果視頻源18是攝像機(jī),則源裝置12和目的地裝置14可形成所謂的相機(jī)電話或視頻電話。然而,本發(fā)明中描述的技術(shù)可大體上適用于視頻譯碼,且可適用于無線和/或有線應(yīng)用,或其中經(jīng)編碼視頻數(shù)據(jù)存儲在本地磁盤上的應(yīng)用。
[0029]所俘獲、預(yù)俘獲或計算機(jī)產(chǎn)生的視頻可由視頻編碼器20編碼。經(jīng)編碼視頻信息可由調(diào)制解調(diào)器22根據(jù)例如無線通信協(xié)議等通信標(biāo)準(zhǔn)而調(diào)制,且經(jīng)由發(fā)射器24發(fā)射到目的地裝置14。調(diào)制解調(diào)器22可包含為了信號調(diào)制而設(shè)計的各種混頻器、濾波器、放大器或其它組件。發(fā)射器24可包含為了發(fā)射數(shù)據(jù)而設(shè)計的電路,包含放大器、濾波器和一個或一個以上天線。
[0030]由視頻編碼器20編碼的所俘獲、預(yù)俘獲或計算機(jī)產(chǎn)生的視頻也可存儲到存儲媒體34或文件服務(wù)器36上以供日后使用。存儲媒體34可包含藍(lán)光光盤、DVD、⑶-ROM、快閃存儲器或任何其它合適的用于存儲經(jīng)編碼視頻的數(shù)字存儲媒體。存儲在存儲媒體34上的經(jīng)編碼視頻可隨后由目的地裝置14存取以用于解碼和重放。雖然圖1中未圖示,但在一些實(shí)例中,存儲媒體34和/或文件服務(wù)器36可存儲發(fā)射器24的輸出。
[0031]文件服務(wù)器36可為能夠存儲經(jīng)編碼視頻且將所述經(jīng)編碼視頻發(fā)射到目的地裝置14的任一類型的服務(wù)器。實(shí)例文件服務(wù)器包含網(wǎng)絡(luò)服務(wù)器(例如,用于網(wǎng)站)、FTP服務(wù)器、網(wǎng)絡(luò)附接存儲(NAS)裝置、本地磁盤驅(qū)動器,或能夠存儲經(jīng)編碼視頻數(shù)據(jù)且將其發(fā)射到目的地裝置的任一其它類型的裝置。經(jīng)編碼視頻數(shù)據(jù)從文件服務(wù)器36的發(fā)射可為流式發(fā)射、下載發(fā)射或兩者的組合。文件服務(wù)器36可由目的地裝置14通過任何標(biāo)準(zhǔn)數(shù)據(jù)連接(包含因特網(wǎng)連接)存取。這可包含適于存取存儲在文件服務(wù)器上的經(jīng)編碼視頻數(shù)據(jù)的無線信道(例如,W1-Fi連接)、有線連接(例如,DSL、電纜調(diào)制解調(diào)器、以太網(wǎng)、USB等等)或兩者的組合。
[0032]在圖1的實(shí)例中,目的地裝置14包含接收器26、調(diào)制解調(diào)器28、視頻解碼器30和顯示裝置32。目的地裝置14的接收器26經(jīng)由信道16接收信息,且調(diào)制解調(diào)器28對所述信息進(jìn)行解調(diào)以產(chǎn)生用于視頻解碼器30的經(jīng)解調(diào)位流。經(jīng)由信道16傳送的信息可包含由視頻編碼器20產(chǎn)生以供視頻解碼器30用于對視頻數(shù)據(jù)進(jìn)行解碼的多種語法信息。此語法也可與存儲在存儲媒體34或文件服務(wù)器36上的經(jīng)編碼視頻數(shù)據(jù)一起包含。視頻編碼器20和視頻解碼器30中的每一者可形成能夠?qū)σ曨l數(shù)據(jù)進(jìn)行編碼或解碼的相應(yīng)編碼器一解碼器(CODEC)的部分。
[0033]顯示裝置32可與目的地裝置14集成或在目的地裝置14的外部。在一些實(shí)例中,目的地裝置14可包含集成顯示裝置,且還經(jīng)配置以與外部顯示裝置介接。在其它實(shí)例中,目的地裝置14可為顯示裝置。大體上,顯示裝置32向用戶顯示經(jīng)解碼視頻數(shù)據(jù),且可包括多種顯示裝置中的任一者,例如液晶顯示器(LCD)、等離子顯示器、有機(jī)發(fā)光二極管(OLED)顯示器,或另一類型的顯示裝置。
[0034]在圖1的實(shí)例中,通信信道16可包括任何無線或有線通信媒體,例如射頻(RF)頻譜或者一種或一種以上物理傳輸線,或無線與有線媒體的任何組合。通信信道16可形成基于包的網(wǎng)絡(luò)的部分,所述網(wǎng)絡(luò)例如為局域網(wǎng)、廣域網(wǎng)或例如因特網(wǎng)的全球網(wǎng)。通信信道16大體上表示用于將視頻數(shù)據(jù)從源裝置12發(fā)射到目的地裝置14的任何合適的通信媒體或不同通信媒體的集合,包含有線或無線媒體的任何合適組合。通信信道16可包含路由器、交換機(jī)、基站或可用于促進(jìn)從源裝置12到目的地裝置14的通信的任何其它設(shè)備。
[0035]視頻編碼器20和視頻解碼器30可根據(jù)例如由ITU-T視頻譯碼專家組(VCEG)的視頻譯碼聯(lián)合合作組(JCT-VC)和IS0/IEC動畫專家組(MPEG)當(dāng)前在開發(fā)的高效視頻譯碼(HEVC)標(biāo)準(zhǔn)等視頻壓縮標(biāo)準(zhǔn)來操作。稱為“HEVC工作草案6”或“WD6”的HEVC標(biāo)準(zhǔn)的最新草案在布洛斯(Bross)等人的文獻(xiàn)JCTVC-H1003 “高效視頻譯碼(HEVC)文本規(guī)范草案6(High efficiency video coding (HEVC) text specification draft6),,(ITU-T SG16WP3和IS0/IEC JTC1/SC29/WG11的視頻譯碼聯(lián)合合作組(JCT-VC),第8次會議:美國加利福尼亞圣何塞,2012年2月)中描述,其從2012年6月I日起可從http://phenix.1nt-evry.fr/jet/doc_end_user/documents/8_San% 20Jose/wglI/JCTVC-H1003-v22.zip 下載。
[0036]或者,視頻編碼器20和視頻解碼器30可根據(jù)例如ITU-T H.264標(biāo)準(zhǔn)(或者稱為MPEG4第10部分高級視頻譯碼(AVC))等其它專門或行業(yè)標(biāo)準(zhǔn)或此些標(biāo)準(zhǔn)的擴(kuò)展來操作。然而本發(fā)明的技術(shù)不限于任何特定譯碼標(biāo)準(zhǔn)。其它實(shí)例包含MPEG-2和ITU-T H.263。
[0037]雖然圖1中未圖示,但在一些方面中,視頻編碼器20和視頻解碼器30可各自與音頻編碼器和解碼器集成,且可包含適當(dāng)?shù)亩嗦窂?fù)用器一多路分用器(MUX-DEMUX)單元或其它硬件和軟件,以處置共同數(shù)據(jù)流或單獨(dú)數(shù)據(jù)流中的音頻和視頻兩者的編碼。如果適用,在一些實(shí)例中,MUX-DEMUX單元可符合ITU H.223多路復(fù)用器協(xié)議,或例如用戶數(shù)據(jù)報協(xié)議(UDP)等其它協(xié)議。
[0038]視頻編碼器20和視頻解碼器30各自可實(shí)施為多種合適編碼器電路中的任一者,例如一個或一個以上微處理器、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)、離散邏輯、軟件、硬件、固件或其任一組合。當(dāng)所述技術(shù)部分地以軟件實(shí)施時,裝置可將用于所述軟件的指令存儲在合適的非暫時性計算機(jī)可讀媒體中,且使用一個或多個處理器執(zhí)行硬件中的指令以執(zhí)行本發(fā)明的技術(shù)。視頻編碼器20和視頻解碼器30中的每一者可包含于一個或一個以上編碼器或解碼器中,其中任一者可集成為相應(yīng)裝置中的組合式編碼器/解碼器(CODEC)的部分。
[0039]視頻編碼器20可實(shí)施本發(fā)明的技術(shù)中的任一者或全部以用于視頻譯碼過程中的CABAC0視頻編碼器30可實(shí)施本發(fā)明的技術(shù)中的任一者或全部以用于視頻譯碼過程中的CABAC0如本發(fā)明中描述的視頻譯碼器可指代視頻編碼器或視頻解碼器。類似地,視頻譯碼單元可指代視頻編碼器或視頻解碼器。同樣,視頻譯碼可指代視頻編碼或視頻解碼。
[0040]在本發(fā)明的一個實(shí)例中,視頻編碼器20可經(jīng)配置以確定P切片中的視頻數(shù)據(jù)塊的第一預(yù)測類型,將第一預(yù)測類型表示為P切片預(yù)測類型語法元素,確定B切片中的視頻數(shù)據(jù)塊的第二預(yù)測類型,將第二預(yù)測類型表示為B切片預(yù)測類型語法元素,確定P切片預(yù)測類型語法元素的P切片二進(jìn)制化,確定B切片預(yù)測類型語法元素的B切片二進(jìn)制化,其中P切片預(yù)測類型語法元素和B切片預(yù)測類型語法元素是使用相同二進(jìn)制化邏輯來確定,且基于P切片預(yù)測類型語法元素和B切片預(yù)測語法元素的二進(jìn)制化對所述視頻數(shù)據(jù)進(jìn)行編碼。
[0041 ] 在本發(fā)明的另一實(shí)例中,視頻解碼器30可經(jīng)配置以使用P切片中的視頻數(shù)據(jù)塊的二進(jìn)制化映射將經(jīng)二進(jìn)制化P切片預(yù)測類型語法元素映射到預(yù)測類型,使用B切片中的視頻數(shù)據(jù)塊的相同二進(jìn)制化映射將經(jīng)二進(jìn)制化B切片預(yù)測類型語法元素映射到預(yù)測類型,且基于經(jīng)映射預(yù)測類型對所述視頻數(shù)據(jù)進(jìn)行解碼。[0042]在本發(fā)明的另一實(shí)例中,視頻編碼器20可經(jīng)配置以確定視頻數(shù)據(jù)塊的預(yù)測模式的分區(qū)類型,使用具有單個上下文的CABAC對視頻數(shù)據(jù)塊的預(yù)測類型語法元素的分區(qū)類型二進(jìn)位進(jìn)行編碼,其中所述單個上下文對于任一分區(qū)類型是相同的,且在旁路模式中使用CABAC對視頻數(shù)據(jù)塊的預(yù)測類型語法元素的分區(qū)大小二進(jìn)位進(jìn)行編碼。
[0043]在本發(fā)明的另一實(shí)例中,視頻解碼器30可經(jīng)配置以接收已使用CABAC譯碼的視頻數(shù)據(jù)塊的預(yù)測類型語法元素,所述預(yù)測類型語法元素包含表示分區(qū)類型的分區(qū)類型二進(jìn)位和表示分區(qū)大小的分區(qū)大小二進(jìn)位,使用具有單個上下文的CABAC對預(yù)測類型語法元素的分區(qū)類型二進(jìn)位進(jìn)行解碼,其中所述單個上下文對于任一分區(qū)類型是相同的,且在旁路模式中使用CABAC對所述預(yù)測類型語法元素的分區(qū)大小二進(jìn)位進(jìn)行解碼。
[0044]在本發(fā)明的另一實(shí)例中,視頻編碼器20和視頻解碼器30可經(jīng)配置以使用CABAC對視頻數(shù)據(jù)塊的Cb色度經(jīng)譯碼塊旗標(biāo)進(jìn)行譯碼,其中對Cb色度經(jīng)譯碼塊旗標(biāo)進(jìn)行譯碼包括使用包含一個或多個上下文的上下文集合作為CABAC的部分,且使用CABAC對Cr色度經(jīng)譯碼塊旗標(biāo)進(jìn)行譯碼,其中對Cr色度經(jīng)譯碼塊旗標(biāo)進(jìn)行譯碼包括使用與Cb色度經(jīng)譯碼塊旗標(biāo)相同的上下文集合作為CABAC的部分。
[0045]JCT-VC正致力于HEVC標(biāo)準(zhǔn)的開發(fā)。HEVC標(biāo)準(zhǔn)化努力是基于稱為HEVC測試模型(HM)的視頻譯碼裝置的演進(jìn)模型。HM假設(shè)視頻譯碼裝置相對于符合例如ITU-TH.264/AVC的現(xiàn)存裝置的若干額外能力。舉例來說,H.264提供9種幀內(nèi)預(yù)測編碼模式,而HM可提供多達(dá)33種幀內(nèi)預(yù)測編碼模式。以下部分將更詳細(xì)論述HM的某些方面。
[0046]大體上,HM的工作模型描述了可將視頻幀或圖片劃分為包含亮度和色度樣本兩者的樹塊或最大譯碼單元(LCU)的序列。樹塊具有與H.264標(biāo)準(zhǔn)的宏塊類似的目的。切片包含若干在譯碼次序上連續(xù)的樹塊。視頻幀或圖片可經(jīng)分割為一個或多個切片。每一樹塊可根據(jù)四叉樹而分裂為若干譯碼單元(CU)。舉例來說,作為四叉樹的根節(jié)點(diǎn)的樹塊可分裂為四個子節(jié)點(diǎn),且每一子節(jié)點(diǎn)又可為母節(jié)點(diǎn)且分裂為另外四個子節(jié)點(diǎn)。作為四叉樹的葉節(jié)點(diǎn),最終未經(jīng)分裂的子節(jié)點(diǎn)包括譯碼節(jié)點(diǎn),即經(jīng)譯碼視頻塊。與經(jīng)譯碼位流相關(guān)聯(lián)的語法數(shù)據(jù)可界定樹塊可經(jīng)分裂的最大次數(shù),且也可界定譯碼節(jié)點(diǎn)的最小大小。
[0047]CU包含譯碼節(jié)點(diǎn)以及與譯碼節(jié)點(diǎn)相關(guān)聯(lián)的預(yù)測單元(PU)和變換單元(TU)。CU的大小大體上對應(yīng)于譯碼節(jié)點(diǎn)的大小且形狀通常必須為正方形。CU的大小的范圍可為從8x8像素直到具有最大64x64像素或更大的樹塊的大小。每一⑶可含有一個或多個PU和一個或多個TU。與CU相關(guān)聯(lián)的語法數(shù)據(jù)可描述例如CU分割為一個或多個PU。分割模式在CU經(jīng)跳過或直接模式編碼、經(jīng)幀內(nèi)預(yù)測模式編碼還是經(jīng)幀間預(yù)測模式編碼之間可不同。PU可經(jīng)分割為非正方形的形狀。與CU相關(guān)聯(lián)的語法數(shù)據(jù)還可描述例如CU根據(jù)四叉樹而分割為一個或多個TU。TU可為正方形或非正方形的形狀。
[0048]新興的HEVC標(biāo)準(zhǔn)允許根據(jù)TU的變換,所述TU對于不同⑶可為不同的。TU通?;跒榻?jīng)分割LCU界定的給定CU內(nèi)的PU的大小來定大小,但情況可能并非總是這樣。TU通常與PU大小相同或小于PU。在一些實(shí)例中,使用稱為“殘余四叉樹”(RQT)的四叉樹結(jié)構(gòu),對應(yīng)于CU的殘余樣本可經(jīng)再分為較小的單元。RQT的葉節(jié)點(diǎn)可稱為變換單元(TU)。與TU相關(guān)聯(lián)的像素差值可經(jīng)變換以產(chǎn)生可經(jīng)量化的變換系數(shù)。
[0049]大體上,PU指代與預(yù)測過程相關(guān)的數(shù)據(jù)。舉例來說,當(dāng)經(jīng)幀內(nèi)模式編碼時,PU可包含描述PU的幀內(nèi)預(yù)測模式的數(shù)據(jù)。作為另一實(shí)例,當(dāng)PU經(jīng)幀間模式編碼時,PU可包含定義PU的運(yùn)動向量的數(shù)據(jù)。界定PU的運(yùn)動向量的數(shù)據(jù)可描述例如運(yùn)動向量的水平分量、運(yùn)動向量的垂直分量、運(yùn)動向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、運(yùn)動向量所指向的參考圖片,和/或運(yùn)動向量的參考圖片列表(例如,列表O、列表I或列表C)。
[0050]大體上,TU用于變換和量化過程。具有一個或一個以上I3U的給定⑶還可包含一個或一個以上變換單元(TU)。在預(yù)測之后,視頻編碼器20可根據(jù)PU從由譯碼節(jié)點(diǎn)識別的視頻塊計算殘余值。隨后更新譯碼節(jié)點(diǎn)以參考?xì)堄嘀刀窃家曨l塊。殘余值包括像素差值,所述像素差值可使用變換和TU中指定的其它變換信息而變換為變換系數(shù)、經(jīng)量化且經(jīng)掃描以產(chǎn)生用于熵譯碼的經(jīng)串行化變換系數(shù)。可再次更新譯碼節(jié)點(diǎn)以參考這些經(jīng)串行化變換系數(shù)。本發(fā)明通常使用術(shù)語“視頻塊”來指代⑶的譯碼節(jié)點(diǎn)。在一些特定情況下,本發(fā)明也可使用術(shù)語“視頻塊”來指代樹塊,即IXU或⑶,其包含譯碼節(jié)點(diǎn)以及和TU。
[0051]視頻序列通常包含一系列視頻幀或圖片。圖片群組(GOP)通常包括一系列一個或多個視頻圖片。GOP可在GOP的標(biāo)頭、一個或多個圖片的標(biāo)頭或其它地方包含描述所述GOP中包含的圖片數(shù)目的語法數(shù)據(jù)。圖片的每一切片可包含描述相應(yīng)切片的編碼模式的切片語法數(shù)據(jù)。視頻編碼器20通常對個別視頻切片內(nèi)的視頻塊進(jìn)行操作以便對視頻數(shù)據(jù)進(jìn)行編碼。視頻塊可對應(yīng)于CU內(nèi)的譯碼節(jié)點(diǎn)。視頻塊可具有固定或變化的大小,且可根據(jù)指定譯碼標(biāo)準(zhǔn)而大小不同。
[0052]作為一實(shí)例,HM支持各種I3U大小下的預(yù)測。假定特定⑶的大小為2Nx2N,則HM支持2Nx2N或NxN的PU大小的幀內(nèi)預(yù)測以及2Nx2N、2NxN、Nx2N或NxN的對稱I3U大小的幀間預(yù)測。HM還支持2NxnU、2NxnD、nLx2N和nRx2N的PU大小的幀間預(yù)測的不對稱分割。在不對稱分割中,⑶的一個方向未分割,而另一方向分割為25%和75%。⑶的對應(yīng)于25%分割的部分由“η”指示,隨后是“上”、“下”、“左”或“右”的指示。因此,舉例來說,“2NxnU”指代經(jīng)水平分割的2Nx2N CU,其中頂部為2Nx0.5NPU且底部為2Nxl.5N PU。
[0053]圖4是展示用于幀內(nèi)預(yù)測和幀間預(yù)測的正方形和非正方形分區(qū)類型的概念圖。分區(qū)102是2Nx2N分區(qū),且可用于幀內(nèi)預(yù)測和幀間預(yù)測兩者。分區(qū)104是NxN分區(qū),且可用于幀內(nèi)預(yù)測和幀間預(yù)測兩者。分區(qū)106是2NxN分區(qū),且當(dāng)前在HEVC中用于幀間預(yù)測。分區(qū)108是Nx2N分區(qū),且當(dāng)前在HEVC中用于幀間預(yù)測。
[0054]圖5是展示不對稱分區(qū)類型的概念圖。分區(qū)110是2NxnU分區(qū),且當(dāng)前在HEVC中用于幀間預(yù)測。分區(qū)112是2NxnD分區(qū),且當(dāng)前在HEVC中用于幀間預(yù)測。分區(qū)114是nLx2N分區(qū),且當(dāng)前在HEVC中用于幀間預(yù)測。分區(qū)116是nRx2N分區(qū),且當(dāng)前在HEVC中用于幀間預(yù)測。
[0055]在本發(fā)明中,“NxN”和“N乘N”可以互換地使用以在垂直和水平尺寸方面指代視頻塊的像素尺寸,例如16x16像素或16乘16像素。大體上,16x16塊將在垂直方向上具有16個像素(y = 16)且在水平方向上具有16個像素(X = 16)。同樣,NxN塊通常在垂直方向上具有N個像素且在水平方向上具有N個像素,其中N表示非負(fù)整數(shù)值。塊中的像素可以若干行和列布置。而且,塊無需一定在水平方向上具有與垂直方向上相同數(shù)目的像素。舉例來說,塊可包括NxM個像素,其中M不一定等于N。
[0056]在使用CU的PU的幀內(nèi)預(yù)測或幀間預(yù)測譯碼之后,視頻編碼器20可計算由CU的TU指定的變換所應(yīng)用于的殘余數(shù)據(jù)。殘余數(shù)據(jù)可對應(yīng)于未經(jīng)編碼圖片的像素之間的像素差和對應(yīng)于CU的預(yù)測值。視頻編碼器20可形成CU的殘余數(shù)據(jù),且隨后變換殘余數(shù)據(jù)以產(chǎn)生變換系數(shù)。
[0057]在任何變換以產(chǎn)生變換系數(shù)后,視頻編碼器20可執(zhí)行變換系數(shù)的量化。量化大體上指代其中變換系數(shù)經(jīng)量化以可能地減少用以表示所述系數(shù)的數(shù)據(jù)量從而提供進(jìn)一步壓縮的過程。量化過程可減小與系數(shù)中的一些或全部相關(guān)聯(lián)的位深度。舉例來說,在量化期間可將η位值下舍入到m位值,其中η大于m。
[0058]在一些實(shí)例中,視頻編碼器20可利用預(yù)定義掃描次序來掃描經(jīng)量化變換系數(shù)以產(chǎn)生可經(jīng)熵編碼的經(jīng)串行化向量。在其它實(shí)例中,視頻編碼器20可執(zhí)行自適應(yīng)掃描。在掃描經(jīng)量化變換系數(shù)以形成一維向量之后,視頻編碼器20可例如根據(jù)上下文自適應(yīng)可變長度譯碼(CAVLC)、上下文自適應(yīng)二進(jìn)制算術(shù)譯碼(CABAC)、基于語法的上下文自適應(yīng)二進(jìn)制算術(shù)譯碼(SBAC)、概率區(qū)間分割熵(PIPE)譯碼或另一熵編碼方法對所述一維向量進(jìn)行熵編碼。視頻編碼器20還可對與經(jīng)編碼視頻數(shù)據(jù)相關(guān)聯(lián)的語法元素進(jìn)行熵編碼以供視頻解碼器30用于對視頻數(shù)據(jù)進(jìn)行解碼。
[0059]為了執(zhí)行CABAC,視頻編碼器20可將上下文模型內(nèi)的上下文指派于待發(fā)射的符號。所述上下文可例如涉及符號的相鄰值是否為非零。為了執(zhí)行CAVLC,視頻編碼器20可針對待發(fā)射符號選擇可變長度譯碼。VLC中的碼字可經(jīng)構(gòu)造以使得相對較短的碼對應(yīng)于較可能的符號,而較長的碼對應(yīng)于較不可能的符號。以此方式,VLC的使用可例如針對待發(fā)射的每一符號使用相等長度碼字來實(shí)現(xiàn)位節(jié)省。概率確定可基于對符號指派的上下文。
[0060]本發(fā)明是用于上下文自適應(yīng)二進(jìn)制算術(shù)譯碼(CABAC)熵譯碼器或例如概率區(qū)間分割熵譯碼(PIPE)或相關(guān)譯碼器等其它熵譯碼器的相關(guān)技術(shù)。算術(shù)譯碼是在具有高譯碼效率的許多壓縮算法中使用的一種形式的熵譯碼,因?yàn)槠淠軌驅(qū)⒎栍成涞椒钦麛?shù)長度碼字。算術(shù)譯碼算法的實(shí)例是在H.264/AVC中使用的基于上下文的二進(jìn)制算術(shù)譯碼(CABAC)。
[0061]大體上,使用CABAC對數(shù)據(jù)符號進(jìn)行譯碼涉及以下步驟中的一者或多者:
[0062](I) 二進(jìn)制化:如果待譯碼符號是非二進(jìn)制值的,那么將其映射到所謂的“二進(jìn)位”的序列。每一二進(jìn)位可具有“O”或“ I ”的值。
[0063](2)上下文指派:(在常規(guī)模式中)將每一二進(jìn)位指派于一上下文。上下文模型確定如何基于可用于給定二進(jìn)位的信息來計算用于所述二進(jìn)位的上下文,所述信息例如先前經(jīng)編碼符號或二進(jìn)位數(shù)的值。
[0064](3) 二進(jìn)位編碼:以算術(shù)編碼器對二進(jìn)位進(jìn)行編碼。為了對二進(jìn)位進(jìn)行編碼,算術(shù)編碼器需要二進(jìn)位的值的概率作為輸入,所述概率即二進(jìn)位的值等于“O”的概率以及二進(jìn)位的值等于“I”的概率。每一上下文的(估計)概率由稱為“上下文狀態(tài)”的整數(shù)值表示。每一上下文具有一狀態(tài),且因此所述狀態(tài)(即,估計概率)對于指派于一個上下文的二進(jìn)位是相同的,且在上下文之間不同。
[0065](4)狀態(tài)更新:用于選定上下文的概率(狀態(tài))是基于二進(jìn)位的實(shí)際經(jīng)譯碼值(例如,如果二進(jìn)位值為“1”,那么“I”的概率增加)來更新。
[0066]應(yīng)注意,概率區(qū)間分割熵譯碼(PIPE)使用類似于算術(shù)譯碼原理的原理,且可因此還利用本發(fā)明的技術(shù)。
[0067]H.264/AVC和HEVC中的CABAC使用若干狀態(tài),且每一狀態(tài)隱含地涉及概率。存在CABAC的變體,其中直接使用符號的概率(“O”或“I”),即概率(或其整數(shù)版本)是狀態(tài)。舉例來說,CABAC的此些變體在“法國電信、NTT、NTT DOCOMO、松下和特藝公司(Technicolor)的視頻譯碼技術(shù)提案的說明(Description ofvideo coding technology proposal byFrance Telecom,NTT,NTT DOCOMO,Panasonic and Technicolor) ”(2010年4月德國德累斯頓,JCTVC-A114,第 I 次 JCT-VC 會議,下文稱為“JCTVC-A114”)以及 A.阿爾新(A.Alshin)和E.阿爾新那(E.Alshina)的“用于CABAC的多參數(shù)概率更新(Mult1-parameterprobability update for CABAC) ”(2011 年 7 月意大利托里諾,JCTVC-F254,第 6 次 JCT-VC會議,下文稱為“JCTVC-F254”)中描述。
[0068]在本發(fā)明中,提出縮減在CABAC中使用的二進(jìn)制化和/或上下文的數(shù)目。特定來說,本發(fā)明提出可使CABAC中使用的上下文數(shù)目降低多達(dá)56的技術(shù)。通過減少56個上下文,實(shí)驗(yàn)結(jié)果展示分別在高效率僅幀內(nèi)、隨機(jī)存取和低延遲測試條件中有0.00%,0.01%和一 0.13%位失真(BD)速率改變。由此,所需上下文數(shù)目的縮減減少了編碼器和解碼器兩者處的存儲需要,而不實(shí)質(zhì)上影響譯碼效率。
[0069]在本發(fā)明中,提出縮減用于語法元素的CABAC上下文的數(shù)目,所述語法元素為pred_type、merge_idx、inter_pred_flag>ref_idx_lx> cbf_cb> cbf_cr> coeff_abs_level_greaterl_flag和 coeff_abs_level_greater2_flag。所述修改縮減多達(dá) 56 個上下文,其中譯碼效率改變可忽略。以上提出的語法元素的上下文縮減可單獨(dú)使用或以任一組合使用。
[0070]語法元素pred_type包含每一譯碼單元的預(yù)測模式(Pred_mode_flag)和分區(qū)類型(part_mode)。等于O的語法元素pred_mode_f lag指定當(dāng)前譯碼單元是在巾貞間預(yù)測模式中譯碼。等于I的語法元素pred_m0de_flag指定當(dāng)前譯碼單元是在幀內(nèi)預(yù)測模式中譯碼。語法元素part_mode指定當(dāng)前譯碼單元的分割模式。
[0071]語法元素merge_idX[X0] [y0]指定合并候選列表的合并候選索引,其中x0、y0指定所考慮預(yù)測塊的左上方亮度樣本相對于圖片的左上方亮度樣本的位置(x0,y0)。當(dāng)merge_idx[x0] [y0]不存在時,推斷其等于O。合并候選列表是與運(yùn)動信息可從其復(fù)制到當(dāng)前單元鄰近的譯碼單元的列表。
[0072]語法元素inter_pred_flag[x0] [y0]指定是否單向預(yù)測或雙向預(yù)測用于當(dāng)前預(yù)測單元。陣列索引x0、y0指定所考慮預(yù)測塊的左上方亮度樣本相對于圖片的左上方亮度樣本的位置(x0,y0)。
[0073]語法元素ref_idX_lX指代參考圖片列表內(nèi)的特定參考圖片。
[0074]語法元素cbf_cb、cbf_cr指示色度(分別為Cb和Cr)變換塊是否含有非零變換系數(shù)。等于I的語法元素cbf_cb[x0] [y0] [trafoDepth]指定Cb變換塊含有不等于O的一個或多個變換系數(shù)層級。陣列索引x0、y0指定所考慮變換塊的左上方亮度樣本相對于圖片的左上方亮度樣本的位置(x0,y0)。陣列索引trafoD印th指定為了變換譯碼將譯碼單元變?yōu)閴K的當(dāng)前細(xì)分層級。對于對應(yīng)于譯碼單元的塊,陣列索引trafoDepth等于O。當(dāng)cbf_cb[x0] [y0] [trafoDepth]不存在且預(yù)測模式不是巾貞內(nèi)預(yù)測時,推斷cbf_cb[x0] [y0][trafoDepth]的值等于 O。
[0075]等于I的語法元素cbf_cr [x0] [y0] [trafoDepth]指定Cr變換塊含有不等于O的一個或多個變換系數(shù)層級。陣列索引x0、y0指定所考慮變換塊的左上方亮度樣本相對于圖片的左上方亮度樣本的位置(x0,y0)。陣列索引trafoD印th指定為了變換譯碼將譯碼單元變?yōu)閴K的當(dāng)前細(xì)分層級。對于對應(yīng)于譯碼單元的塊,陣列索引trafoDepth等于O。當(dāng)cbf_cr [xO] [yO] [trafoDepth]不存在且預(yù)測模式不是幀內(nèi)預(yù)測時,推斷cbf_cr[xO] [yO][trafoDepth]的值等于 O。
[0076]語法兀素coeff_abs_level_greaterl_flag[n]對于掃描位置η指定是否存在大于I的變換系數(shù)層級。當(dāng)coeff_abs_level_greaterl_flag[n]不存在時,推斷其等于O。
[0077]語法兀素coeff_abs_level_greater2_flag[n]對于掃描位置η指定是否存在大于2的變換系數(shù)層級。當(dāng)coeff_abs_level_greater2_flag[n]不存在時,推斷其等于O。
[0078]在針對HEVC的一個提議中,在P和B切片中使用對語法元素pred_type的不同二進(jìn)制化,如表1所示。本發(fā)明提出針對P和B切片使用相同的二進(jìn)制化。表2到4中展示實(shí)例。表5展示在共同測試條件(例如,參見F.博森,“共同測試條件和軟件參考配置(Common test conditions and software reference configurations),,, JCTVC-F900)下
對P切片的譯碼性能影響。
【權(quán)利要求】
1.一種對視頻數(shù)據(jù)進(jìn)行編碼的方法,其包括: 確定P切片中的視頻數(shù)據(jù)塊的第一預(yù)測類型; 將所述第一預(yù)測類型表示為P切片預(yù)測類型語法元素; 確定B切片中的視頻數(shù)據(jù)塊的第二預(yù)測類型; 將所述第二預(yù)測類型表示為B切片預(yù)測類型語法元素; 確定所述P切片預(yù)測類型語法元素的P切片二進(jìn)制化; 確定所述B切片預(yù)測類型語法元素的B切片二進(jìn)制化,其中所述P切片預(yù)測類型語法元素和所述B切片預(yù)測類型語法元素是使用相同的二進(jìn)制化邏輯來確定;以及 基于所述P切片預(yù)測類型語法元素和所述B切片預(yù)測語法元素的所述二進(jìn)制化對所述視頻數(shù)據(jù)進(jìn)行編碼。
2.根據(jù)權(quán)利要求1所述的方法,其中對所述視頻數(shù)據(jù)進(jìn)行編碼包括: 用所述所確定P切片二進(jìn)制化對所述P切片預(yù)測類型語法元素進(jìn)行二進(jìn)制化; 用所述所確定B切片二進(jìn)制化對所述B切片預(yù)測類型語法元素進(jìn)行二進(jìn)制化; 將上下文自適應(yīng)二進(jìn)制算術(shù)譯碼CABAC應(yīng)用于所述經(jīng)二進(jìn)制化P切片預(yù)測類型語法元素;以及 將上下文自適應(yīng)二進(jìn)制算術(shù)譯碼CABAC應(yīng)用于所述經(jīng)二進(jìn)制化B切片預(yù)測類型語法元素。
3.根據(jù)權(quán)利要求1所述的方法,其中所述P切片預(yù)測類型語法元素和所述B切片預(yù)測類型語法元素指定預(yù)測模式和分區(qū)類型。
4.根據(jù)權(quán)利要求3所述的方法,其中所述預(yù)測模式包含幀間預(yù)測和幀內(nèi)預(yù)測中的一者。
5.根據(jù)權(quán)利要求3所述的方法,其中所述分區(qū)類型包含對稱分區(qū)和不對稱分區(qū)中的一者。
6.一種對視頻數(shù)據(jù)進(jìn)行解碼的方法,其包括: 使用用于P切片中的視頻數(shù)據(jù)塊的二進(jìn)制化映射將經(jīng)二進(jìn)制化P切片預(yù)測類型語法元素映射到預(yù)測類型; 使用用于B切片中的視頻數(shù)據(jù)塊的相同二進(jìn)制化映射將經(jīng)二進(jìn)制化B切片預(yù)測類型語法元素映射到預(yù)測類型;以及 基于所述經(jīng)映射預(yù)測類型對所述視頻數(shù)據(jù)進(jìn)行解碼。
7.根據(jù)權(quán)利要求6所述的方法,其進(jìn)一步包括: 接收指示P切片中的所述視頻數(shù)據(jù)塊的所述預(yù)測類型的經(jīng)上下文自適應(yīng)二進(jìn)制算術(shù)譯碼的P切片預(yù)測類型語法元素;以及 接收指示B切片中的所述視頻數(shù)據(jù)塊的所述預(yù)測類型的經(jīng)上下文自適應(yīng)二進(jìn)制算術(shù)譯碼的B切片預(yù)測類型語法元素, 其中對所述視頻數(shù)據(jù)進(jìn)行解碼進(jìn)一步包括: 對所述P切片預(yù)測類型語法元素進(jìn)行解碼以產(chǎn)生所述經(jīng)二進(jìn)制化P切片預(yù)測類型語法元素;以及 對所述B切片預(yù)測類型語法元素進(jìn)行解碼以產(chǎn)生所述經(jīng)二進(jìn)制化B切片預(yù)測類型語法元素。
8.根據(jù)權(quán)利要求6所述的方法,其中所述P切片預(yù)測類型語法元素和所述B切片預(yù)測類型語法元素指定預(yù)測模式和分區(qū)類型。
9.根據(jù)權(quán)利要求8所述的方法,其中所述預(yù)測模式包含幀間預(yù)測和幀內(nèi)預(yù)測中的一者。
10.根據(jù)權(quán)利要求8所述的方法,其中所述分區(qū)類型包含對稱分區(qū)和不對稱分區(qū)中的一者O
11.一種經(jīng)配置以對視頻數(shù)據(jù)進(jìn)行編碼的設(shè)備,其包括: 用于確定P切片中的視頻數(shù)據(jù)塊的第一預(yù)測類型的裝置; 用于將所述第一預(yù)測類型表示為P切片預(yù)測類型語法元素的裝置; 用于確定B切片中的視頻數(shù)據(jù)塊的第二預(yù)測類型的裝置; 用于將所述第二預(yù)測類型表示為B切片預(yù)測類型語法元素的裝置; 用于確定所述P切片預(yù)測類型語法元素的P切片二進(jìn)制化的裝置; 用于確定所述B切片預(yù)測類型 語法元素的B切片二進(jìn)制化的裝置,其中所述P切片預(yù)測類型語法元素和所述B切片預(yù)測類型語法元素是使用相同的二進(jìn)制化邏輯來確定;以及用于基于所述P切片預(yù)測類型語法元素和所述B切片預(yù)測語法元素的所述二進(jìn)制化對所述視頻數(shù)據(jù)進(jìn)行編碼的裝置。
12.根據(jù)權(quán)利要求11所述的設(shè)備,其中所述用于對所述視頻數(shù)據(jù)進(jìn)行編碼的裝置包括: 用于用所述所確定P切片二進(jìn)制化對所述P切片預(yù)測類型語法元素進(jìn)行二進(jìn)制化的裝置; 用于用所述所確定B切片二進(jìn)制化對所述B切片預(yù)測類型語法元素進(jìn)行二進(jìn)制化的裝置; 用于將上下文自適應(yīng)二進(jìn)制算術(shù)譯碼CABAC應(yīng)用于所述經(jīng)二進(jìn)制化P切片預(yù)測類型語法元素的裝置;以及 用于將上下文自適應(yīng)二進(jìn)制算術(shù)譯碼CABAC應(yīng)用于所述經(jīng)二進(jìn)制化B切片預(yù)測類型語法元素的裝置。
13.根據(jù)權(quán)利要求11所述的設(shè)備,其中所述P切片預(yù)測類型語法元素和所述B切片預(yù)測類型語法元素指定預(yù)測模式和分區(qū)類型。
14.根據(jù)權(quán)利要求13所述的設(shè)備,其中所述預(yù)測模式包含幀間預(yù)測和幀內(nèi)預(yù)測中的一者。
15.根據(jù)權(quán)利要求13所述的設(shè)備,其中所述分區(qū)類型包含對稱分區(qū)和不對稱分區(qū)中的一者O
16.一種經(jīng)配置以對視頻數(shù)據(jù)進(jìn)行解碼的設(shè)備,其包括: 用于使用用于P切片中的視頻數(shù)據(jù)塊的二進(jìn)制化映射將經(jīng)二進(jìn)制化P切片預(yù)測類型語法元素映射到預(yù)測類型的裝置; 用于使用用于B切片中的視頻數(shù)據(jù)塊的相同二進(jìn)制化映射將經(jīng)二進(jìn)制化B切片預(yù)測類型語法元素映射到預(yù)測類型的裝置;以及 用于基于所述經(jīng)映射預(yù)測類型對所述視頻數(shù)據(jù)進(jìn)行解碼的裝置。
17.根據(jù)權(quán)利要求16所述的設(shè)備,其進(jìn)一步包括:用于接收指示P切片中的所述視頻數(shù)據(jù)塊的所述預(yù)測類型的經(jīng)上下文自適應(yīng)二進(jìn)制算術(shù)譯碼的P切片預(yù)測類型語法元素的裝置;以及 用于接收指示B切片中的所述視頻數(shù)據(jù)塊的所述預(yù)測類型的經(jīng)上下文自適應(yīng)二進(jìn)制算術(shù)譯碼的B切片預(yù)測類型語法元素的裝置, 其中所述用于對所述視頻數(shù)據(jù)進(jìn)行解碼的裝置進(jìn)一步包括: 用于對所述P切片預(yù)測類型語法元素進(jìn)行解碼以產(chǎn)生所述經(jīng)二進(jìn)制化P切片預(yù)測類型語法元素的裝置;以及 用于對所述B切片預(yù)測類型語法元素進(jìn)行解碼以產(chǎn)生所述經(jīng)二進(jìn)制化B切片預(yù)測類型語法元素的裝置。
18.根據(jù)權(quán)利要求16所述的設(shè)備,其中所述P切片預(yù)測類型語法元素和所述B切片預(yù)測類型語法元素指定預(yù)測模式和分區(qū)類型。
19.根據(jù)權(quán)利要求18所述的設(shè)備,其中所述預(yù)測模式包含幀間預(yù)測和幀內(nèi)預(yù)測中的一者。
20.根據(jù)權(quán)利要求18所述的設(shè)備,其中所述分區(qū)類型包含對稱分區(qū)和不對稱分區(qū)中的一者O
21.—種經(jīng)配置以對視頻數(shù)據(jù)進(jìn)行編碼的設(shè)備,其包括: 視頻編碼器,其經(jīng)配置以: 確定P切片中的視頻數(shù)據(jù)塊的第一預(yù)測類型; 將所述第一預(yù)測類型表示為P切片預(yù)測類型語法元素; 確定B切片中的視頻數(shù)據(jù)塊的第二預(yù)測類型; 將所述第二預(yù)測類型表示為B切片預(yù)測類型語法元素; 確定所述P切片預(yù)測類型語法元素的P切片二進(jìn)制化; 確定所述B切片預(yù)測類型語法元素的B切片二進(jìn)制化,其中所述P切片預(yù)測類型語法元素和所述B切片預(yù)測類型語法元素是使用相同的二進(jìn)制化邏輯來確定;以及 基于所述P切片預(yù)測類型語法元素和所述B切片預(yù)測語法元素的所述二進(jìn)制化對所述視頻數(shù)據(jù)進(jìn)行編碼。
22.根據(jù)權(quán)利要求21所述的設(shè)備,其中所述視頻編碼器進(jìn)一步經(jīng)配置以: 用所述所確定P切片二進(jìn)制化對所述P切片預(yù)測類型語法元素進(jìn)行二進(jìn)制化; 用所述所確定B切片二進(jìn)制化對所述B切片預(yù)測類型語法元素進(jìn)行二進(jìn)制化; 將上下文自適應(yīng)二進(jìn)制算術(shù)譯碼CABAC應(yīng)用于所述經(jīng)二進(jìn)制化P切片預(yù)測類型語法元素;以及 將上下文自適應(yīng)二進(jìn)制算術(shù)譯碼CABAC應(yīng)用于所述經(jīng)二進(jìn)制化B切片預(yù)測類型語法元 素。
23.根據(jù)權(quán)利要求21所述的設(shè)備,其中所述P切片預(yù)測類型語法元素和所述B切片預(yù)測類型語法元素指定預(yù)測模式和分區(qū)類型。
24.根據(jù)權(quán)利要求23所述的設(shè)備,其中所述預(yù)測模式包含幀間預(yù)測和幀內(nèi)預(yù)測中的一者。
25.根據(jù)權(quán)利要求23所述的設(shè)備,其中所述分區(qū)類型包含對稱分區(qū)和不對稱分區(qū)中的一者O
26.—種經(jīng)配置以對視頻數(shù)據(jù)進(jìn)行解碼的設(shè)備,其包括: 視頻解碼器,其經(jīng)配置以: 使用用于P切片中的視頻數(shù)據(jù)塊的二進(jìn)制化映射將經(jīng)二進(jìn)制化P切片預(yù)測類型語法元素映射到預(yù)測類型; 使用用于B切片中的視頻數(shù)據(jù)塊的相同二進(jìn)制化映射將經(jīng)二進(jìn)制化B切片預(yù)測類型語法元素映射到預(yù)測類型;以及 基于所述經(jīng)映射預(yù)測類型對所述視頻數(shù)據(jù)進(jìn)行解碼。
27.根據(jù)權(quán)利要求26所述的設(shè)備,其中所述視頻解碼器進(jìn)一步經(jīng)配置以: 接收指示P切片中的所述視頻數(shù)據(jù)塊的所述預(yù)測類型的經(jīng)上下文自適應(yīng)二進(jìn)制算術(shù)譯碼的P切片預(yù)測類型語法元素; 接收指示B切片中的所述視頻數(shù)據(jù)塊的所述預(yù)測類型的經(jīng)上下文自適應(yīng)二進(jìn)制算術(shù)譯碼的B切片預(yù)測類型語法元素; 對所述P切片預(yù)測類型語法元素進(jìn)行解碼以產(chǎn)生所述經(jīng)二進(jìn)制化P切片預(yù)測類型語法元素;以及 對所述B切片預(yù)測類型語法元素進(jìn)行解碼以產(chǎn)生所述經(jīng)二進(jìn)制化B切片預(yù)測類型語法元素。
28.根據(jù)權(quán)利要求26所述的設(shè)備,其中所述P切片預(yù)測類型語法元素和所述B切片預(yù)測類型語法元素指定預(yù)測模式和分區(qū)類型。
29.根據(jù)權(quán)利要求28所述的設(shè)備,其中所述預(yù)測模式包含幀間預(yù)測和幀內(nèi)預(yù)測中的一者。
30.根據(jù)權(quán)利要求28所述的設(shè)備,其中所述分區(qū)類型包含對稱分區(qū)和不對稱分區(qū)中的一者O
31.一種存儲指令的計算機(jī)可讀存儲媒體,所述指令在執(zhí)行時致使經(jīng)配置以對視頻數(shù)據(jù)進(jìn)行編碼的一個或多個處理器: 確定P切片中的視頻數(shù)據(jù)塊的第一預(yù)測類型; 將所述第一預(yù)測類型表示為P切片預(yù)測類型語法元素; 確定B切片中的視頻數(shù)據(jù)塊的第二預(yù)測類型; 將所述第二預(yù)測類型表示為B切片預(yù)測類型語法元素; 確定所述P切片預(yù)測類型語法元素的P切片二進(jìn)制化; 確定所述B切片預(yù)測類型語法元素的B切片二進(jìn)制化,其中所述P切片預(yù)測類型語法元素和所述B切片預(yù)測類型語法元素是使用相同的二進(jìn)制化邏輯來確定;以及 基于所述P切片預(yù)測類型語法元素和所述B切片預(yù)測語法元素的所述二進(jìn)制化對所述視頻數(shù)據(jù)進(jìn)行編碼。
32.根據(jù)權(quán)利要求31所述的計算機(jī)可讀存儲媒體,其中所述指令進(jìn)一步致使所述一個或多個處理器: 用所述所確定P切片二進(jìn)制化對所述P切片預(yù)測類型語法元素進(jìn)行二進(jìn)制化; 用所述所確定B切片二進(jìn)制化對所述B切片預(yù)測類型語法元素進(jìn)行二進(jìn)制化; 將上下文自適應(yīng)二進(jìn)制算術(shù)譯碼CABAC應(yīng)用于所述經(jīng)二進(jìn)制化P切片預(yù)測類型語法元素;以及將上下文自適應(yīng)二進(jìn)制算術(shù)譯碼CABAC應(yīng)用于所述經(jīng)二進(jìn)制化B切片預(yù)測類型語法元素。
33.根據(jù)權(quán)利要求31所述的計算機(jī)可讀存儲媒體,其中所述P切片預(yù)測類型語法元素和所述B切片預(yù)測類型語法元素指定預(yù)測模式和分區(qū)類型。
34.根據(jù)權(quán)利要求33所述的計算機(jī)可讀存儲媒體,其中所述預(yù)測模式包含幀間預(yù)測和幀內(nèi)預(yù)測中的一者。
35.根據(jù)權(quán)利要求33所述的計算機(jī)可讀存儲媒體,其中所述分區(qū)類型包含對稱分區(qū)和不對稱分區(qū)中的一者。
36.一種存儲指令的計算機(jī)可讀存儲媒體,所述指令在執(zhí)行時致使經(jīng)配置以對視頻數(shù)據(jù)進(jìn)行解碼的一個或多 個處理器: 使用用于P切片中的視頻數(shù)據(jù)塊的二進(jìn)制化映射將經(jīng)二進(jìn)制化P切片預(yù)測類型語法元素映射到預(yù)測類型; 使用用于B切片中的視頻數(shù)據(jù)塊的相同二進(jìn)制化映射將經(jīng)二進(jìn)制化B切片預(yù)測類型語法元素映射到預(yù)測類型;以及 基于所述經(jīng)映射預(yù)測類型對所述視頻數(shù)據(jù)進(jìn)行解碼。
37.根據(jù)權(quán)利要求36所述的計算機(jī)可讀存儲媒體,其中所述指令進(jìn)一步致使所述一個或多個處理器: 接收指示P切片中的所述視頻數(shù)據(jù)塊的所述預(yù)測類型的經(jīng)上下文自適應(yīng)二進(jìn)制算術(shù)譯碼的P切片預(yù)測類型語法元素; 接收指示B切片中的所述視頻數(shù)據(jù)塊的所述預(yù)測類型的經(jīng)上下文自適應(yīng)二進(jìn)制算術(shù)譯碼的B切片預(yù)測類型語法元素; 對所述P切片預(yù)測類型語法元素進(jìn)行解碼以產(chǎn)生所述經(jīng)二進(jìn)制化P切片預(yù)測類型語法元素;以及 對所述B切片預(yù)測類型語法元素進(jìn)行解碼以產(chǎn)生所述經(jīng)二進(jìn)制化B切片預(yù)測類型語法元素。
38.根據(jù)權(quán)利要求36所述的計算機(jī)可讀存儲媒體,其中所述P切片預(yù)測類型語法元素和所述B切片預(yù)測類型語法元素指定預(yù)測模式和分區(qū)類型。
39.根據(jù)權(quán)利要求38所述的計算機(jī)可讀存儲媒體,其中所述預(yù)測模式包含幀間預(yù)測和幀內(nèi)預(yù)測中的一者。
40.根據(jù)權(quán)利要求38所述的計算機(jī)可讀存儲媒體,其中所述分區(qū)類型包含對稱分區(qū)和不對稱分區(qū)中的一者。
【文檔編號】H03M7/40GK103988437SQ201280054835
【公開日】2014年8月13日 申請日期:2012年10月5日 優(yōu)先權(quán)日:2011年11月8日
【發(fā)明者】錢威俊, 霍埃爾·索賴羅哈斯, 馬爾塔·卡切維奇 申請人:高通股份有限公司