用信號發(fā)送用于視頻譯碼的量化矩陣的制作方法
【專利摘要】本發(fā)明的技術大體上可涉及用信號發(fā)送量化矩陣的值。在一些實例中,可基于系數(shù)值在所述量化矩陣中的位置而用不同因數(shù)對所述量化矩陣中的所述系數(shù)值進行降頻采樣。
【專利說明】用信號發(fā)送用于視頻譯碼的量化矩陣
[0001]本申請案主張以下各者的權利:2011年11月7日申請的美國臨時申請案第61/556,785號;2012年2月3日申請的美國臨時申請案第61/594,885號;2012年2月9日申請的美國臨時申請案第61/597,107號;及2012年3月I日申請的美國臨時申請案第61/605,654號,所述申請案中的每一者的全部內(nèi)容以引用方式并入本文中。
【技術領域】
[0002]本發(fā)明涉及數(shù)據(jù)譯碼,且更明確地說,涉及用于譯碼視頻數(shù)據(jù)的技術。
【背景技術】
[0003]數(shù)字視頻能力可并入到廣泛范圍的裝置中,裝置包含數(shù)字電視、數(shù)字直播系統(tǒng)、無線廣播系統(tǒng)、個人數(shù)字助理(PDA)、膝上型或桌上型計算機、數(shù)字相機、數(shù)字記錄裝置、數(shù)字媒體播放器、視頻游戲裝置、視頻游戲機、蜂窩式或衛(wèi)星無線電電話、視頻電傳會議裝置及類似者。數(shù)字視頻裝置實施視頻壓縮技術,例如由MPEG-2、MPEG-4、ITU-TH.263、ITU-TH.264/MPEG-4第十部分(進階視頻譯碼(AVC))定義的標準、目前在開發(fā)中的高效率視頻譯碼(HEVC)標準和這些標準的擴展中所描述的視頻壓縮技術,以更有效率地發(fā)射、接收并存儲數(shù)字視頻信息。
[0004]視頻壓縮技術包含空間預測和/或時間預測以減少或去除視頻序列中固有的冗余。對于基于塊的視頻譯碼,視頻幀或切片可分割成多個塊。每一塊可予以進一步分割。幀內(nèi)譯碼(I)幀或切片中的塊是使用相對于同一幀或切片中的相鄰塊中的參考樣本的空間預測來編碼。幀間譯碼(P或B)幀或切片中的塊可使用相對于同一幀或切片中的相鄰塊中的參考樣本的空間預測,或相對于其它參考幀中的參考樣本的時間預測??臻g或時間預測產(chǎn)生用于待譯碼塊的預測性塊。殘余數(shù)據(jù)表示待譯碼的原始塊與預測性塊之間的像素差。
[0005]經(jīng)幀間譯碼的塊是根據(jù)指向形成預測性塊的參考樣本的塊的運動向量和指示經(jīng)譯碼塊與預測性塊之間的差異的殘余數(shù)據(jù)來編碼。經(jīng)幀內(nèi)譯碼的塊是根據(jù)幀內(nèi)譯碼模式和殘余數(shù)據(jù)來編碼。為了進一步壓縮,殘余數(shù)據(jù)可從像素域變換到變換域,從而產(chǎn)生接著可被量化的殘余變換系數(shù)。最初布置成二維陣列的經(jīng)量化的變換系數(shù)可以特定次序加以掃描以產(chǎn)生變換系數(shù)的一維向量以用于熵譯碼。
【發(fā)明內(nèi)容】
[0006]一般來說,本發(fā)明描述用信號發(fā)送量化矩陣的值。例如,視頻編碼器可將量化矩陣的值劃分成至少值的第一子集和值的第二子集。視頻編碼器可將所述第一子集的所述值作為語法元素編碼及用信號發(fā)送。視頻解碼器可接收所述第一子集的所述值的語法元素且解碼所述語法元素以產(chǎn)生所述第一子集的所述值。在未接收所述第二子集的所述值的情況下,視頻解碼器可根據(jù)所述第一子集中的所述值預測所述第二子集的所述值。
[0007]在本發(fā)明的一個實例中,一種編碼視頻數(shù)據(jù)的方法包括:產(chǎn)生包含多個值的量化矩陣;按第一降頻采樣因數(shù)降頻采樣所述量化矩陣中的第一值集合以產(chǎn)生第一降頻采樣值集合;按第二降頻采樣因數(shù)降頻采樣所述量化矩陣中的第二值集合以產(chǎn)生第二降頻采樣值集合;以及產(chǎn)生包含所述第一降頻采樣值集合及所述第二降頻采樣值集合的經(jīng)譯碼位流。
[0008]在本發(fā)明的另一實例中,一種解碼視頻數(shù)據(jù)的方法包括:在經(jīng)譯碼位流中接收用降頻采樣值譯碼的量化矩陣;按第一升頻采樣因數(shù)升頻采樣所述量化矩陣中的第一降頻采樣值集合以產(chǎn)生第一值集合;按第二升頻采樣因數(shù)升頻采樣所述量化矩陣中的第二降頻采樣值集合以產(chǎn)生第二值集合;以及用所述第一及所述第二值集合反量化變換系數(shù)塊。
[0009]一或多個實例的細節(jié)陳述于隨附圖式及以下描述中。其它特征、目標及優(yōu)勢將從所述描述及所述圖式以及從權利要求書顯而易見。
【專利附圖】
【附圖說明】
[0010]圖1為說明可利用本發(fā)明中所描述的技術的實例視頻編碼及解碼系統(tǒng)的框圖。
[0011]圖2為說明可實施本發(fā)明中所描述的技術的實例視頻編碼器的框圖。
[0012]圖3為說明可實施本發(fā)明中所描述的技術的實例視頻解碼器的框圖。
[0013]圖4為說明實例量化矩陣的概念圖。
[0014]圖5為說明具有實例值的量化矩陣的概念圖。
[0015]圖6為說明利用本發(fā)明的一或多個實例技術的重構建的量化矩陣的概念圖。
[0016]圖7為說明用于量化矩陣的一個實例中的不同部分的降頻采樣因數(shù)的概念圖。
[0017]圖8為說明用于量化矩陣的另一實例中的不同部分的降頻采樣因數(shù)的概念圖。
[0018]圖9為說明用于量化矩陣的另一實例中的不同部分的降頻采樣因數(shù)的概念圖。
[0019]圖10為說明根據(jù)本發(fā)明的技術的視頻編碼方法的流程圖。
[0020]圖11為說明根據(jù)本發(fā)明的技術的視頻解碼方法的流程圖。
【具體實施方式】
[0021]本發(fā)明描述用于在視頻譯碼中用信號發(fā)送量化矩陣的值的技術。量化矩陣可為包含多個值的二維矩陣。作為說明,量化矩陣可用以縮放量化步長,量化步長用于量化與用于視頻譯碼的變換單元相關聯(lián)的殘余變換系數(shù)。可將量化參數(shù)(QP)指派給一變換系數(shù)塊(例如,一變換單元)以指定一量化步長。量化矩陣中的每一值對應于塊中的一待量化的系數(shù),且用以確定待應用于系數(shù)的量化程度(給定QP值)。
[0022]明確地說,本發(fā)明提議用于降頻采樣量化矩陣的技術,使得僅需在經(jīng)編碼視頻位流中傳輸和/或存儲較少的量化值。傳輸或存儲與視頻數(shù)據(jù)的塊相關聯(lián)的整個量化矩陣可能需要大量位,從而降低經(jīng)譯碼視頻位流的頻寬效率。又,視頻解碼器可將整個量化矩陣存儲于存儲裝置中以供反量化過程使用。通過利用本發(fā)明的技術降頻采樣量化矩陣,可在不實質(zhì)上降低經(jīng)譯碼視頻的質(zhì)量的情況下節(jié)約位。
[0023]在本發(fā)明中,將出于說明目的對視頻譯碼進行描述。本發(fā)明中所描述的譯碼技術也可適用于其它類型的數(shù)據(jù)譯碼。數(shù)字視頻裝置實施視頻壓縮技術以更有效率地編碼及解碼數(shù)字視頻信息。視頻壓縮可應用空間(圖幀內(nèi))預測和/或時間(圖幀間)預測技術以減少或去除視頻序列中固有的幾余。
[0024]應理解,術語“幀”可與術語“圖片”互換地使用。換句話說,術語“幀”及“圖片”各自指視頻的一部分,且?guī)驁D片的順序顯示導致平滑播放。因此,在本發(fā)明使用術語“幀”的例子中,本發(fā)明的技術不應被解釋為限于利用術語“幀”的視頻譯碼技術或標準,且所述技術可擴展到其它標準(例如,已開發(fā)標準、開發(fā)中標準或未來標準)或利用術語“圖片”的其它視頻譯碼技術。
[0025]典型視頻編碼器將原始視頻序列的每一幀分割成被稱作“塊”或“譯碼單元”的鄰接的矩形區(qū)域。這些塊是以“幀內(nèi)模式”(I模式)或以“幀間模式”(P模式或B模式)來編碼。
[0026]對于P模式或B模式,編碼器首先在由Fref指示的“參考幀”中搜尋類似于正被編碼的塊的塊。搜尋通常局限于距待編碼的塊不超過特定空間位移的范圍。當最佳匹配(即,預測性塊或“預測”)已被識別時,以二維(2D)運動向量(ΛΧ,Δγ)的形式表示最佳匹配,其中ΛX為在參考幀中預測性塊中的像素的位置相對于在待譯碼塊中的像素的位置的水平位移且Ay為在參考幀中預測性塊中的像素的位置相對于在待譯碼塊中的像素的位置的垂直位移。
[0027]如下所述,將運動向量與參考幀一起用以構建預測塊Fpral:
[0028]Fpred (X,y) = Fref (χ+Δχ, y+Δ y)
[0029]像素在幀中的位置由(X,y)指示。
[0030]對于以I模式編碼的塊,預測塊是使用空間預測根據(jù)同一圖幀內(nèi)的先前編碼的相鄰塊來形成。對于I模式及P或B模式兩者,將預測誤差(即,正被編碼的塊及預測塊中的像素值之間的殘余差異)表示為某一離散變換(例如,離散余弦變換(DCT))的加權基底函數(shù)的集合。變換可基于不同大小的塊(例如,4X4、8X8或16X16及更大)而執(zhí)行。變換塊的形狀并非總為正方形。也可使用矩形形狀的變換塊,例如,具有16X4、32X8等的變換塊大小。
[0031]隨后量化權數(shù)(B卩,變換系數(shù))。量化引入信息的損失,且因而,經(jīng)量化系數(shù)具有比原始變換系數(shù)低的精度。經(jīng)量化的變換系數(shù)和運動向量為“語法元素”的實例。這些語法元素加上某一控制信息形成視頻序列的經(jīng)譯碼表示。也可對語法元素進行熵譯碼,藉此進一步減少其表示所需要的位的數(shù)目。熵譯碼為以通過利用符號分布的性質(zhì)(某些符號比其它符號出現(xiàn)地更頻繁)最小化表示所傳輸或存儲符號(在本情況下為語法元素)所需的位數(shù)目為目標的無損失操作。
[0032]壓縮比(S卩,用以表示原始序列及壓縮序列的位數(shù)目的比)可通過調(diào)整量化參數(shù)(QP)的值及量化矩陣中的值中的一者或兩者來控制,QP及量化矩陣皆可用以量化變換系數(shù)值。壓縮比可視所使用的熵譯碼方法而定。量化矩陣通常經(jīng)設計使得矩陣中的量化值通常(但未必無例外地)在行(左到右)方向及列(上到下)方向兩者上增加。例如,當變換系數(shù)塊從左上(0,0)角中的DC位置朝著變換系數(shù)塊的右下(η,η)角延伸到較高頻率系數(shù)時,量化矩陣中的對應值通常增加。此設計的原因在于,人類視覺系統(tǒng)(HVS)的對比敏感性函數(shù)(CSF)隨頻率增加而減小,在水平方向及垂直方向上均如此。
[0033]在解碼器中,當前幀中的塊是通過首先以與編碼器中的方式相同的方式構建塊的預測且通過將經(jīng)壓縮預測誤差添加到預測而獲得。經(jīng)壓縮預測誤差通過使用經(jīng)量化系數(shù)對變換基底函數(shù)進行加權而發(fā)現(xiàn)。重構建的幀與原始幀之間的差異被稱為重構建誤差。
[0034]圖1為說明可利用本發(fā)明中所描述的技術的實例視頻編碼及解碼系統(tǒng)10的框圖。如圖1中所展示,系統(tǒng)10包含源裝置12,其經(jīng)由通信信道16將經(jīng)編碼視頻傳輸?shù)侥康牡匮b置14。經(jīng)編碼視頻數(shù)據(jù)也可存儲于存儲媒體34或文件服務器36上且可由目的地裝置14按需要接入。當存儲到存儲媒體或文件服務器時,視頻編碼器20可將經(jīng)譯碼視頻數(shù)據(jù)提供到另一裝置(例如,網(wǎng)絡接口、緊密光盤(CD)、藍光或數(shù)字影音光盤(DVD)燒錄器或沖印設施裝置,或其它裝置)以用于將經(jīng)譯碼視頻數(shù)據(jù)存儲到存儲媒體。同樣,與視頻解碼器30分離的裝置(例如,網(wǎng)絡接口、⑶或DVD讀取器或類似者)可從存儲媒體檢索經(jīng)譯碼視頻數(shù)據(jù)且將所檢索數(shù)據(jù)提供到視頻解碼器30。
[0035]源裝置12及目的地裝置14可包括包含以下各者的廣泛范圍的裝置中的任一者:桌上型計算機,筆記型(即,膝上型)計算機,平板計算機,機頂盒,例如所謂智能電話的電話手機,電視,攝影機,顯示裝置,數(shù)字媒體播放器,視頻游戲機,或類似者。在許多情況下,這些裝置可經(jīng)配備以用于無線通信。因此,通信信道16可包括無線信道、有線信道,或無線信道及有線信道的適合于傳輸經(jīng)編碼視頻數(shù)據(jù)的組合。類似地,文件服務器36可由目的地裝置14經(jīng)由任何標準數(shù)據(jù)連接(包含因特網(wǎng)連接)接入。此可包含無線信道(例如,W1-Fi連接)、有線連接(例如,DSL、纜線調(diào)制解調(diào)器等)或無線信道與有線連接的適合于接入存儲于文件服務器上的經(jīng)編碼視頻數(shù)據(jù)的組合。
[0036]根據(jù)本發(fā)明的實例的用于用信號發(fā)送量化矩陣的技術可應用于支持多種多媒體應用中的任一者的視頻譯碼,多媒體應用例如空中(over-the-air)電視廣播、有線電視傳輸、衛(wèi)星電視傳輸、流式傳輸視頻傳輸(例如,經(jīng)由因特網(wǎng))、供存儲于數(shù)據(jù)存儲媒體上的數(shù)字視頻的編碼、存儲于數(shù)據(jù)存儲媒體上的數(shù)字視頻的解碼或其它應用。在一些實例中,系統(tǒng)10可經(jīng)配置以支持單向或雙向視頻傳輸以支持例如視頻流式傳輸、視頻播放、視頻廣播和/或視頻電話的應用。
[0037]在圖1的實例中,源裝置12包含視頻源18、視頻編碼器20、調(diào)制器/解調(diào)制器22和發(fā)射器24。在源裝置12中,視頻源18可包含例如視頻捕獲裝置(例如,視頻攝影機)、含有先前捕獲的視頻的視頻存檔、用以從視頻內(nèi)容提供者接收視頻的視頻饋送接口和/或用于產(chǎn)生作為源視頻的計算機圖形數(shù)據(jù)的計算機圖形系統(tǒng)或這些源的組合的源。作為一個實例,如果視頻源18為視頻攝影機,則源裝置12及目的地裝置14可形成所謂的攝影機電話或視頻電話。然而,本發(fā)明中所描述的技術通??蛇m用于視頻譯碼,且可應用于無線和/或有線應用或?qū)⒔?jīng)編碼視頻數(shù)據(jù)存儲于本端碟片上的應用。
[0038]所捕獲、預先捕獲或計算機產(chǎn)生的視頻可由視頻編碼器20編碼。經(jīng)編碼視頻信息可根據(jù)例如無線通信協(xié)議的通信標準由調(diào)制解調(diào)器22調(diào)制,且經(jīng)由發(fā)射器24傳輸?shù)侥康牡匮b置14。調(diào)制解調(diào)器22可包含各種混頻器、濾波器、放大器或經(jīng)設計以用于信號調(diào)制的其它組件。發(fā)射器24可包含經(jīng)設計以用于傳輸數(shù)據(jù)的電路,包含放大器、濾波器和一或多個天線。
[0039]由視頻編碼器20編碼的所捕獲、預先捕獲或計算機產(chǎn)生的視頻也可存儲到存儲媒體34或文件服務器36上以供稍后使用。存儲媒體34可包含藍光光盤、DVD、⑶-ROM、快閃存儲裝置或用于存儲經(jīng)編碼視頻的任何其它合適數(shù)字存儲媒體。存儲于存儲媒體34上的經(jīng)編碼視頻可接著由目的地裝置14接入以用于解碼及播放。雖然圖1中未展示,但在一些實例中,存儲媒體34和/或文件服務器36可存儲發(fā)射器24的輸出。
[0040]文件服務器36可為能夠存儲經(jīng)編碼視頻且將經(jīng)編碼視頻傳輸?shù)侥康牡匮b置14的任何類型的服務器。實例文件服務器包含網(wǎng)站服務器(例如,用于網(wǎng)站)、FTP服務器、網(wǎng)絡附接存儲(NAS)裝置、本端磁盤機,或能夠存儲經(jīng)編碼視頻數(shù)據(jù)且將經(jīng)編碼視頻數(shù)據(jù)傳輸?shù)侥康牡匮b置的任何其它類型的裝置。經(jīng)編碼視頻數(shù)據(jù)從文件服務器36的傳輸可為流式傳輸、下載傳輸或兩者的組合。文件服務器36可由目的地裝置14經(jīng)由任何標準數(shù)據(jù)連接(包含因特網(wǎng)連接)接入。此可包含無線信道(例如,W1-Fi連接)、有線連接(例如,DSL、纜線調(diào)制解調(diào)器、乙太網(wǎng)絡、USB等)或無線信道與有線連接的適合于接入存儲于文件服務器上的經(jīng)編碼視頻數(shù)據(jù)的組合。
[0041]在圖1的實例中,目的地裝置14包含接收器26、調(diào)制解調(diào)器28、視頻解碼器30和顯示裝置32。目的地裝置14的接收器26經(jīng)由信道16接收信息,且調(diào)制解調(diào)器28解調(diào)制信息以產(chǎn)生供視頻解碼器30使用的經(jīng)解調(diào)制位流。經(jīng)由信道16傳達的信息可包含由視頻編碼器20產(chǎn)生以供視頻解碼器30在解碼視頻數(shù)據(jù)時使用的多種語法信息。此語法也可與存儲于存儲媒體34或文件服務器36上的經(jīng)編碼視頻數(shù)據(jù)包含在一起。視頻編碼器20及視頻解碼器30中的每一者可形成能夠編碼或解碼視頻數(shù)據(jù)的相應編碼器-解碼器(CODEC)的部分。
[0042]顯示裝置32可與目的地裝置14集成或在目的地裝置14外。在一些實例中,目的地裝置14可包含集成式顯示裝置且也可經(jīng)配置以與外部顯示裝置介接。在其它實例中,目的地裝置14可為顯示裝置。一般來說,顯示裝置32向用戶顯示經(jīng)解碼視頻數(shù)據(jù),且可包括多種顯示裝置中的任一者,例如,液晶顯示器(LCD)、等離子顯示器、有機發(fā)光二極管(OLED)顯示器或另一類型的顯示裝置。
[0043]在圖1的實例中,通信信道16可包括任何無線或有線通信媒體(例如,射頻(RF)譜或一或多個實體傳輸線,或無線與有線媒體的任何組合)。通信信道16可形成基于封包的網(wǎng)絡(例如,局域網(wǎng)、廣域網(wǎng),或例如因特網(wǎng)的全球網(wǎng)絡)的部分。通信信道16通常表示用于將視頻數(shù)據(jù)從源裝置12傳輸?shù)侥康牡匮b置14的任何合適通信媒體或不同通信媒體的集合,包含有線或無線媒體的任何合適組合。通信信道16可包含路由器、交換器、基地臺或?qū)Υ龠M從源裝置12到目的地裝置14的通信有用處的任何其它裝備。
[0044]視頻編碼器20和視頻解碼器30可根據(jù)視頻壓縮標準(例如,目前在開發(fā)中的高效率視頻譯碼標準(HEVC))來操作,且可遵守HEVC測試模型(HM)。替代地,視頻編碼器20及視頻解碼器30可根據(jù)其它專有或工業(yè)標準(例如,替代地稱為MPEG-4第十部分(進階視頻譯碼(AVC))的ITU-T H.264標準)或這些標準的擴展而操作。然而,本發(fā)明的技術不限于任何特定譯碼標準。視頻壓縮標準的其它實例包含MPEG-2及ITU-T H.263。
[0045]雖然圖1中未展示,但在一些方面中,視頻編碼器20及視頻解碼器30可各自與音頻編碼器及解碼器集成,且可包含適當多路復用器-多路分用器(MUX-DEMUX)單元或其它硬件及軟件以處置共同數(shù)據(jù)流或單獨數(shù)據(jù)流中的音頻及視頻兩者的編碼。如果適用,則在一些實例中,MUX-DEMUX單元可遵照ITU H.223多路復用器協(xié)議或例如用戶數(shù)據(jù)報協(xié)議(UDP)的其它協(xié)議。
[0046]視頻編碼器20及視頻解碼器30可各自實施為多種合適編碼器電路中的任一者,例如,一或多個微處理器、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)、離散邏輯、軟件、硬件、固件或其任何組合。當所述技術部分地以軟件實施時,裝置可將用于軟件的指令存儲于合適的非暫時性計算機可讀媒體中,且使用一或多個處理器在硬件中執(zhí)行指令以執(zhí)行本發(fā)明的技術。視頻編碼器20及視頻解碼器30中的每一者可包含于一或多個編碼器或解碼器中,其任一者可集成為相應裝置中的組合式編碼器/解碼器(編碼解碼器)的部分。
[0047]對于根據(jù)目前由視頻譯碼聯(lián)合協(xié)作小組(JCT-VC)開發(fā)的新興HEVC標準的視頻譯碼,作為一個實例,可將視頻幀分割成譯碼單元。譯碼單元(CU)通常指圖像區(qū)域,圖像區(qū)域充當被應用各種譯碼工具以用于視頻壓縮的基本單元。CU通常具有指示為Y的亮度分量和指不為U及V的兩個色度分量。視視頻米樣格式而定,U和V分量的大小可與Y分量的大小相同或不同(就樣本的數(shù)目來說)。CU通常為正方形,且可被認為類似于所謂宏塊(例如,根據(jù)例如ITU-T H.264的其它視頻譯碼標準)。出于說明目的,將在本申請案中描述根據(jù)開發(fā)中的HEVC標準的當前提議方面中的一些的譯碼。然而,本發(fā)明中所描述的技術對其它視頻譯碼過程例如,根據(jù)H.264定義的視頻譯碼過程,或其它標準或?qū)S幸曨l譯碼過程)可能有用處。
[0048]HEVC標準化努力是基于視頻譯碼裝置的被稱為HEVC測試模型(HM)的模型。HM假定了視頻譯碼裝置的相對于根據(jù)(例如)ITU-T H.264/AVC的裝置的若干能力。例如,盡管
H.264提供九個幀內(nèi)預測編碼模式,但HM可提供多達35個幀內(nèi)預測編碼模式。HEVC的近期最新工作草案(WD)(在下文中被稱為HEVC WD7)可自2012年10月30起從http://phenix.1nt-evry.fr/jet/doc_end_user/documents/9_Geneva/wgll/JCTVC-11003-v6.zip 獲得。
[0049]一般來說,HM的工作模型描述:視頻幀或圖片可被劃分為包含亮度樣本及色度樣本兩者的樹型塊或最大譯碼單元(LCU)的序列。樹型塊具有與H.264標準的宏塊類似的用途。切片以譯碼次序包含數(shù)個連續(xù)樹型塊。視頻幀或圖片可分割成一或多個切片。每一樹型塊可根據(jù)四叉樹分裂成多個譯碼單元(CU)。例如,作為四叉樹的根節(jié)點的樹型塊可分裂成四個子節(jié)點,且每一子節(jié)點又可為母節(jié)點且可分裂成另外四個子節(jié)點。作為四叉樹的葉節(jié)點的最后未分裂的子節(jié)點包括譯碼節(jié)點,即,經(jīng)譯碼視頻塊。與經(jīng)譯碼位流相關聯(lián)的語法數(shù)據(jù)可定義樹型塊可分裂的最大次數(shù),且也可定義譯碼節(jié)點的最小大小。
[0050]CU包含譯碼節(jié)點和與譯碼節(jié)點相關聯(lián)的預測單元(PU)及變換單元(TU)。CU的大小對應于譯碼節(jié)點的大小,且其形狀必須為正方形。⑶的大小可在8X8個像素直到具有64 X 64個像素或更多像素的最大值的樹型塊的大小的范圍內(nèi)。每一 CU可含有一或多個I3U及一或多個TU。與CU相關聯(lián)的語法數(shù)據(jù)可描述(例如)CU到一或多個PU的分割。分割模式在CU以跳躍或直接模式編碼、以幀內(nèi)預測模式編碼或是以幀間預測模式編碼之間可能不同。PU可被分割為非正方形。與CU相關聯(lián)的語法數(shù)據(jù)也可描述(例如)根據(jù)四叉樹將⑶分割成一或多個TU。TU可為正方形或非正方形。
[0051]HEVC標準允許根據(jù)TU的變換,變換對于不同⑶可能不同。通常基于針對經(jīng)分割LCU定義的給定CU內(nèi)的PU的大小來設定TU的大小,但情況可能并非始終如此。TU通常與PU大小相同或小于W。在一些實例中,對應于CU的殘余樣本可使用被稱為“殘余四叉樹”(RQT)的四叉樹結構而再分為較小單元。RQT的葉節(jié)點可被稱為變換單元(TU)。與TU相關聯(lián)的像素差值可經(jīng)變換以產(chǎn)生變換系數(shù),變換系數(shù)可被量化。
[0052]一般來說,PU包含與預測過程有關的數(shù)據(jù)。例如,當經(jīng)幀內(nèi)模式編碼時,PU可包含描述用于PU的幀內(nèi)預測模式的數(shù)據(jù)。作為另一實例,當PU經(jīng)幀間模式編碼時,PU可包含定義用于PU的運動向量的數(shù)據(jù)。定義用于PU的運動向量的數(shù)據(jù)可描述(例如)運動向量的水平分量、運動向量的垂直分量、運動向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、運動向量所指向的參考圖片和/或運動向量的參考圖片列表(例如,列表O、列表I或列表C)。
[0053]一般來說,將TU用于變換及量化過程。具有一或多個I3U的給定⑶也可包含一或多個變換單元(TU)。在預測之后,視頻編碼器20可計算對應于PU的殘余值。殘余值包括像素差值,所述值可使用TU變換為變換系數(shù),經(jīng)量化并掃描以產(chǎn)生用于熵譯碼的串行化變換系數(shù)。本發(fā)明通常使用術語“視頻塊”來指CU的譯碼節(jié)點。在一些特定情況下,本發(fā)明也可使用術語“視頻塊”來指樹型塊(即,LCU)或CU,其包含譯碼節(jié)點及及TU。
[0054]視頻序列通常包含一系列視頻幀或圖片。圖片群組(GOP)通常包括一系列一或多個視頻圖片。GOP可包含在GOP的標頭、圖片中的一或多者的標頭中或別處的語法數(shù)據(jù),其描述包含于GOP中的若干圖片。圖片的每一切片可包含描述相應切片的編碼模式的切片語法數(shù)據(jù)。視頻編碼器20通常對個別視頻切片內(nèi)的視頻塊進行操作以便編碼視頻數(shù)據(jù)。視頻塊可對應于CU內(nèi)的譯碼節(jié)點。視頻塊可具有固定或變化的大小,且可根據(jù)指定的譯碼標準而在大小上不同。
[0055]作為實例,HM支持按各種PU大小的預測。假設特定⑶的大小為2NX2N,HM支持按2N X 2N或N X N的PU大小的幀內(nèi)預測,和按2N X 2N、2N X N、N X 2N或N X N的對稱I3U大小的幀間預測。HM也支持用于按2NXnU、2NXnD、nLX2N及nRX2N的PU大小的幀間預測的不對稱分割。在不對稱分割中,CU的一個方向未被分割,而另一方向經(jīng)分割成25%及75%。CU的對應于25%分割區(qū)的部分由“η”跟著為“上(Up)”、“下(Down)”、“左(Left)”或“右(Right) ”的指示來指示。因此,例如,“2NXnU”指經(jīng)水平分割而在頂部具2NX0.5NPU 且在底部具 2NX 1.5N PU 的 2NX 2N CU。
[0056]在本發(fā)明中,“NXN”及“N乘N”可互換地使用以指視頻塊在垂直維度及水平維度方面的像素尺寸,例如,16X16像素或16乘16像素。一般來說,16X16塊在垂直方向上將具有16個像素(y = 16),且在水平方向上將具有16個像素(x = 16)。同樣,NXN塊通常在垂直方向上具有N個像素,且在水平方向上具有N個像素,其中N表示非負整數(shù)值。可按行及列來布置塊中的像素。此外,塊未必需要在水平方向上與在垂直方向上具有相同數(shù)目個像素。例如,塊可包括NXM個像素,其中M不必等于N。
[0057]在使用CU的PU的幀內(nèi)預測性譯碼或幀間預測性譯碼之后,視頻編碼器20可計算⑶的TU的殘余數(shù)據(jù)??砂臻g域(也被稱為像素域)中的像素數(shù)據(jù),且TU可包括在對殘余視頻數(shù)據(jù)應用變換(例如,離散余弦變換(DCT)、整數(shù)變換、小波變換或概念上類似的變換)之后在變換域中的系數(shù)。殘余數(shù)據(jù)可對應于未經(jīng)編碼的圖片的像素與對應于PU的預測值之間的像素差。視頻編碼器20可形成包含CU的殘余數(shù)據(jù)的TU,且接著變換TU以產(chǎn)生用于CU的變換系數(shù)。
[0058]在用以產(chǎn)生變換系數(shù)的任何變換之后,視頻編碼器20可執(zhí)行變換系數(shù)的量化。量化通常指量化變換系數(shù)以可能減少用以表示系數(shù)的數(shù)據(jù)量,從而提供進一步壓縮的過程。量化過程可減少與系數(shù)中的一些或所有系數(shù)相關聯(lián)的位深度。例如,可在量化期間將η位值降值舍位到m位值,其中η大于m。
[0059]在一些實例中,視頻編碼器20可利用預定義掃描次序來掃描經(jīng)量化的變換系數(shù)以產(chǎn)生可熵編碼的串列化向量。在其它實例中,視頻編碼器20可執(zhí)行自適應性掃描。在掃描經(jīng)量化的變換系數(shù)以形成一維向量之后,視頻編碼器20可(例如)根據(jù)上下文自適應性可變長度譯碼(CAVLC)、上下文自適應性二進位算術譯碼(CABAC)、基于語法的上下文自適應性二進位算術譯碼(SBAC)、概率區(qū)間分割熵(PIPE)譯碼或另一熵編碼方法來對一維向量進行熵編碼。視頻編碼器20也可對與經(jīng)編碼視頻數(shù)據(jù)相關聯(lián)的語法元素進行熵編碼以供視頻解碼器30在解碼視頻數(shù)據(jù)時使用。
[0060]為了執(zhí)行CABAC,視頻編碼器20可將上下文模型內(nèi)的上下文指派給待傳輸?shù)姆枴I舷挛目膳c(例如)符號的相鄰值是否系非零有關。為了執(zhí)行CAVLC,視頻編碼器20可選擇用于待傳輸符號的可變長度碼。可構建VLC中的碼字,以使得相對較短的碼對應于概率較大的符號,而較長碼對應于概率較低的符號。以此方式,較之于(例如)將相等長度碼字用于待傳輸?shù)拿恳环?,使用VLC可達成位節(jié)省。概率確定可基于指派給符號的上下文。
[0061]視頻編碼器20可在視頻譯碼過程中實施本發(fā)明的用于降頻采樣及用信號發(fā)送量化矩陣的技術中的任一者或全部。同樣,視頻解碼器30可在視頻譯碼過程中實施用于升頻采樣量化矩陣的這些技術中的任一者或全部。如本發(fā)明中所描述,視頻譯碼器可指視頻編碼器或視頻解碼器。類似地,視頻譯碼單元可指視頻編碼器或視頻解碼器。同樣,視頻譯碼可指視頻編碼或視頻解碼。
[0062]在本發(fā)明的一個實例中,視頻編碼器20可經(jīng)配置以:產(chǎn)生包含多個值的量化矩陣;按第一降頻采樣因數(shù)降頻采樣量化矩陣中的第一值集合以產(chǎn)生第一降頻采樣值集合;按第二降頻采樣因數(shù)降頻采樣量化矩陣中的第二值集合以產(chǎn)生第二降頻采樣值集合;且產(chǎn)生包含第一降頻采樣值集合及第二降頻采樣值集合的經(jīng)譯碼位流。在一些實例中,降頻采樣因數(shù)可為一,在此情況下,直接對值進行譯碼而不降頻采樣。
[0063]在本發(fā)明的另一實例中,視頻解碼器30可經(jīng)配置以:在經(jīng)譯碼位流中接收用降頻采樣值譯碼的量化矩陣;按第一升頻采樣因數(shù)升頻采樣量化矩陣中的第一降頻采樣值集合以產(chǎn)生第一值集合;按第二升頻采樣因數(shù)升頻采樣量化矩陣中的第二降頻采樣值集合以產(chǎn)生第二值集合;且用第一及第二值集合反量化變換系數(shù)塊。在一些實例中,升頻采樣因數(shù)可為一,在此情況下,直接對值進行譯碼而不升頻采樣。
[0064]圖2為說明可實施本發(fā)明中所描述的技術的實例視頻編碼器20的框圖。視頻編碼器20可執(zhí)行視頻切片內(nèi)的視頻塊的幀內(nèi)及幀間譯碼。幀內(nèi)譯碼依靠空間預測以減少或去除給定視頻幀或圖片內(nèi)的視頻中的空間冗余。幀間譯碼依靠時間預測以減少或去除視頻序列的鄰近幀或圖片內(nèi)的視頻中的時間冗余。幀內(nèi)模式(I模式)可指若干基于空間的壓縮模式中的任一者。幀間模式(例如,單向預測(P模式)或雙向預測(B模式))可指若干基于時間的壓縮模式中的任一者。
[0065]在圖2的實例中,視頻編碼器20包含分割單元35、預測處理單元41、參考圖片存儲裝置64、求和器50、變換處理單元52、量化單元54和熵編碼單元56。預測處理單元41包含運動估計單元42、運動補償單元44和幀內(nèi)預測處理單元46。為了視頻塊重構建,視頻編碼器20也包含反量化單元58、反變換處理單元60和求和器62。也可包含解塊濾波器(圖2中未圖示)以對塊邊界進行濾波以從重構建的視頻中去除塊效應偽影。如果需要,解塊濾波器通??蓪η蠛推?2的輸出進行濾波。除解塊濾波器外,也可使用額外環(huán)路濾波器(環(huán)路內(nèi)或環(huán)路后)。
[0066]如圖2所示,視頻編碼器20接收視頻數(shù)據(jù),且分割單元35將數(shù)據(jù)分割成多個視頻塊。此分割也可包含分割成切片、瓦片或其它較大單元,以及(例如)根據(jù)LCU及CU的四叉樹結構的視頻塊分割。視頻編碼器20通常說明編碼待編碼的視頻切片內(nèi)的視頻塊的組件。切片可劃分成多個視頻塊(且可能劃分成被稱為瓦片的視頻塊集合)。預測處理單元41可基于錯誤結果(例如,譯碼速率及失真程度)為當前視頻塊選擇多個可能譯碼模式中的一者(例如,多個幀內(nèi)譯碼模式中的一者或多個幀間譯碼模式中的一者)。預測處理單元41可將所得的經(jīng)幀內(nèi)或幀間譯碼塊提供到求和器50以產(chǎn)生殘余塊數(shù)據(jù),且提供到求和器62以重構建經(jīng)編碼塊以用作參考圖片。
[0067]預測處理單元41內(nèi)的幀內(nèi)預測處理單元46可相對于在與待譯碼的當前塊相同的幀或切片中的一或多個相鄰塊執(zhí)行當前視頻塊的幀內(nèi)預測性譯碼以提供空間壓縮。預測處理單元41內(nèi)的運動估計單元42及運動補償單元44相對于一或多個參考圖片中的一或多個預測性塊執(zhí)行當前視頻塊的幀間預測性譯碼以提供時間壓縮。
[0068]運動估計單元42可經(jīng)配置以根據(jù)視頻序列的預定型樣確定用于視頻切片的幀間預測模式。預定型樣可將序列中的視頻切片指定為P切片、B切片或GPB切片。運動估計單元42及運動補償單元44可高度集成,但為概念目的而單獨說明。由運動估計單元42執(zhí)行的運動估計為產(chǎn)生運動向量的過程,運動向量估計視頻塊的運動。例如,運動向量可指示當前視頻幀或圖片內(nèi)的視頻塊的PU相對于參考圖片內(nèi)的預測性塊的位移。
[0069]預測性塊為經(jīng)發(fā)現(xiàn)在像素差方面緊密匹配待譯碼的視頻塊的的塊,像素差可通過絕對差的和(SAD)、平方差的和(SSD)或其它差度量來確定。在一些實例中,視頻編碼器20可計算存儲于參考圖片存儲裝置64中的參考圖片的子整數(shù)像素位置的值。例如,視頻編碼器20可內(nèi)插參考圖片的四分之一像素位置、八分之一像素位置或其它分數(shù)像素位置的值。因此,運動估計單元42可相對于完整像素位置及分數(shù)像素位置執(zhí)行運動搜尋,且輸出具有分數(shù)像素精度的運動向量。
[0070]運動估計單元42通過比較PU的位置與參考圖片的預測性塊的位置來計算用于經(jīng)幀間譯碼的切片中的視頻塊的PU的運動向量。參考圖片可選自第一參考圖片列表(列表O)或第二參考圖片列表(列表I),列表中的每一者識別存儲于參考圖片存儲裝置64中的一或多個參考圖片。運動估計單元42將所計算出的運動向量發(fā)送到熵編碼單元56及運動補償單元44。
[0071]由運動補償單元44執(zhí)行的運動補償可涉及基于由運動估計確定的運動向量來提取或產(chǎn)生預測性塊,可能執(zhí)行到子像素精度的內(nèi)插。在接收到用于當前視頻塊的PU的運動向量時,運動補償單元44可在參考圖片列表中的一者中找出運動向量所指向的預測性塊的位置。視頻編碼器20通過從正被譯碼的當前視頻塊的像素值減去預測性塊的像素值來形成殘余視頻塊,從而形成像素差值。像素差值形成塊的殘余數(shù)據(jù),且可包含亮度差分量及色度差分量兩者。求和器50表示執(zhí)行此減法運算的一或多個組件。運動補償單元44也可產(chǎn)生與視頻塊及視頻切片相關聯(lián)的語法元素以供視頻解碼器30在解碼視頻切片的視頻塊時使用。
[0072]幀內(nèi)預測處理單元46可幀內(nèi)預測當前塊,以作為如上所述的由運動估計單元42及運動補償單元44執(zhí)行的幀間預測的替代。明確地說,幀內(nèi)預測處理單元46可確定用以編碼當前塊的幀內(nèi)預測模式。在一些實例中,幀內(nèi)預測處理單元46可(例如)在單獨編碼遍次期間使用各種幀內(nèi)預測模式編碼當前塊,且?guī)瑑?nèi)預測處理單元46(或在一些實例中,模式選擇單元40)可從經(jīng)測試模式選擇適當幀內(nèi)預測模式來使用。例如,幀內(nèi)預測處理單元46可使用對各種經(jīng)測試幀內(nèi)預測模式的位率失真分析計算位率失真值,且在經(jīng)測試模式中選擇具有最佳位率失真特性的幀內(nèi)預測模式。位率失真分析通常確定經(jīng)編碼塊與經(jīng)編碼以產(chǎn)生經(jīng)編碼塊的原始未經(jīng)編碼塊之間的失真(或誤差)的量,以及用以產(chǎn)生經(jīng)編碼塊的位率(即,位的數(shù)目)。幀內(nèi)預測處理單元46可從各種經(jīng)編碼塊的失真及位率計算比率以確定哪一幀內(nèi)預測模式展現(xiàn)塊的最佳位率失真值。
[0073]在任何情況下,在選擇用于塊的幀內(nèi)預測模式之后,幀內(nèi)預測處理單元46可將指示用于塊的選定幀內(nèi)預測模式的信息提供到熵譯碼單元56。熵譯碼單元56可根據(jù)本發(fā)明的技術編碼指示選定幀內(nèi)預測模式的信息。視頻編碼器20可在所傳輸?shù)奈涣髦邪渲脭?shù)據(jù),配置數(shù)據(jù)可包含多個幀內(nèi)預測模式索引表及多個經(jīng)修改幀內(nèi)預測模式索引表(也被稱為碼字映射表)、各種塊的編碼上下文的定義及用于上下文中的每一者的最大概率幀內(nèi)預測模式、幀內(nèi)預測模式索引表及經(jīng)修改幀內(nèi)預測模式索引表的指示。
[0074]在預測處理單元41經(jīng)由幀間預測抑或幀內(nèi)預測產(chǎn)生當前視頻塊的預測性塊之后,視頻編碼器20通過從當前視頻塊減去預測性塊而形成殘余視頻塊。殘余塊中的殘余視頻數(shù)據(jù)可包含于一或多個TU中且應用于變換處理單元52。變換處理單元52使用一變換(例如,離散余弦變換(DCT)或一概念上類似的變換)將殘余視頻數(shù)據(jù)變換成殘余變換系數(shù)。變換處理單元52可將殘余視頻數(shù)據(jù)從像素域變換到例如頻域的變換域。
[0075]變換處理單元52可將所得變換系數(shù)發(fā)送到量化單元54。量化單元54量化變換系數(shù)以進一步減小位率。量化過程可減少與系數(shù)中的一些或所有系數(shù)相關聯(lián)的位深度。可通過調(diào)整量化參數(shù)或通過修改量化矩陣中的值來修改量化程度。在一些實例中,量化單元54可接著執(zhí)行對包含經(jīng)量化變換系數(shù)的矩陣的掃描。替代地,熵編碼單元56可執(zhí)行掃描。
[0076]在一些情況下,除了量化操作之外,量化單元54也可執(zhí)行變換后縮放操作。變換后縮放操作可結合由變換單元52執(zhí)行的核心變換操作使用,以關于殘余數(shù)據(jù)塊有效率地執(zhí)行完整的空間到頻率變換操作或其近似操作。在一些實例中,變換后縮放操作可與量化操作集成,以使得變換后操作及量化操作系作為關于待量化的一或多個變換系數(shù)的同一操作集合的部分而執(zhí)行。
[0077]在一些實例中,量化單元54可基于量化矩陣來量化變換系數(shù)。量化矩陣可包含多個值,多個值中的每一者對應于待量化的變換系數(shù)塊中的多個變換系數(shù)中的相應變換系數(shù)。量化矩陣中的值可用以確定待由量化單元54應用于變換系數(shù)塊中的對應變換系數(shù)的量化量。例如,對于待量化的變換系數(shù)中的每一者,量化單元54可根據(jù)至少部分地由量化矩陣中的值中的對應于待量化的變換系數(shù)的相應值確定的量化量來量化相應變換系數(shù)。
[0078]在另外實例中,量化單元54可基于量化參數(shù)及量化矩陣來量化變換系數(shù)。量化參數(shù)可為可用以確定待應用于變換系數(shù)塊的量化量的塊層級參數(shù)(即,指派給整個變換系數(shù)塊的參數(shù))。在這些實例中,量化矩陣中的值及量化參數(shù)可一起用以確定待應用于變換系數(shù)塊中的對應變換系數(shù)的量化量。換句話說,量化矩陣可指定與量化參數(shù)一起可用以確定待應用于對應變換系數(shù)的量化量的值。例如,對于變換系數(shù)塊中的待量化的變換系數(shù)中的每一者,量化單元54可根據(jù)量化量來量化相應變換系數(shù),量化量至少部分地由用于變換系數(shù)塊的塊層級量化參數(shù)(QP)和量化矩陣中的多個系數(shù)特定值中的對應于待量化的變換系數(shù)的相應值確定。因此,量化矩陣為每一變換系數(shù)提供對應值,且將值應用于QP以確定用于變換系數(shù)值的量化量。
[0079]在一些實例中,量化過程可包含類似于針對HEVC提議和/或由H.264解碼標準定義的過程中的一或多者的過程。例如,為了量化變換系數(shù)的值(即,水平),量化單元54可按量化矩陣中的對應值及按變換后縮放值對變換系數(shù)進行縮放。量化單元54可接著使經(jīng)縮放變換系數(shù)移位一基于量化參數(shù)的量。在一些情況下,變換后縮放值可基于量化參數(shù)來選擇。也可使用其它量化技術。
[0080]在一些實例中,量化單元54可使指示由量化單元54用于量化變換系數(shù)的量化矩陣的數(shù)據(jù)包含于經(jīng)編碼位流中。例如,量化單元54可將指示量化矩陣的數(shù)據(jù)提供到熵編碼單元56以用于對數(shù)據(jù)進行熵編碼,且隨后置放于經(jīng)編碼位流中。
[0081]包含于經(jīng)編碼位流中的量化矩陣數(shù)據(jù)可由視頻解碼器30用于解碼位流(例如,用于執(zhí)行反量化操作)。在一些實例中,數(shù)據(jù)可為索引值,其從一組量化矩陣識別預定量化矩陣,或可識別用于產(chǎn)生量化矩陣的函數(shù)。在另外實例中,數(shù)據(jù)可包含量化矩陣中所含的實際值。在額外實例中,數(shù)據(jù)可包含量化矩陣中所含的實際值的經(jīng)譯碼版本。例如,量化矩陣的經(jīng)譯碼版本可包含用于量化矩陣中的特定位置的降頻采樣值。在另一實例中,可基于如本發(fā)明中稍后更詳細描述的預測值產(chǎn)生經(jīng)譯碼版本。在一些實例中,數(shù)據(jù)可采取指定由量化單元54用于量化對應于待譯碼的視頻塊的變換系數(shù)塊的量化矩陣的一或多個語法元素的形式,且量化單元54可使一或多個語法元素包含于經(jīng)譯碼視頻塊的標頭中。
[0082]在例如MPEG-2及AVC/H.264的先前標準中,如上所述,量化矩陣被用以改進主觀質(zhì)量。量化矩陣也可被包含作為HEVC標準的部分。
[0083]在HM5.1中,4X4、8X8、16X16及32X32的變換大小是可能的。32X32變換可用于亮度,且可能僅用于亮度(即,可能不用于色度分量)。允許有總共20個量化矩陣可為合適的(即,針對Y、U及V分量用于4X 4、8 X 8、16 X 16幀內(nèi)及幀間預測塊以及針對Y分量的32 X 32幀內(nèi)及幀間預測的塊的單獨量化矩陣)。因此,編碼器用信號發(fā)送4064個量化矩陣值以便用信號發(fā)送所有可能排列是可能的。在一些實例中,對量化矩陣輸入項的Z字形掃描,接著為一階預測(例如,微分譯碼)及指數(shù)葛洛姆譯碼(其中參數(shù)=O))可用于無損失地壓縮量化矩陣。然而,歸因于量化矩陣系數(shù)的巨大數(shù)目,HEVC中可能需要較好壓縮方法。
[0084]量化矩陣通常被設計成利用人類視覺系統(tǒng)(HVS)。人類視覺系統(tǒng)通常對較高頻率下的量化誤差較不敏感。此設計的一個原因在于,人類視覺系統(tǒng)的對比敏感性函數(shù)(CSF)隨頻率增加而減小,在水平方向及垂直方向上均如此。因此,對于設計周到的量化矩陣,矩陣輸入項在行(左到右)方向及列(上到下)方向上皆增加。明確地說,當變換系數(shù)塊從左上(0,0)角中的DC位置朝著右下(n,n)角延伸到較高頻率系數(shù)時,量化矩陣中的對應值大體上增加或至少不減小。
[0085]在用于用信號發(fā)送量化矩陣的先前技術中,對整個量化矩陣的所有值(即,系數(shù))進行用信號發(fā)送。然而,用信號發(fā)送整個量化矩陣可能并非必需的,因為一些系數(shù)(例如,朝向量化矩陣的右下角的系數(shù))對視頻質(zhì)量可能無實質(zhì)影響。
[0086]作為一個實例,例如32X32的較高塊大小通常在殘余塊平滑時使用,其中殘余塊為視頻數(shù)據(jù)的實際塊與視頻數(shù)據(jù)的預測塊之間的差異。平滑的殘余塊展現(xiàn)殘余塊內(nèi)的值的小偏差。在此情況下,在量化之后,在經(jīng)變換塊的較高頻率下(即,朝向右下角)存在許多非零系數(shù)可能不太可能。
[0087]經(jīng)編碼視頻序列的統(tǒng)計數(shù)據(jù)支持此假設。例如,使用部分頻率變換技術(例如,對來自32 X 32塊的最小16 X 16個系數(shù)進行編碼)展示譯碼效率的極小損失。此可被視為等效于為在16 X 16區(qū)域外的頻率的量化矩陣輸入項選擇極高值(例如,為在16 X 16區(qū)域外的頻率的量化矩陣系數(shù)選擇高值)。在此實例中,因為譯碼效率中可能存在極小損失,所以可能不必在經(jīng)編碼視頻位流中用信號發(fā)送所有32X32量化矩陣值(其為1024個值)。
[0088]以下描述量化矩陣的用信號發(fā)送及和碼實例。例如,對于用信號發(fā)送,視頻編碼器20可用信號發(fā)送用以指示整個量化矩陣或是僅量化矩陣的一子集經(jīng)譯碼的一位旗標。如果旗標指示整個量化矩陣經(jīng)譯碼,則可使用任何譯碼方法,例如HM5.1、AVC/H.264、JCTVC-F085、JCTVC-E073的譯碼方法,或以全文引用方式并入且將在下文更詳細論述的美國臨時專利申請案第61/547,647號中所描述的技術。
[0089]如果旗標指示僅量化矩陣的一子集正被譯碼(例如,第一子集),則子集的大小可經(jīng)譯碼為一對值(laSt_row,laSt_Col)。在此實例中,假設子集為矩形的且覆蓋從位置(0,O)到位置(last_roW,last_col)的量化矩陣輸入項。然而,可能使用其它形狀。也可能將形狀限制為正方形,在此情況下,僅可能需要譯碼單一最后值,因為last_r0W值及l(fā)ast_col值將相同。最后值(last_row、last_col)可用固定數(shù)目個位進行譯碼,固定數(shù)目可視量化矩陣的大小而定。例如,對于32X32量化矩陣,最后值可使用5+5 = 10個位進行譯碼。可能使用可變長度碼(例如,指數(shù)葛洛姆碼或葛洛姆碼)來對最后值進行譯碼。
[0090]在對最后值(last_row、last_col)進行譯碼之后,可對屬于一子集的量化矩陣輸入項(例如,第一子集的值)進行譯碼。HM5.1方法或任何其它方法(例如,AVC/H.264、JCTVC-F085、JCTVC-E073,或2012年10月11日申請的美國專利申請案第13/649,836號中所描述的技術)可用以對屬于子集的量化矩陣輸入項進行譯碼。譯碼可為有損失或無損失的。
[0091]根據(jù)美國專利申請案第13/649,836號的技術,視頻編碼器20及視頻解碼器30可對量化矩陣的第一子集的值執(zhí)行光柵掃描及用于譯碼預測誤差的非線性預測值技術。根據(jù)一實例技術,預測值為量化矩陣的第一子集中相對于量化矩陣中的當前掃描位置在左邊的值及在上方的值中的最大值。換句話說,當以光柵次序掃描量化矩陣時,量化矩陣中的當前值是基于在當前值左邊的值及在當前值上方的值中的最大值而預測。光柵次序可通常指按行從上到下且在每一行內(nèi)從左到右地掃描量化矩陣中的值的次序。一般來說,量化矩陣中的值將對應于變換系數(shù)塊中的相應變換系數(shù),其中朝向左上方的系數(shù)為低頻率且接近右下方的系數(shù)在頻率上增加。
[0092]在對屬于一子集的量化矩陣輸入項的譯碼完成之后,可根據(jù)屬于第一子集的量化矩陣輸入項來預測量化矩陣輸入項的剩余部分(例如,第二子集的系數(shù)值)。此過程可由編碼器及解碼器兩者進行。例如,如果屬于一子集的量化矩陣輸入項以有損失方式譯碼,則重構建輸入項。接著,以光柵掃描次序(作為一個實例)掃描在子集外的量化矩陣輸入項(例如,第二子集的系數(shù)值)以預測第二子集的系數(shù)值。
[0093]在本發(fā)明的實例中,視頻編碼器20可經(jīng)配置以用信號發(fā)送量化矩陣的一子集的量化矩陣值。例如,視頻編碼器可將量化矩陣劃分成至少量化矩陣值的第一子集及第二子集。視頻編碼器可編碼第一子集的系數(shù)值,且將這些經(jīng)編碼值作為語法元素用信號發(fā)送到視頻解碼器。視頻解碼器可根據(jù)所接收的語法元素解碼第一子集的系數(shù)值。
[0094]在本發(fā)明的一些實例中,視頻解碼器30可預測第二子集的值。例如,在一些實例中,視頻編碼器20可能不必用信號發(fā)送用以導出第二子集的量化矩陣系數(shù)值的語法元素,使得視頻解碼器可預測第二子集的值。實情為,視頻解碼器30可利用本發(fā)明的技術預測第二子集的值而不利用這些語法元素。以此方式,針對量化矩陣需要用信號發(fā)送的數(shù)據(jù)量可減少。
[0095]作為一個實例,視頻解碼器20可基于量化矩陣值的第一子集的經(jīng)解碼系數(shù)值來預測量化矩陣值的第二子集的系數(shù)值,如下文所更詳細論述。作為另一實例,為了預測量化矩陣值的第二子集的值,視頻解碼器30可為第二子集中的每一系數(shù)指派常數(shù)值,其中作為一個非限制性實例。常數(shù)值可為最大可允許量化矩陣值。在一些實例中,視頻編碼器20可將常數(shù)值用信號發(fā)送到視頻解碼器,或替代地,視頻編碼器20及視頻解碼器30可用常數(shù)值預先編程。
[0096]圖4為說明實例量化矩陣的圖形圖。圖4說明量化矩陣94,其為用以量化殘余變換系數(shù)的32 X 32塊的32 X 32量化矩陣。雖然關于圖4的技術在32 X 32量化矩陣的上下文中描述,但本發(fā)明的方面不限于此且可擴展到其它大小的量化矩陣,包含非正方形量化矩陣。量化矩陣94包含第一子集96,第一子集包含量化矩陣94的輸入項的值的一子集。在此實例中,第一子集96為8 X 8矩陣(包含左上角中的量化矩陣值AOOl及右下角中的量化矩陣值A232),雖然其它大小(包含非正方形大小)是可能的。在此實例中,第一子集96的輸入項中的系數(shù)值可由視頻編碼器20編碼并用信號發(fā)送。第一子集96的大小也可經(jīng)編碼并用信號發(fā)送。大小可為第一子集96的最后行和最后列,即(7,7),假設變數(shù)AOOl在量化矩陣94中位于(0,0)。因為此子集為正方形的,所以可能僅需要用信號發(fā)送一個變數(shù)(例如,7)。對于非正方形子集,可編碼并用信號發(fā)送最后行值及最后列值。
[0097]在一些實例中,第二子集98的輸入項的值可能未被用以預測第二子集98的輸入項的值。第二子集尤其包含量化矩陣值A009、A257及A1024,且以點線為邊界。橢圓形表示額外量化矩陣值且被用以減小圖的大小。換句話說,可不利用根據(jù)第二子集的輸入項的系數(shù)值計算的語法元素而預測第二子集98的輸入項的值。在一些其它實例中,可根據(jù)從視頻編碼器接收的第二子集的降頻采樣值確定第二子集98的輸入項的值,如下文中將更詳細論述。
[0098]在一些實例中,第二子集98的輸入項的值可為在特定值上方的量化矩陣值中的最大值或在特定值左邊的量化矩陣值中的最大值。如果不存在左邊或上方值,則假設左邊或上方值為零。例如,為了預測量化矩陣的第二子集的系數(shù)值,視頻編碼器20或視頻解碼器30可將第二子集的在坐標位置[X,y]處的當前輸入項的系數(shù)值設定為在量化矩陣中坐標位置[x-1,y]處的在左邊的輸入項的系數(shù)值和在量化矩陣中坐標位置[X,y-Ι]處的在上方的輸入項的系數(shù)值中的較大者(假設在η乘η量化矩陣中左上角為[0,0]且右下角為[η, η])。
[0099]在一些實例中,第一子集96的輸入項的值可以光柵掃描次序預測;然而,可使用其它掃描次序。在此實例中,并非用信號發(fā)送量化矩陣的值本身,用信號發(fā)送當前量化矩陣值與沿著光柵掃描次序之前一量化矩陣值之間的差異。由于量化矩陣值通常在水平方向及垂直方向上增加,故所提議預測值(即,上方及左邊的量化矩陣值)的預測誤差(即,當前量化矩陣值與沿著掃描次序之前一量化矩陣值之間的差異)幾乎始終為非負的。應注意,此所提議預測方案在使用不對稱量化矩陣時適用,而基于Z字形的掃描不會如此有效。
[0100]在一些實例中,使用葛洛姆碼編碼預測誤差。葛洛姆碼參數(shù)可由編碼器包含于經(jīng)編碼視頻位流(使用固定或可變長度碼)中或可為編碼器及解碼器兩者所知??赡苁褂闷渌椒?例如,指數(shù)葛洛姆譯碼)來編碼預測誤差。歸因于預測誤差的稍微散布性質(zhì),可能需要葛洛姆碼。為了能夠編碼偶然的負值,可使用再映射方法。
[0101]在一些實例中,第二子集的預測系數(shù)值中的一或多者可根據(jù)第二子集的其它預測系數(shù)值來預測。例如,量化矩陣中也為第二子集的部分的輸入項的系數(shù)值可在第二子集中的當前輸入項上方,且量化矩陣中也為第二子集的部分的輸入項的系數(shù)值可在第二子集中的當前輸入項的左邊。在此實例中,可用以預測當前輸入項的系數(shù)值的輸入項的系數(shù)值可為預測值本身,因此這些輸入項也為第二子集的部分,且第二子集的輸入項的系數(shù)值可全部被預測。視頻編碼器20及視頻解碼器30可使用此過程來導出在子集外(例如,在第二子集中)的所有量化輸入項。在圖5和6中說明了說明量化矩陣及重構建的量化矩陣的圖形圖,且在下文予以更詳細描述。
[0102]返回參看圖4,作為一個實例,第二子集98的系數(shù)A009的值被預測為等于第一子集96的系數(shù)A008,因為在A009上方無值可用。第二子集98的系數(shù)A257的值被預測為等于第一子集96的系數(shù)A225,因為在A257左邊無值可用。第二子集98的系數(shù)A042的值被預測為系數(shù)AOlO及系數(shù)A041(均屬于第二子集98)的值中的較大者。在此實例中,系數(shù)AOlO及A041的值為預測值,因為兩個系數(shù)皆在第二子集98中。
[0103]圖5為說明具有可使用根據(jù)上述技術的預測用信號發(fā)送的實例值的量化矩陣的圖形圖。圖6為說明利用本發(fā)明的一或多個實例技術的重構建的量化矩陣的圖形圖。例如,出于說明目的,圖5說明量化矩陣100,其為8 X 8矩陣。在此實例中,視頻編碼器20可用信號發(fā)送量化矩陣100中的最初5 X 5個輸入項的值(以粗線展示)。例如,在此實例中,量化矩陣100的第一子集101為最初5X5個值,其意謂:在此實例中,last_row及l(fā)ast_col的值各為4(假設基于零的索引)。因為第一子集101為正方形的,所以視頻編碼器20可僅用信號發(fā)送值5(例如,由于last_row值及l(fā)ast_col值相同)。量化矩陣100中的剩余值(即,第一子集101外的值)被視為在第二子集中。
[0104]圖6說明重構建的量化矩陣102。在此實例中,視頻解碼器30(或重構建環(huán)路中的視頻編碼器20)可利用實例技術中的一者來產(chǎn)生重構建的量化矩陣102。例如,視頻解碼器30及視頻編碼器20可利用通過使用相對于當前系數(shù)在左邊的系數(shù)與相對于當前系數(shù)在上方的系數(shù)之間的最大值確定量化矩陣值的第二子集的值的技術。
[0105]重構建的量化矩陣102說明此技術的結果。例如,第一子集103中的最初5X5個輸入項與量化矩陣100中的第一子集101中的最初5X5個輸入項相同,因為這些值經(jīng)明確地用信號發(fā)送。剩余值(例如,在第一子集103外的第二子集的值)是根據(jù)確定相對于當前系數(shù)在上方的系數(shù)及在左邊的系數(shù)中的最大值而導出。
[0106]在一些實例中,替代上文所描述的預測及光柵掃描,可使用其它掃描和/或預測。替代地,在子集外的量化矩陣輸入項(例如,第二子集的系數(shù)值)可經(jīng)設定為常數(shù)值,例如最大可允許量化矩陣值。此常數(shù)值可在位流中從視頻編碼器用信號發(fā)送到視頻解碼器,或視頻編碼器及視頻解碼器可用常數(shù)值預先編程。
[0107]在一些實例中,視頻編碼器20可與由視頻解碼器30所執(zhí)行類似地預測第二子集中的值。例如,視頻編碼器20可預測第二子集的值,且用第二子集的預測值替換第二子集中的值。以此方式,在視頻編碼器側(cè)及視頻解碼器側(cè)使用的量化矩陣可能相同。
[0108]在一些視頻譯碼實例中,使用量化矩陣值的常數(shù)值或來自第一子集的預測來確定未明確地用信號發(fā)送的量化矩陣輸入項(即,在(0,0)到(last_r0W,last_col)的矩形外的彼等輸入項,第二子集的值)可能并不足夠。以下描述用于用信號發(fā)送量化矩陣值的其它實例,例如,使用不同矩陣的值及使用降頻采樣值來確定第二子集的值。
[0109]作為一個實例,未明確地用信號發(fā)送的輸入項(例如,第二子集的值)是從不同矩陣(例如,大小較小的量化矩陣)導出。作為一個實例,此大小較小的量化矩陣可能已在視頻編碼器用信號發(fā)送的位流中譯碼。在一些實例中,不同矩陣可為量化矩陣。視頻編碼器20可能先前已用信號發(fā)送此不同矩陣。
[0110]例如,視頻編碼器可用信號發(fā)送不同量化矩陣(例如,具有包含4X4、8X8、16X16或32X32的大小的量化矩陣)的值。在此實例中,視頻解碼器30可利用來自先前在位流中編碼的量化矩陣中任一者的系數(shù)值來重構建當前量化矩陣。例如,假設待重構建的量化矩陣為32X32量化矩陣。在此實例中,視頻編碼器20可用信號發(fā)送32X32量化矩陣的第一子集的系數(shù)值。假設視頻解碼器已接收到大小為4X4、8X8或16X16的量化矩陣,視頻解碼器可利用4X4、8X8或16X16的量化矩陣來確定第二子集的值從而重構建32X32量化矩陣。
[0111]在一些實例中,可能使用4X4、8X8或16X16量化矩陣中的任一者重構建32X 32量化矩陣。例如,為了重構建32X32量化矩陣,視頻解碼器30可使用8X8量化矩陣,且8X8量化矩陣可為使用4X4量化矩陣進行重構建的重構建量化矩陣。然而,量化矩陣的這些分層重構建可能并非在每個實例中皆為必需的。例如,視頻編碼器20可用信號發(fā)送由視頻解碼器30用于重構建32X32量化矩陣的整個8X8量化矩陣??捎眯盘柊l(fā)送32X32量化矩陣的值中的一些,而可根據(jù)較小矩陣中的一或多者重構建其它值。
[0112]另外,在一些實例中,視頻編碼器可用信號發(fā)送較小矩陣(例如,第一子集)的大小。在另一實例中,視頻解碼器30及視頻編碼器20可用較小矩陣的大小預先編程(例如,較小矩陣的大小可能事前為視頻編碼器20及視頻解碼器30所知)。
[0113]作為一個特定實例,假設:量化矩陣為32X32, last_row = 14,且last_col = 14。在此實例中,視頻編碼器20用信號發(fā)送32X32量化矩陣中的最低的15 X 15個輸入項的值。假設視頻解碼器30正在推導具有索引(r,c)的矩陣輸入項的值,其中r> = 15或c>= 15。在這個實例中,為了推導量化矩陣值,視頻解碼器可使用來自可為大小較小的量化矩陣的不同矩陣(例如,8X8矩陣)的值。
[0114]視頻解碼器30可利用不同方式將大小較小的量化矩陣用于確定第二子集的值。例如,視頻解碼器可確定量化矩陣的大小與不同的大小較小矩陣的大小之間的比。視頻解碼器30可用比率劃分量化矩陣內(nèi)的值經(jīng)確定的輸入項(例如,第二子集中的輸入項的值)的位置坐標,且使用頂值函數(shù)及底限函數(shù)來確定在不同的大小較小矩陣中的對應位置。視頻解碼器30可接著使用不同的大小較小矩陣中的對應于不同的大小較小矩陣內(nèi)的經(jīng)識別位置的值來確定在正被重構建的量化矩陣中的第二子集的值。
[0115]例如,令指示NXN大小的重構建的量化矩陣在位置(r,c)處的值,其中r為行索引且 C 為列索引。令 rL = floor (r/4), rH = ceil (r/4), cL = floor (c/4),且 cH =ceil(c/4),其中因數(shù)4是作為(32/8)而導出。此處,flooHx)指示小于或等于x的最大整數(shù)。類似地,ceil (X)指示大于或等于X的最小整數(shù)。接著,可將么2.@(r,r)設定為8(ri,c£),或可將032.?32 又定為么.r8 (rL,C£)、&HxS(rL,CH)、ftxS (?,Ct)及 ,Cff )的干均值。如果整個8 X 8量化矩陣被發(fā)送到解碼器,則重構建的8 X 8矩陣與原始8 X 8量化矩陣相同??墒褂秒p線性內(nèi)插法或其它更復雜的內(nèi)插技術和/或較長的內(nèi)插濾波器。藉以導出缺失值的矩陣大小可在位流中用信號發(fā)送或事前為視頻編碼器及視頻解碼器所知。較小矩陣(例如,第一子集)的值也可包含于位流中。
[0116]在AVC/H.264中,使用Z字形掃描及微分脈碼調(diào)制(DPCM,即,從掃描次序中的最后值進行預測)。接著,如果量化矩陣值經(jīng)譯碼為零,則此指示:不再有量化矩陣值要被譯碼且重復最后的經(jīng)譯碼正量化矩陣值。在此情況下,替代重復最后的經(jīng)譯碼量化矩陣值,可從較小大小的量化矩陣導出剩余量化矩陣值,如較早所描述。
[0117]如上所述,在一些實例中,視頻解碼器30可在不接收基于第二子集的值的任何語法元素的情況下確定第二子集的值。然而,避免用信號發(fā)送第二子集中的量化矩陣值可能并非在每個實例中皆為有益的。即,用信號發(fā)送量化矩陣的較高頻率分量的至少某些量化矩陣值(例如,值的第二子集中的彼等值)可提供譯碼效率與重構建的量化矩陣中的錯誤之間的較好取舍。
[0118]在本發(fā)明的另一實例中,如下文將更詳細地描述,視頻編碼器20可降頻采樣量化矩陣值的一子集的值,且用信號發(fā)送降頻采樣值。視頻解碼器可升頻采樣降頻采樣值以確定在視頻解碼器側(cè)重構建量化矩陣所需的值。與原始值相比,降頻采樣值中可存在較少量的數(shù)據(jù),且通過用信號發(fā)送降頻采樣值,可減小針對量化矩陣所用信號發(fā)送的數(shù)據(jù)量。
[0119]在降頻采樣的一個實例中,量化矩陣的一子集(例如,從(0,0)到(last_row,last_col))外的值(即,第二子集中的值)可按特定因數(shù)(例如,2)進行降頻采樣,且可以無損失方式在位流中對降頻采樣值進行譯碼。任何譯碼方法(例如,AVC/H.264、JCTVC-F085、JCTVC-E073中所描述的譯碼方法,或美國專利申請案第13/649,836號中所描述的技術)可用以譯碼降頻采樣值。使用簡單平均(例如,NXN區(qū)域中的量化矩陣值的平均)或使用更復雜濾波器和/或方程式來執(zhí)行降頻采樣。視頻編碼器20及視頻解碼器30皆可使用經(jīng)譯碼值的升頻采樣來產(chǎn)生第一子集外的值(例如,第二子集的值)。升頻采樣技術可使用簡單的像素重復(即,使用降頻采樣區(qū)域內(nèi)的所有坐標的降頻采樣值)或更復雜的技術。例如,可以類似于降頻采樣圖像的方式處理降頻采樣量化矩陣值。接著,此項技術中已知的用于執(zhí)行圖像升頻采樣的技術(例如,雙線性內(nèi)插法、雙三次內(nèi)插法等)可用于對降頻采樣量化矩陣進行升頻采樣。
[0120]如上所述,視頻編碼器20可明確地用信號發(fā)送第一子集的系數(shù)值,且使用某一形式的預測確定第二子集的系數(shù)值。在以下實例中,并非用信號發(fā)送第一子集的系數(shù)值及通過預測確定第二子集的值,以下技術可允許視頻編碼器產(chǎn)生以不同水平的粗略度用信號發(fā)送量化矩陣的系數(shù)值的經(jīng)譯碼位流。例如,對應于量化矩陣的較低頻率分量的系數(shù)值可以無損失方式(即,明確地)用信號發(fā)送,且其它系數(shù)值(例如,在第二子集、第三子集等中)可以越來越粗略的方式用信號發(fā)送(例如,通過使用不同降頻采樣因數(shù))。對應于較低頻率位置的系數(shù)值通常位置最接近量化矩陣的原點(例如,系數(shù)值的行索引及列索引最接近(0,0)) 0 一般來說,以下技術允許視頻編碼器基于量化矩陣值位于量化矩陣中何處而將非均勻量的降頻采樣應用于量化矩陣值。
[0121]本實例的技術可提供一方案,通過所述方案,與位置較接近量化矩陣的原點的系數(shù)值相比,較粗略地近似位置距量化矩陣的原點較遠的系數(shù)值。在本實例中,所近似的量化矩陣值(例如,在第二和/或第三子集或更大子集中)可在位流中進行譯碼并被用信號發(fā)送。
[0122]然而,在一些替代實例中,可能對第一子集的系數(shù)值利用以下技術,其中第一子集類似于上文所描述的第一子集。在這些替代實例中,所述技術可使用以上實例技術中的任一者確定第二子集的系數(shù)值。
[0123]例如,對于位于靠近量化矩陣的原點的區(qū)域中(例如,在接近(0,0)的第一子集中)的量化矩陣值,視頻編碼器20可不應用降頻采樣(即,應用降頻采樣因數(shù)I)。在此區(qū)域中,所有量化矩陣值皆被用信號發(fā)送。如果量化矩陣中的系數(shù)值的位置距量化矩陣的原點較遠(例如,在第一子集外的第二子集中),則視頻編碼器20可應用較高水平的降頻采樣(例如,應用降頻采樣因數(shù)2、3、4等)。大于I的降頻采樣因數(shù)可指示由一個值表示的系數(shù)值的數(shù)目。作為一個實例,降頻采樣因數(shù)2可意謂:當重復對重構建使用像素重復時,量化矩陣的22(即,4)個系數(shù)值可由每一經(jīng)編碼值來表示。類似地,降頻采樣因數(shù)4可意謂:當對重構建使用像素重復時,量化矩陣的24(即,16)個系數(shù)值可由每一經(jīng)編碼值來表示。
[0124]如上文所論述,根據(jù)降頻采樣因數(shù)計算出的值可為簡單平均值。例如,在編碼器偵牝?qū)τ诮殿l采樣因數(shù)2,2 X 2正方形中的四個量化矩陣值被平均,且彼等四個量化矩陣值的平均值被用信號發(fā)送。同樣,如果降頻采樣因數(shù)為4,則4X4正方形中的十六個量化矩陣值被平均,且彼等十六個量化矩陣值的平均值被用信號發(fā)送。其它更復雜的方程式或濾波器技術可用以計算降頻采樣值。
[0125]在一些實例中,視頻編碼器20可確立量化矩陣內(nèi)的降頻采樣轉(zhuǎn)變點(例如,邊界)。根據(jù)第一降頻采樣因數(shù)(其可能低至一,此意謂無降頻采樣)對量化矩陣中位于第一轉(zhuǎn)變點與量化矩陣的原點之間的系數(shù)值進行降頻采樣,可按第二降頻采樣因數(shù)對量化矩陣中位于第一轉(zhuǎn)變點與第二轉(zhuǎn)變點之間的系數(shù)值進行降頻采樣,可按第三降頻采樣因數(shù)對量化矩陣中位于第二轉(zhuǎn)變點與第三轉(zhuǎn)變點之間的系數(shù)值進行降頻采樣,等。在一些實例中,在每一轉(zhuǎn)變點降頻采樣因數(shù)改變的量可為非均勻的;但本發(fā)明的方面不限于此。
[0126]例如,在一些實例中,指示量化矩陣值的子集的位置的語法元素可能未包含于位流中。實情為,在視頻編碼器及解碼器兩者處事前知道區(qū)域的位置。使用降頻采樣因數(shù)I可等效于發(fā)送所有值,如在先前實例中對低頻率子集值所做的(例如,低頻率子集值指位置最接近量化矩陣的原點的值)。另外,對于使用大于I的降頻采樣因數(shù)的其它區(qū),可將額外量化矩陣值包含于位流中。在圖7中對于16X16塊展示了此額外量化矩陣值的一個實例。
[0127]在圖7的實例中,如果行索引和列索引皆在0〈=索引〈=3的范圍中,則在每一方向上使用降頻采樣因數(shù)I (即,無降頻采樣)。如果行索引及列索引皆在0〈=索引〈=7的范圍中,但皆不在0〈=索引〈=3的范圍中,則在每一方向(行/列)上使用降頻采樣因數(shù)2。對于所有剩余值,在每一方向上使用降頻采樣因數(shù)4。在圖7中,針對有編號正方形中的每一正方形譯碼一個量化矩陣值。可通過簡單地對來自原始16X16量化矩陣的屬于對應正方形的所有量化矩陣值求平均來推導此值。雖然在本實例中使用簡單求平均,但也可能使用更復雜的降頻采樣濾波器。正方形0-15各自直接對應于一個量化矩陣值,因為在此區(qū)域中降頻采樣因數(shù)為I。正方形17-27對應于量化矩陣值的2X2塊(即,4個量化矩陣值),因為在此區(qū)域中降頻采樣因數(shù)為2。正方形29-39對應于量化矩陣值的4X4塊(即,16個量化矩陣值),因為在此區(qū)域中降頻采樣因數(shù)為4。正方形內(nèi)的數(shù)字表示藉以在位流中譯碼值的Z字形掃描次序。
[0128]對應于每一正方形的一個量化矩陣值可包含于位流中。此可針對每一降頻采樣因數(shù)在特定區(qū)域中使用單獨Z字形掃描來實現(xiàn)。例如,對應于降頻采樣因數(shù)I的首批正方形0-15系以Z字形次序掃描。此掃描后跟著為對應于降頻采樣因數(shù)2的正方形17-27的Z字形掃描。此掃描后跟著為對應于降頻采樣因數(shù)4的正方形28-39的Z字形掃描。如果用于較高降頻采樣因數(shù)的Z字形掃描越過被用于較低降頻采樣因數(shù)的另一Z字形掃描覆蓋的區(qū),則無值被譯碼(例如,當從正方形16轉(zhuǎn)到正方形17時)。然而,如果使用DPCM來譯碼降頻采樣值,則用于Z字形掃描中之下一值的預測值可從用于較低子采樣因數(shù)的對應量化矩陣值導出,值已在位流中譯碼。
[0129]例如,在圖7中,考慮對應于子采樣因數(shù)2的Z字形掃描。Z字形掃描越過具有索引16及17的正方形。這些兩個正方形之間存在已被對應于子采樣因數(shù)I的Z字形掃描覆蓋的區(qū)(正方形11-15)。因而,針對彼區(qū)域,無值被譯碼到位流,因為此區(qū)域已被譯碼。然而,當正使用DPCM譯碼具有索引17的正方形的量化矩陣值時,預測值是從具有索引11、13、14及15的正方形的已譯碼值導出。此量化矩陣值可為舍位到最接近的整數(shù)的經(jīng)譯碼值的簡單平均值。
[0130]在接收到降頻采樣量化矩陣時,視頻解碼器30可按與藉以將量化矩陣值包含于位流中的次序相同的次序解碼系數(shù)值的量化矩陣值。視頻解碼器30可將簡單重復用于執(zhí)行量化矩陣值的升頻采樣。即,正方形內(nèi)的所有位置使用相同量化矩陣值。此量化矩陣值通常為對應于彼正方形的經(jīng)譯碼值。也可使用更復雜的升頻采樣濾波器。
[0131]如上文關于其它技術所描述,降頻采樣量化矩陣值可使用DPCM(從掃描中之前一值的預測)、跟著為帶正負號的指數(shù)葛洛姆譯碼進行譯碼。當某一值由于彼區(qū)已由對應于較低子采樣因數(shù)的Z字形掃描覆蓋而未被譯碼時,如上所述地修改下一經(jīng)譯碼值的預測。也可使用任何其它預測及譯碼方法。替代例如圖7中所展示的3個降頻采樣因數(shù),可使用更少或更多降頻采樣因數(shù)及區(qū)域。圖8展示對于8X8塊具有2個降頻采樣因數(shù)的實例,其中塊0-15具有降頻采樣因數(shù)I且塊17-27具有降頻采樣因數(shù)2。
[0132]也應注意,可使用例如對角線向上(up-diagonal)的其它類型的掃描。又,掃描可以反向次序進行。例如,可首先譯碼對應于降頻采樣因數(shù)3的值。此可跟著為對應于降頻采樣因數(shù)2的值,等等。
[0133]在本發(fā)明的一個特定實例中,量化矩陣的DC系數(shù)(即,位置(0,0)處的量化矩陣值)為第一子集中的唯一值,且用降頻采樣因數(shù)I進行降頻采樣(即,其被明確地用信號發(fā)送)。量化矩陣中的所有其它量化矩陣值被視為在第二子集中,且以2或更大的因數(shù)進行降頻采樣。圖9展示根據(jù)本實例譯碼的16X16量化矩陣。如圖9中所展示,正方形O中的DC系數(shù)被明確地譯碼(即,用降頻采樣因數(shù)I),且量化矩陣中的所有其它量化矩陣值是用因數(shù)2進行降頻采樣。請注意,用因數(shù)2降頻采樣的正方形I技術上包含DC系數(shù)。用于此特定2 X 2塊的值可被確定為三個剩余量化矩陣值(即,除DC系數(shù)外的值)的平均值、區(qū)域中的所有四個量化矩陣值的平均值(即,包含DC系數(shù)的平均值)或使用某一其它濾波技術確定。
[0134]在本發(fā)明的另一實例中,對于32X32塊,可使用以下降頻采樣轉(zhuǎn)變點。如果行索弓丨及列索引皆在0〈=索引〈=3的范圍中,則在每一方向上使用降頻采樣因數(shù)1(即,無降頻采樣)。如果行索引及列索引皆在0〈=索引〈=15的范圍中,但皆不在0〈=索引〈=3的范圍中,則可在每一方向(行/列)上使用降頻采樣因數(shù)2。對于所有剩余值,可在每一方向上使用降頻采樣因數(shù)4。降頻采樣因數(shù)改變值(例如,從I到2或從2到4)所在的轉(zhuǎn)變點及實際降頻采樣因數(shù)可包含于位流中,或其可在視頻編碼器20及視頻解碼器30兩者處為事前已知的。
[0135]在本發(fā)明的一個實例中,如果使用均勻采樣,則僅需要譯碼8 X 8矩陣。對于非均勻采樣,對更多量化矩陣值進行譯碼,因為將達成對完整量化矩陣(32X32或16X16)的更精確估算。
[0136]對于均勻采樣實例,替代譯碼16 X 16或32 X 32的量化矩陣,在位流中譯碼較低大小(例如,8X8)的量化矩陣。接著,當需要產(chǎn)生較大矩陣的量化矩陣輸入項的值時,可使用內(nèi)插法。如果量化矩陣輸入項表示較低頻率子集中的頻率(例如,最低8X8個頻率),則使用雙線性內(nèi)插法來計算較大量化矩陣的量化矩陣輸入項的值。對于區(qū)的剩余部分,使用從較低大小的量化矩陣重復對應值。替代使用最低8X8頻率,可使用任何其它子集。此外,替代雙線性內(nèi)插法和像素重復,可使用任何兩個內(nèi)插方法。此技術可進一步推廣到2個以上區(qū)域及2個以上內(nèi)插方法。
[0137]關于圖7、8和9,以及上文所描述的對系數(shù)值進行降頻采樣的實例,在不同區(qū)(即,表示量化矩陣值的不同子集)中使用不同降頻采樣因數(shù)。對于每一子集,可針對每一塊(例如,圖7到9中的有編號正方形)用信號發(fā)送一個量化矩陣值,其中每一塊所表示的量化矩陣值的數(shù)目是由用于特定子集的降頻采樣因數(shù)確定。降頻采樣因數(shù)之間的切換發(fā)生于的位置可為視頻編碼器及視頻解碼器所知或被明確地用信號發(fā)送。
[0138]換句話說,上文所論述的降頻采樣技術可允許視頻編碼器20無損失地用信號發(fā)送較低頻率量化矩陣值(在一個實例中,關于DC系數(shù))且以越來越粗略的方式近似其它量化矩陣值。此可避免使整個量化矩陣置于存儲裝置中的必要性,此對16X 16及32X32的塊大小可能有益(但益處也可適用于不同大小的塊)。
[0139]根據(jù)上文所描述的技術,視頻編碼器20可經(jīng)配置以:確定包含多個值的量化矩陣;按第一降頻采樣因數(shù)降頻采樣量化矩陣中的第一值集合以產(chǎn)生第一降頻采樣值集合;按第二降頻采樣因數(shù)降頻采樣量化矩陣中的第二值集合以產(chǎn)生第二降頻采樣值集合;且產(chǎn)生包含第一降頻采樣值集合及第二降頻采樣值集合的經(jīng)譯碼位流。
[0140]返回參看圖2,在量化之后,熵編碼單元56熵編碼經(jīng)量化的變換系數(shù)。例如,熵編碼單元56可執(zhí)行上下文自適應性可變長度譯碼(CAVLC)、上下文自適應性二進位算術譯碼(CABAC)、基于語法的上下文自適應性二進位算術譯碼(SBAC)、概率區(qū)間分割熵(PIPE)譯碼或另一熵編碼方法或技術。在通過熵編碼單元56進行的熵編碼之后,經(jīng)編碼位流可被傳輸?shù)揭曨l解碼器30,或經(jīng)存檔以供稍后傳輸或由視頻解碼器30檢索。熵編碼單元56也可熵編碼用于正被譯碼的當前視頻切片的運動向量和其它語法元素。
[0141]在一些實例中,熵編碼單元56可操作以執(zhí)行本發(fā)明的技術。然而,本發(fā)明的方面不限于此。在替代實例中,視頻編碼器20的某一其它單元(例如處理器)或視頻編碼器20的任何其它單元可被分派執(zhí)行本發(fā)明的技術的任務。作為一個實例,熵編碼單元56可操作以編碼量化矩陣的第一子集的大小、編碼第一子集的系數(shù)值且預測量化矩陣的第二子集的系數(shù)值。又,在一些實例中,本發(fā)明的技術可劃分到視頻編碼器20的一或多個單元當中。
[0142]反量化單元58及反變換處理單元60分別應用反量化及反變換,以重構建像素域中的殘余塊以供稍后用作參考圖片的參考塊。運動補償單元44可通過將殘余塊加到參考圖片列表中的一者內(nèi)的參考圖片中的一圖片的預測性塊來計算參考塊。運動補償單元44也可將一或多個內(nèi)插濾波器應用于重構建的殘余塊以計算子整數(shù)像素值以供在運動估計中使用。求和器62將重構建的殘余塊加到由運動補償單元44產(chǎn)生的經(jīng)運動補償?shù)念A測塊以產(chǎn)生參考塊以存儲于參考圖片存儲裝置64中。參考塊可由運動估計單元42及運動補償單元44用作參考塊來幀間預測隨后視頻幀或圖片中的塊。
[0143]圖3為說明可實施本發(fā)明中所描述的技術的實例視頻解碼器30的框圖。在圖3的實例中,視頻解碼器30包含熵解碼單元80、預測處理單元81、反量化單元86、反變換單元88、求和器90和參考圖片存儲裝置92。預測處理單元81包含運動補償單元82和幀內(nèi)預測處理單元84。在一些實例中,視頻解碼器30可執(zhí)行與關于圖2的視頻編碼器20所描述的編碼遍次大體上互逆的解碼遍次。
[0144]在解碼過程期間,視頻解碼器30從視頻編碼器20接收表示經(jīng)編碼視頻切片的視頻塊及相關聯(lián)語法元素的經(jīng)編碼視頻位流。視頻解碼器30的熵解碼單元80熵解碼位流以產(chǎn)生經(jīng)量化的系數(shù)、運動向量及其它語法元素。熵解碼單元80將運動向量及其它語法元素轉(zhuǎn)發(fā)到預測處理單元81。視頻解碼器30可在視頻切片層級和/或視頻塊層級接收語法元素。
[0145]在一些實例中,熵解碼單元80可操作以執(zhí)行本發(fā)明的技術。然而,本發(fā)明的方面不限于此。在替代實例中,視頻解碼器30的某一其它單元(例如處理器)或視頻解碼器30的任何其它單元可被分派執(zhí)行本發(fā)明的技術的任務。作為一個實例,熵解碼單元80可操作以解碼量化矩陣的第一子集的大小、解碼第一子集的系數(shù)值且預測量化矩陣的第二子集的系數(shù)值。又,在一些實例中,本發(fā)明的技術可在視頻解碼器30的一或多個單元當中劃分。
[0146]當視頻切片經(jīng)譯碼為經(jīng)幀內(nèi)譯碼(I)切片時,預測處理單元81的幀內(nèi)預測處理單元84可基于所用信號發(fā)送的幀內(nèi)預測模式及來自當前幀或圖片的先前經(jīng)解碼塊的數(shù)據(jù)產(chǎn)生用于當前視頻切片的視頻塊的預測數(shù)據(jù)。當視頻幀經(jīng)譯碼為幀間譯碼(即,B、P或GPB)切片時,預測處理單元81的運動補償單元82基于從熵解碼單元80接收的運動向量及其它語法元素產(chǎn)生用于當前視頻切片的視頻塊的預測性塊。可根據(jù)參考圖片列表中的一者內(nèi)的參考圖片中的一圖片產(chǎn)生預測性塊。視頻解碼器30可基于存儲于參考圖片存儲裝置92中的參考圖片使用默認構建技術來構建參考幀列表(列表O及列表I)。
[0147]運動補償單元82通過剖析運動向量及其它語法元素來確定用于當前視頻切片的視頻塊的預測信息,且使用預測信息產(chǎn)生用于正被解碼的當前視頻塊的預測性塊。例如,運動補償單元82使用所接收的語法元素中的一些確定用以譯碼視頻切片的視頻塊的預測模式(例如,幀內(nèi)或幀間預測)、幀間預測切片類型(例如,B切片、P切片或GPB切片)、用于切片的參考圖片列表中的一或多者的構建信息、用于切片的每一經(jīng)幀間編碼視頻塊的運動向量、用于切片的每一經(jīng)幀間譯碼視頻塊的幀間預測狀態(tài)和用以解碼當前視頻切片中的視頻塊的其它信息。
[0148]運動補償單元82也可基于內(nèi)插濾波器執(zhí)行內(nèi)插。運動補償單元82可使用由視頻編碼器20在視頻塊的編碼期間使用的內(nèi)插濾波器來計算用于參考塊的子整數(shù)像素的內(nèi)插值。在此情況下,運動補償單元82可根據(jù)所接收的語法元素確定由視頻編碼器20使用的內(nèi)插濾波器,且使用內(nèi)插濾波器來產(chǎn)生預測性塊。
[0149]反量化單元86反量化(即,解量化)提供于位流中且由熵解碼單元80解碼的經(jīng)量化變換系數(shù)。反量化過程可包含將由視頻編碼器20針對視頻切片中的每一視頻塊計算并用信號發(fā)送的量化參數(shù)和/或量化矩陣用以確定量化的程度及(同樣地)應應用的反量化的程度。明確地說,反量化單元86可經(jīng)配置以解碼所接收的已根據(jù)上述技術譯碼的量化矩陣。明確地說,視頻解碼器30可經(jīng)配置以升頻采樣所接收的已根據(jù)本發(fā)明的技術降頻采樣的量化矩陣。
[0150]在本發(fā)明的一個實例中,視頻解碼器30可經(jīng)配置以:在經(jīng)譯碼位流中接收用降頻采樣值譯碼的量化矩陣;按第一升頻采樣因數(shù)升頻采樣量化矩陣中的第一降頻采樣值集合以產(chǎn)生第一值集合;按第二升頻采樣因數(shù)升頻采樣量化矩陣中的第二降頻采樣值集合以產(chǎn)生第二值集合;且用第一及第二值集合反量化變換系數(shù)塊。
[0151]反變換處理單元88將反變換(例如,反DCT、反整數(shù)變換或概念上類似的反變換過程)應用于變換系數(shù)以便產(chǎn)生像素域中的殘余塊。
[0152]在運動補償單元82基于運動向量及其它語法元素產(chǎn)生用于當前視頻塊的預測性塊之后,視頻解碼器30通過將來自反變換處理單元88的殘余塊與由運動補償單元82產(chǎn)生的對應預測性塊求和而形成經(jīng)解碼視頻塊。求和器90表示執(zhí)行此求和運算的一或多個組件。如果需要,也可應用解塊濾波器來對經(jīng)解碼塊進行濾波以便去除塊效應偽影。也可將其它環(huán)路濾波器(在譯碼環(huán)路中或在譯碼環(huán)路之后)用以平滑化像素轉(zhuǎn)變或以其它方式改進視頻質(zhì)量。給定幀或圖片中的經(jīng)解碼視頻塊接著被存儲于存儲用于隨后運動補償?shù)膮⒖紙D片的參考圖片存儲裝置92中。參考圖片存儲裝置92也存儲經(jīng)解碼視頻以供稍后呈現(xiàn)于顯示裝置(例如圖1的顯示裝置32)上。
[0153]圖10為說明根據(jù)本發(fā)明的技術的視頻編碼方法的流程圖。圖10的方法可由視頻編碼器20執(zhí)行。視頻編碼器20可經(jīng)配置以:確定包含多個值的量化矩陣(920);按第一降頻采樣因數(shù)降頻采樣量化矩陣中的第一值集合以產(chǎn)生第一降頻采樣值集合(922);且按第二降頻采樣因數(shù)降頻采樣量化矩陣中的第二值集合以產(chǎn)生第二降頻采樣值集合(924)。
[0154]在本發(fā)明的一個實例中,視頻編碼器20可基于第一值集合在量化矩陣中的位置確定第一降頻采樣因數(shù),且基于第二值集合在量化矩陣中的位置確定第二降頻采樣因數(shù)。在具體實例中,第一值集合僅包含量化矩陣的位置(0,0)處的值,其中第一降頻采樣因數(shù)經(jīng)確定為1,且其中第二降頻采樣因數(shù)經(jīng)確定為2及4中的一者。
[0155]視頻編碼器20可經(jīng)配置以確定量化矩陣中的轉(zhuǎn)變點從而確定降頻采樣量化矩陣值的方式。在一個實例中,視頻編碼器20可經(jīng)配置以:確定量化矩陣中的第一轉(zhuǎn)變點,其中位于第一轉(zhuǎn)變點與量化矩陣的原點之間的值未經(jīng)降頻采樣;確定量化矩陣中的第二轉(zhuǎn)變點,其中量化矩陣中的第一值集合位于第一轉(zhuǎn)變點與第二轉(zhuǎn)變點之間;且確定量化矩陣中的第三轉(zhuǎn)變點,其中量化矩陣中的第二值集合位于第二轉(zhuǎn)變點與第三轉(zhuǎn)變點之間。視頻編碼器20可經(jīng)配置以在經(jīng)譯碼位流中用信號發(fā)送第一、第二及第三轉(zhuǎn)變點以及第一及第二降頻采樣因數(shù)。
[0156]在本發(fā)明的一個實例中,視頻編碼器20可經(jīng)配置以通過以下操作來用信號發(fā)送降頻采樣值:根據(jù)第一及第二降頻采樣值集合中的沿著掃描次序的先前降頻采樣值預測第一及第二降頻采樣值集合中的沿著掃描次序的降頻采樣值中的一者,其中第一集合中的降頻采樣值可用以預測第二集合中的降頻采樣值。
[0157]在本發(fā)明的另一實例中,降頻采樣量化矩陣中的第一值集合包括對第一值集合中的第一數(shù)目個量化矩陣值求平均以產(chǎn)生第一降頻采樣值集合中的值,其中第一數(shù)目是根據(jù)第一降頻采樣因數(shù)確定,且其中降頻采樣量化矩陣中的第二值集合包括對第二值集合中的第二數(shù)目個量化矩陣值求平均以產(chǎn)生第二降頻采樣值集合中的值,其中第二數(shù)目是根據(jù)第二降頻采樣因數(shù)確定。
[0158]視頻編碼器20可經(jīng)進一步配置以根據(jù)量化矩陣量化變換系數(shù)塊中的變換系數(shù)的值以形成經(jīng)量化的變換系數(shù)(926)。視頻編碼器20可經(jīng)進一步配置以產(chǎn)生包含第一降頻采樣值集合及第二降頻采樣值集合的經(jīng)譯碼位流(928)。
[0159]圖11為說明根據(jù)本發(fā)明的技術的視頻解碼方法的流程圖。圖11的方法可由視頻解碼器30執(zhí)行。視頻解碼器30可經(jīng)配置以在經(jīng)譯碼位流中接收用降頻采樣值譯碼的量化矩陣(1020);按第一升頻采樣因數(shù)升頻采樣量化矩陣中的第一降頻采樣值集合以產(chǎn)生第一值集合(1022);按第二升頻采樣因數(shù)升頻采樣量化矩陣中的第二降頻采樣值集合以產(chǎn)生第二值集合(1024);且用第一及第二值集合反量化變換系數(shù)塊(1026)。
[0160]在本發(fā)明的一個實例中,視頻解碼器30可經(jīng)配置以:基于第一降頻采樣值集合在量化矩陣中的位置確定第一升頻采樣因數(shù),且基于第二降頻采樣值集合在量化矩陣中的位置確定第二升頻采樣因數(shù)。在具體實例中,第一降頻采樣值集合僅包含量化矩陣的位置(0,O)處的值,其中第一升頻采樣因數(shù)經(jīng)確定為1,且其中第二升頻采樣因數(shù)經(jīng)確定為2及4中的一者。
[0161]在本發(fā)明的另一實例中,視頻解碼器30可經(jīng)配置以:確定量化矩陣中的第一轉(zhuǎn)變點,其中量化矩陣的位于第一轉(zhuǎn)變點與量化矩陣的原點之間的值未經(jīng)降頻采樣;確定量化矩陣中的第二轉(zhuǎn)變點,其中量化矩陣中的第一降頻采樣值集合位于第一轉(zhuǎn)變點與第二轉(zhuǎn)變點之間;且確定量化矩陣中的第三轉(zhuǎn)變點,其中量化矩陣中的第二降頻采樣值集合位于第二轉(zhuǎn)變點與第三轉(zhuǎn)變點之間。在此實例中,在經(jīng)譯碼位流中接收第一、第二及第三轉(zhuǎn)變點以及第一及第二降頻采樣因數(shù)。
[0162]在本發(fā)明的另一實例中,視頻解碼器30經(jīng)配置以根據(jù)第一及第二降頻采樣值集合中的沿著掃描次序的先前降頻采樣值預測第一及第二降頻采樣值集合中的沿著掃描次序的降頻采樣值中的每一連續(xù)降頻采樣值,其中第一集合中的降頻采樣值可用以預測第二集合中的降頻采樣值。
[0163]在本發(fā)明的另一實例中,通過以下步驟對量化矩陣中的第一值集合進行升頻采樣:對于第一值集合中的第一數(shù)目個值重復第一降頻采樣值集合中的降頻采樣值,其中第一數(shù)目是根據(jù)第一升頻采樣因數(shù)確定,且升頻采樣量化矩陣中的第二值集合包括對于第二值集合中的第二數(shù)目個值重復第二降頻采樣值集合中的降頻采樣值,其中第二數(shù)目是根據(jù)第二升頻采樣因數(shù)確定。
[0164]在本發(fā)明的一個實例中,將不同升頻采樣技術用以升頻采樣第一及第二降頻采樣值集合。在具體實例中,使用雙線性內(nèi)插法升頻采樣第一及第二值集合中的至少一者。
[0165]視頻解碼器30可經(jīng)進一步配置以反變換變換系數(shù)的反量化塊以形成殘余視頻數(shù)據(jù)塊;且對殘余視頻數(shù)據(jù)塊執(zhí)行預測過程以形成經(jīng)解碼的視頻數(shù)據(jù)塊。
[0166]在一或多個實例中,所描述功能可以硬件、軟件、固件或其任何組合來實施。如果以軟件實施,則功能可作為一或多個指令或代碼而存儲于計算機可讀媒體上或經(jīng)由計算機可讀媒體傳輸,且通過基于硬件的處理單元執(zhí)行。計算機可讀媒體可包含計算機可讀存儲媒體(其對應于例如數(shù)據(jù)存儲媒體的有形媒體)或通信媒體,通信媒體包含(例如)根據(jù)通信協(xié)議促進計算機程序從一處傳送到另一處的任何媒體。以此方式,計算機可讀媒體通常可對應于(I)非暫時性的有形計算機可讀存儲媒體,或(2)例如信號或載波的通信媒體。數(shù)據(jù)存儲媒體可為可由一或多個計算機或一或多個處理器接入以檢索指令、代碼和/或數(shù)據(jù)結構以用于實施本發(fā)明中所描述的技術的任何可用媒體。計算機程序產(chǎn)品可包含計算機可讀媒體。
[0167]作為實例而非限制,這些計算機可讀存儲媒體可包括RAM、ROM、EEPROM、CD-ROM或其它光盤存儲裝置、磁盤存儲裝置或其它磁性存儲裝置、快閃存儲裝置,或可用以存儲呈指令或數(shù)據(jù)結構的形式的所要代碼且可由計算機接入的任何其它媒體。又,將任何連接適當?shù)胤Q為計算機可讀媒體。例如,如果使用同軸電纜、光纖纜線、雙絞線、數(shù)字訂戶線(DSL)或無線技術(例如,紅外線、無線電及微波)而從網(wǎng)站、服務器或其它遠端源傳輸指令,則同軸電纜、光纖纜線、雙絞線、DSL或無線技術(例如,紅外線、無線電及微波)包含于媒體的定義中。然而,應理解,計算機可讀存儲媒體及數(shù)據(jù)存儲媒體不包含連接、載波、信號或其它暫時性媒體,而是有關非暫時性有形存儲媒體。如本文中所使用,磁盤及光盤包含緊密光盤(CD)、雷射光盤、光盤、數(shù)字影音光盤(DVD)、軟性磁盤及藍光光盤,其中磁盤通常以磁性方式再生數(shù)據(jù),而光盤通過雷射以光學方式再生數(shù)據(jù)。以上各物的組合也應包含于計算機可讀媒體的范圍內(nèi)。
[0168]可由(例如)一或多個數(shù)字信號處理器(DSP)、通用微處理器、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)或其它等效集成或離散邏輯電路的一或多個處理器執(zhí)行指令。因此,本文中所使用的術語“處理器”可指上述結構或適于實施本文中所描述的技術的任何其它結構中的任一者。另外,在一些方面中,可將本文中所描述的功能性提供于經(jīng)配置用于編碼及解碼的專用硬件和/或軟件模塊內(nèi)或并入于組合式編碼解碼器中。又,所述技術可完全實施于一或多個電路或邏輯元件中。
[0169]本發(fā)明的技術可實施于廣泛多種裝置或設備中,所述裝置或設備包含無線手機、集成電路(IC)或IC集合(例如,芯片組)。在本發(fā)明中描述各種組件、模塊或單元以強調(diào)經(jīng)配置以執(zhí)行所揭示技術的裝置的功能方面,但未必要求通過不同硬件單元實現(xiàn)。相反地,如上所述,可將各種單元組合于編碼解碼器硬件單元中,或可由結合合適軟件和/或固件的互操作性硬件單元(包含如上所述的一或多個處理器)的集合提供所述單元。
[0170]已描述各種實例。這些及其它實例在以下權利要求書的范圍內(nèi)。
【權利要求】
1.一種編碼視頻數(shù)據(jù)的方法,其包括: 確定包含多個值的量化矩陣; 按第一降頻采樣因數(shù)降頻采樣所述量化矩陣中的第一值集合以產(chǎn)生第一降頻采樣值集合; 按第二降頻采樣因數(shù)降頻采樣所述量化矩陣中的第二值集合以產(chǎn)生第二降頻采樣值集合;以及 產(chǎn)生包含所述第一降頻采樣值集合及所述第二降頻采樣值集合的經(jīng)譯碼位流。
2.如權利要求1所述的方法,其進一步包括: 基于所述第一值集合在所述量化矩陣中的位置確定所述第一降頻采樣因數(shù);以及 基于所述第二值集合在所述量化矩陣中的位置確定所述第二降頻采樣因數(shù)。
3.如權利要求2所述的方法,其中所述第一值集合僅包含所述量化矩陣的位置(0,0)處的值,其中所述第一降頻采樣因數(shù)被確定為1,且其中所述第二降頻采樣因數(shù)被確定為2及4之一。
4.如權利要求3所述的方法, 其中所述量化矩陣具有16X16或32X32的大小。
5.如權利要求1所述的方法,其進一步包括: 確定所述量化矩陣中的第一轉(zhuǎn)變點,其中位于所述第一轉(zhuǎn)變點與所述量化矩陣的原點之間的值未經(jīng)降頻采樣; 確定所述量化矩陣中的第二轉(zhuǎn)變點,其中所述量化矩陣中的所述第一值集合位于所述第一轉(zhuǎn)變點與所述第二轉(zhuǎn)變點之間; 確定所述量化矩陣中的第三轉(zhuǎn)變點,其中所述量化矩陣中的所述第二值集合位于所述第二轉(zhuǎn)變點與所述第三轉(zhuǎn)變點之間;以及 在所述經(jīng)譯碼位流中用信號發(fā)送所述第一、所述第二及所述第三轉(zhuǎn)變點以及所述第一及所述第二降頻采樣因數(shù)。
6.如權利要求1所述的方法,其進一步包括: 根據(jù)所述第一及所述第二降頻采樣值集合中的沿著掃描次序的先前降頻采樣值預測所述第一及所述第二降頻采樣值集合中的沿著所述掃描次序的所述降頻采樣值之一,其中所述第一集合中的降頻采樣值可用以預測所述第二集合中的降頻采樣值。
7.如權利要求1所述的方法,其中降頻采樣所述量化矩陣中的所述第一值集合包括:對所述第一值集合中的第一數(shù)目個量化矩陣值求平均以產(chǎn)生所述第一降頻采樣值集合中的值,其中所述第一數(shù)目是根據(jù)所述第一降頻采樣因數(shù)確定,且 其中降頻采樣所述量化矩陣中的所述第二值集合包括:對所述第二值集合中的第二數(shù)目個量化矩陣值求平均以產(chǎn)生所述第二降頻采樣值集合中的值,其中所述第二數(shù)目是根據(jù)所述第二降頻采樣因數(shù)確定。
8.如權利要求1所述的方法,其進一步包括: 對視頻數(shù)據(jù)塊執(zhí)行預測過程以形成殘余視頻數(shù)據(jù)塊; 變換所述殘余視頻數(shù)據(jù)以形成變換系數(shù)塊; 以及將所述經(jīng)量化的變換系數(shù)熵譯碼到所述經(jīng)譯碼位流中。
9.一種解碼視頻數(shù)據(jù)的方法,其包括: 在經(jīng)譯碼位流中接收用降頻采樣值譯碼的量化矩陣; 按第一升頻采樣因數(shù)升頻采樣所述量化矩陣中的第一降頻采樣值集合以產(chǎn)生第一值集合; 按第二升頻采樣因數(shù)升頻采樣所述量化矩陣中的第二降頻采樣值集合以產(chǎn)生第二值集合;以及 用所述第一及所述第二值集合反量化變換系數(shù)塊。
10.如權利要求9所述的方法,其進一步包括: 基于所述第一降頻采樣值集合在所述量化矩陣中的位置確定所述第一升頻采樣因數(shù);以及 基于所述第二降頻采樣值集合在所述量化矩陣中的位置確定所述第二升頻采樣因數(shù)。
11.如權利要求10所述的方法,其中所述第一降頻采樣值集合僅包含所述量化矩陣的位置(0,0)處的值,其中所述第一升頻采樣因數(shù)被確定為1,且其中所述第二升頻采樣因數(shù)被確定為2及4之一。
12.如權利要求11所述的方法, 其中所述量化矩陣具有16 X 16或32 X 32的大小。
13.如權利要求9所述的方法,其進一步包括: 確定所述量化矩陣中的第一轉(zhuǎn)變點,其中位于所述第一轉(zhuǎn)變點與所述量化矩陣的原點之間的所述量化矩陣的值未經(jīng)降頻采樣; 確定所述量化矩陣中的第二轉(zhuǎn)變點,其中所述量化矩陣中的所述第一降頻采樣值集合位于所述第一轉(zhuǎn)變點與所述第二轉(zhuǎn)變點之間; 確定所述量化矩陣中的第三轉(zhuǎn)變點,其中所述量化矩陣中的所述第二降頻采樣值集合位于所述第二轉(zhuǎn)變點與所述第三轉(zhuǎn)變點之間;以及 在所述經(jīng)譯碼位流中接收所述第一、所述第二及所述第三轉(zhuǎn)變點以及所述第一及所述第二降頻采樣因數(shù)。
14.如權利要求9所述的方法,其進一步包括: 根據(jù)所述第一及所述第二降頻采樣值集合中的沿著掃描次序的先前降頻采樣值預測所述第一及所述第二降頻采樣值集合中的沿著所述掃描次序的所述降頻采樣值中的每一連續(xù)降頻采樣值,其中所述第一集合中的降頻采樣值可用以預測所述第二集合中的降頻采樣值。
15.如權利要求9所述的方法,其中升頻采樣所述量化矩陣中的所述第一值集合包括:對于所述第一值集合中的第一數(shù)目個值復制所述第一降頻采樣值集合中的降頻采樣值,其中所述第一數(shù)目是根據(jù)所述第一升頻采樣因數(shù)確定,且 其中升頻采樣所述量化矩陣中的所述第二值集合包括:對于所述第二值集合中的第二數(shù)目個值復制所述第二降頻采樣值集合中的一降頻采樣值,其中所述第二數(shù)目是根據(jù)所述第二升頻采樣因數(shù)確定。
16.如權利要求9所述的方法,其中使用不同升頻采樣技術來升頻采樣所述第一及所述第二降頻采樣值集合。
17.如權利要求9所述的方法,其中使用雙線性內(nèi)插法來升頻采樣所述第一及所述第二值集合中的至少一者。
18.如權利要求9所述的方法,其進一步包括: 反變換所述反量化變換系數(shù)塊以形成殘余視頻數(shù)據(jù)塊;以及 對所述殘余視頻數(shù)據(jù)塊執(zhí)行預測過程以形成經(jīng)解碼視頻數(shù)據(jù)塊。
19.一種經(jīng)配置以譯碼視頻數(shù)據(jù)的設備,其包括: 視頻編碼器,其經(jīng)配置以: 確定包含多個值的量化矩陣; 按第一降頻采樣因數(shù)降頻采樣所述量化矩陣中的第一值集合以產(chǎn)生第一降頻采樣值集合; 按第二降頻采樣因數(shù)降頻采樣所述量化矩陣中的第二值集合以產(chǎn)生第二降頻采樣值集合;以及 產(chǎn)生包含所述第一降頻采樣值集合及所述第二降頻采樣值集合的經(jīng)譯碼位流。
20.如權利要求19所述的設備,其中所述視頻編碼器經(jīng)進一步配置以: 基于所述第一值集合在所述量化矩陣中的位置確定所述第一降頻采樣因數(shù);以及 基于所述第二值集合在所述量化矩陣中的位置確定所述第二降頻采樣因數(shù)。
21.如權利要求20所述的設備,其中所述第一值集合僅包含所述量化矩陣的位置(0,O)處的值,其中所述第一降頻采樣因數(shù)被確定為1,且其中所述第二降頻采樣因數(shù)被確定為2及4之一。
22.如權利要求21所述的設備, 其中所述量化矩陣具有16 X 16或32 X 32的大小。
23.如權利要求19所述的設備,其中所述視頻編碼器經(jīng)進一步配置以: 確定所述量化矩陣中的第一轉(zhuǎn)變點,其中位于所述第轉(zhuǎn)變點與所述量化矩陣的一原點之間的值未經(jīng)降頻采樣; 確定所述量化矩陣中的第二轉(zhuǎn)變點,其中所述量化矩陣中的所述第一值集合位于所述第一轉(zhuǎn)變點與所述第二轉(zhuǎn)變點之間; 確定所述量化矩陣中的第三轉(zhuǎn)變點,其中所述量化矩陣中的所述第二值集合位于所述第二轉(zhuǎn)變點與所述第三轉(zhuǎn)變點之間;以及 在所述經(jīng)譯碼位流中用信號發(fā)送所述第一、所述第二及所述第三轉(zhuǎn)變點以及所述第一及所述第二降頻采樣因數(shù)。
24.如權利要求19所述的設備,其中所述視頻編碼器經(jīng)進一步配置以: 根據(jù)所述第一及所述第二降頻采樣值集合中的沿著掃描次序的先前降頻采樣值預測所述第一及所述第二降頻采樣值集合中的沿著所述掃描次序的所述降頻采樣值之一,其中所述第一集合中的降頻采樣值可用以預測所述第二集合中的降頻采樣值。
25.如權利要求19所述的設備,其中降頻采樣所述量化矩陣中的所述第一值集合包括:對所述第一值集合中 的第一數(shù)目個量化矩陣值求平均以產(chǎn)生所述第一降頻采樣值集合中的值,其中所述第一數(shù)目是根據(jù)所述第一降頻采樣因數(shù)確定,且 其中降頻采樣所述量化矩陣中的所述第二值集合包括:對所述第二值集合中的第二數(shù)目個量化矩陣值求平均以產(chǎn)生所述第二降頻采樣值集合中的值,其中所述第二數(shù)目是根據(jù)所述第二降頻采樣因數(shù)確定。
26.如權利要求19所述的設備,其中所述視頻編碼器經(jīng)進一步配置以: 對視頻數(shù)據(jù)塊執(zhí)行預測過程以形成殘余視頻數(shù)據(jù)塊; 變換所述殘余視頻數(shù)據(jù)以形成變換系數(shù)塊; 根據(jù)所述量化矩陣量化所述變換系數(shù)塊中的變換系數(shù)的值以形成經(jīng)量化的變換系數(shù);以及 將所述經(jīng)量化的變換系數(shù)熵譯碼到所述經(jīng)譯碼位流中。
27.—種經(jīng)配置以解碼視頻數(shù)據(jù)的設備,其包括: 視頻解碼器,其經(jīng)配置以: 在經(jīng)譯碼位流中接收用降頻采樣值譯碼的量化矩陣; 按第一升頻采樣因數(shù)升頻采樣所述量化矩陣中的第一降頻采樣值集合以產(chǎn)生第一值集合; 按第二升頻采樣因數(shù)升頻采樣所述量化矩陣中的第二降頻采樣值集合以產(chǎn)生第二值集合;以及 用所述第一及所述第二值集合反量化變換系數(shù)塊。
28.如權利要求27所述的設備,其中所述視頻解碼器經(jīng)進一步配置以: 基于所述第一降頻采樣值集合在所述量化矩陣中的位置確定所述第一升頻采樣因數(shù);以及 基于所述第二降頻采樣值集合在所述量化矩陣中的位置確定所述第二升頻采樣因數(shù)。
29.如權利要求28所述的設備,其中所述第一降頻采樣值集合僅包含所述量化矩陣的位置(0,0)處的值,其中所述第一升頻采樣因數(shù)被確定為1,且其中所述第二升頻采樣因數(shù)被確定為2及4之一。
30.如權利要求29所述的設備, 其中所述量化矩陣具有16X16或32X32的大小。
31.如權利要求27所述的設備,其中所述視頻解碼器經(jīng)進一步配置以: 確定所述量化矩陣中的第一轉(zhuǎn)變點,其中位于所述第一轉(zhuǎn)變點與所述量化矩陣的原點之間的所述量化矩陣的值未經(jīng)降頻采樣; 確定所述量化矩陣中的第二轉(zhuǎn)變點,其中所述量化矩陣中的所述第一降頻采樣值集合位于所述第一轉(zhuǎn)變點與所述第二轉(zhuǎn)變點之間; 確定所述量化矩陣中的第三轉(zhuǎn)變點,其中所述量化矩陣中的所述第二降頻采樣值集合位于所述第二轉(zhuǎn)變點與所述第三轉(zhuǎn)變點之間;以及 在所述經(jīng)譯碼位流中接收所述第一、所述第二及所述第三轉(zhuǎn)變點以及所述第一及所述第二降頻采樣因數(shù)。
32.如權利要求27所述的設備,其中所述視頻解碼器經(jīng)進一步配置以: 根據(jù)所述第一及所述第二降頻采樣值集合中的沿著掃描次序的先前降頻采樣值預測所述第一及所述第二降頻采樣值集合中的沿著所述掃描次序的所述降頻采樣值中的每一連續(xù)降頻采樣值,其中所述第一集合中的降頻采樣值可用以預測所述第二集合中的降頻采樣值。
33.如權利要求27所述的設備,其中升頻采樣所述量化矩陣中的所述第一值集合包括:對于所述第一值集合中的第一數(shù)目個值復制所述第一降頻采樣值集合中的降頻采樣值,其中所述第一數(shù)目是根據(jù)所述第一升頻采樣因數(shù)確定,且 其中升頻采樣所述量化矩陣中的所述第二值集合包括:對于所述第二值集合中的第二數(shù)目個值復制所述第二降頻采樣值集合中的降頻采樣值,其中所述第二數(shù)目是根據(jù)所述第二升頻采樣因數(shù)確定。
34.如權利要求27所述的設備,其中使用不同升頻采樣技術來升頻采樣所述第一及所述第二降頻采樣值集合。
35.如權利要求27所述的設備,其中使用雙線性內(nèi)插法來升頻采樣所述第一及所述第二值集合中的至少一者。
36.如權利要求27所述的設備,其中所述視頻解碼器經(jīng)進一步配置以: 反變換所述反量化變換系數(shù)塊以形成殘余視頻數(shù)據(jù)塊;以及 對所述殘余視頻數(shù)據(jù)塊執(zhí)行預測過程以形成經(jīng)解碼視頻數(shù)據(jù)塊。
37.一種經(jīng)配置以編碼視頻數(shù)據(jù)的設備,其包括: 用于確定包含多個值的量化矩陣的裝置; 用于按第一降頻采樣因數(shù)降頻采樣所述量化矩陣中的第一值集合以產(chǎn)生第一降頻采樣值集合的裝置; 用于按第二降頻采樣因數(shù)降頻采樣所述量化矩陣中的第二值集合以產(chǎn)生第二降頻采樣值集合的裝置;以及 用于產(chǎn)生包含所述第一降頻采樣值集合及所述第二降頻采樣值集合的經(jīng)譯碼位流的>j-U ρ?α裝直。
38.一種經(jīng)配置以解碼視頻數(shù)據(jù)的設備,其包括: 用于在經(jīng)譯碼位流中接收用降頻采樣值譯碼的量化矩陣的裝置; 用于按第一升頻采樣因數(shù)升頻采樣所述量化矩陣中的第一降頻采樣值集合以產(chǎn)生第一值集合的裝置; 用于按第二升頻采樣因數(shù)升頻采樣所述量化矩陣中的第二降頻采樣值集合以產(chǎn)生第二值集合的裝置;以及 用于用所述第一及所述第二值集合反量化變換系數(shù)塊的裝置。
39.一種存儲指令的計算機可讀存儲媒體,所述指令在執(zhí)行時使經(jīng)配置以編碼視頻數(shù)據(jù)的裝置的一或多個處理器: 確定包含多個值的量化矩陣; 按第一降頻采樣因數(shù)降頻采樣所述量化矩陣中的第一值集合以產(chǎn)生第一降頻采樣值集合; 按第二降頻采樣因數(shù)降頻采樣所述量化矩陣中的第二值集合以產(chǎn)生第二降頻采樣值集合;以及 產(chǎn)生包含所述第一降頻采樣值集合及所述第二降頻采樣值集合的經(jīng)譯碼位流。
40.一種存儲指令的計算機可讀存儲媒體,所述指令在執(zhí)行時使經(jīng)配置以解碼視頻數(shù)據(jù)的裝置的一或多個處理器: 在經(jīng)譯碼位流中接收用降頻采樣值譯碼的量化矩陣; 按第一升頻采樣因數(shù)升頻采樣所述量化矩陣中的第一降頻采樣值集合以產(chǎn)生第一值集合; 按第二升頻采樣因數(shù)升頻采樣所述量化矩陣中的第二降頻采樣值集合以產(chǎn)生第二值集合;以及 用所述第一及 所述第二值集合反量化變換系數(shù)塊。
【文檔編號】H04N19/124GK104137546SQ201280054682
【公開日】2014年11月5日 申請日期:2012年11月7日 優(yōu)先權日:2011年11月7日
【發(fā)明者】瑞珍·雷克斯曼·喬許, 馬爾塔·卡切維奇 申請人:高通股份有限公司