亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

定位在表示音頻內(nèi)容的比特流的幀中的幀元素的制作方法

文檔序號(hào):2825636閱讀:220來源:國(guó)知局
定位在表示音頻內(nèi)容的比特流的幀中的幀元素的制作方法
【專利摘要】通過進(jìn)行如下布置可以在一方面實(shí)現(xiàn)過高比特率與解碼開銷之間的更好折衷并且在另一方面實(shí)現(xiàn)幀元素定位的靈活性:在比特流的幀序列中的每個(gè)幀包括N個(gè)幀元素的序列,并且另一方面,該比特流包括配置塊,該配置塊包括指示元素?cái)?shù)目N的字段以及類型指示語法部分,該類型指示語法部分對(duì)于N個(gè)元素位置的序列中的每個(gè)元素位置指示多個(gè)元素類型中的元素類型,其中在幀的N個(gè)幀元素的序列中,每個(gè)幀元素具有由類型指示部分針對(duì)相應(yīng)元素位置指示的元素類型,在相應(yīng)元素位置處,相應(yīng)幀元素定位在比特流中的相應(yīng)幀的N個(gè)幀元素的序列內(nèi)。因而,幀被相等地構(gòu)造為每個(gè)幀包括由類型指示語法部分指示的幀元素類型的N個(gè)幀元素的相同序列,其以相同的連續(xù)次序定位在比特流內(nèi)。通過使用對(duì)于N個(gè)元素位置的序列中的每個(gè)元素位置指示多個(gè)元素類型中的元素類型的類型指示語法部分,通常能夠針對(duì)幀的序列對(duì)該連續(xù)次序進(jìn)行調(diào)整。
【專利說明】定位在表示音頻內(nèi)容的比特流的巾貞中的巾貞元素
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及音頻編碼,諸如所謂的USAC編解碼器(USAC=統(tǒng)一語音與音頻編碼),尤其涉及定位在相應(yīng)比特流的幀內(nèi)的幀元素。
【背景技術(shù)】
[0002]近年來,已經(jīng)能夠獲得若干音頻編解碼器,每個(gè)音頻編解碼器被特定設(shè)計(jì)為適合專用應(yīng)用。通常,這些音頻編解碼器能夠并行地對(duì)不止一個(gè)音頻通道或音頻信號(hào)進(jìn)行編碼。一些音頻編解碼器甚至通過將音頻內(nèi)容的音頻通道或音頻對(duì)象進(jìn)行不同分組并且使這些組經(jīng)受不同的音頻編碼原理而適于對(duì)音頻內(nèi)容進(jìn)行不同編碼。更甚者,這些音頻編解碼器中的一些允許將擴(kuò)展數(shù)據(jù)插入比特流中,以適應(yīng)音頻編解碼器的未來擴(kuò)展/發(fā)展。
[0003]這種音頻編解碼器的一個(gè)示例為如在IS0/IEC⑶23003-3中定義的USAC編解碼器。命名為“Information Technology-MPEG Audio Techno1gies~Part3:Unified Speechand Audio Coding”的該標(biāo)準(zhǔn)詳細(xì)地描述了對(duì)關(guān)于統(tǒng)一語音與音頻編碼的提議征求的參考模型的功能塊。
[0004]圖5a和圖5b例示編碼器和解碼器的框圖。在下文中,簡(jiǎn)明地說明各個(gè)塊的大體功能。因此,關(guān)于圖6來說明將全部所得語法部分一起放在比特流中的問題。
[0005]圖5a和圖5b例不編碼器和解碼器的框圖。USAC編碼器和解碼器的框圖反映出MPEG-D USAC編碼的結(jié)構(gòu)??梢韵襁@樣來描述大體結(jié)構(gòu):首先,存在包括MPEG環(huán)繞(MPEGS)功能單元和增強(qiáng)型SBR (eSBR)單元的公共預(yù)/后-處理,該MPEGS功能單元處置立體聲或多通道處理,以及該eSBR單元處置輸入信號(hào)中的較高音頻頻率的參數(shù)表示。然后,存在二個(gè)分支,一個(gè)分支包括改進(jìn)的高級(jí)音頻編碼(AAC)工具路徑,而另一分支包括基于線性預(yù)測(cè)編碼(LP或LPC域)的路徑,該另一分支轉(zhuǎn)而以LPC殘差的頻域表示或時(shí)域表示為特征。用于AAC和LPC 二者的所有傳輸頻譜在量化與算術(shù)編碼后以MDCT域表示。時(shí)域表示使用ACELP激勵(lì)編碼方案。
[0006]在圖5a和圖5b中示出MPEG-D USAC的基本結(jié)構(gòu)。在該圖中的數(shù)據(jù)流為從左至右、從上到下。解碼器功能為找出比特流有效載荷中的量化音頻頻譜或時(shí)域表示的描述,并且對(duì)所量化的值和其它重建信息進(jìn)行解碼。
[0007]在傳輸頻譜信息的情況下,解碼器將重建量化頻譜,通過在比特流有效載荷中起作用的任意工具來處理所重建的頻譜以達(dá)到如由輸入比特流有效載荷描述的實(shí)際信號(hào)頻譜,以及最后將頻域頻譜轉(zhuǎn)換到時(shí)域。在頻譜重建的初始重建和定標(biāo)后,存在修改頻譜中的一個(gè)或更多個(gè)頻譜以提供更高效編碼的可選擇工具。
[0008]在傳輸時(shí)域信號(hào)表示的情況下,解碼器將重建量化的時(shí)間信號(hào),通過在比特流有效載荷中起作用的任意工具來處理重建的時(shí)間信號(hào)以達(dá)到如由輸入比特流有效載荷描述的實(shí)際時(shí)域信號(hào)。
[0009]對(duì)于對(duì)信號(hào)數(shù)據(jù)進(jìn)行操作的可選擇工具中的每一個(gè),保留“通過”的選項(xiàng),并且在略去處理的所有情況下,在其輸入的頻譜或時(shí)間樣本在不進(jìn)行修改的情況下直接通過工具。
[0010]在比特流將其信號(hào)表示從時(shí)域改變?yōu)轭l域表示或從LP域改變?yōu)榉荓P域的情況下,反之亦然,解碼器將借助于適當(dāng)?shù)霓D(zhuǎn)換重疊-相加加窗法來幫助從一個(gè)域至另一個(gè)域的轉(zhuǎn)換。
[0011]在轉(zhuǎn)換處置之后,以相同的方式將eSBR和MPEGS處理施加至兩條編碼路徑。
[0012]比特流有效載荷解復(fù)用器工具的輸入為MPEG-D USAC比特流有效載荷。解復(fù)用器將比特流有效載荷分為對(duì)于每個(gè)工具的部分,并且向工具中的每個(gè)工具提供與該工具有關(guān)的比特流有效載荷信息。
[0013]來自比特流有效載荷解復(fù)用器工具的輸出為:
[0014]?取決于當(dāng)前幀中的核心編碼類型,為:
[0015]〇由以下內(nèi)容表示的經(jīng)量化且無噪聲地進(jìn)行編碼的頻譜
[0016]〇定標(biāo)因子信息
[0017]〇算術(shù)編碼的頻譜線
[0018]?或?yàn)?線性預(yù)測(cè)(LP)參數(shù)連同由以下中的任一者表示的激勵(lì)信號(hào):
[0019]〇經(jīng)量化且算術(shù)編碼的頻譜線(變換編碼激勵(lì),TCX)或
[0020]O ACELP編碼時(shí)域激勵(lì)
[0021 ].頻譜噪聲填充信息(可選擇)
[0022].Μ/S決策信息(可選擇)
[0023]?時(shí)間性噪聲整形(TNS)信息(可選擇)
[0024]?濾波器組控制信息
[0025]?時(shí)間展開(TW)控制信息(可選擇)
[0026]?增強(qiáng)型頻譜帶寬復(fù)制(eSBR)控制信息(可選擇)
[0027].MPEG 環(huán)繞(MPEGS)控制信息。
[0028]定標(biāo)因子無噪聲解碼工具從比特流有效載荷解復(fù)用器取得信息、解析該信息以及對(duì)霍夫曼和DPCM編碼定標(biāo)因子進(jìn)行解碼。
[0029]定標(biāo)因子無噪聲解碼工具的輸入為:
[0030]?用于無噪聲編碼頻譜的定標(biāo)因子信息
[0031]定標(biāo)因子無噪聲解碼工具的輸出為:
[0032]?定標(biāo)因子的解碼整數(shù)表示。
[0033]頻譜無噪聲解碼工具從比特流有效載荷解復(fù)用器取得信息、解析該信息、對(duì)算術(shù)編碼數(shù)據(jù)進(jìn)行解碼以及重建量化的頻譜。該無噪聲解碼工具的輸入為:
[0034]?無噪聲編碼頻譜
[0035]該無噪聲解碼工具的輸出為:
[0036]?頻譜的量化值。
[0037]逆量化器工具取得頻譜的量化值,并且將整數(shù)值轉(zhuǎn)換成未定標(biāo)的重建頻譜。該量化器為伸縮量化器,其伸縮因子取決于選擇的核心編碼模式。
[0038]逆量化器工具的輸入為: [0039]?用于頻譜的量化值
[0040]逆量化器工具的輸出為:[0041]?未定標(biāo)的逆量化頻譜
[0042]噪聲填充工具被用于填充解碼的頻譜中的頻譜間隙,該頻譜間隙例如由于編碼器中對(duì)位需求的嚴(yán)格限制而在頻譜值被量化為零時(shí)出現(xiàn)。噪聲填充工具的使用是可選擇的。
[0043]噪聲填充工具的輸入為:
[0044]?未定標(biāo)的逆量化頻譜
[0045]?噪聲填充參數(shù)
[0046]?定標(biāo)因子的經(jīng)解碼的整數(shù)表示
[0047]噪聲填充工具的輸出為:
[0048]?對(duì)于先前被量化為零的頻譜線的未定標(biāo)的逆量化頻譜值
[0049]?定標(biāo)因子的經(jīng)修改的整數(shù)表示
[0050]重新定標(biāo)工具將定標(biāo)因子的整數(shù)表示轉(zhuǎn)換成實(shí)際值,并且用相關(guān)的定標(biāo)因子乘以未定標(biāo)的逆量化頻譜。
[0051]定標(biāo)因子工具的輸入為:
[0052]?定標(biāo)因子的經(jīng)解碼的整數(shù)表示
[0053]?未定標(biāo)的逆量化頻譜
[0054]來自定標(biāo)因子工具的輸出為:`[0055]?經(jīng)定標(biāo)的逆量化頻譜
[0056]有關(guān)Μ/S 工具的概述,請(qǐng)參考 IS0/IEC14496-3:2009, 4.1.1.2。
[0057]有關(guān)時(shí)間性噪聲整形(TNS)工具的概述,請(qǐng)參考IS0/IEC14496-3:2009,4.1.1.2。
[0058]濾波器組/塊交換工具施加在編碼器中執(zhí)行的頻率映射的逆。逆改進(jìn)型離散余弦變換(IMDCT )用于濾波器組工具。MDCT可以被配置為支持120、128、240、256、480、512、960或1024頻譜系數(shù)。
[0059]濾波器組工具的輸入為:
[0060].(逆量化)頻譜
[0061]?濾波器組控制信息
[0062]來自濾波器組工具的輸出為:
[0063]?時(shí)域重建音頻信號(hào)
[0064]當(dāng)使能時(shí)間扭曲模式時(shí),時(shí)間扭曲式濾波器組/塊交換工具替換普通濾波器組/塊交換工具。濾波器組與普通濾波器組相同(IMDCT),另外地,加窗時(shí)域樣本通過時(shí)間改變重新采樣而從扭曲的時(shí)域映射至線性時(shí)域。
[0065]時(shí)間扭曲式濾波器組工具的輸入為:
[0066]?逆量化頻譜
[0067]?濾波器組控制信息
[0068]?時(shí)間扭曲控制信息
[0069]來自濾波器組工具的輸出為:
[0070]?線性時(shí)域重建音頻信號(hào)。
[0071]增強(qiáng)型SBR (eSBR)工具重新生成音頻信號(hào)的高頻帶。其基于在編碼期間截?cái)嗟闹C波序列的復(fù)制。其調(diào)整所生成的高頻帶的頻譜包絡(luò)并且施加逆向?yàn)V波,以及將噪聲和正弦分量相加以重新創(chuàng)建原始信號(hào)的頻譜特性。[0072]eSBR工具的輸入為:
[0073]?量化的包絡(luò)數(shù)據(jù)
[0074]?其它控制數(shù)據(jù)
[0075]?來自頻域核心解碼器或ACELP/TCX核心解碼器的時(shí)域信號(hào)eSBR工具的輸出為:
[0076]?時(shí)域信號(hào),或
[0077]?例如,在使用MPEG環(huán)繞工具的情況下,信號(hào)的QMF域表示。
[0078]MPEG環(huán)繞(MPEGS)工具通過向由適當(dāng)空間參數(shù)控制的輸入信號(hào)應(yīng)用復(fù)雜的上混程序而從一個(gè)或更多個(gè)輸入信號(hào)生成多個(gè)信號(hào)。在USAC背景下,MPEGS通過對(duì)與所傳輸?shù)南禄煨盘?hào)并存的參數(shù)邊信息進(jìn)行傳輸而用于對(duì)多通道信號(hào)進(jìn)行編碼。
[0079]MPEGS工具的輸入為:
[0080]?下混的時(shí)域信號(hào),或
[0081]?來自eSBR工具的下混信號(hào)的QMF域表示
[0082]MPEGS工具的輸出為:
[0083]?多通道時(shí)域信號(hào)
[0084]信號(hào)分類器工具分析原始輸入信號(hào),并且根據(jù)其來生成觸發(fā)不同編碼模式的選擇的控制信息。輸入信號(hào)的分析是與實(shí)現(xiàn)有關(guān)的,并且將試圖選擇用于給定輸入信號(hào)幀的最佳核心編碼模式。信號(hào)分類器的輸出(可選擇地)還可以用于影響其它工具(例如MPEG環(huán)繞、增強(qiáng)型SBR、時(shí)間扭曲式濾波器組以及其它)的行為。
[0085]信號(hào)分類器工具的輸入為:
[0086]?原始的未修改輸入信號(hào)
[0087]?另外的依賴于實(shí)現(xiàn)的參數(shù)
[0088]信號(hào)分類器工具的輸出為:
[0089]?控制核心編解碼器的選擇(非LP濾波的頻域編碼、LP濾波的頻域編碼、或LP濾波的時(shí)域編碼)的控制信號(hào)。
[0090]ACELP工具通過將長(zhǎng)期預(yù)測(cè)器(適應(yīng)性碼字)與脈沖樣序列(創(chuàng)新碼字)組合來提供高效地表示時(shí)域激勵(lì)信號(hào)的方式。重建的激勵(lì)通過LP合成濾波器進(jìn)行發(fā)送以形成時(shí)域信號(hào)。
[0091]ACELP工具的輸入為:
[0092]?適應(yīng)性及創(chuàng)新碼本索引
[0093]?適應(yīng)性及創(chuàng)新代碼增益值
[0094]?其它控制數(shù)據(jù)
[0095]?逆量化且內(nèi)插的LPC濾波器系數(shù)
[0096]ACELP工具的輸出為:
[0097]? 時(shí)域重建的音頻信號(hào)
[0098]基于MDCT的TCX解碼工具用于將經(jīng)加權(quán)的LP殘差表示從MDCT域變換回時(shí)域信號(hào),并且輸出包括經(jīng)加權(quán)的LP合成濾波的時(shí)域信號(hào)。MDCT可以被配置支持256、512或1024頻譜系數(shù)。
[0099]TCX工具的輸入為:[0100].(逆量化)MDCT頻譜
[0101]?逆量化且內(nèi)插的LPC濾波器系數(shù)
[0102]TCX工具的輸出為:
[0103]?時(shí)域重建音頻信號(hào)
[0104]在IS0/IEC⑶23003-3 (其通過引用并入本文)中公開的技術(shù)允許如下定義:例如作為單個(gè)通道元素的通道元素僅包含用于單個(gè)通道的有效載荷,或者作為通道對(duì)元素的通道元素包括用于兩個(gè)通道的有效載荷,或者作為L(zhǎng)FE (低頻增強(qiáng)型)通道元素的通道元素包括用于LFE通道的有效載荷。
[0105]自然地,USAC編解碼器并非是能夠經(jīng)由一個(gè)比特流來對(duì)關(guān)于多于一個(gè)或二個(gè)音頻通道或音頻對(duì)象的較為復(fù)雜的音頻編解碼的信息進(jìn)行編碼和傳送的唯一編解碼器。因此,USAC編解碼器僅用作具體示例。
[0106]圖6示出在一個(gè)公共場(chǎng)景中分別描繪的編碼器和解碼器兩者的較一般的示例,其中編碼器將音頻內(nèi)容10編碼成比特流12,解碼器從該比特流12來解碼音頻內(nèi)容或其至少一部分。解碼的結(jié)果即重建在14處表示。如圖6所示,音頻內(nèi)容10可以由多個(gè)音頻信號(hào)16構(gòu)成。例如,音頻內(nèi)容10可以是由多個(gè)音頻通道16構(gòu)成的空間音頻場(chǎng)景??商娲?,音頻內(nèi)容10可以表示音頻信號(hào)16的聚集,其中音頻信號(hào)16單獨(dú)地和/或成組地表示可以任憑解碼器的使用者的處理而被一起放到音頻場(chǎng)景中的各個(gè)音頻對(duì)象,使得獲得例如用于特定揚(yáng)聲器配置的空間音頻場(chǎng)景形式的音頻內(nèi)容10的重建14。編碼器以連續(xù)時(shí)間周期為單位對(duì)音頻內(nèi)容10進(jìn)行編碼。這種時(shí)間周期在圖6中的18處示意性示出。編碼器使用相同的方式對(duì)音頻內(nèi)容10的連續(xù)周期18進(jìn)行編碼:也就是說,編碼器每時(shí)間周期18將一個(gè)幀20插入比特流12中。這樣做,編碼器將相應(yīng)時(shí)間周期18內(nèi)的音頻內(nèi)容分解成幀元素,其數(shù)目和意義/類型對(duì)于每個(gè)時(shí)間周期18和幀20是分別相同的。關(guān)于上面概述的USAC編解碼器,例如,編碼器將在每個(gè)時(shí)間`周期18內(nèi)的同一對(duì)音頻信號(hào)16編碼成幀20的元素22的通道對(duì)元素,而使用另一編碼原理諸如單通道編碼用于另一音頻信號(hào)16,以獲得單個(gè)通道元素22等。對(duì)用于從如由一個(gè)或更多個(gè)幀元素22定義的下混音頻信號(hào)中獲得音頻信號(hào)的上混的參數(shù)邊信息進(jìn)行采集,以在幀20內(nèi)形成另一幀元素。在此情況下,傳遞該邊信息的幀元素與其它幀元素有關(guān)或形成用于其它幀元素的一種擴(kuò)展數(shù)據(jù)。自然地,這種擴(kuò)展并不限于多通道或多對(duì)象邊信息。
[0107]一種可能性為在每個(gè)幀元素22內(nèi)指出相應(yīng)幀元素為何種類型。有利地,這種程序使得能夠處理比特流語法的未來擴(kuò)展。不能處理某些幀元素類型的解碼器將簡(jiǎn)單地通過利用這些幀元素內(nèi)部的相應(yīng)長(zhǎng)度信息來跳過比特流內(nèi)的相應(yīng)幀元素。此外,可以允許符合標(biāo)準(zhǔn)的不同類型解碼器:一些解碼器能夠理解第一類型集合,而其它解碼器理解并可以處理另一類型集合;可替代的元素類型將簡(jiǎn)單地被各個(gè)解碼器忽略。另外,編碼器將能夠根據(jù)其裁量來對(duì)幀元素進(jìn)行排序,使得可以以例如最小化解碼器內(nèi)的緩沖需求的次序向能夠處理這種另外的幀元素的解碼器給送幀20內(nèi)的幀元素。然而,不利的是,比特流將必須傳遞每個(gè)幀元素的幀元素類型信息,其必要性轉(zhuǎn)而在一方面對(duì)比特流12的壓縮率造成負(fù)面影響,并且在另一方面對(duì)解碼復(fù)雜度造成負(fù)面影響,原因是在每個(gè)幀元素內(nèi)出現(xiàn)用于檢查相應(yīng)幀元素類型信息的解析開銷。
[0108]自然地,可能以另外的方式確定幀元素22間的次序,如按照慣例,但由于例如未來擴(kuò)展幀元素的特定性質(zhì)需要或建議例如幀元素間的不同次序,這種程序防止編碼器具有重排幀元素的自由度。
[0109]因此,分別存在對(duì)比特流、編碼器以及解碼器的另一構(gòu)思的需求。

【發(fā)明內(nèi)容】

[0110]因此,本發(fā)明的目的在于提供解決上述問題并且允許獲得幀元素定位的更有效方式的比特流、編碼器以及解碼器。
[0111]此目的由正在審查中的獨(dú)立權(quán)利要求的主題事物實(shí)現(xiàn)。
[0112]本發(fā)明基于發(fā)現(xiàn)可以在如下情況下在一方面實(shí)現(xiàn)過高的比特流與解碼開銷之間的較好折衷并且可以在另一方面實(shí)現(xiàn)幀元素定位的靈活性的:比特流的幀序列中的每個(gè)幀包括N個(gè)幀元素的序列,并且另一方面,該比特流包括配置塊,該配置塊包括指示元素?cái)?shù)目N的字段以及類型指示語法部分,該類型指示語法部分針對(duì)N個(gè)元素位置的序列中的每個(gè)元素位置指示多個(gè)元素類型中的元素類型,其中在幀的N個(gè)幀元素的序列中,每個(gè)幀元素具有由類型指示部分針對(duì)相應(yīng)元素位置的元素類型,在該相應(yīng)元素位置處,相應(yīng)幀元素定位在比特流中的相應(yīng)幀的N個(gè)幀元素的序列內(nèi)。因而,幀被相同地結(jié)構(gòu)造為每個(gè)幀包括由類型指示語法部分指示的幀元素類型的N個(gè)幀元素的相同序列,其以相同的連續(xù)次序定位在比特流內(nèi)。通過使用對(duì)于N個(gè)元素位置的序列中的每個(gè)元素位置指示多個(gè)元素類型中的元素類型的類型指示語法部分,通常能夠?qū)τ趲蛄袑?duì)該連續(xù)次序進(jìn)行調(diào)整。
[0113]通過該措施,幀元素類型可以以任何次序進(jìn)行排列,諸如根據(jù)編碼器的裁量,使得選擇例如最適于所使用的幀元素類型的次序。
[0114]多個(gè)幀元素類型可以例如包括擴(kuò)展元素類型,其中擴(kuò)展元素類型的幀元素包括關(guān)于相應(yīng)幀元素的長(zhǎng)度的長(zhǎng)度信息,使得不支持特定擴(kuò)展元素類型的解碼器能夠使用該長(zhǎng)度信息作為跳過區(qū)間長(zhǎng)度來跳過擴(kuò)展元素類型的這些幀元素。另一方面,能夠處置擴(kuò)展元素類型的這些幀元素的解碼器相應(yīng)地處理其內(nèi)容或有效載荷部分,并且因?yàn)榫幋a器能夠?qū)U(kuò)展元素類型的這些幀元素自由地定位在幀的幀元素序列內(nèi),所以通過適當(dāng)?shù)剡x擇幀元素類型次序并且在類型指示語法部分內(nèi)傳達(dá)該次序,可以將在解碼器處的緩沖開銷最小化。
[0115]本發(fā)明實(shí)施例的有利實(shí)現(xiàn)是從屬權(quán)利要求的主題。
【專利附圖】

【附圖說明】
[0116]此外,下面將參照附圖來描述本申請(qǐng)的優(yōu)選實(shí)施例,在附圖中:
[0117]圖1示出根據(jù)實(shí)施例的編碼器及其輸入和輸出的示意性框圖;
[0118]圖2示出根據(jù)實(shí)施例的解碼器及其輸入和輸出的示意性框圖;
[0119]圖3示意地示出根據(jù)實(shí)施例的比特流;
[0120]圖4a至圖4z以及圖4za至圖4zc示出根據(jù)實(shí)施例的例示比特流的具體語法的偽代碼的表;
[0121]圖5a和圖5b示出USAC編碼器和解碼器的框圖;以及
[0122]圖6示出典型的一對(duì)編碼器和解碼器。
【具體實(shí)施方式】[0123]圖1示出根據(jù)實(shí)施例的編碼器24。編碼器24用于將音頻內(nèi)容10編碼為比特流12。
[0124]如在本申請(qǐng)的說明書的引言部分所述的,音頻內(nèi)容10可以是若干音頻信號(hào)16的聚集。音頻信號(hào)16表示例如空間音頻場(chǎng)景的各個(gè)音頻通道??商娲?,音頻信號(hào)16形成一起定義音頻場(chǎng)景的音頻對(duì)象集合中的音頻對(duì)象以在解碼側(cè)自由混合。如在26處所示的,音頻信號(hào)16被以公共時(shí)間基準(zhǔn)t定義。也就是說,音頻信號(hào)16可以與相同的時(shí)間區(qū)間有關(guān),并且可以因此相對(duì)于彼此時(shí)間對(duì)齊。
[0125]編碼器24被配置為將音頻內(nèi)容10的連續(xù)時(shí)間周期18編碼成幀20的序列,使得每個(gè)幀20表示音頻內(nèi)容10的時(shí)間周期18中的相應(yīng)時(shí)間周期。在某種意義上,編碼器24被配置為以相同方式對(duì)每個(gè)時(shí)間周期進(jìn)行編碼,使得每個(gè)幀20包括元素?cái)?shù)目為N的幀元素的序列。在每個(gè)幀20內(nèi),適用的是每個(gè)幀元素22是多個(gè)元素類型中的相應(yīng)一種類型,并且定位在某一元素位置處的幀元素22具有相同或相等的元素類型。也就是說,在幀20中的第一幀元素22具有相同的元素類型并且形成幀元素的第一序列(或子流);所有幀20中的第二幀元素22具有彼此相等的元素類型并且形成幀元素的第二序列,以此類推。
[0126]根據(jù)實(shí)施例,例如,編碼器24被配置為使得多個(gè)元素類型包括以下:
[0127]a)例如單個(gè)通道元素類型的幀元素可以由編碼器24生成以表示一個(gè)單個(gè)音頻信號(hào)。因此,在幀20內(nèi)的某一元素位置處的幀元素22的序列(例如,因此形成幀元素的第i個(gè)子流的第i個(gè)元素幀(其中0>i>N+l))將一起表示這種單個(gè)音頻信號(hào)的連續(xù)時(shí)間周期18。如此表不的音頻信號(hào)可以直接與音頻內(nèi)容10的音頻信號(hào)16中的任何一個(gè)相對(duì)應(yīng)。然而,可替代的是如將在下面更詳細(xì)地描述的,這樣表示的音頻信號(hào)可以是下混信號(hào)中的一個(gè)通道,其連同定位在幀20內(nèi)的另一元素位置處的另一幀元素類型的幀元素的有效載荷數(shù)據(jù)來生成音頻內(nèi)容10的多個(gè)音頻信號(hào)16,該音頻信號(hào)16的數(shù)目高于剛才提及的下混信號(hào)的通道的數(shù)目。在下面更詳細(xì)地描述的實(shí)施例的情況下,這種單個(gè)通道元素類型的幀元素被表不為UsacSingleChannelElement(Usac單個(gè)通道兀素)。在MPEG環(huán)繞和SAOC的情況下,例如僅存在單個(gè)下混信號(hào),其可以是單聲、立體聲或在MPEG環(huán)繞的情況下甚至為多通道。在多通道的情況下,例如5.1下混包括兩個(gè)通道對(duì)元素和一個(gè)單個(gè)通道元素。在此情況下,單個(gè)通道元素以及兩個(gè)通道對(duì)元素僅是下混信號(hào)的一部分。在立體聲下混的情況下,將使用通道對(duì)元素。
[0128]b)通道對(duì)元素類型的幀元素可以由編碼器24生成以表示立體聲音頻信號(hào)對(duì)。也就是說,定位在幀20內(nèi)的公共元素位置處的此類型幀元素22將一起形成幀元素的相應(yīng)子流,其表示這樣的立體聲音頻對(duì)的連續(xù)時(shí)間周期18。如此表示的立體聲音頻信號(hào)對(duì)可以直接為音頻內(nèi)容10的任一對(duì)音頻信號(hào)16,或者可以表示例如如下下混信號(hào):其連同定位在另一元素位置處的另一元素類型的幀元素的有效載荷數(shù)據(jù)生成音頻內(nèi)容10的音頻信號(hào)16,該音頻信號(hào)16的數(shù)目高于2。在下面更詳細(xì)地描述的實(shí)施例中,這種通道對(duì)元素類型的幀兀素被表不為UsacChannelPairElement (Usac通道對(duì)兀素)。
[0129]c)為了傳輸關(guān)于音頻內(nèi)容10的需要較少帶寬的音頻信號(hào)16 (如超低音通道等)的信息,編碼器24可以以如下類型的幀元素來支持特定類型的幀元素:該類型的幀元素被定位在公共元素位置處,表示例如單個(gè)音頻信號(hào)的連續(xù)時(shí)間周期18。該音頻信號(hào)可以直接是音頻內(nèi)容10的音頻信號(hào)16中的任何之一,或者可以是如之前關(guān)于單個(gè)通道元素類型和通道對(duì)元素類型所描述的下混信號(hào)的一部分。在下面更詳細(xì)地描述的實(shí)施例中,這種特定中貞元素類型的巾貞元素被表示為UsacLfeElement。
[0130]d)擴(kuò)展元素類型的幀元素可以由編碼器24生成,以連同比特流來傳送邊信息,使得解碼器能夠?qū)τ深愋蚢、b和/或c中的任何類型的幀元素表示的音頻信號(hào)中的任何音頻信號(hào)進(jìn)行上混,以獲得更高數(shù)目的音頻信號(hào)。定位在幀20內(nèi)的某一公共元素位置處的這種擴(kuò)展元素類型的幀元素將因此傳送與連續(xù)時(shí)間周期18有關(guān)的邊信息,使得能夠?qū)τ善渌鼛刂械娜魏螏乇硎镜囊粋€(gè)或更多個(gè)音頻信號(hào)的相應(yīng)時(shí)間周期進(jìn)行上混,以獲得具有更高音頻信號(hào)數(shù)目的相應(yīng)時(shí)間周期,其中后者可以與音頻內(nèi)容10的原始音頻信號(hào)16相對(duì)應(yīng)。這種邊信息的示例可以例如為參數(shù)邊信息,諸如例如MPS或SAOC邊信息。
[0131]根據(jù)在下面詳細(xì)描述的實(shí)施例,可用的元素類型僅包括上面概述的四種元素類型,但其它元素類型也是可用的。另一方面,元素類型a至c中僅一種或二種是可用的。
[0132]如根據(jù)上面的討論變清楚的,從比特流12略去擴(kuò)展元素類型的幀元素22或在解碼中忽略這些幀元素不會(huì)完全使音頻內(nèi)容10的重建不可能:至少其它元素類型的剩余幀元素傳送足夠的信息來生成音頻信號(hào)。這些音頻信號(hào)不一定與音頻內(nèi)容10的原始音頻信號(hào)或其適當(dāng)子集相對(duì)應(yīng),但可以表示音頻內(nèi)容10的一種“結(jié)合體”。也就是說,擴(kuò)展元素類型的幀元素可以傳送如下信息(有效載荷數(shù)據(jù)):該信息表示關(guān)于定位在幀20內(nèi)的不同元素位置處的一個(gè)或更多個(gè)巾貞元素的邊信息。
[0133]然而,下面描述的實(shí)施例中,擴(kuò)展元素類型的幀元素并不限于這種邊信息傳送。更確切地,擴(kuò)展元素類型的幀元素在下文中被表示為UsacExtElement (Usac擴(kuò)展元素),并且被定義為傳送有效載荷數(shù)據(jù)連同長(zhǎng)度信息,其中該長(zhǎng)度信息使得解碼器能夠接收比特流12,以在例如解碼器無法處理這些幀元素內(nèi)的相應(yīng)有效載荷數(shù)據(jù)的情況下跳過擴(kuò)展元素類型的這些幀元素。這將在下面更詳細(xì)地描述。
[0134]然而,在繼續(xù)描述圖1的編碼器之前,應(yīng)當(dāng)注意存在有對(duì)于上述元素類型的替代方案的若干可能性。對(duì)于上述擴(kuò)展元素類型尤為如此。具體地,在擴(kuò)展元素類型被配置為使得其有效載荷數(shù)據(jù)能夠被例如無法處理相應(yīng)有效載荷數(shù)據(jù)的解碼器跳過的情況下,這些擴(kuò)展元素類型幀元素的有效載荷數(shù)據(jù)可以是任何有效載荷數(shù)據(jù)類型。例如,該有效載荷數(shù)據(jù)可以形成關(guān)于其它幀元素類型的其它幀元素的有效載荷數(shù)據(jù)的邊信息,或者可以形成表示另一音頻信號(hào)的自包含有效載荷數(shù)據(jù)。此外,即使在擴(kuò)展元素類型幀元素的有效載荷數(shù)據(jù)表示其它幀元素類型的幀元素的有效載荷數(shù)據(jù)的邊信息的情況下,這些擴(kuò)展元素類型幀元素的有效載荷數(shù)據(jù)不限于剛才描述的種類,即多通道邊信息或多對(duì)象邊信息。多通道邊信息有效載荷例如將由其它元素類型的幀元素中的任何幀元素表示的下混信號(hào)伴隨空間線索諸如雙耳線索編碼(BCC)參數(shù)(諸如通道間相干值(ICC)、通道間電平差(ICLD)和/或通道間時(shí)間差(ICTD)),以及可選擇的通道預(yù)測(cè)系數(shù),所述參數(shù)根據(jù)例如MPEG環(huán)繞標(biāo)準(zhǔn)在本領(lǐng)域中是已知的。剛才提及的空間線索參數(shù)可以例如以時(shí)間/頻率分辨率(即時(shí)間/頻率網(wǎng)格的每個(gè)時(shí)間/頻率片一個(gè)參數(shù))在擴(kuò)展元素類型幀元素的有效載荷數(shù)據(jù)內(nèi)傳輸。在多對(duì)象邊信息的情況下,擴(kuò)展元素類型幀元素的有效載荷數(shù)據(jù)可以包括相似的信息,諸如對(duì)象間交叉關(guān)聯(lián)(IOC)參數(shù)、對(duì)象電平差(OLD)以及展現(xiàn)原始音頻信號(hào)已經(jīng)如何被下混到由另一元素類型的幀元素中的任何幀元素表示的下混信號(hào)的通道中的下混參數(shù)。該下混參數(shù)例如根據(jù)SAOC標(biāo)準(zhǔn)在本領(lǐng)域中是已知的。然而,擴(kuò)展元素類型幀元素的有效載荷數(shù)據(jù)可以表示的不同邊信息的示例為例如SBR數(shù)據(jù),其用于對(duì)由定位在幀20內(nèi)的不同元素位置處的其它幀元素類型的幀元素中的任何幀元素表示的音頻信號(hào)的高頻部分的包絡(luò)進(jìn)行參數(shù)編碼,并且用于例如通過使用從作為高頻部分的基礎(chǔ)的上述音頻信號(hào)所獲得的低頻部分而使得能夠進(jìn)行頻帶復(fù)制,然后形成通過SBR數(shù)據(jù)的包絡(luò)如此獲得的高頻部分的包絡(luò)。更一般地,擴(kuò)展元素類型的幀元素的有效載荷數(shù)據(jù)可以傳送邊信息,以用于在時(shí)域中或頻域中修改由定位在幀20內(nèi)的不同元素位置處的其它元素類型中的任何類型的幀元素表示的音頻信號(hào),其中頻域可以例如是QMF域或某其它濾波器組域或變換域。
[0135]進(jìn)一步繼續(xù)描述圖1的編碼器24的功能,編碼器24被配置為將配置塊28編碼到比特流12中,該配置塊28包括指示元素的數(shù)目N的字段以及類型指示語法部分,該類型指示語法部分對(duì)于N個(gè)元素位置的序列中的每個(gè)元素位置來指示相應(yīng)元素類型。因此,編碼器24被配置為對(duì)于每個(gè)幀20將N個(gè)幀元素22的序列編碼到比特流12中,使得N個(gè)幀元素22的序列中的定位在比特流12的N個(gè)幀元素22的序列內(nèi)的相應(yīng)元素位置處的每個(gè)幀元素22的元素類型由類型指示部分針對(duì)相應(yīng)元素位置指示。換言之,編碼器24形成N個(gè)子流,N個(gè)子流中的每個(gè)子流為相應(yīng)元素類型的幀元素22的序列。也就是說,對(duì)于所有的這些N個(gè)子流,幀元素22具有相等的元素類型,而不同子流的幀元素可以具有不同的元素類型。編碼器24被配置為通過將關(guān)于一個(gè)公共時(shí)間周期18的這些子流的所有N個(gè)幀元素進(jìn)行連結(jié)以形成一個(gè)幀20而將所有這些幀元素復(fù)用到比特流12中。因此,在比特流12中,這些幀元素22在幀20中進(jìn)行排列。在每個(gè)幀20內(nèi),N個(gè)子流一即關(guān)于相同時(shí)間周期18的N個(gè)幀元素——的表示被以靜態(tài)連續(xù)次序進(jìn)行排列,該靜態(tài)連續(xù)次序分別由元素位置順序和配置塊28中的類型指示語法部分定義。
[0136]利用類型指示語法部分,編碼器24能夠自由地選擇次序,N個(gè)子流的幀元素22使用該次序在幀20內(nèi)進(jìn)行排列。通過該措施,編碼器24能夠例如將解碼側(cè)的緩沖開銷保持為盡可能低。例如,傳送另一子流(基本子流)的幀元素(其為非擴(kuò)展元素類型)的邊信息的擴(kuò)展元素類型的幀元素的子流可以被定位在幀20內(nèi)的如下元素位置:其在這些基本子流幀元素在幀20中所位于的元素位置的緊后方。通過該措施,解碼側(cè)必須緩沖基本子流的解碼的結(jié)果或中間結(jié)果以將邊信息施加于該結(jié)果或中間結(jié)果上的緩沖時(shí)間被保持為低,并且可以減小緩沖開銷。在子流的幀元素(其為擴(kuò)展元素類型)的有效載荷數(shù)據(jù)的邊信息被施加至由幀元素22的另一子流(基本子流)表示的音頻信號(hào)的中間結(jié)果(諸如頻域)的情況下,擴(kuò)展元素類型幀元素22的子流緊跟隨基本子流的定位不僅最小化緩沖開銷,而且將解碼器可能必須中斷所表示的音頻信號(hào)的重建的進(jìn)一步處理的持續(xù)時(shí)間最小化,原因在于例如擴(kuò)展元素類型幀元素的有效載荷數(shù)據(jù)修改與基本子流的表示有關(guān)的音頻信號(hào)的重建。然而,將依賴性擴(kuò)展子流定位在其表示音頻信號(hào)的基本子流前方也可能是有利的,其中該擴(kuò)展子流參考該基本子流。例如,編碼器24自由地將擴(kuò)展有效載荷的子流在比特流內(nèi)定位在相對(duì)于通道元素類型子流的上游。例如,子流i的擴(kuò)展有效載荷可以傳送動(dòng)態(tài)范圍控制(DRC)數(shù)據(jù),并且例如相對(duì)于在元素位置i+Ι處的通道子流內(nèi)、諸如經(jīng)由頻域(FD)編碼對(duì)相應(yīng)音頻信號(hào)進(jìn)行編碼,在更早的元素位置i之前或在該元素位置i處傳輸自流i的擴(kuò)展有效載荷。然后,當(dāng)對(duì)由非擴(kuò)展類型子流i+Ι表示的音頻信號(hào)進(jìn)行解碼與重建時(shí),解碼器能夠立即使用該DRC。
[0137]目前為止所描述的編碼器24表示本申請(qǐng)的可能實(shí)施例。然而,圖1還示出編碼器的僅被理解為圖示的可能內(nèi)部結(jié)構(gòu)。如圖1所示,編碼器24可以包括分配器30和序列化器32,在分配器30和序列化器32之間以在下面更詳細(xì)地描述的方式連接有多個(gè)編碼模塊34a至34e。具體地,分配器30被配置為接收音頻內(nèi)容10的音頻信號(hào)16,并且將所接收的音頻信號(hào)16分配至各個(gè)編碼模塊34a至34e上。分配器30將音頻信號(hào)16的連續(xù)時(shí)間周期18分配至編碼模塊34a至34e的方式是靜態(tài)的。具體地,分配可以使得每個(gè)音頻信號(hào)16被排他地轉(zhuǎn)發(fā)至編碼模塊34a至34e之一。例如,給送至LFE編碼器34a的音頻信號(hào)被LFE編碼器34a編碼到類型c (參見上文)的幀元素22的子流中。例如,給送至單通道編碼器34b的輸入的音頻信號(hào)被單通道編碼器34b編碼為類型a (參見上文)的幀元素22的子流。類似地,例如,給送至通道對(duì)編碼器34c的輸入的音頻信號(hào)對(duì)被通道對(duì)編碼器34c編碼為類型d (參見上文)的幀元素22的子流。剛才提及的編碼模塊34a至34c以其輸入和輸出連接在一方面的分配器30和另一方面的序列化器32之間。
[0138]然而,如圖1所示,編碼器模塊34a至34e的輸入不僅僅連接至分配器30的輸出接口。更確切地,編碼器模塊34a至34e的輸入可以由編碼模塊34d及34e中的任何編碼模塊的輸出信號(hào)給送。編碼模塊34d和34e是如下編碼模塊的示例:其被配置為將多個(gè)輸入音頻信號(hào)在一方面編碼為較少數(shù)目的下混通道的下混信號(hào),并且在另一方面編碼為類型d (參見上文)的幀元素22的子流。如根據(jù)以上討論所清楚的,編碼模塊34d可以是SAOC編碼器,而編碼模塊34e可以是MPS編碼器。下混信號(hào)被轉(zhuǎn)發(fā)至編碼模塊34b和34c中的任何編碼模塊。由編碼模塊34a至34e生成的子流被轉(zhuǎn)發(fā)至序列化器32,該序列化器32將該子流排序?yàn)槿缟纤龅谋忍亓?2。因此,編碼模塊34d和34e使其用于多個(gè)音頻信號(hào)的輸入連接至分配器30的輸出接口,而使其子流輸出連接至序列化器32的輸入接口,以及使其下混輸出分別連接至編碼模塊34b和/或34c的輸入。
[0139]應(yīng)當(dāng)注意,根據(jù)以上描述,多對(duì)象編碼器34d和多通道編碼器34e的存在僅被選擇用于說明目的,并且例如這些編碼模塊34e和34e中的任何編碼模塊可以被移除或由另一編碼模塊替換。
[0140]在描述編碼器24及其可能的內(nèi)部結(jié)構(gòu)之后,參照?qǐng)D2來描述相應(yīng)的解碼器。圖2的解碼器通常由附圖標(biāo)記36表示,并且具有輸入以接收比特流12,以及具有輸出以用于輸出音頻內(nèi)容10的重建版本38或其結(jié)合體。因此,解碼器36被配置為對(duì)包括圖1所示的配置塊28和幀20的序列的比特流12進(jìn)行解碼,并且通過如下方式對(duì)每個(gè)幀20進(jìn)行解碼:根據(jù)由類型指示部分針對(duì)相應(yīng)元素位置指示的元素類型來解碼幀元素22,在相應(yīng)元素位置處,相應(yīng)幀元素22定位在比特流12中的相應(yīng)幀20的N個(gè)幀元素22的序列內(nèi)。也就是說,解碼器36被配置為依據(jù)每個(gè)幀元素22在當(dāng)前幀20內(nèi)的元素位置而非根據(jù)在幀元素本身內(nèi)的任何信息,將每個(gè)幀元素22分配為可能的元素類型之一。通過該措施,解碼器36獲得N個(gè)子流,第一子流由幀20的第一幀元素22組成,第二子流由幀20內(nèi)的第二幀元素22組成,第三子流由幀20內(nèi)的第三幀元素22組成,以此類推。
[0141]在更詳細(xì)地關(guān)于擴(kuò)展元素類型幀元素來描述解碼器36的功能之前,更詳細(xì)地說明圖2的解碼器36的可能內(nèi)部結(jié)構(gòu),以對(duì)應(yīng)于圖1的編碼器24的內(nèi)部結(jié)構(gòu)。如關(guān)于編碼器24所描述的,內(nèi)部結(jié)構(gòu)被理解為僅作為示例。
[0142]具體地,如圖2所示,解碼器36可以在內(nèi)部包括分配器40和排列器42,在分配器40和排列器42之間連接有解碼模塊44a至44e。每個(gè)解碼模塊44a至44e負(fù)責(zé)對(duì)某一幀元素類型的幀元素22的子流進(jìn)行解碼。因此,分配器40被配置為將比特流12的N個(gè)子流相對(duì)應(yīng)地分配至解碼模塊44a至44e。解碼模塊44a例如為L(zhǎng)FE解碼器,該LFE解碼器對(duì)類型c (參見上文)的幀元素22的子流進(jìn)行解碼以在其輸出獲得窄帶(例如)音頻信號(hào)。類似地,單通道解碼器44b對(duì)類型a (參見上文)的幀元素22的輸入子流進(jìn)行解碼以在其輸出獲得單個(gè)音頻信號(hào),并且通道對(duì)解碼器44c對(duì)類型b (參見上文)的幀元素22的輸入子流進(jìn)行解碼以在其輸出獲得一對(duì)音頻信號(hào)。解碼模塊44a至44c使其輸入和輸出連接在一方面的分配器40的輸出接口與另一方面的排列器42的輸入接口之間。
[0143]解碼器36可以僅具有解碼模塊44a至44c。其它解碼模塊44e和44d負(fù)責(zé)擴(kuò)展元素類型幀元素,并且因此就考慮音頻編解碼器的一致性而言是可選擇的。如果這些擴(kuò)展模塊44e至44d中的二者或任一者不存在,則分配器40被配置為跳過比特流12中的相應(yīng)擴(kuò)展幀元素子流,如在下面更詳細(xì)描述的,并且音頻內(nèi)容10的重建版本38僅為具有音頻信號(hào)16的原始版本的結(jié)合。
[0144]然而,如果存在,即如果解碼器36支持SAOC和/或MPS擴(kuò)展幀元素,則多通道解碼器44e可以被配置為對(duì)由編碼器34e生成的子流進(jìn)行解碼,而多對(duì)象解碼器44d負(fù)責(zé)對(duì)由多對(duì)象編碼器34d生成的子流進(jìn)行解碼。因此,在解碼模塊44e和/或44d存在的情況下,開關(guān)46可以將解碼模塊44c和44b中的任何解碼模塊的輸出與解碼模塊44e和/或44d的下混信號(hào)輸入連接。多通道解碼器44e可以被配置為使用在來自分配器40的輸入子流內(nèi)的邊信息對(duì)輸入下混信號(hào)進(jìn)行上混,以在其輸出獲得增加數(shù)目的音頻信號(hào)。多對(duì)象解碼器44d可以根據(jù)如下差異進(jìn)行動(dòng)作:多對(duì)象解碼器44d將各個(gè)音頻信號(hào)處理為音頻對(duì)象,而多通道解碼器44e在其輸出將音頻信號(hào)處理為音頻通道。
[0145]如此重建的音頻信號(hào)被轉(zhuǎn)發(fā)至對(duì)其進(jìn)行排列的排列器42,以形成重建38。排列器42可以另外由用戶輸入48控制,該用戶輸入48指示例如可用揚(yáng)聲器配置或所允許的重建38的最高通道數(shù)目。取決于用戶輸入48,排列器42可以禁用解碼模塊44a至44e中的任何解碼模塊,例如諸如解碼模塊44d和44e中的任何解碼模塊,即使其存在以及即使擴(kuò)展元素存在于比特流12中也是如此。
[0146]在進(jìn)一步分別描述解碼器、編碼器以及比特流的可能細(xì)節(jié)之前,應(yīng)當(dāng)注意,由于編碼器有能力將作為擴(kuò)展元素類型的子流的幀元素散置在不是擴(kuò)展元素類型的子流的幀元素之間,所以通過編碼器24分別適當(dāng)?shù)剡x擇子流間的次序以及在每個(gè)幀20內(nèi)的子流的幀元素間的次序,可以降低解碼器36的緩沖開銷。例如,假設(shè)進(jìn)入通道對(duì)解碼器44c的子流被置于幀20內(nèi)的第一元素位置處,而用于解碼器44e的多通道子流將被置于每個(gè)幀的端部。在此情況下,解碼器36將必須在如下時(shí)期內(nèi)緩沖表示用于多通道解碼器44e的下混信號(hào)的中間音頻信號(hào):該時(shí)期橋接在分別到達(dá)每個(gè)幀20的第一幀元素和最末幀元素之間的時(shí)間。只有這樣,多通道解碼器44e才能夠開始其處理。通過編碼器24將專用于多通道解碼器44e的子流在例如幀20的第二元素位置處進(jìn)行排列,可以避免該延遲。另一方面,分配器40不需要關(guān)于每個(gè)幀元素與子流中的任何子流的從屬關(guān)系來檢查每個(gè)幀元素。更確切地,分配器40能夠僅根據(jù)配置塊和其中所含的類型指示語法部分來推定當(dāng)前幀20的當(dāng)前幀元素22與N個(gè)子流中的任何子流的從屬關(guān)系。
[0147]現(xiàn)在參照?qǐng)D3,其示出如上所述的包括配置塊28和幀20的序列的比特流12。在觀察圖3時(shí),右方的比特流部分跟隨在左方的其它比特流部分的位置。在圖3的情況下,例如,配置塊28在圖3所示的幀20前方,其中僅用于例示的目的,圖3僅完整地示出3個(gè)幀20。
[0148]此外,應(yīng)當(dāng)注意:配置塊28可以以周期性或間歇性基準(zhǔn)在幀20之間插入到比特流12內(nèi),以允許流式傳輸應(yīng)用中的隨機(jī)存取點(diǎn)。一般而言,配置塊28可以是比特流12的簡(jiǎn)單連接部分。
[0149]如上所述,配置塊28包括字段50,字段50指示元素?cái)?shù)目N,即每個(gè)幀20內(nèi)的幀元素?cái)?shù)目N以及如上所述的復(fù)用到比特流12中的子流數(shù)目。在描述比特流12的具體語法的實(shí)施例的如下實(shí)施例中,在圖4a至圖4z以及圖4za至圖4zc的以下特定語法示例中,字段50被表不為numElements (兀素?cái)?shù)),并且配置塊28被稱為UsacConfig (Usac配置)。此夕卜,配置塊28包括類型指示語法部分52。如上所述,該部分52對(duì)于每個(gè)元素位置來指示多個(gè)元素類型中的元素類型。如圖3所示,并且作為關(guān)于以下特定語法示例的情況,類型指示語法部分52可以包括N個(gè)語法元素54的序列,其中每個(gè)語法元素54指示對(duì)于相應(yīng)語法元素54在類型指示語法部分52內(nèi)定位的相應(yīng)元素位置的元素類型。換言之,部分52內(nèi)的第i個(gè)語法元素54可以分別表示第i個(gè)子流的元素類型和每個(gè)幀20的第i個(gè)幀元素。在隨后的具體語法示例中,語法元素被表示為UsacElementType (Usac元素類型)。雖然類型指示語法部分52可以被包含在比特流12內(nèi)作為比特流12的單連通或連續(xù)部分,但是圖3示例性示出其元素54與分別對(duì)于N個(gè)元素位置中的每個(gè)元素位置而存在的配置塊28的其它語法元素部分交織。在下面概述的實(shí)施例中,該交織語法部分與特定于子流的配置數(shù)據(jù)55有關(guān),其意義在下面更詳細(xì)地描述。
[0150]如上所述,每個(gè)幀20包括N個(gè)幀元素22的序列。這些幀元素22的元素類型不是由幀元素22本身內(nèi)的相應(yīng)類型指示器傳達(dá)。更確切地,幀元素22的元素類型由其在每個(gè)幀20內(nèi)的元素位置定義。圖3中表示為幀元素22a的首先出現(xiàn)在幀20中的幀元素22具有第一元素位置,因而為由配置塊28內(nèi)的語法部分52對(duì)于第一元素位置表示的元素類型。這同樣適用于后面的幀元素22。例如,在比特流12內(nèi)緊跟隨第一幀元素22a出現(xiàn)的幀元素22b,即具有元素位置2的幀元素,具有由類型指示語法部分52表示的元素類型。
[0151]根據(jù)特定實(shí)施例,語法元素54以與其參考的幀元素22相同的次序在比特流12內(nèi)排列。也就是說,第一語法元素54,即在比特流12中首先出現(xiàn)且位于圖3最左端處的元素,表示每個(gè)幀20的首先出現(xiàn)的幀元素22a的元素類型,第二語法元素54表示第二幀元素22b的元素類型,以此類推。自然地,語法元素54在比特流12和語法部分52內(nèi)的連續(xù)次序或排列可以相對(duì)于幀元素22在幀20內(nèi)的連續(xù)次序進(jìn)行交換。盡管較不優(yōu)選,但是其它排列也是可行的。
[0152]對(duì)于解碼器36,這意味著解碼器36可以被配置為從類型指示語法部分52讀取N個(gè)語法元素54的該序列。更精確地,解碼器36讀取字段50,使得解碼器36獲知要從比特流12讀取的語法元素54的數(shù)目N。如剛才所提及的,解碼器36可以被配置為將語法元素和由此表示的元素類型與幀20內(nèi)的幀元素22相關(guān)聯(lián),使得第i個(gè)語法元素54與第i個(gè)幀元素22相關(guān)聯(lián)。
[0153]除以上描述之外,配置塊28可以包括N個(gè)配置元素56的序列55,其中每個(gè)配置元素56包括如下配置信息:其用于對(duì)于相應(yīng)配置元素56在N個(gè)配置元素56的序列55中定位的相應(yīng)元素位置的元素類型。具體地,將配置元素56的序列寫入比特流12中(以及由解碼器36從比特流12讀取)的次序可以是與分別用于幀元素22和/或語法元素54的次序相同的次序。也就是說,在比特流12中首先出現(xiàn)的配置元素56可以包括用于第一幀元素22a的配置信息,第二配置元素56包括用于巾貞元素22b的配置信息,以此類推。如上面已經(jīng)提及的,類型指示語法部分52和特定于元素位置的配置數(shù)據(jù)55在圖3的實(shí)施例中被示為彼此交插,其中關(guān)于元素位置i的配置元素56在比特流12中被定位在用于元素位置i的類型指示器54與元素位置i+Ι之間。甚至換言之,配置元素56和語法元素54在比特流中交替排列,并且由解碼器36從配置元素56和語法元素54交替進(jìn)行讀取,但此數(shù)據(jù)在塊28內(nèi)的比特流12中的其它定位也是可行的,如之前所提及的。
[0154]通過分別傳送用于配置塊28中的每個(gè)元素位置1...N的配置元素56,比特流允許將幀元素不同地配置為分別屬于子流和元素位置,但是為相同的元素類型。例如,比特流12可以包括兩個(gè)單通道子流,并且因此每個(gè)幀20內(nèi)有單個(gè)通道元素類型的二個(gè)幀元素。然而,用于這兩個(gè)子流的配置信息可以在比特流12中不同地進(jìn)行調(diào)整。這轉(zhuǎn)而意味著:使圖1的編碼器24能夠?qū)τ谶@些不同的子流來不同地設(shè)定配置信息內(nèi)的編碼參數(shù);以及解碼器36的單通道解碼器44b在對(duì)這兩個(gè)子流進(jìn)行解碼時(shí)通過使用這些不同的編碼參數(shù)而受控。這對(duì)于其它解碼模塊同樣適用。更一般而言,解碼器36被配置為從配置塊28讀取N個(gè)配置元素56的序列,并且根據(jù)由第i個(gè)語法元素54表示的元素類型以及使用第i個(gè)配置元素56所包括的配置信息來對(duì)第i個(gè)幀元素22進(jìn)行解碼。
[0155]為了說明的目的,假設(shè)在圖3中第二子流,即包括在每個(gè)幀20內(nèi)的第二元素位置處出現(xiàn)的幀元素22b的子流,具有包括擴(kuò)展元素類型的幀元素22b的擴(kuò)展元素類型子流。自然地,這僅是說明性的。
[0156]此外,僅用于說明的目的,比特流或配置塊28在每個(gè)元素位置包括一個(gè)配置元素56,而與由語法部分52對(duì)于該元素位置所表示的元素類型無關(guān)。例如,根據(jù)替代實(shí)施例,可以存在配置塊28未包括其配置元素的一個(gè)或更多個(gè)元素類型,使得在后者情況下,取決于分別在語法部分52和幀20中出現(xiàn)的這種元素類型的幀元素的數(shù)目,配置塊28內(nèi)的配置元素56的數(shù)目可以小于N。
[0157]無論如何,圖3示出用于建立關(guān)于擴(kuò)展元素類型的配置元素56的又一示例。在隨后說明的特定語法實(shí)施例中,這些配置元素56被表示為UsacExtElementConfig (Usac擴(kuò)展元素配置)。僅為了完整性,在隨后說明的特定語法實(shí)施例中要注意,其它元素類型的配置兀素被表不為UsacSingleChannelElementConfig (Usac單個(gè)通道兀素配置)、UsacChannelPairElementConfig (Usac 通道對(duì)兀素配置)以及 UsacLfeElementConfig(UsacLfe元素配置)。
[0158]然而,在敘述對(duì)于擴(kuò)展元素類型的配置元素56的可能結(jié)構(gòu)之前,參照?qǐng)D3的示出擴(kuò)展元素類型的幀元素的可能結(jié)構(gòu)的部分,于此說明第二幀元素22b。如圖所示,擴(kuò)展元素類型的幀元素可以包括關(guān)于相應(yīng)幀元素22b的長(zhǎng)度的長(zhǎng)度信息58。解碼器36被配置為從每個(gè)幀20的擴(kuò)展元素類型的每個(gè)幀元素22b讀取該長(zhǎng)度信息58。若解碼器36無法處理或被用戶輸入指示為不處理擴(kuò)展元素類型的該幀元素所屬的子流,則解碼器36使用長(zhǎng)度信息58作為跳過區(qū)間長(zhǎng)度——即要跳過的比特流部分的長(zhǎng)度——來跳過該幀元素22b。換言之,解碼器36可以使用長(zhǎng)度信息58來計(jì)算用于定義比特流區(qū)間長(zhǎng)度的字節(jié)數(shù)目或任何其它適當(dāng)度量以進(jìn)一步執(zhí)行讀取比特流12,該比特流區(qū)間長(zhǎng)度為直到存取或訪問當(dāng)前幀20內(nèi)的下一幀元素或開始下一接續(xù)幀20為止要跳過的。
[0159]如將在下面更詳細(xì)描述的,擴(kuò)展元素類型的幀元素可以被配置為適應(yīng)音頻編解碼器的未來或替代的擴(kuò)展或發(fā)展,并且因此擴(kuò)展元素類型的幀元素可以具有不同的統(tǒng)計(jì)長(zhǎng)度分布。為了利用根據(jù)一些應(yīng)用、某一子流的擴(kuò)展元素類型幀元素具有恒定長(zhǎng)度或具有非常窄的統(tǒng)計(jì)長(zhǎng)度分布的可能性,根據(jù)本申請(qǐng)的一些實(shí)施例,用于擴(kuò)展元素類型的配置元素56可以包括默認(rèn)有效載荷長(zhǎng)度信息60,如圖3所示。在此情況下,相應(yīng)子流的擴(kuò)展元素類型的幀元素22b可以參考包含在用于相應(yīng)子流的相應(yīng)配置元素56內(nèi)的默認(rèn)有效載荷長(zhǎng)度信息60,而非明確地傳輸有效載荷長(zhǎng)度。具體地,如圖3所示,在此情況下,長(zhǎng)度信息58可以包括默認(rèn)擴(kuò)展有效載荷長(zhǎng)度標(biāo)記64形式的條件語法部分62,該默認(rèn)有效載荷長(zhǎng)度標(biāo)記64在未被設(shè)定的情況下后面跟隨有擴(kuò)展有效載荷長(zhǎng)度值66。在擴(kuò)展元素類型的相應(yīng)幀元素22b的長(zhǎng)度信息62的默認(rèn)擴(kuò)展有效載荷長(zhǎng)度標(biāo)記64被設(shè)定的情況下,擴(kuò)展元素類型的任何幀元素22b具有由相應(yīng)配置元素56中的信息60表示的默認(rèn)擴(kuò)展有效載荷長(zhǎng)度;以及在擴(kuò)展元素類型的相應(yīng)幀元素22b的長(zhǎng)度信息58的默認(rèn)擴(kuò)展有效載荷長(zhǎng)度標(biāo)記64未被設(shè)定的情況下,擴(kuò)展元素類型的任何幀元素22b具有與擴(kuò)展元素類型的相應(yīng)幀元素22b的長(zhǎng)度信息58的擴(kuò)展有效載荷長(zhǎng)度值66相對(duì)應(yīng)的擴(kuò)展有效載荷長(zhǎng)度。也就是說,每當(dāng)可以僅參考由相應(yīng)子流和元素位置各自的配置元素56內(nèi)的默認(rèn)有效載荷長(zhǎng)度信息60表示的默認(rèn)擴(kuò)展有效載荷長(zhǎng)度,編碼器24可以避免擴(kuò)展有效載荷長(zhǎng)度值66的明確編碼。解碼器36如下進(jìn)行動(dòng)作。在讀取配置元素56期間,解碼器36讀取默認(rèn)有效載荷長(zhǎng)度信息60。當(dāng)讀取相應(yīng)子流的幀元素22b時(shí),解碼器36在讀取這些幀元素的長(zhǎng)度信息中讀取默認(rèn)擴(kuò)展有效載荷長(zhǎng)度標(biāo)記64并且檢查標(biāo)記64是否被設(shè)定。如果默認(rèn)有效載荷長(zhǎng)度標(biāo)記64未被設(shè)定,則解碼器繼續(xù)從比特流讀取條件語法部分62的擴(kuò)展有效載荷長(zhǎng)度值66,以獲得相應(yīng)幀元素的擴(kuò)展有效載荷長(zhǎng)度。然而,如果默認(rèn)有效載荷標(biāo)記64被設(shè)定,則解碼器36將相應(yīng)幀的擴(kuò)展有效載荷長(zhǎng)度設(shè)定為與根據(jù)信息60得到的默認(rèn)擴(kuò)展有效載荷長(zhǎng)度相等。然后,解碼器36的跳過涉及使用剛才確定的擴(kuò)展有效載荷長(zhǎng)度作為跳過區(qū)間長(zhǎng)度——即要跳過的比特流12的部分的長(zhǎng)度一來跳過當(dāng)前幀元素的有效載荷區(qū)段68,以存取當(dāng)前幀20的下一幀元素22或開始下一幀20。
[0160]因此,如先前所述,每當(dāng)某一子流的擴(kuò)展元素類型的幀元素的有效載荷長(zhǎng)度的改變相當(dāng)?shù)蜁r(shí),運(yùn)用標(biāo)記機(jī)制64可以避免這些幀元素的有效載荷長(zhǎng)度的逐幀重復(fù)傳輸。
[0161]然而,由于并非先驗(yàn)明確由某一子流的擴(kuò)展元素類型的幀元素傳送的有效載荷是否具有關(guān)于幀元素的有效載荷長(zhǎng)度的這種統(tǒng)計(jì),并且因此是否值得在擴(kuò)展元素類型的幀元素的這種子流的配置元素中明確傳輸默認(rèn)有效載荷長(zhǎng)度,所以根據(jù)另外的實(shí)施例,默認(rèn)有效載荷長(zhǎng)度信息60也由包括標(biāo)記60a的條件語法部分實(shí)現(xiàn),該標(biāo)記60a在以下特定語法示例中被稱為UsacExtElementDefaultLengthPresent (Usac擴(kuò)展元素默認(rèn)長(zhǎng)度存在)并且表示是否進(jìn)行默認(rèn)有效載荷長(zhǎng)度的明確傳輸。只有在標(biāo)記60a被設(shè)定的情況下,條件語法部分包括在以下特定語法示例中被稱為UsacExtElementDefaultLength (Usac擴(kuò)展元素默認(rèn)長(zhǎng)度)的默認(rèn)有效載荷長(zhǎng)度的明確傳輸60b。否則,默認(rèn)有效載荷長(zhǎng)度被默認(rèn)設(shè)定為O。在后者情況下,由于避免了默認(rèn)有效載荷長(zhǎng)度的明確傳輸,所以節(jié)省了比特流的位消耗。也就是說,解碼器36 (以及負(fù)責(zé)上述和下述所有讀取程序的分配器40)可以被配置為在讀取默認(rèn)有效載荷長(zhǎng)度信息60中從比特流12讀取默認(rèn)有效載荷長(zhǎng)度存在標(biāo)記60a,檢查默認(rèn)有效載荷長(zhǎng)度存在標(biāo)記60a是否被設(shè)定,以及如果默認(rèn)有效載荷長(zhǎng)度存在標(biāo)記60a被設(shè)定,則將默認(rèn)擴(kuò)展有效載荷長(zhǎng)度設(shè)定為零,并且如果默認(rèn)有效載荷長(zhǎng)度存在標(biāo)記60a未被設(shè)定,則從比特流12明確地讀取默認(rèn)擴(kuò)展有效載荷長(zhǎng)度60b (B卩,跟隨標(biāo)記60a的字段60b)。
[0162]除默認(rèn)有效載荷長(zhǎng)度機(jī)制之外或替代默認(rèn)有效載荷長(zhǎng)度機(jī)制,長(zhǎng)度信息58可以包括擴(kuò)展有效載荷存在標(biāo)記70,其中長(zhǎng)度信息58的擴(kuò)展有效載荷存在標(biāo)記70未被設(shè)定的擴(kuò)展元素類型的任何幀元素22b僅包括擴(kuò)展有效載荷存在標(biāo)記。也就是說,不存在有效載荷區(qū)段68。另一方面,長(zhǎng)度信息58的擴(kuò)展有效載荷存在標(biāo)記被70設(shè)定的擴(kuò)展元素類型的任何幀元素22b的長(zhǎng)度信息58還包括語法部分62或66,該語法部分62或66表示相應(yīng)幀22b的擴(kuò)展有效載荷長(zhǎng)度,即相應(yīng)幀22b的有效載荷區(qū)段68的長(zhǎng)度。除默認(rèn)有效載荷長(zhǎng)度機(jī)制即結(jié)合默認(rèn)擴(kuò)展有效載荷長(zhǎng)度標(biāo)記64之外,擴(kuò)展有效載荷存在標(biāo)記70使得能夠?qū)U(kuò)展元素類型的每個(gè)幀元素提供兩個(gè)可有效編碼的有效載荷長(zhǎng)度,即一方面為O并且另一方面為默認(rèn)有效載荷長(zhǎng)度即最可能的有效載荷長(zhǎng)度。
[0163]在解析或讀取擴(kuò)展元素類型的當(dāng)前幀元素22b的長(zhǎng)度信息58中,解碼器36從比特流12讀取擴(kuò)展有效載荷存在標(biāo)記70,檢查擴(kuò)展有效載荷存在標(biāo)記70是否被設(shè)定,以及如果擴(kuò)展有效載荷存在標(biāo)記70未被設(shè)定,則停止讀取相應(yīng)幀元素22b并且繼續(xù)讀取當(dāng)前幀20的另一、下一幀元素22,或開始讀取或解析下一幀20。而如果擴(kuò)展有效載荷存在標(biāo)記70被設(shè)定,則解碼器36讀取語法部分62或至少部分66 (如果標(biāo)記64不存在,原因是此機(jī)制不可用)并且如果要跳過當(dāng)前幀元素22的有效載荷,則通過使用擴(kuò)展元素類型的相應(yīng)幀元素22b的擴(kuò)展有效載荷長(zhǎng)度作為跳過區(qū)間長(zhǎng)度來跳過有效載荷區(qū)段68。
[0164]如上所述,可以設(shè)置擴(kuò)展元素類型的幀元素,以適應(yīng)音頻編解碼器的未來擴(kuò)展或前解碼器不適合的其它擴(kuò)展,因此擴(kuò)展元素類型的幀元素應(yīng)當(dāng)是可配置的。具體地,根據(jù)實(shí)施例,對(duì)于類型指示部分52表示擴(kuò)展元素類型的每個(gè)元素位置,配置塊28包括配置元素56,該配置元素56包括用于擴(kuò)展元素類型的配置信息,其中除上面概述的部件之外或替代上面概述的部件,該配置信息包括表示多個(gè)有效載荷數(shù)據(jù)類型中的有效載荷數(shù)據(jù)類型的擴(kuò)展元素類型字段72。根據(jù)一個(gè)實(shí)施例,多個(gè)有效載荷數(shù)據(jù)類型可以包括多通道邊信息類型和多對(duì)象編碼邊信息類型,此外包括例如被保留供未來發(fā)展的其它數(shù)據(jù)類型。根據(jù)所表示的有效載荷數(shù)據(jù)類型,配置元素56另外包括特定于有效載荷數(shù)據(jù)類型的配置數(shù)據(jù)。因此,在相應(yīng)元素位置處的幀元素22b和相應(yīng)子流的幀元素22b分別在其有效載荷區(qū)段68中傳送與所表示的有效載荷數(shù)據(jù)類型相對(duì)應(yīng)的有效載荷數(shù)據(jù)。為了允許特定于有效載荷數(shù)據(jù)類型的配置數(shù)據(jù)74的長(zhǎng)度的調(diào)整適應(yīng)于有效載荷數(shù)據(jù)類型,并且允許用于另外的有效載荷數(shù)據(jù)類型的未來發(fā)展的保留,在下面描述的特定語法實(shí)施例具有擴(kuò)展元素類型的配置元素56,另外包括被稱為UsacExtElementConfigLength (Usac擴(kuò)展兀素配置長(zhǎng)度)的配置兀素長(zhǎng)度值,使得不知道對(duì)于當(dāng)前子流所表示的有效載荷數(shù)據(jù)類型的解碼器36能夠跳過配置元素56及其特定于有效載荷數(shù)據(jù)類型的配置數(shù)據(jù)74,以存取比特流12的緊跟隨部分如下一元素位置的元素類型語法元素54 (或在未示出的替代實(shí)施例中,下一元素位置的配置元素),或跟隨配置塊28的第一幀的起始或?qū)⒄請(qǐng)D4a示出的一些其它數(shù)據(jù)。具體地,在用于語法的以下特定實(shí)施例中,多通道邊信息配置數(shù)據(jù)包含在SpatialSpecificConfig中,而多對(duì)象邊信息配置數(shù)據(jù)包含在SaocSpecificConfig中。
[0165]根據(jù)后一方面,在讀取配置塊28中,解碼器36將被配置為對(duì)于類型指示部分52表示擴(kuò)展元素類型的每個(gè)元素位置或子流來執(zhí)行下列步驟:
[0166]讀取配置元素56,包括讀取表示多個(gè)可用有效載荷數(shù)據(jù)類型中的有效載荷數(shù)據(jù)類型的擴(kuò)展元素類型字段72。
[0167]如果擴(kuò)展元素類型字段72表示多通道邊信息類型,則從比特流12讀取作為配置信息的一部分的多通道邊信息配置數(shù)據(jù)74 ;而如果擴(kuò)展元素類型字段72表示多對(duì)象邊信息類型,則從比特流12讀取作為配置信息的一部分的多對(duì)象邊信息配置數(shù)據(jù)74。
[0168]然后,在對(duì)相應(yīng)幀元素22b—即分別對(duì)應(yīng)于元素位置和子流的幀元素22b——進(jìn)行解碼中,在有效載荷數(shù)據(jù)類型表示多通道邊信息類型的情況下,解碼器36將使用多通道邊信息配置數(shù)據(jù)74來配置多通道解碼器44e,同時(shí)對(duì)如此配置的多通道解碼器44e給送相應(yīng)幀元素22b的有效載荷數(shù)據(jù)68作為多通道邊信息;以及在有效載荷數(shù)據(jù)類型表示多對(duì)象邊信息類型的情況下,解碼器36將通過如下方式來解碼相應(yīng)的幀元素22b:使用多對(duì)象邊信息配置數(shù)據(jù)74來配置多對(duì)象解碼器44d,并且對(duì)如此配置的多對(duì)象解碼器44d給送相應(yīng)幀元素22b的有效載荷數(shù)據(jù)68。
[0169]然而,如果由字段72表示未知的有效載荷數(shù)據(jù)類型,則解碼器36將運(yùn)用也由當(dāng)前配置元素包括的前述配置長(zhǎng)度值來跳過特定于有效載荷數(shù)據(jù)類型的配置數(shù)據(jù)74。
[0170]例如,對(duì)于類型指示部分52表示擴(kuò)展元素類型的任何元素位置,解碼器36可以被配置為從比特流12讀取配置數(shù)據(jù)長(zhǎng)度字段76作為對(duì)于相應(yīng)元素位置的配置元素56的配置信息的一部分以獲得配置數(shù)據(jù)長(zhǎng)度,并且檢查由對(duì)于相應(yīng)元素位置的配置元素的配置信息的擴(kuò)展元素類型字段72表示的有效載荷數(shù)據(jù)類型是否屬于作為多個(gè)有效載荷數(shù)據(jù)類型的子集的有效載荷數(shù)據(jù)類型的預(yù)定集合。如果由對(duì)于相應(yīng)元素位置的配置元素的配置信息的擴(kuò)展元素類型字段72表示的有效載荷數(shù)據(jù)類型屬于有效載荷數(shù)據(jù)類型的預(yù)定集合,則解碼器36將從數(shù)據(jù)流12讀取作為對(duì)于相應(yīng)元素位置的配置元素的配置信息的一部分的有效載荷數(shù)據(jù)依賴性配置數(shù)據(jù)74,并且使用有效載荷數(shù)據(jù)依賴性配置數(shù)據(jù)74對(duì)在幀20中的相應(yīng)元素位置處的擴(kuò)展元素類型的幀元素進(jìn)行解碼。但是如果由對(duì)于相應(yīng)元素位置的配置元素的配置信息的擴(kuò)展元素類型字段72表示的有效載荷數(shù)據(jù)類型并不屬于有效載荷數(shù)據(jù)類型的預(yù)定集合,則解碼器將使用配置數(shù)據(jù)長(zhǎng)度來跳過有效載荷數(shù)據(jù)依賴性配置數(shù)據(jù)74,并且使用在幀20中的相應(yīng)元素位置處的擴(kuò)展元素類型的幀元素中的長(zhǎng)度信息58來跳過該幀元素。
[0171]除以上機(jī)制之外或代替以上機(jī)制,某一子流的幀元素可以被配置為以片段進(jìn)行傳輸而非一次完全傳輸整個(gè)幀。例如,擴(kuò)展元素類型的配置元素可以包括片段使用標(biāo)記78,解碼器可以被配置為在讀取定位在如下任何元素位置處的幀元素22中從比特流12讀取片段信息80并且使用片段信息來將連續(xù)幀的這些幀元素的有效載荷數(shù)據(jù)放在一起,其中對(duì)于該元素位置,類型指示部分表示擴(kuò)展元素類型并且配置元素的片段使用標(biāo)記78被設(shè)定。在以下的特定語法示例中,片段使用標(biāo)記78被設(shè)定的子流的每個(gè)擴(kuò)展類型幀元素包括一對(duì)標(biāo)記 表不該子流的有效載荷起始的起始標(biāo)記以及表不該子流的有效載荷結(jié)束的結(jié)束標(biāo)記。這些標(biāo)記在以下的特定語法示例中被稱為UsacExtElementStart (Usac擴(kuò)展元素開始)及 UsacExtElementStop (Usac 擴(kuò)展兀素停止)。
[0172]此外,除以上機(jī)制之外或代替以上機(jī)制,相同的可變長(zhǎng)度代碼可以用于讀取長(zhǎng)度信息80、擴(kuò)展元素類型字段72以及配置數(shù)據(jù)長(zhǎng)度字段76,由此降低實(shí)現(xiàn)例如解碼器的復(fù)雜度,并且通過僅在極少發(fā)生的情況(如未來擴(kuò)展元素類型、更大的擴(kuò)展元素類型長(zhǎng)度等)下才需要另外的位來節(jié)省位。在隨后說明的特定示例中,該可變長(zhǎng)度代碼(VLC)能夠根據(jù)圖4m得到。
[0173]綜上所述,以下可適用于解碼器功能:
[0174](I)讀取配置塊28,以及
[0175](2)讀取/解析幀20的序列。步驟I和2由解碼器36、更精確地由分配器40執(zhí)行。
[0176](3)音頻內(nèi)容的重建限于那些子流,即限于在元素位置處的幀元素的序列,其解碼由解碼器36支持。步驟3是在解碼器36內(nèi)的例如其解碼模塊處執(zhí)行(參見圖2)。
[0177]因此,在步驟I中,解碼器36分別讀取每個(gè)幀20的子流的數(shù)目50和幀元素22的數(shù)目,以及展示這些子流和元素位置中每一個(gè)的元素類型的類型指示語法部分52。對(duì)于步驟2中的解析比特流,解碼器36然后循環(huán)地從比特流12讀取幀20的序列的幀元素22。這樣做,解碼器36利用上述的長(zhǎng)度信息58來跳過幀元素或其剩余/有效載荷部分。在第三步驟中,解碼器36通過對(duì)未跳過的幀元素進(jìn)行解碼來執(zhí)行重建。
[0178]在步驟2中決定要跳過哪些元素位置和子流,解碼器36可以檢查配置塊28內(nèi)的配置元素56。為了這樣做,解碼器36可以被配置為以與用于元素類型指示器54和幀元素22本身的次序相同的次序從比特流12的配置塊28循環(huán)地讀取配置元素56。如上面所表示的,配置元素56的循環(huán)讀取可以與語法元素54的循環(huán)讀取散置。具體地,解碼器36可以檢查擴(kuò)展元素類型子流的配置元素56內(nèi)的擴(kuò)展元素類型字段72。如果擴(kuò)展元素類型不是被支持的擴(kuò)展元素類型,則解碼器36跳過相應(yīng)子流和幀20內(nèi)的各個(gè)幀元素位置處的相應(yīng)幀元素22。
[0179]為了減少傳輸長(zhǎng)度信息58所需的比特率,解碼器36在步驟I中被配置為檢查擴(kuò)展元素類型子流的配置元素56,具體地檢查其默認(rèn)有效載荷長(zhǎng)度信息60。在第二步驟中,解碼器36檢查要跳過的擴(kuò)展幀元素22的長(zhǎng)度信息58。具體地,解碼器36首先檢查標(biāo)記64。如果標(biāo)記64被設(shè)定,則解碼器36使用由默認(rèn)有效載荷長(zhǎng)度信息60對(duì)于相應(yīng)子流所表示的默認(rèn)長(zhǎng)度作為要跳過的剩余有效載荷長(zhǎng)度,以繼續(xù)幀的幀元素的循環(huán)讀取/解析。然而,如果標(biāo)記64未被設(shè)定,則解碼器36從比特流12明確地讀取有效載荷長(zhǎng)度66。雖然上面并未明確地說明,但應(yīng)當(dāng)清楚,解碼器36可以得到要跳過的位或字節(jié)的數(shù)目,以通過一些另外的計(jì)算來存取當(dāng)前幀的下一幀元素或下一幀。例如,解碼器36可以考慮是否使如關(guān)于標(biāo)記78在上面說明的片段機(jī)制作用。如果使片段機(jī)制作用,則解碼器36可以考慮:在片段標(biāo)記78被設(shè)定的任何情況下,子流的幀元素具有片段信息80 ;以及因此,在片段標(biāo)記78未被設(shè)定的情況下,有效載荷數(shù)據(jù)68將比其正常情況更晚開始。
[0180]在步驟3的解碼中,解碼器照常動(dòng)作:也就是說,各個(gè)子流經(jīng)受如圖2所示的各個(gè)解碼機(jī)制或解碼模塊,其中一些子流可以形成關(guān)于其它子流的邊信息,如已經(jīng)關(guān)于擴(kuò)展子流的特定示例在上面說明的。
[0181]至于關(guān)于解碼器功能的其它可能細(xì)節(jié),參考以上討論。僅為了完整性,注意解碼器36也可以在步驟I跳過對(duì)配置元素56的進(jìn)一步解析,即對(duì)于要跳過的那些元素位置,原因是例如由字段72表示的擴(kuò)展元素類型不符合所支持的擴(kuò)展元素類型集合。然后,解碼器36可以使用配置長(zhǎng)度信息76以在對(duì)配置元素56進(jìn)行循環(huán)讀取/解析中跳過相應(yīng)配置元素,即跳過相應(yīng)數(shù)目的位/字節(jié),以存取下一比特流語法元素如下一元素位置的類型指示器54。
[0182]在繼續(xù)以上提及的特定語法實(shí)施例前,應(yīng)當(dāng)注意,本發(fā)明并不限于使用統(tǒng)一語音與音頻編碼(USAC)及其各方面(例如使用混合物來交換核心編碼、或使用參數(shù)編碼(ACELP)和變換編碼(TCX)在AAC如頻域編碼和LP編碼之間交換)來實(shí)現(xiàn)。更確切地,上述子流可以利用任何編碼方案來表示音頻信號(hào)。此外,雖然在下面概述的特定語法實(shí)施例中,假設(shè)頻譜帶寬復(fù)制(SBR)為用于利用單通道和通道對(duì)元素類型子流來表示音頻信號(hào)的核心編碼器的編碼選項(xiàng),但SBR也可以不是上述元素類型的選項(xiàng),但僅僅可運(yùn)用于擴(kuò)展元素類型。
[0183]在下文中,說明對(duì)于比特流12的特定語法示例。應(yīng)當(dāng)注意,特定語法示例表示對(duì)于圖3的實(shí)施例的可能實(shí)現(xiàn),并且根據(jù)圖3的各個(gè)符號(hào)和圖3的描述來表示或得到在以下語法的語法元素與圖3的比特流結(jié)構(gòu)之間的一致性?,F(xiàn)在概述以下特定示例的基本方面。在這點(diǎn)上,應(yīng)當(dāng)注意,除上面已經(jīng)關(guān)于圖3描述過的那些之外的任何另外細(xì)節(jié)要被理解為圖3的實(shí)施例的可能擴(kuò)展。所有的這些擴(kuò)展可以各自建立到圖3的實(shí)施例中。作為最后一個(gè)初步注釋,應(yīng)當(dāng)理解,下面描述的特定語法示例明確地分別參考圖5a和圖5b的解碼器和編碼器環(huán)境。
[0184]關(guān)于所包含的音頻內(nèi)容的高階信息(如采樣率、確切通道配置)存在于音頻比特流中。這使比特流更加自包含,并且在嵌入到可以不具有明確傳輸該信息的任何手段的傳輸方案中時(shí),使配置和有效載荷的傳輸更容易。
[0185]配置結(jié)構(gòu)包含有幀長(zhǎng)度和頻譜帶寬復(fù)制(SBR)采樣率比的組合索引(CoreSbrFrameLengthIndex)。這保證二個(gè)值的有效傳輸,并且確保巾貞長(zhǎng)度與SBR比的無意義組合無法被傳達(dá)。后者簡(jiǎn)化了解碼器的實(shí)現(xiàn)。
[0186]配置可以借助于專用配置擴(kuò)展機(jī)制進(jìn)行擴(kuò)展。這將防止如根據(jù)MPEG-4AudioSpecificConfig()已知的配置擴(kuò)展的巨大且無效的傳輸。
[0187]配置允許與每個(gè)所傳輸?shù)囊纛l通道相關(guān)聯(lián)的揚(yáng)聲器位置的自由傳達(dá)。常用通道對(duì)揚(yáng)聲器映射的傳達(dá)可以借助于通道配置索引(channelConfigurationlndex)而有效地傳達(dá)。
[0188]每個(gè)通道元素的配置被包含在單獨(dú)結(jié)構(gòu)中,使得每個(gè)通道元素可以獨(dú)立進(jìn)行配置。
[0189]SBR 配置數(shù)據(jù)(“ SBR 頭”)被分裂成 SbrInfo O 和 SbrHeader O。對(duì)于 SbrHeader O ,定義默認(rèn)版本(SbrDfltHeader O),其可以在比特流中有效地引用。這減少了在需要重新傳輸SBR配置數(shù)據(jù)的位置處的位需求。
[0190]借助于SbrInfoO語法元素,可以有效地傳達(dá)較常施加至SBR的配置變化。
[0191]用于頻譜帶寬復(fù)制(SBR)和參數(shù)立體聲編碼工具(MPS212又稱MPEG環(huán)繞2_1_2)的配置被緊密集成到USAC配置結(jié)構(gòu)中。這表示在標(biāo)準(zhǔn)中實(shí)際采用兩種技術(shù)的顯著更好的方式。
[0192]語法以擴(kuò)展機(jī)制為特征,該擴(kuò)展機(jī)制允許編解碼器的現(xiàn)有和未來擴(kuò)展的傳輸。
[0193]擴(kuò)展可以以任何次序與通道元素進(jìn)行放置(即交插)。這允許需要在被施加擴(kuò)展的特定通道元素之前或之后進(jìn)行讀取的擴(kuò)展。[0194]默認(rèn)長(zhǎng)度可以對(duì)于語法擴(kuò)展進(jìn)行定義,這使得恒定長(zhǎng)度擴(kuò)展的傳輸非常有效,原因是無需每次都傳輸擴(kuò)展有效載荷的長(zhǎng)度。
[0195]如果需要借助于逃逸機(jī)制來傳達(dá)值以擴(kuò)展值的范圍的常見情況被模塊化到專用真實(shí)語法元素(escapedValueO)中,該元素足夠靈活地覆蓋所有期望的逃逸值叢和位字段擴(kuò)展。
[0196]比特流配置
[0197]UsacConfig ()(圖 4a)
[0198]UsacConfigO被擴(kuò)展為包含有與所含音頻內(nèi)容有關(guān)的信息以及用于完整解碼器設(shè)置所需的一切。關(guān)于音頻的頂階信息(采樣率、通道配置、輸出幀長(zhǎng)度)聚集在起始處以容易從更高(應(yīng)用)層存取。
[0199]UsacChannelConfig()(圖 4b)
[0200]這樣的元素給出與所包含的比特流元素以及其至揚(yáng)聲器的映射有關(guān)的信息。channelConfigurationlndex允許對(duì)被視為實(shí)際上相關(guān)的預(yù)定義的單聲、立體聲或多通道配置的范圍中之一進(jìn)行傳達(dá)的容易且方便的方式。
[0201]對(duì)于channelConfigurationlndex 未覆蓋的更詳盡配置,UsacChannelConfig()允許將元素自由分配給32個(gè)揚(yáng)聲器位置的列表中的揚(yáng)聲器位置,該列表覆蓋用于家庭或影院聲音重現(xiàn)的所有已知揚(yáng)聲器設(shè)置中的所有目前已知的揚(yáng)聲器位置。
[0202]該揚(yáng)聲器位置的列表是在MPEG環(huán)繞標(biāo)準(zhǔn)中起重要作用的列表的超集(參考ISO/IEC23003-1的表I和圖1)。已經(jīng)增加四個(gè)另外的揚(yáng)聲器位置以能夠覆蓋最近問世的22.2揚(yáng)聲器設(shè)置(參見圖3a、圖3b、圖4a以及圖4b)。
[0203]UsacDecoderConfig()(圖 4c)
[0204]該元素位于解碼器配置的重要位置,使其包含解碼器解釋比特流所需的所有另外信息。
[0205]具體地,于此通過明確地陳述比特流中的元素?cái)?shù)目及其次序來定義比特流的結(jié)構(gòu)。
[0206]然后,對(duì)所有元素的循環(huán)允許所有類型(單個(gè)、成對(duì)、lfe、擴(kuò)展)的所有元素的配置。
[0207]UsacConfigExtension ()(圖 41)
[0208]為了考慮到未來的擴(kuò)展,配置的特征為以下的強(qiáng)有力機(jī)制:對(duì)于USAC的尚未存在的配置擴(kuò)展而擴(kuò)展該配置。
[0209]UsacSingleChannelElementConfig ()(圖 4d)
[0210]該元素配置包含用于將解碼器配置成對(duì)一個(gè)單通道進(jìn)行解碼所需的所有信息。這基本上為與核心編碼器相關(guān)的信息,并且如果使用SBR,則為與SBR相關(guān)的信息。
[0211]UsacChannelPairElementConfig()(圖 4e)
[0212]類似以上所述的,該元素配置包含用于將解碼器配置成對(duì)一個(gè)通道對(duì)進(jìn)行解碼所需的所有信息。除上述的核心配置和SBR配置之外,其還包括特定于立體聲的配置,例如所施加的立體聲編碼的確切類別(具有或不具有MPS212、殘差等)。注意,該元素覆蓋在USAC中可用的立體聲編碼選項(xiàng)的所有種類。
[0213]UsacLfeElementConfig ()(圖牡)[0214]因?yàn)長(zhǎng)FE元素具有靜態(tài)配置,所以LFE元素配置不包含配置數(shù)據(jù)。
[0215]UsacExtElementConfig ()(圖 4k)
[0216]該元素配置可以用于向編解碼器配置任何種類的現(xiàn)有或未來擴(kuò)展。每個(gè)擴(kuò)展元素類型具有其本身的專用ID值。包括長(zhǎng)度字段,以能夠方便地跳過解碼器所未知的配置擴(kuò)展。默認(rèn)有效載荷長(zhǎng)度的任選定義進(jìn)一步提高存在于實(shí)際比特流中的擴(kuò)展有效載荷的編碼效率。
[0217]已知被預(yù)見為與USAC組合的擴(kuò)展包括:MPEG環(huán)繞、SAOC以及根據(jù)MPEG-4AAC已知的某種FIL元素。
[0218]UsacCoreConfig ()(圖 4g)
[0219]該元素包含影響核心編碼器設(shè)置的配置數(shù)據(jù)。目前,這些配置數(shù)據(jù)為用于時(shí)間彎曲工具和噪聲填充工具的切換。
[0220]SbrConfig ()(圖 4h)
[0221]為了減少由sbrJreaderO的頻繁重新傳輸所產(chǎn)生的位開銷,通常保持為恒定的sbr_header O的元素的默認(rèn)值現(xiàn)在被承載于配置元素SbrDfltHeader O中。此外,靜態(tài)SBR配置元素也被承載于SbrConfigO中。這些靜態(tài)位包括用于使能或禁止增強(qiáng)型SBR的特定特征(如諧波轉(zhuǎn)位或跨時(shí)間包絡(luò)整形特征(inter-TES))的標(biāo)記。
[0222]SbrDfltHeader ()(圖 4i)
[0223]該元素承載通常保持為恒定的sbrJreaderO元素。影響事物(如幅值分辨率、交叉頻帶、頻譜預(yù)平坦化)的元素現(xiàn)在被承載于SbrInfo O中,其允許所述事物實(shí)時(shí)地有效改變。
[0224]Mps212Config()(圖 4j)
[0225]類似上面的SBR配置,對(duì)于MPEG環(huán)繞2_1_2工具的所有設(shè)置參數(shù)被集合在該配置中。來自SpatialSpecificConfigO的與上下文不相關(guān)或冗余的所有元素均被移除。
[0226]比特流有效載荷
[0227]UsacFrame ()(圖 4n)
[0228]其為環(huán)繞USAC比特流有效載荷的最外側(cè)包繞器并且表示USAC存取單元。其包含通過所有所含通道元素和如在config部分所傳達(dá)的擴(kuò)展元素的循環(huán)。這使得比特流格式在其可以包含的內(nèi)容方面顯著更靈活,并且是用于任何未來擴(kuò)展的未來保證。
[0229]UsacSingleChannelElement ()(圖 4o)
[0230]該元素包含對(duì)單聲流進(jìn)行解碼的所有數(shù)據(jù)。該內(nèi)容被劃分成與核心編碼器相關(guān)的部分和與eSBR相關(guān)的部分。與eSBR相關(guān)的部分現(xiàn)在顯著更緊密地連接至核心,這也顯著更好地反映了解碼器需要數(shù)據(jù)的次序。
[0231]UsacChannelPairElement ()(圖 4p)
[0232]該元素覆蓋用于對(duì)立體聲對(duì)進(jìn)行編碼的所有可能方式的數(shù)據(jù)。具體地,覆蓋統(tǒng)一立體聲編碼的所有風(fēng)格,從基于傳統(tǒng)Μ/S的編碼到借助于MPEG環(huán)繞2-1-2的完全參數(shù)立體聲編碼。StereoConfigIndex表示實(shí)際使用的風(fēng)格。在該元素中發(fā)送適當(dāng)?shù)膃SBR數(shù)據(jù)和MPEG 環(huán)繞 2_1_2 數(shù)據(jù)。UsacLfeElementO (圖 4q)
[0233]僅對(duì)之前的I fe_channel_e Iement O重新命名,以遵守一致的命名方案。UsacExtElement O (圖 4r)[0234]擴(kuò)展元素被審慎設(shè)計(jì)為能夠使靈活性最大化,但同時(shí)使效率最大化,即使對(duì)于具有較小(或通常根本沒有)有效載荷的擴(kuò)展也如此。向無知的解碼器傳達(dá)擴(kuò)展有效載荷長(zhǎng)度以跳過它。用戶定義的擴(kuò)展可以借助于擴(kuò)展類型的保留范圍進(jìn)行傳達(dá)。擴(kuò)展可以以元素次序自由地放置。已經(jīng)考慮一定范圍的擴(kuò)展元素,包括寫入填充字節(jié)的機(jī)制。
[0235]UsacCoreCoderData ()(圖 4s)
[0236]該新元素概括影響核心編碼器的所有信息,因此也包含fd_channel_stream()和lpd_channel_stream O。
[0237]StereoCoreToolInfo O (圖 4t)
[0238]為了使語法的可讀性容易化,所有立體聲相關(guān)信息被捕獲在該元素中。其處理立體聲編碼模式下的位的眾多依賴性。
[0239]UsacSbrData()(圖 4x)
[0240]可伸縮性音頻編碼的CRC功能元素和傳統(tǒng)描述元素從用于成為sbr_eXtensi0n_data O元素的元素中被移除。為了減少由SBR信息和頭數(shù)據(jù)的頻繁重新傳輸造成的開銷,可以明確地傳達(dá)它們的存在。
[0241]SbrInfo ()(圖 4y)
[0242]SBR配置數(shù)據(jù)經(jīng)常進(jìn)行實(shí)時(shí)修改。這包括先前需要完整sbr_header()的傳輸?shù)目刂迫缦率挛锏脑兀撌挛锢鐬榉捣直媛省⒔徊骖l帶、頻譜預(yù)平坦化。(參見[N11660]中的6.3,“效率”)。
[0243]SbrHeader ()(圖 4z)
[0244]為了維持SBR實(shí)時(shí)地改變sbr_header O中的值的能力,在應(yīng)當(dāng)使用除在SbrDfltHeader ()中發(fā)送的那些值以外的其它值的情況下,現(xiàn)在可以將SbrHeaderO承載于UsacSbrData O內(nèi)。對(duì)bs_header_extra機(jī)制進(jìn)行維持以對(duì)于大部分常見情況將開銷保持為盡可能低。
[0245]sbr_data ()(圖 4za)
[0246]再者,移除SBR可伸縮編碼的余部,原因是其不能應(yīng)用于USAC上下文中。取決于通道數(shù)目,sbr_data O 包含一個(gè) sbr_single_channel_eIement O 或一個(gè) sbr_channel_pair_element O。
[0247]usacSamplingFrequencylndex
[0248]本表為在MPEG-4中使用以對(duì)音頻編解碼器的采樣頻率進(jìn)行傳達(dá)的表的超集。本表被進(jìn)一步擴(kuò)展為還覆蓋目前在USAC操作模式下使用的采樣率。還加入采樣頻率的一些倍數(shù)。
[0249]channelConfigurationlndex
[0250]本表為在MPEG-4中使用以對(duì)channelConfiguration進(jìn)行傳達(dá)的表的超集。本表被進(jìn)一步擴(kuò)展來允許常用的和所預(yù)見的未來揚(yáng)聲器設(shè)置的傳達(dá)。本表中的索引以5位進(jìn)行傳達(dá),以允許未來擴(kuò)展。
[0251]UsacElementType
[0252]僅存在4種元素類型。四個(gè)基本比特流元素各有一個(gè)類型:UsacSingleChannelElement O、UsacChannelPairElement O、UsacLfeElement O、UsacExtElementQ。這些元素提供所需的頂層結(jié)構(gòu),同時(shí)維持所有需要的靈活性。[0253]UsacExtElementType
[0254]在UsacExtElementO內(nèi)部,本元素允許傳達(dá)過多的擴(kuò)展。為了未來保證,位域被選擇為足夠大以允許所有可設(shè)想的擴(kuò)展。在當(dāng)前已知的擴(kuò)展中,建議考慮少數(shù)擴(kuò)展:填充元素、MPEG環(huán)繞以及SA0C。
[0255]UsacConfigExtType
[0256]可能需要在某一點(diǎn)擴(kuò)展配置,那么這可以通過UsacConfigExtension O來處置,然后其將允許給每個(gè)新配置分配類型。當(dāng)前可以被傳達(dá)的唯一類型為用于該配置的填充機(jī)制。
[0257]CoreSbrFrameLengthIndex
[0258]該表將對(duì)解碼器的多個(gè)配置方面進(jìn)行傳達(dá)。具體地,這些為輸出幀長(zhǎng)度、SBR比以及所得的核心編碼器幀長(zhǎng)度(ccfl)。同時(shí),其表示用在SBR中的合成頻帶和QMF分析的數(shù)目。
[0259]stereoConfiglndex
[0260]該表確定UsacChannelPairElement O的內(nèi)部結(jié)構(gòu)。該表表示單聲或立體聲核心的使用、MPS212的使用、是否施加立體聲SBR以及是否在MPS212中施加殘差編碼。
[0261]通過將eSBR頭字段的大部分移動(dòng)至可以借助于默認(rèn)頭標(biāo)記來參考的默認(rèn)頭,大大減少了發(fā)送eSBR控制數(shù)據(jù)的位需求。被視為在現(xiàn)實(shí)世界系統(tǒng)中最可能改變的前述sbr_header ()位域反而被外包給sbrlnfoO元素,使其現(xiàn)在僅包括覆蓋最多8位的4個(gè)元素。與由至少18位構(gòu)成的sbr_header()相比,這節(jié)省了 10位。
`[0262]評(píng)估此變化對(duì)總比特率的影響是較困難的,原因在于總比特率很大程度上取決于sbrlnfo O中的eSBR控制數(shù)據(jù)的傳輸率。然而,已經(jīng)對(duì)于在比特流中更改sbr交叉的公共使用情況,每次發(fā)生發(fā)送sbrlnfoO替代完整傳輸?shù)膕br_headerO時(shí),位節(jié)省可以高達(dá)22位。
[0263]USAC 解碼器的輸出可以由 MPEG 環(huán)繞(MPS) (IS0/IEC23003-1)或 SAOC (ISO/IEC23003-2)進(jìn)一步處理。如果USAC中的SBR工具為有效的,則通過以對(duì)于ISO/IEC23003-14.4中的HE-AAC所描述的相同方式在QMF域中連接USAC解碼器和后續(xù)MPS/SAOC解碼器,USAC解碼器通常可以有效地與后續(xù)MPS/SA0C解碼器組合。如果在QMF域中的連接不可行,則它們需要在時(shí)域中進(jìn)行連接。
[0264]如果借助于UsacExtElement 機(jī)制(其中 UsacExtElementType 為 ID_EXT_ELE_MPEGS或ID_EXT_ELE_SA0C)將MPS/SA0C邊信息嵌入到USAC比特流中,則USAC數(shù)據(jù)與MPS/SAOC數(shù)據(jù)之間的時(shí)間對(duì)齊呈現(xiàn)出USAC解碼器與MPS/SA0C解碼器之間的最有效連接。如果在USAC中的SBR工具為有效的并且如果MPS/SA0C采用64頻帶的QMF域表示(參見ISO/IEC23003-16.6.3),則最有效連接是在QMF域中。
[0265]否則,最有效連接是在時(shí)域中。這對(duì)應(yīng)于如在130/^023003-14.4、4.5以及7.2.I中定義的MPS和HE-AAC的組合的時(shí)間對(duì)齊。
[0266]通過在USAC解碼后增加MPS解碼所引入的另外延遲是由IS0/IEC23003-14.5給定的,并且取決于:是否使用HQ MPS或LP MPS,以及MPS是否在QMF域或時(shí)域中連接至USAC。
[0267]IS0/IEC23003-14.4闡明USAC系統(tǒng)與MPEG系統(tǒng)之間的接口。從系統(tǒng)接口傳遞給音頻解碼器的每個(gè)存取單元將導(dǎo)致從該音頻解碼器傳遞至系統(tǒng)接口的相應(yīng)組合單元即組合器。這將包括起始狀況和關(guān)斷狀況,即存取單元何時(shí)為存取單元的有限序列中的第一個(gè)或最后一個(gè)。
[0268]對(duì)于音頻組合單元,IS0/IEC14496-17.1.3.5組合時(shí)間戳(CTS)指定施加至組合單元內(nèi)的第η個(gè)音頻樣本的組合時(shí)間。對(duì)于USAC,n的值始終為I。注意,這適用于USAC解碼器本身的輸出。在USAC解碼器例如與MPS解碼器組合的情況下,需要考慮在MPS解碼器的輸出傳遞的組合單元。
[0269]如果借助于UsacExtElement 機(jī)制(其中 UsacExtElementType 為 ID_EXT_ELE_MPEGS或ID_EXT_ELE_SA0C)將MPS/SA0C邊信息嵌入到USAC比特流中,則可以可選擇地施加以下限制:
[0270].MPS/SAOC sacTimeAlign 參數(shù)(參見 IS0/IEC23003-17.2.5)將具有值 O。
[0271].MPS/SA0C的采樣頻率將與USAC的輸出采樣頻率相同。
[0272].MPS/SAOC bsFrameLength 參數(shù)(參見 IS0/IEC23003-15.2)將具有預(yù)定列表的
容許值之一。
[0273]USAC比特流有效載荷語法在圖4n至圖4r中示出,并且附屬有效載荷元素的語法在圖4s至圖4w中示出,以及增強(qiáng)型SBR有效載荷語法在圖4x至圖4zc中示出。
[0274]數(shù)據(jù)元素的簡(jiǎn)短描述
[0275]UsacConf ig ()
[0276]該元素包含關(guān)于所含音頻內(nèi)容的信息以及用于完整解碼器設(shè)置所需的一切。
[0277]UsacChannelConf ig ()
[0278]該元素給予與所包含的比特流元素以及其至揚(yáng)聲器的映射有關(guān)的信息。
[0279]UsacDecoderConf ig ()
[0280]該元素包含由解碼器解釋比特流所需的所有另外信息。具體地,在此處傳達(dá)SBR重新采樣率,并且比特流的結(jié)構(gòu)在此通過明確地陳述比特流中的元素?cái)?shù)目及其次序進(jìn)行定義。
[0281]UsacConfigExtension ()
[0282]對(duì)用于USAC的未來配置擴(kuò)展的配置進(jìn)行擴(kuò)展的配置擴(kuò)展機(jī)制。
[0283]UsacSingleChannelElementConfig()
[0284]其包含用于將解碼器配置為對(duì)一個(gè)單通道進(jìn)行解碼所需的所有信息。這基本上為與核心編碼器相關(guān)的信息,并且如果使用SBR,則為與SBR相關(guān)的信息。
[0285]UsacChannelPairElementConfig ()
[0286]類似以上所述的,該元素配置包含用于將解碼器配置為對(duì)一個(gè)通道對(duì)進(jìn)行解碼所需的所有信息。除上述的核心配置和SBR配置之外,其還包括特定于立體聲的配置,例如所施加的立體聲編碼的確切類別(具有或不具有MPS212、殘差等)。該元素覆蓋在USAC中當(dāng)前可用的立體聲編碼選項(xiàng)的所有種類。
[0287]UsacLfeElementConf ig ()
[0288]因?yàn)長(zhǎng)FE元素具有靜態(tài)配置,所以LFE元素配置不包含配置數(shù)據(jù)。
[0289]UsacExtElementConf ig ()
[0290]該元素配置可以用于對(duì)編解碼器的任何種類的現(xiàn)有或未來擴(kuò)展進(jìn)行配置。每個(gè)擴(kuò)展元素類型具有其本身專用類型值。包括長(zhǎng)度字段,以能夠跳過解碼器所未知的配置擴(kuò)展。
[0291]UsacCoreConf ig ()
[0292]其包含影響核心編碼器設(shè)置的配置數(shù)據(jù)。
[0293]SbrConfigO
[0294]其包含通常保持為恒定的用于SBR的配置元素的默認(rèn)值。此外,靜態(tài)SBR配置元素也被承載于SbrConfigO中。這些靜態(tài)位包括用于使能或禁止增強(qiáng)型SBR的特定特征(如諧波轉(zhuǎn)位或inter-TES)的標(biāo)記。
[0295]SbrDfltHeader ()
[0296]該元素承載SbrHeaderO的元素的默認(rèn)版本,如果不期望這些元素有差值,則可以參考該默認(rèn)版本。
[0297]Mps212Conf ig ()
[0298]對(duì)于MPEG環(huán)繞2_1_2工具的所有設(shè)置參數(shù)被集合在該配置中。
[0299]escapedValueO
[0300]該元素實(shí)現(xiàn)使用不同數(shù)目的位來傳輸整數(shù)值的通用方法。其以兩階逃逸機(jī)制為特征,該兩階逃逸機(jī)制允許通過連續(xù)傳輸另外位來擴(kuò)展可表示的值范圍。
[0301]usacSamplingFrequencylndex
[0302]該索引確定解碼后的音頻信號(hào)的采樣頻率。在表C中描述usacSamplingFrequencylndex的值及`其相關(guān)聯(lián)的采樣頻率。
[0303]表C-usacSamplingFrequencylndex 的值和意義
【權(quán)利要求】
1.一種比特流,包括配置塊(28)和幀(20)序列,所述幀(20)分別表示音頻內(nèi)容(10)的連續(xù)時(shí)間周期(18 ),其中,所述配置塊(28 )包括: 字段(50),其指示元素的數(shù)目N,以及 類型指示語法部分(52),其針對(duì)N個(gè)元素位置的序列中的每個(gè)元素位置指示多個(gè)元素類型中的元素類型; 并且其中,所述幀(20)序列中的每個(gè)幀(20)包括: N個(gè)幀元素(22 )的序列,其中,每個(gè)幀元素具有由所述類型指示語法部分(52 )針對(duì)相應(yīng)元素位置指示的元素類型,在所述相應(yīng)元素位置處,相應(yīng)幀元素(22)定位在所述比特流(12)中的相應(yīng)幀(20)的所述N個(gè)幀元素的序列內(nèi)。
2.根據(jù)權(quán)利要求1所述的比特流,其中,所述類型指示語法部分(52)包括N個(gè)語法元素(54)的序列,其中每個(gè)語法元素(54)指示相應(yīng)元素位置的元素類型,在所述相應(yīng)元素位置處,所述相應(yīng)語法元素(54)定位在所述類型指示語法部分(52)內(nèi)。
3.根據(jù)權(quán)利要求1或2所述的比特流,其中,所述配置塊(28)包括N個(gè)配置元素(56)的序列,其中每個(gè)配置元素(56)包括針對(duì)相應(yīng)元素位置的元素類型的配置信息,在所述相應(yīng)元素位置處,所述相應(yīng)配置元素(56)定位在所述N個(gè)配置元素的序列中。
4.根據(jù)權(quán)利要求3所述的比特流,其中,所述類型指示語法部分(52)包括N個(gè)語法元素(54)的序列,其中每個(gè)語法元素(54)指示相應(yīng)元素位置的元素類型,在所述相應(yīng)元素位置處,相應(yīng)語法元素(54 )定位在所述類型指示語法部分(52 )內(nèi),并且所述配置元素(56 )和所述語法元素在所述比特流中交替地排列。
5.根據(jù)權(quán)利要求1至4中任一項(xiàng)所述的比特流,其中,所述多個(gè)元素類型包括擴(kuò)展元素類型,其中,任何幀(20 )的所述擴(kuò)展元素類型的每個(gè)幀元素(22 )包括關(guān)于相應(yīng)幀元素的長(zhǎng)度的長(zhǎng)度信息(58)。
6.根據(jù)權(quán)利要求5所述的比特流,其中,針對(duì)所述類型指示部分指示出所述擴(kuò)展元素類型的每個(gè)元素位置,所述配置塊(28)包括配置元素(56),所述配置元素(56)包括針對(duì)所述擴(kuò)展元素類型的配置信息,其中,針對(duì)所述擴(kuò)展元素類型的任何配置信息包括關(guān)于默認(rèn)擴(kuò)展有效載荷長(zhǎng)度的默認(rèn)有效載荷長(zhǎng)度信息(60),并且所述擴(kuò)展元素類型的所述幀元素(22)的所述長(zhǎng)度信息(58)包括默認(rèn)擴(kuò)展有效載荷長(zhǎng)度標(biāo)記(64)的形式的條件語法部分(62),其中如果沒有設(shè)定所述默認(rèn)擴(kuò)展有效載荷長(zhǎng)度標(biāo)記(64),則所述默認(rèn)擴(kuò)展有效載荷長(zhǎng)度標(biāo)記后面跟隨有擴(kuò)展有效載荷長(zhǎng)度值(66),其中,在所述擴(kuò)展元素類型的相應(yīng)幀元素(22b)的所述長(zhǎng)度信息(58)的所述默認(rèn)擴(kuò)展有效載荷長(zhǎng)度標(biāo)記(64)被設(shè)定的情況下,所述擴(kuò)展元素類型的任何幀元素具有默認(rèn)擴(kuò)展有效載荷長(zhǎng)度,而在所述擴(kuò)展元素類型的相應(yīng)幀(22b)的所述長(zhǎng)度信息(58)的所述默認(rèn)擴(kuò)展有效載荷長(zhǎng)度標(biāo)記(64)沒有被設(shè)定的情況下,所述擴(kuò)展元素類型的任何幀元素具有與所述擴(kuò)展元素類型的所述相應(yīng)幀元素(22b)的所述長(zhǎng)度信息(58)的所述擴(kuò)展有效載荷長(zhǎng)度值(60)相對(duì)應(yīng)的擴(kuò)展有效載荷長(zhǎng)度。
7.根據(jù)權(quán)利要求5或6所述的比特流,其中,所述擴(kuò)展元素類型的任何幀元素的所述長(zhǎng)度信息(58 )包括擴(kuò)展有效載荷存在標(biāo)記(70 ),其中,在其長(zhǎng)度信息(58 )的所述擴(kuò)展有效載荷存在標(biāo)記(70)沒有被設(shè)定的情況下,所述擴(kuò)展元素類型的任何幀元素(22b)僅包括所述擴(kuò)展有效載荷存在標(biāo)記(70),而在其長(zhǎng)度信息(58)的所述有效載荷數(shù)據(jù)存在標(biāo)記(70)被設(shè)定的情況下,所述擴(kuò)展元素類型的任何幀元素(22b)的所述長(zhǎng)度信息(58)還包括語法部分,所述語法部分指示所述擴(kuò)展元素類型的相應(yīng)幀(22b )的擴(kuò)展有效載荷長(zhǎng)度。
8.根據(jù)權(quán)利要求5至7中任一項(xiàng)所述的比特流,其中,針對(duì)所述類型指示部分(52)指示所述擴(kuò)展元素類型的每個(gè)元素位置,所述配置塊(28 )包括配置元素(56 ),所述配置元素(56)包括針對(duì)所述擴(kuò)展元素類型的配置信息,其中,所述配置信息包括指示多個(gè)有效載荷數(shù)據(jù)類型中的有效載荷數(shù)據(jù)類型的擴(kuò)展元素類型字段(72),其中,所述多個(gè)有效載荷數(shù)據(jù)類型包括多通道邊信息類型和多對(duì)象編碼邊信息類型,其中,在其擴(kuò)展元素類型字段(72)指示所述多通道邊信息的情況下,配置元素的針對(duì)所述擴(kuò)展元素類型的所述配置信息還包括多通道邊信息配置數(shù)據(jù)(74),而在其擴(kuò)展元素類型字段(72)指示所述多對(duì)象邊信息類型的情況下,配置元素的針對(duì)所述擴(kuò)展元素類型的所述配置信息還包括多對(duì)象邊信息配置數(shù)據(jù)(74),并且定位在所述類型指示部分指示所述擴(kuò)展元素類型的任何元素位置處的所述擴(kuò)展元素類型的幀元素(22b)傳送這樣的有效載荷數(shù)據(jù):所述有效載荷數(shù)據(jù)具有由針對(duì)相應(yīng)元素位置的所述配置元素的所述配置信息的所述擴(kuò)展元素類型字段(72)指示的有效載荷數(shù)據(jù)類型。
9.一種用于對(duì)比特流(12)進(jìn)行解碼的解碼器,所述比特流(12)包括配置塊(28)和幀(20)序列,所述幀(20)分別表示音頻內(nèi)容(10)的連續(xù)時(shí)間周期,其中,所述配置塊(UsacConfig)包括指示元素的數(shù)目N的字段(numElements)以及類型指示語法部分(52),所述類型指示語法部分(52)針對(duì)N個(gè)元素位置的序列中的每個(gè)元素位置指示多個(gè)元素類型中的元素類型,并且其中,所述幀序列中的每個(gè)幀包括N個(gè)幀元素的序列,其中,所述解碼器被配置為通過以下方式對(duì)每個(gè)幀(20)進(jìn)行解碼: 根據(jù)由所述類型指示語法部分針對(duì)相應(yīng)元素位置指示的元素類型對(duì)每個(gè)幀元素(22)進(jìn)行解碼,其中在所述相應(yīng)元素位置處,相應(yīng)幀元素定位在所述比特流(12)中的相應(yīng)幀(20 )的所述N個(gè)幀元素(22 )的序列內(nèi)。
10.根據(jù)權(quán)利要求9所述的解碼器,其中,所述解碼器被配置為從所述類型指示語法部分(52)讀取N個(gè)語法元素(54)的序列,其中每個(gè)元素指示相應(yīng)元素位置的元素類型,在所述相應(yīng)元素位置處,所述相應(yīng)語法元素定位在所述N個(gè)語法元素的序列內(nèi)。
11.根據(jù)權(quán)利要求9或10所述的解碼器,其中,所述解碼器被配置為從所述配置塊(28)讀取N個(gè)配置元素(56)的序列,其中每個(gè)配置元素包括針對(duì)相應(yīng)元素位置的元素類型的配置信息,在所述相應(yīng)元素位置處,所述相應(yīng)配置元素定位在所述N個(gè)配置元素的序列中,其中,所述解碼器被配置為:在根據(jù)元素類型對(duì)每個(gè)幀元素(22)進(jìn)行解碼時(shí),其中由所述類型指示語法部分針對(duì)在所述比特流(12)中的相應(yīng)幀(20)的所述N個(gè)幀元素(22)的序列內(nèi)定位相應(yīng)幀元素的相應(yīng)元素位置來指示所述元素類型,所述解碼器使用針對(duì)相應(yīng)元素位置的所述元素類型的配置信息,其中在所述相應(yīng)元素位置處,相應(yīng)幀元素定位在所述比特流(12)中的相應(yīng)幀(20)的所述N個(gè)幀元素(22)的序列內(nèi)。
12.根據(jù)權(quán)利要求11所述的解碼器,其中,所述類型指示語法部分(52)包括N個(gè)語法元素(54)的序列,其中每個(gè)語法元素指示相應(yīng)元素位置的元素類型,其中在所述相應(yīng)元素位置處,相應(yīng)語法元素定位在所述N個(gè)語法元素的序列內(nèi),并且所述解碼器被配置為從所述比特流(12)交替地讀取所述配置元素(56 )和所述語法元素(54 )。
13.根據(jù)權(quán)利要求9至12中任一項(xiàng)所述的解碼器,其中,所述多個(gè)元素類型包括擴(kuò)展元素類型,其中,所述解碼器被配置為:從任何幀(20)的所述擴(kuò)展元素類型的每個(gè)幀元素(22b)讀取關(guān)于相應(yīng)幀元素的長(zhǎng)度的長(zhǎng)度信息(58),以及 通過將關(guān)于所述相應(yīng)幀元素的長(zhǎng)度的所述長(zhǎng)度信息(58)用作跳過區(qū)間長(zhǎng)度,跳過所述幀(20)的所述擴(kuò)展元素類型的所述幀元素(22)中的至少一些幀元素(22)的至少一部分。
14.根據(jù)權(quán)利要求13所述的解碼器,其中, 所述解碼器被配置為對(duì)于所述類型指示部分指示所述擴(kuò)展元素類型的每個(gè)元素位置,從所述配置塊(28 )讀取配置元素(74 ),所述配置元素(74 )包括針對(duì)所述擴(kuò)展元素類型的配置信息,其中在讀取針對(duì)所述擴(kuò)展元素類型的所述配置信息時(shí),從所述比特流讀取關(guān)于默認(rèn)擴(kuò)展有效載荷長(zhǎng)度的默認(rèn)有效載荷長(zhǎng)度信息(60), 所述解碼器還被配置為:在讀取所述擴(kuò)展元素類型的所述幀元素(22)的所述長(zhǎng)度信息(58 )時(shí),從所述比特流(12 )讀取條件語法部分(62 )的默認(rèn)擴(kuò)展有效載荷長(zhǎng)度標(biāo)記(64 ),檢查所述默認(rèn)有效載荷長(zhǎng)度標(biāo)記(64)是否被設(shè)定,并且如果所述默認(rèn)有效載荷長(zhǎng)度標(biāo)記(64)沒有被設(shè)定,則從所述比特流(12)讀取所述條件語法部分(62)的擴(kuò)展有效載荷長(zhǎng)度值(66),以獲得相應(yīng)幀元素的擴(kuò)展有效載荷長(zhǎng)度,以及如果所述默認(rèn)有效載荷長(zhǎng)度標(biāo)記(64)被設(shè)定,則將所述相應(yīng)幀元素的所述擴(kuò)展有效載荷長(zhǎng)度設(shè)定為與所述默認(rèn)擴(kuò)展有效載荷長(zhǎng)度相等, 所述解碼器還被配置為通過將所述相應(yīng)幀元素的所述擴(kuò)展有效載荷長(zhǎng)度用作跳過區(qū)間長(zhǎng)度,跳過所述幀(20)的所述擴(kuò)展元素類型的所述幀元素(22)中的至少一些幀元素的有效載荷區(qū)段(68)。
15.根據(jù)權(quán)利要求13或14所述的解碼器,其中, 所述解碼器被配置為:在讀取所述幀的所述擴(kuò)展元素類型的任何幀元素的所述長(zhǎng)度信息(58)時(shí),從所述比特流(12)讀取擴(kuò)展有效載荷存在標(biāo)記(70),檢查所述擴(kuò)展有效載荷存在標(biāo)記(70)是否被設(shè)定,并且如果所述擴(kuò)展有效載荷存在標(biāo)記(70)沒有被設(shè)定,則停止讀取所述擴(kuò)展元素類型的相應(yīng)幀元素(22b),并繼續(xù)讀取當(dāng)前幀(20)的另一幀元素(22)或后續(xù)幀(20)的幀元素,以及如果所述有效載荷數(shù)據(jù)存在標(biāo)記(70)被設(shè)定,則從所述比特流讀取指示所述擴(kuò)展元素類型的相應(yīng)幀的擴(kuò)展有效載荷長(zhǎng)度的語法部分,并且在其所述長(zhǎng)度信息的所述擴(kuò)展有效載荷存在標(biāo)記(70)被設(shè)定的情況下,至少針對(duì)所述幀(20)的所述擴(kuò)展元素類型的所述幀元素(22)中的一些幀元素(22),通過將從所述比特流讀取的所述擴(kuò)展元素類型的相應(yīng)幀元素(22b)的所述擴(kuò)展有效載荷長(zhǎng)度用作跳過區(qū)間長(zhǎng)度,跳過所述幀元素的有效載荷區(qū)段(68)。
16.根據(jù)權(quán)利要求13或14所述的解碼器,其中, 所述解碼器被配置為:在讀取所述默認(rèn)有效載荷長(zhǎng)度信息(60)時(shí), 從所述比特流(12)讀取默認(rèn)有效載荷長(zhǎng)度存在標(biāo)記, 檢查所述默認(rèn)有效載荷長(zhǎng)度存在標(biāo)記是否被設(shè)定, 如果所述默認(rèn)有效載荷長(zhǎng)度存在標(biāo)記沒有被設(shè)定,則將所述默認(rèn)擴(kuò)展有效載荷長(zhǎng)度設(shè)定為零,以及 如果所述默認(rèn)有效載荷長(zhǎng)度存在標(biāo)記被設(shè)定,則從所述比特流明確地讀取所述默認(rèn)擴(kuò)展有效載荷長(zhǎng)度。
17.根據(jù)權(quán)利要求13至1 6中任一項(xiàng)所述的解碼器,其中,所述解碼器被配置為:在讀取所述配置塊(28 )時(shí),針對(duì)由所述類型指示部分(52 )指示出所述擴(kuò)展元素類型的每個(gè)元素位置: 從所述比特流(12)讀取包括針對(duì)所述擴(kuò)展元素類型的配置信息的配置元素(56),其中,所述配置信息包括指示多個(gè)有效載荷數(shù)據(jù)類型中的有效載荷數(shù)據(jù)類型的擴(kuò)展元素類型字段(72)。
18.根據(jù)權(quán)利要求17所述的解碼器,其中,所述多個(gè)有效載荷數(shù)據(jù)類型包括多通道邊信息類型和多對(duì)象編碼邊信息類型, 所述解碼器被配置為:在讀取所述配置塊(28 )時(shí),針對(duì)由所述類型指示部分(52 )指示出所述擴(kuò)展元素類型的每個(gè)元素位置: 如果所述擴(kuò)展元素類型字段(72)指示所述多通道邊信息類型,則從所述數(shù)據(jù)流(12)讀取作為所述配置信息一部分的多通道邊信息配置數(shù)據(jù)(74);并且如果所述擴(kuò)展元素類型字段(72)指示所述多通道邊信息類型,則從所述數(shù)據(jù)流讀取作為所述配置信息一部分的多對(duì)象邊信息配置數(shù)據(jù)(74);以及 所述解碼器被配置為:在對(duì)每個(gè)幀進(jìn)行解碼時(shí), 通過如下方式對(duì)定位在由所述類型指示部分指示出所述擴(kuò)展元素類型并且由所述配置元素(56)的所述擴(kuò)展元素類型指示出所述多通道邊信息類型的任何元素位置處的所述擴(kuò)展元素類型的所述幀元素進(jìn)行解碼:使用所述多通道邊信息配置數(shù)據(jù)(74)來配置多通道解碼器(44e),并且向這樣配置的多通道解碼器(44e)給送所述擴(kuò)展元素類型的相應(yīng)幀元素(22b )的有效載荷數(shù)據(jù)(68 )作為多通道邊信息,以及 通過如下方式對(duì)定位在由所述類型指示部分指示出所述擴(kuò)展元素類型并且由所述配置元素(56)的所述擴(kuò)展元素類型指示出所述多對(duì)象邊信息類型的任何元素位置處的所述擴(kuò)展元素類型的所述幀元素進(jìn)行解碼:使用所述多對(duì)象邊信息配置數(shù)據(jù)(74)來配置多對(duì)象解碼器(44d),并且向這樣配置的多對(duì)象解碼器(44d)給送所述擴(kuò)展元素類型的相應(yīng)幀元素(22b)的有效載荷數(shù)據(jù)(68)作為多對(duì)象信息。
19.根據(jù)權(quán)利要求17或18所述的解碼器,其中,所述解碼器被配置為針對(duì)由所述類型指示部分指示出所述擴(kuò)展元素類型的任何元素位置, 從所述比特流(12)讀取配置數(shù)據(jù)長(zhǎng)度字段(76)作為針對(duì)相應(yīng)元素位置的所述配置元素的所述配置信息的一部分,以獲得配置數(shù)據(jù)長(zhǎng)度, 檢查由對(duì)于所述相應(yīng)元素位置的所述配置元素的所述配置信息的所述擴(kuò)展元素類型字段(72)指示的所述有效載荷數(shù)據(jù)類型是否屬于作為所述多個(gè)有效載荷數(shù)據(jù)類型的子集的有效載荷數(shù)據(jù)類型預(yù)定集合, 如果由針對(duì)所述相應(yīng)元素位置的所述配置元素的所述配置信息的所述擴(kuò)展元素類型字段(72)指示的所述有效載荷數(shù)據(jù)類型屬于所述有效載荷數(shù)據(jù)類型預(yù)定集合,則 從所述數(shù)據(jù)流(12)讀取作為針對(duì)所述相應(yīng)元素位置的所述配置元素的所述配置信息的一部分的依賴于有效載荷數(shù)據(jù)的配置數(shù)據(jù)(74),以及 使用所述依賴于有效載荷數(shù)據(jù)的配置數(shù)據(jù)(74),對(duì)所述幀(20)中的所述相應(yīng)元素位置處的所述擴(kuò)展元素類型的所述幀元素進(jìn)行解碼,以及 如果由針對(duì)所述相應(yīng)元素位置的所述配置元素的所述配置信息的所述擴(kuò)展元素類型字段(72)指示的所述有效載荷數(shù)據(jù)類型不屬于所述有效載荷數(shù)據(jù)類型的預(yù)定集合,則使用所述配置數(shù)據(jù)長(zhǎng)度來跳過所述依賴于有效載荷數(shù)據(jù)的配置數(shù)據(jù)(74),以及 使用在所述幀(20)中的所述相應(yīng)元素位置處的所述擴(kuò)展元素類型的所述幀元素中的所述長(zhǎng)度信息(58)來跳過所述幀元素。
20.根據(jù)權(quán)利要求13至19中任一項(xiàng)所述的解碼器,其中, 所述解碼器被配置為:在讀取所述配置塊(28 )時(shí),針對(duì)由所述類型指示部分(52 )指示出所述擴(kuò)展元素類型的每個(gè)元素位置, 從所述比特流(12)讀取包括針對(duì)所述擴(kuò)展元素類型的配置信息的配置元素(56),其中,所述配置信息包括分段使用標(biāo)記(78),以及 所述解碼器被配置為:在讀取定位在由所述類型指示部分指示出所述擴(kuò)展元素類型并且所述配置元素的所述分段使用標(biāo)記(78)被設(shè)定的任何元素位置處的幀元素(22)時(shí), 從所述比特流讀取分段信息,以及 使用所述分段信息將連續(xù)幀的這些幀元素的有效載荷數(shù)據(jù)放在一起。
21.根據(jù)權(quán)利要求9至20中任一項(xiàng)所述的解碼器,其中,所述解碼器被配置為使得在對(duì)所述幀(20)中的位于由所述類型指示語法部分指示出單通道元素類型的元素位置處的幀元素(22)進(jìn)行解碼時(shí),所述解碼器重建音頻信號(hào)。
22.根據(jù)權(quán)利要求9至21中任一項(xiàng)所述的解碼器,其中,所述解碼器被配置為使得在對(duì)所述幀(20)中的位于由所述類型指示語法部分指示出通道對(duì)元素類型的元素位置處的幀元素(22)進(jìn)行解碼時(shí),所述解碼器重建兩個(gè)音頻信號(hào)。
23.根據(jù)權(quán)利要求9至22中任一項(xiàng)所述的解碼器,其中,所述解碼器被配置為使用相同的可變長(zhǎng)度代碼來讀取所述長(zhǎng)度信息(80)、所述擴(kuò)展元素類型字段(72)以及所述配置數(shù)據(jù)長(zhǎng)度字段(76)。
24.一種用于將音頻內(nèi)容編碼到比特流中的編碼器,所述編碼器被配置為: 將所述音頻內(nèi)容(10)的連續(xù)時(shí)間周期(18)編碼為幀(20)序列,使得每個(gè)幀(20)包括元素?cái)?shù)目為N的幀元素(22 )序列,其中所述幀(20 )分別表示所述音頻內(nèi)容(10 )的所述連續(xù)時(shí)間周期(18),每個(gè)幀元素(22)具有多個(gè)元素類型中的相應(yīng)一個(gè)類型,使得定位在所述幀元素序列的N個(gè)元素位置的序列中的任何公共元素位置處的幀的幀元素(22)具有相同元素類型, 將配置塊(28)編碼到所述比特流(12)中,所述配置塊(28)包括指示元素的數(shù)目N的字段以及類型指示語法部分,所述類型指示語法部分針對(duì)所述N個(gè)元素位置的序列中的每個(gè)元素位置指示相應(yīng)元素類型,以及 針對(duì)每個(gè)幀(20),將所述N個(gè)幀元素(22)的序列編碼到所述比特流(12)中,使得定位在所述比特流(12)中的所述N個(gè)幀元素(22)的序列內(nèi)的相應(yīng)元素位置處的所述N個(gè)幀元素的序列中的每個(gè)幀元素(22)具有由所述類型指示部分針對(duì)所述相應(yīng)元素位置指示的元素類型。
25.一種用于對(duì)比特流(12)進(jìn)行解碼的方法,所述比特流(12)包括配置塊(28)和幀(20)序列,所述幀(20)分別表示音頻內(nèi)容的連續(xù)時(shí)間周期,其中,所述配置塊(28)包括指示元素的數(shù)目N的字段(50 )以及類型指示語法部分(52 ),所述類型指示語法部分(52 )針對(duì)N個(gè)元素位置的序列中的每個(gè)元素位置指示多個(gè)元素類型中的元素類型,并且其中,所述幀序列中的每個(gè)幀包括N個(gè)幀元素的序列,其中,所述方法包括通過以下方式對(duì)每個(gè)幀(20)進(jìn)行解碼: 根據(jù)所述元素類型對(duì)每個(gè)幀元素(22 )進(jìn)行解碼,所述元素類型由所述類型指示語法部分針對(duì)相應(yīng)幀元素在所述比特流(12)中的相應(yīng)幀(20)的所述N個(gè)幀元素(22)的序列內(nèi)所定位的相應(yīng)元素位置來指示。
26.一種用于將音頻內(nèi)容編碼到比特流中的方法,所述方法包括: 將所述音頻內(nèi)容(10)的連續(xù)時(shí)間周期(18)編碼為幀(20)序列,使得每個(gè)幀(20)包括元素?cái)?shù)目為N的幀元素(22 )序列,其中所述幀(20 )分別表示所述音頻內(nèi)容(10 )的所述連續(xù)時(shí)間周期(18),每個(gè)幀元素(22)具有多個(gè)元素類型中的相應(yīng)一個(gè)類型,使得定位在所述幀元素序列的N個(gè)元素位置的序列中的任何公共元素位置處的幀的幀元素(22)具有相同元素類型, 將配置塊(28)編碼到所述比特流(12)中,所述配置塊(28)包括指示元素的數(shù)目N的字段以及類型指示語法部分,所述類型指示語法部分針對(duì)所述N個(gè)元素位置的序列中的每個(gè)元素位置來指示相應(yīng)元素類型,以及 針對(duì)每個(gè)幀(20),將所述N個(gè)幀元素(22)的序列編碼到所述比特流(12)中,使得定位在所述比特流(12) 中的所述N個(gè)幀元素(22)的序列內(nèi)的相應(yīng)元素位置處的所述N個(gè)幀元素的序列中的每個(gè)幀元素(22)具有由所述類型指示部分針對(duì)所述相應(yīng)元素位置指示的元素類型。
27.一種計(jì)算機(jī)程序,用于當(dāng)在計(jì)算機(jī)上運(yùn)行時(shí)執(zhí)行根據(jù)權(quán)利要求25或權(quán)利要求26所述的方法。
【文檔編號(hào)】G10L19/16GK103703511SQ201280023527
【公開日】2014年4月2日 申請(qǐng)日期:2012年3月19日 優(yōu)先權(quán)日:2011年3月18日
【發(fā)明者】馬克斯·諾伊恩多夫, 馬庫斯·穆爾特魯斯, 斯特凡·德勒, ??啤て諣柟? 弗蘭斯·德邦特 申請(qǐng)人:弗蘭霍菲爾運(yùn)輸應(yīng)用研究公司, 杜比國(guó)際公司, 皇家飛利浦股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1