2014年10月10日申請的標題為“高階立體混響音頻數(shù)據(jù)的可縮放譯碼(SCALABLECODINGOFHIGHERORDERAMBISONICAUDIODATA)”的第62/062,584號美國臨時申請案;2014年11月25日申請的標題為“高階立體混響音頻數(shù)據(jù)的可縮放譯碼(SCALABLECODINGOFHIGHERORDERAMBISONICAUDIODATA)”的第62/084,461號美國臨時申請案;2014年12月3日申請的標題為“高階立體混響音頻數(shù)據(jù)的可縮放譯碼(SCALABLECODINGOFHIGHERORDERAMBISONICAUDIODATA)”的第62/087,209號美國臨時申請案;2014年12月5日申請的標題為“高階立體混響音頻數(shù)據(jù)的可縮放譯碼(SCALABLECODINGOFHIGHERORDERAMBISONICAUDIODATA)”的第62/088,445號美國臨時申請案;2015年4月10日申請的標題為“高階立體混響音頻數(shù)據(jù)的可縮放譯碼(SCALABLECODINGOFHIGHERORDERAMBISONICAUDIODATA)”的第62/145,960號美國臨時申請案;2015年6月12日申請的標題為“高階立體混響音頻數(shù)據(jù)的可縮放譯碼(SCALABLECODINGOFHIGHERORDERAMBISONICAUDIODATA)”的第62/175,185號美國臨時申請案;2015年7月1日申請的標題為“降低高階立體混響(HOA)背景聲道之間的相關(guān)(REDUCINGCORRELATIONBETWEENHIGHERORDERAMBISONIC(HOA)BACKGROUNDCHANNELS)”的第62/187,799號美國臨時申請案,以及2015年8月25日申請的標題為“傳輸經(jīng)譯碼可縮放音頻數(shù)據(jù)(TRANSPORTINGCODEDSCALABLEAUDIODATA)”的第62/209,764號美國臨時申請案,所述申請案中的每一者的全部內(nèi)容以引用的方式并入本文中。
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻數(shù)據(jù),且更具體來說,涉及高階立體混響音頻數(shù)據(jù)的可縮放譯碼。
背景技術(shù):
:高階立體混響(HOA)信號(通常由多個球諧系數(shù)(SHC)或其它階層元素表示)是聲場的三維表示。HOA或SHC表示可以獨立于用以回放從SHC信號渲染的多聲道音頻信號的局部揚聲器幾何布置的方式來表示聲場。SHC信號還可促進向后兼容性,因為可將SHC信號渲染為眾所周知的且被廣泛采用的多聲道格式(例如,5.1音頻聲道格式或7.1音頻聲道格式)。SHC表示因此可實現(xiàn)對聲場的更好表示,其也適應(yīng)向后兼容性。技術(shù)實現(xiàn)要素:一般來說,描述用于高階立體混響音頻數(shù)據(jù)的可縮放譯碼的技術(shù)。高階立體混響音頻數(shù)據(jù)可包括對應(yīng)于具有大于一的階數(shù)的球諧基底函數(shù)的至少一個高階立體混響(HOA)系數(shù)。所述技術(shù)可通過使用例如基礎(chǔ)層和一個或多個增強層等多個層對HOA系數(shù)進行譯碼來提供HOA系數(shù)的可縮放譯碼。所述基礎(chǔ)層可允許再現(xiàn)由所述HOA系數(shù)表示的聲場,所述聲場可由所述一個或多個增強層增強。換句話說,所述增強層(與所述基礎(chǔ)層組合)可提供允許與單獨所述基礎(chǔ)層相比更完整(或,更準確)地再現(xiàn)所述聲場的額外分辨率。在一個方面中,一種裝置經(jīng)配置以對表示高階立體混響音頻信號的位流進行解碼。所述裝置包括:存儲器,其經(jīng)配置以存儲所述位流;以及一個或多個處理器,其經(jīng)配置以從所述位流獲得在所述位流中指定的層的數(shù)目的指示,且基于層的所述數(shù)目的所述指示而獲得所述位流的所述層。在另一方面中,一種對表示高階立體混響音頻信號的位流進行解碼的方法,所述方法包括:從所述位流獲得在所述位流中指定的層的數(shù)目的指示,且基于層的所述數(shù)目的所述指示而獲得所述位流的所述層。在另一方面中,一種設(shè)備經(jīng)配置以對表示高階立體混響音頻信號的位流進行解碼。所述設(shè)備包括:用于存儲所述位流的裝置;用于從所述位流獲得在所述位流中指定的層的數(shù)目的指示的裝置;以及用于基于層的所述數(shù)目的所述指示而獲得所述位流的所述層的裝置。在另一方面中,一種非暫時性計算機可讀存儲媒體上存儲有指令,所述指令在執(zhí)行時致使一個或多個處理器從位流獲得在所述位流中指定的層的數(shù)目的指示,且基于層的所述數(shù)目的所述指示而獲得所述位流的所述層。在另一方面中,一種裝置經(jīng)配置以對高階立體混響音頻信號進行編碼以產(chǎn)生位流。所述裝置包括:存儲器,其經(jīng)配置以存儲所述位流;以及一個或多個處理器,其經(jīng)配置以在所述位流中指定層的數(shù)目的指示,且輸出包含所述層的所述所指示數(shù)目的所述位流。在另一方面中,一種產(chǎn)生表示高階立體混響音頻信號的位流的方法,所述方法包括:在所述位流中指定層的數(shù)目的指示;以及輸出包含所述層的所述所指示數(shù)目的所述位流。在另一方面中,一種裝置經(jīng)配置以對表示高階立體混響音頻信號的位流進行解碼。所述裝置包括:存儲器,其經(jīng)配置以存儲所述位流;以及一個或多個處理器,其經(jīng)配置以從所述位流獲得在所述位流中的一個或多個層中指定的聲道的數(shù)目的指示,且基于聲道的所述數(shù)目的所述指示而獲得在所述位流中的所述一個或多個層中指定的所述聲道。在另一方面中,一種對表示高階立體混響音頻信號的位流進行解碼的方法,所述方法包括:從所述位流獲得在所述位流中的一個或多個層中指定的聲道的數(shù)目的指示;以及基于聲道的所述數(shù)目的所述指示而獲得在所述位流中的所述一個或多個層中指定的所述聲道。在另一方面中,一種裝置經(jīng)配置以對表示高階立體混響音頻信號的位流進行解碼。所述裝置包括:用于從所述位流獲得在所述位流中的一個或多個層中指定的聲道的數(shù)目的指示的裝置;以及用于基于聲道的所述數(shù)目的所述指示而獲得在所述位流中的所述一個或多個層中指定的所述聲道的裝置。在另一方面中,一種非暫時性計算機可讀存儲媒體上存儲有指令,所述指令在執(zhí)行時致使一個或多個處理器從表示高階立體混響音頻信號的位流獲得在所述位流中的一個或多個層中指定的聲道的數(shù)目的指示,且基于聲道的所述數(shù)目的所述指示而獲得在所述位流中的所述一個或多個層中指定的所述聲道。在另一方面中,一種裝置經(jīng)配置以對高階立體混響音頻信號進行編碼以產(chǎn)生位流。所述裝置包括:一個或多個處理器,其經(jīng)配置以在所述位流中指定在所述位流的一個或多個層中指定的聲道的數(shù)目的指示,且在所述位流的所述一個或多個層中指定所述聲道的所述所指示數(shù)目;以及存儲器,其經(jīng)配置以存儲所述位流。在另一方面中,一種對高階立體混響音頻信號進行編碼以產(chǎn)生位流的方法,所述方法包括:在所述位流中指定在所述位流的一個或多個層中指定的聲道的數(shù)目的指示;以及在所述位流的所述一個或多個層中指定所述聲道的所述所指示數(shù)目。在附圖和以下描述中陳述所述技術(shù)的一個或多個方面的細節(jié)。所述技術(shù)的其它特征、目標和優(yōu)點將從所述描述和附圖以及權(quán)利要求而顯而易見。附圖說明圖1是說明具有各種階數(shù)及子階數(shù)的球諧基底函數(shù)的圖。圖2是說明可執(zhí)行本發(fā)明中所描述的技術(shù)的各種方面的系統(tǒng)的圖。圖3是更詳細說明可執(zhí)行本發(fā)明中描述的技術(shù)的各種方面的圖2的實例中所示的音頻編碼裝置的一個實例的框圖。圖4是更詳細地說明圖2的音頻解碼裝置的框圖。圖5是更詳細地說明在經(jīng)配置以執(zhí)行本發(fā)明中描述的可縮放音頻譯碼技術(shù)的潛在版本中的第一者時的圖3的位流產(chǎn)生單元的圖。圖6是更詳細地說明在經(jīng)配置以執(zhí)行本發(fā)明中描述的可縮放音頻解碼技術(shù)的潛在版本中的第一者時的圖4的提取單元的圖。圖7A到7D是說明音頻編碼裝置在產(chǎn)生高階立體混響(HOA)系數(shù)的經(jīng)編碼雙層表示時的實例操作的流程圖。圖8A和8B是說明音頻編碼裝置在產(chǎn)生HOA系數(shù)的經(jīng)編碼三層表示時的實例操作的流程圖。圖9A和9B是說明音頻編碼裝置在產(chǎn)生HOA系數(shù)的經(jīng)編碼四層表示時的實例操作的流程圖。圖10是說明根據(jù)所述技術(shù)的各種方面的在位流中指定的HOA配置對象的實例的圖。圖11是說明由位流產(chǎn)生單元針對第一層和第二層產(chǎn)生的邊帶信息的圖。圖12A和12B是說明根據(jù)本發(fā)明中描述的技術(shù)的可縮放譯碼方面產(chǎn)生的邊帶信息的圖。圖13A和13B是說明根據(jù)本發(fā)明中描述的技術(shù)的可縮放譯碼方面產(chǎn)生的邊帶信息的圖。圖14A和14B是說明音頻編碼裝置在執(zhí)行本發(fā)明中描述的技術(shù)的各種方面時的實例操作的流程圖。圖15A和15B是說明音頻解碼裝置在執(zhí)行本發(fā)明中描述的技術(shù)的各種方面時的實例操作的流程圖。圖16是說明根據(jù)本發(fā)明中描述的技術(shù)的各種方面的如由圖16的實例中所示的位流產(chǎn)生單元執(zhí)行的可縮放音頻譯碼的圖。圖17是其中語法元素指示存在兩個層的實例的概念圖,其中在基礎(chǔ)層中指定四個經(jīng)編碼環(huán)境HOA系數(shù),且在增強層中指定兩個經(jīng)編碼前景信號。圖18是更詳細地說明在經(jīng)配置以執(zhí)行本發(fā)明中描述的可縮放音頻譯碼技術(shù)的潛在版本中的第二者時的圖3的位流產(chǎn)生單元的圖。圖19是更詳細地說明在經(jīng)配置以執(zhí)行本發(fā)明中描述的可縮放音頻解碼技術(shù)的潛在版本中的第二者時的圖3的提取單元的圖。圖20是說明圖18的位流產(chǎn)生單元和圖19的提取單元可借以執(zhí)行本發(fā)明中描述的技術(shù)的潛在版本中的第二者的第二使用情況的圖。圖21是其中語法元素指示存在三個層的實例的概念圖,其中在基礎(chǔ)層中指定兩個經(jīng)編碼環(huán)境HOA系數(shù),在第一增強層中指定兩個經(jīng)編碼前景信號,且在第二增強層中指定兩個經(jīng)編碼前景信號。圖22是更詳細地說明在經(jīng)配置以執(zhí)行本發(fā)明中描述的可縮放音頻譯碼技術(shù)的潛在版本中的第三者時的圖3的位流產(chǎn)生單元的圖。圖23是更詳細地說明在經(jīng)配置以執(zhí)行本發(fā)明中描述的可縮放音頻解碼技術(shù)的潛在版本中的第三者時的圖4的提取單元的圖。圖24是根據(jù)本發(fā)明中描述的技術(shù)的說明音頻編碼裝置可借以在多層位流中指定多個層的第三使用情況的圖。圖25是其中語法元素指示存在三個層的實例的概念圖,其中在基礎(chǔ)層中指定兩個經(jīng)編碼前景信號,在第一增強層中指定兩個經(jīng)編碼前景信號,且在第二增強層中指定兩個經(jīng)編碼前景信號。圖26是根據(jù)本發(fā)明中描述的技術(shù)的說明音頻編碼裝置可借以在多層位流中指定多個層的第三使用情況的圖。圖27和28是說明可經(jīng)配置以執(zhí)行本發(fā)明中描述的技術(shù)的各種方面的可縮放位流產(chǎn)生單元和可縮放位流提取單元的框圖。圖29表示表示可經(jīng)配置以根據(jù)本發(fā)明中描述的技術(shù)的各種方面而操作的編碼器的概念圖。圖30是更詳細地說明圖27的實例中所示的編碼器的圖。圖31是說明可經(jīng)配置以根據(jù)本發(fā)明中描述的技術(shù)的各種方面而操作的音頻解碼器的框圖。具體實施方式環(huán)繞聲的演進現(xiàn)今已使得許多輸出格式可用于娛樂。此等消費型環(huán)繞聲格式的實例大部分為“聲道”式的,這是因為其以某些幾何坐標隱含地指定到擴音器的饋入。消費型環(huán)繞聲格式包含普遍的5.1格式(其包含以下六個聲道:左前(FL)、右前(FR)、中心或前中心、左后或左環(huán)繞、右后或右環(huán)繞,以及低頻效應(yīng)(LFE))、發(fā)展中的7.1格式、包含高度揚聲器的各種格式,例如7.1.4格式和22.2格式(例如,供與超高清晰電視標準一起使用)。非消費型格式可涵括任何數(shù)目的揚聲器(成對稱和非對稱幾何形狀),其常常稱為“環(huán)繞陣列”。此陣列的一個實例包含被安置在截角二十面體的拐角上的坐標上的32個擴音器。到未來MPEG編碼器的輸入視情況為三個可能格式中的一者:(i)傳統(tǒng)的基于聲道的音頻(如上文所論述),其意圖由處于預(yù)先指定的位置處的擴音器播放;(ii)基于對象的音頻,其涉及用于單個音頻對象的具有含有其位置坐標(以及其它信息)的相關(guān)聯(lián)元數(shù)據(jù)的離散脈碼調(diào)制(PCM)數(shù)據(jù);以及(iii)基于場景的音頻,其涉及使用球諧基底函數(shù)的系數(shù)(也稱為“球諧系數(shù)”或SHC、“高階立體混響”或HOA及“HOA系數(shù)”)來表示聲場。未來MPEG編碼器更詳細地描述于國際標準化組織/國際電工委員會(ISO)/(IEC)JTC1/SC29/WG11/N13411的標題為“要求對于3D音頻的提議(CallforProposalsfor3DAudio)”的文獻中,所述文獻于2013年1月在瑞士日內(nèi)瓦發(fā)布,且可在http://mpeg.chiariglione.org/sites/default/files/files/standards/parts/docs/w13411.zip獲得。在市場中存在各種“環(huán)繞聲”基于聲道的格式。它們的范圍(例如)是從5.1家庭影院系統(tǒng)(其在使起居室享有立體聲方面已獲得最大成功)到NHK(日本廣播協(xié)會或日本廣播公司)所開發(fā)的22.2系統(tǒng)。內(nèi)容創(chuàng)建者(例如,好萊塢工作室)將希望一次產(chǎn)生電影的音軌,而不用花費精力來針對每個揚聲器配置對其進行再混合。近來,標準開發(fā)組織(StandardsDevelopingOrganizations)一直在考慮如下方式:提供到標準化位流中的編碼,以及后續(xù)解碼,其可調(diào)適且不知曉回放位置(涉及渲染器)處的揚聲器幾何布置(和數(shù)目)以及聲學條件。為向內(nèi)容創(chuàng)建者提供此種靈活性,可使用分層要素集合來表示聲場。所述分層要素集合可指其中元素經(jīng)排序以使得較低階元素的基礎(chǔ)集合提供模型化聲場的完整表示的一組元素。在所述集合擴展以包含高階元素時,所述表示變得更詳細,從而增加分辨率。分層要素集合的一個實例是球諧系數(shù)(SHC)的集合。以下表達式示范使用SHC對聲場的描述或表示:所述表達式展示,聲場的任一點在時間t的壓力pi可由SHC,唯一地表示。此處,c為聲速(約343m/s),為參考點(或觀測點),jn(·)為階n的球貝塞耳函數(shù)(sphericalBesselfunction),且為階n和子階m的球諧基底函數(shù)??杀孀R到,方括號中的項為信號的頻域表示(即,),其可由各種時頻變換近似表示,例如離散傅里葉變換(DFT)、離散余弦變換(DCT)或小波變換。分層集合的其它實例包含小波變換系數(shù)的集合和多分辨率基底函數(shù)的系數(shù)的其它集合。圖1是說明從零階(n=0)到四階(n=4)的球諧基底函數(shù)的圖。如可看出,對于每一階,存在子階m的擴展,出于易于說明的目的,在圖1的實例中展示所述子階但未明確提到。SHC可以通過各種麥克風陣列配置以物理方式來獲取(例如,記錄),或替代地,它們可以從聲場的基于聲道或基于對象的描述導出。SHC表示基于場景的音頻,其中SHC可輸入到音頻編碼器以獲得經(jīng)編碼SHC,所述經(jīng)編碼SHC可促成更有效的發(fā)射或存儲。舉例來說,可使用涉及(1+4)2個(25,且因此為四階)系數(shù)的四階表示。如上文所指出,可使用麥克風陣列從麥克風記錄導出SHC??扇绾螐柠溈孙L陣列導出SHC的各種實例描述于波萊蒂·M(Poletti,M)的“基于球面諧波的三維環(huán)繞聲系統(tǒng)(Three-DimensionalSurroundSoundSystemsBasedonSphericalHarmonics)”(聽覺工程學協(xié)會會刊(J.AudioEng.Soc.),第53卷,第11期,2005年11月,第1004-1025頁)中。為說明如何可從基于對象的描述導出SHC,考慮以下方程式??蓪?yīng)于個別音頻對象的聲場的系數(shù)表達為:其中i為為階數(shù)為n的(第二種)球面漢克爾函數(shù)(sphericalHankelfunction),且為對象的位置。根據(jù)頻率知曉對象源能量g(ω)(例如,使用時間-頻率分析技術(shù),例如對PCM流執(zhí)行快速傅立葉變換)允許我們將每一PCM對象及對應(yīng)位置轉(zhuǎn)換為SHC另外,可以看出(由于上式為線性正交分解),每一對象的系數(shù)是累加性的。以此方式,PCM對象的量值可由系數(shù)表示(例如,表示為個別對象的系數(shù)向量的和)。基本上,所述系數(shù)含有關(guān)于聲場的信息(隨3D坐標而變的壓力),且上式表示從個別對象到觀測點附近的總體聲場表示的變換。下文在基于對象和基于SHC的音頻譯碼的上下文中描述其余各圖。圖2是說明可執(zhí)行本發(fā)明中描述的技術(shù)的各種方面的系統(tǒng)10的圖。如圖2的實例所示,系統(tǒng)10包含內(nèi)容創(chuàng)建者裝置12和內(nèi)容消費者裝置14。雖然在所述內(nèi)容創(chuàng)建者裝置12和所述內(nèi)容消費者裝置14的情形中描述,但是所述技術(shù)可在聲場的SHC(其也可被稱作HOA系數(shù))或任何其它分層表示被編碼以形成表示音頻數(shù)據(jù)的位流的任何情形中實現(xiàn)。此外,內(nèi)容創(chuàng)建者裝置12可表示能夠?qū)嵤┍景l(fā)明中所描述的技術(shù)的任何形式的計算裝置,包含手持機(或蜂窩式電話)、平板計算機、智能電話或臺式計算機(提供幾個實例)。同樣,內(nèi)容消費者裝置14可表示能夠?qū)嵤┍景l(fā)明中所描述的技術(shù)的任何形式的計算裝置,包含手持機(或蜂窩式電話)、平板計算機、智能電話、機頂盒,或臺式計算機(提供幾個實例)。內(nèi)容創(chuàng)建者裝置12可通過電影工作室或可產(chǎn)生用于由內(nèi)容消費者裝置,例如內(nèi)容消費者裝置14的操作者消費的多聲道音頻內(nèi)容的其它實體來操作。在一些實例中,內(nèi)容創(chuàng)建者裝置12可由希望壓縮HOA系數(shù)11的個人用戶操作。通常,內(nèi)容創(chuàng)建者可產(chǎn)生音頻內(nèi)容以及視頻內(nèi)容。內(nèi)容消費者裝置14可由個人操作。內(nèi)容消費者裝置14可包含音頻回放系統(tǒng)16,其可指能夠渲染SHC以用于作為多聲道音頻內(nèi)容回放的任何形式的音頻回放系統(tǒng)。內(nèi)容創(chuàng)建者裝置12包含音頻編輯系統(tǒng)18。內(nèi)容創(chuàng)建者裝置12可獲得各種格式(包含直接作為HOA系數(shù))的實時記錄7和音頻對象9,內(nèi)容創(chuàng)建者裝置12可使用音頻編輯系統(tǒng)18對其進行編輯。麥克風5可俘獲實時記錄7。在編輯過程期間,內(nèi)容創(chuàng)建者可渲染來自音頻對象9的HOA系數(shù)11,收聽所渲染的揚聲器饋給以試圖識別需要進一步編輯的聲場的各個方面。內(nèi)容創(chuàng)建者裝置12可接著編輯HOA系數(shù)11(可能經(jīng)由操縱可以上文所描述的方式從中導出源HOA系數(shù)的音頻對象9中的不同者而間接地編輯)。內(nèi)容創(chuàng)建者裝置12可使用音頻編輯系統(tǒng)18來產(chǎn)生HOA系數(shù)11。音頻編輯系統(tǒng)18表示能夠編輯音頻數(shù)據(jù)且輸出所述音頻數(shù)據(jù)作為一個或多個源球諧系數(shù)的任何系統(tǒng)。當編輯過程完成時,內(nèi)容創(chuàng)建者裝置12可基于HOA系數(shù)11產(chǎn)生位流21。即,內(nèi)容創(chuàng)建者裝置12包含音頻編碼裝置20,所述音頻編碼裝置表示經(jīng)配置以根據(jù)本發(fā)明中描述的技術(shù)的各種方面編碼或以其它方式壓縮HOA系數(shù)11以產(chǎn)生位流21的裝置。音頻編碼裝置20可產(chǎn)生位流21以用于跨越傳輸信道(其可為有線或無線信道、數(shù)據(jù)存儲裝置或其類似者)發(fā)射(作為一個實例)。位流21可表示HOA系數(shù)11的經(jīng)編碼版本,且可包含主要位流和另一旁側(cè)位流(其可稱為旁側(cè)聲道信息)。雖然在圖2中展示為直接發(fā)射到內(nèi)容消費者裝置14,但內(nèi)容創(chuàng)建者裝置12可將音頻位流21輸出到定位于內(nèi)容創(chuàng)建者裝置12與內(nèi)容消費者裝置14之間的中間裝置。所述中間裝置可存儲音頻位流21以用于稍后遞送到可能請求所述位流的內(nèi)容消費者裝置14。所述中間裝置可包括文件服務(wù)器、網(wǎng)絡(luò)服務(wù)器、臺式計算機、膝上型計算機、平板計算機、移動電話、智能電話,或能夠存儲位流21以供音頻解碼器稍后檢索的任何其它裝置。中間裝置可駐留在能夠?qū)⑽涣?1流式傳輸(且可能結(jié)合發(fā)射對應(yīng)視頻數(shù)據(jù)位流)到請求位流21的訂戶(例如,內(nèi)容消費者裝置14)的內(nèi)容遞送網(wǎng)絡(luò)中?;蛘?,內(nèi)容創(chuàng)建者裝置12可將位流21存儲到存儲媒體,例如壓縮光盤、數(shù)字視頻光盤、高清視頻光盤或其它存儲媒體,其中大多數(shù)能夠由計算機讀取且因此可稱為計算機可讀存儲媒體或非暫時性計算機可讀存儲媒體。在此上下文中,傳輸信道可指借以發(fā)射存儲到媒體的內(nèi)容的信道(且可包含零售商店及其它基于商店的遞送機制)。因而,在任何情況下,就此而言,本發(fā)明的技術(shù)不應(yīng)限于圖2的實例。如圖2的實例中進一步展示,內(nèi)容消費者裝置14包含音頻回放系統(tǒng)16。音頻回放系統(tǒng)16可表示能夠回放多聲道音頻數(shù)據(jù)的任何音頻回放系統(tǒng)。音頻回放系統(tǒng)16可包含數(shù)個不同渲染器22。渲染器22可各自提供不同形式的渲染,其中不同形式的渲染可包含執(zhí)行向量基振幅平移(VBAP)的各種方式中的一者或多者及/或執(zhí)行聲場合成的各種方式中的一者或多者。如本文所使用,“A和/或B”意味著“A或B”,或“A和B”兩者。音頻回放系統(tǒng)16可進一步包含音頻解碼裝置24。音頻解碼裝置24可表示經(jīng)配置以對來自位流21的HOA系數(shù)11'進行解碼的裝置,其中HOA系數(shù)11'可類似于HOA系數(shù)11,但歸因于有損操作(例如,量化)和/或經(jīng)由傳輸信道的傳輸而不同。音頻回放系統(tǒng)16可在對位流21進行解碼之后獲得HOA系數(shù)11'并渲染HOA系數(shù)11'以輸出擴音器饋給25。擴音器饋給25可驅(qū)動一個或多個擴音器(其為便于說明的目的而未在圖2的實例中展示)。為了選擇適當渲染器或在一些情況下產(chǎn)生適當渲染器,音頻回放系統(tǒng)16可獲得指示擴音器的數(shù)目和/或擴音器的空間幾何布置的擴音器信息13。在一些情況下,音頻回放系統(tǒng)16可使用參考麥克風且以使得動態(tài)地確定擴音器信息13的方式驅(qū)動擴音器來獲得擴音器信息13。在其它情況下或結(jié)合擴音器信息13的動態(tài)確定,音頻回放系統(tǒng)16可提示用戶與音頻回放系統(tǒng)16介接并輸入擴音器信息13。音頻回放系統(tǒng)16可隨后基于擴音器信息13選擇音頻渲染器22中的一者。在一些情況下,在音頻渲染器22中無一者處于到擴音器信息13中所指定的擴音器幾何布置的某一閾值相似性量度(就擴音器幾何布置來說)內(nèi)時,音頻回放系統(tǒng)16可基于擴音器信息13產(chǎn)生音頻渲染器22中的一者。音頻回放系統(tǒng)16可在一些情況下基于擴音器信息13產(chǎn)生音頻渲染器22中的一者,而無需首先試圖選擇音頻渲染器22中的現(xiàn)有者。一個或多個揚聲器3接著可回放經(jīng)渲染擴音器饋給25。換句話說,揚聲器3可經(jīng)配置以基于高階立體混響音頻數(shù)據(jù)再現(xiàn)聲場。圖3是更詳細地說明可執(zhí)行本發(fā)明中描述的技術(shù)的各種方面的圖2的實例中所展示的音頻編碼裝置20的一個實例的框圖。音頻編碼裝置20包含內(nèi)容分析單元26、基于向量的分解單元27和基于方向的分解單元28。盡管下文簡要描述,但關(guān)于基于向量的分解單元27以及壓縮HOA系數(shù)的各個方面的較多信息在2014年5月29日申請的標題為“聲場的經(jīng)分解表示的內(nèi)插(INTERPOLATIONFORDECOMPOSEDREPRESENTATIONSOFASOUNDFIELD)”的第WO2014/194099號國際專利申請案中可用。此外,根據(jù)MPEG-H3D音頻標準壓縮HOA系數(shù)的各種方面的更多細節(jié)(包含下方概述的基于向量的分解的論述)可見于:標題為“信息技術(shù)-異質(zhì)環(huán)境中的高效率譯碼和媒體遞送-第3部分:3D音頻(Informationtechnology-Highefficiencycodingandmediadeliveryinheterogeneousenvironments-Part3:3Daudio)”的ISO/IECDIS23008-3文檔,ISO/IECJTC1/SC29/WG11,2014年7月25日(可見于:http://mpeg.chiariglione.org/standards/mpeg-h/3d-audio/dis-mpeg-h-3d-audio,下文稱為“MPEG-H3D音頻標準階段I”);標題為“信息技術(shù)-異質(zhì)環(huán)境中的高效率譯碼和媒體遞送-第3部分:3D音頻,修正3:MPEG-H3D音頻階段2(Informationtechnology-Highefficiencycodingandmediadeliveryinheterogeneousenvironments-Part3:3Daudio,AMENDMENT3:MPEG-H3DAudioPhase2)”的ISO/IECDIS23008-3:2015/PDAM3文檔,ISO/IECJTC1/SC29/WG11,2015年7月25日(可見于:http://mpeg.chiariglione.org/standards/mpeg-h/3d-audio/text-isoiec-23008-3201xpdam-3-mpeg-h-3d-audio-phase-2,且下文稱為“MPEG-H3D音頻標準階段II”);以及JürgenHerre等人,標題為“MPEG-H3D音頻-沉浸式3D音效譯碼新標準(MPEG-H3DAudio-TheNewStandardforCodingofImmersiveSpatialAudio)”,2015年8月,于IEEE信號處理專題雜志(IEEEJournalofSelectedTopicsinSignalProcessing)第9卷第5期發(fā)表。內(nèi)容分析單元26表示經(jīng)配置以分析HOA系數(shù)11的內(nèi)容以識別HOA系數(shù)11表示從實況記錄產(chǎn)生的內(nèi)容還是從音頻對象產(chǎn)生的內(nèi)容的單元。內(nèi)容分析單元26可確定HOA系數(shù)11是從實際聲場的記錄產(chǎn)生還是從人工音頻對象產(chǎn)生。在一些情況下,當幀式HOA系數(shù)11是從記錄中產(chǎn)生時,內(nèi)容分析單元26將HOA系數(shù)11傳遞到基于向量的分解單元27。在一些情況下,當幀式HOA系數(shù)11是從合成音頻對象中產(chǎn)生時,內(nèi)容分析單元26將HOA系數(shù)11傳遞到基于方向的合成單元28?;诜较虻暮铣蓡卧?8可表示經(jīng)配置以執(zhí)行對HOA系數(shù)11的基于方向的合成以產(chǎn)生基于方向的位流21的單元。如圖3的實例中所示,基于向量的分解單元27可包含線性可逆變換(LIT)單元30、參數(shù)計算單元32、重排序單元34、前景選擇單元36、能量補償單元38、去相關(guān)單元60(展示為“去相關(guān)單元60”)、增益控制單元62、心理聲學音頻譯碼器單元40、位流產(chǎn)生單元42、聲場分析單元44、系數(shù)減少單元46、背景(BG)選擇單元48、空間-時間內(nèi)插單元50,和量化單元52。線性可逆變換(LIT)單元30接收呈HOA聲道形式的HOA1111,每一聲道表示與球面基底函數(shù)的給定階數(shù)、子階數(shù)相關(guān)聯(lián)的系數(shù)的塊或幀(其可表示為HOA[k],其中k可表示樣本的當前幀或塊)。HOA系數(shù)11的矩陣可具有維度D:M×(N+1)2。LIT單元30可表示經(jīng)配置以執(zhí)行被稱為奇異值分解的形式的分析的單元。雖然相對于SVD加以描述,但可相對于提供數(shù)組線性不相關(guān)的能量壓縮輸出的任何類似變換或分解執(zhí)行本發(fā)明中所描述的技術(shù)。而且,本發(fā)明中對“集合”的參考一般意欲指非零集合(除非特定地相反陳述),且不意欲指包含所謂的“空集合”的集合的經(jīng)典數(shù)學定義。替代變換可包括常常被稱作“PCA”的主分量分析。取決于上下文,PCA可由數(shù)個不同名稱指代,例如離散卡亨南-洛維變換(Karhunen-Loevetransform)、霍特林變換(Hotellingtransform)、恰當正交分解(POD)和本征值分解(EVD),僅舉幾例。有益于壓縮音頻數(shù)據(jù)的潛在基本目標中的一個的此些操作的性質(zhì)可包含多聲道音頻數(shù)據(jù)的“能量壓縮”和“去相關(guān)”中的一者或多者。在任何情況下,出于實例的目的,假定LIT單元30執(zhí)行奇異值分解(其再次可被稱作“SVD”),LIT單元30可將HOA系數(shù)11變換成兩個或更多個經(jīng)變換HOA系數(shù)的集合。變換HOA系數(shù)的“集合”可包含經(jīng)變換HOA系數(shù)的向量。在圖3的實例中,LIT單元30可對于HOA系數(shù)11執(zhí)行SVD以產(chǎn)生所謂的V矩陣、S矩陣及U矩陣。在線性代數(shù)中,SVD可按如下形式表示y乘z實數(shù)或復數(shù)矩陣X(其中X可表示多聲道音頻數(shù)據(jù),例如HOA系數(shù)11)的因子分解:X=USV*U可表示y乘y實數(shù)或復數(shù)單位矩陣,其中U的y列被稱為多聲道音頻數(shù)據(jù)的左奇異向量。S可表示在對角線上具有非負實數(shù)的y乘z矩形對角線矩陣,其中S的對角線值被稱為多聲道音頻數(shù)據(jù)的奇異值。V*(其可表示V的共軛轉(zhuǎn)置)可表示z乘z實數(shù)或復數(shù)單位矩陣,其中V*的z列被稱為多聲道音頻數(shù)據(jù)的右奇異向量。在一些實例中,以上提及的SVD數(shù)學表達式中的V*矩陣表示為V矩陣的共軛轉(zhuǎn)置以反映SVD可應(yīng)用于包括復數(shù)的矩陣。當應(yīng)用于僅包括實數(shù)的矩陣時,V矩陣的復數(shù)共軛(或換句話說,V*矩陣)可被視為V矩陣的轉(zhuǎn)置。下文中為容易說明的目的,假定HOA系數(shù)11包括實數(shù),結(jié)果是經(jīng)由SVD而非V*矩陣輸出V矩陣。此外,盡管在本發(fā)明中表示為V矩陣,但對V矩陣的提及應(yīng)理解為在適當?shù)那闆r下涉及V矩陣的轉(zhuǎn)置。盡管假定為V矩陣,但所述技術(shù)可以類似方式應(yīng)用于具有復數(shù)系數(shù)的HOA系數(shù)11,其中SVD的輸出為V*矩陣。因此,就此而言,所述技術(shù)不應(yīng)限于僅提供應(yīng)用SVD以產(chǎn)生V矩陣,而是可包含將SVD應(yīng)用于具有復數(shù)分量的HOA系數(shù)11以產(chǎn)生V*矩陣。以此方式,LIT單元30可相對于HOA系數(shù)11執(zhí)行SVD,以輸出具有維度D:M×(N+1)2的US[k]向量33(其可表示S向量與U向量的組合版本)以及具有維度D:(N+1)2×(N+1)2的V[k]向量35。US[k]矩陣中的個別向量元素也可被稱為XPS(k),而V[k]矩陣中的個別向量也可被稱為v(k)。U、S和V矩陣的分析可展現(xiàn)所述矩陣攜載或表示上文由X表示的基本聲場的空間和時間特性。在(具有長度M個樣本的)U中的N個向量中的每一個可表示隨時間(由M個樣本表示的時間周期)而變的彼此正交且已從任何空間特性(其也可被稱作方向信息)解耦的經(jīng)正規(guī)化的分開音頻信號。表示空間形狀和位置的空間特性可實際上由V矩陣(長度(N+1)2的每一者)中的個別第i向量v(i)(k)表示v(i)(k)向量中的每一個的個別元素可表示描述相關(guān)聯(lián)音頻對象的聲場的形狀(包含寬度)和位置的HOA系數(shù)。U矩陣和V矩陣中的向量均經(jīng)正規(guī)化而使得其均方根能量等于單位。因此,在U中的音頻信號的能量由S中的對角元素表示。將U與S相乘形成US[k](具有個別向量元素XPS(k)),因此表示具有能量的音頻信號。SVD分解使音頻時間信號(U中)、其能量(S中)與其空間特性(V中)解耦的能力可支持本發(fā)明中所描述的技術(shù)的各個方面。另外,通過US[k]與V[k]的向量乘法合成基本HOA[k]系數(shù)X的模型產(chǎn)生貫穿此文獻使用的術(shù)語“基于向量的分解”。盡管被描述為直接相關(guān)于HOA系數(shù)11來執(zhí)行,但LIT單元30可對HOA系數(shù)11的導出項應(yīng)用線性可逆變換。例如,LIT單元30可對于從HOA系數(shù)11導出的功率譜密度矩陣應(yīng)用SVD。通過對于HOA系數(shù)的功率譜密度(PSD)而不是其自身系數(shù)來執(zhí)行SVD,LIT單元30可潛在降低按照一個或多個處理器循環(huán)和存儲空間執(zhí)行SVD的計算復雜度,同時實現(xiàn)相同源音頻編碼效率,好像SVD被直接應(yīng)用于HOA系數(shù)一樣。參數(shù)計算單元32表示經(jīng)配置以計算各種參數(shù)的單元,所述參數(shù)例如為相關(guān)參數(shù)(R)、方向特性參數(shù)和能量特性(e)。用于當前幀的所述參數(shù)中的每一者可表示為R[k]、θ[k]、r[k]和e[k]。參數(shù)計算單元32可對于US[k]向量33執(zhí)行能量分析和/或相關(guān)(或所謂的交叉相關(guān))以識別所述參數(shù)。參數(shù)計算單元32還可確定前一幀的參數(shù),其中前一幀的參數(shù)可基于具有US[k-1]向量和V[k-1]向量的前一幀而表示為R[k-1]、θ[k-1]、、r[k-1]和e[k-1]。參數(shù)計算單元32可將當前參數(shù)37和先前參數(shù)39輸出到重排序單元34。由參數(shù)計算單元32計算的參數(shù)可供重排序單元34用以將音頻對象重排序以表示其自然評估或隨時間推移的連續(xù)性。重新排序單元34可逐輪地比較來自第一US[k]向量33的參數(shù)37中的每一個與第二US[k-1]向量33的參數(shù)39中的每一個。重新排序單元34可基于當前參數(shù)37和先前參數(shù)39將US[k]矩陣33和V[k]矩陣35內(nèi)的各個向量重排序(作為一實例,使用匈牙利算法(Hungarianalgorithm))以將重排序的US[k]矩陣33'(其可在數(shù)學上表示為)和重排序的V[k]矩陣35'(其可在數(shù)學上表示為)輸出到前景聲音(或占優(yōu)勢聲音-PS)選擇單元36(“前景選擇單元36”)和能量補償單元38。聲場分析單元44可表示經(jīng)配置以對于HOA系數(shù)11執(zhí)行聲場分析以便潛在地實現(xiàn)目標位速率41的單元。聲場分析單元44可基于所述分析及/或所接收的目標位速率41確定心理聲學譯碼器實例化的總數(shù)目(其可為環(huán)境或背景聲道的總數(shù)目(BGTOT)及前景聲道或換句話說占優(yōu)勢聲道的數(shù)目的函數(shù))。音質(zhì)譯碼器實例化的總數(shù)可表示為numHOATransportChannels。再次為了潛在地實現(xiàn)目標位速率41,聲場分析單元44還可確定前景聲道的總數(shù)(nFG)45、背景(或換句話說,環(huán)境)聲場的最小階數(shù)(NBG或替代地,MinAmbHOAorder)、表示背景聲場的最小階數(shù)的實際聲道的對應(yīng)數(shù)目(nBGa=(MinAmbHOAorder+1)2)以及要發(fā)送的額外BGHOA聲道的索引(i)(其在圖3的實例中可共同地被表示為背景聲道信息43)。背景聲道信息42也可被稱作環(huán)境聲道信息43。從numHOATransportChannels-nBGa保持的聲道中的每一者可為“額外背景/環(huán)境聲道”、“起作用的基于向量的占優(yōu)勢聲道”、“起作用的基于方向的占優(yōu)勢信號”或“完全未起作用”。一方面,可由兩個位將所述聲道類型指示為(作為“ChannelType”)語法元素(例如,00:基于方向的信號;01:基于向量的占優(yōu)勢信號;10:另外環(huán)境信號;11:未起作用信號)。可由(MinAmbHoaOrder+1)2+索引10(在以上實例中)呈現(xiàn)為用于所述幀的位流中的聲道類型的次數(shù)給出背景或環(huán)境信號的總數(shù)nBGa。聲場分析單元44可基于所述目標位速率41選擇背景(或換句話說,環(huán)境)聲道的數(shù)目和前景(或換句話說,占優(yōu)勢)聲道的數(shù)目,從而在所述目標位速率41相對較高時(例如,在目標位速率41等于或大于512Kbps時)選擇更多背景和/或前景聲道。一方面,在位流的標頭部分中,numHOATransportChannels可被設(shè)置為8,而MinAmbHOAorder可被設(shè)置為1。在此情況下,在每個幀,四個聲道可專用于表示所述聲場的背景或環(huán)境部分,而另4個聲道可以在逐幀基礎(chǔ)上隨聲道類型而變化,例如任一者用作另外背景/環(huán)境聲道或前景/占優(yōu)勢聲道。如上所述,所述前景/占優(yōu)勢信號可以為基于向量或基于方向的信號中的任一者。在一些情況下,用于幀的基于向量的占優(yōu)勢信號的總數(shù)可由ChannelType索引在所述幀的位流中為01的次數(shù)給出。在以上方面中,對于每個另外背景/環(huán)境聲道(例如,對應(yīng)于ChannelType10),可在聲道中表示可能的HOA系數(shù)(除前四個以外)中的何者的對應(yīng)信息。對于四階HOA內(nèi)容,所述信息可為指示HOA系數(shù)5-25的索引。當minAmbHOAorder被設(shè)置為1時,前四個環(huán)境HOA系數(shù)1-4可一直發(fā)送,因此,音頻編碼裝置可能僅需要指示具有5-25的索引的另外環(huán)境HOA系數(shù)中的一者。因此,所述信息可以使用可被表示為“CodedAmbCoeffIdx”的5位語法元素(用于4階內(nèi)容)來發(fā)送。在任何情況下,聲場分析單元44將背景聲道信息43和HOA系數(shù)11輸出到背景(BG)選擇單元36,將背景聲道信息43輸出到系數(shù)減少單元46和位流產(chǎn)生單元42,且將nFG45輸出到前景選擇單元36。背景選擇單元48可表示經(jīng)配置以基于背景聲道信息(例如,背景聲場(NBG)以及要發(fā)送的額外BGHOA聲道的數(shù)目(nBGa)和索引(i))確定背景或環(huán)境HOA系數(shù)47的單元。舉例來說,當NBG等于一時,背景選擇單元48可選擇具有等于或小于一的階數(shù)的音頻幀的每一樣本的HOA系數(shù)11。在此實例中,背景選擇單元48可接著選擇具有由索引(i)中的一者識別的索引的HOA系數(shù)11作為額外BGHOA系數(shù),其中,將nBGa提供給位流產(chǎn)生單元42以在位流21中指定,以便使得音頻解碼裝置,例如圖2和4的實例中所示的音頻解碼裝置24,能夠從位流21提取背景HOA系數(shù)47。背景選擇單元48可接著將環(huán)境HOA系數(shù)47輸出到能量補償單元38。環(huán)境HOA系數(shù)47可具有維度D:M×[(NBG+1)2+nBGa]。環(huán)境HOA系數(shù)47也可被稱作“環(huán)境HOA系數(shù)47”,其中,環(huán)境HOA系數(shù)47中的每一個對應(yīng)于待由心理聲學音頻譯碼器單元40編碼的單獨環(huán)境HOA聲道47。前景選擇單元36可表示經(jīng)配置以基于nFG45(其可表示識別前景向量的一個或多個索引)選擇表示聲場的前景或不同分量的重排序的US[k]矩陣33'及重排序的V[k]矩陣35'的單元。前景選擇單元36可將nFG信號49(其可被表示為重排序的US[k]1,…,nFG49,F(xiàn)G1,…,nfG[k]49,或49)輸出到心理聲學音頻譯碼器單元40,其中,nFG信號49可具有維度D:M×nFG,且每個nFG信號49表示單聲道音頻對象。前景選擇單元36也可將對應(yīng)于聲場的前景分量的重排序的V[k]矩陣35'(或35')輸出到空間-時間內(nèi)插單元50,其中,對應(yīng)于前景分量的重排序的V[k]矩陣35'的子集可表示為具有維度D:(N+1)2×nFG的前景V[k]矩陣51k(其可被數(shù)學表示為)。能量補償單元38可表示經(jīng)配置以對于環(huán)境HOA系數(shù)47執(zhí)行能量補償,以補償由于通過背景選擇單元48移除HOA聲道中的各種HOA聲道所造成的能量損失的單元。能量補償單元38可對于重排序的US[k]矩陣33'、重排序的V[k]矩陣35'、nFG信號49、前景V[k]向量51k和環(huán)境HOA系數(shù)47中的一者或多者執(zhí)行能量分析,并且接著基于所述能量分析執(zhí)行能量補償以產(chǎn)生能量補償?shù)沫h(huán)境HOA系數(shù)47'。能量補償單元38可將經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'輸出到去相關(guān)單元60。去相關(guān)單元60可表示經(jīng)配置以實施本發(fā)明中描述的技術(shù)的各種方面以降低或消除經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'之間的相關(guān)以形成一個或多個去相關(guān)環(huán)境HOA音頻信號67的單元。去相關(guān)單元40'可將去相關(guān)HOA音頻信號67輸出到增益控制單元62。增益控制單元62可表示經(jīng)配置以對于去相關(guān)環(huán)境HOA音頻信號67執(zhí)行自動增益控制(其可簡稱為“AGC”)以獲得增益受控環(huán)境HOA音頻信號67'。在應(yīng)用增益控制之后,自動增益控制單元62可將增益受控環(huán)境HOA音頻信號67'提供到心理聲學音頻譯碼器單元40。包含在音頻編碼裝置20內(nèi)的去相關(guān)單元60可表示經(jīng)配置以將一個或多個去相關(guān)變換應(yīng)用于經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'以獲得去相關(guān)HOA音頻信號67的單元的單個或多個例項。在一些實例中,去相關(guān)單元40'可將UHJ矩陣應(yīng)用于經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'。在本發(fā)明的各種實例中,UHJ矩陣也可以被稱作“基于相位的變換”。應(yīng)用基于相位的變換還可以在本文中稱為“相移去相關(guān)”。立體混響UHJ格式為經(jīng)設(shè)計以與單聲道和立體聲媒體兼容的立體混響環(huán)繞聲系統(tǒng)的發(fā)展。UHJ格式包含系統(tǒng)階層,其中所記錄聲場將以根據(jù)可用聲道而變化的準確度再現(xiàn)。在各種情況下,UHJ也稱為“C格式”。所述縮寫指示并入系統(tǒng)中的源中的一些:U來自Universal(UD-4);H來自矩陣H;且J來自系統(tǒng)45J。UHJ為立體混響技術(shù)內(nèi)的對方向聲音信息進行編碼和解碼的階層式系統(tǒng)。取決于可用聲道的數(shù)目,系統(tǒng)可攜載較多或較少信息。UHJ與立體聲和單聲道完全兼容。可使用高達四個聲道(L,R,T,Q)。在一種形式中,可通過可使用收聽端處的UHJ解碼器恢復的正常立體聲信號聲道(CD、FM或數(shù)字無線電,等)攜載2聲道(L,R)UHJ、水平(或“平面”)環(huán)繞信息。將兩個聲道求和可得到兼容的單聲道信號,其可為比對常規(guī)“聲相式單聲道”源進行求和更準確的雙聲道版本表示。如果第三聲道(T)可用,則在經(jīng)由3聲道UHJ解碼器解碼時,可使用第三聲道來得到平面環(huán)繞效果的改善的定位準確度。可能并不需要第三聲道為此目的而具有全音頻帶寬,從而導致所謂的“21/2聲道”系統(tǒng)的可能性,其中第三聲道是帶寬受限的。在一個實例中,限制可為5kHz。第三聲道可經(jīng)由FM無線電(例如借助于相位正交調(diào)制)來廣播。將第四聲道(Q)添加到UHJ系統(tǒng)可允許對具有高度(有時稱為n,如Periphony)的全環(huán)繞聲音進行編碼,其中準確度等同于4聲道B格式。2聲道UHJ為常用于分布立體混響記錄的格式??山?jīng)由所有正常立體聲聲道來發(fā)射2聲道UHJ記錄,且正常2聲道媒體中的任一者可以使用而不加更改。UHJ與立體聲兼容,兼容之處在于,無需解碼,收聽者即可察覺立體聲像,但其比常規(guī)立體聲(例如,所謂的“超立體聲”)顯著較寬。左聲道與右聲道也可以求和以獲得非常高度的單聲道兼容性。經(jīng)由UHJ解碼器重放,可展現(xiàn)環(huán)繞能力。應(yīng)用UHJ矩陣(或基于相位的變換)的去相關(guān)單元60的實例數(shù)學表示如下:UHJ編碼:S=(0.9397*W)+(0.1856*X);D=imag(hilbert((-0.3420*W)+(0.5099*X)))+(0.6555*Y);T=imag(hilbert((-0.1432*W)+(0.6512*X)))-(0.7071*Y);Q=0.9772*Z;S與D到左與右的轉(zhuǎn)換:Left=(S+D)/2Right=(S-D)/2根據(jù)以上計算的一些實施方案,關(guān)于以上計算的假設(shè)可包含以下各項:HOA背景聲道是1階立體混響,F(xiàn)uMa經(jīng)正規(guī)化,按照立體混響聲道編號次序W(a00)、X(a11)、Y(a11-)、Z(a10)。在上文所列的計算中,去相關(guān)單元40'可執(zhí)行各種矩陣乘以常數(shù)值的標量乘法。舉例來說,為獲得S信號,去相關(guān)單元60可執(zhí)行W矩陣乘以常數(shù)值0.9397(例如,標量乘法)以及X矩陣乘以常數(shù)值0.1856的標量乘法。還如在上文所列的計算中所說明,去相關(guān)單元60可應(yīng)用希爾伯特變換(Hilberttransform,由以上UHJ編碼中的“Hilbert()”函數(shù)表示)來獲得D和T信號中的每一個。以上UHJ編碼中的“imag()”函數(shù)指示獲得希爾伯特變換的結(jié)果的虛數(shù)(在數(shù)學意義上)。應(yīng)用UHJ矩陣(或基于相位的變換)的去相關(guān)單元60的另一實例數(shù)學表示如下:UHJ編碼:S=(0.9396926*W)+(0.151520536509082*X);D=imag(hilbert((-0.3420201*W)+(0.416299273350443*X)))+(0.535173990363608*Y);T=0.940604061228740*(imag(hilbert((-0.1432*W)+(0.531702573500135*X)))-(0.577350269189626*Y));Q=Z;S與D到左與右的轉(zhuǎn)換:Left=(S+D)/2;Right=(S-D)/2;在以上計算的一些實例實施方案中,關(guān)于以上計算的假設(shè)可包含以下各項:HOA背景聲道是1階立體混響,N3D(或“全三維”)經(jīng)正規(guī)化,按照立體混響聲道編號次序W(a00)、X(a11)、Y(a11-)、Z(a10)。盡管本文中相對于N3D正規(guī)化進行描述,但將了解,實例計算還可以應(yīng)用于經(jīng)SN3D正規(guī)化(或“施密特半正規(guī)化”)的HOA背景聲道。N3D與SN3D正規(guī)化可在所使用的縮放因數(shù)方面不同。相對于SN3D正規(guī)化的N3D正規(guī)化的實例表示如下表達為:在SN3D正規(guī)化中所使用的加權(quán)系數(shù)的實例如下表達為:在上文所列的計算中,去相關(guān)單元60可執(zhí)行各種矩陣與常數(shù)值的標量乘法。舉例來說,為獲得S信號,去相關(guān)單元60可執(zhí)行W矩陣與常數(shù)值0.9396926(例如,通過標量乘法)以及X矩陣與常數(shù)值0.151520536509082的標量乘法。還如在上文所列的計算中所說明,去相關(guān)單元60可在獲得D和T信號中的每一者時應(yīng)用希爾伯特變換(由以上UHJ編碼中的“Hilbert()”函數(shù)或相移去相關(guān)表示)。以上UHJ編碼中的“imag()”函數(shù)指示獲得希爾伯特變換的結(jié)果的虛數(shù)(在數(shù)學意義上)。去相關(guān)單元60可執(zhí)行上文所列的計算,使得所得S信號和D信號表示左音頻信號和右音頻信號(或換句話說,立體聲音頻信號)。在一些此類情形中,去相關(guān)單元60可輸出T信號和Q信號作為去相關(guān)環(huán)境HOA音頻信號67的部分,但接收位流21的解碼裝置可能在顯現(xiàn)為立體聲揚聲器幾何布置(或,換句話說,立體聲揚聲器配置)時不處理T信號和Q信號。在諸實例中,環(huán)境HOA系數(shù)47'可表示待顯現(xiàn)在單聲道音頻再現(xiàn)系統(tǒng)上的聲場。去相關(guān)單元60可輸出S信號和D信號作為去相關(guān)環(huán)境HOA音頻信號67的部分,且接收位流21的解碼裝置可組合(或“混合”)S信號與D信號以形成待以單聲道音頻格式顯現(xiàn)及/或輸出的音頻信號。在這些實例中,解碼裝置及/或再現(xiàn)裝置可以各種方式恢復單聲道音頻信號。一個實例為通過混合左信號與右信號(由S信號和D信號表示)。另一實例為通過應(yīng)用UHJ矩陣(或基于相位的變換)來對W信號進行解碼。通過應(yīng)用UHJ矩陣(或基于相位的變換)產(chǎn)生呈S信號和D信號形式的自然左信號和自然右信號,去相關(guān)單元60可實施本發(fā)明的技術(shù)以提供優(yōu)于應(yīng)用其它去相關(guān)變換(例如在MPEG-H標準中描述的模式矩陣)的技術(shù)的潛在優(yōu)勢及/或潛在改善。在各種實例中,去相關(guān)單元60可基于所接收的經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'的位速率而應(yīng)用不同的去相關(guān)變換。舉例來說,在經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'表示四聲道輸入的情形中,去相關(guān)可應(yīng)用上文所描述的UHJ矩陣(或基于相位的變換)。更具體來說,基于表示四聲道輸入的經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47',去相關(guān)單元60可應(yīng)用4×4UHJ矩陣(或基于相位的變換)。舉例來說,4×4矩陣可與經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'的四聲道輸入正交。換句話說,在經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'表示較小數(shù)目聲道(例如,四個)的情況下,去相關(guān)單元60可應(yīng)用UHJ矩陣作為所選去相關(guān)變換,以使經(jīng)能量補償?shù)沫h(huán)境HOA信號47'的背景信號去相關(guān)以獲得去相關(guān)環(huán)境HOA音頻信號67。根據(jù)此實例,如果經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'表示較大數(shù)目個聲道(例如,九個),那么去相關(guān)單元60可應(yīng)用不同于UHJ矩陣(或基于相位的變換)的去相關(guān)變換。舉例來說,在經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'表示九聲道輸入的情形中,去相關(guān)單元60可應(yīng)用模式矩陣(例如,如以上提及的MPEG-H3D音頻標準階段I中所描述),以使經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'去相關(guān)。在經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'表示九聲道輸入的實例中,去相關(guān)單元60可應(yīng)用9×9模式矩陣以獲得去相關(guān)環(huán)境HOA音頻信號67。音頻編碼裝置20的各種組件(例如心理聲學音頻譯碼器40)又可在感知上根據(jù)AAC或USAC對去相關(guān)環(huán)境HOA音頻信號67進行譯碼。去相關(guān)單元60可應(yīng)用相移去相關(guān)變換(例如,在四聲道輸入情況下,UHJ矩陣或基于相位的變換),以潛在地優(yōu)化對于HOA的AAC/USAC譯碼。在經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'(且由此,去相關(guān)環(huán)境HOA音頻信號67)表示待顯現(xiàn)在立體聲再現(xiàn)系統(tǒng)上的音頻數(shù)據(jù)的實例中,去相關(guān)單元60可基于AAC與USAC為相對定向(或針對其優(yōu)化)的立體聲音頻數(shù)據(jù)而應(yīng)用本發(fā)明的技術(shù)以改善或優(yōu)化壓縮。將理解,在經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'包含前景聲道的情境中,以及在經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'不包含任何前景聲道的情境中,去相關(guān)單元60可應(yīng)用本文中所描述的技術(shù)。作為一個實例,在經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'包含零(0)個前景聲道和四個(4)個背景聲道的情形(例如,更低/更小位速率的情形)中,去相關(guān)單元40'可應(yīng)用上文所描述的技術(shù)及/或計算。在一些實例中,去相關(guān)單元60可致使位流產(chǎn)生單元42用信號發(fā)送指示去相關(guān)單元60將去相關(guān)變換應(yīng)用于經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'的一個或多個語法元素作為基于向量的位流21的一部分。通過將此指示提供到解碼裝置,去相關(guān)單元60可使得解碼裝置能夠?qū)OA域中的音頻數(shù)據(jù)執(zhí)行互逆去相關(guān)變換。在一些實例中,去相關(guān)單元60可致使位流產(chǎn)生單元42用信號發(fā)送指示應(yīng)用哪一去相關(guān)變換(例如UHJ矩陣(或其它基于相位的變換)或模式矩陣)的語法元素。去相關(guān)單元60可將基于相位的變換應(yīng)用于經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'。用于CAMB(k-1)的OMINHOA系數(shù)序列的基于相位的變換由下式定義:其中系數(shù)d如表1中所定義,信號幀S(k-2)和M(k-2)由下式定義:S(k-2)=A+90(k-2)+d(6)·cAMB,2(k-2)M(k-2)=d(4)·cAMB,1(k-2)+d(5)·cAMB,4(k-2)且A+90(k-2)和B+90(k-2)是+90度相移信號A和B的幀,由下式定義:A(k-2)=d(0)·cAMB,LOW,1(k-2)+d(1)·cAMB,4(k-2)B(k-2)=d(2)·cAMB,LOW,1(k-2)+d(3)·cAMB,4(k-2)。用于CP,AMB(k-1)的第一OMINHOA系數(shù)序列的基于相位的變換相應(yīng)地定義。所描述變換可能引入一個幀的延遲。在上文中,xAMB,LOW,1(k-2)到xAMB,LOW,4(k-2)可對應(yīng)于去相關(guān)環(huán)境HOA音頻信號67。在以上方程式中,變量CAMB,1(k)變量表示對應(yīng)于(階數(shù):子階數(shù))為(0:0)的球基函數(shù)的第k個幀的HOA系數(shù),其也可稱為“W”聲道或分量。變量CAMB,2(k)變量表示對應(yīng)于(階數(shù):子階數(shù))為(1:-1)的球基函數(shù)的第k個幀的HOA系數(shù),其也可稱為“Y”聲道或分量。變量CAMB,3(k)變量表示對應(yīng)于(階數(shù):子階數(shù))為(1:0)的球基函數(shù)的第k個幀的HOA系數(shù),其也可稱為“Z”聲道或分量。變量CAMB,4(k)變量表示對應(yīng)于(階數(shù):子階數(shù))為(1:1)的球基函數(shù)的第k個幀的HOA系數(shù),其也可稱為“X”聲道或分量。CAMB,1(k)到CAMB,3(k)可對應(yīng)于環(huán)境HOA系數(shù)47'。下文的表1說明可由去相關(guān)單元40使用以執(zhí)行基于相位的變換的系數(shù)的實例。nd(n)00.3420200999999999910.4162992733504428120.1431999999999999930.5317025735001352840.9396925999999999950.1515205365090818460.5351739903636075870.5773502691896258480.9406040612287403090.500000000000000表1用于基于相位的變換的系數(shù)在一些實例中,音頻編碼裝置20的各種組件(例如位流產(chǎn)生單元42)可經(jīng)配置以僅發(fā)射一階HOA表示以獲得較低目標位速率(例如,128K或256K的目標位速率)。根據(jù)一些此類實例,音頻編碼裝置20(或其組件,例如位流產(chǎn)生單元42)可經(jīng)配置以舍棄高階HOA系數(shù)(例如,階數(shù)大于一階的系數(shù),或換句話說,N>1)。然而,在音頻編碼裝置20確定目標位速率相對較高的實例中,音頻編碼裝置20(例如,位流產(chǎn)生單元42)可分開前景與背景聲道,且可將位(例如,以較大量)指派到前景聲道。盡管描述為應(yīng)用于經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47',但音頻編碼裝置20可不將去相關(guān)應(yīng)用于經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'。替代地,能量補償單元38可將經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'直接提供到增益控制單元62,所述增益控制單元可執(zhí)行對于經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'的自動增益控制。由此,去相關(guān)單元60展示為虛線以指示去相關(guān)單元可能并不始終執(zhí)行去相關(guān)或包含于音頻解碼裝置20中??臻g-時間內(nèi)插單元50可表示經(jīng)配置以接收第k幀的前景V[k]向量51k和前一幀(因此為k-1記法)的前景V[k-1]向量51k-1,并執(zhí)行空間-時間內(nèi)插以產(chǎn)生內(nèi)插前景V[k]向量的單元??臻g-時間內(nèi)插單元50可將nFG信號49與前景V[k]向量51k重新組合以恢復重排序的前景HOA系數(shù)。空間-時間內(nèi)插單元50可接著將重排序的前景HOA系數(shù)除以經(jīng)內(nèi)插V[k]向量以產(chǎn)生經(jīng)內(nèi)插nFG信號49'??臻g-時間內(nèi)插單元50還可輸出所述前景V[k]向量51k,其用于產(chǎn)生經(jīng)內(nèi)插前景V[k]向量,使得例如音頻解碼裝置24等音頻解碼裝置可產(chǎn)生經(jīng)內(nèi)插前景V[k]向量并由此恢復前景V[k]向量51k。用以產(chǎn)生經(jīng)內(nèi)插前景V[k]向量的前景V[k]向量51k被表示為其余前景V[k]向量53。為確保在編碼器和解碼器處使用所述相同V[k]和V[k-1](以創(chuàng)建內(nèi)插向量V[k]),可在編碼器和解碼器處使用向量的經(jīng)量化/解量化版本??臻g-時間內(nèi)插單元50可將經(jīng)內(nèi)插nFG信號49'輸出到增益控制單元62,且將經(jīng)內(nèi)插前景V[k]向量51k輸出到系數(shù)減少單元46。增益控制單元62還可表示經(jīng)配置以對于經(jīng)內(nèi)插nFG信號49'執(zhí)行自動增益控制(其可簡稱為“AGC”)以獲得增益受控nFG信號49″的單元。在應(yīng)用增益控制之后,自動增益控制單元62可將增益受控nFG信號49″提供到心理聲學音頻譯碼器單元40。系數(shù)減少單元46可表示經(jīng)配置以基于背景聲道信息43對于其余前景V[k]向量53執(zhí)行系數(shù)減少,以將減少前景V[k]向量55輸出到量化單元52的單元。減少前景V[k]向量55可具有維度D:[(N+1)2-(NBG+1)2-BGTOT]×nFG。就此而言,系數(shù)減少單元46可表示經(jīng)配置以減少其余前景V[k]向量53中的系數(shù)的數(shù)目的單元。換句話說,系數(shù)減少單元46可表示經(jīng)配置以消除前景V[k]向量(其形成其余前景V[k]向量53)中具有極少或沒有方向信息的系數(shù)的單元。在一些實例中,相異的系數(shù)或換句話說對應(yīng)于一階和零階基底函數(shù)(其可被表示為NBG)的前景V[k]向量提供極少方向信息,且因此可從前景V向量移除(通過可被稱為“系數(shù)減少”的過程)。在此實例中,可提供較大靈活性以不僅從集合[(NBG+1)2+1,(N+1)2]識別對應(yīng)于NBG的系數(shù)而且識別額外HOA聲道(其可由變量TotalOfAddAmbHOAChan表示)。量化單元52可表示經(jīng)配置以執(zhí)行任何形式的量化以壓縮經(jīng)減少的前景V[k]向量55來產(chǎn)生經(jīng)譯碼前景V[k]向量57,從而將經(jīng)譯碼前景V[k]向量57輸出到位流產(chǎn)生單元42的單元。在操作中,量化單元52可表示經(jīng)配置以壓縮聲場的空間分量(即在此實例中的減少前景V[k]向量55中的一者或多者)的單元。量化單元52可執(zhí)行在以上提及的MPEG-H3D音頻譯碼標準階段I或階段II中所闡述的以下12個量化模式中的任一個。量化單元52還可執(zhí)行前述類型的量化模式中的任一者的預(yù)測版本,其中確定前一幀的V向量的元素(或執(zhí)行向量量化時的權(quán)重)與當前幀的V向量的元素(或執(zhí)行向量量化時的權(quán)重)之間的差。量化單元52接著可量化當前幀與前一幀的元素或權(quán)重之間的差,而非當前幀本身的V向量的元素的值。量化單元52可將經(jīng)譯碼前景V[k]向量57提供到位流產(chǎn)生單元42。量化單元52還可提供指示量化模式的語法元素(例如,NbitsQ語法元素)和用以將V向量解量化或以其它方式重構(gòu)V向量的任何其它語法元素。包含在音頻編碼裝置20內(nèi)的心理聲學音頻譯碼器單元40可表示心理聲學音頻編碼器的多個例項,所述多個例項中的每一者用以對經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'和經(jīng)內(nèi)插nFG信號49'中的每一者的不同音頻對象或HOA聲道進行編碼,以產(chǎn)生經(jīng)編碼環(huán)境HOA系數(shù)59和經(jīng)編碼nFG信號61。心理聲學音頻譯碼器單元40可將經(jīng)編碼環(huán)境HOA系數(shù)59和經(jīng)編碼nFG信號61輸出到位流產(chǎn)生單元42。包含在音頻編碼裝置20內(nèi)的位流產(chǎn)生單元42表示格式化數(shù)據(jù)以符合已知格式(其可指解碼裝置已知的格式),由此產(chǎn)生基于向量的位流21的單元。換句話說,位流21可表示已經(jīng)以上文所描述的方式編碼的經(jīng)編碼音頻數(shù)據(jù)。在一些實例中,位流產(chǎn)生單元42可表示多路復用器,其可接收經(jīng)譯碼前景V[k]向量57、經(jīng)編碼環(huán)境HOA系數(shù)59、經(jīng)編碼nFG信號61和背景聲道信息43。位流產(chǎn)生單元42接著可基于經(jīng)譯碼前景V[k]向量57、經(jīng)編碼環(huán)境HOA系數(shù)59、經(jīng)編碼nFG信號61和背景聲道信息43產(chǎn)生位流21。以此方式,位流產(chǎn)生單元42可由此指定位流21中的向量57以獲得位流21。位流21可包含主要或主位流和一個或多個旁聲道位流。盡管在圖3的實例中未展示,但音頻編碼裝置20還可包含位流輸出單元,所述位流輸出單元基于當前幀將使用基于方向的合成還是基于向量的合成編碼而切換從音頻編碼裝置20輸出的位流(例如,在基于方向的位流21與基于向量的位流21之間切換)。位流輸出單元可基于由內(nèi)容分析單元26輸出的指示執(zhí)行基于方向的合成(作為檢測到HOA系數(shù)11是從合成音頻對象產(chǎn)生的結(jié)果)還是執(zhí)行基于向量的合成(作為檢測到HOA系數(shù)經(jīng)記錄的結(jié)果)的語法元素執(zhí)行所述切換。位流輸出單元可指定正確的標頭語法以指示用于當前幀以及位流21中的相應(yīng)一者的所述切換或當前編碼。此外,如上文所提及,聲場分析單元44可識別BGTOT環(huán)境HOA系數(shù)47,所述BGTOT環(huán)境HOA系數(shù)可在逐幀基礎(chǔ)上改變(但時常BGTOT可跨越兩個或更多個鄰近(在時間上)幀保持恒定或相同)。BGTOT的改變可產(chǎn)生在減少前景V[k]向量55中表達的系數(shù)的改變。BGTOT的改變可產(chǎn)生逐幀改變(盡管有時BGTOT可跨越兩個或兩個以上鄰近(在時間上)幀保持恒定或相同)的背景HOA系數(shù)(其也可被稱作“環(huán)境HOA系數(shù)”)。所述改變常常導致聲場的各方面的能量改變,所述聲場通過額外環(huán)境HOA系數(shù)的添加或移除及系數(shù)從減少前景V[k]向量55的對應(yīng)移除或系數(shù)到所述減少前景V[k]向量的添加表示。結(jié)果,聲場分析單元44可進一步確定環(huán)境HOA系數(shù)何時從幀到幀改變,且產(chǎn)生指示環(huán)境HOA系數(shù)的改變的旗標或其它語法元素(就用于表示聲場的環(huán)境分量來說)(其中所述改變也可被稱作環(huán)境HOA系數(shù)的“轉(zhuǎn)變”或環(huán)境HOA系數(shù)的“轉(zhuǎn)變”)。確切地說,系數(shù)減少單元46可產(chǎn)生旗標(其可表示為AmbCoeffTransition旗標或AmbCoeffIdxTransition旗標),從而將所述旗標提供到位流產(chǎn)生單元42,使得可將所述旗標包含在位流21中(可能作為旁側(cè)聲道信息的部分)。除指定環(huán)境系數(shù)轉(zhuǎn)變旗標之外,系數(shù)減少單元46也可修改產(chǎn)生減少前景V[k]向量55的方式。在一個實例中,在確定環(huán)境HOA環(huán)境系數(shù)中的一者在當前幀期間處于轉(zhuǎn)變中時,系數(shù)減少單元46可指定減少前景V[k]向量55的V向量中的每一者的向量系數(shù)(其也可被稱作“向量元素”或“元素”),其對應(yīng)于處于轉(zhuǎn)變中的環(huán)境HOA系數(shù)。同樣,處于轉(zhuǎn)變中的環(huán)境HOA系數(shù)可添加至背景系數(shù)的BGTOT總數(shù)目或從背景系數(shù)的BGTOT總數(shù)目中移除。因此,背景系數(shù)的總數(shù)目的所得改變影響環(huán)境HOA系數(shù)是否包含于位流中,及在上文所描述的第二及第三配置模式中是否針對位流中所指定的V向量包含V向量的對應(yīng)元素。關(guān)于系數(shù)減少單元46可如何指定減少的前景V[k]向量55以克服能量改變的更多信息提供于2015年1月12日申請的名稱為“環(huán)境高階立體混響系數(shù)的轉(zhuǎn)變(TRANSITIONINGOFAMBIENTHIGHER_ORDERAMBISONICCOEFFICIENTS)”的第14/594,533號美國申請案中。在此方面中,位流產(chǎn)生單元42可以多種不同的編碼方案來產(chǎn)生位流21,所述編碼方案可促進靈活的位流產(chǎn)生以適應(yīng)大量不同的內(nèi)容遞送上下文。表現(xiàn)為在音頻行業(yè)內(nèi)獲得動力的一個上下文為經(jīng)由網(wǎng)絡(luò)將音頻數(shù)據(jù)遞送(或,換句話說,“流式傳輸”)到數(shù)目不斷增多的不同回放裝置。經(jīng)由帶寬受限網(wǎng)絡(luò)將音頻內(nèi)容遞送到具有不同程度的回放能力的裝置可能是困難的,尤其是在回放期間準許高度3D音頻保真度(具有大帶寬消耗)(相對于基于聲道或?qū)ο蟮囊纛l數(shù)據(jù))的HOA音頻數(shù)據(jù)的上下文中。根據(jù)本發(fā)明中描述的技術(shù),位流產(chǎn)生單元42可利用一個或多個可縮放層以允許HOA系數(shù)11的各種重構(gòu)。層中的每一者可為階層式的。舉例來說,第一層(其可稱為“基礎(chǔ)層”)可提供準許渲染立體聲擴音器饋給的HOA系數(shù)的第一重構(gòu)。第二層(其可稱為第一“增強層”)在應(yīng)用于HOA系數(shù)的第一重構(gòu)時可縮放HOA系數(shù)的第一重構(gòu)以準許渲染水平環(huán)繞聲音擴音器饋給(例如,5.1擴音器饋給)。第三層(其可稱為第二“增強層”)可在應(yīng)用于HOA系數(shù)的第二重構(gòu)時可提供縮放HOA系數(shù)的第一重構(gòu)以準許渲染3D環(huán)繞聲音擴音器饋給(例如,22.2擴音器饋給)。就此而言,層可認為階層式縮放前一層。換句話說,層為階層式的,使得第一層在與第二層組合時提供高階立體混響音頻信號的較高分辨率表示。盡管上文描述為允許縮放緊接在前的層,但在另一層上方的任何層可縮放較低層。換句話說,上文所描述的第三層可以用來縮放第一層,即使第一層尚未被第二層“縮放”。第三層在直接應(yīng)用于第一層時可提供高度信息,且由此允許渲染對應(yīng)于不規(guī)則布置的揚聲器幾何布置的不規(guī)則揚聲器饋送。為了準許從位流21提取層,位流產(chǎn)生單元42可指定在位流中指定的層的數(shù)目的指示。位流產(chǎn)生單元42可輸出包含層的所指示數(shù)目的位流21。關(guān)于圖5更詳細地描述位流產(chǎn)生單元42。在下文圖7A到9B中描述產(chǎn)生可縮放HOA音頻數(shù)據(jù)的各種不同實例,其中用于以上實例中的每一者的邊帶信息的實例描述于圖10到13B中。圖5是更詳細地說明在經(jīng)配置以執(zhí)行本發(fā)明中描述的可縮放音頻譯碼技術(shù)的潛在版本中的第一者時的圖3的位流產(chǎn)生單元42的圖。在圖5的實例中,位流產(chǎn)生單元42包含可縮放位流產(chǎn)生單元1000和非可縮放位流產(chǎn)生單元1002??煽s放位流產(chǎn)生單元1000表示經(jīng)配置以產(chǎn)生包括具有類似于下文關(guān)于圖11到13B的實例展示和描述的HOAFrames()的兩個或更多個層(但在一些情況下,可縮放位流可對于某些音頻上下文包括單個層)的可縮放位流21的單元。非可縮放位流產(chǎn)生單元1002可表示經(jīng)配置以產(chǎn)生不提供層或換句話說不提供可縮放性的非可縮放位流21的單元。鑒于非可縮放位流21和可縮放位流21通常在經(jīng)編碼環(huán)境HOA系數(shù)59、經(jīng)編碼nFG信號61和經(jīng)譯碼前景V[k]向量57方面包含相同基本數(shù)據(jù),兩者皆可稱為“位流21”。然而,非可縮放位流21與可縮放位流21之間的一個差異為可縮放位流21包含可表示為層21A、21B等的層。層21A可包含經(jīng)編碼環(huán)境HOA系數(shù)59、經(jīng)編碼nFG信號61經(jīng)譯碼前景V[k]向量57的子集,如下文更詳細地描述。盡管可縮放和非可縮放位流21可有效地為相同位流21的不同表示,但非可縮放位流21表示為非可縮放位流21'以區(qū)分可縮放位流21與非可縮放位流21'。此外,在一些情況下,可縮放位流21可包含符合非可縮放位流21的各種層。舉例來說,可縮放位流21可包含符合非可縮放位流21的基礎(chǔ)層。在這些情況下,非可縮放位流21'可表示可縮放位流21的子位流,其中此非可縮放子位流21'可利用可縮放位流21的額外層(其稱為增強層)加以增強。位流產(chǎn)生單元42可獲得指示調(diào)用可縮放位流產(chǎn)生單元1000還是非可縮放位流產(chǎn)生單元1002的可縮放性信息1003。換句話說,可縮放性信息1003可指示位流產(chǎn)生單元42輸出可縮放位流21還是非可縮放位流21'。出于說明的目的,假定可縮放性信息1003指示位流產(chǎn)生單元42調(diào)用可縮放位流產(chǎn)生單元1000以輸出可縮放位流21'。如圖5的實例中進一步展示,位流產(chǎn)生單元42可接收經(jīng)編碼環(huán)境HOA系數(shù)59A到59D、經(jīng)編碼nFG信號61A和61B,以及經(jīng)譯碼前景V[k]向量57A和57B。經(jīng)編碼環(huán)境HOA系數(shù)59A可表示與具有階數(shù)零和子階數(shù)零的球基函數(shù)相關(guān)聯(lián)的經(jīng)編碼環(huán)境HOA系數(shù)。經(jīng)編碼環(huán)境HOA系數(shù)59B可表示與具有階數(shù)一和階數(shù)零的球基函數(shù)相關(guān)聯(lián)的經(jīng)編碼環(huán)境HOA系數(shù)。經(jīng)編碼環(huán)境HOA系數(shù)59C可表示與具有階數(shù)一和子階數(shù)負一的球基函數(shù)相關(guān)聯(lián)的經(jīng)編碼環(huán)境HOA系數(shù)。經(jīng)編碼環(huán)境HOA系數(shù)59D可表示與具有階數(shù)一和子階數(shù)正一的球基函數(shù)相關(guān)聯(lián)的經(jīng)編碼環(huán)境HOA系數(shù)。經(jīng)編碼環(huán)境HOA系數(shù)59A到59D可表示上文所論述的經(jīng)編碼環(huán)境HOA系數(shù)59的一個實例,且因此可統(tǒng)稱為經(jīng)編碼環(huán)境HOA系數(shù)59。經(jīng)編碼nFG信號61A和61B可各自表示在此實例中表示聲場的兩個最占優(yōu)勢前景方面的US音頻對象。經(jīng)譯碼前景V[k]向量57A與57B可分別表示經(jīng)編碼nFG信號61A與61B的方向信息(其除了方向之外還可指定寬度)。經(jīng)編碼nFG信號61A和61B可表示上文所描述的經(jīng)編碼nFG信號61的一個實例,且因此可統(tǒng)稱為經(jīng)編碼nFG信號61。經(jīng)譯碼前景V[k]向量57A和57B可表示上文所描述的經(jīng)譯碼前景V[k]向量57的一個實例,且因此可統(tǒng)稱為經(jīng)譯碼前景V[k]向量57。一旦調(diào)用,可縮放位流產(chǎn)生單元1000就可以大體類似于下文關(guān)于圖7A到9B描述的方式產(chǎn)生可縮放位流21以包含層21A和21B??煽s放位流產(chǎn)生單元1000可在可縮放位流21中指定層的數(shù)目的指示,且在層21A和21B中的每一者中指定前景元素和背景元素的數(shù)目。作為一個實例,可縮放位流產(chǎn)生單元1000可指定可指定L個層的NumberOfLayers語法元素,其中變量L可表示層的數(shù)目??煽s放位流產(chǎn)生單元1000可接著對于每一層(其可表示為變量i=1到L)指定對于每一層發(fā)送的Bi個經(jīng)編碼環(huán)境HOA系數(shù)59和Fi個經(jīng)譯碼nFG信號61(其還可或替代地指示對應(yīng)經(jīng)譯碼前景V[k]向量57的數(shù)目)。在圖5的實例中,可縮放位流產(chǎn)生單元1000可在可縮放位流21中指定已啟用可縮放譯碼,且兩個層包含于可縮放位流21中,第一層21A包含四個經(jīng)編碼環(huán)境HOA系數(shù)59和零個經(jīng)編碼nFG信號61,且第二層21A包含零個經(jīng)編碼環(huán)境HOA系數(shù)59和w個經(jīng)編碼nFG信號61??煽s放位流產(chǎn)生單元1000還可產(chǎn)生第一層21A(其也可被稱作“基礎(chǔ)層21A”)以包含經(jīng)編碼環(huán)境HOA系數(shù)59??煽s放位流產(chǎn)生單元1000可進一步產(chǎn)生第二層21A(其可稱為“增強層21B”)以包含經(jīng)編碼nFG信號61和經(jīng)譯碼前景V[k]向量57??煽s放位流產(chǎn)生單元1000可輸出層21A和21B作為可縮放位流21。在一些實例中,可縮放位流產(chǎn)生單元1000可將可縮放位流21'存儲到存儲器(在編碼器20內(nèi)部或外部)。在一些情況下,可縮放位流產(chǎn)生單元1000可不指定層的數(shù)目、一個或多個層中的前景分量的數(shù)目(例如,經(jīng)編碼nFG信號61和經(jīng)譯碼前景V[k]向量57的數(shù)目)以及一個或多個層中的背景分量的數(shù)目(例如,經(jīng)編碼環(huán)境HOA系數(shù)59)的指示中的一者或多者或任一者。在本發(fā)明中,分量也可被稱作聲道。替代地,可縮放位流產(chǎn)生單元1000可比較當前幀的層的數(shù)目與前一幀(例如,在時間上最近的前一幀)的層的數(shù)目。在比較得出無差異(意味著當前幀中的層的數(shù)目等于前一幀中的層的數(shù)目)時,可縮放位流產(chǎn)生單元1000可以類似方式比較每一層中的背景分量與前景分量和數(shù)目。換句話說,可縮放位流產(chǎn)生單元1000可比較一個或多個層中在當前幀的背景分量的數(shù)目與一個或多個層中在前一幀的背景組件的數(shù)目??煽s放位流產(chǎn)生單元1000可進一步比較一個或多個層中在當前幀的前景分量的數(shù)目與一個或多個層中在前一幀的前景分量的數(shù)目。在兩個基于分量的比較皆得出無差異(意味著,前景和背景分量在前一幀中的數(shù)目等于前景和背景分量在當前幀中的數(shù)目)時,可縮放位流產(chǎn)生單元1000可在可縮放位流21中指定當前幀中的層的數(shù)目等于前一幀中的層的數(shù)目的指示(例如,HOABaseLayerConfigurationFlag語法元素),而非指定層的數(shù)目、一個或多個層中的前景分量的數(shù)目(例如,經(jīng)編碼nFG信號61和經(jīng)譯碼前景V[k]向量57的數(shù)目)和一個或多個層中的背景分量(例如,經(jīng)編碼環(huán)境HOA系數(shù)59)的數(shù)目的指示中的任一者。音頻解碼裝置24可接著確定層、背景分量和前景分量的數(shù)目的前一幀指示等于層的數(shù)目、背景分量和前景分量的數(shù)目的當前幀指示,如下文更詳細地描述。在上文提到的任一比較得出差異時,可縮放位流產(chǎn)生單元1000可在可縮放位流21中指定當前幀中的層的數(shù)目不等于前一幀中的層的數(shù)目的指示(例如,HOABaseLayerConfigurationFlag語法元素)??煽s放位流產(chǎn)生單元1000可接著指定層的數(shù)目、一個或多個層中的前景分量的數(shù)目(例如,經(jīng)編碼nFG信號61和經(jīng)譯碼前景V[k]向量57的數(shù)目)和一個或多個層中的背景分量(例如,經(jīng)編碼環(huán)境HOA系數(shù)59)的數(shù)目的指示,如上文所指出。就此而言可縮放位流產(chǎn)生單元1000可在位流中指定位流的層的數(shù)目當與位流在前一幀中的層的數(shù)目相比時在當前幀中是否已改變的指示,且指定位流在當前幀中的層的所指示數(shù)目。在一些實例中,并非不指定前景分量的數(shù)目的指示和背景分量的數(shù)目的指示,可縮放位流產(chǎn)生單元1000可不在可縮放位流21中指定分量的數(shù)目的指示(例如,“NumChannels”語法元素,其可為具有[i]項的陣列,其中i等于層的數(shù)目)??煽s放位流產(chǎn)生單元1000可不指定分量(其中這些分量也可被稱作“聲道”)的數(shù)目的此指示,代替不指定前景和背景分量的數(shù)目(鑒于前景和背景分量的數(shù)目可從更通用聲道數(shù)目導出)。在一些實例中,前景分量的數(shù)目的指示和背景聲道的數(shù)目的指示的導出可根據(jù)下表進行:表—ChannelSideInfoData(i)的語法其中ChannelType的描述給出如下:ChannelType:0:基于方向的信號1:基于向量的信號(其可表示前景信號)2:額外環(huán)境HOA系數(shù)(其可表示背景或環(huán)境信號)3:空作為根據(jù)以上SideChannelInfo語法表用信號表示ChannelType的結(jié)果,可根據(jù)設(shè)定為1的ChannelType語法元素的數(shù)目而確定每層的前景分量的數(shù)目,且可根據(jù)設(shè)定為2的ChannelType語法元素的數(shù)目確定每層的背景分量的數(shù)目。在一些實例中,可縮放位流產(chǎn)生單元1000可逐幀地指定HOADecoderConfig,其提供用于從位流21提取層的配置信息。可替代或結(jié)合上表指定HOADecoderConfig。下表可界定位流21中的HOADecoderConfig_FrameByFrame()對象的語法。在上表中,HOABaseLayerPresent語法元素可表示指示可縮放位流21的基礎(chǔ)層是否存在的旗標。當存在時,可縮放位流產(chǎn)生單元1000指定HOABaseLayerConfigurationFlag語法元素,其可表示指示基礎(chǔ)層的配置信息是否存在于位流21中的語法元素。在基礎(chǔ)層的配置信息存在于位流21中時,可縮放位流產(chǎn)生單元1000指定層的數(shù)目(即,所述實例中的NumLayers語法元素)、層中的每一者的前景聲道的數(shù)目(即,所述實例中的NumFGchannels語法元素),和層中的每一者的背景聲道的數(shù)目(即,所述實例中的NumBGchannels語法元素)。在HOABaseLayerPresent旗標指示不存在基礎(chǔ)層配置時,可縮放位流產(chǎn)生單元1000可不提供任何額外語法元素,且音頻解碼裝置24可確定當前幀的配置數(shù)據(jù)與前一幀的配置數(shù)據(jù)相同。在一些實例中,可縮放位流產(chǎn)生單元1000可在可縮放位流21中指定HOADecoderConfig對象,但不每層指定前景和背景聲道的數(shù)目,其中前景和背景聲道的數(shù)目可為靜態(tài)的或如上文關(guān)于ChannelSideInfo表所描述而加以確定。在此實例中,HOADecoderConfig可根據(jù)下表加以界定。作為又一替代方案,用于HOADecoderConfig的前述語法表可替換為用于HOADecoderConfig的以下語法表。就此而言,可縮放位流產(chǎn)生單元1000可經(jīng)配置以如上文所描述在位流中指定在位流的一個或多個層中指定的聲道的數(shù)目的指示,且指定位流的一個或多個層中的聲道的所指示數(shù)目。此外,可縮放位流產(chǎn)生單元1000可經(jīng)配置以指定指示聲道的數(shù)目的語法元素(例如,呈NumLayers語法元素或codedLayerCh語法元素形式,如下文更詳細地所描述)。在一些實例中,可縮放位流產(chǎn)生單元1000可經(jīng)配置以指定在位流中指定的聲道的總數(shù)目的指示。在這些情況下,可縮放位流產(chǎn)生單元1000可經(jīng)配置以指定位流的一個或多個層中的聲道的所指示總數(shù)目。在這些情況下,可縮放位流產(chǎn)生單元1000可經(jīng)配置以指定指示聲道的總數(shù)目的語法元素(例如,numHOATransportChannels語法元素,如下文更詳細地描述)。在這些和其它實例中,可縮放位流產(chǎn)生單元1000可經(jīng)配置以指定在位流中的一個或多個層中指定的聲道中的一者的類型的指示。在這些情況下,可縮放位流產(chǎn)生單元1000可經(jīng)配置以指定位流的一個或多個層中的聲道中的所述一者的所指示類型的所指示數(shù)目。前景聲道可包括US音頻對象和對應(yīng)V向量。在這些和其它實例中,可縮放位流產(chǎn)生單元1000可經(jīng)配置以指定在位流中的一個或多個層中指定的聲道中的一者的類型的指示、指示聲道中的一者為前景聲道的聲道中的一者的類型的指示。在這些情況下,可縮放位流產(chǎn)生單元1000可經(jīng)配置以指定位流的一個或多個層中的前景聲道。在這些和其它實例中,可縮放位流產(chǎn)生單元1000可經(jīng)配置以指定在位流中的一個或多個層中指定的聲道中的一者的類型的指示、指示聲道中的一者為背景聲道的聲道中的一者的類型的指示。在這些情況下,可縮放位流產(chǎn)生單元1000可經(jīng)配置以指定位流的一個或多個層中的背景聲道。背景聲道可包括環(huán)境HOA系數(shù)。在這些和其它實例中,可縮放位流產(chǎn)生單元1000可經(jīng)配置以指定指示聲道中的一者的類型的語法元素(例如,ChannelType語法元素)。在這些和其它實例中,可縮放位流產(chǎn)生單元1000可經(jīng)配置以基于在獲得層中的一者之后在位流中剩余的聲道的數(shù)目指定聲道的數(shù)目的指示(如例如由remainingCh語法元素或numAvailableTransportChannels語法元素界定,如下文更詳細地描述)。圖7A到7D是說明音頻編碼裝置20在產(chǎn)生HOA系數(shù)11的經(jīng)編碼雙層表示時的實例操作的流程圖。首先參考圖7A的實例,去相關(guān)單元60可首先對于表示為經(jīng)能量補償?shù)谋尘癏OA系數(shù)47A'到47D'的一階立體混響背景(其中“立體混響背景”可指描述聲場的背景分量的立體混響系數(shù))應(yīng)用UHJ去相關(guān)(300)。一階立體混響背景47A'到47D'可包含對應(yīng)于具有以下(階數(shù),子階數(shù))的球基函數(shù)的HOA系數(shù):(0,0)、(1,0)、(1,-1)、(1,1)。去相關(guān)單元60可輸出去相關(guān)環(huán)境HOA音頻信號67作為以上所提到的Q、T、L和R音頻信號。Q音頻信號可提供高度信息。T音頻信號可提供水平信息(包含用于表示甜點后的聲道的信息)。L音頻信號提供左立體聲聲道。R音頻信號提供右立體聲聲道。在一些實例中,UHJ矩陣可至少包括與左音頻聲道相關(guān)聯(lián)的高階立體混響音頻數(shù)據(jù)。在其它實例中UHJ矩陣可至少包括與右音頻聲道相關(guān)聯(lián)的高階立體混響音頻數(shù)據(jù)。在另外其它實例中,UHJ矩陣可至少包括與定位聲道相關(guān)聯(lián)的高階立體混響音頻數(shù)據(jù)。在其它實例中,UHJ矩陣可至少包括與高度聲道相關(guān)聯(lián)的高階立體混響音頻數(shù)據(jù)。在其它實例中,UHJ矩陣可至少包括與用于自動增益校正的邊帶相關(guān)聯(lián)的高階立體混響音頻數(shù)據(jù)。在其它實例中,UHJ矩陣可至少包括與左音頻聲道、右音頻聲道、定位聲道以及高度聲道和用于自動增益校正的邊帶相關(guān)聯(lián)的高階立體混響音頻數(shù)據(jù)。增益控制單元62可將自動增益控制(AGC)應(yīng)用于去相關(guān)環(huán)境HOA音頻信號67(302)。增益控制單元62可將經(jīng)調(diào)整環(huán)境HOA音頻信號67'傳遞到位流產(chǎn)生單元42,所述位流產(chǎn)生單元可基于經(jīng)調(diào)整環(huán)境HOA音頻信號67'形成基礎(chǔ)層,且基于高階立體混響增益控制數(shù)據(jù)(HOAGCD)形成旁側(cè)聲道的至少部分(304)。增益控制單元62還可對于經(jīng)內(nèi)插nFG音頻信號49'(其也可被稱作“基于向量的占優(yōu)勢信號”)應(yīng)用自動增益控制(306)。增益控制單元62可將經(jīng)調(diào)整nFG音頻信號49″連同用于經(jīng)調(diào)整nFG音頻信號49″的HOAGCD輸出到位流產(chǎn)生單元42。位流產(chǎn)生單元42可基于經(jīng)調(diào)整nFG音頻信號49″形成第二層,同時基于用于經(jīng)調(diào)整nFG音頻信號49″的HOAGCD和對應(yīng)經(jīng)譯碼前景V[k]向量57形成邊帶信息的部分(308)。高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層(即,基礎(chǔ)層)可包括對應(yīng)于具有等于或小于一的階數(shù)的一個或多個球基函數(shù)的高階立體混響系數(shù)。在一些實例中,第二層(即,增強層)包括基于向量的占優(yōu)勢音頻數(shù)據(jù)。在一些實例中,基于向量的占優(yōu)勢音頻至少包括占優(yōu)勢音頻數(shù)據(jù)和經(jīng)編碼V向量。如上文所描述,經(jīng)編碼V向量可通過音頻編碼裝置20的LIT單元30經(jīng)由應(yīng)用線性可逆變換而從高階立體混響音頻數(shù)據(jù)分解而來。在其它實例中,基于向量的占優(yōu)勢音頻數(shù)據(jù)至少包括額外高階立體混響聲道。在另外其它實例中,基于向量的占優(yōu)勢音頻數(shù)據(jù)至少包括自動增益校正邊帶。在其它實例中,基于向量的占優(yōu)勢音頻數(shù)據(jù)至少包括占優(yōu)勢音頻數(shù)據(jù)、經(jīng)編碼V向量、額外高階立體混響聲道和自動增益校正邊帶。在形成第一層和第二層時,位流產(chǎn)生單元42可執(zhí)行錯誤檢測、錯誤校正或錯誤檢測與校正兩者的錯誤檢查過程。在一些實例中,位流產(chǎn)生單元42可對第一層(即,基礎(chǔ)層)執(zhí)行錯誤檢查過程。在另一實例中,音頻譯碼裝置可對第一層(即,基礎(chǔ)層)執(zhí)行錯誤檢查過程,且制止對第二層(即,增強層)執(zhí)行錯誤檢查過程。在又一實例中,位流產(chǎn)生單元42可對第一層(即,基礎(chǔ)層)執(zhí)行錯誤檢查過程,且響應(yīng)于確定第一層無錯誤,音頻譯碼裝置可對第二層(即,增強層)執(zhí)行錯誤檢查過程。在位流產(chǎn)生單元42對第一層(即,基礎(chǔ)層)執(zhí)行錯誤檢查過程的以上實例中的任一者中,第一層可認為是極少出現(xiàn)錯誤的穩(wěn)健層。接下來參考圖7B,增益控制單元62和位流產(chǎn)生單元42執(zhí)行與上文關(guān)于圖7A所描述的增益控制單元62和位流產(chǎn)生單元42的操作類似的操作。然而,去相關(guān)單元60可將模式矩陣去相關(guān)而非UHJ去相關(guān)應(yīng)用于一階立體混響背景47A'到47D'(301)。接下來參考圖7C,增益控制單元62和位流產(chǎn)生單元42可執(zhí)行與與上文關(guān)于圖7A和7B的實例所描述的增益控制單元62和位流產(chǎn)生單元42的操作類似的操作。然而,在圖7C的實例中,去相關(guān)單元60可不將任何變換應(yīng)用于一階立體混響背景47A'到47D'。在以下實例8A到10B中的每一者中,假定但不說明去相關(guān)單元60可替代地不對于一階立體混響背景47A'到47D'中的一者或多者應(yīng)用去相關(guān)。接下來參考圖7D,去相關(guān)單元60和位流產(chǎn)生單元42可執(zhí)行與與上文關(guān)于圖7A和7B的實例所描述的增益控制單元52和位流產(chǎn)生單元42的操作類似的操作。然而,在圖7D的實例中,增益控制單元62可不將任何增益控制應(yīng)用于去相關(guān)環(huán)境HOA音頻信號67。在以下實例8A到10B中的每一者中,假定但不說明增益控制單元52可替代地不對于去相關(guān)環(huán)境HOA音頻信號67中的一者或多者應(yīng)用去相關(guān)。在圖7A到7D的實例中的每一者中,位流產(chǎn)生單元42可在位流21中指定一個或多個語法元素。圖10是說明在位流21中指定的HOA配置對象的實例的圖。對于圖7A到7D的實例中的每一者,位流產(chǎn)生單元42可將codedVVecLength語法元素400設(shè)定為1或2,其指示1階背景HOA聲道含有所有占優(yōu)勢聲音的1階分量。位流產(chǎn)生單元42還可設(shè)定ambienceDecorrelationMethod語法元素402,使得元素402用信號表示UHJ去相關(guān)的使用(例如,如上文關(guān)于圖7A所描述),用信號表示矩陣模式去相關(guān)的使用(例如,如上文關(guān)于圖7B所描述),或用信號表示不使用去相關(guān)(例如,如上文關(guān)于圖7C所描述)。圖11是說明由位流產(chǎn)生單元42針對第一層和第二層產(chǎn)生的邊帶信息410的圖。邊帶信息410包含邊帶基礎(chǔ)層信息412以及邊帶第二層信息414A和414B。僅在基礎(chǔ)層提供到音頻解碼裝置24時,音頻編碼裝置20才可僅提供邊帶基礎(chǔ)層信息412。邊帶基礎(chǔ)層信息412包含用于基礎(chǔ)層的HOAGCD。邊帶第二層信息414A包含傳輸信道1到4語法元素和對應(yīng)HOAGCD。邊帶第二層信息414B包含對應(yīng)于傳輸信道1和2的對應(yīng)的兩個經(jīng)譯碼減少V[k]向量57(鑒于傳輸信道3和4為空,如由等于112或310的ChannelType語法元素所表示)。圖8A和8B是說明音頻編碼裝置20在產(chǎn)生HOA系數(shù)11的經(jīng)編碼三層表示時的實例操作的流程圖。首先參考圖8A的實例,去相關(guān)單元60和增益控制單元62可執(zhí)行與上文關(guān)于圖7A所描述的操作類似的操作。然而,位流產(chǎn)生單元42可基于經(jīng)調(diào)整環(huán)境HOA音頻信號67的L音頻信號和R音頻信號而非所有經(jīng)調(diào)整環(huán)境HOA音頻信號67形成基礎(chǔ)層(310)。就此而言,在音頻解碼裝置24顯現(xiàn)時,基礎(chǔ)層可提供立體聲聲道。位流產(chǎn)生單元42還可產(chǎn)生基礎(chǔ)層的邊帶信息,包含HOAGCD。位流產(chǎn)生單元42的操作還可不同于上文關(guān)于圖7A所描述的操作,不同之處在于位流產(chǎn)生單元42可基于經(jīng)調(diào)整環(huán)境HOA音頻信號67的Q和T音頻信號形成第二層(312)。在圖8A的實例中,第二層可在于音頻解碼裝置24處顯現(xiàn)時提供水平聲道和3D音頻聲道。位流產(chǎn)生單元42還可產(chǎn)生用于第二層的邊帶信息,包含HOAGCD。位流產(chǎn)生單元42還可以大體類似于上文關(guān)于在圖7A的實例中形成第二層所描述的方式的方式形成第三層。位流產(chǎn)生單元42可指定類似于上文關(guān)于圖10所描述對象的用于位流21的HOA配置對象。另外,音頻編碼器20的位流產(chǎn)生單元42將MinAmbHoaOrder語法元素404設(shè)定為2以便指示發(fā)射1階HOA背景。位流產(chǎn)生單元42還可產(chǎn)生類似于圖12A的實例中所示的邊帶信息412的邊帶信息。圖12A為說明根據(jù)本發(fā)明中描述的技術(shù)的可縮放譯碼方面產(chǎn)生的邊帶信息412的圖。邊帶信息412包含邊帶基礎(chǔ)層信息416、邊帶第二層信息418,以及邊帶第三層信息420A和420B。邊帶基礎(chǔ)層信息416可提供用于基礎(chǔ)層的HOAGCD。邊帶第二層信息418可提供用于第二層的HOAGCD。邊帶第三層信息420A和420B可類似于上文關(guān)于圖11所描述的邊帶信息414A和414B。類似于圖7A,位流產(chǎn)生裝置42可執(zhí)行錯誤檢查過程。在一些實例中,位流產(chǎn)生裝置42可對第一層(即,基礎(chǔ)層)執(zhí)行錯誤檢查過程。在另一實例中,位流產(chǎn)生裝置42可對第一層(即,基礎(chǔ)層)執(zhí)行錯誤檢查過程,且制止對第二層(即,增強層)執(zhí)行錯誤檢查過程。在又一實例中,位流產(chǎn)生裝置42可對第一層(即,基礎(chǔ)層)執(zhí)行錯誤檢查過程,且響應(yīng)于確定第一層無錯誤,音頻譯碼裝置可對第二層(即,增強層)執(zhí)行錯誤檢查過程。在音頻譯碼裝置對第一層(即,基礎(chǔ)層)執(zhí)行錯誤檢查過程的以上實例中的任一者中,第一層可認為是極少出現(xiàn)錯誤的穩(wěn)健層。盡管描述為提供三個層,但在一些實例中,位流產(chǎn)生裝置42可在位流中指定僅存在兩個層的指示,且指定位流的層中的第一者指示高階立體混響音頻信號的提供立體聲聲道回放的背景分量,且位流的層中的第二者指示高階立體混響音頻信號的提供由布置在單個水平面上的三個或更多個揚聲器進行的水平多聲道回放的背景分量。換句話說,盡管展示為提供三個層,但位流產(chǎn)生裝置42可在一些情況下僅產(chǎn)生三個層中的兩者。應(yīng)理解,可產(chǎn)生所述層的任何子集,盡管本文中未詳細地描述。接下來參考圖8B,增益控制單元62和位流產(chǎn)生單元42可執(zhí)行與與上文關(guān)于圖8A的實例所描述的增益控制單元62和位流產(chǎn)生單元42的操作類似的操作。然而,去相關(guān)單元60可將模式矩陣去相關(guān)而非UHJ去相關(guān)應(yīng)用于一階立體混響背景47A'(316)。在一些實例中,一階立體混響背景47A'可包含零階立體混響系數(shù)47A'。增益控制單元62可將自動增益控制應(yīng)用于對應(yīng)于具有一階的球諧系數(shù)的一階立體混響系數(shù)和去相關(guān)環(huán)境HOA音頻信號67。位流產(chǎn)生單元42可基于經(jīng)調(diào)整環(huán)境HOA音頻信號67形成基礎(chǔ)層,且基于對應(yīng)HOAGCD形成邊帶的至少部分(310)。環(huán)境HOA音頻信號67可于在音頻解碼裝置24處顯現(xiàn)時提供單聲道。位流產(chǎn)生單元42可基于經(jīng)調(diào)整環(huán)境HOA系數(shù)47B″到47D″形成第二層,且基于對應(yīng)HOAGCD形成邊帶的至少部分(318)。經(jīng)調(diào)整環(huán)境HOA系數(shù)47B'到47D'可在于音頻解碼裝置24處顯現(xiàn)時提供X、Y和Z(或立體聲,水平和高度)聲道。位流產(chǎn)生單元42可以類似于上文關(guān)于圖8A所描述的方式的方式形成第三層和邊帶信息的至少部分。位流產(chǎn)生單元42可產(chǎn)生邊帶信息412,如關(guān)于圖12B更詳細描述的(326)。圖12B為說明根據(jù)本發(fā)明中描述的技術(shù)的可縮放譯碼方面產(chǎn)生的邊帶信息414的圖。邊帶信息414包含邊帶基礎(chǔ)層信息416、邊帶第二層信息422,以及邊帶第三層信息424A到424C。邊帶基礎(chǔ)層信息416可提供用于基礎(chǔ)層的HOAGCD。邊帶第二層信息422可提供用于第二層的HOAGCD。邊帶第三層信息424A到424C可類似于上文關(guān)于圖11所描述的邊帶信息414A(只是邊帶信息414A指定為邊帶第三層信息424A和424B)和414B。圖9A和9B是說明音頻編碼裝置20在產(chǎn)生HOA系數(shù)11的經(jīng)編碼四層表示時的實例操作的流程圖。首先參考圖9A的實例,去相關(guān)單元60和增益控制單元62可執(zhí)行與上文關(guān)于圖8A所描述的操作類似的操作位流產(chǎn)生單元42可以類似于上文關(guān)于圖8A的實例所描述的方式的方式形成基礎(chǔ)層,即,基于經(jīng)調(diào)整環(huán)境HOA音頻信號67的L音頻信號和R音頻信號而非所有經(jīng)調(diào)整環(huán)境HOA音頻信號67(310)。就此而言,基礎(chǔ)層可在于音頻解碼裝置24處顯現(xiàn)時提供立體聲聲道(或,換句話說,提供立體聲聲道回放)。位流產(chǎn)生單元42還可產(chǎn)生用于基礎(chǔ)層的邊帶信息,包含HOAGCD。位流產(chǎn)生單元42的操作可不同于上文關(guān)于圖8A所描述的操作,不同之處在于位流產(chǎn)生單元42可基于經(jīng)調(diào)整環(huán)境HOA音頻信號67的T音頻信號(而非Q音頻信號)形成第二層(322)。在圖9A的實例中,第二層可在于音頻解碼裝置24處顯現(xiàn)時提供水平聲道(或,換句話說,在單個水平面上的三個或更多個擴音器進行的多聲道回放)。位流產(chǎn)生單元42還可產(chǎn)生用于第二層的邊帶信息,包含HOAGCD。位流產(chǎn)生單元42還可基于經(jīng)調(diào)整環(huán)境HOA音頻信號67的Q音頻信號形成第三層(324)。第三層可提供由布置在一個或多個水平面上的三個或更多個揚聲器進行的三維回放。位流產(chǎn)生單元42可以大體類似于上文關(guān)于在圖8A的實例中形成第三層所描述的方式的方式形成第四層(326)。位流產(chǎn)生單元42可指定類似于上文關(guān)于圖10所描述對象的用于位流21的HOA配置對象。另外,音頻編碼器20的位流產(chǎn)生單元42將MinAmbHoaOrder語法元素404設(shè)定為2以便指示發(fā)射1階HOA背景。位流產(chǎn)生單元42還可產(chǎn)生類似于圖13A的實例中所示的邊帶信息412的邊帶信息。圖13A是說明根據(jù)本發(fā)明中描述的技術(shù)的可縮放譯碼方面產(chǎn)生的邊帶信息430的圖。邊帶信息430包含邊帶基礎(chǔ)層信息416、邊帶第二層信息418、邊帶第三層信息432以及邊帶第四層信息434A和434B。邊帶基礎(chǔ)層信息416可提供用于基礎(chǔ)層的HOAGCD。邊帶第二層信息418可提供用于第二層的HOAGCD。邊帶第三層信息430可提供用于第三層的HOAGCD。邊帶第四層信息434A和434B可類似于上文關(guān)于圖12A所描述的邊帶信息420A和420B。類似于圖7A,位流產(chǎn)生裝置42可執(zhí)行錯誤檢查過程。在一些實例中,位流產(chǎn)生裝置42可對第一層(即,基礎(chǔ)層)執(zhí)行錯誤檢查過程。在另一實例中,位流產(chǎn)生裝置42可對第一層(即,基礎(chǔ)層)執(zhí)行錯誤檢查過程,且制止對其余層(即,增強層)執(zhí)行錯誤檢查過程。在又一實例中,位流產(chǎn)生裝置42可對第一層(即,基礎(chǔ)層)執(zhí)行錯誤檢查過程,且響應(yīng)于確定第一層無錯誤,音頻譯碼裝置可對第二層(即,增強層)執(zhí)行錯誤檢查過程。在音頻譯碼裝置對第一層(即,基礎(chǔ)層)執(zhí)行錯誤檢查過程的以上實例中的任一者中,第一層可認為是極少出現(xiàn)錯誤的穩(wěn)健層。接下來參考圖9B,增益控制單元62和位流產(chǎn)生單元42可執(zhí)行與與上文關(guān)于圖9A的實例所描述的增益控制單元62和位流產(chǎn)生單元42的操作類似的操作。然而,去相關(guān)單元60可將模式矩陣去相關(guān)而非UHJ去相關(guān)應(yīng)用于一階立體混響背景47A'(316)。在一些實例中,一階立體混響背景47A'可包含零階立體混響系數(shù)47A'。增益控制單元62可將自動增益控制應(yīng)用于對應(yīng)于具有一階的球諧系數(shù)的一階立體混響系數(shù)和去相關(guān)環(huán)境HOA音頻信號67(302)。位流產(chǎn)生單元42可基于經(jīng)調(diào)整環(huán)境HOA音頻信號67形成基礎(chǔ)層,且基于對應(yīng)HOAGCD形成邊帶的至少部分(310)。環(huán)境HOA音頻信號67可于在音頻解碼裝置24處顯現(xiàn)時提供單聲道。位流產(chǎn)生單元42可基于經(jīng)調(diào)整環(huán)境HOA系數(shù)47B″到47D″形成第二層,且基于對應(yīng)HOAGCD形成邊帶的至少部分(322)。經(jīng)調(diào)整環(huán)境HOA系數(shù)47B'和47C″可提供由布置在單個水平面上的三個或更多個揚聲器進行的X、Y水平多聲道回放。位流產(chǎn)生單元42可基于經(jīng)調(diào)整環(huán)境HOA系數(shù)47D″形成第三層,且基于對應(yīng)HOAGCD形成邊帶的至少部分(324)。經(jīng)調(diào)整環(huán)境HOA系數(shù)47D″可提供由布置于一個或多個水平面中的三個或更多個揚聲器進行的三維回放。位流產(chǎn)生單元42可以類似于上文關(guān)于圖8A所描述的方式的方式形成第四層和邊帶信息的至少部分(326)。位流產(chǎn)生單元42可產(chǎn)生邊帶信息412,如關(guān)于圖12B更詳細描述的。圖13B是說明根據(jù)本發(fā)明中描述的技術(shù)的可縮放譯碼方面產(chǎn)生的邊帶信息440的圖。邊帶信息440包含邊帶基礎(chǔ)層信息416、邊帶第二層信息442、邊帶第三層信息444以及邊帶第四層信息446A到446C。邊帶基礎(chǔ)層信息416可提供用于基礎(chǔ)層的HOAGCD。邊帶第二層信息442可提供用于第二層的HOAGCD。邊帶第三層信息可提供用于第三層的HOAGCD。邊帶第四層信息446A到446C可類似于上文關(guān)于圖12B所描述的邊帶信息424A到424C。圖4是更詳細地說明圖2的音頻解碼裝置24的框圖。如圖4的實例中所示,音頻解碼裝置24可包含提取單元72、基于方向的重構(gòu)單元90和基于向量的重構(gòu)單元92。盡管在下文描述,但關(guān)于音頻解碼裝置24和解壓縮或以其它方式對HOA系數(shù)進行解碼的各種方面的更多信息可用于2014年5月29日申請的標題為“用于聲場的分解表示的內(nèi)插(INTERPOLATIONFORDECOMPOSEDREPRESENTATIONSOFASOUNDFIELD)”的第WO2014/194099號國際專利申請公開案。進一步信息還可見于上文提及的MPEG-H3D音頻譯碼標準階段I和階段II以及上文提及的概述MPEG-H3D音頻譯碼標準階段I的對應(yīng)論文中。提取單元72可表示經(jīng)配置以接收位流21且提取HOA系數(shù)11的各種經(jīng)編碼版本(例如,基于方向的經(jīng)編碼版本或基于向量的經(jīng)編碼版本)的單元。提取單元72可從以上所提到的指示HOA系數(shù)11是經(jīng)由各種基于方向的還是基于向量的版本而編碼的語法元素進行確定。在執(zhí)行基于方向的編碼時,提取單元72可提取HOA系數(shù)11的基于方向的版本以及與所述經(jīng)編碼版本相關(guān)聯(lián)的語法元素(其在圖4的實例中表示為基于方向的信息91),將基于方向的信息91傳遞到基于方向的重構(gòu)單元90?;诜较虻闹貥?gòu)單元90可表示經(jīng)配置以基于基于方向的信息91重構(gòu)呈HOA系數(shù)11'形式的HOA系數(shù)的單元。在語法元素指示HOA系數(shù)11是使用基于向量的合成編碼時,提取單元72可提取經(jīng)譯碼前景V[k]向量57(其可包含經(jīng)譯碼權(quán)重57及/或索引63或標量經(jīng)量化V向量)、經(jīng)編碼環(huán)境HOA系數(shù)59和對應(yīng)音頻對象61(其也可被稱作經(jīng)編碼nFG信號61)。音頻對象61各自對應(yīng)于向量57中的一者。提取單元72可將經(jīng)譯碼前景V[k]向量57傳遞到V向量重構(gòu)單元74,且將經(jīng)編碼環(huán)境HOA系數(shù)59連同經(jīng)編碼nFG信號61傳遞到心理聲學解碼單元80。關(guān)于圖6的實例更詳細地描述提取單元72。圖6是更詳細地說明在經(jīng)配置以執(zhí)行本發(fā)明中描述的可縮放音頻解碼技術(shù)的潛在版本中的第一者時的圖4的提取單元72的圖。在圖6的實例中,提取單元72包含模式選擇單元1010、可縮放提取單元1012和非可縮放提取單元1014。模式選擇單元1010表示經(jīng)配置以選擇將對于位流21執(zhí)行可縮放還是非可縮放提取的單元。模式選擇單元1010可包含存儲位流21的存儲器。模式選擇單元1010可基于是否已啟用可縮放譯碼的指示確定將執(zhí)行可縮放還是非可縮放提取。HOABaseLayerPresent語法元素可表示在對位流21進行編碼時是否執(zhí)行可縮放譯碼的指示。在HOABaseLayerPresent語法元素指示已啟用可縮放譯碼時,模式選擇單元1010可將位流21識別為可縮放位流21,且將可縮放位流21輸出到可縮放提取單元1012。在HOABaseLayerPresent語法元素指示尚未啟用可縮放譯碼時,模式選擇單元1010可將位流21識別為非可縮放位流21',且將非可縮放位流21'輸出到非可縮放提取單元1014。非可縮放提取單元1014表示經(jīng)配置以根據(jù)MPEG-H3D音頻譯碼標準階段I操作的單元??煽s放提取單元1012可表示經(jīng)配置以基于下文更詳細描述(且上文在各種HOADecoderConfig表中展示)的各種語法元素從可縮放位流21的一個或多個層提取環(huán)境HOA系數(shù)59、經(jīng)編碼nFG信號61和經(jīng)譯碼前景V[k]向量57中的一者或多者。在圖6的實例中,作為一個實例,可縮放提取單元1012可從可縮放位流21的基礎(chǔ)層21A提取四個經(jīng)編碼環(huán)境HOA系數(shù)59A到59D??煽s放提取單元1012還可從可縮放位流21的增強層21B提取兩個經(jīng)編碼nFG信號61A和61B(作為一個實例)以及兩個經(jīng)譯碼前景V[k]向量57A和57B??煽s放提取單元1012可將環(huán)境HOA系數(shù)59、經(jīng)編碼nFG信號61和經(jīng)譯碼前景V[k]向量57輸出到圖4的實例中所示的基于向量的解碼單元92。更具體來說,音頻解碼裝置24的提取單元72可提取L層的聲道,如在以上HOADecoderCofnig_FrameByFrame語法表中所闡述。根據(jù)以上HOADecoderCofnig_FrameByFrame語法表,模式選擇單元1010可首先獲得可指示是否執(zhí)行可縮放音頻編碼的HOABaseLayerPresent語法元素。在未啟用時(如例如由HOABaseLayerPresent語法元素的零值指定),模式選擇單元1010可確定MinAmbHoaOrder語法元素,且將非可縮放位流提供到非可縮放提取單元1014,所述非可縮放提取單元執(zhí)行類似于上文所描述的過程的非可縮放提取過程。在啟用時(如例如由HOABaseLayerPresent語法元素的一值所指定),模式選擇單元1010將MinAmbHOAOrder語法元素值設(shè)定為負一(-1),且將可縮放位流21'提供到可縮放提取單元1012??煽s放提取單元1012可獲得位流的層的數(shù)目當與位流在前一幀中的層的數(shù)目相比時在當前幀中是否已改變的指示。位流的層的數(shù)目當與位流在前一幀中的層的數(shù)目相比時在當前幀中是否已改變的指示可表示為前述表中的“HOABaseLayerConfigurationFlag”語法元素。可縮放提取單元1012可基于所述指示獲得位流在當前幀中的層的數(shù)目的指示。在所述指示指示位流的層的數(shù)目當與所述位流在前一幀中的層的數(shù)目相比時在當前幀中尚未改變時,可縮放提取單元1012可根據(jù)以上語法表的部分確定位流在當前幀中的層的數(shù)目等于位流在前一幀中的層的數(shù)目,所述部分述及:…}else}NumLayers=NumLayersPrevFrame;其中“NumLayers”可表示表示位流在當前幀中的層的數(shù)目的語法元素,且“NumLayersPrevFrame”可表示表示位流在前一幀中的層的數(shù)目的語法元素。根據(jù)以上HOADecoderConfig_FrameByFrame語法表,在所述指示指示位流的層的數(shù)目當與所述位流在前一幀中的層的數(shù)目相比時在當前幀中尚未改變時,可縮放提取單元1012可確定層中的一者或多者在當前幀的前景分量的當前數(shù)目的當前前景指示等于層中的一者或多者在前一幀的前景分量的先前數(shù)目的先前前景指示。換句話說,在HOABaseLayerConfigurationFlag等于零時,可縮放提取單元1012可確定表示層中的一者或多者在當前幀的前景分量的當前數(shù)目的當前前景指示的NumFGchannels[i]語法元素等于表示一個或多個層在前一幀的前景分量的先前數(shù)目的先前前景指示的NumFGchannels_PrevFrame[i]語法元素??煽s放提取單元1012可基于當前前景指示進一步從當前幀中的一個或多個層獲得前景分量。在所述指示指示位流的層的數(shù)目當與所述位流在前一幀中的層的數(shù)目相比時在當前幀中尚未改變時,可縮放提取單元1012還可確定層中的一者或多者在當前幀的背景分量的當前數(shù)目的當前背景指示等于層中的一者或多者在前一幀的背景分量的先前數(shù)目的先前背景指示。換句話說,在HOABaseLayerConfigurationFlag等于零時,可縮放提取單元1012可確定表示層中的一者或多者在當前幀的背景分量的當前數(shù)目的當前背景指示的NumBGchannels[i]語法元素等于表示一個或多個層在前一幀的背景分量的先前數(shù)目的先前背景指示的NumBGchannels_PrevFrame[i]語法元素??煽s放提取單元1012可基于當前背景指示進一步從當前幀中的一個或多個層獲得背景分量。為實現(xiàn)可潛在地降低層的數(shù)目、前景分量和背景分量的各種指示的信令的前述技術(shù),可縮放提取單元1012可將NumFGchannels_PrevFrame[i]語法元素和NumBGchannel_PrevFrame[i]語法元素設(shè)定為用于當前幀的指示(例如,NumFGchannels[i]語法元素和NumBGchannels[i]),在所有i個層迭代。此以以下語法表示:在所述指示指示位流的層的數(shù)目當與所述位流在前一幀中的層的數(shù)目相比時在當前幀中已改變時(例如,在HOABaseLayerConfigurationFlag等于一時),可縮放提取單元1012根據(jù)numHOATransportChannels獲得NumLayerBits語法元素,所述NumLayerBits語法元素傳遞到已根據(jù)本發(fā)明中未描述的其它語法表獲得的語法表中??煽s放提取單元1012可獲得在位流中指定的層的數(shù)目的指示(例如,NumLayers語法元素),其中所述指示可具有由NumLayerBits語法元素指示的位數(shù)。NumLayers語法元素可指定在位流中指定的層的數(shù)目,其中層的數(shù)目可表示為以上L。可縮放提取單元1012可接下來根據(jù)numHOATransportChannels確定numAvailableTransportChannels,且根據(jù)numAvailableTransportChannels確定numAvailableTransportChannelBits??煽s放提取單元1012可接著迭代經(jīng)過NumLayers,從1到NumLayers-1,以確定為第i層指定的背景HOA聲道的數(shù)目(Bi)和前景HOA聲道的數(shù)目(Fi)。可縮放提取單元1012可不迭代經(jīng)過最后層的編號(NumLayer)而僅經(jīng)過NumLayer-1,因為在位流中發(fā)送的前景和背景HOA聲道的總數(shù)目被可縮放提取單元1012知曉時(例如,在前景和背景HOA聲道的總數(shù)目用信號表示為語法元素時),可確定最后層BL。就此而言,可縮放提取單元1012可基于層的數(shù)目的指示獲得位流的層。如上文所描述,可縮放提取單元1012可獲得位流21中指定的聲道的數(shù)目的指示(例如,numHOATransportChannels),且通過至少部分地基于層的數(shù)目的指示和聲道的指示獲得位流21的層而獲得所述層。在迭代經(jīng)過每一層時,可縮放提取單元1012可首先通過獲得NumFGchannels[i]語法元素而確定第i層的前景聲道的數(shù)目??煽s放提取單元1012可接著從numAvailableTransportChannels減去NumFGchannels[i]以更新NumAvailableTransportChannels,且反射已從位流提取前景HOA聲道61的NumFGchannels[i](其也可被稱作“經(jīng)編碼nFG信號61”)。以此方式,可縮放提取單元1012可獲得用于層中的至少一者的在位流21中指定的前景聲道的數(shù)目的指示(例如,NumFGchannels),且基于前景聲道的數(shù)目的指示獲得位流的層中的所述至少一者的前景聲道。同樣,可縮放提取單元1012可通過獲得NumBGchannels[i]語法元素確定第i層的背景聲道的數(shù)目??煽s放提取單元1012可接著從numAvailableTransportChannels減去NumBGchannels[i]以反射已從位流提取背景HOA聲道59的NumBGchannels[i](其也可被稱作“經(jīng)編碼環(huán)境HOA系數(shù)59”)。以此方式,可縮放提取單元1012可獲得用于層中的至少一者的在位流21中指定的背景聲道的數(shù)目的指示(例如,NumBGChannels),且基于背景聲道的數(shù)目的指示獲得位流的層中的所述至少一者的背景聲道??煽s放提取單元1012可通過根據(jù)numAvailableTransports獲得numAvailableTransportChannelsBits而繼續(xù)。根據(jù)以上語法表,可縮放提取單元1012可剖析由numAvailableTransportChannelsBits指定的位數(shù)以確定NumFGchannels[i]和NumBGchannels[i]。鑒于numAvailableTransportChannelBits改變(例如,在每一迭代之后變小),用來表示NumFGchannels[i]語法元素和NumBGchannels[i]語法元素的位數(shù)減少,由此提供潛在地減小用信號表示NumFGchannels[i]語法元素和NumBGchannels[i]語法元素的額外負荷的形式的可變長度譯碼。如上文所指出,可縮放位流產(chǎn)生單元1000可指定NumChannels語法元素代替NumFGchannels和NumBGchannels語法元素。在此情況下,可縮放提取單元1012可經(jīng)配置以根據(jù)以上展示的第二HOADecoderConfig語法表操作。就此而言,在所述指示指示位流的層的數(shù)目當與所述位流在前一幀中的層的數(shù)目相比時在當前幀中已改變時,可縮放提取單元1012可基于層中的一者或多者在前一幀的分量的數(shù)目獲得層中的一者或多者在當前幀的分量的數(shù)目的指示??煽s放提取單元1012可進一步基于分量的數(shù)目的指示獲得一個或多個層在當前幀的背景分量的數(shù)目的指示??煽s放提取單元1012還可基于分量的數(shù)目的指示獲得一個或多個層在當前幀的前景分量的數(shù)目的指示。鑒于層的數(shù)目可能從幀到幀改變,前景和背景聲道的數(shù)目的指示可能從幀到幀改變,因此層的數(shù)目已改變的指示可有效地還指示聲道的數(shù)目已改變。結(jié)果,層的數(shù)目已改變的指示可導致可縮放提取單元1012獲得位流21中的一個或多個層中指定的聲道的數(shù)目當與位流中的一個或多個層在前一幀指定的聲道的數(shù)目相比時在當前幀中是否已改變的指示。由此,可縮放提取單元1012可基于位流中的一個或多個層中指定的聲道的數(shù)目在當前幀中是否已改變的指示獲得聲道中的一者。此外,可縮放提取單元1012可在所述指示指示在位流21的一個或多個層中指定的聲道的數(shù)目當與所述位流的一個或多個層中在前一幀中指定的聲道的數(shù)目相比時在當前幀中尚未改變時,確定位流21的所述一個或多個層中在所述當前幀中指定的聲道的數(shù)目與位流21的一個或多個層中在前一幀中指定的聲道的數(shù)目相同。此外,在所述指示指示在所述位流21的所述一個或多個層中指定的聲道的所述數(shù)目當與所述位流的所述一個或多個層中在所述前一幀中指定的聲道的所述數(shù)目相比時在所述當前幀中尚未改變時,可縮放提取單元1012可獲得所述層中的一者或多者在所述當前幀的聲道的當前數(shù)目與所述層中的一者或多者在前一幀的聲道的先前數(shù)目相同的指示。為實現(xiàn)可潛在地降低層和分量(其在本發(fā)明中也可被稱作“聲道”)的數(shù)目的各種指示的信令的前述技術(shù),可縮放提取單元1012可將NumChannels_PrevFrame[i]語法元素設(shè)定為當前幀的指示(例如,NumChannels[i]),迭代經(jīng)過所有i個層。此以以下語法表示:或者,可省略前述語法(NumLayersPrevFrame=NumLayers等),且可如下表中所闡述更新上文所列的語法表HOADecoderConfig(numHOATransportChannels):作為又一替代方案,提取單元72可根據(jù)上文所列的第三HOADecoderConfig而操作。根據(jù)上文所列的第三HOADecoderConfig語法表,可縮放提取單元1012可經(jīng)配置以從可縮放位流21獲得在位流中的一個或多個層中指定的聲道的數(shù)目的指示,且基于聲道的數(shù)目的指示獲得在位流中的一個或多個層中指定的聲道(其可指聲場的背景分量或前景分量)。在這些和其它實例中,可縮放提取單元1012可經(jīng)配置以獲得指示聲道的數(shù)目的語法元素(例如,以上提及的表中的codedLayerCh)。在這些和其它實例中,可縮放提取單元1012可經(jīng)配置以獲得在位流中指定的聲道的總數(shù)目的指示??煽s放提取單元1012還可經(jīng)配置以基于在一個或多個層中指定的聲道的數(shù)目的指示和聲道的總數(shù)目的指示獲得在一個或多個層中指定的聲道。在這些和其它實例中,可縮放提取單元1012可經(jīng)配置以獲得指示聲道的總數(shù)目的語法元素(例如,以上所提到的NumHOATransportChannels語法元素)。在這些和其它實例中,可縮放提取單元1012可經(jīng)配置以獲得在位流中的一個或多個層中指定的聲道中的一者的類型的指示??煽s放提取單元1012還可經(jīng)配置以基于層的數(shù)目的指示和聲道中的一者的類型的指示獲得聲道中的一者。在這些和其它實例中,可縮放提取單元1012可經(jīng)配置以獲得在位流中的一個或多個層中指定的聲道中的一者的類型的指示、指示聲道中的一者為前景聲道的聲道中的一者的類型的指示??煽s放提取單元1012可經(jīng)配置以基于層的數(shù)目的指示和聲道中的一者的類型為前景聲道的指示獲得聲道中的一者。在這些情況下,聲道中的一者包括US音頻對象和對應(yīng)V向量。在這些和其它實例中,可縮放提取單元1012可經(jīng)配置以獲得在位流中的一個或多個層中指定的聲道中的一者的類型的指示、指示聲道中的一者為背景聲道的聲道中的一者的類型的指示。在這些情況下,可縮放提取單元1012可經(jīng)配置以基于層的數(shù)目的指示和聲道中的一者的類型為背景聲道的指示獲得聲道中的一者。在這些情況下,聲道中的一者包括背景高階立體混響系數(shù)。在這些和其它實例中,可縮放提取單元1012可經(jīng)配置以獲得指示聲道中的一者的類型的語法元素(例如,上文關(guān)于圖30所描述的ChannelType語法元素)。在這些和其它實例中,可縮放提取單元1012可經(jīng)配置以基于在獲得層中的一者之后在位流中剩余的聲道的數(shù)目獲得聲道的數(shù)目的指示。即,在整個循環(huán)過程同時,HOALayerChBits語法元素的值隨如在以上語法表中所闡述的remainingCh語法元素而變。可縮放提取單元1012可接著基于改變的HOALayerChBits語法元素剖析codedLayerCh語法元素。返回到四個背景聲道和兩個前景聲道的實例,可縮放提取單元1012可接收層的數(shù)目為二(即,在圖6的實例中,基礎(chǔ)層21A和增強層21B)的指示??煽s放提取單元1012可獲得前景聲道的數(shù)目對于基礎(chǔ)層21A為零(例如,從NumFGchannels[0])且對于增強層21B為二(例如,從NumFGchannels[1])的指示。在此實例中,可縮放提取單元1012還獲得背景聲道的數(shù)目對于基礎(chǔ)層21A為四(例如,從NumBGchannels[0])且對于增強層21B為零(例如,從NumBGchannels[1])的指示。盡管是關(guān)于特定實例描述,但可指示背景與前景聲道的任何不同組合??煽s放提取單元1012可接著從基礎(chǔ)層21A提取所指定的四個背景聲道59A到59D,且從增強層21B提取兩個前景聲道61A和61B(連同從邊帶信息提取對應(yīng)V向量信息57A和57B)。盡管上文關(guān)于NumFGchannels和NumBGchannels語法元素進行描述,但還可以使用來自以上ChannelSideInfo語法表的ChannelType語法元素執(zhí)行所述技術(shù)。就此而言,NumFGchannels和NumBG聲道還可表示聲道中的一者的類型的指示。換句話說,NumBGchannels可表示聲道中的一者的類型為背景聲道的指示。NumFG聲道可表示聲道中的一者的類型為前景聲道的指示。由此,不管使用ChannelType語法元素還是NumFGchannels語法元素與NumBGchannels語法元素(或可能兩者或任一者的某一子集),可縮放位流提取單元1012可獲得在位流中的一個或多個層中指定的聲道中的一者的類型的指示。在類型的指示指示聲道中的一者為背景聲道時,可縮放位流提取單元1012可基于層的數(shù)目的指示和聲道中的一者的類型為背景聲道的指示獲得聲道中的一者。在類型的指示指示聲道中的一者為前景聲道時,可縮放位流提取單元1012可基于層的數(shù)目的指示和聲道中的一者的類型為前景聲道的指示獲得聲道中的一者。所述V向量重構(gòu)單元74可表示被配置成從所述編碼前景V[k]向量57重構(gòu)所述V向量的單元。所述V向量重構(gòu)單元74可以與所述量化單元52的運行方式互反的方式運行。心理聲學解碼單元80可以與圖3的實例中所示的心理聲學音頻譯碼器單元40反向的方式操作,以便對經(jīng)編碼環(huán)境HOA系數(shù)59和經(jīng)編碼nFG信號61進行解碼,且由此產(chǎn)生經(jīng)調(diào)整環(huán)境HOA音頻信號67'和經(jīng)調(diào)整經(jīng)內(nèi)插nFG信號49″(其也可被稱作經(jīng)調(diào)整經(jīng)內(nèi)插nFG音頻對象49')。心理聲學解碼單元80可將經(jīng)調(diào)整環(huán)境HOA音頻信號67'和經(jīng)調(diào)整經(jīng)內(nèi)插nFG信號49″傳遞到逆增益控制單元86。逆增益控制單元86可表示經(jīng)配置以對于經(jīng)調(diào)整環(huán)境HOA音頻信號67'和經(jīng)調(diào)整經(jīng)內(nèi)插nFG信號49″中的每一者執(zhí)行逆增益控制的單元,其中此逆增益控制與增益控制單元62執(zhí)行的增益控制反向。逆增益控制單元86可根據(jù)在上文關(guān)于圖11到13B的實例所論述的邊帶信息中指定的對應(yīng)HOAGCD執(zhí)行逆增益控制。逆增益控制單元86可將去相關(guān)環(huán)境HOA音頻信號67輸出到再相關(guān)單元88(在圖4的實例中展示為“再相關(guān)單元88”),且將經(jīng)內(nèi)插nFG音頻信號49″輸出到前景制訂單元78。再相關(guān)單元88可實施本發(fā)明的技術(shù)以降低去相關(guān)環(huán)境HOA音頻信號67的背景聲道之間的相關(guān),以降低或緩解噪聲去掩蔽。在再相關(guān)單元88將UHJ矩陣(例如,逆UHJ矩陣)應(yīng)用為所選再相關(guān)變換的實例中,再相關(guān)單元81可通過減少數(shù)據(jù)處理操作而改善壓縮率且節(jié)省計算資源。在一些實例中,可縮放位流21可包含指示在編碼期間應(yīng)用了去相關(guān)變換的一個或多個語法元素。將此些語法元素包含在基于向量的位流21中可使得再相關(guān)單元88能夠?qū)θハ嚓P(guān)環(huán)境HOA音頻信號67執(zhí)行反向去相關(guān)(例如,相關(guān)或再相關(guān))變換。在一些實例中,信號語法元素可指示應(yīng)用了哪一去相關(guān)變換,例如UHJ矩陣或模式矩陣,由此使得再相關(guān)單元88能夠選擇適當再相關(guān)變換應(yīng)用于去相關(guān)HOA音頻信號67。再相關(guān)單元88可對于去相關(guān)環(huán)境HOA音頻信號67執(zhí)行再相關(guān)以獲得經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'。再相關(guān)單元88可將經(jīng)能量補償?shù)沫h(huán)境HOA系數(shù)47'輸出到衰減單元770。盡管描述為執(zhí)行去相關(guān),但在一些實例中,可能不執(zhí)行去相關(guān)。由此,基于向量的重構(gòu)單元92可不執(zhí)行,或在一些實例中包含再相關(guān)單元88。在一些實例中,不存在再相關(guān)單元88由再相關(guān)單元88的虛線表示??臻g-時間內(nèi)插單元76可以類似于上文關(guān)于空間-時間內(nèi)插單元50所描述的方式操作。空間-時間內(nèi)插單元76可接收經(jīng)減少的前景V[k]向量55k,并且對于前景V[k]向量55k和經(jīng)減少的前景V[k-1]向量55k-1執(zhí)行空間-時間內(nèi)插以產(chǎn)生經(jīng)內(nèi)插的前景V[k]向量55k″。空間-時間內(nèi)插單元76將經(jīng)內(nèi)插的前景V[k]向量55k″轉(zhuǎn)發(fā)到淡化單元770。提取單元72還可將指示環(huán)境HOA系數(shù)中的一者何時轉(zhuǎn)變的信號757輸出到淡化單元770,所述淡化單元可接著確定哪些SHCBG47'(其中SHCBG47'還可以表示為“環(huán)境HOA聲道47'”或“環(huán)境HOA系數(shù)47'”)和經(jīng)內(nèi)插前景V[k]向量55k″的元素將淡入或淡出。在一些實例中,淡化單元770可對于環(huán)境HOA系數(shù)47'與經(jīng)內(nèi)插前景向量55k″的元素中的每一者相反地操作。即,淡化單元770可對于環(huán)境HOA系數(shù)47'中的對應(yīng)一者執(zhí)行淡入或淡出或淡入或淡出兩者,而對于經(jīng)內(nèi)插前景V[k]向量55k″的元素中的所述對應(yīng)一者執(zhí)行淡入或淡出或淡入和淡出兩者。淡化單元770可將經(jīng)調(diào)整環(huán)境HOA系數(shù)47″輸出到HOA系數(shù)制訂單元82,且將經(jīng)調(diào)整前景V[k]向量55k″'輸出到前景制訂單元78。就此而言,淡化單元770表示經(jīng)配置以對于HOA系數(shù)或其導出項(例如,呈環(huán)境HOA系數(shù)47'和經(jīng)內(nèi)插前景V[k]向量55k″的元素的形式)的各種方面執(zhí)行淡化操作的單元。前景制訂單元78可表示經(jīng)配置以對于經(jīng)調(diào)整前景V[k]向量55k″'和經(jīng)內(nèi)插nFG信號49'執(zhí)行矩陣乘法以產(chǎn)生前景HOA系數(shù)65的單元。就此而言,前景制訂單元78可組合音頻對象49'(其為表示經(jīng)內(nèi)插nFG信號49'的另一方式)與向量55k″'以重構(gòu)前景,或換句話說,重構(gòu)HOA系數(shù)11'的占優(yōu)勢方面。前景制訂單元78可執(zhí)行經(jīng)內(nèi)插nFG信號49'乘以經(jīng)調(diào)整前景V[k]向量55k″'的矩陣乘法。HOA系數(shù)制訂單元82可表示經(jīng)配置以組合前景HOA系數(shù)65與經(jīng)調(diào)整環(huán)境HOA系數(shù)47″以便獲得HOA系數(shù)11'的單元。撇號記法反映HOA系數(shù)11'可類似于但不相同于HOA系數(shù)11。HOA系數(shù)11與11'之間的差異可源于歸因于經(jīng)由有損傳輸媒體的傳輸、量化或其它有損操作而造成的損失。圖14A和14B是說明音頻編碼裝置20在執(zhí)行本發(fā)明中描述的技術(shù)的各種方面時的實例操作的流程圖。首先參考圖14A的實例,音頻編碼裝置20可以上文所描述的方式(例如,線性分解、內(nèi)插,等)獲得HOA系數(shù)11的當前幀的聲道(500)。所述聲道可包括經(jīng)編碼環(huán)境HOA系數(shù)59、經(jīng)編碼nFG信號61(和呈經(jīng)譯碼前景V向量57形式的對應(yīng)邊帶)或經(jīng)編碼環(huán)境HOA系數(shù)59和經(jīng)編碼nFG信號61(和呈經(jīng)譯碼前景V向量57形式的對應(yīng)邊帶)兩者。音頻編碼裝置20的位流產(chǎn)生單元42可接著以上文所描述的方式在可縮放位流21中指定層的數(shù)目的指示(502)。位流產(chǎn)生單元42可在可縮放位流21的當前層中指定聲道的子集(504)。位流產(chǎn)生單元42可維持用于當前層的計數(shù)器,其中所述計數(shù)器提供當前層的指示。在指定當前層中的聲道之后,位流產(chǎn)生單元42可遞增計數(shù)器。位流產(chǎn)生單元42可接著確定當前層(例如,計數(shù)器)是否大于位流中指定的層的數(shù)目(506)。在當前層不大于層的數(shù)目(“否”506)時,位流產(chǎn)生單元42可指定當前層中的聲道的不同子集(其在計數(shù)器遞增時改變)(504)。位流產(chǎn)生單元42可以此方式繼續(xù),直到當前層大于層的數(shù)目(“是”506)。在當前層大于層的數(shù)目(“是”506)時,位流產(chǎn)生單元可繼續(xù)進行到下一幀,其中當前幀變?yōu)榍耙粠?,且獲得可縮放位流21的現(xiàn)在的當前幀的聲道(500)。所述過程可繼續(xù),直到到達HOA系數(shù)11的最后幀(500到506)。如上文所指出,在一些實例中,層的數(shù)目的指示可能并非明確地指示,而是隱含地指定于可縮放位流21中(例如,在層的數(shù)目從前一幀到當前幀尚未改變時)。接下來參考圖14B的實例,音頻編碼裝置20可以上文所描述的方式(例如,線性分解、內(nèi)插,等)獲得HOA系數(shù)11的當前幀的聲道(510)。所述聲道可包括經(jīng)編碼環(huán)境HOA系數(shù)59、經(jīng)編碼nFG信號61(和呈經(jīng)譯碼前景V向量57形式的對應(yīng)邊帶)或經(jīng)編碼環(huán)境HOA系數(shù)59和經(jīng)編碼nFG信號61(和呈經(jīng)譯碼前景V向量57形式的對應(yīng)邊帶)兩者。音頻編碼裝置20的位流產(chǎn)生單元42可接著以上文所描述的方式在可縮放位流21的層中指定聲道的數(shù)目的指示(512)。位流產(chǎn)生單元42可在可縮放位流21的當前層中指定對應(yīng)聲道(514)。位流產(chǎn)生單元42可接著確定當前層(例如,計數(shù)器)是否大于層的數(shù)目(516)。即,在圖14B的實例中,層的數(shù)目可為靜態(tài)或固定的(而非在可縮放位流21中指定),同時可指定每層的聲道數(shù)目,這不同于圖14A的實例,其中聲道的數(shù)目可為靜態(tài)或固定的且不用信號表示。位流產(chǎn)生單元42可仍維持指示當前層的計數(shù)器。在當前層(如由計數(shù)器指示)不大于層的數(shù)目(“否”516)時,位流產(chǎn)生單元42可在可縮放位流21的另一層中指定現(xiàn)在的當前層(其歸因于遞增計數(shù)器而改變)的聲道數(shù)目的另一指示(512)。位流產(chǎn)生單元42還可在位流21的額外層中指定聲道的對應(yīng)數(shù)目(514)。位流產(chǎn)生單元42可以此方式繼續(xù),直到當前層大于層的數(shù)目(“是”516)。在當前層大于層的數(shù)目時(“是”516),位流產(chǎn)生單元可繼續(xù)進行到下一幀,其中當前幀變?yōu)榍耙粠?,且獲得可縮放位流21的現(xiàn)在的當前幀的聲道(510)。所述過程可繼續(xù),直到到達HOA系數(shù)11的最后幀(510到516)。如上文所指出,在一些實例中,聲道的數(shù)目的指示可能并非明確地指示,而是隱含地指定于可縮放位流21中(例如,在層的數(shù)目從前一幀到當前幀尚未改變時)此外,盡管描述為單獨過程,但關(guān)于圖14A和14B描述的技術(shù)可以上文所描述的方式組合地執(zhí)行。圖15A和15B是說明音頻解碼裝置24在執(zhí)行本發(fā)明中描述的技術(shù)的各種方面時的實例操作的流程圖。首先參考圖15A的實例,音頻解碼裝置24可從可縮放位流21獲得當前幀(520)。當前幀可包含一個或多個層,其中的每一個可包含一個或多個聲道。所述聲道可包括經(jīng)編碼環(huán)境HOA系數(shù)59、經(jīng)編碼nFG信號61(和呈經(jīng)譯碼前景V向量57形式的對應(yīng)邊帶)或經(jīng)編碼環(huán)境HOA系數(shù)59和經(jīng)編碼nFG信號61(和呈經(jīng)譯碼前景V向量57形式的對應(yīng)邊帶)兩者。音頻解碼裝置24的提取單元72可接著以上文所描述的方式獲得可縮放位流21的當前幀中的層的數(shù)目的指示(522)。提取單元72可獲得可縮放位流21的當前層中的聲道的子集(524)。提取單元72可維持當前層的計數(shù)器,其中所述計數(shù)器提供當前層的指示。在指定當前層中的聲道之后,提取單元72可遞增計數(shù)器。提取單元72可接著確定當前層(例如,計數(shù)器)是否大于位流中指定的層的數(shù)目(526)。在當前層不大于層的數(shù)目時(“否”526),提取單元72可獲得當前層(其在計數(shù)器遞增時改變)中的聲道的不同子集(524)。提取單元72可以此方式繼續(xù),直到當前層大于層的數(shù)目(“是”526)。在當前層大于層的數(shù)目時(“是”526),提取單元72可繼續(xù)進行到下一幀,其中當前幀變?yōu)榍耙粠?,且獲得可縮放位流21的現(xiàn)在的當前幀(520)。所述過程可繼續(xù),直到到達可縮放位流21的最后幀(520到526)。如上文所指出,在一些實例中,層的數(shù)目的指示可能并非明確地指示,而是隱含地指定于可縮放位流21中(例如,在層的數(shù)目從前一幀到當前幀尚未改變時)。接下來參考圖15B的實例,音頻解碼裝置24可從可縮放位流21獲得當前幀(530)。當前幀可包含一個或多個層,其中的每一個可包含一個或多個聲道。所述聲道可包括經(jīng)編碼環(huán)境HOA系數(shù)59、經(jīng)編碼nFG信號61(和呈經(jīng)譯碼前景V向量57形式的對應(yīng)邊帶)或經(jīng)編碼環(huán)境HOA系數(shù)59和經(jīng)編碼nFG信號61(和呈經(jīng)譯碼前景V向量57形式的對應(yīng)邊帶)兩者。音頻解碼裝置24的提取單元72可接著以上文所描述的方式獲得可縮放位流21的層中的聲道的數(shù)目的指示(532)。位流產(chǎn)生單元42可從可縮放位流21的當前層獲得聲道的對應(yīng)數(shù)目(534)。提取單元72可接著確定當前層(例如,計數(shù)器)是否大于層的數(shù)目(536)。即,在圖15B的實例中,層的數(shù)目可為靜態(tài)或固定的(而非在可縮放位流21中指定),同時可指定每層的聲道數(shù)目,這不同于圖15A的實例,其中聲道的數(shù)目可為靜態(tài)或固定的且不用信號表示。提取單元72可仍維持指示當前層的計數(shù)器。在當前層(如由計數(shù)器指示)不大于層的數(shù)目(“否”536)時,提取單元72可在可縮放位流21的另一層中獲得現(xiàn)在的當前層(其歸因于遞增計數(shù)器而改變)的聲道數(shù)目的另一指示(532)。提取單元72還可在位流21的額外層中指定聲道的對應(yīng)數(shù)目(514)。提取單元72可以此方式繼續(xù),直到當前層大于層的數(shù)目(“是”516)。在當前層大于層的數(shù)目時(“是”516),位流產(chǎn)生單元可繼續(xù)進行到下一幀,其中當前幀變?yōu)榍耙粠?,且獲得可縮放位流21的現(xiàn)在的當前幀的聲道(510)。所述過程可繼續(xù),直到到達HOA系數(shù)11的最后幀(510到516)。如上文所指出,在一些實例中,聲道的數(shù)目的指示可能并非明確地指示,而是隱含地指定于可縮放位流21中(例如,在層的數(shù)目從前一幀到當前幀尚未改變時)此外,盡管描述為單獨過程,但關(guān)于圖15A和15B描述的技術(shù)可以上文所描述的方式組合地執(zhí)行。圖16是說明根據(jù)本發(fā)明中描述的技術(shù)的各種方面的如由圖16的實例中所示的位流產(chǎn)生單元42執(zhí)行的可縮放音頻譯碼的圖。在圖16的實例中,例如圖2和3的實例中所示的音頻編碼裝置20等HOA音頻編碼器可對HOA系數(shù)11(其也可以被稱作“HOA信號11”)進行編碼。HOA信號11可包括24個聲道,每一聲道具有1024個樣本。如上文所指出,每一聲道包含1024個樣本,其可指對應(yīng)于球基函數(shù)中的一者的1024個HOA系數(shù)。如上文對于圖5的實例中所示的位流產(chǎn)生單元42所描述,音頻編碼裝置20執(zhí)行各種操作以從HOA信號11獲得經(jīng)編碼環(huán)境HOA系數(shù)59(其也可以被稱作“背景HOA聲道59”)。如圖16的實例中進一步展示,音頻編碼裝置20獲得背景HOA聲道59作為HOA信號11的前四個聲道。背景HOA聲道59表示為其中1:4反映出選擇HOA信號11的前四個聲道來表示聲場的背景分量。此聲道選擇可在語法元素中用信號表示為B=4。音頻編碼裝置20的可縮放位流產(chǎn)生單元1000可接著在基礎(chǔ)層21A(其可稱為兩個或更多個層中的第一層)中指定HOA背景聲道59??煽s放位流產(chǎn)生單元1000可產(chǎn)生基礎(chǔ)層21A以包含背景聲道59和如根據(jù)以下方程式指定的增益信息:如圖16的實例中進一步展示,音頻編碼裝置20可獲得F個前景HOA聲道,其可表達為US音頻對象和對應(yīng)V向量。出于說明的目的,假定F=2。音頻編碼裝置20因此可選擇第一和第二US音頻對象61(還可以稱為“經(jīng)編碼nFG信號61”)以及第一和第二V向量57(也可以被稱作“經(jīng)譯碼前景V[k]向量57”),其中所述選擇在圖5的實例中分別表示為US1:2和V1:2。可縮放位流產(chǎn)生單元1000可接著產(chǎn)生可縮放位流21的第二層21B以包含第一和第二US音頻對象61以及第一和第二V向量57。可縮放位流產(chǎn)生單元1000還可產(chǎn)生增強層21B以包含前景HOA聲道61和增益信息連同根據(jù)以下方程式指定的V向量57:為從可縮放位流21'獲得HOA系數(shù)11',圖2和3的實例中所示的音頻解碼裝置24可調(diào)用在圖6的實例中更詳細地展示的提取單元72。提取單元72可以上文關(guān)于圖6所描述的方式提取經(jīng)編碼環(huán)境HOA系數(shù)59A到59D、經(jīng)編碼nFG信號61A和61B,以及經(jīng)譯碼前景V[k]向量57A和57B。提取單元72可接著將經(jīng)編碼環(huán)境HOA系數(shù)59A到59D、經(jīng)編碼nFG信號61A和61B,以及經(jīng)譯碼前景V[k]向量57A和57B輸出到基于向量的解碼單元92。基于向量的解碼單元92可接著根據(jù)以下等式將US音頻對象61乘以V向量57:例如,F(xiàn)=2:第一方程式提供對于F的通用操作的數(shù)學表達式。第二方程式提供所述實例中的數(shù)學表達式,其中假定F等于二。此乘法的結(jié)果表示為前景HOA信號1020。基于向量的解碼單元92接著選擇較高聲道(考慮到最低四個系數(shù)已經(jīng)選擇作為HOA背景聲道59),其中這些較高聲道表示為換句話說,基于向量的解碼單元92從前景HOA信號1020獲得HOA前景聲道65。結(jié)果,所述技術(shù)可促進可變分層(相對于需要層的靜態(tài)數(shù)目)以適應(yīng)大量譯碼上下文且潛在地提供指定聲場的背景和前景分量時的更大靈活性。所述技術(shù)可提供許多其它使用情況,如關(guān)于圖17到26所描述。這些各種使用情況可單獨地執(zhí)行或在給定音頻流內(nèi)一起執(zhí)行。此外,在可縮放音頻編碼技術(shù)內(nèi)指定這些分量可允許更多使用情況。換句話說,所述技術(shù)不應(yīng)限于下文描述的使用情況,而可包含可借以在可縮放位流一個或多個層中用信號表示背景和前景分量的任何方式。圖17是其中語法元素指示存在兩個層的實例的概念圖,其中在基礎(chǔ)層中指定四個經(jīng)編碼環(huán)境HOA系數(shù),且在增強層中指定兩個經(jīng)編碼nFG信號。圖17的實例展示HOA幀,此時圖5的實例中所示的可縮放位流產(chǎn)生單元1000可分段所述幀以形成包含經(jīng)編碼環(huán)境HOA系數(shù)59A到59D的邊帶HOA增益校正數(shù)據(jù)的基礎(chǔ)層??煽s放位流產(chǎn)生單元1000還可分段HOA幀以形成增強層21,所述增強層包含兩個經(jīng)譯碼前景V[k]向量57和用于經(jīng)編碼環(huán)境nFG信號61的HOA增益校正數(shù)據(jù)。如圖17的實例中進一步展示,心理聲學音頻編碼單元40展示為劃分成心理聲學音頻編碼器40A(其可稱為基礎(chǔ)層時間編碼器40A)與心理聲學音頻編碼器40B(其可稱為增強層時間編碼器40B)的單獨例項?;A(chǔ)層時間編碼器40A表示處理基礎(chǔ)層的四個分量的四個心理聲學音頻編碼器例項。增強層時間編碼器40B表示處理增強層的兩個分量的兩個心理聲學音頻編碼器例項。圖18是更詳細地說明在經(jīng)配置以執(zhí)行本發(fā)明中描述的可縮放音頻譯碼技術(shù)的潛在版本中的第二者時的圖3的位流產(chǎn)生單元42的圖。在此實例中,位流產(chǎn)生單元42大體類似于上文關(guān)于圖5的實例所描述的位流產(chǎn)生單元42。然而,位流產(chǎn)生單元42執(zhí)行可縮放譯碼技術(shù)的第二版本以指定三個層21A到21C而非兩個層21A和21B。可縮放位流產(chǎn)生單元1000可指定在基礎(chǔ)層21A中指定兩個經(jīng)編碼環(huán)境HOA系數(shù)和零個經(jīng)編碼nFG信號的指示、在第一增強層21B中指定零個經(jīng)編碼環(huán)境HOA系數(shù)和兩個經(jīng)編碼nFG信號的指示,以及在第二增強層21C中指定零個經(jīng)編碼環(huán)境HOA系數(shù)和兩個經(jīng)編碼nFG信號61的指示??煽s放位流產(chǎn)生單元1000可接著在基礎(chǔ)層21A中指定兩個經(jīng)編碼環(huán)境HOA系數(shù)59A和59B,在第一增強層21B中指定具有對應(yīng)的兩個經(jīng)譯碼前景V[k]向量57A和57B的兩個經(jīng)編碼nFG信號61A和61B,且在第二增強層21C指定具有對應(yīng)的兩個經(jīng)譯碼前景V[k]向量57C和57D的兩個經(jīng)編碼nFG信號61C和61D??煽s放位流產(chǎn)生單元1000可接著輸出這些層作為可縮放位流21。圖19是更詳細地說明在經(jīng)配置以執(zhí)行本發(fā)明中描述的可縮放音頻解碼技術(shù)的潛在版本中的第二者時的圖3的提取單元72的圖。在此實例中,位流提取單元72大體類似于上文關(guān)于圖6的實例所描述的位流提取單元72。然而,位流提取單元72對于三個層21A到21C而非兩個層21A和21B執(zhí)行可縮放譯碼技術(shù)的第二版本。可縮放位流提取單元1012可獲得在基礎(chǔ)層21A中指定兩個經(jīng)編碼環(huán)境HOA系數(shù)和零個經(jīng)編碼nFG信號的指示、在第一增強層21B中指定零個經(jīng)編碼環(huán)境HOA系數(shù)和兩個經(jīng)編碼nFG信號的指示,以及在第二增強層21C中指定零個經(jīng)編碼環(huán)境HOA系數(shù)和兩個經(jīng)編碼nFG信號的指示??煽s放位流提取單元1012可接著從基礎(chǔ)層21A獲得兩個經(jīng)編碼環(huán)境HOA系數(shù)59A和59B,從第一增強層21B獲得具有對應(yīng)的兩個經(jīng)譯碼前景V[k]向量57A和57B的兩個經(jīng)編碼nFG信號61A和61B,且從第二增強層21C獲得具有對應(yīng)的兩個經(jīng)譯碼前景V[k]向量57C和57D的兩個經(jīng)編碼nFG信號61C和61D。可縮放位流提取單元1012可將經(jīng)編碼環(huán)境HOA系數(shù)59、經(jīng)編碼nFG信號61和經(jīng)譯碼前景V[k]向量57輸出到基于向量的解碼單元92。圖20是說明圖18的位流產(chǎn)生單元和圖19的提取單元可借以執(zhí)行本發(fā)明中描述的技術(shù)的潛在版本中的第二者的第二使用情況的圖。舉例來說,圖18的實例中所示的位流產(chǎn)生單元42可指定NumLayer(其為易于理解而展示為“NumberOfLayers”)語法元素以指示在可縮放位流21中指定的層的數(shù)目為三。位流產(chǎn)生單元42可進一步指定在第一層21A(其也稱為“基礎(chǔ)層”)中指定的背景聲道的數(shù)目為二,而在第一層21B中指定的前景聲道的數(shù)目為零(即,在圖20的實例中,B1=2,F(xiàn)1=0)。位流產(chǎn)生單元42可進一步指定在第二層21B(其也稱為“增強層”)中指定的背景聲道的數(shù)目為零,而在第二層21B中指定的前景聲道的數(shù)目為二(即,在圖20的實例中,B2=0,F(xiàn)2=2)。位流產(chǎn)生單元42可進一步指定在第二層21C(其也稱為“增強層”)中指定的背景聲道的數(shù)目為零,而在第二層21C中指定的前景聲道的數(shù)目為二(即,在圖20的實例中,B3=0,F(xiàn)3=2)。然而,在前景和背景聲道的總數(shù)目已經(jīng)在解碼器處知曉(例如,借助于額外語法元素,例如totalNumBGchannels和totalNumFGchannels)時,音頻編碼裝置20可能不必用信號表示第三層背景和前景聲道信息。位流產(chǎn)生單元42可將這些Bi和Fi值指定為NumBGchannels[i]和NumFGchannels[i]。對于以上實例,音頻編碼裝置20可將NumBGchannels語法元素指定為{2,0,0},且將NumFGchannels語法元素指定為{0,2,2}。位流產(chǎn)生單元42還可在可縮放位流21中指定背景HOA音頻聲道59、前景HOA聲道61和V向量57。圖2和4的實例中所示的音頻解碼裝置24可以與音頻編碼裝置20的操作反向的方式來操作,以剖析來自位流的這些語法元素(例如,如在以上HOADecoderConfig語法表中所闡述),如上文關(guān)于圖19的位流提取單元72所描述。音頻解碼裝置24還可根據(jù)所剖析語法元素剖析來自位流21的對應(yīng)背景HOA音頻聲道1002和前景HOA聲道1010,再次如上文關(guān)于圖19的位流提取單元72所描述。圖21是其中語法元素指示存在三個層的實例的概念圖,其中在基礎(chǔ)層中指定兩個經(jīng)編碼環(huán)境HOA系數(shù),在第一增強層中指定兩個經(jīng)編碼nFG信號,且在第二增強層中指定兩個經(jīng)編碼nFG信號。圖21的實例展示HOA幀,此時圖18的實例中所示的可縮放位流產(chǎn)生單元1000可分段所述幀以形成包含用于經(jīng)編碼環(huán)境HOA系數(shù)59A和59B的邊帶HOA增益校正數(shù)據(jù)的基礎(chǔ)層。可縮放位流產(chǎn)生單元1000還可分段HOA幀以形成包含用于經(jīng)編碼環(huán)境nFG信號61的兩個經(jīng)譯碼前景V[k]向量57和HOA增益校正數(shù)據(jù)的增強層21B以及包含用于經(jīng)編碼環(huán)境nFG信號61的兩個額外經(jīng)譯碼前景V[k]向量57和HOA增益校正數(shù)據(jù)的增強層21C。如圖21的實例中進一步展示,心理聲學音頻編碼單元40展示為劃分成心理聲學音頻編碼器40A(其可稱為基礎(chǔ)層時間編碼器40A)與心理聲學音頻編碼器40B(其可稱為增強層時間編碼器40B)的單獨實例化?;A(chǔ)層時間編碼器40A表示處理基礎(chǔ)層的四個分量的兩個心理聲學音頻編碼器例項。增強層時間編碼器40B表示處理增強層的兩個分量的四個心理聲學音頻編碼器例項。圖22是更詳細地說明在經(jīng)配置以執(zhí)行本發(fā)明中描述的可縮放音頻譯碼技術(shù)的潛在版本中的第三者時的圖3的位流產(chǎn)生單元42的圖。在此實例中,位流產(chǎn)生單元42大體類似于上文關(guān)于圖18的實例所描述的位流產(chǎn)生單元42。然而,位流產(chǎn)生單元42執(zhí)行可縮放譯碼技術(shù)的第三版本以指定三個層21A到21C而非兩個層21A和21B??煽s放位流產(chǎn)生單元1000可指定在基礎(chǔ)層21A中指定零個經(jīng)編碼環(huán)境HOA系數(shù)和兩個經(jīng)編碼nFG信號的指示、在第一增強層21B中指定零個經(jīng)編碼環(huán)境HOA系數(shù)和兩個經(jīng)編碼nFG信號的指示,以及在第二增強層21C中指定零個經(jīng)編碼環(huán)境HOA系數(shù)和兩個經(jīng)編碼nFG信號的指示??煽s放位流產(chǎn)生單元1000可接著在基礎(chǔ)層21A中指定具有對應(yīng)的兩個經(jīng)譯碼前景V[k]向量57A和57B的兩個經(jīng)編碼nFG信號61A和61B,在第一增強層21B中指定具有對應(yīng)的兩個經(jīng)譯碼前景V[k]向量57C和57D的兩個經(jīng)編碼nFG信號61C和61D,且在第二增強層21C指定具有對應(yīng)的兩個經(jīng)譯碼前景V[k]向量57E和57F的兩個經(jīng)編碼nFG信號61E和61F。可縮放位流產(chǎn)生單元1000可接著輸出這些層作為可縮放位流21。圖23是更詳細地說明在經(jīng)配置以執(zhí)行本發(fā)明中描述的可縮放音頻解碼技術(shù)的潛在版本中的第三者時的圖4的提取單元72的圖。在此實例中,位流提取單元72大體類似于文關(guān)于圖19的實例所描述的位流提取單元72。然而,位流提取單元72對于三個層21A到21C而非兩個層21A和21B執(zhí)行可縮放譯碼技術(shù)的第三版本。此外,可縮放位流提取單元1012可獲得在基礎(chǔ)層21A中指定零個經(jīng)編碼環(huán)境HOA系數(shù)和兩個經(jīng)編碼nFG信號的指示、在第一增強層21B中指定零個經(jīng)編碼環(huán)境HOA系數(shù)和兩個經(jīng)編碼nFG信號的指示,以及在第二增強層21C中指定零個經(jīng)編碼環(huán)境HOA系數(shù)和兩個經(jīng)編碼nFG信號的指示??煽s放位流提取單元1012可接著從基礎(chǔ)層21A獲得具有對應(yīng)的兩個經(jīng)譯碼前景V[k]向量57A和57B的兩個經(jīng)編碼nFG信號61A和61B,從第一增強層21B獲得具有對應(yīng)的兩個經(jīng)譯碼前景V[k]向量57C和57D的兩個經(jīng)編碼nFG信號61C和61D,且從第二增強層21C獲得具有對應(yīng)的兩個經(jīng)譯碼前景V[k]向量57E和57F的兩個經(jīng)編碼nFG信號61E和61F。可縮放位流提取單元1012可將經(jīng)編碼nFG信號61和經(jīng)譯碼前景V[k]向量57輸出到基于向量的解碼單元92。圖24是根據(jù)本發(fā)明中描述的技術(shù)的說明音頻編碼裝置可借以在多層位流中指定多個層的第三使用情況的圖。舉例來說,圖22的位流產(chǎn)生單元42可指定NumLayer(其為易于理解而展示為“NumberOfLayers”)語法元素以指示在位流21中指定的層的數(shù)目為三。位流產(chǎn)生單元42可進一步指定在第一層(其也稱為“基礎(chǔ)層”)中指定的背景聲道的數(shù)目為零,而在第一層中指定的前景聲道的數(shù)目為二(即,在圖24的實例中,B1=0,F(xiàn)1=2)。換句話說,基礎(chǔ)層并不始終僅用于傳輸環(huán)境HOA系數(shù),而是可允許指定占優(yōu)勢或換句話說前景HOA音頻信號。這兩個前景音頻聲道表示為經(jīng)編碼nFG信號61A/B和經(jīng)譯碼前景V[k]向量57A/B,且可在數(shù)學上由以下方程式表示:表示兩個前景音頻聲道,其可由第一和第二音頻對象(US1和US2)連同對應(yīng)V向量(V1和V2)表示。位流產(chǎn)生裝置42可進一步指定在第二層(其也稱為“增強層”)中指定的背景聲道的數(shù)目為零,而在第二層中指定的前景聲道的數(shù)目為二(即,在圖24的實例中,B2=0,F(xiàn)2=2)。這兩個前景音頻聲道表示為經(jīng)編碼nFG信號61C/D和經(jīng)譯碼前景V[k]向量57C/D,且可在數(shù)學上由以下方程式表示:表示兩個前景音頻聲道,其可由第三和第四音頻對象(US3和US4)連同對應(yīng)V向量(V3和V4)表示。此外,位流產(chǎn)生單元42可指定在第三層(其也稱為“增強層”)中指定的背景聲道的數(shù)目為零,而在第三層中指定的前景聲道的數(shù)目為二(即,在圖24的實例中,B3=0,F(xiàn)3=2)。這兩個前景音頻聲道表示為前景音頻聲道1024,且可在數(shù)學上由以下方程式表示:表示兩個前景音頻聲道1024,其可由第五和第六音頻對象(US5和US6)連同對應(yīng)V向量(V5和V6)表示。然而,在前景和背景聲道的總數(shù)目在解碼器處已經(jīng)知曉(例如,借助于額外語法元素,例如totalNumBGchannels和totalNumFGchannels)時,位流產(chǎn)生單元42可能不必以信號表示此第三層背景和前景聲道信息。然而,在前景和背景聲道的總數(shù)目在解碼器處已經(jīng)知曉(例如,借助于額外語法元素,例如totalNumBGchannels和totalNumFGchannels)時,位流產(chǎn)生單元42可能不以信號表示第三層背景和前景聲道信息。位流產(chǎn)生單元42可將這些Bi和Fi值指定為NumBGchannels[i]和NumFGchannels[i]。對于以上實例,音頻編碼裝置20可將NumBGchannels語法元素指定為{0,0,0},且將NumFGchannels語法元素指定為{2,2,2}。音頻編碼裝置20還可在位流21中指定前景HOA聲道1020到1024。圖2和4的實例中所示的音頻解碼裝置24可以與音頻編碼裝置20的操作反向的方式來操作,以剖析來自位流的這些語法元素(例如,如在以上HOADecoderConfig語法表中所闡述),如上文關(guān)于圖23的位流提取單元72所描述。音頻解碼裝置24還可根據(jù)所剖析語法元素剖析來自位流21的對應(yīng)前景HOA音頻聲道1020到1024,再次如上文關(guān)于圖23的位流提取單元72所描述,且經(jīng)由對前景HOA音頻聲道1020到1024進行求和來重構(gòu)HOA系數(shù)1026。圖25是其中語法元素指示存在三個層的實例的概念圖,其中在基礎(chǔ)層中指定兩個經(jīng)編碼nFG信號,在第一增強層中指定兩個經(jīng)編碼nFG信號,且在第二增強層中指定兩個經(jīng)編碼nFG信號。圖25的實例展示HOA幀,此時圖22的實例中所示的可縮放位流產(chǎn)生單元1000可分段所述幀以形成包含用于經(jīng)編碼nFG信號61A和61B和兩個經(jīng)譯碼前景V[k]向量57的邊帶HOA增益校正數(shù)據(jù)的基礎(chǔ)層??煽s放位流產(chǎn)生單元1000還可分段HOA幀以形成包含用于經(jīng)編碼環(huán)境nFG信號61的兩個經(jīng)譯碼前景V[k]向量57和HOA增益校正數(shù)據(jù)的增強層21B以及包含用于經(jīng)編碼環(huán)境nFG信號61的兩個額外經(jīng)譯碼前景V[k]向量57和HOA增益校正數(shù)據(jù)的增強層21C。如圖25的實例中進一步展示,心理聲學音頻編碼單元40展示為劃分成心理聲學音頻編碼器40A(其可稱為基礎(chǔ)層時間編碼器40A)與心理聲學音頻編碼器40B(其可稱為增強層時間編碼器40B)的單獨實例化。基礎(chǔ)層時間編碼器40A表示處理基礎(chǔ)層的四個分量的兩個心理聲學音頻編碼器例項。增強層時間編碼器40B表示處理增強層的兩個分量的四個心理聲學音頻編碼器例項。圖26是根據(jù)本發(fā)明中描述的技術(shù)的說明音頻編碼裝置可借以在多層位流中指定多個層的第三使用情況的圖。舉例來說,圖2和3的實例中所示的音頻編碼裝置20可指定NumLayer(其為易于理解而展示為“NumberOfLayers”)語法元素以指示在位流21中指定的層的數(shù)目為四。音頻編碼裝置20可進一步指定在第一層(其也稱為“基礎(chǔ)層”)中指定的背景聲道的數(shù)目為一,而在第一層中指定的前景聲道的數(shù)目為零(即,在圖26的實例中,B1=1,F(xiàn)1=0)。音頻編碼裝置20可進一步指定在第二層(其也稱為“第一增強層”)中指定的背景聲道的數(shù)目為一,而在第二層中指定的前景聲道的數(shù)目為零(即,在圖26的實例中,B2=1,F(xiàn)2=0)。音頻編碼裝置20還可指定在第三層(其也稱為“第二增強層”)中指定的背景聲道的數(shù)目為一,而在第三層中指定的前景聲道的數(shù)目為零(即,在圖26的實例中,B3=1,F(xiàn)3=0)。此外,音頻編碼裝置20可指定在第四層(其也稱為“增強層”)中指定的背景聲道的數(shù)目為一,而在第三層中指定的前景聲道的數(shù)目為零(即,在圖26的實例中,B4=1,F(xiàn)4=0)。然而,在前景和背景聲道的總數(shù)目已經(jīng)在解碼器處知曉(例如,借助于額外語法元素,例如totalNumBGchannels和totalNumFGchannels)時,音頻編碼裝置20可能不必用信號表示第四層背景和前景聲道信息。音頻編碼裝置20可將這些Bi和Fi值指定為NumBGchannels[i]和NumFGchannels[i]。對于以上實例,音頻編碼裝置20可將NumBGchannels語法元素指定為{1,1,1,1},且將NumFGchannels語法元素指定為{0,0,0,0}。音頻編碼裝置20還可在位流21中指定背景HOA音頻聲道1030。就此而言,所述技術(shù)可允許增強層指定環(huán)境或換句話說背景HOA聲道1030,其可在指定于位流21的基礎(chǔ)和增強層中之前去相關(guān),如上文關(guān)于圖7A到9B的實例所描述。然而,再次,本發(fā)明中所闡述的技術(shù)不必受限于去相關(guān),且可不在位流中提供與如上文所描述的去相關(guān)有關(guān)的語法元素或任何其它指示。圖2和4的實例中所示的音頻解碼裝置24可以與音頻編碼裝置20的操作反向的方式來操作,以剖析來自位流的這些語法元素(例如,如在以上HOADecoderConfig語法表中所闡述)。音頻解碼裝置24還可根據(jù)所剖析語法元素剖析來自位流21的對應(yīng)背景HOA音頻聲道1030。如上文所指出,在一些情況下,可縮放位流21可包含符合非可縮放位流21的各種層。舉例來說,可縮放位流21可包含符合非可縮放位流21的基礎(chǔ)層。在這些情況下,非可縮放位流21可表示可縮放位流21的子位流,其中此非可縮放子位流21可利用可縮放位流21的額外層(其稱為增強層)增強。圖27和28是說明可經(jīng)配置以執(zhí)行本發(fā)明中描述的技術(shù)的各種方面的可縮放位流產(chǎn)生單元42和可縮放位流提取單元72的框圖。在圖27的實例中,可縮放位流產(chǎn)生單元42可表示上文關(guān)于圖3的實例所描述的位流產(chǎn)生單元42的實例。可縮放位流產(chǎn)生單元42可輸出符合(依據(jù)語法和由不支持可縮放譯碼的音頻解碼器解碼的能力)非可縮放位流21的基礎(chǔ)層21??煽s放位流產(chǎn)生單元42可以上文關(guān)于前述位流產(chǎn)生單位42中的任一者所描述的方式而操作,只是可縮放位流產(chǎn)生單元42不包含非可縮放位流產(chǎn)生單元1002。替代地,可縮放位流產(chǎn)生單元42輸出符合非可縮放位流的基礎(chǔ)層21,且因此不需要單獨的非可縮放位流產(chǎn)生單元1000。在圖28的實例中,可縮放位流提取單元72可與可縮放位流產(chǎn)生單元42往復操作。圖29表示表示可經(jīng)配置以根據(jù)本發(fā)明中描述的技術(shù)的各種方面而操作的編碼器900的概念圖。編碼器900可表示音頻編碼裝置20的另一實例。編碼器900可包含空間分解單元902、去相關(guān)單元904和時間編碼單元906??臻g分解單元902可表示經(jīng)配置以輸出基于向量的占優(yōu)勢聲音(呈上文提到的音頻對象形式)、與這些基于向量的占優(yōu)勢聲音相關(guān)聯(lián)的對應(yīng)V向量和水平環(huán)境HOA系數(shù)903的單元??臻g分解單元902可不同于基于方向的分解,不同之處在于V向量描述音頻對象中的對應(yīng)一者的方向和寬度(隨著每一音頻對象隨時間推移而在聲場內(nèi)移動)兩者??臻g分解單元902可包含圖3的實例中所示的基于向量的合成單元27的單元30到38和44到52,且通常以上文關(guān)于單元30到38和44到52所描述的方式而操作??臻g分解單元902可不同于基于向量的合成單元27,不同之處在于空間分解單元902可不執(zhí)行心理聲學編碼,或另外包含心理聲學譯碼器單元40且可不包含位流產(chǎn)生單元42。此外,在可縮放音頻編碼上下文中,空間分解單元902可通過水平環(huán)境HOA系數(shù)903(意味著,在一些實例中,這些水平HOA系數(shù)可能不修改或以其它方式調(diào)整,且從HOA系數(shù)901剖析)。水平環(huán)境HOA系數(shù)903可指描述聲場的水平分量的HOA系數(shù)901(其也可被稱作HOA音頻數(shù)據(jù)901)中的任一者。舉例來說,水平環(huán)境HOA系數(shù)903可包含與具有階數(shù)零和子階數(shù)零的球基函數(shù)相關(guān)聯(lián)的HOA系數(shù)、對應(yīng)于具有階數(shù)一和子階數(shù)負一的球基函數(shù)的高階立體混響系數(shù),以及對應(yīng)于具有階數(shù)一和子階數(shù)一的球基函數(shù)的第三高階立體混響系數(shù)。去相關(guān)單元904表示經(jīng)配置以對于高階立體混響音頻數(shù)據(jù)903(其中環(huán)境HOA系數(shù)903為此HOA音頻數(shù)據(jù)的一個實例)的兩個或更多個層中的第一層執(zhí)行去相關(guān)以獲得所述高階立體混響音頻數(shù)據(jù)的所述兩個或更多個層中的第一層的經(jīng)去相關(guān)表示905?;A(chǔ)層903可類似于上文關(guān)于圖21到26所描述的第一層、基礎(chǔ)層或基礎(chǔ)子層中的任一者。去相關(guān)單元904可使用以上所提到的UHJ矩陣或模式矩陣執(zhí)行去相關(guān)。去相關(guān)單元904還可使用例如旋轉(zhuǎn)等變換以類似于2014年2月27日申請的標題為“變換球諧系數(shù)(TRANSFORMINGSPHERICALHARMONICCOEFFICIENTS)”的第14/192,829號美國申請案中描述的方式執(zhí)行去相關(guān),只是執(zhí)行旋轉(zhuǎn)以獲得第一層的經(jīng)去相關(guān)表示而非減少系數(shù)的數(shù)目。換句話說,去相關(guān)單元904可執(zhí)行聲場的旋轉(zhuǎn)以沿著分開120度的三個不同橫軸(例如0度方位角/0度仰角,120度方位角/0度仰角,和240度方位角/0度仰角)對準環(huán)境HOA系數(shù)903的能量。通過對準這些能量與三個橫軸,去相關(guān)單元904可嘗試使能量彼此去相關(guān),使得去相關(guān)單元904可利用空間變換有效地渲染三個去相關(guān)音頻聲道905。去相關(guān)單元904可應(yīng)用此空間變換以便計算0度、120度和240度方位角處的空間音頻信號905。盡管關(guān)于0度、120度和240度方位角進行描述,但可關(guān)于均勻或接近均勻地劃分圓的360度方位角的任何三個方位角來應(yīng)用所述技術(shù)。舉例來說,還可以關(guān)于計算60度、180度和300度的方位角處的空間音頻信號905的變換執(zhí)行所述技術(shù)。此外,盡管關(guān)于三個環(huán)境HOA系數(shù)901進行描述,但可更一般地對于任何水平HOA系數(shù)執(zhí)行所述技術(shù),包含如上文所描述的那些系數(shù)和任何其它水平HOA系數(shù),例如與具有階數(shù)二和子階數(shù)二的球基函數(shù)、具有階數(shù)二和子階數(shù)負二的球基函數(shù)、具有階數(shù)X和子階數(shù)X的球基函數(shù)以及具有階數(shù)X和子階數(shù)負X的球基函數(shù)相關(guān)聯(lián)的那些系數(shù),其中X可表示任何數(shù)目,包含3、4、5、6,等。隨著水平HOA系數(shù)的數(shù)目增大,360度圓的均勻或接近均勻部分的數(shù)目可增大。舉例來說,在水平HOA系數(shù)的數(shù)目增大到五時,去相關(guān)單元904可將圓分段為五個均勻分區(qū)(例如,各自大致為72度)。作為另一實例,水平HOA系數(shù)的數(shù)目X可導致X個均勻分區(qū),每一分區(qū)具有360度/X度。為識別指示由水平環(huán)境HOA系數(shù)903表示的聲場旋轉(zhuǎn)量,去相關(guān)單元904可執(zhí)行聲場分析、內(nèi)容特性分析及/或空間分析?;谶@些分析中的一者或多者,去相關(guān)單元904可將旋轉(zhuǎn)信息(或其它變換信息,其中旋轉(zhuǎn)信息為一個實例)識別為聲場的水平旋轉(zhuǎn)度數(shù),且旋轉(zhuǎn)所述聲場,從而有效地獲得高階立體混響音頻數(shù)據(jù)的基礎(chǔ)層的經(jīng)旋轉(zhuǎn)表示(其為更通用經(jīng)變換表示的一個實例)。去相關(guān)單元904可接著將空間變換應(yīng)用于高階立體混響音頻數(shù)據(jù)的基礎(chǔ)層903(其也可被稱作兩個或更多個層中的第一層903)的經(jīng)旋轉(zhuǎn)表示??臻g變換可將高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的基礎(chǔ)層的經(jīng)旋轉(zhuǎn)表示從球面諧波域轉(zhuǎn)換到空間域以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)去相關(guān)表示。第一層的去相關(guān)表示可包含在0度、120度和240度的三個對應(yīng)方位角處渲染的空間音頻信號905,如上文所指出。去相關(guān)單元904可接著將水平環(huán)境空間音頻信號905傳遞到時間編碼單元906。時間編碼單元906可表示經(jīng)配置以執(zhí)行心理聲學音頻譯碼的單元。時間編碼單元906可表示AAC編碼器或統(tǒng)一話音和音頻譯碼器(USAC),提供兩個實例。例如時間編碼單元906等時間音頻編碼單元可對于去相關(guān)音頻數(shù)據(jù)(例如5.1揚聲器設(shè)置的6個聲道,這6個聲道已渲染到去相關(guān)聲道)正常操作。然而,水平環(huán)境HOA系數(shù)903在性質(zhì)上是累加性的,且由此在某些方面相關(guān)。將這些水平環(huán)境HOA系數(shù)903直接提供到時間編碼單元906而不首先執(zhí)行某一形式的去相關(guān)可能會導致空間噪聲去掩蔽,其中聲音出現(xiàn)在不希望的位置。例如空間噪聲去掩蔽的這些感知偽聲可通過執(zhí)行上文所描述的基于變換(或更具體來說,在圖29的實例中,基于旋轉(zhuǎn))的去相關(guān)來減少。圖30是更詳細地說明圖27的實例中所示的編碼器900的圖。在圖30的實例中,編碼器900可表示基礎(chǔ)層編碼器900,其僅對HOA一階水平基礎(chǔ)層903進行編碼,且不展示空間分解單元902,因為此單元902在此通過實例中不執(zhí)行除了將基礎(chǔ)層903提供到聲場分析單元910和去相關(guān)單元904的二維(2D)旋轉(zhuǎn)單元912之外的有意義操作。即,去相關(guān)單元904包含聲場分析單元910和2D旋轉(zhuǎn)單元912。聲場分析單元910表示經(jīng)配置以執(zhí)行上文更詳細描述的聲場分析以獲得旋轉(zhuǎn)角參數(shù)911的單元。旋轉(zhuǎn)角參數(shù)911表示呈旋轉(zhuǎn)信息形式的變換信息的一個實例。2D旋轉(zhuǎn)單元912表示經(jīng)配置以基于旋轉(zhuǎn)角參數(shù)911執(zhí)行繞著聲場的Z軸的水平旋轉(zhuǎn)的單元。此旋轉(zhuǎn)為二維的,因為旋轉(zhuǎn)僅涉及單個旋轉(zhuǎn)軸,且在此實例中不包含任何仰角旋轉(zhuǎn)。2D旋轉(zhuǎn)單元912可獲得逆旋轉(zhuǎn)信息913(作為一個實例,通過反轉(zhuǎn)旋轉(zhuǎn)角參數(shù)911以獲得逆旋轉(zhuǎn)角參數(shù)913),其可為更通用的逆變換信息的實例。2D旋轉(zhuǎn)單元912可提供逆旋轉(zhuǎn)角參數(shù)913,使得編碼器900可在位流中指定逆旋轉(zhuǎn)角參數(shù)913。換句話說,2D旋轉(zhuǎn)單元912可基于聲場分析旋轉(zhuǎn)2D聲場,以使得占優(yōu)勢能量潛在地從2D空間變換模塊中使用的空間取樣點(0°,120°,240°)中的一者到達。作為一個實例,2D旋轉(zhuǎn)單元912可應(yīng)用以下旋轉(zhuǎn)矩陣:在一些實例中,為避免幀偽聲,2D旋轉(zhuǎn)單元912可應(yīng)用平滑(內(nèi)插)函數(shù)以確保時變旋轉(zhuǎn)角的平滑轉(zhuǎn)變。此平滑函數(shù)可包括線性平滑函數(shù)。然而,可使用其它平滑函數(shù),包含非線性平滑函數(shù)。舉例來說,2D旋轉(zhuǎn)單元912可使用仿樣平滑函數(shù)(splinesmoothingfunction)。為進行說明,在聲場分析單元910模塊指示聲場的優(yōu)勢方向在一個分析幀內(nèi)為70°方位角處時,2D旋轉(zhuǎn)單元912可根據(jù)φ=-70°平滑地旋轉(zhuǎn)聲場,以使得優(yōu)勢方向現(xiàn)在為0°。作為另一可能性,2D旋轉(zhuǎn)單元912可根據(jù)φ=50°旋轉(zhuǎn)聲場,以使得優(yōu)勢方向現(xiàn)在為120°。2D旋轉(zhuǎn)單元912可接著將所應(yīng)用的旋轉(zhuǎn)角913以信號表示為位流內(nèi)的額外邊帶參數(shù),以使得解碼器可應(yīng)用正確的逆旋轉(zhuǎn)操作。如圖30的實例中進一步展示,去相關(guān)單元904還包含2D空間變換單元914。2D空間變換單元914表示經(jīng)配置以將基礎(chǔ)層的經(jīng)旋轉(zhuǎn)表示從球面諧波域轉(zhuǎn)換到空間域,從而有效地將經(jīng)旋轉(zhuǎn)基礎(chǔ)層915渲染到三個方位角(例如,0,120和240)的單元。2D空間變換單元914可將經(jīng)旋轉(zhuǎn)基礎(chǔ)層915的系數(shù)與以下變換矩陣相乘,其采用HOA系數(shù)階數(shù)“00+”、“11-”、“11+”和N3D正規(guī)化:前述矩陣計算方位角0°、120°和240°處的空間音頻信號905,以使得360°圓被均勻劃分為3部分。如上文所指出,其它分離是可能的,只要每一部分涵蓋120度即可,例如,計算60°、180°和300°處的空間信號。以此方式,所述技術(shù)可提供經(jīng)配置以執(zhí)行可縮放高階立體混響音頻數(shù)據(jù)編碼的裝置900。裝置900可經(jīng)配置以對于高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層903執(zhí)行去相關(guān),以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)去相關(guān)表示905。在這些和其它實例中,高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層903包括對應(yīng)于具有等于或小于一的階數(shù)的一個或多個球基函數(shù)的環(huán)境高階立體混響系數(shù)。在這些和其它實例中,高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層903包括僅對應(yīng)于描述聲場的水平方面的球基函數(shù)的環(huán)境高階立體混響系數(shù)。在這些和其它實例中,僅對應(yīng)于描述聲場的水平方面的球基函數(shù)的環(huán)境高階立體混響系數(shù)可包括對應(yīng)于具有階數(shù)零和子階數(shù)零的球基函數(shù)的第一環(huán)境高階立體混響系數(shù)、對應(yīng)于具有階數(shù)一和子階數(shù)負一的球基函數(shù)的第二高階立體混響系數(shù),以及對應(yīng)于具有階數(shù)一和子階數(shù)一的球基函數(shù)的第三高階立體混響系數(shù)。在這些和其它實例中,裝置900可經(jīng)配置以對于高階立體混響音頻數(shù)據(jù)的第一層903執(zhí)行變換(例如,借助于2D旋轉(zhuǎn)單元912)。在這些和其它實例中,裝置900可經(jīng)配置以對于高階立體混響音頻數(shù)據(jù)的第一層903執(zhí)行旋轉(zhuǎn)(例如,借助于2D旋轉(zhuǎn)單元912)。在這些和其它實例中,裝置900可經(jīng)配置以對于高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層903應(yīng)用變換(例如,借助于2D旋轉(zhuǎn)單元912)以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)變換表示915,且將高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)變換表示915從球面諧波域轉(zhuǎn)換(例如,借助于2D空間變換單元914)到空間域以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)去相關(guān)表示905。在這些和其它實例中,裝置900可經(jīng)配置以對于高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層903應(yīng)用旋轉(zhuǎn)以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)旋轉(zhuǎn)表示915,且將高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)旋轉(zhuǎn)表示915從球面諧波域轉(zhuǎn)換到空間域以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)去相關(guān)表示905。在這些和其它實例中,裝置900可經(jīng)配置以獲得變換信息911,基于變換信息911對于高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層903應(yīng)用變換以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)變換表示915,且將高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)變換表示915從球面諧波域轉(zhuǎn)換到空間域以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)去相關(guān)表示905。在這些和其它實例中,裝置900可經(jīng)配置以獲得旋轉(zhuǎn)信息911,且基于旋轉(zhuǎn)信息911對于高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層903應(yīng)用旋轉(zhuǎn)以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)旋轉(zhuǎn)表示915,且將高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)旋轉(zhuǎn)表示915從球面諧波域轉(zhuǎn)換到空間域以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)去相關(guān)表示905。在這些和其它實例中,裝置900可經(jīng)配置以至少部分地使用平滑函數(shù)對于高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層903應(yīng)用變換以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)變換表示915,且將高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)變換表示915從球面諧波域轉(zhuǎn)換到空間域以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)去相關(guān)表示905。在這些和其它實例中,裝置900可經(jīng)配置以至少部分地使用平滑函數(shù)對于高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層903應(yīng)用旋轉(zhuǎn)以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)旋轉(zhuǎn)表示915,且將高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)旋轉(zhuǎn)表示915從球面諧波域轉(zhuǎn)換到空間域以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)去相關(guān)表示。在這些和其它實例中,裝置900可經(jīng)配置以指定將在應(yīng)用逆變換或逆旋轉(zhuǎn)時使用的平滑函數(shù)的指示。在這些和其它實例中,裝置900可進一步經(jīng)配置以將線性可逆變換應(yīng)用于高階立體混響音頻數(shù)據(jù)以獲得V向量,且將所述V向量指定為高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第二層,如上文關(guān)于圖3所描述。在這些和其它實例中,裝置900可進一步經(jīng)配置以獲得與具有階數(shù)一和子階數(shù)零的球基函數(shù)相關(guān)聯(lián)的高階立體混響系數(shù),且將高階立體混響系數(shù)指定為高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第二層。在這些和其它實例中,裝置900可進一步經(jīng)配置以對于高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)去相關(guān)表示執(zhí)行時間編碼。圖31是說明可經(jīng)配置以根據(jù)本發(fā)明中描述的技術(shù)的各種方面而操作的音頻解碼器920的框圖。在重構(gòu)HOA系數(shù)、重構(gòu)增強層的V向量、執(zhí)行時間音頻解碼(如由時間音頻解碼單元922執(zhí)行)等方面,解碼器920可表示圖2的實例中所示的音頻解碼裝置24的另一實例。然而,解碼器920不同,不同之處在于解碼器920如位流中所指定而對于可縮放經(jīng)譯碼高階立體混響音頻數(shù)據(jù)進行操作。如圖31的實例中所示,音頻解碼器920包含時間解碼單元922、逆2D空間變換單元924、基礎(chǔ)層渲染單元928和增強層處理單元930。時間解碼單元922可經(jīng)配置而以與時間編碼單元906的操作反向的方式進行操作。逆2D空間變換單元924可表示經(jīng)配置而以與2D空間變換單元914的操作反向的方式進行操作的單元。換句話說,逆2D空間變換單元924可經(jīng)配置以將以下矩陣應(yīng)用于空間音頻信號905以獲得經(jīng)旋轉(zhuǎn)水平環(huán)境HOA系數(shù)915(其也可被稱作“經(jīng)旋轉(zhuǎn)基礎(chǔ)層915”)。逆2D空間變換單元924可使用以下變換矩陣將3個所發(fā)射音頻信號905向后變換為HOA域,所述變換矩陣類似于以上矩陣,采用HOA系數(shù)階數(shù)“00+”、“11-”、“11+”和N3D正規(guī)化:前述矩陣為解碼器中使用的變換矩陣的倒置。逆2D旋轉(zhuǎn)單元926可經(jīng)配置而以與上文關(guān)于2D旋轉(zhuǎn)單元912所描述的操作反向的方式進行操作。就此而言,2D旋轉(zhuǎn)單元912可基于逆旋轉(zhuǎn)角參數(shù)913而非旋轉(zhuǎn)角參數(shù)911根據(jù)上文提到的旋轉(zhuǎn)矩陣執(zhí)行旋轉(zhuǎn)。換句話說,逆旋轉(zhuǎn)單元926可基于用信號表示的旋轉(zhuǎn)φ而應(yīng)用以下矩陣,所述矩陣再次采用HOA系數(shù)階數(shù)“00+”、“11-”、“11+”和N3D正規(guī)化:逆2D旋轉(zhuǎn)單元926可使用與解碼器中使用的相同的平滑(內(nèi)插)函數(shù)來確保時變旋轉(zhuǎn)角的平滑轉(zhuǎn)變,其可用信號表示于位流中或先驗地配置。基礎(chǔ)層渲染單元928可表示經(jīng)配置以將基礎(chǔ)層的僅水平環(huán)境HOA系數(shù)渲染到擴音器饋給的單元。增強層處理單元930可表示經(jīng)配置以利用任何所接收增強層(經(jīng)由涉及上文關(guān)于額外環(huán)境HOA系數(shù)和V向量連同對應(yīng)于V向量的音頻對象所描述的單獨增強層解碼路徑解碼)對基礎(chǔ)層執(zhí)行進一步處理以渲染揚聲器饋給的單元。增強層處理單元930可有效地擴增基礎(chǔ)層以提供聲場的較高分辨率表示,其可提供使聲音潛在地在聲場內(nèi)實際移動的更具沉浸性的音頻體驗?;A(chǔ)層可類似于上文關(guān)于圖11到13B所描述的第一層、基礎(chǔ)層或基礎(chǔ)子層中的任一者。增強層可類似于上文關(guān)于圖11到13B所描述的第二層、增強層或增強子層中的任一者。就此而言,所述技術(shù)提供經(jīng)配置以執(zhí)行可縮放高階立體混響音頻數(shù)據(jù)解碼的裝置920。所述裝置可經(jīng)配置以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)去相關(guān)表示(例如,空間音頻信號905),所述高階立體混響音頻數(shù)據(jù)描述聲場。第一層的經(jīng)去相關(guān)表示通過對于高階立體混響音頻數(shù)據(jù)的第一層執(zhí)行去相關(guān)而去相關(guān)。在一些情況下,高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層包括對應(yīng)于具有等于或小于一的階數(shù)的一個或多個球基函數(shù)的環(huán)境高階立體混響系數(shù)。在這些和其它實例中,高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層包括僅對應(yīng)于描述聲場的水平方面的球基函數(shù)的環(huán)境高階立體混響系數(shù)。在這些和其它實例中,僅對應(yīng)于描述聲場的水平方面的球基函數(shù)的環(huán)境高階立體混響系數(shù)包括對應(yīng)于具有階數(shù)零和子階數(shù)零的球基函數(shù)的第一環(huán)境高階立體混響系數(shù)、對應(yīng)于具有階數(shù)一和子階數(shù)負一的球基函數(shù)的第二高階立體混響系數(shù),以及對應(yīng)于具有階數(shù)一和子階數(shù)一的球基函數(shù)的第三高階立體混響系數(shù)。在這些和其它實例中,第一層的經(jīng)去相關(guān)表示通過對于高階立體混響音頻數(shù)據(jù)的第一層執(zhí)行變換而去相關(guān),如上文關(guān)于編碼器900所描述。在這些和其它實例中,裝置920可經(jīng)配置以對于高階立體混響音頻數(shù)據(jù)的第一層執(zhí)行旋轉(zhuǎn)(例如,通過逆2D旋轉(zhuǎn)單元926)。在這些和其它實例中,裝置920可經(jīng)配置以使高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)去相關(guān)表示重新相關(guān),以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層,如上文例如關(guān)于逆2D空間變換單元924和逆2D旋轉(zhuǎn)單元926所描述。在這些和其它實例中,裝置920可經(jīng)配置以將高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)去相關(guān)表示905從空間域轉(zhuǎn)換到球面諧波域以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)變換表示915,且對于高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)變換表示915應(yīng)用逆變換(例如,如上文關(guān)于逆2D旋轉(zhuǎn)單元926所描述)以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層。在這些和其它實例中,裝置920可經(jīng)配置以將高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)去相關(guān)表示905從空間域轉(zhuǎn)換到球面諧波域以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)變換表示915,且對于高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)變換表示915應(yīng)用逆旋轉(zhuǎn)以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層。在這些和其它實例中,裝置920可經(jīng)配置以將高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)去相關(guān)表示905從空間域轉(zhuǎn)換到球面諧波域以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)變換表示915,獲得變換信息913,且基于變換信息913對于高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)變換表示915應(yīng)用逆變換以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層。在這些和其它實例中,裝置920可經(jīng)配置以將高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)去相關(guān)表示905從空間域轉(zhuǎn)換到球面諧波域以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)變換表示915,獲得旋轉(zhuǎn)信息913,且基于旋轉(zhuǎn)信息913對于高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)變換表示915應(yīng)用逆旋轉(zhuǎn)以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層。在這些和其它實例中,裝置920可經(jīng)配置以將高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)去相關(guān)表示905從空間域轉(zhuǎn)換到球面諧波域以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)變換表示915,且至少部分地使用平滑函數(shù)對于高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)變換表示915應(yīng)用逆變換以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層。在這些和其它實例中,裝置920可經(jīng)配置以將高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)去相關(guān)表示905從空間域轉(zhuǎn)換到球面諧波域以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)變換表示915,且至少部分地使用平滑函數(shù)對于高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層的經(jīng)變換表示915應(yīng)用逆旋轉(zhuǎn)以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第一層。在這些和其它實例中,裝置920可進一步經(jīng)配置以獲得將在應(yīng)用逆變換或逆旋轉(zhuǎn)時使用的平滑函數(shù)的指示。在這些和其它實例中,裝置920可進一步經(jīng)配置以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第二層的表示,其中第二層的所述表示包括基于向量的占優(yōu)勢音頻數(shù)據(jù),基于向量的音頻數(shù)據(jù)至少包括占優(yōu)勢音頻數(shù)據(jù)和經(jīng)編碼V向量,且經(jīng)編碼V向量是經(jīng)由應(yīng)用線性可逆變換而從高階立體混響音頻數(shù)據(jù)分解而來,如上文關(guān)于圖3的實例所描述。在這些和其它實例中,裝置920可進一步經(jīng)配置以獲得高階立體混響音頻數(shù)據(jù)的兩個或更多個層中的第二層的表示,其中第二層的所述表示包括與具有階數(shù)一和子階數(shù)零的球基函數(shù)相關(guān)聯(lián)的高階立體混響系數(shù)。以此方式,所述技術(shù)可使得裝置能夠經(jīng)配置以執(zhí)行以下條項中所闡述的方法,或提供包括用于執(zhí)行以下條項中所闡述的方法的裝置的設(shè)備或其上存儲的指令在執(zhí)行時致使一個或多個處理器執(zhí)行以下條項中所闡述的方法的非暫時性計算機可讀媒體。條項1A。一種對高階立體混響音頻信號進行編碼以產(chǎn)生位流的方法,所述方法包括在所述位流中指定層的數(shù)目的指示,以及輸出包含所述層的所述所指示數(shù)目的所述位流。條項2A。根據(jù)條項1A所述的方法,其進一步包括指定包含于所述位流中的聲道的數(shù)目的指示。條項3A。根據(jù)條項1A所述的方法,其中層的所述數(shù)目的所述指示包括所述位流中用于前一幀的層數(shù)目的指示,且其中所述方法進一步包括在所述位流中指定所述位流的層的數(shù)目當與所述位流的用于所述前一幀的層的所述數(shù)目相比時是否已改變的指示,以及指定所述位流在所述當前幀中的層的所述所指示數(shù)目。條項4A。根據(jù)條項3A所述的裝置,其中指定層的所述所指示數(shù)目包括,在所述指示指示所述位流的層的所述數(shù)目當與所述位流在所述前一幀中的層的所述數(shù)目相比時在所述當前幀中尚未改變時,指定層的所述所指示數(shù)目而不在所述位流中指定所述當前幀的所述層中的一者或多者中的背景分量的當前數(shù)目等于所述前一幀的所述層中的一者或多者中的背景分量的先前數(shù)目的指示。條項5A。根據(jù)條項1A所述的方法,其中所述層為階層式的,使得第一層在與第二層組合時提供所述高階立體混響音頻信號的較高分辨率表示。條項6A。根據(jù)條項1A所述的方法,其中所述位流的所述層包括基礎(chǔ)層和增強層,且其中所述方法進一步包括對于所述基礎(chǔ)層的一個或多個聲道應(yīng)用去相關(guān)變換以獲得所述高階立體混響音頻信號的背景分量的經(jīng)去相關(guān)表示。條項7A。根據(jù)條項6A所述的方法,其中所述去相關(guān)變換包括UHJ變換。條項8A。根據(jù)條項6A所述的方法,其中所述去相關(guān)變換包括模式矩陣變換。此外,所述技術(shù)可使得裝置能夠經(jīng)配置以執(zhí)行以下條項中所闡述的方法,或提供包括用于執(zhí)行以下條項中所闡述的方法的裝置的設(shè)備或其上存儲的指令在執(zhí)行時致使一個或多個處理器執(zhí)行以下條項中所闡述的方法的非暫時性計算機可讀媒體。條項1B。一種對高階立體混響音頻信號進行編碼以產(chǎn)生位流的方法,所述方法包括:在所述位流中指定在所述位流的一個或多個層中指定的聲道的數(shù)目的指示;以及在所述位流的所述一個或多個層中指定所述聲道的所述所指示數(shù)目。條項2B。根據(jù)條項1B所述的方法,其進一步包括指定在所述位流中指定的聲道的總數(shù)目的指示,其中指定聲道的所述所指示數(shù)目包括在所述位流的所述一個或多個層中指定所述聲道的所述所指示總數(shù)目。條項3B。根據(jù)條項1B所述的方法,其進一步包括指定在所述位流中的所述一個或多個層中指定的所述聲道中的一者的類型的指示,且指定聲道的所述所指示數(shù)目包括在所述位流的所述一個或多個層中指定所述聲道中的所述一者的所述所指示類型的所指示數(shù)目。條項4B。根據(jù)條項1B所述的方法,其進一步包括指定在所述位流中的所述一個或多個層指定的所述聲道中的一者的類型的指示,所述聲道中的所述一者的所述類型的所述指示指示所述聲道中的所述一者為前景聲道,且其中指定聲道的所述所指示數(shù)目包括在所述位流的所述一個或多個層中指定所述前景聲道。條項5B。根據(jù)條項1B所述的方法,其進一步包括在所述位流中指定在所述位流中指定的層的數(shù)目的指示。條項6B。根據(jù)條項1B所述的方法,其進一步包括指定在所述位流中的所述一個或多個層中指定的所述聲道中的一者的類型的指示,所述聲道中的所述一者的所述類型的所述指示指示所述聲道中的所述一者為背景聲道,其中指定所述聲道的所述所指示數(shù)目包括在所述位流的所述一個或多個層中指定所述背景聲道。條項7B。根據(jù)條項6B所述的方法,其中所述聲道中的所述一者包括背景高階立體混響系數(shù)。條項1B。根據(jù)條項1B所述的方法,其中指定聲道的所述數(shù)目的所述指示包括基于在指定所述層中的一者之后在所述位流中剩余的聲道的數(shù)目指定聲道的所述數(shù)目的所述指示。以此方式,所述技術(shù)可使得裝置能夠經(jīng)配置以執(zhí)行以下條項中所闡述的方法,或提供包括用于執(zhí)行以下條項中所闡述的方法的裝置的設(shè)備或其上存儲的指令在執(zhí)行時致使一個或多個處理器執(zhí)行以下條項中所闡述的方法的非暫時性計算機可讀媒體。條項1C。一種對表示高階立體混響音頻信號的位流進行解碼的方法,所述方法包括:從所述位流獲得在所述位流中指定的層的數(shù)目的指示,且基于層的所述數(shù)目的所述指示而獲得所述位流的所述層。條項2C。根據(jù)條項1C所述的方法,其進一步包括獲得在所述位流中指定的聲道的總數(shù)目的指示,且其中獲得所述層包括基于層的所述數(shù)目的所述指示和聲道的所述數(shù)目的所述指示獲得所述位流的所述層。條項3C。根據(jù)條項1C所述的方法,其進一步包括獲得所述位流中針對所述層中的至少一個指定的前景聲道的數(shù)目的指示,且其中獲得所述層包括基于前景聲道的所述數(shù)目的所述指示獲得所述位流的所述層中的所述至少一個的所述前景聲道。條項4C。根據(jù)條項1C所述的方法,其進一步包括獲得所述位流中針對所述層中的至少一者指定的背景聲道的數(shù)目的指示,且其中獲得所述層包括基于背景聲道的所述數(shù)目的所述指示獲得所述位流的所述層中的所述至少一者的所述背景聲道。條項5C。根據(jù)條項1C所述的方法,其中所述層的所述數(shù)目的所述指示指示層的所述數(shù)目為二,其中所述兩個層包括基礎(chǔ)層和增強層,且其中獲得所述層包括獲得前景聲道的數(shù)目對于所述基礎(chǔ)層為零且對于所述增強層為二的指示。條項6C。根據(jù)條項1C或5C所述的方法,其中所述層的所述數(shù)目的所述指示指示層的所述數(shù)目為二,其中所述兩個層包括基礎(chǔ)層和增強層,且其中所述方法進一步包括獲得背景聲道的數(shù)目對于所述基礎(chǔ)層為四且對于所述增強層為零的指示。條項7。根據(jù)條項1C所述的方法,其中所述層的所述數(shù)目的所述指示指示層的所述數(shù)目為三,其中所述三個層包括基礎(chǔ)層、第一增強層和第二增強層,且其中所述方法進一步包括獲得前景聲道的數(shù)目對于所述基礎(chǔ)層為零、對于所述第一增強層為二且對于所述第三增強層為二的指示。條項8C。根據(jù)條項1C或7C所述的方法,其中所述層的所述數(shù)目的所述指示指示層的所述數(shù)目為三,其中所述三個層包括基礎(chǔ)層、第一增強層和第二增強層,且其中所述方法進一步包括獲得背景聲道的數(shù)目對于所述基礎(chǔ)層為二、對于所述第一增強層為零且對于所述第三增強層為零的指示。條項9C。根據(jù)條項1C所述的方法,其中所述層的所述數(shù)目的所述指示指示層的所述數(shù)目為三,其中所述三個層包括基礎(chǔ)層、第一增強層和第二增強層,且其中所述方法進一步包括獲得前景聲道的數(shù)目對于所述基礎(chǔ)層為零、對于所述第一增強層為二且對于第三增強層為二的指示。條項10C。根據(jù)條項1C或9C所述的方法,其中所述層的所述數(shù)目的所述指示指示層的所述數(shù)目為三,其中所述三個層包括基礎(chǔ)層、第一增強層和第二增強層,且其中所述方法進一步包括獲得指示背景聲道的數(shù)目對于所述基礎(chǔ)層為零、對于所述第一增強層為零且對于所述第三增強層為零的背景語法元素。條項11C。根據(jù)條項1C所述的方法,其中層的所述數(shù)目的所述指示包括所述位流在前一幀中的層的數(shù)目的指示,且其中所述方法進一步包括獲得所述位流的層的數(shù)目當與所述位流在所述前一幀中的層的所述數(shù)目相比時在當前幀中是否已改變的指示,以及基于所述位流的層的所述數(shù)目在所述當前幀中是否已改變的所述指示獲得所述位流在所述當前幀中的層的所述數(shù)目。條項12C。根據(jù)條項11C所述的方法,其進一步包括在所述指示指示所述位流的層的所述數(shù)目當與所述位流在所述前一幀中的層的所述數(shù)目相比時在所述當前幀中尚未改變時,確定所述位流在所述當前幀中的層的所述數(shù)目等于所述位流在所述前一幀中的層的所述數(shù)目。條項13C。根據(jù)條項11C所述的方法,其中方法進一步包括,在所述指示指示所述位流的層的所述數(shù)目當與所述位流在所述前一幀中的層的所述數(shù)目相比時在所述當前幀中尚未改變時,獲得所述當前幀的所述層中的一者或多者的分量的當前數(shù)目等于所述前一幀的所述層中的一個或多個中的分量的先前數(shù)目的指示。條項14C。根據(jù)條項1C所述的方法,其中層的所述數(shù)目的所述指示指示在所述位流中指定了三個層,且其中獲得所述層包括獲得指示所述高階立體混響音頻信號的提供立體聲聲道回放的背景分量的所述位流的所述層中的第一者,獲得指示所述高階立體混響音頻信號的提供由布置在一個或多個水平面上的三個或更多個揚聲器進行三維回放的背景分量的所述位流的所述層中的第二者,且獲得指示所述高階立體混響音頻信號的前景分量的所述位流的所述層中的第三者。條項15C。根據(jù)條項1C所述的方法,其中層的所述數(shù)目的所述指示指示在所述位流中指定了三個層,且其中獲得所述層包括獲得指示所述高階立體混響音頻信號的提供單聲道回放的背景分量的所述位流的所述層中的第一者,獲得指示所述高階立體混響音頻信號的提供由布置在一個或多個水平面上的三個或更多個揚聲器進行三維回放的背景分量的所述位流的所述層中的第二者,且獲得指示所述高階立體混響音頻信號的前景分量的所述位流的所述層中的第三者。條項16C。根據(jù)條項1C所述的方法,其中層的所述數(shù)目的所述指示指示在所述位流中指定了三個層,且其中獲得所述層包括獲得指示所述高階立體混響音頻信號的提供立體聲聲道回放的背景分量的所述位流的所述層中的第一者,獲得指示所述高階立體混響音頻信號的提供由布置在單個水平面上的三個或更多個揚聲器進行多聲道回放的背景分量的所述位流的所述層中的第二者,獲得指示所述高階立體混響音頻信號的提供由布置在兩個或更多個水平面上的三個或更多個揚聲器進行三維回放的背景分量的所述位流的所述層中的第三者,且獲得指示所述高階立體混響音頻信號的前景分量的所述位流的所述層中的第四者。條項17C。根據(jù)條項1C所述的方法,其中層的所述數(shù)目的所述指示指示在所述位流中指定了三個層,且其中獲得所述層包括獲得指示所述高階立體混響音頻信號的提供單聲道回放的背景分量的所述位流的所述層中的第一者,獲得指示所述高階立體混響音頻信號的提供由布置在單個水平面上的三個或更多個揚聲器進行多聲道回放的背景分量的所述位流的所述層中的第二者,且獲得指示所述高階立體混響音頻信號的提供由布置在兩個或更多個水平面上的三個或更多個揚聲器進行三維回放的背景分量的所述位流的所述層中的第三者,且獲得指示所述高階立體混響音頻信號的前景分量的所述位流的所述層中的第四者。條項18C。根據(jù)條項1C所述的方法,其中層的所述數(shù)目的所述指示指示在所述位流中指定了兩個層,且其中獲得所述層包括獲得指示所述高階立體混響音頻信號的提供立體聲聲道回放的背景分量的所述位流的所述層中的第一者,且獲得指示所述高階立體混響音頻信號的提供由布置在單個水平面上的三個或更多個揚聲器進行水平多聲道回放的背景分量的所述位流的所述層中的第二者。條項19C。根據(jù)條項1C所述的方法,其進一步包括獲得在所述位流中指定的聲道的總數(shù)目的指示,其中獲得所述層包括基于層的所述數(shù)目的所述指示和聲道的所述數(shù)目的所述指示獲得所述位流的所述層。條項20C。根據(jù)條項1C所述的方法,其進一步包括獲得所述位流中針對所述層中的至少一個指定的前景聲道的數(shù)目的指示,其中獲得所述層包括基于前景聲道的所述數(shù)目的所述指示獲得所述位流的所述層中的所述至少一個的所述前景聲道。條項21C。根據(jù)條項1C所述的方法,其進一步包括獲得所述位流中針對所述層中的至少一者指定的背景聲道的數(shù)目的指示,其中獲得所述層包括基于背景聲道的所述數(shù)目的所述指示獲得所述位流的所述層中的所述至少一者的所述背景聲道。條項22C。根據(jù)條項1C所述的方法,其進一步包括基于在獲得所述層中的至少一者之后在所述位流中剩余的聲道的數(shù)目剖析所述位流中針對所述層中的所述至少一者指定的前景聲道的數(shù)目的指示,其中獲得所述層包括基于前景聲道的所述數(shù)目的所述指示獲得所述層中的所述至少一者的所述前景聲道。條項23C。根據(jù)條項22C所述的方法,其中在獲得所述層中的所述至少一者之后在所述位流中剩余的聲道的所述數(shù)目由語法元素表示。條項24C。根據(jù)條項1C所述的方法,其進一步包括基于在獲得所述層中的至少一者之后的聲道的數(shù)目剖析所述位流中針對所述層中的所述至少一者指定的背景聲道的數(shù)目的指示,其中獲得所述背景聲道包括基于背景聲道的所述數(shù)目的所述指示獲得所述層中的所述至少一者的所述背景聲道。條項25C。根據(jù)條項24C所述的方法,其中在獲得所述層中的所述至少一者之后在所述位流中剩余的聲道的所述數(shù)目由語法元素表示。條項26C。根據(jù)條項1C所述的方法,其中所述位流的所述層包括基礎(chǔ)層和增強層,且其中所述方法進一步包括對于所述基礎(chǔ)層的一個或多個聲道應(yīng)用相關(guān)變換以獲得所述高階立體混響音頻信號的背景分量的相關(guān)表示。條項27C。根據(jù)條項26C所述的方法,其中所述相關(guān)變換包括逆UHJ變換。條項28C。根據(jù)條項26C所述的方法,其中所述相關(guān)變換包括逆模式矩陣變換。條項29C。根據(jù)條項1C所述的方法,其中所述位流的所述層中的每一者的聲道的數(shù)目是固定的。此外,所述技術(shù)可使得裝置能夠經(jīng)配置以執(zhí)行以下條項中所闡述的方法,或提供包括用于執(zhí)行以下條項中所闡述的方法的裝置的設(shè)備或其上存儲的指令在執(zhí)行時致使一個或多個處理器執(zhí)行以下條項中所闡述的方法的非暫時性計算機可讀媒體。條項1D。一種對表示高階立體混響音頻信號的位流進行解碼的方法,所述方法包括:從所述位流獲得在所述位流中的一個或多個層中指定的信道的數(shù)目的指示;以及基于信道的所述數(shù)目的所述指示而獲得在所述位流中的所述一個或多個層中指定的所述信道。條項2D。根據(jù)條項1D所述的方法,其進一步包括獲得在所述位流中指定的聲道的總數(shù)目的指示,且其中獲得所述聲道包括基于在所述一個或多個層中指定的聲道的所述數(shù)目的所述指示和聲道的所述總數(shù)目的所述指示獲得所述一個或多個層中指定的所述聲道。條項3D。根據(jù)條項1D所述的方法,其進一步包括獲得在所述位流中的所述一個或多個層中指定的所述聲道中的一者的類型的指示,且其中獲得所述聲道包括基于聲道的所述數(shù)目的所述指示和所述聲道中的所述一者的所述類型的所述指示獲得所述聲道中的所述一者。條項4D。根據(jù)條項1D所述的方法,其進一步包括獲得在所述位流中的所述一個或多個層中指定的所述聲道中的一者的類型的指示,所述聲道中的所述一者的所述類型的所述指示指示所述聲道中的所述一者為前景聲道,且其中獲得所述聲道包括基于聲道的所述數(shù)目的所述指示和所述聲道中的所述一者的所述類型為所述前景聲道的所述指示獲得所述聲道中的所述一者。條項5D。根據(jù)條項1D所述的方法,其進一步包括獲得在所述位流中指定的層的數(shù)目的指示,且其中獲得所述聲道包括基于聲道的所述數(shù)目的所述指示和層的所述數(shù)目的所述指示獲得所述聲道中的所述一者。條項6D。根據(jù)條項5D所述的方法,其中層的所述數(shù)目的所述指示包括所述位流在前一幀中的層的數(shù)目的指示,其中所述方法進一步包括獲得在所述位流中的一個或多個層中指定的聲道的所述數(shù)目當與所述位流中的一個或多個層中在所述前一幀中指定的聲道的數(shù)目相比時在當前幀中是否已改變的指示,且其中獲得所述聲道包括基于在所述位流中的一個或多個層中指定的聲道的所述數(shù)目在所述當前幀中是否已改變的所述指示獲得所述聲道中的所述一者。條項7D。根據(jù)條項5D所述的方法,其進一步包括在所述指示指示在所述位流的所述一個或多個層中指定的聲道的所述數(shù)目當與所述位流的所述一個或多個層中在所述前一幀中指定的聲道的所述數(shù)目相比時在所述當前幀中尚未改變時,確定所述位流的所述一個或多個層中在所述當前幀中指定的聲道的所述數(shù)目與所述位流的所述一個或多個層中在所述前一幀中指定的聲道的所述數(shù)目相同。條項8D。根據(jù)條項5D所述的方法,其中所述一個或多個處理器進一步經(jīng)配置以在所述指示指示在所述位流的所述一個或多個層中指定的聲道的所述數(shù)目當與所述位流的所述一個或多個層中在所述前一幀中指定的聲道的所述數(shù)目相比時在所述當前幀中尚未改變時,獲得所述層中的一者或多者在所述當前幀的聲道的當前數(shù)目與所述層中的一者或多者在前一幀的聲道的先前數(shù)目相同的指示。條項9D。根據(jù)條項1D所述的方法,其進一步包括獲得在所述位流中的所述一個或多個層中指定的所述聲道中的一者的類型的指示,所述聲道中的所述一者的所述類型的所述指示指示所述聲道中的所述一者為背景聲道,且其中獲得所述聲道包括基于層的所述數(shù)目的所述指示和所述聲道中的所述一者的所述類型為所述背景聲道的所述指示獲得所述聲道中的所述一者。條項10D。根據(jù)條項9D所述的方法,其進一步包括獲得在所述位流中的所述一個或多個層中指定的所述聲道中的一者的類型的指示,所述聲道中的所述一者的所述類型的所述指示指示所述聲道中的所述一者為背景聲道,且其中獲得所述聲道包括基于層的所述數(shù)目的所述指示和所述聲道中的所述一者的所述類型為所述背景聲道的所述指示獲得所述聲道中的所述一者。條項11D。根據(jù)條項9D所述的方法,其中所述聲道中的所述一者包括背景高階立體混響系數(shù)。條項12D。根據(jù)條項9D所述的方法,其中獲得所述聲道中的所述一者的所述類型的所述指示包括獲得指示所述聲道中的所述一者的所述類型的語法元素。條項13D。根據(jù)條項1D所述的方法,其中獲得聲道的所述數(shù)目的所述指示包括基于在獲得所述層中的一者之后在所述位流中剩余的聲道的數(shù)目獲得聲道的所述數(shù)目的所述指示。條項14D。根據(jù)條項1D所述的方法,其中所述層包括基礎(chǔ)層。條項15D。根據(jù)條項1D所述的方法,其中所述層包括基礎(chǔ)層和一個或多個增強層。條項16D。根據(jù)條項1D所述的方法,其中所述一個或多個層的數(shù)目是固定的。前述技術(shù)可對于任何數(shù)目的不同上下文和音頻生態(tài)系統(tǒng)來執(zhí)行。下文描述多個實例上下文,但所述技術(shù)應(yīng)限于實例上下文。一個實例音頻生態(tài)系統(tǒng)可包含音頻內(nèi)容、電影工作室、音樂工作室、游戲音頻工作室、基于聲道的音頻內(nèi)容、譯碼引擎、游戲音頻原聲、游戲音頻編碼/渲染引擎和遞送系統(tǒng)。電影工作室、音樂工作室和游戲音頻工作室可接收音頻內(nèi)容。在一些實例中,音頻內(nèi)容可表示獲取的輸出。電影工作室可例如通過使用數(shù)字音頻工作站(DAW)輸出基于聲道的音頻內(nèi)容(例如,呈2.0、5.1和7.1)。音樂工作室可例如通過使用DAW輸出基于聲道的音頻內(nèi)容(例如,呈2.0和5.1)。在任一情況下,譯碼引擎可基于一個或多個編解碼器(例如,AAC、AC3、杜比真HD、杜比數(shù)字加和DTS主音頻)接收并編碼基于聲道的音頻內(nèi)容以供傳遞系統(tǒng)輸出。游戲音頻工作室可例如通過使用DAW輸出一個或多個游戲音頻原聲。游戲音頻譯碼/渲染引擎可譯碼音頻原聲和/或?qū)⒁纛l原聲渲染到基于聲道的音頻內(nèi)容中以供遞送系統(tǒng)輸出??蓤?zhí)行所述技術(shù)的另一實例情形包括音頻生態(tài)系統(tǒng),其可包含廣播記錄音頻對象、專業(yè)音頻系統(tǒng)、消費型裝置上俘獲、HOA音頻格式、裝置上渲染、消費型音頻、TV和配件以及汽車音頻系統(tǒng)。廣播記錄音頻對象、專業(yè)音頻系統(tǒng)和消費型裝置上俘獲都可使用HOA音頻格式對其輸出進行譯碼。以此方式,可使用HOA音頻格式將音頻內(nèi)容譯碼成單一表示,可使用裝置上渲染、消費型音頻、TV和配件以及汽車音頻系統(tǒng)來回放所述單一表示。換句話說,可在通用音頻播放系統(tǒng)(即,與需要例如5.1、7.1等的特定配置相比)(例如,音頻播放系統(tǒng)16)處播放音頻內(nèi)容的單一表示??蓤?zhí)行所述技術(shù)的上下文的其它實例包含可包含獲取元件和回放元件的音頻生態(tài)系統(tǒng)。獲取元件可包含有線和/或無線獲取裝置(例如,本征麥克風)、裝置上環(huán)繞聲俘獲和移動裝置(例如,智能電話和平板計算機)。在一些實例中,有線和/或無線獲取裝置可經(jīng)由有線及/或無線通信聲道耦合到移動裝置。根據(jù)本發(fā)明的一個或多個技術(shù),所述移動裝置可用于獲取聲場。舉例來說,移動裝置可經(jīng)由有線和/或無線獲取裝置和/或裝置上環(huán)繞聲俘獲(例如,集成到移動裝置中的多個麥克風)獲取聲場。移動裝置可接著將所獲取的聲場譯碼成HOA系數(shù)以用于由回放元件中的一者或多者回放。舉例來說,移動裝置的用戶可記錄實況事件(例如,集會、會議、比賽、音樂會等)(獲取實況事件的聲場),且將記錄譯碼成HOA系數(shù)。移動裝置還可利用回放元件中的一者或多者來回放經(jīng)HOA譯碼的聲場。舉例來說,移動裝置可對經(jīng)HOA譯碼的聲場進行解碼,且將致使回放元件中的一者或多者重新產(chǎn)生聲場的信號輸出到回放元件中的一者或多者。作為一個實例,移動裝置可利用無線和/或無線通信聲道將信號輸出到一個或多個揚聲器(例如,揚聲器陣列、聲棒等)。作為另一實例,移動裝置可利用對接解決方案將信號輸出到一個或多個對接站和/或一個或多個對接的揚聲器(例如,智能汽車和/或家庭中的聲音系統(tǒng))。作為另一實例,移動裝置可利用頭戴式耳機渲染將信號輸出到一組頭戴式耳機(例如)以創(chuàng)建真實的雙耳聲音。在一些實例中,特定移動裝置可獲取3D聲場并且在稍后時間回放同一3D聲場。在一些實例中,移動裝置可獲取3D聲場,將3D聲場編碼為HOA,且將經(jīng)編碼的3D聲場發(fā)射到一個或多個其它裝置(例如,其它移動裝置和/或其它非移動裝置)以用于回放。可執(zhí)行所述技術(shù)的又一情形包含音頻生態(tài)系統(tǒng),其可包含音頻內(nèi)容、游戲工作室、經(jīng)譯碼音頻內(nèi)容、渲染引擎和遞送系統(tǒng)。在一些實例中,游戲工作室可包含可支持HOA信號的編輯的一個或多個DAW。舉例來說,所述一個或多個DAW可包含可經(jīng)配置以與一個或多個游戲音頻系統(tǒng)一起操作(例如,工作)的HOA插件和/或工具。在一些實例中,游戲工作室可輸出支持HOA的新原聲格式。在任何情況下,游戲工作室可將經(jīng)譯碼音頻內(nèi)容輸出到渲染引擎,所述渲染引擎可渲染聲場以供遞送系統(tǒng)回放。也可相對于示范性音頻獲取裝置執(zhí)行所述技術(shù)。舉例來說,可相對于可包含共同地經(jīng)配置以記錄3D聲場的多個麥克風的本征麥克風執(zhí)行所述技術(shù)。在一些實例中,本征麥克風的所述多個麥克風可位于具有大約4cm的半徑的實質(zhì)上球面球的表面上。在一些實例中,音頻編碼裝置20可集成到本征麥克風中,以便直接從麥克風輸出位流21。另一示范性音頻獲取情形可包含可經(jīng)配置以從一個或多個麥克風(例如,一個或多個本征麥克風)接收信號的制作車。制作車還可包含音頻編碼器,例如圖3的音頻編碼器20。在一些情況下,移動裝置還可包含共同地經(jīng)配置以記錄3D聲場的多個麥克風。換句話說,所述多個麥克風可具有X、Y、Z分集。在一些實例中,移動裝置可包含可旋轉(zhuǎn)以相對于移動裝置的一個或多個其它麥克風提供X、Y、Z分集的麥克風。移動裝置還可包含音頻編碼器,例如圖3的音頻編碼器20。加固型視頻俘獲裝置可進一步經(jīng)配置以記錄3D聲場。在一些實例中,加固型視頻俘獲裝置可附接到參與活動的用戶的頭盔。舉例來說,加固型視頻俘獲裝置可在用戶泛舟時附接到用戶的頭盔。以此方式,加固型視頻俘獲裝置可俘獲表示用戶環(huán)境的動作(例如,水在用戶身后的撞擊、另一泛舟者在用戶前方說話等)的3D聲場。還可相對于可經(jīng)配置以記錄3D聲場的配件增強型移動裝置執(zhí)行所述技術(shù)。在一些實例中,移動裝置可類似于上文所論述的移動裝置,其中添加了一個或多個配件。舉例來說,本征麥克風可附接到上文所提及的移動裝置以形成配件增強型移動裝置。以此方式,配件增強型移動裝置可俘獲3D聲場的較高質(zhì)量版本,而不是僅使用與附件增強型移動裝置成一體式的聲音俘獲組件。下文進一步論述可執(zhí)行本發(fā)明中所描述的技術(shù)的各種方面的實例音頻回放裝置。根據(jù)本發(fā)明的一或多種技術(shù),揚聲器和/或聲棒在回放3D聲場時可布置于任何任意配置中。此外,在一些實例中,頭戴式耳機回放裝置可經(jīng)由有線或無線連接耦合到解碼器24。根據(jù)本發(fā)明的一或多種技術(shù),可利用聲場的單一通用表示來在揚聲器、聲棒和頭戴式耳機回放裝置的任何組合上渲染聲場。多個不同實例音頻回放環(huán)境還可適合于執(zhí)行本發(fā)明中所描述的技術(shù)的各種方面。舉例來說,以下環(huán)境可為用于執(zhí)行本發(fā)明中描述的技術(shù)的各種方面的合適環(huán)境:5.1揚聲器回放環(huán)境、2.0(例如,立體聲)揚聲器回放環(huán)境、具有全高前擴音器的9.1揚聲器回放環(huán)境、22.2揚聲器回放環(huán)境、16.0揚聲器回放環(huán)境、汽車揚聲器回放環(huán)境,以及具有耳機回放環(huán)境的移動裝置。根據(jù)本發(fā)明的一或多種技術(shù),可利用聲場的單一通用表示來在前述回放環(huán)境中的任一者上渲染聲場。另外,本發(fā)明的技術(shù)使得渲染器能夠從通用表示渲染聲場以供在除上文所描述的環(huán)境之外的回放環(huán)境上回放。舉例來說,如果設(shè)計考慮禁止揚聲器根據(jù)7.1揚聲器回放環(huán)境的恰當置放(例如,如果不可能放置右環(huán)繞揚聲器),那么本發(fā)明的技術(shù)使得渲染器能夠用其它6個揚聲器進行補償,使得可在6.1揚聲器回放環(huán)境上實現(xiàn)回放。此外,用戶可在佩戴頭戴式耳機時觀看體育比賽。根據(jù)本發(fā)明的一或多種技術(shù),可獲取體育比賽的3D聲場(例如,可將一個或多個本征麥克風放置在棒球場中和/或環(huán)境),可獲得對應(yīng)于3D聲場的HOA系數(shù),且將所述HOA系數(shù)發(fā)射到解碼器,所述解碼器可基于HOA系數(shù)重構(gòu)3D聲場且將經(jīng)重構(gòu)3D聲場輸出到渲染器,所述渲染器可獲得關(guān)于回放環(huán)境的類型(例如,頭戴式耳機)的指示,且將經(jīng)重構(gòu)3D聲場渲染為致使頭戴式耳機輸出所述體育比賽的3D聲場的表示的信號。在上述各種實例中的每一者中,應(yīng)理解,音頻編碼裝置20可執(zhí)行一種方法,或另外包括執(zhí)行音頻編碼裝置20經(jīng)配置以執(zhí)行的方法的每一步驟的裝置。在一些情況下,這些裝置可包括一個或多個處理器。在一些情況下,所述一個或多個處理器可表示借助于存儲到非暫時性計算機可讀存儲媒體的指令配置的專用處理器。換句話說,編碼實例的集合中的每一者中的技術(shù)的各種方面可提供其上存儲有指令的非暫時性計算機可讀存儲媒體,所述指令在執(zhí)行時致使所述一個或多個處理器執(zhí)行音頻編碼裝置20已經(jīng)配置以執(zhí)行的方法。在一個或多個實例中,所描述功能可用硬件、軟件、固件或其任何組合來實施。如果以軟件實施,那么所述功能可作為一個或多個指令或代碼在計算機可讀媒體上存儲或傳輸,并且由基于硬件的處理單元來執(zhí)行。計算機可讀媒體可包含計算機可讀存儲媒體,其對應(yīng)于例如數(shù)據(jù)存儲媒體等有形媒體。數(shù)據(jù)存儲媒體可為可由一個或多個計算機或一個或多個處理器存取以檢索用于實施本發(fā)明中描述的技術(shù)的指令、代碼和/或數(shù)據(jù)結(jié)構(gòu)的任何可用媒體。計算機程序產(chǎn)品可包含計算機可讀媒體。同樣地,在上文所述的各種實例中的每一者中,應(yīng)理解,音頻解碼裝置24可執(zhí)行方法或以其它方式包括執(zhí)行所述音頻解碼裝置24經(jīng)配置以執(zhí)行的所述方法的每一步驟的裝置。在一些情況下,所述裝置可包括一個或多個處理器。在一些情況下,所述一個或多個處理器可表示借助于存儲到非暫時性計算機可讀存儲媒體的指令配置的專用處理器。換句話說,編碼實例的集合中的每一者中的技術(shù)的各種方面可提供其上存儲有指令的非暫時性計算機可讀存儲媒體,所述指令在執(zhí)行時致使一個或多個處理器執(zhí)行音頻解碼裝置24已經(jīng)配置以執(zhí)行的方法。作為實例而非限制,此類計算機可讀存儲媒體可包括RAM、ROM、EEPROM、CD-ROM或其它光盤存儲裝置、磁盤存儲裝置或其它磁性存儲裝置、快閃存儲器或可用來存儲指令或數(shù)據(jù)結(jié)構(gòu)的形式的所要程序代碼并且可由計算機存取的任何其它媒體。然而,應(yīng)理解,所述計算機可讀存儲媒體和數(shù)據(jù)存儲媒體并不包含連接、載波、信號或其它暫時性媒體,而是實際上針對非暫時性的有形存儲媒體。如本文中所使用,磁盤和光盤包含壓縮光盤(CD)、激光光盤、光學光盤、數(shù)字多功能光盤(DVD)、軟性磁盤和藍光光盤,其中磁盤通常以磁性方式再現(xiàn)數(shù)據(jù),而光盤利用激光以光學方式再現(xiàn)數(shù)據(jù)。以上各項的組合也應(yīng)包含在計算機可讀媒體的范圍內(nèi)??捎衫缫粋€或多個數(shù)字信號處理器(DSP)、通用微處理器、專用集成電路(ASIC)、現(xiàn)場可編程邏輯陣列(FPGA)或其它等效集成或離散邏輯電路等一個或多個處理器來執(zhí)行指令。因此,如本文中所使用的術(shù)語“處理器”可指前述結(jié)構(gòu)或適合于實施本文中所描述的技術(shù)的任一其它結(jié)構(gòu)中的任一者。另外,在一些方面中,本文中所描述的功能性可在經(jīng)配置以用于編碼和解碼的專用硬件和/或軟件模塊內(nèi)提供,或者并入在組合式編解碼器中。而且,所述技術(shù)可完全實施于一個或多個電路或邏輯元件中。本發(fā)明的技術(shù)可在廣泛多種裝置或設(shè)備中實施,包含無線手持機、集成電路(IC)或一組IC(例如,芯片組)。本發(fā)明中描述各種組件、模塊或單元是為了強調(diào)經(jīng)配置以執(zhí)行所公開的技術(shù)的裝置的功能方面,但未必需要由不同硬件單元實現(xiàn)。實際上,如上文所描述,各種單元可結(jié)合合適的軟件和/或固件組合在編碼解碼器硬件單元中,或者通過互操作硬件單元的集合來提供,所述硬件單元包含如上文所描述的一個或多個處理器。已經(jīng)描述了所述技術(shù)的各種方面。所述技術(shù)的這些和其它方面在所附權(quán)利要求書的范圍內(nèi)。當前第1頁1 2 3