第62/020,348號(hào)美國(guó)臨時(shí)專利申請(qǐng)案,其標(biāo)題為“減少HOA背景信道之間的相關(guān)性(REDUCINGCORRELATIONBETWEENHOABACKGROUNDCHANNELS)”,在2014年7月2日申請(qǐng);和第62/060,512號(hào)美國(guó)臨時(shí)專利申請(qǐng)案,其標(biāo)題為“減少HOA背景信道之間的相關(guān)性(REDUCINGCORRELATIONBETWEENHOABACKGROUNDCHANNELS)”,在2014年10月6日申請(qǐng),其中的每一者的全部?jī)?nèi)容以引用的方式并入本文中。
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻數(shù)據(jù),且更確切地說,涉及高階立體混響音頻數(shù)據(jù)的譯碼。
背景技術(shù):
:高階立體混響(HOA)信號(hào)(通常由多個(gè)球面諧波系數(shù)(SHC)或其它分層元素表示)是聲場(chǎng)的三維表示。HOA或SHC表示可以獨(dú)立于用以回放從SHC信號(hào)再現(xiàn)的多信道音頻信號(hào)的局部揚(yáng)聲器幾何布置的方式來表示聲場(chǎng)。SHC信號(hào)還可促進(jìn)向后兼容性,因?yàn)榭蓪HC信號(hào)再現(xiàn)為眾所周知的且被廣泛采用的多信道格式(例如,5.1音頻信道格式或7.1音頻信道格式)。SHC表示因此可實(shí)現(xiàn)對(duì)聲場(chǎng)的更好表示,其也適應(yīng)向后兼容性。技術(shù)實(shí)現(xiàn)要素:一般來說,描述用于對(duì)高階立體混響音頻數(shù)據(jù)進(jìn)行譯碼的技術(shù)。高階立體混響音頻數(shù)據(jù)可包括對(duì)應(yīng)于具有大于一的階數(shù)的球面諧波基底函數(shù)的至少一個(gè)高階立體混響(HOA)系數(shù)。描述用于減少高階立體混響(HOA)背景信道之間的相關(guān)性的技術(shù)。在一個(gè)方面,一種方法包含:獲得具有至少一左信號(hào)和一右信號(hào)的環(huán)境立體混響系數(shù)的經(jīng)去相關(guān)表示,所述環(huán)境立體混響系數(shù)已從多個(gè)高階立體混響系數(shù)提取并且表示由所述多個(gè)高階立體混響系數(shù)描述的聲場(chǎng)的背景分量,其中所述多個(gè)高階立體混響系數(shù)中的至少一者與具有大于一的階數(shù)的球形基底函數(shù)相關(guān)聯(lián);和基于所述環(huán)境立體混響系數(shù)的所述經(jīng)去相關(guān)表示而產(chǎn)生揚(yáng)聲器饋送。在另一方面,一種方法包含:將去相關(guān)變換應(yīng)用于環(huán)境立體混響系數(shù)以獲得所述環(huán)境立體混響系數(shù)的經(jīng)去相關(guān)表示,所述環(huán)境HOA系數(shù)已從多個(gè)高階立體混響系數(shù)提取并且表示由所述多個(gè)高階立體混響系數(shù)描述的聲場(chǎng)的背景分量,其中所述多個(gè)高階立體混響系數(shù)中的至少一者與具有大于一的階數(shù)的球形基底函數(shù)相關(guān)聯(lián)。在另一方面,一種用于壓縮音頻數(shù)據(jù)的裝置包含一或多個(gè)處理器,其經(jīng)配置以:獲得具有至少一左信號(hào)和一右信號(hào)的環(huán)境立體混響系數(shù)的經(jīng)去相關(guān)表示,所述環(huán)境立體混響系數(shù)已從多個(gè)高階立體混響系數(shù)提取并且表示由所述多個(gè)高階立體混響系數(shù)描述的聲場(chǎng)的背景分量,其中所述多個(gè)高階立體混響系數(shù)中的至少一者與具有大于一的階數(shù)的球形基底函數(shù)相關(guān)聯(lián);和基于所述環(huán)境立體混響系數(shù)的所述經(jīng)去相關(guān)表示而產(chǎn)生揚(yáng)聲器饋送。在另一方面,一種用于壓縮音頻數(shù)據(jù)的裝置包含一或多個(gè)處理器,其經(jīng)配置以:將去相關(guān)變換應(yīng)用于環(huán)境立體混響系數(shù)以獲得所述環(huán)境立體混響系數(shù)的經(jīng)去相關(guān)表示,所述環(huán)境HOA系數(shù)已從多個(gè)高階立體混響系數(shù)提取并且表示由所述多個(gè)高階立體混響系數(shù)描述的聲場(chǎng)的背景分量,其中所述多個(gè)高階立體混響系數(shù)中的至少一者與具有大于一的階數(shù)的球形基底函數(shù)相關(guān)聯(lián)。在另一方面,一種用于壓縮音頻數(shù)據(jù)的裝置包含:用于獲得具有至少一左信號(hào)和一右信號(hào)的環(huán)境立體混響系數(shù)的經(jīng)去相關(guān)表示的裝置,所述環(huán)境立體混響系數(shù)已從多個(gè)高階立體混響系數(shù)提取并且表示由所述多個(gè)高階立體混響系數(shù)描述的聲場(chǎng)的背景分量,其中所述多個(gè)高階立體混響系數(shù)中的至少一者與具有大于一的階數(shù)的球形基底函數(shù)相關(guān)聯(lián);和用于基于所述環(huán)境立體混響系數(shù)的所述經(jīng)去相關(guān)表示而產(chǎn)生揚(yáng)聲器饋送的裝置。在另一方面,一種用于壓縮音頻數(shù)據(jù)的裝置包含:用于將去相關(guān)變換應(yīng)用于環(huán)境立體混響系數(shù)以獲得所述環(huán)境立體混響系數(shù)的經(jīng)去相關(guān)表示的裝置,所述環(huán)境HOA系數(shù)已從多個(gè)高階立體混響系數(shù)提取并且表示由所述多個(gè)高階立體混響系數(shù)描述的聲場(chǎng)的背景分量,其中所述多個(gè)高階立體混響系數(shù)中的至少一者與具有大于一的階數(shù)的球形基底函數(shù)相關(guān)聯(lián);和用于存儲(chǔ)所述環(huán)境立體混響系數(shù)的所述經(jīng)去相關(guān)表示的裝置。在另一方面,用指令對(duì)計(jì)算機(jī)可讀存儲(chǔ)媒體進(jìn)行編碼,所述指令在執(zhí)行時(shí)致使音頻壓縮裝置的一或多個(gè)處理器:獲得具有至少一左信號(hào)和一右信號(hào)的環(huán)境立體混響系數(shù)的經(jīng)去相關(guān)表示,所述環(huán)境立體混響系數(shù)已從多個(gè)高階立體混響系數(shù)提取并且表示由所述多個(gè)高階立體混響系數(shù)描述的聲場(chǎng)的背景分量,其中所述多個(gè)高階立體混響系數(shù)中的至少一者與具有大于一的階數(shù)的球形基底函數(shù)相關(guān)聯(lián);和基于所述環(huán)境立體混響系數(shù)的所述經(jīng)去相關(guān)表示而產(chǎn)生揚(yáng)聲器饋送。在另一方面,用指令對(duì)計(jì)算機(jī)可讀存儲(chǔ)媒體進(jìn)行編碼,所述指令在執(zhí)行時(shí)致使音頻壓縮裝置的一或多個(gè)處理器:將去相關(guān)變換應(yīng)用于環(huán)境立體混響系數(shù)以獲得所述環(huán)境立體混響系數(shù)的經(jīng)去相關(guān)表示,所述環(huán)境HOA系數(shù)已從多個(gè)高階立體混響系數(shù)提取并且表示由所述多個(gè)高階立體混響系數(shù)描述的聲場(chǎng)的背景分量,其中所述多個(gè)高階立體混響系數(shù)中的至少一者與具有大于一的階數(shù)的球形基底函數(shù)相關(guān)聯(lián)。在附圖和以下描述中陳述所述技術(shù)的一或多個(gè)方面的細(xì)節(jié)。所述技術(shù)的其它特征、目標(biāo)和優(yōu)點(diǎn)將從所述描述和圖式以及權(quán)利要求書而顯而易見。附圖說明圖1是說明具有各種階數(shù)和子階數(shù)的球面諧波基底函數(shù)的圖。圖2是說明可執(zhí)行本發(fā)明中描述的技術(shù)的各種方面的系統(tǒng)的圖。圖3是更詳細(xì)地說明在圖2的實(shí)例中所展示的可執(zhí)行本發(fā)明中描述的技術(shù)的各種方面的音頻編碼裝置的一個(gè)實(shí)例的框圖。圖4是更詳細(xì)地說明圖2的音頻解碼裝置的框圖。圖5是說明音頻編碼裝置執(zhí)行本發(fā)明中描述的基于向量的合成技術(shù)的各種方面的示范性操作的流程圖。圖6A是說明音頻解碼裝置執(zhí)行本發(fā)明中描述的技術(shù)的各種方面的示范性操作的流程圖。圖6B是說明音頻編碼裝置和音頻解碼裝置執(zhí)行本發(fā)明中描述的譯碼技術(shù)的示范性操作的流程圖。具體實(shí)施方式環(huán)繞聲的演進(jìn)現(xiàn)今已使得許多輸出格式可用于娛樂。此等消費(fèi)型環(huán)繞聲格式的實(shí)例大部分為基于“信道”的,這是因?yàn)槠湟蕴囟◣缀巫鴺?biāo)隱含地指定去往擴(kuò)音器的饋送。消費(fèi)型環(huán)繞聲格式包含普遍的5.1格式(其包含以下六個(gè)信道:左前(FL)、右前(FR)、中心或前中心、左后或左環(huán)繞、右后或右環(huán)繞,以及低頻效應(yīng)(LFE))、發(fā)展中的7.1格式、包含高度揚(yáng)聲器的各種格式,例如7.1.4格式和22.2格式(例如,供與超高清晰電視標(biāo)準(zhǔn)一起使用)。非消費(fèi)型格式可涵括任何數(shù)目個(gè)揚(yáng)聲器(成對(duì)稱和非對(duì)稱幾何布置),其常常被為“環(huán)繞陣列”。此類陣列的一個(gè)實(shí)例包含定位在截角二十面體的拐角上的坐標(biāo)處的32個(gè)擴(kuò)音器。去往未來MPEG編碼器的輸入視情況為以下三個(gè)可能格式中的一者:(i)傳統(tǒng)的基于信道的音頻(如上文所論述),其意圖由處于預(yù)先指定的位置處的擴(kuò)音器播放;(ii)基于對(duì)象的音頻,其涉及用于單個(gè)音頻對(duì)象的具有含有其位置坐標(biāo)(以及其它信息)的相關(guān)聯(lián)元數(shù)據(jù)的離散脈碼調(diào)制(PCM)數(shù)據(jù);以及(iii)基于場(chǎng)景的音頻,其涉及使用球面諧波基底函數(shù)的系數(shù)(也稱為“球面諧波系數(shù)”或SHC、“高階立體混響”或HOA以及“HOA系數(shù)”)來表示聲場(chǎng)。所述未來MPEG編碼器更詳細(xì)地描述于國(guó)際標(biāo)準(zhǔn)化組織/國(guó)際電工委員會(huì)(ISO)/(IEC)JTC1/SC29/WG11/N13411的標(biāo)題為“要求對(duì)于3D音頻的提議(CallforProposalsfor3DAudio)”的文獻(xiàn)中,所述文獻(xiàn)于2013年1月在瑞士日內(nèi)瓦發(fā)布,且可在http://mpeg.chiariglione.org/sites/default/files/files/standards/parts/docs/w13411.zip獲得。在市場(chǎng)中存在各種基于信道的“環(huán)繞聲”格式。它們的范圍(例如)是從5.1家庭影院系統(tǒng)(其在使起居室享有立體聲效方面已獲得最大成功)到NHK(日本廣播協(xié)會(huì)(NipponHosoKyokai)或日本廣播公司(JapanBroadcastingCorporation))所開發(fā)的22.2系統(tǒng)。內(nèi)容創(chuàng)建者(例如,好萊塢工作室)將希望一次產(chǎn)生電影的原聲帶,而不花費(fèi)精力來針對(duì)每一揚(yáng)聲器配置對(duì)其進(jìn)行再混合。近來,標(biāo)準(zhǔn)開發(fā)組織(StandardsDevelopingOrganizations)一直在考慮如下方式:提供到標(biāo)準(zhǔn)化位流中的編碼,以及后續(xù)解碼,其可調(diào)適且不知曉回放位置(涉及再現(xiàn)器)處的揚(yáng)聲器幾何布置(和數(shù)目)以及聲學(xué)條件。為向內(nèi)容創(chuàng)建者提供此類靈活性,可使用分層要素集合來表示聲場(chǎng)。所述分層要素集合可指其中元素經(jīng)排序以使得較低階元素的基礎(chǔ)集合提供模型化聲場(chǎng)的完整表示的元素集合。在所述集合經(jīng)擴(kuò)展以包含高階元素時(shí),所述表示變得更詳細(xì),從而增加分辨率。分層要素集合的一個(gè)實(shí)例為球面諧波系數(shù)(SHC)集合。以下表達(dá)式示范使用SHC對(duì)聲場(chǎng)的描述或表示:所述表達(dá)式展示在時(shí)間t處在聲場(chǎng)的任何點(diǎn)處的壓力pi可由SHC、來唯一地表示。此處,c是聲音的速度(約343m/s),是參考點(diǎn)(或觀測(cè)點(diǎn)),jn(·)是階n的球面貝塞爾函數(shù),且是階數(shù)n和子階數(shù)m的球面諧波基底函數(shù)??烧J(rèn)識(shí)到,方括號(hào)中的術(shù)語為信號(hào)(即,的頻域表示,其可由各種時(shí)間-頻率變換(例如離散傅里葉變換(DFT)、離散余弦變換(DCT)或小波變換)近似表示。分層集合的其它實(shí)例包含小波變換系數(shù)的集合和多分辨率基底函數(shù)的系數(shù)的其它集合。通過截?cái)喔唠A以使得僅留存零階和一階來處理高階立體混響信號(hào)。歸因于高階系數(shù)的能量損失,通常會(huì)對(duì)剩余的信號(hào)進(jìn)行某些能量補(bǔ)償。本發(fā)明的各種方面針對(duì)于減少背景信號(hào)間的相關(guān)性。舉例來說,本發(fā)明的技術(shù)可減少或可能地消除在HOA域中表達(dá)的背景信號(hào)之間的相關(guān)性。減少背景HOA信號(hào)之間的相關(guān)性的潛在優(yōu)點(diǎn)是減低噪聲去掩蔽。如本文中所使用,表達(dá)“噪聲去掩蔽”可指將音頻對(duì)象歸屬于在空間域中不對(duì)應(yīng)于所述音頻對(duì)象的位置。除減少與噪聲去掩蔽有關(guān)的潛在問題之外,本文中所描述的編碼技術(shù)還可產(chǎn)生表示左音頻信號(hào)和右音頻信號(hào)(例如一起形成立體聲輸出的信號(hào))的輸出信號(hào)。繼而,解碼裝置可解碼左音頻信號(hào)和右音頻信號(hào)以獲得立體聲輸出,或可混合左音頻信號(hào)與右音頻信號(hào)以獲得單聲道輸出。另外,在經(jīng)編碼位流表示純水平布局的情境中,解碼裝置可實(shí)施本發(fā)明的各種技術(shù)以僅解碼水平分量去相關(guān)HOA背景信號(hào)。通過將解碼過程限制于水平分量去相關(guān)HOA背景信號(hào),解碼器可實(shí)施所述技術(shù)以節(jié)省計(jì)算資源并且減少帶寬消耗。圖1是說明從零階(n=0)到四階(n=4)的球面諧波基底函數(shù)的圖。如可見,對(duì)于每一階,存在子階數(shù)m的擴(kuò)展,出于易于說明的目的,在圖1的實(shí)例中展示所述子階數(shù)但未明確注釋。可通過各種麥克風(fēng)陣列配置物理地獲取(例如,記錄)SHC或替代地,其可從聲場(chǎng)的基于信道或基于對(duì)象的描述導(dǎo)出。SHC表示基于場(chǎng)景的音頻,其中SHC可輸入到音頻編碼器以獲得經(jīng)編碼SHC,所述經(jīng)編碼SHC可促成更有效的傳輸或存儲(chǔ)。舉例來說,可使用涉及(1+4)2(25,且因此為四階)系數(shù)的四階表示。如上文所提到,可使用麥克風(fēng)陣列從麥克風(fēng)記錄導(dǎo)出SHC。可如何從麥克風(fēng)陣列導(dǎo)出SHC的各種實(shí)例描述于波萊蒂·M(Poletti,M)的“基于球面諧波的三維環(huán)繞聲系統(tǒng)(Three-DimensionalSurroundSoundSystemsBasedonSphericalHarmonics)”(聽覺工程學(xué)協(xié)會(huì)會(huì)刊(J.AudioEng.Soc.),第53卷,第11期,2005年11月,第1004到1025頁)中。為說明可如何從基于對(duì)象的描述導(dǎo)出SHC,考慮以下方程式??蓪?duì)應(yīng)于個(gè)別音頻對(duì)象的聲場(chǎng)的系數(shù)表達(dá)為:其中i是是階n的球面漢克爾函數(shù)(第二種類),且是對(duì)象的位置。已知隨頻率變化的對(duì)象源能量g(ω)(例如,使用時(shí)間-頻率分析技術(shù),例如對(duì)PCM流執(zhí)行快速傅里葉變換)允許將每一PCM對(duì)象和對(duì)應(yīng)位置轉(zhuǎn)換成SHC此外,可展示(由于以上是線性和正交分解)用于每一對(duì)象的系數(shù)是累加的。以此方式,眾多PCM對(duì)象可由系數(shù)(例如,作為個(gè)別對(duì)象的系數(shù)向量的總和)來表示。基本上,所述系數(shù)含有關(guān)于聲場(chǎng)的信息(隨3D坐標(biāo)而變的壓力),且上述情形表示在觀測(cè)點(diǎn)附近從個(gè)別對(duì)象到整個(gè)聲場(chǎng)的表示的變換。下文在基于對(duì)象和基于SHC的音頻譯碼的上下文中描述剩余各圖。圖2是說明可執(zhí)行本發(fā)明中描述的技術(shù)的各種方面的系統(tǒng)10的圖。如圖2的實(shí)例中所展示,系統(tǒng)10包含內(nèi)容創(chuàng)建者裝置12和內(nèi)容消費(fèi)者裝置14。盡管在內(nèi)容創(chuàng)建者裝置12和內(nèi)容消費(fèi)者裝置14的上下文中描述,但可在其中聲場(chǎng)的SHC(也可稱為HOA系數(shù))或任何其它分層表示經(jīng)編碼以形成表示音頻數(shù)據(jù)的位流的任何上下文中實(shí)施所述技術(shù)。此外,內(nèi)容創(chuàng)建者裝置12可表示能夠?qū)嵤┍景l(fā)明中所描述的技術(shù)的任何形式的計(jì)算裝置,包含手持機(jī)(或蜂窩式電話)、平板計(jì)算機(jī)、智能電話或臺(tái)式計(jì)算機(jī)(提供幾個(gè)實(shí)例)。同樣地,內(nèi)容消費(fèi)者裝置14可表示能夠?qū)嵤┍景l(fā)明中所描述的技術(shù)的任何形式的計(jì)算裝置,包含手持機(jī)(或蜂窩式電話)、平板計(jì)算機(jī)、智能電話、機(jī)頂盒或臺(tái)式計(jì)算機(jī)(提供幾個(gè)實(shí)例)。內(nèi)容創(chuàng)建者裝置12可由電影工作室或可產(chǎn)生多信道音頻內(nèi)容以供內(nèi)容消費(fèi)者裝置(例如,內(nèi)容消費(fèi)者裝置14)的操作者消耗的其它實(shí)體來操作。在一些實(shí)例中,內(nèi)容創(chuàng)建者裝置12可由將希望壓縮HOA系數(shù)11的個(gè)別用戶操作。內(nèi)容創(chuàng)建者通常產(chǎn)生音頻內(nèi)容與視頻內(nèi)容。內(nèi)容消費(fèi)者裝置14可由個(gè)人操作。內(nèi)容消費(fèi)者裝置14可包含音頻回放系統(tǒng)16,其可指能夠再現(xiàn)SHC以供作為多信道音頻內(nèi)容回放的任何形式的音頻回放系統(tǒng)。內(nèi)容創(chuàng)建者裝置12包含音頻編輯系統(tǒng)18。內(nèi)容創(chuàng)建者裝置12獲得各種格式(包含直接作為HOA系數(shù))的實(shí)況記錄7和音頻對(duì)象9,內(nèi)容創(chuàng)建者裝置12可使用音頻編輯系統(tǒng)18對(duì)其進(jìn)行編輯。麥克風(fēng)5可捕獲實(shí)況記錄7。內(nèi)容創(chuàng)建者可在編輯過程期間再現(xiàn)來自音頻對(duì)象9的HOA系數(shù)11,從而收聽所再現(xiàn)的揚(yáng)聲器饋送以試圖標(biāo)識(shí)需要進(jìn)一步編輯的聲場(chǎng)的各種方面。內(nèi)容創(chuàng)建者裝置12接著可編輯HOA系數(shù)11(潛在地通過操縱可以上文所描述的方式從中導(dǎo)出源HOA系數(shù)的音頻對(duì)象9中的不同者而間接地編輯)。內(nèi)容創(chuàng)建者裝置12可采用音頻編輯系統(tǒng)18產(chǎn)生HOA系數(shù)11。音頻編輯系統(tǒng)18表示能夠編輯音頻數(shù)據(jù)且輸出所述音頻數(shù)據(jù)作為一或多個(gè)源球面諧波系數(shù)的任何系統(tǒng)。當(dāng)編輯過程完成時(shí),內(nèi)容創(chuàng)建者裝置12可基于HOA系數(shù)11產(chǎn)生位流21。也就是說,內(nèi)容創(chuàng)建者裝置12包含音頻編碼裝置20,所述音頻編碼裝置表示經(jīng)配置以根據(jù)本發(fā)明中描述的技術(shù)的各種方面編碼或以其它方式壓縮HOA系數(shù)11以產(chǎn)生位流21的裝置。音頻編碼裝置20可產(chǎn)生位流21以用于跨越傳輸信道(其可為有線或無線信道、數(shù)據(jù)存儲(chǔ)裝置或其類似者)傳輸(作為一個(gè)實(shí)例)。位流21可表示HOA系數(shù)11的經(jīng)編碼版本,且可包含主要位流和另一旁側(cè)位流(其可稱為旁側(cè)信道信息)。雖然在圖2中展示為直接傳輸?shù)絻?nèi)容消費(fèi)者裝置14,但內(nèi)容創(chuàng)建者裝置12可將位流21輸出到位于內(nèi)容創(chuàng)建者裝置12與內(nèi)容消費(fèi)者裝置14之間的中間裝置。中間裝置可存儲(chǔ)位流21以用于稍后遞送到可請(qǐng)求所述位流的內(nèi)容消費(fèi)者裝置14。所述中間裝置可包括文件服務(wù)器、網(wǎng)絡(luò)服務(wù)器、臺(tái)式計(jì)算機(jī)、膝上型計(jì)算機(jī)、平板計(jì)算機(jī)、移動(dòng)電話、智能電話,或能夠存儲(chǔ)位流21以供音頻解碼器稍后檢索的任何其它裝置。中間裝置可駐留在能夠?qū)⑽涣?1流式傳輸(且可能結(jié)合傳輸對(duì)應(yīng)視頻數(shù)據(jù)位流)到請(qǐng)求位流21的訂戶(例如,內(nèi)容消費(fèi)者裝置14)的內(nèi)容遞送網(wǎng)絡(luò)中。替代地,內(nèi)容創(chuàng)建者裝置12可將位流21存儲(chǔ)到存儲(chǔ)媒體,例如壓縮光盤、數(shù)字視頻光盤、高清視頻光盤或其它存儲(chǔ)媒體,其中大多數(shù)能夠由計(jì)算機(jī)讀取且因此可稱為計(jì)算機(jī)可讀存儲(chǔ)媒體或非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)媒體。在此上下文中,傳輸信道可指借以傳輸存儲(chǔ)到媒體的內(nèi)容的信道(且可包含小量存儲(chǔ)(retailstores)和其它基于存儲(chǔ)的(store-based)遞送機(jī)制)。因而,在任何情況下,就此而言,本發(fā)明的技術(shù)不應(yīng)限于圖2的實(shí)例。如圖2的實(shí)例中進(jìn)一步展示,內(nèi)容消費(fèi)者裝置14包含音頻回放系統(tǒng)16。音頻回放系統(tǒng)16可表示能夠回放多信道音頻數(shù)據(jù)的任何音頻回放系統(tǒng)。音頻回放系統(tǒng)16可包含多個(gè)不同的再現(xiàn)器22。再現(xiàn)器22可各自提供用于不同形式的再現(xiàn),其中所述不同形式的再現(xiàn)可包含執(zhí)行向量基振幅移動(dòng)(VBAP)的各種方式中的一或多者,以及/或執(zhí)行聲場(chǎng)合成的各種方式中的一或多者。如本文中所使用,“A和/或B”意味著“A或B”,或“A和B”兩者。音頻回放系統(tǒng)16可進(jìn)一步包含音頻解碼裝置24。音頻解碼裝置24可表示經(jīng)配置以解碼來自位流21的HOA系數(shù)11'的裝置,其中HOA系數(shù)11'可類似于HOA系數(shù)11,但歸因于有損操作(例如,量化)和/或經(jīng)由傳輸信道的傳輸而不同。音頻回放系統(tǒng)16可在解碼位流21之后獲得HOA系數(shù)11'并再現(xiàn)HOA系數(shù)11'以輸出擴(kuò)音器饋送25。擴(kuò)音器饋送25可驅(qū)動(dòng)一或多個(gè)擴(kuò)音器(其為便于說明的目的在圖2的實(shí)例中未示出)。為了選擇適當(dāng)再現(xiàn)器或在一些例子中產(chǎn)生適當(dāng)再現(xiàn)器,音頻回放系統(tǒng)16可獲得指示擴(kuò)音器的數(shù)目和/或擴(kuò)音器的空間幾何布置的擴(kuò)音器信息13。在一些例子中,音頻回放系統(tǒng)16可使用參考麥克風(fēng)獲得擴(kuò)音器信息13且以動(dòng)態(tài)地確定擴(kuò)音器信息13的方式驅(qū)動(dòng)擴(kuò)音器。在其它例子中或結(jié)合動(dòng)態(tài)確定擴(kuò)音器信息13,音頻回放系統(tǒng)16可提示用戶與音頻回放系統(tǒng)16介接并輸入擴(kuò)音器信息13。音頻回放系統(tǒng)16接著可基于擴(kuò)音器信息13選擇音頻再現(xiàn)器22中的一者。在一些例子中,當(dāng)音頻再現(xiàn)器22中無一者處于到在擴(kuò)音器信息13中所指定的擴(kuò)音器幾何布置的某一閾值相似性量度(就擴(kuò)音器幾何布置來說)內(nèi)時(shí),音頻回放系統(tǒng)16可基于擴(kuò)音器信息13產(chǎn)生音頻再現(xiàn)器22中的一者。音頻回放系統(tǒng)16可在一些例子中基于擴(kuò)音器信息13產(chǎn)生音頻再現(xiàn)器22中的一者,而無需首先試圖選擇音頻再現(xiàn)器22中的現(xiàn)有者。一或多個(gè)揚(yáng)聲器3接著可回放再現(xiàn)的擴(kuò)音器饋送25。圖3是更詳細(xì)地說明在圖2的實(shí)例中所展示的可執(zhí)行本發(fā)明中描述的技術(shù)的各種方面的音頻編碼裝置20的一個(gè)實(shí)例的框圖。音頻編碼裝置20包含內(nèi)容分析單元26、基于向量的合成方法單元27、基于方向的合成方法單元28,以及去相關(guān)單元40'。盡管下文簡(jiǎn)單描述,但關(guān)于音頻編碼裝置20和壓縮或以其它方式編碼HOA系數(shù)的各種方面的更多信息可在2014年5月29日申請(qǐng)的標(biāo)題為“用于聲場(chǎng)的經(jīng)分解表示的內(nèi)插(INTERPOLATIONFORDECOMPOSEDREPRESENTATIONSOFASOUNDFIELD)”的第WO2014/194099號(hào)國(guó)際專利申請(qǐng)公開案中獲得。內(nèi)容分析單元26表示經(jīng)配置以分析HOA系數(shù)11的內(nèi)容以標(biāo)識(shí)HOA系數(shù)11是表示從實(shí)況記錄產(chǎn)生的內(nèi)容還是表示從音頻對(duì)象產(chǎn)生的內(nèi)容的單元。內(nèi)容分析單元26可確定HOA系數(shù)11是從實(shí)際聲場(chǎng)的記錄產(chǎn)生還是從人工音頻對(duì)象產(chǎn)生。在一些例子中,當(dāng)幀式HOA系數(shù)11是從記錄產(chǎn)生時(shí),內(nèi)容分析單元26將HOA系數(shù)11傳遞到基于向量的分解單元27。在一些例子中,當(dāng)幀式HOA系數(shù)11是從合成音頻對(duì)象產(chǎn)生時(shí),內(nèi)容分析單元26將HOA系數(shù)11傳遞到基于方向的合成單元28?;诜较虻暮铣蓡卧?8可表示經(jīng)配置以執(zhí)行HOA系數(shù)11的基于方向的合成以產(chǎn)生基于方向的位流21的單元。如在圖3的實(shí)例中所展示,基于向量的分解單元27可包含線性可逆變換(LIT)單元30、參數(shù)計(jì)算單元32、重排序單元34、前景選擇單元36、能量補(bǔ)償單元38、心理聲學(xué)音頻譯碼器單元40、位流產(chǎn)生單元42、聲場(chǎng)分析單元44、系數(shù)減少單元46、背景(BG)選擇單元48、空間-時(shí)間內(nèi)插單元50以及量化單元52。線性可逆變換(LIT)單元30接收呈HOA信道形式的HOA系數(shù)11,所述HOA信道中的每一信道表示與球面基底函數(shù)的給定階數(shù)、子階數(shù)相關(guān)聯(lián)的系數(shù)的塊或幀(其可標(biāo)示為HOA[k],其中k可標(biāo)示樣本的當(dāng)前幀或塊)。HOA系數(shù)11的矩陣可具有維度D:M×(N+1)2。LIT單元30可表示經(jīng)配置以執(zhí)行被稱為奇異值分解的分析形式的單元。雖然關(guān)于SVD加以描述,但可對(duì)于提供線性不相關(guān)的能量密集輸出的集合的任何類似變換或分解來執(zhí)行本發(fā)明中所描述的技術(shù)。而且,本發(fā)明中對(duì)“集合”的參考一般意圖指非零集合(除非特定地相反陳述),且并不意圖指包含所謂的“空集合”的集合的經(jīng)典數(shù)學(xué)定義。替代變換可包括通常被稱為“PCA”的主分量分析。取決于上下文,PCA可由若干不同名稱指代,例如(僅舉幾例)離散卡亨南-洛維變換、霍特林變換、恰當(dāng)正交分解(POD)和本征值分解(EVD)。有利于壓縮音頻數(shù)據(jù)的基本目標(biāo)的此類操作的特性為多信道音頻數(shù)據(jù)的“能量壓縮”和“去相關(guān)”。在任何情況下,出于實(shí)例的目的,假設(shè)LIT單元30執(zhí)行奇異值分解(其又可被稱為“SVD”),LIT單元30可將HOA系數(shù)11變換成兩個(gè)或多于兩個(gè)經(jīng)變換HOA系數(shù)的集合。經(jīng)變換HOA系數(shù)的“集合”可包含經(jīng)變換HOA系數(shù)的向量。在圖3的實(shí)例中,LIT單元30可對(duì)于HOA系數(shù)11執(zhí)行SVD以產(chǎn)生所謂的V矩陣、S矩陣及U矩陣。在線性代數(shù)中,SVD可以如下形式表示y乘z實(shí)數(shù)或復(fù)數(shù)矩陣X(其中X可表示多信道音頻數(shù)據(jù),例如HOA系數(shù)11)的因子分解:X=USV*U可表示y乘y實(shí)數(shù)或復(fù)數(shù)單式矩陣,其中U的y列被稱為多信道音頻數(shù)據(jù)的左奇異向量。S可表示在對(duì)角線上具有非負(fù)實(shí)數(shù)的y乘z矩形對(duì)角線矩陣,其中S的對(duì)角線值被稱為多信道音頻數(shù)據(jù)的奇異值。V*(其可標(biāo)示V的共軛轉(zhuǎn)置)可表示z乘z實(shí)數(shù)或復(fù)數(shù)單式矩陣,其中V*的z列被稱為多信道音頻數(shù)據(jù)的右奇異向量。在一些實(shí)例中,以上提及的SVD數(shù)學(xué)表達(dá)式中的V*矩陣標(biāo)示為V矩陣的共軛轉(zhuǎn)置以反映SVD可應(yīng)用于包括復(fù)數(shù)的矩陣。當(dāng)應(yīng)用于僅包括實(shí)數(shù)的矩陣時(shí),V矩陣的復(fù)數(shù)共軛(或換句話說,V*矩陣)可被視為V矩陣的轉(zhuǎn)置。下文中為容易說明的目的,假設(shè)HOA系數(shù)11包括實(shí)數(shù),結(jié)果是經(jīng)由SVD而非V*矩陣輸出V矩陣。此外,盡管在本發(fā)明中標(biāo)示為V矩陣,但對(duì)V矩陣的提及應(yīng)理解為在適當(dāng)?shù)那闆r下涉及V矩陣的轉(zhuǎn)置。盡管假設(shè)為V矩陣,但所述技術(shù)可以類似方式應(yīng)用于具有復(fù)數(shù)系數(shù)的HOA系數(shù)11,其中SVD的輸出為V*矩陣。因此,就此而言,所述技術(shù)不應(yīng)限于僅提供應(yīng)用SVD以產(chǎn)生V矩陣,而是可包含將SVD應(yīng)用于具有復(fù)數(shù)分量的HOA系數(shù)11以產(chǎn)生V*矩陣。以此方式,LIT單元30可對(duì)于HOA系數(shù)11執(zhí)行SVD以輸出具有維度D:M×(N+1)2的US[k]向量33(其可表示S向量和U向量的組合版本)以及具有維度D:(N+1)2×(N+1)2的V[k]向量35。US[k]矩陣中的個(gè)別向量元素也可被稱為XPS(k),而V[k]矩陣中的個(gè)別向量也可被稱為v(k)。U、S和V矩陣的分析可顯示這些矩陣攜載或表示上文由X表示的基本聲場(chǎng)的空間和時(shí)間特性。U(長(zhǎng)度為M個(gè)樣本)中的N個(gè)向量中的每一者可表示隨時(shí)間而變(對(duì)于由M個(gè)樣本表示的時(shí)間周期)的經(jīng)歸一化分離音頻信號(hào),其彼此正交且已與任何空間特性(其也可被稱為方向信息)解耦。表示空間形狀和位置的空間特性可替代地由V矩陣中的個(gè)別第i向量v(i)(k)(每一者具有長(zhǎng)度(N+1)2)表示。v(i)(k)向量中的每一者的個(gè)別元素可表示HOA系數(shù),其描述相關(guān)聯(lián)音頻對(duì)象的聲場(chǎng)的形狀(包含寬度)和位置。U矩陣和V矩陣中的向量均經(jīng)歸一化以使得其均方根能量等于一。U中的音頻信號(hào)的能量因而由S中的對(duì)角線元素表示。將U與S相乘以形成US[k](具有個(gè)別向量元素XPS(k)),因而表示具有能量的音頻信號(hào)。SVD分解以使音頻時(shí)間信號(hào)(U中)、其能量(S中)以及其空間特性(V中)解耦的能力可支持本發(fā)明中所描述的技術(shù)的各種方面。另外,通過US[k]與V[k]的向量乘法合成基本HOA[k]系數(shù)X的模型產(chǎn)生貫穿此文獻(xiàn)使用的術(shù)語“基于向量的分解”。盡管描述為對(duì)于HOA系數(shù)11直接執(zhí)行,但LIT單元30可將線性可逆變換應(yīng)用到HOA系數(shù)11的導(dǎo)出項(xiàng)。舉例來說,LIT單元30可對(duì)于從HOA系數(shù)11導(dǎo)出的功率譜密度矩陣應(yīng)用SVD。通過對(duì)于HOA系數(shù)的功率譜密度(PSD)而非系數(shù)本身執(zhí)行SVD,LIT單元30可在處理器循環(huán)和存儲(chǔ)空間的一或多者方面潛在地降低執(zhí)行SVD的計(jì)算復(fù)雜性,同時(shí)實(shí)現(xiàn)與將SVD直接應(yīng)用于HOA系數(shù)的情況相同的源音頻編碼效率。參數(shù)計(jì)算單元32表示經(jīng)配置以計(jì)算各種參數(shù)的單元,所述參數(shù)例如相關(guān)性參數(shù)(R)、方向特性參數(shù)和能量特性(e)。當(dāng)前幀的參數(shù)中的每一者可標(biāo)示為R[k]、θ[k]、r[k]及e[k]。參數(shù)計(jì)算單元32可對(duì)于US[k]向量33執(zhí)行能量分析和/或相關(guān)(或所謂的交叉相關(guān))以標(biāo)識(shí)這些參數(shù)。參數(shù)計(jì)算單元32還可確定前一幀的參數(shù),其中前一幀的參數(shù)可基于具有US[k-1]向量及V[k-1]向量的前一幀而標(biāo)示為R[k-1]、θ[k-1]、r[k-1]和e[k-1]。參數(shù)計(jì)算單元32可將當(dāng)前參數(shù)37和先前參數(shù)39輸出到重排序單元34。由參數(shù)計(jì)算單元32計(jì)算的參數(shù)可供重排序單元34用以將音頻對(duì)象重排序以表示其自然評(píng)估或隨時(shí)間推移的連續(xù)性。重排序單元34可將來自第一US[k]向量33的參數(shù)37中的每一者與第二US[k-1]向量33的參數(shù)39中的每一者在順序方面進(jìn)行比較。重排序單元34可基于當(dāng)前參數(shù)37和先前參數(shù)39對(duì)US[k]矩陣33和V[k]矩陣35內(nèi)的各種向量進(jìn)行重排序(作為一個(gè)實(shí)例,使用匈牙利算法)以將經(jīng)重排序的US[k]矩陣33'(其可數(shù)學(xué)標(biāo)示為)和經(jīng)重排序的V[k]矩陣35'(其可數(shù)學(xué)標(biāo)示為)輸出到前景聲音(或主導(dǎo)聲音(PS))選擇單元36(“前景選擇單元36”)和能量補(bǔ)償單元38。聲場(chǎng)分析單元44可表示經(jīng)配置以對(duì)于HOA系數(shù)11執(zhí)行聲場(chǎng)分析以便潛在地實(shí)現(xiàn)目標(biāo)位速率41的單元。聲場(chǎng)分析單元44可基于所述分析和/或基于所接收目標(biāo)位速率41,確定心理聲學(xué)譯碼器實(shí)例化的總數(shù)目(其可為環(huán)境或背景信道的總數(shù)目(BGTOT)的函數(shù))以及前景信道(或換句話說,主導(dǎo)信道)的數(shù)目。心理聲學(xué)譯碼器實(shí)例化的總數(shù)可標(biāo)示為numHOATransportChannels。再次為了潛在地實(shí)現(xiàn)目標(biāo)位速率41,聲場(chǎng)分析單元44還可確定前景信道的總數(shù)目(nFG)45、背景(或換句話說,環(huán)境)聲場(chǎng)的最小階數(shù)(NBG或替代性地,MinAmbHOAorder)、表示背景聲場(chǎng)的最小階數(shù)的實(shí)際信道的對(duì)應(yīng)數(shù)目(nBGa=(MinAmbHOAorder+1)2),以及要發(fā)送的額外BGHOA信道的索引(i)(其在圖3的實(shí)例中可共同地標(biāo)示為背景信道信息43)。背景信道信息42也可被稱為環(huán)境信道信息43。保持來自numHOATransportChannels-nBGa的信道中的每一者可為“額外背景/環(huán)境信道”、“活動(dòng)的基于向量的主導(dǎo)信道”、“活動(dòng)的基于方向的主導(dǎo)信號(hào)”,或?yàn)椤巴耆腔顒?dòng)的”。在一個(gè)方面中,信道類型可為通過兩位指示(為“ChannelType”)的語法元素(例如,00:基于方向的信號(hào);01:基于向量的主導(dǎo)信號(hào);10:額外環(huán)境信號(hào);11:非活動(dòng)信號(hào))。可由(MinAmbHOAorder+1)2+索引10(在以上實(shí)例中)作為信道類型在所述幀的位流中出現(xiàn)的次數(shù)給出背景或環(huán)境信號(hào)的總數(shù)目nBGa。聲場(chǎng)分析單元44可基于目標(biāo)位速率41選擇背景(或換句話說,環(huán)境)信道的數(shù)目和前景(或換句話說,主導(dǎo))信道的數(shù)目,從而在目標(biāo)位速率41相對(duì)較高時(shí)(例如,在目標(biāo)位速率41等于或大于512Kbps時(shí))選擇更多背景和/或前景信道。在一個(gè)方面中,在位流的標(biāo)頭部分中,numHOATransportChannels可設(shè)置為8,而MinAmbHOAorder可設(shè)置為1。在此情境下,在每個(gè)幀處,四個(gè)信道可專用于表示聲場(chǎng)的背景或環(huán)境部分,而另4個(gè)信道可在逐幀基礎(chǔ)上隨信道類型而變化,例如任一者用作額外背景/環(huán)境信道或前景/主導(dǎo)信道。前景/主導(dǎo)信號(hào)可為基于向量或基于方向的信號(hào)中的一者,如上文所描述。在一些例子中,幀的基于向量的主導(dǎo)信號(hào)的總數(shù)目可通過ChannelType索引在所述幀的位流中為01的次數(shù)給出。在以上方面中,對(duì)于每個(gè)額外背景/環(huán)境信道(例如,對(duì)應(yīng)于ChannelType10),可在所述信道中表示可能的HOA系數(shù)(除前四個(gè)以外)中的何者的對(duì)應(yīng)信息。對(duì)于四階HOA內(nèi)容,所述信息可為指示HOA系數(shù)5到25的索引。可在minAmbHOAorder設(shè)置為1時(shí)始終發(fā)送前四個(gè)環(huán)境HOA系數(shù)1到4,因此,音頻編碼裝置可能僅需要指示具有索引5到25的額外環(huán)境HOA系數(shù)中的一者。因此,可使用5位語法元素(針對(duì)四階內(nèi)容)發(fā)送所述信息,其可標(biāo)示為“CodedAmbCoeffIdx”。在任何情況下,聲場(chǎng)分析單元44將背景信道信息43和HOA系數(shù)11輸出到背景(BG)選擇單元36,將背景信道信息43輸出到系數(shù)減少單元46和位流產(chǎn)生單元42,且將nFG45輸出到前景選擇單元36。背景選擇單元48可表示經(jīng)配置以基于背景信道信息(例如,背景聲場(chǎng)(NBG)以及要發(fā)送的額外BGHOA信道的數(shù)目(nBGa)和索引(i))確定背景或環(huán)境HOA系數(shù)47的單元。舉例來說,當(dāng)NBG等于一時(shí),背景選擇單元48可選擇具有等于或小于一的階數(shù)的音頻幀的每一樣本的HOA系數(shù)11。在此實(shí)例中,背景選擇單元48接著可選擇具有由索引(i)中的一者標(biāo)識(shí)的索引的HOA系數(shù)11作為額外BGHOA系數(shù),其中將待于位流21中指定的nBGa提供到位流產(chǎn)生單元42以便使得音頻解碼裝置(例如,圖2和4的實(shí)例中所展示的音頻解碼裝置24)能夠從位流21解析背景HOA系數(shù)47。背景選擇單元48接著可將環(huán)境HOA系數(shù)47輸出到能量補(bǔ)償單元38。環(huán)境HOA系數(shù)47可具有維度D:M×[(NBG+1)2+nBGa]。環(huán)境HOA系數(shù)47也可被稱為“環(huán)境HOA系數(shù)47”,其中環(huán)境HOA系數(shù)47中的每一者對(duì)應(yīng)于待由心理聲學(xué)音頻譯碼器單元40編碼的單獨(dú)環(huán)境HOA信道47。前景選擇單元36可表示經(jīng)配置以基于nFG45(其可表示標(biāo)識(shí)前景向量的一或多個(gè)索引)選擇表示聲場(chǎng)的前景或相異分量的經(jīng)重排序的US[k]矩陣33'和經(jīng)重排序的V[k]矩陣35'的單元。前景選擇單元36可將nFG信號(hào)49(其可表示為經(jīng)重排序US[k]1、…、nFG49、FG1、…、nfG[k]49,或49)輸出到心理聲學(xué)音頻譯碼器單元40,其中nFG信號(hào)49可具有維度D:M×nFG,且每一者表示單聲道音頻對(duì)象。前景選擇單元36還可將對(duì)應(yīng)于聲場(chǎng)的前景分量的經(jīng)重排序的V[k]矩陣35'(或35')輸出到空間-時(shí)間內(nèi)插單元50,其中經(jīng)重排序的V[k]矩陣35'中的對(duì)應(yīng)于前景分量的子集可表示為具有維度D:((N+1)2×nFG)的前景V[k]矩陣51k(其可在數(shù)學(xué)上表示為)。能量補(bǔ)償單元38可表示經(jīng)配置以對(duì)于環(huán)境HOA系數(shù)47執(zhí)行能量補(bǔ)償以補(bǔ)償歸因于由背景選擇單元48移除HOA信道中的各者而產(chǎn)生的能量損失的單元。能量補(bǔ)償單元38可對(duì)于經(jīng)重排序的US[k]矩陣33'、經(jīng)重排序的V[k]矩陣35'、nFG信號(hào)49、前景V[k]向量51k和環(huán)境HOA系數(shù)47中的一或多者執(zhí)行能量分析,且接著基于所述能量分析執(zhí)行能量補(bǔ)償以產(chǎn)生經(jīng)能量補(bǔ)償?shù)沫h(huán)境HOA系數(shù)47'。能量補(bǔ)償單元38可將經(jīng)能量補(bǔ)償?shù)沫h(huán)境HOA系數(shù)47'輸出到去相關(guān)單元40'。繼而,去相關(guān)單元40'可實(shí)施本發(fā)明的技術(shù)以減少或消除HOA系數(shù)47'的背景信號(hào)之間的相關(guān)性以形成一或多個(gè)經(jīng)去相關(guān)的HOA系數(shù)47"。去相關(guān)單元40'可將經(jīng)去相關(guān)的HOA系數(shù)47"輸出到心理聲學(xué)音頻譯碼器單元40??臻g-時(shí)間內(nèi)插單元50可表示經(jīng)配置以接收第k幀的前景V[k]向量51k和前一幀(因此為k-1記法)的前景V[k-1]向量51k-1且執(zhí)行空間-時(shí)間內(nèi)插以產(chǎn)生經(jīng)內(nèi)插的前景V[k]向量的單元。空間-時(shí)間內(nèi)插單元50可將nFG信號(hào)49與前景V[k]向量51k重新組合以恢復(fù)經(jīng)重排序的前景HOA系數(shù)??臻g-時(shí)間內(nèi)插單元50接著可將經(jīng)重排序的前景HOA系數(shù)除以經(jīng)內(nèi)插的V[k]向量以產(chǎn)生經(jīng)內(nèi)插的nFG信號(hào)49'。空間-時(shí)間內(nèi)插單元50還可輸出前景V[k]向量51k,所述前景V[k]向量51k用以產(chǎn)生經(jīng)內(nèi)插的前景V[k]向量,以使得例如音頻解碼裝置24的音頻解碼裝置可產(chǎn)生經(jīng)內(nèi)插的前景V[k]向量且借此恢復(fù)前景V[k]向量51k。將用以產(chǎn)生經(jīng)內(nèi)插的前景V[k]向量的前景V[k]向量51k標(biāo)示為剩余的前景V[k]向量53。為了確保在編碼器和解碼器處使用相同的V[k]和V[k-1](以創(chuàng)建經(jīng)內(nèi)插的向量V[k]),可在編碼器和解碼器處使用向量的經(jīng)量化/經(jīng)解量化版本。空間-時(shí)間內(nèi)插單元50可將經(jīng)內(nèi)插的nFG信號(hào)49'輸出到心理聲學(xué)音頻譯碼器單元46且將經(jīng)內(nèi)插的前景V[k]向量51k輸出到系數(shù)減少單元46。系數(shù)減少單元46可表示經(jīng)配置以基于背景信道信息43對(duì)于剩余的前景V[k]向量53執(zhí)行系數(shù)減少以將經(jīng)減少的前景V[k]向量55輸出到量化單元52的單元。經(jīng)減少的前景V[k]向量55可具有維度D:[(N+1)2-(NBG+1)2-BGTOT]×nFG。系數(shù)減少單元46可在這方面表示經(jīng)配置以減少剩余的前景V[k]向量53中的系數(shù)的數(shù)目的單元。換句話說,系數(shù)減少單元46可表示經(jīng)配置以消除(形成剩余的前景V[k]向量53的)前景V[k]向量中的具有極少或幾乎不具有方向信息的系數(shù)的單元。在一些實(shí)例中,相異或(換句話說)前景V[k]向量的對(duì)應(yīng)于一階和零階基底函數(shù)的系數(shù)(其可標(biāo)示為NBG)提供極少方向信息,且因此可從前景V向量移除(通過可被稱為“系數(shù)減少”的過程)。在此實(shí)例中,可提供較大靈活性以不僅從集合[(NBG+1)2+1,(N+1)2]標(biāo)識(shí)對(duì)應(yīng)于NBG的系數(shù)而且標(biāo)識(shí)額外HOA信道(其可由變量TotalOfAddAmbHOAChan標(biāo)示)。量化單元52可表示經(jīng)配置以執(zhí)行任何形式的量化以壓縮減少的前景V[k]向量55以產(chǎn)生經(jīng)譯碼前景V[k]向量57,從而將經(jīng)譯碼前景V[k]向量57輸出到位流產(chǎn)生單元42的單元。在操作中,量化單元52可表示經(jīng)配置以壓縮聲場(chǎng)的空間分量(即,在此實(shí)例中為經(jīng)減少的前景V[k]向量55中的一或多者)的單元。量化單元52可執(zhí)行如由標(biāo)示為“NbitsQ”的量化模式語法元素指示的以下12種量化模式中的任一者:量化單元52還可執(zhí)行前述類型的量化模式中的任一者的經(jīng)預(yù)測(cè)版本,其中確定前一幀的V向量的元素(或執(zhí)行向量量化時(shí)的權(quán)重)與當(dāng)前幀的V向量的元素(或執(zhí)行向量量化時(shí)的權(quán)重)之間的差。量化單元52接著可量化當(dāng)前幀與前一幀的元素或權(quán)重之間的差而非當(dāng)前幀本身的V向量的元素的值。量化單元52可對(duì)于經(jīng)減少的前景V[k]向量55中的每一者執(zhí)行多種形式的量化,以獲得經(jīng)減少的前景V[k]向量55的多個(gè)經(jīng)譯碼版本。量化單元52可選擇經(jīng)減少的前景V[k]向量55的經(jīng)譯碼版本中的一者作為經(jīng)譯碼前景V[k]向量57。換句話說,量化單元52可基于本發(fā)明中論述的準(zhǔn)則的任何組合來選擇未經(jīng)預(yù)測(cè)的經(jīng)向量量化的V向量、經(jīng)預(yù)測(cè)的經(jīng)向量量化的V向量、未經(jīng)霍夫曼譯碼的經(jīng)標(biāo)量量化的V向量以及經(jīng)霍夫曼譯碼的經(jīng)標(biāo)量量化的V向量中的一者,以用作輸出的經(jīng)切換量化的V向量。在一些實(shí)例中,量化單元52可從包含向量量化模式和一或多個(gè)標(biāo)量量化模式的量化模式集合中選擇量化模式,且基于(或根據(jù))選定模式量化輸入的V向量。量化單元52接著可將以下各者中的選定者提供到位流產(chǎn)生單元52以用作經(jīng)譯碼前景V[k]向量57:未經(jīng)預(yù)測(cè)的經(jīng)向量量化的V向量(例如,就權(quán)重值或指示權(quán)重值的位來說)、經(jīng)預(yù)測(cè)的經(jīng)向量量化的V向量(例如,就誤差值或指示誤差值的位來說)、未經(jīng)霍夫曼譯碼的經(jīng)標(biāo)量量化的V向量以及經(jīng)霍夫曼譯碼的經(jīng)標(biāo)量量化的V向量。量化單元52還可提供指示量化模式的語法元素(例如,NbitsQ語法元素)和用以將V向量解量化或以其它方式重構(gòu)V向量的任何其它語法元素。包含于音頻編碼裝置20內(nèi)的去相關(guān)單元40'可表示經(jīng)配置以將一或多個(gè)去相關(guān)變換應(yīng)用于HOA系數(shù)47'以獲得經(jīng)去相關(guān)的HOA系數(shù)47"的單元的單個(gè)或多個(gè)例子。在一些實(shí)例中,去相關(guān)單元40'可將UHJ矩陣應(yīng)用于HOA系數(shù)47'。在本發(fā)明的各種例子中,UHJ矩陣還可被稱作“基于相位的變換”。應(yīng)用基于相位的變換在本文中也可被稱作“相移去相關(guān)”。立體混響UHJ格式是經(jīng)設(shè)計(jì)以與單聲道和立體聲媒體兼容的立體混響環(huán)繞聲系統(tǒng)的發(fā)展。UHJ格式包含其中將以根據(jù)可用的信道變化的準(zhǔn)確性程度重現(xiàn)所記錄的聲場(chǎng)的系統(tǒng)層次。在各種例子中,UHJ也被稱作“C格式”。所述縮寫指示并入到所述系統(tǒng)中的來源中的一些:來自通用的U(UD-4);來自矩陣H的H;和來自系統(tǒng)45J的J。UHJ是編碼和解碼立體混響技術(shù)內(nèi)的方向性聲音信息的分層系統(tǒng)。取決于可用的信道的數(shù)目,系統(tǒng)可攜帶更多或更少信息。UHJ是立體聲和單聲道完全兼容的??墒褂酶哌_(dá)四個(gè)信道(L、R、T、Q)。在一種形式中,2信道(L、R)UHJ、水平(或“平面”)環(huán)繞信息可由正交立體聲信號(hào)信道(CD、FM或數(shù)字無線電等)攜載,所述信息可在收聽端使用UHJ解碼器進(jìn)行恢復(fù)。將兩個(gè)信道求和可產(chǎn)生兼容的單聲道信號(hào),其與對(duì)常規(guī)“經(jīng)假立體聲錄音的(panpotted)單聲道”源相比可為對(duì)兩信道版本的更準(zhǔn)確表示。如果第三信道(T)可用,那么當(dāng)經(jīng)由3信道UHJ解碼器進(jìn)行解碼時(shí),第三信道可用以產(chǎn)生對(duì)平面環(huán)繞效應(yīng)的改進(jìn)的定位準(zhǔn)確性。第三信道為此目的可能并非不需要具有全音頻帶寬,從而導(dǎo)致所謂的“21/2信道”系統(tǒng)的可能性,其中第三信道在帶寬上受限。在一個(gè)實(shí)例中,所述限值可為5kHz。第三信道可經(jīng)由FM無線電例如借助于相位正交調(diào)制進(jìn)行廣播。將第四信道(Q)添加到UHJ系統(tǒng)可允許以高度n(有時(shí)被稱為多聲道(Periphony))對(duì)全環(huán)繞聲音進(jìn)行編碼,其中準(zhǔn)確性程度與4信道B格式相同。2信道UHJ是通常用于立體混響記錄的分配的格式。2信道UHJ記錄可經(jīng)由所有正交立體聲信道傳輸,且可使用正交2信道媒體中的任一者而無需更改。UHJ是立體聲兼容的,因?yàn)樵跓o需解碼的情況下,收聽者可察覺立體聲像,但其與常規(guī)立體聲(例如,所謂的“超立體聲”)相比顯著更寬。也可將左信道與右信道求和以用于極高程度的單聲道兼容性。經(jīng)由UHJ解碼器回放,可展現(xiàn)環(huán)繞能力。應(yīng)用UHJ矩陣(或基于相位的變換)的去相關(guān)單元40'的實(shí)例數(shù)學(xué)表示如下:UHJ編碼:S=(0.9397*W)+(0.1856*X);D=imag(hilbert((-0.3420*W)+(0.5099*X)))+(0.6555*Y);T=imag(hilbert((-0.1432*W)+(0.6512*X)))-(0.7071*Y);Q=0.9772*Z;S和D到左和右的轉(zhuǎn)換:左=(S+D)/2右=(S-D)/2根據(jù)以上計(jì)算的一些實(shí)施方案,關(guān)于以上計(jì)算的假設(shè)可包含以下各項(xiàng):HOA背景信道是1階立體混響,F(xiàn)uMa經(jīng)歸一化,按照立體混響信道編號(hào)次序W(a00)、X(a11)、Y(a11-)、Z(a10)。在上文所列的計(jì)算中,去相關(guān)單元40'可執(zhí)行各種矩陣與恒定值的標(biāo)量乘法。舉例來說,為獲得S信號(hào),去相關(guān)單元40'可執(zhí)行W矩陣與恒定值0.9397(例如,通過標(biāo)量乘法)以及X矩陣與恒定值0.1856的標(biāo)量乘法。還如在上文所列的計(jì)算中所說明,去相關(guān)單元40'可在獲得D和T信號(hào)中的每一者時(shí)應(yīng)用希爾伯特變換(由以上UHJ編碼中的“Hilbert()”函數(shù)標(biāo)示)。以上UHJ編碼中的“imag()”函數(shù)指示獲得希爾伯特變換的結(jié)果的虛數(shù)(在數(shù)學(xué)意義上)。應(yīng)用UHJ矩陣(或基于相位的變換)的去相關(guān)單元40'的另一實(shí)例數(shù)學(xué)表示如下:UHJ編碼:S=(0.9396926*W)+(0.151520536509082*X);D=imag(hilbert((-0.3420201*W)+(0.416299273350443*X)))+(0.535173990363608*Y);T=0.940604061228740*(imag(hilbert((-0.1432*W)+(0.531702573500135*X)))-(0.577350269189626*Y));Q=Z;S和D到左和右的轉(zhuǎn)換:左=(S+D)/2;右=(S-D)/2;在以上計(jì)算的一些實(shí)例實(shí)施方案中,關(guān)于以上計(jì)算的假設(shè)可包含以下各項(xiàng):HOA背景信道是1階立體混響,N3D(或“全三維”)經(jīng)歸一化,按照立體混響信道編號(hào)次序W(a00)、X(a11)、Y(a11-)、Z(a10)。盡管本文中關(guān)于N3D歸一化進(jìn)行描述,但應(yīng)了解,所述實(shí)例計(jì)算也可應(yīng)用于經(jīng)SN3D歸一化(或“經(jīng)施密特半歸一化”)的HOA背景信道。N3D與SN3D歸一化可在所使用的比例縮放因子方面不同。N3D歸一化相對(duì)于SN3D歸一化的實(shí)例表示如下表達(dá)為:在SN3D歸一化中所使用的加權(quán)系數(shù)的實(shí)例如下表達(dá)為:在上文所列的計(jì)算中,去相關(guān)單元40'可執(zhí)行各種矩陣與恒定值的標(biāo)量乘法。舉例來說,為獲得S信號(hào),去相關(guān)單元40'可執(zhí)行W矩陣與恒定值0.9396926(例如,通過標(biāo)量乘法)以及X矩陣與恒定值0.151520536509082的標(biāo)量乘法。還如在上文所列的計(jì)算中所說明,去相關(guān)單元40'可在獲得D和T信號(hào)中的每一者時(shí)應(yīng)用希爾伯特變換(由以上UHJ編碼中的“Hilbert()”函數(shù)或相移去相關(guān)標(biāo)示)。以上UHJ編碼中的“imag()”函數(shù)指示獲得希爾伯特變換的結(jié)果的虛數(shù)(在數(shù)學(xué)意義上)。去相關(guān)單元40'可執(zhí)行上文所列的計(jì)算,使得所得的S信號(hào)和D信號(hào)表示左音頻信號(hào)和右音頻信號(hào)(或換句話說,立體聲音頻信號(hào))。在一些此類情境中,去相關(guān)單元40'可輸出T信號(hào)和Q信號(hào)作為經(jīng)去相關(guān)的HOA系數(shù)47"的一部分,但當(dāng)T信號(hào)和Q信號(hào)再現(xiàn)給立體聲揚(yáng)聲器幾何布置(或換句話說,立體聲揚(yáng)聲器配置)時(shí),接收位流21的解碼裝置可不處理所述T信號(hào)和Q信號(hào)。在實(shí)例中,HOA系數(shù)47'可表示將在單聲道音頻再現(xiàn)系統(tǒng)上再現(xiàn)的聲場(chǎng)。去相關(guān)單元40'可輸出S信號(hào)和D信號(hào)作為經(jīng)去相關(guān)的HOA系數(shù)47"的一部分,且接收位流21的解碼裝置可組合(或“混合”)S信號(hào)和D信號(hào)以形成將以單聲道音頻格式再現(xiàn)和/或輸出的音頻信號(hào)。在這些實(shí)例中,解碼裝置和/或再現(xiàn)裝置可以各種方式恢復(fù)單聲道音頻信號(hào)。一個(gè)實(shí)例是通過混合左信號(hào)與右信號(hào)(由S信號(hào)和D信號(hào)表示)。另一實(shí)例是通過應(yīng)用UHJ矩陣(或基于相位的變換)以解碼W信號(hào)(在下文對(duì)于圖5更詳細(xì)地論述)。通過應(yīng)用UHJ矩陣(或基于相位的變換)產(chǎn)生呈S信號(hào)和D信號(hào)形式的固有左信號(hào)和固有右信號(hào),去相關(guān)單元40'可實(shí)施本發(fā)明的技術(shù)以與應(yīng)用其它去相關(guān)變換(例如在MPEG-H標(biāo)準(zhǔn)中描述的模式矩陣)的技術(shù)相比提供潛在優(yōu)點(diǎn)和/或潛在改進(jìn)。在各種實(shí)例中,去相關(guān)單元40'可基于所接收的HOA系數(shù)47'的位速率,應(yīng)用不同的去相關(guān)變換。舉例來說,在其中HOA系數(shù)47'表示四信道輸入的情境中,去相關(guān)單元40'可應(yīng)用上文所描述的UHJ矩陣(或基于相位的變換)。更具體來說,基于HOA系數(shù)47'表示四信道輸入,去相關(guān)單元40'可應(yīng)用4×4UHJ矩陣(或基于相位的變換)。舉例來說,4×4矩陣可正交于HOA系數(shù)47'的四信道輸入。換句話說,在HOA系數(shù)47'表示更少數(shù)目個(gè)信道(例如,四個(gè))的例子中,去相關(guān)單元40'可應(yīng)用UHJ矩陣作為選定去相關(guān)變換,以將HOA信號(hào)47'的背景信號(hào)去相關(guān)以獲得經(jīng)去相關(guān)的HOA系數(shù)47"。根據(jù)此實(shí)例,如果HOA系數(shù)47'表示更大數(shù)目個(gè)信道(例如,九個(gè)),那么去相關(guān)單元40'可應(yīng)用不同于UHJ矩陣(或基于相位的變換)的去相關(guān)變換。舉例來說,在其中HOA系數(shù)47'表示九信道輸入的情境中,去相關(guān)單元40'可應(yīng)用模式矩陣(例如,如在MPEG-H標(biāo)準(zhǔn)中所描述),以將HOA系數(shù)47'去相關(guān)。在其中HOA系數(shù)47'表示九信道輸入的實(shí)例中,去相關(guān)單元40'可應(yīng)用9×9模式矩陣以獲得經(jīng)去相關(guān)的HOA系數(shù)47"。繼而,音頻編碼裝置20的各個(gè)組件(例如心理聲學(xué)音頻譯碼器40)可根據(jù)AAC或USAC對(duì)經(jīng)去相關(guān)的HOA系數(shù)47"以感知方式進(jìn)行譯碼。去相關(guān)單元40'可應(yīng)用相移去相關(guān)變換(例如,在四信道輸入的情況下,為UHJ矩陣或基于相位的變換),以優(yōu)化針對(duì)HOA的AAC/USAC譯碼。在其中HOA系數(shù)47'(以及借此,經(jīng)去相關(guān)的HOA系數(shù)47")表示將在立體聲再現(xiàn)系統(tǒng)上再現(xiàn)的音頻數(shù)據(jù)的實(shí)例中,去相關(guān)單元40'可應(yīng)用本發(fā)明的技術(shù)以基于AAC和USAC是經(jīng)相對(duì)地定向的立體聲音頻數(shù)據(jù)(或針對(duì)其經(jīng)優(yōu)化)而改進(jìn)或優(yōu)化壓縮。將理解,在其中經(jīng)能量補(bǔ)償?shù)腍OA系數(shù)47'包含前景信道的情境中,以及在其中經(jīng)能量補(bǔ)償?shù)腍OA系數(shù)47'不包含任何前景信道的情境中,去相關(guān)單元40'可應(yīng)用本文中所描述的技術(shù)。作為一個(gè)實(shí)例,在其中經(jīng)能量補(bǔ)償?shù)腍OA系數(shù)47'包含零(0)個(gè)前景信道和四個(gè)(4)背景信道的情境(例如,更低/更小位速率的情境)中,去相關(guān)單元40'可應(yīng)用上文所描述的技術(shù)和/或計(jì)算。在一些實(shí)例中,去相關(guān)單元40'可致使位流產(chǎn)生單元42用信號(hào)發(fā)送指示去相關(guān)單元40'將去相關(guān)變換應(yīng)用于HOA系數(shù)47'的一或多個(gè)語法元素作為基于向量的位流21的一部分。通過將此指示提供到解碼裝置,去相關(guān)單元40'可使得解碼裝置能夠?qū)OA域中的音頻數(shù)據(jù)執(zhí)行互逆去相關(guān)變換。在一些實(shí)例中,去相關(guān)單元40'可致使位流產(chǎn)生單元42用信號(hào)發(fā)送指示應(yīng)用哪一去相關(guān)變換(例如UHJ矩陣(或其它基于相位的變換)或模式矩陣)的語法元素。去相關(guān)單元40'可將基于相位的變換應(yīng)用于能量補(bǔ)償環(huán)境HOA系數(shù)47'。用于CAMB(k-1)的第一OMINHOA系數(shù)序列的基于相位的變換定義如下其中系數(shù)d如在表1中定義,信號(hào)幀S(k-2)和M(k-2)定義如下S(k-2)=A+90(k-2)+d(6)·cAMB,2(k-2)M(k-2)=d(4)·cAMB,1(k-2)+d(5)·cAMB,4(k-2)且A+90(k-2)和B+90(k-2)是+90度相移信號(hào)A和B的幀,定義如下A(k-2)=d(0)·cAMB,LOW,1(k-2)+d(1)·cAMB,4(k-2)B(k-2)=d(2)·cAMB,LOW,1(k-2)+d(3)·cAMB,4(k-2)。因此定義針對(duì)CP,AMB(k-1)的第一OMINHOA系數(shù)序列的基于相位的變換。所描述的變換可引入一個(gè)幀的延遲。在上文中,xAMB,LOW,1(k-2)到xAMB,LOW,4(k-2)可對(duì)應(yīng)于經(jīng)去相關(guān)的環(huán)境HOA系數(shù)47”。在上述方程式中,變化的CAMB,1(k)變量標(biāo)示對(duì)應(yīng)于具有(階數(shù):子階數(shù))為(0:0)的球形基底函數(shù)的第k幀的HOA系數(shù),其還可被稱作‘W’信道或分量。變化的CAMB,2(k)變量標(biāo)示對(duì)應(yīng)于具有(階數(shù):子階數(shù))為(1:-1)的球形基底函數(shù)的第k幀的HOA系數(shù),其還可被稱作‘Y’信道或分量。變化的CAMB,3(k)變量標(biāo)示對(duì)應(yīng)于具有(階數(shù):子階數(shù))為(1:0)的球形基底函數(shù)的第k幀的HOA系數(shù),其還可被稱作‘Z’信道或分量。變化的CAMB,4(k)變量標(biāo)示對(duì)應(yīng)于具有(階數(shù):子階數(shù))為(1:1)的球形基底函數(shù)的第k幀的HOA系數(shù),其還可被稱作‘X’信道或分量。CAMB,1(k)到CAMB,3(k)可對(duì)應(yīng)于環(huán)境HOA系數(shù)47'。下文的表1說明可由去相關(guān)單元40使用以執(zhí)行基于相位的變換的系數(shù)的實(shí)例。nd(n)00.3420200999999999910.4162992733504428120.1431999999999999930.5317025735001352840.9396925999999999950.1515205365090818460.5351739903636075870.5773502691896258480.9406040612287403090.500000000000000表1用于基于相位的變換的系數(shù)在一些實(shí)例中,音頻編碼裝置20的各個(gè)組件(例如位流產(chǎn)生單元42)可經(jīng)配置以僅傳輸針對(duì)較低目標(biāo)位速率(例如,128K或256K的目標(biāo)位速率)的一階HOA表示。根據(jù)一些此類實(shí)例,音頻編碼裝置20(或其組件,例如位流產(chǎn)生單元42)可經(jīng)配置以丟棄高階HOA系數(shù)(例如,具有大于一階(或換句話說,N>1)的階數(shù)的系數(shù))。然而,在其中音頻編碼裝置20確定目標(biāo)位速率相對(duì)較高的實(shí)例中,音頻編碼裝置20(例如,位流產(chǎn)生單元42)可分離前景信道與背景信道,且可分配位(例如,以較大量)給前景信道。包含于音頻編碼裝置20內(nèi)的心理聲學(xué)音頻譯碼器單元40可表示心理聲學(xué)音頻譯碼器的多個(gè)例子,所述例子中的每一者用以編碼經(jīng)去相關(guān)的HOA系數(shù)47"和經(jīng)內(nèi)插的nFG信號(hào)49'中的每一者的不同音頻對(duì)象或HOA信道以產(chǎn)生經(jīng)編碼的環(huán)境HOA系數(shù)59和經(jīng)編碼的nFG信號(hào)61。心理聲學(xué)音頻譯碼器單元40可將經(jīng)編碼的環(huán)境HOA系數(shù)59和經(jīng)編碼的nFG信號(hào)61輸出到位流產(chǎn)生單元42。包含于音頻編碼裝置20內(nèi)的位流產(chǎn)生單元42表示將數(shù)據(jù)格式化以符合已知格式(可指解碼裝置已知的格式),借此產(chǎn)生基于向量的位流21的單元。換句話說,位流21可表示已按上文所描述的方式進(jìn)行編碼的經(jīng)編碼音頻數(shù)據(jù)。在一些實(shí)例中,位流產(chǎn)生單元42可表示可接收經(jīng)譯碼前景V[k]向量57、經(jīng)編碼環(huán)境HOA系數(shù)59、經(jīng)編碼nFG信號(hào)61和背景信道信息43的多路復(fù)用器。位流產(chǎn)生單元42接著可基于經(jīng)譯碼前景V[k]向量57、經(jīng)編碼環(huán)境HOA系數(shù)59、經(jīng)編碼nFG信號(hào)61和背景信道信息43產(chǎn)生位流21。以此方式,位流產(chǎn)生單元42可借此規(guī)定位流中21的向量57以獲得位流21。位流21可包含主要或主位流以及一或多個(gè)旁側(cè)信道位流。盡管未在圖3的實(shí)例中示出,但音頻編碼裝置20還可包含位流輸出單元,所述位流輸出單元基于是將使用基于方向的合成還是基于向量的合成對(duì)當(dāng)前幀進(jìn)行編碼而切換從音頻編碼裝置20輸出的位流(例如,在基于方向的位流21與基于向量的位流21之間切換)。位流輸出單元可基于由內(nèi)容分析單元26輸出的指示執(zhí)行基于方向的合成(作為檢測(cè)到HOA系數(shù)11是從合成音頻對(duì)象產(chǎn)生的結(jié)果)還是執(zhí)行基于向量的合成(作為檢測(cè)到HOA系數(shù)經(jīng)記錄的結(jié)果)的語法元素執(zhí)行所述切換。位流輸出單元可指定正確的標(biāo)頭語法以指示用于當(dāng)前幀以及位流21中的相應(yīng)者的切換或當(dāng)前編碼。此外,如上文所提到,聲場(chǎng)分析單元44可標(biāo)識(shí)BGTOT環(huán)境HOA系數(shù)47,所述系數(shù)可逐幀改變(但有時(shí)BGTOT可跨越兩個(gè)或更多個(gè)鄰近(在時(shí)間上)幀保持恒定或相同)。BGTOT的改變可導(dǎo)致在經(jīng)減少前景V[k]向量55中表達(dá)的系數(shù)的改變。BGTOT的改變可導(dǎo)致背景HOA系數(shù)(其也可被稱作“環(huán)境HOA系數(shù)”)逐幀改變(但再次,BGTOT有時(shí)可跨越兩個(gè)或更多個(gè)鄰近(在時(shí)間上)幀保持恒定或相同)。所述改變通常導(dǎo)致聲場(chǎng)的各方面的能量改變,所述能量改變由額外環(huán)境HOA系數(shù)的添加或移除以及系數(shù)從減少的前景V[k]向量55的對(duì)應(yīng)移除或系數(shù)到減少的前景V[k]向量55的添加來表示。因此,聲場(chǎng)分析單元44可進(jìn)一步確定環(huán)境HOA系數(shù)何時(shí)從幀到幀改變,并且產(chǎn)生指示環(huán)境HOA系數(shù)在用于表示聲場(chǎng)的環(huán)境分量方面的改變的標(biāo)志或其它語法元素(其中所述改變也可被稱作環(huán)境HOA系數(shù)的“轉(zhuǎn)變”或環(huán)境HOA系數(shù)的“轉(zhuǎn)變”)。特定來說,系數(shù)減少單元46可產(chǎn)生標(biāo)志(其可表示為AmbCoeffTransition標(biāo)志或AmbCoeffIdxTransition標(biāo)志),從而將所述標(biāo)志提供到位流產(chǎn)生單元42,使得可將所述標(biāo)志包含在位流21中(可能地作為旁側(cè)信道信息的部分)。除指定環(huán)境系數(shù)轉(zhuǎn)變標(biāo)志之外,系數(shù)減少單元46還可修改產(chǎn)生減少的前景V[k]向量55的方式。在一個(gè)實(shí)例中,在確定環(huán)境HOA環(huán)境系數(shù)中的一者在當(dāng)前幀期間處于轉(zhuǎn)變中時(shí),系數(shù)減少單元46可指定減少的前景V[k]向量55的V向量中的每一者的向量系數(shù)(其也可被稱作“向量元素”或“元素”),其對(duì)應(yīng)于處于轉(zhuǎn)變中的環(huán)境HOA系數(shù)。此外,處于轉(zhuǎn)變中的環(huán)境HOA系數(shù)可添加到背景系數(shù)的BGTOT總數(shù)目或從背景系數(shù)的BGTOT總數(shù)目中移除。因此,背景系數(shù)的總數(shù)目的所得改變影響環(huán)境HOA系數(shù)是否包含于位流中,以及在上文所描述的第二和第三配置模式中是否針對(duì)位流中所指定的V向量包含V向量的對(duì)應(yīng)元素。關(guān)于系數(shù)減少單元46可如何規(guī)定減少的前景V[k]向量55以克服能量改變的更多信息提供于2015年1月12日申請(qǐng)的標(biāo)題為“環(huán)境高階立體混響系數(shù)的轉(zhuǎn)變(TRANSITIONINGOFAMBIENTHIGHER-ORDERAMBISONICCOEFFICIENTS)”的第14/594,533號(hào)美國(guó)申請(qǐng)案中。因此,音頻編碼裝置20可表示用于壓縮音頻的裝置的實(shí)例,所述裝置經(jīng)配置以將去相關(guān)變換應(yīng)用于環(huán)境立體混響系數(shù)以獲得環(huán)境立體混響系數(shù)的經(jīng)去相關(guān)表示,環(huán)境HOA系數(shù)已從多個(gè)高階立體混響系數(shù)中提取并且表示由所述多個(gè)高階立體混響系數(shù)描述的聲場(chǎng)的背景分量,其中所述多個(gè)高階立體混響系數(shù)中的至少一者與具有大于一的階數(shù)的球形基底函數(shù)相關(guān)聯(lián)。在一些實(shí)例中,為了應(yīng)用去相關(guān)變換,所述裝置經(jīng)配置以將UHJ矩陣應(yīng)用于環(huán)境立體混響系數(shù)。在一些實(shí)例中,所述裝置經(jīng)進(jìn)一步配置以根據(jù)N3D(全三維)歸一化對(duì)UHJ矩陣進(jìn)行歸一化。在一些實(shí)例中,所述裝置經(jīng)進(jìn)一步配置以根據(jù)SN3D歸一化(施密特半歸一化)對(duì)UHJ矩陣進(jìn)行歸一化。在一些實(shí)例中,環(huán)境立體混響系數(shù)是與具有階數(shù)零或階數(shù)一的球形基底函數(shù)相關(guān)聯(lián),且為了將UHJ矩陣應(yīng)用于環(huán)境立體混響系數(shù),所述裝置經(jīng)配置以對(duì)于環(huán)境立體混響系數(shù)的至少一個(gè)子集執(zhí)行UHJ矩陣的標(biāo)量乘法。在一些實(shí)例中,為了應(yīng)用去相關(guān)變換,所述裝置經(jīng)配置以將模式矩陣應(yīng)用于環(huán)境立體混響系數(shù)。根據(jù)一些實(shí)例,為了應(yīng)用去相關(guān)變換,所述裝置經(jīng)配置以從經(jīng)去相關(guān)的環(huán)境立體混響系數(shù)獲得左信號(hào)和右信號(hào)。根據(jù)一些實(shí)例,所述裝置經(jīng)進(jìn)一步配置以用信號(hào)發(fā)送經(jīng)去相關(guān)的環(huán)境立體混響系數(shù)以及一或多個(gè)前景信道。根據(jù)一些實(shí)例,為了用信號(hào)發(fā)送經(jīng)去相關(guān)的環(huán)境立體混響系數(shù)以及一或多個(gè)前景信道,所述裝置經(jīng)配置以響應(yīng)于確定目標(biāo)位速率符合或超過預(yù)定閾值而用信號(hào)發(fā)送經(jīng)去相關(guān)的環(huán)境立體混響系數(shù)以及一或多個(gè)前景信道。在一些實(shí)例中,所述裝置經(jīng)進(jìn)一步配置以在不用信號(hào)發(fā)送任何前景信道的情況下用信號(hào)發(fā)送經(jīng)去相關(guān)的環(huán)境立體混響系數(shù)。在一些實(shí)例中,為了在不用信號(hào)發(fā)送任何前景信道的情況下用信號(hào)發(fā)送經(jīng)去相關(guān)的環(huán)境立體混響系數(shù),所述裝置經(jīng)配置以響應(yīng)于確定目標(biāo)位速率低于預(yù)定閾值而在不用信號(hào)發(fā)送任何前景信道的情況下用信號(hào)發(fā)送經(jīng)去相關(guān)的環(huán)境立體混響系數(shù)。在一些實(shí)例中,所述裝置經(jīng)進(jìn)一步配置以用信號(hào)發(fā)送對(duì)去相關(guān)變換已應(yīng)用于環(huán)境立體混響系數(shù)的指示。在一些實(shí)例中,所述裝置進(jìn)一步包含經(jīng)配置以捕獲將被壓縮的音頻數(shù)據(jù)的麥克風(fēng)陣列。圖4是更詳細(xì)地說明圖2的音頻解碼裝置24的框圖。如在圖4的實(shí)例中所展示,音頻解碼裝置24可包含提取單元72、基于方向的重構(gòu)單元90、基于向量的重構(gòu)單元92以及再相關(guān)單元81。盡管下文進(jìn)行描述,但關(guān)于音頻解碼裝置24和解壓縮或以其它方式解碼HOA系數(shù)的各種方面的更多信息可在2014年5月29日申請(qǐng)的標(biāo)題為“用于聲場(chǎng)的經(jīng)分解表示的內(nèi)插(INTERPOLATIONFORDECOMPOSEDREPRESENTATIONSOFASOUNDFIELD)”的第WO2014/194099號(hào)國(guó)際專利申請(qǐng)公開案中獲得。提取單元72可表示經(jīng)配置以接收位流21并提取HOA系數(shù)11的各種經(jīng)編碼版本(例如,基于方向的經(jīng)編碼版本或基于向量的經(jīng)編碼版本)的單元。提取單元72可從以上所述確定指示HOA系數(shù)11是經(jīng)由各種基于方向的版本還是基于向量的版本經(jīng)編碼的語法元素。當(dāng)執(zhí)行基于方向的編碼時(shí),提取單元72可提取HOA系數(shù)11的基于方向的版本和與所述經(jīng)編碼版本相關(guān)聯(lián)的語法元素(其在圖4的實(shí)例中表示為基于方向的信息91),從而將基于方向的信息91傳遞到基于方向的重構(gòu)單元90?;诜较虻闹貥?gòu)單元90可表示經(jīng)配置以基于所述基于方向的信息91重構(gòu)呈HOA系數(shù)11'形式的HOA系數(shù)的單元。下文描述位流內(nèi)的位流和語法元素的布置。當(dāng)語法元素指示HOA系數(shù)11使用基于向量的合成進(jìn)行編碼時(shí),提取單元72可提取經(jīng)譯碼前景V[k]向量57(其可包含經(jīng)譯碼權(quán)重57和/或索引63或經(jīng)標(biāo)量量化的V向量)、經(jīng)編碼環(huán)境HOA系數(shù)59和對(duì)應(yīng)的音頻對(duì)象61(其也可被稱作經(jīng)編碼nFG信號(hào)61)。音頻對(duì)象61各自對(duì)應(yīng)于向量57中的一者。提取單元72可將經(jīng)譯碼前景V[k]向量57傳遞到V向量重構(gòu)單元74,且將經(jīng)編碼環(huán)境HOA系數(shù)59以及經(jīng)編碼nFG信號(hào)61提供到心理聲學(xué)解碼單元80。V向量重構(gòu)單元74可表示經(jīng)配置以從經(jīng)編碼前景V[k]向量57重構(gòu)V向量的單元。V向量重構(gòu)單元74可以與量化單元52互逆的方式操作。心理聲學(xué)解碼單元80可以與圖3的實(shí)例中所展示的心理聲學(xué)音頻譯碼器單元40互逆的方式操作,以便對(duì)經(jīng)編碼環(huán)境HOA系數(shù)59和經(jīng)編碼nFG信號(hào)61進(jìn)行解碼且借此產(chǎn)生經(jīng)能量補(bǔ)償?shù)沫h(huán)境HOA系數(shù)47'和經(jīng)內(nèi)插的nFG信號(hào)49'(其也可被稱作經(jīng)內(nèi)插的nFG音頻對(duì)象49')。心理聲學(xué)解碼單元80可將經(jīng)能量補(bǔ)償?shù)沫h(huán)境HOA系數(shù)47'傳遞到再相關(guān)單元81且將nFG信號(hào)49'傳遞到前景制訂單元78。繼而,再相關(guān)單元81可將一或多個(gè)再相關(guān)變換應(yīng)用于經(jīng)能量補(bǔ)償?shù)沫h(huán)境HOA系數(shù)47'以獲得一或多個(gè)再相關(guān)的HOA系數(shù)47"(或相關(guān)的HOA系數(shù)47"),并且可將相關(guān)的HOA系數(shù)47"傳遞到HOA系數(shù)制訂單元82(任選地,通過淡化單元770)。類似于以上的描述,相對(duì)于音頻編碼裝置20的去相關(guān)單元40',再相關(guān)單元81可實(shí)施本發(fā)明的技術(shù)以減少經(jīng)能量補(bǔ)償?shù)沫h(huán)境HOA系數(shù)47'的背景信道之間的相關(guān)性,從而減少或減低噪聲去掩蔽。在其中再相關(guān)單元81應(yīng)用UHJ矩陣(例如,逆UHJ矩陣)作為選定再相關(guān)變換的實(shí)例中,再相關(guān)單元81可改進(jìn)壓縮率并且通過減少數(shù)據(jù)處理操作而節(jié)省計(jì)算資源。在一些實(shí)例中,基于向量的位流21可包含指示在編碼期間應(yīng)用去相關(guān)變換的一或多個(gè)語法元素。在基于向量的位流21中包含此類語法元素可使再相關(guān)單元81能夠?qū)?jīng)能量補(bǔ)償?shù)腍OA系數(shù)47'執(zhí)行互逆去相關(guān)(例如,相關(guān)或再相關(guān))變換。在一些實(shí)例中,信號(hào)語法元素可指示應(yīng)用哪一去相關(guān)變換,例如UHJ矩陣或模式矩陣,借此使得再相關(guān)單元81能夠選擇適當(dāng)再相關(guān)變換應(yīng)用于經(jīng)能量補(bǔ)償?shù)腍OA系數(shù)47'。在其中基于向量的重構(gòu)單元92將HOA系數(shù)11'輸出到包括立體聲系統(tǒng)的再現(xiàn)系統(tǒng)的實(shí)例中,再相關(guān)單元81可處理S信號(hào)和D信號(hào)(例如,固有左信號(hào)和固有右信號(hào))以產(chǎn)生再相關(guān)的HOA系數(shù)47"。舉例來說,因?yàn)镾信號(hào)和D信號(hào)表示固有左信號(hào)和固有右信號(hào),所以再現(xiàn)系統(tǒng)可使用S信號(hào)和D信號(hào)作為兩個(gè)立體聲輸出流。在其中重構(gòu)單元92將HOA系數(shù)11'輸出到包括單聲道音頻系統(tǒng)的再現(xiàn)系統(tǒng)的實(shí)例中,再現(xiàn)系統(tǒng)可組合或混合S信號(hào)與D信號(hào)(如在HOA系數(shù)11'中表示)以獲得單聲道音頻輸出以用于回放。在單聲道音頻系統(tǒng)的實(shí)例中,再現(xiàn)系統(tǒng)可將經(jīng)混合的單聲道音頻輸出添加到一或多個(gè)前景信道(在存在任何前景信道的情況下)以產(chǎn)生音頻輸出。相對(duì)于一些現(xiàn)有的具有UHJ能力的編碼器,以相位振幅矩陣處理信號(hào)以恢復(fù)類似于B格式的信號(hào)集合。在大多數(shù)情況下,所述信號(hào)將實(shí)際上為B格式,但在2信道UHJ的情況下,沒有充足的信息可供用以能夠重構(gòu)正確的B格式信號(hào),而是呈現(xiàn)類似于B格式信號(hào)的特性的信號(hào)。所述信息接著經(jīng)由雪夫型(Shelf)濾波器集合傳遞到產(chǎn)生揚(yáng)聲器饋送的振幅矩陣,所述雪夫型(Shelf)濾波器集合改進(jìn)解碼器在較小收聽環(huán)境(其在較大規(guī)模的應(yīng)用中可被省略)中的準(zhǔn)確性和性能。立體混響經(jīng)設(shè)計(jì)以符合實(shí)際房間(例如,起居室)和實(shí)用揚(yáng)聲器位置的要求:很多此類房間是矩形的,因此基礎(chǔ)系統(tǒng)經(jīng)設(shè)計(jì)以對(duì)去往矩形中的四個(gè)擴(kuò)音器進(jìn)行解碼,其中側(cè)變長(zhǎng)度介于1:2(寬度是長(zhǎng)度的兩倍)與2:1(長(zhǎng)度是寬度的兩倍)之間,因此符合大部分此類房間的要求。通常提供布局控制以允許解碼器針對(duì)擴(kuò)音器位置經(jīng)配置。布局控制是不同于其它環(huán)繞聲系統(tǒng)的立體混響回放的方面:解碼器可針對(duì)揚(yáng)聲器陣列的大小和布局經(jīng)具體配置。布局控制可呈旋紐、2路(1:2、2:1)或3路(1:2、1:1、2:1)開關(guān)的形式。四個(gè)揚(yáng)聲器是水平環(huán)繞解碼所需的最小值,且雖然四個(gè)揚(yáng)聲器布局可適用于數(shù)種收聽環(huán)境,但較大空間可需要更多揚(yáng)聲器以給出全環(huán)繞定位。再相關(guān)單元81可對(duì)于應(yīng)用UHJ矩陣(例如,逆UHJ矩陣或基于相位的逆變換)作為再相關(guān)變換執(zhí)行的計(jì)算的實(shí)例列出如下:UHJ解碼:左和右到S和D的轉(zhuǎn)換:S=左+右D=左-右W=(0.982*S)+0.197.*imag(hilbert((0.828*D)+(0.768*T)));X=(0.419*S)-imag(hilbert((0.828*D)+(0.768*T)));Y=(0.796*D)-0.676*T+imag(hilbert(0.187*S));Z=(1.023*Q);在以上計(jì)算的一些實(shí)例實(shí)施方案中,關(guān)于以上計(jì)算的假設(shè)可包含以下各項(xiàng):HOA背景信道是1階立體混響,F(xiàn)uMa經(jīng)歸一化,按照立體混響信道編號(hào)次序W(a00)、X(a11)、Y(a11-)、Z(a10)。再相關(guān)單元81可對(duì)于應(yīng)用UHJ矩陣(或基于相位的逆變換)作為再相關(guān)變換執(zhí)行的計(jì)算的實(shí)例列出如下:UHJ解碼:左和右到S和D的轉(zhuǎn)換:左和右到S和D的轉(zhuǎn)換:S=左+右;D=左-右;h1=imag(hilbert(1.014088753512236*D+T));h2=imag(hilbert(0.229027290950227*S));W=0.982*S+0.160849826442762*h1;X=0.513168101113076*S-h1;Y=0.974896917627705*D-0.880208333333333*T+h2;Z=Q;在以上計(jì)算的一些實(shí)施方案中,關(guān)于以上計(jì)算的假設(shè)可包含以下各項(xiàng):HOA背景信道是1階立體混響,N3D(或“全三維”)經(jīng)歸一化,按照立體混響信道編號(hào)次序W(a00)、X(a11)、Y(a11-)、Z(a10)。盡管本文中關(guān)于N3D歸一化進(jìn)行描述,但應(yīng)了解,所述實(shí)例計(jì)算也可應(yīng)用于經(jīng)SN3D歸一化(或“經(jīng)施密特半歸一化”)的HOA背景信道。如上文關(guān)于圖4所描述,N3D與SN3D歸一化可在所使用的比例縮放因子方面不同。上文關(guān)于圖4描述在N3D歸一化中使用的比例縮放因子的實(shí)例表示。上文關(guān)于圖4描述在SN3D歸一化中使用的加權(quán)系數(shù)的實(shí)例表示。在一些實(shí)例中,經(jīng)能量補(bǔ)償?shù)腍OA系數(shù)47'可表示僅水平布局,例如不包含任何垂直信道的音頻數(shù)據(jù)。在這些實(shí)例中,再相關(guān)單元81可不對(duì)于以上的Z信號(hào)執(zhí)行計(jì)算,因?yàn)閆信號(hào)表示垂直方向音頻數(shù)據(jù)。替代地,在這些實(shí)例中,再相關(guān)單元81可僅對(duì)W、X和Y信號(hào)執(zhí)行以上計(jì)算,因?yàn)閃、X和Y信號(hào)表示水平方向數(shù)據(jù)。在其中經(jīng)能量補(bǔ)償?shù)腍OA系數(shù)47'表示將在單聲道音頻再現(xiàn)系統(tǒng)上再現(xiàn)的音頻數(shù)據(jù)的一些實(shí)例中,再相關(guān)單元81可僅從以上計(jì)算得到W信號(hào)。更具體來說,因?yàn)樗肳信號(hào)表示單聲道音頻數(shù)據(jù),所以W信號(hào)可提供所必要的全部數(shù)據(jù),其中經(jīng)能量補(bǔ)償?shù)腍OA系數(shù)47'表示將以單聲道音頻格式再現(xiàn)的數(shù)據(jù),或其中再現(xiàn)系統(tǒng)包括單聲道音頻系統(tǒng)。類似于如上文關(guān)于音頻編碼裝置20的去相關(guān)單元40'所描述,在實(shí)例中,再相關(guān)單元81可在其中經(jīng)能量補(bǔ)償?shù)腍OA系數(shù)47'包含較少數(shù)目個(gè)背景信道的情境中應(yīng)用UHJ矩陣(或逆UHJ矩陣或基于相位的逆變換),但可在經(jīng)能量補(bǔ)償?shù)腍OA系數(shù)47'包含較大數(shù)目個(gè)背景信道的情境中應(yīng)用模式矩陣或逆模式矩陣(例如,如在MPEG-H標(biāo)準(zhǔn)中所描述)。將理解,在其中經(jīng)能量補(bǔ)償?shù)腍OA系數(shù)47'包含前景信道的情境中,以及在其中經(jīng)能量補(bǔ)償?shù)腍OA系數(shù)47'不包含任何前景信道的情境中,再相關(guān)單元81可應(yīng)用本文中所描述的技術(shù)。作為一個(gè)實(shí)例,在其中經(jīng)能量補(bǔ)償?shù)腍OA系數(shù)47'包含零(0)個(gè)前景信道和八(8)個(gè)背景信道的情境(例如,更低/更小位速率的情境)中,再相關(guān)單元81可應(yīng)用上文所描述的技術(shù)和/或計(jì)算。音頻解碼裝置24的各個(gè)組件(例如再相關(guān)單元81)可為用以確定將兩種處理方法中的哪一個(gè)應(yīng)用于去相關(guān)的語法元素,例如標(biāo)志UsePhaseShiftDecorr。在其中去相關(guān)單元40'將空間變換用于去相關(guān)的例子中,再相關(guān)單元81可確定UsePhaseShiftDecorr標(biāo)志設(shè)置為值零。在其中再相關(guān)單元81確定UsePhaseShiftDecorr標(biāo)志設(shè)置為值一的情況下,再相關(guān)單元81可確定將使用基于相位的變換執(zhí)行再相關(guān)。如果標(biāo)志UsePhaseShiftDecorr具有值1,那么應(yīng)用以下處理以重構(gòu)環(huán)境HOA分量的前四個(gè)系數(shù)序列其中如在下文表1中定義的系數(shù)c以及A+90(k)和B+90(k)是+90度相移信號(hào)A和B的幀,定義如下A(k)=c(0)·[cI,AMB,1(k)-cI,AMB,2(k)],B(k)=c(1)·[cI,AMB,1(k)+cI,AMB,2(k)]。下文的表2說明去相關(guān)單元40'可用以實(shí)施基于相位的變換的實(shí)例系數(shù)。nc(n)01.014088753512235610.2290272909502271420.9819999999999999830.1608498264427620540.5131681011130757650.974896917627704816-0.88020833333333337表2基于相位的變換的系數(shù)在上述方程式中,變化的CAMB,1(k)變量標(biāo)示對(duì)應(yīng)于具有(階數(shù):子階數(shù))為(0:0)的球形基底函數(shù)的第k幀的HOA系數(shù),其還可被稱作‘W’信道或分量。變化的CAMB,2(k)變量標(biāo)示對(duì)應(yīng)于具有(階數(shù):子階數(shù))為(1:-1)的球形基底函數(shù)的第k幀的HOA系數(shù),其還可被稱作‘Y’信道或分量。變化的CAMB,3(k)變量標(biāo)示對(duì)應(yīng)于具有(階數(shù):子階數(shù))為(1:0)的球形基底函數(shù)的第k幀的HOA系數(shù),其還可被稱作‘Z’信道或分量。變化的CAMB,4(k)變量標(biāo)示對(duì)應(yīng)于具有(階數(shù):子階數(shù))為(1:1)的球形基底函數(shù)的第k幀的HOA系數(shù),其還可被稱作‘X’信道或分量。CAMB,1(k)到CAMB,3(k)可對(duì)應(yīng)于環(huán)境HOA系數(shù)47'。上文的記法[CI,AMB,1(k)+CI,AMB,2(k)]標(biāo)示可替代地稱為‘S’的項(xiàng),其等效于左信道加右信道。CI,AMB,1(k)變量標(biāo)示作為UHJ編碼的結(jié)果產(chǎn)生的左信道,而CI,AMB,2(k)變量標(biāo)示作為UHJ編碼的結(jié)果產(chǎn)生的右信道。下標(biāo)‘I’記法標(biāo)示對(duì)應(yīng)信道已經(jīng)與其它環(huán)境信道去相關(guān)(例如,通過應(yīng)用UHJ矩陣或基于相位的變換)。[CI,AMB,1(k)-CI,AMB,2(k)]記法標(biāo)示在本發(fā)明通篇中被稱為‘D’的項(xiàng),其表示左信道減右信道。CI,AMB,3(k)變量標(biāo)示在本發(fā)明通篇中被稱為變量‘T’的項(xiàng)。CI,AMB,4(k)變量標(biāo)示在本發(fā)明通篇中被稱為變量‘Q’的項(xiàng)。A+90(k)記法標(biāo)示c(0)乘以S的正90度相移(其還在本發(fā)明通篇中由變量‘h1’標(biāo)示)。B+90(k)記法標(biāo)示c(1)乘以D的正90度相移(其還在本發(fā)明通篇中由變量‘h2’標(biāo)示)??臻g-時(shí)間內(nèi)插單元76可以類似于上文關(guān)于空間-時(shí)間內(nèi)插單元50所描述的方式操作。空間-時(shí)間內(nèi)插單元76可接收經(jīng)減少的前景V[k]向量55k,并且對(duì)于前景V[k]向量55k和經(jīng)減少的前景V[k-1]向量55k-1執(zhí)行空間-時(shí)間內(nèi)插以產(chǎn)生經(jīng)內(nèi)插的前景V[k]向量55k”??臻g-時(shí)間內(nèi)插單元76將經(jīng)內(nèi)插的前景V[k]向量55k”轉(zhuǎn)發(fā)到淡化單元770。提取單元72還可將指示環(huán)境HOA系數(shù)中的一者何時(shí)處于轉(zhuǎn)變中的信號(hào)757輸出到淡化單元770,所述淡化單元接著可確定SHCBG47'(其中SHCBG47'還可標(biāo)示為“環(huán)境HOA信道47'”或“環(huán)境HOA系數(shù)47'”)和經(jīng)內(nèi)插的前景V[k]向量55k”的元素中的何者將淡入或淡出。在一些實(shí)例中,淡化單元770可對(duì)于環(huán)境HOA系數(shù)47'和經(jīng)內(nèi)插的前景V[k]向量55k”的元素中的每一者以相反方式操作。也就是說,淡化單元770可對(duì)于環(huán)境HOA系數(shù)47'中的對(duì)應(yīng)環(huán)境HOA系數(shù)執(zhí)行淡入或淡出或執(zhí)行淡入或淡出兩者,同時(shí)對(duì)于經(jīng)內(nèi)插的前景V[k]向量55k”的元素中的對(duì)應(yīng)元素執(zhí)行淡入或淡出或執(zhí)行淡入和淡出兩者。淡化單元770可將經(jīng)調(diào)整的環(huán)境HOA系數(shù)47”輸出到HOA系數(shù)制訂單元82且將經(jīng)調(diào)整的前景V[k]向量55k”'輸出到前景制訂單元78。在這方面,淡化單元770表示經(jīng)配置以對(duì)于HOA系數(shù)或其衍生物(例如,呈環(huán)境HOA系數(shù)47'和經(jīng)內(nèi)插的前景V[k]向量55k”的元素的形式)的各種方面執(zhí)行淡化操作的單元。前景制訂單元78可表示經(jīng)配置以對(duì)于經(jīng)調(diào)整的前景V[k]向量55k”'和經(jīng)內(nèi)插的nFG信號(hào)49'執(zhí)行矩陣乘法以產(chǎn)生前景HOA系數(shù)65的單元。在這方面,前景制訂單元78可組合音頻對(duì)象49'(其為借以表示經(jīng)內(nèi)插的nFG信號(hào)49'的另一種方式)與向量55k”'以重構(gòu)HOA系數(shù)11'的前景(或換句話說,主導(dǎo))方面。前景制訂單元78可執(zhí)行經(jīng)內(nèi)插的nFG信號(hào)49'與經(jīng)調(diào)整的前景V[k]向量55k”'的矩陣乘法。HOA系數(shù)制訂單元82可表示經(jīng)配置以將前景HOA系數(shù)65與經(jīng)調(diào)整的環(huán)境HOA系數(shù)47”組合以便獲得HOA系數(shù)11'的單元。撇號(hào)記法反映HOA系數(shù)11'可與HOA系數(shù)11類似而非相同。HOA系數(shù)11與11'之間的差異可由歸因于經(jīng)由有損傳輸媒體的傳輸、量化或其它有損操作的損失引起。UHJ是已經(jīng)用以從一階立體混響內(nèi)容創(chuàng)建2信道立體聲流的矩陣變換方法。UHJ在過去用以經(jīng)由FM發(fā)射器發(fā)射立體聲或僅水平環(huán)繞內(nèi)容。然而,應(yīng)了解,UHJ不限于在FM發(fā)射器中的使用。在MPEG-HHOA編碼方案中,可用模式矩陣預(yù)處理HOA背景信道以將HOA背景信道轉(zhuǎn)換成空間域中的正交點(diǎn)。接著經(jīng)由USAC或AAC對(duì)經(jīng)變換信道以感知方式進(jìn)行譯碼。本發(fā)明的技術(shù)通常涉及在對(duì)HOA背景信道進(jìn)行譯碼的應(yīng)用中使用UHJ變換(或基于相位的變換)而非使用此模式矩陣。兩種方法((1)經(jīng)由模式矩陣到空間域中的變換,(2)UHJ變換)通常均涉及減少HOA背景信道之間的的相關(guān)性,所述相關(guān)性可引起經(jīng)解碼聲場(chǎng)內(nèi)的噪聲去掩蔽的(潛在地非所要的)效應(yīng)。因此,在實(shí)例中,音頻解碼裝置24可表示經(jīng)配置以進(jìn)行以下操作的裝置:獲得具有至少一左信號(hào)和右信號(hào)的環(huán)境立體混響系數(shù)的經(jīng)去相關(guān)表示,所述環(huán)境立體混響系數(shù)已從多個(gè)高階立體混響系數(shù)提取并且表示由所述多個(gè)高階立體混響系數(shù)描述的聲場(chǎng)的背景分量,其中所述多個(gè)高階立體混響系數(shù)中的至少一者與具有大于一的階數(shù)的球形基底函數(shù)相關(guān)聯(lián);和基于所述環(huán)境立體混響系數(shù)的經(jīng)去相關(guān)表示而產(chǎn)生揚(yáng)聲器饋送。在一些實(shí)例中,所述裝置經(jīng)進(jìn)一步配置以將再相關(guān)變換應(yīng)用于環(huán)境立體混響系數(shù)的經(jīng)去相關(guān)表示以獲得多個(gè)相關(guān)的環(huán)境立體混響系數(shù)。在一些實(shí)例中,為了應(yīng)用再相關(guān)變換,所述裝置經(jīng)配置以將逆UHJ矩陣(或基于相位的變換)應(yīng)用于環(huán)境立體混響系數(shù)。根據(jù)一些實(shí)例,逆UHJ矩陣(或基于相位的逆變換)已根據(jù)N3D(全三維)歸一化經(jīng)歸一化。根據(jù)一些實(shí)例,逆UHJ矩陣(或基于相位的逆變換)已根據(jù)SN3D歸一化(施密特半歸一化)經(jīng)歸一化。根據(jù)一些實(shí)例,環(huán)境立體混響系數(shù)與具有階數(shù)零或階數(shù)一的球形基底函數(shù)相關(guān)聯(lián),且為了應(yīng)用逆UHJ矩陣(或基于相位的逆變換),所述裝置經(jīng)配置以對(duì)于環(huán)境立體混響系數(shù)的經(jīng)去相關(guān)表示執(zhí)行UHJ矩陣的標(biāo)量乘法。在一些實(shí)例中,為了應(yīng)用再相關(guān)變換,所述裝置經(jīng)配置以將逆模式矩陣應(yīng)用于環(huán)境立體混響系數(shù)的經(jīng)去相關(guān)表示。在一些實(shí)例中,為了產(chǎn)生揚(yáng)聲器饋送,所述裝置經(jīng)配置以基于左信號(hào)產(chǎn)生左揚(yáng)聲器饋送且基于右信號(hào)產(chǎn)生右揚(yáng)聲器饋送,所述左揚(yáng)聲器饋送和揚(yáng)聲器饋送通過立體聲再現(xiàn)系統(tǒng)輸出。在一些實(shí)例中,為了產(chǎn)生揚(yáng)聲器饋送,所述裝置經(jīng)配置以在不將再相關(guān)變換應(yīng)用于所述右信號(hào)和左信號(hào)的情況下,使用左信號(hào)作為左揚(yáng)聲器饋送且使用右信號(hào)作為右揚(yáng)聲器饋送。根據(jù)一些實(shí)例,為了產(chǎn)生揚(yáng)聲器饋送,所述裝置經(jīng)配置以混合左信號(hào)與右信號(hào)以用于由單聲道音頻系統(tǒng)輸出。根據(jù)一些實(shí)例,為了產(chǎn)生揚(yáng)聲器饋送,所述裝置經(jīng)配置以組合相關(guān)的環(huán)境立體混響系數(shù)與一或多個(gè)前景信道。根據(jù)一些實(shí)例,所述裝置經(jīng)進(jìn)一步配置以確定沒有前景信道可用于與相關(guān)的環(huán)境立體混響系數(shù)組合。在一些實(shí)例中,所述裝置經(jīng)進(jìn)一步配置以確定將經(jīng)由單聲道音頻再現(xiàn)系統(tǒng)輸出聲場(chǎng),以及對(duì)包含用于由單聲道音頻再現(xiàn)系統(tǒng)輸出的數(shù)據(jù)的經(jīng)去相關(guān)的高階立體混響系數(shù)的至少一個(gè)子集進(jìn)行解碼。在一些實(shí)例中,所述裝置經(jīng)進(jìn)一步配置以獲得對(duì)環(huán)境立體混響系數(shù)的經(jīng)去相關(guān)表示是通過去相關(guān)變換經(jīng)去相關(guān)的指示。根據(jù)一些實(shí)例,所述裝置進(jìn)一步包含經(jīng)配置以輸出基于環(huán)境立體混響系數(shù)的經(jīng)去相關(guān)表示產(chǎn)生的揚(yáng)聲器饋送的擴(kuò)音器陣列。圖5是說明音頻編碼裝置(例如在圖3的實(shí)例中展示的音頻編碼裝置20)執(zhí)行本發(fā)明中描述的基于向量的合成技術(shù)的各種方面的示范性操作的流程圖。最初,音頻編碼裝置20接收HOA系數(shù)11(106)。音頻編碼裝置20可調(diào)用LIT單元30,其可對(duì)于HOA系數(shù)應(yīng)用LIT以輸出經(jīng)變換的HOA系數(shù)(例如,在SVD的情況下,經(jīng)變換的HOA系數(shù)可包括US[k]向量33和V[k]向量35)(107)。音頻編碼裝置20接下來可調(diào)用參數(shù)計(jì)算單元32以按上文所描述的方式對(duì)于US[k]向量33、US[k-1]向量33、V[k]和/或V[k-1]向量35的任何組合執(zhí)行上文所描述的分析以標(biāo)識(shí)各種參數(shù)。也就是說,參數(shù)計(jì)算單元32可基于對(duì)經(jīng)變換的HOA系數(shù)33/35的分析確定至少一個(gè)參數(shù)(108)。音頻編碼裝置20接著可調(diào)用重排序單元34,所述重排序單元基于所述參數(shù)將經(jīng)變換的HOA系數(shù)(再次在SVD的上下文中,其可指US[k]向量33和V[k]向量35)重排序,以產(chǎn)生經(jīng)重排序的經(jīng)變換HOA系數(shù)33'/35'(或換句話說,US[k]向量33'和V[k]向量35'),如上文所描述(109)。音頻編碼裝置20可在前述操作或后續(xù)操作中的任一者期間還調(diào)用聲場(chǎng)分析單元44。如上文所描述,聲場(chǎng)分析單元44可對(duì)于HOA系數(shù)11和/或經(jīng)變換HOA系數(shù)33/35執(zhí)行聲場(chǎng)分析,以確定前景信道(nFG)45的總數(shù)目、背景聲場(chǎng)(NBG)的階數(shù)以及待發(fā)送的額外BGHOA信道的數(shù)目(nBGa)和索引(i)(其可在圖3的實(shí)例中共同標(biāo)示為背景信道信息43)(109)。音頻編碼裝置20還可調(diào)用背景選擇單元48。背景選擇單元48可基于背景信道信息43確定背景或環(huán)境HOA系數(shù)47(110)。音頻編碼裝置20可進(jìn)一步調(diào)用前景選擇單元36,所述前景選擇單元可基于nFG45(其可表示標(biāo)識(shí)前景向量的一或多個(gè)索引)選擇表示聲場(chǎng)的前景或相異分量的經(jīng)重排序US[k]向量33'和經(jīng)重排序V[k]向量35'(112)。音頻編碼裝置20可調(diào)用能量補(bǔ)償單元38。能量補(bǔ)償單元38可對(duì)于環(huán)境HOA系數(shù)47執(zhí)行能量補(bǔ)償,以補(bǔ)償歸因于由背景選擇單元48移除HOA系數(shù)中的各者而導(dǎo)致的能量損失(114),且借此產(chǎn)生經(jīng)能量補(bǔ)償?shù)沫h(huán)境HOA系數(shù)47'。音頻編碼裝置20還可調(diào)用空間-時(shí)間內(nèi)插單元50。空間-時(shí)間內(nèi)插單元50可對(duì)于經(jīng)重排序的經(jīng)變換HOA系數(shù)33'/35'執(zhí)行空間-時(shí)間內(nèi)插,以獲得經(jīng)內(nèi)插的前景信號(hào)49'(其也可被稱作“經(jīng)內(nèi)插的nFG信號(hào)49'”)和剩余的前景方向信息53(其也可被稱作“V[k]向量53”)(116)。音頻編碼裝置20接著可調(diào)用系數(shù)減少單元46。系數(shù)減少單元46可基于背景信道信息43對(duì)于剩余的前景V[k]向量53執(zhí)行系數(shù)減少,以獲得經(jīng)減少的前景方向信息55(其也可被稱為經(jīng)減少的前景V[k]向量55)(118)。音頻編碼裝置20接著可調(diào)用量化單元52以按上文所描述的方式壓縮經(jīng)減少的前景V[k]向量55且產(chǎn)生經(jīng)譯碼前景V[k]向量57(120)。音頻編碼裝置20還可調(diào)用去相關(guān)單元40'以應(yīng)用相移去相關(guān),以減少或消除HOA系數(shù)47'的背景信號(hào)之間的相關(guān)性,從而形成一或多個(gè)經(jīng)去相關(guān)的HOA系數(shù)47"(121)。音頻編碼裝置20還可調(diào)用心理聲學(xué)音頻譯碼器單元40。心理聲學(xué)音頻譯碼器單元40可對(duì)經(jīng)能量補(bǔ)償?shù)沫h(huán)境HOA系數(shù)47'和經(jīng)內(nèi)插nFG信號(hào)49'的每一向量進(jìn)行心理聲學(xué)譯碼,以產(chǎn)生經(jīng)編碼環(huán)境HOA系數(shù)59和經(jīng)編碼nFG信號(hào)61。音頻編碼裝置接著可調(diào)用位流產(chǎn)生單元42。位流產(chǎn)生單元42可基于經(jīng)譯碼前景方向信息57、經(jīng)譯碼環(huán)境HOA系數(shù)59、經(jīng)譯碼nFG信號(hào)61和背景信道信息43產(chǎn)生位流21。圖6A是說明音頻解碼裝置(例如在圖4的實(shí)例中展示的音頻解碼裝置24)執(zhí)行本發(fā)明中描述的技術(shù)的各種方面的示范性操作的流程圖。最初,音頻解碼裝置24可接收位流21(130)。在接收到位流之后,音頻解碼裝置24即可調(diào)用提取單元72。出于論述的目的假設(shè)位流21指示將執(zhí)行基于向量的重建構(gòu),提取單元72可解析位流以檢索上文所提到的信息,從而將所述信息傳遞到基于向量的重構(gòu)單元92。換句話說,提取單元72可按上文所描述的方式從位流21中提取經(jīng)譯碼前景方向信息57(再次,其也可被稱為經(jīng)譯碼前景V[k]向量57)、經(jīng)譯碼環(huán)境HOA系數(shù)59和經(jīng)譯碼前景信號(hào)(其也可被稱為經(jīng)譯碼前景nFG信號(hào)59或經(jīng)譯碼前景音頻對(duì)象59)(132)。音頻解碼裝置24可進(jìn)一步調(diào)用解量化單元74。解量化單元74可對(duì)經(jīng)譯碼前景方向信息57進(jìn)行熵解碼和解量化以獲得經(jīng)減少的前景方向信息55k(136)。音頻解碼裝置24可調(diào)用再相關(guān)單元81。再相關(guān)單元81可將一或多個(gè)再相關(guān)變換應(yīng)用于經(jīng)能量補(bǔ)償?shù)沫h(huán)境HOA系數(shù)47'以獲得一或多個(gè)經(jīng)再相關(guān)的HOA系數(shù)47"(或相關(guān)的HOA系數(shù)47"),并且可將相關(guān)的HOA系數(shù)47"傳遞到HOA系數(shù)制訂單元82(任選地,通過淡化單元770)(137)。音頻解碼裝置24還可調(diào)用心理聲學(xué)解碼單元80。心理聲學(xué)音頻解碼單元80可對(duì)經(jīng)編碼環(huán)境HOA系數(shù)59和經(jīng)編碼前景信號(hào)61進(jìn)行解碼以獲得經(jīng)能量補(bǔ)償?shù)沫h(huán)境HOA系數(shù)47'和經(jīng)內(nèi)插的前景信號(hào)49'(138)。心理聲學(xué)解碼單元80可將經(jīng)能量補(bǔ)償?shù)沫h(huán)境HOA系數(shù)47'傳遞到淡化單元770且將nFG信號(hào)49'傳遞到前景制訂單元78。音頻解碼裝置24接下來可調(diào)用空間-時(shí)間內(nèi)插單元76??臻g-時(shí)間內(nèi)插單元76可接收經(jīng)重排序的前景方向信息55k'且對(duì)于經(jīng)減少的前景方向信息55k/55k-1執(zhí)行空間-時(shí)間內(nèi)插以產(chǎn)生經(jīng)內(nèi)插的前景方向信息55k”(140)??臻g-時(shí)間內(nèi)插單元76可將經(jīng)內(nèi)插的前景V[k]向量55k”轉(zhuǎn)發(fā)到淡化單元770。音頻解碼裝置24可調(diào)用淡化單元770。淡化單元770可(例如,從提取單元72)接收或以其它方式獲得指示經(jīng)能量補(bǔ)償?shù)沫h(huán)境HOA系數(shù)47'何時(shí)處于轉(zhuǎn)變中的語法元素(例如,AmbCoeffTransition語法元素)。淡化單元770可基于轉(zhuǎn)變語法元素和所維持的轉(zhuǎn)變狀態(tài)信息使經(jīng)能量補(bǔ)償?shù)沫h(huán)境HOA系數(shù)47'淡入或淡出,從而將經(jīng)調(diào)整的環(huán)境HOA系數(shù)47”輸出到HOA系數(shù)制訂單元82。淡化單元770還可基于語法元素和所維持的轉(zhuǎn)變狀態(tài)信息而使經(jīng)內(nèi)插的前景V[k]向量55k”的對(duì)應(yīng)一或多個(gè)元素淡出或淡入,從而將經(jīng)調(diào)整的前景V[k]向量55k”'輸出到前景制訂單元78(142)。音頻解碼裝置24可調(diào)用前景制訂單元78。前景制訂單元78可執(zhí)行nFG信號(hào)49'與經(jīng)調(diào)整前景方向信息55k”'的矩陣乘法以獲得前景HOA系數(shù)65(144)。音頻解碼裝置24還可調(diào)用HOA系數(shù)制訂單元82。HOA系數(shù)制訂單元82可將前景HOA系數(shù)65與經(jīng)調(diào)整環(huán)境HOA系數(shù)47”相加以便獲得HOA系數(shù)11'(146)。圖6B是說明音頻編碼裝置和音頻解碼裝置執(zhí)行本發(fā)明中描述的譯碼技術(shù)的示范性操作的流程圖。圖6B是說明根據(jù)本發(fā)明的一或多個(gè)方面的實(shí)例編碼和解碼過程160的流程圖。盡管過程160可由多種裝置執(zhí)行,但為便于論述,在本文中關(guān)于上文所描述的音頻編碼裝置20和音頻解碼裝置24來描述過程160。使用圖6B中的虛線將過程160的編碼區(qū)段與解碼區(qū)段分界。過程160可開始于音頻編碼裝置20的一或多個(gè)組件(例如,前景選擇單元36和背景選擇單元48)使用HOA空間編碼從HOA輸入產(chǎn)生前景信道164和一階HOA背景信道166(162)。繼而,去相關(guān)單元40'可將去相關(guān)變換(例如,呈基于相位的去相關(guān)變換或矩陣形式)應(yīng)用于經(jīng)能量補(bǔ)償?shù)沫h(huán)境HOA系數(shù)47'。更具體來說,音頻編碼裝置20可將UHJ矩陣或基于相位的去相關(guān)變換(例如,通過標(biāo)量乘法)應(yīng)用于經(jīng)能量補(bǔ)償?shù)沫h(huán)境HOA系數(shù)47'(168)。在一些實(shí)例中,如果去相關(guān)單元40',在其中去相關(guān)單元40'確定HOA背景信道包含較少數(shù)目個(gè)信道(例如,四個(gè))的例子中,去相關(guān)單元40'可應(yīng)用UHJ矩陣(或基于相位的變換)。相反地,在這些實(shí)例中,如果去相關(guān)單元40'確定HOA背景信道包含較大數(shù)目個(gè)信道(例如,九個(gè)),那么音頻編碼裝置20可選擇不同于UHJ矩陣的去相關(guān)變換(例如,在MPEG-H標(biāo)準(zhǔn)中描述的模式矩陣)并將所述去相關(guān)變換應(yīng)用于HOA背景信道。通過將去相關(guān)變換(例如,UHJ矩陣)應(yīng)用于HOA背景信道,音頻編碼裝置20可獲得經(jīng)去相關(guān)的HOA背景信道。如在圖6B中展示,音頻編碼裝置20(例如,通過調(diào)用心理聲學(xué)音頻譯碼器單元40)可將時(shí)間編碼(例如,通過應(yīng)用AAC和/或USAC)應(yīng)用于經(jīng)去相關(guān)的HOA背景信號(hào)(170)以及應(yīng)用于任何前景信道(166)。應(yīng)了解,在一些情境中,心理聲學(xué)音頻譯碼器單元40可確定前景信道的數(shù)目可為零(即,在這些情境中,心理聲學(xué)音頻譯碼器單元40可不從HOA輸入獲得任何前景信道)。因?yàn)锳AC和/或USAC可能不經(jīng)優(yōu)化以用于或以其它方式非常適合于立體聲音頻數(shù)據(jù),去相關(guān)單元40'可應(yīng)用去相關(guān)矩陣以減少或消除HOA背景信道之間的相關(guān)性。經(jīng)去相關(guān)的HOA背景信道中展示的經(jīng)減少的相關(guān)性提供在AAC/USAC時(shí)間編碼階段減輕或消除噪聲去掩蔽的潛在優(yōu)點(diǎn),這是因?yàn)锳AC和USAC可能不針對(duì)立體聲音頻數(shù)據(jù)經(jīng)優(yōu)化。繼而,音頻解碼裝置24可執(zhí)行對(duì)由音頻編碼裝置20輸出的經(jīng)編碼位流的時(shí)間解碼。在過程160的實(shí)例中,音頻解碼裝置24的一或多個(gè)組件(例如,心理聲學(xué)解碼單元80)可分別對(duì)于前景信道(如果有任何前景信道包含在位流中)(172)和背景信道(174)執(zhí)行時(shí)間解碼。另外,再相關(guān)單元81可將再相關(guān)變換應(yīng)用于經(jīng)時(shí)間解碼的HOA背景信道。作為一實(shí)例,再相關(guān)單元81可以互逆方式將去相關(guān)變換應(yīng)用于去相關(guān)單元40'。舉例來說,如在過程160的具體實(shí)例中所描述,再相關(guān)單元81可將UHJ矩陣或基于相位的變換應(yīng)用于經(jīng)時(shí)間解碼的HOA背景信號(hào)(176)。在一些實(shí)例中,如果再相關(guān)單元81確定經(jīng)時(shí)間解碼的HOA背景信號(hào)包含較少數(shù)目個(gè)信道(例如,四個(gè)),那么再相關(guān)單元81可應(yīng)用UHJ矩陣或基于相位的變換。相反地,在這些實(shí)例中,如果再相關(guān)單元81確定經(jīng)時(shí)間解碼的HOA背景信道包含較大數(shù)目個(gè)信道(例如,九個(gè)),那么再相關(guān)單元81可選擇不同于UHJ矩陣的去相關(guān)變換(例如,在MPEG-H標(biāo)準(zhǔn)中描述的模式矩陣)并將所述去相關(guān)變換應(yīng)用于HOA背景信道。另外,HOA系數(shù)制訂單元82可執(zhí)行對(duì)相關(guān)的HOA背景信道和任何可用的經(jīng)解碼前景信道的HOA空間解碼(178)。繼而,HOA系數(shù)制訂單元82可向一或多個(gè)輸出裝置(例如擴(kuò)音器和/或頭戴式耳機(jī)(包含但不限于具有立體聲或環(huán)繞聲能力的輸出裝置)再現(xiàn)經(jīng)解碼的音頻信號(hào)(180)??蓪?duì)于任何數(shù)目個(gè)不同上下文和音頻生態(tài)系統(tǒng)執(zhí)行前述技術(shù)。下文描述數(shù)個(gè)實(shí)例上下文,但所述技術(shù)不應(yīng)限于所述實(shí)例上下文。一個(gè)實(shí)例音頻生態(tài)系統(tǒng)可包含音頻內(nèi)容、電影工作室、音樂工作室、游戲音頻工作室、基于信道的音頻內(nèi)容、譯碼引擎、游戲音頻原聲(stem)、游戲音頻譯碼/再現(xiàn)引擎,以及遞送系統(tǒng)。電影工作室、音樂工作室和游戲音頻工作室可接收音頻內(nèi)容。在一些實(shí)例中,音頻內(nèi)容可表示獲取內(nèi)容的輸出。電影工作室可例如通過使用數(shù)字音頻工作站(DAW)輸出基于信道的音頻內(nèi)容(例如,呈2.0、5.1和7.1)。音樂工作室可例如通過使用DAW輸出基于信道的音頻內(nèi)容(例如,呈2.0和5.1)。在任一情況下,譯碼引擎可基于一或多個(gè)編碼解碼器(例如,AAC、AC3、杜比真HD(DolbyTrueHD)、杜比數(shù)字加(DolbyDigitalPlus)以及DTS主音頻)接收并編碼基于信道的音頻內(nèi)容以用于由遞送系統(tǒng)輸出。游戲音頻工作室可例如通過使用DAW輸出一或多個(gè)游戲音頻原聲。游戲音頻譯碼/再現(xiàn)引擎可譯碼音頻原聲和/或?qū)⒁纛l原聲再現(xiàn)成基于信道的音頻內(nèi)容以供遞送系統(tǒng)輸出??蓤?zhí)行所述技術(shù)的另一實(shí)例上下文包括音頻生態(tài)系統(tǒng),其可包含廣播記錄音頻對(duì)象、專業(yè)音頻系統(tǒng)、消費(fèi)型裝置上捕獲、HOA音頻格式、裝置上再現(xiàn)、消費(fèi)型音頻、TV、和配件,以及汽車音頻系統(tǒng)。廣播記錄音頻對(duì)象、專業(yè)音頻系統(tǒng)和消費(fèi)型裝置上捕獲都可使用HOA音頻格式對(duì)其輸出進(jìn)行譯碼。以此方式,可使用HOA音頻格式將音頻內(nèi)容譯碼成單一表示,可使用裝置上再現(xiàn)、消費(fèi)型音頻、TV、和配件以及汽車音頻系統(tǒng)回放所述單一表示。換句話說,可在通用音頻回放系統(tǒng)(即,與要求例如5.1、7.1等的特定配置相反)(例如,音頻回放系統(tǒng)16)處回放音頻內(nèi)容的單一表示??蓤?zhí)行所述技術(shù)的上下文的其它實(shí)例包含可包含獲取元件和回放元件的音頻生態(tài)系統(tǒng)。獲取元件可包含有線和/或無線獲取裝置(例如,本征麥克風(fēng))、裝置上環(huán)繞聲捕獲,以及移動(dòng)裝置(例如,智能電話和平板計(jì)算機(jī))。在一些實(shí)例中,有線和/或無線獲取裝置可經(jīng)由有線和/或無線通信信道耦合到移動(dòng)裝置。根據(jù)本發(fā)明的一或多種技術(shù),移動(dòng)裝置可用以獲取聲場(chǎng)。舉例來說,移動(dòng)裝置可經(jīng)由有線和/或無線獲取裝置和/或裝置上環(huán)繞聲捕獲(例如,集成到移動(dòng)裝置中的多個(gè)麥克風(fēng))獲取聲場(chǎng)。移動(dòng)裝置接著可將所獲取聲場(chǎng)譯碼成HOA系數(shù)以用于由回放元件中的一或多者回放。舉例來說,移動(dòng)裝置的用戶可記錄實(shí)況事件(例如,集會(huì)、會(huì)議、比賽、音樂會(huì)等)(獲取實(shí)況事件的聲場(chǎng)),且將所述記錄內(nèi)容譯碼成HOA系數(shù)。移動(dòng)裝置還可使用回放元件中的一或多者來回放經(jīng)HOA譯碼聲場(chǎng)。舉例來說,移動(dòng)裝置可對(duì)經(jīng)HOA譯碼聲場(chǎng)進(jìn)行解碼,且將致使回放元件中的一或多者重新產(chǎn)生聲場(chǎng)的信號(hào)輸出到所述回放元件中的所述一或多者。作為一個(gè)實(shí)例,移動(dòng)裝置可使用無線和/或無線通信信道將信號(hào)輸出到一或多個(gè)揚(yáng)聲器(例如,揚(yáng)聲器陣列、聲棒(soundbar)等)。作為另一實(shí)例,移動(dòng)裝置可使用對(duì)接解決方案將信號(hào)輸出到一或多個(gè)對(duì)接站和/或一或多個(gè)對(duì)接的揚(yáng)聲器(例如,智能汽車和/或家庭中的聲音系統(tǒng))。作為另一實(shí)例,移動(dòng)裝置可使用頭戴式耳機(jī)再現(xiàn)將信號(hào)輸出到一組頭戴式耳機(jī)(例如)以創(chuàng)建逼真的雙耳聲。在一些實(shí)例中,特定移動(dòng)裝置可獲取3D聲場(chǎng)以及在稍后時(shí)間回放同一3D聲場(chǎng)。在一些實(shí)例中,移動(dòng)裝置可獲取3D聲場(chǎng),將3D聲場(chǎng)編碼為HOA,并且將經(jīng)編碼3D聲場(chǎng)傳輸?shù)揭换蚨鄠€(gè)其它裝置(例如,其它移動(dòng)裝置和/或其它非移動(dòng)裝置)以用于回放??蓤?zhí)行所述技術(shù)的又一上下文包含音頻生態(tài)系統(tǒng),其可包含音頻內(nèi)容、游戲工作室、經(jīng)譯碼音頻內(nèi)容、再現(xiàn)引擎以及遞送系統(tǒng)。在一些實(shí)例中,游戲工作室可包含可支持HOA信號(hào)的編輯的一或多個(gè)DAW。舉例來說,所述一或多個(gè)DAW可包含可經(jīng)配置以與一或多個(gè)游戲音頻系統(tǒng)一起操作(例如,工作)的HOA插件和/或工具。在一些實(shí)例中,游戲工作室可輸出支持HOA的新原聲格式。在任何情況下,游戲工作室可將經(jīng)譯碼音頻內(nèi)容輸出到再現(xiàn)引擎,所述再現(xiàn)引擎可再現(xiàn)聲場(chǎng)以供遞送系統(tǒng)回放。也可對(duì)于示范性音頻獲取裝置執(zhí)行所述技術(shù)。舉例來說,可對(duì)于可包含共同地經(jīng)配置以記錄3D聲場(chǎng)的多個(gè)麥克風(fēng)的本征麥克風(fēng)執(zhí)行所述技術(shù)。在一些實(shí)例中,本征麥克風(fēng)的所述多個(gè)麥克風(fēng)可位于具有大約4cm的半徑的基本呈球形的球體的表面上。在一些實(shí)例中,音頻編碼裝置20可集成到本征麥克風(fēng)中以便直接從麥克風(fēng)輸出位流21。另一示范性音頻獲取上下文可包含可經(jīng)配置以從一或多個(gè)麥克風(fēng)(例如,一或多個(gè)本征麥克風(fēng))接收信號(hào)的制作車。制作車還可包含音頻編碼器,例如圖3的音頻編碼器20。在一些例子中,移動(dòng)裝置還可包含共同地經(jīng)配置以記錄3D聲場(chǎng)的多個(gè)麥克風(fēng)。換句話說,所述多個(gè)麥克風(fēng)可具有X、Y、Z分集。在一些實(shí)例中,移動(dòng)裝置可包含可旋轉(zhuǎn)以相對(duì)于移動(dòng)裝置的一或多個(gè)其它麥克風(fēng)提供X、Y、Z分集的麥克風(fēng)。移動(dòng)裝置還可包含音頻編碼器,例如圖3的音頻編碼器20。加固型視頻捕獲裝置可進(jìn)一步經(jīng)配置以記錄3D聲場(chǎng)。在一些實(shí)例中,加固型視頻捕獲裝置可附接到參與活動(dòng)的用戶的頭盔。舉例來說,加固型視頻捕獲裝置可在用戶泛舟時(shí)附接到用戶的頭盔。以此方式,加固型視頻捕獲裝置可捕獲表示用戶周圍的動(dòng)作(例如,水在用戶身后的撞擊、另一泛舟者在用戶前方說話等)的3D聲場(chǎng)。還可對(duì)于可經(jīng)配置以記錄3D聲場(chǎng)的配件增強(qiáng)型移動(dòng)裝置執(zhí)行所述技術(shù)。在一些實(shí)例中,移動(dòng)裝置可類似于上文所論述的移動(dòng)裝置,其中添加了一或多個(gè)配件。舉例來說,本征麥克風(fēng)可附接到上文所提及的移動(dòng)裝置以形成配件增強(qiáng)型移動(dòng)裝置。以此方式,與僅使用與配件增強(qiáng)型移動(dòng)裝置成一體的聲音捕獲組件相比,配件增強(qiáng)型移動(dòng)裝置可捕獲3D聲場(chǎng)的更高質(zhì)量版本。下文進(jìn)一步論述可執(zhí)行本發(fā)明中所描述的技術(shù)的各種方面的實(shí)例音頻回放裝置。根據(jù)本發(fā)明的一或多種技術(shù),揚(yáng)聲器和/或聲棒在回放3D聲場(chǎng)時(shí)可布置于任何任意的配置中。此外,在一些實(shí)例中,頭戴式耳機(jī)回放裝置可經(jīng)由有線或無線連接耦合到解碼器24。根據(jù)本發(fā)明的一或多種技術(shù),可使用聲場(chǎng)的單一通用表示來在揚(yáng)聲器、聲棒和頭戴式耳機(jī)回放裝置的任何組合上再現(xiàn)聲場(chǎng)。多個(gè)不同實(shí)例音頻回放環(huán)境還可適用于執(zhí)行本發(fā)明中所描述的技術(shù)的各種方面。舉例來說,以下環(huán)境可為用于執(zhí)行本發(fā)明中所描述的技術(shù)的各種方面的合適環(huán)境:5.1揚(yáng)聲器回放環(huán)境、2.0(例如,立體聲)揚(yáng)聲器回放環(huán)境、具有全高前擴(kuò)音器的9.1揚(yáng)聲器回放環(huán)境、22.2揚(yáng)聲器回放環(huán)境、16.0揚(yáng)聲器回放環(huán)境、汽車揚(yáng)聲器回放環(huán)境,以及具有耳芽(earbud)回放環(huán)境的移動(dòng)裝置。根據(jù)本發(fā)明的一或多種技術(shù),可利用聲場(chǎng)的單一通用表示來在前述回放環(huán)境中的任一者上再現(xiàn)聲場(chǎng)。另外,本發(fā)明的技術(shù)使得再現(xiàn)器能夠從通用表示再現(xiàn)聲場(chǎng)以用于在除上文所描述的環(huán)境之外的回放環(huán)境上回放。舉例來說,如果設(shè)計(jì)考慮禁止揚(yáng)聲器根據(jù)7.1揚(yáng)聲器回放環(huán)境的恰當(dāng)放置(例如,如果不可能放置右環(huán)繞揚(yáng)聲器),那么本發(fā)明的技術(shù)使得再現(xiàn)器能夠以其它6個(gè)揚(yáng)聲器進(jìn)行補(bǔ)償,使得可在6.1揚(yáng)聲器回放環(huán)境上實(shí)現(xiàn)回放。此外,用戶可在佩戴頭戴式耳機(jī)時(shí)觀看運(yùn)動(dòng)比賽。根據(jù)本發(fā)明的一或多種技術(shù),可獲取運(yùn)動(dòng)比賽的3D聲場(chǎng)(例如,可將一或多個(gè)本征麥克風(fēng)放置在棒球場(chǎng)中和/或周圍),可獲得對(duì)應(yīng)于3D聲場(chǎng)的HOA系數(shù)且將所述HOA系數(shù)傳輸?shù)浇獯a器,所述解碼器可基于HOA系數(shù)重構(gòu)3D聲場(chǎng)且將經(jīng)重構(gòu)3D聲場(chǎng)輸出到再現(xiàn)器,且所述再現(xiàn)器可獲得關(guān)于回放環(huán)境的類型(例如,頭戴式耳機(jī))的指示,且將經(jīng)重構(gòu)3D聲場(chǎng)再現(xiàn)為致使頭戴式耳機(jī)輸出運(yùn)動(dòng)比賽的3D聲場(chǎng)的表示的信號(hào)。在上述各種例子中的每一者中,應(yīng)理解,音頻編碼裝置20可執(zhí)行方法,或另外包括執(zhí)行音頻編碼裝置20經(jīng)配置以執(zhí)行的方法的每一步驟的裝置。在一些例子中,這些裝置可包括一或多個(gè)處理器。在一些例子中,所述一或多個(gè)處理器可表示借助于存儲(chǔ)到非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)媒體的指令配置的專用處理器。換句話說,編碼實(shí)例的集合中的每一者中的技術(shù)的各種方面可提供其上存儲(chǔ)有指令的非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)媒體,所述指令在執(zhí)行時(shí)致使一或多個(gè)處理器執(zhí)行音頻編碼裝置20已經(jīng)配置以執(zhí)行的方法。在一或多個(gè)實(shí)例中,所描述的功能可用硬件、軟件、固件或其任何組合實(shí)施。如果以軟件實(shí)施,那么所述功能可以作為一或多個(gè)指令或代碼在計(jì)算機(jī)可讀媒體上存儲(chǔ)或傳輸,并且由基于硬件的處理單元來執(zhí)行。計(jì)算機(jī)可讀媒體可包含計(jì)算機(jī)可讀存儲(chǔ)媒體,其對(duì)應(yīng)于例如數(shù)據(jù)存儲(chǔ)媒體等有形媒體。數(shù)據(jù)存儲(chǔ)媒體可為可由一或多個(gè)計(jì)算機(jī)或一個(gè)或多個(gè)處理器存取以檢索用于實(shí)施本發(fā)明中描述的技術(shù)的指令、代碼和/或數(shù)據(jù)結(jié)構(gòu)的任何可用媒體。計(jì)算機(jī)程序產(chǎn)品可以包含計(jì)算機(jī)可讀媒體。同樣地,在上文所描述的各種例子中的每一者中,應(yīng)理解,音頻解碼裝置24可執(zhí)行方法或另外包括用于執(zhí)行音頻解碼裝置24經(jīng)配置以執(zhí)行的方法的每一步驟的裝置。在一些例子中,所述裝置可包括一或多個(gè)處理器。在一些例子中,所述一或多個(gè)處理器可表示借助于存儲(chǔ)到非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)媒體的指令配置的專用處理器。換句話說,編碼實(shí)例的集合中的每一者中的技術(shù)的各種方面可提供其上存儲(chǔ)有指令的非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)媒體,所述指令在執(zhí)行時(shí)致使所述一或多個(gè)處理器執(zhí)行音頻解碼裝置24已經(jīng)配置以執(zhí)行的方法。借助于實(shí)例而非限制,此類計(jì)算機(jī)可讀存儲(chǔ)媒體可包括RAM、ROM、EEPROM、CD-ROM或其它光盤存儲(chǔ)裝置、磁盤存儲(chǔ)裝置或其它磁性存儲(chǔ)裝置、快閃存儲(chǔ)器,或可用以存儲(chǔ)指令或數(shù)據(jù)結(jié)構(gòu)的形式的期望程序代碼并且可以由計(jì)算機(jī)存取的任何其它媒體。然而,應(yīng)理解,所述計(jì)算機(jī)可讀存儲(chǔ)媒體和數(shù)據(jù)存儲(chǔ)媒體并不包含連接、載波、信號(hào)或其它暫時(shí)性媒體,而是實(shí)際上針對(duì)非暫時(shí)性的有形存儲(chǔ)媒體。如本文中所使用,磁盤和光盤包含壓縮光盤(CD)、激光光盤、光學(xué)光盤、數(shù)字多功能光盤(DVD)、軟性磁盤和藍(lán)光光盤,其中磁盤通常以磁性方式再現(xiàn)數(shù)據(jù),而光盤利用激光以光學(xué)方式再現(xiàn)數(shù)據(jù)。以上各項(xiàng)的組合也應(yīng)包含在計(jì)算機(jī)可讀媒體的范圍內(nèi)??捎衫缫换蚨鄠€(gè)數(shù)字信號(hào)處理器(DSP)、通用微處理器、專用集成電路(ASIC)、現(xiàn)場(chǎng)可編程邏輯陣列(FPGA)或其它等效集成或離散邏輯電路等一或多個(gè)處理器來執(zhí)行指令。因此,如本文中所使用的術(shù)語“處理器”可指前述結(jié)構(gòu)或適于實(shí)施本文中所描述的技術(shù)的任一其它結(jié)構(gòu)中的任一者。另外,在一些方面中,本文中所描述的功能性可以在經(jīng)配置用于編碼和解碼的專用硬件和/或軟件模塊內(nèi)提供,或者并入于組合式編碼解碼器中。而且,所述技術(shù)可完全實(shí)施于一或多個(gè)電路或邏輯元件中。本發(fā)明的技術(shù)可在廣泛多種裝置或設(shè)備中實(shí)施,包含無線手持機(jī)、集成電路(IC)或一組IC(例如,芯片組)。本發(fā)明中描述各種組件、模塊或單元是為了強(qiáng)調(diào)經(jīng)配置以執(zhí)行所揭示的技術(shù)的裝置的功能方面,但未必需要由不同硬件單元實(shí)現(xiàn)。實(shí)際上,如上文所描述,各種單元可以結(jié)合合適的軟件和/或固件組合在編碼解碼器硬件單元中,或者通過互操作硬件單元的集合來提供,所述硬件單元包含如上文所描述的一或多個(gè)處理器。已經(jīng)描述了所述技術(shù)的各種方面。所述技術(shù)的這些和其它方面在所附權(quán)利要求書的范圍內(nèi)。當(dāng)前第1頁1 2 3