28個采樣。如本文檔中所示,這個特定數(shù)量的采樣為音頻編碼和解碼系統(tǒng)的特定實(shí)現(xiàn)提供 最小的總延遲和最佳的對齊。
[0039] 根據(jù)另一方面,描述了一種音頻編碼系統(tǒng),其被配置為基于多聲道輸入信號來產(chǎn) 生比特流。所述系統(tǒng)可以包括下混處理單元,其被配置為確定用于多聲道輸入信號的相應(yīng) 的幀序列的修剪(clip)保護(hù)增益(在本文檔中,其也被稱為修剪-增益和/或DRC2參數(shù)) 序列。當(dāng)前修剪保護(hù)增益可以指示將應(yīng)用于多聲道輸入信號的當(dāng)前幀以防止下混信號的相 應(yīng)的當(dāng)前幀修剪的衰減。以類似的方式,修剪保護(hù)增益序列可以指示將應(yīng)用于多聲道輸入 信號的幀序列的幀以防止下混信號的幀序列的相應(yīng)幀修剪的各自的衰減。
[0040] 下混處理單元可以被配置為內(nèi)插當(dāng)前修剪保護(hù)增益和多聲道輸入信號的前一幀 的前一修剪保護(hù)增益以得到修剪保護(hù)增益曲線。這可以以與修剪保護(hù)增益序列類似的方式 執(zhí)行。此外,下混處理單元可以被配置為將修剪保護(hù)增益曲線應(yīng)用于多聲道輸入信號的當(dāng) 前幀以得到多聲道輸入信號的衰減的當(dāng)前幀。再次,這可以以與多聲道輸入信號的幀序列 類似的方式執(zhí)行。此外,下混處理單元可以被配置為從多聲道輸入信號的衰減的當(dāng)前幀產(chǎn) 生下混信號的幀序列的當(dāng)前幀。以類似的方式,可以產(chǎn)生下混信號的幀序列。
[0041] 音頻處理系統(tǒng)還可以包括參數(shù)處理單元,其被配置為從多聲道輸入信號確定空間 元數(shù)據(jù)幀序列。下混信號的幀序列和空間元數(shù)據(jù)幀序列可以用于產(chǎn)生包括n個聲道的多聲 道上混信號,以使得多聲道上混信號是多聲道輸入信號的逼近。另外,音頻處理系統(tǒng)可以包 括比特流產(chǎn)生單元,其被配置為產(chǎn)生指示修剪保護(hù)增益序列、下混信號的幀序列和空間元 數(shù)據(jù)幀序列的比特流,以使得相應(yīng)的解碼系統(tǒng)能夠產(chǎn)生多聲道上混信號。
[0042] 修剪保護(hù)增益曲線可以包括過渡段和平坦段,過渡段提供從前一修剪保護(hù)增益到 當(dāng)前修剪保護(hù)增益的平滑過渡,平坦段在當(dāng)前修剪保護(hù)增益處保持平坦。過渡段可以跨過 多聲道輸入信號的當(dāng)前幀的預(yù)定數(shù)量的采樣而延伸。所述預(yù)定數(shù)量的采樣可以是多聲道輸 入信號的當(dāng)前幀的多于一個且少于總數(shù)的采樣。具體地說,所述預(yù)定數(shù)量的采樣可以對應(yīng) 于采樣塊(其中,幀可以包括多個塊)或幀。在特定示例中,幀可以包括1536個采樣,塊可 以包括256個采樣。
[0043]根據(jù)另一方面,描述了一種音頻編碼系統(tǒng),其被配置為產(chǎn)生比特流,該比特流指示 下混信號以及用于從下混信號產(chǎn)生多聲道上混信號的空間元數(shù)據(jù)。所述系統(tǒng)可以包括下混 處理單元,其被配置為從多聲道輸入信號產(chǎn)生下混信號。此外,所述系統(tǒng)可以包括參數(shù)處理 單元,其被配置為確定用于多聲道輸入信號的相應(yīng)的幀序列的空間元數(shù)據(jù)幀序列。
[0044]此外,音頻編碼系統(tǒng)可以包括配置單元,其被配置為基于一個或多個外部設(shè)置來 確定對于參數(shù)處理單元的一個或多個控制設(shè)置。所述一個或多個外部設(shè)置可以包括更新時 段,其指示相應(yīng)的解碼系統(tǒng)與比特流同步所需的時間段。配置單元可以被配置為基于更新 時段來從空間元數(shù)據(jù)幀序列確定將被獨(dú)立地編碼的一個或多個獨(dú)立的空間元數(shù)據(jù)幀。
[0045]根據(jù)另一方面,描述了一種用于產(chǎn)生比特流的方法,所述比特流指示下混信號以 及用于從下混信號產(chǎn)生多聲道上混信號的空間元數(shù)據(jù)。所述方法可以從多聲道輸入信號產(chǎn) 生下混信號。此外,所述方法可以包括基于一個或多個外部設(shè)置來確定一個或多個控制設(shè) 置;其中,所述一個或多個外部設(shè)置包括比特流的目標(biāo)數(shù)據(jù)速率,并且其中,所述一個或多 個控制設(shè)置包括空間元數(shù)據(jù)的最大數(shù)據(jù)速率。另外,所述方法可以包括根據(jù)所述一個或多 個控制設(shè)置從多聲道輸入信號確定空間元數(shù)據(jù)。
[0046]根據(jù)另一方面,描述了一種用于確定空間元數(shù)據(jù)幀的方法,所述空間元數(shù)據(jù)幀用 于從下混信號的相應(yīng)幀產(chǎn)生多聲道上混信號的幀。所述方法可以包括從多聲道輸入信號的 聲道的當(dāng)前幀和緊跟幀確定多個頻譜。此外,所述方法可以包括使用窗函數(shù)對所述多個頻 譜進(jìn)行加權(quán)以得到多個加權(quán)的頻譜。另外,所述方法可以包括基于所述多個加權(quán)的頻譜來 確定用于多聲道輸入信號的所述聲道的當(dāng)前幀的空間元數(shù)據(jù)幀。窗函數(shù)可以取決于以下中 的一個或多個:空間元數(shù)據(jù)幀內(nèi)所包括的空間參數(shù)集合的數(shù)量、多聲道輸入信號的當(dāng)前幀 中或緊跟幀中的瞬變的存在、和/或該瞬變的時刻。
[0047]根據(jù)另一方面,描述了一種用于確定空間元數(shù)據(jù)幀的方法,所述空間元數(shù)據(jù)幀用 于從下混信號的相應(yīng)幀產(chǎn)生多聲道上混信號的幀。所述方法可以包括:從多聲道輸入信號 的第一聲道的幀確定第一多個變換系數(shù),并且從多聲道輸入信號的第二聲道的相應(yīng)幀確定 第二多個變換系數(shù)。如以上所概述的,第一多個變換系數(shù)和第二多個變換系數(shù)通常分別提 供第一聲道和第二聲道的相應(yīng)幀的第一時間/頻率表示和第二時間/頻率表示。第一時間 /頻率表示和第二時間/頻率表示可以包括多個頻率區(qū)間和多個時間區(qū)間??臻g參數(shù)集合 可以包括分別用于包括不同數(shù)量的頻率區(qū)間的不同頻帶的相應(yīng)的帶參數(shù)。所述方法還可以 包括確定當(dāng)使用定點(diǎn)算術(shù)確定用于特定頻帶的特定帶參數(shù)時將應(yīng)用的移位。此外,可以基 于確定特定帶參數(shù)將考慮的時間區(qū)間的數(shù)量來確定移位。另外,所述方法可以包括使用定 點(diǎn)算術(shù)和所確定的移位、基于落在特定頻帶中的第一多個變換系數(shù)和第二多個變換系數(shù)來 確定特定帶參數(shù)。
[0048]描述了一種用于基于多聲道輸入信號產(chǎn)生比特流的方法。所述方法可以包括從多 聲道輸入信號的相應(yīng)的第一幀序列產(chǎn)生下混信號的幀序列。此外,所述方法可以包括從多 聲道輸入信號的第二幀序列確定空間元數(shù)據(jù)幀序列。下混信號的幀序列和空間元數(shù)據(jù)幀 序列可以用于產(chǎn)生多聲道上混信號。另外,所述方法可以包括產(chǎn)生包括比特流幀序列的比 特流。比特流幀可以指示下混信號的與多聲道輸入信號的第一幀序列的第一幀對應(yīng)的幀以 及與多聲道輸入信號的第二幀序列的第二幀對應(yīng)的空間元數(shù)據(jù)幀。第二幀可以不同于第一 幀。
[0049] 根據(jù)另一方面,描述了一種用于基于多聲道輸入信號產(chǎn)生比特流的方法。所述方 法可以包括確定用于多聲道輸入信號的相應(yīng)的幀序列的修剪保護(hù)增益序列。當(dāng)前修剪保護(hù) 增益可以指示將應(yīng)用于多聲道輸入信號的當(dāng)前幀以防止下混信號的相應(yīng)的當(dāng)前幀修剪的 衰減。所述方法可以繼續(xù)內(nèi)插當(dāng)前修剪保護(hù)增益和多聲道輸入信號的前一幀的前一修剪保 護(hù)增益以得到修剪保護(hù)增益曲線。此外,所述方法可以包括將修剪保護(hù)增益曲線應(yīng)用于多 聲道輸入信號的當(dāng)前幀以得到多聲道輸入信號的衰減的當(dāng)前幀。下混信號的幀序列的當(dāng)前 幀可以從多聲道輸入信號的衰減的當(dāng)前幀產(chǎn)生。另外,所述方法可以包括從多聲道輸入信 號確定空間元數(shù)據(jù)幀序列。下混信號的幀序列和空間元數(shù)據(jù)幀序列可以用于產(chǎn)生多聲道上 混信號。比特流可以被產(chǎn)生為使得該比特流指示修剪保護(hù)增益序列、下混信號的幀序列以 及空間元數(shù)據(jù)幀序列,以使得能夠基于該比特流產(chǎn)生多聲道上混信號。
[0050] 根據(jù)另一方面,描述了一種用于產(chǎn)生比特流的方法,所述比特流指示下混信號和 空間元數(shù)據(jù),所述空間元數(shù)據(jù)用于從下混信號產(chǎn)生多聲道上混信號。所述方法可以包括從 多聲道輸入信號產(chǎn)生下混信號。此外,所述方法可以包括基于一個或多個外部設(shè)置來確定 一個或多個控制設(shè)置,其中,所述一個或多個外部設(shè)置包括更新時段,其指示解碼系統(tǒng)與比 特流同步所需的時間段。所述方法還可以包括根據(jù)一個或多個控制設(shè)置確定用于多聲道輸 入信號的相應(yīng)的幀序列的空間元數(shù)據(jù)幀序列。另外,所述方法可以包括根據(jù)更新時段對空 間元數(shù)據(jù)幀序列中的一個或多個空間元數(shù)據(jù)幀作為獨(dú)立幀進(jìn)行編碼。
[0051] 根據(jù)另一方面,描述了一種軟件程序。該軟件程序可以適于在處理器上執(zhí)行,并且 適于當(dāng)在處理器上被執(zhí)行時執(zhí)行本文檔中所概述的方法步驟。
[0052] 根據(jù)另一方面,描述了 一種存儲介質(zhì)。該存儲介質(zhì)可以包括軟件程序,該軟件程序 可以適于在處理器上執(zhí)行,并且適于當(dāng)在處理器上被執(zhí)行時執(zhí)行本文檔中所概述的方法步 驟。
[0053] 根據(jù)另一方面,描述了一種計(jì)算機(jī)程序產(chǎn)品。該計(jì)算機(jī)程序產(chǎn)品可以包括用于當(dāng) 在計(jì)算機(jī)上被執(zhí)行時執(zhí)行本文檔中所概述的方法步驟的可執(zhí)行指令。
[0054] 應(yīng)注意,包括其在本專利申請中概述的優(yōu)選實(shí)施例的方法和系統(tǒng)可以獨(dú)立使用或 者與本文檔中所公開的其它方法和系統(tǒng)組合使用。此外,本專利申請中所概述的方法和系 統(tǒng)的所有方面可以被任意組合。具體地說,權(quán)利要求的特征可以以任意的方式彼此組合。
【附圖說明】
[0055] 下面以示例性的方式參照附圖來說明本發(fā)明,其中,
[0056] 圖1示出用于執(zhí)行空間合成的示例音頻處理系統(tǒng)的一般化框圖;
[0057] 圖2示出圖1的系統(tǒng)的示例細(xì)節(jié);
[0058] 圖3類似于圖1示出用于執(zhí)行空間合成的示例音頻處理系統(tǒng);
[0059] 圖4示出用于執(zhí)行空間分析的示例音頻處理系統(tǒng);
[0060] 圖5a示出示例參數(shù)化多聲道音頻編碼系統(tǒng)的框圖;
[0061] 圖5b不出不例空間分析和編碼系統(tǒng)的框圖;
[0062] 圖5c例示多聲道音頻信號的聲道的幀的示例時間-頻率表示;
[0063] 圖5d例示多聲道音頻信號的多個聲道的示例時間-頻率表示;
[0064] 圖5e示出圖5b所示的空間分析和編碼系統(tǒng)的變換單元所應(yīng)用的示例加窗;
[0065]圖6示出用于降低空間元數(shù)據(jù)的數(shù)據(jù)速率的示例方法的流程圖;
[0066] 圖7a例示用于在解碼系統(tǒng)處執(zhí)行的用于空間元數(shù)據(jù)的示例過渡方案;
[0067]圖7b至7d例示為確定空間元數(shù)據(jù)而應(yīng)用的示例窗函數(shù);
[0068] 圖8示出參數(shù)化多聲道編解碼系統(tǒng)的示例處理路徑的框圖;
[0069] 圖9a和9b示出被配置為執(zhí)行修剪保護(hù)和/或動態(tài)范圍控制的示例參數(shù)化多聲道 音頻編碼系統(tǒng)的框圖;
[0070] 圖10例示用于補(bǔ)償DRC參數(shù)的示例方法;和
[0071] 圖11示出用于修剪保護(hù)的示例內(nèi)插曲線。
【具體實(shí)施方式】
[0072] 如引言部分中所概述的,本文檔涉及使用參數(shù)化多聲道表示的多聲道音頻編碼系 統(tǒng)。以下,描述示例多聲道音頻編碼和解碼(編解碼)系統(tǒng)。在圖1至3的上下文中,描述 音頻編解碼系統(tǒng)的解碼器可以如何使用所接收的參數(shù)化多聲道表示來從所接收的m聲道 下混信號X(例如,m= 2)產(chǎn)生n聲道上混信號Y(通常,n> 2)。隨后,描述多聲道音頻編 解碼系統(tǒng)的編碼器相關(guān)的處理。具體地說,描述可以如何從n聲道輸入信號產(chǎn)生參數(shù)化多 聲道表不和m聲道下混信號。
[0073] 圖1例示被配置為從下混信號X和混合參數(shù)集合產(chǎn)生上混信號Y的示例音頻處理 系統(tǒng)100的框圖。具體地說,音頻處理系統(tǒng)100被配置為僅基于下混信號X和所述混合參 數(shù)集合產(chǎn)生上混信號。從比特流P,音頻解碼器140提取下混信號X= [1。r。]1和混合參數(shù) 集合。在所例示的示例中,所述混合參數(shù)集合包括參數(shù)apa2、a3、0p02、0Pgjpky 混合參數(shù)可以以量化和/或熵編碼形式包括在比特流P中的各混合參數(shù)數(shù)據(jù)字段中?;旌?參數(shù)可以被稱為元數(shù)據(jù)(或空間元數(shù)據(jù)),該元數(shù)據(jù)連同編碼的下混信號X-起被發(fā)送。在 本公開的一些實(shí)例中,已明確地指示,一些連接線適于發(fā)送多聲道信號,其中,這些線被提 供與各數(shù)量的聲道相鄰的交叉線。在圖1所示的系統(tǒng)1〇〇中,下混信號X包括m= 2個聲 道,并且以下將定義的上混信號Y包括n= 6個聲道(例如,5. 1聲道)。
[0074] 其動作參數(shù)化地取決于混合參數(shù)的上混級110接收下混信號。下混修改處理器 120通過非線性處理并且通過形成下混聲道的線性組合來修改下混信號,以便獲得修改的 下混信號D=W1d2]T。第一混合矩陣130接收下混信號X和修改的下混信號D,并且通過 形成以下線性組合來輸出上混信號Y= [lfIsrfrsclfe]T:
[0076] 在以上線性組合中,混合參數(shù)a3控制從下混信號形成的中間類型信號(與IQ+r。 成比例)對上混信號中的所有聲道的貢獻(xiàn)?;旌蠀?shù)P3控制側(cè)邊類型信號(與U-r。成 比例)對上混信號中的所有聲道的貢獻(xiàn)。因此,在使用情況下,可以合理地預(yù)期,混合參數(shù) a3和0 3將具有不同的統(tǒng)計(jì)性質(zhì),這使得能夠更高效地編碼。(作為比較考慮參考參數(shù)化 (其中,獨(dú)立的混合參數(shù)控制下混信號對上混信號中的空間左聲道和空間右聲道的各左聲 道貢獻(xiàn)和右聲道貢獻(xiàn)),注意,這樣的混合參數(shù)的統(tǒng)計(jì)可觀察量可能沒有明顯不同。)
[0077] 返回到以上方程所示的線性組合,進(jìn)一步注意,增益參數(shù)h、k2可以取決于比特流 P中的共用的單個混合參數(shù)。此外,增益參數(shù)可以被規(guī)范化以使得k/+k22= 1。
[0078] 修改的下混信號對上混信號中的空間左聲道和空間右聲道的貢獻(xiàn)可以分別由參 數(shù)P1(第一修改聲道對左聲道的貢獻(xiàn))和P2 (第二修改聲道對右聲道的貢獻(xiàn))控制。此 外,下混信號中的每個聲道對其上混信號中的空間上對應(yīng)的聲道的貢獻(xiàn)可以單獨(dú)地通過改 變獨(dú)立的混合參數(shù)g控制。優(yōu)選地,增益參數(shù)g被不均勻地量化以便避免大的量化誤差。
[0079] 現(xiàn)在另外參照圖2,下混修改處理器120可以在第二混合矩陣121中執(zhí)行下混聲道 的以下線性組合(其是交叉混合):
[0081] 如該公式所指示的,填充第二混合矩陣的增益可以參數(shù)化地取決于比特流P中所 編碼的混合參數(shù)中的一些。由第二混合矩陣121執(zhí)行的處理得到中間信號Z= [Z1z2]T,該 中間信號被供給到解相關(guān)器122。圖1示出了解相關(guān)器122包括兩個子解相關(guān)器123、124 的示例,子解相關(guān)器123、124可以被相同地配置(S卩,響應(yīng)于相同的輸入,提供相同的輸出) 或者被不同地配置。作為此的替代方案,圖2示出了所有的解相關(guān)相關(guān)的操作由單個單元 122執(zhí)行的示例,單元122輸出初步修改的下混信號D'。圖2中的下混修改處理器120還 可以包括偽像(artifact)衰減器125。在示例實(shí)施例中,如以上所概述的,偽像衰減器125 被配置為檢測中間信號Z中的尾音、并且通過基于檢測的尾音的位置使該信號中的非期望 的偽像衰減來采取校正動作。該衰減生成修改的下混信號D,該信號從下混修改處理器120 輸出。
[0082] 圖3示出了與圖1所示的類似類型的第一混合矩陣130及其相關(guān)聯(lián)的變換級301、 302和逆變換級311、312、313、314、315、316。變換級可以例如包括濾波器組,諸如正交鏡像 濾波器組(QMF)。因此,位于變換級30U302的上游的信號是時域中的表示,如位于逆變換 級311、312、313、314、315、316的下游的信號一樣。其它信號是頻域表示。其它信號的時間 依賴性可以例如被表達(dá)為與該信號被分割到的時間塊相關(guān)的塊值或離散值。注意,圖3使 用與以上矩陣方程相比的替代記號;一個可以例如具有對應(yīng)關(guān)系\。~1。、\。~r。、八~lf、 L~1身。此外,圖3中的記號強(qiáng)調(diào)信號的時域表示Xw⑴和同一信號的頻域表示Xw (f) 之間的區(qū)別。理解的是,頻域表示被分割為時間幀;因此,它是時間和頻率變量兩者的函數(shù)。
[0083] 圖4示出了音頻處理系統(tǒng)400,其用于產(chǎn)生下混信號X以及控制上混級110所應(yīng)用 的增益的混合參數(shù)apa2、a3、0p0 2、0 3、g、kpk2。該音頻處理系統(tǒng)400通常位于編碼 器側(cè),例如,廣播或記錄設(shè)備中,而圖1所示的系統(tǒng)1〇〇通常將被部署在解碼器側(cè),例如,回 放設(shè)備中。下混級410基于n聲道信號Y生成m聲道信號X。優(yōu)選地,下混級410對這些信 號的時域表示進(jìn)行操作。參數(shù)提取器420可以通過分析n聲道信號Y并且考慮下混級410 的定量和定性的性質(zhì)來生成混合參數(shù)<^、a2、a3、1^、02、的值?;旌蠀?shù)可 以如圖4中的記號所表明的那樣是頻率塊值的矢量,并且可以被進(jìn)一步分割為時間塊。在 示例實(shí)現(xiàn)中,下混級410是時間不變的和/或頻率不變的。由于時間不變性和/或頻率不 變性,在下混級410和參數(shù)提取器420之間通常不需要通信連接,但是參數(shù)提取可以獨(dú)立地 進(jìn)行。這為實(shí)現(xiàn)提供很大的自由。它還給予了縮短系統(tǒng)的總延時的可能性,因?yàn)閹讉€處理 步驟可以并行執(zhí)行。作為一個示例,DolbyDigitalPlus格式(或EnhancedAC-3)可以 用于對下混信號X進(jìn)行編碼。
[0084] 參數(shù)提取器420可以通過訪問下混規(guī)范來了解下混級410的定量的和/或定性的 性質(zhì),所述下混規(guī)范可以指定以下之一:增益值集合、識別對其預(yù)定義增益的預(yù)定義下混模 式的索引等。下混規(guī)范可以是被預(yù)先加載到下混級410和參數(shù)提取器420中的每一個中的 存儲器中的數(shù)據(jù)??商娲鼗蛘吡硗獾?,下混規(guī)范可以通過連接這些單元的通信線路從下 混級410發(fā)送到參數(shù)提取器420。作為另一替代方案,下混級410至參數(shù)提取器420中的每 一個均可以從共用的數(shù)據(jù)源訪問下混規(guī)范,所述共用的數(shù)據(jù)源諸如音頻處理系統(tǒng)中的或者 與輸入信號Y相關(guān)聯(lián)的元數(shù)據(jù)流中的(例如,圖5a所示的配置單元540的)存儲器。
[0085] 圖5a示出了示例多聲道編碼系統(tǒng)500,其用于使用下混信號X(包括m個聲道,其 中,m<n)和參數(shù)化表示來對多聲道音頻輸入信號Y561 (包括n個聲道)進(jìn)行編碼。系統(tǒng) 500包括下混編碼單元510,其包括例如圖4的下混級410。下混編碼單元510可以被配置 為提供下混信號X的編碼版本。下混編碼單元510可以例如使用DolbyDigitalPlus編碼 器來對下混信號X進(jìn)行編碼。此外,系統(tǒng)500包括參數(shù)編碼單元510,其可以包括圖4的參 數(shù)提取器420。參數(shù)編碼單元510可以被配置為對所述混合參數(shù)集合apa2、a3、Pp0 2、 0 3、g、Ic1 (也被稱為空間參數(shù))進(jìn)行量化和編碼以得到編碼的空間參數(shù)562。如以上所指 示的,參數(shù)k2可以從參數(shù)ki確定。另外,系統(tǒng)500可以包括比特流產(chǎn)生單元530,其被配置 為從編碼的下混信號563和編碼的空間參數(shù)562產(chǎn)生比特流P564。比特流564可以根據(jù) 預(yù)定的比特流語法進(jìn)行編碼。具體地說,比特流564可以以符合DolbyDigitalPlus(DD+ 或E-AC-3,EnhancedAC-3)的格式進(jìn)彳丁編碼。
[0086] 系統(tǒng)500可以包括配置單元540,其被配置為確定對于參數(shù)編碼單元520和/或下 混編碼單元510的一個或多個控制設(shè)置552、554??梢曰谙到y(tǒng)500的一個或多個外部設(shè) 置551來確定所述一個或多個控制設(shè)置552、554。舉例來說,所述一個或多個外部設(shè)置551 可以包括比特流564的總(最大或固定)數(shù)據(jù)速率。配置單元540可以被配置為根據(jù)所述 一個或多個外部設(shè)置551來確定一個或多個控制設(shè)置552。對于參數(shù)編碼單元520的所述 一個或多個控制設(shè)置552可以包括以下中的一個或多個:
[0087] 魯編碼的空間參數(shù)562的最大數(shù)據(jù)速率。該控制設(shè)置在本文中被稱為元數(shù)據(jù)數(shù)據(jù) 速率設(shè)置。
[0088]魯將由參數(shù)編碼單元520對音頻信號561的每一幀確定的參數(shù)集合的最大數(shù)量和 /或特定數(shù)量。該控制設(shè)置在本文中被稱為時間分辨率設(shè)置,因?yàn)樗试S影響空間參數(shù)的時 間分辨率。
[0089] 魯參數(shù)編碼單元520將對其確定空間參數(shù)的參數(shù)帶的數(shù)量。該控制設(shè)置在本文中 被稱為頻率分辨率設(shè)置,因?yàn)樗试S影響空間參數(shù)的頻率分辨率。
[0090] 魯用于對空間參數(shù)進(jìn)行量化的量化器的分辨率。該控制設(shè)置在本文中被稱為量化 器設(shè)置。
[0091] 參數(shù)編碼單元520可以使用以上提及的用于確定和/或編碼將被包括到比特流 564中的空間參數(shù)的控制設(shè)置552中的一個或多個。通常,輸入音頻信號Y561被分割為 幀序列,其中,每個幀包括輸入音頻信號Y561的預(yù)定數(shù)量的采樣。元數(shù)據(jù)數(shù)據(jù)速率設(shè)置可 以指示可供用于對輸入音頻信號561的幀的空間參數(shù)進(jìn)行編碼的比特的最大數(shù)量。用于對 幀的空間參數(shù)562進(jìn)行編碼的比特的實(shí)際數(shù)量可以低于元數(shù)據(jù)數(shù)據(jù)速率設(shè)置所分配的比 特的數(shù)量。參數(shù)編碼單元520可以被配置為通知配置單元540關(guān)于實(shí)際使用的比特?cái)?shù)量 553,從而使得配置單元540能夠確定可供用于對下混信號X進(jìn)行編碼的比特的數(shù)量。該比 特?cái)?shù)量可以被作為控制設(shè)置554傳送到下混編碼單元510。下混編碼單元510可以被配置 為(例如,使用多聲道編碼器,諸如DolbyDigitalPlus)基于控制設(shè)置554對下混信號X 進(jìn)行編碼。這樣,尚未用于對空間參數(shù)進(jìn)行編碼的比特可以用于對下混信號進(jìn)行編碼。
[0092] 圖5b示出了示例參數(shù)編碼單元520的框圖。參數(shù)編碼單元520可以包括變換單 元521,其被配置為確定輸入信號561的頻率表示。具體地說,變換單元521可以被配置為 將輸入信號561的幀變換為一個或多個頻譜,每個頻譜包括多個頻率區(qū)間。舉例來說,變換 單元521可以被配置為將濾波器組(例如,QMF濾波器組)應(yīng)用于輸入信號561。濾波器組 可以是臨界采樣濾波器組。濾波器組可以包括預(yù)定數(shù)量Q個濾波器(例如,Q= 64個濾波 器)。這樣,變換單元521可以被配置為從輸入信號561確定Q個子帶信號,其中,每個子帶 信號與相應(yīng)的頻率區(qū)間571相關(guān)聯(lián)。舉例來說,輸入信號561的K個采樣的幀可以被變換 為Q個子帶信號,其中,每一子帶信號K/Q個頻率系數(shù)。換句話說,輸入信號561的K個采 樣的幀被變換為K/Q個頻譜,其中,每個頻譜包括Q個頻率區(qū)間。在特定示例中,幀長度為 K= 1536,頻率區(qū)間的數(shù)量為Q= 64,并且頻譜的數(shù)量K/Q= 24。
[0093] 參數(shù)編碼單元520可以包括分帶(banding)單元522,其被配置為將一個或多個頻 率區(qū)間571分組為頻帶572。頻率區(qū)間571到頻帶572的分組可以取決于頻率分辨率設(shè)置 552。表1例示了頻率區(qū)間571到頻帶572的示例映射,其中,該映射可以由分帶單元522 基于頻率分辨率設(shè)置552應(yīng)用。在所例示的示例中,頻率分辨率設(shè)置552可以指示頻率區(qū) 間571到7、9、12或15個頻帶的分帶。分帶通常對人耳的心理聲學(xué)行為進(jìn)行建模。其結(jié)果 是,每一頻帶572的頻率區(qū)間571的數(shù)量通常隨頻率增加而增加。
[0094]
[0095]表I