用于信道間差估計的方法和空間音頻編碼裝置制造方法
【專利摘要】本發(fā)明提供了用于低復(fù)雜的信道間差估計的方法和裝置。用于估計信道間差I(lǐng)CD的方法包括:對多個音頻信道信號應(yīng)用變換;計算所述多個音頻信道信號中的至少一者與預(yù)定頻率范圍上的參考音頻信道信號之間的所述ICD的多個ICD值,每個ICD值在所述預(yù)定頻率范圍的一部分上進行計算;通過將所述多個ICD值中的每一者乘以對應(yīng)的頻率相關(guān)加權(quán)因數(shù),來對所述多個ICD值中的每一者計算加權(quán)的ICD值;以及通過加入所述多個加權(quán)的ICD值,來對所述預(yù)定頻率范圍計算ICD范圍值。
【專利說明】用于信道間差估計的方法和空間音頻編碼裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及用于信道間差(ICD)估計的方法以及空間音頻編碼或參數(shù)的多信道編碼裝置,尤其是針對參數(shù)的多信道音頻編碼。
【背景技術(shù)】
[0002]參數(shù)的多信道音頻編碼在針對音頻和聲音信號處理應(yīng)用的IEEE專題研討會會干丨J, 2001 年 10 月,第 199 頁至第 202 頁(Proc.1EEE Workshop on App1.0f Sig.Proc.toAudio and Acoust., Oct.2001, pp.199 - 202)中法勒(Faller C.)和鮑姆加特(BaumgarteF.)的“使用感知參數(shù)化的空間音頻的有效表示(Efficient representation of spatialaudio using perceptual parametrization)”中有描述。下混的音頻信號可經(jīng)上混以合成多信道音頻信號,這可通過使用空間提示來產(chǎn)生比下混音頻信號更多的輸出音頻信道來實現(xiàn)。通常,下混的音頻信號因多信道音頻信號,例如,立體聲音頻信號,的多個音頻信道信號的疊加而產(chǎn)生。對下混的音頻信號的波形進行編碼并且將其與涉及空間提示的輔助數(shù)據(jù)一起放入音頻比特流中。解碼器基于波形編碼的音頻信道,使用輔助數(shù)據(jù)來合成多信道音頻信號。
[0003]存在數(shù)個空間提示或參數(shù)可用于合成多信道音頻信號。首先,信道間電平差(ILD)指示待比較的兩個信道上的音頻信號的電平之間的差。第二,信道間時間差(ITD)指示人耳之間的聲音到達時間差。ITD值對聲音的定位很重要,因為它提供提示以識別聲源相對于人耳的入射方向或角度。第三,信道間相位差(ICD)指定待比較的兩個信道之間的相對相位差。子帶I⑶值可用作子帶ITD值的估計。最后,信道間相干(ICC)定義為在根據(jù)ITD或ICD的相位調(diào)整之后的歸一化信道間交叉相關(guān)。ICC值可用于估計聲源的寬度。
[0004]ILD、ITD、I⑶及ICC是空間多信道編碼/解碼的重要參數(shù),特別是對于立體聲音頻信號,尤其是雙聲道的音頻信號。ITD可,例如,覆蓋-1.5ms至1.5ms之間的聲響延遲的范圍。I⑶可覆蓋-與Ji之間的相位差的全部范圍。ICC可覆蓋相關(guān)的范圍并且可指定在O與I之間的百分比值中或-1與+1之間的其他相關(guān)因數(shù)中。在當前參數(shù)的立體聲編碼方案中,ILD、ITD、I⑶及ICC通常在頻域中進行估計。對于每一子帶,ILD、ITD、I⑶及ICC經(jīng)計算、量化、計入音頻比特流的參數(shù)段中而被傳輸。
[0005]由于參數(shù)的音頻編碼方案的比特率的限制,有時在音頻比特流的參數(shù)段中沒有足夠的比特來傳輸空間編碼參數(shù)所有的值。例如,文件US2006/0153408A1揭示了一種音頻編碼器,其中對多個音頻信道產(chǎn)生組合的提示編碼以作為邊信息計入下混的音頻比特流中。文件US8,054,981B2揭示了一種用于空間音頻編碼的方法,該方法使用與以下電平關(guān)系相關(guān)聯(lián)的量化規(guī)則,即某個音頻信道的能量測量與多個音頻信道的能量測量的電平關(guān)系。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的構(gòu)想是對在多個音頻信道信號中的每一對音頻信道信號之間的每個頻率子帶或頻率窗口計算信道間差I(lǐng)CD值并且基于所述ICD值來計算加權(quán)平均值。根據(jù)加權(quán)方案,將感知上重要的頻率子帶或頻率窗口優(yōu)先于較不重要者來考慮。
[0007]有利的是,這種技術(shù)能將考慮能量或感知重要性考慮在內(nèi),這樣環(huán)境聲或漫射聲將不會影響ICD估計。這尤其有利于有意義地表示具有語音音頻數(shù)據(jù)等強的直流分量的聲音的空間圖像。
[0008]此外,所提出的方法減少了待計入音頻比特流中的空間編碼參數(shù)的數(shù)量,從而降低了估計復(fù)雜性和傳輸比特率。
[0009]因此,本發(fā)明的第一方面涉及用于估計信道間差I(lǐng)CD的方法,所述方法包括對多個音頻信道信號應(yīng)用從時域到頻域的變換;計算多個音頻信道信號中的至少一者與預(yù)定頻率范圍上的參考音頻信道信號之間的ICD的多個ICD值,每個ICD值在預(yù)定頻率范圍的一部分上進行計算;通過將多個ICD值中的每一者乘以對應(yīng)的頻率相關(guān)加權(quán)因數(shù),來對多個ICD值中的每一者計算加權(quán)的ICD值;以及通過加入所述多個加權(quán)的ICD值,來對預(yù)定的頻率范圍計算ICD范圍值。
[0010]根據(jù)第一方面的第一實施方案,I⑶是信道間相位差iro或信道間時間差I(lǐng)TD。這些空間編碼參數(shù)對于聽覺的音頻數(shù)據(jù)重現(xiàn)尤其有利。
[0011]根據(jù)第一方面的第二實施方案,從時域到頻域的變換包括以下項中的一者:快速傅立葉變換FFT、余弦調(diào)制濾波器組、離散傅立葉變換DFT以及復(fù)數(shù)濾波器組。
[0012]根據(jù)第一方面的第三實施方案,預(yù)定頻率范圍包括以下項中的一者:多個音頻信道信號的全頻帶、多個音頻信道信號的全頻帶內(nèi)的預(yù)定頻率間隔,以及多個音頻信道信號的全頻帶內(nèi)的多個預(yù)定頻率間隔。
[0013]根據(jù)第一方面的第三實施方案的第一實施方案,預(yù)定頻率間隔在200Hz與600Hz之間或在300Hz與1.5kHz之間。這些頻率范圍對應(yīng)于聽覺的頻率相關(guān)敏感度,其中I⑶參數(shù)最有意義。
[0014]根據(jù)第一方面的第四實施方案,參考音頻信道信號包括一個所述音頻信道信號或從多個音頻信道信號中的至少兩個音頻信道信號導(dǎo)出的下混音頻信號。
[0015]根據(jù)第一方面的第五實施方案,計算多個ICD值包括基于頻率子帶來計算多個ICD 值。
[0016]根據(jù)第一方面的第五實施方案的第一實施方案,頻率相關(guān)加權(quán)因數(shù)基于頻率子帶的能量來確定,所述頻率子帶的能量基于預(yù)定頻率范圍上的總能量而歸一化。
[0017]根據(jù)第一方面的第五實施方案的第二實施方案,頻率相關(guān)加權(quán)因數(shù)基于在預(yù)定的頻率范圍上歸一化的音頻信道信號的頻率的能量分布的掩蔽曲線來確定。
[0018]根據(jù)第一方面的第五實施方案的第三實施方案,頻率相關(guān)加權(quán)因數(shù)基于在預(yù)定頻率范圍上歸一化的音頻信道信號的子帶的感知熵值來確定。
[0019]根據(jù)第一方面的第六實施方案,頻率相關(guān)加權(quán)因數(shù)在至少兩個相鄰幀之間是平滑的。這樣可為有利的,因為估計的I⑶值在相鄰幀之間相對較穩(wěn)定,這是因為立體聲圖像在短時間段內(nèi)通常不會改變很多。
[0020]根據(jù)本發(fā)明的第二方面,空間音頻編碼裝置包括變換模塊,該變換模塊用于對多個音頻信道信號應(yīng)用從頻域到時域的變換,以及參數(shù)估計模塊,該參數(shù)估計模塊:用于計算多個音頻信道信號中的至少一者與預(yù)定頻率范圍上的參考音頻信道信號之間的ICD的多個ICD值;用于通過將多個ICD值中的每一者乘以對應(yīng)的頻率相關(guān)加權(quán)因數(shù),來對多個ICD值中的每一者計算加權(quán)的ICD值;并且用于通過加入所述多個加權(quán)的ICD值,來對預(yù)定的頻率范圍計算ICD范圍值。
[0021]根據(jù)第二方面的第一實施方案,空間音頻編碼裝置進一步包括下混模塊,所述下混模塊用于通過下混多個音頻信道信號來產(chǎn)生下混音頻信道信號。
[0022]根據(jù)第二方面的第二實施方案,空間音頻編碼裝置進一步包括編碼模塊,所述編碼模塊耦合到下混模塊并且用于產(chǎn)生編碼的音頻比特流,所述編碼的音頻比特流包括編碼的下混的音頻比特流。
[0023]根據(jù)第二方面的第三實施方案,空間音頻編碼裝置進一步包括流模塊,所述流模塊耦合到參數(shù)估計模塊并且用于產(chǎn)生音頻比特流,所述音頻比特流包括下混的音頻比特流及輔助數(shù)據(jù),所述輔助數(shù)據(jù)包括多個音頻信道信號的ICD范圍值。
[0024]根據(jù)第二方面的第三實施方案的第一實施方案,流模塊進一步用于在音頻比特流中設(shè)置標志,該標志指示音頻比特流中輔助數(shù)據(jù)的存在,所述輔助數(shù)據(jù)包括ICD范圍值。
[0025]根據(jù)第二方面的第四實施方案,所述標志針對整個音頻比特流二設(shè)置或包含在音頻比特流中的輔助數(shù)據(jù)中。
[0026]根據(jù)本發(fā)明的第三方面,提供一種計算機程序,該計算機程序包括程序編碼,該程序編碼在計算機上運行時執(zhí)行根據(jù)第一方面或其實施方案中的任一項的方法。
[0027]本文描述的方法可實施為數(shù)字信號處理器(DSP)、微控制器或任何其他邊處理器中的軟件或?qū)嵤閷S眉呻娐?ASIC)內(nèi)的硬件電路。
[0028]本發(fā)明可在數(shù)字電子電路中或在計算機硬件、固件、軟件中或在其組合中實施。
[0029]通過以下描述,容易理解額外的實施例和實施方案。確切地說,除非另有說明,下文所述的實施例、各方面及實施方案中的任何特征,都可與實施例、各方面及實施方案中的任何其他特征進行組合。
【專利附圖】
【附圖說明】
[0030]包含附圖用于提供對本發(fā)明的進一步理解。它們圖示了各實施例并且可結(jié)合描述有助于解釋本發(fā)明的原理。在通過參考下文中的詳細描述而更好理解之后,讀者可了解其他實施例和許多預(yù)期優(yōu)勢、設(shè)想的原理以及功能性。圖中的元件不一定相對于彼此按比例畫制。一般而言,相同參考編號指代對應(yīng)的類似部分。
[0031]圖1示意地圖示了空間音頻編碼系統(tǒng)。
[0032]圖2示意地圖示了空間音頻編碼裝置。
[0033]圖3示意地圖示了空間音頻解碼裝置。
[0034]圖4示意地圖示了用于估計信道間差的方法的實施例。
[0035]圖5示意地圖示了音頻比特流的比特流結(jié)構(gòu)的變體。
【具體實施方式】
[0036]在以下詳細描述中,參考了附圖,并且其中圖示了具體的實施例。應(yīng)明白,可利用其他實施例并且在不脫離本發(fā)明范圍的情況下可作出各種結(jié)構(gòu)或邏輯變化。除非另有說明,各實施例的功能、原理及細節(jié)可與其他實施例進行組合。一般地,此應(yīng)用旨在涵蓋本文所論述的具體實施例的任何調(diào)整或變型。因此,以下詳細描述不應(yīng)理解為具有限制意義,而本發(fā)明的范圍是由所附權(quán)利要求來界定的。
[0037]實施例可包括各種方法和流程,這些方法和流程可在機器可讀媒體所提供的機器可讀指令內(nèi)實施,所述機器可讀媒體包括但不限于,能夠存儲可由以下機器使用的信息的裝置、設(shè)備、機制或系統(tǒng):計算機、計算裝置、處理單元、網(wǎng)絡(luò)裝置、便攜式計算機、微處理器等。所述機器可讀媒體可包括易失性或非易失性媒體以及任何形式的傳播信號,例如電信號、數(shù)字信號、邏輯信號、光信號、聲信號、聲光信號等,所述媒體能夠傳遞信息到機器。
[0038]在下文中,參考了各方法和方法步驟,這些方法和方法步驟示意地并示例性地圖示于流程圖和方框圖中。應(yīng)理解結(jié)合這些說明性圖而描述的方法也可由系統(tǒng)、設(shè)備和/或裝置的實施例容易地執(zhí)行。確切地說,應(yīng)明白,能夠執(zhí)行詳細方框圖和/或流程圖的系統(tǒng)、設(shè)備和/或裝置不一定限于下文所示和詳細描述的系統(tǒng)、設(shè)備和/或裝置,而是可為不同的系統(tǒng)、設(shè)備和/或裝置。術(shù)語“第一”、“第二”、“第三”等僅僅用作標記,而不旨在對它們的目標強加數(shù)字要求或建立它們的目標的特定重要性排行。
[0039]圖1不意地圖不了空間首頻編碼系統(tǒng)100。空間首頻編碼系統(tǒng)100包括空間首頻編碼裝置10和空間音頻解碼裝置20。多個音頻信道信號10a、10b被輸入到空間音頻編碼裝置10,圖1中只示例性地示出了兩個音頻信道信號??臻g音頻編碼裝置10對音頻信道信號10a、10b進行編碼并下混并且產(chǎn)生音頻比特流1,該音頻比特流被傳輸?shù)娇臻g音頻解碼裝置20。空間音頻解碼裝置20對音頻比特流I中的音頻數(shù)據(jù)進行解碼并上混并且產(chǎn)生多個輸出音頻信道信號20a、20b,圖1中只示例性地示出了兩個輸出音頻信道信號。各個音頻信道信號10a、10b及20a、20b的數(shù)量在原則上是沒有限制的。例如,在雙聲道立體聲信號中,音頻信道信號10a、10b及20a、20b的數(shù)量可為2。例如,雙聲道立體聲信號可用于基于3D音頻或耳機的環(huán)繞呈現(xiàn),例如,使用HRTF過濾。
[0040]空間音頻編碼系統(tǒng)100可用于對ITU-T G.722、G.722附件(Annex) B、G.711.1和/或G.711.1附件D的立體聲擴展進行編碼。此外,空間音頻編碼系統(tǒng)100可用于移動應(yīng)用中的語音和音頻編碼/解碼,例如在3GPP EVS (增強型語音服務(wù))編碼譯碼器中界定的。
[0041]圖2示意地更詳細地示出了圖1中的空間音頻編碼裝置10。空間音頻編碼裝置10可包括變換模塊15、耦合到變換模塊15的參數(shù)估計模塊11、耦合到變換模塊15的下混模塊12、耦合到下混模塊12的編碼模塊13及耦合到編碼模塊13和參數(shù)估計模塊11的流模塊14。
[0042]變換模塊15可用于從時域到頻域到多個音頻信道信號10a、IOb施加變換,所述音頻信道信號輸入到空間編碼模塊10。下混模塊12可用于從變換模塊15接收變換的音頻信道信號10a、IOb并且用于通過下混多個變換的音頻信道10a、IOb來產(chǎn)生至少一個下混的音頻信道信號。下混的音頻信道信號的數(shù)量可為,例如小于變換的音頻信道信號10a、10b的數(shù)量。例如,下混模塊12可用于只產(chǎn)生一個下混的音頻信道信號。編碼模塊13可用于接收下混的音頻信道信號并且用于產(chǎn)生編碼的音頻比特流,該編碼的音頻比特流包括下混的音頻信道信號。
[0043]參數(shù)估計模塊11可用于接收多個作為輸入的音頻信道信號10a、10b并且用于計算多個音頻信道信號IOa和IOb中的至少一者與預(yù)定頻率范圍上的參考音頻信道信號之間的I⑶的多個信道間差I(lǐng)⑶值。參考音頻信道信號可為,例如多個音頻信道信號IOa和IOb中的一者。或者,它可能使用得自多個音頻信道信號IOa和IOb中至少兩個音頻信道信號的下混的音頻信號。參數(shù)估計模塊11可進一步用于通過將多個I⑶值中的每一者乘以對應(yīng)的頻率相關(guān)加權(quán)因數(shù),來對多個ICD值中的每一者計算加權(quán)的ICD值;并且用于通過加入所述多個加權(quán)的ICD值,來對預(yù)定的頻率范圍計算ICD范圍值。
[0044]隨后,I⑶范圍值可輸入到流模塊14,該流模塊14可用于產(chǎn)生輸出音頻比特流1,該輸出音頻比特流包括來自編碼模塊13的編碼的音頻比特流以及含有ICD范圍值的量化表示的參數(shù)段。流模塊14可進一步用于在音頻比特流I的參數(shù)段中設(shè)置參數(shù)類型標志,用于指示計入音頻比特流I中的ICD范圍值的類型。
[0045]另外,流模塊14可進一步用于在音頻比特流中設(shè)置標志,該標志指示音頻比特流I的參數(shù)段中ICD范圍值的存在。該標志可為整個音頻比特流I設(shè)置或包含在音頻比特流I中的參數(shù)段中。這樣,包含在音頻比特流I中的ICD范圍值的信令可以顯式或隱式的方式發(fā)信號通知空間音頻解碼裝置20。在顯式與隱式信令方案之間可進行切換。
[0046]在隱式信令的情況下,該標志可指示參數(shù)段中的輔助數(shù)據(jù)中二級信道信息的存在。舊式解碼裝置20不檢查此標志是否存在并且因此只對編碼的下混音頻比特流進行解碼。另一方面,非舊式,即最新式的解碼裝置20可檢查接收到的音頻比特流I中此標志的存在并且基于額外的全頻帶空間編碼參數(shù),即包含在音頻比特流I的參數(shù)段中的ICD范圍值,來重建多信道音頻信號20a、20b。
[0047]當使用顯式信令時,整個音頻比特流I可標記為含有I⑶范圍值。這樣,舊式解碼裝置20不能解碼比特流并且因此丟棄音頻比特流I。另一方面,最新式的解碼裝置20可決定是解碼整個音頻比特流I還是只對編碼的下混音頻比特流I進行解碼而忽略ICD范圍值。顯式信令的優(yōu)勢可從此處看到,例如,新的移動終端可決定對音頻比特流的哪部分進行解碼,從而節(jié)約能量并且因此延長集成式電池的電池壽命。對空間編碼參數(shù)進行解碼通常更加復(fù)雜并且需要更多能量。另外,依靠呈現(xiàn)系統(tǒng),最新式的解碼裝置20可決定應(yīng)對音頻比特流I的哪部分進行解碼。例如,關(guān)于用耳機呈現(xiàn),只對編碼的下混音頻比特流進行解碼可能已經(jīng)足夠,而多信道音頻信號只在移動終端連接到具有此多信道呈現(xiàn)功能的塢站時才進行解碼。
[0048]圖3示意地更詳細地示出了圖1中的空間音頻解碼裝置20??臻g音頻解碼裝置20可包括比特流提取模塊26、參數(shù)提取模塊21、解碼模塊22、上混模塊24及變換模塊25。比特流提取模塊26可用于接收音頻比特流I并且將裝入音頻比特流I中的參數(shù)段與編碼的下混音頻比特流分離。參數(shù)提取模塊21可用于檢測接收到的音頻比特流I的參數(shù)段中的參數(shù)類型標志,該參數(shù)類型標志用于指示計入音頻比特流I中的ICD范圍值。參數(shù)提取模塊21可進一步用于從接收到的音頻比特流I的參數(shù)段讀取ICD范圍值。
[0049]解碼模塊22可用于對編碼的下混音頻比特流進行解碼并且用于將解碼的上混音頻信號輸入到上混模塊24中。上混模塊24可耦合到參數(shù)提取模塊21并且用于使用從接收到的音頻比特流I的參數(shù)段讀取的ICD范圍值,來將解碼的下混音頻信號上混為多個音頻信道信號,所述ICD范圍值由參數(shù)提取模塊21提供。最后,變換模塊25可耦合到上混模塊24并且用于基于多個音頻信道信號而將多個音頻信道信號從頻域變換到時域,用于聲音的重現(xiàn)。
[0050]圖4示意地示出了用于參數(shù)空間編碼的方法30的實施例。方法30在第一步驟中包括對輸入信道,例如輸入信道10a、10b執(zhí)行時-頻變換。在立體聲信號的情況下,第一變換在步驟30a執(zhí)行,而第二變換在步驟30b執(zhí)行。在每一種情況下,該變換可通過使用快速傅立葉變換(FFT)來執(zhí)行?;蛘?,可執(zhí)行短時傅立葉變換(STFT)、用余弦調(diào)制濾波器組進行的余弦調(diào)制濾波或用復(fù)數(shù)濾波器組進行的復(fù)數(shù)濾波。
[0051]在第二步驟31中,可對每個子帶計算交叉譜c [b],如
【權(quán)利要求】
1.一種用于估計信道間差I(lǐng)⑶的方法(30),包括: 對多個音頻信道信號進行(30a,30b)從時域到頻域的變換; 計算(31,32)在所述多個音頻信道信號中的至少一者與預(yù)定頻率范圍內(nèi)的參考音頻信道信號之間的所述ICD的多個ICD值,每個ICD值在所述預(yù)定頻率范圍的一部分內(nèi)進行計算; 通過將所述多個ICD值中的每一者乘以對應(yīng)的頻率相關(guān)加權(quán)因數(shù),來對所述多個ICD值中的每一者計算(35)加權(quán)的ICD值;以及 通過加入所述多個加權(quán)的ICD值,來對所述預(yù)定的頻率范圍計算(36) ICD范圍值。
2.根據(jù)權(quán)利要求1所述的方法(30),其中所述ICD是信道間相位差iro或信道間時間差 ITD0
3.根據(jù)權(quán)利要求1和2中的一項權(quán)利要求所述的方法(30),其中從時域到頻域的所述變換包括以下項中的一者:快速傅立葉變換FFT、余弦調(diào)制濾波器組、離散傅立葉變換DFT以及復(fù)數(shù)濾波器組。
4.根據(jù)權(quán)利要求1至3中的一項權(quán)利要求所述的方法(30),其中所述預(yù)定的頻率范圍包括以下項中的一者:所述多個音頻信道信號的全頻帶、所述多個音頻信道信號的所述全頻帶內(nèi)的預(yù)定頻率間隔,以及所述多個音頻信道信號的所述全頻帶內(nèi)的多個預(yù)定頻率間隔。
5.根據(jù)權(quán)利要求4所述的方法(30),其中所述預(yù)定的頻率間隔在200Hz與600Hz之間或在300Hz與1.5kHz之間。
6.根據(jù)權(quán)利要求1至5中的一項權(quán)利要求所述的方法(30),其中所述參考音頻信道信號包括所述音頻信道信號中的一者或從所述多個音頻信道信號中至少兩個音頻信道信號導(dǎo)出的下混音頻信號。
7.根據(jù)權(quán)利要求1至6中的一項權(quán)利要求所述的方法(30),其中計算所述多個ICD值包括基于頻率子帶來計算所述多個ICD值。
8.根據(jù)權(quán)利要求7所述的方法(30),其中所述頻率相關(guān)加權(quán)因數(shù)基于所述頻率子帶的能量來確定,所述頻率子帶的能量基于所述預(yù)定頻率范圍上的總能量而歸一化。
9.根據(jù)權(quán)利要求7所述的方法(30),其中所述頻率相關(guān)加權(quán)因數(shù)基于在所述預(yù)定的頻率范圍上歸一化的所述音頻信道信號的頻率的能量分布的掩蔽曲線來確定。
10.根據(jù)權(quán)利要求7所述的方法(30),其中所述頻率相關(guān)加權(quán)因數(shù)基于在所述預(yù)定的頻率范圍上歸一化的、所述音頻信道信號的所述子帶的感知熵值來確定。
11.根據(jù)權(quán)利要求1至10中的一項權(quán)利要求所述的方法(30),其中所述頻率相關(guān)加權(quán)因數(shù)在至少兩個相鄰幀之間為平滑的。
12.—種空間音頻編碼裝置(10),包括: 變換模塊(15),所述變換模塊用于對多個音頻信道信號(10a ;10b)應(yīng)用從時域到頻域的變換;以及 參數(shù)估計模塊(11),所述參數(shù)估計模塊用于:計算在所述多個音頻信道信號(10a;10b)中的至少一者與預(yù)定頻率范圍上的參考音頻信道信號之間的所述ICD的多個ICD值;通過將所述多個ICD值中的每一者乘以對應(yīng)的頻率相關(guān)加權(quán)因數(shù),來對所述多個ICD值中的每一者計算加權(quán)的ICD值;并且通過加入所述多個加權(quán)的ICD值,來對所述預(yù)定的頻率范圍計算I⑶范圍值。
13.根據(jù)權(quán)利要求12所述的空間音頻編碼裝置(10),進一步包括: 下混模塊(12),所述下混模塊用于通過下混所述多個音頻信道數(shù)據(jù)信號(10a ;10b)來產(chǎn)生下混的音頻信道信號。
14.根據(jù)權(quán)利要求13所述的空間音頻編碼裝置(10),進一步包括: 編碼模塊(13),所述編碼模塊耦合到所述下混模塊(12)并且用于產(chǎn)生編碼的音頻比特流,所述編碼的音頻比特流包括所述編碼的下混的音頻比特流。
15.根據(jù)權(quán)利要求12至14中的一項權(quán)利要求所述的空間音頻編碼裝置(10),進一步包括: 流模塊(14),所述流模塊耦合到所述參數(shù)估計模塊(11)并且用于產(chǎn)生音頻比特流(I ),所述音頻比特流包括下混的音頻比特流及輔助數(shù)據(jù),所述輔助數(shù)據(jù)包括所述多個音頻信道信號(IOa ; IOb)的所述I⑶范圍值。
16.一種具有程序代碼的計算機程序,所述程序代碼在計算機上運行時執(zhí)行根據(jù)權(quán)利要求I至11中的一項權(quán)利要求`所述的方法。
【文檔編號】H04S3/00GK103534753SQ201280023292
【公開日】2014年1月22日 申請日期:2012年4月5日 優(yōu)先權(quán)日:2012年4月5日
【發(fā)明者】郎玥, 大衛(wèi)·維雷特, 許劍峰 申請人:華為技術(shù)有限公司