多聲道音頻信號的時間與空間成形的制作方法

文檔序號：2836937閱讀：198來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：：多聲道音頻信號的時間與空間成形的制作方法
技術(shù)領(lǐng)域：
：本發(fā)明是有關(guān)于多聲道音頻信號的編碼，特別是有關(guān)于用以改善重建的多聲道信號之空間感知性的一種概念。
背景技術(shù)：
：在音頻編碼技術(shù)的近來發(fā)展，得以立體聲(或者單音)信號以及其對應(yīng)的控制數(shù)據(jù)為基礎(chǔ)，重建一頻信號的多聲道表示的能力，成為一種現(xiàn)成可用的技術(shù)。這些方法，與較老式的以矩陣為基礎(chǔ)的解決方法，例如杜比環(huán)繞邏輯(DolbyPrologic)，有顯著的不同，因為會傳送額外的控制數(shù)據(jù)，以依據(jù)所傳送的單音或者立體聲聲道，控制環(huán)繞聲道的重建，也稱之為上混音(up-mix)。因此，該參數(shù)多聲道音頻解碼器，依據(jù)M個傳送聲道，以及依據(jù)額外的控制數(shù)據(jù)，重建N個聲道，其中N〉M。該額外的控制數(shù)據(jù)，代表顯著的小于傳送所有N個聲道所需要的數(shù)據(jù)率，使得該編碼非常有效，同時可以確保與M聲道裝置以及N聲道裝置兩者的兼容性。M個聲道可以是單一單音、立體聲或者5.l聲道表示。因此，有可能在將例如7.2聲道的原始信號下混音成5.1聲道的后向兼容信號，以及空間音頻參數(shù)使得空間音頻解碼器可以在僅需額外負(fù)擔(dān)少量比特率的情況下，重建與原始7.2聲道非常類似的一個版本。這些參數(shù)環(huán)繞聲編碼方法，通常包含依據(jù)ILD(InterchannelLevelDifference,聲道間水平差)以及ICC(InterChannelCoherence，聲道間一致性)的環(huán)繞聲信號的參數(shù)化(parameterisation)。這些參數(shù)描述了例如原始多聲道信號的聲道對之間的功率比(powerratio)以及相關(guān)性(correlation)。在解碼過程中，依據(jù)傳送的ILD參數(shù)所描述的，將接收到的下混音聲道的能量，分散于所有聲道對之間以獲得重建的多聲道信號。然而，由于多聲道信號即使在不同聲道中的信號差異非常大的情況下，所有聲道間仍然可以具有相同的功率分布，由此而產(chǎn)生十分廣闊(擴散)聲音的聽覺印象，因此，將信號與該相同信號的解相關(guān)版本混合，以獲得正確的廣闊度(擴散性)；這個混合過程由ICC參數(shù)所描述。該信號的解相關(guān)版本，是藉由將該信號通過全通濾波器，例如反射器(reverberator)而獲得。這意指該信號的解相關(guān)版本，是在解碼器側(cè)創(chuàng)造出來的，而非像下混音聲道那樣從編碼器傳送至解碼器。從全通濾波器(解相關(guān)器)輸出的輸出信號具有通常是非常平坦的時間響應(yīng)。因此，狄悅克(dirac)輸入信號會得到衰減噪聲突發(fā)輸出。因此，當(dāng)混合解相關(guān)以及原始信號時，對于一些信號形式，例如稠密的瞬時信號(鼓掌喝采信號)，重要的是對該解相關(guān)信號的時間包絡(luò)(erwel叩e)進行成形，以使其更匹配于該下混音聲道，其通常也稱為干信號(drysignal)。若無法做到這些，將造成較大的房間尺寸的感知，以及不自然的發(fā)聲瞬時信號。在瞬時信號以及作為全通濾波器的反射器的情況下，若省略掉對解相關(guān)信號(濕信號)的成形，甚至可能引入回聲形式的偽信號(artefact)。從技術(shù)的觀點來看，重建多聲道信號的其中一個關(guān)鍵挑戰(zhàn)性，例如在MPEG聲音合成中，是在于對于具有非常寬廣的聲音圖像(soundimage)的多聲道音頻的適當(dāng)再現(xiàn)。就技術(shù)方面而言，這對應(yīng)于具有低的聲道間相關(guān)性(或一致性)的、但仍然緊密控制的頻譜以及時間包絡(luò)的數(shù)個信號的產(chǎn)生。這種信號的實例包括"鼓掌喝采"(applause)項，其同時展現(xiàn)高度的解相關(guān)以及尖銳的瞬時事件(拍手聲)兩者。因此，這些項對于MPEG環(huán)繞聲技術(shù)是最關(guān)鍵的；該MPEG環(huán)繞聲技術(shù)，例如在下列文獻(xiàn)中有更詳細(xì)的描述"R印ortonMPEGSpatialAudioCoding腹OListeningTests",IS0/IECJTC1/SC29/WG11(MPEG)，DocumentN7138,Busan，Korea,2005。一般說來，先前技術(shù)針對與寬闊/擴散信號，例如鼓掌喝采聲的最佳再現(xiàn)有關(guān)的多個方面，提供解決方案如下l.改變該解相關(guān)信號的時間(以及頻譜)形狀，以使其適合于被傳送的下混音信號，以免前回聲(pre-echo)-類似偽信號(注這并不需要從該空間音頻編碼器向空間音頻解碼器發(fā)送任何邊信息(sideinformation))。2.使用描述原始輸入信號的時間包絡(luò)的邊信息，以改變合成的輸出聲道的時間包絡(luò)，使其適合于它們的原始包絡(luò)形狀(出現(xiàn)在該對應(yīng)編碼器的輸入)，其中該邊信息是從空間音頻編碼器傳送至空間音頻解碼器。目前，該MPEG環(huán)繞聲參考模型已經(jīng)包含數(shù)種支持這種信號編碼的工具，例如參時域時間成形(TP)參時間包絡(luò)成形(TES)在MPEG環(huán)繞聲合成系統(tǒng)中，產(chǎn)生解相關(guān)聲音并且與"干"(dry)信號混合，以依據(jù)傳送的ICC值來控制合成輸出聲道的相關(guān)。從此處之后，在本文章中把解相關(guān)信號稱之為'擴散'(diffuse)信號，雖然4廣散'這個措辭反映出該重建的空間聲音場的性質(zhì)，而非信號本身的性質(zhì)。對于瞬時信號而言，在解碼器中產(chǎn)生的擴散聲音，并不會自動匹配于干信號的精細(xì)時間形狀，而且也不會與干信號在感知上融合(fuse)得很好。這造成較差的瞬時再現(xiàn)，類似于"前回聲"問題，這是感知音頻編碼中已知的問題。實現(xiàn)時域時間成形的該TP工具，是經(jīng)過設(shè)計藉由處理擴散聲音來解決這個問題。如同在第14圖中所描繪的，該TP工具應(yīng)用于時域。其基本上是由具有比MPEG環(huán)繞聲編碼器的濾波器組所提供的分辨率更高的時間分辨率對干信號和擴散信號進行時間包絡(luò)估計所構(gòu)成。該擴散信號的時間包絡(luò)進行重新縮放，以匹配于干信號的包絡(luò)。這將造成，對于在聲道之間具有寬廣的空間圖像/低相關(guān)性的關(guān)鍵瞬時信號，例如鼓掌喝采聲，聲音質(zhì)量的顯著增加。該包絡(luò)成形(調(diào)整包含在聲道內(nèi)的能量的時間演進)，是通過該濕信號之歸一化(normalized)的短時間能量，匹配于干信號的歸一化的短時間能量而完成。這是通過時變增益函數(shù)(timevaryinggainfunction)來達(dá)成，該時變增益函數(shù)應(yīng)用于該擴散信號，使得該擴散信號的時間包絡(luò)被成形，以匹配于干信號的時間包絡(luò)。必須注意的是，這并不需要從編碼器向解碼器傳送任何邊信息以對該信號的時間包絡(luò)進行處理(該環(huán)繞聲編碼器僅傳送用以選擇性地啟用/禁用TP的控制信息)。第14圖描繪該時域時間成形，如同應(yīng)用于MPEG環(huán)繞聲編碼之內(nèi)的。即將被成形的直達(dá)信號(directsignal)10以及擴散信號(diffusesignal)12為將被處理的信號，兩者均提供于濾波器組域中。在MPEG環(huán)繞聲中，可以有選擇地把可用的剩余信號(residualsignal)14，與該直達(dá)信號10相加，仍然在該濾波器組域之內(nèi)。在MPEG環(huán)繞聲解碼器的該特殊情況中，僅有擴散信號12的高頻率部分會被成形，因此該信號的低頻率部分16，在該濾波器組域中，與直達(dá)信號10相加。直達(dá)信號10以及擴散信號12，通過濾波器組合成裝置18a以及18b，分別轉(zhuǎn)換至?xí)r域。實際的時域時間成形在合成濾波器組之后執(zhí)行。因為僅有擴散信號12的高頻率部分將會進行成形，因此，將直達(dá)信號10以及擴散信號12的時域表示輸入至高通濾波器20a以及20b，以確保在接下來的濾波步驟中，僅有這些信號的高頻部分會被使用。之后，可以接著在頻譜白化器(spectralwhitener)22a以及22b中，進行信號的頻譜白化，以確保信號的全部頻譜范圍內(nèi)的振幅(能量)比率，在接下來的包絡(luò)估計24中，均會被計算到；該包絡(luò)估計24在一給定的時間部分之內(nèi)，對包含在直達(dá)信號以及擴散信號之內(nèi)的能量的比率進行比較。這個時間部分，通常由幀長度(framelength)來定義。該包絡(luò)估計24具有縮放因子26，作為其輸出；該縮放因子26在時域中施加到包絡(luò)成形28中的擴散信號12，以保證信號包絡(luò)對于擴散信號12以及直達(dá)信號10，在每一幀內(nèi)基本上是相同的。最后，該包絡(luò)已成形的擴散信號經(jīng)由高通濾波器29，再一次進行高通濾波，以保證沒有較低頻帶的偽信號包含在該包絡(luò)已成形的擴散信號中。直達(dá)信號以及擴散信號的組合，是由加法器30來實行。該輸出信號32之后包含直達(dá)信號10以及擴散信號12的信號部分，其中該擴散信號是已經(jīng)過包絡(luò)成形，以確保該信號包絡(luò)對于擴散信號12以及直達(dá)信號IO，在該組合之前基本上是相同的。該擴散聲音的時間成形的精確控制的問題，可以由所謂的時間包絡(luò)成形(TES)工具來處理，該TES工具是設(shè)計用以替代該時間處理(TP)工具的具有低復(fù)雜度的工具。TP是藉由對該擴散聲音包絡(luò)的時域縮放，在時域內(nèi)運作，而該TES方法，藉由在頻譜域表示中控制該擴散聲音包絡(luò)，以達(dá)成相同的主要效果。如同從MPEG-2/4高級音頻編碼(AAC)所得知的，這是以類似該時間噪聲成形(TNS)法的方式來達(dá)成。操控該擴散聲音精細(xì)時間包絡(luò)，是藉由將它的遍及所有頻率的頻譜系數(shù)與從干信號的頻譜系數(shù)的LPC分析所得到的適當(dāng)?shù)某尚螢V波器，進行巻積(convolution)而達(dá)成的。由于該MPEG環(huán)繞聲濾波器組的相當(dāng)高的時間分辨率，因此TES處理僅需低階濾波(一階復(fù)雜預(yù)測)，而且如此一來其計算復(fù)雜度也較低。另一方面，由于例如關(guān)于時間混疊(temporalaliasing)的限制，其無法提供該TP工具所能提供的完整程度的時間控制。必須注意的是，類似于TP的情況，TES并不需要從該編碼器傳送任何的邊信息至該解碼器，以描述該信號的時間包絡(luò)。'這兩種工具，TP以及TES，成功的解決該擴散聲音的時間成形的問題，藉由調(diào)整它的時間包絡(luò)，使其適合于該傳送的下混音信號。雖然這樣做可以避免無屏蔽的該前回聲形式，但無法補償多聲道輸出信號中的第二種形式的缺陷，其是因為缺乏空間的重新分布(spatialre-distribution)所造成的鼓掌喝采信號是由瞬時事件(拍手聲)的稠密混合所構(gòu)成的，其中的數(shù)個瞬時事件典型地會落在相同的參數(shù)幀內(nèi)。明顯地，在幀內(nèi)，并非所有的拍手聲均來自于相同的(或者相似的)空間方向。然而，對于MPEG環(huán)繞聲解碼器，該解碼器的時間粒度(temporalgranularity),絕大部分是由該幀大小以及參數(shù)槽(slot)時間粒度所決定的。因此，在合成之后，所有落在一幀內(nèi)的拍手聲，顯示出似乎都是來自于相同的空間方位(輸出聲道之間的水平分布)，與該原始聲道中，每一個拍手聲可能被單獨地局部化(以及實際上被感知)，形成對比。就高度關(guān)鍵信號，例如鼓掌喝采信號的空間重新分布方面而言，為了也達(dá)成好的結(jié)果，該上混音信號的時間包絡(luò)，必須以非常高的時間分辨率來成形。
發(fā)明內(nèi)容本發(fā)明的目的是提供一種用以編碼多聲道音頻信號的概念，允許有效率的編碼，以提供多聲道信號空間分布的一種改進的保存。依據(jù)本發(fā)明第一方面，這個目的可以通過一種解碼器來實現(xiàn)，該解碼器根據(jù)基底信號(basesignal)和波形參數(shù)表示而產(chǎn)生多聲道輸出信號，該基底信號從具有一個或更多個聲道的原始多聲道信號中導(dǎo)出，該基底信號的聲道個數(shù)小于原始多聲道信號的聲道個數(shù)，該基底信號以幀來組織，該幀包括具有高分辨率的采樣值，該波形參數(shù)表示是用來表示原始多聲道信號中所選原始聲道的中間分辨率表示的波形，該波形參數(shù)表示包括具有中間時間分辨率的中間波形參數(shù)的序列，該中間時間分辨率低于采樣值的高時間分辨率，并高于由幀重復(fù)率所定義的低時間分辨率；該解碼器包括上混音器(叩mixer)，用以產(chǎn)生具有比中間分辨率更高的時間分辨率的多個上混音聲道；以及成形器(shaper)，用以使用與所選上混音聲道相對應(yīng)的所選原始聲道的中間波形參數(shù)，對所選上混音聲道進行成形。依據(jù)本發(fā)明第二方面，這個目的可以通過一種編碼器來實現(xiàn)，該編碼器用以產(chǎn)生由幀來表示的多聲道信號的聲道的波形參數(shù)表示，該幀包括具有采樣周期的采樣值；該編碼器包括時間分辨率減低器(decreaser)，使用幀的采樣值來導(dǎo)出聲道的低分辨率表示，該低分辨率表示具有低分辨率值，該低分辨率值具有大于采樣周期的相關(guān)聯(lián)的低分辨率周期；以及波形參數(shù)計算器，用以計算表示該低分辨率表示的波形的波形參數(shù)表示，其中該波形參數(shù)計算器被適配用于產(chǎn)生具有比采樣值的時間分辨率要低并且比幀重復(fù)率所定義的時間分辨率要高的時間分辨率的波形參數(shù)的序列。依據(jù)本發(fā)明第三方面，這個目的可以通過一種方法來實現(xiàn)，該方法根據(jù)基底信號和波形參數(shù)表示而產(chǎn)生多聲道輸出信號，該基底信號從具有一個或更多個聲道的原始多聲道信號中導(dǎo)出，該基底信號的聲道個數(shù)小于原始多聲道信號的聲道個數(shù)，該基底信號以幀來組織，該幀包括具有高分辨率的采樣值，該波形參數(shù)表示是用來表示原始多聲道信號中所選原始聲道的中間分辨率表示的波形，該波形參數(shù)表示包括具有中間時間分辨率的中間波形參數(shù)的序列，該中間時間分辨率低于采樣值的高時間分辨率，并高于由幀重復(fù)率所定義的低時間分辨率；該方法包括產(chǎn)生具有比中間分辨率更高的時間分辨率的多個上混音聲道；以及使用與所選上混音聲道相對應(yīng)的所選原始聲道的中間波形參數(shù)，對所選上混音聲道進行成形。依據(jù)本發(fā)明第四方面，這個目的可以通過一種方法來實現(xiàn)，該方法用以產(chǎn)生由幀來表示的多聲道信號的聲道的波形參數(shù)表示，該幀包括具有采樣周期的采樣值；該方法包括使用幀的釆樣值來導(dǎo)出聲道的低分辨率表示，該低分辨率表示具有低分辨率值，該低分辨率值具有大于采樣周期的相關(guān)聯(lián)的低分辨率周期；以及計算表示該低分辨率表示的波形的波形參數(shù)表示，其中該波形參數(shù)計算器被適配用于產(chǎn)生具有比采樣值的時間分辨率要低并且比幀重復(fù)率所定義的時間分辨率要高的時間分辨率的波形參數(shù)的序列。依據(jù)本發(fā)明第五方面，這個目的可以通過一種多聲道音頻信號表示來實現(xiàn)，該多聲道音頻信號表示基于基底信號和波形參數(shù)表示，該基底信號從具有一個或更多個聲道的原始多聲道信號中導(dǎo)出，該基底信號的聲道個數(shù)小于多聲道信號的聲道個數(shù)，該基底信號以幀來組織，該幀包括具有高分辨率的采樣值，該波形參數(shù)表示是用來表示原始多聲道信號中所選聲道的中間分辨率表示的波形，該波形參數(shù)表示包括具有時間分辨率的中間波形參數(shù)的序列，該時間分辨率低于采樣值的高時間分辨率，并高于由幀重復(fù)率所定義的低時間分辨率。依據(jù)本發(fā)明第六方面，這個目的可以通過一種計算機可讀存儲介質(zhì)來實現(xiàn)，在該計算機可讀存儲介質(zhì)上存儲有多聲道音頻信號表示，該多聲道音頻信號表示基于基底信號和波形參數(shù)表示，該基底信號從具有一個或更多個聲道的原始多聲道信號中導(dǎo)出，該基底信號的聲道個數(shù)小于多聲道信號的聲道個數(shù)，該基底信號以幀來組織，該幀包括具有高分辨率的采樣值，該波形參數(shù)表示是用來表示原始多聲道信號中所選聲道的中間分辨率表示的波形，該波形參數(shù)表示包括具有時間分辨16率的中間波形參數(shù)的序列，該時間分辨率低于采樣值的高時間分辨率，并高于由幀重復(fù)率所定義的低時間分辨率。依據(jù)本發(fā)明第七方面，這個目的可以通過一種具有如下解碼器的接收機或音頻播放器來實現(xiàn)，該解碼器根據(jù)基底信號和波形參數(shù)表示而產(chǎn)生多聲道輸出信號，該基底信號從具有一個或更多個聲道的原始多聲道信號中導(dǎo)出，該基底信號的聲道個數(shù)小于原始多聲道信號的聲道個數(shù)，該基底信號以幀來組織，該幀包括具有高分辨率的采樣值，該波形參數(shù)表示是用來表示原始多聲道信號中所選原始聲道的中間分辨率表示的波形，該波形參數(shù)表示包括具有中間時間分辨率的中間波形參數(shù)的序列，該中間時間分辨率低于采樣值的高時間分辨率，并高于由幀重復(fù)率所定義的低時間分辨率；該解碼器包括上混音器，用以產(chǎn)生具有比中間分辨率更高的時間分辨率的多個上混音聲道；以及成形器，用以使用與所選上混音聲道相對應(yīng)的所選原始聲道的中間波形參數(shù)，對所選上混音聲道進行成形。依據(jù)本發(fā)明第八方面，這個目的可以通過一種具有如下編碼器的發(fā)射機或音頻記錄器來實現(xiàn)，該編碼器用以產(chǎn)生由幀來表示的多聲道信號的聲道的波形參數(shù)表示，該幀包括具有采樣周期的采樣值；該編碼器包括時間分辨率減低器，使用幀的采樣值來導(dǎo)出聲道的低分辨率表示，該低分辨率表示具有低分辨率值，該低分辨率值具有大于采樣周期的相關(guān)聯(lián)的低分辨率周期；以及波形參數(shù)計算器，用以計算表示該低分辨率表示的波形的波形參數(shù)表示，其中該波形參數(shù)計算器被適配用于產(chǎn)生具有比采樣值的時間分辨率要低并且比幀重復(fù)率所定義的時間分辨率要高的時間分辨率的波形參數(shù)的序列。依據(jù)本發(fā)明第九特征，這個目的可以通過一種接收或音頻播放的方法來實現(xiàn)，該方法具有一種根據(jù)基底信號和波形參數(shù)表示而產(chǎn)生多聲道輸出信號的方法，該基底信號從具有一個或更多個聲道的原始多聲道信號中導(dǎo)出，該基底信號的聲道個數(shù)小于原始多聲道信號的聲道個數(shù)，該基底信號以幀來組織，該幀包括具有高分辨率的采樣值，該波形參數(shù)表示是用來表示原始多聲道信號中所選原始聲道的中間分辨率表示的波形，該波形參數(shù)表示包括具有中間時間分辨率的中間波形參數(shù)的序列，該中間時間分辨率低于采樣值的高時間分辨率，并高于由幀重復(fù)率所定義的低時間分辨率；該方法包括產(chǎn)生具有比中間分辨率更高的時間分辨率的多個上混音聲道；以及使用與所選上混音聲道相對應(yīng)的所選原始聲道的中間波形參數(shù)，對所選上混音聲道進行成形。依據(jù)本發(fā)明第十方面，這個目的可以通過一種傳送或者音頻記錄的方法來實現(xiàn)，該方法具有一種用以產(chǎn)生由幀來表示的多聲道信號的聲道的波形參數(shù)表示的方法，該幀包括具有采樣周期的采樣值；該方法包括使用幀的采樣值來導(dǎo)出聲道的低分辨率表示，該低分辨率表示具有低分辨率值，該低分辨率值具有大于采樣周期的相關(guān)聯(lián)的低分辨率周期；以及計算表示該低分辨率表示的波形的波形參數(shù)表示，其中該波形參數(shù)計算器被適配用于產(chǎn)生具有比采樣值的時間分辨率要低并且比幀重復(fù)率所定義的時間分辨率要高的時間分辨率的波形參數(shù)的序列。依據(jù)本發(fā)明第十一方面，這個目的可以通過一種傳輸系統(tǒng)來實現(xiàn)，該傳輸系統(tǒng)具有發(fā)射機和接收機，該發(fā)射機具有編碼器，該編碼器用以產(chǎn)生由幀來表示的多聲道信號的聲道的波形參數(shù)表示，該幀包括具有采樣周期的采樣值；以及該接收機具有解碼器，該解碼器根據(jù)基底信號和波形參數(shù)表示而產(chǎn)生多聲道輸出信號，該基底信號從具有一個或更多個聲道的原始多聲道信號中導(dǎo)出，該基底信號的聲道個數(shù)小于原始多聲道信號的聲道個數(shù)，該基底信號以幀來組織，該幀包括具有高分辨率的采樣值，該波形參數(shù)表示是用來表示原始多聲道信號中所選原始聲道的中間分辨率表示的波形，該波形參數(shù)表示包括具有中間時間分辨率的中間波形參數(shù)的序列，該中間時間分辨率低于采樣值的高時間分辨率，并高于由幀重復(fù)率所定義的低時間分辨率。依據(jù)本發(fā)明第十二方面，這個目的可以通過一種傳輸和接收方法來實現(xiàn)，該傳輸方法具有一種用以產(chǎn)生由幀來表示的多聲道信號的聲道的波形參數(shù)表示的方法，該幀包括具有采樣周期的采樣值；以及該接收方法具有一種根據(jù)基底信號和波形參數(shù)表示而產(chǎn)生多聲道輸出信號的方法，該基底信號從具有一個或更多個聲道的原始多聲道信號中導(dǎo)出，該基底信號的聲道個數(shù)小于原始多聲道信號的聲道個數(shù)，該基底信號以幀來組織，該幀包括具有高分辨率的采樣值，該波形參數(shù)表示是用來表示原始多聲道信號中所選原始聲道的中間分辨率表示的波形，該波形參數(shù)表示包括具有中間時間分辨率的中間波形參數(shù)的序列，該中間時間分辨率低于采樣值的高時間分辨率，并高于由幀重復(fù)率所定義的低時間分辨率。所述方法包括。依據(jù)本發(fā)明第十三方面，這個目的可以通過一種計算機程序來實現(xiàn)，該計算機程序具有程序代碼，當(dāng)在計算機上運行時，該程序代碼可以執(zhí)行任意的上述方法。本發(fā)明是基于下述的發(fā)現(xiàn)由從具有高時間分辨率的采樣值所組合而成的幀所表示的多聲道信號的所選聲道，當(dāng)表示該所選聲道的中間分辨率表示的波形的波形參數(shù)表示被導(dǎo)出時，該所選聲道可以被編碼成具有較高質(zhì)量的形式，該波形參數(shù)表示包括具有時間分辨率的中間波形參數(shù)的序列，該時間分辨率低于采樣值的高時間分辨率，并高于由幀重復(fù)率所定義的時間分辨率。該具有中間分辨率的波形參數(shù)表示可以用于對重建聲道進行成形，以獲取具有與所選原始聲道的信號包絡(luò)相接近的信號包絡(luò)的聲道。該成形是在比逐幀處理的時間刻度(timescale)更為精細(xì)的時間刻度上執(zhí)行，因此可以提高重建聲道的質(zhì)量。另一方面，該成形時間刻度比采樣值的時間刻度更為粗糙，因此可以顯著地降低該波形參數(shù)表示所需要的數(shù)據(jù)總量。適合用于包絡(luò)成形的一波形參數(shù)表示，在本發(fā)明的優(yōu)選實施例中，可以包含信號強度測量作為參數(shù)，其指出在采樣周期內(nèi)該信號的強度。因為該信號強度與信號的感知響度(perc印tualloudness)高度相關(guān)，因此使用信號強度參數(shù)是實現(xiàn)包絡(luò)成形的適當(dāng)選擇。兩種自然的信號強度參數(shù)為，例如信號的振幅或者振幅的平方，亦即該信號的能量。本發(fā)明的目標(biāo)旨在，在高時間粒度的情況下，提供一種恢復(fù)信號空間分布、由此來恢復(fù)"空間分布"的完整感覺的機制，例如其與鼓掌喝采信號有關(guān)。一個重要的附屬條件是，在傳送的控制信息(環(huán)繞聲邊信息)不需要增加太多以致于無法接受的情況下，可以實現(xiàn)該改進的呈現(xiàn)性能(renderingperformance)。在本發(fā)明接下來的段落中所敘述的，主要是關(guān)于，依據(jù)可用的下混音信號以及額外的控制數(shù)據(jù)，進行音頻信號的多聲道重建。在解碼器側(cè)提取空間參數(shù)，其代表關(guān)于原始聲道(給定的)下混音的多聲道特性。該下混音信號以及該空間表示用于解碼器中，借助于把該下混音信號以及該下混音信號的解相關(guān)版本的組合分布到被重建的聲道，以重建原始多聲道信號的十分相似的表示。本發(fā)明可以應(yīng)用于那些期望具有后向兼容的下混音信號的系統(tǒng)中，例如立體聲數(shù)字無線電傳輸(DAB、XM衛(wèi)星無線電等)，但是也可以應(yīng)用于需要多聲道信號的非常緊密表示(compact^presentation)的系統(tǒng)中。在接下來的段落中，是針對本發(fā)明在MPEG環(huán)繞聲音頻標(biāo)準(zhǔn)之中的應(yīng)用進行敘述。不言而喻的是，本發(fā)明也可以應(yīng)用于其它的多聲道音頻編碼系統(tǒng)，舉例而言，如在先前文章中所提到的數(shù)種系統(tǒng)。本發(fā)明是基于下列的考慮參對于最佳感知音頻質(zhì)量，MPEG環(huán)繞聲合成級不但必須提供用以解相關(guān)的裝置，還必須可在精細(xì)的時間粒度上，重新合成該信號的空間分布。參這需要傳送代表多聲道信號的空間分布(聲道包絡(luò))的環(huán)繞邊信息。參為了最小化用以傳送單獨的時間聲道包絡(luò)所需要的比特率，這個信息是以一種，相對于下混音信號的包絡(luò)而言，歸一化而且相關(guān)的方式進行編碼。隨后進行額外的熵編碼步驟，以進一步降低該包絡(luò)傳輸所需要的比特率。參依據(jù)此信息，該MPEG環(huán)繞聲解碼器對直達(dá)以及擴散聲音(或者組合的直達(dá)/擴散聲音)兩者進行成形，使其匹配于時間目標(biāo)包絡(luò)。這使得能夠獨立地控制單獨的聲道包絡(luò)，而且能夠以精細(xì)的時間粒度來重建空間分布的感知性，其與原始情況非常相似(勝于僅借助于解相關(guān)技術(shù)的、基于幀的低分辨率空間處理)。該導(dǎo)引式包絡(luò)成形的原理可以在頻譜域也可以在時域中應(yīng)用，其中在頻譜域中的實現(xiàn)具有計算復(fù)雜度較低的特征。在本發(fā)明的一個實施例中，多聲道信號的所選聲道由描述該聲道的包絡(luò)的參數(shù)表示來表示，其中該聲道由具有高采樣速率，亦即高時間分辨率的采樣值的幀來表示。該包絡(luò)被定義為包含于該聲道內(nèi)的能量的時間演進(timeevolution),其中該包絡(luò)典型地是針對對應(yīng)于幀長度的時間區(qū)間而進行計算。在本發(fā)明中，單一參數(shù)表示該包絡(luò)的時間片(timeslice)會關(guān)于由幀所定義的時間刻度而減少，亦即這個時間片是中間時間區(qū)間，其比采樣區(qū)間要長，并且比幀長度要短。為達(dá)成此目的，計算所選聲道的中間分辨率表示，其描述了具有比采樣參數(shù)所提供的分辨率要小的時間分辨率的幀。所選聲道的包絡(luò)與低分辨率表示的時間分辨率進行估計，使得在一方面增加該低分辨率表示的時間分辨率，以及在另一方面，與時域中的成形相比，減低所需的數(shù)據(jù)總量以及計算復(fù)雜度。在本發(fā)明的優(yōu)選實施例中，所選聲道的中間分辨率表示由濾波器組所提供，該濾波器組導(dǎo)出所選聲道的下采樣濾波器組表示。在該濾波器組表示中，每一個聲道被分成多個有限頻帶，每一個頻帶由多個采樣值來表示，其描述在具有比采樣值的時間分辨率小的時間分辨率的所選頻帶中，該信號的時間演進。將本發(fā)明應(yīng)用于濾波器組域中有許多大的優(yōu)點。該實現(xiàn)與現(xiàn)有的編碼方案十分契合，亦即本發(fā)明可以采用完全后向兼容于現(xiàn)有的音頻編碼方案，例如MPEG環(huán)繞聲音頻編碼的方式來實現(xiàn)。更進一步的，時間分辨率所需的減低，可以自動地由該濾波器組的下采樣性質(zhì)提供，而且，相較于在時域中，在該濾波器組域中實現(xiàn)頻譜的白化，其計算復(fù)雜度可以大幅下降。更進一步地，另一個優(yōu)點是，從感知質(zhì)量的觀點來看，本發(fā)明的概念可以僅應(yīng)用于需要進行成形的所選聲道的頻率部分。在本發(fā)明的另一優(yōu)選實施例中，所選聲道的波形參數(shù)表示被導(dǎo)出，用以描述該所選聲道的包絡(luò)以及在編碼器側(cè)導(dǎo)出的下混音信號的包絡(luò)之間的比率。依據(jù)包絡(luò)的差分(differential)或者相對的估計來導(dǎo)出波形參數(shù)表示的最主要的優(yōu)點是，可以進一步降低該波形參數(shù)表示所要求的比特率。在另一優(yōu)選實施例中，對由此導(dǎo)出的波形參數(shù)表示進行量化，以進一步降低該波形參數(shù)表示所需要的比特率。更進一步地，最有利的是對量化的參數(shù)應(yīng)用熵編碼，以節(jié)省更多的比特率，而且不會損失更多的信息。在本發(fā)明的另一優(yōu)選實施例中，波形參數(shù)基于描述針對給定時間部分包含在所選聲道內(nèi)的能量的能量測量，該能量優(yōu)選地以描述所選聲道的采樣參數(shù)的平方和的方式而計算。在本發(fā)明的另一實施例中，依據(jù)多聲道音頻信號的所選音頻聲道的中間分辨率表示來導(dǎo)出波形參數(shù)表示的本發(fā)明概念在時域中實現(xiàn)。所需的中間分辨率表示的推導(dǎo)可以通過計算多個連續(xù)采樣值的(平方)平均或者能量和來實現(xiàn)。進行平均的連續(xù)采樣值的個數(shù)的變化允許方便地調(diào)整包絡(luò)成形過程的時間分辨率。在先前所敘述的實施例的修改中，僅使用每個第n采樣值，以導(dǎo)出該波形參數(shù)表示，從而進一步降低計算復(fù)雜度。在本發(fā)明的另一實施例中，在頻域中以相對低的計算復(fù)雜度而執(zhí)行成形參數(shù)的推導(dǎo)，其中實際的成形，亦即成形參數(shù)的應(yīng)用是在時域中執(zhí)行。在本發(fā)明的另一實施例中，以高時間分辨率，將包絡(luò)成形僅應(yīng)用于確實需要包絡(luò)成形的所選聲道的那些部分。在先前的數(shù)個段落中所敘述的本發(fā)明可以得到下列優(yōu)點*改善例如鼓掌喝采信號的稠密瞬時聲音的空間聲音質(zhì)量，鼓掌喝采信號到目前為止可以視為最壞情況的信號。參僅需適度增加空間音頻邊信息速率(對于連續(xù)傳輸?shù)陌j(luò)，大約5kbit/S)，因為對包絡(luò)信息進行非常緊密的編碼。參就可感知性而言，當(dāng)必要時可以讓該編碼器僅傳輸包絡(luò)，以進一步降低總比特率，本發(fā)明所提出的該包絡(luò)比特流元素的語法(syntax)，負(fù)責(zé)這個工作。本發(fā)明的概念可以被描述為導(dǎo)引式包絡(luò)成形，并且將在稍后整理于下列段落中-導(dǎo)引式包絡(luò)成形，通過使用包含在比特流中的參數(shù)寬帶包絡(luò)邊信息，對每一個輸出聲道進行包絡(luò)平坦化和重新成形，以恢復(fù)合成的輸出信號的寬帶包絡(luò)。針對該重新成形過程，提取下混音和輸出聲道的包絡(luò)。為得到這些包絡(luò)，計算每一參數(shù)帶以及每一時隙的能量。接著進行頻譜白化運算，其中對每一參數(shù)帶的能量值進行加權(quán)，使得所有參數(shù)帶的總能量相等。最后，將所有參數(shù)帶的已加權(quán)能量相加并歸一化以獲得寬帶包絡(luò)，以及通過具有長時間常數(shù)的低通濾波處理，獲得長期平均能量。包絡(luò)重新成形過程通過對每一輸出聲道的直達(dá)與擴散聲音部分計算并應(yīng)用增益曲線，朝著目標(biāo)包絡(luò)，對輸出聲道進行平坦化以及重新成形。因此，所傳送的下混音以及各自的輸出聲道的包絡(luò)可以按照如上方式而提取。通過如下方式來獲得增益曲線對所提取的下混音包絡(luò)以及所提取的輸出包絡(luò)的比率進行縮放，包絡(luò)比值在比特流中傳輸。本發(fā)明所提出的包絡(luò)成形工具使用比特流中已量化的邊信息。包絡(luò)邊信息所要求的總比特率在第1表中列出(假設(shè)采樣率為44.lkHz，5步量化的包絡(luò)邊信息)。第1表-包絡(luò)邊信息的估計比特率<table>tableseeoriginaldocumentpage23</column></row><table>如同在前面所敘述的，導(dǎo)引式時間包絡(luò)成形解決了與由TES或TP所解決問題的互相正交(orthogonal)的問題本發(fā)明提出的導(dǎo)引式時間包絡(luò)成形旨在改善瞬時事件的空間分布，而TES和TP工具可以有效地對擴散聲音包絡(luò)進行成形，以匹配于干包絡(luò)(dryenvel叩e)。因此，對于高質(zhì)量應(yīng)用的情況，推薦將本發(fā)明新提出的工具與TES或TP組合使用。為達(dá)到最佳性能，在解碼器工具鏈中，在TES或TP之前執(zhí)行導(dǎo)引式時間包絡(luò)成形。更進一步地，對TES和TP工具的配置稍作修改，從而與本發(fā)明提出的工具無縫整合到一起基本上，用于在TES或TP處理中導(dǎo)出目標(biāo)包絡(luò)的信號經(jīng)過改變，從使用下混音信號朝著使用重新成形的獨立聲道的上混音信號而改變。如同已經(jīng)在前面所提到的，本發(fā)明概念的一個大的優(yōu)點是其可以置于MPEG環(huán)繞聲編碼方案中。本發(fā)明的概念一方面擴展了TP/TES工具的功能，因為其實現(xiàn)了適當(dāng)處理瞬時事件或信號所需的時間成形機制。在另一方面，該工具需要傳輸邊信息以導(dǎo)引該成形過程。雖然所需的平均邊信息比特率(大約5KBit/s，針對連續(xù)的包絡(luò)傳輸)相對較低，但是概念上的質(zhì)量增加卻是顯著的。因此，提出該新概念作為現(xiàn)有的TP/TES工具的附加。就保持計算復(fù)雜度相當(dāng)?shù)屯瑫r仍可維持高的音頻質(zhì)量的意義上來說，新提出的概念與TES的組合是優(yōu)選的操作模式。因為關(guān)系到計算復(fù)雜度，可能注意的是該包絡(luò)提取以及重新成形所需要的一些計算是基于幀的，而其它的是以時隙來執(zhí)行(亦即在濾波器組域中的時間區(qū)間)。該復(fù)雜度取決于幀長度以及采樣頻率。假設(shè)幀長度為32個時隙，以及采樣率為44.lKHz，前述的該算法需荽大約每秒105.000次運算(0PS)用以對一個聲道進行包絡(luò)提取，以及需要330:000OPS用于一個聲道的重新成形。由于每一個下混音聲道需要一次包絡(luò)提取，而且每一個輸出聲道需要一次重新成形運算，因此對于5-l-5配置，亦即多聲道音頻信號的5個聲道由單聲道下混音信號來表示的配置，總的復(fù)雜度為1.76M0PS，而對于使用立體聲下混音信號的5-2-5配置，總的復(fù)雜度為1.86M0PS。下文參考附圖來描述本發(fā)明的優(yōu)選實施例，其中第1圖為本發(fā)明的一種解碼器；第2圖為本發(fā)明的一種編碼器；第3a圖與第3b圖為把混合濾波器組的濾波器帶索引指定到其對應(yīng)的子帶索引的表格；第4圖為不同解碼配置的參數(shù)；第5圖為一編碼方案，描繪本發(fā)明概念的后向兼容性；第6圖為選擇不同配置的參數(shù)配置；第7圖為一后向兼容的編碼方案；第7b圖描繪不同的量化方案；第8圖進一步描繪該后向兼容的編碼方案；第9圖為霍夫曼碼簿(Huffmancodebook)用于有效實現(xiàn)；第10圖為多聲道輸出信號的聲道配置的示例；第11圖為本發(fā)明的一種發(fā)射器或者音頻記錄器；第12圖為本發(fā)明的一種接收機或者音頻播放器；第13圖為本發(fā)明的一種傳輸系統(tǒng)；以及第14圖為現(xiàn)有技術(shù)的時域時間成形。具體實施例方式第1圖為本發(fā)明的一種解碼器40，具有上混音器(upmixer)42和成形器(shaper)44。解碼器40接收從原始多聲道信號中導(dǎo)出的基底信號46作為輸入，該基底信號具有一個或更多個聲道，其中該基底信號的聲道個數(shù)小于原始多聲道信號的聲道個數(shù)。解碼器40接收代表所選原始聲道的低分辨率表示的波形的波形參數(shù)表示48，作為第二個輸入，其中該波形參數(shù)表示48包括波形參數(shù)序列，該序列的時間分辨率低于描述基底信號46的多個幀中所組織的釆樣值的時間分辨率。上混音器42根據(jù)基底信號46而產(chǎn)生上混音聲道50，其中該上混音50是原始多聲道信號中所選原始聲道的低分辨率估計表示，具有比采樣值的時間分辨率低的時間分辨率。成形器44接收上混音聲道50以及波形參數(shù)表示48作為輸入，并且導(dǎo)出經(jīng)過成形的上混音聲道52，其經(jīng)過成形使得該成形的上混音聲道52的包絡(luò)，在經(jīng)過適當(dāng)?shù)恼{(diào)整之后可以在容限范圍之內(nèi)，符合于該對應(yīng)的原始聲道的包絡(luò)，其中時間分辨率是由波形參數(shù)表示的時間分辨率所給定。因此，已成形的上混音聲道的包絡(luò)，可由比構(gòu)建該基底信號46的幀所定義的時間分辨率更高的時間分辨率來成形。所以，可以保證重建信號的空間重新分布具有比通過使用幀更精細(xì)的時間粒度，而且感知質(zhì)量可以提升，其代價僅為由于波形參數(shù)表示48所造成的比特率的少量增加。第2圖為本發(fā)明的一種編碼器60，具有時間分辨率減低器(decreaser)62以及波形參數(shù)計算器64。編碼器60接收多聲道信號中的某個聲道作為輸入，其中該多聲道信號是以幀66來表示，這些幀包括采樣值68a至68g，每一采樣值代表第一采樣周期。該時間分辨率減低器62導(dǎo)出該聲道的低分辨率表示70，其中幀具有低分辨率值72a至72d，這些值72a至72d與比該采樣周期大的低分辨率周期相關(guān)聯(lián)。波形參數(shù)計算器64接收低分辨率表示70作為輸入，并且計算波形參數(shù)74，其中波形參數(shù)74所具有的時間分辨率比采樣值的時間分辨率低，并且比由幀所定義的時間分辨率高。波形參數(shù)74優(yōu)選地取決于由低分辨率周期所定義的時間部分內(nèi)的聲道的振幅。在本發(fā)明的優(yōu)選實施例中，波形參數(shù)74描述低分辨率周期中在該聲道內(nèi)所包含的能量。在優(yōu)選實施例中，導(dǎo)出波形參數(shù)，使得在波形參數(shù)74內(nèi)所包含的能測量量，是以相對于由本發(fā)明的多聲道音頻編碼器導(dǎo)出的下混音信號所定義的參考能測量量的方式而導(dǎo)出。本發(fā)明的概念在MPEG環(huán)繞聲音頻解碼器的上下文中的應(yīng)用，將在下列段落中更詳細(xì)的敘述，以略述本發(fā)明的理念。本發(fā)明概念在現(xiàn)有技術(shù)的MPEG編碼器的子帶(subband)域中的應(yīng)用，進一步突顯出本發(fā)明概念與現(xiàn)有技術(shù)的編碼方案的有利的后向兼容性。本發(fā)明方法(導(dǎo)引式包絡(luò)成形)可以恢復(fù)該合成的輸出信號的寬帶包絡(luò)。本發(fā)明方法包括修改后的上混音過程，之后是對每一個輸出聲道的直達(dá)(干)以及擴散(濕)信號部分進行包絡(luò)平坦化(flattening)以及重新成形。為引導(dǎo)該參數(shù)寬帶包絡(luò)的重新成形，使用包含于比特流之內(nèi)的邊信息。邊信息包含把傳送的下混音信號包絡(luò)與原始輸入聲道信號包絡(luò)進行關(guān)聯(lián)的比率(envRatio)。由于該包絡(luò)成形過程采用對不同信號進行的包絡(luò)提取運算，因此首先對該包絡(luò)提取過程詳加敘述。必須提出的是，在MPEG編碼方案中，聲道是在由混合的濾波器組所導(dǎo)出的表示中進行操作，亦即對輸入信號應(yīng)用兩個連續(xù)濾波器。第一濾波器組導(dǎo)出輸入聲道的表示，其中多個頻率區(qū)間由多個參數(shù)獨立地來描述，所述多個參數(shù)具有比輸入聲道的采樣值的時間分辨率低的時間分辨率。這些參數(shù)帶在下文中將以該字母K來代表。參數(shù)帶中的一些接著由額外的濾波器組進行濾波，在具有下文中以k來表示的一個或更多個有限頻帶內(nèi)對第一濾波器組的某些頻帶進一步做出細(xì)分(subdivide)。換句話說，每一個參數(shù)帶K可以和多于一個混合索引k相關(guān)聯(lián)。第3a以及3b圖是把多個參數(shù)帶與其對應(yīng)的混合參數(shù)進行關(guān)聯(lián)的表格。該混合參數(shù)k列于表格中的第一列80，相關(guān)聯(lián)的參數(shù)帶K則列于表中的列82a或82b之一。列82a或82b的應(yīng)用取決于參數(shù)84(decType)，該參數(shù)指示MPEG解碼器濾波器組中兩種不同的可能配置。進一步必須指出的是，與聲道相關(guān)聯(lián)的參數(shù)是以逐幀(frame-wise)的方式來處理，其中單個幀具有n個時間區(qū)間，以及其中對于每一時間區(qū)間n，對于每個混合索引k均存在單一參數(shù)y。時間區(qū)間n也稱為時隙(slot),且相關(guān)聯(lián)的參數(shù)以y"來表示。對于歸一化包絡(luò)的估計，計算參數(shù)帶的能量時，把y"作為幀中每一個時隙的輸入信號其中該求和運算包含，依據(jù)在第3a以及3b圖中的表格，把所有的k歸于所有的參數(shù)帶ic。接下來，對于每一參數(shù)帶，按照如下來計算幀中的總參數(shù)帶能量:其中a為對應(yīng)于時間常數(shù)為400毫秒(ms)的一階IIR低通濾波的<formula>formulaseeoriginaldocumentpage27</formula>加權(quán)因子。t代表幀索引，sFreq為輸入信號的采樣率，以及64代表該濾波器組的下采樣因子。幀中的平均能量計算如下<formula>formulaseeoriginaldocumentpage28</formula>其中、。"=10以及*考=18.確定這些能量的比率，以獲得用于頻譜白化的權(quán)重.-<formula>formulaseeoriginaldocumentpage28</formula>該寬帶包絡(luò)是通過將參數(shù)帶的加權(quán)貢獻(xiàn)相加，經(jīng)過歸一化以及計算平方根之后而獲得-在包絡(luò)提取之后，執(zhí)行包絡(luò)成形過程，其包括對于每一輸出聲道，對直達(dá)和擴散聲音包絡(luò)進行平坦化，之后朝著目標(biāo)包絡(luò)進行重新成形。這將得到待應(yīng)用于每一輸出聲道的直達(dá)和擴散信號部分的增益曲線。在MPEG環(huán)繞聲兼容編碼方案的情況中，必須區(qū)分5-1-5和5-2-5對于5-1-5配置，該目標(biāo)包絡(luò)是藉由估計所傳送的下混音￡"%^的包絡(luò)、隨后依據(jù)編碼器傳送并重新量化的包絡(luò)比率e"^^^'""力對其進行縮放而獲得的。通過分別估計直達(dá)和擴散信號的包絡(luò)^"v力"^,s并將其與目標(biāo)包絡(luò)相關(guān)聯(lián)，針對每一個輸出聲道來計算用于幀中所有時隙的增益曲線<formula>formulaseeoriginaldocumentpage29</formula>對于5-2-5配置，從左聲道兼容的所傳送的下混音信號的包絡(luò)￡"vD"，導(dǎo)出用于L以及Ls的目標(biāo)包絡(luò)，對于R以及Rs，使用右聲道兼容的所傳送的下混音以獲得￡"^一。從左和右兼容的所傳送的下混音信號的包絡(luò)之和，導(dǎo)出中央聲道。通過分別估計直達(dá)和擴散信號的包絡(luò)&^""一'并將其與目標(biāo)包絡(luò)相關(guān)聯(lián)，針對每一個輸出聲道來計算增益曲線<formula>formulaseeoriginaldocumentpage29</formula>對于所有的聲道，該包絡(luò)調(diào)整增益曲線運用如下:其中A從交叉復(fù)合子帶A。開始，以及/K),…，numSlots-1。在濕信號以及干信號分別進行包絡(luò)成形之后，已成形的直達(dá)與擴散聲音，依據(jù)下列公式在子帶域內(nèi)進行混合在之前的段落中，已經(jīng)證明本發(fā)明概念的優(yōu)點是可以實施于基于MPEG環(huán)繞聲編碼的現(xiàn)有技術(shù)的編碼方案中。本發(fā)明同時也使用將被操作的信號的已經(jīng)存在的子帶域表示，引入微小的額外計算量。為了增加將本發(fā)明概念實施于MPEG多聲道音頻編碼中的效率，優(yōu)選地對上混音以及時間包絡(luò)成形中進行一些額外改變。若該導(dǎo)引式包絡(luò)成形是可用的，則在復(fù)合子帶域中，使用修改后的后混合(postmixing),依據(jù)下列方程式，分別合成直達(dá)以及擴散信號'M;;w"+M^w"'*，0"<炎00，0"<A:0其中尨代表交叉復(fù)合子帶。如同從上述方程式中可以看出，直接輸出具有直達(dá)信號、針對較低頻帶的擴散信號以及剩余信號(如果存在)。擴散輸出提供了針對較高頻帶的擴散信號。此處，依據(jù)第4圖，A。表示交叉復(fù)合子帶。第4圖為給出交叉復(fù)合子帶A。的表格，其與由參數(shù)84(decType)所指示的兩種可能的解碼器配置有關(guān)。若TES與導(dǎo)引式包絡(luò)成形組合使用，則對該TES處理稍作調(diào)整以得到最佳性能用重新成形的直達(dá)上混音信號取代下混音信號，用于該成形濾波器估計與5-1-5或5-2-5模式無關(guān)，所有的TES計算均是基于每一聲道而相應(yīng)地執(zhí)行的。更進一步地，在該導(dǎo)引式包絡(luò)成形中，省略直達(dá)和擴散信號的混合步驟，因為其由TES執(zhí)行。若TP與導(dǎo)引式包絡(luò)成形組合使用，則對該TP處理稍作調(diào)整以得到最佳性能使用每一聲道的重新成形的直達(dá)上混音信號，取代一般的下混音(從原始多聲道信號中導(dǎo)出)，用以提取每一個聲道的目標(biāo)包絡(luò)。與5-1-5或5-2-5模式無關(guān)，所有的TP計算均是基于每一聲道而相應(yīng)地執(zhí)行的。更進一步地，在該導(dǎo)引式包絡(luò)成形中，省略直達(dá)和擴散信號的混合步驟，并由TP執(zhí)行。為進一步強調(diào)并且證明本發(fā)明概念與MPEG音頻編碼的后向兼容性，在接下來的幾個圖中，示出比特流的定義，以及被定義為完全后向兼容并且額外支持量化的包絡(luò)重新成形數(shù)據(jù)的功能。第5圖所示是描述比特流的空間特定配置的一般語法。在該配置的第一部分90，變量是與現(xiàn)有技術(shù)的MPEG編碼有關(guān)，其定義例如剩余編碼是否應(yīng)用，或者給出與待應(yīng)用的解相關(guān)方案有關(guān)的指示。當(dāng)應(yīng)用本發(fā)明的導(dǎo)引式包絡(luò)成形概念時，通過描述修改后的配置的第二部分92，很容易地對這種配置進行擴展。特別地，該第二部分使用變量bsTe即ShapeConfig，指示解碼器可應(yīng)用的包絡(luò)成形的配置。第6圖為采用后向兼容方式，解釋由所述變量消耗的四個比特。如同可以從第6圖中所看出，4至7的變量值(在行94中所指示)指示使用本發(fā)明概念，并且，更進一步地，指示本發(fā)明概念與現(xiàn)有技術(shù)的成形機制TP與TES相組合。第7圖概略描述當(dāng)在本發(fā)明的優(yōu)選實施例中實現(xiàn)時針對熵編碼所提出的語法。除此之外，該包絡(luò)邊信息是使用五步量化規(guī)則進行量化。在第7圖中所表示的偽代碼(pseudo-code)的第一部分100中，對于所有期望的輸出聲道，啟用時間包絡(luò)成形，其中在該代碼的第二部分102中請求包絡(luò)重新成形。如同在第6圖中所示，這由變量bsTempShapeConfig來指不。在本發(fā)明的優(yōu)選實施例中，使用五步量化處理，并且把量化值與信息聯(lián)合地編碼在一起，無論一至八個相同的連續(xù)值是否在包絡(luò)成形參數(shù)的比特流內(nèi)出現(xiàn)。必須指出的是，就理論上，可以使用較所提出的五步量化處理更精細(xì)的量化處理，其可以由變量bsEnvquantMode所指示，如同第7b圖所示。雖然理論上可行，該當(dāng)前的實現(xiàn)僅提出一種有效的量化。第8圖為經(jīng)過改編的代碼，用于從霍夫曼編碼表示中導(dǎo)出量化參數(shù)。如同已經(jīng)在之前提到的，關(guān)于所討論的量化值以及該值的重復(fù)次數(shù)的組合信息由單一霍夫曼碼字來表示。因此，霍夫曼解碼至少包括涵蓋所有期望輸出聲道的循環(huán)的第一部分104，以及第二部分106，該第二部分106通過傳送霍夫曼碼字以及接收關(guān)聯(lián)參數(shù)值和重復(fù)數(shù)據(jù)，如圖9中所示，從而接收針對每一個單獨聲道的已編碼值。第9圖是顯示具有40個條目的關(guān)聯(lián)霍夫曼碼簿，因為對于5個不同的參數(shù)值110而言，可預(yù)見最大的重復(fù)率為8。因此，每一個霍夫曼碼字112描述該參數(shù)110以及連續(xù)出現(xiàn)的次數(shù)114的組合。給定霍夫曼解碼的參數(shù)值，用于導(dǎo)引式包絡(luò)成形的包絡(luò)比率，是依據(jù)下列方程式從所傳送的重新成形數(shù)據(jù)中獲得其中<formula>formulaseeoriginaldocumentpage32</formula>,以及J與冗代表該輸出聲道，依據(jù)第10圖。第10圖為一表格，把如同上面的圖表以及表達(dá)式中所使用的循環(huán)變量oc120與重建的多聲道信號的輸出聲道122進行關(guān)聯(lián)。如同已經(jīng)在第3a至9圖中所論證的，本發(fā)明概念應(yīng)用于現(xiàn)有技術(shù)的編碼方案中是非常容易的，可獲得感知質(zhì)量的提高，同時維持完整的后向兼容性。第11圖為本發(fā)明的音頻發(fā)射機或者記錄器330，具有編碼器60，輸入接口332以及輸出接口334。在發(fā)射機/記錄器330的輸入接口332處可以提供音頻信號。在發(fā)射機/記錄器內(nèi)部，使用本發(fā)明的編碼器60對該音頻信號進行編碼，并且在發(fā)射機/記錄器330的輸出接口334處輸出已編碼的表示。該已編碼的表示之后可以被傳送，或者存儲在存儲介質(zhì)上。第12圖為本發(fā)明的接收機或音頻播放器340，具有本發(fā)明的解碼器40，比特流輸入342，以及音頻輸出344。比特流可以在本發(fā)明的接收機/音頻播放器340的輸入342處輸入。然后，該比特流由解碼器40進行解碼，并且己解碼的信號可以在本發(fā)明的接收機/音頻播放器340的輸出344處輸出或者播放。第13圖為一傳輸系統(tǒng)，包括本發(fā)明的發(fā)射機330以及本發(fā)明的接收機340。對發(fā)射機330的輸入接口332處輸入的音頻信號進行編碼，然后從發(fā)射機330的輸出接口334傳輸至接收機340的輸入342。接收機對音頻信號進行解碼，并在其輸出344處回放或者輸出該音頻信號。總括而言，本發(fā)明通過描述例如如下的方法，來提供改進的解決方案-一種用以計算適用且穩(wěn)定的寬帶包絡(luò)的方法，可以使得可感知的失真為最小-一種優(yōu)化方法，以相對于(歸一化至)下混音信號的包絡(luò)而表示的方式，對包絡(luò)邊信息進行編碼，并且如此一來可以最小化比特率開銷-一種針對即將傳送的包絡(luò)信息的量化方案-一種被適配用于傳輸邊信息的比特流語法-一種在QMF子帶域中用以操作寬帶包絡(luò)的有效方法-一種如何將如前文所述的處理形式(1)與(2)統(tǒng)合成為單一架構(gòu)的概念，若描述原始時間聲道包絡(luò)的空間邊信息可用，則該單一架構(gòu)可以在時間上恢復(fù)多聲道信號的精細(xì)空間分布。若在空間比特流中并未發(fā)送該信息(例如由于可用邊信息比特率的限制)，則該處理退化成形式(l)處理，但是仍然可以對解相關(guān)的聲音執(zhí)行正確的時間成形(雖然并非基于單獨的聲道)。雖然在前面中所敘述之本發(fā)明概念，已經(jīng)廣泛的描述其在現(xiàn)有的MPEG編碼方案中的應(yīng)用，但是很顯然的本發(fā)明概念也可以應(yīng)用于任何其它形式的編碼，其中空間音頻特性必須被保留下來。引入或者使用中間信號用于該包絡(luò)成形的本發(fā)明概念，亦即具有增大的時間分辨率的信號的能量(如同在附圖中所描繪的)不僅可以應(yīng)用于頻域，也可以應(yīng)用于時域，其中例如在時間分辨率的減低以及如此一來使得所需比特率的減低，可以通過在連續(xù)時間片上取平均值，或者僅考慮音頻信號的采樣表示的每個第n采樣值而實現(xiàn)。雖然在前面的段落中所闡明的本發(fā)明概念，包含對已處理信號進行頻譜白化，但是具有中間分辨率信號的該概念也可以不需要包含該頻譜白化。取決于本發(fā)明方法的特定實現(xiàn)需求，本發(fā)明方法可以使用硬件或者軟件實現(xiàn)。該實現(xiàn)方式可以使用數(shù)字存儲介質(zhì)，并且與可編程計算機系統(tǒng)的共同配合執(zhí)行之下，使得本發(fā)明方法可以執(zhí)行，其中該數(shù)字存儲介質(zhì)特別是指其上存儲有電可讀控制信號的盤、DVD或者CD。大體而言，本發(fā)明因此是具有程序代碼存儲在機器可讀載體(carrier)上的計算機程序產(chǎn)品；當(dāng)該計算機程序產(chǎn)品在計算機上運行時，該程序代碼可操作地執(zhí)行本發(fā)明方法。換句話說，本發(fā)明方法因此是具有程序代碼的計算機程序，當(dāng)該計算機程序在計算機上運行時，可以執(zhí)行本發(fā)明方法中至少一種方法。雖然在前面中，均參考于特別的具體實施例，進行特別的陳述與描述，但是應(yīng)該了解的是，在該技術(shù)中所使用的各種技巧，在不偏離本發(fā)明精神以及范圍的情況下，任何熟悉該項技術(shù)所屬之領(lǐng)域者，可以在其形式上以及細(xì)節(jié)上做各種不同的改變。應(yīng)該被了解的是，在不偏離于此所揭露以及于接下來的專利申請范圍中所界定的廣泛概念之下，可以進行各種不同的改變以使其適用于不同的具體實施例。權(quán)利要求1.一種解碼器，用于根據(jù)基底信號和波形參數(shù)表示而產(chǎn)生多聲道輸出信號，所述基底信號從具有一個或更多個聲道的原始多聲道信號中導(dǎo)出，所述基底信號的聲道個數(shù)小于原始多聲道信號的聲道個數(shù)，所述基底信號具有幀，所述幀包括具有高分辨率的采樣值，所述波形參數(shù)表示是用來表示原始多聲道信號中所選原始聲道的中間分辨率表示的波形，所述波形參數(shù)表示包括具有中間時間分辨率的中間波形參數(shù)的序列，所述中間時間分辨率低于采樣值的高時間分辨率，并高于由幀重復(fù)率所定義的低時間分辨率；所述解碼器包括上混音器，用于產(chǎn)生具有比中間分辨率更高的時間分辨率的多個上混音聲道；以及成形器，用于使用與所選上混音聲道相對應(yīng)的所選原始聲道的中間波形參數(shù)，對所選上混音聲道進行成形。2.如權(quán)利要求1所述的解碼器，其中，所述上混音器還可操作地導(dǎo)出所述基底信號的中間分辨率表示。3.如權(quán)利要求2所述的解碼器，其中，所述上混音器可操作地使用濾波器組來導(dǎo)出所述基底信號的中間分辨率表示，所述基底信號的中間分辨率表示是在濾波器組域中導(dǎo)出。4.如權(quán)利要求3所述的解碼器，其中，所述濾波器組是復(fù)調(diào)制濾波器組。5.如權(quán)利要求1所述的解碼器，其中，所述上混音器具有一個或更多個解相關(guān)器，所述解相關(guān)器用于從所述基底信號中導(dǎo)出一個或更多個解相關(guān)的信號。6.如權(quán)利要求5所述的解碼器，其中，所述上混音器可操作地使得所述上混音聲道的產(chǎn)生包括所述基底信號以及所述一個或更多個解相關(guān)的信號的聲道的線性組合。7.如權(quán)利要求6所述的解碼器，其中，所述成形器可操作地對所選上混音聲道進行成形，使得從所述基底信號中導(dǎo)出的所選上混音聲道的第一部分與從所述一個或更多個解相關(guān)的信號中導(dǎo)出的所選上混音聲道的第二部分獨立地成形。8.如權(quán)利要求1所述的解碼器，其中，所述成形器可操作地使用中間波形參數(shù)，所述中間波形參數(shù)描述了所選聲道的中間分辨率表示的信號強度測量。9.如權(quán)利要求8所述的解碼器，其中，所述成形器可操作地使用中間波形參數(shù)，所述中間波形參數(shù)描述了具有振幅或者能量測量的信號強度測量。10.如權(quán)利要求1所述的解碼器，其中，所述上混音器可操作地導(dǎo)出所述基底信號的中間分辨率表示，用于產(chǎn)生所述上混音聲道；以及其中，所述成形器可操作地導(dǎo)出所述基底信號的中間分辨率表示的參考波形參數(shù)表示，用于使用所述波形參數(shù)表示以及所述參考波形參數(shù)表示對所選上混音信號進行成形。11.如權(quán)利要求IO所述的解碼器，其中，所述成形器可操作地對所選上混音聲道進行成形，使得所述成形包括來自所述波形參數(shù)表示以及來自所述參考波形參數(shù)表示的參數(shù)的組合。12.如權(quán)利要求IO所述的解碼器，其中，所述成形器可操作地導(dǎo)出所述基底信號的中間分辨率表示的頻譜平坦表示，所述頻譜平坦表示具有平坦的頻譜；而且所述成形器可操作地從所述頻譜平坦表示中導(dǎo)出所述參考波形參數(shù)表示。13.如權(quán)利要求1所述的解碼器，其中，所述成形器還被適配用于使用具有低時間分辨率的附加參數(shù)，對所選上混音聲道進行成形。14.如權(quán)利要求l所述的解碼器，還具有輸出接口，使用已成形的所選上混音聲道來產(chǎn)生具有高時間分辨率的多聲道輸出信號。15.如權(quán)利要求14所述的解碼器，其中，所述輸出接口可操作地產(chǎn)生所述多聲道輸出信號，使得所述多聲道輸出信號的產(chǎn)生包括多個已成形的上混音聲道的濾波器組表示的合成，導(dǎo)致具有高時間分辨率的多個已成形的上混音聲道的時域表示。16.如權(quán)利要求1所述的解碼器，其中，所述成形器具有解量化器，所述解量化器用于使用具有少于IO個量化步驟的解量化規(guī)則，從波形參數(shù)表示的量化表示中導(dǎo)出該波形參數(shù)表示。17.如權(quán)利要求16所述的解碼器，其中，所述成形器具有熵解碼器，所述熵解碼器用于從所述波形參數(shù)表示的熵編碼表示中導(dǎo)出該波形參數(shù)表示的量化表示。18.如權(quán)利要求17所述的解碼器，其中，所述熵解碼器可操作地使用霍夫曼碼簿來導(dǎo)出所述波形參數(shù)表示的量化表示。19.如權(quán)利要求3所述的解碼器，其中，所述成形器可操作地在時域中對所選上混音聲道進行成形。20.—種編碼器，用于產(chǎn)生具有幀的多聲道信號的聲道的波形參數(shù)表示，該幀包括具有采樣周期的采樣值；所述編碼器包括時間分辨率減低器，用于使用幀的采樣值來導(dǎo)出聲道的低分辨率表示，所述低分辨率表示具有低分辨率值，所述低分辨率值具有大于所述采樣周期的相關(guān)聯(lián)的低分辨率周期；以及波形參數(shù)計算器，用于計算表示所述低分辨率表示的波形的波形參數(shù)表示，其中，所述波形參數(shù)計算器被適配用于產(chǎn)生具有比采樣值的時間分辨率要低并且比幀重復(fù)率所定義的時間分辨率要高的時間分辨率的波形參數(shù)的序列。21.如權(quán)利要求20所述的編碼器，其中，所述時間分辨率減低器具有濾波器組，所述濾波器組用于導(dǎo)出聲道的低分辨率表示，所述聲道的低分辨率表示在濾波器組域中導(dǎo)出。22.如權(quán)利要求20所述的編碼器，其中，所述時間分辨率減低器還可操作地導(dǎo)出從所述多聲道信號導(dǎo)出的基底信號的參考低分辨率表示，所述基底信號的聲道個數(shù)小于所述多聲道信號的聲道個數(shù)；而且，所述波形參數(shù)計算器可操作地使用參考低分辨率表示以及該聲道的低分辨率表示來計算波形參數(shù)。23.如權(quán)利要求22所述的編碼器，其中，所述波形參數(shù)計算器可操作地使得所述波形參數(shù)的計算包括參考低分辨率表示以及該聲道的低分辨率表示的振幅測量的組合。24.如權(quán)利要求20所述的編碼器，其中，所述波形參數(shù)計算器具有量化器，所述量化器用于導(dǎo)出所述波形參數(shù)的量化表示。25.如權(quán)利要求24所述的編碼器，其中，所述波形參數(shù)計算器具有熵編碼器，所述熵編碼器用于導(dǎo)出所述波形參數(shù)的量化表示的熵編碼表示。26.—種用于根據(jù)基底信號和波形參數(shù)表示而產(chǎn)生多聲道輸出信號的方法，所述基底信號從具有一個或更多個聲道的原始多聲道信號中導(dǎo)出，所述基底信號的聲道個數(shù)小于原始多聲道信號的聲道個數(shù)，所述基底信號具有幀，所述幀包括具有高分辨率的采樣值，所述波形參數(shù)表示是用來表示原始多聲道信號中所選原始聲道的中間分辨率表示的波形，所述波形參數(shù)表示包括具有中間時間分辨率的中間波形參數(shù)的序列，所述中間時間分辨率低于采樣值的高時間分辨率，并高于由幀重復(fù)率所定義的低時間分辨率；所述方法包括產(chǎn)生具有比所述中間分辨率更高的時間分辨率的多個上混音聲道；以及使用與所選上混音聲道相對應(yīng)的所選原始聲道的中間波形參數(shù)，對所選上混音聲道進行成形。27.—種用于產(chǎn)生具有幀的多聲道信號的聲道的波形參數(shù)表示的方法，所述幀包括具有采樣周期的采樣值；所述方法包括使用幀的釆樣值來導(dǎo)出聲道的低分辨率表示，所述低分辨率表示具有低分辨率值，所述低分辨率值具有大于采樣周期的相關(guān)聯(lián)的低分辨率周期；以及計算表示所述低分辨率表示的波形的波形參數(shù)表示，其中所述波形參數(shù)計算器被適配用于產(chǎn)生具有比采樣值的時間分辨率要低并且比幀重復(fù)率所定義的時間分辨率要高的時間分辨率的波形參數(shù)的序列。28.—種多聲道音頻信號的表示，所述多聲道音頻信號表示基于基底信號和波形參數(shù)表示，所述基底信號從具有一個或更多個聲道的原始多聲道信號中導(dǎo)出，所述基底信號的聲道個數(shù)小于多聲道信號的聲道個數(shù)，所述基底信號具有幀，所述幀包括具有高分辨率的采樣值，所述波形參數(shù)表示是用來表示原始多聲道信號中所選聲道的中間分辨率表示的波形，所述波形參數(shù)表示包括具有時間分辨率的中間波形參數(shù)的序列，所述時間分辨率低于采樣值的高時間分辨率，并高于由幀重復(fù)率所定義的低時間分辨率。29.—種計算機可讀存儲介質(zhì)，在該計算機可讀存儲介質(zhì)上存儲有多聲道音頻信號表示，所述多聲道音頻信號表示基于基底信號和波形參數(shù)表示，所述基底信號從具有一個或更多個聲道的原始多聲道信號中導(dǎo)出，所述基底信號的聲道個數(shù)小于多聲道信號的聲道個數(shù)，所述基底信號具有幀，所述幀包括具有高分辨率的采樣值，所述波形參數(shù)表示是用來表示原始多聲道信號中所選聲道的中間分辨率表示的波形，所述波形參數(shù)表示包括具有時間分辨率的中間波形參數(shù)的序列，所述時間分辨率低于采樣值的高時間分辨率，并高于由幀重復(fù)率所定義的低時間分辨率。30.—種具有解碼器的接收機或音頻播放器，所述解碼器根據(jù)基底信號和波形參數(shù)表示而產(chǎn)生多聲道輸出信號，所述基底信號從具有一個或更多個聲道的原始多聲道信號中導(dǎo)出，所述基底信號的聲道個數(shù)小于原始多聲道信號的聲道個數(shù)，所述基底信號具有幀，所述幀包括具有高分辨率的采樣值，所述波形參數(shù)表示是用來表示原始多聲道信號中所選原始聲道的中間分辨率表示的波形，所述波形參數(shù)表示包括具有中間時間分辨率的中間波形參數(shù)的序列，所述中間時間分辨率低于采樣值的高時間分辨率，并高于由幀重復(fù)率所定義的低時間分辨率；所述解碼器包括上混音器，用于產(chǎn)生具有比中間分辨率更高的時間分辨率的多個上混音聲道；以及成形器，用于使用與所選上混音聲道相對應(yīng)的所選原始聲道的中間波形參數(shù)，對所選上混音聲道進行成形。31.—種具有編碼器的發(fā)射機或音頻記錄器，所述編碼器用于產(chǎn)生由幀來表示的多聲道信號的聲道的波形參數(shù)表示，所述幀包括具有采樣周期的采樣值；所述編碼器包括時間分辨率減低器，使用幀的采樣值來導(dǎo)出聲道的低分辨率表示，所述低分辨率表示具有低分辨率值，所述低分辨率值具有大于采樣周期的相關(guān)聯(lián)的低分辨率周期；以及波形參數(shù)計算器，用于計算表示該低分辨率表示的波形的波形參數(shù)表示，其中所述波形參數(shù)計算器被適配用于產(chǎn)生具有比采樣值的時間分辨率要低并且比幀重復(fù)率所定義的時間分辨率要高的時間分辨率的波形參數(shù)的序列。32.—種接收或音頻播放的方法，所述方法具有一種根據(jù)基底信號和波形參數(shù)表示而產(chǎn)生多聲道輸出信號的方法，所述基底信號從具有一個或更多個聲道的原始多聲道信號中導(dǎo)出，所述基底信號的聲道個數(shù)小于原始多聲道信號的聲道個數(shù)，所述基底信號具有幀，所述幀包括具有高分辨率的采樣值，所述波形參數(shù)表示是用來表示原始多聲道信號中所選原始聲道的中間分辨率表示的波形，所述波形參數(shù)表示包括具有中間時間分辨率的中間波形參數(shù)的序列，所述中間時間分辨率低于采樣值的高時間分辨率，并高于由幀重復(fù)率所定義的低時間分辨率；所述方法包括產(chǎn)生具有比所述中間分辨率更高的時間分辨率的多個上混音聲道；以及使用與所選上混音聲道相對應(yīng)的所選原始聲道的中間波形參數(shù)，對所選上混音聲道進行成形。33.—種傳送或者音頻記錄的方法，所述方法具有一種用以產(chǎn)生由幀來表示的多聲道信號的聲道的波形參數(shù)表示的方法，所述幀包括具有采樣周期的采樣值；所述方法包括使用幀的采樣值來導(dǎo)出聲道的低分辨率表示，所述低分辨率表示具有低分辨率值，所述低分辨率值具有大于采樣周期的相關(guān)聯(lián)的低分辨率周期；以及計算表示所述低分辨率表示的波形的波形參數(shù)表示，其中所述波形參數(shù)計算器被適配用于產(chǎn)生具有比采樣值的時間分辨率要低并且比幀重復(fù)率所定義的時間分辨率要高的時間分辨率的波形參數(shù)的序列。34.—種具有發(fā)射機和接收機的傳輸系統(tǒng)，所述發(fā)射機具有編碼器，所述編碼器用以產(chǎn)生具有幀的多聲道信號的聲道的波形參數(shù)表示，所述幀包括具有采樣周期的釆樣值；所述編碼器包括時間分辨率減低器，使用幀的采樣值來導(dǎo)出聲道的低分辨率表示，所述低分辨率表示具有低分辨率值，所述低分辨率值具有大于采樣周期的相關(guān)聯(lián)的低分辨率周期；以及波形參數(shù)計算器，用于計算表示該低分辨率表示的波形的波形參數(shù)表示，其中所述波形參數(shù)計算器被適配用于產(chǎn)生具有比采樣值的時間分辨率要低并且比幀重復(fù)率所定義的時間分辨率要高的時間分辨率的波形參數(shù)的序列；以及所述接收機具有解碼器，所述解碼器根據(jù)基底信號和波形參數(shù)表示而產(chǎn)生多聲道輸出信號，所述基底信號從具有一個或更多個聲道的原始多聲道信號中導(dǎo)出，所述基底信號的聲道個數(shù)小于原始多聲道信號的聲道個數(shù)，所述基底信號具有幀，所述幀包括具有高分辨率的采樣值，所述波形參數(shù)表示是用來表示原始多聲道信號中所選原始聲道的中間分辨率表示的波形，所述波形參數(shù)表示包括具有中間時間分辨率的中間波形參數(shù)的序列，該中間時間分辨率低于采樣值的高時間分辨率，并高于由幀重復(fù)率所定義的低時間分辨率，所述解碼器包括上混音器，用于產(chǎn)生具有比中間分辨率更高的時間分辨率的多個上混音聲道；以及成形器，用于使用與所選上混音聲道相對應(yīng)的所選原始聲道的中間波形參數(shù)，對所選上混音聲道進行成形。35.—種傳輸和接收方法，所述傳輸方法具有一種用以產(chǎn)生由幀來表示的多聲道信號的聲道的波形參數(shù)表示的方法，所述幀包括具有采樣周期的采樣值；所述方法包括使用幀的采樣值來導(dǎo)出聲道的低分辨率表示，所述低分辨率表示具有低分辨率值，所述低分辨率值具有大于采樣周期的相關(guān)聯(lián)的低分辨率周期；以及計算表示所述低分辨率表示的波形的波形參數(shù)表示，其中所述波形參數(shù)計算器被適配用于產(chǎn)生具有比采樣值的時間分辨率要低并且比幀重復(fù)率所定義的時間分辨率要高的時間分辨率的波形參數(shù)的序列；以及所述接收方法具有一種根據(jù)基底信號和波形參數(shù)表示而產(chǎn)生多聲道輸出信號的方法，所述基底信號從具有一個或更多個聲道的原始多聲道信號中導(dǎo)出，所述基底信號的聲道個數(shù)小于原始多聲道信號的聲道個數(shù)，所述基底信號具有幀，所述幀包括具有高分辨率的采樣值，所述波形參數(shù)表示是用來表示原始多聲道信號中所選原始聲道的中間分辨率表示的波形，所述波形參數(shù)表示包括具有中間時間分辨率的中間波形參數(shù)的序列，所述中間時間分辨率低于采樣值的高時間分辨率，并高于由幀重復(fù)率所定義的低時間分辨率；所述方法包括產(chǎn)生具有比所述中間分辨率更高的時間分辨率的多個上混音聲道；以及使用與所選上混音聲道相對應(yīng)的所選原始聲道的中間波形參數(shù)，對所選上混音聲道進行成形。36.—種具有程序代碼的計算機，當(dāng)在計算機上運行時，所述程序代碼執(zhí)行如權(quán)利要求26、27、32、33或35中任意一項所述的方法。全文摘要由從具有高時間分辨率的采樣值所組合而成的幀所表示的多聲道信號的所選聲道，當(dāng)表示該所選聲道的中間分辨率表示的波形的波形參數(shù)表示被推導(dǎo)出來時，該所選聲道可以被編碼成具有較高質(zhì)量的形式；該波形參數(shù)表示包括具有比采樣值的時間分辨率要低并且比幀重復(fù)率所定義的時間分辨率要高的時間分辨率的中間波形參數(shù)的序列。具有中間分辨率的波形參數(shù)表示可以用于對重建聲道進行成形，以獲得具有與該所選原始聲道的信號包絡(luò)十分接近的信號包絡(luò)的聲道。該成形過程是在比逐幀處理的時間刻度要短的時間刻度上執(zhí)行，因此可以提高該重建聲道的質(zhì)量。另一方面，該成形時間刻度比采樣值的時間刻度要大，因此可以顯著地降低波形參數(shù)表示所需的數(shù)據(jù)總量。文檔編號G10L19/00GK101356571SQ200680037901公開日2009年1月28日申請日期2006年8月31日優(yōu)先權(quán)日2005年10月12日發(fā)明者于爾根·赫勒,杰拉德·霍特胡,耶羅恩·布里巴特,薩沙·迪施,馬蒂亞斯·諾伊辛格申請人:弗勞恩霍夫應(yīng)用研究促進協(xié)會;皇家飛利浦電子股份有限公司

完整全部詳細(xì)技術(shù)資料下載