近透明或透明的多聲道編碼器/解碼器方案的制作方法

文檔序號(hào)：2829273閱讀：318來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專(zhuān)利名稱(chēng)：近透明或透明的多聲道編碼器/解碼器方案的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及多聲道編碼方案，具體涉及參數(shù)多聲道編碼方案。
技術(shù)背景如今，有兩種技術(shù)在充分利用立體聲音頻信號(hào)中所包含的立體聲冗余和不相干方面占優(yōu)勢(shì)。中側(cè)(M/S)立體聲編碼[l]，主要針對(duì)冗余去除，并基于以下事實(shí)由于兩個(gè)聲道經(jīng)常完全相關(guān)，因此對(duì)這兩個(gè)聲道之和以及差進(jìn)行編碼更加有益。因此，與較低功率側(cè)信號(hào)(side signal)(或差信號(hào))相比，可以在高功率的和信號(hào)上消耗更多比特。另一方面，強(qiáng)度立體聲編碼[2， 3]在每個(gè)子帶上通過(guò)以和信號(hào)和方位角代替兩個(gè)信號(hào)來(lái)實(shí)現(xiàn)不相干去除。在解碼器中，將方位角參數(shù)用于控制由子帶和信號(hào)所表示的聽(tīng)覺(jué)事件的空間位置。將中側(cè)和強(qiáng)度立體聲廣泛地用于現(xiàn)有的音頻編碼標(biāo)準(zhǔn)[4]。M/S方法關(guān)于冗余利用的問(wèn)題在于，如果兩個(gè)分量異相(一個(gè)相對(duì)于另一個(gè)延遲)，則M/S編碼增益為零。這是概念問(wèn)題，因?yàn)樵趯?shí) 際的音頻信號(hào)中時(shí)間經(jīng)延遲頻繁發(fā)生。例如，空間聽(tīng)力在很大程度上依靠信號(hào)(尤其是低頻率信號(hào))之間的時(shí)間差[5]。在音頻記錄中，時(shí)間延遲源于立體聲麥克風(fēng)裝備，以及人工后處理(音響效果)。在中側(cè)編碼中，經(jīng)常將自組織解決方案用于時(shí)間延遲問(wèn)題中在不同信號(hào) 的功率小于和信號(hào)的功率的常因子時(shí)只采用M/S編碼[l]。在[6]中更好地提出了對(duì)準(zhǔn)問(wèn)題，在其中從另一個(gè)信號(hào)分量來(lái)預(yù)測(cè)信號(hào)分量之一。在編碼器中，逐幀得到預(yù)測(cè)濾波器，并將其作為側(cè)信號(hào)方面信息進(jìn)行傳輸。在[7]中，考慮了反向自適應(yīng)備選。要注意的是，性能增益很大程度上取決于信號(hào)類(lèi)型，但是針對(duì)特定類(lèi)型的信號(hào)，獲得了與M/S立體聲編碼相比的顯著增益。
近來(lái)，參數(shù)立體聲編碼受到了很大關(guān)注[8-11]?；诤诵膯温暤?(單一聲道)編碼器，這種參數(shù)方案提取了立體聲(多聲道)分量，并以相對(duì)低的比特率對(duì)其進(jìn)行獨(dú)立編碼?？梢詫⒋丝醋鲝?qiáng)度立體聲編碼的概括。參數(shù)立體聲編碼方法在音頻編碼的低比特率范圍內(nèi)特別有用，這導(dǎo)致只將全部比特預(yù)算中的一小部分用于立體聲分量的質(zhì)量的顯著增長(zhǎng)。參數(shù)方法還由于可以縮放到多聲道(多于兩個(gè)聲道)情況并具有提供反向兼容的能力而引人注目MP3環(huán)繞聲[12]就是這樣的一個(gè)示例，其中對(duì)多聲道數(shù)據(jù)進(jìn)行編碼，并通過(guò)數(shù)據(jù)流的側(cè)信號(hào)聲場(chǎng) 進(jìn)行傳輸。這允許接收機(jī)不具有對(duì)正常的立體聲信號(hào)進(jìn)行編碼的多聲道性能，但是環(huán)繞聲使能的接收機(jī)可以享有多聲道音頻。參數(shù)方法經(jīng) 常依靠對(duì)不同的技術(shù)心理聲學(xué)，主要是聲道間電平差(ICLD's)和聲道間時(shí)間差(ICTD's)。在[11]中，提出了相干參數(shù)對(duì)于固有的音響效果具有重要意義。然而，參數(shù)方法受到以下限制由于固有的模型限制，編碼器在較高比特率時(shí)不能夠達(dá)到透明質(zhì)量。該問(wèn)題涉及參數(shù)多聲道編碼器，該參數(shù)多聲道編碼器的最大可獲得質(zhì)量值被限制到明顯在透明質(zhì)量之下的閾值。參數(shù)質(zhì)量閾值如圖11 中的1100所示。從表示根據(jù)BBC增強(qiáng)型單聲道編碼器(1102)的質(zhì) 量/比特率的示意性曲線圖中可以看出，該質(zhì)量不能超過(guò)與比特率無(wú)關(guān) 的參數(shù)質(zhì)量閾值1100。這意味著，即使使用增大的比特率，這種參數(shù) 多聲道編碼器的質(zhì)量也不再增大。BCC增強(qiáng)型單聲道編碼器是針對(duì)當(dāng)前存在的立體聲編碼器或多聲道編碼器的示例，在其中執(zhí)行立體聲-下混音或多聲道下混音。此外，通過(guò)描述聲道間電平關(guān)系、聲道間時(shí)間關(guān)系、聲道間相干關(guān)系等導(dǎo)出參數(shù)。該參數(shù)不同于諸如中側(cè)編碼器的側(cè)信號(hào)之類(lèi)的波形信號(hào)，因?yàn)榕c 參數(shù)表示相比，該側(cè)信號(hào)描述了以波形格式存在的兩個(gè)聲道之差，這通過(guò)給出特定參數(shù)而非逐個(gè)樣本的波形表示描述了兩個(gè)聲道之間的相似性或相異性。在參數(shù)需要用于從編碼器傳輸?shù)浇獯a器的少量比特的同時(shí)，波形描述，即從波形中導(dǎo)出的殘留信號(hào)，需要比理論上所允許的透明重構(gòu)更多的比特。
圖11示出了根據(jù)這種基于波形的傳統(tǒng)的立體聲編碼器(1104) 的典型質(zhì)量/比特率。從圖11中可以明顯看出，比特率越大，諸如中側(cè)立體聲編碼器的傳統(tǒng)立體聲編碼器^J質(zhì)量也越高，直至該質(zhì)量達(dá)到透明質(zhì)量。存在一種"交叉比特率"，在這個(gè)比特率處，參數(shù)多聲道編碼器的特性曲線1102和傳統(tǒng)的基于波形的立體聲編碼器的曲線1104 相互交叉。在這個(gè)交叉(cross-over)比特率之下，參數(shù)多聲道編碼器遠(yuǎn)優(yōu)于傳統(tǒng)的立體聲編碼器。當(dāng)針對(duì)兩個(gè)編碼器考慮同一比特率時(shí)，參數(shù)多聲道編碼器提供了比傳統(tǒng)的基于波形的立體聲編碼器的質(zhì)量高出質(zhì)量差1108的質(zhì)量。換言之，當(dāng)希望具有特定質(zhì)量lllO時(shí)，可以使用參數(shù)編碼器按照與傳統(tǒng)的基于波形的立體聲編碼器相比減少了差比特率 1112的比特率來(lái)實(shí)現(xiàn)這個(gè)質(zhì)量。然而，在交叉比特率之上，情況則完全不同。因?yàn)閰?shù)編碼器處于其最大參數(shù)編碼器質(zhì)量閾值1100，所以可以只通過(guò)使用傳統(tǒng)的基于波形的立體聲編碼器來(lái)獲得較好的質(zhì)量，該立體聲編碼器使用與參數(shù) 編碼器中所使用的相同數(shù)量的比特。發(fā)明內(nèi)容本發(fā)明的目的是提供一種與現(xiàn)有多聲道編碼方案相比允許增大的質(zhì)量和減少的比特率的編碼/解碼方案。根據(jù)本發(fā)明的第一方面，這個(gè)目的可以由多聲道編碼器來(lái)實(shí)現(xiàn)，該多聲道編碼器用于對(duì)具有至少兩個(gè)聲道的原始多聲道信號(hào)進(jìn)行編碼，該多聲道編碼器包括參數(shù)提供器，用于提供一個(gè)或多個(gè)參數(shù)，形成一個(gè)或多個(gè)參數(shù)，使得可以使用從多聲道信號(hào)和一個(gè)或多個(gè)參數(shù) 中所導(dǎo)出的一個(gè)或多個(gè)下混音信號(hào)來(lái)形成重構(gòu)多聲道信號(hào)；殘留信號(hào) 編碼器，基于原始多聲道信號(hào)、一個(gè)或多個(gè)下混音聲道或一個(gè)或多個(gè) 參數(shù)來(lái)產(chǎn)生己編碼的殘留信號(hào)，所以使用殘留信號(hào)所形成的重構(gòu)多聲道信號(hào)比不使用殘留信號(hào)所形成的重構(gòu)多聲道信號(hào)與原始多聲道信號(hào) 更相似；以及數(shù)據(jù)流成形器，用于形成具有殘留信號(hào)以及一個(gè)或多個(gè) 參數(shù)的數(shù)據(jù)流。
根據(jù)本發(fā)明的第二方面，這個(gè)目的可以由多聲道解碼器來(lái)實(shí)現(xiàn)，該多聲道解碼器用于對(duì)具有一個(gè)或多個(gè)下混音聲道、一個(gè)或多個(gè)參數(shù) 以及已編碼的殘留信號(hào)的己編碼的多聲道信號(hào)進(jìn)行解碼，該多聲道解碼器包括殘留信號(hào)解碼器，用于基于己編碼的殘留信號(hào)產(chǎn)生已解碼的殘留信號(hào)；以及多聲道解碼器，用于使用一個(gè)或多個(gè)下混音聲道和一個(gè)或多個(gè)參數(shù)來(lái)產(chǎn)生第一重構(gòu)多聲道信號(hào)，其中該多聲道解碼器還可以用于使用一個(gè)或多個(gè)下混音聲道和已解碼的殘留信號(hào)來(lái)代替第一重構(gòu)多聲道信號(hào)或者除了第一多聲道信號(hào)之外又產(chǎn)生第二重構(gòu)多聲道信號(hào)，其中該第二重構(gòu)多聲道信號(hào)比第一重構(gòu)多聲道信號(hào)與原始多聲道信號(hào)更為相似。根據(jù)本發(fā)明的第三方面，這個(gè)目的可以由多聲道編碼器來(lái)實(shí)現(xiàn)，該多聲道編碼器用于對(duì)具有至少兩個(gè)聲道的原始多聲道信號(hào)進(jìn)行編碼，該多聲道編碼器包括時(shí)間對(duì)準(zhǔn)器，用于使用對(duì)準(zhǔn)參數(shù)對(duì)至少兩個(gè)聲道的第一聲道和第二聲道進(jìn)行對(duì)準(zhǔn)；下混音器，用于使用已對(duì)準(zhǔn) 的聲道產(chǎn)生下混音聲道；增益計(jì)算器，計(jì)算用于對(duì)已對(duì)準(zhǔn)的聲道進(jìn)行加權(quán)的不等于l的增益參數(shù)，因此與增益值l相比，已對(duì)準(zhǔn)的聲道之間的差減少；以及數(shù)據(jù)流成形器，用于形成具有關(guān)于下混音聲道的信息、關(guān)于對(duì)準(zhǔn)參數(shù)的信息以及關(guān)于增益參數(shù)的信息的數(shù)據(jù)流。根據(jù)本發(fā)明的第四方面，這個(gè)目的可以由多聲道解碼器來(lái)實(shí)現(xiàn)，該多聲道解碼器用于對(duì)具有關(guān)于一個(gè)或多個(gè)下混音聲道的信息、關(guān)于增益參數(shù)的信息、關(guān)于對(duì)準(zhǔn)參數(shù)的信息的已編碼的多聲道信號(hào)進(jìn)行解碼，該多聲道解碼器包括下混音聲道解碼器，用于產(chǎn)生已解碼的下混音信號(hào)；以及處理器，用于使用增益參數(shù)對(duì)已解碼的下混音聲道進(jìn) 行處理，以獲得第一解碼輸出聲道，此外該處理器使用增益參數(shù)對(duì)已解碼的下混音聲道進(jìn)行處理，并使用對(duì)準(zhǔn)參數(shù)進(jìn)行解對(duì)準(zhǔn)，以獲得第二解碼輸出聲道。本發(fā)明的另一個(gè)方面包括相應(yīng)的方法、數(shù)據(jù)流/文件和計(jì)算機(jī)程序。本發(fā)明基于以下結(jié)論通過(guò)結(jié)合參數(shù)編碼和基于波形的編碼提出了涉及傳統(tǒng)的參數(shù)編碼器以及基于波形的解碼器的問(wèn)題。本發(fā)明的這
種編碼器產(chǎn)生縮放數(shù)據(jù)流，該數(shù)據(jù)流具有作為第一增強(qiáng)層的已編碼的參數(shù)表示以及作為第二增強(qiáng)層的己編碼的殘留信號(hào)，該殘留信號(hào)優(yōu)選地為波形類(lèi)型的信號(hào)。通常，在純參數(shù)多聲道編碼器中不被提供的另外的殘留信號(hào)，可用于改進(jìn)可實(shí)現(xiàn)的質(zhì)量，尤其是圖11中的交叉比特率與最大透明質(zhì)量之間的質(zhì)量。在圖11中可以看出，即使處于交叉比特率以下，對(duì)于可比較的比特率處的質(zhì)量，本發(fā)明的編碼器算法仍然優(yōu)于純參數(shù)多聲道編碼器。然而，與完全基于波形的傳統(tǒng)的立體聲編碼器相比，本發(fā)明的組合參數(shù)/波形編碼/解碼方案具有更高的比特效率。換言之，本發(fā)明的設(shè)備最優(yōu)地結(jié)合了參數(shù)編碼和基于波形編碼的優(yōu)點(diǎn)，使得即使在交叉比特率之上，本發(fā)明的編碼器仍可以利用參數(shù) 概念，但優(yōu)于純參數(shù)編碼器。根據(jù)特定實(shí)施例，本發(fā)明的優(yōu)點(diǎn)或多或少優(yōu)于現(xiàn)有技術(shù)的參數(shù)編碼器或傳統(tǒng)的基于波形的多聲道編碼器。更先進(jìn)的實(shí)施例提供了更好的質(zhì)量/比特率特性，而本發(fā)明的低水平的實(shí)施例則需要編碼器和/或解碼器方面較少的處理功率，但是，由于純參數(shù)編碼器的質(zhì)量受圖11中的閾值質(zhì)量1100限制，那么由于另外進(jìn)行編碼的殘留信號(hào)則導(dǎo)致比純參數(shù)編碼器更好的質(zhì)量。本發(fā)明的編碼/解碼方案的優(yōu)點(diǎn)在于能夠無(wú)縫地從純參數(shù)編碼轉(zhuǎn) 移到近似波形或完全波形的透明編碼。優(yōu)選地，將參數(shù)立體聲編碼和中側(cè)立體聲編碼結(jié)合成能夠朝著透明質(zhì)量會(huì)聚的方案。在這個(gè)優(yōu)選的中側(cè)立體聲相關(guān)的方案中，更有效地利用了信號(hào)分量(即左聲道和右聲道)之間的相關(guān)性。一般而言，在一些實(shí)施例中，可以將本發(fā)明的思想應(yīng)用于參數(shù)多聲道編碼器。在一個(gè)實(shí)施例中，從原始信號(hào)中導(dǎo)出殘留信號(hào)，而沒(méi)有使用也可用于編碼器的參數(shù)信息。本實(shí)施例在處理功率和處理器的可能的能量消耗之間存在爭(zhēng)議的情況下是優(yōu)選地。這種情況可以發(fā)生在具有諸如移動(dòng)電話、掌上設(shè)備等的具有受限的功率可能性的手持設(shè)備上。殘留信號(hào)只從原始信號(hào)中導(dǎo)出，并且不依靠下混音或參數(shù)。因此，在解碼器側(cè)，使用下混音聲道和參數(shù)所產(chǎn)生的第一重構(gòu)多聲道信號(hào)不用于產(chǎn)生第二重構(gòu)多聲道信號(hào)。然而，一方面在參數(shù)中存在一些冗余，另一方面在殘留信號(hào)中存在一些冗余?？梢酝ㄟ^(guò)其他用于計(jì)算已編碼的殘留信號(hào)的編碼器/解碼器系統(tǒng)來(lái)獲得冗余去除，該編碼器/解碼器系統(tǒng)利用在編碼器處可用的參數(shù)信息，并且還可選地利用也在編碼器中可用的下混音聲道。根據(jù)特定情況，殘留信號(hào)編碼器可以是由合成設(shè)備通過(guò)使用下混音聲道和參數(shù)信息來(lái)計(jì)算完全重構(gòu)多聲道信號(hào)的分析。然后，基于該重構(gòu)信號(hào)，可以產(chǎn)生每個(gè)聲道的差信號(hào)，從而獲得多聲道差錯(cuò)表示，可以使用不同方式來(lái)處理該多聲道差錯(cuò)表示。一種方式是將另一種參數(shù)多聲道編碼方案應(yīng)用于多聲道差錯(cuò)表示。另一種可能性是執(zhí)行用于對(duì)多聲道差錯(cuò)表示進(jìn)行下混音的矩陣變換方案。另一種可能性是從左和右環(huán)繞聲道中除去差錯(cuò)信號(hào)，然后只對(duì)中間聲道差錯(cuò)信號(hào)進(jìn)行編碼或者，此外還對(duì)左聲道差錯(cuò)信號(hào)和右差錯(cuò)聲道差錯(cuò)信號(hào)進(jìn)行編碼。因此，存在基于差錯(cuò)表示來(lái)實(shí)現(xiàn)殘留信號(hào)處理器的多種可能性。上面所提到的實(shí)施例允許對(duì)殘留信號(hào)進(jìn)行縮放編碼的高靈活性。然而，因?yàn)樵诰幋a器處執(zhí)行完全的多聲道重構(gòu)，然后產(chǎn)生多聲道信號(hào) 中的每個(gè)聲道的差錯(cuò)表示，并將其輸入殘留信號(hào)處理器中，這完全是處理功率的要求。在解碼器側(cè)，首先必須計(jì)算第一重構(gòu)多聲道信號(hào)，然后基于作為對(duì)差錯(cuò)信號(hào)的任意表示的己編碼的殘留信號(hào)，必須產(chǎn)生第二重構(gòu)信號(hào)。因此，不管是否將要輸出第一重構(gòu)信號(hào)的事實(shí)，都必須在解碼器側(cè)對(duì)該第一重構(gòu)信號(hào)進(jìn)行計(jì)算。在本發(fā)明的另一個(gè)優(yōu)選實(shí)施例中，不考慮是否將要輸出第一重構(gòu) 多聲道信號(hào)的事實(shí)，都由對(duì)殘留信號(hào)的直接編碼側(cè)的計(jì)算來(lái)代替對(duì)編碼器側(cè)的合成方法的分析以及對(duì)第一重構(gòu)多聲道信號(hào)的計(jì)算。這是基于取決于多聲道參數(shù)的對(duì)原始聲道的加權(quán)，或者基于還是取決于對(duì)準(zhǔn) 參數(shù)的一種類(lèi)型的改進(jìn)的下混音。在本方案中，通過(guò)使用參數(shù)和原始信號(hào)，而不是使用一個(gè)或多個(gè)下混音聲道，來(lái)非迭代地計(jì)算另外的信息，即殘留信號(hào)。本方案在編碼器和解碼器側(cè)都非常有效。當(dāng)由于帶寬需求而不傳輸殘留信號(hào)或者從可縮放的數(shù)據(jù)流中除去殘留信號(hào)時(shí)，本發(fā)明的解碼器自動(dòng)基于下混音聲道和增益以及對(duì)準(zhǔn)參數(shù)而產(chǎn)生第一重構(gòu)多聲道信
號(hào)，當(dāng)輸入不等于零的殘留信號(hào)時(shí)，多聲道重構(gòu)器不計(jì)算第一重構(gòu)多聲道信號(hào)，而只計(jì)算第二重構(gòu)多聲道信號(hào)，因此，此編碼器/解碼器方案具有優(yōu)點(diǎn)允許在編碼器側(cè)以及解碼器側(cè)進(jìn)行十分有效的計(jì)算，并將參數(shù)表示用于減少殘留信號(hào)中的冗余，從而獲得具有非常高的處理功率效率和比特率效率的編碼/解碼方案。

關(guān)于附圖，對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行詳細(xì)描述，在附圖中圖1是本發(fā)明的多聲道編碼器的總體表示的方框圖；圖2是多聲道解碼器的總體表示的方框圖；圖3是低處理功率的編碼器側(cè)的實(shí)施例的方框圖；圖4是針對(duì)圖3的編碼器系統(tǒng)的解碼器實(shí)施例的方框圖；圖5是基于合成分析的編碼器實(shí)施例的方框圖；圖6是與圖5中的編碼器實(shí)施例相對(duì)應(yīng)的解碼器實(shí)施例的方框圖；圖7是在已編碼的殘留信號(hào)中具有減少的冗余的直接編碼器實(shí)施例的總體方框圖；圖8是與圖7中的編碼器相對(duì)應(yīng)的解碼器的優(yōu)選實(shí)施例；圖9a是基于圖7和圖8的概念的編碼器/解碼器方案的優(yōu)選實(shí)施例；圖9b是圖9a的實(shí)施例中不傳輸殘留信號(hào)而只傳輸對(duì)準(zhǔn)和增益參數(shù)時(shí)的優(yōu)選實(shí)施例；圖9c是用于圖9a和圖9b中的編碼器側(cè)的方程組；圖9d是用于圖9a和圖9b中的解碼器側(cè)的方程組；圖10是基于圖9a到圖9d的方案的實(shí)施例的分析濾波器組/合成濾波器組；以及圖11示出了參數(shù)和傳統(tǒng)的基于波形的編碼器與本發(fā)明的增強(qiáng)型編碼器的典型性能的比較。
具體實(shí)施例方式
圖1示出了用于對(duì)具有至少兩個(gè)聲道的原始多聲道信號(hào)進(jìn)行編碼的多聲道編碼器的優(yōu)選實(shí)施例。在立體聲環(huán)境下，第一聲道可以是左聲道10a，而第二聲道可以是右聲道10b。雖然在立體聲方案的上下文中描述了本發(fā)明的實(shí)施例，但因?yàn)榫哂欣?個(gè)聲道的多聲道表示具有若干對(duì)第一聲道和第二聲道，所以縮放成多聲道方案是直接的。在 5.1環(huán)繞方案的上下文中，第一聲道可以是左前聲道，而第二聲道可以是右前聲道。可選地，第一聲道可以是左前聲道，而第二聲道可以是中央聲道。可選地，第一聲道可以是中央聲道，而第二聲道可以是右前聲道。可選地，第一聲道可以是左后聲道(左環(huán)繞聲道)，而第二聲道可以是右后聲道(右環(huán)繞聲道)。本發(fā)明的編碼器可以包括用于產(chǎn)生一個(gè)或多個(gè)下混音聲道的下混音器12。在立體聲環(huán)境下，下混音器12將產(chǎn)生單一的下混音聲道。然而在多聲道環(huán)境下，下混音器12可以產(chǎn)生若干下混音聲道。在5.1 的多聲道環(huán)境下，下混音器13優(yōu)選地產(chǎn)生兩個(gè)下混音聲道。通常，下混音聲道的數(shù)量小于原始多聲道信號(hào)中的聲道的數(shù)量。本發(fā)明的多聲道編碼器還包括用于提供一個(gè)或多個(gè)參數(shù)的參數(shù) 提供器14，形成一個(gè)或多個(gè)參數(shù)使得可以使用從多聲道信號(hào)和一個(gè)或多個(gè)參數(shù)中導(dǎo)出的一個(gè)或多個(gè)下混音聲道來(lái)形成重構(gòu)多聲道信號(hào)。重要的是，本發(fā)明的多聲道編碼器還包括用于產(chǎn)生已編碼的殘留信號(hào)的殘留信號(hào)編碼器16?；谠级嗦暤佬盘?hào)、一個(gè)或多個(gè)下混音聲道或一個(gè)或多個(gè)參數(shù)，產(chǎn)生已編碼的殘留信號(hào)。通常，產(chǎn)生已編碼的殘留信號(hào)，使得使用殘留信號(hào)所形成的重構(gòu)多聲道信號(hào)比不使用殘留信號(hào)所形成的重構(gòu)多聲道信號(hào)與原始多聲道信號(hào)更相似。因此，已編碼的殘留信號(hào)允許解碼器產(chǎn)生具有高于圖11中所示的參數(shù)質(zhì)量閾值1100的質(zhì)量的重構(gòu)多聲道信號(hào)。將一個(gè)或多個(gè)參數(shù)和已編碼的殘留信號(hào)輸入到數(shù)據(jù)流成形器18中，該數(shù)據(jù)流成形器18形成具有殘留信號(hào)和一個(gè)或多個(gè)參數(shù)的數(shù)據(jù)流。優(yōu)選地，由數(shù)據(jù)流成形器18所輸出的數(shù)據(jù)流是具有包括關(guān)于一個(gè)或多個(gè)參數(shù)的信息的第一增強(qiáng)層以及包括關(guān)于已編碼的殘留信號(hào)的信息的第二增強(qiáng)層的縮放數(shù)據(jù)流。如現(xiàn)有技術(shù)中已知的，可以單獨(dú)對(duì)縮放數(shù)據(jù)流中的不同縮放層進(jìn)行解碼，使得諸如純參數(shù)編碼器的低水平設(shè)備處于通過(guò)簡(jiǎn)單地忽略第二增強(qiáng)層來(lái)對(duì) 縮放數(shù)據(jù)流進(jìn)行解碼的位置。在本發(fā)明的一個(gè)實(shí)施例中，縮放數(shù)據(jù)流還包括作為底層的一個(gè)或多個(gè)下混音聲道。然而，本發(fā)明還可用于在其中用戶己經(jīng)占有下混音聲道的環(huán)境。這種情況可以發(fā)生在下混音聲道是單聲道或立體聲信號(hào) 時(shí)，其中用戶已經(jīng)通過(guò)另一個(gè)傳輸聲道或通過(guò)相同的傳輸聲道進(jìn)行接收，但是早于對(duì)第一增強(qiáng)層和第二增強(qiáng)層的接收。當(dāng)存在下混音聲道和第一以及第二增強(qiáng)層的單獨(dú)傳輸時(shí)，編碼器不必包括下混音器12。這種情況由下混音器框中的虛線所表示。此外，參數(shù)提供器14不必基于第一和第二原始聲道對(duì)參數(shù)進(jìn)行實(shí)際計(jì)算。在針對(duì)特定聲道信號(hào)的參數(shù)已經(jīng)存在的情況下，足以向圖 1中的編碼器提供已產(chǎn)生的參數(shù)，因此將這些參數(shù)提供給數(shù)據(jù)流成形器18以及殘留信號(hào)編碼器，以便可選地用于殘留信號(hào)的計(jì)算，并將其引入縮放數(shù)據(jù)流中。然而，優(yōu)選地，殘留信號(hào)編碼器還使用由虛連接線19所示的參數(shù)。在本發(fā)明的優(yōu)選實(shí)施例中，可以通過(guò)單獨(dú)的比特率控制輸入端來(lái) 控制殘留信號(hào)編碼器16。在這種情況下，殘留信號(hào)編碼器包括諸如具有可控量化器步長(zhǎng)的量化器之類(lèi)的特定有損編碼器。當(dāng)通過(guò)比特率輸入端來(lái)發(fā)送大的量化器的步長(zhǎng)時(shí)，己編碼的殘留信號(hào)將具有與通過(guò)比特率控制輸入端來(lái)發(fā)送較小的量化器的步長(zhǎng)的情況相比的較小的值范圍(由量化器輸出最大的量化指標(biāo))。較大的量化器的步長(zhǎng)將導(dǎo)致對(duì)已編碼的殘留信號(hào)的較低比特需求，并因此導(dǎo)致已縮放的數(shù)據(jù)流，與在其中在殘留信號(hào)編碼器16內(nèi)的量化器具較小的量化器步長(zhǎng)從而導(dǎo)致了已編碼的殘留信號(hào)需要更多比特的情況相比，該已縮放的數(shù)據(jù)流具有減少的比特率。嚴(yán)格地說(shuō)，上述要點(diǎn)適用于標(biāo)量量化。然而，總得來(lái)說(shuō)，使用具有可控分辨率的基于向量量化技術(shù)的編碼器是優(yōu)選的。當(dāng)分辨率較高時(shí)，與分辨率較低的情況相比，需要更多的比特來(lái)對(duì)殘留信號(hào)進(jìn)行編碼。圖2示出了本發(fā)明的多聲道解碼器的優(yōu)選實(shí)施例，該多聲道解碼
器可以與圖1中的編碼器一起使用。具體地，圖2示出了用于對(duì)具有一個(gè)或多個(gè)下混音聲道、一個(gè)或多個(gè)參數(shù)以及已編碼的殘留信號(hào)的已編碼的多聲道信號(hào)進(jìn)行解碼。所有這些信息，即下混音聲道、參數(shù)以及已編碼的殘留信號(hào)都包括在被輸入到數(shù)據(jù)流剖析器的縮放數(shù)據(jù)流20中，該數(shù)據(jù)流剖析器從縮放數(shù)據(jù)流20中提取已編碼的殘留信號(hào)，并將已編碼的殘留信號(hào)轉(zhuǎn)發(fā)到殘留信號(hào)編碼器22中。類(lèi)似地，將一個(gè) 或多個(gè)已優(yōu)選編碼的下混音聲道提供給下混音解碼器24。此外，將一個(gè)或多個(gè)己優(yōu)選編碼的參數(shù)提供給參數(shù)解碼器23，以便以已解碼的形式提供一個(gè)或多個(gè)參數(shù)。將由框22、 23和24所輸出的信息輸入到用于產(chǎn)生第一重構(gòu)多聲道信號(hào)26或第二重構(gòu)多聲道信號(hào)27的多聲道解碼器25中。由多聲道解碼器25通過(guò)使用一個(gè)或多個(gè)下混音聲道和一個(gè)或多個(gè)參數(shù)而不是使用殘留信號(hào)來(lái)產(chǎn)生第一重構(gòu)多聲道信號(hào)。然而，第二重構(gòu)多聲道信號(hào)27是通過(guò)使用一個(gè)或多個(gè)下混音聲道和已解碼的殘留信號(hào)來(lái)產(chǎn)生的。因?yàn)闅埩粜盘?hào)包括另外的信息，優(yōu)選地包括波形信息，所以第二重構(gòu)多聲道信號(hào)27比第一重構(gòu)多聲道信號(hào)與原始多聲道信號(hào)(例如圖1中的聲道10a和10b)更相似。根據(jù)多聲道解碼器25的特定實(shí)現(xiàn)，多聲道解碼器25輸出第一重構(gòu)聲道26或第二重構(gòu)聲道信號(hào)27?？蛇x地，除了第二重構(gòu)多聲道信號(hào)之外，多聲道解碼器25還對(duì)第一重構(gòu)多聲道信號(hào)進(jìn)行計(jì)算。必然地，在所有的實(shí)現(xiàn)中，當(dāng)縮放數(shù)據(jù)流包括已編碼的殘留信號(hào)時(shí)，多聲道解碼器25只輸出第一重構(gòu)多聲道信號(hào)。然而，在通過(guò)除去第二增強(qiáng)層對(duì) 縮放數(shù)據(jù)流按照其方式從編碼器到解碼器進(jìn)行處理時(shí)，多聲道解碼器 25將只輸出第一重構(gòu)多聲道信號(hào)。這種去除第二增強(qiáng)層可以發(fā)生在編碼器和解碼器之間存在傳輸聲道時(shí)，這具有非常嚴(yán)格限制的帶寬資源，因此縮放數(shù)據(jù)流的傳輸只在沒(méi)有第二增強(qiáng)層時(shí)可能。圖3和圖4示出了本發(fā)明的概念的一個(gè)實(shí)施例，該實(shí)施例在編碼器側(cè)(圖3)以及解碼器側(cè)(圖4)都只需要減少的處理功率。圖3 中的編碼器包括強(qiáng)度立體聲編碼器30，該強(qiáng)度立體聲編碼器30 —方面輸出單聲道下混音信號(hào)，另一方面輸出參數(shù)強(qiáng)度立體聲的直接信息。將優(yōu)選地通過(guò)添加第一和第二輸入聲道所形成的單聲道下混音輸入數(shù)
據(jù)率減速器31中。對(duì)于單聲道下混音聲道，數(shù)據(jù)率減速器31可以包括任意公知的音頻編碼器，例如MP3編碼器、ACC編碼器或針對(duì)單聲道信號(hào)的任意其他音頻編碼器。對(duì)于參數(shù)方向信息，數(shù)據(jù)率減速器 31可以包括針對(duì)參數(shù)信息的任意已知編碼器，例如差值編碼器、均衡器和/諸如Huffman編碼器或算術(shù)編碼器之類(lèi)的熵編碼器。因此，圖3 中的框30和31提供了圖l編碼器中的框12和14所示意性示出的功能。殘留信號(hào)編碼器16包括側(cè)信號(hào)計(jì)算器32和隨后所采用的數(shù)據(jù)率減速器33。側(cè)信號(hào)計(jì)算器32對(duì)從現(xiàn)有技術(shù)的中側(cè)立體聲編碼器中已知的幅值信號(hào)執(zhí)行計(jì)算。一個(gè)優(yōu)選示例是對(duì)第一聲道10a和第二聲道 10b之間的逐個(gè)樣本的差進(jìn)行計(jì)算，以獲得波形類(lèi)型的側(cè)信號(hào)，然后將該側(cè)信號(hào)輸入針對(duì)數(shù)據(jù)率壓縮的數(shù)據(jù)率減速器33中。數(shù)據(jù)率減速器 33可以包括與上面所概述的關(guān)于數(shù)據(jù)率減速器31的相同的元件。在框33的輸出處獲得已編碼的殘留信號(hào)，將該殘留信號(hào)輸入數(shù)據(jù)流成形器18中，從而得到優(yōu)選地縮放的數(shù)據(jù)流?，F(xiàn)在，由框18所輸出的數(shù)據(jù)流包括除了單聲道下混音以外的參數(shù)強(qiáng)度立體聲方向信息和以波形類(lèi)型編碼的殘留信號(hào)。通過(guò)結(jié)合圖1已經(jīng)討論的比特率控制輸入端，可以控制數(shù)據(jù)率減速器31。在另一個(gè)實(shí)施例中，數(shù)據(jù)率減速器33被設(shè)置用于產(chǎn)生縮放輸出數(shù)據(jù)流，該數(shù)據(jù)流在其底層以每采樣較少數(shù)量比特進(jìn)行殘留信號(hào) 編碼，并且在其第一增強(qiáng)層中以每采樣中等數(shù)量的比特進(jìn)行殘余編碼，以及在其下一個(gè)增強(qiáng)層中以每采樣較多數(shù)量比特進(jìn)行殘余編碼。對(duì)于數(shù)據(jù)率減速器輸出端的底層，可以使用例如每采樣0.5比特。例如，針對(duì)第一增強(qiáng)層，可以使用例如每采樣4比特，以及對(duì)于第二增強(qiáng)層，可以使用例如每采樣16比特。圖4中示出了相應(yīng)的解碼器。將輸入到數(shù)據(jù)流剖析器21中的數(shù) 據(jù)流解析成單獨(dú)輸出到解壓縮器23的參數(shù)信息。將己編碼的下混音信息輸入解壓縮器24，并將已編碼的殘留信號(hào)輸入到殘留信號(hào)解壓縮器 22中。圖4中的解碼器還包括直接的強(qiáng)度立體聲解碼器40，此外還包括中/側(cè)解碼器41。這兩個(gè)解碼器40和41執(zhí)行多聲道解碼器25的功
能，以便輸出由強(qiáng)度立體聲解碼器40單獨(dú)產(chǎn)生的第一重構(gòu)多聲道信號(hào)26，以及輸出由MS解碼器41單獨(dú)產(chǎn)生的第二重構(gòu)多聲道信號(hào)27。當(dāng)數(shù)據(jù)流包括已編碼的殘留信號(hào)時(shí)，圖4中的直接實(shí)現(xiàn)將輸出第一重構(gòu)多聲道信號(hào)26以及第二重構(gòu)多聲道信號(hào)。在這種情況下，必然只有更好的第二重構(gòu)多聲道信號(hào)27對(duì)用戶是有益的。因此，可以提供解碼器控制42，以便自動(dòng)檢測(cè)數(shù)據(jù)流中是否存在已編碼的殘留信號(hào)。當(dāng)自動(dòng)檢測(cè)到數(shù)據(jù)流中沒(méi)有這種已編碼的殘留信號(hào)時(shí)，解碼器控制42 起到了對(duì)中側(cè)解碼器40進(jìn)行去激活以節(jié)約處理功率的作用，因此電池電源在諸如移動(dòng)電話等的低功率手持設(shè)備中尤其有用。圖5示出了本發(fā)明的另一個(gè)實(shí)施例，其中基于合成分析方法產(chǎn)生了已編碼的殘留信號(hào)。此外，將第一和第二聲道10a、 10b輸入下混音器50，下混音器50后面接著數(shù)據(jù)率減速器51。在框51的輸出處，獲得具有一個(gè)或多個(gè)下混音聲道的優(yōu)選壓縮的下混音信號(hào)，并將其提供給數(shù)據(jù)流成形器18。因此，框50和51提供圖1中的下混音器設(shè)備12 的功能。此外，將第一和第二聲道10a、 10b提供給參數(shù)計(jì)算器53，并將參數(shù)計(jì)算器所輸出的參數(shù)轉(zhuǎn)發(fā)到用于對(duì)一個(gè)或多個(gè)參數(shù)進(jìn)行壓縮的另一個(gè)數(shù)據(jù)率減速器54。因此，框53和54提供了與圖1中的參數(shù) 提供器14相同的功能。然而，與圖3中的實(shí)施例相比，殘留信號(hào)編碼器16更為復(fù)雜。具體地，殘留信號(hào)編碼器16包括參數(shù)多聲道重構(gòu)器55。以兩個(gè)聲道為例，多聲道重構(gòu)器產(chǎn)生第一重構(gòu)聲道和第二重構(gòu)聲道。因此參數(shù)多聲道重構(gòu)器只使用下混音聲道和參數(shù)，所以由框55所輸出的重構(gòu)多聲道信號(hào)的質(zhì)量將與圖11中的曲線1102相對(duì)應(yīng)，并始終在圖11中的參數(shù)閾值1100之下。將重構(gòu)多聲道信號(hào)輸入到差錯(cuò)計(jì)算器56中。差錯(cuò)計(jì)算器56還可用于接收第一和第二輸入聲道10a、 10b，并輸出第一差錯(cuò)信號(hào)和第二差錯(cuò)信號(hào)。優(yōu)選地，差錯(cuò)計(jì)算器計(jì)算原始聲道和相應(yīng)的重構(gòu)聲道(輸出框55)之間的逐個(gè)樣本的差。針對(duì)每對(duì)原始聲道和重構(gòu)聲道，執(zhí)行此過(guò)程。差錯(cuò)計(jì)算器56的輸出又是多聲道表示，但是此時(shí)與原始聲道信號(hào)相比為多聲道差錯(cuò)信號(hào)。將這個(gè)具有與原始聲道信號(hào)相同數(shù)量的
聲道的多聲道差錯(cuò)信號(hào)輸入用于產(chǎn)生已編碼的殘留信號(hào)的殘留信號(hào)處理器57中。存在殘留信號(hào)處理器57的多個(gè)實(shí)現(xiàn)，這些實(shí)現(xiàn)全都取決于帶寬需求、所需的可縮放度、質(zhì)量需求等。在一個(gè)優(yōu)選實(shí)施例中，殘留信號(hào)處理器57再次實(shí)現(xiàn)為用于產(chǎn)生一個(gè)或多個(gè)差錯(cuò)下混音聲道和差錯(cuò)下混音參數(shù)的多聲道編碼器。因?yàn)?殘留信號(hào)處理器57可以包括框50、 51、 53和54，可以認(rèn)為這個(gè)實(shí)施例是一種迭代多聲道編碼器?？蛇x地，殘留信號(hào)處理器57可用于只從其具有最大能量的輸入信號(hào)中選擇單一或兩個(gè)差錯(cuò)聲道，并只對(duì)最大能量差錯(cuò)信號(hào)進(jìn)行處理，以獲得已編碼的殘留信號(hào)。除了這個(gè)準(zhǔn)則以外或者代替這個(gè)準(zhǔn)則，可以使用基于可感知的更激發(fā)的差錯(cuò)測(cè)量的更先進(jìn)的準(zhǔn)則?？蛇x地，殘留信號(hào)處理器可以包括用于將輸入聲道下混音為一個(gè)或多個(gè)下混音聲道的矩陣化方案，使得相應(yīng)的解碼器設(shè)備可以執(zhí)行模擬解矩陣過(guò)程。然而，可以使用公知的單聲道或立體聲編碼器的元件來(lái)對(duì)一個(gè)或多個(gè) 下混音聲道進(jìn)行處理，或者可以使用上面所提到的單聲道/立體聲編碼器中的一個(gè)來(lái)對(duì)一個(gè)或多個(gè)下混音聲道進(jìn)行完全處理，以獲得已編碼的殘留信號(hào)。圖6中示出了針對(duì)圖5中的編碼器的解碼器。與圖2的實(shí)施例相比，圖6顯示了多聲道解碼器25包括參數(shù)多聲道重構(gòu)器60和合成器 61。參數(shù)多聲道重構(gòu)器60只基于已解碼的下混音和已解碼的參數(shù)信息來(lái)產(chǎn)生第一重構(gòu)多聲道信號(hào)26。當(dāng)數(shù)據(jù)流中不包括已編碼的殘留信號(hào) 時(shí)，可以輸出第一重構(gòu)信號(hào)26。然而，當(dāng)數(shù)據(jù)流中包括己編碼的殘留信號(hào)時(shí)，則不輸出第一重構(gòu)信號(hào)，而是將其輸入到合成器61中，以便將參數(shù)重構(gòu)的多聲道信號(hào)26合成為已解碼的殘留信號(hào)，這里已解碼的殘留信號(hào)是在上面所討論的圖5中的差錯(cuò)計(jì)算器56的輸出處的差錯(cuò)表示的表示之一。合成器61將己解碼的殘留信號(hào)(即，差錯(cuò)信號(hào)的任意表示)和參數(shù)重構(gòu)的多聲道信號(hào)進(jìn)行合成，以輸出第二重構(gòu)號(hào)27。當(dāng) 關(guān)于圖11來(lái)考慮圖6中的解碼器時(shí)，顯而易見(jiàn)的是，針對(duì)特定比特率，第一重構(gòu)信號(hào)具有由線1102所確定的質(zhì)量，而第二重構(gòu)信號(hào)27具有
由線1114針對(duì)相同比特率所確定的較高的質(zhì)量。因?yàn)橐丫幋a的殘留信號(hào)中的冗余減少，所以圖5/圖6中的實(shí)施例優(yōu)于圖3/圖4中的實(shí)施例。然而，圖5/圖6中的實(shí)施例需要較大量的處理功率、存儲(chǔ)、電池資源和算法延遲。隨后，參考關(guān)于編碼器表示的圖7以及關(guān)于解碼器表示的圖8，描述了對(duì)圖3/圖4中的實(shí)施例與圖5/圖6中的實(shí)施例之間的優(yōu)選折衷。該編碼器包括使用第一和第二輸入聲道10a、 10b來(lái)執(zhí)行下混音的特定下混音器74。與只通過(guò)添加原始聲道10a、 10b來(lái)獲得單聲道信號(hào)所產(chǎn)生的簡(jiǎn)單下混音相比，下混音器74由通過(guò)參數(shù)計(jì)算器71所產(chǎn)生的對(duì)準(zhǔn)參數(shù)控制。這里，在將兩個(gè)信號(hào)彼此相加之前，對(duì)兩個(gè)輸入聲道 10a、 10b進(jìn)行相互間的時(shí)間對(duì)準(zhǔn)。按照這種方式下，在下混音器70 的輸出處得到特定的單聲道信號(hào)，例如該單聲道信號(hào)不同于在圖3中以30示出的低電平強(qiáng)度立體聲編碼器所產(chǎn)生的單聲道信號(hào)。除了對(duì)準(zhǔn)參數(shù)之外，或代替對(duì)準(zhǔn)參數(shù)，參數(shù)計(jì)算器71可用于產(chǎn) 生增益參數(shù)。將該增益參數(shù)輸入加權(quán)設(shè)備72中，以便在執(zhí)行側(cè)信號(hào)的計(jì)算之前，優(yōu)選地使用增益參數(shù)對(duì)第二聲道10b進(jìn)行加權(quán)。在計(jì)算第一和第二聲道之間的類(lèi)似波形差之前，對(duì)第二聲道的加權(quán)導(dǎo)致較小的殘留信號(hào)，如圖所示將該殘留信號(hào)作為特定側(cè)信號(hào)輸入到任何適當(dāng)?shù)?數(shù)據(jù)率減速器33中。圖7中所示的數(shù)據(jù)率減速器33可以完全地實(shí)現(xiàn) 為圖3中所示的數(shù)據(jù)率減速器33。圖7中的實(shí)施例與圖3中的實(shí)施例的不同之處在于優(yōu)選地在下混音器70以及殘留信號(hào)計(jì)算中說(shuō)明參數(shù)信息，這樣由圖7中的數(shù)據(jù)率減速器33所輸出的殘留信號(hào)可以由比數(shù)據(jù)率減速器33所輸出的信號(hào) 更少數(shù)量的比特來(lái)表示。這是由于圖7中的殘留信號(hào)包括的冗余小于圖3中的殘留信號(hào)所包括的冗余的事實(shí)。圖8示出了與圖7中的編碼器實(shí)現(xiàn)相對(duì)應(yīng)的解碼器實(shí)現(xiàn)的優(yōu)選實(shí) 施例。與圖6中的解碼器相比，多聲道重構(gòu)器25可用于在側(cè)信號(hào)(即殘留信號(hào))為零時(shí)自動(dòng)輸出第一重構(gòu)多聲道信號(hào)26，或者在殘留信號(hào) 不等于零時(shí)自動(dòng)輸出第二重構(gòu)多聲道信號(hào)27。因此，圖8中的多聲道重構(gòu)器25不能同時(shí)輸出兩個(gè)信號(hào)26和27，但是可以只輸出這兩個(gè)信
號(hào)中的第一個(gè)或這兩個(gè)信號(hào)中的第二個(gè)。因此，圖8中的實(shí)施例不需要諸如圖4中所示的任意解碼器控制。具體地，圖8中的殘留信號(hào)解碼器22輸出由圖7中的相應(yīng)的解碼器元件72所產(chǎn)生的特定側(cè)信號(hào)。此外，下混音解碼器24輸出由圖 7中的下混音器70所產(chǎn)生的特定單聲道信號(hào)。然后，將特定側(cè)信號(hào)和特定單聲道信號(hào)與增益參數(shù)以及時(shí)間對(duì)準(zhǔn) 參數(shù)一起輸入多聲道解碼器。增益參數(shù)可用于控制增益級(jí)84根據(jù)第一增益規(guī)則來(lái)采用增益。此外，增益參數(shù)控制另外的增益級(jí)82、 83根據(jù) 不同的第二增益規(guī)則來(lái)應(yīng)用增益。此外，多聲道重構(gòu)器包括減法器84 和加法器85以及時(shí)間解對(duì)準(zhǔn)框86，以產(chǎn)生重構(gòu)第一聲道和重構(gòu)第二聲道。隨后，參考圖7和圖8的編碼器/解碼器方案的優(yōu)選實(shí)施例。圖 9a示出了根據(jù)本發(fā)明的方面的完全編碼器/解碼器方案，其中殘余信號(hào) d (n)不等于零。此外，圖9b指示了在沒(méi)有計(jì)算差信號(hào)d (n)或者己經(jīng)除去數(shù)據(jù)流以減少殘留信號(hào)(例如由于傳輸帶寬相關(guān)的需求)時(shí) 的圖9a中的可縮放的編碼器/解碼器。在圖9a的實(shí)施例中，在從編碼器傳輸?shù)浇獯a器的數(shù)據(jù)流中除去已編碼的殘留信號(hào)的情況下，圖9a 的實(shí)施例變成了純參數(shù)多聲道場(chǎng)景，其中對(duì)準(zhǔn)參數(shù)和增益參數(shù)是多聲道參數(shù)，而特定的單聲道信號(hào)是從編碼器側(cè)傳輸?shù)浇獯a器側(cè)的下混音聲道。因?yàn)樵诮獯a器側(cè)沒(méi)有接收到殘留信號(hào)，即d(n)等于零，則只通過(guò)使用對(duì)準(zhǔn)和增益參數(shù)來(lái)執(zhí)行解碼器側(cè)的多聲道重構(gòu)。圖9c示出了基于本發(fā)明的編碼器的方程，而圖9d則指示了基于本發(fā)明的解碼器的方程。具體地，本發(fā)明的編碼器包括作為來(lái)自圖1的參數(shù)提供器14 的參數(shù)計(jì)算器71。參數(shù)計(jì)算器71可用于計(jì)算時(shí)間對(duì)準(zhǔn)參數(shù)，以便將右聲道r (n)與左聲道l (n)對(duì)準(zhǔn)。在圖9a到圖9d中，已對(duì)準(zhǔn)的右聲道由ra (n)表示。優(yōu)選地，從輸入信號(hào)的重疊塊中提取出對(duì)準(zhǔn)參數(shù)。該對(duì)準(zhǔn)參數(shù)與左聲道和右聲道之間的時(shí)間延遲相對(duì)應(yīng)，并優(yōu)選地使用時(shí)間域的互相關(guān)技術(shù)來(lái)對(duì)該對(duì)準(zhǔn)參數(shù)進(jìn)行估計(jì)。針對(duì)在子帶中不存在
對(duì)準(zhǔn)增益的情況，例如在獨(dú)立信號(hào)的情況下，將延遲參數(shù)設(shè)為零。優(yōu) 選地，在子帶結(jié)構(gòu)中，每個(gè)子帶估計(jì)一個(gè)延遲(時(shí)間對(duì)準(zhǔn))參數(shù)。在優(yōu)選實(shí)施例中，采用46ms的估定分析率和50%的重疊漢明窗。參數(shù)計(jì)算器71還計(jì)算增益值。該增益值也優(yōu)選地從信號(hào)的重疊塊中提取。自然地，增益參數(shù)與在諸如公知的技術(shù)心理聲學(xué)編碼方案之類(lèi)的參數(shù)編碼中普遍使用的電平差參數(shù)?？蛇x地，可以使用迭代方法來(lái)計(jì)算增益值，其中將差信號(hào)反饋到參數(shù)計(jì)算器中，并且設(shè)置增益值，使得差信號(hào)達(dá)到如圖9a中的虛線90所示的最小值。一旦計(jì)算了參數(shù)對(duì)準(zhǔn)和增益，則可以開(kāi)始圖7中的下混音器70以及圖7中的殘留信號(hào)編碼器16。具體地，圖7中的下混音器70包括用于將一個(gè)聲道延遲所計(jì)算的時(shí)間對(duì)準(zhǔn)參數(shù)的對(duì)準(zhǔn)框91。然后，使用加法設(shè)備92將所延遲的第二聲道ra (n)與第一聲道相加。在加法器92的輸出處，存在下混音聲道。因此，圖7中的下混音器70包括框91和92以形成特定的單聲道信號(hào)。圖7中的殘留信號(hào)編碼器16還包括加權(quán)器93和后續(xù)的側(cè)信號(hào)計(jì) 算器94，側(cè)信號(hào)計(jì)算器94用于計(jì)算原始第一聲道和已對(duì)準(zhǔn)且已加權(quán) 的第二聲道之間的差。具體地，為了對(duì)已對(duì)準(zhǔn)的第二聲道進(jìn)行加權(quán)，執(zhí)行用于相應(yīng)的解碼器側(cè)框80中的第一加權(quán)規(guī)則。因此，殘留信號(hào)編碼器16包括對(duì)準(zhǔn)設(shè)備91、加權(quán)設(shè)備93、以及側(cè)信號(hào)計(jì)算器94。因?yàn)?將已對(duì)準(zhǔn)的第二聲道用于下混音以及殘留信號(hào)計(jì)算，對(duì)已對(duì)準(zhǔn)的右聲道進(jìn)行一次計(jì)算則足夠，并將結(jié)果轉(zhuǎn)發(fā)到圖7中的下混音器70以及加權(quán)器/側(cè)信號(hào)計(jì)算器72中。優(yōu)選地，選擇對(duì)準(zhǔn)和增益因子，使得該處理可逆，因此可以很好地定義了圖9d中的方程并在數(shù)值對(duì)其進(jìn)行了良好的限定。可以將普通單聲道編碼器51用于對(duì)和信號(hào)進(jìn)行編碼，并且將優(yōu) 選為專(zhuān)用的殘留信號(hào)編碼器33應(yīng)用于殘留信號(hào)。當(dāng)單聲道編碼器51是無(wú)損耗的，即不再對(duì)單聲道信號(hào)進(jìn)行量化，或者殘留信號(hào)編碼器也是無(wú)損耗的，或者對(duì)準(zhǔn)信號(hào)模型與源信號(hào)完全匹配時(shí)，圖9a中所示的本發(fā)明的編碼結(jié)構(gòu)具有也假設(shè)了對(duì)準(zhǔn)和增益參數(shù)只用于無(wú)損耗編碼方案的理想重構(gòu)屬性。圖9a中的本發(fā)明的系統(tǒng)為可以在如圖11中的線1114所示的幅度多個(gè)范圍內(nèi)作用于功能下降的方案提供架構(gòu)。具體地，不進(jìn)行殘留信號(hào)編碼，即d(n)-0，則該方案通過(guò)只傳輸除了單聲道信號(hào)(作為下混音聲道)以外的對(duì)準(zhǔn)和增益參數(shù)(作為多聲道參數(shù))而變成參數(shù)立體聲編碼。圖9b中示出了這種情況。此外，本發(fā)明的系統(tǒng)具有優(yōu)點(diǎn) 該對(duì)準(zhǔn)方法自動(dòng)提出單聲道下混音問(wèn)題。隨后，參考圖10，圖10將圖9a到9b中所示的本發(fā)明的實(shí)施例的實(shí)現(xiàn)作為子帶編碼結(jié)構(gòu)示出。將原始左和右聲道輸入分析濾波組 1000中，以得到若干子帶信號(hào)。針對(duì)每個(gè)子帶信號(hào)，使用如圖9a到 9d所示的編碼/解碼方案。在解碼器側(cè)，在合成濾波器組1010中對(duì)重構(gòu)子帶信號(hào)進(jìn)行合成，以最終到達(dá)全帶重構(gòu)多聲道信號(hào)。自然地，對(duì) 于每個(gè)子帶，如圖10中的箭頭1020所示，將對(duì)準(zhǔn)參數(shù)和增益參數(shù)從編碼器側(cè)傳輸?shù)浇獯a器側(cè)。圖10中的子帶編碼結(jié)構(gòu)的優(yōu)選實(shí)現(xiàn)是基于具有兩個(gè)級(jí)的余弦調(diào) 制的濾波器組，以便實(shí)現(xiàn)不相等的子帶帶寬(以可感知的激發(fā)尺寸)。第一級(jí)將信號(hào)分割成M個(gè)子帶。對(duì)M個(gè)子帶信號(hào)進(jìn)行重要的抽取，并將其饋入第二級(jí)濾波器組。第二級(jí)的第k個(gè)濾波器具有Mk個(gè)頻帶，ke{l.....M}。在優(yōu)選實(shí)現(xiàn)中，使用M:8個(gè)頻帶，子子帶的結(jié)構(gòu)如圖10中的表所示，并在兩個(gè)級(jí)之后優(yōu)選地導(dǎo)致36個(gè)有效子帶。根據(jù) [13]，設(shè)計(jì)在抑制頻帶具有至少100dB衰減的原型濾波器。第一級(jí)的濾波器階數(shù)為116，第二級(jí)的最大濾波器階數(shù)為256。然后，將此編碼結(jié)構(gòu)應(yīng)用于子帶對(duì)(與左和右子帶聲道相對(duì)應(yīng))。第一和第二級(jí)濾波器組之間的子帶的相應(yīng)組如圖10右邊的表所示，可以清楚地看出第一子帶k包括16個(gè)子子帶。此外，第二子帶包括8個(gè)子子帶等。利用高斯模型(GM)向量量化(VQ)技術(shù)來(lái)實(shí)現(xiàn)有效的參數(shù)編碼。基于GM模型的量化在語(yǔ)音編碼[14-16]領(lǐng)域內(nèi)非常普遍，并且有利于高尺寸VQ的低復(fù)雜度的實(shí)現(xiàn)。在優(yōu)選實(shí)施例中，本發(fā)明對(duì)增益和延遲參數(shù)的36維向量進(jìn)行向量量化。所有的GM模型都具有16個(gè) 混合分量，并在從60分鐘的音頻數(shù)據(jù)(具有變化的內(nèi)容，并與隨后的
估計(jì)測(cè)試信號(hào)分開(kāi))中提取的參數(shù)的數(shù)據(jù)庫(kù)中進(jìn)行訓(xùn)練。基于清楚的統(tǒng)計(jì)模型的方法在音頻編碼中比在語(yǔ)音編碼中要不經(jīng)常使用。一個(gè)原因是不相信統(tǒng)計(jì)模型能夠捕捉通用音頻中所包含的所有相關(guān)信息的能力。然而在優(yōu)選情況下，通過(guò)使用對(duì)參數(shù)模型的開(kāi)和閉測(cè)試流程的初步估計(jì)確實(shí)表示了在這種情況下上述并不成問(wèn)題。針對(duì)增益和延遲參數(shù)所產(chǎn)生的比特率是2.3kbps。將子帶結(jié)構(gòu)充分用于對(duì)殘留信號(hào)進(jìn)行編碼。通過(guò)使用如上述所描述的相同塊，估計(jì)每個(gè)子帶中的變化，并使用GMVQ互子帶來(lái)對(duì)該變化進(jìn)行向量量化(即，每次對(duì)一個(gè)36維的向量進(jìn)行編碼)。該變化有利于采用貪婪比特分配算法[17、 p.234]在子帶之間進(jìn)行比特分配。然后使用統(tǒng)一的標(biāo)量量化來(lái)對(duì)子帶信號(hào)進(jìn)行編碼。通過(guò)對(duì)塊估計(jì)的線性內(nèi)插，得到瞬時(shí)增益g (n)和延遲r (n)。基于對(duì)脈沖響應(yīng)的正弦函數(shù)的截?cái)嗖⒓訚h明窗，通過(guò)73rd階的分?jǐn)?shù)延遲濾波器來(lái)實(shí)現(xiàn)時(shí)間變化延遲。通過(guò)使用內(nèi)插的延遲差數(shù)，基于每個(gè) 樣本來(lái)更新濾波器的系數(shù)。提出了針對(duì)通用音頻中的立體聲圖像的靈活編碼的架構(gòu)。通過(guò)使用新的結(jié)構(gòu)，可以從參數(shù)立體聲模式無(wú)縫地移到波形近似編碼。使用未編碼的殘留信號(hào)來(lái)對(duì)該思想的示例實(shí)現(xiàn)進(jìn)行測(cè)試，以估計(jì)殘留信號(hào) 編碼器的比特率的增長(zhǎng)效應(yīng)，以及使用MP3核心編碼器來(lái)估計(jì)更實(shí)際的場(chǎng)景中的方案。.為了使立體聲圖像穩(wěn)定，優(yōu)選地對(duì)純參數(shù)系統(tǒng)或可縮放系統(tǒng)中的參數(shù)進(jìn)行低通濾波，該純參數(shù)系統(tǒng)或可縮放系統(tǒng)具有純參數(shù)部分，可以如示例[9]所進(jìn)行的由解碼器未對(duì)殘余信號(hào)進(jìn)行處理來(lái)使用該純參數(shù)部分。這減少了系統(tǒng)的對(duì)準(zhǔn)增益。通過(guò)使用標(biāo)量子帶編碼對(duì)殘留信號(hào)進(jìn)行編碼，經(jīng)一步增大了質(zhì)量，并且質(zhì)量接近透明質(zhì)量。具體地，通過(guò)向殘留信號(hào)增加比特來(lái)穩(wěn)定立體聲圖像，而且還增加了立體聲寬度。此外，優(yōu)選地使用靈活的時(shí)間分割以及可變速率(例如，比特貯備)技術(shù)來(lái)更好地利用通用音頻的動(dòng)態(tài)特性。優(yōu)選地，相干參數(shù)包括在對(duì)準(zhǔn)濾波器中，以增強(qiáng)參數(shù)模式。改進(jìn)的殘留信號(hào)編碼、采用知覺(jué) 掩蔽、向量量化、以及差分編碼，導(dǎo)致更有效的不相干以及冗余去除。
雖然在立體聲編碼的上下文以及參數(shù)增強(qiáng)的中側(cè)編碼方案的上下文中對(duì)本發(fā)明的系統(tǒng)進(jìn)行了描述，這里要注意的是，諸如通用強(qiáng)度立體聲類(lèi)型的編碼之類(lèi)的每個(gè)多聲道參數(shù)編碼/解碼方案，可以利用另外公開(kāi)的側(cè)信號(hào)元件，以便最終達(dá)到理想的重構(gòu)屬性。雖然已經(jīng)通過(guò) 使用編碼器側(cè)的時(shí)間對(duì)準(zhǔn)、傳輸對(duì)準(zhǔn)參數(shù)、以及使用解碼器側(cè)的時(shí)間解對(duì)準(zhǔn)來(lái)對(duì)本發(fā)明的編碼器/解碼器方案的優(yōu)選實(shí)施例進(jìn)行了描述，但還是存在另外的可選項(xiàng)，該可選項(xiàng)在編碼器側(cè)執(zhí)行時(shí)間對(duì)準(zhǔn)以產(chǎn)生小的差信號(hào)，但是不在解碼器側(cè)執(zhí)行時(shí)間解對(duì)準(zhǔn)，因此不將對(duì)準(zhǔn)參數(shù)從編碼器傳輸?shù)浇獯a器。在本實(shí)施例中，時(shí)間解對(duì)準(zhǔn)的忽略必然包括人為現(xiàn)象。然而，在大多數(shù)情況下，這種人為現(xiàn)象并不嚴(yán)重，因此這個(gè) 實(shí)施例尤其適于低價(jià)多聲道解碼器。因此，還可以將本發(fā)明看作優(yōu)選的BCC類(lèi)型的參數(shù)立體聲編碼方案或任意其他多聲道編碼方案的縮放，當(dāng)去除已編碼的殘留信號(hào)時(shí)，其完全回退到純參數(shù)方案。根據(jù)本發(fā)明，通過(guò)傳輸各種類(lèi)型的額外信息來(lái)增強(qiáng)純參數(shù)系統(tǒng)，額外信息優(yōu)選地包括波形類(lèi)型的殘留信號(hào)、增益參數(shù)和/或時(shí)間對(duì)準(zhǔn)參數(shù)。因此，使用額外信息的解碼操作導(dǎo)致比可單獨(dú)用于參數(shù)技術(shù)更高的質(zhì)量。根據(jù)需求，用于編碼或解碼的本發(fā)明的方法可以在硬件、軟件或固件上實(shí)現(xiàn)。因此，本發(fā)明還涉及一種用于存儲(chǔ)程序代碼的計(jì)算機(jī)可讀介質(zhì)，在計(jì)算機(jī)上運(yùn)行該程序代碼時(shí)，該程序代碼導(dǎo)致本發(fā)明方法之一。因此，本發(fā)明是具有程序代碼的計(jì)算機(jī)程序，該程序代碼在計(jì) 算機(jī)上運(yùn)行時(shí)導(dǎo)致本發(fā)明的方法。
參考文獻(xiàn)列表[I] J.D. Johnston and A.J. Ferreira， .Sum-difference stereo transform coding," in Proc. IEEE Int. Conf. Acoust., Speech, Signal Processing (ICASSP)， 1992， vol. 2， pp. 569.572.[2] R. Waal and R. Veldhuis, .Subband coding of stereophonic digitalaudio signals," in Proc. IEEE Int. Conf. Acoust-, Speech, SignalProcessing (ICASSP), 1991， pp. 3601.3604. [3] J. Herre， K. Brandenburg, and D. Lederer, .Intensity stereocoding," in Preprint 3799， 96th AES Convention, 1994. [4] K. Brandenburg, .MP3 and AAC explained," in Proc. of the AES17th International Conference, paper no. 17-009， 1999. [5] J. Blauert, Spatial hearing: the psychophysics of human soundlocalization, The MIT Press, Cambridge, Massachusetts, 1997. [6] H. Fuchs， .Improving joint stereo audio coding by adaptiveinter-channel prediction," in Proc. of IEEE Workshop onApplications of Signal Processing to Audio and Acoustics, 1993，pp. 39.42.[7] H. Fuchs， .Improving MPEG audio coding by backward adaptive linear stereo prediction," in Preprint 4086, 99th AES Convention, 1995.[8] F. Baumgarte and C. Faller, .Binaural cue coding, part I:Psychoacoustic fundamentals and design principles," IEEE Trans.Speech Audio Processing, vol. 11, no. 6， pp. 509.519， 2003. [9] C. Faller and F. Baumgarte, .Binaural cue coding, part II: Schemesand applications," IEEE Trans. Speech Audio Processing, vol. 11，no. 6, pp. 520.531， 2003. [10]C. Faller， Parametric Coding of Spatial Audio, Ph.D. thesis, EcolePolytechnique Federale de Lausanne, 2004.[II] J. Breebaart， S. van de Par, A. Kohlrausch, and E. Schuijers,"High-quality parametric spatial audio coding at low bitrates," in Preprint 6072， 116th AES Convention, 2004. [12] J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, and C. Spenger， .MP3 surround: Efficient and compatible coding of multi-channel audio," in Preprint 6049， 116th AES Convention, 2004.[13]Y-P. Lin and P.P. Vaidyanaythan, .A Kaiser window approach forthe design of prototype filters of cosine modulated filterbanks,"IEEE Signal Processing Letters, vol. 5， no. 6， pp. 132.134, 1998. [14]P. Hedelin and J. Skoglund， "Vector quantization based onGaussian mixture models," IEEE Trans. Speech Audio Processing,vol. 8， no. 4， pp. 385,401, 2000. [15]A.D. Subramaniam and B.D. Rao， .PDF optimized parametricvector quantization of speech line spectral frequencies," IEEETrans. Speech Audio Processing, vol. 11, no. 2， pp. 130.142， 2003. [16]J. Lindblom and P. Hedelin, .Variable-dimension quantization ofsinusoidal amplitudes using Gaussian mixture models," in Proc.IEEE Int. Conf. A謹(jǐn)st.， Speech, Signal Processing (ICASSP)，2004， vol. l，pp. 153.156. [17]A. Gersho and R. M. Gray, Vector Quantization and SignalCompression, Kluwer Academic Publishers, Boston, 1992. [18]T.I. Laakso, V. Valim汪ki， M. Karjalainen， and U.K. Laine, "Toolsfor fractional delay filter design," IEEE Signal ProcessingMagazine, pp. 30.60, January 1996. [19]ITU-R Recommendation BS.1534, Method for the SubjectiveAssessment of Intermediate Quality Level of Coding Systems,ITU-T, 2001.[20]The LAME project, http:〃lame.sourceforge.net/， July 2004， v3.96丄
權(quán)利要求
1.一種多聲道編碼器，用于對(duì)具有至少兩個(gè)聲道的原始多聲道信號(hào)進(jìn)行編碼，所述多聲道編碼器包括參數(shù)提供器，用于提供一個(gè)或多個(gè)參數(shù)，形成所述一個(gè)或多個(gè)參數(shù)，使得可以使用從多聲道信號(hào)和一個(gè)或多個(gè)參數(shù)中獲得的一個(gè)或多個(gè)下混音聲道來(lái)形成重構(gòu)多聲道信號(hào)；殘留信號(hào)編碼器，用于基于原始多聲道信號(hào)、一個(gè)或多個(gè)下混音聲道、或一個(gè)或多個(gè)參數(shù)來(lái)產(chǎn)生已編碼的殘留信號(hào)，使得使用殘留信號(hào)所形成的重構(gòu)多聲道信號(hào)比沒(méi)有使用殘留信號(hào)所形成的重構(gòu)多聲道信號(hào)與原始多聲道信號(hào)更相似；以及數(shù)據(jù)流成形器，用于形成具有殘留信號(hào)和一個(gè)或多個(gè)參數(shù)的數(shù)據(jù)流。
2. 如權(quán)利要求1所述的多聲道編碼器，其中所述數(shù)據(jù)流成形器用于形成可縮放數(shù)據(jù)流，其中一個(gè)或多個(gè)參數(shù)和殘留信號(hào)處于不同的縮放層。
3. 如權(quán)利要求1所述的多聲道編碼器，其中所述殘留信號(hào)編碼器用于將已編碼的殘留信號(hào)作為波形殘留信號(hào)進(jìn)行計(jì)算。
4. 如權(quán)利要求1所述的多聲道編碼器，其中所述殘留信號(hào)編碼器用于基于一個(gè)或多個(gè)參數(shù)和原始多聲道信號(hào)而非一個(gè)或多個(gè)下混音聲道來(lái)產(chǎn)生殘留信號(hào)，因此與沒(méi)有使用一個(gè)或多個(gè)參數(shù)的殘留信號(hào)的產(chǎn)生相比，所述殘留信號(hào)具有較小的能量。
5. 如權(quán)利要求4所述的多聲道編碼器，其中所述參數(shù)提供器包括對(duì)準(zhǔn)計(jì)算器，用于計(jì)算將要提供給用于對(duì)至少兩個(gè)聲道中的第一聲道和第二聲道進(jìn)行對(duì)準(zhǔn)的時(shí)間對(duì)準(zhǔn)器的時(shí)間對(duì)準(zhǔn)參數(shù)；或者增益計(jì)算器，計(jì)算用于對(duì)聲道進(jìn)行加權(quán)的不等于1的增益，使得兩個(gè)聲道之間的差與增益值1相比減少。
6. 如權(quán)利要求5所述的多聲道編碼器，其中所述殘留信號(hào)編碼器用于對(duì)從第一聲道和己對(duì)準(zhǔn)或已加權(quán)的第二聲道中獲得的差信號(hào)進(jìn) 行計(jì)算和編碼。
7. 如權(quán)利要求5所述的多聲道編碼器，還包括使用己對(duì)準(zhǔn)的聲道來(lái)產(chǎn)生下混音聲道的下混音器。
8. 如權(quán)利要求1所述的多聲道編碼器，還包括用于將多聲道信號(hào)分割成多個(gè)頻帶的分析濾波器組，其中所述參數(shù)提供器和殘留信號(hào)編碼器用于對(duì)子帶信號(hào)進(jìn)行操作，以及其中所述數(shù)據(jù)流成形器用于收集針對(duì)多個(gè)頻帶的已編碼的殘留信號(hào)和參數(shù)。
9. 如權(quán)利要求1所述的多聲道編碼器，其中所述殘留信號(hào)編碼器還包括多聲道解碼器，通過(guò)使用一個(gè)或多個(gè)下混音聲道和一個(gè)或多個(gè)參數(shù)來(lái)產(chǎn)生已解碼的多聲道信號(hào)；差錯(cuò)計(jì)算器，用于基于已解碼的多聲道信號(hào)和原始多聲道信號(hào)來(lái) 計(jì)算多聲道差錯(cuò)信號(hào)表示；以及殘留信號(hào)處理器，用于對(duì)多聲道差錯(cuò)信號(hào)表示進(jìn)行處理，以獲得己編碼的殘留信號(hào)。
10. 如權(quán)利要求9所述的多聲道編碼器，其中所述殘留信號(hào)處理器包括用于產(chǎn)生多聲道差錯(cuò)信號(hào)表示的多聲道表示的多聲道編碼器。
11. 如權(quán)利要求IO所述的多聲道編碼器，其中所述殘留信號(hào)處理器還用于產(chǎn)生多聲道差錯(cuò)信號(hào)表示的一個(gè)或多個(gè)下混音聲道。
12. 如權(quán)利要求1所述的多聲道編碼器，其中所述參數(shù)提供器用于提供技術(shù)心理聲學(xué)編碼(BCC)參數(shù)，例如聲道間電平差、聲道間相干參數(shù)、聲道間時(shí)間差或聲道包絡(luò)提示。
13. —種用于對(duì)具有至少兩個(gè)聲道的原始多聲道信號(hào)進(jìn)行編碼的方法，所述方法包括以下步驟-提供一個(gè)或多個(gè)參數(shù)，形成所述一個(gè)或多個(gè)參數(shù)，使得可以使用從多聲道信號(hào)和一個(gè)或多個(gè)參數(shù)中所獲得的一個(gè)或多個(gè)下混音聲道來(lái) 形成重構(gòu)多聲道信號(hào)；基于原始多聲道信號(hào)、一個(gè)或多個(gè)下混音聲道、或一個(gè)或多個(gè)參數(shù)來(lái)產(chǎn)生已編碼的殘留信號(hào)，使得使用殘留信號(hào)所形成的重構(gòu)多聲道信號(hào)比沒(méi)有使用殘留信號(hào)所形成的重構(gòu)多聲道信號(hào)與原始多聲道信號(hào) 更相似；以及形成具有殘留信號(hào)和一個(gè)或多個(gè)參數(shù)的數(shù)據(jù)流。
14. 一種多聲道解碼器，用于對(duì)具有一個(gè)或多個(gè)下混音聲道、一個(gè)或多個(gè)參數(shù)和已編碼的殘留信號(hào)的已編碼多聲道信號(hào)進(jìn)行解碼，所述多聲道解碼器包括殘留信號(hào)解碼器，用于基于已編碼的殘留信號(hào)，產(chǎn)生已解碼的殘留信號(hào)；以及多聲道解碼器，通過(guò)使用一個(gè)或多個(gè)下混音聲道和一個(gè)或多個(gè)參數(shù)來(lái)產(chǎn)生第一重構(gòu)多聲道信號(hào)；其中代替第一重構(gòu)多聲道信號(hào)或除了第一多聲道信號(hào)以外，所述多聲道解碼器還用于通過(guò)使用一個(gè)或多個(gè)下混音聲道和已解碼的殘留信號(hào)來(lái)產(chǎn)生第二重構(gòu)多聲道信號(hào)，其中所述第二重構(gòu)多聲道信號(hào)比所述第一重構(gòu)多聲道信號(hào)與原始多聲道信號(hào)更相似。
15. 如權(quán)利要求14所述的多聲道解碼器，其中所述已編碼的多聲道信號(hào)由己縮放的數(shù)據(jù)流表示，所述已縮放的數(shù)據(jù)流具有包括一個(gè) 或多個(gè)參數(shù)的第一縮放層以及包括已編碼的殘留信號(hào)的第二縮放層，其中所述多聲道編碼器還包括數(shù)據(jù)流剖析器，用于提取第一縮放層或第二縮放層。
16. 如權(quán)利要求14所述的多聲道解碼器，其中所述已編碼的殘留信號(hào)取決于一個(gè)或多個(gè)參數(shù)；以及其中所述多聲道解碼器用于使用一個(gè)或多個(gè)下混音聲道、一個(gè)或多個(gè)參數(shù)以及已解碼的殘留信號(hào)來(lái)產(chǎn)生第二重構(gòu)多聲道信號(hào)。
17. 如權(quán)利要求14所述的多聲道解碼器，其中所述下混音聲道取決于對(duì)準(zhǔn)參數(shù)或增益參數(shù)，以及其中所述多聲道解碼器用于使用基于增益參數(shù)的第一加權(quán)規(guī)則來(lái)對(duì)下混音聲道進(jìn)行加權(quán)，以及通過(guò)使用增益參數(shù)的第二加權(quán)規(guī)則來(lái) 對(duì)下混音聲道進(jìn)行加權(quán)，或者針對(duì)使用對(duì)準(zhǔn)參數(shù)的其他輸出聲道，對(duì)一個(gè)輸出聲道進(jìn)行解對(duì)準(zhǔn)。
18. 如權(quán)利要求14所述的多聲道解碼器，其中下混音聲道取決于對(duì)準(zhǔn)參數(shù)或增益參數(shù)，以及其中所述多聲道解碼器用于使用增益參數(shù)對(duì)下混音聲道進(jìn)行加權(quán)，將己解碼的殘留信號(hào)加到已加權(quán)的下混音聲道中，并再次對(duì)所產(chǎn) 生的聲道進(jìn)行加權(quán)，以獲得第一多聲道輸出聲道，從下混音聲道中減去已解碼的殘留信號(hào)，并使用增益參數(shù)對(duì)所產(chǎn) 生的聲道進(jìn)行加權(quán)，或者對(duì)下混音聲道和己解碼的殘留信號(hào)之間的差進(jìn)行解對(duì)準(zhǔn)，以獲得第二多聲道輸出信號(hào)。
19. 如權(quán)利要求14所述的多聲道解碼器，其中所述參數(shù)包括技術(shù)心理聲學(xué)編碼(BCC)參數(shù)，例如聲道間電平差、聲道間相干參數(shù)、聲道間時(shí)間差或聲道包絡(luò)提示，以及其中所述多聲道解碼器用于根據(jù)技術(shù)心理聲學(xué)編碼(BCC)方案來(lái)執(zhí)行多聲道解碼操作。
20. 如權(quán)利要求14所述的多聲道解碼器，其中一個(gè)或多個(gè)下混音聲道、一個(gè)或多個(gè)參數(shù)以及已編碼的殘留信號(hào)由子帶專(zhuān)用數(shù)據(jù)表示，所述多聲道解碼器還包括合成濾波器組，用于對(duì)由多聲道解碼器所產(chǎn)生的重構(gòu)子帶數(shù)據(jù)進(jìn) 行合成，以獲得第一或第二重構(gòu)多聲道信號(hào)的全頻帶表示。
21. —種用于對(duì)具有一個(gè)或多個(gè)下混音聲道、一個(gè)或多個(gè)參數(shù)以及已編碼的殘留信號(hào)的已編碼的多聲道信號(hào)進(jìn)行解碼的方法，所述方法包括基于已編碼的殘留信號(hào)，產(chǎn)生已解碼的殘留信號(hào)；以及通過(guò)使用一個(gè)或多個(gè)下混音聲道和一個(gè)或多個(gè)參數(shù)來(lái)產(chǎn)生第一重構(gòu)多聲道信號(hào)，或者通過(guò)使用一個(gè)或多個(gè)下混音聲道和已解碼的殘留信號(hào)來(lái)產(chǎn)生第二重構(gòu)多聲道信號(hào)，其中所述第二重構(gòu)多聲道信號(hào)比所述第一重構(gòu)多聲道信號(hào)與原始多聲道信號(hào)更相似。
22. —種多聲道編碼器，用于對(duì)具有至少兩個(gè)聲道的原始多聲道信號(hào)進(jìn)行編碼，所述多聲道編碼器包括時(shí)間對(duì)準(zhǔn)器，用于使用對(duì)準(zhǔn)參數(shù)，對(duì)至少兩個(gè)聲道的第一聲道和第二聲道進(jìn)行對(duì)準(zhǔn)；下混音器，用于使用已對(duì)準(zhǔn)的聲道來(lái)產(chǎn)生下混音聲道；增益計(jì)算器，用于計(jì)算不等于1的增益參數(shù)，以便對(duì)已對(duì)準(zhǔn)的聲道進(jìn)行加權(quán)，因此已對(duì)準(zhǔn)的聲道之間的差與增益值l相比減少；以及數(shù)據(jù)流成形器，用于形成具有關(guān)于下混音聲道的信息、關(guān)于對(duì)準(zhǔn) 參數(shù)的信息、以及關(guān)于增益參數(shù)的信息的數(shù)據(jù)流。
23. 如權(quán)利要求20所述的多聲道編碼器，還包括用于對(duì)從第一聲道和己對(duì)準(zhǔn)且已加權(quán)的第二聲道中獲得的差信號(hào)進(jìn)行計(jì)算和編碼，其中所述數(shù)據(jù)流成形器還用于將已編碼的殘留信號(hào)包括進(jìn)數(shù)據(jù) 流中。
24. —種多聲道解碼器，用于對(duì)具有關(guān)于一個(gè)或多個(gè)下混音聲道的信息、關(guān)于增益參數(shù)的信息、以及關(guān)于對(duì)準(zhǔn)參數(shù)的信息的已編碼的多聲道信號(hào)進(jìn)行解碼，所述多聲道解碼器包括下混音聲道解碼器，用于產(chǎn)生已解碼的下混音信號(hào)；處理器，用于使用增益參數(shù)對(duì)己解碼的下混音聲道進(jìn)行處理，以獲得第一已解碼的輸出聲道，以及用于使用增益參數(shù)對(duì)已解碼的下混音聲道進(jìn)行處理，以及使用對(duì)準(zhǔn)參數(shù)進(jìn)行解對(duì)準(zhǔn)，以獲得第二已解碼的輸出聲道。
25. 如權(quán)利要求23所述的多聲道解碼器，其中所述已編碼的多聲道信號(hào)還包括已編碼的殘留信號(hào)，所述多聲道解碼器還包括殘留信號(hào)解碼器，用于產(chǎn)生己解碼的殘留信號(hào)，以及其中所述處理器用于使用增益參數(shù)對(duì)下混音聲道進(jìn)行第一次加權(quán)，以添加已解碼的殘留信號(hào)；使用增益參數(shù)進(jìn)行第二次加權(quán)，以獲得第一重構(gòu)聲道，以及從加權(quán)之前的下混音聲道中減去己解碼的殘留信號(hào)，以進(jìn)行解對(duì)準(zhǔn)，獲得第二重構(gòu)聲道。
26. —種對(duì)具有至少兩個(gè)聲道的原始多聲道信號(hào)進(jìn)行編碼的方法，所述方法包括-使用對(duì)準(zhǔn)參數(shù)對(duì)至少兩個(gè)聲道的第一聲道和第二聲道進(jìn)行時(shí)間對(duì)準(zhǔn)；使用已對(duì)準(zhǔn)的聲道來(lái)產(chǎn)生下混音聲道；計(jì)算不等于l的增益參數(shù)，以便對(duì)已對(duì)準(zhǔn)的聲道進(jìn)行加權(quán)，因此與增益值l相比，減少已對(duì)準(zhǔn)的聲道之間的差；以及形成具有關(guān)于下混音聲道的信息、關(guān)于對(duì)準(zhǔn)參數(shù)的信息、以及關(guān) 于增益參數(shù)的信息的數(shù)據(jù)流。
27. —種用于對(duì)具有關(guān)于一個(gè)或多個(gè)下混音聲道的信息、關(guān)于增益參數(shù)的信息、以及關(guān)于對(duì)準(zhǔn)參數(shù)的信息的已編碼的多聲道信號(hào)進(jìn)行解碼的方法，所述方法包括產(chǎn)生已解碼的下混音信號(hào)；通過(guò)使用增益參數(shù)對(duì)己解碼的下混音聲道進(jìn)行處理，以獲得第一已解碼的輸出聲道，以及通過(guò)使用增益參數(shù)和基于對(duì)準(zhǔn)參數(shù)的解對(duì)準(zhǔn)，對(duì)己解碼的下混音聲道進(jìn)行處理，以獲得第二己解碼的輸出聲道。
28. —種已編碼的多聲道信號(hào)，具有關(guān)于一個(gè)或多個(gè)下混音聲道、關(guān)于在第一重構(gòu)多聲道信號(hào)中與一個(gè)或多個(gè)下混音聲道合成所產(chǎn) 生的一個(gè)或多個(gè)參數(shù)、以及關(guān)于在第二重構(gòu)多聲道信號(hào)中與一個(gè)或多個(gè)下混音聲道合成所產(chǎn)生的己編碼的殘留信號(hào)的信息，其中所述第二重構(gòu)多聲道信號(hào)比所述第一重構(gòu)多聲道信號(hào)與原始多聲道信號(hào)更相似。
29. —種計(jì)算機(jī)程序，用于在計(jì)算機(jī)上運(yùn)行時(shí)執(zhí)行對(duì)具有一個(gè)或多個(gè)下混音聲道、一個(gè)或多個(gè)參數(shù)以及已編碼的殘留信號(hào)的己編碼的多聲道信號(hào)進(jìn)行解碼的方法，所述方法包括以下步驟基于已編碼的殘留信號(hào)，產(chǎn)生已解碼的殘留信號(hào)；以及通過(guò)使用一個(gè)或多個(gè)下混音聲道和一個(gè)或多個(gè)參數(shù)來(lái)產(chǎn)生第一重構(gòu)多聲道信號(hào)，或者通過(guò)使用一個(gè)或多個(gè)下混音聲道和已解碼的殘留信號(hào)來(lái)產(chǎn)生第二重構(gòu)多聲道信號(hào)，其中所述第二重構(gòu)多聲道信號(hào)比所述第一重構(gòu)多聲道信號(hào)與原始多聲道信號(hào)更相似。
全文摘要
多聲道編碼器/解碼器方案優(yōu)選地另外產(chǎn)生波形類(lèi)型的殘留信號(hào)(16)。將所述殘留信號(hào)(16)與一個(gè)或多個(gè)多聲道參數(shù)(14)一起傳輸?shù)浇獯a器中。與純參數(shù)多聲道解碼器相比，增強(qiáng)型解碼器由于另外的殘留信號(hào)而產(chǎn)生具有改進(jìn)的輸出質(zhì)量的多聲道輸出信號(hào)。
文檔編號(hào)G10L19/00GK101120615SQ200580048291
公開(kāi)日2008年2月6日申請(qǐng)日期2005年10月4日優(yōu)先權(quán)日2005年2月22日
發(fā)明者約納斯·林德布羅姆申請(qǐng)人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：約納斯.林德布羅姆
技術(shù)所有人：弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)
我是此專(zhuān)利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

編碼器和解碼器的區(qū)別相關(guān)技術(shù)

編碼器和解碼器相關(guān)技術(shù)

視頻編碼器和解碼器相關(guān)技術(shù)

編碼器與解碼器相關(guān)技術(shù)

視頻編碼器與解碼器相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

近透明或透明的多聲道編碼器/解碼器方案的制作方法