專(zhuān)利名稱(chēng):近透明或透明的多聲道編碼器/解碼器方案的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及多聲道編碼方案,具體涉及參數(shù)多聲道編碼方案。
技術(shù)背景如今,有兩種技術(shù)在充分利用立體聲音頻信號(hào)中所包含的立體聲冗余和不相干方面占優(yōu)勢(shì)。中側(cè)(M/S)立體聲編碼[l],主要針對(duì)冗余去除,并基于以下事實(shí)由于兩個(gè)聲道經(jīng)常完全相關(guān),因此對(duì)這兩個(gè)聲道之和以及差進(jìn)行編碼更加有益。因此,與較低功率側(cè)信號(hào)(side signal)(或差信號(hào))相比,可以在高功率的和信號(hào)上消耗更多比特。 另一方面,強(qiáng)度立體聲編碼[2, 3]在每個(gè)子帶上通過(guò)以和信號(hào)和方位 角代替兩個(gè)信號(hào)來(lái)實(shí)現(xiàn)不相干去除。在解碼器中,將方位角參數(shù)用于 控制由子帶和信號(hào)所表示的聽(tīng)覺(jué)事件的空間位置。將中側(cè)和強(qiáng)度立體 聲廣泛地用于現(xiàn)有的音頻編碼標(biāo)準(zhǔn)[4]。M/S方法關(guān)于冗余利用的問(wèn)題在于,如果兩個(gè)分量異相(一個(gè)相 對(duì)于另一個(gè)延遲),則M/S編碼增益為零。這是概念問(wèn)題,因?yàn)樵趯?shí) 際的音頻信號(hào)中時(shí)間經(jīng)延遲頻繁發(fā)生。例如,空間聽(tīng)力在很大程度上 依靠信號(hào)(尤其是低頻率信號(hào))之間的時(shí)間差[5]。在音頻記錄中, 時(shí)間延遲源于立體聲麥克風(fēng)裝備,以及人工后處理(音響效果)。在中 側(cè)編碼中,經(jīng)常將自組織解決方案用于時(shí)間延遲問(wèn)題中在不同信號(hào) 的功率小于和信號(hào)的功率的常因子時(shí)只采用M/S編碼[l]。在[6]中更 好地提出了對(duì)準(zhǔn)問(wèn)題,在其中從另一個(gè)信號(hào)分量來(lái)預(yù)測(cè)信號(hào)分量之一。 在編碼器中,逐幀得到預(yù)測(cè)濾波器,并將其作為側(cè)信號(hào)方面信息進(jìn)行 傳輸。在[7]中,考慮了反向自適應(yīng)備選。要注意的是,性能增益很大 程度上取決于信號(hào)類(lèi)型,但是針對(duì)特定類(lèi)型的信號(hào),獲得了與M/S立 體聲編碼相比的顯著增益。
近來(lái),參數(shù)立體聲編碼受到了很大關(guān)注[8-11]?;诤诵膯温暤?(單一聲道)編碼器,這種參數(shù)方案提取了立體聲(多聲道)分量, 并以相對(duì)低的比特率對(duì)其進(jìn)行獨(dú)立編碼??梢詫⒋丝醋鲝?qiáng)度立體聲編 碼的概括。參數(shù)立體聲編碼方法在音頻編碼的低比特率范圍內(nèi)特別有 用,這導(dǎo)致只將全部比特預(yù)算中的一小部分用于立體聲分量的質(zhì)量的 顯著增長(zhǎng)。參數(shù)方法還由于可以縮放到多聲道(多于兩個(gè)聲道)情況 并具有提供反向兼容的能力而引人注目MP3環(huán)繞聲[12]就是這樣的 一個(gè)示例,其中對(duì)多聲道數(shù)據(jù)進(jìn)行編碼,并通過(guò)數(shù)據(jù)流的側(cè)信號(hào)聲場(chǎng) 進(jìn)行傳輸。這允許接收機(jī)不具有對(duì)正常的立體聲信號(hào)進(jìn)行編碼的多聲 道性能,但是環(huán)繞聲使能的接收機(jī)可以享有多聲道音頻。參數(shù)方法經(jīng) 常依靠對(duì)不同的技術(shù)心理聲學(xué),主要是聲道間電平差(ICLD's)和聲 道間時(shí)間差(ICTD's)。在[11]中,提出了相干參數(shù)對(duì)于固有的音響效 果具有重要意義。然而,參數(shù)方法受到以下限制由于固有的模型限 制,編碼器在較高比特率時(shí)不能夠達(dá)到透明質(zhì)量。該問(wèn)題涉及參數(shù)多聲道編碼器,該參數(shù)多聲道編碼器的最大可獲 得質(zhì)量值被限制到明顯在透明質(zhì)量之下的閾值。參數(shù)質(zhì)量閾值如圖11 中的1100所示。從表示根據(jù)BBC增強(qiáng)型單聲道編碼器(1102)的質(zhì) 量/比特率的示意性曲線圖中可以看出,該質(zhì)量不能超過(guò)與比特率無(wú)關(guān) 的參數(shù)質(zhì)量閾值1100。這意味著,即使使用增大的比特率,這種參數(shù) 多聲道編碼器的質(zhì)量也不再增大。BCC增強(qiáng)型單聲道編碼器是針對(duì)當(dāng)前存在的立體聲編碼器或多 聲道編碼器的示例,在其中執(zhí)行立體聲-下混音或多聲道下混音。此外, 通過(guò)描述聲道間電平關(guān)系、聲道間時(shí)間關(guān)系、聲道間相干關(guān)系等導(dǎo)出 參數(shù)。該參數(shù)不同于諸如中側(cè)編碼器的側(cè)信號(hào)之類(lèi)的波形信號(hào),因?yàn)榕c 參數(shù)表示相比,該側(cè)信號(hào)描述了以波形格式存在的兩個(gè)聲道之差,這 通過(guò)給出特定參數(shù)而非逐個(gè)樣本的波形表示描述了兩個(gè)聲道之間的相 似性或相異性。在參數(shù)需要用于從編碼器傳輸?shù)浇獯a器的少量比特的 同時(shí),波形描述,即從波形中導(dǎo)出的殘留信號(hào),需要比理論上所允許 的透明重構(gòu)更多的比特。
圖11示出了根據(jù)這種基于波形的傳統(tǒng)的立體聲編碼器(1104) 的典型質(zhì)量/比特率。從圖11中可以明顯看出,比特率越大,諸如中 側(cè)立體聲編碼器的傳統(tǒng)立體聲編碼器^J質(zhì)量也越高,直至該質(zhì)量達(dá)到 透明質(zhì)量。存在一種"交叉比特率",在這個(gè)比特率處,參數(shù)多聲道編 碼器的特性曲線1102和傳統(tǒng)的基于波形的立體聲編碼器的曲線1104 相互交叉。在這個(gè)交叉(cross-over)比特率之下,參數(shù)多聲道編碼器遠(yuǎn)優(yōu)于 傳統(tǒng)的立體聲編碼器。當(dāng)針對(duì)兩個(gè)編碼器考慮同一比特率時(shí),參數(shù)多 聲道編碼器提供了比傳統(tǒng)的基于波形的立體聲編碼器的質(zhì)量高出質(zhì)量 差1108的質(zhì)量。換言之,當(dāng)希望具有特定質(zhì)量lllO時(shí),可以使用參 數(shù)編碼器按照與傳統(tǒng)的基于波形的立體聲編碼器相比減少了差比特率 1112的比特率來(lái)實(shí)現(xiàn)這個(gè)質(zhì)量。然而,在交叉比特率之上,情況則完全不同。因?yàn)閰?shù)編碼器處 于其最大參數(shù)編碼器質(zhì)量閾值1100,所以可以只通過(guò)使用傳統(tǒng)的基于 波形的立體聲編碼器來(lái)獲得較好的質(zhì)量,該立體聲編碼器使用與參數(shù) 編碼器中所使用的相同數(shù)量的比特。發(fā)明內(nèi)容本發(fā)明的目的是提供一種與現(xiàn)有多聲道編碼方案相比允許增大 的質(zhì)量和減少的比特率的編碼/解碼方案。根據(jù)本發(fā)明的第一方面,這個(gè)目的可以由多聲道編碼器來(lái)實(shí)現(xiàn), 該多聲道編碼器用于對(duì)具有至少兩個(gè)聲道的原始多聲道信號(hào)進(jìn)行編 碼,該多聲道編碼器包括參數(shù)提供器,用于提供一個(gè)或多個(gè)參數(shù), 形成一個(gè)或多個(gè)參數(shù),使得可以使用從多聲道信號(hào)和一個(gè)或多個(gè)參數(shù) 中所導(dǎo)出的一個(gè)或多個(gè)下混音信號(hào)來(lái)形成重構(gòu)多聲道信號(hào);殘留信號(hào) 編碼器,基于原始多聲道信號(hào)、 一個(gè)或多個(gè)下混音聲道或一個(gè)或多個(gè) 參數(shù)來(lái)產(chǎn)生己編碼的殘留信號(hào),所以使用殘留信號(hào)所形成的重構(gòu)多聲 道信號(hào)比不使用殘留信號(hào)所形成的重構(gòu)多聲道信號(hào)與原始多聲道信號(hào) 更相似;以及數(shù)據(jù)流成形器,用于形成具有殘留信號(hào)以及一個(gè)或多個(gè) 參數(shù)的數(shù)據(jù)流。
根據(jù)本發(fā)明的第二方面,這個(gè)目的可以由多聲道解碼器來(lái)實(shí)現(xiàn), 該多聲道解碼器用于對(duì)具有一個(gè)或多個(gè)下混音聲道、 一個(gè)或多個(gè)參數(shù) 以及已編碼的殘留信號(hào)的己編碼的多聲道信號(hào)進(jìn)行解碼,該多聲道解 碼器包括殘留信號(hào)解碼器,用于基于己編碼的殘留信號(hào)產(chǎn)生已解碼 的殘留信號(hào);以及多聲道解碼器,用于使用一個(gè)或多個(gè)下混音聲道和一個(gè)或多個(gè)參數(shù)來(lái)產(chǎn)生第一重構(gòu)多聲道信號(hào),其中該多聲道解碼器還 可以用于使用一個(gè)或多個(gè)下混音聲道和已解碼的殘留信號(hào)來(lái)代替第一 重構(gòu)多聲道信號(hào)或者除了第一多聲道信號(hào)之外又產(chǎn)生第二重構(gòu)多聲道 信號(hào),其中該第二重構(gòu)多聲道信號(hào)比第一重構(gòu)多聲道信號(hào)與原始多聲 道信號(hào)更為相似。根據(jù)本發(fā)明的第三方面,這個(gè)目的可以由多聲道編碼器來(lái)實(shí)現(xiàn), 該多聲道編碼器用于對(duì)具有至少兩個(gè)聲道的原始多聲道信號(hào)進(jìn)行編碼,該多聲道編碼器包括時(shí)間對(duì)準(zhǔn)器,用于使用對(duì)準(zhǔn)參數(shù)對(duì)至少兩 個(gè)聲道的第一聲道和第二聲道進(jìn)行對(duì)準(zhǔn);下混音器,用于使用已對(duì)準(zhǔn) 的聲道產(chǎn)生下混音聲道;增益計(jì)算器,計(jì)算用于對(duì)已對(duì)準(zhǔn)的聲道進(jìn)行 加權(quán)的不等于l的增益參數(shù),因此與增益值l相比,已對(duì)準(zhǔn)的聲道之 間的差減少;以及數(shù)據(jù)流成形器,用于形成具有關(guān)于下混音聲道的信 息、關(guān)于對(duì)準(zhǔn)參數(shù)的信息以及關(guān)于增益參數(shù)的信息的數(shù)據(jù)流。根據(jù)本發(fā)明的第四方面,這個(gè)目的可以由多聲道解碼器來(lái)實(shí)現(xiàn), 該多聲道解碼器用于對(duì)具有關(guān)于一個(gè)或多個(gè)下混音聲道的信息、關(guān)于 增益參數(shù)的信息、關(guān)于對(duì)準(zhǔn)參數(shù)的信息的已編碼的多聲道信號(hào)進(jìn)行解 碼,該多聲道解碼器包括下混音聲道解碼器,用于產(chǎn)生已解碼的下 混音信號(hào);以及處理器,用于使用增益參數(shù)對(duì)已解碼的下混音聲道進(jìn) 行處理,以獲得第一解碼輸出聲道,此外該處理器使用增益參數(shù)對(duì)已 解碼的下混音聲道進(jìn)行處理,并使用對(duì)準(zhǔn)參數(shù)進(jìn)行解對(duì)準(zhǔn),以獲得第 二解碼輸出聲道。本發(fā)明的另一個(gè)方面包括相應(yīng)的方法、數(shù)據(jù)流/文件和計(jì)算機(jī)程序。本發(fā)明基于以下結(jié)論通過(guò)結(jié)合參數(shù)編碼和基于波形的編碼提出 了涉及傳統(tǒng)的參數(shù)編碼器以及基于波形的解碼器的問(wèn)題。本發(fā)明的這
種編碼器產(chǎn)生縮放數(shù)據(jù)流,該數(shù)據(jù)流具有作為第一增強(qiáng)層的已編碼的 參數(shù)表示以及作為第二增強(qiáng)層的己編碼的殘留信號(hào),該殘留信號(hào)優(yōu)選 地為波形類(lèi)型的信號(hào)。通常,在純參數(shù)多聲道編碼器中不被提供的另 外的殘留信號(hào),可用于改進(jìn)可實(shí)現(xiàn)的質(zhì)量,尤其是圖11中的交叉比特 率與最大透明質(zhì)量之間的質(zhì)量。在圖11中可以看出,即使處于交叉比 特率以下,對(duì)于可比較的比特率處的質(zhì)量,本發(fā)明的編碼器算法仍然 優(yōu)于純參數(shù)多聲道編碼器。然而,與完全基于波形的傳統(tǒng)的立體聲編 碼器相比,本發(fā)明的組合參數(shù)/波形編碼/解碼方案具有更高的比特效 率。換言之,本發(fā)明的設(shè)備最優(yōu)地結(jié)合了參數(shù)編碼和基于波形編碼的 優(yōu)點(diǎn),使得即使在交叉比特率之上,本發(fā)明的編碼器仍可以利用參數(shù) 概念,但優(yōu)于純參數(shù)編碼器。根據(jù)特定實(shí)施例,本發(fā)明的優(yōu)點(diǎn)或多或少優(yōu)于現(xiàn)有技術(shù)的參數(shù)編 碼器或傳統(tǒng)的基于波形的多聲道編碼器。更先進(jìn)的實(shí)施例提供了更好 的質(zhì)量/比特率特性,而本發(fā)明的低水平的實(shí)施例則需要編碼器和/或 解碼器方面較少的處理功率,但是,由于純參數(shù)編碼器的質(zhì)量受圖11中的閾值質(zhì)量1100限制,那么由于另外進(jìn)行編碼的殘留信號(hào)則導(dǎo)致比純參數(shù)編碼器更好的質(zhì)量。本發(fā)明的編碼/解碼方案的優(yōu)點(diǎn)在于能夠無(wú)縫地從純參數(shù)編碼轉(zhuǎn) 移到近似波形或完全波形的透明編碼。優(yōu)選地,將參數(shù)立體聲編碼和中側(cè)立體聲編碼結(jié)合成能夠朝著透 明質(zhì)量會(huì)聚的方案。在這個(gè)優(yōu)選的中側(cè)立體聲相關(guān)的方案中,更有效 地利用了信號(hào)分量(即左聲道和右聲道)之間的相關(guān)性。一般而言,在一些實(shí)施例中,可以將本發(fā)明的思想應(yīng)用于參數(shù)多 聲道編碼器。在一個(gè)實(shí)施例中,從原始信號(hào)中導(dǎo)出殘留信號(hào),而沒(méi)有 使用也可用于編碼器的參數(shù)信息。本實(shí)施例在處理功率和處理器的可 能的能量消耗之間存在爭(zhēng)議的情況下是優(yōu)選地。這種情況可以發(fā)生在 具有諸如移動(dòng)電話、掌上設(shè)備等的具有受限的功率可能性的手持設(shè)備 上。殘留信號(hào)只從原始信號(hào)中導(dǎo)出,并且不依靠下混音或參數(shù)。因此, 在解碼器側(cè),使用下混音聲道和參數(shù)所產(chǎn)生的第一重構(gòu)多聲道信號(hào)不 用于產(chǎn)生第二重構(gòu)多聲道信號(hào)。 然而, 一方面在參數(shù)中存在一些冗余,另一方面在殘留信號(hào)中存 在一些冗余??梢酝ㄟ^(guò)其他用于計(jì)算已編碼的殘留信號(hào)的編碼器/解碼 器系統(tǒng)來(lái)獲得冗余去除,該編碼器/解碼器系統(tǒng)利用在編碼器處可用的 參數(shù)信息,并且還可選地利用也在編碼器中可用的下混音聲道。根據(jù)特定情況,殘留信號(hào)編碼器可以是由合成設(shè)備通過(guò)使用下混 音聲道和參數(shù)信息來(lái)計(jì)算完全重構(gòu)多聲道信號(hào)的分析。然后,基于該 重構(gòu)信號(hào),可以產(chǎn)生每個(gè)聲道的差信號(hào),從而獲得多聲道差錯(cuò)表示, 可以使用不同方式來(lái)處理該多聲道差錯(cuò)表示。 一種方式是將另一種參 數(shù)多聲道編碼方案應(yīng)用于多聲道差錯(cuò)表示。另一種可能性是執(zhí)行用于 對(duì)多聲道差錯(cuò)表示進(jìn)行下混音的矩陣變換方案。另一種可能性是從左 和右環(huán)繞聲道中除去差錯(cuò)信號(hào),然后只對(duì)中間聲道差錯(cuò)信號(hào)進(jìn)行編碼 或者,此外還對(duì)左聲道差錯(cuò)信號(hào)和右差錯(cuò)聲道差錯(cuò)信號(hào)進(jìn)行編碼。因此,存在基于差錯(cuò)表示來(lái)實(shí)現(xiàn)殘留信號(hào)處理器的多種可能性。上面所提到的實(shí)施例允許對(duì)殘留信號(hào)進(jìn)行縮放編碼的高靈活性。 然而,因?yàn)樵诰幋a器處執(zhí)行完全的多聲道重構(gòu),然后產(chǎn)生多聲道信號(hào) 中的每個(gè)聲道的差錯(cuò)表示,并將其輸入殘留信號(hào)處理器中,這完全是 處理功率的要求。在解碼器側(cè),首先必須計(jì)算第一重構(gòu)多聲道信號(hào), 然后基于作為對(duì)差錯(cuò)信號(hào)的任意表示的己編碼的殘留信號(hào),必須產(chǎn)生 第二重構(gòu)信號(hào)。因此,不管是否將要輸出第一重構(gòu)信號(hào)的事實(shí),都必 須在解碼器側(cè)對(duì)該第一重構(gòu)信號(hào)進(jìn)行計(jì)算。在本發(fā)明的另一個(gè)優(yōu)選實(shí)施例中,不考慮是否將要輸出第一重構(gòu) 多聲道信號(hào)的事實(shí),都由對(duì)殘留信號(hào)的直接編碼側(cè)的計(jì)算來(lái)代替對(duì)編 碼器側(cè)的合成方法的分析以及對(duì)第一重構(gòu)多聲道信號(hào)的計(jì)算。這是基 于取決于多聲道參數(shù)的對(duì)原始聲道的加權(quán),或者基于還是取決于對(duì)準(zhǔn) 參數(shù)的一種類(lèi)型的改進(jìn)的下混音。在本方案中,通過(guò)使用參數(shù)和原始 信號(hào),而不是使用一個(gè)或多個(gè)下混音聲道,來(lái)非迭代地計(jì)算另外的信 息,即殘留信號(hào)。本方案在編碼器和解碼器側(cè)都非常有效。當(dāng)由于帶寬需求而不傳 輸殘留信號(hào)或者從可縮放的數(shù)據(jù)流中除去殘留信號(hào)時(shí),本發(fā)明的解碼 器自動(dòng)基于下混音聲道和增益以及對(duì)準(zhǔn)參數(shù)而產(chǎn)生第一重構(gòu)多聲道信
號(hào),當(dāng)輸入不等于零的殘留信號(hào)時(shí),多聲道重構(gòu)器不計(jì)算第一重構(gòu)多 聲道信號(hào),而只計(jì)算第二重構(gòu)多聲道信號(hào),因此,此編碼器/解碼器方 案具有優(yōu)點(diǎn)允許在編碼器側(cè)以及解碼器側(cè)進(jìn)行十分有效的計(jì)算,并 將參數(shù)表示用于減少殘留信號(hào)中的冗余,從而獲得具有非常高的處理 功率效率和比特率效率的編碼/解碼方案。
關(guān)于附圖,對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行詳細(xì)描述,在附圖中圖1是本發(fā)明的多聲道編碼器的總體表示的方框圖;圖2是多聲道解碼器的總體表示的方框圖;圖3是低處理功率的編碼器側(cè)的實(shí)施例的方框圖;圖4是針對(duì)圖3的編碼器系統(tǒng)的解碼器實(shí)施例的方框圖;圖5是基于合成分析的編碼器實(shí)施例的方框圖;圖6是與圖5中的編碼器實(shí)施例相對(duì)應(yīng)的解碼器實(shí)施例的方框圖;圖7是在已編碼的殘留信號(hào)中具有減少的冗余的直接編碼器實(shí)施 例的總體方框圖;圖8是與圖7中的編碼器相對(duì)應(yīng)的解碼器的優(yōu)選實(shí)施例;圖9a是基于圖7和圖8的概念的編碼器/解碼器方案的優(yōu)選實(shí)施例;圖9b是圖9a的實(shí)施例中不傳輸殘留信號(hào)而只傳輸對(duì)準(zhǔn)和增益參 數(shù)時(shí)的優(yōu)選實(shí)施例;圖9c是用于圖9a和圖9b中的編碼器側(cè)的方程組;圖9d是用于圖9a和圖9b中的解碼器側(cè)的方程組;圖10是基于圖9a到圖9d的方案的實(shí)施例的分析濾波器組/合成 濾波器組;以及圖11示出了參數(shù)和傳統(tǒng)的基于波形的編碼器與本發(fā)明的增強(qiáng)型 編碼器的典型性能的比較。
具體實(shí)施例方式
圖1示出了用于對(duì)具有至少兩個(gè)聲道的原始多聲道信號(hào)進(jìn)行編碼 的多聲道編碼器的優(yōu)選實(shí)施例。在立體聲環(huán)境下,第一聲道可以是左聲道10a,而第二聲道可以是右聲道10b。雖然在立體聲方案的上下文 中描述了本發(fā)明的實(shí)施例,但因?yàn)榫哂欣?個(gè)聲道的多聲道表示具 有若干對(duì)第一聲道和第二聲道,所以縮放成多聲道方案是直接的。在 5.1環(huán)繞方案的上下文中,第一聲道可以是左前聲道,而第二聲道可 以是右前聲道。可選地,第一聲道可以是左前聲道,而第二聲道可以 是中央聲道。可選地,第一聲道可以是中央聲道,而第二聲道可以是 右前聲道。可選地,第一聲道可以是左后聲道(左環(huán)繞聲道),而第二 聲道可以是右后聲道(右環(huán)繞聲道)。本發(fā)明的編碼器可以包括用于產(chǎn)生一個(gè)或多個(gè)下混音聲道的下 混音器12。在立體聲環(huán)境下,下混音器12將產(chǎn)生單一的下混音聲道。 然而在多聲道環(huán)境下,下混音器12可以產(chǎn)生若干下混音聲道。在5.1 的多聲道環(huán)境下,下混音器13優(yōu)選地產(chǎn)生兩個(gè)下混音聲道。通常,下 混音聲道的數(shù)量小于原始多聲道信號(hào)中的聲道的數(shù)量。本發(fā)明的多聲道編碼器還包括用于提供一個(gè)或多個(gè)參數(shù)的參數(shù) 提供器14,形成一個(gè)或多個(gè)參數(shù)使得可以使用從多聲道信號(hào)和一個(gè)或 多個(gè)參數(shù)中導(dǎo)出的一個(gè)或多個(gè)下混音聲道來(lái)形成重構(gòu)多聲道信號(hào)。重要的是,本發(fā)明的多聲道編碼器還包括用于產(chǎn)生已編碼的殘留 信號(hào)的殘留信號(hào)編碼器16?;谠级嗦暤佬盘?hào)、 一個(gè)或多個(gè)下混音 聲道或一個(gè)或多個(gè)參數(shù),產(chǎn)生已編碼的殘留信號(hào)。通常,產(chǎn)生已編碼 的殘留信號(hào),使得使用殘留信號(hào)所形成的重構(gòu)多聲道信號(hào)比不使用殘 留信號(hào)所形成的重構(gòu)多聲道信號(hào)與原始多聲道信號(hào)更相似。因此,已 編碼的殘留信號(hào)允許解碼器產(chǎn)生具有高于圖11中所示的參數(shù)質(zhì)量閾 值1100的質(zhì)量的重構(gòu)多聲道信號(hào)。將一個(gè)或多個(gè)參數(shù)和已編碼的殘留 信號(hào)輸入到數(shù)據(jù)流成形器18中,該數(shù)據(jù)流成形器18形成具有殘留信 號(hào)和一個(gè)或多個(gè)參數(shù)的數(shù)據(jù)流。優(yōu)選地,由數(shù)據(jù)流成形器18所輸出的 數(shù)據(jù)流是具有包括關(guān)于一個(gè)或多個(gè)參數(shù)的信息的第一增強(qiáng)層以及包括 關(guān)于已編碼的殘留信號(hào)的信息的第二增強(qiáng)層的縮放數(shù)據(jù)流。如現(xiàn)有技 術(shù)中已知的,可以單獨(dú)對(duì)縮放數(shù)據(jù)流中的不同縮放層進(jìn)行解碼,使得 諸如純參數(shù)編碼器的低水平設(shè)備處于通過(guò)簡(jiǎn)單地忽略第二增強(qiáng)層來(lái)對(duì) 縮放數(shù)據(jù)流進(jìn)行解碼的位置。在本發(fā)明的一個(gè)實(shí)施例中,縮放數(shù)據(jù)流還包括作為底層的一個(gè)或 多個(gè)下混音聲道。然而,本發(fā)明還可用于在其中用戶己經(jīng)占有下混音 聲道的環(huán)境。這種情況可以發(fā)生在下混音聲道是單聲道或立體聲信號(hào) 時(shí),其中用戶已經(jīng)通過(guò)另一個(gè)傳輸聲道或通過(guò)相同的傳輸聲道進(jìn)行接 收,但是早于對(duì)第一增強(qiáng)層和第二增強(qiáng)層的接收。當(dāng)存在下混音聲道 和第一以及第二增強(qiáng)層的單獨(dú)傳輸時(shí),編碼器不必包括下混音器12。 這種情況由下混音器框中的虛線所表示。此外,參數(shù)提供器14不必基于第一和第二原始聲道對(duì)參數(shù)進(jìn)行實(shí)際計(jì)算。在針對(duì)特定聲道信號(hào)的參數(shù)已經(jīng)存在的情況下,足以向圖 1中的編碼器提供已產(chǎn)生的參數(shù),因此將這些參數(shù)提供給數(shù)據(jù)流成形器18以及殘留信號(hào)編碼器,以便可選地用于殘留信號(hào)的計(jì)算,并將其 引入縮放數(shù)據(jù)流中。然而,優(yōu)選地,殘留信號(hào)編碼器還使用由虛連接 線19所示的參數(shù)。在本發(fā)明的優(yōu)選實(shí)施例中,可以通過(guò)單獨(dú)的比特率控制輸入端來(lái) 控制殘留信號(hào)編碼器16。在這種情況下,殘留信號(hào)編碼器包括諸如具 有可控量化器步長(zhǎng)的量化器之類(lèi)的特定有損編碼器。當(dāng)通過(guò)比特率輸 入端來(lái)發(fā)送大的量化器的步長(zhǎng)時(shí),己編碼的殘留信號(hào)將具有與通過(guò)比 特率控制輸入端來(lái)發(fā)送較小的量化器的步長(zhǎng)的情況相比的較小的值范 圍(由量化器輸出最大的量化指標(biāo))。較大的量化器的步長(zhǎng)將導(dǎo)致對(duì)已 編碼的殘留信號(hào)的較低比特需求,并因此導(dǎo)致已縮放的數(shù)據(jù)流,與在 其中在殘留信號(hào)編碼器16內(nèi)的量化器具較小的量化器步長(zhǎng)從而導(dǎo)致 了已編碼的殘留信號(hào)需要更多比特的情況相比,該已縮放的數(shù)據(jù)流具 有減少的比特率。嚴(yán)格地說(shuō),上述要點(diǎn)適用于標(biāo)量量化。然而,總得來(lái)說(shuō),使用具 有可控分辨率的基于向量量化技術(shù)的編碼器是優(yōu)選的。當(dāng)分辨率較高 時(shí),與分辨率較低的情況相比,需要更多的比特來(lái)對(duì)殘留信號(hào)進(jìn)行編 碼。圖2示出了本發(fā)明的多聲道解碼器的優(yōu)選實(shí)施例,該多聲道解碼
器可以與圖1中的編碼器一起使用。具體地,圖2示出了用于對(duì)具有 一個(gè)或多個(gè)下混音聲道、 一個(gè)或多個(gè)參數(shù)以及已編碼的殘留信號(hào)的已 編碼的多聲道信號(hào)進(jìn)行解碼。所有這些信息,即下混音聲道、參數(shù)以 及已編碼的殘留信號(hào)都包括在被輸入到數(shù)據(jù)流剖析器的縮放數(shù)據(jù)流20中,該數(shù)據(jù)流剖析器從縮放數(shù)據(jù)流20中提取已編碼的殘留信號(hào), 并將已編碼的殘留信號(hào)轉(zhuǎn)發(fā)到殘留信號(hào)編碼器22中。類(lèi)似地,將一個(gè) 或多個(gè)已優(yōu)選編碼的下混音聲道提供給下混音解碼器24。此外,將一 個(gè)或多個(gè)己優(yōu)選編碼的參數(shù)提供給參數(shù)解碼器23,以便以已解碼的形 式提供一個(gè)或多個(gè)參數(shù)。將由框22、 23和24所輸出的信息輸入到用 于產(chǎn)生第一重構(gòu)多聲道信號(hào)26或第二重構(gòu)多聲道信號(hào)27的多聲道解 碼器25中。由多聲道解碼器25通過(guò)使用一個(gè)或多個(gè)下混音聲道和一 個(gè)或多個(gè)參數(shù)而不是使用殘留信號(hào)來(lái)產(chǎn)生第一重構(gòu)多聲道信號(hào)。然而, 第二重構(gòu)多聲道信號(hào)27是通過(guò)使用一個(gè)或多個(gè)下混音聲道和已解碼 的殘留信號(hào)來(lái)產(chǎn)生的。因?yàn)闅埩粜盘?hào)包括另外的信息,優(yōu)選地包括波 形信息,所以第二重構(gòu)多聲道信號(hào)27比第一重構(gòu)多聲道信號(hào)與原始多 聲道信號(hào)(例如圖1中的聲道10a和10b)更相似。根據(jù)多聲道解碼器25的特定實(shí)現(xiàn),多聲道解碼器25輸出第一重 構(gòu)聲道26或第二重構(gòu)聲道信號(hào)27??蛇x地,除了第二重構(gòu)多聲道信 號(hào)之外,多聲道解碼器25還對(duì)第一重構(gòu)多聲道信號(hào)進(jìn)行計(jì)算。必然地, 在所有的實(shí)現(xiàn)中,當(dāng)縮放數(shù)據(jù)流包括已編碼的殘留信號(hào)時(shí),多聲道解 碼器25只輸出第一重構(gòu)多聲道信號(hào)。然而,在通過(guò)除去第二增強(qiáng)層對(duì) 縮放數(shù)據(jù)流按照其方式從編碼器到解碼器進(jìn)行處理時(shí),多聲道解碼器 25將只輸出第一重構(gòu)多聲道信號(hào)。這種去除第二增強(qiáng)層可以發(fā)生在編 碼器和解碼器之間存在傳輸聲道時(shí),這具有非常嚴(yán)格限制的帶寬資源, 因此縮放數(shù)據(jù)流的傳輸只在沒(méi)有第二增強(qiáng)層時(shí)可能。圖3和圖4示出了本發(fā)明的概念的一個(gè)實(shí)施例,該實(shí)施例在編碼 器側(cè)(圖3)以及解碼器側(cè)(圖4)都只需要減少的處理功率。圖3 中的編碼器包括強(qiáng)度立體聲編碼器30,該強(qiáng)度立體聲編碼器30 —方 面輸出單聲道下混音信號(hào),另一方面輸出參數(shù)強(qiáng)度立體聲的直接信息。 將優(yōu)選地通過(guò)添加第一和第二輸入聲道所形成的單聲道下混音輸入數(shù)
據(jù)率減速器31中。對(duì)于單聲道下混音聲道,數(shù)據(jù)率減速器31可以包 括任意公知的音頻編碼器,例如MP3編碼器、ACC編碼器或針對(duì)單 聲道信號(hào)的任意其他音頻編碼器。對(duì)于參數(shù)方向信息,數(shù)據(jù)率減速器 31可以包括針對(duì)參數(shù)信息的任意已知編碼器,例如差值編碼器、均衡 器和/諸如Huffman編碼器或算術(shù)編碼器之類(lèi)的熵編碼器。因此,圖3 中的框30和31提供了圖l編碼器中的框12和14所示意性示出的功 能。殘留信號(hào)編碼器16包括側(cè)信號(hào)計(jì)算器32和隨后所采用的數(shù)據(jù)率 減速器33。側(cè)信號(hào)計(jì)算器32對(duì)從現(xiàn)有技術(shù)的中側(cè)立體聲編碼器中已 知的幅值信號(hào)執(zhí)行計(jì)算。 一個(gè)優(yōu)選示例是對(duì)第一聲道10a和第二聲道 10b之間的逐個(gè)樣本的差進(jìn)行計(jì)算,以獲得波形類(lèi)型的側(cè)信號(hào),然后 將該側(cè)信號(hào)輸入針對(duì)數(shù)據(jù)率壓縮的數(shù)據(jù)率減速器33中。數(shù)據(jù)率減速器 33可以包括與上面所概述的關(guān)于數(shù)據(jù)率減速器31的相同的元件。在 框33的輸出處獲得已編碼的殘留信號(hào),將該殘留信號(hào)輸入數(shù)據(jù)流成形 器18中,從而得到優(yōu)選地縮放的數(shù)據(jù)流?,F(xiàn)在,由框18所輸出的數(shù)據(jù)流包括除了單聲道下混音以外的參 數(shù)強(qiáng)度立體聲方向信息和以波形類(lèi)型編碼的殘留信號(hào)。通過(guò)結(jié)合圖1已經(jīng)討論的比特率控制輸入端,可以控制數(shù)據(jù)率減 速器31。在另一個(gè)實(shí)施例中,數(shù)據(jù)率減速器33被設(shè)置用于產(chǎn)生縮放 輸出數(shù)據(jù)流,該數(shù)據(jù)流在其底層以每采樣較少數(shù)量比特進(jìn)行殘留信號(hào) 編碼,并且在其第一增強(qiáng)層中以每采樣中等數(shù)量的比特進(jìn)行殘余編碼, 以及在其下一個(gè)增強(qiáng)層中以每采樣較多數(shù)量比特進(jìn)行殘余編碼。對(duì)于 數(shù)據(jù)率減速器輸出端的底層,可以使用例如每采樣0.5比特。例如, 針對(duì)第一增強(qiáng)層,可以使用例如每采樣4比特,以及對(duì)于第二增強(qiáng)層, 可以使用例如每采樣16比特。圖4中示出了相應(yīng)的解碼器。將輸入到數(shù)據(jù)流剖析器21中的數(shù) 據(jù)流解析成單獨(dú)輸出到解壓縮器23的參數(shù)信息。將己編碼的下混音信 息輸入解壓縮器24,并將已編碼的殘留信號(hào)輸入到殘留信號(hào)解壓縮器 22中。圖4中的解碼器還包括直接的強(qiáng)度立體聲解碼器40,此外還包 括中/側(cè)解碼器41。這兩個(gè)解碼器40和41執(zhí)行多聲道解碼器25的功
能,以便輸出由強(qiáng)度立體聲解碼器40單獨(dú)產(chǎn)生的第一重構(gòu)多聲道信號(hào)26,以及輸出由MS解碼器41單獨(dú)產(chǎn)生的第二重構(gòu)多聲道信號(hào)27。當(dāng)數(shù)據(jù)流包括已編碼的殘留信號(hào)時(shí),圖4中的直接實(shí)現(xiàn)將輸出第 一重構(gòu)多聲道信號(hào)26以及第二重構(gòu)多聲道信號(hào)。在這種情況下,必然 只有更好的第二重構(gòu)多聲道信號(hào)27對(duì)用戶是有益的。因此,可以提供 解碼器控制42,以便自動(dòng)檢測(cè)數(shù)據(jù)流中是否存在已編碼的殘留信號(hào)。 當(dāng)自動(dòng)檢測(cè)到數(shù)據(jù)流中沒(méi)有這種已編碼的殘留信號(hào)時(shí),解碼器控制42 起到了對(duì)中側(cè)解碼器40進(jìn)行去激活以節(jié)約處理功率的作用,因此電池 電源在諸如移動(dòng)電話等的低功率手持設(shè)備中尤其有用。圖5示出了本發(fā)明的另一個(gè)實(shí)施例,其中基于合成分析方法產(chǎn)生 了已編碼的殘留信號(hào)。此外,將第一和第二聲道10a、 10b輸入下混音 器50,下混音器50后面接著數(shù)據(jù)率減速器51。在框51的輸出處,獲得具有一個(gè)或多個(gè)下混音聲道的優(yōu)選壓縮的下混音信號(hào),并將其提供 給數(shù)據(jù)流成形器18。因此,框50和51提供圖1中的下混音器設(shè)備12 的功能。此外,將第一和第二聲道10a、 10b提供給參數(shù)計(jì)算器53, 并將參數(shù)計(jì)算器所輸出的參數(shù)轉(zhuǎn)發(fā)到用于對(duì)一個(gè)或多個(gè)參數(shù)進(jìn)行壓縮 的另一個(gè)數(shù)據(jù)率減速器54。因此,框53和54提供了與圖1中的參數(shù) 提供器14相同的功能。然而,與圖3中的實(shí)施例相比,殘留信號(hào)編碼器16更為復(fù)雜。 具體地,殘留信號(hào)編碼器16包括參數(shù)多聲道重構(gòu)器55。以兩個(gè)聲道 為例,多聲道重構(gòu)器產(chǎn)生第一重構(gòu)聲道和第二重構(gòu)聲道。因此參數(shù)多 聲道重構(gòu)器只使用下混音聲道和參數(shù),所以由框55所輸出的重構(gòu)多聲 道信號(hào)的質(zhì)量將與圖11中的曲線1102相對(duì)應(yīng),并始終在圖11中的參 數(shù)閾值1100之下。將重構(gòu)多聲道信號(hào)輸入到差錯(cuò)計(jì)算器56中。差錯(cuò)計(jì)算器56還可 用于接收第一和第二輸入聲道10a、 10b,并輸出第一差錯(cuò)信號(hào)和第二 差錯(cuò)信號(hào)。優(yōu)選地,差錯(cuò)計(jì)算器計(jì)算原始聲道和相應(yīng)的重構(gòu)聲道(輸 出框55)之間的逐個(gè)樣本的差。針對(duì)每對(duì)原始聲道和重構(gòu)聲道,執(zhí)行 此過(guò)程。差錯(cuò)計(jì)算器56的輸出又是多聲道表示,但是此時(shí)與原始聲道 信號(hào)相比為多聲道差錯(cuò)信號(hào)。將這個(gè)具有與原始聲道信號(hào)相同數(shù)量的
聲道的多聲道差錯(cuò)信號(hào)輸入用于產(chǎn)生已編碼的殘留信號(hào)的殘留信號(hào)處理器57中。存在殘留信號(hào)處理器57的多個(gè)實(shí)現(xiàn),這些實(shí)現(xiàn)全都取決于帶寬 需求、所需的可縮放度、質(zhì)量需求等。在一個(gè)優(yōu)選實(shí)施例中,殘留信號(hào)處理器57再次實(shí)現(xiàn)為用于產(chǎn)生 一個(gè)或多個(gè)差錯(cuò)下混音聲道和差錯(cuò)下混音參數(shù)的多聲道編碼器。因?yàn)?殘留信號(hào)處理器57可以包括框50、 51、 53和54,可以認(rèn)為這個(gè)實(shí)施 例是一種迭代多聲道編碼器??蛇x地,殘留信號(hào)處理器57可用于只從其具有最大能量的輸入 信號(hào)中選擇單一或兩個(gè)差錯(cuò)聲道,并只對(duì)最大能量差錯(cuò)信號(hào)進(jìn)行處理, 以獲得已編碼的殘留信號(hào)。除了這個(gè)準(zhǔn)則以外或者代替這個(gè)準(zhǔn)則,可 以使用基于可感知的更激發(fā)的差錯(cuò)測(cè)量的更先進(jìn)的準(zhǔn)則??蛇x地,殘 留信號(hào)處理器可以包括用于將輸入聲道下混音為一個(gè)或多個(gè)下混音聲 道的矩陣化方案,使得相應(yīng)的解碼器設(shè)備可以執(zhí)行模擬解矩陣過(guò)程。 然而,可以使用公知的單聲道或立體聲編碼器的元件來(lái)對(duì)一個(gè)或多個(gè) 下混音聲道進(jìn)行處理,或者可以使用上面所提到的單聲道/立體聲編碼 器中的一個(gè)來(lái)對(duì)一個(gè)或多個(gè)下混音聲道進(jìn)行完全處理,以獲得已編碼 的殘留信號(hào)。圖6中示出了針對(duì)圖5中的編碼器的解碼器。與圖2的實(shí)施例相 比,圖6顯示了多聲道解碼器25包括參數(shù)多聲道重構(gòu)器60和合成器 61。參數(shù)多聲道重構(gòu)器60只基于已解碼的下混音和已解碼的參數(shù)信息 來(lái)產(chǎn)生第一重構(gòu)多聲道信號(hào)26。當(dāng)數(shù)據(jù)流中不包括已編碼的殘留信號(hào) 時(shí),可以輸出第一重構(gòu)信號(hào)26。然而,當(dāng)數(shù)據(jù)流中包括己編碼的殘留 信號(hào)時(shí),則不輸出第一重構(gòu)信號(hào),而是將其輸入到合成器61中,以便 將參數(shù)重構(gòu)的多聲道信號(hào)26合成為已解碼的殘留信號(hào),這里已解碼的 殘留信號(hào)是在上面所討論的圖5中的差錯(cuò)計(jì)算器56的輸出處的差錯(cuò)表 示的表示之一。合成器61將己解碼的殘留信號(hào)(即,差錯(cuò)信號(hào)的任意 表示)和參數(shù)重構(gòu)的多聲道信號(hào)進(jìn)行合成,以輸出第二重構(gòu)號(hào)27。當(dāng) 關(guān)于圖11來(lái)考慮圖6中的解碼器時(shí),顯而易見(jiàn)的是,針對(duì)特定比特率, 第一重構(gòu)信號(hào)具有由線1102所確定的質(zhì)量,而第二重構(gòu)信號(hào)27具有
由線1114針對(duì)相同比特率所確定的較高的質(zhì)量。因?yàn)橐丫幋a的殘留信號(hào)中的冗余減少,所以圖5/圖6中的實(shí)施例 優(yōu)于圖3/圖4中的實(shí)施例。然而,圖5/圖6中的實(shí)施例需要較大量的 處理功率、存儲(chǔ)、電池資源和算法延遲。隨后,參考關(guān)于編碼器表示的圖7以及關(guān)于解碼器表示的圖8, 描述了對(duì)圖3/圖4中的實(shí)施例與圖5/圖6中的實(shí)施例之間的優(yōu)選折衷。 該編碼器包括使用第一和第二輸入聲道10a、 10b來(lái)執(zhí)行下混音的特定 下混音器74。與只通過(guò)添加原始聲道10a、 10b來(lái)獲得單聲道信號(hào)所 產(chǎn)生的簡(jiǎn)單下混音相比,下混音器74由通過(guò)參數(shù)計(jì)算器71所產(chǎn)生的 對(duì)準(zhǔn)參數(shù)控制。這里,在將兩個(gè)信號(hào)彼此相加之前,對(duì)兩個(gè)輸入聲道 10a、 10b進(jìn)行相互間的時(shí)間對(duì)準(zhǔn)。按照這種方式下,在下混音器70 的輸出處得到特定的單聲道信號(hào),例如該單聲道信號(hào)不同于在圖3中 以30示出的低電平強(qiáng)度立體聲編碼器所產(chǎn)生的單聲道信號(hào)。除了對(duì)準(zhǔn)參數(shù)之外,或代替對(duì)準(zhǔn)參數(shù),參數(shù)計(jì)算器71可用于產(chǎn) 生增益參數(shù)。將該增益參數(shù)輸入加權(quán)設(shè)備72中,以便在執(zhí)行側(cè)信號(hào)的 計(jì)算之前,優(yōu)選地使用增益參數(shù)對(duì)第二聲道10b進(jìn)行加權(quán)。在計(jì)算第 一和第二聲道之間的類(lèi)似波形差之前,對(duì)第二聲道的加權(quán)導(dǎo)致較小的 殘留信號(hào),如圖所示將該殘留信號(hào)作為特定側(cè)信號(hào)輸入到任何適當(dāng)?shù)?數(shù)據(jù)率減速器33中。圖7中所示的數(shù)據(jù)率減速器33可以完全地實(shí)現(xiàn) 為圖3中所示的數(shù)據(jù)率減速器33。圖7中的實(shí)施例與圖3中的實(shí)施例的不同之處在于優(yōu)選地在下 混音器70以及殘留信號(hào)計(jì)算中說(shuō)明參數(shù)信息,這樣由圖7中的數(shù)據(jù)率 減速器33所輸出的殘留信號(hào)可以由比數(shù)據(jù)率減速器33所輸出的信號(hào) 更少數(shù)量的比特來(lái)表示。這是由于圖7中的殘留信號(hào)包括的冗余小于 圖3中的殘留信號(hào)所包括的冗余的事實(shí)。圖8示出了與圖7中的編碼器實(shí)現(xiàn)相對(duì)應(yīng)的解碼器實(shí)現(xiàn)的優(yōu)選實(shí) 施例。與圖6中的解碼器相比,多聲道重構(gòu)器25可用于在側(cè)信號(hào)(即 殘留信號(hào))為零時(shí)自動(dòng)輸出第一重構(gòu)多聲道信號(hào)26,或者在殘留信號(hào) 不等于零時(shí)自動(dòng)輸出第二重構(gòu)多聲道信號(hào)27。因此,圖8中的多聲道 重構(gòu)器25不能同時(shí)輸出兩個(gè)信號(hào)26和27,但是可以只輸出這兩個(gè)信
號(hào)中的第一個(gè)或這兩個(gè)信號(hào)中的第二個(gè)。因此,圖8中的實(shí)施例不需 要諸如圖4中所示的任意解碼器控制。具體地,圖8中的殘留信號(hào)解碼器22輸出由圖7中的相應(yīng)的解 碼器元件72所產(chǎn)生的特定側(cè)信號(hào)。此外,下混音解碼器24輸出由圖 7中的下混音器70所產(chǎn)生的特定單聲道信號(hào)。然后,將特定側(cè)信號(hào)和特定單聲道信號(hào)與增益參數(shù)以及時(shí)間對(duì)準(zhǔn) 參數(shù)一起輸入多聲道解碼器。增益參數(shù)可用于控制增益級(jí)84根據(jù)第一 增益規(guī)則來(lái)采用增益。此外,增益參數(shù)控制另外的增益級(jí)82、 83根據(jù) 不同的第二增益規(guī)則來(lái)應(yīng)用增益。此外,多聲道重構(gòu)器包括減法器84 和加法器85以及時(shí)間解對(duì)準(zhǔn)框86,以產(chǎn)生重構(gòu)第一聲道和重構(gòu)第二 聲道。隨后,參考圖7和圖8的編碼器/解碼器方案的優(yōu)選實(shí)施例。圖 9a示出了根據(jù)本發(fā)明的方面的完全編碼器/解碼器方案,其中殘余信號(hào) d (n)不等于零。此外,圖9b指示了在沒(méi)有計(jì)算差信號(hào)d (n)或者 己經(jīng)除去數(shù)據(jù)流以減少殘留信號(hào)(例如由于傳輸帶寬相關(guān)的需求)時(shí) 的圖9a中的可縮放的編碼器/解碼器。在圖9a的實(shí)施例中,在從編碼 器傳輸?shù)浇獯a器的數(shù)據(jù)流中除去已編碼的殘留信號(hào)的情況下,圖9a 的實(shí)施例變成了純參數(shù)多聲道場(chǎng)景,其中對(duì)準(zhǔn)參數(shù)和增益參數(shù)是多聲 道參數(shù),而特定的單聲道信號(hào)是從編碼器側(cè)傳輸?shù)浇獯a器側(cè)的下混音 聲道。因?yàn)樵诮獯a器側(cè)沒(méi)有接收到殘留信號(hào),即d(n)等于零,則只通 過(guò)使用對(duì)準(zhǔn)和增益參數(shù)來(lái)執(zhí)行解碼器側(cè)的多聲道重構(gòu)。圖9c示出了基于本發(fā)明的編碼器的方程,而圖9d則指示了基于 本發(fā)明的解碼器的方程。具體地,本發(fā)明的編碼器包括作為來(lái)自圖1的參數(shù)提供器14 的參數(shù)計(jì)算器71。參數(shù)計(jì)算器71可用于計(jì)算時(shí)間對(duì)準(zhǔn)參數(shù),以便將 右聲道r (n)與左聲道l (n)對(duì)準(zhǔn)。在圖9a到圖9d中,已對(duì)準(zhǔn)的右 聲道由ra (n)表示。優(yōu)選地,從輸入信號(hào)的重疊塊中提取出對(duì)準(zhǔn)參數(shù)。 該對(duì)準(zhǔn)參數(shù)與左聲道和右聲道之間的時(shí)間延遲相對(duì)應(yīng),并優(yōu)選地使用 時(shí)間域的互相關(guān)技術(shù)來(lái)對(duì)該對(duì)準(zhǔn)參數(shù)進(jìn)行估計(jì)。針對(duì)在子帶中不存在
對(duì)準(zhǔn)增益的情況,例如在獨(dú)立信號(hào)的情況下,將延遲參數(shù)設(shè)為零。優(yōu) 選地,在子帶結(jié)構(gòu)中,每個(gè)子帶估計(jì)一個(gè)延遲(時(shí)間對(duì)準(zhǔn))參數(shù)。在優(yōu)選實(shí)施例中,采用46ms的估定分析率和50%的重疊漢明窗。參數(shù)計(jì)算器71還計(jì)算增益值。該增益值也優(yōu)選地從信號(hào)的重疊 塊中提取。自然地,增益參數(shù)與在諸如公知的技術(shù)心理聲學(xué)編碼方案 之類(lèi)的參數(shù)編碼中普遍使用的電平差參數(shù)??蛇x地,可以使用迭代方 法來(lái)計(jì)算增益值,其中將差信號(hào)反饋到參數(shù)計(jì)算器中,并且設(shè)置增益 值,使得差信號(hào)達(dá)到如圖9a中的虛線90所示的最小值。 一旦計(jì)算了 參數(shù)對(duì)準(zhǔn)和增益,則可以開(kāi)始圖7中的下混音器70以及圖7中的殘留 信號(hào)編碼器16。具體地,圖7中的下混音器70包括用于將一個(gè)聲道 延遲所計(jì)算的時(shí)間對(duì)準(zhǔn)參數(shù)的對(duì)準(zhǔn)框91。然后,使用加法設(shè)備92將 所延遲的第二聲道ra (n)與第一聲道相加。在加法器92的輸出處, 存在下混音聲道。因此,圖7中的下混音器70包括框91和92以形成 特定的單聲道信號(hào)。圖7中的殘留信號(hào)編碼器16還包括加權(quán)器93和后續(xù)的側(cè)信號(hào)計(jì) 算器94,側(cè)信號(hào)計(jì)算器94用于計(jì)算原始第一聲道和已對(duì)準(zhǔn)且已加權(quán) 的第二聲道之間的差。具體地,為了對(duì)已對(duì)準(zhǔn)的第二聲道進(jìn)行加權(quán), 執(zhí)行用于相應(yīng)的解碼器側(cè)框80中的第一加權(quán)規(guī)則。因此,殘留信號(hào)編 碼器16包括對(duì)準(zhǔn)設(shè)備91、加權(quán)設(shè)備93、以及側(cè)信號(hào)計(jì)算器94。因?yàn)?將已對(duì)準(zhǔn)的第二聲道用于下混音以及殘留信號(hào)計(jì)算,對(duì)已對(duì)準(zhǔn)的右聲 道進(jìn)行一次計(jì)算則足夠,并將結(jié)果轉(zhuǎn)發(fā)到圖7中的下混音器70以及加 權(quán)器/側(cè)信號(hào)計(jì)算器72中。優(yōu)選地,選擇對(duì)準(zhǔn)和增益因子,使得該處理可逆,因此可以很好 地定義了圖9d中的方程并在數(shù)值對(duì)其進(jìn)行了良好的限定。可以將普通單聲道編碼器51用于對(duì)和信號(hào)進(jìn)行編碼,并且將優(yōu) 選為專(zhuān)用的殘留信號(hào)編碼器33應(yīng)用于殘留信號(hào)。當(dāng)單聲道編碼器51是無(wú)損耗的,即不再對(duì)單聲道信號(hào)進(jìn)行量化, 或者殘留信號(hào)編碼器也是無(wú)損耗的,或者對(duì)準(zhǔn)信號(hào)模型與源信號(hào)完全 匹配時(shí),圖9a中所示的本發(fā)明的編碼結(jié)構(gòu)具有也假設(shè)了對(duì)準(zhǔn)和增益參 數(shù)只用于無(wú)損耗編碼方案的理想重構(gòu)屬性。 圖9a中的本發(fā)明的系統(tǒng)為可以在如圖11中的線1114所示的幅度 多個(gè)范圍內(nèi)作用于功能下降的方案提供架構(gòu)。具體地,不進(jìn)行殘留信 號(hào)編碼,即d(n)-0,則該方案通過(guò)只傳輸除了單聲道信號(hào)(作為下 混音聲道)以外的對(duì)準(zhǔn)和增益參數(shù)(作為多聲道參數(shù))而變成參數(shù)立 體聲編碼。圖9b中示出了這種情況。此外,本發(fā)明的系統(tǒng)具有優(yōu)點(diǎn) 該對(duì)準(zhǔn)方法自動(dòng)提出單聲道下混音問(wèn)題。隨后,參考圖10,圖10將圖9a到9b中所示的本發(fā)明的實(shí)施例 的實(shí)現(xiàn)作為子帶編碼結(jié)構(gòu)示出。將原始左和右聲道輸入分析濾波組 1000中,以得到若干子帶信號(hào)。針對(duì)每個(gè)子帶信號(hào),使用如圖9a到 9d所示的編碼/解碼方案。在解碼器側(cè),在合成濾波器組1010中對(duì)重 構(gòu)子帶信號(hào)進(jìn)行合成,以最終到達(dá)全帶重構(gòu)多聲道信號(hào)。自然地,對(duì) 于每個(gè)子帶,如圖10中的箭頭1020所示,將對(duì)準(zhǔn)參數(shù)和增益參數(shù)從 編碼器側(cè)傳輸?shù)浇獯a器側(cè)。圖10中的子帶編碼結(jié)構(gòu)的優(yōu)選實(shí)現(xiàn)是基于具有兩個(gè)級(jí)的余弦調(diào) 制的濾波器組,以便實(shí)現(xiàn)不相等的子帶帶寬(以可感知的激發(fā)尺寸)。 第一級(jí)將信號(hào)分割成M個(gè)子帶。對(duì)M個(gè)子帶信號(hào)進(jìn)行重要的抽取, 并將其饋入第二級(jí)濾波器組。第二級(jí)的第k個(gè)濾波器具有Mk個(gè)頻帶,ke{l.....M}。在優(yōu)選實(shí)現(xiàn)中,使用M:8個(gè)頻帶,子子帶的結(jié)構(gòu)如圖10中的表所示,并在兩個(gè)級(jí)之后優(yōu)選地導(dǎo)致36個(gè)有效子帶。根據(jù) [13],設(shè)計(jì)在抑制頻帶具有至少100dB衰減的原型濾波器。第一級(jí)的 濾波器階數(shù)為116,第二級(jí)的最大濾波器階數(shù)為256。然后,將此編碼 結(jié)構(gòu)應(yīng)用于子帶對(duì)(與左和右子帶聲道相對(duì)應(yīng))。第一和第二級(jí)濾波器組之間的子帶的相應(yīng)組如圖10右邊的表所 示,可以清楚地看出第一子帶k包括16個(gè)子子帶。此外,第二子帶包 括8個(gè)子子帶等。利用高斯模型(GM)向量量化(VQ)技術(shù)來(lái)實(shí)現(xiàn)有效的參數(shù)編 碼。基于GM模型的量化在語(yǔ)音編碼[14-16]領(lǐng)域內(nèi)非常普遍,并且有 利于高尺寸VQ的低復(fù)雜度的實(shí)現(xiàn)。在優(yōu)選實(shí)施例中,本發(fā)明對(duì)增益 和延遲參數(shù)的36維向量進(jìn)行向量量化。所有的GM模型都具有16個(gè) 混合分量,并在從60分鐘的音頻數(shù)據(jù)(具有變化的內(nèi)容,并與隨后的
估計(jì)測(cè)試信號(hào)分開(kāi))中提取的參數(shù)的數(shù)據(jù)庫(kù)中進(jìn)行訓(xùn)練。基于清楚的 統(tǒng)計(jì)模型的方法在音頻編碼中比在語(yǔ)音編碼中要不經(jīng)常使用。 一個(gè)原 因是不相信統(tǒng)計(jì)模型能夠捕捉通用音頻中所包含的所有相關(guān)信息的能 力。然而在優(yōu)選情況下,通過(guò)使用對(duì)參數(shù)模型的開(kāi)和閉測(cè)試流程的初 步估計(jì)確實(shí)表示了在這種情況下上述并不成問(wèn)題。針對(duì)增益和延遲參數(shù)所產(chǎn)生的比特率是2.3kbps。將子帶結(jié)構(gòu)充分用于對(duì)殘留信號(hào)進(jìn)行編碼。通過(guò)使用如上述所描述的相同塊,估計(jì)每個(gè)子帶中的變化,并使用GMVQ互子帶來(lái)對(duì)該 變化進(jìn)行向量量化(即,每次對(duì)一個(gè)36維的向量進(jìn)行編碼)。該變化 有利于采用貪婪比特分配算法[17、 p.234]在子帶之間進(jìn)行比特分配。 然后使用統(tǒng)一的標(biāo)量量化來(lái)對(duì)子帶信號(hào)進(jìn)行編碼。通過(guò)對(duì)塊估計(jì)的線性內(nèi)插,得到瞬時(shí)增益g (n)和延遲r (n)。 基于對(duì)脈沖響應(yīng)的正弦函數(shù)的截?cái)嗖⒓訚h明窗,通過(guò)73rd階的分?jǐn)?shù)延 遲濾波器來(lái)實(shí)現(xiàn)時(shí)間變化延遲。通過(guò)使用內(nèi)插的延遲差數(shù),基于每個(gè) 樣本來(lái)更新濾波器的系數(shù)。提出了針對(duì)通用音頻中的立體聲圖像的靈活編碼的架構(gòu)。通過(guò)使 用新的結(jié)構(gòu),可以從參數(shù)立體聲模式無(wú)縫地移到波形近似編碼。使用 未編碼的殘留信號(hào)來(lái)對(duì)該思想的示例實(shí)現(xiàn)進(jìn)行測(cè)試,以估計(jì)殘留信號(hào) 編碼器的比特率的增長(zhǎng)效應(yīng),以及使用MP3核心編碼器來(lái)估計(jì)更實(shí)際 的場(chǎng)景中的方案。.為了使立體聲圖像穩(wěn)定,優(yōu)選地對(duì)純參數(shù)系統(tǒng)或可縮放系統(tǒng)中的 參數(shù)進(jìn)行低通濾波,該純參數(shù)系統(tǒng)或可縮放系統(tǒng)具有純參數(shù)部分,可 以如示例[9]所進(jìn)行的由解碼器未對(duì)殘余信號(hào)進(jìn)行處理來(lái)使用該純參 數(shù)部分。這減少了系統(tǒng)的對(duì)準(zhǔn)增益。通過(guò)使用標(biāo)量子帶編碼對(duì)殘留信 號(hào)進(jìn)行編碼,經(jīng)一步增大了質(zhì)量,并且質(zhì)量接近透明質(zhì)量。具體地, 通過(guò)向殘留信號(hào)增加比特來(lái)穩(wěn)定立體聲圖像,而且還增加了立體聲寬 度。此外,優(yōu)選地使用靈活的時(shí)間分割以及可變速率(例如,比特貯 備)技術(shù)來(lái)更好地利用通用音頻的動(dòng)態(tài)特性。優(yōu)選地,相干參數(shù)包括 在對(duì)準(zhǔn)濾波器中,以增強(qiáng)參數(shù)模式。改進(jìn)的殘留信號(hào)編碼、采用知覺(jué) 掩蔽、向量量化、以及差分編碼,導(dǎo)致更有效的不相干以及冗余去除。
雖然在立體聲編碼的上下文以及參數(shù)增強(qiáng)的中側(cè)編碼方案的上 下文中對(duì)本發(fā)明的系統(tǒng)進(jìn)行了描述,這里要注意的是,諸如通用強(qiáng)度 立體聲類(lèi)型的編碼之類(lèi)的每個(gè)多聲道參數(shù)編碼/解碼方案,可以利用另外公開(kāi)的側(cè)信號(hào)元件,以便最終達(dá)到理想的重構(gòu)屬性。雖然已經(jīng)通過(guò) 使用編碼器側(cè)的時(shí)間對(duì)準(zhǔn)、傳輸對(duì)準(zhǔn)參數(shù)、以及使用解碼器側(cè)的時(shí)間 解對(duì)準(zhǔn)來(lái)對(duì)本發(fā)明的編碼器/解碼器方案的優(yōu)選實(shí)施例進(jìn)行了描述,但 還是存在另外的可選項(xiàng),該可選項(xiàng)在編碼器側(cè)執(zhí)行時(shí)間對(duì)準(zhǔn)以產(chǎn)生小 的差信號(hào),但是不在解碼器側(cè)執(zhí)行時(shí)間解對(duì)準(zhǔn),因此不將對(duì)準(zhǔn)參數(shù)從 編碼器傳輸?shù)浇獯a器。在本實(shí)施例中,時(shí)間解對(duì)準(zhǔn)的忽略必然包括人 為現(xiàn)象。然而,在大多數(shù)情況下,這種人為現(xiàn)象并不嚴(yán)重,因此這個(gè) 實(shí)施例尤其適于低價(jià)多聲道解碼器。因此,還可以將本發(fā)明看作優(yōu)選的BCC類(lèi)型的參數(shù)立體聲編碼方案或任意其他多聲道編碼方案的縮放,當(dāng)去除已編碼的殘留信號(hào)時(shí), 其完全回退到純參數(shù)方案。根據(jù)本發(fā)明,通過(guò)傳輸各種類(lèi)型的額外信 息來(lái)增強(qiáng)純參數(shù)系統(tǒng),額外信息優(yōu)選地包括波形類(lèi)型的殘留信號(hào)、增 益參數(shù)和/或時(shí)間對(duì)準(zhǔn)參數(shù)。因此,使用額外信息的解碼操作導(dǎo)致比可 單獨(dú)用于參數(shù)技術(shù)更高的質(zhì)量。根據(jù)需求,用于編碼或解碼的本發(fā)明的方法可以在硬件、軟件或 固件上實(shí)現(xiàn)。因此,本發(fā)明還涉及一種用于存儲(chǔ)程序代碼的計(jì)算機(jī)可 讀介質(zhì),在計(jì)算機(jī)上運(yùn)行該程序代碼時(shí),該程序代碼導(dǎo)致本發(fā)明方法 之一。因此,本發(fā)明是具有程序代碼的計(jì)算機(jī)程序,該程序代碼在計(jì) 算機(jī)上運(yùn)行時(shí)導(dǎo)致本發(fā)明的方法。
參考文獻(xiàn)列表[I] J.D. Johnston and A.J. Ferreira, .Sum-difference stereo transform coding," in Proc. IEEE Int. Conf. Acoust., Speech, Signal Processing (ICASSP), 1992, vol. 2, pp. 569.572.[2] R. Waal and R. Veldhuis, .Subband coding of stereophonic digitalaudio signals," in Proc. IEEE Int. Conf. Acoust-, Speech, SignalProcessing (ICASSP), 1991, pp. 3601.3604. [3] J. Herre, K. Brandenburg, and D. Lederer, .Intensity stereocoding," in Preprint 3799, 96th AES Convention, 1994. [4] K. Brandenburg, .MP3 and AAC explained," in Proc. of the AES17th International Conference, paper no. 17-009, 1999. [5] J. Blauert, Spatial hearing: the psychophysics of human soundlocalization, The MIT Press, Cambridge, Massachusetts, 1997. [6] H. Fuchs, .Improving joint stereo audio coding by adaptiveinter-channel prediction," in Proc. of IEEE Workshop onApplications of Signal Processing to Audio and Acoustics, 1993,pp. 39.42.[7] H. Fuchs, .Improving MPEG audio coding by backward adaptive linear stereo prediction," in Preprint 4086, 99th AES Convention, 1995.[8] F. Baumgarte and C. Faller, .Binaural cue coding, part I:Psychoacoustic fundamentals and design principles," IEEE Trans.Speech Audio Processing, vol. 11, no. 6, pp. 509.519, 2003. [9] C. Faller and F. Baumgarte, .Binaural cue coding, part II: Schemesand applications," IEEE Trans. Speech Audio Processing, vol. 11,no. 6, pp. 520.531, 2003. [10]C. Faller, Parametric Coding of Spatial Audio, Ph.D. thesis, EcolePolytechnique Federale de Lausanne, 2004.[II] J. Breebaart, S. van de Par, A. Kohlrausch, and E. Schuijers,"High-quality parametric spatial audio coding at low bitrates," in Preprint 6072, 116th AES Convention, 2004. [12] J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, and C. Spenger, .MP3 surround: Efficient and compatible coding of multi-channel audio," in Preprint 6049, 116th AES Convention, 2004.[13]Y-P. Lin and P.P. Vaidyanaythan, .A Kaiser window approach forthe design of prototype filters of cosine modulated filterbanks,"IEEE Signal Processing Letters, vol. 5, no. 6, pp. 132.134, 1998. [14]P. Hedelin and J. Skoglund, "Vector quantization based onGaussian mixture models," IEEE Trans. Speech Audio Processing,vol. 8, no. 4, pp. 385,401, 2000. [15]A.D. Subramaniam and B.D. Rao, .PDF optimized parametricvector quantization of speech line spectral frequencies," IEEETrans. Speech Audio Processing, vol. 11, no. 2, pp. 130.142, 2003. [16]J. Lindblom and P. Hedelin, .Variable-dimension quantization ofsinusoidal amplitudes using Gaussian mixture models," in Proc.IEEE Int. Conf. A謹(jǐn)st., Speech, Signal Processing (ICASSP),2004, vol. l,pp. 153.156. [17]A. Gersho and R. M. Gray, Vector Quantization and SignalCompression, Kluwer Academic Publishers, Boston, 1992. [18]T.I. Laakso, V. Valim汪ki, M. Karjalainen, and U.K. Laine, "Toolsfor fractional delay filter design," IEEE Signal ProcessingMagazine, pp. 30.60, January 1996. [19]ITU-R Recommendation BS.1534, Method for the SubjectiveAssessment of Intermediate Quality Level of Coding Systems,ITU-T, 2001.[20]The LAME project, http:〃lame.sourceforge.net/, July 2004, v3.96丄
權(quán)利要求
1.一種多聲道編碼器,用于對(duì)具有至少兩個(gè)聲道的原始多聲道信號(hào)進(jìn)行編碼,所述多聲道編碼器包括參數(shù)提供器,用于提供一個(gè)或多個(gè)參數(shù),形成所述一個(gè)或多個(gè)參數(shù),使得可以使用從多聲道信號(hào)和一個(gè)或多個(gè)參數(shù)中獲得的一個(gè)或多個(gè)下混音聲道來(lái)形成重構(gòu)多聲道信號(hào);殘留信號(hào)編碼器,用于基于原始多聲道信號(hào)、一個(gè)或多個(gè)下混音聲道、或一個(gè)或多個(gè)參數(shù)來(lái)產(chǎn)生已編碼的殘留信號(hào),使得使用殘留信號(hào)所形成的重構(gòu)多聲道信號(hào)比沒(méi)有使用殘留信號(hào)所形成的重構(gòu)多聲道信號(hào)與原始多聲道信號(hào)更相似;以及數(shù)據(jù)流成形器,用于形成具有殘留信號(hào)和一個(gè)或多個(gè)參數(shù)的數(shù)據(jù)流。
2. 如權(quán)利要求1所述的多聲道編碼器,其中所述數(shù)據(jù)流成形器 用于形成可縮放數(shù)據(jù)流,其中一個(gè)或多個(gè)參數(shù)和殘留信號(hào)處于不同的 縮放層。
3. 如權(quán)利要求1所述的多聲道編碼器,其中所述殘留信號(hào)編碼 器用于將已編碼的殘留信號(hào)作為波形殘留信號(hào)進(jìn)行計(jì)算。
4. 如權(quán)利要求1所述的多聲道編碼器,其中所述殘留信號(hào)編碼 器用于基于一個(gè)或多個(gè)參數(shù)和原始多聲道信號(hào)而非一個(gè)或多個(gè)下混音 聲道來(lái)產(chǎn)生殘留信號(hào),因此與沒(méi)有使用一個(gè)或多個(gè)參數(shù)的殘留信號(hào)的 產(chǎn)生相比,所述殘留信號(hào)具有較小的能量。
5. 如權(quán)利要求4所述的多聲道編碼器,其中所述參數(shù)提供器包括對(duì)準(zhǔn)計(jì)算器,用于計(jì)算將要提供給用于對(duì)至少兩個(gè)聲道中的第一 聲道和第二聲道進(jìn)行對(duì)準(zhǔn)的時(shí)間對(duì)準(zhǔn)器的時(shí)間對(duì)準(zhǔn)參數(shù);或者增益計(jì)算器,計(jì)算用于對(duì)聲道進(jìn)行加權(quán)的不等于1的增益,使得 兩個(gè)聲道之間的差與增益值1相比減少。
6. 如權(quán)利要求5所述的多聲道編碼器,其中所述殘留信號(hào)編碼 器用于對(duì)從第一聲道和己對(duì)準(zhǔn)或已加權(quán)的第二聲道中獲得的差信號(hào)進(jìn) 行計(jì)算和編碼。
7. 如權(quán)利要求5所述的多聲道編碼器,還包括使用己對(duì)準(zhǔn)的聲 道來(lái)產(chǎn)生下混音聲道的下混音器。
8. 如權(quán)利要求1所述的多聲道編碼器,還包括用于將多聲道信 號(hào)分割成多個(gè)頻帶的分析濾波器組,其中所述參數(shù)提供器和殘留信號(hào)編碼器用于對(duì)子帶信號(hào)進(jìn)行操 作,以及其中所述數(shù)據(jù)流成形器用于收集針對(duì)多個(gè)頻帶的已編碼的殘留 信號(hào)和參數(shù)。
9. 如權(quán)利要求1所述的多聲道編碼器,其中所述殘留信號(hào)編碼 器還包括多聲道解碼器,通過(guò)使用一個(gè)或多個(gè)下混音聲道和一個(gè)或多個(gè)參 數(shù)來(lái)產(chǎn)生已解碼的多聲道信號(hào);差錯(cuò)計(jì)算器,用于基于已解碼的多聲道信號(hào)和原始多聲道信號(hào)來(lái) 計(jì)算多聲道差錯(cuò)信號(hào)表示;以及殘留信號(hào)處理器,用于對(duì)多聲道差錯(cuò)信號(hào)表示進(jìn)行處理,以獲得 己編碼的殘留信號(hào)。
10. 如權(quán)利要求9所述的多聲道編碼器,其中所述殘留信號(hào)處理 器包括用于產(chǎn)生多聲道差錯(cuò)信號(hào)表示的多聲道表示的多聲道編碼器。
11. 如權(quán)利要求IO所述的多聲道編碼器,其中所述殘留信號(hào)處 理器還用于產(chǎn)生多聲道差錯(cuò)信號(hào)表示的一個(gè)或多個(gè)下混音聲道。
12. 如權(quán)利要求1所述的多聲道編碼器,其中所述參數(shù)提供器用 于提供技術(shù)心理聲學(xué)編碼(BCC)參數(shù),例如聲道間電平差、聲道間 相干參數(shù)、聲道間時(shí)間差或聲道包絡(luò)提示。
13. —種用于對(duì)具有至少兩個(gè)聲道的原始多聲道信號(hào)進(jìn)行編碼 的方法,所述方法包括以下步驟-提供一個(gè)或多個(gè)參數(shù),形成所述一個(gè)或多個(gè)參數(shù),使得可以使用 從多聲道信號(hào)和一個(gè)或多個(gè)參數(shù)中所獲得的一個(gè)或多個(gè)下混音聲道來(lái) 形成重構(gòu)多聲道信號(hào); 基于原始多聲道信號(hào)、 一個(gè)或多個(gè)下混音聲道、或一個(gè)或多個(gè)參 數(shù)來(lái)產(chǎn)生已編碼的殘留信號(hào),使得使用殘留信號(hào)所形成的重構(gòu)多聲道 信號(hào)比沒(méi)有使用殘留信號(hào)所形成的重構(gòu)多聲道信號(hào)與原始多聲道信號(hào) 更相似;以及形成具有殘留信號(hào)和一個(gè)或多個(gè)參數(shù)的數(shù)據(jù)流。
14. 一種多聲道解碼器,用于對(duì)具有一個(gè)或多個(gè)下混音聲道、一個(gè)或多個(gè)參數(shù)和已編碼的殘留信號(hào)的已編碼多聲道信號(hào)進(jìn)行解碼,所 述多聲道解碼器包括殘留信號(hào)解碼器,用于基于已編碼的殘留信號(hào),產(chǎn)生已解碼的殘 留信號(hào);以及多聲道解碼器,通過(guò)使用一個(gè)或多個(gè)下混音聲道和一個(gè)或多個(gè)參 數(shù)來(lái)產(chǎn)生第一重構(gòu)多聲道信號(hào);其中代替第一重構(gòu)多聲道信號(hào)或除了第一多聲道信號(hào)以外,所述 多聲道解碼器還用于通過(guò)使用一個(gè)或多個(gè)下混音聲道和已解碼的殘留 信號(hào)來(lái)產(chǎn)生第二重構(gòu)多聲道信號(hào),其中所述第二重構(gòu)多聲道信號(hào)比所述第一重構(gòu)多聲道信號(hào)與原 始多聲道信號(hào)更相似。
15. 如權(quán)利要求14所述的多聲道解碼器,其中所述已編碼的多 聲道信號(hào)由己縮放的數(shù)據(jù)流表示,所述已縮放的數(shù)據(jù)流具有包括一個(gè) 或多個(gè)參數(shù)的第一縮放層以及包括已編碼的殘留信號(hào)的第二縮放層,其中所述多聲道編碼器還包括數(shù)據(jù)流剖析器,用于提取第一縮放層或第二縮放層。
16. 如權(quán)利要求14所述的多聲道解碼器, 其中所述已編碼的殘留信號(hào)取決于一個(gè)或多個(gè)參數(shù);以及 其中所述多聲道解碼器用于使用一個(gè)或多個(gè)下混音聲道、 一個(gè)或多個(gè)參數(shù)以及已解碼的殘留信號(hào)來(lái)產(chǎn)生第二重構(gòu)多聲道信號(hào)。
17. 如權(quán)利要求14所述的多聲道解碼器, 其中所述下混音聲道取決于對(duì)準(zhǔn)參數(shù)或增益參數(shù),以及 其中所述多聲道解碼器用于使用基于增益參數(shù)的第一加權(quán)規(guī)則來(lái)對(duì)下混音聲道進(jìn)行加權(quán),以及通過(guò)使用增益參數(shù)的第二加權(quán)規(guī)則來(lái) 對(duì)下混音聲道進(jìn)行加權(quán),或者針對(duì)使用對(duì)準(zhǔn)參數(shù)的其他輸出聲道,對(duì)一個(gè)輸出聲道進(jìn)行解對(duì)準(zhǔn)。
18. 如權(quán)利要求14所述的多聲道解碼器,其中下混音聲道取決 于對(duì)準(zhǔn)參數(shù)或增益參數(shù),以及其中所述多聲道解碼器用于使用增益參數(shù)對(duì)下混音聲道進(jìn)行加權(quán),將己解碼的殘留信號(hào)加到已加權(quán)的下混音聲道中,并再次對(duì)所產(chǎn) 生的聲道進(jìn)行加權(quán),以獲得第一多聲道輸出聲道,從下混音聲道中減去已解碼的殘留信號(hào),并使用增益參數(shù)對(duì)所產(chǎn) 生的聲道進(jìn)行加權(quán),或者對(duì)下混音聲道和己解碼的殘留信號(hào)之間的差進(jìn)行解對(duì)準(zhǔn),以獲得 第二多聲道輸出信號(hào)。
19. 如權(quán)利要求14所述的多聲道解碼器,其中所述參數(shù)包括技 術(shù)心理聲學(xué)編碼(BCC)參數(shù),例如聲道間電平差、聲道間相干參數(shù)、 聲道間時(shí)間差或聲道包絡(luò)提示,以及其中所述多聲道解碼器用于根據(jù)技術(shù)心理聲學(xué)編碼(BCC)方案 來(lái)執(zhí)行多聲道解碼操作。
20. 如權(quán)利要求14所述的多聲道解碼器,其中一個(gè)或多個(gè)下混 音聲道、一個(gè)或多個(gè)參數(shù)以及已編碼的殘留信號(hào)由子帶專(zhuān)用數(shù)據(jù)表示, 所述多聲道解碼器還包括合成濾波器組,用于對(duì)由多聲道解碼器所產(chǎn)生的重構(gòu)子帶數(shù)據(jù)進(jìn) 行合成,以獲得第一或第二重構(gòu)多聲道信號(hào)的全頻帶表示。
21. —種用于對(duì)具有一個(gè)或多個(gè)下混音聲道、一個(gè)或多個(gè)參數(shù)以 及已編碼的殘留信號(hào)的已編碼的多聲道信號(hào)進(jìn)行解碼的方法,所述方 法包括基于已編碼的殘留信號(hào),產(chǎn)生已解碼的殘留信號(hào);以及 通過(guò)使用一個(gè)或多個(gè)下混音聲道和一個(gè)或多個(gè)參數(shù)來(lái)產(chǎn)生第一 重構(gòu)多聲道信號(hào),或者通過(guò)使用一個(gè)或多個(gè)下混音聲道和已解碼的殘 留信號(hào)來(lái)產(chǎn)生第二重構(gòu)多聲道信號(hào),其中所述第二重構(gòu)多聲道信號(hào)比 所述第一重構(gòu)多聲道信號(hào)與原始多聲道信號(hào)更相似。
22. —種多聲道編碼器,用于對(duì)具有至少兩個(gè)聲道的原始多聲道信號(hào)進(jìn)行編碼,所述多聲道編碼器包括時(shí)間對(duì)準(zhǔn)器,用于使用對(duì)準(zhǔn)參數(shù),對(duì)至少兩個(gè)聲道的第一聲道和 第二聲道進(jìn)行對(duì)準(zhǔn);下混音器,用于使用已對(duì)準(zhǔn)的聲道來(lái)產(chǎn)生下混音聲道;增益計(jì)算器,用于計(jì)算不等于1的增益參數(shù),以便對(duì)已對(duì)準(zhǔn)的聲 道進(jìn)行加權(quán),因此已對(duì)準(zhǔn)的聲道之間的差與增益值l相比減少;以及數(shù)據(jù)流成形器,用于形成具有關(guān)于下混音聲道的信息、關(guān)于對(duì)準(zhǔn) 參數(shù)的信息、以及關(guān)于增益參數(shù)的信息的數(shù)據(jù)流。
23. 如權(quán)利要求20所述的多聲道編碼器,還包括用于對(duì)從第一 聲道和己對(duì)準(zhǔn)且已加權(quán)的第二聲道中獲得的差信號(hào)進(jìn)行計(jì)算和編碼,其中所述數(shù)據(jù)流成形器還用于將已編碼的殘留信號(hào)包括進(jìn)數(shù)據(jù) 流中。
24. —種多聲道解碼器,用于對(duì)具有關(guān)于一個(gè)或多個(gè)下混音聲道 的信息、關(guān)于增益參數(shù)的信息、以及關(guān)于對(duì)準(zhǔn)參數(shù)的信息的已編碼的 多聲道信號(hào)進(jìn)行解碼,所述多聲道解碼器包括下混音聲道解碼器,用于產(chǎn)生已解碼的下混音信號(hào); 處理器,用于使用增益參數(shù)對(duì)己解碼的下混音聲道進(jìn)行處理,以 獲得第一已解碼的輸出聲道,以及用于使用增益參數(shù)對(duì)已解碼的下混 音聲道進(jìn)行處理,以及使用對(duì)準(zhǔn)參數(shù)進(jìn)行解對(duì)準(zhǔn),以獲得第二已解碼 的輸出聲道。
25. 如權(quán)利要求23所述的多聲道解碼器,其中所述已編碼的多 聲道信號(hào)還包括已編碼的殘留信號(hào),所述多聲道解碼器還包括殘留信號(hào)解碼器,用于產(chǎn)生己解碼的殘留信號(hào),以及 其中所述處理器用于使用增益參數(shù)對(duì)下混音聲道進(jìn)行第一次加 權(quán),以添加已解碼的殘留信號(hào);使用增益參數(shù)進(jìn)行第二次加權(quán),以獲 得第一重構(gòu)聲道,以及從加權(quán)之前的下混音聲道中減去己解碼的殘留 信號(hào),以進(jìn)行解對(duì)準(zhǔn),獲得第二重構(gòu)聲道。
26. —種對(duì)具有至少兩個(gè)聲道的原始多聲道信號(hào)進(jìn)行編碼的方 法,所述方法包括-使用對(duì)準(zhǔn)參數(shù)對(duì)至少兩個(gè)聲道的第一聲道和第二聲道進(jìn)行時(shí)間對(duì)準(zhǔn);使用已對(duì)準(zhǔn)的聲道來(lái)產(chǎn)生下混音聲道;計(jì)算不等于l的增益參數(shù),以便對(duì)已對(duì)準(zhǔn)的聲道進(jìn)行加權(quán),因此 與增益值l相比,減少已對(duì)準(zhǔn)的聲道之間的差;以及形成具有關(guān)于下混音聲道的信息、關(guān)于對(duì)準(zhǔn)參數(shù)的信息、以及關(guān) 于增益參數(shù)的信息的數(shù)據(jù)流。
27. —種用于對(duì)具有關(guān)于一個(gè)或多個(gè)下混音聲道的信息、關(guān)于增 益參數(shù)的信息、以及關(guān)于對(duì)準(zhǔn)參數(shù)的信息的已編碼的多聲道信號(hào)進(jìn)行 解碼的方法,所述方法包括產(chǎn)生已解碼的下混音信號(hào);通過(guò)使用增益參數(shù)對(duì)己解碼的下混音聲道進(jìn)行處理,以獲得第一 已解碼的輸出聲道,以及通過(guò)使用增益參數(shù)和基于對(duì)準(zhǔn)參數(shù)的解對(duì)準(zhǔn), 對(duì)己解碼的下混音聲道進(jìn)行處理,以獲得第二己解碼的輸出聲道。
28. —種已編碼的多聲道信號(hào),具有關(guān)于一個(gè)或多個(gè)下混音聲 道、關(guān)于在第一重構(gòu)多聲道信號(hào)中與一個(gè)或多個(gè)下混音聲道合成所產(chǎn) 生的一個(gè)或多個(gè)參數(shù)、以及關(guān)于在第二重構(gòu)多聲道信號(hào)中與一個(gè)或多 個(gè)下混音聲道合成所產(chǎn)生的己編碼的殘留信號(hào)的信息,其中所述第二 重構(gòu)多聲道信號(hào)比所述第一重構(gòu)多聲道信號(hào)與原始多聲道信號(hào)更相 似。
29. —種計(jì)算機(jī)程序,用于在計(jì)算機(jī)上運(yùn)行時(shí)執(zhí)行對(duì)具有一個(gè)或 多個(gè)下混音聲道、 一個(gè)或多個(gè)參數(shù)以及已編碼的殘留信號(hào)的己編碼的 多聲道信號(hào)進(jìn)行解碼的方法,所述方法包括以下步驟基于已編碼的殘留信號(hào),產(chǎn)生已解碼的殘留信號(hào);以及 通過(guò)使用一個(gè)或多個(gè)下混音聲道和一個(gè)或多個(gè)參數(shù)來(lái)產(chǎn)生第一 重構(gòu)多聲道信號(hào),或者通過(guò)使用一個(gè)或多個(gè)下混音聲道和已解碼的殘 留信號(hào)來(lái)產(chǎn)生第二重構(gòu)多聲道信號(hào),其中所述第二重構(gòu)多聲道信號(hào)比 所述第一重構(gòu)多聲道信號(hào)與原始多聲道信號(hào)更相似。
全文摘要
多聲道編碼器/解碼器方案優(yōu)選地另外產(chǎn)生波形類(lèi)型的殘留信號(hào)(16)。將所述殘留信號(hào)(16)與一個(gè)或多個(gè)多聲道參數(shù)(14)一起傳輸?shù)浇獯a器中。與純參數(shù)多聲道解碼器相比,增強(qiáng)型解碼器由于另外的殘留信號(hào)而產(chǎn)生具有改進(jìn)的輸出質(zhì)量的多聲道輸出信號(hào)。
文檔編號(hào)G10L19/00GK101120615SQ200580048291
公開(kāi)日2008年2月6日 申請(qǐng)日期2005年10月4日 優(yōu)先權(quán)日2005年2月22日
發(fā)明者約納斯·林德布羅姆 申請(qǐng)人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)