專利名稱:參數(shù)多聲道音頻表示的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種對(duì)多聲道音頻信號(hào)進(jìn)行編碼的方法、一種用于對(duì)多聲道音頻信號(hào)進(jìn)行編碼的編碼器、一種用于提供音頻信號(hào)的設(shè)備、一種經(jīng)編碼的音頻信號(hào)、一種其上存儲(chǔ)有經(jīng)編碼的音頻信號(hào)的存儲(chǔ)介質(zhì)、一種對(duì)經(jīng)編碼的音頻信號(hào)進(jìn)行解碼的方法、一種用于對(duì)經(jīng)編碼的音頻信號(hào)進(jìn)行解碼的解碼器以及一種用于提供解碼后的音頻信號(hào)的設(shè)備。
背景技術(shù):
EP-A-1107232公開了一種參數(shù)編碼方案,用于產(chǎn)生立體聲音頻信號(hào)表示,所述立體聲音頻信號(hào)由左聲道信號(hào)和右聲道信號(hào)構(gòu)成。為了有效利用傳輸帶寬,這種表示包含了僅與單耳信號(hào)相關(guān)的信息以及參數(shù)信息,所述單耳信號(hào)可以是左聲道信號(hào)或右聲道信號(hào)。可以在單耳信號(hào)和參數(shù)信息相結(jié)合的基礎(chǔ)上還原其它立體聲信號(hào)。參數(shù)信息包括立體聲音頻信號(hào)的定位提示,該定位提示包含左聲道和右聲道信號(hào)的強(qiáng)度和相位特征。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種參數(shù)多聲道音頻系統(tǒng),其能夠以可用的位速率來(lái)調(diào)整編碼音頻信號(hào)的質(zhì)量或,以編碼器的復(fù)雜度或有效傳輸帶寬來(lái)調(diào)整編碼音頻信號(hào)的質(zhì)量。
本發(fā)明的第一方面提供了一種如權(quán)利要求1所要求保護(hù)的編碼多聲道音頻信號(hào)的方法。本發(fā)明的第二方面提供了一種如權(quán)利要求2所要求保護(hù)的編碼多聲道音頻信號(hào)的方法。本發(fā)明的第三方面提供了一種如權(quán)利要求14所要求保護(hù)的編碼多聲道音頻信號(hào)的編碼器。本發(fā)明第四方面提供了一種如權(quán)利要求15所要求保護(hù)的編碼多聲道音頻信號(hào)的編碼器。本發(fā)明第五方面提供了一種如權(quán)利要求16所要求保護(hù)的提供音頻信號(hào)的裝置。本發(fā)明第六方面提供了一種如權(quán)利要求17所要求保護(hù)的編碼音頻信號(hào)。本發(fā)明第七方面提供了一種如權(quán)利要求18所要求保護(hù)的其上存儲(chǔ)有編碼信號(hào)的存儲(chǔ)介質(zhì)。本發(fā)明的第八方面提供了一種如權(quán)利要求19所要求保護(hù)的解碼方法。本發(fā)明第九方面提供了一種如權(quán)利要求20所要求保護(hù)的用于解碼上所編碼音頻信號(hào)的解碼器。本發(fā)明第十方面提供了一種如權(quán)利要求21所要求保護(hù)的用于提供解碼音頻信號(hào)的裝置。在從屬權(quán)利要求中定義了有益的實(shí)施例。
在按照本發(fā)明第一方面的對(duì)多聲道音頻信號(hào)進(jìn)行編碼的方法中,產(chǎn)生一個(gè)單一聲道信號(hào)。此外,從所述多聲道音頻信號(hào)中產(chǎn)生這樣的信息通過(guò)所述單一聲道音頻信號(hào)和所述信息能夠?qū)崿F(xiàn)以期望的音質(zhì)等級(jí)對(duì)所述多聲道音頻信號(hào)進(jìn)行還原。最好,所述信息包括參數(shù)組,例如,如從EP-A-1107232中所獲知的參數(shù)組。
按照本發(fā)明的第一方面,所述信息是通過(guò)針對(duì)所述多聲道音頻信號(hào)的第一頻率范圍確定所述信息的第一部分,并且針對(duì)所述多聲道音頻信號(hào)的第二頻率范圍確定所述信息的第二部分而產(chǎn)生的。所述第二頻率范圍是所述第一頻率范圍的一部分并且因此是所述第一頻率范圍的子范圍?,F(xiàn)在,可以得到兩種級(jí)別的解碼音質(zhì)。對(duì)于解碼多聲道音頻信號(hào)的低質(zhì)量等級(jí)而言,解碼器使用的是經(jīng)編碼的單一聲道音頻信號(hào)和所述信息的第一部分。對(duì)于解碼多聲道音頻信號(hào)的較高質(zhì)量等級(jí)而言,解碼器使用的是經(jīng)編碼的單一聲道音頻信號(hào)和所述信息的第一部分和第二部分。當(dāng)然,如果存在大量各自與不同的頻率范圍相關(guān)的信息部分,也可以從大量的等級(jí)中選取解碼音質(zhì)。例如,所述第一部分可以包括單獨(dú)一組在覆蓋了多聲道音頻信號(hào)的全部帶寬的頻率范圍內(nèi)確定的參數(shù)。而第二部分可以包括多組參數(shù),每組參數(shù)是針對(duì)全部帶寬的子范圍或部分而確定的。這些部分合在一起最好能夠覆蓋全部帶寬。不過(guò)也存在其它多種可行的方案。例如,所述第一部分可以包括兩組參數(shù),第一組是針對(duì)覆蓋了全部帶寬的低端部分頻率范圍而確定的,而第二組參數(shù)是針對(duì)覆蓋了全部帶寬的其余部分的頻率范圍而確定的。所述第二部分可以包括針對(duì)全部帶寬中的低端部分中的兩個(gè)頻率范圍而確定的兩組參數(shù)。并不要求針對(duì)全部帶寬的低端的參數(shù)組的數(shù)量與針對(duì)高端的參數(shù)組的數(shù)量相等。
編碼音頻信號(hào)的這種表達(dá)使得解碼音頻信號(hào)的質(zhì)量取決于解碼器的復(fù)雜程度。例如,在簡(jiǎn)單的便攜式解碼器中,可以使用低復(fù)雜程度的解碼器,該解碼器的能耗較低,并且因此僅能夠使用所述信息的一部分。在高端應(yīng)用設(shè)備中,使用了復(fù)雜的解碼器,這種解碼器能夠使用編碼信號(hào)中所有的可用信息。
解碼音頻信號(hào)的質(zhì)量還取決于可用的傳送帶寬。如果傳送帶寬較高,解碼器就可以對(duì)所有的可用層進(jìn)行解碼,這是由于所有的可用層都可以得到傳送。如果傳送帶寬較低,發(fā)送器可以決定僅發(fā)送有限數(shù)量的層。
按照本發(fā)明的第二方面,解碼器會(huì)接收編碼多聲道音頻信號(hào)的最大允許位速率。該最大允許位速率可以由傳輸信道(比如因特網(wǎng))或者存儲(chǔ)介質(zhì)的可用位速率進(jìn)行定義。在傳輸帶寬時(shí)常變化并且因此最大允許位速率隨時(shí)間變化的應(yīng)用系統(tǒng)中,能夠適應(yīng)傳輸帶寬的波動(dòng)以防止解碼音頻信號(hào)質(zhì)量過(guò)低是非常重要的。在正常情況下,編碼器會(huì)對(duì)所有的層進(jìn)行編碼。在發(fā)送端,根據(jù)可用的信道能力決定發(fā)送哪些層。這也可以通過(guò)環(huán)路中的解碼器來(lái)實(shí)現(xiàn),不過(guò)在發(fā)送之前正確地除去某些層是件比較復(fù)雜的事情。
如果包括單一聲道音頻信號(hào)和信息的第一和第二部分的編碼多聲道音頻信號(hào)的位速率不高于最大允許位速率的話,則本發(fā)明的編碼器僅將用于多聲道音頻信號(hào)的第二頻率范圍的信息的第二部分加入到經(jīng)編碼的音頻信號(hào)中。這樣,如果傳輸帶寬不足以支持第二部分的傳送的話,第二部分將不會(huì)存在于經(jīng)編碼的音頻信號(hào)中。
按照權(quán)利要求4中所限定的實(shí)施方式,所述信息包括多個(gè)參數(shù)組,所述信息的每個(gè)部分由一個(gè)或多個(gè)參數(shù)組表示。在所述信息的各部分中存在的參數(shù)組的數(shù)量取決于頻率范圍的數(shù)量。
按照權(quán)利要求6所限定的實(shí)施方式,所述參數(shù)組包括至少一個(gè)定位提示。
按照權(quán)利要求7所限定的實(shí)施方式,所述第一頻率范圍基本上覆蓋了所述多聲道音頻信號(hào)的全部帶寬。按照這種方式,一組參數(shù)足以提供將單一信道音頻信號(hào)解碼為多聲道音頻信號(hào)所需的基本信息。這樣,保障了經(jīng)解碼的音頻信號(hào)質(zhì)量的基本等級(jí)。第二頻率范圍覆蓋全部帶寬的一部分。這樣,當(dāng)經(jīng)編碼的音頻信號(hào)中存在第二部分時(shí),該第二部分提高了這一頻率范圍內(nèi)的解碼音頻信號(hào)質(zhì)量。
按照權(quán)利要求8所限定的實(shí)施方式,所述信息的第二部分包括至少兩個(gè)頻率范圍,它們合在一起基本上覆蓋了多聲道音頻信號(hào)的全部帶寬。這樣,將會(huì)在整個(gè)帶寬上表現(xiàn)出第二部分提供的質(zhì)量提高。
按照權(quán)利要求9所限定的實(shí)施方式,包括單一聲道音頻信號(hào)和所述信息的第一部分的基本層總是存在于經(jīng)編碼的音頻信號(hào)中。包括所述信息的第二部分的增強(qiáng)層僅當(dāng)經(jīng)編碼音頻信號(hào)的位速率不超過(guò)最大允許位速率的情況下才進(jìn)行編碼。這樣,解碼音頻信號(hào)的音質(zhì)將取決于最大允許位速率。如果最大允許位速率過(guò)低而無(wú)法包含增強(qiáng)層,將會(huì)從基本層獲取解碼音頻信號(hào),這樣會(huì)產(chǎn)生比編碼音頻信號(hào)的不可預(yù)知部分無(wú)法到達(dá)解碼器的情況下更好的解碼音頻信號(hào)質(zhì)量。
按照權(quán)利要求10到12中任何一項(xiàng)所限定的實(shí)施方式,下一幀中的所述信息的備部分(通常包含多個(gè)參數(shù)組,每個(gè)參數(shù)組對(duì)應(yīng)于所表達(dá)的每個(gè)頻段)是在前一幀的參數(shù)的基礎(chǔ)上進(jìn)行編碼的。按常理,這減小了經(jīng)編碼的所述信息的各部分的位速率,因?yàn)椋捎谙嚓P(guān)性,兩個(gè)連續(xù)幀中的信息基本上差別不大。
按照權(quán)利要求13所限定的實(shí)施方式,對(duì)兩個(gè)連續(xù)幀的參數(shù)的差值進(jìn)行編碼,而非參數(shù)本身。
目前已經(jīng)提出來(lái)用于降低立體聲節(jié)目素材的位速率的音頻解碼器的解決方案包括強(qiáng)度立體聲和M/S立體聲。
按照強(qiáng)度立體聲算法,高頻(一般高于5kHz)由與時(shí)變和取決于頻率的縮放因子或強(qiáng)度因子結(jié)合在一起的單一音頻信號(hào)(即,單聲道)表示,這能夠?qū)τ谶@些頻率范圍實(shí)現(xiàn)可與原始立體聲信號(hào)相比擬的解碼音頻信號(hào)的還原。按照M/S算法,將信號(hào)分解為一個(gè)和(或中間,或公共)信號(hào)和一個(gè)差(或邊帶,或非公共)信號(hào)。這一分解有時(shí)要與主分量分析或時(shí)變縮放因素結(jié)合起來(lái)進(jìn)行。然后對(duì)這些信號(hào)獨(dú)立地進(jìn)行編碼,這一編碼是通過(guò)變換編碼器或子帶編碼器[它們都是波形編碼器]來(lái)進(jìn)行的。通過(guò)這種算法實(shí)現(xiàn)的信息量減少?gòu)?qiáng)烈依賴于源信號(hào)的空間屬性。例如,如果源信號(hào)是單聲道的,那么差信號(hào)為零并且可以被丟棄。不過(guò),如果左右音頻信號(hào)的相關(guān)性很低(對(duì)于高頻范圍而言,這是經(jīng)常發(fā)生的情況),這種方案僅僅能夠?qū)崿F(xiàn)很小的位速率降低。對(duì)于低頻區(qū)域,M/S編碼通常具有提供顯著的優(yōu)點(diǎn)。
近年來(lái),音頻信號(hào)的參數(shù)表達(dá)得到了關(guān)注,尤其是在音頻編碼領(lǐng)域。已經(jīng)證明,表述音頻信號(hào)的傳送(量化)參數(shù)僅需要很小的輸送能力,以在接收端再合成感覺(jué)上相等的信號(hào)。不過(guò),當(dāng)前的參數(shù)音頻編碼器重點(diǎn)放在了對(duì)單耳信號(hào)進(jìn)行編碼上,而立體聲信號(hào)被當(dāng)作雙單聲道信號(hào)來(lái)進(jìn)行處理。
通過(guò)下文中介紹的實(shí)施方式,本發(fā)明的這些和其它優(yōu)點(diǎn)將會(huì)顯而易見(jiàn),并且將會(huì)參照下文中介紹的實(shí)施方式對(duì)本發(fā)明的這些和其它優(yōu)點(diǎn)進(jìn)行解釋說(shuō)明。
附圖中圖1表示用于立體聲音頻信號(hào)的多聲道編碼器的方框圖,圖2表示用于立體聲音頻信號(hào)的多聲道編碼器的方框圖,圖3示出了編碼數(shù)據(jù)流的表示,圖4表示根據(jù)本發(fā)明的頻率范圍的實(shí)施方式,圖5表示根據(jù)本發(fā)明的頻率范圍的另一實(shí)施方式,圖6表示根據(jù)本發(fā)明的一個(gè)實(shí)施方式的基于前一幀內(nèi)的參數(shù)確定參數(shù)組的過(guò)程,圖7表示一組參數(shù),圖8表示基本層的參數(shù)的差分確定,和圖9表示與增強(qiáng)層的頻率范圍相應(yīng)的參數(shù)的求差確定。
具體實(shí)施例方式
圖1示出了多聲道編碼器的方框圖。編碼器接收多聲道音頻信號(hào),所述多聲道音頻信號(hào)圖示為立體聲信號(hào)RI、LI,編碼器提供編碼多聲道音頻信號(hào)EBS。
下混頻器1將立體聲信號(hào)或立體聲通道信號(hào)RI、LI混頻為單一聲道音頻信號(hào)(也稱為單耳信號(hào))SC。例如,下混頻器1可以確定輸入音頻信號(hào)RI、LI的平均值。
編碼器3對(duì)單耳信號(hào)SC進(jìn)行編碼,以獲得經(jīng)編碼的單耳信號(hào)ESC。編碼器3可以是已知種類的編碼器,例如,MPEG編碼器(MPEG-LII,MPEG-LIII(mp3),或MPEG2-AAC)。
參數(shù)確定電路2根據(jù)輸入音頻信號(hào)RI、LI來(lái)確定表征信息INF的參數(shù)組S1、S2......。根據(jù)需要,參數(shù)確定電路2接收最大允許位速率MBR,以僅僅確定參數(shù)組S1、S2......,這些參數(shù)組在由參數(shù)編碼器4編碼的時(shí)候,與編碼的單耳信號(hào)ESC一起不超過(guò)該最大允許位速率MBR。經(jīng)編碼參數(shù)由EIN表示。
格式器5將經(jīng)過(guò)編碼的單耳信號(hào)SC與經(jīng)過(guò)編碼的參數(shù)EIN以一種期望的格式合成在一個(gè)數(shù)據(jù)流中,以獲得經(jīng)過(guò)編碼的多聲道音頻信號(hào)EBS。
下面將針對(duì)一種實(shí)施方式借助實(shí)例對(duì)編碼器的操作進(jìn)行詳細(xì)地說(shuō)明。將多聲道音頻信號(hào)L1、R1編碼在一個(gè)單一的單耳信號(hào)SC(此外也稱為單一聲道音頻信號(hào))中。由參數(shù)確定電路2執(zhí)行多聲道音頻信號(hào)的LI、RI的空間屬性的參數(shù)。這些參數(shù)包含如何從單耳信號(hào)SC中還原多聲道音頻信號(hào)LI、RI的信息。這些參數(shù)通常是在將它們與經(jīng)編碼的單一單耳信號(hào)ESC進(jìn)行合成之前由參數(shù)編碼器4加以編碼的。這樣,對(duì)于一般的音頻編碼應(yīng)用而言,發(fā)送或存儲(chǔ)的是僅與一個(gè)單耳音頻信號(hào)合成在一起的這些參數(shù)。合成后的編碼信號(hào)是經(jīng)編碼的多聲道音頻信號(hào)EBS。與單獨(dú)地處理多個(gè)聲道的音頻編碼器相比,發(fā)送或存儲(chǔ)該經(jīng)編碼的多聲道音頻信號(hào)EBS所需的發(fā)送或存儲(chǔ)能力得到了大幅降低。不過(guò),借助含有參數(shù)(組)的信息INF,原始的空間感得到了保留。
特別是,多聲道音頻RI、LI的參數(shù)描述與一個(gè)雙聲道處理模塊有關(guān),該模塊旨在描述雙耳立體聲聽覺(jué)系統(tǒng)的有效信號(hào)處理。
該模塊將輸入音頻LI、RI分成數(shù)個(gè)限帶信號(hào),這些限帶信號(hào)最好是以ERB比例刻度線性隔開的。這些信號(hào)的帶寬取決于中心頻率,滿足ERB比例。其次,最好,對(duì)于每個(gè)頻率帶寬,對(duì)輸入信號(hào)的下述屬性進(jìn)行分析-耳間電平差,或ILD,由源于左耳和右耳的限帶信號(hào)的相對(duì)電平定義,-耳間時(shí)間(或相位)差I(lǐng)TD(或IPD),由與耳間交叉相關(guān)函數(shù)中的峰值對(duì)應(yīng)的耳間延遲(或相移)定義,-無(wú)法由ITD或ILD說(shuō)明的波形的相似(相異)性,這可以借助最大耳間交叉相關(guān)IC來(lái)實(shí)現(xiàn)參數(shù)(例如,在最大峰值位置上的交叉相關(guān)值)。
這三個(gè)參數(shù)的組S1、S2......隨時(shí)間變化,對(duì)于每個(gè)頻帶FR1、FR2......各有一個(gè)組。不過(guò),由于雙耳立體聲聽覺(jué)系統(tǒng)就其處理而言是非常緩慢的,故而這些屬性的更新速度是相當(dāng)?shù)偷?一般為幾十毫秒)。
可以假設(shè)(緩慢的)時(shí)間變化參數(shù)是雙耳立體聲聽覺(jué)系統(tǒng)可以利用的僅有的空間信號(hào)屬性,并且通過(guò)這些與時(shí)間和頻率相關(guān)的參數(shù),所感覺(jué)到的聽覺(jué)世界是借助更高級(jí)別的聽覺(jué)系統(tǒng)進(jìn)行重建的。
附圖2表示一個(gè)多聲道解碼器的框圖。該解碼器接收經(jīng)過(guò)編碼的多聲道音頻信號(hào)EBS并且給出經(jīng)過(guò)還原的解碼多聲道音頻信號(hào),后者被表示為立體聲信號(hào)RO、LO。
去格式器6從數(shù)據(jù)流EBS中恢復(fù)經(jīng)過(guò)編碼的單耳信號(hào)ESC’和經(jīng)過(guò)編碼的參數(shù)EIN’。解碼器7把經(jīng)過(guò)編碼的單耳信號(hào)ESC’解碼為輸出單耳信號(hào)SCO。解碼器7可以是任何公知類型的解碼器(當(dāng)然需要與所使用的編碼器相匹配),例如,解碼器7是一個(gè)MPEG解碼器。解碼器8將經(jīng)過(guò)編碼的參數(shù)EIN’解碼為輸出參數(shù)INO。
解多路復(fù)用器9通過(guò)對(duì)輸出單耳信號(hào)SCO應(yīng)用輸出參數(shù)INO的參數(shù)組S1、S2......來(lái)還原輸出立體聲音頻信號(hào)LO和RO。
附圖3表示經(jīng)過(guò)編碼的數(shù)據(jù)流的表述。例如,在每一幀F(xiàn)1、F2......中,數(shù)據(jù)包以報(bào)頭H開始,其后緊隨著經(jīng)過(guò)編碼的單耳信號(hào)ECS(現(xiàn)在由A表示)、編碼信息EIN的第一部分P1、編碼信息EIN的第二部分P2和編碼信息EIN的第三部分P3。
如果幀F(xiàn)1、F2......僅包括報(bào)頭H和經(jīng)過(guò)編碼的單耳信號(hào)ECS,那么將僅發(fā)送單耳信號(hào)SC。
如EP-A-1107232中所述,將存在輸入音頻信號(hào)的全頻段劃分為多個(gè)子頻段,這些子頻段的總體覆蓋了全頻段。按照本發(fā)明的術(shù)語(yǔ),多聲道信息INF編碼在了多個(gè)參數(shù)組S1、S2...中,對(duì)應(yīng)于每個(gè)子頻段FR1、FR2...。這多個(gè)參數(shù)組S1、S2...被編碼成編碼信息EIN的第一部分P1。這樣,要發(fā)送基本水平音質(zhì)的多聲道音頻信號(hào),位流要包括報(bào)頭H、部分A(經(jīng)過(guò)編碼的單耳信號(hào)ESC)和第一部分P1。
在按照本發(fā)明的一種實(shí)施方式的位流中,第一部分P1可以僅由單組參數(shù)S1組成。該單組參數(shù)是針對(duì)整個(gè)帶寬FR1確定的。這個(gè)位流包括報(bào)頭H和部分A以及P1,該位流提供了音質(zhì)的基本層,由附圖3中的BL表示。
為了支持增強(qiáng)音質(zhì),在位流中還存在有編碼信息EIN的附加部分P2、P3。這些附加部分構(gòu)成了增強(qiáng)層EL。該位流可以包括單獨(dú)一個(gè)附加部分P2或者多于一個(gè)的附加部分。該附加部分P2最好包括多個(gè)參數(shù)組S2、S3...,對(duì)應(yīng)于每個(gè)子頻段FR2、FR3...,這些子頻段FR2、FR3...最好覆蓋整個(gè)頻段FR1。增強(qiáng)后的音質(zhì)還可以以逐步的方式表現(xiàn)出來(lái),第一增強(qiáng)等級(jí)是由包括第一部分的增強(qiáng)層EL1提供的。而第二增強(qiáng)層EL包括第一增強(qiáng)層EL1和第二增強(qiáng)層EL2,第二增強(qiáng)層EL2包括部分P3。
附加部分P2還可以包括一個(gè)與單個(gè)頻段FR2對(duì)應(yīng)的單個(gè)參數(shù)組S2,頻段FR2是全頻段FR1的一個(gè)子頻段。附加部分P2也可以包括多個(gè)參數(shù)組S2、S3...,這些參數(shù)組對(duì)應(yīng)于頻段FR2、FR3...,這些頻段合在一起沒(méi)有覆蓋整個(gè)全頻段FR1。
附加部分P3最好包含與再分了至少附加部分P2的子頻段之一的頻段相應(yīng)的參數(shù)組。
按照本發(fā)明的這種位流的格式使得在傳送信道上,或者在解碼器端,能夠依據(jù)傳送信道的位速率或者解碼器的解碼復(fù)雜程度,來(lái)調(diào)整解碼音頻信號(hào)的音質(zhì)。例如,如果音頻解碼器應(yīng)當(dāng)具有較低的功耗,比如這一點(diǎn)在便攜式應(yīng)用設(shè)備中很重要,解碼器可以具有較低的復(fù)雜程度并且僅使用部分H、A和P1。如果用戶表示,他希望得到解碼音頻信號(hào)的更高的音質(zhì),那么解碼器能夠以較高的功耗進(jìn)行更為復(fù)雜的操作,同樣也是可行的。
還有可能編碼器知道最大允許位速率MBR,該位速率可以通過(guò)傳送信道傳送,或者可以保存在存儲(chǔ)介質(zhì)上。現(xiàn)在,編碼器能夠決定多少個(gè)(如果有的話)附加部分P1、P2...能夠與所述最大允許位速率MBR相符。編碼器僅將這些允許的部分P1、P2...編碼在位流中。
附圖4表示按照本發(fā)明的頻率范圍的實(shí)施方式。按照這種實(shí)施方式,頻段FR1等于多聲道音頻信號(hào)LI、RI的全部帶寬FBW,而頻帶FR2是全部帶寬FBW的子頻帶。
如果這些是用于確定參數(shù)組S1、S2...的僅有的頻率范圍,那么將會(huì)針對(duì)頻帶FR1確定參數(shù)組S1,并且該參數(shù)組S1存在于部分P1中,而且針對(duì)頻帶FR2確定參數(shù)組S2,并且該參數(shù)組S2存在于部分P2中。通過(guò)使用或者不使用部分P2,音質(zhì)調(diào)整可以得到實(shí)現(xiàn)。
附圖5表示按照本發(fā)明的頻率范圍的另一種實(shí)施方式。按照這一實(shí)施方式,頻帶FR1再次等于全部帶寬FBW,并且子頻帶FR2和FR3一起覆蓋了全部帶寬FBW?;蛘邠Q句話說(shuō),將頻帶FR1再分成了子頻帶FR2和FR3。
如果這些是用于確定參數(shù)組S1、S2...的僅有的頻率范圍,那么部分P1包括一個(gè)針對(duì)頻帶FR1確定的單個(gè)參數(shù)組S1,而部分P2包括兩個(gè)分別針對(duì)頻帶FR2和FR3確定的參數(shù)組S2和S3。質(zhì)量調(diào)整可以通過(guò)使用或不使用部分P2來(lái)實(shí)現(xiàn)。
附圖6表示按照本發(fā)明的一種實(shí)施方式,基于在前幀中的參數(shù)來(lái)確定參數(shù)組的過(guò)程。
附圖6表示一個(gè)數(shù)據(jù)流,該數(shù)據(jù)流在每個(gè)幀F(xiàn)1、F2...中包括編碼信息EIN,該編碼信息EIN包括部分P1和P2,其中P1是基本層BL的一部分,而P2形成了增強(qiáng)層EL。
在幀F(xiàn)1中,部分P1包括一個(gè)單個(gè)的參數(shù)組S1,該參數(shù)組S1是針對(duì)全部帶寬FR1而確定的。部分P2,作為例子,包括四組參數(shù)S2、S3、S4和S5,它們分別是針對(duì)子頻帶FR2、FR3、FR4和FR5確定的。這四個(gè)子頻段FR2、FR3、FR4和FR5再分了頻帶FR1。
在緊隨幀F(xiàn)1之后的幀F(xiàn)2中,部分P1包括一個(gè)單個(gè)的參數(shù)組S1’,該參數(shù)組S1’是針對(duì)全部帶寬FR1而確定的,并且是基本層BL’的一部分。部分P2包括四組參數(shù)S2’、S3’、S4’和S5’,它們分別是針對(duì)子頻帶FR2、FR3、FR4和FR5確定的,并且它們形成了增強(qiáng)層EL’。
可以為幀F(xiàn)1、F2...的每一個(gè)獨(dú)立地對(duì)每個(gè)參數(shù)組S1、S2...進(jìn)行編碼。也可以相對(duì)于部分P1的參數(shù)而對(duì)部分P2的參數(shù)組進(jìn)行編碼。這由幀F(xiàn)1中始于S1終于S2到S5的箭頭表示。當(dāng)然這在其它幀F(xiàn)2...中也是可行的(未示出)。按照相同的方式,可以相對(duì)于S1對(duì)參數(shù)組S1’進(jìn)行編碼。最終,可以相對(duì)于參數(shù)組S2、S3、S4和S5對(duì)參數(shù)組S2’、S3’、S4’和S5’進(jìn)行編碼。
按照這種方式,編碼信息EIN的位速率將會(huì)得到降低,固為使用了參數(shù)組之間的冗余性和相關(guān)性。
最好,將新的參數(shù)組S1’、S2’、S3’、S4’和S5’的新參數(shù)編碼為它們的值與在前面的參數(shù)組S1、S2、S3、S4和S5的參數(shù)值之間的差值。
每隔一段有規(guī)律的時(shí)間間隔,至少要將參數(shù)組S1絕對(duì)地編碼而不進(jìn)行求差,以防止錯(cuò)誤延續(xù)過(guò)長(zhǎng)時(shí)間。
附圖7表示一組參數(shù)。每個(gè)參數(shù)組Si可以包括一個(gè)或多個(gè)參數(shù)。一般來(lái)說(shuō)這些參數(shù)是定位提示,這些定位提示給出了有關(guān)聲音對(duì)象在音頻信息中的定位的信息。一般來(lái)說(shuō),所述定位提示是耳間電平差I(lǐng)LD、耳間時(shí)間或相位差I(lǐng)TD或IPD和耳間交叉相關(guān)IC。有關(guān)這些參數(shù)的更加詳細(xì)的信息在由Christof Faller等人在2002年5月10-13日于德國(guó)慕尼黑召開的第112屆音響工程協(xié)會(huì)會(huì)議(AdioEngineering Society Convention)中遞交的論文5574號(hào)《應(yīng)用于立體聲和多聲道音頻信號(hào)壓縮的耳間提示編碼(Binaural Cue CodingApplied to Stereo and Multi-channel Audio Compression)》中給出。
附圖8表示基本層的參數(shù)的差值求算。橫軸表示連續(xù)的幀F(xiàn)1到F5。縱軸表示基本層BL的參數(shù)組S1的參數(shù)值PVG。這個(gè)參數(shù)對(duì)于幀F(xiàn)1到F5分別具有值A(chǔ)1到A5。如果不對(duì)該參數(shù)的實(shí)際值A(chǔ)2到A5進(jìn)行編碼,而是對(duì)較小的差值D1、D2...進(jìn)行編碼,那么這個(gè)參數(shù)對(duì)編碼信息EIN的位速率的影響將會(huì)得到降低。
附圖9表示與增強(qiáng)層的頻率范圍相應(yīng)的參數(shù)的差值求算。橫軸代表兩個(gè)連續(xù)的幀F(xiàn)1和F2??v軸代表基本層BL和增強(qiáng)層EL的特定參數(shù)的值。在這個(gè)例子中,基本層BL包括信息INF的部分P1,具有針對(duì)全部頻率范圍FBW而確定的單個(gè)參數(shù)組,部分P1的特定參數(shù)對(duì)于幀F(xiàn)1具有值A(chǔ)1,而對(duì)于幀F(xiàn)2具有值A(chǔ)2。增強(qiáng)層EL包括信息INF的部分P2,該部分P2具有為三個(gè)單獨(dú)的頻率范圍FR2、FR3和FR4而確定的三組參數(shù),其中所述三個(gè)頻率范圍合在一起占滿了全部頻率范圍FBW。這三個(gè)特定的參數(shù)(例如,代表ILD的參數(shù))在幀F(xiàn)1中具有值B11、B12、B13,而在幀F(xiàn)2中具有值B21、B22、B23。
如果不是對(duì)特定參數(shù)的實(shí)際值B11到B23進(jìn)行編碼,而是對(duì)差值D11、D12...進(jìn)行編碼,這三個(gè)參數(shù)對(duì)編碼信息EIN的位速率的影響將會(huì)降低,這是因?yàn)檫@些差值的編碼效率要比實(shí)際值高。
為了進(jìn)行總結(jié),在按照本發(fā)明的優(yōu)選實(shí)施方式中,建議如此組織立體聲參數(shù)信息INF基本層BL包含一組參數(shù)(最好是時(shí)間/電平差和相關(guān)性)S1,該參數(shù)組是針對(duì)多聲道音頻信號(hào)LI、RI的全部帶寬FBW確定的。增強(qiáng)層EL包含多組參數(shù)S2、S3...,這些參數(shù)組對(duì)應(yīng)于全部帶寬FBW中的連續(xù)頻率間隔FR2、FR3...。為了位速率效率,可以相對(duì)于基本層BL中的參數(shù)組S1對(duì)增強(qiáng)層EL中的參數(shù)組S2、S3...進(jìn)行差分編碼。
采用多層方式對(duì)信息INF進(jìn)行編碼,以使得解碼音質(zhì)對(duì)位速率的按比例調(diào)節(jié)成為可能。
為了得出結(jié)論,下面,將會(huì)結(jié)合程序代碼及其解釋對(duì)按照本發(fā)明的優(yōu)選實(shí)施方式進(jìn)行說(shuō)明。
首先,對(duì)于幀F(xiàn)1、F2...中的所有的子幀(部分P1、P2...),確定用于單耳表達(dá)SC的數(shù)據(jù)ESC、用于全部帶寬FBW的立體聲參數(shù)組S1的數(shù)據(jù)EIN、和針對(duì)頻率段(frequency bins)(或區(qū)域)FR2、FR3...的立體聲參數(shù)S2、S3...。
左邊給出的是程序代碼,而在右邊的說(shuō)明下面給出了程序代碼的解釋。
代碼說(shuō)明{{for(f=0;f<nrof_frames;f++)對(duì)于所有的幀進(jìn)行{example_mono_frame(f) 取得用于單耳信號(hào)表達(dá)的數(shù)據(jù)(附圖3中的部分A)example_stereo_extension_layer_1(f) 取得全部帶寬立體聲參數(shù)數(shù)據(jù)(部分P1)example_stereo_extension_layer2(f) 取得頻率段立體聲參} 數(shù)數(shù)據(jù)(部分P2)}其次,取決于位refresh_stereo的值,對(duì)全部帶寬的立體聲參數(shù)進(jìn)行獨(dú)立編碼(對(duì)實(shí)際值進(jìn)行編碼),或者對(duì)與在前值的差值進(jìn)行編碼。下面的代碼適用于耳間電平差I(lǐng)LD。
代碼說(shuō)明example_stereo_extension_layer_1(f){refresh_stereo 1位,指示是否對(duì)數(shù)據(jù)進(jìn)行絕對(duì)編碼
if(refresh_stereo=1) 如果要對(duì)數(shù)據(jù)進(jìn)行{ 絕對(duì)編碼ild_global[f]對(duì)整個(gè)頻率域(全局)的實(shí)際的耳間強(qiáng)度差} (ild)進(jìn)行編碼else 如果不是刷新{ild_global_diff[f] 相對(duì)于在前的幀對(duì)} ild進(jìn)行編碼}再次,取決于位refresh_stereo的值,對(duì)所有頻率段的立體聲參數(shù)進(jìn)行絕對(duì)編碼(對(duì)實(shí)際值進(jìn)行編碼),或者對(duì)全部帶寬的相應(yīng)參數(shù)的差值進(jìn)行編碼。下面的代碼適用于耳間電平差I(lǐng)LD。
代碼說(shuō)明example_stereo_extension_layer_2(f){if(refresh_stereo=1) 如果刷新{for(b=0;b<nrof_bins;b++)針對(duì)所有的頻率段{ild_bin[f,b] 相對(duì)于全局值對(duì)該段中的ild進(jìn)行編碼}}else 如果不刷新{for(b=0;b<nrof_bins;b++)針對(duì)所有段{ild_bin_diff[f,b] 相對(duì)于在前一幀的該
}段中的值對(duì)特定段中的ild} 進(jìn)行編碼}其中項(xiàng)目“refresh_stereo”是指示是否對(duì)立體聲參數(shù)進(jìn)行刷新的標(biāo)志(0=FALSE,1=TRUE)。
項(xiàng)目“ild_global[sf]”表示針對(duì)幀f的整個(gè)頻率域的ILD的霍夫曼編碼絕對(duì)表示級(jí)。
項(xiàng)目“ild_global_diff[f]”表示針對(duì)幀f的整個(gè)頻率域的ILD的霍夫曼編碼相對(duì)表示級(jí)。
項(xiàng)目“ild_bin[f,b]”表示針對(duì)幀f和段b的ILD的霍夫曼編碼絕對(duì)表示級(jí)。
項(xiàng)目“ild_bin_diff[f,b]”表示針對(duì)幀f和段b的ILD的霍夫曼編碼相對(duì)表示級(jí)。
應(yīng)當(dāng)注意到,上面給出的實(shí)施方式是用于解釋說(shuō)明,而非限制本發(fā)明,并且本領(lǐng)域的技術(shù)人員將能夠設(shè)計(jì)出許多其它的實(shí)施方式,而不會(huì)超出所附的權(quán)利要求書的范圍。
雖然在附圖中針對(duì)立體聲信號(hào)對(duì)本發(fā)明進(jìn)行了說(shuō)明,但是本領(lǐng)域技術(shù)人員能夠很容易地將其擴(kuò)展到多于兩個(gè)聲道的音頻信號(hào)上。
在權(quán)利要求書中,放置在括號(hào)中的任何附圖標(biāo)記都不應(yīng)理解為是對(duì)權(quán)利要求的限定。詞“包括”并不排除除了權(quán)利要求中所列的元件或步驟之外還存在其它的元件或步驟。本發(fā)明可以借助包括數(shù)個(gè)性質(zhì)不同元件的硬件來(lái)實(shí)現(xiàn),也可以借助適當(dāng)編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在列舉了數(shù)個(gè)裝置的產(chǎn)品權(quán)利要求中,這些裝置中的某一些可以由同一硬件來(lái)實(shí)現(xiàn)。在相互不同的從屬權(quán)利要求中引用了某些手段這一表面現(xiàn)象并不表示這些手段的組合不能有益地使用。
總之,將多聲道音頻信號(hào)編碼成了單耳音頻信號(hào)和能夠?qū)崿F(xiàn)多聲道音頻信號(hào)還原的信息。所述信息是通過(guò)針對(duì)所述多聲道音頻信號(hào)的第一頻率范圍來(lái)確定該信息的第一部分、針對(duì)所述多聲道音頻信號(hào)的第二頻率范圍來(lái)確定所述信息的第二部分而產(chǎn)生的。所述第二頻率范圍是所述第一頻率范圍的一部分,并且固此是所述第一頻率范圍的一個(gè)子范圍。所述信息是多層次的,能夠?qū)崿F(xiàn)根據(jù)位速率而對(duì)解碼質(zhì)量進(jìn)行的按比例調(diào)整。
權(quán)利要求
1.一種對(duì)包括至少兩個(gè)音頻聲道的多聲道音頻信號(hào)進(jìn)行編碼的方法,該方法包括產(chǎn)生一個(gè)單一聲道音頻信號(hào),并且將該單一聲道音頻信號(hào)編碼到位流中,作為經(jīng)編碼單一聲道音頻信號(hào),從所述至少兩個(gè)音頻聲道中產(chǎn)生信息,通過(guò)所述單一聲道音頻信號(hào)和所述信息能夠?qū)崿F(xiàn)以期望的音質(zhì)等級(jí)對(duì)所述多聲道音頻信號(hào)進(jìn)行還原,所述信息的產(chǎn)生包括,針對(duì)所述多聲道音頻信號(hào)的第一頻率范圍確定所述信息的第一部分,并且將所述信息的所述第一部分編碼到位流中,作為經(jīng)編碼的信息的第一部分,和針對(duì)所述多聲道音頻信號(hào)的第二頻率范圍確定所述信息的第二部分,所述第二頻率范圍是所述第一頻率范圍的一部分,并且將所述信息的所述第二部分編碼到位流中,作為經(jīng)編碼的信息第二部分。
2.一種對(duì)包括至少兩個(gè)音頻聲道的多聲道音頻信號(hào)進(jìn)行編碼的方法,該方法包括產(chǎn)生一個(gè)單一聲道音頻信號(hào);從所述至少兩個(gè)音頻聲道中產(chǎn)生信息,通過(guò)所述單一聲道音頻信號(hào)和所述信息能夠?qū)崿F(xiàn)以期望的音質(zhì)等級(jí)對(duì)所述多聲道音頻信號(hào)進(jìn)行還原,所述信息的產(chǎn)生包括,接收所述經(jīng)編碼的多聲道音頻信號(hào)的最大允許位速率,和如果包括所述單一聲道音頻信號(hào)和所述信息的第一部分的經(jīng)編碼多聲道音頻信號(hào)的位速率不高于所述最大允許位速率,則僅針對(duì)所述多聲道音頻信號(hào)的第一頻率范圍確定所述信息的第一部分。
3.按照權(quán)利要求1或2所述的編碼方法,其中所述單一聲道音頻信號(hào)是所述至少兩個(gè)音頻聲道的特定組合。
4.按照權(quán)利要求1所述的編碼方法,其特征在于,所述信息包括多個(gè)參數(shù)組,所述第一部分至少包括所述參數(shù)組的第一參數(shù)組,所述第二部分至少包括所述參數(shù)組的第二參數(shù)組,其中每個(gè)所述參數(shù)組與相應(yīng)的頻率范圍相關(guān)。
5.按照權(quán)利要求4所述的編碼方法,其特征在于,所述參數(shù)組包括至少一個(gè)定位提示。
6.按照權(quán)利要求5所述的編碼方法,其特征在于,所述至少一個(gè)定位提示是從下述各項(xiàng)中選擇出來(lái)的耳間電平差、耳間時(shí)間或相位差或者耳間交叉相關(guān)。
7.按照權(quán)利要求1或2所述的編碼方法,其特征在于,所述第一頻率范圍覆蓋了所述多聲道音頻信號(hào)的全部帶寬。
8.按照權(quán)利要求1所述的編碼方法,其特征在于,所述第一頻率范圍基本上覆蓋了所述多聲道音頻信號(hào)的全部帶寬,所述第二頻率范圍覆蓋了所述全部帶寬的一部分,并且在于,所述信息的第二部分的確定適用于針對(duì)所述第二頻率范圍和一組附加頻率范圍來(lái)確定參數(shù)組,所述第二頻率范圍和所述一組附加頻率范圍基本上覆蓋了全部帶寬,其中在所述一組附加頻率范圍中包括至少一個(gè)附加頻率范圍。
9.按照權(quán)利要求8所述的編碼方法,其特征在于,所述單一聲道音頻信號(hào)和所述信息的第一部分構(gòu)成了信息的基本層,該基本層總是存在于所述經(jīng)編碼的多聲道音頻信號(hào)中,并且在于,所述方法包括接收所述經(jīng)編碼多聲道音頻信號(hào)的最大允許位速率,所述信息的第二部分構(gòu)成了信息的增強(qiáng)層,該第二部分僅當(dāng)經(jīng)編碼的基本層和增強(qiáng)層的位速率不高于所述最大允許位速率時(shí)才進(jìn)行編碼。
10.按照權(quán)利要求4所述的編碼方法,其特征在于,經(jīng)編碼的信息的特定幀中的信息的第一部分的確定包括,確定所述特定幀中的參數(shù)組中的第一個(gè)參數(shù)組,并且根據(jù)在所述特定幀之前的幀的參數(shù)組中的第一個(gè)參數(shù)組對(duì)所述參數(shù)組中的第一個(gè)參數(shù)組進(jìn)行編碼。
11.按照權(quán)利要求8所述的編碼方法,其特征在于,經(jīng)編碼的信息的特定幀中的信息的第二部分的確定包括,確定所述特定幀中的第二部分的參數(shù)組,并且根據(jù)在所述特定幀之前的幀的參數(shù)組對(duì)所述特定幀中的第二部分的參數(shù)組進(jìn)行編碼。
12.按照權(quán)利要求8所述的編碼方法,其特征在于,經(jīng)編碼的信息的特定幀中的信息的第二部分的確定包括,確定所述特定幀中的第二部分的參數(shù)組,并且根據(jù)在所述特定幀之前的幀的參數(shù)組中的第一個(gè)參數(shù)組對(duì)所述特定幀中的第二部分的參數(shù)組進(jìn)行編碼。
13.按照權(quán)利要求10到12中任何一項(xiàng)所述的編碼方法,其特征在于,所述確定包括,計(jì)算所述特定幀與在所述特定幀之前的幀中的相應(yīng)參數(shù)之間的差值。
14.一種用于對(duì)包括至少兩個(gè)音頻聲道的多聲道音頻信號(hào)進(jìn)行編碼的編碼器,該編碼器包括用于產(chǎn)生一個(gè)單一聲道音頻信號(hào)的裝置,用于從所述至少兩個(gè)音頻聲道中產(chǎn)生信息的裝置,通過(guò)所述單一聲道音頻信號(hào)和所述信息能夠?qū)崿F(xiàn)以期望的音質(zhì)等級(jí)對(duì)所述多聲道音頻信號(hào)進(jìn)行還原,所述信息的產(chǎn)生包括,用于針對(duì)所述多聲道音頻信號(hào)的第一頻率范圍來(lái)確定所述信息的第一部分的裝置,和用于針對(duì)所述多聲道音頻信號(hào)的第二頻率范圍來(lái)確定所述信息的第二部分的裝置,所述第二頻率范圍是所述第一頻率范圍的一部分。
15.一種用于對(duì)包括至少兩個(gè)音頻聲道的多聲道音頻信號(hào)進(jìn)行編碼的編碼器,該編碼器包括用于產(chǎn)生一個(gè)單一聲道音頻信號(hào)的裝置,用于從所述至少兩個(gè)音頻聲道中產(chǎn)生信息的裝置,通過(guò)所述單一聲道音頻信號(hào)和所述信息能夠?qū)崿F(xiàn)以期望的音質(zhì)等級(jí)對(duì)所述多聲道音頻信號(hào)進(jìn)行還原,所述信息的產(chǎn)生包括,用于接收經(jīng)編碼的多聲道音頻信號(hào)的最大允許位速率的裝置,和如果包括所述單一聲道音頻信號(hào)和所述信息的第一部分的經(jīng)編碼多聲道音頻信號(hào)的位速率不高于所述最大允許位速率,則僅針對(duì)所述多聲道音頻信號(hào)的第一頻率范圍來(lái)確定所述信息的第一部分的裝置。
16.一種用于提供音頻信號(hào)的設(shè)備,該設(shè)備包括一個(gè)用于接收音頻信號(hào)的輸入端,一個(gè)如權(quán)利要求14或15所述的編碼器,用于對(duì)所述音頻信號(hào)進(jìn)行編碼,以獲得經(jīng)編碼的音頻信號(hào),和一個(gè)用于提供所述經(jīng)編碼的音頻信號(hào)的輸出端。
17.一種經(jīng)編碼的音頻信號(hào),包括一個(gè)單一聲道音頻信號(hào),來(lái)自所述至少兩個(gè)音頻聲道的信息,通過(guò)所述單一聲道音頻信號(hào)和所述信息能夠?qū)崿F(xiàn)以期望的音質(zhì)等級(jí)對(duì)所述多聲道音頻信號(hào)進(jìn)行還原,所述信息包括,針對(duì)所述多聲道音頻信號(hào)的第一頻率范圍的、所述信息的第一部分,和針對(duì)所述多聲道音頻信號(hào)的第二頻率范圍的、所述信息的第二部分,所述第二頻率范圍是所述第一頻率范圍的一部分。
18.一種存儲(chǔ)介質(zhì),在該存儲(chǔ)介質(zhì)上存儲(chǔ)著如權(quán)利要求17所述的經(jīng)編碼的音頻信號(hào)。
19.一種對(duì)如權(quán)利要求17中所述的那樣進(jìn)行了編碼的多聲道音頻信號(hào)進(jìn)行解碼的方法,該解碼方法包括獲得一個(gè)解碼的單一聲道音頻信號(hào),從這樣的信息中獲取解碼的信息該信息使得通過(guò)所述經(jīng)解碼的單一聲道音頻信號(hào)和所述解碼信息能夠還原所述多聲道音頻信號(hào),所述解碼信息包括所述信息的第一部分和所述信息的第二部分,和對(duì)所述單一聲道音頻信號(hào)應(yīng)用所述信息的第一部分或者所述信息的第一部分和第二部分,以產(chǎn)生解碼后的多聲道音頻信號(hào)。
20.一種用于對(duì)編碼音頻信號(hào)進(jìn)行解碼的解碼器,該解碼器包括用于獲得一個(gè)解碼的單一聲道音頻信號(hào)的裝置,用于從這樣的信息中獲取解碼信息的裝置該信息使得通過(guò)所述被解碼的單一聲道音頻信號(hào)和所述解碼信息能夠?qū)λ龆嗦暤酪纛l信號(hào)進(jìn)行還原,所述解碼信息包括所述信息的第一部分和所述信息的第二部分,和用于對(duì)所述單一聲道音頻信號(hào)應(yīng)用所述信息的第一部分或所述信息的第一部分和第二部分的裝置,以產(chǎn)生解碼的多聲道音頻信號(hào)。
21.一種用于提供解碼的音頻信號(hào)的設(shè)備,該設(shè)備包括一個(gè)用于接收編碼音頻信號(hào)的輸入端,一個(gè)如權(quán)利要求20中所述的解碼器,用于對(duì)所述編碼的音頻信號(hào)進(jìn)行解碼,以獲得多聲道輸出信號(hào),和一個(gè)用于提供或再現(xiàn)所述多聲道輸出信號(hào)的輸出端。
全文摘要
將多聲道音頻信號(hào)編碼成單耳音頻信號(hào)和能夠?qū)崿F(xiàn)多聲道音頻信號(hào)還原的信息,通過(guò)所述單耳信號(hào)和信息能夠還原所述多聲道音頻信號(hào)。所述信息是通過(guò)針對(duì)所述多聲道音頻信號(hào)的第一頻率范圍來(lái)確定該信息的第一部分、針對(duì)所述多聲道音頻信號(hào)的第二頻率范圍來(lái)確定所述信息的第二部分而產(chǎn)生的。所述第二頻率范圍是所述第一頻率范圍的一部分,并且因此是所述第一頻率范圍的一個(gè)子范圍。所述信息是多層信息,能夠針對(duì)位速率調(diào)整解碼質(zhì)量。
文檔編號(hào)G10L19/008GK1647156SQ03808977
公開日2005年7月27日 申請(qǐng)日期2003年4月22日 優(yōu)先權(quán)日2002年4月22日
發(fā)明者A·W·J·奧門, E·G·P·舒杰斯, D·J·布里巴爾特, S·L·J·D·E·范德帕 申請(qǐng)人:皇家飛利浦電子股份有限公司