專利名稱:音頻編碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及編碼多聲道音頻信號并且,更具體地涉及對至少包括第一信號分量、第二信號分量和第三信號分量的多聲道音頻信號進(jìn)行編碼。
音頻信號的參數(shù)描述在過去幾年期間、特別是在音頻編碼領(lǐng)域中引起了關(guān)注。已經(jīng)證明發(fā)射描述音頻信號的(量化的)參數(shù)僅僅要求很少的傳輸容量,而且允許在接收端解碼,其導(dǎo)致音頻信號在感性上沒有明顯地不同于原始信號。
歐洲專利申請EP1 107 232公開了一種針對包括左(L)和右(R)聲道信號的立體聲信號的參數(shù)編碼方案。該編碼方案產(chǎn)生一個(gè)立體聲信號的表示,其包括僅僅與L和R信號中的一個(gè)有關(guān)的信息和參數(shù)信息,基于該參數(shù)信息與L和R信號中的一個(gè)信號有關(guān)的上述信息一起,其他信號可以被恢復(fù)。
然而,上述現(xiàn)有技術(shù)文件不涉及有效地對包含多于雙聲道的多聲道信號編碼的問題。
上述及其他問題通過對至少包括第一信號分量、第二信號分量和第三信號分量的多聲道音頻信號進(jìn)行編碼的方法來解決,該方法包括通過第一參數(shù)編碼器編碼第一和第二信號分量,產(chǎn)生第一編碼信號和第一組編碼參數(shù);通過第二參數(shù)編碼器編碼第一編碼信號和另一信號,產(chǎn)生第二編碼信號和第二組編碼參數(shù),其中另一信號至少源于第三信號分量;和至少通過至少來源于第二編碼信號產(chǎn)生的編碼信號、通過第一組編碼參數(shù)和通過第二組編碼參數(shù)表示該多聲道音頻信號。
因此,通過級聯(lián)多個(gè)參數(shù)編碼器、比如立體聲編碼器,針對多聲道音頻信號的高效編碼方案被提供。根據(jù)該級聯(lián)方案,第一參數(shù)編碼步驟的輸出作為輸入和另一輸入信號(例如,另一個(gè)第二參數(shù)編碼步驟的輸出)一起被饋送到隨后的第二編碼步驟。
因此,根據(jù)該發(fā)明,具有n>2個(gè)音頻聲道的多聲道信號可以作為單個(gè)編碼信號聲道和許多對應(yīng)于參數(shù)編碼器的編碼參數(shù)比特流來編碼,因此提供高的編碼效率。
在一個(gè)優(yōu)選實(shí)施例中的,多聲道音頻信號進(jìn)一步包括第四信號分量;該方法進(jìn)一步包括通過第三參數(shù)編碼器編碼第三和第四信號分量,產(chǎn)生另一信號和第三組編碼參數(shù);并且表示多聲道音頻信號的步驟包括至少通過至少來源于第二編碼信號產(chǎn)生的編碼信號,通過第一組編碼參數(shù)、通過第二組編碼參數(shù)、和通過第三組編碼參數(shù)表示該多聲道音頻信號的步驟。因此,到第二參數(shù)編碼器的另一輸入信號也是前一編碼器的輸出。
該術(shù)語參數(shù)編碼器涉及一種用于編碼至少兩個(gè)音頻聲道產(chǎn)生單個(gè)編碼音頻聲道和一組編碼參數(shù)的編碼器,所述一組編碼參數(shù)允許解碼器將編碼的音頻聲道解碼成兩個(gè)解碼音頻聲道。這樣的參數(shù)編碼方案的例子包括編碼立體聲信號作為主分量信號和相應(yīng)的旋轉(zhuǎn)角,將立體聲信號編碼變成組合信號和許多對應(yīng)于該立體聲信號的空間屬性的參數(shù)等等。然而,任何已知的適當(dāng)?shù)膮?shù)編碼方案可以被使用。第一和第二參數(shù)編碼模塊可以實(shí)施相同的或不同的參數(shù)編碼方案。
產(chǎn)生的編碼信號可能僅僅來源于第二編碼信號,即該編碼信號可能與第二編碼信號的變換相同或是該變換的結(jié)果??商鎿Q地,產(chǎn)生的編碼信號可能是來源于第二編碼信號和另一個(gè)信號的組合。例如,第二編碼信號可以用作對應(yīng)于另一個(gè)級聯(lián)的另一編碼模塊的輸入。
在音頻編碼的領(lǐng)域之內(nèi),包括左-前聲道、左-后聲道、右-前聲道、和右-后聲道的四聲道信號的編碼是特別相關(guān)的。根據(jù)本發(fā)明,這樣的信號可以通過三個(gè)參數(shù)編碼器的級聯(lián)鏈被有效地編碼第一編碼器編碼左-前和左-后聲道,產(chǎn)生組合的左聲道和相應(yīng)的編碼參數(shù)。第二編碼器編碼右-前和右-后聲道產(chǎn)生組合的右聲道和相應(yīng)的編碼參數(shù)。第三編碼器接收組合的右聲道和組合的左聲道并且產(chǎn)生單個(gè)編碼信號和相應(yīng)的第三組編碼參數(shù)。
此外,數(shù)字通用光盤(DVD)和超級音頻壓縮光盤片(SACD)的新興技術(shù)包括五音頻聲道四個(gè)如上所述的聲道和一個(gè)附加的中心通道。根據(jù)本發(fā)明,這樣的信號可以通過使用四個(gè)參數(shù)編碼器被有效地編碼三個(gè)編碼器在如上面四聲道例子的情況下編碼左和右聲道,并且第四編碼器接收上述級聯(lián)鏈的輸出信號和中心信號作為輸入并產(chǎn)生最終的編碼信號。
在另一個(gè)優(yōu)選實(shí)施例中,多聲道信號包括一個(gè)五聲道音頻信號,第一信號分量包括五聲道音頻信號的左-前聲道,第二信號分量包括五聲道音頻信號的左-后聲道,第三信號分量包括五聲道音頻信號的右-前聲道;第四信號分量包括五聲道音頻信號的右-后聲道;五聲道音頻信號進(jìn)一步包括中心信號;并且編碼第一編碼信號和另一信號的步驟進(jìn)一步包括將第一編碼信號和另一信號中的每一個(gè)與中心信號組合。因此,依據(jù)這個(gè)實(shí)施例,中心信號在將左和右聲道作為最終的編碼信號編碼之前與編碼的左聲道和編碼的右聲道組合。
本實(shí)施例的進(jìn)一步的優(yōu)點(diǎn)是提供僅僅利用三個(gè)立體聲編碼器有效地編碼五聲道信號。
本發(fā)明的進(jìn)一步的優(yōu)點(diǎn)是提供一個(gè)編碼方案,其允許接收端的解碼器適合于接收端可用的再現(xiàn)聲道的數(shù)目。
本發(fā)明可以以與包括如上文和下文中所述的方法、用于編碼和解碼的裝置、和另一產(chǎn)品裝置的方式不同的方式被實(shí)施,每種方式產(chǎn)生結(jié)合第一次提到的方法描述的一個(gè)或多個(gè)好處和優(yōu)點(diǎn),并且每種方式具有對應(yīng)于結(jié)合第一次提到的方法描述的優(yōu)選實(shí)施例的和在從屬權(quán)利要求中公開的一個(gè)或多個(gè)優(yōu)選實(shí)施例。
注意到如上文和下文中所述的方法的特征可以用軟件實(shí)施并且在數(shù)據(jù)處理系統(tǒng)或其他通過計(jì)算機(jī)可執(zhí)行指令的執(zhí)行引起的處理裝置中執(zhí)行。該指令可以是從存儲介質(zhì)或從另一個(gè)計(jì)算機(jī)經(jīng)由計(jì)算機(jī)網(wǎng)絡(luò)裝載在存儲器、比如RAM中的程序代碼裝置??商鎿Q地,所描述的特征可以通過硬接線的電路取代軟件或與軟件組合來實(shí)施。
本發(fā)明進(jìn)一步涉及解碼編碼的多聲道音頻信號的方法,該方法包括從編碼的多聲道音頻信號中獲得第一編碼信號、第一組編碼參數(shù)、和第二組編碼參數(shù);從第一編碼信號和第一組編碼參數(shù)中獲得第一和第二解碼信號,第二解碼信號表示多聲道信號的至少第一信號分量;并且從第一解碼信號和第二組編碼參數(shù)中獲得第三和第四解碼信號。
本發(fā)明進(jìn)一步涉及一種用于對至少包括第一信號分量、第二信號分量和第三信號分量的多聲道音頻信號進(jìn)行編碼的裝置,該裝置包括
適合于編碼第一和第二信號分量、產(chǎn)生第一編碼信號和第一組編碼參數(shù)的第一參數(shù)編碼器;適合于編碼第一編碼信號和另一信號、產(chǎn)生第二編碼信號和第二組編碼參數(shù)的第二參數(shù)編碼器,其中該另一信號至少源自于第三信號分量。
本發(fā)明進(jìn)一步涉及用于解碼編碼的多聲道音頻信號的裝置,該裝置包括用于從編碼的多聲道音頻信號中獲得第一編碼信號、第一組編碼參數(shù)、和第二組編碼參數(shù)的裝置;適合于從第一編碼信號和第一組編碼參數(shù)中獲得第一和第二解碼信號的第一解碼器,該第二解碼信號表示多聲道信號中的至少第一信號分量;和適合于從第一解碼信號和第二組編碼參數(shù)中獲得第三和第四解碼信號的第二解碼器。
本發(fā)明進(jìn)一步涉及一種用于提供編碼的音頻信號的設(shè)備,該設(shè)備包括用于接收多聲道音頻信號的單元;用于編碼如上文和在下文中所述用于編碼多聲道音頻信號的裝置;和用于提供該編碼音頻信號的輸出單元。
本發(fā)明進(jìn)一步涉及一種用于提供解碼的音頻信號的設(shè)備,該設(shè)備包括用于接收編碼音頻信號的輸入單元;用于解碼如上文和在下文中所述用于解碼編碼的音頻信號的裝置;和用于提供該解碼的音頻信號的輸出單元。
本發(fā)明進(jìn)一步涉及一種包括音頻信號以及第一和第二組參數(shù)的編碼的多聲道音頻信號,其中該音頻信號和第一組參數(shù)通過第一參數(shù)編碼器在輸入第一編碼信號和另一信號時(shí)產(chǎn)生,其中第一編碼信號和第二組參數(shù)通過第二參數(shù)編碼器在輸入多聲道信號的第一和第二信號分量時(shí)產(chǎn)生,并且其中另一信號源于該多聲道信號的至少第三信號分量。
本發(fā)明進(jìn)一步涉及一種具有在其上存儲這樣的編碼的音頻信號的存儲介質(zhì)。
本發(fā)明的這些及其他方面從下文中參考附圖描述的實(shí)施例中將變的明白清楚,其中
圖1示出了根據(jù)本發(fā)明的實(shí)施例用于傳送多聲道音頻信號的系統(tǒng)的示意圖;圖2示出了根據(jù)本發(fā)明的實(shí)施例用于編碼四聲道音頻信號的編碼器的方框圖;圖3示出了根據(jù)本發(fā)明的實(shí)施例用于解碼編碼的四聲道音頻信號的解碼器的方框圖;圖4示出了根據(jù)本發(fā)明的實(shí)施例用于編碼五聲道音頻信號的編碼器的方框圖;圖5示出了根據(jù)本發(fā)明的實(shí)施例用于解碼編碼的五聲道音頻信號的解碼器的方框圖;圖6示意性地說明了編碼模塊的第一個(gè)例子;圖7示意性地說明了編碼模塊的第二個(gè)例子;圖8示出了根據(jù)本發(fā)明的實(shí)施例用于編碼五聲道音頻信號的編碼器的方框圖;圖9示出了根據(jù)本發(fā)明的實(shí)施例用于解碼編碼的五聲道音頻信號的解碼器的方框圖;圖10示出了根據(jù)本發(fā)明的實(shí)施例,圖9的解碼器901的方框圖;并且圖11示意性地說明了圖10的實(shí)施例中用于確定加權(quán)因子的三個(gè)函數(shù)的函數(shù)形式的例子。
圖1示出了根據(jù)本發(fā)明的實(shí)施例用于傳送多聲道音頻信號的系統(tǒng)的示意圖。該系統(tǒng)包括用于產(chǎn)生編碼的四聲道信號的編碼設(shè)備101和用于將接收到的編碼信號解碼成四聲道信號的解碼設(shè)備105。編碼設(shè)備101和解碼設(shè)備105每個(gè)都可以是任何電子設(shè)備或這樣的設(shè)備的一部分。
這里,術(shù)語電子設(shè)備包括計(jì)算機(jī),比如固定的和便攜式的PC,固定的和便攜式無線電通信設(shè)備及其它手提式或便攜式設(shè)備、比如移動電話、傳呼機(jī)、音頻播放器、多媒體播放器、通信裝備(即電子管理器)、智能電話、個(gè)人數(shù)字助理(PDA)、手提式計(jì)算機(jī)等等。注意到編碼設(shè)備101和解碼設(shè)備可以在一個(gè)電子設(shè)備中被組合,其中音頻信號被存儲在用于稍后再現(xiàn)的計(jì)算機(jī)可讀的介質(zhì)上。
編碼設(shè)備101包括用于接收多聲道信號的輸入單元111,用于編碼四聲道音頻信號的編碼器102,該四聲道信號包括左-前信號分量LF、左-后信號分量LR、右-前信號分量RF、和右-后信號分量RR。該編碼器102經(jīng)由輸入單元111接收四個(gè)信號分量并且產(chǎn)生編碼信號T。四聲道信號可以來源于一組擴(kuò)音器,比如經(jīng)由另一電子設(shè)備、諸如混合設(shè)備等等。該信號可以進(jìn)一步作為來自另一個(gè)音頻播放器的輸出被接收,如同無線電信號通過空氣接收,或通過任何其他的合適的裝置被接收。根據(jù)本發(fā)明的這樣的編碼器的優(yōu)選實(shí)施例將描述如下。
根據(jù)一個(gè)實(shí)施例,編碼器102被連接到發(fā)射機(jī)103上,用于經(jīng)由通信聲道109將編碼信號T發(fā)射給解碼設(shè)備105。發(fā)射機(jī)103包括適用于允許比如經(jīng)由有線或無線數(shù)據(jù)鏈路109進(jìn)行數(shù)據(jù)通信的電路。這樣的發(fā)射機(jī)的例子包括網(wǎng)絡(luò)接口、網(wǎng)卡、無線電發(fā)射機(jī)、用于其他適當(dāng)?shù)碾姶判盘柕陌l(fā)射機(jī),諸如用于例如經(jīng)由IrDa端口、基于無線電的通信、例如經(jīng)由藍(lán)牙收發(fā)信機(jī)發(fā)射紅外光的LED等等。合適的發(fā)射機(jī)的另一例子包括電纜調(diào)制解調(diào)器、電話調(diào)制解調(diào)器、綜合服務(wù)數(shù)字網(wǎng)(ISDN)適配器、數(shù)字用戶線路(DSL)適配器、衛(wèi)星收發(fā)信機(jī)、以太網(wǎng)適配器等等。相應(yīng)地,通信通道109可以是任何適合的有線或無線數(shù)據(jù)鏈路,例如基于分組的通信網(wǎng)絡(luò)(比如因特網(wǎng)或另一個(gè)TCP/IP網(wǎng)絡(luò))、短程通信鏈路(比如紅外線鏈路)、藍(lán)牙連接或另一個(gè)基于無線電的鏈路。
通信通道的另一個(gè)例子包括計(jì)算機(jī)網(wǎng)絡(luò)和無線電信網(wǎng),比如蜂窩數(shù)字分組數(shù)據(jù)(CDPD)網(wǎng)絡(luò)、全球移動系統(tǒng)(GSM)網(wǎng)絡(luò)、碼分多路存取(CDMA)網(wǎng)絡(luò)、時(shí)分多路存取網(wǎng)絡(luò)(TDMA)、通用分組無線業(yè)務(wù)(GPRS)網(wǎng)絡(luò)、第三代網(wǎng)絡(luò)(諸如UMTS網(wǎng)絡(luò))等等。
可替換地或附加地,編碼設(shè)備可以包括一個(gè)或多個(gè)用于傳送編碼信號T到解碼設(shè)備105的其他接口104。這樣的接口的例子包括用于在計(jì)算機(jī)可讀介質(zhì)110上儲存數(shù)據(jù)的磁盤驅(qū)動器,比如軟盤驅(qū)動器、讀/寫CD-ROM驅(qū)動器、DVD驅(qū)動器等等。其他的例子包括存儲卡插槽、磁卡讀/寫器、用于存取智能卡的接口等等。
相應(yīng)地,解碼設(shè)備105包括一個(gè)相應(yīng)的接收機(jī)108,用于接收由發(fā)射機(jī)發(fā)射的信號,和/或另一個(gè)接口106,用于接收經(jīng)由接口104和計(jì)算機(jī)可讀介質(zhì)110傳送的編碼信號。解碼設(shè)備進(jìn)一步包括解碼器107,其接收接收到的信號T并且將該信號T解碼成解碼的四聲道信號的相應(yīng)的分量LF′、LR′、RF’和RR′。將在下面描述根據(jù)本發(fā)明的這樣的解碼器的優(yōu)選實(shí)施例。該解碼設(shè)備進(jìn)一步包括一個(gè)輸出單元112,用于輸出解碼信號,該解碼信號可以接著經(jīng)由一組四個(gè)揚(yáng)聲器被饋送給用于再現(xiàn)的音頻播放器等等。
圖2示出了根據(jù)本發(fā)明的實(shí)施例用于編碼四聲道音頻信號的編碼器的方框圖。該編碼器接收四聲道音頻信號作為輸入,其中四個(gè)要被編碼的輸入聲道是指定的左-前(LF)、右-前(RF)、左-后(LR)、和右-后(RR),對應(yīng)于四聲道音頻系統(tǒng)的相應(yīng)的揚(yáng)聲器。該編碼器包括參數(shù)編碼模塊201、202、和203。編碼模塊202從與相應(yīng)的參數(shù)比特流P2相結(jié)合的兩個(gè)左側(cè)揚(yáng)聲器信號LF和LR中形成單個(gè)音頻聲道L。同樣地,該編碼模塊從與相應(yīng)的參數(shù)比特流P3相結(jié)合的兩個(gè)右側(cè)揚(yáng)聲器信號RF和RR中形成單個(gè)音頻聲道R。
接著,編碼模塊201分別從總的-左側(cè)和總的-右側(cè)信號L和R中產(chǎn)生一個(gè)寬帶音頻信號T。此外,這個(gè)合并過程產(chǎn)生第三參數(shù)比特流P1,第三參數(shù)比特流P1描述了在總的-左聲道和總的-右聲道之間的空間屬性。
該編碼器進(jìn)一步包括合成電路206,該合成電路206例如根據(jù)MPEG(比如MPEG I層3(MP3))、根據(jù)正弦編碼(SSC)、或另一個(gè)適合的編碼方案或其組合來執(zhí)行信號T的適當(dāng)?shù)木幋a。合成電路206進(jìn)一步執(zhí)行成幀、比特率配置、和無損耗編碼,產(chǎn)生要被傳送的組合信號207??商鎿Q地,合成電路206可以提供音頻信號T和比特流作為兩個(gè)或多個(gè)分離信號、作為多路復(fù)用信號等等。
因此,圖2的編碼器產(chǎn)生包括要被傳送到接收機(jī)和/或存儲在存儲介質(zhì)上和/或等等的一個(gè)寬帶音頻信號T和三個(gè)參數(shù)比特流P1、P2、和P3的輸出信號。注意到,即使該例子圖2使用4個(gè)音頻聲道,使用不同數(shù)量的音頻聲道的類似的方法都能被使用。
可以理解,可替換地,編碼器202可以編碼信號LR和RR,以產(chǎn)生總的后側(cè)信號,而編碼器203可以編碼信號LF和RF以產(chǎn)生總的前側(cè)信號。接著,總的前側(cè)和總的后側(cè)信號通過另一編碼器被組合。通過那個(gè)編碼器產(chǎn)生的參數(shù)可以用于2D參數(shù)表示,即來自這個(gè)編碼器的參數(shù)可以被用作整體參數(shù),以針對兩個(gè)左右聲道從后聲道中解碼前聲道。圖3示出了根據(jù)本發(fā)明的實(shí)施例用于解碼編碼的四聲道音頻信號的解碼器的方框圖。該解碼器包括電路306,用于從接收到的信號307中提取編碼的信號T和參數(shù)流P1、P2、和P3,即電路306執(zhí)行圖2的組合器206的逆操作。
解碼器進(jìn)一步包括分別對應(yīng)于編碼模塊201、202、和203的參數(shù)解碼模塊301、302、和303。結(jié)合圖2描述的級聯(lián)編碼過程在解碼器中被反向解碼器接收寬帶音頻信號T和三個(gè)參數(shù)比特流P1、P2、和P3。首先,解碼模塊301使用適當(dāng)?shù)膮?shù)P1從單一的輸入音頻信號T中分別合成總的-左側(cè)和總的-右側(cè)信號L和R。如果當(dāng)前的終端用戶僅僅具有兩個(gè)揚(yáng)聲器,解碼過程在這里結(jié)束。
如果終端用戶具有4個(gè)擴(kuò)音器,附加的解碼步驟被執(zhí)行解碼器302接收總的-左側(cè)信號L和參數(shù)比特流P2并且分別從該總的-左側(cè)信號L中合成左-前和左-后信號LF和LR。
同樣地,解碼器303接收總的-右側(cè)信號R和參數(shù)比特流P3并且分別從總的-右側(cè)信號R中合成右-前和右-后信號RF和RR。
在一個(gè)實(shí)施例中,相同的參數(shù)可以用于解碼器302和303,因此進(jìn)一步地減少發(fā)射多聲道信號需要的帶寬,因?yàn)閮H僅參數(shù)比特流P2和P3(或其組合)中的一個(gè)需要從編碼器發(fā)射到解碼器。在這個(gè)實(shí)施例中,饋送到解碼器301的參數(shù)P1確定左-右三維聲映象(image),而進(jìn)入解碼器302和303的參數(shù)確定前-后面的空間映象。
圖4示出了根據(jù)本發(fā)明的實(shí)施例用于編碼五聲道音頻信號的編碼器的方框圖。該編碼器包括編碼模塊401、402、403、和404。該編碼器接收五聲道音頻信號作為輸入,其中該五個(gè)要被編碼的輸入聲道是指定的左-前(LF)、右-前(RF)、左-后(LR)、右-后(RR)、和中心(C),對應(yīng)于五聲道音頻系統(tǒng)的相應(yīng)的揚(yáng)聲器。
編碼模塊402和403分別從相應(yīng)的輸入信號LF、LR和RF、RR中分別產(chǎn)生總的-左側(cè)和總的-右側(cè)信號L和R并分別產(chǎn)生相應(yīng)的比特流P2和P3。
接著,編碼模塊401分別從總的-左側(cè)和總的-右側(cè)信號L和R中產(chǎn)生音頻信號S和相應(yīng)的比特流P1。因此,編碼模塊401、402、和403對應(yīng)于圖2的編碼模塊201、202、和203。
圖4的編碼器包括包含接收編碼器401的輸出信號S和中心信號C的編碼模塊404的附加的級聯(lián)。編碼模塊404產(chǎn)生寬帶音頻信號T和表示音頻信號中間側(cè)特征的參數(shù)比特流。
編碼器進(jìn)一步包括產(chǎn)生輸出信號407的合成電路406,如結(jié)合圖2中的電路206描述的那樣。因此,圖4的編碼器產(chǎn)生包括要被傳送到接收機(jī)和/或存儲在存儲介質(zhì)上和/或等等的一個(gè)寬帶音頻信號T和四個(gè)參數(shù)比特流P1、P2、P3、和P4的輸出信號407。
圖5示出了根據(jù)本發(fā)明的實(shí)施例用于解碼編碼的五聲道音頻信號的解碼器的方框圖。該解碼器包括用于從接收到的信號507中提取所編碼的信號T和參數(shù)流P1、P2、P3、和P4的電路506,即電路506執(zhí)行圖4的合成器406的逆操作。
解碼器進(jìn)一步包括分別對應(yīng)于編碼模塊401、402、403、和404的參數(shù)解碼模塊501、502、503、和504,結(jié)合圖4描述的級聯(lián)編碼過程在解碼器中被反向解碼器接收寬帶音頻信號T和三個(gè)參數(shù)比特流P1、P2、P3、和P4。首先,解碼模塊504使用參數(shù)P4合成總的邊側(cè)信號S和邊側(cè)信號C。
接著,解碼器501、502、和503從總的邊側(cè)信號S和參數(shù)比特流P1、P2、和P3中分別合成左-前、左-后、右-前、和右-后信號LF、LR、RF、和RR,就像結(jié)合圖3的解碼器所描述的那樣。
可以理解,可替換地,五聲道音頻發(fā)射可以通過發(fā)射兩個(gè)與三個(gè)參數(shù)比特流相結(jié)合的音頻聲道實(shí)現(xiàn),比如通過發(fā)射如結(jié)合圖2和3描述的編碼的四-聲道信號和一個(gè)附加的單聲道實(shí)現(xiàn)。
圖6示意性地說明了參數(shù)編碼模塊的第一個(gè)例子。該裝置接收具有兩個(gè)信號分量L和R的音頻信號。例如,這些信號分量可以是多聲道信號的輸入信號分量中的兩個(gè),比如LF和LR信號分量或四聲道信號的RF和RR信號分量,或分別由圖4中的編碼器402和403產(chǎn)生的編碼的總的-左側(cè)和總的-右側(cè)信號。參數(shù)編碼模塊包括電路601,用于在L-R空間中執(zhí)行該輸入信號旋轉(zhuǎn)α角度,根據(jù)變換y=Lcosα+Rsinα=wLL+wRRr=-Lsinα+Rcosα=-wRL+wLR,
產(chǎn)生旋轉(zhuǎn)的信號分量y和r,其中wL=cosα并且wR=sinα被稱為加權(quán)因子。
優(yōu)選地,角度α被確定,使得它對應(yīng)于高信號變化的方向。最大信號變化、即主分量的方向可以通過主分量分析被估計(jì),使得旋轉(zhuǎn)的y分量對應(yīng)于包括大部分信號能量的主分量信號,并且r是殘留信號。相應(yīng)地,圖6的編碼模塊進(jìn)一步包括電路602,其例如通過執(zhí)行輸入信號樣值的主分量分析(PCA)確定角度α或、可替換地加權(quán)因子wL和wR。
在一個(gè)實(shí)施例中,圖6的編碼模塊輸出主分量信號y和旋轉(zhuǎn)參數(shù)α或wL和wR中的一個(gè)。在另一個(gè)實(shí)施例中,參數(shù)編碼器可以確定自適應(yīng)線性濾波器的濾波器參數(shù),使得當(dāng)主分量信號y作為輸入被饋送到該濾波器時(shí),該自適應(yīng)濾波器產(chǎn)生殘留信號r的估計(jì)。根據(jù)這個(gè)實(shí)施例,該輸入信號被編碼作為主分量信號y、旋轉(zhuǎn)參數(shù)和一組濾波器參數(shù),因此允許在接收機(jī)的解碼器從接收到的主分量信號y中預(yù)測殘留信號r,并且反向旋轉(zhuǎn)信號變成L和R方向(參見,例如在2002年4月10日提交的編號為02076410.6的歐洲專利申請,)。
圖7示意性地說明了編碼模塊的第二個(gè)例子。圖7的編碼模塊通過指定耳間的電平差、耳間的時(shí)間(或相位)差異、和最大相關(guān)作為時(shí)間和頻率函數(shù)描述了多聲道音頻信號的空間屬性,如同在2002年4月22日提交的歐洲專利申請no.02076588.9中描述的那樣。編碼模塊接收立體聲信號的L和R分量作為輸入。最初,分別通過時(shí)間/頻率限幅電路702和703,R和L分量例如通過由變換操作跟隨的時(shí)間-加窗來分成幾個(gè)時(shí)間/頻率插槽。
接著,在分析電路704中,對于每個(gè)時(shí)間/頻率插槽,輸入信號的下列屬性被分析耳間的電平差、或ILD,通過來自兩個(gè)輸入的對應(yīng)的帶寬有限信號的相對電平來定義,該耳間的時(shí)間(或相位)差(ITD或IPD),由對應(yīng)于耳間的互相關(guān)函數(shù)中的峰值的耳間的延遲(或相移)來定義,和不能由ITD或ILD說明的波形的(不)相似性,其可以由互相關(guān)函數(shù)最大值(即,在最大峰值位置的互相關(guān)函數(shù)值)參數(shù)化。
如上所述的三個(gè)參數(shù)隨著時(shí)間變化;然而,因?yàn)橐阎獌啥穆犛X系統(tǒng)在其處理中是非常緩慢的,所以這些屬性的更新速度是相當(dāng)?shù)偷?典型地,數(shù)十毫秒)。
分析電路704進(jìn)一步產(chǎn)生包括左側(cè)和右側(cè)信號的組合的總和(或主導(dǎo))信號S。因此,L和R信號被作為總和信號S和一組參數(shù)P作為頻率和時(shí)間的函數(shù)來編碼,該參數(shù)P包括ILD、ITD/IPD、和互相關(guān)函數(shù)的最大值。
圖8示出了根據(jù)本發(fā)明的實(shí)施例用于編碼五聲道音頻信號的編碼器的方框圖。該編碼器包括編碼模塊801、802、和803。編碼器接收五聲道音頻信號作為輸入,其中該五個(gè)要被編碼的輸入聲道是指定的左-前(LF)、右-前(RF)、左-后(LR)、右-后(RR)、和邊側(cè)(C),對應(yīng)于五聲道音頻系統(tǒng)的相應(yīng)的揚(yáng)聲器。
編碼模塊802和803分別從相應(yīng)的輸入信號LF、LR和RF、RR中分別產(chǎn)生總的-左側(cè)和總的-右側(cè)信號L和R并分別產(chǎn)生相應(yīng)的比特流P2和P3。
接著,編碼模塊801分別從編碼模塊802和803中接收的總的-左側(cè)和總的-右側(cè)信號中產(chǎn)生音頻信號T和相應(yīng)的比特流P1。因此,編碼模塊801、802、和803對應(yīng)于圖2的編碼模塊201、202、和203。
然而,和先前的實(shí)施例相比,邊側(cè)信號C分別與由編碼器802和803產(chǎn)生的兩個(gè)總的-左側(cè)和總的-右側(cè)信號L和R結(jié)合。圖8的編碼器包括加法電路804,用于將邊側(cè)信號加到每一總的-左側(cè)和總的-右側(cè)信號L和R上,分別產(chǎn)生組合信號L’和R’,該組合信號被饋送給編碼模塊801。編碼器進(jìn)一步包括用于產(chǎn)生最終輸出信號807的合成電路806,如結(jié)合圖2中的電路206描述的那樣。
這個(gè)實(shí)施例的優(yōu)點(diǎn)是提供編碼五聲道音頻的更節(jié)約成本的方法。
圖9示出了根據(jù)本發(fā)明的實(shí)施例用于解碼編碼的五聲道音頻信號的解碼器的方框圖。圖9的解碼器適合于解碼由圖8的編碼器編碼的信號。該解碼器包括用于從接收到的信號907中提取編碼信號T和參數(shù)流P1、P2和P3的電路906,即電路906執(zhí)行圖8的組合器806的逆操作。
該解碼器進(jìn)一步包括解碼模塊901、902、和903。該編碼模塊901接收編碼的音頻信號T和相應(yīng)的參數(shù)組P1。最初,解碼模塊901分析發(fā)射的參數(shù)P1。如果參數(shù)P1指出信號是一個(gè)單信號,解碼器輸出接收到的信號作為邊側(cè)信號。因此,在這種情況下,該信號被饋送到邊側(cè)揚(yáng)聲器并且沒有信號被饋送到解碼器901的左和右聲道輸出L和R。
如果所發(fā)射的參數(shù)P1指出信號是立體聲,則信號通過將信號分配到左輸出和右輸出而被解碼。
用于檢測單聲或立體聲內(nèi)容的方法取決于精確的編碼器結(jié)構(gòu)和參數(shù)比特流。例如,在使用結(jié)合圖7描述的參數(shù)編碼空間立體聲的實(shí)施例中,ITD、ILD和相關(guān)參數(shù)確定作為頻率的函數(shù)的空間信號屬性。因此,對于每個(gè)頻帶,如果ITD和ILD接近零、比如小于預(yù)定常數(shù),并且如果該相關(guān)性接近+1,即如果1減該相關(guān)性的差小于預(yù)定的常數(shù)、比如小于0.1,相應(yīng)的帶寬有限信號被饋送到中心揚(yáng)聲器。例如,對于ITD預(yù)定的常數(shù)可以選擇為50-100微秒的數(shù)量級,并且對于ILD預(yù)定的常數(shù)可以選擇為比如1至3dB。對于所有的其他參數(shù)值,信號被分配在左和右輸出上。編碼模塊901的優(yōu)選實(shí)施例將結(jié)合圖10被描述。
如上所述,解碼模塊902和903解碼總的-右側(cè)和總的左側(cè)信號,分別產(chǎn)生左-前、左-后、右-前、和右-后信號分量LF、LR、RF、和RR。
圖10示出根據(jù)本發(fā)明的實(shí)施例的圖9的解碼器901的方框圖。編碼模塊901接收所編碼的音頻信號T和相應(yīng)的參數(shù)組P1。在解碼模塊901后的基本思想是只有當(dāng)空間參數(shù)表明輸出信號是單聲道(其指ILD=0,ITD=0,相關(guān)性=+1)時(shí),才將(特定頻帶的)輸入信號饋送至中心揚(yáng)聲器。對于空間參數(shù)的其他值,信號將使用參數(shù)解碼器被發(fā)送給左側(cè)和右側(cè)輸出。
然而,更期望的是依靠空間參數(shù)在中心輸出和左側(cè)和右側(cè)輸出的分配之間實(shí)現(xiàn)平滑轉(zhuǎn)換。因此,該解碼模塊包括電路1002,其接收參數(shù)P1并且計(jì)算加權(quán)函數(shù)wc和wlr。這里,wc代表要被發(fā)送給中心輸出的單聲道輸入信號的相對的量,而wlr表示根據(jù)空間參數(shù)要被解碼并發(fā)送給左側(cè)和右輸出對的輸入信號的相對量。在一個(gè)實(shí)施例中,在權(quán)重之間的關(guān)系由下列限制wcn+wlrn=1]]>設(shè)置。
在這里,n代表功率,其表明系統(tǒng)是否將保持整個(gè)振幅(n=1),保持功率的總量(n=2)或任何其他的整個(gè)信號電平量度。因此如果wc已知,則wlr可以根據(jù)上述等式獲得,反之亦然。
解碼模塊進(jìn)一步包括電路1003,其將在中心輸出C和輸入TLR之間的根據(jù)加權(quán)因子wc和wlr的輸入信號的每個(gè)次能帶劃分到參數(shù)解碼器1004。如上所述,參數(shù)解碼器解碼縮放(scaled)的信號TLR,分別產(chǎn)生總的-左側(cè)和總的-右側(cè)信號L和R。
優(yōu)選地,如果某一次能帶的ILD和ITD等于0并且如果相關(guān)性等于+1,則電路1002確定權(quán)重wc以致wc=1。對于參數(shù)的其他的值,wc應(yīng)向零減少。在一個(gè)實(shí)施例中,這個(gè)性能用下列方式獲得wc由三個(gè)函數(shù)P1、P2、P3的乘積組成。P1僅僅取決于次能帶的ILD值,P2僅僅取決于當(dāng)前的次能帶的ITD值,并且P3僅僅取決于那個(gè)次能帶的互相關(guān)性。這樣wc=P1(ILD)·P2(ITD)·P3(ρ)圖11a-c示意性地說明了圖10的實(shí)施例中用于確定加權(quán)因子的三個(gè)函數(shù)的函數(shù)形式的例子。
優(yōu)選地,函數(shù)P1,P2和P3的函數(shù)形式將滿足下列限制P1和P2對于零的ILD(分別地ITD)具有+1的最大值,并且對于更小或更大的值向零減少。P3在相關(guān)性為+1時(shí)具有最大值+1,并且對于較小的值,向零減少。圖11a-c分別地說明了函數(shù)P1、P2和P3的例子,其滿足上述條件。
注意到,可以使用用于在中心輸出C、左側(cè)輸出L、和右側(cè)輸出R之間分配的解碼信號T的可替換的方法。例如,如上所述,最初信號T可以使用參數(shù)P1被解碼為L和R信號。接著,在三個(gè)(左,中心,右)輸出上重新分配兩個(gè)輸入信號的算法可以被使用。因此,首先解碼器的左側(cè)和右側(cè)輸出信號使用任何已知的參數(shù)立體聲解碼器被計(jì)算,接著將信號重新分配(換算)成三個(gè)(左,右和中心)輸出。這樣的方法在如國際專利申請WO 02/07481中描寫的2至5聲道處理機(jī)技術(shù)中是已知的。
應(yīng)注意到上述裝置可以實(shí)施為通用的或?qū)S玫目删幊涛⑻幚砥?、?shù)字信號處理器(DSP)、專用集成電路(ASIC)、可編程邏輯陣列(PLA)、現(xiàn)場可編程門陣列(FPGA)、專用電子電路等等,或其組合。
應(yīng)注意到以上實(shí)施例說明而不是限制該發(fā)明,而且本領(lǐng)域的技術(shù)人員在不背離附加的權(quán)利要求范圍內(nèi)能設(shè)計(jì)許多可替換的實(shí)施例。
在權(quán)利要求中,任何位于括號內(nèi)的參考符號將不會被看作是限制該權(quán)利要求。詞″包括″不排除除了那些列在權(quán)利要求中的元件或步驟以外的元件或步驟的存在。元件前的詞″a″或″an″不排除存在多個(gè)這樣的元件。
本發(fā)明可以通過包括幾個(gè)不同的元件的硬件,和通過合適地被編程的計(jì)算機(jī)來實(shí)施。在列舉幾個(gè)裝置的設(shè)備權(quán)利要求中,這些裝置中的幾個(gè)通過同一個(gè)硬件項(xiàng)來實(shí)施。某些措施在互相不同的從屬的權(quán)利要求中被引用的唯一的事實(shí)不表明這些措施的組合不能有利地被使用。
權(quán)利要求
1.一種對至少包括第一信號分量、第二信號分量和第三信號分量的多聲道音頻信號編碼的方法,該方法包括通過第一參數(shù)編碼器編碼第一和第二信號分量,產(chǎn)生第一編碼信號和第一組編碼參數(shù);通過第二參數(shù)編碼器編碼第一編碼信號和另一信號,產(chǎn)生第二編碼信號和第二組編碼參數(shù),其中該另一信號至少源于第三信號分量;并且至少通過至少來源于第二編碼信號產(chǎn)生的編碼信號,通過第一組編碼參數(shù)和通過第二組編碼參數(shù)表示該多聲道音頻信號。
2.如權(quán)利要求1所述的方法,其中多聲道音頻信號進(jìn)一步包括第四信號分量;該方法進(jìn)一步包括通過第三參數(shù)編碼器編碼第三和第四信號分量,產(chǎn)生另一信號和第三組編碼參數(shù);并且表示該多聲道音頻信號的步驟包括至少通過至少來源于第二編碼信號產(chǎn)生的編碼信號、通過第一組編碼參數(shù)、通過第二組編碼參數(shù)、和通過第三組編碼參數(shù)表示該多聲道音頻信號的步驟。
3.一種如權(quán)利要求2所述的方法,其中所述多聲道信號包括四聲道音頻信號,第一信號分量包括該四聲道音頻信號的左-前聲道,第二信號分量包括該四聲道音頻信號的左-后聲道,第三信號分量包括該四聲道音頻信號的右-前聲道,并且第四信號分量包括該四聲道音頻信號的右-后聲道。
4.如權(quán)利要求2所述的方法,其中所述多聲道信號包括五聲道音頻信號,第一信號分量包括該五聲道音頻信號的左-前聲道,第二信號分量包括該五聲道音頻信號的左-后聲道,第三信號分量包括該五聲道音頻信號的右-前聲道,而第四信號分量包括該五聲道音頻信號的右-后聲道;該五聲道音頻信號進(jìn)一步包括中心信號;該方法進(jìn)一步包括通過第四參數(shù)編碼器編碼第二編碼信號和中心信號,產(chǎn)生第三編碼信號和第四組編碼參數(shù);以及表示該多聲道音頻信號的步驟包括至少通過第三編碼信號和通過第一、第二、第三和第四組編碼參數(shù)表示多聲道音頻信號。
5.如權(quán)利要求2所述的方法,其中所述多聲道信號包括五聲道音頻信號,第一信號分量包括該五聲道音頻信號的左-前聲道,第二信號分量包括該五聲道音頻信號的左-后聲道,第三信號分量包括該五聲道音頻信號的右-前聲道;第四信號分量包括該五聲道音頻信號的右-后聲道;該五聲道音頻信號進(jìn)一步包括中心信號;并且編碼第一編碼信號和另一信號的步驟進(jìn)一步包括將中心信號與第一編碼信號和另一信號的每一個(gè)組合在一起。
6.如權(quán)利要求2所述的方法,其中所述多聲道信號包括五聲道音頻信號,第一個(gè)信號分量包括該五聲道音頻信號的左-前聲道,第二信號分量包括該五聲道音頻信號的左-后聲道,第三信號分量包括該五聲道音頻信號的右-前聲道,第四信號分量包括該五聲道音頻信號的右-后聲道;該五聲道音頻信號進(jìn)一步包括中心信號;并且表示該多聲道音頻信號的步驟包括至少通過第二編碼信號、中心信號,和通過第一、第二、和第三組編碼參數(shù)表示該多聲道音頻信號的步驟。
7.一種解碼編碼的多聲道音頻信號的方法,該方法包括從編碼的多聲道音頻信號中獲得第一編碼信號、第一組編碼參數(shù)、和第二組編碼參數(shù);從第一編碼信號和第一組編碼參數(shù)中獲得第一和第二解碼信號,第二解碼信號表示多聲道信號的至少第一信號分量;并且從第一解碼信號和第二組編碼參數(shù)中獲得第三和第四解碼信號。
8.一種用于對至少包括第一信號分量、第二信號分量和第三信號分量的多聲道音頻信號編碼的裝置,該裝置包括適合于編碼第一和第二信號分量、產(chǎn)生第一編碼信號和第一組編碼參數(shù)的第一參數(shù)編碼器;適合于編碼第一編碼信號和另一信號,產(chǎn)生第二編碼信號和第二組編碼參數(shù)的第二參數(shù)編碼器,其中該另一信號至少源于第三信號分量。
9.如權(quán)利要求8所述的裝置,進(jìn)一步包括用于至少通過至少來源于第二編碼信號產(chǎn)生的編碼信號、通過第一組編碼參數(shù)和通過第二組編碼參數(shù)表示該多聲道音頻信號的裝置。
10.一種用于解碼編碼的多聲道音頻信號的裝置,該裝置包括用于從編碼的多聲道音頻信號中獲得第一編碼信號、第一組編碼參數(shù)、和第二組編碼參數(shù)的裝置;適合于從第一編碼信號和第一組編碼參數(shù)中獲得第一和第二解碼信號的第一解碼器,第二解碼信號表示多聲道信號的至少第一信號分量;和適合于從第一解碼信號和第二組編碼參數(shù)中獲得第三和第四解碼信號的第二解碼器。
11.一種用于提供編碼的音頻信號的設(shè)備,該設(shè)備包括用于接收多聲道音頻信號的單元;用于編碼如在權(quán)利要求8中要求的用于編碼多聲道音頻信號的裝置;以及用于提供編碼的音頻信號的輸出單元。
12.一種用于提供解碼的音頻信號的設(shè)備,該設(shè)備包括用于接收編碼的音頻信號的輸入單元;用于解碼如權(quán)利要求10要求的用于解碼編碼音頻信號的裝置;和用于提供該解碼的音頻信號的輸出單元。
13.一種包括音頻信號和第一及第二組參數(shù)的編碼的多聲道音頻信號,其中該音頻信號和第一組參數(shù)在輸入第一編碼信號和另一信號時(shí)由第一參數(shù)編碼器產(chǎn)生,其中第一編碼信號和第二組參數(shù)在輸入多聲道信號的第一和第二信號分量時(shí)由第二參數(shù)編碼器產(chǎn)生,并且其中該另一信號源于該多聲道信號的至少第三信號分量。
14.一種存儲介質(zhì),具有在其上存儲根據(jù)權(quán)利13的編碼的音頻信號。
全文摘要
一種對至少包括第一信號分量(LF)、第二信號分量(LR)和第三信號分量(RF)的多聲道音頻信號進(jìn)行編碼的方法。該方法包括步驟由第一參數(shù)編碼器(202)編碼第一和第二信號分量產(chǎn)生第一編碼信號(L)和第一組編碼參數(shù)(P2);由第二參數(shù)編碼器(201)編碼第一編碼信號和另一信號(R),產(chǎn)生第二編碼信號(T)和第二組編碼參數(shù)(P1),其中該另一信號至少源自于第三信號分量;并且至少由至少源于第二編碼信號產(chǎn)生的編碼信號(T),由第一組編碼參數(shù)和由第二組編碼參數(shù)表示該多聲道音頻信號。
文檔編號G10L19/008GK1669359SQ03816484
公開日2005年9月14日 申請日期2003年6月19日 優(yōu)先權(quán)日2002年7月12日
發(fā)明者D·J·布里巴亞爾特 申請人:皇家飛利浦電子股份有限公司