專利名稱:對多聲道音頻信號進(jìn)行編碼/解碼的系統(tǒng)、介質(zhì)和方法
技術(shù)領(lǐng)域:
本發(fā)明的實(shí)施例涉及音頻信號的編碼和/或解碼,更具體地講,涉及對多聲道音頻信號進(jìn)行編碼/解碼的系統(tǒng)和方法。
背景技術(shù):
一般音頻編碼的示例包括波形多聲道音頻編碼和參數(shù)多聲道音頻編碼。在波形多聲道音頻編碼中,可接收5音頻聲道信號,并輸出5音頻聲道信號。波形多聲道音頻編碼的示例包括MPEG-2 MC音頻編碼、AAC MC音頻編碼以及BSAC/AVS MC音頻編碼。MPEG-2 MC音頻編碼是以兩種類型的模式被執(zhí)行的,一種是對原始信號進(jìn)行操作的模式,另一種是對下混頻(downmix)的信號和其他獨(dú)立的信號進(jìn)行操作的模式,AAC MC音頻編碼是使用PCE和默認(rèn)設(shè)置對原始信號被執(zhí)行的,BSAC/AVS MC是使用channel_configuration_idx對原始信號執(zhí)行的比特分片算術(shù)音頻編碼(bit sliced arithmetic audio coding)。參數(shù)多聲道音頻編碼的示例包括將I個或2個輸入的聲道信號編碼為5個或6個聲道信號的MPEG環(huán)繞編碼。此外,MPEG環(huán)繞編碼基于量化矩陣擴(kuò)展(QMF,Quant MatrixExtension)、逆一輸入至兩輸出的解碼工具(R-0TT,a reverse one-input to two-outputdecoding tool)、逆兩輸入至三輸出的角軍石馬工具(a reverse two-input to three-outputdecoding tool, R-TTT)以及關(guān)于擴(kuò)展的信號的R-OTT樹。這里,作為示例,一輸入至兩輸出工具可以是獲得一個輸入并產(chǎn)生兩個輸出的工具。圖I示出這樣的MPEG環(huán)繞解碼器。在解碼器的接收器端有各種揚(yáng)聲器配置,例如,
1、2、3(前)/0(后),3/1,3/2以及5/2。因此,輸入的編碼的音頻流可被解碼為全部可用的音頻聲道信號,其中,可根據(jù)在解碼器的接收器端使用的揚(yáng)聲器配置選擇性地挑選所述全部可用的音頻聲道信號用于輸出。類似地,圖2示出用于將輸入的音頻聲道信號編碼為音頻比特流的相應(yīng)的編碼器以及用于對編碼的音頻聲道信號進(jìn)行解碼的解碼器。在MPEG環(huán)繞的情況下,編碼器對M個輸入的音頻聲道信號進(jìn)行編碼,并輸出N個音頻聲道信號作為音頻比特流,其中,M大于N。然后,解碼器可對N個編碼的音頻聲道信號進(jìn)行解碼,并輸出L個解碼的音頻聲道信號,其中,L大于或等于N,M大于或等于L。然而,在這樣的傳統(tǒng)解碼器中,通過將M個輸入的音頻聲道信號解碼(例如,當(dāng)M=N = L時)或通過將下混頻的M個輸入音頻聲道信號上混頻為N個音頻聲道信號并隨后對N個音頻聲道信號進(jìn)行解碼來直接產(chǎn)生L個音頻聲道信號。然而,難以在接收器基于實(shí)際已知類型的揚(yáng)聲器配置,將輸入的音頻聲道信號解碼為合適數(shù)量的聲道的音頻信號
發(fā)明內(nèi)容
技術(shù)問題本發(fā)明的實(shí)施例提供一種對多聲道音頻信號進(jìn)行編碼/解碼的系統(tǒng)、介質(zhì)和方法,通過該多聲道音頻信號解碼系統(tǒng)、介質(zhì)和方法,基于可選的解碼級別根據(jù)在解碼器的接收器端的揚(yáng)聲器配置的類型,將輸入的音頻聲道信號選擇性地解碼為復(fù)數(shù)數(shù)量的聲道的音頻信號。將在接下來的描述中部分闡述本發(fā)明另外的方面和/或優(yōu)點(diǎn),還有一部分通過描述將是清楚的,或者可以經(jīng)過本發(fā)明的實(shí)施而得知。技術(shù)方案為了實(shí)現(xiàn)至少上面的和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種多聲道音頻信號解碼系統(tǒng),所述多聲道音頻信號解碼系統(tǒng)包括解碼級別產(chǎn)生單元,產(chǎn)生解碼級別信息以控制將具有預(yù)定數(shù)量N的編碼的音頻聲道信號和空間信息的比特流解碼為數(shù)量L (其中,L ^ N)的音頻聲道信號的解碼級別,其中,所述空間信息包括相應(yīng)的聲道之間的幅值差 和/或相似性的信息;音頻解碼器,基于解碼級別信息通過不同級別的解碼對比特流進(jìn)行選擇性地解碼,并產(chǎn)生數(shù)量L的音頻聲道信號。為了實(shí)現(xiàn)至少上面的和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種多聲道音頻信號解碼方法,所述多聲道音頻信號解碼方法包括包括基于解碼級別信息對比特流進(jìn)行選擇性地解碼,以控制將具有預(yù)定數(shù)量N的編碼的音頻聲道信號和空間信息的比特流解碼為數(shù)量L的音頻聲道信號的解碼級別,其中,所述空間信息包括相應(yīng)的聲道之間的幅值差和/或相似性的信息。為了實(shí)現(xiàn)至少上面的和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種多聲道音頻信號解碼系統(tǒng),所述多聲道音頻信號解碼系統(tǒng)包括第一 OTT解碼器,將以包括相應(yīng)的編碼的單個音頻聲道信號的相應(yīng)的比特流形式的單個音頻聲道信號和空間信息解碼為兩個音頻聲道信號,其中,所述空間信息包括相應(yīng)的聲道之間的幅值差和/或相似性的信息;TTT解碼器,將所述兩個音頻聲道信號解碼為三個音頻聲道信號作為第一、第二和第三聲道信號;第二 OTT解碼器,將第一聲道信號解碼為第一復(fù)數(shù)個聲道信號;第三OTT解碼器,將第二聲道信號解碼為第二復(fù)數(shù)個聲道信號;第四OTT解碼器,將第三聲道信號解碼為第三復(fù)數(shù)個聲道信號。為了實(shí)現(xiàn)至少上面的和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種多聲道音頻信號解碼方法,所述多聲道音頻信號解碼方法包括第一 OTT解碼,將以包括相應(yīng)的編碼的單個音頻聲道信號的相應(yīng)的比特流形式的單個音頻聲道信號和空間信息解碼為兩個音頻聲道信號,其中,所述空間信息包括相應(yīng)的聲道之間的幅值差和/或相似性的信息;τττ解碼,將在第一 OTT解碼中獲得的兩個音頻聲道信號解碼為三個音頻聲道信號作為第一、第二和第三聲道信號;第二 OTT解碼,將第一聲道信號解碼為第一復(fù)數(shù)個聲道信號;第三OTT解碼,將第二聲道信號解碼為第二復(fù)數(shù)個聲道信號;第四OTT解碼,將第三聲道信號解碼為第三復(fù)數(shù)個聲道信號。為了實(shí)現(xiàn)至少上面的和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種多聲道音頻信號解碼系統(tǒng),所述多聲道音頻信號解碼系統(tǒng)包括=TTT解碼器,將以包括相應(yīng)的編碼的兩個音頻聲道信號的相應(yīng)的比特流形式的兩個音頻聲道信號和空間信息解碼為三個音頻聲道信號作為第一、第二和第三聲道信號,其中,所述空間信息包括相應(yīng)的聲道之間的幅值差和/或相似性的信息;第一 OTT解碼器,將第一聲道信號解碼為第一復(fù)數(shù)個聲道信號;第二 OTT解碼器,將第二聲道信號解碼為第二復(fù)數(shù)個聲道信號;第三OTT解碼器,將第三聲道信號解碼為第三復(fù)數(shù)個聲道信號;第四OTT解碼器,將由第一OTT解碼器解碼的第一復(fù)數(shù)個聲道信號之一解碼為第四復(fù)數(shù)個聲道信號;第五OTT解碼器,將由第二OTT解碼器輸出的第二復(fù)數(shù)個聲道信號中的一個聲道信號解碼為第五復(fù)數(shù)個聲道信號。為了實(shí)現(xiàn)至少上面的和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種多聲道音頻信號解碼方法,所述多聲道音頻信號解碼方法包括=TTT解碼,將以包括相應(yīng)的編碼的兩個音頻聲道信號的相應(yīng)的比特流形式的兩個音頻聲道信號和空間信息解碼為三個音頻聲道信號作為第一、第二和第三聲道信號,其中,所述空間信息包括相應(yīng)的聲道之間的幅值差和/或相似性的信息;第一 OTT解碼,將第一聲道信號解碼為第一復(fù)數(shù)個聲道信號;第二OTT解碼,將第二聲道信號解碼為第二復(fù)數(shù)個聲道信號;第三OTT解碼,將第三聲道信號解碼為第三復(fù)數(shù)個聲道信號;第四OTT解碼,將在第一 OTT解碼輸出的第一復(fù)數(shù)個聲道信號之
一解碼為第四復(fù)數(shù)個聲道信號;第五OTT解碼,將在第二OTT解碼中輸出的第二復(fù)數(shù)個聲道信號中的一個聲道信號解碼為第五復(fù)數(shù)個聲道信號。為了實(shí)現(xiàn)至少上面的和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種多聲道音頻信號解碼系統(tǒng),所述多聲道音頻信號解碼系統(tǒng)包括=TTT解碼器,將以包括相應(yīng)的編碼的兩個音頻聲道信號的相應(yīng)的比特流形式的兩個音頻聲道信號和空間信息解碼為三個音頻聲道信號作為第一、第二和第三聲道信號,其中,所述空間信息包括相應(yīng)的聲道之間的幅值差和/或相似性的信息;第一 OTT解碼器,將第一聲道信號解碼為第一復(fù)數(shù)個聲道信號;第二 OTT解碼器,將第二聲道信號解碼為第二復(fù)數(shù)個聲道信號;第三OTT解碼器,將第三聲道信號解碼為第三復(fù)數(shù)個聲道信號;第四OTT解碼器,將第三OTT解碼器的第三復(fù)數(shù)個聲道信號中的一個聲道信號解碼為第四復(fù)數(shù)個聲道信號;第五OTT解碼器,將第四OTT解碼器的第四復(fù)數(shù)個聲道信號中的一個聲道信號解碼為第五復(fù)數(shù)個聲道信號。為了實(shí)現(xiàn)至少上面的和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種多聲道音頻信號解碼方法,所述多聲道音頻信號解碼方法包括=TTT解碼,將以包括相應(yīng)的編碼的兩個音頻聲道信號的相應(yīng)的比特流形式的兩個音頻聲道信號和空間信息解碼為三個音頻聲道信號作為第一、第二和第三聲道信號,其中,所述空間信息包括相應(yīng)的聲道之間的幅值差和/或相似性的信息;第一 OTT解碼,將第一聲道信號解碼為第一復(fù)數(shù)個聲道信號;第二OTT解碼,將第二聲道信號解碼為第二復(fù)數(shù)個聲道信號;第三OTT解碼,將第三聲道信號解碼為第三復(fù)數(shù)個聲道信號;第四OTT解碼,將在第三OTT解碼中輸出的第三復(fù)數(shù)個聲道信號中的一個聲道信號解碼為第四復(fù)數(shù)個聲道信號;第五OTT解碼器,將在第四OTT解碼中輸出的第四復(fù)數(shù)個聲道信號中的一個聲道信號解碼為第五復(fù)數(shù)個聲道信號。為了實(shí)現(xiàn)至少上面的和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種多聲道音頻信號解碼系統(tǒng),所述多聲道音頻信號解碼系統(tǒng)包括第一 OTT解碼器,對包括作為第一和第二音頻聲道信號的兩個編碼的音頻聲道信號和空間信息的比特流進(jìn)行解碼,以便將第一音頻聲道信號解碼為第一復(fù)數(shù)個音頻聲道信號,其中,所述空間信息包括相應(yīng)的聲道之間的幅值差和/或相似性的信息;第二 OTT解碼器,將第二音頻聲道信號解碼為第二復(fù)數(shù)個聲道信號作為第一和第二聲道信號;第三OTT解碼器,將由第一 OTT解碼器輸出的第一復(fù)數(shù)個音頻聲道信號中的一個音頻聲道信號解碼為第三復(fù)數(shù)個聲道信號;第四OTT解碼器,將第一聲道信號解碼為第四復(fù)數(shù)個聲道信號;第五OTT解碼器,將第二聲道信號解碼為第五復(fù)數(shù)個聲道信號;第六OTT解碼器,將第一OTT解碼器輸出的第一復(fù)數(shù)個音頻聲道信號中的另一音頻聲道信號解碼為第六復(fù)數(shù)個聲道信號。為了實(shí)現(xiàn)至少上面的和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種多聲道音頻信號解碼方法,所述多聲道音頻信號解碼方法包括第一 OTT解碼,將包括作為第一音頻聲道信號和第二音頻聲道信號的兩個編碼的音頻聲道信號和空間信息的比特流進(jìn)行解碼,以便將第一音頻聲道信號解碼為第一復(fù)數(shù)個音頻聲道信號,其中,所述空間信息包括相應(yīng)的聲道之間的幅值差和/或相似性的信息;第二 OTT解碼,將第二音頻聲道信號解碼為第二復(fù)數(shù)個聲道信號作為第一和第二聲道信號;第三OTT解碼,將在第一 OTT解碼中獲得的第一復(fù)數(shù)個音頻聲道信號中的一個音頻聲道信號解碼為第三復(fù)數(shù)個聲道信號;第四OTT解碼,將第一聲道信號解碼為第四復(fù)數(shù)個聲道信號;第五OTT解碼,將第二聲道信號解碼為第五復(fù)數(shù)個聲道信號;第六OTT解碼,將在第一OTT解碼中獲得的第一復(fù)數(shù)個音頻聲道信號中的另一音頻聲道信號解碼為第六復(fù)數(shù)個聲道信號。為了實(shí)現(xiàn)至少上面的和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種多聲道音頻信號編碼系統(tǒng),所述多聲道音頻信號編碼系統(tǒng)包括第一 OTT編碼器,從左前音頻聲道(LF)信號和左環(huán)繞音頻聲道(LS)信號產(chǎn)生第一 OTT音頻聲道(L’)信號和第一 OTT參數(shù),其中,第一 OTT參數(shù)包括關(guān)于相應(yīng)的LF和LS聲道之間的幅值差和/或相似性的信息;第二OTT編碼器,從右前音頻聲道(RF)信號和右環(huán)繞音頻聲道(RS)信號產(chǎn)生第二 OTT音頻聲道(R’ )信號和第二 OTT參數(shù),其中,第二 OTT參數(shù)包括相應(yīng)的RF和RS聲道之間的幅值差和/或相似性的信息;第三OTT編碼器,從中音頻聲道(C)信號和低音音頻聲道(LFE)信號產(chǎn)生第三OTT音頻聲道C’信號和第三OTT參數(shù),其中,第三OTT參數(shù)包括相應(yīng)的C和LFE聲道之間的幅值差和/或相似性的信息;TTT編碼器,從分別由第一 OTT編碼器、第二 OTT編碼器和第三OTT編碼器輸出的L’、R’和C’聲道信號產(chǎn)生復(fù)數(shù)個TTT音頻聲道信號和TTT參數(shù),其中,所述TTT參數(shù)包括相應(yīng)的L’、R’和C’聲道之間的幅值差和/或相似性的信息;第四OTT編碼器,從由TTT編碼器輸出的復(fù)數(shù)個TTT音頻聲道信號產(chǎn)生第四OTT音頻聲道信號和第四OTT參數(shù),其中,第四OTT參數(shù)包括相應(yīng)的復(fù)數(shù)個TTT聲道之間的幅值差和/或相似性的信息;比特流產(chǎn)生單元,壓縮由第一至第四OTT編碼器產(chǎn)生的OTT參數(shù)、由TTT編碼器產(chǎn)生的TTT參數(shù)以及由第四OTT編碼器產(chǎn)生的第四OTT音頻聲道信號,以產(chǎn)生比特流。為了實(shí)現(xiàn)至少上面的和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種多聲道音頻信號編碼系統(tǒng),所述多聲道音頻信號編碼系統(tǒng)包括第一 OTT編碼器,從前左音頻聲道(FL)信號和前左中音頻聲道(FLC)信號產(chǎn)生第一 OTT音頻聲道(FL’ )信號和第一 OTT參數(shù),其中,第一 OTT參數(shù)包括相應(yīng)的FL和FLC聲道之間的幅值差和/或相似性的信息;第二OTT編碼器,從前右音頻聲道(FR)信號和前右中音頻聲道(FRC)信號產(chǎn)生第二 OTT音頻聲道FR’信號和第二 OTT參數(shù),其中,第二 OTT參數(shù)包括關(guān)于相應(yīng)的FR和FRC聲道之間的幅值差和/或相似性的信息;第三OTT編碼器,從由第一 OTT編碼器產(chǎn)生的音頻聲道(FL’)信號和后左音頻聲道(BL)信號產(chǎn)生第三OTT音頻聲道(L’)信號和第三OTT參數(shù),其中,第三OTT參數(shù)包括相應(yīng)的FL’和BL聲道之間的幅值差和/或相似性的信息;第四OTT編碼器,從由第二 OTT編碼器產(chǎn)生的音頻聲道(FR’ )信號和后右音頻聲道(BR)信號產(chǎn)生第四OTT音頻聲道(R’)信號和第四OTT參數(shù),其中,第四OTT參數(shù)包括相應(yīng)的FR’和BR聲道之間的幅值差和/或相似性的信息;第五OTT編碼器,從中音頻聲道(C)信號和低音音頻聲道LFE信號產(chǎn)生第五OTT音頻聲道(C’ )信號和第五OTT參數(shù),其中,第五OTT參數(shù)包括相應(yīng)的C和LFE聲道之間的幅值差和/或相似性的信息;TTT編碼器,從分別由第三OTT編碼器、第四OTT編碼器和第五OTT編碼器輸出的L’、R’和C’聲道信號產(chǎn)生復(fù)數(shù)個TTT音頻聲道信號和TTT參數(shù),其中,TTT參數(shù)包括相應(yīng)的L’、R’和C’聲道之間的幅值差和/或相似性的信息;比特流產(chǎn)生單元,壓縮由第一至 第五OTT編碼器以及TTT編碼器產(chǎn)生的參數(shù)以及由TTT編碼器產(chǎn)生的復(fù)數(shù)個TTT音頻聲道信號,以產(chǎn)生比特流。為了實(shí)現(xiàn)至少上面的和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種多聲道音頻信號編碼系統(tǒng),所述多聲道音頻信號編碼系統(tǒng)包括第一 OTT編碼器,從前左中音頻聲道(FLC)信號和前右中音頻聲道(FRC)信號產(chǎn)生第一 OTT音頻聲道(FC’)信號和第一 OTT參數(shù),其中,第一 OTT參數(shù)包括相應(yīng)的FLC和FRC聲道之間的幅值差和/或相似性的信息;第二 OTT編碼器,從由第一 OTT編碼器輸出的音頻聲道(FC’ )信號和中音頻聲道(C)信號產(chǎn)生第二 OTT音頻聲道(C”)信號和第二 OTT參數(shù),其中,第二 OTT參數(shù)包括相應(yīng)的FC’和C聲道之間的幅值差和/或相似性的信息;第三OTT編碼器,從前左音頻聲道(FL)信號和后左音頻聲道(BL)信號產(chǎn)生第三OTT音頻聲道(L’)信號和第三OTT參數(shù),其中,第三OTT參數(shù)可包括相應(yīng)的FL和BL聲道之間的幅值差和/或相似性的信息;第四OTT編碼器,從音頻聲道(FR)信號和后右音頻聲道(BR)信號產(chǎn)生第四OTT音頻聲道(R’ )信號和第四OTT參數(shù),其中,第四OTT參數(shù)包括相應(yīng)的FR和BR聲道之間的幅值差和/或相似性的信息;第五OTT編碼器,從由第二 OTT編碼器輸出的音頻聲道(C”)信號和低音音頻聲道(LFE)信號產(chǎn)生第五OTT音頻聲道(C’)信號和第五OTT參數(shù),其中,第五OTT參數(shù)包括相應(yīng)的C”和LFE聲道之間的幅值差和/或相似性的信息;ΤΤΤ編碼器,從分別由第三OTT編碼器、第四OTT編碼器和第五OTT編碼器輸出的L’、R’和C’聲道信號產(chǎn)生復(fù)數(shù)個TTT音頻聲道信號和TTT參數(shù),其中,TTT參數(shù)包括L’、R’和C’聲道之間的幅值差和/或相似性的信息;比特流產(chǎn)生單元,壓縮由第一至第五OTT編碼器以及TTT編碼器產(chǎn)生的參數(shù)以及由TTT編碼器產(chǎn)生的復(fù)數(shù)個TTT音頻聲道信號,以產(chǎn)生比特流。為了實(shí)現(xiàn)至少上面的和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種多聲道音頻信號編碼系統(tǒng),所述多聲道音頻信號編碼系統(tǒng)包括第一 OTT編碼器,從前左中音頻聲道(FLC)信號和前右中音頻聲道(FRC)信號產(chǎn)生第一 OTT音頻聲道(C’ )信號和第一 OTT參數(shù),其中,第一 OTT參數(shù)包括相應(yīng)的FLC和FRC聲道之間的幅值差和/或相似性的信息;第二 OTT編碼器,從前左音頻聲道(FL)信號和后左音頻聲道(BL)信號產(chǎn)生第二 OTT音頻聲道(L’ )信號和第二 OTT參數(shù),其中,第二 OTT參數(shù)包括相應(yīng)的FL和BL聲道之間的幅值差和/或相似性的信息;第三OTT編碼器,從前右音頻聲道(FR)信號和后右音頻聲道(BR)信號產(chǎn)生第三OTT音頻聲道(R’)信號和第三OTT參數(shù),其中,第三OTT參數(shù)包括相應(yīng)的FR和BR聲道之間的幅值差和/或相似性的信息;第四OTT編碼器,從中音頻聲道(C)信號和低音音頻聲道(LFE)信號產(chǎn)生第四OTT音頻聲道(C”)信號和第四OTT參數(shù),其中,第四OTT參數(shù)包括相應(yīng)的C和LFE聲道之間的幅值差和/或相似性的信息;第五OTT編碼器,從由第二 OTT編碼器輸出的音頻聲道(L’ )信號和由第一 OTT編碼器輸出的音頻聲道(C’ )信號產(chǎn)生第五OTT音頻聲道信號和第五OTT參數(shù),其中,第五OTT參數(shù)包括相應(yīng)的L’和C’聲道之間的幅值差和/或相似性的信息;第六OTT編碼器,從由第三OTT編碼器輸出的音頻聲道(R’)信號和由第四OTT編碼器輸出的音頻聲道(C”)信號產(chǎn)生第六OTT音頻聲道信號和第六OTT參數(shù),其中,第六OTT參數(shù)包括相應(yīng)的R’和C”聲道之間的幅值差和/或相似性的信息;比特流產(chǎn)生單元,壓縮由第一至第六OTT編碼器產(chǎn)生的參數(shù)、由第五OTT編碼器產(chǎn)生的第五OTT音頻聲道信號以及由第六OTT編碼器產(chǎn)生的第六OTT音頻聲道信號,以產(chǎn)生比特流。為了實(shí)現(xiàn)至少上面的和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種多聲道音頻信號編碼方法,所述多聲道音頻信號編碼方法包括第一 OTT編碼,從左前音頻聲道(LF)信號和左環(huán)繞音頻聲道(LS)信號產(chǎn)生第一 OTT音頻聲道(L’)信號和第一 OTT參數(shù),其中,第一 OTT參數(shù)包括關(guān)于相應(yīng)的LF和LS聲道之間的幅值差和/或相似性的信息;第二 OTT編碼,從右前音頻聲道(RF)信號和右環(huán)繞音頻聲道(RS)信號產(chǎn)生第二 OTT音頻聲道(R’)信號和第二 OTT參數(shù),其中,第二 OTT參數(shù)包括相應(yīng)的RF和RS聲道之間的幅值差和/或相似性的信息;第三OTT編碼,從中音頻聲道(C)信號和低音音頻聲道(LFE)信號產(chǎn)生第三 OTT音頻聲道(C’ )信號和第三OTT參數(shù),其中,第三OTT參數(shù)包括相應(yīng)的C和LFE聲道之間的幅值差和/或相似性的信息;TTT編碼,從分別在第一 OTT編碼、第二 OTT編碼和第三OTT編碼中產(chǎn)生的L’、R’和C’聲道信號產(chǎn)生TTT參數(shù)和復(fù)數(shù)個TTT音頻聲道信號,其中,TTT參數(shù)包括相應(yīng)的L’、R’和C’聲道之間的幅值差和/或相似性的信息;第四OTT編碼,從在TTT編碼中產(chǎn)生的復(fù)數(shù)個TTT音頻聲道信號產(chǎn)生第四OTT音頻聲道信號和第四OTT參數(shù);壓縮在第一至第四OTT編碼以及TTT編碼中產(chǎn)生的參數(shù)和在第四OTT編碼中產(chǎn)生的第四OTT音頻聲道信號,以產(chǎn)生比特流。為了實(shí)現(xiàn)至少上面的和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種多聲道音頻信號編碼方法,所述多聲道音頻信號編碼方法包括第一 OTT編碼,從前左音頻聲道(FL)信號和前左中音頻聲道(FLC)信號產(chǎn)生第一 OTT音頻聲道(FL’ )信號和第一 OTT參數(shù),其中,第一 OTT參數(shù)包括相應(yīng)的FL和FLC聲道之間的幅值差和/或相似性的信息;第二 OTT編碼,從前右音頻聲道(FR)信號和前右中音頻聲道(FRC)信號產(chǎn)生第二 OTT音頻聲道(FR’)信號和第二 OTT參數(shù),其中,第二 OTT參數(shù)包括關(guān)于相應(yīng)的FR和FRC聲道之間的幅值差和/或相似性的信息;第三OTT編碼,從在第一 OTT編碼中產(chǎn)生的音頻聲道(FL’)信號和后左音頻聲道(BL)信號產(chǎn)生第三OTT音頻聲道(L’ )信號和第三OTT參數(shù),其中,第三OTT參數(shù)包括相應(yīng)的FL’和BL聲道之間的幅值差和/或相似性的信息;第四OTT編碼,從在第二OTT編碼中產(chǎn)生的音頻聲道(FR’ )信號和后右音頻聲道(BR)信號產(chǎn)生第四OTT音頻聲道(R’)信號和第四OTT參數(shù),其中,第四OTT參數(shù)包括相應(yīng)的FR’和BR聲道之間的幅值差和/或相似性的信息;第五OTT編碼,從中音頻聲道(C)信號和低音音頻聲道(LFE)信號產(chǎn)生第五OTT音頻聲道(C’ )信號和第五OTT參數(shù),其中,第五OTT參數(shù)包括相應(yīng)的C和LFE聲道之間的幅值差和/或相似性的信息;ΤΤΤ編碼,從分別在第三OTT編碼、第四OTT編碼和第五OTT編碼中產(chǎn)生的L’、R’和C’聲道信號產(chǎn)生復(fù)數(shù)個TTT立體聲音頻聲道信號和TTT參數(shù),其中,TTT參數(shù)包括相應(yīng)的L’、R’和C’聲道之間的幅值差和/或相似性的信息;壓縮在第一至第五OTT編碼中產(chǎn)生的參數(shù)以及在TTT編碼中產(chǎn)生的復(fù)數(shù)個立體聲音頻聲道信號,以產(chǎn)生比特流。為了實(shí)現(xiàn)至少上面的和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種多聲道音頻信號編碼方法,所述多聲道音頻信號編碼方法包括第一 OTT編碼,從前左中音頻聲道(FLC)信號和前右中音頻聲道(FRC)信號產(chǎn)生第一 OTT音頻聲道(FC’)信號和第一 OTT參數(shù),其中,第一 OTT參數(shù)包括相應(yīng)的FLC和FRC聲道之間的幅值差和/或相似性的信息;第二 OTT編碼,從在第一 OTT編碼中產(chǎn)生的音頻聲道(FC’ )信號和中音頻聲道(C)信號產(chǎn)生第二 OTT音頻聲道(C”)信號和第二 OTT參數(shù),其中,第二 OTT參數(shù)包括相應(yīng)的FC’和C聲道之間的幅值差和/或相似性的信息;第三OTT編碼,從前左音頻聲道(FL)信號和后左音頻聲道(BL)信號產(chǎn)生第三OTT音頻聲道(L’ )信號和第三OTT參數(shù),其中,第三OTT參數(shù)可包括相應(yīng)的FL和BL聲道之間的幅值差和/或相似性的信息;第四OTT編碼,從前右音頻聲道(FR)信號和后右音頻聲道(BR)信號產(chǎn)生第四OTT音頻聲道(R’ )信號和第四OTT參數(shù),其中,第四OTT參數(shù)包括相應(yīng)的FR和BR聲道之間的幅值差和/或相似性的信息;第五OTT編碼,從在第二 OTT編碼中產(chǎn)生的音頻聲道(C”)信號和低音音頻聲道(LFE)信號產(chǎn)生第五OTT音頻聲道(C’)信號和第五OTT參數(shù),其中,第五OTT參數(shù)包括相應(yīng)的C”和LFE聲道之間的幅值差和/或相似性的信息;TTT編碼器,從分別在第三OTT編碼、第四OTT編碼和第五OTT編碼中產(chǎn)生的L’、R’和C’聲道信號產(chǎn)生復(fù)數(shù)個TTT (立體聲)音頻聲道信號和TTT參數(shù),其中,TTT參數(shù)包括相應(yīng)L’、R’和C’聲道之間的幅值差和/或相似性的信息;壓縮在第一至第五OTT編碼中產(chǎn)生的參數(shù)以及在TTT編碼中產(chǎn)生的音頻聲道信號,以產(chǎn)生比 特流。為了實(shí)現(xiàn)至少上面的和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括一種多聲道音頻信號編碼方法,所述多聲道音頻信號編碼方法包括第一 OTT編碼,從前左中音頻聲道(FLC)信號和前右中音頻聲道(FRC)信號產(chǎn)生第一 OTT音頻聲道(C’ )信號和第一 OTT參數(shù),其中,第一 OTT參數(shù)包括相應(yīng)的FLC和FRC聲道之間的幅值差和/或相似性的信息;第二 OTT編碼,從前左音頻聲道(FL)信號和后左音頻聲道(BL)信號產(chǎn)生第二 OTT音頻聲道(L’ )信號和第二 OTT參數(shù),其中,第二 OTT參數(shù)包括相應(yīng)的FL和BL聲道之間的幅值差和/或相似性的信息;第三OTT編碼,從前右音頻聲道(FR)信號和后右音頻聲道(BR)信號產(chǎn)生第三OTT音頻聲道R’信號和第三OTT參數(shù),其中,第三OTT參數(shù)包括相應(yīng)的FR和BR聲道之間的幅值差和/或相似性的信息;第四OTT編碼,從中音頻聲道(C)信號和低音音頻聲道(LFE)信號產(chǎn)生第四OTT音頻聲道(C”)信號和第四OTT參數(shù),其中,第四OTT參數(shù)包括相應(yīng)的C和LFE聲道之間的幅值差和/或相似性的信息;第五OTT編碼,從在第二 OTT編碼中產(chǎn)生的音頻聲道(L’ )信號和在第一 OTT編碼中產(chǎn)生的音頻聲道(C’ )信號產(chǎn)生第五OTT音頻聲道信號和第五OTT參數(shù),其中,第五OTT參數(shù)包括相應(yīng)的L’和C’聲道之間的幅值差和/或相似性的信息;第六OTT編碼,從在第三OTT編碼中產(chǎn)生的音頻聲道(R’)信號和在第四OTT編碼中產(chǎn)生的音頻聲道(C”)信號產(chǎn)生第六OTT音頻聲道信號和第六OTT參數(shù),其中,第六OTT參數(shù)包括相應(yīng)的R’和C”聲道之間的幅值差和/或相似性的信息;壓縮在第一至第六OTT編碼中產(chǎn)生的參數(shù)、在第五OTT編碼中產(chǎn)生的第五OTT音頻聲道信號以及在第六OTT編碼中產(chǎn)生的第六OTT音頻聲道信號,以產(chǎn)生比特流。為了實(shí)現(xiàn)至少上面的和/或其他方面和優(yōu)點(diǎn),本發(fā)明的實(shí)施例包括至少一種包含用于控制實(shí)現(xiàn)本發(fā)明的實(shí)施例的至少一個處理部件的計算機(jī)可讀代碼的介質(zhì)。有益效果在根據(jù)本發(fā)明的對多聲道音頻信號進(jìn)行編碼/解碼的設(shè)備和方法中,即使單個輸入流也可基于使用的揚(yáng)聲器配置的類型被選擇性地解碼為合適數(shù)量的聲道的音頻聲道信號??蓛H通過對輸入的比特流進(jìn)行部分地解碼而非全部解碼來實(shí)現(xiàn)可伸縮聲道解碼。在可伸縮聲道解碼中,解碼器設(shè)置解碼級別,并根據(jù)解碼級別輸出音頻聲道信號。因此,可降低解碼的復(fù)雜性。
通過下面結(jié)合附圖對實(shí)施例進(jìn)行的描述,本發(fā)明的這些和/或其他方面和優(yōu)點(diǎn)將會變得清楚并更易于理解,其中圖I示出傳統(tǒng)的MPEG環(huán)繞解碼器;圖2示出用于對輸入的音頻聲道信號進(jìn)行編碼的傳統(tǒng)的編碼器、作為結(jié)果的編碼的音頻聲道信號比特流以及用于對編碼的音頻聲道信號進(jìn)行解碼的傳統(tǒng)的解碼器;圖3示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號解碼系統(tǒng);
圖4示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號解碼方法;圖5示出根據(jù)本發(fā)明實(shí)施例的通過參照各種解碼級別對如圖4所述的下混頻的信號進(jìn)行解碼的解碼器;圖6示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號解碼系統(tǒng);圖7示出根據(jù)本發(fā)明的另一實(shí)施例的多聲道音頻信號解碼方法;圖8示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號解碼系統(tǒng);圖9示出根據(jù)本發(fā)明的另一實(shí)施例的多聲道音頻信號解碼方法;圖10示出根據(jù)本發(fā)明的另一實(shí)施例的多聲道音頻信號解碼系統(tǒng);圖11示出根據(jù)本發(fā)明的另一實(shí)施例的多聲道音頻信號解碼方法;圖12示出根據(jù)本發(fā)明的另一實(shí)施例的多聲道音頻信號解碼系統(tǒng);圖13示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號解碼方法;圖14示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號編碼系統(tǒng);圖15示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號編碼方法;圖16示出根據(jù)本發(fā)明的另一實(shí)施例的多聲道音頻信號編碼系統(tǒng);圖17示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號編碼方法;圖18示出根據(jù)本發(fā)明的另一實(shí)施例的多聲道音頻信號編碼系統(tǒng);圖19示出根據(jù)本發(fā)明的另一實(shí)施例的多聲道音頻信號編碼方法;圖20示出根據(jù)本發(fā)明的另一實(shí)施例的多聲道音頻信號編碼系統(tǒng);圖21示出根據(jù)本發(fā)明的另一實(shí)施例的多聲道音頻信號編碼方法。
具體實(shí)施例方式以下,將參照附圖更充分地描述本發(fā)明的示例性實(shí)施例,示例性實(shí)施例在附圖中示出,其中,相同的標(biāo)號始終表示相同的部件。以下通過參照附圖描述實(shí)施例以解釋本發(fā)明。以下,根據(jù)本發(fā)明的不同實(shí)施例,即使單個輸入比特流也可基于接收器揚(yáng)聲器配置的類型被選擇性地解碼為合適數(shù)量的聲道的音頻聲道信號。相應(yīng)地,可僅通過對輸入的比特流進(jìn)行部分解碼來實(shí)現(xiàn)可伸縮聲道解碼。在可伸縮聲道解碼中,解碼器可設(shè)置用于設(shè)置解碼的等級的解碼級別,并根據(jù)解碼級別輸出音頻聲道信號,從而降低解碼復(fù)雜性。
圖3示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號解碼系統(tǒng),作為示例,該多聲道音頻信號解碼系統(tǒng)可包括音頻解碼器300和解碼級別產(chǎn)生單元350。解碼級別產(chǎn)生單元350可產(chǎn)生有助于將具有預(yù)定數(shù)量N的音頻聲道信號和空間信息的比特流解碼為預(yù)定數(shù)量L(L^N)的音頻聲道信號的解碼級別信息。這里,空間信息可包括在聲道的相應(yīng)編碼期間關(guān)于聲道之間的幅值差和相似性的信息。因此,音頻解碼器300可根據(jù)這樣的解碼級別信息選擇性地對比特流進(jìn)行解碼,并輸出L個音頻聲道信號。圖4示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號解碼方法。在操作400,可產(chǎn)生在將例如包括N個音頻聲道信號和空間信息的比特流選擇性地解碼為L個音頻聲道信號時使用的解碼級別信息。比特流可以是包括有空間信息的下混頻的信號,例如,單聲道信號,通過基于空間信息更改下混頻的信號來最終上混頻為另外的信號。這里,如上面提到的,比特流可包括下混頻的信號和附加素材(material),作為示例,附加素材可被不同地稱為特別參數(shù)或空間提示(cue),其中,附加素材包括關(guān)于每個混頻的信號如何彼此區(qū)分或如何與下混頻的單聲道信號區(qū)分開來的信息。通過僅發(fā)送下混頻的信號和附加素材的技術(shù),可減少基 本數(shù)據(jù)量,例如,與每個單獨(dú)的左示例聲道和右示例聲道所需的數(shù)據(jù)相比,對于下混頻的單聲道信號,差不多發(fā)送全部數(shù)據(jù)的一半。因此,進(jìn)一步來說,圖5進(jìn)一步示出通過參照各種解碼級別對下混頻的信號進(jìn)行解碼的解碼器。標(biāo)號dlO、dll和dl2表示這樣的解碼級別,其中,dlO表示核心解碼級別。圖5示出在dll級別的2至3解碼工具(TTT),以及在dl2級別的I至2解碼工具(OTT)。作為示例,如果dl2級別用于對下混頻的信號解碼,則針對左聲道、右聲道和中聲道的揚(yáng)聲器,僅左(L’)、右(R’ )和中(C’ )被解碼并輸出。下面參照圖6進(jìn)一步討論該操作?;氐綀D4,在操作450,可基于解碼級別對比特流解碼以輸出與適當(dāng)?shù)慕獯a級別相應(yīng)的期望數(shù)量的解碼的音頻聲道信號。圖6示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號解碼系統(tǒng),作為示例,該多聲道音頻信號解碼系統(tǒng)可包括第一 OTT解碼器600、TTT解碼器610、第二 OTT解碼器620、第三OTT解碼器630以及第四OTT解碼器640。多聲道音頻信號解碼系統(tǒng)還可包括例如解碼級別產(chǎn)生單元650。第一OTT解碼器600對包括一個音頻聲道信號(例如,下混頻信號)以及上述空間信息的比特流進(jìn)行解碼,從而單個音頻聲道信號被上混頻并被輸出為兩個音頻聲道信號。這里,空間信息可包括在聲道的相應(yīng)編碼期間聲道之間的幅值差以及關(guān)于相同聲道之間的相似性的信息。如果在解碼期間使用dll級別,則由第一 OTT解碼器600輸出的兩個音頻聲道可被當(dāng)作立體聲音頻聲道,例如,選擇性地輸出左揚(yáng)聲器和右揚(yáng)聲器。TTT解碼器610將兩個音頻聲道信號解碼為三個音頻聲道信號。這里,由TTT解碼器610輸出的三個音頻聲道信號的三個聲道可被當(dāng)作例如左音頻聲道L’、右音頻聲道R’以及中音頻聲道C’。當(dāng)由TTT解碼器610輸出的三個音頻聲道信號被稱為第一、第二和第三聲道信號時,第二 OTT解碼器620可將第一聲道信號解碼為兩個聲道信號。這兩個聲道信號的兩個聲道可被當(dāng)作例如左前音頻聲道LF和左環(huán)繞音頻聲道LS。類似地,第三OTT解碼器630可將第二聲道信號解碼為兩個聲道信號。這兩個聲道信號的兩個聲道可被當(dāng)作例如右前音頻聲道RF和右環(huán)繞音頻聲道RS。同樣,第四OTT解碼器640可將第三聲道信號解碼為兩個聲道信號。這兩個聲道信號的兩個聲道可以是例如中音頻聲道C和低音音頻聲道LFE。在一個實(shí)施例中,解碼級別產(chǎn)生單元650可產(chǎn)生在將比特流選擇性地解碼為預(yù)定數(shù)量的音頻聲道信號時使用的解碼級別信息。作為示例,解碼級別信息可包括第一解碼級別dlO、第二解碼級別dll、第三解碼級別dl2以及第四解碼級別dl3。第一解碼級別dlO可用在包括一個音頻聲道信號的比特流的解碼中,以控制將該比特流解碼為一個音頻聲道信號進(jìn)行輸出的選擇級別。第二解碼級別dll可用在包括在第一解碼級別dlO輸出的單個音頻聲道信號的比特流的解碼中,以控制將該比特流解碼為兩個音頻聲道信號的選擇級別。第三解碼級別dl2可用在包括在第二解碼級別dll輸出的兩個音頻聲道信號的比特·流的解碼中,以控制將該比特流解碼為三個音頻聲道信號(例如,L’、R’和C’聲道)的選擇級別。第四解碼級別dl3可用在包括在第三解碼級別dl2輸出的三個音頻聲道信號的比特流的解碼中,以控制將該比特流解碼為例如5. I音頻聲道LF、LS、RF、RS、C和LFE的選擇級別。圖7示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號解碼方法。在操作700,對包括單個音頻聲道信號和空間信息的比特流進(jìn)行解碼,以輸出兩個音頻聲道信號,其中,空間信息包括例如聲道之間的幅值差和/或關(guān)于聲道之間的相似性的信息。所述兩個聲道可被當(dāng)作例如立體聲音頻聲道。在操作720,可將例如來自操作700的兩個音頻聲道信號解碼為三個音頻聲道信號,其中,例如由TTT解碼器610輸出的所述三個音頻聲道的三個聲道被當(dāng)作左音頻聲道1/、右音頻聲道1 ’以及中音頻聲道C’。當(dāng)例如在操作720獲得的三個音頻聲道信號被稱為第一、第二和第三聲道信號時,在操作740,第一、第二和第三聲道信號的每個被解碼為兩個聲道信號,從而輸出5. I聲道信號。這里,第一聲道解碼為的兩個聲道信號的兩個聲道可被當(dāng)作左前音頻聲道LF和左環(huán)繞音頻聲道LS,第二聲道信號解碼為的兩個聲道信號的兩個聲道可被當(dāng)作右前音頻聲道RF和右環(huán)繞音頻聲道RS,第三聲道信號解碼為的兩個聲道信號的兩個聲道可被當(dāng)作中音頻聲道C和低音音頻聲道LFE。因此,為了實(shí)現(xiàn)將比特流解碼為預(yù)定數(shù)量的音頻聲道信號,可能需要解碼級別信息。解碼級別信息可包括第一解碼級別,可用在將包括一個音頻聲道信號的比特流解碼為一個音頻聲道信號的選擇性的解碼中;第二解碼級別,可用在將包括在第一解碼級別輸出的單個音頻聲道信號的比特流解碼為兩個音頻聲道信號的選擇性的解碼中;第三解碼級另|J,可用在將包括在第二解碼級別輸出的兩個音頻聲道信號的比特流解碼為三個聲道L’、R’和C’的三個音頻聲道信號的選擇性的解碼中;第四解碼級別,可用在將包括在第三解碼級別輸出的三個音頻聲道信號的比特流解碼為例如5. I音頻聲道LF、LS、RF、RS、C和LFE的信號的選擇性的解碼中。圖8示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號解碼系統(tǒng),作為示例,該多聲道音頻信號解碼系統(tǒng)可包括=TTT解碼器800、第一 OTT解碼器810、第二 OTT解碼器820、第三OTT解碼器830、第四OTT解碼器840以及第五OTT解碼器850。多聲道音頻信號解碼系統(tǒng)還可包括例如解碼級別產(chǎn)生單元860。TTT解碼器800對包括兩個音頻聲道信號和空間信息的比特流進(jìn)行解碼,以將兩個音頻聲道信號輸出為例如三個音頻聲道信號。這里,空間信息可包括在聲道的相應(yīng)的編碼期間關(guān)于聲道之間的幅值差和相似性的信息。由TTT解碼器800輸出的三個音頻聲道信號的三個聲道可被當(dāng)作例如左音頻聲道L’、右音頻聲道R’以及中音頻聲道C’。在由TTT解碼器800輸出的三個音頻聲道信號被稱為第一、第二和第三聲道信號時,第一 OTT解碼器810將第一聲道信號解碼為兩個聲道信號,其中,這兩個聲道信號的兩個聲道被當(dāng)作前左音頻聲道FL’和后左音頻聲道BL。第二 OTT解碼器820可將第二聲道信號解碼為兩個另外的聲道信號,其中,這兩個聲道信號的兩個聲道可被當(dāng)作前右音頻聲道FR’和后右音頻聲道BR。
第三OTT解碼器830可將第三聲道信號解碼為兩個另外的聲道信號,其中,這兩個聲道信號的兩個聲道被當(dāng)作中音頻聲道C和低音音頻聲道LFE。第四OTT解碼器840可進(jìn)一步將第一 OTT解碼器810的輸出信號中的一個(即,前左音頻聲道FL’的信號)解碼為兩個另外的聲道信號,其中,由第四OTT解碼器840輸出的這兩個聲道信號的兩個聲道被當(dāng)作前左音頻聲道FL和前左中音頻聲道FLC。第五OTT解碼器850可進(jìn)一步將第二 OTT解碼器820的輸出信號中的一個(即,前右音頻聲道FR’的信號)解碼為兩個另外的聲道信號,其中,由第五OTT解碼器850輸出的這兩個聲道信號的兩個聲道被當(dāng)作前右音頻聲道FR和前右中音頻聲道FRC。解碼級別產(chǎn)生單元860可產(chǎn)生在將比特流選擇性地解碼為預(yù)定數(shù)量的音頻聲道信號時使用的解碼級別信息。這里,作為示例,解碼級別信息可包括第一解碼級別dlO、第二解碼級別dll、第三解碼級別dl2以及第四解碼級別dl3。第一解碼級別dlO可在將包括兩個音頻聲道信號的比特流選擇性地解碼為兩個音頻聲道信號時使用。第二解碼級別dll可在將包括在第一解碼級別dlO輸出的兩個音頻聲道信號的比特流選擇性地解碼為例如三個音頻聲道L’、R’和C’的信號時使用。第三解碼級別dl2可在將包括在第二解碼級別dl I輸出的三個音頻聲道信號的比特流選擇性地解碼為例如5. I音頻聲道FL’、BL、FR’、BR、C和LFE的信號時使用。第四解碼級別dl3可在例如將FL’聲道信號選擇性地解碼為兩個音頻聲道FL和FLC的信號以及將FR’聲道信號選擇性地解碼為兩個音頻聲道FR和FRC的信號時使用,從而輸出總共7. I聲道信號。圖9示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號解碼方法。在操作900,對包括兩個音頻聲道信號和空間信息的比特流進(jìn)行解碼,以輸出三個音頻聲道信號,其中,空間信息可包括在聲道的相應(yīng)的編碼期間關(guān)于聲道之間的幅值差和相似性的信息。所述三個音頻聲道信號的三個聲道可被當(dāng)作例如左音頻聲道L’、右音頻聲道R’和中音頻聲道C’。當(dāng)在操作900獲得的三個音頻聲道信號被稱為第一、第二和第三聲道信號時,在操作920,可將第一、第二和第三聲道信號中的每個進(jìn)一步解碼為兩個另外的聲道信號,以輸出5. I聲道信號。第一聲道解碼為的兩個聲道信號的兩個聲道可被當(dāng)作前左音頻聲道FL’和后左音頻聲道BL,第二聲道信號解碼為的兩個聲道信號的兩個聲道可被當(dāng)作前右音頻聲道FR’和后右音頻聲道BR,第三聲道信號解碼為的兩個聲道信號的兩個聲道可被當(dāng)作中音頻聲道C和低音音頻聲道LFE。在操作940,5. I聲道的兩個聲道的信號的每個被進(jìn)一步解碼,以輸出7. I聲道的信號。在操作940中的兩個聲道信號被解碼為的信號的聲道可被當(dāng)作例如前左音頻聲道FL、前左中音頻聲道FLC、前右音頻聲道FR以及前右中音頻聲道FRC。為了實(shí)現(xiàn)上述將比特流解碼為預(yù)定數(shù)量的音頻聲道信號,可使用例如由解碼器生成的解碼級別信息,以便可基于適當(dāng)?shù)慕獯a級別對音頻聲道信號進(jìn)行解碼并輸出。在本實(shí)施例中,解碼級別信息可包括第一解碼級別dio,可在將包括兩個音頻聲道信號的比特流選擇性地解碼為兩個音頻聲道信號時使用;第二解碼級別dll,可在將包括在第一解碼級別dio輸出的兩個音頻聲道信號的比特流選擇性地解碼為例如三個音頻聲道L’、R’和C’的信號時使用;第三解碼級別dl2,可在將包括三個音頻聲道信號的比特流選擇性地解碼為5. I音頻聲道LF、LS、RF、RS、C和LFE的信號時使用;第四解碼級別dl3,可在將FL’聲道信號選擇性地解碼為兩個音頻聲道FL和FLC的信號以及將FR’聲道信號選擇性地解碼為兩個聲道信號FR和FRC的信號以輸出總共7. I聲道信號時使用。圖10示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號解碼系統(tǒng),作為示例,該多聲道音頻信號解碼系統(tǒng)可包括=TTT解碼器1000、第一 OTT解碼器1010、第二 OTT解碼器1020、第三OTT解碼器1030、第四OTT解碼器1040以及第五OTT解碼器1050。多聲道音頻信號解碼系統(tǒng)還可包括例如解碼級別產(chǎn)生單元1060。 TTT解碼器1000可對包括兩個音頻聲道信號和空間信息的比特流進(jìn)行解碼,以從兩個音頻聲道信號輸出三個音頻聲道信號。這里,空間信息可包括在聲道的相應(yīng)的編碼期間關(guān)于聲道之間的幅值差和相似性的信息。由TTT解碼器1000輸出的三個音頻聲道信號的三個聲道可被當(dāng)作例如左音頻聲道L’、右音頻聲道R’以及中音頻聲道C’。在由TTT解碼器1000輸出的三個音頻聲道信號被稱為第一、第二和第三聲道信號時,第一 OTT解碼器1010可將第一聲道信號解碼為兩個聲道信號。這兩個聲道信號的兩個聲道可被當(dāng)作例如前左音頻聲道FL和后左音頻聲道BL。第二 OTT解碼器1020可將第二聲道信號解碼為兩個聲道信號,其中,這兩個聲道信號的兩個聲道可被當(dāng)作例如前右音頻聲道FR和后右音頻聲道BR。類似地,第三OTT解碼器1030可將第三聲道信號解碼為兩個聲道信號,其中,這兩個聲道信號的兩個聲道被當(dāng)作例如中音頻聲道C”和低音音頻聲道LFE。第四OTT解碼器1040可進(jìn)一步將第三OTT解碼器1030的輸出信號中的一個(例如,中音頻聲道C”的信號)解碼為兩個聲道信號,其中,由第四OTT解碼器1040輸出的這兩個聲道信號的兩個聲道被當(dāng)作例如前中音頻聲道FC’和中音頻聲道C。第五OTT解碼器1050可進(jìn)一步將第四OTT解碼器1040的輸出信號中的一個(例如,F(xiàn)C’聲道信號)解碼為兩個聲道信號,其中,由第五OTT解碼器1050輸出的這兩個聲道信號的兩個聲道被當(dāng)作例如前左中音頻聲道FLC和前右中音頻聲道FRC。在一個實(shí)施例中,解碼級別產(chǎn)生單元1060可產(chǎn)生可在將比特流選擇性地解碼為預(yù)定數(shù)量的音頻聲道信號期間使用的解碼級別信息。作為示例,解碼級別信息可包括第一解碼級別dlO、第二解碼級別dll、第三解碼級別dl2以及第四解碼級別dl3。這里,第一解碼級別dlO可在將包括兩個音頻聲道信號的比特流解碼為兩個音頻聲道信號的選擇性解碼期間使用,第二解碼級別dll可在將包括在第一解碼級別dlO輸出的兩個音頻聲道信號的比特流選擇性地解碼為三個音頻聲道L’、R’和C’的信號期間使用,第三解碼級別dl2可在將包括在第二解碼級別dl I輸出的三個音頻聲道信號的比特流選擇性地解碼為5. I音頻聲道FL、BL、FR、BR、C”和LFE的信號期間使用,第四解碼級別dl3可在將FC’聲道信號選擇性地解碼為兩個聲道FLC和FRC信號期間使用,從而輸出總共7. I
聲道信號。圖11示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號解碼方法。在操作1100,對包括兩個音頻聲道信號和空間信息的比特流進(jìn)行解碼,以從兩個音頻聲道信號輸出三個音頻聲道信號,其中,空間信息包括聲道之間的幅值差和關(guān)于聲道之間的相似性的信息。所述三個音頻聲道信號的三個聲道可被當(dāng)作例如左音頻聲道L’、右音頻聲道R’和中音頻聲道C’。當(dāng)在操作1100獲得的三個音頻聲道信號被稱為第一、第二和第三聲道信號時,在操作1120,可將第一、第二和第三聲道信號中的每個解碼為兩個聲道信 號,以輸出5. I聲道信號。更具體地說,第一聲道解碼為的兩個聲道信號的兩個聲道可被當(dāng)作前左音頻聲道FL和后左音頻聲道BL,第二聲道信號解碼為的兩個聲道信號的兩個聲道可被當(dāng)作前右音頻聲道FR和后右音頻聲道BR,第三聲道信號解碼為的兩個聲道信號的兩個聲道可被當(dāng)作中音頻聲道C”和低音音頻聲道LFE。在操作1140,在操作1120輸出的5. I聲道的兩個聲道的信號可被進(jìn)一步解碼為兩個聲道信號,其中,這兩個聲道信號的聲道被當(dāng)作例如前中音頻聲道FC’和中音頻聲道C。在操作1160,在操作1140輸出的兩個聲道信號中的一個例如可被解碼為兩個聲道信號,從而輸出7. I聲道信號,其中,這兩個聲道信號的聲道被當(dāng)作例如前左中音頻聲道FLC和前右中音頻聲道FRC。因此,根據(jù)本實(shí)施例,為了實(shí)現(xiàn)上述將比特流選擇性解碼為預(yù)定數(shù)量的音頻聲道信號,可使用由解碼器生成的解碼級別信息,以便基于解碼級別輸出音頻聲道信號。解碼級別信息可包括第一解碼級別dlO,可在將包括兩個音頻聲道信號的比特流選擇性地解碼為兩個音頻聲道信號期間使用;第二解碼級別dl I,可在將包括在第一解碼級別dlO輸出的兩個音頻聲道信號的比特流選擇性地解碼為三個音頻聲道L’、R’和C’的信號期間使用;第三解碼級別dl2,可在將包括三個音頻聲道信號的比特流選擇性地解碼為5. I音頻聲道FL、BL、FR、BR、C”和LFE的信號期間使用;第四解碼級別dl3,可在將FC’聲道信號選擇性地解碼為兩個音頻聲道FLC和FRC的信號期間使用,從而輸出總共7. I聲道信號。圖12示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號解碼系統(tǒng),作為示例,該多聲道音頻信號解碼系統(tǒng)可包括 第一 OTT解碼器1200、第二 OTT解碼器1210、第三OTT解碼器1220、第四OTT解碼器1230、第五OTT解碼器1240以及第六OTT解碼器1250。在實(shí)施例中,多聲道音頻信號解碼系統(tǒng)還可包括例如解碼級別產(chǎn)生單元1260。響應(yīng)于包括兩個音頻聲道信號(例如,第一和第二音頻聲道信號)和空間信息的比特流,第一 OTT解碼器1200可將第一音頻聲道信號解碼為兩個音頻聲道信號。這里,空間信息可包括在聲道的相應(yīng)的編碼期間關(guān)于聲道之間的幅值差以及聲道之間的相似性的信息。由第一 OTT解碼器1200輸出的兩個音頻信號的聲道可被當(dāng)作例如左音頻聲道L’和中音頻聲道C’。第二 OTT解碼器1210可對比特流進(jìn)行解碼,以輸出兩個音頻聲道信號作為第二音頻聲道信號。由第二 OTT解碼器1210輸出的兩個音頻聲道信號的聲道可被作為右音頻聲道R’和中音頻聲道C”。第三OTT解碼器1220可將由第一 OTT解碼器1200輸出的兩個聲道信號中的一個(例如,L’聲道信號)解碼為另外兩個聲道信號。由第三OTT解碼器1220輸出的兩個音頻聲道信號的兩個聲道可被作為例如前左音頻聲道FL和后左音頻聲道BL。由第二 OTT解碼器1210輸出的兩個音頻聲道信號被稱為第一和第二聲道信號時,第四OTT解碼器1230可將第一聲道信號解碼為兩個聲道信號,其中,這兩個聲道信號的兩個聲道可被當(dāng)作前右音頻聲道FR和后右音頻聲道BR。第五OTT解碼器1240可將第二聲道信號解碼為兩個聲道信號,其中,這兩個聲道信號的兩個聲道被當(dāng)作中音頻聲道C和低音音頻聲道LFE。第六OTT解碼器1250可將第一 OTT解碼器1200的兩個輸出信號中的另一輸出信號(例如,C’聲道信號)解碼為兩個聲道信號,其中,由第六OTT解碼器1250輸出的這兩個聲道信號的兩個聲道是前左中音頻聲道FLC和前右中音頻聲道FRC。在實(shí)施例中,解碼級別產(chǎn)生單元1260可產(chǎn)生可在將比特流選擇性地解碼為預(yù)定數(shù)量的音頻聲道信號時使用的解碼級別信息。作為示例,解碼級別信息可包括第一解碼級 別dlO、第二解碼級別dll、第三解碼級別dl2以及第四解碼級別dl3。這里,第一解碼級別dlO可在將包括兩個音頻聲道信號的比特流選擇性地解碼為兩個音頻聲道信號期間使用。第二解碼級別dll可在將包括在第一解碼級別dlO輸出的兩個音頻聲道信號的比特流選擇性地解碼為例如四個音頻聲道L’、C’、R’和C”的信號期間使用。第三解碼級別dl2可在例如將L’音頻聲道信號選擇性地解碼為兩個音頻聲道FL和BL的信號期間、將要被解碼的R’音頻聲道信號被選擇性地解碼為兩個音頻聲道FR和BR的信號期間以及將要被解碼的C”音頻聲道信號被選擇性地解碼為兩個聲道信號C和LFE的信號期間使用。第四解碼級別dl3可在將C’聲道信號選擇性地解碼為兩個聲道FLC和FRC信號期間使用。圖13示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號解碼方法。在操作1300,對包括兩個音頻聲道信號(例如,第一音頻聲道信號和第二音頻聲道信號)和空間信息的比特流進(jìn)行解碼,以將第一音頻聲道信號輸出為兩個音頻聲道信號(例如,L’和C’音頻聲道信號),其中,空間信息可包括在聲道的相應(yīng)編碼期間聲道之間的幅值差和聲道之間的相似性的信息。這里,L’和C’分別表示左音頻聲道和中音頻聲道。此外,在操作1300,可對比特流解碼,以便將第二音頻聲道信號輸出為兩個音頻聲道信號例如R’和C”音頻聲道信號,其中,R’和C”分別表示右音頻聲道和中音頻聲道。在操作1320,在操作1300獲得的L’信號可被解碼為前左音頻聲道FL和后左音頻聲道BL的信號。在操作1340,第一音頻信號被解碼為前右音頻聲道(FR)信號和后右音頻聲道(BR)信號。在操作1360,第二聲道(C”)可被解碼為中音頻聲道(C)信號和低音音頻聲道(LFE)信號。此外,在操作1380,在操作1300獲得的C’聲道信號可被解碼為前左中音頻聲道(FLC)信號和前右中音頻聲道(FRC)信號。在該實(shí)施例中,為了實(shí)現(xiàn)將比特流選擇性地解碼為預(yù)定數(shù)量的音頻聲道信號,可使用由解碼器生成的解碼級別信息,以便基于解碼級別輸出音頻聲道信號。解碼級別信息可包括第一解碼級別dlO,可在將包括兩個音頻聲道信號的比特流選擇性地解碼為兩個音頻聲道信號期間使用;第二解碼級別dl I,可在將在第一解碼級別dlO輸出的兩個音頻聲道信號選擇性地解碼為四個音頻聲道L’、R’、C’、和C”的信號期間使用;第三解碼級別dl2,可在將L’音頻聲道信號選擇性地解碼為FL和BL音頻聲道信號期間、將R’音頻聲道信號選擇性地解碼為FR和BR音頻聲道信號期間以及將C”音頻聲道信號選擇性地解碼為C和LFE音頻聲道信號期間使用;第四解碼級別dl3,可在將C’聲道信號選擇性地解碼為FLC和FRC音頻聲道信號期間使用。在上面的實(shí)施例中,可使用時域瞬時整形(TP, temporal shaping)和瞬時包跡整形(TES, temporal envelope shaping)以獲得中間輸出。此外,每個解碼級別可大于三樹深(tree depth)。例如,以五個聲道編碼的MPEG環(huán)繞數(shù)據(jù)可被解碼為被建立樹結(jié)構(gòu)的7個揚(yáng)聲器播放。根據(jù)上面所述,現(xiàn)在將進(jìn)一步描述根據(jù)本發(fā)明實(shí)施例的對這樣的多聲道音頻信號進(jìn)行編碼的系統(tǒng)、介質(zhì)和方法。圖14示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號編碼系統(tǒng),該多聲道音頻信號編碼系統(tǒng)可包括例如第一 OTT編碼器1400、第二 OTT編碼器1410、第三OTT編碼器1420、TTT編碼器1430、第四OTT編碼器1440以及比特流產(chǎn)生單元1450。
第一 OTT編碼器1400可使用左前音頻聲道(LF)信號和左環(huán)繞音頻聲道(LS)信號產(chǎn)生第一 OTT音頻聲道(L’)信號和第一 OTT參數(shù)(也可能被稱為空間信息或空間提不),其中,第一 OTT參數(shù)可包括關(guān)于相應(yīng)的聲道之間的幅值差和相似性的信息。第二 OTT編碼器1410可使用右前音頻聲道(RF)信號和右環(huán)繞音頻聲道(RS)信號產(chǎn)生第二 OTT音頻聲道(R’ )信號和第二 OTT參數(shù),其中,第二 OTT參數(shù)可包括相應(yīng)的聲道之間的幅值差和關(guān)于相應(yīng)的聲道之間的相似性的信息。第三OTT編碼器1420可使用中音頻聲道(C)信號和低音音頻聲道(LFE)信號產(chǎn)生第三OTT音頻聲道(C’ )信號和第三OTT參數(shù),其中,第三OTT參數(shù)可包括聲道的幅值之間的幅值差和關(guān)于相應(yīng)的聲道之間的相似性的信息。此外,TTT編碼器1430可使用分別由第一 OTT編碼器1400、第二 OTT編碼器1410和第三OTT編碼器1420輸出的L’、R’和C,聲道信號產(chǎn)生TTT音頻聲道信號和TTT參數(shù),其中,所述TTT參數(shù)可包括相應(yīng)的聲道之間的幅值差和關(guān)于相應(yīng)的聲道之間的相似性的信息。第四OTT編碼器1440可使用由TTT編碼器1430輸出的TTT音頻聲道信號產(chǎn)生第四OTT音頻聲道信號和第四OTT參數(shù),其中,第四OTT參數(shù)可包括相應(yīng)的聲道之間的幅值差和關(guān)于相應(yīng)的聲道之間的相似性的信息。然后,比特流產(chǎn)生單元1450可壓縮由第一至第四OTT編碼器1400、1410、1420和1440產(chǎn)生的OTT參數(shù)、由TTT編碼器1430產(chǎn)生的TTT參數(shù)以及由第四OTT編碼器1440產(chǎn)生的音頻信號,以產(chǎn)生以后可基于這樣的編碼的音頻信號和壓縮的參數(shù)信息被解碼的比特流。圖15示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號編碼方法。在操作1500,可從左前音頻聲道(LF)信號和左環(huán)繞音頻聲道(LS)信號產(chǎn)生第一 OTT參數(shù)和第一 OTT音頻聲道(L’ )信號。在操作1510,可從右前音頻聲道(RF)信號和右環(huán)繞音頻聲道(RS)信號產(chǎn)生第二OTT參數(shù)和第二 OTT音頻聲道(R’ )信號。在操作1520,可從中音頻聲道(C)信號和低音音頻聲道(LFE)信號產(chǎn)生第三OTT參數(shù)和第三OTT音頻聲道(C’ )信號。在操作1530,還可從分別在操作1500、1510和1520產(chǎn)生的L’、R’和C’聲道信號產(chǎn)生TTT參數(shù)和TTT (立體聲)音頻聲道信號。在操作1540,可從在操作1530產(chǎn)生的立體聲音頻聲道信號產(chǎn)生第四OTT參數(shù)和第四OTT音頻聲道(下混頻的單聲道)信號。在操作1550,壓縮在操作1500、1510、1520、1530和1540產(chǎn)生的參數(shù)以及在操作1540產(chǎn)生的單聲道的下混頻音頻聲道信號,以產(chǎn)生比特流。圖16示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號編碼系統(tǒng),該多聲道音頻信號編碼系統(tǒng)可包括例如第一 OTT編碼器1600、第二 OTT編碼器1610、第三OTT編碼器1620、第四OTT編碼器1630、第五OTT編碼器1640、TTT編碼器1650、以及比特流產(chǎn)生單元1660。第一 OTT編碼器1600可使用前左音頻聲道(FL)信號和前左中音頻聲道(FLC)信號產(chǎn)生第一 OTT音頻聲道(FL’ )信號和第一 OTT參數(shù),其中,第一 OTT參數(shù)可包括關(guān)于相應(yīng)的聲道之間的幅值差和相似性的信息。第二 OTT編碼器1610可使用前右音頻聲道(FR)信號和前右中音頻聲道(FRC)信號產(chǎn)生第二 OTT音頻聲道(FR’ )信號和第二 OTT參數(shù),其中,第二 OTT參數(shù)可包括關(guān)于相應(yīng)的聲道之間的幅值差和相似性的信息。第三OTT編碼器1620可使用由第一 OTT編碼器1600產(chǎn)生的FL’音頻聲道信號和后左音頻聲道(BL)信號進(jìn)一步產(chǎn)生第三OTT音頻聲道(L’ )信號和第三OTT參數(shù),其中,第三OTT參數(shù)可包括關(guān)于相應(yīng)的聲道之間的幅值差和相似性的信息。第四OTT編碼器1630可使用由第二 OTT編碼器1610產(chǎn)生的FR’音頻聲道信號和后右音頻聲道(BR)信號產(chǎn)生第四OTT音頻聲道(R’)信號和第四OTT參數(shù),其中,第四OTT 參數(shù)可包括關(guān)于相應(yīng)的聲道之間的幅值差和相似性的信息。第五OTT編碼器1640可使用中音頻聲道(C)信號和低音音頻聲道(LFE)信號產(chǎn)生第五OTT音頻聲道(C’ )信號和第五OTT參數(shù),其中,第五OTT參數(shù)可包括關(guān)于相應(yīng)的聲道之間的幅值差和相似性的信息。TTT編碼器1650可使用分別由第三OTT編碼器1620、第四OTT編碼器1630和第五OTT編碼器1640輸出的L’、R’和C’聲道信號產(chǎn)生TTT音頻聲道信號和TTT參數(shù),其中,所述TTT參數(shù)可包括相應(yīng)的聲道之間的聲道的幅值之差和相似性的信息。 然后,比特流產(chǎn)生單元1660可壓縮由第一至第五OTT編碼器1600至1640以及TTT編碼器1650產(chǎn)生的參數(shù)以及由TTT編碼器1650產(chǎn)生的TTT音頻聲道信號,以產(chǎn)生比特流。圖17示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號編碼方法。在操作1700,可從FL音頻聲道信號和FLC音頻聲道信號產(chǎn)生第一 OTT音頻聲道(FL’)信號和第一 OTT參數(shù)。在操作1710,可從FR音頻聲道信號和FRC音頻聲道信號產(chǎn)生第二 OTT音頻聲道(FR’ )信號和第二 OTT參數(shù)。在操作1720,可使用在操作1700產(chǎn)生的FL’音頻聲道信號和BL音頻聲道信號產(chǎn)生第三OTT音頻聲道(L’ )信號和第三OTT參數(shù)。此外,在操作1730,可從在操作1710產(chǎn)生的FR’音頻聲道信號和BR音頻聲道信號產(chǎn)生第四OTT音頻聲道(R’)信號和第四OTT參數(shù)。在操作1740,可從C音頻聲道信號和LFE音頻聲道信號產(chǎn)生第五OTT音頻聲道(C’ )信號和第五OTT參數(shù)。在操作1750,可從分別在操作1720、1730和1740產(chǎn)生的L’、R’和C’聲道信號產(chǎn)生TTT (立體聲)音頻聲道信號和TTT參數(shù)。然后在操作1760,可壓縮在操作1700、1710、1720、1730、1740和1750產(chǎn)生的參數(shù)以及在操作1750產(chǎn)生的立體聲音頻聲道信號,以產(chǎn)生相應(yīng)的比特流。
圖18示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號編碼系統(tǒng),該多聲道音頻信號編碼系統(tǒng)可包括例如第一 OTT編碼器1800、第二 OTT編碼器1810、第三OTT編碼器1820、第四OTT編碼器1830、第五OTT編碼器1840、TTT編碼器1850、以及比特流產(chǎn)生單元1860。第一 OTT編碼器1800可使用前左中音頻聲道(FLC)信號和前右中音頻聲道(FRC)信號產(chǎn)生第一 OTT音頻聲道(FC’)信號和第一 OTT參數(shù),其中,第一 OTT參數(shù)可包括關(guān)于相應(yīng)的聲道之間的幅值差和相似性的信息。第二 OTT編碼器1810可使用由第一 OTT編碼器1800輸出的FC’音頻聲道信號和中音頻聲道(C)信號產(chǎn)生第二 OTT音頻聲道(C”)信號和第二 OTT參數(shù),其中,第二 OTT參數(shù)可包括相應(yīng)的聲道之間的幅值差和關(guān)于相應(yīng)的聲道之間的相似性的信息。第三OTT編碼器1820可使用前左音頻聲道(FL)信號和后左音頻聲道(BL)信號產(chǎn)生第三OTT音頻聲道(L’ )信號和第三OTT參數(shù),其中,第三OTT參數(shù)可包括關(guān)于相應(yīng)的聲道之間的幅值差和相似性的信息。第四OTT編碼器1830可使用FR音頻聲道信號和后右 音頻聲道(BR)信號產(chǎn)生第四OTT音頻聲道(R’)信號和第四OTT參數(shù),其中,第四OTT參數(shù)可包括關(guān)于相應(yīng)的聲道之間的幅值差和相似性的信息。第五OTT編碼器1840可使用由第
二OTT編碼器1810輸出的C”音頻聲道信號和低音音頻聲道(LFE)信號產(chǎn)生第五OTT音頻聲道(C’ )信號和第五OTT參數(shù),其中,第五OTT參數(shù)可包括關(guān)于相應(yīng)的聲道之間的幅值差和相似性的信息。TTT編碼器1850可使用分別由第三OTT編碼器1820、第四OTT編碼器1830和第五OTT編碼器1840輸出的L’、R’和C’聲道信號產(chǎn)生TTT音頻聲道信號和TTT參數(shù),其中,所述TTT參數(shù)可包括關(guān)于相應(yīng)的聲道之間的幅值差和相似性的信息。然后,比特流產(chǎn)生單元1860可壓縮由第一至第五OTT編碼器1800至1840以及TTT編碼器1850產(chǎn)生的參數(shù)以及由TTT編碼器1850產(chǎn)生的TTT音頻聲道信號,以產(chǎn)生比特流。圖19示出根據(jù)本發(fā)明實(shí)施例的多聲道音頻信號編碼方法。在操作1900,可從FLC音頻聲道信號和FRC音頻聲道信號產(chǎn)生第一 OTT音頻聲道(FC’)信號和第一 OTT參數(shù)。在操作1910,可從在操作1900產(chǎn)生的FC’音頻聲道信號和C音頻聲道信號產(chǎn)生第二 OTT音頻聲道(C” )信號和第二 OTT參數(shù)。在操作1920,可從FL音頻聲道信號和BL音頻聲道信號產(chǎn)生第三OTT音頻聲道(L’ )信號和第三OTT參數(shù)。在操作1930,可從FR音頻聲道信號和BR音頻聲道信號產(chǎn)生第四OTT音頻聲道(R’)信號和第四OTT參數(shù)。在操作1940,可從在操作1910產(chǎn)生的C”音頻聲道信號和LFE音頻聲道信號產(chǎn)生第五OTT音頻聲道(C’ )信號和第五OTT參數(shù)。在操作1950,可從分別在操作1920、1930和1940產(chǎn)生的L’、R’和C’聲道信號產(chǎn)生TTT (立體聲)音頻聲道信號和TTT參數(shù),在操作1960,可壓縮在操作1900至1950產(chǎn)生的參數(shù)和在操作1950產(chǎn)生的立體聲音頻聲道信號,以產(chǎn)生比特流。圖20示出根據(jù)本發(fā)明的實(shí)施例的多聲道音頻信號編碼系統(tǒng),該多聲道音頻信號編碼系統(tǒng)可包括例如第一 OTT編碼器2000、第二 OTT編碼器2010、第三OTT編碼器2020、第四OTT編碼器2030、第五OTT編碼器2040、第六OTT編碼器2050、以及比特流產(chǎn)生單元2060。第一 OTT編碼器2000可使用前左中音頻聲道(FLC)信號和前右中音頻聲道(FRC)信號產(chǎn)生第一 OTT音頻聲道(C’ )信號和第一 OTT參數(shù),其中,第一 OTT參數(shù)可包括關(guān)于相應(yīng)的聲道之間的幅值差和相似性的信息。第二 OTT編碼器2010可使用前左音頻聲道(FL)信號和后左音頻聲道(BL)信號產(chǎn)生第二 OTT音頻聲道(L’)信號和第二 OTT參數(shù),其中,第
二OTT參數(shù)可包括關(guān)于相應(yīng)的聲道之間的幅值差和相似性的信息。第三OTT編碼器2020可使用前右音頻聲道(FR)信號和后右音頻聲道(BR)信號產(chǎn)生第三OTT音頻聲道(R’ )信號和第三OTT參數(shù),其中,第三OTT參數(shù)可包括關(guān)于相應(yīng)的聲道之間的幅值差和相似性的信肩、O第四OTT編碼器2030可使用中音頻聲道(C)信號和低音音頻聲道(LFE)信號產(chǎn)生第四OTT音頻聲道(C”)信號和第四OTT參數(shù),其中,第四OTT參數(shù)可包括關(guān)于相應(yīng)的聲道之間的幅值差和相似性的信息。第五OTT編碼器2040可使用由第二 OTT編碼器2010輸出的L’音頻聲道信號和由第一 OTT編碼器2000輸出的C’音頻聲道信號產(chǎn)生第五OTT音頻聲道信號和第五OTT參數(shù),其中,第五OTT參數(shù)可包括關(guān)于相應(yīng)的聲道之間的幅值差和相似性的信息。第六OTT編碼器2050可使用由第三OTT編碼器2020輸出的R’音頻聲道信號
和由第四OTT編碼器2030輸出的C”音頻聲道信號產(chǎn)生第六OTT音頻聲道信號和第六OTT參數(shù),其中,第六OTT參數(shù)可包括關(guān)于相應(yīng)的聲道之間的幅值差和相似性的信息。然后,比特流產(chǎn)生單元2060可壓縮由第一至第六OTT編碼器2000至2050產(chǎn)生的參數(shù)、由第五OTT編碼器2040產(chǎn)生的第五OTT音頻聲道信號以及由第六OTT編碼器2050產(chǎn)生的第六OTT音頻聲道信號,以產(chǎn)生比特流。圖21示出根據(jù)本發(fā)明的實(shí)施例的多聲道音頻信號編碼方法。在操作2100,可從FLC音頻聲道信號和FRC音頻聲道信號產(chǎn)生第一 OTT音頻聲道(C’)信號和第一 OTT參數(shù)。在操作2110,可從FL音頻聲道信號和BL音頻聲道信號產(chǎn)生第二 OTT音頻聲道(L’ )信號和第二 OTT參數(shù)。在操作2120,可從FR音頻聲道信號和BR音頻聲道信號產(chǎn)生第三OTT音頻聲道(R’ )信號和第三OTT參數(shù)。在操作2130,可從C音頻聲道信號和LFE音頻聲道信號產(chǎn)生第四OTT音頻聲道(C”)信號和第四OTT參數(shù)。在操作2140,可從在操作2110產(chǎn)生的L’音頻聲道信號和在操作2100產(chǎn)生的C’音頻聲道信號產(chǎn)生第五OTT音頻聲道信號和第五OTT參數(shù)。在操作2150,可從在操作2120產(chǎn)生的R’音頻聲道信號和在操作2130產(chǎn)生的C”音頻聲道信號產(chǎn)生第六OTT (立體聲)音頻聲道信號和第六OTT參數(shù)。在操作2160,可壓縮在操作2100至2140產(chǎn)生的參數(shù)、在操作2140產(chǎn)生的第五OTT音頻聲道信號以及在操作2150產(chǎn)生的立體聲音頻聲道信號,以產(chǎn)生比特流。除了上面所述的實(shí)施例,本發(fā)明的實(shí)施例還可通過介質(zhì)(例如,計算機(jī)可讀介質(zhì))上的計算機(jī)可讀代碼/指令被實(shí)施,以控制至少一個處理部件來實(shí)施上述任何實(shí)施例。所述介質(zhì)可對應(yīng)于允許計算機(jī)可讀代碼的的存儲和/或傳輸?shù)娜魏谓橘|(zhì)。計算機(jī)可讀代碼可以各種方式在介質(zhì)上被記錄/傳輸,介質(zhì)的示例包括例如磁存儲介質(zhì)(例如,ROM、軟盤、硬盤等)、光記錄介質(zhì)(例如,CD-ROM或DVD)以及諸如通過互聯(lián)網(wǎng)的載波的存儲/傳輸介質(zhì)。這里,介質(zhì)還可以是根據(jù)本發(fā)明實(shí)施例的諸如作為結(jié)果的信號或比特流的信號。介質(zhì)還可以是分布式網(wǎng)絡(luò),從而計算機(jī)可讀代碼以分布式方式存儲/傳輸和執(zhí)行。此外,僅作為示例,所述處理部件可包括處理器或計算機(jī)處理器,處理部件可以分布和/或包括在單個裝置中。除了上面所述,盡管從系統(tǒng)的角度解釋了實(shí)施例,但是相應(yīng)的實(shí)施例可同樣在設(shè)備中被實(shí)施。
盡管已經(jīng)顯示和描述了本發(fā)明的幾個實(shí)施例,但是本領(lǐng)域的技術(shù)人員應(yīng)該理解,在本發(fā)明的原理和精神的情況下,可以對這些實(shí)施例進(jìn)行改變,本發(fā)明的范圍由權(quán)利要求及其等同物限定。
權(quán)利要求
1. 一種多聲道音頻信號解碼方法,包括 使用TTT空間信息將兩個音頻聲道信號解碼為第一、第二和第三聲道信號; 使用第一 OTT空間信息將第一聲道信號第一解碼為第一復(fù)數(shù)個聲道信號; 使用第二 OTT空間信息將第二聲道信號第二解碼為第二復(fù)數(shù)個聲道信號; 使用第三OTT空間信息將第三聲道信號第三解碼為第三復(fù)數(shù)個聲道信號; 使用第四OTT空間信息將第一復(fù)數(shù)個聲道信號中的一個聲道信號第四解碼為第四復(fù)數(shù)個聲道信號; 使用第五OTT空間信息將第二復(fù)數(shù)個聲道信號中的一個聲道信號第五解碼為第五復(fù)數(shù)個聲道信號, 其中,通過利用使用樹結(jié)構(gòu)布置的解碼器來分別執(zhí)行所有的解碼操作。
全文摘要
一種對多聲道音頻信號進(jìn)行編碼/解碼的系統(tǒng)、介質(zhì)和方法,所述系統(tǒng)包括解碼級別產(chǎn)生單元,產(chǎn)生用于將包括一定數(shù)量的音頻聲道信號和空間信息的比特流解碼為一定數(shù)量的音頻聲道信號的解碼級別信息,其中,所述空間信息包括關(guān)于相應(yīng)的聲道之間的幅值差和/或相似性的信息;音頻解碼器,根據(jù)解碼級別信息對比特流進(jìn)行解碼。因此,即使單個輸入流也可基于使用的揚(yáng)聲器配置的類型被選擇性地解碼為合適數(shù)量的聲道??赏ㄟ^對輸入的比特流進(jìn)行部分地解碼來實(shí)現(xiàn)可伸縮聲道解碼。在可伸縮聲道解碼中,解碼器可設(shè)置解碼級別,并根據(jù)解碼級別輸出音頻聲道信號,從而可降低解碼復(fù)雜性。
文檔編號H03M7/30GK102779512SQ201210190880
公開日2012年11月14日 申請日期2006年11月21日 優(yōu)先權(quán)日2005年11月21日
發(fā)明者吳殷美, 苗磊, 金重會 申請人:三星電子株式會社