專利名稱:壓縮多聲道音頻位元流的解碼裝置及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種壓縮多聲道音頻位元流的解碼裝置及方法,特別是一種可降低聲道數(shù)的多聲道音頻位元流的解碼裝置及方法。
不論由于降低表示完整語音信號的數(shù)字信息量是否能得到經(jīng)濟效益,音頻壓縮技術(shù)都是會被使用的,例如杜比(Dolby)AC-3、數(shù)字劇場系統(tǒng)(Digital Theatre System;DTS)和MPEG音頻壓縮編碼法等等,美國已選定杜比AC-3的壓縮格式作為高清晰度電視(highdefinition television;HDTV)的音頻格式標準,其也被廣泛使用在數(shù)字通用光盤(Digital Versatile Disk;DVD)上。
利用杜比AC-3數(shù)字壓縮編碼法,能將5.1聲道的脈沖碼從調(diào)制(pulse code modulation;PCM)編碼變成為一序列位元流,以32kbps至640kbps的數(shù)據(jù)傳送速率傳送;此處,0.1聲道表示只用小部分帶寬的聲道傳送低頻(超低音)信號。一般使用杜比AC-3數(shù)字壓縮編碼法時,壓縮率可達1∶10,通常運用在人造衛(wèi)星或地球上的音頻信號傳播,音頻信號一般經(jīng)由金屬或光纖電纜傳送,在磁性及光學材料、半導(dǎo)體或其他儲存媒體中儲存。
利用杜比AC-3編碼法是使用一個時域消除濾波存儲單元將一序列音頻信號由時域信號轉(zhuǎn)換成頻域(frequency domain)系數(shù),特別是轉(zhuǎn)換成DTC(離散余弦轉(zhuǎn)換)系數(shù),經(jīng)量化達到高壓縮率。編碼過程的第一步驟將音頻信號由一序列PCM時間采樣轉(zhuǎn)換為一組頻率系數(shù),各組頻率系數(shù)以浮點表示法表示為一個二進位指數(shù)(exponent)和一個尾數(shù)(mantissa),根據(jù)相應(yīng)的編碼程序,將這些指數(shù)編碼,然后,進行位元分配程序(bit allocation process),將這些尾數(shù)進行量化,量化的程度由位元分配過程決定。
解碼過程是編碼過程的逆過程,解碼裝置必須同時對被編碼的位元流、檢錯碼復(fù)原,以及取消對各種數(shù)據(jù)的格式形式(例如編碼過的頻譜波包和被量化的尾數(shù)),以將數(shù)據(jù)復(fù)原。解碼過程主要包括下列四個步驟(1)將頻譜波包還原為指數(shù);(2)將該指數(shù)進行位元分配;(3)此位元分配過程決定用于打開波包及去除尾數(shù)的位元數(shù);(4)將頻率系數(shù)的指數(shù)和尾數(shù)轉(zhuǎn)換成時域信號,以產(chǎn)生PCM時間采樣。對解碼過程的詳細描述,如下杜比AC-3解碼器使用一時域消除(time-domain-aliasing-cancellation;TDAC)濾波器單元將輸入的音頻信號序列x(n)由時域信號轉(zhuǎn)換為頻域系數(shù),更進一步說是進行離散式余弦轉(zhuǎn)換(Discrete CosineTransform;以下簡稱為DCT),以512點采樣視窗h(n)對該音頻信號序列進行采樣,以產(chǎn)生視窗化數(shù)據(jù)W(n)=h(n)xf(n) (1)其中xf(n)是512個輸入數(shù)據(jù)中的第fth個取樣區(qū)塊,xf-1(n)表示512個輸入數(shù)據(jù)中的第(f-1)th個取樣區(qū)塊,第xf(n)與第xf-1(n)取樣重復(fù)256點。
將這個視窗化數(shù)據(jù)w(n)轉(zhuǎn)換為離散式余弦(DCT)系數(shù)時,可視數(shù)據(jù)內(nèi)容決定是采用512點轉(zhuǎn)換還是兩次256點轉(zhuǎn)換,512點轉(zhuǎn)換稱為長DCT轉(zhuǎn)換,256點的轉(zhuǎn)換稱為短DCT轉(zhuǎn)換。就長DCT轉(zhuǎn)換而言,從下列公式可得一長DCT系數(shù)yf(k)yf(k)=1256Σn=0511wf(n)cos[π1024(2n+1)(2k+1)+π4(2k+1)]---(2)]]>其中0≤k≤255就短DCT轉(zhuǎn)換而言,視窗化數(shù)據(jù)w(n)則被分為兩組256點數(shù)據(jù),分別是wf1(n)與wf2(n),且被轉(zhuǎn)換為兩組短DCT系數(shù)yf1(k)與yf2(k)yf1(k)=1128Σn=0255wf1(n)cos[π512(2n+1)(2k+1)]]]>yf2(k)=1128Σn=0255wf2(n)cos[π512(2n+1)(2k+1)+π2(2k+1)]---(3)]]>其中0≤k≤127且0≤n≤255為重建原始數(shù)據(jù),必須對該DCT系數(shù)進行一逆轉(zhuǎn)換,就長DCT系數(shù)而言,該逆向轉(zhuǎn)換公式如下w-f(n)=Σk=0255yf(k)cos[π1024(2n+1)(2k+1)+π4(2k+1)]---(4)]]>其中0≤n≤511且0≤k≤255就短DCT系數(shù)而言,逆轉(zhuǎn)換公式如下w-f1(n)=Σk=0127yf1(k)cos[π512(2n+1)(2k+1)]]]>w-f2(n)=Σk=0127yf2(k)cos[π512(2n+1)(2k+1)+π2(2k+1)]---(5)]]>其中0≤n≤255 且0≤k≤127經(jīng)過逆運算之后,進行疊加運算,就長DCT系數(shù)而言,視窗域系數(shù)乘上一合成視窗f(n)再加上之前的系數(shù)可得原始數(shù)據(jù)x~(n)=w~(n)f(n)+w~f-1(256+n)f(256+n)---(6)]]>其中0≤n≤255在短轉(zhuǎn)換中,需將兩個視窗域系數(shù)結(jié)合然后再經(jīng)由類似長轉(zhuǎn)換的運算處理。
在許多重建系統(tǒng)中,揚聲器的數(shù)目與編碼聲道的數(shù)目并不一致,例如用一般個人電腦的左右揚聲器輸出經(jīng)杜比AC-3壓縮的5個聲道的音頻信號。為了重現(xiàn)全部聲音效果,必須將5個(或5.1個)聲道的信號相互混合(intermixing),在聲道的數(shù)目減少的同時保留高質(zhì)量的音頻信號。
現(xiàn)有的減聲道混音技術(shù)是在時域中進行,現(xiàn)有的減聲道混音是以下面的形式進行L0(n)R0(n)=1c0s00c10sL(n)C(n)R(n)SL(n)SR(n)---(7)]]>其中L(n)、C(n)、R(n)、SL(n)以及SR(n)分別是原來的左、中央、右、左環(huán)繞以及右環(huán)繞聲道,可變常數(shù)c和s為環(huán)繞混音級數(shù),通常選自1至0.5范圍的數(shù)值,L0(n)和R0(n)則為減聲道混音之后的左右聲道輸出信號。
圖1為現(xiàn)有技術(shù)中的解碼器,用于將5個聲道的音頻信號減聲道混音成2聲道的音頻信號。每一個聲道都需要分別進行逆向離散式余弦轉(zhuǎn)換(inverse discrete cosine transform;IDCT)和疊加(overlap-and-add;OA)運算。執(zhí)行疊加運算是因為在編碼過程中,時間取樣的重疊區(qū)塊被乘上時間視窗系數(shù),然后將其轉(zhuǎn)換成為頻域系數(shù),由于存在重疊區(qū)塊,所以每一PCM輸入取樣都被表示為兩個連續(xù)的轉(zhuǎn)換區(qū)塊,因此,在解碼過程中必須反序?qū)?yīng)。
逆向離散式余弦轉(zhuǎn)換(IDCT)步驟,是將音頻數(shù)據(jù)由頻域系數(shù)轉(zhuǎn)換為視窗域系數(shù);疊加(OA)步驟,是由視窗域系數(shù)重建時域音頻數(shù)據(jù);視窗域系數(shù)是指仍然需要進行疊加的一種系數(shù),由于,IDCT和OA轉(zhuǎn)換的復(fù)雜性,所以需要減小在減聲道混音過程中必須進行的IDCT和OA運算的次數(shù)。
如圖2所示,其顯示一個具有在視窗域中進行減聲道混音的音頻解碼器,這個音頻解碼器包括五個逆向離散式余弦轉(zhuǎn)換器1、_2、3、4及5,一個減聲道混音器,兩個疊加器OA-1和OA-2,此逆向離散式余弦轉(zhuǎn)換電路接收一預(yù)處理器(未顯示)產(chǎn)生的五個聲道的離散式余弦轉(zhuǎn)換(DCT)系數(shù),此預(yù)處理器接收一壓縮音頻位元流,執(zhí)行錯誤更正以及區(qū)塊重組(block de-formatting),然后,將DCT系數(shù)依不同聲道分開,該處理程序為現(xiàn)有技術(shù)。
五個逆向離散式余弦轉(zhuǎn)換器分別接收五個聲道的DCT系數(shù),然后輸出視窗域系數(shù)至減聲道混音器,此視窗域系數(shù)經(jīng)由減聲道混音器交互混合,產(chǎn)生左右聲道的視窗域系數(shù),再經(jīng)由第一和第二疊加器將視窗域系數(shù)轉(zhuǎn)變?yōu)闀r域系數(shù),然后輸出至揚聲器放大單元(圖中未顯示)。
圖2所示的解碼器中,雖然減少了疊加器的數(shù)目,但是仍需要五個逆向離散式余弦轉(zhuǎn)換器將DCT系數(shù)轉(zhuǎn)換為視窗域系數(shù),這種電路中的運算操作仍然很復(fù)雜。
本發(fā)明的目的在于提供一種在頻域范圍中實現(xiàn)對數(shù)字式音頻信號減聲道混音的解碼裝置及方法,以減少杜比AC-3解碼器的計算次數(shù)和硬件的復(fù)雜性。
為達到上述目的本發(fā)明采取如下措施本發(fā)明的一種用于對數(shù)字音頻位元流解碼的解碼裝置,該數(shù)字音頻位元流具有一第一組頻域系數(shù),第一組頻域系數(shù)表示來自至少二個不同聲道的第一組時域音頻信號;解碼裝置包括減聲道混音裝置及頻域到時域轉(zhuǎn)換裝置;其特征在于減聲道混音裝置,用以將第一組頻域系數(shù)混合,以產(chǎn)生一第二組頻域系數(shù);混合后的聲道數(shù)少于混合前的聲道數(shù);頻域到時域轉(zhuǎn)換裝置,用以將第二組頻域系數(shù)轉(zhuǎn)換為第二組時域信號。
其中,所述轉(zhuǎn)換裝置包括頻域系數(shù)到視窗域系數(shù)的轉(zhuǎn)換裝置及疊加裝置;頻域系數(shù)到視窗域系數(shù)的轉(zhuǎn)換裝置,用以將所述第二組頻域系數(shù)轉(zhuǎn)換為一組視窗域系數(shù);疊加裝置,用以將第二組視窗域系數(shù)疊加,以產(chǎn)生第二組時域信號。
本發(fā)明的另一種解碼裝置,用以將預(yù)處理的數(shù)字音頻位元流解碼,數(shù)字音頻位元流具有一組短DCT系數(shù)及一組長DCT系數(shù),相應(yīng)于來自不同聲道的第一組時域音頻信號,其特征在于,該裝置包括第一轉(zhuǎn)換裝置,用以將該組短DCT系數(shù)轉(zhuǎn)換為一第二組長DCT系數(shù);減聲道混音裝置,用以將第一組長DCT系數(shù)及第二組長DCT系數(shù)減聲道混音,以產(chǎn)生一預(yù)設(shè)聲道數(shù)音頻信號的第三組長DCT數(shù);第二轉(zhuǎn)換裝置,用以將第三組長DCT系數(shù)轉(zhuǎn)換為第二組時域信號,提供給較第一組時域信號代表聲道數(shù)更少的聲道使用。
本發(fā)明的一種減聲道混音的方法,包括下列步驟(a)將一第一組的DCT系數(shù)進行減聲道混音,進而產(chǎn)生一組減聲道混音后的DCT系數(shù);(b)將減聲道混音后的DCT系數(shù)轉(zhuǎn)換為第二組時域信號,以供一預(yù)設(shè)聲道用。
其中,所述DCT系數(shù)轉(zhuǎn)換步驟包括下列步驟(b1)逆向離散式余弦轉(zhuǎn)換所述減聲道混音后的DCT系數(shù)以產(chǎn)生視窗域系數(shù);(b2)對視窗域系數(shù)進行疊加運算,以產(chǎn)生所述第二組時域信號。
與現(xiàn)有技術(shù)相比,本發(fā)明具有如下效果1、本發(fā)明提供方法簡單易行,由于采用本方法,可減少AC-3編碼中所需的乘法運算量,可降低解碼器的復(fù)雜性以及整體成本。
2、本發(fā)明經(jīng)由簡化計算過程,能夠用軟件來完成AC-3解碼過程,而不必使用特定的硬件解碼器。
結(jié)合附圖及實施例對本發(fā)明技術(shù)內(nèi)容進行詳細說明如下附圖簡單說明圖1為現(xiàn)有技術(shù)中解碼器的電路方框圖,其是對以時域表示的數(shù)字式音頻位元流執(zhí)行減聲道混音;圖2為現(xiàn)有技術(shù)中另一種解碼器的電路方框圖,其是對以視窗域表示的數(shù)字式音頻位元流減聲道混音;
圖3本發(fā)明的對以頻域表示的數(shù)字式音頻位元流減聲道混音的解碼器的電路方框圖,其中,同時使用長逆向離散式余弦轉(zhuǎn)換器及短逆向離散式余弦轉(zhuǎn)換器;圖4為本發(fā)明實施例的電路方框圖,其中解碼器包括數(shù)個虛擬轉(zhuǎn)換器,將短離散式余弦系數(shù)轉(zhuǎn)換為長離散式余弦系數(shù),且在頻域中進行減聲道混音過程。
附錄A是一個摘錄自1997年12月24日送交給“IEEE會刊—語言與音頻信號處理”的論文,此篇論文描述本發(fā)明中AC-3位元流減少混頻的原則。
為便于描述,上述方程式(1)至(6)改用矩陣表示,例如長DCT系數(shù)的逆向離散式余弦轉(zhuǎn)換中,方程式(4)可寫為W~f=W~f1W~f2=L1+L2-Yf---(8)]]>其中的Yf為由預(yù)處理器所提取的長DCT系數(shù)組成的256×256對角矩陣,且⟨L1+⟩n,k=cos(π1024(2n+1+256)(2k+1))for0≤n≤255,0≤k≤255---(9)]]>⟨L2+⟩n,k=cos(π1024(2n+1+768)(2k+1))for0≤n≤255,0≤k≤255---(10)]]>對于短DCT系數(shù)的反離散式余弦轉(zhuǎn)換,方程式(5)可寫為W~f=W~f1W~f2=S1+00S2+Yf1Yf2---(11)]]>其中Yf1和Yf2為由預(yù)處理器所讀取的短DCT系數(shù)組成的128×128對角矩陣。矩陣Yf1包括由預(yù)處理器所讀取的短DCT系數(shù)的第一部分,而矩陣Yf2包括由預(yù)處理器所讀取的短DCT系數(shù)的第二部分,其中,S1+和S2+項可表示為⟨S1+⟩n,k=cos(π512(2n+1)(2k+1))for0≤n≤255,0≤k≤127---(12)]]>⟨S2+⟩n,k=cos(π512(2n+1)(2k+1+256))for0≤n≤255,0≤k≤127---(13)]]>疊加過程中的方程式(6)可改變?yōu)閄~f=[F1F2]W~f1W~(f-1)2---(14)]]>其中F1和F2為256×256對角矩陣,定義為<F1>nn=f(n),<F2>nn=f(256+n)。
如圖3所示,其為以頻域表示的數(shù)字式音頻位元流減少混頻的解碼器的電路方框圖,其中,同時使用長離散式余弦轉(zhuǎn)換及短離散式余弦轉(zhuǎn)換;其中,音頻解碼器300包括一選擇器302、一長減聲道混音器304、一短減聲道混音器306、兩組長逆向離散式余弦轉(zhuǎn)換(L-IDCT_1和L-IDCT_2)308、310、兩個短逆向離散式余弦轉(zhuǎn)換塊(S-IDCT_1和S-IDCT_2)312、314、兩個信號加法器316、318以及兩個疊加塊(OA-1和OA-2)320、322。
由圖3可知,音頻解碼器300具有減聲道混音、逆向離散式余弦轉(zhuǎn)換以及疊加功能,以至使聲道數(shù)少于原被編碼的數(shù)字位元流的聲道。
選擇器302接收來自信號線324a到324e的DCT系數(shù),判斷信號為長DCT系數(shù)Yf還是短DCT系數(shù)(Yf1和Yf2),并分別傳送至長減聲道混音器304及短減聲道混音器306;長減聲道混音器304用下列的演算法執(zhí)行減聲道混音動作,以產(chǎn)生被減聲道混音的長DCT系數(shù)Yf(LD)Yf(RD)=IC0S00C10SYf(L)Yf(C)Yf(R)Yf(SL)Yf(SR)---(15)]]>
其中Yf(LD)和Yf(RD)分別為左右聲道減聲道混音后的DCT系數(shù)。矩陣Yf(L)、Yf(C)、Yf(R)、Yf(SL)以及Yf(SR)包含預(yù)處理器讀取的左、中央、右、左環(huán)繞及右環(huán)繞聲道的長DCT系數(shù),矩陣I為一單位矩陣,矩陣C和S為256×256的對角矩陣,C=C0…00C…000…000…CS=S0…00S…000…000…S---(16)]]>其中C和S為中間和環(huán)繞聲道的混音系數(shù),一般約在0.5至1的范圍。
短減聲道混音器304用下列的演算法執(zhí)行減聲道混音動作,以產(chǎn)生被減聲道混音的長DCT系數(shù)Yf1(LD)Yf1(RD)=IC0S00CI0SYf1(L)Yf1(C)Yf1(R)Yf1(SL)Yf1(SR)---(17)]]>Yf2(LD)Yf2(RD)=IC0S00CI0SYf2(L)Yf2(C)Yf2(R)Yf2(SL)Yf2(SR)---(18)]]>其中Yf1(LD)、Yf1(RD)、Yf2(LD)以及Yf2(RD)分別為左右聲道減聲道混音后的短DCT系數(shù)。其中C和S為中央和環(huán)繞混音系數(shù)的128×128的對角矩陣。
經(jīng)過長減聲道混音器304混音后的長DCT系數(shù),被傳送至逆向離散式余弦轉(zhuǎn)換器(L-IDCT_1和L-IDCT_2)308、310,進行左和右聲道的長DCT系數(shù)運算,轉(zhuǎn)換器308和310依據(jù)下列運算將長DCT系數(shù)轉(zhuǎn)換為視窗域系數(shù)W~f1(L0)W~f1(R0)=L1+00L1+Yf(LD)Yf(RD)---(19)]]>W~f2(L0)W~f2(R0)=L2+00L2+Yf(LD)Yf(RD)---(20)]]>同樣,經(jīng)過短減聲道混音器304混音后的短DCT系數(shù),被傳送至逆向離散式余弦轉(zhuǎn)換器(S-IDCT_1和S-IDCT_2)312、314,進行左和右聲道的短DCT系數(shù)運算,轉(zhuǎn)換器312和314依據(jù)下列運算將短DCT系數(shù)轉(zhuǎn)換為短視窗域系數(shù)W~f1(L0)W~f1(R0)=S1+00S1+Yf1(LD)Yf1(RD)---(21)]]>W~f2(L0)W~f2(R0)=S2+00S2+Yf2(LD)Yf2(RD)---(22)]]>由短逆向離散式余弦轉(zhuǎn)換器312、314產(chǎn)生的短視窗域系數(shù)在信號加法器316和318中與長視窗域系數(shù)結(jié)合,結(jié)合后的信號傳送至疊加器320、322,然后根據(jù)下列演算法轉(zhuǎn)換為時域信號Xf(L0)Xf(R0)=F1F20000F1F2(W~f1(L0)W~(f-1)2(L0)00+00W~f1(R0)W~(f-1)2(R0))---(23)]]>其中Xf(L0)和Xf(R0)為左右聲道減聲道混音后的時域音頻信號,而后再將時域音頻信號傳送至放大單元或揚聲器。
如圖4所示,其表示本發(fā)明的一實施例,為了減少減聲道混音過程所需的逆向離散式余弦轉(zhuǎn)換次數(shù),首先將短DCT系數(shù)轉(zhuǎn)換為長DCT系數(shù),然后對長DCT系數(shù)進行減聲道混音。解碼器400包括5個虛擬(virtual)轉(zhuǎn)換器402a、402b、402c、402d及402e、一個減聲道混音器404、兩個逆向離散式余弦轉(zhuǎn)換器406a和406b,以及兩個疊加器408a和408b。
這些虛擬轉(zhuǎn)換器接收來自五個聲道的信號,然后判定信號為短DCT系數(shù)或長DCT系數(shù),若為短DCT系數(shù)則依下列方程式將其轉(zhuǎn)換為長DCT系數(shù)Yf=VYf1Yf2---(24)]]>其中V=[V1V2]=[L1·H1·F1·S1+L2·H2·F2·S2+]---(25)]]>這里的Yf1和Yf2包含短DCT系數(shù),且⟨L1⟩kn=1256cos(π1024(2n+1+256)(2k+1)),0≤k≤255,0≤n≤255---(26)]]>⟨L2⟩kn=1256cos(π1024(2n+1+768)(2k+1)),0≤k≤255,0≤n≤255---(27)]]>矩陣H1和H2為對角矩陣,<H1>nn=h(n),0≤n≤255,<H2>nn=h(n+256),0≤n≤255;且F1、F2、S1+以及S2+與方程式(12)、(13)和(14)中的符號所代表的意義相同。
方程式(25)可改寫為Yf(K1)=Σk2=0127{V1(K1,K2)Yf1(K2)+V2(K1,K2)Yf2(K2)}forK1=0..255---(28)]]>利用第二或第三階的多項式展開,將不重要的項次取近似值可將上式更進一步簡化,V1(k1、k2)中大部分的項次都集中在k2=k1/2附近,所以將遠離k1/2附近,所以將遠離k1/2的項次取近似值并不會降低其準確性。
重寫(28)式的第一項為Yf(K1)=Σk1=0127{V1(K1,K2)Yf1(K2)}---(29)]]>可將上式拆成三部分,一部分包含鄰近k2=k1/2的項次的中間部分,第二部分為中間之前的部分,第三部分為中間之后的部分。Yf1(K1)=Σk2=0[k12]-M{V1(K1,K2)Yf1(K2)}+Σk1=[k12]-M+1[k12]+M{V1(K1,K2)Yf1(K2)}+Σk2=[k12]+M+1127{V1(K1,K2)Yf1(K2)}-(30)]]>在這里中間部分包含2M個點,然后以第p階的多項式對方程式(30)中的第一和第三項取進似值V1(k1,k2)=Σp=0p-1a(k1,p)k2pfork2=0,...,[k12]-M---(31)]]>V1(k1,k2)=Σp=0p-1a(k1,p)k2pfork2=[k12]-M+1,...,127---(32)]]>這里的a和b分別為當
和
127時,多項式L1.H1.F1.S1+的展開系數(shù),用多項式近似法計算方程式(30)的第一和第三項,會比展開V1.Yf1的所有余弦項之和快得多。
另外,這里也顯示V1(k1,k2)與V2(k1,k2)之間存在一一對應(yīng)關(guān)系V2(k1,k2)=(-1)(k1+k2)×V1(255-k1,127-k2)(33)因此,一但得到V1的項次就可推算出V2,再將V2帶入下式中Yf2(k1)=Σk2=0127{V2(k1,k2)Yf2(k2)}---(34)]]>將方程式(31)與(34)的結(jié)果結(jié)合,可得到方程式(29)中的長DCT系數(shù)。
經(jīng)由虛擬轉(zhuǎn)換器402a至402e將短DCT系數(shù)轉(zhuǎn)換為長DCT系數(shù)之后,將長DCT系數(shù)傳送至減聲道混音器404,減聲道混音器404以前述的方程式(16)將長DCT系數(shù)進行減聲道混音,然后將減聲道混音后的長DCT系數(shù)傳送至逆向離散式余弦轉(zhuǎn)換器406a至406b。逆向離散式余弦轉(zhuǎn)換器406a至406b產(chǎn)生的視窗域系數(shù)再傳送至兩個疊加器408a及408b,然后產(chǎn)生聲道的時域音頻信號。
以上僅為本發(fā)明的實施例的充分描述而已,并非用以限定本發(fā)明的保護范圍;例如減聲道混音法并非僅限定于使用在AC-3演算法,其他超過兩聲道的音頻壓縮演算法,例如MPEG-2或DTS,當揚聲器或放大器的數(shù)目少于數(shù)字位元流的聲道數(shù)時,均可使用減聲道混音法,因此凡其它在本發(fā)明構(gòu)思下完成的等效改變或修飾,均應(yīng)包含在本發(fā)明的權(quán)利范圍內(nèi)。
權(quán)利要求
1.一種用于對數(shù)字音頻位元流解碼的解碼裝置,該數(shù)字音頻位元流具有一第一組頻域系數(shù),第一組頻域系數(shù)表示來自至少二個不同聲道的第一組時域音頻信號;解碼裝置包括減聲道混音裝置及頻域到時域轉(zhuǎn)換裝置;其特征在于減聲道混音裝置,用以將第一組頻域系數(shù)混合,以產(chǎn)生一第二組頻域系數(shù);混合后的聲道數(shù)少于混合前的聲道數(shù);頻域到時域轉(zhuǎn)換裝置,用以將第二組頻域系數(shù)轉(zhuǎn)換為第二組時域信號。
2.根據(jù)權(quán)利要求1所述的裝置,其特征在于,所述轉(zhuǎn)換裝置包括頻域系數(shù)到視窗域系數(shù)的轉(zhuǎn)換裝置及疊加裝置;頻域系數(shù)到視窗域系數(shù)的轉(zhuǎn)換裝置,用以將所述第二組頻域系數(shù)轉(zhuǎn)換為一組視窗域系數(shù);疊加裝置,用以將第二組視窗域系數(shù)疊加,以產(chǎn)生第二組時域信號。
3.根據(jù)權(quán)利要求1所述的裝置,其特征在于,所述第一組頻域系數(shù)包含一組短頻域系數(shù)以及一組長頻域系數(shù);減聲道混音裝置包括一短減聲道混音器及一長減聲道混音器;短減聲道混音器,用以對短頻域系數(shù)進行減聲道混音,以產(chǎn)生一組減聲道混音后的短頻域系數(shù);長減聲道混音器,用以對長頻域系數(shù)進行減聲道混音,以產(chǎn)生一組減聲道混音后的長頻域系數(shù)。
4.根據(jù)權(quán)利要求3所述的裝置,其特征在于,所述轉(zhuǎn)換裝置包括一長轉(zhuǎn)換器,用以將該組減聲道混音后的長頻域系數(shù)轉(zhuǎn)換為一第一組視窗域系數(shù);一短轉(zhuǎn)換器,用以將該組減聲道混音后的短頻域系數(shù)轉(zhuǎn)換為一第二組視窗域系數(shù)。
5.根據(jù)權(quán)利要求4所述的裝置,其特征在于,還包括一加法器,用以將所述第一組視窗域系數(shù)與第二組視窗域系數(shù)結(jié)合,加法器將結(jié)合后的視窗域系數(shù)傳送至所述疊加裝置。
6.一種解碼裝置,用以將預(yù)處理的數(shù)字音頻位元流解碼,數(shù)字音頻位元流具有一組短DCT系數(shù)及一組長DCT系數(shù),相應(yīng)于來自不同聲道的第一組時域音頻信號,其特征在于,該裝置包括第一轉(zhuǎn)換裝置,用以將該組短DCT系數(shù)轉(zhuǎn)換為一第二組長DCT系數(shù);減聲道混音裝置,用以將第一組長DCT系數(shù)及第二組長DCT系數(shù)減聲道混音,以產(chǎn)生一預(yù)設(shè)聲道數(shù)音頻信號的第三組長DCT數(shù);第二轉(zhuǎn)換裝置,用以將第三組長DCT系數(shù)轉(zhuǎn)換為第二組時域信號,提供給較第一組時域信號代表聲道數(shù)更少的聲道使用。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述第二轉(zhuǎn)換裝置包括DCT-至-視窗域轉(zhuǎn)換裝置,用來將所述第三組長DCT系數(shù)轉(zhuǎn)換為一組視窗域系數(shù);疊加裝置,用以將該組視窗域系數(shù)進行疊加運算,進而產(chǎn)生所述第二組時域信號。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述第一轉(zhuǎn)換裝置用下列方程式將短DCT系數(shù)轉(zhuǎn)換為長DCT系數(shù)Yf(k1)=Σk2=0127{V1(k1,k2)Yf1(k2)+V2(k1,k2)Yf2(k2)}]]>其中的Yf1(k1,k2)和Yf2(k1,k2)為短DCT系數(shù),V1(k1,k2)和V2(k1,k2)為轉(zhuǎn)換系數(shù),Yf(k1)為長DCT系數(shù),且K1為0至255的整數(shù)。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述V1(k1,k2)的特定項以多項式近似法計算。
10.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述V2(k1,k2)用下列方程式計算V2(K1,K2)=(-1)(k1+k2)×V1(255-K1,127-K2)
11.一種減聲道混音的方法,包括下列步驟(a)將一第一組的DCT系數(shù)進行減聲道混音,進而產(chǎn)生一組減聲道混音后的DCT系數(shù);(b)將減聲道混音后的DCT系數(shù)轉(zhuǎn)換為第二組時域信號,以供一預(yù)設(shè)聲道用。
12.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述DCT系數(shù)轉(zhuǎn)換步驟包括下列步驟(b1)逆向離散式余弦轉(zhuǎn)換所述減聲道混音后的DCT系數(shù)以產(chǎn)生視窗域系數(shù);(b2)對視窗域系數(shù)進行疊加運算,以產(chǎn)生所述第二組時域信號。
13.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述第一組DCT系數(shù)包括一組長DCT系數(shù)以及一組短DCT系數(shù),所述DCT系數(shù)減聲道混音步驟包括(a1)短DCT系數(shù)進行減聲道混音,以產(chǎn)生一組減聲道混音后的短DCT系數(shù);(a2)將長DCT系數(shù)進行減聲道混音,以產(chǎn)生一組減聲道混音后的長DCT系數(shù);及(a3)兩組減聲道混音后的短DCT系數(shù)及長DCT系數(shù)結(jié)合,以產(chǎn)生第二組的DCT系數(shù)。
14.根據(jù)權(quán)利要求11所述的方法,其特征在于,所述第一組DCT系數(shù)包括一組短DCT系數(shù)及第一組長DCT系數(shù),所述減聲道混音步驟包括(a1)轉(zhuǎn)換短DCT系數(shù)成為一第二組長DCT系數(shù);(a2)減聲道混音第一組DCT系數(shù)及第二組長DCT系數(shù),進而產(chǎn)生減聲道混音后的DCT系數(shù)。
15.根據(jù)權(quán)利要求14所述的方法,其特征在于,所述短DCT系數(shù)轉(zhuǎn)換步驟是由短DCT系數(shù)產(chǎn)生所述第二組長DCT系數(shù),依下列方程式轉(zhuǎn)換Yf(k1)=Σk2=0127{V1(k1,k2)Yf1(k2)+V2(k1,k2)Yf2(k2)}]]>其中的Yf1(k1,k2)和Yf2(k1,k2)為短DCT系數(shù),V1(k1,k2)和V2(k1,k2)為轉(zhuǎn)換系數(shù),Yf(k1)為第一組長DCT系數(shù),K1為0至255的整數(shù)。
16.根據(jù)權(quán)利要求15所述的方法,其特征在于,所述V1(k1,k2)的特定項以多項式近似法計算。
17.根據(jù)權(quán)利要求15所述的方法,其特征在于,所述V2(k1,k2)用下列方程式由V1(k1,k2)算出V2(K1,K2)=(-1)(k1+K2)×V1(255-K1,127-K2)
18.一種將預(yù)處理的數(shù)字音頻位元流減聲道混音的方法,該數(shù)字音頻位元流具有一第一組頻域系數(shù),表示至少來自左聲道、右聲道、左環(huán)繞聲道以及右環(huán)繞聲道的音頻信號,該方法包括下列步驟(a)轉(zhuǎn)換具有短DCT系數(shù)的頻域系數(shù)群組為僅有長DCT系數(shù)的頻域系數(shù)群組,進而產(chǎn)生一僅包含長DCT系數(shù)的第二組頻域系數(shù);(b)減聲道混音第二組頻域系數(shù),以產(chǎn)生第三組頻域系數(shù),供左、右聲道信號用。
19.根據(jù)權(quán)利要求18所述的方法,其特征在于,所述將短DCT系數(shù)轉(zhuǎn)換為長DCT系數(shù)的步驟包括將所述短DCT系數(shù)與一組虛擬轉(zhuǎn)換系數(shù)做向量乘積。
20.一電腦包括一電腦的可讀取記錄媒體,具有數(shù)個電腦可讀程序碼,用以將預(yù)先處理的數(shù)字音頻位元流解碼,數(shù)字音頻位元流具有一第一組頻域信號,代表來自數(shù)個分離聲道的第一組時域音頻信號,第一組頻域信號具有一組短DCT系數(shù)以及一第一組長DCT系數(shù),在電腦程序中的電腦可讀程序碼至少包括電腦可讀程序碼,用來轉(zhuǎn)換該組短DCT系數(shù)以產(chǎn)生一第二組長DCT系數(shù);電腦可讀程序碼,用來轉(zhuǎn)換第一組長DCT系數(shù)以及第二組長DCT系數(shù),以產(chǎn)生一主要由長DCT系數(shù)組成的第二組頻域系數(shù);電腦可讀程序碼,用來將第二組頻域系數(shù)進行減聲道混音,以產(chǎn)生一第三組頻域系數(shù),以供一預(yù)設(shè)聲道用;電腦可讀程序碼,用來轉(zhuǎn)換第三組頻域系數(shù),以產(chǎn)生一第二組時域信號,提供給較第一組時域信號更少的聲道使用。
全文摘要
一種壓縮多聲道音頻位元流的解碼裝置及方法;本裝置包括:減聲道混音裝置及頻域到時域轉(zhuǎn)換裝置;本方法是在頻域中進行壓縮數(shù)字音頻信號的減聲道混音,將短離散式余弦系數(shù)快速虛擬轉(zhuǎn)換為長離散式余弦系數(shù),然后對長離散式余弦系數(shù)進行減聲道混音,再對減聲道混音后的長離散式余弦系數(shù)進行逆向離散式余弦轉(zhuǎn)換,產(chǎn)生視窗域信號,再對視窗域信號進行疊加運算,產(chǎn)生適合放大的時域信號,本裝置及方法可減少計算中的運算次數(shù)。
文檔編號H04S5/00GK1250293SQ9911132
公開日2000年4月12日 申請日期1999年8月6日 優(yōu)先權(quán)日1998年8月10日
發(fā)明者劉啟民, 李思瑋, 李文杰 申請人:揚智科技股份有限公司