專利名稱:減少數(shù)位音訊解碼器的暫存需求量的方法
技術(shù)領(lǐng)域:
本發(fā)明關(guān)于一種數(shù)位音訊解碼,特別是有關(guān)于一種用以減少數(shù)位音訊解碼器的暫存需求量的方法。
先進(jìn)電視系統(tǒng)委員會(huì)(Advanced Television System Committee,ATSC)提出一個(gè)稱作AC-3的對答(competing)的標(biāo)準(zhǔn),作為高解析度電視(HighDefinition Television,HDTV)的音訊服務(wù)標(biāo)準(zhǔn)。AC-3標(biāo)準(zhǔn)也已經(jīng)應(yīng)用在消費(fèi)性媒體(consumer media)中,例如數(shù)位音訊光碟(DVD)以及衛(wèi)星直播(direct satellite broadcast)。一個(gè)AC-3位元流(bitstream)是由資料框(frames)所組成,資料框(frames)代表著跨在所有聲道的1536個(gè)固定日間周期的PCM樣本。其中,每個(gè)資料框(frame)有六個(gè)音言區(qū)段(audio block),各表示著每一編碼的聲道的256個(gè)PCM樣本。AC-3音訊解碼技術(shù)需要某些步驟,例如位元分配(bit allocation)、反量化(dequantization)、去耦合(decoupling)、再矩陣化(rematrixing)、動(dòng)態(tài)范圍壓縮(dynamic range compression),以及反修正式離散余弦轉(zhuǎn)換(Inverse Modified Discrete Cosine Transform,IMDCT)。另一方面,含有兩團(tuán)(granules)的每一個(gè)MP3音訊資料框表示著1152個(gè)輸入PCM音訊樣本。MP3中的一團(tuán)可以視為各含有18個(gè)樣本的32個(gè)次頻帶,共具有576個(gè)樣本。MP3位元流的解碼亦需要一些步驟,例如音訊樣本的可變長度解碼(variable length decoding of audio samples)、縮放因子與位元分配的解碼(decoding of scale factors and bitallocation)、樣本的反量化(dequantization of samples)、反修正式離散余弦轉(zhuǎn)換的計(jì)算(computation of IMDCT),以及次頻帶樣本合成(synthesis of subband sample)。
為了重組(reconstruct)數(shù)位信號(hào),已知解決方法是提供一個(gè)很大的記憶體暫存器,足以同時(shí)儲(chǔ)存一資料框中所有聲道的資料,使得一個(gè)解碼器可以將音訊信號(hào)由頻域轉(zhuǎn)換至?xí)r域。舉上述AC-3位元流的解碼為例,使用需求512×6=3072個(gè)樣本(Samples)的一輸入暫存器,用以實(shí)施一50%重疊的反修正式離散余弦轉(zhuǎn)換(IMDCT),以及需求256×6=1536個(gè)樣本的一輸出暫存器,用以實(shí)施IMDCT。同樣地,已知MP3解碼器使用一個(gè)需求576×2=1152個(gè)樣本的一輸入暫存器用以實(shí)施一50%重疊的IMDCT、需求576×2=1152樣本之一合成輸入暫存器(synthesis InPut buffer)用以實(shí)施次頻帶合成(subband synthesis),以及需求576×2=1152個(gè)PCM樣本之一輸出暫存器。雖然原則上是易于實(shí)施的,但是就設(shè)計(jì)于一單晶片上的數(shù)位音訊解碼器的尺寸、成本以及復(fù)雜度而言是過多了。因此,需要一個(gè)與已知相較而言可以大大地減少暫存需求量的數(shù)位音訊解碼器。
本發(fā)明的目的是這樣實(shí)現(xiàn)的一種減少數(shù)位音訊解碼器的暫存需求量的方法,包括(a)由一位元流之一資料框中,取出此時(shí)須將被解碼至一聲道的N個(gè)樣本,其中N為一第一既定數(shù)目,且為一正整數(shù);(b)儲(chǔ)存上述取出的N個(gè)樣本,至可容納上述取出的N個(gè)樣本之一第一暫存器;(c)對上述取出的N個(gè)樣本,實(shí)施一反轉(zhuǎn)換,以便一次產(chǎn)生含有K個(gè)PCM樣本的一次資料區(qū)段,其中上述次資料區(qū)段是為一PCM輸出資料框的一部份,在此K為一第二既定數(shù)目,且K為一小于N的正整數(shù);(d)儲(chǔ)存上述次資料區(qū)段,至可容納上述K個(gè)PCM樣本之一第二暫存器;(e)丟棄上述取出的N個(gè)樣本;以及(f)重覆上述步驟(a)至步驟(e),直到完全取得上述音訊聲道的上述PCM輸出資料框。
上述位元流符合AC-3規(guī)格。
上述反轉(zhuǎn)換為一反修正式離散余弦轉(zhuǎn)換(IMDCT)。
上述第一既定數(shù)目N為256。
上述第一既定數(shù)目與第二既定數(shù)目間的關(guān)系為K=N2n]]>此處n≥0,且n為一正整數(shù)。
上述位元流符合MPEG-2進(jìn)階編碼技術(shù)標(biāo)準(zhǔn)(Advanced Audio Codingstandrad)。
上述反轉(zhuǎn)換為一反修正式離散余弦轉(zhuǎn)換(IMDCT)。
一種減少數(shù)位音訊解碼器的暫存需求量的方法包括(a)由一位元流中含有M個(gè)樣本之一資料框內(nèi),取出此時(shí)須被解譯至一聲道的N個(gè)樣本,其中N為一第一既定數(shù)目,M為一第二既定數(shù)目,N、M為正整數(shù)且M≥N;(b)儲(chǔ)存上述取出的N個(gè)樣本,至可容納上述取出的N個(gè)樣本之一第一暫存器;(c)對存于上述第一暫存器中的上述取出的N個(gè)樣本,實(shí)施一反轉(zhuǎn)換以便一次產(chǎn)生至少一個(gè)次頻帶樣本;(d)儲(chǔ)存上述次頻帶樣本,至可容納上述K個(gè)次頻帶樣本之一第二暫存器,其中K為一第三既定數(shù)目,且為一正整數(shù);(e)丟棄上述取出的N個(gè)樣本;以及(f)重復(fù)上述步驟(a)至步驟(e),直到完全取得上述聲道的K個(gè)次頻帶樣本。
更包括(g)將存于上述第二暫存器之上述K個(gè)次頻帶樣本,供應(yīng)至一合成濾波器組;(h)由上述合成濾波器組,將上述K個(gè)次頻帶樣本重組成PCM輸出樣本之一資料區(qū)段。
上述位元流符合MPEG layer-3(MP3)格式。
此外,本發(fā)明是針對減少一個(gè)以平面轉(zhuǎn)換為基底的解碼系統(tǒng)中,一數(shù)位音訊解碼器的暫存需求量的方法。根據(jù)本發(fā)明的一實(shí)施例,首先是由一位元流之一資料框中,取出此時(shí)須將被解碼至一聲道的N個(gè)樣本,其中N為一第一既定數(shù)目,且為一正整數(shù)。被取出的N個(gè)樣本,接著被儲(chǔ)存至可容納取出的N個(gè)樣本之一第一暫存器。然后,對第一暫存器中上述取出的N個(gè)樣本,實(shí)施一反轉(zhuǎn)換,以便一次產(chǎn)生含有K個(gè)PCM樣本的一次資料區(qū)段。要注意的是,上述次資料區(qū)段是為一PCM輸出資料框的一部份,在此K為一第二既定數(shù)目,且K為一小于N的正整數(shù)。之后,丟棄上述取出的N個(gè)樣本。接著,重復(fù)前述步驟,直到完全取得上述聲道的PCM輸出資料框?yàn)橹埂?br>
根據(jù)本發(fā)明的另一實(shí)施例,是揭露減少一個(gè)使用濾波器組混合之一數(shù)位音訊解碼器的暫存需求量的方法。本發(fā)明首先是由一位元流中含有M個(gè)樣本之一資料框內(nèi),取出此時(shí)須被解譯至一聲道的N個(gè)樣本。接著,將被取出的N個(gè)樣本,儲(chǔ)存至可容納取出的N個(gè)樣本之一第一暫存器。注意,N為一第一既定數(shù)目,M為一第二既定數(shù)目,N、M為正整數(shù)且M≥N。然后,對存于第一暫存器中的上述取出的N個(gè)樣本,實(shí)施一反轉(zhuǎn)換以便一次產(chǎn)生至少一個(gè)次頻帶樣本接下來,將上述次頻帶樣本,儲(chǔ)存至可容納K個(gè)次頻帶樣本之一第二暫存器,其中K為一第三既定數(shù)目,且為一正整數(shù)。之后,丟棄上述取出的N個(gè)樣本。重覆前述步驟,直到完全取得上述聲道的K個(gè)次頻帶樣本為止。一旦K個(gè)次頻帶樣本全部存于第二暫存器中時(shí),K個(gè)次頻帶樣本將被應(yīng)用至一含有K個(gè)次頻帶的合成濾波器組,同時(shí),上述合成濾波器組將K個(gè)次頻帶樣本,重組成PCM輸出樣本的一資料區(qū)段。
圖1B是為用于已知MPEG Layer-3解碼系統(tǒng)之一合成濾波器組的方塊圖。
圖2A是顯示本發(fā)明對于MPEG Layer-3解碼之一實(shí)施例。
圖2B是為圖2A中的動(dòng)作的流程圖。
圖3A是顯示本發(fā)明對于AC-3解碼的另一實(shí)施例。
圖3B是為圖3A中的動(dòng)作的流程圖。圖號(hào)說明102、112MDCT 114多相濾波器組202、302IMDCT暫存器204、304IMDCT邏輯206次頻帶暫存器208合成濾波器組306PCM暫存器
AC-3是純粹使用修正式離散余弦轉(zhuǎn)換(Modified Discrete CosineTransform,MDCT)來編碼。如圖1A中所示,AC-3解碼器使用一個(gè)50%重疊的512點(diǎn)(512-Point)離散余弦轉(zhuǎn)換,PCM輸入樣本會(huì)被供應(yīng)至一濾波器組(filer bank)102,以便每個(gè)音訊資料區(qū)段(audio block)產(chǎn)生256個(gè)頻譜分量(frequency components)C(k)k=0...255。于瞬態(tài)信號(hào)(transient signal)的情況中,用兩個(gè)256點(diǎn)轉(zhuǎn)換(256-pointtransform)取代上述512點(diǎn)轉(zhuǎn)換,由使用一區(qū)塊交換(block-switching)技術(shù)達(dá)到效能的提升。根據(jù)理想的時(shí)域混疊消除(time domain aliascancellation,TDAC)下,修正式離散余弦轉(zhuǎn)換(MDCT)是為一種線性正交重疊轉(zhuǎn)換(linear orthogonal lapped transform)。
參考圖1B,于MPEG Layer-3中使用的濾波器組為含有一多相濾波器組114及一MDCT112之一合成濾波器組(hybrid filterbank),此合成格式會(huì)選擇相容于先前的格式,如Layer-1及Layer-2。首先,使用多相濾波器組114,數(shù)位音訊信號(hào)(PCM input)會(huì)被分成32個(gè)次頻帶信號(hào)SB(j)j=0...31。上述復(fù)數(shù)次頻帶會(huì)被等間距地設(shè)置于由0至半個(gè)被取樣頻的頻域上。為了達(dá)到更接近人類聲覺的臨界頻帶(critical band)的較高頻率解析度,上述32個(gè)次頻帶信號(hào)SB(j)j=0...31會(huì)由一具有動(dòng)態(tài)窗切換(dynamic window switching)的6點(diǎn)或8點(diǎn)的MDCT轉(zhuǎn)換,更進(jìn)步再細(xì)分成頻譜分量。每個(gè)次頻帶會(huì)再分成18個(gè)更細(xì)微的頻譜分量,總計(jì)為576個(gè)頻譜分量SB(k)k=0...575,增加了去除冗于部分的可能性,對聲調(diào)信號(hào)來說使得編碼的效率更好。上述MDCT可以切換成將每個(gè)次頻帶產(chǎn)生6個(gè)頻譜分量(short-window MDCTs)或是18個(gè)頻譜分量(long-windowMDCTs)。注意,上述MDCT是為一50%重疊轉(zhuǎn)換,因此,實(shí)際上,它分別是一12點(diǎn)或一36點(diǎn)轉(zhuǎn)換。與MPEG Layer-3的合成濾波器組相比,MPEG-2 AAC使用類似于AC-3的一種平面MDCT區(qū)塊轉(zhuǎn)換(plain MDCT blocktransform)。舉例來說,于AAC編碼器中的濾波器組,為具有50%重疊(2048個(gè)樣本的window length)之一1024線的MDCT。上述濾波器組可以切換8組128線的MDCTs(256個(gè)樣本的window length)。因此,與Layer-3中576條頻譜線相比,AAC中頻譜線的數(shù)目增加至1024條。
解碼的步驟非常容易,恰好跟上述編碼的步驟相反,所要做的只是由c編碼的頻譜分量(spectral component)合成為一音訊信號(hào)。事實(shí)上,本發(fā)明是運(yùn)用含有已編碼資料集(Integrally encoded data)的次資料框(sub-frames)或音訊資料區(qū)段(audio blocks)的一個(gè)已編碼的音訊資料框(audio frame)。不像已知為了反轉(zhuǎn)換,而將整個(gè)資料框存于記憶體中,本發(fā)明將MPEG或AC-3位元流(bitstream)解碼,透過暫存記憶體儲(chǔ)存所需的樣本。本發(fā)明試圖只當(dāng)反轉(zhuǎn)換需要資料時(shí),由位元流中取出有用的資料,為了減少暫存量,一次只處理一個(gè)已編碼的聲道。
本發(fā)明適用于MPEG layer-3的方法,將以圖2A中的實(shí)施例,配合圖2B中相關(guān)流程圖用以說明。于步驟S210中,由一MP3位元流之一資料框(sub-frame)中,取出此時(shí)須將被解碼至一聲道的N個(gè)樣本,其中上資料框(granule)含有M個(gè)樣本。注意,N為一第一既定數(shù)目,M為一第二既定數(shù)目,且M與N皆為正整數(shù)。于關(guān)于MP3的此一實(shí)施例中,M會(huì)等于576,且N會(huì)等于18。接著,于步驟S212中,上述被取出的N(N=18)個(gè)樣本,被儲(chǔ)存至可容納取出的N個(gè)樣本之一IMDCT暫存器202。隨著步驟S214中的IMDCT邏輯204,對IMDCT暫存器202中的上述N(N=18)個(gè)樣本,實(shí)施一反轉(zhuǎn)換,以便一次產(chǎn)生至少一個(gè)次頻帶樣本(subbandsample)。之后,于步驟216中,上述次頻帶樣本會(huì)被儲(chǔ)存至一個(gè)次頻帶暫存器(subband buffer)206。其中K為一第三既定數(shù)目,且K為32。接下來,于步驟S218中,丟棄上述取出的N個(gè)樣本,以儲(chǔ)存新的樣本。接著,于步驟S220中,重覆前述步驟S210-S218,直到完全取得上述聲道(audio channel)的32個(gè)次頻帶樣本(subband sample)為止。一旦32個(gè)次頻帶樣本皆被儲(chǔ)存至次頻帶暫存器206中時(shí),于步驟S222中,32個(gè)次頻帶樣本會(huì)被供應(yīng)至含有K個(gè)(K=32)次頻帶之一合成濾波器組(synthesis fliterbank)208。同時(shí),于步驟S224中,由合成濾波器組208將32個(gè)次頻帶樣本,重組(reconstruct)成一PCM輸出樣本的資料區(qū)段(block)。在此方法中,32個(gè)次頻帶的次頻帶樣本會(huì)每一次都被反轉(zhuǎn)換(inverse-transformerd),再供應(yīng)至合成濾波器組208,因此可以產(chǎn)生出連續(xù)不斷的PCM輸出樣本。
關(guān)于AC-3解碼的程序,將以圖3A中的另一實(shí)施例,配合圖3B中相關(guān)流程圖用以說明。本發(fā)明適用于AC-3的解碼步驟,與用于MEPG Layer-3的解碼步驟相似,但不使用一合成濾波器組。于步驟S310中,由一AC-3位元流之一資料框(sub-frame)中,取出此時(shí)須將被解碼至一聲道之N個(gè)樣本,其中N為一第一既定數(shù)目,且為一正整數(shù)。接著,于步驟S312中,上述被取出的N個(gè)樣本,被儲(chǔ)存至可容納取出的N個(gè)樣本之一IMDCT暫存器302。隨著步驟S314中的IMDCT邏輯304,對IMDCT暫存器302中的上述N個(gè)樣本,實(shí)施一反轉(zhuǎn)換,以便一次產(chǎn)生含有K個(gè)次頻帶樣本(subband sample)的一資料區(qū)段(sub-block)。之后,于步驟316中,剛剛產(chǎn)生的上述資料區(qū)段會(huì)被儲(chǔ)存至一個(gè)PCM暫存器306。注意,上述資料區(qū)段(sub-block)是為一PCM輸出資料框(audio block)的一部分,其中K為一第二既定數(shù)目,且K為一個(gè)小于N的正整數(shù)。接下來,于步驟S318中,丟棄存于IMDCT暫存器302中的上述N個(gè)樣本,以儲(chǔ)存新的樣本。接著,于步驟S320中,重覆前述步驟S310-S318,直到完全取得上述聲道(audio channel)之一PCM出輸資料框?yàn)橹埂kS著下一個(gè)次資料框被取樣以及反轉(zhuǎn)換,前述步驟會(huì)繼續(xù)執(zhí)行,而得以進(jìn)行重組(reconstruction)。既然對AC-3而言,N為二的次方,第一既定數(shù)目N與第二既定數(shù)目M之間的關(guān)系,因此被定義為K=N2n]]>此處n≥0,且n為一正整數(shù)。對于實(shí)施例中,上述第一既定數(shù)目N為256,上述第一既定數(shù)目M為16(所以n=4)。
雖然本發(fā)明是參照MPEG Layer-3標(biāo)準(zhǔn)及AC-3標(biāo)準(zhǔn)來說明,但不用以限定本發(fā)明,同樣也可以應(yīng)該于MPEG-2標(biāo)準(zhǔn)、AAC標(biāo)準(zhǔn),以及除了MPEG及AC-3之外的編碼架構(gòu)。因此,本發(fā)明由提供一個(gè)可以比已知大大地減少了暫存需求量的方法,而填補(bǔ)了現(xiàn)存于已知技術(shù)中的需求。
權(quán)利要求
1.一種減少數(shù)位音訊解碼器的暫存需求量的方法,包括(a)由一位元流之一資料框中,取出此時(shí)須將被解碼至一聲道的N個(gè)樣本,其中N為一第一既定數(shù)目,且為一正整數(shù);(b)儲(chǔ)存上述取出的N個(gè)樣本,至可容納上述取出的N個(gè)樣本之一第一暫存器;(c)對上述取出的N個(gè)樣本,實(shí)施一反轉(zhuǎn)換,以便一次產(chǎn)生含有K個(gè)PCM樣本的一次資料區(qū)段,其中上述次資料區(qū)段是為一PCM輸出資料框的一部份,在此K為一第二既定數(shù)目,且K為一小于N的正整數(shù);(d)儲(chǔ)存上述次資料區(qū)段,至可容納上述K個(gè)PCM樣本之一第二暫存器;(e)丟棄上述取出的N個(gè)樣本;以及(f)重覆上述步驟(a)至步驟(e),直到完全取得上述音訊聲道的上述PCM輸出資料框。
2.如權(quán)利要求1所述的減少數(shù)位音訊解碼器的暫存需求量的方法,其特征在于,上述位元流符合AC-3規(guī)格。
3.如權(quán)利要求2所述的減少數(shù)位音訊解碼器的暫存需求量的方法,其特征在于,上述反轉(zhuǎn)換為一反修正式離散余弦轉(zhuǎn)換(IMDCT)。
4.如權(quán)利要求2所述的減少數(shù)位音訊解碼器的暫存需求量的方法,其特征在于,上述第一既定數(shù)目N為256。
5.如權(quán)利要求1所述的減少數(shù)位音訊解碼器的暫存需求量的方法,其特征在于,上述第一既定數(shù)目與第二既定數(shù)目間的關(guān)系為K=N2n]]>此處n≥0,且n為一正整數(shù)。
6.如權(quán)利要求1所述的減少數(shù)位音訊解碼器的暫存需求量的方法,其特征在于,上述位元流符合MPEG-2進(jìn)階編碼技術(shù)標(biāo)準(zhǔn)(Advanced AudioCoding standrad)。
7.如權(quán)利要求6所述的減少數(shù)位音訊解碼器的暫存需求量的方法,其特征在于,上述反轉(zhuǎn)換為一反修正式離散余弦轉(zhuǎn)換(IMDCT)。
8.一種減少數(shù)位音訊解碼器的暫存需求量的方法包括(a)由一位元流中含有M個(gè)樣本之一資料框內(nèi),取出此時(shí)須被解譯至一聲道的N個(gè)樣本,其中N為一第一既定數(shù)目,M為一第二既定數(shù)目,N、M為正整數(shù)且M≥N;(b)儲(chǔ)存上述取出的N個(gè)樣本,至可容納上述取出的N個(gè)樣本之一第一暫存器;(c)對存于上述第一暫存器中的上述取出的N個(gè)樣本,實(shí)施一反轉(zhuǎn)換以便一次產(chǎn)生至少一個(gè)次頻帶樣本;(d)儲(chǔ)存上述次頻帶樣本,至可容納上述K個(gè)次頻帶樣本之一第二暫存器,其中K為一第三既定數(shù)目,且為一正整數(shù);(e)丟棄上述取出的N個(gè)樣本;以及(f)重復(fù)上述步驟(a)至步驟(e),直到完全取得上述聲道的K個(gè)次頻帶樣本。
9.如權(quán)利要求1所述的減少數(shù)位音訊解碼器的暫存需求量的方法,其特征在于,更包括(g)將存于上述第二暫存器之上述K個(gè)次頻帶樣本,供應(yīng)至一合成濾波器組;(h)由上述合成濾波器組,將上述K個(gè)次頻帶樣本重組成PCM輸出樣本之一資料區(qū)段。
10.如權(quán)利要求9所述的減少數(shù)位音訊解碼器的暫存需求量的方法,其特征在于,上述位元流符合MPEG layer-3(MP3)格式。
全文摘要
本發(fā)明提供一種減少數(shù)位音訊解碼器的暫存需求量的方法。首先,由一位元流之一資料框中,取出此時(shí)須將被解碼至一聲道的N個(gè)樣本。由一反轉(zhuǎn)換,以便一次估算出含有K個(gè)PCM樣本之一大資料區(qū)段。然后,丟棄上述取出的N個(gè)樣本。注意,取出的樣本數(shù)目會(huì)大于或等于產(chǎn)生的資料區(qū)段的PCM樣本數(shù)目,即N≥K。接著,重復(fù)前述步驟,直到完全取得上述聲道的大資料框?yàn)橹埂?br>
文檔編號(hào)G10L19/00GK1468003SQ0214891
公開日2004年1月14日 申請日期2002年11月8日 優(yōu)先權(quán)日2002年7月9日
發(fā)明者李忠憲, 黃心怡 申請人:矽統(tǒng)科技股份有限公司