減少數(shù)位音訊解碼器的暫存需求量的方法

文檔序號(hào)：2836363閱讀：234來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：減少數(shù)位音訊解碼器的暫存需求量的方法
技術(shù)領(lǐng)域：
本發(fā)明關(guān)于一種數(shù)位音訊解碼，特別是有關(guān)于一種用以減少數(shù)位音訊解碼器的暫存需求量的方法。
先進(jìn)電視系統(tǒng)委員會(huì)(Advanced Television System Committee，ATSC)提出一個(gè)稱作AC-3的對答(competing)的標(biāo)準(zhǔn)，作為高解析度電視(HighDefinition Television，HDTV)的音訊服務(wù)標(biāo)準(zhǔn)。AC-3標(biāo)準(zhǔn)也已經(jīng)應(yīng)用在消費(fèi)性媒體(consumer media)中，例如數(shù)位音訊光碟(DVD)以及衛(wèi)星直播(direct satellite broadcast)。一個(gè)AC-3位元流(bitstream)是由資料框(frames)所組成，資料框(frames)代表著跨在所有聲道的1536個(gè)固定日間周期的PCM樣本。其中，每個(gè)資料框(frame)有六個(gè)音言區(qū)段(audio block)，各表示著每一編碼的聲道的256個(gè)PCM樣本。AC-3音訊解碼技術(shù)需要某些步驟，例如位元分配(bit allocation)、反量化(dequantization)、去耦合(decoupling)、再矩陣化(rematrixing)、動(dòng)態(tài)范圍壓縮(dynamic range compression)，以及反修正式離散余弦轉(zhuǎn)換(Inverse Modified Discrete Cosine Transform，IMDCT)。另一方面，含有兩團(tuán)(granules)的每一個(gè)MP3音訊資料框表示著1152個(gè)輸入PCM音訊樣本。MP3中的一團(tuán)可以視為各含有18個(gè)樣本的32個(gè)次頻帶，共具有576個(gè)樣本。MP3位元流的解碼亦需要一些步驟，例如音訊樣本的可變長度解碼(variable length decoding of audio samples)、縮放因子與位元分配的解碼(decoding of scale factors and bitallocation)、樣本的反量化(dequantization of samples)、反修正式離散余弦轉(zhuǎn)換的計(jì)算(computation of IMDCT)，以及次頻帶樣本合成(synthesis of subband sample)。
為了重組(reconstruct)數(shù)位信號(hào)，已知解決方法是提供一個(gè)很大的記憶體暫存器，足以同時(shí)儲(chǔ)存一資料框中所有聲道的資料，使得一個(gè)解碼器可以將音訊信號(hào)由頻域轉(zhuǎn)換至?xí)r域。舉上述AC-3位元流的解碼為例，使用需求512×6＝3072個(gè)樣本(Samples)的一輸入暫存器，用以實(shí)施一50％重疊的反修正式離散余弦轉(zhuǎn)換(IMDCT)，以及需求256×6＝1536個(gè)樣本的一輸出暫存器，用以實(shí)施IMDCT。同樣地，已知MP3解碼器使用一個(gè)需求576×2＝1152個(gè)樣本的一輸入暫存器用以實(shí)施一50％重疊的IMDCT、需求576×2＝1152樣本之一合成輸入暫存器(synthesis InPut buffer)用以實(shí)施次頻帶合成(subband synthesis)，以及需求576×2＝1152個(gè)PCM樣本之一輸出暫存器。雖然原則上是易于實(shí)施的，但是就設(shè)計(jì)于一單晶片上的數(shù)位音訊解碼器的尺寸、成本以及復(fù)雜度而言是過多了。因此，需要一個(gè)與已知相較而言可以大大地減少暫存需求量的數(shù)位音訊解碼器。
本發(fā)明的目的是這樣實(shí)現(xiàn)的一種減少數(shù)位音訊解碼器的暫存需求量的方法，包括(a)由一位元流之一資料框中，取出此時(shí)須將被解碼至一聲道的N個(gè)樣本，其中N為一第一既定數(shù)目，且為一正整數(shù)；(b)儲(chǔ)存上述取出的N個(gè)樣本，至可容納上述取出的N個(gè)樣本之一第一暫存器；(c)對上述取出的N個(gè)樣本，實(shí)施一反轉(zhuǎn)換，以便一次產(chǎn)生含有K個(gè)PCM樣本的一次資料區(qū)段，其中上述次資料區(qū)段是為一PCM輸出資料框的一部份，在此K為一第二既定數(shù)目，且K為一小于N的正整數(shù)；(d)儲(chǔ)存上述次資料區(qū)段，至可容納上述K個(gè)PCM樣本之一第二暫存器；(e)丟棄上述取出的N個(gè)樣本；以及(f)重覆上述步驟(a)至步驟(e)，直到完全取得上述音訊聲道的上述PCM輸出資料框。
上述位元流符合AC-3規(guī)格。
上述反轉(zhuǎn)換為一反修正式離散余弦轉(zhuǎn)換(IMDCT)。
上述第一既定數(shù)目N為256。
上述第一既定數(shù)目與第二既定數(shù)目間的關(guān)系為K=N2n]]>此處n≥0，且n為一正整數(shù)。
上述位元流符合MPEG-2進(jìn)階編碼技術(shù)標(biāo)準(zhǔn)(Advanced Audio Codingstandrad)。
上述反轉(zhuǎn)換為一反修正式離散余弦轉(zhuǎn)換(IMDCT)。
一種減少數(shù)位音訊解碼器的暫存需求量的方法包括(a)由一位元流中含有M個(gè)樣本之一資料框內(nèi)，取出此時(shí)須被解譯至一聲道的N個(gè)樣本，其中N為一第一既定數(shù)目，M為一第二既定數(shù)目，N、M為正整數(shù)且M≥N；(b)儲(chǔ)存上述取出的N個(gè)樣本，至可容納上述取出的N個(gè)樣本之一第一暫存器；(c)對存于上述第一暫存器中的上述取出的N個(gè)樣本，實(shí)施一反轉(zhuǎn)換以便一次產(chǎn)生至少一個(gè)次頻帶樣本；(d)儲(chǔ)存上述次頻帶樣本，至可容納上述K個(gè)次頻帶樣本之一第二暫存器，其中K為一第三既定數(shù)目，且為一正整數(shù)；(e)丟棄上述取出的N個(gè)樣本；以及(f)重復(fù)上述步驟(a)至步驟(e)，直到完全取得上述聲道的K個(gè)次頻帶樣本。
更包括(g)將存于上述第二暫存器之上述K個(gè)次頻帶樣本，供應(yīng)至一合成濾波器組；(h)由上述合成濾波器組，將上述K個(gè)次頻帶樣本重組成PCM輸出樣本之一資料區(qū)段。
上述位元流符合MPEG layer-3(MP3)格式。
此外，本發(fā)明是針對減少一個(gè)以平面轉(zhuǎn)換為基底的解碼系統(tǒng)中，一數(shù)位音訊解碼器的暫存需求量的方法。根據(jù)本發(fā)明的一實(shí)施例，首先是由一位元流之一資料框中，取出此時(shí)須將被解碼至一聲道的N個(gè)樣本，其中N為一第一既定數(shù)目，且為一正整數(shù)。被取出的N個(gè)樣本，接著被儲(chǔ)存至可容納取出的N個(gè)樣本之一第一暫存器。然后，對第一暫存器中上述取出的N個(gè)樣本，實(shí)施一反轉(zhuǎn)換，以便一次產(chǎn)生含有K個(gè)PCM樣本的一次資料區(qū)段。要注意的是，上述次資料區(qū)段是為一PCM輸出資料框的一部份，在此K為一第二既定數(shù)目，且K為一小于N的正整數(shù)。之后，丟棄上述取出的N個(gè)樣本。接著，重復(fù)前述步驟，直到完全取得上述聲道的PCM輸出資料框?yàn)橹埂?br> 根據(jù)本發(fā)明的另一實(shí)施例，是揭露減少一個(gè)使用濾波器組混合之一數(shù)位音訊解碼器的暫存需求量的方法。本發(fā)明首先是由一位元流中含有M個(gè)樣本之一資料框內(nèi)，取出此時(shí)須被解譯至一聲道的N個(gè)樣本。接著，將被取出的N個(gè)樣本，儲(chǔ)存至可容納取出的N個(gè)樣本之一第一暫存器。注意，N為一第一既定數(shù)目，M為一第二既定數(shù)目，N、M為正整數(shù)且M≥N。然后，對存于第一暫存器中的上述取出的N個(gè)樣本，實(shí)施一反轉(zhuǎn)換以便一次產(chǎn)生至少一個(gè)次頻帶樣本接下來，將上述次頻帶樣本，儲(chǔ)存至可容納K個(gè)次頻帶樣本之一第二暫存器，其中K為一第三既定數(shù)目，且為一正整數(shù)。之后，丟棄上述取出的N個(gè)樣本。重覆前述步驟，直到完全取得上述聲道的K個(gè)次頻帶樣本為止。一旦K個(gè)次頻帶樣本全部存于第二暫存器中時(shí)，K個(gè)次頻帶樣本將被應(yīng)用至一含有K個(gè)次頻帶的合成濾波器組，同時(shí)，上述合成濾波器組將K個(gè)次頻帶樣本，重組成PCM輸出樣本的一資料區(qū)段。

圖1B是為用于已知MPEG Layer-3解碼系統(tǒng)之一合成濾波器組的方塊圖。
圖2A是顯示本發(fā)明對于MPEG Layer-3解碼之一實(shí)施例。
圖2B是為圖2A中的動(dòng)作的流程圖。
圖3A是顯示本發(fā)明對于AC-3解碼的另一實(shí)施例。
圖3B是為圖3A中的動(dòng)作的流程圖。圖號(hào)說明102、112MDCT 114多相濾波器組202、302IMDCT暫存器204、304IMDCT邏輯206次頻帶暫存器208合成濾波器組306PCM暫存器
AC-3是純粹使用修正式離散余弦轉(zhuǎn)換(Modified Discrete CosineTransform，MDCT)來編碼。如圖1A中所示，AC-3解碼器使用一個(gè)50％重疊的512點(diǎn)(512-Point)離散余弦轉(zhuǎn)換，PCM輸入樣本會(huì)被供應(yīng)至一濾波器組(filer bank)102，以便每個(gè)音訊資料區(qū)段(audio block)產(chǎn)生256個(gè)頻譜分量(frequency components)C(k)k＝0...255。于瞬態(tài)信號(hào)(transient signal)的情況中，用兩個(gè)256點(diǎn)轉(zhuǎn)換(256-pointtransform)取代上述512點(diǎn)轉(zhuǎn)換，由使用一區(qū)塊交換(block-switching)技術(shù)達(dá)到效能的提升。根據(jù)理想的時(shí)域混疊消除(time domain aliascancellation，TDAC)下，修正式離散余弦轉(zhuǎn)換(MDCT)是為一種線性正交重疊轉(zhuǎn)換(linear orthogonal lapped transform)。
參考圖1B，于MPEG Layer-3中使用的濾波器組為含有一多相濾波器組114及一MDCT112之一合成濾波器組(hybrid filterbank)，此合成格式會(huì)選擇相容于先前的格式，如Layer-1及Layer-2。首先，使用多相濾波器組114，數(shù)位音訊信號(hào)(PCM input)會(huì)被分成32個(gè)次頻帶信號(hào)SB(j)j＝0...31。上述復(fù)數(shù)次頻帶會(huì)被等間距地設(shè)置于由0至半個(gè)被取樣頻的頻域上。為了達(dá)到更接近人類聲覺的臨界頻帶(critical band)的較高頻率解析度，上述32個(gè)次頻帶信號(hào)SB(j)j＝0...31會(huì)由一具有動(dòng)態(tài)窗切換(dynamic window switching)的6點(diǎn)或8點(diǎn)的MDCT轉(zhuǎn)換，更進(jìn)步再細(xì)分成頻譜分量。每個(gè)次頻帶會(huì)再分成18個(gè)更細(xì)微的頻譜分量，總計(jì)為576個(gè)頻譜分量SB(k)k＝0...575，增加了去除冗于部分的可能性，對聲調(diào)信號(hào)來說使得編碼的效率更好。上述MDCT可以切換成將每個(gè)次頻帶產(chǎn)生6個(gè)頻譜分量(short-window MDCTs)或是18個(gè)頻譜分量(long-windowMDCTs)。注意，上述MDCT是為一50％重疊轉(zhuǎn)換，因此，實(shí)際上，它分別是一12點(diǎn)或一36點(diǎn)轉(zhuǎn)換。與MPEG Layer-3的合成濾波器組相比，MPEG-2 AAC使用類似于AC-3的一種平面MDCT區(qū)塊轉(zhuǎn)換(plain MDCT blocktransform)。舉例來說，于AAC編碼器中的濾波器組，為具有50％重疊(2048個(gè)樣本的window length)之一1024線的MDCT。上述濾波器組可以切換8組128線的MDCTs(256個(gè)樣本的window length)。因此，與Layer-3中576條頻譜線相比，AAC中頻譜線的數(shù)目增加至1024條。
解碼的步驟非常容易，恰好跟上述編碼的步驟相反，所要做的只是由c編碼的頻譜分量(spectral component)合成為一音訊信號(hào)。事實(shí)上，本發(fā)明是運(yùn)用含有已編碼資料集(Integrally encoded data)的次資料框(sub-frames)或音訊資料區(qū)段(audio blocks)的一個(gè)已編碼的音訊資料框(audio frame)。不像已知為了反轉(zhuǎn)換，而將整個(gè)資料框存于記憶體中，本發(fā)明將MPEG或AC-3位元流(bitstream)解碼，透過暫存記憶體儲(chǔ)存所需的樣本。本發(fā)明試圖只當(dāng)反轉(zhuǎn)換需要資料時(shí)，由位元流中取出有用的資料，為了減少暫存量，一次只處理一個(gè)已編碼的聲道。
本發(fā)明適用于MPEG layer-3的方法，將以圖2A中的實(shí)施例，配合圖2B中相關(guān)流程圖用以說明。于步驟S210中，由一MP3位元流之一資料框(sub-frame)中，取出此時(shí)須將被解碼至一聲道的N個(gè)樣本，其中上資料框(granule)含有M個(gè)樣本。注意，N為一第一既定數(shù)目，M為一第二既定數(shù)目，且M與N皆為正整數(shù)。于關(guān)于MP3的此一實(shí)施例中，M會(huì)等于576，且N會(huì)等于18。接著，于步驟S212中，上述被取出的N(N＝18)個(gè)樣本，被儲(chǔ)存至可容納取出的N個(gè)樣本之一IMDCT暫存器202。隨著步驟S214中的IMDCT邏輯204，對IMDCT暫存器202中的上述N(N＝18)個(gè)樣本，實(shí)施一反轉(zhuǎn)換，以便一次產(chǎn)生至少一個(gè)次頻帶樣本(subbandsample)。之后，于步驟216中，上述次頻帶樣本會(huì)被儲(chǔ)存至一個(gè)次頻帶暫存器(subband buffer)206。其中K為一第三既定數(shù)目，且K為32。接下來，于步驟S218中，丟棄上述取出的N個(gè)樣本，以儲(chǔ)存新的樣本。接著，于步驟S220中，重覆前述步驟S210-S218，直到完全取得上述聲道(audio channel)的32個(gè)次頻帶樣本(subband sample)為止。一旦32個(gè)次頻帶樣本皆被儲(chǔ)存至次頻帶暫存器206中時(shí)，于步驟S222中，32個(gè)次頻帶樣本會(huì)被供應(yīng)至含有K個(gè)(K＝32)次頻帶之一合成濾波器組(synthesis fliterbank)208。同時(shí)，于步驟S224中，由合成濾波器組208將32個(gè)次頻帶樣本，重組(reconstruct)成一PCM輸出樣本的資料區(qū)段(block)。在此方法中，32個(gè)次頻帶的次頻帶樣本會(huì)每一次都被反轉(zhuǎn)換(inverse-transformerd)，再供應(yīng)至合成濾波器組208，因此可以產(chǎn)生出連續(xù)不斷的PCM輸出樣本。
關(guān)于AC-3解碼的程序，將以圖3A中的另一實(shí)施例，配合圖3B中相關(guān)流程圖用以說明。本發(fā)明適用于AC-3的解碼步驟，與用于MEPG Layer-3的解碼步驟相似，但不使用一合成濾波器組。于步驟S310中，由一AC-3位元流之一資料框(sub-frame)中，取出此時(shí)須將被解碼至一聲道之N個(gè)樣本，其中N為一第一既定數(shù)目，且為一正整數(shù)。接著，于步驟S312中，上述被取出的N個(gè)樣本，被儲(chǔ)存至可容納取出的N個(gè)樣本之一IMDCT暫存器302。隨著步驟S314中的IMDCT邏輯304，對IMDCT暫存器302中的上述N個(gè)樣本，實(shí)施一反轉(zhuǎn)換，以便一次產(chǎn)生含有K個(gè)次頻帶樣本(subband sample)的一資料區(qū)段(sub-block)。之后，于步驟316中，剛剛產(chǎn)生的上述資料區(qū)段會(huì)被儲(chǔ)存至一個(gè)PCM暫存器306。注意，上述資料區(qū)段(sub-block)是為一PCM輸出資料框(audio block)的一部分，其中K為一第二既定數(shù)目，且K為一個(gè)小于N的正整數(shù)。接下來，于步驟S318中，丟棄存于IMDCT暫存器302中的上述N個(gè)樣本，以儲(chǔ)存新的樣本。接著，于步驟S320中，重覆前述步驟S310-S318，直到完全取得上述聲道(audio channel)之一PCM出輸資料框?yàn)橹埂ｋS著下一個(gè)次資料框被取樣以及反轉(zhuǎn)換，前述步驟會(huì)繼續(xù)執(zhí)行，而得以進(jìn)行重組(reconstruction)。既然對AC-3而言，N為二的次方，第一既定數(shù)目N與第二既定數(shù)目M之間的關(guān)系，因此被定義為K=N2n]]>此處n≥0，且n為一正整數(shù)。對于實(shí)施例中，上述第一既定數(shù)目N為256，上述第一既定數(shù)目M為16(所以n＝4)。
雖然本發(fā)明是參照MPEG Layer-3標(biāo)準(zhǔn)及AC-3標(biāo)準(zhǔn)來說明，但不用以限定本發(fā)明，同樣也可以應(yīng)該于MPEG-2標(biāo)準(zhǔn)、AAC標(biāo)準(zhǔn)，以及除了MPEG及AC-3之外的編碼架構(gòu)。因此，本發(fā)明由提供一個(gè)可以比已知大大地減少了暫存需求量的方法，而填補(bǔ)了現(xiàn)存于已知技術(shù)中的需求。
權(quán)利要求
1.一種減少數(shù)位音訊解碼器的暫存需求量的方法，包括(a)由一位元流之一資料框中，取出此時(shí)須將被解碼至一聲道的N個(gè)樣本，其中N為一第一既定數(shù)目，且為一正整數(shù)；(b)儲(chǔ)存上述取出的N個(gè)樣本，至可容納上述取出的N個(gè)樣本之一第一暫存器；(c)對上述取出的N個(gè)樣本，實(shí)施一反轉(zhuǎn)換，以便一次產(chǎn)生含有K個(gè)PCM樣本的一次資料區(qū)段，其中上述次資料區(qū)段是為一PCM輸出資料框的一部份，在此K為一第二既定數(shù)目，且K為一小于N的正整數(shù)；(d)儲(chǔ)存上述次資料區(qū)段，至可容納上述K個(gè)PCM樣本之一第二暫存器；(e)丟棄上述取出的N個(gè)樣本；以及(f)重覆上述步驟(a)至步驟(e)，直到完全取得上述音訊聲道的上述PCM輸出資料框。
2.如權(quán)利要求1所述的減少數(shù)位音訊解碼器的暫存需求量的方法，其特征在于，上述位元流符合AC-3規(guī)格。
3.如權(quán)利要求2所述的減少數(shù)位音訊解碼器的暫存需求量的方法，其特征在于，上述反轉(zhuǎn)換為一反修正式離散余弦轉(zhuǎn)換(IMDCT)。
4.如權(quán)利要求2所述的減少數(shù)位音訊解碼器的暫存需求量的方法，其特征在于，上述第一既定數(shù)目N為256。
5.如權(quán)利要求1所述的減少數(shù)位音訊解碼器的暫存需求量的方法，其特征在于，上述第一既定數(shù)目與第二既定數(shù)目間的關(guān)系為K=N2n]]>此處n≥0，且n為一正整數(shù)。
6.如權(quán)利要求1所述的減少數(shù)位音訊解碼器的暫存需求量的方法，其特征在于，上述位元流符合MPEG-2進(jìn)階編碼技術(shù)標(biāo)準(zhǔn)(Advanced AudioCoding standrad)。
7.如權(quán)利要求6所述的減少數(shù)位音訊解碼器的暫存需求量的方法，其特征在于，上述反轉(zhuǎn)換為一反修正式離散余弦轉(zhuǎn)換(IMDCT)。
8.一種減少數(shù)位音訊解碼器的暫存需求量的方法包括(a)由一位元流中含有M個(gè)樣本之一資料框內(nèi)，取出此時(shí)須被解譯至一聲道的N個(gè)樣本，其中N為一第一既定數(shù)目，M為一第二既定數(shù)目，N、M為正整數(shù)且M≥N；(b)儲(chǔ)存上述取出的N個(gè)樣本，至可容納上述取出的N個(gè)樣本之一第一暫存器；(c)對存于上述第一暫存器中的上述取出的N個(gè)樣本，實(shí)施一反轉(zhuǎn)換以便一次產(chǎn)生至少一個(gè)次頻帶樣本；(d)儲(chǔ)存上述次頻帶樣本，至可容納上述K個(gè)次頻帶樣本之一第二暫存器，其中K為一第三既定數(shù)目，且為一正整數(shù)；(e)丟棄上述取出的N個(gè)樣本；以及(f)重復(fù)上述步驟(a)至步驟(e)，直到完全取得上述聲道的K個(gè)次頻帶樣本。
9.如權(quán)利要求1所述的減少數(shù)位音訊解碼器的暫存需求量的方法，其特征在于，更包括(g)將存于上述第二暫存器之上述K個(gè)次頻帶樣本，供應(yīng)至一合成濾波器組；(h)由上述合成濾波器組，將上述K個(gè)次頻帶樣本重組成PCM輸出樣本之一資料區(qū)段。
10.如權(quán)利要求9所述的減少數(shù)位音訊解碼器的暫存需求量的方法，其特征在于，上述位元流符合MPEG layer-3(MP3)格式。
全文摘要
本發(fā)明提供一種減少數(shù)位音訊解碼器的暫存需求量的方法。首先，由一位元流之一資料框中，取出此時(shí)須將被解碼至一聲道的N個(gè)樣本。由一反轉(zhuǎn)換，以便一次估算出含有K個(gè)PCM樣本之一大資料區(qū)段。然后，丟棄上述取出的N個(gè)樣本。注意，取出的樣本數(shù)目會(huì)大于或等于產(chǎn)生的資料區(qū)段的PCM樣本數(shù)目，即N≥K。接著，重復(fù)前述步驟，直到完全取得上述聲道的大資料框?yàn)橹埂?br> 文檔編號(hào)G10L19/00GK1468003SQ0214891
公開日2004年1月14日申請日期2002年11月8日優(yōu)先權(quán)日2002年7月9日
發(fā)明者李忠憲, 黃心怡申請人:矽統(tǒng)科技股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李忠憲;黃心怡
技術(shù)所有人：矽統(tǒng)科技股份有限公司
我是此專利的發(fā)明人

上一篇：采用校正信號(hào)抑制壓力波的系統(tǒng)和方法
上一篇：手拍鼓的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

減少香煙需求量的方法相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

減少數(shù)位音訊解碼器的暫存需求量的方法