亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

使用復(fù)數(shù)值數(shù)據(jù)的音頻信號解碼的制作方法

文檔序號:2827953閱讀:380來源:國知局
專利名稱:使用復(fù)數(shù)值數(shù)據(jù)的音頻信號解碼的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及音頻信號編碼。本發(fā)明具體來說,但非專門地,涉及對MPEG-1層III數(shù)據(jù)信號進(jìn)行解碼。
背景技術(shù)
MPEG-1層III(通常稱為mp3)是廣泛采用的音頻編解碼器。在ISO/IEC JTC1/SC29/WG11 MPEG,IS11172-3,Information Technology-Coding of Moving Pictures and Associated Audio for DigitalStorage Media at up to about 1.5Mbit/s,Part3Audio,MPEG-1,1992中介紹了mp3的行業(yè)標(biāo)準(zhǔn)。這一標(biāo)準(zhǔn)可以從國際標(biāo)準(zhǔn)化組織(ISO)(www.iso.ch)得到并且以引用的方式并入本文。
已經(jīng)設(shè)計(jì)出了高級音頻編碼標(biāo)準(zhǔn)(AAC)來解決mp3的部分不足。在ISO/IEC JTC1/SC29/WG11 MPEG,IS13818-3,Information Technology-Generic Coding of Moving Pictures and Associated Audio,Part3Audio,MPEG-2,1994中介紹了AAC標(biāo)準(zhǔn),這個(gè)標(biāo)準(zhǔn)也可以從ISO得到。
作為解碼處理的一部分,各個(gè)標(biāo)準(zhǔn)介紹的相應(yīng)音頻解碼器創(chuàng)建改進(jìn)離散余弦變換(MDCT)系數(shù)的形式的頻率或者譜系數(shù),即,代表編碼數(shù)據(jù)信號的譜分量的系數(shù)。
各個(gè)譜系數(shù)代表編碼音頻信號的相應(yīng)頻率分量。在某些應(yīng)用中,例如在均衡器中,有可能希望能夠?qū)ψV系數(shù)進(jìn)行后處理,以使得信號的一個(gè)或多個(gè)相應(yīng)頻率分量能夠得到直接運(yùn)用。不過,在常規(guī)的mp3和AAC解碼中,只有有限的MDCT系數(shù)的后處理是可能實(shí)行的。之所以如此,有兩個(gè)原因。首先,MDCT是臨界采樣的和重疊的變換(典型地采用50%重疊),這一變換借助時(shí)域混疊消除(TDAC)來實(shí)現(xiàn)完全重構(gòu)。這意味著,由于時(shí)域混疊的影響,借助(正向)MDCT將信號x(n)變換成X(k)和借助反向MDCT將X(k)反向變換成時(shí)域信號x′(n)一般來說不會給出恒等式x(n)=x′(n)。不過,完全重構(gòu)是通過對信號x′(n)進(jìn)行交疊相加運(yùn)算實(shí)現(xiàn)的。因此,調(diào)節(jié)單獨(dú)一個(gè)給定幀的MDCT系數(shù)能夠影響(例如,減少)解碼信號中時(shí)域混疊消除導(dǎo)致的聽得見的偽音。第二個(gè)原因是,MDCT是實(shí)數(shù)值變換,并且這使得相位調(diào)節(jié)或旋轉(zhuǎn)實(shí)際上不可能做到。
已經(jīng)知道,可以對信號的譜分量的復(fù)數(shù)值表達(dá)(即,具有實(shí)數(shù)和虛數(shù)分量的表達(dá))比較容易進(jìn)行后處理。由Coding Technologies(www.codingtechnologies.com)提供的譜帶復(fù)制(SBR)帶擴(kuò)展工具(例如,在mp3PRO和Advanced Audio Coding Plus(aacPlus)中得到了應(yīng)用)對復(fù)數(shù)值子帶域表達(dá)進(jìn)行運(yùn)算。
附圖1表示針對AAC提出的SBR解碼器。AAC MDCT系數(shù)由全基本層解碼器30(典型地運(yùn)行在采樣頻率的一半上)處理,以產(chǎn)生多個(gè)時(shí)域采樣。將時(shí)域采樣提供給32(或者在基本層解碼器運(yùn)行在整個(gè)采樣頻率上的情況下是64)頻帶復(fù)指數(shù)調(diào)制分析QMF(正交鏡像對稱濾波器)組32,以產(chǎn)生復(fù)數(shù)值子帶域信號,該信號可由處理單元34進(jìn)行后處理。在后處理之后,將復(fù)數(shù)值子帶域信號提供給64頻帶復(fù)指數(shù)調(diào)制合成QMF組36,該QMF組產(chǎn)生包括PCM采樣的輸出信號。附圖1中圖解說明的算法的缺點(diǎn)是,除了基本層解碼器外,還要使用復(fù)指數(shù)調(diào)制濾波器組,這在計(jì)算上和在存儲方面成本都是很高的。為mp3提出的SBR算法受到同樣缺點(diǎn)的困擾。

發(fā)明內(nèi)容
因此應(yīng)該希望給出一種支持復(fù)數(shù)值譜系數(shù)的后處理而又不會明顯增加解碼器的復(fù)雜性的音頻解碼器。
據(jù)此,本發(fā)明的第一個(gè)方面給出了一種解碼器,包括用于從接收到的信號中還原出多個(gè)第一譜系數(shù)的裝置,第一譜系數(shù)包括第一變換裝置的產(chǎn)物;反向變換裝置,用于將所述第一譜系數(shù)變換成一個(gè)或多個(gè)時(shí)域信號分量;第二變換裝置,用于將所述一個(gè)或多個(gè)時(shí)域信號分量變換成多個(gè)第二譜系數(shù),其中在相應(yīng)的調(diào)制頻率上,所述第二變換裝置的調(diào)制正交于所述第一變換裝置的調(diào)制,該解碼器此外還包括用于對一個(gè)或多個(gè)所述第一譜系數(shù)與相應(yīng)的第二譜系數(shù)結(jié)合起來進(jìn)行處理的裝置。
與公共調(diào)制頻率相應(yīng)的第一和第二譜系數(shù)可以一起作為復(fù)數(shù)值譜系數(shù)加以處理。并且,這樣,適合于由處理裝置進(jìn)行后處理。
按照優(yōu)選實(shí)施方式,所述第一正向頻率變換和所述第二正向頻率變換之一包括改進(jìn)離散余弦變換(MDCT),另一個(gè)包括改進(jìn)離散正弦變換(MIDST)。按照這樣的實(shí)施方式,該解碼器尤其適用于對mp3信號進(jìn)行解碼。按照一種實(shí)施方式,解碼器還包括用于對所述第二譜系數(shù)和它們的相應(yīng)混疊的第一譜系數(shù)進(jìn)行復(fù)數(shù)值混疊減少的裝置,其中所述復(fù)數(shù)值混疊減少裝置包括一個(gè)或多個(gè)設(shè)置成用于將復(fù)數(shù)值加權(quán)值應(yīng)用于所述混疊的第一和相應(yīng)的第二頻率分量的抗混疊蝶形運(yùn)算單元(butterflies)。
按照一種優(yōu)選實(shí)施方式,該解碼器此外該包括用于對所述復(fù)數(shù)值譜系數(shù)進(jìn)行一次或多次復(fù)數(shù)值反向頻率變換來產(chǎn)生多個(gè)數(shù)據(jù)采樣的裝置;用于將一種或多種類型的窗口函數(shù)應(yīng)用于所述數(shù)據(jù)采樣來產(chǎn)生多個(gè)加窗的數(shù)據(jù)采樣的裝置;和用于從所述加窗的數(shù)據(jù)采樣構(gòu)建輸出信號的裝置。最好,所述復(fù)數(shù)值反向頻率變換包括奇數(shù)頻率調(diào)制的反向離散傅立葉變換(IDFT),更好地,所述復(fù)數(shù)值反向頻率變換包括奇次奇數(shù)頻率調(diào)制的反向離散傅立葉變換(O2DFT)。
最好,該解碼器此外還包括用于按照說明書中的等式[5]和[6]調(diào)節(jié)復(fù)數(shù)值譜系數(shù)的相位的裝置。
按照另外一種實(shí)施方式,所述反向變換裝置包括合成子帶濾波器組并且第二正向變換裝置包括分析子帶濾波器組。最好,所述第一變換裝置包括分析濾波器組,所述第一和第二正向變換裝置之一是余弦調(diào)制的,另一個(gè)是正弦調(diào)制的。
本發(fā)明的第二個(gè)方面給出了一種對數(shù)據(jù)信號進(jìn)行解碼的方法,該方法包括從接收到的信號中還原出多個(gè)第一頻率系數(shù),第一譜系數(shù)包括第一變換裝置的產(chǎn)物;由反向變換裝置將所述第一譜系數(shù)變換成一個(gè)或多個(gè)時(shí)域信號分量;由第二變換裝置將所述一個(gè)或多個(gè)時(shí)域信號分量變換成多個(gè)第二譜系數(shù),其中在相應(yīng)的調(diào)制頻率上,所述第二變換裝置的調(diào)制正交于所述第一變換裝置的調(diào)制,該方法此外還包括對一個(gè)或多個(gè)所述第一譜系數(shù)與相應(yīng)的第二譜系數(shù)結(jié)合起來進(jìn)行處理。
在從屬權(quán)利要求中列出了其它優(yōu)選特征。
在閱讀了下述本發(fā)明優(yōu)選實(shí)施方式的介紹的情況下,本發(fā)明的更多有益方面對于本領(lǐng)域技術(shù)人員來說將會變得顯而易見。


現(xiàn)在將以舉例的方式并且參照附圖介紹本發(fā)明的實(shí)施方式,其中附圖1給出了圖解說明常規(guī)譜帶復(fù)制(SBR)增強(qiáng)解碼器的框圖;附圖2給出了常規(guī)MPEG-1層III解碼器的框圖;附圖3給出了具體實(shí)施本發(fā)明的一個(gè)方面的解碼器;附圖4給出了在上采樣之后下采樣濾波器組的兩個(gè)相鄰子帶濾波器的響應(yīng)的固定格式的圖解說明;附圖5給出了抗混疊蝶形運(yùn)算單元的示意圖;附圖6給出了具體實(shí)施本發(fā)明的一個(gè)方面的解碼器的另一種實(shí)施方式;附圖7表示常規(guī)MPEG-1層I/II解碼器的簡化框圖;和附圖8給出具體實(shí)施本發(fā)明的一個(gè)方面的再另一種實(shí)施方式。
具體實(shí)施例方式
典型的常規(guī)MPEG-1層III編碼器(未示出)設(shè)置成用來接收包括一連串或一幀1152個(gè)音頻輸入采樣的PCM輸入信號。將該輸入信號供應(yīng)給多相分析濾波器組,該濾波器組將該輸入信號濾波成32個(gè)間距均勻的重疊頻帶,以產(chǎn)生32個(gè)下采樣子帶信號分量,各個(gè)分量包括36個(gè)子帶采樣。
針對各個(gè)子帶信號分量,進(jìn)行加窗的(正向)MDCT(改進(jìn)離散余弦變換)。使用四種窗口類型來迎合可變時(shí)間分段。對于信號的(準(zhǔn))穩(wěn)定部分,可以使用所謂的正常窗口,而,對于信號的非穩(wěn)定部分,可以使用一系列所謂短窗。定義了兩種短時(shí)類型的窗口(所謂的開始和停止窗口)來防止從正常窗口切換到短窗以及反過來進(jìn)行的時(shí)候出現(xiàn)不連續(xù)。對于正常、開始和停止窗口,MDCT是對36個(gè)輸入(即,36個(gè)子帶采樣)進(jìn)行的并且產(chǎn)生18個(gè)輸出MDCT系數(shù),這些MDCT系數(shù)通常稱為頻率線。對于短窗,MDCT是對三個(gè)12個(gè)輸入的組(即,三個(gè)12個(gè)子帶采樣的組)進(jìn)行的,并且產(chǎn)生三個(gè)6個(gè)輸出MDCT系數(shù)(或頻率線)的組。576個(gè)MDCT系數(shù)的集合稱為一團(tuán)(granule)。對于包括1152個(gè)輸入采樣的典型mp3幀來說,由于編碼處理的重疊性質(zhì),會產(chǎn)生兩個(gè)團(tuán)??偟膩碚f,會為各個(gè)576個(gè)輸入采樣產(chǎn)生18×32=576個(gè)MDCT系數(shù)或頻率線。
在正常、開始或停止窗口的情況下,將MDCT頻率線提供給抗混疊蝶形運(yùn)算單元,以減小由對多相濾波器組的譜重疊濾波器進(jìn)行下采樣所造成的混疊效果。最后,對MDCT系數(shù)進(jìn)行編碼(使用霍夫曼(Huffman)編碼)和量化,以產(chǎn)生具有規(guī)定位流格式的輸出信號。量化和編碼是在位分配單元的控制下進(jìn)行的,該單元執(zhí)行位分配算法,該算法典型地是由心理聲學(xué)模型指導(dǎo)的。
附圖2給出了常規(guī)MPEG-1層III解碼器10的簡化框圖,僅僅示出了對評價(jià)本發(fā)明有幫助的那些組成部分。解碼器10設(shè)置成用于接收具有規(guī)定mp3位流格式的輸入信號。解碼和去量化單元12進(jìn)行位流的解碼(典型地是霍夫曼解碼)和去量化,以產(chǎn)生頻率線,或者M(jìn)DCT系數(shù)。對于各個(gè)由編碼器產(chǎn)生的576個(gè)MDCT頻率線的集合,再生出相應(yīng)的576個(gè)頻率線。
將這些頻率線提供給重新排序單元14,該單元在短型窗口的情況下對各個(gè)系數(shù)團(tuán)內(nèi)的頻率線進(jìn)行重新排序。在正常、開始或停止窗口的情況下,將這些頻率線提供給混疊蝶形運(yùn)算單元16,混疊蝶形運(yùn)算單元執(zhí)行由編碼器的抗混疊蝶形運(yùn)算單元執(zhí)行的抗混疊操作的反向操作。
MDCT單元18對這些頻率線執(zhí)行IMDCT(反向改進(jìn)離散余弦變換),以產(chǎn)生32個(gè)多相濾波器子帶信號分量,各個(gè)分量包括36個(gè)子帶采樣。對于與正常、開始或停止窗口MDCT相應(yīng)的那些頻率線,IMDCT單元18將18個(gè)頻率線作為輸入并且產(chǎn)生36個(gè)子帶域采樣。對于與短窗MDCT相應(yīng)的那些頻率線,IMDCT單元18將3個(gè)6個(gè)頻率線的組作為輸入并且產(chǎn)生3個(gè)12個(gè)子帶域采樣的組。
由加窗和重疊-相加單元20對子帶采樣進(jìn)行加窗操作和標(biāo)準(zhǔn)重疊和相加操作。在位流的相關(guān)輔助信息(side information)內(nèi)攜帶著與要使用哪種類型的窗口有關(guān)的信息。
最后,將這些子帶采樣提供給多相合成濾波器組22,該濾波器組22按系數(shù)32進(jìn)行上采樣,并且產(chǎn)生包括PCM采樣的輸出信號。
該濾波器組22包括原型低通濾波器,對原始低通濾波器進(jìn)行余弦調(diào)制,以形成較高頻帶。子帶濾波器組與MDCT/IMDCT單元的串聯(lián)組合稱為混合濾波器組,因?yàn)樗徊糠钟蔀V波器組構(gòu)成,一部分由變換構(gòu)成。IMDCT單元18和合成濾波器組22一起構(gòu)成混合合成濾波器組。從計(jì)算的角度看,并且因此從實(shí)現(xiàn)的角度看,認(rèn)為使用混合濾波器組是mp3的弱點(diǎn),它引入了復(fù)雜性。
如上面所指出的,MDCT系數(shù)是實(shí)數(shù)值的(即,它們不包括虛部)并且是臨界采樣的,這樣來說,它們不太適于后處理。在下面的本發(fā)明的優(yōu)選實(shí)施方式的介紹中,給出了一種復(fù)雜性與解碼器10相當(dāng)?shù)慕獯a器,這種解碼器在解碼處理的中間階段創(chuàng)建類似奇調(diào)制離散傅立葉變換(DFT)表達(dá)的復(fù)數(shù)值系數(shù),這些復(fù)數(shù)值系數(shù)很適于后處理。而且,實(shí)數(shù)值MDCT系數(shù)擴(kuò)展到復(fù)數(shù)值系數(shù)帶來了系數(shù)為2的有效過采樣。結(jié)果,這些復(fù)數(shù)值系數(shù)不會象MDCT那樣受到時(shí)域混疊的影響。換句話說,借助這種復(fù)數(shù)值變換及其反變換對信號x(n)進(jìn)行變換和反變換將會得到同樣的信號x(n)。
可以將MDCT定義為C(k)=Σn=0N-1x(n)cos(2π(n+12+N4)(k+12)N)---[1]]]>其中n是時(shí)間指數(shù),對于常規(guī)mp3解碼器來說,該時(shí)間指數(shù)代表子帶采樣指數(shù);N是變換長度或大?。籯是頻率指數(shù);x(n)是時(shí)域信號,在常規(guī)mp3解碼器中,該信號包括由子帶采樣構(gòu)成的子帶時(shí)域信號;而C(k)是頻域MDCT頻譜。
等式[1]代表復(fù)數(shù)值變換的實(shí)部,如等式[2]中所示 等式[2]中給出的復(fù)數(shù)值變換是奇次奇頻離散傅立葉變換(O2DFT)并且可以通過快速傅立葉變換(FFT)的預(yù)旋轉(zhuǎn)和后旋轉(zhuǎn)(或調(diào)制)來有效地加以計(jì)算。由等式[2]的復(fù)數(shù)值變換的虛部給出了稱為改進(jìn)離散正弦變換(MDST)的變換。因此,可以將MDST描述為
其中S(k)是頻域MDST頻譜。
因此,MDCT系數(shù)與它們相應(yīng)的MDST系數(shù)一起給出了數(shù)據(jù)信號在頻域中的復(fù)數(shù)值表達(dá),各個(gè)MDCT系數(shù)給出對應(yīng)的復(fù)數(shù)值系數(shù)的實(shí)部,而相應(yīng)MDST給出虛部。這樣的復(fù)數(shù)值系數(shù)很適于后處理??梢詫DCT和MDST說成是相互正交的變換,即,相對于彼此正交的變換,因?yàn)橐粋€(gè)變換的頻率指數(shù)k的變換內(nèi)核正交于另一個(gè)變換對應(yīng)于同一頻率指數(shù)k的變換內(nèi)核。換句話說,具有相同調(diào)制頻率的第一變換(例如,MDCT)和第二變換(例如,MDST)各自的變換調(diào)制內(nèi)核是正交的。
正是這種正交屬性使得變換各自的輸出能夠用作復(fù)數(shù)值表達(dá)的相應(yīng)實(shí)部和虛部。一般來說,用在具體實(shí)施本發(fā)明的解碼器中來創(chuàng)建復(fù)數(shù)值頻率或譜系數(shù)的虛部的正向頻率變換的調(diào)制在相應(yīng)的頻率上正交于用在編碼器中來創(chuàng)建復(fù)數(shù)值頻率或譜系數(shù)的實(shí)部的正向頻率變換的調(diào)制(或者反過來,即,解碼器中的正向頻率變換創(chuàng)建實(shí)部和編碼器中的正向頻率變換創(chuàng)建復(fù)數(shù)值頻率系數(shù)的虛部的情況)。在下面的本發(fā)明的具體實(shí)施方式
的介紹中,假設(shè)解碼器設(shè)置成用于對mp3數(shù)據(jù)信號進(jìn)行解碼,所以在編碼器(未示出)中采用MDCT,并且在實(shí)施本發(fā)明的解碼器中采用MDST。不過,將會理解,按照其它可供選用的實(shí)施方式,可以采用其它類似的正交變換。而且,可以使用將數(shù)據(jù)信號從時(shí)域變換到頻率(以及反過來)的其它裝置,例如,子帶分析和合成濾波器組,這兩個(gè)濾波器組是以相互正交的方式調(diào)制的。
附圖3給出具體實(shí)現(xiàn)本發(fā)明的一個(gè)方面的解碼器40的框圖。為了清晰,僅僅示出了解碼器40有助于理解本發(fā)明的那些組成部分。解碼器40設(shè)置成用于對多個(gè)MDCT系數(shù)或頻率線進(jìn)行運(yùn)算,如附圖3的左手邊所指出的。在正常情況下,MDCT系數(shù)是通過對解碼器40接收到的輸入信號進(jìn)行解碼和去量化而還原出來的。例如,在解碼器40包括mp3解碼器的情況下,輸入信號包括mp3編碼位流,并且解碼器40此外還包括解碼和去量化單元以及重新排序單元(在附圖2中給出,而在附圖3中沒有示出),它們對所接收到的mp3位流進(jìn)行還原和重新排序,以產(chǎn)生MDCT系數(shù)。在下面的介紹中,例如,假設(shè)解碼器40設(shè)置成用來對mp3信號進(jìn)行解碼。
為了獲得子帶域采樣,借助IMDCT對MDCT系數(shù)進(jìn)行變換。對于mp3解碼,這可以采用與常規(guī)mp3解碼器10所采用的方式相同的方式來實(shí)現(xiàn)。因此,按照優(yōu)選實(shí)施方式,解碼器40包括混疊單元或者混疊蝶形運(yùn)算單元42和IMDCT單元44,它們分別類似于常規(guī)解碼器10的混疊蝶形運(yùn)算單元16和IMDCT單元18。
IMDCT單元44產(chǎn)生多個(gè)包括子帶采樣的子帶域信號分量。由加窗和重疊-相加單元46對子帶采樣進(jìn)行常規(guī)加窗和重疊-相加運(yùn)算,按照優(yōu)選實(shí)施方式,該加窗和重疊-相加單元46類似于常規(guī)解碼器10的加窗和重疊-相加單元20。
為了產(chǎn)生復(fù)數(shù)值系數(shù),解碼器40必須創(chuàng)建這些系數(shù)的虛部。如前面參照等式[3]介紹的那樣,這可以通過對子帶域信號分量進(jìn)行MDST來實(shí)現(xiàn)。在重疊-相加運(yùn)算之后,子帶信號分量就做好了變換回頻域的準(zhǔn)備,并且將它們提供給MDST單元48。
針對各個(gè)子帶域信號分量,MDST單元48進(jìn)行加窗(正向)MDST。對于正常、開始或停止窗口,對36個(gè)輸入(即,36個(gè)子帶采樣)進(jìn)行MDST,并且產(chǎn)生18個(gè)輸出MDST系數(shù)或頻率線。對于短窗,對三個(gè)12個(gè)輸入的組(即,三個(gè)12個(gè)子帶采樣的組)進(jìn)行MDST,并且產(chǎn)生三個(gè)6個(gè)輸出MDST系數(shù)的組。
最好對MDST系數(shù)進(jìn)行抗混疊。因此,解碼器40最好包括抗混疊單元50或者抗混疊蝶形運(yùn)算單元。在正常情況下,抗混疊僅僅針對與正常、開始或停止窗口相關(guān)的數(shù)據(jù)進(jìn)行??够殳B蝶形運(yùn)算單元50總地來講類似于mp3標(biāo)準(zhǔn)中介紹的抗混疊蝶形運(yùn)算單元,只是要對計(jì)算的某些方面求反(negated)。具體來說,參照mp3標(biāo)準(zhǔn)并且使用同樣的符號,為了用在針對MDCT系數(shù)的抗混疊蝶形運(yùn)算單元中,將向量c定義為c=[-0.6,-0.535,-0.33,-0.185,-0.095,-0.041,-0.0142,-0.0037]由此可以計(jì)算出下列兩個(gè)另外的向量cu和cs
cu(k)=c(k)1+c(k)2,k=0,...,7]]>cs(k)=11+c(k)2,k=0,...,7]]>[4]在對MDST系數(shù)進(jìn)行抗混疊的時(shí)候,要對向量cu求反,即,乘以系數(shù)-1。在其它情況下,抗混疊蝶形運(yùn)算單元50可以按照mp3標(biāo)準(zhǔn)操作。
因此,在由附圖3中的虛線AA’代表的解碼階段,可以為解碼器40給出復(fù)數(shù)值系數(shù),各個(gè)系數(shù)的虛部由相應(yīng)的MDST系數(shù)給出,該系數(shù)的實(shí)部由相應(yīng)的MDCT系數(shù)給出。為了使各個(gè)MDST系數(shù)的產(chǎn)生與其相應(yīng)的MDCT系數(shù)同步,最好由延遲元件52對MDCT系數(shù)進(jìn)行延遲。延遲量取決于產(chǎn)生MDST系數(shù)所需的處理延遲,該處理延遲主要由進(jìn)行重疊-相加運(yùn)算所需的延遲決定。解碼器40為各個(gè)系數(shù)團(tuán)的各個(gè)MDCT系數(shù)產(chǎn)生相應(yīng)的復(fù)數(shù)值系數(shù)。
這些復(fù)數(shù)值系數(shù)適合于后處理,并且為此,在解碼器40中設(shè)置了處理單元56,用來如期望的調(diào)節(jié)一個(gè)或多個(gè)復(fù)數(shù)值系數(shù)。由于復(fù)數(shù)值系數(shù)是頻域分量,因此可以有利地直接對編碼信號的一個(gè)或多個(gè)頻率分量進(jìn)行后處理。
還要求解碼器40產(chǎn)生時(shí)域輸出信號,在本例中,該時(shí)域輸出信號包括來自經(jīng)過后處理(視情況而定)的復(fù)數(shù)值系數(shù)的PCM信號。為此,觀察到復(fù)數(shù)值系數(shù)的形式類似于由O2DFT產(chǎn)生的系數(shù)的形式。而且,由整個(gè)頻率分析(編碼器和解碼器二者中的)結(jié)合抗混疊(編碼器和解碼器二者中的)得到的系數(shù)與由單獨(dú)一次復(fù)數(shù)值變換獲得的系數(shù)對應(yīng)得非常好,要好于對各個(gè)子帶信號進(jìn)行得一組復(fù)數(shù)值變換。因此認(rèn)為,通過對復(fù)數(shù)值系數(shù)進(jìn)行反O2DFT有可能產(chǎn)生時(shí)域輸出信號。這有利地避免了在解碼器40中使用子帶濾波器組的需求。
不過,為了減少輸出信號中能夠感覺到的偽音,最好進(jìn)行復(fù)數(shù)值系數(shù)的某種預(yù)處理,從而使它們更加接近地類似于O2DFT系數(shù),就好像是由單獨(dú)一次O2DFT獲得的,而不是對各個(gè)子帶信號進(jìn)行O2DFT獲得的。就此而論,由解碼器40產(chǎn)生的復(fù)數(shù)值系數(shù)與真正的O2DFT系數(shù)之間的主要差別是1)雖然已經(jīng)通過由抗混疊蝶形運(yùn)算單元50執(zhí)行的抗混疊并且在編碼器中得到了減少,但是在復(fù)數(shù)值系數(shù)中仍然存在一些混疊;和2)由常規(guī)mp3編碼器的(多相)濾波器組造成的相位旋轉(zhuǎn)。
殘余混疊并不明顯并且可以容忍。不過,由多相濾波器造成的相位旋轉(zhuǎn)可以通過對各個(gè)復(fù)數(shù)值系數(shù)施加相位旋轉(zhuǎn)或移動(dòng)來加以補(bǔ)償?;旌蟤p3濾波器組和O2DFT二者各自的相位特性都基本上是線性的并且因此可以由線性函數(shù)表達(dá)。mp3濾波器組結(jié)合對奇數(shù)子帶使用頻率倒置還對交替的子帶進(jìn)行了求反(即,引入180°或π相移)。因此,復(fù)數(shù)值系數(shù)補(bǔ)償mp3或類似的濾波器組的性能所要求的相移(comp可以由下式近似 其中a和b是常數(shù),而k是與系數(shù)團(tuán)的576個(gè)系數(shù)相應(yīng)的指數(shù)。項(xiàng)ak+b給出與原型濾波器和所應(yīng)用的余弦調(diào)制二者的線性相位特性相關(guān)的線性相移,而項(xiàng) 用于對與交替子帶相應(yīng)的系數(shù)求反(假設(shè)是普通的mp3結(jié)構(gòu))。a和b的值可以通過在O2DFT輸出端處和在混合復(fù)數(shù)擴(kuò)展MPEG-1分析濾波器組的輸出端處測量任意輸入信號的相位特性來確定。通過分析多個(gè)輸入信號或幀的這些相應(yīng)相位特性,可以優(yōu)化a和b的值。
可以以直接旋轉(zhuǎn)的方式對復(fù)數(shù)值系數(shù)應(yīng)用多相濾波器修正Pcorr(k)=exp(j·comp(k))P(k)[6]其中P(k)是未補(bǔ)償?shù)膹?fù)數(shù)值系數(shù),而Pcorr(k)是經(jīng)過補(bǔ)償?shù)幕蚪?jīng)過修正的復(fù)數(shù)值系數(shù)(可在附圖3中的級AA′處得到)。
在附圖3中,解碼器40包括相位補(bǔ)償單元54或多相濾波器修正單元,用于執(zhí)行等式[6]的相位補(bǔ)償。該相位補(bǔ)償單元54將經(jīng)過相位補(bǔ)償?shù)膹?fù)數(shù)值系數(shù)Pcorr(k)提供給處理單元56。
在后處理(視情況而定)之后,復(fù)數(shù)值系數(shù)做好了變換到時(shí)域的準(zhǔn)備。如上面所指出的那樣,這在傳統(tǒng)上是通過對與各個(gè)系數(shù)團(tuán)相關(guān)的復(fù)數(shù)值系數(shù)進(jìn)行一次或多次反向O2DFT來實(shí)現(xiàn)的。為此,解碼器40此外還包括反向O2DFT單元58,該單元是為了對復(fù)數(shù)值系數(shù)進(jìn)行一次或多次反向O2DFT而設(shè)置的。將會看到,按照優(yōu)選實(shí)施方式,反向O2DFT單元58設(shè)置成用于一次對整個(gè)系數(shù)團(tuán)的各個(gè)復(fù)數(shù)值系數(shù)進(jìn)行運(yùn)算,而不是按照它們相關(guān)的子帶對復(fù)數(shù)值系數(shù)應(yīng)用一系列較小的反向O2DFT。因此,反向O2DFT單元58對與系數(shù)團(tuán)相關(guān)的的所有復(fù)數(shù)值系數(shù)執(zhí)行單獨(dú)一次反向O2DFT(在需要正常、開始或停止類型的窗口時(shí))或者對與系數(shù)團(tuán)相關(guān)的所有復(fù)數(shù)值系數(shù)的相應(yīng)數(shù)量的子集執(zhí)行多次反向O2DFT(在需要短型窗口時(shí))。對于系數(shù)團(tuán)包括576個(gè)頻率線的mp3位流,反向O2DFT單元58對于正常、開始或停止窗口在整個(gè)系數(shù)團(tuán)執(zhí)行單獨(dú)一次反向O2DFT,得到1152個(gè)時(shí)域采樣,并且對3個(gè)192個(gè)復(fù)數(shù)值系數(shù)的子集執(zhí)行三次反向O2DFT,得到三個(gè)相應(yīng)的384個(gè)時(shí)域采樣的序列或集合。反向O2DFT單元58的輸出包括多個(gè)(在本例中是1152個(gè))還原出來的信號分量或采樣,這些信號分量或采樣可以用于構(gòu)建PCM輸出信號。
為了構(gòu)建PCM輸出信號,對由反向O2DFT單元58產(chǎn)生的信號采樣執(zhí)行加窗和重疊-相加運(yùn)算。因此,解碼器40此外還包括加窗單元60和重疊-相加單元62,下面將更加詳細(xì)地介紹它們的操作。
為了使使用加窗和重疊-相加單元60、62進(jìn)行的PCM輸出信號構(gòu)建可以得到更好的理解,現(xiàn)在將詳細(xì)介紹常規(guī)mp3加窗。在mp3中,規(guī)定了四種不同的窗口類型(和伴隨的長度),即,‘正?!?、‘開始、‘短’和‘停止’。選擇某種類型的窗口或者一系列不同窗口類型來迎合要應(yīng)用(多個(gè))窗口的數(shù)據(jù)部分的特性。例如,短型窗口通常應(yīng)用于與音頻信號中的瞬變對應(yīng)的數(shù)據(jù)部分。與給定數(shù)據(jù)幀相關(guān)的輔助信息指出與系數(shù)團(tuán)一起使用的是哪種窗口類型。所需要的窗口類型影響MDCT的長度或大小(因此還有反向MDCT)和加窗/重疊-相加運(yùn)算二者。
對于mp3,可以將窗口函數(shù)z(n)描述為下列形式對于正常類型的窗口(類型0)z(n)=sin(π36(n+12)),n=0...35---[7]]]>對于開始類型的窗口(類型1)
z(n)=sin(π36(n+12))n=0...171n=18...23sin(π12(n+12-18))n=24...290n=30...35---[8]]]>對于短型窗口(類型2),同時(shí)編碼三個(gè)短窗zp(n)=sin(π12(n+12)),n=0...11,p=0,1,2---[9]]]>對于停止類型的窗口(類型3)z(n)=0n=0...5sin(π12(n+12-6))n=6...111n=12...17sin(π36(n+12))n=18...35---[10]]]>等式[7]、[8]、[9]和[10]中的各個(gè)窗口函數(shù)一般情況下看作單一窗口函數(shù),不過它們可能牽涉到不止一個(gè)窗口的應(yīng)用。從函數(shù)[7]、[8]和[10]中可以看出,窗口長度是36(即,36點(diǎn)窗口),因此指數(shù)n從0變到35。對于函數(shù)[9],三個(gè)短的12點(diǎn)窗口的組合長度是36,因此對于p=0到2,n從0變到11。因此,各個(gè)窗口類型的總長度對應(yīng)于子帶信號分量的大小(36個(gè)子帶采樣)。
現(xiàn)在介紹由加窗和重疊-相加單元60、62結(jié)合反向O2DFT單元58進(jìn)行的PCM輸出信號的構(gòu)建。在下面的例子中,假設(shè)原始PCM信號包括1152個(gè)音頻采樣的幀,各個(gè)幀有效地變換成兩個(gè)576個(gè)頻率線的系數(shù)團(tuán)(或者M(jìn)DCT系數(shù))。因此,反向O2DFT單元58對576個(gè)復(fù)數(shù)值系數(shù)的系數(shù)團(tuán)進(jìn)行操作,以產(chǎn)生包括1152個(gè)采樣的信號,然后將這些采樣提供給加窗和重疊-相加單元60、62。將會看出,僅僅將反向O2DFT單元58產(chǎn)生的信號采樣的各個(gè)實(shí)部提供給加窗單元60。
將復(fù)數(shù)值系數(shù)的第1個(gè)集合或系數(shù)團(tuán)表示為Xl(k),其中k=0...575。參照附圖3,Xl(k)是由經(jīng)過修正的復(fù)數(shù)值系數(shù)Pcorr(k)(在由處理單元56進(jìn)行了后處理之后)的各個(gè)集合或系數(shù)團(tuán)構(gòu)成。在對復(fù)數(shù)值系數(shù)的第1集合(1從0開始)進(jìn)行了解碼之后,由加窗和重疊-相加單元60、62產(chǎn)生的輸出信號用下式描述(使用重疊-相加)yl+1(n+576·l)=y(tǒng)l(n+576·l)+xl+1(n) [11]其中指數(shù)n=0…1151,yl(n)是對第1個(gè)集合進(jìn)行解碼之后的輸出信號,而xl(n)是對復(fù)數(shù)值系數(shù)Xl(k)進(jìn)行變換(反向O2DFT)得到的信號的實(shí)部。對于所有的n,將輸出信號yo(n)初始化為零。
信號xl(n)的產(chǎn)生取決于相應(yīng)的指定窗口類型,如下所述。在第1個(gè)集合的窗口類型是0、1或3的情況下,反向O2DFT單元58產(chǎn)生臨時(shí)信號xtmp(n),該信號包括輸入長度為576并且輸出長度為1152的反向O2DFT的實(shí)部(即,對與相應(yīng)系數(shù)團(tuán)相關(guān)的所有復(fù)數(shù)值系數(shù)進(jìn)行的單獨(dú)一次“長”反向O2DFT)。在等式[12]中給出了合乎需要的變換 其中n=0...N-1并且變換長度N=1152。
當(dāng)用于第1個(gè)集合的窗口類型是2(即,“短窗”)時(shí),反向O2DFT單元58對三個(gè)192個(gè)復(fù)數(shù)值系數(shù)的集合執(zhí)行各自的反向O2DFT,以產(chǎn)生三個(gè)相應(yīng)的臨時(shí)信號,將這三個(gè)臨時(shí)信號表示為xtmp,0(n)、xtmp,1(n)和xtmp,2(n),這三個(gè)信號各自具有384個(gè)點(diǎn),如等式[13]中所示 其中指數(shù)p=0...2,n=0...N-1,N=384,并且在按頻率排序之前按照p對Xl(k)進(jìn)行排序。
有效提供給加窗和重疊-相加單元60、62的是臨時(shí)信號xtmp(n)、xtmp,p(n)。
當(dāng)?shù)?個(gè)集合的窗口類型是0時(shí),由加窗單元60按照下式計(jì)算信號xl(n)
xl(n)=sin(π1152(n+12))xtmp(n),n=0...1151---[14]]]>其中等式[14]中的除數(shù)1152與反向O2DFT變換長度N一致。
當(dāng)?shù)?個(gè)集合的窗口類型是1時(shí),由加窗單元60按照下式計(jì)算信號xl(n)xl(n)=sin(π1152(n+12))xtmp(n),n=0...575]]>xl(n)=xtmp(n) n=576...767xl(n)=sin(π384(n+12-576))xtmp(n),n=768...959]]>xl(n)=0 n=960...1151 [15]當(dāng)?shù)?個(gè)集合的窗口類型是2時(shí),加窗單元60通過首先計(jì)算三個(gè)臨時(shí)信號來計(jì)算信號xl(n)xl,tmp,p(n)=sin(π384(n+12))xtmp,p(n),n=0...383,p=0...2---[16]]]>其中等式[16]中的除數(shù)384與反向O2DFT變換長度N一致。
然后按照下式構(gòu)建信號xl(n)xl(n)=0 n=0...191xl(n)=xl,tmp,0(n-192) n=192...383xl(n)=xl,tmp,0(n-192)+xl,tmp,1(n-384) n=384...575xl(n)=xl,tmp,1(n-384)+xl,tmp,2(n-576) n=576...767xl(n)=xl,tmp,2(n-576) n=768...959xl(n)=0 n=960...1151[17]當(dāng)?shù)?個(gè)集合的窗口類型是3時(shí),由加窗單元60按照下式計(jì)算信號xl(n)xl(n)=0 n=0...191xl(n)=sin(π384(n+12-192))xtmp(n),n=192...383]]>xl(n)=xtmp(n) n=384...575xl(n)=sin(π1152(n+12))xtmp(n),n=576...1151---[18]]]>其中除數(shù)1152與反向O2DFT變換長度N一致并且除數(shù)384與N/3一致。
將會看出,等式[14]、[15]、[16]和[18]具有下列一般形式xl(n)=z(n)xtmp(n) [19]其中xl(n)是加窗函數(shù),xtmp(n)是未加窗函數(shù),而z(n)是窗口函數(shù)。注意,等式[14]、[15]、[16]和[18]的窗口函數(shù)z(n)總地來說分別類似于等式[7]、[8]、[9]和[10]中描述的窗口函數(shù)z(n)。不過,等式[14]、[15]、[16]和[18]中的窗口函數(shù)z(n)各自的窗口長度按照各自的變換長度越長,各自的除數(shù)就相應(yīng)地越大。等式[14]、[15]、[16]和[18]的窗口函數(shù)z(n)可以說成分別包括等式[7]、[8]、[9]和[10]中描述的窗口函數(shù)z(n)的上采樣形式,上采樣的范圍取決于各自的變換長度/窗口長度N。還要注意,等式[14]、[15]、[16]和[18]的窗口函數(shù)z(n)各自包括單獨(dú)一個(gè)窗口函數(shù),即使它的應(yīng)用可能涉及不止一個(gè)窗口的應(yīng)用。
從前述介紹中將會意識到,解碼器40能夠通過創(chuàng)建復(fù)數(shù)值系數(shù)在解碼處理的中間階段實(shí)現(xiàn)編碼信號的后處理。有利地,由于復(fù)數(shù)值系數(shù)代表編碼信號的頻率或譜分量,因此基于頻率的后處理可以直接進(jìn)行。而且,解碼器40與常規(guī)的mp3解碼器10相比,解碼器40并非明顯更復(fù)數(shù)值,并且有益地,不需要合成濾波器組。還要注意,解碼器40并不會受到時(shí)域混疊的困擾,因?yàn)镺2DFT表達(dá)得到了有效的系數(shù)為2的過采樣。
按照前述實(shí)施方式,對復(fù)數(shù)值系數(shù)應(yīng)用一次或多次反向O2DFT。按照另一種可選實(shí)施方式,可以使用可選的變換。例如,在編碼器使用奇數(shù)頻率調(diào)制變換(例如,奇數(shù)頻率調(diào)制離散余弦變換(DCT),即,DCT類型IV)的情況下,在解碼器中使用相應(yīng)的反向奇數(shù)頻率調(diào)制變換,例如奇數(shù)頻率調(diào)制DFT。因此,在解碼器40中,可以使用奇數(shù)頻率調(diào)制反向離散傅立葉變換代替反向O2DFT。具體參照等式[12]和[13],由項(xiàng)(k+1/2)代表奇數(shù)頻率調(diào)制或者旋轉(zhuǎn),其中1/2將頻域中的變換采樣移動(dòng)了半個(gè)采樣??梢詫⑵鏀?shù)頻率調(diào)制離散傅立葉變換定義為如下形式
C(k)=Σnx(n)e-j(2πN(n+φ)(k+12))]]>其中,φ可以取任意值。
并非必須使用奇數(shù)頻率調(diào)制變換。例如,在編碼器中可以使用偶數(shù)頻率調(diào)制的變換(例如,DCT類型I變換),只要在解碼器中使用類似調(diào)制的反向變換。也可以使用其它頻率的調(diào)制(內(nèi)核),只要編碼器和解碼器中使用兼容的調(diào)制內(nèi)核。
按照另外一種可選實(shí)施方式(未示出),反向O2DFT單元設(shè)置成用于按照復(fù)數(shù)值系數(shù)與哪個(gè)子帶相關(guān)對復(fù)數(shù)值系數(shù)應(yīng)用一系列較小的反向O2DFT,而不是一次對整個(gè)系數(shù)團(tuán)的各個(gè)復(fù)數(shù)值系數(shù)進(jìn)行運(yùn)算。因此,在mp3系數(shù)的情況下,反向O2DFT單元產(chǎn)生32個(gè)復(fù)數(shù)值子帶域信號分量,各個(gè)分量包括36個(gè)子帶采樣。對于與正常、開始或停止窗口相應(yīng)的那些復(fù)數(shù)值系數(shù),反向O2DFT單元將18個(gè)復(fù)數(shù)值系數(shù)作為輸入,并且產(chǎn)生36個(gè)復(fù)數(shù)值子帶域采樣。對于與短窗相應(yīng)的那些復(fù)數(shù)值系數(shù),反向O2DFT單元將3個(gè)6個(gè)復(fù)數(shù)值系數(shù)的組作為輸入并且產(chǎn)生3個(gè)12個(gè)復(fù)數(shù)值子帶域采樣的組。按照這樣的實(shí)施方式,最好包括處于后處理單元與反向O2DFT單元之間的混疊單元,用于對復(fù)數(shù)值系數(shù)進(jìn)行混疊,以抵消或基本上抵消由抗混疊單元50和編碼器中的抗混疊給出的抗混疊。在反向O2DFT單元之后,將復(fù)數(shù)值子帶采樣提供給復(fù)指數(shù)調(diào)制合成濾波器組,僅僅使用該濾波器組的實(shí)數(shù)值輸出分量來提供解碼器的輸出信號。舉例來說,復(fù)指數(shù)調(diào)制合成濾波器組可以使用與常規(guī)余弦調(diào)制濾波器組類似的等式來實(shí)現(xiàn),只是將余弦函數(shù)替換為等價(jià)的復(fù)指數(shù)函數(shù)。而且,因?yàn)閮H使用實(shí)數(shù)值輸出,所以一種可選方案是對復(fù)數(shù)值子帶采樣的實(shí)數(shù)值部分采用常規(guī)的余弦調(diào)制的濾波器組并且對復(fù)數(shù)值子帶采樣的虛部采用相應(yīng)的正弦調(diào)制的濾波器組(使用與余弦調(diào)制的濾波器組相同的等式,只是將余弦調(diào)制替換為正弦調(diào)制)。
在附圖3的解碼器40中,抗混疊單元50可以包括常規(guī)的抗混疊裝置,典型地具有常規(guī)抗混疊蝶形運(yùn)算單元的形式。這樣的蝶形運(yùn)算單元使用實(shí)數(shù)值對系數(shù)進(jìn)行加權(quán)來實(shí)施加權(quán)求和。在美國專利US5559834(Edler)和B.Edler所著的“Aliasing reduction insub-bands of cascaded filter banks with decimation”,ElectronicsLetters,Vol.28,No.12,第1104-1106頁,1992年6月)中介紹了這樣的抗混疊蝶形運(yùn)算單元的實(shí)例。這樣的蝶形運(yùn)算單元減少了由多相濾波器組的臨界下采樣造成的混疊。
為了解釋說明,附圖4示出了在上采樣之后下采樣多相濾波器組的第一個(gè)和第二個(gè)相鄰子帶濾波器(未示出)的固定格式響應(yīng)R1、R2。而且還示出了通過例如對與這些子帶濾波器相關(guān)的相應(yīng)子帶信號應(yīng)用MDCT而獲得的兩個(gè)具有值A(chǔ)和B的譜分量。將會看出,作為混疊的結(jié)果,在與具有值A(chǔ)的譜分量相應(yīng)的頻率上,有額外的具有值qB的頻譜分量,并且在與具有值B的譜分量相應(yīng)的頻率上,有額外的具有值rA的譜分量。因此,由于下采樣,在與具有值A(chǔ)的譜分量相應(yīng)的頻率上的譜分量的值可以以A+qB的形式給出,而在與具有值B的譜分量相應(yīng)的頻率上的譜分量的值可以以B+rA的形式給出。q和r各自的值是由相應(yīng)子帶濾波器在具有值B和A的譜分量各自的頻率上的相應(yīng)傳遞函數(shù)決定的。具有值A(chǔ)和B的譜分量的實(shí)際值可以按照下述方式計(jì)算A′=A+qB B′=B+rAA=A′-q(B′-rA)B=B′-r(A′-qB)A=A′-qB′1-rq]]>B=B′-rA′1-rq---[20]]]>其中A、A′、B和B′代表各個(gè)譜分量值或幅度。等式[20]可以以附圖5中所示的抗混疊蝶形運(yùn)算單元的形式用圖解的方式表示。傳統(tǒng)上,r和q的值是實(shí)數(shù)值(即,它們不包括復(fù)數(shù)值分量)。
使用實(shí)數(shù)值使得抗混疊蝶形運(yùn)算單元在譜分量(例如,附圖4中的A+qB)與相應(yīng)的鏡像頻譜分量(例如附圖4中的B+rA)之間的相位差接近180°(或π)或者180°的倍數(shù)的情況下補(bǔ)償混疊對譜系數(shù)的幅度的影響。結(jié)果,實(shí)數(shù)值抗混疊蝶形運(yùn)算單元尤其適合于處理指定使用正常、開始或停止類型的窗口的MDCT或MDST系數(shù)(由分析濾波器組的子帶域采樣獲得)。不過,在指定使用短型窗口的情況下,子帶邊緣附近的鏡像譜分量之間的相位差不能由π的倍數(shù)恰當(dāng)?shù)亟票硎?。因此,常?guī)地抗混疊單元50僅僅在應(yīng)用正常、開始和停止窗口的情況下有用。這樣,在mp3標(biāo)準(zhǔn)中,僅僅對這三種類型的窗口應(yīng)用抗混疊。
現(xiàn)在參照附圖6介紹本發(fā)明的另一種可選實(shí)施方式,這種實(shí)施方式通過使用復(fù)數(shù)值抗混疊蝶形運(yùn)算單元緩解了上面略述的問題。附圖6給出了采用復(fù)數(shù)值抗混疊蝶形運(yùn)算單元的解碼器140的框圖。現(xiàn)在參照附圖6,解碼器140總體上類似于解碼器40,并且使用類似的附圖標(biāo)記表示類似的組成部分。不過,解碼器140包括復(fù)數(shù)值抗混疊單元170,該單元設(shè)置成用于通過對復(fù)數(shù)值系數(shù)應(yīng)用復(fù)數(shù)值加權(quán)值或乘數(shù)來對復(fù)數(shù)值系數(shù)執(zhí)行抗混疊。抗混疊單元170可以包括附圖4中所示的一般類型的抗混疊蝶形運(yùn)算單元,其中加權(quán)值或乘數(shù)r和q的值是復(fù)數(shù)值。提供給復(fù)數(shù)值抗混疊單元170的各個(gè)復(fù)數(shù)值系數(shù)的實(shí)部包括由延遲單元152適當(dāng)延遲的相應(yīng)MDCT系數(shù),而復(fù)數(shù)值系數(shù)的虛部包括由MDST單元148提供的相應(yīng)MDST系數(shù)或正交分量。與解碼器40不同,對隨后用于提供復(fù)數(shù)值系數(shù)的實(shí)部的MDCT系數(shù)進(jìn)行常規(guī)混疊(由混疊單元142方便地進(jìn)行)。
在對復(fù)數(shù)值系數(shù)進(jìn)行了復(fù)數(shù)值抗混疊之后,將它們提供給多相濾波器修正單元154。對這些系數(shù)進(jìn)行的進(jìn)一步處理是參照附圖3介紹的那些處理。
可以采用試驗(yàn)手段來確定加權(quán)值r和q的適當(dāng)復(fù)數(shù)值。例如,為了給出r和q的第一估計(jì)值,針對各個(gè)MDCT頻率接收器(frequencybin),將相應(yīng)的已知幅度的正弦信號供應(yīng)給mp3編碼器中常見類型的常規(guī)mp3混合濾波器組(未示出)(即,包括多相分析濾波器組和用于對由分析濾波器組產(chǎn)生的子帶信號進(jìn)行MDCT的裝置)。將各個(gè)正弦信號的相應(yīng)頻率選擇為相應(yīng)MDCT頻率接收器的中心頻率。對于正常、開始和停止窗口,可以按照下式計(jì)算中心頻率f=(k+12)fs1152Hz---[21]]]>其中k=0...575,fs是采樣頻率,除數(shù)1152與變換長度N一致。因此要通過等式[21]計(jì)算576個(gè)頻率,每個(gè)頻率對應(yīng)于一個(gè)MDCT集(bin)。
對于短型窗口,中心頻率是按照下式計(jì)算的f=(k+12)fs384Hz---[22]]]>
其中k=0...191,fs是采樣頻率,除數(shù)384與變換長度N一致。因此要通過等式[22]計(jì)算192個(gè)頻率,每個(gè)頻率對應(yīng)于一個(gè)MDCT集。
然后對由混合濾波器組產(chǎn)生的各個(gè)MDCT系數(shù)或頻率線進(jìn)行處理,例如使用附圖3中所示的IMDCT單元144、重疊-相加單元146和MDST單元148來產(chǎn)生相應(yīng)的MDST系數(shù)。因此,可以針對各個(gè)正弦信號得到相應(yīng)的復(fù)數(shù)值系數(shù)。因?yàn)楦鱾€(gè)正弦曲線僅僅包括一個(gè)相應(yīng)的頻率分量,所以對于各個(gè)正弦曲線,僅僅產(chǎn)生了兩個(gè)復(fù)數(shù)值系數(shù)一個(gè)代表各個(gè)正弦曲線本身(即,在頻率和幅度上與相應(yīng)的正弦曲線相當(dāng)),另一個(gè)代表作為由濾波器組造成的混疊的結(jié)果而出現(xiàn)的鏡像分量。如果假設(shè)正弦分量的幅度為A,則鏡像分量的幅度為rA。因?yàn)锳是已知的,所以可以容易地計(jì)算出r。加權(quán)值q可以按照類似的方式計(jì)算出來。對各個(gè)正弦曲線重復(fù)進(jìn)行這一處理,以針對各個(gè)鏡像頻帶集合產(chǎn)生相應(yīng)的r和q值。從等式[21]和[22]中注意到,各個(gè)r和q的值也隨窗口類型變化。最好通過使用常規(guī)非線性優(yōu)化算法對按照上述方式計(jì)算出來的r和q值進(jìn)行優(yōu)化。
本發(fā)明并不局限于MPEG-1層III數(shù)據(jù)信號或者M(jìn)DCT。就此而言,注意,術(shù)語“系數(shù)團(tuán)”本來是mp3術(shù)語,但是本領(lǐng)域技術(shù)人員很容易理解,在非mp3實(shí)施方式的環(huán)境下,可以將本文中使用的術(shù)語“系數(shù)團(tuán)”解釋為任何等價(jià)的頻率線或系數(shù)的分組方式(通常,術(shù)語“幀”等價(jià)于“系數(shù)團(tuán)”)。
作為另一個(gè)例子,附圖8中示出了具體實(shí)施本發(fā)明的另一個(gè)方面的用于MPEG-1層I或?qū)覫I信號的解碼器240的框圖。作為背景,附圖7示出了常規(guī)MPEG-1層I/II解碼器的簡化框圖,該解碼器包括用于對包含在接收到的MPEG-1層I/II位流中的頻譜值進(jìn)行解碼以產(chǎn)生32個(gè)子帶信號的組件130。然后將子帶信號提供給合成子帶濾波器組136,該濾波器組產(chǎn)生相應(yīng)的時(shí)域音頻輸出信號x(n)。
在附圖8中,解碼器240包括用于對包含在所接收到的數(shù)據(jù)信號(例如,MPEG-1層I/II位流)中的頻譜值進(jìn)行解碼的組件或模塊212,以產(chǎn)生多個(gè)子帶信號或子帶信號分量。在所接收到的數(shù)據(jù)信號包括MPEG-1層I/II位流的情況下,對各個(gè)幀產(chǎn)生32個(gè)子帶信號。將子帶信號提供給合成子帶濾波器組236,該濾波器組產(chǎn)生包括多個(gè)數(shù)據(jù)采樣的相應(yīng)的時(shí)域信號x(n)。在所接收到的數(shù)據(jù)信號包括MPEG-1層I/II位流的情況下,濾波器組236包括32個(gè)帶余弦調(diào)制的合成濾波器組。然后將時(shí)域信號x(n)提供給分析子帶濾波器組237,該濾波器組產(chǎn)生多個(gè)子帶信號或信號分量。在所接收到的數(shù)據(jù)信號包括MPEG-1層I/II位流的情況下,濾波器組237包括32個(gè)帶濾波器組并且為各個(gè)幀產(chǎn)生32個(gè)子帶信號。此外,分析濾波器237的調(diào)制正交于合成濾波器組236的調(diào)制。因此,在所接收到的數(shù)據(jù)信號包括MPEG-1層I/II位流的情況下,分析濾波器組237包括正弦調(diào)制的濾波器組。結(jié)果,由分析濾波器組237產(chǎn)生的各個(gè)子帶信號可以用作復(fù)數(shù)值子帶信號的虛數(shù)值部分,相應(yīng)的實(shí)數(shù)值部分是由解碼器212產(chǎn)生的相應(yīng)子帶信號給出的。
復(fù)數(shù)值子帶信號在轉(zhuǎn)換到時(shí)域之前得到處理或者調(diào)節(jié)。因此,解碼器240此外還包括用于按照需要調(diào)節(jié)一個(gè)或多個(gè)復(fù)數(shù)值子帶信號的處理單元256。由于復(fù)數(shù)值子帶信號是頻域分量,因此可以有利地直接對編碼信號的一個(gè)或多個(gè)頻率分量進(jìn)行后處理。
復(fù)數(shù)值子帶信號包括復(fù)指數(shù)調(diào)制的子帶系數(shù),并且可以使用復(fù)指數(shù)調(diào)制的合成濾波器組239將其轉(zhuǎn)換到時(shí)域,僅僅需要濾波器組239的實(shí)數(shù)值輸出分量(表示為附圖8中的數(shù)據(jù)信號x(n))。
而且,總地來說,本發(fā)明并不局限于本文介紹的實(shí)施方式,可以對這些實(shí)施方式進(jìn)行改造或改變,而不會超出本發(fā)明的范圍。
權(quán)利要求
1.一種解碼器,包括用于從接收到的信號中還原出多個(gè)第一譜系數(shù)的裝置,第一譜系數(shù)包括第一變換裝置的產(chǎn)物;反向變換裝置,用于將所述第一譜系數(shù)變換成一個(gè)或多個(gè)時(shí)域信號分量;第二變換裝置,用于將所述一個(gè)或多個(gè)時(shí)域信號分量變換成多個(gè)第二譜系數(shù),其中在相應(yīng)的調(diào)制頻率上,所述第二變換裝置的調(diào)制正交于所述第一變換裝置的調(diào)制,該解碼器此外還包括用于對一個(gè)或多個(gè)所述第一譜系數(shù)與相應(yīng)的第二譜系數(shù)結(jié)合起來進(jìn)行處理的裝置。
2.按照權(quán)利要求1所述的解碼器,其中所述還原裝置包括用于對所接收到的數(shù)據(jù)信號進(jìn)行解碼和去量化來還原出第一譜系數(shù)的裝置,所述第一譜系數(shù)包括第一頻率變換的產(chǎn)物;其中所述反向變換裝置包括用于對所述第一譜系數(shù)進(jìn)行一次或多次反向頻率變換來產(chǎn)生所述時(shí)域信號分量的裝置,其中第二變換裝置包括用于對所述時(shí)域信號分量進(jìn)行一次或多次第二正向頻率變換來產(chǎn)生所述第二譜系數(shù)的裝置,并且其中在相應(yīng)的調(diào)制頻率上,所述第一正向頻率變換正交于所述第二正向頻率變換。
3.按照權(quán)利要求2所述的解碼器,其中所述第一譜系數(shù)包括臨界采樣的正向頻率變換的輸出,所述臨界采樣的正向頻率變換在要進(jìn)行變換的數(shù)據(jù)采樣中采用50%的重疊。
4.按照權(quán)利要求2或3所述的解碼器,其中所述第一正向頻率變換和所述第二正向頻率變換之一包括改進(jìn)離散余弦變換(MDCT),另一個(gè)包括改進(jìn)離散正弦變換(MDST)。
5.按照權(quán)利要求4所述的解碼器,其中所述第一正向頻率變換包括改進(jìn)離散余弦變換(MDCT),所述反向頻率變換包括反向改進(jìn)離散余弦變換(IMDCT),并且所述第二正向頻率變換包括改進(jìn)離散正弦變換(MDST)。
6.按照權(quán)利要求2到5中任何一項(xiàng)所述的解碼器,其中在所述一個(gè)或多個(gè)第二正向頻率變換之前,對所述時(shí)域信號分量進(jìn)行一次或多次加窗和重疊-相加運(yùn)算。
7.按照權(quán)利要求6所述的解碼器,此外還包括用于對所述第一譜系數(shù)進(jìn)行延遲從而使各個(gè)第一譜系數(shù)與各自的相應(yīng)第二譜系數(shù)同步的裝置。
8.按照權(quán)利要求2到7中任何一項(xiàng)所述的解碼器,此外還包括用于將混疊引入到所述第一譜系數(shù)中來產(chǎn)生混疊的第一譜系數(shù)的裝置,所述一次或多次反向頻率變換是對所述混疊的第一譜系數(shù)進(jìn)行的。
9.按照權(quán)利要求8所述的解碼器,此外還包括用于對所述第二譜系數(shù)進(jìn)行混疊減少的裝置。
10.按照權(quán)利要求8所述的解碼器,此外還包括用于對所述第二譜系數(shù)和它們的相應(yīng)的混疊的第一譜系數(shù)進(jìn)行復(fù)數(shù)值混疊減少的裝置,其中所述復(fù)數(shù)值混疊減少裝置包括一個(gè)或多個(gè)設(shè)置成用于將復(fù)數(shù)值加權(quán)值應(yīng)用于所述混疊的第一和相應(yīng)的第二頻率分量的抗混疊蝶形運(yùn)算單元。
11.按照權(quán)利要求2到10中任何一項(xiàng)所述的解碼器,其中各個(gè)第一譜系數(shù)和相應(yīng)的第二譜系數(shù)一起構(gòu)成復(fù)數(shù)值譜系數(shù),該解碼器此外該包括用于對所述復(fù)數(shù)值譜系數(shù)進(jìn)行一次或多次復(fù)數(shù)值反向頻率變換來產(chǎn)生多個(gè)數(shù)據(jù)采樣的裝置;用于將一種或多種類型的窗口函數(shù)應(yīng)用于所述數(shù)據(jù)采樣來產(chǎn)生多個(gè)加窗的數(shù)據(jù)采樣的裝置;和用于從所述加窗的數(shù)據(jù)采樣構(gòu)建輸出信號的裝置。
12.按照權(quán)利要求11所述的解碼器,其中各個(gè)復(fù)數(shù)值譜系數(shù)集合是針對各個(gè)從所述接收到的數(shù)據(jù)信號中還原出來的第一譜系數(shù)的各個(gè)系數(shù)團(tuán)產(chǎn)生的,并且其中,針對至少第一種類型的窗口函數(shù),所述復(fù)數(shù)值反向頻率變換裝置設(shè)置成用于對各個(gè)集合的所有復(fù)數(shù)值譜系數(shù)進(jìn)行單獨(dú)一次反向頻率變換。
13.按照權(quán)利要求11所述的編碼器,其中所述輸出信號構(gòu)建裝置對所述加窗的數(shù)據(jù)采樣應(yīng)用一次或多次重疊-相加運(yùn)算,以產(chǎn)生所述輸出信號。
14.按照權(quán)利要求11到13中任何一項(xiàng)所述的編碼器,其中,針對至少所述第一種類型的窗口函數(shù),所述窗口函數(shù)應(yīng)用裝置設(shè)置成用于針對各個(gè)復(fù)數(shù)值譜系數(shù)集合產(chǎn)生的所有數(shù)據(jù)采樣應(yīng)用單獨(dú)一個(gè)窗口函數(shù)。
15.按照權(quán)利要求11到14中任何一項(xiàng)所述的編碼器,其中,所述至少第一種類型的窗口函數(shù)包括長度經(jīng)過調(diào)節(jié)的形式的MPEG-1層III類型0、類型1和類型3窗口函數(shù)。
16.按照權(quán)利要求11到15中任何一項(xiàng)所述的解碼器,其中針對至少第二種類型的窗口函數(shù),所述復(fù)數(shù)值反向頻率變換裝置設(shè)置成用于對各個(gè)復(fù)數(shù)值譜系數(shù)的子集進(jìn)行相應(yīng)的反向頻率變換,集合的所有復(fù)數(shù)值頻率分量都屬于所述子集中的一個(gè)或另一個(gè)。
17.按照權(quán)利要求16中所述的解碼器,針對至少所述第二種類型的窗口函數(shù),所述窗口函數(shù)應(yīng)用裝置設(shè)置成用于對針對復(fù)數(shù)值譜系數(shù)的各個(gè)子集產(chǎn)生的所有數(shù)據(jù)采樣應(yīng)用單獨(dú)一個(gè)窗口函數(shù)。
18.按照權(quán)利要求16或17所述的解碼器,其中所述至少第二種類型的窗口函數(shù)包括長度經(jīng)過調(diào)節(jié)的形式的MPEG-1層III類型2窗口函數(shù),并且各個(gè)子集的復(fù)數(shù)值譜系數(shù)屬于三個(gè)相應(yīng)子集中一個(gè)或另一個(gè)。
19.按照權(quán)利要求11所述的解碼器,其中使復(fù)數(shù)值譜系數(shù)的各個(gè)集合與各個(gè)頻率子帶相關(guān)聯(lián),并且其中,針對至少第一種類型的窗口函數(shù),所述復(fù)數(shù)值反向頻率變換裝置設(shè)置成用于對復(fù)數(shù)值譜系數(shù)的各個(gè)集合進(jìn)行相應(yīng)的反向頻率變換,并且,針對至少第二種類型的窗口函數(shù),所述復(fù)數(shù)值反向頻率變換裝置設(shè)置成用于對復(fù)數(shù)值譜系數(shù)的各個(gè)子集進(jìn)行相應(yīng)的反向頻率變換,集合的所有復(fù)數(shù)值頻率分量屬于所述子集中的一個(gè)或另一個(gè)子集。
20.按照權(quán)利要求19中所述的解碼器,其中所述輸出信號構(gòu)建裝置包括復(fù)指數(shù)調(diào)制的合成濾波器組,該合成濾波器組的實(shí)數(shù)值輸出分量包括所述輸出信號。
21.按照權(quán)利要求11到20中任何一項(xiàng)所述的解碼器,其中所述復(fù)數(shù)值反向頻率變換包括奇數(shù)頻率調(diào)制的反向離散傅立葉變換(DFT)。
22.按照權(quán)利要求21中所述的解碼器,其中所述復(fù)數(shù)值反向頻率變換包括奇次奇頻調(diào)制的反向離散傅立葉變換(O2DFT)。
23.按照權(quán)利要求11到22中任何一項(xiàng)所述的解碼器,此外還包括用于按照說明書中的等式[5]和[6]調(diào)節(jié)復(fù)數(shù)值譜系數(shù)的相位的裝置。
24.按照權(quán)利要求1中所述的解碼器,其中所述反向變換裝置包括合成子帶濾波器組并且第二正向變換裝置包括分析子帶濾波器組。
25.按照權(quán)利要求24所述的解碼器,其中所述第一變換裝置包括分析濾波器組,所述第一和第二正向變換裝置之一是余弦調(diào)制的,另一個(gè)是正弦調(diào)制的。
26.按照權(quán)利要求24或25所述的解碼器,此外還包括復(fù)指數(shù)調(diào)制的合成濾波器組,該合成濾波器組設(shè)置成用于從所述第一和第二譜系數(shù)產(chǎn)生時(shí)域輸出信號。
27.一種對數(shù)據(jù)信號進(jìn)行解碼的方法,該方法包括從接收到的信號中還原出多個(gè)第一譜系數(shù),第一譜系數(shù)包括第一變換裝置的產(chǎn)物;由反向變換裝置將所述第一譜系數(shù)變換成一個(gè)或多個(gè)時(shí)域信號分量;由第二變換裝置將所述一個(gè)或多個(gè)時(shí)域信號分量變換成多個(gè)第二譜系數(shù),其中在相應(yīng)的調(diào)制頻率上,所述第二變換裝置的調(diào)制正交于所述第一變換裝置的調(diào)制,該方法此外還包括對一個(gè)或多個(gè)所述第一譜系數(shù)與相應(yīng)的第二譜系數(shù)結(jié)合起來進(jìn)行處理。
全文摘要
一種解碼器,尤其但非專門,用于MPEG-1層III數(shù)據(jù)信號,其中將還原出來的譜系數(shù)變換成時(shí)域信號分量,然后使用相對于編碼器中使用的正向變換正交調(diào)制的正向變換對時(shí)域信號分量進(jìn)行變換,以產(chǎn)生一組第二譜系數(shù)。這樣,可以將第一和第二譜系數(shù)用作便于后處理的復(fù)數(shù)值譜系數(shù)。按照優(yōu)選實(shí)施方式,在經(jīng)過后處理之后,使用奇數(shù)頻率調(diào)制的離散傅立葉變換(DFT)將復(fù)數(shù)值頻率分量變換到時(shí)域。
文檔編號G10L19/26GK1914669SQ200580003343
公開日2007年2月14日 申請日期2005年1月13日 優(yōu)先權(quán)日2004年1月28日
發(fā)明者E·G·P·舒杰斯 申請人:皇家飛利浦電子股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1