專利名稱:一種數(shù)字音頻編碼、解碼方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種數(shù)字音頻編碼、解碼方法及裝置,屬于數(shù)字信號編碼技術(shù)領(lǐng)域。
背景技術(shù):
由于數(shù)字音頻信號在空間域上具有較強的相關(guān)性,而一維重疊正交變換則是去除 數(shù)字音頻信號空間域冗余度的有效方法,因此被廣泛應(yīng)用于各種音頻編碼標準(如MPEG, E-AC-3等)。數(shù)字音頻編碼裝置通常包括數(shù)據(jù)輸入單元、數(shù)據(jù)正向變換單元、量化單元以及 熵編碼單元,相應(yīng)的解碼裝置包括反熵編碼單元、反量化單元、數(shù)據(jù)反向變換單元及輸出單 元。通常為了使得經(jīng)過數(shù)據(jù)反向變換后得到的重疊數(shù)字音頻信號經(jīng)過“重疊相加”操作后 能夠完全恢復(fù)得到初始的數(shù)字音頻信號,需要在正向變換單元之前對輸入的音頻信號進行 加窗操作以及在反向變換單元之前對重疊正交變換域的系數(shù)進行加窗操作。數(shù)字音頻信號 編解碼的過程通常包括以下幾個步驟編碼過程1、輸入數(shù)字音頻信號數(shù)據(jù);2、對輸入的音頻信號數(shù)據(jù)進行加窗操作;3、將加窗后得到的新的音頻信號數(shù)據(jù)進行一維正向重疊正交變換,得到變換域系 數(shù);4、對得到的變換域系數(shù)向量進行量化處理;5、對經(jīng)過量化后的系數(shù)進行熵編碼,即利用哈夫曼編碼,游程編碼,算術(shù)編碼等編 碼方法進行壓縮編碼,得到編碼后的數(shù)據(jù);此時即可將編碼后的數(shù)據(jù)存儲在存儲介質(zhì)中或 進行傳輸。解碼過程1、對編碼后的數(shù)據(jù)進行反熵編碼,即利用反哈夫曼編碼,反游程編碼,反算術(shù)編碼 等方式進行解碼;2、對反熵編碼后的數(shù)據(jù)進行反量化處理;3、對經(jīng)過反量化處理的數(shù)據(jù)進行加窗操作;4、將加窗后的數(shù)據(jù)進行一維反向重疊正交變換,從而得到“重疊”的數(shù)字音頻數(shù) 據(jù);5、將“重疊”的數(shù)字音頻數(shù)據(jù)進行“重疊相加”操作得到原始的音頻數(shù)據(jù);6、將原始的數(shù)字音頻數(shù)據(jù)進行輸出。目前數(shù)字音頻編解碼裝置中經(jīng)常使用的變換方法包括改進的離散余弦 變換(Modulated Discrete Cosine Transform, MDCT)以及復(fù)數(shù)調(diào)制重疊變換 (ModulatedComplex Lapped Transform,MCLT)等。其中,復(fù)數(shù)調(diào)制重疊變換是一種余弦調(diào) 制濾波器,其將實數(shù)輸入信號轉(zhuǎn)化為復(fù)數(shù)輸出信號。MCLT是調(diào)制重疊變換(MLT),也就是改 進的離散余弦變換(MDCT)的復(fù)數(shù)擴展形式。MCLT實部是MDCT,虛部是改進的離散正弦變 換(MDST)。MCLT因為具有相位信息,因此被廣泛用于需要相位信息的數(shù)字音頻信號處理問
6題,如音頻水印,音頻編碼,音頻流識別和聲學回聲消除,音頻數(shù)據(jù)包丟失隱藏等,且被最新 的音頻標準E-AC-3所采納。 長度為2M的實輸入音頻信號序列{x(n)},η = 0,1,
權(quán)利要求
1. 一種數(shù)字音頻編碼方法,包括對輸入的長度為I的數(shù)字音頻數(shù)據(jù)進 行一維正向MCLT變換,輸出數(shù)字音頻數(shù)據(jù)的MCLT域系數(shù)向量的步驟,#為 大于等于2的偶數(shù),其特征在于,所述一維正向MCLT變換通過2個長度為 M的正向MCLT變換來實現(xiàn),具體按照以下方法
2.如權(quán)利要求1所述數(shù)字音頻編碼方法,其特征在于,所述輸入的數(shù)字音頻數(shù)據(jù)是經(jīng) 過加窗操作后的數(shù)據(jù)。
3.一種數(shù)字音頻解碼方法,包括對輸入的經(jīng)反量化處理的,長度為M的MCLT域系數(shù)向 量進行一維反向MCLT變換,輸出重疊的數(shù)字音頻數(shù)據(jù)的步驟,#為大于等于2的偶數(shù),其特 征在于,所述一維反向MCLT變換通過兩個長度為I的反向MCLT變換來實現(xiàn),具體按照以下 方法
4.如權(quán)利要求3所述數(shù)字音頻解碼方法,其特征在于,所述輸入的經(jīng)反量化處理的 MCLT域系數(shù)向量是經(jīng)過加窗操作后的數(shù)據(jù)。
5.一種數(shù)字音頻編碼裝置,其特征在于,包括順次信號連接的信號輸入單元、MCLT單 元、量化單元及熵編碼單元,其中MCLT單元通過2個長度為 /的正向MCLT變換將長度為 I的數(shù)字音頻數(shù)據(jù)變換為長度為# WMCLT域系數(shù)向量,#為大于等于2的偶數(shù)。
6. 一種數(shù)字音頻解碼裝置,其特征在于,包括順次信號連接的反熵編碼單元、反量化單 元、IMCLT單元、重疊相加及輸出單元,其中IMCLT單元通過2個長度為M的反向MCLT變換 將長度為#的MCLT域系數(shù)向量變換為長度為的重疊的數(shù)字音頻信號向量,#為大于等 于2的偶數(shù)。
全文摘要
本發(fā)明公開了一種數(shù)字音頻編碼、解碼方法,屬于數(shù)字信號編碼技術(shù)領(lǐng)域。本發(fā)明方法在對數(shù)字音頻進行編解碼時,將長度為2M的MCLT和IMCLT分別分解為兩個長度為M的MCLT和IMCLT來進行快速計算,從而降低計算復(fù)雜度。相比現(xiàn)有技術(shù),本發(fā)明方法具有計算復(fù)雜度低、實時性能好、易于實現(xiàn)的優(yōu)點。本發(fā)明還公開了采用本發(fā)明編碼、解碼方法的數(shù)字音頻編碼、解碼裝置。
文檔編號G10L19/02GK102103859SQ20111000424
公開日2011年6月22日 申請日期2011年1月11日 優(yōu)先權(quán)日2011年1月11日
發(fā)明者伍家松, 李松毅, 王膂, 羅立民, 舒華忠 申請人:東南大學