專利名稱:使用有損編碼數(shù)據(jù)流和無損擴(kuò)展數(shù)據(jù)流對(duì)源信號(hào)進(jìn)行無損編碼的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種使用有損編碼數(shù)據(jù)流和無損擴(kuò)展數(shù)據(jù)流對(duì)源信號(hào) 進(jìn)行無損編碼的方法和設(shè)備,所述有損編碼數(shù)據(jù)流和無損擴(kuò)展數(shù)據(jù)流 共同形成所述源信號(hào)的無損編碼數(shù)據(jù)流。
背景技術(shù):
與有損音頻編碼技術(shù)(如mp3、 AAC等)相反,無損壓縮算法僅 可以利用原始音頻信號(hào)的冗余以減小數(shù)據(jù)速率。不可能依賴于如現(xiàn)有 技術(shù)的有損音頻編解碼器中的心理聲學(xué)模型所指出的不相關(guān)內(nèi)容。相 應(yīng)地,所有無損音頻編碼方案的共同技術(shù)原理是應(yīng)用濾波器或變換來 解相關(guān)(例如預(yù)測濾波器或頻率變換),然后以無損方式對(duì)變換后的信 號(hào)進(jìn)行編碼。編碼比特流包括變換或?yàn)V波器的參數(shù),以及變換后的 信號(hào)的無損表示。參見例如J. Makhoul, "Linear prediction: A tutorial review", Proceedings of the IEEE, Vol. 63, pp. 561-580, 1975、 T. Painter, A. Spanias, "Perceptual coding of digital audio", Proceedings of the IEEE: Vol. 88, No. 4, pp. 451-513, 2000以及M. Hans, R.W. Schafer, "Lossless compression of digital audio", IEEE Signal Processing Magazine, July 2001, pp. 21-32。
圖12和圖13中描述了基于有損的無損編碼的基本原理。在圖12 左側(cè)的編碼部分,PCM音頻輸入信號(hào)SpcM通過有損編碼器121到達(dá) 有損解碼器122,并且作為有損比特流到達(dá)解碼部分(右側(cè))的有損 解碼器125。使用有損編碼和解碼來對(duì)信號(hào)進(jìn)行解相關(guān)。在減法器123 中,將解碼器122的輸出信號(hào)從輸入信號(hào)SpcM中移除,所產(chǎn)生的差信 號(hào)通過無損編碼器124,作為擴(kuò)展比特流到達(dá)無損解碼器127。將解碼 器125和127的輸出信號(hào)組合126,以恢復(fù)原始信號(hào)SPCM。
5在EP-B-0756386和US-B-6498811中公開了這一基本原理,還在以 下文獻(xiàn)中討論了該原理P. Craven, M. Gerzon, "Lossless Coding for Audio Discs", J. Audio Eng. Soc., Vol.44, No.9, September 1996,以及J. Koller, Th. Sporer, K.H. Brandenburg, "Robust Coding of High Quality Audio Signals,,,AES 103rd Convention, Preprint 4621, August 1997。
在圖13的有損編碼器中,PCM音頻輸入信號(hào)SpcM通過分解濾波 器組131和子帶樣本的量化132到達(dá)編碼和比特流打包133。量化由 感知模型計(jì)算器134控制,感知模型計(jì)算器134從分解濾波器組131 接收信號(hào)SpcM和相應(yīng)信息。在解碼器側(cè),編碼后的有損比特流進(jìn)入用 于對(duì)比特流進(jìn)行解打包的裝置135,接著是用于對(duì)子帶樣本進(jìn)行解碼 的裝置136,以及輸出解碼后的有損PCM信號(hào)SDee的合成濾波器組 137。
在標(biāo)準(zhǔn)ISO/IEC 11172-3(MPEG-1音頻)中對(duì)有損編碼和解碼的示 例進(jìn)行了詳細(xì)描述。
在現(xiàn)有技術(shù)中,基于以下三種基本信號(hào)處理概念之一進(jìn)行無損音 頻編碼
a) 使用線性預(yù)測技術(shù)的時(shí)域解相關(guān);
b) 使用可逆整數(shù)分解-合成濾波器組的頻域無損編碼;
c) 有損基本層編解碼器的殘差(誤差信號(hào))的無損編碼。
發(fā)明內(nèi)容
本發(fā)明要解決的問題是提供分級(jí)的無損音頻編碼和解碼,所述分 級(jí)的無損音頻編碼和解碼建立在嵌入的有損音頻編解碼器之上,并提 供與現(xiàn)有技術(shù)中基于有損的無損音頻編碼方案相比相同或更高的效率 (即壓縮比),而在計(jì)算復(fù)雜度方面可以以更有效的方式來實(shí)現(xiàn)。該問 題是通過權(quán)利要求1和3中公開的方法來解決的。在權(quán)利要求2和4中分
別公開了利用這些方法的設(shè)備。
本發(fā)明的另外的優(yōu)選實(shí)施例在相應(yīng)從屬權(quán)利要求中公開。 本發(fā)明在有損編碼之上使用數(shù)學(xué)上無損的編碼和解碼。數(shù)學(xué)上無
損的音頻壓縮是指在解碼器輸出處具有原始PCM樣本的比特精確重現(xiàn)的音頻編碼。對(duì)于一些實(shí)施例,假設(shè)有損編碼使用例如類似MDCT 的頻率變換或類似濾波器組在變換域中操作。作為示例,在整個(gè)描述
中,使用mp3標(biāo)準(zhǔn)(ISO/IEC 11172-3層3)作為有損基本層。
所發(fā)送或記錄的編碼比特流包括兩個(gè)部分有損音頻編解碼器的
嵌入比特流,以及針對(duì)一個(gè)或多個(gè)附加層的擴(kuò)展數(shù)據(jù),用于獲得無損 (即比特精確)的原始PCM樣本或中間質(zhì)量。
本發(fā)明利用來自概念a)、 b)、 c)的特征,即來自多種現(xiàn)有技術(shù)中
無損音頻編碼方案的技術(shù)的相互組合。
本發(fā)明以協(xié)作的方式來使用頻域解相關(guān)、時(shí)域解相關(guān)、或其組合,
以準(zhǔn)備用于有效無損編碼的基本層有損音頻編解碼器的殘差信號(hào)(誤
差信號(hào))。
一些實(shí)施例還使用來自有損基本層編解碼器的編碼器信息。使用 來自基本層編解碼器的輔助信息允許降低總比特流中的冗余,因此提 高了基于有損的無損編解碼器的編碼效率。
所有實(shí)施例的共同之處在于,可以從比特流中提取具有不同質(zhì)量 等級(jí)的音頻信號(hào)的至少兩種不同變型。這些變型包括由嵌入的有損編 碼方案和原始PCM樣本的無損解碼所表示的信號(hào)。對(duì)于一些實(shí)施例 (見以下可選擴(kuò)展3和4),可以對(duì)具有中間質(zhì)量(在有損編解碼器和數(shù) 學(xué)上無損的質(zhì)量所限定的范圍內(nèi))的音頻信號(hào)的一個(gè)或多個(gè)另外的變 型進(jìn)行解碼。
描述了一種具體實(shí)現(xiàn),其中通過整數(shù)MDCT在并行數(shù)據(jù)路徑中代 替或復(fù)制作為混合濾波器組的MDCT部分,整數(shù)MDCT使無損編碼器 模塊內(nèi)的全部有損解碼成為多余,從而實(shí)現(xiàn)計(jì)算復(fù)雜度的降低。
此外,本發(fā)明允許使用簡單的比特丟棄技術(shù)來剝離嵌入的有損比 特流。
一些實(shí)施例可能有效地對(duì)嵌入的有效比特流進(jìn)行重新編碼,獲得 數(shù)據(jù)速率不同于(低于或高于)嵌入的"有損"比特流的原始數(shù)據(jù)速 率的新'有損'比特流。
本發(fā)明限于采用混合(分解)濾波器組的有損核心編解碼器(例 如通過利用子帶濾波器組(例如多相濾波器組)接著是附加的
7MDCT/DCT以增加頻譜分辨率)。如果子帶濾波器組是不可能通過類 似分解為"吉文斯旋轉(zhuǎn)"和"提升步(lifting steps)"的技術(shù)來進(jìn)行特 定可逆整數(shù)實(shí)現(xiàn)的類型,即如果不可能通過應(yīng)用分解和合成子帶濾波 器組來實(shí)現(xiàn)整數(shù)輸入信號(hào)的完美數(shù)學(xué)重建,則本發(fā)明尤為適用。
參照附圖描述本發(fā)明的示例性實(shí)施例,在附圖中
圖l是基于有損的無損編碼器的普通方框圖2是基于有損的無損解碼器的普通方框圖3是mp3編碼器的方框圖4是應(yīng)用于mp3核心編解碼器的第一實(shí)施例編碼器的方框圖5是第一和第二實(shí)施例解碼器的方框圖6是第二實(shí)施例編碼器的方框圖7是具有附加舍入增益因子處理的第一實(shí)施例編碼器的方框
圖8是具有附加舍入增益因子處理的第一實(shí)施例解碼器的方框
圖9是用于嵌入的mp3比特流的解碼器的方框圖; 圖10是用于嵌入mp3比特流加頻域殘差的解碼器的方框圖; 圖ll是編碼器(左)和解碼器(右)的可選時(shí)間解相關(guān)模塊或步
驟;
圖12是己知的有損編碼器和解碼器的基本方框圖; 圖13是已知的基于有損的無損編碼器和解碼器的基本方框圖。
具體實(shí)施例方式
在圖l的基于有損的無損編碼器中,PCM音頻輸入信號(hào)SpcM通過 子帶濾波器組和抽選器(decimator)模塊或步驟ll、第一量化器12、 整數(shù)變換13和第二量化器14到達(dá)復(fù)用器10。第一量化器14的輸出提供
表示量化器輸入信號(hào)的量化值的索引值,即其對(duì)信號(hào)進(jìn)行編碼。量化 器14的第二輸出信號(hào)是量化后的輸入信號(hào)值,在第一減法器151中從整
8數(shù)變換模塊或步驟13的輸出信號(hào)中減去該量化后的輸入信號(hào)值(從而
表示頻域中的誤差),第一減法器151的輸出信號(hào)通過無損編碼FD (頻 域)模塊或步驟16到達(dá)復(fù)用器10。第一量化器12的輸出信號(hào)通過插值 和反子帶濾波器組模塊或步驟18并在第二減法器152中從相應(yīng)延遲的 (延遲17)輸入信號(hào)SpcM中減去該信號(hào)。第二減法器的輸出信號(hào)通過 無損編碼TD (時(shí)域)模塊或步驟19到達(dá)復(fù)用器10,該復(fù)用器10輸出相 應(yīng)復(fù)用的編碼比特流SDEc。模塊/級(jí)11、 12、 13和14共同形成了有損編 碼器。
在有損解碼器內(nèi),跟隨分解子帶濾波器組11之后的變換由舍入/ 量化步驟12和整數(shù)變換13來代替??蛇x地,原始變換和舍入/量化步驟 之后可以接著是整數(shù)變換作為并行數(shù)據(jù)路徑。以下將對(duì)該選項(xiàng)進(jìn)行詳 細(xì)描述。整數(shù)變換近似傳統(tǒng)(浮點(diǎn))MDCT變換,但在輸入處接收整 數(shù)值并在輸出處產(chǎn)生整數(shù)值。通過將變換操作分解成可逆的"提升步" 序列,可以以數(shù)學(xué)上無損的方式對(duì)完整的整數(shù)MDCT近似進(jìn)行反轉(zhuǎn)。 在類似MPGE SLS (可縮放至無損)標(biāo)準(zhǔn)中的無損音頻編碼方案中, 已經(jīng)將這樣的整數(shù)MDCT變換應(yīng)用至原始時(shí)域PCM樣本。然而,在本 發(fā)明中,將整數(shù)變換應(yīng)用在混合濾波器組(即如類似mp3的音頻編碼 標(biāo)準(zhǔn)中所使用的混合濾波器組)的子帶域中。
子帶信號(hào)的無損傳輸可以解釋為頻域中的解相關(guān)。通過從原始頻 譜系數(shù)中減去量化的頻譜系數(shù)來形成頻譜殘差。對(duì)頻譜殘差進(jìn)行無損 編碼(無損編碼FD16)??蛇x地,這可以以可縮放的方式來進(jìn)行,以 提供中間音頻質(zhì)量(參見EP06113596和EP06113576以及以下可選擴(kuò) 展4)。
由于在整數(shù)變換13之前的舍入/量化步驟12,并且由于子帶濾波器 組ll的可能不完美的重建特性,通過從延遲的原始PCM輸入數(shù)據(jù)減去 反子帶濾波后的信號(hào)18(在舍入/量化步驟之后)來計(jì)算時(shí)域內(nèi)的殘差。 在無損編碼TD模塊19內(nèi)對(duì)時(shí)域中的殘差(時(shí)間殘差)進(jìn)行無損編碼。
這里,如EP06113596 (參見以下可選擴(kuò)展5)所述,可以應(yīng)用使 用線性預(yù)測濾波的可選時(shí)域解相關(guān)。
可以對(duì)有損編碼比特流和已編碼(整數(shù))頻譜以及時(shí)間殘差進(jìn)行復(fù)用以形成單個(gè)比特流或形成兩個(gè)流(有損編碼流和攜帶殘差的無損 擴(kuò)展)或形成三個(gè)流有損編碼流、已編碼頻譜殘差流和已編碼時(shí)間 殘差流)。
在圖2的解碼器側(cè),已編碼比特流SDEc進(jìn)入解復(fù)用器20,該解復(fù)用
器20輸出有損編碼比特流、無損編碼的FD比特流和無損編碼的TD比 特流。有損編碼比特流通過解碼模塊或步驟24 (從表示量化值的索引 值中恢復(fù)量化值,即量化器14的第二輸出信號(hào))、第一加法器25、反整 數(shù)變換模塊或步驟23以及插值器和反子帶濾波器組模塊或步驟21到達(dá) 第二加法器28的第一輸入。無損編碼的FD比特流通過無損解碼器模塊 或步驟26到達(dá)第一加法器的第二輸入。無損編碼的TD比特流通過無損 解碼器TD模塊或步驟29和相應(yīng)的延遲27到達(dá)第二加法器的第二輸入, 第二加法器輸出解碼的有損PCM信號(hào)SpcM。
在該無損解碼器中,對(duì)全部有損的、頻譜和時(shí)間殘差數(shù)據(jù)進(jìn)行解 打包和解碼。將頻譜殘差加至頻域中的解碼的有損數(shù)據(jù)中,并應(yīng)用反 整數(shù)變換23。注意,由于可逆整數(shù)變換和頻譜殘差編碼方案的完美整 數(shù)重建屬性,反整數(shù)變換的結(jié)果將精確地是在編碼器計(jì)算的量化后的 子帶信號(hào)。在恢復(fù)這些數(shù)據(jù)(混合濾波器組ll的第一部分的量化后的 子帶信號(hào))之后,應(yīng)用反子帶濾波器組21來重建時(shí)間信號(hào)。將解碼和 延遲后的時(shí)間殘差加至該時(shí)間信號(hào)來重建與原始編碼的PCM樣本
Spcm在數(shù)學(xué)上相同的PCM信號(hào)Spcm。
最后,在特定應(yīng)用中,可以重現(xiàn)兩級(jí)中間質(zhì)量完全而完美的重 建將應(yīng)用兩種殘差??梢詢H通過應(yīng)用頻譜殘差而忽略時(shí)間殘差來創(chuàng)建 較低一級(jí)但感知上無損的質(zhì)量。使用傳統(tǒng)的符合標(biāo)準(zhǔn)的有損解碼器, 可以僅通過對(duì)有損編碼流進(jìn)行解碼來創(chuàng)建有損質(zhì)量。可以僅通過應(yīng)用 頻譜殘差數(shù)據(jù)的一部分來創(chuàng)建另外的中間質(zhì)量級(jí)。
在以下附圖中,相同的附圖標(biāo)記分別表示相同的功能或模塊或信號(hào)。
第一優(yōu)選實(shí)施例
該優(yōu)選實(shí)施例將使用公知的mp3標(biāo)準(zhǔn)作為嵌入的有損核心編解碼
10器,在圖3中示出了該編解碼器的編碼部分。原始輸入信號(hào)SpcM通過多
相濾波器組和抽選器503、分段和MDCT 504以及比特分配和量化器 505到達(dá)復(fù)用器507。輸入信號(hào)SpcM還通過FFT級(jí)或步驟501到達(dá)心理聲 學(xué)分析502,心理聲學(xué)分析502控制步驟/級(jí)504和量化505中的分段(或 加窗)。比特分配和量化器505還提供輔助信息515,該輔助信息515通 過輔助信息編碼器506到達(dá)輸出信號(hào)517的復(fù)用器507。 mp3標(biāo)準(zhǔn)應(yīng)用 MDCT變換系數(shù)的非均勻(即非整數(shù))量化。
圖4中的第一實(shí)施例編碼器包括圖3的mp3標(biāo)準(zhǔn)編碼器。然而,采 用以下的方式對(duì)嵌入的mp3編碼器進(jìn)行了修改對(duì)來自多相濾波器組 和抽選器503的子帶信號(hào)512進(jìn)行量化(執(zhí)行舍入),并且已經(jīng)使用整數(shù) MDCT (Int-MDCT)變換504代替了各子帶信號(hào)的模塊或步驟504中的 原始MDCT變換。整數(shù)MDCT近似于原始非整數(shù)MDCT變換的數(shù)值行 為,以保證由圖4的編碼器產(chǎn)生的嵌入mp3比特流可以被任何符合標(biāo)準(zhǔn) 的mp3解碼器解碼而不出現(xiàn)質(zhì)量退化。
除了修改的mp3編碼器以外,本發(fā)明的編碼器信號(hào)處理包括針對(duì) 兩個(gè)誤差信號(hào)的無損編碼方案在頻域中和在時(shí)域中。在頻域中,在 反量化器舍入模塊或步驟521中對(duì)量化后的變換系數(shù)(從mp3比特流 514中獲得)進(jìn)行舍入來獲得整數(shù)值,在第一減法器522中從原始整數(shù) MDCT變換系數(shù)513中減去該整數(shù)值。在無損編碼FD (頻域)模塊或 步驟523中,對(duì)產(chǎn)生的整數(shù)誤差值進(jìn)行無損編碼,并將其復(fù)用(使用復(fù) 用器507)為比特流。在時(shí)域中,將量化(舍入)后的子帶信號(hào)饋送入 插值和子帶濾波器組模塊525中,并且在減法器526中從相應(yīng)延遲(使 用延遲514)的原始PCM樣本SpcM中減去產(chǎn)生的時(shí)域信號(hào)??蛇x地, 對(duì)產(chǎn)生的時(shí)域誤差信號(hào)進(jìn)行時(shí)域解相關(guān)(見以下時(shí)域解相關(guān)器527)、 無損編碼(使用無損編碼TD模塊或步驟528)并復(fù)用(使用復(fù)用器507) 為比特流。復(fù)用器507輸出相應(yīng)編碼比特流517。以獨(dú)立于平臺(tái)的方式 來實(shí)現(xiàn)子帶濾波器組525。
實(shí)質(zhì)上,在圖5的第一實(shí)施例無損解碼器中,對(duì)編碼器方框圖中 的所有步驟進(jìn)行反轉(zhuǎn)。在解復(fù)用器301中,對(duì)接收的編碼比特流517進(jìn) 行解復(fù)用。在"反"量化器模塊或步驟217中,對(duì)來自嵌入的mp3比特流的MDCT系數(shù)215進(jìn)行解碼,并在舍入模塊或步驟221中對(duì)其進(jìn)行舍 入來獲得整數(shù)值222。在輔助信息解碼器模塊或步驟306中對(duì)輔助信息 進(jìn)行解碼,并且使用輔助信息來控制反量化器217。在無損解碼FD模 塊或步驟305中對(duì)頻域殘差243進(jìn)行解碼,并在第一加法器261中對(duì)其執(zhí) 行加法來獲得完整的整數(shù)MDCT系數(shù)。在應(yīng)用反整數(shù)MDCT變換308之 后,將子帶信號(hào)226饋送入插值和多相合成濾波器組232中。在圖5的上 側(cè)路徑中,在無損解碼TD模塊或步驟302中對(duì)時(shí)域殘差240進(jìn)行解碼, 可選地在反TD相關(guān)模塊或步驟303 (即可選的TD解相關(guān)527的反過程) 中對(duì)其進(jìn)行相關(guān),最后在第二加法器262中將其與多相合成濾波器組 232的輸出信號(hào)相加來獲得原始PCM樣本SpcM。
有利地,任何符合標(biāo)準(zhǔn)的mp3解碼器都可以對(duì)嵌入的mp3比特流 進(jìn)行解碼。
第二優(yōu)選實(shí)施例
在圖6的編碼器中,編碼器方框圖的下部包括未修改的傳統(tǒng)的符 合標(biāo)準(zhǔn)的mp3編碼器,參見圖3。與嵌入的mp3編碼器的分段和MDCT 變換模塊504并行,在舍入模塊或步驟520中對(duì)子帶信號(hào)512 (多相濾波 器組和抽選模塊503的輸出)進(jìn)行舍入來獲得整數(shù)值,然后將該整數(shù)值 饋送入分段和整數(shù)MDCT模塊529以及插值和子帶濾波器組模塊525。 將模塊529的輸出輸入至第一減法器522。模塊/步驟521到528具有與圖 4中類似的相同意義和操作。
實(shí)質(zhì)上,與第一優(yōu)選實(shí)施例的差別在于,以并行于傳統(tǒng)MDCT的 方式來計(jì)算整數(shù)MDCT變換而非取代傳統(tǒng)MDCT。第二實(shí)施例具有的 優(yōu)點(diǎn)在于,通過完全符合標(biāo)準(zhǔn)和傳統(tǒng)mp3編碼器來獲得比特流的mp3 部分。即與通常的MDCT相比,不存在通過舍入步驟加整數(shù)MDCT的 任何近似誤差使嵌入的mp3比特流的質(zhì)量退化的危險(xiǎn)。
在編碼器方框圖的其余部分(模塊/步驟521到528)中,信號(hào)流包 括在頻域和時(shí)域中針對(duì)兩個(gè)誤差信號(hào)的無損編碼方案。在頻域中,對(duì) 量化后的變換系數(shù)(從mp3比特流中獲得)進(jìn)行舍入來獲得整數(shù)值, 隨后從整數(shù)MDCT變換系數(shù)中減去該整數(shù)值。對(duì)產(chǎn)生的整數(shù)誤差值進(jìn)
12行無損編碼(在523中),并復(fù)用為比特流。在時(shí)域中,將量化(舍入)
后的子帶信號(hào)饋送入插值和子帶濾波器組中,并從原始PCM樣本SpcM
中減去產(chǎn)生的時(shí)域信號(hào)。可選地,對(duì)時(shí)域誤差信號(hào)進(jìn)行解相關(guān)(見以
下)、無損編碼(在528中)并復(fù)用為比特流。以獨(dú)立于平臺(tái)的方式來 實(shí)現(xiàn)子帶濾波器組。
第二實(shí)施例的解碼器與第一實(shí)施例解碼器相同。 可選擴(kuò)展h在對(duì)子帶信號(hào)進(jìn)行舍入之前應(yīng)用增益 為了減小由對(duì)子帶信號(hào)進(jìn)行舍入而產(chǎn)生的量化誤差,在舍入操作 之前可以應(yīng)用增益因子g。為了將舍入后的值轉(zhuǎn)換回至原始域,在舍入 之后要應(yīng)用反增益因子l/g。在圖7的編碼器和圖8的解碼器中分別示出 了所需的縮放。圖7中示出的編碼器是圖4中編碼器的附加使用了這些 增益因子的增強(qiáng)版本。
在圖7中,實(shí)質(zhì)上,所示的模塊具有與圖4中相應(yīng)模塊相同的功能 或操作。在第一乘法器223中,子帶信號(hào)206乘以增益因子g。在舍入操 作225之后,獲得可以由整數(shù)MDCT 248來處理的整數(shù)取值的子帶樣本 226。為了獲得多相濾波器組232的重建誤差(即時(shí)域殘差),在第一除 法器230中要將舍入后的子帶樣本226除以g。因此,產(chǎn)生的樣本231是 原始子帶樣本206的量化版本。量化后的樣本值是l/g的倍數(shù)。通過選 擇更大的值g,可以減小量化誤差。整數(shù)MDCT248之后,在第二除法 器249中,也要將整數(shù)取值的頻譜值229除以g以繼續(xù)標(biāo)準(zhǔn)mp3編碼器中 的處理。量化和"反"量化后的頻譜值255需要放置回到整數(shù)域中。因 此,在第二乘法器219中,這些值與因子g相乘并且在舍入模塊或步驟 221中對(duì)其進(jìn)行舍入。產(chǎn)生的值257表示整數(shù)域中的量化后的頻譜數(shù)據(jù), 并且在第一減法器247中從整數(shù)MDCT 248的輸出信號(hào)229中減去該值 257以產(chǎn)生頻域殘差258。其余處理類似于圖4中的處理。
在圖8的相應(yīng)的解碼器中,也要考慮使用增益因子g。在頻譜數(shù)據(jù) 的解碼("反"量化器217和輔助信息解碼器306)之后,在乘法器219 中,量化值與因子g相乘,并在舍入模塊或步驟221中將其舍入為如編 碼器(219、 221)中的整數(shù)。在加入與編碼器中信號(hào)258相同解碼后的 頻域殘差371、并應(yīng)用反整數(shù)MDCT 308之后,在除法器309中執(zhí)行使2007
用因子l/g的重新縮放,以便將子帶樣本轉(zhuǎn)換到原始域。產(chǎn)生的樣本231
與編碼器中合成濾波器組205的輸出相同。其余處理類似于圖5中的處理。
可選擴(kuò)展2:有損版本的解碼(mp3解碼器)
由于所提出的基于有損的無損編碼方案的完整比特流包括嵌入
的符合標(biāo)準(zhǔn)的mp3比特流,因此可以應(yīng)用傳統(tǒng)的mp3解碼。在圖9中所 示的相應(yīng)解碼器信號(hào)流中,丟棄了比特流中描述時(shí)域殘差240和頻域殘 差243的部分。該丟棄操作也可以在解碼器的上游進(jìn)行,例如在傳輸網(wǎng) 絡(luò)中。模塊或步驟301、 306、 217和232與圖5中相應(yīng)模塊或步驟相同。 然而,反MDCT模塊或步驟3081可以用于代替反整數(shù)MDCT模塊或步 驟308。
可選擴(kuò)展3:較高質(zhì)量有損版本的解碼
通過將來自嵌入的mp3比特流的信息和頻域解相關(guān)進(jìn)行組合,可 以對(duì)音頻內(nèi)容的較高高質(zhì)量而仍為有損的版本進(jìn)行解碼。在圖10所示 的信號(hào)流中,與圖5中完全無損解碼器相比,丟棄了關(guān)于時(shí)域殘差240 的信息。該丟棄操作也可以在解碼器的上游進(jìn)行,例如在傳輸網(wǎng)絡(luò)中。
由于該可選解碼器不會(huì)呈現(xiàn)無損PCM樣本,因此沒有必要(但可 能)使用反整數(shù)MDCT 308來代替插值和多相濾波器組232之前的反 MDCT3081。
可選擴(kuò)展4:用于對(duì)頻域殘差進(jìn)行編碼的分層結(jié)構(gòu)
可以使用多層比特流結(jié)構(gòu)對(duì)頻域殘差258的信息進(jìn)行編碼。例如, 可以應(yīng)用從MPEG SLS草案標(biāo)準(zhǔn)的比特平面算術(shù)編碼原理或類似方 案。因此,結(jié)合根據(jù)圖10的高質(zhì)量解碼器,可以以比特速率級(jí)的精細(xì) 顆粒度(和質(zhì)量)來實(shí)現(xiàn)完全可縮放的編碼方案。
可選擴(kuò)展5:時(shí)域殘差的解相關(guān)
結(jié)合圖4、圖5和圖6,如上所述,可以在編碼器側(cè)應(yīng)用時(shí)域殘差 信號(hào)的解相關(guān),并在解碼器側(cè)應(yīng)用時(shí)域殘差信號(hào)的相應(yīng)反解相關(guān)。圖 11示出了模塊527 (左側(cè))和模塊303 (右側(cè))內(nèi)的功能。在TD解相關(guān) 編碼器(圖ll左側(cè))中,對(duì)時(shí)域殘差應(yīng)用線性預(yù)測濾波器。從殘差中 減去預(yù)測信號(hào)來移除任何剩余的短期相關(guān)。通過分析來自有損編碼器
14和/或來自編解碼器核心的頻域解相關(guān)模塊的信息,并可選地對(duì)實(shí)際殘 差信號(hào)進(jìn)行分析,使預(yù)測濾波器系數(shù)適配于信號(hào)特性。此外,可能有 必要使濾波器上的信號(hào)信息適配于接收機(jī)或解碼器中的反時(shí)域解相關(guān) 模塊。因此,可能有必要在總比特流的無損擴(kuò)展中包括特定信息。
在解碼器側(cè)(圖U右側(cè)),基于來自在前的解碼級(jí)(有損解碼器 和/或頻域解相關(guān))的信息以及可能基于從時(shí)域解相關(guān)方案的編碼器部 分接收的輔助信息,計(jì)算線性預(yù)測濾波器的相同系數(shù)。以特定的方式 應(yīng)用該系數(shù)來反轉(zhuǎn)在發(fā)射機(jī)側(cè)獲得的預(yù)測濾波效果,從而產(chǎn)生相關(guān)的 時(shí)域殘差。除了在編碼器處使用前饋線性預(yù)測濾波之外,可以應(yīng)用其 他預(yù)測方案,例如反饋結(jié)構(gòu)或前饋和反饋結(jié)構(gòu)的混合。
有利地,本發(fā)明基于利用混合濾波器組(如mp3)的現(xiàn)有有損音
頻編碼方案實(shí)現(xiàn)了無損編碼。僅有的應(yīng)當(dāng)具有獨(dú)立于平臺(tái)的實(shí)現(xiàn)的重 要信號(hào)處理模塊是多相合成濾波器組。
第一和第二實(shí)施例具有以下具體優(yōu)點(diǎn)由于在編碼器中僅需要計(jì)
算一組(整數(shù))MDCT變換,因此第一實(shí)施例允許編碼器的低復(fù)雜度
實(shí)現(xiàn)。另一方面,第二實(shí)施例允許編碼器的較高質(zhì)量的版本,其中,
以并行地計(jì)算兩組MDCT變換為代價(jià),使用未修改的mp3編碼器來產(chǎn) 生嵌入的mp3比特流。
1權(quán)利要求
1、一種使用有損編碼數(shù)據(jù)流和無損擴(kuò)展數(shù)據(jù)流對(duì)源信號(hào)(SPCM)對(duì)進(jìn)行無損編碼的方法,所述有損編碼數(shù)據(jù)流和所述無損擴(kuò)展數(shù)據(jù)流共同形成所述源信號(hào)的無損編碼數(shù)據(jù)流(SDEC),所述方法包括以下步驟-使用具有抽選功能的子帶濾波器組(11)、第一量化(12)、整數(shù)變換(13)和第二量化(14),對(duì)所述源信號(hào)進(jìn)行有損編碼,其中,所述有損編碼提供所述有損編碼數(shù)據(jù)流,-對(duì)所述第一量化(12)的輸出信號(hào)進(jìn)行插值和反子帶濾波器組處理(18);-在所述源信號(hào)的相應(yīng)延遲(17)版本和所述反子帶濾波器組處理(18)的輸出信號(hào)之間形成(152)差值信號(hào);-對(duì)所述差值信號(hào)進(jìn)行時(shí)域無損編碼(19),以提供所述無損擴(kuò)展數(shù)據(jù)流的時(shí)域殘差信號(hào)部分,對(duì)所述第二量化(14)的輸入信號(hào)和量化后的輸出信號(hào)之間的差值信號(hào)(151)進(jìn)行頻域無損編碼(16),以提供所述無損擴(kuò)展數(shù)據(jù)流的頻域殘差信號(hào)部分;-將所述有損編碼數(shù)據(jù)流和所述無損擴(kuò)展數(shù)據(jù)流的兩個(gè)部分進(jìn)行組合(10)來形成所述無損編碼數(shù)據(jù)流(SDEC)。
2、 一種使用有損編碼數(shù)據(jù)流和無損擴(kuò)展數(shù)據(jù)流對(duì)源信號(hào)(SPCM) 對(duì)進(jìn)行無損編碼的設(shè)備,所述有損編碼數(shù)據(jù)流和所述無損擴(kuò)展數(shù)據(jù)流 一同形成所述源信號(hào)的無損編碼數(shù)據(jù)流(Sdec;),所述設(shè)備包括-適于使用具有抽選功能的子帶濾波器組(ll)、第一量化(12)、 整數(shù)變換(13)和第二量化(14)對(duì)所述源信號(hào)進(jìn)行有損編碼的裝置, 其中,所述有損編碼提供所述有損編碼數(shù)據(jù)流,-適于對(duì)所述第一量化(12)的輸出信號(hào)進(jìn)行插值和反子帶濾波 器組處理的裝置(18);-適于在所述源信號(hào)的相應(yīng)延遲(17)版本和所述反子帶濾波器 組處理(18)的輸出信號(hào)之間形成差值信號(hào)的裝置(152);-適于對(duì)所述差值信號(hào)進(jìn)行時(shí)域無損編碼以提供所述無損擴(kuò)展數(shù)據(jù)流的時(shí)域殘差信號(hào)部分,并對(duì)所述第二量化(14)的輸入信號(hào)和量化后的輸出信號(hào)之間的差值信號(hào)(151)進(jìn)行頻域無損編碼以提供所述無損擴(kuò)展數(shù)據(jù)流的頻域殘差信號(hào)部分的裝置(19、 16); 適于將所述有損編碼數(shù)據(jù)流和所述無損擴(kuò)展數(shù)據(jù)流的兩個(gè)部 分進(jìn)行組合來形成所述無損編碼數(shù)據(jù)流(SDEC)的裝置(10)。
3、 一種對(duì)無損編碼的源信號(hào)(SENC)數(shù)據(jù)流進(jìn)行解碼的方法,所述數(shù)據(jù)流是使用根據(jù)權(quán)利要求l的方法來編碼的,所述解碼方法包括以下步驟-對(duì)所述無損編碼的源信號(hào)數(shù)據(jù)流進(jìn)行解復(fù)用(20),以提供有損編碼數(shù)據(jù)流和無損擴(kuò)展數(shù)據(jù)流的時(shí)域殘差信號(hào)部分和頻域殘差信號(hào)部分;-使用量化解碼器(24)、反整數(shù)變換(23)以及插值和子帶濾波 器組(21)來對(duì)所述有損編碼數(shù)據(jù)流進(jìn)行有損解碼;-對(duì)所述頻域殘差信號(hào)部分進(jìn)行頻域無損解碼(26),并將輸出信 號(hào)與所述量化解碼器(24)的相應(yīng)輸出信號(hào)進(jìn)行組合(25),以及對(duì)時(shí) 域殘差信號(hào)部分進(jìn)行時(shí)域無損解碼(29)并將相應(yīng)延遲(27)的輸出 信號(hào)與所述插值和子帶濾波器組(21)的輸出信號(hào)進(jìn)行組合(28),從而重建所述源信號(hào)(SpcM)。
4、 一種對(duì)無損編碼的源信號(hào)(SENC)數(shù)據(jù)流進(jìn)行解碼的設(shè)備,所 述數(shù)據(jù)流是使用根據(jù)權(quán)利要求l的方法來編碼的,所述設(shè)備包括-適于對(duì)所述無損編碼的源信號(hào)數(shù)據(jù)流進(jìn)行解復(fù)用以提供有損編 碼數(shù)據(jù)流和無損擴(kuò)展數(shù)據(jù)流的時(shí)域殘差信號(hào)部分和頻域殘差信號(hào)部分 的裝置(20);-適于使用量化解碼器、反整數(shù)變換以及插值和子帶濾波器組來 對(duì)所述有損編碼數(shù)據(jù)流進(jìn)行有損解碼的裝置(24、 23、 21);-適于對(duì)所述頻域殘差信號(hào)部分進(jìn)行頻域無損解碼并將輸出信號(hào) 與所述量化解碼器的相應(yīng)輸出信號(hào)進(jìn)行組合、以及對(duì)時(shí)域殘差信號(hào)部 分進(jìn)行時(shí)域無損解碼并將相應(yīng)延遲的輸出信號(hào)與所述插值和子帶濾波 器組的輸出信號(hào)進(jìn)行組合,從而重建所述源信號(hào)(SPCM)的裝置(26、 25、 29、 27、 28)。
5、 根據(jù)權(quán)利要求l所述的方法,或根據(jù)權(quán)利要求2所述的設(shè)備, 其中.--所述第一量化(12)是舍入(520);-所述第二量化(14)包括比特分配(505); -在形成所述差值信號(hào)(151、 522)之前,所述第二量化(14) 的所述輸入信號(hào)通過反量化器舍入(521)。
6、 根據(jù)權(quán)利要求l所述的方法,或根據(jù)權(quán)利要求2所述的設(shè)備, 其中-所述第一量化(12)是舍入(520),其中,所述整數(shù)變換(13) 是分段和MDCT(504),不將所述舍入的輸出饋送至所述分段和MDCT (504),而將其饋送至分段和整數(shù)MDCT (529),分段和整數(shù)MDCT (529)的輸出信號(hào)形成所述差值信號(hào)(151、 522)的輸入之一; -所述第二量化(14)包括比特分配(505); -在形成所述差值信號(hào)(151、 522)之前,所述第二量化(14) 的所述輸入信號(hào)通過反量化器舍入(521)。
7、 根據(jù)權(quán)利要求3所述的方法,或根據(jù)權(quán)利要求4所述的設(shè)備, 其中-所述量化解碼器(24、 217)包括相應(yīng)的舍入(221)。
8、 一種根據(jù)權(quán)利要求l、 5或6之一所述的方法來編碼的音頻信號(hào)。
9、 一種存儲(chǔ)介質(zhì),例如光盤,其上包含或存儲(chǔ)或記錄有根據(jù)權(quán) 利要求l、 5或6之一所述的方法來編碼的數(shù)字信號(hào)。
全文摘要
本發(fā)明涉及使用有損編碼數(shù)據(jù)流和無損擴(kuò)展數(shù)據(jù)流對(duì)源信號(hào)(SPCM)進(jìn)行的無損編碼,所述有損編碼數(shù)據(jù)流和所述無損擴(kuò)展數(shù)據(jù)流共同形成所述源信號(hào)的無損編碼數(shù)據(jù)流(SDEC),無損音頻壓縮是指在解碼器輸出處具有原始PCM樣本的比特精確重現(xiàn)的音頻編碼。無損編碼/解碼可以是mp3編碼/解碼。本發(fā)明使用針對(duì)基本層有損音頻編解碼器的殘差信號(hào)的整數(shù)MDCT以及頻域解相關(guān)(16)和時(shí)域解相關(guān)(16)。利用來自有損基本層編解碼器的輔助信息允許減少總比特流中的冗余,從而提高基于有損的無損編解碼器的編碼效率。
文檔編號(hào)G10L19/24GK101490748SQ200780027555
公開日2009年7月22日 申請(qǐng)日期2007年7月12日 優(yōu)先權(quán)日2006年7月24日
發(fā)明者奧利弗·威伯特, 弗洛里安·凱勒, 彼得·杰克斯, 斯文·科登, 約翰尼斯·伯姆 申請(qǐng)人:湯姆森許可貿(mào)易公司