專利名稱:基于整數(shù)變換的編碼和解碼的取整噪聲整形的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于改進(jìn)音頻或視頻信號(hào)的編碼效率的方法和裝置。
背景技術(shù):
整數(shù)可逆變換,特別是整數(shù)MDCT (IntMDCT),用于無損或HD (高清)音頻/視頻編 碼。例如,最近標(biāo)準(zhǔn)化的MPEG-4 SLS編解碼器使用IntMDCT。該方法也可以應(yīng)用在使用無損變換的其他領(lǐng)域,例如,整數(shù)可逆小波變換用于無 損的圖像和視頻編碼。任何整數(shù)可逆變換的問題在于,該變換被分成連續(xù)步驟,每個(gè)步驟向信號(hào)引入不 可忽略的取整誤差。要編碼的有用信號(hào)的電平越低,該問題就越嚴(yán)重。因此,取整誤差噪聲 是殘差編碼方案中的制約因素,在殘差編碼方案中,殘差是原始(或無損或HD)信號(hào)與其有 損或標(biāo)清編碼版本之間的誤差信號(hào)。在沒有噪聲整形的情況下,取整誤差噪聲會(huì)對(duì)被變換信號(hào)的所有頻率箱造成相等 的影響。特別對(duì)于實(shí)際信號(hào)電平較低的頻率箱而言,這是一個(gè)問題。在取整誤差占據(jù)了主導(dǎo) 地位的箱中,為了無損變換,要付出熵(并且因此是數(shù)據(jù)率)急劇增大方面的較大“懲罰”。 對(duì)于取整誤差并非主導(dǎo)的頻率箱,這種懲罰小很多。在 Yoshikazu Yokotani , Ralf Geiger, Gerald D. Τ. Schuller, SoontornOraintara,K. R. Rao,"Lossless audio coding using the IntMDCT androunding error shaping", IEEE Transactions on Audio, Speech, andLanguage Processing, Vol. 14,No. 6,pp. 2201-2211,November 2006 中,F(xiàn)raunhofer 已經(jīng)提出了針對(duì)上述問題的 解決方案,其中,提出了向多個(gè)提升步驟(表示變換的小的整數(shù)可逆子步驟)添加固定的噪 聲整形濾波器,以處理特別是從高頻到低頻的取整誤差影響。上述作者采用啟發(fā)式優(yōu)化準(zhǔn) 則來尋找噪聲整形濾波器系數(shù)。該方法的簡單變型是MPEG-4 SLS編解碼器的一部分(固 定的一階低通濾波器)?;谔嵘桨傅恼麛?shù)變換將整數(shù)映射到整數(shù),并且是可逆的。這種提升的基本思 想是例如,如果一對(duì)濾波器(h,g)是互補(bǔ)的,即,允許理想的重建,則對(duì)于每個(gè)濾波器s,該 對(duì)(h’,g)在h’ (ζ) =h(z)+s(z2)*g(z)的情況下也允許理想重建。對(duì)于濾波器t以及形式 為g’(z) =g(z)+t(z2)*h(z)的每個(gè)對(duì)(h,g'),也是如此。相反也是如此如果濾波器組 (h,g)和(h,,g)允許理想重建,則存在唯一的濾波器s,其中h’ (ζ) =h(z)+s(z2)*g(z)。濾波器組的每一個(gè)這種變換操作稱為提升步驟。一系列提升步驟可以構(gòu)成交替提 升,即,在一個(gè)步驟中,固定低通,而改變高通,在下一步驟中,固定高通,而改變低通,從而 可以合并相同方向的連續(xù)步驟。^t U M 54Min Shi, Shengli Xie, "A Lossless ImageCompression Algorithm by Combining DPCM with Integer WaveletTransform",IEEE 6th CAS Symp. on Emerging Technologies :Mobile andffireless Comm. , Shanghai, China, May 31-June 2, 2004中已公開了處理上述問題的另一方法。作者在無損變換之前應(yīng)用DPCM預(yù)濾波器,從而對(duì)信號(hào)進(jìn)行“白化”,并因此以類似信號(hào)譜的方式對(duì)取整誤差噪聲(也是“白色”的)進(jìn)行有 效整形。但是,該方法也有一些不足之處第一,為了實(shí)現(xiàn)整數(shù)可逆,預(yù)濾波器需要向其自身 添加取整誤差,這會(huì)降低編碼性能(參見下文);第二,作者采用“正常”前向DPCM濾波器, 但是,該濾波器不是針對(duì)上述問題的最優(yōu)選擇
發(fā)明內(nèi)容
雖然平均來講上述固定噪聲整形是有益的,但是其對(duì)于單獨(dú)的信號(hào)塊可能在很大 程度上是次優(yōu)的。本發(fā)明要解決的問題是優(yōu)化在使用提升的整數(shù)可逆變換中的取整誤差噪聲分布、 以及/或者減小對(duì)特定音頻或視頻信號(hào)進(jìn)行比特精度的編碼所必需的數(shù)據(jù)率,即,提高編 碼/解碼效率。該問題由權(quán)利要求1和3公開的方法解決。權(quán)利要求2和4中公開了使用 這些方法的相應(yīng)裝置。本發(fā)明通過使用噪聲整形的逐塊調(diào)整,來限制在整數(shù)可逆變換中來自或由于每個(gè) 提升步驟導(dǎo)致的取整誤差噪聲對(duì)無損編解碼的數(shù)據(jù)率的影響??梢允褂脙煞N基本方法第一,根據(jù)當(dāng)前時(shí)域信號(hào)特征,在各個(gè)單獨(dú)提升步驟中調(diào)整用于變換的噪聲整形 濾波器的濾波器系數(shù)或頻域系數(shù)。已經(jīng)開發(fā)了新的分析調(diào)整規(guī)則,其得到接近最優(yōu)的濾波 器系統(tǒng)。此外,附加的(可選的)迭代過程產(chǎn)生局部最優(yōu)系數(shù)集合。第二,可以在無損變換 之前添加自回歸(即,遞歸)預(yù)濾波器。該濾波器明顯地將“提高”具有較低功率的頻率區(qū) 域的電平作為目標(biāo),以降低這些區(qū)域中取整誤差的主導(dǎo)地位。該預(yù)濾波器共享本發(fā)明中與 用于變換的自適應(yīng)噪聲整形處理或頻域系數(shù)相同的調(diào)整規(guī)則。有利地,這兩種基本處理可 以組合,以進(jìn)一步提高無損編解碼的壓縮率。根據(jù)其可以計(jì)算濾波器系數(shù)的音頻或視頻信號(hào)采樣幀可以具有與音頻或視頻信 號(hào)采樣塊到相應(yīng)的變換系數(shù)塊的長度不同的長度,其中采用相應(yīng)的變換系數(shù)塊的濾波器系 數(shù)。作為備選或作為附加的,可以相對(duì)于采樣塊,在時(shí)間上移動(dòng)采樣幀,這種實(shí)施例的 優(yōu)點(diǎn)在于,不需要向解碼器側(cè)發(fā)送濾波器系數(shù),而可以在解碼器側(cè)相應(yīng)地計(jì)算濾波器系數(shù)??梢圆恢苯痈鶕?jù)信號(hào)采樣幀來計(jì)算濾波器系數(shù),而是根據(jù)在編碼處理中(例如, 在音頻或視頻信號(hào)編碼器的濾波器組部分中)可獲得的誤差或殘差信號(hào),來計(jì)算濾波器系 數(shù)。原理上,本發(fā)明的編碼方法適合提高音頻或視頻信號(hào)的編碼效率,其中針對(duì)所述 信號(hào)的每個(gè)采樣塊,使用整數(shù)可逆變換,來處理所述信號(hào),該整數(shù)變換是使用提升步驟來執(zhí) 行的,所述提升步驟表示所述整數(shù)變換的子步驟,所述提升步驟包括取整運(yùn)算,其中執(zhí)行針 對(duì)從所述提升步驟產(chǎn)生的取整誤差的噪聲整形,所述方法包括如下步驟-使用提升步驟以及針對(duì)至少一些所述提升步驟的自適應(yīng)噪聲整形,對(duì)所述采樣 塊進(jìn)行整數(shù)變換,其中所述整數(shù)變換提供相應(yīng)的變換系數(shù)塊,并且執(zhí)行所述噪聲整形,以減 小來自當(dāng)前變換塊中的低電平幅度變換系數(shù)的取整噪聲,而增大來自所述當(dāng)前變換塊中的 高電平幅度變換系數(shù)的取整噪聲,并且相應(yīng)的噪聲整形濾波器的濾波器系數(shù)是根據(jù)所述音 頻或視頻信號(hào)采樣,逐幀地導(dǎo)出的。原理上,本發(fā)明的編碼裝置適合提高音頻或視頻信號(hào)的編碼效率,其中針對(duì)所述信號(hào)的每個(gè)采樣塊,使用整數(shù)可逆變換,來處理所述信號(hào),該整數(shù)變換是使用提升步驟來執(zhí) 行的,所述提升步驟表示所述整數(shù)變換的子步驟,所述提升步驟包括取整運(yùn)算,其中執(zhí)行針 對(duì)從所述提升步驟產(chǎn)生的取整誤差的噪聲整形,所述裝置包括-用于使用提升步驟以及針對(duì)至少一些所述提升步驟的自適應(yīng)噪聲整形,對(duì)所述 采樣塊進(jìn)行整數(shù)變換的裝置,其中所述整數(shù)變換提供相應(yīng)的變換系數(shù)塊,并且執(zhí)行所述噪 聲整形,以減小來自當(dāng)前變換塊中的低電平幅度變換系數(shù)的取整噪聲,而增大來自所述當(dāng) 前變換塊中的高電平幅度變換系數(shù)的取整噪聲;-相應(yīng)的噪聲整形濾波器,其濾波器系數(shù)是根據(jù)所述音頻或視頻信號(hào)采樣,逐幀地 導(dǎo)出的。原理上,本發(fā)明的解碼方法適合提高音頻或視頻信號(hào)的編碼/解碼效率,其中在編碼器側(cè),針對(duì)所述信號(hào)的每個(gè)采樣塊,使用整數(shù)可逆變換,來處理所述信號(hào),該整數(shù)變換 是使用提升步驟來執(zhí)行的,所述提升步驟表示所述整數(shù)變換的子步驟,所述提升步驟包括 取整運(yùn)算,其中執(zhí)行針對(duì)從所述提升步驟產(chǎn)生的取整誤差的噪聲整形,其中,所述采樣塊是使用提升步驟以及至少一些針對(duì)所述提升步驟的自適應(yīng)噪聲 整形而被整數(shù)變換的,所述整數(shù)變換提供相應(yīng)的變換系數(shù)塊,并且執(zhí)行所述噪聲整形,以減 小來自當(dāng)前變換塊中的低電平幅度變換系數(shù)的取整噪聲,而增大來自所述當(dāng)前變換塊中的 高電平幅度變換系數(shù)的取整噪聲,并且相應(yīng)的噪聲整形濾波器的濾波器系數(shù)是根據(jù)所述音 頻或視頻信號(hào)采樣,逐幀地導(dǎo)出的;所述編碼的音頻或視頻信號(hào)的解碼包括如下步驟-使用提升步驟以及針對(duì)至少一些所述提升步驟的自適應(yīng)噪聲整形,對(duì)所述采樣 塊進(jìn)行整數(shù)逆變換,其中所述逆變換針對(duì)變換系數(shù)塊執(zhí)行,并提供相應(yīng)的輸出采樣值塊,其 中執(zhí)行所述噪聲整形,以減小來自當(dāng)前逆變換塊中的低電平幅度變換系數(shù)的取整噪聲,而 增大來自所述當(dāng)前逆變換塊中的高電平幅度變換系數(shù)的取整噪聲,并且相應(yīng)的噪聲整形濾 波器的濾波器系數(shù)是根據(jù)逆變換的音頻或視頻信號(hào)采樣,逐幀地導(dǎo)出的。原理上,本發(fā)明的解碼裝置適合提高音頻或視頻信號(hào)的編碼/解碼效率,其中在 編碼器側(cè),針對(duì)所述信號(hào)的每個(gè)采樣塊,使用整數(shù)可逆變換,來處理所述信號(hào),該整數(shù)變換 是使用提升步驟來執(zhí)行的,所述提升步驟表示所述整數(shù)變換的子步驟,所述提升步驟包括 取整運(yùn)算,其中執(zhí)行針對(duì)從所述提升步驟產(chǎn)生的取整誤差的噪聲整形,其中,所述采樣塊是使用提升步驟以及針對(duì)至少一些所述提升步驟的自適應(yīng)噪聲 整形而被整數(shù)變換的,所述整數(shù)變換提供相應(yīng)的變換系數(shù)塊,并且執(zhí)行所述噪聲整形,以減 小來自當(dāng)前變換塊中的低電平幅度變換系數(shù)的取整噪聲,而增大來自所述當(dāng)前變換塊中的 高電平幅度變換系數(shù)的取整噪聲,并且相應(yīng)的噪聲整形濾波器的濾波器系數(shù)是根據(jù)所述音 頻或視頻信號(hào)采樣,逐幀地導(dǎo)出的;所述裝置適合對(duì)編碼的音頻或視頻信號(hào)進(jìn)行解碼,并且包括-用于使用提升步驟以及針對(duì)至少一些所述提升步驟的自適應(yīng)噪聲整形,對(duì)所述 采樣塊進(jìn)行整數(shù)逆變換的裝置,其中所述逆變換針對(duì)變換系數(shù)塊執(zhí)行,并提供相應(yīng)的輸出 采樣值塊,其中執(zhí)行所述噪聲整形,以減小來自當(dāng)前逆變換塊中的低電平幅度變換系數(shù)的 取整噪聲,而增大來自所述當(dāng)前逆變換塊中的高電平幅度變換系數(shù)的取整噪聲;-相應(yīng)的噪聲整形濾波器,其濾波器系數(shù)是根據(jù)逆變換的音頻或視頻信號(hào)采樣,逐幀地導(dǎo)出的。在各個(gè)從屬權(quán)利要求中公開了本發(fā)明的其他有利實(shí)施例。例如,可以根據(jù)在 所述音頻或視頻信號(hào)的解碼處理(即,在音頻或視頻信號(hào)解碼 的濾波器組部分)中可獲得的誤差或殘差信號(hào),逐幀地導(dǎo)出噪聲整形濾波器的濾波器系 數(shù)。該噪聲整形濾波器可以是預(yù)濾波器(后濾波器),該預(yù)濾波器(后濾波器)不是布 置在整數(shù)變換(整數(shù)逆變換)內(nèi),而是布置在整數(shù)變換(整數(shù)逆變換)的上游(下游)。該上游(下游)噪聲整形預(yù)濾波器(后濾波器)也可以除布置在整數(shù)變換(整數(shù) 逆變換)內(nèi)的噪聲整形濾波器之外的附加的濾波器。
參照附圖描述本發(fā)明的示例實(shí)施例,附圖中圖1示出了對(duì)于TDAC,Givens旋轉(zhuǎn)到三個(gè)連續(xù)提升步驟的分解,其中每個(gè)提升步 驟具有取整運(yùn)算;圖2示出了針對(duì)兩個(gè)并行輸入信號(hào)(立體聲情況)應(yīng)用的多維提升方案,其中兩 個(gè)輸入信號(hào)X和y已經(jīng)遭受TDAC塊中的取整誤差噪聲;圖3示出了使用噪聲整形的取整;圖4示出了公知的基于有損的無損編碼器和解碼器的基本框圖;圖5示出了整數(shù)MDCT的分解;圖6示出了公知的無噪聲整形的單個(gè)多維提升步驟;圖7示出了單個(gè)多維提升步驟中的公知的噪聲整形;圖8示出了本發(fā)明的自適應(yīng)噪聲整形IntMDCT獨(dú)立變體;圖9示出了本發(fā)明的自適應(yīng)噪聲整形逆IntMDCT獨(dú)立變體;圖10示出了本發(fā)明的自適應(yīng)噪聲整形IntMDCT可縮放到無損變換編碼器;圖11示出了本發(fā)明的自適應(yīng)噪聲整形逆IntMDCT可縮放到無損變換編碼器;圖12示出了本發(fā)明的自適應(yīng)預(yù)濾波器IntMDCT獨(dú)立變體;圖13示出了本發(fā)明的自適應(yīng)預(yù)濾波器逆IntMDCT獨(dú)立變體。
具體實(shí)施例方式整數(shù)MDCT (IntMDCT)是對(duì)正常MDCT算法的近似,正常MDCT算法允許對(duì)原始 PCM采樣的比特精度的重建。該特征是通過將所有算法步驟分解成提升步驟來實(shí)現(xiàn)的, 這些提升步驟是逐個(gè)步驟地在比特精度上可逆。更多信息可以在例如Ralf Geiger, Yoshikazu Yokotani, Gerald Schuller, Jiirgen Herre, “Improved integer transforms usingmulti-dimensional lifting",Proc. of ICASSP,volume 2,pages 17-21, Montreal, Canada, May 2004 中找到。無損(g卩,比特精度)重建特性的代價(jià)是加性誤差每個(gè)提升步驟中的取整運(yùn)算 添加了取整誤差噪聲。本發(fā)明的目的是對(duì)這些取整誤差的方差進(jìn)行量化,并評(píng)估其對(duì)無損 編解碼的壓縮率的影響。然后,使用噪聲整形濾波器和/或預(yù)濾波器進(jìn)行優(yōu)化,以獲得最小 熵。公開了固定和自適應(yīng)濾波器的技術(shù)方案。
Α)取整誤差
在IntMDCT中的大多數(shù)提升步驟中引入了取整誤差,具體內(nèi)容和推導(dǎo)可以參見 Y.Yokotani,R. Geiger,G. D. T. Schuller, S. Oraintara, K. R. Rao, “Lossless audio coding using the IntMDCT and rounding errorshaping,,,IEEE Transactions on Audio, Speech, and Language Processing, 14(6) 2201-2211,November 2006。在以下部分中,簡短總結(jié)了 取整誤差的來源并給出了一些定義。Α. 1)時(shí)域混疊消除(TDAC)圖1示出了 TDAC和窗運(yùn)算(Givens旋轉(zhuǎn))分解成三個(gè)提升步驟。這種針對(duì)輸入 音頻或視頻信號(hào)的每個(gè)塊或段的窗運(yùn)算通常與對(duì)塊或段中的幅度或大小進(jìn)行加權(quán)結(jié)合,例 如,通過使用正弦或余弦函數(shù)加權(quán)和50%交疊窗。將三個(gè)取整運(yùn)算解釋為相應(yīng)的加性噪聲 值 Ii1, n2, n3,得至Ijc,= a cos α _b sin α +Ii1 cos α +n2 cs α +n3 (1)d,= a sin α +b cos α +叫 sin α +n2(2)其中 cs α = (cos α -l)/sin α(3)并且角度α的集合定義了窗函數(shù)。對(duì)于正弦窗,這些角度定義為 二 [錄,”=1,2… 2,況=576.一般而言,O彡α彡ji/4。取整誤差的功率取決于Givens旋轉(zhuǎn)的旋轉(zhuǎn)角度α (c和d表示Givens旋轉(zhuǎn)的未 量化的期望輸出) 如上所述,圖1示出了 Givens旋轉(zhuǎn)到三個(gè)連續(xù)提升步驟的分解,其中每個(gè)提升步 驟具有取整運(yùn)算。輸入值是a和b,輸出值是C’和d’(參見等式⑴和(2))。Q1, Q2和Q3
表示量化步驟。第一提升步驟計(jì)算a+Qi (cs α *b),第二提升步驟計(jì)算b+Q2 (sin α ^+Q1 (cs α *b)]),以及第三提升步驟計(jì)算 對(duì)于正弦窗,來自整數(shù)MDCT的TDAC部分的取整誤差噪聲的平均功率大約是 1.6/12。可以通過針對(duì)所有使用的α值,對(duì)表達(dá)式l/2E{(c,-c)2}+l/2E{(d,-d)2}求平 均,來從理論上導(dǎo)出該值。該平均功率值已進(jìn)一步通過仿真得到了驗(yàn)證。A. 2)多維提升方案立體聲版本圖2示出了兩個(gè)并行輸入信號(hào)多維提升方案或立體聲多維提升方案。兩個(gè)輸入信 號(hào)X和y已經(jīng)進(jìn)行了 TDAC塊TDACl和TDAC2中的取整誤差噪聲,參見圖1。χ和y分別表 示編碼器側(cè)TDAC塊的下部分和上部分的輸出矢量。則IntMDCT域(在解碼器之前)中的 各個(gè)編碼器輸出矢量構(gòu)成為 其中,iDCTiv'表示類型IV的DCT(即,整數(shù)MDCT),n4,n5和n6是量化誤差信號(hào),Q4, QJPQ6表示量化運(yùn)算。根據(jù)該框圖,每一個(gè)結(jié)果‘譜’是實(shí)際MDCT譜(例如DCTiv{χ}) 和一些加性噪聲的混合,這些加性噪聲由頻域和時(shí)域誤差構(gòu)成。在解碼器側(cè),對(duì)三個(gè)變換提 升步驟進(jìn)行逆運(yùn)算,隨后是相應(yīng)的TDAC塊TDAC3和TDAC4。編碼中的中間和最終結(jié)果的矢 量的含糊的時(shí)域特性使得理解和濾波器優(yōu)化比較困難。Α. 2)預(yù)濾波器優(yōu)選地,在TDAC處理之前,由數(shù)字濾波器執(zhí)行對(duì)輸入信號(hào)的預(yù)處理。這可以由自 回歸(AR)或移動(dòng)平均(MA)濾波器實(shí)現(xiàn)。該預(yù)濾波器要以整數(shù)可逆方式實(shí)施。這意味著濾 波器特性必須是嚴(yán)格的最小相位。此外,在編碼器和解碼器中應(yīng)用的濾波器結(jié)構(gòu)必須是理 想可逆的。因此,濾波器運(yùn)算包括將中間值(預(yù)測(cè)器的輸出)取整為整數(shù)值的至少一個(gè)取 整運(yùn)算。這意味著預(yù)濾波器始終會(huì)伴隨有附加的取整誤差噪聲。在IntMDCT內(nèi)的噪聲整形優(yōu)化與預(yù)濾波器的優(yōu)化之間存在很強(qiáng)的相似性。區(qū)別在 于預(yù)濾波器也對(duì)最終量化級(jí)(圖2中的Q5Ai5和Q6Ai6 ;QX是非線性量化運(yùn)算的數(shù)學(xué)描述, 1^是得到的加性量化誤差)的影響產(chǎn)生積極的影響;對(duì)于類似濾波器階,計(jì)算 復(fù)雜度較低; 以及預(yù)濾波器會(huì)產(chǎn)生附加的取整誤差。B)具有噪聲整形的取整可以使用圖3所示的噪聲整形濾波器對(duì)取整誤差的頻率特性進(jìn)行整形。由具有脈 沖響應(yīng)a(k)和延遲T的有限脈沖響應(yīng)(fir)濾波器,對(duì)由量化器Q輸出信號(hào)y(k)得到的 原始量化噪聲坷幻進(jìn)行確定和濾波。將相應(yīng)的濾波后噪聲反饋到輸入信號(hào)中x(k)。然 后,假設(shè)噪聲整形濾波器具有階P,并且是因果的。則,在包括在前的延遲操作的情況下,濾 波器具有以下傳遞函數(shù) 其中,A(Z)表示a(k)的ζ變換,α λ是濾波器系數(shù)??梢宰杂尚薷臑V波器系數(shù) α λ,λ = 1. . . ρ,以獲得不同的頻率特性。尤其令人感興趣的是與離散MDCT的中心頻率有關(guān)的頻率響應(yīng)。如果i表示離散 頻率索引,i = 0,1,...,N-IJUMDCT的第i個(gè)頻率箱的中心頻率給定為角度表示形式的 Ω = (2 31 (i+0. 5))/2N,其中 N 是 MDCT 的長度。噪聲整形濾波器的頻率響應(yīng)變?yōu)? 在稍后的計(jì)算中,需要針對(duì)第Y個(gè)濾波器系數(shù)α γ的頻率響應(yīng)的偏導(dǎo)(等式13, 14,15) 由于噪聲整形濾波,也修改了取整誤差噪聲的時(shí)域特性。除了引入相關(guān)之外,噪聲 整形濾波器還增大了得到的噪聲信號(hào)η(k)的方差在上述推導(dǎo)中,假設(shè)在原點(diǎn)之外的原始量化噪聲的自相關(guān)是0,即,如果Y興0,則 E{n(k)n(k-y)} =0。注意,任何非零系數(shù)α興O會(huì)增大時(shí)域中有效量化噪聲的功率。C)取整誤差噪聲和微分熵為了簡化下面的論述,假設(shè)輸入信號(hào)是具有高斯概率密度函數(shù)(PDF)的隨機(jī)噪 聲,并且至少是短期平穩(wěn)的。但是,輸入信號(hào)的頻率特性不受限制。設(shè)X(k)代表輸入信號(hào)的時(shí)域表示。如果通過正常(浮點(diǎn))MDCT來變換上述隨機(jī) 輸入信號(hào),則得到頻域表示χ( ),短Xi, i表示頻率索引。為了能夠理解的目的,省略了幀索 弓丨。由于假設(shè)輸入信號(hào)是平穩(wěn)的隨機(jī)噪聲,所以MDCT箱也是隨機(jī)的,具有各自獨(dú)立的方差
σ#。第i個(gè)頻率箱的微分熵是 提升步驟中添加取整誤差噪聲,這向每個(gè)頻率箱添加各自的噪聲分量。第i個(gè)箱 中的噪聲方差由表示,并且假設(shè)每個(gè)箱中的信號(hào)分量Xi和噪聲分量Ni是相互獨(dú)立的。 貝U,帶噪頻率箱的微分熵是 S卩,微分熵遭“受到懲罰’\+,該懲罰hi+取決于各自單獨(dú)的信噪比。在全部的頻率范圍上,這些單獨(dú)的懲罰加起來,增大了對(duì)每個(gè)塊編碼至少所需的總比特率(注意假設(shè)在 量化和編碼之后,是微分熵與比特流的比特率之間的簡化的直接映射。實(shí)際中,由于次優(yōu)的熵編碼等,可能存在其他損失)
(24) 下文推導(dǎo)的目的是獲得將每個(gè)塊的上述總懲罰最小化的噪聲整形濾波器的調(diào)整 規(guī)則。根據(jù)先前部分B)的推導(dǎo),第i個(gè)頻率箱中噪聲分量的方差可以建模為 其中,Qi = (2 π (i+0.5))/2N,標(biāo)量因子k2是對(duì)原始取整誤差噪聲所幻的方差進(jìn)
行描述的任意因子。針對(duì)第Y個(gè)系數(shù)α λ的偏導(dǎo)為
(27)參見上述等式13到15的推導(dǎo)。C. 1)近似解決方案現(xiàn)在,應(yīng)該優(yōu)化系數(shù)α λ,以最小化總懲罰H+。為簡化目的,首先假設(shè)低量化噪聲, 即,假設(shè) 從而使用近似log(l+x) X,其對(duì)于x<< 1是有效的。在信號(hào)處理項(xiàng)中,假設(shè) σ2Ν丨在所有頻率箱中都是有效的??倯土PH+加起來為 得到系數(shù)α λ的偏導(dǎo) 將該偏導(dǎo)設(shè)置為0,這帶來方程組,要對(duì)該方程組求解,以找到具有最小熵懲罰的系數(shù)
在此,存在ρ個(gè)方程,來求解ρ個(gè)未知數(shù)。為理解目的,方程組可以表達(dá)為矩陣矢 量符號(hào)。定義下面的矢量和矩陣a = [a” a2, . . . , ap]T e = [_R(1),-R(2),· · ·,-R(P)]T,其中,使用縮寫 上述方程組給出了線性方程系統(tǒng)M · a = e(40)這也可以通過To印Iitz矩陣M的取逆來求解。aopt = M"1 · e(41)注意,量R(K)等效于具有輸入信號(hào)x(k)的逆譜的信號(hào)的自相關(guān)函數(shù)。結(jié) 果,該優(yōu)化方法與使用正常方程的線性預(yù)測(cè)濾波器的基于塊的調(diào)整非常相似,例如參見 P.Vary and R. Martin, "Digital SpeechTransmission-Enhancement, Coding and Error Concealment”,John ffiley&Sons Ltd,2006,Sec. 6. 2。因此,在計(jì)算偽自相關(guān)值 R( κ) 之后,可以利用用于優(yōu)化線性預(yù)測(cè)濾波器的多種方法的全部集合,例如,在計(jì)算上高效的 Levinson-Durbin 算法。通過計(jì)算信號(hào)采樣幀的逆功率譜,來確定自適應(yīng)噪聲整形濾波器的濾波器系數(shù), 從而優(yōu)化濾波器系數(shù),以最小化逆功率譜與對(duì)應(yīng)于這些濾波器系數(shù)的全極點(diǎn)濾波器的頻率 響應(yīng)之間的平均譜距離。即,通過基于信號(hào)采樣幀的逆功率譜的線性預(yù)測(cè)分析,執(zhí)行濾波器系數(shù)的優(yōu)化。在執(zhí)行濾波器系數(shù)的優(yōu)化之前,可以將逆功率譜變換為偽自相關(guān)系數(shù)。C. 2)趨向精確的解在前面的章節(jié)中,使用近似來獲得線性優(yōu)化問題。為了實(shí)現(xiàn)更加精確的解,使用精 確的項(xiàng)來表示熵懲罰 第Υ個(gè)濾波器系數(shù)的偏導(dǎo)得到如下項(xiàng) 不幸的是,該項(xiàng)是非線性的,對(duì)于t = 0·無法得到簡單的分析解。但是,可以應(yīng)用
多種方法來進(jìn)行趨向最優(yōu)解的迭代。例如,可以實(shí)施迭代梯度下降優(yōu)化處理或迭代最速下 降處理,以進(jìn)一步改善到優(yōu)化的濾波器系數(shù)。在該處理中,通過沿最陡(負(fù)的)梯度方向前
進(jìn)一小步, 來在每一個(gè)迭代步驟中改善系數(shù)集合a = La1, a2, . . . , ap]T,其中μ表示迭代索
弓丨,梯度定義為 標(biāo)量因子θ指定了步長,其可以用于控制調(diào)整的速度。重復(fù)進(jìn)行迭代,直到例如 系數(shù)集合已經(jīng)收斂至穩(wěn)定的解。過大的步長可能導(dǎo)致不穩(wěn)定的收斂表現(xiàn)。上述處理會(huì)找到針對(duì)ρ維優(yōu)化問題的局部解。取決于迭代算法的開始點(diǎn),即,取決 于初始系數(shù)集合a(0),最終結(jié)果可能不同。通過以上述章節(jié)中給出的近似解來開始,已經(jīng)獲 得一致的解。盡管如此,不保證該解反映了對(duì)原始的最小化H+的問題的全局最優(yōu)。此外,不保證最終系數(shù)集合得到最小相位濾波器響應(yīng)。這意味著在將結(jié)果應(yīng)用于 預(yù)濾波器內(nèi)之前,有必要針對(duì)最小相位特性來檢查該結(jié)果。上述自適應(yīng)噪聲整形的效果在于,減小了來自輸入信號(hào)塊或段中當(dāng)前塊或段中的 低電平幅度采樣的取整噪聲,而增大了來自當(dāng)前塊或段中高電平幅度采樣的取整噪聲。‘低 電平幅度’和‘高電平幅度’分別表示比例如該塊中平均幅度電平或該塊的閾值幅度電平更 小或更大。上述優(yōu)化確實(shí)應(yīng)用于移動(dòng)平均噪聲整形濾波器的調(diào)整。有利地,相同的調(diào)整規(guī)則 可以應(yīng)用于優(yōu)化自回歸(全極點(diǎn))預(yù)濾波器。C. 3)移動(dòng)平均(MA)預(yù)濾波器為了導(dǎo)出移動(dòng)平均(有限脈沖響應(yīng))預(yù)濾波器的最優(yōu)系數(shù),在濾波器結(jié)構(gòu)方面,該 處理與‘經(jīng)典’預(yù)加重或線性預(yù)測(cè)非常相似。但是,針對(duì)當(dāng)前問題的優(yōu)化準(zhǔn)則不同于針對(duì)這 些研究成熟的情況。由于進(jìn)行預(yù)濾波,所以現(xiàn)在觀察到MDCT域中信號(hào)的不同的功率譜得到
,而不是q
。假設(shè)在除了預(yù)濾波器之外沒有應(yīng)用其他的自適應(yīng)噪聲整形的情況
下,MDCT域中的取整誤差噪聲是白色的。則噪聲功率譜是常量σ
相應(yīng)地,優(yōu)化準(zhǔn)則定義如下 注意,|G(i) |2的定義沒有改變。第Y個(gè)濾波器系數(shù)的近似的偏導(dǎo)得到如下項(xiàng) 同樣,該項(xiàng)是非線性的,很難導(dǎo)出對(duì)優(yōu)化問題的分析解。但是,可以應(yīng)用在前述章 節(jié)中定義的相同的迭代‘最速下降’優(yōu)化過程。如果選擇迭代改進(jìn)處理,則也可以跳過以上使用的近似。如果以精確準(zhǔn)則開始,則 如下項(xiàng)是a ¥的偏導(dǎo)結(jié)果 對(duì)于上述兩種迭代調(diào)整規(guī)則,同樣都無法保證能夠獲得全局最優(yōu)。而是,該方法趨 向局部最優(yōu)收斂,最終結(jié)果將顯著地取決于開始的解。對(duì)來自EBU-SQAM CD的實(shí)際音頻數(shù)據(jù)的具體仿真已展示了在應(yīng)用本發(fā)明的處理時(shí) 的預(yù)期改進(jìn)。相對(duì)于其他提議方案,有多于0.2個(gè)百分點(diǎn)(假設(shè)16比特信號(hào))的性能增益。D)應(yīng)用于立體聲IntMDCT一般而言,對(duì)左通道和右通道分別應(yīng)用優(yōu)化,如果對(duì)于所有取整誤差,假設(shè)
則近似地可以彼此獨(dú)立地處理所有取整誤差源。因此,對(duì)來自TDAC處理的叫,n2, n3的噪聲整形濾波器、以及對(duì)來自多維提升方案 的第一級(jí)的n4的調(diào)整是清楚直接的,可以應(yīng)用來自章節(jié)C. 1的近似解。對(duì)于n6,即,對(duì)于多 維提升方案的最末級(jí),不應(yīng)該執(zhí)行任何噪聲整形。問題在于如何找到針對(duì)115的調(diào)整的解。 量化誤差具有兩重影響第一,量化誤差直接添加到X,即,添加到左通道;第二,量化誤差 的頻率變換添加到Y(jié),即,添加到右通道。因此,需要找到在無噪聲整形與使用‘正?!?調(diào)整規(guī)則的全噪聲整形之間的權(quán)衡。對(duì)于取整誤差噪聲n5的懲罰包括兩個(gè)加數(shù) 第Y個(gè)系數(shù)的微分得到 將這些項(xiàng)設(shè)置為0,得到 這啟發(fā)了一種修改的調(diào)整規(guī)則 相比于章節(jié)C. 1,僅有的區(qū)別在于,通過添加Rx(0),修改了主對(duì)角線。這種處理 與有時(shí)在線性預(yù)測(cè)濾波器中(例如,在J.D.Markel,A.H. Gray,“Linear Prediction of Speech", Springer-Verlag, Berlin, Heidelberg, New York, 1976 巾)j^ffi 白勺白
理相似。E)本發(fā)明在編碼/解碼中的應(yīng)用為容易理解本發(fā)明,描述了 一些現(xiàn)有技術(shù)細(xì)節(jié)。圖4示出了公知的基于有損的無損編碼的基本原理。在圖4左側(cè)的編碼部分中, PCM音頻輸入信號(hào)SrcM通過有損編碼器81,至解碼器部分(右側(cè))的有損解碼器82,并作為 有損比特流至有損解碼器85。使用有損編碼和解碼對(duì)信號(hào)進(jìn)行去相關(guān)。在減法器83中,從輸入信號(hào)SreM中移 除解碼器82的輸出信號(hào),得到的差信號(hào)通過無損編碼器84,作為擴(kuò)展比特流至無損解碼器 87。將解碼器85和87的輸出信號(hào)組合86,以重新得到原始信號(hào)SreM。在EP-B-0756386 和 US-B-6498811 中以及在 P. Craven, M. Gerzon, "Lossless Coding for Audio Discs,,,J. Audio Eng. Soc. , Vol. 44, No. 9, September 1996 禾口 J. Roller, Th.Sporer, K. H. Brandenburg, "RobustCoding of High Quality AudioSignals”,AES 103rd Convention, Preprint4621, August 1997 中公開和論述了針對(duì)音頻
編碼的基本原理。在有損編碼器中,PCM音頻輸入信號(hào)SreM通過分析濾波器組和針對(duì)子帶采樣的量 化,至編碼處理。該量化由感知模型控制,該感知模型接收信號(hào)SPeM,并可能接收來自分析濾 波器組的相應(yīng)信息。在解碼器側(cè),對(duì)編碼的有損比特流解碼,得到的子帶采樣通過合成濾波 器組,該合成濾波器組輸出解碼后的有損PCM信號(hào)。標(biāo)準(zhǔn)IS0/IEC11172-3 (MPEG-1 Audio) 中詳細(xì)描述了有損編碼和解碼的示例。在圖5所示的公知的整數(shù)MDCT的分解中,輸入信號(hào)x(k)和y(k)都通過具有固定 噪聲整形NS的TDAC以及具有固定噪聲整形NS的DCTIV,提供輸出信號(hào)X(i)和Y(i)。給出 了立體聲版本作為示例,如在R. Geiger等人的上述文章Proc. of ICASSP,May 2004中的一 樣。在三個(gè)步驟廣到廣中,針對(duì)每個(gè)通道,執(zhí)行TDAC。使用圖中所示的級(jí)來執(zhí)行DCTIV,其 中到礦3是提升步驟(參見圖2),P是針對(duì)一個(gè)通道的置換和符號(hào)反轉(zhuǎn)(無取整運(yùn)算)。 提升步驟由‘*’標(biāo)記,并且要求進(jìn)行取整運(yùn)算。在現(xiàn)有技術(shù)中,優(yōu)選地在TYTVT^以及中、并且可選地、在D 中,實(shí)施固定噪
聲整形。根據(jù)本發(fā)明,在步驟/級(jí)廣、f2、f3以及t的一個(gè)或多個(gè)中、并且可選地、在步驟 /級(jí)『2中,實(shí)施自適應(yīng)噪聲整形。圖6示出了公知的針對(duì)輸入信號(hào)矢量x(0),. . .,X(N)的、無噪聲整形的單個(gè)多維 提升步驟,得到輸出信號(hào)矢量x (N+1),...,x (2N)?;趫D6,圖7示出了公知的單個(gè)多維提升步驟中的噪聲整形。這應(yīng)用于圖5的 IntMDCT算法中的廣、T*2、T*3以及、并且可選地D*2?;趫D5,圖8示出了本發(fā)明的自適應(yīng)噪聲整形IntMDCT的獨(dú)立變體。根據(jù)輸入信 號(hào)x(k),在濾波器調(diào)整步驟或級(jí)121中計(jì)算濾波器調(diào)整參數(shù)或系數(shù)。將計(jì)算得到的濾波器 參數(shù)或系數(shù)h(k)提供給整數(shù)MDCT步驟或級(jí)123,整數(shù)MDCT步驟或級(jí)123包括具有自適應(yīng) 噪聲整形濾波的TDAC以及具有自適應(yīng)噪聲整形濾波的DCTIV。濾波器調(diào)整步驟或級(jí)121也 可以提供針對(duì)解碼器的相應(yīng)的輔助信息122?;趫D8,圖9示出了本發(fā)明的自適應(yīng)噪聲整形逆IntMDCT的獨(dú)立變體。解碼器輸 入信號(hào)X(i)通過逆整數(shù)MDCT步驟或級(jí)133,該逆整數(shù)MDCT步驟或級(jí)133包括具有自適應(yīng) 噪聲整形的逆TDAC以及具有自適應(yīng)噪聲整形的逆DCTIV。根據(jù)其輸出信號(hào)x(k),在濾波器 調(diào)整步驟或級(jí)131中計(jì)算濾波器調(diào)整參數(shù)或系數(shù)。將計(jì)算得到的濾波器參數(shù)或系數(shù)h(k) 提供給步驟/級(jí)133。濾波器調(diào)整步驟或級(jí)131也可以接收來自編碼器的相應(yīng)的輔助信息 122。在這種情況下,步驟或級(jí)131可以不需要解碼器輸出信號(hào)x(k)。圖8和9所示的處理可應(yīng)用于獨(dú)立無損編解碼,例如MPEG-4 SLS無內(nèi)核。圖10示出了本發(fā)明的使用自適應(yīng)噪聲整形IntMDCT的可縮放至無損變換編碼器 的框圖,其中‘可縮放至無損’表示比特流包括至少兩個(gè)分級(jí)層一個(gè)對(duì)應(yīng)于有損內(nèi)核編解 碼(例如AAC或mp3),一個(gè)-與第一層結(jié)合-代表原始PCM采樣。一方面,輸入信號(hào)x(k) 通過變換編碼器144 (例如,AAC編碼器),可選的映射步驟或級(jí)146、以及取整或量化步驟/ 級(jí)147,至減法器140。這些步驟/級(jí)包括在圖4的有損編碼器81中。變換編碼器144提 供針對(duì)有損編碼器比特流的編碼信號(hào)148。
17
另一方面,輸入信號(hào)x(k)通過整數(shù)MDCT 143,至減法器140的另一輸入。對(duì)于整 數(shù)MDCT 143,使用本發(fā)明的自適應(yīng)噪聲整形,S卩,整數(shù)MDCT 143包括具有自適應(yīng)噪聲整形 濾波的TDAC以及具有自適應(yīng)噪聲整形濾波的DCTIV。使用來自編碼器144的相應(yīng)信息(例 如,量化的變換系數(shù)、量化器的參數(shù)、以及可能有原始變換系數(shù)),在殘差估計(jì)步驟或級(jí)145 中,估計(jì)要用于控制上述濾波器調(diào)整步驟或級(jí)141的殘差信號(hào)(時(shí)域或頻域中)。將計(jì)算得 到的濾波器參數(shù)或系數(shù)h(k)提供給步驟/級(jí)143。在減法器140中,從整數(shù)MDCT 143的輸出信號(hào)中減去步驟/級(jí)147的輸出信號(hào), 從而提供了殘差信號(hào)R(i)。按照需要對(duì)信號(hào)R(i)編碼,參見圖4的無損編碼器84。不同 于圖8,濾波器調(diào)整步驟或級(jí)141不需要提供針對(duì)解碼器的相應(yīng)的輔助信息,這是因?yàn)榭梢?在解碼器側(cè)執(zhí)行調(diào)整。圖11示出了本發(fā)明的使用自適應(yīng)噪聲整形逆IntMDCT的可縮放至無損變換編碼 器的框圖。來自變換編碼器比特流的解碼器輸入信號(hào)158通過變換解碼器154(例如,AAC 或mp3解碼器)、可選的映射步驟或級(jí)156、以及取整或量化步驟或級(jí)157,至組合器150.組合器150將步驟/級(jí)157的輸出信號(hào)與來自擴(kuò)展比特流的解碼后的殘差輸入信 號(hào)R(i)組合。組合后的信號(hào)X(i)通過逆整數(shù)MDCT 153,逆整數(shù)MDCT 153輸出無損解碼 器輸出信號(hào)x(k),該輸出信號(hào)x(k)對(duì)應(yīng)于圖4中的SPeM。對(duì)于逆整數(shù)MDCT 153,使用本發(fā) 明的自適應(yīng)噪聲整形,即,整數(shù)MDCT 143包括具有自適應(yīng)噪聲整形濾波的TDAC以及具有自 適應(yīng)噪聲整形濾波的DCTlv。使用來自解碼器154的相應(yīng)信息(例如,量化的變換系數(shù)、量 化器的參數(shù)、以及可能有原始變換系數(shù)),在殘差估計(jì)步驟或級(jí)155中,估計(jì)要用于控制上 述濾波器調(diào)整步驟或級(jí)151的殘差信號(hào)(時(shí)域或頻域中)。將計(jì)算得到的濾波器參數(shù)或系 數(shù)h(k)提供給步驟/級(jí)153。不同于圖9,濾波器調(diào)整步驟或級(jí)151不需要接收針對(duì)解碼 器的相應(yīng)的輔助信息,這是因?yàn)榭梢栽诮獯a器側(cè)執(zhí)行調(diào)整。根據(jù)圖10和11的處理可應(yīng)用 于例如 MPEG-4 SLS。圖12示出了本發(fā)明的自適應(yīng)預(yù)濾波器IntMDCT的獨(dú)立變體的框圖。一方面,將輸 入信號(hào)x(k)饋入濾波器調(diào)整步驟或級(jí)161。該步驟或級(jí)的輸出信號(hào)為濾波器特性步驟/級(jí) 168提供濾波器參數(shù)或系數(shù)h(k)。另一方面,輸入信號(hào)x(k)通過組合器160,至整數(shù)MDCT 步驟或級(jí)163 (其中不執(zhí)行噪聲整形),整數(shù)MDCT步驟或級(jí)163提供要編碼以在比特流中 傳輸?shù)妮敵鲂盘?hào)X’⑴。組合器160的輸出信號(hào)通過濾波器特性步驟/級(jí)168以及量化器 169,至組合器160的另一輸入。與圖8類似,濾波器調(diào)整步驟或級(jí)161也可以提供針對(duì)解 碼器的相應(yīng)的輔助信息162。圖13示出了本發(fā)明的在逆IntMDCT之后的自適應(yīng)后濾波器的獨(dú)立變體的框圖。從 比特流解碼得到的解碼器輸入信號(hào)X(i)通過逆整數(shù)MDCT步驟或級(jí)173,其中不執(zhí)行噪聲整 形。該步驟/級(jí)的輸出信號(hào)饋入組合器170,該組合器170提供輸出信號(hào)x(k)。輸出信號(hào) x(k)饋入濾波器調(diào)整步驟或級(jí)171,該步驟或級(jí)171為濾波器特性步驟/級(jí)178提供濾波 器參數(shù)或系數(shù)h(k)。逆整數(shù)MDCT步驟或級(jí)173的輸出信號(hào)通過濾波器特性步驟/級(jí)178 和量化器179,至組合器170的另一輸入。濾波器調(diào)整步驟或級(jí)171也可以接收來自編碼器的相應(yīng)的輔助信息162。在這種 情況下,該步驟或級(jí)171不需要解碼器輸出信號(hào)x(k)。根據(jù)圖12和13的處理可應(yīng)用于獨(dú)立的無損編解碼,例如MPEG-4SLS無內(nèi)核。
有利地,相比于在上述MPEG-4 SLS中執(zhí)行的無噪聲整形或簡單的低通噪聲整形處 理,優(yōu)化的自適應(yīng)噪聲整形處理始終產(chǎn)生更好的性能。根據(jù)本發(fā)明,實(shí)施低階的自適應(yīng)噪聲 整形。有利地,濾波器系數(shù)的調(diào)整是清楚直接的,計(jì)算復(fù)雜度的增加也是非常適度的。本發(fā)明有助于通過對(duì)取整誤差噪聲譜進(jìn)行整形,來管理和限制數(shù)據(jù)率。本發(fā)明可應(yīng)用于無損編碼,只要其包括到連續(xù)提升步驟的分解。根據(jù)本發(fā)明編碼的數(shù)字音頻或視頻信號(hào)可以存儲(chǔ)或記錄在存儲(chǔ)介質(zhì)上,例如在光 盤、固態(tài)存儲(chǔ)器或硬盤上。
權(quán)利要求
一種提高音頻或視頻信號(hào)(x(k))的編碼效率的方法,其中針對(duì)所述信號(hào)(x(k))的每個(gè)采樣塊,使用整數(shù)可逆變換(DCTIV),來處理所述信號(hào),該整數(shù)變換是使用提升步驟來執(zhí)行的,所述提升步驟表示所述整數(shù)變換(DCTIV)的子步驟,所述提升步驟包括取整運(yùn)算,其中執(zhí)行針對(duì)從所述提升步驟產(chǎn)生的取整誤差的噪聲整形,所述方法的特征在于如下步驟-使用提升步驟以及針對(duì)至少一些所述提升步驟的自適應(yīng)噪聲整形,對(duì)所述采樣塊進(jìn)行整數(shù)變換(123,143,163),其中所述整數(shù)變換提供相應(yīng)的變換系數(shù)塊,并且執(zhí)行所述噪聲整形,以減小來自當(dāng)前一個(gè)變換塊中的低電平幅度變換系數(shù)的取整噪聲,而增大來自所述當(dāng)前變換塊中的高電平幅度變換系數(shù)的取整噪聲,并且相應(yīng)的噪聲整形濾波器(168,169,160)的濾波器系數(shù)(h(k))是根據(jù)所述音頻或視頻信號(hào)采樣,逐幀地導(dǎo)出(121,141,161)的。
2.一種提高音頻或視頻信號(hào)(x(k))的編碼效率的裝置,其中針對(duì)所述信號(hào)(x(k))的 每個(gè)采樣塊,使用整數(shù)可逆變換(DCTIV),來處理所述信號(hào),該整數(shù)變換是使用提升步驟來執(zhí) 行的,所述提升步驟表示所述整數(shù)變換(DCTIV)的子步驟,所述提升步驟包括取整運(yùn)算,其 中執(zhí)行針對(duì)從所述提升步驟產(chǎn)生的取整誤差的噪聲整形,所述裝置包括_用于使用提升步驟以及針對(duì)至少一些所述提升步驟的自適應(yīng)噪聲整形,對(duì)所述采樣 塊進(jìn)行整數(shù)變換的裝置(123,143,163),其中所述整數(shù)變換提供相應(yīng)的變換系數(shù)塊,并且執(zhí) 行所述噪聲整形,以減小來自當(dāng)前變換塊中的低電平幅度變換系數(shù)的取整噪聲,而增大來 自所述當(dāng)前變換塊中的高電平幅度變換系數(shù)的取整噪聲;-相應(yīng)的噪聲整形濾波器,其濾波器系數(shù)(h(k))是根據(jù)所述音頻或視頻信號(hào)采樣,逐 幀地導(dǎo)出的。
3.一種提高音頻或視頻信號(hào)(x(k))的編碼/解碼效率的方法,其中在編碼器側(cè),針對(duì) 所述信號(hào)(x(k))的每個(gè)采樣塊,使用整數(shù)可逆變換(DCTIV)來處理所述信號(hào),該整數(shù)變換是 使用提升步驟來執(zhí)行的,所述提升步驟表示所述整數(shù)變換(DCTIV)的子步驟,所述提升步驟 包括取整運(yùn)算,其中執(zhí)行針對(duì)從所述提升步驟產(chǎn)生的取整誤差的噪聲整形,其中,所述采樣塊是使用提升步驟以及針對(duì)至少一些所述提升步驟的自適應(yīng)噪聲整 形而被整數(shù)變換(123,143,163)的,所述整數(shù)變換提供相應(yīng)的變換系數(shù)塊,并且執(zhí)行所述 噪聲整形,以減小來自當(dāng)前變換塊中的低電平幅度變換系數(shù)的取整噪聲,而增大來自所述 當(dāng)前變換塊中的高電平幅度變換系數(shù)的取整噪聲,并且相應(yīng)的噪聲整形濾波器(168,169, 160)的濾波器系數(shù)(h(k))是根據(jù)所述音頻或視頻信號(hào)采樣,逐幀地導(dǎo)出(121,141,161) 的;所述編碼的音頻或視頻信號(hào)的解碼包括如下步驟_使用提升步驟以及針對(duì)至少一些所述提升步驟的自適應(yīng)噪聲整形,對(duì)所述采樣塊進(jìn) 行整數(shù)逆變換(153,173),其中所述逆變換針對(duì)變換系數(shù)塊執(zhí)行,并提供相應(yīng)的輸出采樣值 塊,其中執(zhí)行所述噪聲整形,以減小來自當(dāng)前逆變換塊中的低電平幅度變換系數(shù)的取整噪 聲,而增大來自所述當(dāng)前逆變換塊中的高電平幅度變換系數(shù)的取整噪聲,并且相應(yīng)的噪聲 整形濾波器(178,179,170)的濾波器系數(shù)(h(k))是根據(jù)逆變換的音頻或視頻信號(hào)采樣,逐 幀地導(dǎo)出(151,171)的。
4.一種提高音頻或視頻信號(hào)(x(k))的編碼/解碼效率的方法,其中在編碼器側(cè),針對(duì) 所述信號(hào)(x(k))的每個(gè)采樣塊,使用整數(shù)可逆變換(DCTIV),來處理所述信號(hào),該整數(shù)變換是使用提升步驟來執(zhí)行的,所述提升步驟表示所述整數(shù)變換(DCTIV)的子步驟,所述提升步 驟包括取整運(yùn)算,其中執(zhí)行針對(duì)從所述提升步驟產(chǎn)生的取整誤差的噪聲整形,其中,所述采樣塊是使用提升步驟以及針對(duì)至少一些所述提升步驟的自適應(yīng)噪聲整 形而被整數(shù)變換(123,143,163)的,所述整數(shù)變換提供相應(yīng)的變換系數(shù)塊,并且執(zhí)行所述 噪聲整形,以減小來自當(dāng)前變換塊中的低電平幅度變換系數(shù)的取整噪聲,而增大來自所述 當(dāng)前變換塊中的高電平幅度變換系數(shù)的取整噪聲,并且相應(yīng)的噪聲整形濾波器(168,169, 160)的濾波器系數(shù)(h(k))是根據(jù)所述音頻或視頻信號(hào)采樣,逐幀地導(dǎo)出(121,141,161) 的;所述裝置適合對(duì)編碼的音頻或視頻信號(hào)進(jìn)行解碼,并且包括_用于使用提升步驟以及針對(duì)至少一些所述提升步驟的自適應(yīng)噪聲整形,對(duì)所述采樣 塊進(jìn)行整數(shù)逆變換的裝置(153,173),其中所述逆變換針對(duì)變換系數(shù)塊執(zhí)行,并提供相應(yīng)的 輸出采樣值塊,其中執(zhí)行所述噪聲整形,以減小來自當(dāng)前逆變換塊中的低電平幅度變換系 數(shù)的取整噪聲,而增大來自所述當(dāng)前逆變換塊中的高電平幅度變換系數(shù)的取整噪聲;-相應(yīng)的噪聲整形濾波器,其濾波器系數(shù)(h(k))是根據(jù)逆變換的音頻或視頻信號(hào)采 樣,逐幀地導(dǎo)出的。
5.根據(jù)權(quán)利要求1或3所述的方法或根據(jù)權(quán)利要求2或4所述的裝置,其中,通過計(jì)算信號(hào)采樣幀的逆功率譜,來確定所述自適應(yīng)噪聲整形濾波器的所述濾 波器系數(shù)(h(k)),其中,優(yōu)化濾波器系數(shù),以最小化所述逆功率譜與對(duì)應(yīng)于所述濾波器系數(shù)的全極點(diǎn)濾 波器的頻率響應(yīng)之間的平均譜距離。
6.根據(jù)權(quán)利要求5所述的方法或裝置,其中,基于所述信號(hào)采樣幀的所述逆功率譜,通 過線性預(yù)測(cè)分析來執(zhí)行所述濾波器系數(shù)(h(k))的所述優(yōu)化。
7.根據(jù)權(quán)利要求5或6所述的方法或裝置,其中,在執(zhí)行所述濾波器系數(shù)(h(k))的所 述優(yōu)化之前,將所述逆功率譜變換成偽自相關(guān)系數(shù)。
8.根據(jù)權(quán)利要求5到7之一所述的方法或裝置,其中,通過迭代梯度下降優(yōu)化過程,進(jìn) 一步改進(jìn)所優(yōu)化的濾波器系數(shù)(h(k))。
9.根據(jù)權(quán)利要求1以及5到8之一所述方法,或者根據(jù)權(quán)利要求2以及5到8之一所 述的裝置,其中,根據(jù)在所述音頻或視頻信號(hào)的編碼處理中可獲得的誤差或殘差信號(hào),逐幀 地導(dǎo)出(121,141,161)所述噪聲整形濾波器(168,169,160)的所述濾波器系數(shù)(h(k)),其 中所述音頻或視頻信號(hào)的編碼處理的示例是音頻或視頻信號(hào)編碼的濾波器組部分。
10.根據(jù)權(quán)利要求3以及5到8之一所述方法,或者根據(jù)權(quán)利要求4以及5到8之一所 述的裝置,其中,根據(jù)在所述音頻或視頻信號(hào)的解碼處理中可獲得的誤差或殘差信號(hào),逐幀 地導(dǎo)出(121,141,161)所述噪聲整形濾波器(168,169,160)的所述濾波器系數(shù)(h(k)),其 中所述音頻或視頻信號(hào)的解碼處理的示例是音頻或視頻信號(hào)解碼的濾波器組部分。
11.根據(jù)權(quán)利要求1以及5到9之一所述方法,或者根據(jù)權(quán)利要求2以及5到9之一所 述的裝置,其中,所述噪聲整形濾波器(168,169,160)是遞歸或全極點(diǎn)預(yù)濾波器,該預(yù)濾波 器不是布置在所述整數(shù)變換內(nèi),而是布置在所述整數(shù)變換(163)的上游。
12.根據(jù)權(quán)利要求1以及5到9之一所述方法,或者根據(jù)權(quán)利要求2以及5到9之一所 述的裝置,其中,還在所述整數(shù)變換(143)的上游布置噪聲整形預(yù)濾波器(160,168,169)。
13.根據(jù)權(quán)利要求3、5到8以及10之一所述方法,或者根據(jù)權(quán)利要求4、5到8以及10 之一所述的裝置,其中,所述噪聲整形濾波器(170,178,179)是后濾波器,該后濾波器不是 布置在所述整數(shù)逆變換內(nèi),而是布置在所述整數(shù)逆變換(173)的下游。
14.根據(jù)權(quán)利要求3、5到8以及10之一所述方法,或者根據(jù)權(quán)利要求4、5到8以及 10之一所述的裝置,其中,還在所述整數(shù)逆變換(153)的下游布置噪聲整形后濾波器(170, 178,179)。
15.一種數(shù)字音頻或視頻信號(hào),其是根據(jù)權(quán)利要求1、5到9、11以及12之一所述的方法 而編碼的。
16.一種存儲(chǔ)介質(zhì),其包含或存儲(chǔ)、或者已經(jīng)存儲(chǔ)有根據(jù)權(quán)利要求15所述的數(shù)字音頻 或視頻信號(hào),該存儲(chǔ)介質(zhì)的示例是光盤。
全文摘要
整數(shù)MDCT用于無損音頻編碼。但是,整數(shù)可逆變換被分成連續(xù)的提升步驟,每個(gè)步驟向信號(hào)引入不可忽略的取整誤差。要編碼的有用信號(hào)的電平越低,該問題就越嚴(yán)重。在沒有噪聲整形的情況下,取整誤差噪聲會(huì)對(duì)被變換信號(hào)的所有頻率箱造成相等的影響。特別對(duì)于實(shí)際信號(hào)電平較低的頻率箱而言,這是一個(gè)問題。本發(fā)明限制在整數(shù)可逆變換中來自或由于每個(gè)提升步驟導(dǎo)致的取整誤差噪聲對(duì)無損編解碼的數(shù)據(jù)率的影響。根據(jù)當(dāng)前時(shí)域信號(hào)特征,在各個(gè)單獨(dú)提升步驟中針對(duì)變換系數(shù),調(diào)整自適應(yīng)噪聲整形濾波器的濾波器系數(shù)。備選地,可以在無損變換之前添加自回歸預(yù)濾波器。該濾波器將提高具有較低功率的頻率區(qū)域的電平作為目標(biāo),以降低這些區(qū)域中取整誤差的主導(dǎo)地位。這兩種處理可以組合,以進(jìn)一步提高無損編解碼的壓縮率。
文檔編號(hào)G10L19/00GK101868822SQ200880117250
公開日2010年10月20日 申請(qǐng)日期2008年11月10日 優(yōu)先權(quán)日2007年11月23日
發(fā)明者彼得·杰克斯 申請(qǐng)人:湯姆森許可貿(mào)易公司