專利名稱:用于解碼器中的編碼音頻數(shù)據(jù)的頻域后濾波的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于編碼音頻數(shù)據(jù)(例如,線性預測編碼(LPC)語音數(shù)據(jù)、或者其它的 編碼語音數(shù)據(jù)或其它的音頻數(shù)據(jù))的解碼的方法和系統(tǒng)。
背景技術(shù):
在本公開的全文中,包括在權(quán)利要求中,表達方式“編碼數(shù)據(jù)”(或“代碼數(shù)據(jù)”)表 示通過將其它的數(shù)據(jù)(稱為“輸入數(shù)據(jù)”)編碼產(chǎn)生的、并且必須執(zhí)行至少一解碼步驟以從 中恢復輸入數(shù)據(jù)(或輸入數(shù)據(jù)的噪聲版本)的數(shù)據(jù)。例如,如果必須在其上面執(zhí)行至少一 個附加的解碼步驟以從中恢復輸入數(shù)據(jù),那么通過將輸入數(shù)據(jù)編碼產(chǎn)生的、并然后經(jīng)受至 少一個解碼步驟的數(shù)據(jù)是“編碼數(shù)據(jù)”。在本公開的全文中,包括在權(quán)利要求中,術(shù)語“后濾波器(postfilter) ”表示被配 置為對音頻數(shù)據(jù)進行濾波以減少或消除音頻數(shù)據(jù)中的可聽到的噪聲、或者(在使用后濾波 器以對編碼的音頻數(shù)據(jù)進行濾波的情況下)減少或消除編碼音頻數(shù)據(jù)的解碼版本中的可 聽到的噪聲的濾波器。數(shù)字音頻壓縮系統(tǒng)被廣泛用于現(xiàn)代的電信系統(tǒng)或家庭/個人視聽娛樂系統(tǒng)中 以減少數(shù)字音頻信號的數(shù)據(jù)率。這些系統(tǒng)中的大多數(shù)依賴于預測或變換音頻編碼技術(shù) 以減少音頻信號的冗余,由此以最小的感知質(zhì)量的損失產(chǎn)生信號的緊致表現(xiàn)(compact representation)。在預測音頻編碼器中,時域LPC (線性預測編碼)濾波器被應(yīng)用于將輸入 信號解相關(guān),并且,通常通過使用矢量量子化器(quantizer)進一步壓縮從LPC濾波器輸出 的白色殘余信號。在變換音頻編碼器中,輸入信號首先通過使用變換(例如,MDCT或FFT) 從時域被轉(zhuǎn)換到頻域,并且,得到的頻域數(shù)據(jù)值然后被量子化和編碼。已經(jīng)發(fā)現(xiàn),由于在預測編碼中使用的LPC濾波器/殘余模型與人發(fā)音 (articulation)系統(tǒng)的機制非常相似,因此,與變換編碼相比,預測編碼對于純語音信號提 供更好的編碼效率。另一方面,還已發(fā)現(xiàn),對于將包含可在變換域(頻域)中被更緊致地表 現(xiàn)的許多正弦成分的許多音頻信號(例如,音樂或不為純語音信號的其它音頻信號)編碼, 變換編碼方案常常勝過預測編碼方案。變換預測編碼模式組合上述的兩種編碼結(jié)構(gòu)的優(yōu)點,以提供可在簡單的統(tǒng)一構(gòu) 架中有效地將語音、普通的音頻以及混合(例如,混合的語音和音樂信號)編碼的工具。 ¢: Juin-Hwey Chen and D. Wang, "Transform Predictive Coding of Wideband Speech Signals”,Proc. ICASSP 1996,pp. 275-278中描述了變換預測編碼方法和系統(tǒng)的例子。
圖1是常規(guī)的變換預測編碼器的框圖。在圖1的變換預測語音/音頻編碼器中, 輸入音頻信號被采樣,并且,采樣(時域數(shù)字音頻采樣)被送到LPC分析濾波器。LPC分析濾波器去除輸入信號的粗共振峰結(jié)構(gòu)(語音信號的共振峰是揚聲器的聲道的共振頻率處 的信號頻率成分),以產(chǎn)生LPC殘余信號,并且還產(chǎn)生一組LPC參數(shù)。LPC殘余信號然后被 變換到頻域(在圖1中的標有“變換”的階段中),以進一步利用保留于LPC殘余信號中的 任何信號相關(guān)性。然后,變換的LPC殘余信號(包含頻域數(shù)據(jù)值)被量子化和編碼(在圖 1中的標有“量子化器”的階段中),以實現(xiàn)數(shù)據(jù)率降低。用于LPC分析濾波器中的LPC參 數(shù)然后與量子化的、變換的LPC殘差(residual)被多路化(multiplex)(在圖1中的標有 “位流多路化”的階段中),以產(chǎn)生壓縮的音頻位流。適當?shù)某R?guī)的解碼器可使用壓縮的音 頻位流的LPC參數(shù)以重構(gòu)解碼的音頻信號的共振峰結(jié)構(gòu)。從編碼器輸出的壓縮的音頻位流(與一系列的多組的LPC參數(shù)多路化的量子化的 變換的LPC殘差)被發(fā)送到解碼器。變換預測語音/音頻編碼器的解碼器執(zhí)行編碼器的反 向信號處理。圖2是用于將圖1的變換預測編碼器的輸出解碼的常規(guī)的解碼器的框圖。圖 2的第一階段(標有“位流多路化”)將用于LPC分析濾波器和量子化的變換的LPC殘差中 的LPC參數(shù)去多路化(demultiplex)。量子化的變換的LPC殘差被去量子化(在圖2中的 標有“去量子化”的階段中),并且,去量子化的變換的LPC殘差(由頻域音頻數(shù)據(jù)組成)被 反向變換回到時域中(在圖2中的標有“反向變換”的階段中),以產(chǎn)生恢復的LPC殘差(表 示初始地在圖1編碼器的LPC分析濾波器中產(chǎn)生的LPC殘差)。LPC合成濾波器用恢復的 LPC參數(shù)處理恢復的LPC殘差(在時域中),以產(chǎn)生表示初始輸入到圖1編碼器的音頻信號 的恢復的時域數(shù)字音頻采樣。不管是基于變換編碼還是基于預測編碼,音頻編碼系統(tǒng)的挑戰(zhàn)之一是控制一般在 初始輸入信號被量子化和編碼時引入的可聽到的噪聲。在現(xiàn)代的音頻編碼方案中,一般使 用一些類別的知覺編碼技術(shù)來控制這種編碼噪聲,使得噪聲被初始信號中的其它主導的事 件遮蔽(mask)。不幸的是,這種技術(shù)僅在音頻編碼器以高于一定的極限的位率工作時才有 效。當音頻編碼器以低于該極限的位率工作時,編碼噪聲能變得可聽到(在噪聲編碼數(shù)據(jù) 被解碼之后)。在這種情況下,必須進行一定的權(quán)衡,使得只有音頻信號的基本部分以良好 的保真度被表現(xiàn)。通過低數(shù)據(jù)率語音編碼器,實際中一般犧牲語音的頻譜谷區(qū)域并保留共 振峰(共振峰頻率附近并包含共振峰頻率的區(qū)域中的語音的頻率成分),原因是后者在語 音感知中在知覺上是更加重要的。由于認識到可在為了產(chǎn)生編碼語音數(shù)據(jù)的語音采樣的編碼中引入過量的量子化 噪聲(用于解碼器中的隨后的解碼),因此提出通過使用使解碼的語音信號的頻譜谷中的 語音信號和噪聲衰減的自適應(yīng)后濾波器抑制解碼器中的過量的量子化噪聲。在J. -H. Chen and A. GershoZiAdaptive Postfilter for Quality Enhancement of Coded Speech,,,IEEE Transactions on Speech and Audio Processing,vol. 3,no. 1, Jan. 1995 中描述了使用的 自適應(yīng)后濾波器的這種噪聲抑制的例子。已提出通過在變換預測語音/音頻解碼器中使用自適應(yīng)后濾波器抑制過量的量 子化噪聲。圖3是包含這種后濾波器的常規(guī)的變換預測語音/音頻解碼器的框圖。圖3解 碼器的前四個階段與圖2系統(tǒng)的相同標記的階段相同。在圖3解碼器中,如果在恢復的音 頻信號的頻譜谷區(qū)域中存在過量的編碼噪聲,那么,為了進一步抑制這種噪聲,后濾波器段 接收在LPC合成濾波器中產(chǎn)生的時域音頻數(shù)據(jù)的解壓縮的(解碼的)、恢復的采樣并對所述 采樣進行運算(在時域中)。在圖3解碼器中,在常規(guī)上在LPC合成濾波器中使用的LPC參
6數(shù)也被用于后濾波器中,以適當?shù)馗鶕?jù)解碼的信號的頻譜包絡(luò)線(spectral envelope)構(gòu) 建后濾波器。(在圖3所示的類型的解碼器中)實現(xiàn)后濾波器來實現(xiàn)兩種濾波功能(例如, 分別在后濾波器的不同的階段中)是已知的與在接近并包含恢復的音頻信號的共振峰頻 率的頻率區(qū)域中相比在更大程度上抑制恢復的音頻信號的頻譜谷區(qū)域中的過量編碼噪聲 的短期后濾波器、以及使節(jié)距諧波之間的量子化噪聲衰減的長期自適應(yīng)后濾波器。已提出為了增強噪聲音頻數(shù)據(jù)在頻域中實現(xiàn)自適應(yīng)后濾波。例如,Wang, et al. "Frequency Domain Adaptive Postfiltering forEnhancement of Noisy Speech, ”Speech Communication, Vol. 12,pp. 41-56,1993 描述了使用分別被耦合并被配置 為接收輸入音頻數(shù)據(jù)的LPC分析濾波器和DFT (離散傅立葉變換)階段的這種后濾波。DFT 階段在輸入的音頻上執(zhí)行離散的傅立葉變換以產(chǎn)生頻域音頻數(shù)據(jù)。使用LPC分析濾波器的 輸出以確定后濾波器,并且,后濾波器被應(yīng)用(在頻域中)于頻域音頻數(shù)據(jù)的修改版本。但 是,Wang等人沒有解釋或建議在解碼器中實現(xiàn)后濾波器以在頻域中對解碼器中的編碼音頻 數(shù)據(jù)(例如,在變換預測編碼器和其它的音頻數(shù)據(jù)編碼器中產(chǎn)生的編碼音頻數(shù)據(jù))進行運 算,或者如何實現(xiàn)這種后濾波器。在2005年9月6日授權(quán)的美國專利6941263描述了用于(在頻域中)對在解碼 器中解碼(合成)的語音數(shù)據(jù)進行濾波的后濾波器。解碼器在編碼語音數(shù)據(jù)(所述編碼語 音數(shù)據(jù)在預測編碼器中的LPC分析濾波器中經(jīng)受了編碼)上執(zhí)行LPC合成,以產(chǎn)生合成的 語音信號(所述合成的語音信號包含語音數(shù)據(jù)的時域采樣),然后在合成的語音信號上執(zhí) 行時-頻域變換以產(chǎn)生指示合成的語音信號的頻域數(shù)據(jù),然后在頻域數(shù)據(jù)在頻域中執(zhí)行后 濾波,并然后在后濾波的數(shù)據(jù)上執(zhí)行頻-時域變換,以產(chǎn)生后濾波的、合成的語音信號???能希望在不在解碼器中執(zhí)行任何時-頻域變換以為后濾波準備數(shù)據(jù)的情況下在解碼器在 頻域中實現(xiàn)后濾波,以在解碼器中實現(xiàn)對編碼的數(shù)據(jù)的后濾波、并且以產(chǎn)生感知質(zhì)量比常 規(guī)的頻域后濾波可獲得的感知質(zhì)量好的輸出音頻的方式在解碼器中對編碼數(shù)據(jù)在頻域中 實現(xiàn)后濾波。
發(fā)明內(nèi)容
在一類實施例中,本發(fā)明是被配置為通過解碼編碼的音頻數(shù)據(jù)(例如,編碼的語 音數(shù)據(jù))產(chǎn)生解碼的音頻數(shù)據(jù)(例如,解碼的語音數(shù)據(jù))的解碼器。解碼器包含被耦合并 被配置為在頻域中對編碼音頻數(shù)據(jù)(例如,在編碼器中產(chǎn)生并作為解碼器的輸入的編碼輸 入音頻數(shù)據(jù),或者這種編碼輸入音頻數(shù)據(jù)的部分解碼的版本)進行濾波的后濾波器(例如, 頻域自適應(yīng)后濾波器)。解碼器被配置為在不對編碼的音頻數(shù)據(jù)(例如,編碼輸入音頻數(shù)據(jù) 或其部分解碼的版本)執(zhí)行任何時-頻域變換以為后濾波器中的濾波準備數(shù)據(jù)的情況下解 碼輸入的編碼音頻數(shù)據(jù)。在另一類實施例中,本發(fā)明是被配置為通過解碼在變換預測編碼器(例如,變換 預測語音/音頻編碼器)中產(chǎn)生的編碼的音頻數(shù)據(jù)(例如,編碼的語音數(shù)據(jù))來產(chǎn)生解碼 的音頻數(shù)據(jù)(例如,解碼的語音數(shù)據(jù))的解碼器。解碼器包含被耦合和配置為在變換預測 編碼器的固有頻域中對編碼的音頻數(shù)據(jù)(例如,在變換預測編碼器中產(chǎn)生的編碼的輸入音 頻數(shù)據(jù),或者這種編碼輸入音頻數(shù)據(jù)的部分解碼的版本)進行濾波的后濾波器。在任意類的典型的實施例中,由后濾波器執(zhí)行的后濾波通過使其頻譜谷區(qū)域衰減,以去除存在于編碼輸入音頻中的過量的量子化噪聲(當在編碼輸入音頻中存在過量的 量子化噪聲時)、同時保留解碼的音頻信號的共振峰以避免引入不必要的畸變,來提高解碼 的音頻信號的質(zhì)量。在典型的實施例中,當編碼的輸入音頻數(shù)據(jù)指示語音或像語音的音頻 信號并且在以低數(shù)據(jù)率工作的音頻編碼器中產(chǎn)生時,后濾波器是特別有用的。在典型的實 施例中,當編碼的輸入音頻數(shù)據(jù)指示同時包含語音和音樂的混合音頻信號時,后濾波器也 是有用和有利的??梢砸杂布?、固件或軟件實現(xiàn)本發(fā)明的后濾波器。在典型的實施例中,本發(fā)明的解 碼器為或包含可編程數(shù)字信號處理器或者通用或?qū)S糜嬎銠C系統(tǒng),并且,在由數(shù)字信號處 理器或計算機系統(tǒng)執(zhí)行的軟件或固件中實現(xiàn)后濾波器。在其它的實施例中,本發(fā)明的解碼 器為或包含數(shù)字信號處理器(例如,流水線數(shù)字信號處理器),并且,在數(shù)字信號處理器中 的硬件中實現(xiàn)后濾波器。在一些優(yōu)選的實施例中,本發(fā)明的解碼器的后濾波器被耦合和配置為接收LPC殘 差數(shù)據(jù)并在頻域中濾波LPC殘差數(shù)據(jù)。在一些情況下,解碼器包含去量子化器(例如,包含 去量子化器的子系統(tǒng)),并且,LPC殘差數(shù)據(jù)在去量子化器中產(chǎn)生,并且指示去量子化的變 換的LPC殘差。在其它的實施例中,解碼器包含組合的去量子化器和后濾波器,并且,LPC殘 差數(shù)據(jù)指示量子化的變換的LPC殘差。組合的去量子化器和后濾波器接收LPC殘差數(shù)據(jù)并 在頻域中對所述LPC殘差數(shù)據(jù)進行運算,以產(chǎn)生后濾波和去量子化的LPC殘差。在一些優(yōu)選的實施例中,本發(fā)明的解碼器的后濾波器具有傳遞函數(shù)
權(quán)利要求
1.一種解碼器,被配置為響應(yīng)指示編碼輸入音頻數(shù)據(jù)的輸入音頻產(chǎn)生解碼音頻數(shù)據(jù), 所述解碼器包含被耦合并被配置為在頻域中對編碼音頻數(shù)據(jù)進行濾波的后濾波器,其中,所述解碼器 被配置為在不對編碼的音頻數(shù)據(jù)執(zhí)行任何時-頻域變換以為后濾波器中的濾波準備數(shù)據(jù) 的情況下對編碼的輸入音頻數(shù)據(jù)進行解碼。
2.根據(jù)權(quán)利要求1的解碼器,其中,所述后濾波器是頻域自適應(yīng)后濾波器。
3.根據(jù)權(quán)利要求1的解碼器,還包括被耦合為接收所述輸入音頻并被配置為響應(yīng)所述輸入音頻產(chǎn)生部分解碼的音頻數(shù)據(jù) 的第一子系統(tǒng),并且其中,所述后濾波器被耦合和配置為在頻域中對所述部分解碼的音頻 數(shù)據(jù)進行濾波。
4.根據(jù)權(quán)利要求1的解碼器,其中,所述輸入音頻指示編碼的輸入音頻數(shù)據(jù)和量子化 噪聲,解碼的音頻數(shù)據(jù)指示解碼的音頻信號,并且,所述后濾波器被配置為對所述編碼的音 頻數(shù)據(jù)進行濾波,以通過使音頻信號的頻譜谷區(qū)域衰減以在保留解碼的音頻信號的共振峰 的同時去除量子化噪聲中的至少一些來提高解碼的音頻信號的質(zhì)量。
5.根據(jù)權(quán)利要求1的解碼器,其中,編碼的輸入音頻數(shù)據(jù)包含LPC殘差數(shù)據(jù),并且所述 后濾波器被耦合和配置為接收所述LPC殘差數(shù)據(jù)并在頻域中對所述LPC殘差數(shù)據(jù)進行濾 波。
6.根據(jù)權(quán)利要求1的解碼器,其中,所述編碼的輸入音頻數(shù)據(jù)包含量子化的LPC殘差數(shù) 據(jù),并且其中,所述解碼器還包括含有去量子化器的子系統(tǒng),該子系統(tǒng)被配置為響應(yīng)所述輸 入音頻產(chǎn)生去量子化的LPC殘差數(shù)據(jù),并且所述后濾波器與所述子系統(tǒng)耦合并被配置為接 收所述去量子化的LPC殘差數(shù)據(jù)以及在頻域中對所述去量子化的LPC殘差數(shù)據(jù)進行濾波。
7.根據(jù)權(quán)利要求1的解碼器,其中,所述編碼的輸入音頻數(shù)據(jù)包含量子化的LPC殘差數(shù) 據(jù),并且,所述解碼器還包含被配置為從所述輸入音頻提取量子化的LPC殘差數(shù)據(jù)的第一子系統(tǒng),并且其中,所述后濾波器是被耦合并被配置為響應(yīng)量子化的LPC殘差數(shù)據(jù)、包括通過 在頻域中對所述量子化的LPC殘差數(shù)據(jù)進行濾波來產(chǎn)生去量子化的后濾波的LPC殘差數(shù)據(jù) 的所述解碼器的組合的去量子化和后濾波子系統(tǒng)。
8.根據(jù)權(quán)利要求1的解碼器,其中,所述后濾波器具有傳遞函數(shù)
9.根據(jù)權(quán)利要求8的解碼器,其中,增益濾波器G為
10.根據(jù)權(quán)利要求8的解碼器,還包括被配置為響應(yīng)所述輸入音頻產(chǎn)生去量子化的變 換的LPC殘差的子系統(tǒng),并且其中,所述后濾波器與所述子系統(tǒng)耦合并被配置為將與所述去量子化的變換的LPC殘差的頻率ω關(guān)聯(lián)的各數(shù)據(jù)值乘以值
11.一種解碼器,被配置為響應(yīng)指示在具有固有頻域的變換預測編碼器中產(chǎn)生的編碼 的輸入音頻數(shù)據(jù)的輸入音頻產(chǎn)生解碼的音頻數(shù)據(jù),所述解碼器包含被耦合和配置為在所述變換預測編碼器的固有頻域中對編碼的音頻數(shù)據(jù)進行濾波的 后濾波器。
12.根據(jù)權(quán)利要求11的解碼器,其中,所述后濾波器是頻域自適應(yīng)后濾波器。
13.根據(jù)權(quán)利要求11的解碼器,還包括被耦合為接收輸入音頻并被配置為響應(yīng)所述輸入音頻產(chǎn)生部分解碼的音頻數(shù)據(jù)的第 一子系統(tǒng),并且其中,所述后濾波器被耦合和配置為在所述變換預測編碼器的固有頻域中 對所述部分解碼的音頻數(shù)據(jù)進行濾波。
14.根據(jù)權(quán)利要求11的解碼器,其中,所述輸入音頻指示編碼的輸入音頻數(shù)據(jù)和量子 化噪聲,以及解碼的音頻數(shù)據(jù)指示解碼的音頻信號,并且,所述后濾波器被配置為對所述編 碼的音頻數(shù)據(jù)進行濾波,以通過使音頻信號的頻譜谷區(qū)域衰減以在保留解碼的音頻信號的 共振峰的同時去除量子化噪聲中的至少一些來提高解碼的音頻信號的質(zhì)量。
15.根據(jù)權(quán)利要求11的解碼器,其中,編碼的輸入音頻數(shù)據(jù)包含LPC殘差數(shù)據(jù),并且所 述后濾波器被耦合和配置為接收LPC殘差數(shù)據(jù)并在頻域中對所述LPC殘差數(shù)據(jù)進行濾波。
16.根據(jù)權(quán)利要求11的解碼器,其中,所述編碼的輸入音頻數(shù)據(jù)包含量子化的LPC殘 差數(shù)據(jù),并且其中,所述解碼器還包括含有去量子化器的子系統(tǒng),該子系統(tǒng)被配置為響應(yīng)所 述輸入音頻產(chǎn)生去量子化的LPC殘差數(shù)據(jù),并且所述后濾波器與所述子系統(tǒng)耦合并被配置 為接收所述去量子化的LPC殘差數(shù)據(jù)以及在頻域中對所述去量子化的LPC殘差數(shù)據(jù)進行濾 波。
17.根據(jù)權(quán)利要求11的解碼器,其中,所述編碼的輸入音頻數(shù)據(jù)包含量子化的LPC殘差 數(shù)據(jù),并且,所述解碼器還包含被配置為從所述輸入音頻提取所述量子化的LPC殘差數(shù)據(jù)的第一子系統(tǒng),并且其中,所述后濾波器是被耦合并被配置為響應(yīng)量子化的LPC殘差數(shù)據(jù)、包括通過 在頻域中對所述量子化的LPC殘差數(shù)據(jù)進行濾波來產(chǎn)生去量子化的后濾波的LPC殘差數(shù)據(jù) 的所述解碼器的組合的去量子化和后濾波子系統(tǒng)。
18.根據(jù)權(quán)利要求11的解碼器,其中,所述后濾波器具有傳遞函數(shù)G·
19.根據(jù)權(quán)利要求18的解碼器,其中,所述增益濾波器G為
20.根據(jù)權(quán)利要求18的解碼器,還包括被配置為響應(yīng)所述輸入音頻產(chǎn)生去量子化的變 換的LPC殘差的子系統(tǒng),并且其中,所述后濾波器與所述子系統(tǒng)耦合并被配置為將與所述 去量子化的變換的LPC殘差的頻率ω關(guān)聯(lián)的各數(shù)據(jù)值乘以值.
全文摘要
被配置為產(chǎn)生解碼音頻數(shù)據(jù)(例如,解碼的語音數(shù)據(jù))并且包含被耦合并被配置為在頻域中對編碼音頻數(shù)據(jù)進行濾波的后濾波器的解碼器,用于在解碼器中對編碼的音頻數(shù)據(jù)進行頻率后過濾的方法,以及用于在解碼器中對編碼的音頻數(shù)據(jù)進行解碼、包括通過在解碼器中在頻域中對編碼音頻數(shù)據(jù)進行后濾波的方法。在一些實施例中,解碼器被配置為在不對編碼的音頻數(shù)據(jù)執(zhí)行任何時-頻域變換以為后濾波準備數(shù)據(jù)的情況下解碼輸入的編碼音頻。一般地,后濾波通過使音頻信號的頻譜谷區(qū)域衰減以在保留解碼的音頻信號的共振峰的同時去除存在于編碼的輸入音頻中的過量的量子化噪聲以避免引入不必要的畸變來提高解碼的音頻信號的質(zhì)量。
文檔編號G10L21/02GK102099857SQ200980127881
公開日2011年6月15日 申請日期2009年7月14日 優(yōu)先權(quán)日2008年7月18日
發(fā)明者俞容山 申請人:杜比實驗室特許公司