使用改進的概率分布估計的基于線性預(yù)測的音頻編碼的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及基于線性預(yù)測的音頻編碼,并且具體地,涉及使用頻譜編碼的基于線 性預(yù)測的音頻編碼。
【背景技術(shù)】
[0002] 用于在頻域中進行量化和編碼的經(jīng)典方法為獲取信號的(重迭)窗,執(zhí)行時間頻 率變換,應(yīng)用感知模型(perc印tual model),以及通過熵編碼器(諸如算術(shù)編碼器)來量化 各個頻率[1]。感知模型基本上為加權(quán)函數(shù),將其與頻譜線相乘,使得每一加權(quán)頻譜線中的 誤差具有相等的感知影響。因此能夠以相同準(zhǔn)確度量化所有的加權(quán)線,并且總體準(zhǔn)確度確 定感知質(zhì)量與位消耗之間的折衷。
[0003] 在USAC的AAC及頻域模式(非TCX)中,逐頻帶地界定感知模型,使得一組頻譜線 (譜帶)將具有相同權(quán)重。這些權(quán)重稱作比例因子,這是因為這些權(quán)重界定了頻帶通過什么 因子進行按比例調(diào)整(scale)。此外,對這些比例因子進行差分編碼。
[0004] 在TCX域中,這些權(quán)重并未使用比例因子來編碼,而是通過界定頻譜包絡(luò)的 LPC(線性預(yù)測系數(shù),linear prediction coefficient)模型[2]來進行編碼,頻譜包絡(luò)為 頻譜的總體形狀。使用LPC是因為其允許在TCX與ACELP之間平滑切換。然而,LPC并不 能很好地對應(yīng)于感知模型(LPC應(yīng)更加平滑),從而將稱作加權(quán)的處理應(yīng)用于LPC,使得被加 權(quán)的LPC近似地對應(yīng)于所期望的感知模型。
[0005] 在USAC的TCX域中,頻譜線由算術(shù)編碼器來編碼。算術(shù)編碼器是基于將概率分 配給信號的所有可能組配,使得高概率值可用數(shù)目較少的位進行編碼,使得位消耗最小 化。為了估計頻譜線的概率分布,編碼解碼器(codec)使用概率模型,該概率模型在時間頻 率空間中基于先前已編碼的線來預(yù)測信號分布。先前的線被稱為待編碼的當(dāng)前線的環(huán)境 (context) [3]〇
[0006] 最近,NTT建議一種用于改進算術(shù)編碼器的環(huán)境的方法(比較[4])。該方法是基 于使用LTP來確定諧波線的近似位置(梳形濾波器(comb-filter))并且重新布置這些頻 譜線,使得根據(jù)環(huán)境的量值(magnitude)預(yù)測更有效率。
[0007] 通常而言,概率分布估計越好,則通過熵編碼實現(xiàn)的壓縮就越有效率。有利的是即 將獲得能夠?qū)崿F(xiàn)質(zhì)量與使用上文概述的技術(shù)中的任一種可獲得的質(zhì)量類似、但復(fù)雜性降低 的概率分布估計的原理。
【發(fā)明內(nèi)容】
[0008] 因此,本發(fā)明的目標(biāo)是提供具有改進的特性的基于線性預(yù)測的音頻編碼方案。該 目標(biāo)由獨立權(quán)利要求的主題來實現(xiàn)。
[0009] 本發(fā)明的一個基本發(fā)現(xiàn)為:可通過使用針對該多個頻譜分量中的每個頻譜分量根 據(jù)線性預(yù)測系數(shù)信息確定的概率分布估計對包括多個頻譜分量的頻譜進行編碼來改進基 于線性預(yù)測的音頻編碼。具體地,總能獲得該線性預(yù)測系數(shù)信息。因此,該信息可用于在編 碼側(cè)和解碼側(cè)確定概率分布估計。該概率分布估計的確定可通過使用例如在該多個頻譜分 量處對該概率分布估計的適當(dāng)參數(shù)化以計算上簡單的方式來實施??傊伸鼐幋a提供的 編碼效率與使用環(huán)境選擇達到的概率分布估計兼容,但概率分布估計的求導(dǎo)較不復(fù)雜。例 如,該求導(dǎo)可單純地以分析方式進行和/或不需要關(guān)于鄰近頻譜線的屬性的任何信息,諸 如在空間環(huán)境選擇的情況下的鄰近頻譜線的先前被編碼/解碼的頻譜值。例如,此繼而使 計算處理的并行化更為容易。此外,可需要更少的內(nèi)存要求和更少的內(nèi)存訪問。
[0010] 根據(jù)本申請的一個實施例,頻譜(其頻譜值通過使用如剛剛概述地確定的概率估 計進行熵編碼)可以是使用線性預(yù)測系數(shù)信息獲得的變換編碼激勵。
[0011] 根據(jù)本申請的一個實施例,例如,頻譜卻是在感知加權(quán)域中界定的變換編碼激勵。 即,使用所確定概率分布估計來熵編碼的頻譜對應(yīng)于使用變換函數(shù)來預(yù)濾波的音頻信號頻 譜,該變換函數(shù)對應(yīng)于由線性預(yù)測系數(shù)信息界定的感知加權(quán)的線性預(yù)測合成濾波器,并且 針對多個頻譜分量中的每個頻譜分量,確定多個分布參數(shù),使得概率分布參數(shù)在頻譜上遵 循函數(shù)(例如,為該函數(shù)的按比例調(diào)整版本),該函數(shù)取決于該線性預(yù)測合成濾波器的傳遞 函數(shù)(transfer function)與該線性預(yù)測合成濾波器的感知加權(quán)修改的傳遞函數(shù)的倒數(shù) (inverse)的乘積。對于多個頻譜分量中的每個頻譜分量,多個分布估計則為通過相應(yīng)頻譜 分量的概率分布參數(shù)來參數(shù)化的可參數(shù)化函數(shù)。而且,總能獲得線性預(yù)測系數(shù)信息,并且概 率分布參數(shù)的求導(dǎo)可實施為單純的分析處理和/或不需要在該頻譜的不同頻譜分量處的 頻譜值之間的任何互依性的處理。
[0012] 根據(jù)又一個實施例,替代地或額外地確定概率分布參數(shù),使得概率分布參數(shù)在頻 譜上遵循一個函數(shù),該函數(shù)以乘法方式(multiplicatively)取決于頻譜精細結(jié)構(gòu),該頻譜 精細結(jié)構(gòu)又是使用長期預(yù)測(LTP,long term prediction)來確定。而且,在一些基于線性 預(yù)測的編碼解碼器中,總能獲得LTP信息,并且除此之外,概率分布參數(shù)的確定單純地以分 析方式執(zhí)行和/或不需要頻譜的不同頻譜分量的頻譜值的編碼之間的互依性仍是可行的。 當(dāng)LTP使用與感知變換編碼激勵編碼組合時,適度增加復(fù)雜性,則編碼效率得進一步改進。
【附圖說明】
[0013] 有利的實現(xiàn)方式和實施例為從屬權(quán)利要求的主題。下文關(guān)于附圖進一步描述本申 請的優(yōu)選實施例,其中,
[0014] 圖1示出了根據(jù)實施例的基于線性預(yù)測的音頻編碼器的框圖;
[0015] 圖2示出了根據(jù)實施例的圖1的頻譜確定器的框圖;
[0016] 圖3a示出了當(dāng)使用感知編碼來實施圖1和圖2中所示元件的操作模式時在對該 操作模式的描述中出現(xiàn)的不同傳遞函數(shù);
[0017] 圖3b示出了圖3a的函數(shù),然而該函數(shù)使用感知模型的倒數(shù)來加權(quán);
[0018] 圖4示出了例示根據(jù)使用感知編碼的實施例的圖1的概率分布估計器14的內(nèi)部 操作的框圖;
[0019] 圖5a示出了例示在預(yù)加強濾波(pre-emphasis filtering)之后的原始音頻信號 及其估計包絡(luò)的曲線圖;
[0020] 圖5b示出了根據(jù)實施例的用于更接近地估計包絡(luò)的LTP函數(shù)的實例;
[0021] 圖5c示出了例示通過將圖5b的LTP函數(shù)應(yīng)用于圖5a的實例的包絡(luò)估計結(jié)果的 曲線圖;
[0022] 圖6示出了在使用感知編碼和LTP處理的另一實施例中概率分布估計器14的內(nèi) 部操作的框圖;
[0023] 圖7示出了根據(jù)一個實施例的基于線性預(yù)測的音頻解碼器的框圖;
[0024] 圖8示出了根據(jù)另一實施例的基于線性預(yù)測的音頻解碼器的框圖;
[0025] 圖9示出了根據(jù)一個實施例的圖8的濾波器的框圖;
[0026] 圖10示出了根據(jù)一個實施例的定位于量化與熵編碼級和概率分布估計器14處的 圖1的編碼器的一部分的更詳細的結(jié)構(gòu)的框圖;以及
[0027] 圖11示出了根據(jù)一個實施例的(例如)圖7和圖8的基于線性預(yù)測的音頻解碼 器內(nèi)的一部分的框圖,其定位于基于線性預(yù)測的音頻解碼器的與在編碼側(cè)圖10所位于的 部分對應(yīng)的部分處,即位于概率分布估計器102和熵解碼與解量化級104處。
【具體實施方式】
[0028] 在描述本申請的各種實施例之前,對照本申請的說明書的引言部分中所指示的背 景來例示性地論述作為本申請的基礎(chǔ)的思想。不應(yīng)將由于與具體比較技術(shù)例如USAC的比 較的特定特征視為對本申請及其實施例的范圍的限制。
[0029] 在用于算術(shù)編碼的USAC方法中,環(huán)境基本上預(yù)測了隨后的線的量值分布。即,在 編碼/解碼的同時在頻譜維度中掃描頻譜線或頻譜分量,并且根據(jù)先前編碼/解碼的頻譜 值來持續(xù)地預(yù)測量值分布。然而,LPC已在無需預(yù)測的情況下明確地編碼相同信息。因此, 使用LPC代替環(huán)境應(yīng)帶來類似的結(jié)果,但計算復(fù)雜性更低或至少具有實現(xiàn)更低復(fù)雜性的可 能性。實際上,由于在低的位速率下,頻譜基本上由" 1"和"0"組成,所以環(huán)境將幾乎總是 非常稀少并且缺乏有用信息。因此,因為用于概率分布估計的鄰近的已被編碼/解碼的頻 譜值的模板僅稀少地填充有有用信息,所以理論上LPC實際上應(yīng)是好得多的用于量值估計 的源。此外,在編碼器和解碼器處都可獲得LPC信息,因此,就位消耗而言,其達到零成本。
[0030] LPC模型僅界定頻譜包絡(luò)形狀,即每條線的相對量值,而非絕對量值。為了界定單 條線的概率分布,我們總是需要絕對量值,即信號方差(或類似量度)的值。大多數(shù)基于 LPC的頻譜量化器模型的基本部分因此應(yīng)為對LPC包絡(luò)的按比例調(diào)整,使得達到所期望的 方差(并且因此達到所期望的位消耗)。此按比例調(diào)整通常應(yīng)在編碼器和解碼器兩者處執(zhí) 行,這是因為每條線的概率分布當(dāng)時取決于按比例調(diào)整的LPC。
[0031] 如上文所描述,可使用感知模型(經(jīng)加權(quán)的LPC)來界定感知模型,S卩,可在感知域 中執(zhí)行量化,使得每條頻譜線處的預(yù)期量化誤差近似導(dǎo)致相等量的感知失真。因此,倘若如 此,則還通過使LPC模型與如下文界定的被加權(quán)的LPC相乘來將LPC模型變換為感知域。在 下文描述的實施例中,常常假設(shè)將LPC包絡(luò)變換為感知域。
[0032] 因此,可能針對每條頻譜線應(yīng)用獨立概率模型。合理的是假設(shè)頻譜線不具有可預(yù) 測的相位相關(guān)性,因而僅對量值模型化就已足夠。由于可假設(shè)LPC對量值進行有效地編碼, 所以具有基于環(huán)境的算術(shù)編碼器很可能不會改進量值估計的效率。
[0033] 因此,有可能應(yīng)用基于環(huán)境的熵編碼器,使得該環(huán)境取決