等的共同比例因子對包絡(luò)進(jìn)行 適當(dāng)按比例調(diào)整而得到每個頻譜分量k的頻散量度(dispersion measure) 32。頻譜分量k 處的這些頻散量度可充當(dāng)每一頻譜分量k的概率分布估計的參數(shù)化的參數(shù)。例如,針對所 有k,p (k,i)可為f (i,1 (k)),其中,1 (i)為頻譜分量k處確定的頻散量度,其中,對于每一 固定l,f(i,1)為變量i的適當(dāng)函數(shù),例如,如下面所定義的單調(diào)函數(shù),針對包括零的正值i 界定的高斯(Gaussian)或拉普拉斯(Laplace)函數(shù),而1如將在下文以較精確用詞所概述 的為函數(shù)參數(shù),其測量函數(shù)的"陡度"或"寬度"。通過使用經(jīng)參數(shù)化的參數(shù)化,量化與熵編 碼級18因此能夠?qū)㈩l譜的頻譜值有效地熵編碼進(jìn)數(shù)據(jù)流22。如根據(jù)下文更詳細(xì)給出的描 述而變得明顯的,可單純以分析方式和/或在不需要相同頻譜26的不同頻譜分量的頻譜值 之間的相關(guān)性的情況下(即獨立于與相同時刻相關(guān)的不同頻譜分量的頻譜值)來實現(xiàn)對概 率分布估計28的確定。量化與熵編碼級18因此可并行地分別對經(jīng)量化頻譜值或量值水平 執(zhí)行熵編碼。實際熵編碼轉(zhuǎn)而可以是算術(shù)編碼或可變長度編碼,或某一其它形式的熵編碼, 例如,概率區(qū)間劃分熵編碼等。實際上,量化與熵編碼級18使用某一頻譜分量k的概率分 布估計28來對該頻譜分量k處的每一頻譜值進(jìn)行熵編碼,使得在由概率分布估計28指示 的概率更高的頻譜分量k處的頻譜值的可能值的域的部分內(nèi),各個頻譜值k的編碼進(jìn)數(shù)據(jù) 流22的位消耗更低,而在由概率分布估計28指示的概率更低的可能值的域的部分內(nèi),位消 耗更高。在算術(shù)編碼的情況下,例如,可使用基于表格的算術(shù)編碼。在可變長度編碼的情況 下,可根據(jù)由概率分布估計器14針對各個頻譜分量k確定的概率分布估計28,由量化與熵 編碼級選擇并且應(yīng)用將可能值映射至碼字的不同碼字表。
[0046] 圖2示出了圖1的頻譜確定器16的可能實現(xiàn)方式。根據(jù)圖2,頻譜確定器16包括 比例因子確定器34、變換器36以及頻譜塑形器38。變換器36和頻譜塑形器38在頻譜確 定器16的輸入端與輸出端之間彼此串聯(lián)連接,頻譜確定器16經(jīng)由變換器36和頻譜塑形器 38而連接在圖1中的輸入端20與量化與熵編碼級18之間。比例因子確定器34又連接于 LP分析器12與頻譜塑形器38的另一輸入端之間(參見圖1)。
[0047] 對比例因子確定器34進(jìn)行配置,以使用線性預(yù)測系數(shù)信息來確定比例因子。變換 器36在頻譜上分解其接收的信號以獲得原始頻譜。如上文概述的,傳入信號可為輸入端 20處的原始音頻信號或(例如)原始音頻信號的預(yù)加強(qiáng)版本。如上文還已概述的,變換器 36可在內(nèi)部使信號經(jīng)歷變換,以使用重迭部分逐部分地進(jìn)行窗化,分別地變換每一窗化部 分。如上文已指示的,MDCT可用于變換。即,變換器36針對每個頻譜分量k輸出一個頻譜 值x' k,且將頻譜塑形器38配置成通過使用比例因子對頻譜按比例調(diào)整而在頻譜上對此 原始頻譜進(jìn)行塑形,即通過使用由比例因子確定器34輸出的比例因子s k來對每一原始頻 譜值x' k進(jìn)行按比例調(diào)整以便獲得相應(yīng)頻譜值x k,該各個頻譜值xk接著在圖1的級18中 經(jīng)歷量化與熵編碼。
[0048] 比例因子確定器34確定比例因子時的頻譜分辨率不必與由頻譜分量k界定的分 辨率一致。例如,將頻譜分量感知機(jī)動地分組至頻譜群組(諸如,bark頻帶)可形成確定 比例因子(即,對變換器36所輸出的頻譜的頻譜值進(jìn)行加權(quán)的頻譜權(quán)重)的頻譜分辨率。
[0049] 將該比例因子確定器34配置成確定這些比例因子,使得這些比例因子表示或近 似為取決于由該線性預(yù)測系數(shù)信息界定的線性預(yù)測合成濾波器的反向濾波器的傳遞函數(shù)。 例如,可將比例因子確定器34配置成使用從LP分析器12獲得的呈(例如)量化形式的 線性預(yù)測系數(shù)(其中,在解碼側(cè)經(jīng)由數(shù)據(jù)流22也可獲得這些線性預(yù)測系數(shù))作為LPC至 MDCT轉(zhuǎn)換的基礎(chǔ),該轉(zhuǎn)換又可涉及0DFT。當(dāng)然還存在替代方案。在上文概述的圖1的音 頻編碼器為基于感知線性預(yù)測的音頻編碼器的替代方案的情況下,可將比例因子確定器 34配置成在使用(例如)0DFT對頻譜因子進(jìn)行轉(zhuǎn)換之前首先執(zhí)行對LPC的感知機(jī)動加權(quán) (perceptually motivated weighting)。然而,還可存在其它可能性。如下文將更詳細(xì)地 概述的,由頻譜塑形器38進(jìn)行的頻譜按比例調(diào)整所產(chǎn)生的濾波的傳遞函數(shù)可經(jīng)由由比例 因子確定器34執(zhí)行的比例因子確定而取決于由線性預(yù)測系數(shù)信息界定的線性預(yù)測合成濾 波器1/A(z)的反向濾波器,使得該傳遞函數(shù)為傳遞函數(shù)1/A(k*z)的倒數(shù),其中,此處k表 示常數(shù),該常數(shù)可(例如)為〇? 92。
[0050] 在基于線性預(yù)測的音頻編碼器充當(dāng)基于感知線性預(yù)測的音頻編碼器的情況下,為 了更好地理解在頻譜確定器(一方面)與概率分布估計器14(另一方面)的功能性之間的 相互關(guān)系以及此關(guān)系導(dǎo)致量化與熵編碼級18的有效操作的方式,參考圖3a及圖3b。圖3a 示出了原始頻譜40。此處,其是典型的由預(yù)加強(qiáng)濾波器的傳遞函數(shù)加權(quán)的音頻信號的頻譜。 為了更精確,圖3a示出了按頻譜分量或頻譜線k繪制的頻譜40的量值。在相同圖表中,圖 3a示出了線性預(yù)測合成濾波器的傳遞函數(shù)A (z)乘以預(yù)加強(qiáng)濾波器24的傳遞函數(shù),所得乘 積表示為42。如可見到的,函數(shù)42近似為頻譜40的包絡(luò)或粗略形狀。在圖3a中,示出了 線性預(yù)測合成濾波器的感知機(jī)動修改,諸如在上文提及的例示性情況下的A (0. 92z)。此"感 知模型"由附圖標(biāo)記44表示。因此函數(shù)44通過至少將頻譜遮擋(spectral occlusion)考 慮在內(nèi)來表示音頻信號的掩蔽閾值(masking threshold)的簡化估計。頻譜因子確定器34 確定比例因子,以便近似得出感知模型44的倒數(shù)。圖3b中示出了將圖3a的函數(shù)40至44 與感知模型44的倒數(shù)相乘的結(jié)果。例如,46示出了將頻譜40與44的倒數(shù)相乘的結(jié)果,并 且因此對應(yīng)于在編碼器10充當(dāng)如上文描述的基于感知線性預(yù)測的編碼器的情況下由頻譜 塑形器38輸出的感知加權(quán)頻譜。由于使函數(shù)44與函數(shù)44的倒數(shù)相乘得到常數(shù)函數(shù),所以 所得乘積在圖3b中描繪為平坦的,參見50。
[0051] 現(xiàn)轉(zhuǎn)向概率分布估計器14,該概率分布估計器14還能夠訪問如上所述的線性預(yù) 測系數(shù)信息。因此,估計器14能夠計算將函數(shù)42與函數(shù)44的倒數(shù)相乘而得到的函數(shù)48。 如從圖3b可看到的,此函數(shù)48可用作對頻譜塑形器38所輸出的預(yù)濾波46的包絡(luò)或粗略 形狀的估計。
[0052] 因此,概率分布估計器14可如圖4中例示的進(jìn)行操作。具體地,概率分布估計器 14可使界定線性預(yù)測合成濾波器1/A(z)的線性預(yù)測系數(shù)經(jīng)歷感知加權(quán)64,使得這些線性 預(yù)測系數(shù)對應(yīng)于經(jīng)感知修改的線性預(yù)測合成濾波器1/A(k ? z)。未經(jīng)加權(quán)的線性預(yù)測系數(shù) 和經(jīng)加權(quán)的線性預(yù)測系數(shù)均分別經(jīng)歷LPC至頻譜權(quán)重轉(zhuǎn)換60和62,并且針對每個頻譜分 量k使該結(jié)果做除法運算。所得商視情況經(jīng)歷某一參數(shù)求導(dǎo)68,其中針對頻譜分量k的商 分別地(即,針對每一個k)經(jīng)歷某一映射函數(shù),從而產(chǎn)生表示(例如)概率分布估計的頻 散的量度的概率分布參數(shù)。為了更精確,應(yīng)用于未經(jīng)加權(quán)的和經(jīng)加權(quán)的線性預(yù)測系數(shù)的LPC 至頻譜權(quán)重轉(zhuǎn)換60、62產(chǎn)生用于頻譜分量k的頻譜權(quán)重s k及s' k。如上文已指示,可以以 比頻譜分量k本身所界定的頻譜分辨率更低的頻譜分辨率來執(zhí)行轉(zhuǎn)換60、62,但(例如)可 將使用內(nèi)插來使所得商q k在頻譜分量k上平滑。參數(shù)求導(dǎo)接著通過(例如)使用對于所有 k共享的比例因子來按比例調(diào)整所有qk而產(chǎn)生每個頻譜分量k的概率分布參數(shù) k。量化 與熵編碼級18接著可使用這些概率分布參數(shù)Jik來對量化的經(jīng)頻譜塑形的頻譜進(jìn)行有效 地熵編碼。具體地,由于為包絡(luò)頻譜值x k或至少包絡(luò)頻譜值xk的量值的概率分布估計 的頻散的量度,所以量化與熵編碼級18可使用可參數(shù)化函數(shù)例如上文提及的f(i,l(k)), 以通過使用作為可參數(shù)化函數(shù)的設(shè)定(即,作為l(k))來確定每一頻譜分量k的概率 分布估計28。較佳地,可參數(shù)化函數(shù)的參數(shù)化使得概率分布參數(shù)(例如,l(k))實際上為對 概率分布估計的頻散的量度,即概率分布參數(shù)測量概率分布可參數(shù)化函數(shù)的寬度。在下文 進(jìn)一步概述的特定實施例中,將拉普拉斯分布用作可參數(shù)化函數(shù),例如f (i,1 (k))。
[0053] 參看圖1,應(yīng)注意,概率分布估計器14可另外將信息插入數(shù)據(jù)流22中,這樣做使得 在解碼側(cè),與僅基于LPC信息提供的質(zhì)量相比,針對單個頻譜分量k的概率分布估計28的 質(zhì)量增加。具體地,根據(jù)下文進(jìn)一步概述的這些特定例示性地描述的實施細(xì)節(jié),在表示變換 編碼激勵的頻譜26諸如用變換函數(shù)進(jìn)行濾波而得到頻譜對應(yīng)于感知模型的倒數(shù)或線性預(yù) 測合成濾波器的反向濾波器的情況下,概率分布估計器14可使用長期預(yù)測以便獲得對頻 譜26的包絡(luò)或形狀的頻譜上更精細(xì)的估計30。
[0054] 例如,參見圖5a至圖5c來例示概率分布估計器14的后一可選功能。如同圖3a, 圖5a示出了原始音頻信號頻譜40和包括預(yù)加強(qiáng)的LPC模型A (z)。即,具有原始信號40及 其包括預(yù)加強(qiáng)的LPC包絡(luò)42。圖5b顯示了 LTP梳形濾波器70,作為由概率分布估計器14 執(zhí)行的LTP分析的輸出的實例,LTP梳形濾波器70, S卩,例如,通過描述谷峰比率a/b的值 LTP增益和界定梳形函數(shù)70的峰值之間的間距或距離(S卩,c)的參數(shù)LTP滯后來參數(shù)化的 頻譜分量k上的梳形函數(shù)。概率分布估計器14可確定剛剛提及的LTP參數(shù),使得將LTP梳 形函數(shù)70與對頻譜26的基于線性預(yù)測系數(shù)的估計30相乘更接近地估計實際頻譜26。圖 5c中例示性示出了將LTP梳形函數(shù)70與LPC模型42相乘,且可看出,LTP梳