于LPC包絡(luò)或甚至由LPC 包絡(luò)組成。
[0034] 除了 LPC包絡(luò)之外,LTP還可用以推斷包絡(luò)信息。畢竟,在頻域中,LTP可對應(yīng)于梳 形濾波器。下文進一步論述一些實際細節(jié)。
[0035] 在已解釋一些想法(這些想法引起作為在下文進一步描述的實施例的基礎(chǔ)的思 想)之后,現(xiàn)關(guān)于圖1開始對這些實施例的描述,圖1示出了根據(jù)本申請的實施例的基于線 性預(yù)測的音頻編碼器的實施例。圖1的基于線性預(yù)測的音頻編碼器通常使用附圖標記10來 指示,且包括線性預(yù)測分析器12、概率分布估計14、頻譜確定器16以及量化與熵編碼級18。 圖1的基于線性預(yù)測的音頻編碼器10在(例如)輸入端20處接收待編碼的音頻信號,并 且輸出數(shù)據(jù)流22,該數(shù)據(jù)流22相應(yīng)地具有編碼于其中的音頻信號。如圖1中所示,LP分析 器12和頻譜確定器16直接或間接地與輸入端20耦接。概率分布估計器14耦接在LP分 析器12與量化與熵編碼級18之間,并且該量化與熵編碼級18轉(zhuǎn)而耦接至頻譜確定器16 的輸出端。如可在圖1中看出的,LP分析器12和量化與熵編碼級18有助于形成/產(chǎn)生數(shù) 據(jù)流22。如將在下文更詳細地描述的,編碼器10可視情況包含預(yù)加強濾波器24,其可耦接 于輸入端20與LP分析器12和/或頻譜確定器16之間。此外,頻譜確定器16可視情況耦 接至LP分析器12的輸出端。
[0036] 具體地,對LP分析器12進行配置,以基于在輸入端20處傳入(inbound)的音頻信 號來確定線性預(yù)測系數(shù)信息。如圖1中所描繪的,LP分析器12可直接在輸入端20處對音 頻信號執(zhí)行線性預(yù)測分析,或?qū)σ纛l信號的某一經(jīng)修改版本(諸如,如該音頻信號的通過 預(yù)加強濾波器24獲得的預(yù)加強版本)執(zhí)行線性預(yù)測分析。LP分析器12的操作模式可(例 如)涉及:傳入信號的窗化(windowing),以便獲得要經(jīng)LP分析的信號的窗化部分的序列; 自相關(guān)確定,以便確定每一窗化部分的自相關(guān);以及滯后窗化,其為可選的,用于將滯后窗 函數(shù)應(yīng)用于自相關(guān)。接著可對自相關(guān)或滯后窗輸出(即,窗化的自相關(guān)函數(shù))執(zhí)行線性預(yù) 測參數(shù)估計。線性預(yù)測參數(shù)估計可(例如)涉及對(滯后窗化的)自相關(guān)執(zhí)行文納-列文 遜-杜賓(Wiener-Levinson-Durbin)或其它合適算法,以便得到每個自相關(guān)的線性預(yù)測系 數(shù),即要經(jīng)LP分析的信號的每個窗化部分的線性預(yù)測系數(shù)。即,在LP分析器12的輸出端, 得到LPC系數(shù),如下文進一步描述,LPC系數(shù)由概率分布估計器14使用并且視情況由頻譜 確定器16使用??蓪P分析器12配置成對用于插入數(shù)據(jù)流22中的線性預(yù)測系數(shù)進行量 化??稍诓煌诰€性預(yù)測系數(shù)域的另一域中,諸如在線頻譜對或線頻譜頻率域中,執(zhí)行對線 性預(yù)測系數(shù)的量化??蓪⒔?jīng)量化的線性預(yù)測系數(shù)編碼進數(shù)據(jù)流22中。實際上由概率分布估 計器14使用和視情況由頻譜確定器16使用的線性預(yù)測系數(shù)信息可將量化損耗考慮在內(nèi), 艮P,可以是經(jīng)由數(shù)據(jù)流無損耗傳輸?shù)慕?jīng)量化版本。即,后者實際上可將由線性預(yù)測分析器12 獲得的經(jīng)量化線性預(yù)測系數(shù)用作線性預(yù)測系數(shù)信息。僅為了完整性,應(yīng)注意,存在由線性預(yù) 測分析器12執(zhí)行線性預(yù)測系數(shù)信息確定的大量可能性。例如,可使用文納-列文遜-杜賓 算法之外的其它算法。此外,可基于要經(jīng)LP分析的信號的頻譜分解來獲得要經(jīng)LP分析的 信號的局部自相關(guān)的估計。例如,在W0 2012/110476 A1中,描述了可通過以下操作獲得的 自相關(guān):將要經(jīng)LP分析的信號窗化;使每個窗化部分經(jīng)歷MDCT ;確定每個MDCT頻譜的功率 譜;及執(zhí)行逆0DFT,以從MDCT域轉(zhuǎn)變至自相關(guān)的估計。概括而言,LP分析器12提供線性預(yù) 測系數(shù)信息,并且數(shù)據(jù)流22傳遞或包含此線性預(yù)測系數(shù)信息。例如,數(shù)據(jù)流22以由剛剛提 及的窗化部分速率確定的時間分辨率來傳遞線性預(yù)測系數(shù)信息,其中,如本領(lǐng)域中所知的, 窗化部分可彼此重迭,諸如重迭50 %。
[0037] 就預(yù)加強濾波器24而言,應(yīng)注意,可(例如)使用FIR濾波來實現(xiàn)預(yù)加強濾波器 24。預(yù)加強濾波器24可(例如)具有高通傳遞函數(shù)。根據(jù)實施例,將預(yù)加強濾波器24體 現(xiàn)為n階高通濾波器,例如,H(z) = 1 - a z'其中,a設(shè)定為(例如)〇. 68。
[0038] 接下來描述頻譜確定器。將頻譜確定器16配置成基于輸入端20處的音頻信號來 確定包括多個頻譜分量的頻譜。該頻譜將描述音頻信號。類似于線性預(yù)測分析器12,頻譜 確定器16可直接對音頻信號20進行操作,或?qū)σ纛l信號20的某一修改版本例如音頻信號 20的預(yù)加強濾波版本進行操作。頻譜確定器16可使用任何變換,例如重疊變換(lapped transform)或甚至臨界采樣重疊變換(例如,MDCT),以確定頻譜,但還存在其它可能性。 艮P,頻譜確定器16可使要經(jīng)頻譜分解的信號經(jīng)歷窗化,以便獲得窗化部分的序列,并且使 每個窗化部分經(jīng)歷諸如MDCT的相應(yīng)變換。頻譜確定器16的窗化部分速率(即,頻譜分解 的時間分辨率)可不同于LP分析器12確定線性預(yù)測系數(shù)信息的時間分辨率。
[0039] 頻譜確定器16因此輸出包括多個頻譜分量的頻譜。具體地,頻譜確定器16可向 經(jīng)歷變換的每個窗化部分輸出頻譜值的序列,即,每個頻譜分量一個頻譜值,例如頻率的每 個頻譜線一個頻譜值。頻譜值可為復(fù)數(shù)值或?qū)崝?shù)值。例如,在使用MDCT的情況下,頻譜值 為實數(shù)值。具體地,頻譜值可帶有符號,即,頻譜值可為符號與量值的組合。
[0040] 如上文指示,線性預(yù)測系數(shù)信息形成經(jīng)LP分析的信號的頻譜包絡(luò)的短期預(yù)測,并 且因此可充當確定多個頻譜分量中的每個頻譜分量的概率分布估計(即,在統(tǒng)計學(xué)上,在 各個頻譜分量處頻譜采取某一可能頻譜值的概率在可能頻譜值的域中如何變化的估計) 的基礎(chǔ)。通過概率分布估計器14來執(zhí)行該確定。關(guān)于對概率分布估計的確定的細節(jié),存在 不同可能性。例如,根據(jù)下文進一步概述的實施例,盡管可以將頻譜確定器16實現(xiàn)為確定 音頻信號或該音頻信號的預(yù)加強版本的頻譜圖,但可以將頻譜確定器16配置成將激勵信 號(即,通過對音頻信號或該音頻信號的某一經(jīng)修改版本(例如,該音頻信號的預(yù)加強濾波 版本)進行基于LP的濾波而獲得的殘余信號)確定為頻譜。具體地,可將頻譜確定器16 配置成在使用傳遞函數(shù)對傳入信號進行濾波之后,確定傳入頻譜確定器16的信號的頻譜, 該傳遞函數(shù)取決于或等于由線性預(yù)測系數(shù)信息界定的線性預(yù)測合成濾波器的反向濾波器 (inverse)(即,線性預(yù)測分析濾波器)?;蛘撸贚P的音頻編碼器可為基于感知LP的音 頻編碼器,并且可將頻譜確定器16配置成在使用傳遞函數(shù)對傳入信號進行濾波之后,確定 傳入頻譜確定器16的信號的頻譜,該傳遞函數(shù)取決于或等于由線性預(yù)測系數(shù)信息界定的 線性預(yù)測合成濾波器的反向濾波器,但該傳遞函數(shù)已被修改成(例如)對應(yīng)于對掩蔽閾值 的估計的倒數(shù)。即,可將頻譜確定器16配置成確定通過傳遞函數(shù)濾波的傳入信號的頻譜, 該傳遞函數(shù)對應(yīng)于經(jīng)感知修改的線性預(yù)測合成濾波器的反向濾波器。在那種情況下,相對 于感知掩蔽(perceptual masking)更低的頻譜區(qū)域,頻譜確定器16相對地減少了感知掩 蔽更高的頻譜區(qū)域處的頻譜。然而,通過使用線性預(yù)測系數(shù)信息,即,通過在確定概率分布 估計時將線性預(yù)測合成濾波器的感知修改考慮在內(nèi),概率分布估計器14仍能夠估計由頻 譜確定器16確定的頻譜的包絡(luò)。在下文進一步概述這方面細節(jié)。
[0041] 此外,如下文更詳細地概述的,概率分布估計器14能夠使用長期預(yù)測,以便獲得 關(guān)于頻譜的精細結(jié)構(gòu)信息,從而獲得每個頻譜分量的較佳概率分布估計。例如,將(多個) LTP參數(shù)發(fā)送至解碼,以便實現(xiàn)對精細結(jié)構(gòu)信息的重構(gòu)。在下文進一步描述這方面的細節(jié)。
[0042] 在任何情況下,將量化與熵編碼級18配置成使用如由概率分布估計器14針對多 個頻譜分量中的每個頻譜分量確定的概率分布估計來對頻譜進行量化與熵編碼。為了更精 確,量化與熵編碼級18從頻譜確定器16接收由頻譜分量k構(gòu)成的頻譜26,或為了更精確, 在與窗化部分的上述窗化部分速率對應(yīng)的某一時間速率(temporal rate)下,頻譜26的序 列經(jīng)歷變換。具體地,級18可接收在頻譜分量k處的每個頻譜值的符號值以及每個頻譜分 量k的對應(yīng)量值|x k|。
[0043] 另一方面,量化與熵編碼級18接收針對每個頻譜分量k的概率分布估計28,該概 率分布估計28針對頻譜值可采取的每一可能值來界定概率值估計,該概率值估計確定了 在相應(yīng)頻譜分量k處的頻譜值具有此很可能值的概率。例如,由概率分布估計器14確定 的概率分布估計僅關(guān)注于頻譜值的量值,并且因此僅確定正值(包括零)的概率值。具體 地,量化與熵編碼級18 (例如)使用對于所有頻譜分量等同的量化規(guī)則來對頻譜值進行量 化。因此獲得的頻譜分量k的量值水平相應(yīng)地被界定于某一整數(shù)域內(nèi),該整數(shù)域包括零直 至(視情況)某一最大值??舍槍γ恳活l譜分量k,在此可能看整數(shù)i的域內(nèi)界定概率分 布估計,即,p(k,i)將為頻譜分量k的概率估計且界定于整數(shù)ie [0;max]內(nèi),其中,整數(shù) k e [0 ;k_],最大頻譜分量,并且對于所有的k,i,p(k ;i) e [0 ;1],并且對于所有 k,在所有i G [0 ;max]內(nèi)p(k, i)的總和為一。
[0044] 量化與熵編碼級18可(例如)使用恒定量化步長來量化,其中,該步長對所有頻 譜分量k是相等的。概率分布估計28越好,通過量化與熵編碼級18實現(xiàn)的壓縮效率則越 好。
[0045] 坦白地說,概率分布估計器14可使用由LP分析器12提供的線性預(yù)測系數(shù)信息, 以便獲得關(guān)于頻譜26的包絡(luò)30的信息(或近似形狀)。通過使用對包絡(luò)或形狀的這個估 計30,估計器14可通過(例如)使用對于所有頻譜分量相