帶寬擴(kuò)展音頻信號的高頻帶擴(kuò)展的生成的制作方法
【專利摘要】被配置為根據(jù)包絡(luò)和激勵生成音頻信號的高頻帶擴(kuò)展的音頻解碼器(200)。音頻解碼器包括控制裝置(41、42、44),控制裝置(41、42、44)被配置為使用公共控制參數(shù)(f)來聯(lián)合控制包絡(luò)形狀和激勵噪度。
【專利說明】帶寬擴(kuò)展音頻信號的高頻帶擴(kuò)展的生成
【技術(shù)領(lǐng)域】
[0001] 所提出的技術(shù)涉及帶寬擴(kuò)展音頻信號的高頻帶擴(kuò)展的生成。
【背景技術(shù)】
[0002] 大多數(shù)現(xiàn)有電信系統(tǒng)在有限的音頻帶寬上操作。由于固定電話系統(tǒng)的限制,大多 數(shù)語音服務(wù)被限制為僅發(fā)送頻譜的下端。雖然音頻帶寬對于大多數(shù)通話是足夠的,但是期 望增加帶寬以改善可懂性和存在感。雖然電信網(wǎng)絡(luò)中的容量持續(xù)增加,但是仍然非常關(guān)注 針對每一個通信信道的所需帶寬。在移動網(wǎng)絡(luò)中,針對每一個呼叫的較小傳輸帶寬在移動 設(shè)備和基站二者中產(chǎn)生較低的功耗。這轉(zhuǎn)化為針對移動運(yùn)營商的能量節(jié)省和成本節(jié)省,同 時終端用戶將體驗延長的電池壽命和增加的通話時間。此外,在針對每一個用戶的消耗帶 寬較小的情況下,移動網(wǎng)絡(luò)可以并行地為更大量的用戶提供服務(wù)。
[0003] 人類聽覺系統(tǒng)的特性是感知與頻率有關(guān)。具體地,我們的聽力對于較高頻率是不 太準(zhǔn)確的。這已經(jīng)啟發(fā)了所謂的帶寬擴(kuò)展(BWE)技術(shù),在該技術(shù)中,使用有限資源根據(jù)低頻 帶來重構(gòu)高頻帶。
[0004] 傳統(tǒng)的BWE使用擴(kuò)展高頻帶信號的頻譜包絡(luò)的表示,并且通過使用低頻帶信號的 修改版本再現(xiàn)信號的頻譜精細(xì)結(jié)構(gòu)。如果通過濾波器來表示高頻帶包絡(luò),則精細(xì)結(jié)構(gòu)信號 通常被稱作激勵信號。高頻帶包絡(luò)的準(zhǔn)確表示在感知上比精細(xì)結(jié)構(gòu)更重要。因此,比特方 面的可用資源通常被花費(fèi)在包絡(luò)表示上并且根據(jù)經(jīng)編碼的低頻帶信號來重構(gòu)精細(xì)結(jié)構(gòu),而 沒有使用額外邊帶信息。在圖1中示出了 BWE的基本構(gòu)思。
[0005] BWE技術(shù)已經(jīng)被應(yīng)用于多種音頻編碼系統(tǒng)中。例如,3GPPAMR-WB+[1]使用基于低 頻帶編碼器的時域BWE,其中,低頻帶編碼器在代碼激勵線性預(yù)測器(CELP)語音編碼與變 換編碼殘差(TCX)編碼之間切換。另一個示例是基于3GPP eAAC變換的音頻編解碼器,該 音頻編解碼器對BWE執(zhí)行變換域變型,這稱作頻帶復(fù)制(SBR) [2]。在這里,使用根據(jù)低頻帶 激勵生成的音調(diào)分量和噪聲源的混合物來創(chuàng)建激勵,以匹配輸入信號的音調(diào)與噪聲比。通 常,例如使用頻譜平坦度度量將信號的噪度描述為頻譜的平坦程度的度量。還可以將噪度 描述為激勵的非音調(diào)性、隨機(jī)性或非結(jié)構(gòu)性。增加信號的噪度是通過例如將信號與來自例 如隨機(jī)數(shù)發(fā)生器或任何其他噪聲源的噪聲信號進(jìn)行混合使得信號更加似噪聲。這還可以通 過修改信號的頻譜使得它更加平坦來完成。
[0006] 來自低頻帶的頻譜精細(xì)結(jié)構(gòu)可能與在高頻帶中找到的精細(xì)結(jié)構(gòu)完全不同。具體 地,根據(jù)低頻帶信號生成的激勵與高頻帶包絡(luò)的組合可能產(chǎn)生不期望的假象,這是因為可 能以不可控的方式通過包絡(luò)成型加強(qiáng)激勵的存在(residing)調(diào)和性或形狀。作為一種安 全度量,通常平坦化高頻帶包絡(luò)以便限制激勵與包絡(luò)之間的不期望交互。雖然該解決方案 可以產(chǎn)生合理的折中,但是更平坦的包絡(luò)可能被感知為具有更多噪聲并且高頻帶包絡(luò)將不 那么準(zhǔn)確。
【發(fā)明內(nèi)容】
[0007] 所提出的技術(shù)的目的是帶寬擴(kuò)展音頻信號的高頻帶擴(kuò)展的生成的改善控制。
[0008] 根據(jù)所附權(quán)利要求實現(xiàn)該目的。
[0009] 所提出的技術(shù)的第一方面涉及一種根據(jù)包絡(luò)和激勵生成音頻信號的高頻帶擴(kuò)展 的方法。該方法包括以下步驟:使用公共控制參數(shù)來聯(lián)合控制包絡(luò)形狀和激勵噪度。
[0010] 所提出的技術(shù)的第二方面涉及一種被配置為根據(jù)包絡(luò)和激勵來生成音頻信號的 高頻帶擴(kuò)展的音頻解碼器。所述音頻解碼器包括控制布置,所述控制布置被配置為使用公 共控制參數(shù)來聯(lián)合控制包絡(luò)形狀和激勵噪度。
[0011] 所提出的技術(shù)的第三方面涉及一種用戶設(shè)備(UE),包括根據(jù)第二方面所述的音頻 解碼器。
[0012] 所提出的技術(shù)的第四方面涉及一種音頻編碼器,包括頻譜平坦度估計器,所述頻 譜平坦度估計器被配置為確定高頻帶信號的頻譜平坦度的度量以發(fā)送到解碼器。
[0013] 所提出的技術(shù)允許更明顯的包絡(luò)結(jié)構(gòu),該更明顯的包絡(luò)結(jié)構(gòu)掩蔽了由人工生成的 高頻帶激勵所創(chuàng)建的感知假象。同時,對包絡(luò)結(jié)構(gòu)和激勵噪度的聯(lián)合控制改善了重構(gòu)的音 頻信號的逼真度。
【專利附圖】
【附圖說明】
[0014] 可以通過參照結(jié)合附圖給出的以下描述來最佳地理解所提出的技術(shù)及其其他目 的和優(yōu)點。
[0015] 圖1以頻譜的形式示出了 BWE技術(shù)的基本構(gòu)思。使用高頻帶包絡(luò)和根據(jù)低頻帶信 號生成的激勵信號利用高頻帶來擴(kuò)展經(jīng)編碼的低頻帶信號。
[0016] 圖2示出了具有針對低頻帶的CELP編解碼器的示例性BWE系統(tǒng),其中,使用線性 預(yù)測器(LP)包絡(luò)和根據(jù)CELP解碼器的經(jīng)修改的輸出參數(shù)生成的激勵信號來重構(gòu)上頻帶。
[0017] 圖3示出了具有圖2中所示的相應(yīng)編碼器的示例性BWE解碼器。經(jīng)調(diào)制的激勵與 來自噪聲發(fā)生器的噪聲信號混合在一起。
[0018] 圖4示出了具有針對激勵混合和頻譜形狀的聯(lián)合控制布置的CELP解碼器系統(tǒng)中 提出的技術(shù)的示例性實施例。
[0019] 圖5示出了輸入LP頻譜和已經(jīng)使用后置濾波器加強(qiáng)的LP頻譜的示例。
[0020] 圖6示出了使用基于線性預(yù)測編碼(LPC)系數(shù)的頻譜平坦度分析的編碼器的示例 性實施例。
[0021] 圖7示出了與圖6中的編碼器相對應(yīng)的使用所發(fā)送的平坦度參數(shù)進(jìn)行聯(lián)合頻譜包 絡(luò)和激勵結(jié)構(gòu)控制的解碼器的示例性實施例。
[0022] 圖8示出了具有針對整個頻譜的聯(lián)合包絡(luò)編碼并且采用BWE技術(shù)來獲得高頻帶的 頻譜精細(xì)結(jié)構(gòu)的基于變換的音頻編解碼器的示例。
[0023] 圖9示出了屬于圖8中所示的相應(yīng)編碼器的BWE解碼器的示例。使用壓縮器來修 改經(jīng)調(diào)制的激勵以在高頻帶激勵中得到更平坦的精細(xì)結(jié)構(gòu)。
[0024] 圖10示出了具有用于激勵壓縮和包絡(luò)擴(kuò)展的聯(lián)合控制器的基于變換的解碼器系 統(tǒng)中提出的技術(shù)的示例性實施例。
[0025] 圖11示出了具有本地解碼單元和低頻帶誤差估計器的編碼器的示例性實施例。
[0026] 圖12示出了具有用于激勵壓縮和包絡(luò)擴(kuò)展的聯(lián)合控制布置的基于變換的解碼器 系統(tǒng)中提出的技術(shù)的示例性實施例,其中,使用來自編碼器的低頻帶誤差估計來調(diào)整聯(lián)合 控制。
[0027] 圖13示出了控制布置的示例性實施例。
[0028] 圖14示出了配備有控制布置的解碼器的用戶設(shè)備(UE)。
[0029] 圖15示出了所提出的技術(shù)的流程圖。
[0030] 圖16示出了所提出的技術(shù)的示例性實施例的流程圖。
[0031] 圖17示出了所提出的技術(shù)的示例性實施例的流程圖。
[0032] 圖18示出了所提出的技術(shù)的示例性實施例的流程圖。
[0033] 圖19示出了所提出的技術(shù)的示例性實施例的流程圖。
【具體實施方式】
[0034] 在下面的詳細(xì)描述中,已經(jīng)向執(zhí)行相同或類似功能的框提供了相同的附圖標(biāo)記。
[0035] 可以在時域BWE和頻域BWE中使用所提出的技術(shù)。下面將描述針對時域BWE和頻 域BWE的示例性實施例。
[0036] 時域 BWE
[0037] 在圖2中示出了主要用于語音應(yīng)用的現(xiàn)有技術(shù)的BWE的示例性實施例。該示例針 對輸入信號的低頻帶使用CELP語音編碼算法。使用LP濾波器來表示高頻帶包絡(luò)。通過使 用根據(jù)CELP合成提取的低頻帶激勵信號的修改版本來創(chuàng)建高頻帶的合成。
[0038] 使用分析濾波器組10將每一個輸入信號幀y劃分為低頻帶信號^和高頻帶信 號yH。可以使用任何適合的濾波器組,但是它實質(zhì)上是由低通濾波器和高通濾波器組成, 例如,正交鏡像濾波器(QMF)濾波器組。低頻帶信號被饋送到在CELP編碼器12中執(zhí)行的 CELP編碼算法。在LP分析塊14中對高頻帶信號進(jìn)行LP分析,以獲得高頻帶包絡(luò)的表示 A。使用LP量化器或LP編碼器16來對定義A的LP系數(shù)進(jìn)行編碼,并且在比特流mux (復(fù) 用器)18中將量化索引L與CELP編碼器索引I^p復(fù)用在一起以便存儲或者發(fā)送到解碼 器。解碼器進(jìn)而在比特流demux (去復(fù)用器)20中對索引Ι?Ρ和1_進(jìn)行去復(fù)用,并且將它 們分別轉(zhuǎn)發(fā)給LP解碼器22和CELP解碼器24。在CELP解碼中,CELP激勵信號\被提取 和處理使得頻譜被調(diào)制以生成高頻帶激勵信號x H。
[0039] 存在多種調(diào)制方案以在激勵處理器26中根據(jù)低頻帶激勵信號^創(chuàng)建高頻帶激勵 xH。例如,反轉(zhuǎn)頻譜確保信號的特性在低頻帶與高頻帶之間的重疊區(qū)域中是類似的,但是高 頻帶信號的高端可能具有不期望的特性。生成高頻帶激勵的其他方式是執(zhí)行其他類型的調(diào) 制,所述其他類型的調(diào)制可以保留或可以不保留具有一系列諧波的諧波結(jié)構(gòu)。可以根據(jù)低 頻帶的僅一部分得到激勵信號或者甚至通過搜索低頻帶以得到適合用于形成高頻帶激勵 信號的部分自適應(yīng)地得到激勵信號。后一種方法也可能要求對參數(shù)進(jìn)行編碼使得解碼器可 以識別在高頻帶激勵中使用的區(qū)域。
[0040] 使用高頻帶LP濾波器;!/i來對經(jīng)調(diào)制的激勵xH進(jìn)行濾波,以形成高頻帶合成。 這是在LP合成塊28中完成的。在合成濾波器組30中將CELP解碼器的輸出Λ與高頻帶合 成,《聯(lián)合在一起以形成輸出信號# =
[0041] 在圖2以及下面的圖中,用虛線表示分別去往和來自比特流muxl8和比特流 demUX20的線,以指示它們傳遞表示經(jīng)量化的量的索引而不是經(jīng)量化的量的實際值。
[0042] 來自低頻帶的激勵可能具有不適合于用作高頻帶激勵的特性。例如,低頻帶信號 通常包含強(qiáng)諧波結(jié)構(gòu),當(dāng)該強(qiáng)諧波結(jié)構(gòu)被傳遞到高頻帶時,它產(chǎn)生令人煩惱的假象。用于控 制激勵結(jié)構(gòu)的一種現(xiàn)有的解決方案是將低頻帶激勵信號與噪聲進(jìn)行混合。在圖3中示出了 這種系統(tǒng)的示例性解碼器。在這里,如剛剛在圖2中所述的,對高頻帶LP濾波器系數(shù)i進(jìn)行 解碼,并且運(yùn)行CELP解碼器24同時提取激勵信號。然而,如乘法器32、34和加法器36所 示,還針對每一個子幀i使用相應(yīng)的混合因子g x(i)和gn(i)來將經(jīng)調(diào)制的激勵xH與來自 噪聲發(fā)生器38的高斯噪聲信號η進(jìn)行混合,即:
[0043]
【權(quán)利要求】
1. 一種根據(jù)包絡(luò)和激勵生成音頻信號的高頻帶擴(kuò)展的方法,其中,所述方法包括步驟 (S1):使用公共控制參數(shù)(f)來聯(lián)合控制包絡(luò)形狀和激勵噪度。
2. 根據(jù)權(quán)利要求1所述的方法,包括以下步驟:利用具有以下形式的共振峰后置濾波 器H(z)來控制(S1A)所述包絡(luò)形狀:
其中 i是表示所述包絡(luò)的線性預(yù)測濾波器,以及 h、¥2是所述控制參數(shù)f的函數(shù)。
3. 根據(jù)權(quán)利要求2所述的方法,其中,
其中,Υ(ι、Λ Y是預(yù)定常數(shù)。
4. 根據(jù)前述權(quán)利要求中任意一項所述的方法,包括以下步驟:通過按照下式混合子幀 i的高頻帶激勵xH, i和噪聲h來控制(S1B)所述激勵噪度:
其中,通過下式來定義混合因子gx(i)和8"(:0 :
其中 v(i)是部分地控制所述激勵噪度的調(diào)聲參數(shù), α是預(yù)定調(diào)諧常數(shù), Ei是針對所有子幀i的高頻帶激勵Xiu的幀能量,以及 E2是針對所有子巾貞i的噪聲的巾貞能量。
5. 根據(jù)權(quán)利要求2所述的方法,其中,
其中,Υ(ι、Λ YflajP Λ Yshmp是預(yù)定常數(shù)。
6. 根據(jù)權(quán)利要求5所述的方法,包括以下步驟:通過按照下式混合子幀i的高頻帶激 勵Xiu和噪聲h來控制(S1B)所述激勵噪度 :
其中,通過下式來定義混合因子gx(i)和8"(:0 :
其中 V(i)是部分地控制所述激勵噪度的調(diào)聲參數(shù), α是預(yù)定調(diào)諧常數(shù), Ei是針對所有子幀i的高頻帶激勵Xiu的幀能量,以及 E2是針對所有子巾貞i的噪聲的巾貞能量。
7. 根據(jù)前述權(quán)利要求2至6中任意一項所述的方法,包括以下步驟:使所述控制參數(shù)f 適應(yīng)(SIC)巾貞m的高頻帶頻譜傾斜tm。
8. 根據(jù)權(quán)利要求7所述的方法,其中,所述控制參數(shù)f按照下式取決于所述高頻帶頻譜 傾斜tm :
其中,cmin和cmax是預(yù)定常數(shù)。
9. 根據(jù)權(quán)利要求7或8所述的方法,其中,使用幀m的經(jīng)解碼的線性預(yù)測濾波器
的第二系數(shù)&1,π來近似所述高頻帶頻譜傾斜t m,其中,P是濾波器階 數(shù)。
10. 根據(jù)權(quán)利要求9所述的方法,其中, tm = β · max(0, aljm) + (l-^ 其中 tm是巾貞m的頻譜傾斜值, ?μ是前一巾貞m-Ι的頻譜傾斜值,以及 β是范圍β =[〇,〇· 5]中的常數(shù)。
11. 根據(jù)前述權(quán)利要求2至6中任意一項所述的方法,包括以下步驟:使所述控制參數(shù) f適應(yīng)高頻帶的頻譜平坦度的度量(供h
12. -種被配置為根據(jù)包絡(luò)和激勵來生成音頻信號的高頻帶擴(kuò)展的音頻解碼器 (200),包括: 控制裝置(41、42、44;88、90、92 ;310),被配置為使用公共控制參數(shù)(f)來聯(lián)合控制包 絡(luò)形狀和激勵噪度。
13. 根據(jù)權(quán)利要求12所述的解碼器,其中,所述控制裝置(41、42、44)包括聯(lián)合后置濾 波器和激勵控制器(44),所述聯(lián)合后置濾波器和激勵控制器(44)被配置為利用具有以下 形式的共振峰后置濾波器(42)H(z)來控制所述包絡(luò)形狀:
其中 i是表示所述包絡(luò)的線性預(yù)測濾波器,以及 h、¥2是所述控制參數(shù)f的函數(shù)。
14. 根據(jù)權(quán)利要求13所述的解碼器,其中,
其中,Υ(ι、Λ Y是預(yù)定常數(shù)。
15. 根據(jù)前述權(quán)利要求12至14中任意一項所述的解碼器,包括混合控制器(41),所述 混合控制器(41)被配置為:通過按照下式混合子幀i的高頻帶激勵x H, i和噪聲ni來控制 所述激勵噪度:
其中,通過下式來定義混合因子gx(i)和8"(:0 :
其中 v(i)是部分地控制所述激勵噪度的調(diào)聲參數(shù), α是預(yù)定調(diào)諧常數(shù), Ei是針對所有子幀i的高頻帶激勵Xiu的幀能量,以及 E2是針對所有子巾貞i的噪聲的巾貞能量。
16. 根據(jù)權(quán)利要求13所述的解碼器,其中,
其中,Υ(ι、Λ YflajP Λ Yshmp是預(yù)定常數(shù)。
17. 根據(jù)權(quán)利要求16所述的解碼器,包括混合控制器(41),所述混合控制器(41)被配 置為:通過按照下式混合子幀i的高頻帶激勵x H, i和噪聲h來控制所述激勵噪度:
其中,通過下式來定義混合因子gx(i)和8"(:0 :
其中 v(i)是部分地控制所述激勵噪度的調(diào)聲參數(shù), α是預(yù)定調(diào)諧常數(shù), Ei是針對所有子幀i的高頻帶激勵Xiu的幀能量,以及 E2是針對所有子巾貞i的噪聲的巾貞能量。
18. 根據(jù)前述權(quán)利要求13至17中任意一項所述的解碼器,其中,所述聯(lián)合后置濾波器 和激勵控制器(44)被配置為:使所述控制參數(shù)f適應(yīng)幀m的高頻帶頻譜傾斜t m。
19. 根據(jù)權(quán)利要求18所述的解碼器,其中,所述控制參數(shù)f按照下式取決于所述高頻帶 頻譜傾斜乜:
其中,cmin和cmax是預(yù)定常數(shù)。
20. 根據(jù)權(quán)利要求18或19所述的解碼器,其中,所述聯(lián)合后置濾波器和激勵控制器 (44)被配置為利用幀m的經(jīng)解碼的線性預(yù)測濾波器
的第二系數(shù)au m來近似所述高頻帶頻譜傾斜tm,其中,P是濾波器階數(shù)。
21. 根據(jù)權(quán)利要求20所述的解碼器,其中, tm = β · max(0, aljm) + (l-^ 其中 tm是巾貞m的頻譜傾斜值, ?μ是前一巾貞m-Ι的頻譜傾斜值,以及 β是范圍β =[〇,〇· 5]中的常數(shù)。
22. 根據(jù)前述權(quán)利要求13至17中任意一項所述的解碼器,其中,所述聯(lián)合后置濾波器 和激勵控制器(44)被配置為:使所述控制參數(shù)f適應(yīng)高頻帶的頻譜平坦度的度量(-) 3
23. -種用戶設(shè)備UE,包括根據(jù)前述權(quán)利要求12至22中任意一項所述的音頻解碼器。
24. -種音頻編碼器,包括頻譜平坦度估計器(46),所述頻譜平坦度估計器(46)被配 置為確定高頻帶信號的頻譜平坦度的度量(爐)以發(fā)送到解碼器(200)。
【文檔編號】G10L21/038GK104221081SQ201280053336
【公開日】2014年12月17日 申請日期:2012年9月4日 優(yōu)先權(quán)日:2011年11月2日
【發(fā)明者】艾力克·諾維爾, 沃洛佳·格蘭恰諾夫, 托馬斯·詹森·托夫特戈德 申請人:瑞典愛立信有限公司