專(zhuān)利名稱(chēng):低頻帶音頻信號(hào)的帶寬擴(kuò)展的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻編碼,更具體地,涉及低頻帶音頻信號(hào)的帶寬擴(kuò)展。
背景技術(shù):
本發(fā)明涉及音頻信號(hào)的帶寬擴(kuò)展(BWE)。在語(yǔ)音和音頻編碼/解碼中越來(lái)越多地使用BWE方案來(lái)提高在給定比特率下的感知質(zhì)量。BWE所基于的主要理念在于不發(fā)送一部分音頻信號(hào),而是在解碼器處根據(jù)接收到的信號(hào)分量來(lái)重建(估計(jì))該部分音頻信號(hào)。因此,在BWE方案中,在解碼器處重建信號(hào)頻譜的一部分。使用已經(jīng)利用傳統(tǒng)編碼方法實(shí)際發(fā)送的信號(hào)頻譜的特定特征來(lái)執(zhí)行該重建。通常,根據(jù)特定的低頻帶(LB)音頻信號(hào)特征來(lái)重建信號(hào)的高頻帶(HB)。通常通過(guò)高斯混合模型(GMM)或隱馬爾科夫模型(HMM)對(duì)LB特征與HB信號(hào)特性之間的依賴(lài)關(guān)系進(jìn)行建模(例如,[1-2])。最常預(yù)測(cè)的HB特性與頻譜包絡(luò)和/或時(shí)間包絡(luò)有關(guān)。存在兩種主要類(lèi)型的BWE方案 在第一方案中,完全根據(jù)特定的LB特征來(lái)預(yù)測(cè)HB信號(hào)特性。這些BWE解決方案在重建的HB中引入了偽音(artifact),在一些情況下這導(dǎo)致與帶寬受限信號(hào)相比的降低的質(zhì)量。復(fù)雜映射(例如,基于GMM或HMM)容易導(dǎo)致未知數(shù)據(jù)的劣化。一般的經(jīng)驗(yàn)是映射越復(fù)雜(訓(xùn)練參數(shù)的數(shù)目越大),對(duì)于訓(xùn)練集合中不存在的數(shù)據(jù)類(lèi)型,出現(xiàn)偽音的可能性就越高。找到將給出在整體預(yù)測(cè)精度與少量異常數(shù)據(jù)(outlier, 明顯偏離訓(xùn)練集合中的數(shù)據(jù)的數(shù)據(jù),即不能夠被很好建模的分量)之間的最佳平衡具有復(fù)雜度的映射是不容易的。 第二方案([3]中描述的示例)是根據(jù)LB特征和少量發(fā)送的HB信息的組合來(lái)重建HB信號(hào)。利用發(fā)送的HB信息的BWE方案傾向于提高性能(代價(jià)是增大的比特預(yù)算), 但是沒(méi)有提供對(duì)發(fā)送的參數(shù)和預(yù)測(cè)的參數(shù)加以組合的一般方法。通常,發(fā)送HB參數(shù)的一個(gè)集合,而預(yù)測(cè)HB參數(shù)的另一個(gè)集合,其意味著所發(fā)送的信息不能夠補(bǔ)償預(yù)測(cè)的參數(shù)中的故障。
發(fā)明內(nèi)容
本發(fā)明的目的是實(shí)現(xiàn)改進(jìn)的BWE方案。根據(jù)所附的權(quán)利要求實(shí)現(xiàn)了該目的。根據(jù)第一方面,本發(fā)明涉及估計(jì)低頻帶音頻信號(hào)的高頻帶擴(kuò)展的方法。該方法包括以下步驟。提取低頻帶音頻信號(hào)的特征集合。利用廣義加性模型(generalized additive modeling)將提取的特征映射到至少一個(gè)高頻帶參數(shù)。將低頻帶音頻信號(hào)的副本頻移到高頻帶。通過(guò)所述至少一個(gè)高頻帶參數(shù)來(lái)控制低頻帶音頻信號(hào)的頻移后副本的包絡(luò)。根據(jù)第二方面,本發(fā)明涉及用于估計(jì)低頻帶音頻信號(hào)的高頻帶擴(kuò)展的裝置。特征提取塊配置為提取低頻帶音頻信號(hào)的特征集合。映射塊包括下述單元廣義加性模型映射器,配置為利用廣義加性模型將提取的特征映射到至少一個(gè)高頻帶參數(shù);頻移器,配置為將低頻帶音頻信號(hào)的副本頻移到高頻帶;包絡(luò)控制器,配置為通過(guò)所述至少一個(gè)高頻帶參數(shù)來(lái)控制頻移后副本的包絡(luò)。根據(jù)第三方面,本發(fā)明涉及包括根據(jù)第二方面的裝置在內(nèi)的語(yǔ)音解碼器。根據(jù)第四方面,本發(fā)明涉及包括根據(jù)第三方面的語(yǔ)音解碼器在內(nèi)的網(wǎng)絡(luò)節(jié)點(diǎn)。所提出的BWE方案的優(yōu)點(diǎn)在于其在復(fù)雜映射方案(良好的平均性能,但是大量的異常數(shù)據(jù))與更多約束的映射方案(較低的平均性能,但是更魯棒)之間提供良好的平衡。
通過(guò)結(jié)合附圖來(lái)參考下面的描述,可以最佳地理解本發(fā)明及其其他目的和優(yōu)點(diǎn), 在附圖中圖I是示出了包括根據(jù)本發(fā)明的實(shí)施例的語(yǔ)音解碼器的編碼/解碼布置的實(shí)施例的框圖;圖2A-C是示出了廣義加性模型的原理的圖;圖3是示出了根據(jù)本發(fā)明的用于生成HB擴(kuò)展的裝置的實(shí)施例的框圖;圖4是示出了根據(jù)本發(fā)明的實(shí)施例的通過(guò)廣義加性模型獲得的高頻帶參數(shù)的示例的圖;圖5是示出了根據(jù)本發(fā)明的另一實(shí)施例的適合提取的特征的定義的圖;圖6是示出了根據(jù)本發(fā)明的適合基于圖5所示特征來(lái)生成HB擴(kuò)展的裝置的實(shí)施例的框圖;圖7是示出了根據(jù)本發(fā)明的實(shí)施例的通過(guò)廣義加性模型基于圖5所示的特征獲得的高頻帶參數(shù)的示例的示圖;圖8是示出了包括根據(jù)本發(fā)明的另一實(shí)施例的語(yǔ)音解碼器的編碼/解碼布置的另一實(shí)施例的框圖;圖9是示出了包括根據(jù)本發(fā)明的又一實(shí)施例的語(yǔ)音解碼器的編碼/解碼布置的又一實(shí)施例的框圖;圖10是示出了根據(jù)本發(fā)明的用于生成HB擴(kuò)展的裝置的另一實(shí)施例的框圖;圖11是示出了根據(jù)本發(fā)明的用于生成HB擴(kuò)展的裝置的又一實(shí)施例的框圖;圖12是示出了包括根據(jù)本發(fā)明的語(yǔ)音解碼器的實(shí)施例的網(wǎng)絡(luò)節(jié)點(diǎn)的實(shí)施例的框圖;圖13是示出了根據(jù)本發(fā)明的語(yǔ)音解碼器的實(shí)施例的框圖;圖14是示出了根據(jù)本發(fā)明的方法的實(shí)施例的流程圖。
具體實(shí)施例方式在附圖中,對(duì)具有相同或相似功能的單元提供相同的引用標(biāo)記。在下文中,解釋了 LB特征集合及其借助映射來(lái)估計(jì)信號(hào)的HB部分的用法。此外, 還解釋了發(fā)送的HB信息可以如何用于控制映射。圖I是示出了包括根據(jù)本發(fā)明的實(shí)施例的語(yǔ)音解碼器在內(nèi)的編碼/解碼布置的實(shí)施例的框圖。語(yǔ)音編碼器I接收源音頻信號(hào)s (通常接收它的幀),將其轉(zhuǎn)發(fā)給分析濾波器組10,分析濾波器組10將音頻信號(hào)分成低頻帶部分h和高頻帶部分sHB。在該實(shí)施例中, HB部分被丟棄(其意味著分析濾波器組可以僅包括低通濾波器)。音頻信號(hào)的LB部分在LB編碼器12 (通常是碼激勵(lì)線性預(yù)測(cè)(CELP)編碼器,例如代數(shù)碼激勵(lì)線性預(yù)測(cè)(ACELP) 編碼器)中進(jìn)行編碼,并且碼被發(fā)送給語(yǔ)音解碼器2。在[4]中可以找到ACELP編碼/解碼的示例。語(yǔ)音解碼器2接收到的碼在LB解碼器14 (通常是CELP解碼器,例如ACELP解碼器)中進(jìn)行解碼,LB解碼器14給出與%對(duì)應(yīng)的低頻帶音頻信」、該低頻帶音頻信號(hào)被轉(zhuǎn)發(fā)給特征提取塊16,特征提取塊16提取信號(hào)的特征Fu的集合(下文描述)。提取的特征被轉(zhuǎn)發(fā)給映射塊18,映射塊18利用廣義加性模型(下文描述)將提取的特征映射到至少一個(gè)高頻帶參數(shù)(下文描述)。HB參數(shù)被用于控制LB音頻信號(hào)的已經(jīng)頻移到高頻帶的副本的包絡(luò),其中該包絡(luò)給出對(duì)丟棄的HB部分sHB的估計(jì)〗_。信號(hào)t和U皮轉(zhuǎn)發(fā)給合成濾波器組20,合成濾波器組20重建對(duì)原始源音頻信號(hào)的估計(jì)5。特征提取塊16和映射塊18 —起形成用于生成HB擴(kuò)展的裝置30 (下文進(jìn)一步描述)。下文介紹的示例性LB音頻信號(hào)特征(稱(chēng)為局部特征)被用于預(yù)測(cè)特定的HB信號(hào)特性??梢允褂盟纠奶卣髦械乃刑卣骰蜃蛹?。逐幀計(jì)算所有這些局部特征,局部特征動(dòng)態(tài)還包括來(lái)自之前幀的信息。在下文中,η是幀索引,I是樣本索引,以及s(n,I)是語(yǔ)音樣本。
頭兩個(gè)示例特征與頻譜傾斜和傾斜動(dòng)態(tài)有關(guān)。它們測(cè)量能量的頻率分布
權(quán)利要求
1.一種估計(jì)低頻帶音頻信號(hào)()的高頻帶擴(kuò)展(Sm )的方法,包括以下步驟提取(SI)低頻帶音頻信號(hào)的特征集合利用廣義加性模型,將所提取的特征映射(S2)到至少一個(gè)高頻帶參數(shù)
2.根據(jù)權(quán)利要求I所述的方法,其中,所述映射基于所提取的特征 (Flb, Ψ, — Ψ7, F1, F2 )的 S 形函數(shù)的和。
3.根據(jù)權(quán)利要求2所述的方法,其中,所述映射通過(guò)下式給出
4.根據(jù)權(quán)利要求2所述的方法,其中,所述映射通過(guò)下式給出
5.根據(jù)權(quán)利要求3或4所述的方法,其中,所述特征Fl通過(guò)下式給出
6.根據(jù)權(quán)利要求3、4或5所述的方法,其中,所述特征F2通過(guò)下式給出其中,E8H6是對(duì)低頻帶音頻信號(hào)在頻帶8. 0-11. 6kHz中的能量的估計(jì),E0.0_1L6是對(duì)低頻帶音頻信號(hào)在頻帶O. 0-11. 6kHz中的能量的估計(jì)。
7.根據(jù)權(quán)利要求3、4、5或6所述的方法,其中,K= 4。
8.根據(jù)權(quán)利要求4、5、6或7所述的方法,包括以下步驟選擇與信號(hào)分類(lèi)C對(duì)應(yīng)的映射系數(shù)集合
9.一種用于估計(jì)低頻帶音頻信號(hào)(的高頻帶擴(kuò)展C s*)的設(shè)備(30),包括特征提取塊(16),配置為提取低頻帶音頻信號(hào)的特征集合(Flb, Ψ, - Ψ7, F1, F2 ); 映射塊(18),包括廣義加性模型映射器(32),配置為利用廣義加性模型,將所提取的特征映射到至少一個(gè)高頻帶參數(shù)(Y, Yc, Ek, Eck );頻移器(34),配置為將低頻帶音頻信號(hào)(sLB )的副本頻移到高頻帶;包絡(luò)控制器(36),配置為通過(guò)所述至少一個(gè)高頻帶參數(shù)來(lái)控制頻移后副本的包絡(luò)。
10.根據(jù)權(quán)利要求9所述的設(shè)備,其中,所述廣義加性模型映射器(32)配置為使所述映射基于所提取的特征(Flb^K )的S形函數(shù)的和。
11.根據(jù)權(quán)利要求10所述的設(shè)備,其中,所述廣義加性模型映射器(32)配置為根據(jù)下式執(zhí)行映射
12.根據(jù)權(quán)利要求10所述的設(shè)備,其中,所述廣義加性模型映射器(32)配置為根據(jù)下式執(zhí)行映射
13.根據(jù)權(quán)利要求11或12所述的設(shè)備,其中,所述特征提取塊(16)配置為通過(guò)下式提取特征F1
14.根據(jù)權(quán)利要求11、12或13所述的設(shè)備,其中,所述特征提取塊(16)配置為通過(guò)下式提取特征F2
15.根據(jù)權(quán)利要求11、12、13或14所述的設(shè)備,其中,所述廣義加性模型映射器(32)配置為將所提取的特征映射到K = 4個(gè)高頻帶參數(shù)(Ek, Eck )。
16.根據(jù)權(quán)利要求12、13、14或15所述的設(shè)備,包括映射系數(shù)集合選擇器(38),其配置為選擇與信號(hào)分類(lèi)C對(duì)應(yīng)的映射系數(shù)集合·(><;,其中C由下式給出
17.一種語(yǔ)音解碼器,包括根據(jù)前述權(quán)利要求9至16中任一項(xiàng)所述的設(shè)備(30)。
18.—種網(wǎng)絡(luò)節(jié)點(diǎn),包括根據(jù)權(quán)利要求17所述的語(yǔ)音解碼器。
19.根據(jù)權(quán)利要求18所述的網(wǎng)絡(luò)節(jié)點(diǎn),其中,所述網(wǎng)絡(luò)節(jié)點(diǎn)是無(wú)線終端。
全文摘要
低頻帶音頻信號(hào)的高頻帶擴(kuò)展的估計(jì)包括下述步驟提取(S1)低頻帶音頻信號(hào)的特征集合;利用廣義加性模型將提取的特征映射(S2)到至少一個(gè)高頻帶參數(shù);將低頻帶音頻信號(hào)的副本頻移(S3)到高頻帶;通過(guò)所述至少一個(gè)高頻帶參數(shù)來(lái)控制(S4)低頻帶音頻信號(hào)的頻移后副本的包絡(luò)。
文檔編號(hào)G10L19/00GK102612712SQ201080052278
公開(kāi)日2012年7月25日 申請(qǐng)日期2010年9月14日 優(yōu)先權(quán)日2009年11月19日
發(fā)明者哈拉爾德·波布洛斯, 斯特凡·布魯恩, 沃洛佳·格蘭恰諾夫, 西格德?tīng)枴に咕S里森 申請(qǐng)人:瑞典愛(ài)立信有限公司