專利名稱:一種頻帶擴(kuò)展的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,特別涉及一種頻帶擴(kuò)展的方法和裝置。
背景技術(shù):
隨著承載技術(shù)的發(fā)展,人們?cè)絹碓讲粷M足于窄帶語音編解碼器的質(zhì)量,因此語音編解碼器已逐步向?qū)拵?Windband,WB)、超寬帶(Super ffindband, SffB)擴(kuò)展。例如國際電信聯(lián)盟(International Telecommunication Union, ITU)推出了 G. 722、G. 722. 1、 G. 722. 2、G. 729. 1等寬帶語音編解碼標(biāo)準(zhǔn),第三代移動(dòng)通信伙伴項(xiàng)目(Third Generation Partnership Project,3GPP)推出了自適應(yīng)多速率寬帶(Adaptive Multi-Rate ffindband, AMR-WB)(即ITU的G. 722. 2)這一寬帶語音編解碼標(biāo)準(zhǔn),3GPP2則推出了變速率多模式寬帶 (Variable-Rate Multimode ffindband, VMR-ffB) 此外 ITU 最近又提出了 G. 729. l&G. 718 聯(lián)合超寬帶,G. 71UWB&G. 722聯(lián)合超寬帶等。這些標(biāo)準(zhǔn)都是從窄帶擴(kuò)展而來的,核心層一般為碼激勵(lì)線性預(yù)測(cè)(Code-Excited Linear-Prediction, CELP)編碼,而寬帶、超寬帶部分使用變換編碼技術(shù)。變換編碼有很多,例如修正的離散余弦變換(Modified Discrete Cosine ^Transform,MDCT),變換碼激勵(lì) CTransform Coded exciation, TCX)等。頻帶擴(kuò)展在語音/音頻編碼領(lǐng)域非常廣泛的使用,可以有效地提高限帶語音/音樂的感知質(zhì)量,在終端上使用的基于頻帶擴(kuò)展的質(zhì)量增強(qiáng)技術(shù)就是一類很好的應(yīng)用實(shí)例。 頻帶擴(kuò)展技術(shù)還被廣范應(yīng)用于嵌入式變速率語音編碼器中,特別是在傳輸信道條件發(fā)生變化時(shí)產(chǎn)生的音頻帶寬切換。常見的帶寬切換主要有窄帶(Narrow band,NB)、寬帶、超寬帶、 全帶(Full Band, FB)之間的切換。實(shí)現(xiàn)頻帶擴(kuò)展的方法可以分為有邊信息的頻帶擴(kuò)展和無邊信息的頻帶擴(kuò)展兩種。 有邊信息的頻帶擴(kuò)展需要在編碼端提取待擴(kuò)展頻帶的一些特征信息,并將這些信息產(chǎn)送到解碼端,指導(dǎo)解碼端進(jìn)行相應(yīng)的頻帶擴(kuò)展。無邊信息的頻帶擴(kuò)展又稱為盲擴(kuò),不需要在編碼端提取信息,只需要根據(jù)解碼端得到的部分頻帶的信息通過一定的估計(jì)算法人工產(chǎn)生所需擴(kuò)展頻帶的信息。頻帶擴(kuò)展的方法還可以分為基于時(shí)域的擴(kuò)展和基于頻域的擴(kuò)展?;跁r(shí)域的擴(kuò)展通常是基于解碼端得到的部分頻帶的時(shí)域信息進(jìn)行時(shí)域及頻域的整形后得到所需擴(kuò)展頻帶的時(shí)域信息,從而實(shí)現(xiàn)頻帶擴(kuò)展。基于頻域的擴(kuò)展通常是基于解碼端得到的部分頻帶的頻域信息進(jìn)行頻域及時(shí)域的整形后得到所需擴(kuò)展頻帶的頻域信息,從而實(shí)現(xiàn)頻帶擴(kuò)展。目前,無邊信息的頻帶擴(kuò)展技術(shù)一般在時(shí)域進(jìn)行的處理,其中有一種方法是基于統(tǒng)計(jì)特性的分段線性映射頻帶擴(kuò)展法。這種方法的實(shí)現(xiàn)步驟1、提取解碼得到的部分頻帶的特征矢量;2、通過對(duì)提取的特征矢量與頻帶擴(kuò)展前預(yù)先訓(xùn)練得到的統(tǒng)計(jì)特性分類特征矢量集進(jìn)行比較,對(duì)信號(hào)進(jìn)行分類;上述訓(xùn)練是指根據(jù)一定的規(guī)則,從一個(gè)數(shù)據(jù)集中間提取出有用信息,使用這些有用信息的指導(dǎo)將這些數(shù)據(jù)分成不同的類,對(duì)于同一類的數(shù)據(jù)用其對(duì)應(yīng)的一個(gè)有用信息來表示。
3、根據(jù)上述分的類對(duì)應(yīng)的預(yù)先設(shè)定的狀態(tài)轉(zhuǎn)移矩陣,得到所需擴(kuò)展頻帶的參數(shù)信息,從而實(shí)現(xiàn)頻帶擴(kuò)展。發(fā)明人在實(shí)現(xiàn)本發(fā)明的過程中發(fā)現(xiàn)由于將信號(hào)分成有限的幾類,因此可以生成的擴(kuò)展頻帶的參數(shù)信息只有有限的幾種,無法適配廣泛的信號(hào)特征,致使幀間過渡不平滑, 導(dǎo)致聽覺感受差。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例要解決的技術(shù)問題是提供一種頻帶擴(kuò)展的方法和裝置,提高聽覺感受。為解決上述技術(shù)問題,本發(fā)明所提供的頻帶擴(kuò)展的方法實(shí)施例可以通過以下技術(shù)方案實(shí)現(xiàn)獲取低頻帶信號(hào)的特征矢量;根據(jù)所述特征矢量及預(yù)設(shè)的統(tǒng)計(jì)特性分類特征矢量集對(duì)對(duì)所述低頻帶信號(hào)進(jìn)行分類,得到統(tǒng)計(jì)特性分類結(jié)果;根據(jù)所述統(tǒng)計(jì)特性分類結(jié)果、特征矢量以及預(yù)設(shè)的統(tǒng)計(jì)特性分類狀態(tài)轉(zhuǎn)移矩陣, 得到預(yù)估的高頻帶參數(shù);根據(jù)所述統(tǒng)計(jì)特性分類結(jié)果及預(yù)設(shè)的后處理平滑因子集,對(duì)所述預(yù)估的高頻帶參數(shù)進(jìn)行調(diào)整,得到調(diào)整后的高頻帶參數(shù);根據(jù)調(diào)整后的高頻帶參數(shù),重建高頻帶信號(hào)。一種頻帶擴(kuò)展的裝置,包括矢量獲取單元,用于獲取低頻帶信號(hào)的特征矢量;分類單元,用于根據(jù)所述特征矢量及預(yù)設(shè)的統(tǒng)計(jì)特性分類特征矢量集對(duì)對(duì)所述低頻帶信號(hào)進(jìn)行分類,得到統(tǒng)計(jì)特性分類結(jié)果;預(yù)估單元,用于根據(jù)所述統(tǒng)計(jì)特性分類結(jié)果、特征矢量以及預(yù)設(shè)的統(tǒng)計(jì)特性分類狀態(tài)轉(zhuǎn)移矩陣,得到預(yù)估的高頻帶參數(shù);調(diào)整單元,用于根據(jù)所述統(tǒng)計(jì)特性分類結(jié)果及預(yù)設(shè)的后處理平滑因子集,對(duì)所述預(yù)估的高頻帶參數(shù)進(jìn)行調(diào)整,得到調(diào)整后的高頻帶參數(shù);信號(hào)重建單元,用于根據(jù)調(diào)整后的高頻帶參數(shù),重建高頻帶信號(hào)。上述技術(shù)方案具有如下有益效果在基于統(tǒng)計(jì)特性的分段線性映射頻帶擴(kuò)展算法的基礎(chǔ)上增加了一個(gè)自適應(yīng)后處理,該方法有效地利用了分段線性映射頻帶擴(kuò)展算法中獲得的分類信息,對(duì)分段線性映射頻帶擴(kuò)展算法得到的擴(kuò)展頻帶的參數(shù)信息按類再進(jìn)行自適應(yīng)的后處理,使得獲得的擴(kuò)展頻帶參數(shù)信息更加有針對(duì)性,幀間過渡更加平滑,得到的擴(kuò)展出的信號(hào)具有更高的聽覺感受。
為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例一方法流程示意圖;圖2為本發(fā)明實(shí)施例二方法流程示意圖;圖3為本發(fā)明實(shí)施例三方法流程示意圖;圖4為本發(fā)明實(shí)施例四裝置結(jié)構(gòu)示意圖;圖5為本發(fā)明實(shí)施例四裝置結(jié)構(gòu)示意圖;圖6為本發(fā)明實(shí)施例四裝置結(jié)構(gòu)示意圖;圖7為本發(fā)明實(shí)施例四裝置結(jié)構(gòu)示意圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。實(shí)施例一,本發(fā)明實(shí)施例提供了一種頻帶擴(kuò)展的方法,如圖1所示,包括101 獲取低頻帶信號(hào)的特征矢量;具體地,上述特征矢量可以包括時(shí)域包絡(luò)和線性預(yù)測(cè)系數(shù),上述時(shí)域包絡(luò)表示時(shí)域內(nèi)各子幀信號(hào)的能量大小,上述線性預(yù)測(cè)系數(shù)表示信號(hào)的共振峰位置及幅度。當(dāng)然上述特征矢量還可以包括低頻帶信號(hào)的頻域包絡(luò)、頻域線性預(yù)測(cè)系數(shù)等參數(shù)對(duì)此本發(fā)明實(shí)施例不予限定。102:根據(jù)上述特征矢量及預(yù)設(shè)的統(tǒng)計(jì)特性分類特征矢量集對(duì)上述低頻帶信號(hào)進(jìn)行分類,得到統(tǒng)計(jì)特性分類結(jié)果;103:根據(jù)上述統(tǒng)計(jì)特性分類結(jié)果、特征矢量以及預(yù)設(shè)的統(tǒng)計(jì)特性分類狀態(tài)轉(zhuǎn)移矩陣,得到預(yù)估的高頻帶參數(shù);具體地,上述103中,根據(jù)統(tǒng)計(jì)特性分類結(jié)果、特征矢量以及預(yù)設(shè)的統(tǒng)計(jì)特性分類狀態(tài)轉(zhuǎn)移矩陣,得到預(yù)估的高頻帶參數(shù)包括根據(jù)上述統(tǒng)計(jì)特性分類結(jié)果,在預(yù)設(shè)的統(tǒng)計(jì)特性分類狀態(tài)轉(zhuǎn)移矩陣中查詢上述分類結(jié)果對(duì)應(yīng)的狀態(tài)轉(zhuǎn)移矩陣;根據(jù)上述狀態(tài)轉(zhuǎn)移矩陣以及上述特征矢量得到預(yù)估的高頻帶參數(shù)。當(dāng)然上述根據(jù)得到的統(tǒng)計(jì)特性分類結(jié)果、低頻帶信號(hào)的特征矢量以及預(yù)設(shè)的統(tǒng)計(jì)特性分類狀態(tài)轉(zhuǎn)移矩陣,得到預(yù)估的高頻帶參數(shù),還可以有其他方式,例如以下兩種方式 (1)根據(jù)得到的統(tǒng)計(jì)特性分類結(jié)果,在預(yù)設(shè)的統(tǒng)計(jì)特性分類狀態(tài)轉(zhuǎn)移矩陣中查詢?cè)摲诸惤Y(jié)果對(duì)應(yīng)的狀態(tài)轉(zhuǎn)移矩陣;根據(jù)得到的統(tǒng)計(jì)特性分類結(jié)果對(duì)應(yīng)的狀態(tài)轉(zhuǎn)移矩陣乘以低頻帶信號(hào)的特征矢量,得到預(yù)估的高頻帶參數(shù)。( 根據(jù)得到的統(tǒng)計(jì)特性分類結(jié)果,在預(yù)設(shè)的統(tǒng)計(jì)特性分類狀態(tài)轉(zhuǎn)移矩陣中查詢?cè)摲诸惤Y(jié)果對(duì)應(yīng)的狀態(tài)轉(zhuǎn)移映射索引值;根據(jù)得到狀態(tài)轉(zhuǎn)移映射索引值查表得到對(duì)應(yīng)的預(yù)估的高頻帶參數(shù)。具體地,上述高頻帶參數(shù)可以包括時(shí)域包絡(luò)和頻域包絡(luò);上述時(shí)域包絡(luò)表示時(shí)域內(nèi)各子幀信號(hào)的能量大小,上述頻域包絡(luò)表示頻域內(nèi)各子帶信號(hào)的增益大小。當(dāng)然上述高頻帶參數(shù)還可以包括高頻帶信號(hào)的時(shí)域線性預(yù)測(cè)系數(shù)、頻域線性預(yù)測(cè)系數(shù)等參數(shù)對(duì)此本發(fā)明實(shí)施例不予限定。
104:根據(jù)上述統(tǒng)計(jì)特性分類結(jié)果及預(yù)設(shè)的后處理平滑因子集,對(duì)上述預(yù)估的高頻帶參數(shù)進(jìn)行調(diào)整,得到調(diào)整后的高頻帶參數(shù);若所述高頻帶參數(shù)包括時(shí)域包絡(luò)和頻域包絡(luò);所述后處理因子參數(shù),包括幀內(nèi)平滑因子;則所述對(duì)預(yù)估的高頻帶參數(shù)進(jìn)行調(diào)整,得到調(diào)整后的高頻帶參數(shù)可以為根據(jù)統(tǒng)計(jì)特性分類對(duì)應(yīng)的幀內(nèi)平滑因子,調(diào)整預(yù)估的高頻帶參數(shù)中的時(shí)域包絡(luò)參數(shù)和頻域包絡(luò)參數(shù),得到調(diào)整后的高頻帶參數(shù)。具體地,上述根據(jù)統(tǒng)計(jì)特性分類結(jié)果及預(yù)設(shè)的后處理平滑因子集,對(duì)上述預(yù)估的高頻帶參數(shù)進(jìn)行調(diào)整包括根據(jù)上述統(tǒng)計(jì)特性分類結(jié)果,在預(yù)設(shè)的后處理平滑因子集中查詢上述統(tǒng)計(jì)特性分類結(jié)果對(duì)應(yīng)的后處理因子參數(shù);根據(jù)與上述統(tǒng)計(jì)特性分類結(jié)果對(duì)應(yīng)的后處理因子參數(shù),調(diào)整上述預(yù)估的高頻帶參數(shù),得到調(diào)整后的高頻帶參數(shù)。當(dāng)然,上述根據(jù)得到的分類結(jié)果及預(yù)設(shè)的后處理平滑因子集,對(duì)預(yù)估的高頻帶參數(shù)進(jìn)行調(diào)整的方法還可以有其他的方式,例如如下3個(gè)舉例(1)根據(jù)得到的統(tǒng)計(jì)特性分類結(jié)果,在預(yù)設(shè)的后處理平滑因子集中查詢?cè)摲诸惤Y(jié)果對(duì)應(yīng)的后處理因子參數(shù);根據(jù)與得到的統(tǒng)計(jì)特性分類結(jié)果相對(duì)應(yīng)的后處理因子參數(shù),根據(jù)后處理因子參數(shù)對(duì)預(yù)估的高頻帶參數(shù)進(jìn)行幀內(nèi)和/或幀間平滑,自適應(yīng)地調(diào)整預(yù)估的高頻帶參數(shù),得到調(diào)整后的高頻帶參數(shù)。 (2)根據(jù)得到的統(tǒng)計(jì)特性分類結(jié)果,在預(yù)設(shè)的后處理平滑因子集中查詢?cè)摲诸惤Y(jié)果對(duì)應(yīng)的后處理因子參數(shù);根據(jù)與得到的統(tǒng)計(jì)特性分類結(jié)果相對(duì)應(yīng)的后處理因子參數(shù),根據(jù)后處理因子參數(shù)對(duì)預(yù)估的高頻帶參數(shù)進(jìn)行參數(shù)衰減或增強(qiáng),自適應(yīng)地調(diào)整預(yù)估的高頻帶參數(shù),得到調(diào)整后的高頻帶參數(shù)。(3)根據(jù)得到的統(tǒng)計(jì)特性分類結(jié)果,在預(yù)設(shè)的后處理平滑因子集中查詢?cè)摲诸惤Y(jié)果對(duì)應(yīng)的后處理因子參數(shù);根據(jù)與得到的統(tǒng)計(jì)特性分類結(jié)果相對(duì)應(yīng)的后處理因子參數(shù),根據(jù)后處理因子參數(shù)對(duì)預(yù)估的高頻帶參數(shù)進(jìn)行幀內(nèi)和/或幀間平滑,并進(jìn)行參數(shù)衰減或增強(qiáng),自適應(yīng)地調(diào)整預(yù)估的高頻帶參數(shù),得到調(diào)整后的高頻帶參數(shù)。105 根據(jù)上述調(diào)整后的高頻帶參數(shù),重建高頻帶信號(hào)。具體地,上述后處理因子參數(shù)可以包括幀內(nèi)平滑因子和幀間平滑因子。更具體地,上述調(diào)整預(yù)估的高頻帶參數(shù)包括根據(jù)統(tǒng)計(jì)特性分類對(duì)應(yīng)的幀內(nèi)平滑因子,調(diào)整預(yù)估的高頻帶參數(shù)中的時(shí)域包絡(luò)參數(shù);根據(jù)統(tǒng)計(jì)特性分類對(duì)應(yīng)的幀間平滑因子, 初步調(diào)整預(yù)估的高頻帶參數(shù)中的頻域包絡(luò)參數(shù);根據(jù)統(tǒng)計(jì)特性分類對(duì)應(yīng)的幀內(nèi)平滑因子, 對(duì)初步調(diào)整后的高頻帶頻域包絡(luò)參數(shù)進(jìn)行再調(diào)整,得到調(diào)整后的高頻帶參數(shù)。上述方法的執(zhí)行主體可以是任何進(jìn)行頻帶擴(kuò)展的裝置,本發(fā)明實(shí)施例提供的方法在基于統(tǒng)計(jì)特性的分段線性映射頻帶擴(kuò)展算法的基礎(chǔ)上增加了一個(gè)自適應(yīng)后處理,該方法有效地利用了分段線性映射頻帶擴(kuò)展算法中獲得的分類信息,對(duì)分段線性映射頻帶擴(kuò)展算法得到的擴(kuò)展頻帶的參數(shù)信息按類再進(jìn)行自適應(yīng)的后處理,使得獲得的擴(kuò)展頻帶參數(shù)信息更加有針對(duì)性,幀間過渡更加平滑,得到的擴(kuò)展出的信號(hào)具有更高的聽覺感受。實(shí)施例二,本發(fā)明實(shí)施例還給出了頻帶擴(kuò)展的方法更具體的實(shí)例,如圖2所示,包括如下步驟201 解碼得到低頻帶信號(hào);202 提取低頻帶信號(hào)的特征矢量)(f。特征矢量可以有各種組合方式,只需要能夠反映低頻帶信號(hào)的特征即可。例如,特征矢量可以包含低頻帶信號(hào)的時(shí)域包絡(luò)和線性預(yù)測(cè)系數(shù),也可以包含低頻帶信號(hào)的時(shí)域包絡(luò)和頻域包絡(luò)。203 根據(jù)得到的低頻帶信號(hào)的特征矢量\以及預(yù)設(shè)的統(tǒng)計(jì)特性分類特征矢量集 Xf, j(j e {1,…,Μ}),對(duì)低頻帶信號(hào)進(jìn)行分類,得到統(tǒng)計(jì)特性分類i。具體實(shí)現(xiàn)可以使用矢量量化的方法,將預(yù)設(shè)的統(tǒng)計(jì)特性分類特征矢量集作為碼書,在碼書中搜索與特征矢量)(f距離最小的碼字,該碼字在碼書中對(duì)應(yīng)的索引即為統(tǒng)計(jì)特性分類i 碼書是一個(gè)數(shù)組,包含了順序排列的M個(gè)分類對(duì)應(yīng)的分類特征矢量,每一個(gè)特征矢量就是一個(gè)碼字,M個(gè)特征矢量就是M個(gè)碼字。碼字的索引表示該碼字在碼書中的位置, 索引對(duì)應(yīng)了分類號(hào)。i = argmm\\xf-xfJf其中I I · I I2表示計(jì)算均方誤差。204 根據(jù)得到的統(tǒng)計(jì)特性分類i、低頻帶信號(hào)的特征矢量\以及預(yù)設(shè)的統(tǒng)計(jì)特性分類狀態(tài)轉(zhuǎn)移矩陣集H,預(yù)估高頻帶參數(shù)& oy = Ht1 · Xf。其中//f表示對(duì)統(tǒng)計(jì)特性分類i對(duì)應(yīng)的統(tǒng)計(jì)特性分類狀態(tài)轉(zhuǎn)移矩陣Hi計(jì)算轉(zhuǎn)置 (特性分類i對(duì)應(yīng)了狀態(tài)轉(zhuǎn)移矩陣H中的第i個(gè)矢量Hi)。統(tǒng)計(jì)特性分類集和統(tǒng)計(jì)特性分類狀態(tài)轉(zhuǎn)移矩陣同時(shí)訓(xùn)練出來時(shí)保持了一一對(duì)應(yīng)關(guān)系。上述高頻帶參數(shù)可以有不同的組合方式,只要能夠反映出高頻帶信號(hào)的特征即可。例如,高頻帶參數(shù)可以包含高頻帶信號(hào)的時(shí)域包絡(luò)和線性預(yù)測(cè)系數(shù),也可以包含高頻帶信號(hào)的時(shí)域包絡(luò)和頻域包絡(luò)。需要說明的是高頻帶參數(shù)與上文中的特征矢量的組合方式是可以不一致的,不影響本發(fā)明實(shí)施例的實(shí)現(xiàn)。205 根據(jù)統(tǒng)計(jì)特性分類i及預(yù)設(shè)的后處理因子集,對(duì)預(yù)估高頻帶參數(shù)進(jìn)行自適應(yīng)調(diào)整,得到調(diào)整后的高頻帶參數(shù)Ppcjst。上述預(yù)設(shè)的后處理因子集可以有不同的組合方式,可以只包含幀間平滑因子,也可以包含幀間平滑因子和幀內(nèi)平滑因子,還可以包含狀態(tài)跳變因子等不同的后處理因子。 預(yù)設(shè)的后處理因子集中的各參量可以分別針對(duì)不同的統(tǒng)計(jì)特性分類,從而體現(xiàn)后處理方法的自適應(yīng)特性及充分運(yùn)用統(tǒng)計(jì)特性分類的特點(diǎn)。206 根據(jù)調(diào)整后的高頻帶參數(shù)重建高頻帶信號(hào)。根據(jù)得到的高頻帶參數(shù)重建高頻帶信號(hào),主要依據(jù)高頻帶參數(shù)包含的具體內(nèi)容, 例如,高頻帶參數(shù)包含了時(shí)域包絡(luò)和頻域包絡(luò)時(shí),可以采用頻域頻帶擴(kuò)展的方法,對(duì)低頻帶的頻域譜按照頻域包絡(luò)整形后變換到時(shí)域,再根據(jù)時(shí)域包絡(luò)進(jìn)行整形得到重建的高頻帶信號(hào);也可以采用時(shí)域頻帶擴(kuò)展的方法,對(duì)低頻帶的時(shí)域激勵(lì)信號(hào)按照時(shí)域包絡(luò)進(jìn)行整形后變換到頻域,再根據(jù)頻域包絡(luò)進(jìn)行整形,最后再變換回時(shí)域,得到重建的高頻帶信號(hào)。高頻帶參數(shù)包含了高頻帶線性預(yù)測(cè)系數(shù)時(shí),可以用低頻帶的時(shí)域激勵(lì)信號(hào)經(jīng)過高頻帶線性預(yù)測(cè)系數(shù)構(gòu)成的合成濾波器,得到重建的高頻帶信號(hào)。以下對(duì)預(yù)設(shè)的統(tǒng)計(jì)特性分類特征矢量集、預(yù)設(shè)的統(tǒng)計(jì)特性分類狀態(tài)轉(zhuǎn)移矩陣集和預(yù)設(shè)的后處理因子集,是根據(jù)大量信號(hào)的統(tǒng)計(jì)特性得到的,具體的訓(xùn)練方法如下首先,從訓(xùn)練集中提取出每一個(gè)信號(hào)的低頻帶特征矢量以及相應(yīng)的高頻帶參數(shù)矢量,分別組成低頻帶特征矢量訓(xùn)練集和高頻帶參數(shù)矢量訓(xùn)練集;上述訓(xùn)練集為用于訓(xùn)練的數(shù)據(jù)集,該數(shù)據(jù)集為預(yù)先選定的語音/音頻語料。然后,根據(jù)不同的統(tǒng)計(jì)特征,按照聚類的方法,從低頻帶特征矢量訓(xùn)練集中訓(xùn)練得到低頻帶特征矢量集Xq(j e {1,…,M}),同時(shí)根據(jù)統(tǒng)計(jì)特性分類特征矢量集的聚類得到相應(yīng)的高頻帶參數(shù)矢量集Yf,」(j e {1,…,Μ})。根據(jù)每一個(gè)統(tǒng)計(jì)特征分類j e {1,…,Μ}對(duì)應(yīng)的訓(xùn)練數(shù)據(jù)(統(tǒng)計(jì)特征分類j對(duì)應(yīng)的低頻帶特征矢量Xj和高頻帶參數(shù)矢量Yi),計(jì)算對(duì)應(yīng)的狀態(tài)轉(zhuǎn)移矩陣Hj = X/.Yj= (XjtXj)-1X/ · YjX/表示求矢量Xj的偽逆運(yùn)算,X/ = (XjtXj)-1Xjt0每一個(gè)統(tǒng)計(jì)特征分類j e {1,…, M}對(duì)應(yīng)的狀態(tài)轉(zhuǎn)移矩陣就構(gòu)成了狀態(tài)轉(zhuǎn)移矩陣集e {1,…,Μ})。根據(jù)已經(jīng)訓(xùn)練好的的低頻帶特征矢量集和狀態(tài)轉(zhuǎn)移矩陣集,按照分類線性映射頻帶擴(kuò)展的方法,計(jì)算訓(xùn)練中每一個(gè)信號(hào)的預(yù)估高頻帶矢量夕。計(jì)算每一個(gè)統(tǒng)計(jì)特征分類對(duì)應(yīng)的可靠性因子,并將其作為后處理因子集中的參數(shù)。上述可靠性因子為α。后處理因子的范圍更加寬泛,可以只包含Cii,也可以包含除可靠性因子外的其他因子。統(tǒng)計(jì)特征分類i對(duì)應(yīng)的平均分類誤差為
權(quán)利要求
1.一種頻帶擴(kuò)展的方法,其特征在于,包括 獲取低頻帶信號(hào)的特征矢量;根據(jù)所述特征矢量及預(yù)設(shè)的統(tǒng)計(jì)特性分類特征矢量集對(duì)對(duì)所述低頻帶信號(hào)進(jìn)行分類, 得到統(tǒng)計(jì)特性分類結(jié)果;根據(jù)所述統(tǒng)計(jì)特性分類結(jié)果、特征矢量以及預(yù)設(shè)的統(tǒng)計(jì)特性分類狀態(tài)轉(zhuǎn)移矩陣,得到預(yù)估的高頻帶參數(shù);根據(jù)所述統(tǒng)計(jì)特性分類結(jié)果及預(yù)設(shè)的后處理平滑因子集,對(duì)所述預(yù)估的高頻帶參數(shù)進(jìn)行調(diào)整,得到調(diào)整后的高頻帶參數(shù);根據(jù)調(diào)整后的高頻帶參數(shù),重建高頻帶信號(hào)。
2.根據(jù)權(quán)利要求1所述方法,其特征在于,所述根據(jù)統(tǒng)計(jì)特性分類結(jié)果及預(yù)設(shè)的后處理平滑因子集,對(duì)所述預(yù)估的高頻帶參數(shù)進(jìn)行調(diào)整包括根據(jù)所述統(tǒng)計(jì)特性分類結(jié)果,在預(yù)設(shè)的后處理平滑因子集中查詢所述統(tǒng)計(jì)特性分類結(jié)果對(duì)應(yīng)的后處理因子參數(shù);根據(jù)與所述統(tǒng)計(jì)特性分類結(jié)果對(duì)應(yīng)的后處理因子參數(shù),調(diào)整所述預(yù)估的高頻帶參數(shù), 得到調(diào)整后的高頻帶參數(shù)。
3.根據(jù)權(quán)利要求1或2所述方法,其特征在于,所述根據(jù)統(tǒng)計(jì)特性分類結(jié)果、特征矢量以及預(yù)設(shè)的統(tǒng)計(jì)特性分類狀態(tài)轉(zhuǎn)移矩陣,得到預(yù)估的高頻帶參數(shù)包括根據(jù)所述統(tǒng)計(jì)特性分類結(jié)果,在預(yù)設(shè)的統(tǒng)計(jì)特性分類狀態(tài)轉(zhuǎn)移矩陣中查詢所述分類結(jié)果對(duì)應(yīng)的狀態(tài)轉(zhuǎn)移矩陣;根據(jù)所述狀態(tài)轉(zhuǎn)移矩陣以及所述特征矢量得到預(yù)估的高頻帶參數(shù)。
4.根據(jù)權(quán)利要求1或2所述方法,其特征在于,所述特征矢量,包括時(shí)域包絡(luò)和線性預(yù)測(cè)系數(shù),所述時(shí)域包絡(luò)表示時(shí)域內(nèi)各子幀信號(hào)的能量大小,所述線性預(yù)測(cè)系數(shù)表示信號(hào)的共振峰位置及幅度。
5.根據(jù)權(quán)利要求1或2所述方法,其特征在于,所述高頻帶參數(shù),包括時(shí)域包絡(luò)和頻域包絡(luò);所述后處理因子參數(shù),包括幀內(nèi)平滑因子;所述對(duì)預(yù)估的高頻帶參數(shù)進(jìn)行調(diào)整, 得到調(diào)整后的高頻帶參數(shù)包括根據(jù)統(tǒng)計(jì)特性分類對(duì)應(yīng)的幀內(nèi)平滑因子,調(diào)整預(yù)估的高頻帶參數(shù)中的時(shí)域包絡(luò)參數(shù)和頻域包絡(luò)參數(shù),得到調(diào)整后的高頻帶參數(shù)。
6.根據(jù)權(quán)利要求1或2所述方法,其特征在于,所述后處理因子參數(shù),包括幀內(nèi)平滑因子和幀間平滑因子。
7.根據(jù)權(quán)利要求6所述方法,其特征在于,所述調(diào)整預(yù)估的高頻帶參數(shù)包括根據(jù)統(tǒng)計(jì)特性分類對(duì)應(yīng)的幀內(nèi)平滑因子,調(diào)整預(yù)估的高頻帶參數(shù)中的時(shí)域包絡(luò)參數(shù); 根據(jù)統(tǒng)計(jì)特性分類對(duì)應(yīng)的幀間平滑因子,初步調(diào)整預(yù)估的高頻帶參數(shù)中的頻域包絡(luò)參數(shù);根據(jù)統(tǒng)計(jì)特性分類對(duì)應(yīng)的幀內(nèi)平滑因子,對(duì)初步調(diào)整后的高頻帶頻域包絡(luò)參數(shù)進(jìn)行再調(diào)整,得到調(diào)整后的高頻帶參數(shù)。
8.一種頻帶擴(kuò)展的裝置,其特征在于,包括 矢量獲取單元,用于獲取低頻帶信號(hào)的特征矢量;分類單元,用于根據(jù)所述特征矢量及預(yù)設(shè)的統(tǒng)計(jì)特性分類特征矢量集對(duì)對(duì)所述低頻帶信號(hào)進(jìn)行分類,得到統(tǒng)計(jì)特性分類結(jié)果;預(yù)估單元,用于根據(jù)所述統(tǒng)計(jì)特性分類結(jié)果、特征矢量以及預(yù)設(shè)的統(tǒng)計(jì)特性分類狀態(tài)轉(zhuǎn)移矩陣,得到預(yù)估的高頻帶參數(shù);調(diào)整單元,用于根據(jù)所述統(tǒng)計(jì)特性分類結(jié)果及預(yù)設(shè)的后處理平滑因子集,對(duì)所述預(yù)估的高頻帶參數(shù)進(jìn)行調(diào)整,得到調(diào)整后的高頻帶參數(shù);信號(hào)重建單元,用于根據(jù)調(diào)整后的高頻帶參數(shù),重建高頻帶信號(hào)。
9.根據(jù)權(quán)利要求8所述裝置,其特征在于,所述調(diào)整單元包括后處理因子查詢單元,用于根據(jù)所述統(tǒng)計(jì)特性分類結(jié)果,在預(yù)設(shè)的后處理平滑因子集中查詢所述統(tǒng)計(jì)特性分類結(jié)果對(duì)應(yīng)的后處理因子參數(shù);調(diào)整子單元,用于根據(jù)與所述統(tǒng)計(jì)特性分類結(jié)果對(duì)應(yīng)的后處理因子參數(shù),調(diào)整所述預(yù)估的高頻帶參數(shù),得到調(diào)整后的高頻帶參數(shù)。
10.根據(jù)權(quán)利要求8或9所述裝置,其特征在于,所述預(yù)估單元包括矩陣查詢單元,用于根據(jù)所述統(tǒng)計(jì)特性分類結(jié)果,在預(yù)設(shè)的統(tǒng)計(jì)特性分類狀態(tài)轉(zhuǎn)移矩陣中查詢所述分類結(jié)果對(duì)應(yīng)的狀態(tài)轉(zhuǎn)移矩陣;預(yù)估子單元,用于根據(jù)所述狀態(tài)轉(zhuǎn)移矩陣以及所述特征矢量得到預(yù)估的高頻帶參數(shù)。
11.根據(jù)權(quán)利要求10所述裝置,其特征在于,所述調(diào)整單元包括第一調(diào)整單元,用于根據(jù)統(tǒng)計(jì)特性分類對(duì)應(yīng)的幀內(nèi)平滑因子,調(diào)整預(yù)估的高頻帶參數(shù)中的時(shí)域包絡(luò)參數(shù);第二調(diào)整單元,用于根據(jù)統(tǒng)計(jì)特性分類對(duì)應(yīng)的幀間平滑因子,初步調(diào)整預(yù)估的高頻帶參數(shù)中的頻域包絡(luò)參數(shù);第三調(diào)整單元,用于根據(jù)統(tǒng)計(jì)特性分類對(duì)應(yīng)的幀內(nèi)平滑因子,對(duì)初步調(diào)整后的高頻帶頻域包絡(luò)參數(shù)進(jìn)行再調(diào)整,得到調(diào)整后的高頻帶參數(shù)。
全文摘要
本發(fā)明實(shí)施例公開了一種頻帶擴(kuò)展的方法和裝置,以方法的實(shí)現(xiàn)為例,包括獲取低頻帶信號(hào)的特征矢量;根據(jù)所述特征矢量及預(yù)設(shè)的統(tǒng)計(jì)特性分類特征矢量集對(duì)對(duì)所述低頻帶信號(hào)進(jìn)行分類,得到統(tǒng)計(jì)特性分類結(jié)果;根據(jù)所述統(tǒng)計(jì)特性分類結(jié)果、特征矢量以及預(yù)設(shè)的統(tǒng)計(jì)特性分類狀態(tài)轉(zhuǎn)移矩陣,得到預(yù)估的高頻帶參數(shù);根據(jù)所述統(tǒng)計(jì)特性分類結(jié)果及預(yù)設(shè)的后處理平滑因子集,對(duì)所述預(yù)估的高頻帶參數(shù)進(jìn)行調(diào)整,得到調(diào)整后的高頻帶參數(shù);根據(jù)調(diào)整后的高頻帶參數(shù),重建高頻帶信號(hào)。上述方法,使得獲得的擴(kuò)展頻帶參數(shù)信息更加有針對(duì)性,幀間過渡更加平滑,得到的擴(kuò)展出的信號(hào)具有更高的聽覺感受。
文檔編號(hào)G10L21/038GK102339607SQ20101023303
公開日2012年2月1日 申請(qǐng)日期2010年7月16日 優(yōu)先權(quán)日2010年7月16日
發(fā)明者本特·凱瑟, 皮特·瓦里, 馬格納斯·斯卡弗 申請(qǐng)人:華為技術(shù)有限公司