專利名稱:用于寬帶語(yǔ)音解碼中噪聲增強(qiáng)后處理的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語(yǔ)音編解碼技術(shù),更具體地說(shuō),涉及一種用于寬帶語(yǔ)音解碼中噪聲增強(qiáng)后處理的方法及裝置。
背景技術(shù):
語(yǔ)音編/解碼器廣泛地應(yīng)用于數(shù)字通信系統(tǒng),有效的發(fā)送/存儲(chǔ)語(yǔ)音信號(hào)。在數(shù)字系統(tǒng)中,輸入的模擬語(yǔ)音信號(hào)經(jīng)過(guò)采樣轉(zhuǎn)化到數(shù)字域,在數(shù)字域中,對(duì)連續(xù)的語(yǔ)音采樣做進(jìn)一步處理。即語(yǔ)音編碼器的輸入為語(yǔ)音采樣,輸出則為壓縮的比特流。壓縮的比特流通過(guò)信道傳入解碼端,語(yǔ)音解碼器接收該比特流,并產(chǎn)生重構(gòu)的語(yǔ)音信號(hào)。在CELP (Code Excited Linear Prediction,碼激勵(lì)線性預(yù)測(cè))編碼中,數(shù)字語(yǔ)音信號(hào)以幀為單位進(jìn)行編碼傳輸。對(duì)于每幀數(shù)字語(yǔ)音信號(hào),編碼器從中抽取多個(gè)編碼參數(shù),并將這些編碼參數(shù)發(fā)送/存儲(chǔ)。而CELP解碼器則是處理所接收的編碼參數(shù)重構(gòu)合成語(yǔ)音信號(hào)的指定幀。在CELP編解碼模式下,信道中傳輸?shù)木幋a參數(shù)有LSF (Linear Spectrum Frequencies,線譜頻率)或 ISF (ImmitanceSpectrumFrequencies,導(dǎo)譜步頁(yè)率);基音參數(shù),包括基音延遲和基音增益;革新激勵(lì)參數(shù),包括固定碼本索引和增益;LSF或ISF系數(shù)按幀為單位進(jìn)行編碼傳輸,基音參數(shù)和革新激勵(lì)參數(shù)一般按子幀為單位進(jìn)行編碼傳輸。其中,基音參數(shù)和革新激勵(lì)參數(shù)描述了激勵(lì)信號(hào)。LSF/ISF是LP(Linear Prediction,線性預(yù)測(cè))濾波器的系數(shù)的頻域表現(xiàn)形式。激勵(lì)信號(hào)可以看作聲門的輸出,LP濾波器可以看作聲道模型。所以當(dāng)激勵(lì)信號(hào)通過(guò)LP濾波器后,就得到輸出的合成
語(yǔ)音信號(hào)。為了提高解碼后合成語(yǔ)音的質(zhì)量,通常會(huì)在解碼端進(jìn)行一些增強(qiáng)后處理。在CELP編碼中,其激勵(lì)產(chǎn)生的二元模型中包括了模擬濁音特性的自適應(yīng)碼本激勵(lì)和模擬清音特性的固定碼本激勵(lì),其總的激勵(lì)為自適應(yīng)碼本激勵(lì)和固定碼本激勵(lì)的和,最后總的激勵(lì)通過(guò)一個(gè)合成濾波器得到合成語(yǔ)音。當(dāng)人聲趨向清音特性時(shí),在解碼端對(duì)模擬清音特性的固定碼本激勵(lì)進(jìn)行一定的噪聲增強(qiáng)可以提高合成語(yǔ)音的質(zhì)量。AMR-WB (ITU-T G. 722. 2)語(yǔ)音編碼標(biāo)準(zhǔn)是一種寬帶語(yǔ)音編碼標(biāo)準(zhǔn),該標(biāo)準(zhǔn)采用的自適應(yīng)噪聲增強(qiáng)算法的實(shí)現(xiàn)方法如下(I)對(duì)初始的固定碼本增益進(jìn)行修正
權(quán)利要求
1.一種用于寬帶語(yǔ)音解碼中噪聲增強(qiáng)后處理的方法,其特征在于,包括如下步驟 S1`、檢測(cè)當(dāng)前幀的語(yǔ)音/非語(yǔ)音特性,計(jì)算出當(dāng)前幀的噪聲因子; S2、確定該噪聲因子是否大于一預(yù)設(shè)的門限值; S3、在噪聲因子大于預(yù)設(shè)的門限值時(shí),對(duì)當(dāng)前幀的固定碼矢執(zhí)行能量平滑處理,得到經(jīng)過(guò)能量平滑后的固定碼矢; S4、將當(dāng)前幀的自適應(yīng)碼矢與該經(jīng)過(guò)能量平滑后的固定碼矢相加,合成激勵(lì)信號(hào)。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述步驟SI進(jìn)一步包括 S11、通過(guò)下式計(jì)算當(dāng)前譜包絡(luò)和一個(gè)長(zhǎng)時(shí)平均譜包絡(luò)之間的距離d,
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述預(yù)設(shè)的門限值為I。
4.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述步驟S3進(jìn)一步包括 S31、基于當(dāng)前幀的噪聲因子和自適應(yīng)碼矢增益計(jì)算能量平滑因子 ec=a*(Yn-l), 其中,es為能量平滑因子,Yn為噪聲因子,a=l-b,且b為自適應(yīng)碼本增益; S32、確定當(dāng)前幀的固定碼矢能量是否小于上一幀的固定碼矢能量; S33、在當(dāng)前幀的固定碼矢能量小于上一幀的固定碼矢能量時(shí),通過(guò)下式對(duì)當(dāng)前幀的固定碼矢執(zhí)行能量平滑enel= (l+es) ene,且 enel ^ ene, 其中,ene為當(dāng)前幀的縮放的固定碼矢能量,且ene=g2CCT,其中,g為固定碼本增益,c為固定碼本激勵(lì),enel為平滑后的固定碼矢能量; S34、在當(dāng)前幀的固定碼矢能量不小于上一幀的固定碼矢能量時(shí),通過(guò)下式對(duì)當(dāng)前幀的固定碼矢執(zhí)行能量平滑enel= (l_es) ene,且 enel ≥ ene ; S35、通過(guò)下式計(jì)算固定碼矢的縮放因子k
5.一種用于寬帶語(yǔ)音解碼中噪聲增強(qiáng)后處理的裝置,其特征在于,包括 碼矢計(jì)算模塊,用于處理語(yǔ)音信號(hào)中每一幀的解碼參數(shù),分別計(jì)算出固定碼矢和自適應(yīng)碼矢;噪聲檢測(cè)模塊,用于檢測(cè)當(dāng)前幀的語(yǔ)音/非語(yǔ)音特性,計(jì)算出當(dāng)前幀的噪聲因子;能量平滑模塊,用于確定該噪聲因子是否大于一預(yù)設(shè)的門限值,并在噪聲因子大于預(yù)設(shè)的門限值時(shí),對(duì)當(dāng)前幀的固定碼矢執(zhí)行能量平滑處理,得到經(jīng)過(guò)能量平滑后的固定碼矢; 合成模塊,用于將當(dāng)前幀的自適應(yīng)碼矢與該經(jīng)過(guò)能量平滑后的固定碼矢相加,合成激勵(lì)信號(hào)。
6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述碼矢計(jì)算模塊進(jìn)一步包括 固定碼矢計(jì)算模塊,用于將碼本索引解碼并用固定碼本增益作為縮放因子進(jìn)行縮放,得到縮放后的所述固定碼矢; 自適應(yīng)碼矢計(jì)算模塊,用于將基音索引解碼并用自適應(yīng)碼本增益作為縮放因子進(jìn)行縮放,得到縮放后的所述自適應(yīng)碼矢。
7.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述噪聲檢測(cè)模塊進(jìn)一步包括 距離計(jì)算子模塊,用于通過(guò)下式計(jì)算當(dāng)前譜包絡(luò)和一個(gè)長(zhǎng)時(shí)平均譜包絡(luò)之間的距離dq
8.根據(jù)權(quán)利要求5所述的裝置,其特征在于,所述能量平滑模塊進(jìn)一步包括 能量平滑因子計(jì)算子模塊,用于基于當(dāng)前幀的噪聲因子和自適應(yīng)碼矢增益計(jì)算能量平滑因子es=a*(Yn-l), 其中,es為能量平滑因子,Yn為噪聲因子,a=l-b,且b為自適應(yīng)碼本增益; 能量平滑子模塊,用于確定當(dāng)前幀的固定碼矢能量是否小于上一幀的固定碼矢能量,并在當(dāng)前幀的固定碼矢能量小于上一幀的固定碼矢能量時(shí),通過(guò)下式對(duì)當(dāng)前幀的固定碼矢執(zhí)行能量平滑enel= (l+es) ene,且 enel ^ ene, 以及在當(dāng)前幀的固定碼矢能量不小于上一幀的固定碼矢能量時(shí),通過(guò)下式對(duì)當(dāng)前幀的固定碼矢執(zhí)行能量平滑 enel= (l-es) ene, JeL enel ^ ene, 其中,ene為當(dāng)前幀的縮放的固定碼矢能量,且ene=g2CCT,其中,g為固定碼本增益,c為固定碼本激勵(lì),enel為平滑后的固定碼矢能量; 縮放因子計(jì)算子模塊,用于通過(guò)下式計(jì)算固定碼矢的縮放因子k
9.一種用于寬帶語(yǔ)音解碼的方法,其特征在于,包括如下步驟 a、對(duì)語(yǔ)音信號(hào)的解碼參數(shù)中的導(dǎo)譜頻率索引進(jìn)行解碼處理,得到合成濾波器的轉(zhuǎn)移函數(shù); b、通過(guò)根據(jù)權(quán)利要求1-4中任一項(xiàng)所述的方法得到激勵(lì)信號(hào); C、使用步驟a得到的轉(zhuǎn)移函數(shù)對(duì)步驟b得到的激勵(lì)信號(hào)進(jìn)行合成濾波,輸出語(yǔ)音信號(hào)。
10.一種用于寬帶語(yǔ)音解碼的解碼器,其特征在于,包括 參數(shù)處理模塊,用于對(duì)語(yǔ)音信號(hào)的解碼參數(shù)中的導(dǎo)譜頻率索引進(jìn)行解碼處理,得到合成濾波器的轉(zhuǎn)移函數(shù); 根據(jù)權(quán)利要求5-8中任一項(xiàng)所述的噪聲增強(qiáng)后處理的裝置,用于得到激勵(lì)信號(hào); 合成濾波器,用于使用參數(shù)解碼模塊得到的轉(zhuǎn)移函數(shù)對(duì)噪聲增強(qiáng)后處理裝置得到的激勵(lì)信號(hào)進(jìn)行合成濾波,輸出語(yǔ)音信號(hào)。
全文摘要
本發(fā)明涉及一種用于寬帶語(yǔ)音解碼中噪聲增強(qiáng)后處理的方法和裝置。所述方法包括S1、檢測(cè)當(dāng)前幀的語(yǔ)音/非語(yǔ)音特性,計(jì)算出當(dāng)前幀的噪聲因子;S2、確定該噪聲因子是否大于一預(yù)設(shè)的門限值;S3、在噪聲因子大于預(yù)設(shè)的門限值時(shí),對(duì)當(dāng)前幀的固定碼矢執(zhí)行能量平滑處理,得到經(jīng)過(guò)能量平滑后的固定碼矢;S4、將當(dāng)前幀的自適應(yīng)碼矢與該經(jīng)過(guò)能量平滑后的固定碼矢相加,合成激勵(lì)信號(hào)。本發(fā)明還涉及一種用于寬帶語(yǔ)音解碼的方法和解碼器。本發(fā)明通過(guò)解碼語(yǔ)音信號(hào)的噪聲因子的特性對(duì)固定碼矢的能量進(jìn)行平滑,從而達(dá)到噪聲增強(qiáng)的目的。本發(fā)明能夠適用于各種語(yǔ)音編解碼器,算法運(yùn)算復(fù)雜度比較低,并且不額外增加傳輸碼率。
文檔編號(hào)G10L19/12GK102968997SQ20121043608
公開(kāi)日2013年3月13日 申請(qǐng)日期2012年11月5日 優(yōu)先權(quán)日2012年11月5日
發(fā)明者張勇, 閆建新 申請(qǐng)人:深圳廣晟信源技術(shù)有限公司