基于聽(tīng)覺(jué)感知模型的多通道語(yǔ)音增強(qiáng)方法
【專利摘要】本發(fā)明涉及一種基于聽(tīng)覺(jué)感知模型的多通道語(yǔ)音增強(qiáng)方法,所述方法包括:將輸入信號(hào)非均勻通道劃分為多個(gè)通道信號(hào);檢測(cè)每個(gè)通道的噪聲級(jí)得到噪聲級(jí)數(shù)據(jù);根據(jù)所述噪聲級(jí)數(shù)據(jù)計(jì)算得到每個(gè)通道的通道增益;每個(gè)所述通道的通道信號(hào)與通道增益的積作為該通道的增益信號(hào);將所述每個(gè)通道的增益信號(hào)進(jìn)行信號(hào)綜合得到輸出信號(hào);發(fā)送該輸出信號(hào)。本發(fā)明中采用的模擬聽(tīng)覺(jué)感知模型的濾波器將加權(quán)疊接相加結(jié)構(gòu)與全通變換相結(jié)合,實(shí)現(xiàn)在通道數(shù)目較少的情況下模擬人耳聽(tīng)覺(jué)分辨率,同時(shí),具有較低的計(jì)算復(fù)雜度。而且,在信號(hào)綜合過(guò)程中加入了全通反變換操作,克服了現(xiàn)有技術(shù)中相位失真的問(wèn)題,可應(yīng)用于實(shí)時(shí)信號(hào)處理。
【專利說(shuō)明】基于聽(tīng)覺(jué)感知模型的多通道語(yǔ)音增強(qiáng)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語(yǔ)音數(shù)字信號(hào)處理技術(shù),具體涉及一種基于聽(tīng)覺(jué)感知模型的多通道語(yǔ)音增強(qiáng)方法。
【背景技術(shù)】
[0002]語(yǔ)音增強(qiáng)是語(yǔ)音信號(hào)處理的一個(gè)重要分支,其目的是改善音質(zhì),提高清晰度和可懂度,減少聽(tīng)覺(jué)疲勞。語(yǔ)音增強(qiáng)的主要方法之一是譜減法,它通過(guò)從含噪語(yǔ)音功率譜中減去噪聲功率譜來(lái)估計(jì)干凈語(yǔ)音的功率譜。傳統(tǒng)的譜減法是在某幀語(yǔ)音經(jīng)過(guò)快速傅立葉變換后的整個(gè)頻域上減去一個(gè)相同的譜減參數(shù)。而語(yǔ)音和實(shí)際環(huán)境中的非平穩(wěn)噪聲在頻域上是非均勻分布的。相應(yīng)的,噪聲信號(hào)在不同的頻帶上對(duì)語(yǔ)音信號(hào)的影響也是不同的。因此,人們提出了多通道語(yǔ)音增強(qiáng)技術(shù)。典型的多通道語(yǔ)音增強(qiáng)系統(tǒng)是先用濾波器組將信號(hào)劃分為多個(gè)通道,對(duì)每個(gè)通道的信號(hào)單獨(dú)進(jìn)行語(yǔ)音增強(qiáng)處理。最后,將處理后的各通道信號(hào)綜合成一路信號(hào)。
[0003]多通道語(yǔ)音增強(qiáng)系統(tǒng)設(shè)計(jì)中的一個(gè)關(guān)鍵問(wèn)題是如何使系統(tǒng)的頻率分辨率與人類聽(tīng)覺(jué)系統(tǒng)的頻率分辨率相匹配,又可以盡量減少通道數(shù)目。針對(duì)以離散傅立葉變換(Discrete Fourier Transform, DFT)為基礎(chǔ)的多通道語(yǔ)音增強(qiáng)系統(tǒng)只能提供均勻通道劃分的問(wèn)題,專利號(hào)為US7277554的發(fā)明提出了用一階全通濾波器代替離散傅立葉變換中的延遲單元,從而實(shí)現(xiàn)在非線性頻率變換域上計(jì)算壓縮放大增益的語(yǔ)音增強(qiáng)系統(tǒng),適當(dāng)選擇全通濾波器的極點(diǎn)位置,該系統(tǒng)可以較好地模擬聽(tīng)覺(jué)系統(tǒng)。但是,由于全通濾波器的群延遲與頻率有關(guān),該系統(tǒng)會(huì)造成信號(hào)的不同頻率成分通過(guò)該系統(tǒng)的時(shí)間不同,導(dǎo)致信號(hào)失真,這種由于頻率相關(guān)的群延遲產(chǎn)生的信號(hào)失真在通道數(shù)目較多時(shí)尤為嚴(yán)重。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的是針對(duì)現(xiàn)有技術(shù)的缺陷,提供了一種基于聽(tīng)覺(jué)感知模型的多通道語(yǔ)音增強(qiáng)方法,實(shí)現(xiàn)在通道數(shù)目較少的情況下模擬人耳聽(tīng)覺(jué)分辨率,本發(fā)明既具有加權(quán)疊接相加結(jié)構(gòu)的高效率,同時(shí)克服了目前頻率變換濾波器組方法中存在的無(wú)法實(shí)時(shí)實(shí)現(xiàn)和相位失真的問(wèn)題。
[0005]為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于聽(tīng)覺(jué)感知模型的多通道語(yǔ)音增強(qiáng)方法,所述方法包括以下步驟:
[0006]將輸入信號(hào)非均勻通道劃分為多個(gè)通道信號(hào);
[0007]檢測(cè)每個(gè)通道的噪聲級(jí)得到噪聲級(jí)數(shù)據(jù);
[0008]根據(jù)所述噪聲級(jí)數(shù)據(jù)計(jì)算得到每個(gè)通道的通道增益;
[0009]每個(gè)所述通道的通道信號(hào)與通道增益的積作為該通道的增益信號(hào);
[0010]將所述每個(gè)通道的增益信號(hào)進(jìn)行信號(hào)綜合得到輸出信號(hào);
[0011]發(fā)送該輸出信號(hào)。
[0012]優(yōu)選的,將輸入信號(hào)非均勻通道劃分為多個(gè)通道信號(hào)具體包括:[0013]截取有限長(zhǎng)度的信號(hào)片段,并對(duì)所述信號(hào)片段進(jìn)行全通變換得到全通變換信號(hào);其中,所述信號(hào)片段的長(zhǎng)度P為不大于(l+|b|)L(l-|b|)的最大整數(shù),截取步長(zhǎng)為D,其中L為分析原型濾波器的長(zhǎng)度,b為全通變換參數(shù),全通變換為L(zhǎng)-1階,并且所述全通變換利用L-1個(gè)全通濾波器;
[0014]利用分析原型濾波器的時(shí)間翻轉(zhuǎn)h(_r)對(duì)所述全通變換信號(hào)進(jìn)行加權(quán)處理得到加權(quán)信號(hào);
[0015]將所述加權(quán)信號(hào)平均分成L/K個(gè)長(zhǎng)度為K的加權(quán)信號(hào)片段,并將所述加權(quán)信號(hào)片段相加得到和信號(hào);
[0016]對(duì)所述和信號(hào)進(jìn)行K點(diǎn)離散傅立葉變換得到變換信號(hào),K為通道數(shù)目;
[0017]所述變換信號(hào)與中心頻率調(diào)整系數(shù)eXp(jmD0 Icok))之積為各個(gè)通道信號(hào)的
序列之⑷,其為第k個(gè)分量對(duì)應(yīng)第k個(gè)通道m(xù)時(shí)刻的輸出,其中GJk = 2k /K,k =
0,? ? ?,K-1 o
[0018]優(yōu)選的,全通變換具體包括:
[0019]將所述信號(hào)片段s (n)進(jìn)行時(shí)間翻轉(zhuǎn)得到翻轉(zhuǎn)信號(hào)片段s (N-n);
[0020]將所述翻轉(zhuǎn)信號(hào)片段s (N-n)進(jìn)行全通濾波器A (z)鏈處理,當(dāng)n = N時(shí)取值,得到
非線性頻率變換結(jié)果.S(P);其中全通濾波器利用下式實(shí)現(xiàn):
[0021]
【權(quán)利要求】
1.一種基于聽(tīng)覺(jué)感知模型的多通道語(yǔ)音增強(qiáng)方法,其特征在于,包括以下步驟: 將輸入信號(hào)非均勻通道劃分為多個(gè)通道信號(hào); 檢測(cè)每個(gè)通道的噪聲級(jí)得到噪聲級(jí)數(shù)據(jù); 根據(jù)所述噪聲級(jí)數(shù)據(jù)計(jì)算得到每個(gè)通道的通道增益; 每個(gè)所述通道的通道信號(hào)與通道增益的積作為該通道的增益信號(hào); 將所述每個(gè)通道的增益信號(hào)進(jìn)行信號(hào)綜合得到輸出信號(hào); 發(fā)送該輸出信號(hào)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,將輸入信號(hào)非均勻通道劃分為多個(gè)通道信號(hào)具體包括: 截取有限長(zhǎng)度的信號(hào)片段,并對(duì)所述信號(hào)片段進(jìn)行全通變換得到全通變換信號(hào);其中,所述信號(hào)片段的長(zhǎng)度P為不大于(l+|b|)L(l-|b|)的最大整數(shù),截取步長(zhǎng)為D,其中L為分析原型濾波器的長(zhǎng)度,b為全通變換參數(shù),全通變換為L(zhǎng)-1階,并且所述全通變換利用L-1個(gè)全通濾波器; 利用分析原型濾波器的時(shí)間翻轉(zhuǎn)h(-r)對(duì)所述全通變換信號(hào)進(jìn)行加權(quán)處理得到加權(quán)信號(hào); 將所述加權(quán)信號(hào)平均分成L/K個(gè)長(zhǎng)度為K的加權(quán)信號(hào)片段,并將所述加權(quán)信號(hào)片段相加得到和信號(hào);· 對(duì)所述和信號(hào)進(jìn)行K點(diǎn)離散傅立葉變換得到變換信號(hào),K為通道數(shù)目; 所述變換信號(hào)與中心頻率調(diào)整系數(shù)exp(jmD0-Hcok))之積為各個(gè)通道信號(hào)的序列XJk),其為第k個(gè)分量對(duì)應(yīng)第k個(gè)通道m(xù)時(shí)刻的輸出,其中《 k = 2k Ji /K,k = 0,...,K-1。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述全通變換具體包括: 將所述信號(hào)片段s (n)進(jìn)行時(shí)間翻轉(zhuǎn)得到翻轉(zhuǎn)信號(hào)片段s (N-n); 將所述翻轉(zhuǎn)信號(hào)片段s (N-n)進(jìn)行全通濾波器A (z)鏈處理,當(dāng)n = N時(shí)取值,得到非線性頻率變換結(jié)果&/?);其中全通濾波器利用下式實(shí)現(xiàn):z—1 -b A(z) =-T, -1、h < 1.。
\-bz '
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,將所述每個(gè)通道的增益信號(hào)進(jìn)行信號(hào)綜合得到輸出信號(hào)具體包括: 所述各通道信號(hào)序列t(幻與另一組中心頻率調(diào)整系數(shù)exp(-jmD 0 H(Cok))之積為積信號(hào),其中,《k = 2kJi/K,k = 0,...,K-1 ; 對(duì)所述積信號(hào)進(jìn)行K點(diǎn)離散傅立葉反變換得到反變換信號(hào); 將所述反變換信號(hào)復(fù)制L/K次,形成一個(gè)長(zhǎng)度為L(zhǎng)的序列; 利用綜合原型濾波器對(duì)所述序列進(jìn)行加權(quán)處理得到加權(quán)信號(hào); 對(duì)所述加權(quán)信號(hào)進(jìn)行全通反變換得到全通反變換信號(hào),其中全通反變換為P-1階,b為全通反變換參數(shù); 將所述全通反變換信號(hào)疊加至長(zhǎng)度為P的輸出緩存,并將輸出緩存的左側(cè)移出D個(gè)點(diǎn)作為疊加處理后的信號(hào),同時(shí)將輸出緩存右側(cè)補(bǔ)充D個(gè)零; 將所述疊加處理后的信號(hào)通過(guò)頻率響應(yīng)為一階全通濾波器A (z)的群延遲的倒數(shù)的濾波器,得到輸出信號(hào)。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述對(duì)加權(quán)處理的結(jié)果進(jìn)行P-1階參數(shù)為b的全通反變換,可以通過(guò)P-1階參數(shù)為_(kāi)b的全通變換實(shí)現(xiàn)。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述輸入信號(hào)為實(shí)信號(hào)時(shí),所述檢測(cè)各個(gè)通道的噪聲級(jí)和計(jì)算所述各個(gè)通道的增益值僅需對(duì)第O至K/2通道信號(hào)進(jìn)行處理。
【文檔編號(hào)】G10L21/0208GK103714825SQ201410019535
【公開(kāi)日】2014年4月9日 申請(qǐng)日期:2014年1月16日 優(yōu)先權(quán)日:2014年1月16日
【發(fā)明者】孟曉輝, 肖靈 申請(qǐng)人:中國(guó)科學(xué)院聲學(xué)研究所