基于聽(tīng)覺(jué)感知模型的多通道語(yǔ)音增強(qiáng)方法

文檔序號(hào)：2827233閱讀：191來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

基于聽(tīng)覺(jué)感知模型的多通道語(yǔ)音增強(qiáng)方法
【專利摘要】本發(fā)明涉及一種基于聽(tīng)覺(jué)感知模型的多通道語(yǔ)音增強(qiáng)方法，所述方法包括：將輸入信號(hào)非均勻通道劃分為多個(gè)通道信號(hào)；檢測(cè)每個(gè)通道的噪聲級(jí)得到噪聲級(jí)數(shù)據(jù)；根據(jù)所述噪聲級(jí)數(shù)據(jù)計(jì)算得到每個(gè)通道的通道增益；每個(gè)所述通道的通道信號(hào)與通道增益的積作為該通道的增益信號(hào)；將所述每個(gè)通道的增益信號(hào)進(jìn)行信號(hào)綜合得到輸出信號(hào)；發(fā)送該輸出信號(hào)。本發(fā)明中采用的模擬聽(tīng)覺(jué)感知模型的濾波器將加權(quán)疊接相加結(jié)構(gòu)與全通變換相結(jié)合，實(shí)現(xiàn)在通道數(shù)目較少的情況下模擬人耳聽(tīng)覺(jué)分辨率，同時(shí)，具有較低的計(jì)算復(fù)雜度。而且，在信號(hào)綜合過(guò)程中加入了全通反變換操作，克服了現(xiàn)有技術(shù)中相位失真的問(wèn)題，可應(yīng)用于實(shí)時(shí)信號(hào)處理。
【專利說(shuō)明】基于聽(tīng)覺(jué)感知模型的多通道語(yǔ)音增強(qiáng)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語(yǔ)音數(shù)字信號(hào)處理技術(shù)，具體涉及一種基于聽(tīng)覺(jué)感知模型的多通道語(yǔ)音增強(qiáng)方法。
【背景技術(shù)】
[0002]語(yǔ)音增強(qiáng)是語(yǔ)音信號(hào)處理的一個(gè)重要分支，其目的是改善音質(zhì)，提高清晰度和可懂度，減少聽(tīng)覺(jué)疲勞。語(yǔ)音增強(qiáng)的主要方法之一是譜減法，它通過(guò)從含噪語(yǔ)音功率譜中減去噪聲功率譜來(lái)估計(jì)干凈語(yǔ)音的功率譜。傳統(tǒng)的譜減法是在某幀語(yǔ)音經(jīng)過(guò)快速傅立葉變換后的整個(gè)頻域上減去一個(gè)相同的譜減參數(shù)。而語(yǔ)音和實(shí)際環(huán)境中的非平穩(wěn)噪聲在頻域上是非均勻分布的。相應(yīng)的，噪聲信號(hào)在不同的頻帶上對(duì)語(yǔ)音信號(hào)的影響也是不同的。因此，人們提出了多通道語(yǔ)音增強(qiáng)技術(shù)。典型的多通道語(yǔ)音增強(qiáng)系統(tǒng)是先用濾波器組將信號(hào)劃分為多個(gè)通道，對(duì)每個(gè)通道的信號(hào)單獨(dú)進(jìn)行語(yǔ)音增強(qiáng)處理。最后，將處理后的各通道信號(hào)綜合成一路信號(hào)。
[0003]多通道語(yǔ)音增強(qiáng)系統(tǒng)設(shè)計(jì)中的一個(gè)關(guān)鍵問(wèn)題是如何使系統(tǒng)的頻率分辨率與人類聽(tīng)覺(jué)系統(tǒng)的頻率分辨率相匹配，又可以盡量減少通道數(shù)目。針對(duì)以離散傅立葉變換(Discrete Fourier Transform, DFT)為基礎(chǔ)的多通道語(yǔ)音增強(qiáng)系統(tǒng)只能提供均勻通道劃分的問(wèn)題，專利號(hào)為US7277554的發(fā)明提出了用一階全通濾波器代替離散傅立葉變換中的延遲單元，從而實(shí)現(xiàn)在非線性頻率變換域上計(jì)算壓縮放大增益的語(yǔ)音增強(qiáng)系統(tǒng)，適當(dāng)選擇全通濾波器的極點(diǎn)位置，該系統(tǒng)可以較好地模擬聽(tīng)覺(jué)系統(tǒng)。但是，由于全通濾波器的群延遲與頻率有關(guān)，該系統(tǒng)會(huì)造成信號(hào)的不同頻率成分通過(guò)該系統(tǒng)的時(shí)間不同，導(dǎo)致信號(hào)失真，這種由于頻率相關(guān)的群延遲產(chǎn)生的信號(hào)失真在通道數(shù)目較多時(shí)尤為嚴(yán)重。

【發(fā)明內(nèi)容】

[0004]本發(fā)明的目的是針對(duì)現(xiàn)有技術(shù)的缺陷，提供了一種基于聽(tīng)覺(jué)感知模型的多通道語(yǔ)音增強(qiáng)方法，實(shí)現(xiàn)在通道數(shù)目較少的情況下模擬人耳聽(tīng)覺(jué)分辨率，本發(fā)明既具有加權(quán)疊接相加結(jié)構(gòu)的高效率，同時(shí)克服了目前頻率變換濾波器組方法中存在的無(wú)法實(shí)時(shí)實(shí)現(xiàn)和相位失真的問(wèn)題。
[0005]為實(shí)現(xiàn)上述目的，本發(fā)明提供了一種基于聽(tīng)覺(jué)感知模型的多通道語(yǔ)音增強(qiáng)方法，所述方法包括以下步驟:
[0006]將輸入信號(hào)非均勻通道劃分為多個(gè)通道信號(hào)；
[0007]檢測(cè)每個(gè)通道的噪聲級(jí)得到噪聲級(jí)數(shù)據(jù)；
[0008]根據(jù)所述噪聲級(jí)數(shù)據(jù)計(jì)算得到每個(gè)通道的通道增益；
[0009]每個(gè)所述通道的通道信號(hào)與通道增益的積作為該通道的增益信號(hào)；
[0010]將所述每個(gè)通道的增益信號(hào)進(jìn)行信號(hào)綜合得到輸出信號(hào)；
[0011]發(fā)送該輸出信號(hào)。
[0012]優(yōu)選的，將輸入信號(hào)非均勻通道劃分為多個(gè)通道信號(hào)具體包括:[0013]截取有限長(zhǎng)度的信號(hào)片段，并對(duì)所述信號(hào)片段進(jìn)行全通變換得到全通變換信號(hào)；其中，所述信號(hào)片段的長(zhǎng)度P為不大于(l+|b|)L(l-|b|)的最大整數(shù)，截取步長(zhǎng)為D，其中L為分析原型濾波器的長(zhǎng)度，b為全通變換參數(shù)，全通變換為L(zhǎng)-1階，并且所述全通變換利用L-1個(gè)全通濾波器；
[0014]利用分析原型濾波器的時(shí)間翻轉(zhuǎn)h(_r)對(duì)所述全通變換信號(hào)進(jìn)行加權(quán)處理得到加權(quán)信號(hào)；
[0015]將所述加權(quán)信號(hào)平均分成L/K個(gè)長(zhǎng)度為K的加權(quán)信號(hào)片段，并將所述加權(quán)信號(hào)片段相加得到和信號(hào)；
[0016]對(duì)所述和信號(hào)進(jìn)行K點(diǎn)離散傅立葉變換得到變換信號(hào)，K為通道數(shù)目；
[0017]所述變換信號(hào)與中心頻率調(diào)整系數(shù)eXp(jmD0 Icok))之積為各個(gè)通道信號(hào)的
序列之⑷，其為第k個(gè)分量對(duì)應(yīng)第k個(gè)通道m(xù)時(shí)刻的輸出，其中GJk = 2k /K，k =
0，? ? ?，K-1 o
[0018]優(yōu)選的，全通變換具體包括:
[0019]將所述信號(hào)片段s (n)進(jìn)行時(shí)間翻轉(zhuǎn)得到翻轉(zhuǎn)信號(hào)片段s (N-n)；
[0020]將所述翻轉(zhuǎn)信號(hào)片段s (N-n)進(jìn)行全通濾波器A (z)鏈處理，當(dāng)n = N時(shí)取值，得到
非線性頻率變換結(jié)果.S(P)；其中全通濾波器利用下式實(shí)現(xiàn):

[0021]
【權(quán)利要求】
1.一種基于聽(tīng)覺(jué)感知模型的多通道語(yǔ)音增強(qiáng)方法，其特征在于，包括以下步驟: 將輸入信號(hào)非均勻通道劃分為多個(gè)通道信號(hào)；檢測(cè)每個(gè)通道的噪聲級(jí)得到噪聲級(jí)數(shù)據(jù)；根據(jù)所述噪聲級(jí)數(shù)據(jù)計(jì)算得到每個(gè)通道的通道增益；每個(gè)所述通道的通道信號(hào)與通道增益的積作為該通道的增益信號(hào)；將所述每個(gè)通道的增益信號(hào)進(jìn)行信號(hào)綜合得到輸出信號(hào)；發(fā)送該輸出信號(hào)。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，將輸入信號(hào)非均勻通道劃分為多個(gè)通道信號(hào)具體包括: 截取有限長(zhǎng)度的信號(hào)片段，并對(duì)所述信號(hào)片段進(jìn)行全通變換得到全通變換信號(hào)；其中，所述信號(hào)片段的長(zhǎng)度P為不大于(l+|b|)L(l-|b|)的最大整數(shù)，截取步長(zhǎng)為D，其中L為分析原型濾波器的長(zhǎng)度，b為全通變換參數(shù)，全通變換為L(zhǎng)-1階，并且所述全通變換利用L-1個(gè)全通濾波器；利用分析原型濾波器的時(shí)間翻轉(zhuǎn)h(-r)對(duì)所述全通變換信號(hào)進(jìn)行加權(quán)處理得到加權(quán)信號(hào); 將所述加權(quán)信號(hào)平均分成L/K個(gè)長(zhǎng)度為K的加權(quán)信號(hào)片段，并將所述加權(quán)信號(hào)片段相加得到和信號(hào)；· 對(duì)所述和信號(hào)進(jìn)行K點(diǎn)離散傅立葉變換得到變換信號(hào)，K為通道數(shù)目；所述變換信號(hào)與中心頻率調(diào)整系數(shù)exp(jmD0-Hcok))之積為各個(gè)通道信號(hào)的序列XJk),其為第k個(gè)分量對(duì)應(yīng)第k個(gè)通道m(xù)時(shí)刻的輸出，其中《 k = 2k Ji /K，k = 0，...，K-1。
3.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述全通變換具體包括: 將所述信號(hào)片段s (n)進(jìn)行時(shí)間翻轉(zhuǎn)得到翻轉(zhuǎn)信號(hào)片段s (N-n)；將所述翻轉(zhuǎn)信號(hào)片段s (N-n)進(jìn)行全通濾波器A (z)鏈處理，當(dāng)n = N時(shí)取值，得到非線性頻率變換結(jié)果&/?);其中全通濾波器利用下式實(shí)現(xiàn):z—1 -b A(z) =-T, -1、h < 1.。
\-bz '
4.根據(jù)權(quán)利要求1所述的方法，其特征在于，將所述每個(gè)通道的增益信號(hào)進(jìn)行信號(hào)綜合得到輸出信號(hào)具體包括: 所述各通道信號(hào)序列t(幻與另一組中心頻率調(diào)整系數(shù)exp(-jmD 0 H(Cok))之積為積信號(hào)，其中，《k = 2kJi/K，k = 0，...，K-1 ; 對(duì)所述積信號(hào)進(jìn)行K點(diǎn)離散傅立葉反變換得到反變換信號(hào)；將所述反變換信號(hào)復(fù)制L/K次，形成一個(gè)長(zhǎng)度為L(zhǎng)的序列；利用綜合原型濾波器對(duì)所述序列進(jìn)行加權(quán)處理得到加權(quán)信號(hào)；對(duì)所述加權(quán)信號(hào)進(jìn)行全通反變換得到全通反變換信號(hào)，其中全通反變換為P-1階，b為全通反變換參數(shù)；將所述全通反變換信號(hào)疊加至長(zhǎng)度為P的輸出緩存，并將輸出緩存的左側(cè)移出D個(gè)點(diǎn)作為疊加處理后的信號(hào)，同時(shí)將輸出緩存右側(cè)補(bǔ)充D個(gè)零；將所述疊加處理后的信號(hào)通過(guò)頻率響應(yīng)為一階全通濾波器A (z)的群延遲的倒數(shù)的濾波器，得到輸出信號(hào)。
5.根據(jù)權(quán)利要求4所述的方法，其特征在于，所述對(duì)加權(quán)處理的結(jié)果進(jìn)行P-1階參數(shù)為b的全通反變換，可以通過(guò)P-1階參數(shù)為_(kāi)b的全通變換實(shí)現(xiàn)。
6.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述輸入信號(hào)為實(shí)信號(hào)時(shí)，所述檢測(cè)各個(gè)通道的噪聲級(jí)和計(jì)算所述各個(gè)通道的增益值僅需對(duì)第O至K/2通道信號(hào)進(jìn)行處理。
【文檔編號(hào)】G10L21/0208GK103714825SQ201410019535
【公開(kāi)日】2014年4月9日申請(qǐng)日期:2014年1月16日優(yōu)先權(quán)日:2014年1月16日
【發(fā)明者】孟曉輝, 肖靈申請(qǐng)人:中國(guó)科學(xué)院聲學(xué)研究所

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：孟曉輝;肖靈
技術(shù)所有人：中國(guó)科學(xué)院聲學(xué)研究所
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

聽(tīng)覺(jué)感知相關(guān)技術(shù)

根據(jù)感知覺(jué)通道的類型相關(guān)技術(shù)

單通道語(yǔ)音增強(qiáng)相關(guān)技術(shù)

從藍(lán)牙通道播放語(yǔ)音相關(guān)技術(shù)

語(yǔ)音通道相關(guān)技術(shù)

最新語(yǔ)音支付通道相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于聽(tīng)覺(jué)感知模型的多通道語(yǔ)音增強(qiáng)方法