一種音頻混響的抑制裝置及其抑制方法
【專利摘要】本發(fā)明公開了一種音頻混響的抑制裝置及其抑制方法,所述的裝置包括混響時間盲估計模塊、后期混響功率譜估計模塊、譜減模塊和復(fù)倒譜域濾波模塊?;祉懻Z音通過混響時間盲估計模塊,估計出混響時間;后期混響功率譜估計模塊利用所估計出的混響時間來建立混響統(tǒng)計模型,并對混響語音進行分析處理,得到后期混響功率譜;譜減模塊包括增益函數(shù)構(gòu)造和譜減實施模塊,先用混響語音功率譜和后期混響功率譜構(gòu)造出譜減增益函數(shù);再將譜減增益函數(shù)和混響語音輸入譜減實施模塊,得到前期語音;最后將前期語音輸入到復(fù)倒譜域濾波模塊,得到去混響的語音。本發(fā)明計算復(fù)雜度較低,便于實時處理,能明顯抑制音頻混響,有效提高語音質(zhì)量。
【專利說明】一種音頻混響的抑制裝置及其抑制方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種音頻處理技術(shù),特別是一種音頻混響的抑制裝置及其抑制方法?!颈尘凹夹g(shù)】
[0002]混響是由室內(nèi)聲波反射而產(chǎn)生的聲學(xué)現(xiàn)象。適量的混響能使聲音圓潤動聽,聽起來有空間感;若混響不足,聲音就會“發(fā)干”,聽起來不自然;但若混響過大,則聲音聽起來含混不清,音質(zhì)很差。
[0003]在許多采集聲音的場合,特別是當聲源與麥克風(fēng)距離較遠時,或室內(nèi)混響較強時,麥克風(fēng)采集的音頻信號中常含有較大的混響聲,這會嚴重影響語音的清晰度和可懂度,也會影響后續(xù)音頻處理系統(tǒng)(如語音識別系統(tǒng)等)的性能。此時,為了提高音頻質(zhì)量,就必須采用混響抑制技術(shù)。
[0004]Lebart, K., Boucher, J.M., Denbigh, P.N.發(fā)表的文章《A new method based onspectral subtraction for speech dereverberation》[Acta Acoustica,2001,87 (I):359-366]提出了基于Polack混響統(tǒng)計模型的單麥克風(fēng)混響抑制系統(tǒng)。該系統(tǒng)先根據(jù)混響時間構(gòu)造Polack混響統(tǒng)計模型;然后用Polack混響統(tǒng)計模型估計出后期混響功率譜;最后用譜減法去除后期混響,以獲得增強后的語音。該方法的主要缺點是:(I)要求已知混響時間,而實際應(yīng)用環(huán)境中混響時間通常是未知的;(2)實際中很難精確估計后期混響,因此該方法常會引入一些人工噪聲,即:過估計時,會產(chǎn)生“音樂”噪聲;欠估計時,會殘留較多噪聲。
[0005]Gomez Randy, Even Jani, Saruwatari Hirosh1.發(fā)表的文章《Distant talkingrobust speech recognition using late reflection components of room impulseresponse)) (IEEE Int.ernational Conference on Acoustics Speech and SignalProcessing, Las Vegas, USA, 2008:1520-6149)提出了一種混響抑制的快速方法。該方法用已測量得到的沖激響應(yīng)函數(shù)來估計房間沖激響應(yīng)的后期反射部分,然后與多子帶譜減技術(shù)相結(jié)合,抑制中后期混響對語音的影響。該方法計算量較小,能實現(xiàn)實時的混響抑制,但需要已知房間的沖激響應(yīng)函數(shù),這在實際中很難預(yù)先知道,即使在具備混響測試儀等設(shè)備時,測出房間沖激響應(yīng)函數(shù)也很煩瑣。
[0006]Buck M, Schmidt G U, Haulick T.發(fā)表的專利《Dereverberation system forusing a signal processing apparatus》(US2008292108, 2007)提出了一種室內(nèi)麥克
風(fēng)-揚聲器環(huán)境下的混響抑制系統(tǒng)。該系統(tǒng)將麥克風(fēng)音頻信號分解成一個或多個塊;然
后用混響能量估計器來估計這些信號塊中混響部分的能量;最后,用估計出的混響能量進行處理,以得到去混響后的音頻。該系統(tǒng)將麥克風(fēng)語音分成多個信號塊,對每個信號塊估計混響部分能量,這樣會顯著增加計算復(fù)雜度,難以實時處理。
[0007]本發(fā)明用到的簡稱解釋如下:
[0008]PESQ !Perceptual Evaluation of Speech Quality,語音質(zhì)量感知評價
[0009]SS:Spectral Subtraction,譜減法[0010]CF-SS:Cepstral Filter-Spectral Subtraction,復(fù)倒譜域濾波和譜減法
[0011]Polack 混響統(tǒng)計模型:Polack Statistical Reverberation Model
[0012]廣義混響統(tǒng)計模型:GeneralizedStatistical Reverberation Model
[0013]SIR:Signal to Interference Ratio,信干比
[0014]SRR:Signal to Reverberation Ratio,信混比
【發(fā)明內(nèi)容】
[0015]為解決現(xiàn)有技術(shù)存在的上述問題,本發(fā)明要設(shè)計一種可以實現(xiàn)以下目的的音頻混響的抑制裝置及其抑制方法:
[0016]1、避免混響時間測量、直接精確估計后期混響和測量房間沖激響應(yīng)函數(shù)等難題,實現(xiàn)語音信號的混響抑制,提高語音的聽覺感知質(zhì)量;
[0017]2、降低計算復(fù)雜度,易于實時處理。
[0018]為了實現(xiàn)上述目的,本發(fā)明的技術(shù)方案如下:一種音頻混響的抑制裝置,包括混響時間盲估計模塊、后期混響功率譜估計模塊、譜減模塊和復(fù)倒譜域濾波模塊。所述的混響時間盲估計模塊的輸入信號為含有混響的語音信號,其輸出端與后期混響功率譜估計模塊的輸入端連接;后期混響功率譜估計模塊的另一路輸入信號為含有混響的語音信號;譜減模塊的輸入端與后期混響功率譜估計模塊輸出端連接,其輸出連接到復(fù)倒譜域濾波模塊,復(fù)倒譜域濾波模塊輸出最終去混響后的語音。
[0019]一種音頻混響的抑制裝置的抑制方法,包括以下步驟:
[0020]A、混響時間盲估計
[0021]混響時間盲估計模塊接收混響語音并輸出估計出的混響時間;具體步驟如下:
[0022]AU、對混響語音進行線性預(yù)測分析,構(gòu)造低階線性預(yù)測濾波器;
[0023]計算每一幀混響語音X (η)的自相關(guān)函數(shù)R(k)
【權(quán)利要求】
1.一種音頻混響的抑制裝置,其特征在于:包括混響時間盲估計模塊、后期混響功率譜估計模塊、譜減模塊和復(fù)倒譜域濾波模塊;所述的混響時間盲估計模塊的輸入信號為含有混響的語音信號,其輸出端與后期混響功率譜估計模塊的輸入端連接;后期混響功率譜估計模塊的另一路輸入信號為含有混響的語音信號;譜減模塊的輸入端與后期混響功率譜估計模塊輸出端連接,其輸出連接到復(fù)倒譜域濾波模塊,復(fù)倒譜域濾波模塊輸出最終去混響后的語音。
2.一種音頻混響的抑制裝置的抑制方法,其特征在于:包括以下步驟: A、混響時間盲估計 混響時間盲估計模塊接收混響語音并輸出估計出的混響時間;具體步驟如下: AU、對混響語音進行線性預(yù)測分析,構(gòu)造低階線性預(yù)測濾波器; 計算每一巾貞混響語音X(η)的自相關(guān)函數(shù)R(k)
3.根據(jù)權(quán)利要求2所述的一種音頻混響的抑制裝置的抑制方法,其特征在于:所述的幀長N最佳值為240 ;所述的幀間隔L最佳值為100 ;對于fs=16kHz,所述的R最佳值為128,T1最佳值為32ms ;所述的Π最佳值為η=0.98 ;所述的系數(shù)α最佳值為0.1 ;所述的μ最佳值為0.01 ;所述的M最佳值為N/16,h最佳值為N/8。
【文檔編號】G10L21/02GK103440869SQ201310398174
【公開日】2013年12月11日 申請日期:2013年9月3日 優(yōu)先權(quán)日:2013年9月3日
【發(fā)明者】陳喆, 殷福亮, 彭雯雯 申請人:大連理工大學(xué)