專利名稱:噪聲抑制方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字濾波器設(shè)計(jì)領(lǐng)域。具體地,本發(fā)明涉及設(shè)計(jì)用于在表示聲學(xué)記錄 的信號(hào)中進(jìn)行噪聲抑制的數(shù)字濾波器的領(lǐng)域。
背景技術(shù):
由于自然環(huán)境中噪聲的普遍存在,現(xiàn)實(shí)世界聲音記錄典型地包含來(lái)自各種源的噪 聲。為了改進(jìn)聲音記錄的聲音質(zhì)量,已經(jīng)開(kāi)發(fā)了各種方法用于減小聲音記錄的噪聲水平。通 常,在這種方法中,根據(jù)期望頻率響應(yīng)H ( ω )來(lái)計(jì)算時(shí)域噪聲抑制濾波器,然后將時(shí)域噪聲 抑制濾波器應(yīng)用至聲音記錄。在理想的噪聲抑制濾波器中,期望聲學(xué)信號(hào)應(yīng)當(dāng)無(wú)失真地通過(guò)濾波器,而噪聲應(yīng) 當(dāng)被完全衰減。在實(shí)際濾波器中,這些屬性不能同時(shí)滿足(除非在沒(méi)有期望信號(hào)或沒(méi)有噪 聲或者期望信號(hào)和噪聲在頻譜上分離的特殊情況下)。因此,在確定濾波器的期望頻率響應(yīng) Η(ω)時(shí),對(duì)于期望信號(hào)和噪聲共存的頻率,必須進(jìn)行使期望信號(hào)失真與使噪聲失真之間的 權(quán)衡??梢酝ㄟ^(guò)各種方法來(lái)估計(jì)期望頻率響應(yīng)Η(ω),如頻譜減法。在“Low-distortion spectral subtraction for speech enhancement”, Peter Handel, Conference Proceedings of Eurospeech,pp. 1549-1553,ISSN1018-4074,1995 中討論了用于抑制噪聲 的頻譜減法的不同方面。在US5,706,395中,討論了頻譜減法并公開(kāi)了一種用于定義應(yīng)當(dāng) 將噪聲衰減至的水平的方法。在US5,706,395中,期望頻率響應(yīng)Η(ω)被箝位為衰減不能 低于最小值,其中根據(jù)US5,706,395,最小值可以依賴于要濾波的有噪話音信號(hào)的信噪比。 US5, 706,395對(duì)期望頻率響應(yīng)的箝位防止了噪聲抑制濾波器圍繞非常小的值波動(dòng),從而避 免了通常稱為音樂(lè)噪聲的噪聲失真。在許多頻譜減法方法中,作為信噪比(SNR)的函數(shù)來(lái)計(jì)算期望頻率響應(yīng)。由于在 特定頻率處有噪聲學(xué)信號(hào)的SNR隨時(shí)間變化,一般隨時(shí)間更新期望頻率響應(yīng)Η(ω)—通 常針對(duì)每個(gè)數(shù)據(jù)幀來(lái)更新期望頻率響應(yīng)H (ω)。這樣做的效果是,通常將在有噪話音信號(hào) 中處于恒定水平的噪聲衰減至以可察覺(jué)的方式隨時(shí)間顯著變化的水平,導(dǎo)致殘余噪聲的波 動(dòng)。這種不利效果通常稱為噪聲脈動(dòng),可以作為伴隨語(yǔ)音(shadow voice)而被聽(tīng)見(jiàn)。
發(fā)明內(nèi)容
本發(fā)明所涉及的問(wèn)題如何避免殘余噪聲中的不利波動(dòng)。這一問(wèn)題是通過(guò)一種設(shè)計(jì)數(shù)字濾波器的方法來(lái)解決的,所述數(shù)字濾波器用于對(duì)要 濾波的信號(hào)進(jìn)行噪聲抑制,其中所述信號(hào)表示聲學(xué)記錄。所述方法包括確定所述數(shù)字濾波 器的期望頻率響應(yīng)并基于期望頻率響應(yīng)來(lái)產(chǎn)生噪聲抑制濾波器。所述方法的特征在于,以 期望頻率響應(yīng)不超過(guò)最大水平的方式來(lái)確定期望頻率響應(yīng),其中,所述最大水平是響應(yīng)于 要濾波信號(hào)來(lái)確定的。此外,這一問(wèn)題是通過(guò)一種數(shù)字濾波器設(shè)計(jì)設(shè)備來(lái)解決的,所述數(shù)字濾波器設(shè)計(jì)
4設(shè)備被配置為設(shè)計(jì)用于對(duì)要濾波的信號(hào)進(jìn)行噪聲抑制的數(shù)字濾波器,其中所述信號(hào)表示聲 學(xué)記錄。所述數(shù)字濾波器設(shè)計(jì)設(shè)備包括期望頻率響應(yīng)確定設(shè)備,被配置為響應(yīng)于要濾波的 信號(hào)來(lái)確定期望頻率響應(yīng),其中,期望頻率響應(yīng)確定設(shè)備被配置為根據(jù)要濾波的信號(hào)來(lái)確 定期望頻率響應(yīng)的最大水平;并且以期望頻率響應(yīng)不超過(guò)所述最大水平的方式來(lái)確定期望 頻率響應(yīng)。此外,這一問(wèn)題是通過(guò)一種被配置為執(zhí)行本發(fā)明方法的計(jì)算機(jī)程序產(chǎn)品來(lái)解決 的。通過(guò)響應(yīng)于要濾波的信號(hào)來(lái)確定所設(shè)計(jì)的濾波器的期望頻率響應(yīng)的最大水平,可 以減小殘余噪聲中的不利波動(dòng),因此可以提高聲學(xué)信號(hào)的感知聲學(xué)質(zhì)量。例如,如果要濾波 的信號(hào)的功率密度隨時(shí)間變化,則最大水平可以以最小化功率密度變化對(duì)濾波后的信號(hào)的 影響的方式,以與功率密度變化的時(shí)間標(biāo)度適配的時(shí)間標(biāo)度來(lái)變化。此外,也可以作為頻率的函數(shù)來(lái)確定最大水平。通過(guò)允許最大水平隨要濾波的信 號(hào)的頻率而變化,可以更進(jìn)一步提高濾波后的信號(hào)的感知質(zhì)量。例如,與通常存在話音的高 頻相比,在通常僅包含噪聲的低頻處,可以將最大水平設(shè)置為較低的值。有利地,可以基于對(duì)要濾波的信號(hào)的噪聲水平的測(cè)量,如信噪比或噪聲功率,來(lái)確 定期望頻率響應(yīng)的最大水平。本發(fā)明的其他有利實(shí)施例在從屬權(quán)利要求中闡述。
為了更完整地理解本發(fā)明及其優(yōu)點(diǎn),現(xiàn)在結(jié)合附圖來(lái)參考以下描述,其中圖1是數(shù)字濾波器設(shè)計(jì)設(shè)備的示意圖。圖2a是示意本發(fā)明方法的實(shí)施例的流程圖。圖2b是示意本發(fā)明方法的實(shí)施例的流程圖。圖3是根據(jù)本發(fā)明實(shí)施例的期望響應(yīng)確定設(shè)備的示意圖。圖4a是并入了根據(jù)本發(fā)明的數(shù)字濾波器設(shè)計(jì)設(shè)備的用戶設(shè)備的示意圖。圖4b是通信系統(tǒng)中的節(jié)點(diǎn)的示意圖,其中所述節(jié)點(diǎn)包括根據(jù)本發(fā)明的數(shù)字濾波 器設(shè)計(jì)設(shè)備。圖5a示意了信號(hào)濾波的仿真結(jié)果,其中使用了傳統(tǒng)濾波器設(shè)計(jì)方法。圖5b示意了信號(hào)濾波的仿真結(jié)果,其中使用了根據(jù)本發(fā)明的濾波器設(shè)計(jì)方法。
具體實(shí)施例方式具有期望話音分量s (t)和噪聲分量η (t)的有噪話音信號(hào)y(t)可以表示為y(t) = s(t)+n(t) (1)在許多情況下,期望抑制噪聲分量η (t)并形成話音分量的估計(jì)興/),使得估計(jì)話 音分量盡可能接近地與話音分量s (t)相似。一種實(shí)現(xiàn)方式是使用時(shí)域噪聲抑制濾波器 h(z)對(duì)有噪信號(hào)y(t)進(jìn)行濾波,時(shí)域噪聲抑制濾波器h (ζ)被設(shè)計(jì)為去除盡可能多的噪聲 分量n(t),同時(shí)保留盡可能多的話音分量s (t)。通常,根據(jù)期望頻率響應(yīng)Η(ω)來(lái)計(jì)算噪聲抑制濾波器h(z),其中Η(ω)是實(shí)值函 數(shù),典型地被設(shè)計(jì)為使得對(duì)于y(t)僅包含噪聲的頻率ω,Η(ω)接近于零,而對(duì)于y(t)僅包含話音的頻率ω,Η(ω) =1,并且對(duì)于y(t)包含有噪話音的頻率ω,0 <Η(ω) <1。在確定有噪信號(hào)的話音分量時(shí),通常對(duì)有噪信號(hào)的樣本的幀應(yīng)用線性變換F[ ·]。 通過(guò)假定以下關(guān)系 其中F[ ·]表示如快速傅立葉變換(FFT)之類(lèi)的線性變換,作為期望頻率響應(yīng) Η(ω)的反線性變換Π ·]來(lái)獲得噪聲抑制濾波器h (ζ)。因此,可以通過(guò) 來(lái)獲得話音分量估計(jì),其中 表示卷積。因此,為了得到話音分量估計(jì),必須確定期望頻率響應(yīng)Η(ω)。如上所述,對(duì)于 y(t)包含有噪話音的頻率ω,0<Η(ω) < 1。在y(t)包含有噪話音的特定頻率處的H ( ω ) 的值通常是根據(jù)該頻率處有噪話音信號(hào)y(t)的信噪比(SNR)來(lái)選擇的??梢酝ㄟ^(guò)各種方法來(lái)估計(jì)期望頻率響應(yīng)Η(ω),如頻譜減法。由于在特定頻率 處SNR隨時(shí)間變化,因此一般隨時(shí)間更新期望頻率響應(yīng)Η(ω)—通常,針對(duì)每個(gè)數(shù)據(jù)幀 來(lái)更新期望頻率響應(yīng)Η(ω)。因此,期望頻率響應(yīng)Η(ω)典型地在幀之間變化,使得H(kn, ω)興H(kn+1,ω),其中1^表示具有幀編號(hào)η的幀的定時(shí)。備選地,可以以不同的時(shí)間間隔來(lái) 更新期望頻率響應(yīng)Η(ω)并從而更新根據(jù)期望頻率響應(yīng)來(lái)確定的濾波器配置。因此,期望 頻率響應(yīng)和濾波器配置隨時(shí)間變化。然而,為了簡(jiǎn)化描述,在以下表述中不顯式示出Η(ω) 和h(z)的時(shí)間依賴性。在以頻譜減法方法來(lái)確定期望頻率響應(yīng)Η(ω)時(shí),通常使用以下表達(dá)式
(4)其中似)和⑩“俲)分別是n(t)和y(t)的功率譜密度的估計(jì),δ (ω)是用于
減小音樂(lè)噪聲的過(guò)減因子。如上所述,通常,將噪聲抑制限制到水平Hmin以限制通常稱為音 樂(lè)噪聲的殘余噪聲的小波動(dòng)是有利的。此時(shí),表達(dá)式(4)可以采取以下形式
(4a)[和Y2是確定Η(ω) 1與Η(ω)= Hmin之間的轉(zhuǎn)變的急劇程度的因子。當(dāng) Y1= Y2= 1時(shí),表達(dá)式(4)通常表示維納濾波方法。圖1示意了濾波器設(shè)計(jì)設(shè)備100,濾波器設(shè)計(jì)設(shè)備100被配置為基于接收到的經(jīng)采 樣的有噪話音信號(hào)y(t)來(lái)產(chǎn)生合適的噪聲抑制濾波器h (ζ)。濾波器設(shè)計(jì)設(shè)備100具有輸入103,用于接收要濾波的有噪話音信號(hào)y(t);以及輸出104,用于輸出表示所設(shè)計(jì)的數(shù)字 濾波器h(z)的信號(hào)。濾波器設(shè)計(jì)設(shè)備100包括線性變換設(shè)備105,被配置為接收經(jīng)采樣 的有噪話音信號(hào)y(t)并產(chǎn)生經(jīng)采樣的有噪話音信號(hào)y(t)的線性變換Υ(ω)。圖1的濾波 器設(shè)計(jì)設(shè)備100還包括期望響應(yīng)確定設(shè)備110,被配置為接收經(jīng)采樣的信號(hào)y(t)的線性 變換Υ(ω),并基于線性變換Υ(ω)來(lái)確定期望頻率響應(yīng)Η(ω)。濾波器設(shè)計(jì)設(shè)備100還包 括濾波器信號(hào)產(chǎn)生設(shè)備112,濾波器信號(hào)產(chǎn)生設(shè)備112包括反線性變換設(shè)備115,反線性變 換設(shè)備115被配置為接收期望頻率響應(yīng)Η(ω)并產(chǎn)生期望頻率響應(yīng)Η(ω)的反線性變換。 一般地,在濾波器信號(hào)產(chǎn)生設(shè)備112中對(duì)反線性變換設(shè)備115的輸出進(jìn)行進(jìn)一步處理,例如 以US7,251,271中描述的方式,以獲得濾波器h(z)。濾波器信號(hào)產(chǎn)生設(shè)備112的輸出是表 示濾波器h(z)的信號(hào),濾波器信號(hào)產(chǎn)生設(shè)備112的輸出有利地連接至濾波器設(shè)計(jì)設(shè)備100 的輸出104。在理想噪聲抑制技術(shù)中,任何話音應(yīng)無(wú)失真地通過(guò)。因此,對(duì)于有噪話音信號(hào)y (t) 包括話音分量s(t)的所有頻率,Η(ω)應(yīng)滿足Η(ω) = 1。另一方面,理想噪聲抑制技術(shù)應(yīng) 當(dāng)將任何噪聲衰減至期望噪聲水平Hmin,要求對(duì)于有噪話音信號(hào)y(t)包括噪聲分量η (t)的 所有頻率Η(ω) = Hfflin0一般不能同時(shí)滿足上述期望屬性,這是由于語(yǔ)音和噪聲通常同時(shí)存在于相同頻 率。因此,在確定濾波器的期望頻率響應(yīng)Η(ω)時(shí),對(duì)于話音和噪聲共存的頻率,必須進(jìn)行 使話音失真與使殘余噪聲失真之間的權(quán)衡。當(dāng)在存在話音的頻率處Η(ω) <1時(shí),話音被 認(rèn)為失真。當(dāng)在存在噪聲的頻率處Η(ω)興扎^時(shí),殘余噪聲被認(rèn)為失真,其中殘余噪聲定 義為
Kwh^CO = Μ2)<Η) (0·(5)根據(jù)本發(fā)明,選擇期望頻率響應(yīng)使得應(yīng)用Η(ω)的適當(dāng)最大水平,其中最大水平 是響應(yīng)于有噪話音信號(hào)y(t)來(lái)選擇的。從以下可以看到,最大水平可以被選擇為使得可以 以受控的方式來(lái)限制話音和殘余噪聲中的失真。從而可以減小噪聲衰減的波動(dòng)以及噪聲和 話音失真的其他影響。在圖2a中,示出了示意用于確定期望頻率響應(yīng)Η(ω)的本發(fā)明方法的流程圖。在 步驟205,根據(jù)有噪話音信號(hào)y (t)來(lái)確定期望頻率響應(yīng)的最大水平Hmax——更具體地,可以 有利地根據(jù)有噪話音信號(hào)y(t)的線性變換Υ(ω)來(lái)確定最大水平!1_??梢曰谟性朐捯?信號(hào)y(t)的當(dāng)前時(shí)間實(shí)例(即要對(duì)其應(yīng)用要確定的濾波器h(z)的有噪話音信號(hào)的時(shí)間實(shí) 例);基于在要對(duì)其應(yīng)用要確定的濾波器h(z)的實(shí)例的時(shí)間實(shí)例之前的有噪話音信號(hào)y(t) 的時(shí)間實(shí)例(或有噪話音信號(hào)y(t)的當(dāng)前和先前時(shí)間實(shí)例的組合)來(lái)確定Hmax。Hmax可以 是或不是頻率ω的函數(shù),Η(ω)的最大水平以下表示為Η_(ω)。此外,Η_(ω)可以在不 同時(shí)刻之間變化或不變。然而,一般地,以下不顯式示出這種變化??梢砸远喾N不同方式來(lái) 確定Hmax (ω),其中一些方式在以下描述。當(dāng)在步驟205確定了 Η·(ω)時(shí),進(jìn)入步驟210,其中根據(jù)Hmax(ω)來(lái)確定期望頻 率響應(yīng)Η(ω)。在本發(fā)明的一個(gè)實(shí)現(xiàn)中,針對(duì)高于轉(zhuǎn)換頻率Wtl的所有頻率ω,Η(ω)可以 例如被選擇為等于Η_(ω);針對(duì)低于(Oci的頻率,Η(ω)可以被選擇為等于期望頻率響應(yīng) 的最小水平Hmin。在該實(shí)現(xiàn)中,轉(zhuǎn)換頻率ω ^可以例如被確定為以下頻率(或者以任何其他合適的方式來(lái)確定)低于該頻率,有噪話音信號(hào)的話音分量s (t)的功率小于閾值。圖2b示意了本發(fā)明方法的實(shí)現(xiàn),其中根據(jù)期望頻率響應(yīng)的近似Η3ρρΜΧ(ω)以及根 據(jù)最大水平Η_(ω)來(lái)執(zhí)行確定期望頻率響應(yīng)的步驟205。在圖2b的步驟205中,確定最 大水平Η_(ω)(見(jiàn)圖2a)。然后,進(jìn)入步驟207,其中基于經(jīng)采樣的信號(hào)y (t)的線性變換 Υ(ω)來(lái)確定期望頻率響應(yīng)的近似Η_Μ(ω)。例如,可以使用表達(dá)式(4)來(lái)獲得期望頻率 響應(yīng)的這一近似Happra (ω)。然后進(jìn)入步驟210,其中基于期望頻率響應(yīng)的近似Happrax (ω) 與期望頻率響應(yīng)的最大值Η_(ω)之間的比較來(lái)確定Η(ω)的值。例如,可以使用以下表 達(dá)式來(lái)執(zhí)行上述確定Η(ω) =π1 η{Η~(ω), Hmzx(W)} (6)優(yōu)選地,應(yīng)當(dāng)針對(duì)應(yīng)確定Η(ω)值的每個(gè)頻率箱體來(lái)進(jìn)行表達(dá)式(6)所表達(dá)的選 擇。因此,圖2b的步驟210優(yōu)選地針對(duì)應(yīng)確定Η(ω)值的每個(gè)頻率箱體來(lái)重復(fù)進(jìn)行。然而, 可能存在以下情況對(duì)期望頻率響應(yīng)的最大水平的限制對(duì)于頻譜的某些部分不那么有利。 在與這種實(shí)現(xiàn)相關(guān)的實(shí)現(xiàn)中,應(yīng)當(dāng)僅針對(duì)需要對(duì)期望頻率響應(yīng)的最大值進(jìn)行限制的頻率箱 體重復(fù)進(jìn)行步驟210。備選地,可以在步驟205之前執(zhí)行步驟207。在圖2b的方法中(以及在圖2a的方法中)可以包括檢查值Happra (ω)是否小于 期望頻率響應(yīng)的最小值!1_。然后,可以有利地將表達(dá)式(6)改變?yōu)槿缦翲 (ω) = max {min (Happrox (ω),Hmax (ω)},HffliJ (6a)或如下H (ω) = min {max (Happrox (ω), HffliJ,Hmax (ω)} (6b)使用表達(dá)式(6a)還是(6b)取決于期望Η(ω)取值Η_(ω)還是值Hmin,其中Hmin > Hfflax0與Η_(ω) —樣,Hmin可以隨頻率改變,并且可以在不同時(shí)刻取不同值。如上所述,ΗΜΧ(ω)可以被設(shè)置為適用于所有頻率和/或所有時(shí)刻的固定值。當(dāng) Η_(ω)獨(dú)立于時(shí)間和頻率時(shí),Hmax < 1的值將用于限制存在話音的時(shí)刻與僅存在噪聲的時(shí) 刻之間在特定頻率處的噪聲抑制的差異,即可以減小殘余噪聲的波動(dòng)。然后,所發(fā)生的話音 失真總是至少為Hmax所確定的程度。然而,為了減小話音失真以及提高獲得對(duì)噪聲衰減的 波動(dòng)的有效減小的可能性,有利地,引入隨頻率和時(shí)間變化的最大期望頻率響應(yīng)Η_(ω)。例如,可以基于對(duì)有噪話音信號(hào)y(t)的噪聲水平的測(cè)量,如有噪話音信號(hào)y(t)的 信噪比SNR(co)、不同頻率處話音分量估計(jì)的SNR(co)或話音分量估計(jì)· ( )的總信噪比 Sfrim等(其中“總”是指在相關(guān)頻帶上執(zhí)行積分(見(jiàn)以下表達(dá)式(14))),來(lái)導(dǎo)出圖2的步 驟205中確定的Η_(ω)的值。備選地,可以使用其他測(cè)量來(lái)確定Η_(ω)。優(yōu)選地,所述 其他測(cè)量應(yīng)與信噪比相關(guān)例如,Η_(ω)的確定可以基于有噪話音信號(hào)y(t)在不同頻率 處的噪聲功率電平Pn(t,ω),或基于有噪話音信號(hào)的總噪聲水平。對(duì)信號(hào)y(t)的噪聲 功率電平的測(cè)量可以被視為對(duì)信噪比的測(cè)量,其中假定信號(hào)功率具有特定值。Η_(ω)的值 可以備選地基于有噪話音信號(hào)y(t)的功率電平,或基于有噪話音信號(hào)y(t)的任何其他測(cè) 量?;赟NR(t,ω)的最壞t書(shū)況考虎的H:由于在Η(ω)在特定時(shí)間段內(nèi)變化時(shí),針對(duì)該時(shí)間段獲得的估計(jì)話音分量■?( )的SNR取決于Η(ω)(見(jiàn)以下內(nèi)容),因此例如可以從話音分量估計(jì)鄧)的SNR(co)的最壞情況 考慮來(lái)導(dǎo)出Η_(ω)的表達(dá)式。話音分量估計(jì)的SNR ( ω )可以表達(dá)為 其中Φρ Φ, Φ 分別是對(duì)所估計(jì)的話音分量i(i)、有噪話音信號(hào)y(t)和噪聲 分量n(t)的譜密度的估計(jì),是對(duì)殘余噪聲nresidual(t)的譜密度的估計(jì)。從以上表達(dá)式(1)_(3)和⑶可以看到,瞬時(shí)地,針對(duì)特定頻率ω的的 SNR(co)獨(dú)立于Η(ω)(并且等于該頻率處y(t)的SNR)。然而,與瞬時(shí)SNR不同,典型地, 當(dāng)Η(ω)在特定時(shí)間段內(nèi)變化時(shí),針對(duì)該時(shí)間段的SNR依賴于Η(ω)。為了示意這一點(diǎn),考 慮以下簡(jiǎn)單示例其中基于在兩個(gè)不同時(shí)刻、和、采集的兩個(gè)采樣y(tA)和y(tB)來(lái)確定 SNR,并且在tA獲得的采樣包含有噪話音y(tA) =s(tA)+n(tA);在tB處的采樣僅包含噪聲 y(tB) =n(tB)。假定針對(duì)特定頻率ω的期望頻率響應(yīng)Η(ω)在不同時(shí)刻取不同值,使得 H(tA,ω)乒H(tB,ω),基于這兩個(gè)采樣的針對(duì)頻率ω的興 )的SNR可以表示為 顯然,表達(dá)式(8a)中的SNR依賴于Η(ω),由于H(tB,《)僅存在于表達(dá)式(8a)的
分母中。當(dāng)假定話音被最大衰減并且噪聲被最小衰減時(shí)給出最壞情況SNR。對(duì)于頻率ω, 這可以表示為 為了限制最壞情況SNR,可以提供最壞情況SNR的最小值β,其中β是頻率的函
數(shù) 在表達(dá)式(10)中,β (ω)形成了最壞情況SNR的下限。以下將β稱為容限閾值。 優(yōu)選地,針對(duì)所有頻率,應(yīng)當(dāng)對(duì)容限閾值β給出大于0的值。 表達(dá)式(10)得到針對(duì)Η(ω)的最大水平的以下表達(dá)式 通過(guò)針對(duì)Hfflin = 0或= ci>,t(a0的特殊情況來(lái)定義Hmax ( ω ) = 0,這些情況 將被(11)所涵蓋。由于期望Η(ω)以及從而Η_(ω)盡可能大,以最小化話音失真,因此(11)可以
簡(jiǎn)化為 容限閾值β (ω)對(duì)最壞情況SNR可以多小定義了限制。β (ω)可以取大于0的 任何值。在用于移動(dòng)通信的噪聲抑制應(yīng)用中,β (ω)的值可以例如落在-10至IOdB范圍 內(nèi)。這種應(yīng)用中β (ω)的典型值可以是_3dB,這已經(jīng)被證明以合理的話音失真代價(jià)將殘余 噪聲的波動(dòng)減小至對(duì)于Η_(ω)的大多數(shù)值殘余噪聲不可察覺(jué)。例如,可以根據(jù)以下表達(dá)式來(lái)選擇容限閾值 或
的可接受失真(可以從中獲得Dnt5ise和Dspradl的值的關(guān)系在以下表達(dá)式(21)和(22)中給出)。在部分或整個(gè)頻率范圍內(nèi),β (ω)也可以取恒定值。如果對(duì)最小化殘余噪聲失真 賦予比最小化話音失真更高的優(yōu)先級(jí),則β應(yīng)當(dāng)優(yōu)選地被給予較大的值,例如大約+3dB。 另一方面,如果最小化話音失真比最小化殘余噪聲更加重要,則β應(yīng)當(dāng)優(yōu)選地被給予較小 的值,例如大約_7dB。在本發(fā)明的一個(gè)實(shí)現(xiàn)中,β (ω)的值可以取決于有噪話音信號(hào)在特定時(shí)間和頻率 處是否包含話音分量。如果在特定頻率處沒(méi)有話音分量,則β (ω)的值將被設(shè)置為相對(duì) 較大的值;當(dāng)在該特定頻率處出現(xiàn)話音分量時(shí),β (ω)的值可以有利地緩慢下降至明顯較 小的值。在話音出現(xiàn)時(shí)緩慢減小β (ω)的值時(shí),實(shí)現(xiàn)了在不存在話音時(shí)獲得高效的噪聲抑 制,并且在該特定頻率處得到的話音失真以收聽(tīng)信號(hào)的人耳不會(huì)察覺(jué)到對(duì)話音分量估計(jì)的 濾波的逐漸改變的方式逐漸減小?;诳傂旁氡鹊腍=如上所述,可以基于對(duì)總信噪比Sk的考慮來(lái)確定Η_(ω),其中
Hfflax的值可以例如從以下表達(dá)式獲得 或從以下表達(dá)式獲得
(16)基于噪聲功率電平Ρη( ω )的Hmax此夕卜,備選地,可以基于對(duì)噪聲功率電平? ( )的考慮來(lái)確定Η χ(ω)的值,例如 通過(guò)表達(dá)式(17)或(18)中提供的關(guān)系之一Η·(ω) = a[Pn(co)rb+c(17)Η χ(ω) = alog2[Pn(W)]+b (18)基于總噪聲功率電平&的H:備選地,可以基于對(duì)總噪聲功率電平瓦的考慮來(lái)確定Hmax ( ω ),其中ζ是在ω 和 ω2之間的頻率區(qū)域內(nèi)測(cè)量的噪聲功率電平。Hfflax的值可以例如從以下表達(dá)式獲得 或從以下表達(dá)式獲得
(20)在以上表達(dá)式(15)-(20)中,a、b和c是表示可以通過(guò)實(shí)驗(yàn)導(dǎo)出合適值的常數(shù)。也 可以使用確定期望頻率響應(yīng)的最大水平Hmax的其他方法。圖3中示意了根據(jù)本發(fā)明的期望響應(yīng)確定設(shè)備110的實(shí)施例。圖3的期望響應(yīng)確 定設(shè)備Iio包括響應(yīng)近似確定設(shè)備300、最大響應(yīng)確定設(shè)備305和最小值選擇器310。響 應(yīng)近似確定設(shè)備300被配置為對(duì)饋送至期望響應(yīng)確定設(shè)備110的輸入315的信號(hào)(即典 型為有噪話音信號(hào)的線性變換Υ(ω))進(jìn)行操作。此外,響應(yīng)近似確定設(shè)備300被配置為基 于輸入信號(hào)來(lái)確定期望頻率響應(yīng)的近似Η_Μ(ω)。有利地,可以以用于確定期望頻率響應(yīng) 的傳統(tǒng)方式,例如根據(jù)上述表達(dá)式(4)來(lái)確定Η_Μ(ω)。圖3的最大響應(yīng)確定設(shè)備305被配置為確定期望頻率響應(yīng)的最大水平ΗΜΧ(ω)。 在本發(fā)明的許多實(shí)施例中,最大響應(yīng)確定設(shè)備305被配置為接收并操作線性變換Υ(ω),或接收并操作有噪話音信號(hào)y(t),以例如根據(jù)上述表達(dá)式(12)或(15)-(20)中任一項(xiàng)來(lái)確定 。(在圖3的實(shí)施例中,最大響應(yīng)確定設(shè)備305被配置為接收線性變換Υ(ω))。然而, 在其他實(shí)施例中,可以以其他方式來(lái)確定IU (ω)——其中之一為IU ( )取恒定值——并且 可以省略圖3所示的期望響應(yīng)確定設(shè)備110的輸入與最大響應(yīng)確定設(shè)備之間的連接。在圖3所示的設(shè)備中,響應(yīng)近似確定設(shè)備300的輸出(由此傳送表的 信號(hào))和最大響應(yīng)確定設(shè)備的輸出(由此傳送表示Η χ(ω)的信號(hào))均連接至最小值選擇 器310的輸入。最小值選擇器310被配置為將表示Η_(ω)的信號(hào)與信號(hào)Happrax(ω)進(jìn) 行比較,并選擇Η_(ω)與Η_Μ(ω)中的較小者。然后,最小值選擇器310被配置為輸出 Η_(ω)與Happrax(O)中的較小者。最小值選擇器310的輸出表示期望頻率響應(yīng)Η(ω)的 值,最小值選擇器310的輸出連接至期望頻率響應(yīng)確定設(shè)備110的輸出320,以便將表示期 望頻率響應(yīng)Η(ω)的值饋送至輸出320。圖3的期望響應(yīng)確定設(shè)備110可以包括圖3中未示出的其他組件,如最大值選擇 器,被配置為將頻率響應(yīng)的值與期望頻率響應(yīng)的最小水平iiin( ω)進(jìn)行比較,并選擇所比較 值的最大值。有利地,這種最大值選擇器可以被配置為將Hmin( ω )與最小值選擇器310的輸 出進(jìn)行比較,在這種情況下,最大值選擇器的輸出可以有利地連接至期望響應(yīng)確定設(shè)備110 的輸出320。備選地,這種最大值選擇器可以被配置為將Hmin(Co)與響應(yīng)近似確定設(shè)備300 的輸出進(jìn)行比較,在這種情況下,最大值選擇器的輸出有利地連接至最小值選擇器310的 輸入而不是將響應(yīng)近似確定設(shè)備300的輸出連接至最小值選擇器310 (見(jiàn)上述表達(dá)式(6a) 和(6b))。期望響應(yīng)確定設(shè)備110還可以包括如緩沖器等其他組件。期望頻率響應(yīng)確定設(shè)備110可以有利地由合適的計(jì)算機(jī)軟件和/或硬件來(lái)實(shí)現(xiàn), 作為濾波器設(shè)計(jì)設(shè)備100的一部分。根據(jù)本發(fā)明的濾波器設(shè)計(jì)設(shè)備100可以有利地在用于 傳輸話音的用戶設(shè)備中實(shí)現(xiàn),如移動(dòng)電話、固定線路電話、無(wú)線電話機(jī)等等。濾波器設(shè)計(jì)設(shè) 備100還可以在處理聲學(xué)信號(hào)的其他類(lèi)型的用戶設(shè)備中實(shí)現(xiàn),如便攜式攝像機(jī)、錄音電話 等。在圖4a中,示出了包括根據(jù)本發(fā)明的濾波器設(shè)計(jì)設(shè)備的用戶設(shè)備400。用戶設(shè)備400 可以被配置為根據(jù)本發(fā)明在記錄聲學(xué)信號(hào)時(shí)和/或在重放已經(jīng)在不同時(shí)刻和/或由不同用 戶設(shè)備記錄的聲學(xué)信號(hào)時(shí)執(zhí)行噪聲抑制。此外,根據(jù)本發(fā)明的濾波器設(shè)計(jì)設(shè)備100可以有利地在通信網(wǎng)絡(luò)中需要執(zhí)行噪 聲抑制的中間節(jié)點(diǎn)中實(shí)現(xiàn),如在IP多媒體子系統(tǒng)(IMS系統(tǒng))中的媒體資源功能處理器 (MRFP)中、在移動(dòng)媒體網(wǎng)關(guān)中等等。圖4b示出了包括節(jié)點(diǎn)410的通信系統(tǒng)405,節(jié)點(diǎn)410 包括根據(jù)本發(fā)明的濾波器設(shè)計(jì)設(shè)備100。表1以及圖5a和5b示意了通過(guò)根據(jù)上述表達(dá)式(4a)針對(duì)特定時(shí)間t’和頻率ω ’ 來(lái)確定期望頻率響應(yīng)H(t’,ω ’)(圖5a)以及通過(guò)根據(jù)本發(fā)明的實(shí)施例確定期望頻率響應(yīng) H(t’,ω’)(圖5b)而獲得的仿真結(jié)果。在圖5b中,使用表達(dá)式(6a)來(lái)確定H(t’,ω’), 其中使用表達(dá)式(12)來(lái)確定Hmax (t’,ω,),其中β
,并且通過(guò)表達(dá)式(4)獲 得!^ ^,ω’)。在圖5a中,用于獲得H(t’,ω’)的方法以傳統(tǒng)方式不對(duì)H(t’,ω)施
加上限,即= OdB。在圖5a和5b所示的仿真中,均使用相關(guān)參數(shù)的以下值
并且當(dāng)前時(shí)間和頻率處 y(t,)的 SNR 為 10dB??梢允褂靡韵卤磉_(dá)式作為對(duì)殘余噪聲的失真Dn°ise的測(cè)量
而話音的失真Dspeeeh可以表示為
H'
(22)
Dnoise也可以用作對(duì)殘余噪聲的波動(dòng)的測(cè)量。 在圖5a和5b中,指示了 5個(gè)不同信號(hào)水平
1有噪話音信號(hào)y(t’ )的功率譜密度
2噪聲分量n(t’ )的功率譜密度ΦΜ( ·,乂)
3期望噪聲水平- Hlin
4話音分量估計(jì)興ο的功率譜密度χ ^Ο',αΟ一付3GW)
5:殘余噪聲IIresidual(t')的功率譜密度杏 (廣,似,)—//2(/',份‘) 此外,在圖5a和5b中指示了多個(gè)不同信號(hào)水平差
A 有噪話音信號(hào)y(t,)的SNR(t,)以及話音分量估計(jì)的SNR(t,) (IOdB) C:話音失真-H2 (t'
ω
D 殘余噪聲失真
在表1中,給出了通過(guò)圖5a中示意的確定Η(ω)的傳統(tǒng)方法和圖5b中示意的本 發(fā)明方法獲得的Dn°ise和D—的值,以及最壞情況信噪比的值。
表1.傳統(tǒng)噪聲抑制方法與根據(jù)本發(fā)明實(shí)施例的噪聲抑制方法獲得的噪聲抑制的 比較從圖5a和5b所示的仿真結(jié)果以及表1可以清楚看到,本發(fā)明方法獲得的殘余噪 聲失真和最壞情況SNR優(yōu)于傳統(tǒng)噪聲抑制技術(shù)所獲得的殘余噪聲失真和最壞情況SNR。這 種改進(jìn)總體上是以話音失真的增大為代價(jià)而獲得的。然而,在許多情況下,如果減小了殘余 噪聲中的波動(dòng),則話音失真的增大是可接受的。此外,從以上可以清楚看到,可以容易地計(jì) 算根據(jù)本發(fā)明在殘余噪聲與話音的失真之間進(jìn)行的權(quán)衡的效果。因此,判定是否要應(yīng)用本 發(fā)明方法來(lái)選擇濾波器配置的期望頻率響應(yīng)可以基于對(duì)應(yīng)用本發(fā)明方法將對(duì)話音失真對(duì) 殘余噪聲失真具有何種結(jié)果的分析來(lái)進(jìn)行。這種分析可以時(shí)常進(jìn)行,可以基于該分析來(lái)判 定是否要應(yīng)用本發(fā)明方法來(lái)確定H( )。如果發(fā)現(xiàn)從確定H( )的傳統(tǒng)方式至根據(jù)本發(fā)明 的方法的轉(zhuǎn)換是合適的,則可以有利地逐漸進(jìn)行這種轉(zhuǎn)換,以實(shí)現(xiàn)收聽(tīng)者不可察覺(jué)的無(wú)縫 轉(zhuǎn)變。通過(guò)本發(fā)明,獲得了一種靈活并且計(jì)算簡(jiǎn)單的方式來(lái)確定數(shù)字濾波器的期望頻率 響應(yīng)H( )。通過(guò)應(yīng)用該方法,可以以受控的方式來(lái)減小殘余噪聲的波動(dòng),并且殘余噪聲中 的波動(dòng)量與話音失真之間的必要權(quán)衡變得相當(dāng)簡(jiǎn)單。本發(fā)明可以成功地應(yīng)用于基于頻譜減 法的任何噪聲減小方法。以上就有噪話音信號(hào)的噪聲抑制討論了本發(fā)明。但是本發(fā)明也可以有利地應(yīng)用于 其他類(lèi)型的聲學(xué)記錄中的噪聲抑制。以上將要抑制噪聲的信號(hào)y(t)稱為有噪話音信號(hào),但 可以是任何類(lèi)型的有噪聲學(xué)記錄。本領(lǐng)域技術(shù)人員可以認(rèn)識(shí)到,本發(fā)明不限于在附圖中公開(kāi)的實(shí)施例和以上詳細(xì)描 述,在附圖中公開(kāi)的實(shí)施例和以上詳細(xì)描述僅呈現(xiàn)用于示意目的,可以以多種不同方式來(lái) 實(shí)現(xiàn)本發(fā)明,本發(fā)明由所附權(quán)利要求來(lái)限定。
權(quán)利要求
一種設(shè)計(jì)數(shù)字濾波器(h(z))的方法,所述數(shù)字濾波器用于對(duì)要濾波的信號(hào)(y(t))進(jìn)行噪聲抑制,其中所述信號(hào)表示聲學(xué)記錄,所述方法包括確定所述數(shù)字濾波器的期望頻率響應(yīng)(H(ω));基于期望頻率響應(yīng)來(lái)產(chǎn)生噪聲抑制濾波器;所述方法的特征在于,以期望頻率響應(yīng)不超過(guò)最大水平的方式來(lái)確定期望頻率響應(yīng),其中,所述最大水平是響應(yīng)于要濾波的信號(hào)而確定的。
2.根據(jù)權(quán)利要求1所述的方法,其中 所述頻率響應(yīng)的最大水平是頻率的函數(shù)。
3.根據(jù)權(quán)利要求1或2所述的方法,其中,確定期望頻率響應(yīng)包括 確定(205)所述頻率響應(yīng)的最大水平( ^χ(ω));確定(207)所述頻率響應(yīng)的近似(H—(ω)); 將所述近似與所述最大水平進(jìn)行比較(210);以及選擇(210)所述最大水平,作為下述頻率的期望頻率響應(yīng)的值在所述頻率處,所述最 大水平的值低于所述頻率響應(yīng)的近似的值。
4.根據(jù)權(quán)利要求3所述的方法,其中確定近似、確定最大水平、比較和選擇的步驟針對(duì)至少兩個(gè)不同的頻率箱體重復(fù)進(jìn)行。
5.根據(jù)上述任一權(quán)利要求所述的方法,其中以期望頻率響應(yīng)不取低于期望頻率響應(yīng)的最小水平的值的方式,確定期望頻率響應(yīng)。
6.根據(jù)權(quán)利要求5所述的方法,其中所述最大水平是根據(jù)所述最小水平來(lái)確定的。
7.根據(jù)上述任一權(quán)利要求所述的方法,其中所述最大水平是基于對(duì)要濾波的信號(hào)的噪聲水平的測(cè)量來(lái)確定的。
8.根據(jù)權(quán)利要求7所述的方法,其中在特定頻率處的最大水平是根據(jù)對(duì)所述特定頻率處要濾波的信號(hào)的信噪比的估計(jì)來(lái) 確定的。
9.根據(jù)權(quán)利要求8所述的方法,其中所述最大水平被產(chǎn)生為與下述公式的數(shù)值相對(duì)應(yīng)的值 IH2. ΦΜ-ΦΛω)"臓⑷=匪jj卞 ⑷“,I·,其中Η_(ω)是作為頻率的函數(shù)的所述最大水平,Hmin是所述頻率響應(yīng)的最小水平,β 是表示最大可接受信噪比的容限閾值。
10.根據(jù)權(quán)利要求9所述的方法,其中 所述容限閾值的值取決于確定最大水平的頻率。
11.根據(jù)權(quán)利要求7所述的方法,其中所述最大水平是根據(jù)對(duì)信噪比的總值的估計(jì)來(lái)確定的。
12.根據(jù)權(quán)利要求7所述的方法,其中在特定頻率處的最大水平是根據(jù)對(duì)所述特定頻率處要濾波的信號(hào)的噪聲功率的估計(jì) 來(lái)確定的。
13.根據(jù)權(quán)利要求7所述的方法,其中所述最大水平是根據(jù)對(duì)所述信號(hào)的噪聲功率的估計(jì)來(lái)確定的。
14.一種數(shù)字濾波器設(shè)計(jì)設(shè)備(100),被配置為設(shè)計(jì)對(duì)要濾波的信號(hào)(y(t))進(jìn)行噪聲 抑制的數(shù)字濾波器(h(ζ)),其中所述信號(hào)表示聲學(xué)記錄,所述數(shù)字濾波器設(shè)計(jì)設(shè)備包括期望頻率響應(yīng)確定設(shè)備(110),被配置為響應(yīng)于要濾波的信號(hào)來(lái)確定期望頻率響應(yīng) (Η(ω));所述數(shù)字濾波器設(shè)計(jì)設(shè)備的特征在于,期望頻率響應(yīng)確定設(shè)備被配置為根據(jù)要濾波的信號(hào),確定(305)期望頻率響應(yīng)的最大水平(Η_(ω));以及以期望頻率響應(yīng)不超過(guò)所述最大水平的方式,確定(310)期望頻率響應(yīng)。
15.根據(jù)權(quán)利要求14所述的數(shù)字濾波器設(shè)計(jì)設(shè)備,其中期望頻率響應(yīng)確定設(shè)備(110)被配置為作為頻率的函數(shù)來(lái)確定(300)期望頻率響應(yīng) 的最大水平。
16.根據(jù)權(quán)利要求14或15所述的數(shù)字濾波器設(shè)計(jì)設(shè)備,其中,期望頻率響應(yīng)確定設(shè)備 被配置為確定(300)期望頻率響應(yīng)的近似(H—(ω));將所述頻率響應(yīng)的近似與所確定的最大水平進(jìn)行比較(310);以及選擇(310)所述最大水平與期望頻率響應(yīng)的近似中的較小者作為期望頻率響應(yīng)的值。
17.根據(jù)從屬于權(quán)利要求15的權(quán)利要求16所述的數(shù)字濾波器設(shè)計(jì)設(shè)備,其中,期望頻 率響應(yīng)確定設(shè)備被配置為針對(duì)每個(gè)頻率箱體來(lái)進(jìn)行比較和選擇。
18.根據(jù)權(quán)利要求14 17中任一項(xiàng)所述的數(shù)字濾波器設(shè)計(jì)設(shè)備,其中期望頻率響應(yīng)確定設(shè)備被配置為以期望頻率響應(yīng)不取低于最小水平的值的方式來(lái)確 定期望頻率響應(yīng)。
19.根據(jù)權(quán)利要求18所述的數(shù)字濾波器設(shè)計(jì)設(shè)備,其中期望頻率響應(yīng)確定設(shè)備被配置為根據(jù)所述最小水平來(lái)確定所述最大水平。
20.根據(jù)權(quán)利要求14 19中任一項(xiàng)所述的數(shù)字濾波器設(shè)計(jì)設(shè)備,其中期望頻率響應(yīng)確定設(shè)備被配置為基于對(duì)要濾波的信號(hào)的噪聲水平的測(cè)量來(lái)確定所述 最大水平。
21.一種用于處理聲學(xué)信號(hào)的用戶設(shè)備(400),所述用戶設(shè)備包括根據(jù)權(quán)利要求14 20中任一項(xiàng)所述的數(shù)字濾波器設(shè)計(jì)設(shè)備。
22.一種通信系統(tǒng)(405)中用于對(duì)表示語(yǔ)音的信號(hào)進(jìn)行中繼的節(jié)點(diǎn)(410),所述節(jié)點(diǎn)包 括根據(jù)權(quán)利要求14 20中任一項(xiàng)所述的數(shù)字濾波器設(shè)計(jì)設(shè)備(100)。
23.一種用于設(shè)計(jì)數(shù)字濾波器(h(z))的計(jì)算機(jī)程序產(chǎn)品,所述數(shù)字濾波器用于對(duì)要濾 波的信號(hào)(y(t))進(jìn)行噪聲抑制,其中所述信號(hào)表示聲學(xué)記錄,所述計(jì)算機(jī)程序產(chǎn)品包括在計(jì)算機(jī)上運(yùn)行時(shí),適于確定所述數(shù)字濾波器的期望頻率響應(yīng)(Η(ω))的計(jì)算機(jī)程序 代碼部分(110);在計(jì)算機(jī)上運(yùn)行時(shí),適于基于期望頻率響應(yīng)來(lái)產(chǎn)生噪聲抑制濾波器的計(jì)算機(jī)程序代碼 部分(112);所述計(jì)算機(jī)程序產(chǎn)品的特征在于,適于確定期望頻率響應(yīng)的計(jì)算機(jī)程序代碼部分被配置為以期望頻率響應(yīng)不超過(guò)最大 水平的方式來(lái)確定(300、305、310)期望頻率響應(yīng),其中,所述最大水平是響應(yīng)于要濾波的 信號(hào)而確定的。
全文摘要
本發(fā)明涉及一種數(shù)字濾波器的方法和設(shè)備,所述數(shù)字濾波器用于對(duì)表示聲學(xué)記錄的信號(hào)進(jìn)行噪聲抑制。所述方法包括確定所述數(shù)字濾波器的期望頻率響應(yīng)(H(ω));基于期望頻率響應(yīng)來(lái)產(chǎn)生噪聲抑制濾波器。以期望頻率響應(yīng)不超過(guò)最大水平的方式來(lái)確定期望頻率響應(yīng),其中,所述最大水平是響應(yīng)于要濾波信號(hào)來(lái)確定的。
文檔編號(hào)G10L21/02GK101904097SQ200780102005
公開(kāi)日2010年12月1日 申請(qǐng)日期2007年12月20日 優(yōu)先權(quán)日2007年12月20日
發(fā)明者佩爾·阿格倫, 安德?tīng)査埂ぐ@锟怂?申請(qǐng)人:艾利森電話股份有限公司