專利名稱:聲音增強(qiáng)系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明關(guān)于聲音增強(qiáng)系統(tǒng)。
背景技術(shù):
電話機(jī)通常用于嘈雜環(huán)境中,在此環(huán)境中背景噪聲會(huì)干擾對通過電話機(jī)接收的聲音信號(hào)的理解。
戈德堡(Goldberg)的第4,829,565號(hào)美國專利,其所公開的內(nèi)容將以引用的方式并入本文,其描述了一種具有自動(dòng)音量控制系統(tǒng)的電話,系統(tǒng)根據(jù)背景噪聲調(diào)整用戶所聽到的遠(yuǎn)程信號(hào)的音量。但是,此系統(tǒng)會(huì)導(dǎo)致音量太頻繁的變化,以及不精確的變化,這將使人的耳朵感到不舒服。
米勒(Miller)等人的第5,615,270號(hào)美國專利,其所公開的內(nèi)容將以引用的方式并入本文,其描述了一種用于車輛的噪聲補(bǔ)償系統(tǒng)。系統(tǒng)基于從車中感應(yīng)的信號(hào)中過濾出所期望的音樂信號(hào)的過程產(chǎn)生的噪聲信號(hào)來確定所需的放大率。
艾倫(Allen)等人的第5,524,148號(hào)和第5,526,419號(hào)美國專利,其所公開的內(nèi)容將以引用的方式并入本文,其描述了噪聲補(bǔ)償系統(tǒng),其放大提供給電話機(jī)的遠(yuǎn)端信號(hào),增益因數(shù)根據(jù)背景噪聲等級(jí)和遠(yuǎn)端信號(hào)的平均語音功率而確定。在一實(shí)施例中,計(jì)算遠(yuǎn)端信號(hào)所有頻帶的背景噪聲等級(jí)和平均語音功率并且將相同的增益因數(shù)應(yīng)用于遠(yuǎn)端信號(hào)的所有頻帶。歸因于所使用的確定增益因數(shù)的方法,增益因數(shù)不會(huì)足夠或可能過度。
在艾倫(Allen)的專利的另一實(shí)施例中,遠(yuǎn)端信號(hào)被分成多個(gè)頻率分量并且利用相應(yīng)的增益因數(shù)分別放大每個(gè)頻率分量。根據(jù)相應(yīng)頻率分量中的背景噪聲和平均語音功率或總的平均語音功率確定每個(gè)頻率分量的增益因數(shù)。在此實(shí)施例中,由于對信號(hào)不同頻率分量的不同的獨(dú)立的放大,導(dǎo)致發(fā)聲信號(hào)失真。此外,將執(zhí)行許多不必要的振幅調(diào)整,這導(dǎo)致所消耗操作功率的浪費(fèi),尤其對于電池供電系統(tǒng)來說。
1999年1月14日出版的PCT第99/01863號(hào)世界專利,其所公開的內(nèi)容將以引用的方式并入本文,其描述了一種用于吵雜環(huán)境的語音增強(qiáng)系統(tǒng)。第99/01863號(hào)世界專利公開的系統(tǒng)能比較語音和背景噪聲的頻譜分析,以確定是否有一個(gè)或多個(gè)語音的頻率被背景噪聲掩蔽。如果發(fā)生這樣的掩蔽,則改變一個(gè)或多個(gè)語音線頻譜對(LSPs),以基于此LSP(線頻譜對)消除對語音的掩蔽。LSP(線頻譜對)的改變包括移動(dòng)其頻率,增加其帶寬或增加其振幅。LSPs(線頻譜對)的移位將干擾語音信號(hào)。
拉斯穆森(Rasmusson)的第5,636,272號(hào)美國專利,其所公開的內(nèi)容將以引用的方式并入本文,其描述了一種使語音變得更無形的系統(tǒng),系統(tǒng)使用一種非背景噪聲函數(shù)的矯正法。
發(fā)明內(nèi)容
本發(fā)明的一些實(shí)施例的一個(gè)方面涉及一種噪聲補(bǔ)償系統(tǒng),其用于調(diào)整所需聲頻信號(hào),以便克服背景噪聲的影響。系統(tǒng)基于對信號(hào)頻率分量中聲頻和噪聲信號(hào)的分析來確定是否放大和/或聲頻信號(hào)的增益因數(shù)。但是,所確定的增益因數(shù)將應(yīng)用于整個(gè)聲頻信號(hào)或包括多個(gè)頻率分量的一部分聲頻信號(hào)?;陬l率分量的增益因數(shù)的確定提供了對所需增益因數(shù)的更精確的確定,同時(shí)對整個(gè)聲頻信號(hào)應(yīng)用增益因數(shù)防止了將失真引入信號(hào)。
在本發(fā)明的一些實(shí)施例中,增益因數(shù)的確定包括在一個(gè)或多個(gè)頻率分量中將聲頻信號(hào)的功率與噪聲信號(hào)的功率相比較,并根據(jù)比較確定增益因數(shù)。在本發(fā)明的一些實(shí)施例中,聲頻和噪聲信號(hào)被分成多個(gè)頻率分量,其大體上可選擇性的覆蓋信號(hào)的整個(gè)語音頻譜,并且在大體上所有的頻率分量中執(zhí)行比較過程。作為選擇或補(bǔ)充,可以不在所有的頻率分量中執(zhí)行比較過程,例如僅在包括聲音信號(hào)共振峰(即,頻譜中的包絡(luò)波峰)的頻率分量中執(zhí)行。在本發(fā)明的一些實(shí)施例中,不在所有的包括聲音信號(hào)共振峰的頻率分量中執(zhí)行比較過程。在本發(fā)明的一個(gè)具體實(shí)施例中,在聲音信號(hào)中找尋滿足預(yù)定數(shù)量的不同共振峰,例如三個(gè)共振峰。在包括所找尋共振峰的頻率分量中執(zhí)行比較過程。
在本發(fā)明的一些實(shí)施例中,基于涉及比較過程的頻率分量中的信號(hào)噪聲比(SNR)來選擇增益因數(shù)。視情況而定,增益因數(shù)可應(yīng)用于整個(gè)聲頻信號(hào)。或者,增益因數(shù)大體上應(yīng)用于聲頻信號(hào)的所有頻譜,已知聲頻信號(hào)包括語音信號(hào)。在本發(fā)明的一些實(shí)施例中,在根據(jù)增益因數(shù)放大信號(hào)后,壓縮信號(hào)以避免失真,防止放大信號(hào)超出其所允許的動(dòng)態(tài)范圍。
本發(fā)明的一些實(shí)施例的一個(gè)方面涉及一種噪聲補(bǔ)償系統(tǒng),其放大聲音信號(hào)的一個(gè)或多個(gè)第一頻率分量,響應(yīng)對聲音信號(hào)需要放大其一個(gè)或多個(gè)第二頻率分量的確定,這不同于第一頻率分量。系統(tǒng)將聲音信號(hào)分成多個(gè)頻率分量并且至少一個(gè)頻率分量確定了頻率分量的振幅是否足夠。如果確定第一頻率分量的振幅不足夠,則至少調(diào)整一個(gè)第二頻率分量的振幅。在本發(fā)明的一些實(shí)施例中,根據(jù)確定,可能按照相同的調(diào)整因數(shù)調(diào)整大部分或所有頻率分量的振幅。
本發(fā)明的一些實(shí)施例的一個(gè)方面涉及一種噪聲補(bǔ)償系統(tǒng),其用于調(diào)整所需聲頻信號(hào),以便克服背景噪聲的影響。聲頻信號(hào)被分成多個(gè)頻率分量并且根據(jù)噪聲依賴增益因數(shù)和非噪聲依賴增益因數(shù)增強(qiáng)每個(gè)頻率分量。將噪聲依賴增益因數(shù)和非噪聲依賴增益因數(shù)共同應(yīng)用于由相同劃分產(chǎn)生的頻率分量中,提供了兩種增益因數(shù)的優(yōu)點(diǎn),而并不需要雙倍的成本和劃分信號(hào)所需的延遲。在本發(fā)明的一些實(shí)施例中,至少一部分非噪聲依賴增益因數(shù)包含也獨(dú)立于信號(hào)的增益因數(shù),如預(yù)定的固定增益因數(shù)。在本發(fā)明的一些實(shí)施例中,大體上所有頻率分量的噪聲依賴增益因數(shù)都相同。
在本發(fā)明的一些實(shí)施例中,通過一個(gè)單一的放大單元將噪聲依賴增益因數(shù)和非噪聲依賴增益因數(shù)應(yīng)用于聲頻信號(hào)。或者,使用多個(gè)放大單元,其將相應(yīng)的增益因數(shù)部分應(yīng)用于聲頻信號(hào)。視情況而定,一個(gè)第一放大單元僅應(yīng)用非噪聲依賴增益因數(shù),而一個(gè)第二放大單元應(yīng)用噪聲依賴和非噪聲依賴增益因數(shù)。作為選擇或補(bǔ)充,第一放大單元僅提供非信號(hào)依賴增益因數(shù),并且第二放大單元僅提供信號(hào)依賴增益因數(shù)。
應(yīng)注意在此使用的術(shù)語“增益因數(shù)”也包括“衰減因數(shù)”,即增益因數(shù)小于1。
本發(fā)明的一些實(shí)施例的一個(gè)方面涉及一種噪聲補(bǔ)償系統(tǒng),其用于調(diào)整所需聲頻信號(hào),以便克服背景噪聲的影響。噪聲補(bǔ)償系統(tǒng)基于背景噪聲計(jì)算校正的聲頻信號(hào)。系統(tǒng)的輸出等于原始聲頻信號(hào)和補(bǔ)償信號(hào)的加權(quán)和。通過發(fā)出加權(quán)和而不僅是補(bǔ)償信號(hào),提供了介于原始信號(hào)(具有原始信號(hào)的優(yōu)點(diǎn))和增強(qiáng)信號(hào)(具有增強(qiáng)信號(hào)的優(yōu)點(diǎn))之間的折中。
在本發(fā)明的一些實(shí)施例中,加權(quán)和給予原始聲頻信號(hào)和補(bǔ)償信號(hào)預(yù)定的權(quán)。視情況而定,可將偶數(shù)權(quán)給予原始聲頻信號(hào)和補(bǔ)償信號(hào)。作為選擇或補(bǔ)充,可根據(jù)應(yīng)用于校正聲頻信號(hào)的增益因數(shù)的范圍和/或背景噪聲的程度來調(diào)整加權(quán)和的權(quán)。
本發(fā)明的一些實(shí)施例的一個(gè)方面涉及一種識(shí)別聲頻信號(hào)的共振峰的方法。方法包括確定聲頻信號(hào)多個(gè)頻率分量的功率值,低通過濾頻率分量的功率值,以便計(jì)算每個(gè)頻率分量的功率與其相鄰(在頻率上)頻率分量的平均值,并找尋所過濾功率值的峰值功率。
視情況而定,可使用多個(gè)濾波器產(chǎn)生頻率分量?;蛘撸褂靡粋€(gè)傅里葉(Fourier)變換產(chǎn)生多個(gè)頻率分量。在本發(fā)明的一些實(shí)施例中,多個(gè)頻率分量包含10-24個(gè)頻率分量,可視情況包含12-15個(gè)。或者,多個(gè)頻率分量的數(shù)量包含所使用FFT(快速傅里葉變換)的FFT接收器的數(shù)量。本發(fā)明的一個(gè)具體實(shí)施例中,通過執(zhí)行一個(gè)FFT(快速傅里葉變換)計(jì)算多個(gè)頻率分量的值并將多個(gè)相鄰接收器的值組成一個(gè)單一頻率分量值。
本發(fā)明的一些實(shí)施例的一個(gè)方面涉及一種噪聲補(bǔ)償系統(tǒng),其用于雙向通信送受話機(jī),如電話,在確定近端的用戶沒有說話的基礎(chǔ)上,執(zhí)行接收自遠(yuǎn)端的噪聲補(bǔ)償。因此,減少了噪聲補(bǔ)償系統(tǒng)的功率消耗。通常,當(dāng)近端用戶說話而遠(yuǎn)端用戶沉默時(shí),近端用戶不在收聽接收自遠(yuǎn)端的信號(hào)或噪聲補(bǔ)償無效。
本發(fā)明的一些實(shí)施例的一個(gè)方面涉及一種確定增益因數(shù)的方法,其用于增強(qiáng)所需聲頻信號(hào),以便克服背景噪聲的影響。方法包括在不同的時(shí)間周期確定至少兩個(gè)聲頻信號(hào)的振幅極限值。將極限值平均并與噪聲指數(shù)相比較。視情況而定,可根據(jù)比較確定增益因數(shù)。在本發(fā)明的一些實(shí)施例中,從背景噪聲信號(hào)中計(jì)算噪聲指數(shù)的方法與計(jì)算聲頻信號(hào)極限值平均數(shù)的方法相似。
在本發(fā)明的一些實(shí)施例中,極限值平均包括幾何或算術(shù)平均值的計(jì)算。作為選擇或補(bǔ)充,可以使用任何其他平均法。
視情況而定,極限值可包括各個(gè)周期中的最大值。作為選擇或補(bǔ)充,一個(gè)或多個(gè)極限值可包括衰減最大值。也就是說,儲(chǔ)存一個(gè)最大值并且所儲(chǔ)存的值根據(jù)預(yù)定的函數(shù)隨著時(shí)間衰減。將衰減最大值與新值比較,如果新值大于當(dāng)前的衰減最大值,則新值將取代衰減最大值。作為選擇或補(bǔ)充,極限值包括聲頻信號(hào)加權(quán)形式的最大值,其中越新近的值的加權(quán)數(shù)越高。
本發(fā)明的一些實(shí)施例的一個(gè)方面涉及一種執(zhí)行回波消除的方法。方法包括找尋產(chǎn)生回波的信號(hào)與經(jīng)受回波消除的信號(hào)之間的關(guān)系,并僅消除產(chǎn)生回波的信號(hào)的單一復(fù)制。此方法相對于所屬技術(shù)領(lǐng)域中熟知的方法而言十分簡單,盡管其性能較低。由于聲學(xué)條件,當(dāng)回波為直接回波時(shí),此方法尤其有利。
因此,根據(jù)本發(fā)明的一個(gè)實(shí)施例,其提供了一種處理聲頻信號(hào)的方法,以克服與聲頻信號(hào)無關(guān)的背景噪聲的影響,方法包括將聲頻信號(hào)頻率分量中聲頻信號(hào)的度量與背景噪聲頻率分量中噪聲的度量相比較,根據(jù)比較確定增益因數(shù)并利用所確定的增益因數(shù)放大至少一部分聲頻信號(hào),包括至少一個(gè)不包含于聲頻信號(hào)頻率分量中的頻率段。
視情況而定,聲頻信號(hào)的度量可包含許多的聲頻信號(hào)。視情況而定,背景噪聲頻率分量中噪聲的度量可包含許多噪聲的掩蔽形式。放大至少一部分信號(hào)可能包括放大進(jìn)行比較的聲頻信號(hào)的頻率分量部分。
視情況而定,放大至少一部分信號(hào)可包括按確定的增益因數(shù)放大整個(gè)聲頻信號(hào)。在本發(fā)明的一些實(shí)施例中,增益因數(shù)的確定包括確定可以使聲頻信號(hào)的頻率分量的頻帶中的信號(hào)噪聲比超過閾值的增益因數(shù)。
視情況而定,當(dāng)信號(hào)和/或噪聲度量隨時(shí)間變化時(shí),可對閾值進(jìn)行動(dòng)態(tài)調(diào)整?;蛘?,閾值為一個(gè)預(yù)定值。視情況而定,比較聲頻信號(hào)頻率分量中聲頻信號(hào)的度量包括在含有聲頻信號(hào)共振峰的頻率分量中的比較過程。視情況而定,在含有聲頻信號(hào)共振峰的頻率分量中的比較過程包括,在多個(gè)聲頻信號(hào)頻率分量中具有最小信號(hào)噪聲比(SNR)的頻帶的頻率分量中的比較過程。
視情況而定,方法可包括將聲頻信號(hào)分成多個(gè)頻率分量并選擇部分頻率分量。選擇部分頻率分量可能包括選擇含有聲頻信號(hào)共振峰的頻率分量。視情況而定,選擇含有聲頻信號(hào)共振峰的頻率分量可包括選擇預(yù)定數(shù)量的含有共振峰的頻率分量。
視情況而定,方法可包括從所選頻率分量中選擇聲頻信號(hào)的頻率分量。放大至少一部分聲頻信號(hào)可能包括利用由多個(gè)增益因數(shù)(包括根據(jù)比較確定的增益因數(shù))合成的增益因數(shù)進(jìn)行的放大。視情況而定,方法可包括在有背景噪聲的情況下發(fā)出放大信號(hào)。
聲頻信號(hào)的頻率分量和噪聲的頻率分量可能跨越大體上相同的頻帶。視情況而定,聲頻信號(hào)的頻率分量可包括一個(gè)頻率帶。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,其還提供了一種處理聲頻信號(hào)的方法,以克服與聲頻信號(hào)無關(guān)的背景噪聲的影響,方法包括將聲頻信號(hào)分成多個(gè)頻率分量,通過相應(yīng)的頻率分量的非噪聲依賴增益因數(shù)來增強(qiáng)每個(gè)頻率分量,并通過相應(yīng)的頻率分量的噪聲依賴增益因數(shù)來倍增每個(gè)頻率分量。
方法可能包括將多個(gè)頻率分量重新合成為增強(qiáng)的聲頻信號(hào)。
視情況而定,將聲頻信號(hào)分成多個(gè)頻率分量可包括將其分成10-24個(gè)頻率分量或超過100個(gè)頻率分量。視情況而定,將聲頻信號(hào)分成多個(gè)頻率分量可包括將其分成大體上不重疊的多個(gè)頻率分量。通過相應(yīng)的非噪聲依賴增益因數(shù)來增強(qiáng)每個(gè)頻率分量可能包括通過預(yù)定的非信號(hào)依賴增益因數(shù)增強(qiáng)頻率分量。
通過相應(yīng)的噪聲依賴增益因數(shù)來倍增每個(gè)頻率分量可能包括利用相同的噪聲依賴增益因數(shù)倍增大體上所有的頻率分量。可能由一個(gè)單一功能元件執(zhí)行增強(qiáng)與倍增。視情況而定,可由獨(dú)立的功能元件執(zhí)行增強(qiáng)與倍增。
視情況而定,如果聲頻信號(hào)包含有聲語音,則非噪聲依賴增益因數(shù)可包括有聲語音增強(qiáng)因數(shù)。將聲頻信號(hào)分成多個(gè)頻率分量可能包括對聲頻信號(hào)運(yùn)用傅里葉(Fourier)變換。作為選擇或補(bǔ)充,將聲頻信號(hào)分成多個(gè)頻率分量包括使聲頻信號(hào)通過一個(gè)帶通濾波器陣列。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,其還提供了一種處理聲頻信號(hào)的方法,以克服與聲頻信號(hào)無關(guān)的背景噪聲的影響,方法包括接收聲頻信號(hào),根據(jù)背景噪聲的度量增強(qiáng)聲頻信號(hào),并提供一個(gè)輸出,其等于增強(qiáng)聲頻信號(hào)和接收聲頻信號(hào)的加權(quán)和。
視情況而定,增強(qiáng)聲頻信號(hào)可包括利用相應(yīng)的增益因數(shù)倍增多個(gè)聲頻信號(hào)的頻率分量。視情況而定,提供加權(quán)和可包括提供利用動(dòng)態(tài)調(diào)整的加權(quán)數(shù)產(chǎn)生的加權(quán)和。視情況而定,可根據(jù)聲頻信號(hào)增強(qiáng)的程度確定動(dòng)態(tài)調(diào)整的加權(quán)數(shù)。在本發(fā)明的一些實(shí)施例中,增強(qiáng)聲頻信號(hào)包括計(jì)算多個(gè)不同的增益因數(shù)并利用多個(gè)增益因數(shù)倍增聲頻信號(hào),并且其中根據(jù)一個(gè)增益因數(shù)確定動(dòng)態(tài)調(diào)整的加權(quán)數(shù)。
視情況而定,至少不同增益因數(shù)中的一個(gè)可包括歷史依賴增益因數(shù)。視情況而定,提供加權(quán)和可包括提供利用預(yù)定加權(quán)數(shù)產(chǎn)生的加權(quán)和。視情況而定,提供加權(quán)和可包括在確定與所提供加權(quán)和有關(guān)的聽眾正在說話的基礎(chǔ)上提供以所接收聲頻信號(hào)為主的加權(quán)和。視情況而定,提供加權(quán)和可包括在確定聲頻信號(hào)不包含語音信號(hào)的基礎(chǔ)上提供以所接收聲頻信號(hào)為主的加權(quán)和。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,其還提供了一種噪聲補(bǔ)償系統(tǒng),系統(tǒng)包括適合于接收聲頻信號(hào)的輸入接口,適合于發(fā)出增強(qiáng)聲頻信號(hào)的揚(yáng)聲器,適合于收集背景噪聲的話筒,背景噪聲會(huì)干擾聽眾對增強(qiáng)信號(hào)的收聽,以及適合于將聲頻信號(hào)頻率分量中聲頻信號(hào)的度量與相同頻率分量中背景噪聲的度量相比較的控制器,根據(jù)比較確定增益因數(shù)并利用所確定的增益因數(shù)放大至少一部分聲頻信號(hào),包括至少一個(gè)不在頻率分量中的頻率段,以便提供增強(qiáng)的聲頻信號(hào)。
視情況而定,揚(yáng)聲器和話筒可為電話手機(jī)的一部分。系統(tǒng)可選擇性的包括一個(gè)回波消除器,其至少從背景噪聲中消除一個(gè)增強(qiáng)聲頻信號(hào)的回波。視情況而定,回波消除器僅從背景噪聲中消除增強(qiáng)聲頻信號(hào)的單一回波。
因此,根據(jù)本發(fā)明的一個(gè)實(shí)施例,其提供了一種確定增益因數(shù)的方法,用于增強(qiáng)聲頻信號(hào),以克服與聲頻信號(hào)無關(guān)的背景噪聲的影響,方法包括在聲頻信號(hào)的度量中確定多個(gè)極限值,計(jì)算極限值的平均值,將平均值與噪聲度量相比較,并根據(jù)比較確定增強(qiáng)聲頻信號(hào)的增益因數(shù)。
視情況而定,確定多個(gè)極限值可包括在聲頻信號(hào)的不同時(shí)間段中確定極限值。視情況而定,確定多個(gè)極限值可包括在聲頻信號(hào)的具有不同長度的時(shí)間段中確定極限值。視情況而定,確定多個(gè)極限值可包括確定最大值。作為選擇或補(bǔ)充,確定多個(gè)極限值可包括確定聲頻信號(hào)加權(quán)形式的最大值,其中越新近的值的加權(quán)數(shù)越高。視情況而定,計(jì)算極限值的平均值可包括計(jì)算其幾何平均值。
將結(jié)合附圖以及下面對實(shí)施例的描述,進(jìn)一步說明本發(fā)明的非限定性具體實(shí)施例。在多個(gè)圖中出現(xiàn)的相同結(jié)構(gòu),元件或部分最好由相同或類似數(shù)字表示,其中圖1為根據(jù)本發(fā)明實(shí)施例的噪聲補(bǔ)償系統(tǒng)的示意圖;圖2A為根據(jù)本發(fā)明實(shí)施例的噪聲補(bǔ)償系統(tǒng)的控制器的結(jié)構(gòu)示意圖;圖2B為根據(jù)本發(fā)明另一實(shí)施例的噪聲補(bǔ)償系統(tǒng)的控制器的結(jié)構(gòu)示意圖;圖3為根據(jù)本發(fā)明實(shí)施例的,如圖2A或圖2B所示控制器的邏輯單元示意圖;圖4為根據(jù)本發(fā)明實(shí)施例的圖3所示邏輯單元的增益因數(shù)確定單元示意圖;圖5A和5B根據(jù)本發(fā)明實(shí)施例,顯示了在利用由共振峰單元產(chǎn)生的增益因數(shù)進(jìn)行校正之前和之后的示范聲音信號(hào)圖;圖6為根據(jù)本發(fā)明實(shí)施例的增強(qiáng)濾波器的增益因數(shù)示意圖;
圖7為根據(jù)本發(fā)明實(shí)施例的示范噪聲功率譜和其掩蔽形式的示意圖;以及圖8為根據(jù)本發(fā)明實(shí)施例的語音檢測器的結(jié)構(gòu)示意圖。
具體實(shí)施例方式
圖1為根據(jù)本發(fā)明實(shí)施例的噪聲補(bǔ)償系統(tǒng)30的示意圖。系統(tǒng)30接收由揚(yáng)聲器32發(fā)出的輸入聲音信號(hào)Sinput(t)。例如,接收來自電話通話中遠(yuǎn)程方的Sinput(t)??刂破?0接收輸入聲音信號(hào)Sinput(t)和揚(yáng)聲器32附近噪聲的估計(jì)值N(t),并提供噪聲補(bǔ)償輸入信號(hào)S’(t),其為輸入聲音信號(hào)Sinput(t)的噪聲補(bǔ)償形式。
在本發(fā)明的一些實(shí)施例中,輸入聲音信號(hào)Sinput(t)將通過噪聲凈化器95,其負(fù)責(zé)提供輸入聲音信號(hào)Sinput(t)的噪聲濾波形式S(t)。噪聲凈化器95的操作與揚(yáng)聲器32附近的噪聲等級(jí)無關(guān)。噪聲凈化器95當(dāng)沒有語音信號(hào)時(shí)可視情況對噪聲進(jìn)行測量并確定噪聲的頻譜形式。接著,噪聲凈化器95可視情況從包括語音的信號(hào)部分的譜表示中去除噪聲的譜表示。作為選擇或補(bǔ)充,也可以使用所屬技術(shù)領(lǐng)域中已知的任何其他噪聲凈化器,例如海爾夫(Helf)等人的第5,550,924號(hào)美國專利中所描述的和/或在友(Yoo)的“利用帶間聲學(xué)信息模擬有噪聲語音的固定時(shí)間頻率范圍”(1999年,IEEE會(huì)議論文集809-812頁,卷2,[聲學(xué),語音和信號(hào)處理])中所描述的噪聲凈化器,其所公開的內(nèi)容將以引用的方式并入本文。作為選擇或補(bǔ)充,在確定頻率分量之后,將噪聲凈化器與控制器40相鄰安置。因此,由控制器40執(zhí)行的頻譜選取也可供噪聲凈化器使用。
在本發(fā)明的一些實(shí)施例中,根據(jù)輸入噪聲信號(hào)n(t)生成噪聲估計(jì)值N(t),輸入噪聲信號(hào)由在揚(yáng)聲器32附近的話筒34收集。視情況而定,輸入噪聲信號(hào)n(t)可由放大器36放大并通過回波消除器(EC)96以便獲得噪聲估計(jì)值N(t)?;夭ㄏ?6從輸入噪聲信號(hào)n(t)中消除輸出信號(hào)S’(t)的回波,其由話筒34收集和/或其由于聲耦合而進(jìn)入n(t)。
在本發(fā)明的一些實(shí)施例中,回波消除器96在新近預(yù)定大小的輸出信號(hào)S’(t)段(例如幾毫秒)中找尋噪聲信號(hào)n(t)中的最大相關(guān)段。回波消除器96可視情況確定段的相關(guān)值以及它們之間的時(shí)差。在本發(fā)明的一些實(shí)施例中,回波消除器96利用段之間的時(shí)差來延遲聲音信號(hào)S’(t)并利用所確定的自相關(guān)值倍增延遲聲音信號(hào)。噪聲估計(jì)值N(t)可視情況被當(dāng)作所檢測的噪聲信號(hào)n(t)來計(jì)算,從中減去倍增的和延遲的聲音信號(hào)。因此,回波消除器96比所屬領(lǐng)域中其他已知的回波消除器要簡單,盡管其代價(jià)是精確性較低。作為選擇或補(bǔ)充,可以使用任何其他的回波消除器,包括例如利用自適應(yīng)濾波的回波消除器。
另外,作為選擇或補(bǔ)充,噪聲n(t)可不通過回波消除器。在本發(fā)明的一個(gè)具體實(shí)施例中,當(dāng)話筒34并不靠近揚(yáng)聲器32時(shí),例如當(dāng)話筒34的位置靠近噪聲源而不是揚(yáng)聲器32時(shí),不使用回波消除器。例如,當(dāng)主要噪聲源(如汽車發(fā)動(dòng)機(jī))已知,話筒34的位置靠近發(fā)動(dòng)機(jī)時(shí)。在本發(fā)明的一個(gè)具體實(shí)施例中,話筒34和揚(yáng)聲器32之間至少呈90度安置于電話中,例如垂直或反向相對。在這些具體實(shí)施例中,系統(tǒng)30視情況可不包括回波消除器。
在本發(fā)明的一些實(shí)施例中,噪聲補(bǔ)償系統(tǒng)30補(bǔ)償在有線或移動(dòng)電話機(jī)附近的噪聲。視情況而定,系統(tǒng)30可安置于電話機(jī)之中。作為選擇或補(bǔ)充,系統(tǒng)30或其部分可安置于電話網(wǎng)的服務(wù)電話機(jī)之中。話筒34視情況可為普通的電話機(jī)話筒,除了常規(guī)使用外,還用于收集輸入噪聲信號(hào)n(t)。作為選擇或補(bǔ)充,話筒34為附著于電話機(jī)上的免提話筒。另外,作為選擇或補(bǔ)充,話筒34可獨(dú)立于電話機(jī)上的常規(guī)話筒。
在本發(fā)明的其他實(shí)施例中,系統(tǒng)30與其他的音響和/或聲頻系統(tǒng)一同使用,例如廣播系統(tǒng),音樂系統(tǒng),電視會(huì)議系統(tǒng),收音機(jī)和/或電視機(jī)。在本發(fā)明的一些實(shí)施例中,使用多個(gè)話筒收集用于估算噪聲N(t)的噪聲信號(hào)??蓪⒁粋€(gè)或多個(gè)話筒34安置于靠近噪聲源,靠近聽眾的位置和/或任何其他適合確定將被補(bǔ)償?shù)脑肼暤燃?jí)的位置。在本發(fā)明的一些實(shí)施例中,由多個(gè)揚(yáng)聲器32發(fā)出單一輸入信號(hào)Sinput(t)。從而,系統(tǒng)30根據(jù)相應(yīng)的噪聲估計(jì)值N(t)以不同的方式校正每個(gè)揚(yáng)聲器32的輸入信號(hào)。
圖2A為根據(jù)本發(fā)明實(shí)施例的控制器40的結(jié)構(gòu)示意圖。控制器40視情況可以數(shù)字樣本流的方式接收輸入信號(hào)S(t)和噪聲估計(jì)值信號(hào)N(t),并以預(yù)定速率接收,例如每10或12.5毫秒一個(gè)樣本。作為選擇或補(bǔ)充,輸入信號(hào)S(t)和/或噪聲信號(hào)N(t)以模擬信號(hào)的形式提供,可通過適合的模擬數(shù)字轉(zhuǎn)換器(未圖示)將其轉(zhuǎn)換為數(shù)字流。在本發(fā)明的一些實(shí)施例中,在緩沖器110和116中分別積累預(yù)定數(shù)量的輸入信號(hào)S(t)和噪聲信號(hào)N(t)樣本。積累的樣本視情況可分別通過快速傅里葉變換(FFT)單元111和115,以便提供輸入信號(hào)S(t)的多個(gè)頻率分量值S1,S2,…,Sn以及噪聲信號(hào)N(t)的多個(gè)頻率分量值N1,N2,…,Nm。作為選擇或補(bǔ)充,可以使用除FFT(快速傅里葉變換)以外的其他傅里葉變換方法。
在本發(fā)明的一些實(shí)施例中,F(xiàn)FT(快速傅里葉變換)的每個(gè)接收器對應(yīng)于一個(gè)單獨(dú)的頻率分量?;蛘?,每個(gè)頻率分量包含一組獨(dú)立的接收器。在本發(fā)明的一些實(shí)施例中,大體上所有的頻率分量,除了極限情況外,都由相同數(shù)量的接收器形成。作為選擇或補(bǔ)充,頻率分量的頻帶是預(yù)定的,如下文中結(jié)合圖2B所描述的一樣,并利用每個(gè)頻帶中包括的接收器的值確定頻率分量的值。
頻率分量值S1,S2,…,Sn視情況可由增強(qiáng)濾波器112濾波,其根據(jù)預(yù)定的加重方案加重特定的頻率分量,以便增加聲音信號(hào)S(t)的清晰度。增強(qiáng)濾波器112視情況可增強(qiáng)包含主要語音頻率的頻率分量的振幅,以便加重語音信號(hào)。將在下文中結(jié)合圖6描述增強(qiáng)濾波器112的具體實(shí)施例。此后,如下文中所述,對應(yīng)于噪聲N(t)和聲音信號(hào)S(t),在倍增單元117中利用由邏輯單元77確定的相應(yīng)增益因數(shù)(gi,線路121)倍增增強(qiáng)的頻率分量值。因此,在增強(qiáng)濾波器112中利用非噪聲依賴值,在倍增單元117中利用噪聲依賴值倍增每個(gè)頻率分量。
在執(zhí)行噪聲依賴校正之前,通過利用增強(qiáng)濾波器112加重語音信號(hào),噪聲依賴校正集中于處理聲音信號(hào)S(t)的語音分量。如下文描述,應(yīng)注意噪聲依賴校正通常對于所有的頻率分量均相同,以便不會(huì)導(dǎo)致聲音信號(hào)的失真。另一方面,非噪聲依賴校正對于不同的頻率分量使用不同的增益因數(shù)。盡管對不同的頻率分量應(yīng)用不同的增益因數(shù)會(huì)導(dǎo)致聲音信號(hào)的失真,但此失真具有已知的影響并且不依賴于已調(diào)整信號(hào)之外的值,如噪聲。在本發(fā)明的一些實(shí)施例中,如下文所述,倍增單元117的增益因數(shù){gi}是噪聲依賴和非噪聲依賴校正的合成。
增強(qiáng)濾波器112安置于倍增單元117之前,作為選擇或補(bǔ)充,增強(qiáng)濾波器112(或第二增強(qiáng)濾波器)可在倍增單元117的輸出端工作?;陬l率分量的單一選取執(zhí)行噪聲依賴和非噪聲依賴校正,將減小噪聲補(bǔ)償系統(tǒng)30的復(fù)雜性。
倍增的頻率分量值視情況可通過反向FFT(快速傅里葉變換)(IFFT)單元118變換回時(shí)域中,以便提供調(diào)整的聲音信號(hào)S”(t)。在本發(fā)明的一些實(shí)施例中,如下文所述,基于由邏輯單元77產(chǎn)生的相應(yīng)加權(quán)數(shù)b1和b2(b1+b2=1),加權(quán)平均單元133生成調(diào)整的聲音信號(hào)S”(t)和輸入聲音信號(hào)S(t)的加權(quán)和Sw(t)。加權(quán)和視情況可輸入軟限幅器100中,其根據(jù)需要調(diào)整加權(quán)和,使得加權(quán)和不會(huì)超過揚(yáng)聲器32的工作范圍。限幅器100輸出的信號(hào)視情況可通過數(shù)字模擬(D/A)轉(zhuǎn)換器31轉(zhuǎn)換成模擬信號(hào),再由功率放大器52放大,通過揚(yáng)聲器32發(fā)出?;蛘?,D/A轉(zhuǎn)換器31可安置于加權(quán)平均單元133的加法器或限幅器100之前。
在本發(fā)明的一些實(shí)施例中,限幅器100將加權(quán)和Sw(t)限制在放大器52的預(yù)定操作極限之間的范圍中。作為選擇或補(bǔ)充,可基于放大器52的當(dāng)前動(dòng)態(tài)范圍周期性的確定限幅器100限制加權(quán)和Sw(t)的范圍。視情況而定,限幅器100可被限制在對稱極限之間,即,-極限<Sw(t)<+極限。在本發(fā)明的一個(gè)具體實(shí)施例中,限幅器100執(zhí)行下列功能 其中A為0到1之間的任意值,x為將被限幅的信號(hào),F(xiàn)(x)為限幅信號(hào)。
除了使用限幅器100,作為選擇或補(bǔ)充,功率放大器52的動(dòng)態(tài)范圍可大于進(jìn)入控制器40的信號(hào)的動(dòng)態(tài)范圍,使得控制器40大體上不會(huì)產(chǎn)生超出功率放大器52動(dòng)態(tài)范圍的信號(hào)。另外,作為選擇或補(bǔ)充,如下文所述,由邏輯單元77產(chǎn)生的增益因數(shù)包括壓縮因數(shù),其大體上消除了對限幅器100的需要。但是,應(yīng)注意在本發(fā)明的一些實(shí)施例中,即使邏輯單元77產(chǎn)生的增益因數(shù)包括壓縮因數(shù),仍使用限幅器100,以便防止任何失真。
在本發(fā)明的一些實(shí)施例中,邏輯單元77為聲音信號(hào)S(t)的每個(gè)頻率分量接收功率等級(jí)ESi,為噪聲信號(hào)N(t)的每個(gè)頻率分量接收功率等級(jí)ENi。視情況而定,一個(gè)產(chǎn)生信號(hào)絕對值的平方(ABS2)的功率確定單元113,其可從增強(qiáng)濾波器112接收S(t)頻率分量的增強(qiáng)值并從其中確定每個(gè)頻率分量的功率ESi。在本發(fā)明的一些實(shí)施例中,由FFT(快速傅里葉變換)單元115產(chǎn)生的噪聲信號(hào)N(t)的頻率分量將通過功率確定單元114(ABS2),其計(jì)算噪聲信號(hào)N(t)在其每個(gè)頻率分量中的功率ENi。如下文中結(jié)合圖7所述,視情況而定,噪聲功率信號(hào)ENi可通過掩蔽單元119,其根據(jù)人類的聲學(xué)條件調(diào)整噪聲功率信號(hào)ENi。
在本發(fā)明的一些實(shí)施例中,聲音信號(hào)S(t)和噪聲信號(hào)N(t)根據(jù)相同的頻率分量劃分被分成相同數(shù)量的頻率分量(即,n=m)?;蛘撸曇粜盘?hào)S(t)和噪聲信號(hào)N(t)被分成不同數(shù)量的頻率分量。在本發(fā)明的一些實(shí)施例中,噪聲信號(hào)N(t)轉(zhuǎn)化成包括較大帶寬的頻譜。視情況而定,在這些實(shí)施例中,噪聲信號(hào)N(t)與聲音信號(hào)S(t)相比被分成更多的頻率分量,視情況可多出1或2個(gè)頻率分量。在本發(fā)明的一些實(shí)施例中,噪聲信號(hào)N(t)的附加頻率分量被掩蔽單元119使用,以便考慮影響低頻帶的高頻帶噪聲頻率。視情況而定,提供給邏輯單元77的噪聲和聲音信號(hào)可包括相同數(shù)量的頻率分量。
在本發(fā)明的一些實(shí)施例中,以共用的足夠高的采樣率對聲音信號(hào)S(t)和噪聲信號(hào)n(t)進(jìn)行采樣,這允許了更多數(shù)量噪聲信號(hào)頻率分量的產(chǎn)生。或者,噪聲信號(hào)n(t)與聲音信號(hào)S(t)相比具有更高的采樣頻率,使得從采樣信號(hào)n(t)中產(chǎn)生更多數(shù)量的頻率分量。視情況而定,噪聲信號(hào)n(t)接著把采樣速率降低到聲音信號(hào)S(t)的采樣率,以便容易進(jìn)行信號(hào)的比較。或者,通過向高頻添加零值來填塞聲音信號(hào)S(t)。
在本發(fā)明的一些實(shí)施例中,語音激活檢測(VAD)單元250確定S(t)什么時(shí)候不包括語音信號(hào)(例如,在詞語之間的沉默時(shí)期),并且當(dāng)S(t)不包括語音信號(hào)時(shí)大體上禁用邏輯單元77。因此,聲音信號(hào)S(t)中詞語之間的噪聲不被放大去“克服”背景噪聲n(t)。視情況而定,當(dāng)VAD單元250確定輸入不包括語音信號(hào)時(shí),邏輯單元77可提供來自聲音信號(hào)S(t)中包括語音的先前時(shí)間的輸出增益因數(shù){gi}。作為選擇或補(bǔ)充,邏輯單元77的一個(gè)或多個(gè)元件不提供輸出以減小功率消耗。視情況而定,當(dāng)確定聲音信號(hào)S(t)不包括語音時(shí),提供給揚(yáng)聲器32的聲音信號(hào)S(t)大體上沒有改變?;蛘撸袛嗦曇粜盘?hào)S(t)并且當(dāng)聲音信號(hào)不包括語音信號(hào)時(shí)不發(fā)送信號(hào)。
在本發(fā)明的一些實(shí)施例中,VAD單元250基于信號(hào)振幅和聲音閾值的比較確定聲音信號(hào)S(t)是否包括語音信號(hào)。視情況而定,根據(jù)在對話期間啟動(dòng)噪聲等級(jí)的等級(jí)(例如在電話交談開始時(shí)的測量)設(shè)置聲音閾值?;蛘?,聲音閾值為工廠測定或另外預(yù)定的。再或者,可根據(jù)連續(xù)和/或周期性獲得的噪聲測量值來自適應(yīng)的調(diào)整聲音閾值。在本發(fā)明的一些實(shí)施例中,將閾值設(shè)置為所測量噪聲的預(yù)定倍數(shù),例如噪聲的3-5倍之間。作為選擇或補(bǔ)充,可以使用所屬領(lǐng)域中已知的任何其他的VAD(語音激活檢測)操作方法。
在本發(fā)明的一些實(shí)施例中,將控制器40的處理迭代應(yīng)用在預(yù)定數(shù)量的樣本上,例如100-1000個(gè)樣本之間,這依賴于采樣速率。視情況而定,可將控制器40的處理迭代應(yīng)用在為2的乘方的樣本上,例如128,256或512,以便執(zhí)行使用快速傅里葉變換(FFT)方法的傅里葉(Fourier)變換。在本發(fā)明的一些實(shí)施例中,在每個(gè)重復(fù)中使用的樣本數(shù)量要調(diào)整到既滿足所需的精確性(這需要較大數(shù)量的樣本)又滿足縮短延遲(這要求較小數(shù)量的樣本)的需要。視情況而定,用戶可在特定時(shí)間調(diào)整處理迭代中使用的樣本數(shù)量。在本發(fā)明的一些實(shí)施例中,根據(jù)信號(hào)從其起源到揚(yáng)聲器32的總延遲設(shè)置延遲。例如,當(dāng)電話中使用系統(tǒng)30時(shí),如果信號(hào)的環(huán)路延遲(RTD)相對較低,則可以使用具有較大樣本數(shù)量的快速傅里葉變換(FFT),導(dǎo)致一個(gè)相對較大的延遲,如20ms。但是,如果信號(hào)的環(huán)路延遲(RTD)相對較高,則通過減小用于執(zhí)行FFT的樣本數(shù)量將系統(tǒng)30的延遲限制為5或10ms。
視情況而定,可在非重疊樣本組上執(zhí)行每個(gè)處理迭代?;蛘撸瑘?zhí)行每個(gè)處理迭代的樣本組與在前一個(gè)處理迭代中使用的一個(gè)或多個(gè)樣本部分重疊。在本發(fā)明的一個(gè)具體實(shí)施例中,每次執(zhí)行處理迭代將收集128個(gè)樣本,執(zhí)行發(fā)生在一組256個(gè)最新樣本上。在本發(fā)明的一些實(shí)施例中,調(diào)整重疊樣本的數(shù)量作為語音質(zhì)量對功率消耗的函數(shù)。當(dāng)期望最小化功率消耗時(shí),執(zhí)行較少的處理迭代,重疊率較低或沒有重疊。當(dāng)期望獲得高的語音質(zhì)量時(shí),頻繁的執(zhí)行處理迭代,重疊率較高。用戶視情況可選擇期望的處理迭代速率。
除了使用傅里葉(Fourier)變換產(chǎn)生頻率分量值,如現(xiàn)在結(jié)合圖2B所述,還可使用帶通濾波器陣列產(chǎn)生聲音和噪聲信號(hào)的頻率分量信號(hào)。使用濾波器陣列,使得系統(tǒng)30的操作大體上不會(huì)產(chǎn)生延遲。
圖2B為根據(jù)本發(fā)明實(shí)施例的控制器40’的結(jié)構(gòu)示意圖??刂破?0’類似于控制器40并可以代替控制器40用于系統(tǒng)30中。在下面的描述中,僅介紹控制器40’中不同于控制器40的元件。在控制器40’中,聲音信號(hào)S(t)和噪聲信號(hào)N(t)將分別通過相應(yīng)的帶通濾波器(BPF)陣列62和64,其生成多個(gè)頻率分量聲音信號(hào)S1(t),S2(t),…,Sn(t)以及多個(gè)頻率分量噪聲信號(hào)N1(t),N2(t),…,Nm(t)。
聲音和噪聲頻率分量的數(shù)量將與上述控制器40中的等同物一致。在本發(fā)明的一些實(shí)施例中,根據(jù)所需質(zhì)量和控制器40所覆蓋的頻率范圍,濾波器陣列62中的濾波器數(shù)量大約在10-60之間。視情況而定,控制器40的頻率范圍可包括聲頻范圍,如20Hz到20KHz之間。或者,控制器40的頻率范圍包括人類聲頻范圍,如高達(dá)4到7kHz之間。再作為選擇或補(bǔ)充,頻率范圍可包括較小或較大范圍的頻率,例如當(dāng)系統(tǒng)30用于寵物時(shí)。
在本發(fā)明的一些實(shí)施例中,高達(dá)1kHz的頻率分量具有大約100Hz的帶寬,并且在更高范圍的頻率分量的帶寬與頻率呈對數(shù)關(guān)系。視情況而定,可根據(jù)聲學(xué)和/或人耳的其他特性選擇頻率分量的頻率,例如使人耳產(chǎn)生大體上不同感知的頻率包含在不同的頻率分量中。
在本發(fā)明的一些實(shí)施例中,根據(jù)臨界的音頻劃分頻率分量,這在所屬領(lǐng)域中已知。在這些具體實(shí)施例中使用的頻率分量的數(shù)量依賴于被認(rèn)為是重要的頻率的范圍。對于0-20kHz的范圍,這些具體實(shí)施例視情況可使用約24個(gè)頻率分量。對于300-4000Hz的范圍,這些實(shí)施例視情況可使用圍繞下列頻率的頻率分量450,570,630,700,840,1000,1170,1370,1600,1850,2150,2500和2900Hz。視情況而定,也可以使用一個(gè)或兩個(gè)圍繞350Hz和/或3400Hz的附加頻率分量。
在本發(fā)明的另一具體實(shí)施例中,頻率分量包括下列頻率范圍,400-540,510-630,630-770,770-920,920-1080,1080-1270,1270-1480,1480-1720,1720-2000,2000-2320,2320-2700和2700-3150Hz。應(yīng)注意第一和最后頻率分量將覆蓋低于400Hz和高于3150Hz的頻率,盡管其重要性低于頻率分量的頻率范圍中的頻率。
應(yīng)注意上述例子并非限制,可以使用任何其他頻率分量組。特別的是,可以使用更多數(shù)量的頻率分量,如32,48或甚至65個(gè)。作為選擇或補(bǔ)充,頻率分量的范圍可能部分重疊或不完全覆蓋聲音信號(hào)的整個(gè)頻率范圍。
在本發(fā)明的一些實(shí)施例中,陣列62和64中的濾波器包含巴特沃斯(Butterworth)濾波器,視情況可具有至少兩個(gè),三個(gè),四個(gè),五個(gè)或甚至六個(gè)級(jí)。在本發(fā)明的一個(gè)具體實(shí)施例中,當(dāng)需要低功率消耗的系統(tǒng)30時(shí),使用兩個(gè)或三個(gè)級(jí)。當(dāng)需要高精確性時(shí),視情況可使用至少五個(gè)或六個(gè)級(jí)。在本發(fā)明的一些實(shí)施例中,選擇級(jí)的數(shù)量使得濾波器可模擬人耳內(nèi)對于噪聲的掩蔽效用。
視情況而定,頻率分量的極限為濾波器的-3dB點(diǎn)。在本發(fā)明的一些實(shí)施例中,濾波器的最大放大率約為1。作為選擇或補(bǔ)充,陣列62和/或陣列64中的一些或所有濾波器可為其他型號(hào),例如柴比雪夫多(Chebyshev),貝塞爾(Bessel)或橢圓濾波器。視情況而定,相應(yīng)頻率分量的噪聲和聲音濾波器可具有相同特性。作為選擇或補(bǔ)充,至少一些相應(yīng)頻率分量的噪聲和聲音濾波器具有不同特性。例如,在本發(fā)明的一些實(shí)施例中,濾波器陣列62中的濾波器執(zhí)行增強(qiáng)濾波器112的一些或所有的增強(qiáng)處理(視情況可在這些實(shí)施例中省略增強(qiáng)濾波器112)。在這些實(shí)施例中,陣列62的濾波器所執(zhí)行的增強(qiáng)處理將不同于陣列64的濾波器。
在本發(fā)明的一些實(shí)施例中,控制器40’包括倍增器陣列70,其將每個(gè)聲音頻率分量信號(hào)Si(t)平方以獲得功率信號(hào)ESi(t)。功率信號(hào)ESi(t)視情況可由獨(dú)立的低通濾波器(LPF)76濾波并接著由采樣器(未圖示)采樣以產(chǎn)生頻率分量功率值ESi。除了使用采樣器,當(dāng)在其輸入端讀取值時(shí),還可用邏輯單元77執(zhí)行采樣。低通濾波器76視情況可在采樣之前使功率信號(hào)ESi(t)變平滑,使得采樣時(shí)不會(huì)取到非典型的波動(dòng)值。同樣的,噪聲頻率分量信號(hào)Ni(t)將通過相應(yīng)的倍增器陣列68中的倍增器,其將每個(gè)信號(hào)平方。平方的信號(hào)視情況可由低通濾波器(LPFs)73陣列濾波并被采樣以產(chǎn)生頻率分量功率值ENi。
在本發(fā)明的一些實(shí)施例中,LPFs73和/或76包含一或二階濾波器。視情況而定,低通濾波器具有依賴于相應(yīng)頻率分量低頻邊界Fmin的-3dB點(diǎn)。在本發(fā)明的一個(gè)具體實(shí)施例中,-3dB點(diǎn)約在Fmin/k上,其中k約在1.5到2之間,以便獲取功率值的DC分量。作為選擇或補(bǔ)充,一個(gè)或多個(gè)低通濾波器具有依賴于相應(yīng)頻率分量高頻邊界的-3dB點(diǎn)。再作為選擇或補(bǔ)充,可以使用任何其他適合的低通濾波器。再作為選擇或補(bǔ)充,可以使用任何其他適合的方法和/或?yàn)V波器,用于動(dòng)態(tài)選取功率值(其通常等于平均功率)的DC分量。
在倍增單元117之后,視情況可通過如信號(hào)加法器65合成頻率分量信號(hào)S1(t),S2(t),…,Sn(t)。
圖3為根據(jù)本發(fā)明實(shí)施例的邏輯單元77的示意圖。邏輯單元77包含多個(gè)增益因數(shù)確定單元,其確定增益因數(shù)并根據(jù)對聲音信號(hào)S(t)的不同測定(如功率向量{ESi}所表示)倍增聲音信號(hào)S(t)的頻率分量。在圖3所示實(shí)施例中,多個(gè)增益因數(shù)確定單元包括一個(gè)有聲語音增強(qiáng)單元91,一個(gè)自動(dòng)增益單元92,一個(gè)共振峰單元93和一個(gè)壓縮器單元94。但是,應(yīng)注意根據(jù)本發(fā)明的不同實(shí)施例,邏輯單元77可以包括更少的單元和/或附加單元。倍增器99視情況可接收由增益因數(shù)確定單元確定的增益因數(shù)并向倍增單元117(圖2A或2B)提供增益因數(shù){gi}?;蛘撸瑔卧?1,92,93和94中的每一個(gè)都接收前一單元的增益因數(shù)并提供一個(gè)累積的增益因數(shù)。
邏輯單元77視情況可包括一個(gè)有聲識(shí)別單元89,其確定聲音信號(hào)S(t)在當(dāng)前是包括有聲信號(hào)還是無聲信號(hào),就如功率向量{ESi}所表示的一樣。在所屬領(lǐng)域中已知,由聲門脈沖的譜組成產(chǎn)生的聲音被稱為有聲聲音,在無聲帶幫助下發(fā)出的聲音被稱為無聲聲音。
在本發(fā)明的一些實(shí)施例中,識(shí)別單元89識(shí)別聲音信號(hào)S(t)的共振峰并由此確定聲音信號(hào)是否包括有聲語音。視情況而定,如果聲音信號(hào)S(t)包括顯著的音調(diào),如具有大體上比其他所有音調(diào)都大的振幅,則認(rèn)為信號(hào)包含有聲語音。作為選擇或補(bǔ)充,識(shí)別單元89可以比較聲音信號(hào)S(t)的低頻和高頻中的功率。視情況而定,如果低頻中的功率較高,通過來自高頻功率的預(yù)定閾值,認(rèn)為聲音信號(hào)S(t)有聲。在本發(fā)明的一個(gè)具體實(shí)施例中,聲音信號(hào)S(t)的頻帶大體上均勻的劃分于低頻和高頻之間?;蛘?,根據(jù)聲學(xué)原因可在任何其他點(diǎn)進(jìn)行低頻和高頻之間的劃分。
在本發(fā)明的一些實(shí)施例中,僅當(dāng)信號(hào)具有明顯的有聲特性時(shí)識(shí)別單元89才確定信號(hào)包含有聲語音。這是因?yàn)橛新曊Z音增強(qiáng)單元91僅在確定信號(hào)包含有聲語音后生成改變信號(hào)的增益因數(shù)。
作為選擇或補(bǔ)充,可以使用任何其他方法識(shí)別有聲語音,例如上述提及的Yoo(友)的論文和/或Kates(凱茨)等人的第4,468,804號(hào)美國專利中描述的方法,其所公開的內(nèi)容將以引用的方式并入本文。
有聲語音增強(qiáng)單元91視情況可接收來自識(shí)別單元89的表明聲音信號(hào)S(t)是否包含有聲語音的指示信號(hào)。在本發(fā)明的一些實(shí)施例中,如果聲音信號(hào)S(t)包含有聲語音,則增強(qiáng)單元91將選擇一個(gè)有聲語音增強(qiáng)向量(p1,p2,…,pn),向量適合強(qiáng)調(diào)包含有聲語音的聲音信號(hào)S(t)頻率分量。視情況而定,有聲語音增強(qiáng)向量(p1,p2,…,pn)可包含大體上用于所有有聲語音信號(hào)的預(yù)定向量?;蛘?,語音增強(qiáng)向量(p1,p2,…,pn)可為功率向量{ESi}的函數(shù)。
在本發(fā)明的一些實(shí)施例中,語音增強(qiáng)向量(p1,p2,…,pn)提高低頻功率和/或降低高頻功率。例如,語音增強(qiáng)向量(p1,p2,…,pn)可以是非增單調(diào)函數(shù)。在本發(fā)明的一些實(shí)施例中,當(dāng)識(shí)別單元89提供一個(gè)無聲語音指示信號(hào)時(shí),語音增強(qiáng)向量(p1,p2,…,pn)等于一個(gè)不改變聲音信號(hào)S(t)振幅的單位向量。
在本發(fā)明的一些實(shí)施例中,增強(qiáng)單元91也提供一個(gè)改進(jìn)的功率向量{ESMi},其等于由增強(qiáng)向量(p1,p2,…,pn)倍增的功率向量{ESi}。視情況而定,可通過自動(dòng)增益單元92,用改進(jìn)的功率向量{ESMi}表示聲音信號(hào)S(t)的功率。
在本發(fā)明的一些實(shí)施例中,自動(dòng)增益單元92基于聲音信號(hào)S(t)典型功率和噪聲信號(hào)N(t)典型功率的比較確定信號(hào)S(t)的第一增益因數(shù)(Gain1)。視情況可基于信號(hào)在近期的歷史來確定典型功率。視情況可設(shè)計(jì)第一增益因數(shù),使聲音信號(hào)S(t)一般高于噪聲信號(hào)N(t),同時(shí)共振峰單元93對當(dāng)前時(shí)間的聲音和噪聲信號(hào)執(zhí)行一次特殊的比較。在本發(fā)明的一個(gè)具體實(shí)施例中,自動(dòng)增益單元92與下文中結(jié)合圖4所介紹的一樣。視情況而定,自動(dòng)增益單元92還可提供一個(gè)放大的功率向量{Gain1×ESMi},共振峰單元93使用其代表信號(hào)S(t)。
在本發(fā)明的一些實(shí)施例中,共振峰單元93識(shí)別聲音信號(hào)S(t)的一個(gè)或多個(gè)共振峰,并由此產(chǎn)生一個(gè)第二增益因數(shù)(Gain2)。第二增益因數(shù)(Gain2)視情況可為最小的增益因數(shù),此因數(shù)確保對應(yīng)于聲音信號(hào)S(t)的預(yù)定共振峰組的頻率分量的功率值比噪聲信號(hào)N(t)中相應(yīng)頻率分量的功率至少高出一個(gè)預(yù)定余量。視情況而定,預(yù)定余量可對所有的頻率分量均相同。或者,對不同的頻率分量使用不同的余量。在本發(fā)明的一些實(shí)施例中,預(yù)定余量大約在3-10dB之間,視情況可等于6dB。在本發(fā)明的一個(gè)具體實(shí)施例中,共振峰單元93與下文中結(jié)合圖5A和5B所介紹的一樣。視情況而定,共振峰單元93也可提供一個(gè)放大的功率向量{Gain2×Gain1×ESMi},壓縮單元94使用其代表信號(hào)S(t)。
在本發(fā)明的一些實(shí)施例中,來自自動(dòng)增益單元92的放大的功率向量{Gain1×ESMi}將通過前共振峰平滑器97,其使放大的功率向量{Gain1×ESMi}變得平滑。視情況可執(zhí)行平滑處理,因?yàn)槭窃诼曇粜盘?hào)S(t)頻譜的包絡(luò)線上而不是聲音信號(hào)上找尋共振峰,這包括了許多不重要的波峰。
平滑向量(記做{ESMi’})中的每個(gè)頻率分量值視情況可等于與其鄰接頻率分量的加權(quán)平均值。在本發(fā)明的一個(gè)具體實(shí)施例中,前共振峰平滑器97根據(jù)下列方程進(jìn)行操作ESMi’=Gain1×(0.5×ESMi+0.25×ESMi+1+0.25×ESMi-1)2≤i≤n-1ESM1’=Gain1×(0.66×ESM1+0.34×ESM2)ESMn’=Gain1×(0.66×ESMn+0.34×ESMn-1)或者,使用任何其他的平滑函數(shù),例如考慮更多數(shù)量鄰接頻率分量和/或使用其他加權(quán)因數(shù)的函數(shù)。
在本發(fā)明的一些實(shí)施例中,共振峰單元93接收噪聲功率向量{ENi}的平滑化形式,在此稱為{ENi’}。視情況而定,可由噪聲平滑器98產(chǎn)生平滑化的噪聲功率向量{ENi’},平滑器98與前共振峰平滑器97執(zhí)行相同的函數(shù)?;蛘?,噪聲平滑器98與前共振峰平滑器97執(zhí)行不同的函數(shù),視情況可產(chǎn)生一個(gè)平滑性稍差的信號(hào)。視情況可將噪聲功率向量{ENi}平滑化,使其匹配{Gain1×ESMi}的平滑形式。
在本發(fā)明的一些實(shí)施例中,壓縮單元94產(chǎn)生適合減小校正聲音信號(hào)S(t)功率的壓縮向量(c1,c2,…,cn)。視情況而定,壓縮向量(c1,c2,…,cn)可適合于將校正聲音信號(hào)S(t)功率減小到功率放大器52和/或揚(yáng)聲器32的操作極限之中。作為選擇或補(bǔ)充,壓縮向量(c1,c2,…,cn)可適合于將校正聲音信號(hào)S(t)功率減小到一個(gè)大體上等于原始聲音信號(hào)S(t)的水平或任何其他期望的水平。
視情況而定,壓縮單元94可為每個(gè)頻率分量確定頻率分量中的信號(hào)噪聲比(SNR)。視情況而定,如果頻率分量的信號(hào)噪聲比(SNR)大于約6dB,則向量ci的壓縮增益可開始利用衰減量(負(fù)增益)衰減頻帶中的聲音信號(hào),衰減量為信號(hào)噪聲比(SNR)的函數(shù)。在本發(fā)明的一些實(shí)施例中,根據(jù)單調(diào)函數(shù)確定負(fù)增益的大小,在SNR為6dB時(shí),其為0dB(無衰減),在SNR約為24dB時(shí),其為5dB。視情況而定,負(fù)增益的最大值可為5dB。在本發(fā)明的一個(gè)具體實(shí)施例中,根據(jù)下列函數(shù)確定負(fù)增益(Y)的大小Y=-2.95·10-11·x8+5.67·10-9·x7-4.43·10-7·x6+1.80·10-5·x5-4.0·10-4·x4++0.0046·x3-0.026·x2-0.073·x+4.92·10-13其中x指示SNR。
作為選擇或補(bǔ)充,壓縮單元94可尋找峰值頻率分量,其中由{ESi}表示的聲音信號(hào)S(t)的振幅大體上大于其相鄰頻率分量或所有其他頻率分量(例如,大8-10dB)。視情況而定,壓縮向量(c1,c2,…,cn)可使峰值頻率分量減少約5dB或減少一個(gè)百分比,其程度使得峰值頻率分量的振幅大于其他頻率分量。
再作為選擇或補(bǔ)充,壓縮向量(c1,c2,…,cn)還衰減被噪聲掩蔽的頻率分量。視情況而定,可利用零倍增一些頻率分量,使其基本上被去除,這些頻率分量中聲音信號(hào)S(t)的振幅大體上低于噪聲的振幅(例如,低至少6dB)。
再作為選擇或補(bǔ)充,可以使用任何其他大體上不會(huì)使輸出信號(hào)失真的壓縮函數(shù)。再作為選擇或補(bǔ)充,可不使用壓縮單元94并依靠限幅器100執(zhí)行壓縮。再作為選擇或補(bǔ)充,可不使用限幅器100并依靠壓縮單元94執(zhí)行壓縮。再或者,既不使用限幅器100也不使用壓縮單元94并且不執(zhí)行壓縮。視情況而定,在此選擇中,功率放大器52的工作范圍大于輸入聲音信號(hào)的信號(hào)范圍,以便允許輸入信號(hào)的放大,其由揚(yáng)聲器32發(fā)出。
在本發(fā)明的一些實(shí)施例中,在將來自共振峰單元93的放大功率向量{Gain2×Gain1×ESMi}提供給壓縮單元94之前,由前壓縮平滑器107對其進(jìn)行平滑處理。視情況而定,前壓縮平滑器107可與前共振峰平滑器97執(zhí)行相同或類似的平滑函數(shù)。除了使用平滑器107,壓縮單元94可以接收由Gain2倍增的前共振峰平滑器97的平滑化輸出,其表示聲音信號(hào)S(t)。在本發(fā)明的一些實(shí)施例中,壓縮單元94使用平滑化的噪聲功率向量{ENi’}來表示噪聲信號(hào)N(t)。作為選擇或補(bǔ)充,壓縮單元94可使用噪聲功率向量{ENi}的不同平滑形式。再作為選擇或補(bǔ)充,壓縮單元94可使用未被平滑的噪聲功率向量{ENi}。
在本發(fā)明的一些實(shí)施例中,倍增器99接收輸出因數(shù),例如增強(qiáng)向量{pi},Gain1,Gain2和壓縮向量{ci},并且產(chǎn)生增益向量(g1,g2,gn)作為所接收值的乘積,如gi=pi*Gain1*Gain2*ci。除了包括倍增器99的邏輯單元77,作為選擇或補(bǔ)充,一個(gè)或多個(gè)自動(dòng)增益單元92,共振峰單元93和壓縮器單元94可接收一個(gè)或多個(gè)前一單元的輸出因數(shù)。在本發(fā)明的一個(gè)具體實(shí)施例中,共振峰單元93接收Gain1并提供Gain1與Gain2的乘積,壓縮器單元94接收增強(qiáng)向量,Gain1和Gain2,生成壓縮向量(c1,c2,…,cn)并由此產(chǎn)生增益向量(g1,g2,gn)。
除了單元92,93和94對功率向量{ESi}的校正形式進(jìn)行操作外,作為選擇或補(bǔ)充,一個(gè)或多個(gè)單元可對原始功率向量{ESi}或部分校正功率向量進(jìn)行操作。
在本發(fā)明的一些實(shí)施例中,邏輯單元77包括一個(gè)加權(quán)確定單元138,其動(dòng)態(tài)的確定由加權(quán)平均單元133使用的加權(quán)數(shù)b1和b2。視情況而定,給予改進(jìn)的聲音信號(hào)S”(t)的加權(quán)數(shù)b1可相對較高,即,高于0.5,當(dāng)背景相對嘈雜時(shí),Gain1相對較高。視情況而定,給予改進(jìn)的聲音信號(hào)S”(t)的加權(quán)數(shù)b1可為Gain1的非減函數(shù)。也就是說,當(dāng)Gain1增加時(shí),給予改進(jìn)的聲音信號(hào)S”(t)更多的權(quán)。在本發(fā)明的一個(gè)具體實(shí)施例中,加權(quán)數(shù)b1=Gain1/max,其中max為Gain1的最大可能值。作為選擇或補(bǔ)充,當(dāng)Gain1低于預(yù)定值時(shí),例如0.3,可將b1設(shè)置為0。再作為選擇或補(bǔ)充,當(dāng)Gain1高于預(yù)定值時(shí),例如3,可將b1設(shè)置為1。
或者,加權(quán)數(shù)b1和b2為噪聲{ENi}的函數(shù)或具有預(yù)定值,例如0.5。作為選擇或補(bǔ)充,一個(gè)用戶控制使得用戶可以根據(jù)其偏好調(diào)整b1和b2的值。
在本發(fā)明的一些實(shí)施例中,b1和b2在通過低通濾波器之后進(jìn)入加權(quán)平均單元133,其防止權(quán)數(shù)頻繁的波動(dòng)。作為選擇或補(bǔ)充,由加權(quán)確定單元138執(zhí)行的函數(shù)可包括一個(gè)時(shí)間平滑作用。
圖4為根據(jù)本發(fā)明實(shí)施例的自動(dòng)增益單元92的示意圖。自動(dòng)增益單元92視情況可包括一個(gè)信號(hào)歷史單元406,其為由改進(jìn)的功率向量{ESMi}表示的聲音信號(hào)S(t)確定有代表性的典型功率Hs。此外,自動(dòng)增益單元92包括一個(gè)噪聲歷史單元411,其為由噪聲功率向量{ENi}表示的噪聲信號(hào)N(t)確定有代表性的典型功率Hn。視情況可計(jì)算有代表性的典型值,作為不同時(shí)期多個(gè)最大值的平均數(shù)。在本發(fā)明的一些實(shí)施例中,信號(hào)歷史單元406和噪聲歷史單元411大體上等同。或者,歷史單元406和噪聲歷史單元411彼此不同。舉例來說,聲音典型功率Hs與噪聲典型功率Hn相比將給予先前信號(hào)更高的等待。
在本發(fā)明的一些實(shí)施例中,每個(gè)歷史單元406包含一個(gè)加法器408,其生成所有接收的頻率分量功率的功率和?;蛘撸臃ㄆ?08生成來自濾波器62的頻率分量信號(hào)之和并計(jì)算和的功率和/或原始信號(hào)S(t)的功率。視情況可將和提供給短期最大值寄存器410和長期最大值寄存器412。在本發(fā)明的一些實(shí)施例中,寄存器410和412以下列方式確定其新值。如果接收值大于內(nèi)部儲(chǔ)存值,則新值等于儲(chǔ)存值。否則,新值等于內(nèi)部儲(chǔ)存值的衰減形式,其中短期寄存器410中的值比長期寄存器412中的值衰減的要快。在本發(fā)明的一些實(shí)施例中,短期寄存器410中的值在大約一個(gè)單詞的時(shí)間內(nèi)衰減,使得寄存器410中的值與一個(gè)單詞上的最大功率相關(guān)。在本發(fā)明的一些實(shí)施例中,長期寄存器412中的值一個(gè)或幾個(gè)句子的時(shí)間內(nèi)衰減,使得寄存器412中的值與較長時(shí)期上的最大功率相關(guān)。
在本發(fā)明的一些實(shí)施例中,歷史單元406的寄存器410和412分別與歷史單元411的寄存器410和412具有相同的衰減值?;蛘?,歷史單元406的寄存器410和412與歷史單元411的寄存器410和412具有不同的衰減值。在本發(fā)明的一個(gè)具體實(shí)施例中,信號(hào)歷史單元406的長期寄存器412中的值在大約256ms的時(shí)間內(nèi)約衰減到其值的10-30%,同時(shí)信號(hào)歷史單元406的短期寄存器410中的值在大約64ms的時(shí)間內(nèi)衰減。視情況而定,噪聲歷史單元411的長期寄存器412中的值在大約1秒的時(shí)間內(nèi)約衰減到其值的10-30%,同時(shí)噪聲歷史單元411的短期寄存器410中的值在大約25-100ms的時(shí)間內(nèi)衰減。
在本發(fā)明的一些實(shí)施例中,當(dāng)VAD單元250提供一個(gè)指示信號(hào)表明聲音信號(hào)不包括語音時(shí),信號(hào)歷史單元406的寄存器410和412中的值不衰減。視情況而定,當(dāng)聲音信號(hào)不包括語音時(shí),可不更新寄存器410,即使輸入值具有比寄存器中內(nèi)容更高的功率。為選擇或此外,在確定聲音信號(hào)不包括語音的基礎(chǔ)上,可將短期寄存器410中的值調(diào)零。在本發(fā)明的一些實(shí)施例中,在噪聲歷史單元411中執(zhí)行類似的動(dòng)作。
在本發(fā)明的一些實(shí)施例中,如果接收值大于寄存器中的值,則不立刻更新一個(gè)或多個(gè)寄存器410和412中的值,而是階段的執(zhí)行更新,以防止導(dǎo)致更新太急。視情況而定,可將更新限制在比衰減斜率更陡的預(yù)定斜率中。
自動(dòng)增益單元92除了基于功率信號(hào){ESMi}和/或{ENi}工作外,其還可基于頻率分量的樣本來工作。視情況而定,可將頻率分量的值相加并取其平方,此平方值被自動(dòng)增益單元92使用。
在本發(fā)明的一些實(shí)施例中,平均值單元414計(jì)算短期寄存器410和長期寄存器412中的值的平均值,以便產(chǎn)生典型功率值Hs或Hn。在本發(fā)明的一些實(shí)施例中,平均值單元414計(jì)算幾何平均值?;蛘?,平均值單元414計(jì)算任何其他的平均值,例如算術(shù)平均值或中值。視情況而定,自動(dòng)增益單元92可進(jìn)一步包括一個(gè)除法器108和一個(gè)平方根單元109,其負(fù)責(zé)計(jì)算歷史值比率的平方根,即 以便從功率的比率中獲得增益值。
除了寄存器410和412以外,歷史單元406和/或411可包括更多的具有不同衰減時(shí)間的寄存器。再作為選擇或補(bǔ)充,可以使用任何其他的方法確定一個(gè)或多個(gè)有代表性的典型功率值。
在本發(fā)明的一些實(shí)施例中,自動(dòng)增益單元92包括一個(gè)噪聲平穩(wěn)單元407,其在噪聲N(t)的頻率展開上提供一個(gè)平穩(wěn)(或密度)指示值(FLAT)。增益因數(shù)Gain1視情況可隨著平穩(wěn)指示值線性增加,使得當(dāng)噪聲頻譜更廣時(shí),增益因數(shù)也越大。視情況而定,當(dāng)噪聲N(t)類似于白噪聲時(shí),Gain1可具有接近1值,當(dāng)噪聲類似于具有特定頻率的正弦波時(shí),Gain1的值較低,如0.2。
在本發(fā)明的一些實(shí)施例中,噪聲平穩(wěn)單元407計(jì)算頻率分量噪聲功率值{ENi}的標(biāo)準(zhǔn)化平均值NA。視情況而定,通過除以最大功率值,即maxi{ENi},可將平均值標(biāo)準(zhǔn)化。在本發(fā)明的一個(gè)具體實(shí)施例中,根據(jù)下列方程利用標(biāo)準(zhǔn)化平均值NA計(jì)算平穩(wěn)指示值FLAT 在本發(fā)明的一些實(shí)施例中,及時(shí)將平穩(wěn)指示值FLAT與先前FLAT值平均,以防止其值的強(qiáng)烈波動(dòng)。視情況而定,可使用第一或第二級(jí)低通濾波器隨先前時(shí)間值將平穩(wěn)指示值濾波。作為選擇或補(bǔ)充,可使用任何其他合適的時(shí)間依賴濾波器,以防止強(qiáng)烈波動(dòng)。
視情況而定,倍增器405產(chǎn)生Gain1,其為噪聲平穩(wěn)指示值FLAT,歷史值比率的平方根 和預(yù)定恒定放大率(min_gain)的乘積。在本發(fā)明的一些實(shí)施例中,預(yù)定恒定放大率(min_gain)約為1。或者,預(yù)定恒定放大率(min_gain)約為2-2.5。
圖5A和5B根據(jù)本發(fā)明實(shí)施例,顯示了在利用由共振峰單元93產(chǎn)生的增益因數(shù)進(jìn)行校正之前和之后的示范聲音信號(hào)209的圖。視情況而定,共振峰單元93可識(shí)別等于預(yù)定數(shù)量(如,3個(gè))的聲音信號(hào)S(t)的共振峰,即包絡(luò)波峰。選擇等于預(yù)定數(shù)量的共振峰視情況可包括從較頻帶開始選擇,直到不再發(fā)現(xiàn)共振峰或已發(fā)現(xiàn)預(yù)定數(shù)量的共振峰為止。在本發(fā)明的一個(gè)具體實(shí)施例中,共振峰單元93基于功率信號(hào){ESMi}識(shí)別存在共振峰的頻率分量。例如,在信號(hào)209中,共振峰單元93識(shí)別頻率分量3(S3),頻率分量8(S8)和頻率分量12(S12),作為其中的三個(gè)第一共振峰。
對于每個(gè)存在預(yù)定數(shù)量共振峰的頻率分量,共振峰單元93視情況可確定頻率分量中的SNR,即頻率分量中噪聲信號(hào)ENi208的功率和聲音信號(hào)ESMi 209的功率之間的差異。視情況而定,共振峰單元93可選擇SNR最小(包括大部分負(fù)值)的頻率分量。對于信號(hào)209來說,頻率分量8的SNR最小。在本發(fā)明的一些實(shí)施例中,共振峰單元93的輸出增益(Gain2)等于使最小SNR成為預(yù)定值的所需增益,比如,約在3-6dB之間。作為選擇或補(bǔ)充,共振峰單元93的輸出增益(Gain2)可使SNR成為動(dòng)態(tài)調(diào)整等級(jí)。視情況而定,可根據(jù)噪聲等級(jí),聲音信號(hào)S(t)等級(jí)和/或Gain1的值調(diào)整動(dòng)態(tài)調(diào)整等級(jí)。視情況而定,可通過取噪聲和信號(hào)功率比的比率的平方根并利用約在2-4(等同于3-6dB)之間的恒定余量進(jìn)行倍增來計(jì)算輸出增益(Gain2)。
在利用Gain2倍增信號(hào)209之后,信號(hào)209的頻譜將為圖5B所示。視情況而定,如果最低的SNR超過預(yù)定閾值,如3-6dB之間,則可將Gain2設(shè)置為1。在本發(fā)明的一個(gè)具體實(shí)施例中,如果需要放大,預(yù)定閾值則為一個(gè)可使Gain2產(chǎn)生最低SNR的等級(jí)。或者,如果需要放大,預(yù)定閾值則不為一個(gè)可使Gain2產(chǎn)生最低SNR的等級(jí),例如一個(gè)更低的預(yù)定閾值。使用一個(gè)低的預(yù)定閾值限制了振幅變化的發(fā)生,以及限制了那些真正需要變化的情況。
在本發(fā)明的一些實(shí)施例中,共振峰的預(yù)定數(shù)量包括小于聲音信號(hào)S(t)的共振峰數(shù)量的情況。視情況而定,共振峰的預(yù)定數(shù)量包括在2-4之間的情況,可能為3。應(yīng)注意聲音信號(hào)S(t)的共振峰數(shù)量可能小于共振峰的預(yù)定數(shù)量。在此情況下,從找到的共振峰中執(zhí)行最小SNR的確定,即使所發(fā)現(xiàn)的數(shù)量小于共振峰的預(yù)定數(shù)量。
應(yīng)注意,即使當(dāng)系統(tǒng)30與不包括語音,例如音樂信號(hào)的聲頻信號(hào)結(jié)合工作時(shí),一些實(shí)施例也可使用共振峰單元93。
圖6為根據(jù)本發(fā)明實(shí)施例的增強(qiáng)濾波器112的增益因數(shù)示意圖。如圖所示,視情況而定,可利用增強(qiáng)濾波器112衰減低頻和高頻,同時(shí)放大中間頻率。在本發(fā)明的一些實(shí)施例中,增強(qiáng)濾波器112未改變聲音信號(hào)S(t)的總功率。視情況而定,增強(qiáng)濾波器112可包括一個(gè)倍增器,為每個(gè)頻率分量Si(t)分配相應(yīng)的增益因數(shù)。或者,利用增強(qiáng)濾波器112的單一增益因數(shù)至少倍增一組多個(gè)頻率分量。
增強(qiáng)濾波器112除了具有如圖6所示的增益因數(shù)以外,增強(qiáng)濾波器112的增益因數(shù)也可以按照任何其他的函數(shù)確定,這些函數(shù)可以增強(qiáng)語音信號(hào)和/或減小噪聲。在本發(fā)明的一些實(shí)施例中,基于模擬確定增強(qiáng)濾波器112的增益因數(shù)。作為選擇或補(bǔ)充,可在工廠校準(zhǔn)期調(diào)整增強(qiáng)濾波器112的增益因數(shù)。再作為選擇或補(bǔ)充,可根據(jù)現(xiàn)場試驗(yàn)周期性的更新增強(qiáng)濾波器112的增益因數(shù)。再作為選擇或補(bǔ)充,用戶可以調(diào)整增強(qiáng)濾波器112的增益因數(shù)。此選擇尤其適用于聽力受損的用戶。
圖7為根據(jù)本發(fā)明實(shí)施例的示范噪聲功率信號(hào)譜122和掩蔽噪聲功率信號(hào)譜123的示意圖。掩蔽單元119視情況可發(fā)現(xiàn)信號(hào)譜122的譜峰并為每個(gè)波峰計(jì)算一對以預(yù)定斜率從波峰沿相反方向下降的線301和302。視情況而定,預(yù)定斜率可在約40-60dB/十個(gè)之間。作為選擇或補(bǔ)充,根據(jù)聲學(xué)因素,不同波峰的線301和302具有不同的斜率。再作為選擇或補(bǔ)充,相同波峰的線301和302可具有不同的斜率,例如根據(jù)聲學(xué)因素。掩蔽噪聲功率信號(hào)譜123在每點(diǎn)上視情況可等于線301和302在此點(diǎn)上的最大值?;蛘?,掩蔽噪聲功率信號(hào)譜123在每點(diǎn)上視情況可等于線301和302以及頻譜122在此點(diǎn)上的最大值。視情況而定,掩蔽單元119以實(shí)時(shí)方式工作,其為每個(gè)頻率分量提供掩蔽值,取代原始噪聲功率值。
或者,可以使用任何其他考慮到頻率在人耳中的相互影響的掩蔽單元。再或者,不使用掩蔽單元119,例如當(dāng)頻率分量的數(shù)量相對較少和/或使用如圖2B所示的濾波器64產(chǎn)生頻率分量值時(shí)。當(dāng)濾波器64產(chǎn)生頻率分量值時(shí),所設(shè)計(jì)的濾波器結(jié)構(gòu)通常可以執(zhí)行掩蔽功能。
在本發(fā)明的一些實(shí)施例中,例如其中話筒34和揚(yáng)聲器32屬于一部電話,系統(tǒng)30包括一個(gè)確定電話用戶在何時(shí)說話的語音檢測器。視情況而定,當(dāng)用戶說話時(shí),系統(tǒng)30可停止校正遠(yuǎn)程聲音信號(hào)S(t)。因此,系統(tǒng)30不會(huì)將用戶的語音當(dāng)作噪音并從而不會(huì)促使接受的遠(yuǎn)程聲音信號(hào)的振幅高于用戶的說話聲音。
圖8為根據(jù)本發(fā)明實(shí)施例的語音檢測器81的結(jié)構(gòu)示意圖。語音檢測器8 1視情況可從話筒34接收信號(hào),并確定所接收信號(hào)何時(shí)包括語音。在本發(fā)明的一些實(shí)施例中,語音檢測器81包括一個(gè)峰值檢測器82和/或一個(gè)斜率檢測器84,其確定所接收信號(hào)何時(shí)包括語音。視情況而定,峰值檢測器82可將所接收信號(hào)與閾值相比較并當(dāng)所接收信號(hào)高于閾值時(shí)提供一個(gè)語音指示信號(hào)。斜率檢測器84視情況可跟蹤所接收信號(hào)振幅的斜率。在本發(fā)明的一些實(shí)施例中,斜率檢測器84當(dāng)斜率超過預(yù)定遞增斜率時(shí)提供一個(gè)語音開始指示信號(hào),當(dāng)斜率超過預(yù)定遞減斜率時(shí)提供一個(gè)語音結(jié)束指示信號(hào)。
視情況而定,語音邏輯單元86可接收指示信號(hào)。在本發(fā)明的一些實(shí)施例中,當(dāng)語音開始指示信號(hào)和語音指示信號(hào)均被接收時(shí),邏輯單元86停止系統(tǒng)30的信號(hào)校正功能。視情況而定,當(dāng)接收到語音結(jié)束指示信號(hào)而未接收到語音指示信號(hào)時(shí),邏輯單元86在系統(tǒng)30的信號(hào)校正功能開啟后,可開始一個(gè)大約0.5-1.2秒間的計(jì)數(shù)周期,視情況可為1秒。系統(tǒng)30的信號(hào)校正功能視情況可僅在于計(jì)數(shù)周期內(nèi)未接收到語音開始指示信號(hào)和語音指示信號(hào)的情況下開啟。因此,當(dāng)用戶說話時(shí),未增強(qiáng)來自遠(yuǎn)端的聲音信號(hào)S(t)而使其超過用戶語音。
在本發(fā)明的一些實(shí)施例中,停止系統(tǒng)30的信號(hào)校正功能包括將遠(yuǎn)端聲音信號(hào)S(t)的VAD信號(hào)設(shè)置為無語音,不管遠(yuǎn)端聲音信號(hào)S(t)是否包括語音信號(hào)。作為選擇或補(bǔ)充,停止系統(tǒng)30的信號(hào)校正功能還可包括將b1設(shè)置為零。
在本發(fā)明的一些實(shí)施例中,當(dāng)無語音存在時(shí),可根據(jù)所接收信號(hào)的度量動(dòng)態(tài)調(diào)整峰值檢測器82使用的閾值。視情況而定,一個(gè)噪聲平均單元87可在一個(gè)新近的周期內(nèi)平均所接收信號(hào)的振幅,此周期中邏輯單元86確定從話筒所接收的信號(hào)不包括語音。在本發(fā)明的一些實(shí)施例中,由一個(gè)積分器執(zhí)行平均操作。峰值檢測器82使用的閾值視情況可為高于噪聲平均單元87的平均噪聲等級(jí)的一個(gè)預(yù)定間隙。當(dāng)環(huán)境噪聲高時(shí)用戶聲音較高,當(dāng)環(huán)境噪聲低時(shí)用戶聲音較低,在此情況下使用自適應(yīng)的閾值較為有利。
在本發(fā)明的一些實(shí)施例中,進(jìn)入峰值檢測器82的信號(hào)將先經(jīng)過一個(gè)低通濾波器(LPF)88,以便防止所接收信號(hào)的瞬時(shí)改變影響邏輯單元86的輸出。作為選擇或補(bǔ)充,進(jìn)入峰值檢測器82和/或斜率檢測器84的信號(hào)可通過一個(gè)滯后函數(shù),以防止瞬時(shí)信號(hào)影響輸出。
在本發(fā)明的一些實(shí)施例中,預(yù)定遞增和遞減斜率具有相同的大小,如大約0.5*Max_amplitude(最大_振幅)/200毫秒,其中Max_amplitude為話筒34所接收語音信號(hào)的預(yù)定最大值或當(dāng)前揚(yáng)聲器的最大振幅。作為選擇或補(bǔ)充,預(yù)定遞增和遞減斜率可具有不同的大小。
除了使用語音檢測器81,還可以使用任何其他的語音檢測器81或VAD,例如類似于VAD250和/或如上所述的第5,524,148號(hào)美國專利的檢測器。再作為選擇或補(bǔ)充,可使用語音檢測器81或其變型來代替VAD250。再或者,不使用語音檢測器81。當(dāng)揚(yáng)聲器32與話筒34相鄰安置時(shí),此選擇將導(dǎo)致系統(tǒng)30對用戶通話的補(bǔ)償,于是,即使當(dāng)用戶通話時(shí),仍增強(qiáng)所接收的信號(hào)。
在上述實(shí)施例中,所述系統(tǒng)30包括七個(gè)單元,它們是增強(qiáng)單元91,自動(dòng)增益單元92,共振峰單元93,壓縮單元94,限幅器100,增強(qiáng)濾波器112和加權(quán)確定單元138,其通過為聲音信號(hào)S(t)計(jì)算增益因數(shù)來直接或間接的影響聲音信號(hào)S(t)。應(yīng)注意在本發(fā)明的一些實(shí)施例中,增強(qiáng)單元91,增強(qiáng)濾波器112和限幅器100不考慮輸入噪聲進(jìn)行工作,而自動(dòng)增益單元92,加權(quán)確定單元138,共振峰單元93和壓縮單元94則依賴噪聲提供增益因數(shù)值。
因此,在本發(fā)明的這些實(shí)施例中,相對于輸入噪聲改變聲音信號(hào)S(t)的單元既利用相同的增益因數(shù)改變了整個(gè)的聲音信號(hào)S(t)(如單元92和93)又不導(dǎo)致聲音信號(hào)峰值的相對位置的改變(如單元94)。因此,噪聲依賴校正不導(dǎo)致信號(hào)失真。在本發(fā)明的一些實(shí)施例中,不使用壓縮單元94,并且因此,所有的噪聲依賴校正利用相同的增益因數(shù)放大了基本上整個(gè)信號(hào)。
通常,單元92和93確定增益因數(shù),增強(qiáng)單元91和增強(qiáng)濾波器112執(zhí)行不依賴于輸入噪聲的預(yù)矯正,并且壓縮單元94,限幅器100和加權(quán)確定單元138儲(chǔ)存能量。
除了倍增單元117的增益因數(shù){gi}包括噪聲依賴和非噪聲依賴因數(shù)外,在本發(fā)明的一些實(shí)施例中,倍增單元117的增益因數(shù)僅包括噪聲依賴因數(shù)。如增強(qiáng)單元91所產(chǎn)生的非噪聲依賴因數(shù)視情況可由增強(qiáng)濾波器112和/或一個(gè)獨(dú)立的倍增器使用。作為選擇或補(bǔ)充,可不使用增強(qiáng)單元91。在本發(fā)明的一些實(shí)施例中,例如其中不使用壓縮單元94,倍增單元117的增益因數(shù)對大體上所有的頻率分量均相同。
在本發(fā)明的一些實(shí)施例中,本發(fā)明的噪聲補(bǔ)償與主動(dòng)噪聲抑制方法相結(jié)合。視情況而定,根據(jù)本發(fā)明實(shí)施例的用于校正聲音信號(hào)S(t)的噪聲估算可基于主動(dòng)抑制的噪聲。或者,噪聲估算可基于在校正前的原始噪聲。
應(yīng)注意將使用硬件,軟件或其組合實(shí)現(xiàn)上述實(shí)施例。過程可包括數(shù)字處理,模擬處理或其組合。特別的是,上述濾波器可為模擬或數(shù)字濾波器。
應(yīng)了解上述方法可以有多種不同的形式,包括同時(shí)執(zhí)行多個(gè)步驟,改變步驟的順序以及改變所使用的具體實(shí)現(xiàn)方法。例如,當(dāng)使用FFT產(chǎn)生頻率分量值時(shí),將少量相鄰FFT值相加以產(chǎn)生數(shù)量較少的頻率分量的頻率分量值。還應(yīng)了解上述對方法和設(shè)備的描述應(yīng)解釋為執(zhí)行此方法的設(shè)備和使用此設(shè)備的方法。
以舉例的方式,通過對本發(fā)明的非限定性實(shí)施例的詳細(xì)描述說明了本發(fā)明的內(nèi)容,這些實(shí)施例不會(huì)限制本發(fā)明的范圍。應(yīng)理解所描述的關(guān)于一個(gè)實(shí)施例的特點(diǎn)和/或步驟也可使用在其他實(shí)施例上,并且并非本發(fā)明的所有實(shí)施例都具有如具體圖中所示或某一實(shí)施例中所述的所有特點(diǎn)和/或步驟。所屬技術(shù)領(lǐng)域的人員可以構(gòu)想到所述的實(shí)施例的變體。
應(yīng)注意一些上述實(shí)施例描述了發(fā)明人所構(gòu)想的最佳模式,并且在其中包括結(jié)構(gòu),動(dòng)作或結(jié)構(gòu)的細(xì)節(jié)以及以舉例形式給出非本發(fā)明所必要的動(dòng)作。如所屬領(lǐng)域中已知的一樣,在此所述的結(jié)構(gòu)和動(dòng)作可由執(zhí)行相同功能的等同物取代,即使結(jié)構(gòu)和動(dòng)作不同。因此,權(quán)利要求書中使用的元件和限制對本發(fā)明的范圍做了限定。當(dāng)在下面的權(quán)利要求書中使用術(shù)語“包括”,“包含”,“具有”和它們的結(jié)合時(shí),其表示“包括但不局限于”。
權(quán)利要求
1.一種處理聲頻信號(hào)以克服與聲頻信號(hào)無關(guān)的背景噪聲影響的方法,其包括將聲頻信號(hào)頻率分量中聲頻信號(hào)的度量與背景噪聲頻率分量中噪聲的度量相比較;根據(jù)比較確定增益因數(shù);以及利用所確定的增益因數(shù)放大至少一部分聲頻信號(hào),包括至少一個(gè)不包含于聲頻信號(hào)頻率分量中的頻率段。
2.如權(quán)利要求1所述的方法,其中聲頻信號(hào)的度量包括聲頻信號(hào)的功率。
3.如權(quán)利要求1或2所述的方法,其中背景噪聲頻率分量中噪聲的度量包括噪聲的掩蔽形式的功率。
4.如上述權(quán)利要求中任一項(xiàng)所述的方法,其中放大至少一部分信號(hào)包括放大進(jìn)行比較的聲頻信號(hào)的頻率分量部分。
5.如權(quán)利要求4所述的方法,其中放大至少一部分信號(hào)包括按確定的增益因數(shù)放大整個(gè)聲頻信號(hào)。
6.如上述權(quán)利要求中任一項(xiàng)所述的方法,其中增益因數(shù)的確定包括確定可以使聲頻信號(hào)的頻率分量的頻帶中的信號(hào)噪聲比超過閾值的增益因數(shù)。
7.如權(quán)利要求6所述的方法,其中當(dāng)信號(hào)和/或噪聲度量隨時(shí)間變化時(shí),可對閾值進(jìn)行動(dòng)態(tài)調(diào)整。
8.如權(quán)利要求6所述的方法,其中閾值為一個(gè)預(yù)定值。
9.如上述權(quán)利要求中任一項(xiàng)所述的方法,其中比較聲頻信號(hào)頻率分量中聲頻信號(hào)的度量包括在含有聲頻信號(hào)共振峰的頻率分量中的比較過程。
10.如權(quán)利要求9所述的方法,其中在含有聲頻信號(hào)共振峰的頻率分量中的比較過程包括,在多個(gè)聲頻信號(hào)頻率分量中具有最小信號(hào)噪聲比(SNR)的頻帶的頻率分量中的比較過程。
11.如上述權(quán)利要求中任一項(xiàng)所述的方法,其包括將聲頻信號(hào)分成多個(gè)頻率分量并選擇部分頻率分量。
12.如權(quán)利要求11所述的方法,其中選擇部分頻率分量包括選擇含有聲頻信號(hào)共振峰的頻率分量。
13.如權(quán)利要求12所述的方法,其中選擇含有聲頻信號(hào)共振峰的頻率分量包括選擇預(yù)定數(shù)量的含有共振峰的頻率分量。
14.如權(quán)利要求11-13中任一項(xiàng)所述的方法,其包括從所選頻率分量中選擇聲頻信號(hào)的頻率分量。
15.如上述權(quán)利要求中任一項(xiàng)所述的方法,其中放大至少一部分聲頻信號(hào)包括利用由多個(gè)增益因數(shù)(包括根據(jù)比較確定的增益因數(shù))合成的增益因數(shù)進(jìn)行的放大。
16.如上述權(quán)利要求中任一項(xiàng)所述的方法,其包括在存在背景噪聲的情況下發(fā)出放大信號(hào)。
17.如上述權(quán)利要求中任一項(xiàng)所述的方法,其中聲頻信號(hào)的頻率分量和噪聲的頻率分量跨越大體上相同的頻帶。
18.如上述權(quán)利要求中任一項(xiàng)所述的方法,其中聲頻信號(hào)的頻率分量包括一個(gè)頻率帶。
19.一種處理聲頻信號(hào)以克服與聲頻信號(hào)無關(guān)的背景噪聲影響的方法,其包括將聲頻信號(hào)分成多個(gè)頻率分量;通過相應(yīng)的頻率分量的非噪聲依賴增益因數(shù)增強(qiáng)每個(gè)頻率分量;以及通過相應(yīng)的頻率分量的噪聲依賴增益因數(shù)倍增每個(gè)頻率分量。
20.如權(quán)利要求19所述的方法,其包括將多個(gè)頻率分量重新結(jié)合成增強(qiáng)的聲頻信號(hào)。
21.如權(quán)利要求19或20所述的方法,其中將聲頻信號(hào)分成多個(gè)頻率分量包含將其分成10-24個(gè)頻率分量。
22.如權(quán)利要求19或20所述的方法,其中將聲頻信號(hào)分成多個(gè)頻率分量包含將其分成超過100個(gè)頻率分量。
23.如權(quán)利要求19-22中任一項(xiàng)所述的方法,其中將聲頻信號(hào)分成多個(gè)頻率分量包含將其分成多個(gè)大體上不重疊的頻率分量。
24.如權(quán)利要求19-23中任一項(xiàng)所述的方法,其中通過相應(yīng)的非噪聲依賴增益因數(shù)增強(qiáng)每個(gè)頻率分量包含通過預(yù)定的非信號(hào)依賴增益因數(shù)進(jìn)行增強(qiáng)。
25.如權(quán)利要求19-24中任一項(xiàng)所述的方法,其中通過相應(yīng)的噪聲依賴增益因數(shù)倍增每個(gè)頻率分量包含利用相同的噪聲依賴增益因數(shù)倍增大體上所有的頻率分量。
26.如權(quán)利要求19-25中任一項(xiàng)所述的方法,其中由一個(gè)單一功能元件執(zhí)行增強(qiáng)和倍增。
27.如權(quán)利要求19-25中任一項(xiàng)所述的方法,其中由獨(dú)立的功能元件執(zhí)行增強(qiáng)和倍增。
28.如權(quán)利要求19-27中任一項(xiàng)所述的方法,其中如果聲頻信號(hào)包含有聲語音,則非噪聲依賴增益因數(shù)包括有聲語音增強(qiáng)因數(shù)。
29.如權(quán)利要求19-28中任一項(xiàng)所述的方法,其中將聲頻信號(hào)分成多個(gè)頻率分量包括對聲頻信號(hào)運(yùn)用傅里葉(Fourier)變換。
30.如權(quán)利要求19-28中任一項(xiàng)所述的方法,其中將聲頻信號(hào)分成多個(gè)頻率分量包括使聲頻信號(hào)通過一個(gè)帶通濾波器陣列。
31.一種處理聲頻信號(hào)以克服與聲頻信號(hào)無關(guān)的背景噪聲影響的方法,其包括接收聲頻信號(hào);根據(jù)背景噪聲的度量增強(qiáng)聲頻信號(hào);以及提供一個(gè)輸出,其等于增強(qiáng)聲頻信號(hào)和接收聲頻信號(hào)的加權(quán)和。
32.如權(quán)利要求31所述的方法,其中增強(qiáng)聲頻信號(hào)包括利用相應(yīng)的增益因數(shù)倍增多個(gè)聲頻信號(hào)的頻率分量。
33.如權(quán)利要求31或32所述的方法,其中提供加權(quán)和可包括提供利用動(dòng)態(tài)調(diào)整的加權(quán)數(shù)產(chǎn)生的加權(quán)和。
34.如權(quán)利要求33所述的方法,其根據(jù)聲頻信號(hào)增強(qiáng)的程度確定動(dòng)態(tài)調(diào)整的加權(quán)數(shù)。
35.如權(quán)利要求33或34所述的方法,其中增強(qiáng)聲頻信號(hào)包括計(jì)算多個(gè)不同的增益因數(shù)并利用多個(gè)增益因數(shù)倍增聲頻信號(hào),并且其中根據(jù)一個(gè)增益因數(shù)確定動(dòng)態(tài)調(diào)整的加權(quán)數(shù)。
36.如權(quán)利要求35所述的方法,其中至少不同增益因數(shù)中的一個(gè)包括歷史依賴增益因數(shù)。
37.如權(quán)利要求31-36中任一項(xiàng)所述的方法,其中提供加權(quán)和包括提供利用預(yù)定加權(quán)數(shù)產(chǎn)生的加權(quán)和。
38.如權(quán)利要求31-37中任一項(xiàng)所述的方法,其中提供加權(quán)和包括在確定與所提供加權(quán)和有關(guān)的聽眾正在說話的基礎(chǔ)上提供以所接收聲頻信號(hào)為主的加權(quán)和。
39.如權(quán)利要求31-37中任一項(xiàng)所述的方法,其中提供加權(quán)和可包括在確定聲頻信號(hào)不包含語音信號(hào)的基礎(chǔ)上提供以所接收聲頻信號(hào)為主的加權(quán)和。
40.一種噪聲補(bǔ)償系統(tǒng),其包括適合于接收聲頻信號(hào)的輸入接口;適合于發(fā)出增強(qiáng)聲頻信號(hào)的揚(yáng)聲器;適合于收集背景噪聲的話筒,背景噪聲會(huì)干擾聽眾對增強(qiáng)信號(hào)的收聽;以及適合于將聲頻信號(hào)頻率分量中聲頻信號(hào)的度量與相同頻率分量中背景噪聲的度量相比較的控制器,根據(jù)比較確定增益因數(shù)并利用所確定的增益因數(shù)放大至少一部分聲頻信號(hào),包括至少一個(gè)不在頻率分量中的頻率段,以便提供增強(qiáng)的聲頻信號(hào)。
41.如權(quán)利要求40所述的系統(tǒng),其中揚(yáng)聲器和話筒為電話聽筒的一部分。
42.如權(quán)利要求40或41所述的系統(tǒng),其包括一個(gè)回波消除器,可至少從背景噪聲中消除一個(gè)增強(qiáng)聲頻信號(hào)的回波。
43.如權(quán)利要求42所述的系統(tǒng),其中回波消除器僅從背景噪聲中消除增強(qiáng)聲頻信號(hào)的單一回波。
44.一種確定增益因數(shù)的方法,其用于增強(qiáng)所需聲頻信號(hào),以便克服背景噪聲的影響,方法包括在聲頻信號(hào)的度量中確定多個(gè)極限值;計(jì)算極限值的平均值;將平均值與噪聲度量相比較;以及根據(jù)比較確定增強(qiáng)聲頻信號(hào)的增益因數(shù)。
45.如權(quán)利要求44所述的方法,其中確定多個(gè)極限值包括在聲頻信號(hào)的不同時(shí)間段中確定極限值。
46.如權(quán)利要求45所述的方法,其中確定多個(gè)極限值包括在聲頻信號(hào)的具有不同長度的時(shí)間段中確定極限值。
47.如權(quán)利要求44-46中任一項(xiàng)所述的方法,其中確定多個(gè)極限值包括確定最大值。
48.如權(quán)利要求44-46中任一項(xiàng)所述的方法,其中確定多個(gè)極限值包括確定聲頻信號(hào)加權(quán)形式的最大值,其中越新近的值的加權(quán)數(shù)越高。
49.如權(quán)利要求44-48中任一項(xiàng)所述的方法,其中計(jì)算極限值的平均值包括計(jì)算幾何平均值。
全文摘要
一種處理聲頻信號(hào)的方法,其目的是克服與聲頻信號(hào)無關(guān)的背景噪聲的影響。此方法包括將聲頻信號(hào)頻率分量中聲頻信號(hào)的度量與背景噪聲頻率分量中噪聲的度量相比較,根據(jù)比較確定增益因數(shù)并利用所確定的增益因數(shù)放大至少一部分聲頻信號(hào),包括至少一個(gè)不包含于聲頻信號(hào)頻率分量中的頻率段。
文檔編號(hào)G10L15/20GK1620751SQ01817028
公開日2005年5月25日 申請日期2001年8月14日 優(yōu)先權(quán)日2000年8月14日
發(fā)明者Z·利希特 申請人:清晰音頻有限公司