音頻信號(hào)噪聲衰減的制作方法
【專利摘要】一種噪聲衰減設(shè)備接收包括期望信號(hào)分量和噪聲信號(hào)分量的音頻信號(hào)。兩個(gè)碼本(109,111)分別包括表示可能的期望信號(hào)分量的期望信號(hào)候選和表示可能的噪聲貢獻(xiàn)的噪聲信號(hào)貢獻(xiàn)候選。分段器(103)將音頻信號(hào)分割成時(shí)間段,并且針對(duì)每個(gè)時(shí)間段,噪聲衰減器(105)通過(guò)為期望信號(hào)候選中的每一個(gè)作為期望信號(hào)候選的成比例版本和噪聲信號(hào)貢獻(xiàn)候選的加權(quán)組合的組合來(lái)生成估計(jì)的信號(hào)候選而生成諸多估計(jì)的信號(hào)候選。噪聲衰減器(105)使指示在所述時(shí)間段中的音頻信號(hào)之間與所估計(jì)的信號(hào)候選的差的成本函數(shù)最小化。信號(hào)候選然后針對(duì)所述時(shí)間段從所估計(jì)的信號(hào)候選被確定,并且音頻信號(hào)基于這個(gè)信號(hào)候選被補(bǔ)償。
【專利說(shuō)明】音頻信號(hào)噪聲衰減
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及音頻信號(hào)噪聲衰減,并且特別地但不排他地,涉及針對(duì)語(yǔ)音信號(hào)的噪聲衰減。
【背景技術(shù)】
[0002]音頻信號(hào)中的噪聲的衰減在許多應(yīng)用中被期望來(lái)進(jìn)一步增強(qiáng)或者加重期望信號(hào)分量。例如,語(yǔ)音在背景噪聲面前的增強(qiáng)由于其實(shí)際的相關(guān)性已吸引了大量興趣。特別有挑戰(zhàn)的應(yīng)用是移動(dòng)通訊中的單話筒噪聲降低。單話筒裝置的低成本使它在新興市場(chǎng)中變得有吸引力。另一方面,多個(gè)話筒的缺少排除了基于波束形成器的解決方案來(lái)抑制可能存在的高水平的噪聲。在不穩(wěn)定條件下很好地工作的單話筒方法因此在商業(yè)上是所期望的。
[0003]在其中音頻波束形成不是切實(shí)可行的或優(yōu)選的多話筒應(yīng)用中或者附加于這樣的波束形成,單話筒噪聲衰減算法同樣是相關(guān)的。例如,這樣的算法可能對(duì)于混響和漫射不穩(wěn)定噪聲場(chǎng)中的或其中有許多干擾源存在的免提音頻和視頻會(huì)議系統(tǒng)是有用的。諸如波束形成之類的空間濾波技術(shù)在這樣的場(chǎng)景中僅能夠?qū)崿F(xiàn)有限的成功,并且需要在后置處理步驟中對(duì)波束形成器的輸出執(zhí)行附加的噪聲抑制。
[0004]各種噪聲衰減算法已被提出了,包括基于關(guān)于期望信號(hào)分量的特性的知識(shí)或假設(shè)的系統(tǒng)。特別地,諸如碼本驅(qū)動(dòng)方案這樣的基于知識(shí)的語(yǔ)音增強(qiáng)方法已被表明即便當(dāng)對(duì)單話筒信號(hào)操作時(shí)在不穩(wěn)定噪聲條件下也很好地執(zhí)行。這樣的方法的例子在s.Srinivasan,J.Samuelsson 和 I B.Kleijn, “Codebook driven short-term predictor parameterestimation for speech enhancement", IEEE Trans.Speech, Audio and LanguageProcessing, vol.14, n0.1, pp.163 {176, Jan.2006 以及 S.Srinivasan, J.Samuelsson和 I B.Kleijn, “Codebook based Bayesian speech enhancement for non-stationaryenvironments, 〃 IEEE Trans.Speech Audio Processing, vol.15, n0.2, pp.441-452,F(xiàn)eb.2007中被呈現(xiàn)。
[0005]這些方法依賴于語(yǔ)音和噪聲譜形狀的訓(xùn)練的碼本,其通過(guò)例如線性預(yù)測(cè)(LP)系數(shù)被參數(shù)化。語(yǔ)音碼本的使用是直觀的并且使其容易地適合于實(shí)際的實(shí)施方案。語(yǔ)音碼本可以是揚(yáng)聲器無(wú)關(guān)的(使用來(lái)自若干揚(yáng)聲器的數(shù)據(jù)所訓(xùn)練的)或揚(yáng)聲器相關(guān)的。后者情形對(duì)于例如移動(dòng)電話應(yīng)用來(lái)說(shuō)是有用的,因?yàn)檫@些往往是個(gè)人的并且常常主要地被單個(gè)揚(yáng)聲器使用。然而,歸因于在實(shí)踐中可以遇到的各種噪聲類型,在實(shí)際的實(shí)施方案中使用噪聲碼本是有挑戰(zhàn)性的。作為結(jié)果,非常大的噪聲碼本典型地被使用。
[0006]典型地,這樣的基于碼本的算法尋求找到當(dāng)被組合時(shí)最接近地和所捕獲的信號(hào)匹配的語(yǔ)音碼本條目和噪聲碼本條目。當(dāng)適當(dāng)?shù)拇a本條目已被找到時(shí),算法基于所述碼本條目來(lái)補(bǔ)償所接收到的信號(hào)。然而,為了識(shí)別適當(dāng)?shù)拇a本條目,搜索遍及語(yǔ)音碼本條目和噪聲碼本條目的所有可能的組合被執(zhí)行。這導(dǎo)致在計(jì)算上資源要求很高的過(guò)程,其尤其對(duì)于低復(fù)雜性裝置來(lái)說(shuō)常常是不切實(shí)際的。此外,大的噪聲碼本的生成和存儲(chǔ)是麻煩的,并且大量可能的噪聲候選可能增加錯(cuò)誤估計(jì)的風(fēng)險(xiǎn),從而導(dǎo)致次優(yōu)噪聲衰減。[0007]因此,改進(jìn)的噪聲衰減方法將是有利的,并且特別地允許增加的靈活性、降低的計(jì)算要求、便利的實(shí)施方案和/或操作、降低的成本和/或改進(jìn)的性能的方法將是有利的。
【發(fā)明內(nèi)容】
[0008]因此,本發(fā)明尋求優(yōu)選地單個(gè)地或以任何組合的方式緩和、減輕或者消除上面提到的缺點(diǎn)中的一個(gè)或多個(gè)。
[0009]根據(jù)本發(fā)明的一個(gè)方面,提供了一種噪聲衰減設(shè)備,其包括:接收機(jī),其用于接收包括期望信號(hào)分量和噪聲信號(hào)分量的音頻信號(hào);第一碼本,其包括針對(duì)期望信號(hào)分量的多個(gè)期望信號(hào)候選,每個(gè)期望信號(hào)候選表示可能的期望信號(hào)分量;第二碼本,其包括多個(gè)噪聲信號(hào)貢獻(xiàn)候選,每個(gè)噪聲信號(hào)貢獻(xiàn)候選表示針對(duì)噪聲信號(hào)分量的可能的噪聲貢獻(xiàn);分段器,其用于將音頻信號(hào)分割成時(shí)間段;噪聲衰減器,其被布置成針對(duì)每個(gè)時(shí)間段執(zhí)行以下步驟:通過(guò)為第一碼本的期望信號(hào)候選中的每一個(gè)作為期望信號(hào)候選的成比例(scaled)版本和噪聲信號(hào)貢獻(xiàn)候選的加權(quán)組合的組合來(lái)生成估計(jì)的信號(hào)候選而生成多個(gè)估計(jì)的信號(hào)候選,期望信號(hào)候選的比例(scaling)和加權(quán)組合的權(quán)重被確定成使指示在時(shí)間段中的音頻信號(hào)與所估計(jì)的信號(hào)候選之間的差的成本函數(shù)最小化;從所估計(jì)的信號(hào)候選生成針對(duì)時(shí)間段中的音頻信號(hào)的信號(hào)候選;以及響應(yīng)于所述信號(hào)候選衰減時(shí)間段中的音頻信號(hào)的噪聲。
[0010]本發(fā)明可以提供改進(jìn)的和/或便利的噪聲衰減。在許多實(shí)施例中,大幅降低的計(jì)算資源是需要的。該方法可以在許多實(shí)施例中允許更高效的噪聲衰減,其可能導(dǎo)致更快的噪聲衰減。在許多場(chǎng)景中,該方法可以使能或者允許實(shí)時(shí)噪聲衰減。
[0011]與常規(guī)方法相比,大幅地較小的噪聲碼本(第二碼本)能夠在許多實(shí)施例中被使用。這可以降低存儲(chǔ)器要求。
[0012]在許多實(shí)施例中,多個(gè)噪聲信號(hào)貢獻(xiàn)候選可能無(wú)法反映關(guān)于噪聲信號(hào)分量的特性的任何知識(shí)或假設(shè)。噪聲信號(hào)貢獻(xiàn)候選可以是通用噪聲信號(hào)貢獻(xiàn)候選,并且可以具體地是固定的、預(yù)定的、靜態(tài)的、永久的和/或非訓(xùn)練的噪聲信號(hào)貢獻(xiàn)候選。這可以允許便利的操作和/或可以便利于第二碼本的生成和/或分布。特別地,訓(xùn)練階段可以在許多實(shí)施例中被避免。
[0013]期望信號(hào)候選中的每一個(gè)都可以具有與時(shí)間段持續(xù)時(shí)間相對(duì)應(yīng)的持續(xù)時(shí)間。噪聲信號(hào)貢獻(xiàn)候選中的每一個(gè)都可以具有與時(shí)間段持續(xù)時(shí)間相對(duì)應(yīng)的持續(xù)時(shí)間。
[0014]期望信號(hào)候選中的每一個(gè)都可以由表征信號(hào)分量的一組參數(shù)來(lái)表示。例如,每個(gè)期望信號(hào)候選都可以包括用于線性預(yù)測(cè)模型的一組線性預(yù)測(cè)系數(shù)。每個(gè)期望信號(hào)候選都可以包括表征譜分布的一組參數(shù),所述譜分布諸如例如功率譜密度(PSD)。
[0015]噪聲信號(hào)貢獻(xiàn)候選中的每一個(gè)都可以由表征信號(hào)分量的一組參數(shù)來(lái)表不。例如,每個(gè)噪聲信號(hào)貢獻(xiàn)候選都可以包括表征譜分布的一組參數(shù),所述譜分布諸如例如功率譜密度(PSD)。用于噪聲信號(hào)貢獻(xiàn)候選的參數(shù)的數(shù)目可以低于用于期望信號(hào)候選的參數(shù)的數(shù)目。
[0016]噪聲信號(hào)分量可以對(duì)應(yīng)于不是期望信號(hào)分量的一部分的任何信號(hào)分量。例如,噪聲信號(hào)分量可以包括白噪聲、有色噪聲、來(lái)自不想要的噪聲源的確定性噪聲、實(shí)施噪聲等。噪聲信號(hào)分量可以是可以針對(duì)不同的時(shí)間段而改變的不穩(wěn)定噪聲。噪聲衰減器對(duì)每個(gè)時(shí)間段的處理對(duì)于每個(gè)時(shí)間段來(lái)說(shuō)可以是獨(dú)立的。
[0017]噪聲衰減器可以具體地包括用于通過(guò)為第一碼本的期望信號(hào)候選中的每一個(gè)作為期望信號(hào)候選的成比例版本和噪聲信號(hào)貢獻(xiàn)候選的加權(quán)組合的組合來(lái)生成估計(jì)的信號(hào)候選而生成多個(gè)估計(jì)的信號(hào)候選的處理器、電路、功能單元或裝置,期望信號(hào)候選的比例和加權(quán)組合的權(quán)重被確定成使指示在時(shí)間段中的音頻信號(hào)與所估計(jì)的信號(hào)候選之間的差的成本函數(shù)最小化;用于從所估計(jì)的信號(hào)候選生成針對(duì)時(shí)間段中的音頻信號(hào)的信號(hào)候選的處理器、電路、功能單元或裝置;以及用于響應(yīng)于該信號(hào)候選衰減時(shí)間段中的音頻信號(hào)的噪聲的處理器、電路、功能單元或裝置。
[0018]依照本發(fā)明的可選特征,成本函數(shù)是最大似然成本函數(shù)和最小均方誤差成本函數(shù)中的一個(gè)。
[0019]這可以提供對(duì)比例和權(quán)重的特別聞效的且聞性能的確定。
[0020]依照本發(fā)明的可選特征,噪聲衰減器被布置成根據(jù)反映成本函數(shù)相對(duì)于比例和權(quán)重的導(dǎo)數(shù)為零的方程來(lái)計(jì)算比例和權(quán)重。
[0021]這可以提供對(duì)比例和權(quán)重的特別聞效的且聞性能的確定。在許多實(shí)施例中,它可以允許其中比例和權(quán)重能夠根據(jù)閉式方程被直接地計(jì)算的操作。在許多實(shí)施例中,它可以允許比例和權(quán)重在無(wú)需任何遞歸迭代或搜索操作的情況下的直接計(jì)算。
[0022]依照本發(fā)明的可選特征,期望信號(hào)候選比加權(quán)組合具有更高的頻率分辨率。
[0023]這可以允許具有高性能的實(shí)際的噪聲衰減。特別地,它可以在確定所估計(jì)的信號(hào)候選時(shí)允許期望信號(hào)候選的重要性相對(duì)于噪聲信號(hào)貢獻(xiàn)候選的重要性被加重。
[0024]在定義期望信號(hào)候選中的自由度可以高于當(dāng)生成加權(quán)組合時(shí)的自由度。定義期望信號(hào)候選的參數(shù)的數(shù)目可以高于定義噪聲信號(hào)貢獻(xiàn)候選的參數(shù)的數(shù)目。
[0025]依照本發(fā)明的可選特征,多個(gè)噪聲信號(hào)貢獻(xiàn)候選覆蓋某一頻率范圍,并且其中一群噪聲信號(hào)貢獻(xiàn)候選中的每個(gè)噪聲信號(hào)貢獻(xiàn)候選僅在該頻率范圍的子范圍中提供貢獻(xiàn),該群噪聲信號(hào)貢獻(xiàn)候選的不同噪聲信號(hào)貢獻(xiàn)候選的子范圍是不同的。
[0026]這可以在一些實(shí)施例中允許降低的復(fù)雜性、便利的操作和/或改進(jìn)的性能。特別地,它可以通過(guò)調(diào)整權(quán)重來(lái)允許所估計(jì)的信號(hào)候選對(duì)于音頻信號(hào)的便利的和/或改進(jìn)的適配。
[0027]依照本發(fā)明的可選特征,該群噪聲信號(hào)貢獻(xiàn)候選的子范圍是不重疊的。
[0028]這可以在一些實(shí)施例中允許降低的復(fù)雜性、便利的操作和/或改進(jìn)的性能。
[0029]在一些實(shí)施例中,該群噪聲信號(hào)貢獻(xiàn)候選的子范圍可以是重疊的。
[0030]依照本發(fā)明的可選特征,該群噪聲信號(hào)貢獻(xiàn)候選的子范圍具有不等的大小。
[0031]這可以在一些實(shí)施例中允許降低的復(fù)雜性、便利的操作和/或改進(jìn)的性能。
[0032]依照本發(fā)明的可選特征,該群噪聲信號(hào)貢獻(xiàn)候選的噪聲信號(hào)貢獻(xiàn)候選中的每一個(gè)對(duì)應(yīng)于基本上平坦的頻率分布。
[0033]這可以在一些實(shí)施例中允許降低的復(fù)雜性、便利的操作和/或改進(jìn)的性能。特別地,它可以通過(guò)調(diào)整權(quán)重來(lái)允許所估計(jì)的信號(hào)候選對(duì)音頻信號(hào)的便利的和/或改進(jìn)的適配。
[0034]依照本發(fā)明的可選特征,噪聲衰減設(shè)備進(jìn)一步包括噪聲估計(jì)器,所述噪聲估計(jì)器用于為至少部分地在時(shí)間段外的時(shí)間間隔中的音頻信號(hào)生成噪聲估計(jì),并且用于響應(yīng)于該噪聲估計(jì)來(lái)生成噪聲信號(hào)貢獻(xiàn)候選中的至少一個(gè)。
[0035]這可以在一些實(shí)施例中允許降低的復(fù)雜性、便利的操作和/或改進(jìn)的性能。特別地,它可以在許多實(shí)施例中允許對(duì)噪聲信號(hào)分量的更準(zhǔn)確的估計(jì),特別是對(duì)于其中噪聲可以具有穩(wěn)定分量或慢變分量的系統(tǒng)來(lái)說(shuō)。噪聲估計(jì)例如可以是從一個(gè)或多個(gè)先前的時(shí)間段中的音頻信號(hào)所生成的噪聲估計(jì)。
[0036]依照本發(fā)明的可選特征,加權(quán)組合是加權(quán)求和。
[0037]這可以提供特別高效的實(shí)施方案,并且可以特別地降低復(fù)雜性以及例如允許權(quán)重的便利的確定以用于加權(quán)求和。
[0038]依照本發(fā)明的可選特征,第一碼本的期望信號(hào)候選和第二碼本的噪聲信號(hào)貢獻(xiàn)候選中的至少一個(gè)由包括不多于20個(gè)參數(shù)的一組參數(shù)來(lái)表示。
[0039]這允許低復(fù)雜性。本發(fā)明可以在許多實(shí)施例和場(chǎng)景中甚至為信號(hào)和噪聲信號(hào)分量的相對(duì)粗略的估計(jì)提供聞效的噪聲裳減。
[0040]依照本發(fā)明的可選特征,第一碼本的期望信號(hào)候選和第二碼本的噪聲信號(hào)貢獻(xiàn)候選中的至少一個(gè)由譜分布來(lái)表示。
[0041]這可以提供特別高效的實(shí)施方案并且可以特別地降低復(fù)雜性。
[0042]依照本發(fā)明的可選特征,期望信號(hào)分量是語(yǔ)音信號(hào)分量。
[0043]本發(fā)明可以提供用于語(yǔ)音增強(qiáng)的有利的方法。
[0044]該方法可以特別適合于語(yǔ)音增強(qiáng)。期望信號(hào)候選可以表示與語(yǔ)音模型兼容的信號(hào)分量。
[0045]根據(jù)本發(fā)明的一個(gè)方面,提供了一種噪聲衰減的方法,其包括:接收包括期望信號(hào)分量和噪聲信號(hào)分量的音頻信號(hào);提供包括針對(duì)期望信號(hào)分量的多個(gè)期望信號(hào)候選的第一碼本,每個(gè)期望信號(hào)候選都表示可能的期望信號(hào)分量;提供包括多個(gè)噪聲信號(hào)貢獻(xiàn)候選的第二碼本,每個(gè)噪聲信號(hào)貢獻(xiàn)候選都表示針對(duì)噪聲信號(hào)分量的可能的噪聲貢獻(xiàn);將音頻信號(hào)分割成時(shí)間段;以及針對(duì)每個(gè)時(shí)間段執(zhí)行以下步驟:通過(guò)為第一碼本的期望信號(hào)候選中的每一個(gè)作為期望信號(hào)候選的成比例版本和噪聲信號(hào)貢獻(xiàn)候選的加權(quán)組合的組合來(lái)生成估計(jì)的信號(hào)候選而生成多個(gè)估計(jì)的信號(hào)候選,期望信號(hào)候選的比例和加權(quán)組合的權(quán)重被確定成使指示在時(shí)間段中的音頻信號(hào)與所估計(jì)的信號(hào)候選之間的差的成本函數(shù)最小化;從所估計(jì)的信號(hào)候選生成針對(duì)時(shí)間段中的音頻信號(hào)的信號(hào)候選;以及響應(yīng)于所述信號(hào)候選衰減時(shí)間段中的音頻信號(hào)的噪聲。
[0046]本發(fā)明的這些和其它方面、特征以及優(yōu)點(diǎn)從在下文中所描述的(一個(gè)或多個(gè))實(shí)施例將是明顯的,并且將參考在下文中所描述的(一個(gè)或多個(gè))實(shí)施例而被闡明。
【專利附圖】
【附圖說(shuō)明】
[0047]將參考附圖僅通過(guò)例子對(duì)本發(fā)明的實(shí)施例進(jìn)行描述,在附圖中:
圖1是依照本發(fā)明的一些實(shí)施例的噪聲衰減設(shè)備的元件的例子的圖示;
圖2是依照本發(fā)明的一些實(shí)施例的噪聲衰減的方法的圖示;以及 圖3是用于圖1的噪聲衰減設(shè)備的噪聲衰減器的元件的例子的圖示。
【具體實(shí)施方式】
[0048]以下描述集中于可適用于通過(guò)對(duì)噪聲的衰減而進(jìn)行語(yǔ)音增強(qiáng)的本發(fā)明的實(shí)施例。然而,應(yīng)了解本發(fā)明不限于本申請(qǐng),而是可以被應(yīng)用于許多其它信號(hào)。[0049]圖1圖示了依照本發(fā)明的一些實(shí)施例的噪聲衰減器的例子。
[0050]該噪聲衰減器包括接收機(jī)101,其接收包括期望的分量和不期望的分量?jī)烧叩男盘?hào)。不期望的分量被稱為噪聲信號(hào)并且可以包括不是期望信號(hào)分量的一部分的任何信號(hào)分量。
[0051]在圖1的系統(tǒng)中,信號(hào)是具體地可以被從在給定音頻環(huán)境中捕獲音頻信號(hào)的話筒信號(hào)生成的音頻信號(hào)。以下描述將集中于其中期望信號(hào)分量是來(lái)自期望的揚(yáng)聲器的語(yǔ)音信號(hào)的實(shí)施例。噪聲信號(hào)分量可以包括環(huán)境中的環(huán)境噪聲、來(lái)自不期望的聲音源的音頻、實(shí)施
噪聲等。
[0052]接收機(jī)101被耦合到將音頻信號(hào)分割成時(shí)間段的分段器103。在一些實(shí)施例中,時(shí)間段可以是不重疊的,但在其它實(shí)施例中時(shí)間段可以是重疊的。進(jìn)一步地,可以通過(guò)應(yīng)用適當(dāng)?shù)爻尚蔚拇翱诤瘮?shù)來(lái)執(zhí)行分段,并且具體地噪聲衰減設(shè)備可以采用分段的眾所周知的疊加技術(shù),其使用適合的窗口,諸如漢寧(Hanning)或漢明(Hamming)窗口。時(shí)間段持續(xù)時(shí)間將取決于特定實(shí)施方案,但在許多實(shí)施例中將是大約10-100毫秒。
[0053]分段器103被饋送到噪聲衰減器105,所述噪聲衰減器105執(zhí)行基于段的噪聲衰減以便相對(duì)于不期望的噪聲信號(hào)分量加重期望信號(hào)分量。結(jié)果得到的噪聲衰減的段被饋送到輸出處理器107,輸出處理器107提供連續(xù)音頻信號(hào)。輸出處理器可以具體地例如通過(guò)執(zhí)行疊加函數(shù)來(lái)執(zhí)行反分段(desegmentation)。應(yīng)了解,在其它實(shí)施例中,輸出信號(hào)可以被提供為分段的信號(hào),例如在其中對(duì)噪聲衰減的信號(hào)執(zhí)行進(jìn)一步的基于段的信號(hào)處理的實(shí)施例中。
[0054]噪聲衰減是基于碼本方法的,所述碼本方法使用與期望信號(hào)分量以及與噪聲信號(hào)分量有關(guān)的單獨(dú)碼本。因此,噪聲衰減器105被耦合到第一碼本109,所述第一碼本109是期望信號(hào)碼本,并且在特定例子中是語(yǔ)音碼本。噪聲衰減器105被進(jìn)一步耦合到第二碼本111,所述第二碼本111是噪聲信號(hào)貢獻(xiàn)碼本。
[0055]噪聲衰減器105被布置成選擇語(yǔ)音碼本和噪聲碼本的碼本條目使得與所選條目相對(duì)應(yīng)的信號(hào)分量的組合最接近地類似該時(shí)間段中的音頻信號(hào)。一旦適當(dāng)?shù)拇a本條目(連同這些碼本條目的比例一起)已經(jīng)被找到,它們就表示所捕獲的音頻信號(hào)中的單獨(dú)的語(yǔ)音信號(hào)分量和噪聲信號(hào)分量的估計(jì)。具體地,與所選語(yǔ)音碼本條目相對(duì)應(yīng)的信號(hào)分量是所捕獲的音頻信號(hào)中的語(yǔ)音信號(hào)分量的估計(jì)并且噪聲碼本條目提供噪聲信號(hào)分量的估計(jì)。因此,該方法使用碼本方法來(lái)估計(jì)音頻信號(hào)的語(yǔ)音和噪聲信號(hào)分量,并且一旦這些估計(jì)已被確定,它們就能夠被用來(lái)相對(duì)于音頻信號(hào)中的語(yǔ)音信號(hào)分量衰減噪聲信號(hào)分量,因?yàn)楣烙?jì)使得區(qū)分這些成為可能。
[0056]更具體地,考慮其中語(yǔ)音和噪聲被假定為獨(dú)立的加性噪聲模型:
V (η) — Jin)-tw(ti),
其中y(n)、x(n)以及w(n)分別表示采樣的有噪聲語(yǔ)音(輸入音頻信號(hào))、干凈語(yǔ)音(期望的語(yǔ)音信號(hào)分量)以及噪聲(噪聲信號(hào)分量)。
[0057]現(xiàn)有技術(shù)碼本方法搜遍碼本以便找到針對(duì)信號(hào)分量和噪聲分量的碼本條目使得成比例組合最接近地類似所捕獲的信號(hào),從而提供針對(duì)每個(gè)短時(shí)間段的語(yǔ)音和噪聲PSD的估計(jì)。假設(shè)Py(?)表示所觀察到的有噪聲信號(hào)y (η)的PSD,PX(?)表示語(yǔ)音信號(hào)分量x(n)的PSD,以及Ρν(ω)表示噪聲信號(hào)分量的PSDJlJΡ^ω) = Ρχ(ω) + Ρ¥(ω)
假設(shè)~表示所對(duì)應(yīng)的PSD的估計(jì),傳統(tǒng)的基于碼本的噪聲衰減可以通過(guò)對(duì)所捕獲的信號(hào)應(yīng)用頻域維納(Wiener)濾波器Η(ω)來(lái)降低噪聲,即:
Pna(CO) = Py(CO)H(GJ)
其中維納濾波器由下式給出:
【權(quán)利要求】
1.一種噪聲衰減設(shè)備,其包括: -接收機(jī)(101),其用于接收包括期望信號(hào)分量和噪聲信號(hào)分量的音頻信號(hào); -第一碼本(109),其包括針對(duì)期望信號(hào)分量的多個(gè)期望信號(hào)候選,每個(gè)期望信號(hào)候選表示可能的期望信號(hào)分量; -第二碼本(111),其包括多個(gè)噪聲信號(hào)貢獻(xiàn)候選,每個(gè)噪聲信號(hào)貢獻(xiàn)候選表示針對(duì)噪聲信號(hào)分量的可能的噪聲貢獻(xiàn); -分段器(103),其用于將音頻信號(hào)分割成時(shí)間段; -噪聲衰減器(105),其被布置成針對(duì)每個(gè)時(shí)間段執(zhí)行以下步驟: 通過(guò)為第一碼本的期望信號(hào)候選中的每一個(gè)、作為期望信號(hào)候選的成比例版本和噪聲信號(hào)貢獻(xiàn)候選的加權(quán)組合的組合來(lái)生成估計(jì)的信號(hào)候選而生成多個(gè)估計(jì)的信號(hào)候選,期望信號(hào)候選的比例和加權(quán)組合的權(quán)重被確定成使指示在時(shí)間段中的音頻信號(hào)與所估計(jì)的信號(hào)候選之間的差的成本函數(shù)最小化; 從所估計(jì)的信號(hào)候選生成針對(duì)時(shí)間段中的音頻信號(hào)的信號(hào)候選;以及 響應(yīng)于所述信號(hào)候選衰減時(shí)間段中的音頻信號(hào)的噪聲。
2.根據(jù)權(quán)利要求1所述的噪聲衰減設(shè)備,其中成本函數(shù)是最大似然成本函數(shù)和最小均方誤差成本函數(shù)中的一個(gè)。
3.根據(jù)權(quán)利要求1所 述的噪聲衰減設(shè)備,其中噪聲衰減器(105)被布置成根據(jù)反映成本函數(shù)相對(duì)于比例和權(quán)重的導(dǎo)數(shù)為零的方程來(lái)計(jì)算比例和權(quán)重。
4.根據(jù)權(quán)利要求1所述的噪聲衰減設(shè)備,其中期望信號(hào)候選比加權(quán)組合具有更高的頻率分辨率。
5.根據(jù)權(quán)利要求1所述的噪聲衰減設(shè)備,其中多個(gè)噪聲信號(hào)貢獻(xiàn)候選覆蓋一頻率范圍,并且其中一群噪聲信號(hào)貢獻(xiàn)候選中的每個(gè)噪聲信號(hào)貢獻(xiàn)候選僅在所述頻率范圍的子范圍中提供貢獻(xiàn),該群噪聲信號(hào)貢獻(xiàn)候選的不同噪聲信號(hào)貢獻(xiàn)候選的子范圍是不同的。
6.根據(jù)權(quán)利要求5所述的噪聲衰減設(shè)備,其中該群噪聲信號(hào)貢獻(xiàn)候選的子范圍是不重置的。
7.根據(jù)權(quán)利要求5所述的噪聲衰減設(shè)備,其中該群噪聲信號(hào)貢獻(xiàn)候選的子范圍具有不等的大小。
8.根據(jù)權(quán)利要求5所述的噪聲衰減設(shè)備,其中該群噪聲信號(hào)貢獻(xiàn)候選的噪聲信號(hào)貢獻(xiàn)候選中的每一個(gè)都對(duì)應(yīng)于基本上平坦的頻率分布。
9.根據(jù)權(quán)利要求1所述的噪聲衰減設(shè)備,進(jìn)一步包括噪聲估計(jì)器,所述噪聲估計(jì)器用于為至少部分地在時(shí)間段外的時(shí)間間隔中的音頻信號(hào)生成噪聲估計(jì),并且用于響應(yīng)于所述噪聲估計(jì)來(lái)生成噪聲信號(hào)貢獻(xiàn)候選中的至少一個(gè)。
10.根據(jù)權(quán)利要求1所述的噪聲衰減設(shè)備,其中加權(quán)組合是加權(quán)求和。
11.根據(jù)權(quán)利要求1所述的噪聲衰減設(shè)備,其中第一碼本的期望信號(hào)候選和第二碼本的噪聲信號(hào)貢獻(xiàn)候選中的至少一個(gè)由包括不多于20個(gè)參數(shù)的一組參數(shù)來(lái)表示。
12.根據(jù)權(quán)利要求1所述的噪聲衰減設(shè)備,其中第一碼本的期望信號(hào)候選和第二碼本的噪聲信號(hào)貢獻(xiàn)候選中的至少一個(gè)由譜分布來(lái)表示。
13.根據(jù)權(quán)利要求1所述的噪聲衰減設(shè)備,其中期望信號(hào)分量是語(yǔ)音信號(hào)分量。
14.一種噪聲衰減的方法,其包括:-接收包括期望信號(hào)分量和噪聲信號(hào)分量的音頻信號(hào); -提供包括針對(duì)期望信號(hào)分量的多個(gè)期望信號(hào)候選的第一碼本(109),每個(gè)期望信號(hào)候選表示可能的期望信號(hào)分量; -提供包括多個(gè)噪聲信號(hào)貢獻(xiàn)候選的第二碼本(111),每個(gè)噪聲信號(hào)貢獻(xiàn)候選都表示針對(duì)噪聲信號(hào)分量的可能的噪聲貢獻(xiàn); -將音頻信號(hào)分割成時(shí)間段;以及 針對(duì)每個(gè)時(shí)間段執(zhí)行以下步驟: 通過(guò)為第一碼本的期望信號(hào)候選中的每一個(gè)、作為期望信號(hào)候選的成比例版本和噪聲信號(hào)貢獻(xiàn)候選的加權(quán)組合的組合來(lái)生成估計(jì)的信號(hào)候選而生成多個(gè)估計(jì)的信號(hào)候選,期望信號(hào)候選的比例和加權(quán)組合的權(quán)重被確定成使指示在時(shí)間段中的音頻信號(hào)與所估計(jì)的信號(hào)候選之間的差的成本函數(shù)最小化; 從所估計(jì)的信號(hào)候選生成針對(duì)時(shí)間段中的音頻信號(hào)的信號(hào)候選;以及 響應(yīng)于所述信號(hào)候選衰減時(shí)間段中的音頻信號(hào)的噪聲。
15.一種包括計(jì) 算機(jī)上被運(yùn)行時(shí)執(zhí)行權(quán)利要求14的所有步驟。
【文檔編號(hào)】G10L21/0208GK103999155SQ201280064187
【公開(kāi)日】2014年8月20日 申請(qǐng)日期:2012年10月22日 優(yōu)先權(quán)日:2011年10月24日
【發(fā)明者】S.斯里尼瓦桑 申請(qǐng)人:皇家飛利浦有限公司