信號(hào)處理模塊 209應(yīng)用的處理可以是隨時(shí)間變化的并且對(duì)于遠(yuǎn)端信號(hào)的語音區(qū)到噪聲區(qū)可以不同。由音 頻信號(hào)處理模塊209實(shí)現(xiàn)的處理可以包括壓縮,由此取決于遠(yuǎn)端信信號(hào)的輸入水平而將不 同增益應(yīng)用給遠(yuǎn)端信號(hào)。
[0037]在步驟S406中,已經(jīng)由音頻信號(hào)處理模塊209處理的音頻信號(hào)從揚(yáng)聲器210輸出。 這樣,已經(jīng)由音頻信號(hào)處理模塊209處理的音頻信號(hào)輸出給用戶102。
[0038]在不足S408中,麥克風(fēng)212接收音頻信號(hào)。如圖3中所示,所接收的音頻信號(hào)可以包 括作為期望信號(hào)或"主要信號(hào)"的近端信號(hào)。近端信號(hào)是用戶102意圖使麥克風(fēng)212接收的信 號(hào)。然而,所接收的音頻信號(hào)還包括源自在步驟S406中從揚(yáng)聲器210輸出的音頻信號(hào)的回聲 信號(hào)。所接收的音頻信號(hào)還可以包括噪聲,諸如背景噪聲。因此,總體所接收的音頻信號(hào)y (t)可以由近端信號(hào)、回聲和噪聲之和而給出。回聲和噪聲充當(dāng)針對(duì)近端信號(hào)的干擾。盡管 在圖3中未示出,但是將模擬向數(shù)字(ADC)轉(zhuǎn)換應(yīng)用給麥克風(fēng)212所捕獲的信號(hào)以達(dá)到數(shù)字 信號(hào)y(t)。
[0039]建模模塊304將所輸出的音頻信號(hào)(標(biāo)記為"回送信號(hào)")和所接收的音頻信號(hào)y(t) 用作輸入。在步驟S410中,建模模塊304用于對(duì)所接收的音頻信號(hào)y(t)中的回聲的回聲路徑 進(jìn)行建模。
[0040]回聲路徑描述從揚(yáng)聲器210輸出到麥克風(fēng)212的音頻信號(hào)所行進(jìn)的聲學(xué)路徑的效 應(yīng)。音頻信號(hào)可以直接從揚(yáng)聲器210行進(jìn)到麥克風(fēng)212,或者其可以從近端終端的環(huán)境中的 各種表面反射。從揚(yáng)聲器210輸出的音頻信號(hào)所橫穿的回聲路徑可以被視為具有可能隨時(shí) 間變化的頻率和相位響應(yīng)的系統(tǒng)。
[0041]為了從近端麥克風(fēng)212處所記錄的信號(hào)y(t)移除聲學(xué)回聲s(t),必要的是估計(jì)回 聲路徑如何將期望的遠(yuǎn)端揚(yáng)聲器輸出信號(hào)改變?yōu)檩斎胄盘?hào)中的非期望回聲分量。
[0042]回聲路徑h(t)描述所接收的音頻信號(hào)y(t)中的回聲如何與從揚(yáng)聲器201所輸出的 回送信號(hào)X(t)相關(guān),例如對(duì)于由脈沖響應(yīng)h(t)或其頻域Η(ω)中的對(duì)等物所表示的線性回 聲路徑而言,以下等式描述回聲與回送信號(hào)之間的關(guān)系:S(ω)=Η(ω)Χ(ω),其中S(ω)代 表回聲信號(hào)s(t)的頻率響應(yīng),并且Χ(ω)代表回送信號(hào)x(t)的頻率響應(yīng)?;芈暵窂竭€可能隨 時(shí)間變化,并且因此可以在不同時(shí)刻處找到不同頻率響應(yīng)Η(ω)。回聲路徑h(t)或其對(duì)等物 Η(ω)可以取決于(i)揚(yáng)聲器210和麥克風(fēng)212周圍的當(dāng)前環(huán)境狀況(例如是否存在音頻信號(hào) 從揚(yáng)聲器210到麥克風(fēng)212的通路的任何物理障礙、氣壓、溫度、風(fēng)等等),(ii)可能在信號(hào)被 輸出和/或接收時(shí)改變它的揚(yáng)聲器210和/或麥克風(fēng)212的特性,以及(iii)可能沒有在回送 信號(hào)中反映的信號(hào)的任何其它處理,例如緩沖器延遲。
[0043]濾波器模塊304對(duì)所接收的音頻信號(hào)y(t)中的回波路徑的回波路徑h(t)進(jìn)行建 模。這典型地通過做出時(shí)域或頻域中的濾波器的估計(jì)而完成。使用該估計(jì)和當(dāng)前回送信號(hào), 可能估計(jì)將由回聲消除器使用的參數(shù)。那些參數(shù)可以例如是應(yīng)用給近端譜以便移除回聲 (基于抑制的回聲消除器)的抑制增益或者產(chǎn)生需要從近端信號(hào)減除以便移除回聲的回聲 估計(jì)(基于減除的回聲消除器)的濾波器參數(shù)。當(dāng)前實(shí)施例是具體針對(duì)基于抑制的回聲消除 器而定制的,然而還可能將其用于基于減除的回聲消除器,假定可以估計(jì)由回聲減除器所 引入的頻率增益的話。
[0044]在任一情況下,基于抑制、減除或者二者的混合版本的回聲消除器,在回聲是所接 收的音頻信號(hào)的主導(dǎo)部分時(shí),也就是說當(dāng)y(t):SSs(t)時(shí),由濾波器模塊304建模的濾波器參 數(shù)更好地受訓(xùn)。
[0045]回聲路徑的估計(jì)在遠(yuǎn)端活動(dòng)期間完成,遠(yuǎn)端活動(dòng)通過檢測(cè)遠(yuǎn)端信號(hào)中的語音類質(zhì) 量的話音活動(dòng)檢測(cè)器(VAD)(在圖3中未示出的信號(hào)處理模塊300的組件)來檢測(cè)?;芈暵窂?的估計(jì)因此主要基于高能量信號(hào),因?yàn)檫@些高能量信號(hào)是觸發(fā)VAD的信號(hào)。典型地,VAD維持 閾值,并且高能量信號(hào)是能量在背景噪聲以上的閾值量以上的那些高能量信號(hào),即確定當(dāng) 前幀是否具有足夠能量來觸發(fā)VAD的閾值取決于遠(yuǎn)端信號(hào)中所存在的背景噪聲。為了使用 已知術(shù)語起見,我們將檢測(cè)活動(dòng)的模塊稱為VAD。然而,應(yīng)當(dāng)指出的是,該模塊不限于檢測(cè)語 音信號(hào),而是如果其穿過回聲消除器則其預(yù)期回聲將惱人的任何信號(hào)。如上文指出的,該模 塊通常基于檢測(cè)具有比背景噪聲更高能量的信號(hào)。系統(tǒng)增益估計(jì)模塊314布置成從建模模 塊304接收所估計(jì)的回聲路徑。
[0046]通過標(biāo)識(shí)由音頻信號(hào)處理模塊209引入的增益,對(duì)于回聲消除系統(tǒng)而言可能的是 確保系統(tǒng)增益在1以下,并且因此減小嘯叫的風(fēng)險(xiǎn)。現(xiàn)在描述該過程。
[0047]因?yàn)閼?yīng)用于音頻信號(hào)處理模塊209中的遠(yuǎn)端信號(hào)的信號(hào)處理通常是隨時(shí)間變化且 依賴于水平的,所以重要的是選擇適當(dāng)類型的信號(hào)來估計(jì)音頻信號(hào)處理模塊209對(duì)系統(tǒng)增 益的貢獻(xiàn)。對(duì)于嘯叫減小而言,應(yīng)用在低能量信號(hào)之上的增益是最為相關(guān)的,因?yàn)檫@些低能 量信號(hào)是典型地通過遭受嘯叫的系統(tǒng)而放大的信號(hào)。關(guān)于低能量信號(hào),我們是指具有與遠(yuǎn) 端信號(hào)中所存在的背景噪聲相當(dāng)?shù)哪芰康男盘?hào)。因?yàn)榈湍芰啃盘?hào)具有與遠(yuǎn)端信號(hào)中的背景 噪聲水平相當(dāng)?shù)哪芰?,所以遠(yuǎn)端處的VAD沒有被觸發(fā)(低能量信號(hào)沒有被檢測(cè)為語音)并且 回聲抑制器在那些區(qū)期間不活動(dòng)。
[0048]噪聲水平估計(jì)模塊306接收遠(yuǎn)端信號(hào)和回送信號(hào)作為輸入。在步驟S412中,噪聲水 平估計(jì)模塊306確定遠(yuǎn)端信號(hào)的噪聲水平估計(jì)即在通過外部信令處理模塊209 的信號(hào)處理之前)。在步驟S414中,噪聲水平估計(jì)模塊306確定回送信號(hào)的噪聲估計(jì)水平 即在通過外部信令處理模塊209的信號(hào)處理之后)。由噪聲水平估計(jì)模塊306實(shí) 現(xiàn)以確定噪聲水平估計(jì)|班^:1辦和的可能技術(shù)對(duì)于本領(lǐng)域技術(shù)人員而言是公 知的并且因此在本文中不詳細(xì)討論。
[0049] 在步驟S416中,噪聲水平估計(jì)模塊306估計(jì)回送增益£:&:(/:),其是考慮到噪聲水平 估計(jì)和的情況下由音頻信號(hào)處理模塊2〇9引入的增益的估計(jì)。例如, 噪聲水平估計(jì)模塊306可以確定噪聲水平估之間的比率以便估 計(jì)用于回送增益.i獲(/)的值。也就是說:
[0050]因而,由音頻信號(hào)處理模塊209引入的增益的估計(jì)是基于回送信號(hào)和通信客戶端 發(fā)送以用于在揚(yáng)聲器210處播放的音頻信號(hào)的噪聲水平估計(jì)之間的比率。
[0051 ]信號(hào)處理可以在每幀基礎(chǔ)上執(zhí)行。幀的長度可以例如在5和20毫秒之間并且劃分 成譜頻率段,例如每幀64和256段之間。每一個(gè)段包含關(guān)于某一頻率處或者某一頻帶中的信 號(hào)分量的信息。理想地,對(duì)于語音而言,實(shí)時(shí)地處理遠(yuǎn)端信號(hào)的每一個(gè)幀并且針對(duì)每一個(gè)頻 段估計(jì)由音頻信號(hào)處理模塊所引入的增益以控制通過執(zhí)行通信客戶端應(yīng)用所實(shí)現(xiàn)的由信 號(hào)處理功能性針對(duì)該頻段所應(yīng)用的增益水平。
[0052]噪聲估計(jì)器典型地從語音信號(hào)上的沉默時(shí)段來估計(jì)噪聲,并且因此噪聲水平估計(jì) 表示具有最低幅度值的遠(yuǎn)端信號(hào)的部分,其將具有由音頻信號(hào)處理模塊2〇9中 的任何壓縮器功能性所引入的高增益,并且噪聲水平估計(jì)表示回送信號(hào)的部 分,其具有最低幅度值并且因而具有在音頻信號(hào)處理模塊209中的任何壓縮器功能性中應(yīng) 用到它們的高增益。
[0053]特別地,使用具有不觸發(fā)VAD的能量(即具有不超出音頻信號(hào)的所估計(jì)噪聲水平以 上的閾值量的能量)的遠(yuǎn)端音頻信號(hào)的部分來實(shí)現(xiàn)由音頻信號(hào)處理模塊209應(yīng)用的回送增 益的估計(jì)。
[0054]通過基于這些噪聲水平的比率來標(biāo)識(shí)由音頻信號(hào)處理模塊209引入的增益,甚至 在沒有活動(dòng)遠(yuǎn)端的區(qū)期間,可以用于控制嘯叫減小的系統(tǒng)增益也可以被追蹤。此外,音頻信 號(hào)處理模塊209可以具有取決于信號(hào)水平的增益,通過追蹤噪聲水平比率,可能估計(jì)應(yīng)用于 低水平信號(hào)的增益,其是對(duì)于防止嘯叫狀況而言較為相關(guān)的增益。
[0055]遠(yuǎn)端信號(hào)的噪聲水平典型地還由VAD模塊中的基于回聲抑制的回聲消除器使用以 便確定它們是應(yīng)當(dāng)消除回聲還是使有噪回聲通過(消除僅包括噪聲的所有回聲典型地引起 過度衰退)。因而特別重要的是,針對(duì)低水平信號(hào)正確地估計(jì)系統(tǒng)增益以及在該情況下特別 地回聲增益,因?yàn)樵撚性牖芈暤湫偷匕凑栈芈曄髟O(shè)計(jì)將永遠(yuǎn)不會(huì)被回聲消除器所消 除。
[0056]盡管基于回送增益估計(jì)的噪聲水平不是最大回送增益的良好估計(jì),但是其不管怎 樣都足以用于確保針對(duì)噪聲正確地估計(jì)系統(tǒng)增益,這繼而確保噪聲不會(huì)導(dǎo)致嘯叫。在由音 頻信號(hào)處理模塊209應(yīng)用的實(shí)際增益對(duì)于較低水平音頻信號(hào)而言較高的情況下,這是可接 受的,因?yàn)檫@些較