用于回聲抑制器的話音作用檢測器和回聲抑制器的制作方法

文檔序號：2819556閱讀：320來源：國知局

專利名稱：用于回聲抑制器的話音作用檢測器和回聲抑制器的制作方法
技術領域：
本發(fā)明涉及適合在回聲抑制器中使用的話音作用檢測器，獨立地和另外地還涉及回聲抑制器。本發(fā)明提出了在有另外的揚聲器存在的情況下檢測話音(語音)的問題。
在例如(車載)揚聲器電話(VSP)中出現(xiàn)了話音作用檢測的需求。在這種電話中，出網(wǎng)的(陸地到移動)話音被引入車載揚聲器中和車載電話的用戶可能想插入。在本文中按照上下文的要求，對于話音作用檢測和話音作用檢測器使用了“VAD”簡稱。
在全雙工通信信道中允許雙對話的一種安排是回聲抵消，在這種安排中，發(fā)出的話音在進入的通路中被抵消。但是，這種安排就計算資源而言是非常昂貴的，因此經(jīng)常是行不通的。
在其它極度狀態(tài)下，利用根據(jù)給定噪聲背景的標準話音檢測的回聲抑制器概念，在車輛環(huán)境下處理回聲是可能的。
1988年第Ⅲ-1分冊里186-205頁的CCITT建議G.164中概括地描述了各種回聲抑制器，其中D型回聲抑制器是全數(shù)字的并提供了近端話音的話音編碼和遠端話音的解碼(或合成)。在這樣一些安排中，例如正如在許多現(xiàn)代通信系統(tǒng)中執(zhí)行LPC型編碼時，“背景話音”參數(shù)是可利用的。
然而，在全雙工狀態(tài)下常規(guī)的回聲抑制器將不能很好地工作，在全雙工狀態(tài)下?lián)P聲器功率是與本地用戶話音功率可比擬的，因為其話音檢測是根據(jù)話音功率和/或它的靜態(tài)背景噪聲特性之間的區(qū)別進行的。因此，或者揚聲器的話音將由VAD檢測到，或者當這超出VAD指示作用時該本地用戶將被阻塞。
一般來說，在VSP情況下當今的VAD是根據(jù)相對于背景噪聲能量測量信號能量的(噪聲控制閾值(NRT)類型檢測(Noise Riding Threshold(NRT type detection))。為了實現(xiàn)這樣一種檢測器，VAD必須能夠首先檢測噪聲，估算它的瞬時能量等級，和如果信號能量超過一個閾值(在噪聲基礎值以上)，則接著檢測話音。在更為先進的VAD中，噪聲頻譜特性也被估算，和白化反向濾波器的能量輸出被用于VAD。從話音區(qū)別噪聲的處理中，有時利用附加特性提取予以增強，例如靜態(tài)測試和/或周期性檢測(噪聲被靜態(tài)地和作周期性地與話音比較)。
1989年5月22日的GSM06.32建議是一個基于VAD能量的例子，在該例子中能量是在背景噪聲整形濾波器(“白化濾波器”)的反向輸出端測量的。包括自適應閾值的過程和濾波的能量的計算的詳細內(nèi)容在該文件中已給出。
按照本發(fā)明的第一個方面，提供了一個用于回聲抑制器的話音作用檢測器，該檢測器包括具有一個話音檢測器的接收音頻通路，用于接收各話音參數(shù)和合成該參數(shù)的話音，一個發(fā)送音頻通路，一個白化濾波器，用于均衡該發(fā)送通路的音頻信號的頻譜以提供一個經(jīng)均衡的信號，和連接到白化濾波器的判決裝置，測量在經(jīng)均衡信號中的能量和從而檢測在發(fā)送通路中的能量，其特征在于，該白化濾波器是話音白化濾波器和設置用于按照由接收通路中的話音解碼器接收的話音參數(shù)自適應白化濾波器的裝置。
據(jù)此，本發(fā)明至少在其第一方面，根據(jù)對另外的用戶話音特性檢測解決了存在另外的用戶的情況下的話音(話音)檢測問題。
在本發(fā)明的第二方面，提供一種回聲抑制器，該抑制器包括一個接收音頻通路，具有用于接收話音參數(shù)和由該參數(shù)合成話音的話音解碼器;發(fā)送音頻通路;在相應通路中的接收和發(fā)送衰減裝置，用于在該各通路中衰減音頻信號;話音作用檢測器，用于在發(fā)送通路檢測話音，連接到接收與發(fā)送衰減器裝置上，當在發(fā)送通路上檢測到話音時，用于控制衰減器裝置，抑制在接收通路上的音頻信號;在發(fā)送通路上用于對由于來自接收通路的回聲的結果在進入發(fā)送通路的近端話音和進入發(fā)送通路的近端話音之間進行區(qū)別的裝置;以及當發(fā)送通路的話音基本上是來自接收通路的回聲時用于提供發(fā)送與接收衰減器的第一配置和當在發(fā)送通路的話音至少部分地來自遠端話音時提供發(fā)送與接收衰減器的第二配置的裝置。
在發(fā)送通路中用于在進入發(fā)送通路的近端話音與進入發(fā)送通路的遠端話音之間進行區(qū)別的裝置，可以包括一個話音白化濾波器和根據(jù)由話音解碼器接收的話音參數(shù)自適應該白化濾波器的裝置，和/或這些裝置可以包括音調(diào)區(qū)分裝置。
回聲抑制器在全雙工操作中將允許VSP用戶在其希望的時候插話，也就是說，該設計邏輯應當允許雙對話。結果，遠端用戶可以聽到疊加有其自己回聲的VSP用戶的聲音。雖然這不是一種希望的狀態(tài)，但是本發(fā)明至少在其優(yōu)選實施例中做出這樣的假設，即在雙對話狀態(tài)下，如果遠端用戶的回聲相對于VSP用戶的講話電平被衰減的情況下，則遠端用戶能夠克服其回聲(見下文)。
為了實現(xiàn)本發(fā)明的回聲抑制器的上述目的，至少在其優(yōu)選實施例中包括如下述的超過現(xiàn)有技術VAD狀況的兩個特點(1)能夠檢測在有來自揚聲器的話音的情況下的本地話音，即能夠在兩個揚聲器之間的區(qū)別;(2)可調(diào)節(jié)的進入和發(fā)出衰減器，而不是發(fā)出通路無限地衰減(阻塞)。

圖1表示現(xiàn)有技術回聲抑制器的框圖;
圖2表示按照本發(fā)明的優(yōu)選實施例的回聲抑制器的框圖;
圖3是用于說明圖2的裝置操作的真值表;和圖4表示用于與現(xiàn)有技術和本發(fā)明的回聲抑制器有關的相關音頻信號通路的模型。
圖7表示一種現(xiàn)有技術的話音作用檢測器與回聲抑制器的框圖。圖中包括一個以其先進形式(GSM06.32)的進入話音作用檢測器，該檢測器包括麥克風1、A/D變換器2、揚聲器3、D/A變換器4、和數(shù)字信號處理器DSP11。在DSP的內(nèi)部的各種方框或程序是按下述方式實現(xiàn)的。設置一個自適應白化濾波器9，該濾波器自適應抵消背景噪聲頻譜。自適應可以以在編碼器5中估算的LPC參數(shù)為基礎。設置VAD邏輯10，它把涉及背景噪聲由濾波器9均衡的信號能量與一個閾值比較。一旦由VAD邏輯10檢測到話音的作用，發(fā)送衰減器6和/或接收衰減器7被插入相應的通路抑制回聲。一般，衰減器6具有大于46dB的衰減量并可以接通電路或者給出實際上完全阻塞的關斷電路。衰減器7是按CCITTG.164建議的理論描述的，但在實際中未被利用。DSP與通信信號12接口連接。注意DSP和其所實現(xiàn)的方框可以以一個單片微處理器實現(xiàn)，或按照一種方便的處理器與電路的組合實現(xiàn)。
圖1的VAD能夠檢測相對于背景噪聲的話音，但在揚聲器3引入遠端話音時檢測本地用戶的話音將會失效。
上文描述的附加兩個特點反映到圖2中，圖2表示按照本發(fā)明的優(yōu)選實施例的回聲抑制器的框圖。對于圖1的安排主要的增加是一個話音白化濾波器9。它利用了發(fā)出話音的LPC參數(shù)。這些參數(shù)是可以自話音解碼器8得到。在圖2安排中設置了衰減器26和27。這些是可變衰減器。圖中示出了VAD判決邏輯20，其細節(jié)在下面給出。
VAD工作在雙模式下，或者當遠端用戶無聲時利用按照現(xiàn)有技術的常規(guī)技術，或者當發(fā)出揚聲器被啟動時使用下面詳述的算法。發(fā)出話音作用狀態(tài)從解碼器8是已知的。
在進入通路(TX衰減)和發(fā)出通路(RX衰減)引入衰減描述在設置在圖3的真值表上。
在圖3中，第一和第二列分別表示近端(VSP)用戶和遠端用戶的用戶狀態(tài)(1＝講話，0＝不講話)。問題是在它們之間進行區(qū)別和控制由該表中第二與第四行所表示的情況，也就是說僅僅遠端用戶正在講話的情況(第二行，其中在發(fā)送通路的話音中以話音出現(xiàn)的回聲情況)和雙方用戶都正在講話的情況(表的第四行)。
第三和第四列分別表示要引入發(fā)送和接收衰減器6和7的衰減量。
在單一回聲情況(遠端用戶講話，VSP用戶不講話)中的Z值應當包括揚聲器到麥克風的衰減/放大。對應于GSM3.5建議的Z＝46dB是一個可接受的值。如果預期沒有回聲，即遠端用戶沒有講話(遠端用戶＝0)，則沒有衰減引入，除非如果為了避免不穩(wěn)定，要求一定的衰減。X和Y值在雙向同時講話時應當滿足XdB+YdB＜ZdB這樣的關系。
如圖3所描述的邏輯是以VSP VAD和遠端用戶VAD的可行性為基礎的。前者是由編碼器5提供的，后者是來自遠端編碼器在解碼器8中接收的話音指示符的形式提供的(也用作不連續(xù)傳輸?shù)哪康??；赩AD，衰減的插入和去消的定時應當在避免由于脈沖噪聲的虛假瞬態(tài)的同時設計為實現(xiàn)最小箝位。一種可能的辦法是采用CCITT建議P.34“揚聲器電話的瞬態(tài)特性”或類似的邏輯。
圖2所描述的VSP的應用的關鍵性問題是對于遠端用戶作用的情況的VAD設計。這是下面要詳細予以討論的。
對于圖2的VSP的TX VAD的解決包括來自進入和發(fā)出信號的信息。因為大多數(shù)數(shù)字話音編碼的通信協(xié)議包括VAD指示(見GSM標準)，所以在VSP設備上存在或不存在發(fā)出話音是已知的。另外，如果遠端用戶沒有講話，即其VAD指示“0”，則利用現(xiàn)有技術本地話音編碼器VAD應當給出VSP用戶作用的適當指示。為此，在現(xiàn)有技術的情況下，由圖3的表的第一和第三行表示的利用遠端用戶的VAD指示狀態(tài)是已知的。
然而，如果遠端用戶VAD指示是“1”，本地VAD將被啟動進入“雙對話”模式，用于VSP用戶發(fā)出講話開始的檢測和該發(fā)出講話結束的檢測。下面僅涉及當遠端用戶VAD＝1時VAD操作的討論。
當遠端用戶VAD指示為“1”時，為了實現(xiàn)本地話音作用的檢測，建議利用發(fā)出的和進入的聲碼器參數(shù)，這種參數(shù)可以對與單一揚聲器(僅遠端用戶)狀態(tài)相比的識別多個揚聲器(本地用戶和遠端用戶)狀態(tài)有所貢獻。所考慮的聲碼器是諸如CELP、VSELP、RLPT等LPC型的。這種聲碼器按照稱為幀(30ms數(shù)量級)的時間周期提取話音參數(shù)。常常某些例如音調(diào)的參數(shù)更經(jīng)常以子幀速率(例如每7.5ms)被更新。這種結構和信息被用于本發(fā)明的VAD中。
為了建立描述VAD的符號表示法和相關基礎，提供一種有關于音頻信號通路的模型。圖4表示各相關的信號，其中數(shù)字信號處理器(DSP)11表示裝置/算法和實現(xiàn)回聲抑制器及其相關VAD的相關電路。
對于DSP執(zhí)行VAD的可用參數(shù)是So-解碼的(合成的)話音和其相關的編碼參數(shù);和Si-麥克風的輸入，該輸入是一種疊加;
Sp-本地揚聲器產(chǎn)生的信號(話音話音、未說出的或無聲);
Se-So的聲音回聲;和N-車輛的背景噪聲。
回聲信號Se是被濾波的和被延遲的So形式并且可以表示為Se(t)＝h(t)＊So(t-d) (1)其中h(t)是回聲通路的自由脈沖響應的延遲;
d是回聲通路的純延遲;和＊是卷積運算符。
這里假設回聲通路是線性的，正如公式(1)所反映的。h(t)項代表從揚聲器到麥克風的直接通路加上混響效應。
延遲可以估算，假設揚聲器到麥克風的距離是在0.33m到1.5m的范圍，將得到
1ms＜d＜5ms對于8kHz的取樣速率，這對應于8到40個樣值的延遲。這至多是一個典型LPC聲碼器的子幀的數(shù)量級。
在遠端用戶正在講話時，為了根據(jù)能量考慮便利地確定本地話音的發(fā)出，建議對“白化”Si信號的能量進行估計，其中白化濾波器是在遠端話音合成濾波器的基礎上采用編碼器。
有效地實現(xiàn)能量計算和閾值估計類似于在GSM建議06.32提出的，但做了如下的某些修改。
Prad。
Pvad可以按照GSM建議06.32有效地計算。與GSM 06.32的Pvad計算的區(qū)別是利用RX濾波器系數(shù)，而不是特定特性的噪聲估算。這種運算在強調(diào)不同信號(即本地用戶)的同時，具有減小回聲信號的測量失真的效果。
THCADTHVAD在僅有噪聲的情況被確定，即Q＊[噪聲反相濾波能量](建議Q＝3)。利用輔助程序(閾值和濾波器參數(shù)自適應)取噪聲的半靜態(tài)值。
在插入話的情況下，雖然可利用遠端能量的變化，但THVAD應當能夠跟蹤快速變化而變化。因此，對于第K子幀，建議采用以下步驟估算能量Ecst(K)＝A1E0(k)+A2E0(k-1) (2.1)
估算閾值THVAD(k)＝Q[BEcst(k)+(1-B)THVAD(k-1)]其中Ecst(K)＝在子幀K估算的(麥克風)能量;
Aj＝濾波器系數(shù)(見下面的“輔助程序”);
Eo(K)＝在子幀K的能量輸出(即在揚聲器);
＝幀能量＊子幀增益(編碼器參數(shù));
Q＝閾值因子(例如3);和B＝THVAD自適應時間常數(shù)。
輔助程序在噪聲背景中噪聲與話音之間區(qū)別的VAD操作是根據(jù)靜態(tài)的和周期的測試。在話音已在另外的話音背景中被檢測的當前上下文中的第一參數(shù)是無效的。在下文另外討論周期性音調(diào)。
因此，能夠進行僅遠端狀態(tài)的檢測的下述標準應當利用估算誤差和比較閾值‖誤差(k)‖＝‖Ei(k)+Ecst(k)‖＜Th (3)其中Ei(K)＝在子幀K中的能量(即，在麥克風);
Th＝閾值。
據(jù)此，式2.1中能量估算器的參數(shù)Ai應當被調(diào)整(在[近端、遠端]＝
狀態(tài)下同時在話音模式中)到由公式3限定的最小誤差。為此目的，任何自適應話音算法(例如，LMS、WRLS)都可以實現(xiàn)。最簡單的這種程序是標準化的LMS。
自適應濾波器的自適應A(k+1)＝A(k)+mE0/(ETOE0)·誤差(k) (4)A＝[A1A2]TE0＝[E0(k)E0(k-1)]T誤差(k)＝Ei(k)+A(k)TE0m＝自適應常數(shù)(可以與時間有關)其中右上角標T表示矢量易位(Vector transposition)并且矢量是用下標線的值表示的。
參數(shù)A反映到回聲通路中并應當在話音模式中僅遠端話音期間被調(diào)整。可以合理地假定這些參數(shù)將是非常慢地變化，并且將不會存在大多數(shù)時間雙對話的狀態(tài)。因此，在一個短時間的自適應以后，A將不會明顯的改變，除非該本地用戶插話，誤差將保持在很小的水平上。A可以具有反映該車箱聲學特性的正常值。在一次談話結束以后，新的被估算的參數(shù)可以在非易失存儲器中更新。
VAD插話(和插話去除break-out)的判斷因此能夠以超過THVAD(K)的和/或超過一個閾值的誤差(K)的Ei(K)為基礎。對于插話和去插話的轉(zhuǎn)換時間應當與標準方法的概念類似(避免在一方的插話脈沖噪聲，和避免在另一方的話音箝位)。
音調(diào)對于分開的揚聲器的另一參數(shù)是音調(diào)(和其諧波)。當前對于揚聲器的算法是相當復雜的并且尚未涉及回聲抑制問題。然而，因為在回聲通路中音調(diào)是不變的，所以可以有益地利用雙對話狀態(tài)的檢測。下面的描述被建議作為上面描述的能量過程的一種增強技術。
一些聲碼器以滯后的方式反映音調(diào)信息，例如VSELP，(因為該滯后可能對應于諧波或音調(diào)的子諧波)，所以So的基本音調(diào)跟蹤(基本滯后跟蹤)首先從接收的信號中建立。上述公式2.1中的類似平滑過程應當用于回聲通路延遲的補償。
其后，如果Si音調(diào)檢測器(滯后估算器)在回聲信號中從所期望的音調(diào)/音調(diào)諧波(滯后)中產(chǎn)生不同的音調(diào)(滯后)，則表明一個插話狀態(tài)。
權利要求
1.一種用于回聲抑制器的話音作用檢測器，該檢測器包括接收音頻通路(12、8、27、4、3)，具有話音檢測器(8)，用于接收話音參數(shù)和由這些參數(shù)合成話音，發(fā)送音頻通路(1、2、5、26、12)，白化濾波器(19)，用于均衡在發(fā)送通路的音頻信號的頻譜，提供一個均衡的信號，判斷裝置(20)，連接到白化濾波器，測量在均衡的信號中的能量和從而檢測在發(fā)送通路中的話音，其特征在于，該白化濾波器是一個話音白化濾波器，和提供一個用于按照在接收通路由話音解碼器接收的話音參數(shù)自適應該白化濾波器的裝置(8、19)，。
2.按照權利要求1的話音作用檢測器，其特征在于，還包括一個噪聲白化濾波器(9)，用于對發(fā)送通路的信號進行濾波，提供一個信號給該判斷裝置，該提供的信號是相對于噪聲被均衡的。
3.一種回聲抑制器，其特征在于，該抑制器包括按照權利要求1或2的話音作用檢測器和還包括在相應的通路中的至少一個發(fā)送衰減器(26)和接收衰減器(27)，用于衰減在該通路或各通路中的音頻信號，該話音作用檢測器的判斷裝置(20)被連接到發(fā)送和/或接收衰減器，當由話音作用檢測器檢測到話音時，用于控制該衰減器或每個衰減器，以抑制在一個通路上或兩個通路上的音頻信號。
4.一種回聲抑制器，其特征在于，該抑制器包括接收音頻通路(12、8、27、4、3)，具有話音檢測器(8)，用于接收話音參數(shù)和由這些參數(shù)合成話音，發(fā)送音頻通路(1、2、5、26、12)，接收和發(fā)送衰減器裝置(27、26)，設在各自通路中，用于衰減在這些通路中的音頻信號，話音作用檢測器(20)，用于檢測在發(fā)送通路中的話音，并連接到接收與發(fā)送衰減器裝置上，用于控制衰減器裝置，當在發(fā)送通路接收到話音時，以抑制在相應通路上的音頻信號，在發(fā)送通路中的裝置(9、19)，用于作為來自接收通路的回聲的結果，在近端話音進入發(fā)送通路和遠端話音進入發(fā)送通路之間進行區(qū)別，和裝置(20)，當在發(fā)送通路中的話音基本上由于來自接收通路的回聲時，提供發(fā)送和接收衰減器的第一配置和當在發(fā)送通路中的話音是至少部分地由于來自近端話音時，提供發(fā)送和接收衰減器的第二配置。
5.按照權利要求4的回聲抑制器，其特征在于，第一配置包括在發(fā)送衰減器中相對高的衰減(Z)，和第二配置包括在發(fā)送衰減器中相對低的衰減(X)。
6.按照權利要求5的回聲抑制器，其特征在于，第二配置還包括在接收衰減器中的衰減(Y)。
7.按照權利要求6的回聲抑制器，其特征在于，第一配置包括在接收衰減器中基本上沒有衰減。
8.按照權利要求6或7的回聲抑制器，其特征在于，X+Y近似等于Z，且其中這樣選擇X和Y，即同時遠端和近端用戶可以彼此聽到。
9.按照權利要求4到8任何一個的回聲抑制器，其特征在于，包括音調(diào)區(qū)別裝置，用于在近端與遠端話音之間進行區(qū)分。
10.按照權利要求4到8任何一個的回聲抑制器，其特征在于，包括一個按照權利要求1或2的話音作用檢測器。
全文摘要
一種話音作用檢測器適合在回聲抑制器中應用，它包括一個白化濾波器(19)，用以均衡在發(fā)送通路上聲頻信號的頻譜，以提供一個均衡信號，還包括一個決定裝置(20)，與上述的白化濾波器相耦合，測量均衡信號中的能量，借此檢測發(fā)送通路上的話音。白化濾波器是一個話音白化濾波器，根據(jù)話音解碼器在接收通路上接收的話音參數(shù)自適應地工作(8，19)。另一方面，進入發(fā)送通路的近端話音與遠端話音不同而從接收通路產(chǎn)生回聲，在發(fā)送通路上的話音基本上是由于來自接收通路的回聲引起的時候，發(fā)送和接收衰減器(26，27)按第一種配置來安排，當傳送通路上的話音至少部分因近端話音引起的時候，按第二種配置來安排。
文檔編號G10L21/0208GK1114122SQ94190639
公開日1995年12月27日申請日期1994年8月11日優(yōu)先權日1993年8月27日
發(fā)明者福格爾·埃利澤申請人:莫托羅拉公司

完整全部詳細技術資料下載