專利名稱:網(wǎng)絡(luò)通信裝置及消除網(wǎng)絡(luò)通信裝置的噪音的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及噪音消除,特別是涉及網(wǎng)絡(luò)通信裝置的噪音消除。
背景技術(shù):
由于傳統(tǒng)電路交換式的電話花費(fèi)較大的成本,網(wǎng)絡(luò)電話技術(shù)逐漸被用來
進(jìn)行長距離通話或國際電話。因此,諸如VoIP裝置或Instant Messenger的 網(wǎng)絡(luò)通信裝置變的廣受歡迎。《象是Skype、 MSN Messenger, Yahoo Messenger、 Google Talker、 AOL Messenger皆是網(wǎng)絡(luò)通信的軟件應(yīng)用程序。隨著網(wǎng)絡(luò)通 信裝置的頻繁使用,對(duì)網(wǎng)絡(luò)通信裝置的通話聲音品質(zhì)的要求亦跟著提高。提 升網(wǎng)絡(luò)通信裝置的通話聲音品質(zhì)最大的關(guān)鍵在噪音的控制。
網(wǎng)絡(luò)通信裝置時(shí)常需經(jīng)由計(jì)算機(jī)連接上網(wǎng)絡(luò)。此時(shí)計(jì)算機(jī)風(fēng)扇的聲音、 打字的聲音、鼠標(biāo)移動(dòng)的聲音都很容易被網(wǎng)絡(luò)通信裝置的麥克風(fēng)所接收而傳 送至遠(yuǎn)程。網(wǎng)絡(luò)通信裝置所包含的噪音抑制模塊通常能消除大部分的靜態(tài)噪 音(stationary noise),以免靜態(tài)噪音影響到通話聲音品質(zhì)。然而,傳統(tǒng)噪 音抑制4莫塊無法消除非靜態(tài),喿音(non-stationary noise),諸如上述風(fēng)扇的 聲音、打字的聲音、鼠標(biāo)移動(dòng)的聲音等等。
由于進(jìn)行網(wǎng)絡(luò)通信的各方皆為互相獨(dú)立的,因此當(dāng)多人參與網(wǎng)絡(luò)通信時(shí) (例如網(wǎng)絡(luò)會(huì)議),則每方接收到總噪音量為各方產(chǎn)生的噪音的總合。而接收 端的網(wǎng)絡(luò)通信裝置的自動(dòng)增益模塊可能會(huì)再于放大聲音信號(hào)時(shí)連帶將各方產(chǎn) 生的噪音一并放大,降低通話的品質(zhì)。因此,需要一種消除網(wǎng)絡(luò)通信裝置的 噪音的方法,尤其是消除非靜態(tài)噪音,以便增進(jìn)網(wǎng)絡(luò)通信裝置的通話品質(zhì)。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提供一種網(wǎng)絡(luò)通信裝置,以解決習(xí)知技術(shù) 存在的問題。該網(wǎng)絡(luò)通信裝置播放經(jīng)由網(wǎng)絡(luò)接收的一遠(yuǎn)程聲音信號(hào),并經(jīng)由 該網(wǎng)絡(luò)傳送一近端聲音信號(hào)至遠(yuǎn)程。在一實(shí)施例中,該網(wǎng)絡(luò)通信裝置包括一 遠(yuǎn)程語音檢測(cè)模塊及一遠(yuǎn)程信道控制模塊。該遠(yuǎn)程語音檢測(cè)模塊檢測(cè)是否該 遠(yuǎn)程聲音信號(hào)包含語音,以產(chǎn)生一遠(yuǎn)程語音檢測(cè)結(jié)果。若該遠(yuǎn)程語音^r測(cè)結(jié)
果顯示該遠(yuǎn)程聲音信號(hào)不包含語音,則該遠(yuǎn)程信道控制^f莫塊衰減該遠(yuǎn)程聲音 信號(hào),以減少該遠(yuǎn)程聲音信號(hào)所包含的噪音。
本發(fā)明更提供一種消除網(wǎng)絡(luò)通信裝置的噪音的方法。該網(wǎng)絡(luò)通信裝置播 放經(jīng)由網(wǎng)絡(luò)接收的一遠(yuǎn)程聲音信號(hào),并經(jīng)由該網(wǎng)絡(luò)傳送一近端聲音信號(hào)至遠(yuǎn) 程。首先,檢測(cè)是否該遠(yuǎn)程聲音信號(hào)包含語音,以產(chǎn)生一遠(yuǎn)程語音檢測(cè)結(jié)果。 若該遠(yuǎn)程語音檢測(cè)結(jié)果顯示該遠(yuǎn)程聲音信號(hào)不包含語音,則衰減該遠(yuǎn)程聲音 信號(hào),以減少該遠(yuǎn)程聲音信號(hào)所包含的噪音。
為了讓本發(fā)明的上述和其它目的、特征、和優(yōu)點(diǎn)能更明顯易懂,下文特 舉數(shù)較佳實(shí)施例,并配合附圖,作詳細(xì)說明如下。
圖1為依據(jù)本發(fā)明的網(wǎng)絡(luò)通信裝置的數(shù)據(jù)塊圖; 圖2為依據(jù)本發(fā)明的遠(yuǎn)程語音檢測(cè)模塊的數(shù)據(jù)塊圖 圖3為依據(jù)本發(fā)明的遠(yuǎn)程信道控制模塊的數(shù)據(jù)塊圖 圖4為依據(jù)本發(fā)明的近端語音檢測(cè)模塊的數(shù)據(jù)塊圖;以及 圖5為依據(jù)本發(fā)明具有陣列麥克風(fēng)的網(wǎng)絡(luò)通信裝置500的數(shù)據(jù)塊圖 附圖符號(hào)說明 100-網(wǎng)絡(luò)通信裝置; 130-麥克風(fēng)模塊; 132-模/數(shù)轉(zhuǎn)換器; 134-聲學(xué)回聲消除模塊; 136-噪音抑制模塊; 138-自動(dòng)增益控制模塊; 106-近端語音檢測(cè)模塊; 110-數(shù)據(jù)傳輸接口; 112-遠(yuǎn)程回聲消除模塊; 114-遠(yuǎn)程噪音抑制模塊; 104-遠(yuǎn)程信道控制模塊; 102-遠(yuǎn)程語音檢測(cè)模塊; 116_遠(yuǎn)程自動(dòng)增益控制模塊; 118-數(shù)字至模擬轉(zhuǎn)換器;
120-功率^:大器;
108-計(jì)算機(jī);
2 0 O-遠(yuǎn)程語音檢測(cè)模塊;
202-短期平均功率測(cè)量模塊;
204-長期平均功率測(cè)量模塊;
206-噪音估測(cè)模塊;
208、 210-比較器;
212-檢測(cè)模塊;
214-諧波檢測(cè)模塊;
300-遠(yuǎn)程信道控制模塊;
302-檢測(cè)頻率模塊;
304-語音時(shí)期控制模塊;
306-衰減控制才莫塊;
400-近端語音檢測(cè)模塊;
402-比較器;
404-音高檢測(cè)模塊;
406-轉(zhuǎn)換模塊;
408-檢測(cè)模塊;
500-網(wǎng)絡(luò)通信裝置;
532、 533-模/數(shù)轉(zhuǎn)換器;
5 35-波束形成^^莫塊;
534-聲學(xué)回聲消除模塊;
536-噪音抑制模塊;
5 38-自動(dòng)增益控制模塊;
506-近端語音檢測(cè)模塊;
510-數(shù)據(jù)傳輸接口;
512-遠(yuǎn)程回聲消除模塊;
514-遠(yuǎn)程噪音抑制模塊;
504-遠(yuǎn)程信道控制模塊;
5 02-遠(yuǎn)程語音檢測(cè)模塊; 516-遠(yuǎn)程自動(dòng)增益控制模塊; 518-數(shù)字至模擬轉(zhuǎn)換器; 520-功率放大器; 508-計(jì)算機(jī)。
具體實(shí)施例方式
圖1為依據(jù)本發(fā)明的網(wǎng)絡(luò)通信裝置100的數(shù)據(jù)塊圖。網(wǎng)絡(luò)通信裝置100 連接至一個(gè)人計(jì)算機(jī)108,該個(gè)人計(jì)算機(jī)108又連接至一網(wǎng)絡(luò)。網(wǎng)絡(luò)通信裝 置100可為實(shí)體的網(wǎng)絡(luò)話機(jī)或個(gè)人計(jì)算機(jī)108的網(wǎng)絡(luò)通信軟件模塊。網(wǎng)絡(luò)通 信裝置100轉(zhuǎn)換一近端使用者的語音為一聲音信號(hào)并將聲音信號(hào)通過網(wǎng)絡(luò)傳 送至遠(yuǎn)程的另一網(wǎng)絡(luò)通信裝置。網(wǎng)絡(luò)通信裝置100亦通過網(wǎng)絡(luò)接收來自遠(yuǎn)程 的另一網(wǎng)絡(luò)通信裝置所傳送的聲音信號(hào),并將該遠(yuǎn)程聲音信號(hào)播放,使近端 使用者能聽見該遠(yuǎn)程聲音信號(hào)。如此則在網(wǎng)絡(luò)兩端的使用者可通過網(wǎng)絡(luò)進(jìn)行 會(huì)話。在多方會(huì)談的情形下,可有多個(gè)遠(yuǎn)程的網(wǎng)絡(luò)通信裝置同時(shí)與網(wǎng)絡(luò)通信 裝置100進(jìn)行聯(lián)系。
網(wǎng)絡(luò)通信裝置100通過數(shù)據(jù)傳輸接口 110連接至個(gè)人計(jì)算機(jī)108。數(shù)據(jù) 傳輸接口 110可為USB接口或沖莫擬音頻接口 ,當(dāng)網(wǎng)絡(luò)通信裝置10 0為軟件時(shí) 數(shù)據(jù)傳輸接口 110則是一軟件應(yīng)用程序接口 。當(dāng)網(wǎng)絡(luò)通信裝置100自網(wǎng)絡(luò)接 收到遠(yuǎn)程傳送的遠(yuǎn)程聲音信號(hào)時(shí),遠(yuǎn)程聲音信號(hào)在被揚(yáng)聲器122播放前會(huì)先 經(jīng)由網(wǎng)絡(luò)通信裝置100的遠(yuǎn)程信號(hào)處理通路進(jìn)行一連串的處理。遠(yuǎn)程信號(hào)處 理通3各顯示于圖1的下半部,包括遠(yuǎn)程回聲消除(Line Echo Cancellation) 模塊112、遠(yuǎn)程噪音抑制(Line-in Noise S叩pression)模塊114、遠(yuǎn)程語音
(Line—in Speech Detection)才莫^: 102、 i^禾K言il^空弗'J (Line—in Channel Control)模塊104、遠(yuǎn)程自動(dòng)增益控制(Line-in Automatic Gain Control) 才莫塊116、數(shù)字至才莫擬轉(zhuǎn)換器118、以及功率放大器(Power Ampl if ier) 120。
遠(yuǎn)程回聲消除模塊112自遠(yuǎn)程聲音信號(hào)移除網(wǎng)絡(luò)或傳輸線造成的回聲。 遠(yuǎn)程噪音抑制模塊114移除遠(yuǎn)程聲音信號(hào)所包含的一部分靜態(tài)噪音。由于衰 減靜態(tài)噪音時(shí)亦會(huì)對(duì)遠(yuǎn)程聲音信號(hào)本身造成衰減,因此只有一部分噪音被遠(yuǎn) 程噪音抑制模塊114所移除。因此,本發(fā)明增加了兩個(gè)模塊至網(wǎng)絡(luò)通信裝置 100,即遠(yuǎn)程語音檢測(cè)模塊102與遠(yuǎn)程信道控制模塊104,以消除遠(yuǎn)程聲音信 號(hào)所包含的非靜態(tài)噪音及遠(yuǎn)程噪音抑制模塊114未能移除的靜態(tài)噪音。
遠(yuǎn)程語音檢測(cè)模塊102首先檢測(cè)是否遠(yuǎn)程聲音信號(hào)包含語音。若遠(yuǎn)程聲 音信號(hào)包含語音,則遠(yuǎn)程語音檢測(cè)模塊102產(chǎn)生值為1的遠(yuǎn)程語音檢測(cè)結(jié)果。 若遠(yuǎn)程聲音信號(hào)不包含語音,則遠(yuǎn)程語音檢測(cè)模塊102產(chǎn)生值為0的遠(yuǎn)程語 音檢測(cè)結(jié)果。接著,遠(yuǎn)程語音檢測(cè)結(jié)果被送至遠(yuǎn)程信道控制模塊l(M。若遠(yuǎn) 程語音檢測(cè)結(jié)果顯示遠(yuǎn)程聲音信號(hào)不包含語音,則遠(yuǎn)程信道控制模塊104對(duì) 遠(yuǎn)程聲音信號(hào)進(jìn)行衰減。舉例來說,遠(yuǎn)程信道控制才莫塊l(M可直接抹除(mute) 該遠(yuǎn)程聲音信號(hào)。這樣一來,包含非靜態(tài)噪音的所有噪音接自遠(yuǎn)程聲音信號(hào) 中被移除。遠(yuǎn)程自動(dòng)增益控制模塊116接著將遠(yuǎn)程聲音信號(hào)的信號(hào)功率調(diào)整 至預(yù)設(shè)的水平。在遠(yuǎn)程聲音信號(hào)進(jìn)一步由數(shù)字至模擬轉(zhuǎn)換器118轉(zhuǎn)換為模擬 信號(hào)并由功率放大器120放大后,揚(yáng)聲器122播放遠(yuǎn)程聲音信號(hào),近端使用 者便可以聽見來自網(wǎng)絡(luò)另一方的遠(yuǎn)程聲音信號(hào)。
另一方面,網(wǎng)絡(luò)通信裝置100的麥克風(fēng)130亦自近端使用者接收一近端 聲音信號(hào)。在近端聲音信號(hào)被由數(shù)據(jù)傳輸接口 IIO傳送至網(wǎng)絡(luò)前,近端聲音 信號(hào)先由網(wǎng)絡(luò)通信裝置100的近端信號(hào)處理通路進(jìn)行處理。近端信號(hào)處理通 路顯示于圖l的上方,包括模/數(shù)轉(zhuǎn)換器132、聲學(xué)回聲消除(Acoustic Echo Cancel lat ion)才莫i夾134、 p乘音氺卩制(Noise Suppress ion)才莫塊136、近端i吾音 才全觀'HMic Speech Detection)才莫塊106、以及自動(dòng)增益4空制(Automat ic Gain Control)模塊138。本發(fā)明將近端語音才企測(cè)模塊106加入網(wǎng)絡(luò)通信裝置100, 以消除近端聲音信號(hào)包含的噪音,包含非靜態(tài)噪音。與遠(yuǎn)程語音檢測(cè)模塊102 類似,近端語音檢測(cè)模塊106檢測(cè)是否近端聲音信號(hào)包含語音,以產(chǎn)生一近 端語音;f企測(cè)結(jié)果。若近端語音4企測(cè)結(jié)果顯示該近端聲音信號(hào)不包含語音,則 自動(dòng)增益控制;f莫塊138不對(duì)該近端聲音信號(hào)進(jìn)行^:大,以防止該近端聲音信 號(hào)所包含的噪音被放大。因此,近端聲音信號(hào)所包含的剩余噪音及非靜態(tài)噪 音在傳輸前不會(huì)#皮》文大。
圖2為依據(jù)本發(fā)明的遠(yuǎn)程語音檢測(cè)模塊200的數(shù)據(jù)塊圖。遠(yuǎn)程語音檢測(cè) 模塊200包括短期平均功率測(cè)量(Short-term Power Calculat ion)才莫塊202、 長期平均功率測(cè)量才莫塊(Long-1erm Power Ca 1 cu 1 ation) 204、噪音估測(cè)(Noise Estimate)模塊206、比較器208及210、檢測(cè)模塊212、以及諧波檢測(cè) (Harmonics Detect ion)模塊214。短期平均功率測(cè)量模塊202測(cè)量遠(yuǎn)程聲音 信號(hào)L(n)的短期平均功率Ps (n)。長期平均功率測(cè)量模塊204測(cè)量遠(yuǎn)程聲音 信號(hào)L(n)的長期平均功率Pjn)。短期平均功率Ps(n)與長期平均功率P, (n)
分別藉由下列各式?jīng)Q定
<formula>complex formula see original document page 15</formula>(2) 其中L(n)為遠(yuǎn)程聲音信號(hào),0Cs為預(yù)定的短期平滑化參數(shù),Od為預(yù)定的長期 平滑化參數(shù),n為該遠(yuǎn)程聲音信號(hào)的樣本序號(hào)。(1-od)至少較(l-ocs)小10 倍,以便使短期平均功率Ps (n)較長期平均功率P, (n)有較快的更新速度。
噪音估測(cè)模塊206由遠(yuǎn)程聲音信號(hào)的噪音估測(cè)值N (m)導(dǎo)出遠(yuǎn)程聲音信號(hào) 的噪音功率估測(cè)值Pn(n)。噪音估測(cè)模塊206由圖1的遠(yuǎn)程噪音抑制模塊114 取得頻域噪音估測(cè)值N (m)。噪音估測(cè)模塊206接著依據(jù)下式由頻域噪音估測(cè) 值N (m)導(dǎo)出噪音功率估測(cè)值Pn (n):
<formula>complex formula see original document page 15</formula>
其中,函數(shù)[x]表示最接近x的整數(shù)值,k為幀序號(hào),M為頻域處理的幀長度。
當(dāng)短期平均功率Ps (n)、長期平均功率Pi (n)、及噪音功率估測(cè)值Pn (n)
均決定后,該等數(shù)值被送至比較器208與210。比較器208將短期平均功率
Ps (n)與長期平均功率P,(n)間的差距與一第一閾值L(n)進(jìn)行比較,以產(chǎn)生一
第一比較結(jié)果d (n)。比較器210將長期平均功率P, (n)與噪音功率估測(cè)值Pn(n)
間的差距與一第二閾值L(n)進(jìn)行比較,以產(chǎn)生一第二比較結(jié)果C2(n)。第一
比較結(jié)果d (n)與第二比較結(jié)果C2 (n)分別依據(jù)下列諸式得到<formula>complex formula see original document page 15</formula>
其中,lxl表示x的絕對(duì)值,而log(x)表示x以10為底的對(duì)數(shù)值。 若第一比較結(jié)果d(n)表示短期平均功率Ps(n)遠(yuǎn)大于長期平均功率 P"n),且第二比較結(jié)果C2(n)表示長期平均功率P,(n)遠(yuǎn)大于噪音功率估測(cè)值 Pn(n),則第一比較結(jié)果d(n)與第二比較結(jié)果C2(n)皆為真。如此則檢測(cè)模塊 212使能一檢測(cè)輸出值D(n),以便驅(qū)動(dòng)諧波檢測(cè)模塊214。檢測(cè)模塊212依 據(jù)下式?jīng)Q定^r測(cè)輸出值D(n): <formula>formula see original document page 16</formula>當(dāng)檢測(cè)輸出值D (n)為真時(shí),諧波檢測(cè)模塊214對(duì)遠(yuǎn)程聲音信號(hào)L (n)進(jìn)行 諧波分析(ha rmon i c s analysis),以檢測(cè)是否遠(yuǎn)程聲音信號(hào)包含語音成分。 若遠(yuǎn)程聲音信號(hào)包含語音成分,則諧波檢測(cè)模塊214產(chǎn)生值為1的遠(yuǎn)程語音 檢測(cè)結(jié)果S(n),以表示遠(yuǎn)程聲音信號(hào)包含語音成分。因此,圖1的遠(yuǎn)程信道 控制模塊104可依據(jù)遠(yuǎn)程語音檢測(cè)結(jié)果S(n)而決定是否抹除遠(yuǎn)程聲音信號(hào) L (n)。此外,諧波檢測(cè)模塊214對(duì)遠(yuǎn)程聲音信號(hào)L (n)進(jìn)行諧波分析的詳細(xì)方 法,可參閱E. Fisher等的文獻(xiàn)"Generalized 1 ikelihood ratio test for voiced—unvoiced decision in noisy speech using the harmonic model", IEEE Trans. On Audio, Speech and Language Processing, Vol.14, No. 2, March 2006, 或是J. Tabrikian的文獻(xiàn)"Tracking speech in a noisy environment using the harmonic model" , IEEE Trans. Speech and Audio Processing, Vol. 12, No. 1, Jan. 2004。
圖3為依據(jù)本發(fā)明的遠(yuǎn)程信道控制模塊300的數(shù)據(jù)塊圖。遠(yuǎn)程信道控制
模塊300包括檢測(cè)頻率(Detection Frequency)才莫塊302 、語音時(shí)期控制
(Speech Period Control)才莫塊304、以及衰減控制(Attenuation Control)
模塊306。檢測(cè)頻率模塊302接收一語音時(shí)期信號(hào)G(n)。假設(shè)語音時(shí)期信號(hào)
G(n)全為真的時(shí)段為「語音時(shí)期」,則檢測(cè)頻率才莫塊302于語音時(shí)期中計(jì)數(shù)
該遠(yuǎn)程語音檢測(cè)結(jié)果S(n)為真的頻率,以決定一檢測(cè)頻率V(n)。檢測(cè)頻率模
塊302藉由下式?jīng)Q定^^測(cè)頻率V (n):
<formula>formula see original document page 16</formula>。(8)
語音時(shí)期控制模塊304接著依據(jù)檢測(cè)頻率V (n)及遠(yuǎn)程語音檢測(cè)結(jié)果S (n) 產(chǎn)生語音時(shí)期信號(hào)G(n),以控制該遠(yuǎn)程聲音信號(hào)的衰減。若檢測(cè)頻率V(n) 大于一頻率閾值B時(shí),語音時(shí)期控制模塊304延長語音時(shí)期信號(hào)G (n)的語音 時(shí)期。反之,若檢測(cè)頻率V (n)小于該頻率閾值B時(shí),則語音時(shí)期控制模塊304 縮短語音時(shí)期信號(hào)G(n)的語音時(shí)期。接著,衰減控制模塊306依據(jù)語音時(shí)期 信號(hào)G (n)抹除遠(yuǎn)程聲音信號(hào)。經(jīng)過語音時(shí)期控制模塊304調(diào)整語音時(shí)期信號(hào) G(n)為真的時(shí)段長短后,兩網(wǎng)絡(luò)通信裝置間的通話便不會(huì)頻繁地被衰減控制 模塊306抹除,而使揚(yáng)聲器播放的聲音信號(hào)變的斷斷續(xù)續(xù)或出現(xiàn)尖銳的聲音。
語音時(shí)期信號(hào)G(n)經(jīng)由下列各式所決定
<formula>formula see original document page 17</formula>圖4為依據(jù)本發(fā)明的近端語音檢測(cè)模塊400的數(shù)據(jù)塊圖。近端語音檢測(cè) 模塊400包括比較器402、音高檢測(cè)(Pitch Detection)模塊404、轉(zhuǎn)換模塊 406、以及檢測(cè)模塊408。轉(zhuǎn)換模塊406將表示遠(yuǎn)程聲音信號(hào)是否包含語音的 遠(yuǎn)程檢測(cè)信號(hào)Vf (n)自時(shí)域轉(zhuǎn)換至頻域,以得到頻域的遠(yuǎn)程檢測(cè)信號(hào)Vf (m)。 因此,若遠(yuǎn)程檢測(cè)信號(hào)Vf(m)為真,則表示目前正有通話在進(jìn)行,因而此時(shí) 近端聲音信號(hào)包含語音的機(jī)率較大。頻域的遠(yuǎn)程檢測(cè)信號(hào)Vf(m)經(jīng)由下式得
<formula>formula see original document page 17</formula>
其中,m為幀序號(hào),而M為為頻域處理的幀長度。
比較器402接著決定是否近端聲音信號(hào)的功率Pf (m)與近端聲音信號(hào)的一 靜態(tài)噪音(s tat ionary noise)估測(cè)值Pn (m)之間的差距大于一第三閾值Tx (m) 以得到一第三比較結(jié)果Cf(m)。若第三比較結(jié)果Cf(m)為真,表示近端聲音信 號(hào)的功率Pf(m)遠(yuǎn)大于靜態(tài)噪音(stationary noise)估測(cè)值Pn (m),則近端聲 音信號(hào)很可能包含了語音成分。此時(shí)第三比較結(jié)果可驅(qū)動(dòng)音高檢測(cè)模塊404, 使音高檢測(cè)模塊404對(duì)近端聲音信號(hào)進(jìn)行音高檢測(cè)(pitch detection)以產(chǎn)生 一音高檢測(cè)信號(hào)Dx(m)。若因高檢測(cè)信號(hào)為真,則可確定近端聲音信號(hào)包含 語音成分。至于音高檢測(cè)模塊404對(duì)近端聲音信號(hào)進(jìn)行音高檢測(cè)的詳細(xì)方法, 可參閱D. Huang等的文獻(xiàn)"Speech pi tch detect ion in noisy environment using multi-rate adaptive lossless FIR filters" , ISCAS' 04, 22-26 May 2004,或是L. Hui等的文獻(xiàn)"A Pitch Detection Algorithm Based on AMDF and ACF" , ICASSP, 06, 14-19 May 2006。
若音高檢測(cè)信號(hào)Dx (m)與遠(yuǎn)程檢測(cè)信號(hào)Vf (m)皆為真時(shí),表示網(wǎng)絡(luò)兩端的 網(wǎng)絡(luò)通信裝置正在進(jìn)行交談,因此檢測(cè)模塊408使能近端語音檢測(cè)結(jié)果 Sx(n)。接著,圖1的自動(dòng)增益模塊138可依據(jù)近端語音檢測(cè)結(jié)果Sx(n)而放
大近端聲音信號(hào)X (m)。檢測(cè)模塊408依據(jù)下式?jīng)Q定近端語音檢測(cè)結(jié)果Sx (n):
<formula>formula see original document page 18</formula>;以及 (13)
<formula>formula see original document page 18</formula>(14) 其中,Sx(m)為頻域的近端語音檢測(cè)結(jié)果,而Sx(n)為時(shí)域的近端語音檢 測(cè)結(jié)果,函數(shù)[x]表示最接近x的整數(shù)值。
圖5為依據(jù)本發(fā)明具有陣列麥克風(fēng)(array microphone)的網(wǎng)絡(luò)通信裝置 500的數(shù)據(jù)塊圖。除了增加陣列麥克風(fēng)^^莫塊及波束形成(beam forming^莫塊 535之外,網(wǎng)絡(luò)通信裝置500大致類似于圖1的網(wǎng)絡(luò)通信裝置100。陣列麥克 風(fēng)模塊包含兩個(gè)麥克風(fēng)530及531,分別在不同位置接收近端使用者發(fā)出的 聲波并將其分別轉(zhuǎn)換為近端聲音信號(hào)。波束形成i^莫塊535可依據(jù)麥克風(fēng)530 及531產(chǎn)生的近端聲音信號(hào)間的差異而產(chǎn)生波束內(nèi)(in-beam)及波束外 (out-of-beam)信息I,以抑制波束外的噪音,并讓近端語音沖企測(cè);漠塊506產(chǎn) 生更精確的近端語音檢測(cè)結(jié)果Sx。因此,增加了陣列麥克風(fēng)及波束形成模塊 535的網(wǎng)絡(luò)通信裝置500對(duì)近端噪音消除的效能較圖1的網(wǎng)絡(luò)通信裝置100 更佳。
本發(fā)明提供了 一種消除網(wǎng)絡(luò)通信裝置的噪音的方法。本發(fā)明新增了遠(yuǎn)程 語音檢測(cè)模塊,以檢測(cè)遠(yuǎn)程聲音信號(hào)是否包含語音成分,若遠(yuǎn)程聲音信號(hào)不 包含語音成分,再由遠(yuǎn)程信道控制模塊衰減不包含語音的遠(yuǎn)程聲音信號(hào)。本 發(fā)明亦新增了近端語音檢測(cè)模塊,以檢測(cè)近端聲音信號(hào)是否包含語音成分, 若近端聲音信號(hào)不包含語音成分,自動(dòng)增益控制模塊便不對(duì)不包含語音的近 端聲音信號(hào)進(jìn)行放大。如此則遠(yuǎn)程及近端聲音信號(hào)所包含的噪音,包括非靜 態(tài)噪音,皆被有效率地移除,因而增進(jìn)網(wǎng)絡(luò)通信裝置的效能。
雖然本發(fā)明已以較佳實(shí)施例揭露如上,然其并非用以限定本發(fā)明,任何 熟習(xí)此項(xiàng)技術(shù)者,在不脫離本發(fā)明的精神和范圍內(nèi),當(dāng)可作些許的更動(dòng)與潤 飾,因此本發(fā)明的保護(hù)范圍當(dāng)視本發(fā)明的申請(qǐng)專利范圍所界定者為準(zhǔn)。
權(quán)利要求
1.一種網(wǎng)絡(luò)通信裝置,播放經(jīng)由網(wǎng)絡(luò)接收的一遠(yuǎn)程聲音信號(hào),并經(jīng)由該網(wǎng)絡(luò)傳送一近端聲音信號(hào)至遠(yuǎn)程,包括一遠(yuǎn)程語音檢測(cè)模塊,檢測(cè)是否該遠(yuǎn)程聲音信號(hào)包含語音,以產(chǎn)生一遠(yuǎn)程語音檢測(cè)結(jié)果;以及一遠(yuǎn)程信道控制模塊,耦接至該遠(yuǎn)程語音檢測(cè)模塊,若該遠(yuǎn)程語音檢測(cè)結(jié)果顯示該遠(yuǎn)程聲音信號(hào)不包含語音,則衰減該遠(yuǎn)程聲音信號(hào),以減少該遠(yuǎn)程聲音信號(hào)所包含的噪音。
2. 如權(quán)利要求1所述的網(wǎng)絡(luò)通信裝置,其中,該網(wǎng)絡(luò)通信裝置還包括 一近端語音檢測(cè)模塊,檢測(cè)是否該近端聲音信號(hào)包含語音,以產(chǎn)生一近端語音4企測(cè)結(jié)果;以及一自動(dòng)增益控制模塊,耦接至該近端語音檢測(cè)模塊,若該近端語音檢測(cè) 結(jié)果顯示該近端聲音信號(hào)包含語音,則放大該近端聲音信號(hào),以防止該近端 聲音信號(hào)所包含的噪音被放大。
3. 如權(quán)利要求l所述的網(wǎng)絡(luò)通信裝置,其中,該遠(yuǎn)程語音檢測(cè)模塊更包括一短期平均功率測(cè)量^^莫塊,測(cè)量該遠(yuǎn)程聲音信號(hào)的短期平均功率; 一長期平均功率測(cè)量模塊,測(cè)量該遠(yuǎn)程聲音信號(hào)的長期平均功率; 一噪音估測(cè)模塊,取得該遠(yuǎn)程聲音信號(hào)的噪音功率估測(cè)值; 一第一比較器,耦接至該短期平均功率測(cè)量模塊及該長期平均功率測(cè)量閾值的一第一比較結(jié)果;一第二比較器,耦接至該長期平均功率測(cè)量模塊及該噪音估測(cè)模塊,產(chǎn) 生表示是否該長期平均功率與該噪音功率估測(cè)值間的差距大于一第二閾值的 一第二比較結(jié)果;一檢測(cè)模塊,耦接至該第一比較器及該第二比較器,產(chǎn)生表示是否該第 一比較結(jié)果及該第二比較結(jié)果均為真的 一檢測(cè)輸出值;以及一諧波檢測(cè)模塊,耦接至該檢測(cè)模塊,當(dāng)該檢測(cè)輸出值為真時(shí),對(duì)該遠(yuǎn) 程聲音信號(hào)進(jìn)行諧波分析,以產(chǎn)生表示是否該遠(yuǎn)程聲音信號(hào)包含語音成分的 該遠(yuǎn)程語音^r測(cè)結(jié)果。
4. 如權(quán)利要求3所述的網(wǎng)絡(luò)通信裝置,其中,該短期平均功率測(cè)量模塊依據(jù)下式測(cè)量該遠(yuǎn)程聲音信號(hào)的短期平均功率 <formula>see original document page 3</formula>其中,L(n)為該遠(yuǎn)程聲音信號(hào),Ps(n)為該短期平均功率,Alfa s為預(yù)定的一短期平滑化參數(shù),n為該遠(yuǎn)程聲音信號(hào)的樣本序號(hào);和該長期平均功率測(cè)量模塊依據(jù)下式測(cè)量該遠(yuǎn)程聲音信號(hào)的長期平均功率<formula>see original document page 3</formula>; 其中,L(n)為該遠(yuǎn)程聲音信號(hào),P1(n)為該長期平均功率,Od為預(yù)定的一 長期平滑化參數(shù),和(1-a》至少較(l-as)小10倍,n為該遠(yuǎn)程聲音信號(hào)的 樣本序號(hào)。
5. 如權(quán)利要求3所述的網(wǎng)絡(luò)通信裝置,其中,該噪音估測(cè)模塊依據(jù)下式 取得該遠(yuǎn)程聲音信號(hào)的噪音功率估測(cè)值<formula>see original document page 3</formula>;以及<formula>see original document page 3</formula>;其中,Pn(n)為該噪音功率估測(cè)值,N(m)為一頻域噪聲估測(cè)值,函數(shù)[x] 表示最接近x的整數(shù)值,k為幀序號(hào),M為頻域處理的幀長度。
6. 如權(quán)利要求3所述的網(wǎng)絡(luò)通信裝置,其中,該第一比較器依據(jù)下式產(chǎn) 生該第一比較結(jié)果<formula>see original document page 3</formula>其中,C1(n)為該第一比較結(jié)果,Ps(n)為該短期平均功率,PJn)為該長 期平均功率,T1(n)為該第一閾值;和該第二比較器依據(jù)下式產(chǎn)生該第二比較結(jié)果 <formula>see original document page 3</formula>.其中,C2(n)為該第二比較結(jié)果,Pl(n)為該長期平均功率,Pjn)為該噪音功率估測(cè)值,T2(n)為該第二閾值;且該檢測(cè)模塊依據(jù)下式產(chǎn)生該檢測(cè)輸出值 <formula>see original document page 3</formula>其中,D(n)為該檢測(cè)輸出值,d(n)為該第一比較結(jié)果,C2(n)為該第二比 較結(jié)果。
7. 如權(quán)利要求1所述的網(wǎng)絡(luò)通信裝置,其中,該遠(yuǎn)程信道控制模塊包括: 一檢測(cè)頻率模塊,在一語音時(shí)期信號(hào)的語音時(shí)期中計(jì)數(shù)該遠(yuǎn)程語音檢測(cè)結(jié)果為真的頻率以決定一檢測(cè)頻率,其中,該語音時(shí)期表示在該時(shí)期中該語音時(shí)期信號(hào)為真;一語音時(shí)期控制模塊,耦接至該檢測(cè)頻率模塊,產(chǎn)生該語音時(shí)期信號(hào)以 控制該遠(yuǎn)程聲音信號(hào)的衰減,在該檢測(cè)頻率大于一頻率閾值時(shí)延長該語音時(shí) 期信號(hào)的語音時(shí)期,并在該檢測(cè)頻率小于該頻率閾值時(shí)縮短該語音時(shí)期信號(hào) 的語音時(shí)期;以及一衰減控制模塊,耦接至該檢測(cè)頻率模塊及該語音時(shí)期控制模塊,依據(jù) 該語音時(shí)期信號(hào)抹除該遠(yuǎn)程聲音信號(hào)。
8. 如權(quán)利要求7所述的網(wǎng)絡(luò)通信裝置,其中,該檢測(cè)頻率模塊依據(jù)下式?jīng)Q定該4企測(cè)頻率<formula>see original document page 4</formula>其中,V(n)為該檢測(cè)頻率,n為樣本序號(hào),S(n)為該遠(yuǎn)程語音檢測(cè)結(jié)果,G(n)為該語音時(shí)期信號(hào);和該語音時(shí)期控制模塊依據(jù)下式產(chǎn)生該語音時(shí)期信號(hào) <formula>see original document page 4</formula>以及<formula>see original document page 4</formula>其中,G(n)為該語音時(shí)期信號(hào),n為樣本序號(hào),V(n)為該檢測(cè)頻率,S (n) 為該遠(yuǎn)程語音4企測(cè)結(jié)果,而B為該頻率閾值。
9. 如權(quán)利要求2所述的網(wǎng)絡(luò)通信裝置,其中,該近端語音檢測(cè)模塊包括 一第三比較器,決定是否該近端聲音信號(hào)的功率與該近端聲音信號(hào)的一靜態(tài)噪音估測(cè)值之間的差距大于一第三閾值,以得到一第三比較結(jié)果;一音高檢測(cè)模塊,耦接至該第三比較器,當(dāng)被該第三比較結(jié)果驅(qū)動(dòng)時(shí),對(duì)該近端聲音信號(hào)進(jìn)行音高檢測(cè)以產(chǎn)生一音高檢測(cè)信號(hào);一轉(zhuǎn)換模塊,將表示該遠(yuǎn)程聲音信號(hào)包含語音的一遠(yuǎn)程檢測(cè)信號(hào)自時(shí)域轉(zhuǎn)換至頻域;以及一檢測(cè)模塊,耦接至該音高檢測(cè)模塊及該轉(zhuǎn)換模塊,若該音高檢測(cè)信號(hào) 與該遠(yuǎn)程檢測(cè)信號(hào)皆為真時(shí)使能該近端語音檢測(cè)結(jié)果。
10.如權(quán)利要求9所述的網(wǎng)絡(luò)通信裝置,其中,該轉(zhuǎn)換模塊依據(jù)下式轉(zhuǎn) 換該遠(yuǎn)程檢測(cè)信號(hào)其中,Vf (m)為頻域的該遠(yuǎn)程檢測(cè)信號(hào),m為幀序號(hào),而M為為頻域 處理的幀長度。
11.如權(quán)利要求9所述的網(wǎng)絡(luò)通信裝置,其中,該檢測(cè)模塊依據(jù)下式產(chǎn) 生該近端語音;f企測(cè)結(jié)果其中,Sx(m)為頻域的該近端語音檢測(cè)結(jié)果,Sx(n)為時(shí)域的該近端語音 檢測(cè)結(jié)果,Vf (m)為該遠(yuǎn)程檢測(cè)信號(hào),Dx(m)為該音高檢測(cè)信號(hào),函數(shù)[x]表示 最接近x的整數(shù)值,m為幀序號(hào),n為樣本序號(hào),M為頻域處理的幀長度。
12. 如權(quán)利要求2所述的網(wǎng)絡(luò)通信裝置,其中,該網(wǎng)絡(luò)通信裝置還包括 一陣列麥克風(fēng)及一波束形成模塊以產(chǎn)生該近端聲音信號(hào),該波束形成模塊提 供該近端聲音信號(hào)的波束內(nèi)及波束外信息,以供該近端語音才僉測(cè)模塊產(chǎn)生更 精確的該近端語音檢測(cè)結(jié)果。
13. —種消除網(wǎng)絡(luò)通信裝置的噪音的方法,該網(wǎng)絡(luò)通信裝置播放經(jīng)由網(wǎng) 絡(luò)接收的一遠(yuǎn)程聲音信號(hào),并經(jīng)由該網(wǎng)絡(luò)傳送一近端聲音信號(hào)至遠(yuǎn)程,該方 法包括下列步驟檢測(cè)是否該遠(yuǎn)程聲音信號(hào)包含語音,以產(chǎn)生一遠(yuǎn)程語音檢測(cè)結(jié)果;以及 若該遠(yuǎn)程語音檢測(cè)結(jié)果顯示該遠(yuǎn)程聲音信號(hào)不包含語音,則衰減該遠(yuǎn)程 聲音信號(hào),以減少該遠(yuǎn)程聲音信號(hào)所包含的噪音。
14. 如權(quán)利要求13所述的消除網(wǎng)絡(luò)通信裝置的噪音的方法,其中,該方 法還包括下列步驟檢測(cè)是否該近端聲音信號(hào)包含語音,以產(chǎn)生一近端語音檢測(cè)結(jié)果;以及「"/M];若該近端語音沖企測(cè)結(jié)果顯示該近端聲音信號(hào)包含語音,則放大該近端聲 音信號(hào),以防止該近端聲音信號(hào)所包含的噪音被放大。
15. 如權(quán)利要求13所述的消除網(wǎng)絡(luò)通信裝置的噪音的方法,其中,該遠(yuǎn) 程語音檢測(cè)結(jié)果的產(chǎn)生包括下列步驟測(cè)量該遠(yuǎn)程聲音信號(hào)的短期平均功率; 測(cè)量該遠(yuǎn)程聲音信號(hào)的長期平均功率; 取得該遠(yuǎn)程聲音信號(hào)的噪音功率估測(cè)值;產(chǎn)生表示是否該短期平均功率與該長期平均功率間的差距大于 一第 一 閾 值的一第一比較結(jié)果;產(chǎn)生表示是否該長期平均功率與該噪音功率估測(cè)值間的差距大于一第二 閾值的一第二比較結(jié)果;產(chǎn)生表示是否該第 一 比較結(jié)果及該第二比較結(jié)果均為真的 一檢測(cè)輸出 值;以及當(dāng)該檢測(cè)輸出值為真時(shí),對(duì)該遠(yuǎn)程聲音信號(hào)進(jìn)行諧波分析,以產(chǎn)生表示 是否該遠(yuǎn)程聲音信號(hào)包含語音成分的該遠(yuǎn)程語音^r測(cè)結(jié)果。
16. 如權(quán)利要求15所述的消除網(wǎng)絡(luò)通信裝置的噪音的方法,其中,該短期平均功率依據(jù)下式進(jìn)行測(cè)量<formula>see original document page 6</formula>其中,L(n)為該遠(yuǎn)程聲音信號(hào),Ps(n)為該短期平均功率,ots為預(yù)定的 一短期平滑化參數(shù),n為該遠(yuǎn)程聲音信號(hào)的樣本序號(hào);和 該長期平均功率依據(jù)下式進(jìn)行測(cè)量 <formula>see original document page 6</formula>其中,L(n)為該遠(yuǎn)程聲音信號(hào),P,(n)為該長期平均功率,α1為預(yù)定的一 長期平滑化參數(shù),且(1-α1)至少較(l-αs)小10倍,n為該遠(yuǎn)程聲音信號(hào)的 樣本序號(hào)。
17. 如權(quán)利要求15所述的消除網(wǎng)絡(luò)通信裝置的噪音的方法,其中,該噪 音功率估測(cè)值依據(jù)下式得到<formula>see original document page 6</formula>;以及<formula>see original document page 6</formula>;其中,Pn(n)為該噪音功率估測(cè)值,N(m)為一頻域噪聲估測(cè)值,函數(shù)[x]表示最接近x的整數(shù)值,k為幀序號(hào),M為頻域處理的幀長度。
18. 如權(quán)利要求15所述的消除網(wǎng)絡(luò)通信裝置的噪音的方法,其中,該第一比較結(jié)果依據(jù)下式產(chǎn)生<formula>see original document page 7</formula>其中,d(n)為該第一比較結(jié)果,Ps(n)為該短期平均功率,P〃n)為該長 期平均功率,L(n)為該第一闊值;和 該第二比較結(jié)果依據(jù)下式產(chǎn)生<formula>see original document page 7</formula>其中,C2(n)為該第二比較結(jié)果,Pl(n)為該長期平均功率,Pjn)為該噪音功率估測(cè)值,L(n)為該第二閾值;和該檢測(cè)輸出值依據(jù)下式產(chǎn)生<formula>see original document page 7</formula> 其中,D(n)為該檢測(cè)輸出值,d(n)為該第一比較結(jié)果,C2(n)為該第二比 較結(jié)果。
19. 如權(quán)利要求13所述的消除網(wǎng)絡(luò)通信裝置的噪音的方法,其中,該遠(yuǎn) 程聲音信號(hào)的衰減包括下列步驟在 一語音時(shí)期信號(hào)的語音時(shí)期中計(jì)數(shù)該遠(yuǎn)程語音檢測(cè)結(jié)果為真的頻率以 決定一檢測(cè)頻率,其中,該語音時(shí)期表示在該時(shí)期中該語音時(shí)期信號(hào)為真; 當(dāng)該檢測(cè)頻率大于一頻率閾值時(shí)延長該語音時(shí)期信號(hào)的語音時(shí)期; 當(dāng)該檢測(cè)頻率小于該頻率閾值時(shí)縮短該語音時(shí)期信號(hào)的語音時(shí)期;以及 依據(jù)該語音時(shí)期信號(hào)抹除該遠(yuǎn)程聲音信號(hào)。
20. 如權(quán)利要求19所述的消除網(wǎng)絡(luò)通信裝置的噪音的方法,其中,該檢測(cè)頻率依據(jù)下式?jīng)Q定<formula>see original document page 7</formula>其中,V(n)為該檢測(cè)頻率,n為樣本序號(hào),S(n)為該遠(yuǎn)程語音檢測(cè)結(jié)果, G(n)為該語音時(shí)期信號(hào);和該語音時(shí)期信號(hào)依據(jù)下式延長或縮短其語音時(shí)期<formula>see original document page 8</formula><formula>see original document page 8</formula>以及<formula>see original document page 8</formula>其中,G(n)為該語音時(shí)期信號(hào),n為樣本序號(hào),V(n)為該檢測(cè)頻率,S (n) 為該遠(yuǎn)程語音檢測(cè)結(jié)果,而B為該頻率閾值。
21. 如權(quán)利要求14所述的消除網(wǎng)絡(luò)通信裝置的噪音的方法,其中,該近 端語音檢測(cè)結(jié)果的產(chǎn)生包括下列步驟決定是否該近端聲音信號(hào)的功率與該近端聲音信號(hào)的 一靜態(tài)噪音估測(cè)值 之間的差距大于一第三閾值,以得到一第三比較結(jié)果;當(dāng)該第三比較結(jié)果為真時(shí),對(duì)該近端聲音信號(hào)進(jìn)行音高檢測(cè)以產(chǎn)生一音 高檢測(cè)信號(hào);將表示該遠(yuǎn)程聲音信號(hào)包含語音的一遠(yuǎn)程;險(xiǎn)測(cè)信號(hào)自時(shí)域轉(zhuǎn)換至頻域;以及若該音高檢測(cè)信號(hào)與該遠(yuǎn)程檢測(cè)信號(hào)皆為真時(shí)使能該近端語音檢測(cè)結(jié)果。
22. 如權(quán)利要求21所述的消除網(wǎng)絡(luò)通信裝置的噪音的方法,其中,該遠(yuǎn) 程檢測(cè)信號(hào)依據(jù)下式轉(zhuǎn)換<formula>see original document page 8</formula> 其中,Vf (m)為頻域的該遠(yuǎn)程;險(xiǎn)測(cè)信號(hào),m為幀序號(hào),而M為頻域處理的 幀長度。
23.如權(quán)利要求21所述的消除網(wǎng)絡(luò)通信裝置的噪音的方法,其中,該近 端語音檢測(cè)結(jié)果依據(jù)下式產(chǎn)生<formula>see original document page 8</formula>其中,Sx(m)為頻域的該近端語音檢測(cè)結(jié)果,Sx(n)為時(shí)域的該近端語音 檢測(cè)結(jié)果,Vf (m)為該遠(yuǎn)程檢測(cè)信號(hào),Dx(ra)為該音高檢測(cè)信號(hào),函數(shù)[x]表示 最接近x的整數(shù)值,m為幀序號(hào),n為樣本序號(hào),M為頻域處理的幀長度。
24.如權(quán)利要求14所述的消除網(wǎng)絡(luò)通信裝置的噪音的方法,其中,該網(wǎng)絡(luò)通信裝置更包括一 陣列麥克風(fēng)及一 波束形成才莫塊以產(chǎn)生該近端聲音信號(hào), 該波束形成模塊提供該近端聲音信號(hào)的波束內(nèi)及波束外信息,以產(chǎn)生更精確的該近端語音檢測(cè)結(jié)果。
全文摘要
本發(fā)明提供一種網(wǎng)絡(luò)通信裝置,該網(wǎng)絡(luò)通信裝置播放經(jīng)由網(wǎng)絡(luò)接收的一遠(yuǎn)程聲音信號(hào),并經(jīng)由該網(wǎng)絡(luò)傳送一近端聲音信號(hào)至遠(yuǎn)程。在一實(shí)施例中,該網(wǎng)絡(luò)通信裝置包括一遠(yuǎn)程語音檢測(cè)模塊及一遠(yuǎn)程信道控制模塊。該遠(yuǎn)程語音檢測(cè)模塊檢測(cè)是否該遠(yuǎn)程聲音信號(hào)包含語音,以產(chǎn)生一遠(yuǎn)程語音檢測(cè)結(jié)果。若該遠(yuǎn)程語音檢測(cè)結(jié)果顯示該遠(yuǎn)程聲音信號(hào)不包含語音,則該遠(yuǎn)程信道控制模塊衰減該遠(yuǎn)程聲音信號(hào),以減少該遠(yuǎn)程聲音信號(hào)所包含的噪音。
文檔編號(hào)H04M7/00GK101207663SQ20071016791
公開日2008年6月25日 申請(qǐng)日期2007年10月26日 優(yōu)先權(quán)日2006年12月15日
發(fā)明者銘 張, 陸曉燕 申請(qǐng)人:美商富迪科技股份有限公司