專利名稱:移動音頻裝置的自動音量及動態(tài)范圍調(diào)整的制作方法
技術(shù)領(lǐng)域:
所揭示的實(shí)施例涉及移動音頻裝置的噪聲消除及自動音量調(diào)整。
背景技術(shù):
圖1 (現(xiàn)有技術(shù))為從語音信息移除噪聲及回聲的有源噪聲消除系統(tǒng)的圖表。第一 麥克風(fēng)MIC1 (被稱作語音參考麥克風(fēng))放置于接近所要語音源處。其拾取來自蜂窩式 電話的用戶的聲語音信息且將其轉(zhuǎn)換成電語音信號1。此語音信號1受到背景噪聲的污 染。第二麥克風(fēng)MC2 (被稱作噪聲參考麥克風(fēng))放置于接近噪聲源處或遠(yuǎn)離語音源處。 其拾取聲噪聲且將其轉(zhuǎn)換成電噪聲參考信號2。假定噪聲參考信號2與語音信號相比相 對地?zé)o所要語音信息。分離電路3使用噪聲參考信號來消除噪聲且將傳入信號分成語音 信號4及噪聲信號5。語音信號4相對地?zé)o噪聲。回聲消除涉及采用自適應(yīng)濾波器來模 擬回聲路徑。消除器6及7從由麥克風(fēng)MIC1及MIC2輸出的信號減去所產(chǎn)生的回聲信 號。存在在各種技術(shù)領(lǐng)域中實(shí)踐的許多此類有源噪聲消除技術(shù)及電路。
移動通信裝置(例如,蜂窩式電話)通常具有小物理尺寸。這些小尺寸限制有源噪 聲消除系統(tǒng)的多個麥克風(fēng)之間的距離。結(jié)果,噪聲參考信號通常并非無所要語音信息且 噪聲消除性能受到限制。簡單的有源噪聲濾波技術(shù)傾向于消除一些所要語音信號同時留 下一些未經(jīng)消除的噪聲。
已在數(shù)字助聽器中使用被稱作盲源分離(BSS)的較復(fù)雜的噪聲消減技術(shù)。在此種 BSS系統(tǒng)中,噪聲消除系統(tǒng)的兩個麥克風(fēng)位于助聽器用戶的耳朵中。因此,所述兩個麥 克風(fēng)中無一者可主要用于拾取噪聲。兩個麥克風(fēng)拾取語音以及待消除的噪聲。使用時間 反海畢安學(xué)習(xí)算法(temporal anti-Habbian learning algorithm)來分離噪聲與語音信息。 為獲得更多信息,參見M,吉洛拉米(M. Girolami)的"用于噪聲消除及信號分離的對稱 自適應(yīng)最大可會旨性估計(Symmetric Adaptive Maximum Likelihood Estimation For Noise Cancellation And Signal Separation)"(電子學(xué)快報(Electronics Letters), 33( 17): 1437-1438 (1997));及在日本京都(1996)舉行的關(guān)于信號處理的神經(jīng)網(wǎng)絡(luò)的正EE研討會(IEEE Workshop On Neural Networks for Signal Processing)上由K.托克拉(K. Torkkola)發(fā)表 的"基于信息最大化的巻積源的盲分離(Blind Separation Of Convolved Sources Based On Information Maximization)"。因?yàn)锽SS系統(tǒng)的性能大體上依賴于脈沖響應(yīng)對稱性及麥克風(fēng)的適當(dāng)放置,所以可應(yīng)用額外信號處理。
圖2 (現(xiàn)有技術(shù))為在一些蜂窩式電話中所采用的系統(tǒng)的圖表。在使用蜂窩式電話 時,蜂窩式電話用戶可收聽具有較柔和通路以及其它相對較大聲通路的音頻。如果用戶 正在嘈雜環(huán)境中收聽音頻,則背景噪聲可阻止用戶聽到較柔和通路。如果僅放大被供應(yīng) 到揚(yáng)聲器的總電信號,則較柔和通路將被放大以使得用戶可聽到較柔和通路,但較大聲 通路可接著被放大到發(fā)生削波的點(diǎn)。此削波將把不合需要的失真引入到從揚(yáng)聲器發(fā)出的 聲音中。大聲的聲音還可損傷用戶的耳朵。為防止此種不良削波及失真,在時域中追蹤 信號8的振幅。將信號放大為輸入振幅的函數(shù)的增益,使得如果信號較弱則將信號放大 較大增益值,而如果信號較強(qiáng)則將信號放大較小增益值。因此,壓縮了總信號的動態(tài)范 圍。此處理可被稱作"壓縮"或"音頻動態(tài)范圍控制"(ADRC)且發(fā)生于ADRC塊10中。
接著將被稱作自動音量控制(AVC) 11的處理應(yīng)用到ADRC塊IO的輸出。背景噪 聲的電平由麥克風(fēng)12及相關(guān)電路13檢測。在低背景噪聲條件下,經(jīng)壓縮的信號9無需 由AVC塊11放大且很大程度上未經(jīng)放大地供應(yīng)到揚(yáng)聲器。然而,在高背景噪聲條件下, 經(jīng)壓縮的信號9大體上由AVC塊11放大。歸因于由ADRC塊10執(zhí)行的壓縮,消減或 消除了對音頻的高振幅部分的削波。圖2的上述描述為簡化描述。參見美國專利第 6,766,176號以獲得更詳細(xì)描述。
發(fā)明內(nèi)容
一種移動音頻裝置(舉例來說,例如蜂窩式電話的移動通信裝置)執(zhí)行音頻動態(tài)范 圍控制(ADRC)以限制音頻信號的動態(tài)范圍。自動音量控制(AVC)接著應(yīng)用增益以 提升從所述ADRC輸出的信號的振幅。此放大在并不引入歸因于削波的實(shí)質(zhì)失真的情況 下發(fā)生。所得經(jīng)壓縮的音頻信號用以驅(qū)動移動音頻裝置的揚(yáng)聲器。所述經(jīng)壓縮的音頻信 號實(shí)際上通常經(jīng)由介入電路(例如,常規(guī)的數(shù)字模擬轉(zhuǎn)換器)而間接地驅(qū)動揚(yáng)聲器。
移動音頻裝置還執(zhí)行多麥克風(fēng)有源噪聲消除(MMANC)。在一個實(shí)例中,MMANC 用以從在移動音頻裝置的麥克風(fēng)上拾取的非噪聲音頻信息(例如,語音信息)移除背景 噪聲。所述非噪聲信息(例如,語音信息)經(jīng)轉(zhuǎn)發(fā)到空中接口以供從移動音頻裝置傳輸。 在執(zhí)行有源噪聲消除操作期間,所述MMANC處理產(chǎn)生噪聲參考信號作為中間信號。
移動音頻裝置操作時所處的環(huán)境可涉及具有相對恒定特性的靜態(tài)噪聲,及/或還可涉 及較快速地改變的非靜態(tài)噪聲。舉例來說,如果移動音頻裝置的用戶處在擁擠的房間中, 則背景談話可引入此非靜態(tài)噪聲。舉例來說,如果所述用戶正沿?zé)狒[的街道行走,則經(jīng) 過所述街道的車輛可引入此非靜態(tài)噪聲。在MMANC處理的一個實(shí)例中,由MMANC
6處理產(chǎn)生的噪聲參考信號經(jīng)相對快速地調(diào)整以指示此非靜態(tài)噪聲的存在或缺乏。所述噪 聲參考信號以將傳入麥克風(fēng)音頻樣本接收到MMANC處理中的近似速率而調(diào)整。有源噪 聲消除處理使得噪聲參考信號適當(dāng)?shù)刂甘驹肼暤拇嬖诨蛉狈?,即使在移動音頻裝置的用 戶正在說話且用戶的語音正由麥克風(fēng)拾取時。
在一個有利方面中,為在MMANC處理中所產(chǎn)生的中間信號的噪聲參考信號用以控 制ADRC及AVC處理。在一個實(shí)例中,噪聲參考信號經(jīng)縮放且經(jīng)濾波以產(chǎn)生控制信號。 所述控制信號為ADRC及AVC處理的AVC部分用以確定所述AVC部分應(yīng)用到ADRC 部分的輸出的增益的參考。所應(yīng)用的增益為所述控制信號的函數(shù)。
移動音頻裝置可為(例如)數(shù)字音頻播放器(例如,MP3播放器)、數(shù)字媒體播放 器(例如,具有圖像及視頻播放能力的iPOD)、數(shù)字相機(jī)、個人數(shù)字助理(PDA)、便 攜式個人計算機(jī)(例如,膝上型計算機(jī)),或移動通信裝置(例如,蜂窩式電話),或可 播放音頻的其它類似裝置。移動音頻裝置可能或可能不包括用于捕獲、存儲及/或傳輸在 麥克風(fēng)上拾取的音頻信息的能力。
在下文的詳細(xì)描述中描述額外方法及結(jié)構(gòu)。此概述并非意味著界定本發(fā)明。本發(fā)明 由權(quán)利要求書界定。
圖l (現(xiàn)有技術(shù))為多麥克風(fēng)有源噪聲消除系統(tǒng)的圖表。
圖2 (現(xiàn)有技術(shù))為涉及音頻動態(tài)范圍控制(ADRC)及自動音量控制(AVC)的 在一些蜂窩式電話中所采用的系統(tǒng)的圖表。
圖3為根據(jù)一個新穎方面的移動音頻裝置100的一個特定類型的高級塊圖。
圖4為說明在圖3的MSM集成電路101中執(zhí)行的功能的功能塊圖。
圖5為圖4的音量控制及揚(yáng)聲器補(bǔ)償功能塊122的一個實(shí)例的塊圖。
圖6為說明圖5的ADRC功能塊125的操作的曲線圖。
圖7為圖5的ADRC功能塊125的更詳細(xì)功能塊圖。
圖8為根據(jù)一個新穎方面的方法的流程圖。
具體實(shí)施例方式
圖3為根據(jù)一個新穎方面的移動音頻裝置100的一個特定實(shí)例的塊圖。在此實(shí)例中, 移動音頻裝置100為移動通信裝置,且更特定來說為蜂窩式電話。移動音頻裝置100包 括數(shù)字基帶集成電路101 (此處被稱作"移動臺調(diào)制解調(diào)器"或MSM)、第一射頻(RF) 收發(fā)器集成電路102、第二RF集成電路103、第一天線104、第二天線105,及將所述天線耦合到所述RF集成電路的一組其它離散組件。另外,移動音頻裝置IOO包括其它組件,例如,小鍵盤106、顯示器107、揚(yáng)聲器108,以及第一麥克風(fēng)109及第二麥克風(fēng)110。
從天線105接收到移動音頻裝置100上的電話談話信息的一般路徑經(jīng)過第一 RF集成電路102、跨越路徑111且到MSM 101的接收模擬數(shù)字轉(zhuǎn)換器(RXADC) 112中。如果信息為將在揚(yáng)聲器108上聽到的語音信息,則由MSM IOI上的數(shù)字電路(例如,調(diào)制解調(diào)器塊113、處理器114)將信息處理成經(jīng)語音編碼的數(shù)字值的流。經(jīng)語音編碼的數(shù)字值的流由音頻塊115中的適當(dāng)聲碼器解碼且將其轉(zhuǎn)換成接著被輸出以驅(qū)動揚(yáng)聲器108的模擬信號。如果電話談話的語音將由移動音頻裝置100的麥克風(fēng)拾取以經(jīng)由天線105傳輸?shù)诫娫捳勗挼牧硪粎⑴c者,則信息的路徑從麥克風(fēng)109及110延伸且到音頻塊115中。將信息轉(zhuǎn)換成數(shù)字形式,且音頻塊115中的適當(dāng)聲碼器將信息編碼成經(jīng)編碼的數(shù)字值的流。在由處理器114及調(diào)制解調(diào)器塊113處理之后,發(fā)射器數(shù)字模擬轉(zhuǎn)換器(TXDAC) 116將呈模擬形式的信息經(jīng)由路徑117輸出到第二RF集成電路103。信息經(jīng)過第二RF集成電路103、經(jīng)過離散功率放大器及其它電路且到天線105以供傳輸。
圖4為說明在圖3的MSM集成電路101中執(zhí)行的功能的功能塊圖。在圖3的音頻塊115中提供兩個模擬數(shù)字轉(zhuǎn)換器(ADC) 118及119。 ADC 118將從第一麥克風(fēng)109接收到的模擬信號數(shù)字化,而ADC 119將從第二麥克風(fēng)110接收到的模擬信號數(shù)字化。在圖3的音頻塊115中提供數(shù)字模擬轉(zhuǎn)換器(DAC) 120。如所說明,由DAC120輸出的模擬信號驅(qū)動揚(yáng)聲器108。圖4的圖表說明四個主要機(jī)構(gòu)或功能塊l)后端信號處理功能塊121; 2)音量控制及揚(yáng)聲器補(bǔ)償功能塊122; 3)多麥克風(fēng)有源噪聲消除(MMANC)功能塊123;及4)信號調(diào)節(jié)功能塊124。功能塊122還可被稱作"揚(yáng)聲器增益控制單元"。經(jīng)過塊122及120到揚(yáng)聲器108的音頻信號路徑有時被稱作"前向鏈路"。從麥克風(fēng)109及110經(jīng)過塊118、 119及123的音頻信號路徑有時被稱作"反向鏈路"。所述機(jī)構(gòu)或功能塊121、 122、 123及124中的每一者可以軟件、固件、專用硬件或其組合來實(shí)現(xiàn)。在一個實(shí)例中,將圖4的功能塊121、 122及123實(shí)現(xiàn)為在集成電路101中的一個或一個以上處理器上執(zhí)行的處理器可執(zhí)行指令集。處理器可執(zhí)行指令集存儲于集成電路101中的一個或一個以上相關(guān)聯(lián)處理器可讀媒體(例如,ROM或其它半導(dǎo)體存儲器)中。
圖4的音量控制及揚(yáng)聲器補(bǔ)償功能塊122執(zhí)行音頻動態(tài)范圍控制(ADRC)及自動音量控制(AVC)功能。因此,塊122包括ADRC功能塊125以及AVC功能塊126。
圖5進(jìn)一步詳細(xì)展示音量控制及揚(yáng)聲器補(bǔ)償功能塊122的一個特定實(shí)例。箭頭127表示從圖4的后端信號處理功能塊121傳遞到圖4的音量控制及揚(yáng)聲器補(bǔ)償功能塊122中的數(shù)字的經(jīng)脈沖編碼調(diào)制(PCM)的音頻信息值的流。箭頭128表示從圖4的音量控制及揚(yáng)聲器補(bǔ)償功能塊122傳遞到圖4的DAC 120的經(jīng)壓縮的數(shù)字音頻信息值的流。如圖5所說明,音量控制及揚(yáng)聲器補(bǔ)償功能塊122包括輸出濾波器129、固定增益邏輯130、ADRC (有時被稱作"壓縮器")125、 AVC126,及用戶音量設(shè)定邏輯131 。ADRC及AVC:
移動音頻裝置100可用于具有包括靜態(tài)噪聲及非靜態(tài)噪聲的高電平的背景噪聲的環(huán)境中??紤]移動音頻裝置100的用戶正收聽從揚(yáng)聲器108發(fā)出的聲音的情形。聲音的第一通路可相對柔和,因?yàn)閿?shù)字音頻信息值的流127中的值的對應(yīng)通路具有相對小的振幅。聲音的第二通路可相對大聲,因?yàn)閿?shù)字音頻信息值的流127中的值的對應(yīng)通路具有相對大的振幅。(術(shù)語"通路"在此處表示音頻的時間片或音頻信息值的流的其對應(yīng)部分,其中通路是在時域中獲取以使得通路中的一者在時間上是在另一者之前出現(xiàn)。)如果未執(zhí)行動態(tài)范圍控制且如果流127的兩個通路僅被轉(zhuǎn)換成模擬形式且用以驅(qū)動揚(yáng)聲器108,則用戶可歸因于高背景噪聲而難以聽到音頻的對應(yīng)柔和通路。另一方面,如果將兩個通路放大相同增益值以使得可較容易地聽到較低振幅通路,則相對較高振幅通路可被放大太多以致于發(fā)生削波。此種削波通常為不合需要的,因?yàn)槠鋵⑹д嬉氲綇膿P(yáng)聲器108發(fā)出的聲音中。
存在可用于圖4的音量控制揚(yáng)聲器補(bǔ)償塊122的不同實(shí)施例中的ADRC及AVC功能的多個不同變體。根據(jù)第一特定實(shí)例,對流127的數(shù)字值進(jìn)行濾波且將其乘以固定增益。在于塊125中接收到流時,ADRC 125追蹤所述流的振幅電平。ADRC 125將流的數(shù)字值乘以增益值,所述增益值為傳入流的振幅(經(jīng)由多個數(shù)字值所確定)的函數(shù)。
圖6為說明ADRC 125的操作的圖表。在本實(shí)例中,如果確定傳入振幅低于第一預(yù)定閾值T1,則應(yīng)用為零的增益。此有時被稱作"噪聲門"。優(yōu)選地,在此種情形下,揚(yáng)聲器108不輸出聲音。然而,如果傳入振幅在第一預(yù)定閾值T1與第二預(yù)定閾值T2之間,則隨著操作點(diǎn)從閾值T1沿著圖6的曲線圖中向上延伸的黑線移動到右邊,應(yīng)用不斷增長的增益。ADRC 125的此操作區(qū)域有時被稱作"擴(kuò)充"。如果傳入振幅在第二預(yù)定閾值T2與第三預(yù)定閾值T3之間,則應(yīng)用恒定增益。此恒定增益由圖6中的傾斜虛線的斜率指示。如果傳入信號的振幅高于第三閾值T3,則隨著操作點(diǎn)從閾值T3沿著黑線移動到右邊,應(yīng)用不斷減小的增益。ADRC 125的此操作區(qū)域有時被稱作"壓縮"。如果傳入信號的振幅高于第四閾值T4,則輸出"限于"MAX值。因此,以比傳入信號的高于T3的高振幅部分高的增益值來放大傳入信號的低于T3的低振幅通路。據(jù)稱信號127的總音頻信息的動態(tài)范圍由ADRC 125"壓縮"。所得經(jīng)增益調(diào)整的分量值組成經(jīng)壓縮的數(shù)字音頻信息值的流132。
自動音量控制(AVC) 126接著將增益應(yīng)用到流132,因此產(chǎn)生經(jīng)音量控制的數(shù)字值的流134。作為ADRC 125先前已限制音頻流的動態(tài)范圍的結(jié)果,在AVC功能塊126將流中的值放大所述增益時,用戶可較容易地從揚(yáng)聲器108聽到音頻的較柔和通路,而音頻的較大聲通路未被放大太多以致于發(fā)生實(shí)質(zhì)削波。消減或防止了歸因于削波的聲音失真。
在功能塊122的一個實(shí)例中,流127被分成多個頻帶。每一頻帶經(jīng)受單獨(dú)ADRC及AVC處理??舍槍Σ煌l帶將壓縮操作的各種參數(shù)(所應(yīng)用的增益值及預(yù)定振幅閾值)設(shè)定為不同的。替代存在一個控制信號133,信號調(diào)節(jié)塊124針對每一頻帶產(chǎn)生控制信號。頻帶的控制信號用作所述頻帶的AVC處理的參考。在每一頻帶的ADRC及AVC處理之后,將所有頻帶的AVC處理的輸出流組合以形成經(jīng)壓縮的數(shù)字音頻信息的單個流128。此流128經(jīng)過用戶音量設(shè)定邏輯、被轉(zhuǎn)換成模擬形式且供應(yīng)到揚(yáng)聲器。 一些音樂具有頻率相對低的強(qiáng)烈大鼓鼓點(diǎn)。通過將此大鼓鼓點(diǎn)的能量分離到其自身頻帶中,可將
傾向于使音樂的大鼓鼓點(diǎn)分量相對于音樂的其它分量放大較少的增益及閾值應(yīng)用到此頻帶。
圖4的ADRC及AVC功能塊的第二特定實(shí)例陳述于美國專利第6,766,176號中且更明確地說陳述于美國專利第6,766,176號中對圖8的上半部的論述中。圖5為此第二特定實(shí)例中的音量控制揚(yáng)聲器補(bǔ)償功能塊122的更詳細(xì)圖表。如美國專利第6,766,176號中所解釋,輸出濾波器129將數(shù)字值提供到固定增益邏輯130,固定增益邏輯130又將數(shù)字值乘以固定增益G,因此產(chǎn)生經(jīng)放大的數(shù)字樣本值。將經(jīng)放大的數(shù)字樣本值提供到ADRC功能塊125 。 ADRC功能塊125執(zhí)行壓縮且產(chǎn)生經(jīng)壓縮的數(shù)字音頻信息值的流132。AVC 126接收周期性更新的背景噪聲估計(BNE)控制信號133?;趯捎脙艨盏脑u估(如從接收自ADRC 125的Cthresh獲得且如從接收自塊131的當(dāng)前音量電平信號獲得)及BNE控制信號133, AVC 126將流132中的數(shù)字值乘以增益值。AVC 126輸出供應(yīng)到用戶音量設(shè)定邏輯131的經(jīng)音量控制的數(shù)字值的流134。移動音頻裝置100的用戶可使用用戶音量設(shè)定邏輯131來手動地設(shè)定揚(yáng)聲器音量電平,使得此后AVC 126將用戶所要揚(yáng)聲器音量電平作為目標(biāo)音量來控制揚(yáng)聲器音量。因此,用戶音量設(shè)定邏輯131將以適當(dāng)音量電平的經(jīng)數(shù)字化的語音樣本的流128提供到DAC 120。 DAC 120又將流128轉(zhuǎn)換成用于驅(qū)動揚(yáng)聲器108的模擬信號。
圖7為圖5的ADRC功能塊125的更詳細(xì)功能塊圖。參見美國專利第6,766,176號以獲得進(jìn)一步詳情。在由固定增益邏輯130放大之后,將數(shù)字值樣本x[n]提供到濾波器
10300 (濾波器300為任選的且在某些實(shí)施例中可省略)且提供到延遲元件301。延遲元件
301 (其可實(shí)施為FIFO)用于預(yù)測性地控制輸出信號電平,因此在傳輸之前增高(attack)峰值。濾波器300可為帶通濾波器。RMS計算器302確定樣本的RMS (均方根)電平。在一個實(shí)施例中,RMS計算器302為應(yīng)用到流數(shù)字值樣本的第一階低通濾波器。濾波器的時間常數(shù)經(jīng)選擇以使得所關(guān)注的最小頻率分量可針對給定平滑濾波器實(shí)現(xiàn)恒定RMS輸出。將RMS電平值供應(yīng)到對數(shù)計算邏輯303,其計算所述RMS電平值的以2為底的對數(shù)且將所述計算出的以2為底的對數(shù)值乘以0.5,因此產(chǎn)生以分貝(dB)為單位的輸出信號。將所述dB信號供應(yīng)到加法器/減法器304,其從所述dB信號減去壓縮閾值Cthresh。將所得dB信號提供到壓縮器邏輯305,其對所述信號執(zhí)行壓縮功能。將所得信號提供到乘法器306,其將所述信號乘以衰減(負(fù))壓縮斜率值Csl叩e。如果RMS電平升高到高于值Cthresh,則基于值Cslope將壓縮應(yīng)用到信號(具有適當(dāng)?shù)脑龈邥r間及釋放時間),所述值Cslope根據(jù)以下方程式將壓縮比R指定為dB的比率Cslope=l-l/R??蓪嚎s比R界定為高于其時實(shí)際上發(fā)生所有壓縮的RMS電平。應(yīng)根據(jù)正規(guī)化所要的平均dBmO談話者電平來選擇特定信號路徑的壓縮閾值Cthresh及壓縮斜率值Cslope。乘法器306將輸出dB信號提供到反對數(shù)計算邏輯307,其通過將值2升高到dB信號值(G,以dB為單位)的指數(shù)冪來計算dB信號的以2為底的反對數(shù)。反對數(shù)計算邏輯307產(chǎn)生輸出信號f[n]。將信號f[n]提供到增高/釋放時間應(yīng)用邏輯(attack/release time application logic) 308,其根據(jù)以下的方程式1來產(chǎn)生信號g[n]:
g[n]= (1-k) g[n-l]+kf[n] (方程式l)其中值k為平滑系數(shù)。
增高釋放時間應(yīng)用邏輯308應(yīng)用第一階平滑函數(shù)以提供平滑增益曲線以便應(yīng)用到輸出信號(值k依據(jù)是正應(yīng)用增高還是釋放而改變)??蓪⒃龈邥r間設(shè)定為一毫秒以快速地且精確地增高輸入樣本中的峰值??蓪⑨尫艜r間設(shè)定為在100毫秒與200毫秒之間以防止快速增益波動影響壓縮的質(zhì)量。將經(jīng)平滑的信號g[n]提供到第二乘法器309。延遲元件301將數(shù)字樣本值x[n]延遲時間D,從而產(chǎn)生經(jīng)延遲的輸出數(shù)字樣本值x[n-D]。將經(jīng)延遲的數(shù)字樣本值x[n-D]提供到第二乘法器309。第二乘法器309將經(jīng)延遲的樣本x[n-D]乘以平滑函數(shù)g[n],因此產(chǎn)生經(jīng)壓縮的數(shù)字音頻信息值的流132。
MMANC:
存在適合用于圖3的移動音頻裝置100中的執(zhí)行多麥克風(fēng)有源噪聲消除(MMANC)的多種不同方法。圖4說明一個特定實(shí)例。在圖4中,MMANC功能塊123從兩個麥克風(fēng)109及110接收信號,且執(zhí)行回聲消除及信號增強(qiáng)以產(chǎn)生噪聲參考信號135及語音參考信號136。隨后的處理產(chǎn)生很大程度上無背景噪聲的經(jīng)噪聲消除的麥克風(fēng)信號137。 信號137為數(shù)字值的流。將信號137供應(yīng)到后端信號處理功能塊121。功能塊121中的 適當(dāng)聲碼器將數(shù)字值語音編碼成經(jīng)語音編碼的值的對應(yīng)流。在由圖的調(diào)制解調(diào)器113及 處理器114處理之后,由TXDAC 116將經(jīng)語音編碼的值的流B8轉(zhuǎn)換成模擬信號。所 述模擬信號跨越路徑117傳送到RF集成電路103以供從天線105傳輸。
在圖4的MMANC功能塊123的特定實(shí)例中,來自麥克風(fēng)109的模擬輸出信號由模 擬數(shù)字轉(zhuǎn)換器118數(shù)字化成經(jīng)數(shù)字化的語音樣本值的所得流139。類似地,來自麥克風(fēng) 110的模擬輸出信號由模擬數(shù)字轉(zhuǎn)換器119數(shù)字化成經(jīng)數(shù)字化的語音樣本值的流140。 回聲消除器1功能塊141及回聲消除器2功能塊142為產(chǎn)生對流139及140中的回聲進(jìn) 行模擬的信號的自適應(yīng)數(shù)字濾波器。減法器143從流139減去經(jīng)合成的回聲信號。將數(shù) 字值的所得經(jīng)回聲消除的流139A供應(yīng)到盲源分離(BSS)信號增強(qiáng)功能塊145。類似地, 減法器144從流140減去經(jīng)合成的回聲信號。將數(shù)字值的所得經(jīng)回聲消除的流140A供 應(yīng)到盲源分離(BSS)信號增強(qiáng)功能塊145。盲源分離操作(在此項(xiàng)技術(shù)中有時還被稱 作獨(dú)立分量分析(ICA))使用時間反海畢安學(xué)習(xí)算法(temporal anti-Habbian learning algorithm)來產(chǎn)生噪聲參考信號135及語音參考信號136。為獲得額外信息,參見M-吉 洛拉米(M. Girolami)的"用于噪聲消除及信號分離的對稱自適應(yīng)最大可能性估計 (Symmetric Adaptive Maximum Likelihood Estimation For Noise Cancellation And Signal Separation)"(電子學(xué)快報(Electronics Letters), 33 (17): 1437-1438 (1997));及在 日本京都(1996)舉行的關(guān)于信號處理的神經(jīng)網(wǎng)絡(luò)的正EE研討會上由K'托克拉(K. Torkkola)發(fā)表的"基于信息最大化的巻積源的盲分離(Blind Separation Of Convolved Sources Based On Information Maximization),,。
非線性處理功能塊146首先在頻域中分解語音參考信號136及噪聲參考信號135以 獲得每一參考信號的多個不同頻譜分量(不同頻帶)。針對每一頻帶計算可變增益。在 一個實(shí)例中,所述可變增益由方程式(S-N)/S給出,其中S為頻帶中語音參考信號136 的量值,且其中N為頻帶中的噪聲參考信號135的量值。語音參考信號136頻帶含有一 些噪聲。所述可變增益經(jīng)應(yīng)用以進(jìn)一步消減語音參考信號的每一頻帶中的此噪聲。在已 將所述可變增益應(yīng)用到語音參考信號的每一單獨(dú)頻帶之后,將所得頻帶組合回成單個時 域信號147。
語音參考信號136通常含有具有語音信息的周期且還含有相對暫停(例如, 一句話 中的字之間的非語音暫停)的其它周期。話音活動檢測(VAD)決策信號148指示信號 136中是否存在語音或信號136中是否存在暫停。VAD決策信號148是基于在連續(xù)數(shù)字
12值的幀內(nèi)收集的信息。在一個實(shí)例中,幀為經(jīng)回聲消除的信號的八十個數(shù)字值,且VAD 信號148為單個位值。VAD決策每一幀更新一次。后處理功能塊149使用VAD決策信 號148。如果VAD決策信號指示存在語音,則后處理功能塊149應(yīng)用第一增益值(例如, 為l的增益),而如果VAD決策信號指示存在暫停,則后處理功能塊149應(yīng)用第二增益 值(例如,為0.5的增益)。從后處理功能塊149輸出的所得信號為經(jīng)噪聲消除的麥克風(fēng) 信號137。
在圖3的特定實(shí)例中,移動音頻裝置100為蜂窩式電話。因此,在麥克風(fēng)109及110 上拾取的非噪聲音頻信息被稱作"語音"信息。因此,圖4中的信號136被稱作"語音參考 信號"。然而,應(yīng)理解,移動音頻裝置100無需為蜂窩式電話。舉例來說,如果移動音 頻裝置100為數(shù)字音頻播放器(例如,MP3播放器),則由MMANC 123產(chǎn)生的中間信 號136更通常被稱作"音頻參考信號"。在數(shù)字音頻播放器的情況下,MMANC 123可不 輸出經(jīng)噪聲消除的麥克風(fēng)信號137,因?yàn)閿?shù)字音頻播放器可不出于記錄及存儲的目的而 獲取音頻信息。
對ADRC及AVC的控制
根據(jù)一個新穎方面,由圖4的自動音量控制AVC 126應(yīng)用的增益為由MMANC功 能塊123作為中間信號產(chǎn)生的噪聲參考信號135的函數(shù)。認(rèn)識到許多蜂窩式電話采用相 當(dāng)復(fù)雜的多麥克風(fēng)有源噪聲消除技術(shù)。這些技術(shù)的應(yīng)用導(dǎo)致將麥克風(fēng)拾取信號分成語音 參考信號及噪聲參考信號。替代使用由圖2的常規(guī)電路中的電路13所檢測的背景噪聲 的電平來控制AVC功能的增益,使用由多麥克風(fēng)有源噪聲消除功能性所產(chǎn)生的噪聲參 考信號來控制AVC功能的增益。在圖4的特定實(shí)例中,信號調(diào)節(jié)功能塊124接收噪聲 參考信號135且對所述噪聲參考信號135執(zhí)行縮放及數(shù)字濾波以產(chǎn)生控制信號133???制信號133為由MMANC功能塊123所檢測的背景噪聲的存在及量值的指示。控制信號 133快速地適于改變在麥克風(fēng)109及110上檢測到的非靜態(tài)噪聲。在圖4的實(shí)例中,以 將傳入音頻樣本接收到信號增強(qiáng)塊145中的近似速率而改變控制信號133???例如) 以傳入音頻樣本139A及140A的速率的一半而改變控制信號133。
圖8為由圖3的移動音頻裝置IOO執(zhí)行的新穎方法的流程圖。從麥克風(fēng)109及110 接收音頻信號(數(shù)字值樣本的流)(步驟200),且對所述音頻信號執(zhí)行多麥克風(fēng)有源噪 聲消除(MMANC)(步驟201),因此產(chǎn)生語音參考信號136、噪聲參考信號135,及經(jīng) 噪聲消除的麥克風(fēng)信號137。由功能塊121中的適當(dāng)聲碼器對所述經(jīng)噪聲消除的麥克風(fēng) 信號137進(jìn)行語音編碼(步驟202),且由TXDAC116將所述結(jié)果轉(zhuǎn)換成模擬信號。將 所得模擬信號跨越路徑117供應(yīng)到空中接口 (例如,CDMA空中接口、 WCDMA空中接口,或GSM空中接口)以供從移動音頻裝置100進(jìn)行無線RF傳輸。步驟200到202 可(例如)為由在蜂窩式電話上所采用的常規(guī)MMANC電路執(zhí)行的步驟。
從所述空中接口接收第二模擬信號(步驟203),由RXADC112將其轉(zhuǎn)換成數(shù)字形 式,由塊121中的聲碼器將其解碼成數(shù)字音頻信息值的流127。對所述流127執(zhí)行ADRC (步驟204),因此產(chǎn)生經(jīng)壓縮的數(shù)字音頻信息值的流132。對流132執(zhí)行AVC(步驟205)。 在一個新穎方面中,在AVC操作中應(yīng)用的增益為噪聲參考信號135的函數(shù)。信號調(diào)節(jié) 功能塊124處理噪聲參考信號135,因此產(chǎn)生控制信號133??刂菩盘?33用以控制AVC 功能塊126。由用戶音量設(shè)定邏輯131 (參見圖5)任選地對AVC功能塊126的輸出進(jìn) 行音量調(diào)整,由DAC 120將其轉(zhuǎn)換成模擬形式,且用以驅(qū)動圖4的揚(yáng)聲器108。據(jù)稱 AVC功能塊126的輸出是經(jīng)由常規(guī)的介入電路而間接地驅(qū)動揚(yáng)聲器108。
雖然出于指導(dǎo)性目的而在上文中描述某些特定實(shí)施例,但本發(fā)明不限于此。因此, 在不脫離如權(quán)利要求書中所陳述的本發(fā)明的范圍的情況下,可實(shí)踐對所述特定實(shí)施例的 各種特征的各種修改、改進(jìn)及組合。
權(quán)利要求
1.一種方法,其包含(a)執(zhí)行多麥克風(fēng)有源噪聲消除(MMANC)且因此產(chǎn)生音頻參考信號及噪聲參考信號;(b)對數(shù)字音頻信息值的流執(zhí)行音頻動態(tài)范圍控制(ADRC)且因此產(chǎn)生經(jīng)壓縮的數(shù)字音頻信息值的流;以及(c)對所述經(jīng)壓縮的數(shù)字音頻信息值的流執(zhí)行自動音量控制(AVC),其中所述AVC的增益為所述噪聲參考信號的函數(shù)。
2. 根據(jù)權(quán)利要求1所述的方法,其中(a)的所述MMANC、 (b)的所述ADRC及(c) 的所述AVC為通過在處理器上執(zhí)行指令而執(zhí)行的操作,且其中所述處理器為移動 音頻裝置的一部分。
3. 根據(jù)權(quán)利要求1所述的方法,其中由蜂窩式電話執(zhí)行所述方法,其中(a)的所述 MMANC還導(dǎo)致產(chǎn)生經(jīng)噪聲消除的麥克風(fēng)信號,其中所述經(jīng)噪聲消除的麥克風(fēng)信號 為數(shù)字值的流,所述方法進(jìn)一步包含對所述經(jīng)噪聲消除的麥克風(fēng)信號執(zhí)行聲碼器編碼功能。
4. 根據(jù)權(quán)利要求1所述的方法,其中(c)的所述AVC產(chǎn)生經(jīng)音量控制的數(shù)字值的流, 所述方法進(jìn)一步包含將所述經(jīng)音量控制的數(shù)字值的流轉(zhuǎn)換成模擬信號;以及 使用所述模擬信號來驅(qū)動揚(yáng)聲器。
5. 根據(jù)權(quán)利要求l所述的方法,其中(b)的所述ADRC涉及將增益應(yīng)用到所述數(shù)字 音頻信息值的流,其中所述增益為所述數(shù)字音頻信息值的流的振幅的函數(shù)。
6. 根據(jù)權(quán)利要求5所述的方法,其中所述函數(shù)包括噪聲門部分、擴(kuò)充部分、恒定增益 部分、壓縮部分及限制器部分。
7. 根據(jù)權(quán)利要求l所述的方法,其中在蜂窩式電話上執(zhí)行步驟(a)、 (b)及(c),且 其中所述音頻參考信號為語音參考信號。
8. 根據(jù)權(quán)利要求1所述的方法,其中在數(shù)字音頻播放器上執(zhí)行步驟(a)、 (b)及(c)。
9. '根據(jù)權(quán)利要求l所述的方法,其進(jìn)一步包含將(a)的所述噪聲參考信號轉(zhuǎn)換成控制值,且其中所述控制值至少部分地確定 (c)的所述AVC的所述增益。
10. 根據(jù)權(quán)利要求1所述的方法,其中(c)的所述AVC的所述增益為以下兩者的函數(shù).-1)所述噪聲參考信號,以及2)可用凈空量。
11. 一種集成電路,其包含-多麥克風(fēng)有源噪聲消除(MMANC)機(jī)構(gòu),其接收第一麥克風(fēng)信號及第二麥克風(fēng) 信號且輸出噪聲參考信號;音頻動態(tài)范圍控制(ADRC)機(jī)構(gòu),其接收數(shù)字音頻信息值的第一流且輸出數(shù)字 音頻信息值的第二流;以及自動音量控制(AVC)機(jī)構(gòu),其將所述數(shù)字音頻信息值的第二流放大一增益,其 中所述增益作為所述噪聲參考信號的函數(shù)而加以調(diào)整。
12. 根據(jù)權(quán)利要求11所述的集成電路,其中所述MMANC機(jī)構(gòu)執(zhí)行盲源分離(BSS) 且產(chǎn)生所述噪聲參考信號及語音參考信號兩者,其中所述語音參考信號相對地?zé)o噪 聲,且其中所述噪聲參考信號相對地?zé)o語音。
13. 根據(jù)權(quán)利要求11所述的集成電路,其中所述數(shù)字音頻信息值的第一流與所述數(shù)字 音頻信息值的第二流的關(guān)系由函數(shù)描述,其中所述函數(shù)包括噪聲門部分、擴(kuò)充部分、 恒定增益部分、壓縮部分及限制器部分。
14. 根據(jù)權(quán)利要求ll所述的集成電路,其中所述ADRC機(jī)構(gòu)為第一指令集與處理器的 組合,其中由所述處理器對所述第一指令集的執(zhí)行產(chǎn)生所述數(shù)字音頻信息值的第二 流。
15. 根據(jù)權(quán)利要求14所述的集成電路,其中所述AVC機(jī)構(gòu)為第二指令集與所述處理器 的組合,其中由所述處理器對所述第二指令集的執(zhí)行將所述數(shù)字音頻信息值的第二流放大所述增益。
16. 根據(jù)'權(quán)利要求11所述的集成電路,其中所述第一麥克鳳信號為以第一速率接收到 所述MMANC機(jī)構(gòu)上的數(shù)字值的流,且其中由所述MMANC機(jī)構(gòu)輸出的所述噪聲 參考信號由所述MMANC以近似所述第一速率的第二速率來調(diào)整。
17. —種設(shè)備,其包含用于控制作為噪聲參考信號的函數(shù)的增益的裝置,其中所述噪聲參考信號是使用 多麥克風(fēng)有源噪聲消除來產(chǎn)生,且其中所述增益被應(yīng)用到數(shù)字音頻信息值的流;以 及音頻動態(tài)范圍控制機(jī)構(gòu),其產(chǎn)生所述數(shù)字音頻信息值的流。
18. 根據(jù)權(quán)利要求17所述的設(shè)備,其中所述音頻動態(tài)范圍控制機(jī)構(gòu)為處理器與存儲于 處理器可讀存儲器中的指令集的組合,其中由所述處理器對所述指令集的執(zhí)行產(chǎn)生 所述數(shù)字音頻信息值的流。
19. 根據(jù)權(quán)利要求17所述的設(shè)備,其進(jìn)一步包含用于執(zhí)行所述多麥克風(fēng)有源噪聲消除且因此產(chǎn)生所述噪聲參考信號的裝置。
20. 根據(jù)權(quán)利要求17所述的設(shè)備,其進(jìn)一步包含用于執(zhí)行盲源分離(BSS)且因此產(chǎn)生所述噪聲參考信號的裝置。
21. 根據(jù)權(quán)利要求17所述的設(shè)備,其中所述設(shè)備為安置于移動裝置中的單個集成電路, 其中所述移動裝置取自由以下各項(xiàng)組成的群組數(shù)字媒體播放器、數(shù)字音頻播放器、 MP3播放器、個人數(shù)字助理、膝上型計算機(jī)、便攜式計算機(jī)、移動通信裝置及蜂 窩式電話。
全文摘要
一種移動音頻裝置(例如,蜂窩式電話、個人數(shù)字音頻播放器或MP3播放器)執(zhí)行音頻動態(tài)范圍控制(ADRC)(125)及自動音量控制(AVC)(126)以增加從所述移動音頻裝置的揚(yáng)聲器發(fā)出的聲音(127)的音量,使得音頻的微弱通路將為更可聽得見的。微弱通路的此放大在不過度地放大其它較大聲通路且無歸因于削波的實(shí)質(zhì)失真的情況下發(fā)生。舉例來說,使用多麥克風(fēng)有源噪聲消除(MMANC)(133)功能性從所述移動音頻裝置的麥克風(fēng)上拾取的音頻信息中移除背景噪聲。接著,可從所述裝置傳送所述經(jīng)噪聲消除的音頻。所述MMANC功能性產(chǎn)生噪聲參考信號作為中間信號。通過所述AVC處理對所述中間信號進(jìn)行調(diào)節(jié)且接著將其用作參考。在所述AVC處理期間所應(yīng)用的增益為所述噪聲參考信號的函數(shù)。
文檔編號H03G3/32GK101669284SQ200880013792
公開日2010年3月10日 申請日期2008年4月30日 優(yōu)先權(quán)日2007年4月30日
發(fā)明者佩 向, 埃迪·L·T·喬伊, 普拉加科特·V·庫爾卡尼, 松 王, 薩米爾·庫馬爾·古普塔 申請人:高通股份有限公司