專利名稱:音頻信號響度級的自動校正的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對包含至少兩個不同音軌的音頻輸出信號的增益進行調(diào)整的方法和系統(tǒng),這至少兩個不同音軌具有不同信號水平范圍。
背景技術(shù):
在本領(lǐng)域中,已知有許多不同的包含音樂和/或語音的音頻信號源。音樂信號可被存儲在CD、DVD或任意其它的存儲介質(zhì)中。尤其是隨著例如MPEG的新壓縮方案的發(fā)展, 具有不同的風(fēng)格和表演者的音頻信號被保存在存儲介質(zhì)上,并可被組合成要播放給用戶的播放列表。尤其是在車輛環(huán)境中,乘客感受到的音頻信號包括音頻信號本身和道路輪胎噪聲、空氣動力噪聲和發(fā)動機噪聲。不同音頻源的不同音頻信號通常具有不同的信號和動態(tài)壓縮水平。經(jīng)常地,音頻輸出信號的不同音軌具有不同信號水平范圍,被用戶感知到時具有不同的響度級。尤其是在車輛環(huán)境中,所接收的音頻信號對于用戶應(yīng)該是能感知到的,這意味著所接收的音頻信號必須超過車輛中存在的噪聲。同時總音頻信號水平不應(yīng)超過一定的水平,如果超過該水平則會對用戶產(chǎn)生聽覺損害或使用戶感覺疼痛。而且,在車輛環(huán)境中,環(huán)境噪聲很大程度上取決于車輛的速度。
發(fā)明內(nèi)容
因此,存在允許在不同駕駛條件下對車輛中音頻信號的響度水平進行動態(tài)自動校正的需求。這種需要可由獨立權(quán)利要求的特征滿足。在從屬權(quán)利要求中,描述了本發(fā)明的實施例的優(yōu)選實施例。依據(jù)本發(fā)明的第一方面,提供了用于對包含至少兩個不同音軌的音頻輸出信號的增益進行調(diào)整方法,這至少兩個不同音軌具有不同信號水平范圍。該方法包括基于人類聽覺的心理聲學(xué)模型動態(tài)地確定音頻輸入信號的感知響度。額外地,動態(tài)地確定增益確定單元輸出的音頻輸出信號的增益,該增益確定單元接收所確定的響度并輸出音頻輸出信號, 其中增益被確定成使得音頻輸出信號的所述至少兩個音軌被輸出時在預(yù)定的信號水平范圍內(nèi)。而且,音頻輸出信號被輸出到一個空間中,該空間中的環(huán)境噪聲被估算,并且確定由增益確定單元確定的增益影響音頻輸出信號的程度。然后基于估算的環(huán)境噪聲確定增益確定單元影響音頻輸出信號的程度。如果環(huán)境噪聲非常低,例如,當(dāng)車輛靜止或以非常低的速度行駛時,并不絕對地需要由增益確定單元進行的增益調(diào)整。但是,在較高的車輛速度下, 動態(tài)確定的增益調(diào)整將更為有用,因為信號水平應(yīng)該足夠高,以便能被用戶感知到,但是不能太高。通過自動地調(diào)整輸出信號水平,使得不同音軌在輸出時在預(yù)定范圍內(nèi),對于不同音軌可獲得一個相等的響度。而且,用戶不再需要對音量進行調(diào)節(jié)。尤其避免了對具有高信號聲壓級SPL的音軌或音頻信號的音量的減弱,還避免了在具有相當(dāng)?shù)偷男盘柭晧杭壍囊纛l信號的情況下對音量的增加。因此,所有不同的音頻信號源可能具有相等的響度,同時還能保留該音頻信號的動態(tài)結(jié)構(gòu)。
可通過單獨使用所述心理聲學(xué)模型或者結(jié)合使用所述心理聲學(xué)模型與音頻輸入信號的信號統(tǒng)計來確定響度。估算環(huán)境噪聲的一種可能方法是確定在其中輸出音頻信號的車輛的車輛速度,并由確定的車輛速度推導(dǎo)出環(huán)境噪聲。在該實施例中,不需要經(jīng)由麥克風(fēng)來精確測量環(huán)境噪聲,環(huán)境噪聲可從車輛速度中推導(dǎo)出。但是,應(yīng)該理解的是作為備選的,麥克風(fēng)也可被用于估算環(huán)境噪聲。麥克風(fēng)信號于是可被單獨使用或與車輛速度相結(jié)合以估算環(huán)境噪聲。在一個實施例中,如果估算的環(huán)境噪聲比預(yù)定閾值低,則音頻輸出信號有可能根本沒有受到增益確定單元影響。當(dāng)例如由車輛速度確定的環(huán)境噪聲為低時,則可不需要由增益確定單元來調(diào)整增益,并且可使用如音頻源提供的信號水平范圍輸出音頻輸出信號。 而且,隨著環(huán)境噪聲的增加,即隨著車輛速度的增加,增大動態(tài)確定的增益影響音頻輸出信號的程度是可能的。這意味著車輛速度越高,增益確定單元對輸出信號的信號水平或響度范圍的影響越大。依據(jù)優(yōu)選的實施例,本方法包括確定所述至少兩個不同音軌之間的暫?;蛞粋€音軌內(nèi)的暫停的步驟,在該暫停中噪聲是占主導(dǎo)的音頻輸入信號。當(dāng)檢測出這樣的具有噪聲的暫停時,減少在確定的暫停中的增益,以便避免噪聲的放大。在本發(fā)明的一個實施例中, 通過使用對如正在收聽音頻輸入信號的收聽者所感知的音頻輸入信號的空間感知的模擬來基于雙耳定位模型確定所述輸入信號是否能夠被定位,以在音頻輸入信號中檢測出噪聲。如果能夠使用所述人類聽覺的心理聲學(xué)模型定位音頻輸入信號,則該音頻輸入信號不能被當(dāng)作噪聲。但是,如果音頻輸入信號不能被定位,則該音頻輸入信號被當(dāng)作是主要包含噪聲。結(jié)果,可避免增加僅包含噪聲的音頻信號的響度。優(yōu)選地,如果檢測到超過預(yù)定時間段(例如IO-IOOms之間,優(yōu)選地在50ms左右)內(nèi)的暫停,為該暫停減少增益。因此,只有在長于例如50ms的時間內(nèi)檢測到暫停,增益才被降低,以便避免在非常短的不包含音樂信號時期的音軌中降低增益。但是如果音頻輸入信號包含更多的信息并且該輸入信號水平很低,則因此應(yīng)該通過以使得音頻輸出信號覆蓋預(yù)定的信號水平范圍的方式增加增益,來調(diào)整該增益。因此,通過對增益進行控制來降低具有太高的音頻輸入水平的音頻輸入信號,使得預(yù)定的信號水平范圍被覆蓋,并且如果輸入音頻水平太低,則該增益被提高,以便覆蓋相同的信號水平范圍。對于基于輸入信號的定位能力的暫停檢測可使用定位模型。該定位模型可額外地被用于估計響度。正常地,以多個塊的方式處理音頻信號,與對每個采樣進行處理相比節(jié)省了處理時間。依據(jù)本發(fā)明的一個實施例,每個塊的增益通過使用時間常數(shù)來確定,該時間常數(shù)描述了從一個信號塊到下一個塊的響度改變。在該實施例中,提升時間常數(shù)被用于描述在兩個連續(xù)的塊之間的上升的信號響度,而下降時間常數(shù)被用于描述在兩個連續(xù)的塊之間的下降的響度。一個塊包含一個或若干個數(shù)字音頻輸入信號的信號采樣。優(yōu)選地,時間常數(shù)被配置成,使得與下降時間常數(shù)允許響度下降相比,提升時間常數(shù)允許更快的響度增加。信號暫停之后的新音軌開始處需要快速的響度增加,此處需要從一個塊到另一個塊突然地增加響度。兩個塊之間響度下降的較低的可能性允許保持在該音頻信號中最初包含的增加的響度的動態(tài)。優(yōu)選地,時間常數(shù)是自適應(yīng)時間常數(shù),其中該自適應(yīng)時間常數(shù)被調(diào)整成,使得允許時間常數(shù)在音軌開始處,比稍后的音軌期間改變得更快。這使得在音軌開始處響度能夠被快速調(diào)整,并仍然有助于保持例如在音樂的音軌中的音頻信號中包含的動態(tài)。尤其地,在包含古典音樂的音樂音軌中,應(yīng)該保持和信號中最初包含的一樣的信號水平的動態(tài)。優(yōu)選地,當(dāng)兩個音軌之間檢測到暫停時,重置自適應(yīng)時間常數(shù)。音頻信號源的一些用戶可能喜歡保持原始音頻信號的動態(tài)范圍而不對增益進行調(diào)整以達到適合的響度。此外,音頻輸入信號在被輸出之前可被延遲,該延遲與對調(diào)整增益進行確定所需的時間相對應(yīng)。這種延遲可以是恒定的,或可以隨調(diào)整增益的計算而改變。本發(fā)明還涉及如上描述的那樣調(diào)整增益的系統(tǒng),該系統(tǒng)包括響度確定單元,該響度確定單元基于人類聽覺的心理聲學(xué)雙耳模型,并最終基于音樂輸入信號的信號統(tǒng)計,或者基于兩者的結(jié)合,動態(tài)地確定音頻輸入信號的響度。在接收所確定的響度的系統(tǒng)中提供了增益確定單元,該增益確定單元輸出具有調(diào)整增益的音樂輸出信號,其中該增益確定單元動態(tài)地確定音樂輸出信號的增益,使得音頻輸出信號的至少兩個音軌以覆蓋預(yù)定的信號水平范圍的方式被輸出。本系統(tǒng)此外還包括環(huán)境噪聲估算單元,該環(huán)境噪聲估算單元被配置成對音頻輸出信號被輸出到的空間中的環(huán)境噪聲進行估算。而且,提供了增益控制單元,該增益控制單元被配置成確定由增益確定單元確定的增益影響音頻輸出信號的程度,其中該增益控制單元確定音頻輸出信號被增益確定單元基于估算出的環(huán)境噪聲所影響的程度。正如在聯(lián)系以上本發(fā)明的方法描述的那樣,環(huán)境噪聲估算器可使用車輛速度來估算環(huán)境噪聲。如果環(huán)境噪聲低于預(yù)定閾值,則增益控制單元可禁止增益確定單元的影響。音頻分析單元,如以上提及的那樣,通過分析對輸入信號進行定位的可能性,或通過使用信號統(tǒng)計確定暫停。該音樂分析單元試圖使用輸入信號空間調(diào)整的模擬來定位音頻輸入信號。在EP 1 522 868 Al中描述了如何使用如收聽者感知的那樣的音樂輸入信號空間感知進行定位的一個實施例。定位的進一步的細(xì)節(jié)可參考此文檔。進一步的細(xì)節(jié)也可以在Wolfgang Hess等人于2003年 10月,在Audio Engineering Society Convention Paper 5864,115thConvention 中發(fā)表的 “Acoustical Evaluation of Virtual Rooms by Means of Binaural Activity Patterns”中找到。對于信號源的定位可參考由W. Lindemann在 Journal of Acoustic Society of America,1986 年 12 月,p. 1608-1622,Vol. 80 (6)的 "Extension of a Binaural Cross-Correlation Model by Contralateral Inhibition. I. Simulation of Lateralization for Stationary Signals”。音頻分析單元如上所述那樣確定自適應(yīng)時間常數(shù),并在檢測到暫停時對這些自適應(yīng)時間常數(shù)進行重置。可通過使用上面提到的暫停檢測來識別不同音軌的內(nèi)容,來將音頻信號的不同音軌分隔開。而且,可能存在延遲單元,在音頻輸入信號伴隨著被控制的增益被輸出之前,將延遲時間引入音頻輸入信號。該延遲元件引入了與確定調(diào)整增益所需的延遲時間相對應(yīng)的延遲。
將參考附圖更詳細(xì)地描述本發(fā)明,其中圖1示意性地示出了車輛內(nèi)的聲音分量,包含噪音和音頻分量;圖2示出了音頻輸入信號與無增益調(diào)整的估計響度的示例,包括不同的時間常量以平滑響度,即,對增加響度的快速反應(yīng)和在減少響度級處的延遲反應(yīng);圖3示出了音頻輸入信號的動態(tài)水平調(diào)節(jié),如應(yīng)該為自動響度調(diào)節(jié)進行調(diào)節(jié)一樣,當(dāng)已知整個信號內(nèi)容時進行理想地校正,12個平均響度線被示出;圖4示意性地示出了用于調(diào)整音頻輸出信號增益的系統(tǒng);圖5示出了被用于確定音頻輸入信號響度的音頻分析單元的更詳細(xì)的視圖;圖6示意性地示出了向音頻信號引入時間常數(shù),表現(xiàn)為從一個塊到另一個塊的增益改變;圖7示出了不具有以及具有自動響度調(diào)整的音頻輸入信號水平;圖8示出了在自動響度調(diào)整之前和之后,音頻輸入信號的另一個示例。
具體實施例方式從圖1可以看出,取決于使用的車輛,乘車者感知到不同的環(huán)境噪聲。車輛聲音信號包括噪聲分量10和音頻信號分量20。噪聲信號分量10可歸因于道路輪胎噪聲、空氣動力噪聲或發(fā)動機噪聲。在圖1的右側(cè)部分中,指示了不同車輛的噪聲,該噪聲取決于車輛速度。曲線11描述了在跑車或運動型車中產(chǎn)生的噪聲,而曲線12示出了 SUV的與速度相關(guān)的噪聲。正如所看到的,噪聲可具有在60到85dB SPL(信號聲壓級)之間的值。由于聽力痛苦閾值在120dB SPL周圍,音頻信號分量的范圍在20-40dB SPL之間。在圖2的上圖部分中,以滿刻度示出了音頻輸入信號的信號水平,表示OdB滿刻度(OdBre)被分配到數(shù)字域最大可能的信號水平,dB滿刻度表示相對于滿刻度的分貝。正如從圖2的上圖部分可以看出的,信號水平變化地相當(dāng)大,并因此使得被使用者感知的對應(yīng)于該信號的響度級也變化地相當(dāng)大。在圖2的下圖部分,相應(yīng)的響度被從信號輸入水平中 古i十出,$ ITU—R BS. 1770-1 ( "Algorithms to Measure Audio Program Loudness and to a Peak Audio Level")的建議中描述了一種響度估計的可能方法。在本申請中,響度可通過雙耳定位模型(binaural localization model)估計。如果如圖2示出的聲音信號在車輛中向使用者播放,該音頻信號的一些部分可能會被感知到具有令人不快的響度,而音頻信號的其它部分可能被認(rèn)為太低而不能被使用者正確地感知。在圖3中示出了圖2中的信號被理想地調(diào)節(jié)后的水平。作為示例,為了讓使用者良好地感知到,在范圍21中的信號采樣應(yīng)被調(diào)整成較低的信號水平,而在范圍22中的信號應(yīng)被調(diào)整成較高的信號水平。相似地,范圍23中的信號將以強烈減弱的信號水平被輸出。在圖3的下圖部分中,示出了上圖部分的對應(yīng)的經(jīng)理想調(diào)節(jié)的水平的估計響度。 當(dāng)比較圖2的下圖部分與圖3的下圖部分時,可推導(dǎo)出圖3示出的響度估計值優(yōu)于圖2中示出的響度估計值。圖3的響度估計值可比圖2的響度估計值感知的感覺更好。在此得到了并形像化了平滑的、相對恒定的響度。圖4中示出了一種系統(tǒng),使用該系統(tǒng)可如同圖3的實施例中示意性示出的那樣對響度進行調(diào)整。所示的系統(tǒng)包括音頻信號分析單元30,其中使用人類聽力的心理聲學(xué)定位模型并使用信號統(tǒng)計確定音頻輸入信號,例如娛樂音頻信號的響度。該音頻輸入信號19被輸入到包括增益控制單元41和延遲元件42的信號控制器40。通過使用用戶界面50控制由增益控制確定的增益,在用戶界面50能夠確定在被經(jīng)由揚聲器60輸出或被饋給后處理級之前,由增益確定單元確定的增益是否被用于音頻輸出信號19,或以哪種程度被用于音
7頻輸出信號19。娛樂或音頻輸入信號可以是2. 0、1. 5或7. 1倍的作為音頻信號18輸入音頻信號分析單元和信號控制器40中的音頻信號或另一種格式。在信號分析單元30中,象征性地示出響度是基于人類聽覺心理聲學(xué)模型并基于信號的統(tǒng)計確定的。心理聲學(xué)模型被用于估計響度、聲音定位,并被用于確定噪音是否在音頻輸入信號中作為主導(dǎo)因素存在,例如暫停期間或兩個音軌之間。信號統(tǒng)計是確定或估計響度以及確定在該音頻信號中是否存在具有噪聲的暫停的第二基礎(chǔ)。作為示例,可確定該娛樂音頻信號的信號強度。單獨地基于心理聲學(xué)模型或基于心理聲學(xué)模型與統(tǒng)計信號模型的結(jié)合,響度的適配通過將在下面詳細(xì)描述的動態(tài)確定自適應(yīng)時間常量來確定。在圖5中,示出了音頻信號分析單元30的更詳細(xì)的視圖。該音頻信號分析單元包括對接收音頻輸入信號的響度進行估計的響度確定單元31。該響度確定單元31可使用本領(lǐng)域公知的方法和如在ITU-R BS 1770-1中描述的其他方法來確定響度。該響度確定單元可進一步使用人類聽力的雙耳模型,該人類聽力的雙耳模型用于在聽到音頻輸入信號18 時確定響度并用于確定該音頻輸入信號18是否可被用戶定位以及被定位在何處。該雙耳模型模擬音頻輸入信號的空間感知,并允許確定該音頻輸入信號是否主要包含噪聲或例如音樂或語音的任何其它輸入信號。在本申請前面提到的文件中,主要在EP 1 522 868 Al, W. Lindemann 的文件中或在上面提到的 Audio Engineering Society Convention Paper 5864中,更詳細(xì)地描述了對音頻輸入信號的定位。這種定位技術(shù)允許區(qū)分噪音和其它聲音信號,并有助于在音頻輸入信號中僅檢測出噪聲時避免該噪聲經(jīng)過增加的增益被輸出。還允許在檢測出暫停時重置自適應(yīng)時間常數(shù)。該響度確定單元使用人類聽覺的心理聲學(xué)模型對音頻輸入信號的響度進行估計。而且,響度確定單元31可額外地使用統(tǒng)計信號處理,以便估計該音頻輸入信號的響度或檢測信號的暫停。在音頻輸入信號統(tǒng)計分析中,確定了音頻輸入信號的不同采樣的實際信號水平。作為示例,如果該輸入信號的若干連續(xù)采樣的信號水平符合高斯分布,可推論出所處理的采樣只包含噪聲而不含其它音頻信號。然后音頻信號分析單元使用響度估計的結(jié)果,以便計算被引入到音頻輸入信號中的時間常數(shù)。在圖5中,時間常數(shù)的計算由時間常數(shù)生成器32代表。音頻信號分析單元30進一步包括調(diào)整該音頻輸出信號17的增益的增益確定單元 35。響度確定單元31通過發(fā)出dB響度等值(dBLEQ)提供了一定部分的音樂輸入信號,例如包含若干采樣的塊的響度。該增益確定單元具有預(yù)定的信號水平或任意其它信號水平閾值,該預(yù)定的信號水平為當(dāng)輸出例如圖7和圖8的下圖部分示出的_12dB的音頻信號時應(yīng)該滿足的信號水平。在增益確定單元中,從要獲得的平均信號水平中減去確定出的響度,以便計算增益。作為示例,如果確定出的響度對應(yīng)于_5dB,并且如果目標(biāo)為-12dB滿刻度,則必須據(jù)此通過降低增益來調(diào)整增益,以便具有約-12dB的平均信號水平。在圖6中示出了由時間常數(shù)沈分隔開的音頻輸入信號的不同的采樣25。該時間常數(shù)26說明了從一個采樣到下一個采樣應(yīng)該如何調(diào)整響度。該時間常數(shù)可以是提升時間常數(shù)或下降時間常數(shù)。提升時間常數(shù)說明從一個采樣到下一個采樣信號增益如何被增加, 反之下降時間常數(shù)說明從一個采樣到下一個采樣增益減少。時間常數(shù)26是以使得提升時間常數(shù)可比下降時間常數(shù)更迅速地被調(diào)整的方式確定的。作為示例,如果在兩個音軌之間或在一個音軌內(nèi)確定出信號暫停,則不應(yīng)增加音頻信號水平以便避免噪聲的放大。當(dāng)新的音軌開始時,在非常低的信號水平之后可能立即出現(xiàn)高信號水平。因此必須對響度估計的提升時間常數(shù)進行調(diào)整,以便避免新音軌開始處的信號水平被大大增加。在音頻信號水平減少情況下的下降時間常數(shù)只允許與信號水平的增加相比信號水平較慢地減少。而且,時間常數(shù)為自適應(yīng)時間常數(shù),表示音軌越長,時間常數(shù)反應(yīng)越慢。對于提升和下降時間常數(shù), 這可能是有效的。經(jīng)平滑的響度估計還保證了和人類感知響度的方式一樣的響度估計。尖峰和凹谷(dips)被人類聽覺系統(tǒng)平滑掉。時間常數(shù)隨著音頻音軌的時間增加而更慢地變化,有助于保持該音頻信號的動態(tài)。但是,也在到達音樂信號的長運行時間時,對增加的響度的較短的反應(yīng)時間保證了對較快信號增長的適當(dāng)反應(yīng)。在圖6的下圖部分中,示出對于音樂信號隨時間過去的增益增長和增益下降。對于音樂采樣的第一塊61,第一增益被確定為所示出的那樣。對于隨后的信號塊62,確定其具有增加的增益,隨后的信號塊63具有輕微下降的增益。基于使用時間常數(shù)的響度調(diào)整, 確定了每個塊的增益,即每個塊的目標(biāo)增益。于是塊η的目標(biāo)增益實現(xiàn)為從前一個塊n-1 的目標(biāo)增益開始的線性斜坡。如果確定了在一個音軌中或兩個音軌之間有暫停,可重置時間常數(shù)。在信號分析單元30中執(zhí)行的暫停檢測或音軌檢測由暫停檢測單元33和音軌檢測單元34代表。在圖5 的實施例中,響度確定單元31、時間常數(shù)生成器32、暫停和音軌檢測單元33和34以及增益確定單元35被示為分開的單元。但是,對于本領(lǐng)域技術(shù)人員來說應(yīng)該清楚的是,不同的單元可被合并為更少的單元,并且這些單元可被組合成若干個單元或甚至成為一個單元。而且,信號分析單元可通過硬件元件或軟件或硬件和軟件的組合來設(shè)計。參考圖4,信號分析單元的信號輸出17被輸入到增益控制單元41,增益控制單元 41如下面將進一步解釋的那樣控制音頻輸入信號的增益。信號分析單元的信號輸出17被輸入到增益控制單元41中,該增益控制單元41正如將在下面進一步描述的那樣對音頻輸入信號的增益進行控制。此外,信號控制單元40包括延遲元件,該延遲元件將在信號分析單元中確定增益所需要的延遲引入音頻輸入信號18。延遲元件有助于確保由信號分析單元 30處理的信號實際被對應(yīng)于音頻信號的正確的時間常數(shù)控制,正確的時間常數(shù)對于該音頻信號被確定。增益控制單元41有助于確定由增益確定單元35確定的增益的多少數(shù)量實際影響信號輸出水平。為實現(xiàn)這種結(jié)果,提供了對車廂內(nèi)的環(huán)境噪聲進行估算的噪聲估算器50。正如由圖1可以看出的,車輛速度很強地影響了車廂內(nèi)的噪聲。如果車輛以非常低的速度行駛或處于靜止?fàn)顟B(tài),則可考慮不需要由增益確定單元確定的增益調(diào)整。如果音樂輸出信號根本不應(yīng)該受到增益確定單元的影響,意味著單元60中確定的校正沒有被用于輸出,則增益控制單元可將因子設(shè)置為0%,通過該因子,輸出信號受到在單元30中執(zhí)行的計算的影響。噪聲估算器50可接收車輛速度并可訪問表格51,在該表格中提供了車輛速度和噪聲之間的關(guān)系。該表格可以是由車輛制造商設(shè)定的預(yù)定義表格。一般,駕駛員應(yīng)該不能更改在表格51中給定的值。但是,在該表格中給定的值可以例如通過軟件工具來修改,利用該軟件工具可調(diào)節(jié)聲音的設(shè)置。當(dāng)車輛速度較高時,環(huán)境噪聲也可能如圖1所示那樣在SOdB(A)。 在該示例中,如果不應(yīng)超過105dB (A)的閾值,則只有25dB (A)保留下來。由于環(huán)境噪聲為 SOdB(A),音頻輸出信號的響度可被增益確定單元如上所述那樣動態(tài)地確定。增益確定單元可基于環(huán)境噪聲確定在0%和100%之間的因子,該百分比描述了應(yīng)該如上面描述那樣調(diào)整響度的多少量。在所示的實施例中,車輛速度是確定環(huán)境噪聲的唯一變量。但是,其它因素(比如由麥克風(fēng)(未示出)確定的環(huán)境噪聲)可被單獨使用或與車輛速度相結(jié)合使用。圖7中示出了自動響度調(diào)整的第一個示例。在圖7的上圖部分中,示出了響度估計之前的音頻輸出信號18。正如可由該音頻輸入信號的兩個聲道看出的,該輸入信號覆蓋了不同的輸入水平范圍。最大輸入水平可為OdB滿刻度。在圖7的下圖部分中,示出了在響度估計和增益調(diào)整后的音頻輸出信號19。正如可從圖7的下圖部分看出的,平均信號水平被設(shè)定為_12dB滿刻度。同時保留了該音頻信號的動態(tài)結(jié)構(gòu)。圖8中示出了另一個示例,其中輸入水平具有_20dB滿刻度的最大輸入水平。在圖8的下圖部分,示出了在響度估計和增益估計之后的音頻輸出信號19。再次保留了動態(tài)結(jié)構(gòu),并且平均信號水平再次為_12dB滿刻度。如果圖7和圖8的上圖部分中示出的輸入信號被輸出給使用者,該使用者必須頻繁地調(diào)節(jié)音量,以便避免信號水平太高而令人不快, 并對收聽的信號水平太低的音頻信號部分的信號進行增加。通過本申請的使用,由于系統(tǒng)對響度進行了估計,并且在輸出之前自動地且動態(tài)地調(diào)整了增益,用戶將不再需要這種頻繁的音量調(diào)節(jié)。
權(quán)利要求
1.一種方法,用于對包含至少兩個不同音軌的音頻輸出信號的增益進行調(diào)整,該至少兩個不同音軌具有不同信號水平范圍,該方法的步驟包括-基于人類聽覺的心理聲學(xué)模型,動態(tài)地確定音頻輸入信號的感知響度,-動態(tài)地確定由增益確定單元(35)輸出的音頻輸出信號的增益,該增益確定單元(35) 接收感知響度并輸出具有確定的增益的音頻輸出信號,其中,以使得所述音頻輸出信號的至少兩個音軌是覆蓋預(yù)定的信號水平范圍或響度范圍的輸出的方式確定增益,-估算所述音頻輸出信號被輸出的空間中的環(huán)境噪聲;以及_確定由所述增益確定單元確定的增益影響所述音頻輸出信號的程度,其中基于估算出的環(huán)境噪聲確定音頻輸出被所述增益確定單元影響的程度。
2.如權(quán)利要求1所述的方法,其中,如果估算出的環(huán)境噪聲低于預(yù)定閾值,則所述音頻輸出信號不受所述增益確定單元確定的增益的影響。
3.如權(quán)利要求1或2所述的方法,其中通過確定車輛速度來估算所述環(huán)境噪聲,從該車輛速度中推導(dǎo)出所述環(huán)境噪聲。
4.如前述權(quán)利要求中的任一項所述的方法,其中所述動態(tài)確定的增益影響所述音頻輸出信號的程度隨著估算出的環(huán)境噪聲的增大而增大。
5.如前述權(quán)利要求中的任一項所述的方法,其中音頻輸入和輸出信號的每個音軌包括連續(xù)的音樂信號塊,其中每個塊的響度通過使用時間常數(shù)來確定,該時間常數(shù)描述了從一個塊到下一個塊的響度改變。
6.如權(quán)利要求5所述的方法,其中提升時間常數(shù)被用于描述在兩個連續(xù)塊之間升高的響度,而下降時間常數(shù)用于描述在兩個連續(xù)塊之間下降的響度,其中所述時間常數(shù)被配置成使得,與下降時間常數(shù)允許的響度下降相比,提升時間常數(shù)允許更快的響度增加。
7.如權(quán)利要求5或6所述的方法,其中所述時間常數(shù)為自適應(yīng)時間常數(shù),其中該自適應(yīng)時間常數(shù)被調(diào)整成,使得在音軌開始處,所述時間常數(shù)被允許比稍后音軌期間變化得更快。
8.如權(quán)利要求7所述的方法,其中當(dāng)檢測出兩個音軌之間的暫停時,所述自適應(yīng)時間常數(shù)被重置,通過確定是否能夠通過單獨使用雙耳定位模型或通過結(jié)合使用雙耳定位模型與信號統(tǒng)計模型定位所述音頻輸入信號,來檢測所述暫停。
9.如前述權(quán)利要求中的任一項所述的方法,進一步包括在所述音頻輸入信號被輸出之前,將延遲時間包括在所述音頻輸入信號中的步驟,其中所述延遲時間對應(yīng)于對所述音頻輸出信號的增益進行確定所需的時間。
10.一種對包含至少兩個不同音軌的音頻輸出信號的增益進行調(diào)整的系統(tǒng),其中該至少兩個不同音軌具有不同信號水平范圍,該系統(tǒng)接收音頻輸入信號并輸出具有調(diào)整的增益的音頻輸出信號,該系統(tǒng)包括-響度確定單元(31),其基于人類聽覺的心理聲學(xué)模型,動態(tài)地確定所述音頻輸入信號的響度,以及_增益確定單元(35),其接收所確定的響度并輸出具有調(diào)整增益的音頻輸出信號,其中所述增益確定單元(35)動態(tài)地確定所述音頻輸出信號的增益,使得所述音頻輸出信號的至少兩個音軌是覆蓋預(yù)定的信號水平范圍的輸出,-環(huán)境噪聲估算單元(50),其被配置成對所述音頻輸出信號被輸出到的空間中的環(huán)境噪聲進行估算,_增益控制單元(41),其被配置成確定由所述增益確定單元確定的增益影響所述音頻輸出信號的程度,其中所述增益控制單元基于估算出的環(huán)境噪聲確定所述音頻輸出信號受所述增益確定單元影響的程度。
11.如權(quán)利要求10所述的系統(tǒng),進一步包括暫停檢測單元(33),該暫停檢測單元(33) 通過使用對如正在收聽所述音頻輸入信號的收聽者所感知的音頻輸入信號的空間感知的模擬來確定是否能夠定位所述音頻輸入信號,以確定所述至少兩個不同音軌之間或一個音軌以內(nèi)的暫停,在該暫停中噪聲是音頻輸入信號的主導(dǎo)部分,其中,所述增益確定單元(35) 在被確定的暫停中減少增益。
12.如權(quán)利要求10或11所述的系統(tǒng),其中所述音頻輸入和輸出信號的每個音軌包括音頻信號的連續(xù)的塊(25),其中時間常數(shù)生成單元(32)確定所述音頻輸入信號的所述連續(xù)的塊的時間常數(shù)(26),該時間常數(shù)(26)描述了從一個塊到下一個塊的響度的改變,其中所述增益確定單元(35)基于所述時間常數(shù)確定所述音頻輸出信號的增益。
13.如權(quán)利要求12所述的系統(tǒng),其中所述時間常數(shù)生成單元(32)使用提升時間常數(shù)來描述兩個連續(xù)塊之間的升高響度,并使用下降時間常數(shù)描述兩個連續(xù)塊之間的下降響度, 其中所述時間常數(shù)生成單元將所述時間常數(shù)確定成,使得與下降時間常數(shù)允許的增益減少相比,提升時間常數(shù)允許增益增加得更快。
14.如權(quán)利要求12或13所述的系統(tǒng),其中所述時間常數(shù)生成單元(32)將所述時間常數(shù)確定成,使得所述時間常數(shù)為自適應(yīng)時間常數(shù),在音軌開始處,該自適應(yīng)時間常數(shù)在塊與塊之間能夠變化得比在稍后的音軌期間變化得更快。
15.如前述權(quán)利要求12至14中的任一項所述的系統(tǒng),其中當(dāng)在兩個音軌之間檢測出暫停時,所述時間常數(shù)生成單元(32)重置所述時間常數(shù)。
16.如權(quán)利要求11至15中的任一項所述的系統(tǒng),進一步包括延遲元件(42),所述延遲元件(42)在所述音頻輸入信號被作為輸出信號輸出之前將延遲時間引入所述音頻輸入信號,其中所述延遲元件引入與對所述音頻輸出信號的增益進行確定所需的時間對應(yīng)的延遲時間。
17.如權(quán)利要求10至16中的任一項所述的系統(tǒng),其中所述增益控制單元被配置成,當(dāng)估算出的噪聲低于預(yù)定閾值時,消除所述增益確定單元(35)對所述音頻輸出信號的影響。
全文摘要
本發(fā)明音頻信號響度級的自動校正涉及一種用于對包含至少兩個不同音軌的音頻輸出信號的增益進行調(diào)整的方法,該至少兩個不同音軌具有不同信號水平范圍,該方法的步驟包括-基于人類的心理聲學(xué)模型,動態(tài)地確定音頻輸入信號的感知響度,-動態(tài)地確定增益確定單元(35)輸出的音頻輸出信號的增益,該增益確定單元(35)接收感知響度并輸出具有確定增益的音頻輸出信號,其中確定該增益,使得音頻輸出信號的所述至少兩個音軌是覆蓋預(yù)定的信號水平范圍或響度范圍的輸出,-對音頻輸出信號被輸出的空間的環(huán)境噪聲進行估算,以及,-確定由增益確定單元確定的增益影響音頻輸出信號的程度,其中基于估算出的環(huán)境噪聲確定音頻輸出受到增益確定單元影響的程度。
文檔編號H03G3/32GK102195584SQ20111005992
公開日2011年9月21日 申請日期2011年3月14日 優(yōu)先權(quán)日2010年3月12日
發(fā)明者弗蘭克.貝倫, 沃爾夫?qū)?赫斯 申請人:哈曼貝克自動系統(tǒng)股份有限公司