專利名稱:修改輸入音頻信號(hào)的裝置及方法
修改輸入音頻信號(hào)的裝置及方法技術(shù)領(lǐng)域
根據(jù)本發(fā)明的實(shí)施方式涉及音頻信號(hào)處理,尤其涉及修改輸入音頻信號(hào)的裝置及 方法。
背景技術(shù):
已經(jīng)進(jìn)行過許多嘗試來開發(fā)令人滿意的測(cè)量響度的客觀方法。Fletcher和 Munson在1933年確定人的聽覺在低頻和高頻處比在中間(或語音)頻率處較不敏感。他們 還發(fā)現(xiàn)敏感度的相對(duì)變化隨聲級(jí)的增加而降低。早先的響度測(cè)量?jī)x由麥克風(fēng)、放大器、測(cè)量 儀和被設(shè)計(jì)為在低、中和高聲級(jí)大致模仿聽覺的頻率響應(yīng)的濾波器的組合構(gòu)成。
盡管這樣的設(shè)備提供了單一的、恒定聲級(jí)、獨(dú)立音調(diào)的響度測(cè)量,但是更加復(fù)雜聲 音的測(cè)量不能非常好地匹配響度的主觀感覺。這種類型的聲級(jí)測(cè)量?jī)x已經(jīng)被標(biāo)準(zhǔn)化,但是 它僅僅用于諸如監(jiān)控和控制工業(yè)噪聲的特定任務(wù)。
在20 世紀(jì) 50 年代早期,Zwicker 和 Stevens 擴(kuò)展了 Fletcher 和 Munson 的工 作,在于開發(fā)了更為逼真的響度感覺處理的模型。Stevens于1956年在Journal of the Acoustical Society of America 中發(fā)表了一種用于 “Calculation of the Loudness of Complex Noise”的方法,以及Zwicker于1958年在Acoustica中發(fā)表了他的文章 “Psychological and Methodical Basisof Loudness”。在 1959 年,Zwicker 發(fā)表了響度 計(jì)算的圖形化處理并在不久之后發(fā)表了若干類似的論文。Stevens和Zwicker方法已(分別 地)被標(biāo)準(zhǔn)化為IS0532部分A和B。這兩種方法包含類似的步驟。
首先,通過將音頻傳輸穿過具有在臨界頻帶速率標(biāo)度上均勻間隔的中心頻率的一 組帶通聽覺濾波器來模擬被稱之為激勵(lì)的沿內(nèi)耳基膜能量的時(shí)間變化分布。每個(gè)聽覺濾 波器被設(shè)計(jì)成模擬沿內(nèi)耳基膜在特定位置的頻率響應(yīng),該濾波器的中心頻率對(duì)應(yīng)于這個(gè)位 置。臨界頻帶帶寬被定義為這樣的一個(gè)濾波器的帶寬。以Hz為單位進(jìn)行測(cè)量,這些聽覺 濾波器的臨界帶寬隨中心頻率的增加而增加。所以,有用的是,定義翹曲頻率標(biāo)度以便以 這種翹曲標(biāo)度測(cè)量的所有聽覺濾波器的臨界帶寬為常量。這種翹曲標(biāo)度被稱為臨界頻帶速 率標(biāo)度并且對(duì)理解和模擬范圍廣泛的心理聲學(xué)現(xiàn)象是非常有用的。例如,參見E. Zwicker 和 H. Fastl 所著的 Psychoacoustics-Factsand Models, Springer-Verlag,柏林,1990 年。 Stevens和Zwicker的方法使用被稱為Bark標(biāo)度的臨界頻帶速率標(biāo)度,其中,臨界頻帶帶 寬在500Hz以下是常量而在500Hz以上增加。近來,Moore和Glasberg定義了一種臨界帶 寬速率標(biāo)度,他們稱其為等效矩形帶寬(ERB)標(biāo)度(B. C. J. Moore, B. Glasberg, T. Baer, “A Model for the Prediction of Thresholds, Loudness, and Partial Loudness,,,Journal of the Audio Engineering Society, Vol. 45,No. 4,1997 年 4 月,pp. 224-240)。通過使用 陷波噪聲屏蔽器的心理聲學(xué)實(shí)驗(yàn),Moore和Glasberg證明臨界頻帶帶寬在500Hz以下繼續(xù) 減小,這與臨界頻帶帶寬保持恒定的Bark標(biāo)度相反。
術(shù)語“臨界頻帶”要追溯到于1938年由Harvey Fletcher利用伴隨信號(hào)對(duì)聲覺掩 蔽進(jìn)行的工作(“J. B. Allen, “A short history of telephonepsychophysics”,Audio Eng.Soc. Convention, 1997”)。臨界頻帶可以利用Zwicker在1961年提出的Bark標(biāo)度進(jìn)行表 達(dá)每個(gè)臨界頻帶具有一Bark(Heinrich Barkhausen之后命名的單位)的寬度。存在模仿人 類聽覺感知的超濾波器組,例如,等效矩形帶寬(ERB)標(biāo)度(“B. C. J. Moore, B. R. Glasberg 及 T. Baer, uK model for the prediction of thresholds,loudness, andpartial loudness”, J. Audio Eng. Soc.,1997,,)。
術(shù)語“單位響度”描述了由基膜某區(qū)域上的信號(hào)對(duì)臨界頻帶中測(cè)量的某頻率帶寬 引起的響度感覺。以Sone/Bark為單位進(jìn)行測(cè)量。術(shù)語“臨界頻帶”是指包括被設(shè)計(jì)用于 模仿人耳的頻率分辨率的非均勻帶通濾波器組的聽覺濾波器組的頻帶。聲音的總響度等于 所有臨界頻帶上的單位響度的和/積分。
在“A. J. Seefeldt, “Calculating and adjusting the perceived loudnessand/ or the perceived spectral balance of an audio signal” 的美國(guó)專利 2009/0097676, 2009”中描述了一種處理音頻信號(hào)的方法。該方法的目的在于控制音頻信號(hào)的單位響度,可 應(yīng)用于音量控制、動(dòng)態(tài)范圍控制、動(dòng)態(tài)均衡及背景噪聲補(bǔ)償。在該文獻(xiàn)中,對(duì)輸入音頻信號(hào) (通常在頻域內(nèi))進(jìn)行修改使得單位響度與目標(biāo)單位響度匹配。
為了說明如在 “A. J. Seefeldt, “Calculating and adjusting the perceivedloudness and/or the perceived spectral balance of an audio signal,,的 美國(guó)專利2009/0097676,2009 ”中所提出的處理的優(yōu)勢(shì),考慮了音頻信號(hào)的音量控制。改變 聲音重放中音頻信號(hào)的級(jí)別的目的通常在于改變感知響度。換句話說,響度的控制傳統(tǒng)上 以聲級(jí)的控制來實(shí)現(xiàn)。然而,人們的生活經(jīng)驗(yàn)以及心理聲學(xué)知識(shí)表明這不是最佳的。
人的聽覺敏感度隨頻率和級(jí)變化,以便聲強(qiáng)度級(jí)的降低使比中頻(例如, 2000-4000Hz)的感覺大的低頻和高頻(例如,分別為IOOHz和10000Hz)的感覺減弱。當(dāng)使 播放級(jí)從“舒適響度”級(jí)(例如,75-80dBA)至較低級(jí)降低18dB時(shí),音頻信號(hào)的感知頻譜平衡 發(fā)生改變。這種情況在眾所周知的等響度曲線,一般稱為Fletcher-Munson曲線(在首次于 1933年測(cè)量等響度曲線的研究人員之后)中示出。等響度曲線表示頻譜上的聲壓級(jí)(SPL), 當(dāng)以純正平穩(wěn)的音調(diào)呈現(xiàn)時(shí)收聽者會(huì)感知到恒定的響度。
例如,在“B. C. J. Moore, B. R. Glasberg 及 T. Baer, “A model for theprediction of thresholds, loudness, and partial loudness,,, J. Audio Eng. Soc. , 1997,第 232頁(yè),圖 13”中描述了等響度曲線。修訂測(cè)量在2003年已被標(biāo)準(zhǔn)化為ISO 226:2003。
因此,傳統(tǒng)的響度控制不僅改變了響度,而且還改變了音色。該效應(yīng)的影響取決于 SPL (例如,使SPL從86dBA改變?yōu)?8dBA時(shí),與從76dBA改變?yōu)?8dBA相比,不太明顯),但 不是所有類中所期望的那樣。
這是由如在“A. J. Seefeldt, “Calculating and adjusting the perceivedloudness and/or the perceived spectral balance of an audio signal,,的 美國(guó)專利2009/0097676,2009”中所描述的處理補(bǔ)償?shù)摹?br>
圖 7 不出 了 在 “A. J. Seefeldt, “Calculating and adjusting the perceivedloudness and/or the perceived spectral balance of an audio signal,,的 美國(guó)專利2009/0097676,2009”中描述的方法700的流程圖。
通過計(jì)算激勵(lì)信號(hào)710、計(jì)算單位響度720、計(jì)算目標(biāo)單位響度730、計(jì)算目標(biāo)激勵(lì) 信號(hào)740、計(jì)算頻譜權(quán)重750以及將頻譜權(quán)重應(yīng)用于輸入信號(hào)并重新合成輸出信號(hào)760對(duì)輸出信號(hào)進(jìn)行處理。
頻譜權(quán)重H為取決于輸入信號(hào)的單位響度以及目標(biāo)單位響度的頻帶的權(quán)重。如 在“A. J. Seefeldt, “Calculating and adjusting the perceivedloudness and/or the perceived spectral balance of an audio signal ” 的美國(guó)專利 2009/0097676, 2009,,中 所述的計(jì)算包括單位響度的計(jì)算以及單位響度的計(jì)算的逆處理,該逆處理用于目標(biāo)單位響度。
處理步驟的計(jì)算量都很大。在“E.Zwicker, H. Fasti, U. Widmann, K. Kurakata, S. Kuwano及S. Namba,“Program for calculating loudnessaccording to DIN 45631 (ISO 532B) ”, J. Acoust. Soc. Jpn. (E),vol. 12,1991” 以及 “B. C. J. Moore, B. R. Glasberg 及 T. Baer, “A model for the predictionof thresholds,loudness, and partial loudness”,J. Audio Eng. Soc. , 1997”中提出了計(jì)算單位響度的方法。發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種改進(jìn)的修改音頻信號(hào)的構(gòu)想以便以低的計(jì)算復(fù)雜性 進(jìn)行有效的實(shí)現(xiàn)。
該目的通過根據(jù)權(quán)利要求1所述的裝置或根據(jù)權(quán)利要求20所述的方法來解決。
本發(fā)明的實(shí)施方式提供了一種修改輸入音頻信號(hào)的裝置,包括激勵(lì)確定器、存儲(chǔ) 設(shè)備以及信號(hào)修改器。所述激勵(lì)確定器被配置為基于輸入音頻信號(hào)的多個(gè)子帶中的一個(gè)子 帶信號(hào)的能含量確定所述子帶的激勵(lì)參數(shù)值。所述存儲(chǔ)設(shè)備被配置為存儲(chǔ)包含多個(gè)頻譜權(quán) 重因子的查找表,其中,多個(gè)頻譜權(quán)重因子中的一個(gè)頻譜權(quán)重因子與激勵(lì)參數(shù)的預(yù)定義值 以及多個(gè)子帶中的一個(gè)子帶相關(guān)聯(lián)。此外,所述存儲(chǔ)設(shè)備被配置為提供與激勵(lì)參數(shù)的確定 值對(duì)應(yīng)以及與確定了激勵(lì)參數(shù)值的子帶對(duì)應(yīng)的頻譜權(quán)重因子。所述信號(hào)修改器被配置為基 于所提供的頻譜權(quán)重因子修改確定了激勵(lì)參數(shù)的輸入音頻信號(hào)的子帶的內(nèi)容以提供修改 的子帶。
根據(jù)本發(fā)明的實(shí)施方式基于以下中心思想,可以利用含有頻譜權(quán)重因子的查找表 容易地對(duì)音頻信號(hào)的子帶進(jìn)行修改,所述頻譜權(quán)重因子可以根據(jù)各個(gè)子帶及子帶的激勵(lì)參 數(shù)進(jìn)行選擇。為此,查找表包含多個(gè)子帶中的至少一個(gè)預(yù)定義子帶的激勵(lì)參數(shù)的多個(gè)預(yù)定 義值的頻譜權(quán)重因子。由于頻譜權(quán)重因子的明顯的計(jì)算(包括響度計(jì)算、修改及響度計(jì)算的 逆過程)不是必須的,因此利用所述該查找表可以大幅降低計(jì)算復(fù)雜性。所以,允許有效實(shí) 現(xiàn)。
在根據(jù)本發(fā)明的一些實(shí)施方式中,激勵(lì)確定器確定并不是多個(gè)子帶的所有子帶的 激勵(lì)參數(shù)值。此外,所述查找表僅包含與確定了激勵(lì)參數(shù)值的子帶相關(guān)聯(lián)的頻譜權(quán)重因子。 這樣,可以減少查找表所需的存儲(chǔ)空間以及激勵(lì)確定器的計(jì)算工作量。
根據(jù)本發(fā)明的一些實(shí)施方式涉及一種查找表,所述查找表精確地包括與激勵(lì)參數(shù) 的預(yù)定義值相關(guān)聯(lián)、與多個(gè)子帶中的子帶相關(guān)聯(lián)以及與外部修改參數(shù)的預(yù)定義值相關(guān)聯(lián)的 三維度。
根據(jù)本發(fā)明的一些另外的實(shí)施方式涉及一種查找表,所述查找表精確包括與激勵(lì) 參數(shù)的預(yù)定義值相關(guān)聯(lián)、與多個(gè)子帶中的子帶相關(guān)聯(lián)、與外部修改參數(shù)的預(yù)定義值相關(guān)聯(lián) 以及與背景噪聲參數(shù)的預(yù)定義值相關(guān)聯(lián)的四維度。
隨后將參照附圖詳細(xì)介紹本發(fā)明的實(shí)施方式,其中
圖1為用于修改輸入音頻信號(hào)的裝置的框圖2為等響度曲線的示意圖3為由傳輸濾波器標(biāo)準(zhǔn)化的等響度曲線的示意圖4為用于修改輸入音頻信號(hào)的裝置的框圖5為用于修改輸入音頻信號(hào)的方法的流程圖6為用于修改輸入音頻信號(hào)的方法的流程圖7為用于修改輸入音頻信號(hào)的已知方法的流程圖。
在下文中,相同的參考編號(hào)部分用于具有相同或相似功能性質(zhì)的物件及功能單 元,有關(guān)圖的說明同樣應(yīng)適用于其他圖以減少實(shí)施方式的說明部分的冗余。
具體實(shí)施方式
圖1示出了根據(jù)本發(fā)明實(shí)施方式的用于修改輸入音頻子帶信號(hào)102的裝置100的 框圖。裝置100包括激勵(lì)確定器110、存儲(chǔ)設(shè)備120及信號(hào)修改器130。激勵(lì)確定器110被 連接至存儲(chǔ)設(shè)備120而存儲(chǔ)設(shè)備120被連接至信號(hào)修改器130。激勵(lì)確定器110基于子帶 102的能含量確定輸入音頻信號(hào)102的多個(gè)子帶中的一個(gè)子帶102的激勵(lì)參數(shù)值112。存 儲(chǔ)設(shè)備120存儲(chǔ)有含有多個(gè)頻譜權(quán)重因子的查找表,其中,多個(gè)頻譜權(quán)重因子中的一個(gè)頻 譜權(quán)重因子124與激勵(lì)參數(shù)的預(yù)定義值以及多個(gè)子帶中的一個(gè)子帶相關(guān)聯(lián)。進(jìn)一步地,存 儲(chǔ)設(shè)備120提供與激勵(lì)參數(shù)的確定值112對(duì)應(yīng)以及與確定了激勵(lì)參數(shù)值112的子帶102對(duì) 應(yīng)的頻譜權(quán)重因子124。信號(hào)修改器130基于所提供的頻譜權(quán)重因子124修改確定了激勵(lì) 參數(shù)值112的輸入音頻信號(hào)的子帶102的內(nèi)容以提供修改的子帶132。
通過利用查找表來提供用于修改輸入音頻信號(hào)的頻譜權(quán)重因子124,與已知的構(gòu) 想相比可以明顯降低計(jì)算復(fù)雜度。
激勵(lì)確定器110基于子帶102的能含量確定激勵(lì)參數(shù)值112。例如,這可以通過測(cè) 量子帶102的能含量來執(zhí)行以確定子帶102的激勵(lì)參數(shù)值112。這樣,由于能含量可以隨 時(shí)間而變化和/或可以在不同的子帶之間變化,所以激勵(lì)參數(shù)可以表示功率/子帶或特定 子帶中的短時(shí)能量的測(cè)量??蛇x地,可以基于子帶的短時(shí)能量的(唯一、內(nèi)射、雙射)函數(shù)(例 如,指數(shù)函數(shù)、對(duì)數(shù)函數(shù)或線性函數(shù))來確定激勵(lì)參數(shù)值。例如,可以使用量化函數(shù)。在該實(shí) 例中,激勵(lì)確定器110可以確定子帶的能含量且可以量化所測(cè)量的子帶的能含量以獲得激 勵(lì)參數(shù)值,使得激勵(lì)參數(shù)值等于激勵(lì)參數(shù)的預(yù)定義值。換句話說,可以將所測(cè)量的能量值分 配給激勵(lì)參數(shù)的預(yù)定義值(例如,激勵(lì)參數(shù)的最接近預(yù)定義值)。可選地,激勵(lì)參數(shù)值直接表 示所測(cè)量的能含量且存儲(chǔ)設(shè)備120可以將激勵(lì)參數(shù)的確定值分配給激勵(lì)參數(shù)的預(yù)定義值。
輸入音頻信號(hào)的子帶可以表示輸入音頻信號(hào)不同的頻帶??紤]到頻帶的感知分 布,例如,可以根據(jù)ERB標(biāo)度或Bark標(biāo)度或模仿人耳頻率分辨率的另一個(gè)頻率間隔來分布 子帶。換句話說,可以根據(jù)ERB標(biāo)度或Bark標(biāo)度對(duì)輸入音頻信號(hào)的多個(gè)子帶中的子帶進(jìn)行 分割。
存儲(chǔ)設(shè)備120包括用于激勵(lì)參數(shù)(激勵(lì)信號(hào))以及表示確定了激勵(lì)參數(shù)值112的子帶102的子帶指數(shù)的輸入端??蛇x地,存儲(chǔ)設(shè)備包括用于其他參數(shù)的一個(gè)或多個(gè)其他輸入端。
存儲(chǔ)設(shè)備120可以是數(shù)字存儲(chǔ)介質(zhì),例如,只讀存儲(chǔ)器(ROM)、硬盤、CD、DVD或任何 其他類型的非易失性存儲(chǔ)器或隨機(jī)存取存儲(chǔ)器(RAM)。
查找表至少表示包含多個(gè)頻譜權(quán)重因子的二維矩陣。查找表包含的頻譜權(quán)重因子 124明確地與激勵(lì)參數(shù)的預(yù)定義值以及多個(gè)子帶中的一個(gè)子帶相關(guān)聯(lián)。換句話說,查找表包 含的每個(gè)頻譜權(quán)重因子可以與激勵(lì)參數(shù)的預(yù)定義值以及多個(gè)子帶中的一個(gè)子帶相關(guān)聯(lián)。存 儲(chǔ)設(shè)備120可以提供與最接近激勵(lì)參數(shù)的確定值112的激勵(lì)參數(shù)的預(yù)定義值相關(guān)聯(lián)的頻譜 權(quán)重因子124。可選地,例如,存儲(chǔ)設(shè)備120可以線性地或?qū)?shù)地插入與最接近激勵(lì)參數(shù)的 確定值112的激勵(lì)參數(shù)的兩個(gè)預(yù)定義值相關(guān)聯(lián)的兩個(gè)頻譜權(quán)重因子。
激勵(lì)參數(shù)的預(yù)定義值可以線性地或?qū)?shù)地進(jìn)行分布。
例如,信號(hào)修改器130可以利用所提供的頻譜權(quán)重因子124對(duì)確定了激勵(lì)參數(shù)值 112的子帶102的內(nèi)容進(jìn)行放大或衰減。
例如,通過利用所描述的構(gòu)想,可以容易地補(bǔ)償由音頻信號(hào)的聲強(qiáng)級(jí)增大或減小 導(dǎo)致的低頻、中頻及高頻的人類聽覺的不同衰減。例如,當(dāng)使播放級(jí)從一級(jí)降為另一級(jí)時(shí), 音頻信號(hào)的感知頻譜平衡就改變。這種情況在圖2和圖3示出,表示等響度曲線。特別是 在低頻區(qū)域中,不同的等響度的曲線彼此不平行。與中頻帶和/或高頻帶不同的低頻帶的 放大或衰減可以等于等響度曲線彎曲度,使得等響度曲線可以平行或比之前更平行。這樣, 感知頻譜平衡改變可以被補(bǔ)償或幾乎可以利用所描述的構(gòu)想進(jìn)行補(bǔ)償。
圖2的等響度曲線和圖3的等響度曲線之間的差別為傳輸濾波器的標(biāo)準(zhǔn)化。傳輸 濾波器可以模擬通過外耳和內(nèi)耳音頻的傳輸?shù)臑V波效果。這樣的傳輸濾波器可選地在圖1 所示的裝置中實(shí)現(xiàn)以便在提供給激勵(lì)確定器110之前對(duì)輸入音頻信號(hào)進(jìn)行濾波處理。
對(duì)于輸入音頻信號(hào)的更連續(xù)的修改,激勵(lì)確定器110可以確定多個(gè)子帶的一個(gè)以 上子帶的激勵(lì)參數(shù)值112。然后,存儲(chǔ)設(shè)備120可以為確定了激勵(lì)參數(shù)值112的每個(gè)子帶 102提供頻譜權(quán)重因子124,且信號(hào)修改器130可以基于各對(duì)應(yīng)的所提供的頻譜權(quán)重因子 124修改確定了激勵(lì)參數(shù)值112的每個(gè)子帶102的內(nèi)容。
輸入音頻信號(hào)的多個(gè)子帶可以由存儲(chǔ)器單元提供或可以由分析濾波器組產(chǎn)生。
可以確定多個(gè)子帶中的一個(gè)子帶、一個(gè)以上子帶或所有子帶的激勵(lì)參數(shù)。為此,裝 置100可以只包括確定一個(gè)激勵(lì)參數(shù)值、一個(gè)以上激勵(lì)參數(shù)值或所有激勵(lì)參數(shù)值的一個(gè)激 勵(lì)確定器110或可以包括用于確定了激勵(lì)參數(shù)值112的每個(gè)子帶102的激勵(lì)確定器110。 此外,裝置100可以包括用于確定了激勵(lì)參數(shù)的一個(gè)或多個(gè)子帶的一個(gè)或多個(gè)單一修改器 130。然而,對(duì)于確定了激勵(lì)參數(shù)值112的所有子帶102,使用單個(gè)查找表(以及存儲(chǔ)設(shè)備) 就足夠了。
激勵(lì)確定器110、存儲(chǔ)設(shè)備120以及信號(hào)修改器可以是獨(dú)立的硬件單元、計(jì)算機(jī)的 一部分、微控制器或數(shù)字信號(hào)處理器以及被配置為在計(jì)算機(jī)、微控制器或數(shù)字信號(hào)處理器 上運(yùn)行的計(jì)算機(jī)程序或軟件產(chǎn)品。
圖4示出了根據(jù)本發(fā)明實(shí)施方式的用來修改輸入音頻信號(hào)的裝置400的框圖。裝 置400類似于圖1中所示的裝置,但還包括分析濾波器組410以及合成濾波器組420。分析 濾波器組410將輸入音頻信號(hào)分為多個(gè)子帶。然后,激勵(lì)確定器110確定多個(gè)子帶中的一個(gè)或多個(gè)子帶的激勵(lì)參數(shù)值(計(jì)算特征)。然后,存儲(chǔ)設(shè)備120為一個(gè)或多個(gè)信號(hào)修改器130 提供對(duì)應(yīng)的一個(gè)或多個(gè)頻譜權(quán)重因子。最后,合成濾波器組420將含有至少一個(gè)修改的子帶的多個(gè)子帶結(jié)合在一起以獲得并提供修改的音頻信號(hào)(或輸出音頻信號(hào))。
圖4中所示的實(shí)例可以是所提出的方法對(duì)于通用的應(yīng)用情況。用于第η子帶信號(hào) (第η子帶)所示的處理可以以相同的方式用于所有其他子帶信號(hào)(或只用于確定了激勵(lì)參數(shù)值的所有子帶)。
可選地,由查找表包含的頻譜權(quán)重因子還與外部修改參數(shù)的預(yù)定義值相關(guān)聯(lián),如圖4中用虛線所示(但也適用于圖I中所示的裝置)。例如,外部修改參數(shù)(或簡(jiǎn)單修改參數(shù)) 可以表示用戶界面的輸入值(例如,音量和/或環(huán)境設(shè)置)。因此,在這種情況下,存儲(chǔ)設(shè)備 120可以提供與外部修改參數(shù)值對(duì)應(yīng)的頻譜權(quán)重因子。例如,如果用戶增加或減少音量設(shè)置,外部修改參數(shù)值就改變且存儲(chǔ)設(shè)備120可以提供對(duì)應(yīng)的其他頻譜權(quán)重因子??傊?,存儲(chǔ)設(shè)備120可以提供與子帶的激勵(lì)參數(shù)的確定值對(duì)應(yīng)的、與確定了激勵(lì)參數(shù)值的子帶對(duì)應(yīng)的以及與外部修改參數(shù)值對(duì)應(yīng)的頻譜權(quán)重因子。
在該實(shí)例中,查找表可以包括與激勵(lì)參數(shù)的預(yù)定義值相關(guān)聯(lián)、與多個(gè)子帶中的子帶相關(guān)聯(lián)以及與外部修改參數(shù)的預(yù)定義值相關(guān)聯(lián)的精確的三維度。這意味著由查找表包含的每個(gè)頻譜權(quán)重因子與激勵(lì)參數(shù)的特定預(yù)定義值、多個(gè)子帶的一個(gè)子帶以及外部修改參數(shù)的特定預(yù)定義值相關(guān)聯(lián)。換句話說,對(duì)于激勵(lì)參數(shù)的預(yù)定義值、子帶以及外部修改參數(shù)的預(yù)定義值的每個(gè)組合,查找表包含一個(gè)頻譜權(quán)重因子。例如,外部修改參數(shù)的預(yù)定義值可以線性地或?qū)?shù)地分布在外部修改參數(shù)的可能的范圍內(nèi)。
此外,在一些實(shí)施方式中,由查找表包含的頻譜權(quán)重因子也與背景噪聲參數(shù)的預(yù)定義值相關(guān)聯(lián)。背景噪聲參數(shù)可以表示輸入音頻信號(hào)的背景噪聲級(jí)。這樣,例如,在存在背景噪聲時(shí)可以實(shí)現(xiàn)音頻信號(hào)的部分屏蔽的效果的補(bǔ)償。在這種情況下,存儲(chǔ)設(shè)備可以提供與 背景噪聲參數(shù)值對(duì)應(yīng)的頻譜權(quán)重因子。這種情況可以另外地或可選地對(duì)外部修改參數(shù)的上述考慮事項(xiàng)進(jìn)行。如果考慮了這兩種情況,存儲(chǔ)設(shè)備可以提供與子帶的激勵(lì)參數(shù)的確定值對(duì)應(yīng)、與確定了激勵(lì)參數(shù)的子帶對(duì)應(yīng)、與外部修改參數(shù)值對(duì)應(yīng)以及與背景噪聲參數(shù)值對(duì)應(yīng)的頻譜權(quán)重因子。在這種情況下,查找表可以精確地包括與激勵(lì)參數(shù)的預(yù)定義值相關(guān)聯(lián)、 與多個(gè)子帶中的子帶相關(guān)聯(lián)、與外部修改參數(shù)的預(yù)定義值相關(guān)聯(lián)以及與背景噪聲參數(shù)的預(yù)定義值相關(guān)聯(lián)的四維度。例如,背景噪聲參數(shù)的預(yù)定義值可以線性地或?qū)?shù)地分布在背景噪聲參數(shù)的可能的范圍內(nèi)。
背景噪聲參數(shù)值可以由背景噪聲檢測(cè)器確定??梢詫?duì)被分為子帶之前的整個(gè)輸入音頻信號(hào)進(jìn)行或可以單獨(dú)對(duì)一個(gè)子帶、一個(gè)以上子帶或所有子帶的子帶級(jí)進(jìn)行??蛇x地,如果輸入音頻信號(hào)的多個(gè)子帶由存儲(chǔ)器單元存儲(chǔ)并提供,背景噪聲參數(shù)值也可以由存儲(chǔ)器單元提供。
在任何情況下,盡管由查找表包含的頻譜權(quán)重因子可以基于單位響度參數(shù)或目標(biāo)單位響度參數(shù)進(jìn)行計(jì)算,但存儲(chǔ)設(shè)備不包括單位響度參數(shù)的輸入或目標(biāo)單位響度參數(shù)的輸入。頻譜權(quán)重因子的計(jì)算可以在外部進(jìn)行,然后頻譜權(quán)重因子可以由存儲(chǔ)設(shè)備進(jìn)行存儲(chǔ)。由于不需要頻譜權(quán)重因子的顯示計(jì)算,因此與已知設(shè)備相比,可以明顯降低根據(jù)所描述的構(gòu)想實(shí)現(xiàn)的裝置的計(jì)算復(fù)雜度。
例如,可以對(duì)頻譜權(quán)重因子進(jìn)行計(jì)算以便存儲(chǔ)設(shè)備通過以下方式進(jìn)行存儲(chǔ)。
音頻的處理可以在數(shù)字域中進(jìn)行。相應(yīng)地,音頻輸入信號(hào)可以通過離散時(shí)間序列 X[η]表示,該時(shí)間序列已經(jīng)以某采樣頻率f。從音頻源進(jìn)行采樣。可以假設(shè)序列x[n]已經(jīng)被適當(dāng)?shù)囟?biāo)從而通過以下公式以分貝給出的x[n]的均方根(rms)功率
= E Ologj 極H
等于收聽者正在以它進(jìn)行傾聽的單位為dB的聲壓級(jí)。另外,為了簡(jiǎn)化說明起見假設(shè)音頻信號(hào)是單聲道的。
音頻輸入信號(hào)被應(yīng)用于分析濾波器組或?yàn)V波器組函數(shù)(“分析濾波器組”)。分析濾波器組中的每個(gè)濾波器被設(shè)計(jì)為模擬在沿內(nèi)耳基膜的特定位置處的頻率響應(yīng)。濾波器組可以包括一組線性濾波器,其帶寬和間隔在等效矩形帶寬(ERB)頻率標(biāo)度上是恒定的,如通過 Moore、Glasberg 和 Baer (上文提到的 B. C. J. Moore, B. Glasberg, T. Baer, “A Model for thePrediction of Thresholds, Loudness, and Partial Loudness,,,)所定義的。
盡管ERB頻率標(biāo)度更加緊密地匹配人的感覺并且顯示出在產(chǎn)生匹配主觀響度結(jié)果的客觀響度測(cè)量中改進(jìn)的性能,但是可以利用降低的性能應(yīng)用Bark頻率標(biāo)度。
對(duì)于單位為Hz的中心頻率f,單位為Hz的ERB頻帶的帶寬可以被近似為
ERB(f) = 24. 7(4. 37f/1000+l) (I)
根據(jù)這種關(guān)系定義翹曲頻率標(biāo)度從而使得在沿曲折標(biāo)度的任何點(diǎn)處,以曲折標(biāo)度為單位的相應(yīng)的ERB等于一。用于從單位為Hz的線性頻率轉(zhuǎn)換到這種ERB頻率標(biāo)度的函數(shù)通過對(duì)方程I的倒數(shù)積分而獲得
調(diào)/)
權(quán)利要求
1.一種用于修改輸入音頻信號(hào)的裝置(100),包括激勵(lì)確定器(110),被配置為基于所述輸入音頻信號(hào)的多個(gè)子帶中的子帶(102)的能含量確定所述子帶(102)的激勵(lì)參數(shù)值(112);存儲(chǔ)設(shè)備(120),存儲(chǔ)包含多個(gè)頻譜權(quán)重因子的查找表,其中,所述多個(gè)頻譜權(quán)重因子中的一個(gè)頻譜權(quán)重因子與所述激勵(lì)參數(shù)的預(yù)定義值以及所述多個(gè)子帶中的一個(gè)子帶相關(guān)聯(lián),其中,所述存儲(chǔ)設(shè)備被配置為提供與激勵(lì)參數(shù)的確定值(112)對(duì)應(yīng)以及與確定了激勵(lì)參數(shù)值(112)的子帶(102)對(duì)應(yīng)的頻譜權(quán)重因子(124);以及信號(hào)修改器(130),被配置為基于所提供的頻譜權(quán)重因子(124)修改確定了所述激勵(lì)參數(shù)值(112)的輸入音頻信號(hào)的子帶 (102)的內(nèi)容以提供修改的子帶(132)。
2.根據(jù)權(quán)利要求I所述的裝置,其中,所述激勵(lì)確定器(110)被配置為確定所述多個(gè)子帶中的一個(gè)以上子帶(102)的激勵(lì)參數(shù)值(112),其中,所述存儲(chǔ)設(shè)備(120)被配置為為確定了所述激勵(lì)參數(shù)值(112)的每個(gè)子帶(102)提供頻譜權(quán)重因子(124),并且其中,所述信號(hào)修改器(130)被配置為基于各個(gè)對(duì)應(yīng)的所提供的頻譜權(quán)重因子(124)修改確定了所述激勵(lì)參數(shù)值(112)的每個(gè)子帶(102)的內(nèi)容。
3.根據(jù)權(quán)利要求I或2所述的裝置,進(jìn)一步包括分析濾波器組(410),被配置為將所述輸入音頻信號(hào)分為多個(gè)子帶;以及合成濾波器組(420),被配置為組合含有至少一個(gè)修改的子帶(132)的多個(gè)子帶以提供修改的音頻信號(hào)。
4.根據(jù)權(quán)利要求I至3中任一項(xiàng)所述的裝置,其中,由所述查找表包含的每個(gè)頻譜權(quán)重因子與所述激勵(lì)參數(shù)的預(yù)定義值以及所述多個(gè)子帶中的一個(gè)子帶相關(guān)聯(lián)。
5.根據(jù)權(quán)利要求I至4中任一項(xiàng)所述的裝置,其中,根據(jù)ERB標(biāo)度、Bark標(biāo)度或模仿人耳頻率分辨率的另一個(gè)頻率間隔對(duì)所述輸入音頻信號(hào)的所述多個(gè)子帶中的子帶進(jìn)行分割。
6.根據(jù)權(quán)利要求I至5中任一項(xiàng)所述的裝置,其中,所述激勵(lì)確定器(110)被配置為確定并不是所述多個(gè)子帶中的所有子帶的激勵(lì)參數(shù)值(112),并且其中,所述查找表僅包含與確定了激勵(lì)參數(shù)值的子帶相關(guān)聯(lián)的頻譜權(quán)重因子。
7.根據(jù)權(quán)利要求6所述的裝置,其中,確定了激勵(lì)參數(shù)值(112)的子帶(102)包括比沒有確定激勵(lì)參數(shù)值的子帶低的頻率。
8.根據(jù)權(quán)利要求6或7所述的裝置,其中,如果所述激勵(lì)確定器(110)沒有確定所述輸入音頻信號(hào)的子帶的激勵(lì)參數(shù)值(112),則該子帶的內(nèi)容不被所述信號(hào)修改器(130)修改。
9.根據(jù)權(quán)利要求I至8中任一項(xiàng)所述的裝置,其中,所述激勵(lì)確定器(110)被配置為只確定所述多個(gè)子帶中不到三分之一的子帶的激勵(lì)參數(shù)值(112),并且其中,所述信號(hào)修改器(130)被配置為基于各個(gè)對(duì)應(yīng)的所提供的頻譜權(quán)重因子修改確定了激勵(lì)參數(shù)值的子帶的內(nèi)容,其中,這些子帶包括比多個(gè)子帶中的確定了激勵(lì)參數(shù)值的所有其他子帶都低的頻率。
10.根據(jù)權(quán)利要求I至9中任一項(xiàng)所述的裝置,其中,所述信號(hào)修改器(130)被配置為基于為確定了激勵(lì)參數(shù)值(112)的子帶(102)提供的頻譜權(quán)重因子(124)修改沒有確定激勵(lì)參數(shù)值的子帶的內(nèi)容。
11.根據(jù)權(quán)利要求10所述的裝置,其中,所述信號(hào)修改器(130)基于為確定了激勵(lì)參數(shù)值(112)的包含比確定了激勵(lì)參數(shù)值(112)的所有其他子帶(102)都高的頻率的子帶(102) 提供的頻譜權(quán)重因子(124)修改沒有確定激勵(lì)參數(shù)值的子帶的內(nèi)容。
12.根據(jù)權(quán)利要求I至11中任一項(xiàng)所述的裝置,其中,由所述查找表包含的頻譜權(quán)重因子還與外部修改參數(shù)的預(yù)定義值相關(guān)聯(lián),其中,所述存儲(chǔ)設(shè)備(120)被配置為提供與子帶(102)的激勵(lì)參數(shù)的確定值(112)對(duì)應(yīng)的、與確定了激勵(lì)參數(shù)值(112)的子帶(102)對(duì)應(yīng)的以及與外部修改參數(shù)值對(duì)應(yīng)的頻譜權(quán)重因子(124)。
13.根據(jù)權(quán)利要求12所述的裝置,其中,所述查找表精確地包括與所述激勵(lì)參數(shù)的預(yù)定義值相關(guān)聯(lián)、與所述多個(gè)子帶中的子帶相關(guān)聯(lián)以及與所述外部修改參數(shù)的預(yù)定義值相關(guān)聯(lián)的二維度。
14.根據(jù)權(quán)利要求12至13中任一項(xiàng)所述的裝置,其中,所述信號(hào)修改器(130)被配置為基于所述外部修改參數(shù)值修改沒有確定激勵(lì)參數(shù)值的子帶的內(nèi)容。
15.根據(jù)權(quán)利要求I至14中任一項(xiàng)所述的裝置,其中,由所述查找表包含的頻譜權(quán)重因子還與背景噪聲參數(shù)的預(yù)定義值相關(guān)聯(lián),其中,所述存儲(chǔ)設(shè)備(120)被配置為提供與子帶 (102 )的激勵(lì)參數(shù)的確定值(112)對(duì)應(yīng)的、與確定了激勵(lì)參數(shù)值(112)的子帶(102)對(duì)應(yīng)的以及與背景噪聲參數(shù)值對(duì)應(yīng)的頻譜權(quán)重因子(124)。
16.根據(jù)權(quán)利要求15所述的裝置,其中,所述查找表精確地包括與所述激勵(lì)參數(shù)的預(yù)定義值相關(guān)聯(lián)、與所述多個(gè)子帶中的子帶相關(guān)聯(lián)、與所述外部修改參數(shù)的預(yù)定義值相關(guān)聯(lián)以及與所述背景噪聲參數(shù)的預(yù)定義值相關(guān)聯(lián)的四維度。
17.根據(jù)權(quán)利要求I至16中任一項(xiàng)所述的裝置,其中,所述存儲(chǔ)設(shè)備(120)不包括單位響度參數(shù)的輸入或目標(biāo)單位響度參數(shù)的輸入。
18.根據(jù)權(quán)利要求I至17中任一項(xiàng)所述的裝置,其中,由所述存儲(chǔ)設(shè)備(120)存儲(chǔ)的查找表僅是用于修改所述輸入音頻信號(hào)的裝置的查找表。
19.根據(jù)權(quán)利要求I至18中任一項(xiàng)所述的裝置,其中,所述激勵(lì)確定器(110)被配置為測(cè)量子帶(102)的能含量并被配置為量化所測(cè)量的基帶的能含量以獲得激勵(lì)參數(shù)值,從而使得所述激勵(lì)參數(shù)值等于所述激勵(lì)參數(shù)的預(yù)定義值。
20.一種用來修改輸入音頻信號(hào)的方法(500,600),包括基于所述輸入音頻信號(hào)的多個(gè)子帶中的一個(gè)子帶的能含量確定所述子帶的激勵(lì)參數(shù)值(510);提供與激勵(lì)參數(shù)的確定值對(duì)應(yīng)以及與確定了所述激勵(lì)參數(shù)值的所述子帶對(duì)應(yīng)的頻譜權(quán)重因子(520),其中,將所述頻譜權(quán)重因子存儲(chǔ)在包含多個(gè)頻譜權(quán)重因子的查找表中,其中,多個(gè)頻譜權(quán)重因子中的一個(gè)頻譜權(quán)重因子與所述激勵(lì)參數(shù)的預(yù)定義值以及所述多個(gè)子帶中的一個(gè)子帶相關(guān)聯(lián);基于所提供的頻譜權(quán)重因子修改確定了激勵(lì)參數(shù)值的子帶以提供修改的子帶(530)。
21.一種具有程序代碼的計(jì)算機(jī)程序,用于當(dāng)所述計(jì)算機(jī)程序在計(jì)算機(jī)或微控制器上運(yùn)行時(shí)執(zhí)行根據(jù)權(quán)利要求20所述的方法。
全文摘要
一種修改輸入音頻信號(hào)的裝置包括激勵(lì)確定器、存儲(chǔ)設(shè)備以及信號(hào)修改器。所述激勵(lì)確定器基于輸入音頻信號(hào)的多個(gè)子帶中的一個(gè)子帶的能含量確定所述子帶的激勵(lì)參數(shù)值。此外,所述存儲(chǔ)設(shè)備存儲(chǔ)包含多個(gè)頻譜權(quán)重因子的查找表。多個(gè)頻譜權(quán)重因子中的一個(gè)頻譜權(quán)重因子與激勵(lì)參數(shù)的預(yù)定義值以及多個(gè)子帶中的一個(gè)子帶相關(guān)聯(lián)。所述存儲(chǔ)設(shè)備提供與激勵(lì)參數(shù)的確定值對(duì)應(yīng)以及與確定了激勵(lì)參數(shù)值的子帶對(duì)應(yīng)的頻譜權(quán)重因子。此外,所述信號(hào)修改器基于所提供的頻譜權(quán)重因子修改確定了激勵(lì)參數(shù)值的音頻信號(hào)的子帶的內(nèi)容以提供修改的子帶。
文檔編號(hào)G10L19/00GK102986136SQ201180030337
公開日2013年3月20日 申請(qǐng)日期2011年4月20日 優(yōu)先權(quán)日2010年4月22日
發(fā)明者克里斯蒂安·烏勒, 于爾根·赫萊, 奧利弗·黑爾慕斯, 斯特凡·菲瑙爾 申請(qǐng)人:弗蘭霍菲爾運(yùn)輸應(yīng)用研究公司