亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

使用音頻信號(hào)水平的隨時(shí)間變化的估計(jì)概率密度的隨時(shí)間變化的音頻信號(hào)水平的制作方法

文檔序號(hào):7515490閱讀:148來(lái)源:國(guó)知局
專利名稱:使用音頻信號(hào)水平的隨時(shí)間變化的估計(jì)概率密度的隨時(shí)間變化的音頻信號(hào)水平的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及音頻信號(hào)處理。具體而言,本發(fā)明涉及通過(guò)平滑音頻信號(hào)的短期水平來(lái)計(jì)算出隨時(shí)間變化的對(duì)音頻信號(hào)的水平的度量,其中至少部分地通過(guò)隨時(shí)間變化的對(duì)短期水平的概率密度的估計(jì)來(lái)控制平滑處理的參數(shù)。
弓I用文獻(xiàn)且該文獻(xiàn)通過(guò)弓I用結(jié)合于此 在Alan Jeffrey Seefeldt等人的國(guó)際專利申請(qǐng)公布WO 2004/111994A2 (于2004年12月23日公布,題為"Method, Apparatus and ComputerProgr咖for Calculating andAdjusting the Perceived Loudness of anAudio Signal")中禾口在Alan Seefeldt等人的文章(Audio EngineeringSociety(音頻工程協(xié)會(huì))大會(huì)論文6236, 2004年10月28日舊金山,題為"A New 0bj ective Measure of Perceived Loudness")中描述了在更好地理解本發(fā)明時(shí)有用的用于度量感知的(心理聲學(xué))響度的一些技術(shù)。所述申請(qǐng)WO 2004/111994A2和所述文章通過(guò)整體引用而結(jié)合于此。
背景技術(shù)
在音頻信號(hào)處理中,生成隨時(shí)間變化的對(duì)音頻信號(hào)水平的度量常常是必要的(這里術(shù)語(yǔ)"水平" 一般地指代水平的度量,諸如峰水平、均方根水平、響度水平等)。例如,響度計(jì)可以顯示隨時(shí)間變化的對(duì)音頻信號(hào)的感知響度的度量,其中該度量被明顯地平滑以便表明在過(guò)去數(shù)秒內(nèi)的平均響度。在另一例子中,自動(dòng)增益控制(Automatic Gain Control,AGC)處理可以計(jì)算隨時(shí)間變化的對(duì)音頻信號(hào)水平的高度平滑的度量、然后使用所得度量來(lái)生成緩慢變化的增益,該增益在應(yīng)用于音頻信號(hào)時(shí)可以將音頻的平均水平自動(dòng)移動(dòng)到更接近希望的目標(biāo)水平。 在許多例子中的這兩個(gè)例子中,通過(guò)將某一形式的平滑濾波器應(yīng)用于對(duì)短期水平的度量來(lái)計(jì)算出平滑的水平度量。("短期"的意思是在比執(zhí)行后續(xù)的平滑處理的間隔明顯更短的時(shí)間間隔內(nèi)進(jìn)行計(jì)算。)例如,如在申請(qǐng)W0 2004/111994 A2中所述,可以在數(shù)十毫秒的間隔內(nèi)計(jì)算信號(hào)的均方根水平或者感知響度水平以生成短期水平。然后,后續(xù)的對(duì)該短期水平的平滑可以涉及到數(shù)秒量級(jí)的時(shí)間常數(shù)。在以下討論中,將該隨時(shí)間變化的對(duì)短期水平的度量表示為信號(hào)L[t],而將后續(xù)的平滑后的水平度量表示為[[t],其中t表示離散的時(shí)間索引。 許多類型的平滑濾波器可以應(yīng)用于L[t]以生成[[t]??梢允褂糜邢逈_激響應(yīng)(Finite Impulse Response, FIR)濾波器或者多極無(wú)限沖激響應(yīng)(Infinite ImpulseResponse, IIR)濾波器。所用具體濾波器不是關(guān)鍵的。出于示例目的,可以考慮常用的快速上升/緩慢釋放的單極IIR平滑器。利用這樣的濾波器,可以根據(jù)以下方程來(lái)更新平滑后的水平度量C[t]

(1)
a上升丄0 _ 1] + (1 — 上升)丄|>] 丄|>] _丄[t -1 ] > 0"釋放Z[f — 1] + (1 一 《釋放)丄P] — Z[t -1] s 0
可以選擇平滑系數(shù)a上升和a釋放使得a上升< a釋放。這意味著[[t]在L[t]增加(上升)時(shí)比在L[t]減少(釋放)時(shí)更快速地跟蹤L[t]。對(duì)于AGC,例如可以選擇與一秒的時(shí)間常數(shù)對(duì)應(yīng)的a ±#和與四秒的時(shí)間常數(shù)對(duì)應(yīng)的a k。這樣,[[t]隨時(shí)間很緩慢變化,結(jié)果,修改音頻的對(duì)應(yīng)增益也緩慢變化,由此維持原音頻的短期動(dòng)態(tài)性。然而,當(dāng)使用這樣大的時(shí)間常數(shù)時(shí)可能出現(xiàn)問(wèn)題。假設(shè)為了在節(jié)目之間和在各種頻道之間維持一致的平均水平,使用這樣的AGC對(duì)電視機(jī)的音頻進(jìn)行操作。在這樣的情形中,AGC處理的音頻信號(hào)的內(nèi)容可能驟然改變(例如在頻道改變時(shí)),而相關(guān)的音頻信號(hào)的平均水平因此也可能驟然改變。然而,AGC由于它的時(shí)間常數(shù)大而需要大量時(shí)間來(lái)收斂至新水平和使所處理的音頻的修改水平符合希望的目標(biāo)水平。在這樣的調(diào)整時(shí)間期間,電視的觀看者可以感覺(jué)到音頻的水平太響或者太低。結(jié)果,觀看者可能快速去拿遙控器以調(diào)節(jié)音量——而沒(méi)有想到自己只是在AGC收斂時(shí)與它對(duì)抗。 現(xiàn)有技術(shù)通常使用基于短期水平L[t]與平滑水平[[t]的相對(duì)關(guān)系來(lái)改變的時(shí)間常數(shù)來(lái)解決剛才描述的問(wèn)題。例如,如果信號(hào)的短期水平明顯大于或者少于由平滑水平周?chē)囊恍╅撝颠吔缢薅ǖ钠交?,則平滑操作分別向較快的上升時(shí)間常數(shù)和/或釋放時(shí)間常數(shù)切換,直至短期水平回落至平滑水平周?chē)拈撝颠吔鐑?nèi)。隨后,系統(tǒng)切換回原來(lái)較慢時(shí)間常數(shù)??梢孕薷姆匠蘬以通過(guò)包括四種情況而不是兩種情況來(lái)實(shí)施這一更復(fù)雜的平滑技術(shù)
a快上升丄1> _ + (1 _ a快上升)丄1>]"上升Z[f —1] + (l-a;上升)丄[f]
Z[,-1] + (l-a釋放)朋
釋放
丄W-丄[t]〉A(chǔ)L,決
0〈i:[f] — Z[t]sAL快
(2)
快釋放
丄[f —1] + (1_ 快釋放)
化]_訓(xùn)《-M
快 在方禾呈2中,a快上升< a上升禾口 a快釋放< a釋放意b未著a快上升禾口 a快釋放分另lJX寸應(yīng)于比a上升和a釋放更快的時(shí)間常數(shù)。如果a上升和a釋放分別對(duì)應(yīng)于1秒和4秒的時(shí)間常數(shù),則可以選擇例如分別與0. 1秒和0. 4秒的時(shí)間常數(shù)(快至十倍)對(duì)應(yīng)的a ^^和a ttffiK。必須合理地選擇快速時(shí)間常數(shù)閾值A(chǔ)Lft,使得向這些較快的時(shí)間常數(shù)的切換沒(méi)有太頻繁地出現(xiàn),造成不希望的平滑后的水平[[t]的不穩(wěn)定。例如,如果水平度量L[t]和[[t]表示以分貝為單位的均方根水平,則可以將ALft設(shè)置為10dB,約為感知響度的兩倍。
雖然相對(duì)于方程1中的平滑帶來(lái)了改善,但是方程2的平滑對(duì)于許多信號(hào)仍然有次優(yōu)表現(xiàn)。 一般而言,對(duì)于任意合理閾值A(chǔ)Lft,可以存在如下信號(hào),對(duì)于這些信號(hào)而言,短期水平L[t]的原來(lái)希望的動(dòng)態(tài)性在平均水平[[t]周?chē)拈撝颠吔缫酝獠▌?dòng),因此使平滑處理錯(cuò)誤地向快速上升或者釋放模式切換。 為了更好地理解其中方程2的平滑如希望的那樣表現(xiàn)以及其中該平滑表現(xiàn)不充分的情況,可以設(shè)想短期水平L[t]隨時(shí)間的分布??梢詫⑦@一分布設(shè)想為隨時(shí)間變化的如下概率密度,該概率密度預(yù)測(cè)在當(dāng)前時(shí)間索引t附近的時(shí)間間隔內(nèi)遇到短期水平L的任何特定值的概率。這一間隔的持續(xù)時(shí)間應(yīng)當(dāng)與方程2的平滑濾波器中所用的較慢的一組時(shí)間常數(shù)相當(dāng)。 現(xiàn)在針對(duì)之前描述的電視頻道改變的例子來(lái)考慮這種概率密度的行為。假定針對(duì)給定頻道的短期水平的動(dòng)態(tài)范圍有些限制,那么短期水平L[t]的概率密度函數(shù)呈現(xiàn)為位于平滑水平[[t]周?chē)南喈?dāng)窄的峰的形式。當(dāng)頻道改變時(shí),假設(shè)新頻道的平均水平明顯高于原頻道,那么概率密度函數(shù)將開(kāi)始改變新峰增長(zhǎng)到位于新頻道的更高平均水平周?chē)?,而原峰降低?圖l描繪了在描述的轉(zhuǎn)變開(kāi)始時(shí)的概率密度函數(shù)。在圖中,水平軸表示水平而豎直軸表示概率。實(shí)線表示短期水平在轉(zhuǎn)變開(kāi)始時(shí)的概率密度。注意左側(cè)為降低的峰(表示與舊頻道的選擇相關(guān)聯(lián)的概率的降低)而右側(cè)為增長(zhǎng)的峰(表示與新頻道的選擇相關(guān)聯(lián)的概率的升高)。在轉(zhuǎn)變開(kāi)始時(shí),平滑水平[[t-l]仍然落在舊頻道選擇的峰內(nèi),而短期水平L[t]落在新頻道的峰內(nèi)。在圖中,短期水平L[t]比[[t-l]超出大于ALft的數(shù)量,因此根據(jù)等式2,快速時(shí)間常數(shù)用來(lái)將[[t]朝向L[t]更新。這是希望的效果平滑水平[[t]快速適應(yīng)于新選擇的頻道的更高水平,從而快速躍過(guò)將概率密度的兩個(gè)峰分開(kāi)的間隙。
圖2描繪了對(duì)于大為不同的音頻信號(hào)的短期水平的概率密度。在這一情況下,信號(hào)的原動(dòng)態(tài)性比較大,因此概率密度的峰擴(kuò)展很寬。這樣的動(dòng)態(tài)性在高質(zhì)量記錄爵士或者經(jīng)典音樂(lè)時(shí)是典型的。也在圖2中,[[t-l]與L[t]之間的關(guān)系與圖1中完全相同,但是現(xiàn)在兩個(gè)值都落在概率密度的主峰內(nèi)。因此,因?yàn)閇[t-l]與L[t]之間的關(guān)系是信號(hào)的典型動(dòng)態(tài)性的一部分,所以向快速時(shí)間常數(shù)的切換是不希望的。在這一情況下,方程2描述的平滑并不合適。

發(fā)明內(nèi)容
這里教導(dǎo)用于平滑信號(hào)的隨時(shí)間變化的水平的方法、介質(zhì)和裝置。 一種方法包括估計(jì)信號(hào)的短期水平的隨時(shí)間變化的概率密度和通過(guò)使用概率密度來(lái)平滑信號(hào)的水平。信號(hào)可以是音頻信號(hào),而平滑后的水平和估計(jì)出的概率密度可以按近似相同的速率隨時(shí)間變化。 短期水平和平滑后的水平可以是時(shí)間序列,其每個(gè)都具有當(dāng)前時(shí)間索引和先前時(shí)
間索引。在本文中,在平滑之前可以計(jì)算在先前時(shí)間索引處的平滑后的水平的概率。在平滑
之前,可以使用概率密度來(lái)計(jì)算平滑參數(shù)。計(jì)算平滑參數(shù)可以包括使用在先前時(shí)間索引處
的平滑后的水平、在當(dāng)前時(shí)間索引處的短期水平和在先前時(shí)間索引處的平滑后的水平的概
率來(lái)計(jì)算平滑參數(shù)。計(jì)算平滑參數(shù)可以包括使用估計(jì)的概率密度的寬度來(lái)計(jì)算平滑參數(shù)。 計(jì)算平滑參數(shù)可以包括當(dāng)在先前時(shí)間索引處的平滑后的水平不大于閾值概率
時(shí),使用第一上升時(shí)間常數(shù)和釋放時(shí)間常數(shù);相反,當(dāng)在先前時(shí)間索引處的平滑后的水平大
于閾值概率時(shí),使用如下的上升和釋放時(shí)間常數(shù),該上升和釋放時(shí)間常數(shù)中的一個(gè)比它的
對(duì)應(yīng)第一時(shí)間常數(shù)更慢。所用的上升時(shí)間常數(shù)和釋放時(shí)間常數(shù)均可以比它們的對(duì)應(yīng)第一時(shí)
間常數(shù)更慢。
閾值概率可以是可變的??勺冮撝蹈怕士梢允枪烙?jì)的概率密度的函數(shù)。
平滑可以包括通過(guò)使用概率密度來(lái)平滑短期水平。 估計(jì)概率密度可以包括將參數(shù)表達(dá)與短期水平的以往值擬合。擬合可以包括將高斯混合模型與短期水平的以往值擬合。估計(jì)概率密度可以包括計(jì)算短期水平的以往值的直方圖。 —種計(jì)算機(jī)可讀存儲(chǔ)器,包含用于實(shí)現(xiàn)這里描述的方法中的任意一個(gè)的計(jì)算機(jī)程序。 —種計(jì)算機(jī)系統(tǒng),包括中央處理器、所述存儲(chǔ)器以及通信耦合中央處理器和存儲(chǔ)器的總線。 —種音頻信號(hào)水平平滑器,包括短期水平計(jì)算器,用于計(jì)算音頻信號(hào)的短期水平;水平平滑器,用于使用平滑參數(shù)來(lái)平滑音頻信號(hào)的水平;概率密度估計(jì)器,用于估計(jì)音頻信號(hào)的概率密度;概率計(jì)算器,用于計(jì)算經(jīng)延遲的平滑后的水平的概率;平滑參數(shù)計(jì)算器,用于計(jì)算平滑參數(shù);以及延遲器,用于延遲平滑后的水平。 概率密度估計(jì)器可以包括用于使用音頻信號(hào)的短期水平的時(shí)間序列來(lái)估計(jì)概率密度的概率密度估計(jì)器。概率計(jì)算器可以包括用于使用估計(jì)出的概率密度和經(jīng)延遲的平滑后的水平來(lái)計(jì)算概率的概率計(jì)算器。平滑參數(shù)計(jì)算器可以包括用于使用概率、經(jīng)延遲的平滑后的水平和短期水平來(lái)計(jì)算平滑參數(shù)的平滑參數(shù)計(jì)算器。概率計(jì)算器可以包括用于使用估計(jì)出的概率密度和經(jīng)延遲的平滑后的水平來(lái)計(jì)算概率的概率計(jì)算器,而平滑參數(shù)計(jì)算器可以包括用于使用概率、經(jīng)延遲的平滑后的水平和短期水平來(lái)計(jì)算平滑參數(shù)的平滑參數(shù)計(jì)算器。 水平平滑器可以包括用于平滑音頻信號(hào)的短期水平的水平平滑器。 概率密度估計(jì)器可以包括用于將參數(shù)表達(dá)與短期水平的以往值擬合的擬合器。參
數(shù)表達(dá)擬合器可以包括用于將高斯混合模型與短期水平的以往值擬合的擬合器。概率密度
估計(jì)器可以包括用于計(jì)算短期水平的以往值的直方圖的直方圖計(jì)算器。 另一種用于平滑信號(hào)的隨時(shí)間變化的水平的方法包括接收具有短期水平的信號(hào)和平滑隨時(shí)間變化的水平,其中短期水平和平滑后的隨時(shí)間變化的水平為時(shí)間序列,其每個(gè)具有當(dāng)前時(shí)間索引和先前時(shí)間索引,而平滑可以包括當(dāng)在先前時(shí)間索引處的平滑后的短期水平與在當(dāng)前時(shí)間索引處的短期水平之差超過(guò)指示使用快速時(shí)間常數(shù)的閾值時(shí),使用緩慢時(shí)間常數(shù)。 可以通過(guò)參照以下討論和附圖來(lái)更好地理解本發(fā)明的各種特征及其優(yōu)選實(shí)施例,在附圖中相似標(biāo)號(hào)指代相似元件。


圖1描繪了適合向快速平滑時(shí)間常數(shù)切換的音頻信號(hào)的短期水平的概率密度。 圖2描繪了不適合向快速平滑時(shí)間常數(shù)切換的音頻信號(hào)的短期水平的概率密度。 圖3描繪了本發(fā)明一個(gè)實(shí)施例的總體框圖。 圖4描繪了本發(fā)明一個(gè)實(shí)施例對(duì)在水平明顯不同的源之間切換的音頻信號(hào)的操作。 圖5是根據(jù)本發(fā)明一個(gè)實(shí)施例的平滑水平生成器的操作流程圖。
具體實(shí)施例方式
圖3是根據(jù)本發(fā)明一個(gè)實(shí)施例的平滑水平生成器3的框圖。 平滑水平生成器3包括短期水平計(jì)算器31、短期水平平滑器32、概率密度估計(jì)器33、概率計(jì)算器34、平滑參數(shù)計(jì)算器35和延遲器36。短期水平計(jì)算器31接收作為輸入的音頻信號(hào)3D,產(chǎn)生作為其輸出的短期水平L[t]37。概率密度估計(jì)器33接收作為輸入的短期水平L[t]37和產(chǎn)生作為其輸出的估計(jì)出的概率密度p(1, t)38。概率計(jì)算器34接收作為其輸入的估計(jì)出的概率密度P (1, t) 38和經(jīng)延遲的平滑后的水平度量[[t-l] 3C,產(chǎn)生作為其輸出的概率P([[t-l], t)39。平滑參數(shù)計(jì)算器35接收作為其輸入的概率p([[t-l],t)39以及經(jīng)延遲的平滑后的短期水平3B和短期水平L[t]37,產(chǎn)生作為其輸出的平滑參數(shù)3A。短期水平平滑器32接收作為其輸入的平滑參數(shù)3A和短期水平L[t]37,產(chǎn)生作為其輸出的平滑后的水平度量[[t] 3C。最后,延遲器36接收和延遲平滑后的水平度量[[t] 3C。
當(dāng)然,平滑水平生成器3可以整體或者部分地實(shí)施為包括已編程的存儲(chǔ)器的通用計(jì)算機(jī)、專用電路、可編程門(mén)陣列等。 接著描述根據(jù)一個(gè)實(shí)施例的平滑水平生成器3的操作。 平滑水平生成器3通過(guò)平滑短期水平估計(jì)L[t]來(lái)生成平滑后的水平估計(jì)[[t],其中至少部分地按照從短期水平L[t]的隨時(shí)間變化的概率密度估計(jì)導(dǎo)出的信息進(jìn)行控制。所生成的平滑后的水平估計(jì)[[t]例如可用作由實(shí)時(shí)響度計(jì)顯示的值或者在音頻動(dòng)態(tài)處理器(如AGC)中的控制路徑中使用。 圖5是根據(jù)本發(fā)明一個(gè)實(shí)施例的平滑水平生成器3的操作流程圖。首先,計(jì)算音頻信號(hào)的短期水平L[t](步驟505)。平滑該短期水平(步驟510),生成平滑的水平度量[[t]。 并行地,根據(jù)短期水平L[t]來(lái)更新短期水平的概率密度的隨時(shí)間變化的估計(jì)(步驟515)。這一概率密度估計(jì)p(l, t)返回輸入水平l的在零與一之間的概率。時(shí)間索引t表明在概率密度估計(jì)器33(圖3)接收短期水平L[t]的新值時(shí),這一函數(shù)隨時(shí)間改變。理想地,概率密度估計(jì)器33考慮用于創(chuàng)建估計(jì)p(l,t)的L[t]值的時(shí)間間隔應(yīng)當(dāng)與平滑器32用來(lái)生成[[t]的時(shí)間常數(shù)相當(dāng)。結(jié)果[[t]和p(l,t)以近似相同的速率隨時(shí)間變化。
通過(guò)向密度估計(jì)p(l, t)饋送水平值[[t-l]來(lái)計(jì)算(步驟520)來(lái)自先前時(shí)間索引的平滑后的水平度量的概率P([[t-l],t)。這一概率值p([[t-l],t表示與[[t-l]和短期水平在時(shí)間索引t周?chē)脑S多值之間的關(guān)系(不僅僅是[[t-l]與當(dāng)前短期水平L[t]之間的關(guān)系)有關(guān)的信息。例如,如果P([[t-l], t)較高,則這表明[[t-l]類似于短期水平在最近的許多值。相反,如果P([[t-l], t)較低,則[[t-l]不同于短期水平在最近的多數(shù)值。 _ 最后,概率值p([[t-l], t)以及當(dāng)前短期水平L[t]和先前的平滑后的水平度量[[t-l]饋送到平滑參數(shù)計(jì)算器35(圖3)中,該計(jì)算器使用這些值來(lái)選擇用于生成當(dāng)前的平滑后的水平度量[[t]的平滑參數(shù)(步驟525)。 雖然圖3描繪了控制平滑參數(shù)的p([[t-l], t),但是可以采用從密度估計(jì)p(l, t)得出的其它信息。例如,平滑參數(shù)計(jì)算器35可以使用密度估計(jì)的寬度度量,這是音頻信號(hào)的動(dòng)態(tài)范圍的指示。 回到p([[t-l], t)的示例使用,一般而言,當(dāng)密度估計(jì)p(l, t)估計(jì)出先前的平滑后的值[[t-l]具有低概率時(shí),那么應(yīng)當(dāng)用快速時(shí)間常數(shù)更新[[t]。如果[[t-l]的概率相對(duì)較高,則應(yīng)當(dāng)使用正常的較慢的時(shí)間常數(shù)。這樣,如果多數(shù)短期水平值已經(jīng)遠(yuǎn)離先前的平滑后的值[[t-l],則[[t]將朝向這些值更快移動(dòng)。如果[[t-l]已經(jīng)在多數(shù)短期水平值附
9近,則較慢的移動(dòng)是合適的。 參照?qǐng)D2,因?yàn)閇[t-l]仍然落在高概率區(qū)內(nèi)(雖然短期水平L[t]相對(duì)較遠(yuǎn)),所 以本發(fā)明的一個(gè)實(shí)施例可以防止不希望的向更快時(shí)間常數(shù)的切換。對(duì)于圖1中的頻道改變 例子,值得更具體地考察這一策略如何仍然產(chǎn)生希望的快速適應(yīng)。為了有所幫助,圖4描繪 了在五個(gè)階段中兩個(gè)頻道之間的轉(zhuǎn)變。 一種簡(jiǎn)單的時(shí)間常數(shù)控制策略假設(shè)當(dāng)P([[t-l],t) 大于某一閾值PT時(shí)使用緩慢時(shí)間常數(shù)來(lái)更新[[t-l]。當(dāng)p([[t-l],t)少于這一閾值PT時(shí) 使用快速時(shí)間常數(shù)。(圖中的符號(hào)中去除了時(shí)間下標(biāo)以簡(jiǎn)化表達(dá)。) 圖4的第一階段(初始穩(wěn)態(tài))描繪了緊接在選擇較響的第二頻道之前的狀態(tài)。短
期水平的概率密度緊密地分布于第一頻道的平均水平周?chē)F交蟮乃絒落在這一密度
的主峰內(nèi)。因此,[的概率P([)大于閾值PT,因此使用緩慢時(shí)間常數(shù)來(lái)更新[。 第二階段(轉(zhuǎn)變開(kāi)始)表示緊接在音頻已經(jīng)向較響的第二頻道切換之后的系統(tǒng)狀
態(tài)。在這一階段中,位于第一頻道的平均水平周?chē)母怕拭芏鹊拇蠓迨湛s,而位于較響的第
二頻道的平均水平周?chē)男路逶鲩L(zhǎng)。平滑水平[已經(jīng)開(kāi)始朝向第二頻道的平均水平右移。
然而它的概率仍然大于PT,因此仍然采用較慢時(shí)間常數(shù)。 在第三階段(轉(zhuǎn)變中間)中,概率分布的第一峰繼續(xù)收縮,而第二峰繼續(xù)增長(zhǎng)。平 滑后的水平[繼續(xù)朝向第二頻道向右生長(zhǎng),但是現(xiàn)在它的概率下降至閾值PT以下。([已經(jīng) 移入兩個(gè)峰之間的低概率間隙中。)這時(shí),使用快速時(shí)間常數(shù)來(lái)更新[,使得它快速越過(guò)間 隙而移向第二頻道的峰。 在第四階段(轉(zhuǎn)變結(jié)束)中,[已經(jīng)移入第二頻道的主峰中,它的概率再次大于PT。 現(xiàn)在進(jìn)行返回到較慢時(shí)間常數(shù)的切換。 最后在第五階段(新的穩(wěn)態(tài))中,平滑水平[已經(jīng)穩(wěn)定于第二頻道的平均水平,繼 續(xù)使用緩慢時(shí)間常數(shù)。 通過(guò)使用從隨時(shí)間變化的概率密度估計(jì)p(l, t)得出的信息,本發(fā)明實(shí)施例以在 真正的轉(zhuǎn)變時(shí)段期間快速響應(yīng)而對(duì)于先前有問(wèn)題的信號(hào)仍然保持穩(wěn)定的方式來(lái)適應(yīng)用于 平滑音頻信號(hào)水平度量的時(shí)間常數(shù)。 現(xiàn)在具體地描述本發(fā)明一個(gè)具體實(shí)施例的例子。在這一實(shí)施例中,從L[t]生成 [[t]的平滑處理可以被表達(dá)為具有隨時(shí)間變化的系數(shù)a [t]的單極濾波器
[[t] = a [t][[t-l] + (l-a [t])L[t](3) 通過(guò)根據(jù)概率密度估計(jì)p(l,t)來(lái)改變系數(shù)a [t],來(lái)對(duì)平滑進(jìn)行調(diào)整。先描述從 短期水平L[t]得出密度估計(jì)p(l,t)。然后描述系數(shù)a [t]的控制。
概率密度的估計(jì) 概率密度估計(jì)p(l,t)捕獲短期水平L[t]在從當(dāng)前時(shí)間索引t延伸到過(guò)去近期的 時(shí)間間隔內(nèi)的行為。為此,估計(jì)器33(圖3)維護(hù)包含短期水平L[t]的過(guò)去的T個(gè)值的緩 存器。(可以根據(jù)希望的應(yīng)用來(lái)選擇該緩存器的長(zhǎng)度T。對(duì)于之前討論的AGC例子,例如可 以設(shè)置緩存器的長(zhǎng)度等于四秒。) 從該緩存器可以用任意的多種方式生成概率密度的估計(jì)。例如,可以將參數(shù)表達(dá) (如高斯混合模型)與緩存器中的數(shù)據(jù)擬合。另一技術(shù)計(jì)算緩存數(shù)據(jù)的直方圖。緩存器中 的每個(gè)值分配給離散的格子(bin)。通過(guò)先找出值1落入的格子、然后將概率計(jì)算為數(shù)據(jù)緩 存器中分配給該格子的點(diǎn)的數(shù)目除以數(shù)據(jù)緩存器中的點(diǎn)的總數(shù)目,以計(jì)算出密度函數(shù)P (1,t)??梢詫⒅狈綀D的格子限定為以間距AL^位于某一最小水平Lmin與最大水平L^之間。
例如,如果以dB為單位表示水平,則可以設(shè)置Lmin = ldB、L隨=120dB和A Lbin = ldB以產(chǎn) 生具有120個(gè)格子的直方圖。格子的總數(shù)目B可以一般地表達(dá)為 J 一丄 <formula>formula see original document page 11</formula> 在每個(gè)時(shí)間瞬間t,對(duì)長(zhǎng)度為T(mén)的數(shù)據(jù)緩存器中落入直方圖的每個(gè)格子中的樣本 的數(shù)目進(jìn)行計(jì)數(shù)。Ht[b] (b = 1…B)表示直方圖的格子,可以根據(jù)映射函數(shù)計(jì)算水平值l被 分配到的格子b:
<formula>formula see original document page 11</formula>(5) <formula>formula see original document page 11</formula> 在算法上,根據(jù)以下偽代碼計(jì)算每個(gè)時(shí)間t的直方圖Ht[b]: for b = 1 to B,
Ht[b] = 0 end for r =0 to T_l, b = LevelToBin (L[t_ t ]) Ht[b] = Ht[b]+1 end 然后,通過(guò)在1被分配到的格子處的直方圖除以緩存器中的數(shù)據(jù)點(diǎn)的總數(shù)目給出 概率密度估計(jì)P(l,t): <formula>formula see original document page 11</formula>
結(jié)果是估計(jì)出的概率密度p(l, t)不是輸入水平1的連續(xù)函數(shù)而是以ALbin的間 隔"逐級(jí)階躍"的函數(shù)。然而如果直方圖間距ALbin足夠小,概率密度估計(jì)對(duì)于實(shí)際用途而 言也足夠光滑。 平滑濾波器系數(shù)的計(jì)算 現(xiàn)在描述自適應(yīng)濾波器系數(shù)a [t]的計(jì)算。在正常條件之下,當(dāng)[[t-l]的概率相 對(duì)較高時(shí)使用正常的上升時(shí)間常數(shù)和釋放時(shí)間常數(shù)(如在方程l中那樣)。當(dāng)[[t-l]的概 率較低時(shí)使用較快的上升時(shí)間常數(shù)和釋放時(shí)間常數(shù)。 為了在正常時(shí)間常數(shù)與快速時(shí)間常數(shù)之間平滑地插值,基于從密度估計(jì)p(l, t) 計(jì)算出的[[t-l]概率來(lái)生成范圍在零與一之間的控制信號(hào)13 [t]:
<formula>formula see original document page 11</formula> 則= 如果p([[t-l],t)大于閾值PT,則控制信號(hào)13 [t]等于一。隨著p([[t-l],t)下 降至Pt以下,控制信號(hào)13 [t]下降至零。最后,通過(guò)基于控制信號(hào)13 [t]在正常與快速的 上升和釋放系數(shù)之間插值來(lái)計(jì)算平滑濾波器系數(shù)a [t]。<formula>formula see original document page 12</formula> 當(dāng)|3 [t]等于零時(shí)([[t-l]落在低概率區(qū)中),使用快速上升系數(shù)和快速釋放系
數(shù)。當(dāng)e [t]等于一 ([[t-l]落在高概率區(qū)中)時(shí),則使用正常上升和釋放系數(shù)。 為了實(shí)施AGC,可以設(shè)置分別與1秒、0. l秒、4秒和0. 4秒的時(shí)間常數(shù)對(duì)應(yīng)的a上升、
a快上升、a釋放和a快釋放值??梢詫⒏怕书撝礟T的值設(shè)置 為0. 075的固定值。
盡管這一實(shí)施例使用固定值的閾值PT,但是在一些應(yīng)用中使pT為可變閾值(例如 根據(jù)密度估計(jì)P(l, t)的某一度量而改變)也可以是有利的。例如,Pt可以隨著水平1中 的最大值P(l,t)而變化。 本說(shuō)明書(shū)通過(guò)引用合并了本文提到的所有出版物和專利申請(qǐng),也就是說(shuō)本說(shuō)明書(shū) 已經(jīng)通過(guò)引用來(lái)具體和個(gè)別地合并這樣的各個(gè)出版物或者專利申請(qǐng)。 由于可以在不脫離本發(fā)明的實(shí)質(zhì)精神的情況下用多個(gè)形式實(shí)施本發(fā)明,所以本文 中實(shí)施例為示例而非限制。因此,落入權(quán)利要求的界限和范圍內(nèi)或者落入這樣的界限和范 圍的等同內(nèi)的改變將被權(quán)利要求所涵蓋。
權(quán)利要求
一種用于平滑信號(hào)的隨時(shí)間變化的水平的方法,所述方法包括估計(jì)所述信號(hào)的短期水平的隨時(shí)間而變化的概率密度;以及使用所述概率密度來(lái)平滑所述信號(hào)的水平。
2. 根據(jù)權(quán)利要求1所述的方法,其中 所述信號(hào)是音頻信號(hào)。
3. 根據(jù)權(quán)利要求1所述的方法,其中平滑后的水平和估計(jì)出的概率密度以近似相同的速率隨時(shí)間變化。
4. 根據(jù)權(quán)利要求1所述的方法,其中所述短期水平和所述平滑后的水平為時(shí)間序列,其每個(gè)具有當(dāng)前時(shí)間索引和先前時(shí)間 索引;以及在所述平滑之前進(jìn)行以下操作計(jì)算在所述先前時(shí)間索引處所述平滑后的水平的概率。
5. 根據(jù)權(quán)利要求1所述的方法,其中 在所述平滑之前進(jìn)行以下操作使用所述概率密度來(lái)計(jì)算平滑參數(shù)。
6. 根據(jù)權(quán)利要求5所述的方法,其中 所述平滑參數(shù)的計(jì)算包括使用在所述先前時(shí)間索引處的所述平滑后的水平、在所述當(dāng)前時(shí)間索引處的所述短期 水平和在所述先前時(shí)間索引處的所述平滑后的水平的概率來(lái)計(jì)算所述平滑參數(shù)。
7. 根據(jù)權(quán)利要求5所述的方法,其中 所述平滑參數(shù)的計(jì)算包括使用所述估計(jì)出的概率密度的寬度來(lái)計(jì)算所述平滑參數(shù)。
8. 根據(jù)權(quán)利要求6所述的方法,其中 所述平滑參數(shù)的計(jì)算包括當(dāng)在所述先前時(shí)間索引處的所述平滑后的水平不大于閾值概率時(shí),使用第一上升時(shí)間 常數(shù)和釋放時(shí)間常數(shù);以及相反,當(dāng)在所述先前時(shí)間索引處的所述平滑后的水平大于所述閾值概率時(shí),使用如下 的上升時(shí)間常數(shù)和釋放時(shí)間常數(shù),所述上升時(shí)間常數(shù)和釋放時(shí)間常數(shù)之一比其對(duì)應(yīng)的第一 時(shí)間常數(shù)更慢。
9. 根據(jù)權(quán)利要求8所述的方法,其中上升常數(shù)和釋放常數(shù)的使用包括 使用如下的上升時(shí)間常數(shù)和釋放時(shí)間常數(shù),所述上升時(shí)間常數(shù)和釋放時(shí)間常數(shù)都比其對(duì)應(yīng)的第一時(shí)間常數(shù)更慢。
10. 根據(jù)權(quán)利要求6所述的方法,其中 所述閾值概率是可變的。
11. 根據(jù)權(quán)利要求10所述的方法,其中 可變閾值概率是所述估計(jì)出的概率密度的函數(shù)。
12. 根據(jù)權(quán)利要求l-ll中的任一權(quán)利要求所述的方法,其中所述平滑包括使用所述概 率密度來(lái)平滑所述短期水平。
13. 根據(jù)權(quán)利要求1-11中的任一權(quán)利要求所述的方法,其中估計(jì)所述概率密度包括將參數(shù)表達(dá)與所述短期水平的以往值擬合。
14. 根據(jù)權(quán)利要求13所述的方法,其中所述擬合包括 將高斯混合模型與所述短期水平的所述以往值擬合。
15. 根據(jù)權(quán)利要求1-11中的任一權(quán)利要求所述的方法,其中估計(jì)所述概率密度包括 計(jì)算所述短期水平的以往值的直方圖。
16. —種計(jì)算機(jī)可讀存儲(chǔ)器,包含用于實(shí)現(xiàn)根據(jù)權(quán)利要求l-ll的方法中的任一方法的 計(jì)算機(jī)程序。
17. —種計(jì)算機(jī)系統(tǒng),包括 中央處理器;根據(jù)權(quán)利要求16所述的存儲(chǔ)器;以及總線,通信耦合所述中央處理器和所述存儲(chǔ)器。
18. —種音頻信號(hào)水平平滑器,包括 短期水平計(jì)算器,用于計(jì)算音頻信號(hào)的短期水平; 水平平滑器,用于使用平滑參數(shù)來(lái)平滑所述音頻信號(hào)的水平; 概率密度估計(jì)器,用于估計(jì)所述音頻信號(hào)的概率密度; 概率計(jì)算器,用于計(jì)算經(jīng)延遲的平滑后的水平的概率;平滑參數(shù)計(jì)算器,用于計(jì)算所述平滑參數(shù);以及 延遲器,用于延遲所述平滑后的水平。
19. 根據(jù)權(quán)利要求18所述的音頻信號(hào)水平平滑器,其中所述概率密度估計(jì)器包括 用于使用所述音頻信號(hào)的所述短期水平的時(shí)間序列來(lái)估計(jì)概率密度的概率密度估計(jì)器。
20. 根據(jù)權(quán)利要求18所述的音頻信號(hào)水平平滑器,其中所述概率計(jì)算器包括用于使用估計(jì)出的概率密度和經(jīng)延遲的平滑后的水平來(lái)計(jì)算所述概率的概率計(jì)算器。
21. 根據(jù)權(quán)利要求18所述的音頻信號(hào)水平平滑器,其中所述平滑參數(shù)計(jì)算器包括用于使用所述概率、所述經(jīng)延遲的平滑后的水平和所述短期水平來(lái)計(jì)算所述平滑參數(shù) 的平滑參數(shù)計(jì)算器。
22. 根據(jù)權(quán)利要求19所述的音頻信號(hào)水平平滑器,其中所述概率計(jì)算器包括用于使用所述估計(jì)出的概率密度和所述經(jīng)延遲的平滑后的水平來(lái)計(jì)算所述概率的概 率計(jì)算器;以及所述平滑參數(shù)計(jì)算器,包括用于使用所述概率、所述經(jīng)延遲的平滑后的水平和所述短期水平來(lái)計(jì)算平滑參數(shù)的平 滑參數(shù)計(jì)算器。
23. 根據(jù)權(quán)利要求18-22所述的音頻信號(hào)水平平滑器,其中所述水平平滑器包括 用于平滑所述音頻信號(hào)的所述短期水平的水平平滑器。
24. 根據(jù)權(quán)利要求18-22所述的音頻信號(hào)水平平滑器,其中所述概率密度估計(jì)器包括 擬合器,用于將參數(shù)表達(dá)與所述短期水平的以往值擬合。
25. 根據(jù)權(quán)利要求24所述的音頻信號(hào)水平平滑器,其中所述參數(shù)表達(dá)擬合器包括 用于將高斯混合模型與所述短期水平的以往值擬合的擬合器。
26. 根據(jù)權(quán)利要求18-22所述的音頻信號(hào)水平平滑器,其中所述概率密度估計(jì)器包括用于計(jì)算所述短期水平的以往值的直方圖的直方圖計(jì)算器。
27. —種用于平滑信號(hào)的隨時(shí)間變化的水平的方法,所述方法包括 接收具有短期水平的信號(hào);以及 平滑所述隨時(shí)間變化的水平,其中所述短期水平和平滑后的隨時(shí)間變化的水平為時(shí)間序列,其每個(gè)具有當(dāng)前時(shí)間索引和 先前時(shí)間索引,以及 所述平滑包括當(dāng)在所述先前時(shí)間索引處的平滑后的短期水平與在當(dāng)前時(shí)間索引處的短期水平之差 超過(guò)指示使用快速時(shí)間常數(shù)的閾值時(shí),使用緩慢時(shí)間常數(shù)。
全文摘要
用于平滑信號(hào)的隨時(shí)間變化的水平的方法、介質(zhì)和裝置。該方法包括估計(jì)信號(hào)的短期水平的隨時(shí)間變化的概率密度和通過(guò)使用概率密度來(lái)平滑信號(hào)的水平。信號(hào)可以是音頻信號(hào)。短期水平和平滑后的水平可以是各自具有當(dāng)前時(shí)間索引和先前時(shí)間索引的時(shí)間序列。這里,在平滑之前可以計(jì)算在先前時(shí)間索引處的平滑后的水平的概率。在平滑之前可以使用概率密度來(lái)計(jì)算平滑參數(shù)。計(jì)算平滑參數(shù)可以包括使用在先前時(shí)間索引處的平滑后的水平、在當(dāng)前時(shí)間索引處的短期水平和在先前時(shí)間索引處的平滑后的水平的概率來(lái)計(jì)算平滑參數(shù)。計(jì)算平滑參數(shù)可以包括使用估計(jì)的概率密度的寬度來(lái)計(jì)算平滑參數(shù)。
文檔編號(hào)H03G3/30GK101743689SQ200880024506
公開(kāi)日2010年6月16日 申請(qǐng)日期2008年7月11日 優(yōu)先權(quán)日2007年7月13日
發(fā)明者阿蘭·杰弗里·西費(fèi)爾特 申請(qǐng)人:杜比實(shí)驗(yàn)室特許公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1