專利名稱:頻譜建模的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通過確定具有近似于目標(biāo)頻譜的頻率響應(yīng)的濾波器的濾波參量而建立目標(biāo)頻譜的模型。
P.Stoica和R.L.Moses,在“Introduction to spectral analysis(頻譜分析導(dǎo)論)”,Prentice Hall,New Jersey,1997,pp.101-108,中公開了用于建立合理的頻譜模型的參量方法。通常,運(yùn)動(dòng)平均(MA)信號(hào)是通過用全零點(diǎn)濾波器濾波白色噪聲而得到的。由于這個(gè)全零點(diǎn)結(jié)構(gòu),不可能使用MA方程來建立帶有尖的峰值的頻譜的模型,除非MA階數(shù)被選擇為“足夠大”。這與自回歸(AR)的能力,或通過使用相當(dāng)?shù)偷哪P碗A數(shù)建立窄帶頻譜的模型的、全極點(diǎn)的方程,成為對(duì)比。MA模型提供對(duì)于其特征為寬的峰值和尖的零點(diǎn)的那些頻譜的良好的近似。這樣的頻譜在應(yīng)用中比起窄帶頻譜更不經(jīng)常遇到,因此,使用MA信號(hào)模型用于頻譜估值在工程上的興趣,多少是有限的。這種有限的興趣的另一個(gè)原因在于,MA參量估值問題基本上是非線性問題,它的求解方法比起AR參量估值問題難得多。無論如何,MA和ARMA估值問題的困難的類型相當(dāng)類似。
具有尖的峰值和深的零點(diǎn)的頻譜不能通過合理的小的階數(shù)的AR或MA方程來建立模型。正是在這些情形下,其中更一般的ARMA模型,也被稱為極點(diǎn)-零點(diǎn)模型,是有價(jià)值的。然而,ARMA頻譜估值的很大的初始約定減小到某個(gè)程度,因?yàn)閺睦碚摵蛯?shí)踐觀點(diǎn)看來,對(duì)于ARMA參量估值還沒有很好地建立的算法?!袄碚撋献罴袮RMA估值器”是基于其總的收斂不能保證的迭代程序過程?!皩?shí)踐的ARMA估值器”是計(jì)算上簡(jiǎn)單的以及常常是可靠的,但它們的統(tǒng)計(jì)精度在某些情形下可能是差的?,F(xiàn)有技術(shù)公開了兩級(jí)的模型,其中首先執(zhí)行AR估值,然后執(zhí)行MA估值。兩個(gè)方法都給出不精確的估值,或在其中ARMA模型描述的極點(diǎn)和零點(diǎn)一起接近于單位圓附近的位置處的情形下需要高的計(jì)算工作量。這樣的ARMA模型,具有接近于一的、幾乎重合的模數(shù)的極點(diǎn)和零點(diǎn),相應(yīng)于窄帶信號(hào)。在兩個(gè)方法中,零點(diǎn)的估值轉(zhuǎn)換為非線性最優(yōu)化問題。
本發(fā)明的一個(gè)目的是提供不太復(fù)雜的ARMA頻譜建模。為此,本發(fā)明提供如在獨(dú)立的權(quán)利要求中規(guī)定的、用于建立目標(biāo)頻譜的模型的方法和設(shè)備,編碼音頻信號(hào)的方法,譯碼編碼的音頻信號(hào)的方法,音頻編碼器,音頻單放機(jī),音頻系統(tǒng),編碼的音頻信號(hào),和存儲(chǔ)媒體。在所附的權(quán)利要求中限定了獨(dú)到的實(shí)施例。
在本發(fā)明的第一實(shí)施例中,要被建模的頻譜被分割成第一部分和第二部分,其中第一部分由第一模型被建模,得到自回歸參量,以及第二部分由第二模型被建模,得到運(yùn)動(dòng)平均參量。構(gòu)成的處理過程的組合提供精確的ARMA模型。分割優(yōu)選地是以迭代處理過程來執(zhí)行的。在按照本發(fā)明的方法中,非線性最優(yōu)化問題可被省略。
本發(fā)明提供適合于實(shí)時(shí)實(shí)施的ARMA模型估值。本發(fā)明認(rèn)識(shí)到,AR或MA模型在輸送功率譜估值的信息時(shí)不總是精確的或非常節(jié)儉的。在對(duì)數(shù)尺度上,用線性預(yù)測(cè)編碼(LPC)方法(全極點(diǎn)建模),函數(shù)的峰值常常被很好地建模,但谷底是欠估值的。在全零點(diǎn)模型中出現(xiàn)相反的結(jié)果。在音頻和語音編碼中,這是本發(fā)明最想要的應(yīng)用領(lǐng)域,對(duì)數(shù)尺度比起線性尺度是更適當(dāng)?shù)摹K?,最好是在?duì)數(shù)尺度上很好地適配于功率譜。按照本發(fā)明的模型給出在復(fù)雜性與精度之間的較好的折衷。在本模型中的誤差可以在對(duì)數(shù)尺度上被評(píng)估。
在本發(fā)明的優(yōu)選實(shí)施例中,第二建模運(yùn)行包括對(duì)目標(biāo)頻譜的第二部分的倒數(shù)使用第一建模運(yùn)行的步驟。在本實(shí)施例中,只需要規(guī)定一個(gè)建模運(yùn)行,其中自回歸參量是通過頻譜的第一部分的建模而得到的,以及運(yùn)動(dòng)平均參量是通過由同樣的運(yùn)行(即,第一建模運(yùn)行)對(duì)頻譜的第二部分的倒數(shù)建模而得到的。雖然不太好,但也有可能使用第二建模運(yùn)行,它產(chǎn)生第二部分的運(yùn)動(dòng)平均參量,以及也有可能通過對(duì)頻譜的第一部分的倒數(shù)使用同樣的第二建模運(yùn)行,而得到自回歸參量。
本發(fā)明優(yōu)選地被使用于對(duì)音頻信號(hào)中的噪聲分量的參量建模。音頻信號(hào)可包括聲音,通常像音樂,但也可以是語音。除了上述的優(yōu)點(diǎn)以外,按照本發(fā)明的ARMA模型具有另外的優(yōu)點(diǎn)對(duì)于噪聲分量的精確的建模,它比起在全AR或MA建模時(shí)的情形下在可比較的精度下需要較少的參量。較少的參量是指較好的壓縮。
雖然本發(fā)明優(yōu)選地被使用于音頻信號(hào)中噪聲分量的參量建模,但本發(fā)明也可使用于噪聲抑制方案,其中噪聲頻譜的估值從信號(hào)中被減去。
在按照Stoica和Moses的現(xiàn)有技術(shù)方法中,計(jì)算負(fù)擔(dān)在于矩陣求逆。而且,不清楚AR模型的階數(shù)應(yīng)當(dāng)被設(shè)置為什么數(shù)值,除了需要零點(diǎn)高度接近于單位圓。所以,計(jì)算復(fù)雜性很難接近。在按照本發(fā)明的方法中,計(jì)算負(fù)擔(dān)在于分割處理過程的迭代性質(zhì)以及到頻域的變換(Stoica和Moses主要在時(shí)域上進(jìn)行計(jì)算)。本發(fā)明在零點(diǎn)接近于單位圓的情形下,提供更好的結(jié)果。而且,到頻域的變換開創(chuàng)操作的可能性。例子是根據(jù)現(xiàn)有的和測(cè)量的數(shù)據(jù)進(jìn)行分割的頻率。另一個(gè)優(yōu)點(diǎn)是對(duì)于頻率數(shù)據(jù)的可應(yīng)用性。正如下面說明的。為了保證實(shí)時(shí)ARMA建模,應(yīng)當(dāng)應(yīng)用到頻域的快速變換,例如,技術(shù)上熟知的、Welch平均周期圖方法。
自回歸和運(yùn)動(dòng)平均參量可以用多項(xiàng)式、多項(xiàng)式的零點(diǎn)(連同增益因子)、反射系數(shù)或?qū)?shù)(區(qū)域)比值,以不同的方式被表示。在音頻編碼應(yīng)用中,自回歸和運(yùn)動(dòng)平均參量的代表法優(yōu)選地是以對(duì)數(shù)(區(qū)域)比值。在按照本發(fā)明的ARMA建模中確定的自回歸和運(yùn)動(dòng)平均參量被組合來得出被發(fā)送的濾波器參量。
WO 97/28527公開了通過確定背景噪聲PSD估值、確定具有噪聲的語音參量、從語音參量確定具有噪聲的語音PSD估值、從具有噪聲的語音PSD估值中減去背景噪聲PSD估值、以及從增強(qiáng)的語音PSD估值來估計(jì)增強(qiáng)的語音參量,而增強(qiáng)語音參量。增強(qiáng)的參量可被使用于濾波具有噪聲的語音,以便抑制噪聲,或在語音編碼時(shí)被直接使用作為語音參量。PSD的估值可通過自回歸模型而被得到。應(yīng)當(dāng)指出,在本文件中,這樣的估值并不是統(tǒng)計(jì)上一致的估值,但在語音信號(hào)處理中這不是嚴(yán)重的問題。
美國(guó)專利5,943,429公開了在基于幀的數(shù)字通信系統(tǒng)中的頻譜相減噪聲抑制方法。方法是通過基于非語音幀的背景噪聲的功率譜密度的估值和語音幀的背景噪聲的功率譜密度的估值的頻譜相減功能被執(zhí)行的。每個(gè)語音幀通過減小自由度的數(shù)目的參量模型被近似。每個(gè)語音幀的功率譜密度的估值根據(jù)近似的參量模型被估值。另外,在這種情形下,參量模型是AR模型。
美國(guó)專利4,188,667公開了ARMA濾波器和用于得出對(duì)于這樣的濾波器的參量的方法。這個(gè)方法的第一步驟包括執(zhí)行任意選擇的幅度頻譜的離散富立葉逆變換,得出穩(wěn)定的純運(yùn)動(dòng)平均濾波器模型的截?cái)嗟南禂?shù)序列,即,非回歸濾波器模型的參量。截?cái)嗟南禂?shù)序列,具有N+1項(xiàng),然后與隨機(jī)序列進(jìn)行卷積,得出與隨機(jī)序列有關(guān)的輸出。然后,執(zhí)行時(shí)域收斂參量識(shí)別,以使得整個(gè)誤差函數(shù)范數(shù)最小化,得出具有想要的幅度和相位頻率響應(yīng)的模型的接近最小階數(shù)的自回歸和運(yùn)動(dòng)平均參量。參量是離線地識(shí)別的。本實(shí)施例的目的是提供最小的或接近最小的穩(wěn)定的ARMA濾波器。參量是在分批濾波程序中被確定的。
總之,估值功率譜密度函數(shù)不同于表征一個(gè)線性系統(tǒng)在于尤其是在這樣的特征中,輸入和輸出信號(hào)是可提供和被使用的,而在估值功率譜密度函數(shù)時(shí),僅僅功率譜密度函數(shù)是可提供的(不是相關(guān)的輸入信號(hào))。
參照此后描述的實(shí)施例將了解和說明本發(fā)明的上述的和其它的方面。
在附圖上
圖1顯示按照本發(fā)明的、包括音頻編碼器的說明性實(shí)施例;圖2顯示按照本發(fā)明的、包括音頻單放機(jī)的說明性實(shí)施例;圖3顯示按照本發(fā)明的、音頻系統(tǒng)的說明性實(shí)施例;圖4顯示示例性映射函數(shù)m;以及圖5顯示按照本發(fā)明的、噪聲抑制裝置的實(shí)施例。
附圖只示出了對(duì)于了解本發(fā)明必須的那些單元。
本發(fā)明優(yōu)選地應(yīng)用于其中利用合成的噪聲生成的音頻和語音編碼方案。典型地,音頻信號(hào)按逐幀的原則被編碼。在一幀中的噪聲的功率譜密度函數(shù)(或是它的可能非均勻采樣的版本)被估值,以及找到來自某個(gè)類型的濾波器的一組平方幅度響應(yīng)的函數(shù)的最好的近似。在本發(fā)明的一個(gè)實(shí)施例中,使用迭代程序過程來根據(jù)用于使AR和MA模型適合于功率譜密度函數(shù)的、現(xiàn)有的低復(fù)雜性的技術(shù)估值A(chǔ)RMA模型。
圖1顯示按照本發(fā)明的、示例的音頻編碼器2。音頻信號(hào)A是從音頻源1,諸如話筒、存儲(chǔ)媒體、網(wǎng)絡(luò)等得出的。音頻信號(hào)A被輸入到音頻編碼器2。音頻信號(hào)A在音頻編碼器2中逐幀地被參量地建模。編碼單元20包括分析單元(AU)200和合成單元(SU)201。AU 200執(zhí)行音頻信號(hào)的分析,以及確定在音頻信號(hào)A中的基本波形。而且,AU 200產(chǎn)生表示基本波形的波形參量或系數(shù)Ci。波形參量Ci被提供給SU 201,以便得出重新構(gòu)建的音頻信號(hào),它包含合成的基本波形。這個(gè)重新構(gòu)建的音頻信號(hào)被提供給減法器21,從原先的音頻信號(hào)A中被減去。這個(gè)剩余的信號(hào)S被看作為是音頻信號(hào)A的噪聲分量。在優(yōu)選的實(shí)施例中,編碼單元20包括兩級(jí)執(zhí)行瞬時(shí)建模的一級(jí),以及在減去建模的瞬時(shí)分量以后對(duì)音頻信號(hào)執(zhí)行正弦建模的另一級(jí)。
按照本發(fā)明的一個(gè)方面,音頻信號(hào)A中的噪聲分量S的功率譜密度函數(shù)被ARMA建模,導(dǎo)致自回歸參量pi和運(yùn)動(dòng)平均參量qi。噪聲分量S的頻譜在噪聲分析器(NA)22中按照本發(fā)明被建模,得出濾波器參量(pi,qi)。參量(pi,qi)的估值通過確定在NA 22中具有轉(zhuǎn)移函數(shù)H-1的濾波器的濾波參量而被執(zhí)行,該轉(zhuǎn)移函數(shù)使得函數(shù)S在濾波(即,H-1(S))后頻譜盡可能平坦,即,“使得頻譜白化”。在譯碼器中,重新構(gòu)建的噪聲分量可以通過用具有與在編碼器中使用的濾波器相反的轉(zhuǎn)移函數(shù)H的濾波器濾除白色噪聲而被產(chǎn)生為近似地具有與噪聲分量S相同的性質(zhì)。這個(gè)相反的濾波器的濾波運(yùn)行是由ARMA參量pi和qi確定的。濾波器參量(pi,qi)連同波形參量Ci一起在復(fù)接器23中被包括在編碼的音頻信號(hào)A’。音頻信號(hào)A’在通信信道3上從音頻編碼器被提供到音頻單放機(jī),該通信信道可以是無線連接,數(shù)據(jù)總線或貯存媒體等等。
按照本發(fā)明的、包括音頻單放機(jī)4的實(shí)施例被顯示于圖2。音頻信號(hào)A’從通信信道3得出,以及在分接器40中被分接,得出被包括在編碼的音頻信號(hào)A’中的參量(pi,qi)和波形參量Ci。參量(pi,qi)被提供給噪聲分析器(NS)41。NS 41主要是具有轉(zhuǎn)移函數(shù)H的濾波器。白色噪聲信號(hào)y被輸入到NS 41。NS 41的濾波運(yùn)行由ARMA參量(pi,qi)被確定。通過用與在編碼器2中使用的濾波器(NA)22相反的NS 41濾波白色噪聲y,噪聲分量S’被產(chǎn)生為近似具有與在原先的音頻信號(hào)A中的噪聲分量S相同的隨機(jī)性質(zhì)。噪聲分量S’在加法器43中被加到從合成單元(SU)42得到的、其它的重新構(gòu)建的音頻信號(hào),以便得出重新構(gòu)建的音頻信號(hào)(A”)。SU 42類似于SU 201。重新構(gòu)建的音頻信號(hào)A”被提供到輸出端5,它可以是揚(yáng)聲器等等。
圖3顯示按照本發(fā)明的音頻系統(tǒng),包括圖1所示的音頻編碼器2和圖2所示的音頻單放機(jī)4。這樣的系統(tǒng)提供重放和記錄特性。通信信道3可以是音頻系統(tǒng)的一部分,但常常是在音頻系統(tǒng)以外。萬一通信信道3是貯存媒體,則貯存媒體可被固定在系統(tǒng)中,或是可移動(dòng)的軟盤,存儲(chǔ)器棒,磁帶等等。
下面,進(jìn)一步描述S的頻譜的建模。假設(shè)S是離散時(shí)間實(shí)時(shí)數(shù)值信號(hào)的功率譜密度函數(shù)。而且,S是被定義在間隔I=(-π,π)上的實(shí)數(shù)函數(shù)。S被假設(shè)為對(duì)稱的,具有min(S)>0和max(S)<∞。為了方便起見,假定S的對(duì)數(shù)平均值等于零,即 擴(kuò)展到在對(duì)數(shù)尺度上的平均值不等于零的情形是直接了當(dāng)?shù)?,但可以以各種方式來處理。應(yīng)當(dāng)指出,S可以通過適當(dāng)?shù)膬?nèi)插和歸一化從實(shí)際測(cè)量的功率譜密度函數(shù)得出。
令H是按照H=B/A的、具有A=∏i=1N(1-z-1pi)和B=∏i=1M(1-z-1qi)的分式轉(zhuǎn)移函數(shù)。這里,pi和qi分別是轉(zhuǎn)移函數(shù)H的極點(diǎn)和零點(diǎn)。應(yīng)當(dāng)指出,|H|2的對(duì)數(shù)平均值也等于零。
目標(biāo)函數(shù)用H的平方模來近似,即,S≈|H|2。
對(duì)于近似的正確性的度量通過下式給出 準(zhǔn)則(2)根據(jù)S和|H|2具有等于零的對(duì)數(shù)平均值而被重寫為 而且如果對(duì)于每個(gè)θ,S(θ)/|H(ejv)|2≈1,則準(zhǔn)則(2)被近似為J’-1,其中 這意味著,在最佳解的相鄰區(qū)域中,準(zhǔn)則(2)和(4)實(shí)際上是相同的。
眾所周知,在H=1/A(即,B=1)的情形下,(4)與前向線性預(yù)測(cè)(FLP)有關(guān),這是LPC方法的例子。所以,多項(xiàng)式A可以通過計(jì)算(或至少近似)與S有關(guān)的自相關(guān)函數(shù)以及求解Wiener-Hopf方程而找到。這樣的程序過程的定量結(jié)果也是熟知的。以上概述的程序過程將給出對(duì)S的峰值的良好的近似(當(dāng)在對(duì)數(shù)尺度上被測(cè)量或被看出),但通常對(duì)S的谷底值提供差的適配值。為了作出以上的結(jié)論,標(biāo)準(zhǔn)的程序過程可供使用于從功率譜密度函數(shù)估值全極點(diǎn)模型,它通過(2)提供最佳解的近似,以及它在S的峰值建模時(shí)基本上是良好的。
應(yīng)當(dāng)指出,lnS的峰值和谷底基本上具有相同的特性,除了符號(hào)相反以外峰值是正的振幅,而低谷是負(fù)的振幅。因此,取=1/S,全零模型可以通過使用以使得概述的程序過程而被估值。根據(jù)這個(gè)程序過程的結(jié)果,可以預(yù)期對(duì)S的谷底的良好的適配,但對(duì)S的峰值只是差的或至多相當(dāng)適配。
本發(fā)明的目的是提供對(duì)于峰值和谷底時(shí)S的良好的代表。在本發(fā)明的實(shí)施例中,提供了ARMA模型,其中全極點(diǎn)模型和全零點(diǎn)模型按以下的方式被組合。S被分割成兩個(gè)部分,作為S=SA/SB。從SA,估值全極點(diǎn)模型,產(chǎn)生多項(xiàng)式A,以及從SB,估值全零點(diǎn)模型,產(chǎn)生多項(xiàng)式B。組合|H|2=|B|2/|A|2被認(rèn)為是S的近似式。
按照本發(fā)明的優(yōu)選的方面,S的分割按迭代過程被執(zhí)行。迭代步驟被稱為l。在每個(gè)迭代步驟,產(chǎn)生新的分割SA,l和SB,l以及計(jì)算Al和Bl。在SA和SB中的S的再劃分被使用來開始,此后,沒有被精確地建模的SB的部分貢獻(xiàn)給SA,反之亦然。在迭代方案的步驟l-1中,Hl-1=Bl-1/Al-1。此后,考慮部分函數(shù)SA,l=S/|Bl-1|2和SB,l=1/S|Al-1|2。這樣,可以由全極點(diǎn)模型來建模的S的那些部分被排除在提供貢獻(xiàn)給SB。同樣地,可以由全零點(diǎn)濾波器來建模的S的那些部分被排除在提供貢獻(xiàn)給SA。從SA,l和SB,l,估值函數(shù)Al和Bl。這樣,在以前的迭代中不能被近似地建模的部分被交換。
下一個(gè)步驟,優(yōu)選地,考慮以下的四個(gè)可能的組合G0=Bl-1/Al-1G1=Bl-1/AlG2=Bl/Al-1G3=Bl/Al這四個(gè)候選濾波器的S的最好的適配被規(guī)定為具有最小誤差的那個(gè);相關(guān)的濾波器是步驟l的最后結(jié)果。優(yōu)選地,Hl(以及從而是Al和Bl)被選擇為候選者Gi(i=0,1,2,3)中對(duì)于按照下式的對(duì)數(shù)準(zhǔn)則來說最好的一個(gè) 由此,程序過程進(jìn)到步驟l+1,取SA,l+1=S/|Bl|2和SB,l+1=1/S|Al|2。
任何通常的停止過程可被使用,例如,最大數(shù)目的迭代,當(dāng)前的估值的足夠的精度,或在從一個(gè)步驟進(jìn)行到另一個(gè)步驟時(shí)不足的進(jìn)展。
替換地,稍微不同的程序過程執(zhí)行AR和MA建模。如果以前的步驟返回分母Bl-1的改進(jìn)的估值,則SA,l=S/|Bl-1|2以及計(jì)算Al。Bl被取作為Bl-1。
如果以前的步驟返回分母Al-1的改進(jìn)的估值,則SB,l=1/S|Al-1|2以及計(jì)算Bl。Al被取作為Al-1。
從Al和Bl,構(gòu)建Hl,以及估值誤差(例如,在對(duì)數(shù)尺度上的均方差值)。
有許多進(jìn)行初始化迭代方案的替換例。不作為限制,提及以下的可能性首先,通過取SA,0=S和SB,0=1以及SA,0=1和1/SB,0=S,提供初始化的簡(jiǎn)單的方法。接著,計(jì)算A0和B0。從這兩個(gè)初始的估值,選擇最好的適配值(按照某個(gè)準(zhǔn)則)。這樣,第一猜測(cè)或者是全極點(diǎn)或全零點(diǎn)。
第二,S可以按照SA,0=1/SB,0=S]]>被分割為相等的部分。
第三,由于SA應(yīng)當(dāng)包含峰值以及SB包含谷底,所以最好的分割是把在平均對(duì)數(shù)電平以上的每個(gè)項(xiàng)貢獻(xiàn)給SA,0,以及在所述電平以下的任何項(xiàng)貢獻(xiàn)給SB,0。這種劃分可以按總的對(duì)數(shù)平均值作出,但也可以按某個(gè)本地對(duì)數(shù)平均值作出。
第四,進(jìn)一步的分割處理過程考慮到,在對(duì)數(shù)尺度的功率譜密度函數(shù)中,接近于單位圓的極點(diǎn)和零點(diǎn)分別引起顯著的峰值和谷底。數(shù)據(jù)S是在logS中的峰值和谷底分別由全極點(diǎn)和全零點(diǎn)模型更適當(dāng)?shù)乇惶幚淼母拍钌媳环指畹?。定義P=logSPA=logSAPB=logSB考慮變換函數(shù)m,mR→[-1,1]。從對(duì)數(shù)尺度上的極點(diǎn)和零點(diǎn)的對(duì)稱性看來,變換函數(shù)典型地將是非遞減的、點(diǎn)對(duì)稱的S形函數(shù)。然而,也可以使用非對(duì)稱函數(shù),它具有給予極點(diǎn)或零點(diǎn)建模更大的權(quán)重的效果。圖4上顯示示例的變換函數(shù)。
考慮以下的產(chǎn)生分割PA=1+m(P)2P]]>PB=-1-m(P)2p]]>這樣,P的正的振幅(峰值)占優(yōu)勢(shì)地貢獻(xiàn)給PA,因此,它由全極點(diǎn)濾波器建模。P的負(fù)的振幅(谷底)是大多數(shù)貢獻(xiàn)給PB,因此,它由全零點(diǎn)濾波器建模。從PA和PB,構(gòu)建SA和SB,以及計(jì)算下一個(gè)A0和B0。
M有兩個(gè)限制的情形(它類似于上面討論的第二和第三初始化)-m=0,則SA,0=1/SB,0=s]]>-m是正負(fù)號(hào)函數(shù) 在這種情形下
所提出的頻譜建模在建模峰值和谷底是非常合適的,因?yàn)椋旧?,這些方法構(gòu)成通過由極點(diǎn)和零點(diǎn)提供的自由度產(chǎn)生的圖案。因此,程序過程對(duì)于外圍事物很敏感而不是平滑化,這些將在近似式中出現(xiàn)。所以,輸入數(shù)據(jù)S必須是精確的估值(在每個(gè)頻率樣本的標(biāo)準(zhǔn)偏差與平均值的小的比值的意義上)或S必須被預(yù)處理(例如,被平滑),以便壓縮不想要的外圍事物建模。如果模型中自由度的數(shù)目相對(duì)于作為功率譜密度函數(shù)的依據(jù)的數(shù)據(jù)點(diǎn)的數(shù)目是相當(dāng)大的,則這種看法特別被保持。
不知道實(shí)際的最佳化步驟A和B依據(jù)選擇的準(zhǔn)則,就不能建立收斂。不能保證,在迭代過程的每個(gè)步驟中誤差減小。
在許多情形下,希望在對(duì)數(shù)尺度的頻率軸上具有功率譜密度函數(shù)的良好的近似。例如,通常的實(shí)踐是以Bode圖的形式視覺地估值頻譜的適配的結(jié)果。同樣地,對(duì)于音頻和語音應(yīng)用項(xiàng),最好的尺度是Bark或等價(jià)的矩形帶寬(ERB)尺度,它或多或少是對(duì)數(shù)尺度。按照本發(fā)明的方法適合于頻率打包建模。頻譜密度度量值無論如何可以在任意的頻率柵格上被計(jì)算。在頻率打包接近于一階全通段的打包的條件下,這可以被重新打包,而同時(shí)保持ARMA模型的階數(shù)。
本發(fā)明的應(yīng)用領(lǐng)域包括音頻編碼,嵌入數(shù)據(jù)技術(shù),噪聲成形和快速濾波器設(shè)計(jì)。圖5上顯示本發(fā)明的另一個(gè)示例性實(shí)施例。在圖5上,音頻信號(hào)A以與圖1相同的方式從源1被得出。音頻信號(hào)A在噪聲抑制裝置6中被處理。噪聲抑制裝置包括噪聲分析器(NA)60和噪聲合成器(NS)61。在本實(shí)施例中,NA 60直接分析音頻信號(hào)中的噪聲。噪聲的頻譜是通過按照本發(fā)明確定ARMA測(cè)量而被建模的。NS 61,主要是濾波器,具有近似于噪聲頻譜的頻率響應(yīng)。NS 61通過濾波白色噪聲y而產(chǎn)生重新構(gòu)建的噪聲,其中NS 61的濾波性質(zhì)由ARMA參量(pi,qi)確定。在加法器61中,從音頻信號(hào)(A)中減去重新構(gòu)建的噪聲,得出噪聲濾波的音頻信號(hào)({A})。優(yōu)選地,噪聲頻譜在一個(gè)或多個(gè)(以前的)幀中被建模,它除了噪聲外不包含很多信號(hào),例如在語音編碼時(shí)的無語音的幀。重新構(gòu)建的噪聲可以在包含更多的信號(hào)的幀(例如,在語音編碼時(shí)的語音幀)中被減去。
應(yīng)當(dāng)指出,上述的實(shí)施例是說明而不是限制本發(fā)明,本領(lǐng)域技術(shù)人員將能夠設(shè)計(jì)許多替換的實(shí)施例而不背離所附權(quán)利要求的范圍。在權(quán)利要求中,在括號(hào)內(nèi)放置的任何標(biāo)號(hào)不打算限制權(quán)利要求。詞組“包括”并不排除存在除了在權(quán)利要求中所列出的以外的其它的單元或步驟。本發(fā)明可以通過包括幾種不同的單元的硬件,和通過適當(dāng)?shù)鼐幊痰挠?jì)算機(jī)來實(shí)施。在列舉的幾個(gè)裝置的設(shè)備權(quán)利要求中,幾個(gè)這樣的裝置可以由同一個(gè)硬件元件來實(shí)施。某些度量是在互相不同的從屬權(quán)利要求中被闡述的事實(shí),并不表示這些度量的組合不能被用來利用。
總之,通過確定具有近似于目標(biāo)頻譜的頻率響應(yīng)的濾波器的濾波參量,提供了目標(biāo)頻譜的建模,其中目標(biāo)頻譜被分割成至少第一部分和第二部分,第一建模運(yùn)行被使用于目標(biāo)頻譜的第一部分上,得出自回歸參量,第二建模運(yùn)行被使用于目標(biāo)頻譜的第二部分上,得出運(yùn)動(dòng)平均參量,以及自回歸參量和運(yùn)動(dòng)平均參量被組合來得出濾波參量。本發(fā)明優(yōu)選地應(yīng)用于音頻編碼,其中對(duì)信號(hào)中的噪聲分量的頻譜進(jìn)行建模。
說明了用于從功率譜密度數(shù)據(jù)進(jìn)行快速ARMA估值的模型。它使用了用于估值多項(xiàng)式的分子和分母的FLP技術(shù),和迭代程序,用來對(duì)功率譜密度數(shù)據(jù)進(jìn)行最適當(dāng)?shù)姆指?,以便把一部分?jǐn)?shù)據(jù)貢獻(xiàn)給全極點(diǎn)模型和把另一部分?jǐn)?shù)據(jù)貢獻(xiàn)給全零點(diǎn)模型。
權(quán)利要求
1.一種通過確定具有近似于目標(biāo)頻譜(S)的頻率響應(yīng)(S’)的濾波器(41)的濾波參量(pi,qi),進(jìn)行目標(biāo)頻譜(S)建模(2,22)的方法,其特征在于,方法包括以下步驟把目標(biāo)頻譜分割(22)成至少第一部分和第二部分;使用第一建模運(yùn)行于目標(biāo)頻譜(S)的第一部分上,得出自回歸參量(pi);使用第二建模運(yùn)行于目標(biāo)頻譜的第二部分上,得出運(yùn)動(dòng)平均參量(qi);以及把自回歸參量(pi)和運(yùn)動(dòng)平均參量(qi)相組合,得出濾波參量(pi,qi)。
2.如權(quán)利要求1的方法,其中第二建模運(yùn)行(22)包括以下步驟使用第一建模運(yùn)行于目標(biāo)頻譜的第二部分的倒數(shù)上。
3.如權(quán)利要求1的方法,其中分割(22)的步驟包括進(jìn)行初始分割為初始的第一部分和初始的第二部分;使用迭代程序,得出比初始分割更好的分割,直至滿足某個(gè)停止準(zhǔn)則為止。
4.如權(quán)利要求3中要求的方法,其中迭代程序包括使用第一建模運(yùn)行于先前的分割的第一部分,得出新的自回歸參量;使用第二建模運(yùn)行于先前的分割的第二部分,得出新的運(yùn)動(dòng)平均參量;以及把通過第一建模運(yùn)行而不能精確地建模的先前分割的第一部分的部分重新貢獻(xiàn)給先前分割的第二部分,和把通過第二建模運(yùn)行而不能精確地建模的先前分割的第二部分的部分重新貢獻(xiàn)給先前分割的第一部分,得出新的分割。
5.如權(quán)利要求4的方法,其中重新貢獻(xiàn)的步驟包括把先前的分割的第一部分除以基于運(yùn)動(dòng)平均參量的目標(biāo)頻譜的估值;以及把先前的分割的第二部分除以基于自回歸參量的目標(biāo)頻譜的估值。
6.如權(quán)利要求2的方法,其中初始的第一部分至少包括平均倒數(shù)電平以上的、目標(biāo)頻譜的重要的部分以及初始的第二部分至少包括所述電平以下的、目標(biāo)頻譜的重要的部分。
7.如權(quán)利要求2的方法,其中初始分割由下式確定PA=1+m(P)2P]]>PB=1-m(P)2P]]>其中P=log(目標(biāo)頻譜)PA=log(目標(biāo)頻譜的第一部分)PB=log(目標(biāo)頻譜的第二部分)以及m是變換函數(shù),mR→[-1,1]。
8.一個(gè)設(shè)備(2),包括用于確定具有近似于目標(biāo)頻譜的頻率響應(yīng)(S’)的濾波器(41)的濾波參量(pi,qi)的裝置(22);其特征在于,設(shè)備還包括用于把目標(biāo)頻譜(S)分割成至少第一部分和第二部分的裝置(22);用于使用第一建模運(yùn)行于目標(biāo)頻譜(S)的第一部分上,得出自回歸參量(pi)的裝置(22);用于使用第二建模運(yùn)行于目標(biāo)頻譜(S)的第二部分上,得出運(yùn)動(dòng)平均參量(qi)的裝置(22);以及用于把自回歸參量(pi)和運(yùn)動(dòng)平均參量(qi)相組合,得出濾波參量(pi,qi)的裝置(22)。
9.一種抑制音頻信號(hào)(A)中的噪聲(6)的方法,該方法包括通過確定具有近似于噪聲頻譜的頻率響應(yīng)的濾波器(61)的濾波參量(pi,qi),進(jìn)行噪聲頻譜建模(60);通過用其性質(zhì)由濾波參量(pi,qi)確定的濾波器(61)來濾波白色噪聲(y)而得出(61)重新構(gòu)建的噪聲;以及從音頻信號(hào)(A)中減去(62)重新構(gòu)建的噪聲,得出噪聲濾除的音頻信號(hào)({A});建模(60)的步驟包括把頻譜分割(60)成至少第一部分和第二部分;使用(60)第一建模運(yùn)行于頻譜的第一部分上,得出自回歸參量(pi);使用(60)第二建模運(yùn)行于頻譜的第二部分上,得出運(yùn)動(dòng)平均參量(qi);以及把自回歸參量(pi)和運(yùn)動(dòng)平均參量(qi)相組合(60),得出濾波參量(pi,qi)。
10.一種抑制音頻信號(hào)(A)中的噪聲的設(shè)備(6),設(shè)備包括用于通過確定具有近似于噪聲頻譜的頻率響應(yīng)的濾波器(61)的濾波參量(pi,qi),進(jìn)行噪聲頻譜建模的裝置(60);用于通過用其性質(zhì)由濾波參量(pi,qi)確定的濾波器(61)來濾波(61)白色噪聲(y)而得出重新構(gòu)建的噪聲的裝置(61);以及用于從音頻信號(hào)(A)中減去(62)重新構(gòu)建的噪聲,得出噪聲濾除的音頻信號(hào)({A})的裝置(62);用于建模(60)的裝置包括用于把頻譜分割成至少第一部分和第二部分的裝置(60);用于使用第一建模運(yùn)行于頻譜的第一部分上,得出自回歸參量(pi)的裝置(60);用于使用第二建模運(yùn)行于頻譜的第二部分上,得出運(yùn)動(dòng)平均參量(qi)的裝置(60);以及用于把自回歸參量(pi)和運(yùn)動(dòng)平均參量(qi)相組合,得出濾波參量(pi,qi)的裝置(60)。
11.一種編碼(2,21)音頻信號(hào)(A)的方法,包括以下步驟確定(200)音頻信號(hào)(A)中的基本波形;通過從音頻信號(hào)(A)中減去基本波形,得出來自音頻信號(hào)(A)的噪聲分量(S);通過確定具有近似于噪聲分量(S)的頻譜的頻率響應(yīng)(S’)的濾波器(41)的濾波參量(pi,qi),進(jìn)行噪聲分量(S)的頻譜建模(22);以及把濾波參量(pi,qi)和代表基本波形的波形參量(Ci)包括(23)在編碼的音頻信號(hào)(A’)中;建模的步驟包括把頻譜(S)分割(22)成至少第一部分和第二部分;使用(22)第一建模運(yùn)行于頻譜(S)的第一部分上,得出自回歸參量(pi);使用(22)第二建模運(yùn)行于頻譜(S)的第二部分上,得出運(yùn)動(dòng)平均參量(qi);以及把自回歸參量(pi)和運(yùn)動(dòng)平均參量(qi)相組合(60),得出濾波參量(pi,qi)。
12.一種譯碼(4)編碼的音頻信號(hào)(A’)的方法,包括以下步驟接收(40)包括代表基本波形的波形參量(Ci)和濾波參量(pi,qi)的編碼的音頻信號(hào)(A’),濾波參量(pi,qi)是按照權(quán)利要求11的方法得到的、自回歸參量(pi)和運(yùn)動(dòng)平均參量(qi)的組合;濾波(41)白色噪聲信號(hào)(y),得出重新構(gòu)建的噪聲分量(S’),該濾波是通過濾波參量(pi,qi)被確定的;根據(jù)波形參量(Ci)合成(42)基本波形;以及把重新構(gòu)建的噪聲分量(S’)加到(43)合成的基本波形,得出譯碼的音頻信號(hào)(A”)。
13.一種音頻編碼器(2),包括用于確定音頻信號(hào)(A)中的基本波形的裝置(200);用于通過從音頻信號(hào)(A)中減去(21)基本波形,得出來自音頻信號(hào)(A)的噪聲分量(S)的裝置(21);用于通過確定具有近似于噪聲分量(S)的頻譜的頻率響應(yīng)(S’)的濾波器(41)的濾波參量(pi,qi),進(jìn)行噪聲分量(S)的頻譜建模(22)的裝置(22);以及用于把濾波參量(pi,qi)和代表基本波形的波形參量(Ci)包括在編碼的音頻信號(hào)(A’)中的裝置(23);用于建模的裝置(22)包括用于把頻譜(S)分割成至少第一部分和第二部分的裝置(22);用于使用第一建模運(yùn)行于頻譜(S)的第一部分上,得出自回歸參量(pi)的裝置(22);用于使用第二建模運(yùn)行于頻譜(S)的第二部分上,得出運(yùn)動(dòng)平均參量(qi)的裝置(22);以及用于把自回歸參量(pi)和運(yùn)動(dòng)平均參量(qi)相組合,得出濾波參量(pi,qi)的裝置(22)。
14.一種音頻單放機(jī)(4),包括用于接收包括代表基本波形的波形參量(Ci)和濾波參量(pi,qi)的編碼的音頻信號(hào)(A’)的裝置(40),濾波參量(pi,qi)是按照權(quán)利要求11的方法得到的、自回歸參量(pi)和運(yùn)動(dòng)平均參量(qi)的組合;用于濾波白色噪聲信號(hào)(y),得出重新構(gòu)建的噪聲分量(S’)的裝置(41),該濾波是通過濾波參量(pi,qi)被確定的;用于根據(jù)波形參量(Ci)合成基本波形的裝置(42);以及用于把重新構(gòu)建的噪聲分量(S’)加到合成的基本波形,得出譯碼的音頻信號(hào)(A”)的裝置(43)。
15.包括如權(quán)利要求13中要求的音頻編碼器(2)和如 14中要求的音頻單放機(jī)(4)的音頻系統(tǒng)。
16.一種編碼的音頻信號(hào)(A’)包括代表基本波形的波形參量(Ci);以及由按照權(quán)利要求11的方法得到的、自回歸參量(pi)和運(yùn)動(dòng)平均參量(qi)的組合代表的噪聲分量(S)。
17.一種存儲(chǔ)媒體(3),其上存儲(chǔ)如權(quán)利要求16中要求的編碼的音頻信號(hào)(A’)。
全文摘要
通過確定(21)具有近似于目標(biāo)頻譜(S)的頻率響應(yīng)的濾波器的濾波參量(p
文檔編號(hào)G10L19/06GK1361941SQ00810468
公開日2002年7月31日 申請(qǐng)日期2000年5月17日 優(yōu)先權(quán)日2000年5月17日
發(fā)明者A·C·登布林克, A·W·J·奧門 申請(qǐng)人:皇家菲利浦電子有限公司