專利名稱:估算聲音編碼器的諧波的裝置和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于估算聲音編碼器中的諧波的裝置和方法。
由于多媒體和移動通信的發(fā)展,以前僅向特殊群體或人提供的服務(wù)現(xiàn)在也向公眾提供了,而且很多服務(wù)呈幾何增長。因此,到目前為止所使用的傳輸速率不能滿足用戶群。如果傳輸速率降低,而用戶數(shù)量增加,則聲音質(zhì)量下降。在這種環(huán)境中,發(fā)展了聲音編碼器。
在使用移動通信網(wǎng)絡(luò)和現(xiàn)在推廣的數(shù)據(jù)網(wǎng)絡(luò)的聲音通信服務(wù)中,根據(jù)目的與應(yīng)用,將使用不同的聲音編碼器。聲音編碼器通過麥克風(fēng)接收人的聲音,將對應(yīng)于聲音的頻率分布、強(qiáng)度和波形轉(zhuǎn)換為編碼,發(fā)送編碼,并合成編碼。聲音編碼器用于移動終端、電話交換機(jī)、電視會議系統(tǒng)等。
用于多媒體通信和諸如基于IP的話音(VoIP)的聲音存儲系統(tǒng)的大多數(shù)低傳輸速率的聲音編碼器是編碼激勵線性預(yù)測(code-excitedlinear prediction)(CELP)編碼器?,F(xiàn)有的CELP編碼器是用于4-13Kbps傳輸速率的時域編碼器和用于4Kbps以下傳輸速率的頻域編碼器。
諧波編碼器表示激勵信號以基頻的諧波分量的形式。因此,諧波編碼器在無聲的語音間隔中其合成的聲音比表示由白噪聲形式的激勵信號的CELP編碼器的聲音較為不自然。
但是,在占據(jù)了大部分聲音信號的聲音間隔中,諧波編碼器能夠以比CELP編碼器更低的速率編碼聲音信號。因此,諧波編碼器能用作傳輸速率在4Kbps或以下的聲音編碼器。
因此,本發(fā)明的實施例提供了一種估算聲音編碼器中諧波的方法,包括將窗口頻譜應(yīng)用于輸入信號,對產(chǎn)生的頻譜的幅度N1進(jìn)行快速傅立葉變換,并計算輸入信號的頻譜;將與諧波幅度成比例的窗口頻譜應(yīng)用于整數(shù)基音(pitch)候選頻率,在產(chǎn)生的頻譜的幅度N2上進(jìn)行快速傅立葉變換,并計算合成的信號頻譜;計算高頻的調(diào)整值,在所述高頻,得到的每個頻段的輸入信號頻譜和合成信號頻譜的誤差能量在使用整數(shù)單元基音的諧波頻率調(diào)整值的范圍內(nèi)最?。灰约笆褂酶哳l的調(diào)整值計算最大諧波幅度,在所述高頻得到的各頻段的誤差能量最小。
在本發(fā)明的另一實施例中,聲音編碼器的諧波估算裝置包括諧波頻率調(diào)整裝置,用于使用整數(shù)單元基音來計算諧波頻率調(diào)整值的范圍,并使用屬于該范圍內(nèi)的諧波頻率調(diào)整值來選擇使誤差能量最小的頻率調(diào)整值;以及諧波幅度估算裝置,用于使用使誤差能量最小的諧波頻率調(diào)整值通過諧波來估算最大的諧波幅度,并通過諧波頻率調(diào)整裝置得到諧波頻率調(diào)整值。
在本發(fā)明的另一實施例中,聲音編碼器中的諧波估算裝置包括計算裝置,用于計算輸入信號的輸入信號頻譜和合成的信號頻譜,將窗口頻譜應(yīng)用于整數(shù)基音候選頻率;提取裝置,用于從各諧波頻段提取峰值點,并計算各諧波頻段的頻率調(diào)整值的極限值;計算裝置,用于使用得到的頻率調(diào)整的極限值和峰值點的極限值,計算各頻段得到的輸入信號頻譜和得到的合成信號頻譜的誤差能量;以及計算裝置,用于計算使能量最小的諧波頻率調(diào)整值和峰值點;以及裝置,用于使用得到的諧波頻率調(diào)整值和峰值點計算諧波幅度。
應(yīng)該理解,對本發(fā)明的上述一般性描述和下述詳細(xì)描述都是示例性和解釋性的,僅作為對本發(fā)明的進(jìn)一步解釋,不會限制本發(fā)明的權(quán)利要求。
圖6是表示根據(jù)本發(fā)明第三個實施例的使用Δ調(diào)整方法和峰值提取的諧波估算裝置的詳細(xì)圖;圖7是表示根據(jù)本發(fā)明第三個實施例的使用Δ調(diào)整方法和峰值提取的諧波估算裝置的流程圖;圖8表示僅使用Δ調(diào)整方法的情況下合成信號的頻譜;以及圖9表示根據(jù)本發(fā)明的實施例使用Δ調(diào)整方法和峰值提取方法的情況下合成信號的頻譜。
諧波編碼器包括諧波估算裝置和諧波合成器。設(shè)計所述諧波估算裝置應(yīng)考慮系統(tǒng)的性能和計算能力。頻譜諧波估算影響計算量和聲音質(zhì)量。
而且,諧波估算裝置需要對基音、幅度、相位等的許多計算量,并能夠使用數(shù)字信號處理器(DSP)。通過時域的整數(shù)單元和頻域的分?jǐn)?shù)單元來尋找該基音?;诜?jǐn)?shù)基音的諧波估算方法需要大量的計算,因為該諧波估算方法使用使輸入信號頻譜和合成信號頻譜的誤差能量最小的合成,通過分析來進(jìn)行的。
另一方面,與CELP編碼器相反,在諧波編碼器中基音的包絡(luò)線對于聲音質(zhì)量來說比基音的分辨率更為重要,以通過內(nèi)插重放合成的信號。諧波估算方法包括離散傅立葉變換(DFT)和快速傅立葉變換(FFT)。如果使用基于離散傅立葉變換的諧波估算方法,則能夠立即估算頻譜諧波的幅度和相位,與基音周期無關(guān)。當(dāng)基音的周期大時,在離散傅立葉變換中需要大量的計算。
在基于快速傅立葉變換的諧波估算方法中,可以使用在2個或3個基音周期波上進(jìn)行FFT,并提取頻譜的最高點,以觀察頻譜中諧波的峰峰值方法,或可使用相對簡單的方法,例如以對應(yīng)于基頻的諧波的頻率對頻譜采樣。另一方法是最小均方誤差(MMSE)方法,其要求比上述方法更大的計算量,并有更高的性能。
基于DFT的方法用于諸如原型波形內(nèi)插(PWI)的基音周期單元諧波編碼器?;贔FT的方法在計算量方面具有優(yōu)點,并用于諸如正弦變換編碼器(STC)、改進(jìn)的多波段激勵(IMBE)和諧波矢量激勵編碼(HVXC)中的大部分方法。對于基于FFT的諧波估算,有一種MMSE方法,其在兩個或更多的基音周期上進(jìn)行FFT,以計算原始頻譜XW(m)和合成信號頻譜X′W(m,ω0),并計算使得到的原始頻譜XW和得到的合成信號頻譜X′W(m,ω0)的誤差能量E1最小的諧波幅度A1。
MMSE方法包括步驟將窗口頻譜WR(n)應(yīng)用于輸入信號x(n),通過幅度N1的FFT變換計算輸入信號頻譜XW(m),將窗口頻譜WR(n)應(yīng)用于分?jǐn)?shù)基音候選A,通過幅度N2的FFT變換計算合成的信號頻譜X′W(m,ω0),并計算使輸入信號頻譜XW(m)和合成信號頻譜X′W(m,ω0)的誤差能量E1(ω0)最小的聲音數(shù)據(jù)的第I個諧波幅度A1(ω0)。
以下將詳細(xì)描述基于分?jǐn)?shù)基音的諧波估算方法。
圖1是表示根據(jù)本發(fā)明第一個實施例的分?jǐn)?shù)基音的諧波估算方法的框圖。
參照圖1,分?jǐn)?shù)基音提取器100計算輸入信號頻譜XW(m)和合成的信號頻譜X′W(m,ω0)的誤差能量E1(ω0)。換言之,分?jǐn)?shù)基音提取器100計算m個分?jǐn)?shù)基音候選A中的一個輸入信號頻譜XW(m)的合成頻譜X′W(m,ω0),搜索使作為分?jǐn)?shù)基音誤差的和的誤差能量E(ω0)最小的最佳的分?jǐn)?shù)基音候選頻率,并選擇基音的基頻ω0。
這里,輸入信號的頻譜XW(m)是通過對信號XW(n)的幅度N1信號進(jìn)行FFT獲得的信號,其中所述信號XW(n)是將窗口頻譜WR(n)與輸入信號X(n)相乘獲得的。合成的信號頻譜X′W(m,ω0)是使用存儲的窗口頻譜WR(m)和幅度N2,通過在分?jǐn)?shù)基音候選頻率的幅度N2進(jìn)行FFT獲得的信號。諧波幅度估算器110選擇使諧波幅度最大的值作為用于使分?jǐn)?shù)基音提取器100得到的誤差能量最小的頻率ω0最佳的諧波。
圖2是表示根據(jù)本發(fā)明第一個實施例的分?jǐn)?shù)基音的諧波估算方法的流程圖。參照圖2,通過將窗口頻譜WR(n)與輸入信號X(n)相乘產(chǎn)生獲得信號XW(n)(S200)。對產(chǎn)生的信號XW(n)進(jìn)行幅度N1的FFT變換,并產(chǎn)生輸入信號頻譜XW(m)(S201)。將產(chǎn)生的輸入信號頻譜XW(m)用于諧波估算裝置的輸入。其中m可以大于或等于0,且小于或等于N1。
使用窗口頻譜WR(m)采用幅度N2來產(chǎn)生分?jǐn)?shù)基音候選頻率的合成信號的頻譜X′W(m,ω0)(S202)。表達(dá)式1將合成的信號頻譜X′W(m,ω0)計算如下表達(dá)式1XW′(m,ω0)=A1(ω0)|WR[N2N1m-N22πω0l+0.5]|]]>在表達(dá)式1中,A1(ω0)是諧波幅度。表達(dá)式1根據(jù)與諧波幅度A1(ω0)成比例的窗口頻譜WR(m,ω0)表示合成的信號頻譜X′W(m,ω0)。
窗口頻譜X′W(m,ω0)是分析窗口WR(n)的幅度N2(>>N1)的FFT頻譜。分析窗口WR(n)具有長度NR,以包括兩個或以上的基音周期P0。算子[x]表示取實數(shù)x的整數(shù)部分的計算。
使用第1個諧波頻段的起點a1和終點b1得到合成的信號頻譜X′W(m,ω0)。通常使用漢明(Hamming)窗口或凱瑟(Kaiser)窗口作為分析窗口WR(n)。在表達(dá)式2中,a1和b1表示如下
表達(dá)式2al=[N12π(l-0.5)ω0+0.5]]]>bl=[N12π(l+0.5)ω0+0.5]]]>如果得到合成的信號頻譜(S202),則在全部頻段得到了輸入信號頻譜和合成信號頻譜的誤差能量E1(ω0)(S203)。使用表達(dá)式3來獲得表達(dá)式3El(ω0)=Σm=albl{|XW(m)|-|XW′(m,ω0)|}2]]>其中1≤1≤L, 在表達(dá)式3中,ω0是基頻。XW(m)中m的幅度范圍是0≤m≤N1。而且,1表示諧波數(shù)。誤差能量E1(ω0)是輸入信號頻譜XW(m)的絕對值和合成信號頻譜X′W(m,ω0)的絕對值之間差的平方從第1個諧波頻段的起點a1到該諧波頻段終點b1的累加的和。
當(dāng)通過表達(dá)式3獲得誤差能量時(S203),通過在M分?jǐn)?shù)基音候選頻率上重復(fù)步驟S202和步驟S203,選擇使誤差能量E1(ω0)最小的基音的基頻ω0(S204)。這時,為使誤差能量最小,可根據(jù)A1(ω0)對表達(dá)式3進(jìn)行偏微分∂El∂Al.=0]]>表達(dá)式4如下表達(dá)式4Al=Σm=albl|XW(m)||WR[N2N1m-N22πω0l+0.5]|Σm=albl|WR[N2N1m-N22πω0l+0.5]|2]]>為提高由表達(dá)式4表示的諧波幅度A1(ω0)的可靠性,應(yīng)該首先搜索一種精確的分?jǐn)?shù)基音,其中如表達(dá)式5表示的輸入信號頻譜和合成信號頻譜的誤差能量在給出的全部頻段內(nèi)最小。
表達(dá)式5E(ω0)=Σl=1LEl(ω0),ω0(0)≤ω0≤ω0(M-1)]]>其中M是要搜索的分?jǐn)?shù)基音候選頻率數(shù)(如10)。進(jìn)行步驟204后,將表達(dá)式4應(yīng)用于得到的ω0,并得到最大諧波幅度A1(ω′0)(S205)。
第一個實施例是基于諧波分析方法的分?jǐn)?shù)基音。在第一個實施例中,根據(jù)使用的基音的值,由固定的a1和b1表示諧波頻段的MMSE,并搜索精確的分?jǐn)?shù)單元基音。如果由于分配的位或計算量的限制,使編碼器的基音搜索精度退化,則原始信號頻譜和合成的信號頻譜的諧波中心頻率之間的誤差隨著它進(jìn)入高頻而增加。因此,表達(dá)式4的分子的相關(guān)性隱含下降,以使諧波分析性能大幅地下降。性能取決于輸入信號基音的精度,且精確的基音搜索需要大量的計算。
另一方面,如果不將諧波估算應(yīng)用于整個頻段,并根據(jù)頻段對每個諧波頻段進(jìn)行自適應(yīng)地控制,從而消除了輸入基音和計算方法的相關(guān)性,應(yīng)用一種名為DELTA(Δ)調(diào)整方法來減少基音搜索的計算量。在這種Δ調(diào)整方法中,將每個諧波對應(yīng)的諧波頻率間隔向左或右調(diào)整Δ,所述諧波使用整數(shù)基音單元來計算使輸入信號頻譜和合成信號頻譜的誤差能量最小的ΔI,并使用ΔI得到最大諧波幅度。
以下參照圖3和4描述Δ調(diào)整方法。圖3是表示根據(jù)本發(fā)明第二個實施例的使用Δ調(diào)整方法的諧波估算裝置的框圖。參照圖3,Δ調(diào)整器300計算使用整數(shù)單元基音的諧波頻率調(diào)整值ΔI的范圍dl,并選擇使AI(Δ)最大的ΔI作為使用屬于已得到的范圍dl的ΔI的最佳的頻率調(diào)整值。諧波幅度估算器310選擇使諧波幅度最大的值作為用于頻率調(diào)整值ΔI的最佳的諧波,所述ΔI使由Δ調(diào)整器300得到的誤差能量最小。
圖4是表示根據(jù)本發(fā)明第二個實施例的使用Δ調(diào)整方法的諧波估算裝置的流程圖。參照圖4,窗口頻譜WR(n)乘以輸入信號XW(n),產(chǎn)生新的輸入信號XW(n)(S400)。通過進(jìn)行幅度N1的FFT變換產(chǎn)生的輸入信號XW(n),并產(chǎn)生輸入信號頻譜XW(m)(S401)。產(chǎn)生的輸入信號頻譜XW(m)作為諧波估算裝置的輸入。幅度m大于或等于0,且小于或等于N1。
然后,在步驟S401后,通過表達(dá)式1使用幅度N2的窗口頻譜WR(m),產(chǎn)生整數(shù)基音候選頻率的合成信號頻譜X′W(m,ω0)(S402)。通過表達(dá)式2獲得合成信號頻譜X′W(m,ω0)的第I個諧波頻段的起點a1和終點b1。然后,在步驟S402后,使用整數(shù)單元基音得到諧波頻率調(diào)整值ΔI的極限值dl(S403),通過表達(dá)式6得到dl。
表達(dá)式6dl=α2-α1L-1ω0(l-1)+α2ω0]]>在表達(dá)6中,dl表示諧波頻率調(diào)整值ΔI的范圍,并且dl的值與頻率成比例,且在低頻段小,在高頻段大。
在步驟S403后,在得到的范圍dl中使用表達(dá)式7,在頻率調(diào)整值的范圍內(nèi)得到使誤差能量El(Δl)最小的Δl(S404),表達(dá)式7如下表達(dá)式7El(Δl)=Σm=albl{|XW(m+Δl)|-|XW′(m,ω0)|}2]]>表達(dá)式7表示了XW(m+Δ)的絕對值和X′W(m,ω0)的絕對值之間的差的平方從諧波頻段的起點a1到諧波頻段的終點b1的和。
Δl的范圍從-dI到dI。將在步驟404得到的ΔI應(yīng)用于表達(dá)式8,并得到最大諧波幅度(S405)。表達(dá)式8如下表達(dá)式8Al=Σm=albl|XW(m+Δl)||WR[N2N1m-N22πω0l+0.5]|Σm=albl|WR[N2N1m-N22πω0l+0.5]|2]]>第二個實施例的諧波幅度估算器310選擇使諧波幅度最大的值作為最佳的用于頻率調(diào)整值的諧波,所述頻率調(diào)整值使由Δ調(diào)整器300通過輸入信號頻譜的絕對值與合成信號頻譜的絕對值的差的平方得到的誤差能量最小。
在Δ調(diào)整方法中的諧波估算方法中,使用整數(shù)基音來調(diào)整諧波間隔,并得到使誤差能量最小的諧波幅度,從而能夠減小在高頻段產(chǎn)生的諧波估算誤差。但是,由于基音的變化或類似原因,可能產(chǎn)生諧波估算誤差。
為解決這一問題,使用了Δ調(diào)整和峰峰值的諧波估算方法。換言之,將每個諧波的峰值確定為諧波的代表值,并估算諧波。在全部頻段,使用上述方法使原始信號頻譜的諧波峰值和合成信號頻譜的諧波峰值彼此重合,將表達(dá)式4的分子的相關(guān)性設(shè)置到大,從而在高頻段使用Δ調(diào)整來最后估算諧波幅度。這將參照圖5和圖6進(jìn)行描述。
圖5是表示根據(jù)本發(fā)明第三個實施例的使用Δ調(diào)整方法和峰值提取的諧波估算裝置的結(jié)構(gòu)圖。參照圖5,使用Δ調(diào)整和峰值提取的諧波估算裝置包括峰值提取器500、Δ調(diào)整器510和諧波幅度估算器520。通過將窗口頻譜WR(n)應(yīng)用于輸入聲音信號x(n)來產(chǎn)生輸入信號頻譜XW(m),并進(jìn)行幅度N1的FFT變換。通過將窗口頻譜WR(m)應(yīng)用于整數(shù)基音候選頻率產(chǎn)生合成信號頻譜X′W(m,ω0),并進(jìn)行幅度N2的FFT。
峰值提取器500從全部頻段中提取峰值。換言之,峰值提取器500將全部頻段分為一個諧波,并計算最大值作為每個諧波的代表值。在全部頻段上,提取的峰值在原始信號頻譜和合成的信號頻譜的每個諧波重合。換言之,確定與諧波的峰值重合的峰值τpp定位在ω0×I的±(1/2)ω0的范圍內(nèi)的原始信號頻譜XW(m)的最大值,對應(yīng)于合成信號頻譜中的每個諧波峰值位置。
該Δ調(diào)整器510使用整個頻段內(nèi)最大值來計算頻率調(diào)整值ΔI的范圍dI,并選擇使AI(Δ)最大的ΔI作為使用屬于范圍dI的ΔI的頻率調(diào)整值。上述諧波頻率調(diào)整的極限值如下得到 諧波幅度估算器520選擇使諧波幅度最大的值作為使用頻率調(diào)整值ΔI的最佳的諧波,所述ΔI使Δ調(diào)整器510得出的誤差最小。
圖6是表示根據(jù)本發(fā)明第三個實施例的使用Δ調(diào)整方法和峰值提取的諧波估算裝置的詳細(xì)圖。參照圖6,使用Δ調(diào)整和峰值提取的諧波估算裝置包括窗口單元600、傅立葉變換器610、峰值和Δ調(diào)整器620、諧波頻段頻譜合成器630、合成器640、諧波波段誤差能量提取器650、誤差能量確定器660和諧波幅度估算器670。
窗口單元600將窗口頻譜WR(n)應(yīng)用于輸入聲音信號x(n),并產(chǎn)生XW(n)。傅立葉變換器610在窗口單元600產(chǎn)生的XW(n)上進(jìn)行幅度N1的FFT,并產(chǎn)生輸入信號頻譜XW(m)。峰值檢取和Δ調(diào)整器620提取諧波的峰值τpp,并使用整數(shù)單元基音計算諧波頻率調(diào)整值ΔI的范圍dI。諧波頻段頻譜合成器630將窗口頻譜WR(m)應(yīng)用于整數(shù)基音候選頻率ω0。,并產(chǎn)生具有幅度N2的合成信號頻譜X′W(m,ω0)。
合成器640從峰值提取和Δ調(diào)整器620的輸出減去諧波頻譜合成器630的輸出,并輸出減法的結(jié)果。換言之,輸出從Xw(m+πpp+Δ1)-X′W(m,ω0)的計算結(jié)果。諧波頻段誤差能量提取器650使用從合成器640接收的諧波頻率調(diào)整值Δ1的范圍d1計算誤差能量,并由峰值提取和Δ調(diào)整器620得到。
誤差能量判定器660確定由諧波頻段誤差能量提取器650得到的誤差能量Δ1是否最小。如果誤差能量判定器660判定的結(jié)果是在Δ1得到的能量最小,則將誤差能量最小的信息傳送到諧波幅度估算器670。誤差能量最小的信息可以是誤差最小的Δ*I。
如果誤差能量判定器660判定的結(jié)果在Δ*I得到的誤差能量不是最小,則誤差能量判定器660提取在得到的諧波頻率調(diào)整ΔI的范圍內(nèi)至少一個候選頻率。然后,誤差能量判定器660將提取的候選頻率傳送到峰值提取和Δ調(diào)整器620。然后,由于另一候選頻率,將由峰值提取和Δ調(diào)整器620調(diào)整的輸入信號頻譜作為誤差能量經(jīng)由合成器640傳送到諧波頻段誤差能量提取器650。誤差能量判定器660判定傳送的Δ1是否使誤差能量最小。諧波幅度估算器670從誤差能量判定器660接收在Δ*1的最小的誤差能量,并使用得到的d1和峰值τpp計算最終的諧波幅度A1(Δ*1)。這里1≤I≤L, 換言之,確定由每個諧波的峰值作為諧波的代表值,并使全部頻段中每個原始信號頻譜的諧波峰值與合成信號頻譜的諧波峰值重合,從而表達(dá)式4中分子的相關(guān)性大。因此,在高頻段使用Δ調(diào)整方法最終估算諧波幅度。
圖7是表示根據(jù)本發(fā)明第三個實施例的使用Δ調(diào)整方法和峰值提取的諧波估算裝置的流程圖。參照圖7,將窗口頻譜WR(n)應(yīng)用于輸入信號x(n),并產(chǎn)生XW(n)(S700)。通過幅度N1的FFT變換產(chǎn)生的XW(n),并產(chǎn)生輸入信號頻譜XW(m)(S701)。將產(chǎn)生的輸入信號頻譜XW(m)作為諧波估算裝置的輸入。幅度m大于或等于0,且小于或等于N1。
在步驟S701后,使用如表達(dá)式1所示幅度為N2的窗口頻譜WR(n),產(chǎn)生整數(shù)音基候選的合成的信號頻譜X′W(m,ω0)(S702)。使用表達(dá)式2獲得合成信號頻譜X′W(m,ω0)的第I個諧波頻段的起點a1和終點b1。在步驟S702之后,提取在全部諧波頻段的每個最大值(峰值=τpp)(S703)。提取的最大值可以是τpp。
在步驟S703后,使用整數(shù)單位基音每個諧波頻段的調(diào)整值Δ1的極限值d1(S704)如表達(dá)式9。
表達(dá)式9dl=αL-1ω0(l-1)]]>在表達(dá)9中,d1表示諧波頻率調(diào)整值Δ1的范圍,范圍為從-dI到dI,d1的值與頻率成比例,且在低頻段小,在高頻段大,且α是表示根據(jù)頻段調(diào)整范圍變化的常數(shù),小于或等于0.5。
在步驟S704后,使用得到的諧波頻率調(diào)整值的范圍d1和峰值τpp調(diào)整諧波頻率,在頻率調(diào)整值的范圍內(nèi)得到使由表達(dá)式10表示的誤差能量最小的Δ1。
表達(dá)式10El(Δl)=Σm=albl{|XW(m+Δl+τpp)|-|XW′(m,ω0)|}2]]>表達(dá)式10表示了XW(m+Δ)的絕對值和X′W(m,ω0)的絕對值之間的差的平方從諧波頻段的起點a1到諧波頻段的終點b1的和,所述X′W(m,ω0)受到諧波頻率調(diào)整值的影響。
將在步驟S705中表達(dá)式9得到的最小值d1和表達(dá)式10得到的諧波調(diào)整Δ*1應(yīng)用于表達(dá)式11,并得到最終的諧波幅度(S706)。
表達(dá)式11Al=Σm=albl|XW(m+Δl+τpp)||WR[N2N1m-N22πω0l+0.5]|Σm=albl|WR[N2N1m-N22πω0l+0.5]|2]]>這里,-dl≤Δ≤dl,dl=αω0L-1(l-1)]]>在表達(dá)式11中,常數(shù)α是表示根據(jù)頻段調(diào)整范圍變化的常數(shù),小于或等于0.5,且由實驗決定。
確定峰值τpp在對應(yīng)于合成的信號頻譜中的每個諧波峰值位置的ω0×1的±(1/2)ω0的范圍內(nèi)位于原始信號頻譜的最大值,且得出與該值對應(yīng)的使誤差能量最小的Δ*1。如表達(dá)式11所示,通過添加Δ值到輸入信號頻譜,并提取峰值進(jìn)一步調(diào)整該值,可以更精確地得出最終的幅度A1。
圖8表示僅使用Δ調(diào)整方法的情況下合成信號的頻譜。圖9表示根據(jù)本發(fā)明實施例的使用Δ調(diào)整方法和峰值提取方法的情況下合成信號的頻譜。使用Δ調(diào)整方法和峰值提取方法情況下的誤差范圍小于僅使用Δ調(diào)整方法的情況。
如上所述,根據(jù)本發(fā)明,提供了聲音編碼器中估算諧波的裝置和方法,其使用峰值提取和Δ調(diào)整技術(shù)減少了計算量。聲音編碼器中估算諧波的裝置和方法在使用數(shù)字信號處理器(DSP)的實時處理中是非常有效的,且DSP的計算量是重要的。根據(jù)本發(fā)明的聲音編碼器中估算諧波的裝置和方法,通過提供低傳輸速率聲音編碼器的技術(shù),能夠替代傳統(tǒng)技術(shù)。
對于本領(lǐng)域普通技術(shù)人中來說,本發(fā)明的各種修改與變化是顯而易見的。因此,本發(fā)明所附的權(quán)利要求中包括本發(fā)明的修改與變化,其都落在所附權(quán)利要求及其等效的范圍內(nèi)。
權(quán)利要求
1.一種諧波估算方法,包括將窗口頻譜應(yīng)用于輸入信號,對產(chǎn)生的頻譜進(jìn)行預(yù)定幅度的快速傅立葉變換,并計算輸入信號頻譜;使用與第一基頻、諧波幅度和高頻信號幅度成比例的窗口頻譜,產(chǎn)生分?jǐn)?shù)基音候選頻率的合成的信號頻譜;計算每個頻段的輸入信號頻譜和合成信號頻譜的誤差能量,并計算使誤差能量最小的第二基頻;以及在所述第二基頻計算最大諧波幅度。
2.根據(jù)權(quán)利要求1所述的方法,其中通過重復(fù)計算輸入信號頻譜和M分?jǐn)?shù)基音候選頻率的合成信號頻譜的步驟來選擇所述使誤差能量最小的第二基頻。
3.一種諧波估算方法,包括將窗口頻譜應(yīng)用于輸入信號,對產(chǎn)生的頻譜進(jìn)行幅度N1的快速傅立葉變換,并計算輸入信號的頻譜;將與諧波幅度成比例的窗口頻譜應(yīng)用于整數(shù)基音候選頻率,對產(chǎn)后的頻譜進(jìn)行幅度N2的快速傅立葉變換,并計算合成的信號頻譜;計算高頻的調(diào)整值,在所述高頻,得到的每個頻段的輸入信號頻譜和合成信號頻譜的誤差能量在使用整數(shù)基音候選頻率的諧波頻率調(diào)整值的范圍內(nèi)最??;以及使用高頻的調(diào)整值計算最大諧波幅度,在所述高頻每個頻段的誤差能量最小。
4.如權(quán)利要求3所述的方法,其中通過輸入信號頻譜的絕對值和合成的信號頻譜的絕對值之間的差的平方,通過從頻段的起點到該頻段的終點的差的平方的累加,來選擇所述使每個頻段的誤差能量最小的高頻的調(diào)整值,以及選擇高頻的調(diào)整值,在所述高頻,誤差能量在所累加的值中的高頻的調(diào)整值的極值范圍內(nèi)是最小的。
5.如權(quán)利要求3所述的方法,其中所述諧波的幅度通過以下步驟估算如果得出輸入信號頻譜和合成信號頻譜,則在每個諧波頻段計算最大值點和諧波頻率調(diào)整值的極限值;計算得出的輸入信號頻譜和合成信號頻譜的每個頻段的誤差能量;計算得出的諧波頻率調(diào)整值和得出的使誤差能量最小的最大值點;以及通過使用得出的諧波頻率調(diào)整值和得出的最大值點計算最終的諧波幅度。
6.如權(quán)利要求5所述的方法,其中通過輸入信號頻譜的絕對值和合成信號頻譜的絕對值之間差的平方,并將所有諧波頻段的差的平方累加,得到所述誤差能量。
7.如權(quán)利要求5所述的方法,其中通過以下公式得到諧波頻率調(diào)整值的極限值。
8.一種諧波估算裝置,包括諧波頻率調(diào)整裝置,用于使用整數(shù)單位基音來計算諧波頻率調(diào)整值的范圍,并使用屬于該范圍內(nèi)的諧波頻率調(diào)整值來選擇使誤差能量最小的頻率調(diào)整值;以及諧波幅度估算裝置,用于使用使誤差能量最小的諧波頻率調(diào)整值通過諧波來估算最大的諧波幅度,通過諧波頻率調(diào)整裝置得到諧波頻率調(diào)整值。
9.根據(jù)權(quán)利要求8所述的裝置,其中所述諧波頻率調(diào)整值的范圍與頻率成比例,且所述范圍在低頻段小和在高頻段大。
10.根據(jù)權(quán)利要求8所述的裝置,其中通過受諧波調(diào)整值影響的輸入信號頻譜的絕對值和合成信號頻譜的絕對值之間差的平方,以及從諧波的起點到該諧波終點的累加該差的平方來得到所述誤差能量。
11.根據(jù)權(quán)利要求8所述的裝置,其中使用使誤差能量最小的諧波頻率調(diào)整值和在全部頻段上的原始頻譜和合成的頻譜重合的峰值來估算所述諧波幅度。
12.根據(jù)權(quán)利要求11所述的裝置,進(jìn)一步包括峰值提取裝置,用于在全部頻段中提取峰值。
13.根據(jù)權(quán)利要求8所述的裝置,其中所述用于選擇使諧波幅度最大的值的諧波頻率調(diào)整裝置通過使用屬于諧波頻率調(diào)整值范圍內(nèi)的值來選擇最佳的頻率調(diào)整值。
14.一種諧波估算裝置,包括用于計算輸入信號的輸入信號頻譜,并將窗口頻譜應(yīng)用于整數(shù)基音候選頻率,和合成的信號頻譜的裝置;用于從各諧波頻段提取峰值點,并計算各諧波頻段的頻率調(diào)整值的極限值的裝置;用于使用得到的頻率調(diào)整的極限值和峰值點,計算各頻段得到的輸入信號頻譜和得到的合成信號頻譜的誤差能量的裝置;用于計算使能量最小的諧波頻率調(diào)整值的裝置;以及用于使用得到的諧波頻率調(diào)整值和峰值點計算諧波幅度的裝置。
15.根據(jù)權(quán)利要求14所述的裝置,其中如果所述諧波頻率調(diào)整值不是使所述誤差能量最小的值,則所述用于計算誤差能量的裝置調(diào)整諧波的間隔。
16.一種諧波估算方法,包括產(chǎn)生輸入信號頻譜;產(chǎn)生合成的信號頻譜;在調(diào)整值的范圍內(nèi),計算調(diào)整值,所述調(diào)整值使輸入信號頻譜和合成的信號頻譜的誤差能量最?。灰约巴ㄟ^使用每個頻段的調(diào)整值,估算每個頻段的最大諧波幅度。
17.根據(jù)權(quán)利要求16所述的方法,其中所述誤差能量是通過輸入信號頻譜的絕對值和合成信號頻譜的絕對值之間差的平方,以及通過累加從頻段的起點到該頻段終點的差的平方來確定的。
18.根據(jù)權(quán)利要求16所述的方法,進(jìn)一步包括確定每個波段的峰值點;使用所述峰值點確定使誤差能量最小的調(diào)整值;以及使用諧波頻率調(diào)整值和峰值點,計算最大諧波幅度。
19.根據(jù)權(quán)利要求16所述的方法,其中所述誤差能量是通過輸入信號頻譜的絕對值和合成信號頻譜的絕對值之間差的平方,并將所述差的平方在全頻段累加來得到的。
20.根據(jù)權(quán)利要求16所述的方法,其中所述范圍確定為±諧波頻率調(diào)整值的極限值,其中所述極限值是通過下式得到的。
21.根據(jù)權(quán)利要求16所述方法,其中所述諧波調(diào)整值的范圍與頻率成比例,從而所述范圍隨著頻率的提高而增加。
22.根據(jù)權(quán)利要求16所述方法,進(jìn)一步包括如果所述調(diào)整值不是使誤差能量最小的調(diào)整值,則將所述調(diào)整值改變?yōu)槠浞秶鷥?nèi)的另一值。
23.一種諧波估算裝置,包括諧波頻率調(diào)整器,其計算諧波頻率調(diào)整值的范圍,并在使每個頻段誤差能量最小的范圍內(nèi)選擇諧波頻率調(diào)整值;以及諧波幅度估算器,其使用使誤差能量最小的諧波頻率調(diào)整值,估算每個頻段的最大諧波幅度。
24.根據(jù)權(quán)利要求23所述的裝置,其中所述諧波頻率調(diào)整值的范圍,與頻率成比例,且該范圍在低頻段小,在高頻段大。
25.根據(jù)權(quán)利要求23所述的裝置,其中所述誤差能量是通過輸入信號頻譜的絕對值和合成信號頻譜的絕對值之間差的平方,以及通過累加從頻段的起點到該頻段終點的差的平方來得到的。
26.根據(jù)權(quán)利要求23所述的裝置,其中所述諧波幅度是使用使誤差能量最小的諧波頻率調(diào)整值和在每個頻段上的原始頻譜和合成頻譜的諧波重合的峰值來估算的。
27.根據(jù)權(quán)利要求23所述的裝置,進(jìn)一步包括峰值提取裝置,用于在提取每個頻段的原始頻譜和合成頻譜的諧波重合的峰值。
28.根據(jù)權(quán)利要求23所述的裝置,其中所述諧波頻率調(diào)整器使用所述范圍內(nèi)的最佳的頻率調(diào)整值來選擇使諧波幅度最大的值。
29.根據(jù)權(quán)利要求23所述的方法,其中如果所述調(diào)整值不是使誤差能量最小的調(diào)整值,則所述諧波頻率調(diào)整器調(diào)整所述調(diào)整值為其范圍內(nèi)的另一值。
全文摘要
本發(fā)明涉及一種估算諧波的方法和裝置,其通過以多個基頻為中心調(diào)整諧波間隔或從提取峰值來減少了計算量,并能夠非常有效地應(yīng)用于低傳輸速率的聲音編碼器中,從而減小了原始信號頻譜和估算的諧波頻譜之間的誤差。
文檔編號G06F17/14GK1455390SQ0312418
公開日2003年11月12日 申請日期2003年4月30日 優(yōu)先權(quán)日2002年4月30日
發(fā)明者尹誠完, 崔龍洙, 尹大熙 申請人:Lg電子株式會社