專利名稱:叉積增強的諧波轉(zhuǎn)置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及使用用于高頻重建(HFR)的諧波轉(zhuǎn)置(transposition)方法的音頻編碼系統(tǒng)。
背景技術(shù):
HFR技術(shù)(例如頻譜復(fù)制(SBR)技術(shù))使得顯著改進傳統(tǒng)感知音頻編解碼器的編碼效率。與MPEG-4高級音頻編碼(AAC)組合,它形成非常有效的音頻編解碼器,已將其用在XM衛(wèi)星無線電系統(tǒng)和全球數(shù)字無線電系統(tǒng)(Digital Radio Mondiale)中。AAC和 SBR的組合被稱為aacPlus。這是MPEG-4標準的部分,其中,它被稱作高效AAC規(guī)格(High Efficiency AAC Profile)。通常,HFR技術(shù)可以通過后向和前向兼容的方式與任何感知音頻編解碼器組合,因此提供使已經(jīng)建立的廣播系統(tǒng)(類似于Eureka DAB系統(tǒng)中使用的MPEG 層- 升級的可能性。HFR轉(zhuǎn)置方法也可以與語音編解碼器組合以允許超低比特率的寬帶語首。HRF之后的基本構(gòu)思是觀測到通常存在信號的高頻率范圍的特性與同一信號的低頻率范圍的特性之間的強相關(guān)性。因此,通過從低頻率范圍到高頻率范圍的信號轉(zhuǎn)置可以實現(xiàn)對于信號的原始輸入高頻率范圍的表示的良好近似。WO 98/57436中建立了這種轉(zhuǎn)置的構(gòu)思,以作為用于從音頻信號的較低頻帶重建高頻帶的方法。通過在音頻編碼和/或語音編碼中使用該構(gòu)思可以獲得比特率的大量節(jié)省。下文中,將提到音頻編碼,但應(yīng)注意描述的方法和系統(tǒng)同樣可應(yīng)用于語音編碼并且可應(yīng)用在統(tǒng)一的語音和音頻編碼(USAC)中。在基于HFR的音頻編碼系統(tǒng)中,低帶寬信號被提供給核心波形編碼器,使用通常以非常低的比特率被編碼的并且描述目標譜形狀的附加邊信息和低帶寬信號的轉(zhuǎn)置在解碼器側(cè)再生成較高頻率。對于低比特率,在核心編碼的信號的帶寬窄的情況下,重建具有感知愉悅特性的高帶(即音頻信號的高頻率范圍)變得愈加重要。以下提及諧波頻率重建方法的兩種變型,一個被稱為諧波轉(zhuǎn)置,而另一個被稱為單邊帶調(diào)制。WO 98/57436中定義的諧波轉(zhuǎn)置的原理是具有頻率ω的正弦波映射成具有頻率 Τω的正弦波,其中,T > 1是定義轉(zhuǎn)置階的整數(shù)。諧波轉(zhuǎn)置的有吸引力的特征在于,其通過等于轉(zhuǎn)置階的因子(即通過等于T的因子)將源頻率范圍擴展到目標頻率范圍。對于復(fù)雜音樂材料,諧波轉(zhuǎn)置良好地執(zhí)行。此外,諧波轉(zhuǎn)置呈現(xiàn)低交叉頻率,即,從低于交叉頻率的相對小的低頻率范圍可以生成高于交叉頻率的大的高頻率范圍。與諧波轉(zhuǎn)置對照,基于單邊帶調(diào)制(SSB)的HFR將具有頻率ω的正弦波映射成具有頻率ω + Δ ω的正弦波,其中,△ ω是固定頻率偏移。已經(jīng)觀測到若給定具有低帶寬的核心信號,則由于SSB轉(zhuǎn)置會導(dǎo)致失諧振鈴假聲(ringing artifact) 0還應(yīng)注意,對于低交叉頻率(即小的源頻率范圍),諧波轉(zhuǎn)置將需要比基于SSB的轉(zhuǎn)置更少數(shù)目的補丁塊 (patch),以填充期望的目標頻率范圍。以舉例的方式,如果應(yīng)填充(ω,4ω]的高頻率范圍,則使用轉(zhuǎn)置階T = 4,諧波轉(zhuǎn)置可以從(jw,C>的低頻率范圍填充該頻率范圍。另一方
面,使用相同低頻率范圍的基于SSB的轉(zhuǎn)置必須使用㈣的頻率偏移,并且需要重復(fù)處理四次以填充高頻率范圍(ω,4ω]。另一方面,如已經(jīng)在WO 02/052545 Al中指出的那樣,諧波轉(zhuǎn)置對于具有顯著周期結(jié)構(gòu)的信號具有缺點。這些信號是具有頻率Ω、2Ω、3Ω、...的諧波相關(guān)的正弦波的疊加, 其中,Ω是基頻。在階1~的諧波轉(zhuǎn)置時,輸出正弦波具有頻率10、210、310、...,在1~> 1的情況下,其僅是期望的全諧波序列的嚴格子集。關(guān)于所得音頻質(zhì)量,通常將感知與轉(zhuǎn)置的基頻 ΤΩ對應(yīng)的“鬼影(ghost)”音調(diào)。一般,諧波轉(zhuǎn)置產(chǎn)生編碼的和解碼的音頻信號的“金屬”
聲音特性。通過將若干轉(zhuǎn)置階T = 2、3.....Tfflax加到HFR可以將該情況減緩到一定程度,
但如果要避免多數(shù)譜隙,則該方法在計算上是復(fù)雜的。WO 02/052545A1中已經(jīng)提出了當使用諧波轉(zhuǎn)置時用于避免“鬼影”音調(diào)出現(xiàn)的替選解決方案。該解決方案在于使用兩種類型的轉(zhuǎn)置,即典型諧波轉(zhuǎn)置和特殊“脈沖轉(zhuǎn)置”。 描述的方法教導(dǎo)對于被檢測為具有類似脈沖串(pulse-train)特性的周期的音頻信號的部分切換到專用“脈沖轉(zhuǎn)置”。該方法的問題在于,與基于高分辨率濾波器組的諧波轉(zhuǎn)置相比,對復(fù)雜音樂材料應(yīng)用“脈沖轉(zhuǎn)置” 一般使得質(zhì)量下降。因此,必須相當謹慎地調(diào)諧檢測機制,以使得對于復(fù)雜材料不使用脈沖轉(zhuǎn)置。不可避免地,單音調(diào)樂器和聲音有時將被分類為復(fù)雜信號,由此調(diào)用諧波轉(zhuǎn)置并且因此丟失諧波。此外,如果在單音調(diào)信號或具有較弱復(fù)雜背景中的主要音調(diào)的信號的中間發(fā)生切換,則在具有非常不同的譜填充特性的這兩種轉(zhuǎn)換方法之間切換自身將生成可聽見的假聲。
發(fā)明內(nèi)容
本發(fā)明提供一種用于完成由于周期信號的諧波轉(zhuǎn)置而產(chǎn)生的諧波序列的方法和系統(tǒng)。頻域轉(zhuǎn)置包括步驟將來自分析濾波器組的非線性改變的子帶信號映射到合成濾波器組的選擇的子帶。非線性改變包括相位改變或相位旋轉(zhuǎn),其是在幅度調(diào)整之后可以在復(fù)濾波器組域中通過冪法則獲得的。而現(xiàn)有技術(shù)轉(zhuǎn)置一次分開地改變一個分析子帶,本發(fā)明教導(dǎo)將用于每個合成子帶的至少兩個不同分析子帶的非線性組合相加。待混合的分析子帶之間的間隔可以與待轉(zhuǎn)置的信號的主分量的基頻有關(guān)。在多數(shù)常見形式中,本發(fā)明的數(shù)學(xué)描述是使用一組頻率分量ωι、ω2.....COk來創(chuàng)
建新的頻率分量ω = T1 ω ^T2 ω 2+. . . +Tk ω κ,其中,系數(shù) \、T2.....Tk是整數(shù)轉(zhuǎn)置階,它們的和是總轉(zhuǎn)置階T = T^T2+. . . +Tko
通過用因子TpT2.....Tk改變K個適當選取的子帶信號的相位并且將結(jié)果重組為具有等于
改變的相位之和的相位的信號,來獲得這種效果。重要的是,注意,由于各轉(zhuǎn)置階是整數(shù),因此準確定義了所有這些相位操作并且它們是不模糊的,并且只要總轉(zhuǎn)置階滿足T > 1,這些整數(shù)中的一些甚至可以是負數(shù)?,F(xiàn)有技術(shù)方法與情況K = 1對應(yīng),本發(fā)明教導(dǎo)使用K彡2。描述的文本主要處理情
8況K = 2,T彡2,由于其足以解決手上的多數(shù)具體問題。但應(yīng)注意,認為情況K > 2同樣被本文獻公開和涵蓋。本發(fā)明使用來自較高數(shù)目的較低頻帶分析信道(即較高數(shù)目的分析子帶信號) 的信息,以將來自分析濾波器組的非線性改變的子帶信號映射到合成濾波器組的選擇的子帶。轉(zhuǎn)置不僅是一次分開地修改一個子帶,而且其將用于每個合成子帶的至少兩個不同分析子帶的非線性組合相加。如已經(jīng)提到的,階τ的諧波轉(zhuǎn)置被設(shè)計為將頻率ω的正弦波映射為具有頻率Τω的正弦波,其中,T > 1。根據(jù)本發(fā)明,具有音調(diào)(pitch)參數(shù)Ω和索引 0 < r < T的所謂的叉積增強被設(shè)計為將具有頻率(ω,ω + Ω)的正弦波的對映射為具有頻率(T-r) ω+Γ(ω + Ω) = Τω+ΓΩ的正弦波。應(yīng)理解,對于這些叉積轉(zhuǎn)置,通過利用范圍從1到T-I的索引r將音調(diào)參數(shù)Ω的所有叉積加到階T的諧波轉(zhuǎn)置上,將生成具有周期Ω 的周期信號的所有部分頻率。根據(jù)本發(fā)明的一方面,描述了一種用于從信號的低頻分量生成該信號的高頻分量的系統(tǒng)和方法。應(yīng)注意,在系統(tǒng)的背景中以下描述的特征同樣可應(yīng)用于本發(fā)明的方法。例如,信號可以是音頻和/或語音信號。該系統(tǒng)和方法可被用于統(tǒng)一的語音和音頻信號編碼。 信號包括低頻分量和高頻分量,其中,低頻分量包括低于特定交叉頻率的頻率,而高頻分量包括高于交叉頻率的頻率。在特定情況下,可能需要從信號的低頻分量估計其高頻分量。通過舉例的方式,特定音頻編碼方案僅對音頻信號的低頻分量進行編碼,并且目的是可通過使用關(guān)于原始高頻分量的包絡(luò)的特定信息僅從解碼的低頻分量重建該信號的高頻分量。在此描述的系統(tǒng)和方法可以用在這樣的編碼和解碼系統(tǒng)的背景下。用于生成高頻分量的系統(tǒng)包括分析濾波器組,其提供信號的低頻分量的多個分析子帶信號。這樣的分析濾波器組可以包括具有恒定帶寬的一組帶通濾波器。注意,在語音信號的背景下,也可以有利地使用具有對數(shù)帶寬分布的一組帶通濾波器。分析濾波器組的目的是將信號的低頻分量分離成其頻率貢獻。這些頻率貢獻將反映在分析濾波器組生成的多個分析子帶信號中。通過舉例的方式,包括樂器演奏的音符的信號將被分離成具有用于與演奏的音符的諧波頻率對應(yīng)的子帶的顯著幅度的分析子帶信號,而其它子帶將呈現(xiàn)具有低幅度的分析子帶信號。該系統(tǒng)還包括非線性處理單元,其用于通過改變或旋轉(zhuǎn)所述多個分析子帶信號中的第一分析子帶信號和第二分析子帶信號的相位并且通過混合相位改變的分析子帶信號而生成具有特定合成頻率的合成子帶信號。通常,第一分析子帶信號和第二分析子帶信號不同。換句話說,它們與不同子帶對應(yīng)。非線性處理單元可以包括其內(nèi)生成有合成子帶信號的所謂的交叉項處理單元。合成子帶信號包括合成頻率。通常,合成子帶信號包括來自特定合成頻率范圍的頻率。合成頻率是在該頻率范圍內(nèi)的頻率,例如頻率范圍的中心頻率。合成頻率以及還有合成頻率范圍通常高于交叉頻率。通過類似的方式,分析子帶信號包括來自特定分析頻率范圍的頻率。這些分析頻率范圍通常低于所述交叉頻率。相位改變的操作可以包括轉(zhuǎn)置分析子帶信號的頻率。典型地,分析濾波器組得到可被表示為包括幅度和相位的復(fù)指數(shù)的復(fù)分析子帶信號。復(fù)子帶信號的相位與子帶信號的頻率對應(yīng)。通過取得子帶信號的轉(zhuǎn)置階T'次的冪,可以執(zhí)行借助于特定轉(zhuǎn)置階T'的這些子帶信號的轉(zhuǎn)置。這導(dǎo)致復(fù)子帶信號的相位乘以轉(zhuǎn)置階T'。因此,轉(zhuǎn)置的分析子帶信號呈現(xiàn)比初始相位或頻率大T'倍的相位或頻率。該相位改變操作也可以被稱為相位旋轉(zhuǎn)或相
9位相乘。此外,該系統(tǒng)包括合成濾波器組,其用于從合成子帶信號生成信號的高頻分量。 換句話說,合成濾波器組的目的在于,合并來自可能的多個合成頻率范圍的可能的多個合成子帶信號,并且在時域中生成所述信號的高頻分量。應(yīng)注意,對于包括基頻(例如基頻 Ω)的信號,有利的是,合成濾波器組和/或分析濾波器組呈現(xiàn)與信號的基頻相關(guān)聯(lián)的頻率間隔。具體地說,有利的是,選取具有足夠低頻率間隔或足夠高分辨率的濾波器組以解析基頻Ω。根據(jù)本發(fā)明的另一方面,非線性處理單元或非線性處理單元內(nèi)的交叉項處理單元包括第一轉(zhuǎn)置階和第二轉(zhuǎn)置階的多輸入單輸出單元,其從分別呈現(xiàn)第一分析頻率和第二分析頻率的第一分析子帶信號和第二分析子帶信號生成合成子帶信號。換句話說,多輸入單輸出單元執(zhí)行第一分析子帶信號和第二分析子帶信號的轉(zhuǎn)置,并且將兩個轉(zhuǎn)置的分析子帶信號合并為合成子帶信號。第一分析子帶信號被相位改變,或?qū)⑵湎辔怀艘缘谝晦D(zhuǎn)置階,并且第二分析子帶信號被相位改變,或?qū)⑵湎辔怀艘缘诙D(zhuǎn)置階。在復(fù)分析子帶信號的情況下,這種相位改變操作包括將各分析子帶信號的相位乘以各轉(zhuǎn)置階?;旌蟽蓚€轉(zhuǎn)置的分析子帶信號,以得到具有合成頻率的混合的合成子帶信號,該合成頻率與乘以第一轉(zhuǎn)置階的第一分析頻率加上乘以第二轉(zhuǎn)置階的第二分析頻率對應(yīng)。該混合步驟可以包括兩個轉(zhuǎn)置的復(fù)分析子帶信號的相乘。兩個信號之間的這種相乘可以包括它們的采樣的相乘。上述特征也可以通過公式表示。設(shè)第一分析頻率是ω,并且第二分析頻率是(ω + Ω)。應(yīng)注意,這些變量也可以表示兩個分析子帶信號的各分析頻率范圍。換句話說,頻率應(yīng)理解為表示特定頻率范圍或頻率子帶內(nèi)包括的所有頻率,即第一和第二分析頻率也應(yīng)理解為第一和第二分析頻率范圍或第一和第二分析子帶。此外,第一轉(zhuǎn)置階可以是(Τ-r),第二轉(zhuǎn)置階可以是r。 有利的是,限制轉(zhuǎn)置階以使得T > 1并且1 < r < T。對于這些情況,多輸入單輸出單元可以得到具有(T-r) · ω+r· (ω + Ω)的合成頻率的合成子帶信號。根據(jù)本發(fā)明的另一方面,該系統(tǒng)包括多個多輸入單輸出單元和/或多個非線性處理單元,其生成具有合成頻率的多個部分合成子帶信號。換句話說,可以生成覆蓋相同合成頻率范圍的多個部分合成子帶信號。在這樣的情況下,子帶求和單元被設(shè)置為混合所述多個部分合成子帶信號。混合的部分合成子帶信號于是表示合成子帶信號?;旌喜僮骺梢园▽⑺龆鄠€部分合成子帶信號加到一起。其也可以包括從所述多個部分合成子帶信號確定平均合成子帶信號,其中,合成子帶信號可以根據(jù)它們對于合成子帶信號的相關(guān)性而被加權(quán)?;旌喜僮饕部梢园ㄟx擇例如具有超過預(yù)定義閾值的幅度的多個子帶信號中的一個或一些。應(yīng)注意,有利的是,將合成子帶信號乘以增益參數(shù)。注意,在存在多個部分合成子帶信號的情況下,這樣的增益參數(shù)可有助于合成子帶信號的歸一化。根據(jù)本發(fā)明的另一方面,非線性處理單元還包括直接處理單元,其用于從所述多個分析子帶信號中的第三分析子帶信號生成另一合成子帶信號。這樣的直接處理單元可以執(zhí)行例如WO 98/57436中描述的直接轉(zhuǎn)置方法。如果該系統(tǒng)包括附加直接處理單元,則其需要提供用于混合對應(yīng)合成子帶信號的子帶求和單元。這樣的對應(yīng)合成子帶信號通常是覆蓋相同合成頻率范圍和/或呈現(xiàn)相同合成頻率的子帶信號。子帶求和單元可以根據(jù)以上概述的方面進行混合。如果例如來自組成合成子帶信號的交叉項的一個或更多個分析子帶信號的幅度的最小值小于信號的幅度的預(yù)定義分數(shù),則也可以忽略特定合成子帶信號,尤其是生成在多輸入單輸出單元中的特定合成子帶信號。信號可以是信號的低頻分量或特定分析子帶信號。該信號也可以是特定合成子帶信號。換句話說,如果用于生成合成子帶信號的分析子帶信號的幅度或能量太小,則該合成子帶信號可以不用于生成信號的高頻分量。例如,通過確定分析子帶信號的多個鄰近采樣上的時間平均或滑動窗平均,對于每個采樣可以確定能量或幅度,或?qū)τ谝唤M采樣可以確定能量或幅度。直接處理單元可以包括第三轉(zhuǎn)置階T'的單輸入單輸出單元,其從呈現(xiàn)第三分析頻率的第三分析子帶信號生成合成子帶信號,其中,第三分析子帶信號通過第三轉(zhuǎn)置階T' 被相位改變,或?qū)⑵湎辔怀艘缘谌D(zhuǎn)置階T',并且其中,T'大于1。合成頻率于是與乘以第三轉(zhuǎn)置階的第三分析頻率對應(yīng)。應(yīng)注意,該第三轉(zhuǎn)置階T'優(yōu)選地等于以下介紹的系統(tǒng)轉(zhuǎn)置階T。根據(jù)本發(fā)明的另一方面,分析濾波器組具有N個分析子帶,所述N個分析子帶具有基本恒定子帶間隔Δω。如上所述,該子帶間隔△ ω可以與信號的基頻相關(guān)聯(lián)。分析子帶與分析子帶索引η相關(guān)聯(lián),其中,η e (1,...,N)。換句話說,可以通過子帶索引η來標識分析濾波器組的分析子帶。以類似的方式,可以利用子帶索引η來標識包括來自對應(yīng)分析子帶的頻率范圍的頻率的分析子帶信號。在合成側(cè),合成濾波器組也具有與合成子帶索引η相關(guān)聯(lián)的合成子帶。該合成子帶索引η也標識包括來自具有子帶索引η的合成子帶的合成頻率范圍的頻率的合成子帶信號。如果該系統(tǒng)具有系統(tǒng)轉(zhuǎn)置階,(也被稱為總轉(zhuǎn)置階Τ,則合成子帶通常具有Δω ·Τ的基本恒定子帶間隔,即,合成子帶的子帶間隔比分析子帶的子帶間隔大T倍。在這些情況下,具有索引η的合成子帶和分析子帶均包括通過因子或系統(tǒng)轉(zhuǎn)置階T而彼此有關(guān)的頻率范圍。通過舉例的方式,如果具有索引η的分析子帶的頻率范圍是[(η-1) · ω,η· ω],則具有索引η的合成子帶的頻率范圍是[Τ· (η-1) · ω,Τ·η· ω]。假定合成子帶信號與具有索引η的合成子帶相關(guān)聯(lián),則本發(fā)明的另一方面在于, 在多輸入單輸出單元中從第一分析子帶信號和第二分析子帶信號生成具有索引η的該合成子帶信號。第一分析子帶信號與具有索引H-P1的分析子帶相關(guān)聯(lián),第二分析子帶信號與具有索引η+ρ2的分析子帶相關(guān)聯(lián)。以下,概述了用于選擇索引偏移的對(Pl,P2)的若干方法。通過所謂的索引選擇單元可以執(zhí)行該方法。典型地,選擇索引偏移的最佳對,以生成具有預(yù)定義合成頻率的合成子帶信號。在第一種方法中,從存儲在索引存儲單元中的對(Pl,P2)的有限列表選擇索引偏移 Pi*P2。從索引偏移對的該有限列表可以選擇對(Pl,P2),使得包括第一分析子帶信號的幅度和第二分析子帶信號的幅度的集合的最小值被最大化。換句話說,對于索引偏移P1和P2 的每一可能的對,可以確定對應(yīng)分析子帶信號的幅度。在復(fù)分析子帶信號的情況下,幅度對應(yīng)于絕對值。例如,通過確定分析子帶信號的多個鄰近采樣上的時間平均或滑動窗平均,對于每個采樣可以確定幅度,或?qū)τ谝唤M采樣可以確定幅度。這分別得到第一分析子帶信號和第二分析子帶信號的第一幅度和第二幅度??紤]第一幅度和第二幅度的最小值,并且選擇該最小幅度值為最高的索引偏移對(P1, P2)。在另一方法中,從對(Pl,P2)的有限列表選擇索引偏移P1和P2,其中,通過公式P1 =r · 1和P2 = (T-r) · 1確定有限列表。在這些公式中,1是正整數(shù),取值例如從1到10。 在用于轉(zhuǎn)置第一分析子帶(Ii-P1)的第一轉(zhuǎn)置階是(T-r)并且用于轉(zhuǎn)置第二分析子帶(n+p2)的第二轉(zhuǎn)置階是r的情況下,該方法尤其有用。假設(shè)系統(tǒng)轉(zhuǎn)置階T是固定的,則可以選擇參數(shù)1和r以使得包括第一分析子帶信號的幅度和第二分析子帶信號的幅度的集合的最小值被最大化。換句話說,通過如上所述的最大-最小優(yōu)化方法可以選擇參數(shù)1和r。在另一方法中,基于潛在信號的特性可以選擇第一分析子帶信號和第二分析子帶信號。注意,如果信號包括基頻Ω,g卩如果信號是具有脈沖串式特性的周期性信號,則有利的是,考慮該信號特性來選擇索引偏移P1和1)2。從信號的低頻分量可以確定基頻Ω,或從包括低頻分量和高頻分量的原始信號可以確定基頻Ω。在第一種情況下,使用高頻重建在信號解碼器處可以確定基頻Ω,而在第二種情況下,通常會在信號編碼器處確定基頻Ω, 然后傳送到對應(yīng)信號解碼器。如果使用具有子帶間隔△ ω的分析濾波器組,并且如果用于轉(zhuǎn)置第一分析子帶(Ii-P1)的第一轉(zhuǎn)置階是(T-r),并且如果用于轉(zhuǎn)置第二分析子帶(n+p2) 的第二轉(zhuǎn)置階是r,則可以選擇P1和p2,使得它們的和Pl+P2近似于分數(shù)Ω / Δ ω,并且它們的分數(shù)P1Z^P2近似于r/ (T-r)。在特定情況下,選擇P1和p2,使得分數(shù)Pl/P2等于r/ (Τ-r)。根據(jù)本發(fā)明的另一方面,用于生成信號的高頻分量的系統(tǒng)還包括分析窗,其在預(yù)定義時間k周圍隔離預(yù)定義時間間隔的低頻分量。該系統(tǒng)可以還包括合成窗,其在預(yù)定義時間k周圍隔離預(yù)定義時間間隔的高頻分量。這些窗對于具有隨時間改變的頻率貢獻的信號特別有用。它們允許分析信號的瞬時頻率組成。與濾波器組組合,這種時間相關(guān)頻率分析的典型示例是短時間傅立葉變換(STFT)。應(yīng)注意,分析窗一般是合成窗的時間擴展版本。 對于具有系統(tǒng)階轉(zhuǎn)置T的系統(tǒng),時域中的分析窗可以是具有擴展因子T的時域中的合成窗的時間擴展版本。根據(jù)本發(fā)明的另一方面,描述了一種用于對信號進行解碼的系統(tǒng)。該系統(tǒng)采用信號的低頻分量的編碼的版本,并且包括根據(jù)上述系統(tǒng)的轉(zhuǎn)置單元,用于從信號的低頻分量生成信號的高頻分量。典型地,這種解碼系統(tǒng)還包括核心解碼器,其用于對信號的低頻分量進行解碼。該解碼系統(tǒng)還可以包括上采樣器,其用于執(zhí)行低頻分量的上采樣,以得到上采樣的低頻分量。如果在編碼器處已經(jīng)下采樣信號的低頻分量,則這可以是需要的,利用如下事實與原始信號相比,低頻分量僅覆蓋減少的頻率范圍。此外,該解碼系統(tǒng)可以包括 輸入單元,其用于接收包括低頻分量的編碼的信號;以及輸出單元,其用于提供包括低頻分量和生成的高頻分量的解碼的信號。該解碼系統(tǒng)還可以包括包絡(luò)調(diào)整器,其用于對高頻分量整形。雖然使用本發(fā)明中描述的高頻重建系統(tǒng)和方法從信號的低頻率范圍可以再生成信號的高頻率,但有利的是, 從原始信號提取關(guān)于其高頻分量的譜包絡(luò)的信息。該包絡(luò)信息然后可以提供給解碼器,以生成良好地近似原始信號的高頻分量的譜包絡(luò)的高頻分量。通常在解碼系統(tǒng)處在包絡(luò)調(diào)整器中執(zhí)行該操作。為接收與信號的高頻分量的包絡(luò)有關(guān)的信息,該解碼系統(tǒng)可以包括包絡(luò)數(shù)據(jù)接收單元。然后可以在分量求和單元中對再生的高頻分量和解碼的可能上采樣的低頻分量求和,以確定解碼的信號。如上所述,用于生成高頻分量的系統(tǒng)可以使用關(guān)于要被轉(zhuǎn)置和混合以生成特定合成子帶信號的分析子帶信號的信息。為此,該解碼系統(tǒng)還可以包括子帶選擇數(shù)據(jù)接收單元,其用于接收允許第一分析子帶信號和第二分析子帶信號的選擇的信息,從第一分析子帶信號和第二分析子帶信號生成合成子帶信號。該信息可以與編碼的信號的特定特性有關(guān),例如,信息可以與信號的基頻Ω相關(guān)聯(lián)。信息也可以與要選擇的分析子帶直接有關(guān)。通過舉例的方式,信息可以包括可能的索引偏移的對(Pl,P2)的列表或第一分析子帶信號和第二分析子帶信號的可能的對的列表。根據(jù)本發(fā)明的另一方面,描述了一種編碼的信號。該編碼的信號包括與解碼的信號的低頻分量有關(guān)的信息,其中,低頻分量包括多個分析子帶信號。此外,編碼的信號包括與選擇所述多個分析子帶信號中的兩個以通過轉(zhuǎn)置選擇的兩個分析子帶信號生成解碼的信號的高頻分量有關(guān)的信息。換句話說,編碼的信號包括信號的低頻分量的可能編碼的版本。此外,它提供例如可能的索引偏移對(Pl,P2)的列表或信號的基頻Ω的信息,這將允許解碼器基于本文獻中概述的叉積增強的諧波轉(zhuǎn)置方法再生成信號的高頻分量。根據(jù)本發(fā)明的另一方面,描述了一種用于對信號進行編碼的系統(tǒng)。該編碼系統(tǒng)包括分離單元,其用于將信號分離成低頻分量和高頻分量;以及核心編碼器,其用于對低頻分量進行編碼。它還包括頻率確定單元,其用于確定信號的基頻Ω ;以及參數(shù)編碼器,其用于對基頻Ω進行編碼,其中,基頻Ω用在解碼器中,以再生成信號的高頻分量。該系統(tǒng)可以還包括包絡(luò)確定單元,其用于確定高頻分量的譜包絡(luò);以及包絡(luò)編碼器,其用于對譜包絡(luò)進行編碼。換句話說,編碼系統(tǒng)移除原始信號的高頻分量并且通過核心編碼器(例如 AAC或杜比D編碼器)對低頻分量進行編碼。此外,編碼系統(tǒng)分析原始信號的高頻分量,并且確定在解碼器處使用的信息的集合,以再生成解碼的信號的高頻分量。信息的集合可以包括信號的基頻Ω和/或高頻分量的譜包絡(luò)。編碼系統(tǒng)還可以包括分析濾波器組,其提供信號的低頻分量的多個分析子帶信號。此外,它可以包括子帶對確定單元,其用于確定用于生成信號的高頻分量的第一子帶信號和第二子帶信號;以及索引編碼器,其用于對表示確定的第一子帶信號和第二子帶信號的索引號進行編碼。換句話說,編碼系統(tǒng)可以使用本文獻中描述的高頻重建方法和/或系統(tǒng),以確定分析子帶,從所述分析子帶可以生成信號的高頻子帶以及最終為高頻分量。關(guān)于這些子帶的信息(例如索引偏移對(Pl,P2)的有限列表)然后可以被編碼并且提供給解碼器。如以上所強調(diào)的,本發(fā)明還包括用于生成信號的高頻分量的方法、以及用于對信號進行解碼和編碼的方法。在系統(tǒng)的背景下上文中概述的特征同樣可應(yīng)用于對應(yīng)的方法。 以下概述了根據(jù)本發(fā)明的方法的選擇的方面。以類似的方式,這些方面也可應(yīng)用于本文獻中概述的系統(tǒng)。根據(jù)本發(fā)明的另一方面,描述了一種用于從信號的低頻分量執(zhí)行高頻分量的高頻重建的方法。該方法包括步驟提供來自第一頻帶的低頻分量的第一子帶信號以及來自第二頻帶的低頻分量的第二子帶信號。換句話說,從信號的低頻分量隔離兩個子帶信號,第一子帶信號包括第一頻帶,第二子帶信號包括第二頻帶。優(yōu)選地,兩個頻率子帶不同。在另一步驟中,分別通過第一轉(zhuǎn)置因子和第二轉(zhuǎn)置因子轉(zhuǎn)置第一子帶信號和第二子帶信號。根據(jù)用于轉(zhuǎn)置信號的已知方法可以執(zhí)行每個子帶信號的轉(zhuǎn)置。在復(fù)子帶信號的情況下,可以通過利用各轉(zhuǎn)置因子或轉(zhuǎn)置階改變相位或者通過將相位乘以各轉(zhuǎn)置因子或轉(zhuǎn)置階來執(zhí)行轉(zhuǎn)置。在另一步驟中,混合轉(zhuǎn)置的第一子帶信號和第二子帶信號,以得到包括來自高頻帶的頻率的高頻分量。可以執(zhí)行轉(zhuǎn)置,使得高頻帶與乘以第一轉(zhuǎn)置因子的第一頻帶和乘以第二轉(zhuǎn)置因子的第二頻帶之和相對應(yīng)。此外,轉(zhuǎn)置步驟可以包括步驟將第一子帶信號的第一頻帶乘以第
13一轉(zhuǎn)置因子,并且將第二子帶信號的第二頻帶乘以第二轉(zhuǎn)置因子。為了簡化說明并且不限制其范圍,針對單個頻率的轉(zhuǎn)置來說明本發(fā)明。然而,應(yīng)注意,不僅針對單個頻率而且針對整個頻帶(即針對頻帶內(nèi)包括的多個頻率)來執(zhí)行轉(zhuǎn)置。實際上,在本文獻中,頻率的轉(zhuǎn)置和頻帶的轉(zhuǎn)置應(yīng)理解為可互換。然而,需要意識到分析濾波器組和合成濾波器組的不同頻率分辨率。在上述方法中,提供步驟可以包括通過分析濾波器組對低頻分量進行濾波以生成第一子帶信號和第二子帶信號。另一方面,混合步驟可以包括將第一轉(zhuǎn)置的子帶信號和第二轉(zhuǎn)置的子帶信號相乘以得到高子帶信號,以及將高子帶信號輸入到合成濾波器組以生成高頻分量。到某種頻率表示和來自某種頻率表示的其它信號變換也是可能的并且在本發(fā)明的范圍內(nèi)。這些信號變換包括傅立葉變換(FFT,DCT)、小波變換、正交鏡像濾波(QMF) 等。此外,這些變換還包括窗函數(shù),目的是隔離“要變換的”信號的減少的時間間隔??赡艿拇昂瘮?shù)包括高斯窗、余弦窗、漢明窗、漢寧窗、矩形窗、巴特利特窗、布萊克曼窗等。在本文獻中,術(shù)語“濾波器組”可以包括與任何這些窗函數(shù)可組合的任何這些變換。根據(jù)本發(fā)明的另一方面,描述了一種用于對編碼的信號進行解碼的方法。編碼的信號是從原始信號得到的,并且僅表示低于交叉頻率的原始信號的頻率子帶的部分。該方法包括步驟提供編碼的信號的第一頻率子帶和第二頻率子帶。這可以通過使用分析濾波器組完成。然后,分別通過第一轉(zhuǎn)置因子和第二轉(zhuǎn)置因子來轉(zhuǎn)置頻率子帶。這可以通過利用第一轉(zhuǎn)置因子執(zhí)行第一頻率子帶中信號的相位改變或相位相乘并且通過利用第二轉(zhuǎn)置因子執(zhí)行第二頻率子帶中信號的相位改變或相位相乘而完成。最后,從第一轉(zhuǎn)置的頻率子帶和第二轉(zhuǎn)置的頻率子帶生成高頻率子帶,其中高頻率子帶高于交叉頻率。高頻率子帶可以與乘以第一轉(zhuǎn)置因子的第一頻率子帶和乘以第二轉(zhuǎn)置因子的第二頻率子帶之和相對應(yīng)。根據(jù)本發(fā)明的另一方面,描述了一種用于對信號進行編碼的方法。該方法包括步驟對信號進行濾波,以隔離信號的低頻率;以及對信號的低頻分量進行編碼。此外,提供信號的低頻分量的多個分析子帶信號。這可以通過使用本文獻中描述的分析濾波器組完成。然后,確定用于生成信號的高頻分量的第一子帶信號和第二子帶信號。這可以使用本文獻中概述的高頻重建方法和系統(tǒng)完成。最后,對表示確定的第一子帶信號和第二子帶信號的信息進行編碼。這種信息可以是原始信號的特性,(例如信號的基頻Ω )、或與選擇的分析子帶有關(guān)的信息(例如索引偏移對(Pl,P2))。應(yīng)注意,可以任意地組合本發(fā)明的上述實施例和方法。具體地說,應(yīng)注意,針對系統(tǒng)概述的方面也可應(yīng)用于本發(fā)明包括的對應(yīng)方法。此外,應(yīng)注意,本發(fā)明的公開內(nèi)容還覆蓋除了后面提到的從屬權(quán)利要求中明顯給出的權(quán)利要求組合之外的其它權(quán)利要求組合,即, 能夠以任何順序和任何形式組合權(quán)利要求及其技術(shù)特征。
現(xiàn)在將以并非限制本發(fā)明的范圍的說明性示例的方式來描述本發(fā)明。將參照附圖來描述本發(fā)明,在附圖中圖1圖示了 HFR增強的音頻解碼器的操作;圖2圖示了使用若干階的諧波轉(zhuǎn)置器的操作;圖3圖示了頻域(FD)諧波轉(zhuǎn)置器的操作;
圖4圖示了交叉項處理的本發(fā)明使用的操作;圖5圖示了現(xiàn)有技術(shù)的直接處理;圖6圖示了單個子帶的現(xiàn)有技術(shù)的直接非線性處理;圖7圖示了本發(fā)明的交叉項處理的部件;圖8圖示了交叉項處理塊的操作;圖9圖示了圖8的MISO系統(tǒng)中的每一個中包含的本發(fā)明的非線性處理;圖10至圖18圖示了示例性周期信號的諧波轉(zhuǎn)置的本發(fā)明的效果;圖19圖示了短時間傅立葉變換(STFT)的時間-頻率分辨率;圖20圖示了在合成側(cè)使用的窗函數(shù)及其傅立葉變換的示例性時間進展。圖21圖示了正弦輸入信號的STFT ;圖22圖示了在分析側(cè)使用的根據(jù)圖20的窗函數(shù)及其傅立葉變換;圖23和圖M圖示了用于合成濾波器組子帶的交叉項增強的適當?shù)姆治鰹V波器組子帶的確定;圖25、圖沈和圖27圖示了描述的直接項和交叉項諧波轉(zhuǎn)置方法的實驗結(jié)果。圖觀和圖四圖示了分別使用本文獻中概述的增強的諧波轉(zhuǎn)置方案的編碼器和解碼器的實施例;以及圖30圖示了圖觀和圖四所示的轉(zhuǎn)置單元的實施例。
具體實施例方式下述實施例僅說明所謂的叉積增強的諧波轉(zhuǎn)置的本發(fā)明的原理。應(yīng)理解,在此描述的布置和細節(jié)的修改和變形對于本領(lǐng)域技術(shù)人員將是明顯的。因此,目的是僅由所附本發(fā)明權(quán)利要求的范圍而不是以這里的實施例的描述和說明的方式提出的具體細節(jié)來限制。圖1圖示了 HFR增強的音頻解碼器的操作。核心音頻解碼器101輸出低帶寬音頻信號,該低帶寬音頻信號被饋送到可能需要的用以按照期望的全采樣率產(chǎn)生最終音頻輸出貢獻(contribution)的上采樣器104。對于雙速率系統(tǒng)需要這種上采樣,其中,在以全采樣頻率處理HFR部分的同時,帶有限核心音頻編解碼器以外部音頻采樣率的一半操作。因此, 對于單速率系統(tǒng),省略該上采樣器104。101的低帶寬輸出還被發(fā)送到輸出轉(zhuǎn)置的信號(即包括期望的高頻率范圍的信號)的轉(zhuǎn)置器或轉(zhuǎn)置單元102。包絡(luò)調(diào)整器103在時間和頻率上可以對該轉(zhuǎn)置的信號整形。最終音頻輸出是低帶寬核心信號與包絡(luò)調(diào)整的轉(zhuǎn)置的信號之和。圖2圖示了與圖1的轉(zhuǎn)置器102對應(yīng)的諧波轉(zhuǎn)置器201的操作,諧波轉(zhuǎn)置器201
包括不同轉(zhuǎn)置階T的若干轉(zhuǎn)置器。待轉(zhuǎn)置的信號傳遞到分別具有轉(zhuǎn)置階T = 2、3.....Tfflax
的單獨轉(zhuǎn)置器201-2、201-3.....201-Tmax的組。通常,轉(zhuǎn)置階Tmax = 3對于大多數(shù)音頻編
碼應(yīng)用是足夠的。在202中對不同轉(zhuǎn)置器201-2,201-3.....201-Tmax的貢獻求和,以得到
混合的轉(zhuǎn)置器輸出。在第一實施例中,該求和操作可以包括將各貢獻加到一起。在另一實施例中,利用不同權(quán)重將貢獻加權(quán)以使得減輕將多個貢獻加到特定頻率上的效果。例如,第三階貢獻可以與比第二階貢獻更低的增益相加。最后,求和單元202可以根據(jù)輸出頻率有選擇地將貢獻相加。例如,第二階轉(zhuǎn)置可被用于第一較低目標頻率范圍,而第三階轉(zhuǎn)置可被用于第二較高目標頻率范圍。10/21頁圖3圖示了頻域(FD)諧波轉(zhuǎn)置器(例如201的單獨塊之一,即轉(zhuǎn)置階T的轉(zhuǎn)置器 201-T之一)的操作。分析濾波器組301輸出復(fù)子帶,復(fù)子帶被遞送到非線性處理302,非線性處理302根據(jù)選取的轉(zhuǎn)置階T來改變子帶信號的相位和/或幅度。改變的子帶被饋送到合成濾波器組303,合成濾波器組303輸出轉(zhuǎn)置的時域信號。在如圖2所示的不同轉(zhuǎn)置階
的多個并行轉(zhuǎn)置器的情況下,在不同轉(zhuǎn)置器201-2、201-3.....201-Tmax之間可以共享一些
濾波器組操作??梢葬槍Ψ治龌蚝铣蓙磉M行濾波器組的共享。在共享合成303的情況下, 在子帶域中(即在合成303之前)可以執(zhí)行求和202。圖4除了直接處理401之外還圖示了交叉項處理402的操作。在圖3的頻域諧波轉(zhuǎn)置器的非線性處理塊302內(nèi)并行執(zhí)行交叉項處理402和直接處理401。將轉(zhuǎn)置的輸出信號混合(例如相加)以提供聯(lián)合轉(zhuǎn)置的信號。轉(zhuǎn)置的輸出信號的這種混合包括轉(zhuǎn)置的輸出信號的疊加??蛇x地,在增益計算中可以實現(xiàn)交叉項的選擇性相加。圖5更詳細地圖示了在圖3的頻域諧波轉(zhuǎn)置器內(nèi)圖4的直接處理塊401的操作。
單輸入單輸出(SISO)單元401-1.....401-η.....401-Ν將來自源范圍的每個分析子帶映
射到目標范圍中的一個合成子帶。根據(jù)圖5,通過SISO單元401-η將索引η的分析子帶映射到相同索引η的合成子帶。應(yīng)注意,合成濾波器組中具有索引η的子帶的頻率范圍可以根據(jù)諧波轉(zhuǎn)置的確切版本或類型而變化。在圖5所示的版本或類型中,分析組301的頻率間隔是比合成組303的頻率間隔更小的因子Τ。因此,合成組303中的索引η與比分析組 301中的具有相同索引η的子帶的頻率高T倍的頻率相對應(yīng)。通過舉例的方式,分析子帶 [(η-1) ω,η ω ]被轉(zhuǎn)置為合成子帶[(η_1) T ω,ηΤ ω ]。圖6圖示了 401-η的SISO單元中的每一個中包含的單個子帶的直接非線性處理。 塊601的非線性執(zhí)行復(fù)子帶信號的相位與等于轉(zhuǎn)置階T的因子的相乘??蛇x的增益單元 602改變相位改變的子帶信號的幅度。在數(shù)學(xué)方面,SISO單元401-η的輸出y可以寫為至 SISO系統(tǒng)401-η的輸入χ和增益參數(shù)g的函數(shù),如下y = g · VT,其中,V = Χ/|Χ|Η/Τ·(1)這也可以寫為
/ y^ = ^-14 ^ ·
UxU換言之,使復(fù)子帶信號χ的相位乘以轉(zhuǎn)置階T,用增益參數(shù)g改變復(fù)子帶信號χ的幅度。圖7圖示了用于階T的諧波轉(zhuǎn)置的交叉項處理402的部件。存在并行的T_1個交叉項處理塊701-1、· · ·、701-r、· · ·、701-(T-I),在求和單元702中對它們的輸出求和以產(chǎn)生混合的輸出。如介紹部分中已經(jīng)指出的那樣,目標是將具有頻率(ω,ω + Ω)的正弦波的對映射到具有頻率(T-r) ω+Γ(ω + Ω) = Τω+ΓΩ的正弦波,其中,變量r從1到T-1變化。 換句話說,來自分析濾波器組301的兩個子帶被映射為高頻率范圍的一個子帶。對于r的特定值和給定轉(zhuǎn)置階T,在交叉項處理塊701-r中執(zhí)行該映射步驟。圖8圖示了針對固定值r = 1、2.....T-I的交叉項處理塊701_r的操作。在多輸
入單輸出(MISO)單元800-n中從兩個輸入子帶801和802獲得每一輸出子帶803。對于索引η的輸出子帶803,MIS0單元800-n的兩個輸入是子帶n_Pl,801,以及n+p2,802,其中,P1 和P2是正整數(shù)索引偏移,它們?nèi)Q于轉(zhuǎn)置階Τ、變量r、以及叉積增強音調(diào)參數(shù)Ω。分析和
16合成子帶編號習慣與圖5 —致,也就是說,分析組301的頻率間隔是比合成組303的頻率間隔小的因子T,并且因此,針對因子T的改變給出的以上評論仍是相關(guān)的。關(guān)于交叉項處理的使用,應(yīng)考慮以下評述。不需要以高精度獲知音調(diào)參數(shù)Ω,其當然不具有比分析濾波器組301所獲得的頻率分辨率更好的頻率分辨率。實際上,在本發(fā)明的一些實施例中,潛在的叉積增強音調(diào)參數(shù)Ω根本不進入解碼器。反之,通過遵循優(yōu)化準則(例如叉積輸出幅度的最大化,即叉積輸出的能量的最大化)從可能的候選列表選擇整數(shù)索引偏移的選取對(P1, P2) ο通過舉例的方式,對于T和r的給定值,可以使用由公式 (Pl,p2) = (rl,(T-r) 1), 1 e L給出的候選列表,其中,L是正整數(shù)的列表。以下這在公式 (11)的上下文中更詳細地示出。原則上,所有正整數(shù)作為候選是可行的。在一些情況下,音調(diào)信息可有助于識別選取哪個1作為適當?shù)乃饕?。此外,即使圖8所示的示例性叉積處理表明對于輸出子帶的特定范圍所應(yīng)用的索引偏移(P1, P2)是相同的(例如,合成子帶(n-l)、n和(n+1)由具有固定距離Pl+P2的分析子帶組成),也不一定是此情況。實際上,索引偏移(Pl,P2)對于各個和每個輸出子帶可以不同。這意味著對于每個子帶n,可以選擇叉積增強音調(diào)參數(shù)的不同值Ω。圖9圖示了 MISO單元800-n中的每一個中包含的非線性處理。積操作901產(chǎn)生如下子帶信號其相位等于兩個復(fù)輸入子帶信號的相位之和,并且其幅度等于兩個輸入子帶采樣的幅度的廣義均值。可選的增益單元902改變相位改變的子帶采樣的幅度。在數(shù)學(xué)方面,輸出y可以寫為至MISO單元800-n的輸入U1 801與U2 802和增益參數(shù)g的函數(shù),如下
權(quán)利要求
1.一種用于從信號的低頻分量生成所述信號的高頻分量的系統(tǒng),包括-分析濾波器組(301),其提供所述信號的低頻分量的多個分析子帶信號; -非線性處理單元(302),其用于通過改變所述多個分析子帶信號中的第一分析子帶信號和第二分析子帶信號的相位并且通過混合所述相位改變的分析子帶信號而生成具有合成頻率的合成子帶信號;以及-合成濾波器組(303),其用于從所述合成子帶信號生成所述信號的高頻分量。
2.如權(quán)利要求1所述的系統(tǒng),其中,所述非線性處理單元(302)包括-第一和第二轉(zhuǎn)置階的多輸入單輸出單元(800-n),其分別從具有第一分析頻率和第二分析頻率的所述第一分析子帶信號(801)和所述第二分析子帶信號(80 生成所述合成子帶信號(803),其中,-通過所述第一轉(zhuǎn)置階對所述第一分析子帶信號(801)進行相位改變; -通過所述第二轉(zhuǎn)置階對所述第二分析子帶信號(80 進行相位改變;以及 -所述合成頻率與乘以所述第一轉(zhuǎn)置階的所述第一分析頻率加上乘以所述第二轉(zhuǎn)置階的所述第二分析頻率對應(yīng)。
3.如權(quán)利要求2所述的系統(tǒng),其中,-所述相位改變是與轉(zhuǎn)置階的相位相乘; -所述第一分析頻率是ω ; -所述第二分析頻率是(ω + Ω); -所述第一轉(zhuǎn)置階是(T-r); -所述第二轉(zhuǎn)置階是r; -T > 1 ;以及 -1 ^ r < T ;使得所述合成頻率是(T-r) · ω+r· (ω + Ω)。
4.如權(quán)利要求1所述的系統(tǒng),還包括-增益單元(902),其用于將所述合成子帶信號(80 乘以增益參數(shù)。
5.如權(quán)利要求2所述的系統(tǒng),還包括-多個多輸入單輸出單元(800-n)和/或多個非線性處理單元,其生成具有所述合成頻率的多個部分合成子帶信號(803);以及-子帶求和單元(702),其用于混合所述多個部分合成子帶信號。
6.如權(quán)利要求2所述的系統(tǒng),其中,所述非線性處理單元(302)還包括-直接處理單元G01),其用于從所述多個分析子帶信號中的第三分析子帶信號生成另一合成子帶信號;以及-子帶求和單元,其用于混合具有所述合成頻率的合成子帶信號。
7.如權(quán)利要求2所述的系統(tǒng),其中,-如果所述第一分析子帶信號(801)和所述第二分析子帶信號(802)的幅度的最小值小于所述信號的幅度的預(yù)定義分數(shù),則所述子帶求和單元忽略在所述多輸入單輸出單元 (800-n)中生成的所述合成子帶信號。
8.如權(quán)利要求6所述的系統(tǒng),其中,所述直接處理單元(401)包括-第三轉(zhuǎn)置階T’的單輸入單輸出單元GOl-n),其從呈現(xiàn)第三分析頻率的所述第三分析子帶信號生成所述合成子帶信號,其中,-通過所述第三轉(zhuǎn)置階T'對所述第三分析子帶信號進行相位改變; -T'大于1;以及-所述合成頻率與乘以所述第三轉(zhuǎn)置階的所述第三分析頻率對應(yīng)。
9.如權(quán)利要求1所述的系統(tǒng),其中, -所述信號包括基頻;并且-所述分析濾波器組(301)呈現(xiàn)與所述信號的基頻相關(guān)聯(lián)的頻率間隔。
10.如權(quán)利要求3所述的系統(tǒng),其中,-所述分析濾波器組(301)具有N個分析子帶,所述N個分析子帶具有基本恒定子帶間隔Δ ω ;-分析子帶與分析子帶索引η相關(guān)聯(lián),其中,η e {1,...,N}; -所述合成濾波器組(30 具有合成子帶; -所述合成子帶與合成子帶索引η相關(guān)聯(lián);以及-具有索引η的所述合成子帶和所述分析子帶均包括通過因子T而彼此相關(guān)的頻率范圍。
11.如權(quán)利要求10所述的系統(tǒng),其中,-所述合成子帶信號(80 與具有索引η的所述合成子帶相關(guān)聯(lián); -所述第一分析子帶信號(801)與具有索引I1-P1的分析子帶相關(guān)聯(lián); -所述第二分析子帶信號(802)與具有索引η+ρ2的分析子帶相關(guān)聯(lián);以及 -所述系統(tǒng)還包括用于選擇P1和P2的索引選擇單元。
12.如權(quán)利要求11所述的系統(tǒng),其中,-所述索引選擇單元能夠操作以從存儲在索引存儲單元中的對(Pl、P2)的有限列表中選擇所述索引偏移P1和ρ2。
13.如權(quán)利要求12所述的系統(tǒng),其中,-所述索引選擇單元能夠操作以選擇對(Pl、P2),使得包括所述第一分析子帶信號的幅度和所述第二分析子帶信號的幅度的集合的最小值被最大化。
14.如權(quán)利要求11所述的系統(tǒng),其中,所述索引選擇單元能夠操作以確定對(Ρ1、Ρ2)的有限列表,使得-所述索引偏移P1 = Pl; -所述索引偏移P2 = (T-r) · 1 ;以及 -1是正整數(shù)。
15.如權(quán)利要求14所述的系統(tǒng),其中,-所述索引選擇單元能夠操作以選擇參數(shù)1和r,使得包括所述第一分析子帶信號的幅度和所述第二分析子帶信號的幅度的所述集合的最小值被最大化。
16.如權(quán)利要求11所述的系統(tǒng),其中,所述索引選擇單元能夠操作以基于所述信號的特性選擇所述索引偏移P1和p2。
17.如權(quán)利要求16所述的系統(tǒng),其中, -所述信號包括基頻Ω ;-所述索引選擇單元能夠操作以選擇所述索引偏移P1和ρ2,使得-所述索引偏移的和Pl+P2近似于分數(shù)Ω/Δ ω ;以及 -它們的分數(shù)?乂仏是!“/汀-!·)的倍數(shù)。
18.如權(quán)利要求16所述的系統(tǒng),其中, -所述信號包括基頻Ω ;-所述索引選擇單元能夠操作以選擇所述索引偏移P1和ρ2,使得 -所述索引偏移的和Pl+P2近似于分數(shù)Ω/Δ ω ;以及 -所述分數(shù)?1/1)2等于r/(T_r)。
19.如權(quán)利要求1所述的系統(tǒng),還包括-分析窗(2001),其在預(yù)定義時間k周圍隔離預(yù)定義時間間隔的低頻分量;以及 -合成窗(2201),其在預(yù)定義時間k周圍隔離預(yù)定義時間間隔的高頻分量。
20.如權(quán)利要求19所述的系統(tǒng),其中,-所述合成窗O201)是所述分析窗O001)的時間定標版本。
21.一種用于對信號進行解碼的系統(tǒng),包括-根據(jù)權(quán)利要求1的轉(zhuǎn)置單元(102),其用于從信號的低頻分量生成所述信號的高頻分量。
22.如權(quán)利要求21所述的系統(tǒng),其中,所述信號是語音和/或音頻信號。
23.如權(quán)利要求21所述的系統(tǒng),還包括-核心解碼器(101),其用于對所述信號的低頻分量進行解碼。
24.如權(quán)利要求21所述的系統(tǒng),還包括-上采樣器(104),其用于執(zhí)行所述低頻分量的上采樣以得到上采樣的低頻分量; -包絡(luò)調(diào)整器(103),其用于對所述高頻分量整形;以及-分量求和單元,其用于把所述解碼的信號確定為所述上采樣的低頻分量和所述調(diào)整的高頻分量之和。
25.如權(quán)利要求21所述的系統(tǒng),還包括-子帶選擇接收單元,其用于接收允許所述第一分析子帶信號(801)和所述第二分析子帶信號(802)的選擇的信息,從所述第一分析子帶信號(801)和所述第二分析子帶信號 (802)生成所述合成子帶信號(803)。
26.如權(quán)利要求25所述的系統(tǒng),其中,-所述信息與所述信號的基頻Ω相關(guān)聯(lián)。
27.如權(quán)利要求25所述的系統(tǒng),其中,-所述信息包括第一分析子帶信號(801)和第二分析子帶信號(802)的對的列表。
28.如權(quán)利要求M所述的系統(tǒng),還包括-包絡(luò)接收單元,其用于接收與所述信號的高頻分量的包絡(luò)有關(guān)的信息。
29.如權(quán)利要求23所述的系統(tǒng),還包括-輸入單元,其用于接收包括所述低頻分量的信號;以及-輸出單元,其用于提供包括所述低頻分量和所述生成的高頻分量的解碼的信號。
30.一種編碼的信號,包括-與所述解碼的信號的低頻分量有關(guān)的信息,其中,所述低頻分量包括多個分析子帶信-與選擇所述多個分析子帶信號中的所述兩個分析子帶信號有關(guān)的信息,用于通過轉(zhuǎn)置所選擇的兩個分析子帶信號來生成所述解碼的信號的高頻分量。
31.一種用于對信號進行編碼的系統(tǒng),包括-分離單元,其用于將所述信號分離成低頻分量和高頻分量; -核心編碼器,其用于對所述低頻分量進行編碼; -頻率確定單元,其用于確定所述信號的基頻Ω ;以及-參數(shù)編碼器,其用于對所述基頻Ω進行編碼,其中,所述基頻Ω被用于再生所述信號的高頻分量。
32.如權(quán)利要求31所述的系統(tǒng),還包括-包絡(luò)確定單元,其用于確定所述高頻分量的譜包絡(luò);以及 -包絡(luò)編碼器,其用于對所述譜包絡(luò)進行編碼。
33.一種用于對信號進行編碼的系統(tǒng),包括-分離單元,其用于將所述信號分離成低頻分量和高頻分量; -核心編碼器,其用于對所述低頻分量進行編碼; -分析濾波器組,其提供所述信號的低頻分量的多個分析子帶信號; -子帶對確定單元,其用于確定用于生成所述信號的高頻分量的第一子帶信號和第二子帶信號;以及-索引編碼器,其用于對表示所述第一子帶信號和所述第二子帶信號的索引號進行編碼。
34.一種用于從信號的低頻分量執(zhí)行高頻分量的高頻重建的方法,包括-提供(301)來自第一頻帶的低頻分量的第一子帶信號和來自第二頻帶的低頻分量的第二子帶信號;-分別通過第一轉(zhuǎn)置因子和第二轉(zhuǎn)置因子轉(zhuǎn)置(30 所述第一子帶信號和所述第二子帶信號;-混合(30 所述轉(zhuǎn)置的第一子帶信號和第二子帶信號,以從高頻帶得到高頻分量。
35.如權(quán)利要求34所述的方法,其中,-所述高頻帶與乘以所述第一轉(zhuǎn)置因子的所述第一頻帶和乘以所述第二轉(zhuǎn)置因子的所述第二頻帶之和對應(yīng)。
36.如權(quán)利要求34所述的方法,其中,所述轉(zhuǎn)置步驟包括-將所述第一子帶信號的所述第一頻帶乘以所述第一轉(zhuǎn)置因子;以及 -將所述第二子帶信號的所述第二頻帶乘以所述第二轉(zhuǎn)置因子。
37.如權(quán)利要求34所述的方法,其中,所述提供步驟包括-通過分析濾波器組(301)對所述低頻分量進行濾波,以生成第一子帶信號和第二子帶信號。
38.如權(quán)利要求34所述的方法,其中,所述混合步驟包括-將所述第一轉(zhuǎn)置的子帶信號和所述第二轉(zhuǎn)置的子帶信號相乘,以得到高子帶信號;以及-將所述高子帶信號輸入到合成濾波器組,以生成所述高頻分量。
39.一種用于對編碼的信號進行解碼的方法,其中,所述編碼的信號-是從原始信號得到的;以及-僅表示所述原始信號的低于交叉頻率(100 的頻率子帶的部分; 其中,所述方法包括-提供(301)所述編碼的信號的第一頻率子帶和第二頻率子帶; -分別通過第一轉(zhuǎn)置因子和第二轉(zhuǎn)置因子轉(zhuǎn)置(30 所述頻率子帶;以及 -從所述第一轉(zhuǎn)置的頻率子帶和所述第二轉(zhuǎn)置的頻率子帶生成(303)高頻率子帶,其中,所述高頻率子帶高于所述交叉頻帶。
40.如權(quán)利要求39所述的方法,其中,-所述高頻率子帶與乘以所述第一轉(zhuǎn)置因子的所述第一頻率子帶和乘以所述第二轉(zhuǎn)置因子的所述第二頻率子帶之和對應(yīng)。
41.如權(quán)利要求39所述的方法,其中,所述轉(zhuǎn)置步驟包括-執(zhí)行所述第一頻率子帶中的所述信號與所述第一轉(zhuǎn)置因子的相位相乘;以及 -執(zhí)行所述第二頻率子帶中的所述信號與所述第二轉(zhuǎn)置因子的相位相乘。
42.一種用于對信號進行編碼的方法,包括 -對所述信號濾波以隔離所述信號的低頻率; -對所述信號的低頻分量進行編碼;-提供所述信號的低頻分量的多個分析子帶信號;-確定用于生成所述信號的高頻分量的第一子帶信號和第二子帶信號;以及 -對表示所述第一子帶信號和所述第二子帶信號的信息進行編碼。
43.一種用于對包括音頻信號的接收的多媒體信號進行解碼的機頂盒,所述機頂盒包括-根據(jù)權(quán)利要求1的轉(zhuǎn)置單元(102),其用于從所述音頻信號的低頻分量生成所述信號的高頻分量。
44.一種適用于在處理器上執(zhí)行并且用于當在計算設(shè)備上執(zhí)行時執(zhí)行權(quán)利要求34所述的方法步驟的軟件程序。
45.一種存儲介質(zhì),包括適用于在處理器上執(zhí)行并且用于當在計算設(shè)備上執(zhí)行時執(zhí)行權(quán)利要求34所述的方法步驟的軟件程序。
46.一種包括用于執(zhí)行當在計算機上執(zhí)行時執(zhí)行權(quán)利要求34所述的方法的可執(zhí)行指令的計算機程序產(chǎn)品。
47.如權(quán)利要求23所述的系統(tǒng),其中,所述核心解碼器(101)基于以下的編碼方案中的一個杜比E、杜比數(shù)字、AAC。
全文摘要
本發(fā)明涉及使用用于高頻重建(HFR)的諧波轉(zhuǎn)置方法的音頻編碼系統(tǒng)。描述了一種用于從信號的低頻分量生成信號的高頻分量的系統(tǒng)和方法。該系統(tǒng)包括提供信號的低頻分量的多個分析子帶信號的分析濾波器組。該系統(tǒng)還包括非線性處理單元,其通過改變所述多個分析子帶信號中的第一分析子帶信號和第二分析子帶信號的相位并且通過混合相位改變的分析子帶信號而生成具有合成頻率的合成子帶信號。最后,該系統(tǒng)包括用于從合成子帶信號生成信號的高頻分量的合成濾波器組。
文檔編號G10L21/02GK102282612SQ201080004764
公開日2011年12月14日 申請日期2010年1月15日 優(yōu)先權(quán)日2009年1月16日
發(fā)明者佩爾·赫德林, 拉爾斯·維爾默斯 申請人:杜比國際公司