亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于多聲道音頻重構(gòu)中的信號成形的增強(qiáng)的方法

文檔序號:7642353閱讀:179來源:國知局
專利名稱:用于多聲道音頻重構(gòu)中的信號成形的增強(qiáng)的方法
技術(shù)領(lǐng)域
本發(fā)明涉及多聲道音頻重構(gòu)中的增強(qiáng)的信號成形的概念,尤其是 一種新的包絡(luò)成形方法。
背景技術(shù)
近來,音頻編碼的發(fā)展實現(xiàn)了基于立體聲(或單聲道)信號和對 應(yīng)控制數(shù)據(jù)來重建音頻信號的多聲道表示。由于傳送了附加控制數(shù)據(jù), 以控制基于傳送的單聲道或立體聲聲道來進(jìn)行的環(huán)繞聲道的重建,也稱為上混,因此,這些方法與較早的基于矩陣的解決方案,如Dolby Prologic本質(zhì)上不同。這樣的參數(shù)多聲道音頻解碼器基于M個傳送的 聲道和附加控制數(shù)據(jù)來重構(gòu)N個聲道,其中N>M。使用附加控制數(shù) 據(jù)導(dǎo)致了比傳送全部N個聲道明顯更低的數(shù)據(jù)速率,使得編碼非常有 效,而同時確保了與M聲道設(shè)備和N聲道設(shè)備的兼容性。M聲道可 以是單聲道、立體聲聲道或5.1聲道表示。因此,可以將7.2聲道原 始信號下混為5.1聲道后向兼容信號,空間音頻參數(shù)使得空間音頻解 碼器能夠以較小的附加比特流開銷來重現(xiàn)與原始7.2聲道緊密相似的 版本。這些參數(shù)環(huán)繞編碼方法通常包括基于時間和頻率變化的ILD (互 聲道音級差)與ICC (互聲道相干性)參數(shù)的環(huán)繞信號的參數(shù)化。例 如,這些參數(shù)描述了原始多聲道信號的聲道對之間的功率比和相關(guān)性。 在解碼過程中,通過如傳送的ILD參數(shù)所描述的那樣在所有聲道對之 間分配接收到的下混聲道的能量,來獲得重建的多聲道信號。然而, 如ICC參數(shù)所描述的,雖然不同聲道中的信號很不同,但多聲道信號 可以在所有聲道之間有相等的功率分布,從而提供了非常寬的聲音的 收聽印象,因此,通過將信號與其解相關(guān)版本向混合來獲得正確的寬7將信號通過混響器,如全通濾波器,來獲得信號的解相關(guān)版本, 通常也稱為濕(wet)或散射(diffuse)信號。解相關(guān)的一種簡單形式 是對信號應(yīng)用指定的延遲。 一般地,現(xiàn)有技術(shù)中已知多種不同的混響 器,所使用的混響器的確切實現(xiàn)并不重要。解相關(guān)器的輸出通常具有非常平坦的時間響應(yīng)。因此,單位脈沖 (dirac)輸入信號給出了衰變噪聲突發(fā)。在混合解相關(guān)信號和原始信 號時,對于一些瞬時信號類型,如掌聲信號,對信號執(zhí)行一些后處理 是很重要的,以避免感知到較大的感知室大小可能導(dǎo)致的附加引入的 人工效應(yīng)和預(yù)回聲類型的人工效應(yīng)。一般地,本發(fā)明涉及一種系統(tǒng),該系統(tǒng)將多聲道音頻表示為音頻 下混數(shù)據(jù)(例如一或兩個聲道)和相關(guān)參數(shù)多聲道數(shù)據(jù)的組合。在這 樣的方案(例如雙耳線索編碼(binaural cue coding))中,傳送了音頻 下混數(shù)據(jù)流,其中可以注意到,下混的最簡單形式是簡單地加入多聲 道信號的不同信號。這樣的信號(和信號)伴隨有參數(shù)多聲道數(shù)據(jù)流 (輔助信息)。該輔助信息包括,例如以上討論的用于描述多相對信號 的原始聲道的空間相互關(guān)系的一個或更多參數(shù)類型。在某種意義上, 對例如具有和信號以及輔助信息的下混數(shù)據(jù)的發(fā)送/接收端而言,參數(shù) 多聲道方案用作預(yù)處理器/后處理器。應(yīng)注意,可以附加地使用任何音 頻或話音編碼器來對下混數(shù)據(jù)的和信號進(jìn)行編碼。隨著在低帶寬載波上傳送多聲道信號變得越來越普遍,近來已經(jīng) 很好地開發(fā)出了這些系統(tǒng),這些系統(tǒng)也以"空間音頻編碼"、"MPEG 環(huán)繞"而為人所知。在這些技術(shù)的范圍內(nèi),以下出版物是已知的[1] C. Faller and F. Baumgarte, "Efficient representation of spatial audio using perceptual parametrization," in Proc. IEEE WASPAA, Mohonk, NY, Oct. 2001.[2] F. Baumgarte and C. Faller, "Estimation of auditory spatial cues for binaural cue coding," in Proc. ICASSP 2002, Orlando, FL, May 2002.[3] C. Faller and F. Baumgarte, "Binaural cue coding: a novel andefficient representation of spatial audio," in Proc. ICASSP 2002, Orlando, FL, May 2002.[4] F. Baumgarte and C. Faller, "Why binaural cue coding is better than intensity stereo coding," in Proc. AES 112th Conv., Munich, Germany, May 2002.[5] C. Faller and F. Baumgarte, "Binaural cue coding applied to stereo and multi-channel audio compression," in Proc. AES 112th Conv., Munich, Germany, May 2002.[6] F. Baumgarte and C. Faller, "Design and evaluation of binaural cue coding," in AES 113th Conv., Los Angeles, CA, Oct. 2002.[7] C. Faller and F. Baumgarte, "Binaural cue coding applied to audio compression with flexible rendering," in Proc. AES 113th Conv., Los Angeles, CA, Oct. 2002.[8] J. Breebaart, J. Herre, C. Faller, J. R6d6n, F. Myburg, S. Disch, H. Purnhagen, G. Hoto, M. Neusinger, K. Kj6rling, W, Oomen: "MPEG Spatial Audio Coding / MPEG Surround: Overview and Current Status", 119th AES Convention, New York 2005, Preprint 6599[9] J. Herre, H. Purnhagen, J. Breebaart, C. Faller, S. Disch, K. Kj6rling, E. Schuijers, J. Hilpert, F. Myburg, "The Reference Model Architecture for MPEG Spatial Audio Coding", 118th AES Convention, Barcelona 2005, Preprint 6477[10] J. Herre, C. Faller, S. Disch, C. Ertel, J. Hilpert, A. Hoelzer, K. Linzmeier, C. Spenger, P. Kroon: "Spatial Audio Coding: Next-Generation Efficient and Compatible Coding of Multi-Channel Audio", 117th AES Convention, San Francisco 2004, Preprint 6186[11] J. Herre, C. Faller, C. Ertel, J. Hilpert, A Hoelzer, C. Spenger: "MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio", 116th AES Convention, Berlin 2004, Preprint 6049.關(guān)注經(jīng)由一個傳送的單聲道信號來傳送兩個聲道的相關(guān)技術(shù)被稱 為"參數(shù)立體聲",例如,在以下出版物中更多地描述了該技術(shù)9[12] J. Breebaart, S. van de Par, A. Kohlmusch, E. Schuijers, "High-Quality Parametric Spatial Audio Coding at Low Bitrates", AES 116th Convention, Berlin, Preprint 6072, May 2004[13] E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, "Low Complexity Parametric Stereo Coding", AES 116th Convention, Berlin, Preprint 6073, May 2004.如上所述,在空間音頻解碼器中,從直射信號部分與散射信號部 分來計算多聲道上混,該散射信號部分是通過解相關(guān)從直射部分中獲 得的。因此, 一般地,散射部分具有與直射部分不同的時間包絡(luò)。在 這里的上下文中,術(shù)語"時間包絡(luò)"描述了信號的能量或幅度隨時間的變化。對于具有較寬立體聲圖像和同時具有瞬時包絡(luò)結(jié)構(gòu)的輸入信 號,不同的時間包絡(luò)導(dǎo)致了上混信號中的人工效應(yīng)(預(yù)回聲和后回聲、時間"拖尾(smearing)")。一般地,瞬時信號是在短時間段內(nèi)劇烈變 化的信號。針對這類信號的最重要示例可能是類似掌聲的信號,在直播錄音 中經(jīng)常出現(xiàn)該信號。為了避免將具有不合適的時間包絡(luò)的散射/解相關(guān)聲音引入上混 信號而導(dǎo)致的人工效應(yīng),已經(jīng)提出了多種技術(shù)美國申請11/006,492 ("Diffiise Sound Shaping for BCC Schemes and The Like")說明,可以通過對散射信號的時間包絡(luò)進(jìn)行成形以匹 配直射信號的時間包絡(luò),來提高關(guān)鍵瞬時信號的感知質(zhì)量。己經(jīng)由不同的工具,如"時間包絡(luò)成形"(TES)和"時間處理" (TP),將這種方法引入MPEG環(huán)繞技術(shù)。由于散射信號的目標(biāo)時間 包絡(luò)是從傳送的下混信號的包絡(luò)得到的,因此,這種方法不需要傳送 附加的輔助信息。然而,由此,對所有輸出聲道,散射聲音的時間精 細(xì)結(jié)構(gòu)都相同。由于從傳送的下混信號中直接獲得的直射信號部分也 具有類似的時間包絡(luò),因此,這種方法可以在"明快性(crisp-ness)" 方面提供類似掌聲的信號的感知質(zhì)量。然而,由于對所有聲道,直射 信號和散射信號都具有類似的時間包絡(luò),因此,這樣的技術(shù)可以增強(qiáng) 類似掌聲的信號的主觀質(zhì)量,但不能改善信號中單次掌聲事件的空間空間分布,因為僅當(dāng)在瞬時信號出現(xiàn)時一個重構(gòu)聲道遠(yuǎn)比其他聲道更 為強(qiáng)烈時這才是可能的,而對于共享基本上相同的時間包絡(luò)的信號是 不可能的。美國申請11/006,482 ("individual Channel Shaping for BCC Schemes and The Like")描述了克服這個問題的一種選擇性方法。該 方法采用編碼器傳送的精細(xì)顆粒時間寬帶輔助信息來執(zhí)行直射信號與 散射信號的精細(xì)時間成形。顯然,該方法實現(xiàn)了時間精細(xì)接收,該結(jié) 構(gòu)對每個輸出聲道是單獨的,因此,能夠也容納這樣的信號,即對于 該信號,瞬時時間僅在輸出聲道的子集中出現(xiàn)。US 60/726,389 ("Methods for Improved Temporal and Spatial Shaping of Multi-Channel Audio Signals")描述了該方法的進(jìn)一步的變型。所討論 的用于增強(qiáng)瞬時編碼信號的感知質(zhì)量的兩種方法均包括對散射信號的 包絡(luò)的時間成形,以匹配對應(yīng)的直射信號的時間包絡(luò)。雖然之前描述的現(xiàn)有技術(shù)的兩種方法均可以在明快性方面增強(qiáng)類 似掌聲的信號的主觀質(zhì)量,但是,只有后一種方法也可以改善重構(gòu)信 號的時間重分布。由于對干(dry)的與散射的聲音的組合進(jìn)行的時間 成形導(dǎo)致了特性失真(或在執(zhí)行松時間成形時感知到各鼓掌拍擊不 "緊",或在對信號應(yīng)用具有非常高時間分辨率的成形時引入失真), 因此,合成的掌聲信號的主觀質(zhì)量仍不令人滿意。當(dāng)散射信號是直射 信號的簡單地延遲拷貝時,這變得很明顯。接著,與直射信號混合的 散射信號可能具有與直射信號不同的頻譜組成。因此,即使縮放包絡(luò) 來匹配直射信號的包絡(luò),在重構(gòu)信號中將出現(xiàn)并非直接源自原始信號 的不同頻譜成分。當(dāng)縮放散射信號來匹配直射信號的包絡(luò)時,在重構(gòu) 過程中突出(使其更響)散射信號部分時,所引入的失真可能變得甚 至更糟。發(fā)明內(nèi)容本發(fā)明的目的是提供一種多聲道重構(gòu)中增強(qiáng)的信號成形的概念。 該目的是由根據(jù)權(quán)利要求1或29所述的裝置,根據(jù)權(quán)利要求28 所述的方法以及根據(jù)權(quán)利要求30所述的計算機(jī)程序來實現(xiàn)的。本發(fā)明基于以下發(fā)現(xiàn),即對于由多聲道重構(gòu)器使用至少一個下混 聲道和使用參數(shù)表示來重構(gòu)的輸出信號,在使用基于該下混聲道來產(chǎn) 生直射信號分量和散射信號分量的產(chǎn)生器時,能夠以高質(zhì)量有效地重 構(gòu)該輸出信號,通過下混多個原始聲道來獲得所述至少一個下混聲道, 所述參數(shù)表示包括關(guān)于原始聲道的時間(精細(xì))結(jié)構(gòu)的附加信息。如 果僅修正直射信號分量,使得重構(gòu)的輸出信號的時間精細(xì)結(jié)構(gòu)適合所 需的時間精細(xì)結(jié)構(gòu),則可以實質(zhì)上增強(qiáng)質(zhì)量,所傳送的關(guān)于時間精細(xì) 結(jié)構(gòu)的附加信息指示了所述所需的時間精細(xì)結(jié)構(gòu)。換言之,對從下混信號中直接獲得的直射信號部分進(jìn)行縮放,幾 乎不會在出現(xiàn)瞬時信號的時刻引入附加人工效應(yīng)。在現(xiàn)有技術(shù)中,當(dāng) 對濕信號進(jìn)行縮放來匹配所需包絡(luò)時,很可能出現(xiàn)這樣的情況,即與 直射信號混合的突出的散射信號掩蔽了重構(gòu)聲道中的原始瞬時信號, 以下將更多地描述這一點。本發(fā)明通過僅對直射信號分量進(jìn)行縮放,克服了這個問題,從而 以在輔助信息內(nèi)傳送附加參數(shù)來描述時間包絡(luò)為代價,不可能產(chǎn)生附 加人工效應(yīng)。根據(jù)本發(fā)明的一個實施例,使用具有白化頻譜的直射和散射信號 的表示來獲得包絡(luò)縮放參數(shù),即所述表示中,信號的不同頻譜部分具 有幾乎相同的能量。使用白化頻譜的優(yōu)點有兩方面。 一方面,使用白 化頻譜作為計算用于縮放直射信號的縮放因子的基礎(chǔ),允許每時隙僅 傳送一個參數(shù),所述參數(shù)包括時間結(jié)構(gòu)信息。由于在多聲道音頻編碼 中,通常在許多頻帶內(nèi)處理信號,因此,這一特征有助于減少附加需 要的輔助信息的數(shù)量,因此增加了附加參數(shù)傳送的比特率。典型地, 每個時幀和參數(shù)頻帶僅傳送一次其他參數(shù),如ICLD和ICC。由于參數(shù)頻帶的數(shù)量可能高于20,主要優(yōu)點是每個聲道僅需傳送單個參數(shù)。一般地,在多聲道編碼中,在幀結(jié)構(gòu)中,即在具有若干采樣值的實體中處理信號,例如每幀1024個采樣值。此外,如上所述,在處理之前, 將信號分為若干頻譜部分,使得最終,每幀和信號的每頻譜部分典型 地傳送一個ICC和ICLD參數(shù)。僅使用一個參數(shù)的第二個優(yōu)點是從物理上推動的,由于所討論的瞬時信號天然地具有較寬的頻譜。因此,為了正確解決對單個聲道內(nèi) 的瞬時信號的能量,最合適的是使用白化頻譜來計算能量縮放因子。在本發(fā)明的另一個實施例中,在出現(xiàn)附加殘留信號時,僅對高于 特定頻譜限制的信號頻譜部分應(yīng)用本發(fā)明的修正直射信號分量的概 念。這是因為殘留信號與下混信號一起允許了原始聲道的高質(zhì)量重現(xiàn)。概況而言,設(shè)計本發(fā)明的概念,相對于現(xiàn)有技術(shù)的方法,提供了 增強(qiáng)的時間和空間質(zhì)量,避免了與這些現(xiàn)有技術(shù)相關(guān)的問題。因此, 傳送輔助信息來描述各聲道的精細(xì)時間包絡(luò)結(jié)構(gòu),從而允許在解碼器 端對上混聲道信號進(jìn)行精細(xì)時間/空間成形。本文中描述的本發(fā)明方法 基于以下發(fā)現(xiàn)/考慮*類似掌聲的信號可以被視為由單一、獨特的近處拍掌和源自非常密集的遠(yuǎn)處拍掌的類似噪聲的環(huán)境信號(ambience)組成。*在空間音頻解碼器中,在時間包絡(luò)方面,近處拍掌的最佳近似 是直射信號。因此,本發(fā)明方法僅處理直射信號。 由于散射信號主要表示了信號的環(huán)境部分,因此對精細(xì)時間分 辨率的任何處理可能引入失真和調(diào)制人工效應(yīng)(即使這樣的技 術(shù)可能實現(xiàn)掌聲明快性的一定的主觀增強(qiáng))。出于這些考慮, 本發(fā)明的處理不涉及散射信號(不經(jīng)過精細(xì)時間成形)。*然而,散射信號對上混信號的能量平衡有貢獻(xiàn)。本發(fā)明方法通 過由傳送的信息計算要單獨對直射信號部分應(yīng)用的修正寬帶 縮放因子來解決這一點。選擇該修正因子,使得在特定界限內(nèi), 給定的時間間隔中的總能量相同,如同將原始因子應(yīng)用到該間 隔中的信號的直射和散射部分一樣。*使用本發(fā)明方法,如果將空間線索的頻譜分辨率選擇為較低一 —例如"全帶寬"__以確保保持信號中包含的瞬時信號的頻 譜完整性,則能夠獲得最佳的主觀音頻質(zhì)量。在這種情況下, 由于安全地用頻譜分辨率交換了時間分辨率,因此所提出的方 法不必需增加平均空間輔助信息的比特率。通過僅隨時間放大或衰減(damp)("成形")信號的"干"的部 分,實現(xiàn)了主觀質(zhì)量的提高,從而置處的直射信號部分來增強(qiáng)瞬時信號質(zhì) 量,同時避免源自具有不合適的時間包絡(luò)的散射信號的附加失 真*通過在瞬時事件的空間起源處相對于散射部分來突出直射部 分,并在遠(yuǎn)處全景位置處相對于散射部分來衰減該直射部分, 改善了空間定位。


圖1示出了多聲道編碼器和對應(yīng)解碼器的框;圖lb示出了使用解相關(guān)信號的信號重構(gòu)的示意略圖;圖2示出了本發(fā)明的多聲道重構(gòu)器的示例;圖3示出了本發(fā)明的多聲道重構(gòu)器的另一個示例;圖4示出了多聲道解碼方案中用于標(biāo)識不同參數(shù)頻帶的參數(shù)頻帶表示的示例;圖5示出了本發(fā)明的多聲道解碼器的示例;以及 圖6示出了一個框圖,詳細(xì)示出了本發(fā)明的重構(gòu)輸出聲道的方法的示例。
具體實施方式
圖l根據(jù)現(xiàn)有技術(shù)的多聲道音頻數(shù)據(jù)的編碼的示例,以更清楚地 說明本發(fā)明的概念所解決的問題。一般地,在編碼器端,將原始多聲道信號10輸入多聲道編碼器12, 多聲道編碼器12獲得輔助信息14,輔助信息14指示了該原始多聲道信 號的各聲道相對于彼此的空間分布。除了產(chǎn)生輔助信息14外,多聲道 編碼器12產(chǎn)生一個或更多和信號16,和信號16是從該原始多聲道信號 下混得到的。廣泛使用的著名配置是所稱的5-l-5和5-2-5配置。在5-l-5 配置中,編碼器從5個輸入聲道產(chǎn)生一個單聲道和信號16,因此,對應(yīng) 的解碼器18必須產(chǎn)生重構(gòu)的多聲道信號20的5個重構(gòu)聲道。在5-2-5配 置中,編碼器從5個輸入聲道產(chǎn)生兩個下混聲道,該下混聲道中的第一 聲道典型地持有左側(cè)或右側(cè)的信息,而該下混聲道中的第二聲道持有另一側(cè)的信息。例如在圖l中所示的,描述原始聲道的空間分布的樣本參數(shù)是之前介紹的參數(shù)ICLD和ICC??梢宰⒁獾?,在獲得輔助信息14的解析中,典型地,在表示原始聲道的指定頻率間隔的子帶域中處理多聲道信號io的原始聲道的樣本。單個頻率間隔由K表示。在一些應(yīng)用中,在處理之前,可以由混 合濾波器組對輸入聲道進(jìn)行濾波,即可以進(jìn)一步對參數(shù)頻帶K進(jìn)行子 分割,每個子分割由k表示。此外,在每個單個參數(shù)頻帶內(nèi),以逐幀的方式來對描述原始聲道 的樣本值進(jìn)行處理,即若干連續(xù)的樣本形成有限持續(xù)時間的幀。典型 地,上述BCC參數(shù)描述了完整的幀。以某種方式與本發(fā)明的相關(guān)的并在現(xiàn)有技術(shù)中已知的參數(shù)是 ICLD參數(shù),該參數(shù)相對于原始多聲道或信號的其他聲道的對應(yīng)幀來描 述聲道的單個幀內(nèi)包含的能量。通常,在解相關(guān)信號的幫助下實現(xiàn)附加聲道的產(chǎn)生,產(chǎn)生該附加 聲道以僅從一個傳送的和信號重構(gòu)多聲道信號,該解相關(guān)信號是使用 解相關(guān)器或混響器從該和信號中獲得的。對于一種典型的應(yīng)用,離散 釆樣頻率可以是44.100kHz,因此,單個樣本表示原始聲道的約0.02ms的有限長度的間隔。可以注意到,使用濾波器組,將信號分為許多信 號部分,每個信號部分表示原始信號的有限頻率間隔。為了補(bǔ)償描述 聲道的參數(shù)的可能的增加,通常降低時間分辨率,使得濾波器組域內(nèi) 單個樣本所描述的有限長度的時間部分可以增加至0.5ms。典型的幀長 度可以在10至15ms之間變化。在不限制本發(fā)明的范圍的情況下,可以利用不同的濾波器結(jié)構(gòu)和 /或延遲或其組合來獲得解相關(guān)信號??梢赃M(jìn)一步注意到,不必需使用 整個頻譜來獲得解相關(guān)信號。例如,可以僅使用高于和信號(下混信 號)的頻譜下界(指定值K)的頻譜部分,使用延遲和/或濾波器來獲 得解相關(guān)信號。因此, 一般地,解相關(guān)信號描述了從下混信號(下混 聲道)獲得的信號,使得例如,在使用該解相關(guān)信號和下混聲道來獲 得相關(guān)系數(shù)時,該相關(guān)系數(shù)明顯偏離l (unity) 0.2。圖lb給出了多聲道音頻編碼過程中的下混和重構(gòu)過程的極其簡 化的示例,以解釋本發(fā)明的在重構(gòu)多聲道信號的聲道過程中僅縮放直 射信號分量的概念的重大益處。對于以下的描述,假設(shè)了一些簡化。 第一個簡化是,左和右聲道的下混是該聲道內(nèi)的幅度的簡單相加。第 二個強(qiáng)烈的簡化是,假設(shè)相關(guān)性是整個信號的簡單延遲。在這些假設(shè)下,應(yīng)對左聲道21a和右聲道21b的幀進(jìn)行編碼。如在 所示的窗的x軸所示,在多聲道編碼中,典型地,對以固定采樣頻率來 采樣的樣本值執(zhí)行處理。為了便于解釋,在以下的簡要概述中忽略這一點。如上所述,在編碼器端,將左和右聲道組合(下混)為要向解碼器傳送的下混聲道22。在解碼器端,從傳送的下混信號中獲得解相關(guān) 信號23,在本示例中,下混聲道22是左聲道21a和右聲道21b之和。如 已經(jīng)解釋過的,接著執(zhí)行從信號幀來重構(gòu)左聲道,從下混聲道22和解 相關(guān)信號23來獲得該信號幀。可以注意到,如ICLD參數(shù)所示,在組合之前,每個單個幀經(jīng)過全 局縮放,該ICLD參數(shù)將單個聲道的各幀內(nèi)的能量與多聲道信號的其他 聲道的對應(yīng)幀的能量相關(guān)。如在本實施例中所假設(shè)的,在左聲道21a和右聲道21b內(nèi)包含相等 的能量,在組合之前,使用約0.5的因子來縮放傳送的下混聲道22和解 相關(guān)信號23。這就是說,當(dāng)上混與下混同樣簡單時,即對兩個信號求 和時,原始左聲道21a的重構(gòu)是經(jīng)縮放的下混聲道24a與經(jīng)縮放的解相 關(guān)信號24b之和。由于對傳送信號求和以及由ICLD參數(shù)引起的縮放,瞬時信號的信 號對背景的比值可能減小約為2的因子。此外,當(dāng)將兩個信號簡單相加 時,在經(jīng)縮放的解相關(guān)信號24b中,在延遲的瞬時結(jié)構(gòu)的位置可能引入 附加的回聲類型的人工效應(yīng)。如圖lb所示,現(xiàn)有技術(shù)試圖通過對經(jīng)縮放的解相關(guān)信號24b進(jìn)行 縮放以使其匹配經(jīng)縮放的傳送聲道24a的包絡(luò)來克服該回聲問題,如幀 24b中的虛線所示。由于該縮放,左聲道21a中的原始瞬時信號位置的 幅度可能增大。然而,幀24b中縮放位置處的解相關(guān)信號的頻譜組成與原始瞬時信號的頻譜組成不同。因此,即使可以很好地重現(xiàn)信號的總 體強(qiáng)度,也會向信號引入可聽見的人工效應(yīng)。本發(fā)明的重大優(yōu)點在于,本發(fā)明僅對重構(gòu)信號的直射信號分量進(jìn) 行縮放。由于該聲道確實具有與原始瞬時信號相對應(yīng)的信號分量,該 原始瞬時信號具有正確的頻譜組成和正確的定時,因此,僅對下混聲 道進(jìn)行縮放將產(chǎn)生以高精度重構(gòu)原始瞬時事件的重構(gòu)信號。這是由于, 只有該縮放所突出的信號部分才具有與原始瞬時信號相同的頻譜組 成。圖2示出了本發(fā)明的多聲道重構(gòu)器的示例的框圖,以詳細(xì)描述本發(fā)明概念的原理。圖2示出了多聲道重構(gòu)器30,具有產(chǎn)生器32、直射信號修正器和 組合器36。產(chǎn)生器32接收從多個原始聲道下混而來的下混聲道38,以 及包括原始聲道的時間結(jié)構(gòu)信息的參數(shù)表示40。該產(chǎn)生器基于該下混聲道來產(chǎn)生直射信號分量42和散射信號分 量44。直射信號修正器34接收直射信號分量42以及散射信號分量44,此 外還接收具有原始聲道的時間結(jié)構(gòu)信息的參數(shù)表示40。根據(jù)本發(fā)明, 直射信號修正器34使用該參數(shù)表示,僅修正直射信號分量42來獲得修 正的直射信號分量46。修正的直射信號分量46和直射信號修正器34未改變的散射信號 分量44輸入組合器36,組合器36對修正的直射信號分量46和散射信號 分量44進(jìn)行組合來獲得重構(gòu)的輸出聲道50。通過僅對從傳送的下混聲道38獲得的直射信號分量42進(jìn)行修正而不進(jìn)行混響(解相關(guān)),可以重構(gòu)重構(gòu)輸出聲道的時間包絡(luò),該時間 包絡(luò)與其下原始聲道的時間包絡(luò)緊密匹配,而不像現(xiàn)有技術(shù)中那樣引入附加人工效應(yīng)和可聽見的失真。如在圖3的描述中將要更詳細(xì)地描述的,本發(fā)明的包絡(luò)成形恢復(fù) 了合成輸出信號的寬帶包絡(luò)。其包括修正上混過程,接著是每個輸出 聲道的直射信號部分的包絡(luò)平坦化和重新成形。為了重新成形,使用 參數(shù)表示的比特流中包含的參數(shù)寬帶包絡(luò)輔助信息。根據(jù)本發(fā)明的一個實施例,該輔助信息包括將傳送的下混信號的包絡(luò)與原始輸出聲道信號的包絡(luò)相關(guān)的比值(eiwRatio)。在解碼器中,從這些比值獲得增益因子,對給定輸出聲道的幀中的每個時隙上的直射信號應(yīng)用該增益 因子。根據(jù)本發(fā)明的概念,不改變每個聲道的散射聲音部分。圖3的框圖中所示的本發(fā)明的優(yōu)選實施例是多聲道重構(gòu)器60,修 改該多聲道重構(gòu)器60來適合MPEG空間解碼器的解碼器信號流。多聲道重構(gòu)器60包括產(chǎn)生器62,如在MPEG編碼中所使用的,產(chǎn) 生器62使用通過對多個原始聲道進(jìn)行下混而獲得的下混聲道68以及具 有多聲道信號的原始聲道的空間特性信息的參數(shù)表示70,來產(chǎn)生直射 信號分量64以及散射信號分量66。多聲道重構(gòu)器60還包括直射信號修 正器68,接收直射信號分量64、散射信號分量66、下混信號69和附加 的包絡(luò)輔助信息72作為輸入。該直射信號修正器在其修正器輸出73提供了修正的直射信號分量,以下將更詳細(xì)描述進(jìn)行修正的方式。組合器74接收修正的直射信號分量和散射信號分量,以獲得重構(gòu) 的輸出聲道76。如圖所示,在現(xiàn)有的多聲道環(huán)境中可以容易地實現(xiàn)本發(fā)明。在這 樣的編碼方案中,可以根據(jù)在參數(shù)比特流中附加地傳送的一些參數(shù)來 開啟或關(guān)閉本發(fā)明概念的總體應(yīng)用。例如,可以引入附加的標(biāo)志 bsTempShapeEnable,當(dāng)將該標(biāo)志設(shè)為l時,指示需要使用本發(fā)明的概 念。此外,可以引入附加的標(biāo)志,具體地指定需要基于逐聲道地應(yīng)用 本發(fā)明的概念。因此,可以使用附加的標(biāo)志,例如成為 bsEnvShapeChannel??梢詫γ總€單個聲道提供該標(biāo)志,將該標(biāo)志設(shè)為 l時,可以指示使用本發(fā)明的概念。此外還可以注意到,為了便于表示,在圖3中僅描述了兩個聲道 的配置。當(dāng)然,本發(fā)明不應(yīng)局限于僅有兩個聲道的配置。此外,可以 使用任何聲道配置來與本發(fā)明的概念相結(jié)合。例如,可以使用5或7輸 入聲道來與本發(fā)明的增強(qiáng)的包絡(luò)成形相結(jié)合。如圖3所示,當(dāng)在MPEG編碼方案中應(yīng)用本發(fā)明的概念,通過設(shè)定bsTempShapeEnable等于l,以信號來指示應(yīng)用本發(fā)明的概念時,產(chǎn)生 器62根據(jù)以下方程,使用混合子帶域中的修正的后混合(post-mixing) 來分離地合成直射和散射信號分量
<formula>formula see original document page 19</formula>
這里以及在以下段落中,向量wna描述了子帶域的第k個子帶的n 個混合子帶參數(shù)的向量。如上述等式所示,在上混中,分離地獲得直 射和散射信號y。直射輸出持有直射信號分量和殘留信號,該殘留信號 在MPEG編碼中可能附加地出現(xiàn)的一種信號。散射輸出僅提供了散射 信號。根據(jù)本發(fā)明的概念,所引導(dǎo)的包絡(luò)成形(本發(fā)明的包絡(luò)成形) 僅對直射信號分量進(jìn)行進(jìn)一步處理。
包絡(luò)成形過程對不同信號采用包絡(luò)提取操作。由于這是在對直射 信號分量應(yīng)用本發(fā)明的修正之前的必經(jīng)步驟,因此,在以下段落中更 詳細(xì)地描述直射信號修正器68中進(jìn)行的包絡(luò)提取過程。
如上所述,在混合子帶域中,使用k來表示子帶。也可以將若干 子帶k組織在參數(shù)頻帶K中。
圖4的表格中給出了在以下討論的本發(fā)明的實施例下的子帶與參 數(shù)頻帶的關(guān)聯(lián)。
首先,對于幀中的每個時隙,使用它來計算特定參數(shù)頻帶K的能
量Eslot, yn, k是混合子帶輸入信號。
<formula>formula see original document page 19</formula>
其中Kstart=10,Kstop=18。
該求和包括根據(jù)表A.l歸屬于一個參數(shù)頻帶K的所有f 隨后,對每個參數(shù)頻帶,長期能量平均^L計算為
<formula>formula see original document page 19</formula>
其中,a是與一階IIR低通(約400ms時間常數(shù))相對應(yīng)的加權(quán)因 子,n表示時隙索引。平滑總平均(寬帶)能量g。,。,計算為<formula>formula see original document page 20</formula>
從上述方程可以看到,在從聲道的平滑表示獲得增益因子之前, 對時間包絡(luò)進(jìn)行平滑。 一般地,平滑是指從具有遞減梯度的原始聲道 獲得平滑的表示。
從上述方程可以看到,隨后描述的白化操作是基于時間平滑的總 能量估計和子帶中的平滑的能量估計,從而確保了最終的包絡(luò)估計的 更好的穩(wěn)定性。
確定這些能量的比值來獲得用于頻譜白化操作的權(quán)值
通過對參數(shù)頻帶的加權(quán)成分求和來獲得寬帶包絡(luò)估計,所述成分 對長期能量平均進(jìn)行歸一化并計算平方根
<formula>formula see original document page 20</formula>
^是與一階IIR低通(約40ms時間常數(shù))相對應(yīng)的加權(quán)因子。
使用頻譜白化的能量或幅度度量作為計算縮放因子的基礎(chǔ)。從上 述方程可以看到,頻譜白化是指改變頻譜,使得音頻聲道表示的每個 頻譜帶內(nèi)包含相同的能量或均值幅度。這是最有利的,因為所討論的 瞬時信號具有非常寬的頻譜,使得必需使用整個可用頻譜的完整信息來計算增益因子,以不致相對于其他非瞬時信號抑制了該瞬時信號。 換言之,頻譜白化的信號是在其頻譜表示的不同頻譜帶中具有近似相 等的能量的信號。
本發(fā)明的直射信號修正器對直射信號分量進(jìn)行修正。如上所述, 在傳送的殘留信號存在的情況下,可以將處理限制在從起始索引開始 的一些子帶索引中。此外,可以將處理總體限制在閾值索引之上的子 帶索引中。
包絡(luò)成形處理由對每個輸出聲道的直射聲音包絡(luò)的平坦化,接著 是向目標(biāo)包絡(luò)的重新成形組成。如果在輔助信息中對該聲道以信號指
示了bsEnvShapeChannel-l,則這產(chǎn)生了對每個輸出聲道的直射信號應(yīng) 用的增益曲線。
僅對特定混合子子帶(sub-subband) k進(jìn)行該處理
k>7
在傳送的殘留信號存在的情況下,將k選擇為從所討論的聲道的 上混中包含的最高殘留頻帶之上開始。
如在之前的部分所描述的,對于5-l-5配置,通過估計傳送的下混 的包絡(luò)E"^^來獲得目標(biāo)包絡(luò),隨后,使用由編碼器傳送的并重新量 化的包絡(luò)比值e"W W^對其進(jìn)行縮放。
接著,對每個輸出聲道,對幀中的所有時隙,通過估計其包絡(luò)Em^ 來計算其增益曲線gj"),并將該增益曲線與目標(biāo)包絡(luò)相關(guān)。最終,
將該增益曲線轉(zhuǎn)換為對上混聲道的直射部分獨立進(jìn)行縮放的有效增益 曲線
<formula>formula see original document page 21</formula>對于5-2-5配置,從左聲道傳送的下混信號的包絡(luò)^n^^獲得L和 Ls的目標(biāo)包絡(luò),使用右聲道傳送的下混包絡(luò)五"v。^來獲得R和Rs的目
標(biāo)包絡(luò)。從左和右聲道傳送的下混信號的包絡(luò)之和獲得中心聲道。 對每個輸出聲道,通過估計其包絡(luò)£m/x#來計算增益曲線,
并將該增益曲線與目標(biāo)包絡(luò)相關(guān)。在第二步驟中,將該增益曲線轉(zhuǎn)換 為對上混聲道的直射部分獨立進(jìn)行縮放的有效增益曲線
ra〃oc/i(w) = min(4,max(0.25,g^ + flm; / fl〃ocA(M). (gc/i -1

3力'
"(")=,,"")如歸("), ' £"Vc/7(")
J 腸 , 1 J
對所有聲道,如果bsEnvShapeChanne—1,則應(yīng)用該包絡(luò)調(diào)整增益 曲線。
《w(") = ra"《(")'^,^"("), c/ze(丄,Ly,C,凡;^ 否則,簡單地復(fù)制直射信號
丸U",(") = " e仏々,C,凡i 4
最終,每個單個聲道修正的直射信號分量必須根據(jù)以下等式,與
混合子帶域內(nèi)的對應(yīng)各聲道的散射信號分量組合
從以上段落可以看到,本發(fā)明的概念教導(dǎo)了在空間音頻解碼器中 提高感知質(zhì)量和類似掌聲的信號的空間分布。通過獲得具有精細(xì)縮放 時間顆粒度的增益因子,以僅對空間上混信號的直射部分進(jìn)行縮放來
22完成了這種增強(qiáng)。本質(zhì)上,從傳送的輔助信息和編碼器中對直射和散 射信號的音級或能量的度量來獲得該增益因子。
雖然上述示例具體描述了基于幅度度量的計算,但是,應(yīng)注意, 本發(fā)明的方法不限于此,而是也可以計算例如能量度量或適合于描述 信號的時間包絡(luò)的其他量。
上述示例描述了針對5-l-5和5-2-5聲道配置的計算。自然,上述原 理可以類似地應(yīng)用到例如7-2-7和7-5-7聲道配置上。
圖5示出了本發(fā)明的多聲道音頻解碼器100的示例,多聲道音頻解 碼器100接收由一個原始多聲道信號的多個聲道下混而得到的下混聲 道102,以及參數(shù)表示104,參數(shù)表示104包括該原始多聲道信號的原始 聲道(左前置、右前置、左后置和右后置)的時間結(jié)構(gòu)信息。多聲道 解碼器100具有產(chǎn)生器106,用于對下混聲道102下的每個原始聲道產(chǎn)生 直射信號分量和散射信號分量。多聲道解碼器100還包括針對要重構(gòu)的 每個聲道的4個本發(fā)明的直射信號修正器108a至108d,使得該多聲道解 碼器在其輸出112輸出4個輸出聲道(左前置、右前置、左后置和右后 置)。
雖然使用要重構(gòu)4個原始聲道的示例配置來詳細(xì)描述了本發(fā)明的 多聲道解碼器,但是,本發(fā)明的概念可以在具有任意聲道數(shù)目的多聲 道音頻方案中實現(xiàn)。
圖6示出了一個框圖,詳細(xì)描述了本發(fā)明的產(chǎn)生重構(gòu)輸出聲道的 方法。
在產(chǎn)生步驟IIO,從下混聲道獲得直射信號分量和散射信號分量。 在修正步驟112,使用參數(shù)表示的參數(shù)來修正直射信號分量,該參數(shù)表 示具有原始聲道的時間結(jié)構(gòu)信息。
在組合步驟114,將修正的直射信號分量與散射信號分量組合來 獲得重構(gòu)的輸出聲道。
根據(jù)本發(fā)明方法的特定實現(xiàn)需要,可以以硬件或軟件實現(xiàn)本發(fā)明 的方法??梢允褂脭?shù)字存儲介質(zhì),尤其是具有電子可讀控制信號存儲 在其上的磁盤、CD或DVD來執(zhí)行該實現(xiàn)方式,所述電子可讀控制信 號可以與可編程計算機(jī)系統(tǒng)協(xié)作來執(zhí)行本發(fā)明的方法。 一般地,因此,本發(fā)明也在于具有程序代碼的計算機(jī)程序產(chǎn)品,所述程序代碼存儲在 機(jī)器可讀載體上,當(dāng)計算機(jī)程序產(chǎn)品在計算機(jī)上運行時,所述程序代 碼執(zhí)行本發(fā)明的方法。換言之,因此,本發(fā)明可以被實現(xiàn)為具有程序 代碼的計算機(jī)程序,當(dāng)計算機(jī)程序在計算機(jī)上運行時,所述程序代碼 執(zhí)行本發(fā)明的方法。
雖然參照本發(fā)明的具體實施例具體地說明并描述了上述內(nèi)容,但 是,本領(lǐng)域技術(shù)人員應(yīng)理解,在不背離其精神和范圍的情況下,可以 做出形式和細(xì)節(jié)上的各種其他改變。應(yīng)理解,為了適應(yīng)不同的實施例, 在不背離此處所公開的及由所附權(quán)利要求所包括的更寬的概念的情況 下,可以做出各種改變。
權(quán)利要求
1.多聲道重構(gòu)器(30;60),使用通過對多個原始聲道進(jìn)行下混而獲得的至少一個下混聲道(38;68),并使用參數(shù)表示(40;72)來產(chǎn)生重構(gòu)輸出聲道(50;76),所述參數(shù)表示(40;72)包括原始聲道的時間結(jié)構(gòu)信息,所述多聲道重構(gòu)器(30;60)包括產(chǎn)生器(32;62),用于基于所述下混聲道(38;68)來產(chǎn)生重構(gòu)輸出聲道(50;76)的直射信號分量(42;64)和散射信號分量(44;66);直射信號修正器(34;69),用于使用所述參數(shù)表示(40;72)來修正所述直射信號分量(42;64);以及組合器(36;74),用于對修正的直射信號分量(46)和所述散射信號分量(44;66)進(jìn)行組合來獲得所述重構(gòu)輸出聲道(50;76)。
2. 如權(quán)利要求l所述的多聲道重構(gòu)器,其中,所述產(chǎn)生器(32; 62)被操作為僅使用所述下混聲道(38; 68)的分量來產(chǎn)生所述直射 信號分量(42; 64)。
3. 如權(quán)利要求1或2所述的多聲道重構(gòu)器(30; 60),其中,所述 產(chǎn)生器(32; 62)被操作為使用所述下混聲道(38; 68)的濾波的和/ 或延遲的部分來產(chǎn)生所述散射信號分量(44; 66)。
4. 如權(quán)利要求1至3中任一項所述的多聲道重構(gòu)器(30; 60),其 中,所述直射信號修正器(34; 69)被操作為使用原始聲道的時間結(jié) 構(gòu)信息,所述原始聲道的時間結(jié)構(gòu)信息指示了原始聲道的有限長度的 時間部分內(nèi)所述原始聲道中包含的能量。
5. 如權(quán)利要求1至3中任一項所述的多聲道重構(gòu)器(30; 60),其中,所述直射信號修正器(34; 69)被操作為使用原始聲道的時間結(jié) 構(gòu)信息,所述原始聲道的時間結(jié)構(gòu)信息指示了原始聲道的有限長度的 時間部分內(nèi)的所述原始聲道的均值幅度。
6. 如權(quán)利要求1至5中任一項所述的多聲道重構(gòu)器(30; 60),其 中,所述組合器(36; 74)被操作為將所述修正的直射信號分量(46)與所述散射信號分量(44; 66)相加來獲得所述重構(gòu)信號。
7. 如權(quán)利要求1至6中任一項所述的多聲道重構(gòu)器,其中,所述多 聲道重構(gòu)器被操作為使用第一下混聲道和第二下混聲道(38; 68),所 述第一下混聲道具有所述多個原始聲道的左側(cè)的信息,所述第二下混 聲道(38; 68)具有所述多個原始聲道的右側(cè)的信息,其中,僅使用 由所述第一下混聲道產(chǎn)生的直射和散射信號分量來組合左側(cè)的第一重 構(gòu)輸出聲道(50; 76),并且使用僅由所述第二下混聲道產(chǎn)生的直射和 散射信號分量來組合右側(cè)的第二重構(gòu)輸出聲道。
8. 如權(quán)利要求1至7中任一項所述的多聲道重構(gòu)器(30; 60),其 中,所述直射信號修正器(34; 68)被操作為修正有限時間部分的直 射信號,所述有限時間部分比所述參數(shù)表示(40; 72)內(nèi)的附加參數(shù) 信息的幀時間部分更短,其中,所述產(chǎn)生器(32; 62)使用所述附加 參數(shù)信息來產(chǎn)生所述直射和散射信號分量。
9. 如權(quán)利要求8所述的多聲道重構(gòu)器(30; 60),其中,所述產(chǎn)生 器(32; 62)被操作為使用附加參數(shù)信息,所述附加參數(shù)信息具有原 始聲道的能量信息,所述能量信息是相對于所述多個原始聲道的其他 聲道的能量信息。
10. 如之前任一權(quán)利要求所述的多聲道重構(gòu)器(30; 60),其中, 所述直射信號修正器(34; 68)被操作為使用原始聲道的時間結(jié)構(gòu)信 息,所述原始聲道的時間結(jié)構(gòu)信息將原始聲道的時間結(jié)構(gòu)與所述下混 聲道(38; 68)的時間結(jié)構(gòu)相關(guān)。
11. 如之前任一權(quán)利要求所述的多聲道重構(gòu)器(30; 60),其中, 所述原始聲道的時間結(jié)構(gòu)信息與所述下混聲道的時間結(jié)構(gòu)信息具有能 量或幅度度量。
12. 如之前任一權(quán)利要求所述的多聲道重構(gòu)器(30; 60),其中, 所述直射信號修正器(34; 68)被進(jìn)一步操作為獲得與所述下混聲道(38; 68)的時間結(jié)構(gòu)相關(guān)的下混時間信息。
13. 如權(quán)利要求12所述的多聲道重構(gòu)器(30; 60),其中,所述直 射信號修正器(34; 68)被操作為獲得下混時間信息,所述下混時間 信息指示了有限長度的時間間隔內(nèi)所述下混聲道(38; 68)包含的能量,或所述有限長度的時間間隔內(nèi)的幅度度量。
14. 如權(quán)利要求12或13所述的多聲道重構(gòu)器(30; 60),其中,所 述直射信號修正器(34; 68)被進(jìn)一步操作為使用所述下混時間信息 以及所述原始聲道的時間結(jié)構(gòu)信息,來獲得重構(gòu)的下混聲道(38; 68)的目標(biāo)時間結(jié)構(gòu)。
15. 如權(quán)利要求12至14中任一項所述的多聲道重構(gòu)器(30; 60), 其中,所述直射信號修正器(34; 68)被操作為獲得針對所述下混聲 道(38; 68)中高于頻譜下界的頻譜部分的下混時間信息。
16. 如權(quán)利要求12至15中任一項所述的多聲道重構(gòu)器(30; 60), 其中,所述直射信號修正器(34; 68)被進(jìn)一步操作為對所述下混聲 道(38; 68)進(jìn)行頻譜白化,并使用頻譜白化的下混聲道(38; 68) 來獲得所述下混時間信息。
17. 如權(quán)利要求12至16中任一項所述的多聲道重構(gòu)器(30; 60), 其中,所述直射信號修正器(34; 68)被進(jìn)一步操作為獲得所述下混 聲道(38; 68)的平滑表示,并從所述下混聲道的平滑表示來獲得所 述下混時間信息。
18. 如權(quán)利要求17所述的多聲道重構(gòu)器(30; 60),其中,所述直 射信號修正器(34; 68)被操作為通過使用一階低通濾波器對所述下 混聲道(38; 68)進(jìn)行濾波來獲得所述平滑表示。
19. 如之前任一權(quán)利要求所述的多聲道重構(gòu)器(30; 60),其中, 所述直射信號修正器(34; 68)被進(jìn)一步操作為獲得所述直射信號分 量和所述散射信號分量的組合的時間結(jié)構(gòu)信息。
20. 如權(quán)利要求19所述的多聲道重構(gòu)器(30; 60),其中,所述直 射信號修正器(34; 68)被操作為對所述直射信號和散射信號分量的 組合進(jìn)行頻譜白化,并使用頻譜白化的所述直射和散射信號分量來獲 得所述直射信號和散射信號分量的組合的時間結(jié)構(gòu)信息。
21. 如權(quán)利要求19或20所述的多聲道重構(gòu)器(30; 60),其中,所 述直射信號修正器(34; 68)被進(jìn)一步操作為獲得所述直射和散射信 號分量的組合的平滑表示,并從所述直射和散射信號分量的組合的平 滑表示來獲得所述直射和散射信號分量的組合的時間結(jié)構(gòu)信息。
22. 如權(quán)利要求21所述的多聲道重構(gòu)器(30; 60),其中,所述直 射信號修正器(34; 68)被操作為通過使用一階低通濾波器對所述直 射和散射信號分量進(jìn)行濾波來獲得所述直射和散射信號分量的組合的 平滑表示。
23. 如之前任一權(quán)利要求所述的多聲道重構(gòu)器(30; 60),其中, 所述直射信號修正器(34; 68)被操作為使用原始聲道的時間結(jié)構(gòu)信 息,所述原始聲道的時間結(jié)構(gòu)信息表示了原始聲道的有限長度時間間 隔的能量或幅度與所述下混聲道(38; 68)的有限長度時間間隔的能 量或幅度的比值。
24. 如之前任一權(quán)利要求所述的多聲道重構(gòu)器(30; 60),其中, 所述直射信號修正器(34; 68)被操作為使用所述下混聲道(38; 68) 和所述時間結(jié)構(gòu)信息來獲得所述重構(gòu)輸出聲道(50; 76)的目標(biāo)時間 結(jié)構(gòu)。
25. 如權(quán)利要求23所述的多聲道重構(gòu)器(30; 60),其中,所述直 射信號修正器(34; 68)被操作為修改所述直射信號分量,使得所述 重構(gòu)輸出聲道(50; 76)的時間結(jié)構(gòu)等于容限范圍內(nèi)的目標(biāo)時間結(jié)構(gòu)。
26. 如權(quán)利要求24所述的多聲道重構(gòu)器(30; 60),其中,所述直 射信號修正器(34; 68)被操作為獲得中間縮放因子,當(dāng)使用由所述 中間縮放因子來縮放的直射信號分量與由所述中間縮放因子來縮放的 散射信號分量組合得到所述所述重構(gòu)輸出聲道(50; 76)時,所述中 間縮放因子使得所述重構(gòu)輸出聲道(50; 76)的時間結(jié)構(gòu)等于容限范 圍內(nèi)的目標(biāo)時間結(jié)構(gòu)。
27. 如權(quán)利要求25所述的多聲道重構(gòu)器(30; 60),其中,所述直 射信號修正器(34; 68)被進(jìn)一步操作為使用所述中間縮放因子和所 述直射和散射信號分量來獲得最終縮放因子,當(dāng)使用由所述最終縮放 因子來縮放的直射信號分量和散射信號分量組合得到所述重構(gòu)輸出聲 道(50; 76)時,使得所述重構(gòu)輸出聲道(50; 76)的時間結(jié)構(gòu)等于 容限范圍內(nèi)的目標(biāo)時間結(jié)構(gòu)。
28. 使用通過對多個原始聲道進(jìn)行下混而獲得的至少一個下混聲 道(38; 68)并使用參數(shù)表示(40; 72)來產(chǎn)生重構(gòu)輸出聲道(50;76)的方法,所述參數(shù)表示(40; 72)包括原始聲道的時間結(jié)構(gòu)信息,所述方法包括基于所述下混聲道(38; 68)來產(chǎn)生重構(gòu)輸出聲道(50; 76)的 直射信號分量和散射信號分量;使用所述參數(shù)表示(40; 72)來修正所述直射信號分量;以及對修正的直射信號分量(46)和所述散射信號分量進(jìn)行組合來獲 得所述重構(gòu)輸出聲道(50; 76)。
29. 多聲道音頻解碼器,使用通過對多個原始聲道進(jìn)行下混而獲 得的至少一個下混聲道(38; 68),并使用參數(shù)表示(40; 72)來產(chǎn)生 多聲道信號的重構(gòu),所述參數(shù)表示(40; 72)包括原始聲道的時間結(jié) 構(gòu)信息,所述多聲道音頻解碼器包括如權(quán)利要求1至27所述的多聲道重 構(gòu)器。
30. 具有程序代碼的計算機(jī)程序,當(dāng)在計算機(jī)上運行時,運行權(quán) 利要求28所述的方法。
全文摘要
由多聲道重構(gòu)器使用至少一個下混聲道和使用參數(shù)表示來重構(gòu)的輸出信號,可以使用基于該下混聲道(38)來產(chǎn)生直射信號分量(42)和散射信號分量(44)的產(chǎn)生器(32)來產(chǎn)生,通過下混多個原始聲道來獲得所述至少一個下混聲道,所述參數(shù)表示包括關(guān)于原始聲道的時間精細(xì)結(jié)構(gòu)的附加信息。僅修正(34)直射信號分量(42),使得重構(gòu)的輸出信號的時間精細(xì)結(jié)構(gòu)(40)適合所需的時間精細(xì)結(jié)構(gòu),所傳送的關(guān)于時間精細(xì)結(jié)構(gòu)的附加信息指示了所述所需的時間精細(xì)結(jié)構(gòu)。
文檔編號H04S3/00GK101406073SQ200680054008
公開日2009年4月8日 申請日期2006年5月18日 優(yōu)先權(quán)日2006年3月28日
發(fā)明者于爾根·赫勒, 卡斯滕·林茨邁爾, 哈拉爾德·波普, 薩沙·迪施 申請人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1