專利名稱:用于處理音頻信號的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于處理音頻信號的裝置及其方法。雖然本發(fā)明適用于大范圍的應(yīng) 用,但是特別適合于處理經(jīng)由數(shù)字媒體、廣播信號等等接收到的音頻信號。
背景技術(shù):
通常,在用于將多個對象下混合為單音或者立體聲信號的過程中,分別從對象信 號中提取參數(shù)。這些參數(shù)可用于解碼器。對象的每一個的搖擺(panning)和增益是可通過 用戶選擇控制的。
發(fā)明內(nèi)容
技術(shù)問題然而,為了控制每個對象信號,應(yīng)當(dāng)適當(dāng)?shù)囟ㄎ换驌u擺包含在下混合中的每個源。另外,為了提供根據(jù)面向聲道的解碼方案的向后兼容,對象參數(shù)應(yīng)當(dāng)被轉(zhuǎn)換成用 于上混合的多聲道參數(shù)。因此,本發(fā)明針對一種用于處理音頻信號的裝置及其方法,其基本上消除了由于 現(xiàn)有技術(shù)的限制和缺點(diǎn)而導(dǎo)致的一個或多個問題。本發(fā)明的目的在于提供一種用于處理音頻信號的裝置及其方法,通過該裝置和方 法,可以通過控制對象的增益和搖擺來輸出單音信號、立體聲信號和多聲道信號。本發(fā)明的另一個目的在于提供一種用于處理音頻信號的裝置及其方法,通過該裝 置和方法,可以在不執(zhí)行多聲道解碼器的復(fù)雜的方案的情況下,從下混合信號中輸出單音 信號和立體聲信號。本發(fā)明的又一個目的在于提供一種用于處理音頻信號的裝置及其方法,通過該方 法和裝置,可以在以相當(dāng)大的寬度調(diào)整有聲或者背景音樂的增益的情況下,防止聲音質(zhì)量 的失真。有益效果因此,本發(fā)明提供以下的效果或者優(yōu)點(diǎn)。第一,本發(fā)明能夠在沒有限制的情況下控制對象的增益和搖擺。第二,本發(fā)明能夠基于用戶選擇來控制對象的增益和搖擺。第三,在輸出模式是單音或者立體聲的情況下,本發(fā)明在不執(zhí)行多聲道解碼器的 復(fù)雜的方案的情況下生成輸出信號,從而便利實現(xiàn)和降低復(fù)雜度。第四,在為諸如移動設(shè)備的設(shè)備提供一個或者兩個揚(yáng)聲器的情況下,本發(fā)明能夠 在不需要處理多聲道解碼器的編解碼器的情況下控制用下混合信號的對象的增益和搖擺。第五,在有聲或者背景音樂被完全地抑制的情況下,本發(fā)明能夠根據(jù)增益調(diào)整來 防止聲音質(zhì)量的失真。第六,在諸如聲樂等的至少兩個單獨(dú)立對象(立體聲聲道或者若干有聲信號)存 在的情況下,本發(fā)明能夠根據(jù)增益調(diào)整來防止聲音質(zhì)量的失真。
附圖被包括進(jìn)來以提供對本發(fā)明的進(jìn)一步理解,并且并入和構(gòu)成本說明書的一部 分,附示了本發(fā)明的實施例,并且與描述一起用于可以解釋本發(fā)明原理。在附圖中圖1是根據(jù)用于生成單音/立體聲信號的本發(fā)明的實施例的用于處理音頻信號的 裝置的框圖;圖2是用于在圖1中示出的下混合處理單元的第一示例的詳細(xì)框圖;圖3是用于在圖1中示出的下混合處理單元的第二示例的詳細(xì)框圖;圖4是根據(jù)用于生成雙聲道信號的本發(fā)明的一個實施例的用于處理音頻信號的 裝置框圖;圖5是在圖4中示出的下混合處理單元的詳細(xì)框圖;圖6是根據(jù)用于生成雙聲道聲道的本發(fā)明的另一個實施例的用于處理音頻信號 的裝置的框圖;圖7是根據(jù)用于控制獨(dú)立對象的本發(fā)明的一個實施例的用于處理音頻信號的裝 置的框圖;圖8是用于根據(jù)用于控制獨(dú)立對象的本發(fā)明的另一個實施例來處理音頻信號的 裝置的框圖;圖9是根據(jù)用于處理增強(qiáng)的對象的本發(fā)明的第一實施例的用于處理音頻信號的 裝置的框圖;圖10是根據(jù)用于處理增強(qiáng)的對象的本發(fā)明的第二實施例的用于處理音頻信號的 裝置的框圖;以及圖11和圖12是根據(jù)用于處理增強(qiáng)的對象的本發(fā)明的第三實施例的用于處理音頻 信號的裝置的框圖。最佳方式本發(fā)明的其他特征和優(yōu)點(diǎn)將在隨后的描述中進(jìn)行闡述,并且從該描述中在某種程 度上將是清晰可見的,或者可以通過實踐本發(fā)明來習(xí)得??梢酝ㄟ^在撰寫的說明書及其權(quán) 利要求以及所附的附圖中所具體指出的結(jié)構(gòu)來實現(xiàn)和獲得本發(fā)明的目的和其他的優(yōu)點(diǎn)。為了實現(xiàn)這些和其他的優(yōu)點(diǎn)并且根據(jù)本發(fā)明的目的,如在實施和廣泛描述的,根 據(jù)本發(fā)明的一種處理音頻信號的方法包括接收包括至少一個對象信號的下混合信號和在 生成下混合信號時提取的對象信息;接收用于控制對象信號的混合信息;根據(jù)輸出模式使 用對象信息和混合信息來生成下混合處理信息和多聲道信息中的一個;以及如果生成了下 混合處理信息,則通過將下混合處理信息應(yīng)用于下混合信號來生成輸出信號,其中,下混合 信號和輸出信號與單音信號相對應(yīng),并且其中,多聲道信息與用于將下混合信號上混合為 多個聲道信號的信息相對應(yīng)。根據(jù)本發(fā)明,下混合信號和輸出信號與在時間域上的信號相對應(yīng)。根據(jù)本發(fā)明,生成輸出信號包括通過分解下混合信號來生成子帶信號;使用下 混合處理信息來處理子帶信號;以及通過合成子帶信號來生成輸出信號。根據(jù)本發(fā)明,輸出信號包括通過去相關(guān)下混合信號所生成的信號。
根據(jù)本發(fā)明,該方法進(jìn)一步包括如果生成多聲道信息,則通過使用多聲道信息對 下混合信號進(jìn)行上混合來生成多個聲道信號。根據(jù)本發(fā)明,根據(jù)揚(yáng)聲器聲道數(shù)目來確定輸出模式,并且揚(yáng)聲器聲道數(shù)目基于設(shè) 備信息和混合信息中的一個。根據(jù)本發(fā)明,混合信息基于對象位置信息、對象增益信息和回放配置信息中的至 少一個來生成。為了進(jìn)一步實現(xiàn)這些和其他的優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,一種用于處理音頻 信號的裝置,包括多路分解器,該多路分解器接收包括至少一個對象信號的下混合信號和 在下混合信號生成時提取的對象信息;信息生成單元,該信息生成單元根據(jù)輸出模式使用 對象信息和用于控制對象信號的混合信息來生成下混合處理信息和多聲道信息中的一個; 以及下混合處理單元,如果生成下混合處理信息,則該下混合處理單元通過將下混合處理 信息應(yīng)用于下混合信號來生成輸出信號,其中,下混合信號和輸出信號與單音信號相對應(yīng), 并且其中,多聲道信息與用于將下混合信號上混合為多個聲道信號的信息相對應(yīng)。根據(jù)本發(fā)明,該下混合處理單元包括子帶分解單元,該子帶分解單元通過分解下 混合信號來生成子帶信號;M2M處理單元,該M2M處理單元使用下混合處理信息來處理子帶 信號;以及子帶合成單元,該子帶合成單元通過合成子帶信號來生成輸出信號。為了進(jìn)一步實現(xiàn)這些和其他的優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,根據(jù)本發(fā)明的一種 處理音頻信號的方法包括接收包括至少一個對象信號的下混合信號和在下混合信號生成 時提取的對象信息;接收用于控制對象信號的混合信息;根據(jù)輸出模式使用對象信息和混 合信息來生成下混合處理信息和多聲道信息中的一個;以及如果生成了下混合處理信息, 則通過將下混合處理信息應(yīng)用于下混合信號來生成輸出信號,其中,下混合信號與單音信 號相對應(yīng),其中,輸出信號與通過將去相關(guān)器應(yīng)用于下混合信號所生成的立體聲信號相對 應(yīng),并且其中,多聲道信息與用于將下混合信號上混合為多聲道信號的信息相對應(yīng)。根據(jù)本發(fā)明,下混合信號和輸出信號與在時間域上的信號相對應(yīng)。根據(jù)本發(fā)明,生成輸出信號包括通過分解下混合信號來生成子帶信號;通過使 用下混合處理信息處理該子帶信號來生成兩個子帶信號;以及通過合成兩個子帶信號來分 別生成輸出信號。根據(jù)本發(fā)明,生成兩個子帶信號包括通過去相關(guān)子帶信號來生成去相關(guān)的信號; 以及通過使用下混合處理信息處理去相關(guān)的信號和該子帶信號來生成兩個子帶信號。根據(jù)本發(fā)明,該下混合處理信息包括雙聲道參數(shù)和與雙聲道信號相對應(yīng)的輸出信號。根據(jù)本發(fā)明,該方法進(jìn)一步包括如果生成了多聲道信息,則通過使用多聲道信息 對下混合信號進(jìn)行上混合來生成多個聲道信號。根據(jù)本發(fā)明,根據(jù)揚(yáng)聲器聲道數(shù)目來確定輸出模式,并且揚(yáng)聲器聲道數(shù)目基于設(shè) 備信息和混合信息中的一個。為了進(jìn)一步實現(xiàn)這些和其他的優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,一種用于處理音頻 信號的裝置,包括多路分解器,該多路分解器接收包括至少一個對象信號的下混合信號、 時間域下混合信號和在生成下混合信號時提取的對象信息;信息生成單元,該信息生成單 元根據(jù)輸出模式使用用于控制對象信號的混合信息和對象信息來生成下混合處理信息和
6多聲道信息中的一個;以及下混合處理單元,如果生成下混合處理信息,則通過將下混合處 理信息應(yīng)用于下混合信號來生成輸出信號,其中,下混合信號與單音信號相對應(yīng),其中,輸 出信號與通過將去相關(guān)器應(yīng)用于下混合信號所生成的立體聲信號相對應(yīng),并且其中,多聲 道信息與用于將下混合信號上混合為多個聲道信號的信息相對應(yīng)。為了進(jìn)一步實現(xiàn)這些和其他的優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,根據(jù)本發(fā)明的一種 處理音頻信號的方法包括接收包括至少一個對象信號的下混合信號以及在生成下混合信 號時提取的對象信息;接收包括模式選擇信息的混合信息,該混合信息用于控制對象信號; 基于模式選擇信息繞過下混合信號或者從下混合信號中提取背景對象和至少一個獨(dú)立對 象;以及如果該下混合信號被繞過,則使用該對象信息和該混合信息來生成多聲道信息,其 中,下混合信號與單音信號相對應(yīng),并且其中,該模式選擇信息包括指示模式的哪一個的信 息,模式包括正常模式、用于控制背景對象的模式和用于控制至少一個獨(dú)立對象的模式。根據(jù)本發(fā)明,該方法進(jìn)一步包括接收增強(qiáng)的對象信息,其中,使用增強(qiáng)的對象信 息從下混合信號中提取至少一個獨(dú)立對象。根據(jù)本發(fā)明,該增強(qiáng)的對象信息與殘差信號相對應(yīng)。根據(jù)本發(fā)明,至少一個獨(dú)立對象與基于對象的信號相對應(yīng),并且該背景對象與單 音信號相對應(yīng)。根據(jù)本發(fā)明,如果模式選擇模式與正常模式相對應(yīng),則生成立體聲輸出信號。并 且,如果模式選擇模式與用于控制背景對象的模式和用于控制至少一個獨(dú)立對象的模式中 的一個相對應(yīng),則提取該背景對象和至少一個獨(dú)立對象。根據(jù)本發(fā)明,該方法進(jìn)一步包括如果從該下混合信號中提取該背景對象和至少 一個獨(dú)立對象,則生成用于控制該背景對象的第一多聲道信息和用于控制至少一個獨(dú)立對 象的第二多聲道信息中的至少一個。為了進(jìn)一步實現(xiàn)這些和其他的優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,一種用于處理音頻 信號的裝置,包括多路分解器,該多路分解器接收包括至少一個對象信號的下混合信號以 及在生成下混合信號時提取的對象信息;對象代碼轉(zhuǎn)換器,該對象代碼轉(zhuǎn)換器基于包括在 用于控制對象信號的混合信息中的模式選擇信息來繞過下混合信號,或者從下混合信號提 取背景對象和至少一個獨(dú)立對象;以及多聲道解碼器,如果繞過該下混合信號,則使用對象 信息和混合信息來生成多聲道信息,其中,下混合信號與單音信號相對應(yīng),其中,輸出信號 與通過將去相關(guān)器應(yīng)用于下混合信號來生成的立體聲信號相對應(yīng),并且其中,該模式選擇 信息包括指示模式的哪一個的信息,模式包括正常模式、用于控制背景對象的模式和用于 控制至少一個獨(dú)立對象的模式。為了進(jìn)一步實現(xiàn)這些和其他的優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,根據(jù)本發(fā)明的一種 處理音頻信號的方法包括接收包括至少一個對象信號的下混合信號以及在生成下混合信 號時提取的對象信息;接收包括模式選擇信息的混合信息,該混合信息用于控制該對象信 號;以及使用下混合信號來生成立體聲輸出信號,或者基于模式選擇信息來從下混合信號 中提取背景對象和至少一個獨(dú)立對象,其中,下混合信號與單音信號相對應(yīng),其中,該立體 聲輸出信號與包括通過去相關(guān)下混合信號生成的信號的時域信號相對應(yīng),并且其中,該模 式選擇信息包括指示模式的哪一個的信息,模式包括標(biāo)正常模式、用于控制背景對象的模 式和用于控制至少一個獨(dú)立對象的模式。
7
根據(jù)本發(fā)明,該方法進(jìn)一步包括接收增強(qiáng)的對象信息,其中,至少一個獨(dú)立對象 使用增強(qiáng)的對象信息從下混合信號中進(jìn)行提取。根據(jù)本發(fā)明,該增強(qiáng)的對象信息與殘差信號相對應(yīng)。根據(jù)本發(fā)明,至少一個獨(dú)立對象與基于對象的信號相對應(yīng),并且該背景對象與單 音信號相對應(yīng)。根據(jù)本發(fā)明,如果模式選擇模式與正常模式相對應(yīng),則生成該立體聲輸出信號。并 且,如果模式選擇模式與用于控制背景對象的模式和用于控制至少一個獨(dú)立對象的模式中 的一個相對應(yīng),則提取該背景對象和至少一個獨(dú)立對象。根據(jù)本發(fā)明,該方法進(jìn)一步包括如果從下混合信號中提取該背景對象和至少一 個獨(dú)立對象,則生成用于控制該背景對象的第一多聲道信息和用于控制至少一個獨(dú)立對象 的第二多聲道信息中的至少一個。為了進(jìn)一步實現(xiàn)這些和其他的優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,一種用于處理音頻 信號的裝置,包括多路分解器,該多路分解器接收包括至少一個對象信號的下混合信號以 及在生成下混合信號時提取的對象信息;以及對象代碼轉(zhuǎn)換器,該對象代碼轉(zhuǎn)換器使用下 混合信號來生成立體聲輸出信號,或者基于包括在用于控制該對象信號的混合信息中的模 式選擇信息來從該下混合信號中提取背景對象和至少一個獨(dú)立對象,其中,下混合信號與 單音信號相對應(yīng),其中,該立體聲輸出信號與包括通過去相關(guān)下混合信號生成的信號的時 域信號相對應(yīng),并且其中,該模式選擇信息包括指示模式的哪一個的信息相對應(yīng),模式包括 正常模式、用于控制背景對象的模式和用于控制至少一個獨(dú)立對象的模式。應(yīng)該明白,上文的概述和下面的詳細(xì)描述是示例性和說明性的,并且希望提供要 求保護(hù)的本發(fā)明的進(jìn)一步說明。
具體實施例方式現(xiàn)在將對本發(fā)明的優(yōu)選實施例詳細(xì)地進(jìn)行參考,其示例在附圖中進(jìn)行圖示。首先, 本發(fā)明中的術(shù)語可以被解釋為以下的引用。并且,在本說明書中沒有公開的術(shù)語可以被解 釋為匹配本發(fā)明的技術(shù)想法的以下的含義和概念。特定地,在本公開中的“信息”是通常包括值、參數(shù)、系數(shù)、要素等的術(shù)語,并且其含 義可以被認(rèn)為偶爾地不同,本發(fā)明不受此限制。對象具有包括基于對象的信號和基于聲道的信號二者的概念。有時,對象可以僅 包括基于對象的信號。在接收到單音下混合信號的情況下,本發(fā)明意在描述用于處理單音下混合信號的 各種過程。首先,如果有必要將參考圖1至圖3來解釋從單音下混合信號生成單音/立體 聲信號或者多個聲道信號的方法。第二,將參考圖4至圖6來解釋從單音下混合信號(或 者立體聲下混合信號)生成雙聲道信號的方法。第三,將參考圖7至圖12來解釋用于控制 包含在單音下混合中的獨(dú)立對象信號(或者單音背景信號)的方法的各種實施例。1.單音/立體聲信號的生成圖1是根據(jù)用于生成單音/立體聲信號的本發(fā)明的實施例的用于處理音頻信號的 裝置的框圖。參考圖1,根據(jù)本發(fā)明的實施例的用于處理音頻信號的裝置100包括多路分解器110、信息生成單元120和下混合處理單元130。該音頻信號處理裝置100可以進(jìn)一步包括 多聲道解碼器140。多路分解器110經(jīng)由比特流來接收對象信息(OI)。該對象信息(OI)是關(guān)于包含 在下混合信號內(nèi)的對象的信息,并且能夠包括對象水平信息、對象相關(guān)信息等。該對象信息 (OI)能夠包含對象參數(shù)(OP),該對象參數(shù)(OP)是指示對象特性的參數(shù)。比特流進(jìn)一步包含下混合信號(DMX)。該多路分解器110能夠進(jìn)一步從該比特流 中提取下混合信號(DMX)。該下混合信號(DMX)是從下混合至少一個對象信號生成的信號, 并且可以與在時間域上的信號相對應(yīng)。該下混合信號(DMX)可以是單音信號或者立體聲信 號。在本實施例中,該下混合信號(DMX)可以是例如單音信號。信息生成單元120從多路分解器110接收對象信息(OI)。該信息生成單元120從 用戶接口接收混合信息(MXT)。該信息生成單元120從用戶接口或者設(shè)備接收輸出模式信 息(OM)。該信息生成單元120能夠進(jìn)一步從HRTF DB接收HRTF (報頭相關(guān)的傳送功能)參數(shù)。在該情況下,混合信息(MXI)是基于對象位置信息、對象增益信息、回放配置信息 等生成的信息。對象位置信息是使用戶控制每個對象的位置或者搖擺而輸入的信息。對象 增益信息是使用戶控制每個對象的增益而輸入的信息。特定地,對象位置信息或者對象增 益信息可以是從預(yù)設(shè)置的模式選擇的一個。在該情況下,預(yù)設(shè)置的模式是隨著時間的推移 用于預(yù)設(shè)置對象的特定增益或者位置的值。該預(yù)設(shè)置模式信息可以是從另一個設(shè)備接收到 的值或者存儲在設(shè)備中的值。同時,從至少一個或多個預(yù)設(shè)置模式(例如,未使用的預(yù)設(shè)置 模式、預(yù)設(shè)置模式1、預(yù)設(shè)置模式2等)選擇一個可以通過用戶輸入來確定。回放配置信息是包含揚(yáng)聲器數(shù)目、揚(yáng)聲器位置、環(huán)境信息(揚(yáng)聲器的虛擬位置)等 的信息。回放配置信息可以由用戶輸入、可以預(yù)先存儲或者可以從另一個設(shè)備接收。輸出模式信息(OM)是關(guān)于輸出模式的信息。例如,該輸出模式信息(OM)可以包 括指示多少信號用于輸出的信息。指示多少信號用于輸出的該信息可以與單音輸出模式、 立體聲輸出模式、多聲道輸出模式等中的一個相對應(yīng)。同時,該輸出模式信息(OM)可以與 混合信息(MXI)的揚(yáng)聲器的數(shù)目相同。如果預(yù)先存儲該輸出模式信息(OM),則它基于設(shè)備 信息。如果該輸出模式信息(OM)由用戶輸入,則它基于用戶輸入信息。在該情況下,該用 戶輸入信息可以被包括在混合信息(MXI)中。信息生成單元120根據(jù)輸出模式使用對象信息(OI)和混合信息(MXI)來生成下 混合處理信息(DPI)和多聲道信息(MI)中的一個。在該情況下,輸出模式基于以上解釋的 輸出模式信息(OM)。如果輸出模式是單音輸出或者立體聲信號,則信息生成單元120生成 下混合處理信息(DPI)。如果輸出模式是多聲道輸出,則信息生成單元120生成多聲道信息 (Ml)。在該情況下,下混合處理信息(DPI)是用于處理下混合信號(DMX)的信息,稍后將解 釋其細(xì)節(jié)。該多聲道信息(MI)是用于對下混合信號(DMX)進(jìn)行上混合的信息,并且能夠包 括聲道水平信息、聲道相關(guān)信息等。如果輸出模式是單音輸出或者立體聲輸出,則僅生成該下混合處理信息(DPI)。這 是因為下混合處理單元130能夠生成時域單音信號或者時域立體聲信號。同時,如果輸出 模式是多聲道輸出,則生成多聲道信息(Ml)。這是因為在輸入信號是單音信號的情況下多 聲道解碼器140可以生成多聲道信號。
9
下混合處理單元130使用下混合處理信息(DPI)和單音下混合(DMX)來生成單音 輸出信號或者立體聲輸出信號。在該情況下,下混合處理信息(DPI)是用于處理下混合信 號(DMX)的信息,并且將控制包含在下混合信號中對象的增益和/或搖擺。同時,單音輸出信號或者立體聲輸出信號與時域信號相對應(yīng),并且可以包括PCM 信號。在單音輸出信號的情況下,將參考圖2來解釋下混合處理單元130的詳細(xì)配置。在 立體聲輸出信號的情況下,將參考圖3來解釋下混合處理單元130的詳細(xì)配置。此外,下混合處理信息(DPI)可以包括雙聲道參數(shù)。在該情況下,該雙聲道參數(shù)是 用于3D效果的參數(shù),并且可以是由信息成生單元120使用對象信息(01)、混合信息(MXI) 和HRTF參數(shù)成生的信息。在下混合處理信息(DPI)包括雙聲道參數(shù)的情況下,下混合處理 單元130能夠輸出雙聲道信號。稍后將參考圖4至圖6來詳細(xì)解釋用于生成雙聲道信號的 實施例。如果接收到立體聲下混合信號而不是單音下混合信號[在該圖中未示出],則僅 執(zhí)行用于修改下混合信號的串音干擾(crosstalk)的處理,而不生成時域輸出信號。該處 理的下混合信號可以再次由多聲道解碼器140來進(jìn)行處理。但是,本發(fā)明不受該處理的限 制。如果輸出模式是多聲道輸出模式,則多聲道解碼器140通過使用多聲道信息對下 混合(DMX)進(jìn)行上混合來生成多聲道信號。該多聲道解碼器140可以根據(jù)MPEG環(huán)繞(IS)/ IEC 23003-1)的標(biāo)準(zhǔn)來實現(xiàn),本發(fā)明不受此限制。圖2是用于在圖1示出的下混合處理單元的第一示例的詳細(xì)框圖,這是用于生成 單音輸出信號的實施例。圖3是用于在圖1示出的下混合處理單元的第二示例的詳細(xì)框圖, 這是用于生成立體聲輸出信號的示例。參考圖2,下混合處理單元130A包括子帶分解單元132A、M2M處理單元134A和子 帶合成單元136A。該下混合處理單元130A從單音下混合信號生成單音輸出信號。該子帶分解單元132A通過分解單音下混合信號(DMX)來生成子帶信號。子帶分 解單元132A被實現(xiàn)有混合濾波器組,并且子帶信號可以與在混合QMF域上的信號相對應(yīng)。 M2M處理單元134A使用下混合處理信息(DPI)來處理子帶信號。在該情況下,M2M是單音 到單音的縮寫。M2M處理單元134A能夠使用去相關(guān)器來處理子帶信號。子帶合成單元136A 通過合成處理的子帶信號來生成時域單音輸出信號。另外,該子帶合成單元136A可以被實 現(xiàn)有混合濾波器組。參考圖3,下混合處理單元132B包括子帶分解單元132B、M2S處理單元134B、第一 子帶合成單元136B和第二子帶合成單元138B。下混合處理單元130B接收單音下混合信 號,并且然后生成立體聲輸出。類似在圖2中示出的先前的子帶分解單元132A,該子帶分解單元132B通過分解單 音下混合信號(DMX)來生成子帶信號。同樣地,該子帶分解單元132B可以被實現(xiàn)有混合濾 波器組。該M2S處理單元134B通過使用下混合處理信息(DPI)和去相關(guān)器135B處理子帶 信號來生成兩個子帶信號(第一子帶信號和第二子帶信號)。在該情況下,M2S是單音到立 體聲的縮寫。如果使用去相關(guān)器135B,則能夠通過降低在左聲道和右聲道之間的相關(guān)性來 提高立體聲效果。
同時,去相關(guān)器135B將從子帶分解單元132B輸入的子帶信號設(shè)置為第一子帶信 號,并且然后能夠輸出作為第二子帶信號的通過去相關(guān)第一子帶信號生成的信號,本發(fā)明 不受此限制。第一子帶合成單元136B合成第一子帶信號,并且第二子帶合成單元138B合成第 二子帶信號,由此生成時域立體聲輸出信號。因此,在輸入單音下混合的情況下,在以上的描述中解釋了經(jīng)由下混合處理單元 來輸出單音/立體聲輸出的實施例。在以下的描述中,解釋生成雙聲道信號的情況。2.雙聲道信號的生成圖4是根據(jù)用于生成雙聲道信號的本發(fā)明的實施例的用于處理音頻信號的裝置 的框圖。圖5是在圖4中示出的下混合處理單元的詳細(xì)框圖。圖6是根據(jù)用于生成雙聲道 信號的本發(fā)明的另一個實施例的用于處理音頻信號的裝置框圖。參考圖4和圖5,解釋了用于生成雙聲道信號的一個實施例。參考圖6,解釋了用 于生成雙聲道信號的另一個實施例。參考圖4,音頻信號處理裝置200包括多路分解器210、信息生成單元220和下混 合處理單元230。在該情況下,類似參考圖1描述的先前的多路分解器110,該多路分解器 210從比特流中提取對象信息(OI),并且能夠從比特流中進(jìn)一步提取下混合(DMX)。在該情 況下,該下混合信號可以是單音信號或者立體聲信號。信息生成單元220使用對象信息(OI)、混合信息(MXI)和HRTF信息來生成包含雙 聲道參數(shù)的下混合處理信息。在該情況下,該HRTF信息可以是從HRTF DB提取的信息。并 且,雙聲道參數(shù)是用于帶來虛擬3D效果的參數(shù)。下混合處理單元230使用包括雙聲道參數(shù)的下混合處理信息(DPI)來輸出雙聲道 信號。參考圖5來解釋下混合處理單元230的詳細(xì)配置。參考圖5,下混合處理單元230A包括子帶分解單元232A、雙聲道處理單元234A和 子帶合成單元236A。該子帶分解單元232A通過分解下混合信號來生成一個或者兩個子帶 信號。該雙聲道處理單元234A使用包含雙聲道參數(shù)的下混合處理信息(DPI)來處理一個 或者兩個子帶信號。該子帶合成單元236A通過合成一個或者兩個子帶信號來生成時域雙 聲道輸出信號。參考圖6,音頻信號處理裝置300包括多路分解器310和信息生成單元320。音頻 信號處理裝置300可以進(jìn)一步包括多聲道解碼器330。多路分解器310從比特流中提取對象信息(OI),并且能夠從比特流中進(jìn)一步提取 下混合信號(DMX)。信息生成單元320使用對象信息(OI)和混合信息(MXI)來生成多聲 道信息(Ml)。在該情況下,該多聲道信息(MI)是用于對該下混合信號(DMX)進(jìn)行上混合 的信息,并且包括諸如聲道水平信息和聲道相關(guān)信息的空間參數(shù)。信息生成單元320使用 從HRTF DB提取的HRTF參數(shù)來生成雙聲道參數(shù)。雙聲道參數(shù)是用于帶來3D效果的參數(shù), 并且可以包括HRTF參數(shù)本身。雙聲道參數(shù)是非時變性值,并且可以具有動態(tài)特性。如果下混合信號是單音信號,則多聲道信息(MI)可以進(jìn)一步包括增益信息 (ADG)。在該情況下,增益信息(ADG)是用于調(diào)整下混合增益的參數(shù),并且在控制用于特定 對象的增益中是可使用的。在雙聲道輸出的情況下,對對象進(jìn)行上采樣或者下采樣是必要 的。優(yōu)選地使用增益信息(ADG)。如果多聲道解碼器330遵循MPS環(huán)繞標(biāo)準(zhǔn),并且多聲道信
11息(MI)需要根據(jù)MPEG環(huán)繞句法來進(jìn)行配置,則能夠通過設(shè)置‘bsArbitraryDownmix = 1, 使用增益信息(ADG)。如果下混合信號是立體聲信號,則音頻信號處理裝置300可以進(jìn)一步包括用于立 體聲下混合信號的左聲道和右聲道的重新?lián)u擺的下混合處理單元(在該圖中未示出)。但 是,在雙聲道渲染中,左聲道和右聲道的交叉項可以通過HRTF參數(shù)的選擇來生成。因此,在 下混合處理單元(在該圖中未示出)中的操作不是必需的。如果下混合信號是立體聲,并 且多聲道信息(MI)遵循MPS環(huán)繞標(biāo)準(zhǔn),則優(yōu)詵地設(shè)置為5-2-5配置樽式。并且,優(yōu)選地通 過僅繞過左前聲道和右前聲道來進(jìn)行輸出。此外,可以以從右前和左前聲道到右輸出和左 輸出(總共四個參數(shù)設(shè)置)具有有效值而其余的值是零的方式來傳送雙聲道參數(shù)。多聲道解碼器330使用多聲道信息(MI)和雙聲道參數(shù)從下混合信號生成雙聲道 輸出。具體地,該多聲道解碼器330能夠通過將包括在多聲道信息中的空間參數(shù)和雙聲道 參數(shù)的組合應(yīng)用于下混合信號來生成雙聲道輸出。在以上的描述中,解釋了用于生成雙聲道輸出的實施例。類似于第一實施例,如果 經(jīng)由下混合處理單元來直接生成雙聲道輸出,則無需執(zhí)行多聲道解碼器的復(fù)雜方案。因此, 可以降低復(fù)雜度。類似于第二實施例,如果使用多聲道解碼器,則能夠使用多聲道解碼器的 功能。3.獨(dú)立對象的控制(卡拉OK模式/無伴奏合唱(cappella)模式)在以下的描述中,解釋用于通過接收單音下混合來控制獨(dú)立對象或者背景對象的 技術(shù)。圖7是根據(jù)用于控制獨(dú)立對象的本發(fā)明的一個實施例的用于處理音頻信號的裝 置的框圖,并且圖8是根據(jù)用于控制獨(dú)立對象的本發(fā)明的另一個實施例的用于處理音頻信 號的裝置的框圖。參考圖7,音頻信號編碼裝置400的多聲道解碼器410接收多個聲道信號,并且然 后生成單音下混合(DMXm)和多聲道比特流。在該情況下,多個聲道信號是多聲道背景對象 (MBO)。例如,多聲道背景對象(MBO)能夠包括配置背景音樂的多個樂器信號。但是,無 法知道包括多少源信號(例如,樂器信號)。并且,它們不可以按每個源信號來控制。雖然 背景對象可以被下混合為立體聲聲道,但是本發(fā)明意在描述僅下混合為單音信號的背景對象。對象編碼器420通過下混合單音背景對象(DMXm)和至少一個對象信號(ob jN)來 生成單音下混合(DMX),并且還生成對象信息比特流。在該情況下,至少一個對象信號(或 者基于對象的信號)是獨(dú)立對象,并且可以被稱作前景對象(reo)。例如,如果背景對象是 伴唱,則獨(dú)立對象(reo)可以與主唱信號相對應(yīng)。當(dāng)然,如果存在兩個獨(dú)立對象,則可以分 別與歌手1的有聲信號和歌手2的有聲信號相對應(yīng)。并且,對象編碼器420能夠進(jìn)一步生 成殘差信息。該對象編碼器420能夠在下混合單音背景對象(DMXm)和對象信號(ob jN) ( S卩,獨(dú) 立對象)的過程中生成殘差。該殘差用于使解碼器從下混合信號中提取獨(dú)立對象(或者, 背景對象)。音頻信號解碼裝置500的對象代碼轉(zhuǎn)換器510根據(jù)包括在混合信息(MXT)中的模式選擇信息(MSI)來使用增強(qiáng)的對象信息(例如,殘差)從下混合(DMX)中提取至少一個 獨(dú)立對象或者背景對象。該模式選擇信息(MSI)包括指示是否選擇了用于控制背景對象和至少一個獨(dú)立 對象的模式的信息。另外,該模式選擇信息(MSI)可以包括指示規(guī)定的模式與包括正常模 式、用于控制背景對象的模式和用于控制至少一個獨(dú)立對象的模式的模式中的哪一個相對 應(yīng)的信息。例如,如果背景對象是背景音樂,則用于控制背景對象的模式可以與‘無伴奏合 唱模式’模式(或者獨(dú)奏模式)相對應(yīng)。例如,如果獨(dú)立對象是有聲的,則用于控制至少一 個獨(dú)立對象的模式可以與卡拉OK模式相對應(yīng)。換句話說,該模式選擇信息可以是指示是否 選擇了正常模式、‘無伴奏合唱模式’模式和卡拉OK模式中的一個的信息。另外,在‘無伴 奏合唱模式’或者卡拉OK模式的情況下,可以進(jìn)一步包括關(guān)于增益調(diào)整的信息??傊?,如果 模式選擇信息(MSI)是‘無伴奏合唱模式’或者卡拉OK模式,則從下混合(DMX)中提取至 少一個獨(dú)立對象或者背景對象。在正常模式的情況下,該下混合信號可以經(jīng)過旁路。如果提取了獨(dú)立對象,則該對象代碼轉(zhuǎn)換器510通過使用對象信息(OI)、混合信 息(MI)等混合至少一個獨(dú)立對象和背景對象來生成混合的單音下混合。在該情況下,該對 象信息(OI)是從對象信息比特流中提取的信息,并且可以與在先前的描述中解釋的相同。 并且,混合信息(MXI)可以是用于調(diào)整對象增益和/或搖擺的信息。同時,對象代碼轉(zhuǎn)換器510使用多聲道比特流和/或?qū)ο笮畔⒈忍亓鱽砩啥嗦?道信息(Ml)??梢蕴峁┰摱嗦暤佬畔?MI)來控制背景對象或者至少一個獨(dú)立對象。在該 情況下,該多聲道信息可以包括用于控制背景對象的第一多聲道信息和用于控制至少一個 獨(dú)立對象的第二多聲道信息中的至少一個。并且,多聲道解碼器520從使用多聲道信息(MI)混合的單音下混合或者繞過的單 音下混合來生成輸出信號。圖8是用于獨(dú)立對象生成的另一個實施例的示圖。參考圖8,音頻信號處理單元600接收單音下混合(DMX)。該音頻信號處理裝置 600包括下混合處理單元610、多聲道解碼器620、OTN模塊630和渲染單元640。音頻信號處理裝置600根據(jù)模式選擇信息(MSI)來確定是否將下混合信號輸入到 OTN模塊630。在該情況下,該模式選擇信息可以與參考圖7描述的以前的模式選擇信息相 同。如果根據(jù)該模式選擇信息當(dāng)前的模式是用于控制背景對象(MBO)或者至少一個 獨(dú)立對象(reo)的模式,則允許將下混合信號輸入到OTN模塊630。如果根據(jù)模式選擇信 息,當(dāng)前模式是正常模式,則該下混合信號繞過OTN模塊530,而根據(jù)輸出模式輸入到下混 合處理單元610或者多聲道解碼器620。在該情況下,輸出模式與參考圖1描述的輸出模式 信息(OM)相同,并且可以包括輸出揚(yáng)聲器的數(shù)目。在輸出模式是單音/立體聲/雙聲道輸出模式的情況下,下混合處理單元610處 理下混合。在該情況下,下混合處理單元610可以是起與參考圖1/圖2/圖3描述的先前 的下混合處理單元130/130A/130B相同作用的單元。在輸出模式是多聲道模式的情況下,多聲道解碼器620從單音下混合(DMX)生成 多聲道輸出。同樣地,該多聲道解碼器620可以用作與參考圖1描述的以前的多聲道解碼 器140相同的單元。
13
同時,如果根據(jù)模式選擇信息(MSI)將單音下混合信號輸入到OTN模塊630,則 OTN模塊630從下混合信號中提取單音背景對象(MBO)和至少一個獨(dú)立對象信號(TOO)。在 該情況下,OTN是一到η的縮寫。如果存在一個獨(dú)立對象信號,則OTN模塊可以具有OTT( — 到二)結(jié)構(gòu)。如果存在兩個獨(dú)立對象信號,則該OTN模塊可以具有OTT(—到三)結(jié)構(gòu)。如 果存在(N-I)個獨(dú)立對象信號,則該OTN模塊可以具有OTN結(jié)構(gòu)。該OTN模塊630能夠使用對象信息(OI)和增強(qiáng)的對象信息(EDI)。在該情況下, 該增強(qiáng)的對象信息(EOI)可以是在下混合背景對象和獨(dú)立對象的過程中生成的殘差信號。并且,渲染單元640通過使用混合信息(MXI)來渲染背景信息(MBO)和獨(dú)立對象 (FGO)來生成輸出聲道信號。在該情況下,混合信息(MXI)包括用于控制背景對象的信息和 /或用于控制獨(dú)立對象的信息。同時,可以基于對象信息(OI)和混合信息(MXI)來生成多 聲道信息(Ml)。在該情況下,將輸出聲道信號輸入到多聲道解碼器(在該圖中未示出),并 且然后可以基于該多聲道信息來進(jìn)行上混合。圖9是根據(jù)用于處理增強(qiáng)的對象的本發(fā)明的第一實施例的用于處理音頻信號的 裝置的框圖,圖10是根據(jù)用于處理增強(qiáng)的對象的本發(fā)明的第二實施例的用于處理音頻信 號的裝置的框圖,并且圖11和圖12是根據(jù)用于處理增強(qiáng)的對象的本發(fā)明的第三實施例的 用于處理音頻信號的裝置的框圖。第一實施例涉及單音下混合和單音對象。第二實施例涉及單音下混合和立體聲對 象。并且,第三實施例涉及涵蓋第一和第二實施例的兩種情況的情況。參考圖9,音頻信號編碼裝置700A的增強(qiáng)的對象信息編碼器710從是單音信號的 混合的音頻信號生成增強(qiáng)的對象信息(EOP_Xl)和對象信號(obj_Xl)。在該情況下,由于一 個信號使用兩個信號來生成,所以增強(qiáng)的對象信息編碼器710可以被實現(xiàn)為OTT( —到二) 編碼模塊。在該情況下,增強(qiáng)的對象信息(EOP_Xl)可以是殘差信號。并且,增強(qiáng)的對象信 息編碼器710生成與該OTT模塊相對應(yīng)的對象信息(0P_Xl)。音頻信號解碼裝置800Α的增強(qiáng)的對象信息解碼器810使用增強(qiáng)的對象信息(ΕΟΡ_ X1)和混合的音頻信號來生成與附加的重新混合數(shù)據(jù)相對應(yīng)的輸出信號(obj_Xl‘)。參考圖10,音頻信號編碼裝置700B包括第一增強(qiáng)的對象信息編碼器710B和第二 增強(qiáng)的對象信息編碼器720B。并且,音頻信號解碼裝置800B包括第一增強(qiáng)的對象信息解碼 器_和第二增強(qiáng)的對象信息解碼器_。第一增強(qiáng)的對象信息編碼器710B通過將兩個對象信號(obj_Xl,obj_x2)合并在一 起來生成合并的對象和第一增強(qiáng)的對象信息(E0P_L1)。在該情況下,兩個對象信號可以包 括立體聲對象信號,即,對象的左聲道信號和該對象的右聲道信號。在生成合并的對象的過 程中,生成第一對象信息(0P_L1)。第二增強(qiáng)的對象信息編碼器720B使用是單音信號的混合的音頻信號和合并的對 象來生成第二增強(qiáng)的對象信息(EOP_LO)和第二對象信息(OP_LO)。因此,最后的信號通過以上的兩個步驟來生成。由于第一和第二增強(qiáng)的對象信息 編碼器710B和720B的每一個從兩個信號生成一個信號,所以它可以被實現(xiàn)為OTT (—到 二)模塊。該音頻信號解碼裝置800B執(zhí)行與音頻信號編碼裝置700B相反的過程。具體地,第二增強(qiáng)的對象信息解碼器_使用第二增強(qiáng)的對象信息(EOP_LO)和混合的音頻信號來生成合并的對象。在該情況下,可以進(jìn)一步提取音頻信號。并且,第一增強(qiáng)的對象信息解碼器型巡使用第一增強(qiáng)的對象信息(E0P_L1)從合 并的對象中生成兩個對象(Obj_x/ ,obj_x2‘),其是附加的再混合數(shù)據(jù)。圖11和圖12示出了第一和第二實施例的合并的結(jié)構(gòu)。參考圖11,如果根據(jù)在多 聲道編碼器705C的5-1-5或者5-2-5樹形結(jié)構(gòu)的操作的存在或者不存來將增強(qiáng)的對象改 變?yōu)閱我艋蛘吡Ⅲw聲,則將下混合信號改變?yōu)閱我粜盘柣蛘吡Ⅲw聲信號。參考圖11和圖12,在增強(qiáng)的對象是單音信號的情況下,不操作第一增強(qiáng)的對象信 息編碼器710C和第一增強(qiáng)的信息解碼器820C。元件的功能分別地與關(guān)于圖10描述的相同 名稱的那些相同。同時,在下混合信號是單音的情況下,第二增強(qiáng)的對象信息編碼器720C和第二增 強(qiáng)的信息解碼器810C優(yōu)選地分別作為OTT編碼器和OTT解碼器來進(jìn)行操作。在下混合信 號是立體聲的情況下,第二增強(qiáng)的對象信息編碼器720C和第二增強(qiáng)的信息解碼器810C可 以分別作為TIT編碼器和TIT解碼器來操作。根據(jù)本發(fā)明,上述音頻信號處理方法可以在記錄程序的介質(zhì)中被實現(xiàn)為計算機(jī)可 讀代碼。計算機(jī)可讀介質(zhì)包括各種記錄設(shè)備,其中存儲計算機(jī)系統(tǒng)可讀的數(shù)據(jù)。計算機(jī)可 讀的介質(zhì)包括,例如,ROM、RAM、CD-ROM、磁帶、軟盤、光數(shù)據(jù)存儲設(shè)備等,并且還包括載波型 實施方式(例如,經(jīng)由因特網(wǎng)的傳輸)。另外,將通過編碼方法生成的比特流存儲在計算機(jī) 可讀記錄介質(zhì)中,或者可以經(jīng)由有線/無線通信網(wǎng)絡(luò)進(jìn)行傳送。工業(yè)實用性因此,本發(fā)明適用于編碼和解碼音頻信號。雖然已經(jīng)在此處參考本發(fā)明的優(yōu)選實施例描述和說明了本發(fā)明,但是對于本領(lǐng)域 技術(shù)人員來說顯而易見的是,在不脫離本發(fā)明的精神和范圍的情況下,可以在其中進(jìn)行各 種的修改和變化。因此,希望本發(fā)明涵蓋落入所附權(quán)利要求和其等價物的范圍內(nèi)的本發(fā)明 的修改和變化。
權(quán)利要求
一種處理音頻信號的方法,包括接收包括至少一個對象信號的下混合信號以及在生成所述下混合信號時提取的對象信息;接收用于控制所述對象信號的混合信息;根據(jù)輸出模式使用所述對象信息和所述混合信息來生成下混合處理信息和多聲道信息中的一個;以及如果生成了所述下混合處理信息,則通過將所述下混合處理信息應(yīng)用于所述下混合信號來生成輸出信號,其中,所述下混合信號與單音信號相對應(yīng),其中,所述輸出信號與通過將去相關(guān)器應(yīng)用于所述下混合信號所生成的立體聲信號相對應(yīng),以及其中,所述多聲道信息與用于將所述下混合信號上混合為多個聲道信號的信息相對應(yīng)。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述下混合信號和所述輸出信號的每個與在時 間域上的信號相對應(yīng)。
3.根據(jù)權(quán)利要求1所述的方法,其中,所述生成所述輸出信號包括 通過分解所述下混合信號來生成子帶信號;通過使用所述下混合處理信息處理所述子帶信號來生成兩個子帶信號;以及 通過分別地合成所述兩個子帶信號來生成所述輸出信號。
4.根據(jù)權(quán)利要求3所述的方法,其中,所述生成所述兩個子帶信號包括 通過去相關(guān)所述子帶信號來生成去相關(guān)的信號;以及通過使用所述下混合處理信息處理所述去相關(guān)的信號和所述子帶信號來生成所述兩 個子帶信號。
5.根據(jù)權(quán)利要求1所述的方法,其中,所述下混合處理信號包括雙聲道參數(shù),并且其 中,所述輸出信號與雙聲道信號相對應(yīng)。
6.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括如果生成了所述多聲道信息,則通過使用 所述多聲道信息對所述下混合信號進(jìn)行上混合來生成多個聲道信號。
7.根據(jù)權(quán)利要求1所述的方法,其中,根據(jù)揚(yáng)聲器聲道數(shù)目來確定所述輸出模式,并且 其中,所述揚(yáng)聲器聲道數(shù)目基于設(shè)備信息和所述混合信息中的一個。
8.一種用于處理音頻信號的裝置,包括多路分解器,所述多路分解器接收包括至少一個對象信號的下混合信號以及在生成所 述下混合信號時提取的對象信息;信息生成單元,所述信息生成單元根據(jù)輸出模式使用所述對象信息和用于控制所述對 象信號的混合信息來生成下混合處理信息和多聲道信息中的一個;以及下混合處理單元,如果生成了所述下混合處理信息,則所述下混合處理單元通過將所 述下混合處理信息應(yīng)用于所述下混合信號來生成輸出信號, 其中,所述下混合信號與單音信號相對應(yīng),其中,所述輸出信號與通過將去相關(guān)器應(yīng)用于所述下混合信號所生成的立體聲信號相 對應(yīng),以及其中,所述多聲道信息與用于將所述下混合信號上混合為多個聲道信號的信息相對應(yīng)。
9.根據(jù)權(quán)利要求8所述的裝置,其中,所述下混合信號和所述輸出信號與時間域上的 信號相對應(yīng)。
10.根據(jù)權(quán)利要求8所述的裝置,其中,所述下混合處理單元包括子帶分解單元,所述子帶分解單元通過分解所述下混合信號來生成子帶信號; M2M處理單元,所述M2M處理單元通過使用所述下混合處理信息處理所述子帶信號來 生成兩個子帶信號;以及合成單元,所述合成單元通過分別合成所述兩個子帶信號來生成所述輸出信號。
11.根據(jù)權(quán)利要求10所述的裝置,其中,所述M2S處理單元進(jìn)一步包括去相關(guān)器,所 述去相關(guān)器通過去相關(guān)所述子帶信號來生成去相關(guān)的信號;以及其中,所述合成單元通過使用所述下混合處理信息處理所述去相關(guān)的信號和所述子帶 信號來生成所述兩個子帶信號。
12.根據(jù)權(quán)利要求8所述的裝置,其中,所述下混合處理信息包括雙聲道參數(shù),并且其 中,所述輸出信號與雙聲道信號相對應(yīng)。
13.根據(jù)權(quán)利要求8所述的裝置,進(jìn)一步包括多聲道解碼器,如果生成了所述多聲道 信息,則所述多聲道解碼器通過使用所述多聲道信息對所述下混合信息進(jìn)行上混合來生成 多個聲道信號。
14.根據(jù)權(quán)利要求8所述的裝置,其中,根據(jù)揚(yáng)聲器聲道數(shù)目來確定所述輸出模式,并 且其中,所述揚(yáng)聲器聲道數(shù)目基于設(shè)備信息和所述混合信息中的一個。
15.一種包括存儲在其中的程序的計算機(jī)可讀記錄介質(zhì),所述程序被提供用于執(zhí)行處 理音頻信號的方法,所述方法包括接收包括至少一個對象信號的時域下混合信號以及在生成所述下混合信號時提取的 對象信息;接收用于控制所述對象信號的混合信息;根據(jù)輸出模式使用所述對象信息和所述混合信息來生成下混合處理信息和多聲道信 息中的一個;以及如果生成了所述下混合處理信息,則通過將所述下混合處理信息應(yīng)用于所述下混合信 號來生成輸出信號,其中,所述下混合信號與單音信號相對應(yīng),其中,所述輸出信號與通過將去相關(guān)器應(yīng)用于所述下混合信號所生成的立體聲信號相 對應(yīng),以及其中,所述多聲道信息與用于將所述下混合信號上混合為多個聲道信號的信息相對應(yīng)。 全文摘要
公開了一種處理音頻信號的方法和裝置。本發(fā)明包括接收包括至少一個對象信號的下混合信號以及在生成下混合信號時提取的對象信息;接收用于控制對象信號的混合信息;根據(jù)輸出模式使用對象信息和混合信息來生成下混合處理信息和多聲道信息中的一個;以及如果生成了下混合處理信息,則通過將下混合處理信息應(yīng)用于下混合信號來生成輸出信號,其中,下混合信號與單音信號相對應(yīng),其中,輸出信號與通過將去相關(guān)器應(yīng)用于下混合信號所生成的立體聲信號相對應(yīng),并且其中,多聲道信息與用于將下混合信號上混合為多聲道信號的信息相對應(yīng)。
文檔編號H04S7/00GK101911732SQ200880122770
公開日2010年12月8日 申請日期2008年12月31日 優(yōu)先權(quán)日2008年1月1日
發(fā)明者吳賢午, 鄭亮源 申請人:Lg電子株式會社