亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于從音頻信號中產(chǎn)生環(huán)境信號的設(shè)備和方法,用于從音頻信號中導(dǎo)出多聲道音頻信號...的制作方法

文檔序號:2830548閱讀:357來源:國知局

專利名稱::用于從音頻信號中產(chǎn)生環(huán)境信號的設(shè)備和方法,用于從音頻信號中導(dǎo)出多聲道音頻信號...的制作方法
技術(shù)領(lǐng)域
:本發(fā)明總的涉及用于從音頻信號中產(chǎn)生環(huán)境信號的設(shè)備和方法,涉及從音頻信號中導(dǎo)出多聲道音頻信號的設(shè)備和方法,以及涉及計算機(jī)程序。具體地,本發(fā)明涉及用于根據(jù)音頻信號來計算環(huán)境信號的方法和概念,以對單聲道音頻信號進(jìn)行上混(upmix)從而在多聲道系統(tǒng)上回放。
背景技術(shù)
:下面將討論本發(fā)明的根本動機(jī)。目前,在用戶家庭環(huán)境中,多聲道音頻素材也越來越普及。其主要的原因是DVD介質(zhì)上的電影通常提供5.1多聲道聲音。由于這個原因,即使家庭用戶也常常安裝能夠重現(xiàn)多聲道音頻信號的音頻回放系統(tǒng)。例如,一種對應(yīng)的設(shè)置可以由以下組成三個布置在前方的揚(yáng)聲器(示例性地標(biāo)記為L、C和R)、兩個布置在收聽者的后方或?qū)χ章犝弑澈蟮膿P(yáng)聲器(標(biāo)記為Ls和Rs),以及一個低頻音效聲道(也被稱為LFE)。布置在前方的三個揚(yáng)聲器(L、C、R)以下也被稱為前置揚(yáng)聲器。布置在后方并在收聽者背后的揚(yáng)聲器(Ls、Rs)以下也稱之為后置揚(yáng)聲器。此外,應(yīng)該注意到,為了方便起見,以下的細(xì)節(jié)和解釋是針對5.1系統(tǒng)。當(dāng)然,只要對以下的細(xì)節(jié)做很小的修改,也可以應(yīng)用到其它多聲道系統(tǒng)中。與雙聲道立體聲重現(xiàn)相比,多聲道系統(tǒng)(如5.1多聲道音頻系統(tǒng))提供了幾個公知的優(yōu)勢。以如下優(yōu)勢為例-優(yōu)勢h即使在或不在最優(yōu)(中心)收聽位置,都能改進(jìn)前置圖像的穩(wěn)定性。通過中心聲道擴(kuò)大了"甜點(sweetspot)"。術(shù)語"甜點"指的是(收聽者)可以感知到最優(yōu)聲音印象的收聽位置區(qū)域。-優(yōu)勢2:建立對音樂廳印象或體驗的更佳近似。通過后方聲道揚(yáng)聲器或后置聲道揚(yáng)聲器,獲得對"包圍"和空間感的增強(qiáng)體驗。然而,仍存在大量遺留的僅由兩個("立體聲")音頻聲道組成的音頻內(nèi)容(如在致密光盤上)。甚至還有CD和/或DVD上的非常老的錄音、老的電影和電視連續(xù)劇出售,這些CD和/或DVD僅提供單聲道質(zhì)量和/或僅通過一個聲道的"單聲道"音頻信號的方式來提供。因此,對于通過5.1多聲道設(shè)置來對單聲道的遺留音頻素材進(jìn)行回放,存在以下選項-選項h通過中心聲道或通過中心揚(yáng)聲器來重現(xiàn)或回放單聲道,以獲得真實的單聲道源。-選項2:在L和R揚(yáng)聲器上(即在左前置揚(yáng)聲器和右前置揚(yáng)聲器上)重現(xiàn)或回放單聲道信號。這種方法產(chǎn)生的仿真單聲道源具有比真實的單聲道源更廣的感知的源寬度,然而在收聽者沒有坐在甜點時,具有朝向最接近收聽者的揚(yáng)聲器的趨向。如果只有雙聲道回放系統(tǒng)可用,也可使用這種方法,并且該方法不使用擴(kuò)展的揚(yáng)聲器設(shè)置(如使用具有5或者6個揚(yáng)聲器的揚(yáng)聲器設(shè)置)。C揚(yáng)聲器或中心揚(yáng)聲器,Ls揚(yáng)聲器或左后置揚(yáng)聲器,Rs揚(yáng)聲器或右后置揚(yáng)聲器以及LFE揚(yáng)聲器或低頻音效聲道揚(yáng)聲器保持不使用。-選項3:可以采用一種方法,使用5.1揚(yáng)聲器的所有揚(yáng)聲器(即5.1多聲道系統(tǒng)中使用的所有6個揚(yáng)聲器)將單聲道信號的聲道轉(zhuǎn)換為多聲道信號。按照這種方式,多聲道信號受益于先前討論的多聲道設(shè)置的優(yōu)勢。這種方法實時使用或"動態(tài)"使用或通過預(yù)處理的方式使用,并被稱為上混處理或"上混"。對于音頻質(zhì)量或聲音質(zhì)量,選項3提供了超過選項1和選項2的優(yōu)勢。然而,尤其對于產(chǎn)生用于饋送至后置揚(yáng)聲器的信號,所需要的信號處理并不明顯。在文獻(xiàn)中,針對上混方法或上混處理描述了兩種不同的概念。這些概念是"直射/環(huán)境(Direct/Ambient)概念"禾Q"在樂隊中(In-the-band)概念"。以下將對所提到的這兩個概念進(jìn)行描述。直射/環(huán)境概念"直射聲源"是通過3個前置聲道來重現(xiàn)或回放的,使得在與原始的雙聲道版本相同的位置對其進(jìn)行感知。此處使用術(shù)語"直射聲源"來描述完全并直接來自一個分立聲源(例如樂器)的聲音,其僅展現(xiàn)很小另外的聲音或不展現(xiàn)任何另外的聲音,例如由于墻壁的反射而產(chǎn)生的聲音。在此場景中,饋送至后置揚(yáng)聲器的聲音或噪聲應(yīng)當(dāng)僅由似環(huán)境聲音或似環(huán)境噪聲(在原始的錄音中可能出現(xiàn)或也可能未出現(xiàn))組成。似環(huán)境聲音或似環(huán)境噪聲不與單個聲源或噪聲源相關(guān)聯(lián),而對錄音的聲學(xué)環(huán)境(室內(nèi)聲學(xué))的重現(xiàn)或回放或收聽者的所謂的"包圍感"做出貢獻(xiàn)。似環(huán)境聲音或似環(huán)境噪聲還是現(xiàn)場表演中來自觀眾的聲音或噪聲(如掌聲),或出于藝術(shù)目而添加的環(huán)境聲音或環(huán)境噪聲(如錄音噪聲、鳥鳴、蟋蟀的鳴叫聲)。為了示意,圖7表示了(音頻錄音的)原始雙聲道版本。圖8表示了使用直射/環(huán)境概念上混后的演奏。在樂隊中概念根據(jù)環(huán)繞的概念(通常稱為"在樂隊中概念"),每個聲音或噪聲(直射聲音和環(huán)境噪聲)可以被完全和/或任意地圍繞收聽者而放置。噪聲或聲音的位置獨立于其屬性(直射聲音、直射噪聲、環(huán)境聲音或環(huán)境噪聲),而僅依賴于算法的特定設(shè)計及其參數(shù)設(shè)置。圖9表示了環(huán)繞概念。概括而言,圖7、8和9示出幾種回放概念。此處,圖7、8和9描述了收聽者感知到聲音來源于何處(如陰影區(qū)域)。圖7描述了立體聲回放期間的聲學(xué)感知。圖8描述了使用直射/環(huán)境概念的聲學(xué)感知和/或聲音定位。圖9描述了使用環(huán)繞概念的聲音感知和/或聲音定位以下部分給出了現(xiàn)有
技術(shù)領(lǐng)域
中關(guān)于對單聲道或雙聲道信號進(jìn)行上混以形成多聲道版本的概述。文獻(xiàn)教導(dǎo)了幾種用于對單聲道信號和多聲道信號進(jìn)行上混的方法。非信號自適應(yīng)方法大多數(shù)產(chǎn)生所謂"偽立體聲"信號的方法是非信號自適應(yīng)的。這意味著它們以同樣的方式來處理任何單聲道信號,而不論其內(nèi)容為何。這些系統(tǒng)通常使用簡單的濾波器結(jié)構(gòu)和/或時延來操作,以對所產(chǎn)生的信號進(jìn)行解相關(guān)。例如,在[l]中可以找到對這樣的系統(tǒng)的全面討論。信號適應(yīng)性方法在當(dāng)前出售的幾乎每一個音頻/視頻接收機(jī)中都包含矩陣解碼器(如[2]中描述的DolbyProLogicII解碼器、例如[3]中描述的DTSNEO:6解碼器、例如[4]中描述的HarmanKardon/LexiconLogic7解碼器)。作為其實際或期望功能的副產(chǎn)品,這些矩陣解碼器能夠執(zhí)行盲上混。所提到的解碼器使用聲道間差和信號自適應(yīng)控制機(jī)制,以創(chuàng)建多聲道輸出信號。用于多聲道音頻上混的從立體聲信號的環(huán)境提取和合成Avendano和Jot提出了一種頻域技術(shù),用于識別和提取立體聲音頻信號中的環(huán)境信息。(參見[5])。該方法計算聲道間相干系數(shù)和非線性映射函數(shù)的計算,所述非線性映射函數(shù)允許確定主要由雙聲道信號中的環(huán)境分量或環(huán)境部分組成的時頻區(qū)域。然后,合成環(huán)境信號并用于提供多聲道回放系統(tǒng)的環(huán)繞聲道。將立體聲轉(zhuǎn)換為多聲道聲音的方法Irwan和Aarts示出了一種將來自立體聲表示的信號轉(zhuǎn)換為多聲道表示的方法(參見[6])。使用互相關(guān)技術(shù)來計算圍繞聲道的信號。使用主要分量分析(PCA)來計算指示主信號方向的矢量。然后將該矢量從兩聲道表示映射到三聲道表示以產(chǎn)生三個前置聲道?;诃h(huán)境的上混Soulodre示出了一種從立體聲信號產(chǎn)生多聲道信號的系統(tǒng)(參見[7])。信號被分解為所謂的"單源流"和"環(huán)境流"?;谶@些流,所謂的"美學(xué)引擎"合成多聲道輸出。然而,沒有給出關(guān)于該分解步驟和合成步驟的進(jìn)一步的技術(shù)細(xì)節(jié)?;诳臻g提示的偽立體聲Faller在[l]中描述了準(zhǔn)信號自適應(yīng)的偽立體聲處理。該方法使用單信號和相同信號的給定立體聲錄音。從立體聲信號中提取另外的空間信息或空間提示并用于將單聲道信號轉(zhuǎn)換為立體聲信號。
發(fā)明內(nèi)容本發(fā)明的目的在于提供一種從音頻信號中產(chǎn)生環(huán)境信號的概念以及從音頻信號中導(dǎo)出多聲道音頻信號的概念,該概念實現(xiàn)了在單聲道信號中沒有任何預(yù)先信息的情況下,從單聲道信號產(chǎn)生環(huán)境信號,使得環(huán)境信號傳達(dá)出特別好的聽覺印象。這個目的是通過根據(jù)權(quán)利要求l所述的用于從音頻信號中產(chǎn)生環(huán)境信號的設(shè)備、根據(jù)權(quán)利要求20、27或28所述的用于從音頻信號中導(dǎo)出多聲道音頻信號的設(shè)備、根據(jù)權(quán)利要求25所述的用于從音頻信號中產(chǎn)生環(huán)境信號的方法、根據(jù)權(quán)利要求26、29或30所述的用于從音頻信號中導(dǎo)出多聲道音頻信號的方法以及根據(jù)權(quán)利要求31所述的計算機(jī)程序來實現(xiàn)的。本發(fā)明提供一種用于從音頻信號中產(chǎn)生環(huán)境信號的設(shè)備,包括通過對音頻信號的表示進(jìn)行有損壓縮,以獲得描述壓縮音頻信號的音頻信號的壓縮表示的裝置。該用于產(chǎn)生環(huán)境信號的設(shè)備還包括用于計算音頻信號的壓縮表示和音頻信號的表示之間的差值以獲得差別表示(discriminationrepresentation)的裝置。該用于產(chǎn)生環(huán)境信號的設(shè)備還包括使用差別表示來提供環(huán)境信號的裝置。本發(fā)明的關(guān)鍵思想在于,通過確定音頻信號的壓縮表示和音頻信號的原始表示之間的差值,可以以特別有效的方式從音頻信號中產(chǎn)生環(huán)境信號,其中所述音頻信號的壓縮表示是通過對音頻信號的原始表示進(jìn)行有損壓縮來產(chǎn)生的。這就是說,已經(jīng)表明,在使用有損壓縮時,原始音頻信號與由原始音頻信號通過有損壓縮獲得的有損壓縮的音頻信號之間的差值實質(zhì)上描述了環(huán)境信號(即例如,似噪音信號或似環(huán)境信號或不可定位的信號)。換言之,在執(zhí)行有損壓縮時,音頻信號的壓縮表示實質(zhì)上包括可定位的聲音事件或直射聲音事件。這是基于以下事實可定位聲音事件特別常常表現(xiàn)出尤其高的能量以及尤其特有的波形。因此,優(yōu)選地對可定位信號進(jìn)行有損壓縮處理,以使得壓縮后的表示實質(zhì)上包括具有高能量或特有波形的可定位信號。然而,在有損壓縮中,不可定位的環(huán)境信號典型地不會展現(xiàn)出任何尤其特有的波形,與可定位信號相比,其壓縮后的表示在較小程度上表示了不可定位的環(huán)境信號。因此,已經(jīng)認(rèn)識到,音頻信號的有損壓縮方式的表示與音頻信號的原始表示之間的差值實質(zhì)上描述了音頻信號的不可定位部分。此外,已經(jīng)認(rèn)識到,使用音頻信號的有損壓縮方式的表示與音頻信號的原始表示之間的差值作為環(huán)境信號能夠產(chǎn)生特別好的聽覺印象。換言之,已經(jīng)認(rèn)識到,音頻信號的有損壓縮典型地沒有或僅在非常小的程度上包含音頻信號的環(huán)境信號部分,因此,特別地,音頻信號的原始表示和音頻信號的有損壓縮方式的表示之間的差值很好地近似于音頻信號的環(huán)境信號部分。因此,權(quán)利要求l所限定的本發(fā)明的概念適于從音頻信號中對環(huán)境信號部分進(jìn)行盲提取。本發(fā)明概念特別的優(yōu)勢在于,甚至可以在不存在任何額外輔助信息的情況下,從單聲道信號中提取環(huán)境信號。此外,本發(fā)明的概念由算法上較為簡單的步驟組成,即執(zhí)行有損壓縮,并計算音頻信號的有損壓縮方式的表示和音頻信號的原始表示之間的差值。此外,本發(fā)明方法的優(yōu)勢在于,未將任何合成音頻效果引入環(huán)境信號。因此,環(huán)境信號可以沒有在用于產(chǎn)生環(huán)境信號的傳統(tǒng)方法的情況下可能出現(xiàn)的混響。此外,應(yīng)該注意,以本發(fā)明方式產(chǎn)生的環(huán)境信號典型地不再具有任何如有損壓縮情況下可能干擾聽覺印象的高能量部分,這樣的高能量部分包含在音頻信號的有損壓縮方式的表示中,因此在音頻信號的有損壓縮方式的表示和原始表示之間的差值中不出現(xiàn)或很少出現(xiàn)。換言之,根據(jù)本發(fā)明,環(huán)境信號正好包含那些在有損壓縮情況下被認(rèn)為對信息內(nèi)容的表示不必要的部分。然而,該信息正好表示了背景噪聲。因此,本發(fā)明的概念使用有損壓縮,實現(xiàn)了可定位信息與背景噪聲的可靠分離,其中將作為被有損壓縮抑制和/或去除的背景噪聲用作環(huán)境信號。本發(fā)明還提供了一種用于從音頻信號中導(dǎo)出多聲道音頻信號的設(shè)備,所述多音頻信號包括前置揚(yáng)聲器信號和后置揚(yáng)聲器信號。這里,用于導(dǎo)出多聲道音頻信號的設(shè)備包括如上所述的用于從音頻信號中產(chǎn)生環(huán)境信號的設(shè)備。該用于產(chǎn)生環(huán)境信號的設(shè)備被配置為接收音頻信號的表示。所述用于導(dǎo)出多聲道音頻信號的設(shè)備還包括用于提供該音頻信號或從該音頻信號中導(dǎo)出的音頻信號作為前置揚(yáng)聲器信號的設(shè)備;以及后置揚(yáng)聲器信號提供設(shè)備,用于提供由用于產(chǎn)生環(huán)境信號的設(shè)備所提供的環(huán)境信號或從該環(huán)境信號中導(dǎo)出的信號作為后置揚(yáng)聲器信號。換言之,所述用于導(dǎo)出多聲道音頻信號的設(shè)備使用由用于產(chǎn)生環(huán)境信號的設(shè)備所產(chǎn)生的環(huán)境信號作為后置揚(yáng)聲器信號,而所述用于導(dǎo)出多聲道音頻信號的設(shè)備還使用原始音頻信號作為前置揚(yáng)聲器信號或作為前置揚(yáng)聲器信號的基礎(chǔ)。因此,作為一個整體而言,所述用于導(dǎo)出多聲道音頻信號的設(shè)備能夠基于單個原始音頻信號來產(chǎn)生多聲道音頻信號中的前置揚(yáng)聲器信號和后置揚(yáng)聲器信號。因此,原始音頻信號用于提供前置揚(yáng)聲器信號(或甚至直接表示前置揚(yáng)聲器信號),而原始音頻信號的有損壓縮方式的表示和原始音頻信號的表示之間的差值用于產(chǎn)生后置揚(yáng)聲器信號(或甚至直接表示后置揚(yáng)聲器信號)。此外,當(dāng)考慮到其功能時,本發(fā)明提供與本發(fā)明設(shè)備相對應(yīng)的方法。本發(fā)明還提供了實現(xiàn)本發(fā)明方法的計算機(jī)程序。另外,優(yōu)選地,本發(fā)明的特別有利的實施例由所附權(quán)利要求限定。以下將結(jié)合附圖對本發(fā)明的優(yōu)選實施例進(jìn)行討論,在附圖中圖l是根據(jù)本發(fā)明的實施例的用于從音頻信號中產(chǎn)生環(huán)境信號的本發(fā)明的設(shè)備的方框圖2是根據(jù)本發(fā)明的實施例的用于從音頻信號中產(chǎn)生環(huán)境信號的、本發(fā)明的設(shè)備的方框圖3是根據(jù)本發(fā)明的實施例的用于從音頻信號中產(chǎn)生環(huán)境信號的本發(fā)明的設(shè)備的詳細(xì)方框圖;圖4a是通過兩個矩陣的乘積來對矩陣進(jìn)行近似表示的典型表示;圖4b是矩陣X的示意性表示;圖5是根據(jù)本發(fā)明的實施例的用于從音頻信號中導(dǎo)出多聲道音頻信號的本發(fā)明的設(shè)備的方框圖6是根據(jù)本發(fā)明的實施例的用于從音頻信號中創(chuàng)建環(huán)境信號的牟次明H'、J力汰tTJ孤禾主閨;圖7是在立體聲回放概念中的聽覺印象的示意性表示;圖8是在直射/環(huán)境概念中的聽覺印象的示意性表示;以及圖9是在圍繞概念中的聽覺印象的示意性表示。具體實施例方式圖l示出了根據(jù)本發(fā)明的實施例的用于從音頻信號中產(chǎn)生環(huán)境信號的本發(fā)明的設(shè)備的方框圖。根據(jù)圖1的設(shè)備其整體標(biāo)記為100。設(shè)備100用于接收以基本上任意選擇的表示方式所表示的音頻信號。換言之,設(shè)備100接收音頻信號的表示。設(shè)備100包括用于對音頻信號或音頻信號表示進(jìn)行有損壓縮的裝置IIO。裝置110被配置為接收音頻信號表示108。裝置110從音頻信號的(原始)表示108中產(chǎn)生音頻信號的有損壓縮方式的表示112。設(shè)備100還包括用于計算音頻信號的有損壓縮方式的音頻信號表示112和(原始)表示108之間的差值的裝置120。因此,裝置120被配置為接收音頻信號的有損壓縮方式的表示112,此外還接收音頻信號的(原始)表示108?;谝纛l信號的(原始)表示108和音頻信號的有損壓縮方式的表示112,裝置120計算差別表示122,該差別表示122描述了音頻信號的(原始)表示108與音頻信號的有損壓縮方式的表示112之間的差值。設(shè)備100還包括用于使用差別表示122和/或基于差別表示122和/或作為差別表示122的函數(shù)來提供環(huán)境信號132的裝置130。基于以上對設(shè)備100的結(jié)構(gòu)描述,以下簡要描述設(shè)備100的操作。設(shè)備100接收音頻信號的表示108。裝置110產(chǎn)生音頻信號的有損壓縮方式的表示112。裝置120計算差別表示122,該差別表示122描述了音頻信號的表示108與音頻信號的有損壓縮方式的表示112之間的差值,禾口/或是上述差值的函數(shù)。換言之,差別表示122描述了由表示108所描述的(原始)音頻信號中被用于有損壓縮的裝置110去除和/或不在音頻信號的有損壓縮方式的表示112中回放的信號部分。典型地,由于正是那些展現(xiàn)出不規(guī)則曲線的信號部分被裝置110去除和/或不在音頻信號的有損壓縮方式的表示112中回放,因此,差別表示122正好描述了那些具有不規(guī)則曲線或不規(guī)則能量分布的信號部分,即例如似噪聲信號部分。典型地,由于對于收聽者特別重要的直射部分和/或"可定位信號部分"將由前置揚(yáng)聲器(而不由"后置"揚(yáng)聲器)回放,因此,考慮到這一點,差別表示122適應(yīng)于音頻回放的要求。因而,以實質(zhì)上未受損的方式,將原始音頻信號中的直射部分和/或可定位部分包含在音頻信號的有損壓縮方式的表示112中,并因此如期望的那樣,在差別表示122中實質(zhì)上抑制了這些部分。另一方面,在音頻信號的有損壓縮方式的表示112中,減少了具有不規(guī)則分布的能量和/或很弱可定位性的信息部分。其原因在于,在如用于有損壓縮的裝置110所執(zhí)行的有損壓縮中,將具有規(guī)則分布的能量和/或具有高能量的信息攜帶至音頻信號的有損壓縮方式的表示112,而以衰減的形式或僅以微弱的程度將(原始)音頻信號中具有不規(guī)則分布的能量和/或低能量的部分?jǐn)y帶至音頻信號的有損壓縮方式的表示112。因此,通過在有損壓縮情況下對音頻信號中具有不規(guī)則能量分布的信號部分和/或具有低能量的信號部分進(jìn)行衰減,差別表示112仍然包括相對較大部分的低能量信號部分和/或具有不規(guī)則分布的能量的信號部分。正是這些由差別表示122所描述的能量不是非常充足的信號部分和/或具有不規(guī)則分布的能量的信號部分在回放(通過后置揚(yáng)聲器)中表示了產(chǎn)生特別好和令人愉快的聽覺印象的信息??偠灾?,在差別表示122中,抑制或衰減了具有規(guī)則分布的能量的信號部分(即例如可定位信號)。相反,在差別表示122中,不抑制和衰減具有不規(guī)則分布的能量的信號部分(如不可定位的信號)。因此,在差別表示中,與具有規(guī)則分布的能量的信號部分相比,加強(qiáng)或強(qiáng)調(diào)了具有不規(guī)則分布的能量的信號部分。因此,差別表示特別適于作為環(huán)境信號。換言之,在優(yōu)選實施例中,通過有損壓縮,任何在時頻表示中重復(fù)出現(xiàn)的內(nèi)容都得到了很好的近似。例如,這里規(guī)則的能量分布指的是在時頻表示中產(chǎn)生重現(xiàn)圖案的能量分布或在時頻表示中產(chǎn)生能量局部集中的能量分布。例如,不規(guī)則的能量分布是時頻表示中不產(chǎn)生任何重現(xiàn)圖案,也不產(chǎn)生能量局部集中的能量分布。換言之,在優(yōu)選實施例中,環(huán)境信號實質(zhì)上包括具有非結(jié)構(gòu)化的能量分布的信號部分(例如在時頻分布中非結(jié)構(gòu)化),而音頻信號的有損壓縮方式的表示實質(zhì)上包括具有結(jié)構(gòu)化的能量分布的信號部分(例如,在如上所述的時頻表示中結(jié)構(gòu)化)。因此,基于差別表示122來提供環(huán)境信號的裝置130提供了特別適于人類收聽者的期望的環(huán)境信號。例如,用于有損壓縮的裝置110也可以是MP3音頻壓縮器、MP4音頻壓縮器、ELP音頻壓縮器或SPR音頻壓縮器。以下參照圖2和3,更詳細(xì)地描述了本發(fā)明的實施例。出于這個目的,圖2示出了根據(jù)本發(fā)明的實施例的用于從音頻信號中產(chǎn)生環(huán)境信號的本發(fā)明的設(shè)備的方框圖。此外,圖3示出了根據(jù)本發(fā)明的實施例的用于從音頻信號中產(chǎn)生環(huán)境信號的本發(fā)明的設(shè)備的詳細(xì)方框圖。根據(jù)圖2的設(shè)備其整體標(biāo)記為200,根據(jù)圖3的設(shè)備其整體標(biāo)記為300。例如,設(shè)備200用于接收以時間表示x[n]的形式出現(xiàn)的輸入信號208。典型地,輸入信號208描述音頻信號。裝置200包括時頻分布提供器210。時頻分布提供器210被配置為從以時間表示x[n]的形式出現(xiàn)的輸入信號208中產(chǎn)生時頻分布(TFD)。應(yīng)該注意到,時頻分布提供器210是可選的。這就是說,時頻表示的表示212也可用作設(shè)備200的輸入信號,使得在這種情況下可以省略從作為時間信號出現(xiàn)的輸入信號208(x[n])至?xí)r頻分布的表示212的轉(zhuǎn)換。還應(yīng)該注意到,例如,時頻分布的表示212可以以時頻分布矩陣的形式出現(xiàn)。還應(yīng)該注意到,例如,以下將更詳細(xì)解釋的矩陣X(co,k)或矩陣IX(co,k)l可以用作時頻分布的表示212。裝置200還包括近似裝置220,被配置為接收時頻分布的表示212,并產(chǎn)生時頻表示212的近似表示222,與表示212相比,近似表示222典型地經(jīng)過了有損壓縮。換言之,用于近似的裝置220例如使用數(shù)值優(yōu)化方法(以下將更詳細(xì)地進(jìn)行描述)來形成時頻分布212的近似或近似表示222。然而,假定所述近似使得時頻分布的(原始)表示212(是音頻信號的原始表示)與時頻分布的近似表示222之間產(chǎn)生偏差。在本發(fā)明的一個實施例中,時頻分布的原始表示212和近似表示222之間的差值基于以下事實用于近似的裝置220優(yōu)選地被配置為執(zhí)行有損近似,其中展現(xiàn)出規(guī)則能量分布和/或攜帶較大信號能量的信號部分優(yōu)選被攜帶至近似表示中,而與具有規(guī)則分布的能量和/或較大信號能量的信號部分相比,在近似表示222中衰減或抑制了展現(xiàn)出相對不規(guī)則分布的能量和/或相對較低的信號能量的信號部分。設(shè)備200還包括差值確定器230,被配置為接收時頻分布的原始表示212以及時頻表示的近似表示222,以基于原始表示212和近似表示222之間的差值來產(chǎn)生差別表示232,差別表示232實質(zhì)上描述了原始表示212和近似表示222之間的差值,和/或是原始表示212和近似表示222之間的差值的函數(shù)。以下將解釋與差別表示232的計算相關(guān)的細(xì)節(jié)。設(shè)備200還包括重新合成裝置240。重新合成裝置240被配置為接收差別表示232,以基于差別表示232來產(chǎn)生重新合成的信號242。例如,重新合成裝置可以被配置為將以時頻分布形式出現(xiàn)的差別表示232轉(zhuǎn)換為時間信號242。還應(yīng)該注意到,重新合成裝置240是可選的,如果需要對差別表示232(例如以時頻分布的形式出現(xiàn))進(jìn)行直接重新處理,則可以省略重新合成裝置240。裝置200還包括可選裝置250,用于組裝多聲道音頻信號和/或后處理。例如,裝置250被配置為從用于重新合成的裝置240接收重新合成的信號242,并根據(jù)重新合成的信號242來產(chǎn)生多個環(huán)境信號252、254(也表示為a,[n]、...、ak[n])。以下將更詳細(xì)地解釋多個環(huán)境信號252、254的產(chǎn)生??偠灾?,己經(jīng)表明,本發(fā)明實質(zhì)上關(guān)注環(huán)境信號的計算。圖2的方框圖用于提供根據(jù)本發(fā)明的實施例的本發(fā)明的概念、本發(fā)明的設(shè)備和本發(fā)明的方法的簡要概述。本發(fā)明的概念可以簡短概括如下在用于確定時頻分布的(可選)裝置210中(可選地)計算輸入信號208(x[n])的時頻分布212(TFD)。以下將對該計算進(jìn)行更詳細(xì)的解釋。例如,使用數(shù)值近似方法(以下將進(jìn)行更詳細(xì)的描述)來計+厶、/上D-aaazr"i、n_LiKr:/V^*a/mm、、r">/,、I八八/t^|4j門異布u/vi曰5么u6、x(nj乂tfj口、j歹j/rzr鄰z丄z、iru乂tfjjiriwzzu。'iyU》口,口J在用于近似的裝置220中執(zhí)行該計算。通過計算輸入信號208(x[n])的時頻分布212(TFD)及其近似212之間的區(qū)別或差值(例如在用于計算差值的裝置230中),能夠獲得對環(huán)境信號的時頻分布(TFD)的估計232。基于此,執(zhí)行環(huán)境信號的時間信號242的重新合成(例如在可選的重新合成裝置240中)。以下將對重新合成進(jìn)行更詳細(xì)的解釋。此外,可選地使用后處理(例如在用于組裝多聲道音頻信號和/或用于后處理的可選裝置250中實現(xiàn)),以改進(jìn)導(dǎo)出的多聲道信號(例如包括環(huán)境信號252、254)的聽覺印象。以下還將對該可選的后處理進(jìn)行更詳細(xì)的解釋。以下將對與圖2的情況下所示的各個處理步驟相關(guān)的細(xì)節(jié)進(jìn)行解釋。在這樣做的過程中,還參考圖3,圖3示出了用于從音頻信號中產(chǎn)生環(huán)境信號的本發(fā)明的設(shè)備的更詳細(xì)的方框圖。例如,根據(jù)圖3的設(shè)備300被配置為接收以時間連續(xù)輸入信號x(t)的形式或以時間離散輸入信號x[n]的形式出現(xiàn)的輸入信號308。此外,輸入信號308與設(shè)備200的輸入信號208相對應(yīng)。設(shè)備300還包括時間信號至?xí)r頻分布轉(zhuǎn)換器310。時間信號至?xí)r頻分布轉(zhuǎn)換器310被配置為接收輸入信號308并提供時頻分布(TFD)的表示312。此外,時頻分布(TFD)的表示312實質(zhì)上與設(shè)備200中時頻分布的表示212相對應(yīng)。還應(yīng)該注意到,以下也將該時頻分布表示為X(co,k)。還應(yīng)該注意到,時頻分布X(co,k)還可以是設(shè)備300的輸入信號,即可以省略設(shè)備310。設(shè)備300還(可選地)包括幅度-相位分離器314。當(dāng)時頻分布312可以采用復(fù)數(shù)(不是純粹的實數(shù))值時,優(yōu)選使用幅度-相位分離器314。在這種情況下,幅度-相位分離器314優(yōu)選地被配置為基于時頻分布312來提供時頻分布312的幅度表示316以及時頻分布312的相位表示318。此外,時頻分布312的幅度表示也標(biāo)記為IX(,k)I。應(yīng)該注意到,時頻分布312的幅度表示316可以替代設(shè)備200中的表示212。還應(yīng)該注意到,對時頻分布312的相位表示318的使用是可選的。還應(yīng)該主意到,在一些情況下,時頻分布312的相位表示318也標(biāo)記為())(co,k)。還假定時頻分布312的幅度表示316以矩陣的形式出現(xiàn)。設(shè)備300還包括矩陣近似器320,被配置為通過兩個矩陣的W、H(以下將描述)的乘積來近似時頻分布312的幅度表示316。矩陣近似器320實質(zhì)上與設(shè)備200中使用的用于近似的裝置220相對應(yīng)。因此,矩陣近似器320接收時頻分布312的幅度表示316,并提供幅度表示316的近似322。在一些情況下,近似322也標(biāo)記為i(",k)。此外,近似322與圖2中的近似表示222相對應(yīng)。設(shè)備300還包括接收幅度表示316和近似322的差值形成器330。此外,差值形成器330提供差別表示332,差別表示332實質(zhì)上與以下描述的表示IA(co,k)|相對應(yīng)。此外,應(yīng)該注意到,差別表示332還實質(zhì)上與設(shè)備200中的差別表示232相對應(yīng)。設(shè)備300還包括相位添加器334,相位添加器334接收差別表示332和相位表示318,并因此將相位表示318所描述的相位添加到差別表示332的元素中。因此,相位添加器334提供了具有相位的差別表示336,差別表示336也標(biāo)記為A(co,k)。應(yīng)該注意到,相位添加器可以被認(rèn)為是可選的,因此,例如,如果省略了相位添加器,則可以使用具有相位的差別表示336來替代差別表示332。還應(yīng)該注意到,根據(jù)每一種具體情況,差別表示332和具有相位的差別表示336都可以與差別表示232相對應(yīng)。設(shè)備300還包括(可選的)時頻分布至?xí)r間信號轉(zhuǎn)換器340。(可選的)時頻分布至?xí)r間信號轉(zhuǎn)換器340被配置為接收具有相位的差別表示336(可選地差別表示332),并提供形成環(huán)境信號的時域表示(或時間信號表示)的時間信號342(也標(biāo)記為a(t)或a[n])。還應(yīng)該注意到,時頻分布至?xí)r間信號轉(zhuǎn)換器340實質(zhì)上與根據(jù)圖2的重新合成裝置240相對應(yīng)。此外,由時頻分布至?xí)r間信號轉(zhuǎn)換器340提供的信號342實質(zhì)上與設(shè)備200中所示的信號242相對應(yīng)。輸入信號的時頻分布以下描述計算輸入信號的時頻分布(TFD),即例如表示212、312的方式。時頻分布(TFD)是時間信號(即例如輸入信號208或輸入信號308)對時間和頻率的表示和/或示意。在時頻分布的多種公式表示中(例如使用濾波器組或離散余弦變換(DCT)),短時傅里葉變換(STFT)是一種用于計算時頻分布的靈活且計算效率較高的方法。將短時傅里葉變換(STFT)X(co,k)計算為離散時間信號x[n](即例如,輸入信號208、308)的加窗數(shù)據(jù)段的傅里葉變換序列,其中co是頻率箱或頻率索引,k是時間索引。因此,以下為真這里,w[n]表示窗函數(shù)。索引m與幀索引(或時間索引)k的關(guān)系是窗長度和相鄰窗重疊量的函數(shù)。如果時頻分布(TFD)是復(fù)數(shù)值(例如在使用短時傅里葉變換(STFT)的情況下),則在優(yōu)選實施例中,可以使用時頻分布(TFD)的系數(shù)的絕對值來進(jìn)行進(jìn)一步的計算。該時頻分布(TFD)的系數(shù)的絕對值和/或幅度也標(biāo)記為IX(",k)I。在這種情況下,在重新合成階段存儲相位信息())(co,k)=ZX(",k)以待后用。應(yīng)該注意到,在設(shè)備300中,幅度表示IX(",k)|標(biāo)記為316。相位信息(|)(co,k)標(biāo)記為318。應(yīng)該注意到,X(",k)表示通過例如STFT獲得的各個傅里葉系數(shù)(一般地時頻分布的各個系數(shù))。相反,X(co,k)表示包含多個系數(shù)(",k)的矩陣。例如,對于w,=1、2、...、n以及k,=kl、kl+l、…、kl+m-l,矩陣X(w,k,)包含系數(shù)X(co,,k,)。這里,n是矩陣X(",k。的第一維(例如多個行),m是矩陣X(",k,)的第二維。因此,對于矩陣X(",k,)中的元素Xi,j,以下為真<formula>formulaseeoriginaldocumentpage25</formula>這里,以下為真<formula>formulaseeoriginaldocumentpage25</formula>此外,在圖4b中示出了所述的環(huán)境。換言之,矩陣X(",k,)包括多個時頻分布值X(",k,)。還應(yīng)該注意到,以下除非另外表示,否則矩陣幅度(標(biāo)記為ixi)的計算表示逐元素的幅度形成。時頻分布(TFD)的近似在本發(fā)明的情況下,根據(jù)實施例,使用數(shù)值優(yōu)化方法來計算輸入信號的時頻分布的近似。以下描述時間頻率分布的近似以及數(shù)值優(yōu)化方法。在將近似的誤差最小化的數(shù)值優(yōu)化方法的幫助下,導(dǎo)出矩陣X(",k)的近似文(",k)。這里,最小化是指具有不超過50%,優(yōu)選地不超過20%的相對誤差的最小化。此外,最小化可以是確定絕對或局部的最小值。此外,在距離函數(shù)或散度函數(shù)(divergencefunction)的幫助下測量近似誤差。距離和散度之間的差異與數(shù)學(xué)性質(zhì)有關(guān),并基于以下事實在對于兩個矩陣A、B之間的距離以下為真d(A,B)=d(B,A)的意義上,距離是對稱的。與之相反,散度是非對稱的。應(yīng)該注意到,例如,可以通過近似裝置220或矩陣近似器320來進(jìn)行以下描述的時頻分布或時頻分布矩陣X(",k)的近似。還應(yīng)該注意到,對于近似的計算,非負(fù)矩陣分解(NMF)是一種適合的方法。非負(fù)矩陣分解(NMF)以下描述非負(fù)矩陣分解。非負(fù)矩陣分解(NMF)是一種將具有非負(fù)元素的矩陣VeR",近似為兩個矩陣WeR皿和He化,的乘積的近似。這里,針對矩陣W的元素Wi,k和矩陣H的元素Hi,k,以下為真Wi,k》0;以及Hi,k>0。換言之,確定矩陣W和H,使得以下為真VsWH逐元素的對此進(jìn)行表達(dá),以下為真C(WH)a=lXA,*(2)如果分解的秩r滿足以下條件(n+m)r<nm則乘積WH是V的數(shù)據(jù)壓縮后的表示(參見[8])。等式(2)的直觀解釋如下矩陣VeRnxm近似為列矢量^和行矢量5的r個外積之和,其中以下為真ie[1,r],^eR^以及6eR^。在圖4a中以簡單的示例表示了所描述的主題。換言之,圖4a示出了具有分解秩r=2的非負(fù)矩陣分解(NMF)的示意性示例。通過解決對測量近似誤差的代價函數(shù)c:f(V,WH)進(jìn)行最小化的優(yōu)化問題來計算因子W和H。換言之,代價函數(shù)c測量近似的誤差,即矩陣V和WH之間的距離(和/或散度)。兩個矩陣A和B之間的合適距離測量是以其逐元素差值表示的Frobenius范數(shù)DF(A,B)(等式3):D,(A,B)+U(4廣&)2(3)Frobenius范數(shù)對于不相關(guān)的高斯分布數(shù)據(jù)是理想的(參見[9])。換言之,在優(yōu)選實施例中,計算代價函數(shù)c,其中以下為真-c=DF(X((d,k),X(^a))換言之,將近似:k(w,"計算為兩個矩陣w和H的乘積,其中X(一=WH。其它已知的誤差函數(shù)是廣義Kullback-Leibler散度(GKLD)(等式4)。廣義Kullback-Leibler散度(GKLD)與泊松分布(參見[9])或指數(shù)分布更加相關(guān),因此甚至更適于音樂音頻信號的量或幅度譜的近似。兩個矩陣A和B之間的廣義Kullback-Leibler散度的定義如下(A,B)二2。'5(4)此外,Aij和B,j分別是矩陣A和B的項或矩陣元素。換言之,可以如下選擇代價函數(shù)c:c=DGKL(X,X=WH)以下描述如何確定近似矩陣W和H中的項。通過應(yīng)用以下更新規(guī)則和/或迭代規(guī)則,稱為梯度下降的簡單數(shù)值優(yōu)化技術(shù)迭代地逼近代價函數(shù)f(X)的局部(或全局)最小值X(5)其中,a為步長,V/(X)為代價函數(shù)的梯度。為了使用根據(jù)等式(3)的代價函數(shù)來解決根據(jù)等式(2)的優(yōu)化問題,通過以下等式給出了加性更新規(guī)則或迭代規(guī)則WrWH(6)巧,^+"VHT)—(WHHT(7)在本發(fā)明的算法的情況下,在一個實施例中以下為真V=X(,k)還應(yīng)該注意到,Lee和Seimg已經(jīng)發(fā)現(xiàn)或識別出了根據(jù)等式(8)和(9)的乘性更新規(guī)則或迭代規(guī)則(參見[IO])。此外,Lee和Seung已示出了乘性更新規(guī)則與梯度下降方法及其收斂的關(guān)系。該乘性更新規(guī)則如下wik—wik(VHT)(8)(9)再一次地,在一個優(yōu)選的實施例中,以下為真:27V=X(,k)梯度下降方法的速度和魯棒性極大地依賴于步長或步寬OC的正確選擇。乘性更新規(guī)則相對于梯度下降方法的一個主要優(yōu)勢在于其獨立于步長或步寬的選擇。該過程和方法易于實現(xiàn)、計算效率較高并能夠保證找到代價函數(shù)的局部最小值。環(huán)境分離的情況下的非負(fù)矩陣分解(NMF)在本方法的情況下,非負(fù)矩陣分解(NMF)用于計算輸入音頻信號x[n]的量或幅度譜圖IX(co,k)l的近似。與之相關(guān)地,應(yīng)該注意到,通過執(zhí)行逐元素的幅度形成,從矩陣X(co,k)中導(dǎo)出幅度譜圖lX(co,k)I。換言之,對于IX(co,k)l中具有索引i,j的、標(biāo)記為IX(co,k)lij的元素,以下為真|X(co,k)hj叫X(co,k)J這里,X(co,k)ij表示矩陣X(,k)中具有索引i和j的元素。此夕卜,l.l表示幅度形成操作。IXI的非負(fù)矩陣分解(NMF)產(chǎn)生了因子W和H。在優(yōu)選實施例中,根據(jù)信號長度和信號內(nèi)容,所述近似需要在40和100之間的較大分解秩r來表示充分?jǐn)?shù)量的直射聲音或直射噪聲??偠灾?,已經(jīng)示出,通過上述非負(fù)矩陣分解,實質(zhì)上實現(xiàn)了時頻分布的近似表示,例如在根據(jù)圖2的設(shè)備200中其標(biāo)記為222,或此夕卜,在根據(jù)圖3的設(shè)備300中標(biāo)記為322或義(",k)。通過計算時頻分布X的量或者幅度表示IXI與其近似WH之間的差值,基本上導(dǎo)出了環(huán)境信號的量或幅度譜圖IAI,如等式(10)所表示IAI叫X卜WH(10)然而,如以下將進(jìn)行解釋的,在優(yōu)選實施例中,不直接考慮根據(jù)等式10的結(jié)果。這就是說,對于上述對代價函數(shù)進(jìn)行最小化的近似,等式(10)的應(yīng)用產(chǎn)生了具有負(fù)值元素和正值元素的量或幅度譜圖IAI。然而,在量或幅度譜圖IAI優(yōu)選僅包括正值元素的一個實施例中,優(yōu)選地采用處理差值IX卜WH中的負(fù)值元素的方法。幾種方法可以用于處理負(fù)元素。用于處理負(fù)元素的一種簡單方法在于將負(fù)值乘以0到-l之間的因子(3(卩=0、...、-1)。換言之-1《e《0。這里,3=0對應(yīng)于半波整流,3=-1對應(yīng)于全波整流。以下等式給出了用于計算環(huán)境信號的幅度譜圖或幅值譜圖IAI的一般公式表示|A|ik=3ik'偶畫WH)ik(11)其中+1,0/7^nWw(12)其中,Ye[-l,O]是常數(shù)。應(yīng)該注意到,在以上等式中,IAIik表示幅度譜圖或幅值譜圖IAI中具有索引i和k的矩陣元素。此外,(|X|-WH)ik表示時頻分布的幅度譜圖或幅值譜圖IXI與相關(guān)聯(lián)的近似WKNX之間的差值中具有索引i和k的矩陣元素。此外,(WH)ik表示近似WH^x中具有索引i和k的矩陣元素。|X|ik是量或幅度譜圖lXI中具有索引i和k的矩陣元素。因此,從等式(11)和(12)中可以看出,在優(yōu)選實施例中,逐元素地確定因子Pik和/或?qū)Σ钪?IX卜WH)中項的整流。以下描述用于確定環(huán)境信號的量或幅度譜圖IAI的可選方法。根據(jù)以下等式首先確定環(huán)境信號的量或幅度譜圖IAI:IAI叫X卜e■WH其中O《c《1,并隨后在所確定的矩陣IAI中進(jìn)行負(fù)元素的全波整流,從而獲得簡單的可選方法。這里,與包含在環(huán)境信號中的直射信號相比,參數(shù)C有利于設(shè)置和/或控制環(huán)境信號的量。應(yīng)該注意到,與參考等式(11)和(12)所描述的過程相反,在對矩陣IAI的計算中,最后描述的過程涉及以下效果大量直射聲音或直射噪聲在環(huán)境信號中出現(xiàn)。因此,典型地,在等式(11)和(12)的情況下描述的過程是優(yōu)選的。此外,存在用于確定矩陣IAj的第三可選過程,將在隨后對其進(jìn)行描述。該第三可選方法在于,在代價函數(shù)中加入邊界約束或邊界條件以影響以下項中的負(fù)值元素的量或值<formula>formulaseeoriginaldocumentpage30</formula>換言之,正確選擇與代價函數(shù)相關(guān)的邊界約束或邊界條件可以用于實現(xiàn)例如在差值<formula>formulaseeoriginaldocumentpage30</formula>中出現(xiàn)盡可能少的負(fù)值(可選地盡可能少的正值)。換言之,對用于確定矩陣W和H中的項的優(yōu)化方法進(jìn)行適配,以使得所述差值優(yōu)選地包括正值和/或相對較少的負(fù)值(或反之)。新的代價函數(shù)<formula>formulaseeoriginaldocumentpage30</formula>可以用如下公式表:<formula>formulaseeoriginaldocumentpage30</formula>這里,s是確定邊界約束或邊界條件對總代價(或代價函數(shù)c的總值)的影響的常數(shù)。通過在等式(5)中插入微分運(yùn)算符&/^[(根據(jù)公式14)和微分運(yùn)算符3c/3W,導(dǎo)出梯度下降的更新規(guī)則和/或迭代規(guī)則。對于微分運(yùn)算符Sc/3H和Sc/3W,以下為真<formula>formulaseeoriginaldocumentpage30</formula>此外,應(yīng)該注意到,因為易于實現(xiàn)并提供良好的結(jié)果,關(guān)于等式(11)和(12)所描述的過程是優(yōu)選的。總而言之,已經(jīng)示出了,例如通過本發(fā)明優(yōu)選實施例中的差值確定裝置230或差值形成器330,可以執(zhí)行上述對矩陣IAI的確定,針對該確定描述了三種不同的方法。時間信號的重建以下描述如何從環(huán)境信號的幅度表示lA(wJ)l(也標(biāo)記為332)中獲得具有相位信息的表示A(co,k)(也標(biāo)記為336)。使用輸入信號308(也標(biāo)記為x(t),x[n])的時頻分布(TFD)X的相位p二ZX來計算環(huán)境信號的復(fù)數(shù)譜圖A(①,k)。A(oj,k)叫A(co,k)i'[cos(-(",k))+j.sin("",k))](16)這里,例如,小是角度值的矩陣。換言之,將時頻分布(TFD)X的相位信息或角度信息逐元素添加到量或幅度表示lAl。換言之,例如通過與幅度為l的相應(yīng)復(fù)數(shù)相乘,將具有行索引i和列索引j的項或矩陣元素Xi,j的相位信息添加至具有行索引i和列索引j的項或矩陣項Ai,j。總的結(jié)果是具有相位信息的環(huán)境信號的表示A((D,k)(標(biāo)記為336)。然后,通過對A(co,k)進(jìn)行計算時頻分布(TFD)的反過程,從具有相位信息的表示A(co,k)中(可選地)導(dǎo)出環(huán)境信號a[n](或環(huán)境信號的時間離散表示,或環(huán)境信號的時間連續(xù)表示)。這就是說,例如通過反短時傅里葉變換來處理具有相位信息的表示A(co,k),該反短時傅里葉變換使用重疊相加的方案,當(dāng)應(yīng)用至X(co,k)時,產(chǎn)生時間信號x[n]。此外,將所描述的過程應(yīng)用于各具有幾秒長度的重疊段。使用Hami窗對這些段進(jìn)行加窗,以確保相鄰段之間的平滑過渡。還應(yīng)該注意到,例如,可以在用于重新合成的裝置240或時頻分布至?xí)r間信號轉(zhuǎn)換器340中執(zhí)行最后描述的用于導(dǎo)出環(huán)境信號的時間表示a[n]的過程。多聲道音頻信號的組裝通過將環(huán)境信號饋送至后置聲道(即例如至少左后置聲道或右后置聲道,或左后置聲道和右后置聲道),獲得了5.0信號或5.0音頻信號(即例如,包括左后置聲道、前置中心聲道以及右前置聲道、左后置聲道和右后置聲道的音頻信號)。在優(yōu)選實施例中,前置聲道(即例如左前置聲道、中心聲道和/或右前置聲道)回放原始信號。這里,例如,增益參數(shù)和/或響度參數(shù)確保了在使用另外的中心聲道時獲得總能量(或?qū)嵸|(zhì)上保持不變)。此外,應(yīng)該注意到,可以在任何多聲道系統(tǒng)和多聲道音頻回放系統(tǒng)中使用所描述的用于產(chǎn)生環(huán)境信號的概念。例如,可以在7.0系統(tǒng)中(例如,在具有三個前置揚(yáng)聲器、兩個側(cè)面揚(yáng)聲器和兩個后置揚(yáng)聲器的系統(tǒng)中)使用本發(fā)明的概念。因而,例如,可以將環(huán)境信號提供給一個或兩個側(cè)面揚(yáng)聲器和/或一個或兩個后置揚(yáng)聲器??蛇x地,在分離環(huán)境信號之后(或在產(chǎn)生環(huán)境信號后),可以執(zhí)行另外的處理,以獲得高感知質(zhì)量的多聲道音頻信號。當(dāng)從單個聲道來組裝多聲道音頻信號時,需要保留前置圖像,同時增加對空間感的印象。例如,這是通過將幾毫秒的延遲引入或添加到環(huán)境信號和/或通過將抑制環(huán)境信號中的瞬變部分來實現(xiàn)的。此外,對饋送至后置揚(yáng)聲器或后方揚(yáng)聲器的信號相互之間和/或相對于饋送至前置揚(yáng)聲器的信號進(jìn)行解相關(guān)是有利的。瞬變信號抑制和/或峰值抑制或沉降操作將用于檢測瞬變信號(和/或峰值或沉降操作(settling叩eration))并用于處理瞬變信號的算法適于各種音頻信號處理應(yīng)用中,以用于數(shù)字音頻效果(參見[ll,12])和用于上混(參見[13])。上混的情況下的瞬變信號的抑制意在保持前置圖像。當(dāng)在環(huán)境信號中出現(xiàn)瞬變噪聲或瞬變聲音時,(如通過收聽者)不會將產(chǎn)生這些瞬變信號的源定位在前方。這是不期望的效果"直射聲源"顯得比在原始信號中更寬(或更加擴(kuò)展),或者甚至更糟糕地,"直射聲源"被感知為位于收聽者后方的獨立"直射聲源"。后置聲道或后方聲道的信號解相關(guān)在文獻(xiàn)中,術(shù)語"解相關(guān)"描述了這樣一種過程對輸入信號進(jìn)行處理,以使得(兩個或更多)輸出信號展現(xiàn)出不同的波形但聽起來和輸入信號一樣(參見[14])。例如,如果由一對揚(yáng)聲器同時回放或呈現(xiàn)兩個相似、相干的寬帶噪聲信號,則將感知到緊湊的聽覺事件(參見[15p。減小兩個聲道信號的相關(guān)性將聲源或噪聲源的感知帶寬或擴(kuò)展增加到感知到兩個分離的源。通常通過相關(guān)系數(shù)Rxy來表達(dá)兩個居中的信號x和y(即均值為0的信號)的相關(guān)性,如等式(17)所描述的<formula>formulaseeoriginaldocumentpage33</formula>這里,y^k)表示與y(k)復(fù)共軛的數(shù)。由于相關(guān)系數(shù)不獨立于信號x和y之間小的延遲,因此通過或使用聲道間相關(guān)r(參見[15])或通過聲道間相干(參見[16])(等式(18)),定義了兩個居中的信號x和y之間的相似度的其他度量。在等式(18)中,如下定義聲道間相關(guān)或聲道間相干r:<formula>formulaseeoriginaldocumentpage33</formula>這里,根據(jù)等式(19)來定義歸一化互相關(guān):(19)解相關(guān)處理的示例是自然混響和幾種信號處理器(效果提升器(flanger)、合唱、移相器、合成混響)。在[17]中描述了音頻信號處理領(lǐng)域中的一種先前的解相關(guān)的方法。這里,通過對輸入信號與輸入信號的延遲版本求和來產(chǎn)生兩個輸出聲道信號,其中在一個聲道中反轉(zhuǎn)了延遲聲道的相位。其它方法通過巻積來產(chǎn)生解相關(guān)信號。通過將輸入信號與根據(jù)給定值彼此相關(guān)的一對脈沖響應(yīng)進(jìn)行巻積,產(chǎn)生具有給定或指定相關(guān)性度量的一對輸出信號(參見[14])。通過使用時變?nèi)V波器(即針對相鄰的時間幀,在其中計算新的隨機(jī)相位響應(yīng)的全通濾波器)來獲得動態(tài)(即時變)的解相關(guān)(參見[18]、[ll])。在[18]中描述了子帶方法,其中在各個頻率段中的相關(guān)性反復(fù)改變的。在這里描述的本發(fā)明的方法的情況下,將解相關(guān)應(yīng)用于環(huán)境信號。在5.1的設(shè)置中(即例如,在具有六個揚(yáng)聲器的設(shè)置中)(然而也在具有至少兩個揚(yáng)聲器的其他設(shè)置中),需要將最終被饋送至兩個后置或后方聲道的環(huán)境信號相對于彼此解相關(guān)至特定程度。本發(fā)明的方法的期望特性是聲場擴(kuò)散(或噪聲場擴(kuò)散、或聲場的展寬或噪聲場的展寬)和包圍感。以下參見圖5,圖5描述了用于從音頻信號中導(dǎo)出多聲道音頻信號的設(shè)備,所述多聲道音頻信號包括前置揚(yáng)聲器信號和后置揚(yáng)聲器信號。根據(jù)圖5的用于導(dǎo)出多聲道音頻信號的設(shè)備其整體標(biāo)記為500。設(shè)備500接收音頻信號508或音頻信號的表示508。設(shè)備500包括用于產(chǎn)生環(huán)境信號的設(shè)備510,其中,設(shè)備510接收音頻信號508或音頻信號的表示508。設(shè)備510提供環(huán)境信號512。應(yīng)該注意到,在優(yōu)選實施例中,設(shè)備510是根據(jù)圖I的設(shè)備IOO。在另外的優(yōu)選實施例中,設(shè)備510是根據(jù)圖2的設(shè)備200。在另外的優(yōu)選實施例中,設(shè)備510是根據(jù)圖3的設(shè)備300。還將可能以時域表示(或時間信號表示)和/或時頻表示的形式出現(xiàn)的環(huán)境信號512饋送至后處理裝置520。后處理裝置520是可選的,例如,可以包括被配置為減少或去除環(huán)境信號512中出現(xiàn)的瞬變信號的脈沖減少器。這里,瞬變信號是高能量信號部分,可以展現(xiàn)出比給定的最大可允許邊緣陡度更大的邊緣陡度。此外,瞬變事件還可以是環(huán)境信號512中的信號峰值,其幅度超過特定的給定最大幅度。此外,后處理裝置520可以(可選地)包括對環(huán)境信號512進(jìn)行延遲的延遲器或延遲裝置。因此,后處理裝置520提供后處理的環(huán)境信號522,例如與(原始的)環(huán)境信號512相比,后處理的環(huán)境信號522中減少或去除了瞬變信號,禾卩/或與(原始的)環(huán)境信號512相比,延遲了后處理的環(huán)境信號522。如果省略了后處理裝置520,則信號522可以與信號512相同。設(shè)備500還(可選地)包括組合器530。例如,如果包括了組合器,則組合器520提供后處理的環(huán)境信號522與原始音頻信號508的(可選地后處理的)版本組合而形成的后置揚(yáng)聲器信號532。如果省略可選的組合器530,則信號532可以與信號522相同。設(shè)備500還(可選地)包括解相關(guān)器540,解相關(guān)器540接收后置揚(yáng)聲器信號532并基于此來提供至少兩個解相關(guān)后的后置揚(yáng)聲器信號542、544。例如,第一后置揚(yáng)聲器信號542可以表示用于左后置揚(yáng)聲器的后置揚(yáng)聲器信號。例如,第二后置揚(yáng)聲器信號544可以表示用于右后置揚(yáng)聲器的后置揚(yáng)聲器信號。例如,在最簡單的情況下(例如,如果省略了后處理裝置520、組合器530和解相關(guān)器540),將設(shè)備510產(chǎn)生的環(huán)境信號512用作第一后置揚(yáng)聲器信號542和/或用作第二后置揚(yáng)聲器信號544。一般地,可以認(rèn)為,考慮到后處理裝置520、組合器530和/或解相關(guān)器540,考慮將設(shè)備510產(chǎn)生的環(huán)境信號512用于產(chǎn)生第一后置揚(yáng)聲器信號542和/或用于產(chǎn)生第二后置揚(yáng)聲器信號544。因此,本發(fā)明明確地包括將設(shè)備510產(chǎn)生的環(huán)境信號512用作第一后置揚(yáng)聲器信號542和/或用作第二后置揚(yáng)聲器信號544。類似地,本發(fā)明還明確地包括將設(shè)備510產(chǎn)生的環(huán)境信號512用于產(chǎn)生第一后置揚(yáng)聲器信號542和/或用于產(chǎn)生第二后置揚(yáng)聲器信號544??蛇x地,該設(shè)備還可以另外被配置為產(chǎn)生第一前置揚(yáng)聲器信號、第二前置揚(yáng)聲器信號和/或第三前置揚(yáng)聲器信號。例如,出于這個目的,將(原始)音頻信號508饋送至后處理裝置550。例如,后處理裝置550被配置為接收和處理音頻信號508,并產(chǎn)生后處理的音頻信號552,例如將后處理的音頻信號552(可選地)饋送至組合器530。如果省略后處理裝置,則信號542可以與信號508相同。此外,信號552形成前置揚(yáng)聲器信號。在優(yōu)選實施例中,設(shè)備500包括信號分離器560,被配置為接收前置揚(yáng)聲器信號552并基于此來產(chǎn)生第一前置揚(yáng)聲器信號562、第二前置揚(yáng)聲器信號564和/或第三前置揚(yáng)聲器信號566。例如,第一前置揚(yáng)聲器信號562可以是位于左前方的揚(yáng)聲器的揚(yáng)聲器信號。例如,第二前置揚(yáng)聲器信號564可以是位于右前方的揚(yáng)聲器的揚(yáng)聲器信號。例如,第三前置揚(yáng)聲器信號566可以是位于前方中心的揚(yáng)聲器的揚(yáng)聲器信號。此外,圖6示出了根據(jù)本發(fā)明的實施例的本發(fā)明的方法的流程圖。根據(jù)圖6的方法其整體標(biāo)記為600。方法600包括第一步驟610。第一步驟610包括音頻信號(或音頻信號的表示)的有損壓縮,以獲得音頻信號的有損壓縮方式的表示。方法600的第二步驟620包括計算音頻信號的壓縮的表示和音頻信號的表示之間的差值,以獲得差別表示。第三步驟630包括使用差別表示來提供環(huán)境信號。因此,作為一個整體,方法600能夠從音頻信號中產(chǎn)生環(huán)境信號。應(yīng)該注意到,可以通過上述本發(fā)明的設(shè)備所執(zhí)行的步驟來對根據(jù)圖6的本發(fā)明的方法600進(jìn)行補(bǔ)充。因此,例如,可以修改和/或補(bǔ)充方法,以完成根據(jù)圖2的設(shè)備100的功能、根據(jù)圖2的設(shè)備200的功能、根據(jù)圖3的設(shè)備300的功能和/或根據(jù)圖5的設(shè)備500的功能。換言之,可以以硬件或軟件來實現(xiàn)本發(fā)明的設(shè)備和本發(fā)明的方法??梢栽跀?shù)字存儲介質(zhì),如具有電子可讀控制信號的軟盤、CD、DVD或閃存存儲器上進(jìn)行該實現(xiàn),所述電子可讀控制信號與執(zhí)行相應(yīng)方法的可編程計算機(jī)系統(tǒng)協(xié)作。一般地,因此,本發(fā)明還在于具有程序代碼的計算機(jī)程序產(chǎn)品,所述程序代碼存儲在機(jī)器可讀載體上,當(dāng)計算機(jī)程序產(chǎn)品在計算機(jī)上運(yùn)行時,所述程序代碼用于執(zhí)行本發(fā)明的方法。換言之,因此,本發(fā)明可以被實現(xiàn)為具有程序代碼的計算機(jī)程序,當(dāng)計算機(jī)程序在計算機(jī)上運(yùn)行時,所述程序代碼用于執(zhí)行本方法。方法概述總而言之,可以認(rèn)為,從輸入信號中產(chǎn)生環(huán)境信號并將其饋送至后置聲道。這里,使用了標(biāo)題"直射/環(huán)境概念"下描述的概念。本發(fā)明的精髓涉及環(huán)境信號的計算,其中圖2示出了可用于獲得環(huán)境信號的處理的方框圖。總而言之,本發(fā)明示出了以下內(nèi)容如標(biāo)題"輸入信號的時頻分布"下討論的,計算輸入信號的時頻分布(TFD)。如"時頻分布的近似"部分中描述的,使用數(shù)值優(yōu)化方法來計算輸入信號的時頻分布(TFD)的近似。通過計算輸入信號的時頻分布(TFD)與其近似之間的區(qū)別或差值,獲得環(huán)境信號的時頻分布(TFD)的估計。該估計也被標(biāo)記為IAI和/或A。此夕卜,在標(biāo)題"時間信號的重建"下的部分中解釋了環(huán)境信號的時間信號的重新合成。此外,如在標(biāo)題"多聲道音頻信號的組裝"下所描述的,可以(可選地)使用后處理來增強(qiáng)所導(dǎo)出的多聲道信號的聽覺印象??偨Y(jié)總而言之,可以認(rèn)為,本發(fā)明描述了用于從單聲道音頻信號(或從一個單聲道音頻信號)中分離出環(huán)境信號的方法和概念。所導(dǎo)出的環(huán)境信號展現(xiàn)出高音頻質(zhì)量。它包括了源自環(huán)境的聲音元素或噪聲元素,即混響、聽眾噪聲以及環(huán)境噪聲或周圍噪聲。環(huán)境信號中直射聲音或直射噪聲的量或音量非常低或甚至趨于零。以下通過簡化的方式來描述所述方法成功的原因一般地,與環(huán)境噪聲或環(huán)境聲音的時頻分布(TFD)相比,直射聲音或直射噪聲的時頻分布(TFD)更稀疏或更不密集。這就是說,與環(huán)境噪聲或環(huán)境聲音的能量相比,直射聲音或直射噪聲的能量更集中更少的箱或矩陣項中。因此,所述近似對直射噪聲或直射聲音進(jìn)行檢測,而不檢測(或僅在非常小的程度上檢測)環(huán)境噪聲或環(huán)境聲音??蛇x地,可以認(rèn)為,與環(huán)境噪聲或環(huán)境聲音相比,所述近似在更大程度上檢測直射噪聲或直射聲音。因此,輸入信號的時頻分布(TFD)與其近似之間的區(qū)別或差值是在輸入信號中出現(xiàn)的所有環(huán)境噪聲和/或環(huán)境聲音的時頻分布(TFD)的良好表示。然而,本發(fā)明包括根據(jù)單聲道信號或雙聲道信號來計算多聲道信號(或一個多聲道信號)的方法。因此,所述方法和概念的使用實現(xiàn)了在多聲道系統(tǒng)中以維持多信號呈現(xiàn)的優(yōu)點的方式來進(jìn)行傳統(tǒng)錄音的演奏。.此外,應(yīng)該注意到,在本發(fā)明的方法中,在優(yōu)選實施例中,未使用人工音頻效果,對聲音和/或音頻信號的處理僅涉及包圍感和空間感。沒有對原始聲音或原始噪聲進(jìn)行音質(zhì)潤色。維持了音頻信號的作者所想要的聽覺印象。因此,可以認(rèn)為,所描述的本發(fā)明的方法和概念克服了已知方法和概念的實質(zhì)缺點。應(yīng)該注意到,在介紹中描述的信號自適應(yīng)方法通過計算雙聲道輸入信號的聲道間差來計算后置聲道信號(即后置揚(yáng)聲器的信號)。因此,當(dāng)輸入信號的兩個聲道相同時(即當(dāng)輸入信號是雙重單聲道信號時)或當(dāng)兩個聲道的信號幾乎相同時,這些方法不能根據(jù)選項3來從輸入信號中產(chǎn)生多聲道信號。在標(biāo)題"基于空間提示的偽立體聲"下描述的方法總是要求同樣內(nèi)容的多聲道版本或操作員手動產(chǎn)生空間提示。因此,當(dāng)沒有相同輸入信號的多聲道版本可用時,不能以具有實時能力的方式或自動地采用使用所提到的已知方法。相反,沒有關(guān)于信號的任何預(yù)先信息的情況下,這里描述的本發(fā)明的方法和概念能夠從單聲道信號中產(chǎn)生環(huán)境信號。此外,沒有使用合成的音頻對象或音頻效果(如混響)。以下,對于根據(jù)本發(fā)明的實施例的本發(fā)明的概念的應(yīng)用,描述了特別有利的參數(shù)選擇。換言之,以下描述用于單聲道上混應(yīng)用的環(huán)境分離方法的最優(yōu)參數(shù)設(shè)置。此外,給出了該參數(shù)的最小值和最大值,雖然該最大值和最小值可以起作用,但是在音頻質(zhì)量和/或所需處理負(fù)載方面沒有帶來最優(yōu)結(jié)果。這里,F(xiàn)FT大小參數(shù)(nfft)描述了要處理多少個頻帶。換言之,F(xiàn)FT大小參數(shù)指示存在多少個可區(qū)別的頻率co,到(Dn。因此,F(xiàn)FT大小參數(shù)也是矩陣X(co,k)的第一維有多大(例如矩陣的行數(shù))的度量。換言之,在優(yōu)選實施例中,F(xiàn)FT大小參數(shù)描述了矩陣X(co,k)的行(或列)的數(shù)目。因此,例如,F(xiàn)FT大小參數(shù)對應(yīng)于值n。此外,值FFT大小還描述有多少個樣本用于計算矩陣X中的單個項Xi,」。換言之,使用輸入信號的時間表示的nfft個樣本,以基于此來計算nfft個不同頻率CO,到(Dnffl的nfft個頻譜系數(shù)。因此,基于nfft個樣本來計算矩陣X((D,k)的列。然后,將定義輸入信號的預(yù)期樣本的窗移動由跳(hop)參數(shù)來定義的樣本數(shù)目。然后通過傅里葉變換將由移動后的窗所定義的輸入信號的nfft個樣本映射到nfft個頻譜系數(shù),所述頻譜系數(shù)定義了矩陣X的下一列??梢允纠缘卣J(rèn)為,通過輸入信號中具有索引l到nfft的樣本的傅里葉變換,可以形成矩陣X的第一列。通過輸入信號中具有索引l+hop到nfft+hop的樣本的傅里葉變換,可以形成矩陣X的第二列。段長度參數(shù)指示對多長一段信號幀的譜圖進(jìn)行分解。換言之,段長度參數(shù)描述了計算矩陣X中的項所考慮的輸入音頻信號的持續(xù)時間有多長。因此,可以認(rèn)為,矩陣X描述了在等于段長度參數(shù)(segLen)的時間段內(nèi)的輸入時間信號。分解秩參數(shù)描述非負(fù)矩陣分解的分解秩,即參數(shù)r。換言之,分解秩參數(shù)指示了第一近似矩陣W的維數(shù)和第二近似矩陣H的維數(shù)有多大。下面的表給出了這些參數(shù)的優(yōu)選值:<table>tableseeoriginaldocumentpage39</column></row><table>作為另一參數(shù),還確定針對NMF的計算使用哪一個誤差度量c。當(dāng)處理量或幅度譜圖時,優(yōu)選使用Kullback-Leibler散度。當(dāng)處理具有取對數(shù)的譜圖值(SPL)或能量譜圖值時,可以使用其它距離度量。此外,應(yīng)該注意到,以上描述了優(yōu)選值的范圍。應(yīng)該注意到,使用本發(fā)明的方法,F(xiàn)FT大小可在從128到65,536的范圍內(nèi)。跳大小可在FFT大小的1/64和整個FFT大小之間。典型地,段長度至少等于0.1秒。作為簡要概括,可以認(rèn)為,本發(fā)明包括用于從音頻信號中計算環(huán)境信號的新概念或方法。所導(dǎo)出的環(huán)境信號特別有利于對音樂音頻信號進(jìn)行上混以在多聲道系統(tǒng)上回放。與其它方法相比,所描述的本發(fā)明的概念或方法的優(yōu)勢在于,她能夠在不使用合成音頻效果的情況下處理單聲道信號。此外,應(yīng)該注意到,本發(fā)明還可用于簡單系統(tǒng)中。可以想到這樣的系統(tǒng),其中只有一個前置揚(yáng)聲器和一個后置揚(yáng)聲器存在和/或有效。例如,在這種情況下,可以在前置揚(yáng)聲器上回放原始音頻信號??梢栽诤笾脫P(yáng)聲器上回放從原始音頻信號中導(dǎo)出的環(huán)境信號。換言之,可以僅在前置揚(yáng)聲器上將原始單聲道音頻信號作為單聲道信號來回放,而將從原始音頻信號中導(dǎo)出的環(huán)境信號作為單個后置聲道來回放。然而,在本發(fā)明的實施例中,如果存在幾個聲道,則可以對其進(jìn)行分別處理。換言之,考慮將原始音頻信號的第一聲道用于產(chǎn)生第一環(huán)境信號,原始音頻信號的第二聲道用于產(chǎn)生第二環(huán)境信號。然后,例如在第一前置揚(yáng)聲器(如左前置揚(yáng)聲器)上回放原始音頻信號的第一聲道,例如在第二前置揚(yáng)聲器(如右前置揚(yáng)聲器)上回放原始音頻信號的第二聲道。此外,例如,在第一后置揚(yáng)聲器(如左后置揚(yáng)聲器)上回放第一環(huán)境信號,而例如在第二后置揚(yáng)聲器(如右后置揚(yáng)聲器)上回放第二環(huán)境信號。因此,本發(fā)明還包括以所描述的方式從兩個前置揚(yáng)聲器信號中產(chǎn)生兩個后置揚(yáng)聲器信號。在另外的實施例中,原始音頻信號包括三個聲道,例如左前置聲道、前置中心聲道和右前置聲道。因此,從原始音頻信號的第一聲道(例如左前置聲道)中獲得第一環(huán)境信號。從原始音頻信號的第二聲道(例如前置中心聲道)中獲得第二環(huán)境信號。從原始音頻信號的第三聲道(例如右前置聲道)中(可選地)獲得第三環(huán)境信號。然后,將這些環(huán)境信號中的兩個(例如第一環(huán)境信號和第二環(huán)境信號)組合(例如通過加權(quán)或不加權(quán)求和來進(jìn)行混合或組合)以獲得第一環(huán)境揚(yáng)聲器信號,將其饋送至第一環(huán)境揚(yáng)聲器(如左后置揚(yáng)聲器)??蛇x地,此外,將兩個另外的環(huán)境信號(例如第二環(huán)境信號和第三環(huán)境信號)組合以獲得饋送至第二環(huán)境揚(yáng)聲器(如右后置揚(yáng)聲器)的第二環(huán)境揚(yáng)聲器信號。因此,通過環(huán)境信號的第一組合來形成第一環(huán)境揚(yáng)聲器信號,其中每個環(huán)境信號是從原始多聲道音頻信號的一個聲道中來形成的,而通過環(huán)境信號的第二組合來形成第二環(huán)境揚(yáng)聲器信號。第一組合優(yōu)選地包括至少兩個環(huán)境信號,第二組合優(yōu)選地包括至少兩個環(huán)境信號。此外,優(yōu)選地,第一組合與第二組合不同,然而,其中,優(yōu)選地第一組合和第二組合使用公共的環(huán)境信號。此外,應(yīng)該注意到,例如如果使用包括側(cè)面揚(yáng)聲器的揚(yáng)聲器布置,則還可將以本發(fā)明的方式產(chǎn)生的環(huán)境信號饋送至側(cè)面揚(yáng)聲器。因此,在7.1揚(yáng)聲器布置的使用中,可以將環(huán)境信號饋送至左側(cè)揚(yáng)聲器。此外,還可將環(huán)境信號饋送至右側(cè)揚(yáng)聲器,其中,優(yōu)選地,饋送至左側(cè)揚(yáng)聲器的環(huán)境信號與饋送至右側(cè)揚(yáng)聲器的環(huán)境信號不同。因此,本發(fā)明作為一個整體,實現(xiàn)了從單聲道信號中特別好地提取環(huán)境信號。參考文獻(xiàn)C.Faller,PseudostereophonyRevisited,Presentedatthe118thConventionoftheAES,Barcelona,Spain,2005.R.Dressier,"DolbySurroundPrologic2Decoder-Principlesofoperation",Tech.Rep.,DolbyLaboratories,http:〃www.dolby.com/assets/pdf/techlibrary/208DolbySurroundProLogicDecoder.pdf,2000.DTSTechnicalStuff,"AnoverviewofDTSNEo:6multi-channel",DTS,http:〃www.dts.com/media/uploads/pdfs/DTS%20Neo6%20Overview..pdf.[4]HarmanKardonTechnicalStaff,"Logic7.explained",HarmanKardon,http:〃manuals.harman.com/HK/Technology0/o20Articles/logic7-TechSheet.pdf.C,AvendanoandJ.M.Jot,"AmbienceExtractionandSynthesisfromStereoSignalsforMulti-channelAudioUpmix",Proc.ofIEEEInternationalConferenceonAcoustics,SpeechandSignalProcessing(ICASSP),Orlando,Fl,May2002.R.IrwanandR.M.Aarts,"Amethodtoconvertstereotomulti-channelsound",PresentedattheAES19thInternationalConference,SchlossElmau,Germany,June21-24,pages139-143,2001.[7]G.Soulodre,"Ambience-BasedUpmixing",WorkshopSpatialCodingofSurroundSound:AProgressReport,Presentedatthe117thAESconvention,SanFrancisco,CA,USA,2004.D.LeeandH,Seung,"LearningthepartsofobjectsbyNon-negativeMatrixFactorization",InLettersToNature,1999.A.Cichocki,R.Zdunek,andS.Amari,"NewalgorithmsforNon-negativeMatrixFactorizationinapplicationstoBlindSourceSeparation".InPro"ofIEEEInternationalConferenceonAcoustics,SpeechandSignalProcessing(ICASSP),2006.D.LeeandH.Seung,"AlgorithmsforNon-negativeMatrixFactorization".InProceedingsofNIPS,2001.C.Duxbury,M.Davies,M.Sandler,"Separationoftransientinformationinmusicalaudiousingmultiresolutionanalysistechniques",inProceedingsofDAFX-01,2001.M.GoodwinandC.Avendano,"EnhancementofAudioSignalsUsingTransientDetectionandModification",Presentedatthe117thAESconvention,SanFrancisco,CA,USA,2004.A.Walther,C.Janssen,J.Herre,andO.Hellmuth"Transientsuppressioninambience-likesignals"PatentFPL-Fallnummer:06F47242-IIS.G.Kendall,"Thedecorrelationofaudiosignalsanditsimpactonspatialimagery",ComputerMusicJournal,19:4,1995.[15]C.FallerandF.Baumgarte,"BinauralCueCoding-Part2:SchemesandApplications",IEEETSAP,2003.C.Faller,"Parametriccodingofspatialaudio",Phdthesis,2004.[17]M.Schroeder,"Anartificialstereophoniceffectobtainedfromusingasinglesignal",JAES6:74,1957.G.PotardandI.Burnett,"Decorrelationtechniquesfortherenderingofapparentsoundsourcewidthin3Daudiodisplays",inProceedingsofDAFX-04,2004.權(quán)利要求1.用于從音頻信號(108;208;308;508)中產(chǎn)生環(huán)境信號(132;230、242、252、254;332、336、342;512)的設(shè)備(100;200;300;510),包括用于對音頻信號的表示(308;312;316;x(t);x[n];X(ω,k))進(jìn)行有損壓縮以獲得音頻信號的壓縮的表示(312;222;322;(ω,k))的裝置(110;220;320);用于計算音頻信號的壓縮的表示(112;222;322;(ω,k))和音頻信號的表示(308;212;316;X(ω,k))之間的差值,以獲得差別表示(122;232;332、336;|A(ω,k)|)的裝置(122;230;330);以及用于使用所述差別表示來提供環(huán)境信號(132;242、252、254;336、342;a(t)、a[n])的裝置(130、240、340)。2.根據(jù)權(quán)利要求l所述的設(shè)備(100;200;300;510),其中,用于有損壓縮的裝置(110;220;320)被配置為對描述音頻信號(208;308;x(t);x[m])的譜圖的頻譜表示(212;312;|X|)進(jìn)行壓縮,以獲得音頻信號的壓縮的頻譜表示作為壓縮的表示(112;222;322;i)。3.根據(jù)權(quán)利要求2所述的設(shè)備(100;200;300;510),其中,用于有損壓縮的裝置(110;220;320)被配置用于使用描述音頻信號的譜圖的時頻分布矩陣(IXl)作為音頻信號(108;208;308;x(t);x[n])的頻譜表示(108;212;316;|X|),以及通過第一近似矩陣(W)和第二近似矩陣(H)的乘積(WH)來近似時頻分布矩陣(|x|)。4.根據(jù)權(quán)利要求3所述的設(shè)備(100;200;300;510),其中,用于有損壓縮的裝置(110;220;320)被配置用于使用描述音頻信號的譜圖的實值時頻分布矩陣(lxl)作為音頻信號(108;208;308;X(t);x[n])的頻譜表示(108;212;316;|x|)。5.根據(jù)權(quán)利要求4所述的設(shè)備(100;200;300;510),其中,用于有損壓縮的裝置(110;220;320)被配置用于使用時頻分布矩陣(|x|)作為音頻信號(108;208;308;x(t);x[n])的頻譜表示(108;212;316;|x|),針對多個時間間隔,所述時頻分布矩陣(|x|)中的項(X)描述了音頻信號在多個頻率域(co)中的幅度或能量。6.根據(jù)權(quán)利要求3至5中任意一項所述的設(shè)備(100;200;300;510),其中,用于有損壓縮的裝置(110;220;320)被配置用于使用僅包括非負(fù)或僅包括非正項的時頻分布矩陣(|x|)作為音頻信號(108;208;308;x(t);x[n])的頻譜表示(108;212;316)。7.根據(jù)權(quán)利要求3至6中任意一項所述的設(shè)備(100;200;300;510),其中,用于有損壓縮的裝置(110;220;320)被配置用于通過第一近似矩陣(W)和第二近似矩陣(H)的乘積(WH)來近似時頻分布矩陣(|x|),使得第一近似矩陣(W)和第二近似矩陣(H)僅具有非負(fù)項或僅具有非正項,或者使得第一近似矩陣(W)僅具有非負(fù)項,第二近似矩陣(H)僅具有非正項,或者使得第一近似矩陣(W)僅具有非正項,第二近似矩陣(H)僅具有非負(fù)項。8.根據(jù)權(quán)利要求3至7中任意一項所述的設(shè)備(100;200;300;510),其中,用于有損壓縮的裝置(110;220;320)被配置用于通過評估代價函數(shù)(c)來確定第一近似矩陣(W)中的項與第二近似矩陣(H)中的項,所述代價函數(shù)(c)包括對一方面時頻分布矩陣(lxl)與另一方面第一近似矩陣(W)和第二近似矩陣(H)的乘積(WH)之間的差值的定量描述。9.根據(jù)權(quán)利要求8所述的設(shè)備(100;200;300;510),其中,用于有損壓縮的裝置(110;220;320)被配置用于使用確定代價函數(shù)(c)的極值的方法,或使用對代價函數(shù)(c)的極值進(jìn)行近似的方法來確定第一近似矩陣(W)和第二近似矩陣(H)中的項。10.根據(jù)權(quán)利要求8或9所述的設(shè)備(100;200;300;510),其中,所述代價函數(shù)(C)被選擇為使得代價函數(shù)(C)包括以下部分:所述部分取決于一方面時頻分布矩陣中的項(|X|ij)與另一方面第一近似矩陣(w)和第二近似矩陣(H)的乘積(WH)中的項((WH)之間的差值的符號。11.根據(jù)權(quán)利要求8、9或10所述的設(shè)備(100;200;300;510),其中,用于有損壓縮的裝置中的代價函數(shù)(c)或邊界條件被選擇為使得在一方面時頻分布矩陣中的項(|X|ij)與另一方面第一近似矩陣(w)和第二近似矩陣(H)的乘積(WH)中的項((WH)ij)之間的差值中,具有第一符號的值與具有其反轉(zhuǎn)符號的值相比優(yōu)選出現(xiàn)。12.根據(jù)權(quán)利要求8至11中任意一項所述的設(shè)備(100;200;300、510),其中,所述代價函數(shù)(c)被配置用于確定在一方面時頻分布矩陣(|X|)與另一方面第一近似矩陣(W)和第二近似矩陣(H)的乘積(WH)之間的逐元素差值的Frobenius范數(shù)。13.根據(jù)權(quán)利要求8至11中任意一項所述的設(shè)備(100;200;300、510),其中,所述代價函數(shù)(c)被配置用于確定在一方面時頻分布矩陣(|X|)與另一方面第一近似矩陣(W)和第二近似矩陣(H)的乘積(WH)之間的逐元素差值的廣義Kullback-Leibler散度。14.根據(jù)權(quán)利要求3至13中任意一項所述的設(shè)備(100;200;300、510),其中,所述時頻分布矩陣(|X|)包括相關(guān)聯(lián)的第一矩陣維度n和相關(guān)聯(lián)的第二矩陣維度m;其中,第一近似矩陣(W)包括相關(guān)聯(lián)的第一矩陣維度n和相關(guān)聯(lián)的第二矩陣維度r;其中,第二近似矩陣(H)包括相關(guān)聯(lián)的第一矩陣維度r和相關(guān)聯(lián)的第二矩陣維度m;以及其中,以下為真(n+m)r<nm。15.根據(jù)權(quán)利要求3至14中任意一項所述的設(shè)備(100;200;300、510),其中,用于計算差值的裝置(120;230;330)被配置用于導(dǎo)出近似誤差矩陣(|A|),使得所述近似誤差矩陣(|A|)中的項(A)是一方面時頻分布矩陣(|x|)中的元素和另一方面第一近似矩陣(w)和第二近似矩陣(H)的乘積(WH)中的元素((WH),」)之間的差值的函數(shù);其中,所述近似誤差矩陣(|A|)形成差別表示(122;232;332)。16.根據(jù)權(quán)利要求15所述的設(shè)備(100;200;300;510),其中,用于計算差值的裝置(120;230;330)被配置用于在計算近似誤差矩陣(|A|)中的給定項(|A|jj)時,確定一方面時頻分布矩陣(|X|)中與給定項(|A|i」)相關(guān)聯(lián)的項(|x|jj)與另一方面第一近似矩陣(W)和第二近似矩陣(H)的乘積(WH)中與給定項(|X"j)相關(guān)聯(lián)的項((WH)ij)之間的差值,并通過根據(jù)所述差值的符號對所述差值進(jìn)行加權(quán),將近似誤差矩陣(|A|)中的給定項(|A|jj)計算為所述差值的函數(shù)。17.根據(jù)權(quán)利要求15所述的設(shè)備(IOO;200;300;510),其中,用于計算差值的裝置(120;230;330)被配置用于在計算近似誤差矩陣(|A|)中的給定項(|A|ij)時,確定一方面時頻分布矩陣(|X|)中與給定項(|A|ij)相關(guān)聯(lián)的項(|X|ii)與另一方面第一近似矩陣(W)和第二近似矩陣(H)的乘積(WH)中使用加權(quán)因子(。進(jìn)行加權(quán)的項((WH)ij)之間的差值,其中,所述加權(quán)因子(g)不等于與給定項(|A|y)相關(guān)聯(lián)的加權(quán)因子,以及將近似誤差矩陣(|A|)中的給定項(|A|ij)確定為所述差值的幅度。18.根據(jù)權(quán)利要求3至17中任意一項所述的設(shè)備(100;200;300;510),其中,用于計算音頻信號(108;208;308)的壓縮的表示(112;222;322;義)與音頻信號的表示(108;212;316;|X|)之間的差值的裝置(120;230;330)被配置用于使用實值量度量(|A|)來描述所述差值;以及其中,用于提供環(huán)境信號(132;242;336;352、254;342)的裝置(130;240;334)被配置用于將從音頻信號的表示(108;212;312)中導(dǎo)出的相位值(()))分配給由實值量度量(|A|)所描述的、音頻信號的壓縮的表示與音頻信號的表示之間的差值,以獲得環(huán)境信號。19.根據(jù)權(quán)利要求18所述的設(shè)備(100;200;300;510),其中,用于提供的裝置(130;240;334)被配置用于將在時頻分布矩陣(X)中獲得的相位值(小)分配給由實值量度量(|A|)所描述的差值。20.用于從音頻信號(508)中導(dǎo)出多聲道音頻信號的設(shè)備(500),所述多聲道音頻信號包括前置揚(yáng)聲器信號(562、564、566)和后置揚(yáng)聲器信號(542、544),所述設(shè)備(500)包括根據(jù)權(quán)利要求1至19中任意一項所述的用于從音頻信號(508)中產(chǎn)生環(huán)境信號(512)的設(shè)備(100;200;300;510),其中,用于產(chǎn)生環(huán)境信號(512)的設(shè)備(510)被配置用于接收音頻信號(508);用于提供音頻信號(508)或從所述音頻信號(508)中導(dǎo)出的信號作為前置揚(yáng)聲器信號(563、564、566)的設(shè)備(550,560);以及后置揚(yáng)聲器信號提供設(shè)備(520、530、540),用于提供由用于產(chǎn)生環(huán)境信號(512)的設(shè)備(510)提供的環(huán)境信號(512)或從所述環(huán)境信號(512)中導(dǎo)出的信號作為后置揚(yáng)聲器信號(542、544)。21.根據(jù)權(quán)利要求20所述的設(shè)備(500),其中,后置揚(yáng)聲器信號提供設(shè)備(520、530、540)被配置用于產(chǎn)生后置揚(yáng)聲器信號(542、544),使得與前置揚(yáng)聲器信號(562、564、566)相比,所述后置揚(yáng)聲器信號延遲1毫秒至50毫秒的范圍內(nèi)。22.根據(jù)權(quán)利要求20或21所述的設(shè)備(500),其中,后置揚(yáng)聲器信號提供設(shè)備(520、530、540)被配置用于衰減后置揚(yáng)聲器信號(542、544)中類似脈沖的信號部分,或從后置揚(yáng)聲器信號(542、544)中去除類似脈沖的信號部分。23.根據(jù)權(quán)利要求20至22中任意一項所述的設(shè)備(500),其中,后置揚(yáng)聲器信號提供設(shè)備(520、530、540)被配置用于基于由用于產(chǎn)生環(huán)境信號(512)的設(shè)備(510)提供的環(huán)境信號,提供第一后置揚(yáng)聲器的第一后置揚(yáng)聲器信號(542)以及第二后置揚(yáng)聲器的第二后置揚(yáng)聲器信號(544)。24.根據(jù)權(quán)利要求23所述的設(shè)備(500),其中,后置揚(yáng)聲器信號提供設(shè)備(520、530、540)被配置用于基于環(huán)境信號(512)來提供第一后置揚(yáng)聲器信號(542)和第二后置揚(yáng)聲器信號(544),使得第一后置揚(yáng)聲器信號和第二后置揚(yáng)聲器信號相互之間至少部分解相關(guān)。25.用于從音頻信號(108;208;308)中產(chǎn)生環(huán)境信號(132;242;252;254;336;342)的方法(600),包括對音頻信號的表示(108;212;316)進(jìn)行有損壓縮(610),以獲得音頻信號的壓縮的表示(112;222;322);計算(620)音頻信號的壓縮的表示與音頻信號的表示之間的差值(122;232;332),以獲得差別表示(122;232;332);以及使用差別表示來提供(630)環(huán)境信號。26.用于從音頻信號中導(dǎo)出多聲道音頻信號的方法,所述多聲道音頻信號包括前置揚(yáng)聲器信號和后置揚(yáng)聲器信號,所述方法包括根據(jù)權(quán)利要求25來從音頻信號中產(chǎn)生環(huán)境信號;提供音頻信號或由其導(dǎo)出的信號作為前置揚(yáng)聲器信號;以及提供環(huán)境信號或由其導(dǎo)出的信號作為后置揚(yáng)聲器信號。27.用于從音頻信號(508)中導(dǎo)出多聲道音頻信號的設(shè)備(500),所述多聲道音頻信號包括前置揚(yáng)聲器信號(562、564、566)和后置揚(yáng)聲器信號(542、544),所述設(shè)備(500)包括用于從音頻信號(508)中產(chǎn)生環(huán)境信號(512)的設(shè)備(100;200;300;510),其中,用于從音頻信號(108;208;308;508)中產(chǎn)生環(huán)境信號(132;230、242、252、254;332、336、342;512)的設(shè)備(100;200;300;510)包括用于對音頻信號的表示(308;312;316;X(t);X[n];X(CO,k))進(jìn)行有損壓縮以獲得音頻信號的壓縮的表示(312;222;322;i(CO,k))的裝置(110;220;320);以及用于計算音頻信號的壓縮的表示(112;222;322;i(CO,k))和音頻信號的表示(308;212;316;X(①,k))之間的差值,以獲得差別表示(122;232;332,336;|A(>,A:)|)的裝置(122;230;330),描述音頻信號的表示與音頻信號的壓縮的表示之間的差值,以及描述音頻信號中那些在有損壓縮方式的表示中未回放的部分,以及其中,用于有損壓縮的裝置被配置為使得展現(xiàn)能量的規(guī)則分布的信號部分或攜帶大信號能量的信號部分優(yōu)選地包括在壓縮的表示中;其中,所述差別表示形成環(huán)境信號,用于提供音頻信號(508)或從音頻信號(508)中導(dǎo)出的信號作為前置揚(yáng)聲器信號(563、564、566)的設(shè)備(550、560);以及后置揚(yáng)聲器信號提供設(shè)備(520、530、540),用于提供由用于產(chǎn)生環(huán)境信號(512)的設(shè)備(510)提供的環(huán)境信號(512)或從所述環(huán)境信號(512)中導(dǎo)出的信號作為后置揚(yáng)聲器信號(542、544)。28.用于從音頻信號(508)中導(dǎo)出多聲道音頻信號的設(shè)備(500),所述多聲道音頻信號包括前置揚(yáng)聲器信號(562、564、566)和后置揚(yáng)聲器信號(542、544),所述設(shè)備(500)包括用于從音頻信號(508)中產(chǎn)生環(huán)境信號(512)的設(shè)備(100;200;300;510),其中,用于從音頻信號(108;208;308;508)中產(chǎn)生環(huán)境信號(132;230、242、252、254;332、336、342;512)的設(shè)備(100;200;300;510)包括用于對音頻信號的表示(308;312;316;X(t);X[n];X(CO,k))進(jìn)行有損壓縮以獲得音頻信號的壓縮的表示(312;222;322;i(CO,k))的裝置(110;220;320);以及用于計算音頻信號的壓縮的表示(112;222;322;i(co,k))和音頻信號的表示(308;212;316;X(03,k))之間的差值,以獲得差別表示(122;232;332,336;|A(w,"|)的裝置(122;230;330),描述音頻信號的表示與音頻信號的壓縮的表示之間的差值,以及描述音頻信號中那些在有損壓縮方式的表示中未回放的部分,以及用于使用所述差別表示來提供環(huán)境信號(132;242、252、254;336、342;a(t)、a[n])的裝置(130、240、340),其中,用于有損壓縮的裝置被配置為使得展現(xiàn)能量的規(guī)則分布的信號部分或攜帶大信號能量的信號部分優(yōu)選地包括在壓縮的表示中;其中,用于產(chǎn)生環(huán)境信號(512)的設(shè)備(510)被配置用于接收音頻信號(508);用于提供音頻信號(508)或從所述音頻信號(508)中導(dǎo)出的信號作為前置揚(yáng)聲器信號(563、564、566)的設(shè)備(550,560);以及后置揚(yáng)聲器信號提供設(shè)備(520、530、540),用于提供由用于產(chǎn)生環(huán)境信號(512)的設(shè)備(510)提供的環(huán)境信號(512)或從所述環(huán)境信號(512)中導(dǎo)出的信號作為后置揚(yáng)聲器信號(542、544)。29.用于從音頻信號中導(dǎo)出多聲道音頻信號的方法,所述多聲道音頻信號包括前置揚(yáng)聲器信號和后置揚(yáng)聲器信號,所述方法包括從音頻信號中產(chǎn)生環(huán)境信號,其中,從音頻信號中產(chǎn)生環(huán)境信號包括對音頻信號的表示(108;212;316)進(jìn)行有損壓縮(610),以獲得音頻信號的壓縮的表示(112;222;322);以及計算(620)音頻信號的壓縮的表示與音頻信號的表示之間的差值(122;232;332),以獲得形成環(huán)境信號的差別表示(122;232;332),其中,所述差別表示描述了音頻信號的表示與音頻信號的壓縮的表示之間的差值,以及其中,所述差別表示描述了音頻信號中那些在有損壓縮方式的表示中未回放的部分,以及其中,執(zhí)行有損壓縮,使得展現(xiàn)能量的規(guī)則分布的信號部分或攜帶大信號能量的信號部分優(yōu)選地包括在壓縮的表示中;提供音頻信號或由其導(dǎo)出的信號作為前置揚(yáng)聲器信號;以及提供環(huán)境信號或由其導(dǎo)出的信號作為后置揚(yáng)聲器信號。30.用于從音頻信號中導(dǎo)出多聲道音頻信號的方法,所述多聲道音頻信號包括前置揚(yáng)聲器信號和后置揚(yáng)聲器信號,所述方法包括從音頻信號中產(chǎn)生環(huán)境信號,其中,從音頻信號中產(chǎn)生環(huán)境信號包括對音頻信號的表示(108;212;316)進(jìn)行有損壓縮(610),以獲得音頻信號的壓縮的表示(112;222;322);計算(620)音頻信號的壓縮的表示與音頻信號的表示之間的差值(122;232;332),以獲得差別表示(122;232;332);以及使用差別表示來提供(630)環(huán)境信號其中,所述差別表示描述了音頻信號的表示與音頻信號的壓縮的表示之間的差值,以及其中,所述差別表示描述了音頻信號中那些在有損壓縮方式的表示中未回放的部分,以及其中,執(zhí)行有損壓縮,使得展現(xiàn)能量的規(guī)則分布的信號部分或攜帶大信號能量的信號部分優(yōu)選地包括在壓縮的表示中;提供音頻信號或由其導(dǎo)出的信號作為前置揚(yáng)聲器信號;以及提供環(huán)境信號或由其導(dǎo)出的信號作為后置揚(yáng)聲器信號。31.計算機(jī)程序,當(dāng)所述計算機(jī)程序在計算機(jī)上運(yùn)行時,執(zhí)行根據(jù)權(quán)利要求25或26或29或30所述的方法。全文摘要本發(fā)明提供了一種用于從音頻信號中產(chǎn)生環(huán)境信號的設(shè)備,包括通過對音頻信號的表示進(jìn)行有損壓縮,以獲得描述壓縮音頻信號的音頻信號壓縮表示的裝置。所述用于產(chǎn)生環(huán)境信號的設(shè)備還包括用于計算音頻信號的壓縮表示與音頻信號的表示之間的差值以獲得差別表示的裝置。所述設(shè)備還包括使用差別表示來提供環(huán)境信號的裝置。本發(fā)明提供了一種用于從音頻信號中導(dǎo)出多聲道音頻信號的設(shè)備,包括用于從音頻信號中產(chǎn)生環(huán)境信號的設(shè)備;用于提供音頻信號作為前置揚(yáng)聲器信號的設(shè)備以及用于提供環(huán)境信號作為后置揚(yáng)聲器信號的設(shè)備。文檔編號G10L19/02GK101536085SQ200780034829公開日2009年9月16日申請日期2007年10月23日優(yōu)先權(quán)日2006年10月24日發(fā)明者于爾根·赫勒,克里斯丁·烏勒,克里斯蒂安·詹森,奧利弗·赫爾穆特,安德烈亞斯·沃爾瑟申請人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1