亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于從下混信號和空間參數(shù)信息提取直接/周圍信號的裝置及方法

文檔序號:2832725閱讀:174來源:國知局
專利名稱:用于從下混信號和空間參數(shù)信息提取直接/周圍信號的裝置及方法
技術(shù)領(lǐng)域
本發(fā)明涉及音頻信號處理,并且更明確地,涉及從下混信號和空間參數(shù)信息提取直接/周圍信號的一種裝置及方法。本發(fā)明的其他實施例涉及利用直接/周圍分離用于提升音頻信號的雙耳再現(xiàn)。又一些實施例涉及多聲道聲音的雙耳再現(xiàn),其中,多聲道音頻表示具有二個或多個聲道的音頻。具有多聲道聲音的典型音頻內(nèi)容為電影聲軌及多聲道音樂記錄。
背景技術(shù)
人類空間聽覺系統(tǒng)傾向于粗略地以兩部分處理聲音。一方面為可局限化部分或直 接部分,而另一方面為非可局限化部分或周圍部分。存在許多音頻處理應(yīng)用,諸如雙耳聲音再現(xiàn)及多聲道上混,其中,期望存取這二個音頻組分。在本領(lǐng)域中,已知一種直接/周圍分離方法,例如在“用于空間音頻編碼及增強的一次周圍信號分解及基于向量的局限化”,Goodwin, Jot, IEEE國際聲學(xué)、語音及信號處理會議,2007年4月;“從立體聲記錄的基于相關(guān)性的周圍抽取”,Merimaa, Goodwin, Jot,AES第123期刊,紐約2007年;“立體信號的多揚聲器回放”,C. Faller,AES會議,2007年10月;“立體音頻信號使用復(fù)雜相似性指針的一次周圍分解”,Goodwin等人,公告號碼US2009/0198356AL2009年8月;“專利申請案名稱從立體信號產(chǎn)生多聲道音頻信號之方法”,發(fā)明人Christof Faller,代理人FISH&RICHARDS0N P. C.,受讓人LG電子公司,源自美國明尼蘇達州明尼波里市,IPC8類別AH04R500FI,USPC類別3811 ;以及“立體信號的周圍產(chǎn)生”,Avendano et al.,發(fā)行日期2009年7月28日,申請?zhí)?0/163,158,申請日2002年6月4日中所描述,這些方法可用于多項應(yīng)用。現(xiàn)有技術(shù)最先進的直接/周圍分離算法則基于立體聲于頻帶的頻帶間信號比較。此外,在“基于空間音頻場景編碼的雙耳3-D音頻呈現(xiàn)”,Goodwin, Jot, AES123屆會議,紐約2007年,解決使用周圍提取的雙耳回放。關(guān)聯(lián)雙耳再現(xiàn)的周圍提取也在J. Usher及J. Benesty中敘述,“空間聲音質(zhì)量的提升新穎殘響音頻上混器”,IEEE音頻、語音、語言處理會報,第15期第2141-2150頁2007年9月。后述報告聚焦在使用各聲道的直接組分的適應(yīng)性最小均方交叉聲道濾波而在立體麥克風(fēng)記錄的周圍提取??臻g音頻編譯碼器例如MPEG環(huán)繞,典型地由一或二聲道音頻串流組合空間側(cè)邊信息組成,其將音頻延伸入多個 聲道,如在 IS0/IEC 23003-1-MPEG 環(huán)繞中敘述的那樣;及 fceebaart, J.,Herre, J.,Villemoes, L, , Jin, C. , Kjorling, K. , Plogsties, J. , Koppens, J. (2006), “多聲道進入行動裝置MPEG環(huán)繞雙耳呈現(xiàn)”,第29屆AES會議議事錄,韓國首爾。但現(xiàn)代參數(shù)音頻編碼技術(shù)諸如MPEG環(huán)繞(MPS)及參數(shù)立體聲(PS)只提供較少數(shù)音頻下混聲道,在某些情況下,只提供一個聲道連同額外空間側(cè)邊信息?!霸取陛斎肼暤篱g的比較唯有在首次將聲音解碼成為期望的輸出格式后才有可能。因此,要求從下混信號及空間參數(shù)信息提取直接信號部分或周圍信號部分的構(gòu)想。但使用參數(shù)側(cè)邊信息作直接/周圍提取并非既有的解決之道。因此本發(fā)明的目的是提供一種通過使用空間參數(shù)信息而從下混信號提取直接信號部分或周圍信號部分的構(gòu)想。該目的可通過權(quán)利要求I所述的裝置、根據(jù)權(quán)利要求15所述的方法、或根據(jù)權(quán)利要求16所述的計算機程序來實現(xiàn)。

發(fā)明內(nèi)容
基于本發(fā)明的基本觀念是當基于該空間參數(shù)信息而估算多聲道音頻信號的直接部分或周圍部分的位準信息(level information,電平信息)并基于該估算的位準信息而從下混信號提取直接信號部分或周圍信號部分時,可實現(xiàn)前述的直接/周圍提取。此處,該下混信號及該空間參數(shù)信息表示該具有比下混信號更多聲道的多聲道音頻信號。此種解決辦法允許通過使用空間參數(shù)側(cè)邊信息而從具有一或多個輸入聲道的下混信號進行直接和/ 或周圍提取。根據(jù)本發(fā)明的一實施例,一種用于從下混信號及空間參數(shù)信息提取直接和/或周圍信號的裝置包含直接/周圍估算器及直接/周圍提取器(direct/ambience estimator)。該下混信號及該空間參數(shù)信息表示比該下混信號具有更多聲道的多聲道音頻信號。此外,該空間參數(shù)信息包含該多聲道音頻信號的聲道間關(guān)系式。該直接/周圍估算器被構(gòu)造為用于基于該空間參數(shù)信息而估算該多聲道音頻信號的直接部分或周圍部分的位準信息。該直接/周圍提取器被構(gòu)造為用于基于該直接部分或該周圍部分的該估算得到的位準信息而從該下混信號提取該直接信號部分或該周圍信號部分。根據(jù)本發(fā)明的另一實施例,一種用于從下混信號及空間參數(shù)信息提取直接和/或周圍信號的裝置包含雙耳直接聲音呈現(xiàn)裝置(binarural direct sound renderingdevice)、雙耳周圍聲音呈現(xiàn)裝置及組合器。該雙耳直接聲音呈現(xiàn)裝置被構(gòu)造為用于處理該直接信號部分來獲得一第一雙耳輸出信號。該雙耳周圍聲音呈現(xiàn)裝置被構(gòu)造為用于處理該周圍信號部分來獲得一第二雙耳輸出信號。該組合器被構(gòu)造為用于組合該第一雙耳輸出信號及第二雙耳輸出信號來獲得一經(jīng)組合的雙耳輸出信號。因此,可提供一音頻信號的雙耳再現(xiàn),其中,該音頻信號的直接信號部分及周圍信號部分被分開處理。


圖I示出了用于從下混信號及表示多聲道音頻信號的空間參數(shù)信息提取直接/周圍信號的一種裝置的一實施例的框圖;圖2示出了用于從單聲道下混信號及表示參數(shù)立體聲音頻信號的空間參數(shù)信息提取直接/周圍信號的一種裝置的一實施例的框圖;圖3a示出了根據(jù)本發(fā)明的一實施例的多聲道音頻信號的頻譜分解的示意說明圖;圖3b示出了用于基于圖3a的頻譜分解而計算多聲道音頻信號的聲道間關(guān)系式的示意說明圖;圖4示出了利用估算的位準信息下混的直接/周圍提取器的實施例的框圖;圖5示出了通過施加增益參數(shù)至一下混信號的一直接/周圍提取器的又一實施例的框圖;圖6示出了基于使用聲道交混的最小均方(LMS)解的一直接/周圍提取器的又一實施例的框圖;圖7a示出了使用立體聲周圍估算式的一種直接/周圍估算器的實施例的框圖;圖7b示出了直接對總能比(direct-to-total energy ratio)相對于聲道間相干性的一實例的曲線圖;圖8示出了根據(jù)本發(fā)明的一實施例的編碼器/譯碼器系統(tǒng)的框圖;圖9a示出了根據(jù)本發(fā)明的一實施例的雙耳直接聲音呈現(xiàn)的縱覽的框圖;圖9b示出了圖9a的雙耳直接聲音呈現(xiàn)的細節(jié)的框圖; 圖IOa示出了根據(jù)本發(fā)明的一實施例的雙耳周圍聲音呈現(xiàn)的縱覽的框圖;圖IOb示出了圖IOa的雙耳周圍聲音呈現(xiàn)細節(jié)的雙耳周圍聲音呈現(xiàn)細節(jié)的框圖;圖11示出了多聲道音頻信號的雙耳再現(xiàn)的一實施例的構(gòu)想框圖;圖12示出了包括雙耳再現(xiàn)的直接/周圍提取的一實施例的總體框圖;圖13a示出了用于在濾波器排組域(filterbank domain)中從單聲道下混信號提取一直接/周圍信號的一種裝置的一實施例的框圖;圖13b示出了圖13a的直接/周圍提取塊的一實施例的框圖;以及圖14示出了根據(jù)本發(fā)明的又一實施例的MPEG環(huán)繞譯碼方案的一實例的示意說明圖。
具體實施例方式圖I示出了用于從下混信號115及空間參數(shù)信息105提取直接/周圍信號125-1、125-2的裝置100的一實施例的框圖。如圖I所示,下混信號115及空間參數(shù)信息105表示比下混信號115具有更多聲道CtvChN的多聲道音頻信號101??臻g參數(shù)信息105可包含多聲道音頻信號101的聲道間關(guān)系式。更明確言之,裝置100包含一直接/周圍估算器110及一直接/周圍提取器120。直接/周圍估算器110可被構(gòu)造為基于空間參數(shù)信息105而估算該多聲道音頻信號101的直接部分或周圍部分的位準信息113。直接/周圍提取器120可被構(gòu)造為基于該估算的直接部分或周圍部分的位準信息(level information) 113,而從該下混信號115提取直接信號部分125-1或周圍信號部分125-2。圖2示出了用于從一單聲道下混信號215及表示參數(shù)立體聲音頻信號201的空間參數(shù)信息105提取直接/周圍信號125-1、125-2的裝置的一實施例的框圖。圖2的裝置200大致上包含與圖I的裝置100相同的框。因此,具有相同實現(xiàn)方式和/或功能的相同框系以相同組件符號標示。此外,圖2的參數(shù)立體聲音頻信號201可與圖I的多聲道音頻信號101相對應(yīng),及圖2的單聲道下混信號215可與圖I的下混信號115相對應(yīng)。在圖2的實施例中,單聲道下混信號215及空間參數(shù)信息105表示參數(shù)立體聲音頻信號201。參數(shù)立體聲音頻信號可包含以“L”指示的左聲道及以“R”指示的右聲道。此處,直接/周圍提取器120被構(gòu)造為基于該估算的位準信息113,而從該單聲道下混信號215提取直接信號部分125-1或周圍信號部分125-2 ;該位準信息113可通過直接/周圍估算器110的使用而從空間參數(shù)信息105導(dǎo)算出。實際上,圖I或圖2實施例中的空間參數(shù)(空間參數(shù)信息105)特別是指MPEG環(huán)繞(MPS)或參數(shù)立體聲(PS)側(cè)邊信息。該二項技術(shù)是現(xiàn)有技術(shù)中的低位率立體聲或環(huán)繞音頻編碼方法。參考圖2,PS提供一個具有空間參數(shù)的下混音頻聲道,并參考圖1,MPS提供一個、二個或多個具有空間參數(shù)的下混音頻聲道。具體地,圖I和圖2的實施例清晰地示出了空間參數(shù)側(cè)邊信息105可容易地用在從具有一或多個輸入聲道的一信號(也即下混信號115 ;215)進行直接和/或周圍提取的領(lǐng)域中。直接和/或周圍位準(位準信息113)的估算基于有關(guān)聲道間關(guān)系或聲道間差值的信息,諸如位準差和/或相關(guān)性。這些值可從立體聲或多聲道信號算出。圖3a示出了用來計算各個Ctv"ChN的聲道間關(guān)系的多聲道音頻信號(Ctv"ChN)的頻譜分解300的示意說明圖。如圖3a可知,多聲道音頻信號(CtvChN)的受檢查的聲道Chi或其余聲道的線性組合R的頻譜分解,分別包含多個子頻帶301,其中,這些多個子頻帶301中的各個子頻帶303沿著具有子頻帶值305的一橫軸(時間軸310)延伸,如時間/頻率網(wǎng)格的小框所指示的。此夕卜,子頻帶303沿縱軸(頻率軸320)連續(xù)定位而與一濾波器排組的不同頻率區(qū)域相對應(yīng)。在圖3a中,相應(yīng)時間/頻率片以虛線指示。此處,指數(shù)i表示聲道Chi,而 R表示其余聲道的線性組合,而指數(shù)η及k對應(yīng)于某些濾波器排組時槽(filter bank timeslot)307和濾波器排組子頻帶303?;谶@些時間/頻率片例如定位在相對于時間/頻率軸310、320的相同時間/頻率點(t0, &),如圖3b所示,可在步驟330中求出聲道間關(guān)系式335,諸如所檢查的聲道Chi的聲道間相干性(ICCi)或聲道位準差(CLDiX此處,聲道間關(guān)系式ICCi及CLDi的計算可通過使用下列關(guān)系式進行
(ChiR*)1CCi=......"r^==.................
^(ChlCh, )(RR*)
(ChlCh*)σ,. =^7^
[rr)其中,ChiS所檢查的聲道,及R為其余聲道的線性組合,而〈…〉表示時間平均。其余聲道的線性組合R的一例為它們的能量標準化和(energy-normalized)。此外,聲道位準差(CLDi) (channel level difference)通常為參數(shù)σ ^的分貝值。參考前述方程式,聲道位準差(CLDi)或參數(shù)σ i可與標準化至其余聲道的線性組合R的位準Pk的聲道Chi的位準Pi相對應(yīng)。這里,位準Pi或Pk可從聲道Chi的聲道間位準差參數(shù)ICLDi及其余聲道的聲道間位準差參數(shù)ICU^_ (j不等于i)的線性組合ICLDk中導(dǎo)算出。這里,ICLDi及ICLDj分別與一參考聲道Chref相關(guān)。在額外實施例中,聲道間位準差參數(shù)ICLDi及ICLDj也可與多聲道音頻信號(Ctv·· ChN)的屬于參考聲道ChMf的任何其它聲道相關(guān)。如此,最終將導(dǎo)致聲道位準差(CLDi)及參數(shù)Oi的相同結(jié)果。根據(jù)其它實施例,圖3b的聲道間關(guān)系式335也可通過在多聲道音頻信號(Ch1-ChN)的不同或全部成對ChiXhj輸入聲道上經(jīng)運算而導(dǎo)算出。此種情況下,可獲得成對逐一計算的聲道間相干性參數(shù)ICCi,j或聲道位準差(CLDi,j)或參數(shù)O U (或ICLDi,P,指數(shù)(i, j)分別表不某一對聲道Chi及Chj。圖4示出了一直接/周圍提取器420的一實施例400的框圖,其包括估算的位準信息113的下混。圖4的實施例大致上包含圖I的實施例的相同框。因此,具有類似實現(xiàn)方式和/或功能的相同框以相同的組件符號標示。但對應(yīng)于圖I的直接/周圍提取器120的圖4的直接/周圍提取器420被構(gòu)造為將多聲道音頻信號的直接部分或周圍部分的估算得的位準信息113下混,以獲得該直接部分或周圍部分的已下混的位準信息,并基于已下混的位準信息而從下混信號115提取直接信號部分125-1或周圍信號部分125-2。如圖4所示,空間參數(shù)信息105例如可從圖I的多聲道(Ctv" ChN)音頻信號101導(dǎo)算出,并可包含圖3b所介紹的Ctv"ChN的聲道間關(guān)系式335。圖4的空間參數(shù)信息105還包含將要饋送至直接/周圍提取器420的下混信息410。在實施例中,下混信息410可將原先的多聲道音頻信號(例如圖I的多聲道音頻信號101)的下混特征化為下混信號115。下混例如可使用于任何編碼域,例如在時域或頻域中運算的下混器(圖中未示出)來執(zhí)行。根據(jù)其它實施例,直接/周圍提取器420還被構(gòu)造為通過組合具有相干性和的直接部分的估算得到的位準信息與具有非相干性和的周圍部分的估算得到的位準信息,來執(zhí)行多聲道音頻信號101的直接部分或周圍部分的估算的位準信息113的下混。 須指出,估算的位準信息可分別表示直接部分或周圍部分的能量(energy)位準或功率位準。更明確言之,估算得到的直接/周圍部分的能量(也即位準信息113)的下混可通過假設(shè)聲道間的完全非相干性(full incoherence)或完全相干性來執(zhí)行。在分別基于非相干性和或相干性和進行下混的情況下,可應(yīng)用如下二個公式。
JV對于非相干性信號,已下混的能量或已下混的位準信息可由£皿^計算。
=1
f NY對于相干性信號,已下混的能量或已下混的位準信息可由Σ§ Λ[Ε^計
Vi=I J
笪此處,g為下混增益,其可得自于下混信息,而E (Chi)表示多聲道音頻信號中的一聲道Chi的直接/周圍部分的能量。至于非相干性下混的典型例,在下混5. I聲道成為二聲道的情況下,左下混的能量可為EL—DMX-ELeft+ELeft—surround+0. 5*ECenter圖5示出了通過將增益參數(shù)gD、gA施加至下混信號115的直接/周圍提取器520的又一實施例。圖5的直接/周圍提取器520可對應(yīng)于圖4的直接/周圍提取器420。首先,直接部分545-1或周圍部分545-2的估算的位準信息可從如前文說明的一直接/周圍估算器接收到。接收到的位準信息545-1、545-2可在步驟550中組合/下混以分別獲得直接部分555-1或周圍部分555-2的下混位準信息。然后在步驟560中,增益參數(shù)gD 565-1、gA565-2分別可針對直接部分或周圍部分而從下混位準信息555-1、555-2導(dǎo)算出。最后,直接/周圍提取器520可用來施加導(dǎo)算得出的增益參數(shù)565-1、565-3至下混信號115 (步驟570),因而將獲得直接信號部分125-1或周圍部分125-2。此處,須注意,在圖I、圖4、圖5的實施例中,下混信號115可由分別存在于直接/周圍提取器120、420、520的輸入端處的多個下混聲道(Ch1-ChN)組成。在其它實施例中,直接/周圍提取器520被構(gòu)造為從直接部分或周圍部分的下混位準信息555-1、555-2來測定直接對總(DTT)能比或周圍對總(ATT)能比,并使用基于所測得的DTT能比或ATT能比的提取參數(shù)作為增益參數(shù)565-1、565-2。在又一些實施例中,直接/周圍提取器520被構(gòu)造為將下混信號115與第一提取參數(shù)sqrt (DTT)相乘來獲得直接信號部分125-1,并且與第二提取參數(shù)sqrt (ATT)相乘來獲得周圍信號部分125-2。此處,下混信號115可對應(yīng)于單聲道下混信號215,如圖2的實施例所示(「單聲道下混情況」)。在單聲道下混情況下,周圍提取可通過施加sqrt (ATT)及sqrt (DTT)進行。但更明確言之,通過對各個聲道Chi施加sqrt (ATTiXS sqrt (DTTi),對多聲道下混信號相同辦法也有效。根據(jù)其它實施例,在下混信號115包含多個聲道的清況下(「單聲道下混情況」),直接/周圍提取器520可被構(gòu)造為來施加第一多個提取參數(shù)例如sqrt (DTTi)至下混信號115來獲得直接信號部分125-1,并施加第二多個提取參數(shù)例如Sqrt(ATTi)至下混信號115來獲得周圍信號部分125-2。此處,第一多個提取參數(shù)及第二多個提取參數(shù)可組成對角線矩陣。 一般而言,直接/周圍提取器120、420、520還可被構(gòu)造為通過施加平方MXM提取矩陣至下混信號115來提取直接信號部分125-1或周圍信號部分125-2,其中,平方MXM提取矩陣的大小(M)與下混聲道(CtvChN)的數(shù)目(M)相對應(yīng)。因此,施加周圍提取可被描述為施加平方MXM提取矩陣,其中,M為下混聲道(Ch1-ChN)的數(shù)目。這可包括全部可能的方式來操縱輸入信號來獲得直接/周圍輸出,包括基于表示平方MXM提取矩陣(被構(gòu)造為對角線矩陣)的主要組件的sqrt (ATTi)及sqrt(DTTi)參數(shù)的相當簡單的辦法,或被構(gòu)造為完整矩陣的LMS交混辦法。后者將在后文說明,此處,須注意,前述施加MXM提取矩陣的辦法涵蓋任何數(shù)目的聲道,包括一個。根據(jù)其它實施例,提取矩陣可以并非必然為MXM矩陣大小的平方矩陣,原因在于發(fā)明人具有較少數(shù)目的輸出聲道。因此,提取矩陣具有減少的行。該一實例可為提取單一直接信號來代替M。也并非必要經(jīng)常性取全部M個下混聲道作為與具有提取矩陣的M列的輸入。更明確言之,可與應(yīng)用用途相關(guān),此處并非必要具有全部聲道作為輸入信號。圖6示出了基于使用聲道交混的LMS (最小均方)解的直接/周圍提取器620的又一實施例600的框圖。圖6的直接/周圍提取器620可對應(yīng)于圖I的直接/周圍提取器120。在圖6的實施例中,因此具有與圖I實施例類似的實現(xiàn)方式和/或功能的相同框以相同的組件符號表示。但對應(yīng)于圖I的下混信號115的圖6的下混信號615包含多個617下混聲道Ον··ΟιΝ,其中,下混聲道的數(shù)目(M)小于多聲道音頻信號101的聲道CtvChN的數(shù)目(N),也即Μ〈Ν。更明確言之,直接/周圍提取器620被構(gòu)造為通過使用聲道交混的最小均方(LMS)解,來提取直接信號部分125-1或周圍信號部分125-2,LMS解并不要求相等周圍位準。如下提供此種LMS解,其并不要求相等周圍位準,并且也可延伸至任何數(shù)目的聲道。剛剛前述的LMS解并非強制性,而是表示前述辦法的更精準替代之道。用于直接/周圍提取的交混權(quán)值的LMS解所使用的組件符號為Chi 聲道 ia j在聲道i中的直接聲音增益D及/j聲音的直接部分及其估值
Ai及彳聲道i的周圍部分及其估值Px=E [XX*] X的估算得的能量E[]預(yù)期值五I X的估算誤差HZzm聲道i對直接部分的LMS交混權(quán)值Wd聲道η對聲道i的周圍部分的LMS交混權(quán)值在本內(nèi)文中,須注意,LMS解的導(dǎo)算可基于多聲道音頻信號的各個聲道的頻譜表示型態(tài),其表示頻帶中的每項函數(shù)。 信號模型被表不為Chi=aiO+ki導(dǎo)算首先處理a)直接部分,然后,b)周圍部分。最后,導(dǎo)算出權(quán)值的解,并描述權(quán)值的標準化方法。a)直接部分權(quán)值直接部分的估算為D = Yj Q) DiCh, = Σ WdMP+A]
i=l i=l估算誤差讀取為了獲得LMS解,發(fā)明人要求五^與輸入信號正交E [EXhJ=O,對于全部 k
(N^E D-YjWbj{afi + 4) MkD +Aj
Λ 1=1J _
(N^= Ok-^j W0tQiQk - W0kPik = O
V i=1 J
N Σ WDiaiakPD + wDkpAK = aA
i=l呈矩陣形式,前述關(guān)系式讀成
Aw = P
^OxU1Pd + Pa^ Ufl2P0 ■" aIaN^D wA flI
°ia2^D+ ^12)'WD2 _ °2 p
*、I ~ I
' aIaH^D…(W'Pd +/>v Pm,b)周圍部分發(fā)明人從相同的信號模型開始并根據(jù)下式來估算權(quán)值
權(quán)利要求
1.一種用于從一下混信號(115)和一空間參數(shù)信息(105)提取一直接和/或周圍信號(125-1,125-2)的裝置(100),所述下混信號(115)和所述空間參數(shù)信息(105)表示比所述下混信號(115)具有更多聲道(Ctv·· ChN)的一多聲道音頻信號(101 ),其中,所述空間參數(shù)信息(105)包含所述多聲道音頻信號(101)的聲道間關(guān)系式,所述裝置(100)包含 一直接/周圍估算器(110),用于基于所述空間參數(shù)信息(105)估算所述多聲道音頻信號(101)的一直接部分和/或一周圍部分的一位準信息(113);以及 一直接/周圍提取器(120),用于基于所述直接部分或所述周圍部分的所述估算的位準信息(113)而從所述下混信號(115)提取所述直接信號部分(125-1)和/或所述周圍信號部分(125-2)。
2.根據(jù)權(quán)利要求I所述的裝置,其中,所述直接/周圍提取器(420)被構(gòu)造為下混所述直接部分或所述周圍部分的所述估算的位準信息(113)來獲得所述直接部分或所述周圍部 分的已下混的位準信息,并基于所述已下混的位準信息而從所述下混信號(115)提取所述直接信號部分(125-1)或所述周圍信號部分(125-2 )。
3.根據(jù)權(quán)利要求2所述的裝置,其中,所述直接/周圍提取器(420)進一步被構(gòu)造為通過組合具有相干性總和的所述直接部分的所述估算的位準信息與具有非相干性總和的所述周圍部分的所述估算的位準信息,來執(zhí)行所述直接部分或所述周圍部分的所述估算的位準信息(I 13)的下混。
4.根據(jù)權(quán)利要求2或3所述的裝置,其中,所述直接/周圍提取器(520)進一步被構(gòu)造為從所述直接部分或所述周圍部分的所述已下混的位準信息(555-1,555-2)中導(dǎo)算出增益參數(shù)(565-1,565-2),并將所述導(dǎo)算出的增益參數(shù)(565-1,565-2)施加至所述下混信號(115)來獲得所述直接信號部分(125-1)或所述周圍信號部分(125-2)。
5.根據(jù)權(quán)利要求4所述的裝置,其中,所述直接/周圍提取器(520)進一步被構(gòu)造為根據(jù)所述直接部分或所述周圍部分的所述已下混的位準信(555-1,555-2 )來測定一直接對總(DTT)能比或周圍對總(ATT)能比,并使用基于所測定的DTT能比或ATT能比的提取參數(shù)作為所述增益參數(shù)(565-1,565-2 )。
6.根據(jù)權(quán)利要求I至5中任一項所述的裝置,其中,所述直接/周圍提取器(520)被構(gòu)造為通過將一 MXM平方提取矩陣施加至所述下混信號(115)來提取所述直接信號部分(125-1)或所述周圍信號部分(125-2),其中,所述MXM平方提取矩陣的大小(M)與下混聲道(Ctv"ChM)的數(shù)目(M)相對應(yīng)。
7.根據(jù)權(quán)利要求6所述的裝置,其中,所述直接/周圍提取器(520)進一步被構(gòu)造為將一第一多個提取參數(shù)施加至所述下混信號(115)來獲得所述直接信號部分(125-1),并將一第二多個提取參數(shù)施加至所述下混信號(115)來獲得所述周圍信號部分(125-2),所述第一多個提取參數(shù)和所述第二多個提取參數(shù)組成一對角線矩陣。
8.根據(jù)權(quán)利要求I至7中任一項所述的裝置,其中,所述直接/周圍估算器(110)被構(gòu)造為基于所述空間參數(shù)信息(113)和由所述直接/周圍估算器(110)所接收的所述下混信號(115)的至少二個下混聲道(825),來估算所述多聲道音頻信號(101)的所述直接部分或所述周圍部分的所述位準信息(113)。
9.根據(jù)權(quán)利要求I至8中任一項所述的裝置,其中,所述直接/周圍估算器(710)被構(gòu)造為針對所述多聲道音頻信號(101)的各聲道(Chi)通過使用所述空間參數(shù)信息(105)來施加一立體聲周圍估算式,其中,所述立體聲周圍估算式由下式給定 DTTi=fDTT [ σ (Chi, R), ICCi (Chi, R)]ATTi = I-DTTi 所述式取決于聲道位準差(CLDi),所述聲道位準差為σ i的分貝值,并且為聲道Chi的聲道間相干性(ICCi)參數(shù),其中,R為其余聲道的線性組合。
10.根據(jù)權(quán)利要求I至9中任一項所述的裝置,其中,所述直接/周圍提取器(620)被構(gòu)造為由使用聲道交混的最小均方解來提取所述直接信號部分(125-1)或所述周圍信號部分(125-2),所述LMS解不要求相等的周圍位準。
11.根據(jù)權(quán)利要求9所述的裝置,其中,所述直接/周圍提取器(620)被構(gòu)造為通過假設(shè)一信號模型導(dǎo)算出所述LMS解,使得所述LMS解不限于一立體聲道下混信號。
12.根據(jù)權(quán)利要求I至11中任一項所述的裝置,其中,所述裝置還包含 一雙耳直接聲音呈現(xiàn)裝置(910),用于處理所述直接信號部分(125-1)來獲得一第一雙耳輸出信號(915); 一雙耳周圍聲音呈現(xiàn)裝置(1010),用于處理所述周圍信號部分(125-2)來獲得一第二雙耳輸出信號(1015);以及 一組合器(1130),用于組合所述第一雙耳輸出信號(915)和所述第二雙耳輸出信號(1015)來獲得一經(jīng)組合的雙耳輸出信號(1135)。
13.根據(jù)權(quán)利要求12所述的裝置,其中,所述雙耳周圍聲音呈現(xiàn)裝置(1010)被構(gòu)造為將一室內(nèi)效果和/或一濾波器施加至所述周圍信號部分(125-2)來提供所述第二雙耳輸出信號(1015),所述第二雙耳輸出信號(1015)適用于實際擴散聲場的雙耳間相干性。
14.根據(jù)權(quán)利要求12或13所述的裝置,其中,所述雙耳直接聲音呈現(xiàn)裝置(910)被構(gòu)造為基于頭部相關(guān)傳遞函數(shù)(HRTF)通過濾波器饋送所述直接信號部分(125-1)來獲得所述第一雙耳輸出信號(915)。
15.—種用于從一下混信號(115)和一空間參數(shù)信息(105)提取一直接和/或周圍信號(125-1,125-2)的方法(100),所述下混信號(115)和所述空間參數(shù)信息(105)表示比所述下混信號(115)具有更多聲道(Ctv·· ChN)的一多聲道音頻信號(101 ),其中,所述空間參數(shù)信息(105)包含所述多聲道音頻信號(101)的聲道間關(guān)系式,所述方法(100)包含 基于所述空間參數(shù)信息(105)來估算(110)所述多聲道音頻信號(101)的一直接部分和/或一周圍部分的一位準信息(113);以及 基于所述直接部分或所述周圍部分的所述估算的位準信息(113),從所述下混信號(115)提取(120)所述直接信號部分(125-1)和/或周圍信號部分(125-2)。
16.一種具有程序代碼的計算機程序,當所述計算機程序在一計算機上執(zhí)行時用于執(zhí)行權(quán)利要求15所述的方法(100)。
全文摘要
一種用于從下混信號和空間參數(shù)信息提取直接/周圍信號的裝置,該下混信號及該空間參數(shù)信息表示比該下混信號具有更多聲道的多聲道音頻信號,其中,該空間參數(shù)信息包含該多聲道音頻信號的聲道間關(guān)系式。該裝置包含直接/周圍估算器及直接/周圍提取器。該直接/周圍估算器被構(gòu)造為用于基于該空間參數(shù)信息估算該多聲道音頻信號的直接部分和/或周圍部分的位準信息。該直接/周圍提取器被構(gòu)造為用于基于該直接部分或周圍部分的位準信息而從該下混信號提取直接信號部分和/或周圍信號部分。
文檔編號G10L19/00GK102804264SQ201180014038
公開日2012年11月28日 申請日期2011年1月11日 優(yōu)先權(quán)日2010年1月15日
發(fā)明者尤哈·維爾卡莫, 揚·普洛格斯蒂亞斯, 伯恩哈德·諾伊格鮑爾, 于爾根·赫萊 申請人:弗蘭霍菲爾運輸應(yīng)用研究公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1