亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

多聲道音頻信號表示方法

文檔序號:2829044閱讀:395來源:國知局
專利名稱:多聲道音頻信號表示方法
技術領域
本發(fā)明涉及對使用空間參數(shù)的音頻信號的多聲道表示進行編碼。本發(fā)明講授了用于估計和定義合適參數(shù)的新方法,來從數(shù)目少于輸出聲道數(shù)的聲道中再現(xiàn)多聲道信號。具體地,本發(fā)明的目標在于最小化多聲道表示的比特率,以及為所有可能的聲道配置提供能實現(xiàn)數(shù)據(jù)簡易編碼和解碼的多聲道信號的編碼表示。
背景技術
如PCT/SE02/01372”Efficient and scalable Parametric StereoCoding for Low Bit rate Audio Coding Applications”中所示,可以從給定了立體聲圖像壓縮表示的單聲道信號中再現(xiàn)出和原始立體聲圖像非常接近的立體聲圖像?;驹硎菍⑤斎胄盘杽澐殖深l帶和時間段,對這些頻帶和時間段,估算聲道間強度差(IID)和聲道間相干度(ICC)。第一個參數(shù)是在特定的頻帶上對功率在兩聲道間分布的測量,而第二個參數(shù)是在特定的頻帶上對兩聲道間相干度的估計。在解碼器一側,通過按照IID-數(shù)據(jù)把單聲道信號在兩個輸出聲道間分布以及加入一解相關信號來保留原始立體聲聲道的聲道相干度,從而將立體聲圖像從單聲道信號中再現(xiàn)出來。
對于多聲道的情況(多聲道在上下文中指多于兩個輸出聲道),不得不考慮若干額外的問題。目前存在若干種多聲道配置。最熟知的是5.1配置(中聲道,前置左/右,環(huán)繞左/右,和LFE聲道)。但是也存在許多其它配置。根據(jù)完整的編碼/解碼系統(tǒng)的觀點,希望得到的系統(tǒng)能對所有的聲道配置使用相同的參數(shù)集(例如IID和ICC)或其子集。ITU-R BS.775定義了若干縮混(down-mix)方案,能夠從給定的聲道配置中獲得由更少聲道組成的聲道配置。和總是不得不對所有聲道解碼以及對縮混的依賴不同,希望得到一種多聲道表示,使接收機在對聲道解碼之前能夠提取和現(xiàn)有聲道配置相關的參數(shù)。此外,根據(jù)可擴展或嵌入式編碼的觀點,希望得到內在可擴展的參數(shù)集,其中,例如在比特流的增強層存儲與環(huán)繞聲道相對應的數(shù)據(jù)是可能的。
和上述相反,還希望得到的是能夠基于被處理信號的特性采用不同的參數(shù)定義,來在參數(shù)化之間切換,這導致針對當前所處理信號段的最小比特率開銷。
本領域中還有另一種所熟知的采用加和信號或縮混信號以及附加參數(shù)側面信息的多聲道信號表示,叫做雙聲道提示編碼(BCC,binaural cue coding)。此項技術在″Binaural Cue Coding-Part 1Psycho-Acoustic Fundamentals and Design Principles″,IEEETransactions on Speech and Audio Processing,vol.11,No.6,November2003,F(xiàn).Baumgarte,C.Faller,和″Binaural Cue Coding.Part IISchemesand Applications″,IEEE Transactions on Speech and Audio Processingvol.11,No.6,November 2003,C.Faller and F.Baumgarte中進行了描述。
一般來說,雙聲道提示編碼是一種根據(jù)一個縮混音頻聲道和側面信息進行多聲道空間呈現(xiàn)的方法。由BCC編碼器計算及BCC解碼器使用的用于音頻重建和音頻呈現(xiàn)的若干參數(shù)包括聲道間幅度差,聲道間時間差和聲道間相干參數(shù)。這些聲道間提示是感知空間圖像的決定性因素。針對原始多聲道信號的多個時間樣本塊給出這些參數(shù),并且這些參數(shù)的給出具有頻率選擇性,使得多聲道信號的每一個樣本塊對若干個頻段有若干個提示。對于C回放聲道的一般情況,在聲道對之間每個子帶中考慮聲道間幅度差和聲道間時間差,也就是說相對于參考聲道考慮每一個聲道。針對每個聲道間幅度差都定義一個聲道作為參考聲道。通過聲道間幅度差和聲道間時間差,將音源呈現(xiàn)到所使用的回放設備的某一揚聲器對之間的任何方向上是有可能的。為了確定所呈現(xiàn)音源的廣度或擴散,對所有的音頻聲道來說每個子帶考慮一個參數(shù)就足夠了。這個參數(shù)就是聲道間相干參數(shù)。所呈現(xiàn)音源的寬度通過修改子帶信號來控制,使得所有可能的聲道對具有相同的聲道間相干參數(shù)。
在BCC編碼中,所有的聲道間幅度差在參考聲道1和其它聲道之間來確定。例如當中聲道被確定為參考聲道時,將計算出左聲道和中聲道之間的第一聲道間幅度差、右聲道和中聲道之間的第二聲道間幅度差、左環(huán)繞聲道和中聲道之間的第三聲道間幅度差以及右環(huán)繞聲道和中聲道之間的第四聲道間幅度差。這一情況描述了五聲道的配置方案。當五聲道配置方案另外包括一低頻加強聲道也就是所熟知的“重低音”聲道時,將計算出低頻加強聲道和中聲道也就是唯一的參考聲道之間的第五聲道間幅度差。
當使用一個縮混聲道也即被稱為“單聲道”的聲道,以及使用傳輸提示如ICLD(聲道間幅度差)、ICTD(聲道間時間差)和ICC(聲道間相干)來重建原始多聲道時,通過使用這些提示來修改單聲道信號的頻譜系數(shù)。通過使用用來為每個頻譜系數(shù)確定幅度修正的正實數(shù)來完成幅度修正。通過使用用來為每個頻譜系數(shù)確定相位修正的復數(shù)數(shù)值來生成聲道間時間差。另一函數(shù)確定了相干度影響。每個聲道用于幅度修正的因子通過首先計算參考聲道的因子來算出。參考聲道因子的計算使得對每個頻率部分,所有聲道的功率之和等于信號和的功率。然后,根據(jù)參考聲道的幅度修正因子,其他聲道的幅度修正因子可以用相應的ICLD參數(shù)計算出來。
于是,為了完成BCC合成,要計算出參考聲道的幅度修正因子。對于該計算,一頻帶的所有ICLD參數(shù)都是必需的。然后,根據(jù)該單個聲道的幅度修正,將計算出其它聲道也就是非參考聲道的幅度修正因子。
這種方法的缺點在于,為了完全重建,需要每一個聲道間幅度差。當存在易出錯的傳輸信道時,這個要求就更成問題了。傳輸?shù)穆暤篱g幅度差中的每一個錯誤將導致重建的多聲道信號的錯誤,因為需要每個聲道間幅度差來計算多聲道輸出信號的每個聲道。此外,當一個聲道間幅度差在傳輸中丟失,重建就是不可能的,盡管這個聲道間幅度差僅僅對例如左環(huán)繞聲道或右環(huán)繞聲道是必需的,而左環(huán)繞或右環(huán)繞聲道對多聲道重建并不太重要,因為多數(shù)信息包含在了左前置聲道即后來被稱作的左聲道、右前置聲道即后來被稱作的右聲道或中聲道中。當?shù)皖l加強聲道的聲道間幅度差在傳輸中丟失,這種情形變得甚至更糟。在這種情況下,沒有或者僅有錯誤的多聲道重建是可能的,盡管低頻加強聲道對聽眾的聽覺舒適度不太具有決定性。所以,單個的聲道間幅度差中的錯誤蔓延成每個重建輸出聲道中的錯誤。
此外,現(xiàn)有的BCC方案,即在AES會議文章5574,″Binaural CueCoding applied to Stereo and Multi-channel Audio Compression″,C.Faller,F(xiàn).Baumgarte,May 10 to 13,2002,Munich,Germany中描述的方案,當考慮直覺聆聽場景時,因為僅有的一個參考聲道,是不太適宜的。將每個事物都聯(lián)系到單一的參考聲道對人類來說是不自然的,當然,這是整個音頻處理的最終目標。不同的是,人有兩只耳朵,位于頭部不同的兩側。所以,人的自然聽覺印象是,信號是否更向左或者更向右平衡,或者在前后之間平衡。與其相反的是,讓人感覺音場中某聲源在各個揚聲器相對于單個參考揚聲器之間是否處于某種平衡,這是不自然的。當考慮比特率要求、可擴展性要求、靈活性要求、重建人工信號要求或者錯誤魯棒性要求時,這種一方面是自然聽覺印象而另一方面是BCC的數(shù)學/物理模型之間的分歧可能導致編碼方案的負面結果。

發(fā)明內容
本發(fā)明的目的是提供表示多聲道音頻信號的改進思想。
這個目的通過根據(jù)權利要求1所述的用于產生多聲道輸入信號的參數(shù)表示的設備、根據(jù)權利要求21所述的用于產生重建的多聲道表示的設備、權利要求31或32所述的方法、根據(jù)權利要求33所述的計算機程序或者根據(jù)權利要求34所述的參數(shù)表示來實現(xiàn)。
本發(fā)明基于如下的發(fā)現(xiàn),即對于多聲道表示,必須依靠聲道對之間的平衡參數(shù)。而且,還發(fā)現(xiàn)通過提供至少兩個不同的平衡參數(shù),即表示兩個不同聲道對之間平衡的參數(shù),多聲道信號的參數(shù)表示是可能實現(xiàn)的。具體地,靈活性、可擴展性、錯誤魯棒性以至比特率效率都是如下事實的結果,即作為第一平衡參數(shù)基礎的第一聲道對和作為第二平衡參數(shù)基礎的第二聲道對是不同的,其中,形成這些聲道對的四個聲道互不相同。
所以,本發(fā)明的思想和單一的參考聲道的思想不同,而是采用了多平衡或者超平衡的思想,這種思想對人的聽覺感受來說更直觀、更自然。具體地,作為第一和第二平衡參數(shù)基礎的聲道對可以包含原始聲道、縮混聲道,或者優(yōu)選的,輸入聲道間的特定組合。
已經(jīng)發(fā)現(xiàn),從作為聲道對第一聲道的中聲道以及作為聲道對第二聲道的原始左聲道和原始右聲道之和得出的平衡參數(shù),對于在中聲道、左聲道和右聲道之間提供準確的能量分布特別有用。還要在上下文中注意的是,這三個聲道一般涵蓋了聲音情景的大部分信息,其中特別是左右立體聲定位不僅僅受到左右之間平衡的影響,還受到中聲道與左右聲道之和之間平衡的影響。這個發(fā)現(xiàn)通過使用基于本發(fā)明優(yōu)選實施例的該平衡參數(shù)來反映。
優(yōu)選地,當傳輸一個單聲道縮混信號時,還發(fā)現(xiàn),除了中/左加右平衡參數(shù)之外,左/右平衡參數(shù)、后左/后右平衡參數(shù)以及前/后平衡參數(shù)是具有高效比特率參數(shù)表示的最佳解決方案,這種參數(shù)表示靈活,抗錯能力好,并且具有相當?shù)谋U娑取?br> 在接收機側,和BCC合成中僅通過傳輸?shù)男畔碛嬎忝總€聲道不同,本發(fā)明的多平衡表示利用關于用來產生縮混聲道的縮混方案的信息。于是,根據(jù)本發(fā)明,除了平衡參數(shù),在現(xiàn)有技術系統(tǒng)中并不使用的縮混方案信息,也在上混(up-mix)中使用。因此執(zhí)行上混操作,使得重建多聲道信號內形成平衡參數(shù)所依賴的聲道對的聲道之間的平衡由該平衡參數(shù)決定。
這種思想,也就是對不同的平衡參數(shù)形成不同的聲道對,使得在對每個傳輸?shù)钠胶鈪?shù)不知曉得情況下可以獲得一些聲道。具體地,根據(jù)本發(fā)明,在不知曉任何后左/后右平衡或前/后平衡的情況下,仍可以對左、右和中聲道進行重建。這種效果為非常細微調節(jié)的可擴展性提供了可能,因為從比特流中提取附加參數(shù)或者傳輸附加平衡參數(shù)到接收機,都將允許重建一個或多個附加聲道。這和現(xiàn)有技術的單一參考系統(tǒng)不同,在現(xiàn)有技術的單一參考系統(tǒng)中,需要每個聲道間幅度差來重建所有重建輸出聲道中的全部或者一組聲道。
本發(fā)明的思想也是有靈活性的,其中平衡參數(shù)的選擇可適應特定的重建環(huán)境。例如,當五聲道配置結構形成原始的多聲道信號結構時,且當四聲道結構形成重建多聲道結構時,其中該結構只有一個環(huán)繞揚聲器,例如該揚聲器位于聽者之后,前后平衡參數(shù)在對左環(huán)繞聲道和右環(huán)繞聲道不知曉的情況下為計算組合環(huán)繞聲道提供可能。這和單一參考聲道系統(tǒng)不同,單一參考聲道系統(tǒng)中必須從數(shù)據(jù)流中提取左環(huán)繞聲道的聲道間幅度差及右環(huán)繞聲道的聲道間幅度差。然后,必須計算出左環(huán)繞聲道和右環(huán)繞聲道。最后,必須將兩聲道疊加來獲得四聲道重現(xiàn)結構的一個環(huán)繞揚聲器聲道。在更具直覺感知的和更具有聽者導向的平衡參數(shù)表示中上述所有步驟都不是必須執(zhí)行的,因為這種表示由于平衡參數(shù)表示自動產生出組合環(huán)繞聲道,這種表示不是和單一的參考聲道關聯(lián),而是允許將原始聲道的組合作為平衡參數(shù)聲道對的聲道。
本發(fā)明涉及音頻信號的參數(shù)化多聲道表示的問題。提供了一種高效率的方式來為多聲道表示定義合適的參數(shù),且提供了一種不需要對所有聲道進行解碼就能提取出用于表示想要聲道的參數(shù)的能力。本發(fā)明進一步解決了為給定信號段選擇最佳參數(shù)配置使得對給定信號段的空間參數(shù)進行編碼所需的比特率最小化的問題。本發(fā)明還概述了如何應用之前僅對一般多聲道環(huán)境的兩個聲道情況才適用的解相關方法。
在優(yōu)選實施例中,本發(fā)明有以下特征—在編碼器一側將多聲道信號縮混到單聲道或雙聲道表示;—在給定多聲道信號的條件下,定義表示多聲道信號的參數(shù),或者靈活的以每幀為基礎以最小化比特率,或者使得解碼器能在比特流層上提取出聲道配置;—在解碼器一側,給定解碼器當前所支持的聲道配置,提取相關的參數(shù)集;—給定當前的聲道配置,生成所需數(shù)量的互相解相關的信號;—給定從比特流數(shù)據(jù)中解碼得到的參數(shù)集以及解相關的信號,再現(xiàn)輸出信號。
—多聲道音頻信號參數(shù)化的定義,使得相同的參數(shù)或者參數(shù)的子集的使用和聲道配置無關。
—多聲道音頻信號參數(shù)化的定義,使得參數(shù)可在可擴展編碼方案中應用,其中參數(shù)集的子集在可擴展數(shù)據(jù)流的不同層中傳輸。
—多聲道音頻信號參數(shù)化的定義,使得解碼器輸出信號的能量重建,不會被用來對縮混信號進行編碼的底層音頻編解碼器所破壞。
—不同多聲道音頻信號參數(shù)化之間的切換,使得用來對參數(shù)化進行編碼的比特率開銷最小化。
—多聲道音頻信號參數(shù)化的定義,其中包含表示縮混信號的能量修正因子的參數(shù)。
—使用若干互相解相關的解相關器來重現(xiàn)多聲道信號。
—根據(jù)基于所傳輸?shù)膮?shù)集而計算出的上混矩陣H,重現(xiàn)多聲道信號。


本發(fā)明將參考附圖通過說明性的例子來描述,當然發(fā)明的范圍或精神不限于此,附圖中圖1圖示了本發(fā)明中的用于5.1聲道配置的術語;圖2圖示了本發(fā)明的可能的編碼器實現(xiàn);圖3圖示了本發(fā)明的可能的解碼器實現(xiàn);圖4圖示了本發(fā)明的一優(yōu)選多聲道信號參數(shù)化方案;圖5圖示了本發(fā)明的一優(yōu)選多聲道信號參數(shù)化方案;圖6圖示了本發(fā)明的一優(yōu)選多聲道信號參數(shù)化方案;圖7圖示了產生一個基本聲道或兩個基本聲道的縮混方案的示意性結構;圖8圖示了基于本發(fā)明的平衡參數(shù)和關于縮混方案的信息的上混方案的示意性結構;圖9a圖示了編碼器一側幅度參數(shù)的確定;圖9b圖示了解碼器一側幅度參數(shù)的使用;圖10a圖示了在比特流的不同層擁有多聲道參數(shù)化的不同部分的可擴展比特流;圖10b圖示了可擴展性表格,指示用哪些平衡參數(shù)能構建哪些聲道,而哪些平衡參數(shù)和聲道是不使用的或不計算的;以及圖11圖示了基于本發(fā)明的上混矩陣的應用。
具體實施例方式
下述的實施例僅僅是為了闡述本發(fā)明關于音頻信號多聲道表示的原理。將認識到,對此處描述的布置和細節(jié)的修改和變更對于本領域其他技術人員來說是顯而易見的。因此,目的僅僅是將其受限于即將作出的權利要求的范圍,而不受限于此處描述的詳細細節(jié)和對實施例的闡釋。
在如下對本發(fā)明的描述中,概述了如何參數(shù)化IID和ICC參數(shù),以及如何使用它們來重現(xiàn)音頻信號的多聲道表示,其中假設所有涉及的信號是濾波器組中的子帶信號,或者是相應聲道的全部頻率范圍中一部分的某些其他頻率選擇性表示。所以認識到,本發(fā)明不限于特定的濾波器組,且本發(fā)明在下文中對信號的子帶表示的一個頻帶進行了概述,并且相同的操作適用于所有的子帶信號。
盡管平衡參數(shù)被稱作“聲道間強度差(IID)”參數(shù),要強調的是,聲道對之間的平衡參數(shù)并不必須是聲道對中第一聲道的能量或強度與聲道對中第二聲道的能量或強度之間的比率。一般,平衡參數(shù)表示聲源在聲道對的兩個聲道之間的定位。盡管該定位通常由能量/幅度/強度差給出,也可以使用信號的其他特性,如兩個聲道的功率量度或者聲道的時間或頻率包絡等。
圖1中可見用于5.1聲道配置的不同聲道,其中a(t)101表示左環(huán)繞聲道,b(t)102表示左前置聲道,c(t)103中聲道,d(t)104表示右前置聲道,e(t)105表示右環(huán)繞聲道,以及f(t)106表示LFE(低頻聲效)聲道。
假設定義期望算符為E[f(x)]=1T∫0Tf(x(t))dt]]>
那么可根據(jù)如下公式定義上文概述的聲道的能量(這里以左環(huán)繞聲道為例)A=E[a2(t)]這五個聲道在編碼器一側被縮混(down-mix)到兩聲道表示或者單聲道表示??梢杂萌舾煞椒ㄍ瓿煽s混,通常使用的方法是ITU縮混,其定義如下5.1到兩聲道縮混ld(t)=αb(t)+βa(t)+γc(t)+δf(t)rd(t)=αd(t)+βe(t)+γc(t)+δf(t)5.1到單聲道縮混md(t)=12(ld(t)+rd(t))]]>常數(shù)α、β、γ和δ的常用值為α=1,β=γ=12]]>以及δ=0。
IID參數(shù)被定義為兩個任意選出的聲道或者聲道加權組的能量比率。給定上文概述的5.1聲道配置的聲道能量,可以定義若干組IID參數(shù)。
圖7顯示了一般縮混器700,它使用了上述公式來計算單一聲道m(xù)或兩個優(yōu)選地基于立體聲的聲道ld和rd。一般的,縮混器使用特定的縮混信息。在優(yōu)選的線性縮混實施例中,縮混信息包括加權因子α、β、γ和δ。在本領域中已知,可以使用更多或更少的常量或非常量的加權因子。
在ITU推薦的縮混中,α設為1,β和γ設為相等值,同為0.5的平方根,而δ設為0。一般來說,α因子可在1.5到0.5之間變化。另外,β和γ可以互不相等,并且在0和1之間變化。對低頻加強聲道f(t)是一樣的。該聲道的因子δ可在0和1之間變化。另外,用于左縮混和右縮混的因子不需要彼此相等。當考慮非自動縮混,例如由聲音工程師來執(zhí)行時,這種情況變得很清楚。聲音工程師更注重執(zhí)行創(chuàng)新性的縮混,而不是由數(shù)學法則支配的縮混。不同的是,聲音工程師受他自己創(chuàng)新性感受的支配。當這種“創(chuàng)新性”縮混被特定的參數(shù)集記錄之后,它將根據(jù)本發(fā)明被發(fā)明性的上混(up-mix)器所使用,如圖8所示,該上混器不僅受參數(shù)支配,還受縮混方案的額外信息支配。
當如圖7所示,執(zhí)行線性縮混,加權參數(shù)就是關于縮混方案的優(yōu)選信息,將被上混器使用。但是,當用在縮混方案中的其它信息存在時,這些信息也可作為關于縮混方案的信息被上混器使用。這樣的其它信息,例如可以是上混矩陣中的特定矩陣元素或矩陣元素中的特定因子或函數(shù),例如,如圖11中所示。
給定圖1中概述的5.1聲道配置,并注意其它聲道配置如何與5.1聲道配置關聯(lián)對于三聲道的情況,其中環(huán)繞聲道無法獲得,也就是說,根據(jù)上述符號,B、C和D可以獲得。對于四聲道配置,B、C和D可以獲得,并且表示單一環(huán)繞聲道的A和E的組合也可以獲得,它在本文中更經(jīng)常的被表示為后置聲道。
本發(fā)明定義了適用于所有這些聲道的IID參數(shù),也就是說,5.1聲道配置的四聲道子集在描述5.1聲道的IID參數(shù)集中有相應的子集。
如下的IID參數(shù)集解決了此問題r1=LR=α2B+β2A+γ2C+δ2Fα2D+β2E+γ2C+δ2F]]>r2=γ22Cα2(B+D)]]>r3=β2(A+E)α2(B+D)+γ22C]]>r4=β2Aβ2E=AE]]>r5=δ22Fα2(B+D)+β2(A+E)+γ22C]]>顯而易見,r1參數(shù)對應左縮混聲道和右縮混聲道之間的能量比。r2參數(shù)對應中聲道和左右前置聲道之間的能量比。r3參數(shù)對應三個前置聲道和兩個環(huán)繞聲道之間的能量比。r4參數(shù)對應兩個環(huán)繞聲道之間的能量比。r5參數(shù)對應了LFE聲道和所有其它聲道之間的能量比。
圖4圖示了上文解釋的能量比。不同的輸出聲道由101至105表示,和圖1中一樣,因此這里不再詳細描述。揚聲器設置被分為左半和右半部分,其中中聲道103各屬于兩半部分中的一部分。根據(jù)本發(fā)明,左半面和右半面之間的能量比恰恰就是提到的參數(shù)r1。這由圖4中r1下面的實線表示。另外,根據(jù)本發(fā)明,在中聲道103、左前置102和右前置104之間的能量分布由r2表示。最后,在全部的前置聲道設置(102、103和104)和后置聲道(101和105)之間的能量分布由圖4中r3參數(shù)旁的箭頭所示。
給定以上參數(shù)化方案以及傳輸?shù)膯我豢s混聲道的能量M=12(α2(B+D)+β2(A+E)+2γ2C+2δ2F),]]>重建聲道的能量可以表示為F=12γ2r51+r52M]]>A=1β2r41+r4r31+r311+r52M]]>E=1β211+r4r31+r311+r52M]]>C=12γ2r21+r211+r311+r52M]]>B=1α2(2r11+r1M-β2A-γ2C-δ2F)]]>D=1α2(211+r1M-β2E-γ2C-δ2F)]]>于是M信號的能量可以被分布到重建聲道中,導致重建聲道具有和原始聲道相同的能量。
在圖8中圖示了上述優(yōu)選的上混方案。根據(jù)關于F、A、E、C、B和D的公式,顯而易見,上混器所使用的關于縮混方案的信息就是加權因子α,β,γ和δ,這些因子用來對原始聲道進行加權,然后將如此加權或未加權的聲道疊加在一起或彼此相減,以獲得一定數(shù)量的縮混聲道,這些縮混聲道的數(shù)量小于原始聲道的數(shù)量。所以,根據(jù)圖8可知,根據(jù)本發(fā)明,重建聲道的能量不僅由從編碼器一側傳輸?shù)浇獯a器一側的平衡參數(shù)確定,還由縮混因子α,β,γ和δ確定。
當考慮圖8時,顯而易見,為計算左和右聲道能量B和D,在公式中用到已經(jīng)計算出的聲道能量F、A、E、C。但是,這并不必然地意味著順序上混方案。相反,為獲得完全并行的上混方案,例如通過運用含有特定上混矩陣元素的特定上混矩陣來執(zhí)行的方案,A、C、E和F的公式被插入到B和D的公式中。于是,顯而易見,重建聲道能量僅僅由平衡參數(shù)、縮混聲道和關于縮混方案的信息例如縮混因子來確定。
給定以上的IID參數(shù),顯而易見的是,定義用于若干聲道配置的IID參數(shù)的參數(shù)集的問題得到了解決,這在下文中表現(xiàn)的很明顯。作為一個例子,注意三聲道配置(也就是說,從一個可用聲道中重現(xiàn)三個前置聲道),顯而易見的是r3、r4和r5參數(shù)是無用的,因為A、E和F聲道不存在。還顯然的是,參數(shù)r1和r2對于從縮混的單一聲道中重現(xiàn)三聲道是足夠的,因為r1描述的是左和右前置聲道之間的能量比,并且r2描述的是中聲道與左和右前置聲道之間的能量比。
在更一般的情況下,很容易發(fā)現(xiàn)上述定義的IID參數(shù)(r1…r5)適用于從m個聲道中重現(xiàn)n個聲道的所有子集。其中m<n≤6。注意圖4,可以認為—對于從1個聲道中重現(xiàn)2個聲道的系統(tǒng),從r1參數(shù)中獲得充足的信息,來保持聲道間正確的能量比。
—對于從1個聲道中重現(xiàn)3個聲道的系統(tǒng),從r1和r2參數(shù)中獲得充足的信息,來保持聲道間正確的能量比。
—對于從1個聲道中重現(xiàn)4個聲道的系統(tǒng),從r1、r2和r3參數(shù)中獲得充足的信息,來保持聲道間正確的能量比。
—對于從1個聲道中重現(xiàn)5個聲道的系統(tǒng),從r1、r2、r3和r4參數(shù)中獲得充足的信息,來保持聲道間正確的能量比。
—對于從1個聲道中重現(xiàn)5.1聲道的系統(tǒng),從r1、r2、r3、r4和r5參數(shù)中獲得充足的信息,來保持聲道間正確的能量比。
—對于從2個聲道中重現(xiàn)5.1聲道的系統(tǒng),從r2、r3、r4和r5參數(shù)中獲得充足的信息,來保持聲道間正確的能量比。
在圖10b中的表圖示了上述可擴展性特征。圖10a中圖示并將在稍后闡釋的可擴展比特流也可以適用于圖10b中的表,來獲得比圖10a所示精確的多的可擴展性。
本發(fā)明的思想對于下述情況有著特別的優(yōu)勢,即對其它平衡參數(shù)不知曉也沒有提取,僅從單一平衡參數(shù)r1中就可以輕松重建左和右聲道。為此,在圖8里B和D的公式中,聲道A、C、E和F都簡單的設為0。
作為選擇,當只考慮平衡參數(shù)r2時,重建聲道一方面是中聲道和低頻聲道(當這個聲道沒有設為0時)之間的疊加,另一方面是左和右聲道之間的疊加。所以只使用單個參數(shù),一方面可重建中聲道,另一方面可重建單聲道信號。這個特點可以對簡單的三聲道表示產生用處,其中左信號和右信號從左右聲道的疊加中獲得,例如二等分的,而中聲道和左右聲道之和之間的能量通過平衡參數(shù)r2來準確確定。
在上下文中,平衡參數(shù)r1或r2位于低擴展(scaling)層。
關于圖10b中表的第二個條目,表示3個聲道B、D及C與F的和是如何采用兩個平衡參數(shù)而不是5個平衡參數(shù)來獲得的,這些參數(shù)r1和r2之一可能處于比位于較低擴展層中的參數(shù)r1或r2高的擴展層中。
當考慮圖8中的公式時,顯而易見,為了計算C,未提取出的參數(shù)r5和其它未提取出的參數(shù)r3被設為0。另外,未使用的聲道A、E、F也被設為0,使得能計算出三個聲道B、D和中聲道C與低頻加強聲道F的和。
當4聲道的表示被上混時,從參數(shù)數(shù)據(jù)流中只提取出參數(shù)r1、r2和r3就足夠了。在上下文中,r3可以比其它參數(shù)r1或r2處于下一較高擴展層。4聲道配置與本發(fā)明的超級平衡參數(shù)表示相結合是特別合適的,因為正如后面將連同圖6進行的描述,第三平衡參數(shù)r3已經(jīng)從一邊的前置聲道和另一邊的后置聲道的組合中獲得。這是因為這樣的事實,即參數(shù)r3是前-后平衡參數(shù),它是根據(jù)具有后置聲道A和E的組合作為第一聲道以及左聲道B、右聲道E和中聲道C的組合作為前置聲道的聲道對得到的。
所以兩個環(huán)繞聲道的組合聲道能量沒有另外單獨的計算和隨后的組合就可自動獲得,而在單一參考聲道結構中,就存在另外單獨的計算和隨后的組合的情況。
當必須從單一聲道中重現(xiàn)5聲道時,另外的平衡參數(shù)r4是必需的。參數(shù)r4可以再次處于下一個更高的擴展層。
當必須執(zhí)行5.1的重建時,每個平衡參數(shù)都是需要的。因此,包含下一個平衡參數(shù)r5的下一個更高的擴展層將不得不被傳送到接收機,并被接收機估算。
但是,使用同樣的方法,根據(jù)聲道的擴展數(shù)目來擴展IID參數(shù),上述的IID參數(shù)可以通過擴展,來覆蓋聲道數(shù)比5.1配置的聲道數(shù)還要大的聲道配置s。因此,本發(fā)明不限于上述示例。
現(xiàn)在注意的情況是,聲道配置是5.1聲道配置,這是最常用的情況。而且,假設5.1聲道從兩個聲道中重建。這種情況下,可以通過如下參數(shù)替換參數(shù)r3和r4來定義不同的參數(shù)集q3=β2Aα2B]]>q4=β2Eα2D]]>參數(shù)q3和q4分別表示前置與后置左聲道之間的能量比,以及前置與后置右聲道之間的能量比??梢栽O想若干其他的參數(shù)化方案。
圖5中可見修正的參數(shù)化方案。不是采用一個參數(shù)概述前置和后置聲道之間的能量分布(在圖4中被r3概述)以及一個參數(shù)描述左環(huán)繞和右環(huán)繞聲道之間的能量分布(如圖4中被r4概述),使用參數(shù)q3和q4描述左前置102和左環(huán)繞101聲道之間的能量比,以及右前置104和右環(huán)繞105聲道之間的能量比。
本發(fā)明講授了可以用若干參數(shù)集來表示多聲道信號。本發(fā)明的另一特點是,不同的參數(shù)化可以依靠使用參數(shù)的量化類型來選擇。
例如,由于高的比特率限制而對參數(shù)粗略量化的系統(tǒng),必須使用使得在上混過程中錯誤不被放大的參數(shù)化。
注意上述從一個聲道重現(xiàn)5.1聲道的系統(tǒng)中兩個用于重建能量的表示式B=1α2(2r11+r1M-β2A-γ2C-δ2F)]]>D=1α2(211+r1M-β2E-γ2C-δ2F)]]>顯而易見,由于M、A、C和F參數(shù)很小的量化效果,減法操作將產生B和D能量的巨大變化,。
根據(jù)本發(fā)明,應該使用不同的參數(shù)化,它對參數(shù)的量化更不敏感。于是,如果采用粗略的量化,參數(shù)r1上文的定義r1=LR=α2B+β2A+γ2C+δ2Fα2D+β2E+γ2C+δ2F]]>可根據(jù)下式用另一個定義替換r1=BD]]>根據(jù)下式產生了重建能量的公式B=1α2r11+r111+r211+r311+r52M]]>D=1α211+r111+r211+r311+r52M]]>而重建A、E、C和F能量的公式和上文相同。顯而易見,從量化的角度,該參數(shù)化表示了狀況更好的系統(tǒng)。
圖6中圖示了上文闡述的能量比。不同的輸出聲道由101到105表示,并且和圖1相同,于是這里不進一步詳細說明。揚聲器結構被分成前置部分和后置部分。整個前置聲道結構(102、103和104)和后置聲道(101和105)之間的能量分布,通過圖6中參數(shù)r3表示的箭頭來圖示。
本發(fā)明的另一個值得注意的重要特點是當注意如下參數(shù)化r2=γ22Cα2(B+D)]]>r1=BD]]>這不僅僅是從量化的角度看狀況更好的系統(tǒng)。上述的參數(shù)化還具有這樣的優(yōu)勢,即用于重建三個前置聲道的參數(shù)可以在不影響環(huán)繞聲道的條件下獲得。可以設想?yún)?shù)r2來描述中聲道和所有其它聲道之間的關系。但是,缺點是在對描述前置聲道的參數(shù)的估算中包含了環(huán)繞聲道。
記住,本發(fā)明中描述的參數(shù)化可以用來測量聲道之間的相關度或相干度,顯而易見,在對r2的計算中包含后置聲道,將對準確重現(xiàn)前置聲道的成功產生重大的負面影響。
例如,可以想象在所有前置聲道中信號相同以及在后置聲道中信號完全不相關的情況。對于后置聲道常用于重現(xiàn)原始聲音的環(huán)境信息來說,這種情況并不罕見。
如果將中聲道與所有其它聲道相比,在中聲道和所有其它聲道之和之間的相關度測量值就很低,因為后置聲道完全不相關。用于估測前置左/右聲道和后置左/右聲道之間相關度的參數(shù)也是同樣的。
所以,所達到的參數(shù)化可以正確的重建能量,但是不包含所有前置聲道相同即強相關的信息。它包含的信息是,左和右前置聲道與后置聲道去相關,而中聲道也與后置聲道去相關。但是,從這個參數(shù)化中不能推出所有的前置聲道相同的事實。
這個問題的克服可以通過使用如下參數(shù)化r2=γ22Cα2(B+D)]]>r1=BD]]>
如本發(fā)明所講授的,因為對解碼器一側用來重現(xiàn)前置聲道的參數(shù)的估算,沒有包括后置聲道。
根據(jù)本發(fā)明,在中聲道103與左前置聲道102及右前置聲道104之間的能量分布由r2表示。在左環(huán)繞聲道101和右環(huán)繞聲道105之間的能量分布由r4闡釋。最后,在左前置聲道102和右前置聲道104之間的能量分布由r1給出。顯而易見,除了r1之外所有參數(shù)與圖4所示相同,此處r1對應的是左前置揚聲器和右前置揚聲器之間的能量分布,而非整個左側和整個右側之間的能量分布。為了完整性,給出參數(shù)r5描述能量在中聲道103和左聲道106之間的分布。
圖6給出了本發(fā)明優(yōu)選的參數(shù)化實施例的總結。第一平衡參數(shù)r1(由實線表示)構成前左/前右平衡參數(shù)。第二平衡參數(shù)r2為中/左右平衡參數(shù)。第三平衡參數(shù)r3構成前/后平衡參數(shù)。第四平衡參數(shù)r4構成后左/后右平衡參數(shù)。最后第五平衡參數(shù)r5構成中/LFE平衡參數(shù)。
圖4示出了相關的情形。在圖4中縮混左/右平衡的情況下用實線闡釋的第一平衡參數(shù)r1,可以替換為在作為底層聲道對的聲道B和D之間定義的原始前左/前右平衡參數(shù)。這個參數(shù)通過圖4中的虛線r1圖示,在圖5和圖6中則對應實線r1。
在兩基本聲道情況下,參數(shù)r3和r4,也就是前/后平衡參數(shù)和后左/右平衡參數(shù)替換為兩個單側的前/后參數(shù)。第一單側前/后參數(shù)q3也可被認為是第一平衡參數(shù),它從由左環(huán)繞聲道A和左聲道B組成的聲道對中得出。第二單側前/左平衡參數(shù)為參數(shù)q4,它可被認為是第二參數(shù),它是基于由右聲道D和右環(huán)繞聲道E組成的第二聲道對。此外,兩個聲道對相互獨立。對中/左右平衡參數(shù)r2來說也是同樣的,其中,中聲道C作為第一聲道,左和右聲道B和D的和作為第二聲道。
另一種適用于粗略量化用來從一個或兩個聲道中重現(xiàn)系統(tǒng)5.1聲道的系統(tǒng)的參數(shù)化方法,根據(jù)本發(fā)明定義如下。
對于1到5.1聲道q1=β2AM,]]>q2=α2BM,]]>q3=γ2CM,]]>q4=α2DM,]]>q2=β2EM]]>以及q5=δ2FM]]>對于2到5.1聲道的情況
q1=β2AL,]]>q2=α2BL,]]>q3=γ2CM,]]>q4=α2DR,]]>q2=β2ER]]>以及q5=δ2FM]]>顯而易見,上面的參數(shù)化包括的參數(shù),比從嚴格的理論角度來說將傳輸信號的能量正確地重新分布到重現(xiàn)信號所需要的參數(shù)多。但是,參數(shù)化對量化誤差非常不敏感。
上文引用的用于兩基本聲道結構的參數(shù)集,使用了若干參考聲道。但是,與圖6中的參數(shù)配置不同,圖7中參數(shù)集只依靠縮混聲道而不是原始聲道作為參考聲道。平衡參數(shù)q1、q3和q4從完全不同的參數(shù)對中得出。
盡管已經(jīng)描述了若干發(fā)明性的實施例,其中用于得出平衡參數(shù)的聲道對只包含原始聲道(圖4,圖5,圖6)或者包含原始聲道和縮混聲道(圖4,圖5)或者如圖7底部所示僅依靠縮混聲道作為參考聲道,但是優(yōu)選地,圖2中的環(huán)繞數(shù)據(jù)編碼器206中所包括的參數(shù)生成器可操作來僅使用原始聲道或原始聲道的組合,而非平衡參數(shù)所基于的通道對中通道的基礎通道或基礎通道的組合。這是因為事實上不能完全保證從環(huán)繞編碼器到環(huán)繞解碼器的傳輸中,單個基本聲道或者兩個立體聲基本聲道沒有發(fā)生能量的變化。工作在低比特率的條件下,音頻編碼器205(圖2)或音頻解碼器302(圖3)能引起多個縮混聲道或單個縮混聲道的能量變化。這樣的狀況能導致單聲道縮混聲道或者立體聲縮混聲道的能量處理,在左和右立體聲縮混聲道間的處理可以不相同,或者甚至可以是頻率選擇性的或時間選擇性的。
根據(jù)本發(fā)明,為了使得針對這些能量變化而完全可靠,要為每個縮混聲道的每個塊或每個頻帶,傳輸附加的幅度參數(shù)。當平衡參數(shù)是基于原始信號而不是縮混信號時,單一修正因子對每個帶來說是足夠的,因為任何的能量修正不會影響到原始聲道之間的平衡狀況。甚至當沒有傳輸附加的幅度參數(shù)時,任何的縮混聲道能量變化都不會導致音頻圖像中音源的錯誤定位,而只會導致一般的響度變化,響度變化不像由變化的平衡條件引起的音源的移動那樣惱人。
重要的是,要注意小心使得能量M(縮混聲道)是能量B、D、A、E、C和F之和,如上所述。并不總是這樣的情況,因為被縮混到一個聲道的不同聲道之間的相位依賴。能量修正因子可作為附加的參數(shù)rM傳輸,并且在解碼器一側接收到的縮混信號的能量被定義為rMM=12(α2(B+D)+β2(A+E)+2γ2C+2δ2F)]]>圖9中概述了附加參數(shù)rM的應用。縮混的輸入信號在將其發(fā)送到701-705的上混模塊之前,在901中先被rM參數(shù)修改。這和圖7中相同,所以不再進一步詳細描述。對于本領域的技術人員顯而易見的是,用于上述單聲道縮混實例的參數(shù)rM,可以擴展到每個縮混聲道一個參數(shù),且因此也不限于單個縮混聲道。
圖9a圖示了發(fā)明的幅度參數(shù)計算器900,而圖9b顯示了發(fā)明的幅度修正器902。圖9a顯示了編碼器一側的情況,而圖9b顯示了解碼器一側相應的情況。幅度參數(shù)或者“附加”參數(shù)rM為修正因子,給出特定的能量比。為了解釋以上內容,假定如下典型的場景。對特定的原始多聲道信號,一方面存在“主縮混”,另一方面存在“參數(shù)縮混”。主縮混是由音響工程師在音響工作間中基于例如主觀音質印象來生成的。此外,特定的音頻存儲介質也包括參數(shù)縮混,參數(shù)縮混由例如圖2的環(huán)繞編碼器203來執(zhí)行。參數(shù)縮混包括一個基本聲道或者兩個基本聲道,基本聲道形成多聲道重建的基礎,多聲道重建使用了原始多聲道信號的平衡參數(shù)集或者其它的參數(shù)表示。
也可以是這樣的情形,例如,從發(fā)射機到接收機,播送設備不想傳輸參數(shù)縮混而是傳輸主縮混。此外,為了將主縮混升級到多聲道表示,播送設備也傳輸原始多聲道信號的參數(shù)表示。因為能量(一個頻帶中或一個塊中)能(并且典型地將會)在主縮混和參數(shù)縮混之間變化,相對幅度參數(shù)rM在方塊900中產生,并作為附加參數(shù)被傳輸?shù)浇邮諜C。幅度參數(shù)根據(jù)主縮混和參數(shù)縮混得出,并且優(yōu)選地是主縮混和參數(shù)縮混的一個塊和一個頻帶內的能量之比。
一般來說,幅度參數(shù)被計算為原始聲道的能量和(Eorig)與縮混聲道能量的比值,其中縮混聲道可以是參數(shù)縮混(EPD)或主縮混(EMD)或者其它縮混信號。典型地,使用特定的縮混信號能量,它從編碼器被傳輸?shù)浇獯a器。
圖9b圖示了解碼器一側幅度參數(shù)使用的實現(xiàn)。幅度參數(shù)和縮混信號輸入到幅度修正器塊902。幅度修正器依照幅度參數(shù),修正單基本聲道或多基本聲道。因為附加參數(shù)rM是一個相對值,該相對值被乘以了相應基本聲道的能量。
盡管圖9a和9b顯示的情形中,將幅度修正應用到縮混聲道,幅度參數(shù)也能被合并到上混矩陣中。為此,圖8方程中M的每次出現(xiàn)都被替換成項“rMM”。
研究從兩個聲道中重現(xiàn)5.1聲道的情況,得到如下發(fā)現(xiàn)。
如果本發(fā)明是和圖2和圖3的205和302概述的底層音頻編解碼器一起使用,需要做出更多的考慮。注意先前定義的IID參數(shù),其中r1的定義根據(jù)r1=LR=α2B+β2A+γ2C+δ2Fα2D+β2E+γ2C+δ2F]]>該參數(shù)在解碼器一側可以隱性地獲得,因為系統(tǒng)從兩個聲道重現(xiàn)5.1聲道,如果兩個傳輸聲道為環(huán)繞聲道的立體聲縮混的話。
但是,在某比特率限制下工作的音頻編解碼器可以修改頻譜分布,使得解碼器一側測得的L和R能量與它們在編碼器一側的值不同。根據(jù)本發(fā)明,這種對重現(xiàn)聲道上能量分布的影響通過傳輸如下參數(shù)來消除r1=BD]]>當從兩個聲道中重建5.1聲道時,也是這樣的情況。
如果提供信令(signaling)裝置,編碼器通過使用不同的參數(shù)集對當前信號段進行編碼,并對正被處理的特定信號段選擇能給出最低開銷的IID參數(shù)集。右前和后聲道之間的能量水平類似是可能的,并且前和后左聲道之間的能量水平類似但右前和后聲道之間的能量水平大不相同也是可能的。給出參數(shù)的delta編碼以及后來的熵編碼,使用參數(shù)q3和q4來代替r3和r4將更加有效率。對具有不同特點的另一個信號段,不同的參數(shù)集將給出更低的比特率開銷。給定信號段的特性,本發(fā)明允許在不同參數(shù)表示之間自由切換,以便最小化當前編碼信號段的比特率開銷。在IID參數(shù)的不同參數(shù)化之間切換以獲得最小可能比特率開銷的能力,以及提供信令裝置來表示當前使用的是什么參數(shù)化的能力,是本發(fā)明的基本特征。
此外,參數(shù)的delta編碼可以在頻率方向或者時間方向完成,不同參數(shù)間的delta編碼也如此。根據(jù)本發(fā)明,參數(shù)可以關于其它任意參數(shù)進行delta編碼,如果提供信令裝置來表示所使用的特定delta編碼的話。
任意編碼方案的有趣特征是進行可擴展編碼的能力。這意味著編碼的比特流能分成若干不同的層。核心層可被自己解碼,更高的層可被解碼來增強解碼的核心層信號。對不同的情況,可用的層數(shù)可能變化,但是只要核心層可用,解碼器就能生成輸出樣本。上述使用r1到r5參數(shù)的多聲道編碼的參數(shù)化,使它們非常適合于可擴展編碼。所以,可以在增強層中存儲例如兩個環(huán)繞聲道(A和E)的數(shù)據(jù)(即參數(shù)r3和r4),并且在核心層中存儲與前置通道相對應的參數(shù)(由參數(shù)r1和r2表示)。
圖10中概述了根據(jù)本發(fā)明的可擴展比特流的實現(xiàn)。比特流層由1001和1002圖示,其中1001是核心層,擁有波形編碼縮混信號以及重現(xiàn)前置聲道(102、103和104)所需的參數(shù)r1和r2。1002圖示的增強層擁有用于重現(xiàn)后置聲道(101和105)的參數(shù)。
本發(fā)明的另一重要方面是在多聲道配置中解相關器的使用。使用解相關器的思想在PCT/SE02/01372文獻中針對一個或兩個聲道的情況得到詳細描述。但是當把該理論擴展到多于兩個聲道時,若干本發(fā)明解決的問題出現(xiàn)了。
初等數(shù)學表明,為了從N個信號中獲得M個互相解相關的信號,需要M-N個解相關器,其中所有不同的解相關器都是根據(jù)公共輸入信號生成互相正交的輸出信號的函數(shù)。典型的解相關器為全通或者接近全通的濾波器,給定輸入x(t)就生成輸出y(t),其中E[|y|2]=E[|x|2],以及幾乎為o的互相關E[yx*]。另外的感性標準也進入好的解相關器的設計,一些設計方法的例子可以是當將原始信號疊加到解相關信號時要最小化梳狀濾波器的特性,以及最小化有時瞬時信號的過長沖擊響應的影響。一些現(xiàn)有技術的解相關器利用人工反射器(artificialreverberator)來解相關。現(xiàn)有技術也包括通過例如修改復子帶樣本的相位來實現(xiàn)的分數(shù)延時,以獲得更高的回聲密度于是獲得更多的時間擴散。
本發(fā)明提出的方法是,修改基于反射的解相關器,來實現(xiàn)根據(jù)公共輸入信號生成相互解相關的輸出信號的多路解相關器。給定相同輸入,如果兩個解相關器的輸出y1(t)和y2(t)具有等于0或幾乎為0的互相關,那么這兩個解相關器互相解相關。假設輸入是平穩(wěn)白噪聲,由此得出,沖擊響應h1和h2必須正交,E[h1h2*]為0或者幾乎為0。成對方式相互解相關的解相關器組可由若干方式構建。進行修正的高效方式是改變作為分數(shù)延時一部分的相位旋轉因子q。
本發(fā)明規(guī)定相位旋轉因子可以是全通濾波器中延遲線的一部分,或者就是整個分數(shù)延遲。在后一種情況中,該方法不限于全通或者和反射器類似的濾波器,而且還能應用到例如包含分數(shù)延時部分的簡單延時中。解相關器中全通濾波器鏈路可在Z域中描述為H(z)=qz-m-a1-aqz-m]]>其中q為復數(shù)值的相位旋轉因子(|q|=1),m是樣本中延時線的長度,并且a是濾波器系數(shù)。因為穩(wěn)定的原因,濾波器系數(shù)的幅度被限制為|a|<1。但是,使用另一選擇的濾波器系數(shù)a′=-a,定義了新的反射器,具有相同的反射衰減特性,但是輸出和未修正的反射器輸出顯著不相關。另外,相位旋轉因子q的修正,可以通過例如加入常量的相位偏置q′=qejC來進行。常量C可以被用作常量的相位偏置,或者可以進行縮放,使其對應于其應用到的所有頻帶的常量時間偏置。相位偏置常量C也可以是對所有頻帶不相同的隨機數(shù)值。
根據(jù)本發(fā)明,從m個聲道生成n個聲道,通過將大小為n×(m+p)的上混矩陣H應用到大小為(m+p)×1個信號的列向量來執(zhí)行y=ms]]>
其中m是m個縮混和編碼的信號,且s中的p個信號兩兩彼此解相關,并且與m中所有信號解相關。這些解相關信號通過解相關器從m中的信號中產生。n個重建信號a′,b′,...然后被包含在列向量x′=Hy中。
以上在圖11中圖示,其中解相關信號由解相關器1102、1103和1104產生。上混矩陣H由1101給出,它作用于向量y而給出輸出信號x′。
讓R=E[xx*]為原始信號向量的相關矩陣,讓R′=E[x′x′*]為重建信號的相關矩陣。這里以及下文中,對于具有復數(shù)項的矩陣或向量X,X*表示伴隨矩陣,X的復數(shù)共軛轉置。
R的對角線含有能量值A、B、C、...并且根據(jù)上文定義的能量定額,解碼到總能量水平。因為R*=R,只有n(n-1)/2個不同的離對角線互相關值,這些數(shù)值含有通過調整上混矩陣H來全部或部分重建的信息。完全相關結構的重建對應于R′=R的情形。正確能量水平的重建只對應R′和R在對角線相等的情形。
在從m=1個聲道中得到n個聲道的情形,完全相關結構的重建可以通過使用p=n-1個相互解相關的解相關器來實現(xiàn)。上混矩陣H滿足條件HH*=1MR]]>其中M為單一傳輸信號的能量。因為R是半正定,眾所周知這樣的解是存在的。此外,對H的設計留下了n(n-1)/2的自由度,這在本發(fā)明中用來獲得上混矩陣更多有用的特性。中心設計標準是H對所傳輸?shù)南嚓P數(shù)據(jù)的依賴度要平穩(wěn)。
參數(shù)化上混矩陣的一種便利方法是H=UDV,其中U和V是正交矩陣而D是對角矩陣。D的絕對值的平方可以選擇為與R/M的特征值相等。省略V并對特征值排序,使得最大的值應用到第一坐標,這將最小化輸出的解相關信號的總能量。正交矩陣U為實矩陣,由n(n-1)/2個旋轉角度來參數(shù)化。以這些角度和D的n個對角數(shù)值的形式傳輸相關數(shù)據(jù),將直接給出想要的H的平穩(wěn)依賴性。但是因為能量數(shù)據(jù)不得不被轉換成特征值,這種方式犧牲了可擴展性。
本發(fā)明講授的第二種方法包括,通過根據(jù)R=GR0G定義歸一化相關矩陣R0,在R中把能量部分與相關部分分離,其中G是對角矩陣,其對角線數(shù)值等于R的對角線元素的平方根,也就是 并且R0對角線元素都為1。使得H0為正交上混矩陣,其在能量相等、信號完全不相關的情形下定義了優(yōu)選的歸一化上混。這些優(yōu)選的上混矩陣的例子有121-111,1211211-22-20,12111111-1-11-1-111-11-1.]]>然后上混被定義為H=GSH0/M,]]>其中矩陣S是SS*=R0的解。這個解對R0中歸一化互相關值的依賴性被選定為連續(xù)的,使得在R0=I的情況下S等于單位矩陣I。
將n個聲道分為含有更少聲道數(shù)的聲道組是重建部分互相關結構的便利方法。根據(jù)本發(fā)明,針對從1個聲道到5.1聲道的情況,特別有利的分組是{a,e},{c},{b,d},{f},其中對組{c},{f}沒有應用解相關,并且組{a,e},{b,d}通過對相同的縮混/解相關對的上混來產生。對這兩個子系統(tǒng),在完全不相關的情況下,優(yōu)選的歸一化上混分別選為121-111,12111-1,]]>所以全部15個互相關中只有兩個被傳輸和重建,也就是聲道{a,e}和{b,d}之間的互相關。在上述使用的術語中,這是針對n=6,m=1和p=1情形的設計示例。上混矩陣H大小為6×2,其中第二列的第3行和第6行的兩個元素為0,對應于輸出c′和f′。
本發(fā)明講授的用來合并解相關信號的第三種方法是更簡單的觀點每個輸出聲道有一不同的解相關器,產生解相關信號Sa,Sb,...。重建信號形成為
參數(shù)a,b,...控制出現(xiàn)在輸出聲道a′,b′,...中的解相關信號的量。相關數(shù)據(jù)以這些角度的形式被傳輸。很容易計算出,生成的例如聲道a′和b′之間的歸一化互相關等于乘積cosacosb。由于成對的互相關的數(shù)目為n(n-1)/2并且有n個解相關器,一般來說如果n>3,用這種方法不可能和給定的相關結構匹配,但是優(yōu)點是它是一種非常簡單和穩(wěn)定的解碼方法,并且直接控制出現(xiàn)在每個輸出聲道中的解相關信號的生成數(shù)量。這使得解相關信號的混合是基于感性標準并結合了例如聲道對的能量水平差的標準。
對于從m>1的聲道中得到n個聲道的情況,相關矩陣Ry=E[yy*]不能再假設為對角矩陣,并且在將R′=HRyH*匹配到目標矩陣R時也必須考慮該點。因為Ry具有塊狀矩陣結構,可簡化為Ry=Rm00Rs,]]>其中Rm=E[mm*]并且Rs=E[ss*]。另外,假設相互解相關的解相關器,即矩陣Rs為對角矩陣。注意,這也影響關于正確能量重建的上混設計。解決方法是在解碼器計算出,或者從編碼器傳輸與縮混信號的相關結構Rm有關的信息。
對于從2個聲道得到5.1聲道的情況,上混優(yōu)選的方法是a′b′c′d′e′f′=h110h130h210h230h31h32000h420h440h520h54h61h6200.m1m2s1s2,]]>其中s1根據(jù)m1=ld的解相關獲得,并且s2根據(jù)m2=rd的解相關中獲得。
這里考慮成對的互相關,將組{a,b}和{d,e}作為獨立的1→2聲道系統(tǒng)處理。對于聲道c和f,調整權重使得
E[|h31m1+h32m2|2]=C,]]>E[|h61m1+h62m2|2]=F.]]>本發(fā)明針對不同種類的系統(tǒng)、信號(模擬或數(shù)字)的存儲或傳輸,可以使用任意的編解碼器以硬件芯片和DSP的形式實現(xiàn)。圖2和圖3展示了本發(fā)明的可能實現(xiàn)。在這個例子中,顯示了工作在六個輸入信號(5.1聲道配置)條件下的系統(tǒng)。圖2中解碼器一側顯示的是各個聲道的模擬輸入信號,它們被轉換成數(shù)字信號201,并使用濾波器組為每個聲道進行分析202。濾波器組的輸出被供給環(huán)繞編碼器203,它包含參數(shù)生成器,執(zhí)行縮混生成音頻編碼器205編碼的一個或兩個聲道。此外,根據(jù)本發(fā)明環(huán)繞參數(shù)例如IID和ICC參數(shù)被提取出,并且根據(jù)本發(fā)明,概述數(shù)據(jù)的時間頻率網(wǎng)格以及采用了哪種參數(shù)化的控制數(shù)據(jù)被提取出204。正如本發(fā)明所講授的,提取出的參數(shù)被編碼206,或者在不同的參數(shù)化之間切換,或者以可擴展的方式配置參數(shù)。環(huán)繞參數(shù)207、控制信號以及編碼的縮混信號208被復用209到串行比特流。
圖3中顯示了一種典型的解碼器實現(xiàn),也就是用于形成多聲道重建的設備。這里假設音頻解碼器輸出頻域表示的信號,例如在QMF合成濾波器組之前從MPEG-4高效AAC解碼器輸出的信號。串行比特流被解復用301,編碼的環(huán)繞數(shù)據(jù)被供給環(huán)繞數(shù)據(jù)解碼器303,并且縮混編碼的聲道被供給音頻解碼器302,在這個例子中為MPEG-4高效AAC解碼器。環(huán)繞數(shù)據(jù)解碼器對環(huán)繞數(shù)據(jù)解碼,并將其供給環(huán)繞解碼器305,其包括上混器,上混器基于解碼的縮混聲道、環(huán)繞數(shù)據(jù)以及控制信號來重現(xiàn)六個聲道。來自環(huán)繞解碼器的頻域輸出被合成306到時域信號中,接著被數(shù)模轉換器(DAC)307轉換成模擬信號。
盡管本發(fā)明主要是關于平衡參數(shù)的產生和使用進行了描述,這里需要強調,和用于得出平衡參數(shù)的聲道對分組一樣的分組,也可以用于計算在兩個聲道對之間的聲道間相干參數(shù)或者“寬度”參數(shù)。此外,聲道間時間差或者一種“相位提示”,也可以應用和用于平衡參數(shù)計算相同的聲道對來獲得。在接收機一側,這些參數(shù)可用作平衡參數(shù)的另外的參數(shù)或者替換參數(shù),來形成多聲道重建。作為選擇,除了由其它的參考聲道確定的聲道間幅度差之外,也可以使用聲道間相干參數(shù)或者甚至是聲道間時間差。但是,考慮到本發(fā)明的可擴展性的特色,如圖10a和圖10b的討論,優(yōu)選的方法是對所有參數(shù)使用相同的聲道對,使得在可擴展的比特流中,每個擴展層包含用于重建輸出聲道子群的所有參數(shù),這些參數(shù)由相對應的擴展層產生,如圖10b的表倒數(shù)第二列中概述的擴展層。當各個聲道對之間只有相關參數(shù)或時間差參數(shù)被計算并傳輸?shù)浇獯a器時,本發(fā)明是有用的。在這種情況下,當執(zhí)行多聲道重建時,幅度參數(shù)已經(jīng)存在于解碼器處來使用。
取決于本發(fā)明的方法的特定實現(xiàn)要求,本發(fā)明的方法可以以硬件或軟件實現(xiàn)。實現(xiàn)方式可以是使用數(shù)字存儲介質,特別是存儲有可被電方式讀出的控制信號的磁盤或者CD,存儲介質與可編程計算機系統(tǒng)協(xié)作,使得本發(fā)明的方法得以執(zhí)行。一般來說,本發(fā)明也可以是計算機程序產品,程序代碼存儲于機器可讀的載體上,當計算機程序產品在計算機上運行時,可執(zhí)行本發(fā)明的方法。換句話說,本發(fā)明的方法是計算機程序,該程序含有在計算機上運行時來執(zhí)行至少1種發(fā)明性的方法的程序代碼。
權利要求
1.一種用于產生具有至少三個原始聲道的多聲道輸入信號的參數(shù)表示的設備,包括參數(shù)發(fā)生器(203),用于產生第一聲道對之間的第一平衡參數(shù)、第一相干參數(shù)或者第一時間差參數(shù),以及用于產生第二聲道對之間的第二平衡參數(shù)、第二相干參數(shù)或者第二時間參數(shù),其中平衡參數(shù)、相干參數(shù)或者時間參數(shù)形成參數(shù)表示,其中,第一聲道對具有兩個聲道,不同于第二聲道對的兩個聲道,以及雙聲道對中的每個聲道是原始聲道之一、原始聲道的加權或非加權組合、縮混聲道或者至少兩個縮混聲道的加權或非加權組合,以及第一聲道對和第二聲道對包括關于三個原始聲道的信息。
2.根據(jù)權利要求1所述的設備,其中,原始聲道包括左聲道(B)、右聲道(D)和中聲道(C),以及第二平衡參數(shù)(r2)為中平衡參數(shù),并且第二聲道對包括作為第一聲道的中聲道,以及作為第二聲道的包括左聲道和右聲道的聲道組合。
3.根據(jù)權利要求2所述的設備,其中,參數(shù)發(fā)生器可操作來根據(jù)如下公式計算中平衡參數(shù)r2=γ22Cα2(B+D)]]>其中r2為中平衡參數(shù),C表示中聲道,B表示左聲道,D表示右聲道,并且γ和α表示縮混因子。
4.根據(jù)前述權利要求之一所述的設備,其中,第一平衡參數(shù)(r1)為左/右平衡參數(shù),并且第一聲道對包括作為第一聲道的左聲道或左縮混聲道,以及作為第二聲道的右聲道或右縮混聲道。
5.根據(jù)權利要求4所述的設備,其中,參數(shù)發(fā)生器可操作來根據(jù)如下公式計算第一平衡參數(shù)r1=LR=α2B+β2A+γ2C+δ2Fα2D+β2E+γ2C+δ2F]]>或r1=B/D其中r1為第一平衡參數(shù),L是第一縮混聲道,R是第二縮混聲道,B表示左聲道,D表示右聲道,A表示后置左聲道,E表示后置右聲道,C表示中聲道,F(xiàn)表示低頻增強聲道,并且α、β、γ和δ為縮混因子。
6.根據(jù)前述權利要求之一所述的設備,其中,原始聲道包括后置左聲道(A)和后置右聲道(E),參數(shù)發(fā)生器可操作來產生前/后聲道對之間的前/后參數(shù)作為第三平衡參數(shù)(r3)或者作為第一和第二平衡參數(shù)之一,前/后聲道對具有作為第一聲道的包括后置左聲道和后置右聲道的聲道組合,以及作為第二聲道的包括左聲道和右聲道的聲道組合。
7.根據(jù)權利要求6所述的設備,其中,參數(shù)發(fā)生器可操作來根據(jù)如下公式計算前/后參數(shù)(r3)r3=β2(A+E)α2(B+D)+γ22C]]>其中r3為前/后平衡參數(shù),A為后置左聲道,E為后置右聲道,B表示左聲道,D表示右聲道,C表示中聲道,并且其中α、β和γ表示縮混參數(shù)。
8.根據(jù)前述權利要求之一所述的設備,其中,原始多聲道信號包括后置左聲道和后置右聲道,參數(shù)發(fā)生器可操作來產生后置左/右聲道對之間的后置左/右平衡參數(shù)(r4)作為附加平衡參數(shù)或者作為第一或第二平衡參數(shù),后置左/右聲道對具有作為第一聲道的后置左聲道和作為第二聲道的后置右聲道。
9.根據(jù)前述權利要求之一所述的設備,其中,原始多聲道信號包括低頻增強聲道和中聲道,參數(shù)發(fā)生器可操作來產生低頻增強聲道對之間的低頻增強平衡參數(shù)作為附加平衡參數(shù)或者作為第一或第二平衡參數(shù),低頻增強聲道對具有作為第一聲道的低頻增強聲道和作為第二聲道的中聲道或包括原始聲道中的中聲道、左聲道和右聲道的聲道組合。
10.根據(jù)權利要求9所述的設備,其中,參數(shù)發(fā)生器可操作來根據(jù)如下公式計算低頻增強平衡參數(shù)r5=δ22Fα2·(B+D)+β2(A+E)+γ22C]]>其中A對應后置左聲道,E對應后置右聲道,B對應左聲道,D對應右聲道,C對應中聲道,F(xiàn)對應低頻增強聲道,α、β、γ和δ為縮混因子,并且r5為低頻增強平衡參數(shù)。
11.根據(jù)前述權利要求之一所述的設備,還包括數(shù)據(jù)流發(fā)生器,用于產生可擴展的數(shù)據(jù)流(1001,1002),數(shù)據(jù)流發(fā)生器可操作來將第一或第二平衡參數(shù)加入到較低的擴展層以及將任何其它參數(shù)加入到較高的擴展層。
12.根據(jù)權利要求11所述的設備,其中,除第一或第二平衡參數(shù)之外,參數(shù)發(fā)生器還可操作來產生一個或多個平衡參數(shù),并且數(shù)據(jù)流發(fā)生器可操作來將所述一個或多個附加平衡參數(shù)加入到單個或多個較高的擴展層。
13.根據(jù)權利要求12所述的設備,其中,數(shù)據(jù)流發(fā)生器可操作來將每個附加參數(shù)引入到專用的擴展層。
14.根據(jù)前述權利要求之一所述的設備,其中,參數(shù)發(fā)生器可操作來產生左/右平衡參數(shù)作為第一平衡參數(shù),產生中平衡參數(shù)作為第二平衡參數(shù),產生前/后平衡參數(shù)作為第三平衡參數(shù),產生后置左/右平衡參數(shù)作為第四平衡參數(shù),以及產生低頻增強平衡參數(shù)作為第五平衡參數(shù),并且數(shù)據(jù)流發(fā)生器可操作來將第一和第二平衡參數(shù)加入到較低的擴展層,以及將第三到第四平衡參數(shù)或者相應的相干參數(shù)或者相應的時間差加入到一個或多個較高的擴展層。
15.根據(jù)前述權利要求之一所述的設備,其中,參數(shù)發(fā)生器可操作來產生單側的前/后聲道對之間的至少一個單側前/后平衡參數(shù)(q3,q4)作為第一和第二平衡參數(shù)之一或者作為附加平衡參數(shù),單側的前/后聲道對具有作為第一聲道的后置左聲道和作為第二聲道的左聲道或者具有作為第一聲道的后置右聲道和作為第二聲道的右聲道。
16.根據(jù)前述權利要求之一所述的設備,其中,第一和第二平衡參數(shù)之一是第一左或右平衡參數(shù),并且聲道對包括作為第一聲道的左縮混聲道,以及作為第二聲道的左原始聲道或者后置左原始聲道,或者第一和第二平衡參數(shù)之一是右平衡參數(shù),并且聲道對包括作為第一聲道的右縮混聲道,以及作為第二聲道的右原始聲道或者后置右原始聲道,或者第一或第二平衡參數(shù)之一或者附加平衡參數(shù)是中平衡參數(shù),并且聲道對包括作為第一聲道的左和右縮混聲道之和,以及作為第二聲道的原始中聲道。
17.根據(jù)權利要求16所述的設備,其中,參數(shù)發(fā)生器可操作來產生左平衡參數(shù)作為第一平衡參數(shù),產生右平衡參數(shù)作為第二平衡參數(shù),以及產生中平衡參數(shù)作為第三平衡參數(shù)。
18.根據(jù)權利要求17所述的設備,其中,參數(shù)發(fā)生器可操作來產生左/左環(huán)繞平衡參數(shù)作為第四平衡參數(shù),以及產生右/右環(huán)繞平衡參數(shù)作為第五平衡參數(shù)。
19.根據(jù)前述權利要求之一所述的設備,還包括參數(shù)編碼器,用于產生平衡參數(shù)、相干參數(shù)或聲道間時間差的編碼版本,參數(shù)編碼器包括量化器。
20.根據(jù)前述權利要求之一所述的設備,其中,參數(shù)發(fā)生器可操作來僅使用原始聲道或原始聲道的組合而非基礎聲道或基礎聲道的組合作為聲道對內的聲道。
21.根據(jù)前述權利要求之一所述的設備,其中,參數(shù)發(fā)生器可操作來產生不同的參數(shù)集,每個參數(shù)集包括至少兩個參數(shù),其中用于計算不同參數(shù)集中參數(shù)的聲道對互不相同,參數(shù)發(fā)生器還可操作來從不同參數(shù)集中選擇一參數(shù)集用于輸出,該參數(shù)集在給定的特定參數(shù)編碼方案中,得出較低的比特率,所述設備還包括參數(shù)編碼器,用于通過使用特定參數(shù)編碼方案來對選定的參數(shù)集進行編碼;以及參數(shù)控制信息發(fā)生器,用來產生指示選定參數(shù)方案的特性的控制信息。
22.一種用于產生具有至少三個原始聲道的原始多聲道信號的重建多聲道表示的設備,使用通過用縮混方案將原始多聲道信號轉換而產生的若干基本聲道,并使用第一聲道對之間的第一平衡參數(shù)、第一相干參數(shù)或者第一時間差參數(shù),用于產生第二聲道對之間的第二平衡參數(shù)、第二相干參數(shù)或者第二時間參數(shù),其中平衡參數(shù)、相干參數(shù)或者時間參數(shù)形成參數(shù)表示,其中,第一聲道對具有兩個聲道,不同于第二聲道對的兩個聲道,以及雙聲道對中的每個聲道是原始聲道之一、原始聲道的加權或非加權組合、縮混聲道或者至少兩個縮混聲道的加權或非加權組合,以及第一聲道對和第二聲道對包括關于三個原始聲道的信息,所述設備包括上混器(305),用于產生一定數(shù)量的上混聲道,上混聲道的數(shù)量比基本聲道的數(shù)量多,比原始聲道的數(shù)量少或者與之相等,其中,上混器可操作來根據(jù)關于縮混方案的信息并使用平衡參數(shù)、相干參數(shù)或者聲道間時間差產生重建聲道,使得第一重建聲道對之間的平衡或相干或聲道間時間差由第一平衡參數(shù)、第一聲道間相干參數(shù)或者第一聲道間時間差確定,并且第二聲道對之間的平衡、聲道間相干或聲道間幅度差由第二平衡參數(shù)、第二聲道間相干參數(shù)或者第二聲道間時間差參數(shù)確定。
23.根據(jù)權利要求22所述的設備,其中,原始聲道包括左聲道(B)、右聲道(D)和中聲道(C),以及第二平衡參數(shù)(r2)為中平衡參數(shù),并且第二聲道對包括作為第一聲道的中聲道,以及作為第二聲道的包括左聲道和右聲道的聲道組合,上混器可操作來基于第二平衡參數(shù)(r2)產生重建的中聲道。
24.根據(jù)權利要求22或23所述的設備,其中,第一平衡參數(shù)(r1)為左/右平衡參數(shù),并且第一聲道對包括作為第一聲道的左聲道或左縮混聲道,以及作為第二聲道的右聲道或右縮混聲道,以及上混器可操作來基于第一平衡參數(shù)(r1)產生重建的左聲道和重建的右聲道。
25.根據(jù)權利要求22到24之一所述的設備,其中,原始聲道包括后置左聲道(A)和后置右聲道(E),參數(shù)表示包括作為第三平衡參數(shù)(r3)或者作為第一和第二平衡參數(shù)之一的、前/后聲道對之間的前/后參數(shù),前/后聲道對具有作為第一聲道的包括后置左聲道和后置右聲道的聲道組合,以及作為第二聲道的包括左聲道和右聲道的聲道組合,以及上混器可操作來使用前/后平衡參數(shù)(r3)產生重建的組合后置聲道。
26.根據(jù)權利要求22到25之一所述的設備,其中,原始多聲道信號包括后置左聲道和后置右聲道,參數(shù)表示包括作為附加平衡參數(shù)或者作為第一或第二平衡參數(shù)的、后置左/右聲道對之間的后置左/右平衡參數(shù)(r4),后置左/右聲道對具有作為第一聲道的后置左聲道和作為第二聲道的后置右聲道,以及上混器可操作來基于后置左/右平衡參數(shù)產生重建的后置左聲道和重建的后置右聲道。
27.根據(jù)權利要求22到26之一所述的設備,其中,向所述設備提供的參數(shù)信息包括作為第一平衡參數(shù)的左/右平衡參數(shù)、作為第二平衡參數(shù)的中平衡參數(shù)、作為第三平衡參數(shù)的前/后平衡參數(shù)、作為第四平衡參數(shù)的后置左/右平衡參數(shù)、以及作為第五平衡參數(shù)的低頻增強平衡參數(shù),以及數(shù)據(jù)流在較低的擴展層中包括第一和第二平衡參數(shù),在一個或多個較高的擴展層中包括第三和第四平衡參數(shù)或相應的相干參數(shù)或相應的時間差,以及上混器可操作來使用第一平衡參數(shù)和第二平衡參數(shù)來產生左輸出聲道、右輸出聲道和包括中聲道的輸出聲道,或者上混器可操作來另外使用前/后平衡參數(shù)來另外重建后置左聲道和后置右聲道之和;或者上混器可操作來另外使用后置左/右平衡參數(shù)來重建后置左聲道和后置右聲道。
28.根據(jù)權利要求27所述的設備,其中,上混器可操作來產生重建的多聲道信號,并使得滿足下面的方程F=12γ2r51+r52M]]>A=1β2r41+r4r31+r311+r52M]]>E=1β211+r4r31+r311+r52M]]>C=12γ2r21+r211+r311+r32M]]>B=1α2(2r11+r1M-β2A-γ2C-δ2F)]]>D=1α2(211+r1M-β2E-γ2C-δ2F)]]>其中F對應低頻增強聲道,A對應左環(huán)繞聲道,E對應右環(huán)繞聲道,C對應中聲道,B對應左聲道,D對應右聲道,r1為左/右平衡參數(shù),r2為中/左-右平衡參數(shù),r3為前/后平衡參數(shù),r4為后置左/右平衡參數(shù),r5為中/低頻增強平衡參數(shù),并且其中α、β、γ和δ為縮混因子。
29.根據(jù)權利要求22到24之一所述的設備,其中,基本聲道的數(shù)量大于或等于二,并且參數(shù)表示包括作為第一和第二平衡參數(shù)之一或者作為附加平衡參數(shù)的、單側的前/后聲道對之間的至少一個單側前/后平衡參數(shù)(q3,q4),單側的前/后聲道對具有作為第一聲道的后置左聲道和作為第二聲道的左聲道或者具有作為第一聲道的后置右聲道和作為第二聲道的右聲道,并且上混器可操作來基于左聲道或右聲道以及相應的單側前/后平衡參數(shù)來產生重建的后置左聲道或重建的后置右聲道。
30.根據(jù)權利要求22所述的設備,其中,第一和第二平衡參數(shù)之一是第一左或右平衡參數(shù),并且聲道對包括作為第一聲道的左縮混聲道,以及作為第二聲道的左原始聲道或者后置左原始聲道,或者第一和第二平衡參數(shù)之一是右平衡參數(shù),并且聲道對包括作為第一聲道的右縮混聲道,以及作為第二聲道的右原始聲道或者后置右原始聲道,或者第一或第二平衡參數(shù)之一或者附加平衡參數(shù)是中平衡參數(shù),并且聲道對包括作為第一聲道的左和右縮混聲道之和,以及作為第二聲道的原始中聲道,以及上混器可操作來使用參數(shù)以及第一基本聲道、第二基本聲道或者第一和第二基本聲道的組合,產生重建聲道。
31.根據(jù)權利要求22到30之一所述的設備,其中,平衡參數(shù)是可擴展比特流的一部分,可擴展比特流在較低的擴展層中具有第一和第二平衡參數(shù),并在至少一個較高的擴展層中具有至少一個附加平衡參數(shù),并且所述設備還包括數(shù)據(jù)流提取器,用于提取所述較低的擴展層和若干較高的擴展層,其中較高擴展層的數(shù)目在0到小于擴展層總數(shù)的數(shù)字之間,數(shù)據(jù)流提取器可操作來根據(jù)與所述設備相關聯(lián)的輸出聲道配置而提取一定數(shù)目的較高擴展層,所述聲道配置具有的聲道數(shù)少于原始多聲道信號的聲道配置。
32.根據(jù)權利要求22到31之一所述的設備,還包括參數(shù)方案選擇器,用于控制上混器,使得上混器應用由參數(shù)方案控制信息所指示的參數(shù)方案。
33.一種用于產生具有至少三個原始聲道的多聲道輸入信號的參數(shù)表示的方法,包括產生(203)第一聲道對之間的第一平衡參數(shù)、第一相干參數(shù)或者第一時間差參數(shù),以及產生第二聲道對之間的第二平衡參數(shù)、第二相干參數(shù)或者第二時間參數(shù),其中平衡參數(shù)、相干參數(shù)或者時間參數(shù)形成參數(shù)表示,其中,第一聲道對具有兩個聲道,不同于第二聲道對的兩個聲道,以及雙聲道對中的每個聲道是原始聲道之一、原始聲道的加權或非加權組合、縮混聲道或者至少兩個縮混聲道的加權或非加權組合,以及第一聲道對和第二聲道對包括關于三個原始聲道的信息。
34.一種用于產生具有至少三個原始聲道的原始多聲道信號的重建多聲道表示的方法,使用通過用縮混方案將原始多聲道信號轉換而產生的若干基本聲道,并使用第一聲道對之間的第一平衡參數(shù)、第一相干參數(shù)或者第一時間差參數(shù),用于產生第二聲道對之間的第二平衡參數(shù)、第二相干參數(shù)或者第二時間參數(shù),其中平衡參數(shù)、相干參數(shù)或者時間參數(shù)形成參數(shù)表示,其中,第一聲道對具有兩個聲道,不同于第二聲道對的兩個聲道,以及雙聲道對中的每個聲道是原始聲道之一、原始聲道的加權或非加權組合、縮混聲道或者至少兩個縮混聲道的加權或非加權組合,以及第一聲道對和第二聲道對包括關于三個原始聲道的信息,所述方法包括產生(305)一定數(shù)量的上混聲道,上混聲道的數(shù)量比基本聲道的數(shù)量多,比原始聲道的數(shù)量少或者與之相等,其中,產生的步驟包括根據(jù)關于縮混方案的信息并使用平衡參數(shù)、相干參數(shù)或者聲道間時間差產生重建聲道,使得第一重建聲道對之間的平衡或相干或聲道間時間差由第一平衡參數(shù)、第一聲道間相干參數(shù)或者第一聲道間時間差確定,并且第二聲道對之間的平衡、聲道間相干或聲道間幅度差由第二平衡參數(shù)、第二聲道間相干參數(shù)或者第二聲道間時間差參數(shù)確定。
35.一種計算機程序,具有機器可讀指令,用于在計算機上運行時執(zhí)行權利要求33或34所述的方法。
36.一種具有至少三個原始聲道的多聲道輸入信號的參數(shù)表示,包括第一聲道對之間的第一平衡參數(shù)、第一相干參數(shù)或者第一時間差參數(shù),以及第二聲道對之間的第二平衡參數(shù)、第二相干參數(shù)或者第二時間參數(shù),其中平衡參數(shù)、相干參數(shù)或者時間參數(shù)形成參數(shù)表示,其中,第一聲道對具有兩個聲道,不同于第二聲道對的兩個聲道,以及雙聲道對中的每個聲道是原始聲道之一、原始聲道的加權或非加權組合、縮混聲道或者至少兩個縮混聲道的加權或非加權組合,以及第一聲道對和第二聲道對包括關于三個原始聲道的信息。
37.根據(jù)權利要求36所述的參數(shù)表示,用于在輸入到根據(jù)權利要求22所述的設備中時,控制多聲道重建。
全文摘要
含至少三個原始聲道的多聲道輸入信號采用多聲道信號的參數(shù)表示方式進行表示。計算出第一聲道對之間的第一平衡參數(shù)(r
文檔編號G10L19/008GK1965351SQ200580018659
公開日2007年5月16日 申請日期2005年4月12日 優(yōu)先權日2004年4月16日
發(fā)明者??啤て展? 拉爾斯·維爾默斯, 約納斯·恩德加, 約納斯·勒登, 克里斯托弗·薛林 申請人:科丁技術公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1