專利名稱:低位率空間編碼方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及人類聽(tīng)覺(jué)用多維聲域的記錄、傳送和重現(xiàn)。更具體地,本發(fā)明涉及一種感知編碼系統(tǒng),它的編碼器和解碼器以及它的方法的改進(jìn),其中編碼信號(hào)由一個(gè)組合音頻信號(hào)和一個(gè)方向向量所攜帶。本發(fā)明特別適用于要求非常低位率的系統(tǒng)。
美國(guó)專利5,583,962,5,632,005和5,633,981描述兩個(gè)用于音頻信號(hào)的減低位率感知編碼系統(tǒng),此處標(biāo)為“類型Ⅰ”和“類型Ⅱ”。所述5,583,962,5,632,005和5,633,981專利中的每一個(gè)都在此處全部引為參考。根據(jù)兩個(gè)系統(tǒng)的基礎(chǔ)原理,一個(gè)編碼器響應(yīng)于輸入的音頻信號(hào)流而生成頻率副帶信號(hào),這些副帶信號(hào)一般對(duì)應(yīng)于人類耳朵的重要頻帶。
在所述專利中描述的類型Ⅰ系統(tǒng)的編碼器中,當(dāng)有足夠數(shù)量的可用位數(shù)時(shí),每個(gè)音頻流都是單獨(dú)地編碼。當(dāng)位數(shù)不夠時(shí),一部分或全部副帶中的信號(hào)分量組合為一個(gè)組合信號(hào)和多個(gè)比例系數(shù),每個(gè)輸入的音頻流有一個(gè)比例系數(shù),每個(gè)比例系數(shù)基于每個(gè)音頻流中副帶信號(hào)分量中的某些量度。類型Ⅰ解碼器從組合信號(hào)和比例系數(shù)中重新構(gòu)造原始信號(hào)的表現(xiàn)。類型Ⅰ系統(tǒng)因而相對(duì)于在其中獨(dú)立地將每個(gè)音頻流編碼的專用離散系統(tǒng)而言能提供位數(shù)的節(jié)省或編碼增益。類型Ⅰ系統(tǒng)采用于AC-3編碼中,它組成Dolby數(shù)字感知編碼系統(tǒng)的基礎(chǔ),其中5.1音頻聲道(左、中、右、左環(huán)繞、右環(huán)繞和有限帶寬亞低音聲道)編碼為一個(gè)減低位率數(shù)據(jù)流。
在所述專利中描述的類型Ⅱ的編碼器中,當(dāng)有足夠數(shù)量的可用位數(shù)時(shí),每個(gè)音頻流都是單獨(dú)地編碼。當(dāng)位數(shù)不夠時(shí),一部分或全部副帶中的信號(hào)分量組合為一個(gè)組合信號(hào)和一個(gè)或多個(gè)方向向量,這些方向向量標(biāo)示由音頻流表現(xiàn)的聲域的一個(gè)或多個(gè)主要方向。類型Ⅱ解碼器從組合信號(hào)和一個(gè)或多個(gè)方向向量中重新構(gòu)造由原始信號(hào)表現(xiàn)的聲域的表現(xiàn)。類型Ⅱ系統(tǒng)因而相對(duì)于在其中獨(dú)立地將每個(gè)音頻流編碼的專用離散系統(tǒng)而言以及相對(duì)于在其中組合信號(hào)與每個(gè)音頻流的比例系數(shù)相關(guān)連的類型Ⅰ系統(tǒng)能夠提供位的節(jié)省或編碼增益。
在所述專利中描述的類型Ⅰ和類型Ⅱ系統(tǒng)在若干方面是適應(yīng)性的。它們的適應(yīng)性的一個(gè)方面在于一個(gè)或多個(gè)頻率副帶可在某些時(shí)間內(nèi)用一個(gè)“離散”模式操作以使頻率副帶中音頻流的所有副帶分量能夠單獨(dú)地編碼和解碼,而位數(shù)不夠時(shí)能使例如具體頻率副帶中音頻流的副帶分量根據(jù)類型Ⅰ方案或類型Ⅱ方案編碼。
還知道能在一個(gè)或多個(gè)頻率副帶內(nèi)適應(yīng)性地從類型Ⅰ至類型Ⅱ往返地改變操作模式。這類布置是1997年7月16日MarkFranklin Davis提交的名為“在低位率下將多音頻聲道編碼和解碼的方法和設(shè)備”的美國(guó)專利申請(qǐng)?zhí)朣.N.08/895,496的主題。因?yàn)轭愋廷蚍桨副阮愋廷穹桨敢筝^少位數(shù),通過(guò)采用類型Ⅱ編碼和解碼可以克服短時(shí)間內(nèi)位數(shù)不夠的困難。
本發(fā)明涉及類型Ⅱ編碼,它的編碼器和解碼器,以及可以有利地采用這類解碼器的環(huán)境。具體地,本發(fā)明旨在提出所述5,583,962,5,632,005和5,633,981專利中沒(méi)有公開(kāi)過(guò)的類型Ⅱ編碼器,解碼器以及解碼器環(huán)境的新的方面。雖然此處公開(kāi)的具體實(shí)施例涉及一個(gè)簡(jiǎn)化的類型Ⅱ版本,其中編碼器和解碼器優(yōu)選地是專用類型Ⅱ設(shè)備及采用單方向向量,作為本發(fā)明主題的類型Ⅱ編碼改進(jìn)的一定方面可以應(yīng)用于類型Ⅱ系統(tǒng)的更復(fù)雜的形式中,包括所述'962,'005和'981專利中描述的適應(yīng)性布置,及應(yīng)用于適應(yīng)性類型Ⅰ/類型Ⅱ系統(tǒng)中,例如在所述共同未決Davis申請(qǐng)中所描述的。在類型Ⅱ編碼器的簡(jiǎn)化的單方向向量版本中,根據(jù)通過(guò)方向向量進(jìn)行編碼的空間特性來(lái)看,可以稱為“空間編碼器”。在這整個(gè)文件中,所述'962,'005和'981專利的類型Ⅱ編碼的單向量版本稱為“空間編碼”。
本發(fā)明人認(rèn)為,即使聲音來(lái)自各個(gè)方向而且它們?cè)谥匾l帶中的頻率各不相同,但在足夠短的時(shí)間間隔內(nèi)例如幾個(gè)毫秒的數(shù)量級(jí)內(nèi),人類耳朵只能聽(tīng)見(jiàn)來(lái)自重要頻帶內(nèi)單方向的聲音。因此,對(duì)于其中方向向量能夠在足夠短的時(shí)間間隔內(nèi)改變的系統(tǒng),埋嵌于空間編碼器內(nèi)的類型Ⅱ系統(tǒng)的基本、單方向向量形式適合于表現(xiàn)聲域,即使它無(wú)法連續(xù)地和同時(shí)地重現(xiàn)所有聲道的多樣性。此效應(yīng)概念性地闡述于
圖1中;收聽(tīng)者101感收來(lái)自揚(yáng)聲器102和104之間的位置111處的副帶內(nèi)的聲音,即使副帶內(nèi)的聲音實(shí)際上來(lái)自所有揚(yáng)聲器102至110時(shí)亦是如此。
此“單方向”效應(yīng)與眾所周知的“相加局部化”效應(yīng)具有某些表面相似性。按照后一效應(yīng),如Blauert(Jens Blauert所著的“空間聽(tīng)覺(jué)人類聲音局部化的心理物理學(xué)”,The MIT Press,Cambridge,Massachusetts,revised edition,1997)所描述的,兩個(gè)或多個(gè)在一定時(shí)間內(nèi)發(fā)出一定幅值的彼此相干信號(hào)的聲音源產(chǎn)生單個(gè)幻覺(jué)信號(hào)的感受。具體地參閱Blauert論文的204、271和272頁(yè)。按照Blauert,當(dāng)一對(duì)最初相干的信號(hào)愈來(lái)愈不相干時(shí),收聽(tīng)者愈來(lái)愈能檢測(cè)不同的聲音。具體地參閱Blauert論文的240和242頁(yè)。然而,根據(jù)本發(fā)明者的單方向效應(yīng),當(dāng)多個(gè)信號(hào)之間頻率差別縮小至一個(gè)重要頻帶內(nèi)以及當(dāng)時(shí)間間隔足夠短時(shí),收聽(tīng)者感受它們作為來(lái)自不同方向的信號(hào)的能力也就消失。
本發(fā)明者知道在時(shí)間間隔的短暫性與附加位率要求(由于更高采樣率)之間存在折衷,當(dāng)時(shí)間間隔縮短時(shí)可能要求附加位率(見(jiàn)以下18與19頁(yè)的討論)。因此,對(duì)于其中采樣率低于單方向效應(yīng)的最優(yōu)值的極低位率系統(tǒng),在某些信號(hào)條件下可能損失一些多方向多信號(hào)收聽(tīng)者的感受和聲音定位的準(zhǔn)確度。然而所得重現(xiàn)結(jié)果很可能提供一個(gè)悅耳和可接受的多方向收聽(tīng)效果。本發(fā)明特別適用于其中位率受到嚴(yán)格限制的傳輸或記錄系統(tǒng),例如通過(guò)因特網(wǎng)的音頻信號(hào)。
本發(fā)明的一個(gè)方面基于以下了解當(dāng)空間編碼用于一個(gè)其中一個(gè)或多個(gè)收聽(tīng)者預(yù)測(cè)性地位于預(yù)定收聽(tīng)區(qū)內(nèi)的聲音重現(xiàn)布置中時(shí),此處所感受的空間編碼缺點(diǎn)主要是“信號(hào)躲閃”效應(yīng),事實(shí)上是優(yōu)點(diǎn)。本發(fā)明特別適用于以下收聽(tīng)環(huán)境其中一個(gè)或者可能兩個(gè)收聽(tīng)者預(yù)測(cè)性地位于可能稱為“空間編碼有利位置”中,這將在下面結(jié)合圖2、3和4加以解釋。在例如空間編碼有利位置這樣一個(gè)收聽(tīng)區(qū)內(nèi)產(chǎn)生一個(gè)非人為聲域的空間編碼能力是一個(gè)預(yù)料不到的結(jié)果。在空間編碼有利位置處一個(gè)或多個(gè)收聽(tīng)者在心理聲學(xué)上感受不到信號(hào)躲閃效應(yīng)。可以獲得一個(gè)穩(wěn)定而正常的聲域。
圖2顯示一個(gè)位于可預(yù)測(cè)收聽(tīng)區(qū)內(nèi)的收聽(tīng)者202,在五個(gè)揚(yáng)聲器-左(206)、中心(208)、右(210)、左環(huán)繞(212)和右環(huán)繞(214)中的理想的基本上圓形的空間編碼有利位置204,一個(gè)典型“環(huán)繞聲”回放布置。
在個(gè)人計(jì)算機(jī)(“多媒體”)聲響系統(tǒng)中,通常只采用兩個(gè)揚(yáng)聲器,即其位置鄰近于或靠近于計(jì)算機(jī)監(jiān)視器的左和右揚(yáng)聲器(可選地,可以在例如地板上遠(yuǎn)程地放置一個(gè)亞低音揚(yáng)聲器,在本討論中將忽略該亞低音揚(yáng)聲器)。這兩個(gè)揚(yáng)聲器建立一個(gè)相對(duì)小的最佳收聽(tīng)區(qū)。圖3顯示一個(gè)位于可預(yù)測(cè)收聽(tīng)區(qū)內(nèi)的收聽(tīng)者302和一個(gè)理想的空間編碼有利位置304,在計(jì)算機(jī)監(jiān)視器306之前有兩個(gè)揚(yáng)聲器-左(308)和右(310)各在其兩側(cè)。更完備的計(jì)算機(jī)音響系統(tǒng)可能以圖2布置的方式采用兩個(gè)以上的揚(yáng)聲器(計(jì)算機(jī)監(jiān)視器位于中心揚(yáng)聲器的位置上,在左和右揚(yáng)聲器之間)。
某些電視機(jī)可以建立類似的小最佳收聽(tīng)區(qū),其中一對(duì)揚(yáng)聲器位于屏幕的各一側(cè)。圖4顯示一個(gè)位于可預(yù)測(cè)收聽(tīng)區(qū)內(nèi)的收聽(tīng)者402和一個(gè)理想的空間編碼有利位置404,在電視機(jī)406之前有兩個(gè)鄰近于其顯象管412的內(nèi)裝揚(yáng)聲器-左(408)和右(410)。更完備的計(jì)算機(jī)音響系統(tǒng)可能以圖2布置的方式采用兩個(gè)以上的揚(yáng)聲器。例如,電視機(jī)可能具有組合入其柜中的左、中心和右揚(yáng)聲器,或者這些揚(yáng)聲器可能與環(huán)繞揚(yáng)聲器一樣位于電視機(jī)柜的外部。
Dolby AC-3系統(tǒng)和許多其他系統(tǒng)并不全部利用計(jì)算機(jī)或電視音響系統(tǒng)之前的收聽(tīng)者的可預(yù)測(cè)位置,從而浪費(fèi)這類環(huán)境中的位數(shù)。雖然空間編碼對(duì)例如圖1、2和3中所示環(huán)境特別有用,但空間編碼也用于較大環(huán)境中,應(yīng)該理解,當(dāng)揚(yáng)聲器之間的空間增加時(shí),可預(yù)測(cè)收聽(tīng)區(qū)的規(guī)模也增加。當(dāng)只在簡(jiǎn)短的位數(shù)短缺時(shí)間間隔內(nèi)使用時(shí),空間編碼也可用于較大環(huán)境,即使收聽(tīng)者位于可預(yù)測(cè)收聽(tīng)區(qū)之外時(shí)也可以。
在采用空間編碼器的簡(jiǎn)化環(huán)繞音響系統(tǒng)中(即只采用單方向向量的類型Ⅱ系統(tǒng)),只需發(fā)送足夠信息以便滿足可預(yù)測(cè)收聽(tīng)區(qū)或空間編碼有利位置內(nèi)的收聽(tīng)者。不必如AC-3系統(tǒng)中那樣,為重新建立例如所有五個(gè)聲道使之成為五個(gè)輸入聲道的正確復(fù)制內(nèi)容而嘗試提供所有所需信息。其結(jié)果是能夠顯著地減少位數(shù)??臻g編碼器并不將任何瞬間內(nèi)在可預(yù)測(cè)收聽(tīng)區(qū)內(nèi)聽(tīng)不到的任何內(nèi)容編碼,因此它非常有效。此簡(jiǎn)化系統(tǒng)甚至可能用于例如兩個(gè)位于可預(yù)測(cè)收聽(tīng)區(qū)內(nèi)的彼此靠近的收聽(tīng)者。
此簡(jiǎn)化處理的“信號(hào)躲閃”副作用是,如果收聽(tīng)者移出可預(yù)測(cè)收聽(tīng)區(qū)之外并且將耳朵放在任何具體揚(yáng)聲器上,當(dāng)程序內(nèi)容改變時(shí),聲音會(huì)時(shí)現(xiàn)時(shí)隱-即信號(hào)躲閃效應(yīng)(來(lái)自具體揚(yáng)聲器的信號(hào)可能“躲閃”或由來(lái)自其他聲道的信號(hào)所調(diào)制)。該效應(yīng)正是單簧管手所早就知道的;當(dāng)每次長(zhǎng)號(hào)手吹奏時(shí)他們對(duì)聽(tīng)眾的平靜吹奏就消失,而當(dāng)平靜下來(lái)時(shí)該吹奏又奇跡般地出現(xiàn)。雖然這一副作用在大的商業(yè)性劇院中或房間內(nèi)坐滿收聽(tīng)者的家庭影院內(nèi)(而不是如圖3中所示相對(duì)小的空間編碼有利位置內(nèi))是不能容忍的,該效應(yīng)對(duì)于可預(yù)測(cè)收聽(tīng)區(qū)內(nèi)的一個(gè)或兩個(gè)收聽(tīng)者來(lái)說(shuō)是善意的和聽(tīng)不出的。然而,如上所述,空間編碼也可用于大的商業(yè)性劇院和收聽(tīng)者坐滿房間的家庭影院中,但只是在簡(jiǎn)短時(shí)間間隔內(nèi)及例如極端缺少位數(shù)的情況下。
空間編碼的信號(hào)躲閃副作用在可預(yù)測(cè)收聽(tīng)區(qū)內(nèi)聽(tīng)不到這一事實(shí)允許將編碼器的位數(shù)要求限制在為在該區(qū)域內(nèi)生成一個(gè)悅耳收聽(tīng)印象所絕對(duì)需要的位數(shù)。當(dāng)不試圖提供“帶增益的直線”結(jié)果時(shí),可以在空間編碼有利位置中感受到一個(gè)好的可享受的將人工效果局部化至最小的效應(yīng)。
為增強(qiáng)雙揚(yáng)聲器計(jì)算機(jī)或電視機(jī)聲音重現(xiàn)布置的環(huán)繞聲效應(yīng),采用一個(gè)具有聲音交叉(或交叉饋送)消除器的“空間化器”來(lái)使解碼的空間編碼器信號(hào)“空間化”是有利的。當(dāng)通過(guò)常規(guī)手段在兩個(gè)揚(yáng)聲器上表現(xiàn)時(shí),立體聲內(nèi)容一般產(chǎn)生的聲音局限于揚(yáng)聲器本身和它們之間的空間。這是由于來(lái)自每個(gè)揚(yáng)聲器的聲音信號(hào)對(duì)位于計(jì)算機(jī)監(jiān)視器之前的收聽(tīng)者的遠(yuǎn)端耳朵的交叉饋送效果所造成的。通過(guò)將環(huán)繞聲道信號(hào)施加于聲音交叉消除器及將處理的信號(hào)與主要左和右信號(hào)相加,有可能產(chǎn)生一種感受,好像環(huán)繞聲信息來(lái)自位于收聽(tīng)者身后或一側(cè)的虛擬揚(yáng)聲器,事實(shí)上只采用了兩個(gè)向前放置的揚(yáng)聲器(左和右的聲道信號(hào)來(lái)自實(shí)際的正常揚(yáng)聲器位置)。
聲音交叉消除器的起源一般歸功于貝爾電話實(shí)驗(yàn)室的B.S.Atal和Manfred Schroeder(見(jiàn)例如美國(guó)專利3,236,949,它在此處整個(gè)地引為參考)。如最初由Schroeder和Atal所描述的,可以通過(guò)引進(jìn)來(lái)自對(duì)面的揚(yáng)聲器的合適的消除信號(hào)而減輕聲音交叉效應(yīng)。由于消除信號(hào)本身也具有聲音交叉效果,它也必須用來(lái)自原始發(fā)送的揚(yáng)聲器的合適信號(hào)加以消除,等等。
圖5A是用于顯示一個(gè)具有本發(fā)明的聲音交叉消除網(wǎng)絡(luò)的空間化器的一個(gè)類型的功能框圖。接收五個(gè)音頻輸入信號(hào),左、右、中心、環(huán)繞左和環(huán)繞右,如同Dolby數(shù)字AC-3系統(tǒng)。這些輸入分別施加于可選的DC阻塞濾波器502、504、506、508和510。左側(cè)、中心和右側(cè)輸入線中的可選的延遲器512、514和516具有與交叉消除網(wǎng)絡(luò)520中存在的任何時(shí)間延遲相當(dāng)?shù)臅r(shí)間延遲。除非網(wǎng)絡(luò)556包括例如幅值壓縮器/限幅器,通常在網(wǎng)絡(luò)520中沒(méi)有時(shí)間延遲和可以忽略延遲器512、514和516。在此例中,消除網(wǎng)絡(luò)520的輸入量是左環(huán)繞和右環(huán)繞輸入量。與圖5C的實(shí)施例一起描述消除網(wǎng)絡(luò)520的簡(jiǎn)化實(shí)施例。再參照?qǐng)D5A,第一線性附加相加器522接收延遲的左聲道音頻流。第二線性附加相加器524接收延遲的右聲道音頻流。延遲的中心聲道音頻流施加于相加器522和相加器524。來(lái)自網(wǎng)絡(luò)520的處理的左環(huán)繞聲道音頻流也施加于相加器522。來(lái)自網(wǎng)絡(luò)520的處理的右環(huán)繞聲道音頻流也施加于相加器524。只有左和右環(huán)繞聲道音頻流由消除網(wǎng)絡(luò)處理。左和右前聲道分別加至消除網(wǎng)絡(luò)處理過(guò)的左和右環(huán)繞聲道。中心聲道同相地加至左和右輸出量而無(wú)任何附加處理。
當(dāng)存在四個(gè)輸入信號(hào)(左、中心和右聲道,單個(gè)環(huán)繞聲道)時(shí),例如由Dolby Surround或Dolby Surround Pro Logic解碼器提供的信號(hào)時(shí),圖5A的布置也可使用。在此情況下,單個(gè)環(huán)繞聲道應(yīng)該解偶為兩個(gè)偽立體聲信號(hào),然后將它們施加于消除器的輸入端。簡(jiǎn)單的偽立體聲轉(zhuǎn)換可以應(yīng)用移相技術(shù),就是使一個(gè)信號(hào)的相位與另一個(gè)信號(hào)的相位不同。技術(shù)中知道許多其他偽立體聲轉(zhuǎn)換技術(shù)。
圖5B顯示圖5A中空間化器的附加選代項(xiàng)。在圖5B中,左和右前聲道由塊526中的部分地反相混合來(lái)稍為加寬。用反相混合來(lái)加寬表面立體聲“舞臺(tái)”是眾所周知的技術(shù)。作為另一個(gè)選項(xiàng),可以消除中心聲道以便使每個(gè)耳朵兩次聽(tīng)到的中心信號(hào)(一次來(lái)自近的揚(yáng)聲器而又一次來(lái)自遠(yuǎn)的揚(yáng)聲器)所造成的細(xì)微變化減至最小??梢詫⒅行穆暤缆曇艚徊嫘盘?hào)施加于環(huán)繞聲道交叉消除網(wǎng)絡(luò)而消除它們,而并不要求單獨(dú)地實(shí)施消除器。因此,中心聲道信號(hào)分別通過(guò)線性附加相加器526和528混合入左環(huán)繞和右環(huán)繞輸入中,送至交叉消除網(wǎng)絡(luò)520。
圖5C是用于顯示圖5A或圖5B的布置中可用的簡(jiǎn)單聲音交叉消除器的基本元件的功能框圖??梢圆捎闷渌鼮閺?fù)雜的消除器。對(duì)于相對(duì)于收聽(tīng)者+/-15度角向前放置的揚(yáng)聲器而言,每個(gè)延遲器530和532通常約為140微秒,該15度角是圖1的計(jì)算機(jī)監(jiān)視器環(huán)境和圖2的電視機(jī)環(huán)境的典型角度。濾波器534和536中的每一個(gè)是簡(jiǎn)單的與頻率無(wú)關(guān)的衰減系數(shù)K,它通常約為0.9。每個(gè)交叉饋送分支538和540的輸入量在交叉聲道負(fù)反饋布置中(每個(gè)分支在相應(yīng)的相加器處相減)取自附加相加器(分別是542和544)的輸出端,以便如上所述地生成對(duì)每個(gè)先前消除器信號(hào)的消除器。這是可以數(shù)字地實(shí)現(xiàn)的非常簡(jiǎn)單的聲音交叉消除器兩次相加,兩次相乘及用于延遲的一對(duì)6個(gè)樣本環(huán)形緩存。如果使用,最好使用軟件數(shù)字地實(shí)施聲音交叉消除器,并且在具有圖3中所示監(jiān)視器306的個(gè)人計(jì)算機(jī)上或圖4中所示電視機(jī)406中的微處理器上實(shí)時(shí)運(yùn)行該軟件。
根據(jù)本發(fā)明,編碼器產(chǎn)生一個(gè)表現(xiàn)待重現(xiàn)的聲域的組合音頻信息信號(hào)和一個(gè)方向向量或“操縱控制信號(hào)”。組合音頻信息信號(hào)具有其自己的頻譜,該頻譜拆分為若干副帶,它們最好相當(dāng)于人類耳朵的重要頻帶。操縱控制信號(hào)具有一個(gè)與每個(gè)副帶中聲域的主要方向相關(guān)的分量。
雖然本發(fā)明可以使用模擬或數(shù)字技術(shù)或甚至這些技術(shù)的混合來(lái)實(shí)施,但本發(fā)明可以更方便地使用數(shù)字技術(shù)來(lái)實(shí)施,及此處公開(kāi)的優(yōu)選實(shí)施例是數(shù)字實(shí)施。
在本發(fā)明的一個(gè)實(shí)施例中,一個(gè)編碼器接收多條音頻流,其中每一條用于表現(xiàn)一個(gè)輸入聲道以及這些輸入聲道中的每一個(gè)的局部化特性。解碼器接收一個(gè)編碼信號(hào)以及每個(gè)輸出聲道的聲音傳感器的位置或虛擬位置,并且為每個(gè)輸出聲道提供一條信號(hào)流以便盡可能準(zhǔn)確地重現(xiàn)由輸入聲道信號(hào)表現(xiàn)的聲域。因?yàn)楸景l(fā)明的空間編碼方案基于以下約定任何瞬間只聽(tīng)見(jiàn)來(lái)自單方向的聲音,任何瞬間內(nèi)解碼器不必施加一個(gè)信號(hào)至多于兩個(gè)聲音傳感器。編碼信息包括每個(gè)副帶的所有輸入聲道的聚集表現(xiàn)。該聚集表現(xiàn)包括一個(gè)用于表現(xiàn)凈總聲域音平的組合音頻信息信號(hào)及一個(gè)包括該聲域的局部化信息的操縱控制信號(hào)。此處將此局部化信息稱為凈方向向量。
在解碼器中也有以下情況只有一個(gè)方向得到位數(shù),因此每個(gè)時(shí)間間隔內(nèi)在每個(gè)重要頻帶內(nèi)只有一個(gè)或兩個(gè)表現(xiàn)聲道得到位數(shù)(當(dāng)聲域方向成為與表現(xiàn)聲道方向一致時(shí),一個(gè)表現(xiàn)聲道是合適的;否則需要兩個(gè)表現(xiàn)聲道用于將聲域方向定位)。
本發(fā)明的一個(gè)方面是用于將多條表現(xiàn)聲域的音頻流編碼為一個(gè)編碼信號(hào)和用于將編碼信號(hào)解碼的低位率空間編碼系統(tǒng),該系統(tǒng)包括一個(gè)編碼器和一個(gè)解碼器。該編碼器包括一個(gè)副帶信號(hào)發(fā)生器,用于響應(yīng)于多條音頻流而生成多個(gè)副帶信號(hào),每個(gè)副帶信號(hào)表現(xiàn)一條相應(yīng)的音頻流的相應(yīng)頻率副帶,一個(gè)信號(hào)組合器,用于生成一個(gè)表現(xiàn)相應(yīng)頻率副帶中副帶信號(hào)的組合的組合信號(hào),一個(gè)聲域方向檢測(cè)器,用于為組合信號(hào)生成一個(gè)用于標(biāo)示相應(yīng)副帶內(nèi)聲域的主要方向的操縱控制信號(hào),一個(gè)編碼器和位分配器,用于通過(guò)向組合信號(hào)和操縱控制信號(hào)分配位數(shù)而生成編碼信息,及一個(gè)格式化器,用于將編碼信息組裝成一個(gè)編碼信號(hào)。
該解碼器包括一個(gè)去格式化器,用于自編碼信號(hào)中獲取組合信號(hào)和操縱控制信號(hào),一個(gè)逆副帶發(fā)生器,用于響應(yīng)于組合信號(hào)和操縱控制信號(hào)而獲取副帶信號(hào),一個(gè)信息輸入,用于描述解碼器的輸出聲道數(shù)量和連至相應(yīng)輸出聲道的聲音傳感器的位置或虛擬位置,其中存在三條或更多輸出聲道,及一個(gè)信號(hào)發(fā)生器,用于響應(yīng)于所述副帶信號(hào)和重現(xiàn)信息而在任何瞬間在不多于兩條輸出聲道中生成一條音頻流。
本發(fā)明的另一個(gè)方面是用于將多條表現(xiàn)聲域的音頻流編碼為一個(gè)編碼信號(hào),用于將編碼信號(hào)解碼和用于重現(xiàn)聲域的聽(tīng)覺(jué)相似感受的低位率空間編碼系統(tǒng),該系統(tǒng)包括一個(gè)編碼器和一個(gè)解碼器。該編碼器包括
一個(gè)副帶信號(hào)發(fā)生器,用于響應(yīng)于多條音頻流而生成多個(gè)副帶信號(hào),每個(gè)副帶信號(hào)表現(xiàn)一條相應(yīng)的音頻流的相應(yīng)頻率副帶,一個(gè)信號(hào)組合器,用于生成一個(gè)表現(xiàn)每個(gè)頻率副帶中副帶信號(hào)的組合的組合信號(hào),一個(gè)聲域方向檢測(cè)器,用于為組合信號(hào)生成一個(gè)用于標(biāo)示每個(gè)副帶內(nèi)聲域的主要方向的操縱控制信號(hào),一個(gè)編碼器和位分配器,用于通過(guò)向組合信號(hào)和操縱控制信號(hào)分配位而生成編碼信息,及一個(gè)格式化器,用于將編碼信息組裝成一個(gè)編碼信號(hào)。
該解碼器包括一個(gè)去格式化器,用于自編碼信號(hào)中獲取組合信號(hào)和操縱控制信號(hào),一個(gè)逆副帶發(fā)生器,用于響應(yīng)于組合信號(hào)和操縱控制信號(hào)而獲取副帶信號(hào),一個(gè)信息輸入,用于描述解碼器的輸出聲道數(shù)量和連至相應(yīng)輸出聲道的聲音傳感器的位置或虛擬位置,及一個(gè)信號(hào)發(fā)生器,用于響應(yīng)于副帶信號(hào)和重現(xiàn)信息而在一條或更多輸出聲道中生成一條音頻流。
該系統(tǒng)還包括多個(gè)聲音傳感器,連至解碼器的輸出聲道并且布置為對(duì)于空間編碼有利位置收聽(tīng)區(qū)內(nèi)的一個(gè)或多個(gè)收聽(tīng)者生成聲域的聽(tīng)覺(jué)相似感受。
本發(fā)明的又一個(gè)方面是用于低位率空間編碼系統(tǒng)中的解碼器,通過(guò)響應(yīng)于多條表現(xiàn)聲域的音頻流而生成多個(gè)副帶信號(hào)而用于將從多條音頻流中獲取的一個(gè)編碼信號(hào)解碼,每個(gè)副帶信號(hào)表現(xiàn)一條相應(yīng)的音頻流的相應(yīng)頻率副帶,該解碼器生成一個(gè)表現(xiàn)相應(yīng)頻率副帶中副帶信號(hào)的組合的組合信號(hào),為組合信號(hào)生成一個(gè)用于標(biāo)示相應(yīng)副帶內(nèi)聲域的主要方向的操縱控制信號(hào),通過(guò)向組合信號(hào)和操縱控制信號(hào)分配位數(shù)而生成編碼信息,及將編碼信息組裝成一個(gè)編碼信號(hào)。該解碼器包括一個(gè)去格式化器,用于自編碼信號(hào)中獲取組合信號(hào)和操縱控制信號(hào),一個(gè)逆副帶發(fā)生器,用于響應(yīng)于組合信號(hào)和操縱控制信號(hào)而獲取副帶信號(hào),一個(gè)信息輸入,用于描述解碼器的輸出聲道數(shù)量和連至相應(yīng)輸出聲道的聲音傳感器的位置或虛擬位置,其中存在三條或更多輸出聲道,及一個(gè)信號(hào)發(fā)生器,用于響應(yīng)于副帶信號(hào)和重現(xiàn)信息而在任何瞬間在不多于兩條輸出聲道中生成一條音頻流。
本發(fā)明還有一個(gè)方面是用于低位率空間編碼系統(tǒng)中的解碼器和重現(xiàn)系統(tǒng),通過(guò)響應(yīng)于多條表現(xiàn)聲域的音頻流而生成多個(gè)副帶信號(hào)而用于將從多條音頻流中獲取的一個(gè)編碼信號(hào)解碼和重現(xiàn),每個(gè)副帶信號(hào)表現(xiàn)一條相應(yīng)的音頻流的相應(yīng)頻率副帶,該解碼器和重現(xiàn)系統(tǒng)生成一個(gè)表現(xiàn)相應(yīng)頻率副帶中副帶信號(hào)的組合的組合信號(hào),為組合信號(hào)生成一個(gè)用于標(biāo)示相應(yīng)副帶內(nèi)聲域的主要方向的操縱控制信號(hào),通過(guò)向組合信號(hào)和操縱控制信號(hào)分配位數(shù)而生成編碼信息,及將編碼信息組裝成一個(gè)編碼信號(hào)。該解碼器和重現(xiàn)系統(tǒng)包括一個(gè)去格式化器,用于自編碼信號(hào)中獲取組合信號(hào)和操縱控制信號(hào),一個(gè)逆副帶發(fā)生器,用于響應(yīng)于組合信號(hào)和操縱控制信號(hào)而獲取副帶信號(hào),一個(gè)信息輸入,用于描述解碼器的輸出聲道數(shù)量和連至相應(yīng)輸出聲道的聲音傳感器的位置或虛擬位置,及一個(gè)信號(hào)發(fā)生器,用于響應(yīng)于副帶信號(hào)和重現(xiàn)信息而在一條或更多輸出聲道中生成一條音頻流,及多個(gè)聲音傳感器,連至解碼器的輸出聲道并且布置為對(duì)于空間編碼有利位置收聽(tīng)區(qū)內(nèi)的一個(gè)或多個(gè)收聽(tīng)者生成聲域的聽(tīng)覺(jué)相似感受。
本發(fā)明的不同特征及其優(yōu)選實(shí)施例在以下“實(shí)現(xiàn)本發(fā)明的最好模式”及其附圖中更詳細(xì)地說(shuō)明。
圖1是一個(gè)概念圖,用于闡述一個(gè)人收聽(tīng)由多條表現(xiàn)聲道產(chǎn)生的聲域,但他感受到聲音猶如來(lái)自一個(gè)點(diǎn)。
圖2是一個(gè)收聽(tīng)者位于五個(gè)揚(yáng)聲器“環(huán)繞聲”重現(xiàn)布置中的理想空間編碼有利位置上的平面示意圖。
圖3是一個(gè)收聽(tīng)者位于具有兩側(cè)揚(yáng)聲器的計(jì)算機(jī)監(jiān)視器之前的理想空間編碼有利位置上的平面示意圖。
圖4是一個(gè)收聽(tīng)者位于具有鄰近于其顯象管的揚(yáng)聲器的電視機(jī)之前的理想空間編碼有利位置上的平面示意圖。
圖5A是一個(gè)采用聲音交叉消除器的空間化器的功能框圖。
圖5B是一個(gè)采用聲音交叉消除器的修改的空間化器的功能框圖。
圖5C是一個(gè)根據(jù)現(xiàn)有技術(shù)的簡(jiǎn)單四端口聲音交叉消除器的的功能框圖。
圖6是用于顯示空間編碼和解碼的概念框圖。
圖7是用于闡述副帶編碼器的基本結(jié)構(gòu)的功能框圖。
圖8是用于闡述副帶解碼器的基本結(jié)構(gòu)的功能框圖。
圖9是本發(fā)明涉及副帶編碼的基本結(jié)構(gòu)的功能框圖。
圖10是本發(fā)明涉及副帶解碼的基本結(jié)構(gòu)的功能框圖。
圖11是具有五個(gè)表現(xiàn)聲道的三維內(nèi)的重現(xiàn)系統(tǒng)的假設(shè)性圖形表現(xiàn)。
圖12A是與一個(gè)可預(yù)測(cè)回放環(huán)境一起運(yùn)行的空間解碼器的原理功能框圖。
圖12B是與另一個(gè)可預(yù)測(cè)回放環(huán)境一起運(yùn)行的空間解碼器的原理功能框圖。
圖6是類型Ⅱ編碼系統(tǒng)的一個(gè)實(shí)施例的概念闡述。一個(gè)包括過(guò)程604和606的編碼器從來(lái)自副帶編碼器(見(jiàn)圖7)的多條輸入聲道602接收表現(xiàn)一個(gè)聲域的副帶信號(hào),同時(shí)從路徑603接收關(guān)于如何將聲域映射至這些輸入聲道中的每一條的信息。過(guò)程604將信號(hào)組合成一個(gè)沿路徑608通過(guò)的組合信息信號(hào)。過(guò)程606建立一個(gè)用于表現(xiàn)沿路徑610通過(guò)的聲域的表面方向的操縱控制信號(hào)。包括過(guò)程612的解碼器從路徑613接收關(guān)于輸出聲道數(shù)量及關(guān)于表現(xiàn)系統(tǒng)中輸出聲道聲音傳感器的實(shí)際或虛擬空間配置的信息,從路徑608和610接收一個(gè)組合聲道信號(hào),以及沿輸出聲道614生成輸出信號(hào)以供表現(xiàn)聲域之用。
在空間編碼器的實(shí)際應(yīng)用中,送至編碼器的信息是表現(xiàn)輸入聲道的信號(hào)流的組合。編碼器與所需重現(xiàn)聲域有關(guān);因此,它必須接收關(guān)于如何嘗試將這些輸入聲道與該聲域相連系的信息。例如,在通常標(biāo)準(zhǔn)化揚(yáng)聲器位置的具有左、中心、右、左環(huán)繞和右環(huán)繞重現(xiàn)的五聲道源的情況下,可從五個(gè)準(zhǔn)備施加于這些揚(yáng)聲器位置的五聲道信號(hào)中獲取凈方向向量。
一個(gè)接收關(guān)于回放或表現(xiàn)環(huán)境的信息的空間編碼解碼器能夠使用凈方向向量以便產(chǎn)生一組信號(hào),用于所準(zhǔn)備的五聲道回放或表現(xiàn)或者用于其他使用不同數(shù)量聲道和/或揚(yáng)聲器位置的回放或表現(xiàn)環(huán)境。例如,可以為兩個(gè)揚(yáng)聲器計(jì)算機(jī)監(jiān)視器環(huán)境將組合音頻信息信號(hào)和凈方向向量解碼。如上所述,解碼可能包括一個(gè)“空間化器”以使所得的表現(xiàn)能提供一個(gè)聲域的心理聲學(xué)效應(yīng)而不限于兩個(gè)揚(yáng)聲器和它們之間的空間。
本發(fā)明不限于任何用于生成多條輸入聲道的具體方案,也不限于任何用于撲獲或重新建立聲域的具體方案。本發(fā)明在編碼器處接收任何組的多條聲道信息作為輸入,這些輸入聲道具有定義輸入聲道的產(chǎn)生者準(zhǔn)備如何產(chǎn)生一個(gè)聲域所需信息,例如它們準(zhǔn)備具有的相對(duì)于收聽(tīng)者的方向。編碼器將這些信息和這些聲音聲道翻譯成一個(gè)組合音頻信息信號(hào)和一個(gè)凈方向向量操縱控制信號(hào),以使解碼器能夠提供一組表現(xiàn)聲道作為輸出,它們產(chǎn)生與表現(xiàn)設(shè)備和環(huán)境的回放能力相當(dāng)?shù)目赡茏詈玫穆曈?。由解碼器產(chǎn)生的聲道數(shù)量由表現(xiàn)系統(tǒng)的特性所決定,因此不必要等于輸入聲道的數(shù)量。
本發(fā)明應(yīng)用于由任何許多已知技術(shù)所實(shí)施的副帶編碼器。一個(gè)優(yōu)選實(shí)施例使用一個(gè)轉(zhuǎn)換,更具體的是根據(jù)時(shí)域混疊消除(TDAC)技術(shù)的時(shí)域至頻域的轉(zhuǎn)換。見(jiàn)Princen和Bradley的“基于時(shí)域混疊消除的分析/綜合濾波器組設(shè)計(jì)”(IEEE Trans.onAcoust.,Speech,Signal Proc.,vol.ASSP-34,1986,pp.1153-1161)。一個(gè)利用TDAC轉(zhuǎn)換的轉(zhuǎn)換編碼器/解碼器系統(tǒng)的例子提供于美國(guó)專利5,109,417中,它在此處整個(gè)引為參考。
如圖7中所示,典型單聲道副帶編碼包括由濾波器組710將一條輸入信號(hào)流810拆分為各副帶,由編碼器730將這些副帶信息轉(zhuǎn)換為量化代碼字,以及由格式化器740將這些量化代碼字組合為適合于傳輸或存儲(chǔ)的形式。如果濾波器組由數(shù)字濾波器或離散轉(zhuǎn)換所實(shí)施,則在濾波器組濾波之前由采樣器700將輸入信號(hào)采樣和數(shù)字化。如果濾波器組由模擬濾波器實(shí)施,則可以由采樣器720將副帶信號(hào)采樣和數(shù)字化以便由編碼器730進(jìn)行數(shù)字編碼。在一方面,本發(fā)明涉及用于多個(gè)信息聲道的編碼器730。例如,圖6中每個(gè)輸入602組成施加于編碼器730的副帶信息。
如圖8中所示,典型單聲道數(shù)字副帶解碼包括由去格式化器810將格式化代碼字分拆,由解碼器820將副帶信息恢復(fù),以及由逆濾波器組840將副帶信息合并為一個(gè)單聲道信號(hào)。如果逆濾波器組由模擬濾波器實(shí)施及信號(hào)是數(shù)字地編碼的,則在逆濾波器組濾波之前由轉(zhuǎn)換器830將副帶信息轉(zhuǎn)換為模擬形式。如果逆濾波器組由數(shù)字濾波器或離散轉(zhuǎn)換所實(shí)施,則由轉(zhuǎn)換器850將數(shù)字信號(hào)轉(zhuǎn)換為模擬形式。在另一方面,本發(fā)明涉及用于多信息聲道的解碼器820。
副帶操縱將來(lái)自一條或多條聲道的副帶頻譜分量組合為一個(gè)組合信號(hào)。副帶的組合表現(xiàn)被傳輸或記錄以替代由組合聲道副帶所表現(xiàn)的個(gè)別聲道副帶頻譜分量。有兩個(gè)相應(yīng)的方法用于形成組合聲道。可以使用任何一個(gè)方法來(lái)得到相同結(jié)果。一個(gè)方案是首先對(duì)每條聲道應(yīng)用帶內(nèi)屏蔽準(zhǔn)則以便通過(guò)消除屏蔽的信號(hào)分量的編碼來(lái)減少每條聲道所需位數(shù),以及然后合并那些位數(shù)減少聲道以建立一個(gè)組合信號(hào)。將在下面更詳細(xì)地描述的另一個(gè)方案是首先合并原始聲道信號(hào)以便建立組合信號(hào),以及然后對(duì)該組合信號(hào)應(yīng)用帶內(nèi)屏蔽準(zhǔn)則以便通過(guò)消除屏蔽信號(hào)分量的編碼來(lái)減少位數(shù)。可認(rèn)為這兩個(gè)情況下所得組合信號(hào)是相同或基本相同的。在任何一種情況下,空間編碼器采用兩種類型的屏蔽-所得組合信號(hào)中的交叉聲道屏蔽和帶內(nèi)屏蔽。因此,本發(fā)明準(zhǔn)備用于覆蓋兩個(gè)用于形成組合信號(hào)的使用方法中的任何一個(gè)。
操縱控制信號(hào)(或凈方向向量)表現(xiàn)從各條聲道來(lái)的頻譜分量的表面主要方向。
根據(jù)本發(fā)明用于數(shù)字編碼技術(shù)的原理,用于表現(xiàn)頻譜分量的數(shù)字值可量化為代碼字,其中來(lái)自位存儲(chǔ)區(qū)的可變數(shù)量的位數(shù)可以適應(yīng)性地分配給至少某些代碼字。位數(shù)分配基于以下判斷由于現(xiàn)有信號(hào)內(nèi)容,某些副帶內(nèi)的量化誤差是否會(huì)比其他副帶內(nèi)的量化誤差更為嚴(yán)重地降低表面質(zhì)量。更具體地,對(duì)于其量化誤差比其他副帶內(nèi)的量化誤差較少受到心理聲學(xué)屏蔽的副帶內(nèi)的頻譜分量,將賦予更多位數(shù)。
根據(jù)本發(fā)明對(duì)于解碼的原理,逆操縱使用操縱控制信號(hào)來(lái)從組合通道中恢復(fù)操縱的聲道的表現(xiàn)。因?yàn)楦鶕?jù)本發(fā)明的空間編碼使用單方向向量及考慮到任何瞬間收聽(tīng)者只從一個(gè)方向內(nèi)聽(tīng)見(jiàn)聲音的基本原理,只需生成一條或兩條聲道以供具體表現(xiàn)系統(tǒng)的表現(xiàn)之用。解碼器的聲道數(shù)量由表現(xiàn)系統(tǒng)的特性所決定,因此它不必等于輸入聲道的數(shù)量。
再者,根據(jù)本發(fā)明關(guān)于數(shù)字解碼技術(shù)的原理,完成一個(gè)基本上類似于編碼期間所使用的適應(yīng)性位分配過(guò)程以便建立賦予每個(gè)量化的代碼字的位數(shù)。此信息用于重新構(gòu)造副帶頻譜分量。
圖9是空間編碼編碼器(即簡(jiǎn)化的單向量類型Ⅱ編碼器)的原理功能框圖。編碼器可以使用不同模擬和數(shù)字編碼技術(shù)實(shí)施??梢允褂脭?shù)字技術(shù)更方便地實(shí)施本發(fā)明及此處公開(kāi)的實(shí)施例是數(shù)字地實(shí)施的。
數(shù)字實(shí)施可以采用適應(yīng)性位分配技術(shù)。以下優(yōu)選實(shí)施例的描述說(shuō)明適應(yīng)性位分配和副帶操縱概念兩者,然而應(yīng)該理解,可以使用空間編碼的數(shù)字實(shí)施而位分配方案可以不是適應(yīng)性的。
參照?qǐng)D9,輸入路徑901上多條輸入聲道1至N中的每一條的副帶信號(hào)分量由一個(gè)表面方向和組合信號(hào)發(fā)生器902處理以便建立一個(gè)表面方向操縱控制信號(hào)和一個(gè)組合信號(hào)。該過(guò)程還接收源信息,用于標(biāo)示源聲域如何映射至每條輸入聲道(用于描述每條聲道的信號(hào)準(zhǔn)備用的空間方向的信息)。源和重現(xiàn)信息可以是不同的,即永久或可編程。編碼器可以包括涉及源和/或回放環(huán)境的永久指令或者可以通過(guò)如圖9中所示輸入路徑自編碼器外部提供這類指令。自副帶輸入信號(hào)和源信息中獲取表現(xiàn)源聲域的組合音頻信息信號(hào)。自副帶輸入信號(hào)和源信息中獲取包括聲域的局部化信息在內(nèi)的具有單方向向量形式的操縱控制信號(hào)。
自塊902輸出的組合信號(hào)也施加于粗音平量化器904,它用于量化單個(gè)組合聲道的副帶頻譜信息。適應(yīng)性位分配器908響應(yīng)于自粗音平量化器904接收的粗量化信息和自位存儲(chǔ)區(qū)910接收的位置的可用位數(shù)而分配若干位數(shù)給不同副帶。量化器912響應(yīng)于組合信號(hào)、粗音平量化器的輸出和適應(yīng)性位分配器的輸出而適應(yīng)性地量化組合信號(hào)頻譜信息為量化代碼字。雖然下面描述一個(gè)合適的算法,但編碼器用于適應(yīng)性地分配位數(shù)的算法對(duì)于本發(fā)明并不重要。量化器912還量化操縱控制信號(hào)。量化器912分別沿路徑914-918提供操縱信息、量化代碼字和粗量化信息作為輸出。
圖10是一個(gè)空間編碼解碼器的原理功能框圖。適應(yīng)性位分配計(jì)算器1002響應(yīng)于自編碼器輸出端918接收的粗量化信息和自位存儲(chǔ)區(qū)1004接收的可用分配位數(shù)而在量化期間確定分配給每個(gè)代碼字的位數(shù);去量化器1006將自編碼器輸出端914接收的操縱控制信號(hào)去量化及響應(yīng)于自編碼器輸出端916接收的量化代碼字、自編碼器輸出端918接收的粗量化信息和自適應(yīng)性位分配計(jì)算器1002接收的位分配信息而恢復(fù)頻譜分量信息,以及在路徑1008上在其輸出端處提供單方向向量信息,在線路1010上提供組合聲道副帶成分,以及在路徑1012上提供組合聲道頻譜分量。這些輸出都施加于一個(gè)逆表面方向和組合信號(hào)發(fā)生器1014,后者也接收用于描述所希望輸出聲道數(shù)量和連至輸出聲道的傳感器(例如揚(yáng)聲器)的位置或虛擬位置的信息。重現(xiàn)信息可以是永久的或可編程的。解碼器可以包括關(guān)于回放環(huán)境的永久指令或者可以如圖10中所示地通過(guò)一條輸入路徑自解碼器外部提供這類指令。發(fā)生器1014響應(yīng)于在路徑1008-1012上接收的操縱和組合頻譜信息而重新構(gòu)造副帶,以及在接收到一組副帶信號(hào)和方向向量的每個(gè)時(shí)間間隔內(nèi)為一條或兩條副帶頻譜信息的聲道提供一組完全的副帶組,其中每條聲道表現(xiàn)為標(biāo)以Ch 1,…,Ch N的路徑1016的一部分。在該時(shí)間間隔內(nèi)只為每個(gè)副帶啟動(dòng)一條或兩條聲道就已足夠用于自每個(gè)副帶內(nèi)的單個(gè)方向中重現(xiàn)聲音。換言之,相對(duì)于任何具體副帶而言,在每個(gè)時(shí)間間隔內(nèi)只有一條或兩條聲道在工作。
以下說(shuō)明中更詳細(xì)地描述本發(fā)明的優(yōu)選實(shí)施例中關(guān)于編碼和解碼的部分。在整個(gè)討論中提出本發(fā)明的選代實(shí)施例和結(jié)構(gòu)。
再參照?qǐng)D9,它闡述一個(gè)類型Ⅱ副帶編碼器,可以看出,表面方向和組合信號(hào)發(fā)生器902沿路徑901接收副帶信息的多條聲道。如果副帶塊是由離散轉(zhuǎn)換例如離散傅里葉轉(zhuǎn)換(DFT)獲取的,則每個(gè)副帶將要包含一個(gè)或多個(gè)離散轉(zhuǎn)換系數(shù)。一個(gè)20kHz帶寬信號(hào)的具體副帶布置利用512點(diǎn)轉(zhuǎn)換和48kHz的輸入信號(hào)采樣率。這些副帶一般相當(dāng)于耳朵的重要頻帶。可以在不背離本發(fā)明范圍的情況下利用其他副帶組合、采樣率和轉(zhuǎn)換長(zhǎng)度。
如上所述,認(rèn)為在足夠短的時(shí)間間隔內(nèi)單方向效應(yīng)起作用。在48kHz采樣率和512點(diǎn)轉(zhuǎn)換的情況下,每個(gè)轉(zhuǎn)換塊具有大約為10毫秒的時(shí)間間隔(在TDAC轉(zhuǎn)換的情況下,考慮到TDAC過(guò)程中固有的塊至塊平均值,這只是一個(gè)近似值)。因此,大約每隔10毫秒生成一組連續(xù)的組合副帶信號(hào)。每個(gè)組合塊可以具有與它相關(guān)連的單方向向量,或者選代地,可以在通常大于或小于塊周期的規(guī)律基礎(chǔ)上生成方向向量。另一個(gè)選代例子是只當(dāng)主要方向內(nèi)的偏移大于一個(gè)閾值(例如大于30度)時(shí),才在一個(gè)塊周期內(nèi)生成一個(gè)或多個(gè)附加方向向量。本發(fā)明人發(fā)現(xiàn)基于TDAC轉(zhuǎn)換的系統(tǒng)的塊長(zhǎng)度約為10毫秒以及在每個(gè)塊周期內(nèi)單方向向量提供一個(gè)愉快的音樂(lè)重現(xiàn)效果。
表面方向和組合信號(hào)發(fā)生器過(guò)程將來(lái)自多條聲道的頻譜分量加以合并而形成一個(gè)組合單聲道副帶,從而減少必須量化和傳輸?shù)念l譜分量的數(shù)量。一個(gè)用于表達(dá)關(guān)于一個(gè)時(shí)間間隔內(nèi)的聲域表面方向(單方向)的信息的操縱控制信號(hào)與編碼組合聲道頻譜分量一起傳輸,以便允許進(jìn)行接收的去量化器將一條或兩條聲道的頻譜分量恢復(fù),這些聲道對(duì)于單方向重現(xiàn)是足夠的。應(yīng)該知道,一般而言,從組合聲道和單方向控制信號(hào)中恢復(fù)的頻譜分量并不等同于接收機(jī)從離散聲道或從組合聲道和每條聲道的比例系數(shù)中解碼所得頻譜分量(如在類型Ⅰ系統(tǒng)中)。
通過(guò)將組合聲道副帶和輔助單方向向量編碼而不是將離散聲道的副帶或組合聲道副帶和聲道比例系數(shù)編碼(如類型Ⅰ系統(tǒng)中那樣),所節(jié)省的位數(shù)用于適應(yīng)性位分配過(guò)程中以便例如分配給其他副帶以及用于量化器中以便將操縱控制信號(hào)量化。
將一條或多條聲道中副帶的頻譜分量合并。根據(jù)所述專利5,583,962、5,632,005和5,633,981,一個(gè)優(yōu)選方法將組合副帶的每個(gè)頻譜分量設(shè)置為等于操縱的聲道內(nèi)相應(yīng)頻譜分量的平均值,以及選代的方法可能在操縱的聲道內(nèi)形成頻譜分量值的其他線性組合或加權(quán)和。
操縱控制信號(hào)用于表現(xiàn)組合聲道內(nèi)副帶分量的主(主要)空間方向。根據(jù)作為本發(fā)明主題的類型Ⅱ系統(tǒng)的簡(jiǎn)化版本,在每個(gè)時(shí)間間隔內(nèi),一個(gè)基本方法構(gòu)造單個(gè)向量,用于只表現(xiàn)組合信號(hào)中每個(gè)副帶的主或主要空間方向。
可以參照?qǐng)D11更好地理解此基本方法的概念,圖11闡述一個(gè)包括五個(gè)表現(xiàn)聲道的假設(shè)性重現(xiàn)系統(tǒng)。這些表現(xiàn)聲道中對(duì)應(yīng)于一條輸入聲道的每一條表現(xiàn)聲道表現(xiàn)一個(gè)位于單位球表面上的揚(yáng)聲器。準(zhǔn)備收聽(tīng)的人位于球的中心。聲道中之一標(biāo)以RF。對(duì)聲道RF的收聽(tīng)者的表面方向由單位向量 表現(xiàn)。
根據(jù)此基本編碼方法,操縱控制信號(hào)向量 表現(xiàn)組合信號(hào)副帶j的聲域主(主要)方向。雖然笛卡爾坐標(biāo)系統(tǒng)是用于表示方向的優(yōu)選表示,但其他表示例如極坐標(biāo)也可使用而不背離本發(fā)明的實(shí)質(zhì)。每條聲道的方向向量由音平來(lái)加權(quán)。操縱控制信號(hào)可以表現(xiàn)為V→j=Σi=1sLIi,j·DI→i=LI→j·DI----(3)]]>其中 =聲道i的方向單位向量,LIij=聲道i內(nèi)副帶j的計(jì)算音平,S=輸入聲道的總數(shù)量, =副帶j的操縱控制信號(hào)向量, =所有輸入聲道的方向單位向量,及 =所有輸入聲道中副帶j的計(jì)算音平。
在所述5,583,962、5,632,005和5,633,981專利中闡述了本發(fā)明可用的類型Ⅱ編碼器的進(jìn)一步細(xì)節(jié)。
在圖10中所示空間編碼解碼器中,逆表面方向和組合信號(hào)發(fā)生器1014響應(yīng)于操縱控制信號(hào)、粗量化音平和分別自路徑1008至1012接收的頻譜分量值來(lái)重新構(gòu)造組合聲道的單方向表現(xiàn)。
如上所述,類型Ⅱ編碼發(fā)明采用操縱控制信號(hào)的方向向量形式。為逼近編碼信號(hào)的方向,該重新構(gòu)造過(guò)程必須考慮裝于解碼位置的揚(yáng)聲器的數(shù)量和位置。每個(gè)表現(xiàn)聲道i的方向向量 作為重現(xiàn)信息而提供輸入至逆表面方向和組合信號(hào)發(fā)生器1014。重新構(gòu)造過(guò)程優(yōu)選地為一條或兩條表現(xiàn)聲道生成頻譜分量,它們對(duì)于獲取具有由操縱控制信號(hào)表現(xiàn)的組合信號(hào)副帶的空間定向的聲域是足夠的。
通過(guò)應(yīng)用等式1于表現(xiàn)系統(tǒng),操縱控制信號(hào)可以表現(xiàn)如下V→j=Σi=1sLOi,j·DO→i=LO→j·DO→---(4)]]>其中 =表現(xiàn)聲道i的方向單位向量,LOi,j=聲道i內(nèi)副帶j的計(jì)算音平,S=表現(xiàn)聲道的總數(shù)量, =副帶j的操縱控制信號(hào)向量, =所有表現(xiàn)聲道的方向單位向量,及 =所有表現(xiàn)聲道中副帶j的計(jì)算音平。
對(duì)于計(jì)算音平LO所加一個(gè)附加約束是由表現(xiàn)系統(tǒng)產(chǎn)生的聲域響度應(yīng)該等于原始聲域響度。更具體地,對(duì)每個(gè) 向量施加一個(gè)約束以使表現(xiàn)系統(tǒng)所產(chǎn)生的每個(gè)副帶的聲域的響度或總音平等于原始聲域中副帶音平。
在所述專利5,583,962、5,632,005和5,633,981中闡述了本發(fā)明可用的類型Ⅱ解碼器的進(jìn)一步細(xì)節(jié)。
圖12A是與可預(yù)測(cè)回放環(huán)境一起操作的空間解碼器的原理功能框圖。操縱信息、量化代碼字和粗量化信息分別沿輸入路徑1202、1204和1206施加于空間解碼器1208。輸入信號(hào)可以由不同傳輸或存儲(chǔ)技術(shù)中的任何一項(xiàng)傳送給空間解碼器,包括例如有線或無(wú)線傳輸,磁媒體和光媒體。如上所述,根據(jù)類型Ⅱ系統(tǒng)的單向量版本將輸入信號(hào)編碼。解碼器1208提供四或五個(gè)輸出信號(hào),它們可用于采用聲音交叉消除器的可選空間化器1210??臻g化器1210的具體實(shí)施并不重要;其合適的布置結(jié)合圖5A、5B和5C加以描述。如果采用了一個(gè)空間化器,則空間化器1210的輸出施加于左和右揚(yáng)聲器1212和1214(通過(guò)合適的放大和連接裝置,未示出),否則解碼器1208的輸出通過(guò)合適的放大和連接裝置(未示出)施加于揚(yáng)聲器。例如圖3或圖4那樣定位的這些揚(yáng)聲器產(chǎn)生一個(gè)橢圓形空間編碼有利位置1216(理想地示出),其中坐著一個(gè)收聽(tīng)者1217。如果使用空間化器,則空間化器1210在需要時(shí)可能形成解碼器1208的一個(gè)整體部分。
圖12B是與另一個(gè)可預(yù)測(cè)回放環(huán)境一起操作的空間解碼器的原理功能框圖。如圖12A布置中的操縱信息、量化代碼字和粗量化信息分別沿輸入路徑1202、1204和1206施加于空間解碼器1208。圖12B布置的不同處在于回放環(huán)境是一個(gè)標(biāo)準(zhǔn)五揚(yáng)聲器環(huán)繞聲布置。在此情況下,不需要任何空間化器。來(lái)自空間解碼器1208的輸出施加于五個(gè)揚(yáng)聲器-左(1218)、中心(1220)、右(1222)、左環(huán)繞(1224)和右環(huán)繞(1226),它們產(chǎn)生一個(gè)圓形空間編碼有利位置1228(理想地示出),其中坐著一個(gè)收聽(tīng)者1230。
應(yīng)該理解,熟悉技術(shù)的人了解本發(fā)明的其他變動(dòng)和修改及其不同方面,以及本發(fā)明不限制于所描述的這些具體實(shí)施例。因此可以設(shè)想,本發(fā)明覆蓋此處所公開(kāi)的和所權(quán)利要求的基本基礎(chǔ)原理的實(shí)質(zhì)和范圍內(nèi)所包括的任何和全部修改、變動(dòng)或其等效內(nèi)容。
權(quán)利要求
1.一種低位率空間編碼系統(tǒng),用于將多條表現(xiàn)聲域的音頻流編碼為一個(gè)編碼信號(hào)和用于將所述編碼信號(hào)解碼,所述系統(tǒng)包括一個(gè)編碼器和一個(gè)解碼器,所述編碼器包括用于響應(yīng)于所述多條音頻流而生成多個(gè)副帶信號(hào)的裝置,每個(gè)副帶信號(hào)表現(xiàn)一個(gè)相應(yīng)的所述音頻流的相應(yīng)頻率副帶,用于生成一個(gè)表現(xiàn)相應(yīng)頻率副帶中副帶信號(hào)的組合的組合信號(hào)的裝置,用于為所述組合信號(hào)生成一個(gè)用于標(biāo)示相應(yīng)副帶內(nèi)所述聲域的主要方向的操縱控制信號(hào)的裝置,用于通過(guò)向所述組合信號(hào)和所述操縱控制信號(hào)分配位數(shù)而生成編碼信息的裝置,及用于將所述編碼信息組裝成一個(gè)編碼信號(hào)的裝置,及所述解碼器包括用于自所述編碼信號(hào)中獲取組合信號(hào)和操縱控制信號(hào)的裝置,用于響應(yīng)于所述組合信號(hào)和所述操縱控制信號(hào)而獲取副帶信號(hào)的裝置,用于提供用于描述所述解碼器的輸出聲道數(shù)量和連至相應(yīng)輸出聲道的聲音傳感器的位置或虛擬位置的重現(xiàn)信息的裝置,其中存在三條或更多輸出聲道,及用于響應(yīng)于所述副帶信號(hào)和重現(xiàn)信息而在任何瞬間在不多于兩條輸出聲道中生成一條音頻流的裝置。
2.一種低位率空間編碼系統(tǒng),用于將多條表現(xiàn)聲域的音頻流編碼為一個(gè)編碼信號(hào),用于將所述編碼信號(hào)解碼和用于重現(xiàn)所述聲域的聽(tīng)覺(jué)相似感受,所述系統(tǒng)包括一個(gè)編碼器和一個(gè)解碼器,所述編碼器包括用于響應(yīng)于所述多條音頻流而生成多個(gè)副帶信號(hào)的裝置,每個(gè)副帶信號(hào)表現(xiàn)一條相應(yīng)的所述音頻流的相應(yīng)頻率副帶,用于生成一個(gè)表現(xiàn)每個(gè)頻率副帶中副帶信號(hào)的組合的組合信號(hào)的裝置,用于為所述組合信號(hào)生成一個(gè)用于標(biāo)示每個(gè)副帶內(nèi)所述聲域的主要方向的操縱控制信號(hào)的裝置,用于通過(guò)向所述組合信號(hào)和所述操縱控制信號(hào)分配位數(shù)而生成編碼信息的裝置,及用于將所述編碼信息組裝成一個(gè)編碼信號(hào)的裝置,所述解碼器包括用于自所述編碼信號(hào)中獲取組合信號(hào)和操縱控制信號(hào)的裝置,用于響應(yīng)于所述組合信號(hào)和所述操縱控制信號(hào)而獲取副帶信號(hào)的裝置,用于提供用于描述所述解碼器的輸出聲道數(shù)量和連至相應(yīng)輸出聲道的聲音傳感器的位置或虛擬位置的重現(xiàn)信息的裝置,及用于響應(yīng)于所述副帶信號(hào)和重現(xiàn)信息而在一條或更多輸出聲道中生成一條音頻流的裝置,以及還包括多個(gè)聲音傳感器,連至所述解碼器的輸出聲道并且布置為對(duì)空間編碼有利位置收聽(tīng)區(qū)內(nèi)的一個(gè)或多個(gè)收聽(tīng)者生成聲域的聽(tīng)覺(jué)相似感受。
3.根據(jù)權(quán)利要求2的低位率空間編碼系統(tǒng),其中存在三條或更多聲道,及所述用于響應(yīng)于所述副帶信號(hào)和重現(xiàn)信息而在更多輸出聲道中的一條聲道內(nèi)生成一條音頻流的裝置在任何瞬間在不多于兩條輸出聲道中生成一條音頻流。
4.根據(jù)權(quán)利要求1或權(quán)利要求2的低位率空間編碼系統(tǒng),還包括一個(gè)空間化器,該空間化器包括一個(gè)用于在所述輸出聲道中處理音頻流的聲音交叉消除器,該空間化器提供減少數(shù)量的具有音頻流的輸出聲道,這些音頻流的特性是當(dāng)連至聲音傳感器時(shí),它所提供的聲域聽(tīng)覺(jué)印象類似于原始數(shù)量的輸出聲道連至較多聲音傳感器時(shí)所得聲域聽(tīng)覺(jué)印象。
5.根據(jù)權(quán)利要求1或權(quán)利要求2的低位率空間編碼系統(tǒng),其中所述操縱控制信號(hào)包括每個(gè)副帶的一個(gè)方向向量。
6.根據(jù)權(quán)利要求1或權(quán)利要求2的低位率空間編碼系統(tǒng),其中所述相應(yīng)頻率副帶具有一個(gè)相當(dāng)于人類聽(tīng)覺(jué)系統(tǒng)的相應(yīng)重要頻帶的帶寬。
7.根據(jù)權(quán)利要求1或權(quán)利要求2的低位率空間編碼系統(tǒng),其中根據(jù)心理聲學(xué)原理分配所述位數(shù)。
8.根據(jù)權(quán)利要求2的低位率空間編碼系統(tǒng),其中所述解碼器還包括一個(gè)空間化器,該空間化器包括一個(gè)用于在所述輸出聲道中處理音頻流的聲音交叉消除器,從而使空間編碼有利位置收聽(tīng)區(qū)內(nèi)生成的所述聲域的聽(tīng)覺(jué)相似感受提供一個(gè)廣大舞臺(tái)或環(huán)繞聲聲域的感受。
9.一種用于低位率空間編碼系統(tǒng)中的解碼器,通過(guò)響應(yīng)于多條表現(xiàn)聲域的音頻流而生成多個(gè)副帶信號(hào)而用于將從多條音頻流中獲取的一個(gè)編碼信號(hào)解碼,每個(gè)副帶信號(hào)表現(xiàn)一條相應(yīng)的所述音頻流的相應(yīng)頻率副帶,所述解碼器生成一個(gè)表現(xiàn)相應(yīng)頻率副帶中副帶信號(hào)的組合的組合信號(hào),為組合信號(hào)生成一個(gè)用于標(biāo)示相應(yīng)副帶內(nèi)所述聲域的主要方向的操縱控制信號(hào),通過(guò)向組合信號(hào)和操縱控制信號(hào)分配位數(shù)而生成編碼信息,及將編碼信息組裝成一個(gè)編碼信號(hào),所述解碼器包括用于自所述編碼信號(hào)中獲取組合信號(hào)和操縱控制信號(hào)的裝置,用于響應(yīng)于所述組合信號(hào)和所述操縱控制信號(hào)而獲取副帶信號(hào)的裝置,用于提供用于描述所述解碼器的輸出聲道數(shù)量和連至相應(yīng)輸出聲道的聲音傳感器的位置或虛擬位置的重現(xiàn)信息的裝置,其中存在三條或更多輸出聲道,及用于響應(yīng)于所述副帶信號(hào)和重現(xiàn)信息而在任何瞬間在不多于兩條輸出聲道中生成一條音頻流的裝置。
10.一種用于低位率空間編碼系統(tǒng)中的解碼器和重現(xiàn)系統(tǒng),通過(guò)響應(yīng)于多條表現(xiàn)聲域的音頻流而生成多個(gè)副帶信號(hào)而用于將從多條音頻流中獲取的一個(gè)編碼信號(hào)解碼和重現(xiàn),每個(gè)副帶信號(hào)表現(xiàn)一條相應(yīng)的所述音頻流的相應(yīng)頻率副帶,所述解碼器和重現(xiàn)系統(tǒng)生成一個(gè)表現(xiàn)相應(yīng)頻率副帶中副帶信號(hào)的組合的組合信號(hào),為組合信號(hào)生成一個(gè)用于標(biāo)示相應(yīng)副帶內(nèi)所述聲域的主要方向的操縱控制信號(hào),通過(guò)向組合信號(hào)和操縱控制信號(hào)分配位數(shù)而生成編碼信息,及將編碼信息組裝成一個(gè)編碼信號(hào)。所述解碼器和重現(xiàn)系統(tǒng)包括用于自所述編碼信號(hào)中獲取組合信號(hào)和操縱控制信號(hào)的裝置,用于響應(yīng)于所述組合信號(hào)和所述操縱控制信號(hào)而獲取副帶信號(hào)的裝置,用于提供用于描述所述解碼器的輸出聲道數(shù)量和連至相應(yīng)輸出聲道的聲音傳感器的位置或虛擬位置的重現(xiàn)信息的裝置,及用于響應(yīng)于所述副帶信號(hào)和重現(xiàn)信息而在一條或更多輸出聲道中生成一條音頻流的裝置,及多個(gè)聲音傳感器,連至所述解碼器的輸出聲道并且布置為對(duì)空間編碼有利位置收聽(tīng)區(qū)內(nèi)的一個(gè)或多個(gè)收聽(tīng)者生成所述聲域的聽(tīng)覺(jué)相似感受。
11.權(quán)利要求10的組合,其中存在三條或更多輸出聲道,及所述用于響應(yīng)于所述副帶信號(hào)和重現(xiàn)信息而在更多輸出聲道中的一條中生成一條音頻流的裝置在任何瞬間在不多于兩條輸出聲道內(nèi)生成一條音頻流。
12.根據(jù)權(quán)利要求9或權(quán)利要求10的組合還包括一個(gè)空間化器,該空間化器包括一個(gè)用于在所述輸出聲道中處理音頻流的聲音交叉消除器,該空間化器提供減少數(shù)量的具有音頻流的輸出聲道,這些音頻流的特性是當(dāng)連至聲音傳感器時(shí),它所提供的聲域聽(tīng)覺(jué)印象類似于原始數(shù)量的輸出聲道連至較多聲音傳感器時(shí)所得聲域聽(tīng)覺(jué)印象。
13.根據(jù)權(quán)利要求9或權(quán)利要求10的組合,其中所述操縱控制信號(hào)包括每個(gè)副帶的一個(gè)方向向量。
14.根據(jù)權(quán)利要求9或權(quán)利要求10的組合,其中所述相應(yīng)頻率副帶具有一個(gè)相當(dāng)于人類聽(tīng)覺(jué)系統(tǒng)的相應(yīng)重要頻帶的帶寬。
15.根據(jù)權(quán)利要求9或權(quán)利要求10的組合,其中根據(jù)心理聲學(xué)原理分配所述位數(shù)。
16.根據(jù)權(quán)利要求10的組合,其中所述解碼器還包括一個(gè)空間化器,該空間化器包括一個(gè)用于在所述輸出聲道中處理音頻流的聲音交叉消除器,從而使空間編碼有利位置收聽(tīng)區(qū)內(nèi)生成的所述聲域的聽(tīng)覺(jué)相似感受能提供一個(gè)廣大舞臺(tái)或環(huán)繞聲聲域的感受。
17.一種低位率空間編碼系統(tǒng),用于將多條表現(xiàn)聲域的音頻流編碼為一個(gè)編碼信號(hào)和用于將所述編碼信號(hào)解碼,所述系統(tǒng)包括一個(gè)編碼器和一個(gè)解碼器,所述編碼器包括一個(gè)副帶信號(hào)發(fā)生器,用于響應(yīng)于所述多條音頻流而生成多個(gè)副帶信號(hào),每個(gè)副帶信號(hào)表現(xiàn)一條相應(yīng)的所述音頻流的相應(yīng)頻率副帶,一個(gè)信號(hào)組合器,用于生成一個(gè)表現(xiàn)相應(yīng)頻率副帶中副帶信號(hào)的組合的組合信號(hào),一個(gè)聲域方向檢測(cè)器,用于為所述組合信號(hào)生成一個(gè)用于標(biāo)示相應(yīng)副帶內(nèi)所述聲域的主要方向的操縱控制信號(hào),一個(gè)編碼器和位分配器,用于通過(guò)向所述組合信號(hào)和所述操縱控制信號(hào)分配位數(shù)而生成編碼信息,及一個(gè)格式化器,用于將所述編碼信息組裝成一個(gè)編碼信號(hào),及所述解碼器包括一個(gè)去格式化器,用于自所述編碼信號(hào)中獲取組合信號(hào)和操縱控制信號(hào),一個(gè)逆副帶發(fā)生器,用于響應(yīng)于所述組合信號(hào)和所述操縱控制信號(hào)而獲取副帶信號(hào),一個(gè)信息輸入,用于描述所述解碼器的輸出聲道數(shù)量和連至相應(yīng)輸出聲道的聲音傳感器的位置或虛擬位置,其中存在三條或更多輸出聲道,及一個(gè)信號(hào)發(fā)生器,用于響應(yīng)于所述副帶信號(hào)和重現(xiàn)信息而在任何瞬間在不多于兩條輸出聲道中生成一條音頻流。
18.一種低位率空間編碼系統(tǒng),用于將多條表現(xiàn)聲域的音頻流編碼為一個(gè)編碼信號(hào),用于將所述編碼信號(hào)解碼和用于重現(xiàn)所述聲域的聽(tīng)覺(jué)相似感受,所述系統(tǒng)包括一個(gè)編碼器和一個(gè)解碼器,所述編碼器包括一個(gè)副帶信號(hào)發(fā)生器,用于響應(yīng)于所述多條音頻流而生成多個(gè)副帶信號(hào),每個(gè)副帶信號(hào)表現(xiàn)一條相應(yīng)的所述音頻流的相應(yīng)頻率副帶,一個(gè)信號(hào)組合器,用于生成一個(gè)表現(xiàn)每個(gè)頻率副帶中副帶信號(hào)的組合的組合信號(hào),一個(gè)聲域方向檢測(cè)器,用于為所述組合信號(hào)生成一個(gè)用于標(biāo)示每個(gè)副帶內(nèi)所述聲域的主要方向的操縱控制信號(hào),一個(gè)編碼器和位分配器,用于通過(guò)向所述組合信號(hào)和所述操縱控制信號(hào)分配位數(shù)而生成編碼信息,及一個(gè)格式化器,用于將所述編碼信息組裝成一個(gè)編碼信號(hào),所述解碼器包括一個(gè)去格式化器,用于自所述編碼信號(hào)中獲取組合信號(hào)和操縱控制信號(hào),一個(gè)逆副帶發(fā)生器,用于響應(yīng)于所述組合信號(hào)和所述操縱控制信號(hào)而獲取副帶信號(hào),一個(gè)信息輸入,用于描述所述解碼器的輸出聲道數(shù)量和連至相應(yīng)輸出聲道的聲音傳感器的位置或虛擬位置,及一個(gè)信號(hào)發(fā)生器,用于響應(yīng)于所述副帶信號(hào)和重現(xiàn)信息而在一條或更多輸出聲道中生成一條音頻流。及還包括多個(gè)聲音傳感器,連至所述解碼器的輸出聲道并且布置為對(duì)空間編碼有利位置收聽(tīng)區(qū)內(nèi)的一個(gè)或多個(gè)收聽(tīng)者生成所述聲域的聽(tīng)覺(jué)相似感受。
19.根據(jù)權(quán)利要求18的低位率空間編碼系統(tǒng),其中存在三條或更多輸出聲道及所述信號(hào)發(fā)生器在任何瞬間在不多于兩條輸出聲道內(nèi)生成一條音頻流。
20.根據(jù)權(quán)利要求17或權(quán)利要求18的低位率空間編碼系統(tǒng)還包括一個(gè)空間化器,該空間化器包括一個(gè)用于在所述輸出聲道中處理音頻流的聲音交叉消除器,該空間化器提供減少數(shù)量的具有音頻流的輸出聲道,這些音頻流的特性是當(dāng)連至聲音傳感器時(shí),它所提供的聲域聽(tīng)覺(jué)印象類似于原始數(shù)量的輸出聲道連至較多聲音傳感器時(shí)所得聲域聽(tīng)覺(jué)印象。
21.根據(jù)權(quán)利要求17或權(quán)利要求18的低位率空間編碼系統(tǒng),其中所述操縱控制信號(hào)包括每個(gè)副帶的一個(gè)方向向量。
22.根據(jù)權(quán)利要求17或權(quán)利要求18的低位率空間編碼系統(tǒng),其中所述相應(yīng)頻率副帶具有相當(dāng)于人類聽(tīng)覺(jué)系統(tǒng)的相應(yīng)重要頻帶的帶寬。
23.根據(jù)權(quán)利要求17或權(quán)利要求18的低位率空間編碼系統(tǒng),其中根據(jù)心理聲學(xué)原理分配所述位數(shù)。
24.根據(jù)權(quán)利要求18的低位率空間編碼系統(tǒng),其中所述解碼器還包括一個(gè)空間化器,該空間化器包括一個(gè)用于在所述輸出聲道中處理音頻流的聲音交叉消除器,從而使空間編碼有利位置收聽(tīng)區(qū)內(nèi)生成的所述聲域的聽(tīng)覺(jué)相似感受提供一個(gè)廣大舞臺(tái)或環(huán)繞聲聲域的感受。
25.一種用于低位率空間編碼系統(tǒng)中的解碼器,通過(guò)響應(yīng)于多條表現(xiàn)聲域的音頻流而生成多個(gè)副帶信號(hào)而用于將從多條音頻流中獲取的一個(gè)編碼信號(hào)解碼,每個(gè)副帶信號(hào)表現(xiàn)一條相應(yīng)的所述音頻流的相應(yīng)頻率副帶,所述解碼器生成一個(gè)表現(xiàn)相應(yīng)頻率副帶中副帶信號(hào)的組合的組合信號(hào),為組合信號(hào)生成一個(gè)用于標(biāo)示相應(yīng)副帶內(nèi)所述聲域的主要方向的操縱控制信號(hào),通過(guò)向組合信號(hào)和操縱控制信號(hào)分配位數(shù)而生成編碼信息,及將編碼信息組裝成一個(gè)編碼信號(hào),所述解碼器包括一個(gè)去格式化器,用于自所述編碼信號(hào)中獲取組合信號(hào)和操縱控制信號(hào),一個(gè)逆副帶發(fā)生器,用于響應(yīng)于所述組合信號(hào)和所述操縱控制信號(hào)而獲取副帶信號(hào),一個(gè)信息輸入,用于描述所述解碼器的輸出聲道數(shù)量和連至相應(yīng)輸出聲道的聲音傳感器的位置或虛擬位置,其中存在三條或更多輸出聲道,及一個(gè)信號(hào)發(fā)生器,用于響應(yīng)于所述副帶信號(hào)和重現(xiàn)信息而在任何瞬間在不多于兩條輸出聲道中生成一條音頻流。
26.一種用于低位率空間編碼系統(tǒng)中的解碼器和重現(xiàn)系統(tǒng),通過(guò)響應(yīng)于多條表現(xiàn)聲域的音頻流而生成多個(gè)副帶信號(hào)而用于將從多條音頻流中獲取的一個(gè)編碼信號(hào)解碼和重現(xiàn),每個(gè)副帶信號(hào)表現(xiàn)一條相應(yīng)的所述音頻流的相應(yīng)頻率副帶,所述解碼器和重現(xiàn)系統(tǒng)生成一個(gè)表現(xiàn)相應(yīng)頻率副帶中副帶信號(hào)的組合的組合信號(hào),為組合信號(hào)生成一個(gè)用于表現(xiàn)相應(yīng)副帶內(nèi)所述聲域的主要方向的操縱控制信號(hào),通過(guò)向組合信號(hào)和操縱控制信號(hào)分配位數(shù)而生成編碼信息,及將編碼信息組裝成一個(gè)編碼信號(hào),所述解碼器和重現(xiàn)系統(tǒng)包括一個(gè)去格式化器,用于自所述編碼信號(hào)中獲取組合信號(hào)和操縱控制信號(hào),一個(gè)逆副帶發(fā)生器,用于響應(yīng)于所述組合信號(hào)和所述操縱控制信號(hào)而獲取副帶信號(hào),一個(gè)信息輸入,用于描述所述解碼器的輸出聲道數(shù)量和連至相應(yīng)輸出聲道的聲音傳感器的位置或虛擬位置,及一個(gè)信號(hào)發(fā)生器,用于響應(yīng)于所述副帶信號(hào)和重現(xiàn)信息而在一條或更多輸出聲道中生成一條音頻流,及多個(gè)聲音傳感器,連至所述解碼器的輸出聲道并且布置為對(duì)空間編碼有利位置收聽(tīng)區(qū)內(nèi)的一個(gè)或多個(gè)收聽(tīng)者生成所述聲域的聽(tīng)覺(jué)相似感受。
27.權(quán)利要求26的組合,其中存在三條或更多輸出聲道,及所述發(fā)生器在任何瞬間在不多于兩條輸出聲道內(nèi)生成一條音頻流。
28.權(quán)利要求25或權(quán)利要求26的組合還包括一個(gè)空間化器,該空間化器包括一個(gè)用于在所述輸出聲道中處理音頻流的聲音交叉消除器,該空間化器提供減少數(shù)量的具有音頻流的輸出聲道,這些音頻流的特性是當(dāng)連至聲音傳感器時(shí),它所提供的聲域聽(tīng)覺(jué)印象類似于原始數(shù)量的輸出聲道連至較多聲音傳感器時(shí)所得聲域聽(tīng)覺(jué)印象。
29.權(quán)利要求25或權(quán)利要求26的組合,其中所述操縱控制信號(hào)包括每個(gè)副帶的一個(gè)方向向量。
30.權(quán)利要求25或權(quán)利要求26的組合,其中所述相應(yīng)頻率副帶具有一個(gè)相當(dāng)于人類聽(tīng)覺(jué)系統(tǒng)的重要頻帶的帶寬。
31.權(quán)利要求25或權(quán)利要求26的組合,其中根據(jù)心理聲學(xué)原理分配所述位數(shù)。
32.權(quán)利要求26的組合,其中所述解碼器還包括一個(gè)空間化器,該空間化器包括一個(gè)用于在所述輸出聲道中處理音頻流的聲音交叉消除器,從而使空間編碼有利位置收聽(tīng)區(qū)內(nèi)生成的所述聲域的聽(tīng)覺(jué)相似感受提供一個(gè)廣大舞臺(tái)或環(huán)繞聲聲域的感受。
33.一種低位率空間編碼方法,用于將多條表現(xiàn)聲域的音頻流編碼為一個(gè)編碼信號(hào)和用于將所述編碼信號(hào)解碼,所述方法包括編碼和解碼,所述編碼包括響應(yīng)于所述多條音頻流而生成多個(gè)副帶信號(hào),每個(gè)副帶信號(hào)表現(xiàn)一條相應(yīng)的所述音頻流的相應(yīng)頻率副帶,生成一個(gè)表現(xiàn)相應(yīng)頻率副帶中副帶信號(hào)的組合的組合信號(hào),為所述組合信號(hào)生成一個(gè)用于標(biāo)示相應(yīng)副帶內(nèi)所述聲域的主要方向的操縱控制信號(hào),通過(guò)向所述組合信號(hào)和所述操縱控制信號(hào)分配位數(shù)而生成編碼信息,及將所述編碼信息組裝成一個(gè)編碼信號(hào),及所述解碼包括自所述編碼信號(hào)中獲取組合信號(hào)和操縱控制信號(hào),響應(yīng)于所述組合信號(hào)和所述操縱控制信號(hào)而獲取副帶信號(hào),提供用于描述所述解碼器的輸出聲道數(shù)量和連至相應(yīng)輸出聲道的聲音傳感器的位置或虛擬位置的重現(xiàn)信息,其中存在三條或更多輸出聲道,及響應(yīng)于所述副帶信號(hào)和重現(xiàn)信息而在任何瞬間在不多于兩條輸出聲道中生成一條音頻流。
34.一種低位率空間編碼方法,用于將多條表現(xiàn)聲域的音頻流編碼為一個(gè)編碼信號(hào)、用于將所述編碼信號(hào)解碼和用于重現(xiàn)所述聲域的聽(tīng)覺(jué)相似感受,所述方法包括編碼和解碼,所述編碼包括響應(yīng)于所述多條音頻流而生成多個(gè)副帶信號(hào),每個(gè)副帶信號(hào)表現(xiàn)一條相應(yīng)的所述音頻流的相應(yīng)頻率副帶,生成一個(gè)表現(xiàn)每個(gè)頻率副帶中副帶信號(hào)的組合的組合信號(hào),為所述組合信號(hào)生成一個(gè)用于標(biāo)示每個(gè)副帶內(nèi)所述聲域的主要方向的操縱控制信號(hào),通過(guò)向所述組合信號(hào)和所述操縱控制信號(hào)分配位數(shù)而生成編碼信息,及將所述編碼信息組裝成一個(gè)編碼信號(hào),所述解碼包括自所述編碼信號(hào)中獲取組合信號(hào)和操縱控制信號(hào),響應(yīng)于所述組合信號(hào)和所述操縱控制信號(hào)而獲取副帶信號(hào),提供用于描述所述解碼器的輸出聲道數(shù)量和連至相應(yīng)輸出聲道的聲音傳感器的位置或虛擬位置的重現(xiàn)信息,及響應(yīng)于所述副帶信號(hào)和重現(xiàn)信息而在一條或更多輸出聲道中生成一條音頻流,及還包括將所述輸出聲道連至多個(gè)聲音傳感器,所述多個(gè)聲音傳感器布置為對(duì)空間編碼有利位置收聽(tīng)區(qū)內(nèi)的一個(gè)或多個(gè)收聽(tīng)者生成所述聲域的聽(tīng)覺(jué)相似感受。
35.根據(jù)權(quán)利要求34的低位率空間編碼方法,其中存在三條或更多輸出聲道,及所述響應(yīng)于所述副帶信號(hào)和重現(xiàn)信息而在更多輸出聲道中的一條輸出聲道生成一條音頻流的步驟在任何瞬間在不多于兩條輸出聲道內(nèi)生成一條音頻流。
36.根據(jù)權(quán)利要求33或權(quán)利要求34的低位率空間編碼方法還包括使用一個(gè)包括聲音交叉消除器的空間化器在所述輸出聲道內(nèi)處理音頻流的步驟,所述處理步驟提供減少數(shù)量的具有音頻流的輸出聲道,這些音頻流的特性是當(dāng)連至聲音傳感器時(shí),它所提供的聲域聽(tīng)覺(jué)印象類似于原始數(shù)量的輸出聲道連至較多聲音傳感器時(shí)所得聲域聽(tīng)覺(jué)印象。
37.根據(jù)權(quán)利要求33或權(quán)利要求34的低位率空間編碼方法,其中所述操縱控制信號(hào)包括每個(gè)副帶的一個(gè)方向向量。
38.根據(jù)權(quán)利要求33或權(quán)利要求34的低位率空間編碼方法,其中所述相應(yīng)頻率副帶具有一個(gè)相當(dāng)于人類聽(tīng)覺(jué)系統(tǒng)的相應(yīng)重要頻帶的帶寬。
39.根據(jù)權(quán)利要求33或權(quán)利要求34的低位率空間編碼方法,其中根據(jù)心理聲學(xué)原理分配所述位數(shù)。
40.根據(jù)權(quán)利要求34的低位率空間編碼方法,其中所述解碼器還包括使用包括聲音交叉消除器的空間化器在所述輸出聲道內(nèi)處理音頻流的步驟,從而使空間編碼有利位置收聽(tīng)區(qū)內(nèi)生成的所述聲域的聽(tīng)覺(jué)相似感受提供一個(gè)廣大舞臺(tái)或環(huán)繞聲聲域的感受。
41.一種低位率空間編碼解碼方法,通過(guò)響應(yīng)于多條表現(xiàn)聲域的音頻流而生成多個(gè)副帶信號(hào)而用于將從多條音頻流中獲取的一個(gè)編碼信號(hào)解碼,每個(gè)副帶信號(hào)表現(xiàn)一條相應(yīng)的所述音頻流的相應(yīng)頻率副帶,所述解碼方法生成一個(gè)表現(xiàn)相應(yīng)頻率副帶中副帶信號(hào)的組合的組合信號(hào),為組合信號(hào)生成一個(gè)用于標(biāo)示相應(yīng)副帶內(nèi)所述聲域的主要方向的操縱控制信號(hào),通過(guò)向組合信號(hào)和操縱控制信號(hào)分配位數(shù)而生成編碼信息,及將編碼信息組裝成一個(gè)編碼信號(hào),所述解碼方法包括自所述編碼信號(hào)中獲取組合信號(hào)和操縱控制信號(hào),響應(yīng)于所述組合信號(hào)和所述操縱控制信號(hào)而獲取副帶信號(hào),提供用于描述所述解碼器的輸出聲道數(shù)量和連至相應(yīng)輸出聲道的聲音傳感器的位置或虛擬位置的重現(xiàn)信息,其中存在三條或更多輸出聲道,及響應(yīng)于所述副帶信號(hào)和重現(xiàn)信息而在任何瞬間在不多于兩條輸出聲道中生成一條音頻流。
42.一種低位率空間編碼解碼和重現(xiàn)方法,通過(guò)響應(yīng)于多條表現(xiàn)聲域的音頻流而生成多個(gè)副帶信號(hào)而用于將從多條音頻流中獲取的一個(gè)編碼信號(hào)解碼和重現(xiàn),每個(gè)副帶信號(hào)表現(xiàn)一條相應(yīng)的所述音頻流的相應(yīng)頻率副帶,所述解碼和重現(xiàn)方法生成一個(gè)表現(xiàn)相應(yīng)頻率副帶中副帶信號(hào)的組合的組合信號(hào),為組合信號(hào)生成一個(gè)用于表現(xiàn)相應(yīng)副帶內(nèi)所述聲域的主要方向的操縱控制信號(hào),通過(guò)向組合信號(hào)和操縱控制信號(hào)分配位數(shù)而生成編碼信息,及將編碼信息組裝成一個(gè)編碼信號(hào),所述解碼和重現(xiàn)方法包括自所述編碼信號(hào)中獲取組合信號(hào)和操縱控制信號(hào),響應(yīng)于所述組合信號(hào)和所述操縱控制信號(hào)而獲取副帶信號(hào),提供用于描述所述解碼器的輸出聲道數(shù)量和連至相應(yīng)輸出聲道的聲音傳感器的位置或虛擬位置的重現(xiàn)信息,及響應(yīng)于所述副帶信號(hào)和重現(xiàn)信息而在一條或更多輸出聲道中生成一條音頻流,及將多個(gè)聲音傳感器連至所述解碼器的輸出聲道,所述多個(gè)聲音傳感器布置為對(duì)空間編碼有利位置收聽(tīng)區(qū)內(nèi)的一個(gè)或多個(gè)收聽(tīng)者生成聲域的聽(tīng)覺(jué)相似感受。
43.權(quán)利要求42的方法,其中存在三條或更多輸出聲道,及所述響應(yīng)于所述副帶信號(hào)和重現(xiàn)信息而在更多輸出聲道內(nèi)一條中生成一條音頻流的步驟在任何瞬間在不多于兩條輸出聲道內(nèi)生成一條音頻流。
44.權(quán)利要求41或權(quán)利要求42的方法還包括使用一個(gè)空間化器處理所述輸出聲道內(nèi)的音頻流的步驟,該空間化器包括一個(gè)聲音交叉消除器,所述處理步驟提供減少數(shù)量的具有音頻流的輸出聲道,這些音頻流的特性是當(dāng)連至聲音傳感器時(shí),它所提供的聲域聽(tīng)覺(jué)印象類似于原始數(shù)量的輸出聲道連至較多聲音傳感器時(shí)所得聲域聽(tīng)覺(jué)印象。
45.權(quán)利要求41或權(quán)利要求42的方法,其中所述操縱控制信號(hào)包括每個(gè)副帶的一個(gè)方向向量。
46.權(quán)利要求41或權(quán)利要求42的方法,其中所述相應(yīng)頻率副帶具有一個(gè)相當(dāng)于人類聽(tīng)覺(jué)系統(tǒng)的相應(yīng)重要頻帶的帶寬。
47.權(quán)利要求41或權(quán)利要求42的方法,其中根據(jù)心理聲學(xué)原理分配所述位數(shù)。
48.權(quán)利要求42的方法還包括使用一個(gè)包括聲音交叉消除器的空間化器處理所述輸出聲道內(nèi)的音頻流的步驟,從而使空間編碼有利位置收聽(tīng)區(qū)內(nèi)生成的所述聲域的聽(tīng)覺(jué)相似感受提供一個(gè)廣大舞臺(tái)或環(huán)繞聲聲域的感受。
全文摘要
一種包括編碼器和解碼器的空間音頻編碼系統(tǒng)在極低位率下工作并且通過(guò)因特網(wǎng)用于音頻信息。一個(gè)或多個(gè)收聽(tīng)者例如個(gè)人計(jì)算機(jī)用戶或電視觀眾最好位于可預(yù)測(cè)收聽(tīng)區(qū)內(nèi)。編碼器產(chǎn)生一個(gè)用于表現(xiàn)待重現(xiàn)的聲域的組合音頻信息信號(hào)和一個(gè)方向向量或“操縱控制信號(hào)”。該組合音頻信息信號(hào)的頻譜拆分為若干副帶,優(yōu)選地相當(dāng)于人類耳朵的重要頻帶。操縱控制信號(hào)具有與每個(gè)副帶的聲域主要方向相關(guān)的一個(gè)分量。因?yàn)樵撓到y(tǒng)基于在任何瞬間只聽(tīng)到來(lái)自單方向的聲音這一認(rèn)識(shí),因此任何瞬間內(nèi)編碼器不必將一個(gè)信號(hào)施加于多于兩個(gè)聲音傳感器。
文檔編號(hào)H04S3/00GK1295778SQ99804610
公開(kāi)日2001年5月16日 申請(qǐng)日期1999年4月5日 優(yōu)先權(quán)日1998年4月7日
發(fā)明者雷·M·杜比 申請(qǐng)人:雷·M·杜比