本發(fā)明涉及用于對(duì)HOA信號(hào)表示的子帶內(nèi)的主導(dǎo)方向信號(hào)的方向進(jìn)行編碼的方法、用于對(duì)HOA信號(hào)表示的子帶內(nèi)的主導(dǎo)方向信號(hào)的方向進(jìn)行解碼的方法、用于對(duì)HOA信號(hào)表示的子帶內(nèi)的主導(dǎo)方向信號(hào)的方向進(jìn)行編碼的裝置、以及用于對(duì)HOA信號(hào)表示的子帶內(nèi)的主導(dǎo)方向信號(hào)的方向進(jìn)行解碼的裝置。
背景技術(shù):
除了比如波場(chǎng)合成(WFS)或基于聲道的方法(諸如被稱為“22.2”的方法)的其它技術(shù)之外,高階高保真立體聲(HOA)提供表示三維聲音的一種可能性。與基于聲道的方法相反,HOA表示提供獨(dú)立于特定揚(yáng)聲器設(shè)置的優(yōu)點(diǎn)。該靈活性是以在特定揚(yáng)聲器設(shè)置上回放HOA表示所需的解碼處理為代價(jià)的。與其中所需的揚(yáng)聲器的數(shù)量通常非常大的WFS方法相比,HOA也可以被渲染到由僅僅幾個(gè)揚(yáng)聲器組成的設(shè)置。HOA的進(jìn)一步的優(yōu)點(diǎn)是,相同的表示也可以沒(méi)有任何修改地用于雙耳渲染到耳機(jī)。
HOA基于所謂的復(fù)平面諧波幅度的空間密度通過(guò)截?cái)嗟那蛑C函數(shù)(SH)展開(kāi)的表示。每個(gè)展開(kāi)系數(shù)是角頻率的函數(shù),其可以等同地由時(shí)域函數(shù)表示。因此,不失一般性,整個(gè)HOA聲場(chǎng)表示實(shí)際上可以被理解為由O個(gè)時(shí)域函數(shù)組成,其中,O表示展開(kāi)系數(shù)的數(shù)量。這些時(shí)域函數(shù)在下面將被等同地稱為HOA系數(shù)序列或HOA通道。
HOA表示的空間分辨率隨著展開(kāi)的最大階數(shù)N增長(zhǎng)而改進(jìn)。不幸的是,展開(kāi)系數(shù)的數(shù)量O隨著階數(shù)N二次方地增長(zhǎng),并且特別地,O=(N+1)2。例如,典型的使用階數(shù)N=4的HOA表示需要O=25個(gè)HOA(展開(kāi))系數(shù)。根據(jù)以上考慮,給定期望的單聲道采樣速率fS和每一個(gè)采樣的比特?cái)?shù)Nb,用于傳送HOA表示的總比特速率由O·fs·Nb確定。因此,利用每一個(gè)采樣Nb=16個(gè)比特、以fS=48kHz的采樣速率傳送例如階數(shù)N=4的HOA表示,導(dǎo)致19.2MBits/s的比特速率,該比特速率對(duì)于許多實(shí)際應(yīng)用(諸如流傳輸)是非常高的。因此,HOA表示的壓縮是高度期望的。
[4,5,6]中提出了用于壓縮HOA聲場(chǎng)表示的各種方法。這些方法的共同之處在于,它們執(zhí)行聲場(chǎng)分析,并且將給定的HOA表示分解為方向和殘留環(huán)境分量。最終的壓縮的表示一方面包括若干個(gè)量化信號(hào),這些量化信號(hào)是從所謂的方向和基于矢量的信號(hào)以及環(huán)境HOA分量的相關(guān)系數(shù)序列的感知編碼得到的。另一方面,它包括與量化信號(hào)相關(guān)的附加的邊信息(side information),該附加的邊信息對(duì)于從HOA表示的壓縮版本重構(gòu)HOA表示是必要的。
用于方法[4、5、6]的量化信號(hào)的合理的最小數(shù)量是八個(gè)。因此,假設(shè)對(duì)于每單個(gè)感知編碼器數(shù)據(jù)速率為32kbit/s,則這些方法中的一種方法的數(shù)據(jù)速率通常不低于256kbit/s。對(duì)于某些應(yīng)用,像例如對(duì)移動(dòng)設(shè)備的音頻流傳輸,該總數(shù)據(jù)速率可能太高。因此,存在對(duì)于應(yīng)對(duì)明顯較低的數(shù)據(jù)速率(例如,128kbit/s)的HOA壓縮方法的需要。
技術(shù)實(shí)現(xiàn)要素:
公開(kāi)了用于對(duì)來(lái)自壓縮的HOA表示的方向信息進(jìn)行編碼的方法和裝置以及用于對(duì)來(lái)自壓縮的HOA表示的方向信息進(jìn)行解碼的方法和裝置。此外,公開(kāi)了聲場(chǎng)的高階高保真立體聲(HOA)表示的低比特速率壓縮和解壓縮的實(shí)施例。用于聲場(chǎng)的HOA表示的低比特速率壓縮方法的一個(gè)主要方面是,將HOA表示分解為多個(gè)頻率子帶,并且通過(guò)截?cái)嗟腍OA表示和基于若干個(gè)預(yù)測(cè)的方向子帶信號(hào)的表示的組合來(lái)近似每個(gè)頻率子帶內(nèi)的系數(shù)。
截?cái)嗟腍OA表示包括數(shù)量小的選擇的系數(shù)序列,其中,選擇被允許隨時(shí)間變化。例如,對(duì)于每一個(gè)幀進(jìn)行新的選擇。用于表示截?cái)嗟腍OA表示的選擇的系數(shù)序列被感知編碼,并且是最終的壓縮的HOA表示的一部分。在一個(gè)實(shí)施例中,在感知編碼之前對(duì)選擇的系數(shù)序列進(jìn)行去相關(guān),以便提高編碼效率并且降低在渲染時(shí)的噪聲暴露的影響。部分去相關(guān)通過(guò)將空間變換應(yīng)用于預(yù)定數(shù)量的選擇的HOA系數(shù)序列來(lái)實(shí)現(xiàn)。為了解壓縮,通過(guò)再相關(guān)來(lái)使去相關(guān)反向。這樣的部分去相關(guān)的很大優(yōu)點(diǎn)是,在解壓縮時(shí)不需要額外的邊信息來(lái)恢復(fù)去相關(guān)。
近似的HOA表示的其它分量通過(guò)若干個(gè)具有對(duì)應(yīng)方向的方向子帶信號(hào)表示。這些方向子帶信號(hào)通過(guò)參數(shù)化表示進(jìn)行編碼,所述參數(shù)化表示包括來(lái)自截?cái)嗟腍OA表示的系數(shù)序列的預(yù)測(cè)。在實(shí)施例中,每個(gè)方向子帶信號(hào)由截?cái)嗟腍OA表示的系數(shù)序列的縮放的和來(lái)預(yù)測(cè)(或表示),其中,縮放一般是復(fù)值。為了能夠重新合成方向子帶信號(hào)的HOA表示以供解壓縮,壓縮的表示包含復(fù)值預(yù)測(cè)縮放因子的量化版本以及方向的量化版本。
在一個(gè)實(shí)施例中,用于對(duì)來(lái)自壓縮的HOA表示的方向信息進(jìn)行解碼的方法包括:對(duì)于壓縮的HOA表示的每一個(gè)幀,從壓縮的HOA表示提取候選方向的集合(其中,每個(gè)候選方向是至少一個(gè)子帶中的潛在的子帶信號(hào)源方向),對(duì)于每個(gè)頻率子帶以及多達(dá)最大閾值DSB個(gè)潛在的子帶信號(hào)源方向中的每一個(gè),指示該潛在的子帶信號(hào)源方向是否是相應(yīng)頻率子帶的有效(active)子帶方向的比特,和有效子帶方向的相對(duì)方向索引以及對(duì)于每個(gè)有效子帶方向的方向子帶信號(hào)信息;對(duì)于每個(gè)頻率子帶方向,將相對(duì)方向索引轉(zhuǎn)換為絕對(duì)方向索引,其中,如果所述比特指示對(duì)于相應(yīng)頻率子帶,候選方向是有效子帶方向,則每個(gè)相對(duì)方向索引被用作候選方向的集合內(nèi)的索引;以及從所述方向子帶信號(hào)信息預(yù)測(cè)方向子帶信號(hào),其中,方向根據(jù)所述絕對(duì)方向索引分配給方向子帶信號(hào)。
在一個(gè)實(shí)施例中,用于對(duì)輸入的HOA信號(hào)的幀的方向信息進(jìn)行編碼的方法包括:從輸入的HOA信號(hào)確定作為聲源的方向的有效候選方向的第一集合,其中,有效候選方向是在Q個(gè)全局方向的預(yù)定義集合之中確定的,每個(gè)全局方向具有全局方向索引;將輸入的HOA信號(hào)劃分為多個(gè)頻率子帶;在有效候選方向的第一集合之中,對(duì)于所述頻率子帶中的每一個(gè),確定多達(dá)DSB個(gè)有效子帶方向的第二集合,其中,DSB<Q;將相對(duì)方向索引分配給每一個(gè)頻率子帶的每個(gè)方向,方向索引在范圍[1,...,NoOfGlobalDirs(k)]中;組裝當(dāng)前幀的方向信息,以及傳送組裝的方向信息。方向信息包括:有效候選方向,對(duì)于每個(gè)頻率子帶和每個(gè)有效候選方向,指示該有效候選方向是否是相應(yīng)頻率子帶的有效子帶方向的比特,以及對(duì)于每個(gè)頻率子帶,子帶方向的第二集合中的有效子帶方向的相對(duì)方向索引。
在一個(gè)實(shí)施例中,計(jì)算機(jī)可讀介質(zhì)具有存儲(chǔ)在其上的可執(zhí)行指令,所述可執(zhí)行指令當(dāng)在計(jì)算機(jī)上執(zhí)行時(shí)使計(jì)算機(jī)執(zhí)行所述用于對(duì)方向信息進(jìn)行編碼的方法和所述用于對(duì)方向信息進(jìn)行解碼的方法中的至少一個(gè)。
在一個(gè)實(shí)施例中,用于對(duì)方向信息進(jìn)行逐幀編碼(從而進(jìn)行壓縮)和/或解碼(從而解壓縮)的裝置包括處理器和用于軟件程序的存儲(chǔ)器,所述軟件程序當(dāng)在處理器上執(zhí)行時(shí)執(zhí)行上述用于對(duì)方向信息進(jìn)行編碼的方法的步驟和/或上述用于對(duì)方向信息進(jìn)行解碼的方法的步驟。
在一個(gè)實(shí)施例中,用于對(duì)來(lái)自壓縮的HOA表示的方向信息進(jìn)行解碼的裝置包括:提取模塊,其被配置為從壓縮的HOA表示提取候選方向的集合,其中,每個(gè)候選方向是至少一個(gè)子帶中的潛在的子帶信號(hào)源方向,對(duì)于每個(gè)頻率子帶以及多達(dá)DSB個(gè)潛在的子帶信號(hào)源方向中的每一個(gè),指示該潛在的子帶信號(hào)源方向是否是相應(yīng)頻率子帶的有效子帶方向的比特,和有效子帶方向的相對(duì)方向索引以及對(duì)于每個(gè)有效子帶方向的方向子帶信號(hào)信息;轉(zhuǎn)換模塊,其被配置為對(duì)于每個(gè)頻率子帶方向,將所述相對(duì)方向索引轉(zhuǎn)換為絕對(duì)方向索引,其中,如果所述比特指示對(duì)于相應(yīng)頻率子帶,候選方向是有效子帶方向,則每個(gè)相對(duì)方向索引被用作所述候選方向的集合內(nèi)的索引;以及預(yù)測(cè)模塊,其被配置為從所述方向子帶信號(hào)信息預(yù)測(cè)方向子帶信號(hào),其中,方向根據(jù)所述絕對(duì)方向索引分配給方向子帶信號(hào)。
在一個(gè)實(shí)施例中,用于對(duì)方向信息進(jìn)行編碼的裝置至少包括有效候選確定模塊、分析濾波器組模塊、子帶方向確定模塊、相對(duì)方向索引分配模塊、方向信息組裝模塊以及包裝模塊。
有效候選確定模塊被配置為從輸入的HOA信號(hào)確定作為聲源的方向的有效候選方向的第一集合MDIR(k),其中,有效候選方向是在Q個(gè)全局方向的預(yù)定義集合之中確定的,并且其中,每個(gè)全局方向具有全局方向索引。分析濾波器組模塊被配置為將輸入的HOA信號(hào)劃分為多個(gè)頻率子帶。子帶方向確定模塊被配置為在有效候選方向的第一集合之中,對(duì)于所述頻率子帶中的每一個(gè),確定多達(dá)DSB個(gè)有效子帶方向的第二集合,其中,DSB<Q。相對(duì)方向索引分配模塊被配置為將相對(duì)方向索引(在范圍[1,...,NoOfGlobalDirs(k)]中)分配給每一個(gè)頻率子帶的每個(gè)方向。方向信息組裝模塊被配置為組裝當(dāng)前幀的方向信息。方向信息包括:有效候選方向MDIR(k),對(duì)于每個(gè)頻率子帶和每個(gè)有效候選方向,指示該有效候選方向是否是相應(yīng)頻率子帶的有效子帶方向的比特,以及對(duì)于每個(gè)頻率子帶,子帶方向的第二集合中的有效子帶方向的相對(duì)方向索引。包裝模塊被配置為傳送組裝的方向信息。
所公開(kāi)的方向信息的編碼的優(yōu)點(diǎn)是數(shù)據(jù)速率降低。進(jìn)一步的優(yōu)點(diǎn)是對(duì)于每個(gè)頻率子帶的搜索減少并因此搜索更快。
從以下的描述和所附的權(quán)利要求的考慮(在結(jié)合附圖進(jìn)行時(shí)),本發(fā)明的進(jìn)一步的目的、特征和優(yōu)點(diǎn)將變得清楚。
附圖說(shuō)明
參照附圖描述本發(fā)明的示例性實(shí)施例,附圖示出了:
圖1空間HOA編碼器的架構(gòu),
圖2方向估計(jì)塊的架構(gòu),
圖3感知邊信息源編碼器,
圖4感知邊信息源解碼器,
圖5空間HOA解碼器的架構(gòu),
圖6球坐標(biāo)系,
圖7方向估計(jì)處理塊,
圖8截?cái)嗟腍OA表示的方向、軌跡索引集合和系數(shù),
圖9編碼方法的流程圖,
圖10解碼方法的流程圖,
圖11用于對(duì)方向信息進(jìn)行編碼的裝置,
圖12用于對(duì)方向信息進(jìn)行解碼的裝置,以及
圖13方向索引編排。
具體實(shí)施方式
所提出的用于聲場(chǎng)的HOA表示的低比特速率壓縮方法的一個(gè)主要構(gòu)思是,通過(guò)以下兩個(gè)部分的組合來(lái)逐幀和逐頻率子帶(即,在每個(gè)HOA幀的單個(gè)的頻率子帶內(nèi))地近似原始HOA表示:截?cái)嗟腍OA表示以及基于若干個(gè)預(yù)測(cè)的方向子帶信號(hào)的表示。下面進(jìn)一步提供HOA基礎(chǔ)的概述。
近似的HOA表示的第一部分是由數(shù)量小的選擇的系數(shù)序列組成的截?cái)嗟腍OA版本,其中,選擇被允許隨時(shí)間(例如,在幀與幀之間)變化。用于表示截?cái)嗟腍OA版本的選擇的系數(shù)序列然后被感知編碼,并且是最終的壓縮的HOA表示的一部分。為了提高編碼效率并且降低在渲染時(shí)噪聲暴露的影響,有利的是在感知編碼之前對(duì)選擇的系數(shù)序列進(jìn)行去相關(guān)。部分去相關(guān)通過(guò)向預(yù)定義數(shù)量的選擇的HOA系數(shù)序列應(yīng)用空間變換來(lái)實(shí)現(xiàn),這意味著渲染到給定數(shù)量的虛擬揚(yáng)聲器信號(hào)。該部分去相關(guān)的很大優(yōu)點(diǎn)是,在解壓縮時(shí)不需要額外的邊信息來(lái)恢復(fù)去相關(guān)。
近似的HOA表示的第二部分通過(guò)若干個(gè)具有對(duì)應(yīng)方向的方向子帶信號(hào)表示。然而,這些方向子帶信號(hào)不被傳統(tǒng)編碼。相反,它們借助于來(lái)自第一部分(即,截?cái)嗟腍OA表示)的系數(shù)序列的預(yù)測(cè)被編碼為參數(shù)化表示。特別地,每個(gè)方向子帶信號(hào)由截?cái)嗟腍OA表示的系數(shù)序列的縮放的和來(lái)預(yù)測(cè),其中,縮放是線性的,并且一般是復(fù)值。兩個(gè)部分共同形成HOA信號(hào)的壓縮表示,從而實(shí)現(xiàn)低比特速率。為了能夠重新合成方向子帶信號(hào)的HOA表示以供解壓縮,壓縮表示包含復(fù)值預(yù)測(cè)縮放因子的量化版本以及方向的量化版本。特別地,在該上下文中的重要方面是方向和復(fù)值預(yù)測(cè)縮放因子的計(jì)算以及如何高效地對(duì)它們進(jìn)行編碼。
低比特速率HOA壓縮
對(duì)于所提出的低比特速率HOA壓縮,低比特速率HOA壓縮器可以細(xì)分為空間HOA編碼部分以及感知和源編碼部分。圖1中示出了空間HOA編碼部分的示例性架構(gòu),并且圖3中描繪了感知和源編碼部分的示例性架構(gòu)??臻gHOA編碼器10提供第一壓縮的HOA表示,該第一壓縮的HOA表示包括I個(gè)信號(hào),連同描述如何創(chuàng)建其HOA表示的邊信息。在感知和邊信息源編碼器30中,這I個(gè)信號(hào)在感知編碼器31中被感知編碼,并且邊信息在邊信息源編碼器32中經(jīng)受源編碼(例如,熵編碼)。邊信息源編碼器32提供編碼的邊信息然后,由感知編碼器31和邊信息源編碼器32提供的兩個(gè)編碼表示在復(fù)用器33中被復(fù)用以獲得低比特速率壓縮的HOA數(shù)據(jù)流
空間HOA編碼
圖1所示的空間HOA編碼器執(zhí)行逐幀處理。幀被定義為O個(gè)時(shí)間連續(xù)的HOA系數(shù)序列的部分。例如,將被編碼的輸入的HOA表示的第k幀C(k)相對(duì)于時(shí)間連續(xù)的HOA系數(shù)序列的矢量c(t)(參看等式(46))被定義為:
其中,k表示幀索引,L表示幀長(zhǎng)(以采樣為單位),O=(N+1)2表示HOA系數(shù)序列的數(shù)量,并且TS指示采樣周期。
截?cái)嗟腍OA表示的計(jì)算
如圖1所示,計(jì)算截?cái)嗟腍OA表示中的第一步包括從原始HOA幀C(k)計(jì)算11截?cái)嗟陌姹綜T(k)。該上下文中的截?cái)嘁馕吨鴱妮斎氲腍OA表示的O個(gè)系數(shù)序列中選擇I個(gè)特定的系數(shù)序列,并且將所有其它的系數(shù)序列設(shè)置為零。用于選擇系數(shù)序列的各種解決方案從[4,5,6]獲知,例如,相對(duì)于人類感知具有最大功率或最高相關(guān)性的那些。選擇的系數(shù)序列表示截?cái)嗟腍OA版本。產(chǎn)生包含選擇的系數(shù)序列的索引的數(shù)據(jù)集合然后,如下面進(jìn)一步描述的,截?cái)嗟腍OA版本CT(k)將被部分去相關(guān)12,并且部分去相關(guān)的截?cái)嗟腍OA版本CI(k)將經(jīng)受通道分配13,其中,被選的系數(shù)序列被分配給可用的I個(gè)傳輸通道。如下面進(jìn)一步描述的,這些系數(shù)序列然后被感知編碼30,并且最后是壓縮表示的一部分。為了獲得平滑信號(hào)以供通道分配之后的感知編碼,確定在第k幀中被選擇、但在第(k+1)幀中不被選擇的系數(shù)序列。在一個(gè)幀中被選擇、而在下一個(gè)幀中將不被選擇的那些系數(shù)序列漸減。它們的索引包含在數(shù)據(jù)集合中,該數(shù)據(jù)集合是的子集。類似地,在第k幀中被選擇、但在第(k-1)幀中未被選擇的系數(shù)序列漸增。它們的索引包含在集合中,該集合也是的子集。對(duì)于漸變,可以使用窗函數(shù)wOA(l),l=1,...,2L(諸如下面在等式(39)中介紹的函數(shù))。
總起來(lái)說(shuō),如果截?cái)嗟陌姹綜T(k)的HOA幀k通過(guò)以下等式由O個(gè)單個(gè)的系數(shù)序列幀的L個(gè)采樣組成:
則可以通過(guò)以下等式對(duì)于系數(shù)序列索引n=1,...,O和采樣索引l=1,...,L表達(dá)截?cái)啵?/p>
對(duì)于用于選擇系數(shù)序列的標(biāo)準(zhǔn),存在幾個(gè)可能性。例如,一個(gè)有利的解決方案是選擇表示信號(hào)功率中的大部分的那些系數(shù)序列。另一個(gè)有利的解決方案是選擇相對(duì)于人類感知最相關(guān)的那些系數(shù)序列。在后一種情況下,可以例如通過(guò)以下來(lái)確定相關(guān)性,即,將被不同截?cái)嗟谋硎句秩镜教摂M揚(yáng)聲器信號(hào),確定這些信號(hào)和與原始HOA表示對(duì)應(yīng)的虛擬揚(yáng)聲器信號(hào)之間的誤差,以及最后考慮聲音掩蔽效應(yīng)來(lái)解釋該誤差的相關(guān)性。
在一個(gè)實(shí)施例中,用于在集合中選擇索引的合理的策略是總是選擇頭OMIN個(gè)索引1,...,OMIN,其中,OMIN=(NMIN+1)2≤I,并且NMIN表示截?cái)嗟腍OA表示的給定的最小的全階。然后,根據(jù)以上提及的標(biāo)準(zhǔn)中的一個(gè)標(biāo)準(zhǔn)從集合{OMIN+1,...,OMAX}選擇剩余的I-OMIN個(gè)索引,其中,OMAX=(NMAX+1)2≤O,其中NMAX表示考慮要選擇的HOA系數(shù)序列的最大階數(shù)。注意,OMAX是每一個(gè)采樣的可轉(zhuǎn)移系數(shù)的最大數(shù)量,該數(shù)量小于或等于系數(shù)的總數(shù)O。根據(jù)該策略,截?cái)嗵幚韷K11還提供所謂的分配矢量其元素vA,i(k),i=1,...,I-OMIN根據(jù)以下等式設(shè)置:
vA,i(k)=n (4)
其中,n(n≥OMIN+1))表示C(k)的另外選擇的HOA系數(shù)序列(這些HOA系數(shù)序列以后將分配給第i傳輸信號(hào)yi(k))的HOA系數(shù)序列索引。yi(k)的定義在下面的等式(10)中給出。因此,CT(k)的頭OMIN個(gè)行默認(rèn)包括HOA系數(shù)序列1,...,OMIN,并且在CT(k)的后面的O-OMIN(或者OMAX-OMIN,如果O=OMAX的話)個(gè)行之中,存在I-OMIN個(gè)行,這I-OMIN個(gè)行包括其索引存儲(chǔ)在分配矢量vA(k)中的逐幀變化的HOA系數(shù)序列。最后,CT(k)的剩余的行包括零。因此,如下面將描述的,可用的I個(gè)傳輸信號(hào)的頭OMIN個(gè)(或者最后OMIN個(gè),如等式(10)中那樣)默認(rèn)分配給HOA系數(shù)序列1,...,OMIN,并且剩余的I-OMIN個(gè)傳輸信號(hào)分配給其索引存儲(chǔ)在分配矢量vA(k)中的逐幀變化的HOA系數(shù)序列。
部分去相關(guān)
在第二步中,執(zhí)行選擇的HOA系數(shù)序列的部分去相關(guān)12,以便提高隨后的感知編碼的效率,并且在渲染時(shí)避免在對(duì)選擇的HOA系數(shù)序列進(jìn)行矩陣化之后將發(fā)生的編碼噪聲暴露。示例性部分去相關(guān)12通過(guò)將空間變換應(yīng)用于頭OMIN個(gè)選擇的HOA系數(shù)序列(這意味著渲染到OMIN個(gè)虛擬揚(yáng)聲器信號(hào))來(lái)實(shí)現(xiàn)。相應(yīng)的虛擬揚(yáng)聲器位置借助于圖6所示的球坐標(biāo)系來(lái)表達(dá),在該球坐標(biāo)系中,每個(gè)位置假定位于單位球上,即,具有1的半徑。因此,位置可以等同地通過(guò)方向Ωj=(θj,φj)來(lái)表達(dá),其中,1≤j≤OMIN,θj和φj分別表示傾角和方位角(進(jìn)一步參見(jiàn)下面球坐標(biāo)系的定義)。這些方向應(yīng)盡可能均勻地分布在單位球上(參見(jiàn)例如[2],特定方向的計(jì)算)。注意,因?yàn)镠OA一般依賴于NMIN來(lái)定義方向,所以在本文中寫Ωj的地方,實(shí)際上意指
在下面,所有虛擬揚(yáng)聲器信號(hào)的幀通過(guò)以下等式表示:
其中,wj(k)表示第j虛擬揚(yáng)聲器信號(hào)的第k幀。此外,ΨMIN表示相對(duì)于虛擬方向Ωj的模式矩陣,其中,1≤j≤OMIN。模式矩陣通過(guò)以下等式定義:
其中,
指示相對(duì)于虛擬方向Ωi的模式矢量。其每個(gè)元素表示下面定義的實(shí)值球諧函數(shù)(參見(jiàn)等式(48))。通過(guò)使用該記法,可以通過(guò)以下矩陣乘法來(lái)公式化渲染處理:
作為部分去相關(guān)12的輸出的中間表示CI(k)的信號(hào)因此通過(guò)以下等式給出:
通道分配
在已計(jì)算中間表示CI(k)的幀之后,將其單個(gè)的信號(hào)cI,n(k)(其中)分配13給可用的I個(gè)通道,以提供用于感知編碼的傳輸信號(hào)yi(k),i=1,...,I。分配13的一個(gè)目的是避免在選擇在連續(xù)的幀之間改變的情況下可能發(fā)生的將被感知編碼的信號(hào)不連續(xù)。分配可以通過(guò)以下等式表達(dá):
增益控制
每個(gè)傳輸信號(hào)yi(k)最后被增益控制單元14處理,在增益控制單元14中,信號(hào)增益被平滑地修改以實(shí)現(xiàn)適合于感知編碼器的值范圍。增益修改需要一種前瞻性,以便避免連續(xù)的塊之間的嚴(yán)重的增益變化,并因此引入一個(gè)幀的延遲。對(duì)于每個(gè)傳輸信號(hào)幀yi(k),增益控制單元14接收或產(chǎn)生延遲幀yi(k-1),i=1,...,I。增益控制之后的修改信號(hào)幀由zi(k-1),i=1,...,I表示。此外,為了能夠在空間解碼器中恢復(fù)所進(jìn)行的任何修改,提供增益控制邊信息。增益控制邊信息包括指數(shù)ei(k-1)和異常標(biāo)志βi(k-1),i=1,...,I。對(duì)于增益控制的更詳細(xì)的描述,參見(jiàn)例如[9]第C.5.2.5節(jié)或者[3]。因此,截?cái)嗟腍OA版本19包括增益控制的信號(hào)幀zi(k-1)以及增益控制邊信息ei(k-1),βi(k-1),i=1,...,I。
分析濾波器組
如以上提及的,近似的HOA表示由兩個(gè)部分(即,截?cái)嗟腍OA版本19以及由具有對(duì)應(yīng)方向的方向子帶信號(hào)表示的分量,這些方向子帶信號(hào)是從截?cái)嗟腍OA表示的系數(shù)序列預(yù)測(cè)的)組成。因此,為了計(jì)算第二部分的參數(shù)化表示,原始HOA表示cn(k),n=1,...,O的單個(gè)的系數(shù)序列的每個(gè)幀首先被分解為單個(gè)的子帶信號(hào)的幀。這是在一個(gè)或多個(gè)分析濾波器組15中進(jìn)行的。對(duì)于每個(gè)子帶fj,j=1,...,F(xiàn),可以將單個(gè)的HOA系數(shù)序列的子帶信號(hào)的幀收集到以下子帶HOA表示中:
分析濾波器組15將子帶HOA表示提供給方向估計(jì)處理塊16和一個(gè)或多個(gè)計(jì)算塊17以用于方向子帶信號(hào)計(jì)算。
原則上,在分析濾波器組15中可以使用任何類型的濾波器(即,任何復(fù)值濾波器組,例如QMF、FFT)。不要求分析和對(duì)應(yīng)的合成濾波器組的連續(xù)應(yīng)用提供延遲的同一性,這將是被稱為完美重構(gòu)性質(zhì)的要求。注意,與HOA系數(shù)序列cn(k)相反,它們的子帶表示一般是復(fù)值的。此外,與原始時(shí)域信號(hào)相比,子帶信號(hào)一般是適時(shí)抽取的。因此,幀中的采樣數(shù)量通常明顯小于時(shí)域信號(hào)幀cn(k)中的采樣數(shù)量,時(shí)域信號(hào)幀cn(k)中的采樣數(shù)量為L(zhǎng)。
在一個(gè)實(shí)施例中,兩個(gè)或更多個(gè)子帶信號(hào)被組合到子帶信號(hào)組中,以便使處理更好地適應(yīng)人類聽(tīng)覺(jué)系統(tǒng)的性質(zhì)。每個(gè)組的帶寬可以例如通過(guò)其子帶信號(hào)的數(shù)量來(lái)適應(yīng)眾所周知的Bark尺度。也就是說(shuō),尤其是在較高頻率中,兩個(gè)或更多個(gè)組可以組合為一個(gè)組。注意,在這種情況下,每個(gè)子帶組由HOA系數(shù)序列的集合組成,其中,提取的參數(shù)的數(shù)量與單個(gè)子帶是相同的。在一個(gè)實(shí)施例中,分組是在一個(gè)或多個(gè)子帶信號(hào)分組單元(未明確示出)中執(zhí)行的,這些子帶信號(hào)分組單元可以合并在分析濾波器組塊15中。
方向估計(jì)
方向估計(jì)處理塊16對(duì)輸入的HOA表示進(jìn)行分析,并且對(duì)于每個(gè)頻率子帶fj,j=1,...,F(xiàn),計(jì)算向聲場(chǎng)添加重大貢獻(xiàn)的子帶普通平面波函數(shù)的方向的集合在該上下文中,術(shù)語(yǔ)“重大貢獻(xiàn)”可以例如是指隨著從其它方向射入的子帶普通平面波的信號(hào)功率變高的信號(hào)功率。它還可以是指在人類感知方面的高相關(guān)性。注意,在使用子帶分組的情況下,不是單個(gè)子帶,而是子帶組可以用于的計(jì)算。
在解壓縮期間,由于連續(xù)的幀之間估計(jì)的方向和預(yù)測(cè)系數(shù)的變化,可能出現(xiàn)預(yù)測(cè)的方向子帶信號(hào)中的偽像。為了避免這樣的偽像,對(duì)連結(jié)的長(zhǎng)幀執(zhí)行編碼期間的方向子帶信號(hào)的方向估計(jì)和預(yù)測(cè)。連結(jié)的長(zhǎng)幀由當(dāng)前幀及其前驅(qū)組成。為了解壓縮,然后使用對(duì)這些長(zhǎng)幀估計(jì)的量來(lái)執(zhí)行與預(yù)測(cè)的方向子帶信號(hào)的重疊相加處理。
用于方向估計(jì)的直接方法將是單獨(dú)對(duì)待每個(gè)子帶。對(duì)于方向搜索,在一個(gè)實(shí)施例中,可以應(yīng)用例如[7]中提出的技術(shù)。該方法對(duì)于每一單個(gè)子帶提供方向估計(jì)的平滑時(shí)間軌跡,并且能夠捕捉突然的方向變化或起始。然而,這種已知方法存在兩個(gè)缺點(diǎn)。首先,每個(gè)子帶中的獨(dú)立的方向估計(jì)可能導(dǎo)致如下不期望的影響,即,在存在全帶普通平面波(例如,來(lái)自某個(gè)方向的瞬間的擊鼓聲)時(shí),單個(gè)的子方向中的估計(jì)誤差可能導(dǎo)致來(lái)自不同方向的子帶普通平面波,這些子帶普通平面波加起來(lái)不等于期望的來(lái)自一個(gè)方向的全帶版本。特別地,來(lái)自某些方向的瞬態(tài)信號(hào)是模糊的。
第二,考慮獲得低比特速率壓縮的意圖,從邊信息得到的總比特速率必須被記住。在下面,將示出用于這樣的樸素方法的比特速率相當(dāng)高的示例。示例性地,子帶的數(shù)量F假定為10個(gè),并且每個(gè)子帶的方向的數(shù)量(該數(shù)量對(duì)應(yīng)于每個(gè)集合中的元素的數(shù)量)假定為4個(gè)。此外,如[9]中所提出的,假定對(duì)于每個(gè)子帶對(duì)Q=900個(gè)潛在的方向候選的網(wǎng)格執(zhí)行搜索。對(duì)于單個(gè)方向的簡(jiǎn)單編碼,這需要個(gè)比特。假定幀速率為每秒大約50幀,則僅對(duì)于方向的編碼表示所得到的總數(shù)據(jù)速率為:
即使假定幀速率為每秒25幀,所得到的數(shù)據(jù)速率10kbit/s仍然相當(dāng)高。
作為改進(jìn),在一個(gè)實(shí)施例中,在方向估計(jì)塊20中使用以下方向估計(jì)的方法。圖2中示出了總體構(gòu)思。
在第一步中,全帶方向估計(jì)塊21使用以下連結(jié)的長(zhǎng)幀對(duì)由Q個(gè)測(cè)試方向ΩTEST,q,q=1,...,Q組成的方向網(wǎng)格執(zhí)行初步的全帶方向估計(jì)或搜索:
其中,C(k)和C(k-1)是全帶原始HOA表示的當(dāng)前幀和前面的輸入幀。該方向搜索提供D(k)≤D個(gè)方向候選ΩCAND,d(k),d=1,...,D(k),這些方向候選包含在集合中,即,
每幀的方向候選的最大數(shù)量的典型值為D=16個(gè)。方向估計(jì)可以例如通過(guò)[7]中提出的方法來(lái)實(shí)現(xiàn):構(gòu)思是將從輸入的HOA表示的方向功率分布獲得的信息與用于方向的貝葉斯(Bayesian)推理的簡(jiǎn)單的源移動(dòng)模型組合。
在第二步中,由子帶方向估計(jì)塊22每一子帶(或子帶組)地對(duì)每一單個(gè)子帶執(zhí)行方向搜索。然而,對(duì)于子帶的這個(gè)方向搜索不需要考慮由Q個(gè)測(cè)試方向組成的初始的全方向網(wǎng)格,而是僅考慮候選集合該候選集合對(duì)于每個(gè)子帶僅包括D(k)個(gè)方向。由DSB(k,fj)表示的第fj子帶(j=1,...,F(xiàn))的方向的數(shù)量不大于DSB,該DSB通常明顯小于D,例如,DSB=4。像全帶方向搜索一樣,子帶相關(guān)的方向搜索也是對(duì)子帶信號(hào)的由前一個(gè)幀和當(dāng)前幀組成的以下長(zhǎng)連結(jié)幀執(zhí)行的:
原則上,與用于全帶相關(guān)的方向搜索的貝葉斯推理方法相同的貝葉斯推理方法可以應(yīng)用于子帶相關(guān)的方向搜索。
特定聲源的方向可以(但不需要)隨時(shí)間變化。特定聲源的方向的時(shí)間序列在本文中被稱為“軌跡”。每個(gè)子帶相關(guān)的方向或軌跡分別得到無(wú)歧義的索引,這防止不同的軌跡混合,并且提供連續(xù)的方向子帶信號(hào)。這對(duì)于下面描述的方向子帶信號(hào)的預(yù)測(cè)是重要的。特別地,它允許利用下面進(jìn)一步定義的連續(xù)的預(yù)測(cè)系數(shù)矩陣A(k,fj)之間的時(shí)間依賴性。因此,對(duì)于第fj子帶的方向估計(jì)提供元組的集合每個(gè)元組由一方面標(biāo)識(shí)單個(gè)(有效)的方向軌跡的索引和另一方面相應(yīng)的估計(jì)方向ΩSB,d(k,fj)組成,即,
根據(jù)定義,對(duì)于每個(gè)j=1,...,F(xiàn),集合是的子集,因?yàn)槿缟纤?,子帶方向搜索僅在當(dāng)前幀的方向候選ΩCAND,d(k),d=1,...,D(k)之中執(zhí)行。這允許相對(duì)于方向的邊信息的更高效的編碼,因?yàn)槊總€(gè)索引定義D(k)中的一個(gè)方向,而不是Q個(gè)候選方向,其中D(k)≤Q。索引d用于跟蹤后一個(gè)幀中的方向以用于創(chuàng)建軌跡。如圖2所示,并且如上所述,一個(gè)實(shí)施例中的方向估計(jì)處理塊16包括具有全帶方向估計(jì)塊21的方向估計(jì)塊20以及對(duì)于每個(gè)子帶或子帶組的子帶方向估計(jì)塊22。如圖7所示,它可以進(jìn)一步包括長(zhǎng)幀產(chǎn)生塊23,該長(zhǎng)幀產(chǎn)生塊23將以上提及的長(zhǎng)幀提供給方向估計(jì)塊20。長(zhǎng)幀產(chǎn)生塊23使用例如一個(gè)或多個(gè)存儲(chǔ)器從兩個(gè)連續(xù)的輸入幀產(chǎn)生長(zhǎng)幀,這兩個(gè)連續(xù)的輸入幀每個(gè)具有L個(gè)采樣的長(zhǎng)度。長(zhǎng)幀在本文中通過(guò)“”指示,并且通過(guò)具有兩個(gè)索引k-1和k來(lái)指示。在其它實(shí)施例中,長(zhǎng)幀產(chǎn)生塊23也可以是圖1所示的編碼器中的單獨(dú)的塊,或者合并在其它塊中。
方向子帶信號(hào)的計(jì)算
返回到圖1,由分析濾波器組15提供的子帶HOA表示幀j=1,...,F(xiàn)還輸入到一個(gè)或多個(gè)方向子帶信號(hào)計(jì)算塊17。在方向子帶信號(hào)計(jì)算塊17中,所有DSB個(gè)潛在的方向子帶信號(hào)d=1,...,DSB的長(zhǎng)幀以矩陣xk-1;k;fj布置為:
此外,無(wú)效的方向子帶信號(hào)的幀,即,其索引d不包含在集合內(nèi)的那些長(zhǎng)信號(hào)幀被設(shè)置為零。
剩余的長(zhǎng)信號(hào)幀即,具有索引的那些,被收集在矩陣內(nèi)。計(jì)算其中所包含的有效方向子帶信號(hào)的一種可能性是最小化它們的HOA表示和原始的輸入的子帶HOA表示之間的誤差。解決方案通過(guò)以下等式給出:
其中,(·)+表示Moore-Penrose偽逆,并且表示相對(duì)于集合中的方向估計(jì)的模式矩陣。注意,在子帶組的情況下,方向子帶信號(hào)的集合是通過(guò)一個(gè)矩陣(ΨSB(k,fj))+乘以該組的所有HOA表示計(jì)算的。注意,長(zhǎng)幀可以由與上述長(zhǎng)幀產(chǎn)生塊類似的一個(gè)或多個(gè)更多的長(zhǎng)幀產(chǎn)生塊產(chǎn)生。類似地,長(zhǎng)幀可以在長(zhǎng)幀分解塊中分解為正常長(zhǎng)度的幀。在一個(gè)實(shí)施例中,用于計(jì)算方向子帶的塊17在它們的輸出處向方向子帶預(yù)測(cè)塊18提供長(zhǎng)幀j=1,...,F(xiàn)。
方向子帶信號(hào)的預(yù)測(cè)
如以上提及的,近似的HOA表示部分由有效方向子帶信號(hào)表示,然而,這些有效方向子帶信號(hào)不被傳統(tǒng)編碼。相反,在目前描述的實(shí)施例中,使用參數(shù)化表示,以便使用于傳送編碼表示的總數(shù)據(jù)速率保持低。在參數(shù)化表示中,每個(gè)有效方向子帶信號(hào)(即,具有索引)由截?cái)嗟淖訋OA表示和的系數(shù)序列的加權(quán)和來(lái)預(yù)測(cè),其中,并且其中,權(quán)重一般是復(fù)值。
因此,假定表示的預(yù)測(cè)版本,則預(yù)測(cè)通過(guò)矩陣乘法被表達(dá)為:
其中,是具有用于子帶fj的所有加權(quán)因子(或者等同地,預(yù)測(cè)系數(shù))的矩陣。預(yù)測(cè)矩陣A(k,fj)的計(jì)算是在一個(gè)或多個(gè)方向子帶預(yù)測(cè)塊18中執(zhí)行的。在一個(gè)實(shí)施例中,如圖1所示,使用每一個(gè)子帶一個(gè)方向子帶預(yù)測(cè)塊18。在另一個(gè)實(shí)施例中,對(duì)于多個(gè)或所有子帶使用單個(gè)方向子帶預(yù)測(cè)塊18。在子帶組的情況下,對(duì)每個(gè)組計(jì)算一個(gè)矩陣A(k,fj);然而,它被單個(gè)地乘以該組的每個(gè)HOA表示從而每一個(gè)組地創(chuàng)建矩陣的集合注意,每一個(gè)構(gòu)造,A(k,fj)的除了具有索引的那些行之外的所有行都為零。這意味著僅有效方向子帶信號(hào)被預(yù)測(cè)。此外,A(k,fj)的除了具有索引的那些列之外的所有列也都為零。這意味著,對(duì)于預(yù)測(cè),僅考慮被傳送并且在HOA解壓縮期間可用于預(yù)測(cè)的那些HOA系數(shù)序列。
對(duì)于預(yù)測(cè)矩陣A(k,fj)的計(jì)算必須考慮以下方面。
第一,原始截?cái)嗟淖訋OA表示一般在HOA解壓縮時(shí)是不可用的。相反,它的感知解碼版本將是可用的并且被用于方向子帶信號(hào)的預(yù)測(cè)。
在低比特速率下,典型的音頻編解碼器(比如AAC或USAC)使用頻譜帶復(fù)制(SBR),其中,頻譜的較低頻和中頻被傳統(tǒng)編碼,而較高頻內(nèi)容(開(kāi)始于例如5kHz)則使用額外的關(guān)于高頻包絡(luò)的邊信息從較低頻和中頻復(fù)制。
由于該原因,感知解碼之后的截?cái)嗟腍OA分量的重構(gòu)的子帶系數(shù)序列的幅值類似于原始HOA分量的子帶系數(shù)序列的幅值。然而,對(duì)于相位,情況并非如此。因此,對(duì)于高頻子帶,對(duì)使用復(fù)值預(yù)測(cè)系數(shù)的預(yù)測(cè)利用任何相位關(guān)系沒(méi)有意義。相反,更合理的是僅使用實(shí)值預(yù)測(cè)系數(shù)。特別地,定義索引jSBR以使得第fj子帶包括用于SBR的起始頻率,如下設(shè)置預(yù)測(cè)系數(shù)的類型是有利的:
換句話說(shuō),在一個(gè)實(shí)施例中,用于較低子帶的預(yù)測(cè)系數(shù)是復(fù)值,而用于較高子帶的預(yù)測(cè)系數(shù)是實(shí)值。
第二,在一個(gè)實(shí)施例中,使矩陣A(k,fj)的計(jì)算策略適應(yīng)它們的類型。特別地,對(duì)于不受SBR影響的低頻子帶fj,1≤j<jSBR,可以通過(guò)最小化和它的預(yù)測(cè)版本之間的誤差的歐幾里得范數(shù)來(lái)確定A(k,fj)的非零元素。感知編碼器31定義并提供jSBR(未示出)。以這種方式,所涉及的信號(hào)的相位關(guān)系被明確地用于預(yù)測(cè)。對(duì)于子帶組,該組的所有方向信號(hào)上的預(yù)測(cè)誤差的歐幾里得范數(shù)(即,最小平方預(yù)測(cè)誤差)應(yīng)當(dāng)最小化。對(duì)于受SBR影響的高頻子帶fj,jSBR≤j≤F,以上提及的標(biāo)準(zhǔn)是不合理的,因?yàn)榻財(cái)嗟腍OA分量的重構(gòu)的子帶系數(shù)序列的相位不能被假定為甚至是基本類似于原始子帶系數(shù)序列的相位。
在這種情況下,一個(gè)解決方案是忽視相位,并且相反,僅集中于信號(hào)功率來(lái)進(jìn)行預(yù)測(cè)。用于確定預(yù)測(cè)系數(shù)的合理標(biāo)準(zhǔn)是最小化以下誤差:
其中,運(yùn)算|·|2假定逐個(gè)元素地應(yīng)用于矩陣。換句話說(shuō),預(yù)測(cè)系數(shù)被選為使得截?cái)嗟腍OA分量的所有加權(quán)的子帶或子帶組系數(shù)序列的功率的和最佳近似方向子帶信號(hào)的功率。在這種情況下,非負(fù)矩陣因子分解(NMF)技術(shù)(參見(jiàn)例如[8])可以用于求解這個(gè)優(yōu)化問(wèn)題并且獲得預(yù)測(cè)矩陣A(k,fj),j=1,...,F(xiàn).的預(yù)測(cè)系數(shù)。這些矩陣然后被提供給感知和源編碼級(jí)30。
感知和源編碼
在上述空間HOA編碼之后,對(duì)對(duì)于第(k-1)幀所得到的增益適應(yīng)的傳輸信號(hào)zi(k-1),i=1,...,I進(jìn)行編碼以獲得它們的編碼表示這由圖3所示的感知和源編碼級(jí)30處的感知編碼器31執(zhí)行。此外,使分配矢量vA(k-1)、增益控制參數(shù)ei(k-1)和βi(k-1),i=1,...,I、預(yù)測(cè)系數(shù)矩陣j=1,...,F(xiàn)、以及集合j=1,...,F(xiàn)中所包含的信息經(jīng)受源編碼來(lái)移除冗余,以用于高效的存儲(chǔ)或傳送。這在邊信息源編碼器32中執(zhí)行。所得到的編碼表示在復(fù)用器33中與編碼的傳輸信號(hào)表示i=1,...,I一起被復(fù)用以提供最終的編碼幀
因?yàn)樵瓌t上,增益控制參數(shù)和分配的源編碼可以類似于[9]執(zhí)行,所以本說(shuō)明書僅集中于方向和預(yù)測(cè)參數(shù)的編碼,下面詳細(xì)地描述方向和預(yù)測(cè)參數(shù)的編碼。
方向的編碼
對(duì)于單個(gè)的子帶方向的編碼,可以利用根據(jù)以上描述的不相關(guān)性減少來(lái)約束將被選擇的單個(gè)的子帶方向。如已經(jīng)提及的,這些單個(gè)的子帶方向不是從所有可能的測(cè)試方向ΩTEST,q,q=1,...,Q中選擇的,而是從對(duì)全帶HOA表示的每個(gè)幀確定的少量的候選中選擇的。示例性地,在以下算法1中概述用于對(duì)子帶方向進(jìn)行源編碼的可能的方式。
在算法1的第一步中,確定作為子帶方向?qū)嶋H確實(shí)發(fā)生的所有的全帶方向候選的集合即,
由NoOfGlobalDirs(k)表示的該集合的元素的數(shù)量是方向的編碼表示的第一部分。因?yàn)楦鶕?jù)定義是的子集,所以NoOfGlobalDirs(k)可以利用個(gè)比特編碼。為了闡明進(jìn)一步的描述,集合中的方向由ΩFB,d(k),d=1,...,NoOfGlobalDirs(k)表示,即,
在第二步中,借助于可能的測(cè)試方向ΩTEST,q(這里稱為網(wǎng)格)的索引q=1,...,Q對(duì)集合中的方向進(jìn)行編碼。對(duì)于每個(gè)方向ΩFB,d(k),d=1,...,NoOfGlobalDirs(k),相應(yīng)的網(wǎng)格索引被編碼在具有個(gè)比特的大小的數(shù)組元素GlobalDirGridIndices(k)[d]中。表示所有編碼的全帶方向的總數(shù)組GlobalDirGridIndices(k)由NoOfGlobalDirs(k)個(gè)元素組成。
在第三步中,對(duì)于每個(gè)子帶或子帶組fj,j=1,...,F(xiàn),第d方向子帶信號(hào)(d=1,...,DSB)是否有效(即,是否)的信息被編碼在數(shù)組元素bSubBandDirIsActive(k,fj)[d]中??倲?shù)組bSubBandDirIsActive(k,fj由DSB個(gè)元素組成。如果則借助于相應(yīng)的全帶方向ΩFB,i(k)的索引i將相應(yīng)的子帶方向ΩSB,d(k,fj)編碼到數(shù)組RelDirIndices(k,fj)中,該數(shù)組RelDirIndices(k,fj)由DSB(k,fj)個(gè)元素組成。
為了示出這種方向編碼方法的效率,計(jì)算根據(jù)以上示例的方向的編碼表示的最大數(shù)據(jù)速率:假定F=10個(gè)子帶,每一個(gè)子帶DSB(k,fj)=DSB=4個(gè)方向,Q=900個(gè)潛在的測(cè)試方向,并且?guī)俾蕿槊棵?5幀。在傳統(tǒng)編碼方法的情況下,所需的數(shù)據(jù)速率為10kbit/s。在根據(jù)一個(gè)實(shí)施例的改進(jìn)的編碼方法的情況下,如果全帶方向的數(shù)量假定為NoOfGlobalDirs(k)=D=8,則每幀需要個(gè)比特來(lái)對(duì)GlobalDirGridIndices(k)進(jìn)行編碼,需要DSB·F=40個(gè)比特來(lái)對(duì)bSubBandDirIsActive(k,fj)進(jìn)行編碼,并且需要個(gè)比特來(lái)對(duì)RelDirIndices(k,fj)進(jìn)行編碼。這導(dǎo)致240bits/frame·25frames/s=6kbit/s的數(shù)據(jù)速率,該數(shù)據(jù)速率明顯小于10kbit/s。即使對(duì)于更大數(shù)量NoOfGlobalDirs(k)=D=16個(gè)全帶方向,僅7kbit/s的數(shù)據(jù)速率也是足夠的。
圖13如Alg.1中那樣示出了方向索引編排。集合MDIR(k)具有D(k)個(gè)全帶候選方向,其中,D(k)<D,D是預(yù)定義值。集合MDIR(k)(MDIR(k)的子集)具有NoOfGlobalDirs(k)個(gè)實(shí)際使用的方向。GlobalDirIndices是存儲(chǔ)全帶方向(指的是所謂的例如900個(gè)方向的網(wǎng)格)的索引的數(shù)組。bSubBandDirIsActive對(duì)于多達(dá)DSB個(gè)軌跡(或方向)中的每一個(gè)存儲(chǔ)指示“有效”或“無(wú)效”的比特。RelDirIndices存儲(chǔ)用于bSubBandDirIsActive指示“有效”的軌跡/方向的GlobalDirIndices的索引,其中每個(gè)索引log2(NoOfGlobalDirs(k))個(gè)比特。
預(yù)測(cè)系數(shù)矩陣的編碼
對(duì)于預(yù)測(cè)系數(shù)矩陣的編碼,可以利用由于方向軌跡、因此方向子帶信號(hào)的平滑而導(dǎo)致連續(xù)幀的預(yù)測(cè)系數(shù)之間存在高度相關(guān)的事實(shí)。此外,對(duì)于每個(gè)預(yù)測(cè)系數(shù)矩陣A(k,fj),每一幀存在相對(duì)多的DSB(k,fj)·MC,ACT(k-1)個(gè)潛在的非零元素,其中,MC,ACT(k-1)表示集合中的元素的數(shù)量。如果不使用子帶組,則每幀總共存在F個(gè)矩陣要編碼。如果使用子帶組,則對(duì)應(yīng)地每幀存在少于F個(gè)矩陣要編碼。
在一個(gè)實(shí)施例中,為了使用于每個(gè)預(yù)測(cè)系數(shù)的比特?cái)?shù)保持低,每個(gè)復(fù)值預(yù)測(cè)系數(shù)由其幅值及其角度表示,并且然后對(duì)于矩陣A(k,fj)的每個(gè)特定元素獨(dú)立地且在連續(xù)幀之間差分編碼角度和幅值。如果幅值假定在區(qū)間[0,1]內(nèi),則幅值差位于區(qū)間[-1,1]內(nèi)。復(fù)數(shù)的角度差可以假定位于區(qū)間[-π,π]內(nèi)。對(duì)于幅值和角度差這二者的量化,相應(yīng)的區(qū)間可以細(xì)分為例如相等大小的個(gè)子區(qū)間。直接的編碼于是對(duì)于每個(gè)幅值和角度差需要NQ個(gè)比特。此外,已實(shí)驗(yàn)性地發(fā)現(xiàn),由于以上提及的連續(xù)幀的預(yù)測(cè)系數(shù)之間的相關(guān),單個(gè)的差的發(fā)生概率高度不均勻地分布。特別地,幅值中以及角度中的小的差比較大的差顯著更頻繁地發(fā)生。因此,基于將被編碼的單個(gè)的值的先驗(yàn)概率的編碼方法,像例如哈夫曼編碼,可以用于顯著減少每一個(gè)預(yù)測(cè)系數(shù)的平均比特?cái)?shù)。換句話說(shuō),已發(fā)現(xiàn),通常有利的是對(duì)預(yù)測(cè)矩陣A(k,fj)中的值的幅值和相位、而不是它們的實(shí)部和虛部差分編碼。然而,可能出現(xiàn)實(shí)部和虛部的使用是可接受的情況。
在一個(gè)實(shí)施例中,以某些間隔(應(yīng)用特定的,例如,每秒一次)發(fā)送特殊的訪問(wèn)幀,這些訪問(wèn)幀包括沒(méi)有差分編碼的矩陣系數(shù)。這允許解碼器從這些特殊的訪問(wèn)幀重新開(kāi)始差分解碼,因此使得能夠?qū)崿F(xiàn)解碼的隨機(jī)輸入。
下面,描述如以上構(gòu)造的低比特速率壓縮的HOA表示的解壓縮。解壓縮也是逐幀工作的。
原則上,根據(jù)實(shí)施例的低比特速率HOA解碼器包括上述低比特速率HOA編碼器組件的對(duì)應(yīng)部分,這些對(duì)應(yīng)部分以相反的次序布置。特別地,低比特速率HOA解碼器可以細(xì)分為如圖4所描繪的感知和源解碼部分以及如圖6所示的空間HOA解碼部分。
感知和源解碼
圖4示出了一個(gè)實(shí)施例中的感知和邊信息源解碼器40。在感知和邊信息源解碼器40中,低比特速率壓縮的HOA比特流首先在解復(fù)用器中被解復(fù)用s41,這導(dǎo)致I個(gè)信號(hào)i=1,...,I的感知編碼表示以及描述如何創(chuàng)建其HOA表示的編碼的邊信息然后,執(zhí)行這I個(gè)信號(hào)在感知解碼器42中的感知解碼s42以及邊信息在邊信息解碼器43(例如,熵解碼器)中的解碼s43。
感知解碼器42將I個(gè)信號(hào)i=1,...,I解碼為感知解碼信號(hào)i=1,...,I。
邊信息源解碼器43將編碼的邊信息解碼為元組集合j=1,...,F(xiàn)、用于每個(gè)子帶或子帶組fj(j=1,...,F(xiàn))的預(yù)測(cè)系數(shù)矩陣A(k+1,fj)、增益校正指數(shù)ei(k)和增益校正異常標(biāo)志βi(k)、以及分配矢量vAMB,ASSIGN(k)。
算法2示例性地概述了如何從編碼的邊信息創(chuàng)建元組集合j=1,...,F(xiàn)。下面詳細(xì)地描述子帶方向的解碼。
首先,從編碼的邊信息提取全帶方向的數(shù)量NoOfGlobalDirs(k)。如上所述,這些也被用作子帶方向。它利用個(gè)比特編碼。
在第二步中,提取由NoOfGlobalDirs(k)個(gè)元素組成的數(shù)組GlobalDirGridIndices(k),每個(gè)元素通過(guò)個(gè)比特編碼。該數(shù)組包含表示全帶方向ΩFB,d(k),d=1,...,NoOfGlobalDirs(k)的網(wǎng)格索引,以使得
ΩFB,d(k)=ΩTEST,GlobalDirGridIndices(k)[d] (23)
然后,對(duì)于每個(gè)子帶或子帶組fj,j=1,...,F(xiàn),提取由DSB個(gè)元素組成的數(shù)組bSubBandDirIsActive(k,fj),其中,第d元素bSubBandDirIsActive(k,fj)[d]指示第d子帶是否有效。此外,計(jì)算有效子帶方向DSB(k,fj)的總數(shù)。
最后,對(duì)于每個(gè)子帶或子帶組fj,j=1,...,F(xiàn),計(jì)算元組的集合它由標(biāo)識(shí)單個(gè)(有效)的子帶方向軌跡的索引以及相應(yīng)的估計(jì)方向ΩSB,d(k,fj)組成。
接著,從編碼幀重構(gòu)用于每個(gè)子帶或子帶組fj,j=1,...,F(xiàn)的預(yù)測(cè)系數(shù)矩陣A(k+1,fj)。在一個(gè)實(shí)施例中,重構(gòu)包括每個(gè)子帶或子帶組fj的以下步驟:
首先,通過(guò)熵解碼來(lái)獲得每個(gè)矩陣系數(shù)的角度和幅值差。然后,熵解碼的角度和幅值差根據(jù)用于它們的編碼的比特?cái)?shù)NQ重新縮放到它們的實(shí)際值范圍。最后,通過(guò)將重構(gòu)的角度和幅值差與最近的系數(shù)矩陣A(k,fj)(即,前一個(gè)幀的系數(shù)矩陣)的系數(shù)相加來(lái)構(gòu)建當(dāng)前的預(yù)測(cè)系數(shù)矩陣A(k+1,fj)。
因此,對(duì)于當(dāng)前矩陣A(k+1,fj)的解碼,必須知道前一個(gè)矩陣A(k,fj)。在一個(gè)實(shí)施例中,為了使得能夠隨機(jī)訪問(wèn),以某些間隔接收包括沒(méi)有差分編碼的矩陣系數(shù)的特殊的訪問(wèn)幀以從這些幀重新開(kāi)始差分解碼。
感知和邊信息源解碼器40將感知解碼信號(hào)i=1,...,I、元組集合j=1,...,F(xiàn)、預(yù)測(cè)系數(shù)矩陣A(k+1,fj)、增益校正指數(shù)ei(k)、增益校正異常標(biāo)志βi(k)以及分配矢量vAMB,ASSIGN(k)輸出到隨后的空間HOA解碼器50。
空間HOA解碼
圖5示出了一個(gè)實(shí)施例中的示例性空間HOA解碼器50??臻gHOA解碼器50從I個(gè)信號(hào)i=1,...,I以及由邊信息解碼器43提供的上述邊信息創(chuàng)建重構(gòu)的HOA表示。下面詳細(xì)地描述空間HOA解碼器50內(nèi)的單個(gè)的處理單元。
逆增益控制
在空間HOA解碼器50中,感知解碼信號(hào)i=1,...,I、連同相關(guān)聯(lián)的增益校正指數(shù)ei(k)和增益校正異常標(biāo)志βi(k)首先被輸入到一個(gè)或多個(gè)逆增益控制處理塊51。逆增益控制處理塊提供增益校正的信號(hào)幀i=1,...,I。在一個(gè)實(shí)施例中,I個(gè)信號(hào)中的每一個(gè)被饋送到如圖5中的單獨(dú)的逆增益控制處理塊51,以使得第i逆增益控制處理塊提供增益校正的信號(hào)幀逆增益控制的更詳細(xì)的描述從例如[9]第11.4.2.1獲知。
截?cái)嗟腍OA重構(gòu)
在截?cái)嗟腍OA重構(gòu)塊52中,I個(gè)增益校正的信號(hào)幀i=1,...,I根據(jù)由分配矢量vAMB,ASSIGN(k)提供的信息重新分布(即,重新分配)到HOA系數(shù)序列矩陣,以使得截?cái)嗟腍OA表示被重構(gòu)。分配矢量vAMB,ASSIGN(k)包括I個(gè)分量,該I個(gè)分量對(duì)于每個(gè)傳送通道指示它包含原始HOA分量的哪個(gè)系數(shù)序列。此外,分配矢量的元素形成用于第k幀的所有接收的系數(shù)序列的索引(是指原始HOA分量)的集合
截?cái)嗟腍OA表示的重構(gòu)包括以下步驟:
第一,取決于分配矢量中的信息,解碼的中間表示
的單個(gè)的分量n=1,...,O被設(shè)置為零或者被增益校正的信號(hào)幀的對(duì)應(yīng)分量替換,即,
這意味著,如上所述,分配矢量的第i元素(在等式(26)中為n)指示第i系數(shù)替換解碼的中間表示矩陣的第n行中的
第二,通過(guò)將逆空間變換應(yīng)用于內(nèi)的頭OMIN個(gè)信號(hào)來(lái)執(zhí)行它們的再相關(guān),提供以下幀:
在該幀中,模式矩陣ΨMIN如等式(6)中那樣定義。該模式矩陣取決于分別對(duì)每個(gè)OMIN或NMIN預(yù)定義的給定方向,因此在編碼器和解碼器處都可以被獨(dú)立地構(gòu)造。此外,OMIN(或NMIN)是根據(jù)慣例預(yù)先定義的。
最后,根據(jù)以下等式從再相關(guān)的信號(hào)以及中間表示的信號(hào)n=OMIN+1,...,O組成重構(gòu)的截?cái)嗟腍OA表示
分析濾波器組
為了進(jìn)一步計(jì)算由預(yù)測(cè)的方向子帶信號(hào)表示的第二HOA分量,首先在一個(gè)或多個(gè)分析濾波器組53中將解壓縮的截?cái)嗟腍OA表示的單個(gè)的系數(shù)序列n的每個(gè)幀n=1,...,O分解為單個(gè)的子帶信號(hào)的幀j=1,...,F(xiàn)。對(duì)于每個(gè)子帶fj,j=1,...,F(xiàn),可以將單個(gè)的HOA系數(shù)序列的子帶信號(hào)的幀收集到如下的子帶HOA表示中:
對(duì)于j=1,...,F(xiàn) (29)
在HOA空間解碼級(jí)處應(yīng)用的一個(gè)或多個(gè)分析濾波器組53與在HOA空間編碼級(jí)處的那些一個(gè)或多個(gè)分析濾波器組15是相同的,并且對(duì)于子帶組,應(yīng)用來(lái)自HOA空間編碼級(jí)的分組。因此,在一個(gè)實(shí)施例中,分組信息被包括在編碼信號(hào)中。下面提供關(guān)于分組信息的更多細(xì)節(jié)。
在一個(gè)實(shí)施例中,對(duì)于HOA壓縮級(jí)處的截?cái)嗟腍OA表示的計(jì)算(參見(jiàn)以上,等式(4)附近)考慮最大階數(shù)NMAX,并且使HOA壓縮器和解壓縮器的分析濾波器組15、53的應(yīng)用僅限于具有索引n=1,...,OMAX的那些HOA系數(shù)序列具有索引n=OMAX+1,...,O的子帶信號(hào)幀然后可以被設(shè)置為零。
方向子帶HOA表示的合成
對(duì)于每個(gè)子帶或子帶組,在一個(gè)或多個(gè)方向子帶合成塊54中合成方向子帶或子帶組HOA表示j=1,...,F(xiàn)。在一個(gè)實(shí)施例中,為了避免由于連續(xù)幀之間的方向和預(yù)測(cè)系數(shù)的變化而導(dǎo)致的偽像,方向子帶HOA表示的計(jì)算基于重疊相加的概念。因此,在一個(gè)實(shí)施例中,與第fj子帶(j=1,...,F(xiàn))相關(guān)的有效方向子帶信號(hào)的HOA表示被計(jì)算為漸減的分量和漸增的分量的和:
在第一步中,為了計(jì)算這兩個(gè)單個(gè)的分量,通過(guò)以下等式來(lái)計(jì)算與用于幀k1∈{k,k+1}的預(yù)測(cè)系數(shù)矩陣A(k1,fj)以及用于第k幀的截?cái)嗟淖訋OA表示相關(guān)的所有方向子帶信號(hào)的瞬時(shí)幀:
對(duì)于k1∈{k,k+1} (31)
對(duì)于子帶組,將每個(gè)組的HOA表示乘以固定矩陣A(k1,fj)來(lái)創(chuàng)建該組的子帶信號(hào)
在第二步中,相對(duì)于方向ΩSB,d(k,fj)的方向子帶信號(hào)的瞬時(shí)子帶HOA表示(j=1,...,F(xiàn))被獲得為:
其中,表示相對(duì)于方向ΩSB,d(k,fj)的模式矢量(如等式(7)中的模式矢量)。對(duì)于子帶組,對(duì)該組的所有信號(hào)執(zhí)行等式(32),其中,矩陣ψ(ΩSB,d(k,fj))對(duì)于每個(gè)組是固定的。
假定矩陣和將通過(guò)以下等式由它們的采樣組成:
則有效方向子帶信號(hào)的HOA表示的漸減分量和漸增分量的采樣值最后通過(guò)以下等式確定:
其中,矢量
表示重疊相加窗函數(shù)。窗函數(shù)的示例由周期性Hann窗給出,該周期性Hann窗的元素通過(guò)以下等式定義:
子帶HOA組成
對(duì)于每個(gè)子帶或子帶組fj,j=1,...,F(xiàn),解碼的子帶HOA表示的系數(shù)序列(n=1,...,O)被設(shè)置為截?cái)嗟腍OA表示的系數(shù)序列,如果它以前被傳送的話,否則被設(shè)置為由方向子帶合成塊54中的一個(gè)提供的方向HOA分量的系數(shù)序列,即,
該子帶組成由一個(gè)或多個(gè)子帶組成塊55執(zhí)行。在實(shí)施例中,單獨(dú)的子帶組成塊55被用于每個(gè)子帶或子帶組,因此用于所述一個(gè)或多個(gè)方向子帶合成塊54中的每一個(gè)。在一個(gè)實(shí)施例中,方向子帶合成塊54及其對(duì)應(yīng)的子帶組成塊55集成到單個(gè)塊中。
合成濾波器組
在最后一步中,從所有解碼的子帶HOA表示j=1,...,F(xiàn)合成解碼的HOA表示。解壓縮的HOA表示的單個(gè)的時(shí)域系數(shù)序列n=1,...,O由一個(gè)或多個(gè)合成濾波器組56從對(duì)應(yīng)的子帶系數(shù)序列i=1,...,F(xiàn)合成,所述一個(gè)或多個(gè)合成濾波器組56最后輸出解壓縮的HOA表示
注意,由于連續(xù)應(yīng)用分析和合成濾波器組53、56,合成的時(shí)域系數(shù)序列通常具有延遲。
圖8示例性地示出了對(duì)于單個(gè)頻率子帶f1,有效方向候選的集合、它們的被選軌跡以及對(duì)應(yīng)的元組集合。在幀k中,四個(gè)方向在頻率子帶f1中有效。這些方向?qū)儆谙鄳?yīng)的軌跡T1、T2、T3和T5。在前面的幀k-2和k-1中,不同的方向有效,即,分別為T1、T2、T6和T1-T4。幀k中的有效方向的集合MDIR(k)涉及全帶,并且包括幾個(gè)有效方向候選,例如,MDIR(k)={Ω3,Ω8,Ω52,Ω101,Ω229,Ω446,Ω581}。每個(gè)方向可以以任何方式表達(dá),例如,由兩個(gè)角度表達(dá)或者表達(dá)為預(yù)定義表格的索引。從有效的全帶方向的集合,在子帶中實(shí)際有效的那些方向以及它們對(duì)應(yīng)的軌跡針對(duì)每個(gè)頻率子帶單獨(dú)地被收集在元組集合MDIR(k,fj),j=1,...,F中。例如,在幀k的第一頻率子帶中,有效方向?yàn)棣?sub>3、Ω52、Ω229和Ω581,并且它們的相關(guān)聯(lián)的軌跡分別為T3、T1、T2和T5。在第二頻率子帶f2中,有效方向示例性地僅為Ω52和Ω229,并且它們的相關(guān)聯(lián)的軌跡分別為T1和T2。
下面是與示例性集合IC,ACT(k)={1,2,4,6}中的系數(shù)序列對(duì)應(yīng)的示例性截?cái)嗟腍OA表示CT(k)的系數(shù)矩陣的一部分:
根據(jù)IC,ACT(k),僅行1、2、4和6的系數(shù)不被設(shè)置為零(然而,它們可以為零,這取決于信號(hào))。矩陣CT(k)的每一列是指一個(gè)采樣,并且該矩陣的每一行是系數(shù)序列。壓縮包括并非所有的系數(shù)序列被編碼和傳送,而是僅一些選擇的系數(shù)序列(即,其索引分別包括在IC,ACT(k)和分配矢量vA(k)中的那些系數(shù)序列)被編碼和傳送。在解碼器處,系數(shù)被解壓縮,并且被定位到重構(gòu)的截?cái)嗟腍OA表示的正確的矩陣行中。關(guān)于行的信息從分配矢量vAMB,ASSIGN(k)獲得,該分量矢量vAMB,ASSIGN(k)另外還提供用于每個(gè)傳送的系數(shù)序列的傳輸通道。剩余的系數(shù)序列利用零填充,并且以后根據(jù)接收的邊信息(例如,預(yù)測(cè)矩陣)從接收的(通常是非零的)系數(shù)預(yù)測(cè)。
子帶分組
在一個(gè)實(shí)施例中,所使用的子帶具有適應(yīng)人類聽(tīng)覺(jué)的心理聲學(xué)性質(zhì)的不同帶寬??商娲兀M合來(lái)自分析濾波器組53的若干子帶以便形成具有擁有不同帶寬的子帶的適合的濾波器組。來(lái)自分析濾波器組53的一組相鄰子帶使用相同的參數(shù)進(jìn)行處理。如果使用多組組合的子帶,則在編碼器側(cè)應(yīng)用的對(duì)應(yīng)的子帶配置對(duì)于解碼器側(cè)必須是已知的。在實(shí)施例中,配置信息被傳送,并且被解碼器使用以設(shè)置其合成濾波器組。在實(shí)施例中,配置信息包括用于多個(gè)預(yù)定義的已知配置(例如,在列表中)之中的一個(gè)配置的標(biāo)識(shí)符。
在另一個(gè)實(shí)施例中,使用以下靈活的解決方案,該解決方案減少定義子帶配置所需的比特?cái)?shù)。為了對(duì)子帶配置進(jìn)行高效編碼,第一個(gè)、倒數(shù)第二個(gè)和最后一個(gè)子帶組的數(shù)據(jù)被與其它子帶組不同地對(duì)待。此外,在編碼中使用子帶組帶寬差值。原則上,子帶分組信息編碼方法適合于對(duì)針對(duì)音頻信號(hào)的一個(gè)或多個(gè)幀奏效的子帶組的子帶配置數(shù)據(jù)進(jìn)行編碼,其中,每個(gè)子帶組是一個(gè)或多個(gè)相鄰的原始子帶的組合,并且原始子帶的數(shù)量是預(yù)先定義的。在一個(gè)實(shí)施例中,后一個(gè)子帶組的帶寬大于或等于當(dāng)前子帶組的帶寬。該方法包括利用表示NSB-1的固定比特?cái)?shù)對(duì)NSB個(gè)子帶組進(jìn)行編碼,并且如果NSB>1,則對(duì)于第一子帶組g1,利用表示BSB[1]-1的一元碼對(duì)帶寬值BSB[1]進(jìn)行編碼。如果NSB=3,則對(duì)于第二子帶組g2,編碼具有固定比特?cái)?shù)的帶寬差值ΔBSB[2]=BSB[2]-BSB[1]。如果NSB>3,則對(duì)于子帶組利用一元碼對(duì)對(duì)應(yīng)數(shù)量的帶寬差值ΔBSB[g]=BSB[g]-BSB[g-1]進(jìn)行編碼,并且對(duì)于最后一個(gè)子帶組編碼具有固定比特?cái)?shù)的帶寬差值ΔBSB[NSB-1]=BSB[NSB-1]-BSB[NSB-2]。子帶組的帶寬值被表達(dá)為若干相鄰的原始子帶。對(duì)于最后一個(gè)子帶組gSB,沒(méi)有對(duì)應(yīng)的值需要包括在編碼的子帶配置數(shù)據(jù)中。
下面,對(duì)高階高保真立體聲的一些基本特征進(jìn)行解釋。
高階高保真立體聲(HOA)是基于感興趣的緊湊區(qū)域內(nèi)的聲場(chǎng)的描述,該區(qū)域假定是沒(méi)有聲源的。在該情況下,在感興趣區(qū)域內(nèi)的位置x、時(shí)間t處的聲壓p(t,x)的時(shí)空行為在物理上完全由齊次波方程式確定。下面,我們假定如圖6所示的球坐標(biāo)系。在該坐標(biāo)系中,x軸指向前面的位置,y軸指向左邊,z軸指向頂部。空間x=(r,θ,φ)T中的位置由半徑r>0(即,到坐標(biāo)原點(diǎn)的距離)、從極軸z(!)測(cè)量的傾角θ∈[0,π]、以及在x-y平面中從x軸逆時(shí)針測(cè)量的方位角φ∈[0,2π[表示。此外,(·)T表示轉(zhuǎn)置。
于是,可以證明[11],由所表示的相對(duì)于時(shí)間的聲壓的傅里葉變換,即,
(其中,ω表示角頻率,并且i指示虛數(shù)單位)可以根據(jù)以下等式展開(kāi)為球諧級(jí)數(shù):
在等式(42)中,cs表示聲音的速度,并且k表示角波數(shù),其通過(guò)與角頻率ω相關(guān)。此外,jn(·)表示第一類的球貝塞爾函數(shù),并且表示以上定義的階數(shù)n和次數(shù)m的實(shí)值球諧函數(shù)。展開(kāi)系數(shù)僅取決于角波數(shù)k。注意,已隱含地假定聲壓是空間帶限的。因此,級(jí)數(shù)相對(duì)于階數(shù)索引n在上限N處被截?cái)?,該上限N被稱為HOA表示的階數(shù)。
如果聲場(chǎng)由從角度元組(θ,φ)指定的所有可能的方向到達(dá)且無(wú)限數(shù)量的不同角頻率ω的平面諧波的疊加來(lái)表示,則可以證明[10],相應(yīng)的平面波復(fù)數(shù)幅度函數(shù)C(ω,θ,φ)可以由以下球諧函數(shù)展開(kāi)來(lái)表達(dá):
其中,展開(kāi)系數(shù)通過(guò)以下等式與展開(kāi)系數(shù)相關(guān):
假定單個(gè)的系數(shù)(k=ω/cs)是角頻率ω的函數(shù),則逆傅里葉變換(由表示)的應(yīng)用對(duì)于每個(gè)階數(shù)n和次數(shù)m提供以下時(shí)域函數(shù):
這些時(shí)域函數(shù)在這里被稱為連續(xù)時(shí)間HOA系數(shù)序列,這些HOA系數(shù)序列可以通過(guò)以下等式收集在單個(gè)矢量c(t)中:
HOA系數(shù)序列在矢量c(t)內(nèi)的位置索引由n(n+1)+1+m給出。
矢量c(t)中的元素的總數(shù)由O=(N+1)2給出。
最終的高保真立體聲格式如下使用采樣頻率fS提供c(t)的采樣版本:
其中,TS=1/fS表示采樣周期。c(lTS)的元素在這里被稱為離散時(shí)間HOA系數(shù)序列,其可以證明為總是實(shí)值。該性質(zhì)顯然對(duì)于連續(xù)時(shí)間版本也成立。
實(shí)值球諧函數(shù)的定義
實(shí)值球諧函數(shù)(采用SN3D規(guī)范化[1,第3.1章])由以下等式給出:
其中,
相關(guān)聯(lián)的勒讓德(Legendre)函數(shù)Pn,m(x)利用勒讓德多項(xiàng)式Pn(x)定義為:
并且不同于[11]中那樣,沒(méi)有Condon-Shortley相位項(xiàng)(-1)m。
在一個(gè)實(shí)施例中,用于HOA信號(hào)表示(從復(fù)值濾波器組獲得)的子帶或子帶組內(nèi)的主導(dǎo)方向信號(hào)的方向的逐幀確定和高效編碼的方法包括對(duì)于每個(gè)當(dāng)前幀k:確定HOA信號(hào)中的全帶方向候選的集合MDIR(k)、集合MDIR(k)中的元素的數(shù)量NoOfGlobalDirs(k)以及對(duì)該數(shù)量的元素進(jìn)行編碼所需的數(shù)量D(k)=log2(NoOfGlobalDirs(k)),其中,每個(gè)全帶方向候選具有與預(yù)定義的Q個(gè)可能的方向的全集相關(guān)的全局索引q(q∈[1,...,Q]),對(duì)于當(dāng)前幀k的每個(gè)子帶或子帶組j,確定集合MDIR(k)中的全帶方向候選中的哪些方向作為有效子帶方向發(fā)生,確定子帶或子帶組中的任何一個(gè)中的作為有效子帶方向發(fā)生的使用的全帶方向候選(全部包含在HOA信號(hào)中的全帶方向候選的集合MDIR(k)中)的集合MFB(k)、以及使用的全帶方向候選的集合MFB(k)中的元素的數(shù)量NoOfGlobalDirs(k),并且對(duì)于當(dāng)前幀k的每個(gè)子帶或子帶組j:確定集合MDIR(k)中的全帶方向候選之中的多達(dá)d(d∈[1,...,D])個(gè)方向中的哪些方向是有效子帶方向,對(duì)于每個(gè)有效子帶方向確定軌跡和軌跡索引,將軌跡索引分配給每個(gè)有效子帶方向,并且利用D(k)個(gè)比特通過(guò)相對(duì)索引對(duì)當(dāng)前子帶或子帶組j中的每個(gè)有效子帶方向進(jìn)行編碼。
在一個(gè)實(shí)施例中,計(jì)算機(jī)可讀介質(zhì)具有存儲(chǔ)在其上的可執(zhí)行指令,這些可執(zhí)行指令當(dāng)在計(jì)算機(jī)上被執(zhí)行時(shí)使計(jì)算機(jī)執(zhí)行以上公開(kāi)的用于主導(dǎo)方向信號(hào)的方向的逐幀確定和高效編碼的方法。
此外,在一個(gè)實(shí)施例中,用于HOA信號(hào)表示的子帶內(nèi)的主導(dǎo)方向信號(hào)的方向的解碼的方法包括以下步驟:接收將被解碼的HOA信號(hào)表示的最大數(shù)量D個(gè)方向的索引,接收每一個(gè)子帶的有效方向信號(hào)的索引,重構(gòu)將被解碼的HOA信號(hào)表示的最大數(shù)量D個(gè)方向中的方向,從將被解碼的HOA信號(hào)表示的重構(gòu)的D個(gè)方向以及每一個(gè)子帶的有效方向信號(hào)的索引重構(gòu)每一個(gè)子帶的有效方向,預(yù)測(cè)子帶的方向信號(hào),其中,子帶的當(dāng)前幀中的方向信號(hào)的預(yù)測(cè)包括確定該子帶的前一個(gè)幀的方向信號(hào),并且其中,如果方向信號(hào)的索引在前一個(gè)幀中為零、而在當(dāng)前幀中為非零,則創(chuàng)建新的方向信號(hào),如果方向信號(hào)的索引在前一個(gè)幀中為非零、而在當(dāng)前幀中為零,則取消前一方向信號(hào),并且如果方向信號(hào)的索引從第一方向變?yōu)榈诙较颍瑒t將該方向信號(hào)的方向從第一方向移動(dòng)到第二方向。
在一個(gè)實(shí)施例中,如圖1和圖3所示,并且如以上所討論的,用于對(duì)具有給定數(shù)量的系數(shù)序列(其中,每個(gè)系數(shù)序列具有索引)的輸入的HOA信號(hào)的幀進(jìn)行編碼的裝置包括至少一個(gè)硬件處理器和非暫時(shí)性的有形計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)有形地包含至少一個(gè)軟件組件,該軟件組件當(dāng)在所述至少一個(gè)硬件處理器上執(zhí)行行時(shí)引起以下操作:
計(jì)算11具有數(shù)量減少的非零系數(shù)序列的截?cái)嗟腍OA表示CT(k),確定11截?cái)嗟腍OA表示中所包括的有效的系數(shù)序列的索引的集合IC,ACT(k),從輸入的HOA信號(hào)估計(jì)16候選方向的第一集合MDIR(k),將輸入的HOA信號(hào)劃分15為多個(gè)頻率子帶f1,...,fF,其中,獲得頻率子帶的系數(shù)序列對(duì)于每個(gè)頻率子帶估計(jì)16方向的第二集合MDIR(k,f1),...,MDIR(k,fF),其中,方向的第二集合的每個(gè)元素是具有第一索引和第二索引的索引元組,第二索引是當(dāng)前頻率子帶的有效方向的索引,而第一索引是有效方向的軌跡索引,其中,每個(gè)有效方向也包括在輸入的HOA信號(hào)的候選方向的第一集合MDIR(k)中,對(duì)于每個(gè)頻率子帶,根據(jù)相應(yīng)頻率子帶的方向的第二集合MDIR(k,f1),...,MDIR(k,fF)從頻率子帶的系數(shù)序列計(jì)算17方向子帶信號(hào)對(duì)于每個(gè)頻率子帶,使用相應(yīng)頻率子帶的有效的系數(shù)通道的索引的集合IC,ACT(k)從頻率子帶的系數(shù)序列計(jì)算18適于預(yù)測(cè)方向子帶信號(hào)的預(yù)測(cè)矩陣A(k,f1),...,A(k,fF),并且對(duì)候選方向的第一集合MDIR(k)、方向的第二集合MDIR(k,f1),...,MDIR(k,fF)、預(yù)測(cè)矩陣A(k,f1),...,A(k,fF)以及截?cái)嗟腍OA表示CT(k)進(jìn)行編碼。
在一個(gè)實(shí)施例中,如圖4和圖5所示,并且如以上所討論的,用于對(duì)壓縮的HOA表示進(jìn)行解碼的裝置包括至少一個(gè)硬件處理器和非暫時(shí)性的有形計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)有形地包含至少一個(gè)軟件組件,該軟件組件當(dāng)在所述至少一個(gè)硬件處理器上執(zhí)行時(shí)引起以下操作:
從壓縮的HOA表示提取s41、s42、s43多個(gè)截?cái)嗟腍OA系數(shù)序列指示或包含所述截?cái)嗟腍OA系數(shù)序列的序列索引的分配矢量vAMB,ASSIGN(k)、子帶相關(guān)的方向信息MDIR(k+1,f1),...,MDIR(k+1,fF)、多個(gè)預(yù)測(cè)矩陣A(k+1,f1),...,A(k+1,fF)、以及增益控制邊信息e1(k),β1(k),...,eI(k),βI(k);
從所述多個(gè)截?cái)嗟腍OA系數(shù)序列增益控制邊信息e1(k),β1(k),...,eI(k),βI(k)以及分配矢量vAMB,ASSIGN(k)重構(gòu)s51、s52截?cái)嗟腍OA表示
在分析濾波器組53中將重構(gòu)的截?cái)嗟腍OA表示分解為多個(gè)即F個(gè)頻率子帶的頻率子帶表示
在方向子帶合成塊54中對(duì)于每個(gè)頻率子帶表示,從重構(gòu)的截?cái)嗟腍OA表示的相應(yīng)的頻率子帶表示子帶相關(guān)的方向信息MDIR(k+1,f1),...,MDIR(k+1,fF)以及預(yù)測(cè)矩陣A(k+1,f1),...,A(k+1,fF)合成s54預(yù)測(cè)的方向HOA表示
在子帶組成塊55中對(duì)于所述F個(gè)頻率子帶中的每一個(gè),組成s55具有系數(shù)序列n=1,...,O的解碼的子帶HOA表示所述系數(shù)序列n=1,...,O從截?cái)嗟腍OA表示的系數(shù)序列獲得,如果系數(shù)序列具有包括在分配矢量vAMB,ASSIGN(k)中的索引n的話,否則從由方向子帶合成塊54中的一個(gè)提供的預(yù)測(cè)的方向HOA分量的系數(shù)序列獲得;以及
在合成濾波器組56中合成s56解碼的子帶HOA表示以獲得解碼的HOA表示
圖9示出了一個(gè)實(shí)施例中的解碼方法的流程圖。用于對(duì)來(lái)自壓縮的HOA表示的方向信息進(jìn)行解碼的方法90包括對(duì)于壓縮的HOA表示的每個(gè)幀:
從壓縮的HOA表示提取s91-s93候選方向的集合MFB(k),其中,每個(gè)候選方向是至少一個(gè)頻率子帶中的潛在的子帶信號(hào)源方向,對(duì)于每個(gè)頻率子帶以及多達(dá)DSB個(gè)潛在的子帶信號(hào)源方向中的每一個(gè),指示該潛在的子帶信號(hào)源方向是否是相應(yīng)頻率子帶的有效子帶方向的比特bSubBandDirIsActive(k,fj),和有效子帶方向的相對(duì)方向索引RelDirIndices(k,fj)以及對(duì)于每個(gè)有效子帶方向的方向子帶信號(hào)信息;
對(duì)于每個(gè)頻率子帶方向,將相對(duì)方向索引RelDirIndices(k,fj)轉(zhuǎn)換s60為絕對(duì)方向索引,其中,如果所述比特bSubBandDirIsActive(k,fj)指示對(duì)于相應(yīng)頻率子帶,候選方向是有效子帶方向,則每個(gè)相對(duì)方向索引被用作候選方向的集合MFB(k)內(nèi)的索引;以及
從所述方向子帶信號(hào)信息預(yù)測(cè)s70方向子帶信號(hào),其中,方向根據(jù)所述絕對(duì)方向索引被分配給方向子帶信號(hào)。
在實(shí)施例中,當(dāng)前幀中的方向子帶信號(hào)的預(yù)測(cè)s70包括確定前一個(gè)幀的子帶的方向子帶信號(hào),其中,如果方向子帶信號(hào)的索引在前一個(gè)幀中為零、而在當(dāng)前幀中為非零,則創(chuàng)建新的方向子帶信號(hào),如果方向信號(hào)的索引在前一個(gè)幀中為非零、而在當(dāng)前幀中為零,則取消前一方向子帶信號(hào),并且如果方向子帶信號(hào)的索引從第一方向變?yōu)榈诙较?,則將方向子帶信號(hào)的方向從第一方向移動(dòng)到第二方向。
在實(shí)施例中,至少一個(gè)子帶是兩個(gè)或更多個(gè)頻率子帶的子帶組。
在實(shí)施例中,方向子帶信號(hào)信息至少包括多個(gè)截?cái)嗟腍OA系數(shù)序列指示或包含所述截?cái)嗟腍OA系數(shù)序列的序列索引的分配矢量vAMB,ASSIGN(k)以及多個(gè)預(yù)測(cè)矩陣A(k+1,f1),...,A(k+1,fF)。在實(shí)施例中,所述方法進(jìn)一步包括以下步驟:從所述多個(gè)截?cái)嗟腍OA系數(shù)序列和分配矢量vAMB,ASSIGN(k)重構(gòu)s51、s52截?cái)嗟腍OA表示在分析濾波器組53中將重構(gòu)的截?cái)嗟腍OA表示分解s53為多個(gè)即F個(gè)頻率子帶的頻率子帶表示其中,所述預(yù)測(cè)方向子帶信號(hào)的步驟使用所述頻率子帶表示和所述多個(gè)預(yù)測(cè)矩陣A(k+1,f1),...,A(k+1,fF)。
在實(shí)施例中,提取包括對(duì)壓縮的HOA表示進(jìn)行解復(fù)用s91以獲得感知編碼的部分和編碼的邊信息部分,感知編碼的部分包括截?cái)嗟腍OA系數(shù)序列并且編碼的邊信息部分包括有效候選方向的集合MDIR(k)、有效子帶方向的相對(duì)方向索引RelDirIndices(k,fj)、所述分配矢量vAMB,ASSIGN(k)、所述預(yù)測(cè)矩陣A(k+1,f1),...,A(k+1,fF)以及所述比特bSubBandDirIsActive(k,fj),所述比特bSubBandDirIsActive(k,fj)指示對(duì)于每個(gè)頻率子帶和每個(gè)有效候選方向,所述有效候選方向是有效子帶方向。
在實(shí)施例中,所述方法進(jìn)一步包括在感知解碼器42中對(duì)提取的截?cái)嗟腍OA系數(shù)序列進(jìn)行感知解碼s92以獲得截?cái)嗟腍OA系數(shù)序列在實(shí)施例中,所述方法進(jìn)一步包括在邊信息源解碼器43中對(duì)編碼的邊信息部分進(jìn)行解碼s93以獲得子帶相關(guān)的方向信息MDIR(k+1,f1),...,MDIR(k+1,fF)、預(yù)測(cè)矩陣A(k+1,f1),...,A(k+1,fF)、增益控制邊信息e1(k),β1(k),...,eI(k),βI(k)以及分配矢量vAMB,ASSIGN(k)。
在實(shí)施例中,提取包括提取增益控制邊信息e1(k),β1(k),...,eI(k),βI(k),增益控制邊信息在重構(gòu)s51、s52截?cái)嗟腍OA表示中被使用。
在實(shí)施例中,所述方法進(jìn)一步包括在方向子帶合成塊54中對(duì)于每個(gè)頻率子帶表示,從重構(gòu)的截?cái)嗟腍OA表示的相應(yīng)的頻率子帶表示子帶相關(guān)的方向信息MDIR(k+1,f1),...,MDIR(k+1,fF)以及預(yù)測(cè)矩陣A(k+1,f1),...,A(k+1,fF)合成s54預(yù)測(cè)的方向HOA表示在子帶組成塊55中對(duì)于所述F個(gè)頻率子帶中的每一個(gè),組成s55具有系數(shù)序列n=1,...,O的解碼的子帶HOA表示所述系數(shù)序列n=1,...,O從截?cái)嗟腍OA表示的系數(shù)序列獲得,如果系數(shù)序列具有包括在分配矢量vAMB,ASSIGN(k)中的索引n的話,否則從由方向子帶合成塊54中的一個(gè)提供的預(yù)測(cè)的方向HOA分量的系數(shù)序列獲得;以及在合成濾波器組56中合成s56解碼的子帶HOA表示以獲得解碼的HOA表示在實(shí)施例中,方向子帶信號(hào)信息包括有效方向的集合MDIR(k)以及元組集合MDIR(k+1,f1),...,MDIR(k+1,fF),該元組集合MDIR(k+1,f1),...,MDIR(k+1,fF)包括具有第一索引和第二索引的索引元組,第二索引是當(dāng)前頻率子帶的有效方向的集合MDIR(k)內(nèi)的有效方向的索引,而第一索引是有效方向的軌跡索引,其中,軌跡是特定聲源的方向的時(shí)間序列。
在一個(gè)實(shí)施例中,用于對(duì)方向信息進(jìn)行解碼的裝置包括處理器和存儲(chǔ)器,該存儲(chǔ)器存儲(chǔ)當(dāng)被執(zhí)行時(shí)使所述裝置執(zhí)行權(quán)利要求1的步驟的指令。
圖10示出了一個(gè)實(shí)施例中的編碼方法的流程圖。用于對(duì)輸入的HOA信號(hào)的幀的方向信息進(jìn)行編碼的方法100包括:從輸入的HOA信號(hào)確定s101作為聲源的方向的有效候選方向的第一集合MDIR(k),其中,有效候選方向是在Q個(gè)全局方向的預(yù)定義集合之中確定的,每個(gè)全局方向具有全局方向索引;將輸入的HOA信號(hào)劃分s102為多個(gè)頻率子帶f1,...,fF;在有效候選方向的第一集合MDIR(k)之中,對(duì)于每個(gè)頻率子帶,確定s103多達(dá)DSB個(gè)有效子帶方向的第二集合,其中,DSB<Q;將相對(duì)方向索引分配s104給每一個(gè)頻率子帶的每個(gè)方向,方向索引在范圍[1,...,NoOfGlobalDirs(k)]中;組裝s105當(dāng)前幀的方向信息;以及傳送s106組裝的方向信息。
方向信息包括:有效候選方向MDIR(k),對(duì)于每個(gè)頻率子帶和每個(gè)有效候選方向,指示該有效候選方向是否是相應(yīng)頻率子帶的有效子帶方向的比特bSubBandDirIsActive(k,fj),以及對(duì)于每個(gè)頻率子帶,子帶方向的第二集合中的有效子帶方向的相對(duì)方向索引RelDirIndices(k,fj)。
在一個(gè)實(shí)施例中,所述方法進(jìn)一步包括從輸入的HOA信號(hào)組成s107截?cái)嗟腍OA表示CT(k)和方向子帶信號(hào)的步驟,截?cái)嗟腍OA表示是其中一個(gè)或多個(gè)系數(shù)序列被設(shè)置為零的HOA信號(hào),并且其中,方向信息提供方向子帶信號(hào)所指的方向,并且其中,所述傳送進(jìn)一步包括傳送截?cái)嗟腍OA表示CT(k)以及定義方向子帶信號(hào)的信息。
在一個(gè)實(shí)施例中,定義方向子帶信號(hào)的信息包括預(yù)測(cè)矩陣A(k,f1),...,A(k,fF)。在一個(gè)實(shí)施例中,所述方法進(jìn)一步包括以下步驟:在有效候選方向的第一集合之中確定s105a使用在頻率子帶中的至少一個(gè)中的使用的候選方向的集合MFB(k)、以及使用的候選方向的集合的元素的數(shù)量NoOfGlobalDirs(k),其中,所述組裝方向信息s105的步驟中的有效候選方向是所述使用的候選方向;以及通過(guò)使用的候選方向的全局方向索引對(duì)使用的候選方向進(jìn)行編碼s105b,并且通過(guò)log2(D)個(gè)比特對(duì)所述數(shù)量的元素進(jìn)行編碼,其中,D是(全帶)候選方向的預(yù)定義的最大數(shù)量。圖10b)示出了這些后面的實(shí)施例的組合。
在一個(gè)實(shí)施例中,所述方法進(jìn)一步包括確定s104a有效子帶方向的軌跡,其中,有效子帶方向是頻率子帶的聲源的方向,并且其中,軌跡是特定聲源的方向的時(shí)間序列,并且其中,將當(dāng)前幀的當(dāng)前頻率子帶的有效子帶方向與前一個(gè)幀的同一個(gè)頻率子帶的有效子帶方向進(jìn)行比較,并且其中,確定同樣的或相鄰的有效子帶方向?qū)儆谕粋€(gè)軌跡。
在一個(gè)實(shí)施例中,分配s104給每一個(gè)子帶的每個(gè)方向的方向索引是軌跡索引,并且所述方法進(jìn)一步包括以下步驟:將軌跡索引分配s104b給每個(gè)確定的軌跡;以及對(duì)于每個(gè)頻率子帶產(chǎn)生s104c包括索引元組的元組集合MDIR(k,f1),...,MDIR(k,fF),其中,每個(gè)索引元組包括當(dāng)前頻率子帶的有效子帶方向的索引以及對(duì)于有效子帶方向確定的軌跡的軌跡索引。圖10c)示出了這些后面的實(shí)施例的組合。在一個(gè)實(shí)施例中,創(chuàng)建兩個(gè)或更多個(gè)頻率子帶的至少一個(gè)組,并且使用所述至少一個(gè)組,而不是單個(gè)頻率子帶,并且以與單個(gè)頻率子帶相同的方式對(duì)待所述至少一個(gè)組。
在一個(gè)實(shí)施例中,用于編碼的裝置包括處理器和存儲(chǔ)器,該存儲(chǔ)器存儲(chǔ)當(dāng)被執(zhí)行時(shí)使所述裝置執(zhí)行權(quán)利要求2的步驟的指令。
圖11示出了一個(gè)實(shí)施例中的用于對(duì)輸入的HOA信號(hào)的幀的方向信息進(jìn)行編碼的裝置,該裝置包括:有效候選確定模塊101,其被配置為從輸入的HOA信號(hào)確定s101作為聲源的方向的有效候選方向的第一集合MDIR(k),其中,有效候選方向是在Q個(gè)全局方向的預(yù)定義集合之中確定的,每個(gè)全局方向具有全局方向索引;分析濾波器組模塊102(具有分析濾波器組15),其被配置為將輸入的HOA信號(hào)劃分s102為多個(gè)頻率子帶f1,...,fF;子帶方向確定模塊103,其被配置為在有效候選方向的第一集合MDIR(k)之中,對(duì)于每個(gè)頻率子帶,確定s103多達(dá)DSB個(gè)有效子帶方向的第二集合,其中,DSB<Q;相對(duì)方向索引分配模塊104,其被配置為將相對(duì)方向索引分配s104給每一個(gè)頻率子帶的每個(gè)方向,方向索引在范圍[1,...,NoOfGlobalDirs(k)]中;方向信息組裝模塊105,其被配置為組裝s105當(dāng)前幀的方向信息;以及包裝模塊106,其被配置為包裝(并且存儲(chǔ)或傳送)s106組裝的方向信息。方向信息包括:有效候選方向MDIR(k),對(duì)于每個(gè)頻率子帶和每個(gè)有效候選方向,指示該有效候選方向是否是相應(yīng)頻率子帶的有效子帶方向的比特bSubBandDirIsActive(k,fj),以及對(duì)于每個(gè)頻率子帶,子帶方向的第二集合中的有效子帶方向的相對(duì)方向索引RelDirIndices(k,fj)。模塊101-106可例如通過(guò)使用可以由相應(yīng)軟件配置的一個(gè)或多個(gè)硬件處理器來(lái)實(shí)現(xiàn)。
在一個(gè)實(shí)施例中,所述裝置進(jìn)一步包括:使用的候選方向確定模塊105a,其被配置為在有效候選方向的第一集合之中確定使用在頻率子帶中的至少一個(gè)中的使用的候選方向的集合MFB(k),并且確定使用的候選方向的集合的元素的數(shù)量,其中,方向信息組裝模塊105組裝的所述方向信息中所包括的有效候選方向是使用的候選方向,以及編碼器105b,其被配置為通過(guò)使用的候選方向的全局方向索引對(duì)使用的候選方向進(jìn)行編碼,并且通過(guò)log2(D)個(gè)比特對(duì)所述數(shù)量的元素進(jìn)行編碼,其中,D是全帶候選方向(即,對(duì)于全帶來(lái)說(shuō))的預(yù)定義的最大數(shù)量。
在一個(gè)實(shí)施例中,所述裝置進(jìn)一步包括:軌跡確定模塊104a,其被配置為確定有效子帶方向的軌跡,其中,有效子帶方向是頻率子帶的聲源的方向,并且其中,軌跡是特定聲源的方向的時(shí)間序列,并且其中,一個(gè)或多個(gè)方向比較器將當(dāng)前幀的當(dāng)前頻率子帶的有效子帶方向與前一個(gè)幀的同一個(gè)頻率子帶的有效子帶方向進(jìn)行比較,并且其中,確定同樣的或相鄰的有效子帶方向?qū)儆谕粋€(gè)軌跡。
在一個(gè)實(shí)施例中,相對(duì)方向索引分配模塊104分配給每一個(gè)子帶的每個(gè)方向的方向索引是軌跡索引,并且相對(duì)方向索引分配模塊104進(jìn)一步包括:軌跡索引分配模塊104b,其被配置為將軌跡索引分配給每個(gè)確定的軌跡;以及元組集合產(chǎn)生器104c,其被配置為對(duì)于每個(gè)頻率子帶產(chǎn)生包括索引元組的元組集合MDIR(k,f1),...,MDIR(k,fF),其中,每個(gè)索引元組包括當(dāng)前頻率子帶的有效子帶方向的索引和對(duì)于有效子帶方向確定的軌跡的軌跡索引。
在一個(gè)實(shí)施例中,所述裝置進(jìn)一步包括被配置為創(chuàng)建兩個(gè)或更多個(gè)頻率子帶的至少一個(gè)組的至少一個(gè)分組模塊,其中,使用所述至少一個(gè)組,而不是單個(gè)頻率子帶,并且以與單個(gè)頻率子帶相同的方式處理所述至少一個(gè)組。
圖12示出了一個(gè)實(shí)施例中的用于對(duì)來(lái)自壓縮的HOA表示的方向信息進(jìn)行解碼以獲得HOA信號(hào)的幀的方向信息的裝置。所述裝置包括:提取模塊40,其被配置為從壓縮的HOA表示提取候選方向的集合MFB(k),其中,每個(gè)候選方向是至少一個(gè)子帶中的潛在的子帶信號(hào)源方向,對(duì)于每個(gè)頻率子帶以及多達(dá)最大DSB個(gè)潛在的子帶信號(hào)源方向中的每一個(gè),指示該潛在的子帶信號(hào)源方向是否是相應(yīng)頻率子帶的有效子帶方向的比特bSubBandDirIsActive(k,fj),和有效子帶方向的相對(duì)方向索引RelDirIndices(k,fj)以及對(duì)于每個(gè)有效子帶方向的方向子帶信號(hào)信息;轉(zhuǎn)換模塊60,其被配置為對(duì)于每個(gè)頻率子帶方向,將相對(duì)方向索引RelDirIndices(k,fj)轉(zhuǎn)換為絕對(duì)方向索引,其中,如果所述比特bSubBandDirIsActive(k,fj)指示對(duì)于相應(yīng)頻率子帶,候選方向是有效子帶方向,則每個(gè)相對(duì)方向索引被用作候選方向的集合MFB(k)內(nèi)的索引,以及預(yù)測(cè)模塊70,其被配置為從所述方向子帶信號(hào)信息預(yù)測(cè)方向子帶信號(hào),其中,方向根據(jù)所述絕對(duì)方向索引被分配給方向子帶信號(hào)。模塊40、60、70可例如通過(guò)使用可以由相應(yīng)軟件配置的一個(gè)或多個(gè)硬件處理器來(lái)實(shí)現(xiàn)。
在一個(gè)實(shí)施例中,用于對(duì)具有給定數(shù)量的系數(shù)序列(其中,每個(gè)系數(shù)序列具有索引)的輸入的HOA信號(hào)的幀進(jìn)行編碼(從而進(jìn)行壓縮)的方法包括以下步驟:確定將被包括在截?cái)嗟腍OA表示中的有效的系數(shù)序列的索引的集合IC,ACT(k),計(jì)算具有數(shù)量減少的非零系數(shù)序列(即,與輸入的HOA信號(hào)相比,較少的非零系數(shù)序列,因此較多的零系數(shù)序列)的截?cái)嗟腍OA表示CT(k);從輸入的HOA信號(hào)估計(jì)候選方向的第一集合MDIR(k),將輸入的HOA信號(hào)劃分為多個(gè)頻率子帶,其中,獲得這些頻率子帶的系數(shù)對(duì)于每個(gè)頻率子帶,估計(jì)方向的第二集合MDIR(k,f1),...,MDIR(k,fF),其中,方向的第二集合的每個(gè)元素是具有第一索引和第二索引的索引元組,第二索引是當(dāng)前頻率子帶的有效方向的索引,而第一索引是有效方向的軌跡索引,其中,每個(gè)有效方向也包括在輸入的HOA信號(hào)的候選方向的第一集合MDIR(k)中(即,方向的第二集合中的有效子帶方向是全帶方向的第一集合的子集),對(duì)于每個(gè)頻率子帶,根據(jù)相應(yīng)頻率子帶的方向的第二集合MDIR(k,f1),...,MDIR(k,fF)從頻率子帶的系數(shù)計(jì)算方向子帶信號(hào)對(duì)于每個(gè)頻率子帶,使用相應(yīng)頻率子帶的有效的系數(shù)序列的索引的集合IC,ACT(k)從頻率子帶的系數(shù)計(jì)算適于預(yù)測(cè)方向子帶信號(hào)的預(yù)測(cè)矩陣A(k,f1),...,A(k,fF),以及對(duì)候選方向的第一集合MDIR(k)、方向的第二集合MDIR(k,f1),...,MDIR(k,fF)、預(yù)測(cè)矩陣A(k,f1),...,A(k,fF)以及截?cái)嗟腍OA表示CT(k)進(jìn)行編碼。
方向的第二集合與頻率子帶相關(guān)。候選方向的第一集合與全頻帶相關(guān)。有利地,在對(duì)每個(gè)頻率子帶估計(jì)方向的第二集合的步驟中,僅需要在全帶HOA信號(hào)的方向MDIR(k)之中搜索頻率子帶的方向MDIR(k,f1),...,MDIR(k,fF),因?yàn)樽訋Х较虻牡诙鲜侨珟Х较虻牡谝患系淖蛹?。在一個(gè)實(shí)施例中,每個(gè)元組內(nèi)的第一索引和第二索引的相繼次序被交換,即,第一索引是當(dāng)前頻率子帶的有效方向的索引,而第二索引是有效方向的軌跡索引。
完整HOA信號(hào)包括多個(gè)系數(shù)序列或系數(shù)通道。其中這些系數(shù)序列中的一個(gè)或多個(gè)被設(shè)置為零的HOA信號(hào)在本文中被稱為截?cái)嗟腍OA表示。計(jì)算或產(chǎn)生截?cái)嗟腍OA表示一般包括選擇有效的、并因此將不被設(shè)置為零的系數(shù)序列,并且將無(wú)效的系數(shù)序列設(shè)置為零。該選擇可以根據(jù)各種標(biāo)準(zhǔn)(例如,通過(guò)選擇包括最大能量的那些系數(shù)序列或者感知最相關(guān)的那些系數(shù)序列作為將不被設(shè)置為零的系數(shù)序列、或者任意地選擇系數(shù)序列等等)來(lái)進(jìn)行。將HOA信號(hào)劃分為頻率子帶可以由包括例如正交鏡像濾波器(QMF)的分析濾波器組執(zhí)行。
在一個(gè)實(shí)施例中,對(duì)截?cái)嗟腍OA表示CT(k)進(jìn)行編碼包括截?cái)嗟腍OA通道序列的部分去相關(guān)、用于將(相關(guān)的或去相關(guān)的)截?cái)嗟腍OA通道序列y1(k),...,yI(k)分配給傳輸通道的通道分配、對(duì)每個(gè)傳輸通道執(zhí)行增益控制(其中,產(chǎn)生用于每個(gè)傳輸通道的增益控制邊信息ei(k-1),βi(k-1))、在感知編碼器中對(duì)增益控制的截?cái)嗟腍OA通道序列z1(k),...,zI(k)進(jìn)行編碼、在邊信息源編碼器中對(duì)增益控制邊信息ei(k-1),βi(k-1)、候選方向的第一集合MDIR(k)、方向的第二集合MDIR(k,f1),...,MDIR(k,fF)以及預(yù)測(cè)矩陣A(k,f1),...,A(k,fF)進(jìn)行編碼、以及對(duì)感知編碼器和邊信息源編碼器的輸出進(jìn)行復(fù)用以獲得編碼的HOA信號(hào)幀
此外,在一個(gè)實(shí)施例中,用于對(duì)壓縮的HOA表示進(jìn)行解碼(從而進(jìn)行解壓縮)的方法包括:從壓縮的HOA表示提取多個(gè)截?cái)嗟腍OA系數(shù)序列指示(或包含)所述截?cái)嗟腍OA系數(shù)序列的序列索引的分配矢量vAMB,ASSIGN(k)、子帶相關(guān)的方向信息MDIR(k+1,f1),...,MDIR(k+1,fF)、多個(gè)預(yù)測(cè)矩陣A(k+1,f1),...,A(k+1,fF)、以及增益控制邊信息e1(k),β1(k),...,eI(k),βI(k),從所述多個(gè)截?cái)嗟腍OA系數(shù)序列增益控制邊信息e1(k),β1(k),...,eI(k),βI(k)以及分配矢量vAMB,ASSIGN(k)重構(gòu)截?cái)嗟腍OA表示在分析濾波器組中將重構(gòu)的截?cái)嗟腍OA表示分解為多個(gè)即F個(gè)頻率子帶的頻率子帶表示在方向子帶合成塊中對(duì)于每個(gè)頻率子帶表示,從重構(gòu)的截?cái)嗟腍OA表示的相應(yīng)的頻率子帶表示子帶相關(guān)的方向信息MDIR(k+1,f1),...,MDIR(k+1,fF)以及預(yù)測(cè)矩陣A(k+1,f1),...,A(k+1,fF)合成預(yù)測(cè)的方向HOA表示在子帶組成塊中對(duì)于所述F個(gè)頻率子帶中的每一個(gè),組成具有系數(shù)序列n=1,...,O的解碼的子帶HOA表示所述系數(shù)序列n=1,...,O從截?cái)嗟腍OA表示的系數(shù)序列獲得,如果系數(shù)序列具有被包括在分配矢量vAMB,ASSIGN(k)中(即,分配矢量vAMB,ASSIGN(k)的元素)的索引n的話,否則從由方向子帶合成塊中的一個(gè)提供的預(yù)測(cè)的方向HOA分量的系數(shù)序列獲得;以及在合成濾波器組中合成解碼的子帶HOA表示以獲得解碼的HOA表示在一個(gè)實(shí)施例中,提取包括對(duì)壓縮的HOA表示進(jìn)行解復(fù)用以獲得感知編碼的部分和編碼的邊信息部分。在一個(gè)實(shí)施例中,感知編碼的部分包括感知編碼的截?cái)嗟腍OA系數(shù)序列并且提取包括在感知解碼器中對(duì)感知編碼的截?cái)嗟腍OA系數(shù)序列進(jìn)行解碼以獲得截?cái)嗟腍OA系數(shù)序列在一個(gè)實(shí)施例中,提取包括在邊信息源解碼器中對(duì)編碼的邊信息部分進(jìn)行解碼以獲得子帶相關(guān)的方向的集合MDIR(k+1,f1),...,MDIR(k+1,fF)、預(yù)測(cè)矩陣A(k+1,f1),...,A(k+1,fF)、增益控制邊信息e1(k),β1(k),...,eI(k),βI(k)以及分配矢量vAMB,ASSIGN(k)。
在一個(gè)實(shí)施例中,用于對(duì)HOA信號(hào)進(jìn)行解碼的裝置包括:提取模塊,其被配置為從壓縮的HOA表示提取多個(gè)截?cái)嗟腍OA系數(shù)序列指示或包含所述截?cái)嗟腍OA系數(shù)序列的序列索引的分配矢量vAMB,ASSIGN(k)、子帶相關(guān)的方向信息MDIR(k+1,f1),...,MDIR(k+1,fF)、多個(gè)預(yù)測(cè)矩陣A(k+1,f1),...,A(k+1,fF)以及增益控制邊信息e1(k),β1(k),...,eI(k),βI(k);重構(gòu)模塊,其被配置為從所述多個(gè)截?cái)嗟腍OA系數(shù)序列增益控制邊信息e1(k),β1(k),...,eI(k),βI(k)以及分配矢量vAMB,ASSIGN(k)重構(gòu)截?cái)嗟腍OA表示分析濾波器組模塊53,其被配置為將重構(gòu)的截?cái)嗟腍OA表示分解為多個(gè)即F個(gè)頻率子帶的頻率子帶表示至少一個(gè)方向子帶合成模塊54,其被配置為對(duì)于每個(gè)頻率子帶表示,從重構(gòu)的截?cái)嗟腍OA表示的相應(yīng)的頻率子帶表示子帶相關(guān)的方向信息MDIR(k+1,f1),...,MDIR(k+1,fF)以及預(yù)測(cè)矩陣A(k+1,f1),...,A(k+1,fF)合成預(yù)測(cè)的方向HOA表示至少一個(gè)子帶組成模塊55,其被配置為對(duì)于所述F個(gè)頻率子帶中的每一個(gè),組成具有系數(shù)序列n=1,...,的解碼的子帶HOA表示所述系數(shù)序列n=1,...,O從截?cái)嗟腍OA表示的系數(shù)序列獲得,如果系數(shù)序列具有被包括在分配矢量vAMB,ASSIGN(k)中的索引n的話,否則從由方向子帶合成模塊54中的一個(gè)提供的預(yù)測(cè)的方向HOA分量的系數(shù)序列獲得;以及合成濾波器組模塊56,其被配置為合成解碼的子帶HOA表示以獲得解碼的HOA表示
子帶一般是從復(fù)值濾波器組獲得的。分配矢量的一個(gè)目的是指示傳送/接收的、并因此包含在截?cái)嗟腍OA表示中的系數(shù)序列的序列索引,以便使得能夠?qū)⑦@些系數(shù)序列分配給最終的HOA信號(hào)。換句話說(shuō),分配矢量對(duì)于截?cái)嗟腍OA表示的每個(gè)系數(shù)序列指示它對(duì)應(yīng)于最終的HOA信號(hào)中的哪個(gè)系數(shù)序列。例如,如果截?cái)嗟腍OA表示包含四個(gè)系數(shù)序列并且最終的HOA信號(hào)具有九個(gè)系數(shù)序列,則分配矢量可以是[1,2,5,7](原則上),從而指示截?cái)嗟腍OA表示的第一、第二、第三和第四系數(shù)序列實(shí)際上是最終的HOA信號(hào)中的第一、第二、第五和第七系數(shù)序列。
在一個(gè)實(shí)施例中,被配置為預(yù)測(cè)當(dāng)前幀中的方向子帶信號(hào)的預(yù)測(cè)模塊被進(jìn)一步配置為:確定前一個(gè)幀的子帶的方向子帶信號(hào),如果方向子帶信號(hào)的索引在前一個(gè)幀中為零、而在當(dāng)前幀中為非零,則創(chuàng)建新的方向子帶信號(hào),如果方向信號(hào)的索引在前一個(gè)幀中為非零、而在當(dāng)前幀中為零,則取消前一方向子帶信號(hào),并且如果方向子帶信號(hào)的索引從第一方向變?yōu)榈诙较颍瑒t將方向子帶信號(hào)的方向從第一方向移動(dòng)到第二方向。在一個(gè)實(shí)施例中,至少一個(gè)子帶是兩個(gè)或更多個(gè)頻率子帶的子帶組。在一個(gè)實(shí)施例中,方向子帶信號(hào)信息至少包括多個(gè)截?cái)嗟腍OA系數(shù)序列、指示或包含所述截?cái)嗟腍OA系數(shù)序列的序列索引的分配矢量以及多個(gè)預(yù)測(cè)矩陣,并且所述裝置進(jìn)一步包括:截?cái)嗟腍OA表示重構(gòu)模塊,其被配置為從所述多個(gè)截?cái)嗟腍OA系數(shù)序列和分配矢量重構(gòu)截?cái)嗟腍OA表示,以及一個(gè)或多個(gè)分析濾波器組,其被配置為將重構(gòu)的截?cái)嗟腍OA表示分解為多個(gè)即F個(gè)頻率子帶的頻率子帶表示,其中,預(yù)測(cè)模塊使用所述頻率子帶表示和所述多個(gè)預(yù)測(cè)矩陣來(lái)對(duì)方向子帶信號(hào)進(jìn)行所述預(yù)測(cè)。在一個(gè)實(shí)施例中,提取模塊被進(jìn)一步配置為對(duì)壓縮的HOA表示進(jìn)行解復(fù)用以獲得感知編碼的部分和編碼的邊信息部分,其中,感知編碼的部分包括截?cái)嗟腍OA系數(shù)序列,并且其中,編碼的邊信息部分包括有效候選方向的集合MDIR(k)、有效子帶方向的相對(duì)方向索引、所述分配矢量、所述預(yù)測(cè)矩陣以及所述比特,所述比特指示對(duì)于每個(gè)頻率子帶和每個(gè)有效候選方向,所述有效候選方向是有效子帶方向。在一個(gè)實(shí)施例中,方向子帶信號(hào)信息包括有效方向的集合和元組集合,該元組集合包括具有第一索引和第二索引的索引元組,第二索引是當(dāng)前頻率子帶的有效方向的集合內(nèi)的有效方向的索引,而第一索引是有效方向的軌跡索引,其中,軌跡是特定聲源的方向的時(shí)間序列。
在一個(gè)實(shí)施例中,計(jì)算機(jī)可讀介質(zhì)具有存儲(chǔ)在其上的可執(zhí)行指令,這些可執(zhí)行指令當(dāng)在計(jì)算機(jī)上執(zhí)行時(shí)使計(jì)算機(jī)執(zhí)行用于對(duì)輸入的HOA信號(hào)的幀的方向信息進(jìn)行編碼的方法,該方法包括:從輸入的HOA信號(hào)確定作為聲源的方向的有效候選方向的第一集合MDIR(k),其中,有效候選方向是在Q個(gè)全局方向的預(yù)定義集合之中確定的,每個(gè)全局方向具有全局方向索引,將輸入的HOA信號(hào)劃分為多個(gè)頻率子帶,在有效候選方向的第一集合MDIR(k)之中,對(duì)于每個(gè)頻率子帶,確定多達(dá)DSB個(gè)有效子帶方向的第二集合,其中,DSB<Q,將相對(duì)方向索引分配給每一個(gè)頻率子帶的每個(gè)方向,方向索引在范圍[1,...,NoOfGlobalDirs(k)]中,組裝當(dāng)前幀的方向信息,該方向信息包括:有效候選方向MDIR(k),對(duì)于每個(gè)頻率子帶和每個(gè)有效候選方向,指示該有效候選方向是否是相應(yīng)頻率子帶的有效子帶方向的比特,以及對(duì)于每個(gè)頻率子帶,子帶方向的第二集合中的有效子帶方向的相對(duì)方向索引,以及傳送組裝的方向信息。進(jìn)一步的實(shí)施例可以類似于以上公開(kāi)的編碼方法導(dǎo)出。
在一個(gè)實(shí)施例中,計(jì)算機(jī)可讀介質(zhì)具有存儲(chǔ)在其上的可執(zhí)行指令,這些可執(zhí)行指令當(dāng)在計(jì)算機(jī)上執(zhí)行時(shí)使計(jì)算機(jī)執(zhí)行用于對(duì)來(lái)自壓縮的HOA表示的方向信息進(jìn)行解碼的方法,該方法包括對(duì)于壓縮的HOA表示的每個(gè)幀:
從壓縮的HOA表示提取候選方向的集合MFB(k)(其中,每個(gè)候選方向是至少一個(gè)子帶中的潛在的子帶信號(hào)源方向),對(duì)于每個(gè)頻率子帶以及多達(dá)DSB個(gè)潛在的子帶信號(hào)源方向中的每一個(gè),指示該潛在的子帶信號(hào)源方向是否是相應(yīng)頻率子帶的有效子帶方向的比特bSubBandDirIsActive(k,fj),和有效子帶方向的相對(duì)方向索引以及對(duì)于每個(gè)有效子帶方向的方向子帶信號(hào)信息,對(duì)于每個(gè)頻率子帶方向,將相對(duì)方向索引轉(zhuǎn)換為絕對(duì)方向索引,其中,如果所述比特指示對(duì)于相應(yīng)頻率子帶,候選方向是有效子帶方向,則每個(gè)相對(duì)方向索引被用作候選方向的集合MFB(k)內(nèi)的索引,以及從所述方向子帶信號(hào)信息預(yù)測(cè)方向子帶信號(hào),其中,方向根據(jù)所述絕對(duì)方向索引分配給方向子帶信號(hào)。進(jìn)一步的實(shí)施例可以類似于以上公開(kāi)的解碼方法導(dǎo)出。
盡管已經(jīng)示出、描述并指出了本發(fā)明的應(yīng)用于其優(yōu)選實(shí)施例時(shí)的基本的新穎特征,但是將理解,在不背離本發(fā)明的精神的情況下,所描述的裝置和方法中的在所公開(kāi)的設(shè)備的形式和細(xì)節(jié)上的以及在它們的操作上的各種省略、替換和改變可以由本領(lǐng)域技術(shù)人員做出。明確的意圖是以實(shí)現(xiàn)相同結(jié)果的基本上相同的方式執(zhí)行基本上相同的功能的那些元件的所有組合在本發(fā)明的范圍內(nèi)。從一個(gè)所描述的實(shí)施例到另一個(gè)所描述的實(shí)施例的元件替換也被充分預(yù)期和構(gòu)想。將理解,已純粹以示例的方式描述了本發(fā)明,在不背離本發(fā)明的范圍的情況下,可以進(jìn)行細(xì)節(jié)的修改。在說(shuō)明書和(在適當(dāng)情況下)權(quán)利要求以及附圖中公開(kāi)的每個(gè)特征可以獨(dú)立地或者以任何適當(dāng)?shù)慕M合提供。在適當(dāng)?shù)那闆r下,特征可以以硬件、軟件或這二者的組合來(lái)實(shí)現(xiàn)。在適用的情況下,連接可以實(shí)現(xiàn)為無(wú)線連接或有線的、但不一定是直接的或?qū)S玫倪B接。在一個(gè)實(shí)施例中,以上提及的模塊或單元(諸如提取模塊、增益控制單元、子帶信號(hào)分組單元、處理單元及其它)中的每一個(gè)至少部分通過(guò)使用至少一個(gè)硅組件來(lái)以硬件實(shí)現(xiàn)。
參考文獻(xiàn)
[1]Daniel.Représentation de champs acoustiques,applicationàla transmission etàla reproduction de scènes sonores complexes dans un contexte multimédia.PhD thesis,UniversitéParis 6,2001年.
[2]Fliege和Ulrike Maier.A two-stage approach for computing cubature formulae for the sphere.Technical report,Fachbereich Mathematik,Dortmund,1999年.節(jié)點(diǎn)號(hào)在http://www.mathematik.uni-dortmund.de/lsx/research/projects/fliege/nodes/nodes.html上找到.
[3]Sven Kordon和Alexander Krueger.Adaptive value range control for HOA signals.專利申請(qǐng)(Technicolor內(nèi)部參考:PD130016),2013年7月.
[4]Alexander Krueger和Sven Kordon.Intelligent signal extraction and packing for compression of HOA sound field representations.專利申請(qǐng)EP 13305558.2(Technicolor內(nèi)部參考:PD130015),2013年4月29日提交.
[5]A.Krueger、S.Kordon和J.Boehm.HOA compression by decomposition into directional and ambient components.公開(kāi)的專利申請(qǐng)EP2743922(Technicolor內(nèi)部參考:PD120055),2012年12月.
[6]Alexander Krüger、Sven Kordon、Johannes Boehm和Jan-Mark Batke.Method and apparatus for compressing and decompressing a higher order ambisonics signal representation.公開(kāi)的專利申請(qǐng)EP2665208(Technicolor內(nèi)部參考:PD120015),2012年5月.
[7]Alexander Krüger.Method and apparatus for robust sound source direction tracking based on Higher Order Ambisonics.公開(kāi)的專利申請(qǐng)EP2738962(Technicolor內(nèi)部參考:PD120049),2012年12月.
[8]Daniel D.Lee和H.Sebastian Seung.Learning the parts of objects by nonnegative matrix factorization.Nature,401:788–791,1999年.
[9]ISO/IEC JTC 1/SC 29 N.Text of ISO/IEC 23008-3/CD,MPEG-H 3d audio,2014年4月.
[10]Boaz Rafaely.Plane-wave decomposition of the sound field on a sphere by spherical convolution.J.Acoust.Soc.Am.,4(116):2149–2157,2004年10月.
[11]Earl G.Williams.Fourier Acoustics,volume 93 of Applied Mathematical Sciences.Academic Press,1999年.