本申請是申請?zhí)枮?01380016236.8、申請日為2013年3月20日、發(fā)明名稱為“從高階立體混響聲音頻信號解碼立體聲揚聲器信號的方法和裝置”的發(fā)明專利申請的分案申請。
本發(fā)明涉及一種用于使用用于采樣圓上的點的平移函數(shù)從高階立體混響聲(ambisonics)音頻信號解碼立體聲揚聲器信號的方法和裝置。
背景技術(shù):
立體聲揚聲器或耳機(jī)設(shè)置的立體混響聲表示的解碼被稱為一階立體混響聲,例如根據(jù)可以從xiphwiki-ambisonicshttp://wiki.xiph.org/index.php/ambisonics#default_channel_conversions_from_b-format獲得的j.s.bamford、j.vender-kooy的《ambisonicsoundforus》(audioengineeringsocietypreprints,conventionpaper4138presentedatthe99thconvention,1995年10月,紐約)中的等式(10)。這些方式基于在英國專利394325中公開的blumlein立體聲。另一方式使用模式匹配:m.a.poletti的《three-dimensionalsurroundsoundsystemsbasedonsphericalharmonics》(j.audioeng.soc.,卷53(11),第1004-1025頁,2005年11月)。
技術(shù)實現(xiàn)要素:
這種一階立體混響聲方式要么具有與基于具有八圖案(figure-of-eightpatterns)的虛擬揚聲器的blumlein立體聲(gb394325)的立體混響聲解碼器一樣的高負(fù)旁瓣(參見s.weinzierl的《handbuchderaudiotechnik》(springer,柏林,2008年)中的第3.3.4.1節(jié)),要么具有前方向上的較差定位。例如,使用負(fù)旁瓣,來自右后方向上的聲音對象在左立體聲揚聲器上再現(xiàn)。
本發(fā)明要解決的一個問題是提供使用改進(jìn)的立體聲信號輸出解碼的立體混響聲信號。該問題通過權(quán)利要求1和2中公開的方法解決。在權(quán)利要求3中公開利用這些方法的裝置。
本發(fā)明描述用于更高階立體混響聲hoa音頻信號的立體聲解碼器的處理。期望平移函數(shù)可以從揚聲器之間的虛擬源的位移的平移定律而推導(dǎo)。對于每一個揚聲器,定義全部可能的輸入方向的期望平移函數(shù)。類似于j.m.batke、f.keiler的《usingvbap-derivedpanningfunctionsfor3dambisonicsdecoding》(proc.ofthe2ndinternationalsymposiumonambisonicsandsphericalacoustics,2010年5月6-7日,巴黎,法國,urlhttp://ambisonics10.ircam.fr/drupal/files/proceedings/presentations/o14_47.pdf)和wo2011/117399a1的對應(yīng)描述而計算立體混響聲解碼矩陣。平移函數(shù)通過圓形諧波函數(shù)近似,并且隨著立體混響聲階增大,以減小的誤差匹配期望平移函數(shù)。具體地,對于在揚聲器之間的前面區(qū)域,可以使用如正切定律或向量基幅度平移(vbap)的平移定律。對于超過揚聲器位置的向后方向,使用具有來自這些方向的聲音的輕微衰減的平移函數(shù)。
特殊情況是使用指向后方向的揚聲器方向的心形圖案的一半。
在本發(fā)明中,尤其在前面區(qū)域中利用更高階立體混響聲的更高空間分辨率,并且后方向中的負(fù)旁瓣的衰減隨著立體混響聲階增大而增大。本發(fā)明還可以用于具有多于兩個被放置在半圓上的或小于半圓的圓的分段上的揚聲器的揚聲器設(shè)置。其還便于其中一些空間區(qū)域接收更多衰減的立體聲的更藝術(shù)的縮混。這有益于創(chuàng)建使得對話能夠更清晰易懂的改進(jìn)的直接聲音與漫音比(direct-sound-to-diffuse-soundratio)。
根據(jù)本發(fā)明的立體聲解碼器滿足一些重要屬性:在揚聲器之間的前方向上的良好定位,在得到的平移函數(shù)中僅存在較小負(fù)旁瓣,以及后方向的輕微衰減。其還使能當(dāng)聆聽雙通道版本時可能在其他情況下被視為干擾或令人分心的空間區(qū)域的衰減或屏蔽。
與wo2011/117399a1相比,逐個圓形分段地定義期望平移函數(shù),并且在揚聲器位置之間的前面區(qū)域,可以使用公知的平移處理(例如,vbap或正切定律),同時后方向可以輕微衰減。當(dāng)使用一階立體混響聲解碼器時這種屬性是不可行的。
原則上,本發(fā)明方法適用于從更高階立體混響聲音頻信號a(t)解碼立體聲揚聲器信號l(t),所述方法包括下列步驟:
-從左和右揚聲器的方位角值和從圓上的虛擬采樣點的數(shù)目s計算包含全部虛擬采樣點的期望平移函數(shù)的矩陣g,
其中
-確定所述立體混響聲音頻信號a(t)的階n;
-從所述數(shù)目s和從所述階n計算模式矩陣ξ和所述模式矩陣ξ的對應(yīng)偽逆ξ+,其中ξ=[y*(φ1),y*(φ2),...,y*(φs)]和
-從所述矩陣g和ξ+計算解碼矩陣d=gξ+;
-計算揚聲器信號l(t)=da(t)。
原則上,本發(fā)明方法適用于確定可以用于從2d更高階立體混響聲音頻信號a(t)解碼立體聲揚聲器信號l(t)=da(t)的解碼矩陣d,所述方法包括下列步驟:
-接收所述立體混響聲音頻信號a(t)的階n;
-從左和右揚聲器的期望方位角值(φl,φr)和從圓上的虛擬采樣點的數(shù)目s計算包含全部虛擬采樣點的期望平移函數(shù)的矩陣g,
其中
-從所述數(shù)目s和從所述階n計算模式矩陣ξ和所述模式矩陣ξ的對應(yīng)偽逆ξ+,其中ξ=[y*(φ1),y*(φ2),...,y*(φs)]和
-從所述矩陣g和ξ+計算解碼矩陣d=gξ+;
原則上,本發(fā)明裝置適用于從更高階立體混響聲音頻信號a(t)解碼立體聲揚聲器信號l(t),所述裝置包括:
-被適配用于從左和右揚聲器的方位角值和從圓上的虛擬采樣點的數(shù)目s計算包含全部虛擬采樣點的期望平移函數(shù)的矩陣g的部件,
其中
-被適配用于確定所述立體混響聲音頻信號a(t)的階n的部件;
-被適配用于從所述數(shù)目s和從所述階n計算模式矩陣ξ和所述模式矩陣ξ的對應(yīng)偽逆ξ+的部件,其中ξ=[y*(φ1),y*(φ2),...,y*(φs)]和
-被適配用于從所述矩陣g和ξ+計算解碼矩陣d=gξ+的部件;
-被適配用于計算揚聲器信號l(t)=da(t)的部件。
在相應(yīng)的從屬權(quán)利要求中公開本發(fā)明的有利的更多的實施例。
附圖說明
參考附圖描述本發(fā)明的示例實施例,其示出:
圖1是期望平移函數(shù),揚聲器位置φl=30°,φr=-30°;
圖2是作為極坐標(biāo)圖的期望平移函數(shù),揚聲器位置φl=30°,φr=-30°;
圖3是n=4得到的平移函數(shù),揚聲器位置φl=30°,φr=-30°;
圖4是作為極坐標(biāo)圖的n=4得到的期望平移函數(shù),揚聲器位置φl=30°,φr=-30°;
圖5是根據(jù)本發(fā)明的處理的框圖。
具體實施方式
在解碼處理的第一步驟中,必須定義揚聲器的位置。揚聲器被假設(shè)為具有離聆聽位置相同的距離,借此揚聲器位置由它們的方位角定義。方位由φ表示并且逆時針地測量。左和右揚聲器的方位角為φl和φr,并且在對稱設(shè)置中φr=-φl。在下列描述中,全部角度值可以使用2π(弧度)或360°的整數(shù)倍的偏移解釋。
要定義圓上的虛擬采樣點。這些是在立體混響聲解碼處理中使用的虛擬源方向,并且對于這些方向,定義例如兩個真實揚聲器位置的期望平移函數(shù)值。虛擬采樣點的數(shù)目由s表示,并且對應(yīng)的方向圍繞圓均勻分布,使得
s應(yīng)大于2n+1,其中n表示立體混響聲階。實驗示出有利的值為s=8n。
必須定義左和右揚聲器的期望平移函數(shù)gl(φ)和gr(φ)。與來自wo2011/117399a1和上述batke/keiler的文章的方式相比,對于多個分段定義平移函數(shù),其中對于多個分段使用不同的平移函數(shù)。例如,對于期望平移函數(shù),使用三個分段:
a)對于兩個揚聲器之間的前方向,使用公知的平移定律,例如正切定律或等價地如在v.pulkki的《virtualsoundsourcepositioningusingvectorbaseamplitudepanning》(j.audioeng.society,45(6),第456–466頁,1997年6月)中描述的向量基幅度平移(vbap)。
b)對于超過揚聲器圓部分位置的方向,定義后方向的輕微衰減,借此平移函數(shù)的該部分在大約與揚聲器位置相對的角度處逼近值零。
c)期望平移函數(shù)的剩余部分被設(shè)置為0,以便避免來自左揚聲器上的右邊的聲音和來自右揚聲器上的左邊的聲音的再現(xiàn)。
其中對于左揚聲器由φl,0并且對于右揚聲器由φr,0定義其中期望平移函數(shù)達(dá)到0的點和角度值。對于左和右揚聲器,期望平移函數(shù)可以被表示為:
平移函數(shù)gl,1(φ)和gr,1(φ)定義揚聲器位置之間的平移定律,而平移函數(shù)gl,2(φ)和gr,2(φ)通常定義向后方向的衰減。在交叉點處,應(yīng)滿足下列屬性:
gl,2(φl)=gl,1(φl)(4)
gl,2(φl,0)=0(5)
gr,2(φr)=gr,1(φr)(6)
gr,2(φr,0)=0(7)
期望平移函數(shù)在虛擬采樣點處采樣。包含全部虛擬采樣點的期望平移函數(shù)值的矩陣定義如下:
實數(shù)值或復(fù)數(shù)值立體混響聲圓形諧波函數(shù)為ym(φ),其中m=-n,…,n,其中n為上述立體混響聲階。由球形諧波的方位相關(guān)部分表示圓形諧波,參見earlg.williams的《fourieracoustics》(appliedmathematicalsciences的卷93,academicpress,1999年)。
使用實數(shù)值圓形諧波
圓形諧波函數(shù)通常定義如下
其中
圓形諧波被組合在如下向量中組合
y(φ)=[y-n(φ),y0(φ),...,yn(φ)]t(11)
由(·)*表示的復(fù)數(shù)共軛,得到
虛擬采樣點的模式矩陣定義如下
ξ=[y*(φ1),y*(φ2),...,y*(φs)](13)
得到的2d解碼矩陣計算如下
d=gξ+(14)
其中ξ+為矩陣ξ的偽逆。對于如在等式(1)中給出的均勻分布虛擬采樣點,可以由作為ξ的伴隨矩陣(轉(zhuǎn)置和復(fù)數(shù)共軛)的ξh的縮放版本替換偽逆。在該情況下,解碼矩陣為
d=αgξh(15)
其中縮放系數(shù)α取決于圓形諧波的歸一化方案和設(shè)計方向的數(shù)目s。
表示時間實例t的揚聲器采樣信號的向量l(t)計算如下
l(t)=da(t)(16)
當(dāng)使用3維更高階立體混響聲信號a(t)作為輸入信號時,應(yīng)用對2維空間的適當(dāng)轉(zhuǎn)換,得到轉(zhuǎn)換后的立體混響聲系數(shù)a’(t)。在該情況下,等式(16)被改變?yōu)閘(t)=da(t)。
還可以定義矩陣d3d,其已經(jīng)包括3d/2d轉(zhuǎn)換并且被直接應(yīng)用于3d立體混響聲信號a(t)。
在下文中,描述立體聲揚聲器設(shè)置的平移函數(shù)的示例。在揚聲器位置之間,使用根據(jù)等式(2)和等式(3)的平移函數(shù)gl,1(φ)和gr,1(φ)以及根據(jù)vbap的平移增益。這些平移函數(shù)通過其最大值在揚聲器處的心形圖案的一半繼續(xù)。定義角度φl,0和φr,0,以便具有相對于揚聲器位置的位置:
φl,0=φl+π(17)
φr,0=φr+π(18)
歸一化平移增益滿足gl,1(φl)=1和gr,1(φr)=1。指向φl和φr的心形圖案定義如下:
對于解碼的評估,得到的任意輸入方向的平移函數(shù)可以如下獲得
w=dγ(21)
其中γ為考慮的輸入方向的模式矩陣。w為包含當(dāng)應(yīng)用立體混響聲解碼處理時使用的輸入方向和使用的揚聲器位置的平移加權(quán)的矩陣。
圖1和圖2分別描繪期望(即理論或完美)平移函數(shù)增益對線性角度刻度以及以極坐標(biāo)圖格式的增益。對于使用的輸入方向,使用等式(21)計算得到的立體混響聲解碼的平移加權(quán)。圖3和圖4分別示出對于立體混響聲階n=4計算的對應(yīng)的得到的平移函數(shù)對線性角度刻度以及以極坐標(biāo)圖格式的增益。
圖3/4與圖1/2的對比示出期望平移函數(shù)匹配良好并且得到的負(fù)旁瓣非常小。
在下文中,對于復(fù)數(shù)值球形和圓形諧波提供3d到2d轉(zhuǎn)換的示例(對于實數(shù)值基礎(chǔ)函數(shù),其可以以類似方式進(jìn)行)。3d立體混響聲的球形諧波為:
其中n=0,…,n為階索引,m=-n,…,n為度數(shù)索引,mn,m為取決于歸一化方案的歸一化因子,θ為傾角,并且
其中縮放因子
圖5中,用于計算期望平移函數(shù)的步驟或階段51接收左和右揚聲器的方位角φl和φr的值以及虛擬采樣點的數(shù)目s,并且如上所述從其計算包含全部虛擬采樣點的期望平移函數(shù)值的矩陣g。在步驟/階段52中從立體混響聲信號a(t)推導(dǎo)階n。在步驟/階段53中基于等式11到13從s和n計算模式矩陣ξ。
步驟或階段54計算矩陣ξ的偽逆ξ+。在步驟/階段55中根據(jù)等式15從矩陣g和ξ+計算解碼矩陣d。在步驟/階段56中,使用解碼矩陣d從立體混響聲信號a(t)計算揚聲器信號l(t)。在立體混響聲輸入信號a(t)為三維空間信號的情況下,可以在步驟或階段57中進(jìn)行3d到2d轉(zhuǎn)換,并且步驟/階段56接收2d立體混響聲信號a’(t)。