本發(fā)明屬于虛擬聲重放技術(shù)領(lǐng)域,本發(fā)明提出了一種新的ambisonics解碼方法匹配投影法,解決了ambisonics聲重放系統(tǒng)對揚聲器擺放位置固定的要求。
背景技術(shù):
3d多媒體的時代已經(jīng)到來,3d音視頻系統(tǒng)也正迅速走向電影院,家庭影院,及手持終端設(shè)備,成為全球各大電子制造商的新焦點。環(huán)繞聲重放技術(shù)在3d音視頻系統(tǒng)占有重要的地位,目前主流的技術(shù)包括vbap(vectorbaseamplitudepanning)、ambisonics,wfs(wavefieldsynthetize)。其中ambisonics方法是1973年由牛津大學(xué)的michaelgerzon提出的,主要是通過基于球諧函數(shù)對原始聲場的分解與重建來控制虛擬聲源的方位。
基于ambisonics聲重放系統(tǒng)技術(shù)特點是編解碼分離,在編碼階段,根據(jù)虛擬聲源的方向得到各球諧基函數(shù)的投影值;在聲場重放階段,根據(jù)重發(fā)揚聲器的數(shù)量、方位和編碼環(huán)節(jié)得到的投影值,得到不同通道信號的輸出增益,把此增益輸送給對應(yīng)的揚聲器重發(fā),達到在揚聲器陣列中心位置處重建源聲場的目的。
盡管ambisonics方法編解碼分離的方案給3d聲音錄音和重放帶來了很大的優(yōu)勢,但在走向市場的道路中卻遇到困難,原因之一,ambisonics階數(shù)確定,揚聲器數(shù)量和擺放位置不靈活。本發(fā)明提出一種應(yīng)用于ambisonics聲重放系統(tǒng)的解碼方法,解決揚聲器擺放相對固定的情況。
技術(shù)實現(xiàn)要素:
針對現(xiàn)有技術(shù)中存在的技術(shù)問題,本發(fā)明的目的在于提供一種面向不規(guī)則揚聲器擺放的ambisonics匹配投影解碼方法。
本發(fā)明的具體思想是根據(jù)聲源位置得出球諧函數(shù)分量
本發(fā)明的技術(shù)方案為:
一種面向不規(guī)則揚聲器擺放的ambisonics匹配投影解碼方法,其步驟為:
1)根據(jù)聲源位置得到該聲源的球諧信號;根據(jù)揚聲器擺放位置得到揚聲器的球諧信號;
2)將聲源的球諧信號和揚聲器的球諧信號匹配投影,得到各揚聲器的增益。
進一步的,根據(jù)各揚聲器球諧信號與聲源球諧信號的相關(guān)系數(shù),選出最匹配的揚聲器;然后將聲源的球諧信號減去當(dāng)前最匹配的揚聲器的球諧信號,解出殘差信號;然后將該殘差信號賦值給聲源的球諧信號;然后在剩余揚聲器中繼續(xù)挑選最匹配的揚聲器并求解其增益,直至所有揚聲器的增益均被匹配完畢,解碼完成。
進一步的,根據(jù)公式
進一步的,根據(jù)聲源位置得到該聲源的球諧信號的方法為:首先建立聲源傳播的振幅為s的平面波傳播到內(nèi)部沒有聲源的有限空間的波動方程為
進一步的,根據(jù)揚聲器擺放位置得到揚聲器的球諧信號的方法為:首先建立揚聲器傳播的振幅為s的平面波傳播到內(nèi)部沒有聲源的有限空間的波動方程為
進一步的,將當(dāng)前與聲源球諧函數(shù)相關(guān)系數(shù)最大的揚聲器作為最匹配的揚聲器。
進一步的,各所述揚聲器為規(guī)則擺放。
進一步的,各所述揚聲器為不規(guī)則擺放。
與現(xiàn)有技術(shù)相比,本發(fā)明的積極效果為:
現(xiàn)有技術(shù)一般采用矩陣求逆方法進行解碼,當(dāng)揚聲器擺放不規(guī)則時,現(xiàn)有技術(shù)重構(gòu)出的聲場不穩(wěn)定,而本發(fā)明在揚聲器擺放不規(guī)則時,重構(gòu)聲場穩(wěn)定,具體效果對比數(shù)據(jù)如表1所示。
附圖說明
圖1為空間坐標(biāo)系;
圖2為發(fā)明流程框圖;
圖3為匹配投影解碼方法
圖4為高度角0度時各水平角指向圖;
(a)水平角0度,(b)水平角60度,(c)水平角120度,
(d)水平角180度,(e)水平角240度,(f)水平角300度;
圖5為高度角20度時各水平角指向圖;
(a)水平角0度,(b)水平角60度,(c)水平角120度,
(d)水平角180度,(e)水平角240度,(f)水平角300度;
圖6為被試1主觀測試結(jié)果圖;
(a)仰角0度,(b)仰角20度;
圖7為被試2主觀測試結(jié)果圖;
(a)仰角0度,(b)仰角20度。
具體實施方式
下面結(jié)合附圖對本發(fā)明進行進一步詳細(xì)描述。
圖2為發(fā)明流程圖分為三個步驟
1.已知聲源擺放位置
2.已知揚聲器擺放位置
3.將聲源的球諧函數(shù)分量y和各揚聲器球諧函數(shù)分量
步驟1:虛擬聲源的ambisonics編碼
聲源在(x0,y0,z0)處即三維空間中任意一點的波動方程為:
其中
式中n代表展開式的階數(shù),m代表展開式的次數(shù),jm(kr)為一類球貝塞爾函數(shù);球諧函數(shù)分量
nmn-斯密特半正則化系數(shù)
式中δ0,n——delta函數(shù),當(dāng)n=0時,δ0,0=1
虛擬聲源在
假設(shè)聲源傳播的是平面波,根據(jù)平面聲波可以在球坐標(biāo)系中用球諧函數(shù)無限展開的原理,振幅為s的平面波傳播到內(nèi)部沒有聲源的有限空間∩的波動方程可以寫成:
由式(2)與(6)可得
在一維情況下,下列方程展示了處于相位角為θ的聲源發(fā)出的信號s的編碼規(guī)則:
前三行定義了水平面上的一階聲場編碼,由三個成分組成:w,x,y,即為水平面的一階貝塞爾公式。階數(shù)每增加一階,都會有更多的高階立體聲(hoa)編碼方程以及相關(guān)的貝塞爾系數(shù)。由于聲源彼此之間的距離較近,而一階編碼對于相位的分辨率較低,這就導(dǎo)致了編碼的精確度不夠的問題。通過引進高階立體聲編碼方程,使分辨率更高的編碼成為可能。
步驟2:揚聲器的ambisonics編碼
假設(shè)揚聲器發(fā)出的波也為平面波,
由式(2)與(7)可得
步驟3:利用匹配投影法求解揚聲器增益
匹配投影解碼法的具體做法見圖3,首先根據(jù)聲源方向
然后,將聲源球諧信號減去最匹配揚聲器球諧信號解出殘差信號。
隨后,把殘差信號賦值給聲源的球諧信號,繼續(xù)在剩余揚聲器中挑選最匹配的揚聲器并求解其系數(shù),重復(fù)執(zhí)行,直至所有揚聲器的系數(shù)均被匹配完畢,解碼完成。
4聲場重構(gòu)評價
客觀評測
本方法針對揚聲器不規(guī)則擺放,擺放規(guī)則與標(biāo)準(zhǔn)環(huán)繞聲22.2的擺放位置相同。聲源位置選擇仰角0度,20度,水平角0度到360以60度為間隔。用指向圖表示匹配投影法的聲場重構(gòu)效果。指向圖如圖4、5所示。
主觀評測
本方法針對揚聲器不規(guī)則擺放,擺放規(guī)則與標(biāo)準(zhǔn)環(huán)繞聲22.2的擺放位置相同。聲源位置選擇仰角0度,20度,水平角0度到360以60度為間隔。分別用矩陣求逆法和匹配投影法解碼,2名被試判別方向,總體誤差如表1。
表1為總體誤差表
圖6和圖7中三角形為匹配投影法主觀評測結(jié)果,四角星為矩陣求逆法主觀評測結(jié)果。
綜合主客觀評測結(jié)果,揚聲器擺放不規(guī)則的情況下匹配投影法也能很好復(fù)現(xiàn)原聲場,并且主觀實驗結(jié)果同時表明,匹配投影法的效果好于矩陣求逆法。