亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

生成3d聲音的方法和設(shè)備的制作方法

文檔序號(hào):7978801閱讀:162來(lái)源:國(guó)知局
專利名稱:生成3d聲音的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及處理音頻數(shù)據(jù)的設(shè)備。本發(fā)明還涉及處理音頻數(shù)據(jù)的方法。本發(fā)明進(jìn)一步涉及程序單元。并且,本發(fā)明涉及計(jì)算機(jī)可讀介質(zhì)。
背景技術(shù)
隨著虛擬空間中的聲音處理開(kāi)始吸引人們的注意,音頻聲音,特別是3D音頻聲音在提供人造的真實(shí)感方面變得越來(lái)越重要,例如在各種游戲軟件和與圖像結(jié)合的多媒體應(yīng)用中。在音樂(lè)中頻繁使用的很多效果之中,聲場(chǎng)效果被認(rèn)為是重新產(chǎn)生在特殊空間中聽(tīng)到
的聲音的一種嘗試。在本上下文中,經(jīng)常被稱作空間聲音的3D聲音是這樣的聲音,其被處理以便給聽(tīng)眾提供(虛擬)聲音源在三維環(huán)境中的特定位置上的印象。在從特定方向到達(dá)聽(tīng)眾的聲學(xué)信號(hào)到達(dá)聽(tīng)眾兩個(gè)耳朵中的鼓膜之前,該信號(hào)與聽(tīng)眾身體部分進(jìn)行交互。這種交互的結(jié)果是,到達(dá)鼓膜的聲音被從聽(tīng)眾肩膀的反射、與頭的交互、耳廓響應(yīng)和耳道中的共振所修改。可以說(shuō)身體對(duì)到來(lái)的聲音有濾波效果。具體濾波特性取決于聲源位置(相對(duì)于頭)。并且,由于聲音在空氣中的速度有限,根據(jù)聲源位置能夠注意到顯著的耳間(inter-aural)時(shí)延。最近更多地被稱為解剖學(xué)轉(zhuǎn)移函數(shù)(ATF)的頭部相關(guān)轉(zhuǎn)移函數(shù)(Head-Related Transfer Functions, HRTF)是聲源位置處方位角和仰角 (elevation)的函數(shù),其描述了從特定聲源方向到聽(tīng)眾鼓膜的濾波效果。HRTF數(shù)據(jù)庫(kù)是通過(guò)關(guān)于聲源測(cè)量從大的位置集合(通常在1到3米的固定距離上, 在水平和垂直方向上分隔開(kāi)大約5到10度)到兩耳的轉(zhuǎn)移函數(shù)來(lái)構(gòu)建的。這種數(shù)據(jù)庫(kù)可以針對(duì)各種聲學(xué)條件而獲得。例如,在消聲環(huán)境中,由于不存在反射,HRTF只捕捉從位置到鼓膜的直接轉(zhuǎn)移。HRTF還可以在回聲條件下測(cè)量。如果還捕捉到反射,這種HRTF數(shù)據(jù)庫(kù)則是房間特定的。HRTF數(shù)據(jù)庫(kù)經(jīng)常用于定位“虛擬”聲源。通過(guò)用一對(duì)HRTF卷積聲音信號(hào),并將作為結(jié)果得到的聲音通過(guò)耳機(jī)呈現(xiàn)出來(lái),則聽(tīng)眾能夠感知到該聲音是從對(duì)應(yīng)于HRTF對(duì)的方向過(guò)來(lái)的,這與感知到聲源“在頭中”相反,其中后者發(fā)生在當(dāng)未處理的聲音通過(guò)耳機(jī)呈現(xiàn)出來(lái)的時(shí)候。在這個(gè)方面,HRTF數(shù)據(jù)庫(kù)是定位虛擬聲源的受歡迎的手段。其中使用HRTF數(shù)據(jù)庫(kù)的應(yīng)用包括游戲、電話會(huì)議設(shè)備和虛擬現(xiàn)實(shí)系統(tǒng)。本發(fā)明的目標(biāo)和內(nèi)容
本發(fā)明的目標(biāo)是改善用于產(chǎn)生空間化聲音的音頻數(shù)據(jù)處理,允許以高效的方式對(duì)多個(gè)聲源進(jìn)行虛擬化。
為了達(dá)到上述目標(biāo),提供了定義在獨(dú)立權(quán)利要求中的處理音頻數(shù)據(jù)的設(shè)備、處理音頻數(shù)據(jù)的方法、程序單元和計(jì)算機(jī)可讀介質(zhì)。根據(jù)本發(fā)明的實(shí)施例,提供了一種處理音頻數(shù)據(jù)的設(shè)備,其中該設(shè)備包括輸入端,用于接收包括多個(gè)音頻輸入信號(hào)的組合信號(hào);濾波單元(103),適用于根據(jù)濾波器系數(shù) (SF1,SF2)對(duì)所述組合信號(hào)進(jìn)行濾波,結(jié)果產(chǎn)生至少兩個(gè)音頻輸出信號(hào)(0S1,0S2),和參數(shù)變換單元(104),適用于接收表示所述音頻輸入信號(hào)的聲源的空間位置的位置信息、表示每個(gè)聲源在頻帶中的能量的譜功率信息以及轉(zhuǎn)移函數(shù)參數(shù),該參數(shù)變換單元適用于基于該位置信息、該譜功率信息和轉(zhuǎn)移函數(shù)參數(shù)生成所述濾波器系數(shù)(SF1,SF2),并且其中該參數(shù)變換單元(104)適用于通過(guò)使用每個(gè)聲源在頻帶中的能量加權(quán)每個(gè)聲源的空間參數(shù)來(lái)生成平均空間參數(shù)集以及響應(yīng)于所述平均空間參數(shù)集確定所述濾波器系數(shù)。并且,根據(jù)本發(fā)明另一個(gè)實(shí)施例,提供一種處理音頻數(shù)據(jù)的方法,該方法包括如下步驟接收包括多個(gè)音頻輸入信號(hào)的組合信號(hào),根據(jù)濾波器系數(shù)對(duì)所述組合信號(hào)進(jìn)行濾波, 結(jié)果產(chǎn)生至少兩個(gè)音頻輸出信號(hào),接收表示所述音頻輸入信號(hào)的聲源的空間位置的位置信息、表示每個(gè)聲源在頻帶中的能量的譜功率信息以及轉(zhuǎn)移函數(shù)參數(shù),基于該位置信息、該譜功率信息和轉(zhuǎn)移函數(shù)參數(shù)生成所述濾波器系數(shù),通過(guò)使用每個(gè)聲源在頻帶中的能量加權(quán)每個(gè)聲源的空間參數(shù)來(lái)生成平均空間參數(shù)集,以及響應(yīng)于所述平均空間參數(shù)集確定所述濾波器系數(shù)。根據(jù)本發(fā)明處理音頻數(shù)據(jù)可由計(jì)算機(jī)程序、即由軟件來(lái)實(shí)現(xiàn),也可利用一個(gè)和更多專用電子最優(yōu)化電路、即硬件來(lái)實(shí)現(xiàn),還可以混合的形式、即借助軟件組件和硬件組件來(lái)實(shí)現(xiàn)。常規(guī)的HRTF數(shù)據(jù)庫(kù)就信息量來(lái)說(shuō)通常非常大。每個(gè)時(shí)域沖激響應(yīng)可以包括約64個(gè)采樣(對(duì)低復(fù)雜度,消聲條件)大到幾千個(gè)采樣長(zhǎng)(在混響房間內(nèi))。如果HRTF 對(duì)是以在垂直和水平方向上的10度的分辨率來(lái)測(cè)量,則要被存儲(chǔ)的系數(shù)量達(dá)到至少 360/10*180/10*64=41472個(gè)系數(shù)(假設(shè)64采樣沖激響應(yīng)),但是能夠容易地達(dá)到更高的數(shù)量級(jí)。對(duì)稱的頭將會(huì)需要(180/10)* (180/10) *64個(gè)系數(shù)(是41472個(gè)系數(shù)的一半)。根據(jù)本發(fā)明的特征性特征尤其具有如下優(yōu)點(diǎn),對(duì)多個(gè)虛擬聲源的虛擬化可以以幾乎獨(dú)立于虛擬聲源數(shù)目的計(jì)算復(fù)雜度得以實(shí)現(xiàn)。換句話說(shuō),可以有益地對(duì)多個(gè)同時(shí)的聲源以粗略地等于單個(gè)聲源的處理復(fù)雜度來(lái)進(jìn)行合成。通過(guò)降低的處理復(fù)雜度,可以有益地實(shí)現(xiàn)實(shí)時(shí)處理,即使是對(duì)大量聲源也可以實(shí)現(xiàn)。本發(fā)明實(shí)施例預(yù)期的另一個(gè)目標(biāo)是在聽(tīng)眾鼓膜處再現(xiàn)這樣的聲壓級(jí),即該聲壓級(jí)等于如果將實(shí)際聲源放置在虛擬聲源的位置(3D位置)中將會(huì)出現(xiàn)的聲壓。在進(jìn)一步的方面,目的在于產(chǎn)生豐富的聽(tīng)覺(jué)環(huán)境,其可對(duì)視覺(jué)減弱的人和有視力的人用作用戶接口。根據(jù)本發(fā)明的應(yīng)用能夠呈現(xiàn)(rendering)虛擬聲學(xué)聲源,所述虛擬聲學(xué)聲源給聽(tīng)眾以該源處于它們的正確空間位置的印象。本發(fā)明的進(jìn)一步實(shí)施例將在后面結(jié)合從屬權(quán)利要求來(lái)進(jìn)行描述?,F(xiàn)在將描述處理音頻數(shù)據(jù)的設(shè)備實(shí)施例。這些實(shí)施例還可應(yīng)用于處理音頻數(shù)據(jù)的方法、計(jì)算機(jī)可讀介質(zhì)和程序單元。在本發(fā)明的一個(gè)方面中,如果音頻輸入信號(hào)已經(jīng)被混合,則每個(gè)個(gè)別音頻輸入信號(hào)的相對(duì)等級(jí)可以基于譜功率信息而在一定程度上得到調(diào)整。這種調(diào)整只能在一定限度內(nèi) (例如,最大變化6和IOdB)進(jìn)行。通常,由于信號(hào)等級(jí)尺度與聲源距離的倒數(shù)成近似線性關(guān)系的事實(shí),距離效果比IOdB大得多。有益地,該設(shè)備可以另外還包括縮放單元,其適用于基于增益因子對(duì)音頻輸入信號(hào)進(jìn)行縮放。在本上下文中,參數(shù)變換單元可以另外還適用于有益地接收表示音頻輸入信號(hào)聲源距離的距離信息,并基于所述距離信息生成增益因子。由此,可以以簡(jiǎn)單且令人滿意的方式獲得距離效果。通過(guò)該距離增益因子可以減1。聲源功率可以因此根據(jù)聲學(xué)原理建?;蚋淖???蛇x地,由于可以適用于遠(yuǎn)距離聲源的情況,增益因子將會(huì)反映空氣吸收效應(yīng)。因此,可獲得更現(xiàn)實(shí)的聲音感受。根據(jù)實(shí)施例,濾波單元基于快速傅立葉變換(FFT)。這樣可實(shí)現(xiàn)高效和快速處理。HRTF數(shù)據(jù)庫(kù)可包括虛擬聲源位置的有限集合(通常在固定距離和5到10度的空間分辨率)。在很多情況下,不得不為測(cè)量位置之間的位置生成聲源(特別是如果虛擬聲源正隨時(shí)間移動(dòng))。這種生成需要對(duì)可獲得的沖激響應(yīng)進(jìn)行內(nèi)插。如果HRTF數(shù)據(jù)庫(kù)包括針對(duì)垂直和水平方向的響應(yīng),則必須對(duì)每個(gè)輸出信號(hào)實(shí)施內(nèi)插。因此,對(duì)每個(gè)聲源來(lái)說(shuō),需要對(duì)每個(gè)耳機(jī)輸出信號(hào)進(jìn)行4個(gè)沖激響應(yīng)的組合。如果有更多聲源必須同時(shí)被“虛擬化”,則所需沖激響應(yīng)的數(shù)目變得更加重要。在本發(fā)明的有益方面,HRTF模型參數(shù)和代表HRTF的參數(shù)可以在被存儲(chǔ)的空間分辨率之間被內(nèi)插。通過(guò)根據(jù)本發(fā)明在常規(guī)HRTF表上提供HRTF模型參數(shù),可以實(shí)現(xiàn)有益的更快處理。根據(jù)本發(fā)明的系統(tǒng)的主要應(yīng)用領(lǐng)域是處理音頻數(shù)據(jù)。然而,本系統(tǒng)可以嵌入在除了音頻數(shù)據(jù)之外還處理附加數(shù)據(jù),例如與視覺(jué)內(nèi)容相關(guān)的數(shù)據(jù)的情形中。因此,本發(fā)明可以在視頻數(shù)據(jù)處理系統(tǒng)框架內(nèi)實(shí)現(xiàn)。根據(jù)本發(fā)明的設(shè)備可被實(shí)現(xiàn)為下述一組設(shè)備中的其中一種,該組設(shè)備包括車輛音頻系統(tǒng)、便攜式音頻播放器、便攜式視頻播放器、頭盔顯示器(head-mounted display)、移動(dòng)電話、DVD播放器、⑶播放器、基于硬盤的媒體播放器、互聯(lián)網(wǎng)無(wú)線電設(shè)備、公共娛樂(lè)設(shè)備和MP3播放器。盡管提到的這些設(shè)備與本發(fā)明主要應(yīng)用領(lǐng)域有關(guān),但是任意其它的應(yīng)用也是可以的,例如在電話會(huì)議或遠(yuǎn)程出席(tel印resence);為視覺(jué)減弱的人提供的音頻顯示器;遠(yuǎn)程學(xué)習(xí)系統(tǒng)和用于電視電影的專業(yè)聲音和圖片編輯,以及噴氣式戰(zhàn)斗機(jī)(3D音頻可以幫助飛行員)和基于PC的音頻播放器。根據(jù)將在下面描述的實(shí)施例,本發(fā)明上面定義的方面和進(jìn)一步的方面是明顯的, 并將結(jié)合這些實(shí)施例進(jìn)行解釋。附圖的簡(jiǎn)要說(shuō)明
本發(fā)明將在下面結(jié)合實(shí)施例的例子對(duì)本發(fā)明進(jìn)行更加詳細(xì)的描述,本發(fā)明不限于這些例子。

圖1示出了根據(jù)本發(fā)明優(yōu)選實(shí)施例處理音頻數(shù)據(jù)的設(shè)備。圖2示出了根據(jù)本發(fā)明進(jìn)一步實(shí)施例處理音頻數(shù)據(jù)的設(shè)備。圖3示出了根據(jù)本發(fā)明實(shí)施例,包括存儲(chǔ)單元的處理音頻數(shù)據(jù)的設(shè)備。圖4詳細(xì)示出了在圖1或圖2所示處理音頻數(shù)據(jù)的設(shè)備中實(shí)現(xiàn)的濾波單元。
圖5示出了根據(jù)本發(fā)明實(shí)施例的又一個(gè)濾波單元。實(shí)施例的說(shuō)明
附圖中的圖解是示意性的。在不同附圖中,同樣的附圖標(biāo)記表示相似的或同一個(gè)元素?,F(xiàn)在將參照?qǐng)D1,對(duì)根據(jù)本發(fā)明實(shí)施例的處理輸入音頻數(shù)據(jù)\的設(shè)備100進(jìn)行描述。設(shè)備100包括求和單元102,該求和單元102適用于接收多個(gè)音頻輸入信號(hào)Xi,以便從該音頻輸入信號(hào)\生成總和信號(hào)SUM??偤托盘?hào)SUM被提供給濾波單元103,該濾波單元103適用于基于濾波器系數(shù),即在當(dāng)前例子中的第一濾波器系數(shù)SFl和第二濾波器系數(shù) SF2,對(duì)所述總和信號(hào)SUM進(jìn)行濾波,得到第一音頻輸出信號(hào)OSl和第二音頻輸出信號(hào)0S2。 下面給出對(duì)濾波單元103的詳細(xì)描述。并且,如圖1所示,設(shè)備100包括參數(shù)變換單元104,該參數(shù)變換單元104適用于接收一方面表示所述音頻輸入信號(hào)\聲源空間位置的位置信息Vi和另一方面表示所述音頻輸入信號(hào)\譜功率的譜功率信息Si,其中該參數(shù)變換單元104適用于基于對(duì)應(yīng)于輸入信號(hào)的位置信息\和譜功率信息Si生成所述濾波器系數(shù)SF1、SF2,并且其中該參數(shù)變換單元 104另外還適用于接收轉(zhuǎn)移函數(shù)參數(shù)以及另外根據(jù)所述轉(zhuǎn)移函數(shù)參數(shù)生成所述濾波器系數(shù)。圖2示出了在本發(fā)明進(jìn)一步實(shí)施例中的配置200。配置200包括根據(jù)圖1所示實(shí)施例的設(shè)備100并且另外還包括縮放單元201,該縮放單元201適用于基于增益因子&對(duì)音頻輸入信號(hào)\進(jìn)行縮放。在本實(shí)施例中,參數(shù)變換單元104另外還適用于接收表示音頻輸入信號(hào)聲源距離的距離信息,并基于所述距離信息生成增益因子&,再將這些增益因子 gi提供給縮放單元201。因此,通過(guò)簡(jiǎn)單的措施可靠地獲得距離效果。現(xiàn)在將結(jié)合圖3,對(duì)根據(jù)本發(fā)明的系統(tǒng)或設(shè)備實(shí)施例進(jìn)行更詳細(xì)描述。在圖3的實(shí)施例中,所示的系統(tǒng)300包括根據(jù)圖2所示實(shí)施例的配置200,并且另外還包括存儲(chǔ)單元301、音頻數(shù)據(jù)接口 302、位置數(shù)據(jù)接口 303、譜功率數(shù)據(jù)接口 304和HRTF 參數(shù)接口 305。存儲(chǔ)單元301適用于存儲(chǔ)音頻波形數(shù)據(jù),音頻數(shù)據(jù)接口 302適用于基于所存儲(chǔ)的音頻波形數(shù)據(jù)提供多個(gè)音頻輸入信號(hào)&。在本例子中,音頻波形數(shù)據(jù)對(duì)每個(gè)聲源以脈沖編碼調(diào)制(PCM)波表格的形式存儲(chǔ)。 然而,波形數(shù)據(jù)可被另外還或單獨(dú)地存儲(chǔ)為其它形式,例如根據(jù)標(biāo)準(zhǔn)MPEG-I層3 (MP3)、高級(jí)音頻編碼(AAC)、AAC-pIus等的壓縮格式。在存儲(chǔ)單元301中,還為每個(gè)聲源存儲(chǔ)位置信息Vi,且位置數(shù)據(jù)接口 303適用于提供所存儲(chǔ)的位置信息Vi。在本例子中,優(yōu)選實(shí)施例直接指向計(jì)算機(jī)游戲應(yīng)用。在這種計(jì)算機(jī)游戲應(yīng)用中,位置信息Vi隨著時(shí)間變化并取決于空間中編程的絕對(duì)位置(即在計(jì)算機(jī)游戲場(chǎng)景中的虛擬空間位置),但是還取決于用戶動(dòng)作,例如當(dāng)游戲場(chǎng)景中的虛擬人或用戶旋轉(zhuǎn)或改變他/她的虛擬位置時(shí),相對(duì)于用戶的聲源位置變化或者也應(yīng)該變化。在這種計(jì)算機(jī)游戲中,通過(guò)在計(jì)算機(jī)游戲場(chǎng)景中不同空間位置的每個(gè)樂(lè)器,從單個(gè)聲源(例如從后面的射擊)到復(fù)調(diào)音樂(lè)的任何情況都是可能的。同時(shí)的聲源數(shù)可以例如達(dá)到64這么高,因此,音頻輸入信號(hào)Xi范圍為從&到X64。
7
接口單元302基于所存儲(chǔ)的大小為η的幀的音頻波形數(shù)據(jù)提供多個(gè)音頻輸入信號(hào) &。本例子中,向每個(gè)音頻輸入信號(hào)&都提供IlkHz的采樣率。其它的采樣率也可以,例如對(duì)每個(gè)音頻輸入信號(hào)\的采樣率是44kHz。 在縮放單元201中,根據(jù)方程(1 ),利用每個(gè)聲道的增益因子或加權(quán)gi,大小為η的輸入信號(hào)Xi即被組合為總和信號(hào)SUM,即單音信號(hào)m[n]。增益因子&由參數(shù)變換單元104基于如上所述的存儲(chǔ)的伴隨有位置信息Vi的距離信息來(lái)提供。位置信息Vi和譜功率信息SiS數(shù)通常具有低得多的更新率,例如,每第11 毫秒進(jìn)行更新。本例子中,每個(gè)聲源的位置信息Vi由方位角、仰角和距離信息的三元組構(gòu)成。可替換地,可使用笛卡兒坐標(biāo)(X,y,z)或可替換的坐標(biāo)??蛇x地,位置信息可包括組合或子集中的信息,即仰角信息和/或方位角信息和/或距離信息方面的信息。在原理上,增益因子是依賴于時(shí)間的。然而,由于所需的這些增益因子的更新率大大低于輸入音頻信號(hào)^Ci的音頻采樣率這一事實(shí),假設(shè)增益因子& [η]對(duì)于短的時(shí)間段(如上所述,大約為11毫秒到23毫秒)是恒定的。該特性允許進(jìn)行基于幀的處理,其中增益因子&是恒定的,總和信號(hào)m[n]由方程(2)來(lái)表示現(xiàn)在將結(jié)合圖4和5對(duì)濾波單元103進(jìn)行解釋。圖4所示的濾波單元103包括分段單元401、快速傅立葉變換(FFT)單元402、第一子帶分組單元403、第一混合器404、第一組合單元405、第一逆FFT單元406、第一重疊相加單元407、第二子帶分組單元408、第二混合器409、第二組合單元410、第二逆FFT單元411 和第二重疊相加單元412。第一子帶分組單元403、第一混合器404和第一組合單元405構(gòu)成第一混合單元413。同樣地,第二子帶分組單元408、第二混合器409和第二組合單元410 構(gòu)成第二混合單元414。在本例子中,分段單元401適用于將進(jìn)來(lái)的信號(hào),即總和信號(hào)SUM和信號(hào)m[n]分別分段為重疊的幀,并為每個(gè)幀加窗。在本例子中,用漢明窗來(lái)加窗。還可使用其它方法, 例如韋爾奇(Welch)或三角形窗。接下來(lái),F(xiàn)FT單元402適用于利用FFT將每個(gè)加窗信號(hào)變換到頻域。在給出的例子中,利用FFT將每個(gè)長(zhǎng)度為N(N=0. . N_l)的幀m[n]變換到頻域這種頻域表達(dá)M[k]被復(fù)制到第一聲道(也被進(jìn)一步稱作左聲道L)和第二聲道(也被進(jìn)一步稱作右聲道R)。接下來(lái),頻域信號(hào)M[k]通過(guò)為每個(gè)聲道對(duì)FFT處理箱(bins)進(jìn)行分組而被分割為子帶b (b=0. . B-1),即通過(guò)用于左聲道L的第一子帶分組單元403并通過(guò)用于右聲道R的第二子帶分組單元408來(lái)實(shí)施分組。然后一個(gè)帶接一個(gè)帶地生成左輸出幀 L[k]和右輸出幀RDO (在FFT域中)。實(shí)際的處理包括根據(jù)相應(yīng)的縮放因子修改(縮放)每個(gè)FFT處理箱(其中對(duì)當(dāng)前 FFT處理箱對(duì)應(yīng)的頻率范圍的縮放因子被存儲(chǔ)),以及根據(jù)存儲(chǔ)的時(shí)間或相位差來(lái)修改相位。關(guān)于相位差,該差可以以任意的方式(例如對(duì)全部?jī)蓚€(gè)聲道(分成兩個(gè))或者只對(duì)一個(gè)聲道)應(yīng)用。通過(guò)濾波器系數(shù)向量提供每個(gè)FFT處理箱的相應(yīng)縮放因子,即在本例子中,第一濾波器系數(shù)SFl向第一混合器404提供,第二濾波器系數(shù)SF2向第二混合器409提供。在本例子中,濾波器系數(shù)向量為每個(gè)輸出信號(hào)提供用于頻率子帶的復(fù)數(shù)值的縮放因子。然后,在縮放之后,修改的左輸出幀L[k]通過(guò)逆FFT單元406變換到時(shí)域,獲得左時(shí)域信號(hào),而右輸出幀R[k]由逆FFT單元411進(jìn)行變換,獲得右時(shí)域信號(hào)。最后,對(duì)獲得的時(shí)域信號(hào)進(jìn)行重疊相加操作得到對(duì)每個(gè)輸出聲道的最后時(shí)域,即通過(guò)第一重疊相加單元 407獲得第一輸出聲道信號(hào)0S1,并通過(guò)第二重疊相加單元412獲得第二輸出聲道信號(hào)0S2。圖5所示的濾波單元103’與圖4所示的濾波單元103的差別在于提供去相關(guān)單元501,其適用于將去相關(guān)信號(hào)提供給每個(gè)輸出聲道,該去相關(guān)信號(hào)從由FFT單元402獲得的頻域信號(hào)導(dǎo)出。在圖5所示的濾波單元103’中,提供與圖4所示的第一混合單元413相似的第一混合單元413’,但是其另外還適用于處理去相關(guān)信號(hào)。同樣地,提供與圖4所示的第二混合單元414相似的第二混合單元414’,圖5所示的第二混合單元414’另外還適用于處理去相關(guān)信號(hào)。在本例子中,然后按照下面的方法一個(gè)帶接一個(gè)帶地生成兩個(gè)輸出信號(hào)L[k]和 R[k](在 FFT 域中)。
權(quán)利要求
1.一種處理音頻數(shù)據(jù)(Xi)的設(shè)備(100),其中該設(shè)備(100)包括輸入端,用于接收包括多個(gè)音頻輸入信號(hào)的組合信號(hào);濾波單元(103),適用于根據(jù)濾波器系數(shù)(SFl,SF2)對(duì)所述組合信號(hào)進(jìn)行濾波,結(jié)果產(chǎn)生至少兩個(gè)音頻輸出信號(hào)(0S1,0S2),和參數(shù)變換單元(104),適用于接收表示所述音頻輸入信號(hào)的聲源的空間位置的位置信息、表示每個(gè)聲源在頻帶中的能量的譜功率信息以及轉(zhuǎn)移函數(shù)參數(shù),該參數(shù)變換單元適用于基于該位置信息、該譜功率信息和轉(zhuǎn)移函數(shù)參數(shù)生成所述濾波器系數(shù)(SF1,SF2),并且其中該參數(shù)變換單元(104)適用于通過(guò)使用每個(gè)聲源在頻帶中的能量加權(quán)每個(gè)聲源的空間參數(shù)來(lái)生成平均空間參數(shù)集以及響應(yīng)于所述平均空間參數(shù)集確定所述濾波器系數(shù)。
2.根據(jù)權(quán)利要求1所述的設(shè)備(100),其中轉(zhuǎn)移函數(shù)參數(shù)是表示對(duì)于每個(gè)音頻輸出信號(hào)的頭部相關(guān)轉(zhuǎn)移函數(shù)(HRTF)的參數(shù),所述轉(zhuǎn)移函數(shù)參數(shù)將頻率子帶中的功率和每個(gè)輸出聲道的頭部相關(guān)轉(zhuǎn)移函數(shù)之間每個(gè)頻率子帶的實(shí)數(shù)值相位角或復(fù)數(shù)值相位角表示為方位角和仰角的函數(shù)。
3.根據(jù)權(quán)利要求2所述的設(shè)備(100),其中每個(gè)頻率子帶的復(fù)數(shù)值相位角表示每個(gè)輸出聲道的頭部相關(guān)轉(zhuǎn)移函數(shù)之間的平均相位角。
4.根據(jù)權(quán)利要求1或2所述的設(shè)備(100),另外還包括縮放單元(201),適用于基于增益因子對(duì)音頻輸入信號(hào)進(jìn)行縮放。
5.根據(jù)權(quán)利要求4所述的設(shè)備(100),其中參數(shù)變換單元(104)另外還適用于接收表示音頻輸入信號(hào)的聲源的距離的距離信息,并基于所述距離信息生成增益因子。
6.根據(jù)權(quán)利要求1或2所述的設(shè)備(100),其中濾波單元(103)基于快速傅立葉變換 (FFT)或者實(shí)數(shù)值或復(fù)數(shù)值的濾波器組。
7.根據(jù)權(quán)利要求6所述的設(shè)備(100),其中濾波單元(103)另外還包括去相關(guān)單元,適用于向至少兩個(gè)音頻輸出信號(hào)的每一個(gè)施加去相關(guān)信號(hào)。
8.根據(jù)權(quán)利要求6所述的設(shè)備(100),其中濾波單元(103)適用于處理濾波器系數(shù),其中所述濾波器系數(shù)對(duì)于每個(gè)輸出信號(hào)以用于頻率子帶的復(fù)數(shù)值縮放因子的形式提供。
9.根據(jù)權(quán)利要求1至8中任意一項(xiàng)所述的設(shè)備(300),另外還包括存儲(chǔ)音頻波形數(shù)據(jù)的存儲(chǔ)裝置(301),和基于所存儲(chǔ)的音頻波形數(shù)據(jù)提供多個(gè)音頻輸入信號(hào)的接口單元 (302)。
10.根據(jù)權(quán)利要求9所述的設(shè)備(300),其中存儲(chǔ)裝置(301)適用于將音頻波形數(shù)據(jù)存儲(chǔ)為脈沖編碼調(diào)制(PCM)格式和/或壓縮格式。
11.根據(jù)權(quán)利要求9或10的設(shè)備(300),其中存儲(chǔ)裝置(301)適用于存儲(chǔ)每個(gè)時(shí)間和 /或頻率子帶的譜功率信息。
12.根據(jù)權(quán)利要求1所述的設(shè)備(100),其中位置信息包括仰角信息和/或方位角信息和/或距離信息方面的信息。
13.根據(jù)權(quán)利要求9所述的設(shè)備(100),實(shí)現(xiàn)為下述一組設(shè)備中的其中一種,該組設(shè)備包括便攜式音頻播放器、便攜式視頻播放器、頭盔顯示器(head-mounted display)、移動(dòng)電話、DVD播放器、⑶播放器、基于硬盤的媒體播放器、互聯(lián)網(wǎng)無(wú)線電設(shè)備、公共娛樂(lè)設(shè)備、MP3 播放器、基于PC的媒體播放器、電話會(huì)議設(shè)備和噴氣式戰(zhàn)斗機(jī)。
14.一種處理音頻數(shù)據(jù)(101)的方法,其中該方法包括如下步驟接收包括多個(gè)音頻輸入信號(hào)的組合信號(hào),根據(jù)濾波器系數(shù)對(duì)所述組合信號(hào)進(jìn)行濾波,結(jié)果產(chǎn)生至少兩個(gè)音頻輸出信號(hào), 接收表示所述音頻輸入信號(hào)的聲源的空間位置的位置信息、表示每個(gè)聲源在頻帶中的能量的譜功率信息以及轉(zhuǎn)移函數(shù)參數(shù),基于該位置信息、該譜功率信息和轉(zhuǎn)移函數(shù)參數(shù)生成所述濾波器系數(shù),其中生成所述濾波器系數(shù)包括如下步驟通過(guò)使用每個(gè)聲源在頻帶中的能量加權(quán)每個(gè)聲源的空間參數(shù)來(lái)生成平均空間參數(shù)集,以及響應(yīng)于所述平均空間參數(shù)集確定所述濾波器系數(shù)。
全文摘要
一種處理音頻數(shù)據(jù)(101)的設(shè)備(100),其中該設(shè)備(100)包括適用于接收多個(gè)音頻輸入信號(hào)以用于生成總和信號(hào)的求和單元(102),適用于根據(jù)濾波器系數(shù)(SF1,SF2)對(duì)所述總和求和信號(hào)進(jìn)行濾波以作為結(jié)果產(chǎn)生至少兩個(gè)音頻輸出信號(hào)(OS1,OS2)的濾波單元(103),和參數(shù)變換單元(104),其適用于接收一方面表示所述音頻輸入信號(hào)聲源空間位置的位置信息,和另一方面表示所述音頻輸入信號(hào)譜功率的譜功率信息,其中該參數(shù)變換單元適用于基于該位置信息和該譜功率信息生成所述濾波器系數(shù)(SF1,SF2),并且其中該參數(shù)變換單元(104)另外還適用于接收轉(zhuǎn)移函數(shù)參數(shù)并根據(jù)所述轉(zhuǎn)移函數(shù)參數(shù)生成所述濾波器系數(shù)。
文檔編號(hào)H04S7/00GK102395098SQ20111036772
公開(kāi)日2012年3月28日 申請(qǐng)日期2006年9月6日 優(yōu)先權(quán)日2005年9月13日
發(fā)明者布里巴爾特 J. 申請(qǐng)人:皇家飛利浦電子股份有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1