本發(fā)明涉及一種用于執(zhí)行雙耳渲染的音頻信號(hào)處理設(shè)備和音頻信號(hào)處理方法。
背景技術(shù):
3d音頻統(tǒng)指一系列信號(hào)處理、發(fā)送、編碼和重現(xiàn)技術(shù),這些技術(shù)向現(xiàn)有技術(shù)的環(huán)繞音頻提供的水平表面(2d)上的聲音場(chǎng)景提供與高度方向?qū)?yīng)的另一軸線,以提供在三維空間中存在的聲音。具體地,為了提供3d音頻,與現(xiàn)有技術(shù)相比,需要使用更大量的揚(yáng)聲器,或者需要即使使用少量揚(yáng)聲器也能夠在未設(shè)置揚(yáng)聲器的虛擬位置中形成聲像的渲染技術(shù)。
3d音頻可以是與超高清tv(uhdtv)對(duì)應(yīng)的音頻分辨率,并且有望用在各種領(lǐng)域和裝置中。作為提供至3d音頻的聲音源,存在基于聲道的信號(hào)和基于對(duì)象的信號(hào)。另外,可以存在基于聲道的信號(hào)和基于對(duì)象的信號(hào)混合的聲音源,因此用戶可以具有一種新類型的聽覺體驗(yàn)。
同時(shí),雙耳渲染是一種將輸入音頻信號(hào)建模為傳輸至人的兩個(gè)耳朵的信號(hào)。通過耳機(jī)或耳塞收聽經(jīng)過雙耳渲染的雙聲道輸出音頻信號(hào),用戶可以感覺到3d聲音效果。因此,當(dāng)將3d音頻建模為傳輸至人的耳朵的音頻信號(hào)時(shí),可以通過雙聲道輸出音頻信號(hào)來再現(xiàn)3d音頻的3d聲音效果。
技術(shù)實(shí)現(xiàn)要素:
技術(shù)問題
本發(fā)明的提出是為了提供一種用于執(zhí)行雙耳渲染的音頻信號(hào)處理設(shè)備和音頻信號(hào)處理方法。
本發(fā)明的提出還是為了對(duì)3d音頻的對(duì)象信號(hào)和聲道信號(hào)執(zhí)行高效雙耳渲染。
本發(fā)明的提出還是為了對(duì)虛擬現(xiàn)實(shí)(vr)內(nèi)容的音頻信號(hào)實(shí)施浸入式雙耳渲染。
技術(shù)方案
為了實(shí)現(xiàn)上述目的,本發(fā)明提供一種如下的音頻信號(hào)處理方法和音頻信號(hào)處理設(shè)備。
本發(fā)明的示例性實(shí)施例提供了一種對(duì)輸入音頻信號(hào)執(zhí)行雙耳濾波的音頻信號(hào)處理設(shè)備,其包括:第一濾波單元,所述第一濾波單元通過第一側(cè)向傳輸函數(shù)對(duì)所述輸入音頻信號(hào)進(jìn)行濾波以生成第一側(cè)向輸出信號(hào);以及第二濾波單元,所述第二濾波單元通過第二側(cè)向傳輸函數(shù)對(duì)所述輸入音頻信號(hào)進(jìn)行濾波以生成第二側(cè)向輸出信號(hào),其中,所述第一側(cè)向傳輸函數(shù)和所述第二側(cè)向傳輸函數(shù)可以通過修改相對(duì)于所述輸入信號(hào)將第一側(cè)向頭相關(guān)傳輸函數(shù)(hrtf)除以第二側(cè)向hrtf得到的耳間傳輸函數(shù)(hrtf)而生成。
所述第一側(cè)向傳輸函數(shù)和所述第二側(cè)向傳輸函數(shù)可以通過基于相對(duì)于所述輸入音頻信號(hào)的所述第一側(cè)向hrtf和所述第二側(cè)向hrtf中的至少一個(gè)的陷波分量修改所述itf而生成。
所述第一側(cè)向傳輸函數(shù)可以基于從所述第一側(cè)向hrtf提取的所述陷波分量而生成,并且所述第二側(cè)向傳輸函數(shù)可以基于通過將所述第二側(cè)向hrtf除以從所述第一側(cè)向hrtf提取的包絡(luò)分量得到的值而生成。
所述第一側(cè)向傳輸函數(shù)可以基于從所述第一側(cè)向hrtf提取的所述陷波分量而生成,并且所述第二側(cè)向傳輸函數(shù)可以基于通過將所述第二側(cè)向hrtf除以從具有與所述輸入音頻信號(hào)不同方向的第一側(cè)向hrtf提取的包絡(luò)分量得到的值而生成。
具有所述不同方向的所述第一側(cè)向hrtf可以是方位角與所述輸入音頻信號(hào)相同并且高度角為零的第一hrtf。
所述第一側(cè)向傳輸函數(shù)可以是通過使用所述第一側(cè)向hrtf的陷波分量生成的有限脈沖響應(yīng)(fir)濾波器系數(shù)或者無限脈沖響應(yīng)(iir)濾波器系數(shù)。
所述第二側(cè)向傳輸函數(shù)包括基于針對(duì)所述輸入音頻信號(hào)的第一側(cè)向hrtf的包絡(luò)分量和第二側(cè)向hrtf的包絡(luò)分量生成的耳間參數(shù)以及基于第二側(cè)向hrtf的陷波分量生成的脈沖響應(yīng)(ir)濾波器系數(shù),并且其中,所述第一側(cè)向傳輸函數(shù)可以包括基于所述第一側(cè)向hrtf的陷波分量生成的ir濾波器系數(shù)。
所述耳間參數(shù)包括耳間電平差(ild)和耳間時(shí)間差(itd)。
接下來,本發(fā)明的另一示例性實(shí)施例提供了一種對(duì)輸入音頻信號(hào)執(zhí)行雙耳濾波的音頻信號(hào)處理設(shè)備,其包括:同側(cè)濾波單元,所述同側(cè)濾波單元通過同側(cè)傳輸函數(shù)對(duì)所述輸入音頻信號(hào)進(jìn)行濾波以生成同側(cè)輸出信號(hào);以及對(duì)側(cè)濾波單元,所述對(duì)側(cè)濾波單元通過對(duì)側(cè)傳輸函數(shù)對(duì)所述輸入音頻信號(hào)進(jìn)行濾波以生成對(duì)側(cè)輸出信號(hào),其中,所述同側(cè)傳輸函數(shù)和所述對(duì)側(cè)傳輸函數(shù)是基于第一頻帶和第二頻帶中的不同傳輸函數(shù)生成的。
所述第一頻帶的所述同側(cè)傳輸函數(shù)和所述對(duì)側(cè)傳輸函數(shù)可以基于耳間傳輸函數(shù)(itf)而生成,并且所述itf可以基于通過相對(duì)于所述輸入音頻信號(hào)將同側(cè)頭相關(guān)傳輸函數(shù)(hrtf)除以對(duì)側(cè)hrtf得到的值而生成。
所述第一頻帶的所述同側(cè)傳輸函數(shù)和所述對(duì)側(cè)傳輸函數(shù)可以是相對(duì)于所述輸入音頻信號(hào)的同側(cè)hrtf和對(duì)側(cè)hrtf。
與所述第一頻帶不同的所述第二頻帶的所述同側(cè)傳輸函數(shù)和所述對(duì)側(cè)傳輸函數(shù)可以基于修改后的耳間傳輸函數(shù)(mitf)而生成,以及其中,所述mitf可以通過基于相對(duì)于所述輸入音頻信號(hào)的同側(cè)hrtf和對(duì)側(cè)hrtf中的至少一個(gè)的陷波分量修改耳間傳輸函數(shù)(itf)而生成。
所述第二頻帶的所述同側(cè)傳輸函數(shù)可以基于從所述同側(cè)hrtf提取的陷波分量而生成,并且所述第二頻帶的所述對(duì)側(cè)傳輸函數(shù)可以基于通過將所述對(duì)側(cè)hrtf除以從所述同側(cè)hrtf提取的包絡(luò)分量得到的值而生成。
所述第一頻帶的所述同側(cè)傳輸函數(shù)和所述對(duì)側(cè)傳輸函數(shù)可以基于從相對(duì)于各個(gè)頻帶的所述輸入音頻信號(hào)的所述同側(cè)hrtf和所述對(duì)側(cè)hrtf的耳間電平差(ild)、耳間時(shí)間差(itd)、耳間相位差(ipd)和耳間相關(guān)性(ic)中的至少一個(gè)提取的信息而生成。
所述第一頻帶和所述第二頻帶的所述傳輸函數(shù)可以基于從相同的同側(cè)hrtf和對(duì)側(cè)hrtf提取的信息而生成。
所述第一頻帶低于所述第二頻帶。
所述第一頻帶的所述同側(cè)傳輸函數(shù)和所述對(duì)側(cè)傳輸函數(shù)可以基于第一傳輸函數(shù)而生成,與所述第一頻帶不同的所述第二頻帶的所述同側(cè)傳輸函數(shù)和所述對(duì)側(cè)傳輸函數(shù)可以基于第二傳輸函數(shù)而生成,并且,在所述第一頻帶與所述第二頻帶之間的第三頻帶中的所述同側(cè)傳輸函數(shù)和所述對(duì)側(cè)傳輸函數(shù)可以基于所述第一傳輸函數(shù)和所述第二傳輸函數(shù)的線性組合而生成。
此外,本發(fā)明的示例性實(shí)施例提供了一種對(duì)輸入音頻信號(hào)執(zhí)行雙耳濾波的音頻信號(hào)處理方法,其包括:接收輸入音頻信號(hào);通過同側(cè)傳輸函數(shù)對(duì)所述輸入音頻信號(hào)進(jìn)行濾波以生成同側(cè)輸出信號(hào);以及通過對(duì)側(cè)傳輸函數(shù)對(duì)所述輸入音頻信號(hào)進(jìn)行濾波以生成對(duì)側(cè)輸出信號(hào);其中,所述同側(cè)傳輸函數(shù)和所述對(duì)側(cè)傳輸函數(shù)是基于第一頻帶和第二頻帶中的不同傳輸函數(shù)生成的。
本發(fā)明的另一示例性實(shí)施例提供了一種對(duì)輸入音頻信號(hào)執(zhí)行雙耳濾波的音頻信號(hào)處理方法,其包括:接收輸入音頻信號(hào);通過第一傳輸函數(shù)對(duì)所述輸入音頻信號(hào)進(jìn)行濾波以生成第一輸出信號(hào);通過第二側(cè)向傳輸函數(shù)對(duì)所述輸入音頻信號(hào)進(jìn)行濾波以生成第二輸出信號(hào);其中,所述第一側(cè)向傳輸函數(shù)和所述第二側(cè)向傳輸函數(shù)是通過修改相對(duì)于所述輸入音頻信號(hào)將第一側(cè)向頭相關(guān)傳輸函數(shù)(hrtf)除以第二側(cè)向hrtf得到的耳間傳輸函數(shù)(hrtf)而生成的。
有益效果
根據(jù)本發(fā)明的示例性實(shí)施例,可以為高質(zhì)量雙耳聲音提供低計(jì)算復(fù)雜度。
根據(jù)本發(fā)明的示例性實(shí)施例,可以防止雙耳渲染可能會(huì)導(dǎo)致的聲像定位的劣化和聲音質(zhì)量的降低。
根據(jù)本發(fā)明的示例性實(shí)施例,通過高效計(jì)算,實(shí)現(xiàn)了反映出用戶或者對(duì)象的運(yùn)動(dòng)的雙耳渲染過程。
附圖說明
圖1是圖示根據(jù)本發(fā)明的示例性實(shí)施例的音頻信號(hào)處理設(shè)備的框圖。
圖2是圖示根據(jù)本發(fā)明的示例性實(shí)施例的雙耳渲染器的框圖。
圖3是根據(jù)本發(fā)明的示例性實(shí)施例的方向渲染器的框圖。
圖4是圖示根據(jù)本發(fā)明的示例性實(shí)施例的修改的itf(mitf)生成方法的示意圖。
圖5是圖示根據(jù)本發(fā)明的另一示例性實(shí)施例的mitf生成方法的示意圖。
圖6是圖示根據(jù)本發(fā)明的另一示例性實(shí)施例的雙耳參數(shù)生成方法的示意圖。
圖7是根據(jù)本發(fā)明的另一示例性實(shí)施例的方向渲染器的框圖。
圖8是圖示根據(jù)本發(fā)明的另一示例性實(shí)施例的mitf生成方法的示意圖。
具體實(shí)施方式
在本說明書使用的術(shù)語選自當(dāng)考慮到在本發(fā)明中的功能時(shí)當(dāng)前盡可能廣泛使用的常規(guī)術(shù)語,但是這些術(shù)語可能會(huì)根據(jù)本領(lǐng)域的技術(shù)人員的意圖、習(xí)慣、或者新技術(shù)的出現(xiàn)而發(fā)生變化。進(jìn)一步地,在特定情況下,術(shù)語由申請(qǐng)人任意選擇,并且在這種情況下,在本發(fā)明的說明書的對(duì)應(yīng)部分中可能會(huì)描述該術(shù)語的含義。因此,要注意,在本說明書中的術(shù)語是基于該術(shù)語的基本含義和整個(gè)說明書而非基于該術(shù)語的簡(jiǎn)要標(biāo)題來分析。
圖1是圖示根據(jù)本發(fā)明的示例性實(shí)施例的音頻信號(hào)處理設(shè)備的框圖。參照?qǐng)D1,音頻信號(hào)處理設(shè)備10包括雙耳渲染器100、雙耳參數(shù)控制器200和個(gè)性化裝置300。
首先,雙耳渲染器100接收輸入音頻并且對(duì)該輸入音頻執(zhí)行雙耳渲染以生成雙聲道輸出音頻信號(hào)l和r。雙耳渲染器100的輸入音頻信號(hào)可以包括對(duì)象信號(hào)和聲道信號(hào)中的至少一種。在這種情況下,輸入音頻信號(hào)可以是一個(gè)對(duì)象信號(hào)或者一個(gè)單聲道信號(hào),或者可以是多對(duì)象信號(hào)或者多聲道信號(hào)。根據(jù)示例性實(shí)施例,當(dāng)雙耳渲染器100包括單獨(dú)的解碼器時(shí),雙耳渲染器100的輸入信號(hào)可以是音頻信號(hào)的編碼比特流。
雙耳渲染器100的輸出音頻信號(hào)是雙耳信號(hào),即,各個(gè)輸入對(duì)象/聲道信號(hào)由位于3d空間中的虛擬聲音源表示的雙聲道音頻信號(hào)?;趶碾p耳參數(shù)控制器200提供的雙耳參數(shù)來執(zhí)行雙耳渲染,并且在時(shí)域或者頻域上執(zhí)行。如上所述,雙耳渲染器100對(duì)各種類型的輸入信號(hào)執(zhí)行雙耳渲染以生成3d音頻耳機(jī)信號(hào)(即,3d音頻雙聲道信號(hào))。
根據(jù)示例性實(shí)施例,可以進(jìn)一步對(duì)雙耳渲染器100的輸出音頻信號(hào)執(zhí)行后處理。該后處理包括串音消除、動(dòng)態(tài)范圍控制(drc)、音量標(biāo)準(zhǔn)化和峰值限制。后處理可以進(jìn)一步包括對(duì)雙耳渲染器100的輸出音頻信號(hào)進(jìn)行頻域/時(shí)域轉(zhuǎn)換。音頻信號(hào)處理設(shè)備10可以包括執(zhí)行后處理的單獨(dú)的后處理器,并且根據(jù)另一示例性實(shí)施例,后處理器可以被包括在雙耳渲染器100中。
雙耳參數(shù)控制器200生成雙耳渲染的雙耳參數(shù),并且將該雙耳參數(shù)傳輸至雙耳渲染器100。在這種情況下,傳輸?shù)碾p耳參數(shù)包括同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù),如在以下各個(gè)示例性實(shí)施例中描述的。在這種情況下,傳輸函數(shù)可以包括頭相關(guān)傳輸函數(shù)(hrtf)、耳間傳輸函數(shù)(itf)、修改的itf(mitf)、雙耳房間傳輸函數(shù)(brtf)、房間脈沖響應(yīng)(rir)、雙耳房間脈沖響應(yīng)(brir)、頭相關(guān)脈沖響應(yīng)(hrir)和其修改的/編輯的數(shù)據(jù)中的至少一種,但是本發(fā)明不限于上述傳輸函數(shù)。
傳輸函數(shù)可以在消聲室中測(cè)量,并且包括有關(guān)通過模擬估計(jì)的hrtf的信息。用于估計(jì)hrtf的模擬技術(shù)可以是球狀頭模型(shm)、雪人模型、時(shí)域有限差分方法(fdtdm)、邊界元素方法(bem)中的至少一種。在這種情況下,球狀頭模型指示一種假設(shè)人的頭是球體來執(zhí)行模擬的模擬技術(shù)。進(jìn)一步地,雪人模型是指一種假設(shè)頭和身體都是球體來執(zhí)行模擬的模擬技術(shù)。
雙耳參數(shù)控制器200從數(shù)據(jù)庫(未圖示)獲得傳輸函數(shù)或者從個(gè)性化裝置300接收傳輸函數(shù)。在本發(fā)明中,假設(shè)通過對(duì)脈沖響應(yīng)(ir)執(zhí)行快速傅里葉變換來獲得傳輸函數(shù),但是,在本發(fā)明中,變換方法不限于快速傅里葉變換。即,根據(jù)本發(fā)明的示例性實(shí)施例,變換方法包括正交鏡像濾波器組(qmf)、離散余弦變換(dct)、離散正弦變換(dst)和小波。
根據(jù)本發(fā)明的示例性實(shí)施例,雙耳參數(shù)控制器200生成同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù),并且將生成的傳輸函數(shù)傳輸至雙耳渲染器100。根據(jù)本示例性實(shí)施例,同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)可以分別通過修改同側(cè)原型傳輸函數(shù)和對(duì)側(cè)原型傳輸函數(shù)來生成。進(jìn)一步地,雙耳參數(shù)可以進(jìn)一步包括耳間電平差(ild)、有限脈沖響應(yīng)(fir)濾波器系數(shù)、無限脈沖響應(yīng)濾波器系數(shù)。在本發(fā)明中,ild和itd也可稱為耳間參數(shù)。
同時(shí),在本發(fā)明的示例性實(shí)施例中,將傳輸函數(shù)用作可以用濾波器系數(shù)替代的術(shù)語。進(jìn)一步地,將原型傳輸函數(shù)用作可以用原型濾波器系數(shù)替代的術(shù)語。因此,同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)可以分別表示同側(cè)濾波器系數(shù)和對(duì)側(cè)濾波器系數(shù),并且同側(cè)原型傳輸函數(shù)和對(duì)側(cè)原型傳輸函數(shù)可以分別表示同側(cè)原型濾波器系數(shù)和對(duì)側(cè)原型濾波器系數(shù)。
根據(jù)示例性實(shí)施例,雙耳參數(shù)控制器200可以基于從個(gè)性化裝置300獲得的個(gè)性化信息來生成雙耳參數(shù)。個(gè)性化裝置300根據(jù)用戶獲取用于應(yīng)用不同雙耳參數(shù)的附加信息并且提供基于獲得的附加信息而確定的雙耳傳輸函數(shù)。例如,個(gè)性化裝置300可以基于用戶的身體屬性信息從數(shù)據(jù)庫為用戶選擇雙耳傳輸函數(shù)(例如,個(gè)性化hrtf)。在這種情況下,身體素質(zhì)信息可以包括如下信息,諸如,耳廓的形狀或者大小、外耳道的形狀、頭骨的大小和類型、體型和體重。
個(gè)性化裝置300將確定的雙耳傳輸函數(shù)提供至雙耳渲染器100和/或雙耳參數(shù)控制器200。根據(jù)示例性實(shí)施例,雙耳渲染器100通過使用從個(gè)性化裝置300提供的雙耳傳輸函數(shù)對(duì)輸入音頻信號(hào)執(zhí)行雙耳渲染。根據(jù)另一示例性實(shí)施例,雙耳參數(shù)控制器200通過使用從個(gè)性化裝置300提供的雙耳傳輸函數(shù)來生成雙耳參數(shù)并且將生成的雙耳參數(shù)傳輸至雙耳渲染器100。雙耳渲染器100基于從雙耳參數(shù)控制器200獲得的雙耳參數(shù)對(duì)輸入音頻信號(hào)執(zhí)行雙耳渲染。
同時(shí),圖1是圖示本發(fā)明的音頻信號(hào)處理設(shè)備10的元件的示例性實(shí)施例,但本發(fā)明不限于此。例如,除了圖1中圖示的元件之外,本發(fā)明的音頻信號(hào)處理設(shè)備10可以進(jìn)一步包括附加元件。進(jìn)一步地,可以從音頻信號(hào)處理設(shè)備10省略掉圖1中圖示的一些元件,例如,個(gè)性化裝置300。
圖2是圖示根據(jù)本發(fā)明的示例性實(shí)施例的雙耳渲染器的框圖。參照?qǐng)D2,雙耳渲染器100包括方向渲染器120和距離渲染器140。在本發(fā)明的示例性實(shí)施例中,音頻信號(hào)處理設(shè)備可以表示圖2的雙耳渲染器100或者可以指示作為雙耳渲染器100的部件的方向渲染器120或距離渲染器140。然而,在本發(fā)明的示例性實(shí)施例中,音頻信號(hào)處理設(shè)備在廣義上可以指示圖1的包括雙耳渲染器100的音頻信號(hào)處理設(shè)備10。
首先,方向渲染器120執(zhí)行方向渲染以定位輸入音頻信號(hào)的聲音源的方向。聲音源可以表示與對(duì)象信號(hào)對(duì)應(yīng)的音頻對(duì)象或者與聲道信號(hào)對(duì)應(yīng)的擴(kuò)音器。方向渲染器120將應(yīng)用區(qū)分聲音源相對(duì)于收聽者的方向的雙耳線索,即,輸入音頻信號(hào)的方向線索以執(zhí)行方向渲染。在這種情況下,方向線索包括兩個(gè)耳朵的電平差、兩個(gè)耳朵的相位差、頻譜包絡(luò)、頻譜陷波和峰值。方向渲染器120通過使用雙耳參數(shù),諸如同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù),來執(zhí)行雙耳渲染。
接下來,距離渲染器140執(zhí)行距離渲染,該距離渲染反映根據(jù)輸入音頻信號(hào)的聲音源距離的效果。距離渲染器140將區(qū)分聲音源相對(duì)于收聽者的距離線索應(yīng)用到輸入音頻信號(hào)以執(zhí)行距離渲染。根據(jù)本發(fā)明的示例性實(shí)施例,距離渲染可以根據(jù)聲音源與輸入音頻信號(hào)的距離變化反映聲音強(qiáng)度變化和頻譜整形。根據(jù)本發(fā)明的示例性實(shí)施例,距離渲染器140根據(jù)聲音源的距離是否在預(yù)定閾值內(nèi)來執(zhí)行不同的處理。當(dāng)聲音源的距離超過預(yù)定閾值時(shí),可以應(yīng)用與聲音源相對(duì)于收聽者的頭部的距離成反比的聲音強(qiáng)度。然而,當(dāng)聲音源的距離在預(yù)定閾值內(nèi)時(shí),可以基于相對(duì)于收聽者的兩個(gè)耳朵測(cè)得的聲音源的距離來執(zhí)行單獨(dú)的距離渲染。
根據(jù)本發(fā)明的示例性實(shí)施例,雙耳渲染器100對(duì)輸入信號(hào)執(zhí)行方向渲染和距離渲染中的至少一種以生成雙耳輸出信號(hào)。雙耳渲染器100可以順序地對(duì)輸入信號(hào)執(zhí)行方向渲染和距離渲染或者可以執(zhí)行組合了方向渲染和距離渲染的處理。下文中,在本發(fā)明的示例性實(shí)施例中,作為包括方向渲染、距離渲染和其組合的構(gòu)思,可以使用術(shù)語“雙耳渲染”或者“雙耳濾波”。
根據(jù)示例性實(shí)施例,雙耳渲染器100首先對(duì)輸入音頻信號(hào)執(zhí)行方向渲染以獲得雙聲道輸出信號(hào),即,同側(cè)輸出信號(hào)d^i和對(duì)側(cè)輸出信號(hào)d^c。接下來,雙耳渲染器100對(duì)雙聲道輸出信號(hào)d^i和d^c執(zhí)行距離渲染以生成雙耳輸出信號(hào)b^i和b^c。在這種情況下,方向渲染器120的輸入信號(hào)是對(duì)象信號(hào)和/或聲道信號(hào),并且距離渲染器140的輸入信號(hào)是雙聲道信號(hào)d^i和d^c,對(duì)該雙聲道信號(hào)d^i和d^c執(zhí)行方向渲染作為預(yù)處理步驟。
根據(jù)另一示例性實(shí)施例,雙耳渲染器100首先對(duì)輸入音頻信號(hào)執(zhí)行距離渲染以獲得雙聲道輸出信號(hào),即,同側(cè)輸出信號(hào)d^i和對(duì)側(cè)輸出信號(hào)d^c。接下來,雙耳渲染器100對(duì)雙聲道輸出信號(hào)d^i和d^c執(zhí)行方向渲染以生成雙耳輸出信號(hào)b^i和b^c。在這種情況下,距離渲染器140的輸入信號(hào)是對(duì)象信號(hào)和/或聲道信號(hào),并且方向渲染器120的輸入信號(hào)是雙聲道信號(hào)d^i和d^c,對(duì)該雙聲道信號(hào)d^i和d^c執(zhí)行距離渲染作為預(yù)處理步驟。
圖3是根據(jù)本發(fā)明的示例性實(shí)施例的方向渲染器120-1的框圖。參照?qǐng)D3,方向渲染器120-1包括同側(cè)濾波單元122a和對(duì)側(cè)濾波單元122b。方向渲染器120-1接收包括同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)的雙耳參數(shù),并且利用接收到的雙耳參數(shù)對(duì)輸入音頻信號(hào)進(jìn)行濾波以生成同側(cè)輸出信號(hào)和對(duì)側(cè)輸出信號(hào)。即,同側(cè)濾波單元122a利用同側(cè)傳輸函數(shù)對(duì)輸入音頻信號(hào)進(jìn)行濾波以生成同側(cè)輸出信號(hào),并且對(duì)側(cè)濾波單元122b利用對(duì)側(cè)傳輸函數(shù)對(duì)輸入音頻信號(hào)進(jìn)行濾波以生成對(duì)側(cè)輸出信號(hào)。根據(jù)本發(fā)明的示例性實(shí)施例,同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)分別可以是同側(cè)hrtf和對(duì)側(cè)hrtf。即,方向渲染器120-1利用兩個(gè)耳朵的hrtf對(duì)輸入音頻信號(hào)進(jìn)行卷積以獲得相應(yīng)方向的雙耳信號(hào)。
在本發(fā)明的示例性實(shí)施例中,同側(cè)/對(duì)側(cè)濾波單元122a和122b分別可以指示左/右聲道濾波單元,或者分別可以指示右/左聲道濾波單元。當(dāng)輸入音頻信號(hào)的聲音源位于收聽者的左邊時(shí),同側(cè)濾波單元122a生成左聲道輸出信號(hào),并且對(duì)側(cè)濾波單元122b生成右聲道輸出信號(hào)。然而,當(dāng)輸入音頻信號(hào)的聲音源位于收聽者的右邊時(shí),同側(cè)濾波單元122a生成右聲道輸出信號(hào),并且對(duì)側(cè)濾波單元122b生成左聲道輸出信號(hào)。如上所述,方向渲染器120-1執(zhí)行同側(cè)/對(duì)側(cè)濾波以生成兩個(gè)聲道的左/右輸出信號(hào)。
根據(jù)本發(fā)明的示例性實(shí)施例,方向渲染器120-1通過使用耳間傳輸函數(shù)(itf)、修改的itf(mitf)或者其組合,而非hrtf,來對(duì)輸入音頻信號(hào)進(jìn)行濾波,以防止消音室的特性被反映到雙耳信號(hào)中。下文將描述根據(jù)本發(fā)明的各個(gè)示例性實(shí)施例的使用傳輸函數(shù)的雙耳渲染方法。
<使用itf的雙耳渲染>
首先,方向渲染器120-1通過使用itf對(duì)輸入音頻信號(hào)進(jìn)行濾波。可以將itf定義為將對(duì)側(cè)hrtf除以同側(cè)hrtf的傳輸函數(shù),如以下等式1所表示的。
[等式1]
i_i(k)=1
i_c(k)=h_c(k)/h_i(k)
此處,k是頻率索引,h_i(k)是頻率k的同側(cè)hrtf,h_c(k)是頻率k的對(duì)側(cè)hrtf,i_i(k)是頻率k的同側(cè)itf,并且i_c(k)是頻率k的對(duì)側(cè)itf。
即,根據(jù)本發(fā)明的示例性實(shí)施例,在各個(gè)頻率k中,將i_i(k)的值定義為1(即,0db),并且將i_c(k)定義為通過在頻率k中將h_c(k)除以h_i(k)而得到的值。方向渲染器120-1的同側(cè)濾波單元122a利用同側(cè)itf對(duì)輸入音頻信號(hào)進(jìn)行濾波以生成同側(cè)輸出信號(hào),并且對(duì)側(cè)濾波單元122b利用對(duì)側(cè)itf對(duì)輸入音頻信號(hào)進(jìn)行濾波以生成對(duì)側(cè)輸出信號(hào)。在這種情況下,如等式1所表示的,當(dāng)同側(cè)itf為1時(shí),即,當(dāng)同側(cè)itf在時(shí)域中是單位狄拉克(delta)函數(shù)或者所有增益值在頻域中都為1時(shí),同側(cè)濾波單元122a可以對(duì)輸入音頻信號(hào)的濾波進(jìn)行旁通處理。如上所述,對(duì)同側(cè)濾波進(jìn)行旁通處理,并且利用對(duì)側(cè)itf對(duì)輸入音頻信號(hào)執(zhí)行對(duì)側(cè)濾波,從而執(zhí)行使用itf的雙耳渲染。方向渲染器120-1省略了同側(cè)濾波單元122a的操作以獲得計(jì)算復(fù)雜度的增益。
itf是指示同側(cè)原型傳輸函數(shù)與對(duì)側(cè)原型傳輸函數(shù)之間的差異的函數(shù),并且通過將傳輸函數(shù)的該差異用作線索,聽者可以產(chǎn)生方位感。在itf的處理步驟期間,消除了hrtf的房間特性,因此可以補(bǔ)償在使用hrtf的渲染中產(chǎn)生別扭聲音(主要是缺失低音的聲音)的現(xiàn)象。同時(shí),根據(jù)本發(fā)明的另一示例性實(shí)施例,將i_c(k)定義為1,并且可以將i_i(k)定義為通過在頻率k中將h_i(k)除以h_c(k)而得到的值。在這種情況下,方向渲染器120-1對(duì)對(duì)側(cè)濾波進(jìn)行旁通處理并且利用同側(cè)itf對(duì)輸入音頻信號(hào)執(zhí)行同側(cè)濾波。
<使用mitf的雙耳渲染>
當(dāng)通過使用itf執(zhí)行雙耳渲染時(shí),僅對(duì)l/r對(duì)之間的一個(gè)聲道執(zhí)行渲染,從而使得計(jì)算復(fù)雜度的增益較大。然而,當(dāng)使用itf時(shí),由于缺少hrtf的獨(dú)特特性,諸如,頻譜峰值、陷波等,聲像定位可能會(huì)變差。進(jìn)一步地,當(dāng)在作為itf的分母的hrtf(在上述示例性實(shí)施例中是同側(cè)hrtf)中存在陷波時(shí),在itf中生成具有窄帶寬的頻譜峰值,這引起音調(diào)噪聲。因此,根據(jù)本發(fā)明的另一示例性實(shí)施例,可以通過修改輸入音頻信號(hào)的itf來生成用于雙耳濾波的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。方向渲染器120-1通過使用修改的itf(即,mitf)對(duì)輸入音頻信號(hào)進(jìn)行濾波。
圖4是圖示根據(jù)本發(fā)明的示例性實(shí)施例的修改的itf(mitf)生成方法的示意圖。mitf生成單元220是圖1的雙耳參數(shù)控制器200的部件,并且接收同側(cè)hrtf和對(duì)側(cè)hrtf以生成同側(cè)mitf和對(duì)側(cè)mitf。將mitf生成單元220中生成的同側(cè)mitf和對(duì)側(cè)mitf傳輸至圖3的同側(cè)濾波單元122a和對(duì)側(cè)濾波單元122b以用于同側(cè)濾波和對(duì)側(cè)濾波。
在下文中,將參照等式來描述根據(jù)本發(fā)明的各個(gè)示例性實(shí)施例的mitf生成方法。在本發(fā)明的示例性實(shí)施例中,第一側(cè)向指同側(cè)和對(duì)側(cè)中的任何一個(gè),而第二側(cè)向指另一個(gè)。出于方便起見,即使本發(fā)明是在第一側(cè)向指同側(cè)并且第二側(cè)向指對(duì)側(cè)的假設(shè)下進(jìn)行描述的,當(dāng)?shù)谝粋?cè)向指對(duì)側(cè)并且第二側(cè)向指同側(cè)時(shí),也可以按照相同的方式來實(shí)施本發(fā)明。即,在本發(fā)明的等式和示例性實(shí)施例中,同側(cè)和對(duì)側(cè)可以互換使用。例如,將同側(cè)hrtf除以對(duì)側(cè)hrtf以得到同側(cè)mitf的操作可以用將對(duì)側(cè)hrtf除以同側(cè)hrtf以得到對(duì)側(cè)mitf的操作來替代。
在以下示例性實(shí)施例中,通過使用原型傳輸函數(shù)hrtf來生成mitf。然而,根據(jù)本發(fā)明的示例性實(shí)施例,可以使用原型傳輸函數(shù),而非hrtf,即,另一雙耳參數(shù)來生成mitf。
(1.mitf方法:有條件的同側(cè)濾波)
根據(jù)本發(fā)明的第一示例性實(shí)施例,當(dāng)在特定頻率索引k中對(duì)側(cè)hrtf的值大于同側(cè)hrtf時(shí),可以基于通過將同側(cè)hrtf除以對(duì)側(cè)hrtf得到的值來生成mitf。即,當(dāng)同側(cè)hrtf的幅度和對(duì)側(cè)hrtf的幅度由于同側(cè)hrtf的陷波分量而相反時(shí),與itf的操作相反,將同側(cè)hrtf除以對(duì)側(cè)hrtf以防止生成頻譜峰值。更具體地,當(dāng)相對(duì)于頻率索引k,同側(cè)hrtf為h_i(k),對(duì)側(cè)hrtf為h_c(k),同側(cè)mitf為m_i(k),并且對(duì)側(cè)mitf為m_c(k)時(shí),可以生成同側(cè)mitf和對(duì)側(cè)mitf,如以下等式2所表示的。
[等式2]
如果(h_i(k)<h_c(k))
m_i(k)=h_i(k)/h_c(k)
m_c(k)=1
否則
m_i(k)=1
m_c(k)=h_c(k)/h_i(k)
即,根據(jù)第一示例性實(shí)施例,當(dāng)在特定頻率索引k中(即,在陷波區(qū)域中)h_i(k)的值小于h_c(k)的值時(shí),將m_i(k)確定為通過將h_i(k)除以h_c(k)得到的值,并且將m_c(k)的值確定為1。相反,當(dāng)h_i(k)的值不小于h_c(k)的值時(shí),將m_i(k)的值確定為1,并且將m_c(k)的值確定為通過將h_c(k)除以h_i(k)得到的值。
(2.mitf方法:切割(cutting))
根據(jù)本發(fā)明的第二示例性實(shí)施例,當(dāng)在特定頻率索引k中作為itf的分母的hrtf,即,同側(cè)hrtf,具有陷波分量時(shí),可以將在該頻率索引k中的同側(cè)mitf和對(duì)側(cè)mitf的值設(shè)置為1(即,0db)。從數(shù)學(xué)上表達(dá)mitf生成方法的第二示例性實(shí)施例,如以下等式3所表示的。
[等式3]
如果(h_i(k)<h_c(k))
m_i(k)=1
m_c(k)=1
否則
m_i(k)=1
m_c(k)=h_c(k)/h_i(k)
即,根據(jù)第二示例性實(shí)施例,當(dāng)在特定頻率索引k中(即,在陷波區(qū)域中)h_i(k)的值小于h_c(k)的值時(shí),將m_i(k)和m_c(k)的值確定為1。相反,當(dāng)h_i(k)的值不小于h_c(k)的值時(shí),可以分別將同側(cè)mitf和對(duì)側(cè)mitf設(shè)置為與同側(cè)itf和對(duì)側(cè)itf相同。即,將mitfm_i(k)的值確定為1,并且將m_c(k)的值確定為通過將h_c(k)除以h_i(k)得到的值。
(3.mitf方法:縮放)
根據(jù)本發(fā)明的第三示例性實(shí)施例,將權(quán)重反映到具有陷波分量的hrtf以減小陷波的深度。為了將大于1的權(quán)重反映到作為itf的分母的hrtf的陷波分量中,即,同側(cè)hrtf的陷波分量,可以應(yīng)用加權(quán)函數(shù)w(k),如等式4所表示的。
[等式4]
如果(h_i(k)<h_c(k))
m_i(k)=1
m_c(k)=h_c(k)/(w(k)*h_i(k))
否則
m_i(k)=1
m_c(k)=h_c(k)/h_i(k)
此處,符號(hào)*表示乘法。即,根據(jù)第三示例性實(shí)施例,當(dāng)在特定頻率索引k中(即,在陷波區(qū)域中)h_i(k)的值小于h_c(k)的值時(shí),將m_i(k)確定為1,并且將m_c(k)的值確定為通過將h_c(k)除以w(k)和h_i(k)的乘積得到的值。相反,當(dāng)h_i(k)的值不小于h_c(k)的值時(shí),將m_i(k)的值確定為1,并且將m_c(k)的值確定為通過將h_c(k)除以h_i(k)得到的值。即,當(dāng)h_i(k)的值小于h_c(k)的值時(shí),應(yīng)用加權(quán)函數(shù)w(k)。根據(jù)示例性實(shí)施例,將加權(quán)函數(shù)w(k)設(shè)置為隨著同側(cè)hrtf的陷波深度變得更大(即,隨著同側(cè)hrtf的值變得更小)而具有更大的值。根據(jù)另一示例性實(shí)施例,可以將加權(quán)函數(shù)w(k)設(shè)置為隨著同側(cè)hrtf的值與對(duì)側(cè)hrtf的值之間的差異變得更大而具有更大的值。
第一、第二和第三示例性實(shí)施例的條件可以擴(kuò)展到在特定頻率索引k中h_i(k)的值小于h_c(k)的值的預(yù)定比率α的情況。即,當(dāng)h_i(k)的值小于α*h_c(k)的值時(shí),可以基于在各個(gè)示例性實(shí)施例中的條件等式中的等式來生成同側(cè)mitf和對(duì)側(cè)mitf。相反,當(dāng)h_i(k)的值不小于α*h_c(k)的值時(shí),可以將同側(cè)mitf和對(duì)側(cè)mitf設(shè)置為與同側(cè)itf和對(duì)側(cè)itf相同。進(jìn)一步地,第一、第二和第三示例性實(shí)施例的條件部分可以用于僅限于特定的頻帶,并且根據(jù)該頻帶,可以將不同的值應(yīng)用于預(yù)定比率α。
(4.1.mitf方法:陷波分離)
根據(jù)本發(fā)明的第四示例性實(shí)施例,將hrtf的陷波分量分離,并且基于分離的陷波分量來生成mitf。圖5是圖示根據(jù)本發(fā)明的第四示例性實(shí)施例的mitf生成方法的示意圖。mitf生成單元220-1可以進(jìn)一步包括hrtf分離單元222和標(biāo)準(zhǔn)化單元224。hrtf分離單元222將原型傳輸函數(shù),即,hrtf,分成hrtf包絡(luò)分量和hrtf陷波分量。
根據(jù)本發(fā)明的示例性實(shí)施例,hrtf分離單元222將作為itf的分母的hrtf,即,同側(cè)hrtf,分為hrtf包絡(luò)分量和hrtf陷波分量,并且可以基于分離的同側(cè)hrtf包絡(luò)分量和同側(cè)hrtf陷波分量來生成mitf。從數(shù)學(xué)上表達(dá)mitf生成方法的第四示例性實(shí)施例,如以下等式5所表示的。
[等式5]
m_i(k)=h_i_notch(k)
m_c(k)=h_c_notch(k)*h_c_env(k)/h_i_env(k)
此處,k指示頻率索引,h_i_notch(k)指示同側(cè)hrtf陷波分量,h_i_env(k)指示同側(cè)hrtf包絡(luò)分量,h_c_notch(k)指示對(duì)側(cè)hrtf陷波分量,并且h_c_env(k)指示對(duì)側(cè)hrtf包絡(luò)分量。符號(hào)*指乘法,并且h_c_notch(k)*h_c_env(k)可以用未分離的對(duì)側(cè)hrtfh_c(k)來替代。
即,根據(jù)第四示例性實(shí)施例,將m_i(k)確定為從同側(cè)hrtf提取的陷波分量h_i_notch(k)的值,并且將m_c(k)確定為通過將對(duì)側(cè)hrtfh_c(k)除以從同側(cè)hrtf提取的包絡(luò)分量h_i_env(k)得到的值。參照?qǐng)D5,hrtf分離單元222從同側(cè)hrtf提取同側(cè)hrtf包絡(luò)分量,并且輸出同側(cè)hrtf的剩余分量,即,陷波分量,作為同側(cè)mitf。進(jìn)一步地,標(biāo)準(zhǔn)化單元224接收同側(cè)hrtf包絡(luò)分量和對(duì)側(cè)hrtf,并且根據(jù)等式5的示例性實(shí)施例生成并且輸出對(duì)側(cè)mitf。
當(dāng)在外耳的特定位置產(chǎn)生反射時(shí),通常會(huì)生成頻譜陷波,從而使hrtf的頻譜陷波可以極大地有助于識(shí)別仰角感知(elevationperception)。通常,陷波的特征在于快速的譜域變化。相反,itf所代表的雙耳線索的特征在于緩慢的譜域變化。因此,根據(jù)示例性實(shí)施例,hrtf分離單元222通過使用倒頻譜或者波插值的同態(tài)信號(hào)處理來分離hrtf的陷波分量。
例如,hrtf分離單元222執(zhí)行對(duì)同側(cè)hrtf的倒頻譜加窗以獲得同側(cè)hrtf包絡(luò)分量。mitf生成單元200將同側(cè)hrtf和對(duì)側(cè)hrtf中的每一個(gè)除以同側(cè)hrtf包絡(luò)分量,從而生成同側(cè)mitf,從該同側(cè)mitf可以移除頻譜著色。同時(shí),根據(jù)本發(fā)明的另一示例性實(shí)施例,hrtf分離單元222可以通過使用全極點(diǎn)建模、零極點(diǎn)建模、或者群延遲函數(shù)來分離hrtf的陷波分量。
同時(shí),根據(jù)本發(fā)明的另一示例性實(shí)施例,將h_i_notch(k)近似為fir濾波器系數(shù)或者iir濾波器系數(shù),并且將近似的濾波器系數(shù)用作雙耳渲染的同側(cè)傳輸函數(shù)。即,方向渲染器的同側(cè)濾波單元利用近似的濾波器系數(shù)對(duì)輸入音頻信號(hào)進(jìn)行濾波以生成同側(cè)輸出信號(hào)。
(4.2.mitf方法:陷波分量/使用具有不同高度角的hrtf)
根據(jù)本發(fā)明的另一示例性實(shí)施例,為了生成特定角度的mitf,可以使用具有與輸入音頻信號(hào)的方向不同的方向的hrtf包絡(luò)分量。例如,mitf生成單元200在水平面(即,高度角為0)上利用hrtf包絡(luò)分量對(duì)另一hrtf對(duì)(同側(cè)hrtf和對(duì)側(cè)hrtf)進(jìn)行標(biāo)準(zhǔn)化,以將位于水平面上的傳輸函數(shù)實(shí)施成具有平坦頻譜的mitf。根據(jù)本發(fā)明的示例性實(shí)施例,可以通過以下等式6的方法來生成mitf。
[等式6]
m_i(k,θ,φ)=h_i_notch(k,θ,φ)
m_c(k,θ,φ)=h_c(k,θ,φ)/h_i_env(k,0,φ)
此處,k是頻率索引,θ是高度角,φ是方位角。
即,通過從高度角θ和方位角φ的同側(cè)hrtf提取的陷波分量h_i_notch(k,θ,φ)來確定高度角θ和方位角φ的同側(cè)mitfm_i(k,θ,φ),并且通過將高度角θ和方位角φ的對(duì)側(cè)hrtfh_c(k,θ,φ)除以從高度角0和方位角φ的同側(cè)hrtf提取的包絡(luò)分量h_i_env(k,0,φ)得到的值來確定對(duì)側(cè)mitfm_c(k,θ,φ)。根據(jù)本發(fā)明的另一示例性實(shí)施例,可以通過以下等式7的方法來生成mitf。
[等式7]
m_i(k,θ,φ)=h_i_(k,θ,φ)/h_i_env(k,0,φ)
m_c(k,θ,φ)=h_c(k,θ,φ)/h_i_env(k,0,φ)
即,通過將高度角θ和方位角φ的同側(cè)hrtfh_i(k,θ,φ)除以h_i_env(k,0,φ)得到的值來確定高度角θ和方位角φ的同側(cè)mitfm_i(k,θ,φ),并且通過將高度角θ和方位角φ的對(duì)側(cè)hrtfh_c(k,θ,φ)除以h_i_env(k,0,φ)來確定對(duì)側(cè)mitfm_c(k,θ,φ)。在等式6和7中,舉例說明的是,使用具有相同方位角和不同高度角(即,高度角0)的hrtf包絡(luò)分量來生成mitf。然而,本發(fā)明不限于此,并且可以通過使用具有不同方位角和/或不同高度角的hrtf包絡(luò)分量來生成mitf。
(5.mitf方法:陷波分離2)
根據(jù)本發(fā)明的第五示例性實(shí)施例,可以通過使用由空間/頻率軸線表達(dá)的波插值來生成mitf。例如,將hrtf分成慢漸變波(sew)和快漸變波(rew),該慢漸變波(sew)和快漸變波(rew)通過高度角/頻率軸線或者方位角/頻率軸線來三維地表達(dá)。在這種情況下,從sew提取用于雙耳渲染的雙耳線索(例如,itf、耳間參數(shù)),并且從rew提取陷波分量。
根據(jù)本發(fā)明的示例性實(shí)施例,方向渲染器通過使用從sew提取的雙耳線索來執(zhí)行雙耳渲染,并且直接將從rew提取的陷波分量應(yīng)用至各個(gè)聲道(同側(cè)聲道/對(duì)側(cè)聲道)以抑制音調(diào)噪聲。為了在空間域/頻域的波插值中分離sew和rew,可以使用同態(tài)信號(hào)處理、低/高通濾波等方法。
(6.mitf方法:陷波分離3)
根據(jù)本發(fā)明的第六示例性實(shí)施例,在原型傳輸函數(shù)的陷波區(qū)域中,使用原型傳輸函數(shù)來進(jìn)行雙耳濾波,并且,在除了陷波區(qū)域之外的區(qū)域中,可以使用根據(jù)上述示例性實(shí)施例的mitf來進(jìn)行雙耳濾波。這將通過以下等式8來從數(shù)學(xué)上表達(dá)。
[等式8]
如果k處于陷波區(qū)域
m′_i(k)=h_i(k)
m′_c(k)=h_c(k)
否則
m′_i(k)=m_i(k)
m′_c(k)=m_c(k)
此處,m’_i(k)和m’_c(k)是根據(jù)第六示例性實(shí)施例的同側(cè)mitf和對(duì)側(cè)mitf,并且m_i(k)和m_c(k)是根據(jù)上述示例性實(shí)施例中任何一個(gè)示例性實(shí)施例的同側(cè)mitf和對(duì)側(cè)mitf。h_i(k)和h_c(k)指示作為原型傳輸函數(shù)的同側(cè)hrtf和對(duì)側(cè)hrtf。即,在包括有同側(cè)hrtf的陷波分量的頻帶的情況下,將同側(cè)hrtf和對(duì)側(cè)hrtf分別用作雙耳渲染的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。進(jìn)一步地,在不包括同側(cè)hrtf的陷波分量的頻帶的情況下,將同側(cè)mitf和對(duì)側(cè)mitf分別用作雙耳渲染的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。為了分離陷波區(qū)域,如上所述,可以使用全極點(diǎn)建模、零極點(diǎn)建模、群延遲函數(shù)等。根據(jù)本發(fā)明的另一示例性實(shí)施例,可以使用諸如低通濾波等平滑技術(shù),以防止由在陷波區(qū)域與非陷波區(qū)域之間的邊界處的突然頻譜變化導(dǎo)致的聲音質(zhì)量的降低。
(7.mitf方法:具有低復(fù)雜度的陷波分離)
根據(jù)本發(fā)明的第七示例性實(shí)施例,可以通過更簡(jiǎn)單的操作來處理hrtf分離的剩余分量,即,陷波分量。根據(jù)示例性實(shí)施例,將hrtf剩余分量近似為fir濾波器系數(shù)或者iir濾波器系數(shù),并且將近似的濾波器系數(shù)用作雙耳渲染的同側(cè)和/或?qū)?cè)傳輸函數(shù)。圖6是圖示根據(jù)本發(fā)明的第七示例性實(shí)施例的雙耳參數(shù)生成方法的示意圖,并且圖7是根據(jù)本發(fā)明的第七示例性實(shí)施例的方向渲染器的框圖。
首先,圖6圖示了根據(jù)本發(fā)明的示例性實(shí)施例的雙耳參數(shù)生成單元220-2。參照?qǐng)D6,雙耳參數(shù)生成單元220-2包括hrtf分離單元222a和222b、耳間參數(shù)計(jì)算單元225和陷波參數(shù)化單元226a和226b。根據(jù)示例性實(shí)施例,可以將雙耳參數(shù)生成單元220-2用作替代圖4和圖5的mitf生成單元的配置。
首先,hrtf分離單元222a和222b將輸入hrtf分成hrtf包絡(luò)分量和hrtf剩余分量。第一hrtf生成單元222a接收同側(cè)hrtf,并且將同側(cè)hrtf分為同側(cè)hrtf包絡(luò)分量和同側(cè)hrtf剩余分量。第二hrtf生成單元222b接收對(duì)側(cè)hrtf,并且將對(duì)側(cè)hrtf分為對(duì)側(cè)hrtf包絡(luò)分量和對(duì)側(cè)hrtf剩余分量。耳間參數(shù)計(jì)算單元225接收同側(cè)hrtf包絡(luò)分量和對(duì)側(cè)hrtf包絡(luò)分量,并且通過使用這些分量來生成耳間參數(shù)。耳間參數(shù)包括耳間電平差(ild)和耳間時(shí)間差(itd)。在這種情況下,ild與耳間傳輸函數(shù)的大小對(duì)應(yīng),并且itd與耳間傳輸函數(shù)的相位(或者,時(shí)域中的時(shí)間差)對(duì)應(yīng)。
同時(shí),陷波參數(shù)化單元226a和226b接收hrtf剩余分量并且將hrtf剩余分量近似為脈沖響應(yīng)(ir)濾波器系數(shù)。hrtf剩余分量包括hrtf陷波分量,并且ir濾波器包括fir濾波器和iir濾波器。第一陷波參數(shù)化單元226a接收同側(cè)hrtf剩余分量,并且通過使用該同側(cè)hrtf剩余分量來生成同側(cè)ir濾波器系數(shù)。第二陷波參數(shù)化單元226b接收對(duì)側(cè)hrtf剩余分量,并且通過使用該對(duì)側(cè)hrtf剩余分量來生成對(duì)側(cè)ir濾波器系數(shù)。
如上所述,將由雙耳參數(shù)生成單元220-2生成的雙耳參數(shù)傳輸至方向渲染器。雙耳參數(shù)包括耳間參數(shù)和同側(cè)/對(duì)側(cè)ir濾波器系數(shù)。在這種情況下,耳間參數(shù)至少包括ild和itd。
圖7是根據(jù)本發(fā)明的示例性實(shí)施例的方向渲染器120-2的框圖。參照?qǐng)D7,方向渲染器120-2包括包絡(luò)濾波單元125和同側(cè)/對(duì)側(cè)陷波濾波單元126a和126b。根據(jù)示例性實(shí)施例,可以將同側(cè)陷波濾波單元126a用作替代圖2的同側(cè)濾波單元122a的部件,并且可以將包絡(luò)濾波單元125和對(duì)側(cè)陷波濾波單元126b用作替代圖2的對(duì)側(cè)濾波單元122b的部件。
首先,包絡(luò)濾波單元125接收耳間參數(shù),并且基于接收到的耳間參數(shù)對(duì)輸入音頻信號(hào)進(jìn)行濾波以反映同側(cè)/對(duì)側(cè)包絡(luò)之間的差異。根據(jù)圖7的示例性實(shí)施例,包絡(luò)濾波單元125可以執(zhí)行對(duì)側(cè)信號(hào)的濾波,但是本發(fā)明不限于此。即,根據(jù)另一示例性實(shí)施例,包絡(luò)濾波單元125可以執(zhí)行同側(cè)信號(hào)的濾波。當(dāng)包絡(luò)濾波單元125執(zhí)行對(duì)側(cè)信號(hào)的濾波時(shí),耳間參數(shù)可以指示對(duì)側(cè)包絡(luò)相對(duì)于同側(cè)包絡(luò)的相對(duì)信息,并且,當(dāng)包絡(luò)濾波單元125執(zhí)行同側(cè)信號(hào)的濾波時(shí),耳間參數(shù)可以指示同側(cè)包絡(luò)相對(duì)于對(duì)側(cè)包絡(luò)的相對(duì)信息。
接下來,陷波濾波單元126a和126b執(zhí)行同側(cè)/對(duì)側(cè)信號(hào)的濾波以分別反映同側(cè)/對(duì)側(cè)傳輸函數(shù)的陷波。第一陷波濾波單元126a利用同側(cè)ir濾波器系數(shù)對(duì)輸入音頻信號(hào)進(jìn)行濾波以生成同側(cè)輸出信號(hào)。第二陷波濾波單元126b利用對(duì)側(cè)ir濾波器系數(shù)對(duì)經(jīng)過包絡(luò)濾波的輸入音頻信號(hào)進(jìn)行濾波以生成對(duì)側(cè)輸出信號(hào)。即使在圖7的示例性實(shí)施例中是在陷波濾波之前執(zhí)行包絡(luò)濾波,但本發(fā)明不限于此。根據(jù)本發(fā)明的另一示例性實(shí)施例,可以在對(duì)輸入音頻信號(hào)執(zhí)行同側(cè)/對(duì)側(cè)陷波濾波之后對(duì)同側(cè)或者對(duì)側(cè)信號(hào)執(zhí)行包絡(luò)濾波。
如上所述,根據(jù)圖7的示例性實(shí)施例,方向渲染器120-2通過使用同側(cè)陷波濾波單元126a來執(zhí)行同側(cè)濾波。進(jìn)一步地,方向渲染器120-2通過使用包絡(luò)濾波單元125和對(duì)側(cè)陷波濾波單元126b來執(zhí)行對(duì)側(cè)濾波。在這種情況下,用于同側(cè)濾波的同側(cè)傳輸函數(shù)包括基于同側(cè)hrtf的陷波分量生成的ir濾波器系數(shù)。進(jìn)一步地,用于對(duì)側(cè)濾波的對(duì)側(cè)傳輸函數(shù)包括基于對(duì)側(cè)hrtf的陷波分量生成的ir濾波器系數(shù)和耳間參數(shù)。此處,基于同側(cè)hrtf的包絡(luò)分量和對(duì)側(cè)hrtf的包絡(luò)分量來生成耳間參數(shù)。
(8.mitf方法:混合itf)
根據(jù)本發(fā)明的第八示例性實(shí)施例,可以使用組合有上面提到的itf和mitf中的兩個(gè)或者更多個(gè)的混合itf(hitf)。在本發(fā)明的示例性實(shí)施例中,hitf指示耳間傳輸函數(shù),在該耳間傳輸函數(shù)中,在至少一個(gè)頻帶中使用的傳輸函數(shù)與另一個(gè)頻帶中使用的傳輸函數(shù)不同。即,可以使用基于在第一頻帶和第二頻帶中的不同傳輸函數(shù)生成的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。根據(jù)本發(fā)明的示例性實(shí)施例,使用itf對(duì)第一頻帶進(jìn)行雙耳渲染,并且使用mitf對(duì)第二頻帶進(jìn)行雙耳渲染。
更具體地,在低頻帶中,兩個(gè)耳朵的電平差、兩個(gè)耳朵的相位差等是聲像定位的重要因素,并且在高頻帶中,頻譜包絡(luò)、特定陷波、峰值等是聲像定位的重要線索。因此,為了高效地反映出這一點(diǎn),基于itf來生成低頻帶的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù),并且基于mitf來生成高頻帶的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。這將通過以下等式9來從數(shù)學(xué)上表達(dá)。
[等式9]
如果(k<c0)
h_i(k)=i_i(k)
h_c(k)=i_c(k)
否則
h_i(k)=m_i(k)
h_c(k)=m_c(k)
此處,k是頻率索引,c0是臨界頻率索引,h_i(k)和h_c(k)分別是根據(jù)本發(fā)明的示例性實(shí)施例的同側(cè)hitf和對(duì)側(cè)hitf。進(jìn)一步地,i_i(k)和i_c(k)指示同側(cè)itf和對(duì)側(cè)itf,并且m_i(k)和m_c(k)指示根據(jù)上述示例性實(shí)施例中任何一個(gè)示例性實(shí)施例的同側(cè)mitf和對(duì)側(cè)mitf。
即,根據(jù)本發(fā)明的示例性實(shí)施例,基于itf來生成在頻率索引低于臨界頻率索引的第一頻帶中的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù),并且基于mitf來生成在頻率索引等于或者高于臨界頻率索引的第二頻帶中的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。根據(jù)示例性實(shí)施例,臨界頻率索引c0指示在500hz與2khz之間的特定頻率。
同時(shí),根據(jù)本發(fā)明的另一示例性實(shí)施例,基于itf來生成低頻帶的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù),基于mitf來生成高頻帶的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù),基于itf和mitf的線性組合來生成在低頻帶與高頻帶之間的中間頻帶的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。這將通過以下等式10來從數(shù)學(xué)上表達(dá)。
[等式10]
如果(k<c1)
h_i(k)=i_i(k)
h_c(k)=i_c(k)
否則如果(c1≤k≤c2)
h_i(k)=g1(k)*i_i(k)+g2(k)*m_i(k)
h_c(k)=g1(k)*i_c(k)+g2(k)*m_c(k)
否則
h_i(k)=m_i(k)
h_c(k)=m_c(k)
此處,c1指示第一臨界頻率索引,并且c2指示第二臨界頻率索引。進(jìn)一步地,g1(k)和g2(k)分別指示在頻率索引k中的itf和mitf的增益。
即,根據(jù)本發(fā)明的示例性實(shí)施例,基于itf來生成在頻率索引低于第一臨界頻率索引的第一頻帶中的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù),并且基于mitf來生成在頻率索引高于第二臨界頻率索引的第二頻帶中的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。進(jìn)一步地,基于itf和mitf的線性組合來生成頻率索引在第一臨界頻率索引與第二頻率索引之間的第三頻帶的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。然而,本發(fā)明不限于此,并且可以基于itf和mitf的對(duì)數(shù)組合、樣條組合和拉格朗日組合中的至少一個(gè)來生成第三頻帶的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。
根據(jù)示例性實(shí)施例,第一臨界頻率索引c1指示在500hz與1khz之間的特定頻率,并且第二臨界頻率索引c2指示在1khz與2khz之間的特定頻率。進(jìn)一步地,為了節(jié)約能量,增益g1(k)和g2(k)的平方和的值可以滿足g1(k)^2+g2(k)^2=1。然而,本發(fā)明不限于此。
同時(shí),基于itf生成的傳輸函數(shù)護(hù)額基于mitf生成的傳輸函數(shù)可以具有不同的延遲。根據(jù)本發(fā)明的示例性實(shí)施例,當(dāng)特定頻帶的同側(cè)/對(duì)側(cè)傳輸函數(shù)的延遲與不同頻帶的同側(cè)/對(duì)側(cè)傳輸函數(shù)的延遲不同時(shí),可以進(jìn)一步對(duì)相對(duì)于具有長(zhǎng)延遲的同側(cè)/對(duì)側(cè)傳輸函數(shù)具有短延遲的同側(cè)/對(duì)側(cè)傳輸函數(shù)執(zhí)行延遲補(bǔ)償。
根據(jù)本發(fā)明的另一示例性實(shí)施例,同側(cè)hrtf和對(duì)側(cè)hrtf用于第一頻帶的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù),并且基于mitf來生成第二頻帶的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)??商娲?,可以基于從各個(gè)頻帶的同側(cè)hrtf和對(duì)側(cè)hrtf的ild、itd、耳間相位差(ipd)和耳間相關(guān)性(ic)中的至少一個(gè)提取的信息來生成第一頻帶的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù),并且可以基于mitf來生成第二頻帶的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。
根據(jù)本發(fā)明的另一示例性實(shí)施例,基于球狀頭模型的同側(cè)hrtf和對(duì)側(cè)hrtf來生成第一頻帶的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù),并且基于測(cè)得的同側(cè)hrtf和對(duì)側(cè)hrtf來生成第二頻帶的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。根據(jù)示例性實(shí)施例,可以基于球狀頭模型的hrtf和測(cè)得的hrtf的線性組合、重疊、加窗等來生成在第一頻帶與第二頻帶之間的第三頻帶的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。
(9.mitf方法:混合itf2)
根據(jù)本發(fā)明的第九示例性實(shí)施例,可以使用組合有hrtf、itf和mitf中的兩個(gè)或者更多個(gè)的混合itf(hitf)。根據(jù)本發(fā)明的示例性實(shí)施例,為了提高聲相定位性能,可以強(qiáng)調(diào)特定頻帶的頻譜特性。當(dāng)使用上述itf或者mitf時(shí),減少聲音源的著色,但是導(dǎo)致也會(huì)降低聲像定位的性能的折衷現(xiàn)象。因此,為了提高聲像定位的性能,需要對(duì)同側(cè)/對(duì)側(cè)傳輸函數(shù)進(jìn)行另外的改進(jìn)。
根據(jù)本發(fā)明的示例性實(shí)施例,基于mitf(或者itf)來生成主要影響聲音源的著色的低頻帶的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù),并且基于hrtf來生成主要影響聲像定位的高頻帶的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。這將通過以下等式11來從數(shù)學(xué)上表達(dá)。
[等式11]
如果(k<c0)
h_i(k)=m_i(k)
h_c(k)=m_c(k)
否則
h_i(k)=h_i(k)
h_c(k)=h_c(k)
此處,k是頻率索引,c0是臨界頻率索引,h_i(k)和h_c(k)分別是根據(jù)本發(fā)明的示例性實(shí)施例的同側(cè)hitf和對(duì)側(cè)hitf。進(jìn)一步地,hi_i(k)和h_c(k)指示同側(cè)itf和對(duì)側(cè)itf,并且m_i(k)和m_c(k)指示根據(jù)上述示例性實(shí)施例中任何一個(gè)示例性實(shí)施例的同側(cè)mitf和對(duì)側(cè)mitf。
即,根據(jù)本發(fā)明的示例性實(shí)施例,基于mitf來生成在頻率索引低于臨界頻率索引的第一頻帶中的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù),并且基于hrtf來生成在頻率索引等于或者高于臨界頻率索引的第二頻帶中的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。根據(jù)示例性實(shí)施例,臨界頻率索引c0指示在2khz與4khz之間的特定頻率,但本發(fā)明不限于此。
根據(jù)本發(fā)明的另一示例性實(shí)施例,基于itf來生成同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù),并且可以將單獨(dú)的增益應(yīng)用至高頻帶的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。這將通過以下等式12來從數(shù)學(xué)上表達(dá)。
[等式12]
如果(k<c0)
h_i(k)=1
h_c(k)=h_c(k)/h_i(k)
否則
h_i(k)=g
h_c(k)=g*h_c(k)/h_i(k)
此處,g表示增益。即,根據(jù)本發(fā)明的另一示例性實(shí)施例,基于itf來生成在頻率索引低于臨界頻率索引的第一頻帶中的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù),并且基于通過將itf乘以預(yù)定增益g得到的值來生成在頻率索引等于或者高于臨界頻率索引的第二頻帶中的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。
根據(jù)本發(fā)明的另一示例性實(shí)施例,基于根據(jù)上述示例性實(shí)施例中任何一個(gè)示例性實(shí)施例的mitf來生成同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù),并且可以將單獨(dú)的增益應(yīng)用至高頻帶的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。這將通過以下等式13來從數(shù)學(xué)上表達(dá)。
[等式13]
如果(k<c0)
h_i(k)=m_i(k)
h_c(k)=m_c(k)
否則
h_i(k)=g*m_i(k)
h_c(k)=g*m_c(k)
即,根據(jù)本發(fā)明的另一示例性實(shí)施例,基于mitf來生成在頻率索引低于臨界頻率索引的第一頻帶中的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù),并且基于通過將mitf乘以預(yù)定增益g得到的值來生成在頻率索引等于或者高于臨界頻率索引的第二頻帶中的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。
可以根據(jù)各個(gè)示例性實(shí)施例來生成應(yīng)用至hitf的增益g。根據(jù)示例性實(shí)施例,在第二頻帶中,分別計(jì)算具有最大高度角的hrtf幅度的平均值和具有最小高度角的hrtf幅度的平均值,并且基于通過使用這兩個(gè)平均值之間的差值進(jìn)行的插值運(yùn)算來獲得增益g。在這種情況下,針對(duì)第二頻帶的各個(gè)頻率槽,應(yīng)用不同的增益,從而可以提高增益的分辨率。
同時(shí),為了防止由第一頻帶與第二頻帶之間的不連續(xù)性導(dǎo)致的失真,可以另外使用在頻率軸線處經(jīng)過平滑處理的增益。根據(jù)示例性實(shí)施例,可以在未應(yīng)用增益的第一頻帶與應(yīng)用了增益的第二頻帶之間設(shè)置第三頻帶。將平滑后的增益應(yīng)用至第三頻帶的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)??梢曰诰€性插值、對(duì)數(shù)插值、樣條插值和拉格朗日插值中的至少一種來生成平滑后的增益。由于平滑后的增益針對(duì)各個(gè)頻率槽具有不同的值,所以可以將平滑的增益表達(dá)為g(k)。
根據(jù)本發(fā)明的另一示例性實(shí)施例,可以基于從具有不同高度角的hrtf提取的包絡(luò)分量來獲得增益g。圖8是圖示應(yīng)用了根據(jù)本發(fā)明的另一示例性實(shí)施例的增益的mitf生成方法的示意圖。參照?qǐng)D8,mitf生成單元220-3包括hrtf分離單元222a和222c、仰角電平差(elevationleveldifference)(eld)計(jì)算單元223、和標(biāo)準(zhǔn)化單元224。
圖8圖示mitf生成單元220-3生成具有頻率k、高度角θ1和方位角φ的同側(cè)mitf和對(duì)側(cè)mitf的示例性實(shí)施例。首先,第一hrtf分離單元222a將具有高度角θ1和方位角φ的同側(cè)hrtf分為同側(cè)hrtf包絡(luò)分量和同側(cè)hrtf陷波分量。同時(shí),第二hrtf分離單元222c將具有不同高度角θ2的同側(cè)hrtf分為同側(cè)hrtf包絡(luò)分量和同側(cè)hrtf陷波分量。θ2是與θ1不同的高度角,并且根據(jù)示例性實(shí)施例,可以將θ2設(shè)置為0度(即,在水平面上的角度)。
eld計(jì)算單元223接收高度角θ1的同側(cè)hrtf包絡(luò)分量和高度角θ2的同側(cè)hrtf包絡(luò)分量,并且基于這些包絡(luò)分量來生成增益g。根據(jù)示例性實(shí)施例,當(dāng)根據(jù)高度角的變化頻率響應(yīng)未被顯著地改變時(shí)eld計(jì)算單元223將增益值設(shè)置為接近1,并且當(dāng)頻率響應(yīng)被顯著改變時(shí)將增益值設(shè)置為被放大或者衰減。
mitf生成單元222-3通過使用在eld計(jì)算單元223中生成的增益來生成mitf。等式14表示通過使用生成的增益來生成mitf的示例性實(shí)施例。
[等式14]
如果(k<c0)
m_i(k,θ1,φ)=h_i_notch(k,θ1,φ)
m_c(k,θ1,φ)=h_c(k,θ1,φ)/h_i_env(k,θ1,φ)
否則
m_i(k,θ1,φ)=g*h_i_notch(k,θ1,φ)
m_c(k,θ1,φ)=g*h_c(k,θ1,φ)/h_i_env(k,θ1,φ)
基于根據(jù)等式5的示例性實(shí)施例的mitf來生成在頻率索引低于臨界頻率索引的第一頻帶中的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。即,通過從同側(cè)hrtf提取的陷波分量h_i_notch(k,θ1,φ)來確定高度角為θ1且方位角為φ的同側(cè)mitfm_i(k,θ1,φ),并且通過將對(duì)側(cè)hrtfh_c(k,θ1,φ)除以從同側(cè)hrtf提取的包絡(luò)分量h_i_env(k,θ1,φ)得到的值來確定對(duì)側(cè)mitfm_c(k,θ1,φ)。
然而,基于將根據(jù)等式5的示例性實(shí)施例的mitf乘以增益g得到的值來生成在頻率索引等于或者大于臨界頻率索引的第二頻帶中的同側(cè)傳輸函數(shù)和對(duì)側(cè)傳輸函數(shù)。即,通過將從同側(cè)hrtf提取的陷波分量h_i_notch(k,θ1,φ)乘以增益g得到的值來確定m_i(k,θ1,φ),并且通過將對(duì)側(cè)hrtfh_c(k,θ1,φ)乘以增益g得到的值除以從同側(cè)hrtf提取的包絡(luò)分量h_i_env(k,θ1,φ)得到的值,來確定m_c(k,θ1,φ)。
因此,參照?qǐng)D8,將第一hrtf分離單元222a分離的同側(cè)hrtf陷波分量與增益g相乘,輸出作為同側(cè)mitf。進(jìn)一步地,標(biāo)準(zhǔn)化單元224計(jì)算與等式14中表示的同側(cè)hrtf包絡(luò)分量向相比較的對(duì)側(cè)hrtf值,并且將計(jì)算得到的值與增益g相乘,輸出作為對(duì)側(cè)mitf。在這種情況下,增益g是基于具有高度角θ1的同側(cè)hrtf包絡(luò)分量和具有不同高度角θ2的同側(cè)hrtf包絡(luò)分量而生成的值。等式15表示生成了增益g的示例性實(shí)施例。
[等式15]
g=h_i_env(k,θ2,φ)/h_i_env(k,θ1,φ)
即,可以通過將從高度角為θ1且方位角為φ的同側(cè)hrtf提取的包絡(luò)分量h_i_env(k,θ1,φ)除以從高度角為θ2且方位角為φ的同側(cè)hrtf提取的包絡(luò)分量h_i_env(k,θ2,φ)得到的值,來確定增益g。
同時(shí),在上述示例性實(shí)施例中,通過使用具有不同高度角的同側(cè)hrtf的包絡(luò)分量來生成增益g,但本發(fā)明不限于此。即,可以基于具有不同方位角的同側(cè)hrtf的包絡(luò)分量或者具有不同高度角和不同方位角的同側(cè)hrtf的包絡(luò)分量來生成增益g。進(jìn)一步地,不僅可以將增益g應(yīng)用至hitf,而且還可以應(yīng)用至itf、mitf和hrtf中的至少一種。進(jìn)一步地,不僅可以將增益g應(yīng)用至特定的頻帶,諸如,高頻帶,而且還可以應(yīng)用至所有頻帶。
將根據(jù)各個(gè)示例性實(shí)施例的同側(cè)mitf(或者同側(cè)hitf)作為同側(cè)傳輸函數(shù)傳輸至方向渲染器,并且將對(duì)側(cè)mitf(或者對(duì)側(cè)hitf)作為對(duì)側(cè)傳輸函數(shù)傳輸至方向渲染器。根據(jù)上述示例性實(shí)施例,方向渲染器的同側(cè)濾波單元利用同側(cè)mitf(或者同側(cè)hitf)對(duì)輸入音頻信號(hào)進(jìn)行濾波以生成同側(cè)輸出信號(hào),并且根據(jù)上述示例性實(shí)施例,對(duì)側(cè)濾波單元利用對(duì)側(cè)mitf(或者對(duì)側(cè)hitf)對(duì)輸入音頻信號(hào)進(jìn)行濾波以生成對(duì)側(cè)輸出信號(hào)。
在上述示例性實(shí)施例中,當(dāng)同側(cè)mitf或者對(duì)側(cè)mitf的值為1時(shí),同側(cè)濾波單元或者對(duì)側(cè)濾波單元可以對(duì)濾波操作進(jìn)行旁通處理。在這種情況下,可以在渲染時(shí)間處確定是否要對(duì)濾波進(jìn)行旁通處理。然而,根據(jù)另一示例性實(shí)施例,當(dāng)提前確定了原型傳輸函數(shù)hrtf時(shí),同側(cè)/對(duì)側(cè)濾波單元提前獲取關(guān)于旁通點(diǎn)(例如,頻率索引)的附加信息,并且基于該附加信息來確定是否要在各個(gè)點(diǎn)處對(duì)濾波進(jìn)行旁通處理。
同時(shí),在上述示例性實(shí)施例和附圖中,描述的是同側(cè)濾波單元和對(duì)側(cè)濾波單元接收相同的輸入音頻信號(hào)以接收該濾波,但是本發(fā)明不限于此。根據(jù)本發(fā)明的另一示例性實(shí)施例,接收?qǐng)?zhí)行了預(yù)處理的雙通信號(hào),作為方向渲染器的輸入。例如,接收?qǐng)?zhí)行了距離渲染作為預(yù)處理步驟的同側(cè)信號(hào)d^i和對(duì)側(cè)信號(hào)d^c,作為方向渲染器的輸入。在這種情況下,方向渲染器的同側(cè)濾波單元利用同側(cè)傳輸函數(shù)對(duì)接收的同側(cè)信號(hào)d^i進(jìn)行濾波以生成同側(cè)輸出信號(hào)b^i。進(jìn)一步地,方向渲染器的對(duì)側(cè)濾波單元利用對(duì)側(cè)傳輸函數(shù)對(duì)接收的對(duì)側(cè)信號(hào)d^c進(jìn)行濾波以生成對(duì)側(cè)輸出信號(hào)b^c。
上面已經(jīng)通過具體的實(shí)施例對(duì)本發(fā)明進(jìn)行了描述,但是,在不脫離本發(fā)明的目的和范圍的情況下,本領(lǐng)域的技術(shù)人員可以進(jìn)行修改或者改變。即,雖然本發(fā)明已經(jīng)描述了對(duì)音頻信號(hào)進(jìn)行雙耳渲染的示例性實(shí)施例,但是本發(fā)明可以被相似地應(yīng)用并且不僅可以擴(kuò)展到音頻信號(hào),而且還可以擴(kuò)展到包括視頻信號(hào)的各種多媒體信號(hào)。因此,如果本領(lǐng)域的技術(shù)人員可以容易地從本發(fā)明的詳細(xì)說明和示例性實(shí)施例推知這一點(diǎn),那么應(yīng)該將其解釋為包含在本發(fā)明的范圍內(nèi)。