專(zhuān)利名稱(chēng):一種針對(duì)耳機(jī)音響系統(tǒng)的人腦音頻變換函數(shù)(hrtf)的生成方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種能夠?qū)㈦p聲道音頻聲源擴(kuò)展為針對(duì)耳機(jī)音響系統(tǒng)的 HRTF生成的方法和設(shè)備,尤其涉及能夠增強(qiáng)手持終端音效的方法和設(shè)備。
根據(jù)本發(fā)明實(shí)例,三維環(huán)繞音效技術(shù)提供了一種雙聲道音頻再建系統(tǒng), 只需提供一個(gè)人腦音頻變換函數(shù)(HRTF),就能夠改變這些重建虛擬聲源的 聽(tīng)覺(jué)位置。針對(duì)耳機(jī)音響系統(tǒng)的HRTF生成技術(shù)的工作原理基于以下兩項(xiàng)發(fā) 現(xiàn)(1) HRTF可以用一個(gè)線性濾波器系統(tǒng)進(jìn)行描述;(2)該線性系統(tǒng)由三 個(gè)參數(shù)決定聲源方位,聲源高度和音頻采樣率。本發(fā)明針對(duì)雙聲道耳機(jī)聲 音空間化的HRTF生成技術(shù)通過(guò)使用三維雙聲道耳機(jī)音頻系統(tǒng)模型來(lái)獲得更 高精確度的技術(shù)。
原則上講,本發(fā)明方法和設(shè)備所提供冊(cè)TF生成引擎可用于多種不同類(lèi) 型的電子設(shè)備,如手機(jī),PDA, MP3/MP4播放器等。
背景技術(shù):
本發(fā)明致力于尋求通過(guò)線性系統(tǒng)設(shè)計(jì)生成HRTF的有效方法,意在解決 計(jì)算復(fù)雜性和服TF設(shè)計(jì)及實(shí)施中的不夠精確的相關(guān)問(wèn)題。
傳統(tǒng)方法將服TF作為由一對(duì)參數(shù)(聲源方位,聲源高度)決定的線性 濾波系統(tǒng)進(jìn)行模擬。通過(guò)使用KEMAR仿真人腦測(cè)量。這種測(cè)量在全封閉環(huán)境中進(jìn)行,其中,擴(kuò)音器播放測(cè)試信號(hào),從不同方向靠近頭部。測(cè)量結(jié)果為一
組FIR濾波器系數(shù),可用來(lái)處理雙聲道音頻信號(hào)來(lái)生成三維空間音頻。此模 型不能準(zhǔn)確描述HRTF系統(tǒng),由于以下兩個(gè)原因(1)該模型不考慮音頻采 樣率;(2)該模型測(cè)量一些特殊的方向,但并沒(méi)有指出如何獲得一個(gè)針對(duì)上 述參數(shù)對(duì)(聲源方位,聲源高度)任意值的服TF濾波器的參數(shù)值。
更具體地說(shuō),空間環(huán)響要求一個(gè)延遲時(shí)間,這個(gè)參數(shù)由緩沖的采樣數(shù)進(jìn) 行模擬。對(duì)于一個(gè)固定延遲時(shí)間,緩沖器大小應(yīng)該根據(jù)采樣率改變。在由經(jīng) 測(cè)量確定濾波器系數(shù)的過(guò)程中,不可能取對(duì)任意參數(shù)組(聲源方位,聲源高 度,采樣率)的值進(jìn)行測(cè)量。顯然該參數(shù)組的所有可能值都可以在現(xiàn)實(shí)世界 中出現(xiàn)。因此,需要從已測(cè)定的濾波器系數(shù)來(lái)確定所有可能的濾波器系數(shù)。
若一種服TF生成方法或設(shè)備是實(shí)用的,它應(yīng)該具備(l)簡(jiǎn)單因?yàn)樵?方法要用于消費(fèi)電子設(shè)備上,如手機(jī)、PDA等;(2)準(zhǔn)確因?yàn)樵摲椒ū仨?要逼真地重建真實(shí)的人腦聽(tīng)覺(jué)系統(tǒng)。本發(fā)明實(shí)例可以達(dá)到上述兩個(gè)目標(biāo)。
發(fā)明內(nèi)容
本發(fā)明的第一目標(biāo)是提供一種針對(duì)雙聲道耳機(jī)能模擬人腦聽(tīng)覺(jué)系統(tǒng)的 HRTF建立方法和設(shè)備。
本發(fā)明的第二目標(biāo)是提供一種適用于任何消費(fèi)電子設(shè)備,如手機(jī)、PDA 等,并且能針對(duì)雙聲道耳機(jī)有效重建空間環(huán)響音效的服TF建立方法和設(shè)備。
本發(fā)明的第三目標(biāo)是在不需要大量系統(tǒng)資源的條件下,包括CPU和存儲(chǔ) 器,能夠針對(duì)雙聲道耳機(jī)提供一種準(zhǔn)確的空間環(huán)繞音效環(huán)境的HRTF建立方 法和設(shè)備。根據(jù)本發(fā)明實(shí)例原則,通過(guò)提供HRTF建立引擎,以其最寬的涵蓋形式, 基于已發(fā)現(xiàn)的人腦聽(tīng)覺(jué)系統(tǒng)的事實(shí),來(lái)確定HRTF濾波器系數(shù),以實(shí)現(xiàn)上述 目標(biāo)。
本發(fā)明實(shí)例對(duì)來(lái)自給定方向的平面波使用線性濾波器。為了更好地測(cè)量 濾波屬性,進(jìn)行了大量試驗(yàn)以獲得精確數(shù)據(jù)。線性濾波器的脈沖響應(yīng)通過(guò)不 同的聲音方向和聲音采樣率來(lái)決定。
本發(fā)明針對(duì)雙聲道耳機(jī)的服TF生成技術(shù)能高度準(zhǔn)確地模擬三維環(huán)繞環(huán) 境是因?yàn)?,本方法在建立人腦聽(tīng)覺(jué)系統(tǒng)主觀感知的模型時(shí),考慮到了以下三 個(gè)因素(1) HRTF能通過(guò)一個(gè)線性濾波器系統(tǒng)進(jìn)行描述;(2)該線性系統(tǒng) 由參數(shù)組決定聲源方位,聲源高度和音頻采樣率;(3)針對(duì)該參數(shù)組任何 取值的HRTF濾波器能通過(guò)插值與抽取技術(shù)從現(xiàn)有的HRTF濾波器獲得。
由于本發(fā)明應(yīng)用PCM音頻信號(hào),故可對(duì)任何音頻和語(yǔ)音編解碼標(biāo)準(zhǔn)進(jìn) 行后處理,以提供三維環(huán)繞音效。
圖l HRTF所描述的人腦聽(tīng)覺(jué)系統(tǒng)模糊椎體示意圖; 圖2本發(fā)明服TF濾波器生成的流程圖。
具體實(shí)施例方式
如圖2所示,本發(fā)明是通過(guò)HRTF建立引擎實(shí)現(xiàn)的,適用于任何消費(fèi)電 子設(shè)備。HRTF引擎200由對(duì)參數(shù)組(聲源方位,聲源高度,采樣率)特定 取值點(diǎn)測(cè)量所得m^TF濾波器數(shù)據(jù)庫(kù)210,指定音頻采樣率插值器220,指定 聲源方位插值器230,以及指定聲源高度插值器240組成。音頻采樣率插值器220在服TF濾波器數(shù)據(jù)庫(kù)210中選擇與指定參數(shù)組(聲源方位,聲源高 度,采樣率)取值最接近的四組HRTF濾波器,并使用插值和抽取技術(shù)生成 與指定采樣率相同的四組ffi^TF濾波器;聲源方位插值器230使用220的輸 出使用插值技術(shù)生成與指定聲源方位相同的兩組HRTF濾波器;最后,聲源 高度插值器240使用230的輸出使用插值技術(shù)生成與指定聲源高度相同的一 組服TF濾波器。不同于傳統(tǒng)的服TF生成技術(shù),本發(fā)明可對(duì)參數(shù)組(聲源方 位,聲源高度,采樣率)的任意取值生成其所對(duì)應(yīng)的HRTF濾波器,且所生 成的冊(cè)TF濾波器能更好地反映了人腦聽(tīng)覺(jué)系統(tǒng)的主觀感受。
為了了解本發(fā)明HRTF生成技術(shù),有必要先了解一些基于服TF的三維耳 機(jī)環(huán)繞音效的一些基本原理,即如何對(duì)雙聲道信號(hào)的兩個(gè)輸入音頻流實(shí)施處 理。當(dāng)多個(gè)聲源在傳播相關(guān)的或部分相關(guān)的信號(hào)時(shí),有差異的、有時(shí)甚至是 互相干擾的聲源就會(huì)混疊,尤其是當(dāng)聽(tīng)者聽(tīng)到的不同聲源信號(hào)僅有微小振幅 差異和微小時(shí)間差異時(shí)。這種情況下,不同的聲源會(huì)合成為一個(gè)單音,這個(gè) 單音的位置與源聲源的實(shí)際位置會(huì)有很大不同。當(dāng)傳入的聲源差異較大時(shí), 虛擬的聲源鏡像會(huì)混入其中的一個(gè)真實(shí)聲源中,心理聲學(xué)試驗(yàn)顯示,當(dāng)受到 簡(jiǎn)單正弦波的刺激,聽(tīng)覺(jué)系統(tǒng)會(huì)使用兩個(gè)聲源參數(shù)來(lái)估算聲源的方向。艮P: 耳間強(qiáng)度和時(shí)間差異(IID和ITD)共同作用來(lái)達(dá)到該目的。然而,IID和 ITD只能部分地解釋區(qū)別不同空間方向的能力。實(shí)際上,如果聲源沿環(huán)形橫 向運(yùn)動(dòng),如圖3所示,IID和ITD就不會(huì)改變。由頭中部環(huán)形組成的椎體被 稱(chēng)為"模糊錐體"。模糊椎體內(nèi)橫向及縱向的區(qū)別可用頭相關(guān)傳遞函數(shù)(HRTF) 來(lái)描述。HRTF實(shí)際是自給定方向平面波的線性濾波器。該濾波器的幅度和 相位響應(yīng)是很復(fù)雜的,并由聲源的方向和高度決定。由簡(jiǎn)化的服TF模型來(lái)描述相關(guān)的不同方向的聲源是可能的。即使這些
聲源被簡(jiǎn)化了,當(dāng)它們動(dòng)態(tài)地改變時(shí),它們可以提供很強(qiáng)的定位效果。在現(xiàn) 實(shí)生活中,聽(tīng)者在聽(tīng)到一個(gè)聲源時(shí)從來(lái)不會(huì)是靜態(tài)的。甚至是很小的頭部動(dòng) 作也可以對(duì)區(qū)別可能的模糊聲源提供很大的幫助,例如位于聽(tīng)者不能確定聲
源在其正前方或正后方。因此,幾個(gè)虛擬聲源參數(shù),如ITD, IID及HRTFs 足以提供一個(gè)很強(qiáng)的方向效果,只要這些聲源與聽(tīng)者的頭部動(dòng)作有關(guān)。服TF 是針對(duì)雙聲道耳機(jī)建立三維環(huán)響音效的重要模型。
傳統(tǒng)的服TF建立技術(shù)只為(聲源方位,聲源高度,音頻采樣率)參數(shù) 組一些特殊的值提供HRTF濾波器系數(shù)。在現(xiàn)實(shí)生活中,聲音可以來(lái)自任意 方向,以任意速度和任意采樣率。因此,傳統(tǒng)的HRTF建立技術(shù)不能提供一 個(gè)精確的模型來(lái)建立聲音環(huán)響音效。
好的HRTF建立技術(shù)應(yīng)該準(zhǔn)確有效地反映人體聽(tīng)覺(jué)系統(tǒng)的"模糊椎體"。 本發(fā)明HRTF生成技術(shù)通過(guò)下列步驟來(lái)實(shí)現(xiàn)設(shè)計(jì)目標(biāo)(1)通過(guò)一些特定參 數(shù)組值(聲源方位,聲源高度和音頻采樣率)獲得一組HRTF濾波器;(2) 針對(duì)步驟1中未指定的所有參數(shù)組值插補(bǔ)HRTF濾波器系數(shù)。
業(yè)內(nèi)人士應(yīng)該可以看出,發(fā)明HRTF生成技術(shù)的首要目的是有效建立一 個(gè)線性濾波系統(tǒng),基于位置參數(shù)組(聲源方位,聲源高度)決定的當(dāng)前聲音 位置。由于整個(gè)方法的設(shè)計(jì)都基于人體聽(tīng)覺(jué)系統(tǒng)的主觀感覺(jué)以及人體聽(tīng)覺(jué)系 統(tǒng)的精確建模,故本發(fā)明HRTF生成技術(shù)能夠針對(duì)雙聲道耳機(jī)系統(tǒng)生動(dòng)再建 真實(shí)的三維環(huán)繞音效場(chǎng)景。
由于本發(fā)明的服TF生成實(shí)例不需要專(zhuān)門(mén)的硬件支持,只通過(guò)軟件即可 實(shí)現(xiàn)其功能,但不排除專(zhuān)門(mén)的硬件實(shí)現(xiàn)方式,因此該技術(shù)可容易地應(yīng)用于任何類(lèi)型的消費(fèi)電子產(chǎn)品上,如手機(jī),PDA等。此外,本發(fā)明可用于任何音頻 和語(yǔ)音編解碼系統(tǒng),如AAC, AAC+, MP3, WMA, RA, AMR等。
前面已經(jīng)十分詳細(xì)地描述了本發(fā)明所提請(qǐng)的技術(shù),使業(yè)內(nèi)人士能夠了解 和使用本發(fā)明,但是,還要提請(qǐng)注意的是,在不偏離本發(fā)明實(shí)質(zhì)的前提下, 還可以對(duì)所提請(qǐng)的技術(shù)發(fā)明進(jìn)行變更和改進(jìn),并且本發(fā)明不受以上說(shuō)明或附 圖的限制,而是按照所附權(quán)利要求來(lái)予以限定。
權(quán)利要求
1. 針對(duì)雙聲道耳機(jī)音響系統(tǒng)的人腦音頻變換函數(shù)HRTF生成方法包括以下步驟a. 根據(jù)位置參數(shù)組(聲源方位,聲源高度)和聲音采樣率測(cè)量并收集一系列HRTF濾波器系數(shù);b. 針對(duì)步驟a中不存在的位置參數(shù)組(聲源方位,聲源高度)的任意值,使用線性插值技術(shù),從步驟a中指定的現(xiàn)有濾波器獲得該位置參數(shù)組濾波器系數(shù);c. 針對(duì)步驟a中不存在的音頻采樣率參數(shù)的任意值,使用插值和抽取技術(shù),從步驟a中指定的現(xiàn)有濾波器獲得該采樣率參數(shù)的濾波器系數(shù)。
2. 如權(quán)利要求1所述的方法,其中步驟b執(zhí)行線性插值,分為兩個(gè)步驟(1)對(duì)一個(gè)參數(shù)應(yīng)用線性插值;(2)然后對(duì)步驟(1)的輸出對(duì)另一個(gè)參數(shù)應(yīng)用線性插值。
3. 如權(quán)利要求1所述的方法,其中步驟c執(zhí)行插值和抽取技術(shù),分為兩個(gè)步驟(1)針對(duì)(聲源方位,聲源高度)參數(shù)組值最相近的四組己有濾波器系數(shù)的現(xiàn)有聲音采樣率參數(shù)值應(yīng)用插值或抽取技術(shù),獲得有相同的采樣率的上述四種濾波器;(2)然后對(duì)步驟(1)的輸出應(yīng)用線性插值,獲得(聲源方位,聲源高度,音頻采樣率)參數(shù)組指定值的濾波系數(shù)。
4. 針對(duì)雙聲道耳機(jī)音響系統(tǒng)的人腦音頻變換函數(shù)HRTF生成裝置包括以下單元a.根據(jù)(聲源方位,聲源高度)位置參數(shù)組和聲音采樣率,測(cè)量并收集一系列HRTF濾波器系數(shù);b. 針對(duì)單元a中不存在的位置參數(shù)組(聲源方位,聲源高度)的任意值,使用線性插值技術(shù),從步驟a中指定的現(xiàn)有濾波器獲得該位置參數(shù)組濾波器系數(shù);c. 針對(duì)單元a中不存在的音頻采樣率參數(shù)的任意值,使用插值和抽取技術(shù),從單元a中指定的現(xiàn)有濾波器獲得該采樣率參數(shù)的濾波器系數(shù)。
5. 如權(quán)利要求4所述設(shè)備,單元b執(zhí)行線性插值,分兩個(gè)單元(1)對(duì)一個(gè)參數(shù)應(yīng)用線性插值;(2)然后對(duì)單元(1)的輸出對(duì)另一個(gè)參數(shù)應(yīng)用線性插值。
6. 如權(quán)利要求4所述設(shè)備,其中單元c執(zhí)行插值和抽取技術(shù),分為兩個(gè)單元(1)針對(duì)(聲源方位,聲源高度)參數(shù)組值最相近的四組已有濾波器系數(shù)的現(xiàn)有聲音采樣率參數(shù)值應(yīng)用插值或抽取技術(shù),獲得有相同的采樣率的上述四種濾波器;(2)然后對(duì)單元(1)的輸出應(yīng)用線性插值,獲得(聲源方位,聲源高度,音頻采樣率)參數(shù)組指定值的濾波系數(shù)。
全文摘要
一種針對(duì)耳機(jī)音響系統(tǒng)的人腦音頻變換函數(shù)(HRTF)的生成方法和設(shè)備,能夠使雙聲道的音頻信號(hào)擴(kuò)展為多聲道三維環(huán)繞的音頻信號(hào)。本發(fā)明HRTF生成技術(shù)依據(jù)人體聽(tīng)覺(jué)的主觀感知原理建立了一個(gè)新模型。虛擬聲音位置主要通過(guò)“模糊椎體”進(jìn)行反映,“模糊椎體”由頭中部環(huán)形組成,可以用HRTF(Head-Related Transfer Function,人腦音頻變換函數(shù))進(jìn)行描述。本發(fā)明實(shí)例通過(guò)對(duì)參數(shù)組(聲源方位,聲源高度和音頻采樣率)在不連續(xù)域測(cè)量一組濾波器系數(shù),并使用線性插值技術(shù)從現(xiàn)有濾波器獲得任意參數(shù)組的濾波器系數(shù)。本發(fā)明所設(shè)計(jì)的針對(duì)雙聲道耳機(jī)音頻系統(tǒng)的HRTF生成技術(shù)既便于實(shí)施又能高效重建雙聲道音響的三維環(huán)繞效果。
文檔編號(hào)H04R5/033GK101483797SQ20081005568
公開(kāi)日2009年7月15日 申請(qǐng)日期2008年1月7日 優(yōu)先權(quán)日2008年1月7日
發(fā)明者佳 嚴(yán), 洪浩洋, 高成偉 申請(qǐng)人:昊迪移通(北京)技術(shù)有限公司;高成偉