本發(fā)明涉及三維音頻效果增強領(lǐng)域,尤其涉及適用于雙聲道耳機設(shè)備的個性化頭相關(guān)傳遞函數(shù)模型的建立以及利用該模型生成與使用者相匹配的個性化頭相關(guān)函數(shù)的方法。
背景技術(shù):
:隨著虛擬現(xiàn)實(VirtualReality,簡稱VR)技術(shù)的日漸發(fā)展,傳統(tǒng)的立體聲音效已經(jīng)無法滿足沉浸式聲音體驗的要求,而基于多聲道的三維音頻技術(shù)由于播放設(shè)備昂貴、部署要求復(fù)雜等原因很難進入個人使用領(lǐng)域。頭相關(guān)傳遞函數(shù)(HeadRelatedTransferFunction,簡稱HRTF)描述了聲音由特定方位傳遞入人耳的過程中經(jīng)過耳廓、軀干等人體部位反射、衍射而發(fā)生的改變。因此利用HRTF可以計算出來自不同方位的聲音傳遞到人耳時的效果,從而模擬出立體空間聲音定位的效果。頭相關(guān)脈沖響應(yīng)(HeadRelatedImpulseResponse,簡稱HRIR)是HRTF的時域表示。個性化HRTF可以顯著增強三維音頻的空間方位感,而HRTF與使用對象密切相關(guān)。目前有兩種方法獲取HRTF數(shù)據(jù):一種是通過實驗直接測量得到;另一種是通過建立人體參數(shù)模型從而計算出相關(guān)HRTF。對于實驗測量獲得HRTF數(shù)據(jù),對實驗所需設(shè)備和環(huán)境要求很高,且測量過程非常復(fù)雜,對于個體用戶難以實施。而對于建立人體參數(shù)模型通過計算得到HRTF則存在建模難度大、計算復(fù)雜、精度不高的缺點。技術(shù)實現(xiàn)要素:本發(fā)明的目的是提供通過人體測量參數(shù)信息而獲得個性化HRTF的技術(shù)方案,使得個體使用用戶能夠獲得良好的三維音頻體驗。為達到上述目的,本發(fā)明提供一種適用于雙聲道耳機設(shè)備的,基于HRIR波形分組分析的個性化HRTF生成系統(tǒng),包括:模塊1:HRIR前端時延移除模塊,模塊2:HRIR數(shù)據(jù)冗余壓縮模塊,模塊3:HRIR數(shù)據(jù)分組模塊,模塊4:人體測量參數(shù)提取模塊,模塊5:個性化HRTF算子計算模塊,模塊6:個性化HRIR生成模塊,模塊7:三維音頻生成及測試模塊,模塊8:人體測量參數(shù)微調(diào)模塊。所述模塊1:HRIR前端時延移除模塊,用于對HRTF樣本庫中提取的HRIR時域數(shù)據(jù)進行分析,計算出樣本中的雙耳間時差信息,并將HRIR樣本中由于聲波到達人耳而導(dǎo)致的時延空白數(shù)據(jù)移除。該模塊計算所得的信號輸出給HRIR數(shù)據(jù)冗余壓縮模塊——模塊2。所述模塊2:HRIR數(shù)據(jù)冗余壓縮模塊,用于對HRIR數(shù)據(jù)進行分析壓縮,以降低后期計算的復(fù)雜度。該模塊統(tǒng)計并分析出HRIR數(shù)據(jù)的后端冗余噪聲信號,對該類信號進行刪除,以達到壓縮數(shù)據(jù)量并提升計算效率的目的。該模塊計算所得的數(shù)據(jù)傳輸給HRIR數(shù)據(jù)分組模塊——模塊3。所述模塊3:HRIR數(shù)據(jù)分組模塊,用于對來自于模塊2的HRIR信號進行分組,將長信號切分為小規(guī)模的分組信號(可以將長信號切分為多個長度為8個采樣的分組信號,在實際應(yīng)用中分組的數(shù)量和每個分組的長度可根據(jù)情況進行選擇)。分組后的信號傳輸給個性化HRTF算子計算模塊——模塊5。所述模塊4:人體測量參數(shù)提取模塊,用于對HRTF樣本庫中的人體測量參數(shù)樣本進行統(tǒng)計分析,提取出同HRIR具有顯著相關(guān)性的部分人體測量參數(shù)數(shù)據(jù)(包括但不限于頭寬度、頭高度、頭深度、頸部直徑、頸部高度、肩膀?qū)挾?、胸部厚度、耳廓高度、耳廓寬度、耳廓相對于頭部中心偏移距離、耳甲腔寬度、耳甲腔高度、耳甲腔深度,耳屏間切跡寬度、外耳張角)。該模塊計算所得數(shù)據(jù)傳輸給個性化HRTF算子計算模塊——模塊5.所述模塊5:個性化HRTF算子計算模塊,用于建立模塊3和模塊4輸入數(shù)據(jù)間的映射關(guān)系。該模塊將模塊3輸入的數(shù)據(jù)按照分組信息分別與模塊4輸入的人體參數(shù)信息進行建模分析,最終得到人體測量參數(shù)數(shù)據(jù)與HRIR數(shù)據(jù)之間的計算算子。利用該算子建立的模型能夠通過任意個體的人體測量參數(shù)獲取其個性化HRIR數(shù)據(jù)。該模塊計算所得數(shù)據(jù)輸入給個性化HRIR生成模塊——模塊6。所述模塊6:個性化HRIR生成模塊,用于將模塊5所得個性化算子結(jié)合使用用戶提供的人體測量參數(shù)計算出適用于該用戶的個性化HRIR信息。該模塊計算所得數(shù)據(jù)傳輸給三維音頻生成及測試模塊——模塊7。所述模塊7:三維音頻生成及測試模塊,用于利用模塊6所得個性化HRIR信息對音頻進行三維空間模擬,通過用戶使用的主觀感受情況,可以生成適用于當(dāng)前用戶的個性化HRTF數(shù)據(jù);或者通過模塊8對人體測量參數(shù)進行修正以達到三維音頻效果的進一步改善。所述模塊8:人體測量參數(shù)微調(diào)模塊,用于對當(dāng)前用戶提供的人體測量參數(shù)進行修正。由于人體參數(shù)的測量存在誤差,該模塊提供了對人體測量參數(shù)進行修正的功能。修正后的人體測量參數(shù)再次傳輸給模塊6生成調(diào)整后的個性化HRIR信息。本發(fā)明還提供了基于HRIR波形分組分析的個性化HRTF生成方法,包括以下步驟:步驟1,對HRTF樣本庫按樣本對象依次進行HRIR波形分析,得到HRIR中代表聲波首次到達耳道對應(yīng)的波峰位置T0,之后將T0之前的HRIR信號進行刪除。步驟2,對于來源于步驟1的HRIR數(shù)據(jù),逐一進行波形分析,得到HRIR中最后波峰或波谷的位置T1,對超出T1長度的HRIR進行截斷,對長度不足的HRIR進行補0。通過步驟1和步驟2,將原始數(shù)據(jù)中的無效冗余信號刪除,以壓縮數(shù)據(jù)量和減少計算量。步驟3,對來源于步驟2的HRIR進行切割分組。按照逐樣本對象、逐聲道、逐方位的順序?qū)碓从诓襟E2的HRIR進行分組,可根據(jù)步驟2中傳輸數(shù)據(jù)長度決定分組的大小。步驟4,對待選用人體測量參數(shù)進行參數(shù)間的相關(guān)性分析,篩除過度相關(guān)的人體參數(shù),選用適當(dāng)?shù)娜梭w測量參數(shù)并提取出HRTF樣本庫中對應(yīng)的人體測量參數(shù)數(shù)據(jù)。不同的類型的人體參數(shù)具有不同的測量復(fù)雜度,而人體參數(shù)的數(shù)量又關(guān)系到生成個性化HRTF的精確度,可以根據(jù)實際需要對人體參數(shù)的選取進行調(diào)整。步驟5,對分組后的HRIR和人體測量參數(shù)進行多元線性回歸計算。根據(jù)來源于步驟3和步驟4的數(shù)據(jù),對二者的數(shù)據(jù)按照HRIR分組的順序通過多元線性回歸建立關(guān)系,從而得到各個方位對應(yīng)的個性化算子。步驟6,使用者按照步驟4中要求的人體參數(shù)提供相應(yīng)的人體測量參數(shù),通過與步驟5中獲得的個性化算子進行計算,得到適用于該使用者的各個方位的個性化HRIR數(shù)據(jù)。步驟7,將步驟6得到的個性化HRIR數(shù)據(jù)同測試音頻序列進行卷積運算,即可得到相應(yīng)方位的三維音頻效果。使用者根據(jù)主觀聽音感受可以決定是否需要對個性化參數(shù)進行調(diào)整,或者選擇保存當(dāng)前個性化信息。步驟8,對人體測量參數(shù)進行微調(diào),再次經(jīng)由步驟6生成新的個性化HRIR。經(jīng)過若干次步驟6——步驟7——步驟8的迭代,最終用戶可以得到最佳的三維音頻體驗效果。所述步驟1中的HRTF樣本庫至少包括測試人體樣本的左右耳HRIR測量數(shù)據(jù)以及包含人體樣本的包括但不限于頭寬度、頭高度、頭深度、頸部直徑、頸部高度、肩膀?qū)挾?、胸部厚度、耳廓高度、耳廓寬度、耳廓相對于頭部中心偏移距離、耳甲腔寬度、耳甲腔高度、耳甲腔深度,耳屏間切跡寬度、外耳張角的測量數(shù)據(jù)。對其中步驟1中HRTF樣本庫的原始數(shù)據(jù)進行聲波首次到達耳道前的延時移除,處理對象為針對樣本庫中所有方位的HRIR進行;該移除算法為對原始HRIR波形進行首次抵達耳道波峰分析,計算獲得首次抵達耳道的波峰位置,從而移除該波峰之前的時延數(shù)據(jù)。對其中步驟1和步驟2中進行冗余數(shù)據(jù)刪除而實現(xiàn)壓縮數(shù)據(jù)的方法,其方法為對經(jīng)過移除前端時延的HRIR進行最末波峰/波谷位置分析,刪除最末波峰/波谷位置之后的無效數(shù)據(jù)從而只保留下HRIR波形主體范圍。對其中步驟4中人體測量參數(shù)的選擇包括但不限于頭寬度、頭高度、頭深度、頸部直徑、頸部高度、肩膀?qū)挾?、胸部厚度、耳廓高度、耳廓寬度、耳廓相對于頭部中心偏移距離、耳甲腔寬度、耳甲腔高度、耳甲腔深度,耳屏間切跡寬度、外耳張角,也可以根據(jù)計算的復(fù)雜度要求選取部分人體測量參數(shù)進行計算。對其中步驟5中的計算方式,強調(diào)的是依照分組后的HRIR數(shù)據(jù),依次使用多元線性回歸分析進行相關(guān)計算。對其中步驟6中用戶提供的人體測量參數(shù),其參數(shù)的范圍應(yīng)與步驟4涉及的參數(shù)一致,其包含但不限于頭寬度、頭高度、頭深度、頸部直徑、頸部高度、肩膀?qū)挾?、胸部厚度、耳廓高度、耳廓寬度、耳廓相對于頭部中心偏移距離、耳甲腔寬度、耳甲腔高度、耳甲腔深度,耳屏間切跡寬度、外耳張角,也可以根據(jù)計算的復(fù)雜度要求選取部分人體測量參數(shù)進行計算。對其中步驟6中生成的個性化HRIR數(shù)據(jù),是按照步驟3的HRIR分組信息重新進行重組得到的完整HRIR信息,其重組過程包含按分組信息進行HRIR分組拼接、HRIR前端時延信息添加,HRIR后端冗余信息恢復(fù)。其中步驟6使用的音頻測試序列為單聲道音頻序列,測試所使用的方位信息為預(yù)先規(guī)劃的確定路線信息。附圖說明圖1是本發(fā)明實施例的系統(tǒng)結(jié)構(gòu)框圖。圖2是本發(fā)明實施例的方法流程圖。其中,1:HRIR前端時延移除模塊、2:HRIR數(shù)據(jù)冗余壓縮模塊、3:HRIR數(shù)據(jù)分組模塊、4:人體測量參數(shù)提取模塊、5:個性化HRTF算子計算模塊、6:個性化HRIR生成模塊、7:三維音頻生成及測試模塊、8:人體測量參數(shù)微調(diào)模塊。具體實施方式下面以具體實施例結(jié)合附圖對本發(fā)明的技術(shù)方案作進一步說明:參見圖1,本發(fā)明提供一種適用于雙聲道耳機設(shè)備的,基于HRIR波形分組分析的個性化HRTF生成系統(tǒng),該系統(tǒng)包括模塊1:HRIR前端時延移除模塊、模塊2:HRIR數(shù)據(jù)冗余壓縮模塊、模塊3:HRIR數(shù)據(jù)分組模塊、模塊4:人體測量參數(shù)提取模塊、模塊5:個性化HRTF算子計算模塊、模塊6:個性化HRIR生成模塊、模塊7:三維音頻生成及測試模塊、模塊8:人體測量參數(shù)微調(diào)模塊。所述模塊1:HRIR前端時延移除模塊,用于對HRTF樣本庫中提取的HRIR時域數(shù)據(jù)進行分析,計算出樣本中的雙耳間時差信息,并將HRIR樣本中由于聲波到達人耳而導(dǎo)致的時延空白數(shù)據(jù)移除。該模塊計算所得的信號傳輸給模塊2。具體實施時,在HRTF樣本庫中按樣本對象分別挑選出該對象所有空間方位的HRIR信息數(shù)據(jù),對各方位的HRIR波形進行分析,得到聲波首次到達耳道的采樣波峰位置,從而確定出HRIR的前端時延,將前端時延的信息進行刪除。所述模塊2:HRIR數(shù)據(jù)冗余壓縮模塊,用于對HRIR數(shù)據(jù)進行分析壓縮,以降低后期計算的復(fù)雜度。該模塊統(tǒng)計并分析出HRIR數(shù)據(jù)的后端冗余噪聲信號,對該類信號進行刪除,以達到壓縮數(shù)據(jù)量并提升計算效率的目的。該模塊計算所得的數(shù)據(jù)傳輸給模塊3。具體實施時,將來源于模塊1的HRIR數(shù)據(jù)按照逐對象、逐方位的順序依次進行統(tǒng)計分析,統(tǒng)計出HRIR信號的平均最末波峰位置,再綜合考慮HRIR的音頻特性選取適當(dāng)時長作為HRIR的有效時長,將其有效時長后的冗余數(shù)據(jù)進行刪除。所述模塊3:HRIR數(shù)據(jù)分組模塊,用于對來自于模塊2的HRIR信號進行分組,將長信號切分為小規(guī)模的分組信號。分組后的信號傳輸給模塊5。具體實施時,可根據(jù)HRIR有效時長選取不同的分組長度。例如將某樣本對象的某方位HRIR信號平均劃分為8個分組,則在當(dāng)前方位應(yīng)當(dāng)劃分為2×8=16個分組信息,分別對應(yīng)左右耳的HRIR原始信號,每耳對應(yīng)8個分組。所述模塊4:人體測量參數(shù)提取模塊,用于對HRTF樣本庫中的人體測量參數(shù)樣本進行統(tǒng)計分析,提取出與HRIR具有密切相關(guān)性的部分人體測量參數(shù)數(shù)據(jù)。該模塊計算所得數(shù)據(jù)輸入給模塊5。具體實施時,對HRTF樣本庫中的樣本對象進行人體測量參數(shù)相關(guān)度統(tǒng)計,挑選一定數(shù)量的人體測量參數(shù)傳輸給模塊5與HRIR分組數(shù)據(jù)進行相關(guān)計算。所述模塊5:個性化HRTF算子計算模塊,用于建立模塊3和模塊4輸入數(shù)據(jù)間的映射關(guān)系。該模塊對模塊3輸入的數(shù)據(jù)按照分組信息分別同模塊4輸入的人體參數(shù)信息進行建模分析,最終得到人體測量參數(shù)信息與HRIR數(shù)據(jù)之間的計算算子。利用該算子建立的模型能夠使用任意個體的人體測量參數(shù)計算出其個性化HRTF數(shù)據(jù)。該模塊計算所得數(shù)據(jù)傳輸給模塊6。具體實施時,將來自于模塊3的全部樣本對象的HRIR數(shù)據(jù)進行匯總,并按照區(qū)分左右聲道、區(qū)分分組類別的形式分別與來源于模塊4的樣本人體測量參數(shù)進行多元線性回歸分析,從而獲得對應(yīng)于各聲道、各方位的HRTF個性化算子。所述模塊6:個性化HRIR生成模塊,用于使用模塊5計算所得的個性化算子結(jié)合使用用戶提供的人體測量參數(shù)計算出適用于該用戶的個性化HRIR數(shù)據(jù)。該模塊計算所得數(shù)據(jù)傳輸給模塊7。具體實施時,用戶提供相應(yīng)的人體測量參數(shù),該參數(shù)通過個性化算子計算可以得到適用于當(dāng)前用戶的各方位個性化HRIR信息。所述模塊7:三維音頻生成及測試模塊,用于利用模塊6所得個性化HRIR數(shù)據(jù)對音頻進行三維空間模擬,通過用戶使用的主觀感受情況,可以生成適用于當(dāng)前用戶的個性化HRTF數(shù)據(jù);或者通過模塊8對人體測量參數(shù)進行修正以達到三維音頻效果的進一步改善。具體實施時,用戶挑選測試單聲道音頻序列,該測試序列經(jīng)過來源于模塊6的個性化HRIR處理后生成具有三維效果的音效,用戶根據(jù)自己的主觀感受,可以選擇是否需要對自己的人體參數(shù)進行微調(diào)以提升三維音效的定位效果。所述模塊8:人體測量參數(shù)微調(diào)模塊,用于對當(dāng)前用戶提供的人體測量參數(shù)進行修正。由于人體參數(shù)測量存在誤差,該模塊提供了對測量參數(shù)進行修正的功能。修正后的人體測量參數(shù)再次傳輸給模塊6,生成調(diào)整后的個性化HRIR數(shù)據(jù)。具體實施時,用戶可以對人體測量參數(shù)進行修正,不同參數(shù)的修正對生成的三維音效會產(chǎn)生不同的影響,經(jīng)過多次微調(diào)最終可達到最佳三維音效的定位效果。參見圖2,本發(fā)明實例提供的個性化HRTF生成方法可以通過計算機進行運行,具體包括以下步驟:步驟S1,對HRTF樣本庫按樣本對象依次進行HRIR波形分析,得到HRIR中代表聲波首次到達耳道時對應(yīng)的波峰位置T0,實施例中對HRIR進行振幅統(tǒng)計,得到當(dāng)前HRIR波形中的最大振幅為Fmax,之后從HRIR起始位置依次進行分析,以首次超過0.8×|Fmax|的波峰作為首次抵達耳道的波峰位置,從而確定T0,之后將T0之前的HRIR信號進行刪除,并對刪除后的HRIR末端進行補0操作,使得HRIR的整體長度保持不變。步驟S2,對于來源于S1的HRIR數(shù)據(jù),逐一進行波形分析,得到HRIR中最后波峰或波谷的位置T1,實施例中對HRIR進行振幅統(tǒng)計,得到當(dāng)前HRIR波形中的最大振幅為Fmax,之后從HRIR最終位置向前依次進行分析,以首次超過0.2×|Fmax|的振幅絕對值作為最后波峰或波谷位置,從而確定T1,移除T1后的數(shù)據(jù)。對獲得的HRIR數(shù)據(jù)進行統(tǒng)計,結(jié)合HRIR的音頻特性,確定最終保留的HRIR信號長度L,對超出長度的HRIR進行截斷,對長度不足的HRIR進行補0。實施例中采用的HRIR長度為每聲道64個采樣點。步驟S3,對來源于S2的HRIR進行切割分組。實施例中采用的分組數(shù)量為8,每聲道HRIR長度為64采樣點,即每聲道HRIR被分為8個分組。步驟S4,提取出HRTF樣本庫中的人體參數(shù)數(shù)據(jù)。實施例中提取的人體參數(shù)有15個,分別為:頭寬度、頭高度、頭深度、頸部直徑、頸部高度、肩膀?qū)挾?、胸部厚度、耳廓高度、耳廓寬度、耳廓相對于頭部中心偏移距離、耳甲腔寬度、耳甲腔高度、耳甲腔深度,耳屏間切跡寬度、外耳張角。步驟S5,對分組后的HRIR和人體測量參數(shù)進行相關(guān)度計算。實施實例中將來源于S3的數(shù)據(jù)按照區(qū)分聲道、方位的方式進行組織,每聲道每方位存在8個分組的HRIR矩陣,即每個HRIR分組為H(N×R)矩陣(N個樣本對象,每個樣本對象在當(dāng)前分組有R個采樣點數(shù)據(jù));將來源于S4的人體參數(shù)組織為A(N×M)矩陣(N個樣本對象,每樣本對象M個人體參數(shù))。之后進行多元線性回歸計算出β(M×R)矩陣使得:H^i=A·βi+Eii=1,2...8---(1)]]>其中為HRIR分組矩陣,A為人體測量參數(shù)矩陣,βi為當(dāng)前方位的個性化算子矩陣,i為當(dāng)前分組編號,E為計算所得殘差。具體多元線性回歸計算方法為現(xiàn)有技術(shù),本發(fā)明不予贅述。步驟S6,使用者提供人體參數(shù),結(jié)合S5得到的個性化算子,生成該使用者的個性化HRIR數(shù)據(jù)。實施實例中按照如下計算規(guī)則計算:H^i=A·βii=1,2...8---(2)]]>H^=H^1∪H^2∪...∪H^8---(3)]]>其中算式(2)中為HRIR分組矩陣,A為人體測量參數(shù)矩陣,βi為當(dāng)前方位的個性化算子矩陣,i為當(dāng)前分組編號。算式(3)中為將分組HRIR結(jié)果進行拼合得到的個性化HRIR結(jié)果。步驟S7,將S6得到的個性化HRIR數(shù)據(jù)同測試音頻序列進行卷積運算,即可得到相應(yīng)方位的三維音頻效果。實施實例中首先選擇一系列連續(xù)角度的(如順時針旋轉(zhuǎn)360度)HRIR數(shù)據(jù),然后對測試音頻序列按照選取HRIR方位進行分組,之后按照方位順序?qū)ο鄳?yīng)的音頻分組進行卷積運算得到順時針旋轉(zhuǎn)一周的三維音效。使用者可根據(jù)音效效果選擇保存為個性化HRTF或者通過步驟S8進行人體測量參數(shù)調(diào)整。Wi=Pi⊗H^i---(4)]]>W=∪wi(5)其中算式(4)中代表卷積運算,Pi代表測試音頻分組,代表特定方位的HRIR信息,Wi代表當(dāng)前音頻分組運算得到的三維音頻結(jié)果,i表示當(dāng)前的分組編號。算式(5)中Wi代表(4)中所得的三維音頻分組,W代表最終的三維音頻效果,i表示當(dāng)前的分組編號,運算符號∪代表將各個三維音頻分組進行拼接運算。步驟S8,由于使用者提供的人體測量參數(shù)可能存在一定的測量誤差,當(dāng)使用者在S7步驟中經(jīng)過主觀測試,認(rèn)為三維音頻效果不理想,則可以由S8步驟對人體測量參數(shù)進行微調(diào)。經(jīng)過若干次步驟S6——步驟S7——步驟S8的迭代,最終用戶可以得到最佳的三維音頻體驗效果。當(dāng)前第1頁1 2 3