本發(fā)明屬于信號處理領域,尤其涉及一種基于結構模型和主成分分析的頭相關傳遞函數的個性化方法、系統(tǒng)。
背景技術:
隨著虛擬現(xiàn)實技術的快速發(fā)展,3D音頻以其“臨場感”、“沉浸感”受到追捧。雙耳聽覺技術利用頭相關傳遞函數(Head-Related Transfer Function,HRTF)還原三維聲場。
HRTF為耳膜處的聲壓與自由空間(當沒有觀察者時,頭的中心點處)的聲壓之比,它是方向、距離、頻率的函數,它的時域表示是頭相關沖擊響應(Head-Related Impulse Response,HRIR),左右耳有各自的HRTF。雙耳聽覺技術將聲源與給定空間位置左右耳的HRIR卷積,用耳機播放給雙耳聽,得到虛擬的空間位置,從而還原三維聲場。
由于每個人的生理結構不同,HRTF也不同,為了更好的還原三維聲場,需要得到個性化的HRTF。現(xiàn)有技術中,HRTF的個性化方法主要有:
一、結構模型法。該方法將不同的生理結構用各種濾波器結構進行表示,每個生理結構單獨考慮將每個部分的貢獻用一子濾波器結構代表,所有子濾波器的組合效果代表完整的HRTF。該方法中的濾波器系統(tǒng)較多,獲得個性化HRTF時,需要調節(jié)的濾波器系統(tǒng)多;并且,該方法沒有考慮聲源與雙耳之間的距離因素,而在HRTF的個性化調節(jié)過程中,人耳的聽覺反饋是調節(jié)的依據,為了還原真實的三維聲場,有必要考慮距離因素,否則,獲得的HRTF的個性化效果較差、精確度較差。
二、主成分分析(Principal Components Analysis,PCA)法。該方法用PCA給HRTF或HRIR建模,選取標準差最大的3~5個基向量(Principal Component,PC),測試者通過調節(jié)界面不斷調整基向量系數(Principal Component Weight,PCW)來獲得較為準確的空間感。同樣地,該方法沒有考慮聲源與雙耳之間的距離因素,致使獲得的HRTF的個性化效果較差、精確度較差。
技術實現(xiàn)要素:
本發(fā)明實施例的目的在于提供一種頭相關傳遞函數的個性化方法及系統(tǒng),旨在解決現(xiàn)有技術提供的HRTF的個性化方法沒有考慮聲源與雙耳之間的距離因素,致使獲得的HRTF的個性化效果較差、精確度較差的問題。
本發(fā)明實施例是這樣實現(xiàn)的,一種頭相關傳遞函數的個性化方法,所述方法包括以下步驟:
S1:對單聲道聲源輸入信號進行與距離相關的增益濾波處理,得到與距離相關的左耳聲源輸出信號以及與距離相關的右耳聲源輸出信號;
S2:基于HRTF數據庫的測量數據,對雙耳極坐標系下的水平角進行主成分分析,以重構HRIR,并結合所述左耳聲源輸出信號和所述右耳聲源輸出信號,調整HRIR,得到個性化的HRIR;
S3:基于HRTF數據庫的測量數據,對雙耳極坐標系下的高度角進行主成分分析,以重構PRIR,并結合所述左耳聲源輸出信號和所述右耳聲源輸出信號,調整PRIR,得到個性化的PRIR。
本發(fā)明實施例的另一目的在于提供一種頭相關傳遞函數的個性化系統(tǒng),所述系統(tǒng)包括:
增益濾波模塊,用于對單聲道聲源輸入信號進行與距離相關的增益濾波處理,得到與距離相關的左耳聲源輸出信號以及與距離相關的右耳聲源輸出信號;
水平角個性化模塊,用于基于HRTF數據庫的測量數據,對雙耳極坐標系下的水平角進行主成分分析,以重構HRIR,并結合所述增益濾波模塊得到的所述左耳聲源輸出信號和所述右耳聲源輸出信號,調整HRIR,得到個性化的HRIR;
高度角個性化模塊,用于基于HRTF數據庫的測量數據,對雙耳極坐標系下的高度角進行主成分分析,以重構PRIR,并結合所述增益濾波模塊得到的所述左耳聲源輸出信號和所述右耳聲源輸出信號,調整PRIR,得到個性化的PRIR。
本發(fā)明提供的頭相關傳遞函數的個性化方法及系統(tǒng)首先建立距離模型,得到與距離相關的聲源信號,之后利用PCA分別給水平角和高度角建模,在HRTF的個性化調節(jié)過程中,利用與距離相關的聲源信號對模型參數進行個性化調節(jié),以感受到聲源的正確方位,繼而獲得個性化的HRTF,實現(xiàn)了結構化HRTF模型與PCA系數調節(jié)的結合,由于建立的距離模型考慮到了聲源與雙耳之間的距離因素,使得測量者可以感受到距離的變化,因而獲得的HRTF的個性化效果好、精確度高。
附圖說明
圖1是是雙耳極坐標系示意圖;
圖2是本發(fā)明實施例一提供的頭相關傳遞函數的個性化方法的流程圖;
圖3是本發(fā)明實施例一中,增益濾波處理步驟的詳細流程圖;
圖4是本發(fā)明實施例一中,水平角個性化步驟的詳細流程圖;
圖5是本發(fā)明實施例一中,高度角個性化步驟的詳細流程圖;
圖6是本發(fā)明實施例二中,水平角個性化步驟的詳細流程圖;
圖7是本發(fā)明實施例三提供的頭相關傳遞函數的個性化系統(tǒng)的結構圖;
圖8是本發(fā)明實施例三中,增益濾波模塊的結構圖;
圖9是本發(fā)明實施例三中,水平角個性化模塊的結構圖;
圖10是本發(fā)明實施例三中,高度角個性化模塊的結構圖;
圖11是本發(fā)明實施例四中,水平角個性化模塊的結構圖。
具體實施方式
以下結合技術方案和附圖詳細敘述本發(fā)明的具體實施方式。
為解決現(xiàn)有技術存在的問題,本發(fā)明首先建立距離模型,得到與距離相關的聲源信號,之后利用PCA分別給水平角和高度角建模,在HRTF的個性化調節(jié)過程中,利用與距離相關的聲源信號對模型參數進行個性化調節(jié),以感受到聲源的正確方位,繼而獲得個性化的HRTF。
本發(fā)明采用雙耳極坐標系來描述聲源與人體的相對位置。如圖1所示,雙耳極坐標系以雙耳連線中點作為坐標原點,定義了:水平面,即穿過原點與地面平行的平面;中垂面,即穿過原點將人體左右兩側平分的平面;前平面,即穿過原點及雙耳連線、與地面垂直將人體認為前后兩部分的平面;水平角θ,即聲源與原點連線與中垂面之間的夾角;高度角即聲源與雙耳連線所構成半平面與前半水平面之間的夾角;左耳的入射角θlinc,即原點到聲源的射線與原點到左耳的射線之間的夾角;右耳的入射角θrinc,即原點到聲源的射線與原點到右耳的射線之間的夾角;距離r,即聲源到原點的距離。在測試者的正前方,水平角θ和高度角都為0°;當水平角θ為0°時,高度角在中垂面變化,上方的為90°,后方的為180°,下方的為270°;當高度角為0°時,水平角θ在水平面變化,右耳為90°,后方為180°,左耳為270°。
以下將結合實施例詳細說明本發(fā)明的實現(xiàn)方式:
實施例一
本發(fā)明實施例一提供了一種頭相關傳遞函數的個性化方法,如圖2所示,包括以下步驟:
S1:對單聲道聲源輸入信號進行與距離相關的增益濾波處理,得到與距離相關的左耳聲源輸出信號以及與距離相關的右耳聲源輸出信號。
進一步地,如圖3所示,步驟S1包括以下步驟:
S11:計算左耳的直流增益估計值和右耳的直流增益估計值其中,左耳的直流增益估計值可表示為:
右耳的直流增益估計值可表示為:
其中,θlinc為左耳的入射角,θrinc為右耳的入射角,ρ為聲源與頭中心的距離r與頭半徑的比值,p11、p21、q11、q21分別為多項式的系數,可通過查如下表一得到:
表一
在表一中,左耳的入射角θlinc或右耳的入射角θrinc的取值范圍為0°,10°,…,180°,若實際測得的左耳的入射角θlinc或右耳的入射角θrinc的取值不在此范圍,則可對鄰近角度的計算結果進行線性插值而得到。舉例來說,若實際測得的左耳的入射角θlinc=5°,則分別計算左耳的入射角θlinc=0°和左耳的入射角θlinc=10°時的左耳的直流增益估計值之后對得到的二個值取平均值,作為左耳的入射角θlinc=5°時的左耳的直流增益估計值即可。
S12:計算左耳的一階IIR濾波器系數hlsh和右耳的一階IIR濾波器系數hrsh。
近場轉移函數Gl0(或Gr0)的幅頻響應的特點是:當左耳的入射角θlinc(或右耳的入射角θrinc)較小時,幅頻響應類似傾斜型濾波器的頻響,隨著左耳的入射角θlinc(或右耳的入射角θrinc)增加,幅頻響應逐漸呈現(xiàn)低通特性。本發(fā)明中,采用左耳的一階IIR濾波器Hlsh描述幅頻響應隨左耳的入射角θlinc的變化特性,采用右耳的一階IIR濾波器Hrsh描述幅頻響應隨右耳的入射角θrinc的變化特性。
本發(fā)明中,左耳的一階IIR濾波器系數hlsh的z域表達式為:
其中,
Hl0=Vl0-1
其中,fs為采樣頻率,為左耳的高頻增益,為左耳的截斷頻率,和可分別表示為:
其中,p12、p22、q12、q22分別為多項式的系數,可通過查如下表二得到:
表二
其中,p13、p23、p33、q13、q23分別為多項式的系數,可通過查如下表三得到:
表三
類似地,本發(fā)明中,右耳的一階IIR濾波器系數hrsh的z域表達式為:
其中,
Hr0=Vr0-1
其中,fs為采樣頻率,為右耳的高頻增益,為右耳的截斷頻率,和可分別表示為:
其中,p12、p22、q12、q22分別為多項式的系數,可通過查如上表二得到。其中,p13、p23、p33、q13、q23分別為多項式的系數,可通過查如上表三得到。
S13:計算左耳聲源輸出信號yl(t)和右耳聲源輸出信號yr(t),使得:
其中,x(t)為輸入的單聲道聲源信號,“·”表示相乘,“*”表示卷積。
S2:基于HRTF數據庫的測量數據,對雙耳極坐標系下的水平角進行主成分分析,以重構HRIR,并結合左耳聲源輸出信號和右耳聲源輸出信號,調整HRIR,得到個性化的HRIR。
其中,HRTF數據庫可以是KEMER-MIT數據庫、LISTEN數據庫、CIPIC數據庫等,為便于描述,本發(fā)明僅以CIPIC為例進行說明。CIPIC數據庫的測量對象包括43名真人和2個平均人工頭,高度角50個,從-45°變化到230.625°,水平角25個,從-80°變化到80°,一共1250個空間測量方位,每個HRIR有200個采樣數據,長度為4.5ms。特別地,CIPIC數據庫水平面有50個水平角(高度角為0°和180°各25個水平角,也即測量者的正前、正后方各25個水平角),本文設定高度角的范圍是-40°到90°,步長為10°。同時,CIPIC數據庫還收錄了被測者的頭寬、頭長等一些生理尺寸的測量結果。
進一步地,如圖4所示,步驟S2可包括以下步驟:
S201:構建Nh行、Mh列的源數據矩陣Xh。
在實施例一中,基于HRTF數據庫的測量數據,構建源數據矩陣Xh。由于每一HRIR有200個采樣數據,左耳和右耳一共是400個,故Nh=400。由于CIPIC數據庫共45個被測者,每一被測者在水平面50個角度測量HRTF,故Mh=45×50=2250。
S202:對源數據矩陣Xh去均值,得到去均值后的矩陣Bh。
具體地,步驟S202又包括以下步驟:
首先,對源數據矩陣Xh的每一行元素求均值,得到一個維度為Nh×1的列向量μh,表示為:
其中,n表示采樣點數,n=1,2,...,Nh。之后,對源數據矩陣Xh去均值,設一維度為1×Mh的行向量hh,行向量hh中的每一元素均為1,則去均值后的矩陣Bh表示為:
Bh=Xh-μhhh
S203:利用去均值后的矩陣Bh,計算協(xié)方差矩陣Ch,表示為:
其中,表示外積,“H”表示共軛轉置,得到的協(xié)方差矩陣Ch的維度為Nh×Nh。
S204:對協(xié)方差矩陣Ch進行奇異值分解,構建基向量矩陣Vh,并得到基向量系數矩陣Wh。
本發(fā)明中,對協(xié)方差矩陣Ch進行奇異值分解,與qh個最大奇異值對應的向量是Nh×1維的基向量vhi,i=1,2,...,qh,qh個基向量構成基向量矩陣Vh,表示為:
Vh=[v1,v2,…,vqh]
基向量系數矩陣Wh表示為:
Wh=VhTBh
基向量系數矩陣Wh中的維度為qh×Mh,其每一元素表示每個基向量對矩陣Bh的貢獻,矩陣Bh可以由qh個基向量的線性組合進行重構,如果qh=Nh,則可完全重構矩陣Bh,實際中qh小于Nh,仍可獲得較高的重構精度。
S205:計算重構的HRIR矩陣表示為:
重構誤差eh表示為:
其中的xhi是Xh的列向量。本發(fā)明中,qh優(yōu)選為25,則eh<5%。
S206:對每一水平角的每一基向量,計算HRTF數據庫中全部測量者的基向量系數的均值和標準差滿足:
其中,θ表示水平角,取值是0°,5°,…,45°,55°,65°,80°,100°,115°,125°,135°,140°,…,225°,235°,245°,260°,280°,295°,305°,315°,320°,…,355°,ih取值1,2,...,qh,表示第j個被測者在水平角θ第ih個基函數的主成分系數。
S207:對每一水平角,提取前5個標準差最大時對應的基向量系數的均值,并結合左耳聲源輸出信號yl(t)和右耳聲源輸出信號yr(t),對提取的基向量系數的均值進行調節(jié),以使得主觀感受到的聲源方位角最佳。
由于前5個基向量系數的均值隨水平角變化的幅度較大,標準差也較大,而其它基向量系數的均值基本無變換,標準差較小,故本發(fā)明僅調節(jié)前5個標準差最大時對應的基向量系數的均值,其它的基向量系數的均值不調節(jié)。
具體來說,結合左耳聲源輸出信號和右耳聲源輸出信號,對提取的基向量系數的均值進行調節(jié),以使得主觀感受到的聲源方位角最佳的步驟可詳述為:在每一水平角下,按照標準差從大到小的順序,順次調整5個對應的基向量系數的均值,對于每一基向量系數的均值,調節(jié)范圍為±3σ,調節(jié)步長0.2σ,首先對當前調節(jié)的基向量系數的均值增加ΔPCW,其它基向量系數的均值保持不變,比較調節(jié)前后分別合成的HRIR濾波后的聲源方位角是否變化,若無變化,則增加ΔPCW,若有變化,則減小ΔPCW,直到找到可以感受到聲源方位角變化的最小ΔPCW,完成第一輪調節(jié)。如此反復完成對5個基向量系數的均值的三輪調節(jié)。
S208:根據調整后的基向量系數構成的矩陣和對應的基向量矩陣,得到調整后的HRIR,即為得到的個性化的HRIR。具體的計算過程如前述步驟S205所述,不贅述。
S3:基于HRTF數據庫的測量數據,對雙耳極坐標系下的高度角進行主成分分析,以重構與耳廓相關沖擊響應(Pinna-Related Impulse Response,PRIR),并結合左耳聲源輸出信號和右耳聲源輸出信號,調整PRIR,得到個性化的PRIR。
進一步地,如圖5所示,步驟S3可包括以下步驟:
S300:將HRTF數據庫中中垂面上14個高度角的左耳的HRIR的初始時延去掉,并加1.5ms漢寧窗,得到PRIR。
S301:構建Nv行、Mv列的源數據矩陣Xv。
其中,由于CIPIC數據庫的HRTF的采樣頻率是44.1KHZ,加1.5ms漢寧窗后,只取1.5ms數據,故Nv=44.1×1.5=66。由于CIPIC數據庫共45個被測者,每一被測者14個高度角,故Mv=45×14=630。
S302:對源數據矩陣Xv去均值,得到去均值后的矩陣Bv。
具體地,步驟S302又包括以下步驟:
首先,對源數據矩陣Xv的每一行元素求均值,得到一個維度為Nv×1的列向量μv,表示為:
其中,n表示采樣點數,n=1,2,...,Nv。之后,對源數據矩陣Xv去均值,設一維度為1×Mv的行向量hv,行向量hv中的每一元素均為1,則去均值后的矩陣Bv表示為:
Bv=Xv-μvhv
S303:利用去均值后的矩陣Bv,計算協(xié)方差矩陣Cv,表示為:
其中,表示外積,“H”表示共軛轉置,得到的協(xié)方差矩陣Cv的維度為Nv×Nv。
S304:對協(xié)方差矩陣Cv進行奇異值分解,構建基向量矩陣Vv,并得到基向量系數矩陣Wv。
本發(fā)明中,對協(xié)方差矩陣Cv進行奇異值分解,與qv個最大奇異值對應的向量是Nv×1維的基向量vvi,i=1,2,...,qv,qv個基向量構成基向量矩陣Vv,表示為:
基向量系數矩陣Wv表示為:
Wv=VvTBv
基向量系數矩陣Wv中的維度為qv×Mv,其每一元素表示每個基向量對矩陣Bv的貢獻,矩陣Bv可以由qv個基向量的線性組合進行重構,如果qv=Nv,則可完全重構矩陣Bv,實際中qv小于Nv,仍可獲得較高的重構精度。
S305:計算重構的PRIR矩陣表示為:
重構誤差ev表示為:
其中的xvi是Xv的列向量。本發(fā)明中,qv優(yōu)選為12,則ev<5%。
S306:對每一高度角的每一基向量,計算HRTF數據庫中全部測量者的基向量系數的均值和標準差滿足:
其中,表示高度角,取值是-40°,-30°,…,90°,iv取值1,2,...,qv,表示第j個被測者在高度角第iv個基函數的主成分系數。
S307:對每一高度角,提取前5個標準差最大時對應的基向量系數的均值,并結合左耳聲源輸出信號yl(t)和右耳聲源輸出信號yr(t),對提取的基向量系數的均值進行調節(jié),以使得主觀感受到的聲源方位角最佳。
類似地,結合左耳聲源輸出信號和右耳聲源輸出信號,對提取的基向量系數的均值進行調節(jié),以使得主觀感受到的聲源方位角最佳的步驟可詳述為:在每一高度角下,按照標準差從大到小的順序,順次調整5個對應的基向量系數的均值,對于每一基向量系數的均值,調節(jié)范圍為±3σ,調節(jié)步長0.2σ,首先對當前調節(jié)的基向量系數的均值增加ΔPCW,其它基向量系數的均值保持不變,比較調節(jié)前后分別合成的PRIR濾波后的聲源方位角是否變化,若無變化,則增加ΔPCW,若有變化,則減小ΔPCW,直到找到可以感受到聲源方位角變化的最小ΔPCW,完成第一輪調節(jié)。如此反復完成對5個基向量系數的均值的三輪調節(jié)。
S308:根據調整后的基向量系數構成的矩陣和對應的基向量矩陣,得到調整后的PRIR,即為得到的個性化的PRIR。具體的計算過程如前述步驟S305所述,不贅述。
實施例二
本發(fā)明實施例二提供了一種頭相關傳遞函數的個性化方法。與實施例一不同,為了改善水平角定位,進一步優(yōu)化個性化效果,如圖6所示,在步驟S201之前,還可包括以下步驟:
S200:對HRTF數據庫中每個測量者在每一水平角下的左耳HRIR和右耳HRIR去除初始時延,之后將每一HRIR末尾補零至200個采樣點。
此時,在步驟S208之后,還包括以下步驟:
S209:調節(jié)HRTF數據庫中每一HRIR的初始時延,當測量者感受不到水平角變化時,將此時的時延值加到調整后的對應的HRIR上。
其中,初始時延的調節(jié)初始值為聲源到全部測量者左右耳的時延平均值,表示為:
其中,為高度角,為第j個測量者在高度角的時延。調節(jié)的范圍為±3倍標準差,標準差滿足:
實施例二的其它方法步驟描述與實施例一相同,不贅述。以下以一主觀聽覺實驗說明經實施例二個性化后的HRTF的定位效果:
假設4個測量者(包括2男性、2女性)分別用CIPIC數據庫的平均人工頭(subject_165)的HRTF和經實施例二個性化得到的HRTF進行方位角定位實驗,用個性化的HRTF進行距離定位實驗,實驗設置如下:
距離定位實驗,θ=90°,距離為20cm,40cm,75cm,130cm;
水平角定位實驗,距離為50cm,θ=0°,30°,…,330°;
高度角定位實驗,距離為50cm,θ=0°,0°,…,90°。
每組實驗重復5次,隨機打亂順序,4個測量者分別完成20組距離定位實驗,60組水平角定位實驗,25組高度角定位實驗。實驗在一臺筆記本電腦上進行,用一小段語音做聲源,所用耳機為森海塞爾HD201。實驗前,測量者分別試聽兩個HRTF數據庫在上述給定方位的聲音,對距離,水平角,高度角有感知。
實驗結果如下表四所示:
表四
由表四可見,距離定位實驗的平均準確率為80%。使用subject_165的HRTF,四個測量者的水平角平均定位準確度為35%,包含前后混淆的定位準確度為52%。經過個性化調節(jié),定位準確度提高了12.5%,前后混淆誤差減小。經過個性化調節(jié),高度角平均定位準確度提高了14%。
實施例三
本發(fā)明實施例三提供了一種頭相關傳遞函數的個性化系統(tǒng)。如圖7所示,包括:增益濾波模塊1,用于對單聲道聲源輸入信號進行與距離相關的增益濾波處理,得到與距離相關的左耳聲源輸出信號以及與距離相關的右耳聲源輸出信號;水平角個性化模塊2,用于基于HRTF數據庫的測量數據,對雙耳極坐標系下的水平角進行主成分分析,以重構HRIR,并結合增益濾波模塊1得到的左耳聲源輸出信號和右耳聲源輸出信號,調整HRIR,得到個性化的HRIR;高度角個性化模塊3,用于基于HRTF數據庫的測量數據,對雙耳極坐標系下的高度角進行主成分分析,以重構PRIR,并結合增益濾波模塊1得到的左耳聲源輸出信號和右耳聲源輸出信號,調整PRIR,得到個性化的PRIR。
進一步地,如圖8所示,增益濾波模塊1可包括:第一計算子模塊11,用于計算左耳的直流增益估計值和右耳的直流增益估計值其計算公式如實施例一所述,不贅述;第二計算子模塊12,用于計算左耳的一階IIR濾波器系數hlsh和右耳的一階IIR濾波器系數hrsh,其計算公式如實施例一所述,不贅述;第三計算子模塊13,用于計算左耳聲源輸出信號yl(t)和右耳聲源輸出信號yr(t),其計算公式如實施例一所述,不贅述。
進一步地,如圖9所示,水平角個性化模塊2可包括:第一矩陣構建子模塊201,用于構建Nh行、Mh列的源數據矩陣Xh,對源數據矩陣Xh的描述如實施例一所述,不贅述;第一去均值子模塊202,用于對源數據矩陣Xh去均值,得到去均值后的矩陣Bh,該執(zhí)行過程如實施例一中的步驟S202所述,不贅述;第四計算子模塊203,用于利用去均值后的矩陣Bh,計算協(xié)方差矩陣Ch,計算公式如實施例一所述,不贅述;第二矩陣構建子模塊204,用于對協(xié)方差矩陣Ch進行奇異值分解,構建基向量矩陣Vh,并得到基向量系數矩陣Wh,計算公式如實施例一所述,不贅述;第五計算子模塊205,用于計算重構的HRIR矩陣計算公式如實施例一所述,不贅述;第六計算子模塊206,用于對每一水平角的每一基向量,計算HRTF數據庫中全部測量者的基向量系數的均值和標準差計算公式如實施例一所述,不贅述;第一調節(jié)子模塊207,用于對每一水平角,提取前5個標準差最大時對應的基向量系數的均值,并結合左耳聲源輸出信號yl(t)和右耳聲源輸出信號yr(t),對提取的基向量系數的均值進行調節(jié),以使得主觀感受到的聲源方位角最佳,具體的調節(jié)過程如實施例一中的步驟S207所述,不贅述;第一調整子模塊208,用于根據調整后的基向量系數構成的矩陣和對應的基向量矩陣,得到調整后的HRIR,即為得到的個性化的HRIR。具體的計算過程如前述步驟S205所述,不贅述。
進一步地,如圖10所示,高度角個性化模塊3可包括:PRIR獲取子模塊300,用于將HRTF數據庫中中垂面上14個高度角的左耳的HRIR的初始時延去掉,并加1.5ms漢寧窗,得到PRIR;第三矩陣構建子模塊301,用于構建Nv行、Mv列的源數據矩陣Xv,對源數據矩陣Xv的描述如實施例一所述,不贅述;第二去均值子模塊302,用于對源數據矩陣Xv去均值,得到去均值后的矩陣Bv,其執(zhí)行過程如實施例一所述,不贅述;第七計算子模塊303,用于利用去均值后的矩陣Bv,計算協(xié)方差矩陣Cv,計算公式如實施例一所述,不贅述;第四矩陣構建子模塊304,用于對協(xié)方差矩陣Cv進行奇異值分解,構建基向量矩陣Vv,并得到基向量系數矩陣Wv,計算公式如實施例一所述,不贅述;第八計算子模塊305,用于計算重構的PRIR矩陣計算公式如實施例一所述,不贅述;第九計算子模塊306,用于對每一高度角的每一基向量,計算HRTF數據庫中全部測量者的基向量系數的均值和標準差計算公式如實施例一所述,不贅述;第二調節(jié)子模塊307,用于對每一高度角,提取前5個標準差最大時對應的基向量系數的均值,并結合左耳聲源輸出信號yl(t)和右耳聲源輸出信號yr(t),對提取的基向量系數的均值進行調節(jié),以使得主觀感受到的聲源方位角最佳,具體的調節(jié)過程如實施例一中的步驟S307所述,不贅述;第二調整子模塊308,用于根據調整后的基向量系數構成的矩陣和對應的基向量矩陣,得到調整后的PRIR,即為得到的個性化的PRIR。具體的計算過程如前述步驟S305所述,不贅述。
實施例四
本發(fā)明實施例四提供了一種頭相關傳遞函數的個性化系統(tǒng)。與實施例三不同,為了改善水平角定位,進一步優(yōu)化個性化效果,如圖11所示,水平角個性化模塊2還包括:去時延子模塊200,用于對HRTF數據庫中每個測量者在每一水平角下的左耳HRIR和右耳HRIR去除初始時延,之后將每一HRIR末尾補零至200個采樣點,之后由第一矩陣構建子模塊201根據去時延子模塊200的執(zhí)行結果繼續(xù)執(zhí)行;初始時延調節(jié)及附加子模塊209,用于在第一調整子模塊208執(zhí)行完畢后,調節(jié)HRTF數據庫中每一HRIR的初始時延,當測量者感受不到水平角變化時,將此時的時延值加到調整后的對應的HRIR上,對初始時延的調節(jié)過程如實施例二所述,不贅述。
實施例四的其它系統(tǒng)結構與實施例三相同,不贅述。
綜上所述,本發(fā)明提供的頭相關傳遞函數的個性化方法及系統(tǒng)首先建立距離模型,得到與距離相關的聲源信號,之后利用PCA分別給水平角和高度角建模,在HRTF的個性化調節(jié)過程中,利用與距離相關的聲源信號對模型參數進行個性化調節(jié),以感受到聲源的正確方位,繼而獲得個性化的HRTF,實現(xiàn)了結構化HRTF模型與PCA系數調節(jié)的結合,由于建立的距離模型考慮到了聲源與雙耳之間的距離因素,使得測量者可以感受到距離的變化,因而獲得的HRTF的個性化效果好、精確度高。再有,距離模型、水平角個性化調節(jié)模型與高度角個性化調節(jié)模塊采用級聯(lián)方式,簡化了HRTF的個性化過程,執(zhí)行效率高。再有,對于每一水平角或高度角,只需調節(jié)5個主成分系數即可,調節(jié)的系數少。最后,在水平角個性化調節(jié)中,在調節(jié)前,將HRTF數據庫中的HRIR的初始時延去掉,并在HRIR調節(jié)后,調節(jié)初始時延以改變聲源到左右耳的時延之差,之后將調節(jié)后的初始時延附加到所得到的HRIR上,從而改善了水平角定位,進一步優(yōu)化了個性化效果。
以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內所作的任何修改、等同替換和改進等,均應包含在本發(fā)明的保護范圍之內。