專利名稱:雙耳聲強差ild臨界感知特性的測量方法及其裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種雙耳聲強差臨界感知特性的測量方法及其裝置,更具體 地,涉及空間音頻編碼中提取的雙耳聲強差參數(shù)的臨界感知特性的測量方法及 其裝置。
背景技術(shù):
在空間音頻編碼技術(shù)里,空間參數(shù)表達(dá)了多聲道(含立體聲)音頻中蘊涵 的空間信息。雙耳聲強差(Interaural Level Difference,以下簡稱ILD)是眾多 空間參數(shù)中較為重要的一個,它表達(dá)了聲道間強度差對聲源方向定位的影響。 簡單說來,如果左耳感受到的聲音強度比右耳的大,那么聽音人會覺得聲音來 自左側(cè)方向,反之亦然。雙耳聲強差是聽覺系統(tǒng)辨別聲源方位的重要依據(jù)之一。當(dāng)前空間心理聲學(xué)研究表明,人耳對ILD的感知存在著掩蔽效應(yīng)。也就是 說,當(dāng)ILD值變化到一個臨界范圍之內(nèi)時,人耳已經(jīng)不能感知到聲源方向的變 化。該臨界值稱為ILD臨界感知閾值(Just noticeable difference,以下簡稱JND), 它描述了人耳恰可感知的ILD的臨界值,也稱為ILD絕對閾值。在絕對閾值 之下的ILD值不能被人耳感知到,這種現(xiàn)象稱為絕對掩蔽。人的聽覺系統(tǒng)對于 不同操作單元上的ILD存在著感知差異,也就是說在不同頻率下,ILD絕對閾 值是有差異的。然而當(dāng)前對空間音頻參數(shù)ILD的研究并沒有對其臨界感知特性在全頻帶 進(jìn)行分析,也就是說,對ILD參數(shù)在不同頻率和不同響度下表現(xiàn)出的感知特性 差異也還沒有定量的描述。在現(xiàn)有的空間音頻編碼中,對ILD的處理方法包括兩類 一類是在整個信號頻率范圍內(nèi)對各操作單元(如各個劃分的子帶)的ILD 都進(jìn)行編碼;另一類是為降低編碼的參數(shù)碼率,忽略ILD對編碼音質(zhì)的影響而 不對其進(jìn)行編碼。這兩類的處理方法,要么忽略了 ILD在不同操作單元具有的 感知差異,浪費了參數(shù)編碼碼率,要么以編碼音質(zhì)的下降為代價而不處理雙耳 對強度差異的感知信息,從而使得編碼信號中存在大量無法去除的主觀冗余信 息,降低編碼壓縮效率。
發(fā)明內(nèi)容
本發(fā)明依據(jù)人耳的聽覺特性,提出一種分頻帶測量ILD臨界感知特性的方 法及其裝置,目的在于指導(dǎo)空間音頻編碼,有效去除當(dāng)前空間參數(shù)主觀冗余難 以去除的難題。本發(fā)明中頻率覆蓋的范圍是20Hz到20KHz。該方法將音頻信 號劃分為若干子帶,依據(jù)附圖2所示的ILD調(diào)整的原理圖,對每個原始音,通 過增益控制器gi和g2,制作給定ILD下的立體測試音。通過主觀測聽獲得各 子帶上ILD臨界閾值,得出相應(yīng)的JND曲線。
本發(fā)明的解決方案包括以下步驟
一種雙耳聲強差I(lǐng)LD臨界感知特性的測量方法,其特征在于,包括以下步
驟
步驟l、由響度選取單元確定各個響度級選取,由頻率選取單元確定頻帶 劃分規(guī)則以及所有測試音的頻率;
步驟2、由原始音制作單元將步驟1中選取的響度換算成聲壓級,并根據(jù) 步驟(1)中選取的頻率和本步驟換算后的聲壓級制作各響度級以及各頻率下 的原始音;步驟3、輸入各響度級各頻率下的原始音,由ILD測試序列制作單元對每 個原始音設(shè)定至少兩個ILD值,制作測試序列,其中一個ILD值對應(yīng)參考音, 其他作為測試音。
步驟4、測試者對步驟3中所有測試序列進(jìn)行主觀測試,記錄其感知到聲 源方向發(fā)生變化的臨界測試音。
在上述的雙耳聲強差I(lǐng)LD臨界感知特性的測量方法,在步驟l中,響度級 在人耳聽覺域內(nèi)選取,聽覺域范圍為20Hz 20KHz,頻帶劃分采用Bark帶劃 分規(guī)則,測試音頻率選取每個Bark帶中心頻率。
在上述的雙耳聲強差I(lǐng)LD臨界感知特性的測量方法,在步驟3中,所述的 對原始音設(shè)定的ILD值,正值代表左聲道比右聲道強,負(fù)值代表右聲道比左聲 道強,參數(shù)設(shè)置為ILD=0的測試音作為參考音。
在上述的雙耳聲強差I(lǐng)LD臨界感知特性的測量方法,在步驟3中,對每個 原始音制作測試音和參考音時設(shè)定雙耳時間差I(lǐng)TD=0,耳間相關(guān)度K>1。
在上述的雙耳聲強差I(lǐng)LD臨界感知特性的測量方法,在步驟4中,主觀測 試的具體方法為對每個原始音,測試者首先反復(fù)對參考音進(jìn)行聲源定位,將 參考音的聲源位置確定為中心位置,然后使ILD值從0開始分別向正數(shù)和負(fù)數(shù) 兩邊逐漸變化,并對相應(yīng)的測試音進(jìn)行測聽。
在上述的雙耳聲強差I(lǐng)LD臨界感知特性的測量方法,所述步驟4中所述記 錄測試者感知到聲源方向發(fā)生變化的臨界測試音的具體方法為如下選擇記錄 人耳感覺測試音與參考音聲源方向是相同的,比對結(jié)果記錄為0; 人耳感知到了測試音與參考音聲源方向不同,則比對結(jié)果記錄為1; 測試者對所有原始音測聽結(jié)束后,記錄下結(jié)果為0和1的交界處且記錄為1的兩個測試序列的ILD值,取這兩個值的絕對值平均,作為ILD臨界值。在上述的雙耳聲強差I(lǐng)LD臨界感知特性的測量方法,所述的步驟4完成后, 由統(tǒng)計分析單元對所有頻率和響度的ILD臨界值做統(tǒng)計分析,獲取JND曲線族。一種用于雙耳聲強差I(lǐng)LD臨界感知特性的測量方法的裝置,其特征在于 它包括頻率選取單元以及分別與頻率選取單元相連的響度選取單元和原始音 制作單元,ILD測試序列制作單元與原始音制作單元相連,統(tǒng)計分析單元與ILD 測試序列制作單元相連。說明書附圖
圖1為本發(fā)明中雙耳聲強差I(lǐng)LD的聽覺模型; 圖2為本發(fā)明中ILD調(diào)整原理圖; 圖3為本發(fā)明中測試序列制作流程; 圖4為本發(fā)明中主觀測聽流程;圖5為本發(fā)明中傳統(tǒng)參數(shù)編碼模型與參數(shù)臨界感知編碼模型比較圖;
具體實施例方式本發(fā)明提供一種測量雙耳聲強差I(lǐng)LD在不同響度級不同頻率下的臨界感知特性的方法,包括以下步驟(1)由響度選取單元確定各個響度級選取,由頻率選取單元確定頻帶劃 分規(guī)則以及所有測試音的頻率;本步驟是確定頻帶劃分規(guī)則以及所有測試音的頻率,確定實驗需要測試的各個響度級。釆用巴克帶的劃分規(guī)則,將全頻帶劃分為24個巴克帶,選取每 個巴克帶的中心頻率作為測試音的頻率;
(2) 由原始音制作單元將步驟(1)中選取的響度換算成聲壓級,并根據(jù) 步驟(1)中選取的頻率和本步驟換算后的聲壓級制作各響度級以及各頻率下 的原始音;
(3) 輸入各響度級各頻率下的原始音,由ILD測試序列制作單元對每個 原始音設(shè)定至少兩個ILD值,制作測試序列。其中一個ILD值對應(yīng)參考音, 其他作為測試音。
本步驟中,對每個原始音設(shè)定不同的ILD值,其值覆蓋范圍為-9~9,制作 對應(yīng)不同ILD值的參考音與測試音。ILD值的設(shè)定通常以1為步長,取值-9, -8, -7, -6, -5, -4, -3, -2, -1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9,共生成18 個測試音與1個參考音。也可根據(jù)每個頻帶上人耳的感知特性對ILD值做調(diào)整, 采取非線性形式設(shè)定ILD值。參考音的參數(shù)設(shè)置為ILD=0, ITD=0,
(4) 測試者對步驟(3)中所有原始音進(jìn)行主觀測試,記錄其感知到聲源 方向發(fā)生變化的臨界測試音。主觀測試的具體方法為對每個原始音,測試者 首先反復(fù)對參考音進(jìn)行聲源定位,將參考音的聲源位置確定為中心位置,然后 使ILD值由0開始分別向兩邊逐步遞增到-9和9,并按照此順序?qū)y試音進(jìn)行 測聽。測試者首先反復(fù)試聽參考音,確定聲源中心位置,然后分別對每個響度 級下每個頻帶的所有測試音進(jìn)行試聽,判斷聲源的方向。如附圖1所示,參考 音的聲源處在中心位置,其ILD參數(shù)值為O。測試音聲源的方向是從中心位置 向兩側(cè)漸變,測試者在依順序測聽的過程中,需要判斷雙耳剛好分辨不出聲源 方向的臨界序列,記錄下其對應(yīng)的左耳和右耳的兩個ILD臨界值;
記錄測試者感知到聲源方向發(fā)生變化的臨界測試音的具體方法為如下選擇記錄
人耳感覺測試音與參考音聲源方向是相同的,比對結(jié)果記錄為0; 人耳感知到了測試音與參考音聲源方向不同,則比對結(jié)果記錄為1; 測試者對所有原始音測聽結(jié)束后,記錄下結(jié)果為0和1交界處且記錄為1
的測試序列的ILD值,通常為一正一負(fù)兩個值。取兩者的絕對值平均值作為ILD
臨界值。
步驟(4)完成后,由統(tǒng)計分析單元對所有頻率和響度的ILD臨界值做統(tǒng) 計分析,即對各個響度級各個巴克帶上所有測試者的ILD臨界值結(jié)果做算數(shù)平 均,得出其平均值,用直線連接即得出各響度級下的JND曲線。
一種用于權(quán)利要求1所述的方法的裝置,其特征在于它包括頻率選取單 元以及分別與頻率選取單元相連的響度選取單元和原始音制作單元,ILD測試 序列制作單元與原始音制作單元相連,統(tǒng)計分析單元與ILD測試序列制作單元 相連。附圖5所示為傳統(tǒng)參數(shù)編碼模型與參數(shù)臨界感知編碼模型比較圖。
傳統(tǒng)的參數(shù)編碼模型中,信號經(jīng)過變換模塊后進(jìn)行子帶劃分,分為64個 子帶。再對子帶進(jìn)行分組,通常分為10或20組。在參數(shù)編碼模塊中,所有的 ILD參數(shù)采取全部編碼或者全部不編碼的策略。這兩類的處理方法,要么忽略 了ILD在不同操作單元具有的感知差異,浪費了參數(shù)編碼碼率,要么以編碼音 質(zhì)的下降為代價而不處理雙耳對強度差異的感知信息,從而使得編碼信號中存 在大量無法去除的主觀冗余信息,降低編碼壓縮效率。
本發(fā)明的ILD臨界感知模型可對傳統(tǒng)參數(shù)編碼模型進(jìn)行改進(jìn)。如參數(shù)臨界感知 編碼模型所示,信號經(jīng)過變換模塊后,進(jìn)入巴克劃分模塊將信號分為24個巴 克帶。在感知分組模塊中,對于每一楨信號,需要編碼判決模塊對其進(jìn)行判決,根據(jù)參數(shù)的臨界感知統(tǒng)計特性決定是否需要進(jìn)行編碼。此過程不斷循環(huán)進(jìn)行。隨著信號的幀數(shù)不斷增加,感知分組結(jié)果越精細(xì)。最后輸出需要進(jìn)行ILD參數(shù) 編碼的N組信號。在編碼與判決模型中,對這N組信號的ILD值進(jìn)行編碼。 每一組內(nèi)的ILD通過閾值判決模塊決定其編碼值以及碼率分配。改編碼方法不 僅考慮到人耳的感知聽覺特性,避免造成編碼音質(zhì)的嚴(yán)重下降,同時降低了參 數(shù)的冗余,可以有效的提高編碼效率??臻g心理聲學(xué)指出,雙耳聲強差I(lǐng)LD在不同的頻帶下有不同的臨界感知 特性。 一般來說,在中頻和高頻部分,人耳對ILD的感知會比較敏感,而在低 頻和超高頻部分,人耳對ILD的感知特性相對不敏感。同時,不同響度級下ILD 的臨界感知特性也有所不同。通常來講,人耳在響度級較高的情況下對ILD的 感知特性要更敏感一些。人耳存在一個較大的的聽覺域,聽覺頻率范圍一般為20Hz到20kHz,超 過此頻率范圍的聲音通常難以被人耳感知到。而在聽覺范圍內(nèi)的不同頻率下, 人耳對聲壓級的可感知度也有所不同。當(dāng)聲音的強弱小到人的耳朵剛剛可聽見時,稱為聽閾。它是穩(wěn)態(tài)環(huán)境下純音的可聽覺水平,代表了不同頻率下人耳可 感知的最低聲壓級。即是在絕對安靜的環(huán)境下,人耳也感知不到聽閾之下的聲 壓級范圍。如果加大聲音的強度,使它大到人的耳朵感到疼痛,這個閾值稱為 痛閾。在聽閾和痛閾之間的區(qū)域就是人耳的聽覺域。人耳聽覺域是相當(dāng)寬的, 從聲強上來看,相差1012倍以上。響度是人耳聽覺判別聲音強度的等級概念。由于聽覺具有復(fù)雜的強度特 性,頻率特性及時間特性,所以響度不僅取決于聲壓級,還與頻率及瞬態(tài)時間 特性有關(guān)。依據(jù)上述特點,在實驗中設(shè)定響度曲線時應(yīng)充分考慮人耳的聽覺特性,選取具有代表性的若干響度值進(jìn)行實驗。首先在人耳聽覺域之內(nèi)選定若干個響 度,再與頻率關(guān)聯(lián)計算出各頻帶中心頻率的聲壓級。聲壓級與頻率確定后,可 用于生成測試序列。
下面結(jié)合附圖2,附圖3和附圖4對本發(fā)明實施例做進(jìn)一步的說明,以便 具體實施參考。
本發(fā)明實施例分頻帶參數(shù)提取系統(tǒng)包括二個模塊測試序列生成模塊,如 附圖3所示,和主觀實驗?zāi)K,如附圖4所示。
附圖2的ILD原理圖中,單頻音信號S(t)通過兩個不同的增益控制器g,與g2, 使得進(jìn)入左右耳的兩個聲道信號分別為左耳g^S(t)和右耳為g戶S(t)。此時的立 體聲信號為具有給定聲強差的測試音,即對應(yīng)不同ILD值的測試音。
具體實施過程中,如附圖3的測試序列生成圖所示,將輸入信號的能量恒定 式(公式l),結(jié)合ILD的定義式(公式2),可獲得增益控制器gi的計算式(公式 3)和g2的計算式(公式4),
<formula>formula see original document page 11</formula>
本實施例中的測試序列包括參考音和測試音。在第三步測試序列的制作
中,保證始終只有ILD —個參數(shù)在發(fā)生變化,其它影響空間聽覺的參數(shù),如ITD 值和IC值始終保持在中心位置不變,本實例中參考音是ILD=0, ITD=0, IC=1。 測試音nXNO, IC=1, ILD在[-9,9]之間,以步長1變化。
附圖4的主觀測聽流程中,測試者對所有參考音和測試音進(jìn)行主觀測聽。首先測試者要反復(fù)對參考音進(jìn)行聲源定位,將參考音的聲源位置確定為中心位
置。然后使ILD值逐漸增大,按順序?qū)y試音進(jìn)行測聽。當(dāng)ILD值比較小時, 人耳不容易聽出測試音與參考音在聲源方向上的差別。當(dāng)人耳感覺測試音與參
考音聲源方向是相同的,比對結(jié)果記錄為0;當(dāng)人耳感知到測試音與參考音聲 源方向不同,則比對結(jié)果記錄為l;測試者對所有原始音測聽結(jié)束后,記錄下 結(jié)果為0和1交界處且記錄為1的測試序列的ILD值,通常為一正一負(fù)兩個值。 取兩者的絕對值平均值作為ILD臨界值。
對所有頻率所有響度的測試序列都按如上方法進(jìn)行測試,統(tǒng)計所有測試數(shù) 據(jù)可繪制雙耳聲強差I(lǐng)LD的JND曲線。
權(quán)利要求
1.一種雙耳聲強差I(lǐng)LD臨界感知特性的測量方法,其特征在于,包括以下步驟步驟1、由響度選取單元確定各個響度級選取,由頻率選取單元確定頻帶劃分規(guī)則以及所有測試音的頻率;步驟2、由原始音制作單元將步驟1中選取的響度換算成聲壓級,并根據(jù)步驟1中選取的頻率和本步驟換算后的聲壓級制作各響度級以及各頻率下的原始音;步驟3、輸入各響度級各頻率下的原始音,由ILD測試序列制作單元對每個原始音設(shè)定至少兩個ILD值,制作測試序列,其中一個ILD值對應(yīng)參考音,其他作為測試音。步驟4、測試者對步驟3中所有測試序列進(jìn)行主觀測試,記錄其感知到聲源方向發(fā)生變化的臨界測試音。
2. 根據(jù)權(quán)利要求1所述的雙耳聲強差I(lǐng)LD臨界感知特性的測量方法,其特征 在于在步驟1中,響度級在人耳聽覺域內(nèi)選取,聽覺域范圍為20Hz 20KHz, 頻帶劃分采用Bark帶劃分規(guī)則,測試音頻率選取每個Bark帶中心頻率。
3. 根據(jù)權(quán)利要求1所述的雙耳聲強差I(lǐng)LD臨界感知特性的測量方法,其特征 在于在步驟3中,所述的對原始音設(shè)定的ILD值,正值代表左聲道比右聲道 強,負(fù)值代表右聲道比左聲道強,參數(shù)設(shè)置為ILD=0的測試音作為參考音。
4. 根據(jù)權(quán)利要求3所述的雙耳聲強差I(lǐng)LD臨界感知特性的測量方法,其特征 在于在步驟3中,對每個原始音制作測試音和參考音時設(shè)定ITD=0, IC=1。
5. 根據(jù)權(quán)利要求1所述的雙耳聲強差I(lǐng)LD臨界感知特性的測量方法,其特征 在于在步驟4中,主觀測試的具體方法為對每個原始音,測試者首先反復(fù)對參考音進(jìn)行聲源定位,將參考音的聲源位置確定為中心位置,然后使ILD值 從0開始分別向正數(shù)和負(fù)數(shù)兩邊逐漸變化,并對相應(yīng)的測試音進(jìn)行測聽。
6. 根據(jù)權(quán)利要求5所述的雙耳聲強差I(lǐng)LD臨界感知特性的測量方法,其特征 在于所述步驟4中所述記錄測試者感知到聲源方向發(fā)生變化的臨界測試音的 具體方法為如下選擇記錄人耳感覺測試音與參考音聲源方向是相同的,比對結(jié)果記錄為0; 人耳感知到了測試音與參考音聲源方向不同,則比對結(jié)果記錄為1; 測試者對所有原始音測聽結(jié)束后,記錄下結(jié)果為0和1的交界處的兩個記錄為1的測試序列的ILD值,取兩者的絕對平均值作為ILD臨界值。
7. 根據(jù)權(quán)利要求1所述的雙耳聲強差I(lǐng)LD臨界感知特性的測量方法,其特征 在于所述的步驟4完成后,由統(tǒng)計分析單元對所有頻率和響度的ILD臨界值 做統(tǒng)計分析,獲取JND曲線族。
8. —種用于權(quán)利要求1所述的方法的裝置,其特征在于它包括頻率選取單 元以及分別與頻率選取單元相連的響度選取單元和原始音制作單元,ILD測試序 列制作單元與原始音制作單元相連,統(tǒng)計分析單元與ILD測試序列制作單元相 連。
全文摘要
在空間音頻編碼中,雙耳聲強差是聽覺系統(tǒng)辨別聲源方位的重要參數(shù)之一。本發(fā)明公開了雙耳聲強差(以下簡稱ILD)參數(shù)的臨界感知特性的測量方法對測試源采用巴克頻帶的劃分規(guī)則,選取各巴克頻帶的中心頻率作為原始音頻率,同時原始音保持聲壓級恒定;接著依據(jù)ILD的感知原理,通過等間距或非線性變化ILD值的方法制作聽音位置漸變的測試音;最后通過主觀測試的方法,獲取ILD參數(shù)的臨界感知值JND。本發(fā)明實現(xiàn)了頻率從20Hz至20KHz信號的ILD臨界感知特性的定量分析,解決了傳統(tǒng)ILD特性分析中僅有定性描述的缺陷,以及空間音頻編碼中ILD參數(shù)的主觀冗余去除的問題,利于優(yōu)化分析。
文檔編號G01S5/00GK101408614SQ200810197889
公開日2009年4月15日 申請日期2008年11月26日 優(yōu)先權(quán)日2008年11月26日
發(fā)明者劉雨田, 胡瑞敏, 陳文琴, 陳水仙 申請人:武漢大學(xué)