亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

客觀音質(zhì)評價(jià)中基于噪聲掩蔽門限算法的巴克譜失真測度方法

文檔序號:2820207閱讀:493來源:國知局
專利名稱:客觀音質(zhì)評價(jià)中基于噪聲掩蔽門限算法的巴克譜失真測度方法
技術(shù)領(lǐng)域
本發(fā)明涉及客觀音質(zhì)評價(jià)中的失真測度方法,具體涉及基于噪聲掩蔽門限算法的巴克譜失真測度方法背景技術(shù)目前國內(nèi)外對客觀音質(zhì)評價(jià)方法的研究主要集中在各種測度的研究上,最終目的是研究和尋求到與主觀評價(jià)特性曲線最為一致的計(jì)算測度,即主客觀相關(guān)度最高的評價(jià)測度。目前較為成熟的有巴克譜失真BSD測度、對數(shù)譜距離測度LSD、MEL倒譜距離測度MEL-CD、LPC倒譜系數(shù)距離測度LPC-CD和基于瞬時(shí)掩蔽效應(yīng)的改進(jìn)的巴克譜測度MBSD等等。

發(fā)明內(nèi)容
本發(fā)明的目的是提出了一種基于噪聲掩蔽門限(NMT)算法的擴(kuò)展的巴克譜失真(EBSD)測度方法,該測度依據(jù)人耳聽覺系統(tǒng)的同時(shí)性掩蔽特性,在聽覺響度域內(nèi)動(dòng)態(tài)地確定原始語音信號和失真語音信號的響度差掩蔽閾,對不同的語音失真條件,選取不同的掩蔽閾,以此來提高和改善測度的一致性和相關(guān)性。
本發(fā)明的測度方法分以下三步實(shí)現(xiàn)(1)計(jì)算輸入信號和輸出信號的響度差;1)將輸入信號和輸出信號作FFT變換后得到功率譜P(k)(P(k)=Re2(k)+Im2(k)),再求得各個(gè)臨界頻帶內(nèi)的巴克譜功率能量,然后對每個(gè)巴克帶抽一次樣,得到臨界帶能量Bij(Bij=Σk=bjlbjhPi(k));]]>2)應(yīng)用擴(kuò)展函數(shù),擴(kuò)展函數(shù)矩陣為S(j,j′)=15.81+7.5·(j-j′+0.474)-17.51+(j-j′+0.474)2]]>對步驟1)中得到的臨界帶能量Bij用擴(kuò)展函數(shù)進(jìn)行濾波卷積C(j)=Σj′=117S(j,j′)B(j′),]]>得到第j個(gè)Bark帶的擴(kuò)展巴克譜C(j);3)然后將擴(kuò)展巴克譜C(j)在話音頻帶內(nèi)應(yīng)用等響度曲線預(yù)加重得到信號的響度級,最后將響度級轉(zhuǎn)換為輸入信號和輸出信號的響度,最后得到輸入信號與輸出信號的響度差dxy(i);(2)確定輸入信號的噪聲掩蔽門限值(NMT);1)將輸入信號作FFT變換后得到功率譜P(k)(P(k)=Re2(k)+Im2(k)),再求得各個(gè)臨界頻帶內(nèi)的巴克譜功率能量,然后對每個(gè)巴克帶抽一次樣,得到臨界帶能量Bij(Bij=Σk=bjlbjhPi(k));]]>2)應(yīng)用擴(kuò)展函數(shù)擴(kuò)展函數(shù)矩陣為S(j,j′)=15.81+7.5·(j-j′+0.474)-17.51+(j-j′+0.474)2]]>對步驟1)中得到的臨界帶能量Bij用擴(kuò)展函數(shù)進(jìn)行濾波卷積C(j)=Σj′=117S(j,j′)B(j′),]]>得到第j個(gè)Bark帶的擴(kuò)展巴克譜C(j);3)計(jì)算NMT譜平坦度量度(SFM)定義為信號功率譜的幾何平均Gm與算術(shù)平均Am的比值(SFM=10logGmAm),]]>定義一個(gè)音調(diào)因子α作為信號音調(diào)特性的判斷α=min(SFMSFMmax,1)]]>根據(jù)音調(diào)因子α的值可以確定一個(gè)對擴(kuò)展巴克譜C(j)的修正值Qj=α(14.5+j)+5.5(1-α)然后得到巴克帶噪聲掩蔽門限NMTj=10logC(j)-0.1·Oj]]>4)聽閾比較,最后把得到的每個(gè)臨界頻帶NMT與聽閾比較,如果某臨界頻帶的NMT小于聽閾,則實(shí)際的掩蔽門限以聽閾代替,聽閾的計(jì)算公式為 (3)巴克譜失真(EBSD)計(jì)算定義一個(gè)掩蔽矩陣符號M(i,j)(其中j表示第i幀的第j個(gè)Bark帶),M(i,j)的取值由輸入信號與輸出信號的響度差dxy(i)與NMT比較得來M(i,j)=1 dxy(i,j)>NMT(i,j)M(i,j)=0 dxy(i,j)≤NMT(i,j)計(jì)算出第i幀的巴克譜失真距離EBSD(i)=Σj=115dxy2(i,j)·M(i,j)]]>最后計(jì)算出整個(gè)信號總的失真距離為EBSD=1NΣi=1NΣj=115dxy2(i,j)·M(i,j)]]>(其中N為總幀數(shù))。
在BSD測度用于語音SSB調(diào)制經(jīng)過不同干擾失真都已達(dá)到主客觀評價(jià)高度相關(guān)的情況下,對同樣的實(shí)驗(yàn)條件EBSD得到的結(jié)果還是進(jìn)一步提高了主客觀評價(jià)的相關(guān)系數(shù)百分之一到百分之三左右,標(biāo)準(zhǔn)偏差得到減小,表明這種測度是一種與主觀音質(zhì)評價(jià)一致性更好的語音測度。同時(shí),基于擴(kuò)展函數(shù)的EBSD測度相對于MBSD具有更好的普適性。


圖1是基于噪聲掩蔽門限算法的巴克譜失真(EBSD)測度方法工作框2是18個(gè)擴(kuò)展函數(shù)臨界帶濾波器組圖3是SSB調(diào)制失真條件BSD測度歸一化主客觀評價(jià)二次擬合曲線圖4是SSB調(diào)制失真條件EBSD測度歸一化主客觀評價(jià)二次擬合曲線具體實(shí)施方式
下面結(jié)合附圖詳細(xì)說明本發(fā)明的實(shí)現(xiàn)方法EBSD測度主要分為三步,即聽覺響度計(jì)算、噪聲掩蔽門限NMT估計(jì)和EBSD計(jì)算,其工作原理框圖見圖1。
本發(fā)明的獨(dú)創(chuàng)性在于將NMT算法引入廣泛使用的BSD失真測度,采用SFM方法來度量噪聲對純音的掩蔽和純音對噪聲的掩蔽,比較語音信號的響度差與NMT的值作為失真距離計(jì)算的判決準(zhǔn)則,即在失真距離的計(jì)算中考慮NMT是否掩蔽信號的響度差。其中確定輸入語音的噪聲掩蔽門限值NMT是計(jì)算EBSD測度的關(guān)鍵步驟,符合人耳聽覺掩蔽特性的NMT由信號臨界頻帶分析、對巴克譜應(yīng)用譜擴(kuò)展函數(shù)、計(jì)算NMT和聽閾比較四步來完成。
如圖1所示,要對輸入語音信號和輸出語音信號分別進(jìn)行預(yù)處理,預(yù)處理包括將輸入語音信號和輸出語音信號作FFT變換后得到功率譜P(k)(P(k)=Re2(k)+Im2(k)),接著按照下面表1中的臨界頻帶劃分,

表1(臨界頻帶的劃分)求得各個(gè)臨界頻帶(只取前面17個(gè))內(nèi)的巴克譜功率能量,然后對每個(gè)Bark帶抽一次樣,即求得每個(gè)Bark帶在一幀信號中的能量分布,得到臨界帶能量 得到Bij后再應(yīng)用擴(kuò)展函數(shù),擴(kuò)展函數(shù)矩陣為S(j,j′)=15.81+7.5·(j-j′+0.474)-17.51+(j-j′+0.474)2]]>圖2為擴(kuò)展函數(shù)濾波器組。
對Bij用擴(kuò)展函數(shù)進(jìn)行濾波卷積C(j)=Σj′=117S(j,j′)B(j′)]]>這樣得到的C(j)值就是第j個(gè)Bark帶的擴(kuò)展巴克譜,意味著其它各臨界帶對這一頻帶的綜合影響作用。然后將擴(kuò)展巴克譜C(j)在話音頻帶內(nèi)應(yīng)用等響度曲線預(yù)加重得到信號的響度級,將響度級轉(zhuǎn)換為語音信號的響度,分別得到輸入語音信號和輸出語音信號第i幀的響度Lx(i)與Ly(i)。
然后根據(jù)Lx(i)和Ly(i)計(jì)算出輸入語音信號和輸出語音信號之間的響度差dxy(i)。
同時(shí)要確定輸入語音信號的噪聲掩蔽門限,將輸入語音信號作FFT變換后得到功率譜P(k)(P(k)=Re2(k)+Im2(k)),接著按照上面表1中的臨界頻帶劃分,求得各個(gè)臨界頻帶(只取前面17個(gè))內(nèi)的巴克譜功率能量,然后對每個(gè)Bark帶抽一次樣,即求得每個(gè)Bark帶在一幀信號中的能量分布,得到臨界帶能量Bij=Σk=bjlbjhPi(k)]]>得到Bij后再應(yīng)用擴(kuò)展函數(shù),估計(jì)臨界頻帶之間的相互影響。擴(kuò)展函數(shù)用來描述各個(gè)臨界帶的信號對其它臨界帶信號的掩蔽特性。實(shí)際應(yīng)用中,可以用兩條線段來保守地逼近實(shí)驗(yàn)中得出的掩蔽曲線。擴(kuò)展函數(shù)矩陣為S(j,j′)=15.81+7.5·(j-j′+0.474)-17.51+(j-j′+0.474)2]]>
對Bij用擴(kuò)展函數(shù)進(jìn)行濾波卷積C(j)=Σj′=117S(j,j′)B(j′)]]>這樣得到的C(j)值就是第j個(gè)Bark帶的擴(kuò)展巴克譜,意味著其它各臨界帶對這一頻帶的綜合影響作用。語音信號的音調(diào)特性決定了掩蔽程度的大小。同時(shí)性掩蔽效應(yīng)包括純音掩蔽噪聲和噪聲掩蔽純音兩種情況,因此各部分的貢獻(xiàn)大小與信號的音調(diào)特性(似噪性)有關(guān)。譜平坦度量度SFM(Spectral FlatnessMeasure)定義為信號功率譜的幾何平均Gm與算術(shù)平均Am的比值SFM=10logGmAm]]>接著定義一個(gè)音調(diào)因子α作為信號音調(diào)特性的判斷α=min(SFMSFMmax,1)]]>其中SFMmax=-60dB時(shí)設(shè)定信號是完全純音特性,如果SFM=0dB,則信號幾乎為完全噪聲特性。
當(dāng)純音掩蔽噪聲時(shí),掩蔽值為擴(kuò)展譜C(j)減去(14.5+j),即低于C(j)-(14.5+j)dB的噪聲是聽不見的;反之,噪聲掩蔽純音時(shí),C(j)-5.5dB以下的語音也是聽不見的。根據(jù)音調(diào)因子α的值可以確定一個(gè)對C(j)的修正值Oj=α(14.5+j)+5.5(1-α)然后得到Bark帶噪聲掩蔽門限NMTj=10logC(j)-0.1·Oj]]>最后把得到的每個(gè)臨界頻帶NMT與聽閾比較,如果某臨界頻帶的NMT小于聽閾,則實(shí)際的掩蔽門限以聽閾代替,聽閾的計(jì)算公式為 最后得到輸入語音信號的噪聲掩蔽門限(NMT)。
最后根據(jù)求得語音信號響度差和輸入語音信號的噪聲掩蔽門限(NMT)來進(jìn)行EBSD計(jì)算。為了確定某一臨界帶是否可以感知,定義一個(gè)掩蔽矩陣符號M(i,j),j表示第i幀的第j個(gè)Bark帶。當(dāng)失真可以被感知,M(i,j)為1,反之M(i,j)為0,它也是一個(gè)只包含0和1元素的矩陣。而M(i,j)的取值由dxy(i)與NMT比較得來M(i,j)=1 dxy(i,j)>NMT(i,j)M(i,j)=0 dxy(i,j)≤NMT(i,j)下面把所有聽覺能感知的響度差求和得到一幀信號的失真距離,即計(jì)算巴克譜失真時(shí)不考慮被掩蔽的距離EBSD(i)=Σj=115dxy2(i,j)·M(i,j)]]>這里EBSD(i)為第i幀的失真距離,在300-3400Hz的話音頻帶取15Bark。最后整個(gè)測試信號總的失真距離為EBSD=1NΣi=1NΣj=115dxy2(i,j)·M(i,j)]]>(其中N為總幀數(shù))通過比較語音信號的響度差與NMT的值,在失真距離的計(jì)算中排除被NMT掩蔽的臨界頻帶,得出語音信號的失真曲線。
本發(fā)明依據(jù)人耳聽覺系統(tǒng)的同時(shí)性掩蔽特性,在聽覺響度域內(nèi)動(dòng)態(tài)地確定原始語音信號和失真語音信號的響度差掩蔽閾,該掩蔽閾主要由信號的音調(diào)性修正得來,對不同的語音失真條件,選取不同的掩蔽閾能夠得到各自最好的相關(guān)性,從客觀評價(jià)與主觀評價(jià)的統(tǒng)計(jì)相關(guān)性上表明,使用本發(fā)明EBSD測度后客觀評價(jià)與主觀評價(jià)結(jié)果之間具有相對其他測度更好的一致性。
在BSD測度用于語音SSB調(diào)制經(jīng)過不同干擾失真都已達(dá)到主客觀評價(jià)高度相關(guān)的情況下,對同樣的實(shí)驗(yàn)條件EBSD得到的結(jié)果還是進(jìn)一步提高了主客觀評價(jià)的相關(guān)系數(shù)百分之一到百分之三左右,標(biāo)準(zhǔn)偏差得到減小(見表2、圖3和圖4),表明這種測度是一種與主觀音質(zhì)評價(jià)一致性更好的語音測度。同時(shí),基于擴(kuò)展函數(shù)的EBSD測度相對于MBSD具有更好的普適性。三種BSD測度的相關(guān)系數(shù)比較見下表(表2)

表2三種BSD測度的相關(guān)系數(shù)
權(quán)利要求
1.一種客觀音質(zhì)評價(jià)中基于噪聲掩蔽門限算法的巴克譜失真測度方法,包括以下三步(1)計(jì)算輸入信號和輸出信號的響度差;(2)確定輸入信號的噪聲掩蔽門限值(NMT);(3)通過比較信號的響度差與噪聲掩蔽門限(NMT)的值進(jìn)行巴克譜失真(EBSD)計(jì)算。
2.根據(jù)權(quán)利要求1所述的基于噪聲掩蔽門限算法的巴克譜失真測度方法,其步驟(1)中的計(jì)算信號的響度差由以下三步完成1)將輸入信號和輸出信號作FFT變換后得到功率譜P(k)(P(k)=Re2(k)+Im2(k)),再求得各個(gè)臨界頻帶內(nèi)的巴克譜功率能量,然后對每個(gè)巴克帶抽一次樣,得到臨界帶能量Bij(Bij=Σk=bjlbjhPi(k));]]>2)應(yīng)用擴(kuò)展函數(shù),擴(kuò)展函數(shù)矩陣為S(j,j′)=15.81+7.5·(j-j′+0.474)-17.51+(j-j′+0.474)2]]>對步驟1)中得到的臨界帶能量Bij用擴(kuò)展函數(shù)進(jìn)行濾波卷積C(j)=Σj′=117S(j,j′)B(j′),]]>得到第j個(gè)Bark帶的擴(kuò)展巴克譜C(j);3)然后將擴(kuò)展巴克譜C(j)在話音頻帶內(nèi)應(yīng)用等響度曲線預(yù)加重得到信號的響度級,最后將響度級轉(zhuǎn)換為輸入信號和輸出信號的響度,最后得到輸入信號與輸出信號的響度差dxy(i);
3.根據(jù)權(quán)利要求1所述的基于噪聲掩蔽門限算法的巴克譜失真測度方法,其步驟(2)中的確定輸入信號的噪聲掩蔽門限值(NMT)由以下四步完成1)將輸入信號作FFT變換后得到功率譜P(k)(P(k)=Re2(k)+Im2(k)),再求得各個(gè)臨界頻帶內(nèi)的巴克譜功率能量,然后對每個(gè)巴克帶抽一次樣,得到臨界帶能量Bij(Bij=Σk=bjlbjhPi(k));]]>2)應(yīng)用擴(kuò)展函數(shù)擴(kuò)展函數(shù)矩陣為S(j,j′)=15.81+7.5·(j-j′+0.474)-17.51+(j-j′+0.474)2]]>對步驟1)中得到的臨界帶能量Bij用擴(kuò)展函數(shù)進(jìn)行濾波卷積C(j)=Σj′=117S(j,j′)B(j′),]]>得到第j個(gè)Bark帶的擴(kuò)展巴克譜C(j);3)計(jì)算NMT譜平坦度量度(SFM)定義為信號功率譜的幾何平均Gm與算術(shù)平均Am的比值(SFM=10logGmAm),]]>定義一個(gè)音調(diào)因子α作為信號音調(diào)特性的判斷α=min(SFMSFMmax,1)]]>根據(jù)音調(diào)因子α的值可以確定一個(gè)對擴(kuò)展巴克譜C(j)的修正值Oj=α(14.5+j)+5.5(1-α)然后得到巴克帶噪聲掩蔽門限NMTj=10logC(j)-0.1·Oj]]>4)聽閾比較,最后把得到的每個(gè)臨界頻帶NMT與聽閾比較,如果某臨界頻帶的NMT小于聽閾,則實(shí)際的掩蔽門限以聽閾代替,聽閾的計(jì)算公式為
4.根據(jù)權(quán)利要求1所述的基于噪聲掩蔽門限算法的巴克譜失真測度方法,其步驟(3)中的巴克譜失真(EBSD)計(jì)算方法如下定義一個(gè)掩蔽矩陣符號M(i,j)(其中j表示第i幀的第j個(gè)Bark帶),M(i,j)的取值由輸入信號與輸出信號的響度差dxy(i)與NMT比較得來M(i,j)=1 dxy(i,j)>NMT(i,j)M(i,j)=0 dxy(i,j)≤ NMT(i,j)計(jì)算出第i幀的巴克譜失真距離EBSD(i)=Σj=115dxy2(i,j)·M(i,j)]]>最后計(jì)算出整個(gè)信號總的失真距離為EBSD=1NΣi=1NΣj=115dxy2(i,j)·M(i,j)]]>(其中N為總幀數(shù))。
全文摘要
客觀音質(zhì)評價(jià)中基于噪聲掩蔽門限算法的巴克譜失真測度方法,提供了一種基于聽覺同時(shí)性掩蔽效應(yīng)的原理的擴(kuò)展巴克譜失真(EBSD)測度方法,包括聽覺響度計(jì)算,噪聲掩蔽門限(NMT)計(jì)算和擴(kuò)展巴克譜失真(EBSD)計(jì)算,在失真距離的計(jì)算中排除被噪聲掩蔽門限(NMT)掩蔽的臨界頻帶,使用EBSD測度后客觀評價(jià)與主觀評價(jià)結(jié)果之間具有相對其他測度更好的一致性。
文檔編號G10L15/00GK1655230SQ20051002020
公開日2005年8月17日 申請日期2005年1月18日 優(yōu)先權(quán)日2005年1月18日
發(fā)明者吳江濱, 楊波, 張知易 申請人:中國電子科技集團(tuán)公司第三十研究所
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1