本發(fā)明屬于助聽器語音質(zhì)量評估技術(shù)領(lǐng)域,尤其涉及一種基于增益補償助聽器語音質(zhì)量w-pesq客觀評價方法。
背景技術(shù):
隨著科學(xué)技術(shù)的不斷進步,助聽器呈現(xiàn)智能化、數(shù)字化等趨勢。助聽器所具備的高端性能越來越豐富,價格差距也越來越大。而如何評價助聽器的質(zhì)量,是助聽器廠家、消費者以及驗配醫(yī)師都很關(guān)注的問題。目前對助聽器進行客觀評估還主要局限在物理聲學(xué)參數(shù)上,國際國內(nèi)都有相關(guān)的標準規(guī)范。語音質(zhì)量作為助聽器的重要性能,其評估還主要還局限在主觀評價上。而主觀評測方法因其耗費大量人力、物力及時間,不適合作為計量檢測手段。必須采用科學(xué)客觀的方法對助聽器語音質(zhì)量進行評價,才能避免市場定價混亂,企業(yè)不健康競爭,從而避免損害消費者利益。對于語音質(zhì)量評價的客觀評價方法有許多,而檢驗客觀評價的金標準就是主觀評價,即用耳朵去聽。因而,考慮耳朵聽覺特性,用客觀方法對主觀評價過程進行一定程度模擬,可望改善評價性能。目前廣泛應(yīng)用的是w-pesq(寬帶pesq)算法,其評價結(jié)果與主觀評價的相關(guān)度也最高。國際電信聯(lián)盟提出的w-pesq算法最初適用的是對電話語音的質(zhì)量進行評估,并取得了較好的評價效果,進而在其他領(lǐng)域推廣。然而目前尚未發(fā)現(xiàn)有相關(guān)技術(shù)應(yīng)用在助聽器語音質(zhì)量領(lǐng)域,并且w-pesq算法的提出是基于正常人耳的聽力水平,沒有考慮聽力障礙人群的聽力衰減。
技術(shù)實現(xiàn)要素:
針對上述問題,本發(fā)明的目的在于利用現(xiàn)有的w-pesq算法提出一種新的適用于助聽器的客觀評估方法,將w-pesq算法與聽力患者的典型聽力圖相結(jié)合,進行增加補償,進而將其運用于助聽器語音質(zhì)量的客觀評估方法。
技術(shù)方案如下所述:
一種基于增益補償?shù)闹犉髡Z音質(zhì)量的w-pesq客觀評價方法,包括以下步驟:
步驟一:播放大于一定時間長度的純凈語音,錄制助聽器的輸出語音信號;利用端點檢測法將錄制的助聽器輸出語音信號與原始純凈語音信號進行端點檢測對齊處理。
步驟二:將端點檢測對齊處理后的助聽器輸出語音信號與原始純凈語音信號進行穩(wěn)定助聽器信號截取處理。
步驟三:對未經(jīng)過助聽器的純凈語音信號進行增益補償;設(shè)計增益補償濾波器,將原始純凈語音信號按照當前助聽器的頻域增益曲線,進行增益調(diào)整,以將增益補償濾波器的頻域響應(yīng)曲線和助聽器的增益曲線進行擬合。
步驟四:采用w-pesq算法進行助聽器語音質(zhì)量的客觀評價。
所述端點檢測法采用基于雙門限的端點檢測方法,用于檢測語音信號的起始點,去除語音錄制和采集系統(tǒng)本身的時延,將信號對齊。
所述穩(wěn)定助聽器信號截取處理為:在錄制語音信號大于60s的前提下,舍棄助聽器輸出語音信號端點對齊后的15s語音信號,截取15s-60s之間的45s語音信號作為有效助聽器信號,同樣,在端點對齊后的原始純凈語音信號做相同的信號截取處理。
所述增益補償是根據(jù)聽障患者的聽力圖,調(diào)整助聽器的參數(shù)設(shè)置,完成驗配之后,測量助聽器在各個不同頻率點的增益情況,通過設(shè)計濾波器的頻域響應(yīng)曲線和助聽器的增益曲線相擬合,從而將未經(jīng)過助聽器的純凈語音進行增益補償。
本發(fā)明的有益效果在于:
本發(fā)明提出的一種基于增益補償?shù)闹犉髡Z音質(zhì)量w-pesq客觀評價方法,該方法在原有的w-pesq語音質(zhì)量客觀評價方法的基礎(chǔ)上,增加了端點檢測處理、語音截取和增益補償濾波器;利用端點檢測算法,將錄制的助聽器輸出語音與原始純凈語音信號對齊,去除音頻錄制系統(tǒng)及操作系統(tǒng)本身所引入的較大信號延遲;通過語音截取去除助聽器15s之內(nèi)的不穩(wěn)定信號,截取45s的有效語音信號。另外考慮到聽力障礙人群的聽力衰減,將原始語音信號按照當前助聽器的頻域增益曲線,設(shè)計增益補償濾波器,進行增益調(diào)整,以將原始信號的幅度調(diào)整到與助聽器輸出相匹配的范圍,最后采用w-pesq算法進行助聽器語音質(zhì)量的客觀評價。經(jīng)過主觀驗證,該方法的主客觀相關(guān)系數(shù)達到0.8,具有很好主客觀吻合度,易于評價助聽器的語言質(zhì)量優(yōu)劣,相比于w-pesq算法的性能略勝一籌,具有極大的實用價值。
附圖說明
附圖1為基于增益補償?shù)闹犉髡Z音質(zhì)量的w-pesq客觀評價方法的算法流程圖。
附圖2為原始語音信號和助聽器輸出語音信號對比圖。
附圖3為經(jīng)過端點檢測之后的原始語音信號和助聽器輸出語音信號對比圖。
附圖4為經(jīng)過信號截取之后的原始語音信號和助聽器輸出語音信號對比圖。
附圖5為助聽器1的增益補償效果圖。
附圖6為助聽器2的增益補償效果圖。
附圖7為助聽器3的增益補償效果圖。
具體實施方式
下面結(jié)合附圖和實施例對本發(fā)明進行詳細說明。
附圖1為基于增益補償?shù)闹犉髡Z音質(zhì)量的w-pesq客觀評價方法的算法流程圖。如圖1所示,首先需要播放60s以上的原始純凈語音,并作為該算法的參考語音信號,將助聽器錄制的輸出語音信號作為該算法的失真語音信號,然后利用端點檢測模塊,將錄制的助聽器輸出語音信號與原始純凈語音信號進行端點檢測對齊處理,該環(huán)節(jié)采用端點檢測方法,用來檢測語音信號的起始點,將原始純凈語音信號和助聽器輸出語音信號對齊。接下來將端點檢測對齊處理后的助聽器輸出語音信號與原始純凈語音信號進行信號截取處理,依據(jù)ieee60118-15標準,舍棄端點對齊后的15s信號,從第16s開始,一直到60s結(jié)束,保留共45s的有效助聽器信號,以避免15s之內(nèi)的不穩(wěn)定信號;由于助聽器各個頻率的信號放大作用,使得助聽器輸出語音信號的幅度遠大于純凈語音信號所對應(yīng)的幅度,導(dǎo)致無法直接對二者進行比較研究,因此,在進行電平調(diào)整之前,需要設(shè)計增益補償濾波器,設(shè)計濾波器的頻域響應(yīng)曲線和助聽器的增益曲線相擬合,將原始純凈語音信號按照當前助聽器的頻域增益曲線,進行增益調(diào)整和補償,將原始純凈語音信號各個頻率點的幅度調(diào)整到和助聽器輸出信號相當?shù)乃?,以使其幅度與助聽器的輸出相匹配,從而使得二者具有可比性;最后按照w-pesq算法進行助聽器語音質(zhì)量的客觀評價,即將助聽器輸出語音信號和經(jīng)過補償后的原始純凈語音信號調(diào)整到標準聽覺電平,利用輸入濾波器將助聽器的輸出語音限制在50hz~7000hz的頻率范圍,然后將兩個信號進行時間對齊,將對齊好的信號進行聽覺轉(zhuǎn)換,轉(zhuǎn)換之后的輸入和輸出信號差值為干擾度,通過認知模型處理,最后得到w-pesq分值,在干擾度的處理中識別出壞區(qū)間,然后對壞區(qū)間進行重新對齊。
進一步地,在端點檢測對齊處理環(huán)節(jié),本發(fā)明采用基于雙門限的端點檢測方法,但端點檢測的方法不限于此方法。所述基于雙門限的端點檢測方法的步驟如下所述:首先在播放語音的起始端之前的固定時間間隔位置添加固定時長的高強度白噪聲,以提高端點檢測的準確性。采用短時能量和短時過零率相結(jié)合的方法,利用短時能量和短時過零率兩個門限來確定語音信號的起點和終點,目的是從采集到的語音信號中分離出真正的語音信號作為系統(tǒng)處理的對象。在開始端點檢測之前,首先為短時能量和過零率分別確定兩個門限。一個是比較低的門限,其數(shù)值比較小,對信號的變化比較敏感,很容易會被超過。另一個是比較高的門限,數(shù)值比較大,信號必須達到一定的強度,該門限才可能被超過。低門限被超過未必就是語音的開始,有可能是時間很短的噪聲引起的。高門限被超過可以基本確信是由于語音信號引起的。整個語音信號的端點檢測可以分成四段:靜音、過渡段、語音段、結(jié)束。在靜音段,如果能量或過零率超越了低門限,就應(yīng)該開始標記起始點,進入過渡段。在過渡段中,由于參數(shù)的數(shù)值比較小,不能確信是否處于真正的語音段,因此只要兩個參數(shù)的數(shù)值回落到低門限以下,就將當前狀態(tài)恢復(fù)到靜音狀態(tài)。而如果在過渡段中兩個參數(shù)中的任一個超過了高門限,就可以確信進入語音段了。由于一些突發(fā)性的噪聲也可以引起短時能量或過零率的數(shù)值很高,但是往往不能維持足夠長的時間,如門窗的開關(guān)、物理的碰撞等引起的噪聲,這些都可以通過設(shè)定最短時間門限來判別。當前狀態(tài)處于語音段時,如果兩個參數(shù)的數(shù)值降低到低門限一下,而且總的計時長度小于最短時間門限,則認為這是一段噪音,繼續(xù)掃描以后的語音數(shù)據(jù)。否則,標記好結(jié)束端點,并返回。
進一步地,在設(shè)計增益補償濾波器環(huán)節(jié),設(shè)計濾波器的頻域響應(yīng)曲線和助聽器的增益曲線相擬合,具體步驟如下所述:首先將患者聽力曲線下載到待測助聽器中,并將助聽器交由專業(yè)驗配機構(gòu)進行驗配和功能調(diào)試,使其聲音效果對于患者達到最佳,然后依據(jù)標準iec60118-8標準測量1/3倍頻程下的插入增益,采用頻率采樣法設(shè)計fir濾波器,使得濾波器的輸出和所測量得到的待測助聽器的插入增益盡量擬合。采用該濾波器將經(jīng)過端點對齊處理與穩(wěn)定信號截取之后純凈語音信號進行濾波,將純凈語音信號各個頻率點的幅度調(diào)整到和助聽器輸出信號相當?shù)乃剑允沟枚呔哂锌杀刃浴?/p>
為了加強w-pesq算法在語音質(zhì)量客觀評價中運用的有效性,通常利用算法的客觀評價結(jié)果與人的主觀評價結(jié)果的相關(guān)度進行充分證明。其中相關(guān)度表示為:
式中,ai為語音信號在第i種聽力損失曲線下的主觀mos評分,bi為客觀評分,
對于主觀評估采用基于mos評分法。該方法的描述如下所述:請14位具有聽力障礙耳的主觀試聽者對語音信號質(zhì)量進行主觀評估。表1給出了mos法的評分標準,對用戶接聽和感知的語音質(zhì)量狀況進行調(diào)研和量化,主要有五個等級用來衡量語音質(zhì)量;評測人分別對標準語音以及經(jīng)過語音測試系統(tǒng)處理的失真語音進行主觀評分,統(tǒng)計出所有評測者的平均分得到所測語音質(zhì)量的mos分。為了保證測試評分的準確性,對實驗中的環(huán)境、語音材料以及測評人的數(shù)量等都要明確的嚴格規(guī)定,mos得分由高到低,主要意味著語音質(zhì)量的由好到差。
表1mos評分五級標準
實施例一
下面以某家助聽器產(chǎn)品為例進行詳細說明。選擇好、壞、中三款不同等級的助聽器作為測試樣品,分別標記為助聽器1、助聽器2、助聽器3,首先利用casia中文普通話語音庫中純凈語音,合成60s以上的純凈語音,然后在特定測試平臺上,分別采集經(jīng)過測試的三款助聽器后的輸出語音信號。采用雙門限的端點檢測方法,檢測錄制的助聽器輸出語音的起始端點,將之與原始純凈語音對齊。以助聽器1的信號處理過程為例,錄制得到的助聽器輸出語音信號與原始語音信號的對比如圖2所示,由于原始純凈語音經(jīng)過助聽器后信號是有延遲的,并且語音錄制過程中的操作也會引入一定的延遲,為了保證端點檢測的準確性,在原始語音信號的初始部分人工添加了時長固定且與正式語音之間的時長固定的較大幅度的白噪聲。然后對助聽器輸出語音信號采用雙門限端點檢測法將錄制的助聽器輸出語音與原始純凈語音信號對齊。在初始部分添加的大幅度白噪聲的能量和過零率都非常高,在檢測出語音信號起始端點之后,將助聽器輸出語音信號前面一段截取,從而將原始純凈語音信號和助聽器輸出語音信號對齊,效果如圖3所示,然后分別從對齊后的原始純凈語音和助聽器輸出語音的15s開始位置,截取長度為45s的語音信號,得到的原始語音信號和助聽器輸出語音信號的對比圖如圖4所示,顯而易見,二者的語音信號是對齊的,并且保證了助聽器的輸出是在助聽器穩(wěn)定狀態(tài)下錄制的。接下來設(shè)計增益補償濾波器對原始純凈語音信號進行增益補償,將信號幅度調(diào)整到可以和助聽器輸出語音信號幅度相匹配的大小。以iec60118-15中提到的典型聽力圖n2為例,分別將聽力圖下載到好,中,壞三款不同等級的待測助聽器中,依據(jù)iec60118-8標準測量其插入增益,圖5-7分別是助聽器1-3根據(jù)下載的聽力圖n2插入增益后的增益補償效果圖,將調(diào)整后的45s純凈語音和未調(diào)整的45s助聽器輸出語音分別輸入到w-pesq算法中,進行客觀評估分值的計算。再采用正常聽力人群,針對本發(fā)明提出的方法進行驗證,主客觀評價分數(shù)如表2所示。
表2三款不同等級助聽器的主客觀評價分數(shù)
經(jīng)統(tǒng)計學(xué)分析驗證,基于本發(fā)明的方法與主觀評價具有良好的相關(guān)度,根據(jù)本發(fā)明中的方法,能夠?qū)⒑?、中、壞三款助聽器正確地區(qū)分開來,并且與主觀評價結(jié)果相一致。
此實施例僅為本發(fā)明較佳的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)該以權(quán)利要求的保護范圍為準。