數(shù)字助聽器中語音增強(qiáng)和頻響補(bǔ)償相融合方法
【專利摘要】本發(fā)明提出了數(shù)字助聽器中語音增強(qiáng)和頻響補(bǔ)償相融合方法。該方法首先,采用MCRA法獲得估計(jì)噪聲和初步增強(qiáng)語音;將估計(jì)噪聲和初步增強(qiáng)語音分別通過gammatone濾波器組進(jìn)行濾波處理,利用耳蝸對信號(hào)的感知機(jī)理,把信號(hào)分為M個(gè)頻帶,同時(shí)得到信號(hào)的時(shí)頻表示形式;然后,利用人耳的聽覺掩蔽特性和頻帶信噪比等因素計(jì)算各個(gè)頻帶的掩蔽閾值;其次,利用耳障者的聽力曲線動(dòng)態(tài)地計(jì)算含噪語音在時(shí)頻域的掩蔽值,使語音增強(qiáng)和頻響補(bǔ)償同時(shí)處理;最后,利用掩蔽值合成助聽器輸出語音。該算法充分利用了人耳的工作機(jī)理,保留了語音特征,去除了譜減法引入的“音樂噪聲”,使助聽器輸出信號(hào)的可懂度得到很大的提高,低復(fù)雜度,低功耗。
【專利說明】數(shù)字助聽器中語音增強(qiáng)和頻響補(bǔ)償相融合方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于語音信號(hào)處理【技術(shù)領(lǐng)域】,涉及到數(shù)字助聽器中語音增強(qiáng)和頻響補(bǔ)償兩個(gè)關(guān)鍵的語音信號(hào)處理技術(shù)。
【背景技術(shù)】
[0002]耳障已經(jīng)成為世界性問題,但在目前的醫(yī)療條件下,對于大多數(shù)耳障者,選配合適的數(shù)字助聽器是有效提高其聽力水平的最好的方法。隨著近幾十年來科學(xué)技術(shù)的迅速發(fā)展,數(shù)字助聽器的性能得到了不斷的完善,數(shù)字助聽器的基本工作原理,如圖2所示,外界的聲音信號(hào),進(jìn)入麥克風(fēng)從聲能轉(zhuǎn)化成電能,通過模/數(shù)轉(zhuǎn)化器轉(zhuǎn)化為數(shù)字信號(hào),然后在數(shù)字微處理器和數(shù)字濾波器中運(yùn)用預(yù)先設(shè)置好的運(yùn)算法則對這一數(shù)字信號(hào)進(jìn)行計(jì)算,一個(gè)計(jì)算法則是一系列確認(rèn)和計(jì)算的過程,數(shù)字化助聽器需要有盡可能多的字符,利用不同的運(yùn)算關(guān)系的數(shù)據(jù)符來進(jìn)行計(jì)算與判斷,以獲得對某種聽力損失性質(zhì)的再現(xiàn)。計(jì)算法則同樣被用于標(biāo)定數(shù)字化助聽器中的處理器,以滿足在特定條件中應(yīng)進(jìn)行的切換或調(diào)整。助聽器獨(dú)立執(zhí)行的分析通過應(yīng)用計(jì)算法則來實(shí)施和鑒定。處理后的數(shù)字電信號(hào)需要經(jīng)過數(shù)/模轉(zhuǎn)換器轉(zhuǎn)換成模擬電信號(hào),最后由受話器再將其轉(zhuǎn)化為聲能輸入至佩戴者耳中。
[0003]在整個(gè)數(shù)字助聽器工作過程中,DSP中的算法是數(shù)字助聽器的核心內(nèi)容,而算法也是根據(jù)耳障者的病癥提出的。比如,耳障者的病癥主要病癥為:聽域上升,言語識(shí)別率降低。對于以上癥狀,提出頻響補(bǔ)償算法來解決耳障者聽域上升的問題,但是,在噪聲環(huán)境下,僅采用頻響補(bǔ)償算法還是不能提高數(shù)字助聽器佩戴者的言語可懂度,因此,在頻響補(bǔ)償算法之前還需要采用語音增強(qiáng)算法消除背景噪聲,從而實(shí)現(xiàn)更好的提高數(shù)字助聽器佩戴者的言語可懂度。另外,為了保持?jǐn)?shù)字助聽器的穩(wěn)定性,還需反饋消除算法,防止數(shù)字助聽器“嘯叫”。除此之外,在高性能的助聽器還有一些聲源定位等算法。在以上分析的算法中,頻響補(bǔ)償和語音增強(qiáng)是數(shù)字助聽器中十分重要和關(guān)鍵的兩項(xiàng)技術(shù),這兩種技術(shù)直接決定著數(shù)字助聽器性能的優(yōu)劣。
[0004]在噪聲環(huán)境下,一些語音增強(qiáng)算法對言語可懂度的提高程度仍十分有限。因此,環(huán)境噪聲是數(shù)字助聽器設(shè)計(jì)中的最大障礙。目前大多數(shù)數(shù)字助聽器中采用的語音增強(qiáng)方法是譜減法,該方法在去除噪聲的同時(shí)會(huì)產(chǎn)生“音樂噪聲”,導(dǎo)致在數(shù)字助聽器的頻響補(bǔ)償階段,語音幅度放大的同時(shí)噪聲也放大,不利于助聽器提高耳障者對言語的可懂度,嚴(yán)重影響助聽器的效果。對于頻響補(bǔ)償技術(shù),幾乎所有的數(shù)字助聽器都采用了多通道頻響補(bǔ)償?shù)姆桨?。多通道頻響補(bǔ)償方法利用濾波器組將信號(hào)整個(gè)頻段分為N通道,然后在各個(gè)通道內(nèi),根據(jù)患者聽力損傷的情況對不同頻段加以不同的放大處理,最后再將不同頻率的聲音段合成在一起,形成完整的聲音。由于多通道不同的壓縮比率使聽力補(bǔ)償更吻合患者聽力損失情況。但是,由于子帶劃分會(huì)在頻帶交界處帶來的信號(hào)失真,同時(shí)使語音的共振峰發(fā)生形變,破壞了語音的結(jié)構(gòu),不利于可懂度的提高。共振峰是區(qū)別不同元音最主要的特征,對提高耳聾患者的語言識(shí)別率具有重要意義。
[0005]由于數(shù)字助聽器是一種便攜式設(shè)備,同時(shí)它也需要很高的實(shí)時(shí)性,因此,數(shù)字助聽器對算法有一定的特殊要求,比如,算法低復(fù)雜度,低功耗和實(shí)時(shí)性等要求。最終讓數(shù)字助聽器佩戴者有最高的言語可懂度和聽覺舒適度。其中語音增強(qiáng)和頻響補(bǔ)償兩個(gè)技術(shù)是影響數(shù)字助聽器佩戴者舒適度和可懂度十分關(guān)鍵的技術(shù)。對于大多數(shù)數(shù)字助聽器中的語音增強(qiáng)和頻響補(bǔ)償兩種技術(shù)是相互獨(dú)立的,這無形中增加了數(shù)字助聽器算法的復(fù)雜度。
[0006]本發(fā)明提出一種語音增強(qiáng)和頻響補(bǔ)償相融合的數(shù)字助聽器算法,該算法結(jié)合譜減法和時(shí)頻掩蔽的優(yōu)點(diǎn),首先,分析非平穩(wěn)噪聲的時(shí)頻特性,研究在不同噪聲環(huán)境下的噪聲估計(jì)準(zhǔn)確度,并優(yōu)化時(shí)頻掩蔽閾值,減少語音信號(hào)的失真;然后,依據(jù)耳障者的病變機(jī)理,結(jié)合VAD和耳障者的聽力曲線動(dòng)態(tài)地調(diào)整不同通道的掩蔽值,使語音增強(qiáng)和頻響補(bǔ)償同時(shí)處理,減少算法復(fù)雜度;最后,利用掩蔽值合成語音信號(hào)。
【發(fā)明內(nèi)容】
[0007]本發(fā)明針對現(xiàn)有的數(shù)字助聽器語音增強(qiáng)算法在非平穩(wěn)噪聲環(huán)境下,殘留大量背景噪聲還引入了 “音樂噪聲”,同時(shí)大多數(shù)多通道頻響補(bǔ)償算法使語音結(jié)構(gòu)發(fā)生失真,致使數(shù)字助聽器佩戴者對言語可懂度和舒適度不理想等問題,提出了一種語音增強(qiáng)和頻響補(bǔ)償兩種技術(shù)相融合的方法,該算法充分利用了人耳的工作機(jī)理,保留了語音特征,去除了譜減法引入的“音樂噪聲”,使助聽器輸出信號(hào)的可懂度得到很大的提高;由于此算法是在譜減法的基礎(chǔ)上進(jìn)行了,因此,算法實(shí)現(xiàn)簡單,低復(fù)雜度,低功耗。
[0008]為了解決以上所述的問題,本發(fā)明采用的技術(shù)方案是:基于可以模擬人耳聽覺系統(tǒng)中的基底膜和聽覺神經(jīng)的工作機(jī)理的gammatone濾波器和meddis的內(nèi)毛細(xì)胞模型,把信號(hào)頻帶非均勻地分為N個(gè)通道的頻響補(bǔ)償算法,以及利用人耳聽覺感知理論,結(jié)合人耳的聽覺特性和耳蝸的工作機(jī)理,最終實(shí)現(xiàn)語音增強(qiáng)和頻響補(bǔ)償相融合。具體過程包括步驟如下:
[0009]步驟一,數(shù)字助聽器的輸入信號(hào)進(jìn)行預(yù)處理,首先對輸入信號(hào)進(jìn)行分幀處理,然后計(jì)算每幀信號(hào)的頻譜;
[0010]步驟二,提取含噪語音信號(hào)的相位信息,利用人耳對相位信息的改變并不敏感,因此,利用含噪語音信號(hào)的相位信息代替最終合成的語音信號(hào)的相位;
[0011]步驟三,在每幀信號(hào)的頻域范圍內(nèi),估計(jì)含噪信號(hào)的噪聲幅度譜;
[0012]步驟四,利用譜減法的基本思想,讓含噪語音信號(hào)的幅度譜減去估計(jì)噪聲的幅度譜,得到初步增強(qiáng)的語音幅度譜;
[0013]步驟五,傅里葉逆變換,初步增強(qiáng)的語音幅度譜和估計(jì)噪聲幅度譜分別乘以含噪語音的相位,然后通過傅里葉逆變換分別得到初步增強(qiáng)的語音信號(hào)和估計(jì)噪聲信號(hào);
[0014]步驟六,時(shí)頻分析,利用人耳聽覺感知理論,結(jié)合人耳的聽覺特性和耳蝸的工作機(jī)理,把初步增強(qiáng)的語音信號(hào)和估計(jì)噪聲信號(hào)的頻譜范圍非均勻地分為M個(gè)頻帶;
[0015]步驟七,計(jì)算頻帶信噪比,計(jì)算初步增強(qiáng)語音信號(hào)通過時(shí)頻分析得到的M個(gè)頻帶的信噪比;
[0016]步驟八,計(jì)算掩蔽域值,利用由步驟七得到每個(gè)頻帶的信噪比和人耳對不同頻帶的感知特性,計(jì)算不同頻帶的掩蔽域值;
[0017]步驟九,測試耳障者的聽域曲線和痛域曲線,利用不同頻率特征點(diǎn)測試耳障者的聽域聲壓級(jí)和痛域聲壓級(jí),然后利用插值的方法得到整個(gè)頻率范圍的聽力曲線;[0018]步驟十,計(jì)算掩蔽值,利用步驟八和步驟九得到的掩蔽閾值和聽力曲線,動(dòng)態(tài)地調(diào)整掩蔽值的大小;
[0019]步驟十一,時(shí)頻掩蔽,利用步驟十得到的掩蔽值得到最終的輸出信號(hào)。
[0020]本發(fā)明提出了數(shù)字助聽器中語音增強(qiáng)和頻響補(bǔ)償相融合方法。該方法利用人耳聽覺感知理論,結(jié)合人耳的聽覺特性和耳蝸的工作機(jī)理。首先,采用最小值控制遞歸平均(Minima-Controlled Recursive Averaging, MCRA)算法獲得估計(jì)噪聲和初步增強(qiáng)語音;接著,將估計(jì)噪聲和初步增強(qiáng)語音分別通過可以模擬人工耳蝸模型的ga_atone濾波器組進(jìn)行濾波處理,利用耳蝸對信號(hào)的感知機(jī)理,把信號(hào)分為M個(gè)頻帶,同時(shí)得到信號(hào)的時(shí)頻表示形式;然后,利用人耳的聽覺掩蔽特性和頻帶信噪比等因素計(jì)算各個(gè)頻帶的掩蔽閾值;其次,利用耳障者的聽力曲線和VAD(Voice Activity Detection)動(dòng)態(tài)地計(jì)算含噪語音在時(shí)頻域的掩蔽值,使語音增強(qiáng)和頻響補(bǔ)償同時(shí)處理;最后,利用掩蔽值合成助聽器輸出語音。該算法充分利用了人耳的工作機(jī)理,保留了語音特征,去除了譜減法引入的“音樂噪聲”,使助聽器輸出信號(hào)的可懂度得到很大的提高;由于此算法是在譜減法的基礎(chǔ)上進(jìn)行了,因此,算法實(shí)現(xiàn)簡單,低復(fù)雜度,低功耗。
【專利附圖】
【附圖說明】
[0021]圖1本發(fā)明的實(shí)現(xiàn)流程圖
[0022]圖2gammatone濾波器組中每個(gè)濾波器的頻率相應(yīng)
[0023]圖3gammatone濾波器組中每個(gè)濾波器合成后的頻率相應(yīng)
【具體實(shí)施方式】
[0024]步驟一,數(shù)字助聽器輸入的含噪信號(hào)進(jìn)行預(yù)處理,首先對輸入的含噪信號(hào)進(jìn)行分幀處理,然后計(jì)算每幀信號(hào)的頻譜;
[0025](I)數(shù)字助聽器輸入的含噪信號(hào)y(t),t表示時(shí)間,在模數(shù)轉(zhuǎn)換過程中,采用16kHz的米樣率,輸出表不為時(shí)域數(shù)字信號(hào)y (η), η表不的序列號(hào);
[0026](2)含噪信號(hào)y(n)通過哈明窗進(jìn)行分幀,取320點(diǎn)即20ms為一幀,幀移為160點(diǎn)即10ms,可采用式(I)進(jìn)行分幀,得到每幀信號(hào)yU,n);
[0027]
【權(quán)利要求】
1.數(shù)字助聽器中語音增強(qiáng)和頻響補(bǔ)償相融合方法,其特征在于包括步驟如下: 步驟一,數(shù)字助聽器的輸入信號(hào)進(jìn)行預(yù)處理,首先對輸入信號(hào)進(jìn)行分幀處理,然后計(jì)算每幀信號(hào)的頻譜; 步驟二,提取含噪語音信號(hào)的相位信息,利用人耳對相位信息的改變并不敏感,因此,利用含噪語音信號(hào)的相位信息代替最終合成的語音信號(hào)的相位; 步驟三,在每幀信號(hào)的頻域范圍內(nèi),估計(jì)含噪信號(hào)的噪聲幅度譜; 步驟四,利用譜減法的基本思想,讓含噪語音信號(hào)的幅度譜減去估計(jì)噪聲的幅度譜,得到初步增強(qiáng)的語音幅度譜; 步驟五,傅里葉逆變換,初步增強(qiáng)的語音幅度譜和估計(jì)噪聲幅度譜分別乘以含噪語音的相位,然后通過傅里葉逆變換分別得到初步增強(qiáng)的語音信號(hào)和估計(jì)噪聲信號(hào); 步驟六,時(shí)頻分析,利用人耳聽覺感知理論,結(jié)合人耳的聽覺特性和耳蝸的工作機(jī)理,把初步增強(qiáng)的語音信號(hào)和估計(jì)噪聲信號(hào)的頻譜范圍非均勻地分為M個(gè)頻帶; 步驟七,計(jì)算頻帶信噪比,計(jì)算初步增強(qiáng)語音信號(hào)通過時(shí)頻分析得到的M個(gè)頻帶的信噪比; 步驟八,計(jì)算掩蔽域值,利用由步驟七得到每個(gè)頻帶的信噪比和人耳對不同頻帶的感知特性,計(jì)算不同頻帶的掩蔽域值; 步驟九,測試耳障者的聽域曲線和痛域曲線,利用不同頻率特征點(diǎn)測試耳障者的聽域聲壓級(jí)和痛域聲壓級(jí),然后利用插值的方法得到整個(gè)頻率范圍的聽力曲線; 步驟十,計(jì)算掩蔽值,利用步驟八和步驟九得到的掩蔽閾值和聽力曲線,動(dòng)態(tài)地調(diào)整掩蔽值的大小; 步驟十一,時(shí)頻掩蔽,利用步驟十得到的掩蔽值得到最終的輸出信號(hào)。
2.根據(jù)權(quán)利要求1所述的數(shù)字助聽器中語音增強(qiáng)和頻響補(bǔ)償相融合方法,其特征在于包括步驟如下: 步驟一,數(shù)字助聽器輸入的含噪信號(hào)進(jìn)行預(yù)處理,首先對輸入的含噪信號(hào)進(jìn)行分幀處理,然后計(jì)算每幀信號(hào)的頻譜; (1)數(shù)字助聽器輸入的含噪信號(hào)y(t),t表示時(shí)間,在模數(shù)轉(zhuǎn)換過程中,采用16kHz的米樣率,輸出表不為時(shí)域數(shù)字信號(hào)y (η), η表不時(shí)域的序列號(hào); (2)含噪信號(hào)y(n)通過哈明窗進(jìn)行分幀,取320點(diǎn)即20ms為一幀,幀移為160點(diǎn)即10ms,采用式(I)進(jìn)行分幀,得到每幀信號(hào) (λ,η);
【文檔編號(hào)】G10L21/02GK103778920SQ201410049180
【公開日】2014年5月7日 申請日期:2014年2月12日 優(yōu)先權(quán)日:2014年2月12日
【發(fā)明者】李如瑋, 曹龍濤, 鮑長春, 吳水才 申請人:北京工業(yè)大學(xué)