本發(fā)明涉及信息處理技術(shù)及傳感信號處理領(lǐng)域,特別是涉及到一種基于背景噪聲估計自適應(yīng)高通濾波語音降噪方法。
背景技術(shù):
語音降噪技術(shù)已經(jīng)廣泛應(yīng)用于手機電話,會議電話,麥克風(fēng),人工耳蝸語音降噪增強,以及語音識別的前處理等,好的語音降噪能提高語音接收的性噪比,提高人接聽的體驗感。在語音識別中,更能改善人工智能識別的識別率,以及對環(huán)境的適應(yīng)性, 因此語音降噪技術(shù)是語音接收,識別必不可少的環(huán)節(jié)。
作為語音降噪技術(shù)中一個關(guān)鍵基礎(chǔ)技術(shù)就是高通濾波降噪, 由于大多噪聲的能量集中在幾百赫茲的低頻段,如100到500Hz以內(nèi),而人聲頻帶分布廣,在50Hz到上萬Hz都有分布,能量主要集中在500Hz到6000Hz之間。
傳統(tǒng)的高通濾波技術(shù)利用這個特點,將含噪聲能量成分較多的低頻成分過濾掉,而保留高頻段人聲,該高通濾波器的低頻截止頻率大小可以通過用戶配置濾波器結(jié)構(gòu)參數(shù)來實現(xiàn)。
傳統(tǒng)的語音接收處理設(shè)備或者芯片基本集成該高通濾波功能,其截止頻率大多也可以被用戶配置,但是一旦用戶配置完成后,該設(shè)備只能工作在一個固定截止頻率濾波模型下,這種固定截止頻率工作模式無法適應(yīng)背景噪聲發(fā)生波動的情況。
研究和實驗表明,當(dāng)背景噪聲能量變強時,其能量分布往往會向更高的頻率延伸,對人聲也是如此,在安靜環(huán)境下,如果截止頻率設(shè)得過高的話,往往會損害人的低頻基音部分,這樣會影響到語音識別的準(zhǔn)確度,因此安靜環(huán)境下,適合于將截止頻率設(shè)定低一些,而對于背景噪聲較強的環(huán)境,為保持辨識度,人的聲音音量通常會提高,從而也將人的基音頻率提高,因此噪聲較強的環(huán)境下,合適于將截止頻率設(shè)定高一些。
為解決上述問題,需要發(fā)明一種通過動態(tài)估計的背景噪聲大小,從而自動調(diào)節(jié)高通濾波器的結(jié)構(gòu)參數(shù),實現(xiàn)低頻端截止頻率的自動調(diào)節(jié),以達(dá)到更好的濾波效果的基于背景噪聲估計自適應(yīng)高通濾波語音降噪方法。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于克服現(xiàn)有技術(shù)中所存在的上述不足,提供一種能大幅提高濾波效果的基于背景噪聲估計自適應(yīng)高通濾波語音降噪方法。
為了達(dá)到上述目的,本發(fā)明提供了如下技術(shù)方案。
一種基于背景噪聲估計自適應(yīng)高通濾波語音降噪方法,其包括以下步驟:
步驟一,載入聲音數(shù)據(jù);
步驟二,按幀處理所述聲音數(shù)據(jù),所述聲音數(shù)據(jù)為時域內(nèi)聲音數(shù)據(jù),所述幀的時間大小根據(jù)系統(tǒng)設(shè)定,一開始載入的是所述聲音數(shù)據(jù)的當(dāng)前幀數(shù)據(jù),通常所述幀的時間大小在10ms至30ms之間;
步驟三,計算所述聲音數(shù)據(jù)當(dāng)前幀的能量并將計算結(jié)果輸入背景噪聲估計單元;
步驟四,進(jìn)行語音檢測,檢測所述聲音數(shù)據(jù)當(dāng)前幀是語音還是非語音,是語音則直接輸出,是非語音則進(jìn)入下一步驟;
步驟五,所述背景噪聲估計單元將步驟三和步驟四的輸入結(jié)果進(jìn)行累加生成背景噪聲;
步驟六,將所述背景噪聲輸入濾波器參數(shù)地址映射單元,根據(jù)所述背景噪聲數(shù)值大小選擇輸出一組濾波器參數(shù)地址,不同的所述濾波器參數(shù)地址對應(yīng)一組不同的濾波器參數(shù)存儲器的首地址。
步驟七,將所述濾波器參數(shù)地址輸入濾波器參數(shù)讀取控制單元,所述濾波器參數(shù)讀取控制單元根據(jù)所述濾波器參數(shù)地址從所述濾波器參數(shù)存儲器中讀取與所述濾波器參數(shù)存儲器的首地址對應(yīng)的濾波器參數(shù)。
步驟八,將所述濾波器參數(shù)送到高通濾波器進(jìn)行運算;
步驟九,輸出語音結(jié)果。
作為本發(fā)明的優(yōu)選方案,在步驟五中,當(dāng)所述語音檢測的結(jié)果是非語音時,則將所述聲音數(shù)據(jù)的當(dāng)前幀能量輸入一累加器進(jìn)行累加,并用計數(shù)器將所述非語音的幀的數(shù)量加1,當(dāng)所述非語音的幀的數(shù)量累加到系統(tǒng)設(shè)定的數(shù)目時,將背景噪聲能量除以所述幀的數(shù)量即可得到所述背景噪聲的大小,將累加器和計數(shù)器清零,準(zhǔn)備下一輪的累加和計數(shù)。
作為本發(fā)明的優(yōu)選方案,在步驟六中,所述背景噪聲按照一定范圍進(jìn)行分段,每段設(shè)定一個閾值,當(dāng)所述背景噪聲處于兩個閾值范圍內(nèi)時,則所述背景噪聲映射到一組濾波器參數(shù)的存儲地址并輸出,當(dāng)所述背景噪聲低于最小的閾值參數(shù)時則不進(jìn)行濾波。
作為本發(fā)明的優(yōu)選方案,在步驟三中,所述聲音數(shù)據(jù)當(dāng)前幀的能量是將該幀每一個聲音數(shù)據(jù)取絕對值后求平方,然后求和得到,進(jìn)入步驟五。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果:
本發(fā)明采用了背景噪聲動態(tài)估計、根據(jù)噪聲大小映射濾波器參數(shù)地址、濾波器參數(shù)讀取控制和語音高通濾波器等功能單元,實現(xiàn)了一種自動適應(yīng)環(huán)境噪聲,高性能的語音高通濾波技術(shù),達(dá)到了更好的噪聲消除的效果。
附圖說明
圖1為本發(fā)明流程圖。
具體實施方式
下面結(jié)合實施例及具體實施方式對本發(fā)明作進(jìn)一步的詳細(xì)描述,但不應(yīng)將此理解為本發(fā)明上述主體的范圍僅限于以下的實施例,凡基于本發(fā)明內(nèi)容所實現(xiàn)的技術(shù)均屬于本發(fā)明的范圍。
如圖1所示,一種基于動態(tài)噪聲估計時頻域自適應(yīng)語音檢測方法,其包括以下步驟:
一種基于背景噪聲估計自適應(yīng)高通濾波語音降噪方法,其包括以下步驟:
步驟一,載入聲音數(shù)據(jù);
步驟二,按幀處理所述聲音數(shù)據(jù),所述聲音數(shù)據(jù)為時域內(nèi)聲音數(shù)據(jù),所述幀的時間大小根據(jù)系統(tǒng)設(shè)定,一開始載入的是所述聲音數(shù)據(jù)的當(dāng)前幀數(shù)據(jù),通常所述幀的時間大小在10ms至30ms之間;
步驟三,計算所述聲音數(shù)據(jù)當(dāng)前幀的能量并將計算結(jié)果輸入背景噪聲估計單元,即進(jìn)入步驟五;
步驟四,進(jìn)行語音檢測,檢測所述聲音數(shù)據(jù)當(dāng)前幀是語音還是非語音,是語音則直接輸出,是非語音則進(jìn)入下一步驟;
步驟五,所述背景噪聲估計單元將步驟三和步驟四的輸入結(jié)果進(jìn)行累加生成背景噪聲;
步驟六,將所述背景噪聲輸入濾波器參數(shù)地址映射單元,根據(jù)所述背景噪聲數(shù)值大小選擇輸出一組濾波器參數(shù)地址,不同的所述濾波器參數(shù)地址對應(yīng)一組不同的濾波器參數(shù)存儲器的首地址。
步驟七,將所述濾波器參數(shù)地址輸入濾波器參數(shù)讀取控制單元,所述濾波器參數(shù)讀取控制單元根據(jù)所述濾波器參數(shù)地址從所述濾波器參數(shù)存儲器中讀取與所述濾波器參數(shù)存儲器的首地址對應(yīng)的濾波器參數(shù)。
步驟八,將所述濾波器參數(shù)送到高通濾波器進(jìn)行運算,本實施例中高通濾波器采用FIR濾波結(jié)構(gòu),在其他實施例中高通濾波器還可以采用IIR濾波結(jié)構(gòu)等其他的濾波結(jié)構(gòu);
步驟九,輸出語音結(jié)果。
在本實施例中步驟三和步驟四同時進(jìn)行,并同時將結(jié)果輸入步驟五中運行,當(dāng)所述語音檢測的結(jié)果是非語音時,則將所述聲音數(shù)據(jù)的當(dāng)前幀能量輸入一累加器進(jìn)行累加,并用計數(shù)器將所述非語音的幀的數(shù)量加1,當(dāng)所述非語音的幀的數(shù)量累加到系統(tǒng)設(shè)定的數(shù)目時,將背景噪聲能量除以所述幀的數(shù)量即可得到所述背景噪聲的大小,將累加器和計數(shù)器清零,準(zhǔn)備下一輪的累加和計數(shù),背景噪聲按照一定范圍進(jìn)行分段,每段設(shè)定一個閾值,當(dāng)所述背景噪聲處于兩個閾值范圍內(nèi)時,則所述背景噪聲映射到一組濾波器參數(shù)的存儲地址并輸出,當(dāng)所述背景噪聲低于最小的閾值參數(shù)時則不進(jìn)行濾波,所述聲音數(shù)據(jù)當(dāng)前幀的能量是將該幀每一個聲音數(shù)據(jù)取絕對值后求平方,然后求和得到。
在本實施例中,高通濾波器是一個數(shù)字 iir filter(遞歸濾波器),在其他實施例中高通濾波器還可以是一個數(shù)字 FIR filter(有限沖激濾波器)。數(shù)字 iir filter的計算公式為:,其中,x[n-k]為當(dāng)前語音采樣點即第n采樣點往前追溯k個點的原始采樣值,當(dāng)k為0時,x[n-k]表示當(dāng)前采樣點,y[n]為當(dāng)前語音采樣點濾波后的樣點值。y[n-k]為當(dāng)前語音采樣點往前追溯k個點的濾波后采樣值。 coef_a[k], coef_b[k]分別為往前追溯第k個采樣點的濾波參數(shù), 即步驟七中從濾波參數(shù)存儲器中讀取出來的所述濾波器參數(shù),M為往前追溯的采樣點的數(shù)目,在本實施例中M = 8。