一種語(yǔ)音降噪方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語(yǔ)音通話領(lǐng)域,尤其涉及一種語(yǔ)音降噪方法。
【背景技術(shù)】
[0002] 在語(yǔ)音業(yè)務(wù)中最常見(jiàn)的問(wèn)題是在通話中有噪聲,目前處理噪聲最常用的技術(shù)是譜 減法。它利用語(yǔ)音信號(hào)的短時(shí)平穩(wěn)特性,從帶噪語(yǔ)音的短時(shí)譜值中減去噪聲的短時(shí)譜估計(jì) 值,從而得到較純凈語(yǔ)音的頻譜,達(dá)到語(yǔ)音降噪的目的。譜減法包括幅度譜減法和功率譜減 法:幅度譜減法就是在頻域中從帶噪語(yǔ)音的幅度譜上減去噪聲的幅度譜作為語(yǔ)音信號(hào)的幅 度譜;功率譜減法則是從帶噪語(yǔ)音的功率譜中減去噪聲的功率譜,得到純凈語(yǔ)音的功率譜, 通過(guò)開(kāi)方運(yùn)算得到幅度譜。由于人耳對(duì)語(yǔ)音頻譜分量的相位感知并不敏感,因此該些算法 都是在幅度上進(jìn)行的修正,相位部分則保持不變,在處理完噪聲后,仍然使用帶噪語(yǔ)音的相 位來(lái)恢復(fù)降噪后的語(yǔ)音。在噪聲譜的估計(jì)方面,一般是使用語(yǔ)音未產(chǎn)生之前的噪聲譜作為 整個(gè)語(yǔ)音降噪?yún)^(qū)間的噪聲譜估計(jì)值。
[0003] 上述譜減法通過(guò)從帶噪語(yǔ)音的短時(shí)譜中減去噪聲的短時(shí)譜估計(jì)值來(lái)達(dá)到語(yǔ)音降 噪的目的,算法簡(jiǎn)單且容易實(shí)現(xiàn)。由于是把語(yǔ)音未產(chǎn)生之前的噪聲譜作為整個(gè)語(yǔ)音降噪?yún)^(qū) 間的噪聲譜估計(jì)值,使得噪聲譜的估計(jì)值誤差較大,因此在減去噪聲譜后,還會(huì)有些較大功 率譜分量的剩余部分,在頻譜上呈現(xiàn)出隨機(jī)出現(xiàn)的尖峰,在聽(tīng)覺(jué)上形成殘留噪聲。該種噪聲 具有一定的節(jié)奏性起伏感,被稱之為"音樂(lè)噪聲",是各峽的多種隨機(jī)頻率點(diǎn)上出現(xiàn)的聲調(diào) 的組合結(jié)果。聽(tīng)者常常能發(fā)現(xiàn)處理后的語(yǔ)音中的"音樂(lè)噪聲",它比原始語(yǔ)音中的噪聲更為 清晰,也更易令人反感。
【發(fā)明內(nèi)容】
[0004] 為了解決目前采用譜減法處理噪聲后出現(xiàn)音樂(lè)噪聲的問(wèn)題,發(fā)明提出了一種基于 譜減法改進(jìn)的語(yǔ)音降噪方法。該方法包括W下步驟:
[0005] a,通過(guò)端點(diǎn)檢測(cè)將語(yǔ)音峽區(qū)分為靜音峽和語(yǔ)音峽;
[0006] b,對(duì)于靜音峽,計(jì)算當(dāng)前峽的功率譜值作為噪聲功率譜估計(jì)值,對(duì)于語(yǔ)音峽,計(jì)算 平均噪聲功率譜作為噪聲功率譜估計(jì)值;
[0007] C,將語(yǔ)音峽的功率譜減去噪聲功率譜估計(jì)值,得到降噪后的語(yǔ)音功率譜;
[0008]d,根據(jù)降噪后的語(yǔ)音功率譜得出降噪后的語(yǔ)音峽。
[0009] 優(yōu)選的,步驟a具體為:計(jì)算每一語(yǔ)音峽的能量,如果大于或等于口限值,則為語(yǔ) 音峽,如果小于口限值,則為靜音峽。進(jìn)一步的,將前30峽語(yǔ)音峽的平均噪聲能量作為所述 口限值。
[0010] 優(yōu)選的,步驟b中將前30峽語(yǔ)音峽的平均噪聲能量作為所述平均噪聲功率譜。
[0011] 優(yōu)選的,步驟b中所述噪聲譜估計(jì)值還進(jìn)行平滑處理。
[0012] 優(yōu)選的,步驟d利用降噪前語(yǔ)音峽的相位譜,根據(jù)降噪后的語(yǔ)音功率譜計(jì)算出降 噪后的語(yǔ)音譜,進(jìn)而得到降噪后的語(yǔ)音峽。
[0013] 本發(fā)明通過(guò)端點(diǎn)檢測(cè)技術(shù)減小了噪聲功率譜估計(jì)值的誤差,基本消除了音樂(lè)噪 聲,從而提高了語(yǔ)音降噪質(zhì)量和主觀聽(tīng)覺(jué)的效果。
【附圖說(shuō)明】
[0014] 為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作一簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā) 明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可W根 據(jù)該些附圖獲得其他的附圖。
[0015] 圖1是本發(fā)明實(shí)施例的端點(diǎn)檢測(cè)流程示意圖。
【具體實(shí)施方式】
[0016] 為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例 中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是 本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例;需要說(shuō)明的是,在不沖突的情況下,本申請(qǐng)中 的實(shí)施例及實(shí)施例中的特征可W相互組合。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員 在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0017] 在降噪方法中噪聲譜的估計(jì)至關(guān)重要,如果噪聲估計(jì)偏差較大的話,將毫無(wú)疑問(wèn) 的影響語(yǔ)音降噪質(zhì)量。本實(shí)施例是在端點(diǎn)檢測(cè)的基礎(chǔ)上進(jìn)行噪聲估計(jì)的,端點(diǎn)檢測(cè)是指從 一段包含語(yǔ)音的信號(hào)中確定出語(yǔ)音的起始點(diǎn)和終點(diǎn),從而從連續(xù)記錄的帶噪語(yǔ)音信號(hào)中分 離出我們真正感興趣的語(yǔ)音信號(hào)。本實(shí)施例通過(guò)端點(diǎn)檢測(cè)把要降噪的語(yǔ)音峽區(qū)分為靜音峽 和語(yǔ)音峽。在靜音峽,當(dāng)前的譜值就是噪聲譜,在語(yǔ)音峽,使用平均噪聲功率譜作為噪聲功 率譜估計(jì)值。該樣就比傳統(tǒng)的在整個(gè)降噪?yún)^(qū)間使用平均噪聲功率譜作為噪聲功率譜的估計(jì) 值誤差小很多。
[0018] 本實(shí)施例的端點(diǎn)檢測(cè)方法是將語(yǔ)音信號(hào)的短時(shí)能量與口限值比較,如果超過(guò)口限 值則表示當(dāng)前為有語(yǔ)音的語(yǔ)音段,否則就表示當(dāng)前為無(wú)音的靜音段。整個(gè)端點(diǎn)檢測(cè)流程如 圖1所示:首先設(shè)置一個(gè)經(jīng)驗(yàn)值為口限值,本實(shí)施例是將前30峽語(yǔ)音峽的平均噪聲能量 (EMN)作為口限值。然后依次計(jì)算每一峽的能量;
【主權(quán)項(xiàng)】
1. 一種語(yǔ)音降噪方法,其特征在于,所述方法包括以下步驟: a,通過(guò)端點(diǎn)檢測(cè)將語(yǔ)音幀區(qū)分為靜音幀和語(yǔ)音幀; b,對(duì)于靜音幀,計(jì)算當(dāng)前幀的功率譜值作為噪聲功率譜估計(jì)值,對(duì)于語(yǔ)音幀,計(jì)算平均 噪聲功率譜作為噪聲功率譜估計(jì)值; c,將語(yǔ)音幀的功率譜減去噪聲功率譜估計(jì)值,得到降噪后的語(yǔ)音功率譜; 山根據(jù)降噪后的語(yǔ)音功率譜得出降噪后的語(yǔ)音幀。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟a具體為:計(jì)算每一語(yǔ)音幀的能量, 如果大于或等于門(mén)限值,則為語(yǔ)音幀,如果小于門(mén)限值,則為靜音幀。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,將前30幀語(yǔ)音幀的平均噪聲能量作為所 述門(mén)限值。
4. 根據(jù)權(quán)利要求1所述的方法,其特征在于步驟b,將前30幀語(yǔ)音幀的平均噪聲能量 作為所述平均噪聲功率譜。
5. 根據(jù)權(quán)利要求1或4所述的方法,其特征在于步驟b,所述噪聲譜估計(jì)值還進(jìn)行平滑 處理。
6. 根據(jù)權(quán)利要求1所述的方法,其特征在于步驟d,利用降噪前語(yǔ)音幀的相位譜,根據(jù) 降噪后的語(yǔ)音功率譜計(jì)算出降噪后的語(yǔ)音譜,進(jìn)而得到降噪后的語(yǔ)音幀。
【專利摘要】本發(fā)明提出了一種語(yǔ)音降噪方法,該方法包括以下步驟:a,通過(guò)端點(diǎn)檢測(cè)將語(yǔ)音幀區(qū)分為靜音幀和語(yǔ)音幀;b,對(duì)于靜音幀,計(jì)算當(dāng)前幀的功率譜值作為噪聲功率譜估計(jì)值,對(duì)于語(yǔ)音幀,計(jì)算平均噪聲功率譜作為噪聲功率譜估計(jì)值;c,將語(yǔ)音幀的功率譜減去噪聲功率譜估計(jì)值,得到降噪后的語(yǔ)音功率譜;d,根據(jù)降噪后的語(yǔ)音功率譜得出降噪后的語(yǔ)音幀。本發(fā)明通過(guò)端點(diǎn)檢測(cè)技術(shù)減小了噪聲功率譜估計(jì)值的誤差,基本消除了音樂(lè)噪聲,從而提高了語(yǔ)音降噪質(zhì)量和主觀聽(tīng)覺(jué)的效果。
【IPC分類】G10L21-0216
【公開(kāi)號(hào)】CN104867497
【申請(qǐng)?zhí)枴緾N201410076957
【發(fā)明人】陳子華, 徐正春
【申請(qǐng)人】北京信威通信技術(shù)股份有限公司, 北京信友達(dá)視訊技術(shù)有限公司
【公開(kāi)日】2015年8月26日
【申請(qǐng)日】2014年2月26日