專(zhuān)利名稱(chēng):語(yǔ)音增強(qiáng)方法及應(yīng)用該方法的裝置的制作方法
語(yǔ)音增強(qiáng)方法及應(yīng)用該方法的裝置
技術(shù)領(lǐng)域:
本發(fā)明涉及一種語(yǔ)音增強(qiáng)方法。背景技術(shù):
由于大量環(huán)境噪聲的存在,手機(jī)等通訊設(shè)備的麥克風(fēng)采集到的語(yǔ)音信號(hào)普遍信噪 比不夠高,特別是在街道汽車(chē)等高噪聲環(huán)境中,需要提高音量才能使對(duì)方聽(tīng)清。所以需要通 過(guò)語(yǔ)音增強(qiáng)的方法來(lái)提升輸入語(yǔ)音的信噪比,改善通訊質(zhì)量。然而相關(guān)技術(shù)的譜減法語(yǔ)音 增強(qiáng)方法降噪效果有限,并且會(huì)對(duì)語(yǔ)音造成較大失真。因此,有必要研究一種新的語(yǔ)音增強(qiáng)的方法,以達(dá)到良好的降噪效果。
發(fā)明內(nèi)容本發(fā)明需解決的技術(shù)問(wèn)題是提供一種降噪效果好的語(yǔ)音增強(qiáng)方法。根據(jù)上述的技術(shù)問(wèn)題,設(shè)計(jì)了一種語(yǔ)音增強(qiáng)的方法,其包括以下步驟一種語(yǔ)音增強(qiáng)的方法,其特征在于,該方法包括以下步驟步驟(1)將聲音采集裝置采集到的帶噪語(yǔ)音信號(hào)用芯片進(jìn)行分幀、預(yù)加重處理、 再經(jīng)過(guò)短時(shí)傅里葉變換到頻域得到頻域信號(hào);步驟(2)將頻域信號(hào)劃分為若干頻帶,計(jì)算各個(gè)頻帶的能量;步驟(3)根據(jù)各個(gè)頻帶的能量利用計(jì)算器計(jì)算各個(gè)頻帶的后驗(yàn)信噪比,再根據(jù)各 頻帶的能量和后驗(yàn)信噪比利用計(jì)算器計(jì)算各個(gè)頻帶的先驗(yàn)信噪比估計(jì)值;步驟(4)利用修正器對(duì)各個(gè)頻帶的先驗(yàn)信噪比估計(jì)值進(jìn)行修正,得到各個(gè)頻帶的 先驗(yàn)信噪比修正值;步驟(5)根據(jù)當(dāng)前幀先驗(yàn)信噪比修正值,利用判斷器判斷當(dāng)前幀是否為純?cè)胍舨?記錄判斷結(jié)果,如果當(dāng)前幀是純?cè)胍羟以摦?dāng)前幀的前若干幀均為純?cè)胍?,?zhí)行步驟6,反之 執(zhí)行步驟7 ;步驟(6)首先,根據(jù)各個(gè)頻帶的先驗(yàn)信噪比修正值利用計(jì)算器計(jì)算各個(gè)頻帶的衰 減增益;其次,利用調(diào)整器對(duì)增益系數(shù)進(jìn)行調(diào)整得到衰減增益調(diào)整值;再次,利用乘法器將 頻域信號(hào)與衰減增益調(diào)整值相乘,得到處理后的頻域信號(hào);步驟(7)增強(qiáng)語(yǔ)音信號(hào),其包括如下步驟步驟001 利用計(jì)算器計(jì)算LPC參數(shù)、增益因子和信號(hào)功率譜;其次,構(gòu)造因果維納 濾波器,再利用乘法器將頻域信號(hào)與因果維納濾波器相乘,得到當(dāng)前幀處理后的語(yǔ)音信號(hào) 和后一幀處理后的語(yǔ)音信號(hào);步驟002 利用比較器比較當(dāng)前幀處理后的語(yǔ)音信號(hào)和后一幀處理后的語(yǔ)音信號(hào) 是否小于某一閾值,如果小于,得到處理后的頻域信號(hào);如果不小于,重復(fù)步驟001和步驟 002 ;步驟(8)對(duì)各頻帶的噪音能量進(jìn)行更新,得到更新后的噪音能量做為下一幀計(jì)算 后驗(yàn)信噪比的基礎(chǔ);
步驟(9)將處理后的頻域信號(hào)變換到時(shí)間域,進(jìn)行去加重處理并得到輸出信號(hào)。優(yōu)選的,所述判斷器采用先驗(yàn)信噪比的語(yǔ)音激活檢測(cè)方法判斷純?cè)胍?。?yōu)選的,所述該裝置包括聲音采集裝置和集成如權(quán)利要求1所述語(yǔ)音增強(qiáng)的方法 的芯片。與相關(guān)技術(shù)比較,本發(fā)明實(shí)時(shí)語(yǔ)音增強(qiáng)的方法在改進(jìn)的譜減算法基礎(chǔ)上,采用了 基于語(yǔ)音生成模型的增強(qiáng)算法,抑制各種類(lèi)型的背景噪聲,提高語(yǔ)音清晰度。本發(fā)明的語(yǔ)音 增強(qiáng)的方法,大大提高了對(duì)殘余噪聲的衰減,保證了語(yǔ)音可懂度。
圖1為本發(fā)明語(yǔ)音增強(qiáng)方法的流程示意圖。圖2為本發(fā)明語(yǔ)音增強(qiáng)方法步驟(6)的示意圖。圖3為本發(fā)明語(yǔ)音增強(qiáng)方法步驟(7)的示意圖。圖4為本發(fā)明語(yǔ)音增強(qiáng)方法中非線(xiàn)性計(jì)權(quán)曲線(xiàn)。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施方式對(duì)本發(fā)明作進(jìn)一步說(shuō)明。本發(fā)明的主要思想是,通過(guò)將一種語(yǔ)音增強(qiáng)方法集成在專(zhuān)用的芯片中,并通過(guò)該 芯片與相應(yīng)的聲音采集裝置的接口數(shù)據(jù)傳輸,形成一個(gè)語(yǔ)音增強(qiáng)裝置。帶噪語(yǔ)音信號(hào)通過(guò) 聲音采集裝置采集,再經(jīng)過(guò)由芯片處理,得到信噪比增強(qiáng)后的信號(hào),輸出供次級(jí)使用。本發(fā)明提供的語(yǔ)音增強(qiáng)裝置包括聲音采集裝置、集成本發(fā)明語(yǔ)音增強(qiáng)方法的芯 片,所述芯片集成在該聲音采集裝置內(nèi)。如圖1、圖2和圖3所示,本發(fā)明語(yǔ)音增強(qiáng)方法,其包括以下步驟步驟(1)將聲音采集裝置采集到的帶噪語(yǔ)音信號(hào)用芯片進(jìn)行分幀、預(yù)加重處理、 再經(jīng)過(guò)短時(shí)傅里葉變換到頻域得到頻域信號(hào);步驟(2)將頻域信號(hào)劃分為若干頻帶,計(jì)算各個(gè)頻帶的能量;步驟(3)根據(jù)各個(gè)頻帶的能量利用計(jì)算器計(jì)算各個(gè)頻帶的后驗(yàn)信噪比,再根據(jù)各 頻帶的能量和后驗(yàn)信噪比利用計(jì)算器計(jì)算各個(gè)頻帶的先驗(yàn)信噪比估計(jì)值;步驟(4)利用修正器對(duì)各個(gè)頻帶的先驗(yàn)信噪比估計(jì)值進(jìn)行修正,得到各個(gè)頻帶的 先驗(yàn)信噪比修正值;步驟(5)根據(jù)當(dāng)前幀先驗(yàn)信噪比修正值,利用判斷器判斷當(dāng)前幀是否為純?cè)胍舨?記錄判斷結(jié)果,如果當(dāng)前幀是純?cè)胍羟以摦?dāng)前幀的前若干幀均為純?cè)胍?,?zhí)行步驟6,反之 執(zhí)行步驟7 ;步驟(6)首先,根據(jù)各個(gè)頻帶的先驗(yàn)信噪比修正值利用計(jì)算器計(jì)算各個(gè)頻帶的衰 減增益;其次,利用調(diào)整器對(duì)增益系數(shù)進(jìn)行調(diào)整得到衰減增益調(diào)整值;再次,利用乘法器將 頻域信號(hào)與衰減增益調(diào)整值相乘,得到處理后的頻域信號(hào);步驟(7)增強(qiáng)語(yǔ)音信號(hào),其包括如下步驟步驟001 利用計(jì)算器計(jì)算LPC參數(shù)、增益因子和信號(hào)功率譜;其次,構(gòu)造因果維納 濾波器,再利用乘法器將頻域信號(hào)與因果維納濾波器相乘,得到當(dāng)前幀處理后的語(yǔ)音信號(hào) 和后一幀處理后的語(yǔ)音信號(hào);
4
步驟002 利用比較器比較當(dāng)前幀處理后的語(yǔ)音信號(hào)和后一幀處理后的語(yǔ)音信號(hào) 是否小于某一閾值,如果小于,得到處理后的頻域信號(hào);如果不小于,重復(fù)步驟001和步驟 002 ;步驟(8)對(duì)各頻帶的能量進(jìn)行更新,供下一幀使用;步驟(9)將處理后的頻域信號(hào)變換到時(shí)間域,進(jìn)行去加重處理并得到輸出信號(hào)。下面通過(guò)具體的實(shí)施例再詳細(xì)介紹上述方法,該語(yǔ)音增強(qiáng)方法輸入的帶噪語(yǔ)音信 號(hào)的采樣率為8kHZ,精度為16位。首先,對(duì)在時(shí)域中的帶噪語(yǔ)音信號(hào)進(jìn)行分幀,是將帶噪語(yǔ)音信號(hào)以幀為單位等分 成若干帶噪信號(hào)單元。所述帶噪信號(hào)單元由采樣點(diǎn)組成,本發(fā)明中選取了 8KHz的采樣頻 率,根據(jù)短時(shí)譜分析的需要,幀長(zhǎng)一般設(shè)定成10 35ms之間,本實(shí)施方式以32ms分幀,即 一幀帶噪信號(hào)單元設(shè)有256個(gè)采樣點(diǎn),自然地,任意一幀帶噪信號(hào)單元具有一定的幀長(zhǎng),本 發(fā)明中任意幀的幀長(zhǎng)為256。為了防止相鄰兩幀的帶噪信號(hào)單元間的塊效應(yīng),在分幀時(shí)要使相鄰兩幀的帶噪信 號(hào)單元之間有一定的混疊部分,即,本幀數(shù)據(jù)中有D個(gè)數(shù)據(jù)為前一幀數(shù)據(jù)的部分?jǐn)?shù)據(jù),其中 混疊部分描述如下si (n) = di (m, D+n)0 彡 n < L,i = 1,2其中si表示輸入帶噪語(yǔ)音信號(hào),i取1和2分別表示兩路信號(hào)d(m,n) = d(m-l,L+n)0 ^ n < D其中,di表示當(dāng)前幀的256點(diǎn)采樣信號(hào),因?yàn)槿我庖粠拈L(zhǎng)度為256,重疊率為 75%,所以重疊部分的采樣點(diǎn)個(gè)數(shù)D = 192。相鄰幀的帶噪信號(hào)單元的第一個(gè)采樣點(diǎn)相隔的 距離 L = 256-192 = 64。本發(fā)明相鄰兩幀的帶噪信號(hào)單元之間可以具有50% 75%的重疊率。本實(shí)施方 式選取相鄰兩幀的帶噪信號(hào)單元之間具有75%的重疊率,即以本幀的前75% (192點(diǎn))的 帶噪信號(hào)單元和前一幀后75% (192點(diǎn))的帶噪語(yǔ)音信號(hào)單元一致。分幀后的帶噪語(yǔ)音信號(hào),先經(jīng)過(guò)一個(gè)高通濾波器,作為預(yù)加重處理。由于語(yǔ)音信 號(hào)中背景噪聲在低頻部分能量一般較大,所以使用所述高通濾波器可以衰減低頻部分的分 量,使增強(qiáng)效果更好。其形式如下H(z)=l_az-1a 一般取值在0. 75-0. 95之間,這里a = 0. 9,可以取得較好的效果。由于語(yǔ)音信號(hào)是短時(shí)平穩(wěn)的,所以可以對(duì)信號(hào)進(jìn)行分幀處理,但分幀又會(huì)帶來(lái)幀 信號(hào)邊界處的不連續(xù)造成的頻率泄露。所以這里要進(jìn)行短時(shí)傅里葉變換(STFT)。短時(shí)傅里 葉變換可以理解為對(duì)幀信號(hào)先加窗再做傅里葉變換。加窗函數(shù)的目的就是為了在做短時(shí)傅 里葉變換時(shí),減少幀信號(hào)邊界處的不連續(xù)造成的頻率泄露,從而減少“塊效應(yīng)”。這里使用了 一個(gè)長(zhǎng)度等于幀長(zhǎng)256點(diǎn)的漢明窗,它可以有效的降低吉布斯效應(yīng)的震蕩程度。漢明窗函數(shù)定義如下win(n) = {0. 54-0. 46cos (2* n *n/M)0 彡 n 彡 M_10其余 n}
短時(shí)傅里葉變換如下
權(quán)利要求
一種語(yǔ)音增強(qiáng)的方法,其特征在于,該方法包括以下步驟步驟(1)將聲音采集裝置采集到的帶噪語(yǔ)音信號(hào)用芯片進(jìn)行分幀、預(yù)加重處理、再經(jīng)過(guò)短時(shí)傅里葉變換到頻域得到頻域信號(hào);步驟(2)將頻域信號(hào)劃分為若干頻帶,計(jì)算各個(gè)頻帶的能量;步驟(3)根據(jù)各個(gè)頻帶的能量利用計(jì)算器計(jì)算各個(gè)頻帶的后驗(yàn)信噪比,再根據(jù)各頻帶的能量和后驗(yàn)信噪比利用計(jì)算器計(jì)算各個(gè)頻帶的先驗(yàn)信噪比估計(jì)值;步驟(4)利用修正器對(duì)各個(gè)頻帶的先驗(yàn)信噪比估計(jì)值進(jìn)行修正,得到各個(gè)頻帶的先驗(yàn)信噪比修正值;步驟(5)根據(jù)當(dāng)前幀先驗(yàn)信噪比修正值,利用判斷器判斷當(dāng)前幀是否為純?cè)胍舨⒂涗浥袛嘟Y(jié)果,如果當(dāng)前幀是純?cè)胍羟以摦?dāng)前幀的前若干幀均為純?cè)胍簦瑘?zhí)行步驟6,反之執(zhí)行步驟7;步驟(6)首先,根據(jù)各個(gè)頻帶的先驗(yàn)信噪比修正值利用計(jì)算器計(jì)算各個(gè)頻帶的衰減增益;其次,利用調(diào)整器對(duì)增益系數(shù)進(jìn)行調(diào)整得到衰減增益調(diào)整值;再次,利用乘法器將頻域信號(hào)與衰減增益調(diào)整值相乘,得到處理后的頻域信號(hào);步驟(7)增強(qiáng)語(yǔ)音信號(hào),其包括如下步驟步驟001利用計(jì)算器計(jì)算LPC參數(shù)、增益因子和信號(hào)功率譜;其次,構(gòu)造因果維納濾波器,再利用乘法器將頻域信號(hào)與因果維納濾波器相乘,得到當(dāng)前幀處理后的語(yǔ)音信號(hào)和后一幀處理后的語(yǔ)音信號(hào);步驟002利用比較器比較當(dāng)前幀處理后的語(yǔ)音信號(hào)和后一幀處理后的語(yǔ)音信號(hào)是否小于某一閾值,如果小于,得到處理后的頻域信號(hào);如果不小于,重復(fù)步驟001和步驟002;步驟(8)對(duì)各頻帶的噪音能量進(jìn)行更新,得到更新后的噪音能量做為下一幀計(jì)算后驗(yàn)信噪比的基礎(chǔ);步驟(9)將處理后的頻域信號(hào)變換到時(shí)間域,進(jìn)行去加重處理并得到輸出信號(hào)。
2.根據(jù)權(quán)利要求1所述的語(yǔ)音增強(qiáng)的方法,其特征在于所述判斷器采用先驗(yàn)信噪比 的語(yǔ)音激活檢測(cè)方法判斷純?cè)胍簟?br>
3.一種語(yǔ)音增強(qiáng)裝置,其特征在于所述該裝置包括聲音采集裝置和集成如權(quán)利要求 1所述語(yǔ)音增強(qiáng)的方法的芯片。
全文摘要
本發(fā)明提供了一種語(yǔ)音增強(qiáng)的方法,該方法包括如下步驟利用判斷器判斷當(dāng)前幀是否為純?cè)胍?,如果?dāng)前幀是純?cè)胍羟以摦?dāng)前幀的前若干幀均為純?cè)胍?,利用改進(jìn)譜減法的語(yǔ)音增強(qiáng)算法改進(jìn)頻域信號(hào),反之語(yǔ)音生成模型的增強(qiáng)算法改進(jìn)頻域信號(hào);將處理后的頻域信號(hào)變換到時(shí)間域,進(jìn)行去加重處理并得到輸出信號(hào)。本發(fā)明另提供一種應(yīng)用該方法的裝置。本發(fā)明的語(yǔ)音增強(qiáng)的方法,大大提高了對(duì)殘余噪聲的衰減,保證了語(yǔ)音可懂度。
文檔編號(hào)G10L21/02GK101976566SQ20101022430
公開(kāi)日2011年2月16日 申請(qǐng)日期2010年7月9日 優(yōu)先權(quán)日2010年7月9日
發(fā)明者葉利劍 申請(qǐng)人:瑞聲聲學(xué)科技(深圳)有限公司;瑞聲光電科技(常州)有限公司