語(yǔ)音增強(qiáng)方法及應(yīng)用該方法的裝置的制作方法

文檔序號(hào)：2823705閱讀：138來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專(zhuān)利名稱(chēng)：語(yǔ)音增強(qiáng)方法及應(yīng)用該方法的裝置的制作方法
語(yǔ)音增強(qiáng)方法及應(yīng)用該方法的裝置
技術(shù)領(lǐng)域：
本發(fā)明涉及一種語(yǔ)音增強(qiáng)方法。背景技術(shù)：
由于大量環(huán)境噪聲的存在，手機(jī)等通訊設(shè)備的麥克風(fēng)采集到的語(yǔ)音信號(hào)普遍信噪比不夠高，特別是在街道汽車(chē)等高噪聲環(huán)境中，需要提高音量才能使對(duì)方聽(tīng)清。所以需要通過(guò)語(yǔ)音增強(qiáng)的方法來(lái)提升輸入語(yǔ)音的信噪比，改善通訊質(zhì)量。然而相關(guān)技術(shù)的譜減法語(yǔ)音增強(qiáng)方法降噪效果有限，并且會(huì)對(duì)語(yǔ)音造成較大失真。因此，有必要研究一種新的語(yǔ)音增強(qiáng)的方法，以達(dá)到良好的降噪效果。

發(fā)明內(nèi)容本發(fā)明需解決的技術(shù)問(wèn)題是提供一種降噪效果好的語(yǔ)音增強(qiáng)方法。根據(jù)上述的技術(shù)問(wèn)題，設(shè)計(jì)了一種語(yǔ)音增強(qiáng)的方法，其包括以下步驟一種語(yǔ)音增強(qiáng)的方法，其特征在于，該方法包括以下步驟步驟(1)將聲音采集裝置采集到的帶噪語(yǔ)音信號(hào)用芯片進(jìn)行分幀、預(yù)加重處理、再經(jīng)過(guò)短時(shí)傅里葉變換到頻域得到頻域信號(hào)；步驟(2)將頻域信號(hào)劃分為若干頻帶，計(jì)算各個(gè)頻帶的能量；步驟(3)根據(jù)各個(gè)頻帶的能量利用計(jì)算器計(jì)算各個(gè)頻帶的后驗(yàn)信噪比，再根據(jù)各頻帶的能量和后驗(yàn)信噪比利用計(jì)算器計(jì)算各個(gè)頻帶的先驗(yàn)信噪比估計(jì)值；步驟(4)利用修正器對(duì)各個(gè)頻帶的先驗(yàn)信噪比估計(jì)值進(jìn)行修正，得到各個(gè)頻帶的先驗(yàn)信噪比修正值；步驟(5)根據(jù)當(dāng)前幀先驗(yàn)信噪比修正值，利用判斷器判斷當(dāng)前幀是否為純?cè)胍舨?記錄判斷結(jié)果，如果當(dāng)前幀是純?cè)胍羟以摦?dāng)前幀的前若干幀均為純?cè)胍?，?zhí)行步驟6，反之執(zhí)行步驟7 ；步驟(6)首先，根據(jù)各個(gè)頻帶的先驗(yàn)信噪比修正值利用計(jì)算器計(jì)算各個(gè)頻帶的衰減增益；其次，利用調(diào)整器對(duì)增益系數(shù)進(jìn)行調(diào)整得到衰減增益調(diào)整值；再次，利用乘法器將頻域信號(hào)與衰減增益調(diào)整值相乘，得到處理后的頻域信號(hào)；步驟(7)增強(qiáng)語(yǔ)音信號(hào)，其包括如下步驟步驟001 利用計(jì)算器計(jì)算LPC參數(shù)、增益因子和信號(hào)功率譜；其次，構(gòu)造因果維納濾波器，再利用乘法器將頻域信號(hào)與因果維納濾波器相乘，得到當(dāng)前幀處理后的語(yǔ)音信號(hào) 和后一幀處理后的語(yǔ)音信號(hào)；步驟002 利用比較器比較當(dāng)前幀處理后的語(yǔ)音信號(hào)和后一幀處理后的語(yǔ)音信號(hào) 是否小于某一閾值，如果小于，得到處理后的頻域信號(hào)；如果不小于，重復(fù)步驟001和步驟 002 ；步驟(8)對(duì)各頻帶的噪音能量進(jìn)行更新，得到更新后的噪音能量做為下一幀計(jì)算后驗(yàn)信噪比的基礎(chǔ)；
步驟(9)將處理后的頻域信號(hào)變換到時(shí)間域，進(jìn)行去加重處理并得到輸出信號(hào)。優(yōu)選的，所述判斷器采用先驗(yàn)信噪比的語(yǔ)音激活檢測(cè)方法判斷純?cè)胍?。?yōu)選的，所述該裝置包括聲音采集裝置和集成如權(quán)利要求1所述語(yǔ)音增強(qiáng)的方法的芯片。與相關(guān)技術(shù)比較，本發(fā)明實(shí)時(shí)語(yǔ)音增強(qiáng)的方法在改進(jìn)的譜減算法基礎(chǔ)上，采用了基于語(yǔ)音生成模型的增強(qiáng)算法，抑制各種類(lèi)型的背景噪聲，提高語(yǔ)音清晰度。本發(fā)明的語(yǔ)音增強(qiáng)的方法，大大提高了對(duì)殘余噪聲的衰減，保證了語(yǔ)音可懂度。

圖1為本發(fā)明語(yǔ)音增強(qiáng)方法的流程示意圖。圖2為本發(fā)明語(yǔ)音增強(qiáng)方法步驟(6)的示意圖。圖3為本發(fā)明語(yǔ)音增強(qiáng)方法步驟(7)的示意圖。圖4為本發(fā)明語(yǔ)音增強(qiáng)方法中非線(xiàn)性計(jì)權(quán)曲線(xiàn)。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施方式對(duì)本發(fā)明作進(jìn)一步說(shuō)明。本發(fā)明的主要思想是，通過(guò)將一種語(yǔ)音增強(qiáng)方法集成在專(zhuān)用的芯片中，并通過(guò)該芯片與相應(yīng)的聲音采集裝置的接口數(shù)據(jù)傳輸，形成一個(gè)語(yǔ)音增強(qiáng)裝置。帶噪語(yǔ)音信號(hào)通過(guò) 聲音采集裝置采集，再經(jīng)過(guò)由芯片處理，得到信噪比增強(qiáng)后的信號(hào)，輸出供次級(jí)使用。本發(fā)明提供的語(yǔ)音增強(qiáng)裝置包括聲音采集裝置、集成本發(fā)明語(yǔ)音增強(qiáng)方法的芯片，所述芯片集成在該聲音采集裝置內(nèi)。如圖1、圖2和圖3所示，本發(fā)明語(yǔ)音增強(qiáng)方法，其包括以下步驟步驟(1)將聲音采集裝置采集到的帶噪語(yǔ)音信號(hào)用芯片進(jìn)行分幀、預(yù)加重處理、再經(jīng)過(guò)短時(shí)傅里葉變換到頻域得到頻域信號(hào)；步驟(2)將頻域信號(hào)劃分為若干頻帶，計(jì)算各個(gè)頻帶的能量；步驟(3)根據(jù)各個(gè)頻帶的能量利用計(jì)算器計(jì)算各個(gè)頻帶的后驗(yàn)信噪比，再根據(jù)各頻帶的能量和后驗(yàn)信噪比利用計(jì)算器計(jì)算各個(gè)頻帶的先驗(yàn)信噪比估計(jì)值；步驟(4)利用修正器對(duì)各個(gè)頻帶的先驗(yàn)信噪比估計(jì)值進(jìn)行修正，得到各個(gè)頻帶的先驗(yàn)信噪比修正值；步驟(5)根據(jù)當(dāng)前幀先驗(yàn)信噪比修正值，利用判斷器判斷當(dāng)前幀是否為純?cè)胍舨?記錄判斷結(jié)果，如果當(dāng)前幀是純?cè)胍羟以摦?dāng)前幀的前若干幀均為純?cè)胍?，?zhí)行步驟6，反之執(zhí)行步驟7 ；步驟(6)首先，根據(jù)各個(gè)頻帶的先驗(yàn)信噪比修正值利用計(jì)算器計(jì)算各個(gè)頻帶的衰減增益；其次，利用調(diào)整器對(duì)增益系數(shù)進(jìn)行調(diào)整得到衰減增益調(diào)整值；再次，利用乘法器將頻域信號(hào)與衰減增益調(diào)整值相乘，得到處理后的頻域信號(hào)；步驟(7)增強(qiáng)語(yǔ)音信號(hào)，其包括如下步驟步驟001 利用計(jì)算器計(jì)算LPC參數(shù)、增益因子和信號(hào)功率譜；其次，構(gòu)造因果維納濾波器，再利用乘法器將頻域信號(hào)與因果維納濾波器相乘，得到當(dāng)前幀處理后的語(yǔ)音信號(hào) 和后一幀處理后的語(yǔ)音信號(hào)；
4
步驟002 利用比較器比較當(dāng)前幀處理后的語(yǔ)音信號(hào)和后一幀處理后的語(yǔ)音信號(hào) 是否小于某一閾值，如果小于，得到處理后的頻域信號(hào)；如果不小于，重復(fù)步驟001和步驟 002 ；步驟(8)對(duì)各頻帶的能量進(jìn)行更新，供下一幀使用；步驟(9)將處理后的頻域信號(hào)變換到時(shí)間域，進(jìn)行去加重處理并得到輸出信號(hào)。下面通過(guò)具體的實(shí)施例再詳細(xì)介紹上述方法，該語(yǔ)音增強(qiáng)方法輸入的帶噪語(yǔ)音信號(hào)的采樣率為8kHZ，精度為16位。首先，對(duì)在時(shí)域中的帶噪語(yǔ)音信號(hào)進(jìn)行分幀，是將帶噪語(yǔ)音信號(hào)以幀為單位等分成若干帶噪信號(hào)單元。所述帶噪信號(hào)單元由采樣點(diǎn)組成，本發(fā)明中選取了 8KHz的采樣頻率，根據(jù)短時(shí)譜分析的需要，幀長(zhǎng)一般設(shè)定成10 35ms之間，本實(shí)施方式以32ms分幀，即一幀帶噪信號(hào)單元設(shè)有256個(gè)采樣點(diǎn)，自然地，任意一幀帶噪信號(hào)單元具有一定的幀長(zhǎng)，本發(fā)明中任意幀的幀長(zhǎng)為256。為了防止相鄰兩幀的帶噪信號(hào)單元間的塊效應(yīng)，在分幀時(shí)要使相鄰兩幀的帶噪信號(hào)單元之間有一定的混疊部分，即，本幀數(shù)據(jù)中有D個(gè)數(shù)據(jù)為前一幀數(shù)據(jù)的部分?jǐn)?shù)據(jù)，其中混疊部分描述如下si (n) = di (m, D+n)0 彡 n < L，i = 1，2其中si表示輸入帶噪語(yǔ)音信號(hào)，i取1和2分別表示兩路信號(hào)d(m，n) = d(m-l，L+n)0 ^ n < D其中，di表示當(dāng)前幀的256點(diǎn)采樣信號(hào)，因?yàn)槿我庖粠拈L(zhǎng)度為256，重疊率為 75%，所以重疊部分的采樣點(diǎn)個(gè)數(shù)D = 192。相鄰幀的帶噪信號(hào)單元的第一個(gè)采樣點(diǎn)相隔的距離 L = 256-192 = 64。本發(fā)明相鄰兩幀的帶噪信號(hào)單元之間可以具有50% 75%的重疊率。本實(shí)施方式選取相鄰兩幀的帶噪信號(hào)單元之間具有75%的重疊率，即以本幀的前75% (192點(diǎn))的帶噪信號(hào)單元和前一幀后75% (192點(diǎn))的帶噪語(yǔ)音信號(hào)單元一致。分幀后的帶噪語(yǔ)音信號(hào)，先經(jīng)過(guò)一個(gè)高通濾波器，作為預(yù)加重處理。由于語(yǔ)音信號(hào)中背景噪聲在低頻部分能量一般較大，所以使用所述高通濾波器可以衰減低頻部分的分量，使增強(qiáng)效果更好。其形式如下H(z)=l_az-1a 一般取值在0. 75-0. 95之間，這里a = 0. 9，可以取得較好的效果。由于語(yǔ)音信號(hào)是短時(shí)平穩(wěn)的，所以可以對(duì)信號(hào)進(jìn)行分幀處理，但分幀又會(huì)帶來(lái)幀信號(hào)邊界處的不連續(xù)造成的頻率泄露。所以這里要進(jìn)行短時(shí)傅里葉變換(STFT)。短時(shí)傅里葉變換可以理解為對(duì)幀信號(hào)先加窗再做傅里葉變換。加窗函數(shù)的目的就是為了在做短時(shí)傅里葉變換時(shí)，減少幀信號(hào)邊界處的不連續(xù)造成的頻率泄露，從而減少“塊效應(yīng)”。這里使用了一個(gè)長(zhǎng)度等于幀長(zhǎng)256點(diǎn)的漢明窗，它可以有效的降低吉布斯效應(yīng)的震蕩程度。漢明窗函數(shù)定義如下win(n) = {0. 54-0. 46cos (2* n *n/M)0 彡 n 彡 M_10其余 n}
短時(shí)傅里葉變換如下
權(quán)利要求
一種語(yǔ)音增強(qiáng)的方法，其特征在于，該方法包括以下步驟步驟(1)將聲音采集裝置采集到的帶噪語(yǔ)音信號(hào)用芯片進(jìn)行分幀、預(yù)加重處理、再經(jīng)過(guò)短時(shí)傅里葉變換到頻域得到頻域信號(hào)；步驟(2)將頻域信號(hào)劃分為若干頻帶，計(jì)算各個(gè)頻帶的能量；步驟(3)根據(jù)各個(gè)頻帶的能量利用計(jì)算器計(jì)算各個(gè)頻帶的后驗(yàn)信噪比，再根據(jù)各頻帶的能量和后驗(yàn)信噪比利用計(jì)算器計(jì)算各個(gè)頻帶的先驗(yàn)信噪比估計(jì)值；步驟(4)利用修正器對(duì)各個(gè)頻帶的先驗(yàn)信噪比估計(jì)值進(jìn)行修正，得到各個(gè)頻帶的先驗(yàn)信噪比修正值；步驟(5)根據(jù)當(dāng)前幀先驗(yàn)信噪比修正值，利用判斷器判斷當(dāng)前幀是否為純?cè)胍舨⒂涗浥袛嘟Y(jié)果，如果當(dāng)前幀是純?cè)胍羟以摦?dāng)前幀的前若干幀均為純?cè)胍簦瑘?zhí)行步驟6，反之執(zhí)行步驟7；步驟(6)首先，根據(jù)各個(gè)頻帶的先驗(yàn)信噪比修正值利用計(jì)算器計(jì)算各個(gè)頻帶的衰減增益；其次，利用調(diào)整器對(duì)增益系數(shù)進(jìn)行調(diào)整得到衰減增益調(diào)整值；再次，利用乘法器將頻域信號(hào)與衰減增益調(diào)整值相乘，得到處理后的頻域信號(hào)；步驟(7)增強(qiáng)語(yǔ)音信號(hào)，其包括如下步驟步驟001利用計(jì)算器計(jì)算LPC參數(shù)、增益因子和信號(hào)功率譜；其次，構(gòu)造因果維納濾波器，再利用乘法器將頻域信號(hào)與因果維納濾波器相乘，得到當(dāng)前幀處理后的語(yǔ)音信號(hào)和后一幀處理后的語(yǔ)音信號(hào)；步驟002利用比較器比較當(dāng)前幀處理后的語(yǔ)音信號(hào)和后一幀處理后的語(yǔ)音信號(hào)是否小于某一閾值，如果小于，得到處理后的頻域信號(hào)；如果不小于，重復(fù)步驟001和步驟002；步驟(8)對(duì)各頻帶的噪音能量進(jìn)行更新，得到更新后的噪音能量做為下一幀計(jì)算后驗(yàn)信噪比的基礎(chǔ)；步驟(9)將處理后的頻域信號(hào)變換到時(shí)間域，進(jìn)行去加重處理并得到輸出信號(hào)。
2.根據(jù)權(quán)利要求1所述的語(yǔ)音增強(qiáng)的方法，其特征在于所述判斷器采用先驗(yàn)信噪比的語(yǔ)音激活檢測(cè)方法判斷純?cè)胍簟?br> 3.一種語(yǔ)音增強(qiáng)裝置，其特征在于所述該裝置包括聲音采集裝置和集成如權(quán)利要求 1所述語(yǔ)音增強(qiáng)的方法的芯片。
全文摘要
本發(fā)明提供了一種語(yǔ)音增強(qiáng)的方法，該方法包括如下步驟利用判斷器判斷當(dāng)前幀是否為純?cè)胍?，如果?dāng)前幀是純?cè)胍羟以摦?dāng)前幀的前若干幀均為純?cè)胍?，利用改進(jìn)譜減法的語(yǔ)音增強(qiáng)算法改進(jìn)頻域信號(hào)，反之語(yǔ)音生成模型的增強(qiáng)算法改進(jìn)頻域信號(hào)；將處理后的頻域信號(hào)變換到時(shí)間域，進(jìn)行去加重處理并得到輸出信號(hào)。本發(fā)明另提供一種應(yīng)用該方法的裝置。本發(fā)明的語(yǔ)音增強(qiáng)的方法，大大提高了對(duì)殘余噪聲的衰減，保證了語(yǔ)音可懂度。
文檔編號(hào)G10L21/02GK101976566SQ20101022430
公開(kāi)日2011年2月16日申請(qǐng)日期2010年7月9日優(yōu)先權(quán)日2010年7月9日
發(fā)明者葉利劍申請(qǐng)人:瑞聲聲學(xué)科技(深圳)有限公司;瑞聲光電科技(常州)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：葉利劍
技術(shù)所有人：瑞聲聲學(xué)科技（深圳）有限公司;瑞聲光電科技（常州）有限公司
我是此專(zhuān)利的發(fā)明人