利用增益自適應(yīng)提高語音識(shí)別率的方法

文檔序號(hào)：7601605閱讀：381來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：利用增益自適應(yīng)提高語音識(shí)別率的方法
技術(shù)領(lǐng)域：
本發(fā)明涉及自動(dòng)語音識(shí)別領(lǐng)域，特別是一種利用增益自適應(yīng)提高語音識(shí)別率的方法。
背景技術(shù)：
近年來語音識(shí)別技術(shù)得到了巨大的發(fā)展，并且在手機(jī)等嵌入式領(lǐng)域大量普及，其中語音撥號(hào)程序更是逐漸成為高端智能手機(jī)的必備功能之一。使用語音撥號(hào)方便，快捷，不需記憶繁瑣的電話號(hào)碼，也不需要從屏幕上一頁頁的查找聯(lián)系人，極大的提高了人們的溝通效率。
但是現(xiàn)在各種語音識(shí)別方法以及產(chǎn)品在噪音環(huán)境中都表現(xiàn)不佳，主要存在以下幾個(gè)方面的問題一是噪音環(huán)境下的誤觸發(fā)問題，容易將吵鬧的背景音誤認(rèn)為開始說話。二是噪音環(huán)境下的識(shí)別率問題信噪比相對(duì)較低，因而導(dǎo)致識(shí)別率不高。三是噪音環(huán)境下的語音結(jié)束判斷問題容易將吵鬧的背景音誤認(rèn)為一直在說話，從而很長(zhǎng)時(shí)間都無法結(jié)束。四是噪音環(huán)境下的信道飽和問題外部環(huán)境吵鬧時(shí)信道容易飽和，從而使錄音數(shù)據(jù)失真，影響語音識(shí)別。

發(fā)明內(nèi)容
本發(fā)明的目的在于提出一種新的噪音環(huán)境下的評(píng)估處理方法，以使得在各種噪音環(huán)境中仍然能夠使用語音識(shí)別這一技術(shù)，并保證比較高的識(shí)別率。在噪音環(huán)境中提高手機(jī)語音識(shí)別率的方法，發(fā)明的基本特征是在噪音環(huán)境中通過對(duì)背景噪音的評(píng)估分析，相應(yīng)調(diào)節(jié)手機(jī)的錄音增益，調(diào)整端點(diǎn)檢測(cè)方法參數(shù)，以達(dá)到抑止通道飽和，增加信噪比，進(jìn)而提高語音識(shí)別率以及任務(wù)完成率。
該發(fā)明的技術(shù)要點(diǎn)是，在吵鬧環(huán)境中，用戶會(huì)自覺將手機(jī)靠近嘴說話，或者提高聲音。因此，根據(jù)此時(shí)背景噪音的評(píng)估設(shè)置相應(yīng)的麥克風(fēng)增益，同時(shí)調(diào)節(jié)端點(diǎn)檢測(cè)方法參數(shù)。如果環(huán)境很吵，則降低增益，否則提高增益，這樣能夠最大可能的壓制噪音，提高信噪比。
利用增益自適應(yīng)提高語音識(shí)別率的方法，其特征是通過噪音評(píng)估，調(diào)節(jié)錄音增益，調(diào)整端點(diǎn)檢測(cè)方法參數(shù)來提高語音識(shí)別率。
根據(jù)評(píng)估出來的背景設(shè)定不同的增益值，方法如下在每種噪音環(huán)境中，通過調(diào)節(jié)錄音增益，用權(quán)利要求2提供的方法分別測(cè)試并記錄所有增益下的背景音評(píng)估值，然后從中選擇使得背景噪音評(píng)估取值最小的增益值。這樣就得到一個(gè)背景類型和增益值的對(duì)應(yīng)表，增益的調(diào)節(jié)按照這個(gè)表來進(jìn)行。
該方法主要由以下幾個(gè)連續(xù)的流程組成背景音評(píng)估，錄音增益調(diào)整，端點(diǎn)檢測(cè)，進(jìn)行識(shí)別。具體說明如下1.背景音評(píng)估方法本方法用于評(píng)估當(dāng)前的背景環(huán)境噪聲。用相互不疊加的長(zhǎng)度為N＝960(0.125秒)的矩形窗把語音分成K段，并計(jì)算每一段的子帶能量Ei(i＝0，1，...，K)。則在檢測(cè)到第i個(gè)語音塊時(shí)的背景噪聲的計(jì)算公式為B＝[Ei+(ω-1)B]/ω，其中ω是一個(gè)正整數(shù)，我們?nèi)ˇ兀?0。根據(jù)計(jì)算出來的B值范圍作等差分布，將背景環(huán)境劃分為以下幾個(gè)類型安靜環(huán)境如辦公室普通環(huán)境如室外吵鬧環(huán)境如公共汽車上2.錄音增益調(diào)整方法在吵鬧的背景中，用戶習(xí)慣大聲說話，而在安靜的環(huán)境中用戶通常會(huì)輕輕的說話。這樣在用戶的參與下，能夠保證一定的信噪比，進(jìn)而保證識(shí)別率。但是存在以下問題在吵鬧環(huán)境下說話聲稍微提高就容易造成通道飽和，數(shù)據(jù)失真，從而降低識(shí)別率。另一方面，背景音的能量起伏變化很大，給語音的起始結(jié)束判斷帶來難度。
錄音增益調(diào)整的目的是使得在任何環(huán)境下保證錄下的背景噪音保持一個(gè)穩(wěn)定的水平，從而解決上面提到的問題。方法的主要步驟如下首先給定的手機(jī)必須能夠設(shè)置錄音增益。在步驟一中評(píng)估出來的每種噪音環(huán)境中，通過調(diào)節(jié)錄音增益，用同樣的方法分別測(cè)試并記錄所有增益下的背景音評(píng)估值。然后從中選擇使得背景噪音評(píng)估取值最小的增益值。這樣就得到一個(gè)背景類型和增益值的對(duì)應(yīng)表，增益的調(diào)節(jié)按照這個(gè)表來進(jìn)行。對(duì)于不同型號(hào)的手機(jī)這個(gè)表不完全相同，需要通過該方法測(cè)試得到。下面是在某款手機(jī)上的實(shí)測(cè)數(shù)據(jù)(該手機(jī)的增益調(diào)節(jié)范圍為1到30)

3.端點(diǎn)檢測(cè)方法本端點(diǎn)檢測(cè)方法對(duì)語音的首尾端點(diǎn)分別采用不同的檢測(cè)方法。
以往的研究結(jié)果表明，準(zhǔn)確確定語音的尾端點(diǎn)更難，特別是對(duì)于某些被弱化了的語音結(jié)尾，很容易被丟失，從而造成識(shí)別錯(cuò)誤。因此我們采用語音識(shí)別過程來決定語音的尾端點(diǎn)當(dāng)系統(tǒng)檢測(cè)到語音，并且最佳路徑已經(jīng)到達(dá)詞尾的靜音模型并保持連續(xù)0.375秒，則判定語音結(jié)束，測(cè)試表明，該方法對(duì)尾端點(diǎn)的檢測(cè)準(zhǔn)確率接近100％，優(yōu)于任何尾端點(diǎn)檢測(cè)方法。
語音首端點(diǎn)的檢測(cè)采用基于子帶能量的方法，判決門限的計(jì)算公式為T＝λB，其中λ為一個(gè)常量，這里選擇λ＝14，B為評(píng)估的背景噪聲值。判決方法假設(shè)當(dāng)前塊語音的能量為E，首先更新背景噪聲的值B；當(dāng)E＜＝T時(shí)，表示是背景噪聲，則并將最新的兩塊語音(0.25秒)保存下來；當(dāng)E＞T時(shí)，表示檢測(cè)到語音，由于還保存了0.25秒的語音，因此將語音首端點(diǎn)向前推0.25秒，以保證語音不被丟失。
本發(fā)明的優(yōu)點(diǎn)在于能夠有效解決噪音環(huán)境中使用語音識(shí)別遇到的系列問題，提高識(shí)別率和任務(wù)完成率。
實(shí)例分別在電視機(jī)前，城鐵，馬路上錄制一批數(shù)據(jù)，圖1是使用本方法前后的任務(wù)完成率對(duì)比數(shù)據(jù)(百分比數(shù)據(jù))。
以下專有名詞“噪音自適應(yīng)”，“SEA(Smart EnvironmentAdaptation)”，其表現(xiàn)為在各種噪音環(huán)境中都能有效提高語音識(shí)別率。
利用使用者說話習(xí)慣，在吵鬧環(huán)境中降低錄音增益，抑止通道飽和。

圖1是使用本發(fā)明方法前后的任務(wù)完成率對(duì)比數(shù)據(jù)(百分比數(shù)據(jù))圖。
圖2是本發(fā)明的利用增益自適應(yīng)提高語音識(shí)別率方法流程圖。
具體實(shí)施例方式
圖1是使用本方法前后的任務(wù)完成率對(duì)比數(shù)據(jù)(百分比數(shù)據(jù))。
分別在電視機(jī)前，城鐵，馬路上錄制一批數(shù)據(jù)比較結(jié)果。在各種噪音環(huán)境中都能有效提高語音識(shí)別率。
圖2的利用增益自適應(yīng)提高語音識(shí)別率方法，其步驟如下步驟S1，評(píng)估背景噪音；步驟S2，根據(jù)步驟S1評(píng)估出來的背景噪音類型調(diào)整錄音增益；步驟S3，在步驟S1，S2的基礎(chǔ)上進(jìn)行端點(diǎn)檢測(cè)和語音識(shí)別。
權(quán)利要求
1.一種利用增益自適應(yīng)提高語音識(shí)別率的方法，其特征是通過噪音評(píng)估，調(diào)節(jié)錄音增益，調(diào)整端點(diǎn)檢測(cè)方法參數(shù)來提高語音識(shí)別率。
2.根據(jù)權(quán)利要求1所述的背景音評(píng)估方法，其特征是根據(jù)歷史噪音和當(dāng)前噪音將背景環(huán)境分類，具體方法為用相互不疊加的長(zhǎng)度為N＝960(0.125秒)的矩形窗把語音分成K段，并計(jì)算每一段的子帶能量Ei(i＝0，1，…，K)，則在檢測(cè)到第i個(gè)語音塊時(shí)的背景噪聲的計(jì)算公式為B＝[Ei+(ω-1)B]/ω，其中ω是一個(gè)正整數(shù)，我們?nèi)ˇ兀?0，將背景噪音劃分為三種類型安靜環(huán)境，如辦公室，普通環(huán)境，如室外，吵鬧環(huán)境，如公共汽車上。
3.根據(jù)權(quán)利要求1所述的錄音增益調(diào)整方法，其特征是根據(jù)評(píng)估出來的背景設(shè)定不同的增益值，方法如下在每種噪音環(huán)境中，通過調(diào)節(jié)錄音增益，用權(quán)利要求2提供的方法分別測(cè)試并記錄所有增益下的背景音評(píng)估值，然后從中選擇使得背景噪音評(píng)估取值最小的增益值，這樣就得到一個(gè)背景類型和增益值的對(duì)應(yīng)表，增益的調(diào)節(jié)按照這個(gè)表來進(jìn)行。
4.根據(jù)權(quán)利要求1所述的端點(diǎn)檢測(cè)方法，其特征是首尾端點(diǎn)采用不同的檢測(cè)方法，并根據(jù)背景評(píng)估出來的參數(shù)調(diào)節(jié)。采用語音識(shí)別過程來決定語音的尾端點(diǎn)當(dāng)系統(tǒng)檢測(cè)到語音，并且最佳路徑已經(jīng)到達(dá)詞尾的靜音模型并保持連續(xù)0.375秒，則判定語音結(jié)束。語音首端點(diǎn)的檢測(cè)采用基于子帶能量的方法，判決門限的計(jì)算公式為T＝λB，其中λ為一個(gè)常量，這里選擇λ＝14，B為評(píng)估的背景噪聲值。
5.根據(jù)權(quán)利要求1的利用增益自適應(yīng)提高語音識(shí)別率的方法，其具體步驟如下步驟S1，評(píng)估背景噪音；步驟S2，根據(jù)步驟S1評(píng)估出來的背景噪音類型調(diào)整錄音增益；步驟S3，在步驟S1，S2的基礎(chǔ)上進(jìn)行端點(diǎn)檢測(cè)和語音識(shí)別。
全文摘要
本發(fā)明涉及自動(dòng)語音識(shí)別領(lǐng)域，特點(diǎn)是一種利用增益自適應(yīng)提高語音識(shí)別率的方法。通過噪音評(píng)估，調(diào)節(jié)錄音增益，調(diào)整端點(diǎn)檢測(cè)方法參數(shù)來提高語音識(shí)別率。其具體步驟如下步驟S1，評(píng)估背景噪音；步驟S2，根據(jù)步驟S1評(píng)估出來的背景噪音類型調(diào)整錄音增益；步驟S3，在步驟S1，S2的基礎(chǔ)上進(jìn)行端點(diǎn)檢測(cè)和語音識(shí)別。
文檔編號(hào)H04M9/08GK1801326SQ20041010465
公開日2006年7月12日申請(qǐng)日期2004年12月31日優(yōu)先權(quán)日2004年12月31日
發(fā)明者徐波, 謝傳泉, 張東泉, 普劍濤, 張亮, 張建申請(qǐng)人:中國科學(xué)院自動(dòng)化研究所

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：徐波;謝傳泉;張東泉;普劍濤;張亮;張建
技術(shù)所有人：中國科學(xué)院自動(dòng)化研究所
我是此專利的發(fā)明人

上一篇：節(jié)目預(yù)選裝置及程序的制作方法
上一篇：下行呼叫接入控制方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

增益自適應(yīng)相關(guān)技術(shù)

增益自適應(yīng)smith相關(guān)技術(shù)

如何提高語音識(shí)別率相關(guān)技術(shù)

提高天線增益的方法相關(guān)技術(shù)

提高天線增益相關(guān)技術(shù)

如何提高微帶天線增益相關(guān)技術(shù)

語音識(shí)別相關(guān)技術(shù)

百度語音識(shí)別相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

利用增益自適應(yīng)提高語音識(shí)別率的方法