亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

利用增益自適應(yīng)提高語音識(shí)別率的方法

文檔序號(hào):7601605閱讀:381來源:國知局
專利名稱:利用增益自適應(yīng)提高語音識(shí)別率的方法
技術(shù)領(lǐng)域
本發(fā)明涉及自動(dòng)語音識(shí)別領(lǐng)域,特別是一種利用增益自適應(yīng)提高語音識(shí)別率的方法。
背景技術(shù)
近年來語音識(shí)別技術(shù)得到了巨大的發(fā)展,并且在手機(jī)等嵌入式領(lǐng)域大量普及,其中語音撥號(hào)程序更是逐漸成為高端智能手機(jī)的必備功能之一。使用語音撥號(hào)方便,快捷,不需記憶繁瑣的電話號(hào)碼,也不需要從屏幕上一頁頁的查找聯(lián)系人,極大的提高了人們的溝通效率。
但是現(xiàn)在各種語音識(shí)別方法以及產(chǎn)品在噪音環(huán)境中都表現(xiàn)不佳,主要存在以下幾個(gè)方面的問題一是噪音環(huán)境下的誤觸發(fā)問題,容易將吵鬧的背景音誤認(rèn)為開始說話。二是噪音環(huán)境下的識(shí)別率問題信噪比相對(duì)較低,因而導(dǎo)致識(shí)別率不高。三是噪音環(huán)境下的語音結(jié)束判斷問題容易將吵鬧的背景音誤認(rèn)為一直在說話,從而很長(zhǎng)時(shí)間都無法結(jié)束。四是噪音環(huán)境下的信道飽和問題外部環(huán)境吵鬧時(shí)信道容易飽和,從而使錄音數(shù)據(jù)失真,影響語音識(shí)別。

發(fā)明內(nèi)容
本發(fā)明的目的在于提出一種新的噪音環(huán)境下的評(píng)估處理方法,以使得在各種噪音環(huán)境中仍然能夠使用語音識(shí)別這一技術(shù),并保證比較高的識(shí)別率。在噪音環(huán)境中提高手機(jī)語音識(shí)別率的方法,發(fā)明的基本特征是在噪音環(huán)境中通過對(duì)背景噪音的評(píng)估分析,相應(yīng)調(diào)節(jié)手機(jī)的錄音增益,調(diào)整端點(diǎn)檢測(cè)方法參數(shù),以達(dá)到抑止通道飽和,增加信噪比,進(jìn)而提高語音識(shí)別率以及任務(wù)完成率。
該發(fā)明的技術(shù)要點(diǎn)是,在吵鬧環(huán)境中,用戶會(huì)自覺將手機(jī)靠近嘴說話,或者提高聲音。因此,根據(jù)此時(shí)背景噪音的評(píng)估設(shè)置相應(yīng)的麥克風(fēng)增益,同時(shí)調(diào)節(jié)端點(diǎn)檢測(cè)方法參數(shù)。如果環(huán)境很吵,則降低增益,否則提高增益,這樣能夠最大可能的壓制噪音,提高信噪比。
利用增益自適應(yīng)提高語音識(shí)別率的方法,其特征是通過噪音評(píng)估,調(diào)節(jié)錄音增益,調(diào)整端點(diǎn)檢測(cè)方法參數(shù)來提高語音識(shí)別率。
根據(jù)評(píng)估出來的背景設(shè)定不同的增益值,方法如下在每種噪音環(huán)境中,通過調(diào)節(jié)錄音增益,用權(quán)利要求2提供的方法分別測(cè)試并記錄所有增益下的背景音評(píng)估值,然后從中選擇使得背景噪音評(píng)估取值最小的增益值。這樣就得到一個(gè)背景類型和增益值的對(duì)應(yīng)表,增益的調(diào)節(jié)按照這個(gè)表來進(jìn)行。
該方法主要由以下幾個(gè)連續(xù)的流程組成背景音評(píng)估,錄音增益調(diào)整,端點(diǎn)檢測(cè),進(jìn)行識(shí)別。具體說明如下1.背景音評(píng)估方法本方法用于評(píng)估當(dāng)前的背景環(huán)境噪聲。用相互不疊加的長(zhǎng)度為N=960(0.125秒)的矩形窗把語音分成K段,并計(jì)算每一段的子帶能量Ei(i=0,1,...,K)。則在檢測(cè)到第i個(gè)語音塊時(shí)的背景噪聲的計(jì)算公式為B=[Ei+(ω-1)B]/ω,其中ω是一個(gè)正整數(shù),我們?nèi)ˇ兀?0。根據(jù)計(jì)算出來的B值范圍作等差分布,將背景環(huán)境劃分為以下幾個(gè)類型安靜環(huán)境如辦公室普通環(huán)境如室外吵鬧環(huán)境如公共汽車上2.錄音增益調(diào)整方法在吵鬧的背景中,用戶習(xí)慣大聲說話,而在安靜的環(huán)境中用戶通常會(huì)輕輕的說話。這樣在用戶的參與下,能夠保證一定的信噪比,進(jìn)而保證識(shí)別率。但是存在以下問題在吵鬧環(huán)境下說話聲稍微提高就容易造成通道飽和,數(shù)據(jù)失真,從而降低識(shí)別率。另一方面,背景音的能量起伏變化很大,給語音的起始結(jié)束判斷帶來難度。
錄音增益調(diào)整的目的是使得在任何環(huán)境下保證錄下的背景噪音保持一個(gè)穩(wěn)定的水平,從而解決上面提到的問題。方法的主要步驟如下首先給定的手機(jī)必須能夠設(shè)置錄音增益。在步驟一中評(píng)估出來的每種噪音環(huán)境中,通過調(diào)節(jié)錄音增益,用同樣的方法分別測(cè)試并記錄所有增益下的背景音評(píng)估值。然后從中選擇使得背景噪音評(píng)估取值最小的增益值。這樣就得到一個(gè)背景類型和增益值的對(duì)應(yīng)表,增益的調(diào)節(jié)按照這個(gè)表來進(jìn)行。對(duì)于不同型號(hào)的手機(jī)這個(gè)表不完全相同,需要通過該方法測(cè)試得到。下面是在某款手機(jī)上的實(shí)測(cè)數(shù)據(jù)(該手機(jī)的增益調(diào)節(jié)范圍為1到30)

3.端點(diǎn)檢測(cè)方法本端點(diǎn)檢測(cè)方法對(duì)語音的首尾端點(diǎn)分別采用不同的檢測(cè)方法。
以往的研究結(jié)果表明,準(zhǔn)確確定語音的尾端點(diǎn)更難,特別是對(duì)于某些被弱化了的語音結(jié)尾,很容易被丟失,從而造成識(shí)別錯(cuò)誤。因此我們采用語音識(shí)別過程來決定語音的尾端點(diǎn)當(dāng)系統(tǒng)檢測(cè)到語音,并且最佳路徑已經(jīng)到達(dá)詞尾的靜音模型并保持連續(xù)0.375秒,則判定語音結(jié)束,測(cè)試表明,該方法對(duì)尾端點(diǎn)的檢測(cè)準(zhǔn)確率接近100%,優(yōu)于任何尾端點(diǎn)檢測(cè)方法。
語音首端點(diǎn)的檢測(cè)采用基于子帶能量的方法,判決門限的計(jì)算公式為T=λB,其中λ為一個(gè)常量,這里選擇λ=14,B為評(píng)估的背景噪聲值。判決方法假設(shè)當(dāng)前塊語音的能量為E,首先更新背景噪聲的值B;當(dāng)E<=T時(shí),表示是背景噪聲,則并將最新的兩塊語音(0.25秒)保存下來;當(dāng)E>T時(shí),表示檢測(cè)到語音,由于還保存了0.25秒的語音,因此將語音首端點(diǎn)向前推0.25秒,以保證語音不被丟失。
本發(fā)明的優(yōu)點(diǎn)在于能夠有效解決噪音環(huán)境中使用語音識(shí)別遇到的系列問題,提高識(shí)別率和任務(wù)完成率。
實(shí)例分別在電視機(jī)前,城鐵,馬路上錄制一批數(shù)據(jù),圖1是使用本方法前后的任務(wù)完成率對(duì)比數(shù)據(jù)(百分比數(shù)據(jù))。
以下專有名詞“噪音自適應(yīng)”,“SEA(Smart EnvironmentAdaptation)”,其表現(xiàn)為在各種噪音環(huán)境中都能有效提高語音識(shí)別率。
利用使用者說話習(xí)慣,在吵鬧環(huán)境中降低錄音增益,抑止通道飽和。


圖1是使用本發(fā)明方法前后的任務(wù)完成率對(duì)比數(shù)據(jù)(百分比數(shù)據(jù))圖。
圖2是本發(fā)明的利用增益自適應(yīng)提高語音識(shí)別率方法流程圖。
具體實(shí)施例方式
圖1是使用本方法前后的任務(wù)完成率對(duì)比數(shù)據(jù)(百分比數(shù)據(jù))。
分別在電視機(jī)前,城鐵,馬路上錄制一批數(shù)據(jù)比較結(jié)果。在各種噪音環(huán)境中都能有效提高語音識(shí)別率。
圖2的利用增益自適應(yīng)提高語音識(shí)別率方法,其步驟如下步驟S1,評(píng)估背景噪音;步驟S2,根據(jù)步驟S1評(píng)估出來的背景噪音類型調(diào)整錄音增益;步驟S3,在步驟S1,S2的基礎(chǔ)上進(jìn)行端點(diǎn)檢測(cè)和語音識(shí)別。
權(quán)利要求
1.一種利用增益自適應(yīng)提高語音識(shí)別率的方法,其特征是通過噪音評(píng)估,調(diào)節(jié)錄音增益,調(diào)整端點(diǎn)檢測(cè)方法參數(shù)來提高語音識(shí)別率。
2.根據(jù)權(quán)利要求1所述的背景音評(píng)估方法,其特征是根據(jù)歷史噪音和當(dāng)前噪音將背景環(huán)境分類,具體方法為用相互不疊加的長(zhǎng)度為N=960(0.125秒)的矩形窗把語音分成K段,并計(jì)算每一段的子帶能量Ei(i=0,1,…,K),則在檢測(cè)到第i個(gè)語音塊時(shí)的背景噪聲的計(jì)算公式為B=[Ei+(ω-1)B]/ω,其中ω是一個(gè)正整數(shù),我們?nèi)ˇ兀?0,將背景噪音劃分為三種類型安靜環(huán)境,如辦公室,普通環(huán)境,如室外,吵鬧環(huán)境,如公共汽車上。
3.根據(jù)權(quán)利要求1所述的錄音增益調(diào)整方法,其特征是根據(jù)評(píng)估出來的背景設(shè)定不同的增益值,方法如下在每種噪音環(huán)境中,通過調(diào)節(jié)錄音增益,用權(quán)利要求2提供的方法分別測(cè)試并記錄所有增益下的背景音評(píng)估值,然后從中選擇使得背景噪音評(píng)估取值最小的增益值,這樣就得到一個(gè)背景類型和增益值的對(duì)應(yīng)表,增益的調(diào)節(jié)按照這個(gè)表來進(jìn)行。
4.根據(jù)權(quán)利要求1所述的端點(diǎn)檢測(cè)方法,其特征是首尾端點(diǎn)采用不同的檢測(cè)方法,并根據(jù)背景評(píng)估出來的參數(shù)調(diào)節(jié)。采用語音識(shí)別過程來決定語音的尾端點(diǎn)當(dāng)系統(tǒng)檢測(cè)到語音,并且最佳路徑已經(jīng)到達(dá)詞尾的靜音模型并保持連續(xù)0.375秒,則判定語音結(jié)束。語音首端點(diǎn)的檢測(cè)采用基于子帶能量的方法,判決門限的計(jì)算公式為T=λB,其中λ為一個(gè)常量,這里選擇λ=14,B為評(píng)估的背景噪聲值。
5.根據(jù)權(quán)利要求1的利用增益自適應(yīng)提高語音識(shí)別率的方法,其具體步驟如下步驟S1,評(píng)估背景噪音;步驟S2,根據(jù)步驟S1評(píng)估出來的背景噪音類型調(diào)整錄音增益;步驟S3,在步驟S1,S2的基礎(chǔ)上進(jìn)行端點(diǎn)檢測(cè)和語音識(shí)別。
全文摘要
本發(fā)明涉及自動(dòng)語音識(shí)別領(lǐng)域,特點(diǎn)是一種利用增益自適應(yīng)提高語音識(shí)別率的方法。通過噪音評(píng)估,調(diào)節(jié)錄音增益,調(diào)整端點(diǎn)檢測(cè)方法參數(shù)來提高語音識(shí)別率。其具體步驟如下步驟S1,評(píng)估背景噪音;步驟S2,根據(jù)步驟S1評(píng)估出來的背景噪音類型調(diào)整錄音增益;步驟S3,在步驟S1,S2的基礎(chǔ)上進(jìn)行端點(diǎn)檢測(cè)和語音識(shí)別。
文檔編號(hào)H04M9/08GK1801326SQ20041010465
公開日2006年7月12日 申請(qǐng)日期2004年12月31日 優(yōu)先權(quán)日2004年12月31日
發(fā)明者徐波, 謝傳泉, 張東泉, 普劍濤, 張亮, 張建 申請(qǐng)人:中國科學(xué)院自動(dòng)化研究所
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1