本發(fā)明涉及一種增強系統(tǒng),特別是涉及一種語音質(zhì)量增強系統(tǒng)。
背景技術:
隨著手機等移動通信設備的普及,人們有條件實現(xiàn)隨時隨的語音通信,既可以在安靜的環(huán)境中,例如臥室或者醫(yī)院病房,也可以在喧鬧嘈雜的環(huán)境中。在移動語音通信時,如通過手機打電話時,環(huán)境噪聲通常起伏不定,噪聲特點差異大,例如公交車的噪聲、地鐵噪聲、街道噪聲、酒吧音樂噪聲等等,聲音音量及其頻率分布各不相同。隨著3G、4G和WIFI等無線IP網(wǎng)絡的進一步發(fā)展,無線VoIP業(yè)務正如火如荼地展開,手機和平板電腦等移動設備上的語音通信軟件層出不窮,例如skype、Viber、微信等等。隨著無線網(wǎng)絡帶寬增加,網(wǎng)絡資費下降,VoIP的使用者人數(shù)飛速增加,通話時間更長,使用地點隨時變換,使用環(huán)境更加復雜,這就對語音質(zhì)量,特別是通話語音的可懂度提出了更高的要求。實際上,衡量一款語音通信設備或者語音通信軟件優(yōu)劣的核心指標之一就是通話語音質(zhì)量和可懂度?,F(xiàn)有聲音舒適度控制方案大多是在發(fā)送端進行自動增益控制(AGC),例如公開號為CN102446510A的中國專利,其基本思路為:自動增益控制模塊G30將增益控制信息反饋到主動噪聲抑制模塊(ANS),ANS根據(jù)反饋信息即時調(diào)整噪聲抑制比,以使得經(jīng)過AGC處理后的背景噪聲更平穩(wěn)。該技術致力于解決發(fā)送端的背景噪聲平穩(wěn)性問題,不能解決接收端端的聲音可懂度問題。公開號為CN101370056B的中國專利對聲音采集設備的輸入聲音估計瞬時功率,根據(jù)該瞬時功率計算是否為背景噪聲,同時根據(jù)目標信號功率調(diào)整輸出信號增益,以達到使輸出信號更加平衡和諧的目的。該技術主要通過功率估計來解決音頻信號能量的平穩(wěn)問題,沒有考慮接收環(huán)境噪聲對可懂度的影響,對能量的調(diào)整主要是在時域進行增益調(diào)整,未聲明頻域的能量調(diào)整。公開號為CN102436821A的中國專利提出一種通過采集接收端環(huán)境噪聲調(diào)節(jié)音量的方案,并且當環(huán)境噪聲音量大于或小于某一個閾值時,進行高音或低音增強處理以提高清晰度。該技術致力于解決接收端語音的可懂度問題,但是采用的方法比較簡單。例如,音量調(diào)節(jié)按照與當前噪聲能量和參考噪聲能量之差呈正比關系的調(diào)節(jié)方式。音頻頻響的調(diào)整采用高頻或者低頻增強濾波的方式。并未考慮其它對可懂度的影響因素,如頻域的子帶能量調(diào)整、時域的輔音與元音能量比、話音活動檢測結果等,增強效果有限。公開號為CN101740036A的中國專利也是提高一種通過采集估計接收端環(huán)境噪聲進而調(diào)節(jié)音量的方案,該方案的特點在于假設語音信號具有自相關性并且噪聲具有隨機性,進而從總的音頻能量中估計出語音能量,通過濾除語音能量以達到檢測背景噪聲能量進而控制通話音量的目的。該技術通過采用不同的背景噪聲估計方法希望達到準確估計背景噪聲能量的目的。在通話音量調(diào)節(jié)方面方法更加簡單,其音量調(diào)整包括將音量變化某一預設音量,或者使通話音量與通話音量和該預設音量之和達到某一預設比值。音量調(diào)整方式簡單,并未充分從可懂度和質(zhì)量增強的角度考慮實現(xiàn)方法。噪聲估計方式也只能檢測隨機噪聲,未考慮各個頻帶的能量調(diào)整對可懂度的影響。
技術實現(xiàn)要素:
本發(fā)明所要解決的技術問題是提供一種語音質(zhì)量增強系統(tǒng),其提升不同環(huán)境下語音輸出設備所輸出的語音的舒適度和可懂度。本發(fā)明是通過下述技術方案來解決上述技術問題的:一種語音質(zhì)量增強系統(tǒng),其特征在于,其包括語音解碼器、時域自適應增益控制模塊、目標增益進行實時計算模塊、清音頻譜調(diào)節(jié)模塊、濁音頻譜調(diào)節(jié)模塊、環(huán)境噪聲采集和估計模塊以及音頻輸出模塊,語音解碼器、目標增益進行實時計算模塊、清音頻譜調(diào)節(jié)模塊、濁音頻譜調(diào)節(jié)模塊都與時域自適應增益控制模塊連接,目標增益進行實時計算模塊、濁音頻譜調(diào)節(jié)模塊都與環(huán)境噪聲采集和估計模塊連接,清音頻譜調(diào)節(jié)模塊、濁音頻譜調(diào)節(jié)模塊都與音頻輸出模塊連接。優(yōu)選地,所述語音解碼器用于對接收端收到的語音碼流進行解碼操作,得到時域語音樣本數(shù)據(jù);同時輸出話音類型標志,指示當前幀是背景音、清音還是濁音信號。優(yōu)選地,所述時域自適應增益控制模塊根據(jù)輸入語音樣本幅度、語音樣本類型以及目標增益,對輸入語音樣本幅度進行調(diào)整,使得輸入語音能量更佳平穩(wěn),并對發(fā)送端的背景噪聲進行抑制;當話音活動檢測標志顯示接收到的音頻信號為背景噪聲時,目標增益取較小值,當音頻信號為語音時,增益取較大值。優(yōu)選地,所述目標增益進行實時計算模塊對時域自適應增益控制模塊的目標增益進行實時計算,其輸入控制參數(shù)包括接收端的環(huán)境噪聲頻譜估計,目標增益將在預定增益的基礎上隨接收端噪聲能量的增加而增加。優(yōu)選地,所述清音頻譜調(diào)節(jié)模塊根據(jù)清音濁音標志,確定目前的語音信號幀屬于清音信號,并根據(jù)環(huán)境噪聲頻譜信息對語音頻譜進行增強處理。優(yōu)選地,所述濁音頻譜調(diào)節(jié)模塊根據(jù)清音濁音標志,確定目前的語音信號幀屬于濁音信號,并根據(jù)環(huán)境噪聲頻譜信息對濁音頻譜進行增強處理。優(yōu)選地,所述時域自適應增益控制模塊包括以下功能:當話音活動檢測標志顯示當前幀為背景噪聲信號時,將前一幀增益值與對應信號類型的預設因子相乘得到當前信號幀增益,并設定所得增益的上下限;當話音活動檢測標志顯示當前音頻信號幀為語音時,計算語音信號的長時平均能量統(tǒng)計值,其計算方式為利用音頻樣本計算的長時均方根能量統(tǒng)計凈值減去一預設背景能量值;根據(jù)所計算的當前能量統(tǒng)計值和當前目標增益值來計算當前語音幀增益因子,如果當前信號幀能量超過目標增益則被壓縮,反之則被放大;當前信號幀能量與目標增益的差值為正數(shù)和負數(shù)時,自適應速率不同;相鄰幀之間的增益進行平滑處理;幅度調(diào)整之后的音頻樣本進行限幅處理。優(yōu)選地,所述目標增益進行實時計算模塊包括以下功能:對環(huán)境噪聲頻譜估計參數(shù)進行分子帶處理,分帶方式包括但不限于根據(jù)梅爾頻率進行劃分;選取所關心的子帶來計算環(huán)境噪聲能量以模擬環(huán)境噪聲響度;對計算的環(huán)境噪聲能量進行平滑以避免能量過度波動,然后計算噪聲響度增益,噪聲越大增益越大;計算所述噪聲響度增益時需預先減去設定的基底噪聲能量,并限制噪聲響度增益最大值;將所述環(huán)境噪聲響度增益映射到自適應增益控制器的目標增益,環(huán)境噪聲越大,目標增益越大。優(yōu)選地,所述清音頻譜調(diào)節(jié)模塊包括以下功能:將音頻信號變換到頻域,并按照與環(huán)境噪聲頻譜估計參數(shù)相同的形式劃分子帶;由大到小選取占該幀總能量超過P%的子帶計算清音總能量,P等于10到100;選擇環(huán)境噪聲估計中與上述子帶對應的子帶,計算所選子帶的環(huán)境噪聲總能量;根據(jù)所述清音總能量和環(huán)境噪聲總能量計算信噪比,并根據(jù)目標信噪比調(diào)整頻譜能量;如果預設目標信噪比小于實際信噪比,則不做處理,如果預設目標信噪比大于實際信噪比,則放大所選子帶能量;子帶能量不超過某一預設值;相鄰幀對應子帶的放大因子做指數(shù)平滑以消除能量突變造成的失真;頻域信號到時域信號進行轉(zhuǎn)換。優(yōu)選地,所述濁音頻譜調(diào)節(jié)模塊包括以下功能:將音頻信號變換到頻域,并按照與環(huán)境噪聲頻譜估計相同的形式劃分子帶,計算所需濁音子帶的能量;利用所述濁音子帶能量與環(huán)境噪聲估計中對應的子帶能量,計算信噪比;搜索濁音信號共振峰,并根據(jù)所計算信噪比調(diào)整頻譜能量,包括:如果只有一個共振峰,則根據(jù)所計算的各個子帶的平均信噪比將濁音頻段信號能量進行高頻增強;最大能量小于某一預設閾值;信噪比越低,增強程度越大,頻譜越高,增強程度越大;如果有多于一個共振峰,則優(yōu)先放大高階共振峰所在子帶的能量;各個子帶的增益與相鄰子帶增益做平滑,以防相鄰子帶能量波動過大;相鄰幀的對應子帶做增益因子的平滑,以防時域能量波動過大;將頻域信號變換回時域信號。本發(fā)明的積極進步效果在于:本發(fā)明以使得語音通訊設備在接收端能根據(jù)所處環(huán)境噪聲更好地自動調(diào)節(jié)語音音量和頻譜,以獲得更佳的可懂度和用戶體驗。包括在接收端實現(xiàn)一個多帶自適應增益控制模塊,并且將該模塊與聲碼器的語音活動檢測參數(shù)相結合,既避免了傳統(tǒng)方法中需要專門提供一個語音活動檢測模塊所帶來的計算復雜度,又可以更好的與聲碼器協(xié)同工作,進而提供更準確的清音、濁音和靜音檢測。在語音通訊設備接收端提供一個噪聲采集和估計模塊,分頻帶對環(huán)境噪聲進行估計,估計結果供自適應增益控制模塊在頻域?qū)邮照Z音的子帶頻譜能量進行調(diào)整,減小環(huán)境噪聲對語音共振峰的掩蔽效應,以達到最大限度提升可懂度的目的。同時在時域根據(jù)輸入音頻幅度的大小以及語音活動檢測結果對輸出樣本幅度進行調(diào)整,根據(jù)[5]的研究成果,在噪聲環(huán)境下增大輔音與濁音的能量比,減小環(huán)境噪聲對語音,尤其是低能量輔音的掩蔽效應,進一步提升可懂度。附圖說明圖1為本發(fā)明語音質(zhì)量增強系統(tǒng)的原理圖。具體實施方式下面結合附圖給出本發(fā)明較佳實施例,以詳細說明本發(fā)明的技術方案。本發(fā)明用于在噪聲環(huán)境下增強語音播放設備所播放語音的舒適度和可懂度。如圖1所示,本發(fā)明語音質(zhì)量增強系統(tǒng)包括語音解碼器、時域自適應增益控制模塊、目標增益進行實時計算模塊、清音頻譜調(diào)節(jié)模塊、濁音頻譜調(diào)節(jié)模塊、環(huán)境噪聲采集和估計模塊以及音頻輸出模塊,語音解碼器、目標增益進行實時計算模塊、清音頻譜調(diào)節(jié)模塊、濁音頻譜調(diào)節(jié)模塊都與時域自適應增益控制模塊連接,目標增益進行實時計算模塊、濁音頻譜調(diào)節(jié)模塊都與環(huán)境噪聲采集和估計模塊連接,清音頻譜調(diào)節(jié)模塊、濁音頻譜調(diào)節(jié)模塊都與音頻輸出模塊連接。語音解碼器對接收端收到的語音碼流進行解碼操作,得到時域語音樣本數(shù)據(jù),用于輸出到時域自適應增益控制模塊;同時解碼器內(nèi)部包含話音類型標志,指示當前幀是背景音、清音還是濁音信號。時域自適應增益控制模塊根據(jù)輸入語音樣本幅度、語音樣本類型以及目標增益,對輸入語音樣本幅度進行調(diào)整,使得輸入語音能量更佳平穩(wěn),并對發(fā)送端的背景噪聲進行抑制。當話音活動檢測標志顯示接收到的音頻信號為背景噪聲時,目標增益取較小值,當音頻信號為語音時,增益取較大值。目標增益進行實時計算模塊對時域自適應增益控制模塊的目標增益進行實時計算,其輸入控制參數(shù)包括接收端的環(huán)境噪聲頻譜估計參數(shù),目標增益將在預定增益的基礎上隨接收端噪聲能量的增加而增加。環(huán)境噪聲采集和估計模塊產(chǎn)生環(huán)境噪聲頻譜估計參數(shù)。清音頻譜調(diào)節(jié)模塊根據(jù)解碼器內(nèi)部的清音濁音標志,確定目前的語音信號幀屬于清音信號,并根據(jù)環(huán)境噪聲頻譜信息對語音頻譜進行增強處理。濁音頻譜調(diào)節(jié)模塊根據(jù)解碼器內(nèi)部的清音濁音標志,確定目前的語音信號幀屬于濁音信號,并根據(jù)環(huán)境噪聲頻譜信息對濁音頻譜進行增強處理。頻譜增強之后的語音信號通過音頻輸出模塊輸出到對應設備。語音解碼器輸出話音類型檢測標志,話音類型檢測標志也可以由一個單獨的話音類型檢測模塊產(chǎn)生。清音和濁音的頻譜調(diào)整可以在頻域?qū)ψ訋芰恐苯诱{(diào)整,也可以由兩個自適應濾波器分別完成。語音解碼器用于對接收端收到的語音碼流進行解碼操作,得到時域語音樣本數(shù)據(jù);同時輸出話音類型標志,指示當前幀是背景音、清音還是濁音信號。進行自適應語音質(zhì)量增強時,音頻信號分幀進行處理,幀長度為N,N具體可以為1到2000等數(shù)值。時域自適應增益控制模塊根據(jù)輸入語音樣本幅度、語音樣本類型以及目標增益,對輸入語音樣本幅度進行調(diào)整,使得輸入語音能量更佳平穩(wěn),并對發(fā)送端的背景噪聲進行抑制;當話音活動檢測標志顯示接收到的音頻信號為背景噪聲時,目標增益取較小值,當音頻信號為語音時,增益取較大值。時域自適應增益控制模塊包括但不限于以下操作:當話音活動檢測標志顯示當前音頻信號幀為背景音時,計算當前背景音增益如下式(1):G=Gprev*FACTORb………………………………………(1)其中,Gprev為前一幀的音頻信號增益,F(xiàn)ACTORb為一預定因子,例如0.8。并滿足Gb不小于某一預設值Gb_MIN,例如Gb_MIN=0.2;當話音活動檢測標志顯示當前音頻信號幀為語音時,計算語音信號增益,包括:一、計算語音信號的當前能量統(tǒng)計值,如下式(2):Erms=Enet–EBG………………………………………(1)其中Enet為利用音頻樣本計算的當前均方根能量統(tǒng)計凈值,EBG為一預設背景能量值。二、根據(jù)Erms值和當前目標增益值Etarget來計算當前語音幀增益因子,如果當前信號幀能量超過目標能量則被壓縮,反之則被放大,如下式(3):FACTORs=FACTORs+[FACTORc*(Etarget-Erms)/Etarget]其中FACTORc為某一預設常數(shù),Erms與Etarget的差值被限制在一個特定范圍,當差值為正數(shù)或負數(shù)時,F(xiàn)ACTORc的取值可以不同,以控制自適應速率。三、計算當前增益,并利用前一幀的增益進行平滑處理,如下式(4):G=Gprev*FACTORs………………………………………………(4)最后將所計算出的當前增益應用于當前幀樣本并限幅之后得到增益調(diào)整之后的音頻輸出。時域自適應增益控制模塊包括以下功能:當話音活動檢測標志顯示當前信號幀為背景噪音幀時,將前一幀增益值與對應信號類型的預設因子相乘得到當前信號幀增益,并設定所得增益的上下限;當話音活動檢測標志顯示當前音頻信號幀為語音時,計算語音信號的長時平均能量統(tǒng)計值,其計算方式為利用音頻樣本計算的長時均方根能量統(tǒng)計凈值減去一預設背景能量值;根據(jù)所計算的當前能量統(tǒng)計值和當前目標增益值來計算當前語音幀增益因子,如果當前信號幀能量超過目標增益則被壓縮,反之則被放大;當前信號幀能量與目標增益的差值為正數(shù)和負數(shù)時,自適應速率不同;相鄰幀之間的增益進行平滑處理;幅度調(diào)整之后的音頻樣本進行限幅處理。目標增益進行實時計算模塊對時域自適應增益控制模塊的目標增益進行實時計算,其輸入控制參數(shù)包括接收端的環(huán)境噪聲頻譜估計,目標增益將在預定增益的基礎上隨接收端噪聲能量的增加而增加。目標增益進行實時計算模塊根據(jù)接收端環(huán)境噪聲估計以及話音活動檢測結果動態(tài)調(diào)整時域自適應增益控制模塊的目標增益。目標增益進行實時計算模塊的操作過程如下:第一步,首先對環(huán)境噪聲頻譜估計參數(shù)進行分子帶處理,分帶方式可以根據(jù)梅爾(MEL)頻率進行劃分以模擬人耳對頻帶的感知。第二步可以選取其中關心的n個子帶來計算環(huán)境噪聲能量進而模擬環(huán)境噪聲響度,比如選取對語音可懂度影響較大的子帶,如400Hz到2000Hz。第三步首先對計算的環(huán)境噪聲能量進行平滑以避免能量過度波動,然后計算噪聲響度增益,如下式(5):Genv=(Eenv–EBASE)/EMAX…………………………………(5)其中Eenv為當前環(huán)境噪聲響度,EBASE為預設基底響度,EMAX為預設的最大響度。Eenv的值應當被限制在EBASE與EMAX之間。第四步將環(huán)境噪聲響度增益映射到自適應增益控制器的目標增益,如下式(6):Gtarget=GCONST+SCALE*Genv…………………………………(6)其中GCONST為預先設定好的基本目標增益。SCALE為尺度因子。目標增益進行實時計算模塊包括以下功能:對環(huán)境噪聲頻譜估計參數(shù)進行分子帶處理,分帶方式包括但不限于根據(jù)梅爾(MEL)頻率進行劃分;選取所關心的子帶來計算環(huán)境噪聲能量以模擬環(huán)境噪聲響度;對計算的環(huán)境噪聲能量進行平滑以避免能量過度波動,然后計算噪聲響度增益,噪聲越大增益越大;計算所述噪聲響度增益時需預先減去設定的基底噪聲能量,并限制噪聲響度增益最大值;將所述環(huán)境噪聲響度增益映射到自適應增益控制器的目標增益,環(huán)境噪聲越大,目標增益越大。濁音頻譜調(diào)節(jié)模塊根據(jù)清音濁音標志,確定目前的語音信號幀屬于濁音信號,并根據(jù)環(huán)境噪聲頻譜信息對濁音頻譜進行增強處理。濁音頻譜調(diào)節(jié)模塊的操作過程如下:第一步將音頻信號變換到頻域,并按照與環(huán)境噪聲頻譜估計相同的形式劃分子帶。然后由大到小選取占該幀總能量超過P%,例如P=70,的子帶。其余(1-P%)能量的子帶很有可能是背景音或者對可懂度貢獻不大的區(qū)域,因此可不做處理。第二步選擇環(huán)境噪聲估計中對應的子帶,計算所選子帶總能量,用于第三步計算信噪比。第三步利用第一步計算的清音信號能量和第二步計算的環(huán)境噪聲能量,計算信噪比,并根據(jù)目標信噪比調(diào)整頻譜能量。具體的一種實施方式包括:(1)如果預設目標信噪比小于實際信噪比,則不做處理,放大因子AmpFactor=1。(2)如果預設目標信噪比大于實際信噪比,則放大所選子帶能量:Esubbands=Esubbands*AmpFactor.且子帶能量不超過某一預設值。放大因子隨著幀數(shù)遞增:AmpFactor=1+AmpStep,AmpStep可以為一固定值,例如0.2。(3)相鄰幀的放大因子做指數(shù)平滑以消除能量突變造成的失真。第四步將頻域信號變換回時域信號。濁音頻譜調(diào)節(jié)模塊包括以下功能:將音頻信號變換到頻域,并按照與環(huán)境噪聲頻譜估計相同的形式劃分子帶,計算所需濁音子帶的能量;利用所述濁音子帶能量與環(huán)境噪聲估計中對應的子帶能量,計算信噪比;搜索濁音信號共振峰,并根據(jù)所計算信噪比調(diào)整頻譜能量,包括:如果只有一個共振峰,則根據(jù)所計算的各個子帶的平均信噪比將濁音頻段信號能量進行高頻增強;最大能量小于某一預設閾值;信噪比越低,增強程度越大,頻譜越高,增強程度越大;如果有多于一個共振峰,則優(yōu)先放大高階共振峰所在子帶的能量;各個子帶的增益與相鄰子帶增益做平滑,以防相鄰子帶能量波動過大;相鄰幀的對應子帶做增益因子的平滑,以防時域能量波動過大;將頻域信號變換回時域信號。清音頻譜調(diào)節(jié)模塊根據(jù)清音濁音標志,確定目前的語音信號幀屬于清音信號,并根據(jù)環(huán)境噪聲頻譜信息對語音頻譜進行增強處理。清音頻譜調(diào)節(jié)模塊的操作過程如下:第一步將音頻信號變換到頻域,并按照與環(huán)境噪聲頻譜估計相同的形式劃分子帶,計算所需子帶能量,例如從300Hz到3150Hz能量。第二步選擇環(huán)境噪聲估計中對應的子帶,計算個信噪比。第三步搜索濁音信號共振峰,并根據(jù)所計算信噪比調(diào)整頻譜能量。具體的一種實施方式包括:(1)如果只有一個共振峰F0,則根據(jù)所計算的各個子帶的平均信噪比將濁音頻段信號能量進行高頻增強,例如在頻域?qū)⒏髯訋芰砍艘愿髯詫脑鲆嬉蜃?。最大能量小于某一預設閾值。幀數(shù)每增加一幀則增益因子增大VAmpFactor1,信噪比越低,VAmpFactor1的值越大。VAmpFactor1的值對于各個子帶可以不同。直到信噪比不小于一預設閾值。(2)如果有多于一個共振峰,例如有F1到F4,則優(yōu)先放大共振峰F1到F4所在子帶的能量,以得到更清晰的共振峰進而提高可懂度。具體實施方式可以為:在頻域?qū)⒏髯訋芰砍艘愿髯詫脑鲆嬉蜃?。最大能量小于某一預設閾值。在與上面一步同等信噪比下,幀數(shù)每增加一幀則共振峰所在子帶的增益因子增大VAmpFactor2,其余子帶的增益因子增大VAmpFactor3,且VAmpFactor2>VAmpFactor1>VAmpFactor3。其余步驟與(1)相同。(3)各個子帶的增益與相鄰子帶增益做平滑,以防相鄰子帶能量波動過大。(4)相鄰幀的對應子帶做增益因子的平滑,以防時域能量波動過大。第四步將頻域信號變換回時域信號。清音頻譜調(diào)節(jié)模塊包括以下功能:將音頻信號變換到頻域,并按照與環(huán)境噪聲頻譜估計參數(shù)相同的形式劃分子帶;由大到小選取占該幀總能量超過P%的子帶計算清音總能量,P等于10到100;選擇環(huán)境噪聲估計中與上述子帶對應的子帶,計算所選子帶的環(huán)境噪聲總能量;根據(jù)所述清音總能量和環(huán)境噪聲總能量計算信噪比,并根據(jù)目標信噪比調(diào)整頻譜能量;如果預設目標信噪比小于實際信噪比,則不做處理,如果預設目標信噪比大于實際信噪比,則放大所選子帶能量;子帶能量不超過某一預設值;相鄰幀對應子帶的放大因子做指數(shù)平滑以消除能量突變造成的失真;頻域信號到時域信號進行轉(zhuǎn)換。本發(fā)明在接收端實現(xiàn)一個多帶自適應語音增強系統(tǒng),并且將該模塊與聲碼器的語音活動檢測參數(shù)相結合,既避免了傳統(tǒng)方法中需要專門提供一個語音活動檢測模塊所帶來的計算復雜度,又可以更好的與聲碼器協(xié)同工作,進而提供更準確的清音、濁音和靜音檢測,縮短接收端算法的自適應時間。在語音通訊設備接收端根據(jù)輸入音頻時域幅度的大小以及語音活動檢測結果動態(tài)調(diào)整自適應增益控制模塊的目標增益,對輸出樣本幅度進行實時調(diào)整,提升語音可懂度。同時提供一個噪聲采集和估計模塊,分頻帶對環(huán)境噪聲進行估計,估計結果供請濁音頻譜調(diào)節(jié)模塊在頻域?qū)邮照Z音的子帶頻譜能量進行調(diào)整,減小環(huán)境噪聲對語音共振峰的掩蔽效應,在噪聲環(huán)境下增大輔音與濁音的能量比,減小環(huán)境噪聲對語音,尤其是低能量輔音的掩蔽效應,進一步提升可懂度。本領域的技術人員可以對本發(fā)明進行各種改型和改變。因此,本發(fā)明覆蓋了落入所附的權利要求書及其等同物的范圍內(nèi)的各種改型和改變。