亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

噪聲抑制方法和設(shè)備的制作方法

文檔序號(hào):7538896閱讀:199來(lái)源:國(guó)知局
專利名稱:噪聲抑制方法和設(shè)備的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種用于抑制噪聲語(yǔ)音信號(hào)中的噪聲的方法和設(shè)備。
背景技術(shù)
噪聲抑制是一種涉及利用頻域信號(hào)估計(jì)輸入噪聲語(yǔ)音信號(hào)中所引入的噪聲分量的功率譜并從噪聲語(yǔ)音信號(hào)中減去估計(jì)功率譜的技術(shù)。通過(guò)連續(xù)地估計(jì)噪聲分量,噪聲抑制技術(shù)對(duì)于抑制非固定噪聲也是有用的。在日本專利公開(kāi)2002-204175中描述了這種噪聲抑制。圖1示出了此專利公開(kāi)的噪聲抑制器。如圖所示,將噪聲語(yǔ)音信號(hào)的樣本提供給幀分解和窗口電路1,幀分解和窗口電路1將信號(hào)分割為具有K/2個(gè)樣本的幀,其中K表示偶數(shù)。將這些幀與窗口函數(shù)w(t)相乘。通過(guò)對(duì)語(yǔ)音信號(hào)的第n個(gè)幀yn(t)(t=0,1,…,(K/2)-1)進(jìn)行窗口操作,產(chǎn)生信號(hào)yn(t)=w(t)yn(t)。對(duì)于實(shí)數(shù),采用對(duì)稱窗口函數(shù)。對(duì)窗口函數(shù)進(jìn)行設(shè)計(jì),從而當(dāng)噪聲抑制系數(shù)為1時(shí),輸入和輸出信號(hào)彼此一致(即,w(t)+w(t+K/2)=1)。如果對(duì)兩個(gè)連續(xù)的幀進(jìn)行這種窗口操作,則使用公知的漢明窗w(t) 將窗口語(yǔ)音幀yn(t)提供給傅立葉變換轉(zhuǎn)換器2,將語(yǔ)音幀轉(zhuǎn)換為K個(gè)頻譜語(yǔ)音分量的矢量Yn=(Yn(0),Yn(1),…,Yn(K-1))。將此譜語(yǔ)音分量矢量分為K個(gè)相位分量的矢量argYn=(argYn(0),argYn(1),…,argYn(K-1))和K個(gè)幅度分量的矢量|Yn|=(|Yn(0)|,|Yn(1)|,…,|Yn(K-1)|),將前者提供給乘法器10,而將后者饋入平方電路3,在K個(gè)乘法器30~3K-1中,取K個(gè)幅度譜語(yǔ)音分量的平方。平方值|Yn|2=(|Yn(0)|2,|Yn(1)|2,…,|Yn(K-1)|2)表示噪聲語(yǔ)音的功率譜。將平方電路3的輸出提供給功率譜加權(quán)電路4(圖2),對(duì)K個(gè)頻譜語(yǔ)音分量進(jìn)行加權(quán)。
在圖2中,如下實(shí)現(xiàn)此功率譜加權(quán)首先,利用除法器陣列410~41K-1將K個(gè)語(yǔ)音功率分量|Yn|2除以K個(gè)噪聲功率譜分量λn-1的矢量(在前一幀期間,在噪聲估計(jì)電路5中估計(jì)出,并存儲(chǔ)在存儲(chǔ)器42中),計(jì)算譜信號(hào)噪聲比,產(chǎn)生SNR值的矢量γ^n=|Yn|2/λn-1.]]>然后,通過(guò)非線性加權(quán)電路矢量430~43K-1,對(duì)這些SNR值進(jìn)行非線性處理,每個(gè)非線性加權(quán)電路430~43K-1具有如下形式的非線性函數(shù)f2=1,f1<af1-ba-b,a<f1<b0,b<f1]]>其中“a”和“b”是任意實(shí)數(shù)。當(dāng)輸入SNR值大于“b”時(shí),每個(gè)非線性加權(quán)電路43產(chǎn)生等于0的加權(quán)值,而當(dāng)SNR值小于“a”時(shí),產(chǎn)生等于0的加權(quán)值,并取在0和1之間的與SNR值成反比的數(shù)值。最后,利用譜乘法器44,將輸入的K個(gè)譜語(yǔ)音功率分量|Yn|2分別與K個(gè)加權(quán)因子相乘,以產(chǎn)生加權(quán)功率譜語(yǔ)音分量的矢量。將此加權(quán)功率譜語(yǔ)音分量的矢量提供給噪聲估計(jì)電路5(圖3),還從平方電路3將譜功率語(yǔ)音分量|Yn|2提供給噪聲估計(jì)電路5。電路43所進(jìn)行的非線性加權(quán)用于降低在消除噪聲分量時(shí)對(duì)噪聲語(yǔ)音功率譜的語(yǔ)音分量的不利影響。
在圖3中,通過(guò)噪聲計(jì)算器500~50K-1分別處理來(lái)自功率譜加權(quán)電路4的K個(gè)加權(quán)譜功率語(yǔ)音分量和來(lái)自平方電路3的非加權(quán)的K個(gè)譜功率語(yǔ)音分量。在每個(gè)噪聲計(jì)算器50中,當(dāng)門(mén)54響應(yīng)于來(lái)自或門(mén)511的“1”導(dǎo)通時(shí),加權(quán)分量通過(guò)寄存器更新決定電路51的門(mén)54到達(dá)移位寄存器55。當(dāng)初始周期檢測(cè)器512在噪聲抑制器的初始啟動(dòng)時(shí)刻向或門(mén)511提供“1”時(shí),或者當(dāng)非加權(quán)的功率譜分量較低,表示是無(wú)語(yǔ)音信號(hào)或語(yǔ)音低電平信號(hào)時(shí),發(fā)生此移位寄存器更新。在后一種情況下,比較器515在與由閾值計(jì)算器513在前一幀的時(shí)間間隔期間存儲(chǔ)在存儲(chǔ)器514中的決定閾值進(jìn)行比較之后,將“1”提供給或門(mén)511。樣本計(jì)數(shù)器59響應(yīng)于從或門(mén)511輸出的邏輯1遞增其計(jì)數(shù)值,以確定在每個(gè)幀的時(shí)間間隔期間存儲(chǔ)在移位寄存器55中的加權(quán)功率譜分量的個(gè)數(shù)。當(dāng)計(jì)數(shù)值變得等于移位寄存器55的長(zhǎng)度時(shí),將計(jì)數(shù)器復(fù)位為零。在最小值選擇器57中,將計(jì)數(shù)器59的輸出與移位寄存器55的長(zhǎng)度進(jìn)行比較。最小值選擇器57選擇二者之中較小的一個(gè)作為數(shù)值M。加法器56計(jì)算在幀“n”期間存儲(chǔ)在移位寄存器55中的M個(gè)分量Bn,0(k),Bn,1(k),…,Bn,M-1(k)的總和,并在除法電路58中除以數(shù)值M,以產(chǎn)生輸出λn(k)λn(k)=1MΣm=0M-1Bn,m(k)]]>由于樣本計(jì)數(shù)器59的輸出從啟動(dòng)噪聲抑制器的時(shí)刻起單調(diào)增加,最初利用樣本計(jì)數(shù)器輸出來(lái)進(jìn)行除法操作。隨著處理的繼續(xù),樣本計(jì)數(shù)器59的輸出增加,并最終變得大于寄存器長(zhǎng)度,此時(shí)利用寄存器長(zhǎng)度作為除數(shù)來(lái)進(jìn)行除法操作。當(dāng)使用寄存器長(zhǎng)度時(shí),除法輸出λn表示加權(quán)功率譜語(yǔ)音分量的總和的平均功率。將除法操作的商值λn提供給閾值計(jì)算器513,閾值計(jì)算器513將輸入值與預(yù)定數(shù)或高階多項(xiàng)式或非線性函數(shù)相乘,以產(chǎn)生在下一幀期間用在比較器515中的決定閾值。商λn是作為反饋信號(hào)提供給功率譜加權(quán)電路4并存儲(chǔ)在其存儲(chǔ)器42中以更新針對(duì)下一幀的加權(quán)功率譜噪聲分量的估計(jì)噪聲。
返回圖1,在后驗(yàn)SNR(信號(hào)噪聲比)計(jì)算器6中,將平方電路3的語(yǔ)音功率譜分量|Yn|2分別除以噪聲估計(jì)電路5的估計(jì)噪聲功率譜分量λn,以產(chǎn)生后驗(yàn)SNR值的矢量γn,然后將其提供給先驗(yàn)SNR估計(jì)電路7(圖4)。
在圖4中,在加法器70中,將每個(gè)后驗(yàn)SNR值γn與“-1”求和,產(chǎn)生矢量{γn(0)-1},{γn(1)-1},…,{γn(K-1)-1},在范圍限制電路71中,利用最大值選擇器710~71K-1對(duì)其范圍加以限制。最大值選擇器將其輸入與數(shù)值“零”進(jìn)行比較,并根據(jù)關(guān)系如果x>0,則P[x]=x;如果x≤0,則P[x]=0,選擇二者之中較大的一個(gè),并將輸出P[γn(k)-1]傳遞給乘法和加法電路770~77K-1。在幀時(shí)間間隔內(nèi),來(lái)自后驗(yàn)SNR計(jì)算器6的后驗(yàn)SNR值γn(k)也存儲(chǔ)在存儲(chǔ)器72中,然后,提供給乘法器75,作為前一幀的后驗(yàn)SNR值的矢量γn-1(0)~γn-1(K-1)。將這些前一幀的后驗(yàn)SNR值與從平方電路74提供的前一幀的平方校正噪聲抑制系數(shù)的矢量Gn-12相乘,以產(chǎn)生數(shù)值矢量γn-1Gn-12,并將其提供給乘法和加法電路770~77K-1,作為前一幀的估計(jì)SNR值的矢量。為了產(chǎn)生Gn-12,從噪聲抑制系數(shù)校正器9接收校正噪聲抑制系數(shù)的矢量Gn,在幀時(shí)間間隔內(nèi),將其存儲(chǔ)在存儲(chǔ)器73中,并在平方電路74中進(jìn)行平方,以產(chǎn)生Gn-12。在每個(gè)乘法和加法電路77中,在乘法器771中,將來(lái)自相應(yīng)的最大值選擇器71的輸入信號(hào)P[γn-1(k)-1]與因子(1-α)相乘(其中α是加權(quán)值),并在乘法器772中,將來(lái)自乘法電路75的前一幀的估計(jì)SNR值γn-1(k)Gn-12(k)與加權(quán)值α相乘,并與乘法器771的輸出求和,以產(chǎn)生估計(jì)先驗(yàn)SNR值ξ^n=αγn-1G‾n-12+(1-α)P[γn-1],]]>其中G‾-12γ-1=1.]]>將估計(jì)先驗(yàn)SNR值 提供給噪聲抑制系數(shù)計(jì)算器8(圖5)和噪聲抑制系數(shù)校正器9(圖6)。
在圖5中,除了來(lái)自先驗(yàn)SNR計(jì)算器7的估計(jì)先驗(yàn)SNR矢量ξ^n=(ξ^n(0),ξ^n(1),···,ξ^n(K-1))]]>以外,噪聲抑制系數(shù)計(jì)算器8還接收來(lái)自后驗(yàn)SNR計(jì)算器6的后驗(yàn)SNR矢量γn=γn(0)~γn(K-1)。噪聲抑制系數(shù)計(jì)算器8包括MMSE-STSA(最小平均序列誤差短時(shí)間譜幅度)增益函數(shù)值計(jì)算器81和GLR(廣義似然比)計(jì)算器82。對(duì)于每個(gè)譜分量,MMSE-STSA增益函數(shù)計(jì)算器81使用后驗(yàn)SNR值γn、先驗(yàn)SNR值 和無(wú)語(yǔ)音概率“q”來(lái)計(jì)算MMSE-STSA增益函數(shù)GnGn=π2vnγnexp(-vn2)[(1+vn)I0(vn2)+vnI1(vn2)]]]>其中,I0(z)=零階修正貝塞爾函數(shù),I1(z)=一階修正貝塞爾函數(shù),vn=(ηnγn)/(1+ηn),以及ηn=ξ^n/(1-q).]]>使用與計(jì)算器81中的后驗(yàn)和先驗(yàn)SNR以及無(wú)語(yǔ)音概率相同的數(shù)值,GLR計(jì)算器82如下計(jì)算K個(gè)廣義似然比的矢量ΛnΛn=1-qqexpvn1+ηn]]>在計(jì)算電路83中使用增益函數(shù)Gn和GLR值Λn以便向噪聲抑制系數(shù)校正器9(圖6)提供由下式給出的噪聲抑制系數(shù)矢量GnG‾n=ΛnΛn+1Gn]]>在圖6中,將噪聲抑制系數(shù)Gn和先驗(yàn)SNR值ξn提供給噪聲抑制系數(shù)校正電路910~91K-1。在比較器911中,將每個(gè)先驗(yàn)SNR值與閾值進(jìn)行比較,以產(chǎn)生針對(duì)選擇器912的控制信號(hào),通過(guò)選擇器912,根據(jù)先驗(yàn)SNR值相對(duì)于閾值的大小,將噪聲抑制系數(shù)有選擇地通過(guò)乘法器913或直通連接與最大值選擇器914相連。當(dāng)先驗(yàn)SNR值小于閾值時(shí),選擇器912切換到較低的位置,將噪聲抑制系數(shù)與乘法器913相連,從而以校正值對(duì)其進(jìn)行縮放。否則,選擇器912切換到較高的位置,將噪聲抑制系數(shù)直接與最大值選擇器914相連。最大值選擇器914將輸入信號(hào)與下限校正值進(jìn)行比較,并將二者之中較大的一個(gè)傳遞給乘法器10。
返回圖1,乘法器10將校正噪聲抑制系數(shù)Gn與從傅立葉變換轉(zhuǎn)換器2提供的語(yǔ)音幅度譜分量|Yn|相乘,以產(chǎn)生增強(qiáng)語(yǔ)音幅度譜分量|Xn|=Gn|Yn|。在乘法器11中,將增強(qiáng)語(yǔ)音幅度譜分量與相位分量argYn相乘,以產(chǎn)生增強(qiáng)語(yǔ)音譜分量Xn=|Xn|argYn。在逆傅立葉變換轉(zhuǎn)換器12中,對(duì)增強(qiáng)語(yǔ)音分量進(jìn)行逆傅立葉變換,以產(chǎn)生包含一系列K個(gè)時(shí)域分量xn(t)的語(yǔ)音幀(t=0,1,…,K-1)。在幀合成13中,將連續(xù)兩個(gè)語(yǔ)音幀的K/2個(gè)時(shí)域分量組合為增強(qiáng)語(yǔ)音樣本,其形式為x^n(t)=x‾n-1(t+K/2)+x‾n(t).]]>但是,利用相同的算法來(lái)計(jì)算現(xiàn)有技術(shù)噪聲抑制器的噪聲抑制系數(shù),而并未區(qū)分語(yǔ)音部分和噪聲部分。結(jié)果,在語(yǔ)音部分中可能會(huì)發(fā)生語(yǔ)音失真,而在噪聲部分中抑制不足。

發(fā)明內(nèi)容
因此,本發(fā)明的目的是提供一種噪聲抑制方法和設(shè)備,能夠降低語(yǔ)音部分中的語(yǔ)音失真,同時(shí)在噪聲部分中提供足夠的噪聲抑制。
根據(jù)本發(fā)明的第一方案,提出了一種抑制語(yǔ)音信號(hào)中的噪聲的方法,包括將語(yǔ)音信號(hào)轉(zhuǎn)換為頻譜語(yǔ)音分量的第一矢量和與所述第一矢量頻譜語(yǔ)音分量相同的頻譜語(yǔ)音分量的第二矢量;根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定噪聲抑制系數(shù)的矢量;根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定語(yǔ)音對(duì)噪聲關(guān)系;根據(jù)所確定的語(yǔ)音對(duì)噪聲關(guān)系、所述第一矢量頻譜語(yǔ)音分量和所述噪聲抑制系數(shù),確定在后抑制系數(shù)的矢量;以及以所述在后抑制系數(shù)的矢量對(duì)所述第二矢量頻譜語(yǔ)音分量進(jìn)行加權(quán)。
根據(jù)本發(fā)明的第二方案,提出了一種抑制語(yǔ)音信號(hào)中的噪聲的方法,包括將語(yǔ)音信號(hào)轉(zhuǎn)換為頻譜語(yǔ)音分量的第一矢量和與所述第一矢量頻譜語(yǔ)音分量相同的頻譜語(yǔ)音分量的第二矢量;根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定噪聲抑制系數(shù)的矢量;根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定語(yǔ)音對(duì)噪聲關(guān)系;根據(jù)所確定的語(yǔ)音對(duì)噪聲關(guān)系,確定噪聲抑制系數(shù)的多個(gè)下限值;將所述噪聲抑制系數(shù)與所述噪聲抑制系數(shù)的下限值進(jìn)行比較,并根據(jù)所述比較的結(jié)果,產(chǎn)生在后抑制系數(shù)的矢量;以及以所述在后抑制系數(shù)的矢量對(duì)所述頻譜語(yǔ)音分量的第二矢量進(jìn)行加權(quán)。
根據(jù)本發(fā)明的第三方案,提出了一種抑制語(yǔ)音信號(hào)中的噪聲的方法,包括將語(yǔ)音信號(hào)轉(zhuǎn)換為頻譜語(yǔ)音分量的第一矢量和與所述頻譜語(yǔ)音分量的第一矢量相同的頻譜語(yǔ)音分量的第二矢量;根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定噪聲抑制系數(shù)的矢量;以所述噪聲抑制系數(shù)的矢量對(duì)所述第一矢量頻譜語(yǔ)音分量進(jìn)行加權(quán);根據(jù)所述加權(quán)第一矢量頻譜語(yǔ)音分量和所述噪聲抑制系數(shù)的矢量,確定校正因子的矢量;以及以所述校正因子的矢量對(duì)所述噪聲抑制系數(shù)的矢量進(jìn)行加權(quán);以及以噪聲抑制系數(shù)的加權(quán)矢量對(duì)所述頻譜語(yǔ)音分量的第二矢量進(jìn)行加權(quán)。
根據(jù)本發(fā)明的第四方案,提出了一種用于抑制語(yǔ)音信號(hào)中的噪聲的設(shè)備,包括轉(zhuǎn)換器,將語(yǔ)音信號(hào)轉(zhuǎn)換為頻譜語(yǔ)音分量的第一矢量和與所述頻譜語(yǔ)音分量的第一矢量相同的頻譜語(yǔ)音分量的第二矢量;噪聲抑制系數(shù)計(jì)算器,根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定噪聲抑制系數(shù)的矢量;語(yǔ)音對(duì)噪聲關(guān)系計(jì)算器,根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定語(yǔ)音對(duì)噪聲關(guān)系;在后抑制系數(shù)計(jì)算器,根據(jù)語(yǔ)音對(duì)噪聲關(guān)系、所述第一矢量頻譜語(yǔ)音分量和所述噪聲抑制系數(shù)的矢量,確定在后抑制系數(shù)的矢量;以及加權(quán)電路,以所述在后抑制系數(shù)的矢量對(duì)所述頻譜語(yǔ)音分量的第二矢量進(jìn)行加權(quán)。
根據(jù)本發(fā)明的第五方案,提出了一種用于抑制語(yǔ)音信號(hào)中的噪聲的設(shè)備,包括轉(zhuǎn)換器,將語(yǔ)音信號(hào)轉(zhuǎn)換為頻譜語(yǔ)音分量的第一矢量和與所述頻譜語(yǔ)音分量的第一矢量相同的頻譜語(yǔ)音分量的第二矢量;噪聲抑制系數(shù)計(jì)算器,根據(jù)所述頻譜語(yǔ)音分量的第一矢量,確定噪聲抑制系數(shù)的矢量;語(yǔ)音對(duì)噪聲關(guān)系計(jì)算器,根據(jù)所述頻譜語(yǔ)音分量的第一矢量,確定語(yǔ)音對(duì)噪聲關(guān)系;在后抑制系數(shù)計(jì)算器,根據(jù)語(yǔ)音對(duì)噪聲關(guān)系,確定噪聲抑制系數(shù)的多個(gè)下限值,將所述噪聲抑制系數(shù)的矢量與所述噪聲抑制系數(shù)的下限值進(jìn)行比較,并根據(jù)所述比較的結(jié)果,產(chǎn)生在后抑制系數(shù)的矢量;以及加權(quán)電路,以所述在后抑制系數(shù)的矢量對(duì)所述頻譜語(yǔ)音分量的第二矢量進(jìn)行加權(quán)。
根據(jù)本發(fā)明的第六方案,提出了一種用于抑制語(yǔ)音信號(hào)中的噪聲的設(shè)備,包括轉(zhuǎn)換器,將語(yǔ)音信號(hào)轉(zhuǎn)換為頻譜語(yǔ)音分量的第一矢量和與所述頻譜語(yǔ)音分量的第一矢量相同的頻譜語(yǔ)音分量的第二矢量;噪聲抑制系數(shù)計(jì)算器,根據(jù)所述頻譜語(yǔ)音分量的第一矢量,確定噪聲抑制系數(shù)的矢量;計(jì)算器,以所述噪聲抑制系數(shù)的矢量對(duì)所述頻譜語(yǔ)音分量的第一矢量進(jìn)行加權(quán);抑制系數(shù)校正器,根據(jù)加權(quán)第一矢量頻譜語(yǔ)音分量,計(jì)算第一部分校正因子的矢量,將所述第一部分校正因子的矢量與第二部分校正因子的矢量進(jìn)行組合,以產(chǎn)生組合校正因子的矢量,并以所述組合校正因子的矢量對(duì)所述噪聲抑制系數(shù)的矢量進(jìn)行加權(quán);以及加權(quán)電路,以抑制校正因子的矢量對(duì)所述頻譜語(yǔ)音分量的第二矢量進(jìn)行加權(quán)。


將參照附圖詳細(xì)描述本發(fā)明,其中圖1是現(xiàn)有技術(shù)語(yǔ)音信號(hào)噪聲抑制器的方框圖;圖2是圖1所示的現(xiàn)有技術(shù)功率譜加權(quán)電路的方框圖;圖3是圖1所示的現(xiàn)有技術(shù)噪聲估計(jì)電路的方框圖;
圖4是圖1所示的現(xiàn)有技術(shù)先驗(yàn)SNR計(jì)算器的方框圖;圖5是圖1所示的現(xiàn)有技術(shù)噪聲抑制系數(shù)計(jì)算器的方框圖;圖6是圖1所示的現(xiàn)有技術(shù)噪聲抑制系數(shù)校正器的方框圖;圖7是根據(jù)本發(fā)明第一實(shí)施例的語(yǔ)音信號(hào)噪聲抑制器的方框圖;圖8是圖7所示的幅度譜校正器的方框圖;圖9是圖8所示的加權(quán)計(jì)算器的特性的曲線圖;圖10是本發(fā)明第一實(shí)施例的修改的方框圖;圖11是本發(fā)明第二實(shí)施例的噪聲抑制器的方框圖;圖12是本發(fā)明第二實(shí)施例的第一修改的方框圖;圖13是本發(fā)明第二實(shí)施例的第二修改的方框圖;圖14是根據(jù)本發(fā)明第三實(shí)施例的語(yǔ)音信號(hào)噪聲抑制器的方框圖;圖15是圖14所示的先驗(yàn)SNR計(jì)算器的方框圖;圖16是圖14所示的噪聲抑制系數(shù)校正器的方框圖;圖17是本發(fā)明第三實(shí)施例的修改的方框圖;圖18是圖17所示的先驗(yàn)SNR計(jì)算器的方框圖;圖19是圖17所示的噪聲抑制系數(shù)校正器的方框圖;圖20是本發(fā)明第一實(shí)施例的另一修改的方框圖;圖21是圖20所示的幅度譜校正器的方框圖;圖22是本發(fā)明第一實(shí)施例的另一修改的方框圖;圖23是圖22所示的語(yǔ)音出現(xiàn)概率計(jì)算器的方框圖;圖24是圖23所示的幅度譜校正器的方框圖;圖25是圖22所示的實(shí)施例的修改的方框圖;以及圖26是圖25所示的語(yǔ)音出現(xiàn)概率計(jì)算器的方框圖。
具體實(shí)施例方式
現(xiàn)在,參考圖7,示出了根據(jù)本發(fā)明第一實(shí)施例的噪聲抑制器。在圖7中,與圖1中相對(duì)應(yīng)的元件以相同的參考數(shù)字表示,并省略了對(duì)其的描述。本發(fā)明的噪聲抑制器與現(xiàn)有技術(shù)的區(qū)別在于提供了語(yǔ)音幅度譜校正器20。幅度譜校正器20連接在噪聲抑制系數(shù)校正器9和乘法器11之間,并接收來(lái)自乘法器10的增強(qiáng)語(yǔ)音幅度譜分量|Xn|和來(lái)自噪聲估計(jì)電路5的噪聲分量λn。如下所述,這些輸入分量是語(yǔ)音幅度譜校正器20用于產(chǎn)生針對(duì)語(yǔ)音部分的校正系數(shù)和針對(duì)非語(yǔ)音部分的校正系數(shù)從而產(chǎn)生組合系數(shù)F的主要信號(hào)。組合系數(shù)F用于修正噪聲抑制系數(shù)Gn,以產(chǎn)生在后抑制系數(shù)的矢量F·Gn。將語(yǔ)音幅度分量|Yn|與在后抑制系數(shù)相乘,從而使噪聲抑制量在語(yǔ)音部分較低,而在噪聲部分較高。所得到的結(jié)果是語(yǔ)音部分中較小的語(yǔ)音失真和噪聲部分中較小的殘余噪聲。語(yǔ)音幅度譜校正器20的細(xì)節(jié)如圖8所示。
如圖8所示,語(yǔ)音幅度譜校正器20包括平方電路21,用于對(duì)來(lái)自乘法器10的增強(qiáng)語(yǔ)音幅度譜分量|Xn|進(jìn)行平方,以產(chǎn)生K個(gè)增強(qiáng)語(yǔ)音幅度譜分量的矢量|Xn|2。在平均電路22中,通過(guò)將譜分量的大小的總和除以整數(shù)K,對(duì)這些功率譜分量進(jìn)行平均,并將其提供給語(yǔ)音出現(xiàn)概率計(jì)算器24和在后抑制系數(shù)計(jì)算器25。類似地,在平均電路23中,通過(guò)將其總和除以整數(shù)K,對(duì)來(lái)自噪聲估計(jì)電路5的噪聲分量λn進(jìn)行平均,并將其提供給計(jì)算器24和25。
語(yǔ)音出現(xiàn)概率計(jì)算器24利用來(lái)自平均電路22的增強(qiáng)語(yǔ)音功率和來(lái)自平均電路23的估計(jì)噪聲功率,產(chǎn)生表示語(yǔ)音與噪聲之間的相互關(guān)系的輸出。優(yōu)選地,此語(yǔ)音對(duì)噪聲關(guān)系以語(yǔ)音出現(xiàn)的概率來(lái)表示。
語(yǔ)音出現(xiàn)概率計(jì)算器24包括對(duì)數(shù)轉(zhuǎn)換器240,用于對(duì)平均電路22的輸出進(jìn)行轉(zhuǎn)換,將平均語(yǔ)音功率轉(zhuǎn)換為對(duì)數(shù),在乘10電路241中通過(guò)整數(shù)10進(jìn)行縮放。按照這種方式,第n幀的增強(qiáng)語(yǔ)音功率En表示如下En=10log10(1KΣk=0K-1|x‾n(k)|2)---(1)]]>另一方面,在對(duì)數(shù)轉(zhuǎn)換器243中,將平均電路23的輸出轉(zhuǎn)換為對(duì)數(shù),并在乘10電路244中通過(guò)整數(shù)10進(jìn)行縮放,以產(chǎn)生表示第n幀的估計(jì)噪聲功率Nn的輸出Nn=10log10(1KΣk=0K-1λn(k))---(2)]]>確定增強(qiáng)語(yǔ)音功率En與估計(jì)噪聲功率Nn之間的關(guān)系,并根據(jù)此關(guān)系,確定表示包含在輸入信號(hào)中的語(yǔ)音功率量的索引。如果語(yǔ)音功率En大于噪聲功率Nn,則索引取表示語(yǔ)音出現(xiàn)的概率“p”較高的數(shù)值。由于在大多數(shù)情況下,增強(qiáng)語(yǔ)音功率En和估計(jì)噪聲功率Nn是非固定信號(hào),在語(yǔ)音部分中可能會(huì)發(fā)生噪聲功率Nn大于語(yǔ)音功率En的情況。這種情況也可以發(fā)生在噪聲部分。因此,如果在索引計(jì)算中直接使用數(shù)值En和Nn,語(yǔ)音部分的概率“p”很可能包含錯(cuò)誤。為了執(zhí)行精確的索引計(jì)算,需要按照適當(dāng)?shù)姆绞絹?lái)修改數(shù)值En和Nn。
為此,將增強(qiáng)語(yǔ)音功率En提供給具有類似結(jié)構(gòu)的一對(duì)平滑電路242a和242b。在平滑電路242a中,通過(guò)在乘法器25a中將其與縮放因子(1-δ1)相乘,對(duì)增強(qiáng)語(yǔ)音功率En進(jìn)行平滑,其中δ1表示第一平滑系數(shù),產(chǎn)生輸出(1-δ1)En。在加法器24b中,將輸出(1-δ1)En與乘法器24c的輸出相加,乘法器24c將平滑增強(qiáng)語(yǔ)音功率與平滑系數(shù)δ1相乘,此增強(qiáng)語(yǔ)音功率是由加法器25b產(chǎn)生并由延遲元件24d延遲了幀時(shí)間間隔的增強(qiáng)語(yǔ)音功率。因此,平滑電路242a從加法器24b產(chǎn)生以下輸出E1,n=δ1En-1+(1-δ1)En(3a)按照類似的方式,平滑電路242b產(chǎn)生以下輸出E2,n=δ2En-1+(1-δ2)En(3b)其中δ2是大于第一平滑系數(shù)δ1的第二平滑系數(shù)。因?yàn)槠交禂?shù)δ1比δ2的數(shù)值小,平滑電路242a對(duì)語(yǔ)音功率En的平滑效果小于平滑電路242b。將平滑電路242a和242b的輸出分別提供給瞬時(shí)索引計(jì)算器246a和平均索引計(jì)算器246b。
另一方面,將估計(jì)噪聲功率Nn提供給一對(duì)函數(shù)值計(jì)算器245a和245b,以根據(jù)用于動(dòng)態(tài)范圍壓縮或擴(kuò)展的線性或非線性函數(shù)或用于減小離散的平滑函數(shù),分別產(chǎn)生第一函數(shù)值 和第二函數(shù)值 可以省略函數(shù)值計(jì)算,以減小計(jì)算量。用在計(jì)算器245a和245b中的函數(shù)的典型示例如下N^1,n=afcNn+bfc---(4a)]]>N^2,n=cfcNn+dfc---(4b)]]>其中afc、bfc、cfc、dfc是實(shí)數(shù)。
將函數(shù)值計(jì)算器245a和245b的輸出分別提供給瞬時(shí)索引計(jì)算器246a和平均索引計(jì)算器246b,平滑增強(qiáng)語(yǔ)音功率E1,n和E2,n也已經(jīng)從平滑電路242a和242b提供給瞬時(shí)索引計(jì)算器246a和平均索引計(jì)算器246b,從而根據(jù)以下關(guān)系產(chǎn)生索引I1,n和I2,nI1,n=aidx,E‾1,n/N^1,n≤θidxbidx,E‾1,n/N^1,n>θidx---(5a)]]>I2,n=aidx,E‾2,n/N^2,n≤θidxbidx,E‾2,n/N^2,n>θidx---(5b)]]>其中aidx、bidx、θidx是實(shí)數(shù),而且aidx大于bidx。通過(guò)將一些常數(shù)值與上述關(guān)系的分母相加,可以避免離散?;蛘?,也可以使用En與Nn之間的差或所述差的歸一化數(shù)值。由于如上所述,平滑電路242a對(duì)語(yǔ)音功率En的平滑效果小于平滑電路242b,平滑電路242a的較少被平滑的輸出E1,n適合于計(jì)算瞬時(shí)索引I1,n,而平滑電路242b的較多被平滑的輸出E2,n適合于計(jì)算平均索引I2,n。
在加法器247中,對(duì)索引計(jì)算器246a和246b的輸出求和,以產(chǎn)生用作語(yǔ)音出現(xiàn)概率“p”的輸出。應(yīng)當(dāng)注意,代替使用加法器247,可以對(duì)等地使用加權(quán)和或乘積。
在后抑制系數(shù)計(jì)算器25的作用是根據(jù)由計(jì)算器24提供的語(yǔ)音出現(xiàn)概率“p”來(lái)計(jì)算在后抑制系數(shù)的矢量。如下所述,當(dāng)概率“p”較低時(shí),在后抑制系數(shù)計(jì)算器25利用包含更高比例的非語(yǔ)音部分校正因子的加權(quán)因子,產(chǎn)生低在后抑制系數(shù)的矢量。結(jié)果,可以進(jìn)一步減少噪聲部分中的殘余噪聲。與此相反,當(dāng)概率“p”較高時(shí),在后抑制系數(shù)計(jì)算器25利用包含更高比例的語(yǔ)音部分校正因子的加權(quán)因子,產(chǎn)生高在后抑制系數(shù)的矢量,等于或稍微大于由抑制系數(shù)校正器9提供的校正噪聲抑制系數(shù)的矢量Gn。按照這種方式,當(dāng)語(yǔ)音出現(xiàn)概率“p”較高時(shí),可以避免對(duì)語(yǔ)音的過(guò)度抑制。
具體地,在后抑制系數(shù)計(jì)算器25包括非語(yǔ)音部分校正因子計(jì)算器250,利用平均電路22和23的輸出以及由語(yǔ)音出現(xiàn)概率計(jì)算器24提供的語(yǔ)音出現(xiàn)概率“p”,產(chǎn)生非語(yǔ)音部分校正因子FU。
非語(yǔ)音部分校正因子計(jì)算器250包括混合器25a,按照由語(yǔ)音出現(xiàn)概率“p”確定的比例,將來(lái)自平均電路22的增強(qiáng)語(yǔ)音功率與存儲(chǔ)在存儲(chǔ)器25b中的平均語(yǔ)音功率進(jìn)行混合。所存儲(chǔ)的語(yǔ)音功率是混合器25a前一幀的輸出,并在平滑電路25c中利用外部施加的平滑系數(shù)進(jìn)行了平滑。
在混合器25a中,如果語(yǔ)音出現(xiàn)概率“p”相對(duì)較高,則將大部分的當(dāng)前幀平均語(yǔ)音與小部分的前一幀平滑語(yǔ)音進(jìn)行混合。如果語(yǔ)音出現(xiàn)概率“p”相對(duì)較低,則在混合器25a中,將大部分的前一幀平滑語(yǔ)音與小部分的當(dāng)前幀平均語(yǔ)音進(jìn)行混合。
因此,當(dāng)概率“p”相對(duì)較低時(shí),平滑電路25c的輸入信號(hào)具有較高的已平滑前一幀的內(nèi)容,因此實(shí)質(zhì)上并不更新其輸出信號(hào)。結(jié)果,平滑電路25c在噪聲部分期間產(chǎn)生與語(yǔ)音部分期間所計(jì)算出的增強(qiáng)語(yǔ)音功率相同的增強(qiáng)語(yǔ)音功率。另一方面,如果概率“p”相對(duì)較高,平滑電路25c使用包含更多平均增強(qiáng)語(yǔ)音功率的信號(hào)來(lái)進(jìn)行其對(duì)混合器25a的輸出的平滑操作,因此對(duì)其輸出進(jìn)行更新。
平滑電路25c在非語(yǔ)音部分中不更新其輸出而在語(yǔ)音部分中更新其輸出的原因是按照從低音量到高音量的說(shuō)話人音量范圍測(cè)量輸入語(yǔ)音信號(hào)。如果說(shuō)話人在安靜的環(huán)境下發(fā)出較響的聲音,則所計(jì)算出的語(yǔ)音出現(xiàn)概率“p”的可靠性較高,如果說(shuō)話人的聲音在嘈雜的環(huán)境中較低,則概率“p”的可靠性較低。
在除法電路25d中,將來(lái)自平滑電路25c的平滑增強(qiáng)語(yǔ)音功率除以估計(jì)噪聲分量的平均功率λn,以產(chǎn)生信號(hào)噪聲比,在對(duì)數(shù)轉(zhuǎn)換器25e中,將其轉(zhuǎn)換為對(duì)數(shù)。由上述混合器25a的功能可知,當(dāng)語(yǔ)音部分出現(xiàn)概率“p”較低時(shí),平滑電路25c利用包含大量前一幀的平滑增強(qiáng)語(yǔ)音功率的信號(hào)來(lái)計(jì)算當(dāng)前幀的平滑增強(qiáng)語(yǔ)音功率。因此,當(dāng)概率“p”較低時(shí),實(shí)質(zhì)上并未更新平滑增強(qiáng)語(yǔ)音功率。結(jié)果,在噪聲部分期間,平滑電路25c產(chǎn)生與語(yǔ)音部分期間所計(jì)算的相同的增強(qiáng)語(yǔ)音功率。另一方面,在語(yǔ)音出現(xiàn)概率“p”較高的部分中,平滑電路25c利用包含大量增強(qiáng)平均語(yǔ)音功率的信號(hào)來(lái)計(jì)算當(dāng)前幀的平滑增強(qiáng)語(yǔ)音功率。
因此,除法電路25d的輸出表示增強(qiáng)平均語(yǔ)音功率與估計(jì)噪聲功率的比,即增強(qiáng)平均語(yǔ)音功率的信號(hào)噪聲比。在乘10電路25f中,通過(guò)整數(shù)“10”對(duì)對(duì)數(shù)轉(zhuǎn)換器25e的輸出進(jìn)行縮放,并將其提供給加權(quán)計(jì)算器25g。
根據(jù)如上獲得的增強(qiáng)平均語(yǔ)音功率的SNR,加權(quán)計(jì)算器25g通過(guò)在計(jì)算中結(jié)合語(yǔ)音出現(xiàn)概率“p”的可靠性,計(jì)算表示要施加到非語(yǔ)音部分上的抑制量的校正因子。當(dāng)增強(qiáng)平均語(yǔ)音功率的SNR較高時(shí)(即,當(dāng)概率“p”的可靠性較高時(shí)),錯(cuò)誤地抑制語(yǔ)音部分的可能性不大。因此,在這種情況下,將校正因子設(shè)置為較低數(shù)值,以增加抑制量。另一方面,當(dāng)增強(qiáng)平均語(yǔ)音功率的SNR較低時(shí)(即,當(dāng)概率“p”的可靠性較低時(shí)),錯(cuò)誤地抑制語(yǔ)音部分的可能性較高。因此,為了防止在增強(qiáng)平均語(yǔ)音功率的SNR較高時(shí)錯(cuò)誤地抑制語(yǔ)音部分,將校正因子設(shè)置為較高數(shù)值,以減小抑制量。
這種非語(yǔ)音出現(xiàn)SNR值的計(jì)算具有將語(yǔ)音出現(xiàn)概率的可靠性結(jié)合到非語(yǔ)音抑制系數(shù)中的作用。當(dāng)非語(yǔ)音出現(xiàn)SNR值較高時(shí),即當(dāng)語(yǔ)音出現(xiàn)概率“p”的可靠性較高時(shí),錯(cuò)誤地抑制語(yǔ)音部分的可能性較小。在這種情況下,加權(quán)計(jì)算器25g的輸出較低,以增加抑制度。另一方面,當(dāng)非語(yǔ)音出現(xiàn)SNR值較低時(shí),即當(dāng)語(yǔ)音出現(xiàn)概率“p”的可靠性較低時(shí),加權(quán)計(jì)算器25g的輸出較高,以減小抑制度,以便防止錯(cuò)誤地抑制語(yǔ)音部分。圖9是示出了可以用于計(jì)算非語(yǔ)音抑制系數(shù)的非線性函數(shù)的典型示例的曲線圖。在圖9中,fcm表示輸入值,而gcm表示由以下關(guān)系給出的輸出值gcm=dcm,fcm≤acm(dcm-ccm)fcm+acmccm-bcmdcmacm-bcm,acm<fcm≤bcmccm,bcm<fcm---(6)]]>其中acm、bcm、ccm、dcm是正實(shí)數(shù)。圖9所示的非線性函數(shù)表示隨著輸入值的增加,輸出值減小。
在除10電路25h中,將按照上述方式獲得的非語(yǔ)音抑制系數(shù)除以整數(shù)“10”,并提供給指數(shù)計(jì)算器25i,在指數(shù)計(jì)算器25i中,將除10電路25h的輸出轉(zhuǎn)換為表示非語(yǔ)音出現(xiàn)校正因子FU的指數(shù)值。
在后抑制系數(shù)計(jì)算器25包括組合系數(shù)計(jì)算器251,接收非語(yǔ)音部分校正因子FU、概率“p”和語(yǔ)音部分校正因子FV,并產(chǎn)生如下所示的組合系數(shù)FF=pFV+(1-p)FU(7)可以看到,如果概率“p”的數(shù)值較大,則語(yǔ)音出現(xiàn)校正因子FV占組合系數(shù)F中的大部分。組合系數(shù)F也可以根據(jù)以下等式獲得F=pFSFC(FV)+(1-p)GSFC(FU) (8)其中FSFC和GSFC是不同的函數(shù)值。
在乘法器252中,以在后抑制系數(shù)F對(duì)由噪聲抑制系數(shù)校正器9提供的噪聲抑制系數(shù)Gn進(jìn)行加權(quán),以產(chǎn)生在后抑制系數(shù)F·Gn的矢量。
在譜乘法器26中,分別以在后抑制系數(shù)對(duì)語(yǔ)音幅度分量|Yn|進(jìn)行加權(quán),并將譜乘法器26的輸出矢量提供給乘法器11。
以在后抑制系數(shù)F·Gn加權(quán)語(yǔ)音幅度分量|Yn|的好處在于能夠在語(yǔ)音部分中以相對(duì)較低的水平提供噪聲抑制,而在噪聲部分中以相對(duì)較高的水平提供噪聲抑制。結(jié)果是在語(yǔ)音部分中較小的語(yǔ)音失真和在噪聲部分中較小的殘余噪聲。
圖10示出了圖7的第一修改,其中在后抑制系數(shù)計(jì)算器25A是圖8所示的在后抑制系數(shù)計(jì)算器25的修改形式。修改后的計(jì)算器25A還包括語(yǔ)音出現(xiàn)系數(shù)計(jì)算器253,接收平均電路22和23的輸出并通過(guò)將估計(jì)噪聲功率與增強(qiáng)語(yǔ)音功率進(jìn)行比較,產(chǎn)生提供給組合系數(shù)計(jì)算器251的輸出值FV。
當(dāng)估計(jì)噪聲功率大于增強(qiáng)語(yǔ)音功率(即SNR較低)時(shí),F(xiàn)V取從1.0到作為估計(jì)噪聲功率與增強(qiáng)語(yǔ)音功率的比的函數(shù)而確定的較高數(shù)值的范圍內(nèi)的數(shù)值。由于存在噪聲抑制系數(shù)Gn變得小于最優(yōu)值的可能性,數(shù)值FV大于1.0的設(shè)置防止了噪聲抑制系數(shù)Gn對(duì)語(yǔ)音部分進(jìn)行過(guò)度抑制。在這種情況下,大于1的輸出值根據(jù)估計(jì)噪聲功率與增強(qiáng)語(yǔ)音功率的比值而變化。另一方面,當(dāng)估計(jì)噪聲功率小于增強(qiáng)語(yǔ)音功率(即SNR較高)時(shí),在語(yǔ)音部分期間不太可能發(fā)生過(guò)度抑制。在這種情況下,F(xiàn)V取適當(dāng)確定的大于1.0的常數(shù)值,而與估計(jì)噪聲功率與增強(qiáng)語(yǔ)音功率的比無(wú)關(guān)。
圖11示出了本發(fā)明的第二實(shí)施例,其中將圖8所示的在后抑制系數(shù)計(jì)算器25修改為在后抑制系數(shù)計(jì)算器25B。在本實(shí)施例中,計(jì)算器25B包括相同結(jié)構(gòu)的多個(gè)譜在后抑制系數(shù)計(jì)算器2540~254K-1。每個(gè)譜在后抑制系數(shù)計(jì)算器254包括下限計(jì)算器255和最大值選擇器256。將語(yǔ)音部分校正因子下限(SCLL)值和非語(yǔ)音部分校正因子下限(NCLL)值提供給下限計(jì)算器255,并根據(jù)由語(yǔ)音出現(xiàn)概率計(jì)算器24提供的概率值“p”,計(jì)算噪聲抑制系數(shù)的下限值,從而使SCLL值對(duì)計(jì)算器255的輸出值的貢獻(xiàn)比例隨著語(yǔ)音出現(xiàn)概率“p”而增加??梢允褂玫仁?7)和(8)來(lái)確定語(yǔ)音因子下限的貢獻(xiàn)因子。為了防止語(yǔ)音聲音失真,將語(yǔ)音部分校正因子下限(SCLL)值設(shè)置為大于非語(yǔ)音部分校正因子下限(NCLL)值的數(shù)值。將下限計(jì)算器255的輸出提供給最大值選擇器256,同樣將與譜在后抑制系數(shù)計(jì)算器254k相對(duì)應(yīng)的一個(gè)校正噪聲抑制系數(shù)Gn(k)提供給最大值選擇器256。最大值選擇器256選擇兩個(gè)輸入值中較大的一個(gè),并將所選的數(shù)值饋入譜乘法器27。
結(jié)果,將譜在后抑制系數(shù)Gn提供給乘法器26,使其高于通過(guò)語(yǔ)音部分出現(xiàn)概率“p”而建立的下限值。由于按照這種方式建立的下限值在語(yǔ)音出現(xiàn)概率“p”較高時(shí)較大,能夠防止由于過(guò)度抑制而可能發(fā)生在語(yǔ)音部分中的語(yǔ)音失真。另一方面,當(dāng)語(yǔ)音出現(xiàn)概率“p”較低時(shí),下限值較小。因此,能夠優(yōu)化施加到噪聲部分上的噪聲抑制量。
圖12示出了第二實(shí)施例的修改,其中將圖8所示的在后抑制系數(shù)計(jì)算器25修改為在后抑制系數(shù)計(jì)算器25C。在此修改中,計(jì)算器25C包括相同結(jié)構(gòu)的多個(gè)譜在后抑制系數(shù)計(jì)算器2570~257K-1。每個(gè)譜在后抑制系數(shù)計(jì)算器257與圖11所示的計(jì)算器254的不同之處在于還包括語(yǔ)音部分校正因子下限(SCLL)計(jì)算器258和非語(yǔ)音部分校正因子下限(NCLL)計(jì)算器259。計(jì)算器258和259從噪聲估計(jì)電路5接收估計(jì)噪聲功率譜分量λn(0)~λn(K-1)中對(duì)應(yīng)的一個(gè)以及從與其譜號(hào)相對(duì)應(yīng)的平方電路21接收增強(qiáng)語(yǔ)音功率譜分量|Xn(0)|2~|Xn(K-1)|2中對(duì)應(yīng)的一個(gè)。語(yǔ)音因子下限計(jì)算器258根據(jù)增強(qiáng)語(yǔ)音分量|Xn(k)|2與估計(jì)噪聲譜樣本λn(k)的信號(hào)噪聲比,計(jì)算語(yǔ)音因子下限,其中k是0、1、…、K-1中的一個(gè)。類似地,非語(yǔ)音因子下限計(jì)算器259根據(jù)相同的信號(hào)噪聲比,計(jì)算非語(yǔ)音因子下限值。將語(yǔ)音部分校正因子下限(SCLL)值和非語(yǔ)音部分校正因子下限(NCLL)值提供給下限計(jì)算器255。
為了減小語(yǔ)音部分中的語(yǔ)音失真,確定語(yǔ)音部分校正因子下限(SCLL)值,從而使其與SNR值相反地變化。為了減小非語(yǔ)音部分中的殘余噪聲并防止語(yǔ)音部分中的過(guò)度抑制,將非語(yǔ)音部分校正因子下限(NCLL)設(shè)置為小于語(yǔ)音部分校正因子下限(SCLL)值的數(shù)值。優(yōu)選地,對(duì)計(jì)算器258和259進(jìn)行設(shè)計(jì),從而使其下限值之間的差在SNR相對(duì)較低時(shí)不超過(guò)某一臨界值。如果所述差大于臨界值,則語(yǔ)音和非語(yǔ)音部分之間的殘余噪聲的差異增加,將導(dǎo)致在語(yǔ)音部分中可以察覺(jué)的失真聲音。相反地,當(dāng)SNR較高時(shí),由于語(yǔ)音聲音的遮蓋作用,語(yǔ)音部分中的殘余噪聲不易被察覺(jué)。與低SNR值的情況一樣,語(yǔ)音和非語(yǔ)音部分之間不同的殘余噪聲不會(huì)成為語(yǔ)音部分中語(yǔ)音失真的貢獻(xiàn)因子。因此,如果SNR較高,則設(shè)計(jì)計(jì)算器258和259在其輸出值之間保持相對(duì)較大的差別,從而充分地減小非語(yǔ)音部分的殘余噪聲。根據(jù)語(yǔ)音部分校正因子下限(SCLL)值來(lái)確定非語(yǔ)音部分校正因子下限(NCLL)值?;旧希c語(yǔ)音部分校正因子下限(SCLL)值的情況一樣,當(dāng)SNR減小時(shí),非語(yǔ)音部分校正因子下限(NCLL)值增加。
作為本發(fā)明第二實(shí)施例的修改,優(yōu)選的是,計(jì)算器258和259使用估計(jì)噪聲功率譜分量的平均值和增強(qiáng)語(yǔ)音功率分量的平均值來(lái)計(jì)算SNR值,如圖13所示。在此修改中,在后抑制系數(shù)計(jì)算器25D只包括語(yǔ)音部分校正因子下限(SCLL)計(jì)算器258、非語(yǔ)音部分校正因子下限(NCLL)計(jì)算器259和下限計(jì)算器255中的一個(gè)矢量。將平均電路22和23的輸出提供給計(jì)算器258和259,將下限計(jì)算器255的輸出提供給最大值選擇器2560~256K-1。語(yǔ)音出現(xiàn)概率計(jì)算器24的輸出與所有最大值選擇器256相連。
圖14示出了本發(fā)明噪聲抑制器的第三實(shí)施例,其中與圖7對(duì)應(yīng)的元件具有相同的參考數(shù)字。第三實(shí)施例與第一實(shí)施例的區(qū)別在于利用先驗(yàn)SNR計(jì)算器7A和噪聲抑制系數(shù)校正器9A來(lái)代替圖7所示的幅度譜校正器20、以及圖1所示的先驗(yàn)SNR計(jì)算器7和抑制系數(shù)校正器9。先驗(yàn)SNR計(jì)算器7A與現(xiàn)有技術(shù)計(jì)算器7的區(qū)別在于還接收平方電路3和噪聲估計(jì)電路5的輸出。
如圖15詳細(xì)所示,先驗(yàn)SNR計(jì)算器7A在結(jié)構(gòu)上大體類似于圖1所示的現(xiàn)有技術(shù)計(jì)算器7,不同之處在于還包括延遲元件78、乘法器79、語(yǔ)音出現(xiàn)概率計(jì)算器710和延遲元件711。在延遲元件78中,將來(lái)自平方電路3的語(yǔ)音功率譜分量|Yn|2延遲幀時(shí)間間隔,并提供給乘法器79,在乘法器79中,將其分別與由平方電路74提供的前一幀的校正噪聲抑制系數(shù)Gn-12相乘。因此,乘法器79產(chǎn)生輸出|Yn-1|2Gn-12,將其提供給語(yǔ)音出現(xiàn)概率計(jì)算器710,作為對(duì)當(dāng)前幀“n”的增強(qiáng)語(yǔ)音功率分量的估計(jì)。
在延遲元件711中,將來(lái)自噪聲估計(jì)電路5的估計(jì)噪聲功率分量λn延遲幀時(shí)間間隔,并提供給語(yǔ)音出現(xiàn)概率計(jì)算器710。按照這種方式,按照幀彼此對(duì)準(zhǔn)語(yǔ)音出現(xiàn)概率計(jì)算器710的輸入譜信號(hào)。語(yǔ)音出現(xiàn)概率計(jì)算器710在結(jié)構(gòu)上與語(yǔ)音出現(xiàn)概率計(jì)算器24(圖8)相同,用于產(chǎn)生語(yǔ)音出現(xiàn)概率“p”,并將其發(fā)送給噪聲抑制系數(shù)校正器9A。
如圖l6所示,噪聲抑制系數(shù)校正器9A包括相同結(jié)構(gòu)的譜(噪聲)抑制系數(shù)計(jì)算器1900~190K-1。每個(gè)計(jì)算器190k接收概率“p”和來(lái)自噪聲抑制系數(shù)計(jì)算器8的對(duì)應(yīng)噪聲抑制系數(shù)Gn和來(lái)自計(jì)算器7A的對(duì)應(yīng)先驗(yàn) 每個(gè)計(jì)算器1900~190K-1均包括下限計(jì)算器191,按照先前參照譜在后抑制系數(shù)計(jì)算器2540~254K-1(圖11)所描述的相同方式,根據(jù)概率“p”,從語(yǔ)音部分校正因子下限(SCLL)值和非語(yǔ)音部分校正因子下限(NCLL)值中計(jì)算下限值。在最大值選擇器192中,將計(jì)算器191的輸出與當(dāng)選擇器194切換到較高的位置時(shí)通過(guò)選擇器194直接提供的抑制系數(shù)Gn、或當(dāng)開(kāi)關(guān)194處于較低的位置時(shí)在乘法器195中以校正值進(jìn)行縮放的抑制系數(shù)Gn進(jìn)行比較。比較器193將先驗(yàn) 與閾值進(jìn)行比較,并產(chǎn)生在 高于閾值時(shí)將選擇器194切換到較高位置而在SNR低于閾值時(shí)將選擇器194切換到較低位置的控制信號(hào)。最大值選擇器192選擇兩個(gè)輸入值中較大的一個(gè),并將所選數(shù)值發(fā)送給乘法器10(圖15)和后驗(yàn)SNR計(jì)算器7A的存儲(chǔ)器73(圖16)。
結(jié)果,將譜在后抑制系數(shù)Gn(k)提供給乘法器10,使其高于通過(guò)語(yǔ)音部分出現(xiàn)概率“p”而建立的下限值,并能夠防止由于過(guò)度抑制而可能發(fā)生在語(yǔ)音部分中的語(yǔ)音失真。
圖17示出了圖14所示的第三實(shí)施例的修改,其中提供了先驗(yàn)SNR計(jì)算器7B和抑制系數(shù)校正器9B。如圖18所示,除了向抑制系數(shù)校正器9B提供乘法器79的輸出|Yn-1|2Gn-12,作為對(duì)當(dāng)前幀“n”的增強(qiáng)語(yǔ)音功率分量的估計(jì)以外,先驗(yàn)SNR計(jì)算器7B等同于圖15所示的計(jì)算器7A。除了語(yǔ)音出現(xiàn)概率值“p”和噪聲抑制系數(shù)Gn之外,抑制系數(shù)校正器9B還接收來(lái)自噪聲估計(jì)電路5的估計(jì)噪聲功率譜分量λn和來(lái)自先驗(yàn)SNR計(jì)算器7B的增強(qiáng)語(yǔ)音功率估計(jì)Gn-12|Yn-1|2。
如圖19所示,除了包括非語(yǔ)音部分校正因子計(jì)算器196、組合系數(shù)計(jì)算器197和乘法器198來(lái)代替圖16所示的下限計(jì)算器191和最大值選擇器192以外,抑制系數(shù)校正器9B等同于圖16所示的抑制系數(shù)校正器9A。
非語(yǔ)音部分校正因子計(jì)算器196利用概率值“p”、估計(jì)噪聲功率譜分量λn和對(duì)增強(qiáng)語(yǔ)音功率樣本的估計(jì)Gn-12|Yn-1|2,按照與利用來(lái)自平均電路22的增強(qiáng)語(yǔ)音功率譜分量|Xn|2的平均值的、如圖8所示的非語(yǔ)音部分校正因子計(jì)算器250相類似的方式,計(jì)算非語(yǔ)音部分校正因子FU。具體地,非語(yǔ)音部分校正因子計(jì)算器196將增強(qiáng)語(yǔ)音功率估計(jì)Gn-12|Yn-1|2看作確定非語(yǔ)音部分校正因子FU的主要因素。
將按照這種方式計(jì)算出的非語(yǔ)音部分校正因子FU提供給組合系數(shù)計(jì)算器197,也將語(yǔ)音部分校正因子FV提供給組合系數(shù)計(jì)算器197。計(jì)算器197與圖8所示的計(jì)算器251相同,用于利用校正因子FU、FV和概率“p”來(lái)計(jì)算組合系數(shù)F。乘法器198將計(jì)算器197的輸出與通過(guò)選擇器194直接提供的非校正噪聲抑制系數(shù)Gn或通過(guò)乘法器195提供的校正噪聲抑制系數(shù)Gn相乘。
由于在乘法器198中以根據(jù)語(yǔ)音部分概率“p”而計(jì)算出的校正因子對(duì)噪聲抑制系數(shù)Gn進(jìn)行校正,而且由于在先驗(yàn)SNR計(jì)算器7B中通過(guò)反饋環(huán)、利用校正抑制系數(shù)Gn來(lái)更新對(duì)語(yǔ)音功率譜分量的估計(jì),能夠有效地進(jìn)一步抑制噪聲部分中的殘余噪聲。
圖20示出了圖7所示的第一實(shí)施例的另一修改,其中將圖11所示的幅度譜校正器20修改為如圖21所示的幅度譜校正器20A,以提取語(yǔ)音出現(xiàn)概率值“p”。本實(shí)施例的噪聲抑制器還具有幀延遲元件14和加法器15。在延遲元件14中,將從幅度譜校正器20A中提取出的概率“p”延遲幀時(shí)間間隔,并從“1”中減去,以產(chǎn)生無(wú)語(yǔ)音概率q=1-p,將無(wú)語(yǔ)音概率q提供給噪聲抑制系數(shù)計(jì)算器8(圖5)。
也可以如圖22所示,對(duì)本發(fā)明進(jìn)行修改,其中在語(yǔ)音出現(xiàn)概率計(jì)算器16中,根據(jù)計(jì)算器7的先驗(yàn) 來(lái)計(jì)算語(yǔ)音出現(xiàn)概率“p”。語(yǔ)音出現(xiàn)概率計(jì)算器16的輸出與幅度譜校正器20B和加法器15相連,在加法器15中,從“1”中減去概率“p”,以產(chǎn)生無(wú)語(yǔ)音概率“q”,并將無(wú)語(yǔ)音概率“q”提供給抑制系數(shù)計(jì)算器8。
如圖23所示,語(yǔ)音出現(xiàn)概率計(jì)算器16包括平均電路160,通過(guò)對(duì)先驗(yàn)SNR值 進(jìn)行求和并將總和除以整數(shù)K來(lái)產(chǎn)生先驗(yàn)SNR值 的平均值。在對(duì)數(shù)轉(zhuǎn)換器161中,將先驗(yàn)SNR值的平均值轉(zhuǎn)換為對(duì)數(shù),并在乘法器162中與整數(shù)“10”相乘,以產(chǎn)生由下式給出的全波段先驗(yàn)SNR ΞnΞn=10log10(1KΣk=0K-1ξ^n(k))---(9)]]>在一對(duì)平滑電路163和164中,對(duì)全波段先驗(yàn)SNR Ξn進(jìn)行平滑,以根據(jù)等式(3a)和(3b),按照類似于先前參照?qǐng)D8所示的平滑電路242a和242b所描述的方式,產(chǎn)生一對(duì)第一和第二平滑先驗(yàn)SNR值Ξ1,n和Ξ2,n。將第一和第二平滑先驗(yàn)SNR值Ξ1,n和Ξ2,n分別提供給瞬時(shí)索引計(jì)算器165和平均索引計(jì)算器166,以產(chǎn)生如下給出的索引信號(hào)I3,n和I4,nI3,n=aidx2,Ξ‾1,n≤θidx2bidx2,Ξ‾1,n>θidx2---(10a)]]>I4,n=aidx2,Ξ‾2,n≤θidx2bidx2,Ξ‾2,n>θidx2---(10b)]]>其中θidx2、aidx2、bidx2是實(shí)數(shù),而且aidx2大于bidx2。索引信號(hào)主要根據(jù)平滑先驗(yàn)SNR的數(shù)值而變化。在加法器167中,對(duì)索引計(jì)算器165和166的輸出求和,以產(chǎn)生作為語(yǔ)音出現(xiàn)概率“p”的輸出。將計(jì)算器16的輸出“p”提供給加法器15,從“1”中減去,以產(chǎn)生無(wú)語(yǔ)音概率“q”,應(yīng)用于噪聲抑制系數(shù)計(jì)算器8(圖5)。此外,將語(yǔ)音出現(xiàn)概率計(jì)算器16的輸出信號(hào)發(fā)送給幅度譜校正器20B(圖24)。
如圖24所示,除了僅包括在后抑制系數(shù)計(jì)算器25和乘法器26之外,幅度譜校正器20B類似于圖21所示的幅度譜校正器20A。將概率“p”饋入所有的譜在后抑制系數(shù)計(jì)算器2540~254K-1。
可以如圖25所示地修改圖22所示的噪聲抑制器,其中除了先驗(yàn)SNR值 之外,還向語(yǔ)音出現(xiàn)概率計(jì)算器16A提供后驗(yàn)SNR值γn。
在圖26中,語(yǔ)音出現(xiàn)概率計(jì)算器16A還包括平均電路168,用于計(jì)算后驗(yàn)SNR值γn的平均值。在SNR混合器169中,根據(jù)等式(11),將先驗(yàn)SNR的平均值ξn與后驗(yàn)SNR的平均值γn組合在一起,以產(chǎn)生輸出Ξmix(n)Ξmix(n)=Fmix(ξn)ξn+(1-Fmix(ξn))γn(11)其中Fmin是先驗(yàn)SNR平均值ξn的函數(shù),并根據(jù)ξn,取0和1之間的范圍內(nèi)的實(shí)數(shù)值。將SNR混合器169的輸出提供給對(duì)數(shù)轉(zhuǎn)換器169。
等式(11)表明當(dāng)輸入信號(hào)較少被噪聲退化時(shí),后驗(yàn)SNR的平均值λn成為SNR混合器169的輸出中的主要部分。由于在輸入信號(hào)的信號(hào)噪聲比較高時(shí),后驗(yàn)SNR值γn的準(zhǔn)確度高于先驗(yàn)SNR值 對(duì)于不同數(shù)值的信號(hào)噪聲比,混合器169的輸出具有比后驗(yàn)SNR值的平均值更高的準(zhǔn)確度。因此,按照這種方式獲得的語(yǔ)音部分概率“p”比圖23所示的語(yǔ)音出現(xiàn)概率計(jì)算器16更為精確。
盡管已經(jīng)對(duì)其中采用了MMSE-STSA(最小平均序列誤差短時(shí)間譜幅度)公知技術(shù)的實(shí)施例進(jìn)行了描述,也可以對(duì)等地使用如維納濾波和譜相減等其他技術(shù)。
權(quán)利要求
1.一種抑制語(yǔ)音信號(hào)中的噪聲的方法,包括a)將語(yǔ)音信號(hào)轉(zhuǎn)換為頻譜語(yǔ)音分量的第一矢量和與所述第一矢量頻譜語(yǔ)音分量相同的頻譜語(yǔ)音分量的第二矢量;b)根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定噪聲抑制系數(shù)的矢量;c)根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定語(yǔ)音對(duì)噪聲關(guān)系;d)根據(jù)所確定的語(yǔ)音對(duì)噪聲關(guān)系、所述第一矢量頻譜語(yǔ)音分量和所述噪聲抑制系數(shù),確定在后抑制系數(shù)的矢量;以及e)以所述在后抑制系數(shù)的矢量對(duì)所述第二矢量頻譜語(yǔ)音分量進(jìn)行加權(quán)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于(d)包括根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定第一校正因子,并根據(jù)所述第一校正因子和預(yù)定第二校正因子,計(jì)算所述在后抑制系數(shù)的矢量,組合所述第一和第二校正因子,以產(chǎn)生組合校正因子,以及以所述組合校正因子對(duì)所述噪聲抑制系數(shù)的矢量進(jìn)行加權(quán),以產(chǎn)生所述在后抑制系數(shù)的矢量。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于還包括以所述噪聲抑制系數(shù)對(duì)所述第一矢量頻譜語(yǔ)音分量進(jìn)行加權(quán),以及(d)包括利用加權(quán)第一矢量頻譜語(yǔ)音分量來(lái)確定所述第一校正因子。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于還包括根據(jù)所述頻譜語(yǔ)音分量,估計(jì)頻譜噪聲分量的矢量;以及(d)包括利用估計(jì)頻譜噪聲分量的矢量來(lái)確定所述第一校正因子。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于(d)包括根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定所述第二校正因子,以及利用所述第一和第二校正因子來(lái)確定所述在后抑制系數(shù)的矢量。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于(d)包括通過(guò)利用所確定的語(yǔ)音對(duì)噪聲關(guān)系,組合所述第一和第二校正因子,以產(chǎn)生所述組合校正因子。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于(d)包括根據(jù)pFV+(1-p)FU來(lái)組合所述第一校正因子和所述第二校正因子,其中p表示所述語(yǔ)音對(duì)噪聲關(guān)系,以及FU和FV分別表示所述第一校正因子和所述第二校正因子。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于所述語(yǔ)音對(duì)噪聲關(guān)系表示所述第一矢量頻譜語(yǔ)音分量中語(yǔ)音出現(xiàn)的概率。
9.一種抑制語(yǔ)音信號(hào)中的噪聲的方法,包括a)將語(yǔ)音信號(hào)轉(zhuǎn)換為頻譜語(yǔ)音分量的第一矢量和與所述第一矢量頻譜語(yǔ)音分量相同的頻譜語(yǔ)音分量的第二矢量;b)根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定噪聲抑制系數(shù)的矢量;c)根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定語(yǔ)音對(duì)噪聲關(guān)系;d)根據(jù)所確定的語(yǔ)音對(duì)噪聲關(guān)系,確定噪聲抑制系數(shù)的多個(gè)下限值;e)將所述噪聲抑制系數(shù)與所述噪聲抑制系數(shù)的下限值進(jìn)行比較,并根據(jù)所述比較的結(jié)果,產(chǎn)生在后抑制系數(shù)的矢量;以及f)以所述在后抑制系數(shù)的矢量對(duì)所述頻譜語(yǔ)音分量的第二矢量進(jìn)行加權(quán)。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于(d)包括還根據(jù)第一校正因子下限值和第二校正因子下限值來(lái)確定所述噪聲抑制系數(shù)的多個(gè)下限值。
11.根據(jù)權(quán)利要求10所述的方法,其特征在于(d)包括根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定所述第一校正因子下限值和所述第二校正因子下限值。
12.根據(jù)權(quán)利要求9所述的方法,其特征在于所述語(yǔ)音對(duì)噪聲關(guān)系表示所述頻譜語(yǔ)音分量中語(yǔ)音出現(xiàn)的概率。
13.一種抑制語(yǔ)音信號(hào)中的噪聲的方法,包括a)將語(yǔ)音信號(hào)轉(zhuǎn)換為頻譜語(yǔ)音分量的第一矢量和與所述第一矢量頻譜語(yǔ)音分量相同的頻譜語(yǔ)音分量的第二矢量;b)根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定噪聲抑制系數(shù)的矢量;c)以所述噪聲抑制系數(shù)的矢量對(duì)所述第一矢量頻譜語(yǔ)音分量進(jìn)行加權(quán);d)根據(jù)所述加權(quán)第一矢量頻譜語(yǔ)音分量和所述噪聲抑制系數(shù)的矢量,確定校正因子的矢量;以及e)以所述校正因子的矢量對(duì)所述噪聲抑制系數(shù)的矢量進(jìn)行加權(quán);以及f)以噪聲抑制系數(shù)的加權(quán)矢量對(duì)所述頻譜語(yǔ)音分量的第二矢量進(jìn)行加權(quán)。
14.根據(jù)權(quán)利要求13所述的方法,其特征在于還包括根據(jù)加權(quán)第一矢量頻譜語(yǔ)音分量,確定語(yǔ)音對(duì)噪聲關(guān)系,以及(d)包括根據(jù)所述加權(quán)第一矢量頻譜語(yǔ)音分量、所述噪聲抑制系數(shù)的矢量和所述語(yǔ)音對(duì)噪聲關(guān)系,確定所述抑制校正因子的矢量。
15.根據(jù)權(quán)利要求14所述的方法,其特征在于所述語(yǔ)音對(duì)噪聲關(guān)系表示所述頻譜語(yǔ)音分量中語(yǔ)音出現(xiàn)的概率。
16.根據(jù)權(quán)利要求13所述的方法,其特征在于還包括根據(jù)頻譜語(yǔ)音分量的所述第一矢量,估計(jì)頻譜噪聲分量的矢量,以及其中(e)包括e1)根據(jù)頻譜語(yǔ)音分量的所述加權(quán)第一矢量、所述噪聲抑制系數(shù)、所述語(yǔ)音對(duì)噪聲關(guān)系和所述頻譜噪聲分量,確定第一校正因子的矢量;e2)根據(jù)所述語(yǔ)音對(duì)噪聲關(guān)系,將所述第一校正因子與第二校正因子組合,以產(chǎn)生所述抑制校正因子的矢量。
17.根據(jù)權(quán)利要求16所述的方法,其特征在于(e2)包括根據(jù)pFV+(1-p)FU來(lái)組合所述第一校正因子和所述第二校正因子,其中p表示所述語(yǔ)音對(duì)噪聲關(guān)系,以及FU和FV分別表示所述第一校正因子和所述第二校正因子。
18.根據(jù)權(quán)利要求13所述的方法,其特征在于還包括以所述抑制校正因子對(duì)所述噪聲抑制系數(shù)的矢量進(jìn)行加權(quán),以及(e)包括以加權(quán)噪聲抑制系數(shù)對(duì)頻譜語(yǔ)音分量的所述第二矢量進(jìn)行加權(quán)。
19.一種用于抑制語(yǔ)音信號(hào)中的噪聲的設(shè)備,包括轉(zhuǎn)換器(2),將語(yǔ)音信號(hào)轉(zhuǎn)換為頻譜語(yǔ)音分量的第一矢量和與所述第一矢量頻譜語(yǔ)音分量相同的頻譜語(yǔ)音分量的第二矢量;噪聲抑制系數(shù)計(jì)算器(8),根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定噪聲抑制系數(shù)的矢量;語(yǔ)音對(duì)噪聲關(guān)系計(jì)算器(24),根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定語(yǔ)音對(duì)噪聲關(guān)系;在后抑制系數(shù)計(jì)算器(25),根據(jù)所述語(yǔ)音對(duì)噪聲關(guān)系、所述第一矢量頻譜語(yǔ)音分量和所述噪聲抑制系數(shù)的矢量,確定在后抑制系數(shù)的矢量;以及加權(quán)電路(26),以所述在后抑制系數(shù)的矢量對(duì)所述頻譜語(yǔ)音分量的第二矢量進(jìn)行加權(quán)。
20.根據(jù)權(quán)利要求19所述的設(shè)備,其特征在于所述在后抑制系數(shù)計(jì)算器(25)根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定第一校正因子,并根據(jù)所述第一校正因子和預(yù)定第二校正因子,計(jì)算所述在后抑制系數(shù),組合第一和第二校正因子,以產(chǎn)生所述在后抑制系數(shù)。
21.根據(jù)權(quán)利要求19所述的設(shè)備,其特征在于還包括第三加權(quán)電路(10),以來(lái)自所述噪聲抑制系數(shù)計(jì)算器(8)的所述噪聲抑制系數(shù)對(duì)所述第一矢量頻譜語(yǔ)音分量進(jìn)行加權(quán),以及所述在后抑制系數(shù)計(jì)算器(25A)利用加權(quán)第一矢量頻譜語(yǔ)音分量來(lái)確定所述第一校正因子。
22.根據(jù)權(quán)利要求21所述的設(shè)備,其特征在于還包括噪聲估計(jì)電路(5),根據(jù)所述頻譜語(yǔ)音分量的第一矢量,估計(jì)頻譜噪聲分量的矢量;以及所述在后抑制系數(shù)計(jì)算器(25A)利用估計(jì)頻譜噪聲分量來(lái)確定所述第一校正因子。
23.根據(jù)權(quán)利要求19所述的設(shè)備,其特征在于所述在后抑制系數(shù)計(jì)算器(25A)根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定所述第二校正因子,以及利用所述第一和第二校正因子來(lái)確定所述在后抑制系數(shù)的矢量。
24.根據(jù)權(quán)利要求19所述的設(shè)備,其特征在于所述在后抑制系數(shù)計(jì)算器(25A)包括組合電路(251),通過(guò)利用所確定的語(yǔ)音對(duì)噪聲關(guān)系,組合所述第一和第二校正因子。
25.根據(jù)權(quán)利要求24所述的設(shè)備,其特征在于所述組合電路(251)根據(jù)pFV+(1-p)FU來(lái)組合所述第一校正因子和所述第二校正因子,其中p表示所述語(yǔ)音對(duì)噪聲關(guān)系,以及FU和FV分別表示所述第一校正因子和所述第二校正因子。
26.根據(jù)權(quán)利要求19所述的設(shè)備,其特征在于所述語(yǔ)音對(duì)噪聲關(guān)系表示所述頻譜語(yǔ)音分量的第一矢量中語(yǔ)音部分出現(xiàn)的概率。
27.根據(jù)權(quán)利要求22所述的設(shè)備,其特征在于還包括第一平均電路(22),平均所述頻譜語(yǔ)音分量,以產(chǎn)生語(yǔ)音功率平均值;以及第二平均電路(23),平均估計(jì)頻譜噪聲分量,以產(chǎn)生噪聲功率平均值,以及語(yǔ)音對(duì)噪聲關(guān)系計(jì)算器(24)包括一對(duì)平滑電路(242a、242b),分別根據(jù)第一和第二平滑因子,平滑語(yǔ)音功率平均值,以產(chǎn)生第一平滑語(yǔ)音功率平均值和第二平滑語(yǔ)音功率平均值;一對(duì)第一和第二函數(shù)值計(jì)算器(245a、245b),根據(jù)噪聲功率平均值,產(chǎn)生第一函數(shù)值和第二函數(shù)值;一對(duì)第一和第二索引計(jì)算器(246a、246b),根據(jù)所述第一平滑語(yǔ)音功率平均值,從所述第一函數(shù)值中產(chǎn)生第一索引,以及根據(jù)所述第二平滑語(yǔ)音功率平均值,從所述第二函數(shù)值中產(chǎn)生第二索引;以及加法器(247),對(duì)所述第一和第二索引求和,以產(chǎn)生表示所述語(yǔ)音對(duì)噪聲關(guān)系的輸出信號(hào)。
28.一種用于抑制語(yǔ)音信號(hào)中的噪聲的設(shè)備,包括轉(zhuǎn)換器(2),將語(yǔ)音信號(hào)轉(zhuǎn)換為頻譜語(yǔ)音分量的第一矢量和與所述第一矢量頻譜語(yǔ)音分量相同的頻譜語(yǔ)音分量的第二矢量;噪聲抑制系數(shù)計(jì)算器(8),根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定噪聲抑制系數(shù)的矢量;語(yǔ)音對(duì)噪聲關(guān)系計(jì)算器(24),根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定語(yǔ)音對(duì)噪聲關(guān)系;在后抑制系數(shù)計(jì)算器(25B),根據(jù)所述語(yǔ)音對(duì)噪聲關(guān)系,確定噪聲抑制系數(shù)的多個(gè)下限值,將所述噪聲抑制系數(shù)的矢量與所述噪聲抑制系數(shù)的下限值進(jìn)行比較,并根據(jù)所述比較的結(jié)果,產(chǎn)生在后抑制系數(shù)的矢量;以及加權(quán)電路(26),以所述在后抑制系數(shù)的矢量對(duì)所述頻譜語(yǔ)音分量的第二矢量進(jìn)行加權(quán)。
29.根據(jù)權(quán)利要求28所述的設(shè)備,其特征在于所述在后抑制系數(shù)計(jì)算器(25B)根據(jù)第一校正因子下限值和第二校正因子下限值來(lái)確定所述噪聲抑制系數(shù)的多個(gè)下限值。
30.根據(jù)權(quán)利要求28所述的設(shè)備,其特征在于所述在后抑制系數(shù)計(jì)算器(25B)根據(jù)所述頻譜語(yǔ)音分量的第一矢量,確定所述第一校正因子下限值和所述語(yǔ)音出現(xiàn)校正因子下限值。
31.根據(jù)權(quán)利要求28所述的設(shè)備,其特征在于所述語(yǔ)音對(duì)噪聲關(guān)系表示頻譜語(yǔ)音分量的所述第一矢量中語(yǔ)音部分出現(xiàn)的概率。
32.根據(jù)權(quán)利要求28所述的設(shè)備,其特征在于還包括第一平均電路(22),平均所述第一矢量頻譜語(yǔ)音分量,以產(chǎn)生語(yǔ)音功率平均值;以及第二平均電路(23),平均估計(jì)頻譜噪聲分量,以產(chǎn)生噪聲功率平均值,以及語(yǔ)音對(duì)噪聲關(guān)系計(jì)算器(24)包括一對(duì)平滑電路(242a、242b),分別根據(jù)第一和第二平滑因子,平滑語(yǔ)音功率平均值,以產(chǎn)生第一平滑語(yǔ)音功率平均值和第二平滑語(yǔ)音功率平均值;一對(duì)第一和第二函數(shù)值計(jì)算器(245a、245b),根據(jù)噪聲功率平均值,產(chǎn)生第一函數(shù)值和第二函數(shù)值;一對(duì)第一和第二索引計(jì)算器(246a、246b),根據(jù)所述第一平滑語(yǔ)音功率平均值,從所述第一函數(shù)值中產(chǎn)生第一索引,以及根據(jù)所述第二平滑語(yǔ)音功率平均值,從所述第二函數(shù)值中產(chǎn)生第二索引;以及加法器(247),對(duì)所述第一和第二索引求和,以產(chǎn)生表示所述語(yǔ)音對(duì)噪聲關(guān)系的輸出信號(hào)。
33.一種用于抑制語(yǔ)音信號(hào)中的噪聲的設(shè)備,包括轉(zhuǎn)換器(2),將語(yǔ)音信號(hào)轉(zhuǎn)換為頻譜語(yǔ)音分量的第一矢量和與所述第一矢量頻譜語(yǔ)音分量相同的頻譜語(yǔ)音分量的第二矢量;噪聲抑制系數(shù)計(jì)算器(8),根據(jù)所述第一矢量頻譜語(yǔ)音分量,確定噪聲抑制系數(shù)的矢量;計(jì)算器(7A;7B),以所述噪聲抑制系數(shù)的矢量對(duì)所述第一矢量頻譜語(yǔ)音分量進(jìn)行加權(quán);抑制系數(shù)校正器(9A;9B),根據(jù)所述加權(quán)第一矢量頻譜語(yǔ)音分量,計(jì)算第一部分校正因子的矢量,將所述第一部分校正因子的矢量與第二部分校正因子的矢量進(jìn)行組合,以產(chǎn)生組合校正因子的矢量,并以所述組合校正因子的矢量對(duì)所述噪聲抑制系數(shù)的矢量進(jìn)行加權(quán),以產(chǎn)生抑制校正因子的矢量;以及加權(quán)電路(10),以抑制校正因子的矢量對(duì)所述頻譜語(yǔ)音分量的第二矢量進(jìn)行加權(quán)。
34.根據(jù)權(quán)利要求33所述的設(shè)備,其特征在于還包括語(yǔ)音對(duì)噪聲關(guān)系計(jì)算器(7A,7B),根據(jù)頻譜語(yǔ)音分量的所述加權(quán)第一矢量,確定語(yǔ)音對(duì)噪聲關(guān)系,以及所述抑制系數(shù)校正器(9A,9B)根據(jù)所述語(yǔ)音對(duì)噪聲關(guān)系,確定所述噪聲抑制系數(shù)的多個(gè)下限值。
35.根據(jù)權(quán)利要求33所述的設(shè)備,其特征在于所述語(yǔ)音對(duì)噪聲關(guān)系表示頻譜語(yǔ)音分量的所述第一矢量中語(yǔ)音部分出現(xiàn)的概率。
36.根據(jù)權(quán)利要求34所述的設(shè)備,其特征在于還包括第一平均電路(22),平均所述第一矢量頻譜語(yǔ)音分量,以產(chǎn)生語(yǔ)音功率平均值;以及第二平均電路(23),平均估計(jì)頻譜噪聲分量,以產(chǎn)生噪聲功率平均值,以及所述語(yǔ)音對(duì)噪聲關(guān)系計(jì)算器包括一對(duì)平滑電路(242a、242b),分別根據(jù)第一和第二平滑因子,平滑語(yǔ)音功率平均值,以產(chǎn)生第一平滑語(yǔ)音功率平均值和第二平滑語(yǔ)音功率平均值;一對(duì)第一和第二函數(shù)值計(jì)算器(245a、245b),根據(jù)噪聲功率平均值,產(chǎn)生第一函數(shù)值和第二函數(shù)值;一對(duì)第一和第二索引計(jì)算器(246a、246b),根據(jù)所述第一平滑語(yǔ)音功率平均值,從所述第一函數(shù)值中產(chǎn)生第一索引,以及根據(jù)所述第二平滑語(yǔ)音功率平均值,從所述第二函數(shù)值中產(chǎn)生第二索引;以及加法器(247),對(duì)所述第一和第二索引求和,以產(chǎn)生表示所述語(yǔ)音對(duì)噪聲關(guān)系的輸出信號(hào)。
37.根據(jù)權(quán)利要求33所述的設(shè)備,其特征在于所述抑制系數(shù)校正器(9A;9B)根據(jù)pFV+(1-p)FU來(lái)組合第一校正因子的所述矢量和第二校正因子的所述矢量,其中p表示所述語(yǔ)音對(duì)噪聲關(guān)系,以及FU和FV分別表示所述第一校正因子和所述第二校正因子。
全文摘要
在用于抑制包含在語(yǔ)音信號(hào)中的噪聲的噪聲抑制設(shè)備中,將語(yǔ)音信號(hào)轉(zhuǎn)換為譜語(yǔ)音分量的第一矢量和與第一矢量相同的譜語(yǔ)音分量的第二矢量。根據(jù)第一矢量譜語(yǔ)音分量,確定噪聲抑制系數(shù)的矢量。根據(jù)所述第一矢量譜語(yǔ)音分量,確定估計(jì)噪聲分量的矢量,并根據(jù)估計(jì)噪聲分量和第一矢量譜語(yǔ)音分量,計(jì)算語(yǔ)音部分校正因子和非語(yǔ)音部分校正因子,以產(chǎn)生組合校正因子。以組合校正因子對(duì)噪聲抑制系數(shù)進(jìn)行加權(quán),以產(chǎn)生在后抑制系數(shù)的矢量。以在后抑制系數(shù)對(duì)第二矢量譜語(yǔ)音分量進(jìn)行加權(quán),以產(chǎn)生增強(qiáng)語(yǔ)音分量的矢量。
文檔編號(hào)H03H21/00GK1892822SQ20061008767
公開(kāi)日2007年1月10日 申請(qǐng)日期2006年5月31日 優(yōu)先權(quán)日2005年5月31日
發(fā)明者加藤正德, 杉山昭彥 申請(qǐng)人:日本電氣株式會(huì)社
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1