專利名稱:用于抑制噪聲的方法、設(shè)備和計(jì)算機(jī)程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種噪聲抑制方法、 一種用于抑制疊加在所需語(yǔ)音信 號(hào)上的噪聲的噪聲抑制設(shè)備、以及一種用于抑制所述噪聲的計(jì)算機(jī)程序。
背景技術(shù):
噪聲抑制器(噪聲抑制系統(tǒng))是一種用于抑制疊加在所需語(yǔ)音信 號(hào)上的噪聲的系統(tǒng),通常通過(guò)以下操作來(lái)抑制混合在所需語(yǔ)音信號(hào)中 的噪聲通過(guò)將輸入信號(hào)轉(zhuǎn)換到頻域來(lái)估計(jì)噪聲分量的功率譜;以及 從輸入信號(hào)中扣除所估計(jì)出的功率譜。噪聲抑制器也可以用于通過(guò)連 續(xù)估計(jì)噪聲分量的功率譜來(lái)抑制不規(guī)則噪聲。例如,噪聲抑制器可以 是一種北美便攜式電話標(biāo)準(zhǔn)所采用的方法,可參見(jiàn)非專利文獻(xiàn)1 (技 術(shù)要求(TR45) . ENHANCED VARIABLE RATE CODEC, SPEECH SERVICE OPTION 3 FOR WIDEBAND SPREAD SPECTRUM DIGITAL SYSTEMS)和專利 文獻(xiàn)1 (日本未審公開(kāi)專利申請(qǐng)No. 2002-204175)。
通常,將通過(guò)對(duì)用于收集聲波的麥克風(fēng)的輸出信號(hào)進(jìn)行模擬-數(shù) 字(AD)轉(zhuǎn)換而得到的數(shù)字信號(hào)作為輸入信號(hào)傳送至噪聲抑制器。通 常,將高通濾波器放置在AD轉(zhuǎn)換器和噪聲抑制器之間,主要用于抑制 在麥克風(fēng)中收集聲音時(shí)和在對(duì)該聲音進(jìn)行AD轉(zhuǎn)換時(shí)所引入的低頻范 圍內(nèi)的分量。例如,在專利文獻(xiàn)2 (美國(guó)專利No.5,659,622)中公開(kāi) 了上述結(jié)構(gòu)示例。
圖1示出了將專利文獻(xiàn)1的噪聲抑制器與專利文獻(xiàn)2的高通濾波 器進(jìn)行組合的結(jié)構(gòu)。
將含噪聲的話音信號(hào)(其中所需語(yǔ)音信號(hào)與噪聲相混合的信號(hào)) 作為采樣值序列傳送至輸入端11。將含噪聲的話音信號(hào)采樣傳送至高通濾波器17,并在對(duì)其低頻范圍內(nèi)的分量進(jìn)行抑制之后,將其傳送至
分幀器(frame divider) 1。對(duì)于保持輸入含噪聲話音的線性以及實(shí) 現(xiàn)充分的信號(hào)處理性能而言,抑制低頻范圍內(nèi)的分量是絕對(duì)必要的。 分幀器1將含噪聲的話音信號(hào)采樣分為其單位是特定數(shù)目的幀,并將 所述幀傳送至窗口處理器2。窗口處理器2將已分為幀的、含噪聲的 話音信號(hào)采樣與窗口函數(shù)相乘,并將結(jié)果傳送至傅立葉變換器3。
傅立葉變換器3對(duì)窗口處理過(guò)的、含噪聲的話音信號(hào)釆樣進(jìn)行傅 立葉變換,以便將所述信號(hào)采樣分為多個(gè)頻率分量,并對(duì)幅度值進(jìn)行 復(fù)用,以將所述多個(gè)頻率分量傳送至估計(jì)噪聲計(jì)算器52、噪聲抑制系 數(shù)發(fā)生器82和復(fù)用乘法器16。將相位傳送至逆傅立葉變換器9。估計(jì) 噪聲計(jì)算器52估計(jì)所傳送的多個(gè)頻率分量中的每一個(gè)的噪聲,并將所 述噪聲傳送至噪聲抑制系數(shù)發(fā)生器82。 一種噪聲估計(jì)方法的示例是以 過(guò)去的信號(hào)噪聲比對(duì)含噪聲的話音進(jìn)行加權(quán)以將其指定為噪聲分量的 方法,在專利文獻(xiàn)1中描述了上述方法的細(xì)節(jié)。
噪聲抑制系數(shù)發(fā)生器82產(chǎn)生噪聲抑制系數(shù),以便通過(guò)將含噪聲 的話音與估計(jì)噪聲相乘來(lái)獲得已針對(duì)多個(gè)頻率分量中的每一個(gè)抑制了 噪聲的增強(qiáng)語(yǔ)音。作為產(chǎn)生噪聲抑制系數(shù)的示例,廣泛地采用了用于 使增強(qiáng)語(yǔ)音的平均平方功率最小化的最小均方短時(shí)譜幅度方法,在專 利文獻(xiàn)1中描述了上述方法的細(xì)節(jié)。
將針對(duì)每個(gè)頻率而產(chǎn)生的噪聲抑制系數(shù)傳送至復(fù)用乘法器16。針 對(duì)每個(gè)頻率,復(fù)用乘法器16將從傅立葉變換器3傳送過(guò)來(lái)的含噪聲的 話音與從噪聲抑制系數(shù)發(fā)生器82傳送過(guò)來(lái)的噪聲抑制系數(shù)相乘,并將 乘積傳送至逆傅立葉變換器9,作為增強(qiáng)語(yǔ)音的幅度。逆傅立葉變換 器9通過(guò)將從復(fù)用乘法器16傳送過(guò)來(lái)的增強(qiáng)語(yǔ)音幅度與含噪聲的話音 的相位(所述相位來(lái)自傅立葉變換器3)進(jìn)行組合來(lái)執(zhí)行逆傅立葉變 換,并將逆傅立葉變換后的信號(hào)傳送至幀合成器10,作為增強(qiáng)語(yǔ)音信 號(hào)采樣。幀合成器10通過(guò)使用相鄰幀的增強(qiáng)語(yǔ)音采樣來(lái)合成相應(yīng)幀的 輸出語(yǔ)音采樣,以將合成后的采樣傳送至輸出端1
發(fā)明內(nèi)容
高通濾波器17抑制直流附近的頻率分量。通常,其頻率等于或
高于100Hz到120Hz的分量通過(guò)高通濾波器17而未被抑制。當(dāng)高通濾 波器17的結(jié)構(gòu)可以被歸類為有限沖激響應(yīng)(FIR)型或無(wú)限沖激響應(yīng) (IIR)型濾波器時(shí),需要尖銳的通帶端接特性,因此通常采用IIR 型濾波器。對(duì)于IIR型濾波器,已知的是傳遞函數(shù)被表達(dá)為有理函
數(shù),且對(duì)分母系數(shù)的敏感度極高。因此,存在以下問(wèn)題在將高通濾
波器17實(shí)現(xiàn)為有限字長(zhǎng)計(jì)算時(shí),需要頻繁地使用雙精度計(jì)算來(lái)實(shí)現(xiàn)足 夠的精確性,因此計(jì)算量較大。另一方面,如果去除高通濾波器17
以降低計(jì)算量,則難以維持輸入信號(hào)的線性,而不能實(shí)現(xiàn)高質(zhì)量的噪 聲抑制。
本發(fā)明的目的在于提供一種噪聲抑制方法和一種噪聲抑制設(shè)備, 其能夠以較小的計(jì)算量來(lái)抑制低頻范圍內(nèi)的分量并實(shí)現(xiàn)高質(zhì)量的噪聲 抑制。
根據(jù)本發(fā)明的噪聲抑制方法將輸入信號(hào)轉(zhuǎn)換為頻域信號(hào),修正頻 域信號(hào)的幅度以獲得幅度修正信號(hào),通過(guò)使用幅度修正信號(hào)來(lái)獲得估 計(jì)噪聲,通過(guò)使用估計(jì)噪聲和幅度修正信號(hào)來(lái)確定抑制系數(shù),以及以 抑制系數(shù)對(duì)幅度修正信號(hào)進(jìn)行加權(quán)。
另一方面,根據(jù)本發(fā)明的噪聲抑制設(shè)備具有轉(zhuǎn)換器,用于將輸 入信號(hào)轉(zhuǎn)換為頻域信號(hào);幅度修正器,用于修正頻域信號(hào)的幅度以獲 得幅度修正信號(hào);噪聲估計(jì)器,用于通過(guò)使用幅度修正信號(hào)來(lái)獲得估 計(jì)噪聲;抑制系數(shù)發(fā)生器,用于通過(guò)使用估計(jì)噪聲和幅度修正信號(hào)來(lái) 確定抑制系數(shù);以及乘法器,用于以抑制系數(shù)對(duì)幅度修正信號(hào)進(jìn)行加 權(quán)。
根據(jù)本發(fā)明的一種用于噪聲抑制的信號(hào)處理計(jì)算機(jī)程序包括將 輸入信號(hào)轉(zhuǎn)換為頻域信號(hào)的處理,修正頻域信號(hào)的幅度以獲得幅度修 正信號(hào)的處理,通過(guò)使用幅度修正信號(hào)來(lái)獲得估計(jì)噪聲的處理,通過(guò) 使用估計(jì)噪聲和幅度修正信號(hào)來(lái)確定抑制系數(shù)的處理,以及以抑制系 數(shù)對(duì)幅度修正信號(hào)進(jìn)行加權(quán)的處理。
具體地,根據(jù)本發(fā)明的噪聲抑制方法和設(shè)備的特征在于抑制傅立 葉變換后的信號(hào)的低頻范圍內(nèi)的分量。更具體地,所述設(shè)備的特征在于包括..幅度修正器,用于抑制傅立葉變換后的輸出的幅度的低頻范 圍內(nèi)的分量;以及相位修正器,用于修正與低頻范圍內(nèi)的分量的幅度 調(diào)整相對(duì)應(yīng)的相位,以修正傅立葉變換后的輸出的相位。
根據(jù)本發(fā)明,將轉(zhuǎn)換到頻域的信號(hào)的幅度與一常數(shù)相乘,將一常 數(shù)與相位相加,從而能夠以單一的精確計(jì)算來(lái)實(shí)現(xiàn)所述方法和設(shè)備, 并能夠以較小的計(jì)算量來(lái)實(shí)現(xiàn)高質(zhì)量的噪聲抑制。
圖1是示出了傳統(tǒng)噪聲抑制設(shè)備的結(jié)構(gòu)示例的方框圖; 圖2是示出了本發(fā)明第一典型實(shí)施例的方框圖; 圖3是示出了包括在本發(fā)明第一典型實(shí)施例中的幅度修正器的結(jié) 構(gòu)的方框圖4是示出了包括在圖3中的語(yǔ)音存在概率計(jì)算器的結(jié)構(gòu)的方框
圖5是示出了本發(fā)明第二典型實(shí)施例的方框圖; 圖6是示出了本發(fā)明第三典型實(shí)施例的方框圖; 圖7是示出了包括在本發(fā)明第三典型實(shí)施例中的復(fù)用乘法器的結(jié) 構(gòu)的方框圖8是示出了包括在本發(fā)明第三典型實(shí)施例中的加權(quán)噪聲話音計(jì)
算器的結(jié)構(gòu)的方框圖9是示出了包括在圖8中的頻域SNR計(jì)算器的結(jié)構(gòu)的方框圖; 圖10是示出了包括在圖8中的復(fù)用非線性處理器的結(jié)構(gòu)的方框
圖11是示出了非線性處理器的非線性函數(shù)的示例的曲線圖; 圖12是示出了包括在本發(fā)明第三典型實(shí)施例中的估計(jì)噪聲計(jì)算 器的結(jié)構(gòu)的方框圖13是示出了包括在圖12中的頻域估計(jì)噪聲計(jì)算器的結(jié)構(gòu)的方
框圖14是示出了包括在圖13中的更新判決器的結(jié)構(gòu)的方框圖; 圖15是示出了包括在本發(fā)明第三典型實(shí)施例中的估計(jì)先驗(yàn)SNR計(jì)算器的結(jié)構(gòu)的方框圖16是示出了包括在圖15中的多值域限制器的結(jié)構(gòu)的方框圖17是示出了包括在圖15中的復(fù)用加權(quán)加法器的結(jié)構(gòu)的方框
圖18是示出了包括在圖17中的加權(quán)加法器的結(jié)構(gòu)的方框圖19是示出了包括在本發(fā)明第三典型實(shí)施例中的噪聲抑制系數(shù) 發(fā)生器的結(jié)構(gòu)的方框圖20是示出了包括在本發(fā)明第三典型實(shí)施例中的抑制系數(shù)修正 器的結(jié)構(gòu)的方框圖;以及
圖21是示出了包括在圖20中的頻域抑制系數(shù)修正器的結(jié)構(gòu)的方 框圖。
符號(hào)說(shuō)明
1分幀器
2、 20窗口處理器
3傅立葉變換器
4、 5049計(jì)數(shù)器
5、 52估計(jì)噪聲計(jì)算器
6、 1042頻域SNR計(jì)算器
7估計(jì)先驗(yàn)SNR計(jì)算器
8、 82噪聲抑制系數(shù)發(fā)生器
9逆傅立葉變換器
10幀合成器
11輸入端
12輸出端
13、 16、 704、 705、 1404復(fù)用乘法器
14加權(quán)噪聲話音計(jì)算器
15抑制系數(shù)修正器
17高通濾波器
18幅度修正器200680040704.5
說(shuō)明書第6/23頁(yè)
19相位修正器
21語(yǔ)音缺失概率存儲(chǔ)器
22偏移消除器
501、 502、 1302、 1303分離器
1422、 1423、1495、1502分離器
1503、 1801、1901分離器
7013、 7072、7074分離器
503、 1304、1424、1475復(fù)用器
1504、 1803、1903復(fù)用器
7014、 7075復(fù)用器
504()至504K—,頻域估計(jì)噪聲計(jì)算器
520更新判決器
701多值域限制器
702后驗(yàn)SNR存儲(chǔ)器
703抑制系數(shù)存儲(chǔ)器
706權(quán)重存儲(chǔ)器
707復(fù)用加權(quán)加法器
708、 5046、7092、7094加法器
811MMSE STSA增益函數(shù)值計(jì)算器
812廣義似然比計(jì)算器
814抑制系數(shù)計(jì)算器
921瞬時(shí)估計(jì)SNR
921。至921K—,頻域瞬時(shí)估計(jì)SNR
922以往估計(jì)SNR
922 至922K—,以往頻域估計(jì)SNR
923權(quán)重
924估計(jì)先驗(yàn)SNR
924。至924k一,頻域估計(jì)先驗(yàn)SNR
1301。至1301K-l乘法器
1597、 7091、7093乘法器1401、 5042估計(jì)噪聲存儲(chǔ)器
1405復(fù)用非線性處理器
14210至1421K—,、 5048除法器
1485。至1485h非線性處理器
1501()至1501K—,頻域抑制系數(shù)修正器
1591、 7012。至7012k—最大值選擇器
1592抑制系數(shù)下限值存儲(chǔ)器
1593、 5204、 5206閾值存儲(chǔ)器
1594、 5203、 5205比較器
1595、 5044開(kāi)關(guān)
1596修正值存儲(chǔ)器
18020至1802K—,加權(quán)處理器
19020至1902K-,相位旋轉(zhuǎn)器
5041寄存器長(zhǎng)度存儲(chǔ)器
5045移位寄存器
5047最小值選擇器
5201邏輯或計(jì)算器
5207閾值計(jì)算器
7011常數(shù)存儲(chǔ)器
7071。至7071k—,加權(quán)加法器
7095常數(shù)乘法器
具體實(shí)施例方式
圖2是示出了本發(fā)明第一典型實(shí)施例的方框圖。除了高通濾波器 17、幅度修正器18、相位修正器19和窗口處理器20以外,圖2所示 結(jié)構(gòu)與圖l所示結(jié)構(gòu)(傳統(tǒng)示例)相同。以下的詳細(xì)討論將集中在這 些不同點(diǎn)上。
在圖2中,刪除了圖l所示的高通濾波器17,而代替地設(shè)置了幅 度修正器18、相位修正器19和窗口處理器20。設(shè)置幅度修正器18 和相位修正器19,以將高通濾波器的頻率響應(yīng)施加于被轉(zhuǎn)換至頻域的信號(hào)上。將函數(shù)/的絕對(duì)值(幅度頻率響應(yīng))在幅度修正器18中施加 于輸入信號(hào),以及將函數(shù)/的相位(相位頻率響應(yīng))在相位修正器19 中施加于輸入信號(hào),其中通過(guò)將z-exp(,2;r/)施加于高通濾波器17的 傳遞函數(shù)來(lái)獲得所述函數(shù)/。
通過(guò)上述操作,可以獲得與將高通濾波器17施加于輸入信號(hào)相 同的效果。也就是說(shuō),代替在時(shí)域上將高通濾波器17的傳遞函數(shù)與輸 入信號(hào)進(jìn)行巻積,在傅立葉變換器3中被轉(zhuǎn)換為頻域信號(hào)之后,將所 述函數(shù)與頻率響應(yīng)相乘。
將幅度修正器18的輸出傳送至估計(jì)噪聲計(jì)算器52、噪聲抑制系 數(shù)發(fā)生器82和復(fù)用乘法器16。將相位修正器19的輸出傳送至逆傅立 葉變換器9。
隨后的操作與參照?qǐng)D1所描述的操作相同。如專利文獻(xiàn)3 (曰本 未審公開(kāi)專利申請(qǐng)No. 2003-131689)所公開(kāi)的那樣,設(shè)置窗口處理器 20以抑制幀邊界處的間斷聲音。
圖3示出了幅度修正器18的結(jié)構(gòu)示例。將來(lái)自傅立葉變換器3 的復(fù)用噪聲話音幅度譜傳送至分離器1801。分離器1801將復(fù)用噪聲 話音幅度譜分解為各個(gè)頻率分量,并將所述頻率分量傳送至加權(quán)處理 器匿()至1802K—,。加權(quán)處理器1802。至1802K-,以相應(yīng)的幅度頻率響應(yīng)
對(duì)被分解為各個(gè)頻率分量的每個(gè)噪聲話音幅度譜進(jìn)行加權(quán),并將所述 譜傳送至復(fù)用器1803。復(fù)用器1803對(duì)來(lái)自加權(quán)處理器1802(>至1802K-, 的信號(hào)進(jìn)行復(fù)用,以輸出復(fù)用信號(hào),作為修正噪聲話音幅度譜。
圖4示出了相位修正器19的結(jié)構(gòu)示例。將從傅立葉變換器3傳 送過(guò)來(lái)的復(fù)用噪聲話音相位譜傳送至分離器1901。分離器1901將復(fù) 用噪聲話音相位譜分解為各個(gè)頻率分量,并將各個(gè)頻率分量傳送至相 位旋轉(zhuǎn)器1902。至1902K—,。每個(gè)相位旋轉(zhuǎn)器1902。至1902k-,根據(jù)相皮的
相位頻率響應(yīng)對(duì)被分解為各個(gè)頻率分量的噪聲話音相位譜進(jìn)行旋轉(zhuǎn), 并將所述譜傳送至復(fù)用器1903。復(fù)用器1903對(duì)來(lái)自相位旋轉(zhuǎn)器1902。 至1902K—,的信號(hào)進(jìn)行復(fù)用,以輸出復(fù)用信號(hào),作為修正噪聲話音相位 譜。相位修芷器19的存在并不如幅度修正器18那樣重要,因此可以 省略相位修正器19。原因在于己知相位修正器19的存在僅影響輸出信號(hào)的相位,而對(duì)于理解語(yǔ)音內(nèi)容而言,相位信息比幅度信息次要 得多。
圖5是示出了本發(fā)明第二典型實(shí)施例的方框圖。圖5所示結(jié)構(gòu)與
作為第一典型實(shí)施例的圖2所示結(jié)構(gòu)的區(qū)別在于偏移消除器22。偏移 消除器22消除窗口處理后的噪聲話音的偏移,以輸出語(yǔ)音。最簡(jiǎn)單的 偏移消除方法是針對(duì)每一幀獲得噪聲話音的平均值,以將所述平均值 指定為偏移,將從對(duì)應(yīng)幀中的所有采樣中扣除此偏移。或者,針對(duì)多 個(gè)幀,對(duì)每一幀的平均值進(jìn)行平均,并將所獲得的數(shù)值作為偏移從采 樣中扣除。通過(guò)消除偏移,可以在傅立葉變換器3中提高轉(zhuǎn)換精度, 并能夠改善將要輸出的增強(qiáng)語(yǔ)音的聲音質(zhì)量。
圖6是示出了本發(fā)明第三典型實(shí)施例的方框圖。將含噪聲的話音 信號(hào)(所需語(yǔ)音信號(hào)與噪聲相混合的信號(hào))作為采樣值序列傳送至輸 入端ll。將含噪聲的話音信號(hào)采樣傳送至分幀器l,并以K/2個(gè)采樣 為單位分割成幀。這里,假設(shè)K是偶數(shù)。將被分割成幀的噪聲話音信 號(hào)采樣傳送至窗口處理器2,并與窗口函數(shù)w(/)相乘。通過(guò)對(duì)第n幀的 輸入信號(hào)凡W (, = 0,1,...,尺/2-1)進(jìn)行窗口處理而獲得的信號(hào)7 (/)可以 如下等式表示。
此外,在將要進(jìn)行窗口處理的、兩個(gè)連續(xù)幀彼此交疊的部分中廣泛執(zhí) 行上述操作。如果假設(shè)交疊長(zhǎng)度是幀長(zhǎng)度的50%,對(duì)于"0,l,…,尺/2-l, [等式2]
<formula>formula see original document page 12</formula>
通過(guò)上述等式獲得的K(/)(^0,l,…,f/2-1)作為窗口處理器2的輸出。 將左右對(duì)稱的窗口函數(shù)用于實(shí)數(shù)信號(hào)。設(shè)計(jì)窗口函數(shù),從而使輸入信 號(hào)和輸出信號(hào)彼此對(duì)應(yīng),以排除當(dāng)抑制系數(shù)被設(shè)置為"1"時(shí)所導(dǎo)致的
計(jì)算誤差。這意味著W(f) + M^ + K/2)-l。
下面,將繼續(xù)作為示例來(lái)描述其中要進(jìn)行窗口處理的兩個(gè)連續(xù)幀 的50%彼此交疊的情況。例如,可以將以如下等式表示的漢寧窗(Harming Window)用作w(O。 [等式3]
<formula>formula see original document page 13</formula>
除了上述等式外,諸如漢明窗(Hamming Window)、凱瑟窗(Kayser Window)和布萊克曼窗(Blackman Window)等多種窗口函數(shù)是己知的。 將窗口處理后的輸出K(/)傳送至偏移消除器22,并對(duì)偏移進(jìn)行消除。 偏移消除的細(xì)節(jié)與參照?qǐng)D5所描述的內(nèi)容相同。
將已經(jīng)消除了偏移的信號(hào)傳送至傅立葉變換器3,并轉(zhuǎn)換為噪聲 話音譜i:ot)。將噪聲話音譜KOt)分離為相位和幅度,將噪聲話音相位
譜arg]^(Q通過(guò)相位修正器19傳送至逆傅立葉變換器9,以及將噪聲話
音幅度譜li;wl通過(guò)幅度修正器i8傳送至復(fù)用乘法器i3和復(fù)用乘法器
16。相位修正器19和幅度修正器18的操作與參照?qǐng)D2所描述的內(nèi)容 相同。
復(fù)用乘法器13通過(guò)使用其幅度已被修正的噪聲話音幅度譜來(lái)計(jì) 算噪聲話音功率譜,并將所述噪聲話音功率譜傳送至估計(jì)噪聲計(jì)算器 5、頻域SNR (信號(hào)噪聲比)計(jì)算器6和加權(quán)噪聲話音計(jì)算器14。加權(quán) 噪聲話音計(jì)算器14通過(guò)使用從復(fù)用乘法器13傳送過(guò)來(lái)的噪聲話音功 率譜來(lái)計(jì)算加權(quán)噪聲話音功率譜,并將所述加權(quán)噪聲話音功率譜傳送 至估計(jì)噪聲計(jì)算器5。
估計(jì)噪聲計(jì)算器5通過(guò)使用噪聲話音功率譜、加權(quán)噪聲話音功率 譜和來(lái)自計(jì)數(shù)器4的計(jì)數(shù)值來(lái)估計(jì)噪聲的功率譜,并噪聲的功率譜作 為估計(jì)噪聲功率譜傳送至頻域SNR計(jì)算器6。頻域SNR計(jì)算器6通過(guò) 使用輸入的噪聲話音功率譜和輸入的估計(jì)噪聲功率譜來(lái)計(jì)算每個(gè)頻率 的SNR,并將所述SNR作為后驗(yàn)SNR傳送至估計(jì)先驗(yàn)SNR計(jì)算器7和 噪聲抑制系數(shù)發(fā)生器8。
估計(jì)先驗(yàn)SNR計(jì)算器7通過(guò)使用輸入的后驗(yàn)SNR和來(lái)自抑制系數(shù) 修正器15的修正抑制系數(shù)來(lái)估計(jì)先驗(yàn)SNR,并將先驗(yàn)SNR作為估計(jì)先 驗(yàn)SNR傳送至噪聲抑制系數(shù)發(fā)生器8。噪聲抑制系數(shù)發(fā)生器8通過(guò)使用作為輸入而傳送過(guò)來(lái)的后驗(yàn)SNR和估計(jì)先驗(yàn)SNR、以及通過(guò)使用從 語(yǔ)音缺失概率存儲(chǔ)器21傳送過(guò)來(lái)的語(yǔ)音缺失概率來(lái)產(chǎn)生噪聲抑制系 數(shù),并將噪聲抑制系數(shù)作為抑制系數(shù)傳送至抑制系數(shù)修正器15。抑制 系數(shù)修正器15通過(guò)使用輸入的估計(jì)先驗(yàn)SNR和抑制系數(shù)來(lái)修正抑制系 數(shù),并將修正后的抑制系數(shù)作為修正抑制系數(shù)&W傳送至復(fù)用乘法器 16。復(fù)用乘法器16通過(guò)以從抑制系數(shù)修正器15傳送過(guò)來(lái)的修正抑制 系數(shù)5(W對(duì)從傅立葉變換器3通過(guò)幅度修正器18傳送過(guò)來(lái)的修正噪
聲話音幅度譜進(jìn)行加權(quán)來(lái)獲得增強(qiáng)語(yǔ)音幅度譜l足ot)l ,并將增強(qiáng)語(yǔ)音
幅度譜傳送至逆傅立葉變換器9。 IK^I可以由以下等式表示。 [等式4]
|^("| = & | (4) 這里,//"("是幅度修正器18中的修正增益,并作為圖l所示的高通 濾波器的幅度頻率響應(yīng)而獲得。
逆傅立葉變換器9通過(guò)將從復(fù)用乘法器16傳送過(guò)來(lái)的增強(qiáng)語(yǔ)音 幅度譜l&Wl與從傅立葉變換器3通過(guò)相位修正器19傳送過(guò)來(lái)的修正 噪聲話音相位譜argi;W + arg/^W相乘來(lái)獲得增強(qiáng)語(yǔ)音^^)。即,執(zhí)行
以下等式。 [等式5]
^^HAW卜(argi;W + arg/^(W (5) 這里,arg7/"0t)是相位修正器19中的修正相位,并作為圖l所示的高 通濾波器的相位頻率響應(yīng)而獲得。
逆傅立葉變換器9對(duì)所獲得的增強(qiáng)語(yǔ)音^W進(jìn)行逆傅立葉變換, 并將增強(qiáng)語(yǔ)音足W傳送至窗口處理器20,作為時(shí)域采樣序列&(0 (/ = 0,1,...,/:-1),所述時(shí)域采樣序列&W的幀配置有K個(gè)采樣。窗口 處理器20將從逆傅立葉變換器9傳送過(guò)來(lái)的時(shí)域采樣序列與窗口 函數(shù)<0相乘。以如下等式表示信號(hào)&(r),通過(guò)以w(,)對(duì)第n幀的輸入 信號(hào)x力)(,=0,1,...,《/2-1)進(jìn)行窗口處理來(lái)獲得信號(hào)3f力)。 [等式6]<formula>formula see original document page 14</formula>此外,在將要進(jìn)行窗口處理的、兩個(gè)連續(xù)幀彼此交疊的部分中廣泛執(zhí) 行上述操作。如果假設(shè)交疊長(zhǎng)度是幀長(zhǎng)度的50%,對(duì)于^0,l,…,/2-l, [等式7]
W) = 2)
i 0+a:/2) = w(,+/:/2)x (,) ( j
通過(guò)上述等式獲得的y,,(/) (,-o,i,…,尺-1)作為窗口處理器20的輸出, 并傳送至幀合成器io。
幀合成器10從兩個(gè)相鄰的幀^(0的每一個(gè)中取出《/2個(gè)采樣,以 對(duì)這些采樣進(jìn)行交疊,并通過(guò)使用以下等式來(lái)獲得增強(qiáng)語(yǔ)音&(0。
"+《/2) + &(/) (8) 將所獲得的增強(qiáng)語(yǔ)音A(/)傳送至輸出端12,作為幀合成器10的輸出。 圖7是示出了圖6所示的復(fù)用乘法器13的結(jié)構(gòu)的方框圖。復(fù)用 乘法器13包括乘法器1301(,至1301K—,、分離器1302和1303以及復(fù)用 器1304。在分離器1302和1303中,將從圖6的幅度修正器18傳送 過(guò)來(lái)的、已被復(fù)用的修正噪聲話音幅度譜分解為每個(gè)頻率K個(gè)采樣, 并將其分別傳送至乘法器1301。至130V,。乘法器1301 至1301w分別 對(duì)輸入信號(hào)進(jìn)行平方運(yùn)算,并分別將平方信號(hào)傳送至復(fù)用器1304。復(fù) 用器1304對(duì)輸入信號(hào)進(jìn)行復(fù)用,以輸出復(fù)用信號(hào),作為噪聲話音功率 譜。
圖8是示出了加權(quán)噪聲話音計(jì)算器14的結(jié)構(gòu)的方框圖。加權(quán)噪 聲話音計(jì)算器14包括估計(jì)噪聲存儲(chǔ)器1401、頻域SNR計(jì)算器1402、 復(fù)用非線性處理器1405和復(fù)用乘法器1404。估計(jì)噪聲存儲(chǔ)器1401存 儲(chǔ)從圖6的估計(jì)噪聲計(jì)算器5傳送過(guò)來(lái)的估計(jì)噪聲功率譜,并將前一 幀的估計(jì)噪聲功率譜輸出至頻域SNR計(jì)算器1402。
頻域SNR計(jì)算器1402通過(guò)使用從估計(jì)噪聲存儲(chǔ)器1401傳送過(guò)來(lái) 的估計(jì)噪聲功率譜和從圖6的復(fù)用乘法器13傳送過(guò)來(lái)的噪聲話音功率 譜,來(lái)獲得每個(gè)頻率的SNR,并將SNR輸出至復(fù)用非線性處理器1405。 復(fù)用非線性處理器1405通過(guò)使用從頻域SNR計(jì)算器1402傳送過(guò)來(lái)的 SNR,來(lái)計(jì)算權(quán)重系數(shù)矢量,并將權(quán)重系數(shù)矢量輸出至復(fù)用乘法器1404。
針對(duì)每一頻率,復(fù)用乘法器1404計(jì)算從圖6的復(fù)用乘法器13傳 送過(guò)來(lái)的噪聲話音功率譜和從復(fù)用非線性處理器1405傳送過(guò)來(lái)的權(quán) 重系數(shù)矢量的乘積,并將加權(quán)噪聲話音功率譜輸出至圖6的估計(jì)噪聲 計(jì)算器5。復(fù)用乘法器1404的結(jié)構(gòu)與參照?qǐng)D7所描述的復(fù)用乘法器13 的結(jié)構(gòu)相同,所以將省略對(duì)其的詳細(xì)描述。
圖9是示出了包括在圖8中的頻域SNR計(jì)算器1402的結(jié)構(gòu)的方 框圖。頻域SNR計(jì)算器1402包括除法器1421。至1421^、分離器1422 和1423以及復(fù)用器1424。將從圖6的復(fù)用乘法器13傳送過(guò)來(lái)的噪聲 話音功率譜傳送至分離器1422。將從圖8的估計(jì)噪聲存儲(chǔ)器1401傳 送過(guò)來(lái)的估計(jì)噪聲功率譜傳送至分離器1423。在分離器1422和1423 中,將噪聲話音功率譜和估計(jì)噪聲功率譜分別分解為與頻率分量相對(duì) 應(yīng)的K個(gè)采樣,并分別將其傳送至除法器1421。至1421K-,。
在除法器1421。至1421h中,根據(jù)以下等式,通過(guò)將傳送過(guò)來(lái)的 噪聲話音功率譜除以估計(jì)噪聲功率譜,獲得頻域SNR厶(",并將其傳 送至復(fù)用器1424。<formula>formula see original document page 16</formula>(9)
這里,義"一,Ot)是前一幀中的估計(jì)噪聲功率譜。復(fù)用器1424對(duì)傳送過(guò)來(lái) 的K個(gè)頻域SNR進(jìn)行復(fù)用,并將復(fù)用SNR傳送至圖8的復(fù)用非線性處 理器1405。
接下來(lái),將參照?qǐng)D10,對(duì)圖8的復(fù)用非線性處理器1405的結(jié)構(gòu) 和操作進(jìn)行詳細(xì)描述。圖10是示出了包括在加權(quán)噪聲話音計(jì)算器14 中的復(fù)用非線性處理器1405的結(jié)構(gòu)的方框圖。復(fù)用非線性處理器1405 包括分離器1495、非線性處理器1485 至1485h和夏用器1475。分離 器1495將從圖8的頻域SNR計(jì)算器1402傳送過(guò)來(lái)的SNR分解為頻域 SNR,并將分解后的SNR傳送至非線性處理器1485。至1485K-,。非線性 處理器1485。至1485K-,分別包括用于根據(jù)輸入值而輸出實(shí)數(shù)值的非線 性函數(shù)。圖11示出了非線性函數(shù)的示例。如果乂是輸入值,則可以通過(guò)以 下等式獲得圖11所示的非線性函數(shù)的輸出值/2。 [等式10]<formula>formula see original document page 17</formula>(10)
這里,"和6是任意實(shí)數(shù)。
回到圖10,非線性處理器1485 至1485K-,利用非線性函數(shù)來(lái)處理 從分離器1495傳送過(guò)來(lái)的頻域SNR,以獲得加權(quán)系數(shù),并將加權(quán)系數(shù) 輸出至復(fù)用器1475。即,非線性處理器1485。至1485H根據(jù)SNR來(lái)輸 出加權(quán)系數(shù)"1"至"0"。當(dāng)SNR較小時(shí),輸出"1",而當(dāng)SNR較大時(shí), 輸出"0"。復(fù)用器1475對(duì)從非線性處理器1485。至1485K—,輸出的加權(quán) 系數(shù)進(jìn)行復(fù)用,并將復(fù)用加權(quán)系數(shù)作為加權(quán)系數(shù)矢量輸出至復(fù)用乘法 器1404。
在圖8復(fù)用乘法器1404中與噪聲話音功率譜相乘的加權(quán)系數(shù)是 與SNR對(duì)應(yīng)的值,當(dāng)SNR較大,即包含在含噪聲的話音中的語(yǔ)音分量 較大時(shí),加權(quán)系數(shù)的值較小。雖然通常將噪聲話音功率譜用于更新估 計(jì)噪聲,但是通過(guò)根據(jù)SNR,對(duì)用于更新估計(jì)噪聲的噪聲話音功率譜 進(jìn)行加權(quán),可以使包含在噪聲話音功率譜中的語(yǔ)音分量的影響較小, 并能夠?qū)崿F(xiàn)更為精確的噪聲估計(jì)。同時(shí),雖然描述了利用非線性函數(shù) 來(lái)計(jì)算加權(quán)系數(shù)的示例,但是也可以使用除非線性函數(shù)以外的SNR的 其他函數(shù),該函數(shù)可以表示為另一等式,如線性函數(shù)或高階多項(xiàng)式等。
圖12是示出了圖6所示的估計(jì)噪聲計(jì)算器5的結(jié)構(gòu)的方框圖。 估計(jì)噪聲計(jì)算器5包括分離器501和502、復(fù)用器503和頻域估計(jì)噪 聲計(jì)算器504。至504h。
在圖12中,分離器501將從圖6的加權(quán)噪聲話音計(jì)算器14傳送 過(guò)來(lái)的加權(quán)噪聲話音功率譜分解為每個(gè)頻率的加權(quán)噪聲話音功率譜, 并將這些功率譜分別傳送至頻域估計(jì)噪聲計(jì)算器504(,至504h。分離 器502將從圖6的復(fù)用乘法器13傳送過(guò)來(lái)的噪聲話音功率譜分解為每個(gè)頻率的噪聲話音功率譜,并將這些功率譜分別輸出至頻域估計(jì)噪聲
計(jì)算器504。至504K—,。
頻域估計(jì)噪聲計(jì)算器504 至504H根據(jù)從分離器501傳送過(guò)來(lái)的 頻域加權(quán)噪聲話音功率譜、從分離器502傳送過(guò)來(lái)的頻域噪聲話音功 率譜和從圖6的計(jì)數(shù)器4傳送過(guò)來(lái)的計(jì)數(shù)值,計(jì)算頻域估計(jì)噪聲功率 譜,并這些功率譜輸出至復(fù)用器503。復(fù)用器503對(duì)從頻域估計(jì)噪聲 計(jì)算器504 至504H傳送過(guò)來(lái)的頻域估計(jì)噪聲功率譜進(jìn)行復(fù)用,并將 估計(jì)噪聲功率譜輸出至圖6的頻域S服計(jì)算器6以及加權(quán)噪聲話音計(jì) 算器14。將參照?qǐng)D13,對(duì)頻域估計(jì)噪聲計(jì)算器504(,至504K—,的結(jié)構(gòu)和
操作進(jìn)行詳細(xì)描述。
圖13是示出了圖12所示的頻域估計(jì)噪聲計(jì)算器504。至504^的 結(jié)構(gòu)的方框圖。頻域估計(jì)噪聲計(jì)算器504包括更新判決器520、寄存 器長(zhǎng)度存儲(chǔ)器5041、估計(jì)噪聲存儲(chǔ)器5042、開(kāi)關(guān)5044、移位寄存器 5045、加法器5046、最小值選擇器5047、除法器5048和計(jì)數(shù)器5049。
將頻域加權(quán)噪聲話音功率譜從圖12的分離器501傳送至開(kāi)關(guān) 5044。當(dāng)開(kāi)關(guān)5044閉合時(shí),將頻域加權(quán)噪聲話音功率譜傳送至移位寄 存器5045。移位寄存器5045響應(yīng)于從更新判決器520傳送過(guò)來(lái)的控 制信號(hào),年個(gè)內(nèi)部寄存器的存儲(chǔ)值移位至相鄰的寄存器。寄存器長(zhǎng)度 與稍后描述的寄存器長(zhǎng)度存儲(chǔ)器5041中所存儲(chǔ)的數(shù)值相同。將移位寄 存器5045的所有寄存器輸出傳送至加法器5046。加法器5046對(duì)傳送 過(guò)來(lái)的所有寄存器輸出進(jìn)行求和,并將求和結(jié)果傳送至除法器5048。
另一方面,向更新判決器520傳送計(jì)數(shù)值、頻域噪聲話音功率譜 和頻域估計(jì)噪聲功率譜。在計(jì)數(shù)值達(dá)到預(yù)定值之前,更新判決器520 總是輸出"1",在計(jì)數(shù)值達(dá)到預(yù)定值之后,當(dāng)更新判決器520確定輸 入噪聲話音信號(hào)是噪聲時(shí),更新判決器520輸出"1",而在其他情況 下,更新判決器520輸出"0"。將更新判決器520的輸出傳送至計(jì)數(shù) 器5049、開(kāi)關(guān)5044和移位寄存器5045。
當(dāng)從更新判決器520傳送過(guò)來(lái)的信號(hào)是"1"時(shí),開(kāi)關(guān)5044閉合, 而當(dāng)該信號(hào)為"0"時(shí),開(kāi)關(guān)5044斷開(kāi)。當(dāng)從更新判決器520傳送過(guò) 來(lái)的信號(hào)是"l"時(shí),計(jì)數(shù)器5049增加計(jì)數(shù)值,而當(dāng)該信號(hào)為"0"時(shí),計(jì)數(shù)器5049不改變計(jì)數(shù)值。當(dāng)從更新判決器520傳送過(guò)來(lái)的信號(hào)是"1 " 時(shí),移位寄存器5045輸入從開(kāi)關(guān)5044傳送過(guò)來(lái)的一個(gè)信號(hào)采樣,與 此同時(shí),將內(nèi)部寄存器的存儲(chǔ)值移位至相鄰的寄存器。向最小值選擇 器5047傳送計(jì)數(shù)器5049的輸出和寄存器長(zhǎng)度存儲(chǔ)器5041的輸出。
最小值選擇器5047選擇傳送過(guò)來(lái)的計(jì)數(shù)值或寄存器長(zhǎng)度(二者 中較小的一個(gè)),并將所選擇的數(shù)值傳送至除法器5048。除法器5048 將從加法器5046傳送過(guò)來(lái)的頻域噪聲話音功率譜的求和值除以計(jì)數(shù) 值或寄存器長(zhǎng)度(二者中較小的一個(gè)),并輸出所得的商,作為頻域估 計(jì)噪聲功率譜人W。如果5 (" (" = 0,l,...,iV-l)是存儲(chǔ)在移位寄存器 5045中的噪聲話音功率譜的采樣值,則可以通過(guò)以下等式獲得A("
(11)
在以上等式中,JV是計(jì)數(shù)值或寄存器長(zhǎng)度(二者中較小的一個(gè))。 由于計(jì)數(shù)值從"0"開(kāi)始單調(diào)遞增,所以首先使用計(jì)數(shù)值來(lái)執(zhí)行除法操 作,然后才使用寄存器長(zhǎng)度來(lái)執(zhí)行除法操作。針對(duì)以寄存器長(zhǎng)度為除 數(shù)的除法,.需要獲得存儲(chǔ)在移位寄存器中的數(shù)值的平均值。首先,由 于在移位寄存器5045中并未存儲(chǔ)足夠多的數(shù)值,所以使用實(shí)際存儲(chǔ)有 數(shù)值的寄存器的數(shù)目來(lái)執(zhí)行除法操作。當(dāng)計(jì)數(shù)值小于寄存器長(zhǎng)度時(shí), 實(shí)際存儲(chǔ)有數(shù)值的寄存器的數(shù)目等于計(jì)數(shù)值,而當(dāng)計(jì)數(shù)值變得大于寄 存器長(zhǎng)度時(shí),實(shí)際存儲(chǔ)有數(shù)值的寄存器的數(shù)目等于寄存器長(zhǎng)度。
圖14是示出了圖13所示的更新判決器520的結(jié)構(gòu)的方框圖。更 新判決器520包括邏輯或計(jì)算器5201、比較器5203和5205、閾值存 儲(chǔ)器5204和5206以及閾值計(jì)算器5207。
將從圖6的計(jì)數(shù)器4傳送過(guò)來(lái)的計(jì)數(shù)值傳送至比較器5203。同時(shí), 還將閾值(閾值存儲(chǔ)器5204的輸出)傳送至比較器5203。比較器5203 將傳送過(guò)來(lái)的計(jì)數(shù)值與閾值進(jìn)行比較,并在計(jì)數(shù)值小于閾值時(shí),向邏 輯或計(jì)算器5201傳送"1",而在計(jì)數(shù)值大于閾值時(shí),向邏輯或計(jì)算器 5201傳送"0"。另一方面,閾值計(jì)算器5207根據(jù)從圖13的估計(jì)噪聲 存儲(chǔ)器5042傳送過(guò)來(lái)的頻域估計(jì)噪聲功率譜來(lái)計(jì)算閾值,并將計(jì)算值 作為閾值輸出至閾值存儲(chǔ)器5206。最簡(jiǎn)單的閾值計(jì)算方法是將頻域估計(jì)噪聲功率譜與常數(shù)相乘。作為另一方法,也可以使用高階多項(xiàng)式和 非線性函數(shù)來(lái)計(jì)算閾值。
閾值存儲(chǔ)器5206存儲(chǔ)從閾值計(jì)算器5207輸出的閾值,并將一幀 前已存儲(chǔ)的閾值輸出至比較器5205。比較器5205將從閾值存儲(chǔ)器5206 傳送過(guò)來(lái)的閾值與從圖12的分離器502傳送過(guò)來(lái)的頻域噪聲話音功率 譜進(jìn)行比較,并在頻域噪聲話音功率譜小于閾值時(shí),向邏輯或計(jì)算器 5201傳送"1",而在頻域噪聲話音功率譜大于閾值時(shí),向邏輯或計(jì)算 器5201傳送"0"。即,根據(jù)估計(jì)噪聲功率譜的幅度來(lái)確定含噪聲的話 音信號(hào)是否是噪聲。邏輯或計(jì)算器5201計(jì)算比較器5203的輸出值和 比較器5205的輸出值的邏輯或,并將計(jì)算結(jié)果輸出至圖13的開(kāi)關(guān) 5044、移位寄存器5045和計(jì)數(shù)器5049。
如上所述,在初始狀態(tài)或靜音間隔中以及當(dāng)非靜音間隔中含噪聲 的話音功率較小時(shí),更新判決器520輸出"1"。 g卩,對(duì)估計(jì)噪聲進(jìn)行 更新。由于針對(duì)每一頻率來(lái)計(jì)算閾值,可以針對(duì)每一頻率來(lái)更新估計(jì) 噪聲。
圖15是示出了圖6所示的估計(jì)先驗(yàn)SNR計(jì)算器7的結(jié)構(gòu)的方框 圖。估計(jì)先驗(yàn)SNR計(jì)算器7包括多值域限制器701、后驗(yàn)SNR存儲(chǔ)器 702、抑制系數(shù)存儲(chǔ)器703、復(fù)用乘法器704和705、權(quán)重存儲(chǔ)器706、 復(fù)用加權(quán)加法器707以及加法器708。
將從圖6的頻域SNR計(jì)算器6傳送過(guò)來(lái)的后驗(yàn)SNR y (" ("0,1,…,《-1)傳送至后驗(yàn)SNR存儲(chǔ)器702和加法器708。后驗(yàn)SNR 存儲(chǔ)器702存儲(chǔ)第n幀的后驗(yàn)SNR ^W,并將第n-1幀的后驗(yàn)SNR L""傳送至復(fù)用乘法器705。將從圖6的抑制系數(shù)修正器15傳送過(guò) 來(lái)的修正抑制系數(shù)5W U = 0,1,...,《-1)傳送至抑制系數(shù)存儲(chǔ)器703。 抑制系數(shù)存儲(chǔ)器703存儲(chǔ)第n幀的修正抑制系數(shù)5W ,并將第n-l幀 的修正抑制系數(shù)5一,0t)傳送至復(fù)用乘法器704。
復(fù)用乘法器704對(duì)傳送過(guò)來(lái)的5("進(jìn)行平方,以獲得《(W,并 將&U"傳送至復(fù)用乘法器705。復(fù)用乘法器705將《_|("與^—1(^ ("0,1,…,尺-1)相乘以獲得^(yt)^州,并將所獲得的結(jié)果作為以 往估計(jì)SNR 922傳送至復(fù)用加權(quán)加法器707。由于復(fù)用乘法器704和705的結(jié)構(gòu)與參照?qǐng)D7所描述的復(fù)用乘法器13的結(jié)構(gòu)相同,所以將省 略對(duì)其的詳細(xì)描述。
向加法器708的另一端傳送"-1",并將求和結(jié)果r"("-l傳送至 多值域限制器701。多值域限制器701對(duì)從加法器708傳送過(guò)來(lái)的求
和結(jié)果^W-l施加值域限制運(yùn)算符斗]的運(yùn)算,并將結(jié)果戶[h("-l]作 為瞬時(shí)估計(jì)SNR 921傳送至復(fù)用加權(quán)加法器707。戶[;<|由以下等式定義。
還向復(fù)用加權(quán)加法器707傳送來(lái)自權(quán)重存儲(chǔ)器706的權(quán)重923。復(fù)用 加權(quán)加法器707通過(guò)使用傳送過(guò)來(lái)的瞬時(shí)估計(jì)SNR921、以往估計(jì)SNR 922和權(quán)重923,來(lái)獲得估計(jì)先驗(yàn)SNR 924。如果假設(shè)權(quán)重923為a, 4W為估計(jì)先驗(yàn)SNR,則可以通過(guò)以下等式來(lái)計(jì)算&(W。 [等式13]
! W = d (《,("+ (1 -")尸[h (" -1] (13)
這里,假設(shè)5—2,(的^—,W = l。
圖16是示出了圖15所示的多值域限制器701的結(jié)構(gòu)的方框圖。 多值域限制器701包括常數(shù)存儲(chǔ)器7011、最大值選擇器7012()至 7012K-,、分離器7013和復(fù)用器7014。向分離器7013傳送來(lái)自圖15 的加法器708的^("-l。分離器7013將傳送過(guò)來(lái)的r"W-l分解為K 個(gè)頻域分量,并將這些頻域分量傳送至最大值選擇器7012 至7012k, 向最大值選擇器7012 至7012k—的另一輸入傳送來(lái)自常數(shù)存儲(chǔ)器7011 的"0"。最大值選擇器7012。至7012KH將^(yfc)-l與"0"進(jìn)行比較,以 將較大的數(shù)值傳送至復(fù)用器7014。此最大選擇計(jì)算對(duì)應(yīng)于以上等式 12。復(fù)用器7014對(duì)這些數(shù)值進(jìn)行復(fù)用和輸出。
圖17是示出了圖15所示的復(fù)用加權(quán)加法器707的結(jié)構(gòu)的方框圖。 復(fù)用加權(quán)加法器707包括加權(quán)加法器7071 至7071K-,、分離器7072和 7074以及復(fù)用器7075。向分離器7072傳送來(lái)自圖15的多值域限制器 701的、作為瞬時(shí)估計(jì)SNR921的P[^W-1]。分離器7072將P[^("-1]分解為K個(gè)頻域分量,并將這些頻域分量作為頻域瞬時(shí)估計(jì)SNR 921 至921w傳送至加權(quán)加法器7071()至7071K—,。向分離器7074傳送來(lái)自 圖15的復(fù)用乘法器705的、作為以往估計(jì)SNR 922的《—
分離器7074將《一^) v,(W分解為K個(gè)頻域分量,并將這些頻域 分量作為以往頻域估計(jì)SNR 922(,至922K-,傳送至加權(quán)加法器7071(>至 7071K-,。另一方面,還向加權(quán)加法器7071(,至7071K—,傳送權(quán)重923。加 權(quán)加法器7071。至7071w執(zhí)行由上述等式13表示的加權(quán)加法,并將頻 域估計(jì)先驗(yàn)SNR 924。至924H傳送至復(fù)用器7075。復(fù)用器7075對(duì)頻 域估計(jì)先驗(yàn)SNR 924。至924^進(jìn)行復(fù)用,并輸出復(fù)用SNR,作為估計(jì) 先驗(yàn)SNR 924。接下來(lái),將參照?qǐng)D18,對(duì)加權(quán)加法器7071。至7071k— 的操作和結(jié)構(gòu)進(jìn)行描述。
圖18是示出了圖17所示的加權(quán)加法器7071的結(jié)構(gòu)的方框圖。 加權(quán)加法器7071包括乘法器7091和7093以及加法器7092和7094。 作為每一輸入,向加權(quán)加法器7071傳送來(lái)自圖16的分離器7072的頻 域瞬時(shí)估計(jì)SNR921、來(lái)自圖17的分離器7074的以往頻域SNR 922、 和來(lái)自圖15的權(quán)重存儲(chǔ)器706的權(quán)重923。將包括數(shù)值《的權(quán)重923 傳送至常數(shù)乘法器7095和乘法器7093。常數(shù)乘法器7095將通過(guò)將輸 入信號(hào)與相乘所獲得的-a傳送至加法器7094。
向加法器7094的另一輸入傳送"1",因此加法器7094的輸出為 1- (二者之和)。將1- 傳送至乘法器7091,并與另一輸入(頻域瞬 時(shí)估計(jì)SNR p[,n("_i])相乘,并將乘積(1- )尸[, ("-1]傳送至加法器 7092。另一方面,乘法器7093將作為權(quán)重923傳送過(guò)來(lái)的"與以往估 計(jì)SNR 922相乘,并將乘積^二(^v,W傳送至加法器7092。加法器 7092輸出(l-a)尸[^W-l]與c^2—iW的和,作為頻域估計(jì)先驗(yàn)SNR 904。
圖19是示出了圖6所示的噪聲抑制系數(shù)發(fā)生器8的結(jié)構(gòu)的方框 圖。噪聲抑制系數(shù)發(fā)生器8包括畫SE STSA增益函數(shù)值計(jì)算器811、 廣義似然比計(jì)算器812和抑制系數(shù)計(jì)算器814。下面,將根據(jù)在非專 利文獻(xiàn)2 (IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL. 32, NO. 6,第1109 1121頁(yè),1984年12月)中所描述的計(jì)算等式,來(lái)描述抑制系數(shù)的計(jì)算方法。
假設(shè)幀數(shù)為",頻率數(shù)為"K,("是從圖6的頻域SNR計(jì)算器6 傳送過(guò)來(lái)的頻域后驗(yàn)SNR, ^(/t)是從圖6的估計(jì)先驗(yàn)SNR計(jì)算器7傳 送過(guò)來(lái)的頻域估計(jì)先驗(yàn)SNR,以及《是從圖6的語(yǔ)音缺失概率存儲(chǔ)器 21傳送過(guò)來(lái)的語(yǔ)音缺失概率。此外,假設(shè)
<formula>formula see original document page 23</formula>
麗SE STSA增益函數(shù)值計(jì)算器811根據(jù)從圖6的頻域S服計(jì)算器6傳 送過(guò)來(lái)的后驗(yàn)SNR hOt)、從圖6的估計(jì)先驗(yàn)SNR計(jì)算器7傳送過(guò)來(lái)的 估計(jì)先驗(yàn)SNR ^(yt)、以及從圖6的語(yǔ)音缺失概率存儲(chǔ)器21傳送過(guò)來(lái) 的語(yǔ)音缺失概率g,計(jì)算每一頻率的麗SE STSA增益函數(shù)值,并將麗SE STSA增益函數(shù)值輸出至抑制系數(shù)計(jì)算器814。
每一頻率的醒SE STSA增益函數(shù)值G。W由以下等式表示。
<formula>formula see original document page 23</formula>(14)
這里,/。W是0階修正貝塞爾函數(shù),以及/,(z)是1階修正貝塞爾函數(shù)。 在非專利文獻(xiàn)3 (MATHEMATICS DICTIONARY, IWANAMI BOOK SHOP,第 374. G頁(yè),1985年)中描述了修正貝塞爾函數(shù)。
廣義似然比計(jì)算器812根據(jù)從圖6的頻域SNR計(jì)算器6傳送過(guò)來(lái) 的后驗(yàn)SNR r ("、從圖6的估計(jì)先驗(yàn)SNR計(jì)算器7傳送過(guò)來(lái)的估計(jì)先 驗(yàn)SNR 以及從圖6的語(yǔ)音缺失概率存儲(chǔ)器21傳送過(guò)來(lái)的語(yǔ)音
缺失概率《,來(lái)計(jì)算每一頻率的廣義似然比,并將廣義似然比輸出至 抑制系數(shù)計(jì)算器814。
每一頻率的廣義似然比八"W由以下等式表示。 [等式15]
<formula>formula see original document page 23</formula>(15)抑制系數(shù)計(jì)算器814根據(jù)從畫SE STSA增益函數(shù)值計(jì)算器811傳 送過(guò)來(lái)的醒SE STSA增益函數(shù)值G"W和從廣義似然比計(jì)算器812傳送 過(guò)來(lái)的廣義似然比A"0t),計(jì)算每一頻率的抑制系數(shù),并將抑制系數(shù)輸 出至圖6的抑制系數(shù)修正器15。每一頻率的抑制系數(shù)5("由以下等式表示。
<formula>formula see original document page 24</formula>(16)
代替計(jì)算每一頻率的SNR,也可以計(jì)算和使用在包括多個(gè)頻率在內(nèi)的 頻帶內(nèi)公用的SNR。
圖20是示出了圖6所示的抑制系數(shù)修正器15的結(jié)構(gòu)的方框圖。 抑制系數(shù)修正器15包括頻域抑制系數(shù)修正器1501。至1501K-,、分離器 1502和1503以及復(fù)用器1504。
分離器1502將從圖6的估計(jì)先驗(yàn)SNR計(jì)算器7傳送過(guò)來(lái)的估計(jì) 先驗(yàn)SNR分解為頻域分量,并將這些頻域分量分別輸出至頻域抑制系 數(shù)修正器1501 至1501K—,。分離器1503將從圖6的噪聲抑制系數(shù)發(fā)生 器8傳送過(guò)來(lái)的抑制系數(shù)分解為頻域分量,并將這些頻域分量分別輸 出至頻域抑制系數(shù)修正器1501。至認(rèn)ho
頻域抑制系數(shù)修正器1501 至1501h根據(jù)從分寓器1502傳送過(guò)來(lái) 的頻域估計(jì)先驗(yàn)SNR和從分離器1503傳送過(guò)來(lái)的頻域抑制系數(shù),來(lái)計(jì) 算頻域修正抑制系數(shù),并將頻域修正抑制系數(shù)輸出至復(fù)用器1504。復(fù) 用器1504對(duì)從頻域抑制系數(shù)修正器1501(,至1501K—,傳送過(guò)來(lái)的頻域修 正抑制系數(shù)進(jìn)行復(fù)用,并將復(fù)用頻域修正抑制系數(shù)作為修正抑制系數(shù) 輸出至圖6的復(fù)用乘法器16和估計(jì)先驗(yàn)SNR計(jì)算器7。
接下來(lái),將參照?qǐng)D21,對(duì)頻域抑制系數(shù)修正器1501()至1501k-,的 結(jié)構(gòu)和操作進(jìn)行詳細(xì)描述。
圖21是示出了包括在抑制系數(shù)修正器15中的頻域抑制系數(shù)修正 器1501 至150lK-,的結(jié)構(gòu)的方框圖。頻域抑制系數(shù)修正器1501包括最 大值選擇器1591、抑制系數(shù)下限值存儲(chǔ)器1592、閾值存儲(chǔ)器1593、 比較器1594、開(kāi)關(guān)1595、修正值存儲(chǔ)器1596和乘法器1597。比較器1594將從閾值存儲(chǔ)器1593傳送過(guò)來(lái)的閾值與從圖20的 分離器1502傳送過(guò)來(lái)的頻域估計(jì)先驗(yàn)SNR進(jìn)行比較,當(dāng)頻域估計(jì)先驗(yàn) SNR大于閾值時(shí),比較器1594向開(kāi)關(guān)1595傳送"0",而當(dāng)頻域估計(jì) 先驗(yàn)SNR小于閾值時(shí),比較器1594向開(kāi)關(guān)1595傳送"1"。當(dāng)比較器 1594的輸出值為"1"時(shí),開(kāi)關(guān)1595將從圖20的分離器1503傳送過(guò) 來(lái)的頻域抑制系數(shù)輸出至乘法器1597,以及當(dāng)輸出值為"0"時(shí),將 頻域抑制系數(shù)輸出至最大值選擇器1591。 g口,當(dāng)頻域估計(jì)先驗(yàn)SNR小 于閾值時(shí),對(duì)抑制系數(shù)進(jìn)行修正。乘法器1597計(jì)算開(kāi)關(guān)1595的輸出 值與修正值存儲(chǔ)器1596的輸出值的乘積,并將所述乘積輸出至最大值 選擇器1591。
另一方面,抑制系數(shù)下限值存儲(chǔ)器1592向最大值選擇器1591傳 送所存儲(chǔ)的抑制系數(shù)的下限值。最大值選擇器1591將從圖20的分離 器1503傳送過(guò)來(lái)的頻域抑制系數(shù)或由乘法器1597計(jì)算出的乘積與從 抑制系數(shù)下限值存儲(chǔ)器1592傳送過(guò)來(lái)的抑制系數(shù)下限值進(jìn)行比較,并 將較大的數(shù)值輸出至圖20的復(fù)用器1504。 gfl,抑制系數(shù)必將變?yōu)楸?抑制系數(shù)下限值存儲(chǔ)器1592所存儲(chǔ)的下限值大的數(shù)值。
在所有上述典型實(shí)施例中,雖然假設(shè)采用最小均方短時(shí)譜幅度方 法作為噪聲抑制方法,但是這些實(shí)施例也可以應(yīng)用于其他噪聲抑制方 法。這些噪聲抑制方法的示例包括在非專利文獻(xiàn)4 (PROCEEDINGS OF THE IEEE, VOL. 67, NO. 12,第1586 1604頁(yè),1979年12月)中所 公開(kāi)的維納濾波器方法;以及在非專利文獻(xiàn)5 (IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL. 27, NO. 2,第 113 120頁(yè),1979年4月)中所公開(kāi)的譜扣除方法,這里省略了對(duì)上 述方法結(jié)構(gòu)示例的詳細(xì)描述。
上述每一典型實(shí)施例的噪聲抑制設(shè)備均可以計(jì)算機(jī)設(shè)備來(lái)進(jìn)行 配置,所述計(jì)算機(jī)設(shè)備包括用于蓄積程序等的存儲(chǔ)設(shè)備、設(shè)置有按 鍵和開(kāi)關(guān)的操作單元、諸如LCD等的顯示設(shè)備、以及通過(guò)接收來(lái)自操 作單元的輸入來(lái)控制每一部件的操作的控制設(shè)備。當(dāng)控制設(shè)備執(zhí)行存 儲(chǔ)在存儲(chǔ)設(shè)備中的程序時(shí),將實(shí)現(xiàn)上述每一典型實(shí)施例的噪聲抑制設(shè)備的操作。程序可以預(yù)先存儲(chǔ)在存儲(chǔ)設(shè)備中,或者可以將其寫入諸如
CD-ROM等記錄介質(zhì)來(lái)提供給用戶。也可以通過(guò)網(wǎng)絡(luò)來(lái)提供所述程序。
權(quán)利要求
1.一種噪聲抑制方法,用于抑制包括在輸入信號(hào)中的噪聲,其特征在于包括將所述輸入信號(hào)轉(zhuǎn)換為頻域信號(hào);修正所述頻域信號(hào)的幅度,以獲得幅度修正信號(hào);使用所述幅度修正信號(hào),來(lái)獲得估計(jì)噪聲;使用所述估計(jì)噪聲和所述幅度修正信號(hào),來(lái)確定抑制系數(shù);以及以所述抑制系數(shù)對(duì)所述幅度修正信號(hào)進(jìn)行加權(quán)。
2. 根據(jù)權(quán)利要求l所述的噪聲抑制方法,其特征在于包括 修正所述頻域信號(hào)的相位,以獲得相位修正信號(hào);以及 將通過(guò)以所述抑制系數(shù)對(duì)所述幅度修正信號(hào)進(jìn)行加權(quán)所獲得的結(jié)果和所述相位修正信號(hào)轉(zhuǎn)換為時(shí)域信號(hào)。
3. 根據(jù)權(quán)利要求1或2所述的噪聲抑制方法,其特征在于包括 消除所述輸入信號(hào)的偏移,以獲得偏移消除信號(hào);以及 將所述偏移消除信號(hào)轉(zhuǎn)換為所述頻域信號(hào)。
4. 一種噪聲抑制設(shè)備,用于抑制包括在輸入信號(hào)中的噪聲,其 特征在于包括轉(zhuǎn)換器,用于將所述輸入信號(hào)轉(zhuǎn)換為頻域信號(hào);幅度修正器,用于修正所述頻域信號(hào)的幅度,以獲得幅度修正信號(hào);噪聲估計(jì)器,用于使用所述幅度修正信號(hào),來(lái)獲得估計(jì)噪聲; 抑制系數(shù)發(fā)生器,用于使用所述估計(jì)噪聲和所述幅度修正信號(hào), 來(lái)確定抑制系數(shù);以及乘法器,用于以所述抑制系數(shù)對(duì)所述幅度修正信號(hào)進(jìn)行加權(quán)。
5. 根據(jù)權(quán)利要求4所述的噪聲抑制設(shè)備,其特征在于包括-相位修正器,用于修正所述頻域信號(hào)的相位,以獲得相位修正信號(hào);以及逆轉(zhuǎn)換器,用于將通過(guò)以所述抑制系數(shù)對(duì)所述幅度修正信號(hào)進(jìn)行加權(quán)所獲得的結(jié)果和所述相位修正信號(hào)轉(zhuǎn)換為時(shí)域信號(hào)。
6. 根據(jù)權(quán)利要求4或5所述的噪聲抑制設(shè)備,其特征在于包括 偏移消除器,用于消除所述輸入信號(hào)的偏移,以獲得偏移消除信號(hào);以及轉(zhuǎn)換器,用于將所述偏移消除信號(hào)轉(zhuǎn)換為所述頻域信號(hào)。
7. —種計(jì)算機(jī)程序,用于對(duì)信號(hào)進(jìn)行處理,以抑制包括在輸入信號(hào)中的噪聲,所述計(jì)算機(jī)程序使計(jì)算機(jī)執(zhí)行以下處理.-將所述輸入信號(hào)轉(zhuǎn)換為頻域信號(hào); 修正所述頻域信號(hào)的幅度,以獲得幅度修正信號(hào); 使用所述幅度修正信號(hào),來(lái)獲得估計(jì)噪聲;使用所述估計(jì)噪聲和所述幅度修正信號(hào),來(lái)確定抑制系數(shù);以及 以所述抑制系數(shù)對(duì)所述幅度修正信號(hào)進(jìn)行加權(quán)。
8. 根據(jù)權(quán)利要求7所述的計(jì)算機(jī)程序,使計(jì)算機(jī)還執(zhí)行以下處理修正所述頻域信號(hào)的相位,以獲得相位修正信號(hào);以及 將通過(guò)以所述抑制系數(shù)對(duì)所述幅度修正信號(hào)進(jìn)行加權(quán)所獲得的 結(jié)果和所述相位修正信號(hào)轉(zhuǎn)換為時(shí)域信號(hào)。
9. 根據(jù)權(quán)利要求7或8所述的計(jì)算機(jī)程序,使計(jì)算機(jī)還執(zhí)行以 下處理消除所述輸入信號(hào)的偏移,以獲得偏移消除信號(hào);以及 將所述偏移消除信號(hào)轉(zhuǎn)換為所述頻域信號(hào)。
全文摘要
本發(fā)明提出了一種方法、一種設(shè)備和一種計(jì)算機(jī)程序,能夠以較小的計(jì)算量來(lái)抑制低頻范圍內(nèi)的分量,并能夠?qū)崿F(xiàn)高質(zhì)量的噪聲抑制。通過(guò)以下操作來(lái)抑制輸入信號(hào)中疊加在所需信號(hào)上的噪聲將所述輸入信號(hào)轉(zhuǎn)換為頻域信號(hào);修正所述頻域信號(hào)的幅度,以獲得幅度修正信號(hào);使用所述幅度修正信號(hào),來(lái)獲得估計(jì)噪聲;使用所述估計(jì)噪聲和所述幅度修正信號(hào),來(lái)確定抑制系數(shù);以及以所述抑制系數(shù)對(duì)所述幅度修正信號(hào)進(jìn)行加權(quán)。
文檔編號(hào)G10L21/0208GK101300623SQ200680040704
公開(kāi)日2008年11月5日 申請(qǐng)日期2006年8月28日 優(yōu)先權(quán)日2005年9月2日
發(fā)明者加藤正德, 杉山昭彥 申請(qǐng)人:日本電氣株式會(huì)社