專利名稱:用于頻譜對(duì)比加強(qiáng)的系統(tǒng)、方法、設(shè)備及計(jì)算機(jī)程序產(chǎn)品的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音處理。
背景技術(shù):
以前在安靜的辦公室或家庭環(huán)境中進(jìn)行的許多活動(dòng)現(xiàn)今在像汽車、街道或咖啡館的聲音可變情景中進(jìn)行。舉例來說,一人可能希望使用話音通信信道來與另一人進(jìn)行通信。所述信道可(例如)由移動(dòng)無線手持機(jī)或頭戴式耳機(jī)、對(duì)講機(jī)、雙向無線電、車載設(shè)備或另一通信裝置提供。因此,在用戶由其它人包圍的環(huán)境中,在具有人們傾向于聚集之處通常碰到的種類的噪聲內(nèi)容的情況下,相當(dāng)大數(shù)量的話音通信是使用移動(dòng)裝置(例如,手持機(jī)及/或頭戴式耳機(jī))來進(jìn)行的。此噪聲傾向于使電話會(huì)話的遠(yuǎn)端處的用戶分心或感到惱火。此夕卜,許多標(biāo)準(zhǔn)自動(dòng)化商業(yè)交易(例如,賬戶余額或股票報(bào)價(jià)檢查)使用基于話音辨識(shí)的數(shù)據(jù)查詢,且這些系統(tǒng)的準(zhǔn)確性可能會(huì)受到干擾噪聲的顯著妨礙。對(duì)于通信發(fā)生于有噪聲環(huán)境中的應(yīng)用來說,可能希望將所要語音信號(hào)與背景噪聲分離??蓪⒃肼暯缍楦蓴_所要信號(hào)或以其它方式使所要信號(hào)降級(jí)的所有信號(hào)的組合。背景噪聲可包括在聲環(huán)境內(nèi)產(chǎn)生的眾多噪聲信號(hào)(例如,其它人的背景會(huì)話)以及從所述信號(hào)中的每一者產(chǎn)生的反射及回響。除非將所要語音信號(hào)與背景噪聲分離,否則可能難以可靠且有效地使用所述語音信號(hào)。有噪聲聲環(huán)境還可能傾 向于屏蔽或以其它方式使得難以聽到所要的再生音頻信號(hào),例如電話會(huì)話中的遠(yuǎn)端信號(hào)。聲環(huán)境可具有與由通信裝置正在再生的遠(yuǎn)端信號(hào)競(jìng)爭(zhēng)的許多非可控噪聲源。此噪聲可引起令人不滿意的通信體驗(yàn)。除非可將遠(yuǎn)端信號(hào)與背景噪聲區(qū)別開,否則可能難以可靠且有效地使用所述遠(yuǎn)端信號(hào)。
發(fā)明內(nèi)容
根據(jù)通用配置,一種處理語音信號(hào)的方法包括使用經(jīng)配置以處理音頻信號(hào)的裝置來對(duì)多通道感測(cè)音頻信號(hào)執(zhí)行空間選擇性處理操作以產(chǎn)生源信號(hào)及噪聲參考,且對(duì)所述語音信號(hào)執(zhí)行頻譜對(duì)比加強(qiáng)操作以產(chǎn)生經(jīng)處理語音信號(hào)。在此種方法中,執(zhí)行頻譜對(duì)比加強(qiáng)操作包括:基于來自噪聲參考的信息來計(jì)算多個(gè)噪聲子帶功率估計(jì);基于來自所述語音信號(hào)的信息來產(chǎn)生加強(qiáng)向量;及基于所述多個(gè)噪聲子帶功率估計(jì)、來自所述語音信號(hào)的信息及來自所述加強(qiáng)向量的信息來產(chǎn)生所述經(jīng)處理語音信號(hào)。在此種方法中,所述經(jīng)處理語音信號(hào)的多個(gè)頻率子帶中的每一者是基于所述語音信號(hào)的對(duì)應(yīng)頻率子帶。根據(jù)通用配置,一種用于處理語音信號(hào)的設(shè)備包括:用于對(duì)多通道感測(cè)音頻信號(hào)執(zhí)行空間選擇性處理操作以產(chǎn)生源信號(hào)及噪聲參考的裝置,及用于對(duì)所述語音信號(hào)執(zhí)行頻譜對(duì)比加強(qiáng)操作以產(chǎn)生經(jīng)處理語音信號(hào)的裝置。用于對(duì)所述語音信號(hào)執(zhí)行頻譜對(duì)比加強(qiáng)操作的所述裝置包括:用于基于來自噪聲參考的信息來計(jì)算多個(gè)噪聲子帶功率估計(jì)的裝置;用于基于來自所述語音信號(hào)的信息來產(chǎn)生加強(qiáng)向量的裝置;及用于基于所述多個(gè)噪聲子帶功率估計(jì)、來自所述語音信號(hào)的信息及來自所述加強(qiáng)向量的信息來產(chǎn)生所述經(jīng)處理語音信號(hào)的裝置。在此種設(shè)備中,所述經(jīng)處理語音信號(hào)的多個(gè)頻率子帶中的每一者是基于所述語音信號(hào)的對(duì)應(yīng)頻率子帶。根據(jù)另一通用配置,一種用于處理語音信號(hào)的設(shè)備包括:空間選擇性處理濾波器,其經(jīng)配置以對(duì)多通道感測(cè)音頻信號(hào)執(zhí)行空間選擇性處理操作以產(chǎn)生源信號(hào)及噪聲參考;及頻譜對(duì)比加強(qiáng)器,其經(jīng)配置以 對(duì)所述語音信號(hào)執(zhí)行頻譜對(duì)比加強(qiáng)操作以產(chǎn)生經(jīng)處理語音信號(hào)。在此種設(shè)備中,所述頻譜對(duì)比加強(qiáng)器包括:功率估計(jì)計(jì)算器,其經(jīng)配置以基于來自噪聲參考的信息來計(jì)算多個(gè)噪聲子帶功率估計(jì);及加強(qiáng)向量產(chǎn)生器,其經(jīng)配置以基于來自所述語音信號(hào)的信息來產(chǎn)生加強(qiáng)向量。在此種設(shè)備中,所述頻譜對(duì)比加強(qiáng)器經(jīng)配置以基于所述多個(gè)噪聲子帶功率估計(jì)、來自所述語音信號(hào)的信息及來自所述加強(qiáng)向量的信息來產(chǎn)生所述經(jīng)處理語音信號(hào)。在此種設(shè)備中,所述經(jīng)處理語音信號(hào)的多個(gè)頻率子帶中的每一者是基于所述語音信號(hào)的對(duì)應(yīng)頻率子帶。根據(jù)通用配置,一種計(jì)算機(jī)可讀媒體包括在由至少一個(gè)處理器執(zhí)行時(shí)使所述至少一個(gè)處理器執(zhí)行處理多通道音頻信號(hào)的方法的指令。這些指令包括:在由處理器執(zhí)行時(shí)使所述處理器對(duì)多通道感測(cè)音頻信號(hào)執(zhí)行空間選擇性處理操作以產(chǎn)生源信號(hào)及噪聲參考的指令;及在由處理器執(zhí)行時(shí)使所述處理器對(duì)所述語音信號(hào)執(zhí)行頻譜對(duì)比加強(qiáng)操作以產(chǎn)生經(jīng)處理語音信號(hào)的指令。用以執(zhí)行頻譜對(duì)比加強(qiáng)操作的指令包括:用以基于來自噪聲參考的信息來計(jì)算多個(gè)噪聲子帶功率估計(jì)的指令;用以基于來自所述語音信號(hào)的信息來產(chǎn)生加強(qiáng)向量的指令;及用以基于所述多個(gè)噪聲子帶功率估計(jì)、來自所述語音信號(hào)的信息及來自所述加強(qiáng)向量的信息來產(chǎn)生所述經(jīng)處理語音信號(hào)的指令。在此種方法中,所述經(jīng)處理語音信號(hào)的多個(gè)頻率子帶中的每一者是基于所述語音信號(hào)的對(duì)應(yīng)頻率子帶。根據(jù)通用配置,一種處理語音信號(hào)的方法包括:使用經(jīng)配置以處理音頻信號(hào)的裝置來使所述語音信號(hào)的頻譜平滑以獲得第一平滑信號(hào);使所述第一平滑信號(hào)平滑以獲得第二平滑信號(hào);且產(chǎn)生基于所述第一平滑信號(hào)及所述第二平滑信號(hào)的比率的對(duì)比加強(qiáng)語音信號(hào)。還揭示經(jīng)配置以執(zhí)行此方法的設(shè)備,以及具有在由至少一個(gè)處理器執(zhí)行時(shí)使所述至少一個(gè)處理器執(zhí)行此方法的指令的計(jì)算機(jī)可讀媒體。
圖1展示清晰度指數(shù)曲線圖。圖2展示在典型窄帶電話應(yīng)用中的再生語音信號(hào)的功率譜。圖3展示典型語音功率譜及典型噪聲功率譜的實(shí)例。圖4A說明自動(dòng)音量控制對(duì)圖3的實(shí)例的應(yīng)用。圖4B說明子帶均衡對(duì)圖3的實(shí)例的應(yīng)用。圖5展示根據(jù)通用配置的設(shè)備AlOO的框圖。圖6A展示設(shè)備AlOO的實(shí)施方案AllO的框圖。圖6B展示設(shè)備·AlOO (及設(shè)備A110)的實(shí)施方案A120的框圖。圖7展示空間選擇性處理(SSP)濾波器SSlO的一個(gè)實(shí)例的波束圖(beampattern)。圖8A展示SSP濾波器SSlO的實(shí)施方案SS20的框圖。圖8B展示設(shè)備AlOO的實(shí)施方案A130的框圖。圖9A展示設(shè)備A130的實(shí)施方案A132的框圖。圖9B展示設(shè)備A132的實(shí)施方案A134的框圖。圖1OA展示設(shè)備A130 (及設(shè)備Al 10)的實(shí)施方案A140的框圖。圖1OB展示設(shè)備A140 (及設(shè)備A120)的實(shí)施方案A150的框圖。圖1lA展示SSP濾波器SSlO的實(shí)施方案SSllO的框圖。圖1lB展示SSP濾波器SS20及SSllO的實(shí)施方案SS120的框圖。圖12展示加強(qiáng)器ENlO的實(shí)施方案EN100的框圖。圖13展示語音信號(hào)的巾貞的幅度譜(magnitude spectrum)。圖14展示對(duì)應(yīng)于圖13的譜的加強(qiáng)向量EVlO的幀。圖15到圖18分別展示語音信號(hào)的幅度譜、所述幅度譜的平滑型式、所述幅度譜的雙平滑型式及所述平滑頻譜與所述雙平滑頻譜的比率的實(shí)例。圖19A展示加強(qiáng)向量產(chǎn)生器VG100的實(shí)施方案VGllO的框圖。圖19B展示加強(qiáng)向量產(chǎn)生器VGllO的實(shí)施方案VG120的框圖。圖20展示從圖13的幅度譜產(chǎn)生的平滑信號(hào)的實(shí)例。圖21展示從圖20的平滑信號(hào)產(chǎn)生的平滑信號(hào)的實(shí)例。圖22展示語音信號(hào)S40的幀的加強(qiáng)向量的實(shí)例。圖23A展示用于動(dòng)態(tài)范圍控制操作的轉(zhuǎn)移函數(shù)的實(shí)例。圖23B展示動(dòng)態(tài)范圍壓縮操作對(duì)三角波形的應(yīng)用。圖24A展示用于動(dòng)態(tài)范圍壓縮操作的轉(zhuǎn)移函數(shù)的實(shí)例。圖24B展示動(dòng)態(tài)范圍壓縮操作對(duì)三角波形的應(yīng)用。圖25展示自適應(yīng)均衡操作的實(shí)例。圖26A展示子帶信號(hào)產(chǎn)生器SG200的框圖。
圖26B展示子帶信號(hào)產(chǎn)生器SG300的框圖。圖26C展示子帶信號(hào)產(chǎn)生器SG400的框圖。圖26D展示子帶功率估計(jì)計(jì)算器ECllO的框圖。圖26E展示子帶功率估計(jì)計(jì)算器EC120的框圖。圖27包括指示一組七個(gè)巴克標(biāo)度(Bark scale)子帶的邊緣的一行點(diǎn)。圖28展示子帶濾波器陣列SGlO的實(shí)施方案SG12的框圖。圖29A說明通用無限脈沖響應(yīng)(IIR)濾波器實(shí)施方案的轉(zhuǎn)置直接形式II。圖29B說明IIR濾波器的雙二階實(shí)施方案的轉(zhuǎn)置直接形式II結(jié)構(gòu)。圖30展示IIR濾波器的雙二階實(shí)施方案的一個(gè)實(shí)例的幅度及相位響應(yīng)曲線圖。圖31展示一連串七個(gè)雙二階濾波器的幅度及相位響應(yīng)。圖32展示加強(qiáng)器ENlO的實(shí)施方案ENllO的框圖。圖33A展示混合因子計(jì)算器FC200的實(shí)施方案FC250的框圖。圖33B展示混合因子計(jì)算器FC250的實(shí)施方案FC260的框圖。圖33C展示增益因子計(jì)算器FC300的實(shí)施方案FC310的框圖。圖33D展示增益因子計(jì)算器FC300的實(shí)施方案FC320的框圖。圖34A展示偽碼列表。圖34B展示圖34A的偽碼列表的修改。圖35A及圖35B分別展示圖34A及圖34B的偽碼列表的修改。圖36A展示增益控制元件CEllO的實(shí)施方案CEl 15的框圖。圖36B展示子帶濾波器陣列FA100的包括并聯(lián)布置的一組帶通濾波器的實(shí)施方案FAllO的框圖。圖37A展示子帶濾波器陣列FA100的帶通濾波器串聯(lián)布置的實(shí)施方案FA120的框圖。圖37B展示IIR濾波器的雙二階實(shí)施方案的另一實(shí)例。圖38展示加強(qiáng)器ENlO的實(shí)施方案EN120的框圖。圖39展示增益控制元件CE120的實(shí)施方案CE130的框圖。圖40A展示設(shè)備AlOO的實(shí)施方案A160的框圖。圖40B展示設(shè)備A140 (及設(shè)備A165)的實(shí)施方案A165的框圖。圖41展示圖35A的偽碼列表的修改。圖42展示圖35A的偽碼列表的另一修改。圖43A展示設(shè)備AlOO的實(shí)施方案A170的框圖。圖43B展示設(shè)備A170的實(shí)施方案A180的框圖。圖44展示加強(qiáng)器ENllO的包括峰值限制器LlO的實(shí)施方案EN160的框圖。圖45A展示描述峰值限制操作的一個(gè)實(shí)例的偽碼列表。圖45B展示圖45A的偽碼列表的另一型式。圖46展示設(shè)備AlOO的包括分離評(píng)估器EVlO的實(shí)施方案A200的框圖。圖47展示設(shè)備A200的實(shí)施方案A210的框圖。圖48展示加強(qiáng)器EN200 (及加強(qiáng)器ENl 10)的實(shí)施方案EN300的框圖。圖49展示加 強(qiáng)器EN300的實(shí)施方案EN310的框圖。
圖50展示加強(qiáng)器EN300 (及加強(qiáng)器EN310)的實(shí)施方案EN320的框圖。圖51A展示子帶信號(hào)產(chǎn)生器EC210的框圖。圖51B展示子帶信號(hào)產(chǎn)生器EC210的實(shí)施方案EC220的框圖。圖52展示加強(qiáng)器EN320的實(shí)施方案EN330的框圖。圖53展示加強(qiáng)器ENllO的實(shí)施方案EN400的框圖。圖54展示加強(qiáng)器ENllO的實(shí)施方案EN450的框圖。圖55展示設(shè)備AlOO的實(shí)施方案A250的框圖。圖56展示加強(qiáng)器EN450 (及加強(qiáng)器EN400)的實(shí)施方案EN460的框圖。圖57展示設(shè)備A210的包括話音活動(dòng)檢測(cè)器V20的實(shí)施方案A230。圖58A展示加強(qiáng)器EN400的實(shí)施方案EN55的框圖。圖58B展示功率估計(jì)計(jì)算器EC120的實(shí)施方案EC125的框圖。圖59展示設(shè)備AlOO的實(shí)施方案A300的框圖。圖60展示設(shè)備A300的實(shí)施方案A310的框圖。圖61展示設(shè)備A310的實(shí)施方案A320的框圖。圖62展示設(shè)備AlOO的實(shí)施方案A400的框圖。圖63展示設(shè)備AlOO的實(shí)施方案A500的框圖。圖64A展示音頻預(yù)處理器APlO的實(shí)施方案AP20的框圖。圖64B展示音頻預(yù)處理器AP20的實(shí)施方案AP30的框圖。圖65展示設(shè)備A310的實(shí)施方案A330的框圖。圖66A展示回音消除器EClO的實(shí)施方案EC12的框圖。圖66B展示回音消除器EC20a的實(shí)施方案EC22a的框圖。圖66C展示設(shè)備AllO的實(shí)施方案A600的框圖。圖67A展示第一操作配置中的雙麥克風(fēng)手持機(jī)HlOO的圖。圖67B展示手持機(jī)HlOO的第二操作配置。圖68A展示手持機(jī)HlOO的包括三個(gè)麥克風(fēng)的實(shí)施方案HllO的圖。圖68B展示手持機(jī)HllO的兩個(gè)其它視圖。圖69A到圖69D分別展示多麥克風(fēng)音頻感測(cè)裝置D300的仰視圖、俯視圖、正視圖及側(cè)視圖。圖70A展示頭戴式耳機(jī)的不同操作配置的范圍的圖。圖70B展示免持車載設(shè)備的圖。圖7IA到圖71D分別展示多麥克風(fēng)音頻感測(cè)裝置D350的仰視圖、俯視圖、正視圖及側(cè)視圖。圖72A到圖72C展示媒體播放裝置的實(shí)例。圖73A展示通信裝置DlOO的框圖。圖73B展示通信裝置DlOO的實(shí)施方案D200的框圖。圖74A展示聲碼器VClO的框圖。圖74B展示編碼器ENC100的實(shí)施方案ENCllO的框圖。圖75A展示設(shè)計(jì)方法MlO的流程圖。圖75B展示 經(jīng)配置以用于記錄訓(xùn)練數(shù)據(jù)的消聲腔室的實(shí)例。
圖76A展示自適應(yīng)濾波器結(jié)構(gòu)FSlO的雙通道實(shí)例的框圖。圖76B展示濾波器結(jié)構(gòu)FSlO的實(shí)施方案FS20的框圖。圖77說明無線電話系統(tǒng)。圖78說明經(jīng)配置以支持包交換數(shù)據(jù)通信的無線電話系統(tǒng)。圖79A展示根據(jù)通用配置的方法MlOO的流程圖。圖79B展示方法MlOO的實(shí)施方案MllO的流程圖。圖80A展示方法MlOO的實(shí)施方案M120的流程圖。圖80B展示任務(wù)T130的實(shí)施方案T230的流程圖。圖81A展示任務(wù)T140的實(shí)施方案T240的流程圖。圖8IB展示任務(wù)T240的實(shí)施方案T340的流程圖。圖81(:展示方法肌10的實(shí)施方案M130的流程圖。圖82A展示方法MlOO的實(shí)施方案M140的流程圖。圖82B展示根據(jù)通用配置的方法M200的流程圖。圖83A展示根據(jù)通用配置的設(shè)備FlOO的框圖。圖83B展示設(shè)備FlOO的實(shí)施方案FllO的框圖。
圖84A展示設(shè)備FlOO 的實(shí)施方案F120的框圖。圖84B展示裝置G130的實(shí)施方案G230的框圖。圖85A展示裝置G140的實(shí)施方案G240的框圖。圖85B展示裝置G240的實(shí)施方案G340的框圖。圖85C展示設(shè)備FllO的實(shí)施方案F130的框圖。圖86A展示設(shè)備FlOO的實(shí)施方案F140的框圖。圖86B展示根據(jù)通用配置的設(shè)備F200的框圖。在這些圖式中,除非上下文另有指示,否則相同標(biāo)記的使用指示相同結(jié)構(gòu)的例子。
具體實(shí)施例方式在移動(dòng)環(huán)境中影響語音信號(hào)的噪聲可包括各種不同組成部分,例如競(jìng)爭(zhēng)談話者、音樂、串音、街道噪聲及/或飛機(jī)場(chǎng)噪聲。由于此噪聲的特征通常為非穩(wěn)定的且接近于語音信號(hào)的頻率特征(frequency signature),所以可能難以使用傳統(tǒng)單一麥克風(fēng)或固定波束成形類型的方法來為所述噪聲建模。單一麥克風(fēng)噪聲減少技術(shù)通常需要顯著參數(shù)調(diào)諧(parameter tuning)以實(shí)現(xiàn)最佳性能。舉例來說,在所述情況下,合適的噪聲參考可能并非直接可用,且可能有必要間接地導(dǎo)出噪聲參考。因此,可能需要用基于多個(gè)麥克風(fēng)的高級(jí)信號(hào)處理來支持在有噪聲環(huán)境中使用移動(dòng)裝置進(jìn)行話音通信。在一個(gè)特定實(shí)例中,在有噪聲環(huán)境中感測(cè)語音信號(hào),且使用語音處理方法來將所述語音信號(hào)與環(huán)境噪聲(也被稱作“背景噪聲”或“周圍噪聲”)分離。在另一特定實(shí)例中,在有噪聲環(huán)境中再生語音信號(hào),且使用語音處理方法來將所述語音信號(hào)與環(huán)境噪聲分離。語音信號(hào)處理在日常通信的許多領(lǐng)域中是重要的,因?yàn)樵谡鎸?shí)世界狀況中幾乎總是存在噪聲??墒褂萌绫疚乃枋龅南到y(tǒng)、方法及設(shè)備來支持所感測(cè)語音信號(hào)及/或再生語音信號(hào)的增加的可懂度(intelligibility),尤其在有噪聲環(huán)境中。所述技術(shù)可大體上應(yīng)用于任何記錄、音頻感測(cè)、收發(fā)及/或音頻再生應(yīng)用中,尤其所述應(yīng)用的移動(dòng)或其它便攜型例子。舉例來說,本文所揭示的配置范圍包括駐留于經(jīng)配置以使用碼分多址(CDMA)無線接口的無線電話通信系統(tǒng)中的通信裝置。然而,所屬領(lǐng)域的技術(shù)人員將理解,具有如本文中所描述的特征的方法及設(shè)備可駐留于使用所屬領(lǐng)域的技術(shù)人員所已知的各種各樣的技術(shù)的各種通信系統(tǒng)中的任一者中,所述通信系統(tǒng)例如是經(jīng)由有線及/或無線(例如,CDMA、TDMA、FDMA, TD-SCDMA或OFDM)發(fā)射信道使用話音IP (“VoIP”)的系統(tǒng)。除非受其上下文明確地限制,否則術(shù)語“信號(hào)”在本文中用以指示其普通意義中的任一者,包括在導(dǎo)線、總線或其它傳輸媒體上表示的存儲(chǔ)器位置(或存儲(chǔ)器位置的集合)的狀態(tài)。除非受其上下文明確地限制,否則術(shù)語“產(chǎn)生”在本文中用以指示其普通意義中的任一者,例如計(jì)算或以其它方式得到。除非受其上下文明確地限制,否則術(shù)語“計(jì)算”在本文中用以指示其普通意義的任一者,例如計(jì)算、評(píng)估、平滑及/或從多個(gè)值中進(jìn)行選擇。除非受其上下文明確地限制,否則術(shù)語“獲得”用以指示其普通意義中的任一者,例如計(jì)算、導(dǎo)出、接收(例如,從外部裝置)及/或檢索(例如,從存儲(chǔ)元件的陣列)。在術(shù)語“包含”用于本描述及權(quán)利要求書中時(shí),其并不排除其它元件或操作。術(shù)語“基于”(如在“A是基于B”中)用以指示其普通意義中的任一者,包括以下情況:(i) “導(dǎo)出自”(例如,“B為A的前體”);(ii)“至少基于”(例如,“A至少基于B”),及在特定情形下適當(dāng)時(shí),(iii) “等于”(例如,“A等于B”)。類似地,術(shù)語“響應(yīng)于”用以指示其普通意義中的任一者,包括“至少響應(yīng)于”。除非另外指示,否則對(duì)具有特定特征的設(shè)備的操作的任何揭示還明確地希望揭示具有類似特征的方法(且反之亦然),且對(duì)根據(jù)特定配置的設(shè)備的操作的任何揭示還明確地希望揭示根據(jù)類似配置的方法(且反之亦然)。如由其特定上下文所指示,術(shù)語“配置”可參考方法、設(shè)備及/或系統(tǒng)來使用。除非由特定上下文另外指示,否則一般地且可互換地使用術(shù)語“方法”、“過程”、“程序”及“技術(shù)”。除非由特定上下文另外指示,否則還一般地且可互換地使用術(shù)語“設(shè)備”與“裝置”。術(shù)語“元件”及“模塊”通常用以指示較大配置的一部分。除非由其上下文明確地限制,否則術(shù)語“系統(tǒng)”在本文中用以指示其普通意義中的任一者,包括“相互作用以實(shí)現(xiàn)共同目標(biāo)的一群組元件”。通過引用文檔的一部分而做出的任何并入還應(yīng)理解為并入在所述部分內(nèi)提及的術(shù)語或變量的定義(其中所述定義出現(xiàn)于文檔中的別處)以及所述并入部分中提及的任何圖。
可互換地使用術(shù)語“編碼器”、“編解碼器”及“編碼系統(tǒng)”以表示一系統(tǒng),所述系統(tǒng)包括經(jīng)配置以接收音頻信號(hào)的幀并對(duì)其進(jìn)行編碼(可能在例如感知加權(quán)及/或其它濾波操作的一個(gè)或一個(gè)以上預(yù)處理操作后)的至少一個(gè)編碼器及經(jīng)配置以接收所述經(jīng)編碼幀及產(chǎn)生所述幀的對(duì)應(yīng)經(jīng)解碼表示的對(duì)應(yīng)解碼器。此種編碼器及解碼器通常部署于通信鏈路的相對(duì)終端處。為了支持全雙工通信,編碼器及解碼器兩者的例子通常部署于此種鏈路的每一端處。在此描述中,術(shù)語“所感測(cè)音頻信號(hào)”表示經(jīng)由一個(gè)或一個(gè)以上麥克風(fēng)接收到的信號(hào)。音頻感測(cè)裝置(例如,通信或記錄裝置)可經(jīng)配置以存儲(chǔ)基于所述所感測(cè)音頻信號(hào)的信號(hào)及/或?qū)⒋诵盘?hào)輸出到經(jīng)由導(dǎo)線或用無線方式耦合到所述音頻發(fā)送裝置的一個(gè)或一個(gè)以上其它裝置。在此描述中,術(shù)語“再生音頻信號(hào)”表示由從存儲(chǔ)裝置檢索及/或經(jīng)由到另一裝置的有線或無線連接接收到的信息來再生的信號(hào)。音頻再生裝置(例如,通信或播放裝置)可經(jīng)配置以將再生音頻信號(hào)輸出到所述裝置的一個(gè)或一個(gè)以上揚(yáng)聲器?;蛘撸搜b置可經(jīng)配置以將再生音頻信號(hào)輸出到耳機(jī)、其它頭戴式耳機(jī)或經(jīng)由導(dǎo)線或用無線方式耦合到所述裝置的外部揚(yáng)聲器。參考用于話音通信的收發(fā)器應(yīng)用(例如,電話),所感測(cè)音頻信號(hào)為將由收發(fā)器發(fā)射的近端信號(hào),且再生音頻信號(hào)為由收發(fā)器接收到(例如,經(jīng)由有線及/或無線通信鏈路)的遠(yuǎn)端信號(hào)。參考移動(dòng)音頻再生應(yīng)用(例如,所記錄音樂或語音(例如,MP3、音頻圖書、播客)的播放或此內(nèi)容的流式傳輸),再生音頻信號(hào)為所播放或流式傳輸?shù)囊纛l信號(hào)。語音信號(hào)的可懂度可相對(duì)于所述信號(hào)的頻譜特性而改變。舉例來說,圖1的清晰度指數(shù)曲線圖展示語音可懂度的相關(guān)組成如何隨著音頻頻率而改變。此曲線圖說明在IkHz與4kHz之間的頻譜分量對(duì)于可懂度來說尤其重要,相對(duì)重要峰值大約在2kHz。圖2展示經(jīng)由電話應(yīng)用的典型窄帶信道來發(fā)射及/或接收的語音信號(hào)的功率譜。此圖說明此信號(hào)的能量在頻率增加高于500Hz時(shí)快速地減少。然而,如圖1所示,達(dá)4kHz的頻率對(duì)于語音可懂度來說可能非常重要。因此,在500Hz與4000Hz之間的頻帶中人工提升能量可預(yù)期改善此電話應(yīng)用中語音信號(hào)的可懂度。由于高于4kHz的音頻頻率通常不如IkHz到4kHz帶對(duì)可懂度那么重要,所以經(jīng)由典型帶限通信信道發(fā)射窄帶信號(hào)通常足以具有可懂的會(huì)話。然而,對(duì)于通信信道支持寬帶信號(hào)的傳輸?shù)那闆r來說,可預(yù)期個(gè)人語音特點(diǎn)的增加的清晰性及更好的通信。在話音電話情形中,術(shù)語“窄帶”指代從約OHz到500Hz (例如,0、50、100或200Hz)到約3kHz到5kHz(例如,3500、4000或4500Hz)的頻率范圍,且術(shù)語“寬帶”指代從約OHz到500Hz (例如,O、50,100 或 200Hz)到約 7kHz 到 8kHz (例如,7000、7500 或 8000Hz)的頻率范圍??赡苄枰ㄟ^提升語音信號(hào)的選定部分來增加語音可懂度。舉例來說,在助聽器應(yīng)用中,可使用動(dòng)態(tài)范圍壓縮技術(shù)來通過提升再生音頻信號(hào)中的特定頻率子帶來補(bǔ)償所述子帶中的已知聽力損失。 真實(shí)世界充滿多個(gè)噪聲源(包括單點(diǎn)噪聲源),其通常侵入多個(gè)聲音中,從而造成回響。背景聲噪聲可包括由一般環(huán)境產(chǎn)生的眾多噪聲信號(hào)及由其它人的背景會(huì)話產(chǎn)生的干擾信號(hào),以及從所述信號(hào)中的每一者產(chǎn)生的反射及回響。環(huán)境噪聲可影響所感測(cè)音頻信號(hào)(例如,近端語音信號(hào))及/或再生音頻信號(hào)(例如,遠(yuǎn)端語音信號(hào))的可懂度。對(duì)于通信發(fā)生于有噪聲環(huán)境中的應(yīng)用來說,可能需要使用語音處理方法來將語音信號(hào)與背景噪聲區(qū)別開且加強(qiáng)語音信號(hào)的可懂度。此處理在日常通信的許多領(lǐng)域中可為重要的,因?yàn)樵谡鎸?shí)世界狀況中幾乎總是存在噪聲。自動(dòng)增益控制(AGC,也被稱作自動(dòng)音量控制或AVC)為可用以增加在有噪聲環(huán)境中感測(cè)或再生的音頻信號(hào)的可懂度的處理方法??墒褂米詣?dòng)增益控制技術(shù)來將所述信號(hào)的動(dòng)態(tài)范圍壓縮到有限振幅帶中,借此提升所述信號(hào)的具有低功率的區(qū)段并減少具有高功率的區(qū)段中的能量。圖3展示典型語音功率譜(其中自然語音功率滾降使功率隨頻率減少)及典型噪聲功率譜(其中功率大體上在至少語音頻率范圍內(nèi)恒定)的實(shí)例。在此情況下,語音信號(hào)的高頻率分量可具有比噪聲信號(hào)的對(duì)應(yīng)分量少的能量,從而導(dǎo)致對(duì)高頻率語音帶的屏蔽。圖4A說明AVC對(duì)此實(shí)例的應(yīng)用。如此圖中所示,通常實(shí)施AVC模塊以無差別地提升語音信號(hào)的所有頻帶。此方法可能需要將放大信號(hào)的大動(dòng)態(tài)范圍用于高頻率功率的適度提升。背景噪聲對(duì)高頻率語音內(nèi)容的淹沒速度通常比對(duì)低頻率內(nèi)容快得多,因?yàn)楦哳l帶中的語音功率通常遠(yuǎn)小于低頻帶中的語音功率。因此,僅提升信號(hào)的總音量將不一定提升低于IkHz的低頻率內(nèi)容,此可能不會(huì)顯著地有助于可懂度??赡苄枰臑檎{(diào)整音頻子帶功率以補(bǔ)償對(duì)語音信號(hào)的噪聲屏蔽效應(yīng)。舉例來說,可能需要與噪聲語音子帶功率的比率成反比地提升語音功率,且在高頻率子帶中不成比例地提升語音功率,以便朝著高頻率補(bǔ)償語音功率的固有滾降。可能需要在由環(huán)境噪聲占主導(dǎo)的頻率子帶中補(bǔ)償?shù)驮捯艄β?。舉例來說,如圖4B所示,可能需要對(duì)選定子帶起作用以通過將不同增益提升應(yīng)用于語音信號(hào)的不同子帶(例如,根據(jù)語音噪聲比率)來提升可懂度。與圖4A所示的AVC實(shí)例對(duì)比,可預(yù)期所述均衡提供更清楚及更可懂的信號(hào),同時(shí)避免對(duì)低頻率分量的不必要提升。為了以此方式選擇性地提升語音功率,可能需要獲得對(duì)環(huán)境噪聲電平的可靠且同時(shí)的估計(jì)。然而,在實(shí)際應(yīng)用中,可能難以使用傳統(tǒng)單一麥克風(fēng)或固定波束成形類型的方法來根據(jù)所感測(cè)音頻信號(hào)為環(huán)境噪聲建模。雖然圖3表明噪聲電平隨頻率而恒定,但在通信裝置或媒體播放裝置的實(shí)際應(yīng)用中,環(huán)境噪聲電平通常隨時(shí)間及頻率兩者而顯著且快速地改變。在典型環(huán)境中,聲噪聲可包括串音噪聲、飛機(jī)場(chǎng)噪聲、街道噪聲、競(jìng)爭(zhēng)談話者的話音,及/或來自干擾源(例如,電視機(jī)或收音機(jī))的聲音。因此,此噪聲通常為非穩(wěn)定的且可具有接近于用戶自身話音的頻譜的平均頻譜。根據(jù)單一麥克風(fēng)信號(hào)計(jì)算出的噪聲功率參考信號(hào)通常僅為近似穩(wěn)定噪聲估計(jì)。此外,此計(jì)算通常必然伴有噪聲功率估計(jì)延遲,使得可僅在顯著延遲后才執(zhí)行對(duì)子帶增益的對(duì)應(yīng)調(diào)整??赡苄枰@得對(duì)環(huán)境噪聲的可靠且同時(shí)的估計(jì)。圖5展示根據(jù)通用配置的經(jīng)配置以處理音頻信號(hào)的設(shè)備AlOO的框圖,所述設(shè)備包括空間選擇性處理濾波器SSlO及頻譜對(duì)比加強(qiáng)器EN10??臻g選擇性處理(SSP)濾波器SSlO經(jīng)配置以對(duì)M通道感測(cè)音頻信號(hào)SlO (其中M為大于一的整數(shù))執(zhí)行空間選擇性處理操作以產(chǎn)生源信號(hào)S20及噪聲參考S30。加強(qiáng)器ENlO經(jīng)配置以基于來自噪聲參考S30的信息來動(dòng)態(tài)地更改語音信號(hào)S40的頻譜特性以產(chǎn)生經(jīng)處理語音信號(hào)S50。舉例來說,加強(qiáng)器ENlO可經(jīng)配置以使用來自噪聲參考S30的信息來相對(duì)于語音信號(hào)S40的至少一個(gè)頻率子帶來提升語音信號(hào)S40的至少一個(gè)其它頻率子帶及/或使其衰減以產(chǎn)生經(jīng)處理語音信號(hào)S50??蓪?shí)施設(shè)備A100,使得語音信號(hào)S40為再生音頻信號(hào)(例如,遠(yuǎn)端信號(hào))?;蛘撸蓪?shí)施設(shè)備A100,使得語音信號(hào)S40為所感測(cè)音頻信號(hào)(例如,近端信號(hào))。舉例來說,可實(shí)施設(shè)備A100,使得語音信號(hào)S40基于多通道感測(cè)音頻信號(hào)S10。圖6A展示設(shè)備AlOO的此實(shí)施方案AllO的框圖,其中加強(qiáng)器ENlO經(jīng)布置以將源信號(hào)S20作為語音信號(hào)S40來接收。圖6B展示設(shè)備AlOO (及設(shè)備A110)的另一實(shí)施方案A120的框圖,實(shí)施方案A120包括加強(qiáng)器ENlO的兩個(gè)例子ENlOa及ENlOb。在此實(shí)例中,加強(qiáng)器ENlOa經(jīng)布置以處理語音信號(hào)S40 (例如,遠(yuǎn)端信號(hào))以產(chǎn)生經(jīng)處理語音信號(hào)S50a,且加強(qiáng)器ENlOa經(jīng)布置以處理源信號(hào)S20 (例如,近端信號(hào))以產(chǎn)生經(jīng)處理語音信號(hào)S50b。在設(shè)備AlOO的典型應(yīng)用中,所感測(cè)音頻信號(hào)SlO的每一通道是基于來自M個(gè)麥克風(fēng)的陣列中的對(duì)應(yīng)一者的 信號(hào),其中M為具有大于一的值的整數(shù)??山?jīng)實(shí)施以包括具有此麥克風(fēng)陣列的設(shè)備AlOO的實(shí)施方案的音頻感測(cè)裝置的實(shí)例包括助聽器、通信裝置、記錄裝置及音頻或視聽播放裝置。所述通信裝置的實(shí)例包括(不限于)電話機(jī)(例如,有繩或無繩電話、蜂窩式電話手持機(jī)、通用串行總線(USB)手持機(jī))、有線及/或無線頭戴式耳機(jī)(例如,藍(lán)牙頭戴式耳機(jī)),及免持車載設(shè)備。所述記錄裝置的實(shí)例包括(不限于)手持型音頻及/或視頻記錄器及數(shù)字相機(jī)。所述音頻或視聽播放裝置的實(shí)例包括(不限于)經(jīng)配置以再生流式傳輸或預(yù)記錄的音頻或視聽內(nèi)容的媒體播放器??山?jīng)實(shí)施以包括具有此麥克風(fēng)陣列的設(shè)備AlOO的實(shí)施方案且可經(jīng)配置以執(zhí)行通信、記錄及/或音頻或視聽播放操作的音頻感測(cè)裝置的其它實(shí)例包括個(gè)人數(shù)字助理(PDA)及其它手持型計(jì)算裝置;上網(wǎng)本(netbook)計(jì)算機(jī)、筆記本計(jì)算機(jī)、膝上型計(jì)算機(jī)及其它便攜型計(jì)算裝置;及桌上型計(jì)算機(jī)及工作站??蓪?shí)施M個(gè)麥克風(fēng)的陣列以具有經(jīng)配置以接收聲信號(hào)的兩個(gè)麥克風(fēng)(例如,立體聲陣列)或兩個(gè)以上的麥克風(fēng)。所述陣列中的每一麥克風(fēng)可具有全向、雙向或單向(例如,心形線)的響應(yīng)??墒褂玫母鞣N類型的麥克風(fēng)包括(不限于)壓電式麥克風(fēng)、動(dòng)圈式麥克風(fēng)(dynamic microphone)及駐極體麥克風(fēng)(electret microphone)。在用于便攜式話音通信的裝置(例如,手持機(jī)或頭戴式耳機(jī))中,此陣列中的相鄰麥克風(fēng)之間的中心到中心間隔通常在約1.5cm到約4.5cm的范圍中,但在例如手持機(jī)的裝置中,較大間隔(例如,達(dá)IOcm或15cm)也是可能的。在助聽器中,此陣列中的相鄰麥克風(fēng)之間的中心到中心間隔可小如約4_或5_。此陣列中的麥克風(fēng)可沿著一條線布置,或替代地,使得其中心位于二維(例如,三角形)或三維形狀的頂點(diǎn)處??赡苄枰ㄟ^對(duì)由所述陣列的麥克風(fēng)產(chǎn)生的信號(hào)執(zhí)行一個(gè)或一個(gè)以上預(yù)處理操作來獲得所感測(cè)音頻信號(hào)S10。所述預(yù)處理操作可包括取樣、濾波(例如,用于回音消除、噪聲減少、頻譜整形等等)及可能甚至預(yù)分離(例如,通過如本文所描述的另一 SSP濾波器或自適應(yīng)濾波器)以獲得所感測(cè)音頻信號(hào)S10。對(duì)于例如語音的聲應(yīng)用來說,典型取樣速率的范圍是從8kHz到16kHz。其它典型預(yù)處理操作包括模擬及/或數(shù)字域中的阻抗匹配、增益控制及濾波??臻g選擇性處 理(SSP)濾波器SSlO經(jīng)配置以對(duì)所感測(cè)音頻信號(hào)SlO執(zhí)行空間選擇性處理操作以產(chǎn)生源信號(hào)S20及噪聲參考S30。此操作可經(jīng)設(shè)計(jì)以確定所述音頻感測(cè)裝置與特定聲音源之間的距離、減少噪聲、加強(qiáng)從特定方向到來的信號(hào)分量,及/或?qū)⒁粋€(gè)或一個(gè)以上聲音分量與其它環(huán)境聲音分離。所述空間處理操作的實(shí)例描述于2008年8月25日申請(qǐng)的題為“用于信號(hào)分離的系統(tǒng)、方法及設(shè)備(SYSTEMS, METHODS, ANDAPPARATUS FOR SIGNAL SEPARATION)” 的第 12/197,924 號(hào)美國(guó)專利申請(qǐng)案及于 2008年11月24日申請(qǐng)的題為“用于加強(qiáng)的可懂度的系統(tǒng)、方法、設(shè)備及計(jì)算機(jī)程序產(chǎn)品(SYSTEMS,METHODS, APPARATUS, AND ⑶MPUTER PROGRAM PRODUCTS FOR ENHANCEDINTELLIGIBILITY)”的第12/277,283號(hào)美國(guó)專利申請(qǐng)案中且包括(不限于)波束成形及盲源分離操作。噪聲分量的實(shí)例包括(不限于)漫射環(huán)境噪聲(例如,街道噪聲、汽車噪聲及/或串音噪聲)及方向性噪聲(例如,干擾揚(yáng)聲器及/或來自例如電視、收音機(jī)或播音系統(tǒng)的另一點(diǎn)源的聲音)??臻g選擇性處理濾波器SSlO可經(jīng)配置以將所感測(cè)音頻信號(hào)SlO的方向性所要分量(例如,用戶的話音)與所述信號(hào)的一個(gè)或一個(gè)以上其它分量(例如,方向性干擾分量及/或漫射噪聲分量)分離。在此情況下,SSP濾波器SSlO可經(jīng)配置以集中所述方向性所要分量的能量,使得源信號(hào)S20包括比所感測(cè)音頻通道SlO的每一通道包括的能量多的所述方向性所要分量的能量(也就是說,使得源信號(hào)S20包括比所感測(cè)音頻通道SlO的任何個(gè)別通道包括的能量多的所述方向性所要分量的能量)。圖7展示SSP濾波器SSlO的此實(shí)例的波束圖,其表明濾波器響應(yīng)相對(duì)于麥克風(fēng)陣列的軸的方向性。可使用空間選擇性處理濾波器SSlO來提供對(duì)環(huán)境噪聲的可靠且同時(shí)的估計(jì)。在一些噪聲估計(jì)方法中,通過對(duì)輸入信號(hào)的不活動(dòng)幀(例如,僅含有背景噪聲或?yàn)榧澎o的幀)求平均來估計(jì)噪聲參考。所述方法可能會(huì)對(duì)環(huán)境噪聲的改變反應(yīng)緩慢,且通常對(duì)于為非穩(wěn)定噪聲(例如,脈沖噪聲)建模為無效的。空間選擇性處理濾波器SSlO可經(jīng)配置以將噪聲分量甚至與輸入信號(hào)的活動(dòng)幀分離以提供噪聲參考S30。通過SSP濾波器SSlO分離到此噪聲參考的巾貞中的噪聲可基本上與源信號(hào)S20的對(duì)應(yīng)巾貞中的信息內(nèi)容同時(shí),且此噪聲參考還被稱作“瞬時(shí)”噪聲估計(jì)??臻g選擇性處理濾波器SSlO通常經(jīng)實(shí)施以包括由濾波器系數(shù)值的一個(gè)或一個(gè)以上矩陣表征的固定濾波器FF10。可使用如下文更詳細(xì)描述的波束成形、盲源分離(BSS)或組合的BSS/波束成形方法來獲得這些濾波器系數(shù)值??臻g選擇性處理濾波器SSlO還可經(jīng)實(shí)施以包括一個(gè)以上的級(jí)。圖8A展示SSP濾波器SSlO的此實(shí)施方案SS20的框圖,實(shí)施方案SS20包括固定濾波器級(jí)FFlO及自適應(yīng)濾波器級(jí)AFlO。在此實(shí)例中,固定濾波器級(jí)FFlO經(jīng)布置以對(duì)所感測(cè)音頻信號(hào)SlO的通道S10-1及S10-2進(jìn)行濾波以產(chǎn)生經(jīng)濾波信號(hào)S15的通道S15-1及S15-2,且自適應(yīng)濾波器級(jí)AFlO經(jīng)布置以對(duì)通道S15-1及S15-2進(jìn)行濾波以產(chǎn)生源信號(hào)S20及噪聲參考S30。在此情況下,如下文更詳細(xì)地描述,可能需要使用固定濾波器級(jí)FFlO來為自適應(yīng)濾波器級(jí)AFlO產(chǎn)生初始條件。還可能需要對(duì)SSP濾波器SSlO的輸入執(zhí)行自適應(yīng)縮放(例如,以確保IIR固定或自適應(yīng)濾波器組的穩(wěn)定性)。在SSP濾波器SS20的另一實(shí)施方案中,自適應(yīng)濾波器AFlO經(jīng)布置以將經(jīng)濾波的通道S15-1及所感測(cè)音頻通道S10-2作為輸入來接收。在此情況下,可能需要自適應(yīng)濾波器AFlO經(jīng)由與固定濾波器FFlO的預(yù)期處理延遲匹配的延遲元件來接收所感測(cè)音頻通道S10-2。
可能需要實(shí)施SSP濾波器SSlO以包括多個(gè)固定濾波器級(jí),其經(jīng)布置使得可在操作期間選擇所述固定濾波器級(jí)中的適當(dāng)一者(例如,根據(jù)各種固定濾波器級(jí)的相對(duì)分離性能)。此結(jié)構(gòu)揭示于(例如)于2008年12月12日申請(qǐng)的題為“用于基于多麥克風(fēng)的語音加強(qiáng)的系統(tǒng)、方法及設(shè)備(SYSTEMS, METHODS, AND APPARATUS FOR MULT 1-MICROPHONE BASEDSPEECH ENHANCEMENT)”的第12/334,246號(hào)美國(guó)專利申請(qǐng)案(代理人案號(hào)080426)中??臻g選擇性處理濾波器SSlO可經(jīng)配置以在時(shí)域中處理所感測(cè)音頻信號(hào)SlO且產(chǎn)生源信號(hào)S20及噪聲參考S30作為時(shí)域信號(hào)?;蛘?,SSP濾波器SSlO可經(jīng)配置以在頻域(或另一變換域)中接收所感測(cè)音頻信號(hào)SlO或?qū)⑺袦y(cè)音頻信號(hào)SlO轉(zhuǎn)換到此域,且在所述域中處理所感測(cè)音頻信號(hào)S10。可能需要在SSP濾波器SSlO或SS20后跟著噪聲減少級(jí),所述噪聲減少級(jí)經(jīng)配置以應(yīng)用噪聲參考S30以進(jìn)一步減少源信號(hào)S20中的噪聲。圖8B展示設(shè)備AlOO的實(shí)施方案A130的框圖,實(shí)施方案A130包括此噪聲減少級(jí)NRlO。噪聲減少級(jí)NRlO可實(shí)施為維納濾波器(Wiener filter),其濾波系數(shù)值是基于來自源信號(hào)S20及噪聲參考S30的信號(hào)及噪聲功率信息。在此情況下,噪聲減少級(jí)NRlO可經(jīng)配置以基于來自噪聲參考S30的信息來估計(jì)噪聲頻譜。或者,噪聲減少級(jí)NRlO可經(jīng)實(shí)施以基于噪聲參考S30的頻譜來對(duì)源信號(hào)S20執(zhí)行頻譜相減(spectral substraction)操作?;蛘?噪聲減少級(jí)NRlO可實(shí)施為卡爾曼濾波器,其噪聲協(xié)方差是基于來自噪聲參考S30的信息。噪聲減少級(jí)NRlO可經(jīng)配置以在頻域(或另一變換域)中處理源信號(hào)S20及噪聲參考S30。圖9A展示設(shè)備A130的實(shí)施方案A132的框圖,實(shí)施方案A132包括噪聲減少級(jí)NRlO的此實(shí)施方案NR20。設(shè)備A132還包括變換模塊TR10,其經(jīng)配置以將源信號(hào)S20及噪聲參考S30變換到變換域中。在典型實(shí)例中,變換模塊TRlO經(jīng)配置以對(duì)源信號(hào)S20及噪聲參考S30中的每一者執(zhí)行快速傅立葉變換(FFT)(例如,128點(diǎn)、256點(diǎn)或512點(diǎn)FFT)以產(chǎn)生相應(yīng)頻域信號(hào)。圖9B展示設(shè)備A132的實(shí)施方案A134的框圖,實(shí)施方案A134還包括逆變換模塊TR20,逆變換模塊TR20經(jīng)布置以將噪聲減少級(jí)NR20的輸出變換到時(shí)域(例如,通過對(duì)噪聲減少級(jí)NR20的輸出執(zhí)行逆FFT)。噪聲減少級(jí)NR20可經(jīng)配置以通過根據(jù)噪聲參考S30的對(duì)應(yīng)頻段(bin)的值來對(duì)源信號(hào)S20的頻域頻段進(jìn)行加權(quán)來計(jì)算噪聲減少的語音信號(hào)S45。在此情況下,噪聲減少級(jí)NR20可經(jīng)配置以根據(jù)例如Bi=WiAi的表達(dá)式來產(chǎn)生噪聲減少的語音信號(hào)S45,其中Bi指示噪聲減少的語音信號(hào)S45的第i個(gè)頻段,Ai指示源信號(hào)S20的第i個(gè)頻段,且Wi指示幀的權(quán)重向量的第i個(gè)元素。每一頻段可包括對(duì)應(yīng)頻域信號(hào)的僅一個(gè)值,或噪聲減少級(jí)NR20可經(jīng)配置以根據(jù)所要子帶劃分方案來將每一頻域信號(hào)的所述值分組成多個(gè)頻段(例如,如在下文參考頻段化(binning)模塊SG30所描述)。噪聲減少級(jí)NR20的此實(shí)施方案可經(jīng)配置以計(jì)算權(quán)重Wi,使得所述權(quán)重對(duì)于噪聲參考S30具有低值的頻段來說為較高的(例如,較接近于一)且對(duì)于噪聲參考S30具有高值的頻段來說為較低的(例如,較接近于零)。噪聲減少級(jí)NR20的一個(gè)此實(shí)例經(jīng)配置以通過根據(jù)一表達(dá)式來計(jì)算權(quán)重Wi中的每一者來阻斷源信號(hào)S20的頻段或使其通過,所述表達(dá)式例如在頻段Ni中的值的總和(或者,平均值)小于(或者,不大于)閾值Ti時(shí)為Wi=I且否則為Wi=O。在此實(shí)例中,Ni指示噪聲參考S30的第i個(gè)頻段??赡苄枰渲迷肼暅p少級(jí)NR20的此實(shí)施方案,使得閾值Ti彼此相等,或替代地,使得閾值Ti中的至少兩者彼此不同。在另一實(shí)例中,噪聲減少級(jí)NR20經(jīng)配置以通過在頻域中從源信號(hào)S20中減去噪聲參考S30(即,通過從源信號(hào)S20的頻譜中減去噪聲`參考S30的頻譜)來計(jì)算噪聲減少的語音信號(hào)S45。如下文更詳細(xì)地描述,加強(qiáng)器ENlO可經(jīng)配置以在頻域或另一變換域中對(duì)一個(gè)或一個(gè)以上信號(hào)執(zhí)行操作。圖1OA展示設(shè)備AlOO的實(shí)施方案A140的框圖,實(shí)施方案A140包括噪聲減少級(jí)NR20的例子。在此實(shí)例中,加強(qiáng)器ENlO經(jīng)布置以將噪聲減少的語音信號(hào)S45作為語音信號(hào)S40來接收,且加強(qiáng)器ENlO還經(jīng)布置以將噪聲參考S30及噪聲減少的語音信號(hào)S45作為變換域信號(hào)來接收。設(shè)備A140還包括逆變換模塊TR20的例子,其經(jīng)布置以將經(jīng)處理語音信號(hào)S50從變換域變換到時(shí)域。明確地提到,對(duì)于語音信號(hào)S40具有高取樣速率(例如,44.1kHz或高于十千赫的另一取樣速率)的情況,可能需要加強(qiáng)器ENlO通過在時(shí)域中處理信號(hào)S40來產(chǎn)生對(duì)應(yīng)經(jīng)處理語音信號(hào)S50。舉例來說,可能需要避免對(duì)此信號(hào)執(zhí)行變換操作的計(jì)算代價(jià)。從媒體文件或文件流再生的信號(hào)可具有此取樣速率。圖1OB展示設(shè)備A140的實(shí)施方案A150的框圖。設(shè)備A150包括加強(qiáng)器ENlO的例子ENlOa,其經(jīng)配置以在變換域中處理噪聲參考S30及噪聲減少的語音信號(hào)S45(例如,如上文參考設(shè)備A140所描述)以產(chǎn)生第一經(jīng)處理語音信號(hào)S50a。設(shè)備A150還包括加強(qiáng)器ENlO的例子ENlOb,其經(jīng)配置以在時(shí)域中處理噪聲參考S30及語音信號(hào)S40 (例如,遠(yuǎn)端或其它再生信號(hào))以產(chǎn)生第二經(jīng)處理語音信號(hào)S50b。在經(jīng)配置以執(zhí)行方向性處理操作的替代方案中,或除了經(jīng)配置以執(zhí)行方向性處理操作外,SSP濾波器SSlO可經(jīng)配置以執(zhí)行距離處理操作。圖1lA及圖1lB分別展示SSP濾波器SSlO的實(shí)施方案SSllO及SS120的框圖,所述實(shí)施方案包括經(jīng)配置以執(zhí)行此操作的距離處理模塊DS10。距離處理模塊DSlO經(jīng)配置以產(chǎn)生(作為距離處理操作的結(jié)果)距離指示信號(hào)DI10,所述信號(hào)指示多通道感測(cè)音頻信號(hào)SlO的分量的源相對(duì)于麥克風(fēng)陣列的距離。距離處理模塊DSlO通常經(jīng)配置以產(chǎn)生距離指示信號(hào)DIlO作為兩個(gè)狀態(tài)分別指示近場(chǎng)源及遠(yuǎn)場(chǎng)源的二元值指示信號(hào),但產(chǎn)生連續(xù)及/或多值信號(hào)的配置也是可能的。在一個(gè)實(shí)例中,距離處理模塊DSlO經(jīng)配置,使得距離指示信號(hào)DIlO的狀態(tài)是基于麥克風(fēng)信號(hào)的功率梯度之間的類似程度。距離處理模塊DSlO的此實(shí)施方案可經(jīng)配置以根據(jù)(A)麥克風(fēng)信號(hào)的功率梯度之間的差異與(B)閾值之間的關(guān)系來產(chǎn)生距離指示信號(hào)DIlOo 一種此關(guān)系可表達(dá)為:
權(quán)利要求
1.一種方法,所述方法包含在經(jīng)配置以處理音頻信號(hào)的裝置內(nèi)執(zhí)行以下動(dòng)作中的每一者: 在空間選擇性處理過濾器內(nèi)對(duì)多通道所感測(cè)音頻信號(hào)執(zhí)行空間選擇性處理操作以產(chǎn)生源信號(hào)及噪聲參考;以及 在第一頻譜對(duì)比加強(qiáng)器內(nèi)對(duì)遠(yuǎn)端語音信號(hào)執(zhí)行第一頻譜對(duì)比加強(qiáng)操作以產(chǎn)生第一經(jīng)處理語音信號(hào)。
2.根據(jù)權(quán)利要求1所述的處理所述遠(yuǎn)端語音信號(hào)的方法,包括對(duì)所述裝置用無線方式接收到的信號(hào)進(jìn)行解碼以獲得經(jīng)解碼語音信號(hào),其中所述遠(yuǎn)端語音信號(hào)是基于來自所述經(jīng)解碼語首彳目號(hào)的彳目息。
3.根據(jù)權(quán)利要求1所述的方法,其中所述方法包括: 使用回音消除器來從所述多通道所感測(cè)音頻信號(hào)中消除回音;以及 使用所述第一經(jīng)處理語音信號(hào)來訓(xùn)練所述回音消除器。
4.根據(jù)權(quán)利要求1所述的方法,其中所述方法包括: 基于來自所述噪聲參考的信息,對(duì)所述源信號(hào)執(zhí)行噪聲減少操作以獲得所述遠(yuǎn)端語音信號(hào);以及 基于所述源信號(hào)與所述遠(yuǎn)端語音信號(hào)之間的關(guān)系來執(zhí)行話音活動(dòng)檢測(cè)操作,其中產(chǎn)生所述第一經(jīng)處理語音信號(hào)是基于所述話音活動(dòng)檢測(cè)操作的結(jié)果。
5.根據(jù)權(quán)利要求1所述的方法,其中所述執(zhí)行空間選擇性處理操作包括確定在多個(gè)不同頻率中的每一者下所述多通道所感測(cè)音頻信號(hào)的通道的相位角之間的關(guān)系。
6.根據(jù)權(quán)利要求1所述的方法,其中所述執(zhí)行第一頻譜對(duì)比加強(qiáng)操作包括: 基于來自所述噪聲參考的信息來計(jì)算第一多個(gè)子帶因子; 基于來自所述遠(yuǎn)端語音信號(hào)的信息來計(jì)算第二多個(gè)子帶因子; 通過將所述第二多個(gè)子帶因子應(yīng)用到所述遠(yuǎn)端語音信號(hào)來產(chǎn)生第一經(jīng)對(duì)比加強(qiáng)信號(hào);以及 通過組合所述第一多個(gè)子帶因子和所述第一經(jīng)對(duì)比加強(qiáng)信號(hào)來生成所述第一經(jīng)處理語音信號(hào)。
7.根據(jù)權(quán)利要求1所述的方法,其中所述執(zhí)行空間選擇性處理操作包括將所述多通道所感測(cè)音頻信號(hào)的方向性分量的能量集中到所述源信號(hào)中,并且其中所述多通道所感測(cè)音頻信號(hào)包括近端語音信號(hào)。
8.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括在第二頻譜對(duì)比加強(qiáng)器內(nèi)對(duì)近端語音信號(hào)執(zhí)行第二頻譜對(duì)比加強(qiáng)操作以生成第二經(jīng)處理語音信號(hào)。
9.根據(jù)權(quán)利要求8所述的方法,其中所述執(zhí)行第二頻譜對(duì)比加強(qiáng)操作包括: 基于來自所述噪聲參考的信息來計(jì)算第三多個(gè)子帶因子; 基于來自所述近端語音信號(hào)的信息來計(jì)算第四多個(gè)子帶因子; 通過將所述第三多個(gè)子帶因子應(yīng)用到所述近端語音信號(hào)來產(chǎn)生第二經(jīng)對(duì)比加強(qiáng)信號(hào);以及 通過組合所述第三多個(gè)子帶因子和所述第二經(jīng)對(duì)比加強(qiáng)信號(hào)來生成第二經(jīng)處理語音信號(hào)。
10.根據(jù)權(quán)利要求9所述的方法,其中所述生成第二經(jīng)處理語音信號(hào)包括使用濾波器級(jí)的級(jí)聯(lián)來對(duì)所述近端語音信號(hào)進(jìn)行濾波。
11.一種設(shè)備,其包括: 用于對(duì)多通道所感測(cè)音頻信號(hào)執(zhí)行空間選擇性處理操作以產(chǎn)生源信號(hào)及噪聲參考的裝置;以及 用于在第一頻譜對(duì)比加強(qiáng)器內(nèi)對(duì)遠(yuǎn)端語音信號(hào)和所述噪音參考執(zhí)行第一頻譜對(duì)比加強(qiáng)操作以產(chǎn)生第一經(jīng)處理語音信號(hào)的裝置。
12.根據(jù)權(quán)利要求11所述的設(shè)備,包括用于對(duì)所述設(shè)備用無線方式接收到的信號(hào)進(jìn)行解碼以獲得經(jīng)解碼語音信號(hào)的裝置,其中所述遠(yuǎn)端語音信號(hào)是基于來自所述經(jīng)解碼語音信號(hào)的信息。
13.根據(jù)權(quán)利要求11所述的設(shè)備,其中所述設(shè)備包括用于從所述多通道所感測(cè)音頻信號(hào)中消除回音的裝置,并且其中所述用于消除回音的裝置經(jīng)配置和設(shè)置以被所述第一經(jīng)處理語音信號(hào)訓(xùn)練。
14.根據(jù)權(quán)利要求11所述的設(shè)備,其中所述設(shè)備包括: 用于基于來自所述噪聲參考的信息對(duì)所述源信號(hào)執(zhí)行噪聲減少操作以獲得所述遠(yuǎn)端語音信號(hào)的裝置;以及 用于基于所述源信號(hào)與所述遠(yuǎn)端語音信號(hào)之間的關(guān)系來執(zhí)行話音活動(dòng)檢測(cè)操作的裝置, 其中所述用于產(chǎn)生第一經(jīng)處 理語音信號(hào)的裝置經(jīng)配置以基于所述話音活動(dòng)檢測(cè)操作的結(jié)果來產(chǎn)生所述第一經(jīng)處理語音信號(hào)。
15.根據(jù)權(quán)利要求11所述的設(shè)備,其中用于執(zhí)行第一頻譜對(duì)比加強(qiáng)操作的裝置包括: 用于基于來自所述噪聲參考的信息來計(jì)算第一多個(gè)子帶因子的裝置; 用于基于來自所述遠(yuǎn)端語音信號(hào)的信息來計(jì)算第二多個(gè)子帶因子的裝置; 用于通過將所述第二多個(gè)子帶因子應(yīng)用到所述遠(yuǎn)端語音信號(hào)來產(chǎn)生第一經(jīng)對(duì)比加強(qiáng)信號(hào)的裝置;以及 用于通過用于組合所述第一多個(gè)子帶因子和所述第一經(jīng)對(duì)比加強(qiáng)信號(hào)的裝置來生成第一經(jīng)處理語音信號(hào)的裝置。
16.根據(jù)權(quán)利要求11所述的設(shè)備,其中所述用于執(zhí)行空間選擇性處理操作的裝置包括將所述多通道所感測(cè)音頻信號(hào)的方向性分量的能量集中到所述源信號(hào)中,并且其中所述多通道所感測(cè)音頻信號(hào)包括近端語音信號(hào)。
17.根據(jù)權(quán)利要求11所述的設(shè)備,進(jìn)一步包括用于在第二頻譜對(duì)比加強(qiáng)器內(nèi)對(duì)近端語音信號(hào)和所述噪音參考執(zhí)行第二頻譜對(duì)比加強(qiáng)操作以生成第二經(jīng)處理語音信號(hào)的裝置。
18.根據(jù)權(quán)利要求17所述的設(shè)備,其中所述用于執(zhí)行第二頻譜對(duì)比加強(qiáng)操作的裝置包括: 用于基于來自所述噪聲參考的信息來計(jì)算第三多個(gè)子帶因子的裝置; 用于基于來自所述近端語音信號(hào)的信息來計(jì)算第四多個(gè)子帶因子的裝置; 用于通過將所述第四多個(gè)子帶因子應(yīng)用到所述近端語音信號(hào)來產(chǎn)生第二經(jīng)對(duì)比加強(qiáng)信號(hào)的裝置;以及 用于通過用于組合所述第三多個(gè)子帶因子和所述第二經(jīng)對(duì)比加強(qiáng)信號(hào)的裝置來生成第二經(jīng)處理語音信號(hào)的裝置。
19.根據(jù)權(quán)利要求18所述的設(shè)備,其中所述用于生成第二經(jīng)處理語音信號(hào)的裝置包括經(jīng)設(shè)置以對(duì)所述近端語音信號(hào)進(jìn)行濾波的濾波器級(jí)的級(jí)聯(lián)。
20.—種設(shè)備,包括: 空間選擇性處理濾波器,其經(jīng)配置以對(duì)多通道所感測(cè)音頻信號(hào)執(zhí)行空間選擇性處理操作以產(chǎn)生源信號(hào)及噪聲參考;以及 第一頻譜對(duì)比加強(qiáng)器,其耦合到所述空間選擇性處理濾波器、經(jīng)配置以對(duì)遠(yuǎn)端語音信號(hào)和所述噪音參考執(zhí)行頻譜對(duì)比加強(qiáng)操作以產(chǎn)生第一經(jīng)處理語音信號(hào)。
21.根據(jù)權(quán)利要求20所述的設(shè)備,其中所述設(shè)備包括解碼器,所述解碼器經(jīng)配置以對(duì)所述設(shè)備用無線方式接收到的信號(hào)進(jìn)行解碼以獲得經(jīng)解碼語音信號(hào),并且 其中所述遠(yuǎn)端語音信號(hào)是基于來自所述經(jīng)解碼語音信號(hào)的信息。
22.根據(jù)權(quán)利要求20所述的設(shè)備,其中所述第一頻譜對(duì)比加強(qiáng)器包括回音消除器,所述回音消除器經(jīng)配置以從所述多通道所感測(cè)音頻信號(hào)中消除回音;并且 其中所述回音消除器經(jīng)配置和設(shè)置以被所述第一經(jīng)處理語音信號(hào)訓(xùn)練。
23.根據(jù)權(quán)利要求20所述的設(shè)備,其中所述設(shè)備包括: 噪音減小級(jí),其經(jīng)配置以基于來自所述噪聲參考的信息來對(duì)所述源信號(hào)執(zhí)行噪聲減少操作以獲得所述遠(yuǎn)端語音信號(hào);以及 話音活動(dòng)檢測(cè)器,其經(jīng)配置以基于所述源信號(hào)與所述遠(yuǎn)端語音信號(hào)之間的關(guān)系來執(zhí)行話音活動(dòng)檢測(cè)操作, 其中所述第一頻譜對(duì)比加強(qiáng)器經(jīng)配置以基于所述話音活動(dòng)檢測(cè)操作的結(jié)果來產(chǎn)生所述第一經(jīng)處理語音信號(hào)。
24.根據(jù)權(quán)利要求20所述的設(shè)備,其中所述第一頻譜對(duì)比加強(qiáng)器包括: 第一子帶因子計(jì)算器,其經(jīng)配置以基于來自噪聲參考的信息計(jì)算第一多個(gè)子帶因子; 第二子帶因子計(jì)算器,其經(jīng)配置以基于來自遠(yuǎn)端語音信號(hào)的信息計(jì)算第二多個(gè)子帶因子; 控制元件,其經(jīng)配置以基于將所述第二多個(gè)子帶因子應(yīng)用到所述遠(yuǎn)端語音信號(hào)來產(chǎn)生第一經(jīng)對(duì)比加強(qiáng)信號(hào);以及 混合器,其經(jīng)配置以組合所述第一多個(gè)子帶因子和所述第一經(jīng)對(duì)比加強(qiáng)信號(hào)。
25.根據(jù)權(quán)利要求20所述的設(shè)備,其中所述空間選擇性處理操作包括將所述多通道所感測(cè)音頻信號(hào)的方向性分量的能量集中到所述源信號(hào)中,并且其中所述多通道所感測(cè)音頻信號(hào)包括近端語音信號(hào)。
26.根據(jù)權(quán)利要求20所述的設(shè)備,進(jìn)一步包括耦合到空間選擇性處理濾波器的第二頻譜對(duì)比加強(qiáng)器,其經(jīng)配置以對(duì)近端語音信號(hào)執(zhí)行頻譜對(duì)比加強(qiáng)操作以產(chǎn)生第二經(jīng)處理語音信號(hào)。
27.根據(jù)權(quán)利要求20所述的設(shè)備,其中所述第二頻譜對(duì)比加強(qiáng)器包括: 第三子帶因子計(jì)算器,其經(jīng)配置以基于來自所述噪聲參考的信息來計(jì)算第三多個(gè)子帶因子; 第四子帶因子計(jì)算器,其經(jīng)配置以基于來自所述遠(yuǎn)端語音信號(hào)的信息來計(jì)算第四多個(gè)子帶因子; 控制元件,其經(jīng)配置以基于將所述第二多個(gè)子帶因子應(yīng)用到所述遠(yuǎn)端語音信號(hào)來產(chǎn)生第二經(jīng)對(duì)比加強(qiáng)信號(hào);以及 混合器,其經(jīng)配置以組合所述第三多個(gè)子帶因子和所述第二經(jīng)對(duì)比加強(qiáng)信號(hào)。
28.一種非易失性計(jì)算機(jī)可讀媒體,包括在由至少一個(gè)處理器執(zhí)行時(shí)使所述至少一個(gè)處理器執(zhí)行一方法的指令,所述指令包含: 在由處理器執(zhí)行時(shí)使所述處理器對(duì)多通道所感測(cè)音頻信號(hào)執(zhí)行空間選擇性處理操作以產(chǎn)生源信號(hào)及噪聲參考的指令;以及 在由處理器執(zhí)行時(shí)使所述處理器在第一頻譜對(duì)比加強(qiáng)器內(nèi)對(duì)語音信號(hào)執(zhí)行第一頻譜對(duì)比加強(qiáng)操作以產(chǎn)生第一經(jīng)處理語音信號(hào)的指令,其中所述語音信號(hào)包括遠(yuǎn)端語音信號(hào)。
29.根據(jù)權(quán)利要求28所述的非易失性計(jì)算機(jī)可讀媒體,其中所述媒體包括在由處理器執(zhí)行時(shí)使所述處理器對(duì)包括所述媒體的裝置用無線方式接收到的信號(hào)進(jìn)行解碼以獲得經(jīng)解碼語音信號(hào)的指令,其中遠(yuǎn)端語音信號(hào)是基于來自所述經(jīng)解碼語音信號(hào)的信息。
30.根據(jù)權(quán)利要求28所述的非易失性計(jì)算機(jī)可讀媒體,其中所述媒體包括: 在由處理器執(zhí)行時(shí)使所述處理器從所述多通道所感測(cè)音頻信號(hào)中消除回音的指令;并且 其中所述在由處理器執(zhí)行時(shí)使所述處理器消除回音的指令經(jīng)配置和設(shè)置以被所述第一經(jīng)處理語音信號(hào)訓(xùn)練。
31.根據(jù)權(quán)利要求28所述的非易失性計(jì)算機(jī)可讀媒體,其中所述媒體包括: 在由處理器執(zhí)行時(shí)使所述處理器基于來自所述噪聲參考的信息,對(duì)所述源信號(hào)執(zhí)行噪聲減少操作以獲得所述遠(yuǎn)端 語音信號(hào)的指令;以及 在由處理器執(zhí)行時(shí)使所述處理器基于所述源信號(hào)與所述遠(yuǎn)端語音信號(hào)之間的關(guān)系來執(zhí)行話音活動(dòng)檢測(cè)操作的指令, 其中所述在由處理器執(zhí)行時(shí)使所述處理器產(chǎn)生第一經(jīng)處理語音信號(hào)的指令經(jīng)配置以基于所述話音活動(dòng)檢測(cè)操作的結(jié)果來產(chǎn)生所述第一經(jīng)處理語音信號(hào)。
32.—種非易失性計(jì)算機(jī)可讀媒體,包括在由至少一個(gè)處理器執(zhí)行時(shí)使所述至少一個(gè)處理器執(zhí)行第一頻譜對(duì)比加強(qiáng)操作的指令,所述指令包括: 在由處理器執(zhí)行時(shí)使所述處理器基于來自所述噪聲參考的信息來計(jì)算第一多個(gè)子帶因子的指令; 在由處理器執(zhí)行時(shí)使所述處理器基于來自遠(yuǎn)端語音信號(hào)的信息來計(jì)算第二多個(gè)子帶因子的指令; 在由處理器執(zhí)行時(shí)使所述處理器通過將所述第二多個(gè)子帶因子應(yīng)用到所述遠(yuǎn)端語音信號(hào)來產(chǎn)生經(jīng)對(duì)比加強(qiáng)信號(hào)的指令;以及 在由處理器執(zhí)行時(shí)使所述處理器組合所述第一多個(gè)子帶因子和所述第一經(jīng)對(duì)比加強(qiáng)信號(hào)的指令。
33.根據(jù)權(quán)利要求28所述的非易失性計(jì)算機(jī)可讀媒體,其中所述在由處理器執(zhí)行時(shí)使所述處理器執(zhí)行空間選擇性處理操作的指令包括在由處理器執(zhí)行時(shí)使所述處理器將所述多通道所感測(cè)音頻信號(hào)的方向性分量的能量集中到所述源信號(hào)中的指令,并且其中所述多通道所感測(cè)音頻信號(hào)包括近端語音信號(hào)。
34.根據(jù)權(quán)利要求28所述的非易失性計(jì)算機(jī)可讀媒體,進(jìn)一步包括在第二頻譜對(duì)比加強(qiáng)器內(nèi)對(duì)近端語音信號(hào)執(zhí)行第二頻譜對(duì)比加強(qiáng)操作以生成第二經(jīng)處理語音信號(hào)。
35.根據(jù)權(quán)利要求34所述的非易失性計(jì)算機(jī)可讀媒體,包括在由至少一個(gè)處理器執(zhí)行時(shí)使所述至少一個(gè)處理器執(zhí)行第二頻譜對(duì)比加強(qiáng)操作的指令,所述指令包括: 在由處理器執(zhí)行時(shí)使所述處理器基于來自所述噪聲參考的信息來計(jì)算第三多個(gè)子帶因子的指令; 在由處理器執(zhí)行時(shí)使所述處理器基于來自所述近端語音信號(hào)的信息來計(jì)算第四多個(gè)子帶因子的指令; 在由處理器執(zhí)行時(shí)使所述處理器通過將所述第四多個(gè)子帶因子應(yīng)用到所述近端語音信號(hào)來產(chǎn)生經(jīng)對(duì)比加強(qiáng)信號(hào)的指令;以及 在由處理器執(zhí)行時(shí)使所述處理器組合所述第三多個(gè)子帶因子和所述第二經(jīng)對(duì)比加強(qiáng)信號(hào)的指 令。
全文摘要
本申請(qǐng)涉及用于頻譜對(duì)比加強(qiáng)的系統(tǒng)、方法、設(shè)備及計(jì)算機(jī)程序產(chǎn)品。本發(fā)明揭示用于基于來自由空間選擇性處理濾波器從多通道所感測(cè)音頻信號(hào)導(dǎo)出的噪聲參考的信息對(duì)語音信號(hào)進(jìn)行的頻譜對(duì)比加強(qiáng)的系統(tǒng)、方法及設(shè)備。
文檔編號(hào)G10L21/0272GK103247295SQ20131021695
公開日2013年8月14日 申請(qǐng)日期2009年5月29日 優(yōu)先權(quán)日2008年5月29日
發(fā)明者杰里米·托曼, 林鴻春, 埃里克·維塞 申請(qǐng)人:高通股份有限公司