專利名稱:用于音頻均衡的系統(tǒng)、方法、裝置、設備和計算機程序產(chǎn)品的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及有源噪聲消除。
背景技術(shù):
有源噪聲消除(ANC,也稱為有源噪聲減少)是一種通過產(chǎn)生作為噪聲波的逆形式 (例如,具有相同電平和反轉(zhuǎn)相位)的波形(也稱為“反相”或“抗噪聲”波形)來有源地減少環(huán)境聲學噪聲的技術(shù)。ANC系統(tǒng)通常使用一個或一個以上麥克風來拾取外部噪聲參考信號,根據(jù)所述噪聲參考信號產(chǎn)生抗噪聲波形,且通過一個或一個以上揚聲器再現(xiàn)所述抗噪聲波形。此抗噪聲波形相消地干擾原始噪聲波以減小到達用戶的耳朵的噪聲的電平。
ANC系統(tǒng)可包括包圍用戶的耳朵的殼體或插入到用戶的耳道中的耳塞。執(zhí)行ANC 的裝置通常封閉用戶的耳朵(例如,閉耳式頭戴受話器)或包括配合在用戶的耳道內(nèi)的耳塞(例如,無線頭戴耳機,例如Bluetooth 頭戴耳機)。在用于通信應用的頭戴受話器中, 所述設備可包括麥克風和揚聲器,其中麥克風用以俘獲用戶的話音以供發(fā)射且揚聲器用以再現(xiàn)所接收的信號。在此情況下,麥克風可安裝在吊桿上,且揚聲器可安裝在耳杯或耳塞中。
有源噪聲消除技術(shù)還可應用于聲音再現(xiàn)裝置(例如頭戴受話器)和個人通信裝置 (例如蜂窩式電話)以減少來自周圍環(huán)境的聲學噪聲。在此些應用中,使用ANC技術(shù)可在傳遞有用聲音信號(例如音樂和遠端話音)時減小到達耳朵的背景噪聲的電平(例如,高達 20分貝)。發(fā)明內(nèi)容
根據(jù)一般配置的一種處理所再現(xiàn)的音頻信號的方法包括基于來自噪聲估計的信息使所再現(xiàn)的音頻信號的至少一個頻率子帶的振幅相對于所述所再現(xiàn)的音頻信號的至少一個其它頻率子帶的振幅升高以產(chǎn)生經(jīng)均衡的音頻信號。此方法還包括使用指向用戶的耳道處的揚聲器來產(chǎn)生基于所述經(jīng)均衡的音頻信號的聲學信號。在此方法中,所述噪聲估計是基于來自由指向所述用戶的所述耳道處的誤差麥克風產(chǎn)生的聲學誤差信號的信息。本文中還揭示包含在由處理器讀取時致使所述處理器執(zhí)行此方法的有形特征的計算機可讀媒體。
根據(jù)一般配置的一種用于處理所再現(xiàn)的音頻信號的設備包括用于基于來自聲學誤差信號的信息產(chǎn)生噪聲估計的裝置;以及用于基于來自噪聲估計的信息使所再現(xiàn)的音頻信號的至少一個頻率子帶的振幅相對于所述所再現(xiàn)的音頻信號的至少一個其它頻率子帶的振幅升高以產(chǎn)生經(jīng)均衡的音頻信號的裝置。此設備還包括揚聲器,其在所述設備的使用期間指向用戶的耳道處以產(chǎn)生基于所述經(jīng)均衡的音頻信號的聲學信號。在此設備中,所述聲學誤差信號是由在所述設備的所述使用期間指向所述用戶的所述耳道處的誤差麥克風產(chǎn)生的。
根據(jù)一般配置的一種用于處理所再現(xiàn)的音頻信號的設備包括回聲消除器,其經(jīng)配置以產(chǎn)生基于來自聲學誤差信號的信息的噪聲估計;以及子帶濾波器陣列,其經(jīng)配置以基于來自噪聲估計的信息使所再現(xiàn)的音頻信號的至少一個頻率子帶的振幅相對于所述所再現(xiàn)的音頻信號的至少一個其它頻率子帶的振幅升高以產(chǎn)生經(jīng)均衡的音頻信號。此設備還包括揚聲器,其在所述設備的使用期間指向用戶的耳道處以產(chǎn)生基于所述經(jīng)均衡的音頻信號的聲學信號。在此設備中,所述聲學誤差信號是由在所述設備的所述使用期間指向所述用戶的所述耳道處的誤差麥克風產(chǎn)生的。
圖IA展示根據(jù)一般配置的裝置DlOO的框圖。
圖IB展示根據(jù)一般配置的設備AlOO的框圖。
圖IC展示音頻輸入級AIlO的框圖。
圖2A展示音頻輸入級AIlO的實施方案AI20的框圖。
圖2B展示音頻輸入級AI20的實施方案AI30的框圖。
圖2C展示可包括在裝置DlOO內(nèi)的選擇器SELlO。
圖3A展示ANC模塊NClO的實施方案NC20的框圖。
圖3B展示包括ANC模塊NC20和回聲消除器EC20的布置的框圖。
圖3C展示可包括在設備AlOO內(nèi)的選擇器SEL20。
圖4展示均衡器EQlO的實施方案EQ20的框圖。
圖5A展示子帶濾波器陣列FA100的實施方案FA120的框圖。
圖5B說明用于雙二次濾波器的轉(zhuǎn)置直接形式II結(jié)構(gòu)。
圖6展示用于雙二次濾波器的一個實例的量值和相位響應曲線圖。
圖7展示用于一組7個雙二次濾波器中的每一者的量值和相位響應。
圖8展示雙二次濾波器的三級級聯(lián)的實例。
圖9A展示裝置DlOO的實施方案DllO的框圖。
圖9B展示設備AlOO的實施方案AllO的框圖。
圖IOA展示噪聲抑制模塊NSlO的實施方案NS20的框圖。
圖IOB展示噪聲抑制模塊NS20的實施方案NS30的框圖。
圖IOC展示設備AllO的實施方案A120的框圖。
圖IlA展示可包括在設備AllO內(nèi)的選擇器SEL30。
圖IlB展示噪聲抑制模塊NS20的實施方案NS50的框圖。
圖IlC展示從噪聲參考點NRPl到耳朵參考點ERP的主要聲學路徑Pl的圖。
圖IlD展示噪聲抑制模塊NS30和NS50的實施方案NS60的框圖。
圖12A展示噪聲功率對頻率的曲線圖。
圖12B展示設備AlOO的實施方案A130的框圖。
圖13A展示設備A130的實施方案A140的框圖。
圖13B展示設備A120和A130的實施方案A150的框圖。
圖14A展示裝置DlOO的多通道實施方案D200的框圖。
圖14B展示音頻輸入級AI30的多個實例AI30v_l、AI30v_2的布置。
圖15Α展示噪聲抑制模塊NS30的多通道實施方案NS130的框圖。
圖15Β展示噪聲抑制模塊NS50的實施方案NS150的框圖。
圖15C展示噪聲抑制模塊NS150的實施方案NS155的框圖。
圖16Α展示噪聲抑制模塊NS60、NS 130和NS155的實施方案NS160的框圖。
圖16Β展示根據(jù)一般配置的裝置D300的框圖。
圖17Α展示根據(jù)一般配置的設備Α300的框圖。
圖17Β展示ANC模塊NC20和NC50的實施方案NC60的框圖。
圖18Α展示包括ANC模塊NC60和回聲消除器EC20的布置的框圖。
圖18Β展示從噪聲參考點NRP2到耳朵參考點ERP的主要聲學路徑Ρ2的圖。
圖18C展示設備Α300的實施方案Α360的框圖。
圖19Α展示設備Α360的實施方案Α370的框圖。
圖19Β展示設備Α370的實施方案Α380的框圖。
圖20展示裝置DlOO的實施方案D400的框圖。
圖2IA展示設備Α400的實施方案Α430的框圖。
圖2IB展示可包括在設備Α430內(nèi)的選擇器SEL40。
圖22展示設備Α400的實施方案Α410的框圖。
圖23展示設備Α410的實施方案Α470的框圖。
圖24展示設備Α410的實施方案Α480的框圖。
圖25展示設備Α480的實施方案Α485的框圖。
圖26展示設備Α380的實施方案Α385的框圖。
圖27展示設備Α120和Α140的實施方案Α540的框圖。
圖28展示設備Α130和Α430的實施方案Α435的框圖。
圖29展示設備Α140的實施方案Α545的框圖。
圖30展示設備Α120的實施方案Α520的框圖。
圖3IA展示根據(jù)一般配置的設備D700的框圖。圖31B展示設備A700的實施方案A710的框圖。圖32A展示設備A710的實施方案A720的框圖。圖32B展示設備A700的實施方案A730的框圖。圖33展示設備A730的實施方案A740的框圖。圖34展示裝置D400的多通道實施方案D800的框圖。圖35展示設備A410和A800的實施方案A810的框圖。圖36展示手持機HlOO的正視圖、后視圖和側(cè)視圖。圖37展示手持機H200的正視圖、后視圖和側(cè)視圖。圖38A到38D展示頭戴耳機H300的各種視圖。圖39展示正佩戴在用戶的右耳處的在使用中的頭戴耳機H300的實例的俯視圖。圖40A展示用于噪聲參考麥克風MRlO的若干候選位置。圖40B展示耳杯EPlO的橫截面圖。圖41A展示在使用中的一對耳塞的實例。圖41B展示耳塞EBlO的正視圖。圖41C展示耳塞EBlO的實施方案EB12的側(cè)視圖。圖42A展示根據(jù)一般配置的方法MlOO的流程圖。圖42B展示根據(jù)一般配置的設備MF100的框圖。圖43A展示根據(jù)一般配置的方法M300的流程圖。圖43B展示根據(jù)一般配置的設備MF300的框圖。
具體實施例方式除非由其上下文明確地限制,否則術(shù)語“信號”在本文中用以指示其普通意義中的 任一者,包括如在導線、總線或其它傳輸媒體上表達的存儲器位置(或存儲器位置集合)的 狀態(tài)。除非由其上下文明確地限制,否則術(shù)語“產(chǎn)生”在本文中用以指示其普通意義中的任 一者,例如計算或以另外方式產(chǎn)生。除非由其上下文明確地限制,否則術(shù)語“計算”在本文 中用以指示其普通意義中的任一者,例如運算、評估、估計和/或從多個值中進行選擇。除 非由其上下文明確地限制,否則術(shù)語“獲得”用以指示其普通意義中的任一者,例如計算、導 出、接收(例如,從外部裝置)和/或檢索(例如,從存儲元件陣列)。除非由其上下文明確 地限制,否則術(shù)語“選擇”用以指示其普通意義中的任一者,例如識別、指示、施加和/或使 用一組兩者或兩者以上中的至少一者以及少于全部。在術(shù)語“包含”用于本描述和權(quán)利要求 書中的情況下,其不排除其它元件或操作。術(shù)語“基于”(如在“A是基于B”中)用以指示 其普通意義中的任一者,包括以下情況(i) “導出”(例如,“B為A的前驅(qū)體”),(ii) “至 少基于”(例如,“A至少基于B”),以及在特定上下文中適當?shù)那闆r下,(iii) “等于”(例 如,“A等于B”或“A與B相同”)。術(shù)語“基于來自……的信息”(如在“A是基于來自B的 信息”中)用以指示其普通意義中的任一者,包括以下情況(i) “基于”(例如,“A是基于 B”)以及“基于……的至少一部分”(例如,“A是基于B的至少一部分”)。類似地,術(shù)語“響 應于”用以指示其普通意義中的任一者,包括“至少響應于”。對多麥克風音頻感測裝置的麥克風的“位置”的參考指示麥克風的聲學敏感面的中心的位置,除非上下文另有指示。術(shù)語“通道”有時用以指示信號路徑,且在其它時候用以指示由此類路徑攜載的信號,這根據(jù)特定上下文而定。除非另有指示,否則術(shù)語“系列”用以指示兩個或兩個以上項目的序列。術(shù)語“對數(shù)”用以指示以10為底數(shù)的對數(shù),但此運算延伸到其它底數(shù)屬于本發(fā)明的范圍內(nèi)。術(shù)語“頻率分量”用以指示信號的一組頻率或頻帶當中的一者,例如信號的頻域表示的樣本(或“頻段(例如,通過快速傅里葉變換產(chǎn)生) 或信號的子帶(例如,巴克標度或梅爾標度子帶)。
除非另有指示,否則對具有特定特征的設備的操作的任何揭示內(nèi)容還明確地既定揭示具有類似特征的方法(且反之亦然),且對根據(jù)特定配置的設備的操作的任何揭示內(nèi)容還明確地既定揭示根據(jù)類似配置的方法(且反之亦然)。術(shù)語“配置”可在參考方法、設備和/或系統(tǒng)時使用,如由其特定上下文指示。術(shù)語“方法”、“過程”、“程序”和“技術(shù)”一般地且可互換地使用,除非特定上下文另有指示。術(shù)語“設備”和“裝置”也一般地且可互換地使用,除非特定上下文另有指示。術(shù)語“元件”和“模塊”通常用以指示較大配置的一部分。 除非由其上下文明確地限制,否則術(shù)語“系統(tǒng)”在本文中用以指示其普通意義中的任一者, 包括“交互以服務共同目的的元件的群組”。任何以引用的方式并入文獻的一部分還應理解為并入所述部分內(nèi)所提及的術(shù)語或變量的定義(其中此些定義出現(xiàn)在文獻的其它地方), 并且并入所并入部分中所提及的任何圖式。
術(shù)語“譯碼器”、“編解碼器”和“譯碼系統(tǒng)”可互換地使用以指示包括至少一個經(jīng)配置以接收并編碼音頻信號的幀(可能在一個或一個以上預處理操作(例如感知加權(quán)和/ 或其它濾波操作)之后)的編碼器和經(jīng)配置以產(chǎn)生所述幀的經(jīng)解碼表示的對應解碼器的系統(tǒng)。此編碼器和解碼器通常部署在通信鏈路的相反終端處。為了支持全雙工通信,編碼器和解碼器兩者的實例通常部署在此類鏈路的每一末端處。
在此描述中,術(shù)語“所感測的音頻信號”指示經(jīng)由一個或一個以上麥克風接收的信號,且術(shù)語“所再現(xiàn)的音頻信號”指示根據(jù)從存儲裝置檢索和/或經(jīng)由通往另一裝置的有線或無線連接接收的信息再現(xiàn)的信號。音頻再現(xiàn)裝置(例如通信或重放裝置)可經(jīng)配置以將所再現(xiàn)的音頻信號輸出到所述裝置的一個或一個以上揚聲器?;蛘?,此類裝置可經(jīng)配置以將所再現(xiàn)的音頻信號輸出到耳承、其它頭戴耳機或經(jīng)由導線或以無線方式耦合到所述裝置的外部揚聲器。參看用于話音通信的收發(fā)器應用(例如電話),所感測的音頻信號為將由收發(fā)器發(fā)射的近端信號,且所再現(xiàn)的音頻信號為由收發(fā)器接收(例如,經(jīng)由無線通信鏈路)的遠端信號。參看移動音頻再現(xiàn)應用(例如所記錄的音樂、視頻或語音(例如,經(jīng)MP3編碼的音樂文件、電影、視頻剪輯、有聲讀物、播客)的重放或所述內(nèi)容的串流),所再現(xiàn)的音頻信號為正被重放或串流的音頻信號。
用于話音通信的頭戴耳機(例如,Bluetooth 頭戴耳機)通常含有用于在用戶的一只耳朵處再現(xiàn)遠端音頻信號的揚聲器和用于接收用戶的話音的主要麥克風。揚聲器通常佩戴在用戶的耳朵處,且麥克風布置在頭戴耳機內(nèi)以便在使用期間安置以按可接受地高的 SNR接收用戶的話音。麥克風通常位于(例如)佩戴在用戶的耳朵處的外殼內(nèi),從此類外殼朝向用戶的嘴巴延伸的吊桿或其它突出部分上,或載運去往和來自蜂窩式電話的音頻信號的軟線上。頭戴耳機還可包括位于用戶的耳朵處的一個或一個以上額外次要麥克風,其可用于改善主要麥克風信號中的SNR。頭戴耳機與蜂窩式電話(例如,手持機)之間的音頻信息(以及可能,控制信息,例如電話掛機狀態(tài))的傳送可經(jīng)由有線或無線的鏈路來執(zhí)行。
可能需要結(jié)合所要音頻信號的再現(xiàn)來使用ANC。舉例來說,用于聽音樂的聽筒或頭戴受話器或用以在電話呼叫期間再現(xiàn)遠端說話者的話音的無線頭戴耳機(例如, Bluetooth 或其它通信頭戴耳機)還可經(jīng)配置以執(zhí)行ANC。此類裝置可經(jīng)配置以將所再現(xiàn)的音頻信號(例如,音樂信號或所接收的電話呼叫)與經(jīng)布置以將所得音頻信號朝向用戶的耳朵引導的揚聲器的上游的抗噪聲信號進行混頻。
環(huán)境噪聲可影響所再現(xiàn)的音頻信號的可懂度而不管ANC操作。在一個此類實例中,ANC操作可在較高頻率處比在較低頻率處效率低,使得在較高頻率處的環(huán)境噪聲可仍影響所再現(xiàn)的音頻信號的可懂度。在另一此類實例中,ANC操作的增益可為有限的(例如,以確保穩(wěn)定性)。在又一此類實例中,可需要僅在用戶的一只耳朵處使用執(zhí)行音頻再現(xiàn)和ANC 的裝置(例如,無線頭戴耳機,例如Bluetooth 頭戴耳機),使得由用戶的另一只耳朵聽到的環(huán)境噪聲可影響所再現(xiàn)的音頻信號的可懂度。在這些和其它情況下,除了執(zhí)行ANC操作之外,還可能需要修改所再現(xiàn)的音頻信號的頻譜以提升可懂度。
圖IA展示根據(jù)一般配置的裝置DlOO的框圖。裝置DlOO包括誤差麥克風ME10,其經(jīng)配置以在裝置DlOO的使用期間指向用戶的耳朵的耳道處且響應于所感測的聲學誤差而產(chǎn)生誤差麥克風信號SME10。裝置DlOO還包括音頻輸入級AIlO的實例AllOe,其經(jīng)配置以產(chǎn)生聲學誤差信號SAE10 (也稱為“殘余”或“殘余誤差”信號),所述信號是基于來自誤差麥克風信號SME10的信息且描述由誤差麥克風MElO感測的聲學誤差。裝置D100還包括經(jīng)配置以基于來自所再現(xiàn)的音頻信號SRA10的信息和來自聲學誤差信號SAE10的信息而產(chǎn)生音頻輸出信號SA010的設備A100。
裝置D100還包括音頻輸出級A010,其經(jīng)配置以基于音頻輸出信號SA010而產(chǎn)生揚聲器驅(qū)動信號S010 ;以及揚聲器LS10,其經(jīng)配置以在裝置D100的使用期間指向用戶的耳朵處且響應于揚聲器驅(qū)動信號S010而產(chǎn)生聲學信號。音頻輸出級A010可經(jīng)配置以對音頻輸出信號SA010執(zhí)行一個或一個以上后處理操作(例如,濾波、放大、從數(shù)字轉(zhuǎn)換到模擬、阻抗匹配等)以產(chǎn)生揚聲器驅(qū)動信號S010。
裝置D100可經(jīng)實施以使得誤差麥克風MElO和揚聲器LSlO在裝置D100的使用期間佩戴在用戶的頭部上或用戶的耳朵中(例如,作為頭戴耳機,例如用于話音通信的無線頭戴耳機)。或者,裝置D100可經(jīng)實施以使得誤差麥克風MElO和揚聲器LSlO在裝置D100 的使用期間固持到用戶的耳朵(例如,作為電話手持機,例如蜂窩式電話手持機)。圖36、37、38A、40B和41B展示誤差麥克風MElO和揚聲器LSlO的放置的若干實例。
圖IB展示設備A100的框圖,所述設備A100包括經(jīng)配置以基于來自聲學誤差信號 SAE10的信息而產(chǎn)生抗噪聲信號SAN10的ANC模塊NC10。設備A100還包括均衡器EQ10, 其經(jīng)配置以根據(jù)噪聲估計SNE10對所再現(xiàn)的音頻信號SRA10執(zhí)行均衡操作以產(chǎn)生經(jīng)均衡的音頻信號SEQ10,其中噪聲估計SNE10是基于來自聲學誤差信號SAE10的信息。設備A100 還包括混頻器MX10,其經(jīng)配置以將抗噪聲信號SAN10和經(jīng)均衡的音頻信號SEQ10進行組合 (例如,混頻)以產(chǎn)生音頻輸出信號SA010。
音頻輸入級Al IOe將通常經(jīng)配置以對誤差麥克風信號SME10執(zhí)行一個或一個以上預處理操作以獲得聲學誤差信號SAE10。在典型情況下,舉例來說,誤差麥克風MElO將經(jīng)配置以產(chǎn)生模擬信號,而設備A100可經(jīng)配置以對數(shù)字信號進行操作,使得預處理操作將包括模/數(shù)轉(zhuǎn)換。可由音頻輸入級AIlOe在模擬和/或數(shù)字域中對麥克風通道執(zhí)行的其它預處14理操作的實例包括帶通濾波(例如,低通濾波)。
音頻輸入級AIlOe可實現(xiàn)為根據(jù)一般配置的音頻輸入級AIlO的實例,如圖IC的框圖中展示,其經(jīng)配置以對麥克風輸入信號SMIlO執(zhí)行一個或一個以上預處理操作以產(chǎn)生對應的麥克風輸出信號SM010。此些預處理操作可包括(不限于)阻抗匹配、模/數(shù)轉(zhuǎn)換、 增益控制和/或在模擬和/或數(shù)字域中的濾波。
音頻輸入級AIlOe可實現(xiàn)為音頻輸入級AIlO的實施方案AI20的實例,如圖IC的框圖中展示,其包括模擬預處理級P10。在一個實例中,級PlO經(jīng)配置以對麥克風輸入信號 SMIlO (例如,誤差麥克風信號SME10)執(zhí)行高通濾波操作(例如,用50、100或200Hz的截止頻率)。
可能需要音頻輸入級AIlO產(chǎn)生麥克風輸出信號SM010作為數(shù)字信號,也就是說, 作為樣本序列。舉例來說,音頻輸入級AI20包括模/數(shù)轉(zhuǎn)換器(ADC)CIO,其經(jīng)布置以對經(jīng)預處理的模擬信號進行取樣。用于聲學應用的典型取樣速率包括8kHZ、12kHz、16kHz和在從約8到約16kHz的范圍內(nèi)的其它頻率,但還可使用高達約44. 1、48或192kHz的取樣速率。
音頻輸入級AIlOe可實現(xiàn)為音頻輸入級AI20的實施方案AI30的實例,如圖IC的框圖中展示。音頻輸入級AI30包括數(shù)字預處理級P20,其經(jīng)配置以對對應的數(shù)字化通道執(zhí)行一個或一個以上預處理操作(例如,增益控制、頻譜整形、噪聲減少和/或回聲消除)。
裝置DlOO可經(jīng)配置以經(jīng)由導線或以無線方式從音頻再現(xiàn)裝置(例如通信或重放裝置)接收所再現(xiàn)的音頻信號SRA10。所再現(xiàn)的音頻信號SRAlO的實例包括遠端或下行鏈路音頻信號(例如所接收的電話呼叫)和經(jīng)預記錄的音頻信號(例如正從存儲媒體再現(xiàn)的信號(例如,正從音頻或多媒體文件解碼的信號))。
裝置DlOO可經(jīng)配置以在遠端語音信號和經(jīng)解碼音頻信號當中進行選擇且/或?qū)ζ溥M行混頻以產(chǎn)生所再現(xiàn)的音頻信號SRA10。舉例來說,裝置DlOO可包括選擇器SEL10, 如圖2C中展示,其經(jīng)配置以通過從來自語音解碼器SDlO的遠端語音信號SFSlO和來自音頻源ASlO的經(jīng)解碼音頻信號SDAlO當中進行選擇(例如,根據(jù)用戶的開關(guān)致動)來產(chǎn)生所再現(xiàn)的音頻信號SRA10。可包括在裝置DlOO內(nèi)的音頻源ASlO可經(jīng)配置以用于經(jīng)壓縮音頻或視聽信息(例如根據(jù)標準壓縮格式(例如,運動圖片專家小組(MPEG)-I音頻層3 (MP3)、 MPEG-4第14部分(MP4)、視窗媒體音頻/視頻(WMA/WMV)的版本(華盛頓州雷蒙德市微軟公司)、高級音頻譯碼(AAC)、國際電信聯(lián)盟(ITU)-T H. 264等等)編碼的文件或流)的重放。
設備AlOO可經(jīng)配置以包括自動增益控制(AGC)模塊,其經(jīng)布置以壓縮均衡器EQlO 上游的所再現(xiàn)的音頻信號SRAlO的動態(tài)范圍。此模塊可經(jīng)配置以提供凈空高度定義和/或主音量設置(例如,以控制子帶增益因子的上部和/或下部界限)?;蛘呋蛄硗?,設備AlOO 可經(jīng)配置以包括峰值限制器,其經(jīng)配置并布置以限制均衡器EQlO的聲學輸出電平(例如, 以限制經(jīng)均衡的音頻信號SEQlO的電平)。
設備AlOO還包括混頻器MX10,其經(jīng)配置以將抗噪聲信號SANlO和經(jīng)均衡的音頻信號SEQlO進行組合(例如,混頻)以產(chǎn)生音頻輸出信號SA010。混頻器MXlO還可經(jīng)配置以通過將抗噪聲信號SAN10、經(jīng)均衡的音頻信號SEQlO或所述兩個信號的混合物從數(shù)字形式轉(zhuǎn)換為模擬形式且/或通過對此類信號執(zhí)行任何其它所要音頻處理操作(例如,濾波、放大、施加增益因子和/或控制此類信號的電平)來產(chǎn)生音頻輸出信號SA010。
設備AlOO包括ANC模塊NC10,其經(jīng)配置以基于來自誤差麥克風信號SMElO的信息而產(chǎn)生抗噪聲信號SANlO (例如,根據(jù)任何所要數(shù)字和/或模擬ANC技術(shù))?;趤碜月晫W誤差號的息的ANC方法還稱為反饋ANC方法。
可能需要將ANC模塊NClO實施為ANC濾波器FC10,其通常經(jīng)配置以反轉(zhuǎn)輸入信號 (例如,聲學誤差信號SAE10)的相位以產(chǎn)生抗噪聲信號SA10,且可為固定或自適應的。通常需要配置ANC濾波器FClO以產(chǎn)生抗噪聲信號SANlO使其在振幅中與聲學噪聲匹配且在相位中與聲學噪聲相反。可執(zhí)行例如時間延遲、增益放大和均衡或低通濾波等信號處理操作以實現(xiàn)最佳噪聲消除??赡苄枰渲肁NC濾波器FClO以對信號進行高通濾波(例如,以衰減高振幅低頻率聲學信號)。另外或或者,可能需要配置ANC濾波器FClO以對信號進行低通濾波(例如,使得ANC效應在高頻率處隨頻率逐漸減小)。因為抗噪聲信號SANlO應在聲學噪聲從麥克風行進到致動器(即,揚聲器LS10)時可用,所以由ANC濾波器FClO引起的處理延遲應不超過非常短的時間(通常約30到60微秒)。
可由ANC濾波器FClO對聲學誤差信號SAElO執(zhí)行以產(chǎn)生抗噪聲信號SAlO的ANC 操作的實例包括相位反轉(zhuǎn)濾波操作、最小均方(LMS)濾波操作、LMS的變型或衍生物(例如, X濾波LMS,如在第2006/0069566號美國專利申請公開案(納賈爾(Nadjar)等人)和其它地方中所描述)、輸出白化反饋ANC方法和數(shù)字虛擬地球算法(例如,如在第5,105,377號美國專利(齊格勒(Ziegler))中所描述)。ANC濾波器FClO可經(jīng)配置以在時域中且/或在變換域(例如,傅里葉變換或其它頻域)中執(zhí)行ANC操作。
ANC濾波器FClO還可經(jīng)配置以對聲學誤差信號SAElO執(zhí)行其它處理操作(例如, 對誤差信號進行整合、對誤差信號進行低通濾波、對頻率響應進行均衡、對增益進行放大或衰減和/或?qū)ρ舆t進行匹配或減到最小)以產(chǎn)生抗噪聲信號SANlO。ANC濾波器FClO可經(jīng)配置以在脈沖密度調(diào)制(PDM)或其它高取樣速率域中產(chǎn)生抗噪聲信號SAN10,且/或在比聲學誤差信號SAElO的取樣速率低的速率下調(diào)適其濾波器系數(shù),如2011年I月13日公開的第2011/0007907號美國公開專利申請案(帕克(Park)等人)中所描述。
ANC濾波器FClO可經(jīng)配置以具有隨時間固定的濾波器狀態(tài)或者可隨時間調(diào)適的濾波器狀態(tài)。自適應ANC濾波操作可通常在預期范圍的操作條件下實現(xiàn)比固定ANC濾波操作好的性能。與固定ANC方法相比,舉例來說,自適應ANC方法可通常通過對環(huán)境噪聲和/ 或聲學路徑的改變作出響應來實現(xiàn)較好噪聲消除結(jié)果。此些改變可包括裝置DlOO (例如, 蜂窩式電話手持機)在所述裝置的使用期間相對于耳朵的移動,其可通過增大或減少聲學泄漏來改變聲學負載。
可能需要將誤差麥克風MElO安置在由揚聲器LSlO產(chǎn)生的聲學場內(nèi)。舉例來說, 裝置DlOO可經(jīng)構(gòu)造為反饋ANC裝置,使得誤差麥克風MElO經(jīng)定位以感測封閉用戶的耳道的入口且揚聲器LSlO被驅(qū)動到其中的腔室內(nèi)的聲音??赡苄枰獙⒄`差麥克風MElO與揚聲器LSlO —起安置在頭戴受話器的耳杯或耳塞的指向耳膜部分內(nèi)。還可能需要使誤差麥克風MElO與環(huán)境噪聲聲學隔離。
耳道中的聲學信號有可能受正由揚聲器LSlO再現(xiàn)的所要音頻信號(例如,遠端或經(jīng)解碼音頻內(nèi)容)支配??赡苄枰狝NC模塊NClO包括回聲消除器以消除從揚聲器LSlO到誤差麥克風MElO的聲學耦合。圖3A展示包括回聲消除器EClO的ANC模塊NClO的實施方案 NC20的框圖。回聲消除器EClO經(jīng)配置以根據(jù)回聲參考信號SERlO (例如,經(jīng)均衡的音頻信號SEQ10)對聲學誤差信號SAElO執(zhí)行回聲消除操作,以產(chǎn)生回聲經(jīng)清除的噪聲信號SEC10。 回聲消除器EClO可實現(xiàn)為固定濾波器(例如,IIR濾波器)?;蛘?,回聲消除器EClO可實施為自適應濾波器(例如,對聲學負載/路徑/泄漏的改變作出自適應的FIR濾波器)。
可能需要設備AlOO包括另一回聲消除器,其可為自適應的且/或可比將適合于 ANC操作更積極地調(diào)諧。圖3B展示包括此回聲消除器EC20的布置的框圖,所述回聲消除器 EC20經(jīng)配置并布置以根據(jù)回聲參考信號SERlO (例如,經(jīng)均衡的音頻信號SEQ10)對聲學誤差信號SAElO執(zhí)行回聲消除操作,以產(chǎn)生第二回聲經(jīng)清除的信號SEC20,所述第二回聲經(jīng)清除的信號SEC20可由均衡器EQlO接收作為噪聲估計SNE10。
設備AlOO還包括均衡器EQlO,其經(jīng)配置以基于來自噪聲估計SNElO的信息而修改所再現(xiàn)的音頻信號SRAlO的頻譜,以產(chǎn)生經(jīng)均衡的音頻信號SEQ10。均衡器EQlO可經(jīng)配置以通過基于來自噪聲估計SNElO的信息使信號SRAlO的至少一個子帶相對于信號SRlO的另一子帶升高(或衰減)來使信號SRAlO均衡??赡苄枰馄鱁QlO保持不活動,直到所再現(xiàn)的音頻信號SRAlO可用為止(例如,直到用戶起始或接收電話呼叫或者接入媒體內(nèi)容或話音辨識系統(tǒng)提供信號SRAlO為止)。
均衡器EQlO可經(jīng)布置以接收噪聲估計SNElO作為抗噪聲信號SAN10、回聲經(jīng)清除的噪聲信號SEClO和回聲經(jīng)清除的噪聲信號SEC20中的任一者。設備AlOO可經(jīng)配置以包括如圖3C中展示的選擇器SEL20(例如,多路復用器)以支持在兩個或兩個以上此類噪聲估計當中進行運行時選擇(例如,基于回聲消除器EClO的性能的測量的當前值和/或回聲消除器EC20的性能的測量的當前值)。
圖4展示均衡器EQlO的實施方案EQ20的框圖,所述實施方案EQ20包括第一子帶信號產(chǎn)生器SGlOOa和第二子帶信號產(chǎn)生器SGlOOb。第一子帶信號產(chǎn)生器SGlOOa經(jīng)配置以基于來自所再現(xiàn)的音頻信號SRlO的信息而產(chǎn)生一組第一子帶信號,且第二子帶信號產(chǎn)生器SGlOOb經(jīng)配置以基于來自噪聲估計NlO的信息而產(chǎn)生一組第二子帶信號。均衡器EQ20還包括第一子帶功率估計計算器EClOOa和第二子帶功率估計計算器EClOOa。 第一子帶功率估計計算器EClOOa經(jīng)配置以產(chǎn)生一組第一子帶功率估計,其每一者基于來自第一子帶信號中的對應一者的信息,且第二子帶功率估計計算器EClOOb經(jīng)配置以產(chǎn)生一組第二子帶功率估計,其每一者基于來自第二子帶信號中的對應一者的信息。均衡器EQ20還包括子帶增益因子計算器GC100,其經(jīng)配置以基于對應第一子帶功率估計與對應第二子帶功率估計之間的關(guān)系而計算所述子帶中的每一者的增益因子;以及子帶濾波器陣列FA100,其經(jīng)配置以根據(jù)子帶增益因子對所再現(xiàn)的音頻信號SRlO進行濾波以產(chǎn)生經(jīng)均衡的音頻信號SQ10。均衡器EQlO的實施方案和操作的另外實例可在(例如)2010年I月21日公開的題目為“用于增強型可懂度的系統(tǒng)、方法、設備和計算機程序產(chǎn)品(SYSTEMS, METHODS, APPARATUS, AND C0MPUTERPR0GRAM PRODUCTS FOR ENHANCED INTELLIGIBILITY) ”的第2010/0017205號美國公開專利申請案中找到。
子帶信號產(chǎn)生器SGlOOa和SGlOOb中的任一者或兩者可經(jīng)配置以通過根據(jù)所要子帶劃分方案將頻域輸入信號的頻段分組為q個子帶來產(chǎn)生一組q個子帶信號?;蛘撸訋盘柈a(chǎn)生器SGlOOa和SGlOOb中的任一者或兩者可經(jīng)配置以根據(jù)所要子帶劃分方案對時域輸入信號進行濾波(例如,使用子帶濾波器組)以產(chǎn)生一組q個子帶信號。子帶劃分方案可為均一的,使得每一頻段具有大致上相同的寬度(例如,在約10%內(nèi))。或者,子帶劃分方案可為非均一的,例如超越方案(例如,基于巴克標度的方案)或?qū)?shù)方案(例如,基于梅爾標度的方案)。在一個實例中,一組7個巴克標度子帶的邊緣對應于頻率20、300、630、 1080、1720、2700、4400和7700Hz。此子帶布置可用于具有16kHz的取樣速率的寬帶語音處理系統(tǒng)中。在此劃分方案的其它實例中,省略下部子帶以獲得六子帶布置,且/或?qū)⒏哳l率界限從7700Hz增加到8000Hz。子帶劃分方案的另一實例為四帶準巴克方案300_510Hz、 510-920Hz、920-1480Hz和1480_4000Hz。此子帶布置可用于具有8kHz的取樣速率的窄帶語音處理系統(tǒng)中。
子帶功率估計計算器EClOOa和EClOOb中的每一者經(jīng)配置以接收相應組的子帶信號且產(chǎn)生對應組的子帶功率估計(通常針對所再現(xiàn)的音頻信號SRlO和噪聲估計NlO的每一幀)。子帶功率估計計算器EClOOa和EClOOb中的任一者或兩者可經(jīng)配置以將每一子帶功率估計計算為用于所述幀的對應子帶信號的值的平方的總和?;蛘?,子帶功率估計計算器EClOOa和EClOOb中的任一者或兩者可經(jīng)配置以將每一子帶功率估計計算為用于所述幀的對應子帶信號的值的量值的總和。
可能需要實施子帶功率估計計算器EClOOa和EClOOb中的任一者或兩者以針對用于每一幀的整個對應信號計算功率估計(例如,作為平方或量值的總和),且使用此功率估計來正規(guī)化用于所述幀的子帶功率估計。此正規(guī)化可通過將每一子帶總和除以信號總和或從每一子帶總和減去信號總和來執(zhí)行。(在相除的情況下,可能需要將較小值相加到所述信號總和以避免除以零。)或者或另外,可能需要實施子帶功率估計計算器EClOOa和EClOOb 中的任一者或兩者以執(zhí)行子帶功率估計的時間平滑操作。
子帶增益因子計算器GC100經(jīng)配置以基于對應的第一和第二子帶功率估計而針對所再現(xiàn)的音頻信號SRAlO的每一幀計算一組增益因子。舉例來說,子帶增益因子計算器 GC100可經(jīng)配置以將每一增益因子計算為噪聲子帶功率估計與對應信號子帶功率估計的比率。在此情況下,可能需要將較小值相加到信號子帶功率估計以避免除以零。
子帶增益因子計算器GC100還可經(jīng)配置以對所述功率比率中的一者或一者以上 (可能全部)中的每一者執(zhí)行時間平滑操作??赡苄枰藭r間平滑操作經(jīng)配置以允許增益因子值在噪聲程度正增加時較快速改變且/或在噪聲程度正減小時抑制增益因子值的快速改變。此類配置可有助于抵抗音質(zhì)時間掩蔽效應,其中大聲的噪聲持續(xù)掩蔽所要聲音,即使在所述噪聲已經(jīng)結(jié)束之后也是如此。因此,可能需要根據(jù)當前與先前增益因子值之間的關(guān)系來變化平滑因子的值(例如,在增益因子的當前值小于先前值時執(zhí)行較多平滑,且在增益因子的當前值大于先前值時執(zhí)行較少平滑)。
或者或另外,子帶增益因子計算器GC100可經(jīng)配置以向所述子帶增益因子中的一者或一者以上(可能全部)施加上部界限和/或下部界限。這些界限中的每一者的值可為固定的?;蛘?,這些界限中的任一者或兩者的值可根據(jù)(例如)用于均衡器EQlO的所要凈空高度和/或經(jīng)均衡的音頻信號SEQlO的當前音量(例如,音量控制信號的當前用戶控制值)來調(diào)適?;蛘呋蛄硗猓@些界限中的任一者或兩者的值可基于來自所再現(xiàn)的音頻信號 SRAlO的信息,例如所再現(xiàn)的音頻信號SRAlO的當前電平。
可能需要配置均衡器EQlO以補償可由子帶重疊引起的過度升高。舉例來說,子帶增益因子計算器GC100可經(jīng)配置以減小中頻率子帶增益因子中的一者或一者以上的值(例如,包括頻率fs/4的子帶,其中fs指示所再現(xiàn)的音頻信號SRAlO的取樣頻率)。子帶增益因子計算器GClOO的此實施方案可經(jīng)配置以通過將子帶增益因子的當前值乘以具有小于I的值的縮放因子來執(zhí)行所述減小。子帶增益因子計算器GC100的此實施方案可經(jīng)配置以針對待縮小的每一子帶增益因子使用同一縮放因子或者針對待縮小的每一子帶增益因子使用不同縮放因子(例如,基于對應子帶與一個或一個以上鄰近子帶的重疊的程度)。另外或在替代方案中,可能需要配置均衡器EQlO以增加高頻率子帶中的一者或一者以上的升高的程度。舉例來說,可能需要配置子帶增益因子計算器GC100以確保所再現(xiàn)的音頻信號SRAlO的一個或一個以上高頻率子帶(例如,最高子帶)的放大不低于中頻率子帶(例如,包括頻率fs/4的子帶,其中fs指示所再現(xiàn)的音頻信號SRAlO的取樣頻率)的放大。在一個此類實例中,子帶增益因子計算器GC100經(jīng)配置以通過將中頻率子帶的子帶增益因子的當前值乘以大于I的縮放因子來計算高頻率子帶的子帶增益因子的當前值。在另一此類實例中,子帶增益因子計算器GC100經(jīng)配置以將高頻率子帶的子帶增益因子的當前值計算為以下兩者中的最大值(A)從所述子帶的功率比率所計算的當前增益因子值;以及(B)通過將中頻率子帶的子帶增益因子的當前值乘以大于I的縮放因子來獲得的值。 子帶濾波器陣列FA100經(jīng)配置以將所述子帶增益因子中的每一者施加到所再現(xiàn)的音頻信號SRAlO的對應子帶以產(chǎn)生經(jīng)均衡的音頻信號SEQ10。子帶濾波器陣列FA100可經(jīng)實施以包括帶通濾波器陣列,每一帶通濾波器經(jīng)配置以將子帶增益因子中的相應一者施加到所再現(xiàn)的音頻信號SRAlO的對應子帶。此陣列中的濾波器可并聯(lián)且/或串聯(lián)地布置。圖5A展示子帶濾波器陣列FA100的實施方案FA120的框圖,其中帶通濾波器F30-1到F30_q經(jīng)布置以通過串聯(lián)地(即,在級聯(lián)中,使得每一濾波器F30-k經(jīng)布置以對濾波器F30-(k-l)的輸出進行濾波,其中2 < k < q)根據(jù)子帶增益因子對所再現(xiàn)的音頻信號SRAlO進行濾波來將子帶增益因子G(I)到G(q)中的每一者施加到所再現(xiàn)的音頻信號SRAlO的對應子帶。濾波器F30-1到F30_q中的每一者可經(jīng)實施以具有有限脈沖響應(FIR)或無限脈沖響應(IIR)。舉例來說,濾波器F30-1到F30_q中的一者或一者以上(可能全部)中的每一者可經(jīng)實施為二階IIR區(qū)段或“雙二次”。雙二次的轉(zhuǎn)移函數(shù)可表達為
ΓnHl \ K + Λ,: 1 +/>,:…//(:) = 〒—^^——(I)
I +a,r + α ζ '可能需要使用轉(zhuǎn)置直接形式II實施每一雙二次,尤其是針對均衡器EQlO的浮點實施方案。圖5Β說明用于濾波器F30-1到F30_q中的一者F30_i的雙二次實施方案的轉(zhuǎn)置直接形式II結(jié)構(gòu)。圖6展示濾波器F30-1到F30_q中的一者的雙二次實施方案的一個實例的量值和相位響應曲線圖。子帶濾波器陣列FA120可實施為雙二次的級聯(lián)。此實施方案還可被稱為雙二次IIR濾波器級聯(lián)、二階IIR區(qū)段或濾波器的級聯(lián)或一系列級聯(lián)的子帶IIR雙二次。可能需要使用轉(zhuǎn)置直接形式II來實施每一雙二次,尤其是針對均衡器EQlO的浮點實施方案??赡苄枰獮V波器F30-1到F30_q的通帶表示將所再現(xiàn)的音頻信號SRAlO的帶寬劃分為一組非均一子帶(例如,使得所述濾波器通帶中的兩者或兩者以上具有不同寬度)而非一組均一子帶(例如,使得濾波器通帶具有相等寬度)??赡苄枰訋V波器陣列FA120施加相同子帶劃分方案作為第一子帶信號產(chǎn)生器SGlOOa的時域?qū)嵤┓桨傅淖訋V波器組和/或第二子帶信號產(chǎn)生器SGlOOb的時域?qū)嵤┓桨傅淖訋V波器組??缮踔潦褂孟嗤M件濾波器作為所述子帶濾波器組(例如,在不同時間且使用不同增益因子值)來實施子帶濾波器陣列FA120,但應注意,所述濾波器通常在子帶信號產(chǎn)生器SGlOOa和SGlOOb的此些實施方案中并聯(lián)地(即,個別地)而非如在子帶濾波器陣列FA120中串聯(lián)地施加到輸入信號。圖7展示用于如上文所描述的巴克標度子帶劃分方案的子帶濾波器陣列FA120的實施方案中的一組七個雙二次中的每一者的量值和相位響應。子帶增益因子G (I)到G(q)中的每一者可用以當濾波器被配置為子帶濾波器陣列FA120時更新濾波器F30-1到F30_q中的對應一者的一個或一個以上濾波器系數(shù)值。在此情況下,可能需要配置濾波器F30-1到F30_q中的一者或一者以上(可能全部)中的每一者以使得其頻率特性(例如,其通帶的中心頻率和寬度)為固定的且其增益為可變的。可通過僅變化前饋系數(shù)(例如,在以上雙二次表達式(I)中的系數(shù)I^b1和匕)中的一者或一者以上的值來針對FIR或IIR濾波器實施此類技術(shù)。在一個實例中,通過將偏移g相加到前饋系數(shù)k且從前饋系數(shù)b2減去相同偏移g以獲得以下轉(zhuǎn)移函數(shù)來變化濾波器F30-1到F30-q中的一者F30-i的雙二次實施方案的增益
權(quán)利要求
1.一種處理所再現(xiàn)的音頻信號的方法,所述方法包含在經(jīng)配置以處理音頻信號的裝置內(nèi)執(zhí)行以下動作中的每一者基于來自噪聲估計的信息,使所述所再現(xiàn)的音頻信號的至少一個頻率子帶的振幅相對于所述所再現(xiàn)的音頻信號的至少一個其它頻率子帶的振幅升高以產(chǎn)生經(jīng)均衡的音頻信號; 以及使用指向用戶的耳道處的揚聲器來產(chǎn)生基于所述經(jīng)均衡的音頻信號的聲學信號,其中所述噪聲估計是基于來自由指向所述用戶的所述耳道處的誤差麥克風產(chǎn)生的聲學誤差信號的信息。
2.根據(jù)權(quán)利要求I所述的方法,其中所述方法包含向所感測的噪聲信號施加轉(zhuǎn)移函數(shù)以產(chǎn)生所述噪聲估計,其中所述轉(zhuǎn)移函數(shù)是基于來自所述聲學誤差信號的所述信息。
3.根據(jù)權(quán)利要求2所述的方法,其中所述所感測的噪聲信號是基于由位于所述用戶的頭部的側(cè)面處且指向遠離所述頭部的噪聲參考麥克風產(chǎn)生的信號。
4.根據(jù)權(quán)利要求2所述的方法,其中所述所感測的噪聲信號是基于由位于比所述聲學誤差麥克風更靠近所述用戶的嘴巴處的話音麥克風產(chǎn)生的信號。
5.根據(jù)權(quán)利要求2所述的方法,其中所述方法包括對所述所再現(xiàn)的音頻信號執(zhí)行活動檢測操作;以及基于所述執(zhí)行活動檢測操作的結(jié)果,更新所述轉(zhuǎn)移函數(shù)。
6.根據(jù)權(quán)利要求I到5中任一權(quán)利要求所述的方法,其中所述方法包括對基于所述聲學誤差信號的信號執(zhí)行回聲消除操作,其中所述回聲消除操作是基于基于所述經(jīng)均衡的音頻信號的回聲參考信號,且其中所述噪聲參考信號是基于所述回聲消除操作的結(jié)果。
7.根據(jù)權(quán)利要求I到6中任一權(quán)利要求所述的方法,其中所述方法包括計算在所述用戶的嘴巴處發(fā)射的近端語音信號的估計;以及基于來自所述近端語音估計的信息而對基于所述聲學誤差信號的信號執(zhí)行反饋消除操作,其中所述噪聲估計是基于所述反饋消除操作的結(jié)果。
8.根據(jù)權(quán)利要求I到7中任一權(quán)利要求所述的方法,其中所述方法包括將以下兩者進行比較(A)基于由位于所述用戶的頭部的側(cè)面處且指向遠離所述頭部的噪聲參考麥克風產(chǎn)生的信號的第一所感測的噪聲信號的功率相對于時間的改變;以及(B)基于由位于比所述聲學誤差麥克風更靠近所述用戶的嘴巴處的話音麥克風產(chǎn)生的信號的第二所感測的噪聲信號的功率相對于時間的改變,其中所述噪聲參考信號是基于所述比較的結(jié)果。
9.根據(jù)權(quán)利要求I到8中任一權(quán)利要求所述的方法,其中所述方法包含產(chǎn)生基于來自所述聲學誤差信號的信息的抗噪聲信號,且其中基于所述經(jīng)均衡的音頻信號的所述聲學信號還基于所述抗噪聲信號。
10.根據(jù)權(quán)利要求I到9中任一權(quán)利要求所述的方法,其中所述方法包含對所述所再現(xiàn)的音頻信號進行濾波以獲得第一多個時域子帶信號;對噪聲估計進行濾波以獲得第二多個時域子帶信號;基于來自所述第一多個時域子帶信號的信息,計算多個信號子帶功率估計;基于來自所述第二多個時域子帶信號的信息,計算多個噪聲子帶功率估計;以及基于來自所述多個信號子帶功率估計的信息且基于來自所述噪聲子帶功率估計的信息,計算多個子帶增益,且其中所述升高是基于所述所計算得的多個子帶增益。
11.根據(jù)權(quán)利要求10所述的方法,其中所述使所述所再現(xiàn)的音頻信號的至少一個頻率子帶的振幅相對于所述所再現(xiàn)的音頻信號的至少一個其它頻率子帶的振幅升高以產(chǎn)生所述經(jīng)均衡的音頻信號包含使用濾波器級級聯(lián)對所述所再現(xiàn)的音頻信號進行濾波,其中所述濾波包含將所述多個子帶增益中的第一子帶增益施加到所述級聯(lián)中的對應濾波器級以升高所述所再現(xiàn)的音頻信號的第一頻率子帶的振幅;以及將所述多個子帶增益中的第二子帶增益施加到所述級聯(lián)中的對應濾波器級以升高所述所再現(xiàn)的音頻信號的第二頻率子帶的振幅,其中所述第二子帶增益具有與所述第一子帶增益不同的值。
12.一種處理所再現(xiàn)的音頻信號的方法,所述方法包含在經(jīng)配置以處理音頻信號的裝置內(nèi)執(zhí)行以下動作中的每一者計算在所述裝置的用戶的嘴巴處發(fā)射的近端語音信號的估計;基于來自所述近端語音估計的信息而對來自由位于所述用戶的頭部的側(cè)面處的第一麥克風產(chǎn)生的信號的信息執(zhí)行反饋消除操作以產(chǎn)生噪聲估計;基于來自所述噪聲估計的信息,使所述所再現(xiàn)的音頻信號的至少一個頻率子帶的振幅相對于所述所再現(xiàn)的音頻信號的至少一個其它頻率子帶的振幅升高以產(chǎn)生經(jīng)均衡的音頻信號;以及使用指向所述用戶的耳道處的揚聲器來產(chǎn)生基于所述經(jīng)均衡的音頻信號的聲學信號。
13.根據(jù)權(quán)利要求12所述的方法,其中所述第一麥克風指向所述用戶的所述耳道處。
14.根據(jù)權(quán)利要求13所述的方法,其中所述方法包括對基于由所述第一麥克風產(chǎn)生的所述信號的信號執(zhí)行回聲消除操作,其中所述回聲消除操作是基于基于所述經(jīng)均衡的音頻信號的回聲參考信號,且其中所述噪聲參考信號是基于所述回聲消除操作的結(jié)果。
15.根據(jù)權(quán)利要求12到14中任一權(quán)利要求所述的方法,其中所述第一麥克風指向遠離所述用戶的所述頭部。
16.根據(jù)權(quán)利要求12到15中任一權(quán)利要求所述的方法,其中所述噪聲估計是基于向所感測的噪聲信號施加轉(zhuǎn)移函數(shù)的結(jié)果,其中所述轉(zhuǎn)移函數(shù)是基于來自由指向所述用戶的所述耳道處的麥克風產(chǎn)生的信號的信息。
17.根據(jù)權(quán)利要求16所述的方法,其中所述所感測的噪聲信號是基于由位于所述用戶的所述頭部的所述側(cè)面處且指向遠離所述頭部的噪聲參考麥克風產(chǎn)生的信號。
18.根據(jù)權(quán)利要求16所述的方法,其中所述所感測的噪聲信號是基于由位于比所述第一麥克風更靠近所述用戶的嘴巴處的話音麥克風產(chǎn)生的信號。
19.根據(jù)權(quán)利要求16所述的方法,其中所述方法包括對所述所再現(xiàn)的音頻信號執(zhí)行活動檢測操作;以及基于所述執(zhí)行活動檢測操作的結(jié)果,更新所述轉(zhuǎn)移函數(shù)。
20.根據(jù)權(quán)利要求12到19中任一權(quán)利要求所述的方法,其中所述方法包括將以下兩者進行比較(A)基于由位于所述用戶的所述頭部的所述側(cè)面處且指向遠離所述頭部的噪聲參考麥克風產(chǎn)生的信號的第一所感測的噪聲信號的功率相對于時間的改變;以及(B)基于由位于比所述第一麥克風更靠近所述用戶的嘴巴處的話音麥克風產(chǎn)生的信號的第二所感測的噪聲信號的功率相對于時間的改變,其中所述噪聲估計是基于所述比較的結(jié)果。
21.根據(jù)權(quán)利要求12到20中任一權(quán)利要求所述的方法,其中所述方法包含產(chǎn)生基于來自由所述第一麥克風產(chǎn)生的所述信號的信息的抗噪聲信號,且其中基于所述經(jīng)均衡的音頻信號的所述聲學信號還基于所述抗噪聲信號。
22.根據(jù)權(quán)利要求12到21中任一權(quán)利要求所述的方法,其中所述方法包含對所述所再現(xiàn)的音頻信號進行濾波以獲得第一多個時域子帶信號;對噪聲估計進行濾波以獲得第二多個時域子帶信號;基于來自所述第一多個時域子帶信號的信息,計算多個信號子帶功率估計;基于來自所述第二多個時域子帶信號的信息,計算多個噪聲子帶功率估計;以及基于來自所述多個信號子帶功率估計的信息且基于來自所述噪聲子帶功率估計的信息,計算多個子帶增益,且其中所述升高是基于所述所計算得的多個子帶增益。
23.根據(jù)權(quán)利要求22所述的方法,其中所述使所述所再現(xiàn)的音頻信號的至少一個頻率子帶的振幅相對于所述所再現(xiàn)的音頻信號的至少一個其它頻率子帶的振幅升高以產(chǎn)生所述經(jīng)均衡的音頻信號包含使用濾波器級級聯(lián)對所述所再現(xiàn)的音頻信號進行濾波,其中所述濾波包含將所述多個子帶增益中的第一子帶增益施加到所述級聯(lián)中的對應濾波器級以升高所述所再現(xiàn)的音頻信號的第一頻率子帶的振幅;以及將所述多個子帶增益中的第二子帶增益施加到所述級聯(lián)中的對應濾波器級以升高所述所再現(xiàn)的音頻信號的第二頻率子帶的振幅,其中所述第二子帶增益具有與所述第一子帶增益不同的值。
24.一種用于處理所再現(xiàn)的音頻信號的設備,所述設備包含用于基于來自聲學誤差信號的信息而產(chǎn)生噪聲估計的裝置;用于基于來自所述噪聲估計的信息而使所述所再現(xiàn)的音頻信號的至少一個頻率子帶的振幅相對于所述所再現(xiàn)的音頻信號的至少一個其它頻率子帶的振幅升高以產(chǎn)生經(jīng)均衡的音頻信號的裝置;以及揚聲器,其在所述設備的使用期間指向用戶的耳道處以產(chǎn)生基于所述經(jīng)均衡的音頻信號的聲學信號,其中所述聲學誤差信號是由在所述設備的所述使用期間指向所述用戶的所述耳道處的誤差麥克風產(chǎn)生的。
25.根據(jù)權(quán)利要求24所述的設備,其中所述設備包含用于向所感測的噪聲信號施加轉(zhuǎn)移函數(shù)以產(chǎn)生所述噪聲估計的裝置,其中所述轉(zhuǎn)移函數(shù)是基于來自所述聲學誤差信號的所述信息。
26.根據(jù)權(quán)利要求25所述的設備,其中所述所感測的噪聲信號是基于由在所述設備的所述使用期間位于所述用戶的頭部的側(cè)面處且指向遠離所述頭部的噪聲參考麥克風產(chǎn)生的信號。
27.根據(jù)權(quán)利要求25所述的設備,其中所述所感測的噪聲信號是基于由在所述設備的所述使用期間位于比所述聲學誤差麥克風更靠近所述用戶的嘴巴處的話音麥克風產(chǎn)生的信號。
28.根據(jù)權(quán)利要求25所述的設備,其中所述設備包括用于對所述所再現(xiàn)的音頻信號執(zhí)行活動檢測操作的裝置;以及用于基于所述執(zhí)行活動檢測操作的結(jié)果而更新所述轉(zhuǎn)移函數(shù)的裝置。
29.根據(jù)權(quán)利要求24到28中任一權(quán)利要求所述的設備,其中所述設備包括用于對基于所述聲學誤差信號的信號執(zhí)行回聲消除操作的裝置,其中所述回聲消除操作是基于基于所述經(jīng)均衡的音頻信號的回聲參考信號,且其中所述噪聲參考信號是基于所述回聲消除操作的結(jié)果。
30.根據(jù)權(quán)利要求24到29中任一權(quán)利要求所述的設備,其中所述設備包括用于計算在所述用戶的嘴巴處發(fā)射的近端語音信號的估計的裝置;以及用于基于來自所述近端語音估計的信息而對基于所述聲學誤差信號的信號執(zhí)行反饋消除操作的裝置,其中所述噪聲估計是基于所述反饋消除操作的結(jié)果。
31.根據(jù)權(quán)利要求24到30中任一權(quán)利要求所述的設備,其中所述設備包括用于將以下兩者進行比較的裝置(A)基于由位于所述用戶的頭部的側(cè)面處且指向遠離所述頭部的噪聲參考麥克風產(chǎn)生的信號的第一所感測的噪聲信號的功率相對于時間的改變;以及(B)基于由在所述設備的所述使用期間位于比所述聲學誤差麥克風更靠近所述用戶的嘴巴處的話音麥克風產(chǎn)生的信號的第二所感測的噪聲信號的功率相對于時間的改變,其中所述噪聲估計是基于所述比較的結(jié)果。
32.根據(jù)權(quán)利要求24到31中任一權(quán)利要求所述的設備,其中所述設備包含用于產(chǎn)生基于來自所述聲學誤差信號的信息的抗噪聲信號的裝置,且其中基于所述經(jīng)均衡的音頻信號的所述聲學信號還基于所述抗噪聲信號。
33.根據(jù)權(quán)利要求24到32中任一權(quán)利要求所述的設備,其中所述設備包含用于對所述所再現(xiàn)的音頻信號進行濾波以獲得第一多個時域子帶信號的裝置;用于對噪聲估計進行濾波以獲得第二多個時域子帶信號的裝置;用于基于來自所述第一多個時域子帶信號的信息而計算多個信號子帶功率估計的裝置;用于基于來自所述第二多個時域子帶信號的信息而計算多個噪聲子帶功率估計的裝置;以及用于基于來自所述多個信號子帶功率估計的信息且基于來自所述噪聲子帶功率估計的信息而計算多個子帶增益的裝置,且其中所述升高是基于所述所計算得的多個子帶增益。
34.根據(jù)權(quán)利要求33所述的設備,其中所述用于使所述所再現(xiàn)的音頻信號的至少一個頻率子帶的振幅相對于所述所再現(xiàn)的音頻信號的至少一個其它頻率子帶的振幅升高以產(chǎn)生所述經(jīng)均衡的音頻信號的裝置包含用于使用濾波器級級聯(lián)對所述所再現(xiàn)的音頻信號進行濾波的裝置,其中所述用于濾波的裝置包含用于將所述多個子帶增益中的第一子帶增益施加到所述級聯(lián)中的對應濾波器級以升高所述所再現(xiàn)的音頻信號的第一頻率子帶的振幅的裝置;以及用于將所述多個子帶增益中的第二子帶增益施加到所述級聯(lián)中的對應濾波器級以升高所述所再現(xiàn)的音頻信號的第二頻率子帶的振幅的裝置,其中所述第二子帶增益具有與所述第一子帶增益不同的值。
35.一種用于處理所再現(xiàn)的音頻信號的設備,所述設備包含回聲消除器,其經(jīng)配置以產(chǎn)生基于來自聲學誤差信號的信息的噪聲估計;子帶濾波器陣列,其經(jīng)配置以基于來自所述噪聲估計的信息而使所述所再現(xiàn)的音頻信號的至少一個頻率子帶的振幅相對于所述所再現(xiàn)的音頻信號的至少一個其它頻率子帶的振幅升高以產(chǎn)生經(jīng)均衡的音頻信號;以及揚聲器,其在所述設備的使用期間指向用戶的耳道處以產(chǎn)生基于所述經(jīng)均衡的音頻信號的聲學信號,其中所述聲學誤差信號是由在所述設備的所述使用期間指向所述用戶的所述耳道處的誤差麥克風產(chǎn)生的。
36.根據(jù)權(quán)利要求35所述的設備,其中所述設備包含濾波器,所述濾波器經(jīng)配置以向所感測的噪聲信號施加轉(zhuǎn)移函數(shù)以產(chǎn)生所述噪聲估計,其中所述轉(zhuǎn)移函數(shù)是基于來自所述聲學誤差信號的所述信息。
37.根據(jù)權(quán)利要求36所述的設備,其中所述所感測的噪聲信號是基于由在所述設備的使用期間位于所述用戶的頭部的側(cè)面處且指向遠離所述頭部的噪聲參考麥克風產(chǎn)生的信號。
38.根據(jù)權(quán)利要求36所述的設備,其中所述所感測的噪聲信號是基于由在所述設備的使用期間位于比所述聲學誤差麥克風更靠近所述用戶的嘴巴處的話音麥克風產(chǎn)生的信號。
39.根據(jù)權(quán)利要求36所述的設備,其中所述設備包括活動檢測器,所述活動檢測器經(jīng)配置以對所述所再現(xiàn)的音頻信號執(zhí)行活動檢測操作,其中所述濾波器經(jīng)配置以基于所述執(zhí)行活動檢測操作的結(jié)果而更新所述轉(zhuǎn)移函數(shù)。
40.根據(jù)權(quán)利要求35到39中任一權(quán)利要求所述的設備,其中所述設備包括回聲消除器,所述回聲消除器經(jīng)配置以對基于所述聲學誤差信號的信號執(zhí)行回聲消除操作,其中所述回聲消除操作是基于基于所述經(jīng)均衡的音頻信號的回聲參考信號,且其中所述噪聲參考信號是基于所述回聲消除操作的結(jié)果。
41.根據(jù)權(quán)利要求35到40中任一權(quán)利要求所述的設備,其中所述設備包括噪聲抑制模塊,其經(jīng)配置以計算在所述用戶的嘴巴處發(fā)射的近端語音信號的估計;以及反饋消除器,其經(jīng)配置以基于來自所述近端語音估計的信息而對基于所述聲學誤差信號的信號執(zhí)行反饋消除操作,其中所述噪聲估計是基于所述反饋消除操作的結(jié)果。
42.根據(jù)權(quán)利要求35到41中任一權(quán)利要求所述的設備,其中所述設備包括失敗檢測器,所述失敗檢測器經(jīng)配置以將以下兩者進行比較(A)基于由位于所述用戶的頭部的側(cè)面處且指向遠離所述頭部的噪聲參考麥克風產(chǎn)生的信號的第一所感測的噪聲信號的功率相對于時間的改變;以及(B)基于由位于比所述聲學誤差麥克風更靠近所述用戶的嘴巴處的話音麥克風產(chǎn)生的信號的第二所感測的噪聲信號的功率相對于時間的改變,其中所述噪聲估計是基于所述比較的結(jié)果。
43.根據(jù)權(quán)利要求35到42中任一權(quán)利要求所述的設備,其中所述設備包含有源噪聲消除模塊,所述有源噪聲消除模塊經(jīng)配置以產(chǎn)生基于來自所述聲學誤差信號的信息的抗噪聲信號,且其中基于所述經(jīng)均衡的音頻信號的所述聲學信號還基于所述抗噪聲信號。
44.根據(jù)權(quán)利要求35到43中任一權(quán)利要求所述的設備,所述設備包含第一子帶信號產(chǎn)生器,其經(jīng)配置以對所述所再現(xiàn)的音頻信號進行濾波以獲得第一多個時域子帶信號;第二子帶信號產(chǎn)生器,其經(jīng)配置以對噪聲估計進行濾波以獲得第二多個時域子帶信號;第一子帶功率估計計算器,其經(jīng)配置以基于來自所述第一多個時域子帶信號的信息而計算多個信號子帶功率估計;第二子帶功率估計計算器,其經(jīng)配置以基于來自所述第二多個時域子帶信號的信息而計算多個噪聲子帶功率估計;以及子帶增益因子計算器,其經(jīng)配置以基于來自所述多個信號子帶功率估計的信息且基于來自所述噪聲子帶功率估計的信息而計算多個子帶增益,其中所述升高是基于所述所計算得的多個子帶增益。
45.根據(jù)權(quán)利要求44所述的設備,其中所述子帶濾波器陣列經(jīng)配置以使用濾波器級級聯(lián)對所述所再現(xiàn)的音頻信號進行濾波,其中所述子帶濾波器陣列經(jīng)配置以將所述多個子帶增益中的第一子帶增益施加到所述級聯(lián)中的對應濾波器級以升高所述所再現(xiàn)的音頻信號的第一頻率子帶的振幅,且其中所述子帶濾波器陣列經(jīng)配置以將所述多個子帶增益中的第二子帶增益施加到所述級聯(lián)中的對應濾波器級以升高所述所再現(xiàn)的音頻信號的第二頻率子帶的振幅,其中所述第二子帶增益具有與所述第一子帶增益不同的值。
46.一種具有有形特征的非暫時性計算機可讀存儲媒體,所述有形特征致使讀取所述特征的機器基于來自噪聲估計的信息而使所再現(xiàn)的音頻信號的至少一個頻率子帶的振幅相對于所述所再現(xiàn)的音頻信號的至少一個其它頻率子帶的振幅升高以產(chǎn)生經(jīng)均衡的音頻信號;以及驅(qū)動指向用戶的耳道處的揚聲器來產(chǎn)生基于所述經(jīng)均衡的音頻信號的聲學信號, 其中所述噪聲估計是基于來自由指向所述用戶的所述耳道處的誤差麥克風產(chǎn)生的聲學誤差信號的信息。
47.根據(jù)權(quán)利要求46所述的媒體,其中所述有形特征致使讀取所述特征的機器向所感測的噪聲信號施加轉(zhuǎn)移函數(shù)以產(chǎn)生所述噪聲估計,其中所述轉(zhuǎn)移函數(shù)是基于來自所述聲學誤差信號的所述信息。
48.根據(jù)權(quán)利要求47所述的媒體,其中所述有形特征致使讀取所述特征的機器對所述所再現(xiàn)的音頻信號執(zhí)行活動檢測操作;以及基于所述執(zhí)行活動檢測操作的結(jié)果而更新所述轉(zhuǎn)移函數(shù)。
49.根據(jù)權(quán)利要求46到48中任一權(quán)利要求所述的媒體,其中所述有形特征致使讀取所述特征的機器將以下兩者進行比較(A)基于由位于所述用戶的頭部的側(cè)面處且指向遠離所述頭部的噪聲參考麥克風產(chǎn)生的信號的第一所感測的噪聲信號的功率相對于時間的改變;以及(B)基于由位于比所述聲學誤差麥克風更靠近所述用戶的嘴巴處的話音麥克風產(chǎn)生的信號的第二所感測的噪聲信號的功率相對于時間的改變,其中所述噪聲參考信號是基于所述比較的結(jié)果。
50.根據(jù)權(quán)利要求46到49中任一權(quán)利要求所述的媒體,其中所述有形特征致使讀取所述特征的機器產(chǎn)生基于來自所述聲學誤差信號的信息的抗噪聲信號,且其中基于所述經(jīng)均衡的音頻信號的所述聲學信號還基于所述抗噪聲信號。
51.一種計算機可讀媒體,其包含在由處理器讀取時致使所述處理器執(zhí)行根據(jù)權(quán)利要求I到11中任一權(quán)利要求所述的方法的有形特征。
52.一種計算機可讀媒體,其包含在由處理器讀取時致使所述處理器執(zhí)行根據(jù)權(quán)利要求12到23中任一權(quán)利要求所述的方法的有形特征。
全文摘要
本發(fā)明描述用于產(chǎn)生抗噪聲信號且使所再現(xiàn)的音頻信號(例如,遠端電話信號)均衡的方法和設備,其中所述產(chǎn)生和所述均衡兩者均基于來自聲學誤差信號的信息。
文檔編號G10K11/178GK102947878SQ201180030698
公開日2013年2月27日 申請日期2011年6月1日 優(yōu)先權(quán)日2010年6月1日
發(fā)明者樸勛真, 埃里克·維瑟, 辛鐘元, 張國亮, 薩米爾·古普塔, 安德烈·古斯塔沃·舍維茨瓦, 李仁 , 杰洛米·P·托曼 申請人:高通股份有限公司