亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于噪聲活動(dòng)檢測(cè)的系統(tǒng)和方法

文檔序號(hào):7940776閱讀:274來源:國知局
專利名稱:用于噪聲活動(dòng)檢測(cè)的系統(tǒng)和方法
技術(shù)領(lǐng)域
本公開一般地涉及用于例如噪聲削減系統(tǒng)中的噪聲活動(dòng)檢測(cè)器。
背景技術(shù)
在諸如回聲消除、語音識(shí)別、語音編碼、IP電話的許多信號(hào)處理應(yīng)用中,并且尤其 是在噪聲削減系統(tǒng)中,收集關(guān)于信號(hào)中的噪聲的實(shí)時(shí)信息和統(tǒng)計(jì)量是重要的。這最常見的 是通過檢測(cè)何時(shí)存在有用數(shù)量的所希望的信號(hào),并且將信號(hào)的這個(gè)部分視為“非噪聲”來實(shí) 現(xiàn)的。在其它時(shí)刻,認(rèn)為信號(hào)僅是噪聲,并且在這些時(shí)間期間收集所希望的信息和統(tǒng)計(jì)量。在單信道系統(tǒng)中,噪聲和所希望的信號(hào)混合在一起,并且進(jìn)入的混合噪聲信號(hào)被 認(rèn)為是所希望的信號(hào)和不需要的噪聲的線性和。通過檢測(cè)混合信號(hào)中何時(shí)有所希望的信號(hào) 出現(xiàn),在這部分信號(hào)期間不更新噪聲信息。而是在其它時(shí)刻對(duì)噪聲特性的更新允許以適合 的處理執(zhí)行噪聲削減。在語音通信系統(tǒng)中,確定僅有噪聲的時(shí)期的出現(xiàn)的需要已經(jīng)引發(fā)了多種語音確定 方法的激增,由于混合信號(hào)的語音部分是所希望的部分,它們通常被稱為語音檢測(cè)或語音 活動(dòng)檢測(cè)(VAD)方法。這些方法依賴這樣的事實(shí),即,說話的人必須至少聽到其自己的聲音的一部分,以 便正確組織其話語。為了可靠地聽到自己的談話,說話的人必須將其自己的語音保持為高 于環(huán)境或背景噪聲級(jí)別大約10dB。因此,在存在大的背景噪聲時(shí),說話的人自然提高其聲音 級(jí)別,并且將其保持為略高于競(jìng)爭(zhēng)的背景噪聲級(jí)別。不論是在時(shí)域中還是在頻域中實(shí)現(xiàn)的語音活動(dòng)檢測(cè)方法利用這種事實(shí)。許多這種 系統(tǒng)基于檢測(cè)進(jìn)入噪聲信號(hào)的總能量高于一個(gè)閾值,并且當(dāng)滿足這種條件時(shí)指示存在語音 的裝置。當(dāng)然,該閾值必須被調(diào)整為總是在信號(hào)的背景噪聲部分的級(jí)別之上,但是在組合的 語音加噪聲級(jí)別的級(jí)別之下。出于這個(gè)目的,已經(jīng)設(shè)計(jì)了許多復(fù)雜的方法,以便創(chuàng)建這種實(shí) 時(shí)的動(dòng)態(tài)閾值調(diào)整。然而,這些“逆向”方法-即,檢測(cè)所希望的信號(hào)從而可以暗示噪聲時(shí)期,而不是 直接檢測(cè)噪聲部分本身,具有缺點(diǎn)。例如,在大約90dB SPL(聲壓級(jí)別)之上的噪聲中,人 們幾乎不可能進(jìn)一步提高其語音的音量,并且輸入信號(hào)的SNR(信噪比)通常降低到低于 0dB(l 1)。當(dāng)SNR變低,例如,低于IOdB時(shí),常規(guī)的語音檢測(cè)系統(tǒng)工作得不好,或完全不能工 作。只要語音信號(hào)功率顯著地高于噪聲信號(hào)功率,這種系統(tǒng)就能夠檢測(cè)到語音的出現(xiàn)。但 是在越發(fā)嘈雜的情況下,語音檢測(cè)準(zhǔn)確性下降,直到這些系統(tǒng)完全不能工作。另一個(gè)顯著的問題是對(duì)風(fēng)噪的檢測(cè),風(fēng)噪是空氣流過語音檢測(cè)系統(tǒng)中使用的麥克風(fēng)時(shí)產(chǎn)生的噪聲。隨著移動(dòng)通信設(shè)備的激增,風(fēng)噪成為是至關(guān)重要的。這種噪聲可以表現(xiàn) 出高度可變的屬性,并且因此這些系統(tǒng)通常會(huì)對(duì)風(fēng)的噪聲錯(cuò)誤地分類。當(dāng)出現(xiàn)這種情況時(shí), 由于噪聲模板的不正確更新,可能會(huì)損害基于VAD的噪聲削減系統(tǒng)的噪聲削減。對(duì)于被正 確分類的風(fēng)噪,必須以更大的復(fù)雜性和更多花費(fèi)的代價(jià)實(shí)現(xiàn)附加的方法或處理以便對(duì)風(fēng)噪進(jìn)行可靠地檢測(cè)。常規(guī)語音檢測(cè)方案的另一個(gè)難點(diǎn)是語音信號(hào)不會(huì)突然終止,而是在每個(gè)發(fā)音后慢 慢地衰減。盡管語音仍然存在,但當(dāng)語音信號(hào)的衰退的尾部下降到閾值級(jí)別之下時(shí),基于噪 聲功率閾值之上的語音功率的語音檢測(cè)會(huì)錯(cuò)誤地指示發(fā)音的結(jié)束。因此,這些系統(tǒng)通常增 加所謂的“拖尾”定時(shí)器以便延遲噪聲開始的指示。經(jīng)典的語音檢測(cè)方法假設(shè)背景噪聲是靜態(tài)的或僅僅緩慢地改變。在非靜態(tài)噪聲狀 態(tài)下,由于噪聲級(jí)別的迅速改變,經(jīng)典語音檢測(cè)方案是不可靠的,尤其是不能將噪聲上跳與 語音串的開始加以區(qū)分,并且因此將給出語音存在的錯(cuò)誤指示。這種語音檢測(cè)器還對(duì)用戶語音之外的附近語音的存在有所反應(yīng),即使在用戶自己 的語音是唯一所希望的信號(hào)的系統(tǒng)中背景語音實(shí)際上是“噪聲”的情況下亦是如此。另外,幾乎所有語音檢測(cè)方法依賴于基于信號(hào)先前歷史而不是基于當(dāng)前瞬時(shí)狀態(tài) 的一個(gè)或多個(gè)閾值的設(shè)置或更新。由于依賴先前信息,這些閾值不能被快速更新,并且語音 檢測(cè)輸出對(duì)背景噪聲的快速改變反應(yīng)緩慢,從而會(huì)產(chǎn)生錯(cuò)誤直到系統(tǒng)可被最終調(diào)整為止。通過給信號(hào)功率閾值檢測(cè)的基本原理增加某些改進(jìn),在歷史上已經(jīng)對(duì)語音檢測(cè)的 這些問題給予了關(guān)注。這些改進(jìn)包括用于追蹤噪聲級(jí)別以便實(shí)時(shí)更新閾值的方法、增加單 獨(dú)的風(fēng)檢測(cè)器方案、允許以更高精度設(shè)置閾值以便在較低SNR狀態(tài)下工作的提高了靈敏度 的方法、增加防止當(dāng)發(fā)音的結(jié)尾簡(jiǎn)單地是下降到閾值之下時(shí)錯(cuò)誤地指示發(fā)音結(jié)束的拖尾方 法、和創(chuàng)建等待比任意預(yù)期自然出現(xiàn)的發(fā)音時(shí)段更長(zhǎng)的時(shí)間的鎖定時(shí)期,在該時(shí)段后允許 更迅速地調(diào)整閾值,以便試圖適應(yīng)背景噪聲級(jí)別中的突發(fā)或階躍。然而,使用這些改進(jìn)仍然 產(chǎn)生受限的操作,并且仍然導(dǎo)致對(duì)僅有噪聲信號(hào)狀態(tài)的錯(cuò)誤檢測(cè)。已經(jīng)創(chuàng)建了依賴于對(duì)諸如來自傳感器或麥克風(fēng)陣列的多于一個(gè)信號(hào)的可獲得性 的其它語音檢測(cè)方法。然而,這些系統(tǒng)具有很大的缺點(diǎn),即,僅當(dāng)可獲得多個(gè)信號(hào)時(shí),或僅在 可以提供多個(gè)傳感器的情況下這些方法才能工作。另外,它們?cè)黾恿诉@些系統(tǒng)的復(fù)雜性、成 本、大小和功耗。已知的其它解決方案依賴于復(fù)雜的信號(hào)處理計(jì)算,諸如自相關(guān)、互相關(guān)、方差、線 性預(yù)測(cè)編碼(LPC)系數(shù)、各種統(tǒng)計(jì)噪聲預(yù)測(cè)器(例如,高斯、拉普拉斯和伽馬分布)、靜態(tài)測(cè) 量等。一般地,這些解決方案不能顯著提高性能,并且仍然旨在檢測(cè)發(fā)音時(shí)段,而不是檢測(cè) 僅有噪聲的時(shí)段本身。

發(fā)明內(nèi)容
如此處描述的,一種用于檢測(cè)信號(hào)中的噪聲活動(dòng)的方法包括a)計(jì)算信號(hào)在關(guān)鍵帶寬中的平均能量;b)確定與頻率相關(guān)的閾值函數(shù);c)使用平均能量產(chǎn)生對(duì)與頻率相關(guān)的閾值函數(shù)的動(dòng)態(tài)修改;d)識(shí)別信號(hào)的具有根據(jù)相應(yīng)頻率的閾值函數(shù)確定的閾值之上的能量的頻率分量,并且確定第一平均能量值,第一平均能量值表示識(shí)別出的具有該閾值之上的能量的頻率分 量的平均能量;e)識(shí)別信號(hào)的具有根據(jù)相應(yīng)頻率的閾值函數(shù)確定的閾值之下的能量的頻率分量, 并且確定第二平均能量值,第二平均能量值表示識(shí)別出的具有該閾值之下的能量的頻率分量的平均能量; f)給第一平均能量值和第二平均能量值中的至少一個(gè)應(yīng)用偏移值;g)在應(yīng)用所述偏移值之后,對(duì)獲得的第一平均能量值和第二平均能量值彼此進(jìn)行 比較;和h)如果作為所述比較的結(jié)果,確定獲得的第一平均能量值低于獲得的第二平均能 量值,則指示噪聲活動(dòng)的出現(xiàn)。此處還描述了一種用于產(chǎn)生對(duì)信號(hào)中的噪聲活動(dòng)的指示的噪聲活動(dòng)檢測(cè)器,包 括a)第一電路,配置為計(jì)算關(guān)鍵頻帶中的平均能量;b)第二電路,配置為確定與頻率相關(guān)的閾值函數(shù);c)第三電路,配置為使用該平均能量產(chǎn)生對(duì)與頻率相關(guān)的閾值函數(shù)的動(dòng)態(tài)修改;d)第四電路,配置為識(shí)別信號(hào)的具有根據(jù)相應(yīng)頻率的閾值函數(shù)確定的閾值之上的 能量的頻率分量,并且確定第一平均能量值,第一平均能量值表示識(shí)別出的具有該閾值之 上的能量的頻率分量的平均能量;e)第五電路,配置為識(shí)別信號(hào)的具有根據(jù)相應(yīng)頻率的閾值函數(shù)確定的閾值之下的 能量的頻率分量,并且確定第二平均能量值,第二平均能量值表示識(shí)別出的具有該閾值之 下的能量的頻率分量的平均能量;f)第六電路,配置為給第一平均能量值和第二平均能量值中的至少一個(gè)應(yīng)用偏移 值;g)第七電路,配置為在應(yīng)用所述偏移值之后,對(duì)第一和第二平均能量值彼此進(jìn)行 比較;和h)第八電路,配置為如果作為所述比較的結(jié)果,確定獲得的第一平均能量值低于 獲得的第二平均能量值,則指示噪聲活動(dòng)的出現(xiàn)。此處還描述了一種用于產(chǎn)生對(duì)信號(hào)中的噪聲活動(dòng)的指示的噪聲活動(dòng)檢測(cè)器,包 括a)用于計(jì)算信號(hào)在關(guān)鍵頻帶中的平均能量的裝置;b)用于確定與頻率相關(guān)的閾值函數(shù)的裝置;c)用于使用該平均能量產(chǎn)生對(duì)與頻率相關(guān)的閾值函數(shù)的動(dòng)態(tài)修改的裝置;d)用于識(shí)別信號(hào)的具有根據(jù)相應(yīng)頻率的閾值函數(shù)確定的閾值之上的能量的頻率 分量,并且確定第一平均能量值的裝置,第一平均能量值表示識(shí)別出的具有該閾值之上的 能量的頻率分量的平均能量;e)用于識(shí)別信號(hào)的具有根據(jù)相應(yīng)頻率的閾值函數(shù)確定的閾值之下的能量的頻率 分量,并且確定第二平均能量值的裝置,第二平均能量值表示識(shí)別出的具有該閾值之下的 能量的頻率分量的平均能量;f)用于給第一平均能量值和第二平均能量值中的至少一個(gè)應(yīng)用偏移值的裝置;g)用于在應(yīng)用所述偏移值之后,對(duì)獲得的第一平均能量值和第二平均能量值彼此 進(jìn)行比較的裝置;和h)用于如果作為所述比較的結(jié)果,確定獲得的第一平均能量值低于獲得的第二平 均能量值,則指示噪聲活動(dòng)的出現(xiàn)的裝置。
此處還描述了一種機(jī)器可讀的程序存儲(chǔ)設(shè)備,該程序存儲(chǔ)設(shè)備包含有用于執(zhí)行產(chǎn) 生對(duì)信號(hào)中的噪聲活動(dòng)的指示的方法的機(jī)器可執(zhí)行指令的程序,該方法包括a)計(jì)算信號(hào)在關(guān)鍵帶寬中的平均能量;b)確定與頻率相關(guān)的閾值函數(shù);c)使用平均能量產(chǎn)生對(duì)與頻率相關(guān)的閾值函數(shù)的動(dòng)態(tài)修改;d)識(shí)別信號(hào)的具有根據(jù)相應(yīng)頻率的閾值函數(shù)確定的閾值之上的能量的頻率分量, 并且確定第一平均能量值,第一平均能量值表示識(shí)別出的具有該閾值之上的能量的頻率分 量的平均能量;e)識(shí)別信號(hào)的具有根據(jù)相應(yīng)頻率的閾值函數(shù)確定的閾值之下的能量的頻率分量, 并且確定第二平均能量值,第二平均能量值表示識(shí)別出的具有該閾值之下的能量的頻率分 量的平均能量;f)給第一平均能量值和第二平均能量值中的至少一個(gè)應(yīng)用偏移值;g)在應(yīng)用所述偏移值之后,對(duì)第一和第二平均能量值彼此進(jìn)行比較;和h)如果作為所述比較的結(jié)果,確定獲得的第一平均能量值低于獲得的第二平均能 量值,則指示噪聲活動(dòng)的出現(xiàn)。


結(jié)合在本說明書中并且構(gòu)成本說明書的一部分的附圖示出了實(shí)施例的一個(gè)或多 個(gè)例子,并且與對(duì)示例實(shí)施例的描述一起用于解釋這些實(shí)施例的原理和實(shí)現(xiàn)。在附圖中圖1-7是相應(yīng)于不同聲音狀態(tài)的測(cè)量數(shù)據(jù)的圖,并且每個(gè)圖包括作為表示噪聲功 率的曲線的模型的長(zhǎng)虛線;圖8是典型通信系統(tǒng)前端的方框圖,示出了可以在其中使用噪聲活動(dòng)檢測(cè)器 (NAD) 20的上下文;圖9是可由NAD 20執(zhí)行的各種步驟或任務(wù)的流程圖;圖10是實(shí)現(xiàn)在圖9的流程圖中提出的任務(wù)的電路的方框圖;圖11是示出了使用NAD20的設(shè)備的性能的圖。
具體實(shí)施例方式此處,在處理器或單獨(dú)電路或所執(zhí)行的處理的流程圖的上下文中描述示例實(shí)施 例。本領(lǐng)域的普通技術(shù)人員將會(huì)認(rèn)識(shí)到,下面的描述僅是說明性的,并且不旨在以任何方式 作為限制。受益于本公開的本領(lǐng)域的技術(shù)人員容易構(gòu)想其它實(shí)施例?,F(xiàn)在詳細(xì)參考附圖中 示出的示例實(shí)施例的實(shí)現(xiàn)。在附圖和下面的描述中盡可能使用相同的參考指示符指示相同 或類似的項(xiàng)目。為了清楚起見,未示出和描述此處描述的實(shí)現(xiàn)的所有常規(guī)特征。當(dāng)然,應(yīng)當(dāng)明了, 在任意這種實(shí)際實(shí)現(xiàn)的開發(fā)中,必須做出若干特定于實(shí)現(xiàn)的決策,以便實(shí)現(xiàn)開發(fā)者的特定 目標(biāo),諸如對(duì)與應(yīng)用和商業(yè)相關(guān)的限制的符合性,并且這些特定的目標(biāo)將根據(jù)實(shí)現(xiàn)的不同 以及開發(fā)者的不同而改變。另外,應(yīng)當(dāng)明了,這種研發(fā)實(shí)踐可能是復(fù)雜并且費(fèi)時(shí)的,但是對(duì) 于受益于本公開的本領(lǐng)域的普通技術(shù)人員來說,仍然是工程上的例行任務(wù)。
根據(jù)本公開,可以使用各種類型的操作系統(tǒng)、計(jì)算平臺(tái)、計(jì)算機(jī)程序和/或通用機(jī)器實(shí)現(xiàn)此處描述的組件、處理步驟和/或數(shù)據(jù)結(jié)構(gòu)。另外,本領(lǐng)域的普通技術(shù)人員將認(rèn)識(shí) 至|J,還可以使用通用屬性較弱的設(shè)備,諸如硬布線設(shè)備、現(xiàn)場(chǎng)可編程門陣列(FPGA)、專用集 成電路(ASIC)等,而不脫離此處公開的創(chuàng)造性概念的范圍和精神。在以計(jì)算機(jī)或機(jī)器實(shí)現(xiàn) 包括一系列處理步驟的方法,并且這些處理步驟可被存儲(chǔ)為一系列機(jī)器可讀的指令的情況 下,它們可被存儲(chǔ)在諸如計(jì)算機(jī)存儲(chǔ)器設(shè)備(例如,R0M(只讀存儲(chǔ)器)、PROM(可編程只讀 存儲(chǔ)器)、EEPROM(電可擦除可編程只讀存儲(chǔ)器)、閃存、Jump Drive等)、磁存儲(chǔ)介質(zhì)(例 如,磁帶、磁盤驅(qū)動(dòng)器等)、光學(xué)存儲(chǔ)介質(zhì)(例如,⑶-R0M、DVD-R0M、紙卡、紙帶等)和其它類 型的程序存儲(chǔ)器的有形介質(zhì)上。此處公開的噪聲檢測(cè)器,也被稱為噪聲活動(dòng)檢測(cè)器(NAD),基于噪聲與其它信號(hào) 的特性,特別是所希望信號(hào)的特性,不相同的獨(dú)特特性。一般地,它適合于檢測(cè)信號(hào)僅為噪 聲的時(shí)段,并且因此尤其適用于諸如噪聲削減系統(tǒng)的系統(tǒng),在這些系統(tǒng)中,為了實(shí)現(xiàn)系統(tǒng)功 能,必須具有關(guān)于僅有噪聲的時(shí)段的知識(shí)。特別地,此處公開的布置涉及對(duì)混合麥克風(fēng)輸入 信號(hào)中僅有聲學(xué)噪聲的時(shí)段的可靠檢測(cè),所述麥克風(fēng)輸入信號(hào)可以包含語音、風(fēng)噪和聲學(xué) 背景噪聲。一種替換用途是作為語音活動(dòng)檢測(cè)器。更具體地,其涉及在諸如,尤其是,蜂窩 電話、Bluetooth 無線耳機(jī)、語音命令和控制以及自動(dòng)語音識(shí)別的語音級(jí)通信系統(tǒng)和設(shè) 備中的使用。出于本討論的目的,識(shí)別三類聲音聲噪、風(fēng)噪和語音。圖1是以測(cè)量信號(hào)功率的分貝(dB)相對(duì)于赫茲(Hz)頻率繪制的,由在擁擠的 餐館內(nèi)講話的大量人產(chǎn)生的環(huán)境背景噪聲的測(cè)量數(shù)據(jù)的圖??紤]相應(yīng)于大約300HZ到 3,OOOHz的人類語音通信頻帶的感興趣的頻帶,測(cè)量的噪聲功率隨著頻率增加以每倍頻程 大約6dB的速率下降。為了方便下面的詳細(xì)描述,確定從大約250Hz到大約2,500Hz的頻 率范圍上的平均功率級(jí)別。圖1的示例測(cè)量數(shù)據(jù)的平均功率級(jí)別大約為_50db,并且在圖中 被以短虛線表示。另外,構(gòu)造長(zhǎng)虛線以便模擬表示實(shí)際噪聲功率的曲線。對(duì)于這種數(shù)據(jù)和 這個(gè)特定的例子,該模型線被選擇為是具有每倍頻程_6dB的斜率的直線。應(yīng)當(dāng)理解,術(shù)語 “線”不限于直線,并且每倍頻程_6db的說明性斜率不是限制,還可以設(shè)想其它正負(fù)斜率。注意模型曲線(長(zhǎng)虛線)與平均噪聲級(jí)別線(短虛線)在略微高于700Hz的被稱 為有效頻率處相交是有益的。將在下面更詳細(xì)地解釋這種有效頻率的意義,以及選擇和構(gòu) 造模型曲線的方式。假設(shè)已經(jīng)正確地確定了該模型曲線(長(zhǎng)虛線)以便相對(duì)準(zhǔn)確地對(duì)應(yīng)典型噪聲功 率頻率特性形狀,通過抬高或降低模型曲線,直到模型曲線在大約250Hz到大約2,500Hz 的所選帶寬上的平均功率和測(cè)量數(shù)據(jù)的實(shí)際平均噪聲功率相同為止,使得模型曲線在大約 250Hz到大約2,500Hz的所選擇的帶寬上的平均功率等于測(cè)量數(shù)據(jù)的實(shí)際平均噪聲功率。 這被通過在數(shù)學(xué)上求解使得平均模型功率匹配實(shí)際平均測(cè)量功率的模型的幅值來實(shí)現(xiàn)。然 后可以確定該模型和實(shí)際平均功率線交叉(即,相等)處的有效頻率。實(shí)際上,模型曲線 穿過平均功率線,從而當(dāng)被繪制在幅值平方相對(duì)于頻率的圖上時(shí)(未示出),在有效頻率交 點(diǎn)上下在模型曲線和平均功率線之間產(chǎn)生相等的面積??梢妼?duì)于這種數(shù)據(jù),當(dāng)它們?cè)诮?700Hz處交叉時(shí),具有_6dB斜率的模型提供了對(duì)噪聲數(shù)據(jù)特性的緊密近似。因此,700Hz被 確定為這種數(shù)據(jù)的有效頻率。應(yīng)當(dāng)認(rèn)識(shí)到,測(cè)量數(shù)據(jù)的形狀取決于特定信號(hào)拾取系統(tǒng)的特性。對(duì)于其它系統(tǒng),彎曲(非直)線可能是該系統(tǒng)的噪聲響應(yīng)的更適合的模型。對(duì)于圖1所示的數(shù)據(jù),針對(duì)200HZ到3,400Hz范圍內(nèi)的信號(hào)測(cè)量來校準(zhǔn)測(cè)量系統(tǒng),并且該范圍之外的繪圖應(yīng)當(dāng)被認(rèn)為不是準(zhǔn) 確地表示實(shí)際環(huán)境噪聲所必需的。圖2是緊鄰交通繁忙的街道測(cè)量的交通噪聲的圖。如圖1所示,垂直軸是dB噪聲 功率,水平軸是Hz頻率,短虛線表示250Hz到2,500Hz頻帶上的平均噪聲功率,并且長(zhǎng)虛線 表示被構(gòu)造為具有每倍頻程_6dB的斜率的直線。模型線(長(zhǎng)虛線)與平均功率線(短虛 線)在與圖1的餐館噪聲幾乎相同的有效頻率處相交。重要的是,雖然起源、特性和聲音非 常不同,但是交通噪聲具有與餐館噪聲十分類似的頻譜模式,其噪聲功率隨著頻率增加以 大約每倍頻程6dB的速率下降。圖3示出了在車箱內(nèi)測(cè)量的噪聲的一對(duì)圖,下部的圖是在車輛在車窗關(guān)閉并且沒 有其它噪聲源的情況下緩慢運(yùn)動(dòng)時(shí)進(jìn)行的測(cè)量,而上部的圖是車輛在打開收音機(jī)和A/CM 扇的情況下以每小時(shí)70英里行駛時(shí)進(jìn)行的測(cè)量。短虛線和長(zhǎng)虛線再次表示噪聲數(shù)據(jù)的平 均功率,以及給出相應(yīng)平均模型功率“曲線”的具有_6dB的斜率的模型線。注意,這些模型 線在與圖1的情況所確定的相同的有效頻率處相交。從圖3可見,雖然不如前面噪聲情況 那么接近,仍然可以用相同的每倍頻程_6dB的模型描述車內(nèi)噪聲的頻譜模式。這些線仍然 是車箱噪聲的十分合理的模型。圖4和5分別是低風(fēng)速和高風(fēng)速“噪聲”的圖。風(fēng)“噪聲”不同于其它聲音,即,它 是(多個(gè))獨(dú)立麥克風(fēng)端口處的空氣湍流的結(jié)果,并且僅由于麥克風(fēng)的存在而存在。它是 由風(fēng)在(多個(gè))麥克風(fēng)端口處感應(yīng)出的噪聲,而不是風(fēng)固有的并且被麥克風(fēng)感測(cè)到的聲學(xué) 噪聲。這種風(fēng)感應(yīng)出的噪聲導(dǎo)致通常被稱為“風(fēng)噪”的電子麥克風(fēng)輸出信號(hào)。圖4示出了當(dāng)風(fēng)速低并且從而未灌滿麥克風(fēng)時(shí)收集的數(shù)據(jù)。該噪聲信號(hào)以相對(duì)持 續(xù)的噪聲串為特征,該噪聲串表現(xiàn)出高的平穩(wěn)性和具有陡峭斜率的功率頻率響應(yīng)。圖5示 出了在高風(fēng)速狀態(tài)下收集的數(shù)據(jù),其中風(fēng)灌滿了麥克風(fēng),并且極其“突然”。在該情況下,噪 聲信號(hào)以短的、強(qiáng)度不平穩(wěn)的信號(hào)串為特征。在中間風(fēng)狀態(tài)下,信號(hào)在這兩種特征之間輪流 改變。根據(jù)圖4和5,可以看到由風(fēng)感應(yīng)出的噪聲具有與大部分常見類型的聲學(xué)噪聲本 質(zhì)不同的特征,包括頻譜差異和動(dòng)態(tài)模式差異。另外,這種噪聲在統(tǒng)計(jì)上與多傳感器陣列系 統(tǒng)內(nèi)的每個(gè)傳感器信號(hào)無關(guān)。噪聲抑止處理通常必須忽略這種由風(fēng)感應(yīng)出的噪聲信號(hào),對(duì) 其進(jìn)行單獨(dú)處理或以不同于這些處理響應(yīng)聲源噪聲方式的方式處理這種由風(fēng)感應(yīng)出的噪 聲信號(hào)。同樣,在圖4和5中,在平均功率級(jí)別出畫出了水平的短虛線,并且示出了具有_6dB 斜率的長(zhǎng)虛線噪聲模型線,其中模型平均功率與測(cè)量信號(hào)功率在示出的交點(diǎn)頻率處匹配。通過分析以此處公開的系統(tǒng)可被用于其中的系統(tǒng)測(cè)量的多種噪聲信號(hào),確定當(dāng)模 型曲線(在該情況下,"6dB/oct.的直線)被設(shè)置為在750Hz處等于平均測(cè)量噪聲信號(hào)功 率時(shí),模型的確產(chǎn)生了對(duì)所有聲學(xué)噪聲信號(hào)的良好近似。然而,聲學(xué)噪聲信號(hào)表現(xiàn)出相對(duì)于 該模型的微小偏差,而語音(下面討論)和風(fēng)噪相對(duì)于該模型都表現(xiàn)出顯著偏差。如上所 述,出于本討論的目的,識(shí)別三種類型的聲音聲噪、風(fēng)噪和語音。聲學(xué)噪聲一般地是所有非 風(fēng)噪和非語音聲音的統(tǒng)稱。從圖中可見,雖然圖1-3中的噪聲數(shù)據(jù)緊密地聚集在該模型(長(zhǎng)虛線)周圍,圖4 和5中的風(fēng)噪的圖不是這樣。可以使用這種不同區(qū)分風(fēng)噪和其它噪聲。
低風(fēng)感應(yīng)噪聲和高風(fēng)感應(yīng)噪聲之間的區(qū)分是個(gè)相對(duì)概念;可以看到它們的圖顯著 不同。由于“風(fēng)噪”是在麥克風(fēng)的(多個(gè))端口處產(chǎn)生的,圖4和5的結(jié)果之間的過渡風(fēng)速 取決于麥克風(fēng)的物理特性。然而,一般關(guān)系是適用的;即,低風(fēng)速產(chǎn)生陡峭的頻譜曲線,而高 風(fēng)速(相對(duì)于物理配置)產(chǎn)生明顯更高的頻率信號(hào),并且一般產(chǎn)生平坦的頻譜響應(yīng)。可以 觀察到圖4和5的圖在200Hz處相當(dāng)接近,但是對(duì)于高風(fēng)速隨著頻率的增加圖5示出逐漸 更大的功率,并且在2,OOOHz處示出大得多的功率。對(duì)于一種麥克風(fēng)的物理配置,這些曲線 可以相應(yīng)于272mph和5mph的風(fēng)速,并且對(duì)于具有不同端口設(shè)計(jì)和/或內(nèi)置風(fēng)篩的麥克風(fēng) 系統(tǒng),分別相應(yīng)于5mph和IOmph的風(fēng)速。然而,圖4和5代表特定麥克風(fēng)可能在一種風(fēng)速 范圍上產(chǎn)生的風(fēng)感應(yīng)噪聲的變化種類。圖6和7分別是安靜房間狀態(tài)下的有聲談話(voiced speech)和強(qiáng)烈噪聲中的有 聲談話的圖。圖7的圖示中使用的噪聲包括與擴(kuò)散源模擬中來自多個(gè)方向的語音串音混合 在一起的商業(yè)錄制的音樂,它們?cè)邴溈孙L(fēng)處產(chǎn)生大約85dB SPL的噪聲。在這些狀態(tài)下,該 信號(hào)的SNR是-3dB。這種模擬旨在近似各種聚集狀態(tài),諸如機(jī)場(chǎng)、戲院幕間休息、零售店等。 如前面附圖的情況,以水平短虛線表示平均信號(hào)功率級(jí)別(包括所有語音和/或噪聲),并 且以長(zhǎng)虛線示出了 _6dB的直線模型。圖6和7的圖示出了即使語音包括大量噪聲,語音的 特征頻譜模式產(chǎn)生大量語音格式的頻譜功率峰,并且因此頻率能量的改變比任意噪聲狀態(tài) 大得多。即使在零下SNR混合輸入信號(hào)中,頻譜模式中的這種差異可以容易地區(qū)分語音和 噪聲。此處公開的噪聲活動(dòng)檢測(cè)器(NAD)使用上述特性識(shí)別信號(hào),并 且指出何時(shí)出現(xiàn)信 號(hào)的僅有噪聲的時(shí)段。存在對(duì)這種操作的無數(shù)應(yīng)用——例如,它可被用于提供選通其它功 能的控制信號(hào),諸如在頻譜相減處理中更新噪聲模板、更新自動(dòng)麥克風(fēng)匹配表、當(dāng)僅存在噪 聲時(shí)阻止自動(dòng)增益電路提高增益等等。在通信系統(tǒng)的音頻信號(hào)的上下文中描述此處公開的 噪聲活動(dòng)檢測(cè)器。然而,此處公開的處理不限于單通道、單頻帶應(yīng)用,而是可用于多通道應(yīng) 用以及多頻帶應(yīng)用。由于在頻域中執(zhí)行處理,選擇在其上進(jìn)行操作的頻率范圍是簡(jiǎn)單的,并 且噪聲檢測(cè)器的附加實(shí)現(xiàn)可被用于其它頻率范圍。這種應(yīng)用的例子是多頻帶頻譜相減處 理,其中當(dāng)相應(yīng)頻帶中僅存在噪聲時(shí),即使在其它頻帶中可能存在語音信號(hào)和/或風(fēng)感應(yīng) 出的信號(hào),獨(dú)立地更新每個(gè)頻帶的噪聲模板將會(huì)是必須的。噪聲活動(dòng)檢測(cè)器還可用于多通 道應(yīng)用,以便為每個(gè)通道提供何時(shí)其信號(hào)僅為噪聲的指示。雖然對(duì)于許多的多通道系統(tǒng)來 說,每個(gè)輸入信號(hào)可能類似于其它傳感器接收到的信號(hào),誕生存在許多不是如此的情況,諸 如對(duì)于風(fēng)感應(yīng)出的噪聲,以及諸如通過與操作者的皮膚或與其它物體的物理接觸而在端口 處機(jī)械地產(chǎn)生的噪聲。作為可能的應(yīng)用的例子,應(yīng)用于多通道系統(tǒng)的每個(gè)通道的來自噪聲的控制信號(hào)可 被用于特定于通道的頻譜相減處理,和/或可以組合來自不同通道上的噪聲檢測(cè)器的信 號(hào),以便能夠進(jìn)行自動(dòng)麥克風(fēng)匹配處理,以便補(bǔ)償多個(gè)麥克風(fēng)的靈敏度變化。在后一種應(yīng)用 中,特定于通道的噪聲檢測(cè)器確保麥克風(fēng)匹配不會(huì)與出現(xiàn)在單個(gè)通道上的噪聲相匹配。圖8是示出了可以使用噪聲活動(dòng)檢測(cè)器(NAD) 20的上下文的典型通信系統(tǒng)前端的 方框圖。噪聲活動(dòng)檢測(cè)器以多頻帶處理操作,從而時(shí)域信號(hào)被劃分到多個(gè)頻帶內(nèi)??梢允?用一組帶通濾波器(未示出),或通過應(yīng)用傅立葉變換處理,或通過用于多頻帶轉(zhuǎn)換的任意 其它處理完成多頻帶轉(zhuǎn)換。到頻域的轉(zhuǎn)換是公知的處理,該處理可以使用例如短時(shí)傅立葉變換(STFT)技術(shù)或其它公知的頻域轉(zhuǎn)換方法。由于使用NAD 20的系統(tǒng)很可能為諸如頻譜相減、麥克風(fēng)靈敏度匹配和/或自動(dòng)增益控制處理的其它處理采用STFT方法,很可能已經(jīng) 可獲得該轉(zhuǎn)換步驟,并且NAD 20需要很少的附加處理。示例實(shí)施例采用快速傅立葉變換, 并且在頻域執(zhí)行NAD 20的處理。因此,按照示例系統(tǒng),可以在應(yīng)用此處公開的處理之前將 輸入信號(hào)轉(zhuǎn)換到頻域。參考圖8,在組幀方框10對(duì)例如將來自麥克風(fēng)(未示出)的模擬輸入信號(hào)組成 幀。使用窗口方框12用于創(chuàng)建窗口,窗口應(yīng)用方框13將該窗口應(yīng)用于成幀的數(shù)據(jù)。以傅 立葉變換方框14 (例如,快速傅立葉變換(FFT)或如上面解釋的其它適合的變換處理)將 成幀的窗口數(shù)據(jù)轉(zhuǎn)換到頻域,并且以子頻帶選擇方框15將該頻域結(jié)果劃分到一個(gè),或可選 擇地,多于一個(gè)的子頻帶內(nèi)。在示例實(shí)施例中,具有Sksps(千樣本每秒)采樣速率的通信音頻信號(hào)被劃分為 512個(gè)樣本幀,對(duì)其應(yīng)用漢明窗口,使用FFT (快速傅立葉變換)將其轉(zhuǎn)換到頻域,并且選擇 由250Hz和2,500Hz之間的頻率區(qū)間組成的單個(gè)子頻帶。將獲得的子頻帶區(qū)間作為輸入提供給NAD 20,提供NAD 20的輸出用于對(duì)與特定 通信應(yīng)用相關(guān)聯(lián)的所希望處理的后續(xù)控制。方框16表示在使用噪聲檢測(cè)器的系統(tǒng)的設(shè)計(jì)過程中,由專業(yè)人員執(zhí)行的噪聲模 型和頻率處理確定,并且是特定應(yīng)用的一種功能。分析由預(yù)期應(yīng)用的傳感器系統(tǒng)感測(cè)到的 典型噪聲,以便使用公知的曲線擬合方法進(jìn)行曲線擬合。擬合的數(shù)學(xué)曲線的形狀就是噪聲 模型,例如,在圖1-3中,該模型是以下降的長(zhǎng)虛線示出的直線。在設(shè)計(jì)處理過程中還通過 確定建模功率與平均功率值相等處的頻率,確定有效頻率Fe。方框17表示對(duì)關(guān)鍵帶寬的確定。關(guān)鍵帶寬通常是連續(xù)的頻率范圍,其包括這樣的 范圍,在該范圍中數(shù)據(jù)與所述模型相適合。在圖1-3的信號(hào)中,可以看到被測(cè)量系統(tǒng)的數(shù)據(jù) 在從大約200HZ到2,500Hz和3,OOOHz之間的某個(gè)頻率的頻率范圍上與該直線模型相適 合。作為例子,可以選擇250HZ到2,500Hz的頻率范圍。對(duì)所選擇的頻率范圍進(jìn)行小的調(diào) 整以便提供適合數(shù)目的FFT區(qū)間不會(huì)明顯影響噪聲檢測(cè)器的性能。在示例實(shí)施例中,噪聲 活動(dòng)檢測(cè)器所使用的帶寬包括128個(gè)FFT區(qū)間,當(dāng)是2的偶數(shù)冪時(shí),它是計(jì)算128個(gè)區(qū)間內(nèi) 的平均功率的適合的除數(shù)。方框16和17的關(guān)鍵帶寬、噪聲功率模型和有效頻率確定處理可以使用如下步 驟 在典型輸入信號(hào)狀態(tài)下檢查輸入信號(hào)的功率譜。這樣選擇將要使用的子頻帶 (方框15),從而它僅包括針對(duì)該任務(wù)的有效信息。例如,在單通道語音級(jí)通信系統(tǒng)中,從 250HZ延伸到3000Hz的子頻帶是適合的??梢匀菀椎卮_定用于其它系統(tǒng)的子頻帶帶寬和子 頻帶數(shù)目?!槊總€(gè)子頻帶選擇模型和模型復(fù)雜度(方框16)(對(duì)于每個(gè)子頻帶,它們不必相 同)??梢詾檫@個(gè)步驟使用多項(xiàng)式曲線擬合,或可以應(yīng)用任意其它常見的曲線擬合方法。最 好是單調(diào)函數(shù)。對(duì)于上述示例實(shí)施例,該模型使用具有兩個(gè)參數(shù)(即,斜率和截距)的一階 曲線(直線)。 根據(jù)典型的僅為噪聲的數(shù)據(jù)確定參數(shù)值。在示例實(shí)現(xiàn)中,根據(jù)頻率響應(yīng)數(shù)據(jù)確定 斜率,并且以平均能量確定截距。
·計(jì)算有效頻率——即,在該頻率處模型功率曲線的值與包含在實(shí)際測(cè)量噪聲信 號(hào)的該子頻帶部分內(nèi)的平均信號(hào)功率相等的頻率。如圖1-3所示,這是短虛線與長(zhǎng)虛線在 圖上相交處的頻率——即,746Hz。當(dāng)然,746Hz的值僅針對(duì)此處描述的例子,并且其它應(yīng)用 將具有不同的有效頻率。 參考圖9更詳細(xì)地描述方框16的處理,圖9是一般地示出了噪聲活動(dòng)檢測(cè)器 (NAD) 20的操作的流程圖。輸入信號(hào)是子頻帶信號(hào)22,它是由圖8的子頻帶選擇處理15提 供的輸出信號(hào),并且在關(guān)鍵帶寬步驟30中被用于計(jì)算平均能量。在步驟26執(zhí)行噪聲模型確定,并且在步驟28執(zhí)行有效頻率確定。步驟26和28 相應(yīng)于圖8的方框16。如前所述,可以基于視覺觀察執(zhí)行噪聲模型確定,或以已知的曲線擬 合算法更嚴(yán)謹(jǐn)?shù)卮_定噪聲模型。從而,可以確定任意特定功率曲線模型表示測(cè)量的信號(hào)功 率數(shù)據(jù)的適合性如何。在圖1-3的數(shù)據(jù)的情況下,可以看出具有近似每倍頻程_6dB的斜率 的直線相當(dāng)好地模擬了對(duì)于這些圖中示出的所有噪聲源數(shù)據(jù)的傳感器系統(tǒng)響應(yīng),并且通過 麥克風(fēng)系統(tǒng)測(cè)量的噪聲功率在大約200Hz到2,500Hz的頻率范圍上大體上符合直線模型。 因此,對(duì)關(guān)鍵帶寬的確定(步驟17)可將這種帶寬用于單通道系統(tǒng),或可將多個(gè)關(guān)鍵子頻帶 用于多通道系統(tǒng)。不同的麥克風(fēng)設(shè)計(jì)將產(chǎn)生不同的結(jié)果,并且可能需要噪聲信號(hào)的曲線模 型而不是直線模型??梢允褂脟?yán)謹(jǐn)?shù)那€擬合方法以便提供精確的模型,但是為了實(shí)現(xiàn)所 希望的結(jié)果一般不需要這樣做,并且模型越復(fù)雜,操作噪聲檢測(cè)器所需的處理能力越多。另外,如上所述完成對(duì)有效頻率Fe的確定(步驟28),并且將對(duì)其進(jìn)行更全面的描 述。在已經(jīng)確定了噪聲功率模型26和關(guān)鍵帶寬17的形狀之后,在關(guān)鍵帶寬上對(duì)功率模型 積分,以便確定平均模型功率級(jí)別。這個(gè)級(jí)別與噪聲功率模型曲線相交處的頻率是有效頻 率Fe ο設(shè)噪聲功率模型被定義為Pnm (f) = a · Sn (f)(1)其中PM(f)是噪聲功率模型,Sn(f)是噪聲功率模型形狀函數(shù),f是頻率,并且α 是將被確定的幅值矢量因子。在關(guān)鍵帶寬上對(duì)形狀模型積分,并且然后將其除以關(guān)鍵帶寬 Bffc,以便產(chǎn)生平均噪聲功率模型級(jí)別。假設(shè)子頻帶的關(guān)鍵帶寬被以其下頻率邊界flOT和其上頻率邊界fhi定義。在此處 討論的示例情況下,flow = 200并且fhi = 2500。因此Bffc = fhi-flow(2)并且,平均噪聲功率模型級(jí)別是rm evs ‘
DWc A,(3)平均噪聲模型功率級(jí)別在有效頻率Fe處與噪聲功率模型的值相等。艮口,Pnm avg = Pnm(Fe)(4)因此,通過求解等式4可以找到Fe。容易發(fā)現(xiàn),單調(diào)的模型曲線是優(yōu)選的。對(duì)于示例的情況,Pnm (f) = a · Γ2(5)并且<formula>formula see original document page 14</formula>
它實(shí)際上為大約700Ηζ。還可以在噪聲檢測(cè)器的設(shè)計(jì)過程中預(yù)先確定關(guān)鍵帶寬、噪聲功率模型和有效頻率 的所有上述參數(shù),并且不必實(shí)時(shí)計(jì)算這些參數(shù),從而減少了操作系統(tǒng)所需的計(jì)算能力?,F(xiàn)在參考圖9描述噪聲活動(dòng)檢測(cè)器(NAD) 20的實(shí)時(shí)操作,圖9示出了所執(zhí)行的各 種步驟或任務(wù)的流程圖。應(yīng)當(dāng)理解,如圖10所示,這些任務(wù)中的每一個(gè)可被在專用電路中 執(zhí)行,或可以使用一個(gè)或多個(gè)電路執(zhí)行這些任務(wù)中的一個(gè)或多個(gè)。另外,可以使用單個(gè)處理 器或幾個(gè)處理器執(zhí)行這些任務(wù),每個(gè)處理器具有可專用于一個(gè)或多個(gè)任務(wù)的一個(gè)或多個(gè)模 塊。在圖9的步驟30,計(jì)算BW。中的平均能量,并且在所選擇的子頻帶的整個(gè)關(guān)鍵帶寬 上累加該功率,并且將其除以關(guān)鍵帶寬BW。,以便產(chǎn)生當(dāng)前幀的信號(hào)平均功率級(jí)別的值。提 供圖10的電路102用于這個(gè)任務(wù)。在圖9的步驟32使用這個(gè)平均功率級(jí)別值,以便定義 當(dāng)前數(shù)據(jù)幀所特有的閾值函數(shù)Th (f)。提供圖10的電路104用于這個(gè)目的。定義閾值函數(shù)Th (f),通過計(jì)算當(dāng)前數(shù)據(jù)幀中的平均功率,并且設(shè)置模型的級(jí)別 α,從而在有效頻率Fe處當(dāng)前幀的平均功率級(jí)別與模型的值相等,步驟32 (并且電路104) 使用在步驟26確定的噪聲功率模型PNM(f)、在步驟28確定的有效頻率Fe確定動(dòng)態(tài)的頻率 相關(guān)閾值。艮口,
<formula>formula see original document page 14</formula>(7)其中?_8是當(dāng)前平均功率級(jí)別。因此,在步驟32中電路104將第i個(gè)數(shù)據(jù)幀的閾 值函數(shù)確定為<formula>formula see original document page 14</formula>(8)注意,該閾值不是單個(gè)級(jí)別,并且不取決于先前的數(shù)據(jù)幀,這兩點(diǎn)對(duì)于其它這種檢 測(cè)器是共同的。由于閾值是立即性的——即,僅為當(dāng)前幀計(jì)算并且僅由當(dāng)前幀使用——使 得NAD 20能夠跟蹤背景噪聲的迅速改變。因此,使用利用平均能量對(duì)頻率相關(guān)閾值函數(shù)進(jìn) 行的動(dòng)態(tài)修改。使用閾值函數(shù)Thi (f)將當(dāng)前幀的頻譜數(shù)據(jù)劃分為兩組,功率數(shù)據(jù)幅值大于該閾值 的FFT頻率區(qū)間,以及功率數(shù)據(jù)幅值小于該閾值的FFT頻率區(qū)間。示出了風(fēng)噪和語音特性 的圖4-7全部表示這樣的數(shù)據(jù),當(dāng)被應(yīng)用于噪聲活動(dòng)檢測(cè)器20的示例實(shí)施例時(shí),該數(shù)據(jù)產(chǎn) 生每個(gè)相應(yīng)圖的長(zhǎng)虛線所示的閾值函數(shù)。每個(gè)FFT區(qū)間擁有一個(gè)復(fù)數(shù)值,該值具有相應(yīng)于 一幀時(shí)段上該FFT區(qū)間的頻率帶寬內(nèi)的信號(hào)內(nèi)容的平均幅值的幅值。在BW。步驟30中計(jì)算 平均能量時(shí),取每個(gè)FFT區(qū)間的幅值的平方,并且求這些平方值的平均值,從而提供在這些 幀的時(shí)間段上的每個(gè)區(qū)間的平均能量。如上所述,步驟32 (電路104)使用這個(gè)值確定Cii 的值,并且因此當(dāng)前幀的閾值函數(shù)Thi (f),其中i是幀索引。由電路106執(zhí)行計(jì)算Th (f)之 下的平均能量步驟34,其累加相應(yīng)于具有小于該閾值的幅值的區(qū)間的幅值的平方,并且將 該總和除以具有小于該閾值的幅值的區(qū)間的數(shù)目,得到具有小于該閾值的幅值的區(qū)間的每區(qū)間平均能量。另外,由電路108執(zhí)行計(jì)算Th(f)之上的平均能量步驟36,其累加相應(yīng)于 具有大于該閾值的幅值的區(qū)間的幅值的平方,并且將該總和除以具有大于該閾值的幅值的 區(qū)間的數(shù)目,得到具有大于該閾值的幅值的區(qū)間的每區(qū)間平均能量。步驟34提供信號(hào)Eb_ 而步驟36提供信號(hào)Eabqve。在步驟38和40中計(jì)算每個(gè)能量均值Eb_和Eabqve的對(duì)數(shù),并且可選擇地將得到 的值提供給濾波器,所述濾波器通過作用于來自連續(xù)幀的數(shù)據(jù),產(chǎn)生時(shí)間平滑功能。圖10 的對(duì)數(shù)電路110和濾波電路112提供這些功能。雖然平滑不是本申請(qǐng)的噪聲檢測(cè)器的正常 操作所需要的,但如果需要,可以使用這種濾波產(chǎn)生較長(zhǎng)的拖尾時(shí)間。然而,由于即使當(dāng)進(jìn) 入信號(hào)中的語音功率完全在噪聲功率之下時(shí),該檢測(cè)器也能夠正確地確定語音的存在,因 此附加的拖尾通常是多余的。當(dāng)希望時(shí),以下列形式的指數(shù)濾波器執(zhí)行示例實(shí)施例中的步驟38和40的濾波Exavg= αχ · (log(EYi)-log(EXi_1))+log(EXi_1) (9)其中Ey是Ebemw或Eab■,α χ是確定平滑量的時(shí)間常數(shù),其中α χ在0和1之間,并 且其中典型的值為0. 1。下標(biāo)X表示對(duì)于ABOVE和BELOW情況,α x可以不同。Ey是平滑輸 出信號(hào),其中Y可以是指定平滑哪個(gè)信號(hào)的ABV或BLW。對(duì)(多個(gè))平滑濾波器的類型和復(fù)雜性沒有限制,并且許多平滑濾波器是本領(lǐng)域 公知的??梢允褂每梢蕴峁┎粚?duì)稱的上升(發(fā)起)和下降(衰退)時(shí)間常數(shù)的更復(fù)雜的平 滑濾波器。當(dāng)ABOVE平滑信號(hào)的上升能夠比下降快,并且BELOW平滑信號(hào)的下降能夠比上 升快時(shí)產(chǎn)生拖尾。上述方法對(duì)于噪聲檢測(cè)器20的典型噪聲信號(hào)輸入提供兩個(gè)幅值類似的信號(hào),從 而對(duì)輸入信號(hào)中僅為噪聲的部分的檢測(cè)被簡(jiǎn)化為這些信號(hào)中的一個(gè)是否相對(duì)于另一個(gè)發(fā) 生了偏移。在系統(tǒng)設(shè)計(jì)過程中,由專業(yè)人員在確定偏移步驟42中確定偏移,其中該偏移略 微大于噪聲信號(hào)被輸入噪聲檢測(cè)器20時(shí)的兩個(gè)對(duì)數(shù)信號(hào)的隨機(jī)變化。這種偏移量防止噪 聲檢測(cè)器的錯(cuò)誤的否定觸發(fā),即,當(dāng)輸入信號(hào)的確僅為噪聲時(shí),對(duì)存在噪聲之外的信號(hào)的錯(cuò) 誤指示。這種錯(cuò)誤的觸發(fā)在相關(guān)聯(lián)的噪聲削減或使用噪聲檢測(cè)器的其它處理的操作中不產(chǎn) 生錯(cuò)誤,但是它使得某些操作變慢了。因此,該偏移旨在最小化這種作用。在增加偏移步驟 44中將所述偏移(可以是負(fù)數(shù))增加到對(duì)數(shù)和濾波器步驟40的輸出。只因如此,增加偏移 步驟可以在步驟38之后,并且該偏移被應(yīng)用于信號(hào)Eav,。在這種情況下,為了實(shí)現(xiàn)相同結(jié) 果,在步驟42中確定的偏移值具有相反的符號(hào)。在對(duì)兩個(gè)信號(hào)之一進(jìn)行偏移之后,在判斷步驟46 (電路114)中比較結(jié)果值。如果 步驟38的輸出Eav,大于步驟44的輸出EAV_HI,判斷步驟46使得設(shè)置噪聲指示器步驟48 (電 路116)將NAD輸出設(shè)置為指示僅有噪聲存在的“on”狀態(tài)。當(dāng)Eav,小于EAV_HI時(shí),決定判 斷步驟46使得重置噪聲指示器步驟50將NAD輸出重置為指示輸入信號(hào)中存在噪聲之外的 信號(hào)的“off ”狀態(tài)。替換實(shí)施例使用取決于NAD輸出當(dāng)前為on還是off的偏移值,并且以 這種方式,對(duì)于希望具有更穩(wěn)定的NAD輸出的應(yīng)用,可以在NAD轉(zhuǎn)換中結(jié)合滯后。為了示出這種噪聲檢測(cè)器的性能,圖11是未平滑的E^^+offset (偏移)信號(hào), Ebeot信號(hào)和噪聲活動(dòng)檢測(cè)器輸出信號(hào)的圖。水平刻度被示出為幀時(shí)間,并且垂直刻度對(duì)于 E-vfoffset和Ebeot信號(hào)是dB。在這個(gè)圖中,當(dāng)檢測(cè)到僅有噪聲狀態(tài)時(shí),NAD輸出信號(hào)為 高,并且當(dāng)發(fā)現(xiàn)非噪聲時(shí),NAD輸出信號(hào)為低。由于NAD輸出表示on/off 二值標(biāo)記,因此用于NAD輸出的刻度是任意的。圖的頂部帶有數(shù)字的部分指示不同時(shí)間的輸入信號(hào)特性。部分(1)和(5)是僅為 寂靜,并且噪聲檢測(cè)器20沒有信號(hào)輸入的時(shí)段。在該情況下,由于輸入信號(hào)既不是噪聲也 不是非噪聲,所以噪聲檢測(cè)器指示哪個(gè)狀態(tài)都是可接受的,并且噪聲削減系統(tǒng)沒有要被減 小的輸入噪聲。部分(2)是噪聲檢測(cè)器20的信號(hào)輸入是安靜環(huán)境狀態(tài)下的清晰語音的時(shí)段。第 二部分的結(jié)尾的僅具有正常房間環(huán)境聲音而沒有語音的短暫時(shí)段。該噪聲檢測(cè)器正確地處 理這種相對(duì)容易的狀態(tài),指出作為非噪聲的語音的存在,并且仍然檢測(cè)出僅有噪聲期間的 語音缺失。圖11的圖使用的系統(tǒng)包括平滑濾波器,以便通過在語音串停止之后存在檢測(cè)器 輸出不改變指示的短時(shí)間的設(shè)計(jì)提供附加的拖尾。部分(3)由非常響(85dB SPL)的僅有輸入噪聲的聲音組成,該聲音是音樂、單個(gè) 大聲語音和來自多個(gè)方向的串音的混合體。此處可見,噪聲檢測(cè)器指出大部分僅為噪聲,但 是即使背景語音的SNR低于-10dB,還作為單個(gè)響亮背景語音的結(jié)果產(chǎn)生非噪聲指示。在旁邊的部分(4)中,向部分(3)中的噪聲增加了語音,增加的語音SNR近似 為-3dB。按照設(shè)計(jì),NAD輸出示出正確地指出了僅有噪聲的時(shí)段,同時(shí)在談話過程中,NAD 正確地指出了非噪聲。這種低輸入SNR級(jí)別下的正確操作示出了這種新噪聲/語音檢測(cè)器 的能力。雖然已經(jīng)示出并且描述了實(shí)施例和應(yīng)用,從本公開中受益的本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)明了,可以做出比上述更多的修改而不脫離此處公開的創(chuàng)造性概念。因此,除了所附權(quán)利 要求的精神之外,本發(fā)明不受限制。
權(quán)利要求
一種用于產(chǎn)生信號(hào)中的噪聲活動(dòng)的指示的方法,包括a)計(jì)算所述信號(hào)在關(guān)鍵帶寬中的平均能量;b)確定與頻率相關(guān)的閾值函數(shù);c)使用所述平均能量產(chǎn)生對(duì)所述與頻率相關(guān)的閾值函數(shù)的動(dòng)態(tài)修改;d)識(shí)別所述信號(hào)的具有根據(jù)相應(yīng)頻率的閾值函數(shù)所確定的閾值之上的能量的頻率分量,并且確定第一平均能量值,第一平均能量值表示識(shí)別出的具有該閾值之上的能量的頻率分量的平均能量;e)識(shí)別所述信號(hào)的具有根據(jù)相應(yīng)頻率的閾值函數(shù)所確定的閾值之下的能量的頻率分量,并且確定第二平均能量值,第二平均能量值表示識(shí)別出的具有該閾值之下的能量的頻率分量的平均能量;f)給第一平均能量值和第二平均能量值中的至少一個(gè)應(yīng)用偏移值;g)在應(yīng)用所述偏移值之后,對(duì)獲得的第一平均能量值和第二平均能量值彼此進(jìn)行比較;和h)如果作為所述比較的結(jié)果,確定獲得的第一平均能量值低于獲得的第二平均能量值,則指示噪聲活動(dòng)的出現(xiàn)。
2.如權(quán)利要求1所述的方法,其中在多幀處理的各獨(dú)立幀上執(zhí)行過程a)_h)。
3.如權(quán)利要求1所述的方法,還包括在比較過程g)之前進(jìn)行濾波。
4.如權(quán)利要求3所述的方法,其中使用指數(shù)濾波器執(zhí)行所述濾波。
5.如權(quán)利要求3所述的方法,其中將具有不對(duì)稱的上升和下降時(shí)間常數(shù)的所述濾波應(yīng) 用于表示識(shí)別出的具有所述閾值之上的能量的頻率分量的平均能量的信號(hào),和識(shí)別出的具 有所述閾值之下的能量的頻率分量的平均能量的信號(hào)。
6.一種用于產(chǎn)生信號(hào)中的噪聲活動(dòng)的指示的噪聲活動(dòng)檢測(cè)器,包括a)第一電路,配置為計(jì)算關(guān)鍵帶寬中的平均能量;b)第二電路,配置為確定與頻率相關(guān)的閾值函數(shù);c)第三電路,配置為使用所述平均能量產(chǎn)生對(duì)所述與頻率相關(guān)的閾值函數(shù)的動(dòng)態(tài)修改;d)第四電路,配置為識(shí)別所述信號(hào)的具有根據(jù)相應(yīng)頻率的閾值函數(shù)所確定的閾值之上 的能量的頻率分量,并且確定第一平均能量值,第一平均能量值表示識(shí)別出的具有該閾值 之上的能量的頻率分量的平均能量;e)第五電路,配置為識(shí)別所述信號(hào)的具有根據(jù)相應(yīng)頻率的閾值函數(shù)所確定的閾值之下 的能量的頻率分量,并且確定第二平均能量值,第二平均能量值表示識(shí)別出的具有該閾值 之下的能量的頻率分量的平均能量;f)第六電路,配置為給第一平均能量值和第二平均能量值中的至少一個(gè)應(yīng)用偏移值;g)第七電路,配置為在應(yīng)用所述偏移值之后,對(duì)獲得的第一平均能量值和第二平均能 量值彼此進(jìn)行比較;和h)第八電路,配置為如果作為所述比較的結(jié)果,確定獲得的第一平均能量值低于獲得 的第二平均能量值,則指示噪聲活動(dòng)的出現(xiàn)。
7.如權(quán)利要求6所述的檢測(cè)器,其中所述電路在多幀處理的各獨(dú)立幀上執(zhí)行其功能。
8.如權(quán)利要求6所述的檢測(cè)器,還包括用于在比較之前進(jìn)行濾波的濾波器。
9.如權(quán)利要求8所述的檢測(cè)器,其中所述濾波器是指數(shù)濾波器。
10.如權(quán)利要求8所述的檢測(cè)器,其中所述濾波器包括合并有不對(duì)稱的上升和下降時(shí) 間常數(shù)的至少一個(gè)濾波器。
11.一種用于產(chǎn)生信號(hào)中的噪聲活動(dòng)的指示的噪聲活動(dòng)檢測(cè)器,包括a)用于計(jì)算所述信號(hào)在關(guān)鍵帶寬中的平均能量的裝置;b)用于確定與頻率相關(guān)的閾值函數(shù)的裝置;c)用于使用所述平均能量產(chǎn)生對(duì)所述與頻率相關(guān)的閾值函數(shù)的動(dòng)態(tài)修改的裝置;d)用于識(shí)別所述信號(hào)的具有根據(jù)相應(yīng)頻率的閾值函數(shù)所確定的閾值之上的能量的頻 率分量,并且確定第一平均能量值的裝置,第一平均能量值表示識(shí)別出的具有該閾值之上 的能量的頻率分量的平均能量;e)用于識(shí)別所述信號(hào)的具有根據(jù)相應(yīng)頻率的閾值函數(shù)所確定的閾值之下的能量的頻 率分量,并且確定第二平均能量值的裝置,第二平均能量值表示識(shí)別出的具有該閾值之下 的能量的頻率分量的平均能量;f)用于給第一平均能量值和第二平均能量值中的至少一個(gè)應(yīng)用偏移值的裝置;g)用于在應(yīng)用所述偏移值之后,對(duì)獲得的第一平均能量值和第二平均能量值彼此進(jìn)行 比較的裝置;和h)用于如果作為所述比較的結(jié)果,確定獲得的第一平均能量值低于獲得的第二平均能 量值,則指示噪聲活動(dòng)的出現(xiàn)的裝置。
12.如權(quán)利要求11所述的噪聲活動(dòng)檢測(cè)器,其中在多幀處理的各獨(dú)立幀上執(zhí)行過程 a)_h)。
13.如權(quán)利要求11所述的噪聲活動(dòng)檢測(cè)器,還包括在比較過程g)之前進(jìn)行濾波。
14.如權(quán)利要求13所述的噪聲活動(dòng)檢測(cè)器,其中使用指數(shù)濾波器執(zhí)行所述濾波。
15.如權(quán)利要求13所述的噪聲活動(dòng)檢測(cè)器,其中將具有不對(duì)稱的上升和下降時(shí)間常數(shù) 的所述濾波應(yīng)用于表示識(shí)別出的具有所述閾值之上的能量的頻率分量的平均能量的信號(hào), 和識(shí)別出的具有所述閾值之下的能量的頻率分量的平均能量的信號(hào)。
16.一種機(jī)器可讀的程序存儲(chǔ)設(shè)備,該程序存儲(chǔ)設(shè)備包含有用于執(zhí)行產(chǎn)生信號(hào)中的噪 聲活動(dòng)的指示的方法的機(jī)器可執(zhí)行指令的程序,該方法包括a)計(jì)算所述信號(hào)在關(guān)鍵帶寬中的平均能量;b)確定與頻率相關(guān)的閾值函數(shù);c)使用所述平均能量產(chǎn)生對(duì)所述與頻率相關(guān)的閾值函數(shù)的動(dòng)態(tài)修改;d)識(shí)別所述信號(hào)的具有根據(jù)相應(yīng)頻率的閾值函數(shù)所確定的閾值之上的能量的頻率分 量,并且確定第一平均能量值,第一平均能量值表示識(shí)別出的具有該閾值之上的能量的頻 率分量的平均能量;e)識(shí)別所述信號(hào)的具有根據(jù)相應(yīng)頻率的閾值函數(shù)所確定的閾值之下的能量的頻率分 量,并且確定第二平均能量值,第二平均能量值表示識(shí)別出的具有該閾值之下的能量的頻 率分量的平均能量;f)給第一平均能量值和第二平均能量值中的至少一個(gè)應(yīng)用偏移值;g)在應(yīng)用所述偏移值之后,對(duì)獲得的第一平均能量值和第二平均能量值彼此進(jìn)行比 較;和h)如果作為所述比較的結(jié)果,確定獲得的第一平均能量值低于獲得的第二平均能量 值,則指示噪聲活動(dòng)的出現(xiàn)。
17.如權(quán)利要求16所述的設(shè)備,其中在多幀處理的各獨(dú)立幀上執(zhí)行過程a)_h)。
18.如權(quán)利要求16所述的設(shè)備,還包括 在比較過程g)之前進(jìn)行濾波。
19.如權(quán)利要求18所述的設(shè)備,其中使用指數(shù)濾波器執(zhí)行所述濾波。
20.如權(quán)利要求18所述的設(shè)備,其中將具有不對(duì)稱的上升和下降時(shí)間常數(shù)應(yīng)用于的所 述濾波表示識(shí)別出的具有所述閾值之上的能量的頻率分量的平均能量的信號(hào),和識(shí)別出的 具有所述閾值之下的能量的頻率分量的平均能量的信號(hào)。
全文摘要
一種噪聲活動(dòng)檢測(cè)器,包括用于計(jì)算關(guān)鍵頻帶中的平均能量的電路,用于確定閾值函數(shù)的電路,用于產(chǎn)生對(duì)閾值函數(shù)的動(dòng)態(tài)修改的電路,用于識(shí)別信號(hào)的具有根據(jù)該閥值函數(shù)所確定的閾值之上的能量的頻率分量,并且確定第一平均能量值的電路,其中第一平均能量值表示識(shí)別出的具有該閾值之上的能量的頻率分量的平均能量,用于識(shí)別信號(hào)的具有根據(jù)該閾值函數(shù)所確定的閾值之下的能量的頻率分量,并且確定第二平均能量值的電路,其中第二平均能量值表示識(shí)別出的具有該閾值之下的能量的頻率分量的平均能量,用于偏移第一平均能量值和第二平均能量值中的至少一個(gè)的電路,用于對(duì)第一和第二平均能量值彼此進(jìn)行比較的電路,用于如果第一平均能量值低于第二平均能量值,則指示噪聲活動(dòng)的出現(xiàn)的電路。
文檔編號(hào)H04B15/00GK101821971SQ200880111290
公開日2010年9月1日 申請(qǐng)日期2008年8月22日 優(yōu)先權(quán)日2007年8月22日
發(fā)明者J·C·塔恩澤 申請(qǐng)人:杜比實(shí)驗(yàn)室特許公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1