聲音處理裝置及方法

文檔序號(hào)：7755779閱讀：151來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：聲音處理裝置及方法
技術(shù)領(lǐng)域：
本發(fā)明涉及聲音處理裝置及方法，尤其涉及對(duì)麥克風(fēng)進(jìn)行靈敏度校正的聲音處理
直O(jiān)
背景技術(shù)：
麥克風(fēng)陣列上用來處理聲音信號(hào)的方法很多。舉例而言，廣義旁瓣對(duì)消法 (generalized sidelobe cancellation，GSC)艮口為一常見的方法。圖1為使用GSC方法的傳統(tǒng)聲音處理裝置示意圖。聲音處理裝置100包括一主麥克風(fēng)110、一參考麥克風(fēng)120、一固定式聲波束形成器130、一適應(yīng)性閉塞濾波器(adaptive blocking filter) 140以及一適應(yīng)性干擾消除器150。主麥克風(fēng)110與參考麥克風(fēng)120從一音源接收聲音(圖未示)，以及無可避免地從非音源處接收到噪音，其中聲為理想信號(hào)，而噪音則不是。主麥克風(fēng)110與參考麥克風(fēng)120產(chǎn)生的輸入信號(hào)會(huì)被進(jìn)一步提供至該固定式聲波束形成器130及該適應(yīng)性閉塞濾波器140。該固定式聲波束形成器130采用GSC方法以從混合的聲音及噪音中擷取出理想信號(hào)，以產(chǎn)生對(duì)應(yīng)至聲音的主通道輸出，而該適應(yīng)性閉塞濾波器140從混合的聲音與噪音中移除該理想信號(hào)，并產(chǎn)生對(duì)應(yīng)至噪音的一參考通道輸出。由于參考通道在各個(gè)頻道上的遺漏使得主通道輸出總有許多旁瓣產(chǎn)生，故將該適應(yīng)性干擾消除器150耦接至該固定式聲波束形成器130及適應(yīng)性閉塞濾波器140以補(bǔ)償主通道輸出，進(jìn)而取得最終輸出。在聲束形成之后，該最終輸出被提供至一維納后端濾波器 (Wiener post-filter)以進(jìn)一步減低靜態(tài)與非靜態(tài)噪音。該GSC聲波束形成器與維納后端濾波器的效能必須依賴兩麥克風(fēng)110與參考麥克風(fēng)120在靈敏度上的完美匹配?？稍谶m應(yīng)性閉塞濾波器140與適應(yīng)性干擾消除器150中使用聲音動(dòng)態(tài)檢測(cè)器(voice activity detectors, VAD)以避免誤消到理想的聲音。當(dāng)麥克風(fēng)欠缺可靠的靈敏度校正機(jī)制時(shí)，VAD即無法提供正確的信息。然而，麥克風(fēng)之間的靈敏度不匹配始終存在。再者，由于GSC聲束形成法是在時(shí)域中實(shí)施，而聲音與噪音在接收時(shí)又是互相混合的，所以GSC聲束形成法很難移除所有的即時(shí)雜訊。因此需要一種新方法處理前述問題。

發(fā)明內(nèi)容
本發(fā)明提供一種聲音處理裝置。該聲音處理裝置包括一主麥克風(fēng)，用以從一音源接收一聲音并從一背景接收一噪音，并產(chǎn)生一主輸入；一參考麥克風(fēng)，用以接收該聲音與該噪音并產(chǎn)生一參考輸入；一短時(shí)傅立葉變換(short-time Fourier transformation, STFT)單元，用以利用短時(shí)傅立葉變換以將時(shí)域的該主輸入變換成頻域的一主信號(hào)，并將時(shí)域的該參考輸入變換成頻域的一參考信號(hào)；一靈敏度校正單元，用以對(duì)該主信號(hào)與該參考信號(hào)進(jìn)行靈敏度校正，并產(chǎn)生一主校正信號(hào)與一參考校正信號(hào)；一聲音動(dòng)態(tài)檢測(cè)器(voice active detector，VAD)，用以依據(jù)該主校正信號(hào)、該參考校正信號(hào)以及一波到達(dá)方向(direction of arrival，D0A)信號(hào)產(chǎn)生一聲音動(dòng)態(tài)信號(hào)；以及一聲波束形成器(beamformer)，用以依據(jù)該聲音動(dòng)態(tài)信號(hào)將該主校正信號(hào)變換成一主通道，并將該參考校正信號(hào)變換成一參考通道。本發(fā)明還提供一聲音處理方法。該聲音處理方法包括從一音源接收一聲音并從一背景接收一噪音，并產(chǎn)生一主輸入；接收該聲音與該噪音并產(chǎn)生一參考輸入；利用短時(shí)傅立葉變換以將時(shí)域的該主輸入變換成頻域的一主信號(hào)，并將時(shí)域的該參考輸入變換成頻域的一參考信號(hào)；對(duì)該主信號(hào)與該參考信號(hào)進(jìn)行靈敏度校正，并產(chǎn)生一主校正信號(hào)與一參考校正信號(hào)；依據(jù)該主校正信號(hào)、該參考校正信號(hào)以及一波到達(dá)方向(direction of arrival, D0A)信號(hào)產(chǎn)生一聲音動(dòng)態(tài)信號(hào)；以及依據(jù)該聲音動(dòng)態(tài)信號(hào)將該主校正信號(hào)變換成一主通道，并將該參考校正信號(hào)變換成一參考通道。

圖1為使用GSC方法的傳統(tǒng)聲音處理裝置示意圖。
圖2A為依照本發(fā)明一實(shí)施例的聲音處理裝置。
圖2B為一實(shí)例中主麥克風(fēng)與參考麥克風(fēng)在移動(dòng)電話上的位
圖3A依照本發(fā)明一實(shí)施例為聲音處理方法的流程圖。
圖3B為步驟S330的詳細(xì)流程。
圖3C為步驟S340的詳細(xì)流程。
圖3D為步驟S350的詳細(xì)流程。
主要元件符號(hào)說明
100 聲音處理裝置；
110 主麥克風(fēng)；
120 參考麥克風(fēng)；
130 固定式聲波束形成器；
140 適應(yīng)性閉塞濾波器；
150 適應(yīng)性干擾消除器；
200 聲音處理裝置；
202 主麥克風(fēng)；
204 參考麥克風(fēng)；
210 短時(shí)傅立葉變換單元；
220 靈敏度校正單元；
230 聲音動(dòng)態(tài)檢測(cè)器；
222 空間譜估計(jì)器；
224 擴(kuò)散噪音檢測(cè)器；
226 靈敏度不匹配計(jì)算器；
228 靈敏度不匹配移除器；
240 聲波束形成器；
250 噪音抑制單元；
260 反STFT單元；
Ml 乂輸入；
M2 -、參考輸入；
Sl -、主信號(hào)；
S2 -、參考信號(hào)；
Sl -、主信號(hào)；
S2 -、參考信號(hào)；
Cl -、主校正信號(hào)；
C2 -、參考校正信號(hào)。
具體實(shí)施例方式下文為介紹本發(fā)明的最佳實(shí)施例。各實(shí)施例用以說明本發(fā)明的原理，但非用以限制本發(fā)明。本發(fā)明的范圍當(dāng)以所附的權(quán)利要求書為準(zhǔn)。圖2A為依照本發(fā)明一實(shí)施例的聲音處理裝置。聲音處理裝置200包括一主麥克風(fēng)202、一參考麥克風(fēng)204、一短時(shí)傅立葉變換(STFT)單元210、一靈敏度校正單元220、一聲音動(dòng)態(tài)檢測(cè)器(VAD) 230、一聲波束形成器240、一噪音抑制單元250以及一反STFT單元 260。為方便說明，在本發(fā)明的實(shí)施例中聲音處理裝置200可為一移動(dòng)電話，然而，本領(lǐng)域技術(shù)人員可了解到，本發(fā)明不必以此為限主麥克風(fēng)202與參考麥克風(fēng)204用以自一音源接收聲音(圖2中未示)并自一背景接收噪音，主麥克風(fēng)202與參考麥克風(fēng)204分別配置于移動(dòng)電話的不同位置。圖2B為一實(shí)例中主麥克風(fēng)與參考麥克風(fēng)在移動(dòng)電話上的位置。在此實(shí)施例中，移動(dòng)電話300包括一面板310與一背板1320，而該主麥克風(fēng)202配置于前板 310的底部，而該參考麥克風(fēng)204配置于該背板320的頂部(本發(fā)明不必以此為限。主麥克風(fēng)202較參考麥克風(fēng)204更靠近該音源，例如，說話者的口部。值得注意的是，由于前板310 與后板320間存在實(shí)體障礙，所以參考麥克風(fēng)204自該音源所接收的聲音會(huì)較主麥克風(fēng)202 來得少。這兩個(gè)麥克風(fēng)的位置將有利于信號(hào)處理。在此實(shí)施例中，主麥克風(fēng)202與參考麥克風(fēng)204分別將混合的聲音與噪音分別變換成一主輸入Ml與參考輸入M2，如圖2所示。主輸入Ml與參考輸入M2為時(shí)域信號(hào)，并被提供至STFT單元210。STFT單元210 分別將時(shí)域的主輸入Ml與參考輸入M2變換成頻域的主信號(hào)Sl與參考信號(hào)S2。靈敏度校正單元220接收主信號(hào)Sl與參考信號(hào)S2，并對(duì)主信號(hào)Sl與參考信號(hào)S2 進(jìn)行靈敏度校正，以產(chǎn)生一主校正信號(hào)Cl與一參考校正信號(hào)C2。在本發(fā)明中，靈敏度校正單元220還包括一空間譜估計(jì)器222、一擴(kuò)散噪音檢測(cè)器224、一靈敏度不匹配計(jì)算器226 以及一靈敏度不匹配移除器228，用以消除靈敏度不匹配，進(jìn)而使聲音處理裝置200取得較佳的信號(hào)?？臻g譜估計(jì)器222用以依據(jù)主信號(hào)Sl與參考信號(hào)S2產(chǎn)生空間譜。空間譜估計(jì)器222取得空間譜的方法很多，包括，Capon空間譜估計(jì)法、多重信號(hào)分類(multiple signal classification, MUSIC)空間譜估計(jì)法、GCC空間譜估計(jì)法以及相位變換(phase transfer,PHAT)空間譜估計(jì)法。在此實(shí)施例中，空間譜可指出主信號(hào)與參考信號(hào)的功率分布與入射角間的函數(shù)關(guān)系?？臻g譜顯示了主麥克風(fēng)202與參考麥克風(fēng)204所接收聲音與噪音的混合。如本領(lǐng)域技術(shù)人員所知，空間譜中大致平坦的曲線由遠(yuǎn)場(chǎng)(遠(yuǎn)場(chǎng))噪音所造成，而空間譜中突出的主峰則是由近場(chǎng)(近場(chǎng))聲音，即說話者的聲音及環(huán)境中的點(diǎn)源噪音所造成。本發(fā)明利用擴(kuò)散噪音校正麥克風(fēng)202與204間的靈敏度不匹配。擴(kuò)散噪音檢測(cè)器 224可用來檢驗(yàn)空間譜，以指出是否存在擴(kuò)散噪音。一般來說，擴(kuò)散噪音會(huì)使空間譜中出現(xiàn)平坦的曲線，本領(lǐng)域技術(shù)人員可從中輕易分辨出何者為擴(kuò)散噪音而何者為點(diǎn)源噪音。由于擴(kuò)散噪音被視為遠(yuǎn)場(chǎng)噪音，因此被主麥克風(fēng)202及參考麥克風(fēng)204所感測(cè)到的功率都是相同的。靈敏度不匹配計(jì)算器226配置于本發(fā)明中，可用來在擴(kuò)散噪音檢測(cè)器224指出擴(kuò)散噪音存在時(shí)，判斷主信號(hào)Sl與參考信號(hào)S2間的靈敏度不匹配。接著，靈敏度不匹配移除器 228接收該主信號(hào)Sl與參考信號(hào)S2，并移除主信號(hào)Sl與參考信號(hào)S2之間的靈敏度不匹配，并產(chǎn)生主校正信號(hào)Cl與參考校正信號(hào)C2。接著將麥克風(fēng)202與204的靈敏度校正成彼此相等，并進(jìn)一步處理主校正信號(hào)Cl 與參考校正信號(hào)C2以取得更好的信號(hào)。聲音處理裝置200還包括一波到達(dá)方向(direction of arrival,D0A)估計(jì)器232，其用以檢驗(yàn)空間譜并產(chǎn)生一 DOA信號(hào)Dl，其中DOA信號(hào)Dl指出空間譜是否存在主峰。VAD 230用以依據(jù)主校正信號(hào)Cl、參考校正信號(hào)C2以及DOA信號(hào) Dl產(chǎn)生聲音動(dòng)態(tài)信號(hào)VI。更明確地說，VAD 230將主校正信號(hào)Cl與參考校正信號(hào)C2間的功率比一倉一倉地(bin by bin)與一預(yù)設(shè)臨界值進(jìn)行比較。舉例而言，當(dāng)一倉中的功率比小于預(yù)設(shè)臨界值，則該倉的信號(hào)即被視為噪音而予以刪除，并開啟聲音動(dòng)態(tài)信號(hào)。然而，當(dāng)一倉中的功率比大于該預(yù)設(shè)臨界值，則該倉的信號(hào)將被視為理想信號(hào)而予以保留，并關(guān)閉聲音動(dòng)態(tài)信號(hào)。聲波束形成器240用以依據(jù)the聲音動(dòng)態(tài)信號(hào)Vl將主校正信號(hào)Cl變換成一主通道Ni，并將參考校正信號(hào)C2變換成參考通道N2。聲波束形成器240還包括一陣列流形矩陣辨識(shí)單元242、一主通道產(chǎn)生器244以及一參考通道產(chǎn)生器246。陣列流形矩陣辨識(shí)單元 242用以依據(jù)聲音動(dòng)態(tài)信號(hào)Vl追蹤信號(hào)子空間，并產(chǎn)生一導(dǎo)引向量信號(hào)V2。陣列流形矩陣辨識(shí)單元242可采用的信號(hào)子空間追蹤方法可為PAST演算法。導(dǎo)引向量信號(hào)V2可依據(jù) VAD 230所提供的聲音動(dòng)態(tài)信號(hào)Vl指出各個(gè)頻率倉中的方向向量。主通道產(chǎn)生器244用以接收該主校正信號(hào)Cl以及該參考校正信號(hào)C2，并依據(jù)該導(dǎo)引向量信號(hào)V2產(chǎn)生主通道Ni，其中主通道附對(duì)應(yīng)至從音源上接收的聲音。舉例而言，主通道產(chǎn)生器244中可利用最小方差無失真口向應(yīng)(minimum variance distortionless response,MVDR)演算法進(jìn)行聲束形成的處理。參考通道產(chǎn)生器246用以接收主校正信號(hào)Cl與參考校正信號(hào)C2，并依據(jù)導(dǎo)引向量信號(hào)V2產(chǎn)生參考通道N2，其中參考通道N2對(duì)應(yīng)至從背景接收到的噪音。舉例而言，參考通道產(chǎn)生器246可將理想信號(hào)(從音源接收的聲音)消除以取得該參考通道N2。雖然在聲波束形成器240處理之后可取得主通道m(xù)與參考通道N2，但仍可能存在部分非線性的噪音。噪音抑制單元250即用以依據(jù)聲音動(dòng)態(tài)信號(hào)Vl進(jìn)一步抑制主通道 Nl與參考通道N2中的靜態(tài)與非靜態(tài)噪音，并將主通道m(xù)與參考通道N2整合成一最終信號(hào) F1。舉例而言，噪音抑制單元是一維納后端濾波器。之后，反STFT單元260可利用反短時(shí)傅立葉變換將頻率的最終信號(hào)Fl變換成時(shí)域的最終輸出Pl。本發(fā)明還包括提供一聲音處理方法。圖3A依照本發(fā)明一實(shí)施例為聲音處理方法的流程圖。請(qǐng)參照?qǐng)D3A與圖2A，本聲音處理方法包括在步驟S310中，從音源接收一聲音，從背景接收一噪音，并產(chǎn)生主輸入M1，并產(chǎn)生一參考輸入M2;在步驟S320中，利用短時(shí)傅立葉變換而將時(shí)域的主輸入Ml變換成頻域的主信號(hào)Si，并將時(shí)域的參考輸入M2變換成頻域
8的參考信號(hào)S2 ；在步驟S330中，對(duì)主信號(hào)Sl與參考信號(hào)S2進(jìn)行靈敏度校正以產(chǎn)生一主校正信號(hào)Cl與一參考校正信號(hào)C2 ；在步驟S340中，依據(jù)主校正信號(hào)Cl、參考校正信號(hào)C2以及一波到達(dá)方向DOA信號(hào)Dl產(chǎn)生一聲音動(dòng)態(tài)信號(hào)Vl ；在步驟S350中，依據(jù)聲音動(dòng)態(tài)信號(hào) V2將該主校正信號(hào)Cl變換成一主通道m(xù)，并將該參考校正信號(hào)C2變換成一參考通道N2 ；在步驟S360中，依據(jù)聲音動(dòng)態(tài)信號(hào)Vl抑制主通道附與參考通道N2中的靜態(tài)與非靜態(tài)噪音，并將主通道m(xù)與參考通道N2整合成一最終信號(hào)Fl ；而在步驟S370中，利用反短時(shí)傅立葉變換將該頻域的最終信號(hào)Fl變換成時(shí)域的最終輸出Pl。圖3B為步驟S330的詳細(xì)流程。請(qǐng)參照?qǐng)D3B與圖2。步驟S330還包括在步驟 S331中，依據(jù)主信號(hào)Sl與參考信號(hào)S2產(chǎn)生一空間譜，其中空間譜指出主信號(hào)Sl與參考信號(hào)S2的功率分布與入射角之間的函數(shù)關(guān)系；在步驟S332中，檢驗(yàn)空間譜以指出是否存在擴(kuò)散噪音；在步驟S333中，當(dāng)擴(kuò)散噪音檢測(cè)器指出擴(kuò)散噪音存在時(shí)，計(jì)算主信號(hào)Sl與參考信號(hào)S2之間的靈敏度不匹配；在步驟S334中，移除主信號(hào)Sl與參考信號(hào)S2間的靈敏度不匹配，并產(chǎn)生主校正信號(hào)Cl與參考校正信號(hào)C2。圖3C為步驟S340的詳細(xì)流程。請(qǐng)參照?qǐng)D3C與圖2。步驟S340還包括在步驟 S341中，檢驗(yàn)空間譜，并產(chǎn)生DOA信號(hào)D1，其中DOA信號(hào)Dl指出該空間譜是否存在一主峰；而在步驟S342中，將主校正信號(hào)Cl與參考校正信號(hào)C2間的功率比與一預(yù)設(shè)臨界值進(jìn)行比較；其中當(dāng)功率比大于一預(yù)設(shè)臨界值時(shí)，開啟該聲音動(dòng)態(tài)信號(hào)VI，而當(dāng)功率比小于該預(yù)設(shè)臨界值時(shí)，關(guān)閉聲音動(dòng)態(tài)信號(hào)V2。圖3D為步驟S350的詳細(xì)流程。請(qǐng)參照?qǐng)D3D與圖2。步驟S350還包括在步驟 S351中，追蹤信號(hào)子空間并依據(jù)聲音動(dòng)態(tài)信號(hào)Vl產(chǎn)生導(dǎo)引向量信號(hào)V2 ；在步驟S352中，接收主校正信號(hào)Cl與參考校正信號(hào)C2，并依據(jù)引向量信號(hào)V2產(chǎn)生主通道附與參考通道N2，其中主通道m(xù)對(duì)應(yīng)至從音源接收的聲音，而該參考通道N2對(duì)應(yīng)至由背景接收到的噪音。本發(fā)明雖以優(yōu)選實(shí)施例公開如上，然其并非用以限定本發(fā)明的范圍，本領(lǐng)域技術(shù)人員在不脫離本發(fā)明的精神和范圍內(nèi)，當(dāng)可做些許的更動(dòng)與潤(rùn)飾，因此本發(fā)明的保護(hù)范圍當(dāng)視所附權(quán)利要求書所界定者為準(zhǔn)。
權(quán)利要求
1.一種聲音處理裝置，包括一主麥克風(fēng)，用以從一音源接收一聲音并從一背景接收一噪音，并產(chǎn)生一主輸入；一參考麥克風(fēng)，用以接收該聲音與該噪音并產(chǎn)生一參考輸入；一短時(shí)傅立葉變換(short-time Fourier transformation,STFT)單元,用以利用短時(shí)傅立葉變換以將時(shí)域的該主輸入變換成頻域的一主信號(hào)，并將時(shí)域的該參考輸入變換成頻域的一參考信號(hào)；一靈敏度校正單元，用以對(duì)該主信號(hào)與該參考信號(hào)進(jìn)行靈敏度校正，并產(chǎn)生一主校正信號(hào)與一參考校正信號(hào)；一聲音動(dòng)態(tài)檢測(cè)器(voice active detector，VAD)，用以依據(jù)該主校正信號(hào)、該參考校正信號(hào)以及一波到達(dá)方向(direction of arrival, DOA)信號(hào)產(chǎn)生一聲音動(dòng)態(tài)信號(hào)；以及一聲波束形成器(beamformer)，用以依據(jù)該聲音動(dòng)態(tài)信號(hào)將該主校正信號(hào)變換成一主通道，并將該參考校正信號(hào)變換成一參考通道。
2.如權(quán)利要求1所述的聲音處理裝置，其中該主麥克風(fēng)被配置在較該參考麥克風(fēng)更靠近該音源之處。
3.如權(quán)利要求1所述的聲音處理裝置，其中該靈敏度校正單元還包括一空間譜估計(jì)器，用以依據(jù)該主信號(hào)與該參考信號(hào)產(chǎn)生一空間譜，其中該空間譜指出該主信號(hào)與該參考信號(hào)在功率分布與入射角間的函數(shù)關(guān)系。
4.如權(quán)利要求3所述的聲音處理裝置，其中該靈敏度校正單元還包括一擴(kuò)散噪音檢測(cè)器，用以檢驗(yàn)該空間譜以指出是否存在一擴(kuò)散噪音。
5.如權(quán)利要求4所述的聲音處理裝置，其中該靈敏度校正單元還包括一靈敏度不匹配計(jì)算器，用以在該擴(kuò)散噪音檢測(cè)器指出該擴(kuò)散噪音存在時(shí)，計(jì)算該主信號(hào)與參考信號(hào)間的靈敏度不匹配。
6.如權(quán)利要求5所述的聲音處理裝置，其中該靈敏度校正單元還包括一靈敏度不匹配移除器，用以接收該主信號(hào)與該參考信號(hào)，并移除該主信號(hào)與參考信號(hào)間的靈敏度不匹配，并產(chǎn)生該主校正信號(hào)與該參考校正信號(hào)。
7.如權(quán)利要求3所述的聲音處理裝置，還包括一DOA估計(jì)器，用以檢驗(yàn)該空間譜，并產(chǎn)生該DOA信號(hào)，其中該DOA信號(hào)指出在該空間譜中是否存在一主峰。
8.如權(quán)利要求1所述的聲音處理裝置，其中該VAD將該主校正信號(hào)與該參考校正信號(hào)間的功率比與一預(yù)設(shè)臨界值作比較；其中，當(dāng)該功率比大于一該預(yù)設(shè)臨界值時(shí)，該聲音動(dòng)態(tài)信號(hào)將被開啟，而當(dāng)該功率小于該預(yù)設(shè)臨界值時(shí)，該聲音動(dòng)態(tài)信號(hào)將被關(guān)閉。
9.如權(quán)利要求1所述的聲音處理裝置，其中該聲波束形成器還包括一陣列流形矩陣辨識(shí)單元，用以追蹤一信號(hào)子空間并依據(jù)該聲音動(dòng)態(tài)信號(hào)產(chǎn)生一導(dǎo)引向量信號(hào)。
10.如權(quán)利要求9所述的聲音處理裝置，其中該聲波束形成器還包括一主通道產(chǎn)生器，用以接收該主校正信號(hào)與該參考校正信號(hào)，并依據(jù)該導(dǎo)引向量信號(hào)產(chǎn)生該主通道，其中該主通道對(duì)應(yīng)至從該音源接收的該聲音；以及一參考通道產(chǎn)生器，用以接收該主校正信號(hào)與該參考校正信號(hào)，并依據(jù)該導(dǎo)引向量信號(hào)產(chǎn)生該參考通道，其中該參考通道對(duì)應(yīng)至從該背景接收的該噪音。
11.如權(quán)利要求1所述的聲音處理裝置，還包括，一噪音抑制單元，用以依據(jù)該聲音動(dòng)態(tài)信號(hào)抑制該主通道與該參考通道中的靜態(tài)與非靜態(tài)噪音，并將該主通道與該參考通道整合成一最終信號(hào)。
12.如權(quán)利要求1所述的聲音處理裝置，還包括，一反STFT單元，用以利用反短時(shí)傅立葉變換以將頻域的該最終信號(hào)變換成時(shí)域的一最終輸出。
13.如權(quán)利要求9所述的聲音處理裝置，其中該陣列流形矩陣辨識(shí)單元利用一投影逼近子空間追蹤(projection approximation subspace tracking，PAST)演算法。
14.如權(quán)利要求10所述的聲音處理裝置，其中該主通道產(chǎn)生器與該參考通道產(chǎn)生器利用一最小方差無失真口向應(yīng)(minimum variance distortionless response，MVDR)聲束形成方法以產(chǎn)生該主通道與該參考通道。
15.如權(quán)利要求11所述的聲音處理裝置，其中該噪音抑制單元是一維納后端濾波器 (Wiener post filter)。
16.一聲音處理方法，包括從一音源接收一聲音并從一背景接收一噪音，并產(chǎn)生一主輸入；接收該聲音與該噪音并產(chǎn)生一參考輸入；利用短時(shí)傅立葉變換以將時(shí)域的該主輸入變換成頻域的一主信號(hào)，并將時(shí)域的該參考輸入變換成頻域的一參考信號(hào)；對(duì)該主信號(hào)與該參考信號(hào)進(jìn)行靈敏度校正，并產(chǎn)生一主校正信號(hào)與一參考校正信號(hào)；依據(jù)該主校正信號(hào)、該參考校正信號(hào)以及一波到達(dá)方向(direction of arrival,DOA) 信號(hào)產(chǎn)生一聲音動(dòng)態(tài)信號(hào)；以及依據(jù)該聲音動(dòng)態(tài)信號(hào)將該主校正信號(hào)變換成一主通道，并將該參考校正信號(hào)變換成一參考通道。
17.如權(quán)利要求16所述的聲音處理方法，還包括依據(jù)該主信號(hào)與該參考信號(hào)產(chǎn)生一空間譜，其中該空間譜指出該主信號(hào)與該參考信號(hào)在功率分布與入射角間的函數(shù)關(guān)系。
18.如權(quán)利要求17所述的聲音處理方法，還包括檢驗(yàn)該空間譜以指出是否存在一擴(kuò)散噪音。
19.如權(quán)利要求18所述的聲音處理方法，還包括在該擴(kuò)散噪音檢測(cè)器指出該擴(kuò)散噪音存在時(shí)，計(jì)算該主信號(hào)與參考信號(hào)間的靈敏度不匹配。
20.如權(quán)利要求19所述的聲音處理方法，還包括移除該主信號(hào)與參考信號(hào)間的靈敏度不匹配，并產(chǎn)生該主校正信號(hào)與該參考校正信號(hào)。
21.如權(quán)利要求17所述的聲音處理方法，還包括檢驗(yàn)該空間譜，并產(chǎn)生該DOA信號(hào)，其中該DOA信號(hào)指出在該空間譜中是否存在一主峰。
22.如權(quán)利要求21所述的聲音處理方法，還包括將該主校正信號(hào)與該參考校正信號(hào)間的功率比與一預(yù)設(shè)臨界值作比較；其中，當(dāng)該功率比大于一該預(yù)設(shè)臨界值時(shí)，將該聲音動(dòng)態(tài)信號(hào)開啟，而當(dāng)該功率小于該預(yù)設(shè)臨界值時(shí)，將該聲音動(dòng)態(tài)信號(hào)關(guān)閉。
23.如權(quán)利要求16所述的聲音處理方法，還包括追蹤一信號(hào)子空間并依據(jù)該聲音動(dòng)態(tài)信號(hào)產(chǎn)生一導(dǎo)引向量信號(hào)。
24.如權(quán)利要求23所述的聲音處理方法，還包括接收該主校正信號(hào)與該參考校正信號(hào)，并依據(jù)該導(dǎo)引向量信號(hào)產(chǎn)生該主通道與該參考通道，其中該主通道對(duì)應(yīng)至從該音源接收的該聲音，而該參考通道對(duì)應(yīng)至從該背景接收的該噪音。
25.如權(quán)利要求16所述的聲音處理方法，還包括依據(jù)該聲音動(dòng)態(tài)信號(hào)抑制該主通道與該參考通道中的靜態(tài)與非靜態(tài)噪音，并將該主通道與該參考通道整合成一最終信號(hào)。
26.如權(quán)利要求16所述的聲音處理方法，還包括利用反短時(shí)傅立葉變換以將頻域的該最終信號(hào)變換成時(shí)域的一最終輸出。
全文摘要
聲音處理裝置及方法。該聲音處理裝置包括一主麥克風(fēng)及一參考麥克風(fēng)，用以接收該聲音與該噪音并產(chǎn)生一主輸入及一參考輸入；一STFT單元，用以利用短時(shí)傅立葉變換以將時(shí)域的該主輸入變換成頻域的一主信號(hào)，并將時(shí)域的該參考輸入變換成頻域的一參考信號(hào)；一靈敏度校正單元，用以對(duì)該主信號(hào)與該參考信號(hào)進(jìn)行靈敏度校正，并產(chǎn)生一主校正信號(hào)與一參考校正信號(hào)；一VAD，用以依據(jù)該主校正信號(hào)、該參考校正信號(hào)以及一DOA信號(hào)產(chǎn)生一聲音動(dòng)態(tài)信號(hào)；以及一聲波束形成器，用以依據(jù)該聲音動(dòng)態(tài)信號(hào)將該主校正信號(hào)變換成一主通道，并將該參考校正信號(hào)變換成一參考通道。
文檔編號(hào)H04R29/00GK102348156SQ20101024176
公開日2012年2月8日申請(qǐng)日期2010年7月29日優(yōu)先權(quán)日2010年7月29日
發(fā)明者劉勝, 李細(xì)林申請(qǐng)人:美商富迪科技股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李細(xì)林;劉勝
技術(shù)所有人：美商富迪科技股份有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

濕熱處理的方法和裝置相關(guān)技術(shù)

聲音裝置相關(guān)技術(shù)

聲音互動(dòng)裝置藝術(shù)案例相關(guān)技術(shù)

聲音裝置藝術(shù)相關(guān)技術(shù)

聲音復(fù)核裝置相關(guān)技術(shù)

聲音交互裝置相關(guān)技術(shù)

聲音互動(dòng)裝置相關(guān)技術(shù)

國(guó)際聲音裝置藝術(shù)展相關(guān)技術(shù)

交互式聲音體驗(yàn)裝置相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

聲音處理裝置及方法