專利名稱:聲音處理裝置及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及聲音處理裝置及方法,尤其涉及對(duì)麥克風(fēng)進(jìn)行靈敏度校正的聲音處理
直O(jiān)
背景技術(shù):
麥克風(fēng)陣列上用來處理聲音信號(hào)的方法很多。舉例而言,廣義旁瓣對(duì)消法 (generalized sidelobe cancellation,GSC)艮口為一常見的方法。圖1為使用GSC方法的傳統(tǒng)聲音處理裝置示意圖。聲音處理裝置100包括一主麥克風(fēng)110、一參考麥克風(fēng)120、一固定式聲波束形成器130、一適應(yīng)性閉塞濾波器(adaptive blocking filter) 140以及一適應(yīng)性干擾消除器150。主麥克風(fēng)110與參考麥克風(fēng)120從一音源接收聲音(圖未示),以及無可避免地從非音源處接收到噪音,其中聲為理想信號(hào), 而噪音則不是。主麥克風(fēng)110與參考麥克風(fēng)120產(chǎn)生的輸入信號(hào)會(huì)被進(jìn)一步提供至該固定式聲波束形成器130及該適應(yīng)性閉塞濾波器140。該固定式聲波束形成器130采用GSC方法以從混合的聲音及噪音中擷取出理想信號(hào),以產(chǎn)生對(duì)應(yīng)至聲音的主通道輸出,而該適應(yīng)性閉塞濾波器140從混合的聲音與噪音中移除該理想信號(hào),并產(chǎn)生對(duì)應(yīng)至噪音的一參考通道輸出。由于參考通道在各個(gè)頻道上的遺漏使得主通道輸出總有許多旁瓣產(chǎn)生,故將該適應(yīng)性干擾消除器150耦接至該固定式聲波束形成器130及適應(yīng)性閉塞濾波器140以補(bǔ)償主通道輸出,進(jìn)而取得最終輸出。在聲束形成之后,該最終輸出被提供至一維納后端濾波器 (Wiener post-filter)以進(jìn)一步減低靜態(tài)與非靜態(tài)噪音。該GSC聲波束形成器與維納后端濾波器的效能必須依賴兩麥克風(fēng)110與參考麥克風(fēng)120在靈敏度上的完美匹配??稍谶m應(yīng)性閉塞濾波器140與適應(yīng)性干擾消除器150中使用聲音動(dòng)態(tài)檢測(cè)器(voice activity detectors, VAD)以避免誤消到理想的聲音。當(dāng)麥克風(fēng)欠缺可靠的靈敏度校正機(jī)制時(shí),VAD即無法提供正確的信息。然而,麥克風(fēng)之間的靈敏度不匹配始終存在。再者,由于GSC聲束形成法是在時(shí)域中實(shí)施,而聲音與噪音在接收時(shí)又是互相混合的,所以GSC聲束形成法很難移除所有的即時(shí)雜訊。因此需要一種新方法處理前述問題。
發(fā)明內(nèi)容
本發(fā)明提供一種聲音處理裝置。該聲音處理裝置包括一主麥克風(fēng),用以從一音源接收一聲音并從一背景接收一噪音,并產(chǎn)生一主輸入;一參考麥克風(fēng),用以接收該聲音與該噪音并產(chǎn)生一參考輸入;一短時(shí)傅立葉變換(short-time Fourier transformation, STFT)單元,用以利用短時(shí)傅立葉變換以將時(shí)域的該主輸入變換成頻域的一主信號(hào),并將時(shí)域的該參考輸入變換成頻域的一參考信號(hào);一靈敏度校正單元,用以對(duì)該主信號(hào)與該參考信號(hào)進(jìn)行靈敏度校正,并產(chǎn)生一主校正信號(hào)與一參考校正信號(hào);一聲音動(dòng)態(tài)檢測(cè)器(voice active detector,VAD),用以依據(jù)該主校正信號(hào)、該參考校正信號(hào)以及一波到達(dá)方向(direction of arrival,D0A)信號(hào)產(chǎn)生一聲音動(dòng)態(tài)信號(hào);以及一聲波束形成器(beamformer),用以依據(jù)該聲音動(dòng)態(tài)信號(hào)將該主校正信號(hào)變換成一主通道,并將該參考校正信號(hào)變換成一參考通道。 本發(fā)明還提供一聲音處理方法。該聲音處理方法包括從一音源接收一聲音并從一背景接收一噪音,并產(chǎn)生一主輸入;接收該聲音與該噪音并產(chǎn)生一參考輸入;利用短時(shí)傅立葉變換以將時(shí)域的該主輸入變換成頻域的一主信號(hào),并將時(shí)域的該參考輸入變換成頻域的一參考信號(hào);對(duì)該主信號(hào)與該參考信號(hào)進(jìn)行靈敏度校正,并產(chǎn)生一主校正信號(hào)與一參考校正信號(hào);依據(jù)該主校正信號(hào)、該參考校正信號(hào)以及一波到達(dá)方向(direction of arrival, D0A)信號(hào)產(chǎn)生一聲音動(dòng)態(tài)信號(hào);以及依據(jù)該聲音動(dòng)態(tài)信號(hào)將該主校正信號(hào)變換成一主通道,并將該參考校正信號(hào)變換成一參考通道。
圖1為使用GSC方法的傳統(tǒng)聲音處理裝置示意圖。
圖2A為依照本發(fā)明一實(shí)施例的聲音處理裝置。
圖2B為一實(shí)例中主麥克風(fēng)與參考麥克風(fēng)在移動(dòng)電話上的位
圖3A依照本發(fā)明一實(shí)施例為聲音處理方法的流程圖。
圖3B為步驟S330的詳細(xì)流程。
圖3C為步驟S340的詳細(xì)流程。
圖3D為步驟S350的詳細(xì)流程。
主要元件符號(hào)說明
100 聲音處理裝置;
110 主麥克風(fēng);
120 參考麥克風(fēng);
130 固定式聲波束形成器;
140 適應(yīng)性閉塞濾波器;
150 適應(yīng)性干擾消除器;
200 聲音處理裝置;
202 主麥克風(fēng);
204 參考麥克風(fēng);
210 短時(shí)傅立葉變換單元;
220 靈敏度校正單元;
230 聲音動(dòng)態(tài)檢測(cè)器;
222 空間譜估計(jì)器;
224 擴(kuò)散噪音檢測(cè)器;
226 靈敏度不匹配計(jì)算器;
228 靈敏度不匹配移除器;
240 聲波束形成器;
250 噪音抑制單元;
260 反STFT單元;
Ml 乂輸入;
M2 -、參考輸入;
Sl -、主信號(hào);
S2 -、參考信號(hào);
Sl -、主信號(hào);
S2 -、參考信號(hào);
Cl -、主校正信號(hào);
C2 -、參考校正信號(hào)。
具體實(shí)施例方式下文為介紹本發(fā)明的最佳實(shí)施例。各實(shí)施例用以說明本發(fā)明的原理,但非用以限制本發(fā)明。本發(fā)明的范圍當(dāng)以所附的權(quán)利要求書為準(zhǔn)。圖2A為依照本發(fā)明一實(shí)施例的聲音處理裝置。聲音處理裝置200包括一主麥克風(fēng)202、一參考麥克風(fēng)204、一短時(shí)傅立葉變換(STFT)單元210、一靈敏度校正單元220、一聲音動(dòng)態(tài)檢測(cè)器(VAD) 230、一聲波束形成器240、一噪音抑制單元250以及一反STFT單元 260。為方便說明,在本發(fā)明的實(shí)施例中聲音處理裝置200可為一移動(dòng)電話,然而,本領(lǐng)域技術(shù)人員可了解到,本發(fā)明不必以此為限主麥克風(fēng)202與參考麥克風(fēng)204用以自一音源接收聲音(圖2中未示)并自一背景接收噪音,主麥克風(fēng)202與參考麥克風(fēng)204分別配置于移動(dòng)電話的不同位置。圖2B為一實(shí)例中主麥克風(fēng)與參考麥克風(fēng)在移動(dòng)電話上的位置。在此實(shí)施例中,移動(dòng)電話300包括一面板310與一背板1320,而該主麥克風(fēng)202配置于前板 310的底部,而該參考麥克風(fēng)204配置于該背板320的頂部(本發(fā)明不必以此為限。主麥克風(fēng)202較參考麥克風(fēng)204更靠近該音源,例如,說話者的口部。值得注意的是,由于前板310 與后板320間存在實(shí)體障礙,所以參考麥克風(fēng)204自該音源所接收的聲音會(huì)較主麥克風(fēng)202 來得少。這兩個(gè)麥克風(fēng)的位置將有利于信號(hào)處理。在此實(shí)施例中,主麥克風(fēng)202與參考麥克風(fēng)204分別將混合的聲音與噪音分別變換成一主輸入Ml與參考輸入M2,如圖2所示。主輸入Ml與參考輸入M2為時(shí)域信號(hào),并被提供至STFT單元210。STFT單元210 分別將時(shí)域的主輸入Ml與參考輸入M2變換成頻域的主信號(hào)Sl與參考信號(hào)S2。靈敏度校正單元220接收主信號(hào)Sl與參考信號(hào)S2,并對(duì)主信號(hào)Sl與參考信號(hào)S2 進(jìn)行靈敏度校正,以產(chǎn)生一主校正信號(hào)Cl與一參考校正信號(hào)C2。在本發(fā)明中,靈敏度校正單元220還包括一空間譜估計(jì)器222、一擴(kuò)散噪音檢測(cè)器224、一靈敏度不匹配計(jì)算器226 以及一靈敏度不匹配移除器228,用以消除靈敏度不匹配,進(jìn)而使聲音處理裝置200取得較佳的信號(hào)??臻g譜估計(jì)器222用以依據(jù)主信號(hào)Sl與參考信號(hào)S2產(chǎn)生空間譜。空間譜估計(jì)器222取得空間譜的方法很多,包括,Capon空間譜估計(jì)法、多重信號(hào)分類(multiple signal classification, MUSIC)空間譜估計(jì)法、GCC空間譜估計(jì)法以及相位變換(phase transfer,PHAT)空間譜估計(jì)法。在此實(shí)施例中,空間譜可指出主信號(hào)與參考信號(hào)的功率分布與入射角間的函數(shù)關(guān)系??臻g譜顯示了主麥克風(fēng)202與參考麥克風(fēng)204所接收聲音與噪音的混合。如本領(lǐng)域技術(shù)人員所知,空間譜中大致平坦的曲線由遠(yuǎn)場(chǎng)(遠(yuǎn)場(chǎng))噪音所造成, 而空間譜中突出的主峰則是由近場(chǎng)(近場(chǎng))聲音,即說話者的聲音及環(huán)境中的點(diǎn)源噪音所造成。本發(fā)明利用擴(kuò)散噪音校正麥克風(fēng)202與204間的靈敏度不匹配。擴(kuò)散噪音檢測(cè)器 224可用來檢驗(yàn)空間譜,以指出是否存在擴(kuò)散噪音。一般來說,擴(kuò)散噪音會(huì)使空間譜中出現(xiàn)平坦的曲線,本領(lǐng)域技術(shù)人員可從中輕易分辨出何者為擴(kuò)散噪音而何者為點(diǎn)源噪音。由于擴(kuò)散噪音被視為遠(yuǎn)場(chǎng)噪音,因此被主麥克風(fēng)202及參考麥克風(fēng)204所感測(cè)到的功率都是相同的。靈敏度不匹配計(jì)算器226配置于本發(fā)明中,可用來在擴(kuò)散噪音檢測(cè)器224指出擴(kuò)散噪音存在時(shí),判斷主信號(hào)Sl與參考信號(hào)S2間的靈敏度不匹配。接著,靈敏度不匹配移除器 228接收該主信號(hào)Sl與參考信號(hào)S2,并移除主信號(hào)Sl與參考信號(hào)S2之間的靈敏度不匹配, 并產(chǎn)生主校正信號(hào)Cl與參考校正信號(hào)C2。接著將麥克風(fēng)202與204的靈敏度校正成彼此相等,并進(jìn)一步處理主校正信號(hào)Cl 與參考校正信號(hào)C2以取得更好的信號(hào)。聲音處理裝置200還包括一波到達(dá)方向(direction of arrival,D0A)估計(jì)器232,其用以檢驗(yàn)空間譜并產(chǎn)生一 DOA信號(hào)Dl,其中DOA信號(hào)Dl指出空間譜是否存在主峰。VAD 230用以依據(jù)主校正信號(hào)Cl、參考校正信號(hào)C2以及DOA信號(hào) Dl產(chǎn)生聲音動(dòng)態(tài)信號(hào)VI。更明確地說,VAD 230將主校正信號(hào)Cl與參考校正信號(hào)C2間的功率比一倉一倉地(bin by bin)與一預(yù)設(shè)臨界值進(jìn)行比較。舉例而言,當(dāng)一倉中的功率比小于預(yù)設(shè)臨界值,則該倉的信號(hào)即被視為噪音而予以刪除,并開啟聲音動(dòng)態(tài)信號(hào)。然而,當(dāng)一倉中的功率比大于該預(yù)設(shè)臨界值,則該倉的信號(hào)將被視為理想信號(hào)而予以保留,并關(guān)閉聲音動(dòng)態(tài)信號(hào)。聲波束形成器240用以依據(jù)the聲音動(dòng)態(tài)信號(hào)Vl將主校正信號(hào)Cl變換成一主通道Ni,并將參考校正信號(hào)C2變換成參考通道N2。聲波束形成器240還包括一陣列流形矩陣辨識(shí)單元242、一主通道產(chǎn)生器244以及一參考通道產(chǎn)生器246。陣列流形矩陣辨識(shí)單元 242用以依據(jù)聲音動(dòng)態(tài)信號(hào)Vl追蹤信號(hào)子空間,并產(chǎn)生一導(dǎo)引向量信號(hào)V2。陣列流形矩陣辨識(shí)單元242可采用的信號(hào)子空間追蹤方法可為PAST演算法。導(dǎo)引向量信號(hào)V2可依據(jù) VAD 230所提供的聲音動(dòng)態(tài)信號(hào)Vl指出各個(gè)頻率倉中的方向向量。主通道產(chǎn)生器244用以接收該主校正信號(hào)Cl以及該參考校正信號(hào)C2,并依據(jù)該導(dǎo)引向量信號(hào)V2產(chǎn)生主通道Ni, 其中主通道附對(duì)應(yīng)至從音源上接收的聲音。舉例而言,主通道產(chǎn)生器244中可利用最小方差無失真口向應(yīng)(minimum variance distortionless response,MVDR)演算法進(jìn)行聲束形成的處理。參考通道產(chǎn)生器246用以接收主校正信號(hào)Cl與參考校正信號(hào)C2,并依據(jù)導(dǎo)引向量信號(hào)V2產(chǎn)生參考通道N2,其中參考通道N2對(duì)應(yīng)至從背景接收到的噪音。舉例而言,參考通道產(chǎn)生器246可將理想信號(hào)(從音源接收的聲音)消除以取得該參考通道N2。雖然在聲波束形成器240處理之后可取得主通道m(xù)與參考通道N2,但仍可能存在部分非線性的噪音。噪音抑制單元250即用以依據(jù)聲音動(dòng)態(tài)信號(hào)Vl進(jìn)一步抑制主通道 Nl與參考通道N2中的靜態(tài)與非靜態(tài)噪音,并將主通道m(xù)與參考通道N2整合成一最終信號(hào) F1。舉例而言,噪音抑制單元是一維納后端濾波器。之后,反STFT單元260可利用反短時(shí)傅立葉變換將頻率的最終信號(hào)Fl變換成時(shí)域的最終輸出Pl。本發(fā)明還包括提供一聲音處理方法。圖3A依照本發(fā)明一實(shí)施例為聲音處理方法的流程圖。請(qǐng)參照?qǐng)D3A與圖2A,本聲音處理方法包括在步驟S310中,從音源接收一聲音, 從背景接收一噪音,并產(chǎn)生主輸入M1,并產(chǎn)生一參考輸入M2;在步驟S320中,利用短時(shí)傅立葉變換而將時(shí)域的主輸入Ml變換成頻域的主信號(hào)Si,并將時(shí)域的參考輸入M2變換成頻域
8的參考信號(hào)S2 ;在步驟S330中,對(duì)主信號(hào)Sl與參考信號(hào)S2進(jìn)行靈敏度校正以產(chǎn)生一主校正信號(hào)Cl與一參考校正信號(hào)C2 ;在步驟S340中,依據(jù)主校正信號(hào)Cl、參考校正信號(hào)C2以及一波到達(dá)方向DOA信號(hào)Dl產(chǎn)生一聲音動(dòng)態(tài)信號(hào)Vl ;在步驟S350中,依據(jù)聲音動(dòng)態(tài)信號(hào) V2將該主校正信號(hào)Cl變換成一主通道m(xù),并將該參考校正信號(hào)C2變換成一參考通道N2 ; 在步驟S360中,依據(jù)聲音動(dòng)態(tài)信號(hào)Vl抑制主通道附與參考通道N2中的靜態(tài)與非靜態(tài)噪音,并將主通道m(xù)與參考通道N2整合成一最終信號(hào)Fl ;而在步驟S370中,利用反短時(shí)傅立葉變換將該頻域的最終信號(hào)Fl變換成時(shí)域的最終輸出Pl。圖3B為步驟S330的詳細(xì)流程。請(qǐng)參照?qǐng)D3B與圖2。步驟S330還包括在步驟 S331中,依據(jù)主信號(hào)Sl與參考信號(hào)S2產(chǎn)生一空間譜,其中空間譜指出主信號(hào)Sl與參考信號(hào)S2的功率分布與入射角之間的函數(shù)關(guān)系;在步驟S332中,檢驗(yàn)空間譜以指出是否存在擴(kuò)散噪音;在步驟S333中,當(dāng)擴(kuò)散噪音檢測(cè)器指出擴(kuò)散噪音存在時(shí),計(jì)算主信號(hào)Sl與參考信號(hào)S2之間的靈敏度不匹配;在步驟S334中,移除主信號(hào)Sl與參考信號(hào)S2間的靈敏度不匹配,并產(chǎn)生主校正信號(hào)Cl與參考校正信號(hào)C2。圖3C為步驟S340的詳細(xì)流程。請(qǐng)參照?qǐng)D3C與圖2。步驟S340還包括在步驟 S341中,檢驗(yàn)空間譜,并產(chǎn)生DOA信號(hào)D1,其中DOA信號(hào)Dl指出該空間譜是否存在一主峰; 而在步驟S342中,將主校正信號(hào)Cl與參考校正信號(hào)C2間的功率比與一預(yù)設(shè)臨界值進(jìn)行比較;其中當(dāng)功率比大于一預(yù)設(shè)臨界值時(shí),開啟該聲音動(dòng)態(tài)信號(hào)VI,而當(dāng)功率比小于該預(yù)設(shè)臨界值時(shí),關(guān)閉聲音動(dòng)態(tài)信號(hào)V2。圖3D為步驟S350的詳細(xì)流程。請(qǐng)參照?qǐng)D3D與圖2。步驟S350還包括在步驟 S351中,追蹤信號(hào)子空間并依據(jù)聲音動(dòng)態(tài)信號(hào)Vl產(chǎn)生導(dǎo)引向量信號(hào)V2 ;在步驟S352中,接收主校正信號(hào)Cl與參考校正信號(hào)C2,并依據(jù)引向量信號(hào)V2產(chǎn)生主通道附與參考通道N2, 其中主通道m(xù)對(duì)應(yīng)至從音源接收的聲音,而該參考通道N2對(duì)應(yīng)至由背景接收到的噪音。本發(fā)明雖以優(yōu)選實(shí)施例公開如上,然其并非用以限定本發(fā)明的范圍,本領(lǐng)域技術(shù)人員在不脫離本發(fā)明的精神和范圍內(nèi),當(dāng)可做些許的更動(dòng)與潤(rùn)飾,因此本發(fā)明的保護(hù)范圍當(dāng)視所附權(quán)利要求書所界定者為準(zhǔn)。
權(quán)利要求
1.一種聲音處理裝置,包括一主麥克風(fēng),用以從一音源接收一聲音并從一背景接收一噪音,并產(chǎn)生一主輸入;一參考麥克風(fēng),用以接收該聲音與該噪音并產(chǎn)生一參考輸入;一短時(shí)傅立葉變換(short-time Fourier transformation,STFT)單元,用以利用短時(shí)傅立葉變換以將時(shí)域的該主輸入變換成頻域的一主信號(hào),并將時(shí)域的該參考輸入變換成頻域的一參考信號(hào);一靈敏度校正單元,用以對(duì)該主信號(hào)與該參考信號(hào)進(jìn)行靈敏度校正,并產(chǎn)生一主校正信號(hào)與一參考校正信號(hào);一聲音動(dòng)態(tài)檢測(cè)器(voice active detector,VAD),用以依據(jù)該主校正信號(hào)、該參考校正信號(hào)以及一波到達(dá)方向(direction of arrival, DOA)信號(hào)產(chǎn)生一聲音動(dòng)態(tài)信號(hào);以及一聲波束形成器(beamformer),用以依據(jù)該聲音動(dòng)態(tài)信號(hào)將該主校正信號(hào)變換成一主通道,并將 該參考校正信號(hào)變換成一參考通道。
2.如權(quán)利要求1所述的聲音處理裝置,其中該主麥克風(fēng)被配置在較該參考麥克風(fēng)更靠近該音源之處。
3.如權(quán)利要求1所述的聲音處理裝置,其中該靈敏度校正單元還包括一空間譜估計(jì)器,用以依據(jù)該主信號(hào)與該參考信號(hào)產(chǎn)生一空間譜,其中該空間譜指出該主信號(hào)與該參考信號(hào)在功率分布與入射角間的函數(shù)關(guān)系。
4.如權(quán)利要求3所述的聲音處理裝置,其中該靈敏度校正單元還包括一擴(kuò)散噪音檢測(cè)器,用以檢驗(yàn)該空間譜以指出是否存在一擴(kuò)散噪音。
5.如權(quán)利要求4所述的聲音處理裝置,其中該靈敏度校正單元還包括一靈敏度不匹配計(jì)算器,用以在該擴(kuò)散噪音檢測(cè)器指出該擴(kuò)散噪音存在時(shí),計(jì)算該主信號(hào)與參考信號(hào)間的靈敏度不匹配。
6.如權(quán)利要求5所述的聲音處理裝置,其中該靈敏度校正單元還包括一靈敏度不匹配移除器,用以接收該主信號(hào)與該參考信號(hào),并移除該主信號(hào)與參考信號(hào)間的靈敏度不匹配, 并產(chǎn)生該主校正信號(hào)與該參考校正信號(hào)。
7.如權(quán)利要求3所述的聲音處理裝置,還包括一DOA估計(jì)器,用以檢驗(yàn)該空間譜,并產(chǎn)生該DOA信號(hào),其中該DOA信號(hào)指出在該空間譜中是否存在一主峰。
8.如權(quán)利要求1所述的聲音處理裝置,其中該VAD將該主校正信號(hào)與該參考校正信號(hào)間的功率比與一預(yù)設(shè)臨界值作比較;其中,當(dāng)該功率比大于一該預(yù)設(shè)臨界值時(shí),該聲音動(dòng)態(tài)信號(hào)將被開啟,而當(dāng)該功率小于該預(yù)設(shè)臨界值時(shí),該聲音動(dòng)態(tài)信號(hào)將被關(guān)閉。
9.如權(quán)利要求1所述的聲音處理裝置,其中該聲波束形成器還包括一陣列流形矩陣辨識(shí)單元,用以追蹤一信號(hào)子空間并依據(jù)該聲音動(dòng)態(tài)信號(hào)產(chǎn)生一導(dǎo)引向量信號(hào)。
10.如權(quán)利要求9所述的聲音處理裝置,其中該聲波束形成器還包括一主通道產(chǎn)生器,用以接收該主校正信號(hào)與該參考校正信號(hào),并依據(jù)該導(dǎo)引向量信號(hào)產(chǎn)生該主通道,其中該主通道對(duì)應(yīng)至從該音源接收的該聲音;以及一參考通道產(chǎn)生器,用以接收該主校正信號(hào)與該參考校正信號(hào),并依據(jù)該導(dǎo)引向量信號(hào)產(chǎn)生該參考通道,其中該參考通道對(duì)應(yīng)至從該背景接收的該噪音。
11.如權(quán)利要求1所述的聲音處理裝置,還包括,一噪音抑制單元,用以依據(jù)該聲音動(dòng)態(tài)信號(hào)抑制該主通道與該參考通道中的靜態(tài)與非靜態(tài)噪音,并將該主通道與該參考通道整合成一最終信號(hào)。
12.如權(quán)利要求1所述的聲音處理裝置,還包括,一反STFT單元,用以利用反短時(shí)傅立葉變換以將頻域的該最終信號(hào)變換成時(shí)域的一最終輸出。
13.如權(quán)利要求9所述的聲音處理裝置,其中該陣列流形矩陣辨識(shí)單元利用一投影逼近子空間追蹤(projection approximation subspace tracking,PAST)演算法。
14.如權(quán)利要求10所述的聲音處理裝置,其中該主通道產(chǎn)生器與該參考通道產(chǎn)生器利用一最小方差無失真口向應(yīng)(minimum variance distortionless response,MVDR)聲束形成方法以產(chǎn)生該主通道與該參考通道。
15.如權(quán)利要求11所述的聲音處理裝置,其中該噪音抑制單元是一維納后端濾波器 (Wiener post filter)。
16.一聲音處理方法,包括從一音源接收一聲音并從一背景接收一噪音,并產(chǎn)生一主輸入; 接收該聲音與該噪音并產(chǎn)生一參考輸入;利用短時(shí)傅立葉變換以將時(shí)域的該主輸入變換成頻域的一主信號(hào),并將時(shí)域的該參考輸入變換成頻域的一參考信號(hào);對(duì)該主信號(hào)與該參考信號(hào)進(jìn)行靈敏度校正,并產(chǎn)生一主校正信號(hào)與一參考校正信號(hào); 依據(jù)該主校正信號(hào)、該參考校正信號(hào)以及一波到達(dá)方向(direction of arrival,DOA) 信號(hào)產(chǎn)生一聲音動(dòng)態(tài)信號(hào);以及依據(jù)該聲音動(dòng)態(tài)信號(hào)將該主校正信號(hào)變換成一主通道,并將該參考校正信號(hào)變換成一參考通道。
17.如權(quán)利要求16所述的聲音處理方法,還包括依據(jù)該主信號(hào)與該參考信號(hào)產(chǎn)生一空間譜,其中該空間譜指出該主信號(hào)與該參考信號(hào)在功率分布與入射角間的函數(shù)關(guān)系。
18.如權(quán)利要求17所述的聲音處理方法,還包括 檢驗(yàn)該空間譜以指出是否存在一擴(kuò)散噪音。
19.如權(quán)利要求18所述的聲音處理方法,還包括在該擴(kuò)散噪音檢測(cè)器指出該擴(kuò)散噪音存在時(shí),計(jì)算該主信號(hào)與參考信號(hào)間的靈敏度不匹配。
20.如權(quán)利要求19所述的聲音處理方法,還包括移除該主信號(hào)與參考信號(hào)間的靈敏度不匹配,并產(chǎn)生該主校正信號(hào)與該參考校正信號(hào)。
21.如權(quán)利要求17所述的聲音處理方法,還包括檢驗(yàn)該空間譜,并產(chǎn)生該DOA信號(hào),其中該DOA信號(hào)指出在該空間譜中是否存在一主峰。
22.如權(quán)利要求21所述的聲音處理方法,還包括將該主校正信號(hào)與該參考校正信號(hào)間的功率比與一預(yù)設(shè)臨界值作比較;其中,當(dāng)該功率比大于一該預(yù)設(shè)臨界值時(shí),將該聲音動(dòng)態(tài)信號(hào)開啟,而當(dāng)該功率小于該預(yù)設(shè)臨界值時(shí),將該聲音動(dòng)態(tài)信號(hào)關(guān)閉。
23.如權(quán)利要求16所述的聲音處理方法,還包括追蹤一信號(hào)子空間并依據(jù)該聲音動(dòng)態(tài)信號(hào)產(chǎn)生一導(dǎo)引向量信號(hào)。
24.如權(quán)利要求23所述的聲音處理方法,還包括接收該主校正信號(hào)與該參考校正信號(hào),并依據(jù)該導(dǎo)引向量信號(hào)產(chǎn)生該主通道與該參考通道,其中該主通道對(duì)應(yīng)至從該音源接收的該聲音,而該參考通道對(duì)應(yīng)至從該背景接收的該噪音。
25.如權(quán)利要求16所述的聲音處理方法,還包括依據(jù)該聲音動(dòng)態(tài)信號(hào)抑制該主通道與該參考通道中的靜態(tài)與非靜態(tài)噪音,并將該主通道與該參考通道整合成一最終信號(hào)。
26.如權(quán)利要求16所述的聲音處理方法,還包括利用反短時(shí)傅立葉變換以將頻域的該最終信號(hào)變換成時(shí)域的一最終輸出。
全文摘要
聲音處理裝置及方法。該聲音處理裝置包括一主麥克風(fēng)及一參考麥克風(fēng),用以接收該聲音與該噪音并產(chǎn)生一主輸入及一參考輸入;一STFT單元,用以利用短時(shí)傅立葉變換以將時(shí)域的該主輸入變換成頻域的一主信號(hào),并將時(shí)域的該參考輸入變換成頻域的一參考信號(hào);一靈敏度校正單元,用以對(duì)該主信號(hào)與該參考信號(hào)進(jìn)行靈敏度校正,并產(chǎn)生一主校正信號(hào)與一參考校正信號(hào);一VAD,用以依據(jù)該主校正信號(hào)、該參考校正信號(hào)以及一DOA信號(hào)產(chǎn)生一聲音動(dòng)態(tài)信號(hào);以及一聲波束形成器,用以依據(jù)該聲音動(dòng)態(tài)信號(hào)將該主校正信號(hào)變換成一主通道,并將該參考校正信號(hào)變換成一參考通道。
文檔編號(hào)H04R29/00GK102348156SQ20101024176
公開日2012年2月8日 申請(qǐng)日期2010年7月29日 優(yōu)先權(quán)日2010年7月29日
發(fā)明者劉勝, 李細(xì)林 申請(qǐng)人:美商富迪科技股份有限公司