專利名稱:使用過采樣濾波器組的定向音頻信號(hào)處理的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻信號(hào)處理的應(yīng)用,其中,音頻信號(hào)的到達(dá)方向是用于信號(hào)處理的主要參數(shù)。本發(fā)明可用于需要輸入音頻信號(hào)根據(jù)該信號(hào)從其到達(dá)的空間方向來處理的任何應(yīng)用中。
本發(fā)明的應(yīng)用包括,但不限于,音頻監(jiān)視(audio surveillance)系統(tǒng),助聽器,聲指令(voice-command)系統(tǒng),便攜通信裝置,語音識(shí)別/記錄系統(tǒng),以及希望根據(jù)到達(dá)方向來處理信號(hào)的任何應(yīng)用。
背景技術(shù):
定向處理可用來解決許多音頻信號(hào)處理問題。例如,在助聽器應(yīng)用中,定向處理可用來降低來自于與想要語音或聲音不同空間方向的環(huán)境噪聲,由此,改進(jìn)助聽器用戶收聽的舒適性及語音感知。在音頻監(jiān)視、聲指令和便攜通信系統(tǒng)中,定向處理可用來增強(qiáng)對來自特定方向聲音的接收,由此,能使這些系統(tǒng)將注意力集中在希望的聲音上。在其它系統(tǒng)中,定向處理可被用于抑制來自特定方向的干擾信號(hào),同時(shí)保持對來自所有其它方向信號(hào)的感知,由此將系統(tǒng)與干擾信號(hào)的有害影響隔離。波束形成是一個(gè)術(shù)語,它描述一種使用數(shù)學(xué)模型來使輸入裝置的方向性達(dá)到最大的技術(shù)。在該技術(shù)中,濾波的權(quán)(filteringweight)可被實(shí)時(shí)調(diào)整,或者適于對用戶、或信號(hào)源、或二者的環(huán)境改變做出反應(yīng)。
傳統(tǒng)上,對音頻信號(hào)的定向處理已在時(shí)域中實(shí)現(xiàn),使用有限脈沖響應(yīng)(FIR)濾波器和/或簡單延時(shí)元件。對于處理簡單窄帶信號(hào)的應(yīng)用,這些方法通常是足夠的。但是,對于處理復(fù)寬帶信號(hào),如語音,這些時(shí)域方法通常表現(xiàn)不佳,除非該應(yīng)用中使用有效的附加手段,如大麥克風(fēng)陣列、長度濾波器(lengthy filters)、復(fù)后置濾波(complexpost-filtering),以及強(qiáng)處理能力。這些技術(shù)的實(shí)施例公開在“基于用后置濾波的麥克風(fēng)陣列的降噪和解混響技術(shù)的分析(Analysis of NoiseReduction and Dereverberation Techniques Based on Microphone Arrayswith Postfiltering)”中,C.Marro,Y.Mahieux和K.U.Simmer的,IEEETrans.Speech and Audio Processing,1998年第3號(hào)第6卷,和“一種用于助聽器的麥克風(fēng)陣列(A Microphone Array for Hearing Aids)”中,B.Widrow的,IEEE Adaptive Systems for Signal Processing,Communications and Control Symposium,2000年第7到11頁。
在任何定向處理的算法中,需要有兩個(gè)或更多個(gè)傳感器的陣列。對于音頻定向處理,全向或定向麥克風(fēng)被用作傳感器。
圖1示出一般定向處理系統(tǒng)的高水平(high level)框圖。如圖所示,有兩個(gè)或更多個(gè)輸入100、105到系統(tǒng)110,并且一般只有一個(gè)輸出120。
定向處理算法有兩種常見類型自適應(yīng)波束形成和固定波束形成。與自適應(yīng)波束形成中的時(shí)變波束圖相反,在固定波束形成中,算法的空間響應(yīng)——或波束圖——不隨時(shí)間改變。波束圖是一種極性圖(polargraph),示出波束形成系統(tǒng)在不同到達(dá)方向上對特定信號(hào)頻率的增益響應(yīng)。圖2示出兩個(gè)不同波束圖的實(shí)施例,其中從某些特定到達(dá)方向來的信號(hào)相對從其它方向來的信號(hào)被衰減(或增強(qiáng))。第一個(gè)圖是心形圖200,一些典型的端射麥克風(fēng)陣列,以及另一個(gè)圖205是典型的垂射(broad-side)麥克風(fēng)陣列的波束圖。圖3示出用于端射300、305、310和垂射320、325、330麥克風(fēng)陣列的典型結(jié)構(gòu)。
更多的新的基于快速傅立葉變換(FFT)的方法試圖通過在頻域中實(shí)現(xiàn)定向處理來改進(jìn)傳統(tǒng)的時(shí)域方法。然而,這些基于FFT的方法中許多都有高重疊的寬的副頻帶的缺點(diǎn),并且因此提供不良的頻率分辨率。在計(jì)算FFT方面他們還需要更長的群延遲以及更強(qiáng)的處理能力。
因此,需要解決以上所關(guān)注的問題,還需要一種新的方法來增強(qiáng)和/或取代現(xiàn)有的技術(shù)。
發(fā)明內(nèi)容
在此所述的本發(fā)明在解決傳統(tǒng)波束形成方案中出現(xiàn)的問題方面可適用于端射和垂射麥克風(fēng)結(jié)構(gòu)。本發(fā)明還可用于麥克風(fēng)陣列的其它幾何結(jié)構(gòu),由于下面的處理體系結(jié)構(gòu)靈活到足以接納寬范圍的陣列結(jié)構(gòu)。例如,基于二或三維陣列的更復(fù)雜的定向系統(tǒng),用于產(chǎn)生有三維空間的波束圖,是已知的并且適于與本發(fā)明一起使用。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,提供一種定向信號(hào)處理系統(tǒng),用于波束形成數(shù)個(gè)信息信號(hào),該系統(tǒng)包括數(shù)個(gè)麥克風(fēng);過采樣(oversampled)濾波器組,至少包括一個(gè)分析濾波器組和一個(gè)綜合濾波器組,其中,分析濾波器組用來將時(shí)域中來自麥克風(fēng)的數(shù)個(gè)信息信號(hào)變成變換域(transform domain)中的數(shù)個(gè)通道(channel)信號(hào);和信號(hào)處理器,處理所述分析濾波器組的輸出,波束形成所述信息信號(hào)。該綜合濾波器組將所述信號(hào)處理器的輸出變換成時(shí)域中的單信息信號(hào)。
根據(jù)本發(fā)明進(jìn)一步的實(shí)施例,提供一種處理數(shù)個(gè)通道信號(hào)的方法,用來在通道內(nèi)獲得近似的線性相位響應(yīng),該方法包括通過將一個(gè)以上的濾波器作用于至少一個(gè)通道信號(hào)來進(jìn)行濾波的步驟。
根據(jù)本發(fā)明進(jìn)一步的實(shí)施例,提供一種處理時(shí)域中至少一個(gè)信息信號(hào)的方法,用來獲得近似的線性相位響應(yīng),該方法包括一個(gè)使用至少一個(gè)過采樣分析濾波器組進(jìn)行過采樣的步驟。過采樣分析濾波器組將至少一個(gè)分?jǐn)?shù)延遲(fractional delay)脈沖響應(yīng)作用于至少一個(gè)濾波器組原型窗口時(shí)間(prototype window time)。
本發(fā)明的定向處理系統(tǒng)利用過采樣分析/綜合濾波器組將時(shí)域中的輸入音頻信號(hào)變換到變換域。常見的變換方法的實(shí)施例包括GDFT(廣義離散傅立葉變換Generalized Discrete Fourier Transform)、FFT、DCT(離散余弦變換)、子波變換(Wavelet Transform)和其它廣義變換。在此所述的本發(fā)明的重點(diǎn)在于使用過采樣濾波器組的定向處理系統(tǒng),用是所述濾波器組一個(gè)可能實(shí)施方案的FFT方法。過采樣的、基于FFT濾波器組的一個(gè)實(shí)施例公開在R.Brennan和T.Schneider的美國專利6,236,731,“用于濾波及將信息信號(hào)分成不同頻帶,特別是用于助聽器中音頻信號(hào)的濾波器組結(jié)構(gòu)和方法Filterbank Structure and Method forFiltering and Separating an Information Signal into Different Bands,Particularly for Audio Signal in Heating Aids”中,其被結(jié)合在此作為參考。使用所述過采樣濾波器組的助聽器裝置的一個(gè)實(shí)施例公開在R.Brennan和T.Schneider的美國專利6,240,192“用于在數(shù)字助聽器,包括應(yīng)用特定的集成電路和可編程數(shù)字信號(hào)處理器中濾波的裝置和方法Apparatus for and Method for Filtering in an Digital Heating Aid,Including an Application Specific Integrated Circuit and a ProgrammableDigital Signal Processor”中,其被結(jié)合在此作為參考。但是,在此公開的在定向處理系統(tǒng)通用框架下的過采樣分析/綜合濾波器組的這些使用之前從未公開過。
下面說明的副頻帶信號(hào)處理方法,與其相應(yīng)的、是在此公開的本發(fā)明中用的過采樣濾波器組的一個(gè)可能實(shí)施方案的基于FFT的方法,有在寬帶信號(hào)的定向處理中直接尋址(addressing)頻率依賴(frequency-dependent)特性的優(yōu)點(diǎn)。與傳統(tǒng)的時(shí)域和基于FFT的方法相比,根據(jù)本發(fā)明的在副頻帶信號(hào)處理中使用過采樣濾波器組的優(yōu)點(diǎn)如下1)處理能力的一小部分相當(dāng)于或大于的信號(hào)處理能力,2)不同頻率接收器中副頻帶信號(hào)的正交化效應(yīng)(effect),由于過采樣濾波器組的FFT,3)改進(jìn)的高頻分辨率,4)更好的空間濾波,5)很低成本的處理能力下寬范圍的增益調(diào)節(jié),以及6)易于與其它算法結(jié)合。
結(jié)果,用過采樣濾波器組的副頻帶定向處理方法使得在小型低功率的裝置上能實(shí)現(xiàn)強(qiáng)有力的定向處理能力。對于使用本發(fā)明的應(yīng)用來說,這意味著1)更好的收聽舒適性及語音感知(對助聽器尤其重要),2)語音和說話者識(shí)別系統(tǒng)的更精確的識(shí)別,3)更好的方向性和更高的SNR,4)低群延遲,以及5)較低的功耗。
因此,本發(fā)明可用于要求高保真度和超低功率處理平臺(tái)的音頻應(yīng)用。
通過以下說明、所附權(quán)利要求及附圖可更好地理解本發(fā)明的其它特征、方案、及優(yōu)點(diǎn)。
附圖簡要說明現(xiàn)參照附圖來說明本發(fā)明的實(shí)施方案,其中圖1示出普通定向處理系統(tǒng)的框圖;圖2示出兩個(gè)不同波束圖的實(shí)施例;圖3示出端射和垂射陣列的陣列結(jié)構(gòu);圖4示出根據(jù)本發(fā)明一個(gè)實(shí)施方案的自適應(yīng)波束形成器系統(tǒng)的框圖;圖5示出根據(jù)本發(fā)明另一實(shí)施方案的自適應(yīng)波束形成系統(tǒng)器的框圖;圖6示出傳統(tǒng)的時(shí)域波束形成器結(jié)構(gòu);圖7示出根據(jù)本發(fā)明另一實(shí)施方案使用過采樣濾波器組的副頻帶波束形成器;圖8示出另一個(gè)優(yōu)選實(shí)施方案,變化用于補(bǔ)償副頻帶的帶寬;圖9示出另一個(gè)優(yōu)選實(shí)施方案,變化用于補(bǔ)償不希望有的低頻波束形成器響應(yīng);以及圖10示出本發(fā)明的另一優(yōu)選實(shí)施方案,使用神經(jīng)網(wǎng)絡(luò)作為波束形成器濾波器。
具體實(shí)施例方式
現(xiàn)參照圖4,以框圖形式示出使用本發(fā)明的自適應(yīng)波束形成器系統(tǒng)。請注意假設(shè)L麥克風(fēng)400(L≥2)的輸出已通過一組模數(shù)轉(zhuǎn)換器(ADC)(未示出)轉(zhuǎn)換成數(shù)字形式。類似地,假設(shè)該輸出通過數(shù)模轉(zhuǎn)換器(DAC)(未示出)由數(shù)字形式轉(zhuǎn)換來產(chǎn)生適當(dāng)?shù)妮敵鲂盘?hào)490。L麥克風(fēng)400的數(shù)字化輸出首先在組合矩陣415中組合。組合矩陣415可以是任何的具有多端輸入和輸出(輸出數(shù)M小于或等于輸入數(shù)L(M≤L))的有限脈沖響應(yīng)(FIR)濾波器。合適的矩陣包括延遲及和(delay-and-sum)網(wǎng)絡(luò)、sigma-delta網(wǎng)絡(luò)、和輸入到輸出一一映射(例如通過其將L個(gè)輸入變成L個(gè)(即M=L)輸出的一些普通矩陣)。然后,組合矩陣415的M輸出通過分析濾波器組420變換到頻域,每個(gè)組合矩陣輸出有N個(gè)副頻帶,產(chǎn)生M×N個(gè)信號(hào)用于處理。在本實(shí)施方案中使用的(過采樣)分析濾波器組420是加權(quán)疊加(weighted-overlap-add)(WOLA)濾波器組,公開在R.Brennan和T.Schneider的美國專利6,236,731,“用于濾波及將信息信號(hào)分成不同頻帶,特別是用于助聽器中音頻信號(hào)的濾波器組結(jié)構(gòu)和方法”中。之后,自適應(yīng)系統(tǒng)460生成一個(gè)分析濾波器組輸出的加權(quán)和,通過乘法器425作用于輸出。自適應(yīng)系統(tǒng)460的權(quán)(也稱為濾波分支filter taps)根據(jù)已知的自適應(yīng)策略來自適應(yīng),該策略包括但不限于基于最小均方(LMS)的那些,和遞歸最小乘方(RLS)。然后,乘法器425的輸出傳到加法器430,產(chǎn)生N個(gè)輸出,各為源于原麥克風(fēng)信號(hào)的加權(quán)副頻帶。整個(gè)自適應(yīng)過程由包括估計(jì)塊450和后置濾波器適配器455的側(cè)處理(side process)的輸出來進(jìn)一步地控制。側(cè)處理的估計(jì)塊450可包括一個(gè)或更多個(gè)聲音活動(dòng)探測器(voice activity detector)(VAD)、目標(biāo)干擾比(Target-to-Jammer Ratio TJR)估計(jì)器、和信號(hào)噪聲比(SNR)估計(jì)器。隨后,估計(jì)塊450的輸出用于減慢、加快、或通過控制權(quán)自適應(yīng)(weight adaptation)460來制止自適應(yīng)過程,并且還與后置濾波器自適應(yīng)455組合,控制后置濾波器435。在通過將從自適應(yīng)處理器460、425接收的處理的M×N個(gè)輸入組合成N個(gè)副頻帶的加法器430之后,后置濾波器435工作在頻域,根據(jù)從后置濾波器455的輸出進(jìn)一步處理信號(hào)。后置濾波后,N個(gè)副頻帶頻域輸出由綜合濾波器組440來處理,生成時(shí)域輸出490。
過采樣濾波器組由于其靈活性及制造工藝,提供了上述發(fā)明內(nèi)容中所述的總的優(yōu)點(diǎn)。對于本發(fā)明的自適應(yīng)波束形成器,使用其的進(jìn)一步的優(yōu)點(diǎn)是1)使用已有技術(shù)的定向處理需要很長的自適應(yīng)濾波器長度,特別是在混響環(huán)境中,如其他研究者所報(bào)告的(請見J.E.Greenberg,“麥克風(fēng)陣列助聽器的改進(jìn)設(shè)計(jì)”,博士論文,MIT,1994年9月)。使用過采樣濾波器組的副頻帶自適應(yīng),通過副頻帶的并行處理,能有效地實(shí)現(xiàn)等效的長濾波器(long filter)。
2)在頻域波束形成中(自適應(yīng)的和固定的),需要以非常自由的方式對快速傅立葉變換(FFT)系數(shù)進(jìn)行加權(quán)。典型的自適應(yīng)后置濾波操作是多麥克風(fēng)Wiener濾波,其中頻率響應(yīng)根據(jù)接收信號(hào)的信號(hào)噪聲比(SNR)來自適應(yīng)。在此過程中,需要橫跨頻帶的自由的增益調(diào)節(jié)。過采樣濾波器組的實(shí)現(xiàn)使得能夠有一個(gè)寬范圍的增益調(diào)節(jié),而不產(chǎn)生在臨界采樣濾波器組中發(fā)生的所謂“時(shí)間混疊”問題。顯然,操作成本并不比臨界采樣濾波器組高很多,并且遠(yuǎn)低于非分樣(undecimated)濾波器組。詳情請見R.Brennan和T.Schneider的美國專利6,240,192,“用于在數(shù)字助聽器,包括應(yīng)用特定的集成電路和可編程數(shù)字信號(hào)處理器中濾波的裝置和方法”,和R.Brennan和T.Schneider的“在數(shù)字助聽器擴(kuò)大信號(hào)操作的靈活的濾波器組結(jié)構(gòu)A FlexibleFilterbank Structure for Extensive Signal Manipulations in Digital HearingAids”,Proc.IEEE Int.Symp.電路與系統(tǒng)(Circuits and Systems),569-572頁,1998年。
3)所謂的“誤調(diào)”錯(cuò)誤,在與最佳Wiener濾波器比較時(shí)有超均方誤差,典型地出現(xiàn)在自適應(yīng)系統(tǒng)中。已知并可理解的是副頻帶和正交分解可減輕這一問題。本發(fā)明中使用的過采樣濾波器組至少在一種優(yōu)選實(shí)施方案中使用了該分解。
4)目標(biāo)干擾比(TJR)的估計(jì)通常需要兩個(gè)或兩個(gè)以上的麥克風(fēng)輸出互相關(guān)(如J.E.Greenberg,博士論文,MIT,1994年9月的“改進(jìn)的麥克風(fēng)陣列助聽器設(shè)計(jì)”中所述的)。使用過采樣濾波器組的處理的頻域?qū)崿F(xiàn)比先前使用的時(shí)域方法更快很多并且更加有效。
5)通過使用聲音活動(dòng)探測器(VAD)、目標(biāo)干擾比(TJR)估計(jì)器和信號(hào)噪聲比(SNR)估計(jì)器的側(cè)處理輸出,自適應(yīng)過程可在有強(qiáng)目標(biāo)(如語音)出現(xiàn)時(shí)被減慢或被完全制止。這使系統(tǒng)能在混響環(huán)境下工作。在語音信號(hào)中有足夠的間歇來確保制止過程不干擾系統(tǒng)的運(yùn)行。使用過采樣濾波器組的適當(dāng)有效的頻域VAD公開在共同的待定專利申請中,“過采樣濾波器組中副頻帶自適應(yīng)信號(hào)處理Sub-bandAdaptive Signal Processing in an Oversampled Filterbank”,K.Tam等的加拿大專利申請序列號(hào)2,354,808,2001年8月,美國申請序列號(hào)__,其被結(jié)合在此作為參考。
根據(jù)本發(fā)明進(jìn)一步的優(yōu)選實(shí)施方案,如圖5所示,權(quán)自適應(yīng)過程在一組B固定波束上進(jìn)行,用于由源于各麥克風(fēng)輸出的副頻帶構(gòu)成或合成的每個(gè)副頻帶,而不是麥克風(fēng)輸出本身或該輸出的副頻帶。圖5中大多數(shù)元件與圖4中的相同,并且用相同的參考編號(hào)表示。因此這些元件將不再說明。本實(shí)施方案引入的新的元件是固定波束形成器510和權(quán)自適應(yīng)塊520,固定波束形成器510從副頻帶產(chǎn)生B主波束,權(quán)自適應(yīng)塊520基于VAD、TJR和SNR估計(jì)塊450的輸入,控制乘法器425和固定波束形成器510輸出的副頻帶信號(hào)。通常來說,該策略在自適應(yīng)濾波加權(quán)變化時(shí)提供更平滑或更穩(wěn)健的過渡。權(quán)自適應(yīng)由一些TJR和/或SNR估計(jì)來控制,基于,但不限于,一種或一種以上下面的信號(hào)統(tǒng)計(jì)自相關(guān)、互相關(guān)、副頻帶量級(subband magnitude level)、副頻帶功率級、互功率譜、互功率相位、交叉譜密度,等等。在此建議一種基于簡化SNR估計(jì)的可能的濾波權(quán)自適應(yīng)策略,但對于本領(lǐng)域普通技術(shù)人員來說還可想到其它類似或有關(guān)的方法,并且本發(fā)明也欲涵蓋這些方法。當(dāng)側(cè)處理探測到?jīng)]有(或幾乎沒有)目標(biāo)時(shí),每個(gè)波束中噪聲的時(shí)間平均能量(time-averaged energy,用En(I)表示,I=1,2,...,B)被測量。當(dāng)目標(biāo)再出現(xiàn)時(shí),目標(biāo)的時(shí)間平均能量(Et(I))和每個(gè)波束的SNR(SNR(I))被估計(jì),假定波束的總平均能量為Etot(I),通過Et(I)=Etot(I)-En(I),I=1,2,...BSNP(I)=Et(I)/En(I)如果噪聲統(tǒng)計(jì)、和噪聲及目標(biāo)方向從一個(gè)目標(biāo)信號(hào)間歇到下一個(gè)間歇沒有改變太多,則各波束的SNR(I)可被用來構(gòu)成波束的加權(quán)和。然而,如果噪聲是很不固定的,或者如果噪聲和/或目標(biāo)源正快速移動(dòng),則應(yīng)使用用自適應(yīng)處理器來調(diào)節(jié)權(quán)。為了改進(jìn)性能,固定波束形成器可設(shè)計(jì)成有一組窄束,覆蓋所關(guān)心的用于特定應(yīng)用的方位角和仰角。
現(xiàn)在討論本發(fā)明在固定波束形成應(yīng)用中的進(jìn)一步的實(shí)施方案。實(shí)現(xiàn)固定波束形成器的傳統(tǒng)方法是延時(shí)及和方法。由于陣列中麥克風(fēng)的物理間隔,在各麥克風(fēng)接收的信號(hào)之間有一個(gè)固有延時(shí)。因此,延時(shí)及和方法利用簡單的延時(shí)元件來適當(dāng)矯正接收的信號(hào),以便從某些方向到達(dá)的信號(hào)能最大地同相,并且相干地(coherently)提供合計(jì)的輸出信號(hào)。任何從其它方向到達(dá)的信號(hào)則不相干提供輸出信號(hào),以便其信號(hào)功率可在輸出端被降低。
對于FIR濾波器方法,通常設(shè)計(jì)有FIR濾波器,以便其相位響應(yīng)有矯正接收信號(hào)的作用,從而產(chǎn)生希望的波束圖。這些濾波器可以被設(shè)計(jì)使用從模擬濾波器轉(zhuǎn)換,或直接的FIR濾波器設(shè)計(jì)方法。當(dāng)涉及復(fù)寬帶信號(hào)時(shí),該時(shí)域?yàn)V波器的設(shè)計(jì)通常需要大量可用的計(jì)算能力。為比較之目的,圖6示出使用現(xiàn)有技術(shù)時(shí)域方法的固定波束形成器的結(jié)構(gòu)。在圖中,一個(gè)有三個(gè)麥克風(fēng)600、601、602的陣列以已知模式設(shè)置,盡管也可使用更多數(shù)目的麥克風(fēng)。陣列中各麥克風(fēng)600、601、602的輸出通過單獨(dú)的延時(shí)元件(或FIR濾波器)610、611、612,其輸出依次通過加法器620。當(dāng)延時(shí)元件按如上所述設(shè)定時(shí),加法器620相對于麥克風(fēng)陣列提供增強(qiáng)的輸出630用于特定的空間方向。通常,延時(shí)元件610、611、612的這種設(shè)定是動(dòng)態(tài)完成的,但是經(jīng)常有折衷方案(compromise)基于包括信號(hào)頻率和陣列中麥克風(fēng)相對間隔的因素。如果需要許多波束,每一個(gè)可用類似的電路來構(gòu)成或合成。由于這個(gè)原因,這些系統(tǒng)昂貴、功率消耗大、復(fù)雜并且因此在應(yīng)用上受到限制。
在此說明的本發(fā)明的進(jìn)一步的優(yōu)選實(shí)施方案實(shí)行一系列窄帶處理步驟,來解決更復(fù)雜的寬帶問題。過采樣濾波器組的使用使得窄帶處理能以有效實(shí)用的方式進(jìn)行。圖7示出根據(jù)本發(fā)明另一實(shí)施方案使用過采樣濾波器組的副頻帶固定波束形成器。該系統(tǒng)與圖4所述的系統(tǒng)非常相似。為方便和清楚起見,相同的組件在兩個(gè)圖中用相同的參考編號(hào)表示。在L麥克風(fēng)陣列400接收的信號(hào)的數(shù)字形式在發(fā)送到分析濾波器組420之前通過組合矩陣415合成M信號(hào)通道(M≤L)。該分析濾波器組420為每個(gè)通道生成N個(gè)頻率副頻帶,波束形成濾波器710在其上作用復(fù)值增益因數(shù)來實(shí)現(xiàn)希望的波束圖,基于從VAD、TJR和SNR估計(jì)塊450的輸入,以及分析濾波器組420產(chǎn)生的副頻帶中的信號(hào)電平。增益因數(shù)可單獨(dú)作用于每個(gè)通道和副頻帶,或者通過一些矩陣操作共同作用在所有通道和/或副頻帶。在增益因數(shù)由乘法器425作用后,M通道通過求和操作430組合形成一個(gè)單通道。然后,如前所述(如改進(jìn)SNR)使用側(cè)處理450、455,后置濾波過程435可用來提供進(jìn)一步的增強(qiáng)。之后,綜合濾波器組440將N個(gè)副頻帶構(gòu)成的單通道變換回到時(shí)域。在進(jìn)一步的實(shí)施方案中,后置濾波用在時(shí)域中,在信道通過綜合濾波器組轉(zhuǎn)換回到時(shí)域之后,盡管,與頻域后置濾波相比,這典型地需要更多的處理能力。
波束形成濾波器的復(fù)值增益因數(shù)可以通過許多方式得到。例如,如果設(shè)計(jì)一個(gè)模擬濾波器,則它可在副頻帶中直接實(shí)現(xiàn),通過簡單地使用每個(gè)副頻帶的中心頻率來查找對應(yīng)的模擬濾波器的復(fù)響應(yīng)(頻率采樣)。對于足夠窄的副頻帶,本方法可產(chǎn)生近似模擬濾波器的數(shù)字等效。在本發(fā)明進(jìn)一步的實(shí)施方案中,為了緊緊接近寬的副頻帶的理想的相位及振幅響應(yīng),應(yīng)用窄帶濾波器到各副頻帶輸出,如與圖8相關(guān)的說明,其中許多組件與前面圖7中的相同,并且為了方便和清楚起見,那些相同的組件用相同的參考編號(hào)表示。本實(shí)施方案的增加功能在窄帶原型濾波器815中進(jìn)行。為了接近波束形成器的理想的線性相位響應(yīng),濾波器815設(shè)計(jì)成全通,有窄帶線性相位響應(yīng)。在進(jìn)一步的實(shí)施方案中,濾波器進(jìn)一步強(qiáng)制相同,并在FFT調(diào)制級之前移回,通過將其脈沖響應(yīng)和濾波器組原型窗相組合。一個(gè)可能的組合是濾波器組原型窗的時(shí)間卷積和分?jǐn)?shù)延遲脈沖響應(yīng)。作為一種消除聲輸出級外噪聲的方式,活性噪聲消除(Active Noise Cancellation)(ANC)模塊可選擇性地添加到該系統(tǒng),以一種與共同的待定專利申請“使用心理聲學(xué)模式和過采樣濾波器組的聲音清晰度增強(qiáng)Sound IntelligibilityEnhancement Using a Psychoacoustic Model and an OversampledFilterbank”,T.Schneider等的加拿大專利申請系列號(hào)2,354,755,和美國系列號(hào)__中公開的系統(tǒng)類似的方式,這些專利申請被結(jié)合在此作為參考。仍如圖8所示,ANC包括放置在輸出端490的麥克風(fēng)820,加上一個(gè)環(huán)路濾波器830,來提供反饋給組合矩陣415。
幾乎所有的波束形成器的實(shí)現(xiàn)都受到低頻滾降效應(yīng)(roll-off effect)的損害。為了補(bǔ)償該效應(yīng),大多數(shù)系統(tǒng),包括所建議的系統(tǒng),都引入低頻放大。但是,由于不可避免的麥克風(fēng)內(nèi)噪聲,這固有地導(dǎo)致很低頻率上高水平的輸出噪聲。眾所周知,結(jié)果是僅能在一些截止值(通常在1kHz左右,基于特定的麥克風(fēng)間隔距離)之上的頻率獲得希望的波束圖。在進(jìn)一步的實(shí)施方案中,如圖9所示,為了避免高水平的低頻噪聲,麥克風(fēng)信號(hào)被高通濾波器(HPF)920和低通濾波器(LPF)910分為高頻和低頻部分。再次,參考圖7來說明的優(yōu)選實(shí)施方案中所用的許多相同部分被使用,來實(shí)現(xiàn)相同的功能,并且給予相同的參考編號(hào)。高通濾波器920輸出的高頻部分由波束形成濾波器710、乘法器7425、和窄帶原型濾波器815來處理,如上所述。低頻部分旁路波束形成濾波器710、乘法器7425和窄帶原型濾波器815,僅依靠后置濾波器435來提供低頻信號(hào)增強(qiáng)。
除了傳統(tǒng)的數(shù)字濾波器設(shè)計(jì)方法之外,圖7中的波束形成器濾波器710也可使用人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)來實(shí)現(xiàn)。ANN可作為一種非參數(shù)的、穩(wěn)健的自適應(yīng)濾波器類型,并且,已日益作為一種富有生命力的信號(hào)處理方法來加以研究。本發(fā)明的進(jìn)一步的可能的實(shí)施方案是實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)1010作為完整的波束形成濾波器,如圖10所示。與圖4相同的參考編號(hào)再次用于在功能方面沒有改變的那些部分。神經(jīng)網(wǎng)絡(luò)1010接受從由分析濾波器組輸出的副頻帶來的輸入,并且使用這些來控制影響那些副頻帶的乘法器425。后置濾波器適配器455在此情況下將乘法器操作425之后各副頻帶的結(jié)果作為輸入,并且再次用來自適應(yīng)后置濾波塊435。
級聯(lián)混合(Cascaded Hybrid)神經(jīng)網(wǎng)絡(luò)(CHNN),特為副頻帶信號(hào)處理而設(shè)計(jì),可用來實(shí)現(xiàn)一個(gè)波束形成濾波器。CHNN包含兩個(gè)經(jīng)典的神經(jīng)網(wǎng)絡(luò)——自組織圖(Self-Organising Map SOM)和徑向基功能網(wǎng)絡(luò)(Radial Basis Function Network,RBFN)——被連接在抽頭延遲行結(jié)構(gòu)(tapped-delay line structure)中(例如,參見“使用級聯(lián)混合神經(jīng)網(wǎng)絡(luò)的自適應(yīng)降噪”,E.Chau,M.sc.論文,Guelph大學(xué),工程學(xué)院,2001)。該神經(jīng)網(wǎng)絡(luò)也可用來在副頻帶信號(hào)處理系統(tǒng)中提供ANC、波束形成濾波器及其它信號(hào)處理算法的綜合功能(integrated function)。
雖然已結(jié)合具體實(shí)施方案對本發(fā)明進(jìn)行了說明,但這些僅是對本發(fā)明舉例性地說明,并不能理解為是對本發(fā)明的限制。對于本領(lǐng)域普通技術(shù)人員來說,可在不偏離所附的權(quán)利要求書定義的本發(fā)明精神和范圍的情況下對本發(fā)明進(jìn)行各種改動(dòng)。
權(quán)利要求
1.一種用于波束形成數(shù)個(gè)信息信號(hào)的定向信號(hào)處理系統(tǒng),所述定向信號(hào)處理系統(tǒng)包括數(shù)個(gè)麥克風(fēng);過采樣濾波器組,包括至少一個(gè)分析濾波器組和一個(gè)綜合濾波器組,所述分析濾波器組將時(shí)域中來自麥克風(fēng)的數(shù)個(gè)信息信號(hào)變成變換域中的數(shù)個(gè)通道信號(hào);以及信號(hào)處理器,處理所述分析濾波器組的輸出,波束形成所述信息信號(hào),綜合濾波器組,將所述信號(hào)處理器的輸出變換為時(shí)域中的單信息信號(hào)。
2.如權(quán)利要求1所述的定向處理系統(tǒng),其中所述變換域是頻域。
3.如權(quán)利要求1或2所述的定向處理系統(tǒng),進(jìn)一步包括以下的至少任何一個(gè)配設(shè)置在所述信號(hào)處理器和所述綜合濾波器組之間的后置濾波器;控制所述后置濾波器的控制器;聲音活動(dòng)探測器;目標(biāo)干擾比估計(jì)器;信號(hào)噪聲比評估器;模數(shù)轉(zhuǎn)換器,將所述信息信號(hào)轉(zhuǎn)換為數(shù)個(gè)數(shù)字信息信號(hào),將所述數(shù)字信息信號(hào)供給到所述分析濾波器組;數(shù)模轉(zhuǎn)換器,接收所述綜合濾波器組的輸出,將數(shù)字信息信號(hào)轉(zhuǎn)換為模擬信息信號(hào);組合矩陣,配置在所述模數(shù)轉(zhuǎn)換器和所述分析濾波器組之間,在時(shí)域中對所述信息信號(hào)進(jìn)行預(yù)處理;活性噪聲處理器,包括一個(gè)麥克風(fēng)和一個(gè)環(huán)路濾波器。
4.如權(quán)利要求1所述的定向處理系統(tǒng),其中所述分析濾波器組將至少一個(gè)分?jǐn)?shù)延遲脈沖響應(yīng)作用于至少一個(gè)濾波器組原型窗。
5.如權(quán)利要求3所述的定向處理系統(tǒng),其中所述控制器基于以下的至少任何一個(gè)的輸出來控制所述后置濾波器所述聲音活動(dòng)探測器;所述目標(biāo)干擾比估計(jì)器;所述信號(hào)噪聲比估計(jì)器。
6.如權(quán)利要求3所述的定向處理系統(tǒng),其中所述組合矩陣是FIR濾波器。
7.如權(quán)利要求3所述的定向處理系統(tǒng),其中所述組合矩陣是IIR濾波器。
8.如權(quán)利要求1、2或3所述的定向處理系統(tǒng),其中所述信號(hào)處理器進(jìn)一步包括至少一個(gè)乘法器,將所述分析濾波器組的輸出乘以至少一個(gè)權(quán)因數(shù);以及至少一個(gè)累加電路,將所述乘法器的輸出相加形成通道信號(hào)。
9.如權(quán)利要求8所述的定向處理系統(tǒng),其中所述信號(hào)處理器進(jìn)一步包括一個(gè)調(diào)節(jié)所述權(quán)因數(shù)的自適應(yīng)處理器。
10.如權(quán)利要求9所述的定向處理系統(tǒng),其中所述自適應(yīng)處理器基于以下的至少任何一個(gè)的輸出來調(diào)節(jié)所述權(quán)因數(shù)聲音活動(dòng)探測器;目標(biāo)干擾比估計(jì)器;信號(hào)噪聲比估計(jì)器。
11.如權(quán)利要求1、2或3所述的定向處理系統(tǒng),其中所述信號(hào)處理器進(jìn)一步包括至少一個(gè)固定波束形成器,接收所述分析濾波器組的輸出,波束形成有特定波束圖的所述信息信號(hào);以及至少一個(gè)乘法器,將所述固定波束形成器的輸出乘以至少一個(gè)權(quán)因數(shù)。
12.如權(quán)利要求11所述的定向處理系統(tǒng),其中所述信號(hào)處理器進(jìn)一步包括以下的至少任何一個(gè)一個(gè)累加電路,將所述乘法器的輸出相加來形成通道信號(hào);用來調(diào)節(jié)所述權(quán)因數(shù)的自適應(yīng)處理器。
13.如權(quán)利要求11所述的定向處理系統(tǒng),其中至少一個(gè)固定波束形成器包括一個(gè)處理通道信號(hào)的電路,來在該通道內(nèi)獲得近似的線性相位響應(yīng),所述電路將一個(gè)或更多個(gè)濾波器作用于至少一個(gè)通道信號(hào)。
14.如權(quán)利要求13所述的定向處理系統(tǒng),其中濾波器是IIR濾波器。
15.如權(quán)利要求1、2或3所述的定向處理系統(tǒng),其中所述信號(hào)處理器進(jìn)一步包括至少一個(gè)乘法器,將所述分析濾波器組的輸出乘以至少一個(gè)波束形成濾波分支;以及至少一個(gè)累加電路,將所述乘法器的輸出相加,形成所述通道信號(hào),來波束形成所述信息信號(hào)。
16.如權(quán)利要求15所述的定向處理系統(tǒng),其中所述信號(hào)處理器進(jìn)一步包括以下的至少任何一個(gè)用于調(diào)整所述波束形成濾波分支的自適應(yīng)處理器;處理數(shù)個(gè)通道信號(hào)的電路,在該通道內(nèi)獲得近似的線性相位響應(yīng),所述電路將一個(gè)或更多濾波器作用于至少一個(gè)通道信號(hào);處理器,用于分割所述分析濾波器組的輸出,使得至少一個(gè)通道信號(hào)可不同于其它通道信號(hào)地被處理。
17.如權(quán)利要求16所述的定向處理系統(tǒng),其中所述電路包括IIR濾波器。
18.如權(quán)利要求16所述的定向處理系統(tǒng),其中用于分割所述分析濾波器組輸出的所述處理器包括至少一個(gè)高通濾波器和至少一個(gè)低通濾波器。
19.如權(quán)利要求16所述的定向處理系統(tǒng),其中所述累加電路接收所述乘法器的輸出,和已被不同地處理的通道信號(hào)的至少任何一個(gè)。
20.如權(quán)利要求1或2所述的定向處理系統(tǒng),其中所述信號(hào)處理器包括以下的至少任何一個(gè)接收所述分析濾波器組輸出的神經(jīng)網(wǎng)絡(luò);將所述神經(jīng)網(wǎng)絡(luò)的輸出乘以所述分析濾波器組輸出的乘法器;累加電路,將所述乘法器的輸出相加來形成數(shù)個(gè)通道信號(hào);配置在所述累加電路和所述綜合濾波器組之間的后置濾波器;控制所述后置濾波器的控制器。
21.如權(quán)利要求20所述的定向處理系統(tǒng),其中所述神經(jīng)網(wǎng)絡(luò)是級聯(lián)混合神經(jīng)網(wǎng)絡(luò)。
22.一種處理數(shù)個(gè)通道信號(hào)用來在通道內(nèi)獲得近似的線性相位響應(yīng)的方法,所述方法包括通過將一個(gè)或更多個(gè)濾波器作用于至少一個(gè)通道信號(hào)來進(jìn)行濾波的步驟。
23.如權(quán)利要求22所述的處理數(shù)個(gè)通道信號(hào)的方法,其中所述濾波器是IIR濾波器。
24.一種在時(shí)域中處理至少一個(gè)信息信號(hào)用來獲得近似的線性相位響應(yīng)的方法,所述方法包括使用至少一個(gè)過采樣分析濾波器組進(jìn)行過采樣的變換的步驟,所述過采樣分析濾波器組將至少一個(gè)分?jǐn)?shù)延遲脈沖響應(yīng)作用于至少一個(gè)濾波器組原型窗。
全文摘要
一種用于波束形成信息信號(hào)的定向信號(hào)處理系統(tǒng)。該系統(tǒng)包括一個(gè)過采樣濾波器組,它有一個(gè)分析濾波器組,將時(shí)域中的信息信號(hào)變成變換域中的通道信號(hào),一個(gè)綜合濾波器組和一個(gè)信號(hào)處理器。該信號(hào)處理器處理分析濾波器組的輸出,來波束形成信息信號(hào)。該綜合濾波器組將信號(hào)處理器的輸出變換為時(shí)域中的單信息信號(hào)。
文檔編號(hào)G10L15/28GK1565144SQ02819484
公開日2005年1月12日 申請日期2002年8月7日 優(yōu)先權(quán)日2001年8月8日
發(fā)明者R·L·布倫南, E·Y·趙, H·S·南德杰, T·施內(nèi)德 申請人:數(shù)字信號(hào)處理工廠有限公司