專(zhuān)利名稱:具有多個(gè)輸入源的音頻處理設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種音頻處理設(shè)備,該設(shè)備包括很多產(chǎn)生輸入音頻信號(hào)的音頻源,以及用來(lái)根據(jù)輸入音頻信號(hào)獲取處理后的音頻信號(hào)的處理裝置,該音頻處理設(shè)備還包括用來(lái)根據(jù)處理后的音頻信號(hào)獲取組合音頻信號(hào)的組合裝置。
本發(fā)明還涉及一種音頻信號(hào)處理設(shè)備以及一種音頻處理方法。
從1997年9月的IEEE Transactions on Speech and AudioProcessing,Vol 5,No,5中S.Affes和Y.Grenier發(fā)表的“A SignalSubspace Tracking Algorithm for Microphone Array Processingof Speech”中可以了解到根據(jù)本發(fā)明的音頻處理。
在當(dāng)前和將來(lái)的通訊系統(tǒng)中,象移動(dòng)電話,視頻會(huì)議和基于互連網(wǎng)(TCP/IP)的通訊系統(tǒng)中,無(wú)手操作變得逐漸重要。而且在用戶接口中使用語(yǔ)音識(shí)別的無(wú)手操作起到重要的作用。
一種降低語(yǔ)音清晰度的聲學(xué)現(xiàn)象是由于從說(shuō)話者到麥克風(fēng)的多路徑傳播引起的混響現(xiàn)象。這種多路徑傳播是由于語(yǔ)音信號(hào)與說(shuō)話者周?chē)h(huán)境,例如墻、家具等等之間的反射造成的。為了處理這種多路徑傳播,常常使用一種所謂的延遲-總和波束形成器。在延遲-總和波束形成器中,來(lái)自多個(gè)麥克風(fēng)的信號(hào)被加上一個(gè)延遲值以補(bǔ)償說(shuō)話者與各個(gè)麥克風(fēng)之間的延遲差值。延遲后的信號(hào)被相加而組合起來(lái)。如果延遲補(bǔ)償作的很好,延遲補(bǔ)償?shù)囊纛l信號(hào)的直達(dá)聲場(chǎng)分量被相干加在一起,而混響語(yǔ)音分量不會(huì)被相干相加。這將會(huì)提高語(yǔ)音清晰度。
延遲-總和波束形成器的一個(gè)問(wèn)題是,它難以準(zhǔn)確確定延遲值并足夠快地追蹤移動(dòng)的說(shuō)話者或很快調(diào)整到另一個(gè)開(kāi)始說(shuō)話的人。在有混響的房間里尤其會(huì)這樣。其結(jié)果是,延遲估計(jì)可能是錯(cuò)誤的,麥克風(fēng)信號(hào)不再被相干疊加。因此,將不會(huì)獲得對(duì)語(yǔ)音信號(hào)清晰度的任何提高。甚至還會(huì)降低語(yǔ)音清晰度。
在上面提到的文章中描述了一種方法用于改進(jìn)語(yǔ)音信號(hào)的清晰度。在所述文章中使用了從說(shuō)話者到麥克風(fēng)的能量傳遞函數(shù),這是基于這樣一種假設(shè)作出的如果說(shuō)話者移動(dòng),該能量傳遞函數(shù)不會(huì)變化很大。上面提到的能量傳遞函數(shù)通過(guò)測(cè)量得到。由于需要對(duì)每個(gè)位置進(jìn)行測(cè)量,使得使用這種方法配置的產(chǎn)品變的很麻煩。
本發(fā)明的目標(biāo)是,提供一種音頻處理設(shè)備,在部署該音頻處理設(shè)備之前不需要進(jìn)行任何測(cè)量。
為了實(shí)現(xiàn)這個(gè)目標(biāo),根據(jù)本發(fā)明的音頻處理設(shè)備的特征在于該音頻處理設(shè)備包括用來(lái)控制處理裝置以便最大化組合音頻信號(hào)的功率測(cè)量值的控制裝置,并且該控制裝置被安排來(lái)將處理后的音頻信號(hào)的組合功率增益測(cè)量值限制到一個(gè)預(yù)定的值。
在組合功率增益測(cè)量值(例如,各個(gè)信號(hào)的功率和)被限制到一個(gè)預(yù)定值的前提下,通過(guò)最大化組合音頻信號(hào)的功率測(cè)量值,就不需要使用任何的測(cè)量數(shù)據(jù)。實(shí)驗(yàn)表明,與以前技術(shù)的設(shè)備相比,語(yǔ)音信號(hào)的清晰度并沒(méi)有變壞。
實(shí)驗(yàn)還證明,在以前技術(shù)的設(shè)備中,當(dāng)使用具有長(zhǎng)脈沖響應(yīng)的濾波器時(shí),會(huì)發(fā)生所謂的預(yù)回聲。預(yù)回聲發(fā)生于在語(yǔ)音信號(hào)的直達(dá)聲場(chǎng)分量被再生之前,再生其經(jīng)過(guò)縮放的版本的時(shí)候。預(yù)回聲的發(fā)生會(huì)使聽(tīng)者感覺(jué)很不舒服。實(shí)驗(yàn)還表明,在根據(jù)本發(fā)明的處理裝置中,預(yù)回聲的發(fā)生基本上少于以前技術(shù)的處理裝置。
本發(fā)明的一個(gè)實(shí)施方案的特征在于,處理裝置包括以縮放因子縮放輸入音頻信號(hào)以獲得處理后的音頻信號(hào)的縮放裝置,所述的控制裝置還包括用來(lái)獲得多個(gè)以某一縮放因子縮放的組合音頻信號(hào)的縮放裝置,其中的縮放因子對(duì)應(yīng)于縮放裝置的縮放因子,并且在于該控制裝置被安排來(lái)最大化組合音頻信號(hào)的功率測(cè)量值,并通過(guò)最小化輸入音頻信號(hào)和對(duì)應(yīng)于該音頻信號(hào)的縮放組合音頻信號(hào)之間的差值來(lái)限制處理后音頻信號(hào)的組合功率增益測(cè)量值。
實(shí)驗(yàn)表明,使用簡(jiǎn)單的縮放因子作為處理工具可以獲得語(yǔ)音清晰度非常明顯的改進(jìn)。適當(dāng)?shù)那疤釛l件是,不同輸入源的縮放因子的平方和等于一個(gè)預(yù)定的常數(shù)。
本發(fā)明的另一個(gè)實(shí)施方案的特征在于,處理裝置包括多個(gè)可調(diào)整濾波器用來(lái)獲得處理后的音頻信號(hào),還在于控制裝置包括多個(gè)進(jìn)一步可調(diào)的濾波器,其傳遞函數(shù)為可調(diào)濾波器傳遞函數(shù)的共扼,所述進(jìn)一步可調(diào)濾波器被安排來(lái)從組合音頻信號(hào)獲得濾波后的組合音頻信號(hào),并且在于控制裝置被安排來(lái)最大化組合音頻信號(hào)的功率測(cè)量值,并通過(guò)控制可調(diào)濾波器和進(jìn)一步可調(diào)濾波器的傳遞函數(shù)從而將處理后的音頻信號(hào)的組合功率增益測(cè)量值限制為一個(gè)預(yù)定值,以便最小化輸入音頻信號(hào)和對(duì)應(yīng)于該輸入音頻信號(hào)的濾波組合音頻信號(hào)之間的差值。
通過(guò)使用可調(diào)濾波器作為處理裝置,語(yǔ)音信號(hào)的質(zhì)量可以進(jìn)一步增強(qiáng)。通過(guò)最小化輸入音頻信號(hào)和對(duì)應(yīng)的濾波組合音頻信號(hào)之間的差值,在每個(gè)頻率分量可調(diào)濾波器的功率增益和都等于一個(gè)預(yù)定常數(shù)的前提下,可以獲得組合音頻信號(hào)功率測(cè)量值的最大化。上面提到的兩個(gè)準(zhǔn)則之間的對(duì)應(yīng)將通過(guò)簡(jiǎn)化的例子在附圖的詳細(xì)描述中給出。
可調(diào)濾波器的使用使得不再需要在延遲-總和波束形成器中采用的任何可調(diào)的延遲元件。
本發(fā)明的又一個(gè)實(shí)施方案的特征在于,音頻源包括多個(gè)麥克風(fēng),并且麥克風(fēng)被放置在其指向性圖案明顯分離的位置。
憑借根據(jù)本發(fā)明的組合裝置,通過(guò)將多個(gè)分離的指向性圖案的麥克風(fēng)組合起來(lái),可以實(shí)現(xiàn)來(lái)自接收最強(qiáng)信號(hào)麥克風(fēng)的信號(hào)被自動(dòng)加強(qiáng)。這種系統(tǒng)可以被很好地用于一類(lèi)會(huì)議系統(tǒng)中,在該系統(tǒng)中發(fā)言者的聲音必須被加強(qiáng),而不需要能夠選擇具有最強(qiáng)信號(hào)的麥克風(fēng)的開(kāi)關(guān)。
本發(fā)明再一個(gè)實(shí)施方案的特征在于音頻源包括多個(gè)麥克風(fēng),這些麥克風(fēng)被放置在一個(gè)線形陣列中。
實(shí)驗(yàn)表明當(dāng)線形陣列的麥克風(fēng)結(jié)合處理裝置中的可調(diào)濾波器被用做音頻源時(shí),語(yǔ)音信號(hào)和它的第一反射被相干相加,使得語(yǔ)音清晰度得到提高。與使用延遲-總和波束形成器的配置相比,這種配置更加強(qiáng)壯,并且收斂更快。可以發(fā)現(xiàn),在線形陣列中麥克風(fēng)被放置在與指向性圖案主瓣方向基本正交的直線上,但是,還可能的是麥克風(fēng)被放置在與指向性圖案主瓣方向一致的線上。
本發(fā)明將被結(jié)合附圖作出解釋
圖1是根據(jù)本發(fā)明的音頻處理設(shè)備,其中實(shí)值的加權(quán)因子被用于處理裝置。
圖2是根據(jù)本發(fā)明的音頻處理設(shè)備,其中頻域自適應(yīng)濾波器和頻域可編程濾波器被使用。
圖3是用于圖2設(shè)備中的歸一化裝置73的詳細(xì)實(shí)施方案。
圖4是用于圖2的頻域自適應(yīng)濾波器62,66,68的實(shí)現(xiàn)。
圖5是用于圖2的頻域可編程濾波器44,46,50的實(shí)現(xiàn)。
圖6是根據(jù)本發(fā)明的音頻處理設(shè)備的實(shí)現(xiàn),其中時(shí)域自適應(yīng)濾波器和時(shí)域可編程濾波器被使用。
在圖1的音頻處理設(shè)備2中,第一音頻源,(這里是麥克風(fēng)4)的輸出端被連接到音頻處理設(shè)備2的第一輸入端,第二音頻源(這里是麥克風(fēng)6)的輸出端被連接到音頻處理設(shè)備2的第二輸入端。如果假設(shè)麥克風(fēng)4,6通過(guò)衰減因子a和b接收信號(hào)VIN,那麼麥克風(fēng)4的輸出信號(hào)等于a.VIN,麥克風(fēng)6的輸出信號(hào)等于b.VIN。這里的處理裝置包括第一縮放裝置10和第二縮放裝置12,這些裝置以縮放因子x和y分別縮放它們的輸入信號(hào)。在處理裝置11的輸出端處,可獲得處理后的信號(hào)VP和VQ。對(duì)于這些處理后的信號(hào)可以有VP=a·x·VIN(1)和VQ=b·y·VIN(2)組合裝置18的輸出端處,可得到處理后的信號(hào)VP和VQ的和VSUM該信號(hào)VSUM等于VSUM=(a·x+b·y)VIN(3)進(jìn)一步縮放裝置14和16利用縮放因子x和y從組合信號(hào)獲得縮放后的組合信號(hào)。第一縮放組合信號(hào)等于VSC1=(a·x+b·y)·x·VIN(4)第二縮放組合信號(hào)等于VSC2=(a·x+b·y)·y·VIN(5)第一輸入音頻信號(hào)和第一縮放組合音頻信號(hào)之間的第一差值測(cè)量值由減法器24確定。對(duì)于減法器24的輸出信號(hào)有VDIFF1={a-(a·x+b·y)·x}·VIN(6)第二輸入音頻信號(hào)和第二縮放組合音頻信號(hào)之間的第二差值測(cè)量值由減法器26確定。對(duì)于減法器26的輸出信號(hào)有VDIFF2={b-(a·x+b·y)·y}·VIN(7)
根據(jù)圖1的設(shè)備包括一個(gè)控制元件20用來(lái)調(diào)整縮放因子x來(lái)使得減法器24的輸出信號(hào)VDIFF1等于0。該設(shè)備還包括一個(gè)控制元件22使得減法器26的輸出信號(hào)VDIFF2等于0。為了找到x和y的值使得兩個(gè)差值都等于0,下述等式必須成立(a·x+b·y)·x=a (8)(a·x+b·y)·y=b (9)通過(guò)(8)被(9)除來(lái)從(8)和(9)中消去(a.x+b.y)得到xy=ab⇒x=a·yb-----(10)]]>在(9)中代入(10)得到y(tǒng)的表達(dá)式(a2·yb+b·y)·y=b⇒y=±ba2+b2-----(11)]]>將(11)代入(10)得到xx=±aa2+b2-----(12)]]>根據(jù)(11)和(12)可以清楚看到當(dāng)a增加(或b降低)時(shí),x增加,當(dāng)b增加(或a降低)時(shí),y增加。采用這種方法,可以得到最強(qiáng)的輸入信號(hào)。這種應(yīng)用能夠相對(duì)背景噪聲和語(yǔ)音信號(hào)混響分量增強(qiáng)說(shuō)話者的語(yǔ)音信號(hào),而不需要象以前的技術(shù)設(shè)備中那樣需要知道說(shuō)話者到麥克風(fēng)的路徑a和b的頻率關(guān)系。對(duì)a和b的估計(jì)可以從麥克風(fēng)輸入信號(hào)的平均值中得到。
下面將要證明的是在處理裝置的功率增益和受限的情況下,最大化組合音頻信號(hào)的功率的結(jié)果是x,y的值與使得減法器24和26的輸出信號(hào)為0的x,y的值相同。
對(duì)于組合音頻信號(hào)VSUM的功率測(cè)量值PSUM有PSUM=VSUM2=(a·x+b·y)2·VIN2(13)對(duì)于邊界條件縮放裝置的功率增益和為一個(gè)常數(shù)可以表示如下GP=x2+y2=1 (14)
因此,在邊界條件x2+y2-1=0下,(a·x+b·y)2必須為最大。這可以利用眾所周知的拉格朗日乘數(shù)方法實(shí)現(xiàn)。根據(jù)所述方法,下面表達(dá)式必須取最大值。(a·x+b·y)2+λ·(x2+y2-1)(15)在(15)中對(duì)x和y微分,并使結(jié)果為0得到2·(a·x+b·y)·a+2·λ·x=0 (16)2·(a·x+b·y)·b+2·λ·y=0 (17)將(16)乘以y并將(17)乘以x并相減,得到y(tǒng)=ba·x-----(18)]]>將(18)代入(14),分別得到x和yx=±aa2+b2;y=±ba2+b2-----(19)]]>該結(jié)果對(duì)應(yīng)于(11)和(12)。因此,很明顯,控制x和y使差值信號(hào)為0等價(jià)于在邊界條件處理裝置的不同分支的功率增益和被限制為一個(gè)最大值的條件下,最大化組合信號(hào)的功率。
對(duì)于具有傳遞因子ai,1≤i≤N的N個(gè)輸入,上面的描述是很容易推廣的。如果假設(shè)處理裝置具有N個(gè)分支,每個(gè)對(duì)應(yīng)于信號(hào)i并具有傳遞因子xi,對(duì)于這些xi有xi=±aiΣj=1Naj2-----(20)]]>根據(jù)圖1的設(shè)備可以與延遲元件結(jié)合以補(bǔ)償從音頻信號(hào)源到幾個(gè)麥克風(fēng)的路徑延遲之間的差別。根據(jù)本發(fā)明的設(shè)備提高了性能,而且在補(bǔ)償路徑延遲的延遲元件的延遲值還沒(méi)有被調(diào)整到最佳值的過(guò)渡期間,性能也得到了提高。
在根據(jù)圖2的音頻處理設(shè)備中,來(lái)自音頻源-這里是麥克風(fēng)30,32,34-的輸入信號(hào)被轉(zhuǎn)換成數(shù)字信號(hào),通過(guò)相應(yīng)的串-并行轉(zhuǎn)換器36,38,40,這些數(shù)字信號(hào)又被轉(zhuǎn)換成包含L個(gè)樣本的數(shù)據(jù)塊。串-并行轉(zhuǎn)換器36,38,40的輸出被連接到處理裝置41的相應(yīng)輸入端,并被分別連接到塊延遲元件54,56,58的輸入端。
在處理裝置41中,串-并行轉(zhuǎn)換器36的輸出信號(hào)被施加給塊連接單元42。塊連接單元42根據(jù)當(dāng)前的L樣本數(shù)據(jù)塊和來(lái)自以前樣本塊的N個(gè)樣本構(gòu)造包含N+L個(gè)樣本的數(shù)據(jù)塊,其中的N個(gè)樣本可以在串-并行轉(zhuǎn)換器36的輸出處獲得。塊連接單元42的輸出端被連接到頻域可編程濾波器44的輸入端處。頻域可編程濾波器44的輸出端-載有處理后的音頻信號(hào)-被連接到組合裝置(這里是加法器76)的第一輸入端。頻域可編程濾波器44在其輸出端處產(chǎn)生包含N+L個(gè)樣本的樣本塊。
以同樣的方法,串-并行轉(zhuǎn)換器38的輸出信號(hào)被塊連接單元48和頻域可編程濾波器46處理,串-并行轉(zhuǎn)換器40的輸出信號(hào)被塊連接單元52和頻域可編程濾波器50處理。頻域可編程濾波器46,50的輸出端載有處理后的音頻信號(hào),它被連接到加法器76的相應(yīng)輸入端。
加法器76的輸出被連接到IFFT單元77的輸入端,該單元根據(jù)加法器76的輸出信號(hào)確定經(jīng)過(guò)反向快速傅立葉變換的信號(hào)。IFFT單元77的輸出被連接到單元79的輸入端,后者拋棄IFFT單元77輸出端處N+L個(gè)樣本中的N個(gè)樣本。
單元77的輸出信號(hào)被并-串轉(zhuǎn)換器78轉(zhuǎn)換成串形的樣本流。在并-串轉(zhuǎn)換器78的輸出端處可以獲得音頻處理設(shè)備的輸出信號(hào)。單元79的輸出信號(hào)也被傳送給塊連接單元74,后者根據(jù)當(dāng)前在加法器76的輸出端處得到的包含L個(gè)樣本的樣本塊和在單元79的輸出端處得到的包含N個(gè)以前樣本的樣本塊得到包含N+L個(gè)樣本的樣本塊。塊連接單元74的輸出被連接到快速傅立葉變換器72的輸入端,該變換器根據(jù)其輸入端的N+L個(gè)樣本計(jì)算N+L點(diǎn)的FFT??焖俑盗⑷~變換器72的輸出信號(hào)表示組合信號(hào)的頻譜。該頻譜被傳送給頻域自適應(yīng)濾波器62,66,68的輸入端,以及歸一化裝置73的輸入端。歸一化裝置73的輸出信號(hào)被連接到頻域自適應(yīng)濾波器62,66,68的輸入端。
塊延遲元件54的輸出端被連接到減法器60的第一輸入端。塊延遲元件56的輸出端被連接到減法器64的第一輸入端,塊延遲元件58的輸出端被連接到減法器70的第一輸入端。塊延遲元件54,56,58被用來(lái)補(bǔ)償音頻信號(hào)在頻域可編程濾波器44,46,50和頻域自適應(yīng)濾波器62,66,68中經(jīng)受的延遲。
頻域自適應(yīng)濾波器62的輸出端被連接到減法器60的第二輸入端,減法器60的輸出端被連接到頻域自適應(yīng)濾波器的控制輸入端。頻域自適應(yīng)濾波器66的輸出端被連接到減法器64的第二輸入端,減法器64的輸出端被連接到頻域自適應(yīng)濾波器的控制輸入端。頻域自適應(yīng)濾波器68的輸出端被連接到減法器70的第二輸入端,減法器70的輸出端被連接到頻域自適應(yīng)濾波器的控制輸入端。
頻域自適應(yīng)濾波器62,66,68被安排來(lái)調(diào)整它們的傳遞函數(shù)以便最小化其控制輸入處的輸入信號(hào)功率。頻域自適應(yīng)濾波器62,66,68將其N(xiāo)+L個(gè)濾波器系數(shù)提供給頻域可編程濾波器44,46,48。這些頻域自適應(yīng)濾波器在利用它們對(duì)從塊連接單元42,48,52接收的信號(hào)濾波之前確定這N+L個(gè)濾波器系數(shù)的共扼值。
在根據(jù)圖3的頻域自適應(yīng)濾波器62,66,68中,填充元件80將從各個(gè)頻域自適應(yīng)濾波器的控制輸入端得到的L個(gè)樣本與值為0的N個(gè)樣本組合成包含N+L個(gè)數(shù)據(jù)的樣本塊。該N+L樣本塊被FFT元件82進(jìn)行N+L點(diǎn)快速傅立葉變換。在執(zhí)行FFT之前將包含L個(gè)樣本的樣本塊擴(kuò)展成包含N+L個(gè)樣本的樣本塊的操作是為了避免信號(hào)的失真,這種失真是由于FFT信號(hào)在半采樣頻率處的對(duì)稱性造成的。對(duì)于頻域(自適應(yīng))濾波器領(lǐng)域的技術(shù)人員來(lái)說(shuō)這一點(diǎn)是眾所周知的。
在FFT元件82的輸出端處,可獲得頻域自適應(yīng)濾波器控制輸入端處(減法器60,64,70的輸出)的信號(hào)頻譜。FFT元件82的輸出信號(hào)被乘以歸一化裝置73的輸出信號(hào)。歸一化裝置73的輸出信號(hào)的N+L個(gè)分量表示確定頻域自適應(yīng)濾波器系數(shù)的調(diào)整速度的調(diào)整速度值。
乘法器84的輸出信號(hào)被加入塊延遲元件112的輸出信號(hào)中。塊延遲元件112的輸出信號(hào)表示頻域自適應(yīng)濾波器系數(shù)的以前值。加法器86的輸出信號(hào)被IFFT元件94進(jìn)行反向快速傅立葉變換。根據(jù)IFFT元件94的2.L個(gè)輸出樣本,最后L個(gè)樣本的值被元件96設(shè)置為0。接下來(lái),2.L個(gè)樣本(其中L個(gè)樣本為0)被FFT元件110進(jìn)行FFT操作。IFFT元件94,元件96和FFT元件110的使用被用來(lái)避免由于FFT處理器82執(zhí)行的FFT變換的周期性造成的信號(hào)失真。
在FFT元件110的輸出處,可得到N+L個(gè)系數(shù)用于濾波操作。這些系數(shù)也被傳遞給相應(yīng)的頻域可編程濾波器。這些系數(shù)也被通過(guò)塊延遲元件112傳遞給加法器86。加法器86,IFFT元件94,元件96和FFT元件110和塊延遲元件112一起根據(jù)下面的表達(dá)式共同確定濾波器系數(shù)Vi,k=Vi,k-1+λi,k·Ei,k(21)在(21)中,vi,k表示在時(shí)刻k的N+L個(gè)濾波器系數(shù),vi,k-1表示在時(shí)刻k-1的N+L個(gè)濾波器系數(shù),λi,k表示歸一化裝置73提供給乘法器84的第二輸入端的自適應(yīng)系數(shù),Ek,i表示圖2中減法器60,64和70輸出端處誤差信號(hào)的頻譜。
在根據(jù)圖4的歸一化裝置73中,圖2中FFT 72單元提供的輸入信號(hào),共扼元件106確定所述輸入信號(hào)的共扼值。該共扼值被乘法器104乘以所述的輸入信號(hào)。在乘法器104的輸出端處,可獲得輸入信號(hào)的功率譜。乘法器104的輸出端被連接到乘法器102的輸入端。
由乘法器102,加法器100,乘法器98和塊延遲元件92組成的低通濾波器確定可在乘法器104的輸出端獲得的頻域自適應(yīng)濾波器輸入信號(hào)功率譜的時(shí)間平均。b的一個(gè)適當(dāng)值為b=1-20·Lfsample-----(22)]]>在(22)中fsample是采樣頻率,音頻信號(hào)以該采樣率被采樣和處理。L=32已經(jīng)被證明是一個(gè)有用的值。具有時(shí)間平均功率譜信息的加法器100的輸出端被連接到除法器88的第一輸入端。共扼元件106的輸出信號(hào)被縮放元件90以縮放因子2a縮放。a的一個(gè)適當(dāng)值是0.01??s放元件90的輸出信號(hào)被連接到除法器88的第二輸入端。
除法器確定λi,k的值,其方式為計(jì)算數(shù)字濾波器的輸入信號(hào)的共扼FFT變換(以縮放因子2a縮放)與歸一化裝置73的輸入信號(hào)的時(shí)間平均功率譜之間的比值。λi,k隨著輸入信號(hào)的k階譜分量和時(shí)間平均功率譜的k階譜分量之間的比成正比增長(zhǎng)。這產(chǎn)生一種自適應(yīng)語(yǔ)音,它對(duì)于所有頻率分量都是一樣的而不管他們的強(qiáng)度如何。
在根據(jù)圖5的頻域可編程濾波器44,46,50中,輸入信號(hào)被傳送給FFT元件120的輸入端,120根據(jù)所述輸入信號(hào)計(jì)算N+L點(diǎn)FFT。共扼元件122確定從頻域自適應(yīng)濾波器62,66,68接收到的參數(shù)的共扼值。乘法器124通過(guò)將輸入信號(hào)的FFT乘以從頻域自適應(yīng)濾波器接收的共扼濾波器系數(shù)來(lái)計(jì)算濾波后的信號(hào)。
IFFT元件126根據(jù)在乘法器124的輸出端獲得的濾波后輸出信號(hào)來(lái)計(jì)算時(shí)域輸出信號(hào)。拋棄元件拋棄來(lái)自IFFT元件126的輸出信號(hào)的最后L個(gè)樣本并在其輸出端給出頻域可編程濾波器的輸出信號(hào)。
可以觀察到,對(duì)N的適當(dāng)選擇是使N=L,但是也可能的是選擇N大于或小于L。理想的是使得N+L等于2的冪以便比較容易地實(shí)現(xiàn)FFT和IFFT操作。
在根據(jù)圖6的音頻處理設(shè)備的時(shí)域?qū)崿F(xiàn)中,麥克風(fēng)30,32,34的輸出端被連接到處理裝置131以及延遲元件186,188和190的輸入端。處理裝置131包括時(shí)域可編程濾波器133,135和137。
時(shí)域可編程濾波器133包括很多級(jí)聯(lián)延遲元件130,132和134,以及將以加權(quán)因子W1,1......W1,N加權(quán)的延遲元件的輸出信號(hào)相加的加法器146。其中的加權(quán)是由加權(quán)元件136,138,140,142和144執(zhí)行的。時(shí)域可編程濾波器135包括很多級(jí)聯(lián)延遲元件148,150和152,以及將以加權(quán)因子W2,1......W2,N加權(quán)的延遲元件的輸出信號(hào)相加的加法器164。其中的加權(quán)是由加權(quán)元件154,156,158,160和162執(zhí)行的。時(shí)域可編程濾波器137包括多個(gè)級(jí)聯(lián)延遲元件166,168和170,以及將以加權(quán)因子WM,1......WM,N加權(quán)的延遲元件的輸出信號(hào)相加的加法器182。
時(shí)域可編程濾波器133,135和137的輸出端載有處理后音頻信號(hào),它被連接到這里為加法器184的組合裝置。在加法器184的輸出端處,可獲得加強(qiáng)的語(yǔ)音信號(hào)。加法器184的輸出端被連接到時(shí)域自適應(yīng)濾波器191,193,和195的輸入端。
時(shí)域自適應(yīng)濾波器191包括很多延遲元件194,196和198。延遲元件194,196和198的輸出信號(hào)被加權(quán)元件200,202,204,206和208以加權(quán)因子W1,1......W1,N加權(quán)。加權(quán)元件200......208的輸出信號(hào)被加法器192相加,該加法器提供自適應(yīng)濾波器191的輸出信號(hào)。
時(shí)域自適應(yīng)濾波器193包括很多延遲元件226,228和230。延遲元件226,228和230的輸出信號(hào)被加權(quán)元件216,218,220,222和224以加權(quán)因子W2,1......W2,N加權(quán)。加權(quán)元件216......224的輸出信號(hào)被加法器210相加,該加法器提供自適應(yīng)濾波器193的輸出信號(hào)。
時(shí)域自適應(yīng)濾波器195包括很多延遲元件236,240和246。延遲元件236,240和246的輸出信號(hào)被加權(quán)元件234,238,242,244和248以加權(quán)因子WM,1......WM,N加權(quán)。加權(quán)元件234......248的輸出信號(hào)被加法器232相加,該加法器提供自適應(yīng)濾波器195的輸出信號(hào)。
延遲元件186,188和190的輸出被連接到減法器212,214和250的第一輸入端。延遲元件186,188和190被用來(lái)使得可編程濾波器的脈沖響應(yīng)對(duì)應(yīng)于時(shí)域可編程濾波器的脈沖響應(yīng)相對(duì)為非因果性的(anticausal)(在時(shí)間上早)。減法器212,214和250的第二輸入被耦合到時(shí)域自適應(yīng)濾波器191,193和195的輸出端。減法器212,214和250的輸出被分別連接到控制裝置231,233和235。這些控制裝置被安排來(lái)調(diào)整對(duì)應(yīng)自適應(yīng)濾波器191,193和195的傳遞函數(shù)來(lái)最小化相應(yīng)減法器輸出信號(hào)的功率。
控制裝置231,233和235被安排用來(lái)根據(jù)下面表達(dá)式調(diào)整自適應(yīng)濾波器191,193和195的系數(shù)。Wj,k(n+1)=Wj,k(n)+μ·y[n-k]·ej[n](23)在(23)中,Wj,k(n)是j階自適應(yīng)濾波器中k階加權(quán)元件的加權(quán)因子,μ是自適應(yīng)常數(shù),ej[n]是延遲輸入信號(hào)的j階塊延遲元件的輸出信號(hào)與j階自適應(yīng)濾波器輸出信號(hào)之間的差值。yj[n-k]是音頻處理設(shè)備的輸出信號(hào)經(jīng)過(guò)k個(gè)樣本延遲后的值。這些信號(hào)y[n-k]可以在自適應(yīng)濾波器的延遲元件的輸出端處獲得。因?yàn)樽赃m應(yīng)濾波器都具有相同的輸入信號(hào),延遲元件可以被共享,使得所需延遲元件的數(shù)目減少。
在系數(shù)Wj,k(n)被確定之后,這些系數(shù)被反向傳送給時(shí)域可編程濾波器133,135和137。這意味著對(duì)應(yīng)于自適應(yīng)濾波器的第一抽頭的系數(shù)被傳送給相應(yīng)可編程濾波器中最后一個(gè)抽頭的系數(shù)。
權(quán)利要求
1.一種音頻處理設(shè)備,包括多個(gè)產(chǎn)生輸入音頻信號(hào)的音頻源以及用來(lái)根據(jù)輸入音頻信號(hào)獲取處理后的音頻信號(hào)的處理裝置,該音頻處理設(shè)備還包括用來(lái)根據(jù)處理后的音頻信號(hào)獲取組合音頻信號(hào)的組合裝置;該音頻處理設(shè)備的特征在于它包括用來(lái)控制處理裝置以便最大化組合音頻信號(hào)的功率測(cè)量值的控制裝置,并且在于該控制裝置被安排來(lái)將處理后的音頻信號(hào)的組合功率增益測(cè)量值限制在一個(gè)預(yù)定的值。
2.根據(jù)權(quán)利要求1的音頻處理設(shè)備,其特征在于處理裝置包括用來(lái)以縮放因子縮放輸入音頻信號(hào)以獲得處理后的音頻信號(hào)的縮放裝置,所述的控制裝置還包括用來(lái)獲得多個(gè)以某一縮放因子縮放的組合音頻信號(hào)的縮放裝置,其中的縮放因子對(duì)應(yīng)于縮放裝置的縮放因子,并且在于該控制裝置被安排來(lái)最大化組合音頻信號(hào)的功率測(cè)量值,并通過(guò)最小化輸入音頻信號(hào)和對(duì)應(yīng)于該輸入音頻信號(hào)的縮放組合音頻信號(hào)之間的差值來(lái)限制處理后音頻信號(hào)的組合功率增益。
3.根據(jù)權(quán)利要求1的音頻處理設(shè)備,其特征在于處理裝置包括多個(gè)可調(diào)整濾波器用來(lái)獲得處理后的音頻信號(hào),還在于控制裝置包括多個(gè)進(jìn)一步可調(diào)的濾波器,其傳遞函數(shù)為可調(diào)濾波器傳遞函數(shù)的共扼,所述進(jìn)一步可調(diào)濾波器被安排來(lái)從組合音頻信號(hào)獲得濾波后的組合音頻信號(hào),并且在于控制裝置被安排來(lái)最大化組合音頻信號(hào)的功率測(cè)量值,并通過(guò)控制可調(diào)濾波器和進(jìn)一步可調(diào)濾波器的傳遞函數(shù)從而將處理后的音頻信號(hào)的組合功率增益測(cè)量值限制為一個(gè)預(yù)定值,以便最小化輸入音頻信號(hào)和對(duì)應(yīng)于該輸入音頻信號(hào)的濾波組合音頻信號(hào)之間的差值。
4.根據(jù)權(quán)利要求2的音頻處理設(shè)備,其特征在于該音頻處理設(shè)備包括用來(lái)補(bǔ)償輸入音頻信號(hào)中存在的普通音頻信號(hào)的延遲差值的延遲元件。
5.根據(jù)前面權(quán)利要求的一個(gè)或多個(gè)的音頻處理設(shè)備,其特征在于音頻源包括多個(gè)麥克風(fēng),并且麥克風(fēng)被放置在它們的指向性圖案分離的位置。
6.根據(jù)權(quán)利要求5的音頻處理設(shè)備,其特征在于麥克風(fēng)圍繞一個(gè)中心點(diǎn)放置,兩個(gè)麥克風(fēng)之間的角度為360度除以麥克風(fēng)的數(shù)目。
7.根據(jù)權(quán)利要求1,2,3或4的音頻處理設(shè)備,其特征在于音頻源包括多個(gè)麥克風(fēng),這些麥克風(fēng)被放置在一個(gè)線形陣列中。
8.一種音頻處理設(shè)備,包括多個(gè)用來(lái)接收輸入音頻信號(hào)的輸入端,以及用來(lái)根據(jù)輸入音頻信號(hào)獲取處理后的音頻信號(hào)的處理裝置,該音頻處理設(shè)備還包括用來(lái)根據(jù)處理后的音頻信號(hào)獲取組合音頻信號(hào)的組合裝置;該音頻處理設(shè)備的特征在于它包括用來(lái)控制處理裝置以便最大化組合音頻信號(hào)的功率測(cè)量值的控制裝置,并且在于該控制裝置被安排來(lái)將處理后的音頻信號(hào)的組合功率增益測(cè)量值限制在一個(gè)預(yù)定的值。
9.根據(jù)權(quán)利要求8的音頻處理設(shè)備,其特征在于處理裝置包括用來(lái)以縮放因子縮放輸入音頻信號(hào)以獲得處理后的音頻信號(hào)的縮放裝置,所述的控制裝置還包括用來(lái)獲得多個(gè)以某一縮放因子縮放的組合音頻信號(hào)的縮放裝置,其中的縮放因子對(duì)應(yīng)于縮放裝置的縮放因子,并且在于該控制裝置被安排來(lái)最大化組合音頻信號(hào)的功率測(cè)量值,并通過(guò)最小化輸入音頻信號(hào)和對(duì)應(yīng)于該音頻信號(hào)的縮放組合音頻信號(hào)之間的差值來(lái)限制處理后音頻信號(hào)的組合功率增益。
10.一種音頻處理方法,包括從多個(gè)音頻源接收很多輸入音頻信號(hào),根據(jù)輸入音頻信號(hào)獲取處理后的音頻信號(hào),根據(jù)處理后的音頻信號(hào)獲取組合音頻信號(hào),其特征在于該方法包括控制音頻信號(hào)的處理以便最大化組合音頻信號(hào)的功率測(cè)量值,并且在于該方法包括控制將處理后的音頻信號(hào)的組合功率增益測(cè)量值限制在一個(gè)預(yù)定值的過(guò)程。
全文摘要
在音頻處理設(shè)備(2)中,來(lái)自多個(gè)輸入源(4,6)的輸入信號(hào)被加權(quán)元件(10,12)以加權(quán)因子X(jué)和y加權(quán)。加權(quán)后的輸入信號(hào)被加法器(18)組合為一個(gè)組合信號(hào)。加法器(18)的輸出信號(hào)構(gòu)成音頻處理設(shè)備的輸出。為了以最強(qiáng)的信號(hào)來(lái)發(fā)音,在滿足加權(quán)系數(shù)的平方和為一個(gè)常數(shù)的條件下,加權(quán)系數(shù)(x,y)被控制來(lái)最大化加法器(18)的輸出。
文檔編號(hào)G10L21/02GK1251192SQ98803542
公開(kāi)日2000年4月19日 申請(qǐng)日期1998年11月20日 優(yōu)先權(quán)日1997年11月22日
發(fā)明者H·J·W·貝爾特, C·P·楊瑟 申請(qǐng)人:皇家菲利浦電子有限公司