亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種麥克風陣列遠場語音增強裝置的制作方法

文檔序號:11621583閱讀:483來源:國知局
一種麥克風陣列遠場語音增強裝置的制造方法

本發(fā)明涉及一種麥克風陣列語音增強裝置,尤其是涉及一種可實現遠場語音增強的麥克風陣列裝置。



背景技術:

與使用單個麥克風的語音系統(tǒng)相比,麥克風陣列技術可利用空間排列的多個麥克風進行多通道語音信號空-時綜合處理,從而實現語音增強、語音分離、聲源定位等功能,可極大地改善語音質量。但隨著人機交互、智能家居、語音分離等領域對語音信號處理需求的迅速發(fā)展,說話人位于較遠距離時(如距離5m、8m、10m,甚至更遠)的遠場語音場景成為一個極大的技術挑戰(zhàn)。

中國專利zl2010591158.2公開一種視頻定位的長距離拾音裝置,該裝置在以攝像機為中心的圓周安裝2個指向麥克風構成高指向性聲聚焦桶,并在桶側壁外安裝2個全向麥克風用于獲取參考噪聲,該裝置隨攝像頭轉動時操作員可根據視頻圖像內容進行對焦、視頻定位后獲取與攝像頭同方向的長距離語音信號。

中國專利zl2012103200049公開一種帶聲源方向跟蹤功能的麥克風陣列語音增強裝置,該裝置利用平行濾波器結構結合波束掃描以實現對移動聲源的語音增強處理。

在遠場條件下,隨著距離的增加語音信號信噪比迅速降低,再考慮到環(huán)境噪聲及混響等困難,采用普通的麥克風陣列語音處理技術通過波束成形、旁瓣抵消等方式進行遠場語音增強的性能并不理想,在實際應用中復雜混響、背景噪聲的條件下實現遠場語音增強具有極大的困難,難以獲得滿意的遠場語音增強性能。



技術實現要素:

本發(fā)明的目的在于提供一種麥克風陣列遠場語音增強裝置。

本發(fā)明設有:

麥克風陣列模塊,用于多通道采集語音信號、前置處理和模數轉換;

聲源定位模塊,用于對每個麥克風陣列單元聲聚焦引入的相位差進行自校正;

波束對準增強模塊,用于根據目標說話人方向調整各通道時延進行聲源方向對準;

傳輸函數估計模塊,用于估計不同反射聲分量相對主波束的傳輸函數;

多通道反射聚焦模塊,用于對經不同反射路徑的多徑發(fā)射聲分量進行聚焦增強處理;

合并增強模塊,用于對波束對準和發(fā)射聚焦獲得的語音進行合并增強。

所述麥克風陣列模塊,用于進行各麥克風信號的采集、放大和模擬數字轉換,所述麥克風陣列模塊中各通道語音信號輸出端依次經前置放大電路和模數轉換器后,通過數據線分別和聲源方位估計模塊、傳輸函數估計模塊的信號輸入端相連接;

所述聲源定位模塊,用于獲得聲源方向,所述聲源定位模塊設有信號輸入端、聲源方向輸出端,信號輸入端接麥克風陣列輸出端,聲源方向輸出端接波束對準增強模塊的方向輸入端;

所述波束對準增強模塊,用于根據聲源方向進行波束對準和增強處理,所述波束對準增強模塊設有信號輸入端、聲源方向輸入端和增強信號輸出端,信號輸入端接麥克風陣列輸出端,聲源方向輸入端接出端接聲源定位模塊的聲源方向輸出端,增強信號輸出端分別接合并增強模塊的主波束信號輸入端;

所述傳輸函數估計模塊,用于根據波束對準增強信號和麥克風陣列信號進行反射分量的反射傳輸函數估計,所述傳輸函數估計模塊設有主波束信號輸入端、麥克風陣列信號輸入端和反射響應輸出端,主波束信號輸入端接波束對準增強模塊的增強信號輸出端,麥克風陣列信號輸入端接麥克風陣列模塊各通道語音信號的輸出;

所述多通道反射聚焦模塊,用于根據估計獲得的傳輸函數對遠程語音中的直達、反射聲進行聚焦處理,所述多通道反射聚焦模塊設有麥克風陣列信號輸入端、傳輸函數輸入端和反射聚焦增強輸出端,經過反射聚焦增強模塊進行反射聚焦增強處理后,輸出聚焦增強語音至合并增強模塊;

所述合并增強模塊,用于對波束對準增強語音、多通道反射聚焦語音兩部分語音進行合并增強,所述合并增強模塊設有波束增強語音輸入端、多通道反射聚焦語音輸入端,分別接波束對準增強模塊和多通道反射聚焦模塊的對應輸出端,模塊的輸出端輸出合并增強語音。

所述麥克風陣列遠場語音增強裝置,進行遠場語音增強的步驟如下:

1個聲源方位估計步驟:根據本領域通用的麥克風陣列聲源定位算法對各通道麥克風陣列信號進行聲源方向估計,輸出聲源方向;

1個波束對準增強步驟:根據聲源方向利用本領域通用的麥克風陣列波束對準增強算法對準聲源方向進行時延調整、語音增強,輸出波束對準增強語音;

1個傳輸函數估計步驟:根據波束對準增強語音和麥克風陣列各通道語音進行各通道相對主波束的傳輸函數估計,輸出傳輸函數估計結果;

1個多通道反射聚焦步驟:利用獲得的傳輸函數對麥克風陣列個通道語音信號進行發(fā)射聚焦處理,達到利用反射能量增強語音的目的,輸出反射聚焦增強結果;

1個合并增強步驟:對波束對準增強和反射聚焦增強進行合并增強,輸出合并增強結果。

本發(fā)明首先利用本領域通用的聲源定位技術估計遠場聲源方向,并采用本領域通用的麥克風陣列波束對準形成主波束對遠場語音進行初步增強,針對遠場條件下語音信噪比低的核心問題,本裝置逐個對麥克風陣列各通道相對主波束的傳輸函數進行估計,并基于傳輸函數估計結果進行各通道接收信號中反射分量的聚焦增強,最后對主波束對準初步增強和反射聚焦增強兩部分增強語音進行合并進一步提高語音信噪比,實現遠場語音的麥克風陣列語音增強。

本發(fā)明針對遠場語音信噪比低、受噪聲、混響影響嚴重的問題,不僅采用麥克風陣列波束形成進行從聲源到麥克風陣列的直達聲信號的空間對準增強,而且,與傳統(tǒng)麥克風陣列語音增強方法對反射形成的混響語音進行抑制不同,本發(fā)明提出利用經過不同反射路徑形成的反射語音進行多通道混響分量聚焦來進一步實現遠場微弱語音信號的增強,從而實現利用多徑能量的遠場語音增強處理。

與現有的麥克風陣列語音增強方法相比,本發(fā)明提出的麥克風陣列遠場語音增強裝置有兩個突出的優(yōu)點:第一,在對聲源方向進行波束對準增強的同時,對遠場語音中的反射聲能量進行多通道聚焦增強,相對于傳統(tǒng)麥克風陣列增強方法對非聲源方向語音作為干擾進行抑制處理,有效利用遠場語音中反射聲部分能量可有效提高遠場增強效果;第二,對波束對準增強和多通道反射聚焦增強兩部分增強語音進行合并增強處理,在合并增強處理中通過對兩部分增強語音進行相位對齊實現合并增強,進一步提高遠場增強效果。

附圖說明

圖1為本發(fā)明實施例的結構組成框圖。

圖2為本發(fā)明實施例中的5元麥克風圓陣與微處理器電路連接圖。

圖3為本發(fā)明實施例的5元麥克風圓陣時延補償波束成形原理圖。

圖4為本發(fā)明實施例的5元麥克風圓陣各陣元信號與主波束信號間的傳輸函數。

圖5為本發(fā)明實施例的5元麥克風圓陣多通道反射聚焦后與主波束信號間的傳輸函數。

具體實施方式

為了使本發(fā)明的技術內容、特征、優(yōu)點更加明顯易懂,以下實施例將結合附圖對本發(fā)明作進一步的說明。如圖1所示,所述麥克風陣列遠場語音增強裝置實施例設有麥克風陣列1、聲源定位模塊2、波束對準增強模塊3、傳輸函數估計模塊4、多通道反射聚焦模塊5、合并增強模塊6。

所述帶相位自校正功能的聲聚焦麥克風陣列長距離拾音裝置實施例中麥克風陣列由5個等間距排列的麥克風(m0,m1,…,m4)組成圓形結構麥克風陣列,陣列中各麥克風單元在圓周上等間隔分布,相鄰麥克風陣元的夾角為72度,本實施例中圓周直徑為20cm。

麥克風陣列由本領域通用的麥克風單元及硬件電路組成,其中麥克風陣列由體積小、結構簡單、電聲性能好的壓強式駐極體麥克風m0,…,m4,njm2100運算放大器芯片構成的前置放大電路及max118模數轉換芯片構成(如圖2所示)。

聲源定位模塊、波束對準增強模塊、傳輸函數估計模塊、多通道反射聚焦模塊、合并增強模均屬于數字信號處理模塊,在本實施例中采用本領域通用的arm9s3c2440微處理器進行算法編程實現。

麥克風陣列與微處理器的連接采用本領域通用的連接方式:麥克風陣列中5個麥克風輸出信號經過圖2所示運算放大器構成的2級前置放大電路放大后輸入多通道模數轉換芯片max118,s3c2440微處理器通過io口gpb2,3,4控制max118的輸入通道端a1、a2、a3,通過定時器輸出腳tout0、tout1控制max118的讀出/寫入端口wr、rd進行采樣頻率16ksps的模數轉換,通過數據線data0至data7進行8bit模數轉換結果到s3c2440微處理器的傳送。

所述麥克風陣列遠場語音增強裝置實施例中多通道語音信號模數轉換進入微處理器后,以軟件編程形式運行的各數字信號處理模塊間的數據、控制流連接方式如圖3所示,具體說明如下:

本發(fā)明實施例中聲源定位采用本領域通用的相位變化(phat)方法(參考文獻3)估計遠場聲源所在方向θ。

獲得聲源方向θ后,本發(fā)明實施實施例中采用本領域通用的時延補償波束成形方法對準進行波束成形,通過形成對準聲源方向的主波束進行遠場語音的初步增強。具體過程如下:

x'i(k)=xi(k');

k'=k+round[di,j],i=1,2,3,4,5;

其中:k'為時延調整前信號采樣點的時間刻度;k為時延調整后信號采樣點的時間刻度;xi(k')為時延調整前的第i通道采樣信號;x’i(k)為時延調整后的第i通道采樣信號;i為圓陣中各圓周麥克風通道的編號,i=1,2,3,4,5;θ為聲源定位模塊獲得的聲源方向角度;θd為圓陣第1個麥克風的固定方位角(本實施例中設置θd=15度);

di代表第i個圓陣麥克風在聲源角度θ下相對圓陣中心的時延值對應的采樣點數;r為圓陣半徑,本實施例中r=0.1m;c為空氣中的聲速(本實施例中取340m/s);fs為麥克風陣列語音信號的采樣頻率(單位為hz,在本實施例中取16000hz);round()代表取整運算;

xθ(k)為對應聲源角度θ進行波束成形獲得的初步增強信號。

由于本發(fā)明考慮的是遠場條件下的語音信號,經過初步波束成形增強后的語音信噪比仍偏低,無法滿足語音信號處理的要求。本發(fā)明實施例中的傳輸函數估計模塊以波束成形獲得的初步增強主波束信號作為參考信號,計算麥克風陣列各陣元與主波束信號之間的傳輸函數。麥克風陣列各麥克風信號與主波束信號之間的傳輸函數可以通過如下互相關計算獲得:

其中:xθ(k)為對準聲源方向θ波束成形獲得的主波束信號,l為互相關計算窗長,本實施例中取l=1800;l為互相關計算時主波束與第i個麥克風陣元信號之間的時延差,s為時延搜索范圍,本實施例中取為900。

麥克風陣列各陣元與主波束信號之間的傳輸函數中包含了位于遠場的聲源到各陣元之間直達聲以及不同路徑反射聲組成的分量,即麥克風陣列第i陣元與主波束信號之間的傳輸函數可近似視為由pi個時延分別在dp,幅度分別為ap的直達及反射多徑分量組成,如下式所示:

其中pi為麥克風陣列第i通道語音傳播過程中直達及反射多徑分量的個數,p為各直達及多徑分量的編號,p=1,2,…,pi,dp、ap分別為編號p的直達及反射多徑分量對應的時延、幅度。

也即,各陣元接收信號xi(k)可以視為主波束信號與傳輸函數卷積后疊加噪聲ni(k)的結果:

xi(k)≈xθ(k)*hi(k)+ni(k)

常規(guī)的麥克風陣列增強算法通常采用抑制多徑反射聲的方法來增強直達聲信號,達到增強目的,但對于聲源位于遠場、語音信號信噪比極低的場合,單純采用抑制多徑反射來進行語音增強會導致性能下降。圖4所示為聲源位于6m距離的遠場條件下,本發(fā)明實施例5元麥克風圓陣各陣元信號與對準聲源方向主波束間的傳輸函數,從圖中可以看出各陣元與主波束之間存在嚴重的反射分量,嚴重影響了對準聲源方向的主波束語音的信噪比。

本發(fā)明提出的利用獲得的麥克風陣列各陣元與主波束信號之間的傳輸函數進行多通道反射聚焦處理,具體處理過程為:首先對傳輸函數估計模塊獲取的傳輸函數hi(k)進行時間反轉獲得hi(-k),然后對各陣元信號采用時間反轉后的傳輸函數hi(-k)進行卷積運算,如下式所示:

xi(k)*hi(-k)=xθ(k)*hi(k)*hi(-k)+ni(k)*hi(-k)

其中的傳輸函數以其時間反轉項的卷積可表示為:

即,傳輸函數hi(k)與其時間反轉項hi(-k)進行卷積后得到把各反射分量的能量聚焦在起點時刻的多徑聚焦項以及多徑能量偏移到各個不同時刻的多徑偏移項;進一步將各個陣元信號進行時間反轉后疊加,則:

從上式可看出,多陣元進行時反處理后,各陣元多徑能量均被從空間、時間域聚焦到傳輸函數中的同一時延處因而實現聚焦增強,而各陣元的多徑偏移項在疊加后被隨機化,可近似視為消失。

同時,各通道噪聲分量時間反轉后疊加形成等效噪聲影響項:

因此,對多陣元接收信號進行時反處理后獲得的是反射聲分量的空間、時間聚焦項和等效噪聲影響項mn(k),如下式所示:

即,實現了利用麥克風陣列各陣元中的反射分量進行聚焦增強。如圖5本發(fā)明實施例5元麥克風圓陣各陣元信號聚焦增強后與對準聲源方向主波束間的傳輸函數,從圖5可以看出,經過多陣元的聚焦增強后,各陣元反射分量實現了聚焦,與主波束的傳輸函數近似理想沖激函數,信號通過反射能量的聚焦得到明顯增強。

考慮到本發(fā)明針對的遠場語音場景,此時主波束語音信號信噪比低,因此在通過多通道聚焦處理增強后,本發(fā)明進一步采用自適應增強處理改善信噪比,具體自適應合并增強過程描述如下:

利用已知主波束信號xθ(k)作為訓練信號,多通道反射聚焦信號xmf(k)作為輸入信號,則適應增強的目的是構造一個l階的增強波器系數w=[w1w2w3w4……wl],通過自適應算法(本實施例中l(wèi)=100,采用本領域通用的最小均方誤差lms自適應算法)以已知訓練信號xθ(k)作為目標信號進行系數w的自適應迭代學習,迭代學習的目的是使誤差ek的均方最?。?/p>

wk+1=wk+μ·ek·rk(1)

k=1,2,...n

ek=xθ(k)-xout(k)(2)

rk=xmf(k,k+1,...,k+l-1)(3)

其中u為自適應迭代的步長因子,算法收斂后的輸出xout(k)為系統(tǒng)的最后增強語音輸出。

本實施例中波束形成、傳輸函數估計、多通道聚焦、合并增強步驟均以軟件編程的方式在處理器arm9s3c2440中進行。

本發(fā)明公開的麥克風陣列遠場語音增強置最大的特點在于,考慮遠場語音的低信噪比和強烈反射,采用多通道反射聚焦處理對各麥克風陣元的反射聲信號進行聚焦增強,相對于常規(guī)的麥克風陣列語音增強算法對反射聲信號進行抑制處理,本發(fā)明公開的技術方案有利于充分利用反射聲能量提高遠場語音信噪比;在此基礎上,進一步采用自適應增強對主波束信號和多陣元聚焦信號進行自適應迭代增強,進一步改善遠場語音增強效果。

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1