適用于微型麥克風(fēng)陣列的聲強(qiáng)估計(jì)聲源定向方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及小尺寸陣列,尤其是直徑小于4cm的陣列下的聲強(qiáng)估計(jì)聲源定向方 法,可用于視頻會(huì)議系統(tǒng)、機(jī)器人聽覺、助聽器、人機(jī)語音交互系統(tǒng)、以及音頻監(jiān)控等諸多領(lǐng) 域。
【背景技術(shù)】
[0002] 在很多實(shí)際應(yīng)用中,由于受到安裝平臺(tái)限制或系統(tǒng)設(shè)計(jì)要求,往往只能采用小 尺寸麥克風(fēng)陣列。而在小尺寸陣列孔徑條件下,傳統(tǒng)的聲源定向方法如時(shí)延估計(jì)法、可 控功率波束形成法等已經(jīng)無法滿足實(shí)際定向精度的要求?;诓罘炙枷氲穆晱?qiáng)估計(jì) 聲源定向方法為小尺寸陣列條件下的高精度聲源定向提供了一個(gè)重要技術(shù)途徑。目 前,基本的聲強(qiáng)估計(jì)聲源定向方法有復(fù)聲強(qiáng)法(見文獻(xiàn)[l]GUnel B,Hacihabiboglu H,Kondoz A M. Acoustic Source Separation of Convolutive Mixtures Based on Intensity Vector Statistics[J]. IEEE Transactions on Audio,Speech, and Language Processing,2008, 16(4) :748-756;文獻(xiàn)[2]陳華偉,趙俊渭.基于矢量傳感器復(fù)聲強(qiáng) 測(cè)量的低空目標(biāo)二維波達(dá)方向估計(jì)[J].聲學(xué)學(xué)報(bào):中文版,2004,(3) :277-282.)和直 方圖法(見文獻(xiàn)[3] Zhong,X.,Chen, X.,Wang, W.,Mlinaghi,Acoustic vector sensor based reverberant speech separation with probabilistic time-frequency masking. European Signal Processing Conference. IEEE, 2013:1-5 ;文獻(xiàn)[4]惠俊英,惠娟?矢量 聲信號(hào)處理基礎(chǔ)[M].國防工業(yè)出版社,2009)。對(duì)于復(fù)聲強(qiáng)法,其雖然對(duì)空間不相關(guān)噪聲 具有很強(qiáng)的抑制能力,但對(duì)混響較為敏感,隨著混響的增大其性能急劇下降。而對(duì)于直方圖 法,信噪比較低時(shí),其性能較差,并且該方法須通過搜索峰值來確定方位角,實(shí)時(shí)性較差。因 此,為了克服以上方法的缺陷,本發(fā)明提出了一種同時(shí)對(duì)噪聲和混響具有魯棒性的聲源定 向方法,并且所提出的方法具有閉式解,無需峰值搜索,便于實(shí)時(shí)實(shí)現(xiàn)。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明的目的是針對(duì)上述【背景技術(shù)】中的不足,提供一種適用于微型麥克風(fēng)陣列的 聲強(qiáng)估計(jì)聲源定向方法,同時(shí)對(duì)噪聲和混響具有魯棒性,并且具有閉式解,無需峰值搜索, 便于實(shí)時(shí)實(shí)現(xiàn)。
[0004] 為實(shí)現(xiàn)上述目的,本發(fā)明采用以下技術(shù)方案:
[0005] -種適用于微型麥克風(fēng)陣列的聲強(qiáng)估計(jì)聲源定向方法,包括如下步驟:
[0006]步驟1,借助語音信號(hào)的稀疏特性對(duì)各時(shí)頻點(diǎn)構(gòu)造方位估計(jì)時(shí)頻圖,利用滑動(dòng)窗對(duì) 選定的時(shí)頻塊對(duì)應(yīng)的瞬時(shí)方位估計(jì)值進(jìn)行局部標(biāo)準(zhǔn)差估計(jì);
[0007] 步驟2,根據(jù)設(shè)定的局部標(biāo)準(zhǔn)差門限參數(shù)值對(duì)時(shí)頻點(diǎn)進(jìn)行二值掩蔽處理;
[0008] 步驟3,對(duì)過濾出的時(shí)頻點(diǎn)進(jìn)行重新排布,并再次進(jìn)行局部標(biāo)準(zhǔn)差估計(jì)和門限判 斷;
[0009] 步驟4,將滿足條件的時(shí)頻點(diǎn)對(duì)應(yīng)的各方向上的瞬時(shí)聲強(qiáng)進(jìn)行求和平均,得出方位 角估計(jì)值。
[0010] 所述步驟1的具體步驟為:對(duì)每個(gè)時(shí)頻點(diǎn)各方向上的聲強(qiáng)估計(jì)值進(jìn)行求和平均, 并取實(shí)部,即可得到方位角估計(jì)值:
[0012] 上式中,IM(t, f)、Ijt,f)分別表示各時(shí)頻點(diǎn)在x軸和y軸方向上聲強(qiáng)分量,Re 表示取實(shí)部;
[0013] 為了更加清楚的了解每個(gè)時(shí)頻點(diǎn)對(duì)方位估計(jì)的貢獻(xiàn),利用下式對(duì)每個(gè)時(shí)頻點(diǎn)進(jìn)行 瞬時(shí)方位估計(jì),
[0015]因?yàn)槭菆A形陣列,考慮到方位估計(jì)的范圍為[-180°,180° ),-180°又與180° 重合,為了防止180°附近定向產(chǎn)生偏差,在利用復(fù)聲強(qiáng)法得到初步估計(jì)結(jié)果后對(duì)方位估計(jì) 值在180°附近的時(shí)頻點(diǎn)進(jìn)行修正,如果||巾|| >L,(r3ci< ° ],那么對(duì)每個(gè)時(shí)頻點(diǎn) 對(duì)應(yīng)的小于0°的方位角進(jìn)行360°補(bǔ)償,即(i>(t,f) - (i>(t,f)+360°。然后對(duì)修正之后 的瞬時(shí)方位估計(jì)值.4^,/:)計(jì)算局部標(biāo)準(zhǔn)差。
[0016] 所述步驟2中,如果0 Jti,fi) > a,那么將所有符合條件的時(shí)頻點(diǎn)信息都置為0, 即=0,1。7(1^,;^) =0。這樣做的目的是為了初步篩選出那些局 部標(biāo)準(zhǔn)差較大且定向精度不高的時(shí)頻點(diǎn)。
[0017] 所述步驟3中的時(shí)頻點(diǎn)重新排布,是將過濾出的時(shí)頻點(diǎn)對(duì)應(yīng)的方位角、各方向聲 強(qiáng)分量信息分別載入一個(gè)新向量中。
[0018] 所述步驟3中,將滿足〇1(tk,fk)彡a條件的二維時(shí)頻圖中的時(shí)頻點(diǎn)信息分別載 入到一維向量中,即傘'(k) = <Htk,fk),I ' 。x(k) = Iox(tk,fk),I' 。y(k) = Ioy(tk,fk), 這樣做的目的,可以有效的分散開原先局部標(biāo)準(zhǔn)差較小,但是定向精度很差的區(qū)域中的時(shí) 頻點(diǎn),然后計(jì)算出對(duì)應(yīng)時(shí)頻點(diǎn)的局部標(biāo)準(zhǔn)差。 2(k)。如果〇2〇〇彡0,就按照步驟2的方 法將不滿足條件的時(shí)頻點(diǎn)信息置0,其他時(shí)頻點(diǎn)信息保留,巾"(j) = 4>' 0〇,1" M(j) =r 0!£(^),i"oy(j) = r oy(ki)〇
[0019] 所述步驟4中,將步驟3中最終保留的數(shù)據(jù)按照下式即可得出方位角估計(jì)值:
[0021] 本發(fā)明的有益效果為:相比現(xiàn)有技術(shù),本發(fā)明對(duì)混響和噪聲具有更高的魯棒性,方 位估計(jì)精度也較高,具體為:
[0022] (1)由于對(duì)時(shí)頻點(diǎn)進(jìn)行局部標(biāo)準(zhǔn)差估計(jì)時(shí),往往會(huì)出現(xiàn)局部標(biāo)準(zhǔn)差較小但方位估 計(jì)值也不完全精確的情況,如果按照局部標(biāo)準(zhǔn)差進(jìn)行加權(quán),必定會(huì)造成這些方位估計(jì)誤差 較大的時(shí)頻點(diǎn)占據(jù)更大的權(quán)重,從而導(dǎo)致最后估計(jì)結(jié)果偏離真實(shí)值。為此,本發(fā)明巧妙利用 二次門限時(shí)頻重排的方式,有效克服了局部標(biāo)準(zhǔn)差較小而方位估計(jì)值不準(zhǔn)的異常情況。
[0023] (2)本發(fā)明克服了直方圖法的缺陷,一方面在信噪比降低時(shí)也能保持很高的定向 精度,另一方面避免了峰值搜索過程,實(shí)時(shí)性較高。
[0024] (3)相比現(xiàn)有的方法,本發(fā)明適用于小尺寸麥克風(fēng)陣列,且具有較高的抗混響能力 和空間噪聲抑制能力,在混響噪聲環(huán)境下的方位估計(jì)精度高。
【附圖說明】
[0025] 圖1為陣列結(jié)構(gòu)和坐標(biāo)定義示意圖;
[0026] 圖2為本發(fā)明方法原理流程圖;
[0027] 圖3為時(shí)頻重排前后部分時(shí)頻信息分布圖,其中,(a)第一次門限判斷后部分時(shí)頻 信息分布,(b)時(shí)頻重排方式1,(c)時(shí)頻重排方式2,(d)第二次門限判斷后部分時(shí)頻信息 的一種分布方式;
[0028] 圖4為實(shí)施例1的仿真結(jié)果圖,其中,(a)局部標(biāo)準(zhǔn)差小于30°但方位估計(jì)值大于 30°的時(shí)頻分布,(b)第一次門限判斷后,局部標(biāo)準(zhǔn)差小于30°但方位估計(jì)大于30°的時(shí) 頻分布,(c)第二次門限判斷后,局部標(biāo)準(zhǔn)差小于30°但方位估計(jì)大于30°的時(shí)頻分布;
[0029] 圖5為對(duì)比例1的仿真結(jié)果圖,其中,(a)信噪比20dB時(shí)復(fù)聲強(qiáng)法、直方圖法和本 發(fā)明方法的均方根誤差對(duì)比圖,(b)信噪比10dB時(shí)復(fù)聲強(qiáng)法、直方圖法和本發(fā)明方法的均 方根誤差對(duì)比圖;
[0030] 圖6為對(duì)比例2的實(shí)測(cè)結(jié)果圖,其中,(a)復(fù)聲強(qiáng)法、直方圖法和本發(fā)明方法平均 絕對(duì)誤差對(duì)比圖,(b)復(fù)聲強(qiáng)法、直方圖法和本發(fā)明方法最大絕對(duì)誤差對(duì)比圖。
【具體實(shí)施方式】
[0031] 本發(fā)明中所指的微型麥克風(fēng)陣列是指尺寸較小的陣列,一般是指直徑小于4cm的 陣列(即下文所述的D〈4cm),本發(fā)明實(shí)施例和對(duì)比例中都選用2. 5cm。
[0032] 下面結(jié)合附圖對(duì)發(fā)明的技術(shù)方案進(jìn)行詳細(xì)說明。
[0033] 本發(fā)明方法是在如圖1所示的麥克風(fēng)陣列的基礎(chǔ)上,按照?qǐng)D2所示的原理流程圖 進(jìn)行研宄的。四個(gè)全向麥克風(fēng)等間隔的分布在直徑為D的圓周上,那么原點(diǎn)處聲壓由四個(gè) 麥克風(fēng)接收到的信號(hào)的平均值近似求得:
[0035]其中,Pl (t)、p2(t)、p3(t)、p4⑴分別表示麥克風(fēng)Mi、M2、M3、M 4接收到的信號(hào),原點(diǎn) 處振速的兩個(gè)正交分量為:
[0037]式中,P為媒質(zhì)密度。考慮到語音信號(hào)具有短時(shí)平穩(wěn)的特性,因此我們采用時(shí)頻處 理方法。對(duì)接收到的信號(hào)分別進(jìn)行短時(shí)傅里葉變換,得到原點(diǎn)處振速的兩個(gè)正交分量為:
[0040]其中,
Pi(t,f)、P2(t,f)、P3(t,f)、P 4(t,f)分別為四個(gè)麥克風(fēng)接收信號(hào)的 短時(shí)傅里葉變換。原點(diǎn)處聲壓信號(hào)P(