l(t)的短時傅里葉變換為PJt,f),則各方向上的瞬時 復聲強可以表示為:
[0043]PQ(t, f)表示PQ(t, f)的希爾伯特變換,由于振速和聲壓的相位相差90°,采用希 爾伯特變換以消除相位差,符號*表示共軛運算。然后利用式(2)計算出時頻點的瞬時方 位值,并利用下式進行局部標準差估計,
[0045]其中Q表示滑動窗,N表示滑動窗的大小,y(t,f)表示方位估計的局部均值,由 下式求得:
[0047] 接下來根據(jù)時頻點的局部標準差進行掩蔽和重排。圖3(a)表示第一次門限判斷 以后時頻點分布情況,其中灰色部分表示局部標準差oJkfi) > a的時頻點,E(t,f)表 示時頻點信息,包括這些時頻點的瞬時方位估計值、各方向上的聲強分量等,圖3(b)給出 了一種經(jīng)過第一次門限判斷保留的時頻點進行時頻重排后的表現(xiàn)圖。由于時頻重排前后滿 足能量守恒定律,因此這樣的時頻重排方法有很多,圖3(b)、3(c)只是給出了較為簡單的 時頻重排方式,可根據(jù)實際情況自主進行重排。而圖中的灰色部分表示第二次門限判斷局 部標準差〇 20〇 > 0的時頻點。根據(jù)第二次門限判斷的結(jié)果,將保留的時頻點信息,任意 的(不用考慮時頻點排序問題,因為本次排布不影響最后定位精度)放置在一個新的向量 中,如圖3(d)給出了隨機的一種排布。最后,將這些時頻點各方向上聲強分量按照式(3) 得到最終的方位估計值。
[0048] 下面結(jié)合一些具體實施例以及對比例對本發(fā)明做進一步說明。
[0049] 實施例
[0050] 本發(fā)明方法對瞬時方位估計異常時頻點的掩蔽效果。
[0051] 對瞬時方位估計異常時頻點的掩蔽是本發(fā)明的關(guān)鍵技術(shù)。為此,舉例說明對異常 點的掩蔽效果??紤]混響時間為200ms,信噪比為20dB時,真實方位角為120°,門限值設(shè) 為50°。圖4(a)為瞬時方位估計偏差大于30°的時頻點(異常的時頻點)的分布情況, 異常時頻點的總數(shù)共為7167個,占總時頻點的比例高達11. 29%。經(jīng)過第一次門限判斷并 進行時頻掩蔽后,此時異常時頻點的分布如圖4(b)所示,其異常時頻點的總數(shù)下降為2145 個,占總時頻點的比例為3. 38%。而采用本發(fā)明方法的兩次門限判斷并進行時頻掩蔽后,對 應的異常時頻點的分布如圖4(c)所示,其異常時頻點的總數(shù)進一步減少為102個,其占總 時頻點的比例僅為0. 16%。通過以上仿真分析表明,本發(fā)明方法對異常時頻點具有良好的 抑制作用,有效提高了聲源方位估計的精度。
[0052] 對比例1
[0053] 高混響下復聲強法、直方圖法與本發(fā)明方法的仿真比較。
[0054] 令D = 2. 5cm,陣列中心到聲源距離為2m,聲音在空氣的速度為340m/s。選擇房 間參數(shù)為7X6X4m,陣列中心置于(3. 5, 2. 8, l)m?;祉憰r間為500ms,信噪比分別20dB、 10dB。a為最大局部標準差的35%,0為最大局部標準差的30%??紤]方位角從-180° 到180°,且以10°為間隔,進行100次蒙特卡洛實驗。對這100次結(jié)果求取均值和方差, 利用均方根誤差作為評價指標。
[0055] 圖5(a)表示信噪比為20dB時三種方法各個方位角的均方根誤差,其中對于平均 均方根誤差,復聲強法為4.86°,直方圖法為5.42°,本發(fā)明方法為3.79°。而最大均方 根誤差,復聲強法達到15. 11°,直方圖法為9.39°,本發(fā)明方法為8.09°。圖5(b)為信 噪比為10dB時三種方法各個方位角的均方根誤差,其中對于平均均方根誤差,復聲強法 為5.11°,直方圖法為13. 13°,本發(fā)明方法為4.23°。而最大均方根誤差,復聲強法為 15. 22°,直方圖法為26.42°,本發(fā)明方法為8.7°。從仿真結(jié)果來看,直方圖法在高混響 低信噪比環(huán)境下基本失效,在高混響高信噪比環(huán)境下雖然可以定向,但是定向精度還有待 提高。此外,直方圖法通過搜索峰值帶來的高計算復雜度也是一大問題。而復聲強法和本 發(fā)明方法對噪聲具有一定的魯棒性,實時性也比較高。但是,復聲強法雖整體上要優(yōu)于直方 圖法,但是精度也不是很高,甚至在某些角度也失去了定向性能。因此本發(fā)明方法整體上要 優(yōu)于以上兩種方法。
[0056] 對比例2
[0057]實際環(huán)境下復聲強法、直方圖法與本發(fā)明方法的比較。
[0058] 將整套系統(tǒng)放置在房間參數(shù)為6. 69X7. 79X2. 68m的會議室進行實測。陣列置于 房間中心附近,聲源和陣列放置在不同高度。利用采集卡對四路麥克風信號同時進行數(shù)據(jù) 采集,然后利用電腦對導入的數(shù)據(jù)進行處理。考慮方位角由-180°到180°以30°間隔遞 增,每個角度再進行10次實驗。其中,圖6(a)表示三種方法各個方位角的平均絕對誤差, 圖6(b)表示三種方法各個方位角的最大絕對誤差。由實測結(jié)果可以看出,本發(fā)明方法整體 上誤差都要小于復聲強法和直方圖法,精度較高,且具有一定的魯棒性。
[0059] 以上所述僅是本發(fā)明的優(yōu)選實施方式,應當指出:對于本技術(shù)領(lǐng)域的普通技術(shù)人 員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應 視為本發(fā)明的保護范圍。
【主權(quán)項】
1. 一種適用于微型麥克風陣列的聲強估計聲源定向方法,其特征在于:包括如下步 驟: 步驟1,借助語音信號的稀疏特性對各時頻點構(gòu)造方位估計時頻圖,利用滑動窗對選定 的時頻塊對應的瞬時方位估計值進行局部標準差估計; 步驟2,根據(jù)設(shè)定的局部標準差門限參數(shù)值對時頻點進行二值掩蔽處理; 步驟3,對過濾出的時頻點進行重新排布,并再次進行局部標準差估計和門限判斷; 步驟4,將滿足條件的時頻點對應的各方向上的瞬時聲強進行求和平均,得出方位角估 計值。2. 如權(quán)利要求1所述的適用于微型麥克風陣列的聲強估計聲源定向方法,其特征在 于:所述步驟1的具體步驟為:對每個時頻點各方向上的聲強估計值進行求和平均,并取實 部,即可得到方位角初步估計值:上式中,Im (t,f)、Itjy (t,f)分別表示各時頻點在X軸和y軸方向上聲強分量,Re表示 取實部; 利用下式對每個時頻點進行瞬時方位估計,在利用復聲強法得到初步估計結(jié)果后對方位估計值在180°附近的時頻點進行修正, 如果I I Φ I I > L,(135° < L < 150° ),那么對每個時頻點對應的小于0°的方位角進行 360°補償,即(Ht,f) - (Ht,f)+360°,然后對修正之后的瞬時方位估計值一(?,/)計算 局部標準差。3. 如權(quán)利要求1所述的適用于微型麥克風陣列的聲強估計聲源定向方法,其特征在 于:所述步驟2中,如果〇 Jbfi) > α,那么將所有符合條件的時頻點信息都置為0,即 Φ (ti,fi) = 0, IoxUi, fi) = 0, IoyUi, fi) = 0〇4. 如權(quán)利要求1所述的適用于微型麥克風陣列的聲強估計聲源定向方法,其特征在 于:所述步驟3中的時頻點重新排布,是將過濾出的時頻點對應的方位角、各方向聲強分量 信息分別載入一個新向量中。5. 如權(quán)利要求4所述的適用于微型麥克風陣列的聲強估計聲源定向方法,其特征在 于:所述步驟3中,將滿足〇1(tk,fk) < α條件的二維時頻圖中的時頻點信息分別載入到 一維向量中,即 Φ' (k) = Φ (tk,fk),I ' 。x(k) = Iox(tk,fk),I' 。y(k) = Ioy(tk,fk)。6. 如權(quán)利要求4所述的適用于微型麥克風陣列的聲強估計聲源定向方法,其特征在 于:所述步驟3中,計算出對應點的局部標準差〇2(k),如果O2GO彡β,就按照步驟2的 方法將不滿足條件的時頻點信息置0,其他時頻點信息保留,即Φ"?) = Φ' 0〇,1" M(j) =I'。χ0〇,I" oy(j) = I'。y(ki)。
【專利摘要】本發(fā)明公開了一種適用于微型麥克風陣列的聲強估計聲源定向方法,首先,借助語音信號的稀疏特性對各時頻點構(gòu)造方位估計時頻圖,利用滑動窗對選定的時頻塊對應的瞬時方位估計值進行局部標準差估計;然后,根據(jù)設(shè)定的局部標準差門限參數(shù)值對時頻點進行二值掩蔽處理;再次,對過濾出的時頻點進行重新排布,并進行第二次局部標準差估計和門限判斷;最后,將滿足條件的時頻點對應的各方向上的瞬時聲強進行求和平均,得出方位角估計值。相比現(xiàn)有技術(shù),本發(fā)明對混響和噪聲具有更高的魯棒性,方位角估計精度也較高。
【IPC分類】G01S3/802
【公開號】CN104898086
【申請?zhí)枴緾N201510256448
【發(fā)明人】何賽娟, 陳華偉, 丁少為
【申請人】南京航空航天大學
【公開日】2015年9月9日
【申請日】2015年5月19日