一種基于時(shí)頻掩膜的單聲學(xué)矢量傳感器目標(biāo)語音增強(qiáng)方法
【專利摘要】本發(fā)明涉及一種基于時(shí)頻掩膜的單聲學(xué)矢量傳感器(Acoustic?Vector?Sensor,AVS)目標(biāo)語音增強(qiáng)方法。所述方法已知目標(biāo)語音的到達(dá)角,采用聯(lián)合固定波束形成器與后置維納濾波器方法實(shí)現(xiàn)目標(biāo)語音增強(qiáng),后置維納濾波器權(quán)值的計(jì)算涉及目標(biāo)語音的自功率譜估計(jì),本發(fā)明利用語音信號(hào)的時(shí)頻稀疏特性,通過計(jì)算AVS中2個(gè)梯度傳感器輸出分量信號(hào)間的數(shù)據(jù)比(Inter-sensor?data?ratio,ISDR)來估算接收音頻信號(hào)時(shí)頻點(diǎn)關(guān)聯(lián)到達(dá)角,通過計(jì)算時(shí)頻點(diǎn)關(guān)聯(lián)到達(dá)角與目標(biāo)達(dá)到角之間的誤差來設(shè)計(jì)時(shí)頻掩膜,以此獲得目標(biāo)語音的自功率譜估計(jì)。本發(fā)明所述方法不需要任何噪聲先驗(yàn)知識(shí),在多說話人存在的復(fù)雜環(huán)境中,能夠有效地增強(qiáng)目標(biāo)語音,抑制干擾語音及背景噪聲。此外該方法運(yùn)算復(fù)雜度低,采用的麥克風(fēng)陣列體積小(僅有1cm3左右),非常適用于便攜設(shè)備上的應(yīng)用。
【專利說明】一種基于時(shí)頻掩膜的單聲學(xué)矢量傳感器目標(biāo)語音增強(qiáng)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于時(shí)頻掩膜的單聲學(xué)矢量傳感器目標(biāo)語音增強(qiáng)方法,屬于語音 信號(hào)處理【技術(shù)領(lǐng)域】。
【背景技術(shù)】
[0002] 語音增強(qiáng)是語音處理領(lǐng)域的核心技術(shù)之一。在實(shí)際復(fù)雜環(huán)境中,麥克風(fēng)在拾取語 音信號(hào)時(shí),不可避免地會(huì)受到來自周圍環(huán)境噪聲、傳輸媒介噪聲、通信設(shè)備內(nèi)部電噪聲、房 間混響以及其它說話人的話音干擾,因此拾取語音的質(zhì)量受到影響。為了減少噪聲對(duì)語音 的影響,獲得高質(zhì)量的語音,對(duì)語音增強(qiáng)技術(shù)提出了要求。傳統(tǒng)的單通道語音增強(qiáng)方法通常 實(shí)現(xiàn)簡單,對(duì)非相干噪聲效果明顯,但對(duì)于嘈雜人聲環(huán)境(多個(gè)說話人存在)場景,難以增 強(qiáng)目標(biāo)語音;基于麥克風(fēng)陣列的語音增強(qiáng)技術(shù)則利用了信號(hào)的空時(shí)譜信息,有較強(qiáng)的空間 干擾噪聲抑制能力,可獲得比單通道語音增強(qiáng)更好的性能,但語音增強(qiáng)性能隨著麥克風(fēng)數(shù) 目的增加而提高,因此麥克風(fēng)陣列的體積較大,限制了該類技術(shù)在小型移動(dòng)設(shè)備上的應(yīng)用。
[0003] 本發(fā)明采用了 一種新型麥克風(fēng)陣列-聲學(xué)矢量傳感器(Acoustic Vector Sensor,AVS)作為音頻信號(hào)采集器。與常用的聲壓麥克風(fēng)相比,AVS在結(jié)構(gòu)上具有其特殊 性:一顆AVS由2到3個(gè)正交放置的壓力梯度傳感器和1個(gè)全向壓力傳感器構(gòu)成,它的空間 結(jié)構(gòu)緊湊,僅僅有l(wèi)cm3左右大小,所以在研究中被認(rèn)為是同位陣列。各個(gè)傳感器接收到的 音頻信號(hào)在時(shí)間上可認(rèn)為是對(duì)齊的。對(duì)于理想的AVS,各通道接收信號(hào)存在三角函數(shù)關(guān)系, 因此,僅單顆AVS就能夠?qū)崿F(xiàn)單個(gè)或者多個(gè)的空間聲源到達(dá)方向的估計(jì)。隨著移動(dòng)終端技 術(shù)和語音技術(shù)的發(fā)展和應(yīng)用需求,AVS小體積的特殊優(yōu)點(diǎn),有可能成為手機(jī)、錄音筆和相機(jī) 等小尺寸便攜設(shè)備音頻傳感和噪聲抑制的有效解決方案。
[0004] 本發(fā)明利用AVS中2個(gè)正交同位放置的壓力梯度傳感器采集音頻信號(hào),在二維場 景下,其梯度傳感器輸出的信號(hào)模型可表示為:
【權(quán)利要求】
1. 一種基于時(shí)頻掩膜的單聲學(xué)矢量傳感器目標(biāo)語音增強(qiáng)方法,包括如下步驟: (a) 對(duì)聲學(xué)矢量傳感器中兩個(gè)壓力梯度傳感器的輸出數(shù)據(jù)分別加窗分巾貞,進(jìn)行短時(shí)傅 里葉變換,得到兩通道的時(shí)頻譜數(shù)據(jù); (b) 對(duì)(a)所得兩通道數(shù)據(jù)計(jì)算ISDR值,對(duì)ISDR值求反三角函數(shù)得到到達(dá)角估計(jì),與 目標(biāo)語音到達(dá)角比較求得時(shí)頻掩膜; (c) 根據(jù)目標(biāo)語音到達(dá)角計(jì)算固定波束形成器權(quán)向量,對(duì)(a)所得兩通道數(shù)據(jù)進(jìn)行固 定波束形成,輸出時(shí)頻譜記為Ym ; (d) 用(b)所得的時(shí)頻掩膜對(duì)(c)固定波束形成器的輸出進(jìn)行時(shí)頻掩膜濾波,輸出記為 Ys; (e) 通過(c)和(d)所得的數(shù)據(jù)計(jì)算后置維納濾波器的權(quán)值,并對(duì)(c)固定波束形成器 的輸出進(jìn)行維納濾波; (f) 對(duì)(e)所得的后置維納濾波器輸出數(shù)據(jù)進(jìn)行傅里葉反變換,用疊接相加法重建增 強(qiáng)后的目標(biāo)語音時(shí)域信號(hào)。
2. 根據(jù)權(quán)利要求1所述的一種基于時(shí)頻掩膜的單聲學(xué)矢量傳感器目標(biāo)語音增強(qiáng)方法, 其特征在于,該方法使用聲學(xué)矢量傳感器作為聲音信號(hào)接收器,它包含兩個(gè)正交同位放置 的壓力梯度傳感器;傳感器的同位放置可保證整體結(jié)構(gòu)緊湊、尺寸小。
3. 根據(jù)權(quán)利要求1所述的一種基于時(shí)頻掩膜的單聲學(xué)矢量傳感器目標(biāo)語音增強(qiáng)方法, 其特征在于,所述步驟(b)的具體實(shí)現(xiàn)方法為: 對(duì)兩梯度傳感器接收信號(hào)的短時(shí)傅里葉變換的幅度譜在每個(gè)時(shí)頻點(diǎn)計(jì)算數(shù)據(jù)比值 (即ISDR值),對(duì)該比值求反三角函數(shù)求得該時(shí)頻點(diǎn)信號(hào)譜所表征的信號(hào)分量的到達(dá)角估 計(jì),求該到達(dá)角與目標(biāo)語音到達(dá)角的差值Λ φ,可設(shè)定一個(gè)允許角度范圍δ (可取一大于〇 小于90的數(shù),本發(fā)明取25),當(dāng)| Λ φ| < δ時(shí),判定該時(shí)頻點(diǎn)的信號(hào)譜來自目標(biāo)語音源, 該時(shí)頻點(diǎn)掩膜系數(shù)設(shè)置為1,否則掩膜系數(shù)設(shè)置為Ρ (可取一大于〇小于1的數(shù),本發(fā)明取 0· 07)。
4. 根據(jù)權(quán)利要求1所述的一種基于時(shí)頻掩膜的單聲學(xué)矢量傳感器目標(biāo)語音增強(qiáng)方法, 其特征在于,所述步驟(c)中固定波束形成器采用空間匹配濾波器。
5. 根據(jù)權(quán)利要求1所述的一種基于時(shí)頻掩膜的單聲學(xué)矢量傳感器目標(biāo)語音增強(qiáng)方法, 其特征在于,所述步驟(e)的具體實(shí)現(xiàn)方法為: 令(c)固定波束形成器的輸出¥_"為后置維納濾波器的輸入,計(jì)算(d)掩膜后的輸出與 (c)固定波束形成器的輸出之間的互功率譜作為后置維納濾波器權(quán)值計(jì)算公式的分子,計(jì) 算(c)固定波束形成器輸出數(shù)據(jù)的自功率譜作為后置維納濾波器權(quán)值計(jì)算公式的分母,兩 者的比值為后置維納濾波器的最佳權(quán)值估計(jì)。用該后置維納濾波器權(quán)值對(duì)(c)固定波束形 成器的輸出進(jìn)行濾波,得到增強(qiáng)的目標(biāo)語音時(shí)頻譜。
6. 根據(jù)權(quán)利要求5所述的一種基于時(shí)頻掩膜的單聲學(xué)矢量傳感器目標(biāo)語音增強(qiáng)方法, 其特征在于,所述步驟(e)的具體實(shí)現(xiàn)方法中,后置維納濾波器分子和分母的計(jì)算皆采用 多幀求平均的方法(本發(fā)明取2幀)。
【文檔編號(hào)】G10L21/02GK104103277SQ201310133745
【公開日】2014年10月15日 申請(qǐng)日期:2013年4月15日 優(yōu)先權(quán)日:2013年4月15日
【發(fā)明者】鄒月嫻, 王鵬, 石偉 申請(qǐng)人:北京大學(xué)深圳研究生院