亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于遠(yuǎn)場語音識(shí)別的預(yù)處理方法和裝置的制造方法

文檔序號(hào):9598811閱讀:797來源:國知局
用于遠(yuǎn)場語音識(shí)別的預(yù)處理方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語音識(shí)別技術(shù)領(lǐng)域,尤其涉及一種用于遠(yuǎn)場語音識(shí)別的預(yù)處理方法和 裝置。
【背景技術(shù)】
[0002] 為了提高語音識(shí)別的準(zhǔn)確度,在語音識(shí)別之前通常會(huì)進(jìn)行預(yù)處理。在遠(yuǎn)場語音識(shí) 別場景下,目前采用比較多的一種預(yù)處理方案是回聲消除(Acoustic echo cancellation, AEC) +聲源定位+自適應(yīng)波束形成技術(shù)。大致的思想是:先對(duì)每個(gè)麥克風(fēng)采集的語音信號(hào) 進(jìn)行回聲消除、再基于聲源定位技術(shù)找到目標(biāo)說話人的空間方位,進(jìn)而通過自適應(yīng)波束形 成(Adaptive Beamforming,ABF)技術(shù)將主波束指向說話人,實(shí)現(xiàn)聲音增強(qiáng)的效果。
[0003] 但是,上述處理方案在運(yùn)算量、準(zhǔn)確度、收斂速度和殘差等方面都存在一定的問 題,進(jìn)而影響最終的遠(yuǎn)場語音識(shí)別性能。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
[0005] 為此,本發(fā)明的一個(gè)目的在于提出一種用于遠(yuǎn)場語音識(shí)別的預(yù)處理方法,該方法 可以實(shí)現(xiàn)了信號(hào)的聲源定位和語音增強(qiáng)功能,并且新的波束形成方法還保證了陣列的空間 響應(yīng)與頻率無關(guān),從而降低信號(hào)的頻譜失真程度,保證了后續(xù)音頻通訊,尤其是語音識(shí)別系 統(tǒng)的性能。
[0006] 本發(fā)明的另一個(gè)目的在于提出一種用于遠(yuǎn)場語音識(shí)別的預(yù)處理裝置。
[0007] 為達(dá)到上述目的,本發(fā)明第一方面實(shí)施例提出的用于遠(yuǎn)場語音識(shí)別的預(yù)處理方 法,包括:獲取由麥克風(fēng)陣列采集的多路語音信號(hào);根據(jù)預(yù)設(shè)的頻率點(diǎn)閾值,將所述多路語 音信號(hào)分為低頻分量和中高頻分量;對(duì)低頻分量進(jìn)行延遲求和波束形成,以及,對(duì)中高頻分 量進(jìn)行基于濾波器的波束形成。
[0008] 本發(fā)明第一方面實(shí)施例提出的用于遠(yuǎn)場語音識(shí)別的預(yù)處理方法,通過上述是波束 形成方法,同時(shí)實(shí)現(xiàn)了信號(hào)的聲源定位和語音增強(qiáng)功能,并且上述的波束形成方法還保證 了陣列的空間響應(yīng)與頻率無關(guān),從而降低信號(hào)的頻譜失真程度,保證了后續(xù)音頻通訊,尤其 是語音識(shí)別系統(tǒng)的性能。
[0009] 為達(dá)到上述目的,本發(fā)明第二方面實(shí)施例提出的用于遠(yuǎn)場語音識(shí)別的預(yù)處理裝 置,包括:獲取模塊,用于獲取由麥克風(fēng)陣列采集的多路語音信號(hào);劃分模塊,用于根據(jù)預(yù) 設(shè)的頻率點(diǎn)閾值,將所述多路語音信號(hào)分為低頻分量和中高頻分量;波束形成模塊,用于對(duì) 低頻分量進(jìn)行延遲求和波束形成,以及,對(duì)中高頻分量進(jìn)行基于濾波器的波束形成。
[0010] 本發(fā)明第二方面實(shí)施例提出的用于遠(yuǎn)場語音識(shí)別的預(yù)處理裝置,通過上述是波束 形成方法,同時(shí)實(shí)現(xiàn)了信號(hào)的聲源定位和語音增強(qiáng)功能,并且上述的波束形成方法還保證 了陣列的空間響應(yīng)與頻率無關(guān),從而降低信號(hào)的頻譜失真程度,保證了后續(xù)音頻通訊,尤其 是語音識(shí)別系統(tǒng)的性能。
[0011] 本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發(fā)明的實(shí)踐了解到。
【附圖說明】
[0012] 本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變 得明顯和容易理解,其中:
[0013] 圖1是本發(fā)明一實(shí)施例提出的用于遠(yuǎn)場語音識(shí)別的預(yù)處理方法的流程示意圖;
[0014] 圖2是本發(fā)明另一實(shí)施例提出的用于遠(yuǎn)場語音識(shí)別的預(yù)處理方法的流程示意圖;
[0015] 圖3是本發(fā)明另一實(shí)施例提出的用于遠(yuǎn)場語音識(shí)別的預(yù)處理裝置的結(jié)構(gòu)示意圖;
[0016] 圖4是本發(fā)明另一實(shí)施例提出的用于遠(yuǎn)場語音識(shí)別的預(yù)處理裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0017] 下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終 相同或類似的標(biāo)號(hào)表示相同或類似的模塊或具有相同或類似功能的模塊。下面通過參考 附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。相反, 本發(fā)明的實(shí)施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同 物。
[0018] 圖1是本發(fā)明一實(shí)施例提出的用于遠(yuǎn)場語音識(shí)別的預(yù)處理方法的流程示意圖,該 方法包括:
[0019] S11 :獲取由麥克風(fēng)陣列采集的多路語音信號(hào)。
[0020] 其中,麥克風(fēng)陣列可以具體是均勾環(huán)形麥克風(fēng)陣列(Uniform Circular Array, UCA),UCA是指將多個(gè)麥克風(fēng)均勻設(shè)置在環(huán)形平面上。
[0021] 通過每個(gè)麥克風(fēng)采集一路語音信號(hào),從而可以獲取到多路語音信號(hào)。
[0022] 麥克風(fēng)的個(gè)數(shù)以及環(huán)形半徑可以設(shè)置,例如,N = 16, R = 0. 08m。
[0023] S12:根據(jù)預(yù)設(shè)的頻率點(diǎn)閾值,將所述多路語音信號(hào)分為低頻分量和中高頻分量。
[0024] 頻率點(diǎn)閾值例如是f0 = 1 kHz。
[0025] 低頻分量是指頻率小于fO的部分,中高頻分量是指頻率大于fO的部分。
[0026] 每一路語音信號(hào)的頻譜范圍通常是在0-8kHz,通過與頻率點(diǎn)閾值比較,可以將采 集的多路語音信號(hào)分為低頻分量和中高頻分量。
[0027] S13 :對(duì)低頻分量進(jìn)行延遲求和波束形成,以及,對(duì)中高頻分量進(jìn)行基于濾波器的 波束形成。
[0028] 對(duì)均勻環(huán)形麥克風(fēng)陣列采集的語音信號(hào)進(jìn)行延時(shí)求和波束形成可以稱為DS-UCA, 對(duì)均勻環(huán)形麥克風(fēng)陣列采集的語音信號(hào)進(jìn)行基于濾波器的波束形成可以稱為FIB-UCA。
[0029] 一些實(shí)施例中,參見圖2,對(duì)低頻分量的處理流程可以包括:
[0030] S201 :對(duì)低頻分量根據(jù)空間響應(yīng)的公式,進(jìn)行DS-UCA的波束成形。
[0031] 其中,DS-UCA的波束成形時(shí)采用的空間響應(yīng)的公式是:
[0033] 其中,N是均勻環(huán)形麥克風(fēng)陣列中麥克風(fēng)的個(gè)數(shù),R是環(huán)形半徑,B表示波束形成器 的空間響應(yīng),ω是語音信號(hào)的角頻率,θ,φ分別是語音信號(hào)的仰角和方向角,在遠(yuǎn)場識(shí)別 場景下,Θ = 9。= Ji/2,k是波數(shù),k= c〇/c,c是光速,Θ。,φ。分別是主波束的仰角和方 向角,γη是第η個(gè)麥克風(fēng)的方向角,γ n= 2 π (n-l)/N。主波束的仰角和方向角可以設(shè)置。
[0034] S202 :對(duì)低頻分量中的高頻分量進(jìn)行預(yù)加重處理。
[0035] 通過公式(1)可以看出,當(dāng)語音信號(hào)的頻率越大,頻譜失真越嚴(yán)重,為此,在對(duì)低 頻分量(Ο-lkHz)計(jì)算空間響應(yīng)后,可以對(duì)低頻分量中的高頻分量(偏向1kHz的部分)進(jìn) 行預(yù)加重處理。預(yù)加重處理時(shí)例如在上述的空間響應(yīng)B的基礎(chǔ)上乘以一個(gè)增益因子,該增 益因子與頻率成正比。具體的低頻分量中高頻分量的選擇以及增益因子的設(shè)置可以根據(jù)經(jīng) 驗(yàn)值確定。
[0036] 一些實(shí)施例中,參見圖2,對(duì)中高頻分量的處理流程可以包括:
[0037] S203 :確定補(bǔ)償濾波器。
[0038] 補(bǔ)償濾波器Η" (ω)的公式是:
[0040] 其中,〇^分別表示ω的最低和最高值,Κ是麥克風(fēng)的個(gè)數(shù),m是相位模式 (phase-mode)的索弓丨,其中,麥克風(fēng)采集的語音信號(hào)經(jīng)過離散傅里葉逆變換(Inverse Discrete Fourier Transform,IDFT)變換可以轉(zhuǎn)換為相位模式,Jn ( α )為第一類 Bessel 函數(shù),
r是麥克風(fēng)陣列的半徑,c是光速,f是語音信 號(hào)的頻率,是最高頻率。
[0041] S204:確定加權(quán)因子。
[0042] 加權(quán)因子{gm}是一個(gè)Μ階有限長單位沖激響應(yīng)(Finite Impulse Response,F(xiàn)IR) 濾波器系數(shù),M是m的最大
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1