亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語音活動(dòng)檢測方法和頭戴式耳機(jī)與流程

文檔序號:40386052發(fā)布日期:2024-12-20 12:08閱讀:5來源:國知局
語音活動(dòng)檢測方法和頭戴式耳機(jī)與流程

本技術(shù)涉及降噪領(lǐng)域,具體而言,涉及一種語音活動(dòng)檢測方法、語音活動(dòng)檢測方法、頭戴式耳機(jī)。


背景技術(shù):

1、隨著遠(yuǎn)程會(huì)議的普及,用戶在嘈雜的開放式環(huán)境中進(jìn)行通話、會(huì)議的需求也越來越高,這對耳機(jī)降噪能力的要求也越來越高。

2、目前,降噪耳機(jī)在工作時(shí),需要對麥克風(fēng)對采集到的語音信號幀進(jìn)行語音活動(dòng)檢測,也即判斷該語音信號幀為噪聲幀或語音幀,再對噪聲幀進(jìn)行抑制。

3、現(xiàn)有的不同語音活動(dòng)檢測方式在檢測區(qū)分時(shí)噪聲幀和語音幀存在檢測準(zhǔn)確性較低的問題。例如,部分檢測方法無法跟蹤噪聲譜的快速變化,在嘈雜的環(huán)境中檢測準(zhǔn)確性較低;部分檢測方法無法區(qū)分用戶自身的語音和旁人的語音,在環(huán)境噪聲較大時(shí)的準(zhǔn)確性較低。


技術(shù)實(shí)現(xiàn)思路

1、有鑒于此,本技術(shù)旨在提供一種語音活動(dòng)檢測方法和頭戴式耳機(jī),以提高語音活動(dòng)的檢測準(zhǔn)確性,進(jìn)而提高耳機(jī)的降噪效果。

2、首先,本技術(shù)實(shí)施例提供一種語音活動(dòng)檢測方法,應(yīng)用于耳機(jī)的處理單元,所述語音活動(dòng)檢測方法包括:獲取同一幀聲音對應(yīng)的多路麥克語音信號,一幀所述多路麥克語音信號包括所述同一幀聲音對應(yīng)的前向語音信號和后向語音信號,所述前向語音信號為預(yù)設(shè)用戶聲音傳播方向上的語音信號,所述后向語音信號為與預(yù)設(shè)用戶聲音傳播方向的反方向上的語音信號;計(jì)算所述前向語音信號和所述后向語音信號的相關(guān)性和第一能量比值;基于所述相關(guān)性和所述第一能量比值確定所述多路麥克語音信號的類型,所述多路麥克語音信號的類型為語音幀或噪聲幀。

3、本技術(shù)實(shí)施例中,對每幀聲音進(jìn)行語音活動(dòng)檢測,可以實(shí)現(xiàn)對噪聲譜的快速變化進(jìn)行跟蹤,從而在嘈雜的環(huán)境中也能夠具有較高的檢測準(zhǔn)確性。前向語音信號為預(yù)設(shè)用戶聲音傳播方向上的語音信號,其能有效抑制噪聲的特征,體現(xiàn)出用戶發(fā)出的語音的特征,反之,反向語音信號為傳播方向反方向上的信號,能夠較好地抑制用戶語音的特征,更好地體現(xiàn)出噪聲的特征,利用前向語音信號和后向語音信號進(jìn)行噪聲幀和語音幀的判斷,能夠有效提高檢測準(zhǔn)確性。相應(yīng)地,在判斷是否為語音幀和噪聲幀時(shí),前向語音信號和后向語音信號的第一能量比值的過大或過小能夠有效表征二者是否同為噪聲幀或語音幀。前向語音信號和后向語音信號所抑制的方向不同,突出的語音特征不同,因此,在二者的第一能量比值無法區(qū)分噪聲幀和語音幀時(shí),再結(jié)合相關(guān)性進(jìn)行判斷,可以得到更為準(zhǔn)確的檢測結(jié)果。

4、一實(shí)施例中,所述耳機(jī)為頭戴式耳機(jī),所述頭戴式耳機(jī)包括咪桿,所述咪桿上設(shè)置第一麥克風(fēng)和第二麥克風(fēng);所述獲取同一幀聲音對應(yīng)的多路麥克語音信號,包括:獲取對所述同一幀聲音進(jìn)行采集時(shí),所述咪桿上所述第一麥克風(fēng)采集的第一語音信號和所述第二麥克風(fēng)采集的第二語音信號;對所述第一語音信號和所述第二語音信號進(jìn)行前向波束成形處理,得到所述前向語音信號;對所述第一語音信號和所述第二語音信號進(jìn)行后向波束成形處理,得到所述后向語音信號。

5、本技術(shù)實(shí)施例中,相較于耳機(jī)腔體設(shè)置的麥克風(fēng),咪桿上設(shè)置的麥克風(fēng)能夠更靠近音源,也即用戶嘴部,咪桿上麥克風(fēng)采集的語音信號具有更高的信噪比,利用咪桿上麥克風(fēng)采集的第一語音信號和第二語音信號進(jìn)行語音活動(dòng)檢測,可以有效提高語音活動(dòng)檢測的準(zhǔn)確性。

6、一實(shí)施例中,在所述咪桿上,所述第一麥克風(fēng)和所述第二麥克風(fēng)間隔預(yù)設(shè)距離。

7、本技術(shù)實(shí)施例中,波束成形處理需使用差分信號,若第一麥克風(fēng)和第二麥克風(fēng)距離過近,則可能使得二者采集的語音信號的區(qū)別較小,無法用于波束成形,因此,使第一麥克風(fēng)和第二麥克風(fēng)間隔一定的距離,可以使得二者各自采集的語音信號具有較為明顯的差異,有助于提高波束成形的效果,進(jìn)而提高基于波束成形的前向語音信號和后向語音信號進(jìn)行語音活動(dòng)檢測的準(zhǔn)確性。

8、一實(shí)施例中,所述預(yù)設(shè)距離的取值范圍為2厘米至4厘米。

9、本實(shí)施例中,對于頭戴式耳機(jī),使得預(yù)設(shè)距離在2厘米至4厘米的范圍內(nèi),可以使得第一語音信號和第二語音信號具有明顯差異的同時(shí),避免距離過大使得第一語音信號和第二語音信號差異多大而無法通過波束成形準(zhǔn)確確定出共同的前向或后向特征的情況。

10、一實(shí)施例中,所述基于所述相關(guān)性和所述第一能量比值確定語音活動(dòng)檢測結(jié)果,包括:若所述第一能量比值小于或等于第一預(yù)設(shè)能量比閾值,則確定所述多路麥克語音信號中各語音信號對應(yīng)的類型為所述噪聲幀;若所述第一能量比值大于或等于第二預(yù)設(shè)能量比閾值,則確定所述多路麥克語音信號各語音信號對應(yīng)的類型為所述語音幀;所述第二預(yù)設(shè)能量比閾值大于所述第一預(yù)設(shè)能量比閾值;若所述第一能量比值在所述第一預(yù)設(shè)能量比閾值和所述第二預(yù)設(shè)能量比閾值之間,則判斷:若所述相關(guān)性小于預(yù)設(shè)相關(guān)性閾值,則確定所述多路麥克語音信號各語音信號對應(yīng)的類型為所述噪聲幀;若所述相關(guān)性大于所述預(yù)設(shè)相關(guān)性閾值,則確定所述多路麥克語音信號各語音信號對應(yīng)的類型為所述語音幀。

11、本技術(shù)實(shí)施例中,第一能量比值為前向語音信號和后向語音信號的能量比值,前向語音信號和后向語音信號所體現(xiàn)的特征不同,分別為前向和后向的聲音特征,若第一能量比值較小,則表征后向語音信號較大,進(jìn)而意味著噪聲信號較大,因此,可以在第一能量比值大于第二預(yù)設(shè)能量比閾值的情況下直接確定為噪聲幀,反之,若第一能量比值較大,大于第一預(yù)設(shè)能量比閾值甚至接近于1,則意味著后向語音信號與前向語音信號相似,則大概率為語音幀。對于第一能量比值在第一預(yù)設(shè)能量比閾值和第二預(yù)設(shè)能量比閾值之間時(shí),則存在干擾影響,但干擾的大小不確定,無法直接確定語音幀或噪聲幀,因此,在該情況下,可以結(jié)合相關(guān)性進(jìn)行判斷,在第一能量比值處于第一預(yù)設(shè)能量比閾值和第二預(yù)設(shè)能量比閾值之間時(shí),若二者相關(guān)性較小,則表征噪聲較大,可以判斷為噪聲幀,反之,若二者相關(guān)性較大,則表征噪聲較小,可以判斷為語音幀。通過上述方式,可以準(zhǔn)確判斷不同情況下的語音活動(dòng),得到較為準(zhǔn)確的檢測結(jié)果。

12、一實(shí)施例中,所述頭戴式耳機(jī)包括左耳機(jī)、右耳機(jī)、第三麥克風(fēng)和第四麥克風(fēng);所述第三麥克風(fēng)設(shè)置于所述左耳機(jī)上,所述第四麥克風(fēng)設(shè)置于所述右耳機(jī)上;所述多路麥克語音信號還包括所述第三麥克風(fēng)采集的第三語音信號和所述第四麥克風(fēng)采集的第四語音信號;所述語音活動(dòng)檢測方法,還包括:在所述第一能量比值大于或等于所述第一預(yù)設(shè)能量比閾值的情況下,獲取并確定所述第三語音信號和所述第四語音信號之間的第二能量比值;若所述第二能量比值大于第五能量閾值,或,所述第二能量比值小于第六能量閾值,則重新確定所述多路麥克語音信號的類型為所述噪聲幀;所述第五能量閾值大于所述第六能量閾值。

13、本技術(shù)實(shí)施例中,在第一能量比值大于或等于所述第一預(yù)設(shè)能量比閾值的情況下,其有可能是用戶兩側(cè)的噪聲信號較大的原因,兩側(cè)的噪聲在前向和后向的能量比值是相似的,因此,在該情況下,可以在結(jié)合耳機(jī)兩側(cè)的第三麥克風(fēng)和第四麥克風(fēng)采集的語音信號計(jì)算第二能量比值,通過第二能量比值表征用戶兩側(cè)的聲音大小,輔助判斷是否為噪聲幀,若第二能量比值過大或過小,均表征為噪聲幀,由此,通過第二能量比值進(jìn)一步對噪聲幀進(jìn)行判斷,可以提高語音活動(dòng)檢測的準(zhǔn)確性。

14、一實(shí)施例中,所述計(jì)算所述前向語音信號和所述后向語音信號的相關(guān)性和第一能量比值,包括:基于所述前向語音信號和所述后向語音信號中預(yù)設(shè)頻率范圍的語音信號計(jì)算所述相關(guān)性和所述第一能量比值;所述預(yù)設(shè)頻率范圍與人聲的頻率范圍匹配。

15、本實(shí)施例中,預(yù)設(shè)頻率范圍與人聲的頻率范圍匹配,截取人聲頻率范圍的語音信號計(jì)算相關(guān)性和能量比值,可以更為準(zhǔn)確地截取到前向語音信號和后向語音信號中的人聲特征,特別是耳機(jī)用戶的聲音,基于該預(yù)設(shè)頻率范圍的語音信號計(jì)算相關(guān)性和第一能量比值,使得相關(guān)性和第一能量比值與人聲之間的關(guān)聯(lián)性更大,進(jìn)而基于相關(guān)性和第一能量比值確定的噪聲幀和語音幀更準(zhǔn)確。

16、一實(shí)施例中,所述處理單元中配置有具有不同噪聲抑制方式的多個(gè)噪聲抑制模塊;所述基于所述相關(guān)性和所述第一能量比值確定所述多路麥克語音信號的類型之后,所述語音活動(dòng)檢測方法還包括:基于具有不同噪聲抑制方式的多個(gè)所述噪聲抑制模塊分別對所述前向語音信號進(jìn)行處理,得到各所述噪聲抑制模塊輸出的增益;基于預(yù)設(shè)的增益選取條件,從各所述噪聲抑制模塊輸出的增益中確定出目標(biāo)增益;使用所述目標(biāo)增益對所述前向語音信號進(jìn)行降噪。

17、本實(shí)施例中,通過設(shè)置多個(gè)噪聲抑制模塊確定多個(gè)降噪的增益,由此,在針對不同場景下的語音信號,能夠確定出更為合適的目標(biāo)增益進(jìn)行降噪,以提高降噪效果。

18、一實(shí)施例中,所述處理單元還包括自適應(yīng)濾波器,多個(gè)所述噪聲抑制模塊包括:單麥克噪聲抑制模塊,以及殘余非線性回聲消除模塊;所述基于具有不同噪聲抑制方式的多個(gè)所述噪聲抑制模塊分別對所述前向語音信號進(jìn)行處理之前,所述方法還包括:將所述前向語音信號輸入所述自適應(yīng)濾波器,得到自適應(yīng)濾波后的前向語音信號;其中,若所述前向語音信號為所述噪聲幀時(shí),所述自適應(yīng)濾波器基于所述噪聲幀調(diào)整自身的濾波器系數(shù);所述基于具有不同噪聲抑制方式的多個(gè)所述噪聲抑制模塊分別對所述前向語音信號進(jìn)行處理,得到各所述噪聲抑制模塊輸出的增益,包括:將所述自適應(yīng)濾波后的前向語音信號輸入所述殘余非線性回聲消除模塊進(jìn)行殘余非線性回聲消除處理,得到第一增益;將所述自適應(yīng)濾波后的前向語音信號輸出至所述單麥克噪聲抑制模塊,得到所述單麥克噪聲抑制模塊進(jìn)行噪聲抑制后輸出的第二增益。

19、耳機(jī)中的自適應(yīng)濾波器會(huì)調(diào)整自身的濾波器系數(shù),以調(diào)整對噪聲的濾波能力,而若輸入自適應(yīng)濾波器的語音信號為語音幀,則可能使得語音信號幀中的人聲出現(xiàn)失真,因此,本技術(shù)實(shí)施例中,在將前向語音信號輸入自適應(yīng)濾波器及各噪聲抑制模塊計(jì)算增益前,先判斷是否為噪聲幀,在噪聲幀的情況下,再更新自適應(yīng)濾波器的系數(shù),濾波器更新后,再計(jì)算第一增益能更實(shí)時(shí)追蹤噪聲的變化,改善降噪效果,減少語音失真的情況。無論殘余非線性回聲消除或是單麥克噪聲抑制,均能夠?qū)η跋蛘Z音信號中的噪聲進(jìn)行較好的抑制,得到具有較好降噪效果的增益。

20、一實(shí)施例中,多個(gè)所述噪聲抑制模塊還包括:能量差噪聲抑制模塊;所述耳機(jī)還包括噪聲估計(jì)模塊;所述噪聲估計(jì)模塊還與所述處理單元連接;所述基于具有不同噪聲抑制方式的多個(gè)所述噪聲抑制模塊分別對所述前向語音信號進(jìn)行處理,得到各所述噪聲抑制模塊輸出的增益,還包括:基于所述能量差噪聲抑制模塊對所述噪聲估計(jì)模塊輸出的噪聲估計(jì)和所述自適應(yīng)濾波后的前向語音信號進(jìn)行處理,得到第三增益;其中,所述耳機(jī)還包括左耳機(jī)、右耳機(jī)、第三麥克風(fēng)和第四麥克風(fēng);所述第三麥克風(fēng)設(shè)置于所述左耳機(jī)上,所述第四麥克風(fēng)設(shè)置于所述右耳機(jī)上;所述多路麥克語音信號還包括所述第三麥克風(fēng)采集的第三語音信號和所述第四麥克風(fēng)采集的第四語音信號;所述方法還包括:在基于能量差噪聲抑制模塊對所述噪聲估計(jì)模塊輸出的噪聲估計(jì)和所述自適應(yīng)濾波后的前向語音信號進(jìn)行處理之前,獲取所述同一幀聲音對應(yīng)的第三語音信號和第四語音信號,并從二者中確定出能量更高的最大輔麥克信號;計(jì)算所述前向語音信號和所述最大輔麥克信號的第三能量差值;若所述第三能量差值大于或等于第三預(yù)設(shè)能量差值閾值,則不更新所述噪聲估計(jì)模塊中的噪聲估計(jì);若所述第三能量差值小于或等于第四預(yù)設(shè)能量差值閾值,則基于所述最大輔麥克信號更新所述噪聲估計(jì)模塊中的噪聲估計(jì);若所述第三能量差值在所述第三預(yù)設(shè)能量差值閾值和所述第四預(yù)設(shè)能量差值閾值之間,則基于所述前向語音信號更新所述噪聲估計(jì)模塊中的噪聲估計(jì)。

21、前向語音信號經(jīng)過殘余非線性回聲消除和單麥克噪聲抑制雖然能抑制一部分干擾語音,但難以完全消除干擾信號。因此,在本實(shí)施例中,將第三麥克風(fēng)和第四麥克風(fēng)采集的語音信號作為輔助麥克風(fēng)信號,確定出最大輔麥克信號,以前向語音信號和最大輔麥克信號的第三能量差值更新確定更新噪聲估計(jì)的方式,從而得到更適合當(dāng)前所采集語音信號的噪聲估計(jì),以使用該噪聲估計(jì)對前向語音信號進(jìn)行噪聲抑制時(shí),可以提高噪聲抑制效果。

22、一實(shí)施例中,預(yù)設(shè)的增益選取條件為從多個(gè)增益中選取最小增益為所述目標(biāo)增益。

23、本實(shí)施例中,使用最小增益進(jìn)行降噪已經(jīng)具有一定的降噪效果,而由于增益最小,可以有效減少因增益過大導(dǎo)致降噪時(shí)語音信號失真的可能性。

24、第二方面,本技術(shù)實(shí)施例還提供一種頭戴式耳機(jī),包括:麥克風(fēng),用于對聲音進(jìn)行采集;處理單元,與所述麥克風(fēng)連接,用于執(zhí)行如第一方面任一項(xiàng)所述的語音活動(dòng)檢測方法。

25、一實(shí)施例中,所述頭戴式耳機(jī)還包括咪桿,所述咪桿上設(shè)置第一麥克風(fēng)和第二麥克風(fēng);對所述同一幀聲音進(jìn)行采集時(shí),所述第一麥克風(fēng)用于采集第一語音信號和所述第二麥克風(fēng)用于采集第二語音信號;所述處理單元用于對所述第一語音信號和所述第二語音信號進(jìn)行前向波束成形處理,得到所述前向語音信號;以及,對所述第一語音信號和所述第二語音信號進(jìn)行后向波束成形處理,得到所述后向語音信號。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1