本發(fā)明屬于汽車電子應用技術領域,具體涉及一種應用于車載語音識別的雙麥克風降噪系統(tǒng)及降噪方法。
背景技術:
隨著汽車領域科技的發(fā)展,人們對車內(nèi)電子產(chǎn)品的使用欲望愈發(fā)強烈。
語音識別是近幾年來發(fā)展起來的新技術,也是剛剛滲入汽車領域的新功能,它通過語音交互的方式控制整車的部分功能,提升駕駛員的行車享受。
語音識別的關鍵技術之一就是語音的音質清晰處理,也就是語音的降噪技術?,F(xiàn)有的降噪方法有如下幾種:
中國專利cn201410076957.4公開了一種語音降噪方法,采用單麥克風方案,計算前30幀的噪音功率譜估計值作為靜音幀,計算說話時的平均功率譜作為語音幀,語音幀減去靜音幀作為降噪后的語音譜,再通過處理得到降噪后的語音,這種方法由于采用說話前的噪音作為靜音幀,沒有用說話實時的背景噪音作為靜音幀,處理降噪時不夠準確,無法在語音識別這種高精準的功能中使用。
中國專利cn201410042189.0公開了一種雙路麥克風語音降噪處理方法及系統(tǒng),采用雙麥克風方案,對兩路信號求和取平均作為含噪語音信號估計,求差平均作為噪聲信號估計,含噪語音信號估計與噪音信號估計的功率譜相減得到純凈語音信號功率譜,最后通過處理得到純凈的語音信號,此種方法中的噪聲信號是通過雙路信號相減得出的,由于車輛的噪音不同于人聲噪音,所以這種方法也無法在車內(nèi)使用。
除此之外還有應用于手機上的雙麥克風降噪系統(tǒng)及方法,其主麥克風與副麥克風保持一定距離,這樣保證主、副麥克風接受到的語音有幅度差,而接受的噪音是一樣的,然后通過相減的方法去除噪音。這種方法雖然較好的去除噪音,但是不適用于車輛語音識別。一方面,車輛的主副麥克風都與駕駛者有一定距離,無法明顯的區(qū)分噪音與人的聲音,其次語音識別功能也為副駕駛和后座乘客提供,所以車輛語音識別不能使用這種方法。
技術實現(xiàn)要素:
為了解決上述存在的技術問題,本發(fā)明設計了一種應用于車載語音識別的雙麥克風降噪系統(tǒng)及降噪方法,通過對音質的處理,保證語音錄入的清晰,從而提升語音識別率,保證語音功能的正常使用。
為了解決上述存在的技術問題,本發(fā)明采用了以下方案:
一種應用于車載語音識別的雙麥克風降噪系統(tǒng),其特征在于,包括主麥克風、副麥克風、語音凈音模塊和語音識別后續(xù)處理模塊;
所述主麥克風:錄入乘車人員的聲音和行車噪音;
所述副麥克風:錄入行車噪音;
所述語音凈音模塊:處理所述主麥克風和所述副麥克風錄入的語噪信號,并通過噪音模型庫優(yōu)化所述副麥克風錄入的語噪信號獲得噪音信號,經(jīng)過處理的所述主麥克風語噪信號減去噪音信號得到語音信號,將所述語音信號與語音模型庫匹配優(yōu)化,得到純凈語音信號;
所述語音識別后續(xù)處理模塊:對發(fā)送來的純凈語音信號識別并執(zhí)行對應操作。
進一步,所述語音凈音模塊包括:
信號轉換模塊:將模擬信號轉為數(shù)字信號;
噪音拾取模塊:通過聲音頻率劃分,拾取所述副麥克風錄入的語噪信號中的噪音部分,再與噪音模型庫匹配,擴展噪音部分,最后將噪音部分與所述副麥克風錄入的原語噪信號對比處理,得到最終噪音信號;
噪音模型庫:內(nèi)置噪音語音頻譜和優(yōu)化程序,評估噪音趨勢并完善所述噪音信號;其中噪音語音頻譜為前期針對車輛在各種行駛情況下的噪音數(shù)據(jù)統(tǒng)計,副麥克風的語噪信號可以與其對比,篩選出對應狀態(tài)下的噪音信號;
音頻處理模塊:對所述主麥克風錄入的語噪信號和所述噪音拾取模塊獲得的噪音信號進行處理,通過傅里葉變換,分別得到語噪功率譜和噪音功率譜;
信號集成模塊:將語噪功率譜減去噪音功率譜,得出語音功率譜,并通過數(shù)據(jù)變換,還原語音信號;
凈音處理模塊:將還原后的語音信號與語音模型庫匹配,優(yōu)化語音信號;
語音模型庫:內(nèi)置話語語音頻譜和優(yōu)化程序,并通過評分和優(yōu)化機制對所述語音信號進一步篩選和優(yōu)化;
信號放大模塊:將優(yōu)化后的語音信號進一步放大,增強后續(xù)語音功能的實現(xiàn)。
進一步,所述主麥克風錄入的行車噪音主要包括空調(diào)出風音、開窗風音、車內(nèi)機械摩擦音等行車噪音。
一種應用于車載語音識別的雙麥克風降噪方法,其特征在于,包括如下步驟:
步驟1,在車內(nèi)開啟語音識別,并發(fā)出語音指令;
步驟2,主麥克風將錄入的語噪信號發(fā)送至語音凈音模塊,所述語音凈音模塊中相對應的信號轉換模塊將該語噪模擬信號轉換成數(shù)字信號后發(fā)送至相對應的音頻處理模塊;同時副麥克風將錄入的語噪信號發(fā)送至所述語音凈音模塊,所述語音凈音模塊中相對應的信號轉換模塊將該語噪模擬信號轉換成數(shù)字信號后發(fā)送至噪音拾取模塊,噪音拾取模塊通過噪音切除、拾取、優(yōu)化方式得到噪音信號,并將該噪音信號發(fā)送至相對應的音頻處理模塊;噪音拾取模塊將來自于所述副麥克風并經(jīng)過轉換的語噪信號分成很多段,然后針對每段信號與噪音模型庫進行對比,拾取其中噪音信號段,并對拾取后的噪音信號段進行整合和優(yōu)化;
步驟3,所述音頻處理模塊分別對相對應的語噪信號和噪音信號進行幅度譜和相位譜拆分,并對幅度譜進行傅里葉變換,得到語噪功率譜和噪音功率譜;
步驟4,在信號集成模塊中,用所述語噪功率譜減去所述噪音功率譜,得到語音信號功率譜,并通過變化還原成語音信號;
步驟5,將還原后的語音信號與語音模型庫匹配并進行優(yōu)化;
步驟6,將優(yōu)化后的語音信號通過信號放大器放大,得到最終純凈放大語音信號,最后發(fā)送至語音識別程序,識別并執(zhí)行對應操作。
進一步,上述步驟2中,噪音拾取模塊將副麥克風拾取的語噪信號進行音頻劃分,提取其中噪音部分,然后將噪音部分與噪音模型庫匹配,通過數(shù)據(jù)匹配和優(yōu)化程序將噪音部分完善,完善后的噪音部分再與語噪信號對比,刪減溢出聲音頻率,最終得到噪音信號。
該應用于車載語音識別的雙麥克風降噪系統(tǒng)及降噪方法具有以下有益效果:
(1)本發(fā)明通過前期整理的噪音模型庫和語音模型庫,匹配優(yōu)化語音信號,得到純凈語音,提升車內(nèi)語音識別率,保證語音功能的完整執(zhí)行。
(2)本發(fā)明是在信號差分放大的基本框架基礎上,主麥克風接受語音+噪音,副麥克風單獨接受噪音,并通過噪音模型庫優(yōu)化噪音信號。在差分后通過語音模型庫優(yōu)化純凈語音信號。相比傳統(tǒng)方式,讓最終得到的語音信號更加純凈清晰,更適用于車載語音識別系統(tǒng)。
附圖說明
圖1:本發(fā)明應用于車載語音識別的雙麥克風降噪系統(tǒng)的結構示意圖;
圖2:本發(fā)明應用于車載語音識別的雙麥克風降噪系統(tǒng)的工作流程圖;
圖3:本發(fā)明中噪音拾取模塊的工作流程圖。
附圖標記說明:
1—主麥克風;2—副麥克風;3—語音凈音模塊;4—語音識別后續(xù)處理模塊。
具體實施方式
下面結合附圖,對本發(fā)明做進一步說明:
圖1示出了一種應用于車載語音識別的雙麥克風降噪系統(tǒng),包括主麥克風1、副麥克風2、語音凈音模塊3和語音識別后續(xù)處理模塊4。
主麥克風1:錄入乘車人員的聲音和行車噪音,其中行車噪音主要包括空調(diào)出風音、開窗風音、車內(nèi)機械摩擦音等行車噪音。
副麥克風2:錄入行車噪音。
語音凈音模塊3包括:
信號轉換模塊:將模擬信號轉為數(shù)字信號;
噪音拾取模塊:將副麥克風錄入的語噪信號處理,因為行車噪音的頻率與正常人說話的頻率不同,通過聲音頻率劃分,拾取其中噪音部分,再與噪音模型庫匹配,擴展噪音部分,最后將噪音部分與原語噪信號對比處理,得到最終噪音信號;
噪音模型庫:內(nèi)置噪音語音頻譜和優(yōu)化程序,評估噪音趨勢并完善噪音信號;
音頻處理模塊:對語噪信號和噪音信號進行處理,通過傅里葉變換,分別得到語噪功率譜和噪音功率譜;
信號集成模塊:將語噪功率譜減去噪音功率譜,得出語音功率譜,并通過數(shù)據(jù)變換,還原語音信號;
凈音處理模塊:將還原后的語音信號與語音模型庫匹配,優(yōu)化語音信號;
語音模型庫:內(nèi)置話語語音頻譜和優(yōu)化程序,并通過評分和優(yōu)化機制對語音信號進一步篩選和優(yōu)化。
信號放大模塊:將優(yōu)化后的語音信號進一步放大,增強后續(xù)語音功能的實現(xiàn)。
語音識別后續(xù)處理模塊4:對發(fā)送來的語音信號識別并執(zhí)行對應操作。
工作時,如圖1和圖2所示,客戶在車內(nèi)開啟語音識別,并發(fā)出語音指令。其中,主麥克風1將錄入的語噪信號發(fā)送至語音凈音模塊3,語音凈音模塊3中相對應的信號轉換模塊將語噪模擬信號轉換成數(shù)字信號后發(fā)送至相對應的音頻處理模塊。而副麥克風2將錄入的語噪信號發(fā)送至語音凈音模塊3,語音凈音模塊3中相對應的信號轉換模塊將該語噪模擬信號轉換成數(shù)字信號后發(fā)送至噪音拾取模塊,噪音拾取模塊通過噪音切除、拾取、優(yōu)化方式得到噪音信號,并將該噪音信號發(fā)送至相對應的音頻處理模塊。音頻處理模塊分別對相對應的語噪信號和噪音信號進行幅度譜和相位譜拆分,并對幅度譜進行傅里葉變換,得到語噪功率譜和噪音功率譜。在信號集成模塊中,將語噪功率譜減去噪音功率譜,得到語音信號功率譜,并通過變化還原程語音信號;還原后的語音信號與語音模型庫匹配,此時的語音信號可能存在部分頻段殘缺,以及部分頻段不足,需要對比語音模型庫的語句頻譜對殘缺、不足語音部分補漏、補償。將優(yōu)化后的語音信號通過信號放大模塊放大,得到最終純凈放大語音信號,最后發(fā)送至語音識別程序,識別并執(zhí)行對應操作。
如圖3所示,其中噪音拾取模塊將副麥克風拾取的語噪信號進行音頻劃分,提取其中噪音部分,然后將噪音部分與噪音模型庫匹配,通過數(shù)據(jù)匹配和優(yōu)化程序將噪音部分完善和全面,完善后的噪音部分再與語噪信號對比,刪減溢出聲音頻率,最終得到噪音信號。
本發(fā)明通過前期整理的噪音模型庫和語音模型庫,匹配優(yōu)化語音信號,得到純凈語音,提升車內(nèi)語音識別率,保證語音功能的完整執(zhí)行。
本發(fā)明是在信號差分放大的基本框架基礎上,主麥克風接受語音+噪音,副麥克風單獨接受噪音,并通過噪音模型庫優(yōu)化噪音信號。在差分后通過語音模型庫優(yōu)化純凈語音信號。相比傳統(tǒng)方式,讓最終得到的語音信號更加純凈清晰,更適用于車載語音識別系統(tǒng)。
上面結合附圖對本發(fā)明進行了示例性的描述,顯然本發(fā)明的實現(xiàn)并不受上述方式的限制,只要采用了本發(fā)明的方法構思和技術方案進行的各種改進,或未經(jīng)改進將本發(fā)明的構思和技術方案直接應用于其它場合的,均在本發(fā)明的保護范圍內(nèi)。