一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置的制作方法

文檔序號：2835238閱讀：376來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置的制作方法
技術(shù)領(lǐng)域：
本實(shí)用新型涉及信號處理領(lǐng)域，特別是一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置。
背景技術(shù)：
語音是人類交流最自然的手段，但在語音通信、語音識別等實(shí)際應(yīng)用中，往往存在著各種各樣的環(huán)境噪聲。當(dāng)這些環(huán)境噪聲較強(qiáng)時，會嚴(yán)重影響語音通信的質(zhì)量和識別的正確率。例如在工廠、集會等嘈雜環(huán)境中，不但語音通信的音質(zhì)、可懂度會顯著變差，語音識別器的識別率也會急劇下降。語音增強(qiáng)是一種常用的減少環(huán)境噪聲影響、提高語音通信質(zhì)量的方法，也可以用于識別前語音的預(yù)處理，以提高語音識別器的識別率。目前語音增強(qiáng)方法主要包括兩類，一類是基于單麥克風(fēng)的語音增強(qiáng)方法，包括譜減法、維納濾波、MMSE、卡爾曼濾波、小波變換等，這類方法利用單麥克風(fēng)接收語音信號，通過時域、頻域、小波變換域等濾波和處理來抑制噪聲，提高語音的質(zhì)量；另一類是基于麥克風(fēng)陣列的語音增強(qiáng)方法，這類方法將陣列信號處理技術(shù)應(yīng)用到語音增強(qiáng)中，利用多個麥克風(fēng)接收到的語音信號里包含的空間相位信息對輸入語音進(jìn)行空間濾波，形成具有指向性的空間波束，對指定方向上的語音信號進(jìn)行增強(qiáng)，同時抑制其他方向上的干擾，可提供比傳統(tǒng)語音增強(qiáng)方法更好的噪聲抑制效果?，F(xiàn)有的語音增強(qiáng)技術(shù)能在一定程度上提高帶噪語音的質(zhì)量，但由于這些技術(shù)均基于麥克風(fēng)等空氣傳導(dǎo)的語音傳感器，在接收信號中，環(huán)境噪聲直接疊加在語音信號上，因此隨著環(huán)境噪聲的增強(qiáng)，其性能不可避免地下降，特別在強(qiáng)噪聲環(huán)境下，現(xiàn)有的語音增強(qiáng)技術(shù)仍很難取得好的效果O為了能適應(yīng)強(qiáng)噪聲環(huán)境下的語音通信，一些語音通信系統(tǒng)采用了非空氣傳導(dǎo)的語音傳感器，如喉部送話器和骨傳導(dǎo)語音傳感器等。這些語音傳感器在使用時緊貼使用者的喉部、顎骨等部位，使用者說話時聲帶振動帶動傳感器中的簧片發(fā)生形變，將簧片的振動轉(zhuǎn)化為電信號即可得到語音信號。由于空氣中傳導(dǎo)的聲波無法使這類語音傳感器的簧片發(fā)生形變，因此這類語音傳感器不受聲學(xué)噪聲的影響，具有很強(qiáng)的抗干擾能力，常用于坦克、工廠等強(qiáng)噪聲環(huán)境中的語音通信和語音識別。但由于非空氣傳導(dǎo)語音傳感器檢測到的語音信號在傳播信道的特性上與說話時聲道的特性有較大的不同，因此與麥克風(fēng)等空氣傳導(dǎo)語音傳感器接收到的語音相比自然度差，聽起來并不舒適。

實(shí)用新型內(nèi)容針對現(xiàn)有基于空氣傳導(dǎo)語音傳感器的語音增強(qiáng)技術(shù)在強(qiáng)噪聲環(huán)境中效果不佳和非空氣傳導(dǎo)語音傳感器音質(zhì)差等不足，本實(shí)用新型提供了一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置。本實(shí)用新型體積小、抗噪聲能力強(qiáng)、語音質(zhì)量好、使用方便，可以廣泛用于各種強(qiáng)噪聲環(huán)境下的語音通信、記錄、識別等場合。本實(shí)用新型具體技術(shù)方案如下。一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置，其包括空氣傳導(dǎo)語音傳感器、非空氣傳導(dǎo)語音傳感器、多路數(shù)據(jù)采集模塊和數(shù)據(jù)處理裝置，空氣傳導(dǎo)語音傳感器、非空氣傳導(dǎo)語音傳感器均各自與多路數(shù)據(jù)采集模塊連接，多路數(shù)據(jù)采集模塊與數(shù)據(jù)處理裝置連接，其中，空氣傳導(dǎo)語音傳感器和非空氣傳導(dǎo)語音傳感器分別用于采集空氣傳導(dǎo)和非空氣傳導(dǎo)的語音信號，多路數(shù)據(jù)采集模塊用于采集接收空氣傳導(dǎo)語音傳感器和非空氣傳導(dǎo)語音傳感器的輸出信號，數(shù)據(jù)處理裝置用于對多路數(shù)據(jù)采集模塊采集的數(shù)據(jù)進(jìn)行處理并對空氣傳導(dǎo)語音傳感器檢測語音進(jìn)行增強(qiáng)并輸出。進(jìn)一步的，上述可用于強(qiáng)噪聲環(huán)境的語音采集裝置中，所述數(shù)據(jù)處理裝置包括噪聲模型估計(jì)模塊、聯(lián)合模型修正模塊、語音增強(qiáng)模塊、聯(lián)合模型訓(xùn)練和自適應(yīng)模塊，空氣傳導(dǎo)語音傳感器、非空氣傳導(dǎo)語音傳感器、噪聲模型估計(jì)模塊、語音增強(qiáng)模塊分別與多路數(shù)據(jù)采集模塊連接，噪聲模型估計(jì)模塊、聯(lián)合模型修正模塊、語音增強(qiáng)模塊順次連接，聯(lián)合模型訓(xùn)練和自適應(yīng)模塊與多路數(shù)據(jù)采集模塊和聯(lián)合模型修正模塊連接；其中，噪聲模型估計(jì)模塊用于估計(jì)當(dāng)前空氣傳導(dǎo)語音傳感器檢測語音的噪聲模型，聯(lián)合模型修正模塊用于根據(jù)當(dāng)前的噪聲模型對聯(lián)合模型的參數(shù)進(jìn)行修正，語音增強(qiáng)模塊根據(jù)修正前和修正后的聯(lián)合模型對空氣傳導(dǎo)語音傳感器檢測語音進(jìn)行增強(qiáng)，聯(lián)合模型訓(xùn)練和自適應(yīng)模塊用于訓(xùn)練聯(lián)合模型，并對模型參數(shù)進(jìn)行在線的自適應(yīng)調(diào)整。進(jìn)一步的，所述數(shù)據(jù)處理裝置包括DSP處理芯片。進(jìn)一步的，所述多路數(shù)據(jù)采集模塊采用多路數(shù)據(jù)采集芯片。進(jìn)一步的，所述空氣傳導(dǎo)語音傳感器采用麥克風(fēng)，所述非空氣傳導(dǎo)語音傳感器采用喉部送話器。本實(shí)用新型將空氣傳導(dǎo)語音傳感器和非空氣傳導(dǎo)語音傳感器相結(jié)合，首先建立空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音的聯(lián)合模型，在增強(qiáng)時利用非空氣傳導(dǎo)語音傳感器檢測語音來準(zhǔn)確估計(jì)聲學(xué)噪聲模型，并據(jù)此對聯(lián)合模型的參數(shù)進(jìn)行修正，然后利用修正后的聯(lián)合模型對輸入的空氣傳導(dǎo)語音傳感器檢測語音進(jìn)行增強(qiáng)。由于同時利用了空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音來恢復(fù)語音信號，因此與現(xiàn)有技術(shù)相比，本實(shí)用新型提供的方法能在強(qiáng)噪聲環(huán)境中輸出音質(zhì)更好的語音信號。上述可用于強(qiáng)噪聲環(huán)境的語音采集裝置的語音增強(qiáng)方法，具體包含以下步驟:步驟1:建立干凈環(huán)境下空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音的聯(lián)合模型；步驟2:根據(jù)非空氣傳導(dǎo)語音傳感器檢測的語音信號，估計(jì)當(dāng)前接收的空氣傳導(dǎo)語音傳感器檢測語音信號的噪聲模型；步驟3:利用步驟2得到的噪聲模型對聯(lián)合模型的參數(shù)進(jìn)行修正；步驟4:用修正前和修正后的聯(lián)合模型對空氣傳導(dǎo)語音傳感器檢測語音信號進(jìn)行增強(qiáng)，并輸出增強(qiáng)后的語音信號。進(jìn)一步的，上述步驟I中空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音的聯(lián)合模型，為空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音的聯(lián)合概率模型或它們之間的映射關(guān)系。進(jìn)一步的，上述步驟I中聯(lián)合模型的建立，包含以下步驟:步驟1.1:采集同步、干凈的空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)；[0020]步驟1.2:對步驟1.1中采集的空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音數(shù)據(jù)進(jìn)行分幀，提取每幀語音的聲道參數(shù)和激勵參數(shù)；步驟1.3:利用空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音中提取的聲道參數(shù)和激勵參數(shù)分別訓(xùn)練聲道參數(shù)和激勵參數(shù)的聯(lián)合模型。上述步驟2中當(dāng)前接收的空氣傳導(dǎo)語音傳感器檢測語音信號的噪聲模型估計(jì)，包含以下步驟:步驟2.1:同步采集空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音；步驟2.2:利用非空氣傳導(dǎo)語音傳感器檢測的語音數(shù)據(jù)進(jìn)行語音的端點(diǎn)檢測；步驟2.3:依據(jù)步驟2.2檢測的語音端點(diǎn)，提取空氣傳導(dǎo)語音傳感器檢測語音中的純噪聲段；步驟2.4:利用步驟2.3中得到的空氣傳導(dǎo)語音傳感器檢測語音中的純噪聲段數(shù)據(jù)，估計(jì)噪聲的統(tǒng)計(jì)模型。上述步驟3中，根據(jù)空氣傳導(dǎo)語音傳感器檢測語音信號的噪聲模型和步驟I中訓(xùn)練得到的聲道參數(shù)聯(lián)合模型，采用模型補(bǔ)償技術(shù)對聲道參數(shù)聯(lián)合模型的參數(shù)進(jìn)行修正。上述步驟4中的空氣傳導(dǎo)語音傳感器檢測語音信號增強(qiáng)，具體包含以下步驟:步驟4.1:利·用修正前和修正后的聲道參數(shù)聯(lián)合模型，以及當(dāng)前空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音中提取的聲道參數(shù)，按選定的優(yōu)化準(zhǔn)則估計(jì)干凈的空氣傳導(dǎo)語音傳感器檢測語音聲道參數(shù)；步驟4.2:求出當(dāng)前非空氣傳導(dǎo)語音傳感器檢測語音的激勵參數(shù)；步驟4.3:利用空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音激勵參數(shù)的聯(lián)合模型，將非空氣傳導(dǎo)語音傳感器檢測語音的激勵參數(shù)映射為空氣傳導(dǎo)語音傳感器檢測語音的激勵參數(shù)，并重構(gòu)空氣傳導(dǎo)語音傳感器檢測語音的激勵；步驟4.4:利用步驟4.3得到的空氣傳導(dǎo)語音傳感器檢測語音的激勵和步驟4.1得到的空氣傳導(dǎo)語音傳感器檢測語音聲道參數(shù)，合成增強(qiáng)后的語音。進(jìn)一步優(yōu)選的，上述步驟4.1中的優(yōu)化準(zhǔn)則為最小均方誤差準(zhǔn)則。上述方法中，空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音聯(lián)合模型的參數(shù)，在聲學(xué)噪聲小于預(yù)設(shè)門限時采用模型自適應(yīng)技術(shù)進(jìn)行調(diào)整。與現(xiàn)有技術(shù)相比，本實(shí)用新型有以下主要優(yōu)點(diǎn):(I)體積小，使用方便。與基于麥克風(fēng)陣列的語音增強(qiáng)相比，本實(shí)用新型使用一個空氣傳導(dǎo)語音傳感器和一個非空氣傳導(dǎo)語音傳感器，可以按人頭部的構(gòu)造設(shè)計(jì)成緊湊的耳機(jī)，體積更小，使用更方便。(2)與基于空氣傳導(dǎo)語音傳感器的語音增強(qiáng)相比，抗噪聲的能力更強(qiáng)。本實(shí)用新型將空氣傳導(dǎo)語音傳感器與非空去傳導(dǎo)傳感器相結(jié)合，而空氣中傳導(dǎo)的聲波不會對非空氣傳導(dǎo)的傳感器產(chǎn)生影響，因而具有很強(qiáng)的抗噪聲能力，在強(qiáng)噪聲環(huán)境中仍能得到較清晰的語
曰 (3)與基于非空氣傳導(dǎo)語音傳感器的語音增強(qiáng)相比，語音質(zhì)量更好。本實(shí)用新型在語音增強(qiáng)時利用了非空氣傳導(dǎo)語音和空氣傳導(dǎo)語音之間的映射關(guān)系來重建干凈語音，因此與基于非空氣傳導(dǎo)語音傳感器的語音增強(qiáng)方法相比具有更好的自然度。
圖1為本實(shí)用新型實(shí)施例提供的語音增強(qiáng)裝置結(jié)構(gòu)圖；圖2為本實(shí)用新型實(shí)施例提供的語音增強(qiáng)方法流程圖；圖3為本實(shí)用新型實(shí)施例提供的語音增強(qiáng)方法中建立語音聯(lián)合模型的流程圖；圖4為本實(shí)用新型實(shí)施例提供的語音增強(qiáng)方法中建立噪聲模型的流程圖；圖5為本實(shí)用新型實(shí)施例提供的語音增強(qiáng)方法中對空氣傳導(dǎo)語音傳感器檢測語音進(jìn)行增強(qiáng)的流程圖。
具體實(shí)施方式
以下結(jié)合附圖和實(shí)施例對本實(shí)用新型的具體實(shí)施步驟作進(jìn)一步說明，但本實(shí)用新型的實(shí)施和保護(hù)范圍不限于此。本實(shí)用新型實(shí)施例提供的語音增強(qiáng)裝置的系統(tǒng)結(jié)構(gòu)圖如圖1所示，包括空氣傳導(dǎo)語音傳感器、非空氣傳導(dǎo)語音傳感器、多路數(shù)據(jù)采集模塊和數(shù)據(jù)處理裝置，其中數(shù)據(jù)處理裝置包括噪聲模型估計(jì)模塊、聯(lián)合模型修正模塊、語音增強(qiáng)模塊、聯(lián)合模型訓(xùn)練和自適應(yīng)模塊，其中空氣傳導(dǎo)語音傳感器、非空氣傳導(dǎo)語音傳感器、噪聲模型估計(jì)模塊、語音增強(qiáng)模塊分別與多路數(shù)據(jù)采集模塊連接，噪聲模型估計(jì)模塊、聯(lián)合模型修正模塊、語音增強(qiáng)模塊順次連接，聯(lián)合模型訓(xùn)練和自適應(yīng)模塊與多路數(shù)據(jù)采集模塊和聯(lián)合模型修正模塊連接?？諝鈧鲗?dǎo)語音傳感器和非空氣傳導(dǎo)語音傳感器分別用于采集空氣傳導(dǎo)和非空氣傳導(dǎo)的語音信號，上述實(shí)施例中，空氣傳導(dǎo)語音傳感器采用麥克風(fēng)實(shí)現(xiàn)，非空氣傳導(dǎo)語音傳感器采用喉部送話器實(shí)現(xiàn)；多路數(shù)據(jù)采集模塊用于采集接收空氣傳導(dǎo)語音傳感器和非空氣傳導(dǎo)語音傳感器的輸出信號，上述實(shí)施例中，多路數(shù)據(jù)采集模塊采用多路數(shù)據(jù)采集芯片來實(shí)現(xiàn)；噪聲模型估計(jì)模塊用于估計(jì)當(dāng)前空氣傳導(dǎo)語音傳感器檢測語音的噪聲模型，聯(lián)合模型修正模塊用于根據(jù)當(dāng)前的噪聲模型對聯(lián)合模型中對應(yīng)于空氣傳導(dǎo)語音的參數(shù)進(jìn)行修正，語音增強(qiáng)模塊根據(jù)修正前和修正后的聯(lián)合模型對空氣傳導(dǎo)語音傳感器檢測語音進(jìn)行增強(qiáng)，聯(lián)合模型訓(xùn)練和自適應(yīng)模塊用于訓(xùn)練聯(lián)合模型，并對模型參數(shù)進(jìn)行在線的自適應(yīng)調(diào)整，上述實(shí)施例中，噪聲模型估計(jì)模塊，聯(lián)合模型修正模塊，語音增強(qiáng)模塊，聯(lián)合模型訓(xùn)練和自適應(yīng)模塊在DSP芯片中實(shí)現(xiàn)。上述實(shí)施例中，語音增強(qiáng)方法如圖2所示，采用如下步驟來實(shí)現(xiàn):步驟1:建立干凈環(huán)境下空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音的聯(lián)合模型，其流程如圖3所示，具體可分為以下步驟:步驟1.1:采集同步、干凈的空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。上述實(shí)施例中，在安靜的環(huán)境下通過多路數(shù)據(jù)采集芯片同步采集麥克風(fēng)和喉部送話器收集的語音數(shù)據(jù)作為聯(lián)合模型的訓(xùn)練數(shù)據(jù)。步驟1.2:對步驟1.1中采集的空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音數(shù)據(jù)進(jìn)行分幀，提取每幀語音的聲道參數(shù)和激勵參數(shù)。上述實(shí)施例中，將空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音按IOms的間隔進(jìn)行分幀，對于聲道參數(shù)，采用線性預(yù)測分析法提取一幀空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音的線性預(yù)測系數(shù)(即LPC系數(shù))。將原始語音通過LPC分析濾波器，得到預(yù)測殘差的幅度譜即為所需的激勵參數(shù)。步驟1.3:利用空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音中提取的聲道參數(shù)和激勵參數(shù)分別訓(xùn)練聲道參數(shù)聯(lián)合模型和激勵參數(shù)聯(lián)合模型?？諝鈧鲗?dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音參數(shù)的聯(lián)合模型可以采用聯(lián)合概率模型或它們之間的映射關(guān)系來表示，上述實(shí)施例中，使用高斯模型來對空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音中提取的聲道參數(shù)和激勵參數(shù)進(jìn)行建模，具體方法如下:對于聲道參數(shù)的聯(lián)合模型訓(xùn)練，首先將同一時刻空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音中提取的LPC參數(shù)轉(zhuǎn)換為線性預(yù)測倒譜系數(shù)(即LPCC系數(shù))，將兩者合并為一個聯(lián)合矢量，記為C=[ClT，c2T]T，其中C1為空氣傳導(dǎo)語音傳感器檢測語音的LPCC系數(shù)，C2為非空氣傳導(dǎo)語音傳感器檢測語音的LPCC系數(shù)，然后使用J個高斯模型來擬合這個聯(lián)合矢量的概率分布。令λ ^表示第j個高斯模型，則其模型參數(shù)包括高斯函數(shù)的均值、方差和該高斯模型的先驗(yàn)概率。高斯模型的參數(shù)有多種成熟的訓(xùn)練方法，上述實(shí)施例中，采用以下步驟來訓(xùn)練J個高斯模型的參數(shù):步驟1.3.1:將所有訓(xùn)練用的聯(lián)合矢量分成J個群，每個群使用一個高斯模型來擬合其概率分布，求出該群中所有聯(lián)合矢量的均值和方差作為高斯函數(shù)的均值和方差，該群中包含的聯(lián)合矢量的個數(shù)與所有訓(xùn)練用的聯(lián)合矢量個數(shù)之比為該高斯模型的先驗(yàn)概率。步驟1.3.2:根據(jù)上一步所得的高斯模型參數(shù)對所有訓(xùn)練用的聯(lián)合矢量重新劃分所屬的群，其原則是如果某一聯(lián)合矢量c屬于群j，則有P(c I λ P >P(c| Ai), i Φ j。步驟1.3.3:如果迭代次數(shù)達(dá)到預(yù)設(shè)值，則當(dāng)前的高斯模型參數(shù)即為訓(xùn)練好的高斯模型參數(shù)。否則，按步驟1.3.2的分群結(jié)果重新計(jì)算所有高斯模型的均值、方差和先驗(yàn)概率，并轉(zhuǎn)步驟1.3.2。對于激勵參數(shù)的聯(lián)合概率模型訓(xùn)練，將同一時刻空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音中提取的激勵的幅度譜合并為一個聯(lián)合矢量，記為s=[SlT, s2T]T，其中S1為空氣傳導(dǎo)語音傳感器檢測語音激勵的幅度譜，S2為非空氣傳導(dǎo)語音傳感器檢測語音激勵的幅度譜。使用K個高斯模型來擬合該聯(lián)合矢量的概率分布，采用與聲道參數(shù)相同的訓(xùn)練方法，可以得到激勵參數(shù)的K個高斯模型的參數(shù)。步驟2:根據(jù)非空氣傳導(dǎo)語音傳感器檢測的語音信號，估計(jì)當(dāng)前接收的空氣傳導(dǎo)語音傳感器檢測語音信號的噪聲模型，其流程如圖4所示，具體步驟如下:步驟2.1:同步采集空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音。上述實(shí)施例中，通過數(shù)據(jù)采集芯片同時采集的麥克風(fēng)語音信號和喉部送話器語音信號，并送入噪聲模型估計(jì)模塊進(jìn)行噪聲模型的估計(jì)；步驟2.2:利用非空氣傳導(dǎo)語音傳感器檢測的語音數(shù)據(jù)進(jìn)行語音的端點(diǎn)檢測。由于非空氣傳導(dǎo)語音傳感器檢測的語音信號不受聲學(xué)環(huán)境噪聲的影響，因此可以在有聲學(xué)噪聲的環(huán)境下準(zhǔn)確地檢測出語音的端點(diǎn)。語音端點(diǎn)檢測有多種方法，上述實(shí)施例中，采用經(jīng)典的基于能量和過零率的方法對喉部送話器檢測到的語音進(jìn)行端點(diǎn)檢測；步驟2.3:依據(jù)步驟2.2檢測的語音端點(diǎn)，提取空氣傳導(dǎo)語音傳感器檢測語音中的純噪聲段。由于空氣傳導(dǎo)語音傳感器檢測語音和非空氣傳導(dǎo)語音傳感器檢測語音同步采集，因此兩者語音的端點(diǎn)在時間上是一致，依據(jù)步驟2.2檢測的語音端點(diǎn)可以檢測出空氣傳導(dǎo)語音傳感器檢測語音的無話音段，即純噪聲信號。步驟2.4:利用步驟2.3中得到的空氣傳導(dǎo)語音傳感器檢測語音中的純噪聲段數(shù)據(jù)，估計(jì)噪聲的統(tǒng)計(jì)模型。上述實(shí)施例中，僅對噪聲的聲道參數(shù)進(jìn)行建模，建模模型采用單高斯函數(shù)，提取若干幀純噪聲信號的聲道參數(shù)并計(jì)算其均值和方差，即可得到噪聲聲道參數(shù)的高斯模型。步驟3:利用步驟2得到的噪聲模型對聯(lián)合模型的參數(shù)進(jìn)行修正，使其與當(dāng)前的使用環(huán)境匹配。上述步驟在聯(lián)合模型修正模塊完成，根據(jù)空氣傳導(dǎo)語音傳感器檢測語音信號的噪聲模型和步驟I中訓(xùn)練得到的聲道參數(shù)聯(lián)合模型，采用模型補(bǔ)償技術(shù)對聲道參數(shù)聯(lián)合模型的參數(shù)進(jìn)行修正，使其與當(dāng)前的使用環(huán)境匹配。上述實(shí)施例中，非空氣傳導(dǎo)傳感器檢測語音被認(rèn)為未受到聲學(xué)噪聲的影響，因此非空氣傳導(dǎo)傳感器檢測語音中的噪聲設(shè)置為0，模型補(bǔ)償中所用到的噪聲參數(shù)均按此設(shè)置提取。此外，聲道參數(shù)聯(lián)合模型中的高斯模型先驗(yàn)概率保持不變，激勵參數(shù)的聯(lián)合模型不進(jìn)行修正。模型補(bǔ)償技術(shù)在語音識別中已得到廣泛的應(yīng)用，對于聲道參數(shù)，上述實(shí)施例中采用了一種適用于線性預(yù)測系數(shù)(LPCC)的模型補(bǔ)償技術(shù)來對GMM中的高斯模型參數(shù)進(jìn)行修正(見參考文獻(xiàn):Ivandro Sanches.Noise-Compensated Hidden Markov Models.1EEETRANSACTIONS ON SPEECH AND AUDIO PROCESSING, 2000,8 (5):533_540)，具體方法如下:(I)均值的補(bǔ)償令cs表示線性倒譜域中高斯模型的均值，則其修正按以下步驟來進(jìn)行:步驟3.1A:用式(I)將Cs從LPCC域變換到LPC域
權(quán)利要求1.一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置，其特征在于包括空氣傳導(dǎo)語音傳感器、非空氣傳導(dǎo)語音傳感器、多路數(shù)據(jù)采集模塊和數(shù)據(jù)處理裝置，空氣傳導(dǎo)語音傳感器、非空氣傳導(dǎo)語音傳感器均各自與多路數(shù)據(jù)采集模塊連接，多路數(shù)據(jù)采集模塊與數(shù)據(jù)處理裝置連接，其中，空氣傳導(dǎo)語音傳感器和非空氣傳導(dǎo)語音傳感器分別用于采集空氣傳導(dǎo)和非空氣傳導(dǎo)的語音信號，多路數(shù)據(jù)采集模塊用于采集接收空氣傳導(dǎo)語音傳感器和非空氣傳導(dǎo)語音傳感器的輸出信號，數(shù)據(jù)處理裝置用于對多路數(shù)據(jù)采集模塊采集的數(shù)據(jù)進(jìn)行處理并對空氣傳導(dǎo)語音傳感器檢測語音進(jìn)行增強(qiáng)并輸出。
2.根據(jù)權(quán)利要求1所述的一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置，其特征在于所述數(shù)據(jù)處理裝置包括噪聲模型估計(jì)模塊、聯(lián)合模型修正模塊、語音增強(qiáng)模塊、聯(lián)合模型訓(xùn)練和自適應(yīng)模塊，空氣傳導(dǎo)語音傳感器、非空氣傳導(dǎo)語音傳感器、噪聲模型估計(jì)模塊、語音增強(qiáng)模塊分別與多路數(shù)據(jù)采集模塊連接，噪聲模型估計(jì)模塊、聯(lián)合模型修正模塊、語音增強(qiáng)模塊順次連接，聯(lián)合模型訓(xùn)練和自適應(yīng)模塊與多路數(shù)據(jù)采集模塊和聯(lián)合模型修正模塊連接；其中，噪聲模型估計(jì)模塊用于估計(jì)當(dāng)前空氣傳導(dǎo)語音傳感器檢測語音的噪聲模型，聯(lián)合模型修正模塊用于根據(jù)當(dāng)前的噪聲模型對聯(lián)合模型的參數(shù)進(jìn)行修正，語音增強(qiáng)模塊根據(jù)修正前和修正后的聯(lián)合模型對空氣傳導(dǎo)語音傳感器檢測語音進(jìn)行增強(qiáng)，聯(lián)合模型訓(xùn)練和自適應(yīng)模塊用于訓(xùn)練聯(lián)合模型，并對模型參數(shù)進(jìn)行在線的自適應(yīng)調(diào)整。
3.根據(jù)權(quán)利要求1所述的一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置，其特征在于所述數(shù)據(jù)處理裝置包括DSP處理芯片。
4.根據(jù)權(quán)利要求1所述的一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置，其特征在于所述多路數(shù)據(jù)采集模塊采用多路數(shù)據(jù)采集芯片。
5.根據(jù)權(quán)利要求Γ4任一項(xiàng)所述的一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置，其特征在于所述空氣傳導(dǎo)語音傳感器采用麥克風(fēng)，所述非空氣傳導(dǎo)語音傳感器采用喉部送話器。
專利摘要本實(shí)用新型公開一種可用于強(qiáng)噪聲環(huán)境的語音采集裝置，所述裝置包括空氣傳導(dǎo)語音傳感器、非空氣傳導(dǎo)語音傳感器、多路數(shù)據(jù)采集模塊、噪聲模型估計(jì)模塊、聯(lián)合模型修正模塊、語音增強(qiáng)模塊、聯(lián)合模型訓(xùn)練和自適應(yīng)模塊，非空氣傳導(dǎo)語音傳感器、噪聲模型估計(jì)模塊、語音增強(qiáng)模塊分別與多路數(shù)據(jù)采集模塊連接，噪聲模型估計(jì)模塊、聯(lián)合模型修正模塊、語音增強(qiáng)模塊順次連接，聯(lián)合模型訓(xùn)練和自適應(yīng)模塊與多路數(shù)據(jù)采集模塊和聯(lián)合模型修正模塊連接。本實(shí)用新型與現(xiàn)有技術(shù)相比，具有體積更小，使用更方便，抗噪聲能力更強(qiáng)，語音質(zhì)量更好等優(yōu)點(diǎn)。
文檔編號G10L25/84GK203165457SQ201320107350
公開日2013年8月28日申請日期2013年3月8日優(yōu)先權(quán)日2013年3月8日
發(fā)明者張軍, 朱穎莉, 寧更新, 馮義志, 余華, 韋崗申請人:華南理工大學(xué)

完整全部詳細(xì)技術(shù)資料下載