一種低功耗話音端點(diǎn)檢測(cè)模塊的制作方法

文檔序號(hào)：2824052閱讀：335來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：一種低功耗話音端點(diǎn)檢測(cè)模塊的制作方法
技術(shù)領(lǐng)域：
本實(shí)用新型屬于話音端點(diǎn)檢測(cè)技術(shù)領(lǐng)域，尤其是涉及一種低功耗話音端點(diǎn)檢測(cè)模塊。
背景技術(shù)：
各種話音端點(diǎn)檢測(cè)(VAD)技術(shù)的根本出發(fā)點(diǎn)都在于尋找能夠有效區(qū)分話音段與無(wú)話音噪聲背景的統(tǒng)計(jì)判斷量，最終歸結(jié)為門限設(shè)置。目前，主要使用的傳統(tǒng)的統(tǒng)計(jì)特征量方法包括短時(shí)能量、短時(shí)過(guò)零率、短時(shí)自相關(guān)函數(shù)、信息熵、倒譜及MEL系數(shù)等方法，不同 VAD檢測(cè)方法大多基于這幾種方法的不同組合。一般來(lái)說(shuō)，單一的統(tǒng)計(jì)判斷量的檢測(cè)效果并不理想，往往僅適合某些場(chǎng)合，不同 VAD方法的適用范圍有所不同。由于不同環(huán)境下的背景噪聲變化較大，且話音隨者說(shuō)話人的性別、年齡、語(yǔ)種、聲調(diào)、聲強(qiáng)、語(yǔ)速等變化而變化，因此，基于多統(tǒng)計(jì)量與多判決門限的聯(lián)合判決準(zhǔn)則成為VAD檢測(cè)研究的方向，但多門限的判決往往要求處理器的處理能力比較高，功耗比較大，對(duì)于一些處理能力較低的平臺(tái)如單片機(jī)、ARM7處理器等則無(wú)法正常運(yùn)行。

實(shí)用新型內(nèi)容本實(shí)用新型所要解決的技術(shù)問(wèn)題在于針對(duì)上述現(xiàn)有技術(shù)中的不足，提供一種低功耗話音端點(diǎn)檢測(cè)模塊，其設(shè)計(jì)新穎合理、接線方便且使用操作簡(jiǎn)便，采用短時(shí)能量和短時(shí)過(guò) 零率相結(jié)合的方法進(jìn)行判決，減少了話音檢測(cè)過(guò)程出現(xiàn)的誤判漏判，并且運(yùn)算量少，功耗低，適用于各種低速處理平臺(tái)。為解決上述技術(shù)問(wèn)題，本實(shí)用新型采用的技術(shù)方案是一種低功耗話音端點(diǎn)檢測(cè) 模塊，其特征在于包括話音信號(hào)檢測(cè)單元、采用短時(shí)能量與短時(shí)平均過(guò)零率相結(jié)合的特征量統(tǒng)計(jì)方法對(duì)話音信號(hào)檢測(cè)單元所檢測(cè)的話音信號(hào)進(jìn)行話音端點(diǎn)檢測(cè)的處理器單元以及分別與話音信號(hào)檢測(cè)單元和處理器單元相接的電源管理模塊；所述處理器單元包括由主處理器和與主處理器相接的協(xié)處理器組成的雙核信號(hào)處理單元以及與主處理器相接的FPGA 現(xiàn)場(chǎng)可編程門陣列模塊，所述話音信號(hào)檢測(cè)單元接主處理器。所述話音信號(hào)檢測(cè)單元包括語(yǔ)音傳感器和與語(yǔ)音傳感器相接的A/D采樣電路，所述A/D采樣電路接主處理器。還包括分別與主處理器相接的A/D轉(zhuǎn)換模塊和D/A轉(zhuǎn)換模塊。所述主處理器和協(xié)處理器為ARM處理器或DSP數(shù)字信號(hào)處理器。本實(shí)用新型與現(xiàn)有技術(shù)相比具有以下優(yōu)點(diǎn)1、設(shè)計(jì)新穎合理、接線方便且使用操作簡(jiǎn)便，智能化程度高。2、過(guò)零率算法采用雙重過(guò)零門限，減少在高噪聲背景下出現(xiàn)的虛假過(guò)零率，從而減少話音誤判。3、運(yùn)算量少，功耗低，適用于各種低速處理平臺(tái)，例如單片機(jī)、ARM7等處理平臺(tái)。4、采用短時(shí)能量和短時(shí)過(guò)零率相結(jié)合的方法進(jìn)行判決，具體是采用短時(shí)能量的統(tǒng)計(jì)特征，分清濁音段；采用短時(shí)過(guò)零率統(tǒng)計(jì)量，分清清音段，減少了話音檢測(cè)過(guò)程出現(xiàn)的誤判漏判。5、采用實(shí)時(shí)統(tǒng)計(jì)方法，減少話音句與句之間的誤判，較少話音之間的間斷。綜上所述，本實(shí)用新型設(shè)計(jì)新穎合理、接線方便且使用操作簡(jiǎn)便，采用短時(shí)能量和短時(shí)過(guò)零率相結(jié)合的方法進(jìn)行判決，減少了話音檢測(cè)過(guò)程出現(xiàn)的誤判漏判，并且運(yùn)算量少，功耗低，適用于各種低速處理平臺(tái)。下面通過(guò)附圖和實(shí)施例，對(duì)本實(shí)用新型的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
圖1為本實(shí)用新型的電路原理框圖。圖2為利用本實(shí)用新型進(jìn)行話音端點(diǎn)檢測(cè)的方法流程圖。附圖標(biāo)記說(shuō)明1-話音信號(hào)檢測(cè)單元；1-1-語(yǔ)音傳感器；1-2-A/D采樣電路； 2-處理器單元；2-1-主處理器； 2-2-協(xié)處理器；2-3-FPGA現(xiàn)場(chǎng)可編程門陣列模塊；2-4-A/D轉(zhuǎn)換模塊；2-5-D/A轉(zhuǎn)換模塊；3-電源管理模塊。
具體實(shí)施方式
如圖1所示，本實(shí)用新型包括話音信號(hào)檢測(cè)單元1、采用短時(shí)能量與短時(shí)平均過(guò)零率相結(jié)合的特征量統(tǒng)計(jì)方法對(duì)話音信號(hào)檢測(cè)單元1所檢測(cè)的話音信號(hào)進(jìn)行話音端點(diǎn)檢測(cè) 的處理器單元2以及分別與話音信號(hào)檢測(cè)單元1和處理器單元2相接的電源管理模塊3。所述處理器單元2包括由主處理器2-1和與主處理器2-1相接的協(xié)處理器2-2組成的雙核信號(hào)處理單元以及與主處理器2-1相接的FPGA現(xiàn)場(chǎng)可編程門陣列模塊2-3，所述話音信號(hào) 檢測(cè)單元1接主處理器2-1。本實(shí)施例中，所述話音信號(hào)檢測(cè)單元1包括語(yǔ)音傳感器1-1和與語(yǔ)音傳感器1-1 相接的A/D采樣電路1-2，所述A/D采樣電路1-2接主處理器2-1。同時(shí)，本實(shí)用新型還包括分別與主處理器2-1相接的A/D轉(zhuǎn)換模塊2-4和D/A轉(zhuǎn)換模塊2_5。實(shí)際使用過(guò)程中，所述主處理器2-1和協(xié)處理器2-2為ARM處理器或DSP數(shù)字信號(hào)處理器，也就是說(shuō)，可以選擇相應(yīng)型號(hào)的ARM處理器或DSP數(shù)字信號(hào)處理器作為主處理器2-1和協(xié)處理器2-2，只要主處理器2-1和協(xié)處理器2-2相結(jié)合能實(shí)現(xiàn)話音端點(diǎn)檢測(cè)功能即可。本實(shí)用新型的工作原理是由于短時(shí)平均過(guò)零率是語(yǔ)音信號(hào)時(shí) 域分析中最簡(jiǎn)單的一種特征，它是指每幀內(nèi)信號(hào)通過(guò)零值的次數(shù)，定義為
n+N-\
Z Z |sgn[(xJ]-sgnK(^-l)]|在濁音段，一般具有較低的過(guò)零率；而在清音段具
丄 m=n*
有較高的過(guò)零率，這樣可以通過(guò)短時(shí)平均過(guò)零率來(lái)初步判斷并區(qū)分清音和濁音。另外，語(yǔ)音
N-\
信號(hào)的短時(shí)能量定義為-A=jyn(—而語(yǔ)音和噪聲的區(qū)別則體現(xiàn)在各自的能量上，語(yǔ)音
m=0^
段的能量比噪聲段的能量大，如果環(huán)境噪聲和系統(tǒng)輸入的噪聲比較小，只要計(jì)算輸入信號(hào) 的短時(shí)能量就能夠把語(yǔ)音段和噪聲背景區(qū)分開(kāi)，除此之外，用基于能量的檢測(cè)方法來(lái)檢測(cè)
4濁音通常效果也是比較理想的，因?yàn)闈嵋舻哪芰恐当惹逡舸蟮枚?，可以判斷濁音和清音?間過(guò)渡的時(shí)刻；但基于能量的檢測(cè)方法對(duì)清音來(lái)說(shuō)，檢測(cè)效果不是很好。綜上，將上述短時(shí) 平均過(guò)零率和短時(shí)能量?jī)煞N檢測(cè)方法結(jié)合起來(lái)，通過(guò)短時(shí)能量分析去除高頻環(huán)境噪聲的干擾，用短時(shí)平均過(guò)零率分析再相應(yīng)去除低頻信號(hào)的干擾，則能夠取得較好的檢測(cè)效果。結(jié)合圖2，本實(shí)用新型進(jìn)行話音端點(diǎn)檢測(cè)的過(guò)程如下首先通過(guò)處理器單元2分別設(shè)定短時(shí)平均過(guò)零率和短時(shí)能量檢測(cè)方法中所需設(shè)定的門限值。實(shí)際檢測(cè)時(shí)，話音信號(hào)檢測(cè)單元1實(shí)時(shí)將其所檢測(cè)語(yǔ)音(或話音)信號(hào)傳送至處理器單元2 ；處理器單元2首先對(duì)所接收的語(yǔ)音信號(hào)進(jìn)行加窗和分幀，之后計(jì)算得出分幀后語(yǔ)音信號(hào)前20幀的平均過(guò)零率(即采用短時(shí)平均過(guò)零率分析法)和平均能量(即采用短時(shí)能量分析法)并將計(jì)算結(jié)果即實(shí)際數(shù)值與預(yù)先設(shè)定的門限值(即初始門限)進(jìn)行比較當(dāng)比較得出實(shí)際數(shù)值小于預(yù)先設(shè)定的門限值時(shí)則說(shuō)明初始無(wú)話音，否則對(duì)預(yù)先設(shè)定的門限值進(jìn)行修改；預(yù)先設(shè)定的門限值修改后，處理器單元2計(jì)算得出每幀語(yǔ)音信號(hào)的過(guò)零率和能量即實(shí)際值并與修改后的門限值進(jìn) 行比較當(dāng)比較得出實(shí)際值小于修改后的門限值時(shí)說(shuō)明初步無(wú)話音且連續(xù)四幀信號(hào)均保持無(wú)話音時(shí)，說(shuō)明此時(shí)無(wú)語(yǔ)音；反之，當(dāng)比較得出實(shí)際值大于修改后的門限值時(shí)說(shuō)明初步有話音且連續(xù)四幀信號(hào)均保持有語(yǔ)音時(shí)，說(shuō)明此時(shí)有話音。以上所述，僅是本實(shí)用新型的較佳實(shí)施例，并非對(duì)本實(shí)用新型作任何限制，凡是根據(jù)本實(shí)用新型技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何簡(jiǎn)單修改、變更以及等效結(jié)構(gòu)變化，均仍屬于本實(shí)用新型技術(shù)方案的保護(hù)范圍內(nèi)。
權(quán)利要求一種低功耗話音端點(diǎn)檢測(cè)模塊，其特征在于包括話音信號(hào)檢測(cè)單元(1)、對(duì)話音信號(hào)檢測(cè)單元(1)所檢測(cè)的話音信號(hào)進(jìn)行話音端點(diǎn)檢測(cè)的處理器單元(2)以及分別與話音信號(hào)檢測(cè)單元(1)和處理器單元(2)相接的電源管理模塊(3)；所述處理器單元(2)包括由主處理器(2 1)和與主處理器(2 1)相接的協(xié)處理器(2 2)組成的雙核信號(hào)處理單元以及與主處理器(2 1)相接的FPGA現(xiàn)場(chǎng)可編程門陣列模塊(2 3)，所述話音信號(hào)檢測(cè)單元(1)接主處理器(2 1)。
2.按照權(quán)利要求1所述的一種低功耗話音端點(diǎn)檢測(cè)模塊，其特征在于所述話音信號(hào) 檢測(cè)單元(1)包括語(yǔ)音傳感器(1-1)和與語(yǔ)音傳感器(1-1)相接的A/D采樣電路(1-2)，所述A/D采樣電路(1-2)接主處理器(2-1)。
3.按照權(quán)利要求1或2所述的一種低功耗話音端點(diǎn)檢測(cè)模塊，其特征在于還包括分別與主處理器(2-1)相接的A/D轉(zhuǎn)換模塊(2-4)和D/A轉(zhuǎn)換模塊(2_5)。
4.按照權(quán)利要求1或2所述的一種低功耗話音端點(diǎn)檢測(cè)模塊，其特征在于所述主處理器(2-1)和協(xié)處理器(2-2)為ARM處理器或DSP數(shù)字信號(hào)處理器。
專利摘要本實(shí)用新型公開(kāi)了一種低功耗話音端點(diǎn)檢測(cè)模塊，包括話音信號(hào)檢測(cè)單元、采用短時(shí)能量與短時(shí)平均過(guò)零率相結(jié)合的特征量統(tǒng)計(jì)方法對(duì)話音信號(hào)檢測(cè)單元所檢測(cè)的話音信號(hào)進(jìn)行話音端點(diǎn)檢測(cè)的處理器單元以及分別與話音信號(hào)檢測(cè)單元和處理器單元相接的電源管理模塊；所述處理器單元包括由主處理器和與主處理器相接的協(xié)處理器組成的雙核信號(hào)處理單元以及與主處理器相接的FPGA現(xiàn)場(chǎng)可編程門陣列模塊，所述話音信號(hào)檢測(cè)單元接主處理器。本實(shí)用新型設(shè)計(jì)新穎合理、接線方便且使用操作簡(jiǎn)便，采用短時(shí)能量和短時(shí)過(guò)零率相結(jié)合的方法進(jìn)行判決，減少了話音檢測(cè)過(guò)程出現(xiàn)的誤判漏判，并且運(yùn)算量少，功耗低，適用于各種低速處理平臺(tái)。
文檔編號(hào)G10L21/02GK201765819SQ20102010121
公開(kāi)日2011年3月16日申請(qǐng)日期2010年1月22日優(yōu)先權(quán)日2010年1月22日
發(fā)明者張凡, 張勛勛, 曹軍勤, 楊勇, 楊森, 梁峰申請(qǐng)人:西安烽火電子科技有限責(zé)任公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：梁峰;楊勇;張凡;曹軍勤;楊森;張勛勛
技術(shù)所有人：西安烽火電子科技有限責(zé)任公司
我是此專利的發(fā)明人

上一篇：語(yǔ)音控制轉(zhuǎn)接頭的制作方法
上一篇：智能語(yǔ)音自動(dòng)點(diǎn)歌機(jī)的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

語(yǔ)音端點(diǎn)檢測(cè)相關(guān)技術(shù)

語(yǔ)音信號(hào)端點(diǎn)檢測(cè)相關(guān)技術(shù)

語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)相關(guān)技術(shù)

語(yǔ)音端點(diǎn)檢測(cè)算法相關(guān)技術(shù)

python語(yǔ)音端點(diǎn)檢測(cè)相關(guān)技術(shù)

語(yǔ)音端點(diǎn)檢測(cè)實(shí)驗(yàn)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種低功耗話音端點(diǎn)檢測(cè)模塊的制作方法