專利名稱:一種低功耗話音端點(diǎn)檢測(cè)模塊的制作方法
技術(shù)領(lǐng)域:
本實(shí)用新型屬于話音端點(diǎn)檢測(cè)技術(shù)領(lǐng)域,尤其是涉及一種低功耗話音端點(diǎn)檢測(cè)模 塊。
背景技術(shù):
各種話音端點(diǎn)檢測(cè)(VAD)技術(shù)的根本出發(fā)點(diǎn)都在于尋找能夠有效區(qū)分話音段與 無(wú)話音噪聲背景的統(tǒng)計(jì)判斷量,最終歸結(jié)為門限設(shè)置。目前,主要使用的傳統(tǒng)的統(tǒng)計(jì)特征量 方法包括短時(shí)能量、短時(shí)過(guò)零率、短時(shí)自相關(guān)函數(shù)、信息熵、倒譜及MEL系數(shù)等方法,不同 VAD檢測(cè)方法大多基于這幾種方法的不同組合。一般來(lái)說(shuō),單一的統(tǒng)計(jì)判斷量的檢測(cè)效果并不理想,往往僅適合某些場(chǎng)合,不同 VAD方法的適用范圍有所不同。由于不同環(huán)境下的背景噪聲變化較大,且話音隨者說(shuō)話人的 性別、年齡、語(yǔ)種、聲調(diào)、聲強(qiáng)、語(yǔ)速等變化而變化,因此,基于多統(tǒng)計(jì)量與多判決門限的聯(lián)合 判決準(zhǔn)則成為VAD檢測(cè)研究的方向,但多門限的判決往往要求處理器的處理能力比較高, 功耗比較大,對(duì)于一些處理能力較低的平臺(tái)如單片機(jī)、ARM7處理器等則無(wú)法正常運(yùn)行。
實(shí)用新型內(nèi)容本實(shí)用新型所要解決的技術(shù)問(wèn)題在于針對(duì)上述現(xiàn)有技術(shù)中的不足,提供一種低功 耗話音端點(diǎn)檢測(cè)模塊,其設(shè)計(jì)新穎合理、接線方便且使用操作簡(jiǎn)便,采用短時(shí)能量和短時(shí)過(guò) 零率相結(jié)合的方法進(jìn)行判決,減少了話音檢測(cè)過(guò)程出現(xiàn)的誤判漏判,并且運(yùn)算量少,功耗 低,適用于各種低速處理平臺(tái)。為解決上述技術(shù)問(wèn)題,本實(shí)用新型采用的技術(shù)方案是一種低功耗話音端點(diǎn)檢測(cè) 模塊,其特征在于包括話音信號(hào)檢測(cè)單元、采用短時(shí)能量與短時(shí)平均過(guò)零率相結(jié)合的特征 量統(tǒng)計(jì)方法對(duì)話音信號(hào)檢測(cè)單元所檢測(cè)的話音信號(hào)進(jìn)行話音端點(diǎn)檢測(cè)的處理器單元以及 分別與話音信號(hào)檢測(cè)單元和處理器單元相接的電源管理模塊;所述處理器單元包括由主處 理器和與主處理器相接的協(xié)處理器組成的雙核信號(hào)處理單元以及與主處理器相接的FPGA 現(xiàn)場(chǎng)可編程門陣列模塊,所述話音信號(hào)檢測(cè)單元接主處理器。所述話音信號(hào)檢測(cè)單元包括語(yǔ)音傳感器和與語(yǔ)音傳感器相接的A/D采樣電路,所 述A/D采樣電路接主處理器。還包括分別與主處理器相接的A/D轉(zhuǎn)換模塊和D/A轉(zhuǎn)換模塊。所述主處理器和協(xié)處理器為ARM處理器或DSP數(shù)字信號(hào)處理器。本實(shí)用新型與現(xiàn)有技術(shù)相比具有以下優(yōu)點(diǎn)1、設(shè)計(jì)新穎合理、接線方便且使用操作簡(jiǎn)便,智能化程度高。2、過(guò)零率算法采用雙重過(guò)零門限,減少在高噪聲背景下出現(xiàn)的虛假過(guò)零率,從而 減少話音誤判。3、運(yùn)算量少,功耗低,適用于各種低速處理平臺(tái),例如單片機(jī)、ARM7等處理平臺(tái)。4、采用短時(shí)能量和短時(shí)過(guò)零率相結(jié)合的方法進(jìn)行判決,具體是采用短時(shí)能量的統(tǒng)計(jì)特征,分清濁音段;采用短時(shí)過(guò)零率統(tǒng)計(jì)量,分清清音段,減少了話音檢測(cè)過(guò)程出現(xiàn)的誤 判漏判。5、采用實(shí)時(shí)統(tǒng)計(jì)方法,減少話音句與句之間的誤判,較少話音之間的間斷。綜上所述,本實(shí)用新型設(shè)計(jì)新穎合理、接線方便且使用操作簡(jiǎn)便,采用短時(shí)能量和 短時(shí)過(guò)零率相結(jié)合的方法進(jìn)行判決,減少了話音檢測(cè)過(guò)程出現(xiàn)的誤判漏判,并且運(yùn)算量少, 功耗低,適用于各種低速處理平臺(tái)。下面通過(guò)附圖和實(shí)施例,對(duì)本實(shí)用新型的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
圖1為本實(shí)用新型的電路原理框圖。圖2為利用本實(shí)用新型進(jìn)行話音端點(diǎn)檢測(cè)的方法流程圖。附圖標(biāo)記說(shuō)明1-話音信號(hào)檢測(cè)單元;1-1-語(yǔ)音傳感器;1-2-A/D采樣電路; 2-處理器單元;2-1-主處理器; 2-2-協(xié)處理器;2-3-FPGA現(xiàn)場(chǎng)可編程門陣列模塊;2-4-A/D轉(zhuǎn)換模塊;2-5-D/A轉(zhuǎn)換模塊;3-電源管理模塊。
具體實(shí)施方式
如圖1所示,本實(shí)用新型包括話音信號(hào)檢測(cè)單元1、采用短時(shí)能量與短時(shí)平均過(guò)零 率相結(jié)合的特征量統(tǒng)計(jì)方法對(duì)話音信號(hào)檢測(cè)單元1所檢測(cè)的話音信號(hào)進(jìn)行話音端點(diǎn)檢測(cè) 的處理器單元2以及分別與話音信號(hào)檢測(cè)單元1和處理器單元2相接的電源管理模塊3。 所述處理器單元2包括由主處理器2-1和與主處理器2-1相接的協(xié)處理器2-2組成的雙核 信號(hào)處理單元以及與主處理器2-1相接的FPGA現(xiàn)場(chǎng)可編程門陣列模塊2-3,所述話音信號(hào) 檢測(cè)單元1接主處理器2-1。本實(shí)施例中,所述話音信號(hào)檢測(cè)單元1包括語(yǔ)音傳感器1-1和與語(yǔ)音傳感器1-1 相接的A/D采樣電路1-2,所述A/D采樣電路1-2接主處理器2-1。同時(shí),本實(shí)用新型還包 括分別與主處理器2-1相接的A/D轉(zhuǎn)換模塊2-4和D/A轉(zhuǎn)換模塊2_5。實(shí)際使用過(guò)程中,所 述主處理器2-1和協(xié)處理器2-2為ARM處理器或DSP數(shù)字信號(hào)處理器,也就是說(shuō),可以選擇 相應(yīng)型號(hào)的ARM處理器或DSP數(shù)字信號(hào)處理器作為主處理器2-1和協(xié)處理器2-2,只要主處 理器2-1和協(xié)處理器2-2相結(jié)合能實(shí)現(xiàn)話音端點(diǎn)檢測(cè)功能即可。本實(shí)用新型的工作原理是由于短時(shí)平均過(guò)零率是語(yǔ)音信號(hào)時(shí) 域分析中最簡(jiǎn)單的一種特征,它是指每幀內(nèi)信號(hào)通過(guò)零值的次數(shù),定義為
n+N-\
Z Z |sgn[(xJ]-sgnK(^-l)]|在濁音段,一般具有較低的過(guò)零率;而在清音段具
丄 m=n*
有較高的過(guò)零率,這樣可以通過(guò)短時(shí)平均過(guò)零率來(lái)初步判斷并區(qū)分清音和濁音。另外,語(yǔ)音
N-\
信號(hào)的短時(shí)能量定義為-A=jyn(—而語(yǔ)音和噪聲的區(qū)別則體現(xiàn)在各自的能量上,語(yǔ)音
m=0^
段的能量比噪聲段的能量大,如果環(huán)境噪聲和系統(tǒng)輸入的噪聲比較小,只要計(jì)算輸入信號(hào) 的短時(shí)能量就能夠把語(yǔ)音段和噪聲背景區(qū)分開(kāi),除此之外,用基于能量的檢測(cè)方法來(lái)檢測(cè)
4濁音通常效果也是比較理想的,因?yàn)闈嵋舻哪芰恐当惹逡舸蟮枚?,可以判斷濁音和清音?間過(guò)渡的時(shí)刻;但基于能量的檢測(cè)方法對(duì)清音來(lái)說(shuō),檢測(cè)效果不是很好。綜上,將上述短時(shí) 平均過(guò)零率和短時(shí)能量?jī)煞N檢測(cè)方法結(jié)合起來(lái),通過(guò)短時(shí)能量分析去除高頻環(huán)境噪聲的干 擾,用短時(shí)平均過(guò)零率分析再相應(yīng)去除低頻信號(hào)的干擾,則能夠取得較好的檢測(cè)效果。結(jié)合圖2,本實(shí)用新型進(jìn)行話音端點(diǎn)檢測(cè)的過(guò)程如下首先通過(guò)處理器單元2分別 設(shè)定短時(shí)平均過(guò)零率和短時(shí)能量檢測(cè)方法中所需設(shè)定的門限值。實(shí)際檢測(cè)時(shí),話音信號(hào)檢 測(cè)單元1實(shí)時(shí)將其所檢測(cè)語(yǔ)音(或話音)信號(hào)傳送至處理器單元2 ;處理器單元2首先對(duì)所 接收的語(yǔ)音信號(hào)進(jìn)行加窗和分幀,之后計(jì)算得出分幀后語(yǔ)音信號(hào)前20幀的平均過(guò)零率(即 采用短時(shí)平均過(guò)零率分析法)和平均能量(即采用短時(shí)能量分析法)并將計(jì)算結(jié)果即實(shí)際 數(shù)值與預(yù)先設(shè)定的門限值(即初始門限)進(jìn)行比較當(dāng)比較得出實(shí)際數(shù)值小于預(yù)先設(shè)定的 門限值時(shí)則說(shuō)明初始無(wú)話音,否則對(duì)預(yù)先設(shè)定的門限值進(jìn)行修改;預(yù)先設(shè)定的門限值修改 后,處理器單元2計(jì)算得出每幀語(yǔ)音信號(hào)的過(guò)零率和能量即實(shí)際值并與修改后的門限值進(jìn) 行比較當(dāng)比較得出實(shí)際值小于修改后的門限值時(shí)說(shuō)明初步無(wú)話音且連續(xù)四幀信號(hào)均保持 無(wú)話音時(shí),說(shuō)明此時(shí)無(wú)語(yǔ)音;反之,當(dāng)比較得出實(shí)際值大于修改后的門限值時(shí)說(shuō)明初步有話 音且連續(xù)四幀信號(hào)均保持有語(yǔ)音時(shí),說(shuō)明此時(shí)有話音。以上所述,僅是本實(shí)用新型的較佳實(shí)施例,并非對(duì)本實(shí)用新型作任何限制,凡是根 據(jù)本實(shí)用新型技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何簡(jiǎn)單修改、變更以及等效結(jié)構(gòu)變化,均仍 屬于本實(shí)用新型技術(shù)方案的保護(hù)范圍內(nèi)。
權(quán)利要求一種低功耗話音端點(diǎn)檢測(cè)模塊,其特征在于包括話音信號(hào)檢測(cè)單元(1)、對(duì)話音信號(hào)檢測(cè)單元(1)所檢測(cè)的話音信號(hào)進(jìn)行話音端點(diǎn)檢測(cè)的處理器單元(2)以及分別與話音信號(hào)檢測(cè)單元(1)和處理器單元(2)相接的電源管理模塊(3);所述處理器單元(2)包括由主處理器(2 1)和與主處理器(2 1)相接的協(xié)處理器(2 2)組成的雙核信號(hào)處理單元以及與主處理器(2 1)相接的FPGA現(xiàn)場(chǎng)可編程門陣列模塊(2 3),所述話音信號(hào)檢測(cè)單元(1)接主處理器(2 1)。
2.按照權(quán)利要求1所述的一種低功耗話音端點(diǎn)檢測(cè)模塊,其特征在于所述話音信號(hào) 檢測(cè)單元(1)包括語(yǔ)音傳感器(1-1)和與語(yǔ)音傳感器(1-1)相接的A/D采樣電路(1-2),所 述A/D采樣電路(1-2)接主處理器(2-1)。
3.按照權(quán)利要求1或2所述的一種低功耗話音端點(diǎn)檢測(cè)模塊,其特征在于還包括分 別與主處理器(2-1)相接的A/D轉(zhuǎn)換模塊(2-4)和D/A轉(zhuǎn)換模塊(2_5)。
4.按照權(quán)利要求1或2所述的一種低功耗話音端點(diǎn)檢測(cè)模塊,其特征在于所述主處 理器(2-1)和協(xié)處理器(2-2)為ARM處理器或DSP數(shù)字信號(hào)處理器。
專利摘要本實(shí)用新型公開(kāi)了一種低功耗話音端點(diǎn)檢測(cè)模塊,包括話音信號(hào)檢測(cè)單元、采用短時(shí)能量與短時(shí)平均過(guò)零率相結(jié)合的特征量統(tǒng)計(jì)方法對(duì)話音信號(hào)檢測(cè)單元所檢測(cè)的話音信號(hào)進(jìn)行話音端點(diǎn)檢測(cè)的處理器單元以及分別與話音信號(hào)檢測(cè)單元和處理器單元相接的電源管理模塊;所述處理器單元包括由主處理器和與主處理器相接的協(xié)處理器組成的雙核信號(hào)處理單元以及與主處理器相接的FPGA現(xiàn)場(chǎng)可編程門陣列模塊,所述話音信號(hào)檢測(cè)單元接主處理器。本實(shí)用新型設(shè)計(jì)新穎合理、接線方便且使用操作簡(jiǎn)便,采用短時(shí)能量和短時(shí)過(guò)零率相結(jié)合的方法進(jìn)行判決,減少了話音檢測(cè)過(guò)程出現(xiàn)的誤判漏判,并且運(yùn)算量少,功耗低,適用于各種低速處理平臺(tái)。
文檔編號(hào)G10L21/02GK201765819SQ20102010121
公開(kāi)日2011年3月16日 申請(qǐng)日期2010年1月22日 優(yōu)先權(quán)日2010年1月22日
發(fā)明者張凡, 張勛勛, 曹軍勤, 楊勇, 楊森, 梁峰 申請(qǐng)人:西安烽火電子科技有限責(zé)任公司