一種公共場所異常聲音特征提取方法【專利摘要】本發(fā)明涉及公共場所異常聲音特征提取方法,屬音頻信號處理【
技術(shù)領(lǐng)域:
】。方法采用基于T分布的隨機(jī)噪聲代替原始的總體局部均值分解模型中的高斯白噪聲,推導(dǎo)出基于T分布的總體局部均值分解模型(TD-ELMD)。并利用TD-ELMD模型分解公共場所異常聲音信號,得到一系列從低頻到高頻的乘積函數(shù)(PFi)。并將各階PFi的能量與原始信號的總能量之比作為公共場所異常聲音特征向量。最后輸入支持向量機(jī)(SVM)分類器進(jìn)行分類識別。本發(fā)明提出的TD-ELMD模型更能夠反映公共場所異常聲音信號的特點(diǎn),與目前常用的提取方法相比,其特征描述能力更強(qiáng),對公共場所異常聲音的識別具有更好的魯棒性?!緦@f明】一種公共場所異常聲音特征提取方法【
技術(shù)領(lǐng)域:
】[0001]本發(fā)明屬于音頻信號特征提取及模式識別【
技術(shù)領(lǐng)域:
】?!?br>背景技術(shù):
】[0002]公共場所是指公眾從事社會(huì)生活的各種場所如廣場、車站、學(xué)校等。公共場所中所發(fā)生的各種異常事件、犯罪事件等都與人們的生命財(cái)產(chǎn)與安全息息相關(guān)。目前,公共場所安全監(jiān)視主要以視頻監(jiān)視平臺(tái)為核心,大多還沒有音頻監(jiān)控功能。由于大多數(shù)公共場合所發(fā)生的異常事件都伴隨有異常聲音的產(chǎn)生如槍聲、爆炸聲、玻璃破碎聲、尖叫聲等。異常聲音的產(chǎn)生表明異常事件已發(fā)生或即將發(fā)生。通過音頻監(jiān)控技術(shù)彌補(bǔ)視頻監(jiān)控平臺(tái)的不足,已成為公共場所安全監(jiān)控的發(fā)展方向。由于音頻監(jiān)控領(lǐng)域相關(guān)理論與技術(shù)的缺乏,使得公共場所音頻監(jiān)控系統(tǒng)幾乎為空白??梢姡瑢矆鏊惓B曇籼卣魈崛∠嚓P(guān)領(lǐng)域的理論及關(guān)鍵技術(shù)的研究具有重要的意義?!?br/>發(fā)明內(nèi)容】[0003]本發(fā)明的目的在于提出一種適用于公共場所異常聲音的特征提取方法,旨在解決公共場所異常聲音特征提取中關(guān)鍵的理論及技術(shù)問題,即一是公共場所背景噪聲建模問題;二是公共場所異常聲音的特征提取問題。[0004]對于公共場所背景噪聲建模問題:公共場所如廣場、車站、校園的背景情況很復(fù)雜,噪聲很大,有時(shí)噪聲甚至?xí)蜎]待研究的信號。要解決公共場所異常聲音特征提取的核心問題,首先需要獲得公共場所背景噪聲分布模型。我們知道,公共場所背景噪聲為自然信號,往往存在一些大氣噪聲、人為噪聲如汽車鳴笛聲、腳步聲等脈沖噪聲的干擾。公共場所背景噪聲具有較為明顯的脈沖特性,其統(tǒng)計(jì)密度函數(shù)具有長拖尾現(xiàn)象。目前業(yè)界還沒有有效的理論分析結(jié)果,研究人員均將公共場所背景噪聲假設(shè)為高斯分布。為了獲得適當(dāng)?shù)墓矆鏊尘霸肼暷P?,本發(fā)明提出通過KoImogorov-Smirnov(K-S)假設(shè)檢驗(yàn)對目前現(xiàn)有的幾種公共場所噪聲假設(shè)模型進(jìn)行擬合優(yōu)度分析。根據(jù)K-S假設(shè)檢驗(yàn)得到公共場所背景噪聲模型為T分布,用T分布來描述公共場所背景噪聲較傳統(tǒng)的高斯分布和SaS分布更為合理。[0005]對于公共場所異常聲音特征提取:目前異常聲音的特征提取方法大多沿用傳統(tǒng)的語音信號處理方法如mel頻率倒譜系數(shù)(Melfrequencycepstrumcoefficient,MFCC)、線性預(yù)測倒譜參數(shù)(Linearpredictivecepstralcoding,LPCC)。而公共場所異常聲音不僅包含語音信號如尖叫聲,還包括非語音信號如爆炸聲、槍聲等。由于公共場所異常聲音信號的基頻頻率分散,信號能量在不同寬度的頻率域集中分布,同時(shí)在整個(gè)頻率域呈現(xiàn)非均勻分布的特點(diǎn),上述傳統(tǒng)方法對異常聲音的特征描述能力有限。目前大多數(shù)研究人員采用各類特征融合策略來增強(qiáng)對異常聲音特征的表征力。但從原理上看,各類融合方法仍然不能從根本上解決非語音信號特征提取的問題。本發(fā)明通過對目前非平穩(wěn)、非線性信號處理領(lǐng)域新理論、新方法的分析,并充分考慮公共場合背景噪聲對異常聲音特征提取的影響,提出一種新的公共場所異常聲音特征提取方法,即基于T分布的總體局部均值分解(Basedonensemblelocalmeandecomposition,TD-ELMD)方法,將其用于公共場所異常聲音的特征描述。[0006]基于以上分析,本發(fā)明提出的公共場所異常聲音特征提取方法包括公共場所背景噪聲建模與公共場所異常聲音特征提取兩個(gè)步驟;[0007]步驟1:所述公共場所背景噪聲建模,是使用自由度為V的T分布來描述公共場所背景噪聲,將自由度為ν的T分布隨機(jī)數(shù)據(jù)替代原始總體局部均值分解(ELMD)中的高斯白噪聲,得到基于T分布的總體局部均值分解(TD-ELMD)模型;[0008]步驟2:公共場所異常聲音特征提取,是利用TD-ELMD模型將公共場所異常聲音信號分解為若干階瞬時(shí)頻率的乘積函數(shù)(PFi)分量;用PFi分量的能量與異常聲音信號總能量相比作為公共場所異常聲音特征向量;最后,將該特征向量輸入支持向量機(jī)(SVM)進(jìn)行分類識別。[0009]所述步驟I中基于T分布的總體局部均值分解(TD-ELMD)模型為:[0010]y][―y]PFipjt)]+—y,m{t)p=\ni^lnr-1[0011]其中:X(t)為待分析的信號,PFp(t)是分解出來的乘積函數(shù),U(t)是殘余量,表的是一組PF分量的個(gè)數(shù),P為序號;n代表的是每一個(gè)PF是由η次添加不同的服從T分布的噪聲序列到原始信號進(jìn)行TD-ELMD分解,在同一位置得到的PF分量的個(gè)數(shù),即每個(gè)PFp(t)的個(gè)數(shù),在這里對同一位置的PFp(t)分量進(jìn)行求平均,即對η個(gè)PFp(t)分量進(jìn)行求平均作為每個(gè)位置的最終PFp(t)分量,這里i是序號;同樣,對Ui(t),由于每次TD-ELMD分解只會(huì)得到一個(gè)殘余量u(t),所以,這里是將η次添加不同的服從T分布的噪聲序列到原始信號進(jìn)行TD-ELMD得到的η個(gè)u(t)進(jìn)行求平均作為最終的u(t)。[0012]所述步驟2的公共場所異常聲音特征提取的具體實(shí)現(xiàn)步驟如下:[0013]步驟2.1:用TD-ELMD模型將公共場所異常聲音信號即原始異常聲音信號分解成若干階PFi分量。[0014]步驟2.2:求出各階PFi分量的能量EijN-1[0015]Ei=-YjArEi[0016]其中,Ai是PFi分量的幅值,N是待分析信號的長度,i是PF分量的階數(shù)。[0017]步驟2.3:計(jì)算各階PFi分量的能量Ei和原始異常聲音信號的能量E的比h二I,L生成原始異常聲音信號的特征向量,h則為異常聲音信號的特征量。[0018]步驟2.4:將匕歸一化后的公共場所異常聲音特征向量輸入SVM分類器,則可得到公共場所異常聲音分類識別結(jié)果。[0019]本發(fā)明的優(yōu)點(diǎn)在于:[0020]1、本發(fā)明充分考慮公共場所背景噪聲對公共場所異常聲音特征提取方法的影響,從理論上分析得到的T分布比傳統(tǒng)的高斯分布更能反映公共場所背景噪聲的實(shí)際情況,提出的TD-ELMD模型更能夠反映公共場所異常聲音信號的特點(diǎn)。[0021]2、用服從T分布的公共場所背景噪聲代替原始ELMD方法中的高斯白噪聲,建立了一種更加適合于公共場所環(huán)境的異常聲音特征描述模型(TD-ELMD)。提出的將TD-ELMD分解得到的公共場所異常聲音各瞬時(shí)頻率的PFi的能量與異常聲音信號總能量之比作為公共場所異常聲音特征向量,簡單有效。[0022]3、本發(fā)明方法通過實(shí)驗(yàn)驗(yàn)證,優(yōu)于傳統(tǒng)的基于語音信號處理的特征提取方法,其特征描述能力更強(qiáng),對公共場所異常聲音的識別具有更好的魯棒性。【專利附圖】【附圖說明】[0023]圖1:基于K-S假設(shè)檢驗(yàn)的公共場所背景噪聲分布檢驗(yàn)流程框圖;[0024]圖2:本發(fā)明提出TD-LMD模型用于分解公共場所異常聲音得到的各階PFi結(jié)果圖;[0025]圖3:本發(fā)明提出的公共場所異常聲音特征提取及識別流程框圖;[0026]圖4:本發(fā)明與幾種典型語音信號特征提取方法的接受者操作特征曲線(Receiveroperatingcharacteristic,ROC)圖。其中,LPCC為線性預(yù)測倒譜系數(shù),EEMD為總體經(jīng)驗(yàn)?zāi)J椒纸夥椒?,aEEMD為本發(fā)明人前期提出的基于SaS分布的總體經(jīng)驗(yàn)?zāi)B(tài)分解方法,ELMD為總體局部均值分解方法,TD-ELMD為本發(fā)明提出的基于T分布的總體局部均值分解方法?!揪唧w實(shí)施方式】[0027]以下結(jié)合附圖進(jìn)一步詳細(xì)闡述本發(fā)明:[0028]本發(fā)明提出的公共場所異常聲音特征提取流程框圖如圖1所示,主要內(nèi)容為兩部分:公共場所背景噪聲建模與公共場所異常聲音特征提取。[0029]一、公共場所背景噪聲建模:是使用自由度為V的T分布來描述公共場所背景噪聲,將自由度為ν的T分布隨機(jī)數(shù)據(jù)替代原始總體局部均值分解(ELMD)中的高斯白噪聲,得到基于T分布的總體局部均值分解(TD-ELMD)模型。[0030](一)本發(fā)明使用自由度為V的T分布來描述公共場所背景噪聲是基于以下研究:[0031]首先假設(shè)公共場所背景噪聲模型為T分布、高斯分布和對稱a穩(wěn)定分布(Symmetricalphastable,SaS)分布。然后采用K_S假設(shè)檢驗(yàn)方法對這三種假設(shè)進(jìn)行擬合優(yōu)度分析,得出公共場所噪聲用自由度為ν的T分布來描述更為合理的結(jié)論。具體方法為:[0032](I)采集幾種典型的公共場所背景噪聲數(shù)據(jù),地點(diǎn)如廣場、車站及學(xué)校、時(shí)段如早、中、晚。[0033](2)將噪聲數(shù)據(jù)進(jìn)行預(yù)處理,分幀,得到時(shí)長為Is的聲音信號。分組得到N組公共場所背景噪聲數(shù)據(jù)。如每組噪聲錄制時(shí)間為3分鐘,將每組噪聲信號分幀得100組時(shí)長為Is的噪聲信號,組成若干小組噪聲數(shù)據(jù),最后合并為N組噪聲數(shù)據(jù)。[0034]將需要判斷的分布f\,f2,…,4如T分布、高斯分布、SaS分布作為參考分布,將預(yù)處理后的噪聲作為樣本。采用K-S假設(shè)檢驗(yàn)進(jìn)行擬合優(yōu)度分析。其基本原理為:比較樣本與參考分布之間的累積分布函數(shù)之間的最大差距,由此判斷樣本是否服從該參考分布。當(dāng)這個(gè)差距足夠小時(shí),則可認(rèn)為樣本是來自參考分布,反之,則認(rèn)為樣本不是來自參考分布。[0035]K-S假設(shè)檢驗(yàn)定義如下:[0036]H0:樣本服從指定的分布;[0037]H1:樣本并不服從指定的分布;[0038]統(tǒng)計(jì)量:D=max|Fn(x)-F0(χ)[0039]其中,F(xiàn)tl(X)表示理論分布的分布函數(shù),F(xiàn)n(X)表示一組隨機(jī)樣本的累計(jì)頻率函數(shù)。D(η,α)是顯著水平為α樣本容量為η時(shí)的拒絕臨界值。[0040]當(dāng)統(tǒng)計(jì)量D>D(η,α),則拒絕Htl,反之則接受Htl假設(shè)。[0041]Α、對假設(shè)的η個(gè)分布,采用K-S假設(shè)檢驗(yàn)對N組噪聲數(shù)據(jù)進(jìn)行擬合優(yōu)度分析,可得至Ijη個(gè)分布各自在N組數(shù)據(jù)中服從相應(yīng)分布的數(shù)據(jù)量Iii1,m2,…,mk,…,!!^。[0042]B、將mi,m2,…,mk,…,mn分別除以N,得到N個(gè)數(shù)據(jù)服從η個(gè)分布的概率Pl,P2,…,Pk,…,Pn.°[0043]C、比較Pl,p2,…,pk,…,Pn值的大小,就可判斷出適合于該原始噪聲數(shù)據(jù)的分布。[0044]公共場所背景噪聲的K-S假設(shè)檢驗(yàn)流程如圖2所示,其檢驗(yàn)結(jié)果如表1所示。根據(jù)表1,本發(fā)明認(rèn)為公共場所背景噪聲用T分布來描述更合理。[0045]表1不同假設(shè)分布噪聲數(shù)據(jù)的K-S假設(shè)檢驗(yàn)的接受率(%)(顯著度為0.05)【權(quán)利要求】1.一種公共場所異常聲音特征提取方法,包括公共場所背景噪聲建模與公共場所異常聲音特征提取兩個(gè)步驟;步驟1:所述公共場所背景噪聲建模,是使用自由度為V的T分布來描述公共場所背景噪聲,將自由度為ν的T分布隨機(jī)數(shù)據(jù)替代原始總體局部均值分解(ELMD)中的高斯白噪聲,得到基于T分布的總體局部均值分解(TD-ELMD)模型;步驟2:公共場所異常聲音特征提取,是利用TD-ELMD模型將公共場所異常聲音信號分解為若干階瞬時(shí)頻率的乘積函數(shù)(PFi)分量;用PFi分量的能量與異常聲音信號總能量相比作為公共場所異常聲音特征向量;最后,將該特征向量輸入支持向量機(jī)(SVM)進(jìn)行分類識別。2.根據(jù)權(quán)利要求1所述的公共場所異常聲音特征提取方法,其特征在于:所述步驟I的所述基于T分布的總體局部均值分解(TD-ELMD)模型為:3.根據(jù)權(quán)利要求2的公共場所異常聲音特征提取方法,其特征在于:所述步驟2的公共場所異常聲音特征提取的具體實(shí)現(xiàn)步驟如下:步驟2.1:用TD-ELMD模型將公共場所異常聲音信號即原始異常聲音信號分解成若干階PFi分量;步驟2.2:求出各階PFi分量的能量Ei4.根據(jù)權(quán)利要求3的公共場所異常聲音特征提取方法,其特征在于:所述自由度v=15的T分布描述公共場所噪聲比較恰當(dāng)。【文檔編號】G10L15/06GK103730109SQ201410016150【公開日】2014年4月16日申請日期:2014年1月14日優(yōu)先權(quán)日:2014年1月14日【發(fā)明者】李偉紅,李淵,龔衛(wèi)國申請人:重慶大學(xué)