1.一種噪聲檢測(cè)方法,其特征在于,包括:
獲取待處理的音頻信號(hào),計(jì)算所述音頻信號(hào)中音頻幀的功率譜Spectrum(ω);所述ω為2π*功率譜的頻率;
依據(jù)所述音頻幀的功率譜計(jì)算類自相關(guān)譜Corr(τ),所述τ為時(shí)間值;
依據(jù)所述自相關(guān)譜Corr(τ)計(jì)算增強(qiáng)相關(guān)譜Ecorr(τ);
獲取所述Ecorr(τ)中的最大值Max(ECorr),若連續(xù)預(yù)定個(gè)數(shù)的音頻幀的Max(ECorr)均小于第一閾值,則確定所述音頻幀為噪聲,所述第一閾值為增強(qiáng)相關(guān)譜的閾值;
或者,獲取所述Max(ECorr)對(duì)應(yīng)的τ,若所述Max(ECorr)對(duì)應(yīng)的τ不在預(yù)設(shè)閾值范圍,則確定所述音頻幀為噪聲,所述預(yù)設(shè)閾值范圍為預(yù)設(shè)的時(shí)間范圍。
2.根據(jù)權(quán)利要求1所述方法,其特征在于,所述依據(jù)所述自相關(guān)譜Corr(τ)計(jì)算增強(qiáng)相關(guān)譜Ecorr(τ)包括:
將所述Corr(τ)中小于0的值賦值為0然后計(jì)算增強(qiáng)譜eCorr(τ);
將所述eCorr(τ)中小于0的值賦值為0,得到增強(qiáng)相關(guān)譜Ecorr(τ)。
3.根據(jù)權(quán)利要求2所述方法,其特征在于,所述計(jì)算增強(qiáng)譜eCorr(τ)包括:
依據(jù)eCorr(τ)=Corr(τ)-Corr(τ/2)計(jì)算所述eCorr(τ),若τ為奇數(shù),所述Corr(τ/2)由鄰近點(diǎn)插值得到。
4.根據(jù)權(quán)利要求1所述方法,其特征在于,所述依據(jù)所述音頻幀的功率譜計(jì)算類自相關(guān)譜Corr(τ)包括:
計(jì)算所述Spectrum(ω)的頻點(diǎn)的三次方根,并對(duì)所述Spectrum(ω)的頻點(diǎn)的三次方根作快速傅里葉變換取實(shí)部,得到所述Corr(τ)。
5.根據(jù)權(quán)利要求1至4任意一項(xiàng)所述方法,其特征在于,在所述確定所述音頻幀為噪聲之前,所述方法還包括:
計(jì)算所述音頻幀的幅度譜S與噪聲譜N的幅度譜的平均距離d,d=20(log10(S)-log10(N));若所述d小于第二閾值且連續(xù)預(yù)定個(gè)數(shù)的音頻幀的Max(ECorr)均小于所述第一閾值,或者,若所述d小于所述第二閾值且所述Max(ECorr)對(duì)應(yīng)的τ不在預(yù)設(shè)閾值范圍,則確定所述音頻幀為噪聲,所述預(yù)設(shè)閾值范圍為預(yù)設(shè)的時(shí)間范圍。
6.根據(jù)權(quán)利要求5所述方法,其特征在于,所述方法還包括:
若確定所述音頻幀為噪聲,則采用窗口平均的方式確定新噪聲譜。
7.根據(jù)權(quán)利要求6所述方法,其特征在于,在所述確定新噪聲譜之后,所述方法還包括:
使用所述新噪聲譜對(duì)所述音頻信號(hào)的音頻幀進(jìn)行維納濾波。
8.根據(jù)權(quán)利要求1至4任意一項(xiàng)所述方法,其特征在于,所述方法還包括:
若所述音頻幀未確定為噪聲,則確定所述音頻幀為人聲或者音樂。
9.根據(jù)權(quán)利要求8所述方法,其特征在于,在所述確定所述音頻幀為人聲或者音樂之前,所述方法還包括:
若所述d大于所述第二閾值且若所述音頻幀未確定為噪聲,則確定所述音頻幀為人聲或者音樂。
10.根據(jù)權(quán)利要求9所述方法,其特征在于,所述方法還包括:
若未確定所述音頻幀為人聲或者音樂,則采用窗口平均的方式使用所述音頻幀的Ecorr(τ)更新所述第一閾值。
11.一種噪聲檢測(cè)裝置,其特征在于,包括:
信號(hào)獲取單元,用于獲取待處理的音頻信號(hào);
計(jì)算單元,用于計(jì)算所述音頻信號(hào)中音頻幀的功率譜Spectrum(ω);所述ω為2π*功率譜的頻率;依據(jù)所述音頻幀的功率譜計(jì)算類自相關(guān)譜Corr(τ),所述τ為時(shí)間值;依據(jù)所述自相關(guān)譜Corr(τ)計(jì)算增強(qiáng)相關(guān)譜Ecorr(τ);
信號(hào)確定單元,用于獲取所述Ecorr(τ)中的最大值Max(ECorr),若連續(xù)預(yù)定個(gè)數(shù)的音頻幀的Max(ECorr)均小于第一閾值,則確定所述音頻幀為噪聲,所述第一閾值為增強(qiáng)相關(guān)譜的閾值;或者,獲取所述Max(ECorr)對(duì)應(yīng)的τ,若所述Max(ECorr)對(duì)應(yīng)的τ不在預(yù)設(shè)閾值范圍,則確定所述音頻幀為噪聲,所述預(yù)設(shè)閾值范圍為預(yù)設(shè)的時(shí)間范圍。
12.根據(jù)權(quán)利要求11所述裝置,其特征在于,
所述計(jì)算單元,具體用于將所述Corr(τ)中小于0的值賦值為0然后計(jì)算增強(qiáng)譜eCorr(τ);將所述eCorr(τ)中小于0的值賦值為0,得到增強(qiáng)相關(guān)譜Ecorr(τ)。
13.根據(jù)權(quán)利要求12所述裝置,其特征在于,
所述計(jì)算單元,具體用于依據(jù)eCorr(τ)=Corr(τ)-Corr(τ/2)計(jì)算所述eCorr(τ),若τ為奇數(shù),所述Corr(τ/2)由鄰近點(diǎn)插值得到。
14.根據(jù)權(quán)利要求11所述裝置,其特征在于,
所述計(jì)算單元,具體用于計(jì)算所述Spectrum(ω)的頻點(diǎn)的三次方根,并對(duì)所述Spectrum(ω)的頻點(diǎn)的三次方根作快速傅里葉變換取實(shí)部,得到所述Corr(τ)。
15.根據(jù)權(quán)利要求11至14任意一項(xiàng)所述裝置,其特征在于,
所述計(jì)算單元,還用于在所述信號(hào)確定單元確定所述音頻幀為噪聲之前,計(jì)算所述音頻幀的幅度譜S與噪聲譜N的幅度譜的平均距離d,d=20(log10(S)-log10(N));
所述信號(hào)確定單元,具體用于若所述d小于第二閾值且連續(xù)預(yù)定個(gè)數(shù)的音頻幀的Max(ECorr)均小于所述第一閾值,或者,若所述d小于所述第二閾值且所述Max(ECorr)對(duì)應(yīng)的τ不在預(yù)設(shè)閾值范圍,則確定所述音頻幀為噪聲,所述預(yù)設(shè)閾值范圍為預(yù)設(shè)的時(shí)間范圍。
16.根據(jù)權(quán)利要求15所述裝置,其特征在于,所述裝置還包括:
噪聲譜更新單元,用于若所述信號(hào)確定單元確定所述音頻幀為噪聲,則采用窗口平均的方式確定新的噪聲譜N。
17.根據(jù)權(quán)利要求16所述裝置,其特征在于,所述裝置還包括:
濾波單元,用于使用所述新噪聲譜對(duì)所述音頻信號(hào)的音頻幀進(jìn)行維納濾波。
18.根據(jù)權(quán)利要求11至14任意一項(xiàng)所述裝置,其特征在于,
所述信號(hào)確定單元,還用于若所述音頻幀未確定為噪聲,則確定所述音頻幀為人聲或者音樂。
19.根據(jù)權(quán)利要求18所述裝置,其特征在于,
所述信號(hào)確定單元,還用于在所述確定所述音頻幀為人聲或者音樂之前,若所述d大于所述第二閾值且若所述音頻幀未確定為噪聲,則確定所述音頻幀為人聲或者音樂。
20.根據(jù)權(quán)利要求19所述裝置,其特征在于,所述裝置還包括:
閾值更新單元,用于若未確定所述音頻幀為人聲或者音樂,則采用窗口平均的方式使用所述音頻幀的Ecorr(τ)更新所述第一閾值。