音頻信號的處理方法和裝置制造方法
【專利摘要】本發(fā)明公開了音頻信號的處理方法和裝置,該方法包括:根據(jù)設(shè)定的時間間隔依次獲取音頻信號每個時間點幅度采樣值,獲取幅度采樣值時比較幅度采用值的大小;若當(dāng)前時間點幅度采樣值大于或等于上一時間點的幅度平均值,則通過Xpi=A*|Xi|+(1-A)*Xp(i-1)計算當(dāng)前時間點的幅度平均值;若小于上一時間點的幅度平均值,則通過X?pi=(1-R)*X?p(i-1)計算當(dāng)前時間點幅度平均值。本發(fā)明所提供的音頻信號的處理方法和裝置,計算出的幅度動態(tài)平均值所涉及的數(shù)據(jù)量少,運算簡單,無需存儲大量的相關(guān)數(shù)據(jù),在保證計算出的各頻段的幅度動態(tài)平均值符合人耳特性要求的基礎(chǔ)上,節(jié)約了大量的數(shù)據(jù)存儲空間。
【專利說明】音頻信號的處理方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及音頻【技術(shù)領(lǐng)域】,尤其是涉及一種音頻信號的處理方法和裝置。
【背景技術(shù)】
[0002]在傳統(tǒng)數(shù)字音頻【技術(shù)領(lǐng)域】中,一般采用超低頻率的低通濾波器獲取數(shù)字音頻的各頻段音頻信號的幅度值和變化量。但是這種超低頻率的低通濾波器設(shè)計難度大,穩(wěn)定性差,同時資源消耗量大。
[0003]另外,數(shù)字音頻的采樣頻率比普通的音頻最高采用頻率一般高出數(shù)倍,如數(shù)字音頻的采樣頻率可以為44.lkHz,48kHz等。由于直接將某一次的數(shù)字音頻采樣頻率的絕對值作為數(shù)字音頻信號的幅度值離散性較大,沒有實用價值。
[0004]現(xiàn)有技術(shù)中為了確保獲取比較實用的數(shù)字音頻信號幅度值一般有多次采樣頻率的算術(shù)平均值代替。如采樣如下公式計算獲得所需的數(shù)字音頻信號幅度值:Xp=(|X1| + |X2|+…+ |Xn-l| + |Xn|)/n,其中η為大于或等于的I自然數(shù)。采用這種方式計算獲得所需數(shù)字音頻信號幅度值,當(dāng)η不大時容易實現(xiàn),當(dāng)η過大時,采用這種方式需要占用過多的存儲資源,因此這種方式不適用于η值大的情況。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的主要目的在于提供一種音頻信號的處理方法和裝置,在計算獲得符合人耳特性的音頻信號的幅度值前提下,節(jié)約數(shù)據(jù)存儲空間。
[0006]本發(fā)明提出一種音頻信號的處理方法,包括:·[0007]根據(jù)設(shè)定的時間間隔依次獲取音頻信號每個時間點幅度采樣值,并在獲取幅度采樣值的同時比較該幅度采用值的大小;
[0008]若當(dāng)前時間點幅度采樣值大于或等于音頻信號的上一時間點的幅度平均值,則通過公式Xp^AHXil + a-AhXptD計算音頻信號的當(dāng)前時間點的幅度平均值;若當(dāng)前時間點的幅度采樣值小于音頻信號的上一時間點的幅度平均值,則通過公式X pi=(l-R)*X P(1-D計算音頻信號的當(dāng)前時間點的幅度平均值;音頻信號的每個頻段對應(yīng)的依次相鄰的所有幅度平均值形成該頻段的幅度動態(tài)平均值;其中,Xpi為音頻信號的當(dāng)前時間點的幅度平均值;Xp(^1)為音頻信號的上一時間點的幅度平均值,初始值為“O” ;Xi為音頻信號的當(dāng)前時間點的幅度采樣值;A為跟進系數(shù),取值為小于I的正常數(shù),R為釋放系數(shù),取值為小于I的正常數(shù)。
[0009]優(yōu)選地,所述跟進系數(shù)A取值為0.1,和/或釋放系數(shù)R取值為0.0001。
[0010]優(yōu)選地,所述方法還包括:
[0011]根據(jù)音頻信號各頻段的幅度動態(tài)平均值計算所述音頻信號的相關(guān)參數(shù),根據(jù)音頻信號各頻段的幅度動態(tài)平均值的大小和所述相關(guān)參數(shù)的大小確定音頻信號的類型;
[0012]根據(jù)音頻信號的類型對音頻信號進行相應(yīng)的處理,并輸出處理后的音頻信號。
[0013]優(yōu)選地,所述音頻信號的相關(guān)參數(shù)包括以下參數(shù):音頻信號的幅度動態(tài)平均值變化率、音頻信號的幅度動態(tài)平均值間歇時間、音頻信號的過零點密度。
[0014]優(yōu)選地,所述音頻信號的類型包括:語音信號和非語音信號;
[0015]所述根據(jù)音頻信號各頻段的幅度動態(tài)平均值的大小和所述相關(guān)參數(shù)的大小確定音頻信號的類型具體包括:
[0016]當(dāng)音頻信號的各頻段的幅度動態(tài)平均值均小于0.1、幅度動態(tài)平均值變化率大于
0.5、幅度動態(tài)平均值間歇時間為2至5秒,過零點密度大于0.3,則確定所述音頻信號為語音信號;否則為非語音信號。
[0017]優(yōu)選地,所述根據(jù)音頻信號的類型對音頻信號進行相應(yīng)的處理具體包括:
[0018]當(dāng)音頻信號為語音信號,則對該音頻信號的低于200Hz頻段和高于6kHz頻段的音頻信號進行衰減處理,處于200Hz至6kHz頻段的音頻信號進行增益處理。
[0019]本發(fā)明另提出一種音頻信號的處理裝置,包括:
[0020]比較模塊,用于根據(jù)設(shè)定的時間間隔依次獲取音頻信號每個時間點幅度采樣值,并在獲取幅度采樣值的同時比較該幅度采用值的大小;
[0021]計算模塊,用于若當(dāng)前時間點幅度采樣值大于或等于音頻信號的上一時間點計的幅度平均值,則通過公式Xpi=A* I XiK(1-AhXp^1)計算音頻信號的當(dāng)前時間點的幅度平均值;若當(dāng)前時間點的幅度采樣值小于音頻信號的上一時間點的幅度平均值,則通過公式Xpi= (1-R) *x P(1-D計算音頻信號的當(dāng)前時間點當(dāng)前幅度平均值;音頻信號的每個頻段對應(yīng)的依次相鄰的所有幅度平均值形成該頻段的幅度動態(tài)平均值;其中,Xpi為音頻信號的當(dāng)前時間點的幅度平均值A(chǔ)pa-D為音·頻信號的上一時間點的幅度平均值,初始值為“0”;\為音頻信號的當(dāng)前時間點的幅度采樣值;A為跟進系數(shù),取值為小于I的正常數(shù),R為釋放系數(shù),取值為小于I的正常數(shù)。
[0022]優(yōu)選地,所述跟進系數(shù)A取值為0.1,和/或釋放系數(shù)R取值為0.0001。
[0023]優(yōu)選地,所述的音頻信號的處理裝置還包括:
[0024]類型確定模塊,用于根據(jù)音頻信號各頻段的幅度動態(tài)平均值計算所述音頻信號的相關(guān)參數(shù),根據(jù)音頻信號各頻段的幅度動態(tài)平均值的大小和所述相關(guān)參數(shù)的大小確定音頻信號的類型;
[0025]信號處理模塊,用于根據(jù)音頻信號的類型對音頻信號進行相應(yīng)的處理,并輸出處理后的音頻信號。
[0026]優(yōu)選地,所述音頻信號的相關(guān)參數(shù)包括以下參數(shù):音頻信號的幅度動態(tài)平均值變化率、音頻信號的幅度動態(tài)平均值間歇時間、音頻信號的過零點密度。
[0027]優(yōu)選地,所述音頻信號的類型包括:語音信號和非語音信號;
[0028]所述信號確定模塊,具體用于當(dāng)音頻信號各頻段的幅度動態(tài)平均值均小于0.1、幅度動態(tài)平均值變化率大于0.5、幅度動態(tài)平均值間歇時間為2至5秒,過零點密度大于0.3,則確定所述音頻信號為語音信號;否則為非語音信號。
[0029]優(yōu)選地,所述信號處理模塊,具體還用于當(dāng)音頻信號為語音信號,則對該音頻信號的低于200Hz頻段和高于6kHz頻段的音頻信號進行衰減處理,處于200Hz至6kHz頻段的音頻信號進行增益處理。
[0030]本發(fā)明所提供的音頻信號的處理方法和裝置,通過根據(jù)設(shè)定的時間間隔依次獲取音頻信號每個時間點幅度采樣值,并在獲取幅度采樣值的同時比較該幅度采用值的大??;若當(dāng)前時間點幅度采樣值大于或等于音頻信號的上一時間點的幅度平均值,則通過公式Xpi=AHXih(1-AhXpI1)計算音頻信號的當(dāng)前時間點的幅度平均值;若當(dāng)前時間點的幅度采樣值小于音頻信號的上一時間點的幅度平均值,則通過公式X pi= (1-R) *X w-d計算音頻信號的當(dāng)前時間點幅度平均值的方式,在計算某一具體時間點的幅度平均值過程所涉及到的數(shù)據(jù)量少,即計算音頻信號各頻段的幅度動態(tài)平均值所涉及的數(shù)據(jù)量少,運算簡單,無需預(yù)先存儲大量的相關(guān)數(shù)據(jù),同時計算出的各頻段的幅度動態(tài)平均值符合人耳特性,能夠保證人耳的聽覺效果,即在保證計算出的各頻段的幅度動態(tài)平均值符合人耳特性要求的基礎(chǔ)上,節(jié)約了大量的數(shù)據(jù)存儲空間。
【專利附圖】
【附圖說明】
[0031]圖1是本發(fā)明的音頻信號的處理方法一實施例的流程圖;
[0032]圖2是本發(fā)明的音頻信號的處理方法另一實施例的流程圖;
[0033]圖3是本發(fā)明的音頻信號的處理裝置一實施例的結(jié)構(gòu)示意圖;
[0034]圖4是本發(fā)明的音頻信號的處理裝置另一實施例的結(jié)構(gòu)示意圖。
[0035]本發(fā)明目的的實現(xiàn)、功能特點及優(yōu)點將結(jié)合實施例,參照附圖做進一步說明。
【具體實施方式】
[0036]應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0037]參見圖1,提出本 發(fā)明的一種音頻信號的處理方法一實施例,包括:
[0038]步驟S101、根據(jù)設(shè)定的時間間隔依次獲取音頻信號對應(yīng)時間點的幅度采樣值,并在獲取幅度采樣值的同時比較該幅度采用值的大小。若當(dāng)前時間點的幅度采樣值大于或等于音頻信號的上一時間點的幅度平均值,則轉(zhuǎn)入步驟S102 ;若當(dāng)前時間點的幅度采樣值小于音頻信號的上一時間點的幅度平均值,則轉(zhuǎn)入步驟S103。
[0039]步驟S102、若當(dāng)前時間點的幅度采樣值大于或等于音頻信號的上一時間點的幅度平均值,通過公式=Xpi=AHXih(1-AhXp^1)—一⑴計算音頻信號的當(dāng)前時間點的幅度平均值。
[0040]其中,Xpi為音頻信號的當(dāng)前時間點的幅度平均值;Xp(i_D為音頻信號的上一時間點的幅度平均值,初始值為“O” ;Xi為音頻信號的當(dāng)前時間點的幅度采樣值;A為跟進系數(shù),一般可以取值為小于I的正常數(shù),較佳取值為0.1。
[0041]步驟S103、若當(dāng)前時間點的幅度采樣值小于音頻信號的上一時間點的幅度平均值,通過公式X pi= (1-R) *X p(i_D----(2)計算音頻信號的當(dāng)前時間點的幅度平均值。
[0042]其中,Xpi為音頻信號的當(dāng)前時間點的幅度平均值;Xp(i_D為音頻信號的上一時間點的幅度平均值,初始值為“0”;R為釋放系數(shù),一般可以取值為小于I的正常數(shù),較佳取值為
0.0001。
[0043]步驟S104、音頻信號的每個頻段對應(yīng)的依次相鄰的所有幅度平均值形成該頻段的幅度動態(tài)平均值。
[0044]以下通過舉例說明上述實施例:若設(shè)音頻信號時長為100秒,時間間隔為I秒,則計算音頻信號每個時間點的幅度平均值具體如下:依次獲取第I秒、2秒、3秒、4秒------100秒對應(yīng)的幅度采樣值,其中在獲取第N (I至100任一個自然數(shù))秒對應(yīng)的幅度采樣值的同時。比較該幅度采用值與第N-1秒對應(yīng)的幅度平均值;當(dāng)?shù)贜秒的幅度采樣值大于或等于第N-1秒對應(yīng)的幅度平均值,則通過公式=Xpi=AyXih(1-AhX1^1)計算第N秒的幅度平均值;當(dāng)?shù)贜秒的幅度采樣值小于第N-1秒對應(yīng)的幅度平均值,則通過公式:Xpi= (1-R) *x P(1-D計算第N秒的幅度平均值;其中第O秒對應(yīng)的幅度平均值為“O”。
[0045]在音頻【技術(shù)領(lǐng)域】中人耳對聲音存在掩蔽效應(yīng),即人耳對聲音對無到有比較敏感,其對應(yīng)的系數(shù)為跟進系數(shù)A ;而對聲音從有到無比較遲鈍,其對應(yīng)的系數(shù)為釋放系數(shù)。本實施例通過調(diào)整公式(I)和(2)中的跟進系數(shù)A和釋放系數(shù)R的大小,使得計算出的各頻段的幅度動態(tài)平均值符合人耳特性。將跟進系數(shù)A調(diào)整為釋放系數(shù)1000倍效果最佳,如A取值為0.1,R取值為0.0001。
[0046]參見圖2,上述音頻信號的處理方法實施例中,步驟S104之后還包括:
[0047]步驟S201、根據(jù)音頻信號各頻段的幅度動態(tài)平均值計算所述音頻信號的相關(guān)參數(shù),根據(jù)音頻信號各頻段的幅度動態(tài)平均值的大小和所述相關(guān)參數(shù)的大小確定音頻信號的類型。
[0048]本步驟S201中所述音頻信號的相關(guān)參數(shù)包括以下參數(shù):音頻信號的幅度動態(tài)平均值變化率、音頻信號的幅度動態(tài)平均值間歇時間、音頻信號的過零點密度。其中根據(jù)所述幅度動態(tài)平均值計算音頻信號的幅度動態(tài)平均值變化率、音頻信號的幅度動態(tài)平均值間歇時間、音頻信號的過零點密度屬于現(xiàn)有技術(shù),在此對其具體的計算過程不再贅述。
[0049]本步驟S201中所述根據(jù)音頻信號的各頻段的幅度動態(tài)平均值的大小和所述相關(guān)參數(shù)的大小確定音頻信號的類型具體處理如下:當(dāng)音頻信號的各頻段的幅度動態(tài)平均值均小于0.1、幅度動態(tài)平均值變化率大于0.5、幅度動態(tài)平均值間歇時間為2至5秒,過零點密度大于0.3,則確定所述音頻信號為語音信號;否則為非語音信號。
[0050]步驟S202、根據(jù)音頻·信號的類型對音頻信號進行相應(yīng)的處理,并輸出處理后的音頻信號。
[0051]本步驟S202中,當(dāng)音頻信號為語音信號,對音頻信號進行相應(yīng)的處理如下:對該音頻信號的低于200Hz頻段和高于6kHz頻段的音頻信號進行衰減處理,處于200Hz至6kHz頻段的音頻信號進行增益處理,然后將處理后的音頻信號通過施密特開關(guān)并輸出,如此處理后的音頻信號人耳能夠聽得很清楚,保證了語音信號的聽覺效果。而當(dāng)確定音頻信號為非語音信號,則不作任何處理,直接通過施密特開關(guān)后輸出即可。
[0052]本實施例所提供的音頻信號的處理方法,在計算某一具體時間點的幅度平均值過程所涉及到的數(shù)據(jù)量少,即計算音頻信號各頻段的幅度動態(tài)平均值所涉及的數(shù)據(jù)量少,運算簡單,無需預(yù)先存儲大量的相關(guān)數(shù)據(jù),同時計算出的各頻段的幅度動態(tài)平均值符合人耳特性,能夠保證人耳的聽覺效果,即在保證計算出的各頻段的幅度動態(tài)平均值符合人耳特性要求的基礎(chǔ)上,節(jié)約了大量的數(shù)據(jù)存儲空間。
[0053]參見圖3,提出本發(fā)明的一種音頻信號的處理裝置100—實施例,包括比較模塊110和計算模塊120。其中所述比較模塊110,用于根據(jù)設(shè)定的時間間隔依次獲取音頻信號每個時間點幅度采樣值,并在獲取幅度采樣值的同時比較該幅度采用值的大小。所述計算模塊120,用于若當(dāng)前時間點幅度采樣值大于或等于音頻信號的上一時間點的幅度平均值,則通過公式Xpi=AyXih(1-AhXpM)計算音頻信號的當(dāng)前時間點的幅度平均值;若當(dāng)前時間點的幅度采樣值小于音頻信號的上一時間點的幅度平均值,則通過公式X pi= (1-R) *XP(1-D計算音頻信號的當(dāng)前時間點的幅度平均值。Xpi為音頻信號的當(dāng)前時間點的幅度平均值為音頻信號的上一時間點的幅度平均值,初始值為“0”;\為音頻信號的當(dāng)前時間點的幅度采樣值;A為跟進系數(shù),一般取值為小于I的正常數(shù),較佳取值為0.1 ;R為釋放系數(shù),一般取值為小于I的正常數(shù),較佳取值為0.0001。
[0054]本實施例中,所述音頻信號的每個頻段對應(yīng)的依次相鄰的所有幅度平均值形成該頻段的幅度動態(tài)平均值。
[0055]以下通過舉例說明上述實施例:若設(shè)音頻信號時長為100秒,時間間隔為I秒,則計算音頻信號每個時間點的幅度平均值具體如下:依次獲取第I秒、2秒、3秒、4
秒------100秒對應(yīng)的幅度采樣值,其中在獲取第N (I至100任一個自然數(shù))秒對應(yīng)的幅
度采樣值的同時。比較該幅度采用值與第N-1秒對應(yīng)的幅度平均值;當(dāng)?shù)贜秒的幅度采樣值大于或等于第N-1秒對應(yīng)的幅度平均值,則通過公式ApeAHXil + a-AhXptD計算第N秒的幅度平均值;當(dāng)?shù)贜秒的幅度采樣值小于第N-1秒對應(yīng)的幅度平均值,則通過公式:Xpi= (1-R) *x P(1-D計算第N秒的幅度平均值;其中第O秒對應(yīng)的幅度平均值為“O”。
[0056]在音頻【技術(shù)領(lǐng)域】中人耳對聲音存在掩蔽效應(yīng),即人耳對聲音對無到有比較敏感,其對應(yīng)的系數(shù)為跟進系數(shù)A ;而對聲音從有到無比較遲鈍,其對應(yīng)的系數(shù)為釋放系數(shù)。本實施例通過調(diào)整公式(I)和(2)中的跟進系數(shù)A和釋放系數(shù)R的大小,使得計算出的各頻段的幅度動態(tài)平均值符合人耳特性。將跟進系數(shù)A調(diào)整為釋放系數(shù)1000倍效果最佳,如A取值為0.1,R取值為0.0001。
[0057]參見圖4,上述音頻信號的處理裝置100實施例還包括:類型確定模塊130、信號處理模塊140。所述類型確定模塊130,用于根據(jù)音頻信號各頻段的幅度動態(tài)平均值計算所述音頻信號的相關(guān)參數(shù),根據(jù)音頻信號各頻段的幅度動態(tài)平均值的大小和所述相關(guān)參數(shù)的大小確定音頻信號的類型。所述信號處理模塊140,用于根據(jù)音頻信號的類型對音頻信號進行相應(yīng)的處理,并輸出處理后的音頻信號。
[0058]本實施例中,所述音頻信號的相關(guān)參數(shù)包括以下參數(shù):音頻信號的幅度動態(tài)平均值變化率、音頻信號的幅度動態(tài)平均值間歇時間、音頻信號的過零點密度。其中,根據(jù)所述幅度動態(tài)平均值計算音頻信號的幅度動態(tài)平均值變化率、音頻信號的幅度動態(tài)平均值間歇時間、音頻信號的過零點密度屬于現(xiàn)有技術(shù),在此對其具體的計算過程不再贅述。
[0059]本實施例中,所述音頻信號的類型包括:語音信號和非語音信號。所述信號確定模塊130根據(jù)音頻信號的各個頻段的幅度動態(tài)平均值的大小和所述相關(guān)參數(shù)的大小確定音頻信號的類型的具體過程如下:當(dāng)音頻信號的各頻段的幅度動態(tài)平均值均小于0.1、幅度動態(tài)平均值變化率大于0.5、幅度動態(tài)平均值間歇時間為2至5秒,過零點密度大于0.3,則確定所述音頻信號為語音信號;否則為非語音信號。所述信號處理模塊140,具體還用于當(dāng)音頻信號為語音信號,則對該音頻信號的低于200Hz頻段和高于6kHz頻段的音頻信號進行衰減處理,處于200Hz至6kHz頻段的音頻信號進行增益處理,如此處理后的音頻信號人耳能夠聽得很清楚,保證了語音信號的聽覺效果。但當(dāng)確定音頻信號為非語音信號,信號處理模塊130則不作任何處理,直接通過施密特開關(guān)后輸出即可。
[0060]本實施例所提供的音頻信號的處理裝置100,在計算具體時間點的幅度平均值過程所涉及到的數(shù)據(jù)量少,即計算音頻信號各頻段的幅度動態(tài)平均值所涉及的數(shù)據(jù)量少,運算簡單,無需預(yù)先存儲大量的相關(guān)數(shù)據(jù),同時計算出的各頻段的幅度動態(tài)平均值符合人耳特性,能夠保證人耳的聽覺效果,即在保證計算出的各頻段的幅度動態(tài)平均值符合人耳特性要求的基礎(chǔ)上,節(jié)約了大量的數(shù)據(jù)存儲空間。
[0061]本發(fā)明所提供的音頻信號的處理方法和裝置還可以采用各類低通、高通或帶通濾波器,用于分析音頻信號的各頻段的幅度值。如采用200Hz以下的低通濾波器,可以測量音頻信號的低頻段分量的力度、持續(xù)時間和間隔時間,這些參數(shù)是分析音頻信號是音樂信號還是純語音信號的條件之一,即在設(shè)定持續(xù)時間(如2s)內(nèi)間隔時間遞減值不歸零或不低于某個設(shè)定值則可判斷該音頻信號為音樂信號。又如采用8kHz以上的高通濾波器,可以測量音頻信號的高頻段分量的大小,用來分析音頻信號的質(zhì)量。又如采用EQ濾波器組,可以實現(xiàn)音頻信號分頻段DRC功能和音頻信號類型的綜合判斷。
[0062]本發(fā)明所提供的音頻信號的處理方法和裝置可以運行于MATLAB、VC、C++等純軟件平臺,可用于分析WAV、MP3或其他各類數(shù)字音頻信號文件,同時還可以運行于DSP處理器用于實際處理實時數(shù)字音頻信號。
[0063]應(yīng)當(dāng)理解的是,以上僅為本發(fā)明的優(yōu)選實施例,不能因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運用在其他相關(guān)的【技術(shù)領(lǐng)域】,均同理包括在本發(fā)明的專利保護范圍內(nèi)。
【權(quán)利要求】
1.一種音頻信號的處理方法,其特征在于,包括: 根據(jù)設(shè)定的時間間隔依次獲取音頻信號每個時間點的幅度采樣值,并在獲取幅度采樣值的同時比較該幅度采樣值的大??; 若當(dāng)前時間點的幅度采樣值大于或等于音頻信號的上一時間點的幅度平均值,則通過公式Xpi=AdXiha-AhXp^)計算音頻信號的當(dāng)前時間點的幅度平均值;若當(dāng)前時間點的幅度采樣值小于音頻信號的上一時間點的幅度平均值,則通過公式Xpi=( l-R)*Xp(i_D計算音頻信號的當(dāng)前時間點的幅度平均值;音頻信號的每個頻段對應(yīng)的依次相鄰的所有幅度平均值形成該頻段的幅度動態(tài)平均值;其中,Xpi為音頻信號的當(dāng)前時間點的幅度平均值;Xp(h)為音頻信號的上一時間點的幅度平均值,初始值為“0”;\為音頻信號的當(dāng)前時間點的幅度采樣值;A為跟進系數(shù),取值為小于I的正常數(shù),R為釋放系數(shù),取值為小于I的正常數(shù)。
2.根據(jù)權(quán)利要求1所述的音頻信號的處理方法,其特征在于,所述跟進系數(shù)A取值為0.1,和/或釋放系數(shù)R取值為0.0001。
3.根據(jù)權(quán)利要求1或2所述的音頻信號的處理方法,其特征在于,所述方法還包括: 根據(jù)音頻信號各頻段的幅度動態(tài)平均值計算所述音頻信號的相關(guān)參數(shù),根據(jù)音頻信號各頻段的幅度動態(tài)平均值的大小和所述相關(guān)參數(shù)的大小確定音頻信號的類型; 根據(jù)音頻信號的類型對音頻信號進行相應(yīng)的處理,并輸出處理后的音頻信號。
4.根據(jù)權(quán)利要求3所述的音頻信號的處理方法,其特征在于,所述音頻信號的相關(guān)參數(shù)包括以下參數(shù):音頻信號的幅度動態(tài)平均值變化率、音頻信號的幅度動態(tài)平均值間歇時間、音頻信號的過零點密度。
5.根據(jù)權(quán)利要求4所述的音頻信號的處理方法,其特征在于,所述音頻信號的類型包括:語音信號和非語音信號; 所述根據(jù)音頻信號各頻段的幅度動態(tài)平均值的大小和所述相關(guān)參數(shù)的大小確定音頻信號的類型具體包括: 當(dāng)音頻信號的各頻段的幅度動態(tài)平均值均小于0.1、幅度動態(tài)平均值變化率大于0.5、幅度動態(tài)平均值間歇時間為2至5秒,過零點密度大于0.3,則確定所述音頻信號為語音信號;否則為非語音信號。
6.根據(jù)權(quán)利要求3所述的音頻信號的處理方法,其特征在于,所述根據(jù)音頻信號的類型對音頻信號進行相應(yīng)的處理具體包括: 當(dāng)音頻信號為語音信號,則對該音頻信號的低于200Hz頻段和高于6kHz頻段的音頻信號進行衰減處理,處于200Hz至6kHz頻段的音頻信號進行增益處理。
7.一種音頻信號的處理裝置,其特征在于,包括: 比較模塊, 用于根據(jù)設(shè)定的時間間隔依次獲取音頻信號每個時間點幅度采樣值,并在獲取幅度采樣值的同時比較該幅度采用值的大?。? 計算模塊,用于若當(dāng)前時間點幅度采樣值大于或等于音頻信號的上一時間點計的幅度平均值,則通過公式Xpi=A* I Xi I + (1-A) *Xp(i_D計算音頻信號的當(dāng)前時間點的幅度平均值;若當(dāng)前時間點的幅度采樣值小于音頻信號的上一時間點的幅度平均值,則通過公式Xpi=(1-R)*Xp(i_D計算音頻信號的當(dāng)前時間點的幅度平均值;音頻信號的每個頻段對應(yīng)的依次相鄰的所有幅度平均值形成該頻段的幅度動態(tài)平均值;其中,Xpi為音頻信號的當(dāng)前時間點的幅度平均值;Xp(i_D為音頻信號的上一時間點的幅度平均值,初始值為“0”;\為音頻信號的當(dāng)前時間點的幅度采樣值;A為跟進系數(shù),取值為小于I的正常數(shù),R為釋放系數(shù),取值為小于I的正常數(shù)。
8.根據(jù)權(quán)利要求7所述的音頻信號的處理裝置,其特征在于,所述跟進系數(shù)A取值為0.1,和/或釋放系數(shù)R取值為0.0001。
9.根據(jù)權(quán)利要求7或8所述的音頻信號的處理裝置,其特征在于,還包括: 類型確定模塊,用于根據(jù)音頻信號各頻段的幅度動態(tài)平均值計算所述音頻信號的相關(guān)參數(shù),根據(jù)音頻信號各頻段的幅度動態(tài)平均值的大小和所述相關(guān)參數(shù)的大小確定音頻信號的類型; 信號處理模塊,用于根據(jù)音頻信號的類型對音頻信號進行相應(yīng)的處理,并輸出處理后的音頻信號。
10.根據(jù)權(quán)利要求9所述的音頻信號的處理裝置,其特征在于,所述音頻信號的相關(guān)參數(shù)包括以下參數(shù):音頻信號的幅度動態(tài)平均值變化率、音頻信號的幅度動態(tài)平均值間歇時間、音頻信號的過零點密度。
11.根據(jù)權(quán)利要求10所述的音頻信號的處理裝置,其特征在于,所述音頻信號的類型包括:語音信號和非語音信號; 所述信號確定模塊,具體用于當(dāng)音頻信號各頻段的幅度動態(tài)平均值均小于0.1、幅度動態(tài)平均值變化率大于0.5、幅度動態(tài)平均值間歇時間為2至5秒,過零點密度大于0.3,則確定所述音頻信號為語音信號;否則為非語音信號。
12.根據(jù)權(quán)利要求9所述的音頻信號的處理裝置,其特征在于,所述信號處理模塊,具體還用于當(dāng)音頻信號為語音信號,則對該音頻信號的低于200Hz頻段和高于6kHz頻段的音頻信號進行衰減處理,處于200Hz至6kHz頻段的音頻信號進行增益處理。
【文檔編號】G10L21/0364GK103680516SQ201310676820
【公開日】2014年3月26日 申請日期:2013年12月11日 優(yōu)先權(quán)日:2013年12月11日
【發(fā)明者】何文輝, 高偉標(biāo), 劉飛祥 申請人:深圳Tcl新技術(shù)有限公司