語音基音周期估計(jì)方法和裝置制造方法
【專利摘要】本發(fā)明涉及一種語音基音周期估計(jì)方法和裝置。所述裝置包括:信號預(yù)處理單元、歸一化自相關(guān)函數(shù)計(jì)算單元和基音周期后處理單元。所述方法包括:S1、對語音信號進(jìn)行除去直流分量、感知加權(quán)和信號下采樣的預(yù)處理;S2、計(jì)算所述預(yù)處理后的語音信號的歸一化自相關(guān)函數(shù)值;S3、確定基音周期搜索范圍內(nèi)所述歸一化自相關(guān)函數(shù)值中的最大值,將所述最大值對應(yīng)的基音周期候選值確定為所述語音信號的基音周期估計(jì)值。本發(fā)明較好地克服了基音周期估計(jì)中的倍頻和半頻錯(cuò)誤,提升了基音周期估計(jì)方法的抗噪聲性能,同時(shí)降低了算法的運(yùn)算復(fù)雜度,改進(jìn)了相應(yīng)的數(shù)字音頻/語音編碼效率。本發(fā)明能夠適用于各種語音編解碼算法中的基音搜索,具有廣泛的適用性。
【專利說明】語音基音周期估計(jì)方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語音編碼技術(shù),更具體地說,涉及一種語音基音周期估計(jì)方法和裝置?!颈尘凹夹g(shù)】
[0002]基音周期是指人發(fā)音時(shí)聲帶振動的周期?;糁芷谑钦Z音編碼中一個(gè)重要的問題,其準(zhǔn)確性將直接影響到語音編碼器的編碼質(zhì)量和效率。準(zhǔn)確的基音周期性分析,可以在語音編碼過程中有效地去除冗余,降低編碼的比特?cái)?shù),實(shí)現(xiàn)低比特率高質(zhì)量語音編碼。但是,由于語音的特殊性,基音周期的準(zhǔn)確搜索會面臨如下困難:
[0003](I)語音信號變化十分復(fù)雜,聲門激勵(lì)波形不是一個(gè)完全的周期脈沖串,并且語音波形的周期是時(shí)變的。
[0004](2)在語音的開頭和結(jié)尾部分并不具有聲帶振動那樣的周期性,有些清濁音等過渡音是很難判定它屬于周期或非周期信號,從而也就無法估計(jì)基音周期。
[0005](3)要從語音信號中去除聲道影響,直接取出僅和聲帶振動有關(guān)的信息比較困難。
[0006](4)在濁音段定義每個(gè)基音周期的準(zhǔn)確開始和結(jié)束這一困難限制了基音的可靠測量,這不僅因?yàn)檎Z音信號本身是準(zhǔn)周期的(即基音是有變化的),同時(shí)也因?yàn)椴ㄐ我资芄舱穹搴驮肼暤鹊挠绊憽?br>
[0007](5)在實(shí)際應(yīng)用中,背景噪聲會影響基音檢測的性能,對于移動通信環(huán)境尤為重要,因?yàn)椴ㄐ谓?jīng)常會出現(xiàn)高電平噪聲。
[0008](6)基音周期變化范圍較大也給準(zhǔn)確基音檢測帶來了一定的困難。
[0009]目前,還沒有一種通用的方法能精確可靠地提取出語音在任一情況下的基音周期。傳統(tǒng)的基音檢測方法,可分為時(shí)域法和頻域法。在時(shí)域,傳統(tǒng)的基音周期算法包括基于平均幅度差函數(shù)(Average Magnitude Difference Function, AMDF)的基音估計(jì)算法、基于短時(shí)自相關(guān)函數(shù)(Autocorrelation Function, ACF)基音檢測算法。這兩種算法可以參見如下文獻(xiàn)的介紹:
[0010]Chu, Wai C.Speech coding algorithms !foundation and evolution ofstandardized coders.John ffiley&Sons, Inc.2003, pp.33-45。
[0011]在頻域的角度,Griffin和Lim提出了一種頻域基音周期估計(jì)方案(D.ff.Griffin,J.S.Lim.Multiband Excitation Vocoder.1EEE Trans ASSP, 1988, 36 (8)),用于多帶激勵(lì)語音編碼算法(MBE), 這種基音周期估計(jì)算法采用閉環(huán)分析合成方法,匹配信號頻域波形,得到最優(yōu)基音周期估計(jì)。
[0012]在實(shí)際應(yīng)用中,基于時(shí)域的基音搜索算法由于其算法簡單,性能較佳而得到廣泛應(yīng)用。例如在當(dāng)前的語音編碼標(biāo)準(zhǔn)G.729、AMR-WB中,均采取了時(shí)域改進(jìn)的短時(shí)自相關(guān)函數(shù)(ACF)基音檢測算法(鮑長春.低碼率數(shù)字語音編碼基礎(chǔ).北京:北京工業(yè)大學(xué)出版社,2001.2.)。但是,通常時(shí)域的ACF方法容易產(chǎn)生“倍頻”和“半頻”錯(cuò)誤,AMDF方法不能有效跟蹤語音頻率快速變化。頻域方法一般采用倒譜法,由于引入對數(shù)運(yùn)算,使計(jì)算量大幅度增加,且易受噪音的影響。
【發(fā)明內(nèi)容】
[0013]本發(fā)明要解決的技術(shù)問題在于,針對現(xiàn)有技術(shù)的上述缺陷,提供一種低復(fù)雜度、高效的語音基音周期估計(jì)方法和裝置,能較好地克服基音周期估計(jì)中的倍頻與半頻錯(cuò)誤,并能提升抗噪聲性能。
[0014]本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:提出一種語音基音周期估計(jì)方法,包括如下步驟:
[0015]S1、對語音信號進(jìn)行除去直流分量、感知加權(quán)和信號下采樣的預(yù)處理;
[0016]S2、使用下式計(jì)算所述預(yù)處理后的語音信號的歸一化自相關(guān)函數(shù)值:
[0017]
【權(quán)利要求】
1.一種語音基音周期估計(jì)方法,其特征在于,包括如下步驟: 51、對語音信號進(jìn)行除去直流分量、感知加權(quán)和信號下采樣的預(yù)處理; 52、使用下式計(jì)算所述預(yù)處理后的語音信號的歸一化自相關(guān)函數(shù)值:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟SI進(jìn)一步包括: 511、對語音信號重采樣到內(nèi)部采樣率; 512、對重采樣的語音信號進(jìn)行高通濾波以除去直流分量; 513、對高通濾波后的語音信號進(jìn)行感知加權(quán); 514、對感知加權(quán)后的語音信號進(jìn)行低通濾波和1/2下采樣。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述內(nèi)部采樣率為12.8kHz,所述高通濾波的截止頻率為50Hz。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S3進(jìn)一步包括: 531、依據(jù)語音信號的采樣率,將基音周期搜索范圍劃分成第一區(qū)間、第二區(qū)間和第三區(qū)間,分別得到各個(gè)區(qū)間的歸一化自相關(guān)函數(shù)最大值和對應(yīng)的基音周期候選值; 532、依據(jù)一定的權(quán)重參數(shù),從所述三個(gè)區(qū)間的歸一化自相關(guān)函數(shù)最大值中選擇出所述基音周期搜索范圍的歸一化自相關(guān)函數(shù)最大值,將該最大值對應(yīng)的基音周期候選值確定為所述語音信號的基音周期估計(jì)值。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述步驟S32進(jìn)一步包括:判斷第二區(qū)間的歸一化自相關(guān)函數(shù)最大值是否大于等于第一區(qū)間的歸一化自相關(guān)函數(shù)最大值與所述權(quán)重參數(shù)的乘積,如果是,則將第二區(qū)間的歸一化自相關(guān)函數(shù)最大值對應(yīng)的基音周期候選值確定為所述語音信號的基音周期估計(jì)值,否則,進(jìn)一步判斷第三區(qū)間的歸一化自相關(guān)函數(shù)最大值是否大于等于第一區(qū)間的歸一化自相關(guān)函數(shù)最大值與所述權(quán)重參數(shù)的乘積,如果是,則將第三區(qū)間的歸一化自相關(guān)函數(shù)最大值對應(yīng)的基音周期候選值確定為所述語音信號的基音周期估計(jì)值,否則將第一區(qū)間的歸一化自相關(guān)函數(shù)最大值對應(yīng)的基音周期候選值確定為所述語音信號的基音周期估計(jì)值。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述第一區(qū)間、第二區(qū)間和第三區(qū)間具體為[L_min,39],[40,79],[80,L_max],其中L_min表示基音周期搜索范圍的起始值,L_max表示基音周期搜索范圍的結(jié)束值。
7.一種語音基音周期估計(jì)裝置,其特征在于,包括: 信號預(yù)處理單元,對語音信號進(jìn)行除去直流分量、感知加權(quán)和信號下采樣的預(yù)處理; 歸一化自相關(guān)函數(shù)計(jì)算單元,使用下式計(jì)算所述預(yù)處理后的語音信號的歸一化自相關(guān)函數(shù)值:
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述信號預(yù)處理單元進(jìn)一步對語音信號重采樣到內(nèi)部采樣率,然后對重采樣的語音信號進(jìn)行高通濾波以除去直流分量,隨后對高通濾波后的語音信號進(jìn)行感知加權(quán),最后對感知加權(quán)后的語音信號進(jìn)行低通濾波和1/2下采樣。
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述基音周期后處理單元進(jìn)一步依據(jù)語音信號的采樣率,將基音周期搜索范圍劃分成第一區(qū)間、第二區(qū)間和第三區(qū)間,分別得到各個(gè)區(qū)間的歸一化自相關(guān)函數(shù)最大值和對應(yīng)的基音周期候選值,并依據(jù)一定的權(quán)重參數(shù),從所述三個(gè)區(qū)間的歸一化自相關(guān)函數(shù)最大值中選擇出所述基音周期搜索范圍的歸一化自相關(guān)函數(shù)最大值,將該最大值對應(yīng)的基音周期候選值確定為所述語音信號的基音周期估計(jì)值。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述基音周期后處理單元依據(jù)一定的權(quán)重參數(shù)從所述三個(gè)區(qū)間的歸.一化自相關(guān)函數(shù)最大值中選擇出所述基音周期搜索范圍的歸一化自相關(guān)函數(shù)最大值具體為:判斷第二區(qū)間的歸一化自相關(guān)函數(shù)最大值是否大于等于第一區(qū)間的歸一化自相關(guān)函數(shù)最大值與所述權(quán)重參數(shù)的乘積,如果是,則將第二區(qū)間的歸一化自相關(guān)函數(shù)最大值對應(yīng)的基音周期候選值確定為所述語音信號的基音周期估計(jì)值,否貝U,進(jìn)一步判斷第三區(qū)間的歸一化自相關(guān)函數(shù)最大值是否大于等于第一區(qū)間的歸一化自相關(guān)函數(shù)最大值與所述權(quán)重參數(shù)的乘積,如果是,則將第三區(qū)間的歸一化自相關(guān)函數(shù)最大值對應(yīng)的基音周期候選值確定為所述語音信號的基音周期估計(jì)值,否則將第一區(qū)間的歸一化自相關(guān)函數(shù)最大值對應(yīng)的基音周期候選值確定為所述語音信號的基音周期估計(jì)值。
【文檔編號】G10L19/00GK103474074SQ201310409433
【公開日】2013年12月25日 申請日期:2013年9月9日 優(yōu)先權(quán)日:2013年9月9日
【發(fā)明者】閆建新, 張勇 申請人:深圳廣晟信源技術(shù)有限公司