基于過渡幀判決及處理的激勵信號自然度提高方法

文檔序號：2830880閱讀：303來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：基于過渡幀判決及處理的激勵信號自然度提高方法
技術(shù)領(lǐng)域：
本發(fā)明屬于語音編碼技術(shù)領(lǐng)域，特別針對于SELP2.4kbps聲碼器技術(shù)。
技術(shù)背景語音編碼在通信系統(tǒng)、語音存儲回放系統(tǒng)、具有語音功能的消費類產(chǎn)品中有廣泛的應(yīng)用。近些年來國際電信聯(lián)盟(ITU)、一些區(qū)域組織和一些國家相繼制定了一系列語音壓縮編碼標(biāo) 準(zhǔn)，在編碼速率為2.4kb/s到16kb/s上得到了令人滿意的語音質(zhì)量。目前國內(nèi)外的研究主要集中在2.4kb/s以下速率高質(zhì)量語音壓縮編碼上，主要用于無線通信、保密通信、大容量語音存儲回放等。低速率語音編碼中激勵信號的合成非常重要，SELP聲碼器采用混合激勵信號，用基音周期參數(shù)、能量參數(shù)、余量譜幅度參數(shù)以及子帶清濁音判決參數(shù)描述激勵信號的特征，合成語音清晰自然。目前SELP2.4kbps聲碼器技術(shù)中激勵信號合成的主要步驟如下步驟(1)對輸入語音信號樣點按時間順序分幀；步驟(2) 對當(dāng)前幀提取基音周期參數(shù)；步驟(3)對當(dāng)前幀提取能量參數(shù)；步驟(4) 對當(dāng)前幀提取余量譜幅度參數(shù)；步驟(5)對當(dāng)前幀提取子帶清濁音判決參數(shù)；步驟(6)將步驟(2)、步驟(3)、步驟(4)以及步驟(5)求取的特征參數(shù)進(jìn)行量化，將量化索引傳遞給解碼端；步驟(7)解碼端根據(jù)步驟(6)發(fā)送的量化索引進(jìn)行解量化，得到合成激勵信號所需的參數(shù)；步驟(8)對步驟(7)中求取的特征參數(shù)進(jìn)行插值。若前一幀和當(dāng)前幀為濁音幀，并且基音周期的變化率小于22.5%，則對解碼端參數(shù)采用逐點的線性插值；否則采用分段插值；步驟(9)根據(jù)步驟(8)中插值后的參數(shù)合成激勵信號。上述己有技術(shù)對子帶清濁音判決參數(shù)采用5bit量化，每個子帶的清濁音特性用lbit表示，當(dāng)某個子帶為濁音時將其清濁音判決參數(shù)置為1，否則置為0。由于當(dāng)?shù)谝粋€子帶為清音時，后四個子帶也必為清音，因此子帶清濁音判決參數(shù)中有部分模式是不存在的，即子帶清濁音判決參數(shù)的量化存在一定的冗余。如圖1所示，在子帶清濁音判決參數(shù)的量化上，原有技術(shù)采用簡單的每個子帶清濁音判決參數(shù)lbit量化共5bit量化的方式，這會使編碼后的碼流存在一定的冗余度，沒有充分的利用比特信息。發(fā)明內(nèi)容本發(fā)明的目的是為克服已有技術(shù)的不足之處，提出一種基于過渡幀判決及處理的激勵信號自然度提高方法，能夠比較充分的利用子帶清濁音判決參數(shù)量化的冗余度，提高清濁音過渡時合成語音的自然度。本發(fā)明提出的基于過渡幀判決及處理的激勵信號自然度提高方法，包括以下步驟在編碼端，依次按以下步驟執(zhí)行步驟(1)對輸入語音信號樣點按時間順序分幀；步驟(2)對當(dāng)前幀提取基音周期參數(shù)；步驟(3)對當(dāng)前幀提取能量參數(shù)；步驟(4) 對當(dāng)前幀提取余量譜幅度參數(shù)；步驟(5)對當(dāng)前幀提取子帶清濁音判決參數(shù)；步驟(6)求取當(dāng)前幀前后各60個樣點的平均能量，當(dāng)后60個樣點的平均能量大于前60個樣點平均能量的32倍時，判定當(dāng)前幀為過渡幀；步驟(7)若當(dāng)前幀為過渡幀，并且步驟(5)中求取的子帶清濁音判決參數(shù)為除10000以外的其他模式，則將第一個子帶的清濁音判決參數(shù)置為0， g卩，假設(shè)步驟(5)中求取的模式為11100，則修改為01100;步驟(8)將步驟(2)、步驟(3)和步驟(4)求取的特征參數(shù)以及步驟(7)修正的清濁音判決參數(shù)進(jìn)行量化，將量化索引傳遞給解碼端；在解碼端，依次按以下步驟執(zhí)行步驟(r)解碼端根據(jù)步驟(8)發(fā)送的量化索引進(jìn)行解量化，得到合成激勵信號所需的參數(shù)若清濁音判決參數(shù)中第一個子帶的清濁音判決參數(shù)為0，并且后四個子帶的清濁音判決參數(shù)不全為0，解碼端自動將第一個子帶的清濁音判決參數(shù)置為1，并判定當(dāng)前幀為過渡幀；步驟(2')將步驟(r)修正的第一個子帶的清濁音判決參數(shù)作為當(dāng)前幀的全帶清濁音判決參數(shù)；步驟(3')對步驟(r)中所得到的參數(shù)進(jìn)行插值。若前一幀和當(dāng)前幀為濁音幀，并且基音周期的變化率小于22.5%，則對解碼端所得參數(shù)采用逐點的線性插值；若前一幀為清音幀且當(dāng)前幀為濁音幀，并且當(dāng)前幀不為過渡幀，則不進(jìn)行插值；否則采用分段插值；步驟(4')根據(jù)步驟(3')中插值后的參數(shù)合成激勵信號。本發(fā)明的特點是對分幀后的語音信號采用過渡幀判決的方法，并且根據(jù)當(dāng)前幀是否為過渡幀來修正子帶清濁音判決參數(shù)。原有的技術(shù)對各個子帶的清濁音判決參數(shù)采用簡單的lbit 量化，它沒有考慮到子帶清濁音判決參數(shù)中一些不存在的模式，因此增加了量化的冗余度。本發(fā)明利用了子帶清濁音判決參數(shù)的冗余度，根據(jù)當(dāng)前幀前后各60個樣點的平均能量比值判定當(dāng)前幀是否為過渡幀，根據(jù)當(dāng)前幀是否為過渡幀來決定是否修正子帶清濁音判決參數(shù)。解碼端根據(jù)接收到的子帶清濁音判決參數(shù)判定當(dāng)前幀是否為過渡幀，并對第一個子帶的清濁音判決參數(shù)進(jìn)行修正，根據(jù)當(dāng)前幀是否為過渡幀而采用不同的插值方案。本方法可以降低參數(shù)量化的冗余度，提高清濁音過渡時合成語音的自然度。該方法主要針對于SELP 2.4kbps聲碼器。

圖1為已有技術(shù)的激勵信號合成方法流程框圖。圖2為本發(fā)明提出的激勵信號合成方法流程框圖。
具體實施方式
本發(fā)明提出的基于過渡幀判決及處理的激勵信號自然度提高方法結(jié)合附圖及實施例進(jìn)一步說明如下本發(fā)明的方法流程如圖2所示，包括以下步驟-在編碼端，依次按以下步驟執(zhí)行步驟(1) 對輸入語音信號樣點按時間順序分幀；步驟(2)對當(dāng)前幀提取基音周期參數(shù)；步驟(3) 對當(dāng)前幀提取能量參數(shù)；步驟(4)對當(dāng)前幀提取余量譜幅度參數(shù)；步驟(5)對當(dāng)前幀提取子帶清濁音判決參數(shù)；步驟(6)求取當(dāng)前幀前后各60個樣點的平均能量，當(dāng)后60個樣點的平均能量大于前60個樣點平均能量的32倍時，判定當(dāng)前幀為過渡幀；步驟(7)若當(dāng)前幀為過渡幀，并且步驟(5)中求取的子帶清濁音判決參數(shù)為除10000以外的其他模式，則將第一個子帶的清濁音判決參數(shù)置為0， B卩，假設(shè)步驟(5)中求取的模式為11100，則修改為01100; 步驟(8)將歩驟(2)、步驟(3)和步驟(4)求取的特征參數(shù)以及步驟(7)修正的清濁音判決參數(shù)進(jìn)行量化，將量化索引傳遞給解碼端；在解碼端，依次按以下步驟執(zhí)行步驟(i')解碼端根據(jù)步驟(8)發(fā)送的量化索引進(jìn)行解量化，得到合成激勵信號所需的參數(shù)若清濁音判決參數(shù)中第一個子帶的清濁音判決參數(shù)為O，并且后四個子帶的清濁音判決參數(shù)不全為0，解碼端自動將第一個子帶的清濁音判決參數(shù)置為1，并判定當(dāng)前幀為過渡幀；步驟(2')將步驟(1，)修正的第一個子帶的清濁音判決參數(shù)作為當(dāng)前幀的全帶清濁音判決參數(shù)；步驟(3')對步驟(r)中所得到的參數(shù)進(jìn)行插值。若前一幀和當(dāng)前幀為濁音幀，并且基音周期的變化率小于22.5%，則對解碼端所得參數(shù)采用逐點的線性插值；若前一幀為清音幀且當(dāng)前幀為濁音幀，并且當(dāng)前幀不為過渡幀，則不進(jìn)行插值；否則采用分段插值；步驟(4')根據(jù)步驟(3')中插值后的參數(shù)合成激勵信號。本發(fā)明上述方法各步驟的具體實施例分別詳細(xì)說明如下上述方法步驟(1)對輸入語音信號樣點按時間順序分幀的實施例是按8khz頻率采樣、己經(jīng)過高通濾波去除工頻干擾的語音樣點。同原有的SELP2.4kbps聲碼器一樣，每25ms，也就是200個語音樣點構(gòu)成一幀。上述方法步驟(2)的實施例為按美國政府2400b/s混合激勵的線性預(yù)測(MELP)語音編碼算法標(biāo)準(zhǔn)所描述的方法求取當(dāng)前幀的基音周期參數(shù)尸"c/z。上述方法步驟(3)的實施例為按美國政府2400b/s混合激勵的線性預(yù)測(MELP)語音編碼算法標(biāo)準(zhǔn)所描述的方法求取當(dāng)前幀的能量參數(shù)7 MS。上述方法步驟(4)的實施例為按美國政府2400b/s混合激勵的線性預(yù)測(MELP)語音編碼算法標(biāo)準(zhǔn)所描述的方法求當(dāng)前幀的余量譜幅度參數(shù)，記為矢量W，其維數(shù)為"。丑=|>^2廣'，~]，"二10上述方法步驟(5)的實施例為按美國政府2400b/s混合激勵的線性預(yù)測(MELP)語音編碼算法標(biāo)準(zhǔn)所描述的方法對當(dāng)前幀提取5個子帶的清濁音參數(shù)，子帶為清音用"0"表示，子帶為濁音用"1"表示，得到5個子帶清濁音判決參數(shù)，記為， 2 ， ~3 ， ~4 ， 5 ]。上述方法步驟(6)的實施例為計算當(dāng)前幀前后各60個樣點的平均能量，公式表示如下A = S[X—)]五2二Z["附)]。用一個過渡幀標(biāo)志位化"y7"g來表征當(dāng)前幀m=0 m=140是否為過渡幀。若五2/五1>32，判定當(dāng)前幀為過渡幀，并將"q/7ag置為i;反之將其置為o。上述方法步驟(7)的實施例為若過渡幀判決標(biāo)志位""y "g=i ，并且F6/72 + r6/73 + ^7/ 4 + KZ^5 # 0 ，則令F6/^ = 0 。上述方法步驟(8)的實施例為按美國政府2400b/s混合激勵的線性預(yù)測(MELP)語音編碼算法標(biāo)準(zhǔn)所描述的方法對當(dāng)前幀的特征參數(shù)進(jìn)行量化，發(fā)送量化索引。上述方法步驟(r)的實施例為按美國政府2400b/s混合激勵的線性預(yù)測(MELP)語音編碼算法標(biāo)準(zhǔn)所描述的方法根據(jù)量化索引對當(dāng)前幀的特征參數(shù)進(jìn)行解量化。若J^A = 0,并且rZ^2+F&/73+FZj/ 4+FZ^5#0 ，則令KZ^二l， Zra^7"g二l;反之，令化q/7"g = 0 。上述方法步驟(2')的實施例為令r^p二rz ^，其中「^p為全帶清濁音判決參數(shù)。上述方法步驟(3，)的實施例為若W^。w =^^ ew =1 ，且i^c/2。w—i^c/z,|<0.225x戶"c/7腳，則對解碼端的戶/fc/z 、 ^RMS、 A以及[M^，r 2， f^ 3,r^4, W>/ 5]參數(shù)采用逐點的線性插值；若^P。w = 0 ， f^/7腳=1 ，i^q/7ag = 0，則不進(jìn)行插值；否則采用分段插值。逐點的線性插值采用如下計算公式<formula>formula see original document page 8</formula>分段插值采用如下計算公式<formula>formula see original document page 8</formula>不進(jìn)行插值時，有<formula>formula see original document page 8</formula>其中，P"r。w為前一幀的參數(shù)，P"r,為當(dāng)前幀的參數(shù)，P"""為插值后的參數(shù)，W 為語音樣點的個數(shù)，這里取200。上述方法步驟(4')的實施例為按美國政府2400b/s混合激勵的線性預(yù)測(MELP)語音編碼算法標(biāo)準(zhǔn)所描述的方法，利用子帶清濁音判決、基音周期參數(shù)、余量譜幅度參數(shù)和能量參數(shù)進(jìn)行激勵信號合成。
權(quán)利要求
1. 基于過渡幀判決及處理的激勵信號自然度提高方法，其特征在于，所述方法在編、解碼端依次按以下步驟實現(xiàn)在編碼端，依次按如下步驟執(zhí)行步驟(1)對輸入語音信號樣點按時間順序分幀；步驟(2)對當(dāng)前幀提取基音周期參數(shù)；步驟(3)對當(dāng)前幀提取能量參數(shù)；步驟(4)對當(dāng)前幀提取余量譜幅度參數(shù)；步驟(5)對當(dāng)前幀提取子帶清濁音判決參數(shù)；步驟(6)求取當(dāng)前幀前后各60個樣點的平均能量，當(dāng)后60個樣點的平均能量大于前60個樣點平均能量的32倍時，判定當(dāng)前幀為過渡幀；步驟(7)若當(dāng)前幀為過渡幀，并且步驟(5)中求取的子帶清濁音判決參數(shù)為除10000以外的其他模式，則將第一個子帶的清濁音判決參數(shù)置為0，即，假設(shè)步驟(5)中求取的模式為11100，則修改為01100；步驟(8)將步驟(2)、步驟(3)和步驟(4)求取的特征參數(shù)以及步驟(7)修正的清濁音判決參數(shù)進(jìn)行量化，將量化索引傳遞給解碼端；在解碼端，依次按如下步驟執(zhí)行步驟(1′)解碼端根據(jù)步驟(8)發(fā)送的量化索引進(jìn)行解量化，得到合成激勵信號所需的參數(shù)若清濁音判決參數(shù)中第一個子帶的清濁音判決參數(shù)為0，并且后四個子帶的清濁音判決參數(shù)不全為0，解碼端自動將第一個子帶的清濁音判決參數(shù)置為1，并判定當(dāng)前幀為過渡幀；步驟(2′)將步驟(1’)修正的第一個子帶的清濁音判決參數(shù)作為當(dāng)前幀的全帶清濁音判決參數(shù)；步驟(3′)對步驟(1’)中所得到的參數(shù)進(jìn)行插值。若前一幀和當(dāng)前幀為濁音幀，并且基音周期的變化率小于22.5％，則對解碼端所得參數(shù)采用逐點的線性插值；若前一幀為清音幀且當(dāng)前幀為濁音幀，并且當(dāng)前幀不為過渡幀，則不進(jìn)行插值；否則采用分段插值；步驟(4′)根據(jù)步驟(3’)中插值后的參數(shù)合成激勵信號。
全文摘要
基于過渡幀判決及處理的激勵信號自然度提高方法屬于低速率語音壓縮編碼技術(shù)領(lǐng)域。若當(dāng)前幀前后各60個樣點的平均能量比值小于1/32，則被判定為過渡幀，并用子帶清濁音矢量的冗余模式進(jìn)行表示，解碼端對參數(shù)進(jìn)行解量化，根據(jù)解碼得到的子帶清濁音矢量判決當(dāng)前幀是否為過渡幀，若判定為非過渡幀，再判決當(dāng)前幀是否為濁音幀且前一幀是否為清音幀，若是，則在合成激勵信號時，解碼端當(dāng)前幀參數(shù)不與前一幀參數(shù)進(jìn)行插值。這種方法可以提高合成語音的自然度。該方法適用于SELP 2.4kbps聲碼器。
文檔編號G10L19/00GK101261836SQ20081010513
公開日2008年9月10日申請日期2008年4月25日優(yōu)先權(quán)日2008年4月25日
發(fā)明者昆唐, 崔慧娟, 曄李, 哲計申請人:清華大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：崔慧娟;唐昆;計哲;李曄
技術(shù)所有人：清華大學(xué)
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

ps圖片接縫自然過渡相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于過渡幀判決及處理的激勵信號自然度提高方法