1kb/s線譜頻率參數(shù)的一步插值預(yù)測矢量量化方法

文檔序號：2836639閱讀：374來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：1kb/s線譜頻率參數(shù)的一步插值預(yù)測矢量量化方法
技術(shù)領(lǐng)域：
1kb/s線譜頻率參數(shù)的一步插值預(yù)測矢量量化方法，屬于語音信號處理，可應(yīng)用于中低速率語音編碼和參數(shù)語音合成系統(tǒng)中。
對于低速率語音編碼，人們希望用盡可能少的比特?cái)?shù)量化LSF參數(shù)，達(dá)到透明量化的指標(biāo)。標(biāo)量量化是常見的一種LSF參數(shù)量化方法，這種方法是對每一個LSF參數(shù)分別量化，若要達(dá)到平均譜失真小于1dB，則每幀至少需要32比特。在低速率語音編碼情況下，比如在5kb/s以下速率，分配給LSF參數(shù)的比特?cái)?shù)比較少，這時標(biāo)量量化顯然不是適合的方法。
由于矢量量化在相同的比特?cái)?shù)下能比標(biāo)量量化給出更低的量化失真，所以，在低速率語音編碼和參數(shù)語音合成中，LSF參數(shù)的量化主要采用矢量量化的方法，但直接應(yīng)用矢量量化方法會存在碼書存儲量大、計(jì)算復(fù)雜度高等問題。為了克服這些問題，人們大多采用各種次優(yōu)矢量量化方法，如，多級矢量量化、分裂矢量量化和預(yù)測矢量量化等。但這些方法透明量化LSF參數(shù)所需的比特率都較高，一般都在1kb/s以上。
本發(fā)明是基于矢量量化原理，利用LSF參數(shù)的幀間和幀內(nèi)相關(guān)性，在幀內(nèi)采用一步預(yù)測和在幀間采用一步內(nèi)插的方法設(shè)計(jì)了一種1kb/s LSF參數(shù)的矢量量化器，對通過一步內(nèi)插預(yù)測過程消除冗余度的LSF預(yù)測殘差矢量r(n)進(jìn)行矢量量化。
本發(fā)明矢量量化的工作過程是在計(jì)算機(jī)處理器中完成，其技術(shù)方案如

圖1所示。
圖1中ω(n)為去除均值的第n幀LSF矢量，為去除均值的第n幀LSF的量化矢量，為第n幀ω(n)的預(yù)測矢量，r(n)為第n幀LSF的預(yù)測誤差矢量，為第n幀量化的LSF預(yù)測誤差矢量，k1(n)和k2(n)分別表示第n幀兩個LSF殘差碼書的碼矢量標(biāo)號。圖1的工作原理如下編碼端
首先，將第n幀量化的第i-1個線譜頻率與第n-1幀量化的第i個線譜頻率的加權(quán)和作為第n幀的第i個線譜頻率的預(yù)測值，即ω~i(n)=αiω^i-1(n)+βi(ω)^i(n-1),i=1,2,···,p]]>式中αi和βi稱為權(quán)系數(shù)。由于本發(fā)明僅考慮了第n幀與第n-1幀的LSF相關(guān)性以及第n幀的第i個LSF和第i-1個LSF的相關(guān)性，所以稱上述加權(quán)求和過程為一步內(nèi)插預(yù)測過程，一步內(nèi)插是指將第n-1幀量化的第i個線譜頻率乘以權(quán)系數(shù)βi，一步預(yù)測是指將第n幀量化的第i-1個線譜頻率乘以權(quán)系數(shù)αi，所以，我們又稱αi和βi為幀內(nèi)預(yù)測系數(shù)和幀間內(nèi)插系數(shù)。權(quán)系數(shù)αi和βi可以從訓(xùn)練序列中估計(jì)出來，并在量化器中保持為常數(shù)。αi和βi的具體估計(jì)方法為令第i個LSF的平方預(yù)測誤差為Ei=Σn=1Nf[ri(n)]2=Σn=1Nf[ωi(n)-αiω^i-1(n)-βiω^i(n-1)]2]]>式中Nf為LSF訓(xùn)練矢量的總數(shù)，ri(n)為r(n)的第i個元素。估計(jì)時用原始數(shù)據(jù)ωi(n)代替量化數(shù)據(jù) 。根據(jù)最小二乘估計(jì)原理，令Ei/αi＝0和Ei/βi＝0，并解二元一次方程，得系數(shù)αi和βi為αi=(Σn=1Nfωi(n)ωi-1(n))(Σn=1Nfωi(n-1)ωi(n-1))-(Σn=1Nfωi(n)ωi(n-1))(Σn=1Nfωi(n-1)ωi-1(n))(Σn=1Nfωi-1(n)ωi-1(n))(Σn=1Nfωi(n-1)ωi(n-1))-(Σn=1Nfωi-1(n)ωi(n-1))2,i=2,3,···,10,]]>βi=(Σn=1Nfωi(n)ωi(n-1))(Σn=1Nfωi-1(n)ωi-1(n))-(Σn=1Nfωi(n)ωi-1(n))(Σn=1Nfωi-1(n)ωi(n-1))(Σn=1Nfωi-1(n)ωi-1(n))(Σn=1Nfωi(n-1)ωi(n-1))-(Σn=1Nfωi-1(n)ωi(n-1))2,i=2,3,···,10,]]>
α1＝0.0β1=Σn=1Nfωi(n)ωi(n-1)Σn=1Nfωi(n-1)ωi(n-1)]]>第二，將輸入量化器的無偏線譜頻率ωi(n)與其預(yù)測值相減，得到LSF殘差矢量r(n)。預(yù)測誤差ri(n)的動態(tài)范圍比ωi(n)的動態(tài)范圍減小了很多，因而非常適合于作為量化的對象以提高量化的效率，這一點(diǎn)可以從圖2和圖3的歸一化統(tǒng)計(jì)直方圖中看出。其中，圖2是ωi(n)的統(tǒng)計(jì)直方圖，圖3是ri(n)的統(tǒng)計(jì)直方圖，橫坐標(biāo)表示歸一化的LSF預(yù)測誤差。
第三，將預(yù)測誤差矢量r(n)分裂成兩個子矢量，令前四個分量構(gòu)成一個子矢量，后六個分量構(gòu)成一個子矢量，這兩個子矢量分別與兩個10bit碼書中的碼矢量進(jìn)行Paliwal加權(quán)失真比較，得到兩個重構(gòu)的殘差子矢量 i＝1，…，4和 i＝5，…，10，這里k1(n)和k2(n)分別表示進(jìn)入信道的兩個殘差碼書的碼矢量標(biāo)號，將這兩個重構(gòu)的殘差子矢量合并，得到重建的殘差矢量圖1中的LSF殘差碼書由1個4維矢量碼書和1個6維矢量碼書構(gòu)成，每個碼書均包含1024個碼矢量，即各為10比特碼書。4維矢量碼書由r(n)的前4個元素的訓(xùn)練序列獲得，6維矢量碼書由r(n)的后6個元素的訓(xùn)練序列獲得。4維和6維預(yù)測殘差碼書均采用傳統(tǒng)的LBG算法訓(xùn)練，訓(xùn)練數(shù)據(jù)為漢語語音，長度約為1個小時，采樣率為8kHz，精度為16位線性PCM。
4維和6維殘差輸入矢量分別與4維和6維殘差碼書中的每一個碼矢量進(jìn)行失真比較時，使用的失真測度為E1=Σi=14[CiWi(ri(n)-r^i(n)(k1(n)))]2]]>和E2=Σi=510[CiWi(ri(n)-r^i(n)(k2(n)))]2]]>式中Ci和Wi為Paliwal加權(quán)因子，γ＝0.15為Paliwal經(jīng)驗(yàn)常數(shù)。
第四，將重構(gòu)的殘差矢量加上預(yù)測矢量得到LSF的無偏重構(gòu)矢量，該重構(gòu)矢量將用于下一幀的一步內(nèi)插預(yù)測。
譯碼端首先，譯碼端根據(jù)收到的標(biāo)號k1(n)和k2(n)，通過查表從兩個碼書中找到對應(yīng)的重構(gòu)殘差子矢量 i＝1，…，4和 i＝5，…，10，將這兩個重構(gòu)的殘差子矢量合并，得到重建的殘差矢量第二，用一步內(nèi)插預(yù)測過程得到LSF的預(yù)測矢量第三，將加上預(yù)測矢量得到LSF的無偏重構(gòu)矢量第四，將加上LSF的均值，得到最終恢復(fù)的LSF參數(shù)。該均值是事先從所有LSF訓(xùn)練矢量集中計(jì)算得到的，在量化器中為常數(shù)。
獲得了透明的量化結(jié)果，滿足了低速率語音編碼對聲道參數(shù)進(jìn)行透明量化的要求。
譯碼端當(dāng)收到來自編碼端的碼矢量標(biāo)號k1(n)和k2(n)后，同編碼端一樣，按如下邏輯得到譯碼的無偏LSF矢量ω~1(n)=β1ω^1(n-1)]]>ω^1(n)=r^1(n)(k1(n))+ω~1(n)]]>
for i＝2 to 4ω~i(n)=αiω^i-1(n)+βiω^i(n-1)]]>ω^i(n)=r^i(n)(k1(n))+ω~i(n)]]>endfor i＝5 to 10ω~i(n)=αiω^i-1(n)+βiω^i(n-1)]]>ω^i(n)=r^i(n)(k2(n))+ω~i(n)]]>end最后重建的LSF矢量為ωi(n)(q)=ω&OverBar;i+ω^i(n),i=1,2,···10]]>實(shí)驗(yàn)效果本發(fā)明用訓(xùn)練語音外的500秒漢語語音產(chǎn)生2500個LSF矢量，經(jīng)過圖1所示的矢量量化器量化，按國際通用的譜失真計(jì)算方法，當(dāng)每幀分配20比特(4維和6維殘差碼書各用10比特)用于量化LSF參數(shù)時，得到的平均譜失真為0.94dB，譜失真介于2dB和4dB之間的幀的百分比僅為1.998％(＜2％)，而譜失真大于4dB的幀的百分比為零，圖4給出了譜失真統(tǒng)計(jì)直方圖，這些數(shù)據(jù)說明，本發(fā)明中的LSF參數(shù)一步插值預(yù)測矢量量化方法在1kb/s(＝幀速率×比特/幀＝50×20)達(dá)到了透明的量化性能。
權(quán)利要求
1.1kb/s線譜頻率參數(shù)的一步插值預(yù)測矢量量化方法，包含在計(jì)算機(jī)處理器中完成對語音信號的線譜頻率參數(shù)(LSF)進(jìn)行量化，本發(fā)明的特征在于基于矢量量化原理，利用LSF參數(shù)的幀間和幀內(nèi)相關(guān)性，在幀內(nèi)采用一步預(yù)測和在幀間采用一步內(nèi)插的方法設(shè)計(jì)了一種1kb/s LSF參數(shù)的矢量量化器，對通過一步內(nèi)插預(yù)測過程消除冗余度的LSF預(yù)測殘差矢量r(n)進(jìn)行矢量量化，矢量量化的工作流程如下編碼過程首先，將第n幀量化的第i-1個線譜頻率與第n-1幀量化的第i個線譜頻率的加權(quán)和作為第n幀的第i個線譜頻率的預(yù)測值，即ω~i(n)=αiω^i-1(n)+βiω^i(n-1),i=1,2,···,p]]>式中αi和βi稱為權(quán)系數(shù)，又稱αi和βi為幀內(nèi)預(yù)測系數(shù)和幀間內(nèi)插系數(shù)；一步內(nèi)插預(yù)測過程是指僅考慮第n幀與第n-1幀的LSF相關(guān)性以及第n幀的第i個LSF和第i-1個LSF的相關(guān)性的加權(quán)求和過程；一步內(nèi)插是指將第n-1幀量化的第i個線譜頻率乘以權(quán)系數(shù)βi；一步預(yù)測是指將第n幀量化的第i-1個線譜頻率乘以權(quán)系數(shù)αi；根據(jù)最小二乘原理，權(quán)系數(shù)αi和βi可以從LSF的訓(xùn)練序列中計(jì)算出來，并在量化器中保持為常數(shù)；第二，將輸入量化器的無偏線譜頻率ωi(n)與其預(yù)測值相減，得到LSF殘差矢量r(n)；第三，將預(yù)測誤差矢量r(n)分裂成兩個子矢量，令前四個分量構(gòu)成一個子矢量，后六個分量構(gòu)成一個子矢量，這兩個子矢量分別與兩個10bit碼書中的碼矢量進(jìn)行Paliwal加權(quán)失真比較，得到兩個重構(gòu)的殘差子矢量 i＝1，…，4和 i＝5，…，10；這里k1(n)和k2(n)分別表示進(jìn)入信道的兩個殘差碼書的碼矢量標(biāo)號，將這兩個重構(gòu)的殘差子矢量合并，得到重建的殘差矢量第四，將重構(gòu)的殘差矢量加上預(yù)測矢量得到LSF的無偏重構(gòu)矢量，該重構(gòu)矢量將用于下一幀的一步內(nèi)插預(yù)測過程；譯碼過程首先，譯碼端根據(jù)收到的標(biāo)號k1(n)和k2(n)，通過查表從兩個碼書中找到對應(yīng)的重構(gòu)殘差子矢量 i＝1，…，4和 i＝5，…，10，將這兩個重構(gòu)的殘差子矢量合并，得到重建的殘差矢量第二，用一步內(nèi)插預(yù)測過程得到LSF的預(yù)測矢量第三，將加上預(yù)測矢量得到LSF的無偏重構(gòu)矢量第四，將加上LSF的均值，得到最終恢復(fù)的LSF參數(shù)。
全文摘要
1kb/s線譜頻率參數(shù)的一步插值預(yù)測矢量量化方法，屬于語音信號處理，可應(yīng)用于中低速率語音編碼和參數(shù)語音合成系統(tǒng)中。本發(fā)明矢量量化的工作過程是在計(jì)算機(jī)處理器中完成，其特征在于，基于矢量量化原理，利用LSF參數(shù)的幀間和幀內(nèi)相關(guān)性，在幀內(nèi)采用一步預(yù)測和在幀間采用一步內(nèi)插的方法設(shè)計(jì)了一種1kb/s LSF參數(shù)的矢量量化器，對通過一步內(nèi)插預(yù)測過程消除冗余度的LSF預(yù)測殘差矢量進(jìn)行矢量量化，獲得了透明的量化結(jié)果，滿足了低速率語音編碼對聲道參數(shù)進(jìn)行透明量化的要求。
文檔編號G10L19/00GK1420487SQ0215667
公開日2003年5月28日申請日期2002年12月19日優(yōu)先權(quán)日2002年12月19日
發(fā)明者鮑長春申請人:北京工業(yè)大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：鮑長春
技術(shù)所有人：北京工業(yè)大學(xué)
我是此專利的發(fā)明人

上一篇：2.3kb/s諧波激勵線性預(yù)測語音編碼方法
上一篇：八音盒的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

光譜頻率相關(guān)技術(shù)

頻率譜相關(guān)技術(shù)

梅爾頻率倒譜系數(shù)相關(guān)技術(shù)

紅外光譜基團(tuán)頻率表相關(guān)技術(shù)

mel頻率倒譜系數(shù)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

1kb/s線譜頻率參數(shù)的一步插值預(yù)測矢量量化方法