自適應(yīng)激勵矢量量化裝置和自適應(yīng)激勵矢量量化方法

文檔序號：2830585閱讀：245來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：自適應(yīng)激勵矢量量化裝置和自適應(yīng)激勵矢量量化方法
技術(shù)領(lǐng)域：
本發(fā)明涉及在CELP(Code Excited Linear Prediction,碼激勵線性預(yù)測)方式的語音編碼中進(jìn)行自適應(yīng)激勵(excitation)的矢量量化的自適應(yīng)激勵矢量量化裝置和自適應(yīng)激勵矢量量化方法，特別涉及在以因特網(wǎng)通信為代表的分組通信系統(tǒng)或移動通信系統(tǒng)等的領(lǐng)域中，進(jìn)行語音信號的編碼的語音編碼裝置所使用的自適應(yīng)激勵矢量量化裝置和自適應(yīng)激勵矢量量化方法。
背景技術(shù)：
在數(shù)字無線通信、以因特網(wǎng)通信為代表的分組通信或語音存儲等領(lǐng)域中，為了實現(xiàn)電波等的傳輸路徑容量或存儲媒體的有效利用，語音信號的編碼和解碼技術(shù)必不可少。尤其，CELP方式的語音編碼和解碼纟支術(shù)成為主流的技術(shù) (例如，參照非專利文獻(xiàn)1)。CELP方式的語音編碼裝置基于預(yù)先存儲的語音模型，對輸入語音進(jìn)行編碼。具體而言，CELP方式的語音編碼裝置將數(shù)字化后的語音信號劃分為 10至20ms左右的一定時間間隔的幀，對各個幀內(nèi)的語音信號進(jìn)行線性預(yù)測分析來求線性預(yù)測系數(shù)(LPC: Linear Prediction Coefficient)和線性預(yù)測殘差矢量，并分別單獨地對線性預(yù)測系數(shù)和線性預(yù)測殘差矢量進(jìn)行編碼。在CELP 方式的語音編碼/解碼裝置中，利用存儲有過去所生成的驅(qū)動激勵信號的自適應(yīng)激勵碼本以及存儲有特定數(shù)個固定形狀的矢量(固定代碼矢量)的固定碼本，對線性預(yù)測殘差矢量進(jìn)行編碼/解碼。其中，自適應(yīng)激勵碼本用于表示線性預(yù) 測殘差矢量所具有的周期性分量，另一方面，固定碼本用于表示在線性預(yù)測殘差矢量中無法通過自適應(yīng)激勵碼本表示的非周期性分量。另外，在線性預(yù)測殘差矢量的編碼/解碼處理中，一般將幀劃分為更短的時間單位(5ms至10ms左右)的子幀來進(jìn)行。在非專利文獻(xiàn)2所記載的ITU-T 建議G.729中，通過將幀劃分為兩個子幀，對兩個子幀分別使用自適應(yīng)激勵碼本搜索音調(diào)(pitch)周期，進(jìn)行自適應(yīng)激勵的矢量量化。這樣的以子幀為單位的自適應(yīng)激勵矢量量化方法與以幀為單位的自適應(yīng)激勵矢量量化方法相比，能夠降低自適應(yīng)激勵矢量量化方法的運算量。非專利文獻(xiàn)1: M.R.Schroeder、 B.S.Atal著、「 IEEE proc. ICASSP J、 1985、「 Code Excited Linear Prediction: High Quality Speech at Low Bit Rate J、 p.937-940非專利文獻(xiàn)2: "ITU-T Recommendation G.729", ITU-T, 1996/3, pp. 17陽19 發(fā)明內(nèi)容本發(fā)明要解決的問題然而，在如上所述的以各個子幀為單位進(jìn)行自適應(yīng)激勵矢量量化的裝置中，各個子幀的音調(diào)周期搜索處理所使用的信息量不同時，例如在第一子幀的自適應(yīng)激勵矢量量化所使用的信息量為8比特、以及第二子幀的自適應(yīng)激勵矢量量化所使用的信息量為4比特時，存在以下的問題，即在兩個子幀的自適應(yīng)激勵矢量量化的精度上產(chǎn)生偏移，第二子幀的自適應(yīng)激勵矢量量化精度低于第一子幀的自適應(yīng)激勵矢量量化精度，但未進(jìn)行降低自適應(yīng)激勵矢量量化精度的偏移的處理。本發(fā)明的目的在于，提供自適應(yīng)激勵矢量量化裝置和自適應(yīng)激勵矢量量化方法，其在以子幀為單位進(jìn)行線性預(yù)測編碼的CELP語音編碼中，利用不同的信息量進(jìn)行各個子幀的自適應(yīng)激勵矢量量化時，能夠降低各個子幀的自適應(yīng)激勵矢量量化的量化精度的偏移，提高整體的語音編碼精度。解決問題的方案本發(fā)明的自適應(yīng)激勵矢量量化裝置，輸入通過將長度為n的幀劃分為多個長度為m的子幀進(jìn)行線性預(yù)測分析所生成的長度為m的線性預(yù)測殘差矢量和線性預(yù)測系數(shù)，對第一子幀使用比對第二子幀多的比特數(shù)，進(jìn)行每個子幀的自適應(yīng)激勵矢量量化，其中n和m為整數(shù)，該自適應(yīng)激勵矢量量化裝置所采用的結(jié)構(gòu)包括自適應(yīng)激勵矢量生成單元，從自適應(yīng)激勵碼本中切割出長度為r的自適應(yīng)激勵矢量，其中，nKSn;目標(biāo)矢量構(gòu)成單元，根據(jù)所述多個子幀的所述線性預(yù)測殘差矢量生成長度為r的目標(biāo)矢量；合成濾波器，利用所述各個子幀的所述線性預(yù)測系數(shù)，生成rxr的脈沖響應(yīng)矩陣；評價尺度計算單元，利用所述長度為r的自適應(yīng)激勵矢量、所述長度為r的目標(biāo)矢量以及所述rxr的脈沖響應(yīng)矩陣，對多個音調(diào)周期的候補，計算自適應(yīng)激勵矢量量化的評價尺度；以及評價尺度比較單元，比較與所述多個音調(diào)周期的候補對應(yīng)的所述評價尺度，求使所述評價尺度最大的音調(diào)周期作為所述第一子幀的自適應(yīng)激勵矢量量化結(jié)果。本發(fā)明的自適應(yīng)激勵矢量量化方法，輸入通過將長度為n的幀劃分為多個長度為m的子幀進(jìn)行線性預(yù)測分析所生成的長度為m的線性預(yù)測殘差矢量和線性預(yù)測系數(shù)，對第一子幀使用比對第二子幀多的比特數(shù)，進(jìn)行每個子幀的自適應(yīng)激勵矢量量化，其中n和m為整數(shù)，該自適應(yīng)激勵矢量量化方法包括以下的步驟從自適應(yīng)激勵碼本中切割出長度為r的自適應(yīng)激勵矢量，其中，m<r^n;根據(jù)所述多個子幀的所述線性預(yù)測殘差矢量生成長度為r的目標(biāo) 矢量；利用所述各個子幀的所述線性預(yù)測系數(shù)，生成rxr的脈沖響應(yīng)矩陣；利用所述長度為r的自適應(yīng)激勵矢量、所述長度為r的目標(biāo)矢量以及所述rxr 的脈沖響應(yīng)矩陣，對多個音調(diào)周期的候補，計算自適應(yīng)激勵矢量量化的評價尺度；以及比較與所述多個音調(diào)周期的候補對應(yīng)的所述評價尺度，求使所述評價尺度最大的音調(diào)周期作為所述第一子幀的自適應(yīng)激勵矢量量化結(jié)果。發(fā)明的效果根據(jù)本發(fā)明，在以子幀為單位進(jìn)行線性預(yù)測編碼的CELP語音編碼中，與第二子幀相比，在第一子幀中利用較多的信息量進(jìn)行以子幀為單位的自適應(yīng)激勵矢量量化時，通過以各個子幀為單位的線性預(yù)測系數(shù)，構(gòu)成具有長于子幀長度的行和列的脈沖響應(yīng)矩陣，并從自適應(yīng)激勵碼本中切割出長于子幀長度的自適應(yīng)激勵矢量，進(jìn)行第一子幀的自適應(yīng)激勵矢量量化。由此，能夠降低各個子幀的自適應(yīng)激勵矢量量化的量化精度的偏移，能夠提高整體的語音編碼精度。

圖1是表示本發(fā)明的實施方式1的自適應(yīng)激勵矢量量化裝置的主要結(jié)構(gòu) 的方框圖。圖2是表示本發(fā)明的實施方式1的自適應(yīng)激勵碼本所具備的驅(qū)動激勵的圖。圖3是表示本發(fā)明的實施方式1的自適應(yīng)激勵矢量逆量化裝置的主要結(jié) 構(gòu)的方框圖。圖4是表示本發(fā)明的實施方式2的自適應(yīng)激勵矢量量化裝置的主要結(jié)構(gòu) 的方框圖。圖5是表示本發(fā)明的實施方式2的自適應(yīng)激勵矢量量化裝置的主要結(jié)構(gòu) 的方框圖。圖6是表示本發(fā)明的實施方式2的自適應(yīng)激勵矢量量化裝置的主要結(jié)構(gòu) 的方框圖。
具體實施方式
在本發(fā)明的各個實施方式中，采用以下的情況為例，即在包含自適應(yīng)激勵矢量量化裝置的CELP語音編碼裝置中，將構(gòu)成16kHz的語音信號的各個幀分別劃分為兩個子幀，對各個子幀進(jìn)行線性預(yù)測分析，求每個子幀的線性預(yù)測系數(shù)和線性預(yù)測殘差矢量。另外，在以下的說明中，將幀長度表記為n, 將子幀長度表記為m。以下，參照附圖詳細(xì)地說明本發(fā)明的實施方式。C實施方式1)圖1是表示本發(fā)明的實施方式1的自適應(yīng)激勵矢量量化裝置100的主要結(jié)構(gòu)的方框圖。在圖1中，自適應(yīng)激勵矢量量化裝置100包括音調(diào)周期指示單元101、音調(diào)周期存儲單元102、自適應(yīng)激勵碼本103、自適應(yīng)激勵矢量生成單元104、合成濾波器105、搜索用目標(biāo)矢量生成單元106、評價尺度計算單元107、以及評價尺度比較單元108。在自適應(yīng)激勵矢量量化裝置100中，輸入每個子幀的子幀索引、線性預(yù)測系數(shù)和目標(biāo)矢量。其中，子幀索引表示在包含本實施方式的自適應(yīng)激勵矢量量化裝置100的CELP語音編碼裝置所獲得的各個子幀是在幀內(nèi)的第幾個子幀。另外，線性預(yù)測系數(shù)和目標(biāo)矢量表示在CELP 語音編碼裝置中對各個子幀進(jìn)行線性預(yù)測分析所求得的每個子幀的線性預(yù)測系數(shù)和線性預(yù)測殘差(激勵信號)矢量。作為線性預(yù)測系數(shù)，利用LPC參數(shù)或可與LPC參數(shù)一對一地互換的頻域的參數(shù)即LSF(Line Spectral Frequency,線譜頻率)參數(shù)、以及LSP(Line Spectral Pairs,線譜對)參數(shù)等。音調(diào)周期指示單元101基于對每個子幀輸入的子幀索引和存儲在音調(diào)周期存儲單元102中的第一子幀的音調(diào)周期，將預(yù)先設(shè)定的音調(diào)周期搜索范圍內(nèi)的音調(diào)周期依序指示給自適應(yīng)激勵矢量生成單元104。音調(diào)周期存儲單元102由用于存儲第一子幀的音調(diào)周期的緩沖器構(gòu)成，每當(dāng)以子幀為單位的音調(diào)周期搜索結(jié)束，基于從評價尺度比較單元108反饋的音調(diào)周期索引IDX，更新內(nèi)置的緩沖器。自適應(yīng)激勵碼本103內(nèi)置存儲了驅(qū)動激勵的緩沖器，每當(dāng)以子幀為單位的音調(diào)周期搜索結(jié)束，基于從評價尺度比較單元108反饋的音調(diào)周期索引 IDX，更新驅(qū)動激勵。自適應(yīng)激勵矢量生成單元104以對每個子幀輸入的子幀索引對應(yīng)的長度，從自適應(yīng)激勵碼本103中切割出具有由音調(diào)周期指示單元101指示的音調(diào)周期的自適應(yīng)激勵矢量，并輸出到評價尺度計算單元107。合成濾波器105利用對每個子幀輸入的線性預(yù)測系數(shù)構(gòu)成合成濾波器，將與對每個子幀輸入的子幀索引對應(yīng)的長度的脈沖響應(yīng)矩陣輸出到評價尺度計算單元107。搜索用目標(biāo)矢量生成單元106將對每個子幀輸入的目標(biāo)矢量相加，從相加而獲得的結(jié)果中切割出與對每個子幀輸入的子幀索引對應(yīng)的長度的搜索用目標(biāo)矢量，并輸出到評價尺度計算單元107。評價尺度計算單元107利用從自適應(yīng)激勵矢量生成單元104輸入的自適應(yīng)激勵矢量、從合成濾波器105輸入的脈沖響應(yīng)矩陣、以及從搜索用目標(biāo)矢量生成單元106輸入的搜索用目標(biāo)矢量，計算音調(diào)周期搜索用的評價尺度即自適應(yīng)激勵矢量量化的評價尺度，并輸出到評價尺度比較單元108。評價尺度比較單元108基于對每個子幀輸入的子幀索引，求在從評價尺度計算單元107輸入的評價尺度最大時的音調(diào)周期，將表示求出的音調(diào)周期的索引IDX輸出到外部，同時反饋給音調(diào)周期存儲單元102和自適應(yīng)激勵碼本103。自適應(yīng)激勵矢量量化裝置100的各個單元進(jìn)行以下的動作。在對每個子幀輸入的子幀索引表示第一子幀時，音調(diào)周期指示單元101 將預(yù)先設(shè)定的音調(diào)周期搜索范圍內(nèi)的音調(diào)周期Tjnt、例如與從"32"至"287"為止的8比特對應(yīng)256種的音調(diào)周期T—int(T—int=32、 33..... 287)，依序指示給自適應(yīng)激勵矢量生成單元104。這里，從"32，，至"287，，為止是表示音調(diào)周期的索引。另外，在對每個子幀輸入的子幀索引表示第二子幀時，音調(diào)周期指示單元101利用在音調(diào)周期存儲單元102中存儲的音調(diào)周期T—INT，，將與T—int=T—INT，-7、 T_INT，-6..... T—INT，+8的4比特對應(yīng)的16種音調(diào)周期，依序指示給自適應(yīng)激勵矢量生成單元104。也就是說，作為第二子幀的音調(diào) 周期，利用"A延遲(DeltaLag)，，的方法，求與第一子幀的音調(diào)周期之間的差分。音調(diào)周期存儲單元102由存儲第一子幀的音調(diào)周期的緩沖器構(gòu)成，每當(dāng) 以子幀為單位的音調(diào)周期搜索結(jié)束，利用與從評價尺度比較單元108反饋的音調(diào)周期索引IDX對應(yīng)的音調(diào)周期TJNT'，更新內(nèi)置的緩沖器。自適應(yīng)激勵碼本103內(nèi)置存儲了驅(qū)動激勵的緩沖器，每當(dāng)以子幀為單位的音調(diào)周期搜索結(jié)束，利用具有從評價尺度比較單元108反饋的索引IDX表示的音調(diào)周期的自適應(yīng)激勵矢量，更新驅(qū)動激勵。在對每個子幀輸入的子幀索引表示第一子幀時，自適應(yīng)激勵矢量生成單元104從自適應(yīng)激勵碼本103中切割出相當(dāng)于音調(diào)周期搜索分析長度r(m〈r^n)的、具有由音調(diào)周期指示單元101指示的音調(diào)周期T—int的自適應(yīng)激勵矢量，并輸出到評價尺度計算單元107作為自適應(yīng)激勵矢量P(T—int)。這里，在r是預(yù)先設(shè)定的值，自適應(yīng)激勵矢量生成單元104中所生成的幀長度n的自適應(yīng)激勵矢量P(T—int)是由例如在自適應(yīng)激勵碼本103由以exc(O)、 exc(l).....exc(e-l)表示的、具有e的長度的矢量構(gòu)成時，由下式(l)表示。<formula>formula see original document page 9</formula>另外，在對每個子幀輸入的子幀索引表示第二子幀時，從自適應(yīng)激勵碼本103中切割出相當(dāng)于子幀長度m的、具有由音調(diào)周期指示單元101指示的音調(diào)周期T一int的自適應(yīng)激勵矢量，并輸出到評價尺度計算單元107作為自適應(yīng)激勵矢量P(T—int)。例如在自適應(yīng)激勵碼本103由以exc(O)、 exc(l).....exc(e-l)表示的、具有e的長度的矢量構(gòu)成時，自適應(yīng)激勵矢量生成單元l(M 中所生成的子幀長度m的自適應(yīng)激勵矢量P(Tjnt)由下式(2)表示。<formula>formula see original document page 9</formula>圖2是表示自適應(yīng)激勵碼本103所具備的驅(qū)動激勵的圖。另外，圖2也是用于說明自適應(yīng)激勵矢量生成單元104中的自適應(yīng)激勵矢量的生成動作的圖，表示所生成的自適應(yīng)激勵矢量的長度為音調(diào)周期搜索分析長度r的情況作為例子。在圖2中，e表示驅(qū)動激勵121的長度，r表示自適應(yīng)激勵矢量P(T—int)的長度，T_int表示由音調(diào)周期指示單元101指示的音調(diào)周期。如圖2所示，自適應(yīng)激勵矢量生成單元104將從驅(qū)動激勵121(自適應(yīng)激勵碼本103)的末端(e的位置)相隔了相當(dāng)于T_int的位置作為起點，從該起點向末端e的方向切割出長度r的部分122，以生成自適應(yīng)激勵矢量P(T—int)。這里，在T—int的值小于r時，自適應(yīng)激勵矢量生成單元104使切割出的區(qū)間的長度被反復(fù)補充直至其達(dá)到長度r為止。另外，自適應(yīng)激勵矢量生成單元104對由音調(diào)周期指示單元101提供的從"32"至"287"為止的256組的T—int,反復(fù)由上式(l)表示的切割處理。合成濾波器105利用對每個子幀輸入的線性預(yù)測系數(shù)構(gòu)成合成濾波器，在對每個子幀輸入的子幀索引表示第一子幀時，將由下式(3)表示的rxr的脈沖響應(yīng)矩陣H輸出到評價尺度計算單元107。另一方面，在對每個子幀輸入的子幀索引表示第二子幀時，合成濾波器105將由下式(4)表示的mxm的脈沖響應(yīng)矩陣H輸出到評價尺度計算單元107。
<formula>formula see original document page 10</formula>
如式(3)和式(4)所示，在子幀索引表示第一子幀時的脈沖響應(yīng)矩陣H求得相當(dāng)于長度r的矩陣，而在子幀索引表示第二子幀時的脈沖響應(yīng)矩陣H求得相當(dāng)于子幀長度m的矩陣。搜索用目標(biāo)矢量生成單元106將子幀索引表示第一子幀時所輸入的 Xl=[x(0) x(l) ... x(m-l)]與子幀索引表示第二子幀時所輸入的X2=[x(m) x(m+l).,.x(n-l)]相加，生成由下式(5)表示的幀長度n的目標(biāo)矢量XF。然后，搜索用目標(biāo)矢量生成單元106在第一子幀的音調(diào)周期搜索處理中，根據(jù)幀長度n的目標(biāo)矢量XF生成由下式(6)表示的長度r的搜索用目標(biāo)矢量X，并輸出到評價尺度計算單元107。另外，搜索用目標(biāo)矢量生成單元106在第二子幀的音調(diào)周期搜索處理中，從幀長度n的目標(biāo)矢量XF生成由下式(7)表示的子幀長度m的搜索用目標(biāo)矢量X，并輸出到評價尺度計算單元107。，=[X(0) X(l)…X(附-l) …JC("-1)] …(5)h[x(O) ;c(l)…x(m-1) x(附)…；c(r-1)] …(6) X = [x(m)……(7)評價尺度計算單元107在第一子幀的音調(diào)周期搜索處理中，利用從自適應(yīng)激勵矢量生成單元104輸入的長度r的自適應(yīng)激勵矢量P(T—int)、從合成濾波器105輸入的rxr的脈沖響應(yīng)矩陣H、以及從搜索用目標(biāo)矢量生成單元106 輸入的長度r的搜索用目標(biāo)矢量X,根據(jù)下式(8)計算音調(diào)周期搜索用(自適應(yīng) 激勵矢量量化)的評價尺度Dist(Tjnt),并輸出到評價尺度比較單元108。另外，評價尺度計算單元107在第二子幀的音調(diào)周期搜索處理中，利用從自適應(yīng)激勵矢量生成單元104輸入的子幀長度m的自適應(yīng)激勵矢量P(T_int)、從合成濾波器105輸入的mxm的脈沖響應(yīng)矩陣H、以及從搜索用目標(biāo)矢量生成單元106輸入的子幀長度m的搜索用目標(biāo)矢量X,根據(jù)下式(8)計算音調(diào)周期搜索用(自適應(yīng)激勵矢量量化)的評價尺度Dist(T—int)，并輸出到評價尺度比較單元108。一 l朋(rjnt)l如上式(8)所示，評價尺度計算單元107求對脈沖響應(yīng)矩陣H和自適應(yīng)激勵矢量P(T一int)進(jìn)行巻積所獲得的再現(xiàn)矢量與搜索用目標(biāo)矢量X之間的平方誤差作為評價尺度。另外，在評價尺度計算單元107中計算評價尺度Dist(T—int) 時，通常利用將搜索用脈沖響應(yīng)矩陣H與在CELP語音編碼裝置中所包含的聽覺加權(quán)濾波器的脈沖響應(yīng)矩陣W相乘所獲得的矩陣H，(=HxW)，以代替上式(8)中的搜索用脈沖響應(yīng)矩陣H。但是，在以下的說明中，未對H和H，進(jìn)行區(qū)別而將其記載為H。評價尺度比較單元108在第一子幀的音調(diào)周期搜索處理中，對從評價尺度計算單元107輸入的、例如256組評價尺度Dist(Tjnt)進(jìn)行比較，求其中的與最大的評價尺度Dist(Tjnt)對應(yīng)的音調(diào)周期Tjnt，，將表示音調(diào)周期 T—int，的音調(diào)周期索引IDX輸出到外部，同時輸出到音調(diào)周期存儲單元102 和自適應(yīng)激勵碼本103。另外，評價尺度比較單元108在第二子幀的音調(diào)周期搜索處理中，對/人評價尺度計算單元107輸入的、例如16組評價尺度Dist(Tjnt)進(jìn)行比較，求其中的與最大的評價尺度Dist(Tjnt)對應(yīng)的音調(diào)周期 T—int，，將表示音調(diào)周期T—int，與在第一子幀的音調(diào)周期^叟索處理中求出的音調(diào)周期T—int，之間的音調(diào)周期差的音調(diào)周期索引IDX輸出到外部，同時輸出到音調(diào)周期存儲單元102和自適應(yīng)激勵碼本103。包含自適應(yīng)激勵矢量量化裝置100的CELP語音編碼裝置，將包含了在評價尺度比較單元108中所生成的音調(diào)周期索引IDX的語音編碼信息，發(fā)送到包含本實施方式的自適應(yīng)激勵矢量逆量化裝置的CELP解碼裝置。CELP 解碼裝置對接收到的語音編碼信息進(jìn)行解碼，獲得音調(diào)周期索引IDX,輸入到本實施方式的自適應(yīng)激勵矢量逆量化裝置。另外，與CELP語音編碼裝置中的語音編碼處理同樣，在CELP解碼裝置中的語音解碼處理也以子幀為單位進(jìn)行，CELP解碼裝置將子幀索引輸入到本實施方式的自適應(yīng)激勵矢量逆量化裝置。圖3是表示本實施方式的自適應(yīng)激勵矢量量化裝置200的主要結(jié)構(gòu)的方框圖。在圖3中，自適應(yīng)激勵矢量逆量化裝置200包括音調(diào)周期判定單元201、音調(diào)周期存儲單元202、自適應(yīng)激勵碼本203以及自適應(yīng)激勵矢量生成單元 204,輸入在CELP語音解碼裝置中所生成的子幀索引和音調(diào)周期索引IDX。在對每個子幀輸入的子幀索引表示第一子幀時，音調(diào)周期判定單元201 將與所輸入的音調(diào)周期索引對應(yīng)的音調(diào)周期T—int，，輸出到音調(diào)周期存儲單元202、自適應(yīng)激勵碼本203和自適應(yīng)激勵矢量生成單元204。另外，在對每個子幀輸入的子幀索引表示第二子幀時，音調(diào)周期判定單元201將對應(yīng)于所輸入的音調(diào)周期索引對應(yīng)的音調(diào)周期差與音調(diào)周期存儲單元202中存儲的第一子幀的音調(diào)周期Tjnt，相加，并將相加結(jié)果即音調(diào)周期T一int，輸出到自適應(yīng) 激勵碼本203和自適應(yīng)激勵矢量生成單元204作為第二子幀的音調(diào)周期。音調(diào)周期存儲單元202存儲從音調(diào)周期判定單元201輸入的第一子幀的音調(diào)周期Tjnt，，所存儲的第一子幀的音調(diào)周期T一int，在第二子幀的處理中通過音調(diào)周期判定單元201讀出。自適應(yīng)激勵碼本203內(nèi)置了存儲與自適應(yīng)激勵矢量量化裝置100的自適應(yīng)激勵碼本103所具備的驅(qū)動激勵同樣的驅(qū)動激勵的緩沖器，每當(dāng)每個子幀的自適應(yīng)激勵解碼處理結(jié)束，利用具有從音調(diào)周期判定單元201輸入的音調(diào) 周期T一int，的自適應(yīng)激勵矢量，更新驅(qū)動激勵。在對每個子幀輸入的子幀索引表示第一子幀時，自適應(yīng)激勵矢量生成單元204從自適應(yīng)激勵碼本203中切割出相當(dāng)于子幀長度m的、具有從音調(diào)周期判定單元201輸入的音調(diào)周期T—int，的自適應(yīng)激勵矢量P，(T—int，)，并將其輸出作為自適應(yīng)激勵矢量。在自適應(yīng)激勵矢量生成單元204中生成的自適應(yīng)激勵矢量P，(T一int，)由下式(9)表示。(e-r一int')"]….，、 r im'+i) ,八、尸'(r一int')-尸' 、，一 , ...(9)—exc(e—T_int'+m -l)這樣，根據(jù)本實施方式，在以子幀為單位進(jìn)行線性預(yù)測編碼的CELP語音編碼中，與第二子幀相比，在第一子幀中利用較多的^f言息量進(jìn)^f以子幀為單位的自適應(yīng)激勵矢量量化時，通過以各個子幀為單位的線性預(yù)測系數(shù)，構(gòu) 成具有長于子幀長度的行和列的脈沖響應(yīng)矩陣，從自適應(yīng)激勵碼本中切割出長于子幀長度的自適應(yīng)激勵矢量，進(jìn)行第一子幀的自適應(yīng)激勵矢量量化。由此，能夠降低各個子幀的自適應(yīng)激勵矢量量化的量化精度的偏移，能夠提高整體的語音編碼精度。另外，在本實施方式中，以預(yù)先設(shè)定滿足nKr^n的r的情況為例進(jìn)行了說明，但本發(fā)明并不限于此，也可基于用于各個子幀的自適應(yīng)激勵矢量量化的信息量，自適應(yīng)地改變r的值。例如，用于第二子幀的自適應(yīng)激勵矢量量化的信息量越少，將r的值設(shè)定得越大，從而能夠在第一子幀的自適應(yīng)激勵矢量量化中增大覆蓋第二子幀的范圍，更有效地降低各個子幀的自適應(yīng)激勵矢量量化的量化4青度的偏移。另外，在本實施方式中，作為音調(diào)周期的候補，以從"32，，至"28"為止的 256組為例進(jìn)行了說明，但本發(fā)明并不限于此，也可將其他的范圍作為音調(diào) 周期的候補。另夕卜，在本實施方式中，以在包含自適應(yīng)激勵矢量量化裝置100的CELP 語音編碼裝置中，將一個幀劃分為兩個子幀，對各個子幀進(jìn)行線性預(yù)測分析為前提，進(jìn)行了說明，但本發(fā)明并不限于此，也可在CELP方式的語音編碼裝置中，將一個幀劃分為三個以上的子幀，對各個子幀進(jìn)行線性預(yù)測分析。另外，在本實施方式中，以自適應(yīng)激勵碼本103基于從評價尺度比較單元108反饋的音調(diào)周期索引IDX更新驅(qū)動激勵的情況為例進(jìn)行了說明，但本發(fā)明并不限于此，也可利用在CELP語音編碼中通過自適應(yīng)激勵矢量和固定激勵矢量生成的激勵矢量，更新驅(qū)動激勵。
另外，在本實施方式中，以將線性預(yù)測殘差矢量作為輸入，利用自適應(yīng) 激勵碼本搜索線性預(yù)測殘差矢量的音調(diào)周期的情況為例進(jìn)行了說明，但本發(fā)
明并不限于此，也可將語音信號本身作為輸入，直接搜索語音信號本身的音調(diào)周期。
(實施方式2)
圖4是表示本發(fā)明的實施方式2的自適應(yīng)激勵矢量量化裝置300的主要結(jié)構(gòu)的方框圖。另外，自適應(yīng)激勵矢量量化裝置300具有與實施方式1所示的自適應(yīng)激勵矢量量化裝置IOO(參照圖l)同樣的基本結(jié)構(gòu)，對相同的結(jié)構(gòu)要素附加相同的標(biāo)號，并省略其說明。
自適應(yīng)激勵矢量量化裝置300與自適應(yīng)激勵矢量量化裝置100的不同之處在于，還具備頻譜距離計算單元301和音調(diào)周期搜索分析長度決定單元 302。自適應(yīng)激勵矢量量化裝置300的自適應(yīng)激勵矢量生成單元304、合成濾波器305和搜索用目標(biāo)矢量生成單元306與自適應(yīng)激勵矢量量化裝置100的自適應(yīng)激勵矢量生成單元104、合成濾波器105和搜索用目標(biāo)矢量生成單元 106，在其處理上存在部分不同之處，為了表示該不同之處，附加不同的標(biāo)號。
頻鐠距離計算單元301將所輸入的第一子幀的線性預(yù)測系數(shù)和第二子幀的線性預(yù)測系數(shù)分別變換為頻譜，求第一子幀的頻譜與第二子幀的頻譜之間的距離，并輸出到音調(diào)周期搜索分析長度決定單元302。
音調(diào)周期搜索分析長度決定單元302根據(jù)從頻譜距離計算單元301輸入的子巾貞間的頻諳距離，決定音調(diào)周期搜索分析長度r，并輸出到自適應(yīng)激勵矢量生成單元304、合成濾波器305和搜索用目標(biāo)矢量生成單元306。
子幀間的頻鐠距離較大，意味著子幀間的音韻的變動較大，子幀間的音調(diào)周期的變動隨著音韻的變動也變大的可能性較高。因此，在利用音調(diào)周期的時間上的連續(xù)性的"A延遲"的方法中，子幀間的頻譜距離較大，音調(diào)周期的變動也隨之較大時，無法完全通過"A延遲"的音調(diào)周期搜索范圍覆蓋子幀間的音調(diào)周期的變動的大小的可能性較高。因此，通過根據(jù)音調(diào)周期的時間上的連續(xù)性的程度，自適應(yīng)地改變使第一子幀的音調(diào)周期搜索的分析長度重疊(overlap)到第二子幀端的長度，能夠提高量化精度。在本實施方式中，對這樣的情況，使第一子幀的音調(diào)周期搜索分析長度r更長，在第一子幀的音調(diào)周期搜索中，設(shè)定較多的相當(dāng)于考慮第二子幀的部分，從而提高量化精度。也就是說，在第一子幀的音調(diào)周期與第二子幀的音調(diào)周期之間的差較大(較為不連續(xù))時，在第一子幀的音調(diào)周期搜索的時刻，使分析長度較長地重疊到第二子幀端。由此，選擇出如能夠進(jìn)一步地考慮第二子幀那樣的音調(diào)周期作為第一子幀的音調(diào)周期，在第二子幀中A延遲高效地發(fā)揮作用，從而能夠改善因音調(diào)周期的時間上的不連續(xù)造成的A延遲的非效率性。另一方面，在第一子幀的音調(diào)周期與第二子幀的音調(diào)周期之間的差較小(較為連續(xù))時，通過使第一子幀的音調(diào)周期搜索的分析長度只以必要的長度重疊到第二子幀端而不是過多重疊，能夠適宜地校正在音調(diào)周期搜索精度的時序上的不均勻。
具體而言，在子幀間的頻語距離為規(guī)定的閾值以下時，音調(diào)周期搜索分
析長度決定單元302將音調(diào)周期搜索分析長度r設(shè)定為滿足m<r，^n的條件的 r，，而在子幀間的頻譜距離大于規(guī)定的閾值時，將音調(diào)周期搜索分析長度r 設(shè)定為滿足m<r，，^i且r，々"的條件的r"。
自適應(yīng)激勵矢量生成單元304、合成濾波器305和搜索用目標(biāo)矢量生成單元306與自適應(yīng)激勵矢量量化裝置100的自適應(yīng)激勵矢量生成單元l(H、合成濾波器105和搜索用目標(biāo)矢量生成單元106的不同之處僅在于，利用從音調(diào)周期搜索分析長度決定單元302輸入的音調(diào)周期搜索分析長度r，代替預(yù) 先設(shè)定的音調(diào)周期搜索分析長度r，所以這里省略詳細(xì)的說明。
這樣，根據(jù)本實施方式，自適應(yīng)激勵矢量量化裝置根據(jù)子幀間的頻譜距離決定音調(diào)周期搜索分析長度r,所以在子幀間的音調(diào)周期的變動較大時，能夠?qū)⒁粽{(diào)周期搜索分析長度r設(shè)定得更長，能夠進(jìn)一步地降低各個子幀的自適應(yīng)激勵矢量量化的量化精度的偏移，從而進(jìn)一步提高整體的語音編碼精度。
另外，在本實施方式中，以頻譜距離計算單元301從線性預(yù)測系數(shù)求頻譜，音調(diào)周期搜索分析長度決定單元302根據(jù)子幀間的頻譜距離決定音調(diào)周期搜索分析長度r的情況為例進(jìn)行了說明，但本發(fā)明并不限于此，音調(diào)周期搜索分析長度決定單元302也可根據(jù)倒頻語(cepstrum)距離、a參數(shù)的距離和在LSP領(lǐng)域的距離等，決定音調(diào)周期搜索分析長度r。
另外，在本實施方式中，以音調(diào)周期搜索分析長度決定單元302利用子幀間的頻i普距離作為用于預(yù)測子幀間的音調(diào)周期的變動的程度的參數(shù)的情況為例進(jìn)行了說明，但本發(fā)明并不限于此，也可利用輸入語音信號的子幀間的功率的差或子幀間的音調(diào)周期的差作為用于預(yù)測子幀間的音調(diào)周期的變動的程度的參數(shù)即用于預(yù)測音調(diào)周期的時間上的連續(xù)性的參數(shù)。在上述的情況下，子幀間的音韻的變動越大，子幀間的功率的差或前一幀的子幀間的音調(diào)周期
的差越大，所以將音調(diào)周期搜索分析長度r設(shè)定得更長。
以下，說明利用輸入語音信號的子幀間的功率之差或前一幀的子幀間的音調(diào)周期之差作為預(yù)測子幀間的音調(diào)周期的變動程度的參數(shù)時的自適應(yīng)激勵矢量量化裝置的動作。
在利用輸入語音信號的子幀間的功率之差作為預(yù)測子幀間的音調(diào)周期的
變動程度的參數(shù)時，圖5所示的自適應(yīng)激勵矢量量化裝置400的功率差計算單元401通過下式(10)求輸入語音信號的第一子幀的功率與第二子幀的功率之間的差Pow dist。<formula>formula see original document page 16</formula>其中，sp是以sp(O)、 sp(l)..... sp(n-l)表示的輸入語音。另外，sp(O)
是與當(dāng)前時刻對應(yīng)的輸入語音樣本，與第一子幀對應(yīng)的輸入語音以sp(O)、
sp(l)..... sp(m-l)表示，與第二子幀對應(yīng)的輸入語音以sp(m)、 sp(m+l)、…
、sp(n-l)表示。
功率差計算單元401既可根據(jù)上式(10)從子幀長度的輸入語音樣本求功率的差，也可根據(jù)下式(ll)，從包括過去的輸入語音的范圍的、滿足m2>m 的m2的長度的輸入語音求功率的差。<formula>formula see original document page 16</formula>在子幀間的功率之差為規(guī)定的閾值以下時，音調(diào)周期搜索分析長度決定單元402將音調(diào)周期搜索分析長度r設(shè)定為滿足nKr，Sn的條件的r，。然后，在子幀間的功率之差大于規(guī)定的閾值時，音調(diào)周期搜索分析長度決定單元402 將音調(diào)周期搜索分析長度r設(shè)定為滿足m<r"^i且r，々"的條件的r"。
另一方面，在利用前一幀的子幀間的音調(diào)周期之差作為預(yù)測子幀間的音
調(diào)周期的變動程度的參數(shù)時，圖6所示的自適應(yīng)激勵矢量量化裝置500的音
調(diào)周期差計算單元501通過下式(12)求前一幀的第一子幀的音調(diào)周期與第二
子幀的音調(diào)周期之間的差Pit一dist。
<formula>formula see original document page 16</formula>
其中，T_prel是前一幀的第一子幀的音調(diào)周期，Tjre2是前一幀的第二子幀的音調(diào)周期。
在前一幀的子幀間的音調(diào)周期的差Pit—dist為規(guī)定的閾值以下時，音調(diào)周
期搜索分析長度決定單元502將音調(diào)周期搜索分析長度r設(shè)定為滿足m<r，^i 的條件的r，。然后，在前一幀的子幀間的音調(diào)周期的差Pit一dist大于規(guī)定的閾值時，音調(diào)周期搜索分析長度決定單元502將音調(diào)周期搜索分析長度r設(shè)定為滿足m<r"^i且r，々"的條件的r"。
或者，音調(diào)周期搜索分析長度決定單元502也可僅利用過去幀的第一子幀的音調(diào)周期T_prel或第二子幀的音調(diào)周期T_pre2作為預(yù)測子幀間的音調(diào) 周期的變動程度的參^:。
有以下的統(tǒng)計上的傾向，即過去幀的音調(diào)周期的值越大，與前一幀的音調(diào)周期相比，當(dāng)前一幀的音調(diào)周期容易產(chǎn)生較大的變動，相對于此，過去幀的音調(diào)周期的值越小，與前一幀的音調(diào)周期相比，當(dāng)前一幀的音調(diào)周期的變動的幅度容易變小。因此，在利用音調(diào)周期的時間性的連續(xù)性的"A延遲"的方法中，過去幀的音調(diào)周期較大，音調(diào)周期的變動也隨之較大時，無法完全地通過"A延遲"的音調(diào)周期搜索范圍覆蓋子幀間的音調(diào)周期的變動的大小的可能性高。因此，在這樣的情況下，使第一子幀的音調(diào)周期搜索分析長度r 更長，在第一子幀的音調(diào)周期搜索中，設(shè)定較多的相當(dāng)于考慮第二子幀的部分，從而提高量化精度。例如，在過去幀的第二子幀的音調(diào)周期的Tjre2的值為規(guī)定的閾值以下時，音調(diào)周期搜索分析長度決定單元502將音調(diào)周期搜索分析長度r設(shè)定為滿足m々，^n的條件的r，，而在過去幀的第二子幀的音調(diào) 周期T_pre2的值大于規(guī)定的閾值時，將音調(diào)周期搜索分析長度r設(shè)定為滿足 m<r"^i且r，〈r"的條件的r"。
另外，在本實施方式中，以將用于預(yù)測子幀間的音調(diào)周期的變動程度的參數(shù)與規(guī)定的一個閾值進(jìn)行比較，并基于比較結(jié)果決定音調(diào)周期搜索分析長度r的情況為例進(jìn)行了說明，但本發(fā)明并不限于此，也可將用于預(yù)測子幀間的音調(diào)周期的變動程度的參數(shù)與多個閾值進(jìn)行比較，并且預(yù)測子幀間的音調(diào) 周期的變動程度的參數(shù)越大，將音調(diào)周期搜索分析長度r設(shè)定得越小。
以上，i兌明了本發(fā)明的實施方式。
本發(fā)明的自適應(yīng)激勵矢量量化裝置能夠裝載于進(jìn)行語音傳輸?shù)囊苿油ㄐ?系統(tǒng)中的通信終端裝置，由此能夠提供具有與上述同樣的作用效果的通信終
端裝置。另外，這里，以由硬件構(gòu)成本發(fā)明的情況為例進(jìn)行了說明，但也能夠由
軟件實現(xiàn)本發(fā)明。例如，通過利用編程語言(programming language)記述本發(fā) 明的自適應(yīng)激勵矢量量化方法的算法，將該程序存儲在存儲器后^f吏信息處理單元執(zhí)行該程序，從而能夠?qū)崿F(xiàn)與本發(fā)明的自適應(yīng)激勵矢量量化裝置和自適應(yīng)矢量逆量化裝置同樣的功能。
另外，用于上述實施方式的說明中的各功能塊通常作為集成電路即LSI 來實現(xiàn)。這些塊既可以單獨地集成為一個芯片，也可以包含一部分或全部地集成為一個芯片。
另外，雖然此處稱為LSI,但根據(jù)集成程度，也可以稱為IC、系統(tǒng)LSI、超大LSI(Super LSI)、特大LSI(Ultra LSI)等。
另外，實現(xiàn)集成電路化的方法不僅限于LSI,也可使用專用電路或通用處理器來實現(xiàn)。也可以使用在LSI制造后可編程的FPGA(Field Programmable Gate Array:現(xiàn)場可編程門陣列)，或者可重構(gòu)LSI內(nèi)部的電路單元的連接和設(shè)定的可重構(gòu)處理器。
再者，隨著半導(dǎo)體的技術(shù)進(jìn)步或隨之派生的其它技術(shù)的出現(xiàn)，如果能夠出現(xiàn)替代LSI的集成電路化的新技術(shù)，當(dāng)然可利用該新技術(shù)進(jìn)行功能塊的集成化。有可能適用于生化技術(shù)等。
在2006年12月15日提交的特愿第2006_338343號的日本專利申請以及在2007年5月23日提交的特愿第2007-137031號的日本專利申請中所包含的說明書、附圖以及說明書摘要的公開內(nèi)容，全部引用于本發(fā)明。
工業(yè)實用性
本發(fā)明的自適應(yīng)激勵矢量量化裝置和自適應(yīng)激勵矢量量化方法能夠適用于語音編碼和語音解碼等用途。
權(quán)利要求
1. 自適應(yīng)激勵矢量量化裝置，輸入通過將長度為n的幀劃分為多個長度為m的子幀進(jìn)行線性預(yù)測分析所生成的長度為m的線性預(yù)測殘差矢量和線性預(yù)測系數(shù)，對第一子幀使用比對第二子幀多的比特數(shù)，進(jìn)行每個子幀的自適應(yīng)激勵矢量量化，其中n和m為整數(shù)，該自適應(yīng)激勵矢量量化裝置包括自適應(yīng)激勵矢量生成單元，從自適應(yīng)激勵碼本中切割出長度為r的自適應(yīng)激勵矢量，其中，m<r≤n；目標(biāo)矢量構(gòu)成單元，根據(jù)所述多個子幀的所述線性預(yù)測殘差矢量生成長度為r的目標(biāo)矢量；合成濾波器，利用所述各個子幀的所述線性預(yù)測系數(shù)，生成r×r的脈沖響應(yīng)矩陣；評價尺度計算單元，利用所述長度為r的自適應(yīng)激勵矢量、所述長度為r的目標(biāo)矢量以及所述r×r的脈沖響應(yīng)矩陣，對多個音調(diào)周期的候補，計算自適應(yīng)激勵矢量量化的評價尺度；以及評價尺度比較單元，比較與所述多個音調(diào)周期的候補對應(yīng)的所述評價尺度，求使所述評價尺度最大的音調(diào)周期作為所述第一子幀的自適應(yīng)激勵矢量量化結(jié)果。
2. 如權(quán)利要求l所述的自適應(yīng)激勵矢量量化裝置，用于所述第一子幀的自適應(yīng)激勵矢量量化的比特數(shù)與用于所述第二子幀的自適應(yīng)激勵矢量量化的比特數(shù)之間的差越大，則將所述r設(shè)定得越大。
3. 如權(quán)利要求1所述的自適應(yīng)激勵矢量量化裝置，還包括計算單元，將所述多個子幀的線性預(yù)測系數(shù)分別變換為多個頻譜，并計算所述多個頻譜間的距離；以及設(shè)定單元，所述頻譜間的距離越大，其將所述r設(shè)定得越長。
4. 如權(quán)利要求1所述的自適應(yīng)激勵矢量量化裝置，還包括計算單元，計算所述多個子幀間的功率的差；以及設(shè)定單元，所述子幀間的功率的差越大，其將所述r設(shè)定得越長。
5. 如權(quán)利要求l所述的自適應(yīng)激勵矢量量化裝置，還包括設(shè)定單元，過去幀的所述多個子幀的音調(diào)周期的值越大，其將所述r設(shè)定得越長。
6. 如權(quán)利要求1所述的自適應(yīng)激勵矢量量化裝置，還包括計算單元，計算過去幀的所述多個子幀間的音調(diào)周期的差；以及設(shè)定單元，所述過去幀的所述多個子幀間的音調(diào)周期的差越大，其將所述r設(shè)定得越長。
7. 碼激勵線性預(yù)測語音編碼裝置，包括權(quán)利要求1所述的自適應(yīng)激勵矢量量化裝置。
8. 自適應(yīng)激勵矢量量化方法，輸入通過將長度為n的幀劃分為多個長度為m的子幀進(jìn)行線性預(yù)測分析所生成的長度為m的線性預(yù)測殘差矢量和線性預(yù)測系數(shù)，對第一子幀使用比對第二子幀多的比特數(shù)，進(jìn)行每個子幀的自適應(yīng)激勵矢量量化，其中n和m為整數(shù)，該自適應(yīng)激勵矢量量化方法包括以下的步驟從自適應(yīng)激勵碼本中切割出長度為r的自適應(yīng)激勵矢量，其中，m<r^n; 根據(jù)所述多個子幀的所述線性預(yù)測殘差矢量生成長度為r的目標(biāo)矢量；利用所述各個子幀的所述線性預(yù)測系數(shù)，生成rxr的脈沖響應(yīng)矩陣；利用所述長度為r的自適應(yīng)激勵矢量、所述長度為r的目標(biāo)矢量以及所述rxr的脈沖響應(yīng)矩陣，對多個音調(diào)周期的候補，計算自適應(yīng)激勵矢量量化的評價尺度；以及比較與所述多個音調(diào)周期的候補對應(yīng)的所述評價尺度，求使所述評價尺度最大的音調(diào)周期作為所述第一子幀的自適應(yīng)激勵矢量量化結(jié)果。
全文摘要
公開了自適應(yīng)激勵矢量量化裝置等，其在第一子幀利用比第二子幀更多的信息量，以子幀為單位進(jìn)行自適應(yīng)激勵矢量量化時，能夠降低各個子幀的自適應(yīng)激勵矢量量化的量化精度的偏移。在該裝置的第一子幀的自適應(yīng)激勵矢量量化中，自適應(yīng)激勵矢量生成單元(104)從自適應(yīng)激勵碼本(103)中切割出長度r(r、n和m為整數(shù)，m＜r≤n，n為幀長度，m為子幀長度)的自適應(yīng)激勵矢量，合成濾波器(105)利用所輸入的第一子幀的線性預(yù)測系數(shù)生成r×r的脈沖響應(yīng)矩陣，搜索用目標(biāo)矢量生成單元(106)利用以子幀為單位的目標(biāo)矢量生成長度r的搜索用目標(biāo)矢量，評價尺度計算單元(107)計算自適應(yīng)激勵矢量量化的評價尺度。
文檔編號G10L19/02GK101548317SQ20078004520
公開日2009年9月30日申請日期2007年12月14日優(yōu)先權(quán)日2006年12月15日
發(fā)明者佐藤薰, 森井利幸申請人:松下電器產(chǎn)業(yè)株式會社

完整全部詳細(xì)技術(shù)資料下載