亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

自適應(yīng)激勵矢量量化裝置和自適應(yīng)激勵矢量量化方法

文檔序號:2830585閱讀:245來源:國知局
專利名稱:自適應(yīng)激勵矢量量化裝置和自適應(yīng)激勵矢量量化方法
技術(shù)領(lǐng)域
本發(fā)明涉及在CELP(Code Excited Linear Prediction,碼激勵線性預(yù)測)方 式的語音編碼中進(jìn)行自適應(yīng)激勵(excitation)的矢量量化的自適應(yīng)激勵矢量量 化裝置和自適應(yīng)激勵矢量量化方法,特別涉及在以因特網(wǎng)通信為代表的分組 通信系統(tǒng)或移動通信系統(tǒng)等的領(lǐng)域中,進(jìn)行語音信號的編碼的語音編碼裝置 所使用的自適應(yīng)激勵矢量量化裝置和自適應(yīng)激勵矢量量化方法。
背景技術(shù)
在數(shù)字無線通信、以因特網(wǎng)通信為代表的分組通信或語音存儲等領(lǐng)域中, 為了實現(xiàn)電波等的傳輸路徑容量或存儲媒體的有效利用,語音信號的編碼和 解碼技術(shù)必不可少。尤其,CELP方式的語音編碼和解碼纟支術(shù)成為主流的技術(shù) (例如,參照非專利文獻(xiàn)1)。CELP方式的語音編碼裝置基于預(yù)先存儲的語音模型,對輸入語音進(jìn)行 編碼。具體而言,CELP方式的語音編碼裝置將數(shù)字化后的語音信號劃分為 10至20ms左右的一定時間間隔的幀,對各個幀內(nèi)的語音信號進(jìn)行線性預(yù)測 分析來求線性預(yù)測系數(shù)(LPC: Linear Prediction Coefficient)和線性預(yù)測殘差矢 量,并分別單獨地對線性預(yù)測系數(shù)和線性預(yù)測殘差矢量進(jìn)行編碼。在CELP 方式的語音編碼/解碼裝置中,利用存儲有過去所生成的驅(qū)動激勵信號的自適 應(yīng)激勵碼本以及存儲有特定數(shù)個固定形狀的矢量(固定代碼矢量)的固定碼本, 對線性預(yù)測殘差矢量進(jìn)行編碼/解碼。其中,自適應(yīng)激勵碼本用于表示線性預(yù) 測殘差矢量所具有的周期性分量,另一方面,固定碼本用于表示在線性預(yù)測 殘差矢量中無法通過自適應(yīng)激勵碼本表示的非周期性分量。另外,在線性預(yù)測殘差矢量的編碼/解碼處理中, 一般將幀劃分為更短的 時間單位(5ms至10ms左右)的子幀來進(jìn)行。在非專利文獻(xiàn)2所記載的ITU-T 建議G.729中,通過將幀劃分為兩個子幀,對兩個子幀分別使用自適應(yīng)激勵 碼本搜索音調(diào)(pitch)周期,進(jìn)行自適應(yīng)激勵的矢量量化。這樣的以子幀為單位 的自適應(yīng)激勵矢量量化方法與以幀為單位的自適應(yīng)激勵矢量量化方法相比,能夠降低自適應(yīng)激勵矢量量化方法的運算量。非專利文獻(xiàn)1: M.R.Schroeder、 B.S.Atal著、「 IEEE proc. ICASSP J、 1985、 「 Code Excited Linear Prediction: High Quality Speech at Low Bit Rate J、 p.937-940非專利文獻(xiàn)2: "ITU-T Recommendation G.729", ITU-T, 1996/3, pp. 17陽19 發(fā)明內(nèi)容本發(fā)明要解決的問題然而,在如上所述的以各個子幀為單位進(jìn)行自適應(yīng)激勵矢量量化的裝置 中,各個子幀的音調(diào)周期搜索處理所使用的信息量不同時,例如在第一子幀 的自適應(yīng)激勵矢量量化所使用的信息量為8比特、以及第二子幀的自適應(yīng)激 勵矢量量化所使用的信息量為4比特時,存在以下的問題,即在兩個子幀的 自適應(yīng)激勵矢量量化的精度上產(chǎn)生偏移,第二子幀的自適應(yīng)激勵矢量量化精 度低于第一子幀的自適應(yīng)激勵矢量量化精度,但未進(jìn)行降低自適應(yīng)激勵矢量 量化精度的偏移的處理。本發(fā)明的目的在于,提供自適應(yīng)激勵矢量量化裝置和自適應(yīng)激勵矢量量 化方法,其在以子幀為單位進(jìn)行線性預(yù)測編碼的CELP語音編碼中,利用不 同的信息量進(jìn)行各個子幀的自適應(yīng)激勵矢量量化時,能夠降低各個子幀的自 適應(yīng)激勵矢量量化的量化精度的偏移,提高整體的語音編碼精度。解決問題的方案本發(fā)明的自適應(yīng)激勵矢量量化裝置,輸入通過將長度為n的幀劃分為多 個長度為m的子幀進(jìn)行線性預(yù)測分析所生成的長度為m的線性預(yù)測殘差矢量 和線性預(yù)測系數(shù),對第一子幀使用比對第二子幀多的比特數(shù),進(jìn)行每個子幀 的自適應(yīng)激勵矢量量化,其中n和m為整數(shù),該自適應(yīng)激勵矢量量化裝置所 采用的結(jié)構(gòu)包括自適應(yīng)激勵矢量生成單元,從自適應(yīng)激勵碼本中切割出長 度為r的自適應(yīng)激勵矢量,其中,nKSn;目標(biāo)矢量構(gòu)成單元,根據(jù)所述多個 子幀的所述線性預(yù)測殘差矢量生成長度為r的目標(biāo)矢量;合成濾波器,利用 所述各個子幀的所述線性預(yù)測系數(shù),生成rxr的脈沖響應(yīng)矩陣;評價尺度計 算單元,利用所述長度為r的自適應(yīng)激勵矢量、所述長度為r的目標(biāo)矢量以及 所述rxr的脈沖響應(yīng)矩陣,對多個音調(diào)周期的候補,計算自適應(yīng)激勵矢量量 化的評價尺度;以及評價尺度比較單元,比較與所述多個音調(diào)周期的候補對應(yīng)的所述評價尺度,求使所述評價尺度最大的音調(diào)周期作為所述第 一子幀的 自適應(yīng)激勵矢量量化結(jié)果。本發(fā)明的自適應(yīng)激勵矢量量化方法,輸入通過將長度為n的幀劃分為多個長度為m的子幀進(jìn)行線性預(yù)測分析所生成的長度為m的線性預(yù)測殘差矢量 和線性預(yù)測系數(shù),對第一子幀使用比對第二子幀多的比特數(shù),進(jìn)行每個子幀 的自適應(yīng)激勵矢量量化,其中n和m為整數(shù),該自適應(yīng)激勵矢量量化方法包 括以下的步驟從自適應(yīng)激勵碼本中切割出長度為r的自適應(yīng)激勵矢量,其 中,m<r^n;根據(jù)所述多個子幀的所述線性預(yù)測殘差矢量生成長度為r的目標(biāo) 矢量;利用所述各個子幀的所述線性預(yù)測系數(shù),生成rxr的脈沖響應(yīng)矩陣; 利用所述長度為r的自適應(yīng)激勵矢量、所述長度為r的目標(biāo)矢量以及所述rxr 的脈沖響應(yīng)矩陣,對多個音調(diào)周期的候補,計算自適應(yīng)激勵矢量量化的評價 尺度;以及比較與所述多個音調(diào)周期的候補對應(yīng)的所述評價尺度,求使所述 評價尺度最大的音調(diào)周期作為所述第一子幀的自適應(yīng)激勵矢量量化結(jié)果。 發(fā)明的效果根據(jù)本發(fā)明,在以子幀為單位進(jìn)行線性預(yù)測編碼的CELP語音編碼中, 與第二子幀相比,在第一子幀中利用較多的信息量進(jìn)行以子幀為單位的自適 應(yīng)激勵矢量量化時,通過以各個子幀為單位的線性預(yù)測系數(shù),構(gòu)成具有長于 子幀長度的行和列的脈沖響應(yīng)矩陣,并從自適應(yīng)激勵碼本中切割出長于子幀 長度的自適應(yīng)激勵矢量,進(jìn)行第一子幀的自適應(yīng)激勵矢量量化。由此,能夠 降低各個子幀的自適應(yīng)激勵矢量量化的量化精度的偏移,能夠提高整體的語音編碼精度。


圖1是表示本發(fā)明的實施方式1的自適應(yīng)激勵矢量量化裝置的主要結(jié)構(gòu) 的方框圖。圖2是表示本發(fā)明的實施方式1的自適應(yīng)激勵碼本所具備的驅(qū)動激勵的圖。圖3是表示本發(fā)明的實施方式1的自適應(yīng)激勵矢量逆量化裝置的主要結(jié) 構(gòu)的方框圖。圖4是表示本發(fā)明的實施方式2的自適應(yīng)激勵矢量量化裝置的主要結(jié)構(gòu) 的方框圖。圖5是表示本發(fā)明的實施方式2的自適應(yīng)激勵矢量量化裝置的主要結(jié)構(gòu) 的方框圖。圖6是表示本發(fā)明的實施方式2的自適應(yīng)激勵矢量量化裝置的主要結(jié)構(gòu) 的方框圖。
具體實施方式
在本發(fā)明的各個實施方式中,采用以下的情況為例,即在包含自適應(yīng)激 勵矢量量化裝置的CELP語音編碼裝置中,將構(gòu)成16kHz的語音信號的各個 幀分別劃分為兩個子幀,對各個子幀進(jìn)行線性預(yù)測分析,求每個子幀的線性 預(yù)測系數(shù)和線性預(yù)測殘差矢量。另外,在以下的說明中,將幀長度表記為n, 將子幀長度表記為m。以下,參照附圖詳細(xì)地說明本發(fā)明的實施方式。C實施方式1)圖1是表示本發(fā)明的實施方式1的自適應(yīng)激勵矢量量化裝置100的主要 結(jié)構(gòu)的方框圖。在圖1中,自適應(yīng)激勵矢量量化裝置100包括音調(diào)周期指示單元101、 音調(diào)周期存儲單元102、自適應(yīng)激勵碼本103、自適應(yīng)激勵矢量生成單元104、 合成濾波器105、搜索用目標(biāo)矢量生成單元106、評價尺度計算單元107、以 及評價尺度比較單元108。在自適應(yīng)激勵矢量量化裝置100中,輸入每個子 幀的子幀索引、線性預(yù)測系數(shù)和目標(biāo)矢量。其中,子幀索引表示在包含本實 施方式的自適應(yīng)激勵矢量量化裝置100的CELP語音編碼裝置所獲得的各個 子幀是在幀內(nèi)的第幾個子幀。另外,線性預(yù)測系數(shù)和目標(biāo)矢量表示在CELP 語音編碼裝置中對各個子幀進(jìn)行線性預(yù)測分析所求得的每個子幀的線性預(yù)測 系數(shù)和線性預(yù)測殘差(激勵信號)矢量。作為線性預(yù)測系數(shù),利用LPC參數(shù)或 可與LPC參數(shù)一對一地互換的頻域的參數(shù)即LSF(Line Spectral Frequency,線 譜頻率)參數(shù)、以及LSP(Line Spectral Pairs,線譜對)參數(shù)等。音調(diào)周期指示單元101基于對每個子幀輸入的子幀索引和存儲在音調(diào)周 期存儲單元102中的第一子幀的音調(diào)周期,將預(yù)先設(shè)定的音調(diào)周期搜索范圍 內(nèi)的音調(diào)周期依序指示給自適應(yīng)激勵矢量生成單元104。音調(diào)周期存儲單元102由用于存儲第一子幀的音調(diào)周期的緩沖器構(gòu)成, 每當(dāng)以子幀為單位的音調(diào)周期搜索結(jié)束,基于從評價尺度比較單元108反饋的音調(diào)周期索引IDX,更新內(nèi)置的緩沖器。自適應(yīng)激勵碼本103內(nèi)置存儲了驅(qū)動激勵的緩沖器,每當(dāng)以子幀為單位 的音調(diào)周期搜索結(jié)束,基于從評價尺度比較單元108反饋的音調(diào)周期索引 IDX,更新驅(qū)動激勵。自適應(yīng)激勵矢量生成單元104以對每個子幀輸入的子幀索引對應(yīng)的長 度,從自適應(yīng)激勵碼本103中切割出具有由音調(diào)周期指示單元101指示的音 調(diào)周期的自適應(yīng)激勵矢量,并輸出到評價尺度計算單元107。合成濾波器105利用對每個子幀輸入的線性預(yù)測系數(shù)構(gòu)成合成濾波器, 將與對每個子幀輸入的子幀索引對應(yīng)的長度的脈沖響應(yīng)矩陣輸出到評價尺度 計算單元107。搜索用目標(biāo)矢量生成單元106將對每個子幀輸入的目標(biāo)矢量相加,從相 加而獲得的結(jié)果中切割出與對每個子幀輸入的子幀索引對應(yīng)的長度的搜索用 目標(biāo)矢量,并輸出到評價尺度計算單元107。評價尺度計算單元107利用從自適應(yīng)激勵矢量生成單元104輸入的自適 應(yīng)激勵矢量、從合成濾波器105輸入的脈沖響應(yīng)矩陣、以及從搜索用目標(biāo)矢 量生成單元106輸入的搜索用目標(biāo)矢量,計算音調(diào)周期搜索用的評價尺度即 自適應(yīng)激勵矢量量化的評價尺度,并輸出到評價尺度比較單元108。評價尺度比較單元108基于對每個子幀輸入的子幀索引,求在從評價尺 度計算單元107輸入的評價尺度最大時的音調(diào)周期,將表示求出的音調(diào)周期 的索引IDX輸出到外部,同時反饋給音調(diào)周期存儲單元102和自適應(yīng)激勵碼 本103。自適應(yīng)激勵矢量量化裝置100的各個單元進(jìn)行以下的動作。 在對每個子幀輸入的子幀索引表示第一子幀時,音調(diào)周期指示單元101 將預(yù)先設(shè)定的音調(diào)周期搜索范圍內(nèi)的音調(diào)周期Tjnt、例如與從"32"至"287"為止的8比特對應(yīng)256種的音調(diào)周期T—int(T—int=32、 33..... 287),依序指示給自適應(yīng)激勵矢量生成單元104。這里,從"32,,至"287,,為止是表示音調(diào)周 期的索引。另外,在對每個子幀輸入的子幀索引表示第二子幀時,音調(diào)周期 指示單元101利用在音調(diào)周期存儲單元102中存儲的音調(diào)周期T—INT,,將與T—int=T—INT,-7、 T_INT,-6..... T—INT,+8的4比特對應(yīng)的16種音調(diào)周期,依序指示給自適應(yīng)激勵矢量生成單元104。也就是說,作為第二子幀的音調(diào) 周期,利用"A延遲(DeltaLag),,的方法,求與第一子幀的音調(diào)周期之間的差分。音調(diào)周期存儲單元102由存儲第一子幀的音調(diào)周期的緩沖器構(gòu)成,每當(dāng) 以子幀為單位的音調(diào)周期搜索結(jié)束,利用與從評價尺度比較單元108反饋的音調(diào)周期索引IDX對應(yīng)的音調(diào)周期TJNT',更新內(nèi)置的緩沖器。自適應(yīng)激勵碼本103內(nèi)置存儲了驅(qū)動激勵的緩沖器,每當(dāng)以子幀為單位的音調(diào)周期搜索結(jié)束,利用具有從評價尺度比較單元108反饋的索引IDX表示的音調(diào)周期的自適應(yīng)激勵矢量,更新驅(qū)動激勵。在對每個子幀輸入的子幀索引表示第一子幀時,自適應(yīng)激勵矢量生成單元104從自適應(yīng)激勵碼本103中切割出相當(dāng)于音調(diào)周期搜索分析長度r(m〈r^n)的、具有由音調(diào)周期指示單元101指示的音調(diào)周期T—int的自適應(yīng)激勵矢量,并輸出到評價尺度計算單元107作為自適應(yīng)激勵矢量P(T—int)。這里,在r是預(yù)先設(shè)定的值,自適應(yīng)激勵矢量生成單元104中所生成的幀長度n的自適應(yīng)激勵矢量P(T—int)是由例如在自適應(yīng)激勵碼本103由以exc(O)、 exc(l).....exc(e-l)表示的、具有e的長度的矢量構(gòu)成時,由下式(l)表示。<formula>formula see original document page 9</formula>另外,在對每個子幀輸入的子幀索引表示第二子幀時,從自適應(yīng)激勵碼 本103中切割出相當(dāng)于子幀長度m的、具有由音調(diào)周期指示單元101指示的 音調(diào)周期T一int的自適應(yīng)激勵矢量,并輸出到評價尺度計算單元107作為自適應(yīng)激勵矢量P(T—int)。例如在自適應(yīng)激勵碼本103由以exc(O)、 exc(l).....exc(e-l)表示的、具有e的長度的矢量構(gòu)成時,自適應(yīng)激勵矢量生成單元l(M 中所生成的子幀長度m的自適應(yīng)激勵矢量P(Tjnt)由下式(2)表示。<formula>formula see original document page 9</formula>圖2是表示自適應(yīng)激勵碼本103所具備的驅(qū)動激勵的圖。 另外,圖2也是用于說明自適應(yīng)激勵矢量生成單元104中的自適應(yīng)激勵 矢量的生成動作的圖,表示所生成的自適應(yīng)激勵矢量的長度為音調(diào)周期搜索分析長度r的情況作為例子。在圖2中,e表示驅(qū)動激勵121的長度,r表示自適應(yīng)激勵矢量P(T—int)的長度,T_int表示由音調(diào)周期指示單元101指示的音調(diào)周期。如圖2所示,自適應(yīng)激勵矢量生成單元104將從驅(qū)動激勵121(自適應(yīng)激勵碼本103)的末端(e的位置)相隔了相當(dāng)于T_int的位置作為起點,從該起點向末端e的方向切割出長度r的部分122,以生成自適應(yīng)激勵矢量P(T—int)。這里,在T—int的值小于r時,自適應(yīng)激勵矢量生成單元104使切割出的區(qū)間的長度被反復(fù)補充直至其達(dá)到長度r為止。另外,自適應(yīng)激勵矢量生成單元104對由音調(diào)周期指示單元101提供的從"32"至"287"為止的256組的T—int,反復(fù)由上式(l)表示的切割處理。合成濾波器105利用對每個子幀輸入的線性預(yù)測系數(shù)構(gòu)成合成濾波器,在對每個子幀輸入的子幀索引表示第一子幀時,將由下式(3)表示的rxr的脈沖響應(yīng)矩陣H輸出到評價尺度計算單元107。另一方面,在對每個子幀輸入的子幀索引表示第二子幀時,合成濾波器105將由下式(4)表示的mxm的脈沖響應(yīng)矩陣H輸出到評價尺度計算單元107。
<formula>formula see original document page 10</formula>
如式(3)和式(4)所示,在子幀索引表示第 一子幀時的脈沖響應(yīng)矩陣H求得 相當(dāng)于長度r的矩陣,而在子幀索引表示第二子幀時的脈沖響應(yīng)矩陣H求得 相當(dāng)于子幀長度m的矩陣。搜索用目標(biāo)矢量生成單元106將子幀索引表示第一子幀時所輸入的 Xl=[x(0) x(l) ... x(m-l)]與子幀索引表示第二子幀時所輸入的X2=[x(m) x(m+l).,.x(n-l)]相加,生成由下式(5)表示的幀長度n的目標(biāo)矢量XF。然后, 搜索用目標(biāo)矢量生成單元106在第一子幀的音調(diào)周期搜索處理中,根據(jù)幀長 度n的目標(biāo)矢量XF生成由下式(6)表示的長度r的搜索用目標(biāo)矢量X,并輸 出到評價尺度計算單元107。另外,搜索用目標(biāo)矢量生成單元106在第二子 幀的音調(diào)周期搜索處理中,從幀長度n的目標(biāo)矢量XF生成由下式(7)表示的子幀長度m的搜索用目標(biāo)矢量X,并輸出到評價尺度計算單元107。,=[X(0) X(l)…X(附-l) …JC("-1)] …(5)h[x(O) ;c(l)…x(m-1) x(附)…;c(r-1)] …(6) X = [x(m)……(7)評價尺度計算單元107在第一子幀的音調(diào)周期搜索處理中,利用從自適 應(yīng)激勵矢量生成單元104輸入的長度r的自適應(yīng)激勵矢量P(T—int)、從合成濾 波器105輸入的rxr的脈沖響應(yīng)矩陣H、以及從搜索用目標(biāo)矢量生成單元106 輸入的長度r的搜索用目標(biāo)矢量X,根據(jù)下式(8)計算音調(diào)周期搜索用(自適應(yīng) 激勵矢量量化)的評價尺度Dist(Tjnt),并輸出到評價尺度比較單元108。另 外,評價尺度計算單元107在第二子幀的音調(diào)周期搜索處理中,利用從自適 應(yīng)激勵矢量生成單元104輸入的子幀長度m的自適應(yīng)激勵矢量P(T_int)、從 合成濾波器105輸入的mxm的脈沖響應(yīng)矩陣H、以及從搜索用目標(biāo)矢量生成 單元106輸入的子幀長度m的搜索用目標(biāo)矢量X,根據(jù)下式(8)計算音調(diào)周期 搜索用(自適應(yīng)激勵矢量量化)的評價尺度Dist(T—int),并輸出到評價尺度比較 單元108。一 l朋(rjnt)l如上式(8)所示,評價尺度計算單元107求對脈沖響應(yīng)矩陣H和自適應(yīng)激 勵矢量P(T一int)進(jìn)行巻積所獲得的再現(xiàn)矢量與搜索用目標(biāo)矢量X之間的平方 誤差作為評價尺度。另外,在評價尺度計算單元107中計算評價尺度Dist(T—int) 時,通常利用將搜索用脈沖響應(yīng)矩陣H與在CELP語音編碼裝置中所包含的 聽覺加權(quán)濾波器的脈沖響應(yīng)矩陣W相乘所獲得的矩陣H,(=HxW),以代替上 式(8)中的搜索用脈沖響應(yīng)矩陣H。但是,在以下的說明中,未對H和H,進(jìn)行 區(qū)別而將其記載為H。評價尺度比較單元108在第一子幀的音調(diào)周期搜索處理中,對從評價尺 度計算單元107輸入的、例如256組評價尺度Dist(Tjnt)進(jìn)行比較,求其中 的與最大的評價尺度Dist(Tjnt)對應(yīng)的音調(diào)周期Tjnt,,將表示音調(diào)周期 T—int,的音調(diào)周期索引IDX輸出到外部,同時輸出到音調(diào)周期存儲單元102 和自適應(yīng)激勵碼本103。另外,評價尺度比較單元108在第二子幀的音調(diào)周 期搜索處理中,對/人評價尺度計算單元107輸入的、例如16組評價尺度Dist(Tjnt)進(jìn)行比較,求其中的與最大的評價尺度Dist(Tjnt)對應(yīng)的音調(diào)周期 T—int,,將表示音調(diào)周期T—int,與在第一子幀的音調(diào)周期^叟索處理中求出的音 調(diào)周期T—int,之間的音調(diào)周期差的音調(diào)周期索引IDX輸出到外部,同時輸出 到音調(diào)周期存儲單元102和自適應(yīng)激勵碼本103。包含自適應(yīng)激勵矢量量化裝置100的CELP語音編碼裝置,將包含了在 評價尺度比較單元108中所生成的音調(diào)周期索引IDX的語音編碼信息,發(fā)送 到包含本實施方式的自適應(yīng)激勵矢量逆量化裝置的CELP解碼裝置。CELP 解碼裝置對接收到的語音編碼信息進(jìn)行解碼,獲得音調(diào)周期索引IDX,輸入 到本實施方式的自適應(yīng)激勵矢量逆量化裝置。另外,與CELP語音編碼裝置 中的語音編碼處理同樣,在CELP解碼裝置中的語音解碼處理也以子幀為單 位進(jìn)行,CELP解碼裝置將子幀索引輸入到本實施方式的自適應(yīng)激勵矢量逆量 化裝置。圖3是表示本實施方式的自適應(yīng)激勵矢量量化裝置200的主要結(jié)構(gòu)的方 框圖。在圖3中,自適應(yīng)激勵矢量逆量化裝置200包括音調(diào)周期判定單元201、 音調(diào)周期存儲單元202、自適應(yīng)激勵碼本203以及自適應(yīng)激勵矢量生成單元 204,輸入在CELP語音解碼裝置中所生成的子幀索引和音調(diào)周期索引IDX。在對每個子幀輸入的子幀索引表示第一子幀時,音調(diào)周期判定單元201 將與所輸入的音調(diào)周期索引對應(yīng)的音調(diào)周期T—int,,輸出到音調(diào)周期存儲單 元202、自適應(yīng)激勵碼本203和自適應(yīng)激勵矢量生成單元204。另外,在對每 個子幀輸入的子幀索引表示第二子幀時,音調(diào)周期判定單元201將對應(yīng)于所 輸入的音調(diào)周期索引對應(yīng)的音調(diào)周期差與音調(diào)周期存儲單元202中存儲的第 一子幀的音調(diào)周期Tjnt,相加,并將相加結(jié)果即音調(diào)周期T一int,輸出到自適應(yīng) 激勵碼本203和自適應(yīng)激勵矢量生成單元204作為第二子幀的音調(diào)周期。音調(diào)周期存儲單元202存儲從音調(diào)周期判定單元201輸入的第一子幀的 音調(diào)周期Tjnt,,所存儲的第一子幀的音調(diào)周期T一int,在第二子幀的處理中通 過音調(diào)周期判定單元201讀出。自適應(yīng)激勵碼本203內(nèi)置了存儲與自適應(yīng)激勵矢量量化裝置100的自適 應(yīng)激勵碼本103所具備的驅(qū)動激勵同樣的驅(qū)動激勵的緩沖器,每當(dāng)每個子幀 的自適應(yīng)激勵解碼處理結(jié)束,利用具有從音調(diào)周期判定單元201輸入的音調(diào) 周期T一int,的自適應(yīng)激勵矢量,更新驅(qū)動激勵。在對每個子幀輸入的子幀索引表示第一子幀時,自適應(yīng)激勵矢量生成單元204從自適應(yīng)激勵碼本203中切割出相當(dāng)于子幀長度m的、具有從音調(diào)周期判定單元201輸入的音調(diào)周期T—int,的自適應(yīng)激勵矢量P,(T—int,),并將其輸出作為自適應(yīng)激勵矢量。在自適應(yīng)激勵矢量生成單元204中生成的自適應(yīng)激勵矢量P,(T一int,)由下式(9)表示。(e-r一int')"]….,、 r im'+i) ,八、尸'(r一int')-尸' 、 ,一 , ...(9)—exc(e—T_int'+m -l)這樣,根據(jù)本實施方式,在以子幀為單位進(jìn)行線性預(yù)測編碼的CELP語 音編碼中,與第二子幀相比,在第一子幀中利用較多的^f言息量進(jìn)^f以子幀為 單位的自適應(yīng)激勵矢量量化時,通過以各個子幀為單位的線性預(yù)測系數(shù),構(gòu) 成具有長于子幀長度的行和列的脈沖響應(yīng)矩陣,從自適應(yīng)激勵碼本中切割出長于子幀長度的自適應(yīng)激勵矢量,進(jìn)行第一子幀的自適應(yīng)激勵矢量量化。由 此,能夠降低各個子幀的自適應(yīng)激勵矢量量化的量化精度的偏移,能夠提高 整體的語音編碼精度。另外,在本實施方式中,以預(yù)先設(shè)定滿足nKr^n的r的情況為例進(jìn)行了 說明,但本發(fā)明并不限于此,也可基于用于各個子幀的自適應(yīng)激勵矢量量化 的信息量,自適應(yīng)地改變r的值。例如,用于第二子幀的自適應(yīng)激勵矢量量 化的信息量越少,將r的值設(shè)定得越大,從而能夠在第一子幀的自適應(yīng)激勵 矢量量化中增大覆蓋第二子幀的范圍,更有效地降低各個子幀的自適應(yīng)激勵 矢量量化的量化4青度的偏移。另外,在本實施方式中,作為音調(diào)周期的候補,以從"32,,至"28"為止的 256組為例進(jìn)行了說明,但本發(fā)明并不限于此,也可將其他的范圍作為音調(diào) 周期的候補。另夕卜,在本實施方式中,以在包含自適應(yīng)激勵矢量量化裝置100的CELP 語音編碼裝置中,將一個幀劃分為兩個子幀,對各個子幀進(jìn)行線性預(yù)測分析 為前提,進(jìn)行了說明,但本發(fā)明并不限于此,也可在CELP方式的語音編碼 裝置中,將一個幀劃分為三個以上的子幀,對各個子幀進(jìn)行線性預(yù)測分析。另外,在本實施方式中,以自適應(yīng)激勵碼本103基于從評價尺度比較單 元108反饋的音調(diào)周期索引IDX更新驅(qū)動激勵的情況為例進(jìn)行了說明,但本發(fā)明并不限于此,也可利用在CELP語音編碼中通過自適應(yīng)激勵矢量和固定 激勵矢量生成的激勵矢量,更新驅(qū)動激勵。
另外,在本實施方式中,以將線性預(yù)測殘差矢量作為輸入,利用自適應(yīng) 激勵碼本搜索線性預(yù)測殘差矢量的音調(diào)周期的情況為例進(jìn)行了說明,但本發(fā)
明并不限于此,也可將語音信號本身作為輸入,直接搜索語音信號本身的音 調(diào)周期。
(實施方式2)
圖4是表示本發(fā)明的實施方式2的自適應(yīng)激勵矢量量化裝置300的主要 結(jié)構(gòu)的方框圖。另外,自適應(yīng)激勵矢量量化裝置300具有與實施方式1所示 的自適應(yīng)激勵矢量量化裝置IOO(參照圖l)同樣的基本結(jié)構(gòu),對相同的結(jié)構(gòu)要 素附加相同的標(biāo)號,并省略其說明。
自適應(yīng)激勵矢量量化裝置300與自適應(yīng)激勵矢量量化裝置100的不同之 處在于,還具備頻譜距離計算單元301和音調(diào)周期搜索分析長度決定單元 302。自適應(yīng)激勵矢量量化裝置300的自適應(yīng)激勵矢量生成單元304、合成濾 波器305和搜索用目標(biāo)矢量生成單元306與自適應(yīng)激勵矢量量化裝置100的 自適應(yīng)激勵矢量生成單元104、合成濾波器105和搜索用目標(biāo)矢量生成單元 106,在其處理上存在部分不同之處,為了表示該不同之處,附加不同的標(biāo)號。
頻鐠距離計算單元301將所輸入的第一子幀的線性預(yù)測系數(shù)和第二子幀 的線性預(yù)測系數(shù)分別變換為頻譜,求第 一子幀的頻譜與第二子幀的頻譜之間 的距離,并輸出到音調(diào)周期搜索分析長度決定單元302。
音調(diào)周期搜索分析長度決定單元302根據(jù)從頻譜距離計算單元301輸入 的子巾貞間的頻諳距離,決定音調(diào)周期搜索分析長度r,并輸出到自適應(yīng)激勵矢 量生成單元304、合成濾波器305和搜索用目標(biāo)矢量生成單元306。
子幀間的頻鐠距離較大,意味著子幀間的音韻的變動較大,子幀間的音 調(diào)周期的變動隨著音韻的變動也變大的可能性較高。因此,在利用音調(diào)周期 的時間上的連續(xù)性的"A延遲"的方法中,子幀間的頻譜距離較大,音調(diào)周期 的變動也隨之較大時,無法完全通過"A延遲"的音調(diào)周期搜索范圍覆蓋子幀 間的音調(diào)周期的變動的大小的可能性較高。因此,通過根據(jù)音調(diào)周期的時間 上的連續(xù)性的程度,自適應(yīng)地改變使第一子幀的音調(diào)周期搜索的分析長度重 疊(overlap)到第二子幀端的長度,能夠提高量化精度。在本實施方式中,對這 樣的情況,使第一子幀的音調(diào)周期搜索分析長度r更長,在第一子幀的音調(diào)周期搜索中,設(shè)定較多的相當(dāng)于考慮第二子幀的部分,從而提高量化精度。 也就是說,在第 一子幀的音調(diào)周期與第二子幀的音調(diào)周期之間的差較大(較為 不連續(xù))時,在第一子幀的音調(diào)周期搜索的時刻,使分析長度較長地重疊到第 二子幀端。由此,選擇出如能夠進(jìn)一步地考慮第二子幀那樣的音調(diào)周期作為 第一子幀的音調(diào)周期,在第二子幀中A延遲高效地發(fā)揮作用,從而能夠改善 因音調(diào)周期的時間上的不連續(xù)造成的A延遲的非效率性。另一方面,在第一 子幀的音調(diào)周期與第二子幀的音調(diào)周期之間的差較小(較為連續(xù))時,通過使第 一子幀的音調(diào)周期搜索的分析長度只以必要的長度重疊到第二子幀端而不是 過多重疊,能夠適宜地校正在音調(diào)周期搜索精度的時序上的不均勻。
具體而言,在子幀間的頻語距離為規(guī)定的閾值以下時,音調(diào)周期搜索分
析長度決定單元302將音調(diào)周期搜索分析長度r設(shè)定為滿足m<r,^n的條件的 r,,而在子幀間的頻譜距離大于規(guī)定的閾值時,將音調(diào)周期搜索分析長度r 設(shè)定為滿足m<r,,^i且r,々"的條件的r"。
自適應(yīng)激勵矢量生成單元304、合成濾波器305和搜索用目標(biāo)矢量生成 單元306與自適應(yīng)激勵矢量量化裝置100的自適應(yīng)激勵矢量生成單元l(H、 合成濾波器105和搜索用目標(biāo)矢量生成單元106的不同之處僅在于,利用從 音調(diào)周期搜索分析長度決定單元302輸入的音調(diào)周期搜索分析長度r,代替預(yù) 先設(shè)定的音調(diào)周期搜索分析長度r,所以這里省略詳細(xì)的說明。
這樣,根據(jù)本實施方式,自適應(yīng)激勵矢量量化裝置根據(jù)子幀間的頻譜距 離決定音調(diào)周期搜索分析長度r,所以在子幀間的音調(diào)周期的變動較大時,能 夠?qū)⒁粽{(diào)周期搜索分析長度r設(shè)定得更長,能夠進(jìn)一步地降低各個子幀的自 適應(yīng)激勵矢量量化的量化精度的偏移,從而進(jìn)一步提高整體的語音編碼精度。
另外,在本實施方式中,以頻譜距離計算單元301從線性預(yù)測系數(shù)求頻 譜,音調(diào)周期搜索分析長度決定單元302根據(jù)子幀間的頻譜距離決定音調(diào)周 期搜索分析長度r的情況為例進(jìn)行了說明,但本發(fā)明并不限于此,音調(diào)周期 搜索分析長度決定單元302也可根據(jù)倒頻語(cepstrum)距離、a參數(shù)的距離和 在LSP領(lǐng)域的距離等,決定音調(diào)周期搜索分析長度r。
另外,在本實施方式中,以音調(diào)周期搜索分析長度決定單元302利用子 幀間的頻i普距離作為用于預(yù)測子幀間的音調(diào)周期的變動的程度的參數(shù)的情況 為例進(jìn)行了說明,但本發(fā)明并不限于此,也可利用輸入語音信號的子幀間的 功率的差或子幀間的音調(diào)周期的差作為用于預(yù)測子幀間的音調(diào)周期的變動的程度的參數(shù)即用于預(yù)測音調(diào)周期的時間上的連續(xù)性的參數(shù)。在上述的情況下, 子幀間的音韻的變動越大,子幀間的功率的差或前一幀的子幀間的音調(diào)周期
的差越大,所以將音調(diào)周期搜索分析長度r設(shè)定得更長。
以下,說明利用輸入語音信號的子幀間的功率之差或前一幀的子幀間的 音調(diào)周期之差作為預(yù)測子幀間的音調(diào)周期的變動程度的參數(shù)時的自適應(yīng)激勵 矢量量化裝置的動作。
在利用輸入語音信號的子幀間的功率之差作為預(yù)測子幀間的音調(diào)周期的
變動程度的參數(shù)時,圖5所示的自適應(yīng)激勵矢量量化裝置400的功率差計算 單元401通過下式(10)求輸入語音信號的第一子幀的功率與第二子幀的功率 之間的差Pow dist。<formula>formula see original document page 16</formula>其中,sp是以sp(O)、 sp(l)..... sp(n-l)表示的輸入語音。另外,sp(O)
是與當(dāng)前時刻對應(yīng)的輸入語音樣本,與第一子幀對應(yīng)的輸入語音以sp(O)、
sp(l)..... sp(m-l)表示,與第二子幀對應(yīng)的輸入語音以sp(m)、 sp(m+l)、…
、sp(n-l)表示。
功率差計算單元401既可根據(jù)上式(10)從子幀長度的輸入語音樣本求功 率的差,也可根據(jù)下式(ll),從包括過去的輸入語音的范圍的、滿足m2>m 的m2的長度的輸入語音求功率的差。<formula>formula see original document page 16</formula>在子幀間的功率之差為規(guī)定的閾值以下時,音調(diào)周期搜索分析長度決定 單元402將音調(diào)周期搜索分析長度r設(shè)定為滿足nKr,Sn的條件的r,。然后, 在子幀間的功率之差大于規(guī)定的閾值時,音調(diào)周期搜索分析長度決定單元402 將音調(diào)周期搜索分析長度r設(shè)定為滿足m<r"^i且r,々"的條件的r"。
另一方面,在利用前一幀的子幀間的音調(diào)周期之差作為預(yù)測子幀間的音
調(diào)周期的變動程度的參數(shù)時,圖6所示的自適應(yīng)激勵矢量量化裝置500的音
調(diào)周期差計算單元501通過下式(12)求前一幀的第一子幀的音調(diào)周期與第二
子幀的音調(diào)周期之間的差Pit一dist。
<formula>formula see original document page 16</formula>
其中,T_prel是前一幀的第一子幀的音調(diào)周期,Tjre2是前一幀的第二子幀的音調(diào)周期。
在前一 幀的子幀間的音調(diào)周期的差Pit—dist為規(guī)定的閾值以下時,音調(diào)周
期搜索分析長度決定單元502將音調(diào)周期搜索分析長度r設(shè)定為滿足m<r,^i 的條件的r,。然后,在前一幀的子幀間的音調(diào)周期的差Pit一dist大于規(guī)定的閾 值時,音調(diào)周期搜索分析長度決定單元502將音調(diào)周期搜索分析長度r設(shè)定 為滿足m<r"^i且r,々"的條件的r"。
或者,音調(diào)周期搜索分析長度決定單元502也可僅利用過去幀的第一子 幀的音調(diào)周期T_prel或第二子幀的音調(diào)周期T_pre2作為預(yù)測子幀間的音調(diào) 周期的變動程度的參^:。
有以下的統(tǒng)計上的傾向,即過去幀的音調(diào)周期的值越大,與前一幀的音 調(diào)周期相比,當(dāng)前一幀的音調(diào)周期容易產(chǎn)生較大的變動,相對于此,過去幀 的音調(diào)周期的值越小,與前一幀的音調(diào)周期相比,當(dāng)前一幀的音調(diào)周期的變 動的幅度容易變小。因此,在利用音調(diào)周期的時間性的連續(xù)性的"A延遲"的 方法中,過去幀的音調(diào)周期較大,音調(diào)周期的變動也隨之較大時,無法完全 地通過"A延遲"的音調(diào)周期搜索范圍覆蓋子幀間的音調(diào)周期的變動的大小的 可能性高。因此,在這樣的情況下,使第一子幀的音調(diào)周期搜索分析長度r 更長,在第一子幀的音調(diào)周期搜索中,設(shè)定較多的相當(dāng)于考慮第二子幀的部 分,從而提高量化精度。例如,在過去幀的第二子幀的音調(diào)周期的Tjre2的 值為規(guī)定的閾值以下時,音調(diào)周期搜索分析長度決定單元502將音調(diào)周期搜 索分析長度r設(shè)定為滿足m々,^n的條件的r,,而在過去幀的第二子幀的音調(diào) 周期T_pre2的值大于規(guī)定的閾值時,將音調(diào)周期搜索分析長度r設(shè)定為滿足 m<r"^i且r,〈r"的條件的r"。
另外,在本實施方式中,以將用于預(yù)測子幀間的音調(diào)周期的變動程度的 參數(shù)與規(guī)定的一個閾值進(jìn)行比較,并基于比較結(jié)果決定音調(diào)周期搜索分析長 度r的情況為例進(jìn)行了說明,但本發(fā)明并不限于此,也可將用于預(yù)測子幀間 的音調(diào)周期的變動程度的參數(shù)與多個閾值進(jìn)行比較,并且預(yù)測子幀間的音調(diào) 周期的變動程度的參數(shù)越大,將音調(diào)周期搜索分析長度r設(shè)定得越小。
以上,i兌明了本發(fā)明的實施方式。
本發(fā)明的自適應(yīng)激勵矢量量化裝置能夠裝載于進(jìn)行語音傳輸?shù)囊苿油ㄐ?系統(tǒng)中的通信終端裝置,由此能夠提供具有與上述同樣的作用效果的通信終
端裝置。另外,這里,以由硬件構(gòu)成本發(fā)明的情況為例進(jìn)行了說明,但也能夠由
軟件實現(xiàn)本發(fā)明。例如,通過利用編程語言(programming language)記述本發(fā) 明的自適應(yīng)激勵矢量量化方法的算法,將該程序存儲在存儲器后^f吏信息處理 單元執(zhí)行該程序,從而能夠?qū)崿F(xiàn)與本發(fā)明的自適應(yīng)激勵矢量量化裝置和自適 應(yīng)矢量逆量化裝置同樣的功能。
另外,用于上述實施方式的說明中的各功能塊通常作為集成電路即LSI 來實現(xiàn)。這些塊既可以單獨地集成為一個芯片,也可以包含一部分或全部地 集成為一個芯片。
另外,雖然此處稱為LSI,但根據(jù)集成程度,也可以稱為IC、系統(tǒng)LSI、 超大LSI(Super LSI)、特大LSI(Ultra LSI)等。
另外,實現(xiàn)集成電路化的方法不僅限于LSI,也可使用專用電路或通用 處理器來實現(xiàn)。也可以使用在LSI制造后可編程的FPGA(Field Programmable Gate Array:現(xiàn)場可編程門陣列),或者可重構(gòu)LSI內(nèi)部的電路單元的連接和 設(shè)定的可重構(gòu)處理器。
再者,隨著半導(dǎo)體的技術(shù)進(jìn)步或隨之派生的其它技術(shù)的出現(xiàn),如果能夠 出現(xiàn)替代LSI的集成電路化的新技術(shù),當(dāng)然可利用該新技術(shù)進(jìn)行功能塊的集 成化。有可能適用于生化技術(shù)等。
在2006年12月15日提交的特愿第2006_338343號的日本專利申請以及 在2007年5月23日提交的特愿第2007-137031號的日本專利申請中所包含 的說明書、附圖以及說明書摘要的公開內(nèi)容,全部引用于本發(fā)明。
工業(yè)實用性
本發(fā)明的自適應(yīng)激勵矢量量化裝置和自適應(yīng)激勵矢量量化方法能夠適用 于語音編碼和語音解碼等用途。
權(quán)利要求
1. 自適應(yīng)激勵矢量量化裝置,輸入通過將長度為n的幀劃分為多個長度為m的子幀進(jìn)行線性預(yù)測分析所生成的長度為m的線性預(yù)測殘差矢量和線性預(yù)測系數(shù),對第一子幀使用比對第二子幀多的比特數(shù),進(jìn)行每個子幀的自適應(yīng)激勵矢量量化,其中n和m為整數(shù),該自適應(yīng)激勵矢量量化裝置包括自適應(yīng)激勵矢量生成單元,從自適應(yīng)激勵碼本中切割出長度為r的自適應(yīng)激勵矢量,其中,m<r≤n;目標(biāo)矢量構(gòu)成單元,根據(jù)所述多個子幀的所述線性預(yù)測殘差矢量生成長度為r的目標(biāo)矢量;合成濾波器,利用所述各個子幀的所述線性預(yù)測系數(shù),生成r×r的脈沖響應(yīng)矩陣;評價尺度計算單元,利用所述長度為r的自適應(yīng)激勵矢量、所述長度為r的目標(biāo)矢量以及所述r×r的脈沖響應(yīng)矩陣,對多個音調(diào)周期的候補,計算自適應(yīng)激勵矢量量化的評價尺度;以及評價尺度比較單元,比較與所述多個音調(diào)周期的候補對應(yīng)的所述評價尺度,求使所述評價尺度最大的音調(diào)周期作為所述第一子幀的自適應(yīng)激勵矢量量化結(jié)果。
2. 如權(quán)利要求l所述的自適應(yīng)激勵矢量量化裝置,用于所述第一子幀的自適應(yīng)激勵矢量量化的比特數(shù)與用于所述第二子幀 的自適應(yīng)激勵矢量量化的比特數(shù)之間的差越大,則將所述r設(shè)定得越大。
3. 如權(quán)利要求1所述的自適應(yīng)激勵矢量量化裝置,還包括 計算單元,將所述多個子幀的線性預(yù)測系數(shù)分別變換為多個頻譜,并計算所述多個頻譜間的距離;以及設(shè)定單元,所述頻譜間的距離越大,其將所述r設(shè)定得越長。
4. 如權(quán)利要求1所述的自適應(yīng)激勵矢量量化裝置,還包括 計算單元,計算所述多個子幀間的功率的差;以及 設(shè)定單元,所述子幀間的功率的差越大,其將所述r設(shè)定得越長。
5. 如權(quán)利要求l所述的自適應(yīng)激勵矢量量化裝置,還包括 設(shè)定單元,過去幀的所述多個子幀的音調(diào)周期的值越大,其將所述r設(shè)定得越長。
6. 如權(quán)利要求1所述的自適應(yīng)激勵矢量量化裝置,還包括 計算單元,計算過去幀的所述多個子幀間的音調(diào)周期的差;以及設(shè)定單元,所述過去幀的所述多個子幀間的音調(diào)周期的差越大,其將所 述r設(shè)定得越長。
7. 碼激勵線性預(yù)測語音編碼裝置,包括權(quán)利要求1所述的自適應(yīng)激勵矢 量量化裝置。
8. 自適應(yīng)激勵矢量量化方法,輸入通過將長度為n的幀劃分為多個長度 為m的子幀進(jìn)行線性預(yù)測分析所生成的長度為m的線性預(yù)測殘差矢量和線性 預(yù)測系數(shù),對第一子幀使用比對第二子幀多的比特數(shù),進(jìn)行每個子幀的自適 應(yīng)激勵矢量量化,其中n和m為整數(shù),該自適應(yīng)激勵矢量量化方法包括以下 的步驟從自適應(yīng)激勵碼本中切割出長度為r的自適應(yīng)激勵矢量,其中,m<r^n; 根據(jù)所述多個子幀的所述線性預(yù)測殘差矢量生成長度為r的目標(biāo)矢量; 利用所述各個子幀的所述線性預(yù)測系數(shù),生成rxr的脈沖響應(yīng)矩陣; 利用所述長度為r的自適應(yīng)激勵矢量、所述長度為r的目標(biāo)矢量以及所述rxr的脈沖響應(yīng)矩陣,對多個音調(diào)周期的候補,計算自適應(yīng)激勵矢量量化的評價尺度;以及比較與所述多個音調(diào)周期的候補對應(yīng)的所述評價尺度,求使所述評價尺度最大的音調(diào)周期作為所述第 一子幀的自適應(yīng)激勵矢量量化結(jié)果。
全文摘要
公開了自適應(yīng)激勵矢量量化裝置等,其在第一子幀利用比第二子幀更多的信息量,以子幀為單位進(jìn)行自適應(yīng)激勵矢量量化時,能夠降低各個子幀的自適應(yīng)激勵矢量量化的量化精度的偏移。在該裝置的第一子幀的自適應(yīng)激勵矢量量化中,自適應(yīng)激勵矢量生成單元(104)從自適應(yīng)激勵碼本(103)中切割出長度r(r、n和m為整數(shù),m<r≤n,n為幀長度,m為子幀長度)的自適應(yīng)激勵矢量,合成濾波器(105)利用所輸入的第一子幀的線性預(yù)測系數(shù)生成r×r的脈沖響應(yīng)矩陣,搜索用目標(biāo)矢量生成單元(106)利用以子幀為單位的目標(biāo)矢量生成長度r的搜索用目標(biāo)矢量,評價尺度計算單元(107)計算自適應(yīng)激勵矢量量化的評價尺度。
文檔編號G10L19/02GK101548317SQ20078004520
公開日2009年9月30日 申請日期2007年12月14日 優(yōu)先權(quán)日2006年12月15日
發(fā)明者佐藤薰, 森井利幸 申請人:松下電器產(chǎn)業(yè)株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1