語音編碼的制作方法

文檔序號：2821954閱讀：359來源：國知局

專利名稱：語音編碼的制作方法
技術領域：
本發(fā)明涉及語音編碼，更具體地，涉及在包含數(shù)字化語音樣本的離散時間幀中對語音信號編碼，但是本發(fā)明特別適用于，盡管是不必要的，變長比特語音編碼。
在歐洲，被接受的數(shù)字蜂窩電話的標準以字首GSM而聞名(用于移動通訊的全球系統(tǒng))，最近版本的GSM標準(GSM2；06．60)導致已知為增強全速率(EFR)的新語音編碼算法(或編解碼器)的細則。如傳統(tǒng)的語音編解碼器那樣，EFR被設計為降低個體聲音或數(shù)據(jù)通訊所需的比特率。通過最小化該比特率，可以復用到給定信號帶寬的獨立呼叫數(shù)可以增加。
類似于EFR中使用的語音編碼器結構的通常的圖解說明在圖l中給出。采樣后的語音信號被分成20毫秒的幀x，每個包含160個樣本。每個樣本由16個比特表示。通過首先將樣本幀應用于線性預測編碼器(LPC1)，這些樣本幀被編碼，其中的線性預測編碼器為每個幀產(chǎn)生一組LPC系數(shù)a．這些系數(shù)代表幀中的短時冗余。
來自LPC1的輸出包括LPC系數(shù)a和殘余信號γ1，該信號是通過LPC分析濾波器從輸入語音幀中除去短時冗余而產(chǎn)生的。然后，殘留信號被提供給長時預測器(LPT)2，它產(chǎn)生一組表示殘留信號γ1中長時冗余的LTP參數(shù)b，并且還產(chǎn)生長時冗余被除去的殘留信號s。實際上，長時預測分兩個階段，(1)首先為整個幀進行開環(huán)估計得到一組LTP參數(shù)；(2)其次對估計所得的參數(shù)進行閉環(huán)精確化以便為該幀的每個40樣本子幀產(chǎn)生一組LTP參數(shù)。LTP2提供的殘留信號s依次通過濾波器1／A(z)和W(z)而被濾波(以圖l中的方框2a給出)以給出加權后的殘留信號s~]]>。這些濾波器中的第一個是LPC合成濾波器，而第二個是強調(diào)譜中的共振峰結構的感知加權濾波器．所有濾波器的參數(shù)是由LPC分析階段給出的(塊1)。
代數(shù)激勵碼書3被用于產(chǎn)生激勵矢量c。對于每個40樣本子幀(每幀有4個子幀)，通過縮放單元4，一些不同的“候選”激勵矢量依次被施加給LTP合成濾波器5。濾波器5接受當前子幀的LTP參數(shù)，并且在激勵矢量中引入LTP參數(shù)預測的長時冗余。所產(chǎn)生的信號然后被提供給LPC合成濾波器6，該濾波器接收連續(xù)幀的LPC系數(shù)。對于給定的子幀，利用幀到幀的內(nèi)插會產(chǎn)生一組LPC系數(shù)，所產(chǎn)生的系數(shù)依次應用于產(chǎn)生合成信號ss。

圖1的編碼器不同于以前的碼激勵線性預測(CELP)編碼器，后者用到了包含預定的激勵矢量組的碼書。前者類型的編碼器卻依賴于激勵矢量的代數(shù)產(chǎn)生和確定(例如，見WO 9624925)，并且常常被稱為代數(shù)CELP或ACELP。更具體的，量化矢量d(i)被定義為包含10個非零脈沖。所有的脈沖幅度可以為+1或-1。子幀中40個樣本位置(I=0到39)被劃分成5個“軌道”，每個軌道包括兩個脈沖(即8個可能位置中的2個)。如在下面表中給出的。
表1代數(shù)碼書中各個脈沖的可能位置給定軌道中每對脈沖的位置以6比特編碼(即，總共30比特，每個脈沖3比特)，而軌道中第一脈沖的符號以1比特編碼(總共5比特)。第二脈沖的符號并不會被特別編碼，而是根據(jù)其相對于第一脈沖的位置來獲得，如果第二脈沖的采樣位置先于第一脈沖，那麼第二脈沖被定義為與第一脈沖符號相反，否則，兩個脈沖被定義具有相同的符號。所有的3比特脈沖位置被進行格雷編碼，以便提高針對信道誤差的強度，使得量化矢量可以用35比特代數(shù)碼u來編碼。
為了產(chǎn)生激勵矢量c(i)，由代數(shù)碼u定義的量化矢量d(i)被預濾波器FE(z)濾波，其中的預濾波器增強了特殊的譜分量以便提高合成語音的質(zhì)量。預濾波器(常常稱為色彩濾波器)用為該子幀產(chǎn)生的某些LTP參數(shù)來定義。
如傳統(tǒng)的CELP編碼器那樣，差值單元7在逐個樣本(逐個子幀)的基礎上確定合成信號和輸入信號之間的差值。加權濾波器8被用于對誤差信號加權以考慮人類音頻感知。對于給定的子幀，搜索單元9從代數(shù)碼書3產(chǎn)生的候選矢量中選出適當?shù)募钍噶縶c(i)，其中I=0到39}，其方式是識別出最小化加權均方誤差的矢量。該過程通常稱為“矢量量化”。
如已經(jīng)注意到的，在縮放單元4激勵矢量被乘以增益gc。導致縮放后的激勵矢量的能量等于加權殘留信號s~]]>能量的增益值被選出，其中的殘留信號由LTP2給出。該增益由下式給出gc=s~THc(i)c(i)THTHc(i)]]>其中H是線性預測模型(LTP和LPC)脈沖響應矩陣。有必要將增益信息連同定義激勵矢量的代數(shù)碼一起引入編碼后的語音子幀，以使得子幀能夠被正確重構。然而，與其直接引入增益gc，不如在處理單元10中根據(jù)以前的語音子幀產(chǎn)生預測增益并且在單元11中確定校正因子，即然后，在包括5比特碼矢量的校正因子碼書情況下，相關因子被進行矢量量化。索引矢量νγ表明量化后的增益相關因子該因子被引入編碼后的幀。假定增益gc在幀與幀之間略有不同，那麼γgc≌1，并可以用相對較短的碼書來正確量化。
實際上，預測增益是利用具有固定系數(shù)的移動平均(MA)預測得到的，如下所示，對激勵能量進行了4階MA預測。使得子幀n中除去平均激勵能量(以dB)后得到E(n)，由下式給出E(n)=10log(1Ngc2Σi=0N-1c2(i))-E_......(3)]]>其中N=40是子幀的大小，c(i)是激勵矢量(包括預濾波)。E=36dB是典型激勵能量的預定均值。子幀n的能量可以由下式預測其中[b1b2b3b4]=
是MA預測系數(shù)，是子幀j的預測能量中的誤差。根據(jù)下面等式，當前子幀的誤差被計算出來，用在處理后續(xù)子幀中通過以代替等式(3)中的E(n)，預測能量可以用于計算預測增益如下式其中Ec=10log(1NΣi=0N-1c2(i))......(7)]]>是激勵矢量c(i)的能量。
增益校正因子碼書搜索被執(zhí)行以識別量化后的增益校正因子它使得誤差最小化編碼幀包括LPC系數(shù)，LTP參數(shù)，定義激勵矢量的代數(shù)碼，以及量化后的增益校正因子碼書索引。在發(fā)送之前，在編碼和復用單元12中會對某些編碼參數(shù)進行進一步編碼。實際上，LPC系數(shù)被轉(zhuǎn)換成相應數(shù)量的線性譜對(LSP)系數(shù)，如在“Efficient Vector Quantisation ofLPC Parameters at 24Bits／Frame”Kuldip K．P和Bishnu S．A，IEEETrans Speech and Audio Processing，卷1，第1期，January 1993中描述的那樣，整個的編碼幀也被編碼以用于誤差檢測和校正。為GSM2制定的編解碼器以完全相同的比特數(shù)，即244對每個語音幀進行編碼。在引入卷積編碼和附加了循環(huán)冗余檢驗比特后增加到456比特。
圖2給出ACELP解碼器的通常結構，適于對被圖1的編碼器編碼的信號解碼。解復用器13將所接收的編碼信號分離為各個分量。相同于解碼器處的碼書3的代數(shù)碼書14確定編碼矢量并對該矢量進行預濾波(利用LTP參數(shù))以產(chǎn)生激勵矢量，其中的編碼矢量由所接收的編碼信號中的35比特代數(shù)碼確定。增益校正因子是利用所接收的量化增益校正因子并根據(jù)增益校正因子碼書確定的，并且該因子在塊15中用于校正在塊16確定的、根據(jù)以前解碼的子幀得到的預測增益。在塊17中，激勵矢量被乘以校正后的增益，然后該乘積被傳送給LTP合成濾波器18和LPC合成濾波器19。LTP和LPC濾波器分別接收由編碼信號傳送的LTP參數(shù)和LPC系數(shù)，并在激勵矢量中再次引入長時和短時冗余。
語音在其本質(zhì)上變化性很強，包括強活動期和弱活動期，并且常常包括相對的無聲段。因此使用固定比特率編碼會浪費帶寬資源。一些語音編解碼器被推薦，這些編解碼器的幀與幀之間，子幀與子幀之間的編碼比特率是變化的。例如，US 5，657，420推薦了一種語音編解碼器用于US CDMA系統(tǒng)中，在該系統(tǒng)中，數(shù)據(jù)幀的編碼比特率是根據(jù)數(shù)據(jù)幀中的語音活動等級而從一些可能的比特率中選出的。
至于ACELP編解碼器，建議將語音信號子幀劃分成兩類或多類，并用不同的代數(shù)碼書對不同的類別進行編碼。更具體的，加權信號s~]]>隨時間變化很慢的子幀可以利用具有相對較少脈沖(如2)的碼矢量d(i)來編碼，而加權殘留信號變化相對較快的子幀可以用具有相對較多脈沖(例如10)的碼矢量d(i)來編碼。
參考上面的等式(7)，碼矢量d(i)中激勵脈沖數(shù)量的變化，例如從10變?yōu)?將導致激勵矢量c(i)中能量的相應降低。因為等式(4)的能量預測是基于以前子幀的，在激勵脈沖數(shù)量大量減少的情況下，該預測值可能會很差。這樣會導致預測增益中相對較大的誤差，造成增益校正因子在整個語音信號上變化很大。為了能夠正確地對這種變化范圍很大的增益校正因子量化，增益校正因子量化表必須相對很大，需要相應較長的碼書索引νγ，例如5比特。這樣會在編碼子幀數(shù)據(jù)中加入額外的比特。
要理解的是預測增益中的較大誤差也會產(chǎn)生于CELP編碼器中，在該編碼器中碼矢量d(i)的能量在幀與幀之間變化很大，需要類似的較大的碼書用于量化增益校正因子。
本發(fā)明的目標是克服或至少減輕上面提到的現(xiàn)存可變速率編解碼器的不利之處。
根據(jù)本發(fā)明的第一方面，這里給出了一種對語音信號編碼的方法，其中的信號包括含有數(shù)字化語音樣本的子幀序列，對于每個子幀，該方法包括(a)選出一個至少包括一個脈沖的量化矢量d(i)，其中矢量d(i)中的脈沖數(shù)m和脈沖位置可能在子幀之間變化；(b)確定增益值gc用于縮放量化矢量d(i)的幅度或用于縮放從量化矢量d(i)得到的另一個矢量c(i)的幅度，其中縮放后的矢量與加權后的殘留信號s~]]>同步；(c)確定縮放因子k，該因子為預定能量值與量化矢量d(i)中能量之比的函數(shù)；(d)在一個或多個以前處理過的子幀基礎上確定預測的增益值該因子為量化矢量d(i)的能量Ec的函數(shù)或者當另一個矢量c(i)的幅度由所述的縮放因子k縮放時，為該矢量c(i)的能量Ec的函數(shù)；(e)利用所述的增益值gc和所述的預測增益值確定量化的增益校正因子通過如上述的那樣縮放激勵矢量的能量，當量化矢量d(i)中的脈沖數(shù)(或能量)在子幀之間變化時，本發(fā)明會提高預測增益值的準確性。這樣會減小增益校正因子γgc的范圍，并且在與前文相比更小的量化碼書的情況下，能夠進行正確量化。使用較小的碼書降低了用于索引該碼書的矢量的比特長度。此外，可以用與以前所用碼書大小相同的碼書來提高量化準確性。
在本發(fā)明的一個實施方案中，矢量d(i)中的脈沖數(shù)m取決于子幀語音信號的本質(zhì)。在另一個可選實施方案中，脈沖數(shù)m是由系統(tǒng)需求或特性確定的。例如在編碼信號通過傳輸信道傳輸?shù)那闆r下，當信道干涉較高時，脈沖數(shù)可以很小，這樣可以允許更多的保護比特加入信號中。當信道干涉較低時，信號需要較少的保護比特，矢量中的脈沖數(shù)可以增加。
最好的是，本發(fā)明的方法是一種可變比特率的編碼方法，該方法包括通過從語音信號子幀中基本除去長時和短時冗余而產(chǎn)生所述加權殘留信號s~;]]>根據(jù)包括在加權殘留信號s~]]>中的能量而將語音信號子幀分類，并利用該分類來確定量化矢量d(i)中的脈沖數(shù)m。
最好的是，該方法包括為每個子幀產(chǎn)生一組線性預測編碼(LPC)系數(shù)a，并為每幀產(chǎn)生一組長時預測(LTP)參數(shù)b，其中的數(shù)據(jù)幀包括多個語音子幀，并在LPC系數(shù)，LTP參數(shù)，量化矢量d(i)和量化增益校正因子的基礎上產(chǎn)生編碼的語音信號。
最好的是，量化矢量d(i)由代數(shù)碼μ定義，該碼被引入編碼語音信號中。
最好的是增益值gc被用于縮放所述矢量c(i)，該矢量是通過對量化矢量d(i)濾波得到的。
最好的是，預測增益值根據(jù)下面等式確定。其中E是常數(shù)，是在以前子幀基礎上確定的當前子幀中能量的預測值。該預測能量可以用下面等式確定其中bi是移動平均預測系數(shù)，p是預測階數(shù)，是以前子幀j的預測能量的誤差，誤差由下式給出項Ec是由下面等式確定的Ec=10log(1NΣi=0N-1(kc(i))2)]]>其中N是子幀中的樣本數(shù)，最好的是k=Mm]]>其中M是量化矢量d(i)中最大允許的脈沖數(shù)。
最好的是，量化矢量d(i)包括兩個或多個脈沖，其中所有的脈沖具有相同的幅度。
最好的是，步驟(d)包括搜索一個增益校正因子碼書來確定最小化誤差的量化增益校正因子并對識別出的量化增益校正因子進行碼書索引編碼。
根據(jù)本發(fā)明的第二方面，這里給出一種方法，對數(shù)字化采樣語音信號的編碼子幀序列進行解碼，對于每個子幀，該方法包括(a)從編碼信號恢復至少包括一個脈沖的量化矢量d(i)，其中矢量d(i)中的脈沖數(shù)m和脈沖位置可能在子幀之間變化。
(b)從編碼信號恢復量化增益校正因子 (c)確定縮放因子k，該因子為預定能量值與量化矢量d(i)中能量之比的函數(shù)；(d)在一個或多個以前處理過的子幀基礎上確定預測的增益值該增益值為量化矢量d(i)的能量Ec的函數(shù)，或者當另一個得自d(i)的矢量c(i)的幅度由所述縮放因子k縮放時，為該矢量c(i)的能量Ec的函數(shù)。
(e)利用量化增益校正因子來校正預測增益值以給出校正后的增益值gc。
(f)利用增益值gc對量化矢量d(i)或所述另一個矢量c(i)進行縮放以產(chǎn)生與殘留信號s~]]>同步的激勵矢量，其中的殘留信號s~]]>在從原始子幀語音信號中基本上除去冗余信息之后仍然保留在該子幀中。
最好的是，每個所接收信號的編碼子幀包括一個代數(shù)碼u，該碼定義了量化矢量d(i)，每個編碼子幀還包括一個索引，該索引定義了獲得量化增益校正因子的量化增益校正因子碼書的地址。
根據(jù)本發(fā)明的第三方面，這里給出一種裝置用于編碼語音信號，該信號包括含有數(shù)字語音樣本的子幀序列，該裝置具有依次編碼所述每個子幀的裝置，這些該裝置包括用于選出包括至少一個脈沖的量化矢量d(i)的矢量選擇裝置，其中矢量d(i)中的脈沖數(shù)m和脈沖位置可能在子幀之間變化。
用于確定增益值gc的第一信號處理裝置，該增益值用于縮放量化矢量d(i)的幅度或用于縮放得自量化矢量d(i)的另一個矢量c(i)的幅度，其中縮放后的矢量與加權后的殘留信號s~]]>同步。
用于確定縮放因子k的第二信號處理裝置，其中k為預定能量值與量化矢量d(i)中能量之比的函數(shù)；在一個或多個以前處理過的子幀基礎上確定預測增益值的第三信號處理裝置，該增益值為量化矢量d(i)的能量Ec的函數(shù)或當另一個矢量c(i)的幅度由所述縮放因子k縮放時，為該矢量c(i)的能量Ec的函數(shù)。
用于利用所述的增益值gc和所述的預測增益值確定量化增益校正因子的第四信號處理裝置。
根據(jù)本發(fā)明的第四方面，這里給出一種裝置，用于對數(shù)字化采樣語音信號的編碼子幀序列解碼，該裝置具有對所述每個子幀依次解碼的裝置，這些裝置包括用于從編碼信號恢復包括至少一個脈沖的量化矢量d(i)的第一信號處理裝置，其中矢量d(i)中的脈沖數(shù)m和脈沖位置可能在子幀之間變化。
用于從編碼信號恢復量化增益校正因子的第二信號處理裝置。
用于確定縮放因子k的第三信號處理裝置，該因子為預定能量值與量化矢量d(i)中能量之比的函數(shù)；用于在一個或多個以前處理過的子幀基礎上確定預測增益值的第四信號處理裝置，該因子為量化矢量d(i)的能量Ec的函數(shù)或者當另一個矢量c(i)的幅度由所述的縮放因子k縮放時，為該矢量c(i)的能量Ec的函數(shù)。
用于利用量化增益校正因子來校正預測增益值以給出校正后的增益值gc的校正裝置。
用于利用增益值gc對量化矢量d(i)或所述另一個矢量c(i)進行縮放以產(chǎn)生與殘留信號s~]]>同步的激勵矢量的縮放裝置，其中的殘留信號在從原始子幀語音信號中除去冗余信息之后仍然保留在該子幀中。為了更好地理解本發(fā)明以及本發(fā)明是如何實現(xiàn)的，下面通過例子參考附圖描述，其中圖1給出ACELP語音編碼器的方框圖。
圖2給出ACELP語音解碼器的方框圖。
圖3給出修正后的能夠進行可變比特率編碼的ACELP語音編碼器的方框圖。
圖4給出修正后的能夠進行可變比特率解碼的ACELP語音解碼器的方框圖。
上面已經(jīng)參考圖1和2簡要描述了類似于為GSM2推薦的ACELP語音編解碼器。圖3說明了適于對數(shù)字化采樣語音信號進行變比特率編碼的經(jīng)修正的ACELP語音編碼器，其中的功能塊已經(jīng)參考圖1描述了，這些功能塊被標以類似的參考標號。
在圖3的編碼器中，圖1的單個代數(shù)碼書3被一對代數(shù)碼書13，14代替。第一碼書13被用于基于包含兩個脈沖的碼矢量d(i)來產(chǎn)生激勵矢量c(i)，而第二碼書14被用于基于包含10個脈沖的碼書矢量d(i)來產(chǎn)生激勵矢量c(i)。對于給定的子幀，碼書選擇單元5根據(jù)LTP2給出的加權殘留信號s~]]>中的能量選出碼書13，14。如果加權殘留信號中的能量超過了某個預定的(或自適應的)閾值--表明變化很大的加權殘留信號，那麼10個脈沖碼書14被選出。另一方面，如果加權殘留信號中的能量低于定義的閾值，那麼2脈沖碼書13被選出。在使用3個或多個碼書的情況中，建議定義兩個或多個閾值。為了更詳細地描述適當?shù)拇a書選擇過程，應該參考文獻“Toll Quality Variable-Rate SpeechCodec”；Ojala P；Proc．Of IEEE International Conference onAcoustics，Speech and Signal Processing，Munich，Germany，Apr．21-24 1997。
用于縮放單元4的增益gc的推導是如上面參考等式(1)描述的那樣實現(xiàn)的。然而，在獲得預測增益的過程中，通過如下所示對激勵矢量施加一個幅度縮放因子k，等式(7)被修正(在修正處理單元16中)為下式Ec=10log(1NΣi=0N-1(kc(i))2)......(9)]]>在選擇10個脈沖碼書的情況下，k=1，在選擇2個脈沖碼書的情況下，更通用的表達是，縮放因子由下式給出k=10m......(10)]]>其中m是對應碼書矢量d(i)中的脈沖數(shù)。
對于給定子幀在計算除去均值后的激勵能量E(n)的過程中，為了能夠以等式(4)預測能量，還需要引入縮放因子k。這樣等式(3)被修正為E(n)=10log(1Ngc2Σi=0N-1(kc(i))2)-E_]]>然后通過等式(6)、等式(9)給出的修正后的激勵矢量能量和等式(11)給出的修正后的除去均值的激勵能量來計算預測增益。
將縮放因子k引入等式(9)和(11)明顯改善了增益預測使得一般來說當與以前技術相比增益校正因子的范圍縮小時，可以使用較小的增益校正因子碼書，使用較短長度的碼書索引νγ，例如3或4比特。
圖4說明了適于對圖3的ACELP編碼器編碼的語音信號解碼的解碼器，其中在圖3中語音子幀以變比特率被編碼。圖4中解碼器的大部分功能與圖3的解碼器相同，并且這些功能塊已經(jīng)參考圖2描述了，并且這些功能塊在圖2和圖4中被標以相同的參考標號。主要的差別在于兩個代數(shù)碼書20，21的給出，它們對應于圖3編碼器中的2脈沖碼書和10脈沖碼書。所接收代數(shù)碼u的本質(zhì)確定了適當碼書20，21的選擇，此后解碼過程以前面描述的同樣方式進行。然而，如編碼器那樣，在塊22中利用等式(6)、等式(9)給出的縮放后的激勵矢量能量Ec和等式(11)給出的縮放后的除去均值的激勵能量E(n)來計算預測增益技術人員將會理解在不偏離本發(fā)明范圍的情況下可以對上面描述的實施方案進行各種修改。特別是，圖3和4中的編碼器和解碼器可以用軟件或硬件實現(xiàn)，也可以軟硬結合來實現(xiàn)。盡管上面的描述集中于GSM蜂窩電話系統(tǒng)，本發(fā)明也能夠很好地應用于其它的蜂窩無線電系統(tǒng)以及非無線電通訊系統(tǒng)如互聯(lián)網(wǎng)。本發(fā)明還可以應用于數(shù)據(jù)存儲中對語音數(shù)據(jù)的編碼和解碼過程。
本發(fā)明可以應用于CELP編碼器，以及ACELP編碼器。然而，因為CELP編碼器有一個固定碼書用于產(chǎn)生量化矢量d(i)，并且給定量化矢量中脈沖的幅度可以變化，用于縮放激勵矢量c(i)幅度的縮放因子k并不是(如等式(10)那樣)脈沖數(shù)m的簡單函數(shù)。而且，每個固定碼書的每個量化矢量d(i)的能量必須被計算出來并且該能量相對于例如最大量化矢量能量的比例要確定。該比例的平方根給出縮放因子k。
權利要求
1．一種編碼語音信號的方法，其中的信號包括含有數(shù)字化語音樣本的子幀序列，對于每個子幀，該方法包括(a)選出一個包括至少一個脈沖的量化矢量d(i)，其中矢量d(i)中的脈沖數(shù)m和脈沖位置可能在子幀之間變化；(b)確定增益值gc用于縮放量化矢量d(i)的幅度或用于縮放從量化矢量d(i)得到的另一個矢量c(i)的幅度，其中縮放后的矢量與加權后的殘留信號s~]]>同步；(c)確定縮放因子k，該因子為預定能量值與量化矢量d(i)中能量之比的函數(shù)；(d)在一個或多個以前處理過的子幀基礎上確定預測的增益值該增益值為量化矢量d(i)的能量Ec的函數(shù)或當另一個矢量c(i)的幅度由所述的縮放因子k縮放時該矢量c(i)的能量Ec的函數(shù)；(e)利用所述的增益值gc和所述的預測增益值確定量化的增益校正因子
2．根據(jù)權利要求1的方法，該方法是變比特率編碼方法，該方法包括通過從語音信號子幀中基本上除去長時和短時冗余而產(chǎn)生所述的加權殘留信號s;~]]>根據(jù)包含于加權殘留信號s~]]>中的能量將語音信號子幀分類，并利用該分類確定量化矢量d(i)中的脈沖數(shù)m。
3．根據(jù)權利要求1或2的方法，包括為每個子幀產(chǎn)生一組線性預測編碼(LPC)系數(shù)a和為每個數(shù)據(jù)幀產(chǎn)生一組長時預測(LTP)參數(shù)b，其中的數(shù)據(jù)幀包括多個語音子幀；在LPC系數(shù)，LTP參數(shù)，量化矢量d(i)以及量化增益校正因子的基礎上產(chǎn)生編碼語音信號。
4．根據(jù)前面任何一個權利要求的方法，包括通過代數(shù)碼u在編碼信號中定義量化矢量d(i)。
5．根據(jù)前面任何一個權利要求的方法，其中預測增益值是根據(jù)下面等式確定的其中E是常數(shù)，是在所述以前處理過的子幀基礎上確定的當前子幀中能量的預測值。
6．根據(jù)前面任何一個權利要求的方法，其中所述預測增益值量化矢量d(i)的除去均值后的能量E(n)的函數(shù)，或者當每個以前處理的子幀的所述另一個矢量c(i)的幅度被所述縮放因子k縮放時，為該矢量c(i)的能量Ec的函數(shù)。
7．根據(jù)前面任何一個權利要求的方法，其中增益值gc被用于對所述另一個矢量c(i)進行縮放，該另一個矢量是通過對量化矢量d(i)濾波得到的。
8．根據(jù)權利要求5的方法，其中所述預測增益值是量化矢量d(i)的除去均值后的激勵能量E(n)的函數(shù)，或者當每個以前處理過的子幀的所述另一個矢量c(i)的幅度被所述縮放因子k縮放時，為該矢量c(i)的能量Ec的函數(shù)；增益值gc被用于對所述另一個矢量c(i)進行縮放，該另一個矢量是通過對量化矢量d(i)濾波得到的；預測能量是利用下面等式得到的其中bi是移動平均預測系數(shù)，P是預測階數(shù)，是以前子幀j中預測能量中的誤差，由下式給出其中
9．根據(jù)權利要求5的方法，其中項Ec由下面等式確定Ec=10log(1NΣi=0N-1(kc(i))2)]]>其中N是子幀中的樣本數(shù)。
10．根據(jù)前面任何一個權利要求的方法，其中，如果量化矢量d(i)包括兩個或多個脈沖，則所有脈沖具有相同的幅度。
11．根據(jù)前面任何一個權利要求的方法，其中縮放因子由下式給出k=Mm]]>其中M是量化矢量d(i)中最大允許的脈沖數(shù)。
12．根據(jù)前面任何一個權利要求的方法，該方法包括搜索一個增益校正因子碼書來確定量化增益校正因子該因子使誤差最小化并對所識別出的量化增益校正因子進行碼書索引編碼。
13．對數(shù)字化采樣語音信號子幀序列解碼的方法，對于每個子幀，該方法包括(a)從編碼信號恢復包括至少一個脈沖的量化矢量d(i)，其中矢量d(i)中的脈沖數(shù)m和脈沖位置可能在子幀之間變化；(b)從編碼信號恢復量化增益校正因子 (c)確定縮放因子k，該因子為預定能量值與量化矢量d(i)中能量之比的函數(shù)；(d)在一個或多個以前處理過的子幀基礎上確定預測的增益值該增益值是量化矢量d(i)的能量Ec的函數(shù)或當?shù)米栽摿炕噶康牧硪粋€矢量c(i)的幅度由所述的縮放因子k縮放時，該矢量c(i)的能量Ec的函數(shù)。(e)利用量化增益校正因子來校正預測增益值以給出校正后的增益值gc。(f)利用增益值gc對量化矢量d(i)或所述另一個矢量c(i)進行縮放以產(chǎn)生與殘留信號s~]]>同步的激勵矢量，其中的殘留信號s~]]>在從原始子幀語音信號中除去冗余信息之后仍然保留在該子幀中。
14．根據(jù)權利要求13的方法，其中每個所接收信號的編碼子幀包括一個定義量化矢量d(i)的代數(shù)碼μ和對獲得量化增益校正因子的量化增益校正因子碼書編址的索引。
15．用于編碼語音信號的裝置，其中的信號包括含有數(shù)字化語音樣本的子幀序列，該裝置具有依次對所述每個子幀編碼的裝置，這些裝置包括用于選出包括至少一個脈沖的量化矢量d(i)的矢量選擇裝置，其中矢量d(i)中脈沖數(shù)m和脈沖位置可能在子幀之間變化；用于確定增益值gc的第一信號處理裝置，該增益值用于縮放量化矢量d(i)的幅度或從量化矢量d(i)得到的另一個矢量c(i)的幅度，其中縮放后的矢量與加權后的殘留信號s~]]>同步；用于確定縮放因子k的第二信號處理裝置，其中k為預定能量值與量化矢量d(i)中能量之比的函數(shù)；在一個或多個以前處理過的子幀基礎上確定預測增益值的第三信號處理裝置，該增益值為量化矢量d(i)的能量Ec的函數(shù)或當另一個矢量c(i)的幅度由所述的縮放因子k縮放時，為該矢量c(i))的能量Ec的函數(shù)。用于利用所述的增益值gc和所述的預測增益值確定量化增益校正因子的第四信號處理裝置。
16．用于對數(shù)字化采樣語音信號的編碼子幀序列進行解碼的裝置，該裝置具有用于對每個所述子幀依次解碼的裝置，所說依次解碼裝置包括從編碼信號恢復包括至少一個脈沖的量化矢量d(i)的第一信號處理裝置，其中矢量d(i)中脈沖數(shù)m和脈沖位置可能在子幀之間變化；從編碼信號恢復量化增益校正因子的第二信號處理裝置。確定縮放因子k的第三信號處理裝置，該因子為預定能量值與量化矢量d(i)中能量之比的函數(shù)；在一個或多個以前處理過的子幀基礎上確定預測增益值的第四信號處理裝置，該增益值為量化矢量d(i)的能量Ec的函數(shù)或當另一個得自該量化矢量的矢量c(i)的幅度由所述的縮放因子k縮放時，為矢量c(i))的能量Ec的函數(shù)。利用量化增益校正因子來校正預測增益值以給出校正后的增益值gc的校正裝置；利用增益值gc對量化矢量d(i)或所述另一個矢量c(i)進行縮放以產(chǎn)生與殘留信號s~]]>同步的激勵矢量的縮放裝置，其中的殘留信號s~]]>在從原始子幀語音信號中除去冗余信息之后仍然保留在該子幀中。
全文摘要
可變比特率語音編碼方法為每個子幀確定一個量化矢量d(i),該矢量包括數(shù)量可變的脈沖。用于激勵LTP和LPC合成濾波器的激勵矢量c(i)是通過對量化矢量d(i)進行濾波得到的,增益值g
文檔編號G10L19/002GK1292914SQ99803763
公開日2001年4月25日申請日期1999年2月12日優(yōu)先權日1998年3月9日
發(fā)明者P·奧亞拉申請人:諾基亞移動電話有限公司

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：P.奧亞拉
技術所有人：諾基亞移動電話有限公司
我是此專利的發(fā)明人

上一篇：基于語言模型的信息檢索和語音識別的制作方法
上一篇：包括軟自適應特性的語音編碼的制作方法

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

語音編碼芯片相關技術

語音編碼技術相關技術

amr語音編碼相關技術

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語音編碼的制作方法