專利名稱:語音編碼的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種語音編碼的方法和裝置,其中輸入的語音信號被劃分為基本的塊以及編碼所得到的數(shù)據(jù)塊作為單位。
迄今已經(jīng)知道了各種編碼音頻信號(包括語音和聲信號)的編碼方法,以便利用在時(shí)間域和頻率域中的信號的統(tǒng)計(jì)特性以及人耳的音質(zhì)特性壓縮編碼的音頻信號。該編碼的方法粗略分類為時(shí)間域編碼,頻率域編碼和分析/合成編碼。語音信號的高效編碼的例子包括諸如諧波編碼,多頻帶激勵(lì)(MBE)編碼,分頻段編碼(SBC),線性預(yù)測編碼(LPC),離散余弦變換(DCT),改進(jìn)DCT(MDCT)和快速付里葉變換(FFT)的正弦分析編碼。語音信號的高效編碼的其他例子包括由最佳矢量閉環(huán)搜索使用分析方法的合成所作的代碼激勵(lì)的線性預(yù)測(CELP)編碼。
在例如語音信號的高效編碼例子的代碼激勵(lì)線性預(yù)測中,編碼的質(zhì)量受到編碼的語音信號特性的明顯的影響。例如,有各種不同結(jié)構(gòu)的語音,以致對包括與一些諸如發(fā)音為英語的發(fā)音Sa,Shi,Su,Se和So或者具有諸如英語的發(fā)音Pa,Pi,Pu,Pe和Po的具有爆破發(fā)音的輔音的接近噪聲的輔音的所有語言進(jìn)行編碼很難得到滿意的結(jié)果。
因此,本發(fā)明的目的在于提供一種語音編碼的方法和裝置,使用它們可以對各種不同結(jié)構(gòu)的語音滿意地編碼。
本發(fā)明的語音編碼的方法和裝置是對在時(shí)間軸上劃分輸入的語音信號成為單位的塊進(jìn)行編碼,時(shí)間域的波形的矢量量化是由最佳矢量的閉環(huán)搜索使用分析方法得到的合成進(jìn)行的,其中用多個(gè)閾值對高斯噪聲(Gaussiannoise)矢量進(jìn)行限幅,獲得矢量量化的代碼本。
也就是根據(jù)本發(fā)明,用多個(gè)不同的閾值對高斯噪聲矢量限幅得到的代碼矢量執(zhí)行矢量量化以處理各種語音結(jié)構(gòu)。
圖1是根據(jù)本發(fā)明的語音信號編碼方法以及完成該編碼方法的語音信號編碼裝置(編碼器)的基本結(jié)構(gòu)的方框圖;圖2是語音信號解碼裝置(解碼器)的基本結(jié)構(gòu)的方框圖,該解碼器是對圖1所示的編碼的信號進(jìn)行解碼的裝置;
圖3是圖1所示的語音信號編碼器的更具體結(jié)構(gòu)的方框圖;圖4是圖2所示的語音解碼器的更詳盡結(jié)構(gòu)的方框圖;圖5是LPC量化器的具體基本結(jié)構(gòu)的方框圖;圖6是LPC量化器的更詳細(xì)的結(jié)構(gòu)的方框圖;圖7是矢量量化器的基本結(jié)構(gòu)的方框圖;圖8是矢量量化器的更詳細(xì)結(jié)構(gòu)的方框圖;圖9是本發(fā)明的語音信號編碼器的(ELP)編碼部分(第二編碼單元)的詳細(xì)結(jié)構(gòu)的方框電路圖;圖10是圖9所示方案中的處理流程的流程圖;圖11A和圖11B是用不同的閾值限幅后的高斯噪聲的波形圖;圖12是在用學(xué)習(xí)方法產(chǎn)生形狀代碼簿的時(shí)間的處理流程的流程圖;圖13是使用本發(fā)明語音信號編碼器的便攜終端的傳輸端結(jié)構(gòu)的方框圖;圖14是使用對應(yīng)圖13的相應(yīng)裝置的語音信號解碼器的便攜終端的接收端的結(jié)構(gòu)的方框圖;圖15是在本發(fā)明的語音信號解碼器中不同比特率的輸出數(shù)據(jù)的表格。
結(jié)合附圖將詳細(xì)解釋本發(fā)明的優(yōu)選實(shí)施例。
在圖1中示出了完成本發(fā)明的語音編碼方法的語音信號編碼器的基本結(jié)構(gòu)的方框圖。該語音信號編碼器包括作為尋找語音輸入信號的短期預(yù)測殘余的裝置的反向LPC濾波器11和從短期預(yù)測殘余中尋找正弦分析編碼參量的正弦分析編碼器裝置114。該語音信號編碼器還包括矢量量化單元116和第二編碼單元120。單元116是作為在正弦分析編碼參數(shù)上執(zhí)行感覺性加權(quán)矢量量化的裝置,單元120是作為用相位傳輸波形編碼編碼輸入的語音信號的裝置。
圖2是語音信號解碼裝置(解碼器)的基本結(jié)構(gòu)的方框圖,該解碼器對應(yīng)圖1中所示的編碼裝置的對應(yīng)裝置,圖3是圖1中所示語音信號編碼器的更具體的方框圖,圖4是圖2中所示的語音解碼器的更詳盡的方框圖。
現(xiàn)在解釋圖1至圖4的方框圖的結(jié)構(gòu)。
圖1中的語音信號編碼器的基本結(jié)構(gòu)在于,該編碼器具有尋找諸如線性預(yù)測編碼(LPC)殘余的執(zhí)行,諸如諧波編碼的正弦分析編碼的輸入語音信號的第一編碼單元110,和用呈現(xiàn)相位再現(xiàn)性的波形編碼編碼輸入語音信號的第二編碼單元120,以及第一編碼單元110和第二編碼單元120用以分別地對輸入的信號的濁音部分和清音部分進(jìn)行編碼。
第一編碼單元110具有用諧波編碼或多波段編碼(MBE)的正弦分析編碼的編碼LPC殘余的結(jié)構(gòu)。第二編碼單元120具有使用合成方法的分析使用最佳矢量的閉環(huán)搜索的矢量量化進(jìn)行代碼激勵(lì)線性預(yù)測(CELP)的結(jié)構(gòu)。
在該實(shí)施例中,供給輸入端101的語音信號發(fā)送給第一編碼單元110的反向LPC濾波器111和LPC分析/量化單元113。從LPC分析/量化單元113得到的LPC系數(shù)或所謂的α-參數(shù)傳送給反向LPC濾波器111,以便由反向LPC濾波器111取出輸入語音依賴的線性預(yù)測殘余(LPC殘余)。正象以后解釋的那樣,線性頻譜對(LSP)的量化輸出,從LPC分析/量化單元113取出和發(fā)送給輸出端102。來自反向LPC濾波器111的LPC的殘余發(fā)送給正弦分析編碼單元114。正弦分析編碼單元114執(zhí)行音調(diào)(pitch)檢測,頻譜包絡(luò)幅度計(jì)算和由濁音的(V)/清音的(UV)識別單元115所作的V/UV識別。來自正弦分析編碼單元114的頻譜包絡(luò)幅度數(shù)據(jù)發(fā)送給矢量量化單元116。來自矢量量化單元116的作為頻譜包絡(luò)的矢量量化輸出的代碼簿的下標(biāo)(index)通過開關(guān)117發(fā)送給輸出終端103,同時(shí)正弦分析編碼單元114的輸出通過開關(guān)118發(fā)送給輸出終端104。來自V/UV識別單元115的V/UV識別輸出發(fā)送給輸出終端105以及作為開關(guān)控制信號傳送給開關(guān)117和118。濁音信號,下標(biāo)和音調(diào)被選擇,以便在輸出端103和104處取出。
在本實(shí)施例中,圖1的第2編碼單元120具有代碼激勵(lì)線性預(yù)測(CELP)編碼結(jié)構(gòu),以及通過合成方法的分析使用,閉環(huán)搜索執(zhí)行時(shí)間域波形的矢量量化。在合成方法中,噪聲代碼簿121的輸出由加權(quán)合成濾波器122合成,該合成加權(quán)語音傳送給減法器123,在這里加權(quán)語音和加到輸入端101的語音信號經(jīng)過了感覺性加權(quán)濾波器125后的信號間的誤差被取出和傳送給距離計(jì)算電路124,以便執(zhí)行距離計(jì)算,而且最小化誤差的矢量由噪聲代碼簿121檢索到。如前面所述,這個(gè)CELP編碼用于編碼清音的部分。來自噪聲代碼簿121的作為UV數(shù)據(jù)的代碼簿下標(biāo)通過開關(guān)127在輸出端107處取出,當(dāng)來自V/UV識別單元115的V/UV識別結(jié)果指示為清音的聲音(UV)時(shí),開關(guān)127接通。
圖2是圖1的語音信號編碼器的相對應(yīng)的語音信號解碼器的基本結(jié)構(gòu)的方框圖,它用以根據(jù)本發(fā)明完成語音解碼方法。
參照圖2,作為來自圖1的輸出端102的線性頻譜對(LSP)的量化輸出的代碼簿的下標(biāo)供給輸入端202。作為下標(biāo)數(shù)據(jù),音調(diào)和作為包絡(luò)量化輸出的V/UV識別輸出,輸出端103,104和105的輸出分別送到輸入端203至205。作為清音數(shù)據(jù)的下標(biāo)數(shù)據(jù)從圖1的輸出端107加給輸入端207。
作為輸入端203的量化輸出的下標(biāo)傳送給反向矢量量化單元212,以便反向矢量量化,從而得到傳送給濁音的語音合成器211的LPC殘余的頻譜包絡(luò)。濁音的語音合成器211用正弦合成濁音的語音部分的線性預(yù)測編碼(LPC)殘余。濁音的語音合成器211還從輸入端204和205饋送音調(diào)和V/UV識別輸出。來自濁音的語言合成單元211的濁音語言的LPC的殘余傳送給LPC合成濾波器214。來自輸入端207的UV數(shù)據(jù)的下標(biāo)數(shù)據(jù)傳送給清音的合成單元220,在這里噪聲代碼簿必須被查閱以取出清音部分的LPC的殘余。在LPC合成濾波器214中,濁音部分的LPC的殘余和清音部分的LPC的殘余由LPC合成來處理。另外,濁音部分的LPC的殘余和清音部分的LPC的殘余和可以由LPC合成來處理。來自輸入端202的LSP下標(biāo)數(shù)據(jù)傳送給LPC參量再現(xiàn)單元213,在這里L(fēng)PC的α-參量被取出和傳送給LPC合成濾波器214。該由LPC合成濾波器214合成的語音信號在輸出端201處取出。參照圖3,對圖1所示的語音信號編碼器的更詳細(xì)的結(jié)構(gòu)現(xiàn)在將解釋,類似于圖1所示的部分或元件用相同的標(biāo)號數(shù)字表示。
在圖3所示的語音信號編碼器中,提供給輸入端101的語音信號由高通濾波器109濾波,以除去不需要波段的信號,以及從這里加到LPC分析/量化單元113的LPC分析電路132和反向LPC濾波器111。LPC分析/量化單元113的LPC分析電路132應(yīng)用漢明窗口,用大約256個(gè)取樣的樣品的輸入信號波形的長度作為(數(shù)據(jù))塊,和用自校正方法尋找線性預(yù)測系數(shù),該系數(shù)就是所謂的α-參數(shù),這個(gè)作為數(shù)據(jù)輸出單元的成幀間隙近似地設(shè)定160個(gè)樣品值。如果例如取樣頻率是8KHz,160個(gè)樣品值的一幀間隙是20毫秒(ms)。
來自LPC分析電路132的α-參量傳送給α-LSP轉(zhuǎn)換電路133,以便轉(zhuǎn)換成行頻譜對(LSP)參量。作為由直接式的濾波系數(shù)所建立的,這就轉(zhuǎn)變α-參量成為例如10,也就是5對LSP參量。這個(gè)轉(zhuǎn)換例子可以通過Newton-Rhapson方法完成的。α-參量轉(zhuǎn)換成LSP參量的原因在于內(nèi)插特性優(yōu)于α-參量。
來自α-LSP轉(zhuǎn)換電路133的LSP參量被矩陣化或由LSP量化器134作矢量量化。這就有可能在矢量量化前取得幀與幀的差別,或者為了執(zhí)行矩陣量化收集多個(gè)幀。在目前的事例中,LSP參量的兩幀(20msec)(每個(gè)計(jì)作20msec)被收集和用矩陣量化和矢量量化所處理。
作為LSP量化的下標(biāo)數(shù)據(jù)的量化器134的量化輸出在終端102處取出,同時(shí)量化的LSP矢量傳送給LSP內(nèi)插電路136。
為了提供8-倍的速率,LSP內(nèi)插電路136內(nèi)插LSP矢量,也就是每20毫秒或40毫秒量化一次的矢量。也就是,LSP矢量每2.5毫秒更新一次。該原因在于,如果殘余波形用諧波編碼/解碼方法的分析/合成處理的話,則合成波形的包絡(luò)表現(xiàn)出極緩和的波形,以致如果LPC系數(shù)每20毫秒突然急劇變化,很可能產(chǎn)生不相干的噪聲。也就是,如果每2.5毫秒逐漸地變化LPC的系數(shù),可以防止出現(xiàn)不相干的噪聲。
使用每2.5毫秒產(chǎn)生的內(nèi)插的LSP矢量反向?yàn)V波輸入的語音,LSP參量由LSP-α轉(zhuǎn)換電路137轉(zhuǎn)換或α-參量作為例如10階直接濾波器的系數(shù)。LSP-α轉(zhuǎn)換電路137的輸出傳送給LPC反向?yàn)V波器電路111,由電路111執(zhí)行反向?yàn)V波,以便使用每2.5毫秒更新的α-參量產(chǎn)生緩和的輸出。反向LPC濾波器111的輸出傳送給例如是諧波編碼電路的正弦分析編碼單元114的例如是DCT電路的正交變換電路145。
將來自LPC分析/量化單元113的LPC分析電路132的α-參量送往感覺性加權(quán)濾波計(jì)算電路139,以求出感覺性加權(quán)數(shù)據(jù)。將這些加權(quán)數(shù)據(jù)送往感覺性加權(quán)矢量量化器116、第二編碼單元120的感覺性加權(quán)濾波器125和感覺性加權(quán)合成濾波器122。
諧波編碼電路的正弦分析編碼單元114用諧波編碼的方法分析反向LPC濾波器111的輸出。這也就是,完成音調(diào)的檢測,分別的諧波的幅度Am的計(jì)算和濁音的(V)/清音的(UV)識別,以及隨音調(diào)變化的幅度Am的數(shù)或分別的諧波的包絡(luò)由維的變換而做成輔音。
在圖3所示正弦分析編碼單元114的舉例說明的例子中,使用通常的諧波編碼。特別在多波段激勵(lì)(MBE)編碼中,在摸擬中采用濁音部分和清音部分出現(xiàn)在頻率區(qū)域或在相同時(shí)間點(diǎn)的頻段上(在相同的塊或幀中)。在其他的諧波編碼技術(shù)中,不論在一個(gè)塊中或一幀中的語音是濁音的或清音的只有唯一的判斷。在隨后的說明當(dāng)中,如果波段的總體是UV,就MBE編碼而言,給定點(diǎn)的幀判定為UV。
開環(huán)音調(diào)搜索單元141和圖3中的正弦分析編碼單元114的過零計(jì)數(shù)器142被分別地饋給來自輸入端101的輸入語音信號和來自高通濾波器(HPF)109的信號。來自反向LPC濾波器111的LPC殘余或線性預(yù)測殘余供給正弦分析編碼單元114的正交變換電路145。開環(huán)音調(diào)搜索單元141取得輸入信號的LPC殘余,以通過開環(huán)執(zhí)行比較粗略的音調(diào)搜索。正如后面要解釋的,由閉環(huán)將抽取的粗略的音調(diào)數(shù)據(jù)傳送給精細(xì)音調(diào)搜索單元146。從開環(huán)音調(diào)搜索單元141,由規(guī)格化與粗略音調(diào)數(shù)據(jù)一道的LPC殘余的自相關(guān)的最大值得到的規(guī)格化的自相關(guān)r(P)的最大值和粗略音調(diào)數(shù)據(jù)一道取出,以便傳送給V/UV識別單元115。
正交變換電路145執(zhí)行諸如離散付里葉變換(DFT)的正交變換,以便轉(zhuǎn)換在時(shí)間軸上的LPC殘余成為在頻率軸上的頻譜幅度數(shù)據(jù)。正交變換電路145的輸出傳送給精細(xì)音調(diào)搜索單元146和頻譜估值單元148,以便估算頻譜幅度或包絡(luò)。
精細(xì)音調(diào)搜索單元146被饋以由開環(huán)音調(diào)搜索單元141抽取的比較粗略的音調(diào)數(shù)據(jù)和由正交變換單元145DFT得到的頻率域數(shù)據(jù)。為了最終達(dá)到具有最佳函數(shù)點(diǎn)(浮點(diǎn))的精細(xì)音調(diào)數(shù)據(jù)的值,在粗略的音調(diào)值數(shù)據(jù)的中心附近,以0.2至0.5的速率,精細(xì)音調(diào)搜索單元146變動音調(diào)數(shù)據(jù)以±幾個(gè)取樣。合成方法的分析用于精細(xì)搜索技術(shù),以選擇音調(diào),以致功率頻譜將取得最接近原始聲音的功率頻譜。來自閉環(huán)精細(xì)音調(diào)搜索單元146的音調(diào)數(shù)據(jù)通過開關(guān)118傳送給輸出端104。
在頻譜估算單元148中,每個(gè)諧波的幅度和作為諧波的和的頻譜包絡(luò),根據(jù)頻譜幅度和作為LPC殘余的正交變換輸出被估算,以及傳送給精細(xì)音調(diào)搜索單元146,V/UV識別單元115和感覺性加權(quán)矢適量量化單元116。
V/UV識別單元115根據(jù)正交變換電路145的輸出是,來自精細(xì)音調(diào)搜索單元146的最佳音調(diào),來自頻譜估算單元148的頻譜幅度數(shù)據(jù),來自開環(huán)音調(diào)搜索單元141的規(guī)格化自相關(guān)r(P)的最大值和來自過零計(jì)數(shù)器142的過零計(jì)算值識別幀的V/UV。此外,MBE的基帶V/UV識別的邊界位置還可以用作V/UV識別的條件。在輸出端105取出V/UV識別單元115的識別輸出。
頻譜估算單元148的輸出單元或矢量量化單元116的輸入單元配備給數(shù)據(jù)數(shù)轉(zhuǎn)換單元(執(zhí)行取樣率種類的轉(zhuǎn)換的單元)。數(shù)據(jù)數(shù)轉(zhuǎn)換單元用于設(shè)定包絡(luò)的幅度數(shù)據(jù)1Aml,它是考慮這樣的實(shí)際,在頻率軸上頻帶被分成的數(shù)和數(shù)據(jù)的數(shù)不同于音調(diào)。這就是,如果有效頻帶高達(dá)3400KHZ,依賴音調(diào)有效頻帶能分成8至63個(gè)頻帶。從頻帶到頻帶獲得的幅度數(shù)據(jù)1Aml的mMX+1的數(shù)在從8至63的范圍內(nèi)變動。因此,數(shù)據(jù)數(shù)轉(zhuǎn)換單元用于轉(zhuǎn)變可變動mMx+1的幅度數(shù)為例如是44數(shù)據(jù)的數(shù)據(jù)的預(yù)定的數(shù)M。
來自數(shù)據(jù)數(shù)轉(zhuǎn)換單元,提供在頻譜估算單元148的輸出單元上或者矢量量化單元116的輸入單元上的幅度數(shù)據(jù)或預(yù)置數(shù)M的包絡(luò)數(shù)據(jù),由矢量量化單元116,用執(zhí)行加權(quán)矢量量化的方法按照諸如44數(shù)據(jù)的數(shù)據(jù)預(yù)置數(shù)目集合起來作為單位。這個(gè)加權(quán)是由感覺性加權(quán)濾波器估算電路139的輸出提供的。來自矢量量化器116的包絡(luò)的下標(biāo)通過開關(guān)117在輸出端103處取出。在加權(quán)矢量量化前,最好使用由預(yù)置數(shù)目的數(shù)據(jù)組成的矢量的適合的泄漏系數(shù)取得幀間差。
現(xiàn)在解釋第二個(gè)編碼單元120。第二個(gè)編碼單元120具有所謂的CELP編碼的結(jié)構(gòu),并且特別用于輸入的語音信號的清音部分的編碼。在輸入語音信號的清音部分的CELP編碼結(jié)構(gòu)中,對應(yīng)作為表示噪聲代碼簿的輸出值的清音的LPC的殘余的噪聲輸出,或者所謂的隨機(jī)代碼簿121通過增益控制電路126傳送給感覺性加權(quán)合成濾波器122。該加權(quán)合成濾波器122LPC合成輸入的噪聲和傳送產(chǎn)生的加權(quán)的清音的信號給減法器123。來自輸入端101的信號,經(jīng)過高通濾波器(HPF)109和由感性加權(quán)濾波器125感覺性加權(quán)后饋給減法器123。該差或該信號與來自合成濾波器122之間的誤差被取出。同時(shí),感覺性加權(quán)會成濾波器的零輸入響應(yīng)預(yù)先從感覺性加權(quán)濾波器125的輸出中減去。這個(gè)誤差饋送給計(jì)算距離的距離計(jì)算電路124。在噪聲代碼簿中表示最小化誤差的矢量值被搜索。以上是依次使用合成方法的分析用閉環(huán)搜索時(shí)間域波形的矢量量化的概括。
作為來自使用CELP編碼結(jié)構(gòu)的第二編碼器120的清音(UV)部分的數(shù)據(jù),來自噪聲代碼簿121的代碼簿的形狀下標(biāo),以及來自增益電路126的代碼簿的增益下標(biāo)被取出。將來自噪聲代碼簿121的UV數(shù)據(jù)的形狀下標(biāo)和增益電路126的UV數(shù)據(jù)的增益下標(biāo)通過開關(guān)127g傳送給輸出端107g。
開關(guān)127s,127g和開關(guān)117,118的接通和關(guān)斷取決于來自V/UV識別單元115的V/UV決定的結(jié)果。具體地說,如果現(xiàn)時(shí)傳輸?shù)膸恼Z音信號的V/UV識別的結(jié)果表示是濁音的(V),則開關(guān)117,118接通,如果現(xiàn)時(shí)傳輸?shù)膸恼Z音信號是清音的(UV),則開關(guān)127S,127g接通。
圖4示出了圖2中所示語音信號解碼器的更詳盡的結(jié)構(gòu)。在圖4中,用相同的數(shù)字表示與圖2中所示的相對應(yīng)的部分。
在圖4中,對應(yīng)圖1和圖3的輸出端102的是代碼簿下標(biāo)的矢量量化輸出提供給輸入端202。
LSP下標(biāo)傳送給LPC參量再現(xiàn)單元213的LSP的反向矢量量化器231,以致被反向矢量量化成為線頻譜對(LSP)數(shù)據(jù),然后該數(shù)據(jù)供給用作內(nèi)插的內(nèi)插電路232,233。結(jié)果的內(nèi)插數(shù)據(jù)被LSP-α轉(zhuǎn)換電路234,235轉(zhuǎn)換成α參數(shù),該參數(shù)傳送給LPC合成濾波器。LSP內(nèi)插電路232和LSP-α轉(zhuǎn)換電路是為濁聲(V)聲音設(shè)計(jì)的,而LSP內(nèi)插電路233和LSP-α轉(zhuǎn)換電路是為清聲(UV)聲音設(shè)計(jì)的。LPC合成濾波器214將聲音語言部分的LPC合成濾波器236與清音的語言部分的LPC合成濾波器237分開。也就是,LPC系數(shù)內(nèi)插為濁音語言部分和清音語言部分獨(dú)立地完成,以禁止不這樣的話從濁音語言部分到清音語音部分的過渡部分產(chǎn)生壞的影響,反過來,用總的不同特性的LSP的內(nèi)插也是一樣。
將圖1和3的編碼器的輸出端103的對應(yīng)加權(quán)矢量量化的頻譜包絡(luò)Am的代碼下標(biāo)數(shù)據(jù)提供給圖4的輸入端203。來自圖1和圖3的端點(diǎn)104的音調(diào)數(shù)據(jù)加到輸入端204,來自圖1和圖3的端點(diǎn)105的V/UV識別數(shù)據(jù)加到輸入端205。
來自輸入端203的頻譜包絡(luò)的矢量量化下標(biāo)數(shù)據(jù)傳送給作反向矢量量化的反向矢量量化器212,在這里完成有關(guān)數(shù)據(jù)數(shù)轉(zhuǎn)換的反向轉(zhuǎn)換。最后的頻譜包絡(luò)數(shù)據(jù)傳送給正弦合成電路215。
如果在編碼期間,在頻譜的矢量量化前發(fā)現(xiàn)幀間差,在反向矢量量化以后幀間差被解碼,以便產(chǎn)生頻譜包絡(luò)數(shù)據(jù)。
來自輸入端204的音調(diào)和來自輸入端205的V/UV識別數(shù)據(jù)饋送給正弦合成電路215。對應(yīng)圖1和圖3中所示的LPC反向?yàn)V波器111的輸出的LPC殘余數(shù)據(jù)從正弦合成電路215取出并使送到加法器218。
反向矢量量化器212的包絡(luò)數(shù)據(jù)和來自輸入端204,205的音調(diào)的V/UV識別數(shù)據(jù)傳送給噪聲合成電路216,以便濁音部分(V)的噪聲相加。噪聲合成電路216的輸出通過加權(quán)迭加電路217傳送給加法器218。具體地講,在考慮到這樣實(shí)際的噪聲加到LPC殘余信號的濁音部分,該實(shí)際是作為輸入到濁音的LPC合成濾波器的激勵(lì)由正弦波合成產(chǎn)生,在如男性語音的低音調(diào)中產(chǎn)生了沉悶的感覺,而且在濁音和清音間的聲音質(zhì)量的突變產(chǎn)生了不自然的聽覺感覺。這樣的噪聲考慮到與諸如濁語音部分的LPC合成濾波器有聯(lián)系的音調(diào),頻譜包絡(luò)的幅度,在一幀中的最大幅度或殘余信號電平的語音編碼數(shù)據(jù)有關(guān)的參數(shù),這就是激勵(lì)。
加法器218的加和輸出傳送給LPC合成濾波器的濁音的合成濾波器236,在這里完成LPC合成,以形成時(shí)間波形數(shù)據(jù),然后該數(shù)據(jù)由濁語音的后濾波器238V濾波并傳送到加法器239。
作為來自圖3中的輸出端107s和107g的數(shù)據(jù)的波形下標(biāo)和增益下標(biāo)供給圖4的輸入端207s和207g,并且因此加給清語音的合成單元220。來自端點(diǎn)207s的波形下標(biāo)傳送給清語音合成單元220的噪聲代碼簿221。同時(shí),來自端點(diǎn)207g的增益下標(biāo)傳送給增益電路222。來自噪聲代碼簿221的讀取的代表值輸出是對應(yīng)清語音的LPC殘余的噪聲信號成分。這就變成了增益電路222中的預(yù)置增益幅度,并且傳送給窗口電路223,以致被開窗,以便光滑連接濁語音部分。
窗口電路223的輸出傳送給LPC合成濾波器214的清(UV)語音的合成濾波器237。傳送給合成濾波器237的數(shù)據(jù)用LPC合成來處理,以便變成清音部分的時(shí)間波形數(shù)據(jù)。在傳送給加法器239以前,由清音部分的后濾波器將清音部分的時(shí)間波形數(shù)據(jù)濾波。
在加法器239中,將來自濁語音238V的后濾波器的時(shí)間波形信號和來自清語音的后濾波器238u的清語音部分的時(shí)間波形數(shù)據(jù)彼此相加,并且在輸出端201處取出加和的結(jié)果數(shù)據(jù)。
前述的語音信號編碼器能輸出取決于所需求的聲音質(zhì)量的不同比特率的數(shù)據(jù)。也就是以可變化的比特率輸出數(shù)據(jù)。例如,如果低比特率是2Kb/秒,高比特率是6Kb/秒,則該輸出數(shù)據(jù)是具有圖15中所示比特率的比特率。
來自輸出端104的音調(diào)總是以8比特/20毫秒的比特率輸出濁語音,和從輸出端105總是以1比特/20毫秒的速率輸出V/UV識別輸出。從輸出端102輸出的LSP量化的下標(biāo)在32比特/40毫秒和48比特/40毫秒間轉(zhuǎn)換。另一方面,由輸出端103輸出的濁語音(V)期間的下標(biāo)在15比特/20毫秒和87比特/20毫秒間轉(zhuǎn)換。從輸出端107s和107g輸出的清音(UV)的下標(biāo)在11比特/10毫秒和23比特/5毫秒間轉(zhuǎn)換。濁音(V)的輸出數(shù)據(jù)是2Kbps(每秒千比特)的40比特/20毫秒,和6Kbps的120千比特/20毫秒。另一方面,濁音(V)的輸出數(shù)據(jù)是2Kbps的39比特/20毫秒和6Kbps的117千比特/20毫秒。
在涉及到下述有關(guān)方案時(shí),再解釋LSP量化的下標(biāo),濁語音(V)的下標(biāo)和清語音(UV)的下標(biāo)。
涉及圖5和圖6,現(xiàn)在詳細(xì)解釋LSP量化器134中的矩陣量化和矢量量化。
來自LPC分析電路132的α-參量傳送給轉(zhuǎn)換為LSP參量的α-LSP電路133。如果在LPC分析電路132中的執(zhí)行P階LPC分析,計(jì)算出Pα-參量。Pα-參量被轉(zhuǎn)換成保存在緩沖器610中的LSP參量。
緩沖器610輸出兩幀LSP參量。該兩幀LSP參量通過由第一矩陣量化器6201和第二矩陣量化器6202組成的矩陣量化器620進(jìn)行矩陣量化。該兩幀LSP參量在第一矩陣量化器6201中矩陣量化,其結(jié)果量化誤差進(jìn)一步在第二矩陣量化器6202中矩陣量化。該矩陣量化利用在時(shí)間軸和頻率軸二者上的相關(guān)。
來自矩陣量化器6202的兩幀量化誤差進(jìn)入由第一矢量量化器6401和第二矢量量化器6402組成的矢量量化器。第一矢量量化器6401是由兩個(gè)矢量量化部分650,660組成。然而,第二矢量量化器6402是由兩個(gè)矢量量化部分670,680組成。來自矩陣量化單元620的量化誤差由第一矢量量化器6401的矢量量化部分650,660在幀的基礎(chǔ)上被量化。結(jié)果的量化誤差矢量由第二矢量量化器6402的矢量量化部分670,680進(jìn)一步矢量量化。上述的矢量量化利用了沿頻率軸的相關(guān)。
如上所述執(zhí)行矩陣量化的矩陣量化單元620至少包括執(zhí)行第一矩陣量化步驟的第一矩陣量化器6201和執(zhí)行矩陣量化由第一矩陣量化產(chǎn)生的量化誤差的第二矩陣量化步驟的第二矩陣量化器6202。如上所述的執(zhí)行矢量量化的矢量量化單元640至少包括執(zhí)行第一矢量量化步驟的第一矢量量化器6401和執(zhí)行矩陣量化由第一矢量量化產(chǎn)生的量化誤差的第二矩陣量化步驟的第二矢量量化器6402。
現(xiàn)在將詳細(xì)解釋矩陣量化和矢量量化。
作為10×2矩陣的存儲在緩沖器600中的二幀LSP參量傳送給第一矩陣量化器6201。第一矩陣量化器6201通過LSP參量加法器621傳送二幀LSP參量到尋找最小值的加權(quán)距離的加權(quán)距離計(jì)算單元623。
在代碼簿搜索期間,由第一矩陣量化器6201所作的失真測量由方程(1)給出dMQ1(X1,X1′)=Σt=01Σi=1Pw(t,i)(x1(t,i)-x1′(t,i))2----(1)]]>其中,X1是LSP參量,X1’是量化值,t和i是p-維的數(shù)字。
在頻率軸和時(shí)間軸上不考慮加權(quán)限制的加權(quán)w(t,i)由方程(2)給出w(t,i)=1x(t,i+1)-x(t,i)+1x(t,i)-x(t,i-1)----(2)]]>其中,x(t,o)=0,x(t,p+1)=π,而不考慮t。
方程(2)的加權(quán)還用于下游端的矩陣量化和矢量量化。
將計(jì)算的加權(quán)距離傳送給矩陣量化的矩陣量化器MQ622。由這個(gè)矩陣量化輸出的8-比特下標(biāo)傳送給信號轉(zhuǎn)換器690。由矩陣量化的量化值在加法器621中從兩幀的LSP參量中減去。由加權(quán)距離計(jì)算單元623每兩幀地順序計(jì)算加權(quán)的距離,以致在矩陣量化單元622中完成矩陣量化。而且,使加權(quán)距離最小化的最化值被選擇。加法器621的輸出傳送給第二矩陣量化器6202的加法器631。
類似第一矩陣量化器6201,第二矩陣量化器6202執(zhí)行矩陣量化。加法器621的輸出通過加法器631送到加權(quán)距離計(jì)算單元633,在這里計(jì)算最小的加權(quán)距離。
由第二矩陣量化器6202在代碼簿搜索期間所作的失真測量由方程(3)給出。dMQ2(X2,X2′)=Σt=01Σi=1Pw(t,i)(x2(t,i)-x2′(t,i))2----(3)]]>其中,X2和X2’分別是來自第一矩陣量化器6201的量化誤差和量化值。
經(jīng)加權(quán)的距離傳送給矩量化的矩陣量化單元(MQ2)632。由矩陣量化輸出的8-比特的下標(biāo)在加法器631處從兩幀的量化誤差中減去。使用加法器631的輸出,加權(quán)距離計(jì)算單元633順序地計(jì)算加權(quán)距離。最小化加權(quán)距離的量化值被選擇。加法器631的輸出一幀一幀地傳送給第一矢量量器6401的加法器651,661。
第一矢量量化器6401一幀一幀地執(zhí)行矢量量化。加法器631的輸出通過計(jì)算最小值加權(quán)距離的加法器651,661一幀一幀地傳送給每個(gè)加權(quán)距離計(jì)算單元653,663。
量化誤差X2和量化誤差X2’間的差是(10×2)的矩陣。如果該差表示為X2-X2’=[X3-1,X3-2],由第一矢量量化器6401的矢量量化單元652,662在代碼簿搜索期間的失真測量dVQ1,dVQ2由方程(4)和(5)給出dVQ1(x3-1,x3-1′)=Σi=1Pw(O,i)(x3-1(O,i)-x3-1′(O,i))2----(4)]]>dVQ2(x3-2,x3-2′)=Σi=1Pw(1,i)(x3-2(1,i)-x3-2′(1,i))2----(5)]]>加權(quán)距離傳送給矢量量化的矢量量化單元VQ1652和矢量量化單元VQ2662。由矢量量化輸出的每8比特下標(biāo)傳送給信號轉(zhuǎn)換器690。量化值由加法器651,661從輸入的兩幀量化誤差矢量中減去。加權(quán)距離計(jì)算單元653,663使用加法器651,661的輸出順序地計(jì)算加權(quán)距離,以便選擇最小化加權(quán)距離的量化值。加法器651,661的輸出傳送給第二矢量量化器6402的加法器671,681。
在代碼簿搜索期間由第二矢量量化器6402的矢量量化器672,682作失真測量,X4-1=X3-1-X3-1′X4-2=X3-2-X3-2′由方程(6)和(7)給出dVQ3(x4-1,x4-1′)=Σi=1Pw(O,i)(x4-1(O,i)-x4-1′(O,i))2----(6)]]>dVQ4(x4-2,x′4-2)=Σi=1Pw(1,i)(x4-2(1,i)-x′4-2(1,i))2----(7)]]>這些加權(quán)距離傳送給矢量量化的矢量量化器(VQ3)672和矢量量化器(VQ4)682。來自矢量量化的8-比特輸出下標(biāo)數(shù)據(jù)由加法器671,681從兩幀的輸入量化誤差矢量中減去。加權(quán)的距離計(jì)算單元673,683使用加法器671,681的輸出順序地計(jì)算加權(quán)的距離,以便選擇最小化的加權(quán)距離的量化值。
在代碼簿查明期間,根據(jù)相應(yīng)的失真測量,由通用的勞埃德算法執(zhí)行該查明。
在代碼簿搜索期間和查明期間失真測量可以是不同的值。
來自矩陣量化單元622,632和矢量量化單元652,662,672和682和8-比特下標(biāo)數(shù)據(jù)由信號轉(zhuǎn)換器690轉(zhuǎn)換,并在輸出端691處輸出。
具體地講,對于低比特率,完成第一矩陣量化步驟的第一矩陣量化器6201,完成第二矩陣量化步驟的第二矩陣量化器6202和完成第一矢量量化步驟的第一矢量量化器6401的輸出被取出。相反,對于高比特率,低比特率的輸出加到完成第二矢量量化步驟的第二矢量量化器6402,而且該結(jié)果的和被取出。
這將分別輸出2Kbps和6Kbps的32比特/40毫秒的下標(biāo)和48比特/40毫秒的下標(biāo)。
矩陣量化單元620和矢量量化單元640在符合于表示LPC系數(shù)的參量特性的頻率軸和/或時(shí)間軸上執(zhí)行限定的加權(quán)。
首先解釋在符合LSP參數(shù)特性的頻率軸上的限定的加權(quán)。如果階數(shù)P=10,LSP參量X(i)分組為L1={X(i)|1≤i≤2}L2={X(i)|3≤i≤6}L3={X(i)|7≤i≤10}低、中、高三個(gè)范圍。如果分組L1,L2和L3的加權(quán)是1/4,1/2和1/4,僅在頻率軸上限定的加權(quán)由方程(8),(9)和(10)給出。w′(i)=w(i)Σj=12w(j)×14----(8)]]>w′(i)=w(i)Σj=36w(j)×12----(9)]]>w′(i)=w(i)Σj=710w(j)×14----(10)]]>分別的LSP參量的加權(quán)僅在每組中執(zhí)行,以及相應(yīng)的權(quán)重由每個(gè)組的加權(quán)所限定。
從時(shí)間軸方向看,對應(yīng)幀的總和必須是1,以致在時(shí)間軸方向上的限定是以幀為基礎(chǔ)的。在時(shí)間軸方向上的僅有的限定的權(quán)重由方程(11)給出w′(i,t)=w(i,t)Σj=110Σs=01w(j,s)----(11)]]>這里,1≤i≤10和0≤t≤1用方程(11),在具有t=0,和t=1的幀數(shù)的兩幀間,在頻率軸方向上完成未限定的加權(quán)。在用矩陣量化處理的兩幀間完成僅在時(shí)間軸方向上的限定的加權(quán)。
在查明期間,具有總數(shù)T,用作查明數(shù)據(jù)的總的幀根據(jù)方程(12)被加權(quán)w′(i,t)=w(i,t)Σj=110Σs=0Tw(j,s)----(12)]]>這里,1≤i≤10和0≤t≤T現(xiàn)在解釋在頻率軸方向上和在時(shí)間軸方向上的限定的加權(quán)。如果階數(shù)P=10,LSP參量X(i,t)分組為L1={X(i,t)|1≤i≤2,0≤t≤1}L2={X(i,t)|3≤i≤6,0≤t≤1}L3={X(i,t)|7≤i≤10,0≤t≤1}低、中、高范圍的三個(gè)范圍。如果組L1,L2和L3的加權(quán)是1/4,1/2和1/4,由方程(13),(14)和(15)給出僅在頻率軸上的限定的加權(quán)w′(i,t)=w(i,t)Σj=12Σs=01w(j,s)×14----(13)]]>w′(i,t)=w(i,t)Σj=36Σs=01w(j,s)×12----(13)]]>w′(i,t)=w(i,t)Σj=710Σs=01w(j,s)×14----(15)]]>用方程(13)至(15)完成在頻率軸方向上每三幀和用矩陣量化處理的兩幀上的限定的加權(quán)。這在代碼簿搜索期間和查明期間是有效的。
在查明期間,全部數(shù)據(jù)的所有的幀被加權(quán)。LSP參量X(i,t)分組成為L1={X(i,t)|1≤i≤2,0≤t≤T}L2={X(i,t)|3≤i≤6,0≤t≤T}L3={X(i,t)|7≤i≤10,0≤t≤T}低、中和高范圍。如果組L1,L2和L3是1/4,1/2和1/4,僅在頻率軸上限制的組L1,L2和L3的加權(quán)由方程(16),(17)和(18)給出w′(i,t)=w(i,t)Σj=12Σs=0Tw(j,s)×14----(16)]]>w′(i,t)=w(i,t)Σj=36Σs=0Tw(j,s)×12----(17)]]>w′(i,t)=w(i,t)Σj=710Σs=0Tw(j,s)×14----(18)]]>通過方程(16)至(18),在頻率軸方向上的三個(gè)頻帶,以及時(shí)間軸方向上的所有的幀都能執(zhí)行加權(quán)。
另外,矩陣量化單元620和矢量量化單元640執(zhí)行依賴于在LSP參量中變化的幅度的加權(quán)。在V至UV或UV至V過渡區(qū)域,LSP參量,由于輔音和元音音節(jié)頻率響應(yīng)中的區(qū)別,而明顯地變化,所說的過渡區(qū)域表示所有語音幀中的少數(shù)幀。因此,由方程(19)所示的加權(quán)可以由加權(quán)W(i,t)倍增,以便在過渡區(qū)域上安置重點(diǎn)加權(quán)。可使用方程(19),wd(i)=Σi=110|x1(i,t)-x1(i,t-1)|2----(19)]]>和隨后的方法(20)wd(t)Σi=110|x1(i,t)-x1(i,t-1)|----(20)]]>
因此,LSP量化單元134執(zhí)行兩級矩陣量化和兩級矢量量化,以給與輸出下標(biāo)變量的比特?cái)?shù)。
圖7示出了矢量量化單元116的基本結(jié)構(gòu),同時(shí)在圖7中所示矢量量化單元116的更詳盡的結(jié)構(gòu)示于圖8中?,F(xiàn)在解釋在矢量量化單元116中頻譜包絡(luò)Am的加權(quán)矢量量化的說明性的結(jié)構(gòu)。
首先解釋在圖3中所示語音信號編碼裝置中的在頻譜估算單元148的輸出端或矢量量化單元116的輸入端上提供的頻譜包絡(luò)幅度的恒定數(shù)目的數(shù)據(jù)的數(shù)據(jù)數(shù)目轉(zhuǎn)換的示意性方案。
可以想到數(shù)據(jù)數(shù)目轉(zhuǎn)換的各種方法。在本實(shí)施例中,將來自塊中的最后一個(gè)數(shù)據(jù)到塊中的第一個(gè)數(shù)據(jù)的偽數(shù)據(jù)內(nèi)插值或諸如重復(fù)塊中的最后一個(gè)數(shù)據(jù)或第一個(gè)數(shù)據(jù)的預(yù)置的數(shù)據(jù)加到頻率軸上的有效頻帶上的一個(gè)數(shù)據(jù)塊的幅度數(shù)據(jù)上,以提高數(shù)據(jù)數(shù)為NF,數(shù)目上等于0倍的幅度數(shù)據(jù),就象8倍的一樣,就象由例如FIR濾波器作有限頻帶的8倍的附加取樣那樣,由0倍的所表征。用((mMx+1)x0)的幅度數(shù)據(jù)線性內(nèi)插,以擴(kuò)大為較大的數(shù)NM,例如為2048。這個(gè)NM數(shù)據(jù)被二次取樣,以轉(zhuǎn)換到上述的預(yù)置的數(shù)目M的數(shù)據(jù),例如44數(shù)據(jù)。
實(shí)際上,最終需要的表達(dá)M數(shù)據(jù)的僅僅必要的數(shù)據(jù)由附加取樣,并沒有發(fā)現(xiàn)上述的NM數(shù)據(jù)的線性內(nèi)插計(jì)算。
完成圖7的加權(quán)矢量量化的矢量量化單元116至少包括執(zhí)行第一矢量量化步驟的第一矢量量化單元500和完成在第一矢量量化期間量化由第一矢量量化單元500產(chǎn)生的量化誤差矢量的第二矢量量化步驟的第二矢量量化單元510。這個(gè)第一矢量量化單元500是所謂的第一級矢量量化單元,同時(shí)第二矢量量化單元510是所謂的第二級矢量量化單元。
作為具有預(yù)定數(shù)目M的包絡(luò)數(shù)據(jù)的頻譜估算單元148的輸出矢量X進(jìn)入第一矢量量化單元500的輸入端501。這個(gè)輸出矢量X由矢量量化單元502用加權(quán)矢量量化量化。因此,由矢量量化單元502輸出的形狀下標(biāo)在輸出端503輸出,同時(shí)量化的值X′0在輸出端504輸出和傳送給加法器505,513。這個(gè)加法器505從源矢量X中減去量化的值X′0,以給出多階量化誤差矢量y。
量化誤差矢量y傳送給第二矢量量化單元510中的矢量量化單元511。這個(gè)第二矢量量化單元是由多個(gè)矢量量化單元或者圖7中的兩個(gè)矢量量化器5111,5112所組成量化誤差矢量被維空間地分離,以致由在兩個(gè)矢量量化器5111,5112中的加權(quán)矢量量化所量化。這些由矢量量化器5111,5112輸出的形狀下標(biāo)在輸出端5121,5122輸出,同時(shí)量化的值y1′,y2′在維空間方向上連接并傳送到加法器513。加法器513將量化值y1′,y2′加到量化值X0′上,以產(chǎn)生在輸出端514輸出的量化值X1′。
因此,對于低比特率。由第一矢量量化單元500的第一矢量量化步驟的輸出被取出,反過來、對于高比特率,第一矢量量化步驟的輸出和由第二量化單元510的第二量化步驟的輸出被輸出。
具體地講,在矢量量化部分116的第一矢量量化單元500中的矢量量化器502是諸如44階2級結(jié)構(gòu)的L-階的,如圖8中所示。
也就是,用增益gi乘的,具有大小為32的代碼簿的44階矢量量化代碼簿的矢量輸出的和用作44階頻譜包絡(luò)矢量X的量化值X0′。因此,如圖8所示,兩個(gè)代碼簿是CB0和CB1,同時(shí)輸出矢量是S1i和S1j,其中的0≤i和j≤31。另一方面,增益代碼簿CBg的輸出是gl,其中0≤l≤31其中的gl是標(biāo)量。最終輸出X0′是gl(S1i+S1j)。
由上述的LPC殘余的MBE分析和轉(zhuǎn)換成預(yù)置等級所獲得的頻譜包絡(luò)Am是X。因此,如何有效率地量化x是很關(guān)鍵的。
量化誤差能量E定義如下E=‖W{Hx-Hgl((S01+S1j)}‖2=‖WH{x-{x-gl(S0i+S1j)}‖2…(21)其中,H表示在LPC合成的頻率軸上的特性,以及加權(quán)的矩陣W代表頻率軸上的頻譜加權(quán)的特性。
如果現(xiàn)時(shí)幀的LPC分析結(jié)果的α-參量表示為αi(1≤i≤P),例如對應(yīng)點(diǎn)的44階的L階的值由方程(22)的頻率響應(yīng)取樣,H(z)=11+Σi=1Pαiz-i----(22)]]>對于計(jì)算,用0填充在相鄰串1,α1,α2,…αp的地方,以得到串1,α1,α2,…αp,0,0,…0以給出例如256點(diǎn)的數(shù)據(jù)。于是,用256點(diǎn)FFT,(re2+im2)1/2計(jì)算與0到π范圍有關(guān)的點(diǎn),而且發(fā)現(xiàn)該結(jié)果的倒數(shù),這些倒數(shù)作L點(diǎn)的二次取樣,例如44個(gè)點(diǎn)。從而形成在對角線上有L個(gè)元素的矩陣
互易地加權(quán),矩陣W由方程23給出W(z)=1+Σi=1Pαiλbiz-i1+Σi=1Pαiλaiz-i]]>這里的αi是LPC分析的結(jié)果,λa、λb是常數(shù),以致λa=0.4和λb=0.9。
矩陣W可以由上述方程(23)的頻率響應(yīng)計(jì)算出來。例如FFT可以用256點(diǎn)數(shù)據(jù),1,α1λb,α2λ1b2……αpλbp,0,0……0表示以找到0到π范疇的(re2[i]+I(xiàn)m2[i])1/2。用在從發(fā)現(xiàn)(re′2[i]+I(xiàn)m′2[i])1/2的128個(gè)點(diǎn)上的1,α1λa,α2λa2……αpλap,0,0,…,0的0至π的范疇的256點(diǎn)的FFT找到分母的頻率響應(yīng),這里的0≤i≤128。
方程23的頻率響應(yīng)可以由下式得到w0[i]=re2[i]+im2[i]re′2[i]+im′2[i]]]>這里0≤i≤128。這就用下面的方法表示例如44階矢量的每個(gè)相關(guān)的點(diǎn)。更準(zhǔn)確地說,應(yīng)當(dāng)使用線性內(nèi)插。然而,在隨后的例子中,替換了最接近的點(diǎn)。
也就是,ω[i]=ω0[nint{128i/L)],這晨1≤i≤L。
在該方程中,nint(X)是恢復(fù)最接近X的值的函數(shù)。
用類似的方法找到H,h(1),h(2),…h(huán)(L)。
也就是,
作為另一個(gè)例子,對于減小FFT的倍數(shù)的情況,首先表示H(Z)W(Z),然后表示頻率響應(yīng)。也就是方程(25)的分母H(z)W(z)=11+Σi=1Pαiz-i·1+Σi=1Pαiλbiz-i1+Σi=1Pαiλaiz-i----(25)]]>擴(kuò)展為,(1+Σi=1Pαiz-i)(1+Σi=1Pαaiλaiz-i)=1+Σi=12Pβiz-i]]>256點(diǎn)數(shù)據(jù),例如使用串1,β1,β2…,β2p,0,0,……0產(chǎn)生之。然后進(jìn)行256點(diǎn)FFT,幅度的頻率響應(yīng)是,rms[i]=re′′2[i]+im′′2[i]]]>這里0≤i≤128,其中,wh0[i]=re2[i]+im2[i]re′′2[i]+im′′2[i]]]>這里0≤i≤128。這將表示每一個(gè)L維矢量的對應(yīng)點(diǎn)。如果FFT的點(diǎn)數(shù)很少,應(yīng)當(dāng)使用線性內(nèi)插。然而,在此可由下面公式表示最接近的值;wh[i]=wh0[n int(128L·i)]]]>這里1≤i≤L,如果具有對角線元素的矩陣是W’,
則,方程(26)表示與方程(24)相同的矩陣。
另外,從與ω=i/Lλ有關(guān)的方程(25)可以直接表示,以致可用于Wh(i)。另外,方程(25)的脈沖響應(yīng)表示適當(dāng)?shù)拈L度,例如64個(gè)點(diǎn),以及快速付里葉變換以發(fā)現(xiàn)然后用于Wh(i)的幅度頻率特性。
使用這個(gè)矩陣重寫方程(21)。它是加權(quán)合成濾波器的頻率響應(yīng),我們得到方程(27)E=‖W′(x-gl((S0i+S1))‖2…(27)現(xiàn)在解釋查明形狀代碼簿和增益代碼簿的方法。
對所有的幀K,使所有的失真的期望值減至最小,對于這些幀代碼矢量選擇為CB0。如果是M幀,如果J=1MΣk=1M||Wk′(x-gk(s0c+s1k))||2----(28)]]>是最小化的,它將是充分的。在方程(28)中,Wk′,Xk,gk和Sik分別地表示第K幀的加權(quán),第K幀的輸入,第K幀的增益和第K幀的代碼簿CB1的輸出。
最小化方程(28),J=1MΣk=1M{(xkT-gk(s0cT+s1kT))Wk′TWk′(xk-gk(s0c+s1k))}]]>=1MΣk=1M{xkTWk′TWk′xk-2gk(s0cT+s1kT)Wk′TWk′xk]]>+gk2(s0cT+s1kT)Wk′TWk′(s0c+s1k)}]]>=1MΣk=1M{xkTWk′TWk′xk-2gk(s0cT+s1kT)Wk′TWk′xk]]>+gk2s0cTWk′TWk′s0c+2gk2s0cTWk′TWk′s1k+gk2s1kTWk′TWk′s1k}----(29)]]>∂J∂s0c=1MΣk=1M{2gkWk′TWk′xk+2gk2Wk′TWk′s0c+2gk2Wk′TWk′s1k}=0----(30)]]>因此Σk=1M(gkWk′TWk′xk-gk2Wk′TWk′s1k)=Σk=1Mgk2Wk′TWk′s0c]]>所以s0c={Σk=1Mgk2Wk′TWk′}-1·{Σk=1MgkWk′TWk′(x-gks1k)}----(31)]]>這里的()表示反向矩陣和Wk′T表示轉(zhuǎn)置矩陣Wk′。
然后,考慮增益最優(yōu)化。
有關(guān)選擇增益的代碼字gc的第k幀的失真的期望值由下面給出Jg=1MΣk=1N||Wk′(xk-gc(s0k+s1k))||2]]>=1MΣk=1M{xkTWk′TWk′xk-2gcxkTWk′TWk′(s0k+s1k)]]>-gc2(s0kT+s1kT)Wk′TWk′(s0k+s1k)}]]>解方程∂Jg∂gc=1MΣk=1M{-2xkTWk′TWk′(s0k+s1k)]]>-2gc(s0kT+s1kT)Wk′TWk′(s0k+s1k)}=0]]>我們得到Σk=1MxkTWk′TWk′(s0k+s1k)=Σk=1Mgc(s0kT+s1kT)Wk′TW′(s0k+s1k)]]>和gc=Σk=1MxkTWk′TWk′(s0k+s1k)Σk=1M(s0kT+s1kT)Wk′TW′(s0k+s1k)----(32)]]>
上面的方程(31)和(32)給出了形狀S0i,S1i的最佳質(zhì)(量中)心和0≤i≤31的增益gi,這也是最佳解碼輸出。同時(shí),S1i可以用相同的方式表示為S0i。
最接近鄰近條件的最佳編碼條件被考慮。
由使方程E=‖W′(X-gc(S1i+S1j))‖2盡可能小的S0i和S1j確定失真測量的前面的方程(27)將給出每次表明輸入X和加權(quán)矩陣W′,它是以一幀接著一幀為基礎(chǔ)的。
實(shí)質(zhì)上,對于gl(0≤l≤31),S0i(0≤i≤31)和S1j(0≤i≤31)的所有的組合,E建立在環(huán)形的知更烏方式上,也就是為了找到S0i,S1i的組,它是32×32×32=32768,它將給出E的最小值。然而,由于這需要龐大的計(jì)算,在本實(shí)施例中順序地搜索形狀和增益。同時(shí),環(huán)形和更鳥式的搜索用于S0i和S1i的組合。這里有32×32=1024個(gè)S0i和S1i的組合。在以后的說明中,為了簡單用Sm表示S1i+S1j。
上面的方程(27)變?yōu)镋=‖W′(X-glam)‖2,如果為了進(jìn)一步簡化,我們得到Xk=W′S和Sw=W′Snp。
E=‖xk-glow‖2…(33)E=||xw||2+||sw||2(gi-xwT·sw||sw||2)2-(xWT·sw)2||sw||2----(34)]]>因此,如果gl作得充分的精確,可以用下面的兩個(gè)步驟執(zhí)行搜索(1)對極大化的Sw的搜索,(xwT·sw)2||sw||2]]>和(2)對gl的搜索,gl最接近,xwT·sw||sw||2]]>如果使用原來的符號重寫以上的話,(1)′對S0i和S1i組進(jìn)行搜索,它將是最大化的,(xTW′TW′(s0i+s1j))2||W′(s0i+s1j)||2]]>和(2)′對gl進(jìn)行搜索,gl最接近xTW′TW′(s0i+s1j)||W′(s0i+s1j)||2]]>
上面的方向(35)表示最佳編碼條件(最接近相鄰的條件)。
使用方程(31)和(32)的條件(質(zhì)(量中)心條件)和方程(35)的條件,代碼簿(CB0,CB1和CBg)可以在使用所謂的一般化的勞埃德算法(GLA)的同時(shí)進(jìn)行實(shí)踐。
在本實(shí)施例中,用輸入X的范圍劃分的W′用作W′。也就是W′/‖×‖替代方程(31),(32)和(35)中的W′。
另外,在由矢量量化器116作矢量量化時(shí),用作感性加權(quán)的加權(quán)W’由上面的方程(26)定義。然而,考慮到暫時(shí)掩蓋的加權(quán)W’可以通過發(fā)現(xiàn)現(xiàn)時(shí)的加權(quán)W’而被發(fā)現(xiàn)。在現(xiàn)時(shí)加權(quán)中已經(jīng)考慮到過去的W’。
正象在第幾幀的時(shí)候所發(fā)現(xiàn)的,在上面方程(26)中的Wh(1),wh(2),…wh(L)的值分別地表示為whn(1),whn(2),whn(L)。
如果在時(shí)間n的加權(quán)考慮到過去的0值,它將定義為An(i),這里1≤i≤L,An(i)=λAn-1(i)+(1-λ)whn(i),(whn(i)≤An-1(i))=whn(i),(whn(i)>An-1(i))這里,λ可以設(shè)定,例如,λ=0.2。在An(i)中,同時(shí)1≤i≤L。因此發(fā)現(xiàn),具有諸如An(i)作為對角線元素的矩陣可以用于上面的加權(quán)。
用這種方法通過加權(quán)矢量量化獲得的形狀下標(biāo)值S0i,Sij分別地在輸出端520,522輸出。而且,在輸出端504輸出量化值x0′,同時(shí)傳送給加法器505。
加法器505,從頻譜包絡(luò)矢量x中減該量化值,以產(chǎn)生量化誤差矢量y。具體地講,這個(gè)量化誤差矢量y使送給矢量量化單元511,以致空間地分離和由矢量量化器511,至511g用加權(quán)矢量量化進(jìn)行量化。
第二矢量量化單元510使用大于第一矢量量化單元500的比特?cái)?shù)。因此,代碼簿的存儲容量和代碼簿搜索的處理容量(復(fù)雜性)明顯地增加。因此,用和第一矢量量化單元500相同的44階完成矢量量化已成為不可能。因此,在第二矢量量化單元510中的矢量量化單元511是由多個(gè)矢量量化器組成,以及輸入的量化值被空間地分離成多個(gè)低空間的矢量,以執(zhí)行加權(quán)的矢量量化。
對于矢量量化器5111至511g中的量化值y0至y7間的關(guān)系,空間的維數(shù)和比特?cái)?shù)示于隨后的表2中。
表2
來自矢量量化器5111至511g的輸出的下標(biāo)值Idvq0至Idvq7在輸出端5231至523g輸出。這些下標(biāo)數(shù)據(jù)的比特的和是72。
如果通過在空間方向上連接矢量量化器5111至5118的量化輸出值y0′至y7′,所得到的值是y′,量化值y′和X0′由加法器513求和,以給出量化值x1′。因此,量化值X1′表示為,
X1′=X0′+y′=X-y+y′也就是,最終量化誤差矢量是y′-y。
如果來自第二矢量量化器510的量化值X′是被解碼的,語音信號解碼裝置不需要來自第一量化單元500的量化值X′。然而,需要來自第一量化單元500和第二量化單元510的下標(biāo)數(shù)據(jù)。
以后要解釋在矢量量化部分511中的查明方法和代碼簿搜索。
作為查明方法,量化誤差矢量y用表2中所示的加權(quán)W′被劃分成為y0至y7的8個(gè)低階矢量。如果權(quán)重W′是具有對角線元素的44個(gè)二次取樣的點(diǎn)的矩陣,
其中,權(quán)重W′分離成下面的8個(gè)矩陣,
因此,分離成低空間維的y和W′稱作Yi和W1′,其中,分別地1≤i≤8。
該失真測量E定義為,E=‖W1′(yi-S)‖2代碼簿矢量S是yi的量化結(jié)果。使失真測E最小化的代碼簿的代碼矢量被搜索。
在查明代碼簿中,使用勞埃德算法(GLA)進(jìn)行進(jìn)一步的加權(quán)。首先解釋查明的最佳質(zhì)心條件。如果具有作為最佳量化結(jié)果的選擇的代碼矢量的M個(gè)輸入矢量y,而且實(shí)踐數(shù)據(jù)是yk,矢真J的期望值由在有關(guān)的所有幀K的加權(quán)上使失真中心盡可能小的方程(38)給出J=1MΣk-1M||Wk′(yk-s)||2]]>=1MΣk-1M(yk-s)TWk′TWk′(yk-s)]]>=1MΣk-1MykTWk′TWk′yk-2ykTWk′TWk′s]]>+sTWk′TWk′s----(38)]]>∂J∂s=1MΣk-1M(-2ykTWk′TWk′+2sTWk′TWk′)=0]]>解方程,我們得到Σk=1MykTWk′TWk′=Σk=1MsTWk′TWk′]]>互換兩側(cè)的值,我們得到Σk=1MWk′TWk′yk=Σk=1MWk′TWk′s]]>因此s=(Σk=1MWk′TWk′)-1Σk=1MWk′TWk′yk----(39)]]>在上面方程(39)中,S是最佳的代表矢量和表示最佳的質(zhì)心狀態(tài)。
至于最佳編碼條件,它在搜索與查明期間的W1′不相同的期間滿足搜索使‖W1′(yi-S)‖2·W1′的值最小的S,并且可以是非加權(quán)的矩陣
通過由兩級矢量量化單元構(gòu)成在語音信號編碼器中的矢量量化單元116,這將有可能使輸出下標(biāo)比特變?yōu)榭勺兊摹?br>
使用上述的本發(fā)明的CELP編碼器構(gòu)造的第二編碼單元120,它由圖9所示的多級矢量量化處理器構(gòu)成。在圖9的實(shí)施例中,這些多級矢量量化處理器構(gòu)成兩級編碼單元1201,1202,其中示出了在傳輸比特率能在例如2Kbps和6Kbps間轉(zhuǎn)換的情況下處理6Kbps的傳輸比特率的方案。另外,形狀和增益下標(biāo)輸出可以在23比特/5毫秒和15比特/5毫秒間轉(zhuǎn)換。在圖9方案中的處理流程示于圖10中。
參照圖9,圖9的LPC分析電路302對應(yīng)于圖3中所示的LPC分析電路132,同時(shí)LSP參量量化電路303對應(yīng)于圖3的從α-LSP轉(zhuǎn)換電路133到LSP-α轉(zhuǎn)換電路137的結(jié)構(gòu),以及感性加權(quán)濾波器304對應(yīng)圖3的感性加權(quán)濾波計(jì)算電路139和感性加權(quán)濾波器125。因此,在圖9中,與圖3的第一編碼單元113的LSP-α轉(zhuǎn)換電路137相同的輸出提供到端點(diǎn)305,同時(shí)與圖3的感性加權(quán)濾波計(jì)算電路的輸出相同的輸出加到端點(diǎn)307,以及與圖3的感性加權(quán)濾波器125的輸出相同的輸出加到端點(diǎn)306。然而,與感性加權(quán)濾波器125不同,圖9的感性加權(quán)濾波器304產(chǎn)生感性加權(quán)信號,也就是和圖3的感性加權(quán)濾波器125的輸出相同的信號,使用輸入語音數(shù)據(jù)和預(yù)量化α參數(shù)替代使用LSP-α轉(zhuǎn)換電路137的輸出。
在圖9中所示的兩級第二編碼單元1201和1202中,減法器313和323對應(yīng)圖3的減法器123,同時(shí)距離計(jì)算電路314,324對應(yīng)圖3的距離計(jì)算電路124。另外,增益電路311,321對應(yīng)圖3的增益電路126,同時(shí),隨機(jī)代碼簿310,320和增益代碼簿315,325對應(yīng)圖3的噪聲代碼簿121。
在圖9的結(jié)構(gòu)中,在圖10的步驟S1,LPC分析電路將由端點(diǎn)301提供的輸入語音數(shù)據(jù)x分離成前面所述的幀,以為了發(fā)現(xiàn)α-參量而執(zhí)行LPC分析。LSP參量量化電路303將來自LPC分析電路的α-參量轉(zhuǎn)換成LSP參量,以量化該LSP參量。量化的LSP參量被內(nèi)插和轉(zhuǎn)換成α-參量。LSP參量量化電路303由從量化的LSP參量轉(zhuǎn)換的α-參量產(chǎn)生LPC合成濾波函數(shù)1/H(Z),并且將產(chǎn)生的LPC合成濾波函數(shù)1/H(Z)通過終端305傳送給第一級第二編碼單元120的感性加權(quán)合成濾波器312。
感性加權(quán)濾波器304發(fā)現(xiàn)相同于圖3的感性加權(quán)濾波計(jì)算電路139由來自LPC分析電路302的參量產(chǎn)生的感性加權(quán)數(shù)據(jù),這也就是預(yù)量化α-參量。這些加權(quán)數(shù)據(jù)通過端點(diǎn)307加到第一級第二編碼單元1201的感性加權(quán)合成濾波器312。感性加權(quán)濾波器312象圈10中所示的步驟S2那樣,從輸入的語音數(shù)據(jù)和預(yù)量化α-參量,產(chǎn)生相同于感性加權(quán)濾波器125輸出的感性加權(quán)信號。也就是,由預(yù)量化α-參量首先產(chǎn)生LPC合成濾波函數(shù)W(Z)。該產(chǎn)生的濾波函數(shù)W(Z)因此加上輸入語音數(shù)據(jù)X,以產(chǎn)生通過終端306作為感性加權(quán)信號加給第一級第二編碼單元1201的減法器303的Xk。
在第一級第二編碼單元1201中,9比特的形狀下標(biāo)輸出的隨機(jī)代碼簿310的代表值輸出傳送給增益電路311,然后,該電路將來自隨機(jī)代碼簿310的代表輸出乘上來自6比特增益下標(biāo)輸出的增益代碼簿315的增益(標(biāo)量)。用增益電路311的增益乘過的代表值輸出傳送給具有1/A(Z)=(1/H(Z))*W(Z)的感性加權(quán)合成濾波器312。加權(quán)合成濾波器312,傳送1/A(Z)零輸入響應(yīng)輸出給由圖10的步驟S3所示的減法器313。該減法器313執(zhí)行感性加權(quán)合成濾波器312的零-輸入響應(yīng)輸出與來自感性加權(quán)濾波器304的感性加權(quán)信號Xk的減法,并將結(jié)果的差值或誤差作為參考矢量γ取出。在第一級第二編碼單元120的搜索期間,這個(gè)參考矢量r傳送給距離計(jì)算電路314,在這里,如圖10中的步驟S4所示,計(jì)算出距離和搜索了形狀矢量S和使量化誤差能量E最小的增益g。這里,1/A(E)是在零狀態(tài)。也就是,如果與零狀態(tài)中的1/A(Z)、合成的代碼簿中的形狀矢量S是Ssyn,則最小化方程(40)為E=Σn=0N-1(r(n)-gssyn(n))2----(40)]]>其形狀矢量S和增益g被搜索。
雖然使量化誤差能量E最小的S和g能完全地搜索,但可以使用下面的方法以減少計(jì)算的量。
第一種方法是,搜索使Es最小的形狀矢量S,由下面的方程(41)定義EsEs=Σn=0N-1r(n)ssyn(n)Σn=0N-1ssyn(n)2----(41)]]>從用第一種方法獲得的S,理想的增益由方程(42)表示gref=Σn=0N-1r(n)ssyn(n)Σn=0N-1ssyn(n)2----(42)]]>因此;作為第二種方法,搜索使下述方程(43)最小的g。
Eg=(gref-g)2(43)由于E是g的二次方程,最小化Eg的g使E最小。
從由第一和第二種方法得到的S,可以由下面的方程(44)計(jì)算量化誤差矢量e。
e=r-gssyn(44)這就象在第一級那樣,這個(gè)量化作為第二級第二編碼單元1202的參考基準(zhǔn)。
這也就是供給端點(diǎn)305和307的信號是直接從第一級第二編碼單元1201的感性加權(quán)合成濾波器312加給第二級第二編碼單元1202的感性加權(quán)合成濾波器322。由第一級第二編碼單元1201發(fā)現(xiàn)的量化誤差矢量e供給第二級第二編碼單元1202的減法器323。
在圖10的步驟S5,類似于在第一級中執(zhí)行的處理發(fā)生在第二級第二編碼單元1202中,也就是,來自5比特形狀下標(biāo)輸出的隨機(jī)代碼簿320的分別的輸出值傳送給增益電路321,在這里代碼簿320的代表值輸出乘以來自3比特增益下標(biāo)輸出的增益代碼簿325的增益。加權(quán)合成濾波器322的輸出傳送給減法器323,在這里感性加權(quán)合成濾波器322的輸出和第一級誤差矢量e間的差被發(fā)現(xiàn)。這個(gè)差傳送給作距離計(jì)算的距離計(jì)算電路324,這是為了搜索形狀矢量S和使量化誤差能量E最小的增益g。
隨機(jī)代碼簿310的形狀下標(biāo)輸出和第一級第二編碼單元1201的增益代碼簿315的增益下標(biāo)輸出,以及隨機(jī)代碼簿320的下標(biāo)輸出和第二級第二編碼單元1202的增益代碼簿325的下標(biāo)輸出傳送給下標(biāo)輸出轉(zhuǎn)換電路330。如果由第二編碼單元120輸出23比特,第一級和第二級第二編碼單元1201,1202的隨機(jī)代碼簿310,320和增益代碼簿315,325的下標(biāo)數(shù)據(jù)被求總和并且輸出。如果輸出15比特,第一級第二編碼單元1201的隨機(jī)代碼簿310和增益代碼簿的下標(biāo)數(shù)據(jù)被輸出。
如步驟S6所示,為了計(jì)算零輸入響應(yīng)輸出,濾波器狀態(tài)于是被更新。
在本實(shí)施例中,第二級第二編碼單元的下標(biāo)比特的數(shù)象形狀矢量的5那樣小。同時(shí),它的增益象3那樣小。如果適當(dāng)?shù)男螤詈驮鲆鏇]有出現(xiàn)在代碼簿的情況下,則量化誤差很可能增加而不是減小。
雖然能提供0的增益以防止那種缺陷,這里只有3比特給增益。如果這些中的一個(gè)設(shè)定為0,量化器性能明顯地惡化。在這個(gè)考慮中,為形狀矢量提供所有的0矢量,已有大量的比特分配給形狀矢量。除了所有的零矢量,上述的搜索被執(zhí)行。如果量化誤差已經(jīng)最終增加了,那么選擇所有的零矢量。增益是任意的。這就有可能在第二級第二編碼單元1202中防止量化誤差被增加。
雖然以上描述了兩級方案,級數(shù)可以大于2。在這種情況下,如果用第一級閉環(huán)搜索的矢量量化已經(jīng)結(jié)束,則2≤N的第N級量化,用作為基準(zhǔn)輸入的第(N-1)級的量化誤差將其完成。第N級的量化誤差用作第(N+1)級的基準(zhǔn)輸入。
從圖9和圖10可以看到,使用第二編碼單元的多級矢量量化器與使用有相同比特?cái)?shù)的直線向量量化器或使用配對代碼簿的相比較,其計(jì)算量減少。特別是,在使用合成方法得到的分析作閉環(huán)搜索的時(shí)間軸波形矢量量化的CELP編碼中,少量的搜索操作時(shí)間是至關(guān)重要的。另外,比特?cái)?shù)能夠容易地在使用兩級第二編碼單元1201,1202的兩個(gè)下標(biāo)輸出和僅使用第一級第二編碼單元1201的而不使用第二級第二編碼單元1202的輸出之間進(jìn)行轉(zhuǎn)換。如果第一級和第二級第二編碼單元1201,1202的下標(biāo)輸出結(jié)合起來輸出,解碼器能容易地處理選擇一個(gè)下標(biāo)輸出的結(jié)構(gòu)。也就是解碼器容易使用2Kbps的解碼器,其操作解碼用例如6Kbps的編碼的參量的結(jié)構(gòu)。另外,如果在第二級第二編碼單元1202的波形代碼簿中包含零矢量,它將有可能防止量化誤差被增加,性能上的惡化小于將0加給增益的情形。
隨機(jī)代碼簿的代碼矢量,例如能通過限幅所謂高斯噪聲產(chǎn)生。具體地說,通過用產(chǎn)生的高斯噪聲、用適當(dāng)?shù)拈撝迪薹摳咚乖肼暫鸵?guī)格化的限幅的高斯噪聲能產(chǎn)生該代碼簿。
然而,有各種不同類型的語音、例如高斯噪聲能處理諸如Sa,Shi,Su,Se和So的接近噪聲的輔音,而高斯噪聲不能處理急劇升高的輔音,如“Pa,Pi,Pu,Pe,和Po”。根據(jù)本發(fā)明,高斯噪聲應(yīng)用到一些代碼矢量,同時(shí)剩余的代碼矢量部分查明了可以處理,因此具有急劇升高輔音和接近噪聲的輔音二者能夠被處理。如果例如閾值增加,可以獲得的矢量有一些較大峰點(diǎn),相反,如果閾值減小,代碼矢量接近高斯噪音。因此,通過增加限幅閾值的偏差,將有可能處理具有急劇升高部分如“Pa,Pi,Pu,Pe和Po”的輔音或接近噪聲如“Sa,Shi,Su,Se和So”的輔音,因此增加了清晰程度。圖11分別地示出了用實(shí)線表示的高斯噪聲的和虛線表示的限幅噪聲的例子。圖11A和圖11B示出了用限幅閾值等于1.0的較大的閾值的噪聲和用限幅閾值等于0.4的較小的閾值的噪聲。從圖11A和圖11B可以看到,如果閾值選擇較大的,于是得到有一些較大峰點(diǎn)的矢量。相反,如果閾值選擇較小的,噪聲就接近高斯噪聲本身。
為了實(shí)現(xiàn)這個(gè),用限幅高斯噪聲的方法準(zhǔn)備初始的代碼簿和設(shè)置適當(dāng)數(shù)量的非查明的代碼矢量。為了處理接近諸如“Sa,Shi,Su,Se和So”的噪音的輔音,按增加變化值的順序選擇非查明的代碼矢量。用LBG算法查明該矢量。在最接近的鄰域值條件下的編碼,使用固定代碼矢量和查明所獲得的代碼矢量二者。在質(zhì)心條件下,只有代碼矢量組為了查明而被刷新。因此,代碼矢量組用于查明能處理諸如“Pa,Pi,Pu,Pe和Po”的尖銳上升的輔音。
最佳增益用通常的知識可以查明這些代碼矢量。
圖12是用限幅高斯噪音、處理代碼簿的結(jié)構(gòu)的流程。
在圖12中,為了初始化查明的次數(shù)n在步驟S10設(shè)定n=0。誤差Do=∞,查明的最大次數(shù)nmax被設(shè)定,以及設(shè)定查明最終狀態(tài)的閾值∈被設(shè)定。
在下一步驟S11,限幅高斯噪聲得到的最初代碼簿產(chǎn)生了。在步驟S12,固定了部分的代碼矢量作為未查明的代碼矢量。
在下一個(gè)步驟S13,編碼被完成,使上述代碼簿作響,在步驟S14,計(jì)算了誤差。在步驟S15判斷是否Dn-1-Dn/Dn<∈,或者n=nmax,如果結(jié)果是YES(是),處理將結(jié)束,如果結(jié)果是NO(否),處理轉(zhuǎn)移到步驟S16。
在步驟S16,沒有用于編碼的代碼矢量被處理。在下個(gè)步驟S17,代碼簿被刷新。在步驟S18,在返回到步驟S13以前查明的n的次數(shù)被增加。
上述的信號編碼和信號解碼裝置可以用于使用中的語音代碼簿,例如圖14中所示的便攜通信終端或便攜電話機(jī)。
圖13示出了使用象圖1和圖3所示結(jié)構(gòu)的語音編碼單元160的便攜終端的發(fā)送端。由話筒161收集的語音信號由放大器162放大和由模/數(shù)(A/D)轉(zhuǎn)換器163轉(zhuǎn)換成數(shù)字信號,該數(shù)字信號傳送給結(jié)構(gòu)象圖1和圖3中所示結(jié)構(gòu)的語音編碼單元161。由A/D轉(zhuǎn)換器163給出的數(shù)字信號供給輸入端101。語音編碼單元160執(zhí)行結(jié)合圖1和圖3所作解釋的編碼。圖1和圖2的輸出編的輸出信號作為語音編碼單元160的輸出信號傳送給發(fā)送信道編碼單元164,然后單元164對提供的信號執(zhí)行信道編碼。發(fā)送信道編碼單元164的輸出信號傳送給用于調(diào)制的調(diào)制電路165和從而通過數(shù)/模(D/A)轉(zhuǎn)換器和RF(射頻)放大器167加到天線168上。
圖14示出了使用如圖4中結(jié)構(gòu)的語音編碼單元260的便攜終端的接收端。由圖14的天線261接收的語音信號由放大器262放大并通過模/數(shù)(A/D)轉(zhuǎn)換器263傳送給傳輸信道解碼單元265。解碼單元265的輸出信號供給如圖2和圖4中所示結(jié)構(gòu)的語音解碼單元260。語音解碼單元260就象結(jié)合圖2和圖4所解釋的那樣解碼信號。在圖2和圖4的輸出端上的輸出信號作為語音解碼單元260的信號傳送給數(shù)/模(D/A)轉(zhuǎn)換器266。來自D/A轉(zhuǎn)換器的模擬語音信號傳送給揚(yáng)聲器268。
本發(fā)明不限于上述的實(shí)施例。例如,語音合成端(編碼器)的結(jié)構(gòu)或語音合成(解碼器)的結(jié)構(gòu),至此作為硬件描述的,它也可以使用所謂的數(shù)字信號處理器(DSP)由軟件程序?qū)崿F(xiàn)。而且多幀數(shù)據(jù)可以收集在一起和由矩陣量化以替代矢量量化。然而,語音編碼方法或?qū)?yīng)的語音解碼方法不但可以應(yīng)用前面述及的使用多波段激勵(lì)的語音合成/分析方法而且可以應(yīng)用于諸如用正弦合成的這些合成語音的濁音部分以及根據(jù)噪聲信號合成清語音部分的各種不同的語音合成/分析方法。該應(yīng)用也可以應(yīng)用到合理的應(yīng)用領(lǐng)域。也就是本發(fā)明不限于傳輸或記錄/重放,而且能應(yīng)用到音調(diào)轉(zhuǎn)換,語音藥物治療或噪聲抑制。
權(quán)利要求
1一種將在時(shí)間軸上的輸入語音信號劃分成作為單位的(數(shù)據(jù))塊和編碼該結(jié)果信號的語音信號編碼方法,包括使用合成提供的分析以最佳矢量的時(shí)域閉環(huán)檢索作矢量量化的編碼步驟,其中由以多個(gè)閾值限幅高斯噪音所產(chǎn)生的代碼簿用作矢量量化的代碼簿。
2根據(jù)權(quán)利要求1的語音信號編碼方法,其特征是,其中矢量量化的代碼簿是由限幅所說的高斯噪音產(chǎn)生的代碼矢量和用由限幅高斯噪音產(chǎn)生的作為初始值的代碼簿矢量查明所獲得的代碼簿矢量構(gòu)成的。
3一種將在時(shí)間軸上的輸入語音信號劃分成作為單位的(數(shù)據(jù))塊和編碼該結(jié)果信號的語音信號編碼裝置,包括使用合成方法提供的分析用矢量量化最佳矢量的時(shí)域閉環(huán)檢索的編碼裝置,其中用多個(gè)閾值限幅高斯噪聲產(chǎn)生的代碼簿用作矢量量化的代碼簿。
4根據(jù)權(quán)利要求3的語音信號編碼裝置,其特征是,矢量量化的代碼簿是由限幅所說的高斯噪音產(chǎn)生的代碼矢量和使用限幅高斯噪音作為初始值所產(chǎn)生的代碼簿矢量通過查明所獲得的代碼簿矢量所構(gòu)成的。
5一種便攜無線電終端裝置,包括放大輸入語音信號的放大器裝置;對放大后的信號進(jìn)行A/D轉(zhuǎn)換的A/D轉(zhuǎn)換器裝置;語音編碼所說的A/D轉(zhuǎn)換器裝置的輸出的語音編碼裝置;信道解碼所說的編碼信號的傳輸通路編碼裝置;和放大來自D/A轉(zhuǎn)換裝置的信號和提供放大了的信號給天線的調(diào)制裝置;所說的語音編碼裝置還包括使用合成方法提供的分析矢量量化最佳矢量的時(shí)域閉環(huán)檢索的編碼裝置,其中以多種閾值限幅高斯噪音產(chǎn)生的代碼簿用作所說的矢量量化的代碼薄。
全文摘要
一種編碼裝置,其中的輸入語音信號劃分成基本的(數(shù)據(jù))塊并且以編碼結(jié)果的塊作為單位。編碼裝置包括具有噪音代碼簿121和執(zhí)行CELP編碼的編碼單元120,矢量量化代碼簿是由限幅高斯噪音產(chǎn)生的代碼矢量和使用由限幅高斯噪音作為初始值產(chǎn)生的代碼簿矢量通過查明獲得的代碼簿矢量構(gòu)成的。該編碼裝置能對各種語音構(gòu)成作最佳編碼。
文檔編號G10L19/08GK1156872SQ9612197
公開日1997年8月13日 申請日期1996年10月26日 優(yōu)先權(quán)日1995年10月26日
發(fā)明者飯島和幸, 西口正之, 松本淳, 大森士郎 申請人:索尼公司