一種用于語音編碼的固定碼本快速搜索算法的制作方法

文檔序號：2821208閱讀：298來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：一種用于語音編碼的固定碼本快速搜索算法的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種用于語音編碼的固定碼本快速搜索算法，屬于電話通信中的語音編解碼技術(shù)領(lǐng)域。
背景技術(shù)：
在移動通信中，語音編解碼器被稱為聲碼器，一般采用數(shù)字信號處理器(DSP，digital signal processor)來實現(xiàn)。由于在移動通信系統(tǒng)中對聲碼器的需求較大(比如基站系統(tǒng))，提高語音編碼算法的執(zhí)行效率，從而降低系統(tǒng)成本和體積尤為重要。
TIA/EIA/IS-127標(biāo)準(zhǔn)是第三代移動通信系統(tǒng)CDMA2000 1X系統(tǒng)采用的語音編碼標(biāo)準(zhǔn)。它采用的增強(qiáng)可變速率語音編解碼器(EVRC，Enhanced VariableRate Codec)具有可變速率和話音質(zhì)量高的特點。它采用的語音幀時間長度為20ms，根據(jù)每幀的噪聲情況不同分別采用三種不同的速率進(jìn)行編碼輸出全速率、1/2速率和1/8速率。該增強(qiáng)可變速率語音編解碼器是由濾波、噪聲去除、模型參數(shù)估計、編碼速率判決、參數(shù)編碼(包含了線譜對加權(quán)矢量量化模塊)以及解碼六個模塊構(gòu)成。EVRC算法的復(fù)雜度約為30MIPS(million instructionper second)，即每秒3千萬條指令，比較復(fù)雜。
EVRC算法基本原理是用自適應(yīng)碼本中的碼字矢量來逼近語音的基音，用固定碼本中的碼字矢量來逼近語音的經(jīng)過短時、長時預(yù)測后的余量信號。再從這兩個碼本中搜索出來的最佳碼字矢量，分別乘以各自的最佳增益后相加，其和就是激勵信號源，激勵信號源通過合成濾波器得到合成語音。最佳合成激勵信號源用分析合成方法來確定，使得原始語音和合成語音之間的均方加權(quán)誤差最小。
EVRC算法對輸入的語音幀首先進(jìn)行高通濾波，去掉直流和過低頻率的信號。對高通濾波后的語音幀需要去除噪聲，改善語音信號質(zhì)量。再對去除噪聲的語音信號計算10個線性預(yù)測系數(shù)(LPC，Linear predictive coefficient)，以及將該LPC系數(shù)轉(zhuǎn)換為10個線譜對(LSP，line spectrum pairs)參數(shù)。然后對線譜對LSP參數(shù)進(jìn)行加權(quán)矢量量化。最后進(jìn)行參數(shù)編碼。有三種編碼速率全速率、1/2速率、1/8速率。在參數(shù)編碼模塊中，全速率時，對模型參數(shù)估計模塊得到的頻譜過渡指示標(biāo)志、基音延遲及其差分延遲分別進(jìn)行編碼，而在1/2速率時，僅對基音延遲編碼。在1/8速率時僅需將線譜對量化索引和語音幀能量的增益編碼。對于全速率和1/2速率的情況，還需要進(jìn)一步將語音幀劃分為3個子幀，對每一子幀進(jìn)行如下處理從EVRC的自適應(yīng)碼本和固定碼本中各自搜索得到每一子幀的最佳碼字矢量，并進(jìn)一步得到各自的最佳增益，將每一子幀的自適應(yīng)碼本增益和固定碼本增益以及對應(yīng)的最佳碼字矢量的索引編碼。
目前，在EVRC算法中規(guī)定的全速率下固定碼本的最佳碼字矢量搜索算法如下固定碼本矢量包含55個分量，被劃分為5個軌道，每個軌道有11個分量，在該5個軌道上，僅有8個分量是非零單位脈沖(每個脈沖包括位置和正負(fù)符號)，其余分量為零。這8個非零脈沖的位置和符號的不同排列構(gòu)成不同的碼字矢量，進(jìn)而可以得到合成語音，通過判斷合成語音和原始輸入語音之間的加權(quán)均方誤差是否最小的判斷準(zhǔn)則，可以判斷采用上述方法所得到的碼字矢量是否最佳。在該5個軌道中，有3個軌道各自分別包含2個非零脈沖，即這3個軌道中的每個軌道要搜索2次；其余兩個軌道各自分別包含1個非零脈沖，即這兩個軌道中的每個軌道搜索1次。包含單脈沖的兩個軌道可能是第4、5軌道、或第5、1軌道、或第1、2軌道、或第2、3軌道。
為了搜索最佳碼字矢量，需要對8個脈沖的所有可能的位置和符號的組合都進(jìn)行搜索，但是這樣做的運算量非常龐大。為了減少了搜索運算量，EVRC算法采用了局部搜索算法。該局部搜索算法采用四次迭代循環(huán)，每次迭代循環(huán)又包含四個子迭代循環(huán)；每次迭代循環(huán)搜索可以得到一個候選最佳碼字矢量，然后比較這些候選最佳碼字矢量，并從其中得到最佳碼字矢量。例如在第一次迭代循環(huán)中假設(shè)包含單脈沖的軌道是第4、5軌道，再分別假設(shè)包含單脈沖的軌道是第5、1軌道、或第1、2軌道、或第2、3軌道，重復(fù)進(jìn)行3次迭代；且每次迭代循環(huán)時，將8個脈沖分成4對，每個子迭代循環(huán)只順序確定其中一對脈沖的位置。從數(shù)學(xué)分析的角度來看，EVRC算法是將在8個待搜索脈沖構(gòu)成的8維空間內(nèi)的搜索分解為在4個二維空間內(nèi)的搜索。在EVRC算法中規(guī)定的最佳碼字矢量搜索的具體過程如下(1)首先假設(shè)包含單脈沖的軌道是在第4、5軌道，其余軌道各自存在兩個脈沖。
(2)在第1和第2軌道上分別確定第1、2個脈沖位置。由于EVRC算法事先采用了預(yù)測算法，確定第1個脈沖可能的位置減少到6種，而第2個脈沖仍舊有11種可能的位置。因此確定第1、2個脈沖位置采用一個迭代的循環(huán)，此時搜索的碼字矢量次數(shù)是6×11＝66。
(3)在第3和第4軌道上分別確定第3、4個脈沖位置。此時搜索的碼字矢量次數(shù)同上，仍為66。
(4)在第5和第1軌道上分別確定第5、6個脈沖位置。此時搜索的碼字矢量次數(shù)同上，仍為66。
(5)在第2和第3軌道上分別確定第7、8個脈沖位置。此時搜索的碼字矢量次數(shù)同上，仍為66。
(6)通過上述步驟(2)到(5)，確定8個脈沖位置，得到假設(shè)單脈沖軌道在當(dāng)前軌道時的候選最佳碼書矢量。
(7)假設(shè)包含單脈沖的軌道分別是第5、1軌道，類似地重復(fù)步驟(2)-(6)，碼字矢量的搜索次數(shù)仍舊同上。
(8)假設(shè)包含單脈沖的軌道分別是第1、2軌道，類似地重復(fù)步驟(2)-(6)，碼字矢量的搜索次數(shù)仍舊同上。
(9)假設(shè)包含單脈沖的軌道分別是第2、3軌道，類似地重復(fù)步驟(2)-(6)，碼字矢量的搜索次數(shù)仍舊同上。
(10)以上述步驟得到的四種候選最佳碼字矢量進(jìn)一步可以得到合成語音，再通過判斷四個合成語音和原始輸入語音之間的加權(quán)均方誤差是否最小來確定最佳碼字矢量。
(11)至此，每一子幀的固定碼本的最佳碼字矢量搜索次數(shù)為4×4×66＝1056個。每一幀的固定碼本的最佳碼字矢量搜索次數(shù)為3×1056＝3168個。
在1/2速率，固定碼本搜索情況也如同上述，但是全速率下固定碼本的搜索最費時間，極需優(yōu)化，已經(jīng)成為業(yè)內(nèi)人士相當(dāng)關(guān)注的一個課題。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種用于語音編碼的固定碼本快速搜索算法，該方法是在全速率情況下針對固定碼本的搜索問題提出的一種快速搜索算法，能夠降低EVRC算法的復(fù)雜度，在全速率時理論上可以使搜索時間減少到原來的25.8％，大大提高效率；并且優(yōu)化后的音質(zhì)基本不變，符合相應(yīng)的TIA/EIA/IS-718測試標(biāo)準(zhǔn)，從而降低硬件系統(tǒng)的實現(xiàn)成本和體積。
本發(fā)明的目的是這樣實現(xiàn)的一種用于語音編碼的固定碼本快速搜索算法，該固定碼本是由55個分量的碼字矢量的一個集合所組成；其特征在于在全速率情況下，進(jìn)行四次迭代循環(huán)搜索，每次迭代循環(huán)搜索后得到一個候選最佳碼字矢量，再由該四個候選最佳碼字矢量分別進(jìn)一步得到四個合成語音，最后判斷該四個合成語音和原始輸入語音之間的加權(quán)均方誤差為最小的候選最佳碼字矢量為最佳碼字矢量。
所述每次迭代循環(huán)搜索得到一個候選最佳碼字矢量的具體步驟是每次迭代循環(huán)搜索時，順序地在每個軌道中分別逐個確定8個脈沖中的每個脈沖的位置；即每次順序地在一個軌道中確定一個脈沖位置，確定每個脈沖位置時不采用迭代循環(huán)。
所述四次迭代循環(huán)搜索中的第一次迭代循環(huán)中假設(shè)包含單脈沖的軌道是第4、5軌道，其余軌道各自存在兩個脈沖；其余三次迭代循環(huán)搜索中，分別假設(shè)包含單脈沖的軌道是第5、1軌道、第1、2軌道和第2、3軌道。
該方法的具體操作步驟如下(A)先假設(shè)包含單脈沖的軌道分別在第4、5軌道，其余軌道各自存在兩個脈沖的情況下，進(jìn)行第一次迭代循環(huán)搜索，得到假設(shè)單脈沖軌道在4、5軌道時的候選最佳碼字矢量，其搜索次數(shù)為4×(6+11)＝68；(B)假設(shè)包含單脈沖的軌道分別在第5、1軌道，其余軌道各自存在兩個脈沖的情況下，進(jìn)行第二次迭代循環(huán)搜索，得到假設(shè)單脈沖軌道在5、1軌道時的候選最佳碼字矢量，其搜索次數(shù)為4×(6+11)＝68；(C)假設(shè)包含單脈沖的軌道分別在第1、2軌道，其余軌道各自存在兩個脈沖的情況下，進(jìn)行第三次迭代循環(huán)搜索，得到假設(shè)單脈沖軌道在1、2軌道時的候選最佳碼字矢量，其搜索次數(shù)為4×(6+11)＝68；(D)假設(shè)包含單脈沖的軌道分別在第2、3軌道，其余軌道各自存在兩個脈沖的情況下，進(jìn)行第四次迭代循環(huán)搜索，得到假設(shè)單脈沖軌道是在2、3軌道時的候選最佳碼字矢量，其搜索次數(shù)為4×(6+11)＝68；(E)由上述四個候選最佳碼字矢量分別進(jìn)一步得到四個合成語音，再判斷該四個合成語音和原始輸入語音之間的加權(quán)均方誤差為最小的候選最佳碼字矢量為最佳碼字矢量；這樣，每一子幀的固定碼本的最佳碼字矢量搜索次數(shù)為4×4×(6+11)＝272個；每一幀的固定碼本的最佳碼字矢量搜索次數(shù)為3×272＝816。
該方法的步驟A的具體操作方法如下(1)在第1軌道確定第1個脈沖位置，因為增強(qiáng)可變速率語音編解碼器EVRC算法事先采用了預(yù)測算法，該第1個脈沖的位置有6種可能，因此本次搜索的碼字矢量次數(shù)是6；(2)在第2軌道確定第2個脈沖位置，該第2個脈沖的位置有11種可能，因此本次搜索的碼字矢量次數(shù)是11；
(3)在第3軌道確定第3個脈沖位置，因為EVRC算法事先采用了預(yù)測算法，該第3個脈沖可能的位置為6種，因此本次搜索的碼字矢量次數(shù)是6；(4)在第4軌道確定第4個脈沖位置，該第4個脈沖的位置有11種可能，因此本次搜索的碼字矢量次數(shù)是11；(5)在第5軌道確定第5個脈沖位置，因為EVRC算法事先采用了預(yù)測算法，該第5個脈沖的位置有6種可能，因此本次搜索的碼字矢量次數(shù)是6；(6)在第1軌道確定第6個脈沖位置，該第6個脈沖的位置有11種可能，因此本次搜索的碼字矢量次數(shù)是11；(7)在第2軌道確定第7個脈沖位置，因為EVRC算法事先采用了預(yù)測算法，該第7個脈沖的位置可能有6種，因此本次搜索的碼字矢量次數(shù)是6；(8)在第3軌道確定第8個脈沖位置，該第8個脈沖的位置有11種可能，因此本次搜索的碼字矢量次數(shù)是11；(9)藉由上述步驟(1)-(8)的第一次迭代循環(huán)搜索，得到假設(shè)單脈沖軌道是在4、5軌道時的候選最佳碼字矢量，其搜索次數(shù)為4×(6+11)＝68；該方法的步驟B、C、D的第二、三、四次迭代循環(huán)搜索具體操作方法類似于步驟A的第一次迭代循環(huán)搜索，都是在假設(shè)包含單脈沖的軌道中進(jìn)行一次搜索，而在包含兩個脈沖的軌道中進(jìn)行兩次搜索，其區(qū)別只是具體的軌道序號有所不同。
本發(fā)明是在全速率情況下針對固定碼本的搜索問題提出的一種快速搜索算法，具有下列優(yōu)點首先是提高了搜索效率，采用本發(fā)明的快速搜索算法后，在全速率時每幀語音的固定碼本的最佳碼字矢量搜索個數(shù)由原來的3168個減少到816個，優(yōu)化后的搜索個數(shù)大約是原來的25.8％，大大提高效率。如果在全速率情況下，本發(fā)明的算法和原算法都用C代碼浮點實現(xiàn)，則前者的搜索次數(shù)只是后者的搜索次數(shù)的33.2％。在全速率時，本發(fā)明的算法使復(fù)雜度減少約3×1.264＝3.8MIPS。此外，采用本發(fā)明算法優(yōu)化后的通話語音音質(zhì)與原來算法的音質(zhì)基本保持不變，符合專門用于測試各廠家研發(fā)的EVRC算法是否符合相關(guān)要求的TIA/EIA/IS-718測試標(biāo)準(zhǔn)。實踐表明，本發(fā)明算法是一個簡便而實用的算法，具有很好的應(yīng)用前景和比較顯著的經(jīng)濟(jì)效益。

圖1是本發(fā)明固定碼本快速搜索算法的一實施例流程方框圖。
具體實施例方式
本發(fā)明是一種用于語音編碼的固定碼本快速搜索算法，語音編碼時要進(jìn)行固定碼本搜索，而固定碼本是由55個分量的碼字矢量的一個集合所組成。該方法的機(jī)理是先按照最小距離準(zhǔn)則在距離碼本及其位置索引中搜索與待量化矢量距離最小的碼字矢量，得到一個初步搜索結(jié)果，再在該初步搜索結(jié)果的一定范圍內(nèi)，用加權(quán)最小距離準(zhǔn)則進(jìn)行搜索，得到最終搜索結(jié)果，即最佳量化矢量。
本發(fā)明具體方法是在全速率情況下，進(jìn)行四次迭代循環(huán)搜索，每次迭代循環(huán)搜索后得到一個候選最佳碼字矢量，再由該四個候選最佳碼字矢量分別進(jìn)一步得到四個合成語音，最后判斷該四個合成語音和原始輸入語音之間的加權(quán)均方誤差為最小的候選最佳碼字矢量為最佳碼字矢量。其中每次迭代循環(huán)搜索得到一個候選最佳碼字矢量的具體步驟是每次迭代循環(huán)搜索時，將8個脈沖分拆成8個，每次順序地只在一個軌道中確定一個脈沖位置，即確定每個脈沖位置時不采用迭代循環(huán)。從數(shù)學(xué)分析的角度來看，本發(fā)明的改進(jìn)算法是將由8個待搜索脈沖構(gòu)成的8維空間先分解為4個二維空間。每個二維空間又進(jìn)一步分解為兩個一維空間，然后分別在8個一維空間搜索脈沖。圖1具體展示了一實施例流程方框圖。參見圖1，圖中所示的第一次迭代循環(huán)中假設(shè)包含單脈沖的軌道是第4、5軌道，其余軌道各自存在兩個脈沖；其余三次迭代循環(huán)搜索中，分別假設(shè)包含單脈沖的軌道是第5、1軌道、第1、2軌道和第2、3軌道。經(jīng)過上述四次迭代循環(huán)搜索(每次迭代循環(huán)搜索次數(shù)為4×(6+11)＝68)得到述四個候選最佳碼字矢量，再由該四個候選最佳碼字矢量分別得到四個合成語音，最后判斷該四個合成語音和原始輸入語音之間的加權(quán)均方誤差為最小的候選最佳碼字矢量為最佳碼字矢量。這樣，每一子幀的固定碼本的最佳碼字矢量搜索次數(shù)為4×4×(6+11)＝272個；每一幀的固定碼本的最佳碼字矢量搜索次數(shù)為3×272＝816。
本發(fā)明的方法可以用于第三代移動通信系統(tǒng)CDMA2000 1X系統(tǒng)采用的EVRC聲碼器，也可以用于其它適用該固定碼本快速搜索算法的語音編碼算法。
本發(fā)明已經(jīng)在用單片數(shù)字信號處理器DSP(芯片型號為TMS320C6211，主頻150MHZ)實現(xiàn)的包含本發(fā)明固定碼本快速算法模塊的EVRC優(yōu)化聲碼器上進(jìn)行實施試驗和測試。測試結(jié)果表明，采用本發(fā)明算法優(yōu)化后，在全速率時每幀語音的固定碼本的最佳碼字矢量搜索個數(shù)由原來的3168個減少到816個，優(yōu)化后的搜索個數(shù)大約是原來的25.8％，與原來的相比效率得到較大提高。采用本發(fā)明快速搜索算法后的全速率下快速搜索算法和原算法如果都用C代碼浮點實現(xiàn)，則發(fā)現(xiàn)前者的搜索次數(shù)是后者的搜索次數(shù)的33.2％。全速率下快速搜索算法可使復(fù)雜度減少約3×1.264＝3.8MIPS。實踐表明，該快速搜索算法是一個簡便的算法，具有比較顯著的降低成本和縮小系統(tǒng)體積的很好效果。
此外，還對實施例進(jìn)行了音質(zhì)測試，其結(jié)果如下1、測試用的原始語音為EVRC算法附帶的一段標(biāo)準(zhǔn)測試數(shù)據(jù)樣本(該段數(shù)據(jù)持續(xù)時長為4660ms，采用8000HZ采樣率，經(jīng)過μ律壓擴(kuò)，內(nèi)容為The thinthimble to my mad，she said she is dolman.)，將該原始語音分別采用優(yōu)化前后的算法進(jìn)行編解碼。對解碼結(jié)果經(jīng)多人聽覺實驗證實，優(yōu)化前后解碼音質(zhì)沒有明顯的區(qū)別，失真較小。
2、采用ITU-T P.862標(biāo)準(zhǔn)對上述原始語音的兩種解碼結(jié)果(與原始語音進(jìn)行比較來)進(jìn)行音質(zhì)測試發(fā)現(xiàn)，在一次編解碼的情況下本發(fā)明快速搜索算法的音質(zhì)與原來算法的語音質(zhì)量基本不變(相差為0.062，可以忽略)。在二次編解碼(級聯(lián))的情況下，本發(fā)明算法的語音質(zhì)量基本不變(相差為0.011，可以忽略)。
3、本發(fā)明的快速搜索算法用EVRC算法附帶的其它標(biāo)準(zhǔn)測試數(shù)據(jù)樣本來檢驗，效果也比較好，通過了TIA/EIA/IS-718測試標(biāo)準(zhǔn)的測試。
權(quán)利要求
1.一種用于語音編碼的固定碼本快速搜索算法，該固定碼本是由55個分量的碼字矢量的一個集合所組成；其特征在于在全速率情況下，進(jìn)行四次迭代循環(huán)搜索，每次迭代循環(huán)搜索后得到一個候選最佳碼字矢量，再由該四個候選最佳碼字矢量分別進(jìn)一步得到四個合成語音，最后判斷該四個合成語音和原始輸入語音之間的加權(quán)均方誤差為最小的候選最佳碼字矢量為最佳碼字矢量。
2.根據(jù)權(quán)利要求1所述的固定碼本快速搜索算法，其特征在于所述每次迭代循環(huán)搜索得到一個候選最佳碼字矢量的具體步驟是每次迭代循環(huán)搜索時，順序地在每個軌道中分別逐個確定8個脈沖中的每個脈沖的位置；即每次順序地在一個軌道中確定一個脈沖位置，確定每個脈沖位置時不采用迭代循環(huán)。
3.根據(jù)權(quán)利要求1所述的固定碼本快速搜索算法，其特征在于所述四次迭代循環(huán)搜索中的第一次迭代循環(huán)中假設(shè)包含單脈沖的軌道是第4、5軌道，其余軌道各自存在兩個脈沖；其余三次迭代循環(huán)搜索中，分別假設(shè)包含單脈沖的軌道是第5、1軌道、第1、2軌道和第2、3軌道。
4.根據(jù)權(quán)利要求1或3所述的固定碼本快速搜索算法，其特征在于該方法的具體操作步驟如下(A)先假設(shè)包含單脈沖的軌道分別在第4、5軌道，其余軌道各自存在兩個脈沖的情況下，進(jìn)行第一次迭代循環(huán)搜索，得到假設(shè)單脈沖軌道在4、5軌道時的候選最佳碼字矢量，其搜索次數(shù)為4×(6+11)＝68；(B)假設(shè)包含單脈沖的軌道分別在第5、1軌道，其余軌道各自存在兩個脈沖的情況下，進(jìn)行第二次迭代循環(huán)搜索，得到假設(shè)單脈沖軌道在5、1軌道時的候選最佳碼字矢量，其搜索次數(shù)為4×(6+11)＝68；(C)假設(shè)包含單脈沖的軌道分別在第1、2軌道，其余軌道各自存在兩個脈沖的情況下，進(jìn)行第三次迭代循環(huán)搜索，得到假設(shè)單脈沖軌道在1、2軌道時的候選最佳碼字矢量，其搜索次數(shù)為4×(6+11)＝68；(D)假設(shè)包含單脈沖的軌道分別在第2、3軌道，其余軌道各自存在兩個脈沖的情況下，進(jìn)行第四次迭代循環(huán)搜索，得到假設(shè)單脈沖軌道是在2、3軌道時的候選最佳碼字矢量，其搜索次數(shù)為4×(6+11)＝68；(E)由上述四個候選最佳碼字矢量分別進(jìn)一步得到四個合成語音，再判斷該四個合成語音和原始輸入語音之間的加權(quán)均方誤差為最小的候選最佳碼字矢量為最佳碼字矢量；這樣，每一子幀的固定碼本的最佳碼字矢量搜索次數(shù)為4×4×(6+11)＝272個；每一幀的固定碼本的最佳碼字矢量搜索次數(shù)為3×272＝816。
5.根據(jù)權(quán)利要求4所述的固定碼本快速搜索算法，其特征在于該方法的步驟A的具體操作方法如下(1)在第1軌道確定第1個脈沖位置，因為增強(qiáng)可變速率語音編解碼器EVRC算法事先采用了預(yù)測算法，該第1個脈沖的位置有6種可能，因此本次搜索的碼字矢量次數(shù)是6；(2)在第2軌道確定第2個脈沖位置，該第2個脈沖的位置有11種可能，因此本次搜索的碼字矢量次數(shù)是11；(3)在第3軌道確定第3個脈沖位置，因為EVRC算法事先采用了預(yù)測算法，該第3個脈沖可能的位置為6種，因此本次搜索的碼字矢量次數(shù)是6；(4)在第4軌道確定第4個脈沖位置，該第4個脈沖的位置有11種可能，因此本次搜索的碼字矢量次數(shù)是11；(5)在第5軌道確定第5個脈沖位置，因為EVRC算法事先采用了預(yù)測算法，該第5個脈沖的位置有6種可能，因此本次搜索的碼字矢量次數(shù)是6；(6)在第1軌道確定第6個脈沖位置，該第6個脈沖的位置有11種可能，因此本次搜索的碼字矢量次數(shù)是11；(7)在第2軌道確定第7個脈沖位置，因為EVRC算法事先采用了預(yù)測算法，該第7個脈沖的位置可能有6種，因此本次搜索的碼字矢量次數(shù)是6；(8)在第3軌道確定第8個脈沖位置，該第8個脈沖的位置有11種可能，因此本次搜索的碼字矢量次數(shù)是11；(9)藉由上述步驟(1)-(8)的第一次迭代循環(huán)搜索，得到假設(shè)單脈沖軌道是在4、5軌道時的候選最佳碼字矢量，其搜索次數(shù)為4×(6+11)＝68；
6.根據(jù)權(quán)利要求4或3所述的固定碼本快速搜索算法，其特征在于該方法的步驟B、C、D的第二、三、四次迭代循環(huán)搜索具體操作方法類似于步驟A的第一次迭代循環(huán)搜索，都是在假設(shè)包含單脈沖的軌道中進(jìn)行一次搜索，而在包含兩個脈沖的軌道中進(jìn)行兩次搜索，其區(qū)別只是具體的軌道序號有所不同。
全文摘要
一種用于語音編碼的固定碼本快速搜索算法，是在全速率情況下，進(jìn)行四次迭代循環(huán)搜索，每次迭代循環(huán)搜索后得到一個候選最佳碼字矢量，再由該四個候選最佳碼字矢量分別進(jìn)一步得到四個合成語音，最后判斷該四個合成語音和原始輸入語音之間的加權(quán)均方誤差為最小的候選最佳碼字矢量為最佳碼字矢量。每次迭代循環(huán)搜索的具體步驟是順序地在每個軌道中分別逐個確定8個脈沖中的每個脈沖的位置；即每次順序地在一個軌道中確定一個脈沖位置，確定每個脈沖位置時不采用迭代循環(huán)。該方法降低了EVRC算法的復(fù)雜度，在全速率時可以使搜索時間減少到原來的25.8％，大大提高效率；并且優(yōu)化后的音質(zhì)基本不變，符合相應(yīng)的TIA/EIA/IS－718測試標(biāo)準(zhǔn)，能夠降低硬件系統(tǒng)的實現(xiàn)成本和體積。
文檔編號G10L19/04GK1547193SQ200310117069
公開日2004年11月17日申請日期2003年12月3日優(yōu)先權(quán)日2003年12月3日
發(fā)明者王波濤, 翟文軍, 段世平, 傅宇玲, 隋進(jìn)國申請人:北京首信股份有限公司

完整全部詳細(xì)技術(shù)資料下載