專利名稱:編碼語音信號的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及ー種用于編碼語音信號的方法和設(shè)備。
背景技術(shù):
為了增加語音信號的壓縮性,可以使用線性預(yù)測、自適應(yīng)碼本和固定碼本搜索技術(shù)。
發(fā)明內(nèi)容
技術(shù)問題本發(fā)明的目的是為了在編碼語音信號中最小化頻譜量化誤差。
技術(shù)解決方案通過提供ー種編碼語音信號的方法能夠?qū)崿F(xiàn)本發(fā)明的目的,其包括根據(jù)第一最佳信息來提取可以被用作與語音信號有關(guān)的最佳譜向量的候選。在本發(fā)明的另一方面中,提供ー種編碼語音信號的方法,其包括根據(jù)第二最佳信息來提取可以被用作與語音信號有關(guān)的最佳自適應(yīng)碼本的候選。在本發(fā)明的另一方面中,提供ー種編碼語音信號的方法,其包括根據(jù)第三最佳信息來提取可以被用作與語音信號有關(guān)的最佳固定碼本的候選。有利效果根據(jù)本發(fā)明的實(shí)施例,基于最佳信息來編碼語音信號的方法是提取最佳編譯參數(shù)的候選,并且通過組合所有的編譯參數(shù)的搜索過程來確定最佳編譯參數(shù)的方法。與逐步最佳方案相比較能夠獲取用于最小化量化誤差的最佳參數(shù),并且可以提高被合成的語音信號的質(zhì)量。另外,本發(fā)明與傳統(tǒng)的各種語音編碼技術(shù)兼容。
圖I是示出合成分析類型(analysis-by-synthesis)的語音編碼器的框圖。圖2是示出根據(jù)本發(fā)明的實(shí)施例的碼激勵(lì)線性預(yù)測(CELP)類型的語音編碼器的結(jié)構(gòu)的框圖。圖3是示出根據(jù)本發(fā)明的實(shí)施例的順序地獲取用于語音信號編碼處理所必要的編譯參數(shù)的處理的圖。圖4是示出根據(jù)本發(fā)明的實(shí)施例的基于最優(yōu)信息,使用被量化的譜候選向量來量化輸入信號的處理的圖。圖5是示出使用第一最佳信息的用于獲取被量化的譜候選向量的處理的圖。圖6是示出根據(jù)本發(fā)明的實(shí)施例的,基于第二最佳信息,使用自適應(yīng)碼本候選來量化輸入信號的處理的圖。圖7是示出根據(jù)本發(fā)明的實(shí)施例的,基于第三最佳信息,使用自適應(yīng)碼本候選來量化輸入信號的處理的圖。
具體實(shí)施例方式根據(jù)本發(fā)明,提供ー種編碼語音信號的方法,該方法包括使用線性預(yù)測從輸入信號獲取當(dāng)前幀的線性預(yù)測濾波器系數(shù);基于第一最佳信息獲取與當(dāng)前幀的線性預(yù)測濾波器系數(shù)相對應(yīng)的當(dāng)前幀的被量化的譜候選向量;以及對當(dāng)前幀的被量化的譜候選向量和之前幀的被量化的譜向量進(jìn)行插值。第一最佳信息可以是關(guān)于在幀單元中提取的碼本索引的數(shù)目的信息。獲取被量化的譜候選向量可以包括將當(dāng)前幀的線性預(yù)測濾波器系數(shù)變換為當(dāng)前幀的譜向量,計(jì)算當(dāng)前幀的譜向量和當(dāng)前幀的碼本之間的誤差;以及考慮誤差和第一最佳信息來提取當(dāng)前幀的碼本索引。 該方法可以進(jìn)一歩包括計(jì)算譜向量和當(dāng)前幀的碼本之間的誤差,并且以誤差的升序的方式排列被量化的碼本向量或者碼本索引??梢砸宰V向量和當(dāng)前幀的碼本之間的誤差的升序來提取當(dāng)前幀的碼本索弓I。與碼本索引相對應(yīng)的被量化的碼本向量可以是當(dāng)前幀的被量化導(dǎo)抗譜頻率候選向量。根據(jù)本發(fā)明,提供一種用于編碼語音信號的設(shè)備,該設(shè)備包括線性預(yù)測分析器200,該線性預(yù)測分析器200被配置為使用線性預(yù)測從輸入信號獲取當(dāng)前幀的線性預(yù)測濾波器系數(shù);以及量化単元210,該量化単元210被配置為基于第一最佳信息量化與當(dāng)前幀的線性預(yù)測濾波器系數(shù)相對應(yīng)的當(dāng)前幀的譜候選向量,并且對當(dāng)前幀的被量化的譜候選向量和之前幀的被量化的譜向量進(jìn)行插值。第一最佳信息可以是關(guān)于在幀單元中提取的碼本索引的數(shù)目的信息。被配置為獲取被量化的譜候選向量的量化単元210可以將當(dāng)前幀的線性預(yù)測濾波器系數(shù)變換為當(dāng)前幀的譜向量,測量當(dāng)前幀的譜向量與當(dāng)前幀的碼本之間的誤差,并且考慮誤差和第一最佳信息來提取碼本索引,并且當(dāng)前幀的碼本可以包括被量化的代碼向量和與被量化的代碼向量相對應(yīng)的碼本索引。量化單元210可以計(jì)算當(dāng)前幀的碼本與譜向量之間的誤差,并且以誤差的升序排列被量化的代碼向量或者碼本索引??梢砸宰V向量和當(dāng)前幀的碼本之間的誤差的升序提取當(dāng)前幀的碼本索弓I。與碼本索引相對應(yīng)的被量化的代碼向量可以是當(dāng)前幀的被量化導(dǎo)抗譜頻率候選向量。圖I是示出合成分析型的語音編碼器的框圖。合成分析方法涉及如下的方法,其比較經(jīng)由語音編碼器合成的信號和原始的輸入信號并且確定語音編碼器的最佳編譯參數(shù)。即,在激勵(lì)信號生成步驟中沒有測量均方差,但是在合成步驟中測量,從而確定最佳編譯參數(shù)。此方法可以被稱為閉路捜索方法。參考圖1,合成分析語音編碼器可以包括激勵(lì)信號生成器100、長期合成濾波器110、以及短期合成濾波器120。另外,根據(jù)建模激勵(lì)信號的方法可以進(jìn)一歩包括加權(quán)濾波器130。激勵(lì)信號生成器100可以根據(jù)長期預(yù)測獲得殘余信號,并且將不具有相關(guān)性的分量最終建模到固定的碼本中。在這樣的情況下,作為在子幀內(nèi)對具有固定的尺寸的脈沖位置進(jìn)行編碼的方法的代數(shù)碼本可以被使用??梢员4娓鶕?jù)脈沖的數(shù)目和碼本存儲器而可以更改的傳輸率。長期合成濾波器110用作生成長期相關(guān)性,其與音調(diào)激勵(lì)信號物理地相關(guān)聯(lián)。使用通過長期預(yù)測或者音調(diào)分析而獲取的延遲值D和增益值gp可以實(shí)現(xiàn)長期合成濾波器110,例如,如等式I中所示。等式I
權(quán)利要求
1.ー種編碼語音信號的方法,所述方法包括 使用線性預(yù)測,從輸入信號來獲取當(dāng)前幀的線性預(yù)測濾波器系數(shù); 基于第一最佳信息來獲取與所述當(dāng)前幀的線性預(yù)測濾波器系數(shù)相對應(yīng)的所述當(dāng)前幀的被量化的譜候選向量;以及 對所述當(dāng)前幀的被量化的譜候選向量和之前幀的被量化的譜向量進(jìn)行插值, 其中,所述第一最佳信息是關(guān)于在幀單元中提取的碼本索引的數(shù)目的信息。
2.根據(jù)權(quán)利要求I所述的方法,其中,獲取所述被量化的譜候選向量包括 將所述當(dāng)前幀的線性預(yù)測濾波器系數(shù)變換為所述當(dāng)前幀的譜向量; 計(jì)算所述當(dāng)前幀的譜向量與所述當(dāng)前幀的碼本之間的誤差;以及 考慮所述誤差和所述第一最佳信息來提取所述當(dāng)前幀的碼本索引, 其中,所述當(dāng)前幀的碼本包括被量化的代碼向量以及與所述被量化的代碼向量相對應(yīng)的碼本索引。
3.根據(jù)權(quán)利要求2所述的方法,進(jìn)ー步包括 計(jì)算所述譜向量和所述當(dāng)前幀的碼本之間的誤差,并且以誤差的升序排列所述被量化的代碼向量或者所述碼本索引。
4.根據(jù)權(quán)利要求3所述的方法,其中,以所述當(dāng)前幀的碼本和所述譜向量之間的誤差的升序來提取所述當(dāng)前幀的碼本索引。
5.根據(jù)權(quán)利要求2所述的方法,其中,與所述碼本索引相對應(yīng)的被量化的代碼向量是所述當(dāng)前幀的被量化導(dǎo)抗譜頻率候選向量。
6.一種用于編碼語音信號的設(shè)備,所述設(shè)備包括 線性預(yù)測分析器,所述線性預(yù)測分析器被配置為使用線性預(yù)測,從輸入信號來獲取當(dāng)前幀的線性預(yù)測濾波器系數(shù);以及 量化単元,所述量化単元被配置為基于第一最佳信息來獲取與所述當(dāng)前幀的線性預(yù)測濾波器系數(shù)相對應(yīng)的所述當(dāng)前幀的被量化的譜候選向量,并且對所述當(dāng)前幀的被量化的譜候選向量和之前幀的被量化的譜向量進(jìn)行插值, 其中,所述第一最佳信息是關(guān)于在幀單元中提取的碼本索引的數(shù)目的信息。
7.根據(jù)權(quán)利要求6所述的設(shè)備,其中,所述量化単元被配置為獲取所述被量化的譜候選向量,將所述當(dāng)前幀的線性預(yù)測過濾器系數(shù)變換為所述當(dāng)前幀的譜向量,測量所述當(dāng)前幀的所述譜向量和所述當(dāng)前幀的碼本之間的誤差,以及考慮所述誤差和所述第一最佳信息來提取碼本索引, 其中,所述當(dāng)前幀的碼本包括被量化的代碼向量以及與所述被量化的代碼向量相對應(yīng)的碼本索引。
8.根據(jù)權(quán)利要求7所述的設(shè)備,其中,所述量化単元計(jì)算所述譜向量和所述當(dāng)前幀的碼本之間的誤差,并且以誤差的升序來排列所述被量化的代碼向量或者所述碼本索引。
9.根據(jù)權(quán)利要求8所述的設(shè)備,其中,以所述當(dāng)前幀的碼本和所述譜向量之間的誤差的升序來提取所述當(dāng)前幀的碼本索引。
10.根據(jù)權(quán)利要求7所述的設(shè)備,其中,與所述碼本索引相對應(yīng)的被量化的代碼向量是所述當(dāng)前幀的被量化導(dǎo)抗譜頻率候選向量。
全文摘要
根據(jù)本發(fā)明,使用線性預(yù)測從輸入信號獲取當(dāng)前幀的線性預(yù)測濾波器系數(shù),基于第一最佳信息獲取與當(dāng)前幀的線性預(yù)測濾波器系數(shù)相對應(yīng)的當(dāng)前幀的被量化的譜候選向量,并且對當(dāng)前幀的被量化的譜候選向量和之前幀的被量化的譜向量進(jìn)行插值。因此,與傳統(tǒng)的相位優(yōu)化技術(shù)相比較,能夠獲得最小化量化誤差的最佳參數(shù)。
文檔編號G10L19/08GK102656629SQ201080056249
公開日2012年9月5日 申請日期2010年12月10日 優(yōu)先權(quán)日2009年12月10日
發(fā)明者丁奎赫, 姜泓求, 李炳錫, 李珉基, 田惠晶, 金大煥, 金洛榕 申請人:Lg電子株式會社, 延世大學(xué)工業(yè)學(xué)術(shù)合作社