專(zhuān)利名稱(chēng):用于對(duì)語(yǔ)音信號(hào)lpc系數(shù)進(jìn)行多級(jí)矢量量化的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語(yǔ)音編碼領(lǐng)域,更具體地,本發(fā)明涉及基于線性預(yù)測(cè)編碼(LPC)類(lèi)的語(yǔ)音編碼技術(shù)。
背景技術(shù):
在語(yǔ)音編碼壓縮中,通常用LPC系數(shù)表征語(yǔ)音的短時(shí)譜包絡(luò),對(duì)其高效量化是語(yǔ)音編碼中一個(gè)關(guān)鍵性問(wèn)題。由于LPC系數(shù)的動(dòng)態(tài)范圍比較大,出于合成濾波器穩(wěn)定性和量化效率的考慮,LPC系數(shù)通常被轉(zhuǎn)換為在數(shù)學(xué)上完全等價(jià)的其它形式的參數(shù)后再量化,通常的表示形式為導(dǎo)抗譜頻率系數(shù)(ISF)或線譜頻率參數(shù)(LSF)。LSF作為L(zhǎng)PC系數(shù)的一種頻域參數(shù),由于其具有更好的量化和插值特性,語(yǔ)音編碼端常將LPC系數(shù)轉(zhuǎn)換為L(zhǎng)SF系數(shù),然后再將LSF系數(shù)進(jìn)行量化,語(yǔ)音解碼端進(jìn)行逆量化得到量化后的LSF參數(shù),并將LSF參數(shù)再轉(zhuǎn)換為L(zhǎng)PC系數(shù),因此LSF在基于LPC語(yǔ)音編碼中得到了廣泛的應(yīng)用。
由于矢量量化在相同的編碼比特?cái)?shù)下能獲得比標(biāo)量量化更低的量化失真,因此對(duì)LSF系數(shù)量化的研究主要集中在矢量量化上,參見(jiàn)Gardner W R等人發(fā)表于IEEE Transactions on Speech and Audio Processing, 1995. 3 (5) :367 381 的論文 Theoretical analysis of the high-rate vector quantization of LPC parameters。目前LPCi吾音編碼中的矢量量化技術(shù)主要存在以下缺陷第一,將高維LSF系數(shù)作為一個(gè)矢量進(jìn)行整體量化的方法并不可行,其存在存儲(chǔ)量大、搜索運(yùn)算復(fù)雜、難以實(shí)現(xiàn)的問(wèn)題。第二,對(duì)于其他次優(yōu)矢量量化算法一般都基于LBG等聚類(lèi)訓(xùn)練算法得到矢量量化器,雖然適合對(duì)任何概率分布的源信號(hào)進(jìn)行高效量化,但其需要大量的存儲(chǔ)空間存儲(chǔ)矢量碼本(一般隨量化比特?cái)?shù)和矢量的維數(shù)成指數(shù)增長(zhǎng)),運(yùn)算復(fù)雜度高、存儲(chǔ)空間大。常見(jiàn)的次優(yōu)矢量量化算法例如多級(jí)矢量量化(可參見(jiàn) LeBlance W P 等人發(fā)表于 IEEE Transactions on Speech and Audio Processing, 1993.1 (4) : 373 385 的論文 Efficient search and design procedures for robust mult1-stage VQ of LPC parameters for4Kb/s speech coding.和周高洪等人發(fā)表于電子技術(shù)應(yīng)用,2005. 6:4擴(kuò)51的論文一種增強(qiáng)的LPC參數(shù)多級(jí)矢量量化技術(shù))、分裂矢量量化(了參見(jiàn) Paliwal K. K 等人發(fā)表于 IEEE Transactions on Speech and Audio Processing, 1993.1 (I) : 3 14 的論文Efficient vector quantization of LPC parameters at24bit/frame和李靚等人發(fā)表于北京工業(yè)大學(xué)學(xué)報(bào),2005. 3,Vol. 31,No2:130^135的論文一種高效、低存儲(chǔ)的線譜頻率參數(shù)矢量量化器件)等。
2003年Subramaniam提出的基于GMM模型的線譜頻率(LSF)參數(shù)量化算法 (具體可見(jiàn) Subramaniam A. D 和 Rao B. D.發(fā)表于 IEEE Transactions on Speech and Audio Processing, 2003. 11 (2):130 142 的論文 PDF optimized parametric vector quantization of speech line spectral frequencies),其基本思想是利用高斯混合模型將輸入的LSF矢量分成屬于不同高斯分布的M個(gè)聚類(lèi),然后針對(duì)每個(gè)高斯聚類(lèi)設(shè)計(jì)量化器實(shí)現(xiàn)對(duì)該高斯聚類(lèi)信號(hào)的量化。但是,這種算法是基于標(biāo)量量化器的,從理論上來(lái)說(shuō)標(biāo)量量化在相同的比特?cái)?shù)的情況下,其量化性能是次于矢量量化的,而且其量化算法需要將輸入的矢量通過(guò)KLT (Karhunen-Leove變換)轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布,隨著輸入矢量的維數(shù)增加, 其變換的運(yùn)算復(fù)雜度將急劇增加。發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問(wèn)題在于,針對(duì)現(xiàn)有技術(shù)的量化性能低、運(yùn)算復(fù)雜度高、存儲(chǔ)空間大等問(wèn)題中的至少一些缺陷,提供以下技術(shù)方案。
根據(jù)本發(fā)明的第一方面,提供了用于對(duì)語(yǔ)音信號(hào)LPC系數(shù)進(jìn)行多級(jí)矢量量化的方法,其包括通過(guò)等效變換,將LPC系數(shù)轉(zhuǎn)換為一等價(jià)表達(dá),并對(duì)該等價(jià)表達(dá)進(jìn)行第一級(jí)矢量量化,得到相應(yīng)的第一級(jí)量化索引和第一級(jí)量化殘差;基于GMM模型,對(duì)第一級(jí)量化殘差進(jìn)行模型聚類(lèi)分割,得到相應(yīng)的GMM聚類(lèi)索引;基于GMM聚類(lèi)索引,對(duì)第一級(jí)量化殘差進(jìn)行第二級(jí)矢量量化,得到相應(yīng)的第二級(jí)矢量索引;以及將經(jīng)歷進(jìn)一步編碼處理的第一級(jí)量化索引、GMM聚類(lèi)索引、及第二級(jí)矢量索引傳到解碼端。
在一個(gè)優(yōu)選實(shí)施例中,LPC系數(shù)的等價(jià)表達(dá)可以是LSF或者ISF系數(shù)中的一種。進(jìn)一步地,第一級(jí)矢量量化可選自多級(jí)矢量量化、分裂矢量量化或混合矢量量化其中一種。優(yōu)選地,第一級(jí)矢量量化進(jìn)一步包含兩次矢量量化,第一次矢量量化采用隨機(jī)矢量碼本對(duì)信號(hào)進(jìn)行矢量量化,第二次矢量量化將第一次矢量量化的殘差分裂為N維矢量,然后按照第一次矢量量化的量化方式處理N維矢量,得到第一級(jí)量化索引和第一級(jí)量化殘差。
在一個(gè)優(yōu)選實(shí)施例中,在模型聚類(lèi)分割中,將第一級(jí)量化殘差進(jìn)行高斯格型量化, 得到針對(duì)GMM模型各種情況的多個(gè)格矢量,以及基于GMM模型及多個(gè)格矢量,將第一級(jí)量化殘差聚類(lèi)分割到某一 GMM聚類(lèi),并確定GMM聚類(lèi)索引。進(jìn)一步地,第一級(jí)量化殘差聚類(lèi)分割的方法包括全局搜索法。優(yōu)選地,高斯格型量化包括歸一化的步驟,并且歸一化后的矢量量化為RE8、Z8、Z16、D8、D16格矢量中的一種。
在一個(gè)優(yōu)選實(shí)施例中,所述高斯格型量化還包括歸一化的步驟,通過(guò)下式實(shí)現(xiàn)所述歸一化_ χ-μ;[麵]y=7T
其中X為高斯模型的輸入矢量,Ui為第i個(gè)高斯模型的均值矢量,^為第1個(gè)高斯模型的方差矢量。
在優(yōu)選實(shí)施例中,對(duì)第一級(jí)量化殘差進(jìn)行模型聚類(lèi)分割的方法可選自全局搜索法、矢量量化法或后驗(yàn)概率計(jì)算法中的一種。
根據(jù)本發(fā)明的第二方面,提供了用于對(duì)語(yǔ)音信號(hào)LPC系數(shù)進(jìn)行多級(jí)矢量量化的系統(tǒng),其包括等效變換器,其將LPC系數(shù)轉(zhuǎn)換為一等價(jià)表達(dá);耦合到等價(jià)變換器的第一級(jí)矢量量化器,其接收等價(jià)表達(dá)并對(duì)等價(jià)表達(dá)進(jìn)行第一級(jí)矢量量化,得到相應(yīng)的第一級(jí)量化索引和第一級(jí)量化殘差;耦合到第一級(jí)矢量量化器的GMM模型聚類(lèi)分割器,其基于GMM模型對(duì)第一級(jí)量化殘差進(jìn)行模型聚類(lèi)分割,得到相應(yīng)的GMM聚類(lèi)索引;耦合到GMM模型聚類(lèi)分割器的第二級(jí)矢量量化器,其基于GMM聚類(lèi)索引,對(duì)第一級(jí)量化殘差進(jìn)行第二級(jí)矢量量化,得到相應(yīng)的第二級(jí)矢量索引;以及發(fā)送器,將經(jīng)歷進(jìn)一步編碼處理的第一級(jí)量化索引、GMM聚類(lèi)索引、及第二級(jí)矢量索引傳到解碼端。
在一個(gè)優(yōu)選實(shí)施例中,LPC系數(shù)可以是LSF或ISF系數(shù)中的一種。進(jìn)一步地,第一級(jí)矢量量化器可選自多級(jí)矢量量化器、分裂矢量量化器、混合矢量量化器中的其中一種。優(yōu)選地,第一級(jí)矢量量化進(jìn)一步包括兩次矢量量化,第一次矢量量化采用隨機(jī)矢量碼本對(duì)信號(hào)進(jìn)行矢量量化,第二次矢量量化將第一次矢量量化的殘差分裂為N維矢量,然后按照第一次矢量量化的量化方式處理N維矢量,得到第一級(jí)量化索引和第一級(jí)量化殘差。
在一個(gè)優(yōu)選實(shí)施例中,運(yùn)用高斯格型量化器,對(duì)第一級(jí)量化殘差進(jìn)行高斯格型量化,得到針對(duì)GMM模型各種情況的多個(gè)格矢量;以及耦合到高斯格型量化器的GMM模型聚類(lèi)器,其基于GMM模型及多個(gè)格矢量,將第一級(jí)量化殘差聚類(lèi)分割到某一 GMM聚類(lèi),并確定GMM 聚類(lèi)索引。進(jìn)一步地,GMM模型聚類(lèi)分割器使用全局搜索法進(jìn)行聚類(lèi)分割。優(yōu)選地,高斯格型量化包括歸一化的步驟,并且歸一化后的矢量量化為RE8、Z8、Z16、D8、D16格矢量中的一種。
在一個(gè)優(yōu)選實(shí)施例中,所述高斯格型量化器進(jìn)行的高斯格型量化還包括歸一化的步驟,并通過(guò)下式實(shí)現(xiàn)所述歸一化_ χ-μ;_7] y=~K
其中X為高斯模型的輸入矢量,μ ,為第i個(gè)高斯模型的均值矢量,V i為第i個(gè)高斯模型的方差矢量。
在優(yōu)選實(shí)施例中,GMM模型聚類(lèi)分割器進(jìn)行模型聚類(lèi)分割的方法可選自全局搜索法、矢量量化法或后驗(yàn)概率計(jì)算法中的一種。
根據(jù)本發(fā)明的第三方面,提供了用于解碼語(yǔ)音信號(hào)LPC系數(shù)的方法,其包括接收編碼碼流,并解碼其中包含的第一級(jí)量化索引、GMM聚類(lèi)索引、及第二級(jí)矢量索引;基于對(duì)第二級(jí)矢量索引進(jìn)行逆量化獲得的第二級(jí)矢量以及基于GMM聚類(lèi)索引所指定的GMM模型參數(shù),重構(gòu)第一級(jí)量化殘差;基于第一級(jí)矢量索引及重構(gòu)的第一級(jí)量化殘差,恢復(fù)LPC系數(shù)的一等價(jià)表達(dá);以及基于等價(jià)表達(dá),通過(guò)等價(jià)轉(zhuǎn)換得到LPC系數(shù)。
在一個(gè)優(yōu)選實(shí)施例中,LPC系數(shù)的等價(jià)表達(dá)可以是LSF或者ISF系數(shù)中的一種。進(jìn)一步地,第二級(jí)矢量索引進(jìn) 行的逆量化是高斯格型矢量量化的逆量化,并且GMM模型參數(shù)包括高斯模型的均值矢量和高斯模型的方差矢量。
優(yōu)選地,第一級(jí)矢量索引可能獲得自以下量化方法中的一種多級(jí)矢量量化、分裂矢量量化、混合矢量量化。
根據(jù)本發(fā)明的第四方面,提供了用于解碼語(yǔ)言信號(hào)LPC系數(shù)的系統(tǒng),其包括接收器,其接收編碼碼流;耦合到接收器的解碼器,其解碼編碼碼流中包含的第一級(jí)量化索引、 GMM聚類(lèi)索引、及第二級(jí)矢量索引;耦合到解碼器的第二級(jí)矢量逆量化器,其基于對(duì)第二級(jí)矢量索引進(jìn)行逆量化獲得的第二級(jí)矢量,并基于GMM聚類(lèi)索引所指定的GMM模型參數(shù),重構(gòu)第一級(jí)量化殘差;轉(zhuǎn)換器,其將第一級(jí)量化索引及重構(gòu)的第一級(jí)量化殘差所得的等價(jià)表達(dá)轉(zhuǎn)換為L(zhǎng)PC系數(shù)。
在一個(gè)優(yōu)選實(shí)施例中,LPC系數(shù)的等價(jià)表達(dá)可以是LSF或ISF系數(shù)中的一種。進(jìn)一步地,第二級(jí)矢量索引進(jìn)行的逆量化是高斯格型矢量量化的逆量化,并且GMM模型參數(shù)包括高斯模型的均值矢量和高斯模型的方差矢量。
優(yōu)選地,第一級(jí)矢量索引可能獲得自以下量化方法中的一種多級(jí)矢量量化、分裂矢量量化、混合矢量量化。
相比于前文所述Subramaniam最早提出的基于GMM模型的LSF算法,本發(fā)明具有低運(yùn)算復(fù)雜度的優(yōu)點(diǎn)。根據(jù)本發(fā)明的一個(gè)實(shí)施例,算法的運(yùn)算復(fù)雜度可降低約40%。此外, 本發(fā)明實(shí)施例在平均比特?cái)?shù)相當(dāng)時(shí),其譜失真較現(xiàn)有基于VQ的LSF量化算法小,因而具有較高的量化性能。另外,本發(fā)明實(shí)施例還具有實(shí)現(xiàn)變比特率量化的優(yōu)點(diǎn),即可以根據(jù)LSF參數(shù)的特性,自適應(yīng)調(diào)整量化比特?cái)?shù)。
本領(lǐng)域技術(shù)人員應(yīng)該意識(shí)到,前述概括僅僅是為了提供本發(fā)明的特定方面的簡(jiǎn)單描述。通過(guò)結(jié)合附圖并參照權(quán)利要求和以下優(yōu)選實(shí)施例的詳細(xì)描述,能夠獲得對(duì)本發(fā)明的更完全的理解
下面將結(jié)合附圖及實(shí)施例對(duì)本發(fā)明作進(jìn)一步說(shuō)明,附圖中
圖1a示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的編解碼原理框圖1b示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的量化器;
圖2示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的量化過(guò)程;
圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的逆量化過(guò)程。
具體實(shí)施方式
為了敘述簡(jiǎn)潔,本發(fā)明實(shí)施例可能省略對(duì)本領(lǐng)域技術(shù)人員所公知的內(nèi)容,例如語(yǔ)音信號(hào)LPC編碼的原理、各種公知的矢量量化方法、LPC系數(shù)到LSF系數(shù)的轉(zhuǎn)化方法等。
簡(jiǎn)而言之,在根據(jù)本發(fā)明的一個(gè)本優(yōu)選實(shí)施例中,對(duì)語(yǔ)音信號(hào)LPC系數(shù)的某種等價(jià)表示(例如,LSF系數(shù))進(jìn)行量化的示意性系統(tǒng)包括隨機(jī)矢量量化模塊30、GMM模型分類(lèi)模塊31-34、及GMM格型矢量量化模塊35這三個(gè)主要部分;其逆量化系統(tǒng)為量化系統(tǒng)的逆系統(tǒng), 主要包括GMM模型參數(shù)提供模塊37、GMM格型矢量量化解碼模塊38、及隨機(jī)矢量量化解碼模塊39。圖1 (a)示意性示出了上述量化系統(tǒng)和逆量化系統(tǒng)的框圖。
具體來(lái)說(shuō),根據(jù)本發(fā)明的一個(gè)實(shí)施例,在量化端,首先從隨機(jī)矢量量化模塊30的輸入端輸入LSF系數(shù),并隨后在隨機(jī)矢量量化模塊30中采用隨機(jī)矢量碼本對(duì)LSF系數(shù)進(jìn)行矢量量化(獲得了索引I和殘差X),以去除輸入信號(hào)的冗余和相關(guān),從而使得從隨機(jī)矢量量化模塊30輸出的、經(jīng)受了矢量量化的殘差信號(hào)X的動(dòng)態(tài)變化范圍降低。
考慮到所得殘差信號(hào)X大致服從高斯分布,因此在隨后的GMM模型分類(lèi)模塊31 — 34中采用各種GMM模型將量化殘差X分配到不同高斯分布的m個(gè)聚類(lèi)(m優(yōu)選為4、5、6、7、8個(gè));然后針對(duì)每個(gè)高斯聚類(lèi)殳卜;^使用高斯格型矢量量化器進(jìn)行量化(將在下文更詳細(xì)地描述),并結(jié)合模塊35,確定使量化失真最小的那個(gè)高斯模型,即在文卜^^中搜索,找出與殘差信號(hào)X最接近那個(gè)聚類(lèi)的GMM索引J及相應(yīng)的高斯格型矢量量化索引K。最后,將索引I、GMM索引J和高斯格型矢量量化索引K編碼后發(fā)送。
與之相對(duì)地,根據(jù)本發(fā)明的一個(gè)實(shí)施例,在逆量化端,在高斯混合模型參數(shù)提供模塊37和高斯格型矢量量化器模塊38接收并解碼得到GMM索引J和高斯格型矢量量化索引K,并基于解碼的J和K重構(gòu)量化殘差&;在隨機(jī)矢量量化解碼模塊39中,基于接收和解碼得到的索引I及重構(gòu)的量化殘差i恢復(fù)/iF氣· IO
在圖1 (b)中,詳細(xì)示出了 GMM模型分類(lèi)模塊31 — 34的量化過(guò)程。具體而言,令輸入矢量為X,首先減去第i個(gè)高斯聚類(lèi)的值μ i,即X-μ i,將得到的殘差X-μ i除以第i個(gè)高斯聚類(lèi)的方差Vi,得到歸一化的值,在高斯格型矢量量化器模塊40中,對(duì)歸一化的值進(jìn)行高斯格型矢量量化,接下來(lái),在高斯格型矢量逆量化器模塊41中,對(duì)高斯格型矢量量化值進(jìn)行逆量化得到重建的歸一化量化值,將重建的歸一化量化值乘以第i個(gè)高斯聚類(lèi)的方差Vi,再加上第i個(gè)高斯聚類(lèi)的均值μ i,得到重建矢量;X ,
在圖2中,詳細(xì)描述了本發(fā)明的一個(gè)更具體的實(shí)現(xiàn)過(guò)程。假定第一級(jí)隨機(jī)矢量量化碼本有M1個(gè)碼字,第二級(jí)的隨機(jī)矢量量化碼本y21和y22分別有M21和M22個(gè)碼字,輸入的LSF矢量為16維。兩級(jí)矢量量化方法的量化步驟如下
在步驟50中,對(duì)一個(gè)給定的輸入的矢量LSF,計(jì)算LSF相對(duì)于碼本中的每一個(gè)碼字的量化誤差ei= Il LSF-Y1,, Il 2,選擇使量化誤差ei最小的碼字yu作為第一級(jí)隨機(jī)矢量量化碼字,記錄碼字yu的索引I1,然后計(jì)算第一級(jí)的量化殘差Res^LSF-yu。其中,第一級(jí)采用隨機(jī)矢量量化可以是任何已知的矢量量化,如多級(jí)矢量量化、分裂矢量量化,或者是混合矢量量化。
接下來(lái),在步驟51中,把Res1分裂為兩個(gè)8維矢量Res21和Res22,然后按照步驟50 的方法,基于隨機(jī)矢量量化碼本y21和Y22分別對(duì)Res21和Res22進(jìn)行隨機(jī)矢量量化,然后分別在步驟52和步驟55計(jì)算第二級(jí)的量化殘差Res31和Res32, Res31=Res21I2ui, Res32=Res22_y22, i,以及y2i,i和!22Λ的索引I2I和
將步驟52和步驟55得到的兩組殘差序列Res31和Res32進(jìn)行高斯混合模型歸一化處理,歸一化處理的方法如下 X-μ,.
其中X為高斯模型的輸入矢量,μ ,為第i個(gè)高斯模型的均值矢量,V i為第i個(gè)高斯模型的方差矢量,將歸一化后的矢量I量化成RE8格矢量C,其中c = RE8 (x)。其中, 對(duì)歸一化后的矢量I的量化方法不僅可以采用RE8格型矢量量化,還可以采用其他的格型矢量量化,如Z8, Z16, D8, D16等。
確定j、k,使得 ReS31 -Py-C ^ 和|!ReS32 -μ4 — ct^ 最小。在確定了 j、k 和格矢量h和Ck后,計(jì)算格矢量和Ck的索引I31和I32以及各自對(duì)應(yīng)的GMM模型索引G1和
將索引I1, I21, I22, I31, I32,以及G1和G2編碼后傳到解碼端。
相對(duì)上述兩級(jí)矢量量化方法的逆量化框圖如圖3所示,具體實(shí)施步驟如下
首先,在步驟60和63中,解碼索引I31和I32,然后通過(guò)高斯格型矢量逆量化得到 RE8格矢量&和Ck。
接下來(lái),在步驟61和64中,解碼索引G1和G2,得到GMM模型參數(shù)μ和V,然后再重構(gòu)得到差序列和Ri,S31,其中Rh31 = μ_,·JRes32 =Ht -°
然后,在步驟62和65中,解碼索引I21和I22,得到隨機(jī)矢量量化y21,i和y22,i,然后計(jì)算得到兩個(gè) 8 維矢量RlS21^PReS22,其中RS^21 = Ris31 + v2U ,ReS22 = Ris32 + V22,。
最后,在步驟66中,將兩個(gè)8維矢量Rh21和RSS22合并得到一個(gè)16維矢量Ris1,解碼索引I1得到y(tǒng)u,然后重構(gòu)得到量化的LSF系數(shù)/j/.· LSF = Rhsl +Vu。
需要說(shuō)明的是,本發(fā)明不局限于對(duì)LSF系數(shù)量化,也可以對(duì)ISF系數(shù)進(jìn)行量化,而且不僅可 以適合窄帶語(yǔ)音編碼中LPC系數(shù)的量化,還適合寬帶和超寬帶語(yǔ)音編碼中LPC系數(shù)的量化,具有廣泛的實(shí)用性。
權(quán)利要求
1.ー種用于對(duì)語(yǔ)音信號(hào)LPC系數(shù)進(jìn)行多級(jí)矢量量化的方法,包括 a通過(guò)等效變換,將所述LPC系數(shù)轉(zhuǎn)換為等價(jià)表達(dá),并對(duì)所述等價(jià)表達(dá)進(jìn)行第一級(jí)矢量量化,得到相應(yīng)的第一級(jí)量化索引和第一級(jí)量化殘差; b基于GMM模型對(duì)所述第一級(jí)量化殘差進(jìn)行第二級(jí)矢量量化,得到相應(yīng)的第二級(jí)矢量索引;以及 c將經(jīng)歷進(jìn)ー步編碼處理的所述第一級(jí)量化索引、GMM聚類(lèi)索引、及第ニ級(jí)矢量索引傳到解碼端。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述步驟(a)中的所述第一級(jí)矢量量化進(jìn)一歩包含兩次矢量量化,第一次矢量量化采用隨機(jī)矢量碼本對(duì)信號(hào)進(jìn)行矢量量化,第二次矢量量化將所述第一次矢量量化的殘差分裂為N維矢量,然后按照所述第一次矢量量化的量化方式處理所述N維矢量,得到所述第一級(jí)量化索引和所述第一級(jí)量化殘差。
3.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述步驟(b)進(jìn)ー步包括 b. I對(duì)所述第一級(jí)量化殘差進(jìn)行高斯格型量化,得到針對(duì)GMM模型各種情況的多個(gè)格矢量;以及 b. 2基于所述GMM模型及所述多個(gè)格矢量,將所述第一級(jí)量化殘差聚類(lèi)分割到某一 GMM聚類(lèi),并確定所述GMM聚類(lèi)索引。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述高斯格型量化還包括歸ー化的步驟,通過(guò)下式實(shí)現(xiàn)所述歸ー化 χ-μ ■sh 其中X為高斯模型的輸入矢量,μ i為第i個(gè)高斯模型的均值矢量,V i為第i個(gè)高斯模型的方差矢量。
5.ー種用于對(duì)語(yǔ)音信號(hào)LPC系數(shù)進(jìn)行多級(jí)矢量量化的系統(tǒng),包括 等效變換器,用于將所述LPC系數(shù)轉(zhuǎn)換為一等價(jià)表達(dá); 耦合到所述等價(jià)變換器的第一級(jí)矢量量化器,用于接收所述等價(jià)表達(dá)并對(duì)所述等價(jià)表達(dá)進(jìn)行第一級(jí)矢量量化,得到相應(yīng)的第一級(jí)量化索引和第一級(jí)量化殘差; 耦合到所述第一級(jí)矢量量化器的GMM模型聚類(lèi)分割器,用于基于GMM模型對(duì)所述第一級(jí)量化殘差進(jìn)行模型聚類(lèi)分割,得到相應(yīng)的GMM聚類(lèi)索引; 耦合到所述GMM模型聚類(lèi)分割器的第二級(jí)矢量量化器,用于基于所述GMM聚類(lèi)索引,對(duì)所述第一級(jí)量化殘差進(jìn)行第二級(jí)矢量量化,得到相應(yīng)的第二級(jí)矢量索引;以及 發(fā)送器,用于將經(jīng)歷進(jìn)ー步編碼處理的所述第一級(jí)量化索引、GMM聚類(lèi)索引、及第ニ級(jí)矢量索引傳到解碼端。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,所述第一級(jí)矢量量化進(jìn)ー步包括兩次矢量量化,第一次矢量量化采用隨機(jī)矢量碼本對(duì)信號(hào)進(jìn)行矢量量化,第二次矢量量化將所述第一次矢量量化的殘差分裂為N維矢量,然后按照所述第一次矢量量化的量化方式處理所述N維矢量,得到所述第一級(jí)量化索引和所述第一級(jí)量化殘差。
7.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,所述GMM模型聚類(lèi)分割器進(jìn)ー步包括 高斯格型量化器,用于對(duì)所述第一級(jí)量化殘差進(jìn)行高斯格型量化,得到針對(duì)GMM模型各種情況的多個(gè)格矢量;以及耦合到所述高斯格型量化器的GMM模型聚類(lèi)器,用于基于所述GMM模型及所述多個(gè)格矢量,將所述第一級(jí)量化殘差聚類(lèi)分割到某一 GMM聚類(lèi),并確定所述GMM聚類(lèi)索引。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述高斯格型量化器進(jìn)行的高斯格型量化還包括歸ー化的步驟,并通過(guò)下式實(shí)現(xiàn)所述歸ー化
9.一種用于解碼語(yǔ)音信號(hào)LPC系數(shù)的方法,包括 d接收編碼碼流,并解碼其中包含的第一級(jí)量化索引、GMM聚類(lèi)索引、及第ニ級(jí)矢量索弓I ; e基于對(duì)所述第二級(jí)矢量索引進(jìn)行逆量化獲得的第二級(jí)矢量以及基于所述GMM聚類(lèi)索引所指定的GMM模型參數(shù),重構(gòu)第一級(jí)量化殘差; f基于所述第一級(jí)矢量索引及重構(gòu)的第一級(jí)量化殘差,恢復(fù)所述LPC系數(shù)的一等價(jià)表達(dá);以及 g基于所述等價(jià)表達(dá),通過(guò)等價(jià)轉(zhuǎn)換得到所述LPC系數(shù)。
10.一種用于解碼語(yǔ)音信號(hào)LPC系數(shù)的系統(tǒng),包括 接收器,用于接收編碼碼流; 耦合到所述接收器的解碼器,用于解碼所述編碼碼流中包含的第一級(jí)量化索引、GMM聚類(lèi)索引、及第ニ級(jí)矢量索引; 耦合到所述解碼器的第二級(jí)矢量逆量化器,用于基于對(duì)所述第二級(jí)矢量索引進(jìn)行逆量化獲得的第二級(jí)矢量,并基于所述GMM聚類(lèi)索引所指定的GMM模型參數(shù),重構(gòu)第一級(jí)量化殘差; 轉(zhuǎn)換器,用于將所述第一級(jí)量化索引及重構(gòu)的第一級(jí)量化殘差所得的等價(jià)表達(dá)轉(zhuǎn)換為L(zhǎng)PC系數(shù)。
全文摘要
本發(fā)明提供了用于對(duì)語(yǔ)音信號(hào)LPC系數(shù)進(jìn)行多級(jí)矢量量化的方法和系統(tǒng),以及解碼語(yǔ)音信號(hào)LPC系數(shù)的方法和系統(tǒng)。其中該對(duì)語(yǔ)音信號(hào)LPC系數(shù)進(jìn)行多級(jí)矢量量化的方法包括通過(guò)等效變換,將LPC系數(shù)轉(zhuǎn)換為一等價(jià)表達(dá),并對(duì)該等價(jià)表達(dá)進(jìn)行第一級(jí)矢量量化,得到相應(yīng)的第一級(jí)量化索引和第一級(jí)量化殘差;基于GMM模型,對(duì)第一級(jí)量化殘差進(jìn)行模型聚類(lèi)分割,得到相應(yīng)的GMM聚類(lèi)索引;基于GMM聚類(lèi)索引,對(duì)第一級(jí)量化殘差進(jìn)行第二級(jí)矢量量化,得到相應(yīng)的第二級(jí)矢量索引;以及將經(jīng)歷進(jìn)一步編碼處理的第一級(jí)量化索引、GMM聚類(lèi)索引、及第二級(jí)矢量索引傳到解碼端。實(shí)施本發(fā)明的方法和系統(tǒng),可實(shí)現(xiàn)較高的量化性能和較低的運(yùn)算復(fù)雜度。
文檔編號(hào)G10L19/038GK102982807SQ201210246780
公開(kāi)日2013年3月20日 申請(qǐng)日期2012年7月17日 優(yōu)先權(quán)日2012年7月17日
發(fā)明者張勇, 閆建新 申請(qǐng)人:深圳廣晟信源技術(shù)有限公司