專利名稱:一種在解碼端細(xì)化窄帶聲碼器參數(shù)的方法
技術(shù)領(lǐng)域:
本發(fā)明屬于參數(shù)語音編碼技術(shù)領(lǐng)域,特別是涉及一種在解碼端細(xì)化窄帶聲碼器參數(shù)的方法。
背景技術(shù):
語音編碼在通信系統(tǒng)、語音存儲回放系統(tǒng)、具有語音功能的消費(fèi)類產(chǎn)品中有廣泛的應(yīng)用。近些年來國際電信聯(lián)盟(ITU)、一些區(qū)域組織和一些國家相繼制定了一系列語音壓縮編碼標(biāo)準(zhǔn),語音編碼方式從編碼方法的角度可以劃分為波形編碼、參數(shù)編碼和混合編碼。在編碼速率降至4kbps以下時,大多采用參數(shù)編碼模型。基于參數(shù)編碼模型的低速率語音編碼技術(shù)仍然是語音信號處理領(lǐng)域的研究熱點(diǎn),主要應(yīng)用于無線通信、保密通信、大容量語音存儲回放等領(lǐng)域?;旌霞罹€性預(yù)測模型在低速率語音編碼算法中表現(xiàn)出色,因此成為2. 4kbps以下速率算法的主流模型?;诨旌霞罹€性預(yù)測模型的低速率語音編碼算法中,需要提取聲道參數(shù)、基音參數(shù)、能量參數(shù)、子帶清濁音度參數(shù)以及余量譜幅度參數(shù),由于編碼速率低,因此用于量化各參數(shù)的比特?cái)?shù)較少,如何在編碼端高效地量化以及在解碼端更好地恢復(fù)各參數(shù)便成為大家普遍關(guān)注的問題。目前主要方法如下
(1)對輸入語音信號樣點(diǎn)按時間順序分巾貞;
(2)按巾貞提取聲道參數(shù)、基音參數(shù)、能量參數(shù)、子帶清池音度參數(shù)以及余量譜幅度參
數(shù);
(3)聯(lián)合多個語音幀組成超幀,多個語音幀的上述的各個參數(shù)分別組成超幀的對應(yīng)參數(shù),即超巾貞的聲道參數(shù)、基音參數(shù)、能量參數(shù)、子帶清池音度以及余量譜幅度參數(shù);
(4)對超幀各參數(shù)進(jìn)行矢量量化,將各參數(shù)索引傳輸?shù)浇獯a端;
(5)解碼端根據(jù)索引值搜索碼本得到超幀各參數(shù);
(6)根據(jù)超幀參數(shù),得到每個語音幀的編碼參數(shù),送入解碼端進(jìn)行語音合成?,F(xiàn)有技術(shù)的缺陷
在混合激勵線性預(yù)測模型的諸多參數(shù)中,基音參數(shù)、能量參數(shù)、子帶清濁音度參數(shù)以及余量譜幅度參數(shù)也稱為激勵參數(shù),可以合成激勵信號,與聲道參數(shù)對應(yīng)。在參數(shù)提取過程中,聲道參數(shù)和激勵參數(shù)仍然存在可觀的相關(guān)性,即使是激勵參數(shù)之間,也存在一定的相關(guān)性。根據(jù)香農(nóng)理論,相關(guān)性的存在可以進(jìn)一步提高量化效率,提升重構(gòu)精度,而現(xiàn)有技術(shù)并未充分考慮或利用到這種相關(guān)性,從而無法進(jìn)一步提高各參數(shù)的量化效率。
發(fā)明內(nèi)容
因此,本發(fā)明基于激勵參數(shù)和聲道參數(shù)之間的相關(guān)性,采用非線性映射的方法,提供一種在解碼端細(xì)化窄帶聲碼器參數(shù)的方法,從而提高參數(shù)的量化效率,并改善合成語音的質(zhì)量。一種在解碼端細(xì)化窄帶聲碼器參數(shù)的方法,其特征在于,解碼端根據(jù)接收到的各參數(shù)的第一索引值搜索匹配編碼端的碼本得到超幀各參數(shù)的反量化值,進(jìn)而根據(jù)參考碼本重新量化超幀各參數(shù)的反量化值,得到對應(yīng)的第二索引值;
其中上述參數(shù)分別是聲道參數(shù)k/、基音參數(shù)P、能量參數(shù)σ、子帶清濁音度參數(shù)‘以
及余量譜幅度參數(shù)/V ;對應(yīng)的第二索引值依次是I設(shè)、而對應(yīng)
的參考碼本的尺寸分別為AZjUZf ^ ^R,S(P ^M^SF' ^4, ·;
進(jìn)而通過下式得到細(xì)化的聲道參數(shù)、基音參數(shù)、能量參數(shù)、子帶清池音度參數(shù)以及余量譜幅度參數(shù)或者其中的部分參數(shù)
權(quán)利要求
1.一種在解碼端細(xì)化窄帶聲碼器參數(shù)的方法,其特征在于,解碼端根據(jù)接收到的各參數(shù)的第一索引值搜索匹配編碼端的碼本得到超幀各參數(shù)的反量化值,進(jìn)而根據(jù)參考碼本重新量化超幀各參數(shù)的反量化值,得到對應(yīng)的第二索引值; 其中上述參數(shù)分別是聲道參數(shù)&/、基音參數(shù)P、能量參數(shù)σ、子帶清濁音度參數(shù)以及余量譜幅度參數(shù)/V ;對應(yīng)的第二索引值依次是而對應(yīng)的參考碼本的尺寸分別為N啊'N艮鐵 ^M,SPr ; 進(jìn)而通過下式得到細(xì)化的聲道參數(shù) 、基音參數(shù)、能量參數(shù)、子帶清池音度參數(shù)以及余量譜幅度參數(shù)或者其中的部分參數(shù)
2.根據(jù)權(quán)利要求I所述的在解碼端細(xì)化窄帶聲碼器參數(shù)的方法,其特征在于,選擇部分參數(shù)進(jìn)行細(xì)化時,考慮到算法復(fù)雜度,優(yōu)選基音參數(shù)、能量參數(shù)和子帶清濁音度參數(shù)。
3.根據(jù)權(quán)利要求2所述的在解碼端細(xì)化窄帶聲碼器參數(shù)的方法,其特征在于,當(dāng)考慮選擇部分參數(shù)進(jìn)行細(xì)化時,考慮匹配的要素是解碼端的存儲能力。
4.根據(jù)權(quán)利要求I至3任一所述的在解碼端細(xì)化窄帶聲碼器參數(shù)的方法,其特征在于,細(xì)化重構(gòu)碼本Cc胃的生成方法如下,
全文摘要
本發(fā)明公開了一種在解碼端細(xì)化窄帶聲碼器參數(shù)的方法,基于激勵參數(shù)與聲道參數(shù)間的相關(guān)性,在解碼端對各參數(shù)進(jìn)行更加精細(xì)的重構(gòu),提高其量化精度,進(jìn)一步提高合成語音的質(zhì)量。更具體地,對基于混合激勵線性預(yù)測模型的窄帶低速率語音編碼中的編解碼參數(shù)采用了基于不同參數(shù)間映射細(xì)化的方法。原有的技術(shù)對各編解碼參數(shù)采用獨(dú)立矢量量化。本發(fā)明考慮到了激勵參數(shù)和聲道參數(shù)之間的相關(guān)性,采用非線性映射的方法,對反量化的各編解碼參數(shù)進(jìn)行細(xì)化,因此提高了各參數(shù)的量化效率,改善了合成語音的質(zhì)量。本方法可以提高合成語音的自然度。
文檔編號G10L13/08GK102903365SQ20121042313
公開日2013年1月30日 申請日期2012年10月30日 優(yōu)先權(quán)日2012年10月30日
發(fā)明者李曄, 馬曉鳳, 樊燕紅, 姜競賽, 郝秋赟 申請人:山東省計(jì)算中心