碼簿激勵(lì)線性預(yù)測(cè)編碼器、譯碼器及編碼、譯碼方法

文檔序號(hào)：2827551閱讀：201來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

碼簿激勵(lì)線性預(yù)測(cè)編碼器、譯碼器及編碼、譯碼方法
【專利摘要】本發(fā)明提供了碼簿激勵(lì)線性預(yù)測(cè)編碼器、譯碼器及編碼、譯碼方法。根據(jù)本發(fā)明的一方面，通過共同句柄簿激勵(lì)線性預(yù)測(cè)(CELP)編譯碼器的碼簿激勵(lì)的增益，連同控制該變換編碼幀的變換或反變換電壓，可實(shí)現(xiàn)跨CELP編碼幀及變換編碼幀的全域增益控制。根據(jù)又另一方面，通過執(zhí)行在激勵(lì)信號(hào)的加權(quán)域的CELP編碼中的增益值確定，當(dāng)改變個(gè)別增益值時(shí)，可更良好適應(yīng)于變換編碼電壓調(diào)整的表現(xiàn)而呈現(xiàn)CELP編碼比特流的響度變化。
【專利說明】碼簿激勵(lì)線性預(yù)測(cè)編碼器、譯碼器及編碼、譯碼方法
[0001]本申請(qǐng)是分案申請(qǐng)，其母案的申請(qǐng)?zhí)枮?01080058349.0，申請(qǐng)日為2010年10月
19日，發(fā)明名稱為“多模式音頻編譯碼器及其適用的碼簿激勵(lì)線性預(yù)測(cè)編碼”。
【技術(shù)領(lǐng)域】
[0002]本發(fā)明涉及多模式音頻編碼，諸如統(tǒng)一語音及音頻編譯碼器，或適用于一般音頻信號(hào)諸如音樂、語音、混合及其它信號(hào)的編譯碼器，及其適用的一種CELP編碼方案。
【背景技術(shù)】
[0003]混合不同編碼模式來編碼表示不同類型音頻信號(hào)諸如語音、音樂等的混合的一般音頻信號(hào)是有利的個(gè)別編碼模式可適用于特定的音頻類型，因此，多模式音頻編碼器可利用隨著時(shí)間與音頻內(nèi)容類型的改變相對(duì)應(yīng)地改變編碼模式的優(yōu)勢(shì)換言之，多模式音頻編碼器例如可判定使用特別專用于編碼語音的編碼模式來編碼該音頻信號(hào)的語音內(nèi)容部分，使用另一編碼模式來編碼該音頻內(nèi)容的表示非語音內(nèi)容諸如音樂的部分。線性預(yù)測(cè)編碼模式傾向于較為適合用以編碼語音內(nèi)容，而只要有關(guān)音樂的編碼，則頻域編碼模式傾向于表現(xiàn)效能優(yōu)于線性預(yù)測(cè)編碼模式。
[0004]但使用不同的編碼模式，使得其難以全域地調(diào)整已編碼的比特流內(nèi)增益，或更準(zhǔn)確地說，已編碼的比特流的音頻內(nèi)容的譯碼表示型態(tài)的增益，無需實(shí)際上將該已編碼的比特流譯碼然后再度重新編碼增益已調(diào)整的譯碼表示型態(tài)，迂回繞道必然減低已調(diào)整增益的比特流的質(zhì)量，原因在于再量化在重新編碼已譯碼且已調(diào)整增益的表示型態(tài)進(jìn)行。
[0005]舉例來說，在AAC中，通過改變8-位字段「全域增益」的值，在比特流層面可實(shí)現(xiàn)輸出電壓的調(diào)整。此比特流元素可簡(jiǎn)單地被通過、編輯，而無需完整譯碼及重編碼。如此，此處理并未引入任何質(zhì)量下降，并且可毫無損耗地取消。有些應(yīng)用用途實(shí)際上使用了此選項(xiàng)。舉例來說，一種免費(fèi)軟件稱作「AAC增益」，[AAC增益]恰應(yīng)用了前述方法。此種軟件為免費(fèi)軟件「MP3增益」的衍生，其應(yīng)用與MPEC1/2層3相同的技術(shù)。
[0006]在剛萌芽的USAC編譯碼器中，F(xiàn)D編碼模式從AAC繼承8-位全域增益。因此，若USAC只以FD模式執(zhí)行，例如用于較高比特率，則與AAC比較，全然保留電壓調(diào)整功能。但一旦允許模式轉(zhuǎn)換，則此項(xiàng)可能性不復(fù)存在。舉例來說，在TCX模式中，也有一個(gè)具相同功能的比特流元素也稱作「全域增益」，其具有7-位長(zhǎng)度。換言之，編碼個(gè)別模式的個(gè)別增益元素的比特?cái)?shù)主要適應(yīng)于各自的編碼模式，來實(shí)現(xiàn)一方面耗用較少比特于增益控制，另一方面避免質(zhì)量因增益調(diào)整的量化太過粗糙而降低間的最佳折衷。顯然此折衷在比較TCX模式與FD模式時(shí)導(dǎo)致不同的比特?cái)?shù)。在目前萌生的USAC標(biāo)準(zhǔn)的ACELP模式中，電壓可通過具有2-位長(zhǎng)度的比特流元素「平均能量」控制。再次，顯然過多比特用于平均能量與過少比特用于平均能量間的折衷，結(jié)果導(dǎo)致與其它編碼模式(即，TCX和FD編碼模式)相比不同的比特?cái)?shù)。
[0007]如此，到目前為止，全域地調(diào)整通過多模式編碼所編碼的已編碼比特流的譯碼表示型態(tài)的增益煩瑣且易于造成質(zhì)量的降低。執(zhí)行譯碼接著執(zhí)行增益調(diào)整及重新編碼，或單獨(dú)通過調(diào)整影響比特流的不同編碼模式部分的增益的不同模式的個(gè)別比特流元素，試探性地執(zhí)行響度電壓的調(diào)整。但后一可能性極其可能將假像(artifacts)引入已增益調(diào)整的已譯碼的表示型態(tài)。
[0008]因此，本發(fā)明的目的是提供一種多模式音頻編碼器，其允許全域增益調(diào)整，而無譯碼及重新編碼的繞道，就質(zhì)量及壓縮率而言只有中等降低，及提供一種適用于嵌入多模式音頻編碼而達(dá)成類似性質(zhì)的CELP編譯碼器。
[0009]該目的可通過所附的獨(dú)立權(quán)利要求的主題實(shí)現(xiàn)。

【發(fā)明內(nèi)容】

[0010]根據(jù)本發(fā)明的第一方面，本申請(qǐng)發(fā)明人了解當(dāng)嘗試跨不同編碼模式使得全域增益調(diào)整協(xié)調(diào)時(shí)所遭遇的問題，系植基于實(shí)際上不同編碼模式具有不同幀尺寸且以不同方式分解成子幀。根據(jù)本發(fā)明的第一方面，此困難可通過將子幀的比特流元素不同地編碼成全域增益值，使得幀的全域增益值的改變導(dǎo)致該音頻內(nèi)容的譯碼表示型態(tài)的輸出電壓的調(diào)整。同時(shí)，不同的編碼可節(jié)省位，否則當(dāng)將新語法元素導(dǎo)入編碼比特流時(shí)將出現(xiàn)位。另外，不同的編碼通過允許設(shè)定全域增益值的時(shí)間分辨率比前述比特流元素不同地編碼成全域增益值來調(diào)整各子幀的增益時(shí)的時(shí)間分辨率更低，而允許全域調(diào)整編碼的比特流的增益時(shí)的負(fù)擔(dān)減輕。
[0011]因此，根據(jù)本申請(qǐng)的第一方面，一種用以基于編碼比特流而提供音頻內(nèi)容的譯碼表示型態(tài)的多模式音頻譯碼器，該多模式音頻譯碼器被配置為譯碼該編碼比特流的每個(gè)幀的全域增益值，其中幀的第一子集以第一編碼模式編碼，及幀的第二子集以第二編碼模式編碼，而該第二子集的各個(gè)幀由多于一個(gè)子幀組成；對(duì)幀的該第二子集的子幀的至少一個(gè)子集的每個(gè)子幀，與各幀的全域增益值不同地譯碼相對(duì)應(yīng)的比特流元素；在譯碼幀的第二子集的子幀的至少一個(gè)子集的子幀時(shí)使用所述全域增益值及相對(duì)應(yīng)的比特流元素，及譯碼幀的第一子集時(shí)使用該全域增益值，完成所述比特流的譯碼，其中該多模式音頻譯碼器被配置為使得編碼比特流內(nèi)的幀的全域增益值變化導(dǎo)致該譯碼音頻內(nèi)容表示型態(tài)的輸出電壓的調(diào)整。根據(jù)本第一方面，一種多模式音頻編碼器被配置為將音頻內(nèi)容編碼成編碼的比特流而幀的第一子集以第一編碼模式編碼及幀的第二子集以第二編碼模式編碼，此時(shí)幀的第二子集由一個(gè)或多個(gè)子幀組成，此時(shí)該多模式音頻編碼器被配置為確定和編碼每幀的全域增益值，及對(duì)第二子集的子幀的至少一個(gè)子集的每個(gè)子幀與各幀的全域增益值不同地編碼和確定相對(duì)應(yīng)的比特流元素，其中執(zhí)行多模式音頻編碼方法，使得編碼比特流內(nèi)的幀的全域增益值的改變導(dǎo)致音頻內(nèi)容的譯碼表示型態(tài)在譯碼端的輸出電位的調(diào)整。
[0012]根據(jù)本申請(qǐng)的第二方面，本申請(qǐng)發(fā)明人發(fā)現(xiàn)若CELP編譯碼器的碼簿激勵(lì)的增益連同變換編碼幀的變換或反變換電壓一起控制，則跨經(jīng)CELP編碼幀及變換編碼幀的通用增益控制可經(jīng)由維持前文概述的優(yōu)點(diǎn)實(shí)現(xiàn)。
[0013]據(jù)此，根據(jù)第二方面，一種用以基于編碼比特流而提供音頻內(nèi)容的譯碼表示型態(tài)的多模式音頻譯碼器，其幀的第一子集以CELP編碼，及其幀的第二子集以變換編碼，該多模式音頻譯碼器包括CELP譯碼器，其被配置為解碼該第一子集的目前幀，該CELP譯碼器包括激勵(lì)發(fā)生器，其被配置為通過基于該編碼比特流內(nèi)的該第一子集的目前幀的碼簿指標(biāo)及過去激勵(lì)而組成碼簿激勵(lì)，以及基于該編碼比特流內(nèi)部之全域增益值而設(shè)定該碼簿激勵(lì)之增益，來產(chǎn)生該第一子集的前幀的目前激勵(lì)；以及線性預(yù)測(cè)合成濾波器，其被配置為基于該編碼比特流內(nèi)的第一子集的目前幀的線性預(yù)測(cè)濾波系數(shù)而濾波目前激勵(lì)；變換譯碼器被配置為通過如下方式解碼該第二子集的目前幀:由編碼比特流構(gòu)造第二子集的目前幀的頻譜信息，及對(duì)該頻譜信息進(jìn)行頻域至?xí)r域變換來獲得時(shí)域信號(hào)，使得時(shí)域信號(hào)的電壓取決于全域增益值。
[0014]同理，根據(jù)第二方面，一種多模式音頻編碼器，用于通過CELP編碼音頻內(nèi)容的幀的第一子集及通過變換編碼的第二幀子集而將該音頻內(nèi)容編碼成編碼比特流，該多模式音頻編碼器包括=CELP編碼器，被配置為編碼第一子集的目前幀，該CELP編碼器包括:線性預(yù)測(cè)分析器，其被配置為對(duì)該第一子集的目前幀產(chǎn)生線性預(yù)測(cè)濾波系數(shù)，并將其編碼成該編碼比特流；及激勵(lì)發(fā)生器，被配置為判定該第一子集的目前幀的目前激勵(lì)，當(dāng)通過線性預(yù)測(cè)合成濾波器基于編碼比特流內(nèi)的線性預(yù)測(cè)濾波系數(shù)濾波時(shí)，其恢復(fù)由該第一子集的目前幀的碼簿指標(biāo)及過去激勵(lì)所限定的第一子集的目前幀，及將該碼簿指標(biāo)編碼成該編碼比特流；及變換編碼器，其被配置為通過對(duì)該第二子集的目前幀的時(shí)域信號(hào)執(zhí)行時(shí)域至頻域變換成而編碼第二子集的目前幀來獲得頻譜信息，及將該頻譜信息編碼成該編碼比特流，其中該多模式音頻編碼器被配置為將全域增益值編碼成編碼比特流，該全域增益值取決于第一子集的目前幀的音頻內(nèi)容根據(jù)線性預(yù)測(cè)系數(shù)而使用該線性預(yù)測(cè)分析濾波器來濾波的版本的能量，或取決于該時(shí)域信號(hào)的能量。
[0015]根據(jù)本申請(qǐng)的第三方面，發(fā)明人發(fā)現(xiàn)若CELP編碼的全域增益值經(jīng)運(yùn)算且施加于激勵(lì)信號(hào)的加權(quán)域，而非直接使用普通激勵(lì)信號(hào)，則當(dāng)改變各全域增益值時(shí)，CELP編碼比特流的響度變化更加適應(yīng)配合變換編碼電壓調(diào)整的表現(xiàn)。此外，當(dāng)考慮CELP編碼模式排它地作為CELP的其它增益諸如碼增益及LTP增益在加權(quán)域運(yùn)算時(shí)，在激勵(lì)信號(hào)的加權(quán)域運(yùn)算與施加全域增益值也有其優(yōu)勢(shì)。
[0016]如此，根據(jù)第三方面，一種CELP譯碼器，包括激勵(lì)發(fā)生器，其被配置為產(chǎn)生比特流的目前幀的目前激勵(lì)，概產(chǎn)生通過:基于該比特流內(nèi)的目前幀的自適應(yīng)碼簿指標(biāo)及過去激勵(lì)，構(gòu)造自適應(yīng)碼簿激勵(lì)；基于該比特流內(nèi)的目前幀的創(chuàng)新碼簿指標(biāo)，構(gòu)造創(chuàng)新碼簿激勵(lì)；計(jì)算由該比特流內(nèi)的線性預(yù)測(cè)濾波系數(shù)所組成的加權(quán)線性預(yù)測(cè)合成濾波器而頻譜式加權(quán)的該創(chuàng)新碼簿激勵(lì)的能量的估值；基于該比特流內(nèi)的全域增益值與估算的能量間的比，設(shè)定該創(chuàng)新碼簿激勵(lì)的增益；及組合該自適應(yīng)碼簿激勵(lì)與該創(chuàng)新碼簿激勵(lì)來獲得該目前激勵(lì)；及線性預(yù)測(cè)合成濾波器，其被配置為基于該等線性預(yù)測(cè)濾波系數(shù)而濾波該目前激勵(lì)。
[0017]同理，根據(jù)第三方面，一種CELP編碼器，包括線性預(yù)測(cè)分析器，其被配置生成對(duì)音頻內(nèi)容的目前幀的線性預(yù)測(cè)濾波系數(shù)，以及將線性預(yù)測(cè)濾波系數(shù)編碼成比特流；激勵(lì)發(fā)生器，被配置為將目前幀的目前激勵(lì)確定為自適應(yīng)碼簿激勵(lì)與創(chuàng)新碼簿激勵(lì)的組合，而當(dāng)基于線性預(yù)測(cè)濾波系數(shù)通過線性預(yù)測(cè)合成濾波器濾波時(shí)，恢復(fù)所述目前幀，通過:造由目前幀的自適應(yīng)碼簿指標(biāo)及過去激勵(lì)所限定的所述自適應(yīng)碼簿激勵(lì)，以及將自適應(yīng)碼簿指標(biāo)編碼成比特流；及構(gòu)造由該目前幀的創(chuàng)新碼簿指標(biāo)限定的創(chuàng)新碼簿激勵(lì)，及將該創(chuàng)新碼簿指標(biāo)編碼成該比特流；及能量測(cè)定器，其被配置為確定加權(quán)濾波器濾波的該目前幀的音頻內(nèi)容的版本的能量，以獲得全域增益值，以及將該全域增益值編碼成該比特流，該加權(quán)濾波器由該線性預(yù)測(cè)濾波系數(shù)解釋?！緦＠綀D】

【附圖說明】
[0018]本申請(qǐng)的優(yōu)選實(shí)施例為本申請(qǐng)所附的從屬權(quán)利要求的主旨。此外，本申請(qǐng)的優(yōu)選實(shí)施例在后文參考附圖進(jìn)行說明，附圖中:
[0019]圖1A和圖1B示出根據(jù)實(shí)施方式的多模式音頻編碼器的方塊圖；
[0020]圖2示出根據(jù)第一替代例的圖1的編碼器的能量計(jì)算部分的方塊圖；
[0021]圖3示出根據(jù)第二替代例的圖1的編碼器的能量計(jì)算部分的方塊圖；
[0022]圖4示出根據(jù)實(shí)施方式且適用于譯碼由第I圖的編碼器編碼的比特流的多模式音頻譯碼器；
[0023]圖5A及圖5B示出根據(jù)本發(fā)明又一實(shí)施方式的多模式音頻編碼器及多模式音頻譯碼器；
[0024]圖6A及圖6B示出根據(jù)本發(fā)明又一實(shí)施方式的多模式音頻編碼器及多模式音頻譯碼器；以及
[0025]圖7A及圖7B示出根據(jù)本發(fā)明又一實(shí)施方式的CELP編碼器及CELP譯碼器?！揪唧w實(shí)施方式】
[0026]圖1A和IB示出根據(jù)本申請(qǐng)實(shí)施方式的一種多模式音頻編碼器的實(shí)施方式。圖1A和IB的多模式音頻編碼器適用于編碼混合型音頻信號(hào)，諸如語音與音樂的混合信號(hào)。為了獲得最適當(dāng)?shù)乃俾?失真折衷，該多模式音頻編碼器被配置為在數(shù)種編碼模式間切換而調(diào)整編碼性質(zhì)適應(yīng)要編碼的音頻內(nèi)容的目前需求。更明確地，根據(jù)圖1A和IB的實(shí)施方式，多模式音頻編碼器通常使用三種不同的編碼模式，即FD(頻域)編碼及LP(線性預(yù)測(cè))編碼，其又再劃分成TCX(變換編碼激勵(lì))及CELP (碼簿激勵(lì)線性預(yù)測(cè))編碼。在FD編碼模式中，要編碼的音頻內(nèi)容經(jīng)開窗、頻譜分解，且該頻譜分解經(jīng)根據(jù)心理聲學(xué)而量化及定標(biāo)來隱藏在掩蔽臨界值下方的量化噪聲。在TCX及CELP編碼模式中，音頻內(nèi)容接受線性預(yù)測(cè)分析來獲得線性預(yù)測(cè)系數(shù)，及這些線性預(yù)測(cè)系數(shù)在比特流內(nèi)連同激勵(lì)信號(hào)一起傳輸，其當(dāng)使用比特流內(nèi)的線性預(yù)測(cè)系數(shù)，以相對(duì)應(yīng)的線性預(yù)測(cè)合成濾波器濾波時(shí)，獲得音頻內(nèi)容的譯碼表示型態(tài)。在TCX的情況下，激勵(lì)信號(hào)經(jīng)變換編碼，而在CELP的情況下，激勵(lì)信號(hào)通過碼簿內(nèi)的檢索登錄項(xiàng)目編碼，或以合成方式組成所濾波樣本的碼簿向量。根據(jù)本實(shí)施方式使用的ACELP (代數(shù)碼簿激勵(lì)線性預(yù)測(cè))，激勵(lì)由自適應(yīng)碼簿激勵(lì)及創(chuàng)新碼簿激勵(lì)所組成。容后詳述，在TCX中，線性預(yù)測(cè)系數(shù)可在譯碼器端使用，也通過推導(dǎo)定標(biāo)因子而在頻域直接采用來成形噪聲量化。在此種情況下，TCX被設(shè)定來變換原先信號(hào)，及將LPC結(jié)果只應(yīng)用在頻域。
[0027]盡管編碼模式不同，但圖1A和IB的編碼器產(chǎn)生比特流，使得通過例如等量增或減全域增益值，例如，相等數(shù)量的比特?cái)?shù)(其等于以對(duì)數(shù)底乘以位數(shù)的因子(或除數(shù))縮放)，與該已編碼比特流的全部幀相關(guān)聯(lián)的某個(gè)語法元素(具體實(shí)例是與幀個(gè)別地或幀組群相關(guān)聯(lián))允許跨全部編碼模式的全域增益適應(yīng)。
[0028]具體地，根據(jù)圖1A和IB的多模式音頻編碼器10支持的各種編碼模式，其包含F(xiàn)D編碼器12及LPC(線性預(yù)測(cè)編碼)編碼器14。LPC編碼器14又由TCX編碼部16、CELP編碼部18及編碼模式切換器20所組成。編碼器10所包含的又一編碼模式切換器相當(dāng)概略地顯示為模式分配器22。模式分配器被配置為分析要編碼的音頻內(nèi)容24以便將其連續(xù)的時(shí)間部分與不同編碼模式相關(guān)聯(lián)。具體地，在圖1A和IB的情況下，模式分配器22將音頻內(nèi)容24的不同的連續(xù)時(shí)間部分分配至FD編碼模式及LPC編碼模式中的任一者。在圖1A和IB的說明例中，舉例來說，模式分配器22已將音頻內(nèi)容24的部分26分配至FD編碼模式，而緊隨后部分28分配至LPC編碼模式。根據(jù)模式分配器22分配的編碼模式，音頻內(nèi)容24可再細(xì)分成不同的連續(xù)幀。舉例來說，在圖1A和IB的實(shí)施方式中，部分26內(nèi)的音頻內(nèi)容24被編碼成等長(zhǎng)幀30，而彼此有例如50%重迭。換言之，F(xiàn)D編碼器12被配置為以這些單元30編碼音頻內(nèi)容24的FD部分26。根據(jù)圖1A和IB的實(shí)施方式，LPC編碼器14也被配置以幀單位32編碼音頻內(nèi)容24的相關(guān)聯(lián)部分28，但這些幀并非必需與幀30大小相等。以圖1A和IB為例，幀32的大小小于幀30的大小。具體地，根據(jù)特定實(shí)施方式，幀30的長(zhǎng)度為音頻內(nèi)容24的2048個(gè)樣本，而幀32的長(zhǎng)度為1024個(gè)樣本?？赡茉贚PC編碼模式與FD編碼模式間的邊界，最末幀與第一幀重迭。但在圖1A和IB的實(shí)施方式中，及如圖1A和IB示例性所示，在從FD編碼模式轉(zhuǎn)換至LPC編碼模式的情況下并無幀重迭，反之亦然。
[0029]如第I圖所示，F(xiàn)D編碼器12接收幀30，并通過頻域變換編碼將其編碼成已編碼比特流36的個(gè)別幀34。為了實(shí)現(xiàn)該目的，F(xiàn)D編碼器12包括一開窗器38、變換器40、量化及定標(biāo)模塊42、無損耗編碼器44，以及心理聲學(xué)控制器46。原則上，F(xiàn)D編碼器12可根據(jù)AAC標(biāo)準(zhǔn)實(shí)施，只要下文描述并未教示FD編碼器12的不同表現(xiàn)即可。具體地，開窗器38、變換器40、量化及定標(biāo)模塊42、及無損耗編碼器44系串接在FD編碼器12的輸入端48與輸出端50之間，及心理聲學(xué)控制器46具有輸入端連接至輸入端48，及輸出端連接至量化及定標(biāo)模塊42的另一輸入端。須注意FD編碼器12還可包括額外的模塊用于其它編碼選項(xiàng)，但在此處并不關(guān)鍵。
[0030]開窗器38可使用不同窗用來開窗進(jìn)入輸入端48的目前幀。該開窗幀在變換器40諸如使用MDCT等接受時(shí)域至頻域的變換。變換器40可使用不同變換長(zhǎng)度來變換開窗幀。
[0031]具體地，開窗器38可支持長(zhǎng)度與幀30的長(zhǎng)度一致的窗，變換器40使用相同的變換長(zhǎng)度以便獲得例如在MDCT的情況下與幀30的半數(shù)樣本相對(duì)應(yīng)的多個(gè)變換系數(shù)。但開窗器38也可被配置為支持編碼選項(xiàng)，根據(jù)這些編碼選項(xiàng)，時(shí)間上彼此相對(duì)偏移的諸如幀30的半長(zhǎng)度的8窗的若干較短窗被施加至目前幀，變換器40使用符合開窗的變換長(zhǎng)度變換目前幀的這些開窗版本，從而獲得該幀期間的不同時(shí)間，藉取樣該音頻內(nèi)容而對(duì)該幀獲得8頻譜。由開窗器38所使用的窗可為對(duì)稱或非對(duì)稱的，且可具有零前端及/或零后端。在施加若干短窗至目前幀的情況下，這些短窗的非零部分相對(duì)于彼此位移，但彼此重迭。當(dāng)然，根據(jù)其它實(shí)施方式也可使用開窗器38及變換器40的窗及變換長(zhǎng)度的其它編碼選項(xiàng)。
[0032]由變換器40輸出的變換系數(shù)在模塊42量化及定標(biāo)。特別，心理聲學(xué)控制器46分析輸入端48的輸入信號(hào)以確定掩蔽臨界值48，據(jù)此，由量化及定標(biāo)所導(dǎo)入的量化噪聲形成為低于該掩蔽臨界值。具體地，定標(biāo)模塊42可在定標(biāo)因子帶運(yùn)算，共同覆蓋頻譜域所再細(xì)分的變換器40的頻譜域。據(jù)此，成組連續(xù)的變換系數(shù)被分配至不同的定標(biāo)因子帶。模塊42判定每個(gè)定標(biāo)因子帶的定標(biāo)因子，該定標(biāo)因子當(dāng)乘以分配給各定標(biāo)因子頻帶的各變換系數(shù)值時(shí)，獲得變換器40所輸出的變換系數(shù)的重建版本。此外，模塊42設(shè)定頻譜上一致地定標(biāo)該頻譜的增益值。如此，重建變換系數(shù)等于該變換系數(shù)值乘以相關(guān)聯(lián)的定標(biāo)因子乘以各幀i的增益值gi。變換系數(shù)值、定標(biāo)因子、及增益值在無損耗編碼器44接受無損耗編碼，諸如利用熵編碼，諸如算術(shù)編碼或霍夫曼編碼，連同其它語法元素，例如有關(guān)前述窗及變換長(zhǎng)度決策的語法元素，及允許其它編碼選項(xiàng)的額外語法元素。有關(guān)此方面的進(jìn)一步細(xì)節(jié)，請(qǐng)參考AAC標(biāo)準(zhǔn)有關(guān)其它編碼選項(xiàng)。
[0033]為了略為更加精確，量化及定標(biāo)模塊42可被配置為傳輸每頻譜列k的量化變換系數(shù)值，當(dāng)重新定標(biāo)時(shí)，其獲得個(gè)別頻譜列k的重建變換系數(shù)，即X_reScal，當(dāng)乘以
[0034]增益=2°.25.(sf_sf-°ffset)
[0035]其中，sf為個(gè)別量化變換系數(shù)所屬的個(gè)別定標(biāo)因子帶的定標(biāo)因子，Sf_offSet為常數(shù)，例如可設(shè)定為100。
[0036]如此，定標(biāo)因子在對(duì)數(shù)域內(nèi)定義。定標(biāo)因子可在比特流36內(nèi)連同頻譜存取彼此差異編碼，亦即只有頻譜鄰近定標(biāo)因子sf間的差異可在比特流內(nèi)傳輸。相對(duì)于前述全域增益值(global_gain value)被差異編碼的第一定標(biāo)因子sf可在比特流內(nèi)傳輸。下文說明將關(guān)注此語法元素global_gain。
[0037]global_gain值可在對(duì)數(shù)域在比特流內(nèi)傳輸。換言之，模塊42可被配置為取目前頻譜的第一定標(biāo)因子sf作為global_gain。然后,此sf值可與零差異地傳輸,及隨后的sf值與個(gè)別前趨值差異傳輸。
[0038]顯然，當(dāng)一致地在全部幀30上進(jìn)行時(shí)，改變global_gain，將改變重建變換的能量，而如此轉(zhuǎn)譯成FD編碼部分26的響度變化。
[0039]具體地，F(xiàn)D巾貞的global_gain在比特流內(nèi)傳輸,使得global_gain對(duì)數(shù)式地取決于重建的音頻時(shí)域樣本的移動(dòng)平均，或反之亦然，重建的音頻時(shí)域樣本的移動(dòng)平均指數(shù)式地取決于global_gain。
[0040]類似于幀30，全部分配給LPC編碼模式的幀亦即幀32進(jìn)入LPC編碼器14。在LPC編碼器14內(nèi)，切換器20將各個(gè)幀32再劃分成一個(gè)或多個(gè)子幀52。各個(gè)子幀52可被分配給TCX編碼模式或CELP編碼模式。被分配給TCX編碼模式的子幀52傳遞至TCX編碼器16的輸入端54，而被分配給CELP編碼模式的子幀通過切換器20被傳遞至CELP編碼器18的輸入端56。
[0041]須注意圖1A和IB示出的切換器20配置在LPC編碼器14的輸入端58與TCX編碼器16及CELP編碼器18個(gè)子的輸入端54及56僅為了說明的目的，實(shí)際上，有關(guān)幀32再劃分成子幀52并且將TCX及CELP中的各編碼模式與個(gè)別子幀關(guān)聯(lián)的編碼決策，可在TCX編碼器16與CELP編碼器18的內(nèi)部元素間以互動(dòng)方式進(jìn)行，以便最大化某個(gè)權(quán)值/失真測(cè)量值。
[0042]總而言之，TCX編碼器16包含激勵(lì)發(fā)生器60、LP分析器62、及能量測(cè)定器64，其中，該LP分析器62及該能量測(cè)定器64由CELP編碼器18共同使用(共同擁有)，CELP編碼器18進(jìn)一步包括其本身的激勵(lì)發(fā)生器66。激勵(lì)發(fā)生器60、LP分析器62及能量測(cè)定器64的各自的輸入端連接至TCX編碼器16的輸入端54。同理，LP分析器62、能量測(cè)定器64及激勵(lì)發(fā)生器66各自的輸入端連接至CELP編碼器18的輸入端56。LP分析器62被配置為分析目前幀即TCX幀或CELP幀內(nèi)音頻內(nèi)容來確定線性預(yù)測(cè)系數(shù)，且連接至激勵(lì)發(fā)生器60、能量測(cè)定器64及激勵(lì)發(fā)生器66各自的系數(shù)輸入端來傳遞線性預(yù)測(cè)系數(shù)至這些組件。容后詳述，LP分析器可在原先音頻內(nèi)容的預(yù)強(qiáng)調(diào)版本上運(yùn)算，及各預(yù)強(qiáng)調(diào)濾波器可為L(zhǎng)P分析器的各輸入部分的一部分，或可連接至其輸入端的前方。同理適用于能量測(cè)定器64，容后詳述。但至于激勵(lì)發(fā)生器60，其可直接對(duì)原先信號(hào)操作。激勵(lì)發(fā)生器60、LP分析器62、能量測(cè)定器64及激勵(lì)發(fā)生器66各自的輸出端以及輸出端50連接至編碼器10的多路復(fù)用器68的各個(gè)輸入端，該多路復(fù)用器被配置為在輸出端70將所接收的語法元素多任務(wù)化成比特流36。
[0043]如前文已述，LPC分析器62被配置為確定輸入的LPC幀32的線性預(yù)測(cè)系數(shù)。有關(guān)LP分析器62可能的功能的進(jìn)一步細(xì)節(jié)請(qǐng)參考ACELP標(biāo)準(zhǔn)。一般而言，LP分析器62可使用自我相關(guān)法或協(xié)方差法來確定LPC系數(shù)。舉例來說，使用自我相關(guān)法，LP分析器62可使用李杜(Levinson-Durban)演繹法則,解出LPC系數(shù)來產(chǎn)生自我相關(guān)矩陣。如本領(lǐng)域已知的，LPC系數(shù)限定一種合成濾波器，其粗略地仿真人類聲道模型，而當(dāng)通過激勵(lì)信號(hào)驅(qū)動(dòng)時(shí)，大致上仿真氣流通過聲帶的模型。這種合成濾波器通過LP分析器62使用線性預(yù)測(cè)模型化。聲道形狀改變速率受限制，據(jù)此，LP分析器62可使用適應(yīng)于該限制的更新速率且與幀32的幀率不同的更新速率，來更新線性預(yù)測(cè)系數(shù)。LP分析器62執(zhí)行LP分析對(duì)組件60、64及66等某些濾波器提供信息，諸如:
[0044]線性預(yù)測(cè)合成濾波器H (Z)；
[0045]其反濾波器，亦即線性預(yù)測(cè)分析濾波器或白化濾波器A(Z)，其中
【權(quán)利要求】
1.一種CELP譯碼器，包括: 激勵(lì)發(fā)生器(540)，被配置為產(chǎn)生比特流(544)的目前幀的目前激勵(lì)(542)，該產(chǎn)生通過基于所述比特流(544)內(nèi)的目前幀的自適應(yīng)碼簿指標(biāo)(550)及過去激勵(lì)(548)，構(gòu)造自適應(yīng)碼簿激勵(lì)(546)；基于所述比特流(544)內(nèi)的目前幀的創(chuàng)新碼簿指標(biāo)(554)，構(gòu)造創(chuàng)新碼簿激勵(lì)(552)；計(jì)算由所述比特流(36，134，304，514)內(nèi)的線性預(yù)測(cè)濾波系數(shù)(556)所構(gòu)造的加權(quán)線性預(yù)測(cè)合成濾波器而頻譜加權(quán)的所述創(chuàng)新碼簿激勵(lì)(546)的能量的估值；基于所述比特流(544)內(nèi)的全域增益值(560)與估算的所述能量間的比，設(shè)定所述創(chuàng)新碼簿激勵(lì)(552)的增益；以及組合所述自適應(yīng)碼簿激勵(lì)(546)和所述創(chuàng)新碼簿激勵(lì)(552)以獲得所述目前激勵(lì)(542);以及線性預(yù)測(cè)合成濾波器(542)，被配置為基于所述線性預(yù)測(cè)濾波系數(shù)(556)而濾波所述目前激勵(lì)(542)。
2.根據(jù)權(quán)利要求1所述的CELP譯碼器，其中，所述激勵(lì)發(fā)生器出0，66，146，416，440，444,540)被配置為在構(gòu)造所述自適應(yīng)碼簿激勵(lì)(556，520，546)時(shí)，根據(jù)所述自適應(yīng)碼簿指標(biāo)(526，550，546，556)使用濾波器來濾波所述過去激勵(lì)(420，446，524，548)。
3.根據(jù)權(quán)利要求1所述的CELP譯碼器，其中，所述激勵(lì)發(fā)生器(540)被配置為構(gòu)造所述創(chuàng)新碼簿激勵(lì)(552)，使得后者包括具有多個(gè)非零脈沖的零向量，所述非零脈沖的數(shù)目及位置由所述創(chuàng)新碼簿指標(biāo)(554)指示。
4.根據(jù)權(quán)利要求1所述的CELP譯碼器，其中，所述激勵(lì)發(fā)生器(540)被配置為在計(jì)算所述創(chuàng)新碼簿激勵(lì)的能量的估值時(shí)，用下式濾波所述創(chuàng)新碼簿激勵(lì)(552)， mz) kz) HrmpJ-) 其中，所述線性預(yù)測(cè)合成濾波器被配置為根據(jù)濾波所述目前激勵(lì)(542)，其中W(z)^歲ζ/>)及Y為聽覺加權(quán)因子,Hraiph = 1-αζΛ α為高頻增強(qiáng)因子,其中,所述激勵(lì)發(fā)生器(540)進(jìn)一步被配置為計(jì)算經(jīng)濾波的所述創(chuàng)新碼簿激勵(lì)的樣本的平方和以獲得所述能量的所述估值。
5.根據(jù)權(quán)利要求1所述的CELP譯碼器，其中，所述激勵(lì)發(fā)生器(540)被配置為在組合所述自適應(yīng)碼簿激勵(lì)(546)和所述創(chuàng)新碼簿激勵(lì)(552)時(shí)，形成根據(jù)所述自適應(yīng)碼簿指標(biāo)(550)以加權(quán)因子加權(quán)的所述自適應(yīng)碼簿激勵(lì)(546)與以所述增益加權(quán)的所述創(chuàng)新碼簿激勵(lì)(552)的加權(quán)和。
6.一種CELP編碼器，包括: 線性預(yù)測(cè)分析器(502)，被配置生成對(duì)音頻內(nèi)容(512)的目前幀(510)的線性預(yù)測(cè)濾波系數(shù)(508)，以及將所述線性預(yù)測(cè)濾波系數(shù)(508)編碼成比特流(514)；激勵(lì)發(fā)生器(504)被配置為將所述目前幀(510)的目前激勵(lì)(516)確定為自適應(yīng)碼簿激勵(lì)(520)與創(chuàng)新碼簿激勵(lì)(522)的組合，而當(dāng)基于線性預(yù)測(cè)濾波系數(shù)通過線性預(yù)測(cè)合成濾波器濾波時(shí)，恢復(fù)所述目前幀(510)，通過構(gòu)造由所述目前幀(510)的自適應(yīng)碼簿指標(biāo)(526)及過去激勵(lì)(524)所限定的所述自適應(yīng)碼簿激勵(lì)(520)，以及將所述自適應(yīng)碼簿指標(biāo)(526)編碼成所述比特流(514);以及構(gòu)造由所述目前幀(510)的創(chuàng)新碼簿指標(biāo)(528)限定的所述創(chuàng)新碼簿激勵(lì)(522)，以及將所述創(chuàng)新碼簿指標(biāo)(528)編碼成所述比特流(514);以及能量測(cè)定器(506)，被配置為確定加權(quán)濾波器濾波的所述目前幀的音頻內(nèi)容的版本的能量，以獲得全域增益值(530)，以及將所述全域增益值(530)編碼成所述比特流(514)，所述加權(quán)濾波器由所述線性預(yù)測(cè)濾波系數(shù)(508)解釋。
7.根據(jù)權(quán)利要求6所述的CELP編碼器，其中，所述線性預(yù)測(cè)分析器(502)被配置為通過將線性預(yù)測(cè)分析施加至開窗的且根據(jù)預(yù)定前置增強(qiáng)濾波器而前置增強(qiáng)的音頻內(nèi)容(512)的版本而確定所述線性預(yù)測(cè)濾波系數(shù)(508)。
8.根據(jù)權(quán)利要求6所述的CELP編碼器，其中，所述激勵(lì)發(fā)生器(504)被配置為在構(gòu)造所述自適應(yīng)碼簿激勵(lì)(520)和所述創(chuàng)新碼簿激勵(lì)(522)時(shí)，相對(duì)于所述音頻內(nèi)容(512)最小化聽覺加權(quán)失真測(cè)量值。
9.根據(jù)權(quán)利要求6所述的CELP編碼器，其中，所述激勵(lì)發(fā)生器(504)被配置為在構(gòu)造所述自適應(yīng)碼簿激勵(lì)(520)和所述創(chuàng)新碼簿激勵(lì)(522)時(shí)，使用聽覺加權(quán)濾波器相對(duì)于所述音頻內(nèi)容(512)最小化聽覺加權(quán)失真測(cè)量值，
W(z) = A(z/ Y ), 其中，Y為聽覺加權(quán)因子，A(Z)為1/H(z)，其中，H(Z)為線性預(yù)測(cè)合成濾波器，及其中，所述能量測(cè)定器(506)被配置為使用所述聽覺加權(quán)濾波器作為加權(quán)濾波器。
10.根據(jù)權(quán)利要求6所述的CELP編碼器，其中，所述激勵(lì)發(fā)生器(504)被配置為執(zhí)行激勵(lì)更新以獲得下一幀的過去激勵(lì)，通過使用下式通過濾波由所述創(chuàng)新碼簿指標(biāo)(522)內(nèi)所含第一信息所限定的創(chuàng)新碼簿向量來估算創(chuàng)新碼簿激勵(lì)能量估值，
11.一種CELP譯碼方法，包括: 通過下列處理產(chǎn)生比特流(544)的目前幀的目前激勵(lì)(542):基于所述比特流(544)內(nèi)的所述目前幀的自適應(yīng)碼簿指標(biāo)(550)和過去激勵(lì)(548)而構(gòu)造自適應(yīng)碼簿激勵(lì)(546)；基于所述比特流(544)內(nèi)的所述目前幀的創(chuàng)新碼簿指標(biāo)(554)而構(gòu)造創(chuàng)新碼簿激勵(lì)(552)；計(jì)算由所述比特流(36，134，304，514)內(nèi)的線性預(yù)測(cè)濾波系數(shù)(556)所構(gòu)造的加權(quán)線性預(yù)測(cè)合成濾波器而頻譜加權(quán)的所述創(chuàng)新碼簿激勵(lì)(546)的能量的估值；基于所述比特流(544)內(nèi)的全域增益值(560)與估算的所述能量間的比，設(shè)定所述創(chuàng)新碼簿激勵(lì)(552)的增益；以及組合所述自適應(yīng)碼簿激勵(lì)(546)和所述創(chuàng)新碼簿激勵(lì)(552)以獲得所述目前激勵(lì)(542);以及通過線性預(yù)測(cè)合成濾波器(542)基于所述線性預(yù)測(cè)濾波系數(shù)(556)而濾波所述目前激勵(lì)(542)。
12.—種CELP編碼方法，包括: 執(zhí)行線性預(yù)測(cè)分析來產(chǎn)生音頻內(nèi)容(512)的目前幀(510)的線性預(yù)測(cè)濾波系數(shù)(508)，及將所述線性預(yù)測(cè)濾波系數(shù)(508)編碼成比特流(514)；確定目前幀(510)的目前激勵(lì)(516)為自適應(yīng)碼簿激勵(lì)(520)與創(chuàng)新碼簿激勵(lì)(522)的組合，當(dāng)由線性預(yù)測(cè)合成濾波器基于線性預(yù)測(cè)濾波系數(shù)(508)濾波時(shí)，其通過如下處理恢復(fù)所述目前幀(510)，構(gòu)造由所述目前幀(510)的自適應(yīng)碼簿指標(biāo)(526)和過去激勵(lì)(524)所限定的自適應(yīng)碼簿激勵(lì)(520)，及將所述自適應(yīng)碼簿指標(biāo)(526)編碼成比特流(514);以及構(gòu)造由所述目前幀(510)的創(chuàng)新碼簿指標(biāo)(528)所限定的創(chuàng)新碼簿激勵(lì)(522)，及將所述創(chuàng)新碼簿指標(biāo)(528)編碼成所述比特流(514);以及確定以加權(quán)濾波器濾波的所述目前幀的音頻內(nèi)容的版本的能量，以獲得全域增益值(530)，以及將所述全域增益值(530)編碼成所述比特流(514)，所述加權(quán)濾波器由所述線性預(yù)測(cè)濾波系數(shù)(508)解釋。
【文檔編號(hào)】G10L19/083GK104021795SQ201410256091
【公開日】2014年9月3日申請(qǐng)日期:2010年10月19日優(yōu)先權(quán)日:2009年10月20日
【發(fā)明者】拉爾夫·蓋爾, 紀(jì)堯姆·福奇斯, 馬庫斯·穆賴特魯斯, 伯恩哈德·格里申請(qǐng)人:弗蘭霍菲爾運(yùn)輸應(yīng)用研究公司

完整全部詳細(xì)技術(shù)資料下載