用于在具有不同采樣速率的各幀之間的過渡時(shí)的聲音信號(hào)的線性預(yù)測編碼和解碼的方法、編碼器和解碼器與流程

文檔序號(hào)：11851778閱讀：578來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

用于在具有不同采樣速率的各幀之間的過渡時(shí)的聲音信號(hào)的線性預(yù)測編碼和解碼的方法、編碼器和解碼器與流程

本公開涉及聲音編碼的領(lǐng)域。更具體地說，本公開涉及用于在具有不同采樣速率的各幀之間的過渡時(shí)的聲音信號(hào)的線性預(yù)測編碼和解碼的方法、編碼器和解碼器。

背景技術(shù)：

對(duì)于具有良好主觀質(zhì)量/比特率折衷的高效數(shù)字寬帶話音/音頻編碼技術(shù)的需求關(guān)于大量應(yīng)用(例如音頻/視頻電話會(huì)議、多媒體以及無線應(yīng)用以及互聯(lián)網(wǎng)和分組網(wǎng)絡(luò)應(yīng)用)正在增加。直到近來，200-3400Hz的范圍中的電話帶寬才并非主要用在話音編碼應(yīng)用中。然而，存在增加的對(duì)于寬帶應(yīng)用的需求，以增加話音信號(hào)的智能性和自然性。發(fā)現(xiàn)范圍50-7000Hz中的帶寬對(duì)于傳遞面對(duì)面話音質(zhì)量是足夠的。對(duì)于音頻信號(hào)，該范圍給出可接受的音頻質(zhì)量，但仍低于在范圍20-20000Hz中操作的CD(壓縮盤)質(zhì)量。

話音編碼器將話音信號(hào)轉(zhuǎn)換為通過通信信道發(fā)送(或存儲(chǔ)在存儲(chǔ)介質(zhì)中)的數(shù)字比特流。話音信號(hào)受數(shù)字化(通過通常每采樣16比特受采樣和量化)，并且話音編碼器具有在保持良好主觀話音質(zhì)量的同時(shí)通過較小數(shù)量的比特表示這些數(shù)字采樣的作用。話音解碼器或合成器對(duì)所發(fā)送或存儲(chǔ)的比特流進(jìn)行操作，并且將其轉(zhuǎn)換回到聲音信號(hào)。

能夠?qū)崿F(xiàn)良好質(zhì)量/比特率折衷的最佳可用技術(shù)之一是所謂的CELP(碼激勵(lì)線性預(yù)測)技術(shù)。根據(jù)該技術(shù)，所采樣的話音信號(hào)在通常稱為幀的L個(gè)采樣的連續(xù)塊中受處理，其中，L是(與話音的10-30ms對(duì)應(yīng)的)某預(yù)定數(shù)。在CELP中，每一幀計(jì)算并且發(fā)送LP(線性預(yù)測)合成濾波器。L個(gè)采樣幀進(jìn)一步劃分為N個(gè)采樣的稱為子幀的更小的塊，其中，L＝kN，并且k是幀中的子幀的數(shù)量(N通常與話音的4-10ms對(duì)應(yīng))。在每個(gè)子幀中確定激勵(lì)信號(hào)，其通常包括兩個(gè)分量：一個(gè)來自過去激勵(lì)(又稱為音調(diào)貢獻(xiàn)或自適應(yīng)碼本)，另一個(gè)來自新進(jìn)的碼本(又稱為固定碼本)。該激勵(lì)信號(hào)被發(fā)送并且在解碼器處用作LP合成濾波器的輸入，以獲得合成的話音。

為了根據(jù)CELP技術(shù)合成話音，憑借通過對(duì)話音信號(hào)的譜特性進(jìn)行建模的時(shí)變?yōu)V波對(duì)來自新進(jìn)的碼本的適當(dāng)?shù)拇a矢量進(jìn)行濾波來合成N個(gè)采樣的每個(gè)塊。這些濾波器包括音調(diào)合成濾波器(通常實(shí)現(xiàn)為包含過去激勵(lì)信號(hào)的自適應(yīng)碼本)和LP合成濾波器。在編碼器端處，對(duì)于來自新進(jìn)的碼本的碼矢量的全部或其子集計(jì)算合成輸出(碼本搜索)。所保留的新進(jìn)的碼矢量是根據(jù)感知上加權(quán)的失真測度產(chǎn)生最接近原始話音信號(hào)的合成輸出的碼矢量。使用通常從LP合成濾波器推導(dǎo)的所謂的感知加權(quán)濾波器執(zhí)行這種感知加權(quán)。

在基于LP的編碼器(例如CELP)中，LP濾波器被計(jì)算，然后每幀一次地被量化并且發(fā)送。然而，為了確保LP合成濾波器的平滑演變，基于來自過去幀的LP參數(shù)在每個(gè)子幀中內(nèi)插濾波器參數(shù)。歸因于濾波器穩(wěn)定性問題，LP濾波器參數(shù)不適合于量化。通常使用對(duì)于量化和內(nèi)插更高效的另一LP表示。一般使用的LP參數(shù)表示是線譜頻率(LSF)域。

在寬帶編碼中，聲音信號(hào)以每秒16000個(gè)采樣被采樣，并且所編碼的帶寬擴(kuò)展上至7kHz。然而，在低比特率寬帶編碼(小于16kbit/s)時(shí)，通常更高效的是，將輸入信號(hào)下采樣為稍微更低的速率，并且將CELP模型以用于較低帶寬，然后在解碼器處使用帶寬擴(kuò)展以生成上至7kHz的信號(hào)。這是歸因于這樣的事實(shí)：CELP模型對(duì)具有高能量的較低頻率建模得比較高頻率更好。因此，更高效的是，在低比特率時(shí)將模型關(guān)注于較低帶寬。AMR-WB標(biāo)準(zhǔn)(參考文獻(xiàn)[1])是這樣的編碼示例：其中，輸入信號(hào)下采樣為每秒12800個(gè)采樣，并且CELP對(duì)上至6.4kHz的信號(hào)進(jìn)行編碼。在解碼器處，帶寬擴(kuò)展用于生成從6.4kHz到7kHz的信號(hào)。然而，在比16kbit/s更高的比特率時(shí)，由于存在足夠的比特以表示整個(gè)帶寬，因此更高效的是，使用CELP以對(duì)上至7kHz的信號(hào)進(jìn)行編碼。

最新近的編碼器是多速率編碼器，其覆蓋寬范圍的比特率，以在不同的應(yīng)用場景中實(shí)現(xiàn)靈活性。再次，AMR-WB是這樣的示例：其中，編碼器按從6.6kbit/s到23.85kbit/s的比特率進(jìn)行操作。在多速率編碼器中，編解碼器應(yīng)能夠基于幀在不同比特率之間進(jìn)行切換，而不引入切換假聲。在AMR-WB中，由于在12.8kHz內(nèi)部采樣速率時(shí)所有速率使用CELP，因此這是容易實(shí)現(xiàn)的。然而，在使用以小于16kbit/s的比特率的12.8kHz采樣以及高于16kbit/s的比特率的16kHz采樣的新近的編碼器中，與在使用不同采樣速率的各幀之間切換比特率有關(guān)的問題需要解決。主要問題在于LP濾波器過渡，并且在于合成濾波器和自適應(yīng)碼本的記憶。

因此，仍需要用于在具有不同內(nèi)部采樣速率的兩個(gè)比特率之間切換基于LP的編解碼器的高效方法。

技術(shù)實(shí)現(xiàn)要素：

根據(jù)本公開，提供一種在用于將線性預(yù)測(LP)濾波器參數(shù)從聲音信號(hào)采樣速率S1轉(zhuǎn)換為聲音信號(hào)采樣速率S2的聲音信號(hào)編碼器中實(shí)現(xiàn)的方法。使用LP濾波器參數(shù)在采樣速率S1計(jì)算LP合成濾波器的功率譜。修改所述LP合成濾波器的功率譜，以將其從所述采樣速率S1轉(zhuǎn)換為所述采樣速率S2。逆變換所述LP合成濾波器的修改后的功率譜，以確定在所述采樣速率S2的所述LP合成濾波器的自相關(guān)。在所述采樣速率S2使用所述自相關(guān)以計(jì)算所述LP濾波器參數(shù)。

根據(jù)本公開，還提供一種在用于將接收到的線性預(yù)測(LP)濾波器參數(shù)從聲音信號(hào)采樣速率S1轉(zhuǎn)換為聲音信號(hào)采樣速率S2的聲音信號(hào)解碼器中實(shí)現(xiàn)的方法。使用接收到的LP濾波器參數(shù)在采樣速率S1計(jì)算LP合成濾波器的功率譜。修改所述LP合成濾波器的功率譜，以將其從所述采樣速率S1轉(zhuǎn)換為所述采樣速率S2。逆變換所述LP合成濾波器的修改后的功率譜，以確定在所述采樣速率S2的所述LP合成濾波器的自相關(guān)。在所述采樣速率S2使用所述自相關(guān)以計(jì)算所述LP濾波器參數(shù)。

根據(jù)本公開，還提供一種用于在將線性預(yù)測(LP)濾波器參數(shù)從聲音信號(hào)采樣速率S1轉(zhuǎn)換為聲音信號(hào)采樣速率S2的聲音信號(hào)編碼器中使用的設(shè)備。所述設(shè)備包括處理器，被配置為：

·在所述采樣速率S1使用接收到的LP濾波器參數(shù)計(jì)算LP合成濾波器的功率譜；

·修改所述LP合成濾波器的功率譜，以將其從所述采樣速率S1轉(zhuǎn)換為所述采樣速率S2；

·逆變換所述LP合成濾波器的修改后的功率譜，以確定在所述采樣速率S2的所述LP合成濾波器的自相關(guān)；以及

·在所述采樣速率S2使用所述自相關(guān)以計(jì)算所述LP濾波器參數(shù)。

本公開還涉及一種用于在用于將接收到的線性預(yù)測(LP)濾波器參數(shù)從聲音信號(hào)采樣速率S1轉(zhuǎn)換為聲音信號(hào)采樣速率S2的聲音信號(hào)解碼器中使用的設(shè)備。所述設(shè)備包括處理器，被配置為：

·在所述采樣速率S1使用接收到的LP濾波器參數(shù)計(jì)算LP合成濾波器的功率譜；

·修改所述LP合成濾波器的功率譜，以將其從所述采樣速率S1轉(zhuǎn)換為所述采樣速率S2；

·逆變換所述LP合成濾波器的修改后的功率譜，以確定在所述采樣速率S2的所述LP合成濾波器的自相關(guān)；以及

·在所述采樣速率S2使用所述自相關(guān)以計(jì)算所述LP濾波器參數(shù)。

在閱讀參照附圖僅通過示例的方式給出的本公開的說明性實(shí)施例的以下非限定性描述時(shí)，其前述和其它目的、優(yōu)點(diǎn)和特征將變得更清楚。

附圖說明

在附圖中：

圖1是描述使用聲音編碼和解碼的示例的聲音通信系統(tǒng)的示意性框圖；

圖2是示出圖1的聲音通信系統(tǒng)的部分的基于CELP的編碼器和解碼器的結(jié)構(gòu)的示意性框圖；

圖3示出LP參數(shù)的成幀和內(nèi)插的示例；

圖4是示出用于在兩個(gè)不同采樣速率之間轉(zhuǎn)換LP濾波器參數(shù)的實(shí)施例的框圖；以及

圖5是形成圖1和圖2的編碼器和/或解碼器的硬件組件的示例配置的簡化框圖。

具體實(shí)施方式

本公開的非限定性說明性實(shí)施例涉及一種用于在使用不同內(nèi)部采樣速率的各幀之間在基于LP的編解碼器中的高效切換的方法和設(shè)備。所述切換方法和設(shè)備可以用于包括話音信號(hào)和音頻信號(hào)的任何聲音信號(hào)。通過示例的方式給出16kHz內(nèi)部采樣速率與12.8kHz內(nèi)部采樣速率之間的切換，然而，切換方法和設(shè)備也可以應(yīng)用于其它采樣速率。

圖1是描述使用聲音編碼和解碼的示例的聲音通信系統(tǒng)的示意性框圖。聲音通信系統(tǒng)100支持穿過通信信道101發(fā)送并且再現(xiàn)聲音信號(hào)。通信信道101可以包括例如有線鏈路、光鏈路或光纖鏈路。替代地，通信信道101可以至少部分地包括射頻鏈路。射頻鏈路一般支持例如可以關(guān)于蜂窩電話發(fā)現(xiàn)的需要共享的帶寬資源的多個(gè)同時(shí)話音通信。雖然未示出，但通信信道101可以由接收并且存儲(chǔ)所編碼的聲音信號(hào)以用于稍后回放的通信系統(tǒng)101的單個(gè)設(shè)備實(shí)施例中的存儲(chǔ)設(shè)備替換。

仍參照?qǐng)D1，例如，麥克風(fēng)102產(chǎn)生原始模擬聲音信號(hào)103，其提供給模數(shù)(A/D)轉(zhuǎn)換器104，以用于將其轉(zhuǎn)換為原始數(shù)字聲音信號(hào)105。也可以從存儲(chǔ)設(shè)備(未示出)記錄并且提供原始數(shù)字聲音信號(hào)105。聲音編碼器106對(duì)原始數(shù)字聲音信號(hào)105進(jìn)行編碼，由此產(chǎn)生編碼參數(shù)集合107，其編碼為二進(jìn)制形式并且傳遞到可選信道編碼器108?？蛇x信道編碼器108當(dāng)出現(xiàn)時(shí)將冗余性加入到編碼參數(shù)的二進(jìn)制表示，然后通過通信信道101發(fā)送它們。在接收機(jī)側(cè)上，可選信道解碼器109利用數(shù)字比特流111中的上述冗余信息，以檢測并且校正可能在通過通信信道101的發(fā)送期間已經(jīng)產(chǎn)生的信道誤碼，產(chǎn)生接收到的編碼參數(shù)112。聲音解碼器110轉(zhuǎn)換接收到的編碼參數(shù)112，以用于創(chuàng)建所合成的數(shù)字聲音信號(hào)113。聲音解碼器110中所重構(gòu)的所合成的數(shù)字聲音信號(hào)113在數(shù)模(D/A)轉(zhuǎn)換器115中轉(zhuǎn)換為所合成的模擬聲音信號(hào)114，并且在外放揚(yáng)聲器單元116中被回放。替代地，所合成的數(shù)字聲音信號(hào)113也可以提供給并且記錄在存儲(chǔ)設(shè)備(未示出)中。

圖2是示出圖1的聲音通信系統(tǒng)的部分的基于CELP的編碼器和解碼器的結(jié)構(gòu)的示意性框圖。如圖2所示，聲音編解碼器包括兩個(gè)基本部分：聲音編碼器106以及聲音解碼器110，二者在圖1的前面描述中介紹。編碼器106被提供有原始數(shù)字聲音信號(hào)105，確定下文中所描述的表示原始模擬聲音信號(hào)103的編碼參數(shù)107。參數(shù)107編碼為數(shù)字比特流111，其使用通信信道(例如圖1的通信信道101)發(fā)送到解碼器110。聲音解碼器110將所合成的數(shù)字聲音信號(hào)113重構(gòu)為與原始數(shù)字聲音信號(hào)105盡可能相似。

目前，最廣泛的話音編碼技術(shù)基于線性預(yù)測(LP)(具體地說，CELP)。在基于LP的編碼中，憑借通過具有傳遞函數(shù)1/A(z)的LP合成濾波器216對(duì)激勵(lì)214進(jìn)行濾波產(chǎn)生所合成的數(shù)字聲音信號(hào)113。在CELP中，激勵(lì)214典型地包括兩個(gè)部分：第一級(jí)，自適應(yīng)碼本貢獻(xiàn)222，選自自適應(yīng)碼本218并且放大達(dá)自適應(yīng)碼本增益g_p226；以及第二級(jí)，固定碼本貢獻(xiàn)224，選自固定碼本220，并且放大達(dá)固定碼本增益g_c228。一般而言，自適應(yīng)碼本貢獻(xiàn)222對(duì)激勵(lì)的周期性部分進(jìn)行建模，固定碼本貢獻(xiàn)214加入以對(duì)聲音信號(hào)的演變進(jìn)行建模。

通過典型地20ms的幀處理聲音信號(hào)，并且每幀一次地發(fā)送LP濾波器參數(shù)。在CELP中，幀進(jìn)一步劃分為若干子幀，以對(duì)激勵(lì)進(jìn)行編碼。子幀長度典型地是5ms。

CELP使用稱為分析合成的原理，其中，可能的解碼器輸出已經(jīng)在編碼器106處的編碼處理期間得以嘗試(合成)并且然后與原始數(shù)字聲音信號(hào)105進(jìn)行比較。編碼器106因此包括與解碼器110的元件相似的元件。這些元件包括：自適應(yīng)碼本貢獻(xiàn)250，選自自適應(yīng)碼本242，其提供與加權(quán)合成濾波器H(z)(見238)的沖擊響應(yīng)卷積的過去激勵(lì)信號(hào)v(n)(LP合成濾波器1/A(z)和感知加權(quán)濾波器W(z)的級(jí)聯(lián))，其結(jié)果y₁(n)放大達(dá)自適應(yīng)碼本增益g_p240。此外，所包括的是固定碼本貢獻(xiàn)252，選自固定碼本244，其提供與加權(quán)合成濾波器H(z)的沖擊響應(yīng)卷積的新進(jìn)的碼矢量c_k(n)，其結(jié)果y₂(n)放大達(dá)固定碼本增益g_c248。

編碼器106還包括感知加權(quán)濾波器W(z)233以及LP合成濾波器1/A(z)和感知加權(quán)濾波器W(z)的級(jí)聯(lián)(H(z))的零輸入響應(yīng)的提供器234。減法器236、254和256分別從感知加權(quán)濾波器233所濾波的原始數(shù)字聲音信號(hào)105減去零輸入響應(yīng)、自適應(yīng)碼本貢獻(xiàn)250和固定碼本貢獻(xiàn)252，以提供原始數(shù)字聲音信號(hào)105與所合成的數(shù)字聲音信號(hào)113之間的均方差232。

碼本搜索在感知加權(quán)域中使得原始數(shù)字聲音信號(hào)105與所合成的數(shù)字聲音信號(hào)113之間的均方差232最小化，其中，離散時(shí)間指數(shù)n＝0、1、……、N-1，N是子幀的長度。感知加權(quán)濾波器W(z)利用頻率掩蔽效應(yīng)，并且典型地是從LP濾波器A(z)推導(dǎo)的。

用于WB(寬帶，50Hz-7000Hz的帶寬)的感知加權(quán)濾波器W(z)的示例可見于參考文獻(xiàn)[1]。

由于LP合成濾波器1/A(z)和加權(quán)濾波器W(z)的記憶獨(dú)立于所搜索的碼矢量，因此可以在固定碼本搜索之前從原始數(shù)字聲音信號(hào)105減去該記憶。然后可以通過圖2中的H(z)所表示的濾波器1/A(z)和W(z)的級(jí)聯(lián)的沖擊響應(yīng)的卷積完成候選碼矢量的濾波。

從編碼器106發(fā)送到解碼器110的數(shù)字比特流111典型地包含以下參數(shù)107：LP濾波器A(z)的量化的參數(shù)、自適應(yīng)碼本242和固定碼本244的指數(shù)以及自適應(yīng)碼本242和固定碼本244的增益g_p240和g_c248。

當(dāng)在具有不同采樣速率的幀邊界處進(jìn)行切換時(shí)轉(zhuǎn)換LP濾波器參數(shù)

在基于LP的編碼中，LP濾波器A(z)得以每幀一次地確定，并且然后對(duì)于每個(gè)子幀內(nèi)插。圖3示出LP參數(shù)的成幀和內(nèi)插的示例。在該示例中，目前的幀劃分為四個(gè)子幀SF1、SF2、SF3和SF4，并且LP分析窗口在最后子幀SF4處居中。因此，如在最后子幀中那樣使用源自目前幀F(xiàn)1中的LP分析的LP參數(shù)，也就是說，SF4＝F1。對(duì)于前三個(gè)子幀SF1、SF2和SF3，通過在目前幀F(xiàn)1和先前幀F(xiàn)0中內(nèi)插參數(shù)獲得LP參數(shù)。也就是說：

SF1＝0.75F0+0.25F1；

SF2＝0.5F0+0.5F1；

SF3＝0.25F0+0.75F1

SF4＝F1。

取決于LP分析窗口形狀、長度和位置，可以替代地使用其它內(nèi)插示例。在另一實(shí)施例中，編碼器在12.8kHz內(nèi)部采樣速率與16kHz內(nèi)部采樣速率之間切換，其中，在12.8kHz時(shí)使用每幀4個(gè)子幀，在16kHz時(shí)使用每幀5個(gè)子幀，并且其中，還在目前幀(Fm)的中間量化LP參數(shù)。在該另外實(shí)施例中，用于12.8kHz幀的LP參數(shù)內(nèi)插給出如下：

SF1＝0.5F0+0.5Fm；

SF2＝Fm；

SF3＝0.5Fm+0.5F1；

SF4＝F1。

對(duì)于16kHz采樣，內(nèi)插給出如下：

SF1＝0.55F0+0.45Fm；

SF2＝0.15F0+0.85Fm；

SF3＝0.75Fm+0.25F1；

SF4＝0.35Fm+0.65F1；

SF5＝F1。

LP分析產(chǎn)生使用下式計(jì)算LP合成濾波器的參數(shù)：

$<mrow> <mfrac> <mn>1</mn> <mrow> <mi>A</mi> <mrow> <mo>(</mo> <mi>z</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>a</mi> <mi>i</mi> </msub> <msup> <mi>z</mi> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </msup> </mrow> </mfrac> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <msub> <mi>a</mi> <mn>1</mn> </msub> <msup> <mi>z</mi> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>+</mo> <msub> <mi>a</mi> <mn>2</mn> </msub> <msup> <mi>z</mi> <mrow> <mo>-</mo> <mn>2</mn> </mrow> </msup> <mo>+</mo> <mn>...</mn> <mo>+</mo> <msub> <mi>a</mi> <mi>M</mi> </msub> <msup> <mi>z</mi> <mrow> <mo>-</mo> <mi>M</mi> </mrow> </msup> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>$

其中，a_i，i＝1、……、M是LP濾波器參數(shù)，M是濾波器階數(shù)。

LP濾波器參數(shù)變換到另一域，目的是量化和內(nèi)插。通常使用的其它LP參數(shù)表示是反射系數(shù)、對(duì)數(shù)面積比率、導(dǎo)抗譜配對(duì)(用在AMR-WB中；參考文獻(xiàn)[1])以及線譜配對(duì)(其又稱為線譜頻率(LSF))。在該說明性實(shí)施例中，使用線譜頻率表示?？梢杂糜趯P參數(shù)轉(zhuǎn)換為LSF參數(shù)并且反之亦然的方法的示例可見于參考文獻(xiàn)[2]中。前述段落中的內(nèi)插示例應(yīng)用于LSF參數(shù)，其可以處于0至Fs/2之間的范圍中(其中，F(xiàn)s是采樣頻率)的頻域中或0至π之間的比例化的頻域中或余弦域(比例化頻率的余弦)中。

如上所述，可以在不同的比特率時(shí)使用不同內(nèi)部采樣速率，以改進(jìn)基于多速率LP的編碼的質(zhì)量。在該說明性實(shí)施例中，使用多速率CELP寬帶編碼器，其中，在較低比特率時(shí)使用12.8kHz的內(nèi)部采樣速率，在較高比特率時(shí)使用16kHz的內(nèi)部采樣速率。在12.8kHz采樣速率時(shí)，LSF覆蓋從0到6.4kHz的帶寬，而在16kHz采樣速率，它們覆蓋從0到8kHz的范圍。當(dāng)在內(nèi)部采樣速率不同的兩個(gè)幀之間切換比特率時(shí)，一些問題要解決以確保無縫切換。這些問題包括在不同采樣速率時(shí)的LP濾波器參數(shù)的內(nèi)插以及合成濾波器和自適應(yīng)碼本的記憶。

本公開引入一種用于在處于不同內(nèi)部采樣速率的兩個(gè)幀之間高效內(nèi)插LP參數(shù)的方法。通過示例的方式，考慮12.8kHz采樣速率與16kHz采樣速率之間的切換。然而，所公開的技術(shù)不限于這些特定采樣速率，并且可以應(yīng)用于其它內(nèi)部采樣速率。

讓我們假設(shè)編碼器從具有內(nèi)部采樣速率S1的幀F(xiàn)1切換到具有內(nèi)部采樣速率S2的幀F(xiàn)2。第一幀中的LP參數(shù)表示為LSF1_S1，第二幀處的LP參數(shù)表示為LSF2_S2。為了更新幀F(xiàn)2的每個(gè)子幀中的LP參數(shù)，內(nèi)插LP參數(shù)LSF1和LSF2。為了執(zhí)行內(nèi)插，濾波器必須設(shè)置在相同的采樣速率。這要求在采樣速率S2執(zhí)行幀F(xiàn)1的LP分析。為了避免在幀F(xiàn)1中在兩個(gè)采樣速率發(fā)送LP濾波器兩次，可以對(duì)在編碼器和解碼器處都可用的過去合成信號(hào)執(zhí)行在采樣速率S2的LP分析。該方法包括：從速率S1到速率S2對(duì)過去合成信號(hào)重新采樣；以及執(zhí)行完整LP分析，該操作在解碼器處重復(fù)，這通常在計(jì)算上是費(fèi)力的。

在此公開替選方法和設(shè)備，用于將LP合成濾波器參數(shù)LSF1從采樣速率S1轉(zhuǎn)換為采樣速率S2，而無需對(duì)過去合成重新采樣并且執(zhí)行完整LP分析。在編碼和/或在解碼時(shí)所使用的該方法包括：在速率S1計(jì)算LP合成濾波器的功率譜；修改功率譜，以將其從速率S1轉(zhuǎn)換為速率S2；將修改后的功率譜轉(zhuǎn)換回到時(shí)域，以獲得在速率S2的濾波器自相關(guān)；以及最后使用自相關(guān)以在速率S2計(jì)算LP濾波器參數(shù)。

在至少一些實(shí)施例中，修改功率譜以將其從速率S1轉(zhuǎn)換為速率S2包括以下操作：

如果S1大于S2，則修改功率譜包括：截?cái)郖采樣功率譜下至K(S2/S1)個(gè)采樣，也就是說，移除K(S1-S2)/S1個(gè)采樣。

另一方面，如果S1小于S2，則修改功率譜包括：擴(kuò)展K采樣功率譜上至K(S2/S1)個(gè)采樣，也就是說，加入K(S2-S1)/S1個(gè)采樣。

可以使用Levinson-Durbin算法(見參考文獻(xiàn)[1])完成從自相關(guān)在速率S2計(jì)算LP濾波器。一旦LP濾波器轉(zhuǎn)換為速率S2，LP濾波器參數(shù)就變換到內(nèi)插域，其在該說明性實(shí)施例中為LSF域。

在圖4中概述上述方法，圖4是示出用于在兩個(gè)不同采樣速率之間轉(zhuǎn)換LP濾波器參數(shù)的實(shí)施例的框圖。

操作的序列300示出，用于計(jì)算LP合成濾波器1/A(z)的功率譜的簡單方法是在從0到2π的K個(gè)頻率處估計(jì)濾波器的頻率響應(yīng)。

合成濾波器的頻率響應(yīng)由下式給出：

$<mrow> <mfrac> <mn>1</mn> <mrow> <mi>A</mi> <mrow> <mo>(</mo> <mi>ω</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>a</mi> <mi>i</mi> </msub> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mi>j</mi> <mi>ω</mi> <mi>i</mi> </mrow> </msup> </mrow> </mfrac> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>a</mi> <mi>i</mi> </msub> <mi>cos</mi> <mrow> <mo>(</mo> <mi>ω</mi> <mi>i</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>j</mi> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>a</mi> <mi>i</mi> </msub> <mi>sin</mi> <mrow> <mo>(</mo> <mi>ω</mi> <mi>i</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>$

并且合成濾波器的功率譜計(jì)算為合成濾波器的頻率響應(yīng)的能量，給出如下：

$<mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>ω</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mo>|</mo> <mi>A</mi> <mrow> <mo>(</mo> <mi>ω</mi> <mo>)</mo> </mrow> <msup> <mo>|</mo> <mn>2</mn> </msup> </mrow> </mfrac> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <msup> <mrow> <mo>(</mo> <mn>1</mn> <mo>+</mo> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>a</mi> <mi>i</mi> </msub> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mo>(</mo> <mi>ω</mi> <mi>i</mi> <mo>)</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>a</mi> <mi>i</mi> </msub> <mi>s</mi> <mi>i</mi> <mi>n</mi> <mo>(</mo> <mi>ω</mi> <mi>i</mi> <mo>)</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>$

初始地，LP濾波器處于等于S1的速率(操作310)。通過從0到2π的頻率范圍進(jìn)行采樣計(jì)算LP合成濾波器的K采樣(即離散)功率譜(操作320)。也就是說

$<mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <msup> <mrow> <mo>(</mo> <mn>1</mn> <mo>+</mo> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>a</mi> <mi>i</mi> </msub> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mo>(</mo> <mfrac> <mrow> <mn>2</mn> <mi>π</mi> <mi>i</mi> <mi>k</mi> </mrow> <mi>K</mi> </mfrac> <mo>)</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>a</mi> <mi>i</mi> </msub> <mi>s</mi> <mi>i</mi> <mi>n</mi> <mo>(</mo> <mfrac> <mrow> <mn>2</mn> <mi>π</mi> <mi>i</mi> <mi>k</mi> </mrow> <mi>K</mi> </mfrac> <mo>)</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </mfrac> <mo>,</mo> <mi>k</mi> <mo>=</mo> <mn>0</mn> <mo>,</mo> <mn>......</mn> <mo>,</mo> <mi>K</mi> <mo>-</mo> <mn>1</mn> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>$

注意，由于從π到2π的功率譜是從0到π的功率譜的鏡像，因此可以通過僅對(duì)于k＝0、……、K/2計(jì)算P(k)減少運(yùn)算復(fù)雜度。

測試(操作330)確定以下情況中的哪些應(yīng)用。在第一情況下，采樣速率S1大于采樣速率S2，并且用于幀F(xiàn)1的功率譜被截?cái)?操作340)，從而采樣的新的數(shù)量是K(S2/S1)。

更詳細(xì)地說，當(dāng)S1大于S2時(shí)，截?cái)嗟墓β首V的長度是K₂＝K(S2/S1)個(gè)采樣。由于功率譜被截?cái)?，因此從k＝0、……、K₂/2計(jì)算它。由于功率譜在K₂/2周圍是對(duì)稱的，因此于是假設(shè)：

P(K₂/2+k)＝P(K₂/2-k)，從k＝1、……、K₂/2-1

信號(hào)的自相關(guān)的傅立葉變換給出該信號(hào)的功率譜。因此，將逆傅立葉變換應(yīng)用于截?cái)嗟墓β首V產(chǎn)生在采樣速率S2的合成濾波器的沖擊響應(yīng)的自相關(guān)。

截?cái)嗟墓β首V的逆離散傅立葉變換(IDFT)給出如下：

$<mrow> <mi>R</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>K</mi> <mn>2</mn> </msub> </mfrac> <munderover> <mo>Σ</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mi>P</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <msup> <mi>e</mi> <mrow> <mi>j</mi> <mn>2</mn> <mi>π</mi> <mi>i</mi> <mi>k</mi> <mo>/</mo> <msub> <mi>K</mi> <mn>2</mn> </msub> </mrow> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>$

由于濾波器階數(shù)是M，因此于是可以僅對(duì)于i＝0、……、M計(jì)算IDFT。此外，由于功率譜是實(shí)數(shù)并且對(duì)稱的，因此于是功率譜的IDFT也是實(shí)數(shù)并且對(duì)稱的。給定功率譜的對(duì)稱性，并且僅需要M+1個(gè)相關(guān)，那么功率譜的逆變換可以給出為：

$<mrow> <mi>R</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>K</mi> <mn>2</mn> </msub> </mfrac> <mrow> <mo>(</mo> <mi>P</mi> <mo>(</mo> <mn>0</mn> <mo>)</mo> <mo>+</mo> <msup> <mrow> <mo>(</mo> <mrow> <mo>-</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> <mi>i</mi> </msup> <mi>P</mi> <mo>(</mo> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> </mrow> <mo>)</mo> <mo>+</mo> <mn>2</mn> <msup> <mrow> <mo>(</mo> <mrow> <mo>-</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> <mi>i</mi> </msup> <munderover> <mo>Σ</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mi>P</mi> <mo>(</mo> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> <mo>-</mo> <mi>k</mi> </mrow> <mo>)</mo> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mo>(</mo> <mrow> <mn>2</mn> <mi>π</mi> <mi>i</mi> <mi>k</mi> <mo>/</mo> <msub> <mi>K</mi> <mn>2</mn> </msub> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow>$

也就是說

$<mrow> <mi>R</mi> <mrow> <mo>(</mo> <mn>0</mn> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>K</mi> <mn>2</mn> </msub> </mfrac> <mrow> <mo>(</mo> <mi>P</mi> <mo>(</mo> <mn>0</mn> <mo>)</mo> <mo>+</mo> <mi>P</mi> <mo>(</mo> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> </mrow> <mo>)</mo> <mo>+</mo> <mn>2</mn> <munderover> <mo>Σ</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mi>P</mi> <mo>(</mo> <mi>k</mi> <mo>)</mo> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow>$

$<mrow> <mi>R</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>K</mi> <mn>2</mn> </msub> </mfrac> <mrow> <mo>(</mo> <mi>P</mi> <mo>(</mo> <mn>0</mn> <mo>)</mo> <mo>-</mo> <mi>P</mi> <mo>(</mo> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> </mrow> <mo>)</mo> <mo>-</mo> <mn>2</mn> <munderover> <mo>Σ</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mi>P</mi> <mo>(</mo> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> <mo>-</mo> <mi>k</mi> </mrow> <mo>)</mo> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mo>(</mo> <mrow> <mn>2</mn> <mi>π</mi> <mi>i</mi> <mi>k</mi> <mo>/</mo> <msub> <mi>K</mi> <mn>2</mn> </msub> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mi>f</mi> <mi>o</mi> <mi>r</mi> <mi> </mi> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>3</mn> <mo>,</mo> <mn>...</mn> <mo>,</mo> <mi>M</mi> <mo>-</mo> <mn>1</mn> </mrow>$

$<mrow> <mi>R</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>K</mi> <mn>2</mn> </msub> </mfrac> <mrow> <mo>(</mo> <mi>P</mi> <mo>(</mo> <mn>0</mn> <mo>)</mo> <mo>+</mo> <mi>P</mi> <mo>(</mo> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> </mrow> <mo>)</mo> <mo>+</mo> <mn>2</mn> <munderover> <mo>Σ</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mi>P</mi> <mo>(</mo> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> <mo>-</mo> <mi>k</mi> </mrow> <mo>)</mo> <mi>cos</mi> <mo>(</mo> <mrow> <mn>2</mn> <mi>π</mi> <mi>i</mi> <mi>k</mi> <mo>/</mo> <msub> <mi>K</mi> <mn>2</mn> </msub> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mi>f</mi> <mi>o</mi> <mi>r</mi> <mi> </mi> <mi>i</mi> <mo>=</mo> <mn>2</mn> <mo>,</mo> <mn>4</mn> <mo>,</mo> <mn>...</mn> <mo>,</mo> <mi>M</mi> </mrow>$

于在采樣速率S2計(jì)算自相關(guān)之后，Levinson-Durbin算法(見參考文獻(xiàn)[1])可以用于在采樣速率S2計(jì)算LP濾波器的參數(shù)。然后，LP濾波器參數(shù)變換到LSF域，以用于與幀F(xiàn)2的LSF的內(nèi)插，以在每個(gè)子幀處獲得LP參數(shù)。

在編碼器對(duì)寬帶信號(hào)進(jìn)行編碼并且從具有內(nèi)部采樣速率S1＝16kHz的幀切換為具有內(nèi)部采樣速率S2＝12.8kHz的幀的說明性示例中，假設(shè)K＝100，那么截?cái)嗟墓β首V的長度是K₂＝100(12800/16000)＝80個(gè)采樣。使用公式(4)對(duì)于41個(gè)采樣計(jì)算功率譜，并且然后在K₂＝80的情況下使用公式(7)計(jì)算自相關(guān)。

在第二情況下，當(dāng)測試(操作330)確定S1小于S2時(shí)，所擴(kuò)展的功率譜的長度是K₂＝K(S2/S1)個(gè)采樣(操作350)。在從k＝0、……、K/2計(jì)算功率譜之后，功率譜擴(kuò)展為K₂/2。由于K/2與K₂/2之間不存在原始譜內(nèi)容，因此可以通過使用非常低的采樣值插入上至K₂/2的多個(gè)采樣完成擴(kuò)展功率譜。簡單方法是在K/2上至K₂/2重復(fù)采樣。由于功率譜在K₂/2周圍是對(duì)稱的，因此于是假設(shè)：

P(K₂/2+k)＝P(K₂/2-k)，從k＝1、……、K₂/2-1

在任一情況下，如在公式(6)中那樣計(jì)算逆DFT，以獲得在采樣速率S2的自相關(guān)(操作360)，并且Levinson-Durbin算法(見參考文獻(xiàn)[1])用于在采樣速率S2計(jì)算LP濾波器參數(shù)(操作370)。然后，濾波器參數(shù)變換到LSF域，以用于與幀F(xiàn)2的LSF的內(nèi)插，以在每個(gè)子幀處獲得LP參數(shù)。

再次，讓我們采用說明性示例，其中，編碼器從具有內(nèi)部采樣速率

S1＝12.8kHz的幀切換到具有內(nèi)部采樣速率S2＝16kHz的幀，并且讓我們假設(shè)K＝80。擴(kuò)展的功率譜的長度是K₂＝80(16000/12800)＝100個(gè)采樣。使用公式(4)對(duì)于51個(gè)采樣計(jì)算功率譜，并且然后在K₂＝100的情況下使用公式(7)計(jì)算自相關(guān)。

注意，在不脫離本公開的精神的情況下，其它方法可以用于計(jì)算LP合成濾波器的功率譜或功率譜的逆DFT。

注意，在該說明性實(shí)施例中，在不同內(nèi)部采樣速率之間轉(zhuǎn)換LP濾波器參數(shù)應(yīng)用于量化的LP參數(shù)，以確定每個(gè)子幀中的內(nèi)插的合成濾波器參數(shù)，并且該操作在解碼器處重復(fù)。注意，加權(quán)濾波器使用非量化的LP濾波器參數(shù)，但發(fā)現(xiàn)，在新的幀F(xiàn)2中的非量化的濾波器參數(shù)與來自過去幀F(xiàn)1的采樣轉(zhuǎn)換后的量化的LP參數(shù)之間進(jìn)行內(nèi)插以確定每個(gè)子幀中的加權(quán)濾波器的參數(shù)是足夠的。這樣同樣無需在非量化的LP濾波器參數(shù)上應(yīng)用LP濾波器采樣轉(zhuǎn)換。

當(dāng)在具有不同采樣速率的幀邊界處進(jìn)行切換時(shí)的其它考慮

當(dāng)在具有不同內(nèi)部采樣速率的各幀之間進(jìn)行切換時(shí)要考慮的另一問題是自適應(yīng)碼本的內(nèi)容，其通常包含過去激勵(lì)信號(hào)。如果新的幀具有內(nèi)部采樣速率S2并且先前幀具有內(nèi)部采樣速率S1，則從速率S1到速率S2對(duì)自適應(yīng)碼本的內(nèi)容重新采樣，并且在編碼器和解碼器處都重復(fù)該操作。

為了減少復(fù)雜度，在本公開中，強(qiáng)制新的幀F(xiàn)2使用瞬時(shí)編碼模式，其獨(dú)立于過去激勵(lì)歷史并且因此不使用自適應(yīng)碼本的歷史。瞬時(shí)模式編碼的示例可見于PCT專利申請(qǐng)WO 2008/049221 A1“Method and device for coding transition frames in speech signals”中，其公開通過引用合并到此。

當(dāng)在具有不同采樣速率的幀邊界處進(jìn)行切換時(shí)的另一考慮是預(yù)測量化器的記憶。作為示例，LP參數(shù)量化器通常使用預(yù)測量化，其當(dāng)參數(shù)處于不同采樣速率時(shí)可能不正確地工作。為了減少切換假聲，當(dāng)在不同采樣速率之間進(jìn)行切換時(shí)，可以強(qiáng)制LP參數(shù)量化器進(jìn)入非預(yù)測編碼模式。

另一考慮是合成濾波器的記憶，當(dāng)在具有不同采樣速率的各幀之間進(jìn)行切換時(shí)，可以對(duì)其重新采樣。

最后，可以通過修改編碼處理或解碼處理的部分補(bǔ)償當(dāng)在具有不同內(nèi)部采樣速率的各幀之間進(jìn)行切換時(shí)源自轉(zhuǎn)換LP濾波器參數(shù)的附加復(fù)雜度。例如，為了不增加編碼器復(fù)雜度，可以通過降低幀的第一子幀中的迭代的數(shù)量修改固定碼本搜索(見參考文獻(xiàn)[1]，用于固定碼本搜索的示例)。

此外，為了不增加解碼器復(fù)雜度，可以跳過特定后處理。例如，在該說明性實(shí)施例中，可以使用描述于美國專利7,529,660“Method and device for frequency-selective pitch enhancement of synthesized speech”中的后處理技術(shù)，其公開通過引用合并到此。在切換到不同的內(nèi)部采樣速率之后，在第一幀中跳過該后處理(跳過后處理還克服對(duì)于后濾波器中所利用的過去合成的需要)。

此外，相應(yīng)地可以比例化取決于采樣速率的其它參數(shù)。例如，對(duì)于解碼器分類器和幀擦除隱藏所使用的過去音調(diào)延遲可以由因子S2/S1比例化。

圖5是形成圖1和圖2的編碼器和/或解碼器的硬件組件的示例配置的簡化框圖。設(shè)備400可以實(shí)現(xiàn)為移動(dòng)終端的部分、便攜式媒體播放器的部分、基站、互聯(lián)網(wǎng)裝備或在任何相似的設(shè)備中，并且可以合并編碼器106、解碼器110或編碼器106和解碼器110二者。設(shè)備400包括處理器406和存儲(chǔ)器408。處理器406可以包括用于執(zhí)行代碼指令以執(zhí)行圖4的操作的一個(gè)或多個(gè)獨(dú)特處理器。處理器406可以實(shí)施圖1和圖2的編碼器106和解碼器110的各個(gè)元件。處理器406可以進(jìn)一步執(zhí)行移動(dòng)終端、便攜式媒體播放器、基站、互聯(lián)網(wǎng)裝備等的任務(wù)。存儲(chǔ)器408可操作地連接到處理器406?？梢允欠撬矔r(shí)存儲(chǔ)器的存儲(chǔ)器408存儲(chǔ)可由處理器406執(zhí)行的代碼指令。

音頻輸入402當(dāng)用作編碼器106時(shí)出現(xiàn)在設(shè)備400中。音頻輸入402可以包括例如麥克風(fēng)或可連接到麥克風(fēng)的接口。音頻輸入402可以包括麥克風(fēng)102和A/D轉(zhuǎn)換器104，并且產(chǎn)生原始模擬聲音信號(hào)103和/或原始數(shù)字聲音信號(hào)105。替代地，音頻輸入402可以接收原始數(shù)字聲音信號(hào)105。類似地，當(dāng)設(shè)備400用作編碼器106并且被配置為將編碼參數(shù)107或包含包括LP濾波器參數(shù)的參數(shù)107的數(shù)字比特流111經(jīng)由通信鏈路(例如，經(jīng)由通信信道101)轉(zhuǎn)發(fā)到遠(yuǎn)程解碼器或朝向另一存儲(chǔ)器(未示出)以用于存儲(chǔ)時(shí)，已編碼輸出404出現(xiàn)。已編碼輸出404的非限定性實(shí)現(xiàn)方式示例包括移動(dòng)終端的無線電接口、物理接口(例如比如便攜式媒體播放器的通用串行總線(USB)端口等)。

已編碼輸入403和音頻輸出405都出現(xiàn)在當(dāng)用作解碼器110時(shí)的設(shè)備400中。已編碼輸入403可以構(gòu)造為從編碼器106的已編碼輸出404接收編碼參數(shù)107或包含包括LP濾波器參數(shù)的參數(shù)107的數(shù)字比特流111。當(dāng)設(shè)備400包括編碼器106和解碼器110時(shí)，已編碼輸出404和已編碼輸入403可以形成公共通信模塊。音頻輸出405可以包括D/A轉(zhuǎn)換器115和外放揚(yáng)聲器單元116。替代地，音頻輸出405可以包括可連接到音頻播放器、外放揚(yáng)聲器、記錄設(shè)備等的接口。

音頻輸入402或已編碼輸入403也可以從存儲(chǔ)設(shè)備(未示出)接收信號(hào)。以相同方式，已編碼輸出404和音頻輸出405可以將輸出信號(hào)提供給存儲(chǔ)設(shè)備(未示出)，以用于記錄。

音頻輸入402、已編碼輸入403、已編碼輸出404以及音頻輸出405都可操作地連接到處理器406。

本領(lǐng)域技術(shù)人員應(yīng)理解，用于聲音信號(hào)的線性預(yù)測編碼和解碼的方法、編碼器和解碼器的描述僅是說明性的，而非意圖以任何方式進(jìn)行限制。其它實(shí)施例將容易地對(duì)具有本公開的益處的本領(lǐng)域技術(shù)人員建議它們自身。此外，所公開的方法、編碼器和解碼器可以定制為提供對(duì)于在具有不同采樣速率的兩個(gè)比特率之間切換基于線性預(yù)測的編解碼器的現(xiàn)有需要和問題的有價(jià)值的解決方案。

為了清楚，在此并未示出并且描述方法、編碼器和解碼器的實(shí)現(xiàn)方式的所有常規(guī)特征。當(dāng)然，應(yīng)理解，在方法、編碼器和解碼器的任何這樣的實(shí)際實(shí)現(xiàn)方式的發(fā)展中，可能需要進(jìn)行大量實(shí)現(xiàn)方式特定的判斷，以實(shí)現(xiàn)開發(fā)者的特定目的(例如與和應(yīng)用、系統(tǒng)、網(wǎng)絡(luò)和商業(yè)有關(guān)的約束的順應(yīng)性)，并且這些特定目的將隨著實(shí)現(xiàn)方式并且隨著開發(fā)者而變化。此外，應(yīng)理解，開發(fā)努力可能是復(fù)雜并且耗時(shí)的，但對(duì)于具有本公開的益處的聲音編碼領(lǐng)域的技術(shù)人員將絕非是承攬工程的常規(guī)。

根據(jù)本公開，可以使用各種類型的操作系統(tǒng)、計(jì)算平臺(tái)、網(wǎng)絡(luò)設(shè)備、計(jì)算機(jī)程序和/或通用機(jī)器實(shí)現(xiàn)在此所描述的組件、處理操作和/或數(shù)據(jù)結(jié)構(gòu)。此外，本領(lǐng)域技術(shù)人員應(yīng)理解，也可以使用較不通用的性質(zhì)的設(shè)備(例如硬連線設(shè)備、現(xiàn)場可編程門陣列(FPGA)、專用集成電路(ASIC)等)。在通過計(jì)算機(jī)或機(jī)器實(shí)現(xiàn)包括一系列操作的方法并且這些操作可以存儲(chǔ)為一系列可由機(jī)器讀取的指令的情況下，它們可以存儲(chǔ)在有形介質(zhì)上。

在此所描述的系統(tǒng)和模塊可以包括適合于在此所描述的目的之軟件、固件、硬件或軟件、固件或硬件的任何組合。

雖然在上文中已經(jīng)通過本公開的非限定性說明性實(shí)施例描述了本公開，但在不脫離本公開的精神和性質(zhì)的情況下，可以在所附權(quán)利要求的范圍內(nèi)任意修改這些實(shí)施例。

參考文獻(xiàn)

在此通過引用合并以下參考文獻(xiàn)。

[1]3GPP Technical Specification 26.190,"Adaptive Multi-Rate-Wideband(AMR-WB)speech codec；Transcoding functions,"July 2005；http://www.3gpp.org.

[2]ITU-T Recommendation G.729"Coding of speech at 8kbit/s usingconjugate-structure algebraic-code-excited linear prediction(CS-ACELP)",01/2007.

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3