亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于在具有不同采樣速率的各幀之間的過渡時(shí)的聲音信號(hào)的線性預(yù)測編碼和解碼的方法、編碼器和解碼器與流程

文檔序號(hào):11851778閱讀:578來源:國知局
用于在具有不同采樣速率的各幀之間的過渡時(shí)的聲音信號(hào)的線性預(yù)測編碼和解碼的方法、編碼器和解碼器與流程

本公開涉及聲音編碼的領(lǐng)域。更具體地說,本公開涉及用于在具有不同采樣速率的各幀之間的過渡時(shí)的聲音信號(hào)的線性預(yù)測編碼和解碼的方法、編碼器和解碼器。



背景技術(shù):

對(duì)于具有良好主觀質(zhì)量/比特率折衷的高效數(shù)字寬帶話音/音頻編碼技術(shù)的需求關(guān)于大量應(yīng)用(例如音頻/視頻電話會(huì)議、多媒體以及無線應(yīng)用以及互聯(lián)網(wǎng)和分組網(wǎng)絡(luò)應(yīng)用)正在增加。直到近來,200-3400Hz的范圍中的電話帶寬才并非主要用在話音編碼應(yīng)用中。然而,存在增加的對(duì)于寬帶應(yīng)用的需求,以增加話音信號(hào)的智能性和自然性。發(fā)現(xiàn)范圍50-7000Hz中的帶寬對(duì)于傳遞面對(duì)面話音質(zhì)量是足夠的。對(duì)于音頻信號(hào),該范圍給出可接受的音頻質(zhì)量,但仍低于在范圍20-20000Hz中操作的CD(壓縮盤)質(zhì)量。

話音編碼器將話音信號(hào)轉(zhuǎn)換為通過通信信道發(fā)送(或存儲(chǔ)在存儲(chǔ)介質(zhì)中)的數(shù)字比特流。話音信號(hào)受數(shù)字化(通過通常每采樣16比特受采樣和量化),并且話音編碼器具有在保持良好主觀話音質(zhì)量的同時(shí)通過較小數(shù)量的比特表示這些數(shù)字采樣的作用。話音解碼器或合成器對(duì)所發(fā)送或存儲(chǔ)的比特流進(jìn)行操作,并且將其轉(zhuǎn)換回到聲音信號(hào)。

能夠?qū)崿F(xiàn)良好質(zhì)量/比特率折衷的最佳可用技術(shù)之一是所謂的CELP(碼激勵(lì)線性預(yù)測)技術(shù)。根據(jù)該技術(shù),所采樣的話音信號(hào)在通常稱為幀的L個(gè)采樣的連續(xù)塊中受處理,其中,L是(與話音的10-30ms對(duì)應(yīng)的)某預(yù)定數(shù)。在CELP中,每一幀計(jì)算并且發(fā)送LP(線性預(yù)測)合成濾波器。L個(gè)采樣幀進(jìn)一步劃分為N個(gè)采樣的稱為子幀的更小的塊,其中,L=kN,并且k是幀中的子幀的數(shù)量(N通常與話音的4-10ms對(duì)應(yīng))。在每個(gè)子幀中確定激勵(lì)信號(hào),其通常包括兩個(gè)分量:一個(gè)來自過去激勵(lì)(又稱為音調(diào)貢獻(xiàn)或自適應(yīng)碼本),另一個(gè)來自新進(jìn)的碼本(又稱為固定碼本)。該激勵(lì)信號(hào)被發(fā)送并且在解碼器處用作LP合成濾波器的輸入,以獲得合成的話音。

為了根據(jù)CELP技術(shù)合成話音,憑借通過對(duì)話音信號(hào)的譜特性進(jìn)行建模的時(shí)變?yōu)V波對(duì)來自新進(jìn)的碼本的適當(dāng)?shù)拇a矢量進(jìn)行濾波來合成N個(gè)采樣的每個(gè)塊。這些濾波器包括音調(diào)合成濾波器(通常實(shí)現(xiàn)為包含過去激勵(lì)信號(hào)的自適應(yīng)碼本)和LP合成濾波器。在編碼器端處,對(duì)于來自新進(jìn)的碼本的碼矢量的全部或其子集計(jì)算合成輸出(碼本搜索)。所保留的新進(jìn)的碼矢量是根據(jù)感知上加權(quán)的失真測度產(chǎn)生最接近原始話音信號(hào)的合成輸出的碼矢量。使用通常從LP合成濾波器推導(dǎo)的所謂的感知加權(quán)濾波器執(zhí)行這種感知加權(quán)。

在基于LP的編碼器(例如CELP)中,LP濾波器被計(jì)算,然后每幀一次地被量化并且發(fā)送。然而,為了確保LP合成濾波器的平滑演變,基于來自過去幀的LP參數(shù)在每個(gè)子幀中內(nèi)插濾波器參數(shù)。歸因于濾波器穩(wěn)定性問題,LP濾波器參數(shù)不適合于量化。通常使用對(duì)于量化和內(nèi)插更高效的另一LP表示。一般使用的LP參數(shù)表示是線譜頻率(LSF)域。

在寬帶編碼中,聲音信號(hào)以每秒16000個(gè)采樣被采樣,并且所編碼的帶寬擴(kuò)展上至7kHz。然而,在低比特率寬帶編碼(小于16kbit/s)時(shí),通常更高效的是,將輸入信號(hào)下采樣為稍微更低的速率,并且將CELP模型以用于較低帶寬,然后在解碼器處使用帶寬擴(kuò)展以生成上至7kHz的信號(hào)。這是歸因于這樣的事實(shí):CELP模型對(duì)具有高能量的較低頻率建模得比較高頻率更好。因此,更高效的是,在低比特率時(shí)將模型關(guān)注于較低帶寬。AMR-WB標(biāo)準(zhǔn)(參考文獻(xiàn)[1])是這樣的編碼示例:其中,輸入信號(hào)下采樣為每秒12800個(gè)采樣,并且CELP對(duì)上至6.4kHz的信號(hào)進(jìn)行編碼。在解碼器處,帶寬擴(kuò)展用于生成從6.4kHz到7kHz的信號(hào)。然而,在比16kbit/s更高的比特率時(shí),由于存在足夠的比特以表示整個(gè)帶寬,因此更高效的是,使用CELP以對(duì)上至7kHz的信號(hào)進(jìn)行編碼。

最新近的編碼器是多速率編碼器,其覆蓋寬范圍的比特率,以在不同的應(yīng)用場景中實(shí)現(xiàn)靈活性。再次,AMR-WB是這樣的示例:其中,編碼器按從6.6kbit/s到23.85kbit/s的比特率進(jìn)行操作。在多速率編碼器中,編解碼器應(yīng)能夠基于幀在不同比特率之間進(jìn)行切換,而不引入切換假聲。在AMR-WB中,由于在12.8kHz內(nèi)部采樣速率時(shí)所有速率使用CELP,因此這是容易實(shí)現(xiàn)的。然而,在使用以小于16kbit/s的比特率的12.8kHz采樣以及高于16kbit/s的比特率的16kHz采樣的新近的編碼器中,與在使用不同采樣速率的各幀之間切換比特率有關(guān)的問題需要解決。主要問題在于LP濾波器過渡,并且在于合成濾波器和自適應(yīng)碼本的記憶。

因此,仍需要用于在具有不同內(nèi)部采樣速率的兩個(gè)比特率之間切換基于LP的編解碼器的高效方法。



技術(shù)實(shí)現(xiàn)要素:

根據(jù)本公開,提供一種在用于將線性預(yù)測(LP)濾波器參數(shù)從聲音信號(hào)采樣速率S1轉(zhuǎn)換為聲音信號(hào)采樣速率S2的聲音信號(hào)編碼器中實(shí)現(xiàn)的方法。使用LP濾波器參數(shù)在采樣速率S1計(jì)算LP合成濾波器的功率譜。修改所述LP合成濾波器的功率譜,以將其從所述采樣速率S1轉(zhuǎn)換為所述采樣速率S2。逆變換所述LP合成濾波器的修改后的功率譜,以確定在所述采樣速率S2的所述LP合成濾波器的自相關(guān)。在所述采樣速率S2使用所述自相關(guān)以計(jì)算所述LP濾波器參數(shù)。

根據(jù)本公開,還提供一種在用于將接收到的線性預(yù)測(LP)濾波器參數(shù)從聲音信號(hào)采樣速率S1轉(zhuǎn)換為聲音信號(hào)采樣速率S2的聲音信號(hào)解碼器中實(shí)現(xiàn)的方法。使用接收到的LP濾波器參數(shù)在采樣速率S1計(jì)算LP合成濾波器的功率譜。修改所述LP合成濾波器的功率譜,以將其從所述采樣速率S1轉(zhuǎn)換為所述采樣速率S2。逆變換所述LP合成濾波器的修改后的功率譜,以確定在所述采樣速率S2的所述LP合成濾波器的自相關(guān)。在所述采樣速率S2使用所述自相關(guān)以計(jì)算所述LP濾波器參數(shù)。

根據(jù)本公開,還提供一種用于在將線性預(yù)測(LP)濾波器參數(shù)從聲音信號(hào)采樣速率S1轉(zhuǎn)換為聲音信號(hào)采樣速率S2的聲音信號(hào)編碼器中使用的設(shè)備。所述設(shè)備包括處理器,被配置為:

·在所述采樣速率S1使用接收到的LP濾波器參數(shù)計(jì)算LP合成濾波器的功率譜;

·修改所述LP合成濾波器的功率譜,以將其從所述采樣速率S1轉(zhuǎn)換為所述采樣速率S2;

·逆變換所述LP合成濾波器的修改后的功率譜,以確定在所述采樣速率S2的所述LP合成濾波器的自相關(guān);以及

·在所述采樣速率S2使用所述自相關(guān)以計(jì)算所述LP濾波器參數(shù)。

本公開還涉及一種用于在用于將接收到的線性預(yù)測(LP)濾波器參數(shù)從聲音信號(hào)采樣速率S1轉(zhuǎn)換為聲音信號(hào)采樣速率S2的聲音信號(hào)解碼器中使用的設(shè)備。所述設(shè)備包括處理器,被配置為:

·在所述采樣速率S1使用接收到的LP濾波器參數(shù)計(jì)算LP合成濾波器的功率譜;

·修改所述LP合成濾波器的功率譜,以將其從所述采樣速率S1轉(zhuǎn)換為所述采樣速率S2;

·逆變換所述LP合成濾波器的修改后的功率譜,以確定在所述采樣速率S2的所述LP合成濾波器的自相關(guān);以及

·在所述采樣速率S2使用所述自相關(guān)以計(jì)算所述LP濾波器參數(shù)。

在閱讀參照附圖僅通過示例的方式給出的本公開的說明性實(shí)施例的以下非限定性描述時(shí),其前述和其它目的、優(yōu)點(diǎn)和特征將變得更清楚。

附圖說明

在附圖中:

圖1是描述使用聲音編碼和解碼的示例的聲音通信系統(tǒng)的示意性框圖;

圖2是示出圖1的聲音通信系統(tǒng)的部分的基于CELP的編碼器和解碼器的結(jié)構(gòu)的示意性框圖;

圖3示出LP參數(shù)的成幀和內(nèi)插的示例;

圖4是示出用于在兩個(gè)不同采樣速率之間轉(zhuǎn)換LP濾波器參數(shù)的實(shí)施例的框圖;以及

圖5是形成圖1和圖2的編碼器和/或解碼器的硬件組件的示例配置的簡化框圖。

具體實(shí)施方式

本公開的非限定性說明性實(shí)施例涉及一種用于在使用不同內(nèi)部采樣速率的各幀之間在基于LP的編解碼器中的高效切換的方法和設(shè)備。所述切換方法和設(shè)備可以用于包括話音信號(hào)和音頻信號(hào)的任何聲音信號(hào)。通過示例的方式給出16kHz內(nèi)部采樣速率與12.8kHz內(nèi)部采樣速率之間的切換,然而,切換方法和設(shè)備也可以應(yīng)用于其它采樣速率。

圖1是描述使用聲音編碼和解碼的示例的聲音通信系統(tǒng)的示意性框圖。聲音通信系統(tǒng)100支持穿過通信信道101發(fā)送并且再現(xiàn)聲音信號(hào)。通信信道101可以包括例如有線鏈路、光鏈路或光纖鏈路。替代地,通信信道101可以至少部分地包括射頻鏈路。射頻鏈路一般支持例如可以關(guān)于蜂窩電話發(fā)現(xiàn)的需要共享的帶寬資源的多個(gè)同時(shí)話音通信。雖然未示出,但通信信道101可以由接收并且存儲(chǔ)所編碼的聲音信號(hào)以用于稍后回放的通信系統(tǒng)101的單個(gè)設(shè)備實(shí)施例中的存儲(chǔ)設(shè)備替換。

仍參照?qǐng)D1,例如,麥克風(fēng)102產(chǎn)生原始模擬聲音信號(hào)103,其提供給模數(shù)(A/D)轉(zhuǎn)換器104,以用于將其轉(zhuǎn)換為原始數(shù)字聲音信號(hào)105。也可以從存儲(chǔ)設(shè)備(未示出)記錄并且提供原始數(shù)字聲音信號(hào)105。聲音編碼器106對(duì)原始數(shù)字聲音信號(hào)105進(jìn)行編碼,由此產(chǎn)生編碼參數(shù)集合107,其編碼為二進(jìn)制形式并且傳遞到可選信道編碼器108??蛇x信道編碼器108當(dāng)出現(xiàn)時(shí)將冗余性加入到編碼參數(shù)的二進(jìn)制表示,然后通過通信信道101發(fā)送它們。在接收機(jī)側(cè)上,可選信道解碼器109利用數(shù)字比特流111中的上述冗余信息,以檢測并且校正可能在通過通信信道101的發(fā)送期間已經(jīng)產(chǎn)生的信道誤碼,產(chǎn)生接收到的編碼參數(shù)112。聲音解碼器110轉(zhuǎn)換接收到的編碼參數(shù)112,以用于創(chuàng)建所合成的數(shù)字聲音信號(hào)113。聲音解碼器110中所重構(gòu)的所合成的數(shù)字聲音信號(hào)113在數(shù)模(D/A)轉(zhuǎn)換器115中轉(zhuǎn)換為所合成的模擬聲音信號(hào)114,并且在外放揚(yáng)聲器單元116中被回放。替代地,所合成的數(shù)字聲音信號(hào)113也可以提供給并且記錄在存儲(chǔ)設(shè)備(未示出)中。

圖2是示出圖1的聲音通信系統(tǒng)的部分的基于CELP的編碼器和解碼器的結(jié)構(gòu)的示意性框圖。如圖2所示,聲音編解碼器包括兩個(gè)基本部分:聲音編碼器106以及聲音解碼器110,二者在圖1的前面描述中介紹。編碼器106被提供有原始數(shù)字聲音信號(hào)105,確定下文中所描述的表示原始模擬聲音信號(hào)103的編碼參數(shù)107。參數(shù)107編碼為數(shù)字比特流111,其使用通信信道(例如圖1的通信信道101)發(fā)送到解碼器110。聲音解碼器110將所合成的數(shù)字聲音信號(hào)113重構(gòu)為與原始數(shù)字聲音信號(hào)105盡可能相似。

目前,最廣泛的話音編碼技術(shù)基于線性預(yù)測(LP)(具體地說,CELP)。在基于LP的編碼中,憑借通過具有傳遞函數(shù)1/A(z)的LP合成濾波器216對(duì)激勵(lì)214進(jìn)行濾波產(chǎn)生所合成的數(shù)字聲音信號(hào)113。在CELP中,激勵(lì)214典型地包括兩個(gè)部分:第一級(jí),自適應(yīng)碼本貢獻(xiàn)222,選自自適應(yīng)碼本218并且放大達(dá)自適應(yīng)碼本增益gp226;以及第二級(jí),固定碼本貢獻(xiàn)224,選自固定碼本220,并且放大達(dá)固定碼本增益gc228。一般而言,自適應(yīng)碼本貢獻(xiàn)222對(duì)激勵(lì)的周期性部分進(jìn)行建模,固定碼本貢獻(xiàn)214加入以對(duì)聲音信號(hào)的演變進(jìn)行建模。

通過典型地20ms的幀處理聲音信號(hào),并且每幀一次地發(fā)送LP濾波器參數(shù)。在CELP中,幀進(jìn)一步劃分為若干子幀,以對(duì)激勵(lì)進(jìn)行編碼。子幀長度典型地是5ms。

CELP使用稱為分析合成的原理,其中,可能的解碼器輸出已經(jīng)在編碼器106處的編碼處理期間得以嘗試(合成)并且然后與原始數(shù)字聲音信號(hào)105進(jìn)行比較。編碼器106因此包括與解碼器110的元件相似的元件。這些元件包括:自適應(yīng)碼本貢獻(xiàn)250,選自自適應(yīng)碼本242,其提供與加權(quán)合成濾波器H(z)(見238)的沖擊響應(yīng)卷積的過去激勵(lì)信號(hào)v(n)(LP合成濾波器1/A(z)和感知加權(quán)濾波器W(z)的級(jí)聯(lián)),其結(jié)果y1(n)放大達(dá)自適應(yīng)碼本增益gp240。此外,所包括的是固定碼本貢獻(xiàn)252,選自固定碼本244,其提供與加權(quán)合成濾波器H(z)的沖擊響應(yīng)卷積的新進(jìn)的碼矢量ck(n),其結(jié)果y2(n)放大達(dá)固定碼本增益gc248。

編碼器106還包括感知加權(quán)濾波器W(z)233以及LP合成濾波器1/A(z)和感知加權(quán)濾波器W(z)的級(jí)聯(lián)(H(z))的零輸入響應(yīng)的提供器234。減法器236、254和256分別從感知加權(quán)濾波器233所濾波的原始數(shù)字聲音信號(hào)105減去零輸入響應(yīng)、自適應(yīng)碼本貢獻(xiàn)250和固定碼本貢獻(xiàn)252,以提供原始數(shù)字聲音信號(hào)105與所合成的數(shù)字聲音信號(hào)113之間的均方差232。

碼本搜索在感知加權(quán)域中使得原始數(shù)字聲音信號(hào)105與所合成的數(shù)字聲音信號(hào)113之間的均方差232最小化,其中,離散時(shí)間指數(shù)n=0、1、……、N-1,N是子幀的長度。感知加權(quán)濾波器W(z)利用頻率掩蔽效應(yīng),并且典型地是從LP濾波器A(z)推導(dǎo)的。

用于WB(寬帶,50Hz-7000Hz的帶寬)的感知加權(quán)濾波器W(z)的示例可見于參考文獻(xiàn)[1]。

由于LP合成濾波器1/A(z)和加權(quán)濾波器W(z)的記憶獨(dú)立于所搜索的碼矢量,因此可以在固定碼本搜索之前從原始數(shù)字聲音信號(hào)105減去該記憶。然后可以通過圖2中的H(z)所表示的濾波器1/A(z)和W(z)的級(jí)聯(lián)的沖擊響應(yīng)的卷積完成候選碼矢量的濾波。

從編碼器106發(fā)送到解碼器110的數(shù)字比特流111典型地包含以下參數(shù)107:LP濾波器A(z)的量化的參數(shù)、自適應(yīng)碼本242和固定碼本244的指數(shù)以及自適應(yīng)碼本242和固定碼本244的增益gp240和gc248。

當(dāng)在具有不同采樣速率的幀邊界處進(jìn)行切換時(shí)轉(zhuǎn)換LP濾波器參數(shù)

在基于LP的編碼中,LP濾波器A(z)得以每幀一次地確定,并且然后對(duì)于每個(gè)子幀內(nèi)插。圖3示出LP參數(shù)的成幀和內(nèi)插的示例。在該示例中,目前的幀劃分為四個(gè)子幀SF1、SF2、SF3和SF4,并且LP分析窗口在最后子幀SF4處居中。因此,如在最后子幀中那樣使用源自目前幀F(xiàn)1中的LP分析的LP參數(shù),也就是說,SF4=F1。對(duì)于前三個(gè)子幀SF1、SF2和SF3,通過在目前幀F(xiàn)1和先前幀F(xiàn)0中內(nèi)插參數(shù)獲得LP參數(shù)。也就是說:

SF1=0.75F0+0.25F1;

SF2=0.5F0+0.5F1;

SF3=0.25F0+0.75F1

SF4=F1。

取決于LP分析窗口形狀、長度和位置,可以替代地使用其它內(nèi)插示例。在另一實(shí)施例中,編碼器在12.8kHz內(nèi)部采樣速率與16kHz內(nèi)部采樣速率之間切換,其中,在12.8kHz時(shí)使用每幀4個(gè)子幀,在16kHz時(shí)使用每幀5個(gè)子幀,并且其中,還在目前幀(Fm)的中間量化LP參數(shù)。在該另外實(shí)施例中,用于12.8kHz幀的LP參數(shù)內(nèi)插給出如下:

SF1=0.5F0+0.5Fm;

SF2=Fm;

SF3=0.5Fm+0.5F1;

SF4=F1。

對(duì)于16kHz采樣,內(nèi)插給出如下:

SF1=0.55F0+0.45Fm;

SF2=0.15F0+0.85Fm;

SF3=0.75Fm+0.25F1;

SF4=0.35Fm+0.65F1;

SF5=F1。

LP分析產(chǎn)生使用下式計(jì)算LP合成濾波器的參數(shù):

<mrow> <mfrac> <mn>1</mn> <mrow> <mi>A</mi> <mrow> <mo>(</mo> <mi>z</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>a</mi> <mi>i</mi> </msub> <msup> <mi>z</mi> <mrow> <mo>-</mo> <mi>i</mi> </mrow> </msup> </mrow> </mfrac> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <msub> <mi>a</mi> <mn>1</mn> </msub> <msup> <mi>z</mi> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>+</mo> <msub> <mi>a</mi> <mn>2</mn> </msub> <msup> <mi>z</mi> <mrow> <mo>-</mo> <mn>2</mn> </mrow> </msup> <mo>+</mo> <mn>...</mn> <mo>+</mo> <msub> <mi>a</mi> <mi>M</mi> </msub> <msup> <mi>z</mi> <mrow> <mo>-</mo> <mi>M</mi> </mrow> </msup> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

其中,ai,i=1、……、M是LP濾波器參數(shù),M是濾波器階數(shù)。

LP濾波器參數(shù)變換到另一域,目的是量化和內(nèi)插。通常使用的其它LP參數(shù)表示是反射系數(shù)、對(duì)數(shù)面積比率、導(dǎo)抗譜配對(duì)(用在AMR-WB中;參考文獻(xiàn)[1])以及線譜配對(duì)(其又稱為線譜頻率(LSF))。在該說明性實(shí)施例中,使用線譜頻率表示??梢杂糜趯P參數(shù)轉(zhuǎn)換為LSF參數(shù)并且反之亦然的方法的示例可見于參考文獻(xiàn)[2]中。前述段落中的內(nèi)插示例應(yīng)用于LSF參數(shù),其可以處于0至Fs/2之間的范圍中(其中,F(xiàn)s是采樣頻率)的頻域中或0至π之間的比例化的頻域中或余弦域(比例化頻率的余弦)中。

如上所述,可以在不同的比特率時(shí)使用不同內(nèi)部采樣速率,以改進(jìn)基于多速率LP的編碼的質(zhì)量。在該說明性實(shí)施例中,使用多速率CELP寬帶編碼器,其中,在較低比特率時(shí)使用12.8kHz的內(nèi)部采樣速率,在較高比特率時(shí)使用16kHz的內(nèi)部采樣速率。在12.8kHz采樣速率時(shí),LSF覆蓋從0到6.4kHz的帶寬,而在16kHz采樣速率,它們覆蓋從0到8kHz的范圍。當(dāng)在內(nèi)部采樣速率不同的兩個(gè)幀之間切換比特率時(shí),一些問題要解決以確保無縫切換。這些問題包括在不同采樣速率時(shí)的LP濾波器參數(shù)的內(nèi)插以及合成濾波器和自適應(yīng)碼本的記憶。

本公開引入一種用于在處于不同內(nèi)部采樣速率的兩個(gè)幀之間高效內(nèi)插LP參數(shù)的方法。通過示例的方式,考慮12.8kHz采樣速率與16kHz采樣速率之間的切換。然而,所公開的技術(shù)不限于這些特定采樣速率,并且可以應(yīng)用于其它內(nèi)部采樣速率。

讓我們假設(shè)編碼器從具有內(nèi)部采樣速率S1的幀F(xiàn)1切換到具有內(nèi)部采樣速率S2的幀F(xiàn)2。第一幀中的LP參數(shù)表示為LSF1S1,第二幀處的LP參數(shù)表示為LSF2S2。為了更新幀F(xiàn)2的每個(gè)子幀中的LP參數(shù),內(nèi)插LP參數(shù)LSF1和LSF2。為了執(zhí)行內(nèi)插,濾波器必須設(shè)置在相同的采樣速率。這要求在采樣速率S2執(zhí)行幀F(xiàn)1的LP分析。為了避免在幀F(xiàn)1中在兩個(gè)采樣速率發(fā)送LP濾波器兩次,可以對(duì)在編碼器和解碼器處都可用的過去合成信號(hào)執(zhí)行在采樣速率S2的LP分析。該方法包括:從速率S1到速率S2對(duì)過去合成信號(hào)重新采樣;以及執(zhí)行完整LP分析,該操作在解碼器處重復(fù),這通常在計(jì)算上是費(fèi)力的。

在此公開替選方法和設(shè)備,用于將LP合成濾波器參數(shù)LSF1從采樣速率S1轉(zhuǎn)換為采樣速率S2,而無需對(duì)過去合成重新采樣并且執(zhí)行完整LP分析。在編碼和/或在解碼時(shí)所使用的該方法包括:在速率S1計(jì)算LP合成濾波器的功率譜;修改功率譜,以將其從速率S1轉(zhuǎn)換為速率S2;將修改后的功率譜轉(zhuǎn)換回到時(shí)域,以獲得在速率S2的濾波器自相關(guān);以及最后使用自相關(guān)以在速率S2計(jì)算LP濾波器參數(shù)。

在至少一些實(shí)施例中,修改功率譜以將其從速率S1轉(zhuǎn)換為速率S2包括以下操作:

如果S1大于S2,則修改功率譜包括:截?cái)郖采樣功率譜下至K(S2/S1)個(gè)采樣,也就是說,移除K(S1-S2)/S1個(gè)采樣。

另一方面,如果S1小于S2,則修改功率譜包括:擴(kuò)展K采樣功率譜上至K(S2/S1)個(gè)采樣,也就是說,加入K(S2-S1)/S1個(gè)采樣。

可以使用Levinson-Durbin算法(見參考文獻(xiàn)[1])完成從自相關(guān)在速率S2計(jì)算LP濾波器。一旦LP濾波器轉(zhuǎn)換為速率S2,LP濾波器參數(shù)就變換到內(nèi)插域,其在該說明性實(shí)施例中為LSF域。

在圖4中概述上述方法,圖4是示出用于在兩個(gè)不同采樣速率之間轉(zhuǎn)換LP濾波器參數(shù)的實(shí)施例的框圖。

操作的序列300示出,用于計(jì)算LP合成濾波器1/A(z)的功率譜的簡單方法是在從0到2π的K個(gè)頻率處估計(jì)濾波器的頻率響應(yīng)。

合成濾波器的頻率響應(yīng)由下式給出:

<mrow> <mfrac> <mn>1</mn> <mrow> <mi>A</mi> <mrow> <mo>(</mo> <mi>&omega;</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>a</mi> <mi>i</mi> </msub> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mi>j</mi> <mi>&omega;</mi> <mi>i</mi> </mrow> </msup> </mrow> </mfrac> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>a</mi> <mi>i</mi> </msub> <mi>cos</mi> <mrow> <mo>(</mo> <mi>&omega;</mi> <mi>i</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>j</mi> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>a</mi> <mi>i</mi> </msub> <mi>sin</mi> <mrow> <mo>(</mo> <mi>&omega;</mi> <mi>i</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

并且合成濾波器的功率譜計(jì)算為合成濾波器的頻率響應(yīng)的能量,給出如下:

<mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>&omega;</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mo>|</mo> <mi>A</mi> <mrow> <mo>(</mo> <mi>&omega;</mi> <mo>)</mo> </mrow> <msup> <mo>|</mo> <mn>2</mn> </msup> </mrow> </mfrac> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <msup> <mrow> <mo>(</mo> <mn>1</mn> <mo>+</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>a</mi> <mi>i</mi> </msub> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mo>(</mo> <mi>&omega;</mi> <mi>i</mi> <mo>)</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>a</mi> <mi>i</mi> </msub> <mi>s</mi> <mi>i</mi> <mi>n</mi> <mo>(</mo> <mi>&omega;</mi> <mi>i</mi> <mo>)</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>

初始地,LP濾波器處于等于S1的速率(操作310)。通過從0到2π的頻率范圍進(jìn)行采樣計(jì)算LP合成濾波器的K采樣(即離散)功率譜(操作320)。也就是說

<mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <msup> <mrow> <mo>(</mo> <mn>1</mn> <mo>+</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>a</mi> <mi>i</mi> </msub> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mo>(</mo> <mfrac> <mrow> <mn>2</mn> <mi>&pi;</mi> <mi>i</mi> <mi>k</mi> </mrow> <mi>K</mi> </mfrac> <mo>)</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>a</mi> <mi>i</mi> </msub> <mi>s</mi> <mi>i</mi> <mi>n</mi> <mo>(</mo> <mfrac> <mrow> <mn>2</mn> <mi>&pi;</mi> <mi>i</mi> <mi>k</mi> </mrow> <mi>K</mi> </mfrac> <mo>)</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </mfrac> <mo>,</mo> <mi>k</mi> <mo>=</mo> <mn>0</mn> <mo>,</mo> <mn>......</mn> <mo>,</mo> <mi>K</mi> <mo>-</mo> <mn>1</mn> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>

注意,由于從π到2π的功率譜是從0到π的功率譜的鏡像,因此可以通過僅對(duì)于k=0、……、K/2計(jì)算P(k)減少運(yùn)算復(fù)雜度。

測試(操作330)確定以下情況中的哪些應(yīng)用。在第一情況下,采樣速率S1大于采樣速率S2,并且用于幀F(xiàn)1的功率譜被截?cái)?操作340),從而采樣的新的數(shù)量是K(S2/S1)。

更詳細(xì)地說,當(dāng)S1大于S2時(shí),截?cái)嗟墓β首V的長度是K2=K(S2/S1)個(gè)采樣。由于功率譜被截?cái)?,因此從k=0、……、K2/2計(jì)算它。由于功率譜在K2/2周圍是對(duì)稱的,因此于是假設(shè):

P(K2/2+k)=P(K2/2-k),從k=1、……、K2/2-1

信號(hào)的自相關(guān)的傅立葉變換給出該信號(hào)的功率譜。因此,將逆傅立葉變換應(yīng)用于截?cái)嗟墓β首V產(chǎn)生在采樣速率S2的合成濾波器的沖擊響應(yīng)的自相關(guān)。

截?cái)嗟墓β首V的逆離散傅立葉變換(IDFT)給出如下:

<mrow> <mi>R</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>K</mi> <mn>2</mn> </msub> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mi>P</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <msup> <mi>e</mi> <mrow> <mi>j</mi> <mn>2</mn> <mi>&pi;</mi> <mi>i</mi> <mi>k</mi> <mo>/</mo> <msub> <mi>K</mi> <mn>2</mn> </msub> </mrow> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>

由于濾波器階數(shù)是M,因此于是可以僅對(duì)于i=0、……、M計(jì)算IDFT。此外,由于功率譜是實(shí)數(shù)并且對(duì)稱的,因此于是功率譜的IDFT也是實(shí)數(shù)并且對(duì)稱的。給定功率譜的對(duì)稱性,并且僅需要M+1個(gè)相關(guān),那么功率譜的逆變換可以給出為:

<mrow> <mi>R</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>K</mi> <mn>2</mn> </msub> </mfrac> <mrow> <mo>(</mo> <mi>P</mi> <mo>(</mo> <mn>0</mn> <mo>)</mo> <mo>+</mo> <msup> <mrow> <mo>(</mo> <mrow> <mo>-</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> <mi>i</mi> </msup> <mi>P</mi> <mo>(</mo> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> </mrow> <mo>)</mo> <mo>+</mo> <mn>2</mn> <msup> <mrow> <mo>(</mo> <mrow> <mo>-</mo> <mn>1</mn> </mrow> <mo>)</mo> </mrow> <mi>i</mi> </msup> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mi>P</mi> <mo>(</mo> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> <mo>-</mo> <mi>k</mi> </mrow> <mo>)</mo> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mo>(</mo> <mrow> <mn>2</mn> <mi>&pi;</mi> <mi>i</mi> <mi>k</mi> <mo>/</mo> <msub> <mi>K</mi> <mn>2</mn> </msub> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow>

也就是說

<mrow> <mi>R</mi> <mrow> <mo>(</mo> <mn>0</mn> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>K</mi> <mn>2</mn> </msub> </mfrac> <mrow> <mo>(</mo> <mi>P</mi> <mo>(</mo> <mn>0</mn> <mo>)</mo> <mo>+</mo> <mi>P</mi> <mo>(</mo> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> </mrow> <mo>)</mo> <mo>+</mo> <mn>2</mn> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mi>P</mi> <mo>(</mo> <mi>k</mi> <mo>)</mo> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <mi>R</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>K</mi> <mn>2</mn> </msub> </mfrac> <mrow> <mo>(</mo> <mi>P</mi> <mo>(</mo> <mn>0</mn> <mo>)</mo> <mo>-</mo> <mi>P</mi> <mo>(</mo> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> </mrow> <mo>)</mo> <mo>-</mo> <mn>2</mn> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mi>P</mi> <mo>(</mo> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> <mo>-</mo> <mi>k</mi> </mrow> <mo>)</mo> <mi>c</mi> <mi>o</mi> <mi>s</mi> <mo>(</mo> <mrow> <mn>2</mn> <mi>&pi;</mi> <mi>i</mi> <mi>k</mi> <mo>/</mo> <msub> <mi>K</mi> <mn>2</mn> </msub> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mi>f</mi> <mi>o</mi> <mi>r</mi> <mi> </mi> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>3</mn> <mo>,</mo> <mn>...</mn> <mo>,</mo> <mi>M</mi> <mo>-</mo> <mn>1</mn> </mrow>

<mrow> <mi>R</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>K</mi> <mn>2</mn> </msub> </mfrac> <mrow> <mo>(</mo> <mi>P</mi> <mo>(</mo> <mn>0</mn> <mo>)</mo> <mo>+</mo> <mi>P</mi> <mo>(</mo> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> </mrow> <mo>)</mo> <mo>+</mo> <mn>2</mn> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <mi>P</mi> <mo>(</mo> <mrow> <msub> <mi>K</mi> <mn>2</mn> </msub> <mo>/</mo> <mn>2</mn> <mo>-</mo> <mi>k</mi> </mrow> <mo>)</mo> <mi>cos</mi> <mo>(</mo> <mrow> <mn>2</mn> <mi>&pi;</mi> <mi>i</mi> <mi>k</mi> <mo>/</mo> <msub> <mi>K</mi> <mn>2</mn> </msub> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mi>f</mi> <mi>o</mi> <mi>r</mi> <mi> </mi> <mi>i</mi> <mo>=</mo> <mn>2</mn> <mo>,</mo> <mn>4</mn> <mo>,</mo> <mn>...</mn> <mo>,</mo> <mi>M</mi> </mrow>

于在采樣速率S2計(jì)算自相關(guān)之后,Levinson-Durbin算法(見參考文獻(xiàn)[1])可以用于在采樣速率S2計(jì)算LP濾波器的參數(shù)。然后,LP濾波器參數(shù)變換到LSF域,以用于與幀F(xiàn)2的LSF的內(nèi)插,以在每個(gè)子幀處獲得LP參數(shù)。

在編碼器對(duì)寬帶信號(hào)進(jìn)行編碼并且從具有內(nèi)部采樣速率S1=16kHz的幀切換為具有內(nèi)部采樣速率S2=12.8kHz的幀的說明性示例中,假設(shè)K=100,那么截?cái)嗟墓β首V的長度是K2=100(12800/16000)=80個(gè)采樣。使用公式(4)對(duì)于41個(gè)采樣計(jì)算功率譜,并且然后在K2=80的情況下使用公式(7)計(jì)算自相關(guān)。

在第二情況下,當(dāng)測試(操作330)確定S1小于S2時(shí),所擴(kuò)展的功率譜的長度是K2=K(S2/S1)個(gè)采樣(操作350)。在從k=0、……、K/2計(jì)算功率譜之后,功率譜擴(kuò)展為K2/2。由于K/2與K2/2之間不存在原始譜內(nèi)容,因此可以通過使用非常低的采樣值插入上至K2/2的多個(gè)采樣完成擴(kuò)展功率譜。簡單方法是在K/2上至K2/2重復(fù)采樣。由于功率譜在K2/2周圍是對(duì)稱的,因此于是假設(shè):

P(K2/2+k)=P(K2/2-k),從k=1、……、K2/2-1

在任一情況下,如在公式(6)中那樣計(jì)算逆DFT,以獲得在采樣速率S2的自相關(guān)(操作360),并且Levinson-Durbin算法(見參考文獻(xiàn)[1])用于在采樣速率S2計(jì)算LP濾波器參數(shù)(操作370)。然后,濾波器參數(shù)變換到LSF域,以用于與幀F(xiàn)2的LSF的內(nèi)插,以在每個(gè)子幀處獲得LP參數(shù)。

再次,讓我們采用說明性示例,其中,編碼器從具有內(nèi)部采樣速率

S1=12.8kHz的幀切換到具有內(nèi)部采樣速率S2=16kHz的幀,并且讓我們假設(shè)K=80。擴(kuò)展的功率譜的長度是K2=80(16000/12800)=100個(gè)采樣。使用公式(4)對(duì)于51個(gè)采樣計(jì)算功率譜,并且然后在K2=100的情況下使用公式(7)計(jì)算自相關(guān)。

注意,在不脫離本公開的精神的情況下,其它方法可以用于計(jì)算LP合成濾波器的功率譜或功率譜的逆DFT。

注意,在該說明性實(shí)施例中,在不同內(nèi)部采樣速率之間轉(zhuǎn)換LP濾波器參數(shù)應(yīng)用于量化的LP參數(shù),以確定每個(gè)子幀中的內(nèi)插的合成濾波器參數(shù),并且該操作在解碼器處重復(fù)。注意,加權(quán)濾波器使用非量化的LP濾波器參數(shù),但發(fā)現(xiàn),在新的幀F(xiàn)2中的非量化的濾波器參數(shù)與來自過去幀F(xiàn)1的采樣轉(zhuǎn)換后的量化的LP參數(shù)之間進(jìn)行內(nèi)插以確定每個(gè)子幀中的加權(quán)濾波器的參數(shù)是足夠的。這樣同樣無需在非量化的LP濾波器參數(shù)上應(yīng)用LP濾波器采樣轉(zhuǎn)換。

當(dāng)在具有不同采樣速率的幀邊界處進(jìn)行切換時(shí)的其它考慮

當(dāng)在具有不同內(nèi)部采樣速率的各幀之間進(jìn)行切換時(shí)要考慮的另一問題是自適應(yīng)碼本的內(nèi)容,其通常包含過去激勵(lì)信號(hào)。如果新的幀具有內(nèi)部采樣速率S2并且先前幀具有內(nèi)部采樣速率S1,則從速率S1到速率S2對(duì)自適應(yīng)碼本的內(nèi)容重新采樣,并且在編碼器和解碼器處都重復(fù)該操作。

為了減少復(fù)雜度,在本公開中,強(qiáng)制新的幀F(xiàn)2使用瞬時(shí)編碼模式,其獨(dú)立于過去激勵(lì)歷史并且因此不使用自適應(yīng)碼本的歷史。瞬時(shí)模式編碼的示例可見于PCT專利申請(qǐng)WO 2008/049221 A1“Method and device for coding transition frames in speech signals”中,其公開通過引用合并到此。

當(dāng)在具有不同采樣速率的幀邊界處進(jìn)行切換時(shí)的另一考慮是預(yù)測量化器的記憶。作為示例,LP參數(shù)量化器通常使用預(yù)測量化,其當(dāng)參數(shù)處于不同采樣速率時(shí)可能不正確地工作。為了減少切換假聲,當(dāng)在不同采樣速率之間進(jìn)行切換時(shí),可以強(qiáng)制LP參數(shù)量化器進(jìn)入非預(yù)測編碼模式。

另一考慮是合成濾波器的記憶,當(dāng)在具有不同采樣速率的各幀之間進(jìn)行切換時(shí),可以對(duì)其重新采樣。

最后,可以通過修改編碼處理或解碼處理的部分補(bǔ)償當(dāng)在具有不同內(nèi)部采樣速率的各幀之間進(jìn)行切換時(shí)源自轉(zhuǎn)換LP濾波器參數(shù)的附加復(fù)雜度。例如,為了不增加編碼器復(fù)雜度,可以通過降低幀的第一子幀中的迭代的數(shù)量修改固定碼本搜索(見參考文獻(xiàn)[1],用于固定碼本搜索的示例)。

此外,為了不增加解碼器復(fù)雜度,可以跳過特定后處理。例如,在該說明性實(shí)施例中,可以使用描述于美國專利7,529,660“Method and device for frequency-selective pitch enhancement of synthesized speech”中的后處理技術(shù),其公開通過引用合并到此。在切換到不同的內(nèi)部采樣速率之后,在第一幀中跳過該后處理(跳過后處理還克服對(duì)于后濾波器中所利用的過去合成的需要)。

此外,相應(yīng)地可以比例化取決于采樣速率的其它參數(shù)。例如,對(duì)于解碼器分類器和幀擦除隱藏所使用的過去音調(diào)延遲可以由因子S2/S1比例化。

圖5是形成圖1和圖2的編碼器和/或解碼器的硬件組件的示例配置的簡化框圖。設(shè)備400可以實(shí)現(xiàn)為移動(dòng)終端的部分、便攜式媒體播放器的部分、基站、互聯(lián)網(wǎng)裝備或在任何相似的設(shè)備中,并且可以合并編碼器106、解碼器110或編碼器106和解碼器110二者。設(shè)備400包括處理器406和存儲(chǔ)器408。處理器406可以包括用于執(zhí)行代碼指令以執(zhí)行圖4的操作的一個(gè)或多個(gè)獨(dú)特處理器。處理器406可以實(shí)施圖1和圖2的編碼器106和解碼器110的各個(gè)元件。處理器406可以進(jìn)一步執(zhí)行移動(dòng)終端、便攜式媒體播放器、基站、互聯(lián)網(wǎng)裝備等的任務(wù)。存儲(chǔ)器408可操作地連接到處理器406??梢允欠撬矔r(shí)存儲(chǔ)器的存儲(chǔ)器408存儲(chǔ)可由處理器406執(zhí)行的代碼指令。

音頻輸入402當(dāng)用作編碼器106時(shí)出現(xiàn)在設(shè)備400中。音頻輸入402可以包括例如麥克風(fēng)或可連接到麥克風(fēng)的接口。音頻輸入402可以包括麥克風(fēng)102和A/D轉(zhuǎn)換器104,并且產(chǎn)生原始模擬聲音信號(hào)103和/或原始數(shù)字聲音信號(hào)105。替代地,音頻輸入402可以接收原始數(shù)字聲音信號(hào)105。類似地,當(dāng)設(shè)備400用作編碼器106并且被配置為將編碼參數(shù)107或包含包括LP濾波器參數(shù)的參數(shù)107的數(shù)字比特流111經(jīng)由通信鏈路(例如,經(jīng)由通信信道101)轉(zhuǎn)發(fā)到遠(yuǎn)程解碼器或朝向另一存儲(chǔ)器(未示出)以用于存儲(chǔ)時(shí),已編碼輸出404出現(xiàn)。已編碼輸出404的非限定性實(shí)現(xiàn)方式示例包括移動(dòng)終端的無線電接口、物理接口(例如比如便攜式媒體播放器的通用串行總線(USB)端口等)。

已編碼輸入403和音頻輸出405都出現(xiàn)在當(dāng)用作解碼器110時(shí)的設(shè)備400中。已編碼輸入403可以構(gòu)造為從編碼器106的已編碼輸出404接收編碼參數(shù)107或包含包括LP濾波器參數(shù)的參數(shù)107的數(shù)字比特流111。當(dāng)設(shè)備400包括編碼器106和解碼器110時(shí),已編碼輸出404和已編碼輸入403可以形成公共通信模塊。音頻輸出405可以包括D/A轉(zhuǎn)換器115和外放揚(yáng)聲器單元116。替代地,音頻輸出405可以包括可連接到音頻播放器、外放揚(yáng)聲器、記錄設(shè)備等的接口。

音頻輸入402或已編碼輸入403也可以從存儲(chǔ)設(shè)備(未示出)接收信號(hào)。以相同方式,已編碼輸出404和音頻輸出405可以將輸出信號(hào)提供給存儲(chǔ)設(shè)備(未示出),以用于記錄。

音頻輸入402、已編碼輸入403、已編碼輸出404以及音頻輸出405都可操作地連接到處理器406。

本領(lǐng)域技術(shù)人員應(yīng)理解,用于聲音信號(hào)的線性預(yù)測編碼和解碼的方法、編碼器和解碼器的描述僅是說明性的,而非意圖以任何方式進(jìn)行限制。其它實(shí)施例將容易地對(duì)具有本公開的益處的本領(lǐng)域技術(shù)人員建議它們自身。此外,所公開的方法、編碼器和解碼器可以定制為提供對(duì)于在具有不同采樣速率的兩個(gè)比特率之間切換基于線性預(yù)測的編解碼器的現(xiàn)有需要和問題的有價(jià)值的解決方案。

為了清楚,在此并未示出并且描述方法、編碼器和解碼器的實(shí)現(xiàn)方式的所有常規(guī)特征。當(dāng)然,應(yīng)理解,在方法、編碼器和解碼器的任何這樣的實(shí)際實(shí)現(xiàn)方式的發(fā)展中,可能需要進(jìn)行大量實(shí)現(xiàn)方式特定的判斷,以實(shí)現(xiàn)開發(fā)者的特定目的(例如與和應(yīng)用、系統(tǒng)、網(wǎng)絡(luò)和商業(yè)有關(guān)的約束的順應(yīng)性),并且這些特定目的將隨著實(shí)現(xiàn)方式并且隨著開發(fā)者而變化。此外,應(yīng)理解,開發(fā)努力可能是復(fù)雜并且耗時(shí)的,但對(duì)于具有本公開的益處的聲音編碼領(lǐng)域的技術(shù)人員將絕非是承攬工程的常規(guī)。

根據(jù)本公開,可以使用各種類型的操作系統(tǒng)、計(jì)算平臺(tái)、網(wǎng)絡(luò)設(shè)備、計(jì)算機(jī)程序和/或通用機(jī)器實(shí)現(xiàn)在此所描述的組件、處理操作和/或數(shù)據(jù)結(jié)構(gòu)。此外,本領(lǐng)域技術(shù)人員應(yīng)理解,也可以使用較不通用的性質(zhì)的設(shè)備(例如硬連線設(shè)備、現(xiàn)場可編程門陣列(FPGA)、專用集成電路(ASIC)等)。在通過計(jì)算機(jī)或機(jī)器實(shí)現(xiàn)包括一系列操作的方法并且這些操作可以存儲(chǔ)為一系列可由機(jī)器讀取的指令的情況下,它們可以存儲(chǔ)在有形介質(zhì)上。

在此所描述的系統(tǒng)和模塊可以包括適合于在此所描述的目的之軟件、固件、硬件或軟件、固件或硬件的任何組合。

雖然在上文中已經(jīng)通過本公開的非限定性說明性實(shí)施例描述了本公開,但在不脫離本公開的精神和性質(zhì)的情況下,可以在所附權(quán)利要求的范圍內(nèi)任意修改這些實(shí)施例。

參考文獻(xiàn)

在此通過引用合并以下參考文獻(xiàn)。

[1]3GPP Technical Specification 26.190,"Adaptive Multi-Rate-Wideband(AMR-WB)speech codec;Transcoding functions,"July 2005;http://www.3gpp.org.

[2]ITU-T Recommendation G.729"Coding of speech at 8kbit/s usingconjugate-structure algebraic-code-excited linear prediction(CS-ACELP)",01/2007.

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1