專利名稱:語(yǔ)音和音頻編碼中快速代數(shù)碼本搜索的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于搜索具有代數(shù)(algebraic)結(jié)構(gòu)的固定碼本(codebook)的方法 和設(shè)備。根據(jù)本發(fā)明的碼本搜索方法和設(shè)備可用在對(duì)聲音信號(hào)(包括語(yǔ)音和音頻信號(hào))進(jìn) 行編碼和解碼的技術(shù)中。
背景技術(shù):
由于諸如音頻/視頻遠(yuǎn)程會(huì)議、多媒體、無(wú)線應(yīng)用、以及互聯(lián)網(wǎng)和分組網(wǎng)絡(luò)應(yīng)用之 類的各種應(yīng)用,對(duì)具有良好的主觀質(zhì)量/比特率折衷的高效的數(shù)字寬帶語(yǔ)音/音頻編碼技 術(shù)的需求正在增加。直到最近,在200-3400HZ范圍內(nèi)被濾波的電話帶寬主要用于語(yǔ)音編碼 應(yīng)用。然而,存在針對(duì)寬帶語(yǔ)音應(yīng)用的增加的需求,以便增加語(yǔ)音信號(hào)的可理解性和自然 性。發(fā)現(xiàn)50-7000HZ范圍內(nèi)的帶寬對(duì)傳遞面對(duì)面的語(yǔ)音質(zhì)量是足夠的。對(duì)音頻信號(hào),這個(gè)范 圍給出可接受的音頻質(zhì)量,但是仍然低于運(yùn)行在20-20000HZ范圍內(nèi)的⑶(致密盤(pán)(Compact Disk))質(zhì)量。語(yǔ)音編碼器將語(yǔ)音信號(hào)轉(zhuǎn)換成通過(guò)通信信道傳輸(或存儲(chǔ)在存儲(chǔ)介質(zhì)中)的數(shù)字 比特流。語(yǔ)音信號(hào)被數(shù)字化(通常以每個(gè)樣本16比特進(jìn)行采樣和量化),并且語(yǔ)音編碼器 的任務(wù)是用更小數(shù)量的比特來(lái)表示這些數(shù)字樣本同時(shí)保持良好的主觀語(yǔ)音質(zhì)量。語(yǔ)音解碼 器或合成器對(duì)所傳輸?shù)幕蛩鎯?chǔ)的比特流進(jìn)行操作并將其轉(zhuǎn)換回聲音信號(hào)。能夠?qū)崿F(xiàn)良好的質(zhì)量/比特率折衷的最好的現(xiàn)有技術(shù)之一是所謂的CELP (碼激勵(lì) (excite)線性預(yù)測(cè))技術(shù)。根據(jù)這個(gè)技術(shù),所采樣的語(yǔ)音信號(hào)在通常被稱為幀的L個(gè)樣本 的連續(xù)塊中進(jìn)行處理,其中L是某個(gè)預(yù)先確定的數(shù)字(對(duì)應(yīng)語(yǔ)音的10-30ms)。在CELP中, LP (線性預(yù)測(cè))合成濾波器在每一幀進(jìn)行計(jì)算和傳輸。L樣本的幀然后被劃分成更小的塊, 該更小的塊被稱為N個(gè)樣本的子幀,其中L = kN,k為一幀中的子幀的數(shù)量(N通常對(duì)應(yīng)語(yǔ) 音的4-lOms)。激勵(lì)信號(hào)在每個(gè)子幀內(nèi)被確定,其通常由兩種分量構(gòu)成一種來(lái)自過(guò)去的激 勵(lì)(也稱為音高貢獻(xiàn)(Pitch contribution)或自適應(yīng)碼本),另一種來(lái)自創(chuàng)新碼本(也稱 為固定碼本)。這個(gè)激勵(lì)信號(hào)被傳輸并在解碼器處作為L(zhǎng)P合成濾波器的輸入來(lái)使用,以獲 得合成語(yǔ)音。為了根據(jù)CELP技術(shù)合成語(yǔ)音,每N個(gè)樣本的塊通過(guò)由對(duì)語(yǔ)音信號(hào)的譜特性建模的 時(shí)變?yōu)V波器對(duì)來(lái)自創(chuàng)新碼本的適當(dāng)?shù)拇a向量(codevector)進(jìn)行濾波來(lái)合成。這些濾波器 由音高合成濾波器(通常實(shí)現(xiàn)為包含過(guò)去激勵(lì)信號(hào)的自適應(yīng)碼本)和LP合成濾波器構(gòu)成。在編碼器端,針對(duì)來(lái)自創(chuàng)新碼本的所有碼向量或其子集來(lái)計(jì)算合成輸出(碼本搜索)。所保 留的創(chuàng)新碼向量是根據(jù)感覺(jué)(perceptually)加權(quán)失真量度,產(chǎn)生最接近原始語(yǔ)音信號(hào)的 合成輸出的碼向量。這個(gè)感覺(jué)加權(quán)是使用所謂的感覺(jué)加權(quán)濾波器來(lái)執(zhí)行的,該濾波器通常 由LP合成濾波器衍生(derive)而來(lái)。在CELP環(huán)境中,創(chuàng)新碼本是被稱為N維碼向量的N樣本長(zhǎng)度的序列的索引集 (indexed set)。每個(gè)碼本序列由0至M。_l范圍內(nèi)的整數(shù)k進(jìn)行索引,其中Μ。代表創(chuàng)新碼 本的大小,通常被表示為比特的數(shù)量b,其中Mc = 2b。
碼本可存儲(chǔ)在物理存儲(chǔ)器中,例如查找表(隨機(jī)(stochastic)碼本),或者可指將索引與對(duì)應(yīng)的碼向量關(guān)聯(lián)起來(lái)的機(jī)制,例如公式(代數(shù)碼本)。第一類型的碼本(隨機(jī)碼本)的缺點(diǎn)是它們經(jīng)常牽涉到大量的物理存儲(chǔ)裝置。它 們是隨機(jī)性的,即,在這個(gè)意義上是隨機(jī)的從索引到相關(guān)聯(lián)的碼向量的路徑牽涉到查找 表,該查找表是將隨機(jī)產(chǎn)生的數(shù)或統(tǒng)計(jì)技術(shù)應(yīng)用到大量的語(yǔ)音訓(xùn)練集的結(jié)果。隨機(jī)碼本的 大小傾向于受到存儲(chǔ)裝置和/或搜索復(fù)雜度的限制。第二類型的碼本為代數(shù)碼本。通過(guò)與隨機(jī)碼本的對(duì)比,代數(shù)碼本不是隨機(jī)的,且不 要求大量的存儲(chǔ)裝置。代數(shù)碼本為一組索引的碼向量,其中第k個(gè)碼向量的脈沖的幅度和 位置可通過(guò)不需要物理存儲(chǔ)裝置、或需要最少的物理存儲(chǔ)裝置的規(guī)則從對(duì)應(yīng)的索引k衍生 而來(lái)。因此,代數(shù)碼本的大小不受存儲(chǔ)裝置要求的限制。代數(shù)碼本也可被設(shè)計(jì)用于高效的 搜索。CELP模型已經(jīng)非常成功用于編碼電話頻帶聲音信號(hào),若干基于CELP的標(biāo)準(zhǔn) 存在于廣泛的應(yīng)用中,尤其在數(shù)字蜂窩應(yīng)用中。在電話頻帶中,聲音信號(hào)被頻帶限制 (band-limit)在200_3400Ηζ,并以8000樣本/秒被采樣。在寬帶語(yǔ)音/音頻應(yīng)用中,聲音 信號(hào)被頻帶限制在50-7000ΗΖ并以16000樣本/秒被采樣。在編碼寬帶信號(hào)時(shí)出現(xiàn)的重要問(wèn)題是需要使用非常大的激勵(lì)碼本。因此,要求最 小存儲(chǔ)裝置并能被快速搜索的高效的碼本結(jié)構(gòu)變得非常重要。代數(shù)碼本因?yàn)樗鼈兊男识?聞名,因此現(xiàn)在在各種語(yǔ)音編碼標(biāo)準(zhǔn)中被廣泛使用??墒褂梅歉F盡搜索方法來(lái)高效地搜索 具有更大比特?cái)?shù)量的代數(shù)碼本。示例為嵌套循環(huán)搜索[4]、在脈沖子集中搜索脈沖的深度 優(yōu)先(d印th-first)樹(shù)搜索[5]、和全局脈沖替換[6]。在ITU-T推薦(Recommendation) G. 723. 1 [7]中使用一種類似于多脈沖序列搜索[3]的簡(jiǎn)單搜索。在參考文獻(xiàn)[7]中,激勵(lì) 由幀內(nèi)的若干符號(hào)脈沖(signed pulse)組成(沒(méi)有如ACELP中的軌道(track)結(jié)構(gòu)),對(duì) 于所有脈沖具有固定增益。通過(guò)更新所謂的后向?yàn)V波目標(biāo)信號(hào)d(n)并將新的脈沖放置在 信號(hào)d(n)的最大絕對(duì)值處,來(lái)順序地搜索脈沖。針對(duì)若干增益值重復(fù)該搜索,但是在每次 迭代過(guò)程中假定增益是恒定的。
發(fā)明內(nèi)容
更具體地,根據(jù)本發(fā)明,提供在對(duì)聲音信號(hào)進(jìn)行編碼期間搜索代數(shù)碼本的方法,其 中所述代數(shù)碼本包括由多個(gè)脈沖位置和多個(gè)脈沖形成的一組碼向量,每個(gè)脈沖具有符號(hào) (sign)并分布在所述脈沖位置上。代數(shù)碼本搜索方法包括計(jì)算用來(lái)搜索代數(shù)碼本參考信 號(hào);在第一階段,(a)關(guān)于所述參考信號(hào)并在所述多個(gè)脈沖位置中確定第一脈沖的位置;在 第一階段之后的多個(gè)階段的每一個(gè)中,(a)重新計(jì)算代數(shù)碼本增益,(b)使用重新計(jì)算的代 數(shù)碼本增益更新參考信號(hào),以及(c)關(guān)于參考信號(hào)并在所述多個(gè)脈沖位置中確定另一脈沖 的位置;以及使用在第一和之后的階段中所確定的脈沖的位置和符號(hào)來(lái)計(jì)算代數(shù)碼本的碼 向量,其中所述第一和之后的階段的數(shù)量對(duì)應(yīng)于代數(shù)碼本的碼向量中的脈沖的數(shù)量。本發(fā)明還涉及在對(duì)聲音信號(hào)進(jìn)行編碼期間用于搜索代數(shù)碼本的設(shè)備,其中所述代 數(shù)碼本包括由多個(gè)脈沖位置和多個(gè)脈沖形成的一組碼向量,每個(gè)脈沖具有符號(hào)并分布在所 述脈沖位置上,以及其中所述代數(shù)碼本搜索設(shè)備包括用于計(jì)算用以搜索代數(shù)碼本的參考 信號(hào)的部件;用于在第一階段關(guān)于所述參考信號(hào)并在所述多個(gè)脈沖位置中確定第一脈沖的位置的部件;用于第一階段之后的多個(gè)階段的每一個(gè)中重新計(jì)算代數(shù)碼本增益的部件;用 于在每個(gè)之后的階段中使用重新計(jì)算的代數(shù)碼本增益來(lái)更新參考信號(hào)的部件;以及用于在 每個(gè)之后的階段中關(guān)于所更新的參考信號(hào)并在所述多個(gè)脈沖位置中確定另一脈沖的位置 的部件;以及用于使用在第一和隨后的階段中確定的脈沖的位置和符號(hào)來(lái)計(jì)算代數(shù)碼本的 碼向量的部件,其中所述第一和隨后的階段的數(shù)量對(duì)應(yīng)于代數(shù)碼本的碼向量中的脈沖的數(shù) 量。
本發(fā)明進(jìn)一步涉及在對(duì)聲音信號(hào)進(jìn)行編碼期間搜索代數(shù)碼本的設(shè)備,其中所述代 數(shù)碼本包括由多個(gè)脈沖位置和多個(gè)脈沖形成的一組碼向量,每個(gè)脈沖具有符號(hào)并分布在所 述脈沖位置上,以及其中所述代數(shù)碼本搜索設(shè)備包括第一計(jì)算裝置,其用來(lái)計(jì)算用以搜索 代數(shù)碼本的參考信號(hào);第二計(jì)算裝置,其用來(lái)在第一階段關(guān)于所述參考信號(hào)并在所述多個(gè) 脈沖位置中確定第一脈沖的位置;第三計(jì)算裝置,其用來(lái)在第一階段之后的多個(gè)階段的每 一個(gè)中重新計(jì)算代數(shù)碼本增益;第四計(jì)算裝置,其用來(lái)在每個(gè)之后的階段中使用重新計(jì)算 的代數(shù)碼本增益來(lái)更新參考信號(hào);以及第五計(jì)算裝置,其用來(lái)在每個(gè)之后的階段中關(guān)于所 更新的參考信號(hào)并在所述多個(gè)脈沖位置中確定另一脈沖的位置;以及第六計(jì)算裝置,其使 用在第一和隨后的階段中確定的脈沖的位置和符號(hào)來(lái)計(jì)算代數(shù)碼本的碼向量,其中所述第 一和隨后的階段的數(shù)量對(duì)應(yīng)于代數(shù)碼本的碼向量中的脈沖的數(shù)量。在閱讀了本發(fā)明的示意性實(shí)施例的以下非限制性描述的基礎(chǔ)上,本發(fā)明的上述和 其他目標(biāo)、優(yōu)勢(shì)及特征將變得明顯,參考附圖僅通過(guò)示例給出這些實(shí)施例。
在所附的圖中圖1為圖示聲音編碼和解碼設(shè)備的使用的通信系統(tǒng)的示意框圖;圖2為圖示基于CELP的編碼器和解碼器結(jié)構(gòu)的示意框圖;圖3為圖示根據(jù)本發(fā)明的代數(shù)固定碼本搜索方法和設(shè)備的實(shí)施例的框圖;以及圖4為圖示根據(jù)本發(fā)明的代數(shù)固定碼本搜索方法和設(shè)備的另一實(shí)施例的框圖。
具體實(shí)施例方式本發(fā)明的非限制說(shuō)明性的實(shí)施例關(guān)注基于CELP的編碼器的快速碼本搜索的方法 和設(shè)備。碼本搜索方法和設(shè)備可用于任何聲音信號(hào),包括語(yǔ)音和音頻信號(hào)。碼本搜索方法 和設(shè)備也可應(yīng)用于以任何比率采樣的窄帶、寬帶、或全頻帶信號(hào)。圖1為描述使用聲音編碼和解碼的示例的聲音通信系統(tǒng)100的示意框圖。聲音通 信系統(tǒng)100支持通信信道101上的聲音信號(hào)的傳輸和再現(xiàn)。盡管它可包括例如有線、光學(xué) 或光纖鏈路,但通信信道101典型地至少部分地包括射頻鏈路。射頻鏈路通常支持需要共 享帶寬資源的多個(gè)同步語(yǔ)音通信,如可在蜂窩電話的情況下發(fā)現(xiàn)那樣。盡管未顯示,通信信 道101可由通信系統(tǒng)101的單個(gè)設(shè)備實(shí)施例中的存儲(chǔ)設(shè)備來(lái)代替,其記錄并存儲(chǔ)編碼的聲 音信號(hào)用于以后回放。仍然參考圖1,例如,麥克風(fēng)102產(chǎn)生模擬聲音信號(hào)103,其被提供給模數(shù){A/D} 轉(zhuǎn)換器104以將其轉(zhuǎn)換成數(shù)字聲音信號(hào)105。聲音編碼器106對(duì)數(shù)字聲音信號(hào)105進(jìn)行編 碼,因此產(chǎn)生一組編碼參數(shù)107,編碼參數(shù)107被編碼成二進(jìn)制形式并被傳遞給信道編碼器108。在通過(guò)通信信道101傳輸編碼參數(shù)的二進(jìn)制之前,可選的信道編碼器108向編碼參數(shù) 的二進(jìn)制表示增加冗余度。在接收機(jī)側(cè),信道解碼器109利用以上提到的在所接收到的比 特流中的冗余信息來(lái)檢測(cè)并校正在通過(guò)通信信道101傳輸期間出現(xiàn)的信道誤差。聲音解碼 器110將從信道解碼器110接收的比特流轉(zhuǎn)換回用于創(chuàng)建合成的數(shù)字聲音信號(hào)113的一組 編碼參數(shù)。在數(shù)模(D/A)轉(zhuǎn)換器115中將在聲音解碼器110中重構(gòu)的合成的數(shù)字聲音信號(hào) 113轉(zhuǎn)換成模擬聲音信號(hào)114,并在揚(yáng)聲器單元116中進(jìn)行回放。如圖2a和2b中所圖示的,聲音編解碼器由兩個(gè)基本部分構(gòu)成聲音編碼器210和 聲音解碼器212。編碼器210對(duì)聲音信號(hào)進(jìn)行數(shù)字化,選擇代表聲音信號(hào)的有限數(shù)量的參 數(shù),并將這些參數(shù)轉(zhuǎn)換成數(shù)字比特流,使用例如圖1的通信信道101的通信信道將該數(shù)字比 特流傳輸給解碼器212。聲音解碼器212將該聲音信號(hào)重構(gòu)為與原始聲音信號(hào)盡可能地相 似。當(dāng)前,最普遍的語(yǔ)音編碼技術(shù)是基于線性預(yù)測(cè)(LP),特別是CELP。在基于LP的 編碼中,由具有傳遞函數(shù)1/A(z)的LP合成濾波器216通過(guò)對(duì)激勵(lì)214濾波來(lái)合成聲音信 號(hào)230。在CELP中,激勵(lì)214典型地由兩部分組成第一階段(stage),自適應(yīng)碼本貢獻(xiàn) (contribution) 222,其選自自適應(yīng)碼本218并被自適應(yīng)碼本增益gp226放大;以及第二階 段,固定碼本貢獻(xiàn)224,其選自固定碼本220并被固定碼本增益g。228放大。通常說(shuō)來(lái),自 適應(yīng)碼本貢獻(xiàn)222對(duì)激勵(lì)的周期部分建模,而添加固定碼本貢獻(xiàn)214來(lái)對(duì)聲音信號(hào)的演進(jìn) (evolution)建模。典型地按20ms的幀來(lái)處理聲音信號(hào),在每幀內(nèi)傳輸一次LP濾波器系數(shù)。在CELP 中,幀被進(jìn)一步地劃分為若干子幀以對(duì)激勵(lì)進(jìn)行編碼。子幀長(zhǎng)度典型地為5ms。CELP背后的主要原理被稱為合成_分析,其中已經(jīng)在編碼處理期間嘗試(合成) 可能的解碼器輸出,然后與原始聲音信號(hào)進(jìn)行比較。該搜索在感覺(jué)加權(quán)域中最小化輸入語(yǔ) 音信號(hào)s(n)211和合成語(yǔ)音s' (ri)230之間的均方誤差232,其中,離散時(shí)間索引η = 0, 1,. . .,Ν-1,Ν為子幀的長(zhǎng)度。感覺(jué)加權(quán)濾波器233利用頻率掩蔽效應(yīng),并典型地由LP濾波 器A(Z)衍生而來(lái)。在等式(1)中給出感覺(jué)加權(quán)濾波器233的一個(gè)示例
(1)其中因子[和Y 2控制感覺(jué)加權(quán)的量,以及其中0< Y2 < Y1S 1。等式(1)的 傳統(tǒng)感覺(jué)加權(quán)濾波器對(duì)ΝΒ(窄帶,200-3400ΗΖ的帶寬)信號(hào)工作良好??稍趨⒖嘉墨I(xiàn)[2] 中發(fā)現(xiàn)針對(duì)WB(寬帶,50-7000Hz的帶寬)信號(hào)的感覺(jué)加權(quán)濾波器的示例。由于LP合成濾波器1/Α(ζ)和加權(quán)濾波器W(Z)的存儲(chǔ)與所搜索的碼向量無(wú)關(guān),因 此可在固定碼本搜索之前從輸入語(yǔ)音信號(hào)s (η)減去(subtract)該存儲(chǔ)。然后可通過(guò)與級(jí) 聯(lián)的濾波器1/A(z)和W(z)的脈沖響應(yīng)的卷積來(lái)對(duì)候選的碼向量進(jìn)行濾波,該級(jí)聯(lián)的濾波 器的脈沖響應(yīng)由圖1中的H(Z)來(lái)表示。從編碼器210向解碼器212傳輸?shù)谋忍亓鞯湫偷匕韵聟?shù)LP合成濾波器 A(Z)的量化參數(shù)、自適應(yīng)和固定碼本索弓丨、以及自適應(yīng)和固定碼本的增益gp*g。。在圖2a 和2b中示出包含所描述參數(shù)的編碼器210和解碼器212的框圖。自適應(yīng)碼本搜索將僅在以下段落中簡(jiǎn)單描述基于CELP的編解碼器中的自適應(yīng)碼本搜索,這是因?yàn)檫@種自適應(yīng)碼本搜索被認(rèn)為在其它方面對(duì)本領(lǐng)域的普通技術(shù)人員來(lái)說(shuō)是眾所周知的。在加權(quán)語(yǔ)音域中執(zhí)行基于CELP的編解碼器中的自適應(yīng)碼本搜索,以確定延時(shí)(音高周期)t和音高增益(或自適應(yīng)碼本增益)gp,并構(gòu)建激勵(lì)的自適應(yīng)碼本貢獻(xiàn)。音高周期 t強(qiáng)烈地依賴于具體的揚(yáng)聲器,它的準(zhǔn)確確定嚴(yán)重地影響合成語(yǔ)音的質(zhì)量。在最近的CELP編解碼器中,使用三階段過(guò)程來(lái)確定音高周期t。在第一階段,為每 個(gè)幀計(jì)算開(kāi)環(huán)音高周期的估計(jì)T。p。典型地使用加權(quán)聲音信號(hào)sw(η)和歸一化(normalize) 相關(guān)計(jì)算來(lái)搜索開(kāi)環(huán)音高周期;如在圖2a中所示出的,通過(guò)由加權(quán)濾波器W(Z) 233對(duì)輸入 聲音信號(hào)s (η) 211進(jìn)行加權(quán)來(lái)計(jì)算加權(quán)的聲音信號(hào)Sw (η)。在第二階段,對(duì)于每個(gè)5ms子幀 在所估計(jì)的開(kāi)環(huán)音高周期T。p附近對(duì)整數(shù)音高周期執(zhí)行閉環(huán)音高搜索。一旦發(fā)現(xiàn)最優(yōu)化的 整數(shù)音高周期,則第三階段遍歷該最優(yōu)化的整數(shù)音高周期附近的片斷(fraction)。通過(guò)最 小化原始和合成聲音信號(hào)之間的均方加權(quán)誤差232來(lái)執(zhí)行閉環(huán)音高搜索。這可以通過(guò)最大 化以下項(xiàng)來(lái)實(shí)現(xiàn) 其中Xl(n)為目標(biāo)信號(hào),yi(n)為濾波的自適應(yīng)碼向量。如在圖2a中所示出的,通 過(guò)來(lái)自在音高周期t的自適應(yīng)碼本242的過(guò)去激勵(lì)信號(hào)V(n)與加權(quán)合成濾波器H(z) 238 的脈沖響應(yīng)h (η)的卷積來(lái)計(jì)算濾波的自適應(yīng)碼向量yi (η)Y1 (η) = ν (η) *h (η)(3)通過(guò)LP合成濾波器1/A(z)和感覺(jué)加權(quán)濾波器W (ζ)的級(jí)聯(lián)形成濾波器H(Z) 238。 目標(biāo)信號(hào)X1 (η)對(duì)應(yīng)于減去濾波器H(Z)的零輸入響應(yīng)之后的感覺(jué)加權(quán)輸入語(yǔ)音信號(hào)Sw(η) (見(jiàn)減法器236)。通過(guò)最小化信號(hào)X1 (η)和yi (η)之間的均方誤差來(lái)尋找音高增益gp240,并通過(guò)以 下關(guān)系式給出 音高增益%通常由1.2來(lái)界定。在大多數(shù)的CELP實(shí)施方案中,一旦發(fā) 現(xiàn)創(chuàng)新的碼向量,則利用固定碼本增益來(lái)量化音高增益gp。通過(guò)將濾波的自適應(yīng)碼向量yi (η)乘以音高增益gp來(lái)計(jì)算自適應(yīng)碼本貢獻(xiàn)250。固定碼本搜索在基于CELP的編解碼器中搜索固定(創(chuàng)新的)碼本(FCB)貢獻(xiàn)的目的是最小化 在使用自適應(yīng)碼本之后的殘差(residual error)。該殘差通過(guò)下列關(guān)系式給出(見(jiàn)圖2a 的減法器) 其中g(shù)。為固定碼本增益,y2k(n)為濾波的創(chuàng)新碼向量。k為固定碼本索引,濾波 的創(chuàng)新碼向量y2k(n)為來(lái)自索引k處的固定碼本244的碼向量ck(η)與加權(quán)合成濾波器 H (ζ) 246的脈沖響應(yīng)h (η)的卷積。通過(guò)濾波的創(chuàng)新碼向量y2k(η)乘以固定碼本增益g。248來(lái)計(jì)算固定碼本貢獻(xiàn)252。 通過(guò)從自適應(yīng)碼本目標(biāo)信號(hào)X1 (η)減去自適應(yīng)碼本貢獻(xiàn)250來(lái)計(jì)算代數(shù)固定碼本 目標(biāo)信號(hào)X2 (η)(見(jiàn)減法器254)X2 (n) = X1 (η) -gpyi (η)(6)從等式(5)來(lái)最小化E產(chǎn)生最優(yōu)化的固定碼本增益g。 以及來(lái)自等式(5)的最小誤差然后產(chǎn)生 這樣,通過(guò)最大化以下項(xiàng)來(lái)執(zhí)行該搜索 可以以若干種方式來(lái)實(shí)施固定碼本。一種最常見(jiàn)的實(shí)施方案由使用其中將一組脈 沖放置在每個(gè)子幀上的代數(shù)碼本[1]構(gòu)成。這種代數(shù)碼本的效率依賴于脈沖的數(shù)量、它們 的符號(hào)、位置和幅度。由于大的碼本被用來(lái)保證編碼的高的主觀質(zhì)量,因此還實(shí)施高效的碼 本搜索。在代數(shù)CELP (ACELP (代數(shù)編碼激勵(lì)線性預(yù)測(cè)))編解碼器中,代數(shù)固定碼本向量 (在此之后稱為固定碼向量)Ck (η)包含具有各自的符號(hào)~和位置Ii^的M個(gè)單位脈沖,并由 此通過(guò)以下關(guān)系式給出 其中對(duì)η = 0,Sj = 士 1,δ (η) = 1,對(duì)η乒0,δ (η) =0。經(jīng)過(guò)濾波器246濾波 之后的固定碼向量然后可以被表示成以下形式
M-]
(11) 通常,脈沖的數(shù)量M受比特率可用性限制。固定碼本索引(或碼字)k代表每個(gè)子 幀內(nèi)的脈沖位置和符號(hào)。這樣無(wú)需碼本存儲(chǔ)裝置,這是因?yàn)樵跊](méi)有查找表的情況下可以通 過(guò)包含在索引k本身的信息在解碼器處重構(gòu)所選擇的碼向量。不同于多脈沖方法[3],代數(shù)固定碼本增益g。對(duì)所有的脈沖來(lái)說(shuō)是相同的。將碼本索引k處的代數(shù)碼向量表示為ck,將經(jīng)過(guò)濾波器H(Z) 246濾波的對(duì)應(yīng)碼向 量表示為y2(k) (η)(圖2a)。然后可以使用矩陣記號(hào)(notation)將等式(9)中的代數(shù)碼本 搜索描述為以下準(zhǔn)則[1]的最大化
其中T表示向量轉(zhuǎn)置(transpose),H為下三角To印Iitz卷積矩陣,對(duì)角線為 h (0),下對(duì)角線為 h(l),...,h (N-I) 向量d = HTX2為X2 (η)和h(n)之間的相關(guān)性,也被稱為后向?yàn)V波目標(biāo)向量(因?yàn)?可以使用通過(guò)加權(quán)合成濾波器的X2(Ii)的時(shí)間-逆轉(zhuǎn)(time-reversed)濾波來(lái)計(jì)算它 矩陣φ = HtH為h (η)的相關(guān)矩陣。通常都在碼本搜索之前計(jì)算d和Φ。如果代 數(shù)碼本僅包含少許非零脈沖,則針對(duì)所有可能索引k的最大化準(zhǔn)則的計(jì)算是非??斓腫1]??墒褂梅歉F盡搜索方法來(lái)高效地搜索具有更大比特?cái)?shù)的代數(shù)碼本。示例為嵌套循 環(huán)搜索[4]、在脈沖子集中搜索脈沖的深度優(yōu)先樹(shù)搜索[5]、和全局脈沖替換[6]。在ITU-T Recommendation G. 723. 1 [7]中使用一種類似于多脈沖序列搜索[3]的簡(jiǎn)單搜索。在參考 文獻(xiàn)[7]中,激勵(lì)由幀里的若干符號(hào)脈沖組成(沒(méi)有如ACELP中的軌道結(jié)構(gòu)),具有針對(duì)所 有脈沖的固定增益。通過(guò)更新后向?yàn)V波目標(biāo)向量d(n)并將新的脈沖放置在d(n)的最大絕 對(duì)值處來(lái)順序地搜索脈沖。針對(duì)若干增益值重復(fù)該搜索,但是在每次迭代期間假定增益是 常數(shù)。在本說(shuō)明書(shū)中公開(kāi)的本發(fā)明的實(shí)施例關(guān)注搜索代數(shù)碼本的方法和設(shè)備,其中可以將 幀劃分為脈沖位置的交織(interleaved)軌道,以及其中在每個(gè)軌道上放置若干脈沖。所 公開(kāi)的碼本搜索方法和設(shè)備通過(guò)最大化基于最大似然信號(hào)的某種準(zhǔn)則來(lái)實(shí)施脈沖的序列 搜索的使用。然后在每個(gè)階段重新計(jì)算固定碼本增益??赏ㄟ^(guò)更改搜索軌道的順序來(lái)使用 若干迭代。將在以下的描述中公開(kāi)碼本搜索方法和設(shè)備的若干非限制性實(shí)施例以示出本發(fā) 明。代數(shù)固定碼本結(jié)構(gòu)可基于交織單脈沖列(interleaved single-pulse permutation, ISPP)來(lái)設(shè)計(jì) 碼本結(jié)構(gòu)。在這個(gè)結(jié)構(gòu)中,脈沖位置被劃分為交織位置的若干軌道。例如,被劃分為交織位 置的4個(gè)軌道UpT2和T3的64-位置的碼向量在每個(gè)軌道上產(chǎn)生16個(gè)位置,如下表I所顯示的。這個(gè)結(jié)構(gòu)將被用在以下示例中。表1-20-比特碼本中各個(gè)脈沖的潛在位置 如果單符號(hào)脈沖被放置在每個(gè)軌道上(M = 4),脈沖位置利用4比特來(lái)編碼,其符 號(hào)利用1比特來(lái)編碼,則產(chǎn)生20-比特碼本。如果兩個(gè)符號(hào)脈沖被放置在每個(gè)軌道上,兩個(gè) 脈沖位置利用8比特來(lái)編碼,以及它們對(duì)應(yīng)的符號(hào)可通過(guò)利用脈沖排序僅使用1比特來(lái)編 碼;因此,需要總共4X (4+4+1) =36比特來(lái)為這個(gè)特定的代數(shù)碼本結(jié)構(gòu)指定脈沖位置和符 號(hào)??赏ㄟ^(guò)例如在每個(gè)軌道Tc^TpT2和T3上放置3、4、5或6個(gè)脈沖來(lái)設(shè)計(jì)其他碼本結(jié)構(gòu)。在參考文獻(xiàn)[8]中描述對(duì)每個(gè)軌道上脈沖的編碼。碼本結(jié)構(gòu)的另一示例包括64-位置的碼向量,其被劃分為交織位置的2個(gè)軌道Ttl 和T1,在每個(gè)軌道上產(chǎn)生32個(gè)位置,如在表II中所示。如果單符號(hào)脈沖被放置在每個(gè)軌道 上,脈沖位置利用5比特來(lái)編碼,其符號(hào)利用1比特來(lái)編碼,則產(chǎn)生12-比特碼本。同樣,可 通過(guò)在每個(gè)軌道上放置更多脈沖,或通過(guò)固定一些脈沖的符號(hào)來(lái)設(shè)計(jì)其他碼本結(jié)構(gòu)。表II-12-比特碼本中各個(gè)脈沖的潛在位置 可使用軌道數(shù)量和每個(gè)軌道上脈沖數(shù)量的其他組合;已經(jīng)詳細(xì)示出了以上12-比 特和20-比特碼本,這是因?yàn)樵贗TU-T Recommendation G. 718編解碼器實(shí)施方案框架中使 用它們,以下在此將對(duì)該框架進(jìn)行概括。如已經(jīng)陳述的,在具有表I中所描述的結(jié)構(gòu)的20-比特碼本中,一個(gè)軌道上的每個(gè) 脈沖位置利用4比特來(lái)編碼,該脈沖的符號(hào)利用1比特來(lái)編碼。由子幀中的脈沖的位置除 以(整除)軌道的數(shù)量給出位置索引。該除法的余數(shù)給出軌道索引。例如,位置31處的脈沖具有位置索引31/4 = 7,其屬于具有索引3的軌道(第四軌道)。在這個(gè)示意性實(shí)施例 中,對(duì)于正的符號(hào),符號(hào)索引被設(shè)置為0,對(duì)負(fù)的符號(hào)被設(shè)置為1。由此通過(guò)以下關(guān)系式給出 符號(hào)脈沖的索引Im = m+s X 2W(15)其中m為位置索引,s為符號(hào)索弓丨,P = 4為每個(gè)軌道的比特?cái)?shù)。自相關(guān)方法簡(jiǎn)化FCB(固定碼本)搜索過(guò)程的普遍方法是使用自相關(guān)方法[9]。按照這個(gè)方 法,通過(guò)修改等式(16)中的總和限制,使來(lái)自等式(12)的具有元素
(16) 的相關(guān)矩陣Φ被減少為T(mén)o印lize形式,以便Φ (i,j) = α (|i_j|),其中
(17)
自相關(guān)方法源自將等式(13)的NXN的卷積矩陣修改成(2N-1)XN形式的的矩 陣 使用這個(gè)矩陣的卷積Hck產(chǎn)生在對(duì)每個(gè)長(zhǎng)度為N的兩個(gè)分段(segment)進(jìn)行卷積 時(shí)獲得的長(zhǎng)度為2N-1的碼向量。在協(xié)方差(covariance)方法中,僅考慮卷積的前N個(gè)樣 本,不考慮超出這個(gè)子幀限制的任何樣本??稍诟鶕?jù)本發(fā)明的技術(shù)中使用這個(gè)方法。使用自相關(guān)方法意味著在2N-1個(gè)樣本上最小化均方加權(quán)誤差。這要求通過(guò)輸入 在N個(gè)聲音樣本之后的零值樣本到加權(quán)合成濾波器H(z)246,來(lái)在2N-1個(gè)樣本上計(jì)算目標(biāo) 信號(hào)x2 (η)。結(jié)果,將修改由d = HTX2給出的信號(hào)Χ2(η)的計(jì)算以考慮新的矩陣維度。作為 近似,可如在傳統(tǒng)方法中那樣執(zhí)行信號(hào)X1 (η)和d(n)的計(jì)算,但是可使用自相關(guān)方法來(lái)執(zhí) 行濾波固定碼向量y2(k)(n)的能量的計(jì)算。根據(jù)等式(10)_(12),可示出,對(duì)于具有M個(gè)脈沖的代數(shù)固定碼本,要被最大化的 準(zhǔn)則可記做 使用自相關(guān)方法,這可被表達(dá)為 根據(jù)等式(7),代數(shù)碼本增益可表達(dá)為 以及在自相關(guān)方法的情形中 已經(jīng)在序列多脈沖搜索[3]中使用了自相關(guān)方法,這是因?yàn)閷?duì)單個(gè)脈沖,搜索準(zhǔn) 則降低至將脈沖放置在d(η)的最大絕對(duì)值處。快速代數(shù)固定碼本搜索現(xiàn)在將描述在例如固定碼本中進(jìn)行快速代數(shù)碼本搜索的方法和設(shè)備。進(jìn)行快速代 數(shù)碼本搜索的方法和設(shè)備背后的總體思路是在若干迭代中順序地搜索脈沖。在以下的非限 制示意性實(shí)施例中,將使用自相關(guān)方法。然而也可使用更普遍的協(xié)方差方法[8]。該方法和 設(shè)備的基本原理在于在確定每個(gè)新的脈沖之后,更新固定碼本增益g。和后向?yàn)V波目標(biāo)向量 d(n)。基本搜索可由以下步驟來(lái)概括。1.使用等式(14)和(17)預(yù)先(即,在進(jìn)入搜索過(guò)程的迭代部分之前)計(jì)算后向 濾波目標(biāo)向量d(n)(在此實(shí)施例中,用于搜索代數(shù)固定碼本的參考信號(hào))和向量α (η)(或 在協(xié)方差方法的情形中,矩陣Φ)。2.在每次迭代的第一階段,第一脈沖位置mQ典型地被設(shè)置在后向?yàn)V波目標(biāo)向量 d(n)的最大絕對(duì)值處,η為N長(zhǎng)度的子幀中的樣本索引(或在協(xié)方差方法的情形中,通過(guò)最 大化i/2(m。)/樹(shù)m。,mG) ) 脈沖符號(hào)由(Kmtl)的符號(hào)給出。3.在隨后的階段(每個(gè)新的脈沖被確定之后),代數(shù)固定碼本增益g。被重新計(jì)算, 然后該增益g。被用來(lái)更新后向?yàn)V波目標(biāo)向量d (η)。4.按更新后的后向?yàn)V波目標(biāo)向量d(n)的最大絕對(duì)值來(lái)尋找每個(gè)新的脈沖%的位 置,并且脈沖符號(hào)由樣本(Kmj)的符號(hào)給出。
5.為實(shí)現(xiàn)更高的編碼效率,以上步驟2-4可以以mQ的不同位置開(kāi)始來(lái)迭代(例 如,第2次迭代中d(n)的第二大的最大絕對(duì)值,第3次迭代中d(η)的第三大的最大絕對(duì)值, 等)。最大化等式(12)的搜索準(zhǔn)則的迭代最終被用于脈沖位置的選擇。以下描述解釋了在固定碼本中進(jìn)行快速代數(shù)碼本搜索的方法和設(shè)備的使用,該固 定碼本由若干交織位置的軌道組成,其中M為脈沖數(shù)量,L為軌道數(shù)量以及N為子幀長(zhǎng)度。 首先給出M = L = 4的具體情況的描述。然后將針對(duì)M個(gè)脈沖(當(dāng)M仍等于L)概括該過(guò) 程,并進(jìn)一步擴(kuò)展至M不等于L的情形。所公開(kāi)的搜索方法和設(shè)備的一般過(guò)程現(xiàn)在將描述方法和設(shè)備的實(shí)施方案的示例,所述方法和設(shè)備用于進(jìn)行快速代數(shù)碼 本搜索,用于搜索具有4個(gè)脈沖位置的軌道且每個(gè)軌道上一個(gè)脈沖的固定碼本。FCB搜索過(guò)程以計(jì)算等式(14)定義的后向?yàn)V波目標(biāo)向量d(n)(在這個(gè)實(shí)施例中, 用來(lái)搜索代數(shù)固定碼本的參考信號(hào))和等式(17)定義的向量α (k)(或等式(16)定義的 矩陣Φ( ,j))開(kāi)始。在以下描述中,索引i代表軌道中脈沖的位置(見(jiàn)表I或表II),索 引η代表子幀中樣本的數(shù)量,其中η = 0,. . .,N-I0在首次迭代中,m0標(biāo)示(designate)在軌道Ttl中確定的脈沖位置,Hi1標(biāo)示在軌道 T1中確定的脈沖位置,Hl2標(biāo)示在軌道T2中確定的脈沖位置,以及Hl3標(biāo)示在軌道T3中確定的 脈沖位置。對(duì)單個(gè)脈沖,等式(19)中的準(zhǔn)則被降至
(23)以及在自相關(guān)方法的情形中,等式(20)被降至 從等式(24)可看出,按后向?yàn)V波目標(biāo)向量d(i) (i e T0)的最大絕對(duì)值的索引尋 找第一脈沖的位置,即m0 = index (max (| d (i) |))(25)以及它的符號(hào)由d(mQ)的符號(hào)給出,即s0 = sgn(d(m0)) (26)根據(jù)等式(22),第一脈沖的增益由以下關(guān)系式給出
(27)或在自相關(guān)方法的情形中由以下關(guān)系式給出
(28)在第二階段(第二脈沖搜索),按以下通過(guò)從該目標(biāo)信號(hào)X2 (η)中減去第一脈沖貢 獻(xiàn)來(lái)更新目標(biāo)信號(hào)
( 29 )以上所使用的括號(hào)中的上索引范圍是
,并對(duì)應(yīng)所搜索的脈沖編號(hào)j。 注意到為了簡(jiǎn)單和清楚起見(jiàn),描述信號(hào)y2(k)n)時(shí),碼本索引k被省略。使用等式(11),等式(29)可記為
(30)為尋找第二脈沖位置和增益,按以下更新后向?yàn)V波目標(biāo)向量d(i) (i e Ti)
(31) 在自相關(guān)方法的情形中,按以下更新后向?yàn)V波目標(biāo)向量d(n)
(32)類似于等式(25)和(26),使用如下關(guān)系式來(lái)尋找第二脈沖的位置和符號(hào) (i e Ti)IIi1 = index (max (| d(1) (i) |))(33)S1 = sgn (d(1) (Hi1))(34)以與第二階段相同的方式執(zhí)行第三階段。唯一的區(qū)別是考慮第一和第二脈沖貢獻(xiàn) 兩者來(lái)尋找第三脈沖的位置和符號(hào)。根據(jù)等式(21),使用以下關(guān)系式來(lái)重新計(jì)算兩個(gè)脈沖之后的增益g。 「(1) _s0d(m0) +SlCjjml)
(35)以及對(duì)自相關(guān)方法,根據(jù)等式(22) 使用以下關(guān)系式來(lái)進(jìn)行目標(biāo)信號(hào)的更新
( 37)以及使用以下關(guān)系式來(lái)更新向量d(i) (i e Ti)
(38)以及通過(guò)下列關(guān)系式使用自相關(guān)方法
(39)類似于等式(25)和(26),按以下對(duì)于i e T2尋找第三脈沖的位置和符號(hào)m2 = index (max (| d(2) (i) |))(40)s2 = sgn(d(2) (m2))(41)類似地,在第四階段中,使用自相關(guān)方法,對(duì)i e 1~3按以下進(jìn)行后向?yàn)V波目標(biāo)向量 d(n)的更新
( 42 )其中第三脈沖的固定碼本增益g。(2)由下式給出
( 43 )以及對(duì)i e T3使用以下關(guān)系式來(lái)尋找第四脈沖的位置和符號(hào)m3 = index(max(|d(3)(i) I)) (44)s3 = sgn(d⑶(m3))(45)使用以上過(guò)程,尋找到所有的4個(gè)脈沖的位置和符號(hào)。通過(guò)在不同的軌道上開(kāi)始每一次迭代,以上過(guò)程被重復(fù)L = 4次。例如,在第二次 迭代中,脈沖位置Hl0被指派給軌道T1,脈沖位置Hl1被指派給軌道T2,脈沖位置Hl2被指派給 軌道T3,以及脈沖位置Hl3被指派給軌道 ;。最終,本次迭代中被選擇的、最小化均方加權(quán)誤 差的脈沖位置和符號(hào)被選取用來(lái)形成最終的固定碼向量和濾波固定碼向量。更具體地,所 有迭代之后,按最大化下列準(zhǔn)則的那些來(lái)選取脈沖位置和符號(hào)的最優(yōu)集合 其中對(duì)優(yōu)選的碼本索引k,y2(k) (η)由等式(11)給出。這個(gè)過(guò)程可被輕易地?cái)U(kuò)展至多于4個(gè)脈沖,并用于執(zhí)行迭代的不同方法。這個(gè)過(guò) 程也可擴(kuò)展至若干脈沖被放置在脈沖位置的每個(gè)軌道上的情形。對(duì)4個(gè)軌道上4個(gè)脈沖的情形,該過(guò)程可使用下列假設(shè)概括如下。脈沖被順序地 搜索,且后向?yàn)V波目標(biāo)向量d(n)(在此實(shí)施例中,用于搜索代數(shù)固定碼本的參考信號(hào))在每 個(gè)階段被更新。階段的數(shù)量等于脈沖數(shù)量M。迭代的次數(shù)等于軌道數(shù)量L。使用自相關(guān)方 法。1.該過(guò)程在L (對(duì)應(yīng)脈沖位置軌道的數(shù)量)次迭代中重復(fù),每次迭代開(kāi)始于不同的 軌道。2.每次迭代由M(對(duì)應(yīng)脈沖的數(shù)量)個(gè)階段組成。脈沖被逐個(gè)搜索,每次一個(gè)軌道。3.在進(jìn)入搜索過(guò)程的迭代部分之前,使用等式(14)和(17)預(yù)先計(jì)算后向?yàn)V波目 標(biāo)向量d(n)和向量α (η)兩者。4.在每次迭代過(guò)程中,第一階段包括確定第一脈沖位置πν在初始軌道中,它被 典型地設(shè)置在后向?yàn)V波目標(biāo)向量d(n)的最大絕對(duì)值處。脈沖符號(hào)由(Kmci)的符號(hào)給出。5.在隨后的階段中,在每個(gè)新的脈沖被確定之后,重新計(jì)算固定碼本增益g。,并也 使用它來(lái)更新后向?yàn)V波目標(biāo)向量d (η)。6.按更新后的后向?yàn)V波目標(biāo)向量d(n)的最大絕對(duì)值來(lái)尋找新脈沖Hij的位置,且 脈沖符號(hào)由樣本d(mp的符號(hào)給出。7.該過(guò)程的以上操作4-6被重復(fù)L次,以各自不同的軌道開(kāi)始。最大化等式(12)的搜索準(zhǔn)則的迭代最終被用作脈沖位置和符號(hào)的選擇。搜索M個(gè)軌道中的M個(gè)脈沖的過(guò)程如以上所描述的進(jìn)行快速代數(shù)碼本搜索的方法和設(shè)備可進(jìn)一步概括為如下針對(duì)M 個(gè)脈沖。在這個(gè)實(shí)施例中,軌道的數(shù)量等于待搜索的脈沖數(shù)量,也就是M = L。該過(guò)程可由如下操作概括1.計(jì)算后向?yàn)V波目標(biāo)向量d(n)(在此實(shí)施例中,用于搜索代數(shù)固定碼本的參考信 號(hào))和相關(guān)向量α (η)。2.進(jìn)行第一次迭代。將脈沖位置m0指派給軌道Ttl,脈沖位置Hi1給軌道T1,脈沖位 置Hl2給軌道T2,脈沖位置Hl3給軌道T3,...,脈沖位置HIsh給軌道Tsh (假定每個(gè)軌道一個(gè)脈 沖)。3.通過(guò)計(jì)算下式來(lái)確定第一脈沖的位置和符號(hào) 其中i e Τ。。4.通過(guò)計(jì)算下式確定第二脈沖的位置和符號(hào) 其中 5.對(duì)j = 2至M-1,通過(guò)計(jì)算下式確定其他脈沖的位置和符號(hào) 其中 6.使用等式(10)和(11)分別計(jì)算固定碼向量ck(η)和濾波固定碼向量y2(k) (η)。7.通過(guò)將各脈沖指派給不同的軌道,根據(jù)操作2重復(fù)該過(guò)程。迭代次數(shù)等于L。
8.選取對(duì)應(yīng)于最大化等式(46)的準(zhǔn)則的迭代的脈沖集合。搜索L個(gè)軌道中M個(gè)脈沖的過(guò)程
以上過(guò)程可進(jìn)一步擴(kuò)展成針對(duì)在數(shù)量為L(zhǎng)的軌道中搜索數(shù)量為M的脈沖的情況,M 是L的整數(shù)倍。在這個(gè)示例中,每個(gè)軌道上存在若干脈沖。這種情況也包括只有一個(gè)軌道 被使用的情形(即,當(dāng)未使用ISPP方法時(shí)的一般情形)。使用等式(47)至(60)對(duì)相同軌道上的脈沖進(jìn)行順序地搜索。針對(duì)軌道的所有位 置搜索軌道上的脈沖。當(dāng)兩個(gè)或更多脈沖占據(jù)同一個(gè)位置時(shí),可能會(huì)存在一些狀況。如果 這些脈沖具有相同的符號(hào),則它們?cè)谶@個(gè)位置上增加并加強(qiáng)碼本貢獻(xiàn)。不允許脈沖具有相 反符號(hào)的情形。每個(gè)軌道上多個(gè)脈沖的順序搜索對(duì)搜索脈沖順序很敏感。存在兩種基本的順序搜 索方法可用。第一種方法假設(shè)在搜索其他軌道之前搜索一個(gè)軌道上的所有脈沖。第二種方 法假設(shè)在軌道Ttl上搜索第一脈沖,在軌道T1上搜索第二脈沖,等。如果需要,在隨后的直 到軌道IV1的軌道上再次搜索脈沖,每個(gè)軌道一個(gè)脈沖,等。這兩種方法的示例在表III中 示出。如實(shí)驗(yàn)所觀察到的,第二種方法實(shí)現(xiàn)了更好的結(jié)果,因此被用在實(shí)施方案的以下示例 中。如果能負(fù)擔(dān)更高的復(fù)雜度,則兩種方法都可使用,然而會(huì)導(dǎo)致更多次迭代。表III-搜索L個(gè)軌道中的M個(gè)脈沖的兩種方法這里示出了 M = 8和L = 4的示例 然而另一方法可以是基于某個(gè)準(zhǔn)則來(lái)選擇將在其中搜索下一個(gè)脈沖的軌道。這種 準(zhǔn)則可以是,例如,后向?yàn)V波目標(biāo)向量d(n)的最大絕對(duì)值或它的更新。該準(zhǔn)則可以只用來(lái) 選擇所有脈沖都未被指派的軌道。在參考信號(hào)內(nèi)搜索為進(jìn)一步提高搜索過(guò)程的效率,脈沖的幅度和符號(hào)可以根據(jù)參考信號(hào)b(n)來(lái)確定。在AMR-WB[8]的示例所使用的信號(hào)-選擇(signal-selected)脈沖幅度方法中,設(shè)置 位置η處的脈沖的符號(hào)等于那個(gè)位置處參考信號(hào)的符號(hào)。此外,在非常大的代數(shù)碼本的情 形中,參考信號(hào)b(n)可用來(lái)設(shè)置一些脈沖的位置。將在以后討論信號(hào)-選擇脈沖幅度方法 在本過(guò)程中的應(yīng)用。在當(dāng)前的非限制性、示意性的實(shí)施例中,參考信號(hào)b(n)被定義為后向 濾波目標(biāo)向量d(n)和理想激勵(lì)信號(hào)r(n)的組合。參考信號(hào)可表示為如下
(61)它是歸一化的后向?yàn)V波目標(biāo)向量d(n)和理想激勵(lì)信號(hào)r(n)的加權(quán)和。Ed = dTd 為后向?yàn)V波目標(biāo)向量的能量,Er = rTr為理想激勵(lì)信號(hào)的能量。δ值對(duì)少量脈沖更接近于 1,對(duì)大量的脈沖更接近于0。參考信號(hào)也可表示為如下 其中尺度因子β = δ/(1-δ)。在典型的實(shí)施方案中,對(duì)2個(gè)脈沖(δ =0.8), β = 4,對(duì) 4 個(gè)脈沖(δ = 0. 66), β =2,以及對(duì) 8 個(gè)脈沖(δ = 0. 5),β =1。通過(guò)具有零狀態(tài)的加權(quán)合成濾波器Η(ζ)的逆(inverse)對(duì)目標(biāo)信號(hào)x2(n)進(jìn)行 濾波來(lái)獲得理想激勵(lì)信號(hào)r (η)。這也可以通過(guò)具有零狀態(tài)的濾波器Η(ζ)的逆首先對(duì)目標(biāo) 信號(hào)X1 (η)進(jìn)行濾波給出A(Ii)來(lái)進(jìn)行。然后通過(guò)減去所選擇的自適應(yīng)向量貢獻(xiàn)來(lái)更新信 號(hào) r。(n),即 r(n) = r。(η)-gpv(η),其中,η = 0,· · ·,N-1。信號(hào)Γ(ι(η),或這個(gè)信號(hào)的一部分,可由LP殘差信號(hào)來(lái)近似,以節(jié)省復(fù)雜度。在當(dāng) 前的示例性實(shí)施方案中,通過(guò)由濾波器H(Z)的逆僅在子幀的前半部分中對(duì)目標(biāo)信號(hào)X1(Ii) 進(jìn)行濾波來(lái)計(jì)算信號(hào)4(1!)。LP殘差信號(hào)用在子幀的后半部分。這個(gè)LP殘差信號(hào)使用以 下關(guān)系式來(lái)計(jì)算
^其中\(zhòng)為量化的LP濾波器系數(shù),以及s (η)為輸入語(yǔ)音信號(hào)。如在此之上所提到的,等式(62)中的尺度因子β控制參考信號(hào)b(n)對(duì)后向?yàn)V波 目標(biāo)向量d(n)的依賴性,并通常隨著脈沖數(shù)量的增加的時(shí)候而降低。這個(gè)方法使得要考慮 潛在位置的智能猜想(intelligent guess)。等式(62)所定義的參考信號(hào)b(n)被用來(lái)確 定脈沖位置。使用參考信號(hào)b (η)搜索脈沖的過(guò)程可結(jié)合圖3概括為下列操作。假設(shè)這里不使 用ISSP方法。僅示出與前面章節(jié)中的等式不同的等式1.在操作301中,計(jì)算裝置計(jì)算后向?yàn)V波目標(biāo)向量d(n)、相關(guān)向量α (η)和參考 信號(hào)b(n)。2.在操作302中,計(jì)算裝置使用以下關(guān)系式計(jì)算第一脈沖的位置和符號(hào)m0 = index (max (| b (η) |)) (64)s0 = sgn (b (m0))(65)使用等式(62)計(jì)算參考信號(hào)b(n),其中針對(duì)所有N個(gè)值在整個(gè)子幀上計(jì)算能量Ed和Er ο3.在操作303中,脈沖索引j被設(shè)置成1。4.計(jì)算裝置計(jì)算等式(49)至(52)以確定第一脈沖的固定碼本增益g。(操作 304),并在操作305中更新后向?yàn)V波目標(biāo)向量d(n)和參考信號(hào)b(n)以最終計(jì)算第二脈沖 的位置和符號(hào)(操作306)
(66)Iii1 = index (max (| b ω (η) |)) (67)S1 = sgn (b(1) (Hi1))(68)5.在操作304-306中使用等式(55)-(58),對(duì)j = 2至M-1 (操作307和308)確 定其他脈沖的位置
( 69 )Iiij = index (max (| b(J) (η) |)) (70)Sj = sgn (b(J) (Hij))(71)6.在操作309中,計(jì)算裝置使用等式(10)和(11)分別計(jì)算代數(shù)碼向量ck(η)和
濾波代數(shù)碼向量y3(k)n)。當(dāng)使用ISSP方法時(shí),以上過(guò)程做如下變化。迭代過(guò)程在以上的步驟1之后開(kāi)始。 在第一次迭代中,將脈沖位置Hltl指派給軌道Ttl,脈沖位置Hl1給軌道T1,脈沖位置Hl2給軌道 T2,脈沖位置Hl3給軌道T3,...,脈沖位置HIsh給軌道Tsh,其中假定每個(gè)軌道上一個(gè)脈沖(M = L)。然后該過(guò)程繼續(xù)到步驟6。通過(guò)將各脈沖指派給不同的軌道,然后根據(jù)操作302至 309重復(fù)該過(guò)程。迭代的數(shù)量等于L。最終選擇最大化等式(46)的準(zhǔn)則的脈沖位置和符號(hào)集合 ο艮的值在整個(gè)搜索過(guò)程中是恒定的,因此可以僅在搜索過(guò)程開(kāi)始時(shí)被計(jì)算一次。Ed 的值必須在每次迭代的每個(gè)階段被重新計(jì)算,這是因?yàn)樗鼈兪褂酶碌暮笙驗(yàn)V波目標(biāo)向量 d(1)(i)的值。進(jìn)一步關(guān)于步驟4,可針對(duì)所有N個(gè)值再次計(jì)算能量Ed和艮,但是為了節(jié)省復(fù) 雜性,也可僅針對(duì)相應(yīng)軌道中的值來(lái)計(jì)算它們。僅針對(duì)在對(duì)應(yīng)的軌道中的i,則Ed代表更新 的信號(hào)d(1)(i)的能量,以及類似地,則艮代表信號(hào)r(i)的能量。類似于在步驟5中,能量 Ed和Er再次僅對(duì)應(yīng)于d(1)⑴和r⑴的N/L個(gè)樣本。先前的等式中所使用的尺度因子β的值對(duì)所有的階段是常數(shù)。然而它的值可根 據(jù)搜索的階段變化,使得尺度因子的值是自適應(yīng)的。這個(gè)想法是為后來(lái)的階段增加它的值。 對(duì)更高的階段,這將強(qiáng)調(diào)參考信號(hào)b (η)中更新的后向?yàn)V波目標(biāo)向量d(n)的貢獻(xiàn),在更高 的階段中減少了剩下的待確定的脈沖的數(shù)量。實(shí)際上,在更高的階段,參考信號(hào)b (η)可僅 由更新的后向?yàn)V波目標(biāo)向量d(n)來(lái)近似,而之前章節(jié)中的過(guò)程可用在更高的階段。由等式 (87)和(88)進(jìn)一步描述示例。在圖3中,自適應(yīng)尺度因子由符號(hào)β」,j = 0,...,M-I來(lái) 表不。符號(hào)的預(yù)選擇為進(jìn)一步簡(jiǎn)化搜索,可使用參考文獻(xiàn)[10]中描述的信號(hào)選擇脈沖幅度方法。于是,某個(gè)位置處的脈沖的符號(hào)被設(shè)置成等于在那個(gè)位置處的根據(jù)等式(62)的參考信號(hào) b(n)的符號(hào)。為此,構(gòu)建包含原始參考信號(hào)b (η)的符號(hào)的向量zb (η)。向量zb(n)在碼本 搜索過(guò)程的開(kāi)始處(即在進(jìn)入迭代循環(huán)之前)進(jìn)行計(jì)算。以這種方式,被搜索的脈沖的符 號(hào)被預(yù)先選擇,且等式(64)和(65)變成下列等式m0 = index (max (zb (η) · b (η))) (72)s0 = Zb (πι。)(73)相同的原理用于其他階段,對(duì)j = 1至M-1,使用下列關(guān)系式來(lái)確定脈沖的位置和 符號(hào)Iiij = index (max (zb (η) ‘ b(J) (η))) (74)Sj = zb (πι」)(75)也可關(guān)于使用后向?yàn)V波目標(biāo)向量d(n)的搜索來(lái)使用符號(hào)預(yù)選擇的相同的原理, 其中向量Zb(η)包含原始的后向?yàn)V波目標(biāo)向量d(n)的符號(hào)。軌道順序確定如在以上描述中所指示的,搜索過(guò)程逐個(gè)軌道地順序地搜索脈沖。可按照軌 道編號(hào)順序地來(lái)選取軌道的順序,即,對(duì)20-比特代數(shù)固定碼本,第一次迭代按照順序 T0-T1-T2-T3搜索軌道,第二次迭代按照順序T1-T2-T3-Ttl搜索軌道,等。然而軌道的序列順序 不是最優(yōu)的,另一軌道順序可能是有優(yōu)勢(shì)的。一種可能的解決方案是根據(jù)各個(gè)軌道中參考 信號(hào)b(n)的最大絕對(duì)值對(duì)軌道進(jìn)行排序。做為軌道排序的一個(gè)實(shí)施例,假設(shè)20-比特的代數(shù)固定碼本。進(jìn)一步地,bTOmax被 定義為參考信號(hào)b (η)在軌道Τ。上的最大絕對(duì)值,bT1_為b(n)在軌道T1上的最大絕對(duì)值, bT2max為b (η)在軌道T2上的最大絕對(duì)值,bT3max為b (η)在軌道T3上的最大絕對(duì)值。在進(jìn)入 搜索過(guò)程的迭代循環(huán)之前,各自軌道上b (η)的最大絕對(duì)值被按照降序排列。在以上的示例 中
。則第一次迭代按照順序Ttl-T1-T3-T2搜索軌道,第二次迭 代按順序T1-T3-T2-Ttl,第三次迭代按順序T2-T1-T3-Ttl,以及第四次迭代按順序T3-T1-T2-Tc^以上的軌道順序確定示例幫助發(fā)現(xiàn)脈沖的潛在位置的更準(zhǔn)確的估計(jì)。在ITU-T Recommendation G. 718編解碼器中實(shí)施該軌道順序確定。在這種情形下,使用后向?yàn)V波目 標(biāo)向量d(n)來(lái)進(jìn)行搜索,相同的原理可用來(lái)安排軌道順序。搜索過(guò)程的概括當(dāng)使用利用參考信號(hào)b (η)、自相關(guān)方法、軌道排序和脈沖符號(hào)的預(yù)選擇的搜索時(shí), 快速代數(shù)碼本搜索方法和設(shè)備可參照?qǐng)D4概括如下。這里使用了 ISPP方法。1.在操作401中,計(jì)算裝置計(jì)算后向?yàn)V波目標(biāo)向量d(n)、相關(guān)向量α (η)、參考信 號(hào)b (η)、和符號(hào)向量zb (η)。2.在操作402中,計(jì)算裝置確定軌道的順序。3.在操作403中,迭代索引I被設(shè)置為1。4.在操作404中,在每次迭代中,計(jì)算裝置以不同的軌道開(kāi)始每一次迭代,并根據(jù) 步驟2的軌道確定相對(duì)應(yīng)地給剩余軌道排序,確定向軌道指派脈沖。5.在操作405中,在第一階段,計(jì)算裝置按參考信號(hào)b(i)的最大絕對(duì)值的索引確 定第一脈沖的位置,i對(duì)應(yīng)適當(dāng)?shù)能壍???赏ㄟ^(guò)符號(hào)向量Zb(η)尋找第一脈沖的符號(hào)。對(duì)于 給定軌道中的i
m0 = index [max (zb(i) · b(i))] (76)s0 = zb (πι。)(77)應(yīng)當(dāng)注意到在等式(76)中,使用符號(hào)向量而不是計(jì)算更復(fù)雜的絕對(duì)值來(lái)尋找參 考信號(hào)b(n)中的最大值。6.在操作406中,脈沖索引被設(shè)置成j = 1。7.在操作407中,計(jì)算裝置計(jì)算第一脈沖的固定碼本增益g。。之前發(fā)現(xiàn)的脈沖(脈 沖IV…,HljJ的固定碼本增益通過(guò)以下關(guān)系式給出 其中分子和分母表示如下 和 其中初始化gt1) = 0和gf = 0。8.在操作408中,改變軌道。9.在操作409中,計(jì)算裝置通過(guò)從原始的目標(biāo)信號(hào)x2(n)中減去被發(fā)現(xiàn)的脈沖的 貢獻(xiàn)來(lái)更新目標(biāo)信號(hào)。使用等式(11),這可被記為如下對(duì)于對(duì)應(yīng)適當(dāng)軌道的i 現(xiàn)在在等式(14)中替代來(lái)自等式(81)的χ2ω(υ并使用等式(17),計(jì)算裝置如 下確定后向?yàn)V波目標(biāo)向量d(i)的更新 現(xiàn)在使用以下關(guān)系式來(lái)更新參考信號(hào)b (i)
( 83 )其中等式(83)中的^為自適應(yīng)尺度因子值。10.在操作410中,計(jì)算裝置按以下類似于等式(76)和(77)來(lái)計(jì)算第二脈沖的位 置和符號(hào)Iiij = index [max (zb (i) · b(J) (i))] (84)sj=Zb(mj)(85)11.在操作411中,如果脈沖索引j小、于M-1,則在返回至操作407-410之前索引 j遞增1,以確定下一個(gè)脈沖的位置和符號(hào)。這一直被重復(fù),直到迭代I = 1的所有階段都 已完成,即,直到已經(jīng)發(fā)現(xiàn)所有脈中的位置和符號(hào)。12.在操作411中,如果脈沖索引j等于M_l,則計(jì)算裝置在操作413中使用等式 (10)和(11)分別計(jì)算固定碼向量Ck(η)和濾波固定碼向量y2(k)n)。
13.在操作414中,如果迭代索引I小于迭代數(shù)量L,則索引I在操作415中遞增 1,通過(guò)返回至操作404-413來(lái)進(jìn)行下一次迭代。這一直重復(fù)到所有的迭代都已完成。14.在操作414中,如果迭代索引等于L,則選擇器在操作416中選擇在不同的L 次迭代之一中計(jì)算的、且最大化等式(46)的準(zhǔn)則的脈沖位置和符號(hào)的集合,作為所發(fā)現(xiàn)的 (最好的)固定碼向量ck(η)和濾波固定碼向量y2(k) (η)。G. 718編解碼器中快速碼本搜索的實(shí)施方案利用最近已被標(biāo)準(zhǔn)化的ITU-T Recommendation G. 718 (之前被稱為G. EV-VBR)編 解碼器基線(baseline),來(lái)實(shí)施并測(cè)試以上所描述的快速代數(shù)固定碼本搜索方法和設(shè)備。 G. 718編解碼器中的快速代數(shù)固定碼本搜索的實(shí)施方案對(duì)應(yīng)于以上參照?qǐng)D4所描述的實(shí)施 方案。G. 718編解碼器是包含5層的嵌入式編解碼器,其中較高層比特流可被丟棄而不影響 較低層的解碼。第一層(Li)使用基于分類的ACELP技術(shù),第二層(L2)使用代數(shù)碼本技術(shù) 對(duì)來(lái)自第一層的誤差信號(hào)進(jìn)行編碼,以及較高層使用MDCT技術(shù)來(lái)進(jìn)一步對(duì)來(lái)自較低層的 誤差信號(hào)進(jìn)行編碼。該編解碼器還配備了選項(xiàng),從而允許與以12. 65千比特/秒的ITU-T Recommendation G. 722. 2編解碼器的互操作性。當(dāng)在編碼器上被調(diào)用時(shí),這個(gè)選項(xiàng)使得可 使用G. 722. 2模式2(12. 65千比特/秒)來(lái)替換第一和第二層Ll和L2。由此在最初的兩 層中采用代數(shù)FCB搜索,或在G. 722. 2選項(xiàng)的情形中,在G. 722. 2核心層中采用代數(shù)FCB搜 索。它們中的所有對(duì)窄帶和寬帶輸入信號(hào)都使用12. SkHz的內(nèi)部采樣頻率和20ms的幀長(zhǎng) 度。每個(gè)幀被劃分為4個(gè)N = 64樣本的子幀。第一層Ll的編碼利用基于信號(hào)分類的編碼的優(yōu)勢(shì)。在ITU-TRecommendation G. 718編解碼器中,針對(duì)每一幀的不同編碼考慮4種不同的信號(hào)類別清音編碼(unvoiced coding)、池音編碼(voiced coding)、過(guò)渡編碼(transition coding)禾口通用編碼(generic coding)。Ll中的代數(shù)FCB搜索采用20-比特和12-比特碼本。它們?cè)诓煌訋械氖褂?依賴于編碼模式。L2層中的FCB搜索在通用和濁音編碼幀中的兩個(gè)子幀中采用20-比特碼 本,在其他兩個(gè)子幀中采用12-比特碼本,在過(guò)渡和清音編碼幀中的三個(gè)子幀中采用20-比 特碼本,在一個(gè)子幀中采用12-比特碼本。G. 722. 2選項(xiàng)中的FCB搜索在所有的4個(gè)子幀中 采用36-比特碼本。這些碼本的配置在表IV中進(jìn)行概括。表IV-G. 718編解碼器中使用的代數(shù)固定碼本配置的概括 尺度因子β的值可以被如下設(shè)置為常量(對(duì)所有的階段相同)
(86)然而,如以上所提到的,尺度因子β的值對(duì)每個(gè)階段可以不同。在一個(gè)實(shí)施方案 的示例中發(fā)現(xiàn),尺度因子β對(duì)20-比特代數(shù)固定碼本的最優(yōu)值如下 以及對(duì)12-比特碼本
第二階段(88)值β =⑴意味著在這個(gè)階段,更新的參考信號(hào)b (η)等于更新的后向?yàn)V波目標(biāo)向 量 d(n)。如以上所描述的,可以在編解碼器中使用等式(12)的準(zhǔn)則。然而為了避免在對(duì)兩 個(gè)候選值進(jìn)行比較時(shí)的除法,僅使用乘法運(yùn)算來(lái)實(shí)施該準(zhǔn)則,細(xì)節(jié)見(jiàn)例如參考文獻(xiàn)[8]??焖俅a本搜索性能在G. 718編解碼器中測(cè)試以上所描述的快速代數(shù)固定碼本搜索方法和設(shè)備的性 能,其中原始的FCB搜索[8]被以上所描述的方法所代替。目的是在降低復(fù)雜度的情況下 實(shí)現(xiàn)類似的合成語(yǔ)音質(zhì)量。表V至X概括了使用分段信噪比(分段SNR)測(cè)量的新的快速FCB搜索性能。在 表中,“FCB1”代表參考文獻(xiàn)[8]中提出的技術(shù),“FCB2”代表參考文獻(xiàn)[6]中提出的技術(shù), 本報(bào)告中提出的技術(shù)被稱為“新的FCB”。使用既包含男性又包含女性英語(yǔ)說(shuō)話者的額定等 級(jí)的清楚的語(yǔ)音句子數(shù)據(jù)庫(kù)作為語(yǔ)音材料。數(shù)據(jù)庫(kù)的長(zhǎng)度為大約456秒。在使用代數(shù)固定 碼本搜索的層(即,針對(duì)層L1、L2和G.722.2-選項(xiàng)核心層)中估計(jì)G. 718編解碼器中該 方法的性能。這導(dǎo)致3組測(cè)試:8kbps測(cè)試(僅層Li)、12kbps測(cè)試(使用層Ll和L2)、以 及12. 65kbps的G. 722. 2-選項(xiàng)測(cè)試。在使用以上所描述的算法的12-比特FCB和20-比 特FCB 二者中來(lái)實(shí)施以上所描述的技術(shù)。對(duì)G. 722. 2選項(xiàng),在36-比特FCB中實(shí)施以上所 描述的技術(shù)。表VII和表IX中概括了 FCB搜索的復(fù)雜度和整個(gè)的G. 718編碼器復(fù)雜度。對(duì)最 差的情形,復(fù)雜度由wMP0S(加權(quán)的每秒百萬(wàn)操作)給出。表V-G. 718編解碼器中對(duì)12kpbs的性能(Li,L2) 表VI-G. 718編解碼器中對(duì)8kpbs的性能(Li)新的FCB僅用在20-比特碼本中。 表VII-G. 718編解碼器中對(duì)12kbps在最差的情形下的復(fù)雜度(Li,L2) 表VIII-G. 718編解碼器中對(duì)G. 22. 2選項(xiàng)的性能 表IX-G. 718編解碼器中對(duì)G. 722. 2選項(xiàng)在最差的情形下的復(fù)雜度 如從表V-VII可以看出,所提出的算法大大降低了計(jì)算要求,但是代價(jià)是與參考 文獻(xiàn)[8]中提出的技術(shù)相比,分段SNR略微降低。因此決定僅在SNR下降不明顯的G. 718 的第二層(L2)使用所提出的算法。由此RecommendationG. 718在層2中采用快速代數(shù)固 定碼本搜索。該實(shí)施方案對(duì)應(yīng)于以上參照?qǐng)D4所描述的實(shí)施方案。
也在ITU-T Recommendation G. 729. 1編解碼器中[6]以8kbps測(cè)試該性能,其中 原始的FCB搜索[6]被以上所描述的快速代數(shù)固定碼本搜索方法和設(shè)備所代替。G.729. 1 編解碼器使用4個(gè)40個(gè)樣本的子幀。脈沖mo、Hi1和m2中的每一個(gè)的位置使用3個(gè)比特來(lái) 編碼,同時(shí)脈沖m3的位置使用4個(gè)比特來(lái)編碼。每個(gè)脈沖符號(hào)的符號(hào)使用1個(gè)比特來(lái)編碼。 對(duì)4個(gè)脈沖,這總共給出17個(gè)比特。表X-G. 729. 1編解碼器中的性能 盡管已經(jīng)在上述說(shuō)明書(shū)中描述了關(guān)于其非限制示意性實(shí)施例的本發(fā)明,但這些實(shí) 施例可在不背離本發(fā)明的精神和實(shí)質(zhì)的前提下,在所附權(quán)利要求的范圍內(nèi)隨意修改。參考文獻(xiàn)[1]R. Salami,C. Laflamme,J-P. Adou1,and D. Massaloux,"A toll quality 8kb/s speech codec for the personal communications system (PCS)(用于個(gè)人通信系統(tǒng)(PCS) 的高質(zhì)量 8kb/s i吾音編解碼器),,,IEEE Trans, on VehicularTechnology, Vol. 43, No. 3, pp.808-816,1994 年 8 月[2]B. Bessette, R. Salami, R. Lefebvre,M. Jelinek, J. Rotola-Pukkila, J. Vainio H. Mikkola,and K. Jarvinen,"The Adaptive Multi-Rate Wideband SpeechCodec(AMR-WB) (自適應(yīng)多速率寬帶語(yǔ)音編解碼器(AMR-WB)),,,SpecialIssue of IEEE Transactions on Speech and Audio Processing, Vol. 10,No. 8,pp.620—636,2002 年 11 月[3] S. Singhal and B. S. Atal, "Amplitude optimization and pitch predictionin multipulse coders (多脈沖編碼器中的幅度最優(yōu)化和音高預(yù)測(cè))”, IEEETrans. ASSP, vol. 37,no. 3,pp.317-327,1989 年 3 月[4]ITU-T Recommendation G. 729(1/2007), "Coding of Speech at 8kbit/ susing Conjugate-Structure Algebraic-Code-Excited Linear Prediction (CS-ACELP) (使用共軛結(jié)構(gòu)代數(shù)碼激勵(lì)線性預(yù)測(cè)(CS-ACELP)的8千比特/秒的語(yǔ)音編碼)”,2007年1[5]ITU-T Recommendation G. 729Annex A(11/96),"Reduced complexity 8kbit/ s CS-ACELP speech codec (復(fù)雜度降低的8千比特/秒CS-ACELP語(yǔ)音編解碼器)”,1996 年11月[6]ITU-T Recommendation G.29. 1(05/2006), "G. 729based EmbeddedVariable bit-rate coder:An 8_32kbit/s scalable wideband coderbitstreaminteroperable with G. 729 (基于G. 729的嵌入式比特率可變的編碼器可與G. 729互操作的8_32千比特 /秒可伸縮寬帶編碼器比特流)”,2006年5月[7] ITU-T Recommendation G. 723. 1 (05/2006) , "Dual rate speech coder formultimedia communications transmitting, at 5. 3and 6. 3kbit/s (針對(duì)以 5. 3 禾口 6. 3千比特/秒傳輸?shù)亩嗝襟w通信的雙速率語(yǔ)音編碼器)”,2006年5月[8] 3GPP Technical Specification 26. 190, "Adaptive Multi-Rate-Wideband(AMR-ffB) speech codec ;Transcoding functions ( 自適應(yīng)多速率寬帶(AMR-WB)語(yǔ)音編解碼器;轉(zhuǎn)碼功能)”,2005年7月;http://Ww. 3gpp.org[9] I. Μ. Trancoso and B. S. Atal, "Efficient procedures for finding theoptimum innovation in stochastic coders (隨機(jī)編碼器中發(fā)現(xiàn)最優(yōu)創(chuàng)新的高效過(guò) 程)”,Proc. ICASSP' 86,pp.2375-2378,1986 年[10] _ Bl 禾0 5754976 :Algebraic codebook with signal-selected pulseamplitude/position combinations for fast coding of speech (具有/[言號(hào)選擇脈 沖幅度/位置組合的用于快速語(yǔ)音編碼的代數(shù)碼本)[11]ITU-T Recommendation G.718 “Frame error robust narrowband andwideband embedded variable bit-rate coding of speech and audio from 8-32kbit/s (8-32千比特/秒的語(yǔ)音和音頻的幀誤差魯棒的窄帶和寬帶嵌入式比特率可變 的編碼)”,2008年9月核準(zhǔn)。
權(quán)利要求
一種用于在對(duì)聲音信號(hào)進(jìn)行編碼期間搜索代數(shù)碼本的方法,其中所述代數(shù)碼本包括由多個(gè)脈沖位置和多個(gè)脈沖形成的一組碼向量,所述多個(gè)脈沖中的每一個(gè)具有符號(hào)并分布在所述脈沖位置上,以及其中所述代數(shù)碼本搜索方法包括計(jì)算用來(lái)搜索所述代數(shù)碼本的參考信號(hào);在第一階段,(a)關(guān)于所述參考信號(hào)并在所述多個(gè)脈沖位置中確定第一脈沖的位置;在所述第一階段之后的多個(gè)階段的每一個(gè)階段中,(a)重新計(jì)算代數(shù)碼本增益,(b)使用所重新計(jì)算的代數(shù)碼本增益來(lái)更新所述參考信號(hào),以及(c)關(guān)于所更新的參考信號(hào)并在所述多個(gè)脈沖位置中確定另一脈沖的位置;使用在所述第一階段和之后的階段中所確定的脈沖的所述符號(hào)和位置計(jì)算所述代數(shù)碼本的碼向量,其中所述第一階段和之后的階段的數(shù)量對(duì)應(yīng)于所述代數(shù)碼本的所述碼向量中的脈沖的數(shù)量。
2.如權(quán)利要求1中所述的代數(shù)碼本搜索方法,其中所述多個(gè)脈沖位置被劃分為脈沖位 置的一組軌道。
3.如權(quán)利要求2中所述的代數(shù)碼本搜索方法,包括在第一次迭代中,(a)為所述第一階段和之后的階段確定所述第一脈沖和其他脈沖的 位置向脈沖位置的軌道的第一指派,以及(b)進(jìn)行所述第一階段和多個(gè)之后的階段和使用 該第一指派計(jì)算所述代數(shù)碼本的碼向量;以及在所述第一次迭代之后的多次迭代的每一次迭代中,(a)為所述第一階段和之后的階 段確定所述第一脈沖和其他脈沖的位置向脈沖位置的軌道的另一指派,以及(b)進(jìn)行所述 第一階段和所述多個(gè)之后的階段和使用所述另一指派計(jì)算代數(shù)碼本的碼向量。
4.如權(quán)利要求2中所述的代數(shù)碼本搜索方法,其中在所述脈沖位置的軌道中交織所述 脈沖位置。
5.如權(quán)利要求3中所述的代數(shù)碼本搜索方法,包括使用給定的選擇準(zhǔn)則來(lái)選擇在所述 第一次迭代和之后的迭代中所計(jì)算的碼向量之一。
6.如權(quán)利要求1中所述的代數(shù)碼本搜索方法,包括在第一階段,關(guān)于所述參考信號(hào)確定所述第一脈沖的符號(hào);以及在所述第一階段之后的所述多個(gè)階段的每一個(gè)階段中,關(guān)于所更新的參考信號(hào)確定所 述其他脈沖的符號(hào)。
7.如權(quán)利要求1中所述的代數(shù)碼本搜索方法,其中計(jì)算所述參考信號(hào)包括計(jì)算后向?yàn)V 波目標(biāo)向量。
8.如權(quán)利要求1中所述的代數(shù)碼本搜索方法,其中計(jì)算所述參考信號(hào)包括按后向?yàn)V波 目標(biāo)向量和理想激勵(lì)信號(hào)的組合來(lái)計(jì)算參考信號(hào)。
9.如權(quán)利要求1中所述的代數(shù)碼本搜索方法,包括通過(guò)尺度因子來(lái)控制所述參考信號(hào) 對(duì)所述后向?yàn)V波目標(biāo)向量的依賴關(guān)系。
10.如權(quán)利要求9中所述的代數(shù)碼本搜索方法,包括在所述之后的階段的每一個(gè)階段 中改變所述尺度因子。
11.如權(quán)利要求1中所述的代數(shù)碼本搜索方法,其中-在所述第一階段,確定所述第一脈沖的所述位置包括將所述第一脈沖的位置設(shè)置在 所述參考信號(hào)的最大值處;以及-在所述多個(gè)之后的階段的每一個(gè)階段中,確定所述其他脈沖的位置包括將所述其他 脈沖的位置設(shè)置在所更新的參考信號(hào)的最大值處。
12.如權(quán)利要求3中所述的代數(shù)碼本搜索方法,包括在不同的軌道處開(kāi)始每一次迭代。
13.如權(quán)利要求1中所述的代數(shù)碼本搜索方法,包括預(yù)先選擇所述第一脈沖和其他脈 沖的符號(hào)。
14.如權(quán)利要求3中所述的代數(shù)碼本搜索方法,包括為每一次迭代確定脈沖位置的軌 道的順序。
15.如權(quán)利要求13中所述的代數(shù)碼本搜索方法,其中預(yù)先選擇所述第一脈沖和其他脈 沖的符號(hào)包括構(gòu)建包含最先計(jì)算的、未更新的參考信號(hào)的符號(hào)的向量。
16.如權(quán)利要求15中所述的代數(shù)碼本搜索方法,其中確定所述其他脈沖的位置包括 將所述其他脈沖的位置設(shè)置在所更新的參考信號(hào)和包含所述符號(hào)的所述向量的乘積的最 大值處。
17.一種用于在對(duì)聲音信號(hào)進(jìn)行編碼期間搜索代數(shù)碼本的設(shè)備,其中所述代數(shù)碼本包 括由多個(gè)脈沖位置和多個(gè)脈沖形成的一組碼向量,所述多個(gè)脈沖中的每一個(gè)具有符號(hào)并分 布在所述脈沖位置上,以及其中代數(shù)碼本搜索設(shè)備包括用于計(jì)算用以搜索所述代數(shù)碼本的參考信號(hào)的部件;用于在第一階段關(guān)于所述參考信號(hào)并在所述多個(gè)脈沖位置中確定第一脈沖的位置的 部件;用于在所述第一階段之后的多個(gè)階段的每一個(gè)階段中重新計(jì)算代數(shù)碼本增益的部件; 用于在之后的階段的每一個(gè)階段中使用所重新計(jì)算的代數(shù)碼本增益來(lái)更新所述參考信號(hào) 的部件;以及用于在所述之后的階段的每一個(gè)階段中關(guān)于所更新的參考信號(hào)并在所述多個(gè) 脈沖位置中確定另一脈沖的位置的部件;用于使用在所述第一階段和之后的階段中所確定的脈沖的符號(hào)和位置來(lái)計(jì)算所述代 數(shù)碼本的碼向量的部件,其中所述第一階段和之后的階段的數(shù)量對(duì)應(yīng)于所述代數(shù)碼本的碼 向量中的脈沖的數(shù)量。
18.一種用于在對(duì)聲音信號(hào)進(jìn)行編碼期間搜索代數(shù)碼本的設(shè)備,其中所述代數(shù)碼本包 括由多個(gè)脈沖位置和多個(gè)脈沖形成的一組碼向量,所述多個(gè)脈沖中的每一個(gè)具有符號(hào)并分 布在所述脈沖位置上,以及其中代數(shù)碼本搜索設(shè)備包括第一計(jì)算裝置,用于計(jì)算用以搜索所述代數(shù)碼本的參考信號(hào);第二計(jì)算裝置,用于在第一階段關(guān)于所述參考信號(hào)并在所述多個(gè)脈沖位置中確定第一 脈沖的位置;第三計(jì)算裝置,用于在所述第一階段之后的多個(gè)階段的每一個(gè)階段中重新計(jì)算代數(shù)碼 本增益;第四計(jì)算裝置,用于在之后的階段的每一個(gè)階段中使用所重新計(jì)算的代數(shù)碼本增 益來(lái)更新所述參考信號(hào);以及第五計(jì)算裝置,用于在所述之后的階段的每一個(gè)階段中關(guān)于 所更新的參考信號(hào)并在所述多個(gè)脈沖位置中確定另一脈沖的位置;第六計(jì)算裝置,用于使用在所述第一階段和之后的階段中所確定的脈沖的符號(hào)和位置 來(lái)計(jì)算所述代數(shù)碼本的碼向量,其中所述第一階段和之后的階段的數(shù)量對(duì)應(yīng)于所述代數(shù)碼 本的所述碼向量中的脈沖的數(shù)量。
19.如權(quán)利要求18中所述的代數(shù)碼本搜索設(shè)備,其中所述多個(gè)脈沖位置被劃分為脈沖位置的一組軌道。
20.如權(quán)利要求18中所述的代數(shù)碼本搜索設(shè)備,其中在第一次迭代中,(a)第七計(jì)算裝置為所述第一階段和之后的階段確定所述第一脈沖和其他脈沖的位置向脈沖位置的軌道的第一指派,以及(b)所述第二、第三、第四和第五計(jì) 算裝置進(jìn)行所述第一階段和多個(gè)之后的階段,以及所述第六計(jì)算裝置使用該第一指派來(lái)計(jì) 算所述代數(shù)碼本的碼向量;以及在所述第一次迭代之后的多次迭代的每一次迭代中,(a)第八計(jì)算裝置為所述第一階 段和之后的階段確定所述第一脈沖和其他脈沖的位置向脈沖位置的軌道的另一指派,以及 (b)所述第二、第三、第四和第五計(jì)算裝置進(jìn)行所述第一階段和所述多個(gè)之后的階段,以及 所述第五計(jì)算裝置使用所述另一指派計(jì)算所述代數(shù)碼本的碼向量。
21.如權(quán)利要求19中所述的代數(shù)碼本搜索設(shè)備,其中在所述脈沖位置的軌道中交織所 述脈沖位置。
22.如權(quán)利要求20中所述的代數(shù)碼本搜索設(shè)備,包括選擇器,所述選擇器使用給定的 選擇準(zhǔn)則來(lái)選擇在所述第一迭代和之后的迭代中所計(jì)算的碼向量之一。
23.如權(quán)利要求18中所述的代數(shù)碼本搜索設(shè)備,其中在第一階段,所述第二計(jì)算裝置關(guān)于所述參考信號(hào)確定所述第一脈沖的符號(hào);以及在所述第一階段之后的所述多個(gè)階段的每一個(gè)階段中,所述第五計(jì)算裝置關(guān)于所更新 的參考信號(hào)確定所述其他脈沖的符號(hào)。
24.如權(quán)利要求18中所述的代數(shù)碼本搜索設(shè)備,其中所述第一計(jì)算裝置計(jì)算后向?yàn)V波 目標(biāo)向量作為所述參考信號(hào)。
25.如權(quán)利要求18中所述的代數(shù)碼本搜索設(shè)備,其中所述第一計(jì)算裝置按后向?yàn)V波目 標(biāo)向量和理想激勵(lì)信號(hào)的組合來(lái)計(jì)算參考信號(hào)。
26.如權(quán)利要求18中所述的代數(shù)碼本搜索設(shè)備,其中所述第一計(jì)算裝置通過(guò)尺度因子 來(lái)控制所述參考信號(hào)對(duì)所述后向?yàn)V波目標(biāo)向量的依賴關(guān)系。
27.如權(quán)利要求26中所述的代數(shù)碼本搜索設(shè)備,其中所述第一計(jì)算裝置在所述之后的 階段的每一個(gè)階段中改變所述尺度因子。
28.如權(quán)利要求18中所述的代數(shù)碼本搜索設(shè)備,其中-在所述第一階段,所述第二計(jì)算裝置通過(guò)將所述第一脈沖的位置設(shè)置在所述參考信 號(hào)的最大值處來(lái)確定所述第一脈沖的所述位置;以及-在所述多個(gè)之后的階段的每一個(gè)階段中,所述第五計(jì)算裝置通過(guò)將所述其他脈沖的 位置設(shè)置在所更新的參考信號(hào)的最大值處來(lái)確定所述其他脈沖的位置。
29.如權(quán)利要求18中所述的代數(shù)碼本搜索設(shè)備,包括用于在不同的軌道處開(kāi)始每一次 迭代的部件。
30.如權(quán)利要求18中所述的代數(shù)碼本搜索設(shè)備,包括第九計(jì)算裝置,所述第九計(jì)算裝 置用來(lái)預(yù)先選擇所述第一脈沖和其他脈沖的符號(hào)。
31.如權(quán)利要求20中所述的代數(shù)碼本搜索設(shè)備,包括第九計(jì)算裝置,所述第九計(jì)算裝 置用來(lái)為每一次迭代確定脈沖位置的軌道的順序。
32.如權(quán)利要求30中所述的代數(shù)碼本搜索設(shè)備,其中所述第九計(jì)算裝置通過(guò)構(gòu)建包含 最先計(jì)算的、未更新的參考信號(hào)的所述符號(hào)的向量來(lái)預(yù)先選擇所述第一脈沖和其他脈沖的符號(hào)。
33.如權(quán)利要求32中所述的代數(shù)碼本搜索方法,其中所述第五計(jì)算裝置將所述其他脈 沖的位置設(shè)置在所更新的參考信號(hào)和包含所述符號(hào)的所述向量的乘積的最大值處。
全文摘要
一種在對(duì)聲音信號(hào)進(jìn)行編碼期間搜索代數(shù)碼本的方法和設(shè)備,其中所述代數(shù)碼本包括由多個(gè)脈沖位置和分布在所述脈沖位置上的多個(gè)脈沖形成的一組碼向量。在該代數(shù)碼本搜索方法和設(shè)備中,計(jì)算用來(lái)搜索代數(shù)碼本的參考信號(hào)。在第一階段,關(guān)于所述參考信號(hào)并在所述多個(gè)脈沖位置中確定第一脈沖的位置。在第一階段之后的多個(gè)階段中的每一個(gè)階段中,(a)重新計(jì)算代數(shù)碼本增益,(b)使用重新計(jì)算的代數(shù)碼本增益更新參考信號(hào),以及(c)關(guān)于所更新的參考信號(hào)并在所述多個(gè)脈沖位置中確定另一脈沖的位置。使用在第一階段和之后的階段中確定的脈沖位置計(jì)算代數(shù)碼本的碼向量,其中所述第一階段和之后的階段的數(shù)量對(duì)應(yīng)于代數(shù)碼本的碼向量中的脈沖的數(shù)量。
文檔編號(hào)G10L19/00GK101842833SQ200880113783
公開(kāi)日2010年9月22日 申請(qǐng)日期2008年9月11日 優(yōu)先權(quán)日2007年9月11日
發(fā)明者瓦克拉夫·??怂估? 米蘭·杰利尼克, 雷德萬(wàn)·薩拉米 申請(qǐng)人:沃伊斯亞吉公司