專利名稱:用來(lái)對(duì)相位譜信息進(jìn)行子抽樣的方法和設(shè)備的制作方法
背景技術(shù):
I.發(fā)明領(lǐng)域本發(fā)明總體上涉及語(yǔ)音處理領(lǐng)域,尤其涉及用來(lái)對(duì)將由語(yǔ)音編碼器發(fā)送的相位譜信息進(jìn)行子抽樣的方法和設(shè)備。
II.背景技術(shù)通過(guò)數(shù)字技術(shù)發(fā)送語(yǔ)音已變得普遍,特別是在長(zhǎng)途和數(shù)字無(wú)線電話應(yīng)用中更是如此。這接著增加了人們對(duì)確定在維持重建語(yǔ)音的可感質(zhì)量的同時(shí)能在信道上發(fā)送最小信息量的興趣。如果語(yǔ)音只是簡(jiǎn)單地通過(guò)抽樣和數(shù)字化來(lái)發(fā)送,需要在每秒64千比特(kbps)的數(shù)量級(jí)上的數(shù)據(jù)速率以取得傳統(tǒng)模擬電話的語(yǔ)音質(zhì)量。然而,通過(guò)使用語(yǔ)音分析,加上合適的編碼、發(fā)送及接收機(jī)端的合成,可實(shí)現(xiàn)數(shù)據(jù)速率的顯著減少。
壓縮語(yǔ)音的設(shè)備用于許多電信領(lǐng)域。典型的領(lǐng)域是無(wú)線通信。無(wú)線通信領(lǐng)域有許多應(yīng)用,包括,例如,無(wú)繩電話、尋呼、無(wú)線本地環(huán)路,諸如蜂窩和PCS電話系統(tǒng)、移動(dòng)因特網(wǎng)協(xié)議(IP)電話和衛(wèi)星通信系統(tǒng)之類的無(wú)線電話。一種特別重要的應(yīng)用是移動(dòng)用戶的無(wú)線電話。
至今,已經(jīng)為包括如頻分多址(FDMA),時(shí)分多址(TDMA)和碼分多址(CDMA)的無(wú)線通信系統(tǒng)開發(fā)了多種空中接口。與之相關(guān),已建立多種國(guó)內(nèi)和國(guó)際標(biāo)準(zhǔn),包括,例如,高級(jí)移動(dòng)電話業(yè)務(wù)(AMPS)、全球移動(dòng)通信系統(tǒng)(GSM)和過(guò)渡標(biāo)準(zhǔn)95(IS-95)。一典型的無(wú)線電話通信系統(tǒng)是碼分多址(CDMA)系統(tǒng)。IS-95標(biāo)準(zhǔn)及其變體IS-95A、ANSIJ-STD-08、IS-95B、建議第三代標(biāo)準(zhǔn)IS-95C和IS-2000等(此處統(tǒng)稱IS-95)由電信工業(yè)協(xié)會(huì)(TIA)及其他廣為人知的標(biāo)準(zhǔn)組織分布以說(shuō)明蜂窩或PCS電話通信系統(tǒng)的CDMA空中接口的使用。基本上按照IS-95標(biāo)準(zhǔn)的使用配置的典型無(wú)線通信系統(tǒng)在專利號(hào)為5,103,459和4,901,307的美國(guó)專利中有描述,這兩個(gè)專利已轉(zhuǎn)讓給本發(fā)明的受讓人,在此完全引述供參考。
利用通過(guò)析取涉及人類語(yǔ)音生成模型的參數(shù)來(lái)壓縮語(yǔ)音的技術(shù)的設(shè)備稱為語(yǔ)音編碼器。語(yǔ)音編碼器把輸入語(yǔ)音信號(hào)分成時(shí)間塊或分析幀。語(yǔ)音編碼器通常包括編碼器和解碼器。編碼器分析輸入語(yǔ)音幀以析取一些相關(guān)參數(shù),然后把這些參數(shù)量化成二進(jìn)制表示,即,一組數(shù)據(jù)位或二進(jìn)制數(shù)據(jù)分組。數(shù)據(jù)分組通過(guò)通信信道發(fā)送給接收機(jī)和解碼器。解碼器處理這些數(shù)據(jù)分組,對(duì)它們進(jìn)行去量化以生成參數(shù),并用去量化參數(shù)重新合成語(yǔ)音幀。
語(yǔ)音編碼器的功能是通過(guò)去掉語(yǔ)音中固有的全部自然冗余而把數(shù)字化語(yǔ)音信號(hào)壓縮成低比特率信號(hào)。數(shù)字壓縮是通過(guò)用一組參數(shù)來(lái)代表輸入語(yǔ)音幀并采用量化而用一組數(shù)據(jù)位來(lái)代表這些參數(shù)而實(shí)現(xiàn)的。如果輸入語(yǔ)音幀有幾個(gè)比特Ni且由語(yǔ)音編碼器生成的數(shù)據(jù)分組有幾個(gè)比特No,則由語(yǔ)音編碼器取得的壓縮系數(shù)是Cr=Ni/No。我們所面臨的挑戰(zhàn)是,在取得目標(biāo)壓縮系數(shù)的同時(shí),保持解碼語(yǔ)音的高語(yǔ)音質(zhì)量。語(yǔ)音編碼器的性能取決于(1)語(yǔ)音模型或上述分析與合成過(guò)程的組合的工作情況是否良好;以及(2)參數(shù)量化過(guò)程以每秒No比特的目標(biāo)比特率執(zhí)行的情況。語(yǔ)音模型的目標(biāo)因而是用每個(gè)幀的一小組參數(shù)來(lái)捕獲語(yǔ)音信號(hào)的要素或目標(biāo)語(yǔ)音質(zhì)量。
或許語(yǔ)音編碼器的設(shè)計(jì)中最重要的是對(duì)描述語(yǔ)音信號(hào)的好參數(shù)(包括失量)組的搜索。一組好參數(shù)要求在重建感知上精確的語(yǔ)音信號(hào)時(shí)采用低系統(tǒng)帶寬。音調(diào)、信號(hào)功率、頻譜包絡(luò)(或其共振峰)、振幅譜和相位譜是語(yǔ)音編碼參數(shù)的例子。
語(yǔ)音編碼器可實(shí)施為時(shí)域編碼器,它試圖通過(guò)利用高時(shí)間分辨率來(lái)處理以一次對(duì)小語(yǔ)音段(通常為5毫秒(ms)子幀)編碼而捕獲時(shí)域語(yǔ)音波形。對(duì)每個(gè)子幀,來(lái)自電碼本空間的高準(zhǔn)確度表示是通過(guò)業(yè)界已知的多種搜索算法發(fā)現(xiàn)的?;蛘?,語(yǔ)音編碼器可實(shí)施為頻域編碼器,它試圖用參數(shù)(分析)組捕獲輸入語(yǔ)音幀的短期語(yǔ)音頻譜并利用相應(yīng)的合成過(guò)程以從頻譜參數(shù)重新生成語(yǔ)音波形。參數(shù)量化器通過(guò)用存儲(chǔ)碼矢量來(lái)表示它們而按照A.Gersho和R.M.Gray所著的“Vector Quantization and Signal Compression”(1992年版)中描述的已知的量化技術(shù)保存這些參數(shù)。
廣為人知的時(shí)域語(yǔ)音編碼器是L.B Rabiner和R.W.Schafer所著的“DigitalProcessing ofSpeech Signals”(396-453,1978年)中描述的碼激勵(lì)線性預(yù)測(cè)(CELP)編碼器,在此完全引述供參考。在CELP編碼器中,語(yǔ)音信號(hào)中的短期相關(guān)或冗余通過(guò)線性預(yù)測(cè)(LP)分析而去除,線性預(yù)測(cè)分析找到短期共振峰濾波器的系數(shù)。把短期預(yù)測(cè)濾波器用于輸入語(yǔ)音幀生成LP剩余信號(hào),用長(zhǎng)期預(yù)測(cè)濾波器參數(shù)和后續(xù)隨機(jī)電碼本對(duì)LP剩余信號(hào)進(jìn)一步建模和量化。這樣,CELP編碼把對(duì)時(shí)域語(yǔ)音波形編碼的任務(wù)分成對(duì)LP短期濾波器系數(shù)編碼與對(duì)LP剩余編碼這兩個(gè)獨(dú)立的任務(wù)。時(shí)域編碼可以固定速率(即,用每個(gè)幀的相同數(shù)目的比特No)或以可變速率(不同的比特率用于不同類型的幀內(nèi)容)來(lái)執(zhí)行??勺兯俾示幋a器試圖只使用把編譯碼器參數(shù)編碼成足夠獲得目標(biāo)質(zhì)量的水平所需的比特?cái)?shù)量。典型的可變速率CELP編碼器在專利號(hào)為5,414,796的美國(guó)專利中有描述,該專利已轉(zhuǎn)讓給本發(fā)明的受讓人,在此完全引述從參考。
諸如CELP編碼器之類的時(shí)域編碼器通常依賴于高數(shù)目的每幀比特?cái)?shù)No,以保持時(shí)域語(yǔ)音波形的精準(zhǔn)性。只要每幀的比特?cái)?shù)No的數(shù)目相當(dāng)大(例如,8kbps或以上),這樣的編碼器通常給出非常好的語(yǔ)音質(zhì)量。然而,在低比特率(4kbps或以下)時(shí),時(shí)域編碼器因可供比特?cái)?shù)目有限而不能保持高質(zhì)量和強(qiáng)有力的性能。在低比特率時(shí),有限的電碼本空間切斷普通時(shí)域編碼器的波形匹配能力,普通時(shí)域編碼器布署于較高速率商業(yè)應(yīng)用中是很成功的。因此,盡管隨時(shí)間的不斷改進(jìn),許多運(yùn)行在低比特率的CELP編碼系統(tǒng)遭遇通常以噪聲為特征的感知上重大的失真。
目前對(duì)開發(fā)運(yùn)行在中間至低的比特率(即,在2.4至4kbps的范圍)的高質(zhì)量語(yǔ)音編碼器有劇升的研究興趣和強(qiáng)烈的商業(yè)需求。應(yīng)用領(lǐng)域包括無(wú)線電話、衛(wèi)星通信、因特網(wǎng)電話、各種多媒體和語(yǔ)音流應(yīng)用、語(yǔ)音郵件及其他語(yǔ)音存儲(chǔ)系統(tǒng)。驅(qū)動(dòng)力是分組數(shù)據(jù)丟夫情況下對(duì)高容量的需要和對(duì)健康性能的要求。各種近來(lái)的語(yǔ)音編碼標(biāo)準(zhǔn)化努力是推動(dòng)研究和開發(fā)低速率語(yǔ)音編碼算法的另一直接驅(qū)動(dòng)力。低速率語(yǔ)音編碼器按容許應(yīng)用帶寬生成更多信道或用戶,且與合適信道編碼的添加層耦合的低速率語(yǔ)音編碼器能適合于編碼器規(guī)格總比特預(yù)算,而在信道差錯(cuò)條件下提供健全的性能。
以低比特率對(duì)語(yǔ)音有效率地編碼的一有效技術(shù)是多模編碼。典型的多模編碼技術(shù)在1998年12月21日申請(qǐng)的、序列號(hào)為09/217,341,標(biāo)題為“VARIABLERATE SPEECH CODING”的美國(guó)申請(qǐng)中有描述,該申請(qǐng)書已轉(zhuǎn)讓給本發(fā)明的受讓人,在此完全引述供參考。普通多模編碼器把不同模式或編碼一解碼算法運(yùn)用于不同類型的輸入語(yǔ)音幀。每個(gè)模式或編碼一解碼過(guò)程定制成以最有效方式最佳地表示某種類型的語(yǔ)音段,例如,濁語(yǔ)音、清語(yǔ)音、過(guò)渡語(yǔ)音(例如,清和濁之間)及背景噪聲(非話音)。外部的開環(huán)模式判定機(jī)制仔細(xì)查看輸入語(yǔ)音幀并就哪一種模式適用于該幀作出判定。開環(huán)模式判定通常是通過(guò)從輸入幀析取許多參數(shù),就一些時(shí)間和頻譜特征評(píng)價(jià)這些參數(shù),并根據(jù)評(píng)價(jià)來(lái)決定模式來(lái)進(jìn)行的。
以在2.4kbps級(jí)別上的速率運(yùn)行的編碼系統(tǒng)通常本質(zhì)上是參數(shù)的。也就是說(shuō),這樣的編碼系統(tǒng)通過(guò)以有規(guī)律的間隔發(fā)送描述語(yǔ)音信號(hào)的音節(jié)周期和頻譜包絡(luò)(或共振峰)的參數(shù)而運(yùn)行。說(shuō)明這些所謂參數(shù)編碼器的是LP聲碼器系統(tǒng)。
LP聲碼器采用每一音節(jié)一個(gè)脈沖,周期地對(duì)濁語(yǔ)音信號(hào)建模??梢栽鰪?qiáng)這一基于技術(shù),從而除其他事物外還包括發(fā)送有關(guān)頻譜包絡(luò)的信息。盡管LP聲碼器一般提供合理的性能,它們可帶來(lái)典型地以蜂音為特征的感知上重大的失真。
近幾年中,已出現(xiàn)是波形編碼器和參數(shù)編碼器的混合的編碼器。說(shuō)明這些所謂混合編碼器的是原型波形內(nèi)插(PWI)語(yǔ)音編碼器。PWI編碼系統(tǒng)亦可稱為原型音節(jié)(pitch)周期(PPP)語(yǔ)音編碼器。PWI編碼系統(tǒng)提供一種用來(lái)對(duì)濁語(yǔ)音編碼的有效方法。PWI的基本概念是以固定間隔析取代表音節(jié)周期(原型波形)、發(fā)送其描述及通過(guò)在原型波形間內(nèi)插重建語(yǔ)音信號(hào)。PWI方法可運(yùn)行在或者LP剩余信號(hào)上或者語(yǔ)音信號(hào)上。典型的PWI或PPP語(yǔ)音編碼器在1998年12月21日申請(qǐng)的,序列號(hào)為09/217,494、標(biāo)題為“PERIODIC SPEECHCODING”的美國(guó)申請(qǐng)中有描述,該申請(qǐng)書已轉(zhuǎn)讓給本發(fā)明的受讓人,在此完全引述供參數(shù)。其他PWI或PPP語(yǔ)音編碼器在專利號(hào)為5,884,253的美國(guó)專利及W.Bastiaan Kleign和Wolfgang Granzow所著的“Method for WaveformInterpolation in Speech Coding”(1991年版)的215至230頁(yè)中有描述。
在許多普通語(yǔ)音編碼器中,給定音節(jié)原型的相位參數(shù)各自單獨(dú)由編碼器量化和發(fā)送?;蛘?,相位參數(shù)可得到矢量量化以使帶寬守恒。然而,在低比特率語(yǔ)音編碼器中,發(fā)送最小數(shù)目的可能維持令人滿意的語(yǔ)音質(zhì)量的比特是有益的。因此,在一些普通語(yǔ)音編碼器中,相位參數(shù)可根本不是由編碼器發(fā)送的,而解碼器可以或者不把相位用于重建,或者使用固定的存儲(chǔ)相位參數(shù)組。在這兩種情況的任一情況中,結(jié)果語(yǔ)音質(zhì)量可降低。因此,提供一種減小從編碼器向解碼器發(fā)送相位譜信息所必需的單元的數(shù)目從而發(fā)送較少的相位信息的低速率語(yǔ)音編碼器將是理想的。因而,需要一種每幀發(fā)送較少相位參數(shù)的語(yǔ)音編碼器。
發(fā)明概要本發(fā)明涉及一種每幀發(fā)送較少相位參數(shù)的語(yǔ)音編碼器。相應(yīng)地,在本發(fā)明的一個(gè)方面,一種在語(yǔ)音編碼器中處理幀的原型的方法最好包括以下步驟生成基準(zhǔn)原型的多個(gè)相位參數(shù)、生成原型的多個(gè)相位參數(shù),以及在多個(gè)頻帶中,使原型的相位參數(shù)和基準(zhǔn)原型的相位參數(shù)相關(guān)聯(lián)。
在本發(fā)明的另一方面,一種在語(yǔ)音編碼器中處理幀的原型的方法最好包括以下步驟生成基準(zhǔn)原型的多個(gè)相位參數(shù)、生成與該原型有關(guān)的多個(gè)線性相移植,以及在多個(gè)頻帶上從這些相位參數(shù)和這些線性相移值合成相位矢量。
在本發(fā)明的另一方面,一種在語(yǔ)音編碼器中處理幀的原型的方法最好包括以下步驟生成與該原型有關(guān)的多個(gè)循環(huán)旋轉(zhuǎn)值,在多個(gè)頻帶中生成多個(gè)帶通波形(多個(gè)帶通波形與基準(zhǔn)原型的多個(gè)相位數(shù)有關(guān))及根據(jù)多個(gè)循環(huán)旋轉(zhuǎn)值修改多個(gè)帶通波形。
在本發(fā)明的另一方面,一種語(yǔ)音編碼器最好包括用來(lái)生成幀的基準(zhǔn)原型的多個(gè)相位參數(shù)的裝置,用來(lái)生成當(dāng)前幀的當(dāng)前原型的多個(gè)相位參數(shù)的裝置及用來(lái)在多個(gè)頻帶中使當(dāng)前原型的相位參數(shù)和基準(zhǔn)原型的相位參數(shù)相關(guān)聯(lián)的裝置。
在本發(fā)明的另一方面,一種語(yǔ)音編碼器最好包括用來(lái)生成幀的基準(zhǔn)原型的多個(gè)相位參數(shù)的裝置,用來(lái)生成與當(dāng)前幀的當(dāng)前原型關(guān)聯(lián)的多個(gè)線性相移值的裝置以及用來(lái)在多個(gè)頻帶上從這些相位參數(shù)和這些線性相移值合成相位矢量的裝置。
在本發(fā)明的另一方面,一種語(yǔ)音編碼器最好包括用來(lái)生成與當(dāng)前幀的當(dāng)前原型相關(guān)聯(lián)的多個(gè)循環(huán)旋轉(zhuǎn)值的裝置,用來(lái)在多個(gè)頻帶中生成多個(gè)帶通波形的裝置(多個(gè)帶通波形與幀的基準(zhǔn)原型的多個(gè)相位參數(shù)有關(guān))及用來(lái)根據(jù)多個(gè)循環(huán)旋轉(zhuǎn)值修改多個(gè)帶通波形的裝置。
在本發(fā)明的另一方面,一種語(yǔ)音編碼器最好包括配置成從正由語(yǔ)音編碼器處理的當(dāng)前幀析取當(dāng)前原型的原型析取器,以及耦合到原型析取器并配置成生成幀的基準(zhǔn)原型的多個(gè)相位參數(shù),生成當(dāng)前原型的多個(gè)相位參數(shù)且在多個(gè)頻帶中使當(dāng)前原型的這些相位參數(shù)和基準(zhǔn)原型的這些相位參數(shù)相關(guān)聯(lián)的原型量化器。
在本發(fā)明的另一方面,一種語(yǔ)音編碼器最好包括配置成從正由語(yǔ)音編碼器處理的當(dāng)前幀析取當(dāng)前原型的原型析取器,以及耦合到原型析取器并配置成生成幀的基準(zhǔn)原型的多個(gè)相位參數(shù),生成與當(dāng)前原型有關(guān)的多個(gè)線性相移值且在多個(gè)頻帶上從這些相位參數(shù)和線性相移值合成相位矢量的原型量化器。
在本發(fā)明的另一方面,語(yǔ)音編碼器最好包括配置成從正由語(yǔ)音編碼器處理的當(dāng)前幀析取當(dāng)前原型的原型析取器,以及耦合到原型析取器并配置成生成與當(dāng)前原型有關(guān)的多個(gè)循環(huán)旋轉(zhuǎn)值,在多個(gè)頻帶中生成多個(gè)帶通波形(多個(gè)帶通波形與幀的基準(zhǔn)原型的多個(gè)相位參數(shù)有關(guān))且根據(jù)多個(gè)循環(huán)旋轉(zhuǎn)值修改多個(gè)帶通波形的原型量化器。
附圖簡(jiǎn)述
圖1是無(wú)線電話系統(tǒng)的方框圖。
圖2是由語(yǔ)音編碼器終接在每一端的通信信道的方框圖。
圖3是編碼器的方框圖。
圖4是解碼器的方框圖。
圖5是說(shuō)明語(yǔ)音編碼判定過(guò)程的流程圖。
圖6A是語(yǔ)音信號(hào)幅度對(duì)時(shí)間的曲線圖,而圖6B是線性預(yù)測(cè)(LP)剩余幅度對(duì)時(shí)間的曲線圖。
圖7是原型音節(jié)周期語(yǔ)音編碼器的方框圖。
圖8是可用于圖7中的語(yǔ)音編碼器中的原型量化器的方框圖。
圖9是可用于圖7中的語(yǔ)音編碼器中的原型去量化器的方框圖。
圖10是可用于圖7中的語(yǔ)音編碼器中的原型去量化器的方框圖。
較佳實(shí)施例的詳細(xì)描述下文中描述的示例實(shí)施例駐留于配置成利用CDMA空中接口的無(wú)線電話通信系統(tǒng)中。然而,本領(lǐng)域中的熟練人士明白,含有本發(fā)明特性的子抽樣方法和設(shè)備可駐留于利用為本領(lǐng)域中的熟練人士所知的范圍廣泛的技術(shù)的各種通信系統(tǒng)中的任一種中。
如圖1所示,CDMA無(wú)線電話系統(tǒng)通常包括多個(gè)移動(dòng)用戶單元10、多個(gè)基站12、基站控制器(BSC)14及移動(dòng)交換中心(MSC)16。MSC16配置成與普通公交換電話網(wǎng)(PSTN)18交接(interface)。MSC16亦配置成與BSC14交接。BSC14通過(guò)迂回線路耦合到基站12。迂回線路可配置成支持幾種已知接口包括(例如)E1/T1、ATM、IP、PPP、幀中繼、HDSL、ADSL或XDSL中的任一種。應(yīng)當(dāng)理解,系統(tǒng)中可有多于兩個(gè)的BSC14。每個(gè)基站12最好包括至少一個(gè)扇區(qū)(未示出),每個(gè)扇區(qū)包含一指向一徑向離開基站12的特定方向的全向天線或天線?;蛘撸總€(gè)扇區(qū)可包含用于分集接收的兩個(gè)天線。每個(gè)基站12最好設(shè)計(jì)成支持多個(gè)頻率分配。扇區(qū)和頻率分配的交點(diǎn)可稱為CDMA信道?;?2亦可稱為基站收發(fā)信機(jī)子系統(tǒng)(BTS)12?;蛘撸盎尽痹跇I(yè)界可用來(lái)統(tǒng)稱BSC14和一個(gè)或以上的BTS12。BTS12亦可表示為“區(qū)站”12?;蛘?,給定BTS12的單獨(dú)扇區(qū)可稱為區(qū)站。移動(dòng)用戶單元10通常是蜂窩或PCS電話10。系統(tǒng)最好配置成按照IS-95標(biāo)準(zhǔn)使用。
在蜂窩電話系統(tǒng)的典型運(yùn)行期間,基站12接收來(lái)自幾組移動(dòng)單元10的幾組反向鏈路信號(hào)。移動(dòng)單元10在進(jìn)行電話呼叫或其他通信。由一給定基站12接收的每個(gè)反向鏈路信號(hào)在該基站12內(nèi)處理。結(jié)果數(shù)據(jù)提交給BSC14。BSC14提供呼叫資源分配和包括基站12間軟切換的協(xié)調(diào)(orchestration)的移動(dòng)性管理功能。BSC14還把接收的數(shù)據(jù)發(fā)送給MSC16,MSC16提供用于與PSTN18交接的附加的路由選擇業(yè)務(wù)。類似地,PSTN18與MSC16接口相連,而MSC16與MSC14交接,BSC14依次控制基站12向移動(dòng)單元組10發(fā)送前向鏈路信號(hào)組。
在圖2中,第一編碼器100接收數(shù)字化語(yǔ)音樣本S(n),并對(duì)這些樣本S(n)編碼,以在傳輸媒介102或通信信道102上向第一解碼器104發(fā)送。解碼器104對(duì)編碼語(yǔ)音樣本解碼,并合成輸出語(yǔ)音信號(hào)SSYNTH(n)。為在相反方向發(fā)送,第二編碼器106對(duì)數(shù)字化的語(yǔ)音樣本S(n)編碼,數(shù)字化的語(yǔ)音樣本S(n)在通信信道108上發(fā)送。第二解碼器110接收并對(duì)編碼語(yǔ)音樣本解碼,生成合成輸出語(yǔ)音信號(hào)SSYNTH(n)。
語(yǔ)音樣本S(n)表示已按照本領(lǐng)域中已知的各種方法,包括(例如),脈碼調(diào)制(PCM)、壓擴(kuò)μ律或A律中的任一種得到數(shù)字化和量化的語(yǔ)音信號(hào)。如本領(lǐng)域中所知,語(yǔ)音樣本S(n)組織到輸入數(shù)據(jù)幀中,其中,每個(gè)幀包含一預(yù)置數(shù)目的數(shù)字化的語(yǔ)音樣本S(n)。在一示例實(shí)施例中,利用8KHz的抽樣率,每個(gè)20ms幀包含160個(gè)樣本。在下面描述的實(shí)施例中,數(shù)據(jù)發(fā)送速率最好按幀而異從13.2kbps(全速率)到6.2kbps(半速率)到2.6kbps(1/4速率)到1kbps(1/8速率)。使數(shù)據(jù)發(fā)送速率各異是有益的,因?yàn)閷?duì)含有相對(duì)較少語(yǔ)音信息的幀可以有選擇地利用較低比特率。如本領(lǐng)域中的熟練人員所知,可使用其他抽樣速率、幀大小和數(shù)據(jù)發(fā)送速率。
第一編碼器100與第二解碼器110一起含有一個(gè)語(yǔ)音編碼器或語(yǔ)音編譯碼器。語(yǔ)音編碼器可用于任一用來(lái)發(fā)送語(yǔ)音信號(hào)的通信設(shè)備,包括,例如,用戶單元,BTS或上面參考圖1所述的BSC中。與此類似,第二編碼器106和第一解碼器104一起含有一個(gè)第二語(yǔ)音編碼器。本領(lǐng)域中的熟練人士明白,語(yǔ)音編碼器可用數(shù)字信號(hào)處理器(DSP)、專用集成電路(ASIC)、離散門邏輯、固件或任一普通可編程軟件模塊和微處理器來(lái)實(shí)施。軟件模塊可位于RAM存儲(chǔ)器、按塊擦除存儲(chǔ)器、寄存器或本領(lǐng)域中所知的其他形式的可寫存儲(chǔ)介質(zhì)內(nèi)?;蛘?,可用任一普通處理器、控制器或狀態(tài)機(jī)代替微處理器。專門為語(yǔ)音編碼設(shè)計(jì)的示例ASIC在專利號(hào)為5,727,123的美國(guó)專利及1994年2月16日提交的序列號(hào)為08/197,417標(biāo)題為“VOCODER ASIC”的美國(guó)專利申請(qǐng)書中有描述,二者均已轉(zhuǎn)讓給本發(fā)明的受讓人,在此引述供參考。
圖3中,可用于語(yǔ)音編碼器中的編碼器200包括模式判模塊202,音節(jié)估計(jì)模塊204、LP分析濾波器208、LP量化塊210及剩余量化模塊212。輸入語(yǔ)音幀S(n)提供給模式判定模塊202、音節(jié)估計(jì)模塊204、LP分析模塊206和LP分析濾波器208。模式判定模塊202根據(jù)每個(gè)輸入語(yǔ)音幀S(n)的周期性、能量、信噪比(SNR)或過(guò)零率等生成模式索引IM和模式M。按照周期性對(duì)語(yǔ)音幀歸類的各種方法在專利號(hào)為5,911,128的美國(guó)專利中有描述,該專利已轉(zhuǎn)讓給本發(fā)明的受讓人,在此引述供參考。這樣的方法亦被并入電信工業(yè)協(xié)會(huì)工業(yè)過(guò)渡標(biāo)準(zhǔn)TIA/EIA IS-127和TIA/EIA IS-733中。示例模式判定方案在前面所提及的序列號(hào)09/217,341的美國(guó)專利申請(qǐng)書中亦有描述。
音節(jié)估計(jì)模塊204根據(jù)每個(gè)輸入語(yǔ)音幀S(n)生成音節(jié)索引IP和滯后值Po。LP分析模塊206在每個(gè)輸入語(yǔ)音幀S(n)上執(zhí)行線性預(yù)測(cè)分析以生成LP參數(shù)a。LP參數(shù)a提供給LP量化模塊210。LP量化模塊210亦接收模式M,從而以取決于模式的方式執(zhí)行量化過(guò)程。LP量化模塊210生成LP索引ILP和量化的LP參數(shù)a。LP分析濾波器208除接收輸入語(yǔ)音幀S(n)外還接收量化的LP參數(shù)a。LP分析濾波器208生成LP剩余信號(hào)R[n],LP剩余信號(hào)R[n]表示輸入語(yǔ)音幀S(n)與基于量化線性預(yù)測(cè)參數(shù)a的重建語(yǔ)音間的差錯(cuò)。LP剩余R[n],模式M和量化LP參數(shù)a提供給剩余量化模塊212。根據(jù)這些值,剩余量化模塊212生成剩余索引IR和量化剩余信號(hào)R[n]。
在圖4中可用于語(yǔ)音編碼器中的解碼器300包括LP參數(shù)解碼模塊302,剩余解碼模塊304、模式解模塊306和LP合成濾波器308。模式解碼模塊306接收并對(duì)模式索引IM解碼,從中生成模式M。LP參數(shù)解碼模塊302接收模式M和LP索引ILP。LP參數(shù)解碼模塊302對(duì)接收的值解碼,以生成量化LP參數(shù)a。剩余解碼模塊304接收剩余索引IR、音節(jié)索引IP和模式索引IM。剩余解碼模塊304對(duì)接收的值解碼,以生成量化剩余信號(hào)R[n]。量化剩余信號(hào)R[n]和量化LP參數(shù)a提供給LP合成濾波器308,LP合成濾波器308從中合成解碼輸出語(yǔ)音信號(hào)S[n]。
圖3的編碼器200和圖4的解碼器300的各種模塊的運(yùn)行和實(shí)施為本領(lǐng)域中的人員所知,且在前文中所提及的專利號(hào)為5,414,796的美國(guó)專利及L.B.Rabiner與R.W.Schafer合著的“Digital Processing of Speech Signals“(1978年版)的396至453頁(yè)中有描述。
如圖5的流程圖所示,根據(jù)一實(shí)施例的語(yǔ)音編器在處理用于發(fā)送的語(yǔ)音樣本中遵循一組步驟。在步驟400中語(yǔ)音編碼器接收連續(xù)幀中語(yǔ)音信號(hào)的數(shù)字樣本。一旦接收一給定幀,語(yǔ)音編碼器進(jìn)入步驟402。步驟402中語(yǔ)音編碼器檢測(cè)該幀的能量。能量是幀的語(yǔ)音活動(dòng)性的量度。語(yǔ)音檢測(cè)是通過(guò)求數(shù)字語(yǔ)音樣本的幅度的平方的和及把結(jié)果能量與閾值比較執(zhí)行的。在一實(shí)施例中閾值根據(jù)背景噪聲的變化水平適配。典型的可變閾值語(yǔ)音活動(dòng)性檢測(cè)器在前文提及的專利號(hào)為5,414,796的美國(guó)專利中有描述。一些清音可以是特別低能量的樣本,可作為背景噪聲被誤編碼。為防止此情況發(fā)生,如在前文提及的專利號(hào)為5,414,796的美國(guó)專利中所述,可使用低能量樣本的頻譜傾斜以把清音與背景噪聲區(qū)分開。
檢測(cè)幀的能量后,語(yǔ)音編碼器進(jìn)入步驟404。步驟404中語(yǔ)音編碼器確定檢測(cè)幀能量是否充足到把幀分為含有語(yǔ)音信息。若檢測(cè)幀能量落于預(yù)置門限水平之后,語(yǔ)音編碼器進(jìn)入步驟406。步驟406中語(yǔ)音編碼器把幀當(dāng)作背景噪聲(即,非話或靜寂)編碼。在一實(shí)施例中,背景噪聲幀以1/8速率或1kbps編碼。若步驟404中檢測(cè)幀能量符合或超出預(yù)置門限水平,幀歸類為語(yǔ)音而語(yǔ)音編碼器進(jìn)入步驟408。
步驟408中,語(yǔ)音編碼器確定幀是否清音,即,語(yǔ)音編碼器檢驗(yàn)幀的周期性。周期性確定的各種已知方法包括,例如,使用過(guò)零和使用歸一化自相關(guān)函數(shù)(NACF)。特別是,使用過(guò)零和NACF檢測(cè)周期性在前文提及的專利號(hào)為5,911,128的美國(guó)專利和序列號(hào)為09/217,341的美國(guó)專利申請(qǐng)書中有描述。另外,以上用來(lái)區(qū)分濁音和清音的方法被并入電信工業(yè)協(xié)會(huì)過(guò)渡標(biāo)準(zhǔn)TIA/EIA IS-127和TIA/EIA IS-733中。若步驟408確定幀是清音,語(yǔ)音編碼器進(jìn)入步驟410。步驟410中語(yǔ)音編碼器把幀作為清音編碼。在一實(shí)施例中,清音幀以1/4速率或2.6kbps得到編碼。若步驟408中未確定幀是清音,語(yǔ)音編碼器進(jìn)入步驟412。
步驟412中,例如,前文提及的專利號(hào)為5,911,128的美國(guó)專利中所述,語(yǔ)音編碼器用本領(lǐng)域所知的周期性檢測(cè)方法確定幀是否是過(guò)渡語(yǔ)音。若確定幀是過(guò)渡語(yǔ)音,語(yǔ)音編碼器進(jìn)入步驟414。步驟414中幀作為過(guò)渡語(yǔ)音(即,從清音向濁音過(guò)渡)編碼。在一實(shí)施例中,過(guò)渡語(yǔ)音幀是按照1999年5月7日申請(qǐng)的序列號(hào)為09/307,294的、標(biāo)題為“MULTIPULSE INTERPOLATIVECODING OF TRANSITION SPEECH FRAMES”的美國(guó)專利申請(qǐng)書描述的多脈沖內(nèi)插編碼方法編碼的,該申請(qǐng)書已轉(zhuǎn)證給本發(fā)明的受讓人,在此完全引述供參考。在另一實(shí)施例中,過(guò)渡語(yǔ)音幀以全速率或13.2kbps編碼。
若步驟412中語(yǔ)音編碼器確定幀不是過(guò)渡語(yǔ)音,語(yǔ)音編碼器進(jìn)入步驟416。步驟416中語(yǔ)音編碼器把幀作為濁音編碼。在一實(shí)施例中可以半速率或6.2kbps濁音幀編碼。亦可能全速率或13.2kbps(或全速率,8kbps,在8kCELP編碼器中)對(duì)濁音幀編碼。然而,本領(lǐng)域中的熟練人士明白,以半速率對(duì)濁音幀編碼能通過(guò)利用濁音幀的穩(wěn)態(tài)本質(zhì)允許編碼器存儲(chǔ)寶貴的帶寬。而且,不管用來(lái)對(duì)濁音編碼的速率是什么,最好用以前幀的信息對(duì)濁音編碼,因而可說(shuō)成是對(duì)濁音預(yù)測(cè)編碼。
普通技術(shù)人員能夠認(rèn)識(shí)到,可遵循圖5所示的步驟對(duì)語(yǔ)音信號(hào)或相應(yīng)的LP剩余編碼。噪聲、清音、過(guò)渡語(yǔ)音和濁音的濾形特點(diǎn)可看作是圖6A的曲線圖中時(shí)間函數(shù)。噪聲、清音LP剩余、過(guò)渡語(yǔ)音LP剩余和濁音LP剩余可視為圖6B的曲線圖中時(shí)間的函數(shù)。
在一種實(shí)施例中,原型音節(jié)周期(PPP)語(yǔ)音編碼器500包括反濾波器502,原型析取器504、原型量化器506、原型去量化508、內(nèi)插/合成模塊510和LPC合成模塊512,如圖7所示。語(yǔ)音編碼器500可最好是DSP的部件,并可駐留于,例如,PCS或蜂窩電話系統(tǒng)中的用戶單元或基站中,或駐留于衛(wèi)星系統(tǒng)中的用戶單元或網(wǎng)關(guān)中。
在語(yǔ)音編碼器500中,將數(shù)字化語(yǔ)音信號(hào)S(n)(其中,n是幀號(hào))提供給反LP濾波器502。在一特定實(shí)施例中,幀長(zhǎng)是20ms。按照下列等式計(jì)算反濾波器的傳遞函數(shù)A(2)A(z)=1-a1z-1-a2z-2-…-apz-p(略)系數(shù)a1是具有按照已知方法選擇的預(yù)置值的濾波器抽頭,這些已知方法如專利號(hào)5,414,796的美國(guó)專利和序列號(hào)為09/217,494的美國(guó)專利申請(qǐng)書中所述,它們?cè)谇拔闹幸酝耆龉﹨⒖?。?shù)字P表示反LP濾波器502用于預(yù)測(cè)的前樣本的數(shù)目。在一特定實(shí)施例中,P設(shè)定為10。
反濾波器502向原型析取器504提供LP剩余信號(hào)r(n)。原型析取器504從當(dāng)前幀析取原型。原型是將由內(nèi)插/合成模塊510用來(lái)自類似地定位于幀中的前幀的原型線性地內(nèi)插以在解碼器端重建LP剩余信號(hào)的當(dāng)前幀的部分。
原型析取器504向原型量化器506提供原型,原型量化器506按照下面參考圖8所述的技術(shù)量化原型。量化值可從查閱表(未示出)獲得,匯編成數(shù)據(jù)分組,數(shù)據(jù)分組包括滯后和其他電碼本參數(shù),用來(lái)通過(guò)信道發(fā)送。分組提供給發(fā)射機(jī)(未示出)并通過(guò)信道向接收機(jī)(亦未示出)發(fā)送。反LP濾波器502,原型析取器504和原型量化器506已完成對(duì)當(dāng)前幀的PPP分析。
接收機(jī)接收數(shù)據(jù)分組并把數(shù)據(jù)分組提供給原型去量化器508。原型去量化器508按照下面參考圖9所述的技術(shù)去量化數(shù)據(jù)分組。原型去量化器508向內(nèi)插/合成模塊510提供去量化原型。內(nèi)插/合成模塊510用來(lái)自類似定位于幀中的前幀的原型內(nèi)插原型以重建當(dāng)前幀的LP剩余信號(hào)。內(nèi)插與幀合成最好按照專利號(hào)為5,884,253的美國(guó)專利和前文提及的序列號(hào)為09/217,494的美國(guó)專利申請(qǐng)書中所述的已知方法來(lái)完成。
內(nèi)插/合成模塊510向LPC合成模塊512提供重建LP剩余信號(hào)r(n)。LPC合成模塊512還接收來(lái)自發(fā)送數(shù)據(jù)分組的線譜對(duì)(LSP)值,LSP值用來(lái)執(zhí)行重建LP剩余信號(hào)r(n)上的LPC濾波,以生成當(dāng)前幀的重建語(yǔ)音信號(hào)S(n)。在一可選實(shí)施例中,可在執(zhí)行當(dāng)前幀的插入/合成之前對(duì)原型執(zhí)行語(yǔ)音信號(hào)S(n)的LPC合成。原型去量化器508,內(nèi)插/合成模塊510和LPC合成模塊512已完成當(dāng)前幀的PPP合成。
在一實(shí)施例中,原型量化器600采用有效發(fā)送的智能子抽樣,執(zhí)行原型相位的量化,如圖8所示,原型建化器600包括第一和第二離散傅里叫級(jí)數(shù)(DFS)系數(shù)計(jì)算模塊602、604、第一和第二分解模塊606、608、頻帶標(biāo)識(shí)模塊610、幅度矢量量化器612、關(guān)聯(lián)模塊614和量化器616。
在原型量化器600中,基準(zhǔn)原型提供給第一DFS系數(shù)計(jì)算模塊602。第一DFS系數(shù)計(jì)算模塊602計(jì)算基準(zhǔn)原型的DFS系數(shù),如下所述,并把基準(zhǔn)原型的DFS系數(shù)提供給第一分解模塊606。第一分解模塊606把基準(zhǔn)原型的DFS系數(shù)分解成幅度矢量和相位矢量,如下所述。第一分解模塊606向關(guān)聯(lián)模塊614提供幅度矢量和相位矢量。
把當(dāng)前原型提供給第二DFS系數(shù)計(jì)算模塊602。第二DFS系數(shù)計(jì)算模塊606計(jì)算當(dāng)前原型的DFS系數(shù),如下所述,并把當(dāng)前原型的DFS系數(shù)提供給第二分解模塊608。第二分解模塊608把當(dāng)前原型的DFS系數(shù)分解成幅度矢量和相位矢量,如下所述。第二分解模塊608向關(guān)聯(lián)模塊614提供幅度矢量和相位矢量。
第二分解模塊608還向頻帶標(biāo)識(shí)模塊610提供當(dāng)前原型的幅度矢量和相位矢量。頻帶標(biāo)識(shí)模塊610標(biāo)識(shí)用于關(guān)聯(lián)的頻帶,如下所述,并向關(guān)聯(lián)模塊614提供頻帶標(biāo)識(shí)索引。
第二分解模塊608還向幅度矢量量化器612提供當(dāng)前原型的幅度矢量。幅度矢量量化器612量化當(dāng)前原型的幅度矢量,如下所述,并生成幅度量化參數(shù)用于發(fā)送。在一特定實(shí)施例中,幅度矢量量化器612同頻帶標(biāo)識(shí)模塊610(為求明晰這種聯(lián)系未在附圖中示出)和/或向關(guān)聯(lián)模塊614提供量化幅度值。
關(guān)聯(lián)模塊614在所有頻帶中關(guān)聯(lián),以確定全部頻帶的最佳線性相移,如下所述,在一可選實(shí)施例中,在帶通信號(hào)上的時(shí)域中執(zhí)行互相關(guān)以確定所有頻帶的最佳循環(huán)旋轉(zhuǎn),亦如下所述。關(guān)聯(lián)模塊614向量化器616提供線性相移值。在一可選實(shí)施例中,關(guān)聯(lián)模塊614向量化器616提供循環(huán)旋轉(zhuǎn)值。量化器616量化接收值,如下所述,生成相位量化參數(shù)用于發(fā)送。
在一實(shí)施例中原型去量化器700用DFS的組成頻帶上的線性移執(zhí)行原型相位譜的重建,如圖9所示。原型去量化器700包括DFS系數(shù)計(jì)算模塊702、反DFS計(jì)算模塊704、分解模塊706、組合模塊708、頻帶標(biāo)識(shí)模塊701、幅度矢量去量化器712、合成模塊714和相位去量化器716。
在原型去量化器700中,基準(zhǔn)原型提供給DFS系數(shù)計(jì)算模塊702。DFS系數(shù)計(jì)算模塊702計(jì)算基準(zhǔn)原型的DFS系數(shù),如下所述,并向分解模塊706提供基準(zhǔn)原型的DFS系數(shù)。分解模塊706把基準(zhǔn)原型的DFS系數(shù)分解成幅度和相位矢量,如下所述。分解模塊706向合成模塊714提供基準(zhǔn)相位(即,基準(zhǔn)原型的相位矢量)。
相位量化參數(shù)由相位去量化器716接收。相位去量化器716去量化接收相位量化參數(shù),如下所述,生成線性相移值。相位去量化器716向合成模塊714提供線性相移值。
幅度矢量量化參數(shù)由幅度矢量去量化器712接收。幅度矢量去量化器712去量化接收幅度量化參數(shù),如下所述,生成去量化幅度值。幅度矢量去量化器712向組合模塊708提供量化幅度值。幅度矢量去量化器712還向頻帶標(biāo)識(shí)模塊710提供去量化幅度值。頻帶標(biāo)識(shí)模塊710標(biāo)識(shí)頻帶用于組合,如下所述,并向合成模塊714提供頻帶標(biāo)識(shí)索引。
合成模塊714從基準(zhǔn)相位和線性相移值合成修改的相位矢量,如下所述。合成模塊714向組合模塊708提供修改的相位矢量值。
組合模塊708將去量化幅度值和相位值組合起來(lái),如下所述,生成重建的、修改的DFS系數(shù)矢量。組合模塊708向反DFS計(jì)算模塊704提供組合的幅度和相位矢量。反DFS計(jì)算模塊704計(jì)算重建的、修改的DFS系數(shù)矢量的反DFS,如下所述,生成重建當(dāng)前原型。
在一實(shí)施例中,原型去量化器800用在編碼器端的原型波形的組成帶通波形上的時(shí)域中執(zhí)行的循環(huán)旋轉(zhuǎn)執(zhí)行原型相位譜的重建,如圖9所示。原型去量化器800包括DFS系數(shù)計(jì)算模塊802、帶通波形加法器804、分解模塊806、反DFS/帶通信號(hào)生成模塊808、頻帶標(biāo)識(shí)模塊810、幅度矢量去量化器812、合成模塊814和相位去量化器816。
在原型去量化器800中,基準(zhǔn)原型提供給DFS系數(shù)計(jì)算模塊802。DFS系數(shù)計(jì)算模塊802計(jì)算基準(zhǔn)原型的DFS系數(shù),如下所述,并向分解模塊806提供基準(zhǔn)原型的DFS系數(shù)。分解模塊806把基準(zhǔn)原型的DFS系數(shù)分解成幅度和相位矢量,如下所述。分解模塊806向合成模塊814提供基準(zhǔn)相位(即,基準(zhǔn)原型的相位矢量)。
相位量化參數(shù)由相位去量化器816接收。相位去量化器816去量化接收相位量化參數(shù),如下所述,生成循環(huán)旋轉(zhuǎn)值。相位去量化器816向合成模塊814提供循環(huán)旋轉(zhuǎn)值。
幅度矢量量化參數(shù)由幅度矢量去量化器812接收。幅度矢量去量化器812去量化接收幅度量化參數(shù),如下所述,生成去量化幅度值。幅度矢量去量化器812向反DFS/帶通信號(hào)生成模塊808提供量化幅度值。幅度矢量去量化器812還向頻帶標(biāo)識(shí)模塊810提供去量化幅度值。頻帶標(biāo)識(shí)模塊810標(biāo)識(shí)頻帶用于組合,如下所述,并向反FDS/帶通信號(hào)生成模塊808提供頻帶標(biāo)識(shí)索引。
反DFS/帶通信號(hào)生成模塊808組合去量化幅度值和每個(gè)頻帶的基準(zhǔn)相位值,并用每個(gè)頻帶的反DFS從組合計(jì)算帶通信號(hào),如下所述。反DFS/帶通信號(hào)生成模塊808向組成模塊814提供帶通信號(hào)。
合成模塊814用去量化循環(huán)旋轉(zhuǎn)值循環(huán)旋轉(zhuǎn)每個(gè)帶通信號(hào),如下所述,生成修改的、旋轉(zhuǎn)的帶通信號(hào)。合成模塊814向帶通波形加法器804提供修改的、旋轉(zhuǎn)的帶通信號(hào)。帶通波形加法器804求全部帶通信號(hào)的和,以生成重建原型。
圖8的原型量化器600和圖9的原型去量化器700在正常工作中分別用來(lái)對(duì)原型音節(jié)周期波形的相位譜編碼和解碼。在發(fā)射機(jī)/編碼器(圖8),用DFS表達(dá)式 計(jì)算當(dāng)前幀的原型SC(n)的相位譜kc,Ckc是當(dāng)前原型的復(fù)合DFS系數(shù)而ωoc是SC(n)的歸一化基頻。相位譜kc是組成DFS的復(fù)合系數(shù)的角。用類似的方式計(jì)算基準(zhǔn)原型的相位譜kr,以提供Ckc和kr?;蛘撸鶞?zhǔn)原型的相位譜kr在有基準(zhǔn)原型的幀得到處理后得到存儲(chǔ),并且從存儲(chǔ)器只是得到檢索。在一特別實(shí)施例中,基準(zhǔn)原型是來(lái)自前一幀的原型。來(lái)自基準(zhǔn)幀和當(dāng)前幀的兩原型的復(fù)合DFS可表示為振幅譜和相位譜的乘積,如下面的等式所示 。#應(yīng)注意的是,振幅譜和相位譜是矢量,因?yàn)閺?fù)合DFS亦是矢量。DFS矢量的每個(gè)單元是等于相應(yīng)原型的時(shí)長(zhǎng)的倒數(shù)的頻率的諧波。對(duì)最大頻率為FmHz(以至少2FmHz的速率抽樣)的信號(hào)和FoHz的諧波頻率,有M個(gè)諧波。諧波的數(shù)目M等于Fm/Fo。因此,每個(gè)原型相位譜矢量和振幅譜矢量由M個(gè)單元構(gòu)成。
當(dāng)前原型的DFS矢量劃分成B個(gè)頻帶而對(duì)應(yīng)每個(gè)B頻帶的時(shí)間信號(hào)是帶通信號(hào)。頻帶的數(shù)目B限于小于諧波的數(shù)目M。求全部B帶通時(shí)間信號(hào)的和會(huì)得出原始當(dāng)前原型。以類似的方式,基準(zhǔn)原型的DFS矢量亦劃分成相同的B頻帶。(kbi)]]>對(duì)每個(gè)B頻帶,在對(duì)應(yīng)基準(zhǔn)原型的帶通信號(hào)與對(duì)應(yīng)當(dāng)前原型的帶通信號(hào)間執(zhí)行互相關(guān)。互相關(guān)可在頻域DFS矢量 上執(zhí)行,其中,(kbi)是第i個(gè)頻帶bi中的諧波數(shù)集,而θi是第i個(gè)頻帶bi和可能的線性相移?;ハ嚓P(guān)亦可按照下面的等式在對(duì)應(yīng)的時(shí)域帶通信號(hào)上(例如,用圖10的去量化器800)執(zhí)行 L是當(dāng)前原型的樣本中的長(zhǎng)度,而 和 分別是基準(zhǔn)原型和當(dāng)前原型的歸一化基頻,而ri是樣本中的循環(huán)旋轉(zhuǎn)。對(duì)應(yīng)頻帶bi的帶通時(shí)域信號(hào)sbir(n)和sbiC分別由下列表達(dá)式給出 在一實(shí)施例中,用量化幅度矢量 得到CkC,如下面的等式所示 。互相關(guān)通過(guò)基準(zhǔn)原型的帶通DFS矢量的全部可能線性相移執(zhí)行。或者,互相關(guān)可通過(guò)基準(zhǔn)原型的帶通FDS矢量的全部可能線性相移的子集執(zhí)行。在一可選實(shí)施例中,利用時(shí)域方法,而互相關(guān)通過(guò)基準(zhǔn)原型的帶通時(shí)間信號(hào)的全部可能循環(huán)旋轉(zhuǎn)執(zhí)行。在一實(shí)施例中,互相關(guān)通過(guò)基準(zhǔn)原型的帶通時(shí)間信號(hào)的全部可循環(huán)旋轉(zhuǎn)的子集執(zhí)行。互相關(guān)過(guò)程生成對(duì)應(yīng)每個(gè)B頻帶的互相關(guān)的最大值的B線性相移(或B循環(huán)旋轉(zhuǎn),在互相關(guān)在帶通時(shí)間信號(hào)上的時(shí)域中執(zhí)行的實(shí)施例中)。然后B個(gè)線性相移(或,在可迭實(shí)施例中,B循環(huán)旋轉(zhuǎn))取代M個(gè)原始相位譜矢量單元作為相位譜的代表得到量化和發(fā)送。獨(dú)立地量化和發(fā)送振幅譜矢量。這樣,基準(zhǔn)原型的帶通DFS矢量(或帶通時(shí)間信號(hào))最好用作電碼本對(duì)當(dāng)前幀的原型的對(duì)應(yīng)DFS矢量(或帶通信號(hào))編碼。相應(yīng)地,需要較少單元量化和發(fā)送相位信息,從而實(shí)現(xiàn)相位信息的結(jié)果子抽樣并產(chǎn)生更有效的發(fā)送。這在低比特率語(yǔ)音編碼中特別有益,低比特率語(yǔ)音編碼中由于缺少充足的比特,要么因大量的相位單元相位信息的量化很差,要么相位信根本沒有發(fā)送,上述每種情況都導(dǎo)致低質(zhì)量。因?yàn)橛休^少的單元需量化,上述實(shí)施例允許低比特率編碼器維持的語(yǔ)音質(zhì)量。
在接收機(jī)/解碼器(圖9)(如本領(lǐng)域中的熟練人士所理解,亦在解碼器的編碼器的復(fù)制端),B線性相移值運(yùn)用到基準(zhǔn)原型的DFS B頻帶劃分的矢量的解碼器的復(fù)制以生成修改原型DFS相位矢量 。然后,修改DFS矢量作為接收和解碼振幅譜矢量與修改原型DFS相位矢量的乘積獲得。然后用修改DFS矢量上的反DFS操作構(gòu)建重建原型。在可選實(shí)施例中,其中,利用時(shí)域方法,每個(gè)B頻帶的振幅譜矢量與相同B頻帶的基準(zhǔn)原型的相位矢量得到組合,而在組合上執(zhí)行反DFS操作以生成B帶通時(shí)間信號(hào)。然后,用B循環(huán)旋轉(zhuǎn)值循環(huán)地旋轉(zhuǎn)B帶通時(shí)間信號(hào)。把全部B帶通時(shí)間信號(hào)相加以生成重建原型。
這樣,一種新穎的,用來(lái)對(duì)相位譜信息子抽樣的方法和設(shè)備已得到描述。本領(lǐng)域中的熟練人士明白,結(jié)合此處揭示的實(shí)施例描述的各種說(shuō)明性邏輯塊和算法步驟可用以下實(shí)施或執(zhí)行數(shù)字信號(hào)處理器(DSP),專用集成電路(ASIC),離散門或晶體管邏輯,諸如,例如,寄存器和FIFO之類的離散硬件組件,執(zhí)行一組固件指令的處理器或任一普通可編程較件模塊,及處理器。處理器最好是微處理器,但處理器也可以是任一普通處理器、控制器、微控制器或狀態(tài)機(jī)。軟件模塊可駐留于RAM存儲(chǔ)器、按塊擦除存儲(chǔ)器、寄存器或本領(lǐng)域中所知的任一其他形式的可寫存儲(chǔ)媒介。熟練人士會(huì)進(jìn)一步認(rèn)識(shí)到,在整個(gè)上面的描述中可參考的數(shù)據(jù)、指令、命令、信息、信號(hào)、數(shù)據(jù)位、碼元和碼片最好采用電壓、電流、電磁波、磁場(chǎng)或充粒子、光場(chǎng)或光粒子,或以上的任一組合。
這樣,已示出并描述本發(fā)明的較佳實(shí)施例。然而,對(duì)本領(lǐng)域有普通技能的人而言明顯的是,可不脫離本發(fā)明的精神和范圍地對(duì)此處揭示的實(shí)施例作出許多改變。因此,本發(fā)明除按照下列權(quán)利要求外將不受限制。
權(quán)利要求
1.一種處理語(yǔ)音編碼器中幀的原型的方法,其特征在于,它包括以下步驟生成基準(zhǔn)原型的多個(gè)相位參數(shù);生成所述原型的多個(gè)相位參數(shù);以及在多個(gè)頻帶中使所述原型的相位參數(shù)與所述基準(zhǔn)原型的相位參數(shù)相關(guān)聯(lián)。
2.如權(quán)利要求1所述的方法,其特征在于,所述生成步驟包括以下步驟計(jì)算所述基準(zhǔn)原型的離散傅里葉級(jí)數(shù)系數(shù),并把所述離散傅里葉級(jí)數(shù)系數(shù)分解成所述基準(zhǔn)原型的幅度矢量和相位矢量,并且其中,所述生成步驟包括以下步驟計(jì)算所述原型的離散傅里葉級(jí)數(shù)系數(shù),并把所述離散傅里葉級(jí)數(shù)系數(shù)分解成所述原型的幅度矢量和相位矢量。
3.如權(quán)利要求1所述的方法,其特征在于,它還包含標(biāo)識(shí)在其中執(zhí)行所述關(guān)聯(lián)步驟的頻帶的步驟。
4.如權(quán)利要求1所述的方法,其特征在于,所述幀是語(yǔ)音幀。
5.如權(quán)利要求1所述的方法,其特征在于,所述幀是線性預(yù)測(cè)剩余的幀。
6.如權(quán)利要求1所述的方法,其特征在于,所述關(guān)聯(lián)步驟生成所述原型的多個(gè)最佳線性相移值。
7.如權(quán)利要求1所述的方法,其特征在于,所述關(guān)聯(lián)步驟生成所述原型的多個(gè)最佳循環(huán)旋轉(zhuǎn)值。
8.如權(quán)利要求6所述的方法,其特征在于,它還包含這樣兩個(gè)步驟,即,使所述線性相移值量化,以及使所述原型的多個(gè)幅度參數(shù)量化。
9.如權(quán)利要求7所述的方法,其特征在于,它還包含這樣兩個(gè)步驟,即,使所述循環(huán)旋轉(zhuǎn)值量化,以及使所述原型的多個(gè)幅度參數(shù)量化。
10.一種處理語(yǔ)音編碼器中的幀的原型的方法,其特征在于,它包括以下步驟生成基準(zhǔn)原型的多個(gè)相位參數(shù);生成與所述原型有關(guān)的多個(gè)線性相移值;以及在多個(gè)頻帶上從所述相位參數(shù)和所述線性相移值來(lái)合成相位矢量。
11.如權(quán)利要求10所述的方法,其特征在于,所述生成步驟包括以下步驟計(jì)算所述基準(zhǔn)原型的離散傅里葉級(jí)數(shù)系數(shù),并把所述離散傅里葉級(jí)數(shù)系數(shù)分解成所述基準(zhǔn)原型的幅度矢量和相位矢量。
12.如權(quán)利要求10所述的方法,其特征在于,它還包含這樣一個(gè)步驟,即,標(biāo)識(shí)在其中執(zhí)行合成步驟的頻帶。
13.如權(quán)利要求10所述的方法,其特征在于,所述幀是語(yǔ)音幀。
14.如權(quán)利要求10所述的方法,其特征在于,所述幀是線性預(yù)測(cè)剩余的幀。
15.如權(quán)利要求10所述的方法,其特征在于,所述生成步驟包含去量化與所述原型有關(guān)的多個(gè)量化相位參數(shù),以生成多個(gè)線性相移值。
16.如權(quán)利要求12所述的方法,其特征在于,它還包含這樣一個(gè)步驟,即,去量化與所述原型有關(guān)的多個(gè)幅度量化參數(shù),以生成多個(gè)去量化的幅度參數(shù),其中,所述標(biāo)識(shí)步驟包括根據(jù)多個(gè)去量化的幅度參數(shù)來(lái)標(biāo)識(shí)頻帶。
17.如權(quán)利要求10所述的方法,其特征在于,它還包含這樣一些步驟,即,將所述合成的相位矢量與和所述原型有關(guān)的多個(gè)幅度參數(shù)組合起來(lái),以生成一個(gè)組合矢量,并計(jì)算所述組合矢量的反離散傅里葉級(jí)數(shù),以生成所述原型的重建版本。
18.一種處理語(yǔ)音編碼器中幀的原型的方法,其特征在于,它包括以下步驟生成與所述原型有關(guān)的多個(gè)循環(huán)旋轉(zhuǎn)值;生成多個(gè)頻帶中的多個(gè)帶通波形,所述多個(gè)帶通波形與一基準(zhǔn)原型的多個(gè)相位參數(shù)有關(guān);以及根據(jù)多個(gè)循環(huán)旋轉(zhuǎn)值,修改所述多個(gè)帶通波形。
19.如權(quán)利要求18所述的方法,其特征在于,它還包含這樣一個(gè)步驟,即,標(biāo)識(shí)在其中執(zhí)行所述生成步驟的頻帶。
20.如權(quán)利要求18所述的方法,其特征在于,所述幀是語(yǔ)音幀。
21.如權(quán)利要求18所述的方法,其特征在于,所述幀是線性預(yù)測(cè)剩余的幀。
22.如權(quán)利要求18所述的方法,其特征在于,所述生成步驟包括使與所述原型有關(guān)的多個(gè)量化相位參數(shù)去量化,以生成所述多個(gè)循環(huán)旋轉(zhuǎn)值。
23.如權(quán)利要求19所述的方法,其特征在于,使與所述原型有關(guān)的多個(gè)幅度量化參數(shù)去量化,以生成多個(gè)去量化的幅度參數(shù),其中,所述標(biāo)識(shí)步驟包括根據(jù)所述多個(gè)去量化幅度參數(shù)來(lái)標(biāo)識(shí)頻帶。
24.如權(quán)利要求23所述的方法,其特征在于,所述生成步驟包括以下步驟計(jì)算所述基準(zhǔn)原型的離散傅里葉級(jí)數(shù)系數(shù),把所述離散傅里葉級(jí)數(shù)系數(shù)分解成所述基準(zhǔn)原型的幅度矢量和相位矢量,將所述相位矢量和多個(gè)去量化的幅度參數(shù)組合起來(lái),并計(jì)算所述相位矢量的反離散傅里葉級(jí)數(shù),以生成所述多個(gè)帶通波形。
25.如權(quán)利要求18所述的方法,其特征在于,它還包含這樣一個(gè)步驟,即,將所述多個(gè)修改的帶通波形求和,以生成所述原型的重建版本。
26.一種語(yǔ)音編碼器,其特征在于,它包括用來(lái)生成幀的基準(zhǔn)原型的多個(gè)相位參數(shù)的裝置;用來(lái)生成當(dāng)前幀的當(dāng)前原型的多個(gè)相位參數(shù)的裝置;以及在多個(gè)頻帶中使所述當(dāng)前原型的所述相位參數(shù)與所述基準(zhǔn)原型的所述相位參數(shù)相關(guān)聯(lián)的裝置。
27.如權(quán)利要求26所述的語(yǔ)音編碼器,其特征在于,所述生成裝置包括計(jì)算所述基準(zhǔn)原型的離散傅里葉級(jí)數(shù)系數(shù)的裝置,以及把所述離散傅里葉級(jí)數(shù)系數(shù)分解成所述基準(zhǔn)原型的幅度矢量和相位矢量的裝置,并且其中,所述生成裝置包括計(jì)算所述當(dāng)前原型的離散傅里葉級(jí)數(shù)系數(shù)的裝置以及把所述離散傅里葉級(jí)數(shù)系數(shù)分解成所述當(dāng)前原型的幅度矢量和相位矢量的裝置。
28.如權(quán)利要求26所述的語(yǔ)音編碼器,其特征在于,它還包含用來(lái)標(biāo)識(shí)所述多個(gè)頻帶的裝置。
29.如權(quán)利要求26所述的語(yǔ)音編碼器,其特征在于,所述當(dāng)前幀是一語(yǔ)音幀。
30.如權(quán)利要求26所述的語(yǔ)音編碼器,其特征在于,所述當(dāng)前幀是一個(gè)線性預(yù)測(cè)剩余的幀。
31.如權(quán)利要求26所述的語(yǔ)音編碼器,其特征在于,所述關(guān)聯(lián)裝置生成所述當(dāng)前原型的多個(gè)最佳線性相移值。
32.如權(quán)利要求26所述的語(yǔ)音編碼器,其特征在于,所述關(guān)聯(lián)裝置生成所述當(dāng)前原型的多個(gè)最佳循環(huán)旋轉(zhuǎn)值。
33.如權(quán)利要求31所述的語(yǔ)音編碼器,其特征在于,它還包含用來(lái)使所述線性相移值量化的裝置,以及用來(lái)使所述當(dāng)前原型的多個(gè)幅度參數(shù)量化的裝置。
34.如權(quán)利要求32所述的語(yǔ)音編碼器,其特征在于,它還包含用來(lái)使所述循環(huán)旋轉(zhuǎn)值量化的裝置,以及用來(lái)使所述當(dāng)前原型的多個(gè)幅度參數(shù)量化的裝置。
35.如權(quán)利要求26所述的語(yǔ)音編碼器,其特征在于,所述語(yǔ)音編碼器駐留于無(wú)線通信系統(tǒng)的用戶單元中。
36.一種語(yǔ)音編碼器,其特征在于,它包括用來(lái)生成幀的基準(zhǔn)原型的多個(gè)相位參數(shù)的裝置;用來(lái)生成與當(dāng)前幀的當(dāng)前原型有關(guān)的多個(gè)線性相移值的裝置;以及用來(lái)在多個(gè)頻帶上合成所述相位參數(shù)和所述線性相移值的相位矢量的裝置。
37.如權(quán)利要求36所述的語(yǔ)音編碼器,其特征在于,所述生成裝置包括用來(lái)計(jì)算所述基準(zhǔn)原型的離散傅里葉級(jí)數(shù)系數(shù)的裝置,以及用來(lái)把所述離散傅里葉級(jí)數(shù)系數(shù)分解成所述基準(zhǔn)原型的幅度矢量和相位矢量的裝置。
38.如權(quán)利要求36所述的語(yǔ)音編碼器,其特征在于,它還包含用來(lái)標(biāo)識(shí)所述多個(gè)頻帶的裝置。
39.如權(quán)利要求36所述的語(yǔ)音編碼器,其特征在于,所述當(dāng)前幀是一個(gè)語(yǔ)音幀。
40.如權(quán)利要求36所述的語(yǔ)音編碼器,其特征在于,所述當(dāng)前幀是一個(gè)線性預(yù)測(cè)剩余的幀。
41.如權(quán)利要求36所述的語(yǔ)音編碼器,其特征在于,所述生成裝置包括用來(lái)使與所述當(dāng)前原型有關(guān)的多個(gè)量化相位參數(shù)去量化以生成多個(gè)線性相移值的裝置。
42.如權(quán)利要求38所述的語(yǔ)音編碼器,其特征在于,它還包含用來(lái)使與所述當(dāng)前原型有關(guān)的多個(gè)幅度量化參數(shù)去量化以生成多個(gè)去量化的幅度參數(shù)的裝置,其中,所述標(biāo)識(shí)手段包括用來(lái)根據(jù)多個(gè)去量化的幅度參數(shù)標(biāo)識(shí)多個(gè)頻帶的裝置。
43.如權(quán)利要求36所述的語(yǔ)音編碼器,其特征在于,它還包含用來(lái)將所述合成的相位矢量與和所述當(dāng)前原型有關(guān)的多個(gè)幅度參數(shù)組合起來(lái)以生成組合的矢量的裝置,以及用來(lái)計(jì)算所述組合的矢量的反離散傅里葉級(jí)數(shù)以生成所述當(dāng)前原型的重建版本的裝置。
44.如權(quán)利要求36所述的語(yǔ)音編碼器,其特征在于,所述語(yǔ)音編碼器駐留于無(wú)線通信系統(tǒng)的用戶單元中。
45.一種語(yǔ)音編碼器,其特征在于,它包括用來(lái)生成與當(dāng)前幀的當(dāng)前原型有關(guān)的多個(gè)循環(huán)旋轉(zhuǎn)值的裝置;用來(lái)在多個(gè)頻帶中生成多個(gè)帶通波形的裝置,所述多個(gè)帶通波形與幀的基準(zhǔn)原型的多個(gè)相位參數(shù)有關(guān);以及用來(lái)根據(jù)多個(gè)循環(huán)旋轉(zhuǎn)值修改所述多個(gè)帶通波形的裝置。
46.如權(quán)利要求45所述的語(yǔ)音編碼器,其特征在于,它還包含用來(lái)標(biāo)識(shí)所述多個(gè)頻帶的裝置。
47.如權(quán)利要求45所述的語(yǔ)音編碼器,其特征在于,所述當(dāng)前幀是一個(gè)語(yǔ)音幀。
48.如權(quán)利要求45所述的語(yǔ)音編碼器,其特征在于,所述當(dāng)前幀是一個(gè)線性預(yù)測(cè)剩余的幀。
49.如權(quán)利要求45所述的語(yǔ)音編碼器,其特征在于,所述生成裝置包括用來(lái)使與所述當(dāng)前原型有關(guān)的多個(gè)量化相位參數(shù)去量化從而生成多個(gè)循環(huán)旋轉(zhuǎn)值的裝置。
50.如權(quán)利要求46所述的語(yǔ)音編碼器,其特征在于,它還包含用來(lái)使與所述當(dāng)前原型有關(guān)的多個(gè)幅度量化參數(shù)去量化從而生成多個(gè)去量化的幅度參數(shù)的裝置,其中,所述標(biāo)識(shí)裝置包括用來(lái)根據(jù)所述多個(gè)去量化的幅度參數(shù)標(biāo)識(shí)頻帶的裝置。
51.如權(quán)利要求50所述的語(yǔ)音編碼器,其特征在于,所述生成裝置包括用來(lái)計(jì)算所述基準(zhǔn)原型的離散傅里葉級(jí)數(shù)系數(shù)的裝置,用來(lái)把所述離散傅里葉級(jí)數(shù)系數(shù)分解成所述基準(zhǔn)原型的幅度矢量和相位矢量的裝置,用來(lái)將所述相位矢量和所述多個(gè)去量化幅度參數(shù)組合起來(lái)的裝置,以及用來(lái)計(jì)算所述相位矢量的反離散傅里葉級(jí)數(shù)以生成所述多個(gè)帶通波形的裝置。
52.如權(quán)利要求45所述的語(yǔ)音編碼器,其特征在于,它還包含用來(lái)將所述多個(gè)修改的帶通波形求和以生成所述當(dāng)前原型的重建版本的裝置。
53.如權(quán)利要求45所述的語(yǔ)音編碼器,其特征在于,所述語(yǔ)音編碼器駐留于無(wú)線通信系統(tǒng)的用戶單元中。
54.一種語(yǔ)音編碼器,其特征在于,它包括配制成從正由所述語(yǔ)音編碼器處理的當(dāng)前幀析取當(dāng)前原型的原型析取器;以及耦合到所述原型析取器并配置成生成幀的基準(zhǔn)原型的多個(gè)相位參數(shù)、生成當(dāng)前所述原型的多個(gè)相位參數(shù)以及在多個(gè)頻帶中使所述當(dāng)前原型的相位參數(shù)和所述基準(zhǔn)原型的相位參數(shù)相關(guān)聯(lián)的原型量化器。
55.如權(quán)利要求54所述的語(yǔ)音編碼器,其特征在于,所述原型量化器進(jìn)一步配置成計(jì)算所述基準(zhǔn)原型的離散傅里葉級(jí)數(shù)系數(shù)、把所述離散傅里葉級(jí)數(shù)系數(shù)分解成所述基準(zhǔn)原型的幅度矢量和相位矢量、計(jì)算所述當(dāng)前原型的離散傅里葉級(jí)數(shù)系數(shù)以及把所述離散傅里葉級(jí)數(shù)系數(shù)分解成所述當(dāng)前原型的幅度矢量和相位矢量。
56.如權(quán)利要求54所述的語(yǔ)音編碼器,其特征在于,所述原型量化器進(jìn)一步配置成標(biāo)識(shí)所述多個(gè)頻帶。
57.如權(quán)利要求54所述的語(yǔ)音編碼器,其特征在于,所述當(dāng)前幀是一個(gè)語(yǔ)音幀。
58.如權(quán)利要求54所述的語(yǔ)音編碼器,其特征在于,所述當(dāng)前幀是一個(gè)線性預(yù)測(cè)剩余的幀。
59.如權(quán)利要求54所述的語(yǔ)音編碼器,其特征在于,所述原型量化器進(jìn)一步配置成生成所述當(dāng)前原型的多個(gè)最佳線性相移值。
60.如權(quán)利要求54所述的語(yǔ)音編碼器,其特征在于,所述原型量化器進(jìn)一步配置成生成所述當(dāng)前原型的多個(gè)最佳循環(huán)旋轉(zhuǎn)值。
61.如權(quán)利要求59所述的語(yǔ)音編碼器,其特征在于,所述原型量化器進(jìn)一步配置成使所述線性相移值量化,并使所述當(dāng)前原型的多個(gè)幅度參數(shù)量化。
62.如權(quán)利要求60所述的語(yǔ)音編碼器,其特征在于,所述原型量化器進(jìn)一步配置成使所述循環(huán)旋轉(zhuǎn)值量化,并使所述當(dāng)前原型的多個(gè)幅度參數(shù)量化。
63.如權(quán)利要求54所述的語(yǔ)音編碼器,其特征在于,所述語(yǔ)音編碼器駐留于無(wú)線通信系統(tǒng)的用戶單元中。
64.一種語(yǔ)音編碼器,其特征在于,它包括配制成從正由所述語(yǔ)音編碼器處理的當(dāng)前幀中析取當(dāng)前原型的原型析取器;以及耦合到所述原型析取器并配置成生成幀的基準(zhǔn)原型的多個(gè)相位參數(shù)、生成與所述當(dāng)前原型有關(guān)的多個(gè)線性相移值以及在多個(gè)頻帶上從所述相位參數(shù)和所述線性相移值合成相位矢量的原型量化器。
65.如權(quán)利要求64所述的語(yǔ)音編碼器,其特征在于,所述原型量化器進(jìn)一步配置成計(jì)算所述基準(zhǔn)原型的離散傅里葉級(jí)數(shù)系數(shù),并把所述離散傅里葉級(jí)數(shù)系數(shù)分解成所述基準(zhǔn)原型的幅度矢量和相位矢量。
66.如權(quán)利要求64所述的語(yǔ)音編碼器,其特征在于,所述原型量化器進(jìn)一步配置成標(biāo)識(shí)所述多個(gè)頻帶。
67.如權(quán)利要求64所述的語(yǔ)音編碼器,其特征在于,所述當(dāng)前幀是一個(gè)語(yǔ)音幀。
68.如權(quán)利要求64所述的語(yǔ)音編碼器,其特征在于,所述當(dāng)前幀是一個(gè)線性預(yù)測(cè)剩余的幀。
69.如權(quán)利要求64所述的語(yǔ)音編碼器,其特征在于,所述原型量化器進(jìn)一步配置成使與所述當(dāng)前原型有關(guān)的多個(gè)量化相位參數(shù)去量化以生成多個(gè)線性相移值。
70.如權(quán)利要求66所述的語(yǔ)音編碼器,其特征在于,所述原型量化器進(jìn)一步配置成使與所述當(dāng)前原型有關(guān)的多個(gè)幅度量化參數(shù)去量化以生成多個(gè)去量化幅度參數(shù),并且根據(jù)去量化的幅度參數(shù)識(shí)別所述多個(gè)頻帶。
71.如權(quán)利要求64所述的語(yǔ)音編碼器,其特征在于,所述原型量化器進(jìn)一步配置成將所述相位矢量與和所述當(dāng)前原型有關(guān)的多個(gè)幅度參數(shù)組合起來(lái)以生成組合矢量,并計(jì)算所述組合矢量的反離散傅里葉級(jí)數(shù)以生成所述當(dāng)前原型的重建版本。
72.如權(quán)利要求64所述的語(yǔ)音編碼器,其特征在于,所述語(yǔ)音編碼器駐留于無(wú)線通信系統(tǒng)的用戶單元中。
73.一種語(yǔ)音編碼器,它包括配置成從正由所述語(yǔ)音編碼器處理的當(dāng)前幀析取當(dāng)前原型的原型析取器;以及耦合到所述原型析取器并配置成生成與所述當(dāng)前原型有關(guān)的多個(gè)循環(huán)旋轉(zhuǎn)值、在多個(gè)頻帶中生成多個(gè)帶通波形,所述多個(gè)帶通波形與幀的基準(zhǔn)原型的多個(gè)相位參數(shù)有關(guān),并根據(jù)所述多個(gè)循環(huán)旋轉(zhuǎn)值修改多個(gè)帶通波形的原型量化器。
74.如權(quán)利要求73所述的語(yǔ)音編碼器,其特征在于,所述原型量化器進(jìn)一步配置成標(biāo)識(shí)所述多個(gè)頻帶。
75.如權(quán)利要求73所述的語(yǔ)音編碼器,其特征在于,所述當(dāng)前幀是一個(gè)語(yǔ)音幀。
76.如權(quán)利要求73所述的語(yǔ)音編碼器,其特征在于,所述當(dāng)前幀是一個(gè)線性預(yù)測(cè)剩余的幀。
77.如權(quán)利要求73所述的語(yǔ)音編碼器,其特征在于,所述原型量化器進(jìn)一步配置成使與所述當(dāng)前原型有關(guān)的多個(gè)量化相位參數(shù)去量化,以生成多個(gè)循環(huán)旋轉(zhuǎn)值
78.如權(quán)利要求74所述的語(yǔ)音編碼器,其特征在于,所述原型量化器進(jìn)一步配置成使與所述當(dāng)前原型有關(guān)的多個(gè)幅度量化參數(shù)去量化,以生成多個(gè)去量化的幅度參數(shù),并根據(jù)所述多個(gè)去量化的幅度參數(shù)來(lái)標(biāo)識(shí)頻帶。
79.如權(quán)利要求78所述的語(yǔ)音編碼器,其特征在于,所述原型量化器進(jìn)一步配置成計(jì)算所述基準(zhǔn)原型的離散傅里葉級(jí)數(shù)系數(shù)、把所述離散傅里葉級(jí)數(shù)系數(shù)分解成所述基準(zhǔn)原型的幅度矢量和相位矢量、將所述相位矢量和多個(gè)去量化的幅度參數(shù)組合起來(lái),并計(jì)算所述相位矢量的反離散傅里葉級(jí)數(shù),以生成多個(gè)帶通波形。
80.如權(quán)利要求73所述的語(yǔ)音編碼器,其特征在于,所述原型量化器進(jìn)一步配置成將多個(gè)修改的帶通波形求和,以生成所述當(dāng)前原型的重建版本。
81.如權(quán)利要求73所述的語(yǔ)音編碼器,其特征在于,所述語(yǔ)音編碼器駐留于無(wú)線通信系統(tǒng)的用戶單元中。
全文摘要
一種用來(lái)對(duì)相位譜信息進(jìn)行子抽樣的方法和設(shè)備,包括用來(lái)通過(guò)使用一幀的原型的相位譜信息的智能子抽樣對(duì)該原型進(jìn)行分析和重建的語(yǔ)音編碼器。為分析原型,語(yǔ)音編碼器生成一基準(zhǔn)原型的相位參數(shù),生成一當(dāng)前原型的相位參數(shù),并使當(dāng)前原型的相位參數(shù)與基準(zhǔn)原型的相位參數(shù)在多個(gè)頻帶中相關(guān)。為用線性相移值重建原型,語(yǔ)音編碼器生成基準(zhǔn)原型的相位參數(shù),生成與原型相關(guān)的線性相移值集,并在多個(gè)頻帶上從相位參數(shù)和線性相移值相位失量。為用循環(huán)旋轉(zhuǎn)值重建原型,語(yǔ)音編碼器生成與原型有關(guān)的循環(huán)旋轉(zhuǎn)值集,生成多個(gè)頻帶中的帶通波型集,帶通波形與基準(zhǔn)原型的相位參數(shù)有關(guān),并根據(jù)循環(huán)旋轉(zhuǎn)值修改帶通波形。
文檔編號(hào)G10L11/00GK1375095SQ00813001
公開日2002年10月16日 申請(qǐng)日期2000年7月18日 優(yōu)先權(quán)日1999年7月19日
發(fā)明者S·曼祖那什 申請(qǐng)人:高通股份有限公司