用于編碼和解碼寬帶語音信號(hào)的方法、裝置和系統(tǒng)的制作方法

文檔序號(hào)：2830577閱讀：284來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：：用于編碼和解碼寬帶語音信號(hào)的方法、裝置和系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
：符合本發(fā)明的方法、裝置和系統(tǒng)涉及編碼和解碼寬帶語音信號(hào)，而且更具體地，涉及利用添加有阻尼因子的匹配追蹤正弦模型來編碼和解碼寬帶語音信號(hào)。
背景技術(shù)：
：語音通信的應(yīng)用領(lǐng)域的多樣化以及網(wǎng)絡(luò)的數(shù)據(jù)傳輸率的增加已經(jīng)導(dǎo)致對(duì)高質(zhì)量語音通信的需求的增長(zhǎng)。為了滿足高質(zhì)量語音通信的需求，需要傳輸具有50-7000赫茲帶寬的寬帶語音信號(hào)，其與300-3400赫茲的現(xiàn)有電話頻帶相比在諸如自然性和清晰性的多種方面具有更優(yōu)越的性能，而為了有效地壓縮寬帶語音信號(hào)，期望開發(fā)新的寬帶語音壓縮器。特別地，數(shù)字通信使用分組交換方法用于集成語音通信和數(shù)據(jù)通信。然而，分組交換方法可能引起信道擁塞，導(dǎo)致分組丟失和聲音質(zhì)量低劣。雖然可以使用隱藏?fù)p壞分組的技術(shù)以便解決這些問題，但是該技術(shù)并非這些問題的長(zhǎng)期解決方案。因此，最近的語音壓縮器已經(jīng)嘗試通過利用擴(kuò)充功能減少通信量來解決這些問題。擴(kuò)充功能允許通過在各種級(jí)中形成語音數(shù)據(jù)、并在將語音數(shù)據(jù)分組化時(shí)根據(jù)擁塞的等級(jí)調(diào)整所傳輸?shù)牡募?jí)的量而在給定的信道環(huán)境下執(zhí)行最佳通信。擴(kuò)充功能用于借助分組網(wǎng)絡(luò)的語音通信，而且可以根據(jù)網(wǎng)絡(luò)狀態(tài)提供最佳通信。而且，如果在經(jīng)由具有不同的位率的信道發(fā)送語音分組時(shí)提供擴(kuò)充功能，則可以執(zhí)行無串接(tandem-free)通信，借以通過調(diào)整傳輸級(jí)來發(fā)送語音分組而不^f吏用雙編碼。因此，已經(jīng)開展關(guān)于利用擴(kuò)充功能的語音編碼和解碼的研究，而且更詳細(xì)地，利用正弦合成模型編碼和解碼16位線性脈沖編碼調(diào)制(PCM)格式語音信號(hào)。正弦模型是以低位率編碼語音信號(hào)的高效率技術(shù)，而且在最近用于語音轉(zhuǎn)換、聲音質(zhì)量改善、以及低數(shù)據(jù)率音頻編碼。由于對(duì)背景噪聲和非語音信號(hào)的壯健性，正弦模型用于其中對(duì)視頻信號(hào)、生物信號(hào)等執(zhí)行分析和合成的數(shù)字信號(hào)處理的領(lǐng)域。然而，在用于將語音信號(hào)建模的現(xiàn)有技術(shù)正弦模型中，假定在單個(gè)幀中基頻的整數(shù)倍中正弦參數(shù)是恒定的。由于該假設(shè)，當(dāng)由解碼器端合成具有時(shí)間變化特性的語音信號(hào)時(shí)，時(shí)間變化特性失真，而且出現(xiàn)幀之間的不連續(xù)性。為了解決這些問題，解碼器端使用參數(shù)內(nèi)插方法或波形內(nèi)插方法。然而，參數(shù)內(nèi)插方法或波形內(nèi)插方法引起語音波形的修改，導(dǎo)致非穩(wěn)定時(shí)段期間波形的失真。特別地，因肇始(onset)或消退(offset)轉(zhuǎn)變持續(xù)時(shí)間中語音信號(hào)的波形失真而發(fā)生聲音質(zhì)量的顯著下降。此外，已經(jīng)由具有低傳輸率的語音編碼器使用的現(xiàn)有技術(shù)諧波編碼方法利用峰檢測(cè)方法來檢測(cè)諧波幅度，峰檢測(cè)方法用于做成零相位并執(zhí)行快速傅立葉變換(FFT)以便防止相位傳輸。然而，現(xiàn)有技術(shù)諧波編碼方法的局限在于，由于復(fù)雜度和導(dǎo)通(on)數(shù)據(jù)率的限制而必須應(yīng)用小于512個(gè)點(diǎn)的頻率分辨率。頻率分辨率的下降和相位參數(shù)的傳輸限制妨礙了正確的諧波峰才企測(cè)，作為結(jié)果，語音編碼器的性能因合成語音信號(hào)的脈沖位置的延遲以及幀之間的相位差而下降。
發(fā)明內(nèi)容技術(shù)方案本發(fā)明的示范性實(shí)施例通過改善現(xiàn)有正弦模型并減少量化誤差以便編碼寬帶語音信號(hào)而提供用于編碼寬帶語音信號(hào)并以良好的性能支持信噪比(SNR)可擴(kuò)展性的方法和系統(tǒng)。有益效果根據(jù)本發(fā)明的示范性實(shí)施例的編碼/解碼寬帶語音信號(hào)的方法有利于高聲音質(zhì)量和低復(fù)雜度，因?yàn)槠浣鉀Q現(xiàn)有正弦模型中出現(xiàn)的幀之間的不連續(xù)性以及語音波形失真的問題，并將量化誤差最小化。此外，通過提供SNR擴(kuò)展功能，可以執(zhí)行給定信道環(huán)境下的最佳通信。通過參照附圖詳細(xì)描述其示范性實(shí)施例，本發(fā)明的以上和其它方面將變得更加顯而易見，其中圖1是才艮據(jù)本發(fā)明的示范性實(shí)施例的寬帶語音編碼和解碼系統(tǒng)的框圖2是才艮據(jù)本發(fā)明的示范性實(shí)施例的正弦分析器的框圖'；圖3A和3B是示出根據(jù)本發(fā)明的示范性實(shí)施例的正弦幅度和相位搜索單元已經(jīng)首次操作其呈環(huán)形配置的內(nèi)部塊時(shí)的信號(hào)波形和幅度的曲線圖；圖4A和4B是示出根據(jù)本發(fā)明的示范性實(shí)施例的正弦幅度和相位搜索單元已經(jīng)第二次操作其呈環(huán)形配置的內(nèi)部塊時(shí)的信號(hào)波形和幅度的曲線圖；圖5A和5B是根據(jù)本發(fā)明的示范性實(shí)施例的譜幅度量化器的編碼器端和解碼器端的框圖；以及圖6是才艮據(jù)本發(fā)明的示范性實(shí)施例的相位量化器的框圖。具體實(shí)施方式最佳模式根據(jù)本發(fā)明的一個(gè)方面，提供一種編碼和解碼寬帶語音信號(hào)的方法，該方法包括從寬帶語音信號(hào)中提取線性預(yù)測(cè)系數(shù)(LPC);輸出通過利用LPC從寬帶語音信號(hào)中去除包絡(luò)(envelope)而獲得的線性預(yù)測(cè)(LP)殘留信號(hào)；音調(diào)(pitch)-搜索LP殘留信號(hào)的譜；通過向匹配追蹤算法添加阻尼因子來提取LP殘留信號(hào)的譜幅度和相位，鐠幅度和相位與阻尼因子對(duì)應(yīng)；從所提取的譜幅度和相位當(dāng)中獲取其中將LP殘留信號(hào)的功率值最小化的第一譜幅度和第一相位；量化第一譜幅度和第一相位；以及解碼寬帶語音信號(hào)。所述阻尼因子可以包括LP殘留信號(hào)的譜幅度阻尼因子和頻率阻尼因子。所述提取LP殘留信號(hào)的鐠幅度和相位可以包括相對(duì)于利用頻率阻尼因子通過音調(diào)-搜索LP殘留信號(hào)獲得的每個(gè)頻率設(shè)置多個(gè)候選頻率；通過相對(duì)于通過音調(diào)-搜索獲得的每個(gè)頻率從候選頻率當(dāng)中獲得其中將誤差值最小化的頻率和相位來計(jì)算正弦字典值，并累加相對(duì)于通過音調(diào)-搜索獲得的每個(gè)頻率計(jì)算的正弦字典值；通過從作為目標(biāo)信號(hào)的LP殘留信號(hào)中減去所累加的正弦字典值來產(chǎn)生最終殘留信號(hào)；以及^r測(cè)與其中相對(duì)于通過音調(diào)-搜索獲得的每個(gè)頻率將最終殘留信號(hào)的功率值最小化的第一譜幅度和第一相位對(duì)應(yīng)的頻率阻尼因子。所述設(shè)置候選頻率的步驟可以包括相對(duì)于與LP殘留信號(hào)中基頻的n倍對(duì)應(yīng)的頻率利用頻率阻尼因子設(shè)置與基頻的n-1倍對(duì)應(yīng)的頻率和與基頻的n+l倍對(duì)應(yīng)的頻率之間的候選頻率。累加的正弦字典的數(shù)量可以與寬帶語音信號(hào)的譜的數(shù)量相等?？梢岳玫谝蛔V幅度和第一相位來獲得和量化譜幅度阻尼因子?？梢岳秒x散余弦變換(DCT)量化第一譜幅度。量化第一相位的方法可以包括通過獲得第一相位與^v第一相位產(chǎn)生的第一碼本相位之間的差、將所述差乘以與第一相位對(duì)應(yīng)的包絡(luò)值、并將每個(gè)差加到各個(gè)相乘結(jié)果來獲得距離；^r測(cè)和輸出允許將距離最小化的第一碼本相位；通過調(diào)整從第一碼本相位與第一相位之間的差產(chǎn)生的相位誤差向量來產(chǎn)生第二相位，并通過獲得第二相位與從第二相位產(chǎn)生的第二碼本相位之間的差、將所述差乘以與第二相位對(duì)應(yīng)的包絡(luò)值、并將所述差加到各個(gè)相乘結(jié)果來獲得距離；以及檢測(cè)和輸出允許將距離最小化的第二碼本相位。可以通過根據(jù)各種傳輸率借助模式信息確定位分配來量化阻尼因子、譜幅度、相位和音調(diào)。所述解碼寬帶語音信號(hào)的步驟可以包括解碼經(jīng)量化的第一譜幅度和經(jīng)量化的第一相位；解碼經(jīng)量化的阻尼因子；利用第一譜幅度、第一相位、阻尼因子、音調(diào)值其中至少一個(gè)來合成LP殘留信號(hào)；以及從LP殘留信號(hào)解碼寬帶語音信號(hào)。根據(jù)本發(fā)明的另一個(gè)方面，提供一種用于在寬帶語音編碼系統(tǒng)中編碼寬帶語音信號(hào)的裝置，該裝置包括線性預(yù)測(cè)系數(shù)(LPC)分析器，其從寬帶語音信號(hào)中提取LPC;LPC逆濾波器，其輸出通過利用LPC從寬帶語音信號(hào)中去除包絡(luò)而獲得的線性預(yù)測(cè)(LP)殘留信號(hào)；音調(diào)搜索單元，其音調(diào)-搜索LP殘留信號(hào)的i普；正弦分析器，其通過向匹配追蹤算法添加阻尼因子來提取LP殘留信號(hào)的與阻尼因子對(duì)應(yīng)的譜幅度和相位，并從所提取的譜幅度和相位當(dāng)中獲得其中將LP殘留信號(hào)的功率值最小化的第一譜幅度和第一相位；以及相位和譜幅度量化器，其量化第一譜幅度和第一相位。所述正弦分析器可以包括頻率阻尼因子施加單元，其相對(duì)于利用頻率阻尼因子通過音調(diào)-搜索LP殘留信號(hào)獲得的每個(gè)頻率設(shè)置多個(gè)候選頻率；誤差最小化單元，其相對(duì)于通過音調(diào)-搜索獲得的每個(gè)頻率從候選頻率當(dāng)中獲得其中將誤差值最小化的頻率和相位；字典分量產(chǎn)生器，其借助從誤差最小化單元輸出的頻率和相位獲得正弦字典值；累加器，其從字典分量產(chǎn)生器接收相對(duì)于通過音調(diào)-搜索獲得的每個(gè)頻率產(chǎn)生的正弦字典值，并累加正弦字典值；計(jì)算器，其通過從LP殘留信號(hào)中減去所累加的正弦字典值來產(chǎn)生最終殘留信號(hào)；以及阻尼因子選擇器，其檢測(cè)與其中相對(duì)于通過音調(diào)-搜索獲得的每個(gè)頻率將最終殘留信號(hào)的功率值最小化的第一譜幅度和第一相位對(duì)應(yīng)的頻率阻尼因子。根據(jù)本發(fā)明的另一個(gè)方面，提供一種寬帶語音編碼和解碼系統(tǒng)，包括寬帶語音編碼裝置，其通過利用從寬帶語音信號(hào)中提取的線性預(yù)測(cè)系數(shù)(LPC)從寬帶語音信號(hào)中去除包絡(luò)而獲得線性預(yù)測(cè)(LP)殘留信號(hào)，通過向匹配追蹤算法添加阻尼因子來提取LP殘留信號(hào)的與阻尼因子對(duì)應(yīng)的譜幅度和相位，從所提取的譜幅度和相位當(dāng)中獲得其中將LP殘留信號(hào)的功率值最小化的第一譜幅度和第一相位，并量化第一譜幅度和第一相位；以及寬帶語音解碼裝置，其通過解碼經(jīng)量化的第一譜幅度、經(jīng)量化的第一相位和經(jīng)量化的阻尼因子并合成LP殘留信號(hào)來解碼寬帶語音信號(hào)。發(fā)明模式參照用于例示本發(fā)明的優(yōu)選實(shí)施例的附圖以便充分理解本發(fā)明、其優(yōu)點(diǎn)、以及由本發(fā)明一般概念的實(shí)施實(shí)現(xiàn)的目的。以下，將通過參照本發(fā)明的示范性實(shí)施例來詳細(xì)描述本發(fā)明概念。附圖中，類似的引用數(shù)字指代類似的元素。圖1是根據(jù)本發(fā)明的示范性實(shí)施例的寬帶語音編碼和解碼系統(tǒng)的框圖。參照?qǐng)D1,所述寬帶語音編碼和解碼系統(tǒng)包括寬帶語音編碼器IOO和寬帶語音解碼器200。寬帶語音編碼器100包括線性預(yù)測(cè)系數(shù)(LPC)分析器105、線性譜對(duì)(LSP)轉(zhuǎn)換器110、LSP內(nèi)插器113、LSP量化器115、感知加權(quán)濾波器120、LPC逆濾波器125、整數(shù)音調(diào)搜索單元130、正弦分析器140、分?jǐn)?shù)音調(diào)搜索單元150、阻尼因子向量量化器155、相位/譜幅度量化器160、音調(diào)量化器170、參數(shù)分配單元180、以及多路復(fù)用器(MUX)190。大約每20毫秒(即，每幀)將具有大約50赫茲至大約7000赫茲的寬帶寬的語音信號(hào)輸入到LPC分析器105、感知加權(quán)濾波器120和整數(shù)音調(diào)搜索單元130。LPC分析器105相對(duì)于每幀施加漢明窗口的輸入信號(hào)利用自相關(guān)方法輸出16階LPC參數(shù)。LSP轉(zhuǎn)換器110通過將時(shí)域中的LPC參數(shù)轉(zhuǎn)換為頻域中的LSP參數(shù)來減少位率。LSP內(nèi)插器113利用兩個(gè)子幀LPC濾波器內(nèi)插過去的LSP值，并通過將經(jīng)內(nèi)插的過去的LSP值轉(zhuǎn)換為L(zhǎng)PC而輸出2個(gè)子幀的2對(duì)LPC。LSP量化器115量化LSP參數(shù)。感知加權(quán)濾波器120接收寬帶語音信號(hào)和包含LPC參數(shù)的LPC，并利用被量化為適合人類聽覺的感知特性的LPC來修改寬帶語音信號(hào)。LPC逆用從LSP內(nèi)插器113輸出的LPC信號(hào)產(chǎn)生LP殘留信號(hào)。利用LP殘留信號(hào)確定音調(diào)，而且正弦分析器140利用其中向正弦建模添加阻尼因子的匹配追蹤算法執(zhí)行LP殘留信號(hào)的正弦建模。正弦分析器140通過基于從參數(shù)分配單元180輸入的信息將其中寬帶語音信號(hào)的譜幅度和相位是基頻的譜幅度和相位的整數(shù)倍的位置設(shè)置為參考點(diǎn)來執(zhí)行LP殘留信號(hào)的建模，并基于該建模獲得阻尼因子。即，正弦分析器140接收LP殘留信號(hào)并利用添加有阻尼因子的匹配追蹤正弦模型將LP殘留信號(hào)建模。相位/譜幅度量化器160利用離散余弦變換(DCT)量化LP殘留信號(hào)的語幅度，并利用循環(huán)特性量化LP殘留信號(hào)的相位。相位/譜幅度量化器160具有多級(jí)結(jié)構(gòu)。該情況下，譜幅度由量化器(未示出)利用DCT量化，相位由循環(huán)加權(quán)量化器(未示出)量化，而阻尼因子由向量量化器(未示出)量化。將參照下面圖2詳細(xì)描述由正弦分析器140用于提取阻尼因子的方法；而且將參照下面圖5和6詳細(xì)描述由正弦分析器140分析的譜幅度和相位的量化。音調(diào)搜索包括整數(shù)音調(diào)搜索和分?jǐn)?shù)音調(diào)搜索兩級(jí)。即，整數(shù)音調(diào)搜索單元130接收LP殘留信號(hào)和寬帶語音信號(hào)，并通過利用快速傅里葉變換(FFT)系數(shù)值的自相關(guān)近似值執(zhí)行整數(shù)音調(diào)搜索來獲得LP殘留信號(hào)的峰周期。分?jǐn)?shù)音調(diào)搜索單元150通過從音調(diào)值的近似值當(dāng)中獲得具有最大互相關(guān)值的音調(diào)值來執(zhí)行十進(jìn)制小數(shù)點(diǎn)基礎(chǔ)上的精細(xì)音調(diào)搜索。音調(diào)搜索方法使用其中利用FFT使用計(jì)算值計(jì)算自相關(guān)近似值的開環(huán)音調(diào)搜索。即，可以通過利用FFT獲得近似音調(diào)值、并從近似音調(diào)值當(dāng)中獲得具有最大互相關(guān)值的音調(diào)值來獲得正確的音調(diào)值。音調(diào)值由音調(diào)量化器170量化。MUX190將譜幅度、相位、阻尼因子、以及音調(diào)值的碼本索引分組化。碼本索引和經(jīng)量化的編碼被輸入到寬帶語音解碼器200，而寬帶語音解碼器200通過寬帶語音編碼器100的逆過程將經(jīng)編碼的寬帶語音信號(hào)解碼，并輸出經(jīng)解碼的寬帶語音信號(hào)。'即，寬帶語音解碼器200利用經(jīng)量化的第一諳幅度、經(jīng)量化的第一相位、經(jīng)量化的阻尼因子和經(jīng)量化的音調(diào)值合成LP殘留信號(hào)，并通過從合成的LP殘留信號(hào)中解碼經(jīng)編碼的寬帶語音信號(hào)來輸出寬帶信號(hào)。對(duì)于多級(jí)寬帶語音編碼器，將基本級(jí)設(shè)置為8Kbps,并通過向基本級(jí)添加具有4kbps、12Kbps和8Kbps的數(shù)據(jù)率的級(jí)來執(zhí)行編碼。于是，參數(shù)分配單元180根據(jù)信道狀態(tài)基于模式信息確定參數(shù)選擇和位分配，如下面表l中所示，并向正弦分析器140、阻尼因子向量量化器155、相位/譜幅度量化器160和音調(diào)量化器170提供關(guān)于參數(shù)選擇和位分配的每個(gè)細(xì)節(jié)的信息。每個(gè)級(jí)通過在添加有阻尼因子的正弦模型中建模與基頻相鄰的頻率來向基本級(jí)提供詳細(xì)的信息。表1示出根據(jù)32Kbps、24Kbps、12Kbps和8Kbps模式的參數(shù)的位分配。<table>tableseeoriginaldocumentpage12</column></row><table><table>tableseeoriginaldocumentpage13</column></row><table>現(xiàn)在將參照?qǐng)D2更詳細(xì)地描述使用其中由正弦分析器140添加有阻尼因子的匹配追蹤算法的正弦建模方法。本發(fā)明的示范性實(shí)施例通過借助給予一般正弦模型簡(jiǎn)單約束條件來獲取稱為'阻尼因子，的兩個(gè)傳輸參數(shù)(譜幅度阻尼因子^和頻率阻尼因子c，)而允許更高效率的建模。即，由于語音信號(hào)根據(jù)語音信號(hào)的特性而隨著可以預(yù)先確定的當(dāng)前幀與前一幀之間的相關(guān)而變換，所以將約束條件給予語音樣本之間的相關(guān)。在描述本發(fā)明的示范性實(shí)施例之前，現(xiàn)在將描述阻尼因子。阻尼因子表示當(dāng)前幀的參數(shù)與前一幀的參數(shù)的比率，而幀之間的譜的幅度和頻率由等式l表示。[數(shù)學(xué)式1](1)等式l中，々和W分別表示第A:幀的第/譜的幅度和頻率。即，當(dāng)前幀的相對(duì)于譜幅度和頻率的阻尼因子分別由^和cf表示。對(duì)利用匹配追蹤正弦模型分析的譜幅度和頻率進(jìn)行參數(shù)內(nèi)插以防止幀之間的不連續(xù)性，其中利用下面示出的等式2的第一行內(nèi)插譜幅度，并利用下面示出的等式3的第一行內(nèi)插相位。其中，可以利用鐠幅度阻尼因子g，由等式2的第二行表示通過對(duì)前一幀的譜幅度進(jìn)行內(nèi)插而合成的譜幅度，而且可以利用頻率阻尼因子cf和譜的相位改變率由等式3的第二行表示通過對(duì)前一幀的相位進(jìn)行內(nèi)插而合成的相位。W(2)《a=2iV等式2和3中，iV表示幀長(zhǎng)度。值a表示通過執(zhí)行前一幀的譜的相位的2階內(nèi)插而合成的譜的相位改變率，而且可以利用頻率阻尼因子cf由等式3表示。圖2是根據(jù)本發(fā)明的示范性實(shí)施例的正弦分析器140的框圖。參照?qǐng)D2，正弦分析器140包括正弦幅度/相位搜索單元143、頻率阻尼因子施加單元145、阻尼因子選擇器147和阻尼因子合成器149。由于在根據(jù)添加有阻尼因子的匹配追蹤正弦模型的特性執(zhí)行合成時(shí)利用譜幅度和頻率阻尼因子代替內(nèi)插，因而不需要額外的窗口塊。將LPC逆濾波器125(圖1中所示)輸出的LP殘留信號(hào)作為目標(biāo)信號(hào)r[w]輸入到正弦幅度/相位搜索單元143，并利用匹配追蹤算法搜索目標(biāo)信號(hào)r[w]的鐠幅度和相位。即，正弦幅度/相位搜索單元143集成在利用添加有阻尼因子的匹配追蹤正弦模型預(yù)測(cè)和合成參數(shù)時(shí)所使用的內(nèi)插方法。正弦幅度/相位搜索單元143包括計(jì)算器塊143a、誤差最小化塊143b、字典元素產(chǎn)生器塊143c和累加器塊143d,其呈環(huán)形配置依次彼此相互耦接。正弦幅度/相位搜索單元'143通過將語幅度阻尼因子gf固定為1來檢測(cè)與從頻率阻尼因子施加單元145輸入的頻率阻尼因子c;的每個(gè)候選對(duì)應(yīng)的鐠幅度和相位對(duì)。以下，將^f又描述這樣的狀態(tài)，其中將頻率阻尼因子c，固定為初始值，即，其中所檢測(cè)的頻率為基頻的倍數(shù)的部分。將LP殘留信號(hào)作為第一目標(biāo)信號(hào)r[w]輸入到正弦幅度/相位搜索單元143的計(jì)算器塊143a，而計(jì)算器塊143a向誤差最小化塊143b輸出跟第一目標(biāo)信號(hào)r["]與從累加器塊143d輸出的信號(hào)["]之間的差對(duì)應(yīng)的信號(hào)o["]作為新的目標(biāo)信號(hào)。該情況下，將從由整數(shù)音調(diào)搜索單元130和分?jǐn)?shù)音調(diào)搜索單元150找到的音調(diào)檢測(cè)到的基頻w。和新的目標(biāo)信號(hào)n[w]輸入到誤差最小化塊143b。誤差最小化塊143b利用新的目標(biāo)信號(hào)r,[/7]借助等式4搜索正弦字典的幅度和相位。幀尺寸「/Vb&=zk["〗-々cos(yir(4)其中，o表示第/目標(biāo)信號(hào)，而五/表示r/與第/正弦字典之間的均方誤差。如果/為0，則。等于LP殘留信號(hào)。如果如上所述假定^為1，則由等式2表示的合成譜幅度》與當(dāng)前幀的譜幅度4相同。誤差最小化塊143b利用等式5(如下所示)獲得其中將誤差￡/最小化的^和&。即，其中將誤差A(yù)最小化的A和《由等式5表示。、、爿,=一/2+6/2，《=-tan_幀尺寸-1幀尺寸-i幀尺寸-i幀尺寸-i》in2(《)》,(")cos(《)-》os》,(")sin(《)(5)幀尺寸-1幀尺寸-1幀尺寸-1楨尺寸-l^c。s2(《)藝sin2(《)—2]c。啦)sin(《)Zc。s(《)sin(《)rt=0w=0/7=0w=0幀尺寸-1幀尺寸-1幀尺寸-1幀尺寸-1》os2(《)Z。(如(《)-》os(《)sin(《)》,(")cos(e)。/—幀尺寸-1幀尺寸-1幀尺寸-l幀尺寸-1|>s2(《)|>iii2(《)-j]c。啦)sin(e,)Xc。s(《)sin(6077=0/7=0=0w=0這里，^和^分別是第/譜的幅度和相位。誤差最小化塊143b才艮據(jù)頻率阻尼因子cf的候選值確定&，并選擇其中將誤差五,最小化的^和(9,。該情況下，使用初始值作為cf，而且所檢測(cè)的頻率點(diǎn)是基頻的倍數(shù)。如上所述，誤差最小化塊143b向字典元素產(chǎn)生器塊143c輸出與第/語對(duì)應(yīng)的/*w。、A和S,而字典元素產(chǎn)生器塊143c產(chǎn)生由等式6表示的正弦字典《。<formula>formulaseeoriginaldocumentpage16</formula>等式6中，正弦字典《可以是與第A:幀中的第/譜對(duì)應(yīng)的時(shí)域波形。即，字典元素產(chǎn)生器塊143c借助輸出參數(shù)產(chǎn)生通過在時(shí)域中僅合成每個(gè)幀中的第/譜而獲得的時(shí)域波形《。累加器塊143d通過線性地累加《產(chǎn)生合成信號(hào)巧["]，即，直到第/合成信號(hào)產(chǎn)生的合成信號(hào)，如等式7中所示。[數(shù)學(xué)式7]幀尺寸-1丄，、巧["]=ZS4")cos(《("))(7)n=0/=1等式7中，￡表示通過將音調(diào)除以2獲得的整數(shù)，即，諧波的數(shù)量。當(dāng)累加器塊143d輸出合成信號(hào)5W時(shí)，計(jì)算器塊143a通過從目標(biāo)信號(hào)rM中減去合成信號(hào)巧M來產(chǎn)生新的目標(biāo)信號(hào)r,["]。最終，正弦幅度/相位搜索單元143合成從作為基頻的倍數(shù)的頻率中檢測(cè)的語幅度和相位。阻尼因子選擇器147根據(jù)每個(gè)頻率獲得最終殘留信號(hào)的功率值，選擇與最小功率值對(duì)應(yīng)的最佳參數(shù)，并向阻尼因子合成器149輸出最佳參數(shù)。阻尼因子合成器149利用通過重復(fù)匹配追蹤算法獲得的最佳參數(shù)合成LP殘留信號(hào)?，F(xiàn)在將參照?qǐng)D2至4B更詳細(xì)地描述才艮據(jù)本發(fā)明的示范性實(shí)施例的匹配追蹤算法。圖3A和3B是示出根據(jù)本發(fā)明的示范性實(shí)施例的正弦幅度/相位搜索單元143已經(jīng)首次梯:作其呈環(huán)形配置的內(nèi)部塊時(shí)的信號(hào)波形和幅度的曲線圖。圖3A示出根據(jù)本發(fā)明的示范性實(shí)施例的頻域中由字符a指示的作為目標(biāo)信號(hào)r["]的LP殘留信號(hào)的幅度、以及由字符b指示的從累加器塊143d輸出的第一合成信號(hào)5M的幅度。圖3B示出根據(jù)本發(fā)明的示范性實(shí)施例的頻域中由字符c指示的通過從目標(biāo)信號(hào)r[w]中減去合成信號(hào)5W而產(chǎn)生的新的目標(biāo)信號(hào)O["]的幅度。將作為第一目標(biāo)信號(hào)r["]的LP殘留信號(hào)輸入到正弦幅度/相位搜索單元143的計(jì)算器塊143a并提供給誤差最小化塊143b。同時(shí)，通過音調(diào)搜索將基頻^輸入到誤差最小化塊143b。'誤差最小化塊143b相對(duì)于第一目標(biāo)信號(hào)r["]利用如上面等式5中所示的最小化過程獲得基頻w。中的正弦幅度^和相位A。正弦幅度/相位搜索單元143相對(duì)于從頻率阻尼因子施加單元145輸出的^的候選值額外地根據(jù)c，的每個(gè)候選值檢測(cè)頻率、譜幅度和相位參數(shù)。現(xiàn)在將更詳細(xì)地描述正弦幅度/相位搜索單元143的相對(duì)于從頻率阻尼因子施加單元145輸出的cf的候選值的操作。誤差最小化塊143b利用從頻率阻尼因子施加單元145輸出的基頻w。和值a搜索能夠相對(duì)于(1-2a*")*w0、(1-a*")*w。、w0、(1+a*")*w0和(1+2a*")*w0中的每個(gè)頻率將誤差最小化的正弦幅度^和相位《。即，通過基于上面等式3中當(dāng)前幀與前一幀的基頻的差將"乘以(w=0、±1、士2)來設(shè)置五個(gè)候選頻率(l-2a*")*w0、(l-a*")*w。、w0、(1+"*")*0和(1+2"*")*%。例如，如果將阻尼因子a設(shè)置為0,則誤差最小化塊143b獲得能夠相對(duì)于基頻w。將誤差最小化的正弦幅度^和相位&。于是，利用上述方法，誤差最小化塊143b獲得能夠相對(duì)于(1-2a*n)*wQ、(1-a*")*wQ、w0、(l+W""w。和(l+2a^hw。中的每個(gè)頻率將誤差最小化的正弦幅度A和相位《，并向阻尼因子選擇器147提供與每個(gè)頻率對(duì)應(yīng)的一對(duì)正弦幅度和相位(^，《)。當(dāng)輸入正弦幅度A和相位《時(shí)，字典元素產(chǎn)生器塊143c產(chǎn)生由下面等式8表示的正弦字典信號(hào)《，并向累加器塊輸出正弦字典信號(hào)^。幀尺寸zv<=J^(w)*cos(l*w0*w+*3*l*w0(8)值"表示通過執(zhí)行前一幀的譜的相位的2階內(nèi)插而合成的譜的相位改變率，而且可以利用從頻率阻尼因子施加單元145輸入的頻率阻尼因子c，由上面等式3表示。于是，根據(jù)如上面等式3中所示的cf確定值a，并根據(jù)a計(jì)算檢測(cè)的頻率點(diǎn)，即，(l-2a*/)*w0、(1-fl*w)*w0、,(1+"*")、和(1+2")、。累加器塊通過線性地累加《產(chǎn)生合成信號(hào)5["](圖3A中的信號(hào)b)。該情況下，累加器塊143d僅產(chǎn)生《。累加器塊143d輸出通過在時(shí)域中合成^產(chǎn)生的信號(hào)5["]。計(jì)算器塊143a通過從作為目標(biāo)信號(hào)(圖3A中的信號(hào)a)的LP殘留信號(hào)中減去合成信號(hào)巧["](廚3A中的信號(hào)b)來產(chǎn)生新的目標(biāo)信號(hào)(圖3B中的信號(hào)c)，并執(zhí)行下一環(huán)操作。如圖3A中所示，目標(biāo)信號(hào)(信號(hào)a)和合成信號(hào)5[n](信號(hào)b)二者在基頻w。中形成峰值，以及如圖3B中所示當(dāng)新的目標(biāo)信號(hào)o["](信號(hào)c)的幅度在基頻w中接近0時(shí)，基頻w中的誤差值小于其它頻率中的誤差值。如上所述，如果相對(duì)于基頻w。和周圍頻率的搜索的第一環(huán)操作結(jié)束，則執(zhí)行對(duì)新的目標(biāo)信號(hào)。M的第二環(huán)操作。圖4A和4B是示出根據(jù)本發(fā)明的示范性實(shí)施例的正弦幅度/相位搜索單元143已經(jīng)第二次操作其呈環(huán)形配置的內(nèi)部塊時(shí)的信號(hào)波形和幅度的曲線圖。圖4A示出才艮據(jù)本發(fā)明的示范性實(shí)施例的頻域中由字符a指示的作為目標(biāo)信號(hào)K"]的LP殘留信號(hào)的幅度、以及由字符b指示的從累加器塊143d輸出的第二合成信號(hào)&w的幅度。圖4B示出根據(jù)本發(fā)明的示范性實(shí)施例的頻域中由字符c指示的新的目標(biāo)信號(hào)o[XI的幅度。在第二環(huán)操作中，搜索能夠相對(duì)于與兩倍基頻對(duì)應(yīng)的頻率2*^0和周圍頻率將誤差最小化的正弦幅度A和相位《。如第一環(huán)操作一樣，在第二環(huán)操作中，當(dāng)?shù)诙繕?biāo)信號(hào)r["]被輸入到誤差最小化塊143b時(shí)，借助音調(diào)搜索將與兩倍基頻對(duì)應(yīng)的頻率2*^。同時(shí)輸入到誤差最小化塊143b。誤差最小化塊143b相對(duì)于第二目標(biāo)信號(hào)^["]利用如上面等式5中所示的最小化過程獲得頻率2*,和周圍頻率中的正弦幅度A和相位《，并向字典元素產(chǎn)生器塊143c輸出正弦幅度A和相位《。即，如第一環(huán)操作中一樣，誤差最小化塊143b利用阻尼因子值fl搜索能夠相對(duì)于(l-2a*")*2*w。、(l-a*")*2*wQ、2*w。、(l+")*2*w。和(l+2a*w)*2*W。中的每個(gè)頻率將誤差最小化的正弦幅度^和相位《。當(dāng)輸入正弦幅度^和相位《時(shí)，字典元素產(chǎn)生器塊143c產(chǎn)生由下面等式9表示的正弦字典《，并向累加器塊143d輸出正弦字典《。《=J]22(")*cos(2*w。*"+a*2*w。*w*"+《)(9)該情況下，與第一環(huán)操作中一樣，正弦字典《根據(jù)找到的正弦幅度爿2和相位《變化。累加器塊143d通過線性地累加《即累加第一環(huán)操作中產(chǎn)生的時(shí)域波形<和第二環(huán)操作中產(chǎn)生的時(shí)域波形《來產(chǎn)生合成信號(hào)。于是，累加器塊143d輸出從《+《在時(shí)域中產(chǎn)生的合成信號(hào)F,W。同樣地，在第三環(huán)操作中，通過從目標(biāo)信號(hào)r[n](圖4A中的信號(hào)a)中減去合成信號(hào)6["](圖4A中的信號(hào)b)來產(chǎn)生第三目標(biāo)信號(hào)Q["](圖4B中的信號(hào)c)如圖4A中所示，第一目標(biāo)信號(hào)r["]的譜的峰值可能不匹配頻率2Sv。中的信號(hào)《的譜的峰值。于是，誤差最小化塊143b獲得能夠相對(duì)于(1—2a*w)*2*w。、(l_a*")*2*w。、2*w0、(l+a*w)*2*w。和(1+2*")*2*w。中的每個(gè)頻率將誤差最小化的正弦幅度^和相位《，并向阻尼因子選擇器147提供與每個(gè)頻率對(duì)應(yīng)的一對(duì)正弦幅度和相位(」2，《)。即，如果LP殘留信號(hào)在與基頻w的整數(shù)倍近似對(duì)應(yīng)的位置處形成峰值而不在基頻W的整數(shù)倍處形成峰值，則出現(xiàn)幀之間的不連續(xù)性，于是為了防止不連續(xù)性，搜索與峰值對(duì)應(yīng)的頻率以盡可能多地減少誤差。于是，在第二環(huán)操作中通過從目標(biāo)信號(hào)中減去通過合成在與兩倍基頻對(duì)應(yīng)的頻率處分析的參數(shù)獲得的信號(hào)而產(chǎn)生新的信號(hào)，在第三環(huán)操作中通過從目標(biāo)信號(hào)中減去通過合成在與三倍基頻對(duì)應(yīng)的頻率處分析的參數(shù)獲得的信號(hào)而再次產(chǎn)生新的信號(hào)，并重復(fù)該過程。以這樣的方式，如果執(zhí)行了與第一目標(biāo)信號(hào)r["]的譜的數(shù)量/對(duì)應(yīng)的數(shù)量的輪轉(zhuǎn)，則相對(duì)于作為基頻w。的整數(shù)倍的頻率的周圍頻率的正弦幅度和相位對(duì)被輸入到并存儲(chǔ)在阻尼因子選擇器147中。通過劃分由整數(shù)音調(diào)搜索單元130和分?jǐn)?shù)音調(diào)搜索單元150獲得的音調(diào)來計(jì)算譜的數(shù)量，如等式10所示。H畫^f(10)在等式10中，仏柳表示譜的數(shù)量，而p表示音調(diào)周期。阻尼因子選擇器147根據(jù)每個(gè)頻率獲得最終殘留信號(hào)的功率值，選擇其中將功率值最小化的最佳頻率阻尼因子c，，并向阻尼因子合成器149輸出與最佳頻率阻尼因子cf對(duì)應(yīng)的A和《。即，如果已經(jīng)最終執(zhí)行與鐠的數(shù)量/對(duì)應(yīng)的數(shù)量的輪轉(zhuǎn)，則累加器塊輸出巧["]=《+《+.,,+《，而計(jì)算器塊通過從第一目標(biāo)信號(hào)r["]中減去巧[n]來產(chǎn)生最終目標(biāo)信號(hào)最終目標(biāo)信號(hào)0+7["]可以是到當(dāng)前時(shí)刻為止借助輪轉(zhuǎn)通過從第一目標(biāo)信號(hào)/i"]中減去合成信號(hào)而獲得的最終殘留信號(hào)。即，通過從原始信號(hào)中減去具有最大能量的頻率的正弦字典并借助從目標(biāo)信號(hào)中減去具有第二大能量的頻率的正弦字典來合成新的目標(biāo)信號(hào)，以與產(chǎn)生目標(biāo)信號(hào)的方法的i普的數(shù)量相同的次數(shù)重復(fù)執(zhí)行正弦幅度/相位搜索單元143的匹配追蹤算法。該情況下，由于執(zhí)行了與語的數(shù)量/對(duì)應(yīng)的數(shù)量的輪轉(zhuǎn)，以與譜的數(shù)量/對(duì)應(yīng)的次數(shù)產(chǎn)生與每個(gè)cf對(duì)應(yīng)的其中將&最小化的A和《。其中將五a最小化的4和《與每個(gè)阻尼因子cf一起^^皮存儲(chǔ)在阻尼因子選擇器147中。阻尼因子選擇器147根據(jù)cf的每個(gè)候選獲得最終剩下的最終殘留信號(hào)的功率值，選擇其中將功率值最小化的最佳參數(shù)，并向阻尼因子合成器149輸出最佳參數(shù)。阻尼因子合成器149利用借助重復(fù)匹配追蹤算法獲得的最佳參數(shù)合成LP殘留信號(hào)。由阻尼因子合成器149合成的LP殘留信號(hào)是利用最佳頻率阻尼因子c，以及相應(yīng)的頻率中的譜幅度和相位合成的信號(hào)。這里，由于譜幅度阻尼因子^被固定為1，不考慮譜幅度阻尼因子gf,因而僅考慮頻率阻尼因子c，。阻尼因子選擇器147從最終目標(biāo)信號(hào)0+7["]獲得能夠相對(duì)于(l—2a*")*/*w。、(l-a*")*/*w。、/*w0、(1+"*")"*^。和(1+2"*")*/*^。中的每個(gè)頻率將誤差最小化的正弦幅度為和相位《，并存儲(chǔ)與每個(gè)頻率對(duì)應(yīng)的一對(duì)正弦幅度和相位(J,《)。阻尼因子選擇器147最終相對(duì)于5個(gè)頻率阻尼因子cf中的每一個(gè)獲得最終殘留信號(hào)的功率值，選擇其中將功率值最小化的最佳頻率阻尼因子cf，并向阻尼因子合成器149輸出與最佳頻率阻尼因子cf對(duì)應(yīng)的A和《。通過將殘留信號(hào)的譜自乘來獲得功率值阻尼因子合成器149接收最佳頻率阻尼因子cf以及與最佳頻率阻尼因子《對(duì)應(yīng)的^和《，并利用等式ll合成LP殘留信號(hào)。幀尺寸/、/、K")=Z4cos((/w。+c0)"+《)(11)/=1這里，作為上標(biāo)的標(biāo)記(即，r帽)表示考慮阻尼因子的影響的譜的幅度和相位。阻尼因子合成器149還利用下面示出的等式12至14確定譜幅度阻尼因子gf。這里，通過考慮數(shù)據(jù)率的約束^R定gf為^來估計(jì)^。[數(shù)學(xué)式12]<formula>formulaseeoriginaldocumentpage21</formula>其中<formula>formulaseeoriginaldocumentpage21</formula>最后，由于在^%^=0時(shí)獲得^的最佳解，將等式12改寫為等式13,3g。<formula>formulaseeoriginaldocumentpage21</formula>于是，為g纟將等式12改寫為等式14[數(shù)學(xué)式14]<formula>formulaseeoriginaldocumentpage21</formula>這些最終估計(jì)的參數(shù)，即，譜幅度和相位以及阻尼因子^和w,用于正弦合成公式。即，通過利用頻率阻尼因子cf調(diào)整每個(gè)峰脈沖的位置、利用譜幅度阻尼因子g纟將前一幀的最后一個(gè)峰脈沖的幅度與當(dāng)前幀的第一個(gè)峰脈沖的幅度之間的斜坡調(diào)整為線性的、并調(diào)整每個(gè)當(dāng)前幀的各個(gè)峰脈沖之間的斜坡來改善不連續(xù)的語音信號(hào)。-現(xiàn)在將參照?qǐng)D5A和5B更詳細(xì)地描述由相位/譜幅度量化器160用于量化從正弦分析器140輸出的LP殘留信號(hào)的譜幅度和阻尼因子的方法。相位/語幅度量化器160包括譜幅度量化器160a和相位量化器160b。圖5A和5B是才艮據(jù)本發(fā)明的示范性實(shí)施例的譜幅度量化器160a的編碼器端和解碼器端的框圖。參照?qǐng)D5A，語幅度量化器160a的編碼器端包括正規(guī)化塊161、離散余弦變換(DCT)塊162、初級(jí)變量向量匹配單元163、向量緩沖器164和次級(jí)變量向量匹配單元165。諧波幅度值的數(shù)量為大約6-120，而為了量化該可變數(shù)量的譜幅度(諧波值和非諧波值)，使用DCT功能。利用分離向量量化方法和多級(jí)向量量化方法來量化經(jīng)變換的DCT值。才艮據(jù)DCT量化器的分析過程，利用上面等式IO獲得諧波的數(shù)量。正規(guī)化塊161如下面等式15中所示利用譜幅度的平均能量正規(guī)化每個(gè)譜幅度。因?yàn)楦鶕?jù)語音信號(hào)的能量檢測(cè)的譜幅度的變化范圍很大，所以為了量化效率執(zhí)行正規(guī)化以將語幅度的變化范圍減小到閾值范圍之內(nèi)。該閾值范圍可以預(yù)先確定。"』=,"")(15)DCT塊162如等式16中所示利用改進(jìn)DCT(MDCT)變換經(jīng)正規(guī)化的譜值。<formula>formulaseeoriginaldocumentpage22</formula>初級(jí)變量向量匹配單元163從碼本1選擇N個(gè)候選向量以使得將DCT系數(shù)之間的歐幾里得距離最小化，并在向量緩沖器164中存儲(chǔ)該N個(gè)候選向次級(jí)變量向量匹配單元165獲得N個(gè)候選向量之間的差值，從碼本2選擇n個(gè)碼本候選向量，并最終選擇將利用原始dct系數(shù)的歐幾里得距離最小化的碼本候選向量。參照?qǐng)D5B，譜幅度量化器160a的解碼器端包括逆DCT(IDCT)塊166，而IDCT塊166通過執(zhí)行由解碼器端選擇的碼本1和碼本2的碼本值的逆MDCT(IMDCT)來獲得逆量化的值和原始譜幅度?，F(xiàn)在將參照?qǐng)D6描述量化利用添加有阻尼因子的匹配追蹤正弦模型提取的參數(shù)當(dāng)中的相位的方法。圖6是根據(jù)本發(fā)明的示范性實(shí)施例的相位量化器160b的框圖。參照?qǐng)D6，相位量化器160b包括距離計(jì)算塊167、權(quán)重函數(shù)塊168和最小化塊169。雖然相位量化器160b被示出為一個(gè)級(jí)的量化器，但是也可以通過并行地連接兩個(gè)或更多量化器來調(diào)整傳輸率以減少前一級(jí)的量化錯(cuò)誤或調(diào)整被量化的相位的數(shù)量。即，被量化的相位的數(shù)量針對(duì)每個(gè)傳輸率變化，而且針對(duì)每個(gè)傳輸率出現(xiàn)的相位量化錯(cuò)誤也被量化。距離計(jì)算塊167接收目標(biāo)相位，并獲得目標(biāo)相位與從目標(biāo)相位產(chǎn)生的碼本相位之間的距離。即，在所有類型的向量量化中，使用搜索在要量化的目標(biāo)信號(hào)與經(jīng)量化信號(hào)的碼本索引之間具有最小差的量化值的方法。這是因?yàn)?，由于具有最小差的量化值與目標(biāo)相位最相似，所以量化錯(cuò)誤被最小化。根據(jù)垂直線上的標(biāo)量量化，每個(gè)維度中的誤差為最大2兀。然而，如果利用相位的模2兀旋轉(zhuǎn)特性在極坐標(biāo)上獲得誤差，則最大誤差是兀。通過利用相位的該旋轉(zhuǎn)特性，可以高效率地減少位的數(shù)量。將目標(biāo)量化信號(hào)與碼本相位之間的相關(guān)表示為等式17和18。[數(shù)學(xué)式17]<formula>formulaseeoriginaldocumentpage23</formula>這里，p/2^e加(")表示第"維度的目標(biāo)相位，p/za化c。^(w)表示第"維度的第1級(jí)碼本相位，而；/zase,r。(")表示第"維度的第1級(jí)誤差相位。為了如等式15中表示一ase^("),有利的是如等式16中根據(jù)目標(biāo)信號(hào)和碼本索引的符號(hào)而不同地表示；/za^e,。(")。該相關(guān)由等式19表示。[數(shù)學(xué)式19];/z氾e加(w)—//ja化co血,(w);>0,//fiwecorfe>0=Iz^^^證o("〗_2冗；/^we加>0,p/cweCOTfe<0,(丄9)"柳o2;r—1;^^^—0("〗；/^aw加<0，/^0;^0血>0f此外，利用相位的旋轉(zhuǎn)特性，使用加權(quán)濾波器的設(shè)計(jì)以便通過根據(jù)輸入語音的語幅度改變相位碼本中的誤差權(quán)重而在時(shí)域中將合成的語音表示為與輸入語音最相似的語音。權(quán)重函數(shù)塊168根據(jù)LP殘留信號(hào)的LPC系數(shù)和譜幅度利用包^^f直獲得相對(duì)于具有相同的維度的相位的權(quán)重函數(shù)尸『(iV)。最小化塊169利用從權(quán)重函數(shù)塊168接收的權(quán)重函數(shù)以及從下面等式20獲得的均方誤差(MSE)來搜索最佳相位索引，并向MUX190發(fā)送最佳相位索引。MS￡=iW2(7V)0^a",。r(")-;7/a^c。de("))2(20)這里，尸『(7V)表示第w維度的輸入語音信號(hào)的譜幅度，而p/za^c。&(")表示利用碼本合成的合成相位。如上所迷，本發(fā)明的示范性實(shí)施例涉及擴(kuò)展用于提供具有良好頻率分辨率的匹配追蹤方法以對(duì)語音信號(hào)進(jìn)行高效率正弦建模的正弦模型、以及使用該擴(kuò)展正弦模型的寬帶語音編碼器。此外，為了高效率地量化擴(kuò)展正弦模型的參數(shù)，使用利用DCT的諧波量化器以及旋轉(zhuǎn)權(quán)重相位量化器。另外，通過發(fā)送全部級(jí)的參數(shù)量化誤差或根據(jù)級(jí)增加參數(shù)的數(shù)量可以支持信噪比(SNR)可擴(kuò)展性。本發(fā)明的概念也可以實(shí)現(xiàn)為計(jì)算機(jī)程序。本發(fā)明的概念所屬領(lǐng)域的程序員可以容易地得出用于實(shí)現(xiàn)所述計(jì)算機(jī)程序的代碼和代碼段。4艮據(jù)本發(fā)明的計(jì)算機(jī)程序的示范性實(shí)施例通過存儲(chǔ)在計(jì)算機(jī)可讀記錄介質(zhì)中并在之后由計(jì)算機(jī)系統(tǒng)讀取和執(zhí)行來實(shí)現(xiàn)編碼/解碼寬帶語音信號(hào)的方法。計(jì)算機(jī)可讀記錄介質(zhì)的示例包括》茲記錄介質(zhì)、光記錄介質(zhì)和載波介質(zhì)。雖然已經(jīng)參照其示范性實(shí)施例具體地展示和描述了本發(fā)明的概念，但是本領(lǐng)域技術(shù)人員將理解，可以在其中從形式和細(xì)節(jié)上作出各種變更而不背離由所附權(quán)利要求書限定的本發(fā)明的精神和范圍。示范性實(shí)施例應(yīng)當(dāng)僅作描述的意義考慮而非用于限制的目的。因而，本發(fā)明的范圍并非由本發(fā)明的詳細(xì)描述而是由所附權(quán)利要求書限定，而且該范圍內(nèi)的全部變化將被解讀為包含在本發(fā)明之內(nèi)。對(duì)相關(guān)申請(qǐng)的交叉引用本申請(qǐng)要求于2006年11月28日向韓國(guó)特許廳提交的韓國(guó)專利申請(qǐng)No.10-2006-0118546的優(yōu)先權(quán)，其公開的全部?jī)?nèi)容通過引用而被合并于此。權(quán)利要求1.一種方法，包括從寬帶語音信號(hào)中提取線性預(yù)測(cè)系數(shù)LPC；利用LPC從寬帶語音信號(hào)中去除包絡(luò)以獲得線性預(yù)測(cè)LP殘留信號(hào)；音調(diào)-搜索LP殘留信號(hào)的譜；通過向匹配追蹤算法添加阻尼因子，提取LP殘留信號(hào)的與阻尼因子對(duì)應(yīng)的多個(gè)譜幅度和相位；從所提取的多個(gè)譜幅度和相位當(dāng)中獲取其中將LP殘留信號(hào)的功率值最小化的第一譜幅度和第一相位；以及量化第一譜幅度和第一相位。2.如權(quán)利要求l所述的方法，進(jìn)一步包括解碼寬帶語音信號(hào)。3.如權(quán)利要求l所述的方法，其中所述阻尼因子包括LP殘留信號(hào)的譜幅度阻尼因子和頻率阻尼因子。4.如權(quán)利要求3所述的方法，其中所述提取LP殘留信號(hào)的多個(gè)譜幅度和相位的步驟包括利用頻率阻尼因子相對(duì)于通過音調(diào)-搜索LP殘留信號(hào)獲得的每個(gè)頻率設(shè)置多個(gè)候選頻率；通過相對(duì)于通過音調(diào)-搜索獲得的每個(gè)頻率從多個(gè)候選頻率當(dāng)中獲得其中將誤差值最小化的頻率和相位來計(jì)算正弦字典值，并累加相對(duì)于通過音調(diào)-搜索獲得的每個(gè)頻率計(jì)算的正弦字典值；通過從作為目標(biāo)信號(hào)的LP殘留信號(hào)中減去所累加的正弦字典值來產(chǎn)生最終殘留信號(hào)；以及檢測(cè)與其中相對(duì)于通過音調(diào)-搜索獲得的每個(gè)頻率將最終殘留信號(hào)的功率值最小化的第一譜幅度和第一相位對(duì)應(yīng)的頻率阻尼因子。5.如權(quán)利要求4所述的方法，其中所述設(shè)置多個(gè)候選頻率的步驟包括相對(duì)于與LP殘留信號(hào)中基頻的n倍對(duì)應(yīng)的頻率利用頻率阻尼因子設(shè)置與基頻的n-l倍對(duì)應(yīng)的頻率和與基頻的n+l倍對(duì)應(yīng)的頻率之間的多個(gè)候選頻率。6.如權(quán)利要求5所述的方法，其中累加的正弦字典的數(shù)量與寬帶語音信號(hào)的譜的數(shù)量相等。7.如權(quán)利要求4所述的方法，其中利用第一譜幅度和第一相位來獲得和量化譜幅度阻尼因子。8.如權(quán)利要求7所述的方法，其中利用離散余弦變換DCT量化第一譜幅度。9.如權(quán)利要求8所述的方法，其中量化第一相位的步驟包括通過獲得第一相位與從第一相位產(chǎn)生的多個(gè)第一碼本相位之間的第一多個(gè)差、將第一多個(gè)差乘以與第一相位對(duì)應(yīng)的包絡(luò)值以產(chǎn)生第一多個(gè)相乘結(jié)果、并將第一多個(gè)差中的每個(gè)差分別加到第一多個(gè)相乘結(jié)果中的各個(gè)相乘結(jié)果來獲得第一多個(gè)距離；檢測(cè)和輸出允許將第一多個(gè)距離當(dāng)中的距離最小化的第一碼本相位；通過調(diào)整從第一碼本相位與第一相位之間的差產(chǎn)生的相位誤差向量來產(chǎn)生第二相位，并通過獲得第二相位與從第二相位產(chǎn)生的多個(gè)第二碼本相位之間的第二多個(gè)差、將第二多個(gè)差差乘以與第二相位對(duì)應(yīng)的包絡(luò)值以產(chǎn)生第二多個(gè)相乘結(jié)果、并將第二多個(gè)差中的每個(gè)差分別加到第二多個(gè)相乘結(jié)果中的各個(gè)相乘結(jié)果來獲得第二多個(gè)距離；以及檢測(cè)和輸出允許將第二多個(gè)距離當(dāng)中的距離最小化的第二碼本相位。10.如權(quán)利要求9所述的方法，其中通過根據(jù)各種傳輸率基于模式信息確定位分配來量化阻尼因子、譜幅度、相位和音調(diào)。11.如權(quán)利要求7所述的方法，其中所述解碼寬帶語音信號(hào)的步驟包括解碼經(jīng)量化的第一譜幅度和經(jīng)量化的第一相位；解碼經(jīng)量化的阻尼因子；利用第一譜幅度、第一相位、阻尼因子、音調(diào)值其中至少一個(gè)來合成LP殘留信號(hào)；以及從LP殘留信號(hào)解碼寬帶語音信號(hào)。12.—種用于在寬帶語音編碼系統(tǒng)中編碼寬帶語音信號(hào)的裝置，該裝置包括線性預(yù)測(cè)系數(shù)LPC分析器，其從寬帶語音信號(hào)中提取LPC;LPC逆濾波器，其輸出通過利用LPC從寬帶語音信號(hào)中去除包絡(luò)而獲得的線性預(yù)測(cè)LP殘留信號(hào)；音調(diào)搜索單元，其音調(diào)-搜索LP殘留信號(hào)的譜；正弦分析器，其通過向匹配追蹤算法添加阻尼因子來提取LP殘留信號(hào)的與阻尼因子對(duì)應(yīng)的多個(gè)譜幅度和相位，并從所提取的多個(gè)鐠幅度和相位當(dāng)中獲得其中將LP殘留信號(hào)的功率值最小化的第一譜幅度和第一相位；以及相位和譜幅度量化器，其量化第一譜幅度和第一相位。13.如權(quán)利要求12所述的裝置，其中所述阻尼因子包括LP殘留信號(hào)的語幅度阻尼因子和頻率阻尼因子。14.如權(quán)利要求13所述的裝置，其中所述正弦分析器包括頻率阻尼因子施加單元，其相對(duì)于利用頻率阻尼因子通過音調(diào)-搜索LP殘留信號(hào)獲得的每個(gè)頻率設(shè)置多個(gè)候選頻率；誤差最小化單元，其相對(duì)于通過音調(diào)-搜索獲得的每個(gè)頻率從多個(gè)候選頻率當(dāng)中獲得其中將誤差值最小化的頻率和相位；字典分量產(chǎn)生器，其基于從誤差最小化單元輸出的頻率和相位獲得正弦字典值；累加器，其從字典分量產(chǎn)生器接收相對(duì)于通過音調(diào)-搜索獲得的每個(gè)頻率產(chǎn)生的正弦字典值，并累加正弦字典值；計(jì)算器，其通過從LP殘留信號(hào)中減去所累加的正弦字典值來產(chǎn)生最終殘留信號(hào)；以及阻尼因子選擇器，其檢測(cè)與其中相對(duì)于通過音調(diào)-搜索獲得的每個(gè)頻率將最終殘留信號(hào)的功率值最小化的第一譜幅度和第一相位對(duì)應(yīng)的頻率阻尼因子。15.如權(quán)利要求14所述的裝置，其中所述頻率阻尼因子施加單元相對(duì)于與LP殘留信號(hào)中基頻的n倍對(duì)應(yīng)的頻率利用頻率阻尼因子設(shè)置與基頻的n-l倍對(duì)應(yīng)的頻率和與基頻的n+l倍對(duì)應(yīng)的頻率之間的多個(gè)候選頻率。16.如權(quán)利要求15所述的裝置，其中累加的正弦字典的數(shù)量與寬帶語音信號(hào)的譜的數(shù)量相等。17.如權(quán)利要求14所述的裝置，進(jìn)一步包括阻尼因子合成器，其利用第一譜幅度和第一相位獲得語幅度阻尼因子。18.如權(quán)利要求17所述的裝置，其中所述相位和譜幅度量化器利用離散余弦變換DCT量化第一譜幅度。19.如權(quán)利要求18所述的裝置，其中所述相位和譜幅度量化器包括距離計(jì)算塊，其通過獲得第一相位與從第一相位產(chǎn)生的多個(gè)第一碼本相位之間的多個(gè)差、將所述多個(gè)差乘以與第一相位對(duì)應(yīng)的包絡(luò)值以產(chǎn)生多個(gè)相乘結(jié)果、并將所述多個(gè)差中的每個(gè)差分別加到所述多個(gè)相乘結(jié)果中的各個(gè)相乘結(jié)果來獲得距離；最小化塊，其檢測(cè)允許將所述距離最小化的第一碼本相位，并通過向從與最小化距離對(duì)應(yīng)的第一碼本相位與第一相位之間的差產(chǎn)生的相位誤差向量施加權(quán)重函數(shù)來輸出第二相位；以及權(quán)重函數(shù)塊，其向最小化塊輸出譜幅度和音調(diào)的權(quán)重函數(shù)。20.如權(quán)利要求19所述的裝置，其中并行地耦接起來的多個(gè)相位和語幅度量化器量化第一相位。21.如權(quán)利要求19所述的裝置，其中該裝置通過根據(jù)各種傳輸率基于模式信息確定位分配來量化阻尼因子、譜幅度、相位和音調(diào)。22.—種寬帶語音編碼和解碼系統(tǒng)，包括寬帶語音編碼裝置，其通過利用從寬帶語音信號(hào)中提取的線性預(yù)測(cè)系數(shù)LPC從寬帶語音信號(hào)中去除包絡(luò)而獲得線性預(yù)測(cè)LP殘留信號(hào)，通過向匹配追蹤算法添加阻尼因子來提取LP殘留信號(hào)的與阻尼因子對(duì)應(yīng)的多個(gè)譜幅度和相位，從所提取的多個(gè)譜幅度和相位當(dāng)中獲得其中將LP殘留信號(hào)的功率值最小化的第一譜幅度和第一相位，并量化第一譜幅度和第一相位；以及寬帶語音解碼裝置，其通過解碼經(jīng)量化的第一譜幅度、經(jīng)量化的第一相位和經(jīng)量化的阻尼因子并合成LP殘留信號(hào)來解碼寬帶語音信號(hào)。23.—種存儲(chǔ)用于執(zhí)行一方法的計(jì)算機(jī)可讀程序的計(jì)算機(jī)可讀記錄介質(zhì)5該方法包括從寬帶語音信號(hào)中提取線性預(yù)測(cè)系數(shù)LPC;利用LPC從寬帶語音信號(hào)中去除包絡(luò)以獲得線性預(yù)測(cè)LP殘留信號(hào)；音調(diào)-搜索LP殘留信號(hào)的語；通過向匹配追蹤算法添加阻尼因子，提取LP殘留信號(hào)的與阻尼因子對(duì)應(yīng)的多個(gè)譜幅度和相位；從所提取的多個(gè)譜幅度和相位當(dāng)中獲取其中將LP殘留信號(hào)的功率值最小化的第一譜幅度和第一相位；以及量化第一譜幅度和第一相位。24.如權(quán)利要求23所述的計(jì)算機(jī)可讀記錄^h質(zhì)，其中所述方法進(jìn)一步包括解碼寬帶語音信號(hào)。全文摘要提供一種用于編碼或解碼寬帶語音信號(hào)的方法、裝置和系統(tǒng)。該方法包括從寬帶語音信號(hào)中提取線性預(yù)測(cè)系數(shù)(LPC)；輸出線性預(yù)測(cè)(LP)殘留信號(hào)；音調(diào)-搜索LP殘留信號(hào)的譜；提取LP殘留信號(hào)的譜幅度和相位，其與阻尼因子對(duì)應(yīng)；從所提取的譜幅度和相位當(dāng)中獲取其中將LP殘留信號(hào)的功率值最小化的第一譜幅度和第一相位；量化第一譜幅度和第一相位；以及解碼寬帶語音信號(hào)。該裝置包括線性預(yù)測(cè)系數(shù)(LPC)分析器；LPC逆濾波器；音調(diào)搜索單元；正弦分析器；以及相位和譜幅度量化器。該系統(tǒng)包括寬帶語音編碼裝置；以及寬帶語音解碼裝置。文檔編號(hào)G10L19/08GK101542599SQ200780044020公開日2009年9月23日申請(qǐng)日期2007年11月16日優(yōu)先權(quán)日2006年11月28日發(fā)明者徐商源,李寅誠(chéng),鄭奎赫,金鐘學(xué)申請(qǐng)人:三星電子株式會(huì)社;忠北大學(xué)校產(chǎn)學(xué)協(xié)力團(tuán)

完整全部詳細(xì)技術(shù)資料下載