音頻編碼裝置和音頻編碼譯碼裝置的制作方法

文檔序號：2820166閱讀：183來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：音頻編碼裝置和音頻編碼譯碼裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及音頻編碼裝置和音頻編碼譯碼裝置，該套裝置可把音頻信號壓縮編碼成數(shù)字化信號。
圖9是一個(gè)普通音頻編碼譯碼裝置的典型的總體框圖，它把音頻輸入信號分成頻譜包絡(luò)信息和音源信號信息，并且以幀為單位把聲源信號進(jìn)行編碼。圖9所示的裝置是與JP-A64/40899號公報(bào)發(fā)表的裝置一樣的。
在圖9里，各標(biāo)號是1編碼裝置，2譯碼裝置，3多路轉(zhuǎn)換裝置，4分離裝置，5音頻輸入，6傳輸線，7音頻輸出。編碼裝置1是由線性預(yù)測參數(shù)分析裝置8，線性預(yù)測參數(shù)編碼裝置9，自適應(yīng)聲源信號編碼本10，自適應(yīng)聲源檢索裝置11，誤差信號生成裝置12，驅(qū)動聲源編碼本13，驅(qū)動聲源檢索裝置14和聲源信號產(chǎn)生裝置15構(gòu)成。譯碼裝置2是由線性預(yù)測參數(shù)譯碼裝置16，自適應(yīng)聲源編碼本17，自適應(yīng)聲源信號譯碼裝置18，驅(qū)動聲源信號編碼本19，驅(qū)動聲源信號譯碼裝置20，聲源信號發(fā)生裝置21和復(fù)合濾波器22。
以下僅就上述以往的音頻編碼譯碼裝置的工作原理，說明它是如何將音頻輸入信號分解成頻譜包絡(luò)信息和聲源信號信息，并且如何把聲源信號信息以幀為單位進(jìn)行編碼。
首先編碼裝置1接收，例如，以8kHz采樣的數(shù)字音頻信號作為音頻輸入5。線性預(yù)測參數(shù)分析裝置8分析音頻輸入5，并且抽取聲音的頻譜包絡(luò)信息作為線性預(yù)測參數(shù)。隨后線性預(yù)測參數(shù)編碼裝置9將抽取的線性預(yù)測參數(shù)量化，并且把代表該參數(shù)的編碼輸出到多路轉(zhuǎn)換裝置。同時(shí)線性預(yù)測參數(shù)編碼裝置9把量化的線性預(yù)測參數(shù)輸出到自適應(yīng)聲源檢索裝置11，誤差信號發(fā)生裝置12以及驅(qū)動聲源檢索裝置14。
下面，說明有關(guān)聲源信息編碼過程。在自適應(yīng)聲源編碼本10里，保存有過去來自聲源信號產(chǎn)生裝置15產(chǎn)生的聲源信號，將從自適應(yīng)聲源檢索裝置11輸入的與延遲參數(shù)L對應(yīng)的幀長度的自適應(yīng)聲源向量輸出給自適應(yīng)聲源檢索裝置11。在這里，上述的自適應(yīng)聲源向量是抽出的比延遲參數(shù)L早一個(gè)幀長的聲源信號采樣，當(dāng)延遲參數(shù)L比幀長短時(shí)，把一個(gè)采樣的聲源信號重復(fù)地生成，一直到一個(gè)幀長時(shí)間為止。當(dāng)延遲參數(shù)L大于或等于幀長時(shí)，典型的自適應(yīng)聲源向量的實(shí)例如

圖10(a)所示；當(dāng)延遲參數(shù)L小于幀長時(shí)，自適應(yīng)聲源向量的實(shí)例如圖10(b)所示。
例如延遲參數(shù)L落入20≤延遲參數(shù)L≤128的區(qū)域時(shí)，自適應(yīng)聲源檢索裝置11把由自適應(yīng)聲源編碼本10輸入的自適應(yīng)聲源向量和由線性預(yù)測參數(shù)編碼裝置9輸入的量化線性預(yù)測參數(shù)進(jìn)行線性預(yù)測復(fù)合，從而生成復(fù)合音頻向量。于是，從輸入音頻5每幀抽取的輸入音頻向量和上述的復(fù)合音頻向量之間，求出聽覺加權(quán)失真。然后，通過比較進(jìn)行評價(jià)上述的失真，求出使上述失真變成最小的延遲參數(shù)L和與其對應(yīng)的自適應(yīng)聲源增益β，并把上述的延遲參數(shù)L和自適應(yīng)聲源增益β的編碼傳送給多路轉(zhuǎn)換裝置3，與此同時(shí)，把與上述的延遲參數(shù)L相對應(yīng)的自適應(yīng)聲源向量和上述的自適應(yīng)聲源增益β相乘，從而產(chǎn)生出自適應(yīng)聲源信號，并且把該信號傳送到誤差信號產(chǎn)生裝置12和聲源信號產(chǎn)生裝置15。
誤差信號產(chǎn)生裝置12把從上述的自適應(yīng)聲源檢索裝置11輸入的自適應(yīng)聲源信號和從上述的線性預(yù)測參數(shù)編碼裝置9輸入的量化的線性預(yù)測參數(shù)，進(jìn)行線性預(yù)測復(fù)合，從而產(chǎn)生出復(fù)合音頻向量。于是，從輸入音頻5每幀抽出輸入音頻向量和上述的復(fù)合音頻向量的差分，求出作為誤差信號向量，并且把該誤差信號向量傳送給驅(qū)動聲源檢索裝置14。
在驅(qū)動聲源編碼本13里，例如，存儲著由隨機(jī)噪聲產(chǎn)生的N個(gè)驅(qū)動聲源向量，并輸出按照來自驅(qū)動聲源檢索裝置14輸入的與驅(qū)動聲源編碼i相對應(yīng)的驅(qū)動聲源向量。驅(qū)動聲源檢索裝置14對于N個(gè)驅(qū)動聲源向量，利用從上述的驅(qū)動聲源編碼本13輸入的驅(qū)動聲源向量和從上述的線性預(yù)測參數(shù)編碼裝置9輸入的量化的線性預(yù)測參數(shù)，進(jìn)行線性預(yù)測復(fù)合，于是，產(chǎn)生出復(fù)合音頻向量。然后，求出上述的誤差信號產(chǎn)生裝置12輸入的誤差信號向量和從上述的復(fù)合音頻向量之間的聽覺加權(quán)失真。接著，通過比較進(jìn)行評價(jià)，求出使上述的失真變成最小的驅(qū)動聲源編碼和與其對應(yīng)的驅(qū)動聲源增益γ，并把上述的驅(qū)動聲源編碼I和驅(qū)動聲源增益γ的編碼傳送給多路轉(zhuǎn)換裝置3，與此同時(shí)，把與上述的驅(qū)動聲源編碼I對應(yīng)的驅(qū)動聲源向量和上述的驅(qū)動聲源增益γ相乘，從而，產(chǎn)生出驅(qū)動聲源信號，并且把該信號傳送到聲源信號產(chǎn)生裝置15。
聲源信號產(chǎn)生裝置15把從上述的自適應(yīng)聲源檢索裝置11輸入的自適應(yīng)聲源信號和上述的驅(qū)動聲源信號檢索裝置14輸入的驅(qū)動聲源信號進(jìn)行加法運(yùn)算，從而產(chǎn)生聲源信號并且傳送給自適應(yīng)聲源編碼本17。
以上的編碼處理過程完成后，多路轉(zhuǎn)換裝置3把上述量化后的同線性預(yù)測參數(shù)相對應(yīng)的編碼、延遲參數(shù)L、驅(qū)動聲源編碼I以及聲源增益β乃至同γ相對應(yīng)的編碼，都通過傳輸線路6發(fā)送出去。
現(xiàn)在，僅就譯碼部件2的工作原理說明如下首先，接收多路轉(zhuǎn)換裝置3的輸出信息的分離裝置4，把收到分別發(fā)送給以下各裝置線性預(yù)測參數(shù)的編碼→線性預(yù)測參數(shù)譯碼裝置16；延遲參數(shù)L、(自適應(yīng))聲源增益β的編碼→自適應(yīng)聲源譯碼裝置18；驅(qū)動聲源編碼I、(驅(qū)動)聲源增益γ的編碼→驅(qū)動聲源譯碼裝置20。
線性預(yù)測參數(shù)譯碼裝置16把同上述的線性預(yù)測參數(shù)的編碼相對應(yīng)的線性預(yù)測參數(shù)進(jìn)行譯碼，并將譯碼后的信息傳送到復(fù)合濾波器22。自適應(yīng)聲源譯碼裝置18把同上述的延遲參數(shù)L相對應(yīng)的自適應(yīng)聲源向量從自適應(yīng)聲源編碼本17中讀出，并根據(jù)上述的自適應(yīng)聲源增益誤差β的編碼，把自適應(yīng)聲源增益β進(jìn)行譯碼，產(chǎn)生出上述的自適應(yīng)聲源向量和上述的自適應(yīng)聲源增益β進(jìn)行相乘，從而得出自適應(yīng)聲源信號，而后向聲源信號產(chǎn)生裝置21輸出。驅(qū)動聲源譯碼裝置20把同上述的驅(qū)動聲源編碼I相對應(yīng)的驅(qū)動聲源向量從驅(qū)動聲源編碼本19中讀出，并根據(jù)上述的驅(qū)動聲源增益γ的編碼，把驅(qū)動聲源增益γ進(jìn)行譯碼，將上述驅(qū)動聲源向量和上述的驅(qū)動聲源增益γ相乘，產(chǎn)生出驅(qū)動聲源信號，并把該信號輸出到聲源信號產(chǎn)生裝置21。
聲源信號產(chǎn)生裝置21把從上述的自適應(yīng)聲源譯碼裝置18輸入的自適應(yīng)聲源信號和從上述的驅(qū)動聲源譯碼裝置20輸入的驅(qū)動聲源信號，進(jìn)行加法運(yùn)算，從而生成聲源信號，并將其分別發(fā)送到自適應(yīng)聲源編碼本17和復(fù)合濾波器22。復(fù)合濾波器22利用從上述的聲源信號產(chǎn)生裝置21輸入的聲源信號和從上述的線性預(yù)測參數(shù)譯碼裝置16輸入的線性預(yù)測參數(shù)，進(jìn)行線性預(yù)測復(fù)合，并產(chǎn)生輸出音頻7。
此外，在P.Kroon&B.S.Atal所著的“Pitch Predictors With HighTemporal Resolution”(ICASSP’90，PP661-664，1990)一文中，已經(jīng)描述出上述的現(xiàn)有音頻編碼與譯碼裝置的已改進(jìn)的先有技術(shù)，它能夠提供更高的輸出音頻效果。
這種改進(jìn)的音頻編碼與譯碼裝置與圖9所示現(xiàn)有的結(jié)構(gòu)的不同之處在于，自適應(yīng)聲源檢索裝置11里的檢索對象的延遲參數(shù)，不僅可取整數(shù)，也可取帶小數(shù)的有理數(shù)；自適應(yīng)聲源編碼本10和17對以前產(chǎn)生的采樣的聲源信號間進(jìn)行插補(bǔ)，產(chǎn)生出與帶有小數(shù)的有理數(shù)延遲參數(shù)相對應(yīng)的自適應(yīng)聲源向量，并將其輸出。當(dāng)延遲參數(shù)為帶小數(shù)的有理數(shù)時(shí)，自適應(yīng)聲源向量實(shí)例，如圖11所示。當(dāng)延遲參數(shù)L≥一個(gè)幀長時(shí)，自適應(yīng)聲源向量實(shí)例如圖11(a)所示；當(dāng)延遲參數(shù)L＜一個(gè)幀長時(shí)，情況如圖11(b)所示。
利用這樣的結(jié)構(gòu)，能以比輸入音頻采樣頻率更高的精度確定延遲參數(shù)，并相應(yīng)地產(chǎn)生自適應(yīng)聲源向量；因此，與JP-A64/40899公報(bào)所公開的裝置相比，這種裝置可產(chǎn)生更高質(zhì)的音頻輸出。
在JP-A4/344669公報(bào)中發(fā)布另外一種現(xiàn)有技術(shù)的音頻編碼與譯碼裝置。圖12就是表示該現(xiàn)有的音頻編碼與譯碼裝置的總體框圖。
在圖12里，與圖9所對應(yīng)的部分均給予同一標(biāo)號，為避免重復(fù)，該部分的詳細(xì)說明在此略去。
在圖12里，與圖9不同之處是標(biāo)號23、24代表驅(qū)動聲源編碼本。
現(xiàn)在，僅就用上述結(jié)構(gòu)實(shí)現(xiàn)的編碼與譯碼裝置說明其操作原理。
首先，例如延遲參數(shù)L處在20≤延遲參數(shù)L≤128的范圍內(nèi)，這種情況下，編碼部件里的自適應(yīng)聲源檢索裝置11，利用從自適應(yīng)聲源編碼本10輸入的自適應(yīng)聲源向量和從線性預(yù)測參數(shù)編碼裝置9輸入的量化的線性預(yù)測參數(shù)，進(jìn)行線性預(yù)測復(fù)合，產(chǎn)生出復(fù)合音頻向量。然后，自適應(yīng)聲源檢索裝置11根據(jù)從輸入音頻5以幀抽取的輸入音頻向量和上述的復(fù)合音頻向量，從中求得聽覺加權(quán)失真。通過比較對聽覺加權(quán)失真進(jìn)行評價(jià)，并求出使上述失真達(dá)到最小的延遲參數(shù)L及其對應(yīng)的自適應(yīng)聲源增益β；隨后，把求得的延遲參數(shù)L和自適應(yīng)聲源增益β的編碼，傳送給多路轉(zhuǎn)換裝置3和驅(qū)動聲源編碼本23；與此同時(shí)，把上述延遲參數(shù)L對應(yīng)的自適應(yīng)聲源向量和上述的自適應(yīng)聲源增益β相乘，從而產(chǎn)生出自適應(yīng)聲源信號，并把其發(fā)送到誤差信號產(chǎn)生裝置12和聲源信號產(chǎn)生裝置15。
在驅(qū)動聲源編碼本23里，例如，存儲著由隨機(jī)噪聲產(chǎn)生的N個(gè)驅(qū)動聲源向量，把從驅(qū)動聲源檢索裝置14輸入的與驅(qū)動聲源編碼i相對應(yīng)的驅(qū)動聲源向量，按與延遲參數(shù)L相對應(yīng)的每個(gè)周期重復(fù)，周期化并輸出該驅(qū)動聲源向量。這種周期化的驅(qū)動聲源向量的實(shí)例如圖13(a)所示。當(dāng)延遲參數(shù)L為帶小數(shù)的有理數(shù)時(shí)，如圖13(b)所示，對驅(qū)動聲源向量的取樣之間進(jìn)行插補(bǔ)，從而產(chǎn)生周期化的驅(qū)動聲源向量。
驅(qū)動聲源檢索裝置14對于N個(gè)驅(qū)動聲源向量，它利用從上述的驅(qū)動聲源編碼本23輸入來的周期化驅(qū)動聲源向量和從線性預(yù)測參數(shù)編碼裝置9輸入來的量化線性預(yù)測參數(shù)，將二者進(jìn)行線性預(yù)測復(fù)合，從而產(chǎn)生出復(fù)合音頻向量，然后，驅(qū)動聲源檢索裝置14求出從誤差信號產(chǎn)生裝置12輸入來的誤差信號向量和上述的復(fù)合音頻向量之間的聽覺加權(quán)失真。隨后，通過比較評價(jià)該失真，并且求出使上述的失真變成最小的驅(qū)動聲源編碼I及其對應(yīng)的驅(qū)動聲源增益γ，并把上述的驅(qū)動聲源編碼I和驅(qū)動聲源增益γ的編碼，傳送給多路轉(zhuǎn)換裝置3；與此同時(shí)，驅(qū)動聲源檢索裝置14把上述的驅(qū)動聲源編碼I對應(yīng)的周期化的驅(qū)動聲源向量乘以上述的驅(qū)動聲源增益γ，從而產(chǎn)生出驅(qū)動聲源信號，并將其發(fā)送到聲源信號產(chǎn)生裝置15。
編碼過程完成后，多路轉(zhuǎn)換裝置3把對應(yīng)上述的量化后的線性預(yù)測參數(shù)的編碼、預(yù)測參數(shù)L、驅(qū)動聲源編碼I、聲源增益β以及對應(yīng)于γ的編碼，通過傳輸線路6發(fā)送出去。
現(xiàn)在，說明有關(guān)譯碼部件2的操作原理。
首先，接收多路轉(zhuǎn)換裝置3輸出的分離裝置4，分別發(fā)送給各個(gè)裝置線性預(yù)測參數(shù)編碼→線性預(yù)測參數(shù)譯碼裝置16；預(yù)測參數(shù)L和聲源增益β的編碼→自適應(yīng)聲源譯碼裝置18和驅(qū)動聲源編碼本24；驅(qū)動聲源編碼I和聲源增益γ→驅(qū)動聲源編碼本24。
驅(qū)動聲源編碼本24和編碼部件的驅(qū)動聲源編碼本23都存儲著同樣多的N個(gè)驅(qū)動聲源向量，自驅(qū)動聲源譯碼裝置20輸入的與驅(qū)動聲源編碼I，相對應(yīng)驅(qū)動聲源向量，按對應(yīng)上述延遲參數(shù)L的每個(gè)周期重復(fù)周期化，并把它送給驅(qū)動聲源譯碼裝置20。
驅(qū)動聲源譯碼裝置20根據(jù)上述的驅(qū)動聲源增益γ的編碼，譯碼出驅(qū)動聲源增益γ，并把從上述的驅(qū)動聲源編碼本24輸入來的周期化驅(qū)動聲源向量與上述的驅(qū)動聲源增益γ相乘，從而產(chǎn)生出驅(qū)動聲源信號，并將其發(fā)送到聲源信號產(chǎn)生裝置21。
聲源信號傳送裝置21把來自聲源譯碼裝置18的自適應(yīng)聲源信號和來自上述的驅(qū)動聲源譯碼裝置20的驅(qū)動聲源信號，進(jìn)行加法運(yùn)算，產(chǎn)生出聲源信號，并將其發(fā)送到自適應(yīng)聲源編碼本17和復(fù)合濾波器22。復(fù)合濾波器22利用從上述的聲源信號產(chǎn)生裝置21輸入的聲源信號和從線性預(yù)測參數(shù)譯碼裝置16輸入來的線性預(yù)測參數(shù)，將二者進(jìn)行線性預(yù)測復(fù)合，并將其結(jié)果作為輸出音頻7輸出。
在如上所述的現(xiàn)有的音頻編碼和譯碼裝置里，在編碼過程中的聲源檢索期間，根據(jù)延遲參數(shù)，周期化產(chǎn)生自適應(yīng)聲源向量或驅(qū)動聲源向量，作為幀長的聲源向量把該向量進(jìn)行線性預(yù)測復(fù)合，而產(chǎn)生出復(fù)合音頻向量；在幀長的區(qū)域內(nèi)求出輸入音頻向量和復(fù)合音頻向量之間的失真。但是，因?yàn)樵谶M(jìn)行線性預(yù)測復(fù)合時(shí)需要處理的運(yùn)算量很大，于是就有在聲源檢索時(shí)要處理相當(dāng)大的運(yùn)算量的問題。
本發(fā)明正是為解決上述課題的產(chǎn)物，其目的在于，提供一種當(dāng)把音頻進(jìn)行編碼時(shí)，防止復(fù)合音頻質(zhì)量降低，以少的運(yùn)算量，能產(chǎn)生出高質(zhì)量的復(fù)合音頻輸出的音頻編碼裝置和音頻編碼譯碼裝置。
為了解決上述課題，本發(fā)明的音頻編碼裝置具備以下裝置目標(biāo)音頻產(chǎn)生裝置，用于根據(jù)輸入音頻產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的目標(biāo)音頻向量；自適應(yīng)聲源編碼本，用于根據(jù)過去生成的聲源信號，產(chǎn)生出具有與上述延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源向量；自適應(yīng)聲源檢索裝置，用于評價(jià)從上述的自適應(yīng)聲源向量中獲得的復(fù)合音頻向量相對于上述目標(biāo)音頻向量的失真，并檢索出使該失真變成最小的自適應(yīng)聲源向量；幀長聲源產(chǎn)生裝置，用于從上述的使失真變成最小的自適應(yīng)聲源向量中產(chǎn)生出具有幀長度的聲源信號。
并且，音頻編碼裝置將進(jìn)一步具備如下裝置第2目標(biāo)音頻產(chǎn)生裝置，用于由目標(biāo)音頻向量和使失真變成最小的自適應(yīng)聲源向量，產(chǎn)生出第2目標(biāo)音頻向量；驅(qū)動聲源編碼本，用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源向量；驅(qū)動聲源檢索裝置，用于評價(jià)由上述的驅(qū)動聲源向量獲得的第2復(fù)合音頻向量相對于第2目標(biāo)音頻向量的失真，并檢索出使失真變成最小的驅(qū)動聲源向量；第2幀產(chǎn)生裝置，用于從上述的使失真變成最小的驅(qū)動聲源向量中產(chǎn)生出第2幀長的聲源信號。
并且，音頻編碼裝置還具備如下裝置目標(biāo)音頻產(chǎn)生裝置，用于從音頻輸入產(chǎn)生出具有與延遲參數(shù)的相對應(yīng)的向量長度的目標(biāo)音頻向量；驅(qū)動聲源編碼本，用于產(chǎn)生具有與延遲參數(shù)相對應(yīng)的向量長度驅(qū)動聲源向量；驅(qū)動聲源檢索裝置，用于評價(jià)從上述的驅(qū)動聲源向量中獲得的復(fù)合音頻向量相對于上述目標(biāo)音頻向量的失真，并檢索出使失真變成最小的驅(qū)動聲源向量；幀長聲源產(chǎn)生裝置，用于從上述的使失真變成最小的驅(qū)動聲源向量產(chǎn)生出具有幀長度的聲源信號。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是，目標(biāo)音頻向量和驅(qū)動聲源向量的向量長度是依照輸入音頻的音調(diào)周期來決定的。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是，對應(yīng)延遲參數(shù)的向量長度可選取有理數(shù)。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是，目標(biāo)音頻產(chǎn)生裝置把以幀為單位的輸入音頻劃分成具有與延遲參數(shù)相對應(yīng)的每個(gè)向量長度的，并加權(quán)平均每個(gè)向量長度的輸入音頻部分，以便產(chǎn)生出目標(biāo)音頻向量。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是，目標(biāo)音頻產(chǎn)生裝置把具有與延遲參數(shù)相對應(yīng)的向量長度的整倍數(shù)長的輸入音頻劃分成每個(gè)向量長度，并加權(quán)平均每向量長度的輸入音頻，以便產(chǎn)生出目標(biāo)音頻向量。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是，具有與延遲參數(shù)相對應(yīng)的向量長度的的整倍數(shù)長度是等于幀長或大于幀長。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是，目標(biāo)音頻產(chǎn)生裝置按照對應(yīng)延遲參數(shù)的每個(gè)向量長的輸入音頻有關(guān)的特征量，對每個(gè)向量長度加權(quán)平均輸入音頻，從而確定出產(chǎn)生目標(biāo)音頻向量時(shí)的權(quán)。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是，有關(guān)具有與延遲參數(shù)相對應(yīng)的向量長度的的每一音頻輸入部分的特征量，至少包括有關(guān)輸入音頻的功率信息。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是，有關(guān)具有與延遲參數(shù)相對應(yīng)的向量長度的每一份輸入音頻的特征量，至少要包括輸入音頻的相關(guān)信息。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是，目標(biāo)音頻產(chǎn)生裝置按照具有與延遲參數(shù)相對應(yīng)的向量長度的每一輸入音頻的時(shí)序關(guān)系，把對每個(gè)向量長度的輸入音頻進(jìn)行加權(quán)平均，從而決定出產(chǎn)生目標(biāo)音頻向量時(shí)的權(quán)。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是，當(dāng)把具有與延遲參數(shù)相對應(yīng)的向量長度的每一輸入音頻進(jìn)行加權(quán)平均時(shí)，目標(biāo)音頻產(chǎn)生裝置可精細(xì)調(diào)整每一向量長度的輸入音頻時(shí)序關(guān)系。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是，幀聲源產(chǎn)生裝置在上述的每向量長度區(qū)域內(nèi)，重復(fù)具有與延遲參數(shù)相對應(yīng)的向量長度的的聲源向量并進(jìn)行周期化，從而產(chǎn)生出具有幀長聲源信號。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是，幀聲源產(chǎn)生裝置是在幀之間進(jìn)行插補(bǔ)具有與延遲參數(shù)相對應(yīng)的向量長度的的聲源向量，從而產(chǎn)生出聲源信號。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是，自適應(yīng)聲源向量檢索裝置配備有一個(gè)復(fù)合濾波器，并且利用來自復(fù)合濾波器的脈沖響應(yīng)，反復(fù)地計(jì)算由自適應(yīng)向量獲得的復(fù)合音頻向量相對于目標(biāo)音頻向量的失真。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是，配備有一個(gè)把輸入音頻進(jìn)行提高采樣的輸入音頻提高采樣裝置，目標(biāo)音頻產(chǎn)生裝置是根據(jù)提高采樣的輸入音頻產(chǎn)生目標(biāo)音頻向量的裝置。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是，配備有把過去生成的聲源信號進(jìn)行提高采樣的聲源提高采樣裝置，自適應(yīng)聲源編碼本是從提高采樣的過去生成的聲源信號產(chǎn)生出自適應(yīng)聲源向量的。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是，提高采樣裝置是依照延遲參數(shù)，改變提高采樣的比例因數(shù)。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是，提高采樣裝置僅在與延遲參數(shù)相對應(yīng)的向量長度的范圍內(nèi)，改變輸入音頻或聲源信號的提高采樣比例因數(shù)。
此外，有關(guān)本發(fā)明的音頻編碼譯碼裝置，在編碼器部分里配備如下裝置目標(biāo)音頻產(chǎn)生裝置，用于從輸入音頻產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的目標(biāo)音頻向量；自適應(yīng)聲源編碼本，用于從過去生成的聲源信號產(chǎn)生出對應(yīng)上述延遲參數(shù)的具有向量長度的自適應(yīng)聲源向量；自適應(yīng)聲源檢索裝置，用于評價(jià)從上述的自適應(yīng)聲源向量中獲得的復(fù)合音頻向量相對于上述的目標(biāo)音頻向量的失真，并檢索出使失真變成最小的自適應(yīng)聲源向量；以及幀聲源產(chǎn)生裝置，用于從上述的使失真變成最小的自適應(yīng)聲源向量產(chǎn)生出具有幀長度的聲源信號，另一方面，在譯碼器部件里配備如下裝置自適應(yīng)聲源編碼本，用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源向量；及幀長聲源產(chǎn)生裝置，用于從自適應(yīng)聲源向量產(chǎn)生出具有幀長度的聲源信號。
根據(jù)本發(fā)明的音頻編碼譯碼裝置進(jìn)一步配備，其編碼器方面，由下列裝置構(gòu)成第2目標(biāo)聲源產(chǎn)生裝置，用于從目標(biāo)音頻向量和自適應(yīng)聲源向量，產(chǎn)生出第2目標(biāo)音頻向量；驅(qū)動聲源編碼本，用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的的驅(qū)動聲源向量；驅(qū)動聲源檢索裝置，用于評價(jià)從上述的驅(qū)動聲源向量獲得的第2復(fù)合音頻向量相對于第2目標(biāo)音頻向量的失真，并檢索出使失真變成最小的驅(qū)動聲源向量；以及第2幀長產(chǎn)生裝置，用于從上述的使失真變成最小的驅(qū)動聲源向量中產(chǎn)生出第2幀長的聲源信號，在音頻器部件里，配備如下裝置驅(qū)動聲源編碼本，用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源向量；及第2幀長聲源產(chǎn)生裝置，用于從驅(qū)動聲源向量中產(chǎn)生出具有第2幀長度的的聲源信號。
圖1是表示作為本發(fā)明的實(shí)施例里的音頻編碼裝置和音頻裝置的總體結(jié)構(gòu)框圖。
圖2是表示本發(fā)明的實(shí)施例1的目標(biāo)音頻產(chǎn)生裝置的操作一例的說明圖。
圖3是表示本發(fā)明的實(shí)施例5的目標(biāo)音頻產(chǎn)生裝置的操作一例的說明圖。
圖4是表示本發(fā)明的實(shí)施例6的目標(biāo)音頻產(chǎn)生裝置的操作一例的說明圖。
圖5是表示本發(fā)明的實(shí)施例7的目標(biāo)音頻產(chǎn)生裝置的操作一例的說明圖。
圖6是表示本發(fā)明的實(shí)施例8的目標(biāo)音頻產(chǎn)生裝置的操作一例的說明圖。
圖7是表示本發(fā)明的實(shí)施例9的目標(biāo)音頻產(chǎn)生裝置的操作一例的說明圖。
圖8是表示作為本發(fā)明的實(shí)施例10的音頻編碼裝置和音頻譯碼裝置的總體框圖。
圖9是表示現(xiàn)有的音頻編碼和譯碼裝置的實(shí)例的總體框圖。
圖10是表示現(xiàn)有的音頻編碼和譯碼裝置里的自適應(yīng)聲源向量的實(shí)例。
圖11是表示現(xiàn)有的改進(jìn)型音頻編碼和譯碼裝置里的自適應(yīng)聲源向量的實(shí)例。
圖12是表示現(xiàn)有的音頻編碼和譯碼裝置的另外一例的總體結(jié)構(gòu)框圖。
圖13是表示音頻編碼和譯碼裝置里的周期化驅(qū)動聲源向量的實(shí)例的說明圖。
實(shí)施例1圖1是表示本發(fā)明的實(shí)施例1的音頻編碼裝置和音頻譯碼裝置的總體結(jié)構(gòu)框圖。
在圖1里，各標(biāo)號分別表示1是編碼器部件；2是譯碼器部件；3是多路轉(zhuǎn)換裝置；4是分離裝置；5是輸入音頻；6是傳輸線路；7是輸出音頻編碼器部件是由如下的8、9以及25～36各個(gè)裝置所構(gòu)成的；其中，8是線性預(yù)測參數(shù)分析裝置；9是線性預(yù)測參數(shù)編碼裝置；15是聲源信號產(chǎn)生裝置；25是音調(diào)分析裝置，用于抽取輸入音頻的音調(diào)周期；26是延遲參數(shù)檢索區(qū)域決定裝置，用于決定出在檢索自適應(yīng)聲源向量時(shí)所需要的延遲參數(shù)的檢索范圍；27是音頻輸入提高采樣裝置，用于提高采樣輸入音頻；28是目標(biāo)音頻產(chǎn)生裝置，用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的目標(biāo)音頻向量；29是聲源信號提高采樣裝置，用于提高采樣過去生成的聲源信號；30是自適應(yīng)聲源編碼本，用于從過去生成的聲源信號產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源向量；31是自適應(yīng)聲源檢索裝置，用于評價(jià)從自適應(yīng)聲源向量獲得的復(fù)合音頻向量相對于目標(biāo)音頻向量的失真，并檢索出使失真變成最小的自適應(yīng)聲源向量；32是幀聲源產(chǎn)生裝置，用于從具有與延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源信號產(chǎn)生出具有幀長度的自適應(yīng)聲源信號；33是第2目標(biāo)音頻產(chǎn)生裝置，用于產(chǎn)生出具有與驅(qū)動聲源檢索時(shí)所用的延遲參數(shù)相對應(yīng)向量長度的目標(biāo)音頻向量；34是驅(qū)動聲源編碼本，用于輸出具有與延遲參數(shù)相對應(yīng)的向量長度的的驅(qū)動聲源向量；35是驅(qū)動聲源檢索裝置，用于評價(jià)從驅(qū)動聲源向量獲得的復(fù)合音頻向量相對于第2目標(biāo)音頻向量的失真，并檢索出使失真變成最小的驅(qū)動聲源向量；36是第2幀聲源產(chǎn)生裝置，用于從具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源信號產(chǎn)生出具有幀長度的驅(qū)動聲源信號。
此外，譯碼器部件是由如下的16、21、22乃至37～43各個(gè)裝置所構(gòu)成。16是信息預(yù)測參數(shù)譯碼裝置；21是聲源信號產(chǎn)生裝置；22是復(fù)合濾波器；37是聲源信號提高采樣裝置，用于提高采樣過去生成的聲源信號；38是自適應(yīng)聲源編碼本，用于輸出具有與延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源向量；39是自適應(yīng)聲源譯碼裝置-用于譯碼出具有與延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源信號；40是幀聲源產(chǎn)生裝置，用于從具有與延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源信號中產(chǎn)生出具有幀長度的自適應(yīng)聲源信號；41是驅(qū)動聲源編碼本，用于輸出具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源向量；42是驅(qū)動聲源譯碼裝置，用于譯碼出具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源信號；43是第2幀聲源產(chǎn)生裝置，用于從具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源信號，產(chǎn)生出具有幀長度的驅(qū)動聲源信號。
以下僅就實(shí)施例的編碼器部件的操作，說明如下首先，在編碼器部件1里，譬如說是以8KHz采樣的數(shù)字化音頻作為輸入音頻5的輸入信號。線性預(yù)測參數(shù)分析裝置8對上述輸入音頻5的輸入信號進(jìn)行分析，并抽出線性預(yù)測參數(shù)，它就是音頻的頻譜包絡(luò)信息。然后，線性預(yù)測參數(shù)編碼裝置9把抽取出來的上述線性預(yù)測參數(shù)進(jìn)行量化，并將與其對應(yīng)的編碼發(fā)送給多路轉(zhuǎn)換裝置3。與此同時(shí)，把量化的線性預(yù)測參數(shù)分別發(fā)送到自適應(yīng)聲源檢索裝置31、第2目標(biāo)音頻產(chǎn)生裝置33和驅(qū)動聲源檢索裝置35。
音調(diào)分析裝置25通過分析音頻輸入5抽出音調(diào)周期P。根據(jù)上述的音調(diào)周期P，譬如說，按照下面的等式(1)，延遲參數(shù)檢索區(qū)域決定裝置26決定出當(dāng)查找自適應(yīng)聲源向量時(shí)所需要的延遲參數(shù)檢索范圍1min≤延遲參數(shù)≤1max；并把它發(fā)送到輸入音頻提高采樣裝置27、聲源信號提高采樣裝置29和自適應(yīng)聲源檢索裝置31。上述所用過的等式(1)中1min＝P-ΔP1max＝P+ΔP…………(1)其中，例如ΔP是P/10輸入音頻提高采樣裝置27，根據(jù)由延遲參數(shù)檢索區(qū)決定裝置26輸入的延遲參數(shù)的檢索范圍所規(guī)定的采樣率，例如，在對聲源信號進(jìn)行編碼作為單位的幀區(qū)間內(nèi)，實(shí)現(xiàn)對輸入音頻提高采樣，并將采樣結(jié)果傳送給目標(biāo)音頻產(chǎn)生裝置28。其中，上述的規(guī)定的采樣率，譬如說是按以下情況決定的當(dāng)1min≤45，4倍采樣率提高采樣；當(dāng)45≤1min≤65，以2倍采樣率進(jìn)行提高采樣；當(dāng)65≤1min，則不進(jìn)行提高采樣。
目標(biāo)音頻采樣裝置28把由上述的輸入音頻提高采樣裝置27所輸入的具有幀長度的提高采樣輸入音頻按照由自適應(yīng)聲源檢索裝置31輸入來的延遲參數(shù)L對應(yīng)關(guān)系劃分成具有每份周期l；然后，通過在把對應(yīng)延遲參數(shù)L的具有相量長度的每份輸入音頻進(jìn)行加權(quán)平均計(jì)算，產(chǎn)生出對應(yīng)延遲參數(shù)L的具有向量長度的目標(biāo)音頻相量；于是，目標(biāo)音頻采樣裝置28把該目標(biāo)聲源向量輸出給自適應(yīng)聲源檢索裝置31和第2目標(biāo)音頻產(chǎn)生裝置33。其中，延遲參數(shù)L可以是整數(shù)，也可以帶有小數(shù)的有理數(shù)。按照延遲參數(shù)L的存在范圍，例如，lint作為整數(shù)值延遲的情況下，可以取以下的一種值當(dāng)1＜45的情況下，可以取lint、lint+1/4、lint+1/2、lint+3/4；當(dāng)45≤1＜65的情況下，可取lint、lint+1/2；當(dāng)65≤1的情況下，可取lint。
典型目標(biāo)音頻向量如圖2所示，它具有從幀長度輸入音頻產(chǎn)生的對應(yīng)延遲參數(shù)1的向量長度。其中，若延遲參數(shù)L≥幀長度的情況下，則不進(jìn)行加權(quán)平均計(jì)算，并把幀長度的輸入音頻當(dāng)作是目標(biāo)音頻向量。
當(dāng)聲源信號提高采樣裝置29把從聲源信號產(chǎn)生裝置15收到過去生成的聲源信號，只有在根據(jù)從上述的延遲參數(shù)檢索區(qū)域決定裝置26輸入的延遲參數(shù)的自適應(yīng)聲源檢索中的自適應(yīng)聲源檢索區(qū)間是必要的情況下，才能按照上述延遲參數(shù)檢索范圍的采樣率執(zhí)行提高采樣操作，并把產(chǎn)生的聲源信號結(jié)果發(fā)送到自適應(yīng)聲源編碼本30。其中，采樣率是按照以下所述的規(guī)則決定的若在1＜45的區(qū)間內(nèi)，則按4倍采樣率進(jìn)行提高采樣；若在45≤1＜65的區(qū)間內(nèi)，則按2倍采樣率進(jìn)行提高采樣；若在65＜1的區(qū)間內(nèi)，則不進(jìn)行提高采樣。
自適應(yīng)聲源編碼本30根據(jù)由上述的聲源信號提高采樣裝置29輸入的提高采樣的聲源信號，把由自適應(yīng)聲源檢索裝置31輸入來的具有與延遲參數(shù)L相對應(yīng)的向量長度的的自適應(yīng)聲源向量送給自適應(yīng)聲源檢索裝置31。在這里，上述的自適應(yīng)聲源向量是通過抽取比延遲參數(shù)L早一個(gè)采樣的聲源信號而獲得的；若在延遲參數(shù)l≥幀長度的情況下，則自適應(yīng)聲源向量是通過抽取比延遲參數(shù)早一個(gè)幀長的采樣的聲源信號獲得的。
自適應(yīng)檢索裝置31配備有復(fù)合濾波器，并利用來自線性預(yù)測參數(shù)編碼裝置9的量化線性預(yù)測參數(shù)，求出復(fù)合濾波器的脈沖響應(yīng)。然后，對于給定的延遲參數(shù)處在1min≤l≤1max的范圍內(nèi)時(shí)，則自適應(yīng)聲源檢索裝置31通過利用上述的脈沖響應(yīng)，反復(fù)地計(jì)算并合成來自自適應(yīng)聲源編碼本30的自適應(yīng)聲源向量，從而產(chǎn)生出復(fù)合音頻向量。自適應(yīng)聲源檢索裝置31求出由上述的目標(biāo)音頻產(chǎn)生裝置21輸入的目標(biāo)音頻向量相對于上述的復(fù)合音頻向量的聽覺加權(quán)失真。然后，通過比較，評價(jià)上述失真，自適應(yīng)聲源檢索裝置31求出使上述的失真變成最小的延遲參數(shù)L以及與其對應(yīng)的自適應(yīng)聲源增益β，并把上述的延遲參數(shù)L和自適應(yīng)聲源增益β的編碼，傳送給多路轉(zhuǎn)換裝置3和驅(qū)動聲源編碼本34；與此同時(shí)，自適應(yīng)檢索裝置31把與上述的延遲參數(shù)L對應(yīng)的自適應(yīng)聲源向量和上述的自適應(yīng)聲源增益β相乘，從而產(chǎn)生出自適應(yīng)聲源信號，并把它發(fā)送到幀聲源傳送裝置32和第2目標(biāo)音頻產(chǎn)生裝置33。在這里，如果延遲參數(shù)L＜幀長度的情況下，則自適應(yīng)聲源信號是L長的采樣；若L≥幀長度的情況下，則自適應(yīng)聲源信號是一個(gè)幀長度信號。
幀聲源產(chǎn)生裝置32根據(jù)由自適應(yīng)聲源檢索裝置31輸入的自適應(yīng)聲源信號，例如，在每個(gè)L的周期內(nèi)重復(fù)并周期化，產(chǎn)生出幀長度的自適應(yīng)聲源信號，并將其發(fā)送到聲源信號產(chǎn)生裝置15。
第2目標(biāo)聲源產(chǎn)生裝置33把從上述的自適應(yīng)聲源檢索裝置31輸入的自適應(yīng)聲源信號和利用由線性預(yù)測參數(shù)編碼裝置9輸入來的量化線性預(yù)測參數(shù)，使二者實(shí)現(xiàn)線性預(yù)測復(fù)合，從而產(chǎn)生出復(fù)合音頻向量。于是，第2目標(biāo)音頻產(chǎn)生裝置33求出由目標(biāo)音頻產(chǎn)生裝置28輸入來的目標(biāo)音頻向量和上述的復(fù)合音頻向量之間的差分，并以此作為第2目標(biāo)音頻向量，將其發(fā)送給驅(qū)動聲源檢索裝置35。
在驅(qū)動聲源編碼本34里，例如，存儲著由隨機(jī)噪聲產(chǎn)生的N個(gè)驅(qū)動聲源向量。驅(qū)動聲源編碼本34在對應(yīng)延遲參數(shù)L的向量長度里，抽出由驅(qū)動聲源檢索裝置35輸入來的對應(yīng)驅(qū)動聲源編碼i的驅(qū)動聲源向量，并將其輸出。若延遲參數(shù)L≥幀長度時(shí)，則輸出具有幀長度的驅(qū)動聲源向量。
驅(qū)動聲源檢索裝置35對應(yīng)N個(gè)驅(qū)動聲源向量把從上述的驅(qū)動聲源編碼本34輸入來的信號中，抽出驅(qū)動聲源向量和利用從上述的線性預(yù)測參數(shù)編碼裝置9輸入來的量化線性預(yù)測參數(shù)，使二者進(jìn)行線性預(yù)測復(fù)合，從而產(chǎn)生出復(fù)合音頻向量。于是，驅(qū)動聲源檢索裝置35求出由上述的第2目標(biāo)音頻產(chǎn)生裝置33輸入來的第2目標(biāo)音頻向量相對于上述的復(fù)合音頻向量的聽覺加權(quán)失真。然后，通過比較評價(jià)上述的失真，求出使上述董事長變成最小的驅(qū)動聲源編碼I和與其對應(yīng)驅(qū)動聲源增益γ，并把上述的驅(qū)動聲源編碼I和驅(qū)動聲源增益γ的編碼送到多路轉(zhuǎn)換裝置3；與此同時(shí)，把與上述的驅(qū)動聲源編碼I對應(yīng)的驅(qū)動向量乘以上述的驅(qū)動聲源增益γ，從而產(chǎn)生出驅(qū)動聲源信號，并將該信號傳送給第2幀聲源產(chǎn)生裝置36。
第2幀聲源產(chǎn)生裝置36根據(jù)由上述驅(qū)動聲源檢索裝置35所輸入的驅(qū)動聲源信號，例如，按每周期L重復(fù)并周期化，從而產(chǎn)生出幀長度的驅(qū)動聲源信號，并將它發(fā)送給聲源信號產(chǎn)生裝置15。
聲源信號產(chǎn)生裝置15把由上述的幀聲源產(chǎn)生裝置32所輸入的幀長度自適應(yīng)聲源信號和有由上述的第2幀聲源產(chǎn)生裝置36所輸入的幀長度的驅(qū)動聲源信號進(jìn)行加法運(yùn)算，從而產(chǎn)生出聲源信號，并把它傳送給聲源信號提高采樣裝置29。
當(dāng)上述的編碼過程完成后，多路轉(zhuǎn)換裝置3把上述的量化以后的對應(yīng)線性預(yù)測參數(shù)的編碼、延遲參數(shù)L、驅(qū)動聲源信號I以及聲源增益β和對應(yīng)γ的編碼，通過傳輸線路6輸出。
以上所述的操作是本發(fā)明的第1實(shí)施例的編碼器的特征性操作。
以下，就譯碼器部件2進(jìn)行說明。
首先，用于接收多路轉(zhuǎn)換裝置3輸出信息的分離裝置4通過分離過程，把相應(yīng)的信息分別傳送給以下各裝置把線性預(yù)測參數(shù)的編碼送給線性預(yù)測參數(shù)編碼裝置16；把延遲參數(shù)L送給自適應(yīng)聲源譯碼裝置39和驅(qū)動編碼本41；把聲源增益β的編碼送給自適應(yīng)聲源譯碼裝置39；把驅(qū)動聲源編碼I和聲源增益γ的編碼送給驅(qū)動聲源檢索裝置42。
首先，自適應(yīng)聲源譯碼裝置39把上述的延遲參數(shù)L傳送給聲源信號提高采樣裝置37和自適應(yīng)聲源編碼本38。聲源信號提高采樣裝置37把由聲源信號產(chǎn)生裝置21所輸入的在過去產(chǎn)生的聲源信號，僅在按照上述的自適應(yīng)聲源譯碼裝置39輸入的延遲參數(shù)L生成自適應(yīng)聲源向量時(shí)所需要的區(qū)間內(nèi)，才能按照上述的延遲參數(shù)L規(guī)定的采樣率進(jìn)行提高采樣，并將提高采樣的聲源信號輸出給自適應(yīng)聲源編碼本38。在這里，提高采樣率是與編碼器部件里的聲源信號提高采樣裝置29所采取的同樣方式進(jìn)行確定的。
自適應(yīng)聲源編碼本38根據(jù)由上述的聲源信號提高采樣裝置37所輸入的提高采樣的聲源信號，產(chǎn)生出具有與自適應(yīng)聲源譯碼裝置39所輸入的延遲參數(shù)L相對應(yīng)的向量長度的自適應(yīng)聲源向量，并把它傳送給自適應(yīng)聲源譯碼裝置39。在這里，上述的自適應(yīng)聲源向量是抽出的比延遲參數(shù)L，早L采樣聲源信號，當(dāng)延遲參數(shù)L≥幀長度時(shí)，將從比延遲參數(shù)L早L采樣中抽取一幀長的聲源信號。
自適應(yīng)聲源譯碼裝置39根據(jù)上述的自適應(yīng)聲源增益β的編碼，譯碼出自適應(yīng)聲源增益β，把由上述的自適應(yīng)聲源編碼本38輸入的自適應(yīng)聲源向量乘以上述的自適應(yīng)聲源增益β，從而產(chǎn)生出自適應(yīng)聲源信號，并將它傳送給幀聲源產(chǎn)生裝置40。幀聲源產(chǎn)生裝置40根據(jù)由上述的自適應(yīng)聲源譯碼裝置39輸入的自適應(yīng)聲源信號，例如，按每周期L重復(fù)并周期化，從而產(chǎn)生出幀長自適應(yīng)聲源信號，并將它傳送給聲源信號產(chǎn)生裝置21。
驅(qū)動聲源編碼本41和編碼器部件里的驅(qū)動聲源編碼本34，都存儲有同樣多的N個(gè)驅(qū)動聲源向量；按照與上述的延遲參數(shù)L相對應(yīng)的向量長度方式抽出由驅(qū)動聲源譯碼裝置42輸入的對應(yīng)驅(qū)動聲源編碼I的驅(qū)動聲源向量，并將它送給驅(qū)動聲源譯碼裝置42。
驅(qū)動聲源譯碼裝置42根據(jù)上述的驅(qū)動聲源增益γ的編碼，譯碼出驅(qū)動聲源增益γ，把由上述的驅(qū)動聲源編碼本輸入的信息中抽出的驅(qū)動聲源向量乘以所述驅(qū)動聲源增益γ，從而產(chǎn)生出驅(qū)動聲源信號，并將它傳送給第2幀聲源產(chǎn)生裝置43。第2幀聲源產(chǎn)生裝置43利用由上述的驅(qū)動聲源譯碼裝置42輸入的驅(qū)動聲源信號，例如，按每周期L重復(fù)該收到的信號，從而產(chǎn)生出周期化具有幀長度的驅(qū)動聲源信號，并將它傳送給聲源信號產(chǎn)生裝置21。
聲源信號產(chǎn)生裝置21把由上述的幀聲源產(chǎn)生裝置40所輸入的具有幀長度自適應(yīng)聲源信號和由上述的第2幀聲源產(chǎn)生裝置43輸入的具有幀長度的驅(qū)動聲源信號，實(shí)現(xiàn)加法運(yùn)算，于是產(chǎn)生出聲源信號并將它傳送給聲源信號提高采樣裝置37和復(fù)合濾波器22。復(fù)合濾波器22利用上述的聲源信號產(chǎn)生裝置21輸入的聲源信號和由線性預(yù)測參數(shù)譯碼裝置16輸入的線性預(yù)測參數(shù)，使兩者進(jìn)行線性預(yù)測復(fù)合，并輸出輸出音頻7。
以上所述的操作是本發(fā)明實(shí)施例1的音頻譯碼裝置里的特征性操作。
根據(jù)本發(fā)明的實(shí)施例1，當(dāng)決定最佳延遲參數(shù)時(shí)，延遲參數(shù)1比幀長短的情況下，周期性的加權(quán)平均計(jì)算輸入音頻，從而產(chǎn)生出具有向量長度l-的目標(biāo)音頻向量；另一方面，線性預(yù)測復(fù)合具有向量長度l的自適聲源應(yīng)向量，評價(jià)產(chǎn)生出的復(fù)合音頻向量相對于目標(biāo)音頻向量之間的失真；而且當(dāng)決定最佳的驅(qū)動聲源編碼時(shí)，線性預(yù)測復(fù)合具有向量長度的驅(qū)動聲源向量，通過利用失真評價(jià)方法去評價(jià)復(fù)合音頻向量，防止復(fù)合音頻的質(zhì)量惡化，可以用少量的運(yùn)算量產(chǎn)生出高質(zhì)量的復(fù)合音頻。
實(shí)施例2上述的實(shí)施例1，在幀聲源產(chǎn)生裝置32、40以及第2幀聲源產(chǎn)生裝置36和43里，每一周期L重復(fù)并周期化與延遲參數(shù)L相對應(yīng)的向量長度的自適應(yīng)聲源信號或驅(qū)動聲源信號，產(chǎn)生出幀長度的自適應(yīng)聲源信號或驅(qū)動聲源信號；但是，例如在每周期L可以作為波形內(nèi)插，例如，按每周期L進(jìn)行波形插值處理，在幀之間進(jìn)行波形內(nèi)插插上述的對應(yīng)延遲參數(shù)L的具有向量長度的自適應(yīng)聲源信號或驅(qū)動聲源信號，也能很好地產(chǎn)生出自適應(yīng)聲源信號或驅(qū)動聲源信號。
根據(jù)本發(fā)明的第2實(shí)施例，使幀間的聲源信號變化變得平滑，復(fù)合音頻的再現(xiàn)性會更好，可以提高質(zhì)量。
實(shí)施例3在上述的實(shí)施例1和2里，根據(jù)對應(yīng)延遲參數(shù)L的具有向量長度的自適應(yīng)聲源信號和驅(qū)動聲源信號，利用幀聲源產(chǎn)生裝置以及第2幀聲源產(chǎn)生裝置，產(chǎn)生出具有幀長度的自適應(yīng)聲源信號和具有幀長度的驅(qū)動聲源信號，把二者進(jìn)行加法運(yùn)算，產(chǎn)生出具有幀長度的聲源信號；但是，可把對應(yīng)延遲參數(shù)L的具有向量長度的自適應(yīng)聲源信號和驅(qū)動聲源信號進(jìn)行加法運(yùn)算，從而產(chǎn)生出具有與延遲參數(shù)L相對應(yīng)的向量長度的聲源信號；這可以舉例說明如下按每周期L，把上述的信號進(jìn)行重復(fù)并周期化，從而也能很好地產(chǎn)生出具有幀長度的聲源信號。
實(shí)施例4在上述的實(shí)施例1里，編碼器部件和音頻器部件都采用新的結(jié)構(gòu)；但是，編碼器部件依然選用實(shí)施例1的編碼器結(jié)構(gòu)，然而譯碼器部件選用圖12所示的以往譯碼器部件結(jié)構(gòu)，也是可以的。
實(shí)施例5上述的實(shí)施例1，在其目標(biāo)音頻產(chǎn)生裝置28方面，根據(jù)具有幀長度的輸入音頻產(chǎn)生出具有與延遲參數(shù)L相對應(yīng)的向量長度的目標(biāo)音頻向量；但是，如圖3所示，從具有與延遲參數(shù)L相對應(yīng)的向量長度的整倍數(shù)長的輸入音頻，也能很好地產(chǎn)生出目標(biāo)音頻向量。
根據(jù)本實(shí)施例5，在產(chǎn)生目標(biāo)音頻向量時(shí)的平均化處理里，可以進(jìn)行簡單處理，因?yàn)橐巡簧婕皫в胁煌蛄块L度的處理任務(wù)。而且，根據(jù)在對超出幀長的輸入音頻進(jìn)行音頻編碼時(shí)的評價(jià)過程中，按照已考慮到已知幀的復(fù)合音頻如何影響其以后幀的思路進(jìn)行編碼，所以使得復(fù)合音頻具有很好的再現(xiàn)性，從而可提高輸出質(zhì)量。
實(shí)施例6上述的實(shí)施例1，在其目標(biāo)音頻產(chǎn)生裝置28里，根據(jù)輸入音頻，當(dāng)產(chǎn)生具有與延遲參數(shù)L相對應(yīng)的向量長度的目標(biāo)音頻向量時(shí)，只是作簡單的平均計(jì)算；但是，如圖4所示，按照具有與延遲參數(shù)L相對應(yīng)的向量長度的輸入音頻功率加權(quán)平均計(jì)算，譬如說，輸入音頻功率越大，則加的權(quán)也越大，按照這樣進(jìn)行加權(quán)平均計(jì)算。
根據(jù)本發(fā)明實(shí)施例6，在產(chǎn)生目標(biāo)音頻向量時(shí)的平均化處理中，由于按照輸入音頻功率進(jìn)行加權(quán)后實(shí)現(xiàn)音頻編碼，所以對主觀質(zhì)量(Subjectivequality)給予影響大的復(fù)合音頻的功率大部分的再現(xiàn)性都變得很好，從而可以提高音頻質(zhì)量。
實(shí)施例7上述的實(shí)施例1，在其目標(biāo)音頻產(chǎn)生裝置28里，從輸入音頻產(chǎn)生出具有與延遲參數(shù)L相對應(yīng)的向量長度的目標(biāo)音頻向量時(shí)，只是進(jìn)行簡單的平均計(jì)算；但是，如圖5所示，按照具有與各延遲參數(shù)L相對應(yīng)的向量長度的輸入音頻之間的相關(guān)值加權(quán)，例如，當(dāng)具有與其他各延遲參數(shù)L相對應(yīng)的向量長度的輸入音頻相關(guān)程度較低的情況下，可取小的加權(quán)值，這樣進(jìn)行加權(quán)平均計(jì)算也是可以的。
根據(jù)本實(shí)施例7，在產(chǎn)生目標(biāo)音頻向量的加權(quán)平均處理中，由于按照輸入音頻具有周期l的周期性的情況，對相關(guān)程度較低的部分取小的加權(quán)值的原則進(jìn)行音頻編碼，即使是音調(diào)周期變動的音頻，也能產(chǎn)生出對應(yīng)1音調(diào)周期的失真程度小的目標(biāo)音頻向量，并能獲得更好的復(fù)合音頻再現(xiàn)性，從而可提高質(zhì)量。
實(shí)施例8上述的實(shí)施例1，在其目標(biāo)音頻產(chǎn)生裝置28里，當(dāng)從輸入音頻產(chǎn)生出具有與延遲參數(shù)L相對應(yīng)的向量長度的目標(biāo)音頻向量時(shí)，只是進(jìn)行簡單平均處理；但是，如圖6所示，按照具有與各延遲參數(shù)L相對應(yīng)的向量長度的輸入音頻間的位置加權(quán)，例如，對于幀邊界附近的輸入音頻，其加權(quán)值可取較大的值進(jìn)行加權(quán)平均計(jì)算也是可以的。
根據(jù)本實(shí)施例8，在產(chǎn)生目標(biāo)音頻向量時(shí)的加權(quán)平均處理中，給幀邊界附近的輸入音頻的加權(quán)值較大，生成目標(biāo)音頻向量，由于按照這種方法實(shí)現(xiàn)編碼，所以幀邊界附近的復(fù)合音頻再現(xiàn)性良好，可使幀間的復(fù)合音頻變化變得平滑起來。這種效果在本實(shí)施例2里的用幀間插補(bǔ)方法產(chǎn)生聲源信號時(shí)，尤為顯著。
實(shí)施例9上述實(shí)施例1，在其目標(biāo)音頻產(chǎn)生裝置28里，當(dāng)從輸入音頻產(chǎn)生出具有與延遲參數(shù)L相對應(yīng)的向量長度的目標(biāo)音頻向量時(shí)，把輸入音頻按每周期l進(jìn)行加權(quán)平均計(jì)算；但是，如圖7所示，精細(xì)調(diào)整抽出輸入音頻的位置，例如，使與各延遲參數(shù)L相對應(yīng)的向量長度的輸入音頻間的相互相關(guān)變?yōu)樽畲蠖M(jìn)行加法平均也是可以的。
根據(jù)本實(shí)施例9，在產(chǎn)生目標(biāo)音頻向量時(shí)的平均化處理中，按照能使具有與延遲參數(shù)L相對應(yīng)的向量長度的輸入音頻之間相互相關(guān)變成最大的原則，精細(xì)地調(diào)整抽出的位置，即使對于音調(diào)周期變動的輸入音頻，也可產(chǎn)生出對應(yīng)1音調(diào)周期l的失真達(dá)到最小程度的目標(biāo)音頻向量，將可使目標(biāo)音頻的再現(xiàn)性良好，可提高質(zhì)量。
實(shí)施例10圖8是表示本發(fā)明的實(shí)施例10音頻編碼裝置和音頻譯碼裝置總體結(jié)構(gòu)框圖。在該框圖里，與圖1中的相同部分都標(biāo)上同樣的標(biāo)號，因而省略其說明部分。
在圖8里，它采取有別于圖1的新結(jié)構(gòu)如下44是把輸入音頻進(jìn)行提高采樣的輸入音頻提高采樣裝置；45是產(chǎn)生出具有與音調(diào)周期相對應(yīng)的向量長度的目標(biāo)音頻向量的目標(biāo)音頻產(chǎn)生裝置；46和51為驅(qū)動聲源編碼本，它用于輸出具有與音調(diào)周期相對應(yīng)的向量長度的驅(qū)動聲源向量；47是驅(qū)動聲源檢索裝置，它用于評價(jià)由驅(qū)動聲源向量獲得的復(fù)合音頻向量相對應(yīng)目標(biāo)音頻向量的失真，并且檢索出使失真變成最小的驅(qū)動聲源向量；48是第2目標(biāo)音頻產(chǎn)生裝置，它產(chǎn)生出在第2驅(qū)動聲源向量檢索里的與音調(diào)周期相對應(yīng)的向量長度的目標(biāo)音頻向量；49和54是第2驅(qū)動聲源編碼本，它用于輸出具有與音調(diào)周期相對應(yīng)的向量長度的第2驅(qū)動聲源向量；50是第2驅(qū)動聲源檢索裝置，它評價(jià)由第2驅(qū)動聲源向量獲得的復(fù)合音頻向量相對于第2目標(biāo)音頻向量的失真并檢索出使上述的失真變成最小的驅(qū)動聲源向量；52驅(qū)動聲源譯碼裝置，它譯碼出具有與音調(diào)周期相對應(yīng)的向量長度的驅(qū)動聲源信號；53是幀聲源產(chǎn)生裝置，它根據(jù)具有與音調(diào)周期相對應(yīng)的向量長度的驅(qū)動聲源信號，產(chǎn)生出具有幀長度的驅(qū)動聲源信號；55是第2驅(qū)動聲源譯碼裝置，它譯碼出具有與音調(diào)周期相對應(yīng)的向量長度的第2驅(qū)動聲源信號；56是第2幀聲源產(chǎn)生裝置，它根據(jù)具有與音調(diào)周期相對應(yīng)的向量長度的第2驅(qū)動聲源信號，產(chǎn)生出具有幀長度的驅(qū)動聲源信號。
以下將以上述的新結(jié)構(gòu)為中心，解說其操作原理。
首先，在編碼器部件1里音調(diào)分析裝置25分析輸入音頻5，抽取音調(diào)周期P，并將它傳送給多路轉(zhuǎn)換裝置3，輸入音頻提高采樣裝置44，目標(biāo)音頻產(chǎn)生裝置45，驅(qū)動聲源編碼本46和第2驅(qū)動聲源編碼本49。其中，音調(diào)周期除了可選取整數(shù)值之外，也可選取非整數(shù)的有理數(shù)，按照P值存在范圍，例如，把Pint作為整數(shù)音調(diào)周期的情況下可選取如下的各種數(shù)值當(dāng)P＜45的情況下，可取Pint、Pint+1/4、Pint+1/2和Pint+3/4；當(dāng)45≤P＜65的情況下，可取Pint、Pint+1/2；當(dāng)65≤P的情況下，則可取Pint值。
輸入音頻提高采樣裝置44按照由音調(diào)分析裝置25所輸入的音調(diào)周期規(guī)定的采樣率，對輸入音頻與進(jìn)行提高采樣操作，例如，在作為編碼聲源信號單位的幀區(qū)間里進(jìn)行提高采樣，并將采樣結(jié)果發(fā)送給目標(biāo)音頻產(chǎn)生裝置45。其中，提高采樣率，例如按以下情況確定，當(dāng)P＜45的情況下，以4倍提高采樣操作；當(dāng)45≤P＜65的情況下，以2倍提高采樣操作；當(dāng)65≤P的情況下，則不進(jìn)行提高采樣操作。
目標(biāo)音頻產(chǎn)生裝置45按照由音調(diào)分析裝置25輸入來的周期P，例如，按照每一周期P加法平均計(jì)算由上述的輸入音頻提高采樣裝置44所輸入的以提高采樣的具有向量長度的輸入音頻，從而產(chǎn)生出具有向量長度P的目標(biāo)音頻向量，并將它發(fā)送到確定聲源檢索裝置47和第2目標(biāo)音頻產(chǎn)生裝置48。其中，P≥幀長度的情況下，則不進(jìn)行上述的加法平均計(jì)算，并把具有幀長度的輸入音頻作為目標(biāo)音頻向量。
驅(qū)動聲源編碼本46里，例如，存儲著由隨機(jī)噪聲產(chǎn)生的N個(gè)驅(qū)動聲源向量，并按照由上述的音調(diào)分析裝置25所輸入的具有與音調(diào)周期P相對應(yīng)的向量長度，抽取并輸出由驅(qū)動聲源檢索裝置47所輸入的與驅(qū)動聲源i相對應(yīng)的驅(qū)動聲源向量。在這里，若P≥幀長度時(shí)，則輸出具有幀長度的驅(qū)動聲源向量。
驅(qū)動聲源檢索裝置47對于N個(gè)驅(qū)動聲源向量，把由上述的驅(qū)動聲源編碼本46里抽出的驅(qū)動聲源向量和由線性預(yù)測參數(shù)編碼裝置9所輸入的已量化的線性預(yù)測參數(shù)，進(jìn)行線性預(yù)測復(fù)合，從而產(chǎn)生出復(fù)合音頻向量。然后，驅(qū)動聲源檢索裝置47求出由上述目標(biāo)音頻產(chǎn)生裝置45輸入來的目標(biāo)音頻向量相對于上述的復(fù)合音頻向量之間的聽覺加權(quán)失真。緊接著通過比較進(jìn)行評價(jià)上述失真，驅(qū)動聲源檢索裝置47尋找出使上述失真變成最小的驅(qū)動聲源編碼I以及與其對應(yīng)的驅(qū)動聲源增益γ，并把上述的驅(qū)動聲源編碼I和驅(qū)動聲源增益γ的編碼發(fā)送到多路轉(zhuǎn)換裝置3；與此同時(shí)，把對應(yīng)上述驅(qū)動聲源編碼I的驅(qū)動聲源向量乘以上述的驅(qū)動聲源增益γ，從而產(chǎn)生出驅(qū)動聲源信號，并將它發(fā)送給第2目標(biāo)音頻產(chǎn)生裝置48。
第2目標(biāo)音頻產(chǎn)生裝置48把由上述的驅(qū)動聲源檢索裝置47輸入的驅(qū)動聲源信號和由線性預(yù)測參數(shù)編碼裝置9輸入的已量化的線性預(yù)測參數(shù)兩者進(jìn)行線性預(yù)測復(fù)合，從而產(chǎn)生出復(fù)合音頻向量。然后，第2目標(biāo)音頻產(chǎn)生裝置48求出由上述目標(biāo)音頻產(chǎn)生裝置45輸入來的目標(biāo)音頻向量和由上述的復(fù)合音頻向量之間的差分，將它作為第2目標(biāo)音頻向量發(fā)送到第2驅(qū)動聲源檢索裝置50。
在第2驅(qū)動聲源編碼本49里，例如，儲存著由隨機(jī)噪聲產(chǎn)生出來的N個(gè)驅(qū)動聲源向量，并按照由上述音調(diào)分析裝置25所輸入的對應(yīng)音調(diào)周期P的向量長度，抽出并輸出由第2驅(qū)動聲源檢索裝置50所輸入的對應(yīng)驅(qū)動聲源編碼j的第2驅(qū)動聲源向量。在這里，若P≥幀長度的情況下，則輸出具有幀長度的驅(qū)動聲源向量。
第2驅(qū)動聲源檢索裝置50對于N個(gè)驅(qū)動聲源向量，把由上述的第2驅(qū)動聲源編碼本49抽出的第2驅(qū)動聲源向量和由上述的線性預(yù)測參數(shù)編碼裝置9輸入的已量化的線性預(yù)測參數(shù)兩者進(jìn)行線性預(yù)測復(fù)合，從而產(chǎn)生出復(fù)合音頻向量。并且，第2驅(qū)動聲源檢索裝置50求出由上述的第2目標(biāo)音頻產(chǎn)生裝置48輸入的第2目標(biāo)音頻向量相對于上述的復(fù)合音頻向量的聽覺加權(quán)失真；緊接著通過比較進(jìn)行評價(jià)上述的失真，求出使上述的失真變成最小的第2驅(qū)動聲源編碼J和與其對應(yīng)的第2驅(qū)動聲源增益γ2。并把上述的第2驅(qū)動聲源編碼J和第2驅(qū)動聲源增益γ2的編碼發(fā)送到多路轉(zhuǎn)換裝置3。
上述的編碼過程完成之后，多路轉(zhuǎn)換裝置3把對應(yīng)上述的量化后的線性預(yù)測參數(shù)的編碼、音調(diào)周期P、驅(qū)動聲源編碼I、J以及對應(yīng)聲源增益γ、γ2的編碼，都通過傳輸線路6發(fā)送出去。
以上所述是本實(shí)施例10的音頻編碼裝置里的特征性操作。
以下，將繼續(xù)說明有關(guān)編碼器部件2的情況。
首先，接收多路轉(zhuǎn)換裝置3輸出的分離裝置4，通過分離處理分別把線性預(yù)測參數(shù)編碼送到線性預(yù)測參數(shù)譯碼裝置16、音調(diào)周期P送到驅(qū)動聲源編碼本51和第2驅(qū)動聲源編碼本54、驅(qū)動聲源編碼I和聲源增益γ的編碼送到驅(qū)動聲源譯碼裝置52和第2驅(qū)動聲源編碼J和音頻增益γ2的編碼送到第2驅(qū)動聲源譯碼裝置55。
驅(qū)動聲源編碼本51和編碼器部件的驅(qū)動聲源編碼本46，都存儲著相同數(shù)量的N個(gè)驅(qū)動聲源向量，并按照與上述的音調(diào)周期P相對應(yīng)的向量長度，抽出由驅(qū)動聲源譯碼裝置52輸入的對應(yīng)驅(qū)動聲源編碼I的驅(qū)動聲源向量并將它發(fā)送到驅(qū)動聲源譯碼裝置52。
驅(qū)動聲源譯碼裝置52從上述的驅(qū)動聲源增益γ的編碼，譯碼出驅(qū)動增益γ，把由上述的驅(qū)動編碼本51輸入的信息中抽出驅(qū)動聲源向量乘以驅(qū)動聲源增益γ，從而產(chǎn)生出驅(qū)動聲源信號，并將它送到幀聲源產(chǎn)生裝置53。幀聲源產(chǎn)生裝置53根據(jù)由上述的驅(qū)動聲源譯碼裝置52輸入的聲源信號，例如，按每周期P重復(fù)并周期化，從而產(chǎn)生出具有幀長度的驅(qū)動聲源信號并將它送到聲源產(chǎn)生裝置21。
第2驅(qū)動聲源編碼本54和編碼器部件里的第2驅(qū)動聲源編碼本49，都存儲著同樣多的N個(gè)驅(qū)動聲源向量，并在具有與上述的音調(diào)周期P相對應(yīng)的向量長度里，抽出由第2驅(qū)動聲源編碼裝置55輸入的與第2驅(qū)動聲源編碼J相對應(yīng)的第2驅(qū)動聲源向量，并將它送到第2驅(qū)動聲源編碼裝置55。
第2驅(qū)動聲源譯碼裝置55由上述的第2驅(qū)動聲源增益γ2的編碼中譯碼出驅(qū)動聲源增益γ2，把由上述的第2驅(qū)動聲源編碼本54里抽出的第2驅(qū)動聲源向量乘以上述的驅(qū)動聲源增益γ2，從而產(chǎn)生出第2驅(qū)動聲源信號，并將它發(fā)送到第2幀聲源產(chǎn)生裝置56。第2幀聲源產(chǎn)生裝置56根據(jù)由上述的第2驅(qū)動聲源譯碼裝置55輸入的第2驅(qū)動聲源信號，例如。在每個(gè)周期P里重復(fù)并周期化，從而產(chǎn)生出第2幀長度驅(qū)動聲源信號，并將它發(fā)送到聲源信號產(chǎn)生裝置21。
聲源信號產(chǎn)生裝置21把由上述的幀聲源產(chǎn)生裝置53輸入的具有幀長度的驅(qū)動聲源信號和由上述的第2幀聲源產(chǎn)生裝置56輸入的驅(qū)動聲源信號繼續(xù)加法運(yùn)算，從而產(chǎn)生出聲源信號，并將它送到復(fù)合濾波器22，復(fù)合濾波器22把由上述的聲源信號產(chǎn)生裝置21輸入的聲源信號和由線性預(yù)測參數(shù)譯碼裝置16輸入的線性預(yù)測參數(shù)進(jìn)行線性預(yù)測復(fù)合，將其結(jié)果輸出音頻7輸出出去。
以上所述是本實(shí)施例10的音頻譯碼裝置里的具有特征性的操作。
根據(jù)本實(shí)施例10，當(dāng)輸入音頻的音調(diào)周期P比幀長度短時(shí)，周期的加法平均計(jì)算輸入音頻，產(chǎn)生出具有向量長度P的目標(biāo)音頻向量；另一方面，把向量長度P的驅(qū)動聲源向量進(jìn)行線性預(yù)測復(fù)合，根據(jù)評價(jià)生成的復(fù)合音頻向量之間的失真，防止復(fù)合音頻質(zhì)量下降，以少的運(yùn)算量可產(chǎn)生出高質(zhì)量的復(fù)合音頻。
正如上所述，根據(jù)本發(fā)明，由于在音頻編碼裝置里具備如下各裝置從輸入音頻產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的目標(biāo)音頻向量的目標(biāo)向量產(chǎn)生裝置；從在過去生成的音頻信號，產(chǎn)生出具有與上述的延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源向量的自適應(yīng)聲源編碼本；評價(jià)由上述的自適應(yīng)聲源向量獲得的復(fù)合音頻向量相對于上述的目標(biāo)音頻向量的失真，并檢索出使失真變成最小的自適應(yīng)聲源向量的自適應(yīng)聲源檢索裝置；從使上述失真變成最小的自適應(yīng)聲源向量產(chǎn)生出具有幀長度的聲源信號的幀聲源產(chǎn)生裝置。正因?yàn)槿绱?，可防止?fù)合音頻質(zhì)量下降，以少的運(yùn)算量可產(chǎn)生出高質(zhì)量的復(fù)合音頻。
而且，根據(jù)本發(fā)明，由于目標(biāo)音頻向量的向量長度可選取為有理數(shù)，當(dāng)從輸入音頻產(chǎn)生目標(biāo)音頻向量時(shí)，不依賴與輸入音頻的采樣周期，可產(chǎn)生出高精度目標(biāo)音頻向量，防止復(fù)合音頻質(zhì)量下降，以少的計(jì)算量可產(chǎn)生出高質(zhì)量復(fù)合音頻。
而且，根據(jù)發(fā)明，由于目標(biāo)音頻產(chǎn)生裝置按照每向量長度劃分出具有與延遲參數(shù)相對應(yīng)的向量長度的整倍數(shù)長的輸入音頻，再把上述的每一向量長度的輸入音頻進(jìn)行加權(quán)平均計(jì)算，從而產(chǎn)生出目標(biāo)音頻向量，因此在產(chǎn)生目標(biāo)音頻向量時(shí)的平均化處理過程里，不涉及處理不同向量長度的向量，可實(shí)現(xiàn)簡單處理，防止復(fù)合音頻的質(zhì)量下降，以少的計(jì)算量可產(chǎn)生出高質(zhì)量的復(fù)合音頻。
而且，假定僅就產(chǎn)生目標(biāo)音頻向量的向量長度整倍數(shù)長的輸入音頻已超過幀長度以上的情況而論，根據(jù)用于對超過幀長度的輸入音頻實(shí)現(xiàn)編碼時(shí)的評價(jià)，按照已考慮到的已知幀的復(fù)合音頻如何其以后幀的思路進(jìn)行決定編碼，所以使得復(fù)合音頻具有很好的再現(xiàn)性，可以提高質(zhì)量。
而且，即使是關(guān)于每向量長的輸入音頻的特征量很少，若能包括輸入音頻的功率信息，則根據(jù)依照輸入音頻功率大的部分予以加權(quán)編碼，使得對主觀質(zhì)量有很大影響的復(fù)合音頻功率大的部分的再現(xiàn)性變好，可提高質(zhì)量。
而且，即使是關(guān)于每向量長的輸入音頻的特征量很少，若包含輸入音頻的相關(guān)信息，作為輸入音頻具有周期L的周期性情況下，則按照相關(guān)程度低的部分小權(quán)重來進(jìn)行音頻編碼，盡管是對于音調(diào)周期變動的輸入音頻也可產(chǎn)生出對應(yīng)一音調(diào)周期的失真小的目標(biāo)音頻向量，使復(fù)合音頻的再現(xiàn)性良好，從而提高質(zhì)量。
而且，目標(biāo)音頻產(chǎn)生裝置依照每個(gè)向量程度的輸入音頻時(shí)間關(guān)系，在上述的每向量長度里，進(jìn)行加權(quán)平均計(jì)算輸入音頻，若能決定在生成目標(biāo)音頻向量時(shí)的權(quán)重，則可對在幀邊界附近的輸入音頻給予大的權(quán)重，產(chǎn)生出目標(biāo)音頻向量，通過按照這種方式進(jìn)行編碼，于是在幀邊界附近的復(fù)合音頻的再現(xiàn)性可以變好，可使幀間的復(fù)合音頻的變化平滑起來。
而且，目標(biāo)音頻產(chǎn)生裝置當(dāng)把輸入音頻在每個(gè)向量長度里進(jìn)行加權(quán)平均計(jì)算時(shí)，若能進(jìn)行精細(xì)調(diào)整，上述的每向量長的輸入音頻時(shí)間關(guān)系，按照向量長l的輸入音頻間的相互關(guān)系大的抽出進(jìn)行細(xì)微調(diào)整位置，盡管是對于音調(diào)周期變動的輸入音頻，也可產(chǎn)生出對應(yīng)1音調(diào)周期的失真小的目標(biāo)音頻向量，所以復(fù)合音頻的再現(xiàn)性良好，從而提高質(zhì)量。
而且，根據(jù)本發(fā)明，由于幀聲源產(chǎn)生裝置把具有向量長度的聲源向量在幀間進(jìn)行插補(bǔ)，從而生成聲源信號，使幀間的聲源信號變化變得平滑起來，可使復(fù)合音頻的再現(xiàn)性良好，提高質(zhì)量。
權(quán)利要求
1.一種把輸入音頻分成頻譜包絡(luò)信息和聲源信息并且以幀為單位對聲源信號信息進(jìn)行編碼的音頻編碼裝置，其特征是，具備從輸入音頻產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的目標(biāo)音頻向量的目標(biāo)音頻產(chǎn)生裝置；從過去生成的聲源信號產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源向量的自適應(yīng)聲源編碼本；評價(jià)由上述自適應(yīng)聲源向量獲得的復(fù)合音頻向量相對于上述目標(biāo)音頻向量的失真，并且檢索出使上述失真變成最小的自適應(yīng)聲源向量的自適應(yīng)聲源檢索裝置；以及從使上述失真變成最小的自適應(yīng)聲源向量，產(chǎn)生出具有幀長度的聲源信號的幀聲源產(chǎn)生裝置。
2.根據(jù)權(quán)利要求1記載的音頻編碼裝置，其特征是，具備第2目標(biāo)音頻產(chǎn)生裝置，用于從與目標(biāo)音頻向量失真變成最小的自適應(yīng)聲源向量，產(chǎn)生出第2目標(biāo)音頻向量；驅(qū)動聲源編碼本，用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源向量；驅(qū)動聲源檢索裝置，用于評價(jià)由上述驅(qū)動聲源向量獲得的第2復(fù)合音頻向量相對于上述第2目標(biāo)音頻向量的失真，并檢索出使失真變成最小的驅(qū)動聲源向量；以及第2幀聲源產(chǎn)生裝置，用于由使上述失真變成最小的由驅(qū)動聲源向量產(chǎn)生出第2幀長聲源信號。
3.一種把輸入音頻分成頻譜包絡(luò)信息和聲源信號信息并以幀為單位對聲源信號進(jìn)行編碼的音頻編碼裝置里，其特征是，具備目標(biāo)音頻產(chǎn)生裝置，用于由輸入音頻產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的目標(biāo)音頻向量；驅(qū)動聲源編碼本，用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源向量；驅(qū)動聲源檢索裝置，用于評價(jià)由上述驅(qū)動聲源向量獲得的復(fù)合音頻向量相對于上述目標(biāo)音頻向量的失真，并檢索出使失真變成最小的驅(qū)動聲源向量；以及幀聲源產(chǎn)生裝置，用于從上述使失真變成最小的驅(qū)動聲源向量產(chǎn)生出具有幀長的聲源信號。
4.根據(jù)權(quán)利要求3記載的音頻編碼裝置，其特征是，延遲參數(shù)按照對應(yīng)輸入音頻的音調(diào)周期進(jìn)行決定的。
5.根據(jù)權(quán)利要求1～3所記載的任何一項(xiàng)的音頻編碼裝置，其特征是，與延遲參數(shù)相對應(yīng)的向量長度取有理數(shù)。
6.根據(jù)權(quán)利要求1～3所記載的任何一項(xiàng)的音頻編碼裝置，其特征是，目標(biāo)音頻產(chǎn)生裝置按照對應(yīng)延遲參數(shù)的每個(gè)向量長度劃分幀輸入音頻，并把每個(gè)向量長度的輸入音頻進(jìn)行加權(quán)平均，產(chǎn)生出目標(biāo)音頻向量。
7.根據(jù)權(quán)利要求1～3所記載的任何一項(xiàng)的音頻編碼裝置，其特征是，目標(biāo)音頻產(chǎn)生裝置把具有與延遲參數(shù)相對應(yīng)的向量長度的整倍數(shù)長度的輸入音頻劃分成每個(gè)向量長度，并且加權(quán)平均每向量長度的輸入音頻，從而產(chǎn)生出目標(biāo)音頻向量。
8.根據(jù)權(quán)利要求1～3所記載的任何一項(xiàng)的音頻編碼裝置，其特征是，目標(biāo)音頻產(chǎn)生裝置依照具有與延遲參數(shù)相對應(yīng)的每向量長的輸入音頻有關(guān)的特征量，決定出產(chǎn)生音頻向量時(shí)的權(quán)重，把輸入音頻在每向量長度內(nèi)進(jìn)行加權(quán)平均。
9.根據(jù)權(quán)利要求1～3所記載的任何一項(xiàng)的音頻編碼裝置，其特征是，幀聲源產(chǎn)生裝置在每個(gè)向量長度里，重復(fù)具有與延遲參數(shù)相對應(yīng)的向量長度的聲源向量并周期化，從而產(chǎn)生出具有幀長度的聲源信號。
10.根據(jù)權(quán)利要求1～3所記載的任何一項(xiàng)的音頻編碼裝置，其特征是，幀聲源產(chǎn)生裝置在幀間進(jìn)行插補(bǔ)具有與延遲參數(shù)相對應(yīng)的向量長度的聲源向量，從而產(chǎn)生出聲源信號。
11.根據(jù)權(quán)利要求1記載的音頻編碼裝置，其特征是，自適應(yīng)聲源檢索裝置備有復(fù)合濾波器，利用該復(fù)合濾波器的脈沖響應(yīng)，反復(fù)計(jì)算由自適應(yīng)聲源向量獲得的復(fù)合音頻向量相對于目標(biāo)音頻向量的失真。
12.一種把輸入音頻分成頻譜包絡(luò)信息和聲源信息，而且以幀為單位對聲源信號進(jìn)行編碼并將編碼的聲源信號信息進(jìn)行譯碼，從而產(chǎn)生輸出音頻的音頻編碼譯碼裝置，其特征是，在編碼部件方面具備目標(biāo)音頻產(chǎn)生裝置，用于從輸入音頻產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的目標(biāo)音頻向量；自適應(yīng)聲源編碼本，用于從過去生成的聲源信號產(chǎn)生出具有與上述延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源向量；自適應(yīng)聲源檢索裝置，用于評價(jià)由上述自適應(yīng)聲源向量獲得的復(fù)合音頻向量相對于上述目標(biāo)音頻向量的失真，并且檢索出使失真變成最小的自適應(yīng)聲源向量；以及幀聲源產(chǎn)生裝置，用于由使上述失真變成最小的自適應(yīng)聲源向量，產(chǎn)生出具有幀長度的聲源信號，另一方面，在編碼部件里具備如下自適應(yīng)聲源編碼本，用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的聲源向量；以及幀聲源產(chǎn)生裝置，用于由自適應(yīng)聲源向量產(chǎn)生出具有幀長的聲源信號。
13.根據(jù)權(quán)利要求12記載的音頻編碼和譯碼裝置，其特征是，在編碼方面，具備如下第2目標(biāo)音頻產(chǎn)生裝置，用于由目標(biāo)音頻向量和自適應(yīng)聲源向量產(chǎn)生出第2目標(biāo)音頻向量；驅(qū)動聲源編碼本，用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源向量驅(qū)動聲源檢索裝置，用于評價(jià)由上述驅(qū)動聲源向量獲得的第2復(fù)合音頻向量相對于第2目標(biāo)音頻向量的失真，并檢索出使失真變成最小的驅(qū)動聲源向量；以及第2幀聲源產(chǎn)生裝置，用于由上述使失真最小的驅(qū)動聲源向量產(chǎn)生出第2幀長的聲源信號，另一方面，在編碼部件里具備驅(qū)動聲源編碼本，用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源向量；以及第2幀聲源產(chǎn)生裝置，用于從驅(qū)動聲源向量產(chǎn)生出第2幀長的聲源信號。
14.一種把輸入音頻分成頻譜包絡(luò)信息和聲源信號信息并以幀為單位對聲源信號信息進(jìn)行編碼和將編碼的聲源信號信息譯碼再產(chǎn)生出輸出音頻的音頻編碼譯碼裝置，其特征是，在編碼部件里具有目標(biāo)音頻產(chǎn)生裝置，用于從輸入音頻產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的目標(biāo)音頻向量；驅(qū)動聲源編碼本，用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源向量；驅(qū)動聲源檢索裝置用于評價(jià)由上述驅(qū)動聲源向量獲得的復(fù)合音頻向量相對于上述目標(biāo)音頻向量的失真，并檢索出使失真變成最小的驅(qū)動聲源向量；以及幀聲源產(chǎn)生裝置，用于從使失真變成最小的驅(qū)動聲源向量產(chǎn)生出具有向量長度的聲源信號，另一方面，在譯碼部件里，具備如下驅(qū)動聲源編碼本，用于從與延遲參數(shù)相對應(yīng)的向量長度產(chǎn)生出具有幀長度的聲源向量；以及幀聲源產(chǎn)生裝置，用于從驅(qū)動聲源向量產(chǎn)生出具有幀長的聲源信號。
全文摘要
音頻編碼裝置當(dāng)把音頻進(jìn)行編碼時(shí),能防止音頻質(zhì)量下降,以小的運(yùn)算量可產(chǎn)生出高質(zhì)量復(fù)合音頻。音頻編碼裝置具備:目標(biāo)音頻產(chǎn)生裝置,用于由輸入音頻產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的目標(biāo)音頻向量;自適應(yīng)聲源編碼本,用于由過去生成的聲源信號產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源向量;自適應(yīng)聲源檢索裝置,用于評價(jià)由上述自適應(yīng)聲源向量獲得的復(fù)合音頻向量相對于上述目標(biāo)音頻向量的失真,并檢索出使失真變成最小的自適應(yīng)聲源向量;以及幀聲源產(chǎn)生裝置,用于由上述的使失真變成最小的自適應(yīng)聲源向量獲得具有幀長的聲源信號。
文檔編號G10L19/12GK1170189SQ97102939
公開日1998年1月14日申請日期1997年3月12日優(yōu)先權(quán)日1996年5月29日
發(fā)明者山浦正, 田崎裕久, 高橋真哉申請人:三菱電機(jī)株式會社

完整全部詳細(xì)技術(shù)資料下載