專利名稱:音頻編碼裝置和音頻編碼譯碼裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻編碼裝置和音頻編碼譯碼裝置,該套裝置可把音頻信號壓縮編碼成數(shù)字化信號。
圖9是一個(gè)普通音頻編碼譯碼裝置的典型的總體框圖,它把音頻輸入信號分成頻譜包絡(luò)信息和音源信號信息,并且以幀為單位把聲源信號進(jìn)行編碼。圖9所示的裝置是與JP-A64/40899號公報(bào)發(fā)表的裝置一樣的。
在圖9里,各標(biāo)號是1編碼裝置,2譯碼裝置,3多路轉(zhuǎn)換裝置,4分離裝置,5音頻輸入,6傳輸線,7音頻輸出。編碼裝置1是由線性預(yù)測參數(shù)分析裝置8,線性預(yù)測參數(shù)編碼裝置9,自適應(yīng)聲源信號編碼本10,自適應(yīng)聲源檢索裝置11,誤差信號生成裝置12,驅(qū)動聲源編碼本13,驅(qū)動聲源檢索裝置14和聲源信號產(chǎn)生裝置15構(gòu)成。譯碼裝置2是由線性預(yù)測參數(shù)譯碼裝置16,自適應(yīng)聲源編碼本17,自適應(yīng)聲源信號譯碼裝置18,驅(qū)動聲源信號編碼本19,驅(qū)動聲源信號譯碼裝置20,聲源信號發(fā)生裝置21和復(fù)合濾波器22。
以下僅就上述以往的音頻編碼譯碼裝置的工作原理,說明它是如何將音頻輸入信號分解成頻譜包絡(luò)信息和聲源信號信息,并且如何把聲源信號信息以幀為單位進(jìn)行編碼。
首先編碼裝置1接收,例如,以8kHz采樣的數(shù)字音頻信號作為音頻輸入5。線性預(yù)測參數(shù)分析裝置8分析音頻輸入5,并且抽取聲音的頻譜包絡(luò)信息作為線性預(yù)測參數(shù)。隨后線性預(yù)測參數(shù)編碼裝置9將抽取的線性預(yù)測參數(shù)量化,并且把代表該參數(shù)的編碼輸出到多路轉(zhuǎn)換裝置。同時(shí)線性預(yù)測參數(shù)編碼裝置9把量化的線性預(yù)測參數(shù)輸出到自適應(yīng)聲源檢索裝置11,誤差信號發(fā)生裝置12以及驅(qū)動聲源檢索裝置14。
下面,說明有關(guān)聲源信息編碼過程。在自適應(yīng)聲源編碼本10里,保存有過去來自聲源信號產(chǎn)生裝置15產(chǎn)生的聲源信號,將從自適應(yīng)聲源檢索裝置11輸入的與延遲參數(shù)L對應(yīng)的幀長度的自適應(yīng)聲源向量輸出給自適應(yīng)聲源檢索裝置11。在這里,上述的自適應(yīng)聲源向量是抽出的比延遲參數(shù)L早一個(gè)幀長的聲源信號采樣,當(dāng)延遲參數(shù)L比幀長短時(shí),把一個(gè)采樣的聲源信號重復(fù)地生成,一直到一個(gè)幀長時(shí)間為止。當(dāng)延遲參數(shù)L大于或等于幀長時(shí),典型的自適應(yīng)聲源向量的實(shí)例如
圖10(a)所示;當(dāng)延遲參數(shù)L小于幀長時(shí),自適應(yīng)聲源向量的實(shí)例如圖10(b)所示。
例如延遲參數(shù)L落入20≤延遲參數(shù)L≤128的區(qū)域時(shí),自適應(yīng)聲源檢索裝置11把由自適應(yīng)聲源編碼本10輸入的自適應(yīng)聲源向量和由線性預(yù)測參數(shù)編碼裝置9輸入的量化線性預(yù)測參數(shù)進(jìn)行線性預(yù)測復(fù)合,從而生成復(fù)合音頻向量。于是,從輸入音頻5每幀抽取的輸入音頻向量和上述的復(fù)合音頻向量之間,求出聽覺加權(quán)失真。然后,通過比較進(jìn)行評價(jià)上述的失真,求出使上述失真變成最小的延遲參數(shù)L和與其對應(yīng)的自適應(yīng)聲源增益β,并把上述的延遲參數(shù)L和自適應(yīng)聲源增益β的編碼傳送給多路轉(zhuǎn)換裝置3,與此同時(shí),把與上述的延遲參數(shù)L相對應(yīng)的自適應(yīng)聲源向量和上述的自適應(yīng)聲源增益β相乘,從而產(chǎn)生出自適應(yīng)聲源信號,并且把該信號傳送到誤差信號產(chǎn)生裝置12和聲源信號產(chǎn)生裝置15。
誤差信號產(chǎn)生裝置12把從上述的自適應(yīng)聲源檢索裝置11輸入的自適應(yīng)聲源信號和從上述的線性預(yù)測參數(shù)編碼裝置9輸入的量化的線性預(yù)測參數(shù),進(jìn)行線性預(yù)測復(fù)合,從而產(chǎn)生出復(fù)合音頻向量。于是,從輸入音頻5每幀抽出輸入音頻向量和上述的復(fù)合音頻向量的差分,求出作為誤差信號向量,并且把該誤差信號向量傳送給驅(qū)動聲源檢索裝置14。
在驅(qū)動聲源編碼本13里,例如,存儲著由隨機(jī)噪聲產(chǎn)生的N個(gè)驅(qū)動聲源向量,并輸出按照來自驅(qū)動聲源檢索裝置14輸入的與驅(qū)動聲源編碼i相對應(yīng)的驅(qū)動聲源向量。驅(qū)動聲源檢索裝置14對于N個(gè)驅(qū)動聲源向量,利用從上述的驅(qū)動聲源編碼本13輸入的驅(qū)動聲源向量和從上述的線性預(yù)測參數(shù)編碼裝置9輸入的量化的線性預(yù)測參數(shù),進(jìn)行線性預(yù)測復(fù)合,于是,產(chǎn)生出復(fù)合音頻向量。然后,求出上述的誤差信號產(chǎn)生裝置12輸入的誤差信號向量和從上述的復(fù)合音頻向量之間的聽覺加權(quán)失真。接著,通過比較進(jìn)行評價(jià),求出使上述的失真變成最小的驅(qū)動聲源編碼和與其對應(yīng)的驅(qū)動聲源增益γ,并把上述的驅(qū)動聲源編碼I和驅(qū)動聲源增益γ的編碼傳送給多路轉(zhuǎn)換裝置3,與此同時(shí),把與上述的驅(qū)動聲源編碼I對應(yīng)的驅(qū)動聲源向量和上述的驅(qū)動聲源增益γ相乘,從而,產(chǎn)生出驅(qū)動聲源信號,并且把該信號傳送到聲源信號產(chǎn)生裝置15。
聲源信號產(chǎn)生裝置15把從上述的自適應(yīng)聲源檢索裝置11輸入的自適應(yīng)聲源信號和上述的驅(qū)動聲源信號檢索裝置14輸入的驅(qū)動聲源信號進(jìn)行加法運(yùn)算,從而產(chǎn)生聲源信號并且傳送給自適應(yīng)聲源編碼本17。
以上的編碼處理過程完成后,多路轉(zhuǎn)換裝置3把上述量化后的同線性預(yù)測參數(shù)相對應(yīng)的編碼、延遲參數(shù)L、驅(qū)動聲源編碼I以及聲源增益β乃至同γ相對應(yīng)的編碼,都通過傳輸線路6發(fā)送出去。
現(xiàn)在,僅就譯碼部件2的工作原理說明如下首先,接收多路轉(zhuǎn)換裝置3的輸出信息的分離裝置4,把收到分別發(fā)送給以下各裝置線性預(yù)測參數(shù)的編碼→線性預(yù)測參數(shù)譯碼裝置16;延遲參數(shù)L、(自適應(yīng))聲源增益β的編碼→自適應(yīng)聲源譯碼裝置18;驅(qū)動聲源編碼I、(驅(qū)動)聲源增益γ的編碼→驅(qū)動聲源譯碼裝置20。
線性預(yù)測參數(shù)譯碼裝置16把同上述的線性預(yù)測參數(shù)的編碼相對應(yīng)的線性預(yù)測參數(shù)進(jìn)行譯碼,并將譯碼后的信息傳送到復(fù)合濾波器22。自適應(yīng)聲源譯碼裝置18把同上述的延遲參數(shù)L相對應(yīng)的自適應(yīng)聲源向量從自適應(yīng)聲源編碼本17中讀出,并根據(jù)上述的自適應(yīng)聲源增益誤差β的編碼,把自適應(yīng)聲源增益β進(jìn)行譯碼,產(chǎn)生出上述的自適應(yīng)聲源向量和上述的自適應(yīng)聲源增益β進(jìn)行相乘,從而得出自適應(yīng)聲源信號,而后向聲源信號產(chǎn)生裝置21輸出。驅(qū)動聲源譯碼裝置20把同上述的驅(qū)動聲源編碼I相對應(yīng)的驅(qū)動聲源向量從驅(qū)動聲源編碼本19中讀出,并根據(jù)上述的驅(qū)動聲源增益γ的編碼,把驅(qū)動聲源增益γ進(jìn)行譯碼,將上述驅(qū)動聲源向量和上述的驅(qū)動聲源增益γ相乘,產(chǎn)生出驅(qū)動聲源信號,并把該信號輸出到聲源信號產(chǎn)生裝置21。
聲源信號產(chǎn)生裝置21把從上述的自適應(yīng)聲源譯碼裝置18輸入的自適應(yīng)聲源信號和從上述的驅(qū)動聲源譯碼裝置20輸入的驅(qū)動聲源信號,進(jìn)行加法運(yùn)算,從而生成聲源信號,并將其分別發(fā)送到自適應(yīng)聲源編碼本17和復(fù)合濾波器22。復(fù)合濾波器22利用從上述的聲源信號產(chǎn)生裝置21輸入的聲源信號和從上述的線性預(yù)測參數(shù)譯碼裝置16輸入的線性預(yù)測參數(shù),進(jìn)行線性預(yù)測復(fù)合,并產(chǎn)生輸出音頻7。
此外,在P.Kroon&B.S.Atal所著的“Pitch Predictors With HighTemporal Resolution”(ICASSP’90,PP661-664,1990)一文中,已經(jīng)描述出上述的現(xiàn)有音頻編碼與譯碼裝置的已改進(jìn)的先有技術(shù),它能夠提供更高的輸出音頻效果。
這種改進(jìn)的音頻編碼與譯碼裝置與圖9所示現(xiàn)有的結(jié)構(gòu)的不同之處在于,自適應(yīng)聲源檢索裝置11里的檢索對象的延遲參數(shù),不僅可取整數(shù),也可取帶小數(shù)的有理數(shù);自適應(yīng)聲源編碼本10和17對以前產(chǎn)生的采樣的聲源信號間進(jìn)行插補(bǔ),產(chǎn)生出與帶有小數(shù)的有理數(shù)延遲參數(shù)相對應(yīng)的自適應(yīng)聲源向量,并將其輸出。當(dāng)延遲參數(shù)為帶小數(shù)的有理數(shù)時(shí),自適應(yīng)聲源向量實(shí)例,如圖11所示。當(dāng)延遲參數(shù)L≥一個(gè)幀長時(shí),自適應(yīng)聲源向量實(shí)例如圖11(a)所示;當(dāng)延遲參數(shù)L<一個(gè)幀長時(shí),情況如圖11(b)所示。
利用這樣的結(jié)構(gòu),能以比輸入音頻采樣頻率更高的精度確定延遲參數(shù),并相應(yīng)地產(chǎn)生自適應(yīng)聲源向量;因此,與JP-A64/40899公報(bào)所公開的裝置相比,這種裝置可產(chǎn)生更高質(zhì)的音頻輸出。
在JP-A4/344669公報(bào)中發(fā)布另外一種現(xiàn)有技術(shù)的音頻編碼與譯碼裝置。圖12就是表示該現(xiàn)有的音頻編碼與譯碼裝置的總體框圖。
在圖12里,與圖9所對應(yīng)的部分均給予同一標(biāo)號,為避免重復(fù),該部分的詳細(xì)說明在此略去。
在圖12里,與圖9不同之處是標(biāo)號23、24代表驅(qū)動聲源編碼本。
現(xiàn)在,僅就用上述結(jié)構(gòu)實(shí)現(xiàn)的編碼與譯碼裝置說明其操作原理。
首先,例如延遲參數(shù)L處在20≤延遲參數(shù)L≤128的范圍內(nèi),這種情況下,編碼部件里的自適應(yīng)聲源檢索裝置11,利用從自適應(yīng)聲源編碼本10輸入的自適應(yīng)聲源向量和從線性預(yù)測參數(shù)編碼裝置9輸入的量化的線性預(yù)測參數(shù),進(jìn)行線性預(yù)測復(fù)合,產(chǎn)生出復(fù)合音頻向量。然后,自適應(yīng)聲源檢索裝置11根據(jù)從輸入音頻5以幀抽取的輸入音頻向量和上述的復(fù)合音頻向量,從中求得聽覺加權(quán)失真。通過比較對聽覺加權(quán)失真進(jìn)行評價(jià),并求出使上述失真達(dá)到最小的延遲參數(shù)L及其對應(yīng)的自適應(yīng)聲源增益β;隨后,把求得的延遲參數(shù)L和自適應(yīng)聲源增益β的編碼,傳送給多路轉(zhuǎn)換裝置3和驅(qū)動聲源編碼本23;與此同時(shí),把上述延遲參數(shù)L對應(yīng)的自適應(yīng)聲源向量和上述的自適應(yīng)聲源增益β相乘,從而產(chǎn)生出自適應(yīng)聲源信號,并把其發(fā)送到誤差信號產(chǎn)生裝置12和聲源信號產(chǎn)生裝置15。
在驅(qū)動聲源編碼本23里,例如,存儲著由隨機(jī)噪聲產(chǎn)生的N個(gè)驅(qū)動聲源向量,把從驅(qū)動聲源檢索裝置14輸入的與驅(qū)動聲源編碼i相對應(yīng)的驅(qū)動聲源向量,按與延遲參數(shù)L相對應(yīng)的每個(gè)周期重復(fù),周期化并輸出該驅(qū)動聲源向量。這種周期化的驅(qū)動聲源向量的實(shí)例如圖13(a)所示。當(dāng)延遲參數(shù)L為帶小數(shù)的有理數(shù)時(shí),如圖13(b)所示,對驅(qū)動聲源向量的取樣之間進(jìn)行插補(bǔ),從而產(chǎn)生周期化的驅(qū)動聲源向量。
驅(qū)動聲源檢索裝置14對于N個(gè)驅(qū)動聲源向量,它利用從上述的驅(qū)動聲源編碼本23輸入來的周期化驅(qū)動聲源向量和從線性預(yù)測參數(shù)編碼裝置9輸入來的量化線性預(yù)測參數(shù),將二者進(jìn)行線性預(yù)測復(fù)合,從而產(chǎn)生出復(fù)合音頻向量,然后,驅(qū)動聲源檢索裝置14求出從誤差信號產(chǎn)生裝置12輸入來的誤差信號向量和上述的復(fù)合音頻向量之間的聽覺加權(quán)失真。隨后,通過比較評價(jià)該失真,并且求出使上述的失真變成最小的驅(qū)動聲源編碼I及其對應(yīng)的驅(qū)動聲源增益γ,并把上述的驅(qū)動聲源編碼I和驅(qū)動聲源增益γ的編碼,傳送給多路轉(zhuǎn)換裝置3;與此同時(shí),驅(qū)動聲源檢索裝置14把上述的驅(qū)動聲源編碼I對應(yīng)的周期化的驅(qū)動聲源向量乘以上述的驅(qū)動聲源增益γ,從而產(chǎn)生出驅(qū)動聲源信號,并將其發(fā)送到聲源信號產(chǎn)生裝置15。
編碼過程完成后,多路轉(zhuǎn)換裝置3把對應(yīng)上述的量化后的線性預(yù)測參數(shù)的編碼、預(yù)測參數(shù)L、驅(qū)動聲源編碼I、聲源增益β以及對應(yīng)于γ的編碼,通過傳輸線路6發(fā)送出去。
現(xiàn)在,說明有關(guān)譯碼部件2的操作原理。
首先,接收多路轉(zhuǎn)換裝置3輸出的分離裝置4,分別發(fā)送給各個(gè)裝置線性預(yù)測參數(shù)編碼→線性預(yù)測參數(shù)譯碼裝置16;預(yù)測參數(shù)L和聲源增益β的編碼→自適應(yīng)聲源譯碼裝置18和驅(qū)動聲源編碼本24;驅(qū)動聲源編碼I和聲源增益γ→驅(qū)動聲源編碼本24。
驅(qū)動聲源編碼本24和編碼部件的驅(qū)動聲源編碼本23都存儲著同樣多的N個(gè)驅(qū)動聲源向量,自驅(qū)動聲源譯碼裝置20輸入的與驅(qū)動聲源編碼I,相對應(yīng)驅(qū)動聲源向量,按對應(yīng)上述延遲參數(shù)L的每個(gè)周期重復(fù)周期化,并把它送給驅(qū)動聲源譯碼裝置20。
驅(qū)動聲源譯碼裝置20根據(jù)上述的驅(qū)動聲源增益γ的編碼,譯碼出驅(qū)動聲源增益γ,并把從上述的驅(qū)動聲源編碼本24輸入來的周期化驅(qū)動聲源向量與上述的驅(qū)動聲源增益γ相乘,從而產(chǎn)生出驅(qū)動聲源信號,并將其發(fā)送到聲源信號產(chǎn)生裝置21。
聲源信號傳送裝置21把來自聲源譯碼裝置18的自適應(yīng)聲源信號和來自上述的驅(qū)動聲源譯碼裝置20的驅(qū)動聲源信號,進(jìn)行加法運(yùn)算,產(chǎn)生出聲源信號,并將其發(fā)送到自適應(yīng)聲源編碼本17和復(fù)合濾波器22。復(fù)合濾波器22利用從上述的聲源信號產(chǎn)生裝置21輸入的聲源信號和從線性預(yù)測參數(shù)譯碼裝置16輸入來的線性預(yù)測參數(shù),將二者進(jìn)行線性預(yù)測復(fù)合,并將其結(jié)果作為輸出音頻7輸出。
在如上所述的現(xiàn)有的音頻編碼和譯碼裝置里,在編碼過程中的聲源檢索期間,根據(jù)延遲參數(shù),周期化產(chǎn)生自適應(yīng)聲源向量或驅(qū)動聲源向量,作為幀長的聲源向量把該向量進(jìn)行線性預(yù)測復(fù)合,而產(chǎn)生出復(fù)合音頻向量;在幀長的區(qū)域內(nèi)求出輸入音頻向量和復(fù)合音頻向量之間的失真。但是,因?yàn)樵谶M(jìn)行線性預(yù)測復(fù)合時(shí)需要處理的運(yùn)算量很大,于是就有在聲源檢索時(shí)要處理相當(dāng)大的運(yùn)算量的問題。
本發(fā)明正是為解決上述課題的產(chǎn)物,其目的在于,提供一種當(dāng)把音頻進(jìn)行編碼時(shí),防止復(fù)合音頻質(zhì)量降低,以少的運(yùn)算量,能產(chǎn)生出高質(zhì)量的復(fù)合音頻輸出的音頻編碼裝置和音頻編碼譯碼裝置。
為了解決上述課題,本發(fā)明的音頻編碼裝置具備以下裝置目標(biāo)音頻產(chǎn)生裝置,用于根據(jù)輸入音頻產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的目標(biāo)音頻向量;自適應(yīng)聲源編碼本,用于根據(jù)過去生成的聲源信號,產(chǎn)生出具有與上述延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源向量;自適應(yīng)聲源檢索裝置,用于評價(jià)從上述的自適應(yīng)聲源向量中獲得的復(fù)合音頻向量相對于上述目標(biāo)音頻向量的失真,并檢索出使該失真變成最小的自適應(yīng)聲源向量;幀長聲源產(chǎn)生裝置,用于從上述的使失真變成最小的自適應(yīng)聲源向量中產(chǎn)生出具有幀長度的聲源信號。
并且,音頻編碼裝置將進(jìn)一步具備如下裝置第2目標(biāo)音頻產(chǎn)生裝置,用于由目標(biāo)音頻向量和使失真變成最小的自適應(yīng)聲源向量,產(chǎn)生出第2目標(biāo)音頻向量;驅(qū)動聲源編碼本,用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源向量;驅(qū)動聲源檢索裝置,用于評價(jià)由上述的驅(qū)動聲源向量獲得的第2復(fù)合音頻向量相對于第2目標(biāo)音頻向量的失真,并檢索出使失真變成最小的驅(qū)動聲源向量;第2幀產(chǎn)生裝置,用于從上述的使失真變成最小的驅(qū)動聲源向量中產(chǎn)生出第2幀長的聲源信號。
并且,音頻編碼裝置還具備如下裝置目標(biāo)音頻產(chǎn)生裝置,用于從音頻輸入產(chǎn)生出具有與延遲參數(shù)的相對應(yīng)的向量長度的目標(biāo)音頻向量;驅(qū)動聲源編碼本,用于產(chǎn)生具有與延遲參數(shù)相對應(yīng)的向量長度驅(qū)動聲源向量;驅(qū)動聲源檢索裝置,用于評價(jià)從上述的驅(qū)動聲源向量中獲得的復(fù)合音頻向量相對于上述目標(biāo)音頻向量的失真,并檢索出使失真變成最小的驅(qū)動聲源向量;幀長聲源產(chǎn)生裝置,用于從上述的使失真變成最小的驅(qū)動聲源向量產(chǎn)生出具有幀長度的聲源信號。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是,目標(biāo)音頻向量和驅(qū)動聲源向量的向量長度是依照輸入音頻的音調(diào)周期來決定的。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是,對應(yīng)延遲參數(shù)的向量長度可選取有理數(shù)。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是,目標(biāo)音頻產(chǎn)生裝置把以幀為單位的輸入音頻劃分成具有與延遲參數(shù)相對應(yīng)的每個(gè)向量長度的,并加權(quán)平均每個(gè)向量長度的輸入音頻部分,以便產(chǎn)生出目標(biāo)音頻向量。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是,目標(biāo)音頻產(chǎn)生裝置把具有與延遲參數(shù)相對應(yīng)的向量長度的整倍數(shù)長的輸入音頻劃分成每個(gè)向量長度,并加權(quán)平均每向量長度的輸入音頻,以便產(chǎn)生出目標(biāo)音頻向量。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是,具有與延遲參數(shù)相對應(yīng)的向量長度的的整倍數(shù)長度是等于幀長或大于幀長。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是,目標(biāo)音頻產(chǎn)生裝置按照對應(yīng)延遲參數(shù)的每個(gè)向量長的輸入音頻有關(guān)的特征量,對每個(gè)向量長度加權(quán)平均輸入音頻,從而確定出產(chǎn)生目標(biāo)音頻向量時(shí)的權(quán)。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是,有關(guān)具有與延遲參數(shù)相對應(yīng)的向量長度的的每一音頻輸入部分的特征量,至少包括有關(guān)輸入音頻的功率信息。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是,有關(guān)具有與延遲參數(shù)相對應(yīng)的向量長度的每一份輸入音頻的特征量,至少要包括輸入音頻的相關(guān)信息。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是,目標(biāo)音頻產(chǎn)生裝置按照具有與延遲參數(shù)相對應(yīng)的向量長度的每一輸入音頻的時(shí)序關(guān)系,把對每個(gè)向量長度的輸入音頻進(jìn)行加權(quán)平均,從而決定出產(chǎn)生目標(biāo)音頻向量時(shí)的權(quán)。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是,當(dāng)把具有與延遲參數(shù)相對應(yīng)的向量長度的每一輸入音頻進(jìn)行加權(quán)平均時(shí),目標(biāo)音頻產(chǎn)生裝置可精細(xì)調(diào)整每一向量長度的輸入音頻時(shí)序關(guān)系。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是,幀聲源產(chǎn)生裝置在上述的每向量長度區(qū)域內(nèi),重復(fù)具有與延遲參數(shù)相對應(yīng)的向量長度的的聲源向量并進(jìn)行周期化,從而產(chǎn)生出具有幀長聲源信號。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是,幀聲源產(chǎn)生裝置是在幀之間進(jìn)行插補(bǔ)具有與延遲參數(shù)相對應(yīng)的向量長度的的聲源向量,從而產(chǎn)生出聲源信號。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是,自適應(yīng)聲源向量檢索裝置配備有一個(gè)復(fù)合濾波器,并且利用來自復(fù)合濾波器的脈沖響應(yīng),反復(fù)地計(jì)算由自適應(yīng)向量獲得的復(fù)合音頻向量相對于目標(biāo)音頻向量的失真。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是,配備有一個(gè)把輸入音頻進(jìn)行提高采樣的輸入音頻提高采樣裝置,目標(biāo)音頻產(chǎn)生裝置是根據(jù)提高采樣的輸入音頻產(chǎn)生目標(biāo)音頻向量的裝置。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是,配備有把過去生成的聲源信號進(jìn)行提高采樣的聲源提高采樣裝置,自適應(yīng)聲源編碼本是從提高采樣的過去生成的聲源信號產(chǎn)生出自適應(yīng)聲源向量的。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是,提高采樣裝置是依照延遲參數(shù),改變提高采樣的比例因數(shù)。
根據(jù)本發(fā)明的音頻編碼裝置進(jìn)一步是,提高采樣裝置僅在與延遲參數(shù)相對應(yīng)的向量長度的范圍內(nèi),改變輸入音頻或聲源信號的提高采樣比例因數(shù)。
此外,有關(guān)本發(fā)明的音頻編碼譯碼裝置,在編碼器部分里配備如下裝置目標(biāo)音頻產(chǎn)生裝置,用于從輸入音頻產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的目標(biāo)音頻向量;自適應(yīng)聲源編碼本,用于從過去生成的聲源信號產(chǎn)生出對應(yīng)上述延遲參數(shù)的具有向量長度的自適應(yīng)聲源向量;自適應(yīng)聲源檢索裝置,用于評價(jià)從上述的自適應(yīng)聲源向量中獲得的復(fù)合音頻向量相對于上述的目標(biāo)音頻向量的失真,并檢索出使失真變成最小的自適應(yīng)聲源向量;以及幀聲源產(chǎn)生裝置,用于從上述的使失真變成最小的自適應(yīng)聲源向量產(chǎn)生出具有幀長度的聲源信號,另一方面,在譯碼器部件里配備如下裝置自適應(yīng)聲源編碼本,用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源向量;及幀長聲源產(chǎn)生裝置,用于從自適應(yīng)聲源向量產(chǎn)生出具有幀長度的聲源信號。
根據(jù)本發(fā)明的音頻編碼譯碼裝置進(jìn)一步配備,其編碼器方面,由下列裝置構(gòu)成第2目標(biāo)聲源產(chǎn)生裝置,用于從目標(biāo)音頻向量和自適應(yīng)聲源向量,產(chǎn)生出第2目標(biāo)音頻向量;驅(qū)動聲源編碼本,用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的的驅(qū)動聲源向量;驅(qū)動聲源檢索裝置,用于評價(jià)從上述的驅(qū)動聲源向量獲得的第2復(fù)合音頻向量相對于第2目標(biāo)音頻向量的失真,并檢索出使失真變成最小的驅(qū)動聲源向量;以及第2幀長產(chǎn)生裝置,用于從上述的使失真變成最小的驅(qū)動聲源向量中產(chǎn)生出第2幀長的聲源信號,在音頻器部件里,配備如下裝置驅(qū)動聲源編碼本,用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源向量;及第2幀長聲源產(chǎn)生裝置,用于從驅(qū)動聲源向量中產(chǎn)生出具有第2幀長度的的聲源信號。
圖1是表示作為本發(fā)明的實(shí)施例里的音頻編碼裝置和音頻裝置的總體結(jié)構(gòu)框圖。
圖2是表示本發(fā)明的實(shí)施例1的目標(biāo)音頻產(chǎn)生裝置的操作一例的說明圖。
圖3是表示本發(fā)明的實(shí)施例5的目標(biāo)音頻產(chǎn)生裝置的操作一例的說明圖。
圖4是表示本發(fā)明的實(shí)施例6的目標(biāo)音頻產(chǎn)生裝置的操作一例的說明圖。
圖5是表示本發(fā)明的實(shí)施例7的目標(biāo)音頻產(chǎn)生裝置的操作一例的說明圖。
圖6是表示本發(fā)明的實(shí)施例8的目標(biāo)音頻產(chǎn)生裝置的操作一例的說明圖。
圖7是表示本發(fā)明的實(shí)施例9的目標(biāo)音頻產(chǎn)生裝置的操作一例的說明圖。
圖8是表示作為本發(fā)明的實(shí)施例10的音頻編碼裝置和音頻譯碼裝置的總體框圖。
圖9是表示現(xiàn)有的音頻編碼和譯碼裝置的實(shí)例的總體框圖。
圖10是表示現(xiàn)有的音頻編碼和譯碼裝置里的自適應(yīng)聲源向量的實(shí)例。
圖11是表示現(xiàn)有的改進(jìn)型音頻編碼和譯碼裝置里的自適應(yīng)聲源向量的實(shí)例。
圖12是表示現(xiàn)有的音頻編碼和譯碼裝置的另外一例的總體結(jié)構(gòu)框圖。
圖13是表示音頻編碼和譯碼裝置里的周期化驅(qū)動聲源向量的實(shí)例的說明圖。
實(shí)施例1圖1是表示本發(fā)明的實(shí)施例1的音頻編碼裝置和音頻譯碼裝置的總體結(jié)構(gòu)框圖。
在圖1里,各標(biāo)號分別表示1是編碼器部件;2是譯碼器部件;3是多路轉(zhuǎn)換裝置;4是分離裝置;5是輸入音頻;6是傳輸線路;7是輸出音頻編碼器部件是由如下的8、9以及25~36各個(gè)裝置所構(gòu)成的;其中,8是線性預(yù)測參數(shù)分析裝置;9是線性預(yù)測參數(shù)編碼裝置;15是聲源信號產(chǎn)生裝置;25是音調(diào)分析裝置,用于抽取輸入音頻的音調(diào)周期;26是延遲參數(shù)檢索區(qū)域決定裝置,用于決定出在檢索自適應(yīng)聲源向量時(shí)所需要的延遲參數(shù)的檢索范圍;27是音頻輸入提高采樣裝置,用于提高采樣輸入音頻;28是目標(biāo)音頻產(chǎn)生裝置,用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的目標(biāo)音頻向量;29是聲源信號提高采樣裝置,用于提高采樣過去生成的聲源信號;30是自適應(yīng)聲源編碼本,用于從過去生成的聲源信號產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源向量;31是自適應(yīng)聲源檢索裝置,用于評價(jià)從自適應(yīng)聲源向量獲得的復(fù)合音頻向量相對于目標(biāo)音頻向量的失真,并檢索出使失真變成最小的自適應(yīng)聲源向量;32是幀聲源產(chǎn)生裝置,用于從具有與延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源信號產(chǎn)生出具有幀長度的自適應(yīng)聲源信號;33是第2目標(biāo)音頻產(chǎn)生裝置,用于產(chǎn)生出具有與驅(qū)動聲源檢索時(shí)所用的延遲參數(shù)相對應(yīng)向量長度的目標(biāo)音頻向量;34是驅(qū)動聲源編碼本,用于輸出具有與延遲參數(shù)相對應(yīng)的向量長度的的驅(qū)動聲源向量;35是驅(qū)動聲源檢索裝置,用于評價(jià)從驅(qū)動聲源向量獲得的復(fù)合音頻向量相對于第2目標(biāo)音頻向量的失真,并檢索出使失真變成最小的驅(qū)動聲源向量;36是第2幀聲源產(chǎn)生裝置,用于從具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源信號產(chǎn)生出具有幀長度的驅(qū)動聲源信號。
此外,譯碼器部件是由如下的16、21、22乃至37~43各個(gè)裝置所構(gòu)成。16是信息預(yù)測參數(shù)譯碼裝置;21是聲源信號產(chǎn)生裝置;22是復(fù)合濾波器;37是聲源信號提高采樣裝置,用于提高采樣過去生成的聲源信號;38是自適應(yīng)聲源編碼本,用于輸出具有與延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源向量;39是自適應(yīng)聲源譯碼裝置-用于譯碼出具有與延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源信號;40是幀聲源產(chǎn)生裝置,用于從具有與延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源信號中產(chǎn)生出具有幀長度的自適應(yīng)聲源信號;41是驅(qū)動聲源編碼本,用于輸出具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源向量;42是驅(qū)動聲源譯碼裝置,用于譯碼出具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源信號;43是第2幀聲源產(chǎn)生裝置,用于從具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源信號,產(chǎn)生出具有幀長度的驅(qū)動聲源信號。
以下僅就實(shí)施例的編碼器部件的操作,說明如下首先,在編碼器部件1里,譬如說是以8KHz采樣的數(shù)字化音頻作為輸入音頻5的輸入信號。線性預(yù)測參數(shù)分析裝置8對上述輸入音頻5的輸入信號進(jìn)行分析,并抽出線性預(yù)測參數(shù),它就是音頻的頻譜包絡(luò)信息。然后,線性預(yù)測參數(shù)編碼裝置9把抽取出來的上述線性預(yù)測參數(shù)進(jìn)行量化,并將與其對應(yīng)的編碼發(fā)送給多路轉(zhuǎn)換裝置3。與此同時(shí),把量化的線性預(yù)測參數(shù)分別發(fā)送到自適應(yīng)聲源檢索裝置31、第2目標(biāo)音頻產(chǎn)生裝置33和驅(qū)動聲源檢索裝置35。
音調(diào)分析裝置25通過分析音頻輸入5抽出音調(diào)周期P。根據(jù)上述的音調(diào)周期P,譬如說,按照下面的等式(1),延遲參數(shù)檢索區(qū)域決定裝置26決定出當(dāng)查找自適應(yīng)聲源向量時(shí)所需要的延遲參數(shù)檢索范圍1min≤延遲參數(shù)≤1max;并把它發(fā)送到輸入音頻提高采樣裝置27、聲源信號提高采樣裝置29和自適應(yīng)聲源檢索裝置31。上述所用過的等式(1)中1min=P-ΔP1max=P+ΔP…………(1)其中,例如ΔP是P/10輸入音頻提高采樣裝置27,根據(jù)由延遲參數(shù)檢索區(qū)決定裝置26輸入的延遲參數(shù)的檢索范圍所規(guī)定的采樣率,例如,在對聲源信號進(jìn)行編碼作為單位的幀區(qū)間內(nèi),實(shí)現(xiàn)對輸入音頻提高采樣,并將采樣結(jié)果傳送給目標(biāo)音頻產(chǎn)生裝置28。其中,上述的規(guī)定的采樣率,譬如說是按以下情況決定的當(dāng)1min≤45,4倍采樣率提高采樣;當(dāng)45≤1min≤65,以2倍采樣率進(jìn)行提高采樣;當(dāng)65≤1min,則不進(jìn)行提高采樣。
目標(biāo)音頻采樣裝置28把由上述的輸入音頻提高采樣裝置27所輸入的具有幀長度的提高采樣輸入音頻按照由自適應(yīng)聲源檢索裝置31輸入來的延遲參數(shù)L對應(yīng)關(guān)系劃分成具有每份周期l;然后,通過在把對應(yīng)延遲參數(shù)L的具有相量長度的每份輸入音頻進(jìn)行加權(quán)平均計(jì)算,產(chǎn)生出對應(yīng)延遲參數(shù)L的具有向量長度的目標(biāo)音頻相量;于是,目標(biāo)音頻采樣裝置28把該目標(biāo)聲源向量輸出給自適應(yīng)聲源檢索裝置31和第2目標(biāo)音頻產(chǎn)生裝置33。其中,延遲參數(shù)L可以是整數(shù),也可以帶有小數(shù)的有理數(shù)。按照延遲參數(shù)L的存在范圍,例如,lint作為整數(shù)值延遲的情況下,可以取以下的一種值當(dāng)1<45的情況下,可以取lint、lint+1/4、lint+1/2、lint+3/4;當(dāng)45≤1<65的情況下,可取lint、lint+1/2;當(dāng)65≤1的情況下,可取lint。
典型目標(biāo)音頻向量如圖2所示,它具有從幀長度輸入音頻產(chǎn)生的對應(yīng)延遲參數(shù)1的向量長度。其中,若延遲參數(shù)L≥幀長度的情況下,則不進(jìn)行加權(quán)平均計(jì)算,并把幀長度的輸入音頻當(dāng)作是目標(biāo)音頻向量。
當(dāng)聲源信號提高采樣裝置29把從聲源信號產(chǎn)生裝置15收到過去生成的聲源信號,只有在根據(jù)從上述的延遲參數(shù)檢索區(qū)域決定裝置26輸入的延遲參數(shù)的自適應(yīng)聲源檢索中的自適應(yīng)聲源檢索區(qū)間是必要的情況下,才能按照上述延遲參數(shù)檢索范圍的采樣率執(zhí)行提高采樣操作,并把產(chǎn)生的聲源信號結(jié)果發(fā)送到自適應(yīng)聲源編碼本30。其中,采樣率是按照以下所述的規(guī)則決定的若在1<45的區(qū)間內(nèi),則按4倍采樣率進(jìn)行提高采樣;若在45≤1<65的區(qū)間內(nèi),則按2倍采樣率進(jìn)行提高采樣;若在65<1的區(qū)間內(nèi),則不進(jìn)行提高采樣。
自適應(yīng)聲源編碼本30根據(jù)由上述的聲源信號提高采樣裝置29輸入的提高采樣的聲源信號,把由自適應(yīng)聲源檢索裝置31輸入來的具有與延遲參數(shù)L相對應(yīng)的向量長度的的自適應(yīng)聲源向量送給自適應(yīng)聲源檢索裝置31。在這里,上述的自適應(yīng)聲源向量是通過抽取比延遲參數(shù)L早一個(gè)采樣的聲源信號而獲得的;若在延遲參數(shù)l≥幀長度的情況下,則自適應(yīng)聲源向量是通過抽取比延遲參數(shù)早一個(gè)幀長的采樣的聲源信號獲得的。
自適應(yīng)檢索裝置31配備有復(fù)合濾波器,并利用來自線性預(yù)測參數(shù)編碼裝置9的量化線性預(yù)測參數(shù),求出復(fù)合濾波器的脈沖響應(yīng)。然后,對于給定的延遲參數(shù)處在1min≤l≤1max的范圍內(nèi)時(shí),則自適應(yīng)聲源檢索裝置31通過利用上述的脈沖響應(yīng),反復(fù)地計(jì)算并合成來自自適應(yīng)聲源編碼本30的自適應(yīng)聲源向量,從而產(chǎn)生出復(fù)合音頻向量。自適應(yīng)聲源檢索裝置31求出由上述的目標(biāo)音頻產(chǎn)生裝置21輸入的目標(biāo)音頻向量相對于上述的復(fù)合音頻向量的聽覺加權(quán)失真。然后,通過比較,評價(jià)上述失真,自適應(yīng)聲源檢索裝置31求出使上述的失真變成最小的延遲參數(shù)L以及與其對應(yīng)的自適應(yīng)聲源增益β,并把上述的延遲參數(shù)L和自適應(yīng)聲源增益β的編碼,傳送給多路轉(zhuǎn)換裝置3和驅(qū)動聲源編碼本34;與此同時(shí),自適應(yīng)檢索裝置31把與上述的延遲參數(shù)L對應(yīng)的自適應(yīng)聲源向量和上述的自適應(yīng)聲源增益β相乘,從而產(chǎn)生出自適應(yīng)聲源信號,并把它發(fā)送到幀聲源傳送裝置32和第2目標(biāo)音頻產(chǎn)生裝置33。在這里,如果延遲參數(shù)L<幀長度的情況下,則自適應(yīng)聲源信號是L長的采樣;若L≥幀長度的情況下,則自適應(yīng)聲源信號是一個(gè)幀長度信號。
幀聲源產(chǎn)生裝置32根據(jù)由自適應(yīng)聲源檢索裝置31輸入的自適應(yīng)聲源信號,例如,在每個(gè)L的周期內(nèi)重復(fù)并周期化,產(chǎn)生出幀長度的自適應(yīng)聲源信號,并將其發(fā)送到聲源信號產(chǎn)生裝置15。
第2目標(biāo)聲源產(chǎn)生裝置33把從上述的自適應(yīng)聲源檢索裝置31輸入的自適應(yīng)聲源信號和利用由線性預(yù)測參數(shù)編碼裝置9輸入來的量化線性預(yù)測參數(shù),使二者實(shí)現(xiàn)線性預(yù)測復(fù)合,從而產(chǎn)生出復(fù)合音頻向量。于是,第2目標(biāo)音頻產(chǎn)生裝置33求出由目標(biāo)音頻產(chǎn)生裝置28輸入來的目標(biāo)音頻向量和上述的復(fù)合音頻向量之間的差分,并以此作為第2目標(biāo)音頻向量,將其發(fā)送給驅(qū)動聲源檢索裝置35。
在驅(qū)動聲源編碼本34里,例如,存儲著由隨機(jī)噪聲產(chǎn)生的N個(gè)驅(qū)動聲源向量。驅(qū)動聲源編碼本34在對應(yīng)延遲參數(shù)L的向量長度里,抽出由驅(qū)動聲源檢索裝置35輸入來的對應(yīng)驅(qū)動聲源編碼i的驅(qū)動聲源向量,并將其輸出。若延遲參數(shù)L≥幀長度時(shí),則輸出具有幀長度的驅(qū)動聲源向量。
驅(qū)動聲源檢索裝置35對應(yīng)N個(gè)驅(qū)動聲源向量把從上述的驅(qū)動聲源編碼本34輸入來的信號中,抽出驅(qū)動聲源向量和利用從上述的線性預(yù)測參數(shù)編碼裝置9輸入來的量化線性預(yù)測參數(shù),使二者進(jìn)行線性預(yù)測復(fù)合,從而產(chǎn)生出復(fù)合音頻向量。于是,驅(qū)動聲源檢索裝置35求出由上述的第2目標(biāo)音頻產(chǎn)生裝置33輸入來的第2目標(biāo)音頻向量相對于上述的復(fù)合音頻向量的聽覺加權(quán)失真。然后,通過比較評價(jià)上述的失真,求出使上述董事長變成最小的驅(qū)動聲源編碼I和與其對應(yīng)驅(qū)動聲源增益γ,并把上述的驅(qū)動聲源編碼I和驅(qū)動聲源增益γ的編碼送到多路轉(zhuǎn)換裝置3;與此同時(shí),把與上述的驅(qū)動聲源編碼I對應(yīng)的驅(qū)動向量乘以上述的驅(qū)動聲源增益γ,從而產(chǎn)生出驅(qū)動聲源信號,并將該信號傳送給第2幀聲源產(chǎn)生裝置36。
第2幀聲源產(chǎn)生裝置36根據(jù)由上述驅(qū)動聲源檢索裝置35所輸入的驅(qū)動聲源信號,例如,按每周期L重復(fù)并周期化,從而產(chǎn)生出幀長度的驅(qū)動聲源信號,并將它發(fā)送給聲源信號產(chǎn)生裝置15。
聲源信號產(chǎn)生裝置15把由上述的幀聲源產(chǎn)生裝置32所輸入的幀長度自適應(yīng)聲源信號和有由上述的第2幀聲源產(chǎn)生裝置36所輸入的幀長度的驅(qū)動聲源信號進(jìn)行加法運(yùn)算,從而產(chǎn)生出聲源信號,并把它傳送給聲源信號提高采樣裝置29。
當(dāng)上述的編碼過程完成后,多路轉(zhuǎn)換裝置3把上述的量化以后的對應(yīng)線性預(yù)測參數(shù)的編碼、延遲參數(shù)L、驅(qū)動聲源信號I以及聲源增益β和對應(yīng)γ的編碼,通過傳輸線路6輸出。
以上所述的操作是本發(fā)明的第1實(shí)施例的編碼器的特征性操作。
以下,就譯碼器部件2進(jìn)行說明。
首先,用于接收多路轉(zhuǎn)換裝置3輸出信息的分離裝置4通過分離過程,把相應(yīng)的信息分別傳送給以下各裝置把線性預(yù)測參數(shù)的編碼送給線性預(yù)測參數(shù)編碼裝置16;把延遲參數(shù)L送給自適應(yīng)聲源譯碼裝置39和驅(qū)動編碼本41;把聲源增益β的編碼送給自適應(yīng)聲源譯碼裝置39;把驅(qū)動聲源編碼I和聲源增益γ的編碼送給驅(qū)動聲源檢索裝置42。
首先,自適應(yīng)聲源譯碼裝置39把上述的延遲參數(shù)L傳送給聲源信號提高采樣裝置37和自適應(yīng)聲源編碼本38。聲源信號提高采樣裝置37把由聲源信號產(chǎn)生裝置21所輸入的在過去產(chǎn)生的聲源信號,僅在按照上述的自適應(yīng)聲源譯碼裝置39輸入的延遲參數(shù)L生成自適應(yīng)聲源向量時(shí)所需要的區(qū)間內(nèi),才能按照上述的延遲參數(shù)L規(guī)定的采樣率進(jìn)行提高采樣,并將提高采樣的聲源信號輸出給自適應(yīng)聲源編碼本38。在這里,提高采樣率是與編碼器部件里的聲源信號提高采樣裝置29所采取的同樣方式進(jìn)行確定的。
自適應(yīng)聲源編碼本38根據(jù)由上述的聲源信號提高采樣裝置37所輸入的提高采樣的聲源信號,產(chǎn)生出具有與自適應(yīng)聲源譯碼裝置39所輸入的延遲參數(shù)L相對應(yīng)的向量長度的自適應(yīng)聲源向量,并把它傳送給自適應(yīng)聲源譯碼裝置39。在這里,上述的自適應(yīng)聲源向量是抽出的比延遲參數(shù)L,早L采樣聲源信號,當(dāng)延遲參數(shù)L≥幀長度時(shí),將從比延遲參數(shù)L早L采樣中抽取一幀長的聲源信號。
自適應(yīng)聲源譯碼裝置39根據(jù)上述的自適應(yīng)聲源增益β的編碼,譯碼出自適應(yīng)聲源增益β,把由上述的自適應(yīng)聲源編碼本38輸入的自適應(yīng)聲源向量乘以上述的自適應(yīng)聲源增益β,從而產(chǎn)生出自適應(yīng)聲源信號,并將它傳送給幀聲源產(chǎn)生裝置40。幀聲源產(chǎn)生裝置40根據(jù)由上述的自適應(yīng)聲源譯碼裝置39輸入的自適應(yīng)聲源信號,例如,按每周期L重復(fù)并周期化,從而產(chǎn)生出幀長自適應(yīng)聲源信號,并將它傳送給聲源信號產(chǎn)生裝置21。
驅(qū)動聲源編碼本41和編碼器部件里的驅(qū)動聲源編碼本34,都存儲有同樣多的N個(gè)驅(qū)動聲源向量;按照與上述的延遲參數(shù)L相對應(yīng)的向量長度方式抽出由驅(qū)動聲源譯碼裝置42輸入的對應(yīng)驅(qū)動聲源編碼I的驅(qū)動聲源向量,并將它送給驅(qū)動聲源譯碼裝置42。
驅(qū)動聲源譯碼裝置42根據(jù)上述的驅(qū)動聲源增益γ的編碼,譯碼出驅(qū)動聲源增益γ,把由上述的驅(qū)動聲源編碼本輸入的信息中抽出的驅(qū)動聲源向量乘以所述驅(qū)動聲源增益γ,從而產(chǎn)生出驅(qū)動聲源信號,并將它傳送給第2幀聲源產(chǎn)生裝置43。第2幀聲源產(chǎn)生裝置43利用由上述的驅(qū)動聲源譯碼裝置42輸入的驅(qū)動聲源信號,例如,按每周期L重復(fù)該收到的信號,從而產(chǎn)生出周期化具有幀長度的驅(qū)動聲源信號,并將它傳送給聲源信號產(chǎn)生裝置21。
聲源信號產(chǎn)生裝置21把由上述的幀聲源產(chǎn)生裝置40所輸入的具有幀長度自適應(yīng)聲源信號和由上述的第2幀聲源產(chǎn)生裝置43輸入的具有幀長度的驅(qū)動聲源信號,實(shí)現(xiàn)加法運(yùn)算,于是產(chǎn)生出聲源信號并將它傳送給聲源信號提高采樣裝置37和復(fù)合濾波器22。復(fù)合濾波器22利用上述的聲源信號產(chǎn)生裝置21輸入的聲源信號和由線性預(yù)測參數(shù)譯碼裝置16輸入的線性預(yù)測參數(shù),使兩者進(jìn)行線性預(yù)測復(fù)合,并輸出輸出音頻7。
以上所述的操作是本發(fā)明實(shí)施例1的音頻譯碼裝置里的特征性操作。
根據(jù)本發(fā)明的實(shí)施例1,當(dāng)決定最佳延遲參數(shù)時(shí),延遲參數(shù)1比幀長短的情況下,周期性的加權(quán)平均計(jì)算輸入音頻,從而產(chǎn)生出具有向量長度l-的目標(biāo)音頻向量;另一方面,線性預(yù)測復(fù)合具有向量長度l的自適聲源應(yīng)向量,評價(jià)產(chǎn)生出的復(fù)合音頻向量相對于目標(biāo)音頻向量之間的失真;而且當(dāng)決定最佳的驅(qū)動聲源編碼時(shí),線性預(yù)測復(fù)合具有向量長度的驅(qū)動聲源向量,通過利用失真評價(jià)方法去評價(jià)復(fù)合音頻向量,防止復(fù)合音頻的質(zhì)量惡化,可以用少量的運(yùn)算量產(chǎn)生出高質(zhì)量的復(fù)合音頻。
實(shí)施例2上述的實(shí)施例1,在幀聲源產(chǎn)生裝置32、40以及第2幀聲源產(chǎn)生裝置36和43里,每一周期L重復(fù)并周期化與延遲參數(shù)L相對應(yīng)的向量長度的自適應(yīng)聲源信號或驅(qū)動聲源信號,產(chǎn)生出幀長度的自適應(yīng)聲源信號或驅(qū)動聲源信號;但是,例如在每周期L可以作為波形內(nèi)插,例如,按每周期L進(jìn)行波形插值處理,在幀之間進(jìn)行波形內(nèi)插插上述的對應(yīng)延遲參數(shù)L的具有向量長度的自適應(yīng)聲源信號或驅(qū)動聲源信號,也能很好地產(chǎn)生出自適應(yīng)聲源信號或驅(qū)動聲源信號。
根據(jù)本發(fā)明的第2實(shí)施例,使幀間的聲源信號變化變得平滑,復(fù)合音頻的再現(xiàn)性會更好,可以提高質(zhì)量。
實(shí)施例3在上述的實(shí)施例1和2里,根據(jù)對應(yīng)延遲參數(shù)L的具有向量長度的自適應(yīng)聲源信號和驅(qū)動聲源信號,利用幀聲源產(chǎn)生裝置以及第2幀聲源產(chǎn)生裝置,產(chǎn)生出具有幀長度的自適應(yīng)聲源信號和具有幀長度的驅(qū)動聲源信號,把二者進(jìn)行加法運(yùn)算,產(chǎn)生出具有幀長度的聲源信號;但是,可把對應(yīng)延遲參數(shù)L的具有向量長度的自適應(yīng)聲源信號和驅(qū)動聲源信號進(jìn)行加法運(yùn)算,從而產(chǎn)生出具有與延遲參數(shù)L相對應(yīng)的向量長度的聲源信號;這可以舉例說明如下按每周期L,把上述的信號進(jìn)行重復(fù)并周期化,從而也能很好地產(chǎn)生出具有幀長度的聲源信號。
實(shí)施例4在上述的實(shí)施例1里,編碼器部件和音頻器部件都采用新的結(jié)構(gòu);但是,編碼器部件依然選用實(shí)施例1的編碼器結(jié)構(gòu),然而譯碼器部件選用圖12所示的以往譯碼器部件結(jié)構(gòu),也是可以的。
實(shí)施例5上述的實(shí)施例1,在其目標(biāo)音頻產(chǎn)生裝置28方面,根據(jù)具有幀長度的輸入音頻產(chǎn)生出具有與延遲參數(shù)L相對應(yīng)的向量長度的目標(biāo)音頻向量;但是,如圖3所示,從具有與延遲參數(shù)L相對應(yīng)的向量長度的整倍數(shù)長的輸入音頻,也能很好地產(chǎn)生出目標(biāo)音頻向量。
根據(jù)本實(shí)施例5,在產(chǎn)生目標(biāo)音頻向量時(shí)的平均化處理里,可以進(jìn)行簡單處理,因?yàn)橐巡簧婕皫в胁煌蛄块L度的處理任務(wù)。而且,根據(jù)在對超出幀長的輸入音頻進(jìn)行音頻編碼時(shí)的評價(jià)過程中,按照已考慮到已知幀的復(fù)合音頻如何影響其以后幀的思路進(jìn)行編碼,所以使得復(fù)合音頻具有很好的再現(xiàn)性,從而可提高輸出質(zhì)量。
實(shí)施例6上述的實(shí)施例1,在其目標(biāo)音頻產(chǎn)生裝置28里,根據(jù)輸入音頻,當(dāng)產(chǎn)生具有與延遲參數(shù)L相對應(yīng)的向量長度的目標(biāo)音頻向量時(shí),只是作簡單的平均計(jì)算;但是,如圖4所示,按照具有與延遲參數(shù)L相對應(yīng)的向量長度的輸入音頻功率加權(quán)平均計(jì)算,譬如說,輸入音頻功率越大,則加的權(quán)也越大,按照這樣進(jìn)行加權(quán)平均計(jì)算。
根據(jù)本發(fā)明實(shí)施例6,在產(chǎn)生目標(biāo)音頻向量時(shí)的平均化處理中,由于按照輸入音頻功率進(jìn)行加權(quán)后實(shí)現(xiàn)音頻編碼,所以對主觀質(zhì)量(Subjectivequality)給予影響大的復(fù)合音頻的功率大部分的再現(xiàn)性都變得很好,從而可以提高音頻質(zhì)量。
實(shí)施例7上述的實(shí)施例1,在其目標(biāo)音頻產(chǎn)生裝置28里,從輸入音頻產(chǎn)生出具有與延遲參數(shù)L相對應(yīng)的向量長度的目標(biāo)音頻向量時(shí),只是進(jìn)行簡單的平均計(jì)算;但是,如圖5所示,按照具有與各延遲參數(shù)L相對應(yīng)的向量長度的輸入音頻之間的相關(guān)值加權(quán),例如,當(dāng)具有與其他各延遲參數(shù)L相對應(yīng)的向量長度的輸入音頻相關(guān)程度較低的情況下,可取小的加權(quán)值,這樣進(jìn)行加權(quán)平均計(jì)算也是可以的。
根據(jù)本實(shí)施例7,在產(chǎn)生目標(biāo)音頻向量的加權(quán)平均處理中,由于按照輸入音頻具有周期l的周期性的情況,對相關(guān)程度較低的部分取小的加權(quán)值的原則進(jìn)行音頻編碼,即使是音調(diào)周期變動的音頻,也能產(chǎn)生出對應(yīng)1音調(diào)周期的失真程度小的目標(biāo)音頻向量,并能獲得更好的復(fù)合音頻再現(xiàn)性,從而可提高質(zhì)量。
實(shí)施例8上述的實(shí)施例1,在其目標(biāo)音頻產(chǎn)生裝置28里,當(dāng)從輸入音頻產(chǎn)生出具有與延遲參數(shù)L相對應(yīng)的向量長度的目標(biāo)音頻向量時(shí),只是進(jìn)行簡單平均處理;但是,如圖6所示,按照具有與各延遲參數(shù)L相對應(yīng)的向量長度的輸入音頻間的位置加權(quán),例如,對于幀邊界附近的輸入音頻,其加權(quán)值可取較大的值進(jìn)行加權(quán)平均計(jì)算也是可以的。
根據(jù)本實(shí)施例8,在產(chǎn)生目標(biāo)音頻向量時(shí)的加權(quán)平均處理中,給幀邊界附近的輸入音頻的加權(quán)值較大,生成目標(biāo)音頻向量,由于按照這種方法實(shí)現(xiàn)編碼,所以幀邊界附近的復(fù)合音頻再現(xiàn)性良好,可使幀間的復(fù)合音頻變化變得平滑起來。這種效果在本實(shí)施例2里的用幀間插補(bǔ)方法產(chǎn)生聲源信號時(shí),尤為顯著。
實(shí)施例9上述實(shí)施例1,在其目標(biāo)音頻產(chǎn)生裝置28里,當(dāng)從輸入音頻產(chǎn)生出具有與延遲參數(shù)L相對應(yīng)的向量長度的目標(biāo)音頻向量時(shí),把輸入音頻按每周期l進(jìn)行加權(quán)平均計(jì)算;但是,如圖7所示,精細(xì)調(diào)整抽出輸入音頻的位置,例如,使與各延遲參數(shù)L相對應(yīng)的向量長度的輸入音頻間的相互相關(guān)變?yōu)樽畲蠖M(jìn)行加法平均也是可以的。
根據(jù)本實(shí)施例9,在產(chǎn)生目標(biāo)音頻向量時(shí)的平均化處理中,按照能使具有與延遲參數(shù)L相對應(yīng)的向量長度的輸入音頻之間相互相關(guān)變成最大的原則,精細(xì)地調(diào)整抽出的位置,即使對于音調(diào)周期變動的輸入音頻,也可產(chǎn)生出對應(yīng)1音調(diào)周期l的失真達(dá)到最小程度的目標(biāo)音頻向量,將可使目標(biāo)音頻的再現(xiàn)性良好,可提高質(zhì)量。
實(shí)施例10圖8是表示本發(fā)明的實(shí)施例10音頻編碼裝置和音頻譯碼裝置總體結(jié)構(gòu)框圖。在該框圖里,與圖1中的相同部分都標(biāo)上同樣的標(biāo)號,因而省略其說明部分。
在圖8里,它采取有別于圖1的新結(jié)構(gòu)如下44是把輸入音頻進(jìn)行提高采樣的輸入音頻提高采樣裝置;45是產(chǎn)生出具有與音調(diào)周期相對應(yīng)的向量長度的目標(biāo)音頻向量的目標(biāo)音頻產(chǎn)生裝置;46和51為驅(qū)動聲源編碼本,它用于輸出具有與音調(diào)周期相對應(yīng)的向量長度的驅(qū)動聲源向量;47是驅(qū)動聲源檢索裝置,它用于評價(jià)由驅(qū)動聲源向量獲得的復(fù)合音頻向量相對應(yīng)目標(biāo)音頻向量的失真,并且檢索出使失真變成最小的驅(qū)動聲源向量;48是第2目標(biāo)音頻產(chǎn)生裝置,它產(chǎn)生出在第2驅(qū)動聲源向量檢索里的與音調(diào)周期相對應(yīng)的向量長度的目標(biāo)音頻向量;49和54是第2驅(qū)動聲源編碼本,它用于輸出具有與音調(diào)周期相對應(yīng)的向量長度的第2驅(qū)動聲源向量;50是第2驅(qū)動聲源檢索裝置,它評價(jià)由第2驅(qū)動聲源向量獲得的復(fù)合音頻向量相對于第2目標(biāo)音頻向量的失真并檢索出使上述的失真變成最小的驅(qū)動聲源向量;52驅(qū)動聲源譯碼裝置,它譯碼出具有與音調(diào)周期相對應(yīng)的向量長度的驅(qū)動聲源信號;53是幀聲源產(chǎn)生裝置,它根據(jù)具有與音調(diào)周期相對應(yīng)的向量長度的驅(qū)動聲源信號,產(chǎn)生出具有幀長度的驅(qū)動聲源信號;55是第2驅(qū)動聲源譯碼裝置,它譯碼出具有與音調(diào)周期相對應(yīng)的向量長度的第2驅(qū)動聲源信號;56是第2幀聲源產(chǎn)生裝置,它根據(jù)具有與音調(diào)周期相對應(yīng)的向量長度的第2驅(qū)動聲源信號,產(chǎn)生出具有幀長度的驅(qū)動聲源信號。
以下將以上述的新結(jié)構(gòu)為中心,解說其操作原理。
首先,在編碼器部件1里音調(diào)分析裝置25分析輸入音頻5,抽取音調(diào)周期P,并將它傳送給多路轉(zhuǎn)換裝置3,輸入音頻提高采樣裝置44,目標(biāo)音頻產(chǎn)生裝置45,驅(qū)動聲源編碼本46和第2驅(qū)動聲源編碼本49。其中,音調(diào)周期除了可選取整數(shù)值之外,也可選取非整數(shù)的有理數(shù),按照P值存在范圍,例如,把Pint作為整數(shù)音調(diào)周期的情況下可選取如下的各種數(shù)值當(dāng)P<45的情況下,可取Pint、Pint+1/4、Pint+1/2和Pint+3/4;當(dāng)45≤P<65的情況下,可取Pint、Pint+1/2;當(dāng)65≤P的情況下,則可取Pint值。
輸入音頻提高采樣裝置44按照由音調(diào)分析裝置25所輸入的音調(diào)周期規(guī)定的采樣率,對輸入音頻與進(jìn)行提高采樣操作,例如,在作為編碼聲源信號單位的幀區(qū)間里進(jìn)行提高采樣,并將采樣結(jié)果發(fā)送給目標(biāo)音頻產(chǎn)生裝置45。其中,提高采樣率,例如按以下情況確定,當(dāng)P<45的情況下,以4倍提高采樣操作;當(dāng)45≤P<65的情況下,以2倍提高采樣操作;當(dāng)65≤P的情況下,則不進(jìn)行提高采樣操作。
目標(biāo)音頻產(chǎn)生裝置45按照由音調(diào)分析裝置25輸入來的周期P,例如,按照每一周期P加法平均計(jì)算由上述的輸入音頻提高采樣裝置44所輸入的以提高采樣的具有向量長度的輸入音頻,從而產(chǎn)生出具有向量長度P的目標(biāo)音頻向量,并將它發(fā)送到確定聲源檢索裝置47和第2目標(biāo)音頻產(chǎn)生裝置48。其中,P≥幀長度的情況下,則不進(jìn)行上述的加法平均計(jì)算,并把具有幀長度的輸入音頻作為目標(biāo)音頻向量。
驅(qū)動聲源編碼本46里,例如,存儲著由隨機(jī)噪聲產(chǎn)生的N個(gè)驅(qū)動聲源向量,并按照由上述的音調(diào)分析裝置25所輸入的具有與音調(diào)周期P相對應(yīng)的向量長度,抽取并輸出由驅(qū)動聲源檢索裝置47所輸入的與驅(qū)動聲源i相對應(yīng)的驅(qū)動聲源向量。在這里,若P≥幀長度時(shí),則輸出具有幀長度的驅(qū)動聲源向量。
驅(qū)動聲源檢索裝置47對于N個(gè)驅(qū)動聲源向量,把由上述的驅(qū)動聲源編碼本46里抽出的驅(qū)動聲源向量和由線性預(yù)測參數(shù)編碼裝置9所輸入的已量化的線性預(yù)測參數(shù),進(jìn)行線性預(yù)測復(fù)合,從而產(chǎn)生出復(fù)合音頻向量。然后,驅(qū)動聲源檢索裝置47求出由上述目標(biāo)音頻產(chǎn)生裝置45輸入來的目標(biāo)音頻向量相對于上述的復(fù)合音頻向量之間的聽覺加權(quán)失真。緊接著通過比較進(jìn)行評價(jià)上述失真,驅(qū)動聲源檢索裝置47尋找出使上述失真變成最小的驅(qū)動聲源編碼I以及與其對應(yīng)的驅(qū)動聲源增益γ,并把上述的驅(qū)動聲源編碼I和驅(qū)動聲源增益γ的編碼發(fā)送到多路轉(zhuǎn)換裝置3;與此同時(shí),把對應(yīng)上述驅(qū)動聲源編碼I的驅(qū)動聲源向量乘以上述的驅(qū)動聲源增益γ,從而產(chǎn)生出驅(qū)動聲源信號,并將它發(fā)送給第2目標(biāo)音頻產(chǎn)生裝置48。
第2目標(biāo)音頻產(chǎn)生裝置48把由上述的驅(qū)動聲源檢索裝置47輸入的驅(qū)動聲源信號和由線性預(yù)測參數(shù)編碼裝置9輸入的已量化的線性預(yù)測參數(shù)兩者進(jìn)行線性預(yù)測復(fù)合,從而產(chǎn)生出復(fù)合音頻向量。然后,第2目標(biāo)音頻產(chǎn)生裝置48求出由上述目標(biāo)音頻產(chǎn)生裝置45輸入來的目標(biāo)音頻向量和由上述的復(fù)合音頻向量之間的差分,將它作為第2目標(biāo)音頻向量發(fā)送到第2驅(qū)動聲源檢索裝置50。
在第2驅(qū)動聲源編碼本49里,例如,儲存著由隨機(jī)噪聲產(chǎn)生出來的N個(gè)驅(qū)動聲源向量,并按照由上述音調(diào)分析裝置25所輸入的對應(yīng)音調(diào)周期P的向量長度,抽出并輸出由第2驅(qū)動聲源檢索裝置50所輸入的對應(yīng)驅(qū)動聲源編碼j的第2驅(qū)動聲源向量。在這里,若P≥幀長度的情況下,則輸出具有幀長度的驅(qū)動聲源向量。
第2驅(qū)動聲源檢索裝置50對于N個(gè)驅(qū)動聲源向量,把由上述的第2驅(qū)動聲源編碼本49抽出的第2驅(qū)動聲源向量和由上述的線性預(yù)測參數(shù)編碼裝置9輸入的已量化的線性預(yù)測參數(shù)兩者進(jìn)行線性預(yù)測復(fù)合,從而產(chǎn)生出復(fù)合音頻向量。并且,第2驅(qū)動聲源檢索裝置50求出由上述的第2目標(biāo)音頻產(chǎn)生裝置48輸入的第2目標(biāo)音頻向量相對于上述的復(fù)合音頻向量的聽覺加權(quán)失真;緊接著通過比較進(jìn)行評價(jià)上述的失真,求出使上述的失真變成最小的第2驅(qū)動聲源編碼J和與其對應(yīng)的第2驅(qū)動聲源增益γ2。并把上述的第2驅(qū)動聲源編碼J和第2驅(qū)動聲源增益γ2的編碼發(fā)送到多路轉(zhuǎn)換裝置3。
上述的編碼過程完成之后,多路轉(zhuǎn)換裝置3把對應(yīng)上述的量化后的線性預(yù)測參數(shù)的編碼、音調(diào)周期P、驅(qū)動聲源編碼I、J以及對應(yīng)聲源增益γ、γ2的編碼,都通過傳輸線路6發(fā)送出去。
以上所述是本實(shí)施例10的音頻編碼裝置里的特征性操作。
以下,將繼續(xù)說明有關(guān)編碼器部件2的情況。
首先,接收多路轉(zhuǎn)換裝置3輸出的分離裝置4,通過分離處理分別把線性預(yù)測參數(shù)編碼送到線性預(yù)測參數(shù)譯碼裝置16、音調(diào)周期P送到驅(qū)動聲源編碼本51和第2驅(qū)動聲源編碼本54、驅(qū)動聲源編碼I和聲源增益γ的編碼送到驅(qū)動聲源譯碼裝置52和第2驅(qū)動聲源編碼J和音頻增益γ2的編碼送到第2驅(qū)動聲源譯碼裝置55。
驅(qū)動聲源編碼本51和編碼器部件的驅(qū)動聲源編碼本46,都存儲著相同數(shù)量的N個(gè)驅(qū)動聲源向量,并按照與上述的音調(diào)周期P相對應(yīng)的向量長度,抽出由驅(qū)動聲源譯碼裝置52輸入的對應(yīng)驅(qū)動聲源編碼I的驅(qū)動聲源向量并將它發(fā)送到驅(qū)動聲源譯碼裝置52。
驅(qū)動聲源譯碼裝置52從上述的驅(qū)動聲源增益γ的編碼,譯碼出驅(qū)動增益γ,把由上述的驅(qū)動編碼本51輸入的信息中抽出驅(qū)動聲源向量乘以驅(qū)動聲源增益γ,從而產(chǎn)生出驅(qū)動聲源信號,并將它送到幀聲源產(chǎn)生裝置53。幀聲源產(chǎn)生裝置53根據(jù)由上述的驅(qū)動聲源譯碼裝置52輸入的聲源信號,例如,按每周期P重復(fù)并周期化,從而產(chǎn)生出具有幀長度的驅(qū)動聲源信號并將它送到聲源產(chǎn)生裝置21。
第2驅(qū)動聲源編碼本54和編碼器部件里的第2驅(qū)動聲源編碼本49,都存儲著同樣多的N個(gè)驅(qū)動聲源向量,并在具有與上述的音調(diào)周期P相對應(yīng)的向量長度里,抽出由第2驅(qū)動聲源編碼裝置55輸入的與第2驅(qū)動聲源編碼J相對應(yīng)的第2驅(qū)動聲源向量,并將它送到第2驅(qū)動聲源編碼裝置55。
第2驅(qū)動聲源譯碼裝置55由上述的第2驅(qū)動聲源增益γ2的編碼中譯碼出驅(qū)動聲源增益γ2,把由上述的第2驅(qū)動聲源編碼本54里抽出的第2驅(qū)動聲源向量乘以上述的驅(qū)動聲源增益γ2,從而產(chǎn)生出第2驅(qū)動聲源信號,并將它發(fā)送到第2幀聲源產(chǎn)生裝置56。第2幀聲源產(chǎn)生裝置56根據(jù)由上述的第2驅(qū)動聲源譯碼裝置55輸入的第2驅(qū)動聲源信號,例如。在每個(gè)周期P里重復(fù)并周期化,從而產(chǎn)生出第2幀長度驅(qū)動聲源信號,并將它發(fā)送到聲源信號產(chǎn)生裝置21。
聲源信號產(chǎn)生裝置21把由上述的幀聲源產(chǎn)生裝置53輸入的具有幀長度的驅(qū)動聲源信號和由上述的第2幀聲源產(chǎn)生裝置56輸入的驅(qū)動聲源信號繼續(xù)加法運(yùn)算,從而產(chǎn)生出聲源信號,并將它送到復(fù)合濾波器22,復(fù)合濾波器22把由上述的聲源信號產(chǎn)生裝置21輸入的聲源信號和由線性預(yù)測參數(shù)譯碼裝置16輸入的線性預(yù)測參數(shù)進(jìn)行線性預(yù)測復(fù)合,將其結(jié)果輸出音頻7輸出出去。
以上所述是本實(shí)施例10的音頻譯碼裝置里的具有特征性的操作。
根據(jù)本實(shí)施例10,當(dāng)輸入音頻的音調(diào)周期P比幀長度短時(shí),周期的加法平均計(jì)算輸入音頻,產(chǎn)生出具有向量長度P的目標(biāo)音頻向量;另一方面,把向量長度P的驅(qū)動聲源向量進(jìn)行線性預(yù)測復(fù)合,根據(jù)評價(jià)生成的復(fù)合音頻向量之間的失真,防止復(fù)合音頻質(zhì)量下降,以少的運(yùn)算量可產(chǎn)生出高質(zhì)量的復(fù)合音頻。
正如上所述,根據(jù)本發(fā)明,由于在音頻編碼裝置里具備如下各裝置從輸入音頻產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的目標(biāo)音頻向量的目標(biāo)向量產(chǎn)生裝置;從在過去生成的音頻信號,產(chǎn)生出具有與上述的延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源向量的自適應(yīng)聲源編碼本;評價(jià)由上述的自適應(yīng)聲源向量獲得的復(fù)合音頻向量相對于上述的目標(biāo)音頻向量的失真,并檢索出使失真變成最小的自適應(yīng)聲源向量的自適應(yīng)聲源檢索裝置;從使上述失真變成最小的自適應(yīng)聲源向量產(chǎn)生出具有幀長度的聲源信號的幀聲源產(chǎn)生裝置。正因?yàn)槿绱?,可防止?fù)合音頻質(zhì)量下降,以少的運(yùn)算量可產(chǎn)生出高質(zhì)量的復(fù)合音頻。
而且,根據(jù)本發(fā)明,由于目標(biāo)音頻向量的向量長度可選取為有理數(shù),當(dāng)從輸入音頻產(chǎn)生目標(biāo)音頻向量時(shí),不依賴與輸入音頻的采樣周期,可產(chǎn)生出高精度目標(biāo)音頻向量,防止復(fù)合音頻質(zhì)量下降,以少的計(jì)算量可產(chǎn)生出高質(zhì)量復(fù)合音頻。
而且,根據(jù)發(fā)明,由于目標(biāo)音頻產(chǎn)生裝置按照每向量長度劃分出具有與延遲參數(shù)相對應(yīng)的向量長度的整倍數(shù)長的輸入音頻,再把上述的每一向量長度的輸入音頻進(jìn)行加權(quán)平均計(jì)算,從而產(chǎn)生出目標(biāo)音頻向量,因此在產(chǎn)生目標(biāo)音頻向量時(shí)的平均化處理過程里,不涉及處理不同向量長度的向量,可實(shí)現(xiàn)簡單處理,防止復(fù)合音頻的質(zhì)量下降,以少的計(jì)算量可產(chǎn)生出高質(zhì)量的復(fù)合音頻。
而且,假定僅就產(chǎn)生目標(biāo)音頻向量的向量長度整倍數(shù)長的輸入音頻已超過幀長度以上的情況而論,根據(jù)用于對超過幀長度的輸入音頻實(shí)現(xiàn)編碼時(shí)的評價(jià),按照已考慮到的已知幀的復(fù)合音頻如何其以后幀的思路進(jìn)行決定編碼,所以使得復(fù)合音頻具有很好的再現(xiàn)性,可以提高質(zhì)量。
而且,即使是關(guān)于每向量長的輸入音頻的特征量很少,若能包括輸入音頻的功率信息,則根據(jù)依照輸入音頻功率大的部分予以加權(quán)編碼,使得對主觀質(zhì)量有很大影響的復(fù)合音頻功率大的部分的再現(xiàn)性變好,可提高質(zhì)量。
而且,即使是關(guān)于每向量長的輸入音頻的特征量很少,若包含輸入音頻的相關(guān)信息,作為輸入音頻具有周期L的周期性情況下,則按照相關(guān)程度低的部分小權(quán)重來進(jìn)行音頻編碼,盡管是對于音調(diào)周期變動的輸入音頻也可產(chǎn)生出對應(yīng)一音調(diào)周期的失真小的目標(biāo)音頻向量,使復(fù)合音頻的再現(xiàn)性良好,從而提高質(zhì)量。
而且,目標(biāo)音頻產(chǎn)生裝置依照每個(gè)向量程度的輸入音頻時(shí)間關(guān)系,在上述的每向量長度里,進(jìn)行加權(quán)平均計(jì)算輸入音頻,若能決定在生成目標(biāo)音頻向量時(shí)的權(quán)重,則可對在幀邊界附近的輸入音頻給予大的權(quán)重,產(chǎn)生出目標(biāo)音頻向量,通過按照這種方式進(jìn)行編碼,于是在幀邊界附近的復(fù)合音頻的再現(xiàn)性可以變好,可使幀間的復(fù)合音頻的變化平滑起來。
而且,目標(biāo)音頻產(chǎn)生裝置當(dāng)把輸入音頻在每個(gè)向量長度里進(jìn)行加權(quán)平均計(jì)算時(shí),若能進(jìn)行精細(xì)調(diào)整,上述的每向量長的輸入音頻時(shí)間關(guān)系,按照向量長l的輸入音頻間的相互關(guān)系大的抽出進(jìn)行細(xì)微調(diào)整位置,盡管是對于音調(diào)周期變動的輸入音頻,也可產(chǎn)生出對應(yīng)1音調(diào)周期的失真小的目標(biāo)音頻向量,所以復(fù)合音頻的再現(xiàn)性良好,從而提高質(zhì)量。
而且,根據(jù)本發(fā)明,由于幀聲源產(chǎn)生裝置把具有向量長度的聲源向量在幀間進(jìn)行插補(bǔ),從而生成聲源信號,使幀間的聲源信號變化變得平滑起來,可使復(fù)合音頻的再現(xiàn)性良好,提高質(zhì)量。
權(quán)利要求
1.一種把輸入音頻分成頻譜包絡(luò)信息和聲源信息并且以幀為單位對聲源信號信息進(jìn)行編碼的音頻編碼裝置,其特征是,具備從輸入音頻產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的目標(biāo)音頻向量的目標(biāo)音頻產(chǎn)生裝置;從過去生成的聲源信號產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源向量的自適應(yīng)聲源編碼本;評價(jià)由上述自適應(yīng)聲源向量獲得的復(fù)合音頻向量相對于上述目標(biāo)音頻向量的失真,并且檢索出使上述失真變成最小的自適應(yīng)聲源向量的自適應(yīng)聲源檢索裝置;以及從使上述失真變成最小的自適應(yīng)聲源向量,產(chǎn)生出具有幀長度的聲源信號的幀聲源產(chǎn)生裝置。
2.根據(jù)權(quán)利要求1記載的音頻編碼裝置,其特征是,具備第2目標(biāo)音頻產(chǎn)生裝置,用于從與目標(biāo)音頻向量失真變成最小的自適應(yīng)聲源向量,產(chǎn)生出第2目標(biāo)音頻向量;驅(qū)動聲源編碼本,用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源向量;驅(qū)動聲源檢索裝置,用于評價(jià)由上述驅(qū)動聲源向量獲得的第2復(fù)合音頻向量相對于上述第2目標(biāo)音頻向量的失真,并檢索出使失真變成最小的驅(qū)動聲源向量;以及第2幀聲源產(chǎn)生裝置,用于由使上述失真變成最小的由驅(qū)動聲源向量產(chǎn)生出第2幀長聲源信號。
3.一種把輸入音頻分成頻譜包絡(luò)信息和聲源信號信息并以幀為單位對聲源信號進(jìn)行編碼的音頻編碼裝置里,其特征是,具備目標(biāo)音頻產(chǎn)生裝置,用于由輸入音頻產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的目標(biāo)音頻向量;驅(qū)動聲源編碼本,用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源向量;驅(qū)動聲源檢索裝置,用于評價(jià)由上述驅(qū)動聲源向量獲得的復(fù)合音頻向量相對于上述目標(biāo)音頻向量的失真,并檢索出使失真變成最小的驅(qū)動聲源向量;以及幀聲源產(chǎn)生裝置,用于從上述使失真變成最小的驅(qū)動聲源向量產(chǎn)生出具有幀長的聲源信號。
4.根據(jù)權(quán)利要求3記載的音頻編碼裝置,其特征是,延遲參數(shù)按照對應(yīng)輸入音頻的音調(diào)周期進(jìn)行決定的。
5.根據(jù)權(quán)利要求1~3所記載的任何一項(xiàng)的音頻編碼裝置,其特征是,與延遲參數(shù)相對應(yīng)的向量長度取有理數(shù)。
6.根據(jù)權(quán)利要求1~3所記載的任何一項(xiàng)的音頻編碼裝置,其特征是,目標(biāo)音頻產(chǎn)生裝置按照對應(yīng)延遲參數(shù)的每個(gè)向量長度劃分幀輸入音頻,并把每個(gè)向量長度的輸入音頻進(jìn)行加權(quán)平均,產(chǎn)生出目標(biāo)音頻向量。
7.根據(jù)權(quán)利要求1~3所記載的任何一項(xiàng)的音頻編碼裝置,其特征是,目標(biāo)音頻產(chǎn)生裝置把具有與延遲參數(shù)相對應(yīng)的向量長度的整倍數(shù)長度的輸入音頻劃分成每個(gè)向量長度,并且加權(quán)平均每向量長度的輸入音頻,從而產(chǎn)生出目標(biāo)音頻向量。
8.根據(jù)權(quán)利要求1~3所記載的任何一項(xiàng)的音頻編碼裝置,其特征是,目標(biāo)音頻產(chǎn)生裝置依照具有與延遲參數(shù)相對應(yīng)的每向量長的輸入音頻有關(guān)的特征量,決定出產(chǎn)生音頻向量時(shí)的權(quán)重,把輸入音頻在每向量長度內(nèi)進(jìn)行加權(quán)平均。
9.根據(jù)權(quán)利要求1~3所記載的任何一項(xiàng)的音頻編碼裝置,其特征是,幀聲源產(chǎn)生裝置在每個(gè)向量長度里,重復(fù)具有與延遲參數(shù)相對應(yīng)的向量長度的聲源向量并周期化,從而產(chǎn)生出具有幀長度的聲源信號。
10.根據(jù)權(quán)利要求1~3所記載的任何一項(xiàng)的音頻編碼裝置,其特征是,幀聲源產(chǎn)生裝置在幀間進(jìn)行插補(bǔ)具有與延遲參數(shù)相對應(yīng)的向量長度的聲源向量,從而產(chǎn)生出聲源信號。
11.根據(jù)權(quán)利要求1記載的音頻編碼裝置,其特征是,自適應(yīng)聲源檢索裝置備有復(fù)合濾波器,利用該復(fù)合濾波器的脈沖響應(yīng),反復(fù)計(jì)算由自適應(yīng)聲源向量獲得的復(fù)合音頻向量相對于目標(biāo)音頻向量的失真。
12.一種把輸入音頻分成頻譜包絡(luò)信息和聲源信息,而且以幀為單位對聲源信號進(jìn)行編碼并將編碼的聲源信號信息進(jìn)行譯碼,從而產(chǎn)生輸出音頻的音頻編碼譯碼裝置,其特征是,在編碼部件方面具備目標(biāo)音頻產(chǎn)生裝置,用于從輸入音頻產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的目標(biāo)音頻向量;自適應(yīng)聲源編碼本,用于從過去生成的聲源信號產(chǎn)生出具有與上述延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源向量;自適應(yīng)聲源檢索裝置,用于評價(jià)由上述自適應(yīng)聲源向量獲得的復(fù)合音頻向量相對于上述目標(biāo)音頻向量的失真,并且檢索出使失真變成最小的自適應(yīng)聲源向量;以及幀聲源產(chǎn)生裝置,用于由使上述失真變成最小的自適應(yīng)聲源向量,產(chǎn)生出具有幀長度的聲源信號,另一方面,在編碼部件里具備如下自適應(yīng)聲源編碼本,用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的聲源向量;以及幀聲源產(chǎn)生裝置,用于由自適應(yīng)聲源向量產(chǎn)生出具有幀長的聲源信號。
13.根據(jù)權(quán)利要求12記載的音頻編碼和譯碼裝置,其特征是,在編碼方面,具備如下第2目標(biāo)音頻產(chǎn)生裝置,用于由目標(biāo)音頻向量和自適應(yīng)聲源向量產(chǎn)生出第2目標(biāo)音頻向量;驅(qū)動聲源編碼本,用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源向量驅(qū)動聲源檢索裝置,用于評價(jià)由上述驅(qū)動聲源向量獲得的第2復(fù)合音頻向量相對于第2目標(biāo)音頻向量的失真,并檢索出使失真變成最小的驅(qū)動聲源向量;以及第2幀聲源產(chǎn)生裝置,用于由上述使失真最小的驅(qū)動聲源向量產(chǎn)生出第2幀長的聲源信號,另一方面,在編碼部件里具備驅(qū)動聲源編碼本,用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源向量;以及第2幀聲源產(chǎn)生裝置,用于從驅(qū)動聲源向量產(chǎn)生出第2幀長的聲源信號。
14.一種把輸入音頻分成頻譜包絡(luò)信息和聲源信號信息并以幀為單位對聲源信號信息進(jìn)行編碼和將編碼的聲源信號信息譯碼再產(chǎn)生出輸出音頻的音頻編碼譯碼裝置,其特征是,在編碼部件里具有目標(biāo)音頻產(chǎn)生裝置,用于從輸入音頻產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的目標(biāo)音頻向量;驅(qū)動聲源編碼本,用于產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的驅(qū)動聲源向量;驅(qū)動聲源檢索裝置用于評價(jià)由上述驅(qū)動聲源向量獲得的復(fù)合音頻向量相對于上述目標(biāo)音頻向量的失真,并檢索出使失真變成最小的驅(qū)動聲源向量;以及幀聲源產(chǎn)生裝置,用于從使失真變成最小的驅(qū)動聲源向量產(chǎn)生出具有向量長度的聲源信號,另一方面,在譯碼部件里,具備如下驅(qū)動聲源編碼本,用于從與延遲參數(shù)相對應(yīng)的向量長度產(chǎn)生出具有幀長度的聲源向量;以及幀聲源產(chǎn)生裝置,用于從驅(qū)動聲源向量產(chǎn)生出具有幀長的聲源信號。
全文摘要
音頻編碼裝置當(dāng)把音頻進(jìn)行編碼時(shí),能防止音頻質(zhì)量下降,以小的運(yùn)算量可產(chǎn)生出高質(zhì)量復(fù)合音頻。音頻編碼裝置具備:目標(biāo)音頻產(chǎn)生裝置,用于由輸入音頻產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的目標(biāo)音頻向量;自適應(yīng)聲源編碼本,用于由過去生成的聲源信號產(chǎn)生出具有與延遲參數(shù)相對應(yīng)的向量長度的自適應(yīng)聲源向量;自適應(yīng)聲源檢索裝置,用于評價(jià)由上述自適應(yīng)聲源向量獲得的復(fù)合音頻向量相對于上述目標(biāo)音頻向量的失真,并檢索出使失真變成最小的自適應(yīng)聲源向量;以及幀聲源產(chǎn)生裝置,用于由上述的使失真變成最小的自適應(yīng)聲源向量獲得具有幀長的聲源信號。
文檔編號G10L19/12GK1170189SQ97102939
公開日1998年1月14日 申請日期1997年3月12日 優(yōu)先權(quán)日1996年5月29日
發(fā)明者山浦正, 田崎裕久, 高橋真哉 申請人:三菱電機(jī)株式會社