亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

編碼設備、解碼設備、編碼方法和解碼方法

文檔序號:2821038閱讀:341來源:國知局
專利名稱:編碼設備、解碼設備、編碼方法和解碼方法
技術領域
本發(fā)明涉及對諸如音頻信號或語音信號之類的聲信號進行高效壓縮編碼的編碼設備、解碼設備、編碼方法和解碼方法,尤其涉及即使根據(jù)一部分編碼信息也能夠解碼音頻或語音的、適合于可伸縮(scalar)編碼和解碼的編碼設備、解碼設備、編碼方法和解碼方法。
背景技術
以低位速率壓縮音頻信號或語音信號的聲音編碼技術對于有效利用移動通信中的無線電和記錄媒體是非常重要的。編碼語音信號的語音編碼方法包括由ITU(國際電信聯(lián)盟)標準化的G726和G729。這些方法編碼窄帶信號(300Hz-3.4kHz),并且能夠以8kb/s(千位每秒)到32kb/s的位速率進行高質(zhì)編碼。
寬帶(50Hz-7kHz)的標準編碼包括ITU的G722和G722.1和GPP(第三代伙伴項目)的AMR-WB。這些方法能夠以6.6kb/s到64kb/s的位速率高質(zhì)編碼寬帶語音信號。
以低位速率對語音信號高效編碼的有效方法是CELP(碼激勵線性預測)。CELP是根據(jù)通過工程技術模仿人類語音生成模型的模型進行編碼的方法。具體地說,在CELP中,讓由隨機值組成的激勵信號經(jīng)過與周期性的強度相對應的音調(diào)濾波器和與聲道特性相對應的合成濾波器,并且確定編碼參數(shù),以便在聽覺特性加權(quán)下使輸出信號和輸入信號之間的平方誤差達到最小。
在許多最新標準語音編碼方法中,都是根據(jù)CELP進行編碼。例如,G729能夠以8kb/s進行窄帶信號編碼,和AMR-WB能夠以6.6kb/s到23.85kb/s進行窄帶信號編碼。
同時,在編碼音頻信號的音頻編碼的情況下,共同使用將音頻信號轉(zhuǎn)換到頻域和利用聽覺心理聲學模型進行編碼的方法,譬如,由MPEG(運動圖像專家組)標準化的Layer III方法和AAC方法。眾所周知,利用這些方法,對于44.1kHz取樣速率的信號,在64kb/s到96kb/s每信道上幾乎不會變差。
這種音頻編碼是對音樂進行高質(zhì)編碼的方法。音頻編碼也可以對如上所述,在背景中存在音樂或環(huán)境聲音的語音信號進行高質(zhì)編碼,并且可以管理具有CD質(zhì)量的、大約22kHz的信號頻帶。
但是,當利用語音編碼方法對語音信號占優(yōu)勢和在背景中疊加了音樂或環(huán)境聲音的信號進行編碼時,存在如下問題,由于背景音樂或環(huán)境聲音,不僅背景信號變差了,而且語音信號也變差了,因此,總質(zhì)量下降了。
出現(xiàn)這個問題是因為語音編碼方法基于專用于CELP語音模型的方法。問題在于,語音編碼方法只能管理直到7kHz的信號頻帶,和對于復合信號,不能充分地管理作為更高頻帶中的成分的信號。
此外,對于音頻編碼方法,為了取得高質(zhì)編碼,必須使用高位速率。對于音頻編碼方法,如果應該利用下至32kb/s的位速率進行編碼,那么,存在解碼信號質(zhì)量大幅下降的問題。因此,存在問題不能在傳輸速率低的通信網(wǎng)絡上使用的問題。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種甚至在低位速率下也能夠?qū)φZ音信號占優(yōu)勢和在背景中疊加了音樂或環(huán)境聲音的信號進行高質(zhì)編碼和解碼的編碼設備、解碼設備、編碼方法和解碼方法。
這個目的是通過擁有兩個層,即基本層和增強層,根據(jù)基本層中的CELP,以低位速率對輸入信號窄帶或?qū)拵ьl區(qū)進行高質(zhì)編碼,和在不能在基本層中得到表示的背景音樂或環(huán)境聲音,以及存在比基本層覆蓋的頻區(qū)高的頻率成分的信號的增強層中進行編碼達到的。


圖1是示出根據(jù)本發(fā)明第1實施例的信號處理設備的配置的方塊圖;圖2是示出輸入信號成分的例子的圖形;圖3是示出根據(jù)上面實施例的信號處理設備的信號處理方法的例子的圖形;圖4是示出基本層編碼器的配置的例子的圖形;圖5是示出增強層編碼器的配置的例子的圖形;
圖6是示出增強層編碼器的配置的例子的圖形;圖7是示出增強層中的LPC系數(shù)計算的例子的圖形;圖8是示出根據(jù)本發(fā)明第3實施例的信號處理設備的增強層編碼器的配置的方塊圖;圖9是示出根據(jù)本發(fā)明第4實施例的信號處理設備的增強層編碼器的配置的方塊圖;圖10是示出根據(jù)本發(fā)明第5實施例的信號處理設備的配置的方塊圖;圖11是示出基本層解碼器的例子的方塊圖;圖12是示出增強層解碼器的例子的方塊圖;圖13是示出增強層解碼器的例子的圖形;圖14是示出根據(jù)本發(fā)明第7實施例的信號處理設備的增強層解碼器的配置的方塊圖;圖15是示出根據(jù)本發(fā)明第8實施例的信號處理設備的增強層解碼器的配置的方塊圖;圖16是示出根據(jù)本發(fā)明第9實施例的聲音編碼設備的配置的方塊圖;圖17是示出聲信號信息分布的例子的圖形;圖18是示出在基本層和增強層中經(jīng)受編碼的區(qū)域的例子的圖形;圖19是示出聲(音樂)信號譜的例子的圖形;圖20是示出上面實施例的聲音編碼設備的頻率確定部分的內(nèi)部配置的例子的方塊圖;圖21是示出上面實施例的聲音編碼設備的聽覺掩蔽計算器的內(nèi)部配置的例子的圖形;圖22是示出上面實施例的增強層編碼器的內(nèi)部配置的例子的方塊圖;圖23是示出上面實施例的聽覺掩蔽計算器的內(nèi)部配置的例子的方塊圖;圖24是示出根據(jù)本發(fā)明第9實施例的聲音解碼設備的配置的方塊圖;圖25是示出上面實施例的聲音解碼設備的增強層解碼器的內(nèi)部配置的例子的方塊圖;圖26是示出根據(jù)本發(fā)明第10實施例的基本層編碼器的內(nèi)部配置的例子的方塊圖;圖27是示出上面實施例的基本層解碼器的內(nèi)部配置的例子的方塊圖;圖28是示出上面實施例的基本層解碼器的內(nèi)部配置的例子的方塊圖;
圖29是示出根據(jù)本發(fā)明第11實施例的聲音編碼設備的頻率確定部分的內(nèi)部配置的例子的方塊圖;圖30是示出上面實施例的估計誤差譜計算器計算的殘留誤差譜的例子的圖形;圖31是示出根據(jù)本發(fā)明第12實施例的聲音編碼設備的頻率確定部分的內(nèi)部配置的例子的方塊圖;圖32是示出上面實施例的聲音編碼設備的頻率確定部分的內(nèi)部配置的例子的方塊圖;圖33是示出根據(jù)本發(fā)明第13實施例的聲音編碼設備的增強層編碼器的內(nèi)部配置的例子的方塊圖;圖34是示出上面實施例的定序部分排序估計失真值的例子的圖形;圖35是示出根據(jù)本發(fā)明第13實施例的聲音解碼設備的增強層解碼器的內(nèi)部配置的例子的方塊圖;圖36是示出根據(jù)本發(fā)明第14實施例的聲音編碼設備的增強層編碼器的內(nèi)部配置的例子的方塊圖;圖37是示出根據(jù)本發(fā)明第14實施例的聲音解碼設備的增強層解碼器的內(nèi)部配置的例子的方塊圖;圖38是示出上面實施例的聲音編碼設備的頻率確定部分的內(nèi)部配置的例子的方塊圖;圖39是示出根據(jù)本發(fā)明第14實施例的聲音解碼設備的增強層解碼器的內(nèi)部配置的例子的方塊圖;圖40是示出根據(jù)本發(fā)明第15實施例的通信設備的配置的方塊圖;圖41是示出根據(jù)本發(fā)明第16實施例的通信設備的配置的方塊圖;圖42是示出根據(jù)本發(fā)明第17實施例的通信設備的配置的方塊圖;和圖43是示出根據(jù)本發(fā)明第18實施例的通信設備的配置的方塊圖。
具體實施例方式
基本上,本發(fā)明擁有兩個層,即基本層和增強層,根據(jù)基本層中的CELP,以低位速率對輸入信號窄帶或?qū)拵ьl區(qū)進行高質(zhì)編碼,然后,在不能在基本層中得到表示的背景音樂或環(huán)境聲音,以及存在比基本層覆蓋的頻區(qū)高的頻率成分的信號的增強層中進行編碼,增強層具有如同使用音頻編碼方法一樣,能夠使所有信號得到管理的配置。
通過這種手段,可以對不能在基本層中得到表示的背景音樂或環(huán)境聲音,以及存在比基本層覆蓋的頻區(qū)高的頻率成分的信號進行高效編碼。本發(fā)明的特性是,此時,利用通過基本層編碼信息獲得的信息進行增強層編碼。通過這種手段,獲得了能夠減少增強層編碼位的個數(shù)的效果。
現(xiàn)在參照附圖詳細描述本發(fā)明的實施例。
(第1實施例)圖1是示出根據(jù)本發(fā)明第1實施例的信號處理設備的配置的方塊圖。圖1中的信號處理設備100主要包括向下取樣器(down-sampler)101、基本層編碼器102、局部解碼器103、向上取樣器(up-sampler)104、延遲器105、減法器106、增強層編碼器107和多路復用器108。
向下取樣器101從取樣速率FH到取樣速率FL向下取樣(down-sample)輸入信號取樣速率,并且將取樣速率FL的聲信號輸出到基本層編碼器102。這里,取樣速率FL是比取樣速率FH低的頻率。
基本層編碼器102編碼取樣速率FL的聲信號,并且將編碼信息輸出到局部解碼器103和多路復用器108。
局部解碼器103解碼從基本層編碼器102輸出的編碼信息,將解碼信號輸出到向上取樣器104,并且將從解碼結(jié)果中獲得的參數(shù)輸出到增強層編碼器107。
向上取樣器104將解碼信號取樣速率升高到FH,并且將結(jié)果輸出到減法器106。
延遲器105將輸入取樣速率FH的聲信號延遲預定時間,然后,將信號輸出到減法器106。通過使這個延遲時間等于在向下取樣器106、基本層編碼器102、局部解碼器103和向上取樣器104中產(chǎn)生的時間延遲,可以防止在接著的相減處理中出現(xiàn)相移。
減法器106從取樣速率FH的聲信號中減去解碼信號,并且將相減結(jié)果輸出到增強層編碼器107。
增強層編碼器107利用從局部解碼器103輸出的解碼結(jié)果參數(shù)解碼從減法器106輸出的信號,并且將所得結(jié)果輸出到多路復用器108。多路復用器108多路復用和輸出由基本層編碼器102和增強層編碼器107編碼的信號。
現(xiàn)在說明基本層編碼和增強層編碼。圖2是示出輸入信號成分的例子的圖形。在圖2中,垂直軸表示信號成分信息量,而水平軸表示頻率。圖2示出了給出包含在輸入信號中的語音信息和背景音樂/背景噪聲信息的頻帶。
在語音信息的情況下,在低頻區(qū)中存在大量信息,信息量隨著頻區(qū)增高而減少。相反,在背景音樂和背景噪聲信息的情況下,與語音信息相比,在較低區(qū)域中存在相對少的信息,和大量信息處在較高區(qū)域中。
因此,本發(fā)明的信號處理設備使用數(shù)種編碼方法,并且對各自編碼方法適合的每個區(qū)域進行不同編碼。
圖3是示出根據(jù)本實施例的信號處理設備的信號處理方法的例子的圖形。在圖3中,垂直軸表示信號成分信息量,而水平軸表示頻率。
基本層編碼器102被設計成有效表示從0到FL的頻帶中的語音信息,并且可以對該區(qū)域中的語音信息進行高質(zhì)編碼。但是,從0到FL的頻帶中背景音樂和背景噪聲信息的編碼質(zhì)量不高。增強層編碼器107編碼基本層編碼器102不能編碼的部分和從FL到FH的頻帶中的信號。
因此,通過組合基本層編碼器102和增強層編碼器107,可以在寬帶中實現(xiàn)高質(zhì)編碼。此外,可以實現(xiàn)即使只利用至少基本層編碼部分的編碼信息也可以解碼語音信息的可伸縮功能。
這樣,局部解碼器103中出自通過編碼生成的那些參數(shù)當中的有用參數(shù)被供應給增強層編碼器107,和增強層編碼器107利用這個參數(shù)進行編碼。
由于這個參數(shù)是從編碼信息中生成的,當解碼本實施例的信號處理設備編碼的信號時,在聲音解碼過程中可以獲得相同參數(shù),沒有必要附加這個傳輸?shù)浇獯a方的參數(shù)。其結(jié)果是,增強層編碼部分可以實現(xiàn)不會招致附加信息增加的有效編碼處理。
例如,存在于局部解碼器103解碼的參數(shù)當中,指示輸入信號是諸如元音之類具有明顯周期性的信號還是諸如輔音之類具有明顯噪聲特性的信號的有聲/無聲標志用作增強層編碼器107應用的參數(shù)??梢岳糜新?無聲標志進行調(diào)整,譬如,進行在有聲部分中的增強層中強調(diào)較低區(qū)域多于較高區(qū)域的位分配,和進行在無聲部分中強調(diào)較高區(qū)域多于較低區(qū)域的位分配。
因此,根據(jù)本實施例的信號處理設備,通過從輸入信號中提取不超過預定頻率的成分和進行適當于語音編碼的編碼,和利用解碼所得編碼信息的結(jié)果進行適合于音頻編碼的編碼,可以以低位速率進行高質(zhì)編碼。
關于取樣速率FH和FL,只需要取樣速率FH比取樣速率FL高,并且對這些值沒有限制。例如,可以利用FH=24kHz和FL=16kHz的取樣速率進行編碼。
(第2實施例)在本實施例中,描述在第1實施例的局部解碼器103解碼的參數(shù)當中,指示輸入信號譜的LPC系數(shù)用作增強層編碼器107利用的參數(shù)的例子。
本實施例的信號處理設備利用圖1中的基本層編碼器102中的CELP進行編碼,并且在增強層編碼器107中利用指示輸入信號譜的LPC系數(shù)進行編碼。
首先給出基本層編碼器102的操作的詳細描述,后面接著增強層編碼器107的基本配置的描述。這里提到的“基本配置”旨在簡化隨后實施例的描述,和表示不使用局部解碼器103編碼參數(shù)的配置。此后,給出使用局部解碼器103解碼的LPC系數(shù)的增強層編碼器107的描述,這是本實施例的特征。
圖4是示出基本層編碼器102的配置的例子的圖形?;緦泳幋a器102主要包括LPC分析器401、加權(quán)部分402、自適應碼簿搜索單元403、自適應增益量化器404、目標矢量發(fā)生器405、噪聲碼簿搜索單元406、噪聲增益量化器407和多路復用器408。
LPC分析器401從向下取樣器101以取樣速率FL取樣的輸入信號中獲取LPC系數(shù),并且將這些LPC系數(shù)輸出到加權(quán)部分402。
加權(quán)部分402根據(jù)LPC分析器401獲取的LPC系數(shù),對輸入信號進行加權(quán),并且將加權(quán)輸入信號輸出到自適應碼簿搜索單元403、自適應增益量化器404和目標矢量發(fā)生器405。
自適應碼簿搜索單元403利用作為目標信號的加權(quán)輸入信號進行自適應碼簿搜索,并且將檢索的自適應矢量輸出到自適應增益量化器404和目標矢量發(fā)生器405。然后,自適應碼簿搜索單元403將確定為存在最小量化失真的自適應矢量的代碼輸出到多路復用器408。
自適應增益量化器404量化乘以從自適應碼簿搜索單元403輸出的自適應矢量的自適應增益,并且將結(jié)果輸出到目標矢量發(fā)生器405。然后,將這個代碼輸出到多路復用器408。
目標矢量發(fā)生器405對將自適應矢量乘以自適應增益的結(jié)果與從加權(quán)部分402輸入的輸入信號進行矢量相減,并且將相減結(jié)果作為目標矢量輸出到噪聲碼簿搜索單元406和噪聲增益量化器407。
噪聲碼簿搜索單元406從噪聲碼簿中檢索與從目標矢量發(fā)生器405輸出的目標矢量相關的失真最小的噪聲矢量。然后,噪聲碼簿搜索單元406將檢索的噪聲矢量輸出到噪聲增益量化器407,并且還將那個代碼輸出到多路復用器408。
噪聲增益量化器407乘以噪聲碼簿搜索單元406檢索的噪聲矢量的噪聲增益,并且將那個代碼輸出到多路復用器408。
多路復用器408多路復用LPC系數(shù)、自適應矢量、自適應增益、噪聲矢量和噪聲增益編碼信息,并且將所得信號輸出到局部解碼器103和多路復用器108。
接著,描述圖4中基本層編碼器102的操作。首先,輸入從向下取樣器101輸出的取樣速率FL,和LPC分析器401獲取LPC系數(shù)。將LPC系數(shù)轉(zhuǎn)換成諸如LSP系數(shù)之類適合量化的參數(shù),并且量化它們。將通過這種量化獲得的編碼信息供應給多路復用器408,并且,從編碼信息中計算出量化LSP系數(shù)和將其轉(zhuǎn)換成LPC系數(shù)。
通過這種量化,獲得量化LPC系數(shù)。利用量化LPC系數(shù)、自適應碼簿、自適應增益、噪聲碼簿和噪聲增益進行編碼。
然后,加權(quán)部分402根據(jù)LPC分析器401獲得的LPC系數(shù),對輸入信號進行加權(quán)。這種加權(quán)的目的是進行譜成形,以便通過輸入信號的頻譜包絡掩蔽量化失真譜。
然后,自適應碼簿搜索單元403利用作為目標信號的加權(quán)輸入信號搜索自適應碼簿。以音調(diào)周期為基礎重復舊激勵序列的信號被稱為自適應矢量,和自適應碼簿由在預定范圍的音調(diào)周期上生成的自適應矢量組成。
如果將加權(quán)輸入信號指定為t(n),將包括LPC系數(shù)的加權(quán)合成濾波器的脈沖響應被卷積成音調(diào)周期為i的自適應矢量的信號指定為pi(n),那么,將使如下方程(1)的估算函數(shù)D達到極小的自適應矢量的音調(diào)周期i作為參數(shù)發(fā)送到多路復用器408。
D=Σn=0N-1t2(n)-(Σn=0N-1t(n)pi(n))2Σn=0N-1pi2(n)···(1)]]>這里,N表示矢量長度。
接著,自適應增益量化器404進行乘以自適應矢量的自適應增益的量化。自適應增益β用方程(2)表示。這個β值經(jīng)受標量量化(scalar quantization),并且所得代碼被發(fā)送到多路復用器408。
β=Σn=0N-1t(n)pi(n)Σn=0N-1pi2(n)···(2)]]>然后,目標矢量發(fā)生器405從輸入信號中減去自適應矢量產(chǎn)生的效果,生成噪聲碼簿搜索單元406和噪聲增益量化器407使用的目標矢量。如果這里的pi(n)表示當方程(1)所表示的估算函數(shù)D達到極小時,合成濾波器的脈沖響應被卷積成自適應矢量的信號,和βq表示當方程(2)所表示的自適應矢量β經(jīng)受標量量化時的量化值,那么,目標矢量t2(n)由如下方程(2)表示。
t2(n)=t(n)-βq·pi(n)…(3)將前述目標矢量t2(n)和LPC系數(shù)供應給噪聲碼簿搜索單元406,進行噪聲碼簿搜索。
這里,提供給噪聲碼簿搜索單元406的噪聲碼簿的典型成分是代數(shù)。在代數(shù)碼簿中,幅度為1的脈沖由只具有預定極少數(shù)的矢量表示。此外,對于代數(shù)碼簿,事先決定可以為每個相位保留的位置,以便不重疊。因此,代數(shù)碼簿的特征是,通過小量計算就可以確定脈沖位置和脈沖代碼(極性)的最佳組合。
如果將目標矢量指定為t2(n),將加權(quán)合成濾波器的脈沖響應被卷積成與代碼j相對應的噪聲矢量的信號指定為cj(n),那么,將使如下方程(4)的估算函數(shù)D達到極小的噪聲矢量的指標j作為參數(shù)發(fā)送到多路復用器408。
D=Σn=0N-1t22(n)-(Σn=0N-1t2(n)cj(n))2Σn=0N-1cj2(n)···(4)]]>接著,噪聲增益量化器407進行乘以噪聲矢量的噪聲增益的量化。噪聲增益γ用方程(5)表示。這個γ值經(jīng)受標量量化,并且所得代碼被發(fā)送到多路復用器408。
γ=Σn=0N-1t2(n)cj(n)Σn=0N-1cj2(n)···(5)]]>多路復用器408多路復用發(fā)送的LPC系數(shù)、自適應碼簿、自適應增益、噪聲碼簿和噪聲增益編碼信息,并且將所得信號輸出到局部解碼器103和多路復用器108。
當存在新輸入信號時,重復上面的處理。當不存在新輸入信號時,終止該處理。
現(xiàn)在描述增強層編碼器107。圖5是示出增強層編碼器107的配置的例子的圖形。圖5中的增強層編碼器107主要包括LPC分析器501、譜包絡計算器502、MDCT部分503、功率計算器504、功率歸一化器505、譜歸一化器506、Bark標度歸一化器508、Bark標度形狀計算器507、矢量量化器509和多路復用器510。
LPC分析器501對輸入信號進行LPC分析。并且,LPC分析器501在LSP或其它適合于量化的參數(shù)的值域中有效地量化LPC系數(shù),LPC分析器將編碼信息輸出到多路復用器,和LPC分析器將量化LPC系數(shù)輸出到譜包絡計算器502。譜包絡計算器502從量化LPC系數(shù)中計算譜包絡,并且將這個譜包絡輸出到矢量量化器509。
MDCT部分503對輸入信號進行MDCT(改進離散余弦變換)處理,并且將獲得的MDCT系數(shù)輸出到功率計算504和功率歸一化器505。功率計算器504找出和量化MDCT系數(shù)的功率,并且將量化功率輸出到功率歸一化器505和將編碼信息輸出到多路復用器510。
功率歸一化器505利用量化功率歸一化MDCT系數(shù),并且將功率歸一化MDCT系數(shù)輸出到譜歸一化器506。譜歸一化器506利用譜包絡歸一化根據(jù)功率歸一化的MDCT系數(shù),并且將歸一化MDCT系數(shù)輸出到Bark標度形狀計算器507和Bark標度歸一化器508。
Bark標度形狀計算器507通過Bark標度計算以等間隔頻帶劃分的頻譜的形狀,然后,量化這個譜形狀,并且,將量化譜形狀輸出到Bark標度歸一化器508和矢量量化器509。并且,Bark標度形狀計算器507將編碼信息輸出到多路復用器510。
Bark標度歸一化器508利用量化Bark標度形狀歸一化歸一化MDCT系數(shù),將結(jié)果輸出到矢量量化器509。
矢量量化器509對從Bark標度歸一化器508輸出的歸一化MDCT系數(shù)進行矢量量化,找出失真最小的代碼矢量,并且將代碼矢量的指標作為編碼信息輸出到多路復用器510。
多路復用器510多路復用所有編碼信息,并且將所得信號輸出到多路復用器108。
現(xiàn)在描述圖5中增強層編碼器107的操作。圖1中的減法器106獲得的相減信號經(jīng)受LPC分析器501的LPC分析。然后,通過LPC分析計算出LPC系數(shù)。將LPC系數(shù)轉(zhuǎn)換成此后進行量化、諸如LSP系數(shù)之類適合于量化的參數(shù)。將與這里獲得的LPC系數(shù)有關的編碼信息供應給多路復用器510。
譜包絡計算器502根據(jù)解碼的LPC系數(shù),按照如下的方程(6)計算譜包絡。
env(m)=|11-Σi=1NPαq(i)e-j2πmiM|···(6)]]>這里,αq表示解碼的LPC系數(shù),NP表示LPC系數(shù)的次序,和M表示譜分辨率。通過方程(6)獲得的譜包絡env(m)供如后所述的譜歸一化器506和矢量量化器509使用。
然后,輸入信號在MDCT部分503中經(jīng)受MDCT處理,獲得MDCT系數(shù)。MDCT處理的特征是,由于使用了每次一半地完全疊加連續(xù)幀的分析幀,和分析幀的前一半是奇函數(shù),而分析幀的后一半是偶函數(shù)的正交基,不會出現(xiàn)幀邊緣失真。當進行MDCT處理時,將輸入信號與諸如正弦函數(shù)窗口那樣的窗口函數(shù)相乘。當將MDCT系數(shù)指定為X(m)時,MDCT系數(shù)按照如下方程(7)計算。
X(m)=1NΣn=02N-1x(n)cos{(2n+1+N)·(2m+1)π4N}···(7)]]>這里,x(n)表示將輸入信號乘以窗口函數(shù)時的信號。
接著,功率計算器504求出和量化MDCT系數(shù)X(m)的功率。然后,功率歸一化器505利用方程(8)歸一化具有那個量化之后的功率的MDCT系數(shù)。
pow=Σm=0M-1X(m)2···(8)]]>這里,M表示MDCT系數(shù)的大小。在MDCT系數(shù)功率pow被量化之后,將編碼信息發(fā)送到多路復用器510。利用編碼信息解碼MDCT系數(shù)的功率,和利用所得值,按照如下方程(9)歸一化MDCT系數(shù)。
X1(m)=X(m)powq···(9)]]>
這里,X1(m)代表功率歸一化之后的MDCT系數(shù),和powq表示量化之后MDCT系數(shù)的功率。
然后,譜歸一化器506利用譜包絡歸一化已經(jīng)按照功率歸一化的MDCT系數(shù)。譜歸一化器506按照如下的方程(10)進行歸一化。
X2(m)=X1(m)env(m)···(10)]]>接著,Bark標度形狀計算器507通過Bark標度計算以等間隔頻帶劃分的頻譜的形狀,然后,量化這個譜形狀。Bark標度形狀計算器507將這個編碼信息發(fā)送到多路復用器510,并且還利用解碼值,對作為來自譜歸一化器506的輸出信號的MDCT系數(shù)X2(m)進行歸一化。Bark標度和Herz標度之間的對應關系通過如下方程(11)所表示的轉(zhuǎn)換表達式給出。
B=13tan-1(0.76f)+3.5tan-1(f7.5)···(11)]]>這里,B表示Bark標度和f表示Herz標度。對于在Bark標度上以等間隔頻帶劃分的子頻帶,Bark標度形狀計算器507按照如下的方程(12)計算形狀。
B(k)=Σm=fl(k)fh(k)X2(m)2----0≤k≤K···(12)]]>這里,fl(k)表示第k子頻帶的最低頻率和fh(k)表示第k子頻帶的最高頻率,和K表示子頻帶的個數(shù)。
然后,Bark標度形狀計算器507量化每個頻帶的Bark標度形狀B(k)和將編碼信息發(fā)送到多路復用器510,并且還解碼Bark標度形狀和將結(jié)果供應給Bark標度歸一化器508和矢量量化器509。利用歸一化之后的Bark標度形狀,Bark標度歸一化器508按照如下方程(13)生成歸一化MDCT系數(shù)X3(m)。
X3(m)=X2(m)Bq(k)----fl(k)≤m≤fh(k)--0≤k≤K···(13)]]>這里,Bq(k)表示第k子頻帶量化之后的Bark標度形狀。
接著,矢量量化器509將X3(m)劃分成數(shù)個矢量和利用與每個矢量相對應的碼簿,找出失真最小的代碼矢量,并且將這個指標作為編碼信息發(fā)送到多路復用器510。
當進行矢量量化時,矢量量化器509利用輸入信號譜信息,確定兩個重要參數(shù)。這些參數(shù)之一是量化位分配,和另一個是碼簿搜索加權(quán)。量化位分配是利用譜包絡計算器502獲得的譜包絡env(m)確定的。
當利用譜包絡確定量化位分配時,也可以作出這樣的設置,使分配在與頻率0到FL相對應的頻譜中的位數(shù)很少。
實現(xiàn)這個過程的一個例子是設置可以分配在頻率0到FL中的最大位數(shù)MAX_LOWBAND_BIT,并且,施加一個限制,以便分配在這個頻帶中的最大位數(shù)不超過最大位數(shù)MAX_LOWBAND_BIT的方法。
在這種實現(xiàn)例子中,由于在頻率為0到FL的基本層中已經(jīng)進行了編碼,沒有必要分配大量位數(shù),和通過進行有意使這個頻帶中的量化粗糙些并使位分配保持在低水平上的量化和將額外位分配給頻率FL到FH,可以提高總體質(zhì)量。也可以使用通過組合譜包絡env(m)和前述Bark標度形狀Bq(k)確定這種位分配的配置。
利用應用譜包絡計算器502獲得的譜包絡env(m)和從Bark標度形狀計算器507獲得的Bark標度形狀Bq(k)中計算的權(quán)重的失真度量進行矢量量化。通過找出使如下方程(14)規(guī)定的失真D達到極小的代碼矢量C的指標j實現(xiàn)矢量量化。
D=Σmw(m)2(Cj(m)-X3(m))2···(14)]]>這里,w(m)表示加權(quán)函數(shù)。
利用譜包絡env(m)和Bark標度形狀Bq(k)可以將加權(quán)函數(shù)w(n)表示成如下方程(15)所示那樣。
w(m)=(env(m)·Bq(Herz_to_Bark(m)))p…(15)這里,p表示0和1之間的常數(shù),和Herz_to_Bark()表示從Herz標度轉(zhuǎn)換到Bark標度的函數(shù)。
當加權(quán)函數(shù)w(m)確定下來時,也可以作出這樣的設置,使將位分配給與頻率0到FL相對應的頻譜的加權(quán)函數(shù)很小。實現(xiàn)這個過程的一個例子是下面將與頻率0到FL相對應的加權(quán)函數(shù)w(m)的可能最大值設置成MAX_LOWBAND_WGT,并且,施加一個限制,以便這個頻帶的加權(quán)函數(shù)w(m)的值不超過MAX_LOWBAND_WGT的方法。在這種實現(xiàn)例子中,在頻率為0到FL的基本層中已經(jīng)進行了編碼,通過有意降低這個頻帶的量化精度和相對提高頻率FL到FH的量化精度,可以提高總體質(zhì)量。
最后,多路復用器510多路復用編碼信息,并且將所得信號輸出到多路復用器108。當存在新輸入信號時,重復上面的處理。當不存在新輸入信號時,終止該處理。
因此,根據(jù)本實施例的信號處理設備,通過從輸入信號中提取不超過預定頻率的成分和利用碼激勵線性預測進行編碼,和利用解碼所得編碼信息的結(jié)果通過MDCT處理進行編碼,可以以低位速率進行高質(zhì)編碼。
上面已經(jīng)描述了從減法器106獲得的相減信號中分析LPC系數(shù)的例子,但本發(fā)明的信號處理設備也可以利用局部解碼器103解碼的LPC系數(shù)進行解碼。
圖6是示出增強層編碼器107的配置的例子的圖形。將與圖5中相同的標號指定給圖6中與圖5中的那些相同的部分,并且省略對它們的詳細描述。
圖6中的增強層編碼器107與圖5中的增強層編碼器107的不同之處在于,配備了轉(zhuǎn)換表601、LPC系數(shù)映射部分602、譜包絡計算器603和變換部分604,并且利用局部解碼器103解碼的LPC系數(shù)進行編碼。
轉(zhuǎn)換表601存儲基本層LPC系數(shù)和增強層LPC系數(shù),以及指示它們之間的對應關系。
LPC系數(shù)映射部分602參考轉(zhuǎn)換表601,將從局部解碼器103輸入的基本層LPC系數(shù)轉(zhuǎn)換成增強層LPC系數(shù),并且將增強層LPC系數(shù)輸出到譜包絡計算器603。
譜包絡計算器603根據(jù)增強層LPC系數(shù)獲取譜包絡,并且將這個譜包絡輸出到變換部分604。變換部分604變換譜包絡和將結(jié)果輸出到譜歸一化器506和矢量量化器509。
現(xiàn)在描述圖6中增強層編碼器107的操作。基本層LPC系數(shù)是為信號帶0到FL中的信號求的,并且與增強層信號(信號帶0到FH)所用的LPC系數(shù)不一致。但是,在兩者之間存在強關聯(lián)。因此,在LPC系數(shù)映射部分602中,利用這種關聯(lián)事先獨立設計示出信號帶0到FL信號的LPC系數(shù)和信號帶0到FH信號的LPC系數(shù)之間的對應關系的轉(zhuǎn)換表601。這個轉(zhuǎn)換表601用于從基本層LPC系數(shù)中求出增強層LPC系數(shù)。
圖7是示出增強層中的LPC系數(shù)計算的例子的圖形。轉(zhuǎn)換表601由表示增強層LPC系數(shù)(次序M)的J個候選者{Yj(m)}和與{Yj(m)}指定了對應關系、與基本層LPC系數(shù)具有相同次數(shù)(=K)的候選者{yj(k)}組成。{Yj(m)}和{yj(k)}是根據(jù)大規(guī)模音頻和語音數(shù)據(jù)等事先設計和提供的。當輸入基本層LPC系數(shù)x(k)時,從{yj(k)}當中找出與x(k)最相似的一系列LPC系數(shù)。通過輸出與確定為最相似的LPC系數(shù)的指標j相對應的增強層LPC系數(shù)Yj(m),可以實現(xiàn)從基本層LPC系數(shù)到增強層LPC系數(shù)的映射。
接著,譜包絡計算器603根據(jù)以這種方式找出的增強層LPC系數(shù)獲得譜包絡。然后,變換部分604變換這個譜包絡。然后,將這個變換譜包絡當作如上所述的實現(xiàn)例子的譜包絡,由此加以處理。
實現(xiàn)變換譜包絡的變換部分604的一個例子是使與經(jīng)受基本層編碼的信號帶0到FL相對應的譜包絡的作用很小的處理。如果將譜包絡指定為env(m),變換env′(m)由如下方程(16)表示。
env′(m)=env(m)pif0≤m≤Flenv(m)else···(16)]]>這里,p表示0和1之間的常數(shù)。
在頻率為0到FL的基本層中已經(jīng)進行了編碼,和經(jīng)過增強層編碼的相減信號的頻率0到FL之間的頻譜接近平坦。與此無關,在如在這個實現(xiàn)例子中所述的LPC系數(shù)映射中不考慮這樣的動作。因此,通過利用利用方程(16)校正譜包絡的技術可以提高質(zhì)量。
因此,根據(jù)本實施例的信號處理設備,通過利用基本層量化器量化的LPC系數(shù)求出增強層LPC系數(shù),和從增強層LPC系數(shù)分析中計算出譜包絡,使LPC分析和量化變得多余了,并且可以減少量化位的個數(shù)。
(第3實施例)圖8是示出根據(jù)本發(fā)明第3實施例的信號處理設備的增強層編碼器的配置的方塊圖。將與圖5中相同的標號指定給圖8中與圖5中的那些相同的部分,并且省略對它們的詳細描述。
圖8中的增強層編碼器107與圖5中的增強層編碼器107的不同之處在于,配備了譜精細結(jié)構(gòu)計算器801,并且,利用基本層編碼器102編碼和局部解碼器103解碼的音調(diào)周期計算譜精細結(jié)構(gòu),和將那個譜精細結(jié)構(gòu)應用在譜歸一化和矢量量化中。
譜精細結(jié)構(gòu)計算器801從在基本層中編碼的音調(diào)周期T和音調(diào)增益β中計算譜精細結(jié)構(gòu),并且將譜精細結(jié)構(gòu)輸出到譜歸一化器506。
前述音調(diào)周期T和音調(diào)增益β實際上是編碼信息的組成部分,并且,通過局部解碼器(如圖1所示)可以獲得相同信息。因此,即使利用音調(diào)周期T和音調(diào)增益β進行編碼,位速率也不會增加。
利用音調(diào)周期T和音調(diào)增益β進行編碼,譜精細結(jié)構(gòu)計算器801按照如下方程(17)計算譜精細結(jié)構(gòu)har(m)。
har(m)=|11-β·e-j2πmTM|···(17)]]>這里,M表示譜分辨率。由于方程(17)是β的絕對值大于等于1時的振蕩濾波,所以還存在設置一種限制,使β絕對值的可能范圍小于等于小于1的預定設置值(例如,0.8)的方法。
譜歸一化器506利用譜包絡計算器502獲得的譜包絡env(m)和譜精細結(jié)構(gòu)計算器801獲得的譜精細結(jié)構(gòu)har(m)兩者,按照如下方程(18)進行歸一化。
X2(m)=X1(m)env(m)·har(m)···(18)]]>利用譜包絡計算器502獲得的譜包絡env(m)和譜精細結(jié)構(gòu)計算器801獲得的譜精細結(jié)構(gòu)har(m)兩者還可以確定矢量量化器509的量化位分配。譜精細結(jié)構(gòu)還用在矢量量化中的加權(quán)函數(shù)w(m)確定中。具體地說,按照如下方程(18)定義加權(quán)函數(shù)w(m)。
w(m)=(env(m)·har(m)·Bq(Herz_to_Bark(m)))p…(19)這里,p表示0和1之間的常數(shù),和Herz_to_Bark()表示從Herz標度轉(zhuǎn)換到Bark標度的函數(shù)。
因此,根據(jù)本實施例的信號處理設備,通過利用基本層編碼器編碼和局部解碼器解碼的音調(diào)周期計算譜精細結(jié)構(gòu),和將那個譜精細結(jié)構(gòu)應用在譜歸一化和矢量量化中,可以提高量化性能。
(第4實施例)圖9是示出根據(jù)本發(fā)明第4實施例的信號處理設備的增強層編碼器的配置的方塊圖。將與圖5中相同的標號指定給圖9中與圖5中的那些相同的部分,并且省略對它們的詳細描述。
圖9中的增強層編碼器107與圖5中的增強層編碼器的不同之處在于,配備了功率估計單元901和功率漲落量量化器902,并且,在局部解碼器103中利用基本層編碼器102獲得的編碼信息生成解碼信號,根據(jù)那個解碼信號預測MDCT系數(shù)功率,和根據(jù)那個預測值編碼漲落量。
在圖1中,解碼參數(shù)從局部解碼器103輸出到增強層編碼器107,但是,在本實施例中,將局部解碼器103獲得的解碼信號輸出到增強層編碼器107,而不是解碼參數(shù)。
圖5中局部解碼器103解碼的信號sl(n)輸入到功率估計單元901。然后,功率估計單元901根據(jù)這個解碼信號sl(n)估計MDCT系數(shù)功率。如果將MDCT系數(shù)功率指定為powp,powp由如下方程(20)表示。
powp=α·Σn=0N-1sl(n)2···(20)]]>這里,N表示解碼信號sl(n)的長度,和α表示用于校正的預定常數(shù)。在使用從基本層LPC系數(shù)中求出的譜斜度的另一種方法中,MDCT系數(shù)功率估計由如下方程(21)表示。
powp=α·β·Σn=0N-1sl(n)2···(21)]]>這里,β表示具有當譜斜度大時(當?shù)皖l帶中譜能量大時)接近0,和當譜斜度小時(當相對高區(qū)域中存在功率時)接近1的特性、取決于從基本層LPC系數(shù)中求出的譜斜度的變量。
接著,功率漲落量量化器902通過功率估計單元901獲得的功率估計powp,歸一化MDCT部分503獲得的MDCT系數(shù)的功率,并且量化漲落量。漲落量r用如下方程(22)表示。
r=powpowp···(22)]]>這里,pow表示MDCT系數(shù)功率,和通過方程(23)來計算。
pow=Σm=0M-1X(m)2···(23)]]>這里,X(m)表示MDCT系數(shù),和M表示幀長度。功率漲落量量化器902量化漲落量r,將編碼信息發(fā)送到多路復用器510,并且還解碼量化漲落量rq。利用量化漲落量rq,功率歸一化器505利用如下方程(24)歸一化MDCT系數(shù)。
X1(m)=X(m)rq·powp···(24)]]>這里,X1(m)表示功率歸一化之后的MDCT系數(shù)。
因此,根據(jù)本實施例的信號處理設備,通過利用基本層解碼信號功率和增強層MDCT系數(shù)功率之間的關聯(lián),利用基本層解碼信號預測MDCT系數(shù)功率,和根據(jù)那個預測值編碼漲落量,可以減少MDCT系數(shù)功率量化所需的位數(shù)。
(第5實施例)圖10是示出根據(jù)本發(fā)明第5實施例的信號處理設備的配置的方塊圖。圖10中的信號處理設備主要包括多路分用器1001、基本層解碼器1002、向上取樣器1003、增強層解碼器1004和加法器1005。
多路分用器1001分離編碼信息,生成基本層編碼信息和增強層編碼信息。然后,多路分用器1001將基本層編碼信息輸出到基本層解碼器1002,和將增強層編碼信息輸出到增強層解碼器1004。
基本層解碼器1002利用多路分用器1001獲得的基本層編碼信息解碼取樣速率FL解碼信號,并且將所得信號輸出到向上取樣器1003。同時,將基本層解碼器1002解碼的參數(shù)輸入到增強層解碼器1004。向上取樣器1003將解碼信號取樣頻率升高到FH,并且將它輸出到加法器1005。
增強層解碼器1004利用多路分用器1001獲得的增強層編碼信息和基本層解碼器1002解碼的參數(shù),解碼取樣速率FH解碼信號,并且將所得信號輸出到加法器1005。
加法器1005對從向上取樣器1003輸出的解碼信號和從增強層解碼器1004輸出的解碼信號進行相加。
現(xiàn)在描述本實施例的信號處理設備的操作。首先,輸入在第1到第4實施例任何一個的信號處理設備中編碼的代碼,并且,多路分用器1001分離那個代碼,生成基本層編碼信息和增強層編碼信息。
接著,基本層解碼器1002利用多路分用器1001獲得的基本層編碼信息解碼取樣速率FL解碼信號。然后,向上取樣器1003將那個解碼信號的取樣頻率升高到FH。
在增強層解碼器1004中,利用多路分用器1001獲得的增強層編碼信息和基本層解碼器1002解碼的參數(shù)解碼取樣速率FH解碼信號。
加法器1005相加向上取樣器1003向上取樣的基本層解碼信號和增強層解碼信號。當存在新輸入信號時,重復上面的處理。當不存在新輸入信號時,終止該處理。
因此,根據(jù)本實施例的信號處理設備,通過利用基本層解碼器1002解碼的參數(shù)進行增強層解碼器1004解碼,可以從利用基本層編碼中的解碼參數(shù)進行增強層編碼的聲音編碼單元的編碼信息中生成解碼信號。
現(xiàn)在描述基本層解碼器1002。圖11是示出基本層解碼器1002的例子的方塊圖。圖11中的基本層解碼器1002主要包括多路分用器1101、激勵發(fā)生器1102和合成濾波器1103,和進行CELP解碼處理。
多路分用器1101從多路分用器1001輸入的基本層編碼信息中分離出各種參數(shù),并且將這些參數(shù)輸出到和合成濾波器1103。
激勵發(fā)生器1102進行自適應矢量、自適應矢量增益、噪聲矢量和噪聲矢量增益解碼,利用這些值生成激勵信號,并且將這個激勵信號輸出到合成濾波器1103。合成濾波器1103利用解碼LPC系數(shù)生成合成信號。
現(xiàn)在描述圖11中基本層解碼器1002的操作。首先,多路分用器1101從基本層編碼信息中分離出各種參數(shù)。
接著,激勵發(fā)生器1102進行自適應矢量、自適應矢量增益、噪聲矢量和噪聲矢量增益解碼。然后,激勵發(fā)生器1102按照如下方程(25)生成激勵矢量ex(n)。
ex(n)=βq·q(n)+γq·c(n)…(25)這里,q(n)表示自適應矢量,βq表示自適應矢量增益,c(n)表示噪聲矢量,和γq表示噪聲矢量增益。
然后,合成濾波器1103利用解碼LPC系數(shù),按照如下方程(26)生成合成信號syn(n)。
syn(n)=ex(n)+Σi=1NPαq(i)·syn(n-i)···(26)]]>這里,αq表示解碼LPC系數(shù),和NP表示LPC系數(shù)的次序。
將以這種方式解碼的解碼信號syn(n)輸出到向上取樣器1003,并且將作為解碼結(jié)果獲得的參數(shù)輸出到增強層解碼器1004。當存在新輸入信號時,重復上面的處理。當不存在新輸入信號時,終止該處理。取決于CELP配置,在經(jīng)過后置濾波器之后輸出合成信號的模式也是可以的。所述的后置濾波器具有使編碼失真更不易覺察的后處理功能。
現(xiàn)在描述增強層解碼器1004。圖12是示出增強層解碼器1004的例子的方塊圖。圖12中的增強層解碼器1004主要包括多路分用器1201、LPC系數(shù)解碼器1202、譜包絡計算器1203、矢量解碼器1204、Bark標度形狀解碼器1205、乘法器1206、乘法器1207、功率解碼器1208、乘法器1209和IMDCT部分1210。
多路分用器1201從多路分用器1001輸出的增強層編碼信息中分離出各種參數(shù)。LPC系數(shù)解碼器1202利用LPC系數(shù)相關編碼信息解碼LPC系數(shù),并且將結(jié)果輸出到譜包絡計算器1203。
譜包絡計算器1203利用LPC系數(shù),按照方程(6)計算譜包絡,并且將譜包絡env(m)輸出到矢量解碼器1204和乘法器1207。
矢量解碼器1204根據(jù)譜包絡計算器1203獲得的譜包絡env(m)確定量化位分配,并且根據(jù)從多路分用器1201中獲得的編碼信息和前述量化位分配,解碼歸一化MDCT系數(shù)X3q(m)。量化位分配方法與用在第1到第4實施例任何一個的編碼方法中的增強層編碼中的方法相同。
Bark標度形狀解碼器1205根據(jù)從多路分用器1201中獲得的編碼信息,解碼Bark標度形狀Bq(k),并且將結(jié)果輸出到乘法器1206。
乘法器1206按照如下方程(27),將歸一化MDCT系數(shù)X3q(m)乘以Bark標度形狀Bq(k),并且將結(jié)果輸出到乘法器1207。
X2q(m)=X3q(m)Bq(k)----fl(k)≤m≤fh(k)--0≤k≤K···(27)]]>這里,fl(k)表示第k子頻帶的最低頻率和fh(k)表示第k子頻帶的最高頻率,和K表示子頻帶個數(shù)。
乘法器1207按照如下方程(28),將從乘法器1206中獲得的歸一化MDCT系數(shù)X2q(m)乘以譜包絡計算器1203獲得的譜包絡env(m),并且將相乘結(jié)果輸出到乘法器1209。
X1q(m)=X2q(m)env(m)…(28)功率解碼器1208根據(jù)從多路分用器1201中獲得的編碼信息解碼功率powq,并且將解碼結(jié)果輸出到乘法器1209。
乘法器1209按照如下方程(29),將歸一化MDCT系數(shù)X1q(m)乘以解碼功率powq,并且將相乘結(jié)果輸出到IMDCT部分1210。
Xq(m)=X1q(m)powq···(29)]]>IMDCT部分1210對以這種方式獲得的解碼MDCT系數(shù)進行IMDCT(改進離散余弦逆變換),重疊和相加一半在前一個幀中獲得和一半在當前幀中獲得的信號,并且,所得信號是輸出信號。當存在新輸入信號時,重復上面的處理。當不存在新輸入信號時,終止該處理。
因此,根據(jù)本實施例的信號處理設備,通過利用基本層解碼器解碼的參數(shù)進行增強層解碼器解碼,可以從利用基本層編碼中的解碼參數(shù)進行增強層編碼的編碼單元的編碼信息中生成解碼信號。
(第6實施例)圖13是示出增強層解碼器1004的例子的方塊圖。將與圖12中相同的標號指定給圖13中與圖2中的那些相同的部分,并且省略對它們的詳細描述。
圖13中的增強層解碼器1004與圖12中的增強層編碼器1004的不同之處在于,配備了轉(zhuǎn)換表1301、LPC系數(shù)映射部分1302、譜包絡計算器1303和變換部分1304,并且利用基本層解碼器1002解碼的LPC系數(shù)進行解碼。
轉(zhuǎn)換表1301存儲基本層LPC系數(shù)和增強層LPC系數(shù),以及指示它們之間的對應關系。
LPC系數(shù)映射部分1302參考轉(zhuǎn)換表1301,將從局部解碼器1002輸入的基本層LPC系數(shù)轉(zhuǎn)換成增強層LPC系數(shù),并且將增強層LPC系數(shù)輸出到譜包絡計算器1303。
譜包絡計算器1303根據(jù)增強層LPC系數(shù)獲取譜包絡,并且將這個譜包絡輸出到變換部分1304。變換部分1304變換譜包絡和將結(jié)果輸出到乘法器1207和矢量解碼器1204。變換方法的一個例子是顯示在第2實施例的方程(16)中的方法。
現(xiàn)在描述圖13中增強層解碼器1003的操作?;緦覮PC系數(shù)是為信號帶0到FL中的信號求的,并且與增強層信號(信號帶0到FH)所用的LPC系數(shù)不一致。但是,在兩者之間存在強關聯(lián)。因此,在LPC系數(shù)映射部分1302中,利用這種關聯(lián)事先獨立設計示出信號帶0到FL信號的LPC系數(shù)和信號帶0到FH信號的LPC系數(shù)之間的對應關系的轉(zhuǎn)換表1301。這個轉(zhuǎn)換表1301用于從基本層LPC系數(shù)中求出增強層LPC系數(shù)。
轉(zhuǎn)換表1301的細節(jié)與第2實施例中轉(zhuǎn)換表601的細節(jié)相同。
因此,根據(jù)本實施例的信號處理設備,通過利用基本層解碼器量化的LPC系數(shù)求出增強層LPC系數(shù),和從增強層LPC系數(shù)中計算出譜包絡,使LPC分析和量化變得多余了,并且可以減少量化位的個數(shù)。
(第7實施例)圖14是示出根據(jù)本發(fā)明第7實施例的信號處理設備的增強層解碼器的配置的方塊圖。將與圖12中相同的標號指定給圖14中與圖12中的那些相同的部分,并且省略對它們的詳細描述。
圖14中的增強層解碼器1004與圖12中的增強層解碼器的不同之處在于,配備了譜精細結(jié)構(gòu)計算器1401,并且,利用基本層解碼器1002解碼的音調(diào)周期計算譜精細結(jié)構(gòu),將那個譜精細結(jié)構(gòu)應用在解碼中,并且進行與聲音編碼相對應的聲音解碼,從而提高量化性能。
譜精細結(jié)構(gòu)計算器1401從基本層解碼器1002解碼的音調(diào)周期T和音調(diào)增益β中計算譜精細結(jié)構(gòu),并且將譜精細結(jié)構(gòu)輸出到矢量解碼器1204和乘法器1207。
利用音調(diào)周期Tq和音調(diào)增益βq,譜精細結(jié)構(gòu)計算器1401按照如下方程(30)計算譜精細結(jié)構(gòu)har(m)。
har(m)=|11-βq·e-j2πmTqM|···(30)]]>這里,M表示譜分辨率。由于方程(30)是βq的絕對值大于等于1時的振蕩濾波,所以還可以設置一種限制,使βq絕對值的可能范圍小于等于小于1的預定設置值(例如,0.8)。
利用譜包絡計算器1203獲得的譜包絡env(m)和譜精細結(jié)構(gòu)計算器1401獲得的譜精細結(jié)構(gòu)har(m)兩者還可以確定矢量解碼器1204的量化位分配。然后,根據(jù)那個量化位分配和從多路分用器1201中獲得的編碼信息解碼歸一化MDCT系數(shù)X3q(m)。此外,通過按照如下方程(31)將歸一化MDCT系數(shù)X2q(m)乘以譜包絡env(m)和譜精細結(jié)構(gòu)har(m)求出歸一化MDCT系數(shù)X1q(m)。
X1q(m)=X2q(m)env(m)har(m)…(31)因此,根據(jù)本實施例的信號處理設備,通過利用基本層編碼器編碼和局部解碼器解碼的音調(diào)周期計算譜精細結(jié)構(gòu),和將那個譜精細結(jié)構(gòu)應用在譜歸一化和矢量量化中,可以進行與聲音編碼相對應的聲音解碼,從而提高量化性能。
(第8實施例)圖15是示出根據(jù)本發(fā)明第8實施例的信號處理設備的增強層解碼器的配置的方塊圖。將與圖12中相同的標號指定給圖15中與圖12中的那些相同的部分,并且省略對它們的詳細描述。
圖15中的增強層解碼器1004與圖12中的增強層解碼器的不同之處在于,配備了功率估計單元1501、功率漲落量解碼器1502和功率發(fā)生器1503,并且,形成與利用基本層解碼信號預測MDCT系數(shù)功率,并根據(jù)那個預測值編碼漲落量的編碼器相對應的解碼器。
在圖10中,解碼參數(shù)從基本層解碼器1002輸出到增強層解碼器1004,但是,在本實施例中,將基本層解碼器1002獲得的解碼信號輸出到增強層解碼器1004,而不是解碼參數(shù)。
功率估計單元1501利用方程(20)或方程(21),從基本層解碼器1002解碼的解碼信號sl(n)中估計MDCT系數(shù)的功率。
功率漲落量量化器1502根據(jù)從多路分用器1201獲得的編碼信息解碼功率漲落量,并且將這個功率漲落量輸出到功率發(fā)生器1503。功率發(fā)生器1503從功率漲落量中計算功率。
乘法器1209按照如下方程(32)求出MDCT系數(shù)。
Xq(m)=X1q(m)rq·powp···(32)]]>這里,rq表示功率漲落量,和powp表示功率估計。X1q(m)表示來自乘法器1207的輸出信號。
因此,根據(jù)本實施例的信號處理設備,通過配置與利用基本層解碼信號預測MDCT系數(shù)功率,和根據(jù)那個預測值編碼漲落量的編碼器相對應的解碼器,可以減少MDCT系數(shù)功率量化所需的位數(shù)。
(第9實施例)圖16是示出根據(jù)本發(fā)明第9實施例的聲音編碼設備的配置的方塊圖。圖16中的聲音編碼設備1600主要包括向下取樣器1601、基本層編碼器1602、局部解碼器1603、向上取樣器1604、延遲器1605、減法器1606、頻率確定部分1607、增強層編碼器1608和多路復用器1609。
基本層編碼器1602以預定基本幀為單位編碼取樣速率FL輸入數(shù)據(jù),并且將第一編碼信息輸出到局部解碼器1603和多路復用器1609。基本層編碼器1602可以利用,例如,CELP方法編碼輸入數(shù)據(jù)。
局部解碼器1603解碼第一編碼信息,并且將通過解碼獲得的解碼信號輸出到向上取樣器1604。向上取樣器1604將解碼信號取樣速率升高到FH,并且將結(jié)果輸出到減法器1606和頻率確定部分1607。
延遲器1605將輸入信號延遲預定時間,然后,將信號輸出到減法器1606。通過使這個延遲時間等于在向下取樣器1601、基本層編碼器1602、局部解碼器1603和向上取樣器1604中產(chǎn)生的時間延遲,可以防止在接著的相減處理中出現(xiàn)相移。減法器1606進行輸入信號和解碼信號之間的相減,并且將相減結(jié)果作為誤差信號輸出到增強層編碼器1608。
頻率確定部分1607根據(jù)取樣速率已經(jīng)升高到FH的解碼信號確定進行誤差信號編碼的區(qū)域和不進行誤差信號編碼的區(qū)域,并且通知增強層編碼器1608。例如,頻率確定部分1607根據(jù)取樣速率已經(jīng)升高到FH的解碼信號確定聽覺掩蔽的頻率,并且將這個頻率輸出到增強層編碼器1608。
增強層編碼器1608將誤差信號轉(zhuǎn)換到頻域和生成誤差譜,并且根據(jù)從頻率確定部分1607中獲得的頻率信息進行誤差譜編碼。多路復用器1609多路復用通過基本層編碼器1602編碼獲得編碼信息和通過增強層編碼器1608編碼獲得編碼信息。
現(xiàn)在分別描述基本層編碼器1602和增強層編碼器1608編碼的信號。圖17是示出聲信號信息分布的例子的圖形。在圖17中,垂直軸表示信息量,而水平軸表示頻率。圖17示出了在哪些頻帶中給出多少包含在輸入信號中的語音信息和背景音樂和背景噪聲信息。
如圖17所示,在語音信息的情況下,在低頻區(qū)中存在大量信息,信息量隨著頻區(qū)增高而減少。相反,在背景音樂和背景噪聲信息的情況下,與語音信息相比,在較低區(qū)域中存在相對少的信息,和在較高區(qū)域中存在大量信息。
因此,在基本層中,利用CELP高質(zhì)量地編碼語音信號,和在增強層中,不能在基本層中得到表示的背景音樂或環(huán)境聲音和存在比基本層覆蓋的頻區(qū)高的頻率成分的信號得到有效編碼。
圖18是示出基本層和增強層中編碼區(qū)的例子的圖形。在圖18中,垂直軸表示信息量,而水平軸表示頻率。圖18示出了作為分別由基本層編碼器1603和增強層編碼器1608編碼的信息的對象的區(qū)域。
基本層編碼器1602被設計成有效表示從0到FL的頻帶中的語音信息,并且可以對該區(qū)域中的語音信息進行高質(zhì)編碼。但是,對于基本層編碼器1602,從0到FL的頻帶中背景音樂和背景噪聲信息的編碼質(zhì)量不高。
增強層編碼器1608被設計成覆蓋如上所述,基本層編碼器1602的能力不足的部分和從FL到FH的頻帶中的信號。因此,通過組合基本層編碼器1502和增強層編碼器1608,可以在寬帶中實現(xiàn)高質(zhì)編碼。
如圖18所示,通過基本層編碼器1602中的編碼獲得的第一編碼信息包含0和FL之間的頻帶中的語音信息,因此,可以實現(xiàn)即使只利用至少第一編碼信息也可以獲得解碼信號的可伸縮功能。
此外,可以考慮利用增強層中的聽覺掩蔽來升高編碼頻率。聽覺掩蔽應用了當供應某個信號時,頻率在那個信號的頻率附近的信號不能被聽到(被掩蔽)的人聽覺特性。
圖19是示出聲(音樂)信號譜的例子的例子。在圖19中,實線表示聽覺掩蔽,和虛線表示誤差譜。這里的“誤差譜”指的是輸入信號和基本層解碼信號的誤差信號(增強層輸入信號)的頻譜。
在圖19中陰影區(qū)所指的誤差譜中,幅度值低于聽覺掩蔽,因此,人的耳朵聽不到聲音,而在其它區(qū)域中,誤差譜幅度值超過聽覺掩蔽,因此,感覺得到量化失真。
在增強層中,只需編碼包括在圖19中的白區(qū)中的誤差譜,使得那些區(qū)域的量化失真小于聽覺掩蔽。屬于陰影區(qū)的系數(shù)已經(jīng)小于聽覺掩蔽,因此,不需要量化。
在本實施例的聲音編碼設備1600中,根據(jù)聽覺掩蔽等編碼殘留誤差信號的頻率不從編碼方發(fā)送到解碼方,編碼方和解碼方利用向上取樣基本層解碼信號分開確定進行增強層編碼的誤差譜頻率。
在解碼信號來源于對基本層編碼信息的解碼的情況下,編碼方和解碼方獲得相同信號,因此,通過讓編碼方通過從這個解碼信號中確定聽覺掩蔽頻率來編碼信號和讓解碼方通過從這個解碼信號中獲取聽覺掩蔽頻率來解碼信號,編碼和發(fā)送作為附加信息的誤差譜頻率信息就變得多余了,從而能夠?qū)崿F(xiàn)位速率的降低。
接著,詳細描述根據(jù)本實施例的聲音編碼設備的操作。首先,描述頻率確定部分1607從向上取樣基本層解碼信號(下文稱為“基本層解碼信號”)中確定在增強層中編碼的誤差譜頻率的操作。圖20是示出本實施例的聲音編碼設備的頻率確定部分的內(nèi)部配置的例子的方塊圖。
在圖20中,頻率確定部分1607主要包括FFT部分1901、估計聽覺掩蔽計算器1902和確定部分1903。
FFT部分1901對從向上取樣器1604輸出的基本層解碼信號x(n)進行正交轉(zhuǎn)換,計算幅度譜P(m),并且將幅度譜P(m)輸出到估計聽覺掩蔽計算器1902和確定部分1903。具體地說,F(xiàn)FT部分1901利用如下方程(33)計算幅度譜P(m)。
P(m)=Re2(m)+Im2(m)···(33)]]>這里,Re(m)和Im(m)表示基本層解碼信號x(n)的付里葉系數(shù)的實部和虛部,和m表示頻率。
接著,估計聽覺掩蔽計算器1902利用基本層解碼信號幅度譜P(m)計算估計聽覺掩蔽M′(m),并且將估計聽覺掩蔽M′(m)輸出到確定部分1903。一般說來,聽覺掩蔽是根據(jù)輸入信號的頻譜計算的,但在這個實現(xiàn)例子中,利用基本層解碼信號x(n)而不是利用輸入信號來估計聽覺掩蔽。這基于這樣的思想,由于基本層解碼信號x(n)被確定成相對應于輸入信號失真很小,所以,如果用基本層解碼信號x(n)取代輸入信號,將會取得足夠好的近似,并且主要問題也不會存在。
然后,確定部分1903利用基本層解碼信號幅度譜P(m)和估計聽覺掩蔽計算器1902獲得的估計聽覺掩蔽M′(m),確定增強層編碼器1608進行誤差譜編碼可應用的頻率。確定部分1903把基本層解碼信號幅度譜P(m)當作誤差譜的近似,并且將使如下方程(34)成立的頻率輸出到增強層編碼器1608。
P(m)-M′(m)>0…(34)在方程(34)中,項P(m)估計誤差譜的大小,和項M′(m)估計聽覺掩蔽。然后,確定部分1903比較估計誤差譜和估計聽覺掩蔽的值,并且,如果方程(34)得到滿足-也就是說,如果估計誤差譜的值超過估計聽覺掩蔽的值-假設那個頻率的誤差譜是可當作噪聲感覺的,并且讓增強層編碼器1608對它進行編碼。
相反,如果估計誤差譜的值小于估計聽覺掩蔽的大小,確定部分1903認為由于掩蔽效應,那個頻率的誤差譜將不會當作噪聲感覺到,并且確定不要對這個頻率的誤差譜進行量化。
現(xiàn)在描述估計聽覺掩蔽計算器1902的操作。圖21是示出本實施例的聲音編碼設備的聽覺掩蔽計算器的內(nèi)部配置的例子的圖形。在圖21中,估計聽覺掩蔽計算器1902主要包括Bark譜計算器2001、擴展函數(shù)卷積單元2002、音調(diào)計算器2003和聽覺掩蔽計算器2004。
在圖21中,Bark譜計算器2001利用如下方程(35)計算Bark譜B(k)。
B(k)=Σm=fl(k)fh(k)P2(m)···(35)]]>這里,P(m)表示幅度譜,并且從上面的方程(33)中求出,k與Bark譜號相對應,和fl(k)和fh(k)分別表示第k Bark譜的最低頻率和最高頻率。在頻帶分布在Bark標度上是等間隔的情況下,Bark譜B(k)表示譜強度。如果Herz標度用h表示和Bark標度用B表示,Herz標度和Bark標度之間的關系用如下方程(36)表示。
B=13tan-1(0.76f)+3.5tan-1(f7.5)···(36)]]>擴展函數(shù)卷積單元2002利用如下方程(37)將擴展函數(shù)SF(k)卷積成Bark譜B(k)。
C(k)=B(k)*SF(k)…(37)音調(diào)計算器2003利用如下方程(38)求出每個Bark譜的譜平坦度SFM(k)。
SFM(k)=μg(k)μa(k)···(38)]]>這里,μg(k)表示第k Bark譜中功率譜的幾何平均,和μa(k)表示第k Bark譜中功率譜的算術平均。然后,音調(diào)計算器2003利用如下方程(39),從譜平坦度SFM(k)的分貝值SFMdB(k)中計算音調(diào)系數(shù)α(k)。
α(k)=min(SFMdB(k)-60,1.0)···(39)]]>利用如下方程(40),聽覺掩蔽計算器2004從音調(diào)計算器2003計算的音調(diào)系數(shù)α(k)中求出每個Bark標度的偏移量0(k)。
O(k)=α(k)·(14.5-k)+(1.0-α(k))·5.5…(40)然后,聽覺掩蔽計算器2004利用如下方程(41),通過從擴展函數(shù)卷積單元2002求出的C(k)中減去偏移量0(k)計算聽覺掩蔽T(k)。
T(k)=max(10log10(C(k))-(O(k)/10),Tq(k))···(41)]]>這里,Tq(k)表示絕對閾值。絕對閾值代表作為人聽覺特性觀察的聽覺掩蔽的最小值。聽覺掩蔽計算器2004將在Bark標度上表達的聽覺掩蔽T(k)轉(zhuǎn)換成Herz標度。并且求出輸出到確定部分1903的估計聽覺掩蔽M′(k)。
增強層編碼器1608利用以這種方式求出的經(jīng)過量化的頻率m進行MDCT系數(shù)編碼。圖22是示出本實施例的增強層編碼器的內(nèi)部配置的例子的圖形。圖22中的增強層編碼器1608主要包括MDCT部分2101和MDCT系數(shù)量化器2102。
MDCT部分2101將從減法器1606輸出的輸入信號乘以分析窗,然后,進行MDCT(改進離散余弦變換)處理以獲得MDCT系數(shù)。在MDCT處理中,供分析用的正交基用于相繼的兩個幀。并且,分析幀一半重疊,分析幀的前一半是奇函數(shù),而分析幀的后一半是偶函數(shù)。MDCT處理的特征是,由于逆變換之后波形的疊加造成的相加,不會出現(xiàn)幀邊緣失真。當進行MDCT時,輸入信號被乘以諸如正弦函數(shù)窗口之類的窗口函數(shù)。如果將一系列MDCT系數(shù)指定為X(n)時,MDCT系數(shù)按照如下方程(42)計算。
X(m)=1NΣn=02N-1x(n)cos{(2n+1+N)·(2m+1)π4N}···(42)]]>MDCT系數(shù)量化器2102量化與來自頻率確定部分1607的頻率相對應的系數(shù)。然后,MDCT系數(shù)量化器2102將量化MDCT系數(shù)編碼信息輸出到多路分用器1609。
因此,根據(jù)本實施例的聲音編碼設備,由于利用基本層解碼信號確定了增強層中用于量化的頻率,沒有必要將用于量化的頻率信息從編碼方發(fā)送到解碼方,并且能夠以低位速率進行高質(zhì)編碼。
在上面的實施例中,已經(jīng)描述了使用FFT的聽覺掩蔽計算方法,但是,也可以利用MDCT取代FFT來計算聽覺掩蔽。圖23是示出本實施例的聽覺掩蔽計算器的內(nèi)部配置的例子的圖形。將與圖20中相同的標號指定給圖23中與圖20中的那些相同的部分,并且省略對它們的詳細描述。
MDCT部分2201利用MDCT系數(shù)近似計算幅度譜P(m)。具體地說,MDCT部分2201利用如下方程(43)近似計算幅度譜P(m)。
P(m)=R2(m)···(43)]]>這里,R(m)是通過對向上取樣器1604供應的信號進行MDCT處理求出的MDCT系數(shù)。
估計聽覺掩蔽計算器1902從P(m)中近似計算Bark譜B(k)。此后,按照上述方法計算用于量化的頻率信息。
因此,本實施例的聲音編碼設備可以利用MDCT計算聽覺掩蔽。
現(xiàn)在描述解碼方。圖24是示出根據(jù)本發(fā)明第9實施例的聲音解碼設備的配置的方塊圖。圖24中的聲音解碼設備2300主要包括多路分用器2301、基本層解碼器2302、向上取樣器2303、頻率確定部分2304、增強層解碼器2305和加法器2306。
多路分用器2301將聲音編碼設備1600編碼的代碼分離成基本層第一編碼信息和增強層第二編碼信息,并且將第一編碼信息輸出到基本層解碼器2302,和將第二編碼信息輸出到增強層解碼器2305。
基本層解碼器2302解碼第一編碼信息和獲取取樣速率FL解碼信號。然后,基本層解碼器2302將解碼信號輸出到向上取樣器2303。向上取樣器2303將取樣速率FL解碼信號轉(zhuǎn)換成取樣速率FH解碼信號,并且將這個信號輸出到頻率確定部分2304和加法器2306。
利用向上取樣基本層解碼信號,頻率確定部分2304確定要在增強層解碼器2305中解碼的誤差譜頻率。這個頻率確定部分2304具有與圖16中的頻率確定部分16相同類型的配置。
增強層解碼器2305解碼第二編碼信息和將取樣速率FH解碼信號輸出到加法器2306。
加法器2306相加向上取樣器2303向上取樣的基本層解碼信號和增強層解碼器2305解碼的增強層解碼信號,并且輸出所得信號。
接著,詳細描述根據(jù)本實施例的聲音解碼設備的每個方塊的操作。圖25是示出本實施例的聲音解碼設備的增強層解碼器的內(nèi)部配置的例子的方塊圖。圖25示出了圖24中的增強層解碼器2305的內(nèi)部配置的例子。圖25中的增強層解碼器2305主要包括MDCT系數(shù)解碼器2401、IMDCT部分2402和疊加加法器2403。
MDCT系數(shù)解碼器2401根據(jù)從頻率確定部分2304輸出的頻率,確定從多路分用器2301輸出的第二編碼信息中量化的MDCT系數(shù)。具體地說,定位與頻率確定部分2304所指的頻率相對應的解碼MDCT系數(shù),并且,對于其它頻率填上零。
IMDCT部分2402對從MDCT系數(shù)解碼器2401輸出的MDCT系數(shù)進行逆MDCT處理,生成時域信號,并且將這個信號輸出到疊加加法器2403。
疊加加法器2403在對來自IMDCT部分2402的時域信號開窗之后,進行疊加和相加操作,并且,它將解碼信號輸出到加法器2306。具體地說,疊加加法器2403將解碼信號乘以一個窗口和疊加在前一幀和當前幀中解碼的時域信號,進行相加,并且生成輸出信號。
因此,根據(jù)本實施例的聲音解碼設備,通過利用基本層解碼信號確定用于增強層解碼的頻率,無需任何附加信息就可以確定用于增強層解碼的頻率,并且,能夠以低位速率進行高質(zhì)編碼。
(第10實施例)在本實施例中,描述CELP用在基本層編碼中的例子。圖26是示出根據(jù)本發(fā)明第10實施例的基本層編碼器的內(nèi)部配置的例子的方塊圖。圖26示出了圖16中的基本層編碼器1602的內(nèi)部配置的例子。圖26中的基本層編碼器1602主要包括LPC分析器2501、加權(quán)部分2502、自適應碼簿搜索單元2503、自適應增益量化器2504、目標矢量發(fā)生器2505、噪聲碼簿搜索單元2506、噪聲增益量化器2507和多路復用器2508。
LPC分析器2501計算取樣速率FL輸入信號的LPC系數(shù),將LPC系數(shù)轉(zhuǎn)換成諸如LSP系數(shù)之類適合于量化的參數(shù),并且進行量化。然后,LPC分析器2501將通過這種量化獲得的編碼信息輸出到多路復用器2508。
此外,LPC分析器2501從編碼信息中計算量化LSP系數(shù),將這個量化LSP系數(shù)轉(zhuǎn)換成LSP系數(shù),并且將量化LSP系數(shù)輸出到自適應碼簿搜索單元2503、自適應增益量化器2504、噪聲碼簿搜索單元2506和噪聲增益量化器2507。LPC分析器2501還將原LPC系數(shù)輸出到加權(quán)部分2502、自適應碼簿搜索單元2503、自適應增益量化器2504、噪聲碼簿搜索單元2506和噪聲增益量化器2507。
加權(quán)部分2502根據(jù)LPC分析器1501獲得的LPC系數(shù),對從向下取樣器1601輸出的輸入信號進行加權(quán)。這種操作的目的是進行譜成形,以便通過輸入信號譜包絡掩蔽量化失真譜。
然后,自適應碼簿搜索單元2503利用作為目標信號的加權(quán)輸入信號搜索自適應碼簿。以音調(diào)周期為基礎重復以前確定激勵信號的信號被稱為自適應矢量,和自適應碼簿由在預定范圍的音調(diào)周期上生成的自適應矢量組成。
如果將加權(quán)輸入信號指定為t(n),和將包括原LPC系數(shù)和量化LPC系數(shù)的加權(quán)合成濾波器的脈沖響應被卷積成音調(diào)周期為i的自適應矢量的信號指定為pi(n),那么,自適應碼簿搜索單元2503將使如下方程(44)的估算函數(shù)D達到極小的自適應矢量的音調(diào)周期i作為編碼信息輸出到多路復用器408。
D=Σn=0N-1t2(n)-(Σn=0N-1t(n)pi(n))2Σn=0N-1pi2(n)···(44)]]>這里,N表示矢量長度。由于方程(44)的第一項與音調(diào)周期i無關,自適應碼簿搜索單元2503實際上只計算第二項。
自適應增益量化器2504進行乘以自適應矢量的自適應增益的量化。自適應增益β用方程(45)表示。自適應增益量化器2504進行這個自適應增益β的標量量化,并且將在量化過程中獲得的編碼信息輸出到多路復用器2508。
β=Σn=0N-1t(n)pi(n)Σn=0N-1pi2(n)···(45)]]>目標矢量發(fā)生器2505從輸入信號中減去自適應矢量產(chǎn)生的效果,生成和輸出噪聲碼簿搜索單元2506和噪聲增益量化器2507使用的目標矢量。在目標矢量發(fā)生器2505中,如果pi(n)表示當方程(44)所表示的估算函數(shù)D達到極小時,加權(quán)合成濾波器脈沖響應被卷積成自適應矢量的信號,和βq表示當方程(45)所表示的自適應矢量β經(jīng)受標量量化時的量化自適應增益,那么,目標矢量t2(n)由如下方程(46)表示。
t2(n)=t(n)-βq·pi(n)…(46)噪聲碼簿搜索單元406利用前述目標矢量t2(n)、原LPC系數(shù)和量化LPC系數(shù),進行噪聲碼簿搜索。噪聲碼簿搜索單元406可以使用,例如,隨機噪聲或利用大量語音信號學習的信號。此外,可以使用代數(shù)碼簿。代數(shù)碼簿由一些脈沖組成。這樣代數(shù)碼簿的特征是,通過小量計算就可以確定脈沖位置和脈沖代碼(極性)的最佳組合。
如果將目標矢量指定為t2(n),和將加權(quán)合成濾波器的脈沖響應被卷積成與代碼j相對應的噪聲矢量的信號指定為cj(n),那么,噪聲碼簿搜索單元2506將使如下方程(47)的估算函數(shù)D達到極小的噪聲矢量的指標j輸出到多路復用器2508。
D=Σn=0N-1t22(n)-(Σn=0N-1t2(n)cj(n))2Σn=0N-1cj2(n)···(47)]]>噪聲增益量化器2507量化乘以噪聲矢量的噪聲增益。噪聲增益量化器2507利用如下方程(48)計算自適應增益γ,對這個噪聲增益γ進行標量量化,并且將編碼信息輸出到多路復用器2508。
γ=Σn=0N-1t2(n)cj(n)Σn=0N-1cj2(n)···(48)]]>多路復用器2508多路復用LPC系數(shù)的編碼信息、自適應矢量、自適應增益、噪聲矢量和噪聲增益編碼信息,并且將所得信號輸出到局部解碼器1603和多路復用器1609。
現(xiàn)在描述解碼方。圖27是示出本實施例的基本層解碼器的內(nèi)部配置的例子的方塊圖。圖27示出了基本層解碼器2302的例子。圖27中的基本層解碼器2302主要包括多路分用器2601、激勵發(fā)生器2602和合成濾波器2603。
多路分用器2601將來自多路分用器2301的第一編碼信息分離成LPC系數(shù)、自適應矢量、自適應增益、噪聲矢量和噪聲增益編碼信息,并且將自適應矢量、自適應增益、噪聲矢量和噪聲增益編碼信息輸出到激勵發(fā)生器2602。類似地,多路分用器2601將線性預測系數(shù)編碼信息輸出到合成濾波器2603。
激勵發(fā)生器2602解碼自適應矢量、自適應矢量增益、噪聲矢量和噪聲矢量增益編碼信息,和利用如下方程(49)生成激勵矢量ex(n)。
ex(n)=βq·q(n)-γq·c(n) …(49)這里,q(n)表示自適應矢量,βq表示自適應矢量增益,c(n)表示噪聲矢量,和γq表示噪聲矢量增益。
合成濾波器2603對LPC系數(shù)編碼信息進行LPC系數(shù)解碼,和利用如下方程(50),從解碼LPC系數(shù)中生成合成信號syn(n)。
syn(n)=ex(n)+Σi=1NPαq(i)·syn(n-i)···(50)]]>這里,αq表示解碼LPC系數(shù),和NP表示LPC系數(shù)的次序。然后,合成濾波器2603將以這種方式解碼的解碼信號syn(n)輸出到向上取樣器2303。
因此,根據(jù)本實施例的聲音編碼設備,通過在發(fā)送方在基本層中利用CELP編碼輸入信號,和在接收方利用CELP解碼這個編碼輸入信號,可以以低位速率實現(xiàn)高質(zhì)基本層。
為了抑制量化失真被人們感覺到,本實施例的編碼設備也可以應用在合成濾波器2603之后附屬連接后置濾波器的配置。圖28是示出本實施例的基本層解碼器的內(nèi)部配置的例子的方塊圖。將與圖27中相同的標號指定給圖28中與圖27中的那些相同的部分,并且省略對它們的詳細描述。
各種類型的配置可用于后置濾波器,以實現(xiàn)量化失真被人們感覺到的抑制,一種典型方法是利用包括通過多路分用器2601解碼獲得的LPC系數(shù)的共振峰強調(diào)濾波器的方法。共振峰強調(diào)濾波函數(shù)Hf(z)用如下方程(51)表示。
Hf(z)=A(z/γn)A(z/γd)(1-μz-1)···(51)]]>這里,A(z)表示包括解碼LPC系數(shù)的分析濾波函數(shù),和γn、γd和μ表示確定濾波器特性的常數(shù)。
(第11實施例)圖29是示出根據(jù)本發(fā)明第11實施例的聲音編碼設備的頻率確定部分的內(nèi)部配置的例子的方塊圖。將與圖20中相同的標號指定給圖29中與圖20中的那些相同的部分,并且省略對它們的詳細描述。圖29中的頻率確定部分1607與圖20中的頻率確定部分的不同之處在于,配備了估計誤差譜計算器2801和確定部分2802,并且,從基本層解碼信號幅度譜P(m)中估計估計誤差譜E′(m),和利用估計誤差譜E′(m)和估計聽覺掩蔽M′(m),確定增強層編碼器1608編碼的誤差譜的頻率。
FFT部分1901對從向上取樣器1604輸出的基本層解碼信號x(n)進行付里葉變換,計算幅度譜P(m),并且將幅度譜P(m)輸出到估計聽覺掩蔽計算器1902和估計誤差譜計算器2801。具體地說,F(xiàn)FT部分1901利用如下方程(33)計算幅度譜P(m)。
估計誤差譜計算器2801從FFT部分1901計算的基本層解碼信號幅度譜P(m)中計算估計誤差譜E′(m),并且將估計誤差譜E′(m)輸出到確定部分2802。估計誤差譜E′(m)是通過執(zhí)行使基本層解碼信號幅度譜P(m)接近平坦的處理計算的。具體地說,估計誤差譜計算器2801利用如下方程(52)計算估計誤差譜E′(m)。
E′(m)=α·P(m)γ…(52)這里,a和γ是大于等于0和小于1的常數(shù)。
利用估計誤差譜計算器2801獲得的估計誤差譜E′(m)和估計聽覺掩蔽計算器1902獲得的估計聽覺掩蔽M′(m),確定部分1903確定增強層編碼器1608用于誤差譜編碼的頻率。
接著,描述本實施例的估計誤差譜計算器2801計算的估計誤差譜。圖30是示出本實施例的估計誤差譜計算器計算的殘留誤差譜的例子的圖形。
如圖30所示,誤差譜E(m)的譜線形狀比基本層解碼信號幅度譜P(m)的譜線形狀光滑,并且,它的總頻帶功率較小。因此,通過使幅度譜P(m)變平成γ(0<γ<1)的功率,和通過乘以a(0<a<1)降低總頻帶功率,可以提高誤差譜估計的精度。
此外,在解碼方,聲音解碼設備2300的頻率確定部分2304的內(nèi)部配置與圖29中的編碼方頻率確定部分1607的內(nèi)部配置相同。
因此,根據(jù)本實施例的聲音編碼設備,通過使從基本層解碼信號譜中估計的殘留誤差譜變平滑,可以使估計誤差譜接近殘留誤差譜,和可以在增強層中有效地編碼誤差譜。
在本實施例中,已經(jīng)描述了使用FFT的情況,但是,像上述第9實施例中那樣,MDCT或其它變換用來取代FFT的配置也是可以的。
(第12實施例)圖31是示出根據(jù)本發(fā)明第12實施例的聲音編碼設備的頻率確定部分的內(nèi)部配置的例子的方塊圖。將與圖20中相同的標號指定給圖31中與圖20中的那些相同的部分,并且省略對它們的詳細描述。圖31中的頻率確定部分1607與圖20中的頻率確定部分的不同之處在于,配備了估計聽覺掩蔽校正部分3001和確定部分3002,并且,在通過估計聽覺掩蔽計算器1902從基本層解碼信號幅度譜P(m)中計算出估計聽覺掩蔽M′(m)之后,頻率確定部分1607根據(jù)局部解碼器1603解碼參數(shù)信息,對這個估計聽覺掩蔽M′(m)加以校正。
FFT部分1901對從向上取樣器1604輸出的基本層解碼信號x(n)進行付里葉變換,計算幅度譜P(m),并且將幅度譜P(m)輸出到估計聽覺掩蔽計算器1902和確定部分3002。估計聽覺掩蔽計算器1902利用基本層解碼信號幅度譜P(m)計算估計聽覺掩蔽M′(m),并且將估計聽覺掩蔽M′(m)輸出到估計聽覺掩蔽校正部分3001。
因此,根據(jù)本實施例的聲音編碼設備,通過使從基本層解碼信號譜中估計的殘留誤差譜變平滑,可以使估計誤差譜接近殘留誤差譜,和可以在增強層中有效地編碼誤差譜。
利用從局部解碼器1603輸入的基本層解碼參數(shù)信息,估計聽覺掩蔽校正部分3001對估計聽覺掩蔽計算器1902獲得的估計聽覺掩蔽M′(m)加以校正。
這里假設供應從解碼LPC系數(shù)中計算的一階PARCOR系數(shù)作為基本層編碼信息。一般說來,LPC系數(shù)和PARCOR系數(shù)代表輸入信號譜包絡。由于PARCOR系數(shù)的特性,隨著PARCOR系數(shù)的階降低,譜包絡的形狀簡化了,并且,當PARCOR系數(shù)的階是1時,指出了頻譜的傾斜度。
另一方面,在音頻或語音輸入信號的譜特性中,存在與較高區(qū)相反,功率朝著較低區(qū)方向偏置的情況(例如,對于元音),和反過來的情況(例如,對于輔音)?;緦咏獯a信號易受這樣輸入信號譜特性的影響,并且,存在過分強調(diào)譜功率偏置的傾向。
因此,在本實施例的聲音編碼設備中,通過在估計聽覺掩蔽校正部分3001中利用前述一階PARCOR系數(shù)校正過分強調(diào)譜偏置,可以提高估計聽覺掩蔽M′(m)的精度。
估計聽覺掩蔽校正部分3001利用如下方程(53),從基本層編碼器1602輸出的一階PARCOR系數(shù)k(1)中計算校正濾波函數(shù)Hk(z)。
Hk(z)=1-β·k(1)·z-1…(53)這里,β表示小于1的正常數(shù)。接著,估計聽覺掩蔽校正部分3001利用如下方程(54),計算校正濾波函數(shù)Hk(z)的幅度特性K(m)。
K(m)=|1-β·k(1)·e-j2πmM|···(54)]]>然后,估計聽覺掩蔽校正部分3001利用如下方程(55),從校正濾波函數(shù)幅度特性K(m)中計算校正估計聽覺掩蔽M″(m)。
M″(m)=K(m)·M′(m)…(55)然后,取代估計聽覺掩蔽M′(m),估計聽覺掩蔽校正部分3001將校正估計聽覺掩蔽M″(m)輸出到確定部分3002。
利用基本層解碼信號幅度譜P(m)和從估計聽覺掩蔽校正部分3001輸出的校正估計聽覺掩蔽M″(m),確定部分3002確定增強層編碼器1608用于誤差譜編碼的頻率。
因此,根據(jù)本實施例的聲音編碼設備,通過利用掩蔽效應特性,從輸入信號譜中計算聽覺掩蔽,和在增強層編碼中進行使量化失真不超過掩蔽值的量化,在不會使質(zhì)量下降的情況下,可以減少經(jīng)受量化的MDCT系數(shù)的個數(shù),和以低位速率進行高質(zhì)編碼。
因此,根據(jù)本實施例的聲音編碼設備,通過根據(jù)基本層編碼器解碼參數(shù)信息對估計聽覺掩蔽加入校正,可以提高估計聽覺掩蔽的精度,和在增強層中進行有效誤差譜編碼。
此外,在解碼方,聲音解碼設備2300的頻率確定部分2304的內(nèi)部配置與圖31中的編碼方頻率確定部分1607的內(nèi)部配置相同。
對于本實施例的頻率確定部分1607,還可以應用將本實施例和第11實施例組合在一起的配置。圖32是示出本實施例的聲音編碼設備的頻率確定部分的內(nèi)部配置的例子的方塊圖。將與圖20中相同的標號指定給圖32中與圖20中的那些相同的部分,并且省略對它們的詳細描述。
FFT部分1901對從向上取樣器1604輸出的基本層解碼信號x(n)進行付里葉變換,計算幅度譜P(m),并且將幅度譜P(m)輸出到估計聽覺掩蔽計算器1902和估計誤差譜計算器2801。
估計聽覺掩蔽計算器1902利用基本層解碼信號幅度譜P(m)計算估計聽覺掩蔽M′(m),并且將估計聽覺掩蔽M′(m)輸出到估計聽覺掩蔽校正部分3001。
在估計聽覺掩蔽校正部分3001中,應用從局部解碼器1603輸入的基本層解碼參數(shù)信息來校正估計聽覺掩蔽計算器1902獲得的估計聽覺掩蔽M′(m)。
估計誤差譜計算器2801從FFT部分1901計算的基本層解碼信號幅度譜P(m)中計算估計誤差譜E′(m),并且將估計誤差譜E′(m)輸出到確定部分3101。
利用估計誤差譜計算器2801估計的估計誤差譜E′(m)和從估計聽覺掩蔽校正部分3001輸出的校正聽覺掩蔽M″(m),確定部分3101確定增強層編碼器1608進行誤差譜編碼的頻率。
在本實施例中,已經(jīng)描述了使用FFT的情況,但是,像上述第9實施例中那樣,MDCT或其它變換技術用來取代FFT的配置也是可以的。
(第13實施例)圖33是示出根據(jù)本發(fā)明第13實施例的聲音編碼設備的增強層編碼器的內(nèi)部配置的例子的方塊圖。將與圖22中相同的標號指定給圖33中與圖22中的那些相同的部分,并且省略對它們的詳細描述。圖33中的增強層編碼器與圖22中的增強層編碼器的不同之處在于,配備了定序部分3201和MDCT系數(shù)量化器3202,并且,按照估計失真值D(m)的數(shù)量,通過頻率對頻率確定部分1607供應的頻率進行加權(quán)。
在圖33中,MDCT部分2101將從減法器1606輸出的輸入信號乘以分析窗,然后,進行MDCT(改進離散余弦變換)處理以獲得MDCT系數(shù),并且將MDCT系數(shù)輸出到MDCT系數(shù)量化器3202。
定序部分3201接收頻率確定部分1607獲得的頻率信息,并且計算每個頻率的估計誤差譜E′(m)超過估計聽覺掩蔽M′(m)的數(shù)量(下文稱為“估計失真值”)D(m)。這個估計失真值D(m)由如下方程(56)定義。
D(m)=E’(m)-M’(m)…(56)這里,定序部分3201只計算滿足如下方程(57)的估計失真值D(m)。
E’(m)-M’(m)>0…(57)然后,定序部分3201按從高到低估計失真值D(m)次序進行定序,并且將相應頻率信息輸出到MDCT系數(shù)量化器3202。MDCT系數(shù)量化器3202進行量化,根據(jù)估計失真值D(m),將位成正比地分配給位于按從高到低估計失真值D(m)次序排列的頻率上的誤差譜E(m)。
作為一個例子,這里描述從頻率確定部分發(fā)送的頻率和估計失真值像圖34所示那樣的情況。圖34是示出本實施例的定序部分排序估計失真值的例子的圖形。
定序部分3201根據(jù)圖34中的信息,按從高到低估計失真值D(m)次序重新排列頻率。在本例中,作為定序部分3201的處理結(jié)果獲得的頻率m次序是7、8、4、9、1、11、3、12。定序部分3201將這個定序信息輸出到MDCT系數(shù)量化器3202。
在MDCT部分2101給出的誤差譜E(m)內(nèi),MDCT系數(shù)量化器3202根據(jù)定序部分3201給出的定序信息,量化E(7)、E(8)、E(4)、E(9)、E(1)、E(11)、E(3)、E(12)。
同時,在該次序的開頭分配許多用于誤差譜量化的位,和朝著該次序的末端分配逐漸減少的位。也就是說,頻率的估計失真值D(m)越大,分配用于誤差譜量化的位就越多,頻率的估計失真值D(m)越小,分配用于誤差譜量化的位就越少。
例如,可以進行如下位分配對于E(7),8個位;對于E(8)和E(4),7個位;對于E(9)和E(1),6個位;對于E(11)、E(3)和E(12),5個位。這樣,根據(jù)估計失真值D(m)進行自適應位分配提高了量化效率。
當應用矢量量化時,增強層編碼器1608從位于該次序的開頭上的誤差譜開始依次配置矢量,并且對各自矢量進行矢量量化。同時,進行矢量配置和量化位分配,以便對于位于該次序的開頭上的誤差譜,分配的位較多,和對于位于該次序的末端上的誤差譜,分配的位較少。在圖34中的例子中,配置了三個矢量-二維、二維和四維,以及V1=(E(7),E(8))、V2=(E(4),E(9))和V3=(E(1),E(11),E(3),E(12)),并且,位分配是對于V1,10個位;對于V2,8個位;和對于V3,8個位。
因此,根據(jù)本實施例的聲音編碼設備,通過在增強層編碼中進行將大量信息分配給估計誤差譜超過估計聽覺掩蔽的數(shù)量大的頻率的編碼,可以實現(xiàn)量化效率的提高。
現(xiàn)在描述解碼方。圖35是示出根據(jù)本發(fā)明第13實施例的聲音解碼設備的增強層解碼器的內(nèi)部配置的例子的方塊圖。將與圖25中相同的標號指定給圖35中與圖25中的那些相同的部分,并且省略對它們的詳細描述。圖35中的增強層解碼器2305與圖25中的增強層解碼器的不同之處在于,配備了定序部分3401和MDCT系數(shù)解碼器3402,并且,按照估計失真值D(m)的數(shù)量定序頻率確定部分2304供應的頻率。
定序部分3401利用上面的方程(56)計算估計失真值D(m)。定序部分3401具有與上述定序部分3201相同的配置。通過這種配置,可以解碼能夠進行自適應位分配和提高量化效率的上述聲音編碼方法的編碼信息。
MDCT系數(shù)解碼器3402利用按照估計失真值D(m)的數(shù)量定序的頻率信息,解碼從多路分用器2301輸出的第二編碼信息。具體地說,MDCT系數(shù)解碼器3402定位與頻率確定部分2304供應的頻率相對應的解碼MDCT系數(shù),并且,對于其它頻率填上零。然后,IMDCT部分2402對從MDCT系數(shù)解碼器2401獲得的MDCT系數(shù)進行逆MDCT處理,生成時域信號。
疊加加法器2403為了組合將前述信號乘以一個窗口函數(shù),和疊加在前一幀和當前幀中解碼的時域信號,進行相加,并且生成輸出信號。疊加加法器2403將這個輸出信號輸出到加法器2306。
因此,根據(jù)本實施例的聲音解碼設備,通過在增強層編碼中進行按照估計誤差譜超過估計聽覺掩蔽的數(shù)量進行自適應位分配的矢量量化,可以實現(xiàn)量化效率的提高。
(第14實施例)
圖36是示出根據(jù)本發(fā)明第14實施例的聲音編碼設備的增強層編碼器的內(nèi)部配置的例子的方塊圖。將與圖22中相同的標號指定給圖36中與圖22中的那些相同的部分,并且省略對它們的詳細描述。圖36中的增強層編碼器與圖22中的增強層編碼器的不同之處在于,配備了固定頻帶指定部分3501和MDCT系數(shù)量化器3502,并且,與從頻率確定部分1607中獲得的頻率一起量化包括在事先指定的頻帶中的MDCT系數(shù)。
在圖36中,在固定頻帶指定部分3501中事先設置就聽覺感覺而言重要的頻帶。這里假設對于包括在所設頻帶中的頻率,設置“m=15,16”。
MDCT系數(shù)量化器3502在來自MDCT部分2101的輸入信號中,利用從頻率確定部分1607輸出的聽覺掩蔽將輸入信號分類成要量化的系數(shù)和不要量化的系數(shù),并且,編碼要量化的系數(shù),以及固定頻帶指定部分3501設置的頻帶中的系數(shù)。
假設相關頻率成為如圖34所示那樣,MDCT系數(shù)量化器3502量化誤差譜E(1)、E(3)、E(4)、E(7)、E(8)、E(9)、E(11)、E(12)和固定頻帶指定部分3501指定的頻率的誤差譜E(15)、E(16)。
因此,根據(jù)本實施例的聲音編碼設備,通過強迫量化不可能選作量化的對象、但從聽覺的觀點來說重要的頻帶,即使不選擇應該真正選為編碼的對象的頻率,也必定可以量化位于包括在從聽覺的觀點來說重要的頻帶中的頻率上的誤差譜,從而使質(zhì)量得到提高。
現(xiàn)在描述解碼方。圖37是示出根據(jù)本發(fā)明第14實施例的聲音解碼設備的增強層解碼器的內(nèi)部配置的例子的方塊圖。將與圖25中相同的標號指定給圖37中與圖25中的那些相同的部分,并且省略對它們的詳細描述。圖37中的增強層解碼器與圖25中的增強層解碼器的不同之處在于,配備了固定頻帶指定部分3601和MDCT系數(shù)解碼器3602,并且,與從頻率確定部分2304中獲得的頻率一起解碼包括在事先指定的頻帶中的MDCT系數(shù)。
在圖37中,在固定頻帶指定部分3601中事先設置就聽覺感覺而言重要的頻帶。
MDCT系數(shù)解碼器3602根據(jù)從頻率確定部分1607輸出的經(jīng)過解碼的誤差譜頻率,解碼從多路分用器2301輸出的第二編碼信息中量化的MDCT系數(shù)。具體地說,MDCT系數(shù)解碼器3602定位與頻率確定部分2304和固定頻帶指定部分3501所指的頻率相對應的解碼MDCT系數(shù),并且,對于其它頻率填上零。
IMDCT部分2402對從MDCT系數(shù)解碼器3601輸出的MDCT系數(shù)進行逆MDCT處理,生成時域信號,并且將這個信號輸出到疊加加法器2403。
因此,根據(jù)本實施例的聲音解碼設備,通過解碼包括在事先指定的頻帶中的MDCT系數(shù),可以解碼其中已經(jīng)強迫量化了不可能選作量化的對象、但從聽覺的觀點來說重要的頻帶的信號,并且,即使不選擇在編碼方應該真正選為編碼的對象的頻率,也必定可以量化位于包括在從聽覺的觀點來說重要的頻帶中的頻率上的誤差譜,從而使質(zhì)量得到提高。
對于本實施例的增強層編碼器和增強層解碼器,還可以應用將本實施例和第13實施例組合在一起的配置。圖38是示出本實施例的聲音編碼設備的頻率確定部分的內(nèi)部配置的例子的方塊圖。將與圖22中相同的標號指定給圖38中與圖22中的那些相同的部分,并且省略對它們的詳細描述。
在圖38中,MDCT部分2101將從減法器1606輸出的輸入信號乘以分析窗,然后,進行MDCT(改進離散余弦變換)處理以獲得MDCT系數(shù),并且將MDCT系數(shù)輸出到MDCT系數(shù)量化器3701。
定序部分3201接收頻率確定部分1607獲得的頻率信息,并且,計算每個頻率的估計誤差譜E′(m)超過估計聽覺掩蔽M′(m)的數(shù)量(下文稱為“估計失真值”)D(m)。
在固定頻帶指定部分3501中事先設置就聽覺感覺而言重要的頻帶。
MDCT系數(shù)量化器3701進行量化,根據(jù)按照估計失真值D(m)定序的頻率信息,將位成正比地分配給位于按從高到低估計失真值D(m)次序排列的頻率上的誤差譜E(m)。MDCT系數(shù)量化器3701還編碼固定頻帶指定部分3501設置的頻帶中的系數(shù)。
現(xiàn)在描述解碼方。圖39是示出根據(jù)本發(fā)明第14實施例的聲音解碼設備的增強層解碼器的內(nèi)部配置的例子的方塊圖。將與圖25中相同的標號指定給圖39中與圖25中的那些相同的部分,并且省略對它們的詳細描述。
在圖39中,定序部分3401接收頻率確定部分2304獲得的頻率信息,并且,計算每個頻率的估計誤差譜E′(m)超過估計聽覺掩蔽M′(m)的數(shù)量(下文稱為“估計失真值”)D(m)。
然后,定序部分3401按從高到低估計失真值D(m)次序進行定序,并且將相應頻率信息輸出到MDCT系數(shù)解碼器3801。在固定頻帶指定部分3601中事先設置就聽覺感覺而言重要的頻帶。
MDCT系數(shù)解碼器3801根據(jù)從定序部分3401輸出的經(jīng)過解碼的誤差譜頻率,解碼從多路分用器2301輸出的第二編碼信息中量化的MDCT系數(shù)。具體地說,MDCT系數(shù)解碼器3801定位與定序部分3401和固定頻帶指定部分3601所指的頻率相對應的解碼MDCT系數(shù),并且,對于其它頻率填上零。
IMDCT部分2402對從MDCT系數(shù)解碼器3801輸出的MDCT系數(shù)進行逆MDCT處理,生成時域信號,并且將這個信號輸出到疊加加法器2403。
(第15實施例)現(xiàn)在參照附圖描述本發(fā)明的第15實施例。圖40是示出根據(jù)本發(fā)明第15實施例的通信設備的配置的方塊圖。本實施例的特征是圖40中的信號處理設備3903被配置成如上述第1到第14實施例所示的聲音編碼設備之一。
如圖40所示,根據(jù)本發(fā)明第15實施例的通信設備3900包括輸入設備3901、A/D轉(zhuǎn)換設備3902和與網(wǎng)絡3904連接的信號處理設備3903。
A/D轉(zhuǎn)換設備3902與輸入設備3901的輸出端相連接。信號處理設備3903的輸入端與A/D轉(zhuǎn)換設備3902的輸出端相連接。信號處理設備3903的輸出端與網(wǎng)絡3904相連接。
輸入設備3901將人耳朵可聽見的聲波轉(zhuǎn)換成作為電信號的模擬信號,并且將這個模擬信號供應給A/D轉(zhuǎn)換設備3902。A/D轉(zhuǎn)換設備3902將模擬信號轉(zhuǎn)換成數(shù)字信號,并且將這個數(shù)字信號供應給信號處理設備3903。信號處理設備3903編碼輸入數(shù)字信號和生成代碼,并且將這個代碼輸出到網(wǎng)絡3904。
因此,根據(jù)本發(fā)明這個實施例的通信設備,可以在通信過程中獲得像上述第1到第14實施例所示那樣的效果,并且,可以提供用少量的位有效編碼聲信號的聲音編碼設備。
(第16實施例)現(xiàn)在參照附圖描述本發(fā)明的第16實施例。圖41是示出根據(jù)本發(fā)明第16實施例的通信設備的配置的方塊圖。本實施例的特征是圖41中的信號處理設備4003被配置成如上述第1到第14實施例所示的聲音解碼設備之一。
如圖41所示,根據(jù)本發(fā)明第16實施例的通信設備4000包括與網(wǎng)絡4001連接的接收設備4002、信號處理設備4003、D/A轉(zhuǎn)換設備4004和輸出設備4005。
接收設備4002與網(wǎng)絡4001相連接。信號處理設備4003的輸入端與接收設備4002的輸出端相連接。D/A轉(zhuǎn)換設備4004的輸入端與信號處理設備4003的輸出端相連接。輸出設備4005的輸入端與D/A轉(zhuǎn)換設備4004的輸出端相連接。
接收設備4002接收來自網(wǎng)絡4001的數(shù)字編碼聲信號,生成數(shù)字接收聲信號,并且將這個接收聲信號供應給信號處理設備4003。信號處理設備4003接收來自接收設備4002的接收聲信號,對這個接收聲信號進行解碼處理和生成數(shù)字解碼聲信號,并且將這個數(shù)字解碼聲信號供應給D/A轉(zhuǎn)換設備4004。D/A轉(zhuǎn)換設備4004轉(zhuǎn)換來自信號處理設備4003的數(shù)字解碼聲信號和生成模擬解碼語音信號,并且將這個模擬解碼語音信號供應給輸出設備4005。輸出設備4005將作為電信號的模擬解碼語音信號轉(zhuǎn)換成空氣振動,并且像聲波那樣輸出這些空氣振動,以便人的耳朵可聽見。
因此,根據(jù)本施例的通信設備,可以在通信過程中獲得像上述第1到第14實施例所示那樣的效果,并且,可以解碼用少量的位有效編碼的聲信號,從而輸出良好的聲信號。
(第17實施例)現(xiàn)在參照附圖描述本發(fā)明的第17實施例。圖42是示出根據(jù)本發(fā)明第17實施例的通信設備的配置的方塊圖。本實施例的特征是圖42中的信號處理設備4103被配置成如上述第1到第14實施例所示的聲音編碼設備之一。
如圖42所示,根據(jù)本發(fā)明第17實施例的通信設備4100包括輸入設備4101、A/D轉(zhuǎn)換設備4102和信號處理設備4103、RF(射頻)調(diào)制設備4104和天線4105。
輸入設備4101將人耳朵可聽見的聲波轉(zhuǎn)換成作為電信號的模擬信號,并且將這個模擬信號供應給A/D轉(zhuǎn)換設備4102。A/D轉(zhuǎn)換設備4102將模擬信號轉(zhuǎn)換成數(shù)字信號,并且將這個數(shù)字信號供應給信號處理設備4103。信號處理設備4103編碼輸入數(shù)字信號和生成編碼聲信號,并且將這個編碼聲信號輸出到RF調(diào)制設備4104。RF調(diào)制設備4104調(diào)制編碼聲信號和生成調(diào)制編碼聲信號,并且將這個調(diào)制編碼聲信號供應給天線4105。天線4105發(fā)送該調(diào)制編碼聲信號作為無線電波。
因此,根據(jù)本實施例的通信設備,可以在無線電通信過程中獲得像上述第1到第14實施例所示那樣的效果,并且,可以用少量的位有效編碼聲信號。
(第18實施例)現(xiàn)在參照附圖描述本發(fā)明的第18實施例。圖43是示出根據(jù)本發(fā)明第18實施例的通信設備的配置的方塊圖。本實施例的特征是圖43中的信號處理設備4203被配置成如上述第1到第14實施例所示的聲音解碼設備之一。
如圖43所示,根據(jù)本發(fā)明第18實施例的通信設備4200包括天線4201、RF解調(diào)設備4202、信號處理設備4203、D/A轉(zhuǎn)換設備4204和輸出設備4205。
天線4201接收作為無線電波的數(shù)字編碼聲信號,生成作為電信號的數(shù)字接收編碼聲信號,并且將這個數(shù)字接收編碼聲信號供應給RF解調(diào)設備4202。RF解調(diào)設備4202解調(diào)來自天線4201的接收編碼聲信號和生成解調(diào)編碼聲信號,并且將這個解調(diào)編碼聲信號供應給信號處理設備4203。
信號處理設備4203接收來自RF解調(diào)設備4202的數(shù)字解調(diào)編碼聲信號,進行解碼處理和生成數(shù)字解碼聲信號,并且將這個數(shù)字解碼聲信號供應給D/A轉(zhuǎn)換設備4204。D/A轉(zhuǎn)換設備4204轉(zhuǎn)換來自信號處理設備4203的數(shù)字解碼聲信號和生成模擬解碼語音信號,并且將這個模擬解碼語音信號供應給輸出設備4205。輸出設備4205將作為電信號的模擬解碼語音信號轉(zhuǎn)換成空氣振動,并且像聲波那樣輸出這些空氣振動,以便人的耳朵可聽見。
因此,根據(jù)本施例的通信設備,可以在無線電通信過程中獲得像上述第1到第14實施例所示那樣的效果,并且,可以解碼用少量的位有效編碼的聲信號,從而輸出良好的聲信號。
本發(fā)明可應用于使用音頻信號的接收設備、接收解碼設備、或語音信號解碼設備。本發(fā)明還可應用于移動臺設備或基站設備。
本發(fā)明不局限于上述的實施例,并且,在不偏離本發(fā)明范圍的情況下,可以進行各種各樣的改變和改進。例如,在上面的實施例中,已經(jīng)描述了將本發(fā)明作為信號處理設備來實現(xiàn)的情況,但是,本發(fā)明不局限于此,并且,也可以將這種信號處理方法作為軟件來實現(xiàn)。
例如,事先將執(zhí)行上述信號處理方法的程序存儲在ROM(只讀存儲器)中,和由CPU(中央處理單元)執(zhí)行這個程序也是可以的。
將執(zhí)行上述信號處理方法的程序存儲在計算機可讀存儲媒體中,將存儲在存儲媒體中的程序記錄在計算機的RAM(隨機訪問存儲器)中,和按照那個程序操作計算機也是可以的。
在上面的描述中,已經(jīng)描述了MDCT用作從時域變換到頻域的方法,但是,本發(fā)明不局限于此,只要是正交的,可以應用任何變換方法。例如,也可以應用離散付里葉變換、離散余弦變換或小波變換方法。
本發(fā)明可應用于使用音頻信號的接收設備、接收解碼設備、或語音信號解碼設備。本發(fā)明還可應用于移動臺設備或基站設備。
從上面的描述中可清楚看出,根據(jù)本發(fā)明的編碼設備,解碼設備、編碼方法和解碼方法,通過利用從基本層編碼信息中獲得的信息進行增強層編碼,即使在語音占優(yōu)勢和在背景中疊加了音樂或環(huán)境聲音的信號的情況下,也可以以低位速率進行高質(zhì)編碼。
本申請基于2002年4月26日提出的日本專利申請第2002-127541號和2002年9月12日提出的日本專利申請第2002-267436號,特此全文引用,以供參考。
工業(yè)可應用性本發(fā)明適用于編碼和解碼語音信號的設備和通信設備。
權(quán)利要求
1.一種編碼設備,包括向下取樣部分,用于降低輸入信號的取樣速率;基本層編碼部分,用于編碼取樣速率降低了的輸入信號和獲取第一編碼信息;解碼部分,用于根據(jù)所述第一編碼信息生成解碼信號;向上取樣部分,用于將所述解碼信號的取樣速率升高到與所述輸入信號的取樣速率相同的速率;增強層編碼部分,用于利用在所述解碼部分的解碼處理中生成的參數(shù),編碼所述輸入信號和取樣速率升高了的所述解碼信號之間的差值,并獲取第二編碼信息;和多路復用部分,用于多路復用所述第一編碼信息和所述第二編碼信息。
2.根據(jù)權(quán)利要求1所述的編碼設備,其中,所述基本層編碼部分利用碼激勵線性預測編碼輸入信號。
3.根據(jù)權(quán)利要求1所述的編碼設備,其中,所述增強層編碼部分利用正交變換編碼輸入信號。
4.根據(jù)權(quán)利要求3所述的編碼設備,其中,所述增強層編碼部分利用MDCT處理編碼輸入信號。
5.根據(jù)權(quán)利要求1到4任何一項所述的編碼設備,其中,所述增強層編碼部分利用在所述解碼部分的解碼處理中生成的基本層LPC系數(shù)進行編碼處理。
6.根據(jù)權(quán)利要求5所述的編碼設備,其中,所述增強層編碼部分根據(jù)預置轉(zhuǎn)換表將基本層LPC系數(shù)轉(zhuǎn)換成增強層LPC系數(shù),根據(jù)增強層LPC系數(shù)計算譜包絡,并且在編碼處理中將所述譜包絡用在譜歸一化或矢量量化的至少一個中。
7.根據(jù)權(quán)利要求1所述的編碼設備,其中,所述增強層編碼部分利用在所述解碼部分的解碼處理中生成的音調(diào)周期和音調(diào)增益進行編碼處理。
8.根據(jù)權(quán)利要求7所述的編碼設備,其中,所述增強層編碼部分利用音調(diào)周期和音調(diào)增益計算譜精細結(jié)構(gòu),并且在編碼處理中將所述譜精細結(jié)構(gòu)用在譜歸一化和矢量量化中。
9.根據(jù)權(quán)利要求1所述的編碼設備,其中,所述增強層編碼部分利用所述解碼部分生成的解碼信號的功率進行編碼處理。
10.根據(jù)權(quán)利要求9所述的編碼設備,其中,所述增強層編碼部分根據(jù)解碼信號的功率量化MDCT系數(shù)的功率漲落量,并且在編碼處理中將所述量化MDCT系數(shù)功率漲落量用在功率歸一化中。
11.根據(jù)權(quán)利要求1所述的聲音編碼設備,進一步包括相減部分,用于從輸入時的輸入信號和取樣速率升高了的解碼信號的差值中獲取誤差信號;和頻率確定部分,用于根據(jù)取樣速率升高了的解碼信號確定經(jīng)過所述誤差信號的編碼的頻率,其中,所述增強層編碼部分以所述頻率編碼所述誤差信號。
12.根據(jù)權(quán)利要求11所述的聲音編碼設備,進一步包括聽覺掩蔽部分,用于計算指示對聽力沒有貢獻的幅度值的聽覺掩蔽;其中,所述增強層編碼部分在所述頻率確定部分中確定編碼的對象以便不使所述聽覺掩蔽內(nèi)的信號成為編碼的對象,并編碼作為所述誤差信號的頻譜的誤差譜。
13.根據(jù)權(quán)利要求12所述的聲音編碼設備,其中所述聽覺掩蔽部分包括頻域變換部分,用于將取樣速率升高了的解碼信號變換成頻域系數(shù);估計聽覺掩蔽計算部分,用于利用所述頻域系數(shù)計算估計聽覺掩蔽;和確定部分,用于求出所述解碼信號的頻譜的幅度值超過所述估計聽覺掩蔽的幅度值的頻率,并且所述增強層編碼部分編碼位于所述頻率上的所述誤差譜。
14.根據(jù)權(quán)利要求13所述的聲音編碼設備,其中所述聽覺掩蔽部分包括利用所述頻域系數(shù)計算估計誤差譜的估計誤差譜計算部分;和所述確定部分求出所述估計誤差譜的幅度值超過所述估計聽覺掩蔽的幅度值的頻率。
15.根據(jù)權(quán)利要求13所述的聲音編碼設備,其中所述聽覺掩蔽部分包括使所述估計聽覺掩蔽計算部分計算的估計聽覺掩蔽變平滑的校正部分;和所述確定部分求出所述解碼信號譜或所述估計誤差譜的幅度值超過平滑化所述估計聽覺掩蔽的幅度值的頻率。
16.根據(jù)權(quán)利要求13所述的聲音編碼設備,其中,所述增強層編碼部分為每個頻率計算估計誤差譜或誤差譜和聽覺掩蔽或估計聽覺掩蔽之間的幅度值差,和根據(jù)所述幅度值差的數(shù)量確定編碼信息量。
17.根據(jù)權(quán)利要求13所述的聲音編碼設備,其中,所述增強層編碼部分編碼預定頻帶中的所述誤差譜,以及所述確定部分求出的頻率。
18.一種解碼設備,包括基本層解碼部分,用于解碼編碼方以預定基本幀為單位編碼輸入信號的第一編碼信息,并獲取第一解碼信號;增強層解碼部分,用于解碼第二編碼信息,和獲取第二解碼信號;向上取樣部分,用于將所述第一解碼信號的取樣速率升高到與所述第二解碼信號的取樣速率相同的速率;和相加部分,用于相加取樣速率升高了的所述第一解碼信號和所述第二解碼信號。
19.根據(jù)權(quán)利要求18所述的解碼設備,其中,所述基本層解碼部分解碼通過碼激勵線性預測生成的第一編碼信息。
20.根據(jù)權(quán)利要求18所述的解碼設備,其中,所述增強層解碼部分利用正交變換解碼第二編碼信息。
21.根據(jù)權(quán)利要求20所述的解碼設備,其中,所述增強層解碼部分利用逆MDCT處理解碼第二編碼信息。
22.根據(jù)權(quán)利要求18所述的解碼設備,其中,所述增強層解碼部分利用基本層LPC系數(shù)解碼第二編碼信息。
23.根據(jù)權(quán)利要求22所述的解碼設備,其中,所述增強層解碼部分根據(jù)預置轉(zhuǎn)換表將基本層LPC系數(shù)轉(zhuǎn)換成增強層LPC系數(shù),根據(jù)增強層LPC系數(shù)計算譜包絡,并在解碼處理中將所述譜包絡用在矢量解碼中。
24.根據(jù)權(quán)利要求18所述的解碼設備,其中,所述增強層解碼部分利用音調(diào)周期或音調(diào)增益的至少一個進行解碼處理。
25.根據(jù)權(quán)利要求24所述的解碼設備,其中,所述增強層解碼部分利用音調(diào)周期和音調(diào)增益計算譜精細結(jié)構(gòu),并在解碼處理中將所述譜精細結(jié)構(gòu)用在矢量解碼中。
26.根據(jù)權(quán)利要求24所述的解碼設備,其中,所述增強層解碼部分利用所述解碼部分生成的解碼信號的功率進行解碼處理。
27.根據(jù)權(quán)利要求26所述的解碼設備,其中,所述增強層解碼部分根據(jù)解碼信號的功率解碼MDCT系數(shù)的功率漲落量,并在解碼處理中將所述解碼MDCT系數(shù)功率漲落量用在功率歸一化中。
28.根據(jù)權(quán)利要求18所述的聲音解碼設備,進一步包括頻率確定部分,用于根據(jù)所述向上取樣第一解碼信號,確定經(jīng)過編碼方編碼輸入信號和解碼第一編碼信息所得的信號的殘留誤差信號的第二編碼信息的解碼的頻率,其中所述增強層解碼部分利用所述頻率信息解碼所述第二編碼信息和生成第二解碼信號;和所述相加部分相加所述第二解碼信號和取樣速率升高了的第一解碼信號。
29.根據(jù)權(quán)利要求28所述的聲音解碼設備,進一步包括聽覺掩蔽部分,用于計算指示對聽力沒有貢獻的幅度值的聽覺掩蔽,其中,所述增強層解碼部分在所述頻率確定部分中確定解碼的對象以便不使所述聽覺掩蔽內(nèi)的信號成為解碼的對象。
30.根據(jù)權(quán)利要求29所述的聲音解碼設備,其中所述聽覺掩蔽部分包括頻域變換部分,用于將取樣速率升高了的基本層解碼信號變換成頻域系數(shù);估計聽覺掩蔽計算部分,用于利用所述頻域系數(shù)計算估計聽覺掩蔽;和確定部分,用于求出所述解碼信號的頻譜的幅度值超過所述估計聽覺掩蔽的幅度值的頻率,并且所述增強層解碼部分解碼位于所述頻率上的所述誤差譜。
31.根據(jù)權(quán)利要求30所述的聲音解碼設備,其中所述聽覺掩蔽部分包括利用所述頻域系數(shù)計算估計誤差譜的估計誤差譜計算部分;和所述確定部分求出所述估計誤差譜的幅度值超過所述估計聽覺掩蔽的幅度值的頻率。
32.根據(jù)權(quán)利要求30所述的聲音解碼設備,其中所述聽覺掩蔽部分包括使所述估計聽覺掩蔽計算部分計算的估計聽覺掩蔽變平滑的校正部分;和所述確定部分求出所述解碼信號譜或所述估計誤差譜的幅度值超過平滑化所述估計聽覺掩蔽的幅度值的頻率。
33.根據(jù)權(quán)利要求29所述的聲音解碼設備,其中,所述增強層解碼部分為每個頻率計算估計誤差譜或誤差譜和聽覺掩蔽或估計聽覺掩蔽之間的幅度值差,和根據(jù)所述幅度值差的數(shù)量確定解碼信息量。
34.根據(jù)權(quán)利要求29所述的聲音解碼設備,其中,所述增強層解碼部分解碼預定頻帶中的所述誤差譜,以及所述確定部分求出的頻率。
35.一種聲信號發(fā)送設備,包括聲輸入部分,用于將聲信號轉(zhuǎn)換成電信號;A/D轉(zhuǎn)換部分,用于將從所述聲輸入部分輸出的信號轉(zhuǎn)換成數(shù)字信號;根據(jù)權(quán)利要求1所述的編碼設備,用于編碼從所述A/D轉(zhuǎn)換部分輸出的信號;RF調(diào)制部分,用于將從所述編碼設備輸出的編碼信息調(diào)制成射頻信號;和發(fā)送天線,用于將從所述RF調(diào)制部分輸出的信號轉(zhuǎn)換成無線電波,和發(fā)送那個無線電波。
36.一種聲信號接收設備,包括接收天線,用于接收無線電波;RF解調(diào)部分,用于解調(diào)所述接收天線接收的信號;根據(jù)權(quán)利要求18所述的解碼設備,用于解碼所述RF解調(diào)部分獲得的信息;D/A轉(zhuǎn)換部分,用于將從所述解碼部分輸出的信號轉(zhuǎn)換成模擬信號;和聲輸出部分,用于將從所述D/A轉(zhuǎn)換部分輸出的電信號轉(zhuǎn)換成聲信號。
37.一種通信終端設備,包括根據(jù)權(quán)利要求35所述的聲信號發(fā)送設備。
38.一種通信終端設備,包括根據(jù)權(quán)利要求36所述的聲信號接收設備。
39.一種基站設備,包括根據(jù)權(quán)利要求35所述的聲信號發(fā)送設備。
40.一種移動臺設備,包括根據(jù)權(quán)利要求36所述的聲信號接收設備。
41.一種編碼方法,包括降低輸入信號的取樣速率的步驟;編碼取樣速率降低了的輸入信號和獲取第一編碼信息的步驟;根據(jù)所述第一編碼信息生成解碼信號的步驟;將所述解碼信號的取樣速率升高到與所述輸入信號的取樣速率相同的速率的步驟;利用在生成所述解碼信號的處理中獲得的參數(shù),編碼所述輸入信號和取樣速率升高了的所述解碼信號之間的差值,并獲取第二編碼信息的步驟;和多路復用所述第一編碼信息和所述第二編碼信息的步驟。
42.一種解碼方法,包括解碼第一編碼信息和獲取第一解碼信號的步驟;解碼第二編碼信息和獲取第二解碼信號的步驟;將所述第一解碼信號的取樣速率升高到與所述第二解碼信號的取樣速率相同的速率的步驟;和相加取樣速率升高了的所述第一解碼信號和所述第二解碼信號的步驟。
全文摘要
向下取樣器(101)將輸入信號的取樣速率從取樣速率FH降低到取樣速率FL?;緦泳幋a器(102)編碼取樣速率FL的聲信號。局部解碼器(103)解碼從基本層編碼器(102)輸出的編碼信息。向上取樣器(104)將解碼信號的取樣速率升高到FH。減法器(106)從取樣速率FH的聲信號中減去解碼信號。增強層編碼器(107)利用從局部解碼器(103)輸出的解碼所得參數(shù)編碼從減法器(106)輸出的信號。
文檔編號G10L19/24GK1650348SQ0380937
公開日2005年8月3日 申請日期2003年4月28日 優(yōu)先權(quán)日2002年4月26日
發(fā)明者押切正浩 申請人:松下電器產(chǎn)業(yè)株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1