專利名稱::話音信號編碼器和話音信號解碼器的制作方法
技術領域:
:本發(fā)明涉及高效編碼和解碼話音信息用的話音信號編碼器和話音信號解碼器。
背景技術:
:當今,正在開發(fā)高效編碼和解碼話音信息用的話音編碼技術?!洞a激勵線性預測低比特率高質(zhì)量話音》(CodeExcitedLinearPrediction:HighQualitySpeechatLowBitRate)(M.R.Schroeder著;發(fā)表于ICASSP,85,pp.937~940)中記載著基于這種話音編碼技術的CELP型話音信號編碼器。此話音信號編碼器對用固定時間劃分輸入話音所得的每一幀進行線性預測,由每幀的線性預測求預測殘差(激勵信號),并用存放過去驅(qū)動音源的自適應碼本和存放多個噪聲碼矢量的噪聲碼本將該預測殘差編碼。圖1中示出以往的CELP型話音信號編碼器(下文簡稱為"話音編碼器")的功能框圖。線性預測分析單元12對此CELP型話音信號編碼器中輸入的話音信號11進行線性預測分析。利用該線性預測分析,可取得線性預測系數(shù)。線性預測系數(shù)為表示話音信號11的頻譜包絡特性的參數(shù)。線性預測分析單元12所得的線性預測系數(shù)在線性預測系數(shù)編碼單元13進行量化,并將量化后的線性預測系數(shù)送到線性預測系數(shù)解碼單元14。又將量化所得量化號作為線性預測碼輸入到編碼輸出單元24。線性預測系數(shù)解碼單元M將線性預測系數(shù)編碼單元13所得量化線性預測系數(shù)解碼后,取得合成濾波器的系數(shù),線性預測系數(shù)解碼單元14將合成濾波器的系數(shù)輸出到合成濾波器15。自適應碼本17為輸出多種候補自適應碼矢量的碼本,由存放過去的多幀驅(qū)動音源的緩存器構成。自適應碼矢量為表現(xiàn)輸入話音中周期分量的時間序列噪聲碼本18為存放多種候補噪聲碼矢量的碼本,其種類對應于所分配的比特數(shù)。噪聲碼矢量為表現(xiàn)輸入話音中非周期分量的時間序列矢量。自適應碼增益加權單元19和噪聲碼增益加權單元20分別對自適應碼本17和噪聲碼本18輸出的候補矢量乘以從加權碼本21讀出的自適應增益和噪聲碼增益后,輸出到加法器22。加權碼本是一種存儲器,分別存放多種與候補自適應碼矢量相乘的加權數(shù)和與候補噪聲碼矢量相乘的加權數(shù),其種類對應于所分配的比特數(shù)。加法器22將分別在自適應碼增益加權單元19、噪聲碼增益加權單元20加權后的候補自適應碼矢量和候補噪聲碼矢量相加,產(chǎn)生候補驅(qū)動音源矢量,并輸出到合成濾波器15。合成濾波器15為由線性預測系數(shù)解碼單元14所得的合成濾波器系數(shù)構成的全極型濾波器。合成濾波器15具有一種功能,輸入來自加法器22的候補驅(qū)動音源矢量時,輸出候補合成話音矢量。失真計算單元16計算合成濾波器15的輸出(即候補合成話音矢量)與輸入話音ll之間的失真,所得失真值輸出到碼號規(guī)定單元23。碼號規(guī)定單元23分別對三種碼本(自適應碼本、噪聲碼本和加權碼本)規(guī)定使失真計算單元16中算出的失真最小的三種碼號(自適應碼號、噪聲碼號和加權碼號)。然后,將碼號規(guī)定單元23所規(guī)定的三種碼號輸出到編碼輸出單元24。編碼輸出單元24匯合線性預測系數(shù)編碼單元13所得的線性預測碼號以及碼號規(guī)定單元23所規(guī)定的自適應碼號、噪聲碼號和加權碼號,并輸出到傳輸線路。圖2中示出對上述編碼器編碼的信號進行解碼的CELP型話音信號解碼器(下文簡稱為"話音解碼器")的功能框圖。此話音信號解碼器中,編碼輸入單元31接收話音信號編碼器(圖l)送來的編碼,將接收到的編碼分解為線性預測碼號、自適應碼號、噪聲碼號和加權碼號,并將分解所得編碼分別輸出到線性預測系數(shù)解碼單元32、自適應碼本33、噪聲碼本34和加權碼本35。接著,線性預測系數(shù)解碼單元32將編碼輸入單元31所得線性預測碼號解碼后,取得合成濾波器系數(shù),并輸出到合成濾波器39。然后,從自適應碼本中與自適應碼號對應的位置讀出自適應碼矢量,從噪聲碼本讀出與噪聲碼號對應的噪聲碼矢量,進而從加權碼本讀出加權碼號對應的自適應碼增益和噪聲碼增益。而且,在自適應碼加權單元36將自適應碼矢量乘以自適應碼增益后,送到加法器38。同樣,在噪聲碼矢量加權單元37將噪聲碼矢量乘以噪聲碼增益后,送到加法器38。加法器38將上述兩個編碼矢量相加后,產(chǎn)生驅(qū)動音源矢量,并將產(chǎn)生的驅(qū)動音源送到自適應碼本33,以更新緩存器,該驅(qū)動音源也送到合成濾波器39,以驅(qū)動濾波器。合成濾波器39由加法器38所得驅(qū)動音源矢量驅(qū)動,并用線性預測系數(shù)解碼單元32的輸出再現(xiàn)合成話音。在CELP型話音信號編碼器的失真計算單元16—般利用下式(式l)計算所求失真E:EK一(卵〃P+gc〃C)V:輸入話音信號(矢量)H-合成濾波器脈沖響應巻積矩陣(1)力(0)力(1)力(2)0力(0)力(1)0<formula>formulaseeoriginaldocumentpage6</formula>其中,h為合成濾波器的脈沖響應(矢量),L為幀長度,p:自適應碼矢量C:噪聲碼矢量ga:自適應碼增益gC:噪聲碼增益這里,為了使式(I)的失真E最小,需要對自適應碼號、噪聲碼號和加權碼號的全部組合用閉環(huán)計算失真,規(guī)定各碼號。然而,對式(l)進行閉環(huán)檢索,則運算處理量過大,因而一般首先用自適應碼本由矢量量化規(guī)定自適應碼號,其次由采用噪聲碼本的矢量量化規(guī)定噪聲碼號,最后由采用加權碼本的矢量量化規(guī)定加權碼號?,F(xiàn)就這種情況下,對采用噪聲碼本的矢量量化處理作進一步詳細說明。自適應碼號和自適應碼增益預先確定或暫時確定時,式(l)的失真估算式變?yōu)橄旅娴氖?2)。Ec=X-gcHC(2)其中,式(2)內(nèi)的矢量X為采用預先規(guī)定或暫時規(guī)定的自適應碼號和自適應碼增益,并由下列式(3)求得的噪聲源信息(規(guī)定噪聲碼號用的目標矢量)。X=V—gaHP(3)ga:自適應碼增益V-話音信號(矢量)H:合成濾波器脈沖響應巻積矩陣P:自適應碼矢量在規(guī)定噪聲碼號后規(guī)定噪聲碼增益gC的情況下,一般知道可假設式(2)中的gc能取任意值,使式(2)最小的規(guī)定噪聲碼矢量號的處理(噪聲源信息的矢量量化處理)可置換為規(guī)定使下式(4)的分數(shù)式最大的噪聲碼矢量號。(n)2M、艮p,在自適應碼號和自適應碼增益先前已有或暫時規(guī)定的情況下,噪聲源信息矢量量化處理成為規(guī)定使失真計算單元16算出的式(4)分數(shù)式最大的候補噪聲碼矢量號的處理。初期的CELP型編碼器/解碼器中,將存儲器中存儲種類與所分配比特數(shù)對應的隨機數(shù)序列所得的數(shù)據(jù)用作噪聲碼本。然而,存在以下課題需要非常大的存儲容量,同時對各候補噪聲碼矢量計算式(4)的失真用的運算處理量龐大。作為解決此課題的一種方法,可舉出《采用IO毫秒話音幀的8kb/sACELP話音編碼候選CCITT標準》("8KBIT/SACELPCODINGOFSPEECHWITH10MSSPEECH-FRAME:ACANDIDATEFORCCITTSTANDARDIZATION")(R.Salami.C.Laflamme和J-P.Adoul著,刊登于ICASSP,94,pp.II-97~II-100,1994)等中所記載那樣,采用以代數(shù)方式產(chǎn)生音源矢量的代數(shù)音源矢量生成單元的CELP型話音信號編碼器/解碼器。然而,噪聲碼本采用上述代數(shù)音源生成單元的CELP型話音信號編碼器/解碼器中,常以少量脈沖近似表現(xiàn)由式(3)求得的噪聲源信息(規(guī)定噪聲碼號的目標矢量),因而在謀求改善話音質(zhì)量方面存在局限。實際察看式(3)中噪聲源信息X的要素,則幾乎沒有僅用少量脈沖構成該要素的情況。由此可說明存在局限。
發(fā)明內(nèi)容本發(fā)明的目的在于提供一種新的音源矢量生成裝置,該裝置能產(chǎn)生與實際分析話音信號時所得音源矢量的形狀和統(tǒng)計相似性高的音源矢量。本發(fā)明的又一目的在于提供一種CELP話音信號編碼器/解碼器、話音信號通信系統(tǒng)和話音信號記錄系統(tǒng),它們通過將上述音源矢量生成裝置用作噪聲碼本,可獲得比代數(shù)音源生成單元用作噪聲碼本時品質(zhì)高的合成話音。本發(fā)明第1形態(tài)是一種音源矢量生成裝置,其特征在于,包括具有N個(N2l)生成在矢量軸上某一要素建立帶極性單元脈沖的脈沖矢量的通道的脈沖矢量生成單元;具有存儲所述N中每一個通道M(M2l)種擴散模式的功能,同時具有從所存M種擴散模式選擇一種擴散模式的功能的擴散模式存儲選擇單元;具有每一通道進行所述脈沖矢量生成單元所輸出脈沖矢量與所述擴散模式存儲選擇單元所選擇擴散模式的巻積運算,并產(chǎn)生N個擴散矢量的功能的脈沖矢量擴散單元;具有將所述脈沖矢量擴散單元產(chǎn)生的N個擴散矢量相加后,產(chǎn)生音源矢量的功能的擴散矢量加法器。使所述脈沖矢量生成單元具有以代數(shù)方式產(chǎn)生N個脈沖矢量(N2l)的功能,再加上所述擴散模式存儲選擇單元預先存儲通過預先學習實際話音矢量的形狀(特性)獲得的擴散模式,因而可產(chǎn)生形狀比以往的代數(shù)音源生成單元更好地接近實際音源矢量形狀的音源矢量。本發(fā)明第2形態(tài)是一種CELP話音信號編碼器/解碼器,其特征在于,噪聲碼本中采用所述音源矢量生成裝置。與以往噪聲碼本中采用代數(shù)音源生成單元的話音信號編碼器/解碼器相比,能產(chǎn)生更接近實際形狀的音源矢量,因此,能取得可輸出質(zhì)量更高的合成話音的話音信號編碼器/解碼器、話音信號通信系統(tǒng)和話音信號記錄系統(tǒng)。依照本發(fā)明的一個方面,提供了用于話音信號編碼器或話音信號解碼器的擴散矢量發(fā)生器。所述擴散矢量發(fā)生器包括脈沖矢量提供單元,用于提供在矢量軸的某一要素上具有帶極性單元脈沖的脈沖矢量;擴散模式選定單元,用于在開始編碼或解碼處理之前從所預定的波形組選定一擴散模式;和擴散矢量生成單元,用于對所述脈沖矢量和所述選定的擴散模式進行巻積運算生成擴散矢量,所述波形的長度比子幀的長度短。依照本發(fā)明的另一方面,提供了用于話音信號編碼器或話音信號解碼器、生成擴散矢量的方法。所述方法包括下述步驟脈沖矢量提供步驟,提供在矢量軸的某一要素上具有帶極性單元脈沖的脈沖矢量;擴散模式選定步驟,在開始編碼或解碼處理之前從所預定的波形組選定一擴散模式;和擴散矢量生成步驟,對所述脈沖矢量和所述選定的擴散模式進行巻積運算生成擴散矢量,所述波形的長度比子幀的長度短。圖1為以往的CELP型話音信號編碼器的功能框圖。圖2為以往的CELP型話音信號解碼器的功能框圖。圖3為本發(fā)明第1實施形態(tài)有關音源矢量生成裝置的功能框圖。圖4為本發(fā)明第2實施形態(tài)有關CELP型話音信號編碼器的功能框圖。圖5為本發(fā)明第2實施形態(tài)有關CELP型話音信號解碼器的功能框圖。圖6為本發(fā)明第3實施形態(tài)有關CELP型話音信號編碼器的功能框圖。圖7為本發(fā)明第4實施形態(tài)有關CELP型話音信號編碼器的功能框圖。圖8為本發(fā)明第5實施形態(tài)有關CELP型話音信號編碼器的功能框圖。圖9為第5實施形態(tài)中矢量量化功能的框圖。圖IO為第5實施形態(tài)中提取目標的算法的說明圖。圖11為第5實施形態(tài)中預測量化的功能框圖。圖12為第6實施形態(tài)中預測量化的功能框圖。圖13為第7實施形態(tài)中CELP型話音信號編碼器的功能框圖。圖14為第7實施形態(tài)中失真計算單元的功能框圖。具體實施例方式下面利用本發(fā)明的實施形態(tài)。(第1實施形態(tài))圖3中示出本發(fā)明實施形態(tài)有關音源矢量生成裝置的功能框圖。此音源矢量生成裝置包括具有多個通道的脈沖矢量生成單元101;具有擴散模式存儲單元和開關的擴散模式存儲選擇單元102;擴散脈沖矢量的脈沖矢量擴散單元103;將擴散的多個通道脈沖矢量相加的擴散矢量加法器104。脈沖矢量生成單元101具有N個通道(本實施形態(tài)中對N二3的情況進行說明),這些通道生成在矢量軸上某一要素配置帶極性單元脈沖的矢量(下文稱為脈沖矢量)。擴散模式存儲選擇單元102具有存儲單元MlM3和開關SW1~SW3,前者對每一通道存儲M種擴散模式(本實施形態(tài)中對M=2的情況迸行說明),后者從各存儲單元Ml~M3分別選擇M種擴散模式中的一種擴散模式。脈沖矢量擴散單元103對每一通道進行脈沖矢量生成單元101所輸出脈沖矢量與擴散模式存儲選擇單元102所輸出擴散模式的巻積運算,并產(chǎn)生N個擴散矢量。擴散矢量加法器104將脈沖矢量擴散單元103生成的N個擴散矢量相加后,生成音源矢量105。本實施形態(tài)中,對脈沖矢量生成單元101按照下列表1所記載規(guī)則以代數(shù)方式產(chǎn)生N個脈沖矢量(N二3)的情況進行說明。表1<table>tableseeoriginaldocumentpage10</column></row><table>說明上文所述那樣構成的音源矢量生成裝置的運作。擴散模式存儲選擇單元102從每通道分別存儲2種的擴散模式中選擇1種,并輸出到脈沖矢量擴散單元103。但,對應于選擇的擴散模式組合(組合總數(shù)MN=8種),專門分配號碼。接著,脈沖矢量生成單元101按照表1記載的規(guī)則,以代數(shù)方式生成通道數(shù)量份額的脈沖矢量(本實施形態(tài)中為3)。脈沖矢量擴散單元103將擴散模式存儲選擇單元102選擇的擴散模式和脈沖矢量生成單元101生成的脈沖用式(5)作巻積運算,對每一通道生成擴散矢量。<formula>formulaseeoriginaldocumentpage11</formula>(5)其中,n:0~L—1L:擴散矢量長度i:通道號j:擴散模式號(j=l~M)Ci:通道i的擴散矢量Wij:通道i的第j種擴散模式Wij(m)的矢量長度為2L-l(m:—(L-1)L一1),但,2L—1個要素中能規(guī)定值的是Lij要素,其它要素為零di:通道i的脈沖矢量di=±5(n—pi),n=0~L_lpi:通道i的候補脈沖矢量擴散矢量加法器104利用公式(6)將脈沖矢量擴散單元103生成的3個擴散矢量相加后,產(chǎn)生音源矢量105。,=Sci(")(6)C:音源矢量d:擴散矢量i:通道號(i-1~N)n:矢量要素號(n二0L一l,其中L為音源矢量長度)這樣構成的音源矢量生成裝置,通過使擴散模式存儲選擇單元102所選擇擴散模式的組合方法以及脈沖矢量生成單元101所生成脈沖矢量中的脈沖位置和極性帶有變化,可產(chǎn)生多樣的音源矢量。于是,以上那樣構成的音源矢量生成裝置,對擴散模式存儲選擇單元102所選擇擴散模式的組合方法和脈沖矢量生成單元101所生成脈沖矢量形狀(脈沖位置和脈沖極性)的組合方法等2種信息,可預先分配分別一一對應的號碼。擴散模式存儲選擇單元102中,還可根據(jù)實際音源信息進行預先學習,并預先存儲該學習結果所得的擴散模式。若話音信號編碼器/解碼器的音源信息生成單元中采用上述音源矢量生成裝置,則通過傳送擴散模式存儲選擇單元所選擇擴散模式的組合號和脈沖矢量生成單元所生成脈沖矢量的組合號(能規(guī)定脈沖位置和脈沖極性)等2種號碼。能實現(xiàn)噪聲源信息的傳送。又,采用以上那樣構成的音源矢量生成單元時,與采用以代數(shù)方式生成的脈沖音源時相比,可產(chǎn)生形狀(特性)和實際音源信息相似的音源矢量。本實施形態(tài)中,對擴散模式存儲選擇單元102存儲每一通道2種擴散模式的情況進行說明,但在對各通道分配2種以外的擴散模式時,也能取得同樣的作用和效果。本實施形態(tài)中對脈沖矢量生成單元101由3通道組成而且以表1所記載脈沖生成規(guī)則為基礎的情況進行說明,但在信道數(shù)不同時,以及脈沖生成規(guī)則采用表1所記載以外的規(guī)則時,也能取得同樣的作用和效果。此外,組成具有上述音源矢量生成裝置或話音信號編碼器/解碼器的話音信號通信系統(tǒng)或話音信號記錄系統(tǒng),可取得上述音源矢量生成裝置所具有的作用和效果。(第2實施形態(tài))圖4中示出本實施形態(tài)有關CELP型話音信號編碼器的功能框圖,圖5中示出本實施形態(tài)有關CELP型話音信號解碼器的功能框圖。有關本實施形態(tài)的CELP型話音信號編碼器,在上述圖1CELP型話音信號編碼器的噪聲碼本中應用第1實施形態(tài)所說明的音源矢量生成裝置。與本實施形態(tài)有關的CELP型話音信號解碼器,在上述圖2CELP話音信號解碼器的噪聲碼本中,應用上述第1實施形態(tài)的音源矢量生成裝置。因此,除噪聲源信息矢量量化處理以外的處理,均與上述圖1、圖2的裝置相同。本實施形態(tài)中,以噪聲源信息矢量量化處理為中心說明話音信號編碼器和話音信號解碼器。而且,與第l實施形態(tài)相同,也設通道數(shù)N二3,一個通道的擴散模式數(shù)M-2,脈沖矢量的生成依據(jù)圖1。圖4話音信號編碼器中的噪聲源矢量量化處理是規(guī)定使式(4)基準值最大的2種號碼(擴散模式組合號、脈沖位置和脈沖極性組合號)的處理。將圖3音源矢量生成裝置用作噪聲碼本時,用閉環(huán)規(guī)定擴散模式組合號(8種)和脈沖矢量組合號(考慮極性時為16384種)。因此,擴散模式存儲選擇單元215首先從本身存儲的2種擴散模式中選擇一種擴散模式,并輸出到脈沖矢量擴散單元217。然后,脈沖矢量生成單元216按照圖1的規(guī)則,以代數(shù)方法產(chǎn)生通道數(shù)份額的脈沖矢量(本實施形態(tài)中為3個),并輸出到脈沖矢量擴散單元217。脈沖矢量擴散單元217將擴散模式存儲選擇單元215選擇的擴散模式和脈沖矢量生成單元216產(chǎn)生的脈沖矢量用式(5)的巻積運算對每一通道產(chǎn)生擴散矢擴散矢量加法器218將脈沖矢量擴散單元217獲得的擴散矢量相加后,生成音源矢量(成為候補噪聲碼矢量)。然后,失真計算單元206算出采用擴散矢量加法器218所得候補噪聲碼矢量的式(4)的值。對按表1的規(guī)則產(chǎn)生的脈沖矢量的全部組合,進行上述式(4)的值的運算,并將其中式(4)的值最大時的擴散模式組合號、脈沖矢量組合號(脈沖位置及其極性的組合),以及當時的最大值輸出到碼號規(guī)定單元213。接著,擴散模式存儲選擇單元215從所得存儲擴散模式選擇與先前剛選擇的組合不同的擴散模式。然后,就新選擇并更改的擴散模式的組合,與上文所述相同,對按表1的規(guī)則在脈沖矢量生成單元216產(chǎn)生的全部脈沖矢量組合算出式(4)的值。再次將其中式(4)最大時的擴散模式組合號、脈沖矢量組合號和最大值再次輸出到碼號規(guī)定單元213。對能從擴散模式存儲選擇單元215所存擴散模式選擇的全部組合(本實施形態(tài)說明中組合總數(shù)為8)反復進行上述處理。碼號規(guī)定單元213比較失真計算單元206算出的全部8個矢量最大值,選擇其中最大的,規(guī)定產(chǎn)生該最大值時的2種組合號(擴散模式組合號、脈沖矢量組合號),并作為噪聲碼號輸出到編碼輸出單元214。另一方面,圖5的話音信號解碼器中,編碼輸入單元301接收話音信號編碼器(圖4)送來的編碼,將接收到的編碼分解成對應的線性預測號碼、自適應碼號、噪聲碼號(由擴散模式組合號、脈沖矢量組合號等2種組成)和加權碼號,并將分解所得的編碼分別輸出到線性預測系數(shù)解碼單元302、自適應碼本303、噪聲碼本304和加權碼本305。噪聲碼號中,擴散模式組合號輸出到擴散模式存儲選擇單元311、脈沖矢量組合號輸出到脈沖矢量生成單元312。然后,線性預測系數(shù)解碼單元302將線性預測碼號解碼,取得合成濾波器系數(shù),并輸出到合成濾波器309。在自適應碼本303,從與自適應碼號對應的位置讀出自適應碼矢量。噪聲碼本304中,擴散模式存儲選擇單元311對每一通道讀出與擴散脈沖組合號對應的擴散模式并輸出到脈沖矢量擴散單元313;脈沖矢量生成單元312產(chǎn)生通道數(shù)份額的與脈沖矢量組合號對應的脈沖矢量并輸出到脈沖矢量擴散單元313;脈沖矢量擴散單元313將從擴散模式存儲選擇單元311接收到的擴散模式和從脈沖矢量生成單元312接收到的脈沖矢量用式(5)的巻積運算產(chǎn)生擴散矢量,并輸出到擴散矢量加法器314。擴散矢量加法器314將脈沖矢量擴散單元313產(chǎn)生的各通道的擴散矢量相加后,產(chǎn)生噪聲碼矢量。從加權碼本305讀出與加權碼號對應的自適應碼增益和噪聲碼增益,并在自適應碼矢量加權單元306將自適應碼矢量乘以自適應碼增益,同樣,在噪聲碼加權單元307將噪聲碼矢量乘以噪聲碼增益后,送到加法器308。加法器308將已乘上增益的上述2個碼矢量相加,生成驅(qū)動音源矢量,并將生成的驅(qū)動音源矢量輸出到自適應碼本303,以便更新緩存器,還輸出到合成濾波器309,以便驅(qū)動合成濾波器。合成濾波器309用加法器308所得的驅(qū)動音源矢量驅(qū)動后,再生合成話音310。又,自適應碼本303用從加法器308接收的驅(qū)動音源矢量更新緩存器。但,圖4和圖5中的擴散模式存儲選擇單元取為將式(2)內(nèi)的C中代入式(6)記載的音源矢量所得式(7)的失真計算基準式當作代價函數(shù),并預先學習,使該代價函數(shù)的值較小后,將學習所得的擴散模式按每一通道加以存儲。通過上述操作,可生成形狀與實際噪聲源信息(式(4)中矢量X)的形狀相似的音源矢量,因而與噪聲碼本中采用代數(shù)音源矢量生成單元的CELP話音信號編碼器/解碼器相比,能取得質(zhì)量高的合成話音。Ec=乙一l(7)X:規(guī)定噪聲碼號用的目標矢量gC:噪聲碼增益H:合成濾波器脈沖響應巻積矩陣C:噪聲碼矢量i:通道號(1=1~N)j-擴散模式號(i-lM)Ci.-通道i的擴散矢量Wij:通道i的第j種擴散模式di:通道i的脈沖矢量L:音源矢量長度(n二0L一l)本實施形態(tài)中對每一通道預先存儲M個進行預先學習,使式(7)的代價函數(shù)值較小后獲得的擴散模式的情況進行說明,但實際上M個擴散模式不必全部通過學習取得,如果做成每一通道至少預先存儲一種通過學習取得的擴散模式,這種情況下也能取得提高合成話音質(zhì)量的作用和效果。本實施形態(tài)中說明的情況是,根據(jù)擴散模式存儲選擇單元所存儲擴散模式的全部組合和脈沖矢量生成單元6所生成候補脈沖矢量位置的全部組合,用閉環(huán)規(guī)定使式(4)中基準值最大的組合號。然而,做成根據(jù)規(guī)定噪聲碼本號前求得的參數(shù)(自適應碼矢量的理想增益等),進行預選,或用開環(huán)進行檢索等,也能取得同樣的作用和效果。此外,通過構成具有上述話音信號編碼器/解碼器的話音信號通信系統(tǒng)或話音信號記錄系統(tǒng),能取得第1實施形態(tài)中記載的音源矢量生成裝置所具有的作用和效果。(第3實施形態(tài))圖6中示出本實施形態(tài)有關CELP型話音信號編碼器的功能框圖。本實施形態(tài)在噪聲碼本內(nèi)采用上述第1實施形態(tài)音源矢量生成裝置的CELP話音編碼器中,用檢索噪聲碼本前求得的理想自適應碼增益值,進行擴散模式存儲選擇單元所存擴散模式的預選。除噪聲碼本外圍部分以外,都與圖4的CELP型話音信號編碼器相同。因此,本實施形態(tài)說明圖6CELP型話音信號編碼器中的噪聲源信息矢量量化處理。此CELP型話音信號編碼器具有自適應碼本407、自適應碼增益加權單元409、由實施形態(tài)l所說明音源矢量生成裝置構成的噪聲碼本408、噪聲碼增益加權單元410、合成濾波器405、失真計算單元406、碼號規(guī)定單元4B、擴散模式存儲選擇單元415、脈沖矢量生成單元416、脈沖矢量擴散單元417、擴散矢量加法器418和自適應增益判定單元419。但,本實施形態(tài)中,上述擴散模式存儲選擇單元415存儲的M種擴散模式(M》2)中至少一種是預先學習,使噪聲源信息矢量量化時產(chǎn)生的量化失真較小,并由該學習結果得到的擴散模式。為了說明簡便,本實施形態(tài)中設脈沖矢量生成單元的通道數(shù)N為3,擴散模式存儲選擇單元所存儲每一通道的擴散脈沖種類數(shù)M為2,而且取下列情況進行說明M種擴散模式(M二2)的一種是由上述學習獲得的擴散模式,另一種是由隨機數(shù)矢量生成裝置生成的隨機矢量串(下文稱為隨機模式)。附帶說一下,上述由學習獲得的擴散模式,如圖3中的Wll那樣,顯然為長度比較短的脈沖狀擴散模式。圖6的CELP型話音信號編碼器中,在噪聲源信息矢量量化前進行規(guī)定自適應碼本號的處理。因此,在迸行噪聲源信息矢量量化處理的時刻,可參照自適應碼本的矢量號(自適應碼號)和理想自適應碼增益(暫時確定)。本實施形態(tài)中,使用其中的理想自適應碼增益值進行擴散脈沖的預選。具體而言,首先,自適應碼本檢索完畢后,立即將碼號規(guī)定單元413所保持的自適應碼增益理想值輸出到失真計算單元406。失真計算單元406將從碼號規(guī)定單元413接收到的自適應碼增益輸出到自適應增益判定單元419。自適應增益判定單元419對從失真計算單元409接收到的理想自適應增益值和預先設定的門限值的大小進行比較。接著,自適應增益判定單元419根據(jù)上述大小比較的結果,將預先用的控制信號送到擴散模式存儲選擇單元415。控制信號的內(nèi)容在上述大小比較中自適應碼增益大時,指示選擇進行預先學習、使噪聲源信息矢量量化時所產(chǎn)生量化失真較小后得到的擴散模式,并在上述大小比較中自適應碼增益不大時,指示預選與學習結果所得擴散模式不同的擴散模式。結果,在擴散模式存儲選擇單元415中,可適應自適應增益的大小,預選各通道存儲的M種擴散模式(M二2),從而能大量減少擴散模式組合數(shù)。結果,不需要對擴散模式的全部組合號計算失真,能以少量的運算高效進行噪聲源信息的矢量量化處理。再者,噪聲碼矢量的形狀在自適應增益值大時(有聲性強時)為脈沖狀,自適應增益值小時(有聲性弱時)為隨機狀。因此,對話音信號的有聲區(qū)域和無聲區(qū)域,可分別利用形狀適合的噪聲碼矢量,所以能提高合成話音的質(zhì)量。為了說明簡便,本實施形態(tài)限定于脈沖矢量生成單元的通道數(shù)N為3,擴散模式存儲選擇單元所存每一通道擴散脈沖的種類數(shù)M為2的情況下進行說明。然而,脈沖矢量生成單元的通道數(shù)、擴散模式存儲選擇單元中每一通道的擴散模式數(shù)與上述說明不同時,也能取得同樣的效果和作用。為了說明簡便,本實施形態(tài)對每一通道所存M種擴散模式中(M二2),一種為由上述學習獲得的擴散模式,另一種為隨機模式的情況進行說明。然而,如果每一通道至少預先存儲一種由學習取得的擴散模式,即便不是上述那樣的情況,也能期望取得同樣的效果和作用。本實施形態(tài)對具有將自適應碼增益大小信息作為預選擴散模式用的手段的情況進行說明,但如果兼用自適應增益大小信息以外的表示話音信號短時間特征的參數(shù),可期望獲得更進一步的效果和作用。此外,通過構成具有上述話音信號編碼器的話音信號通信系統(tǒng)或話音信號記錄系統(tǒng),可獲得實施形態(tài)1中記載的音源矢量生成裝置所具有的作用和效果。再者,本實施形態(tài)說明了利用在噪聲源信息量化的時刻可參照的當前處理幀理想自適應音源增益,預選擴散模式的方法,但不用當前幀理想自適應音源增益,而代之以利用在緊接前一幀求出的解碼自適應音源增益時,可取同樣的結構,這時也能取得相同的效果。(第4實施形態(tài))圖7為本實施形態(tài)有關CELP型話音信號編碼器的功能框圖。本實施形態(tài)在噪聲碼本內(nèi)采用第1實施形態(tài)音源矢量生成裝置的CELP型話音信號編碼器中,使用在噪聲源信息矢量量化的時刻可利用的信息,預選擴散模式存儲選擇單元所存儲的多個擴散模式。作為此預選的基準,其特征在于,使用規(guī)定自適應碼本號時所產(chǎn)生編碼失真(用S/N比表示)的大小。除噪聲碼本外圍部分以外,均與圖4CELP型話音信號編碼器相同。因此,本實施形態(tài)詳細說明噪聲源信息的矢量量化處理。如圖7所示,本實施形態(tài)的CELP型話音信號編碼器具有自適應碼本507、自適應碼增益加權單元509、由第1實施形態(tài)中說明的音源矢量生成裝置構成的噪聲碼本508、噪聲碼增益加權單元510、合成濾波器505、失真計算單元506、碼號規(guī)定單元513、擴散模式存儲選擇單元515、脈沖矢量生成單元516、脈沖矢量擴散單元517、擴散矢量加法器518和失真功率判定單元519。但,本實施形態(tài)中,取上述擴散模式存儲選擇單元515所存M種擴散模式中(M^2),至少一種為隨機模式。為了說明簡便,本實施形態(tài)中,取脈沖矢量生成單元的通道數(shù)N為3,擴散模式存儲選擇單元所存每一通道擴散模式的種類數(shù)M為2,而且假設M種擴散模式中(M二2)—種為隨機模式,另一種為預先學習,使噪聲源信息矢量量化所產(chǎn)生的量化失真較小后,由該學習結果所得的擴散模式。圖7的CELP型話音信號編碼器中,在噪聲源信息矢量量化處理前進行規(guī)定自適應碼本號的處理。因此,在進行噪聲源號矢量量化處理的時刻,可參照自適應碼本的矢量號(自適應碼號)、理想自適應碼增益(暫時確定)和自適應碼本檢索用的目標矢量。本實施形態(tài)中使用可根據(jù)上述三種信息算出的自適應碼本編碼失真(用S/N比表示),進行擴散模式的預選。具體而言,自適應碼本檢索完畢后,立即將碼號規(guī)定單元513所保持的自適應碼號和自適應碼增益(理想增益)的值輸出到失真計算單元506。失真計算單元506利用從碼號規(guī)定單元513接收到的自適應碼號和自適應碼增益,以及自適應碼本檢索用的目標矢量,算出由規(guī)定自適應碼本號而產(chǎn)生的編碼失真(S/N比)。將算出的S/N比輸出到失真功率判定單元519。失真功率判定單元519首先進行從失真計算單元506接收到的S/N比與預先設定的門限值的大小比較。接著,失真功率判定單元519根據(jù)上述大小比較的結果,將預選用的控制信號送到擴散模式存儲選擇單元515??刂菩盘柕膬?nèi)容在上述大小比較中S/N比大時,指示選擇預先學習,使噪聲碼本檢索用目標矢量進行編碼所產(chǎn)生的編碼失真較小后,其結果所得的擴散模式,并在上述大小比較中S/N比小時,指示選擇隨機模式的擴散模式。結果,擴散模式存儲選擇單元515中,從各通道存儲的M種擴散模式(M二2)僅預選一種,可大量減少擴散模式的組合。因此,不需要對擴散模式的全部組合號計算失真,能用少量的運算高效規(guī)定噪聲碼號。再者,噪聲碼矢量的形狀在S/N比大時為脈沖狀,S/N比小時為隨機狀。因此,能根據(jù)話音信號的短時間特征,使噪聲碼矢量的形狀變化,從而可提高合成話音的質(zhì)量。為了說明簡便,本實施形態(tài)限定于脈沖矢量生成單元的通道數(shù)N為3,擴散模式存儲選擇單元所存每一通道擴散脈沖的種類數(shù)M為2的情況下進行說明。然而,脈沖矢量生成單元的通道數(shù)、每一通道擴散模式的種類與上述說明不同時,也能取得同樣的效果和作用。為了說明簡便,本實施形態(tài)又對每一通道存儲的M種擴散模式中(M二2),一種為由上述學習取得的擴散模式,另一種為隨機模式的情況進行說明。然而,如果做成每一通道至少預先存儲一種隨機模式的擴散模式,即便不是上述那樣的情況也可期望取得同樣的效果和作用。本實施形態(tài)中雖然僅用由規(guī)定自適應碼號而產(chǎn)生的編碼失真(用S/N比表示)的大小信息作為預選擴散模式用的手段,但如果兼用進一步正確表示話音信號短時間特征的信息,可期望具有更進一步的效果和作用。此外,通過構成具有上述話音信號編碼器的話音信號通信系統(tǒng)或話音信號記錄系統(tǒng),或獲得第1實施形態(tài)中記載的音源矢量生成裝置所具有的作用和效果。第5實施形態(tài)圖8中示出本發(fā)明第5實施形態(tài)有關CELP型話音信號編碼器的功能框圖。此CELP型話音信號編碼器中,在LPC分析單元600通過對輸入話音數(shù)據(jù)601進行自相關分析和LPC分析,獲得LPC系數(shù)。又在對所得LPC系數(shù)進行編碼而取得LPC碼的同時,將所得LPC碼解碼,取得解碼LPC系數(shù)。接著,在音源生成單元602,取出自適應碼本603和噪聲碼本604所存的音源取樣(分別稱為自適應碼矢量(或自適應音源)和噪聲碼矢量(或噪聲源)),并分別送到LPC合成單元605。在LPC合成單元605中,對音源生成單元602所獲得的2個音源,利用LPC分析單元600所獲得的解碼LPC系數(shù)進行濾波,從而獲得2個合成話音。在比較單元606中,分析LPC合成單元605所得2個合成話音和輸入話音601的關系,求2個合成話音的最佳值(最佳增益),并將用該最佳增益調(diào)整功率后的各合成話音相加,取得總合成話音后,計算該總合成話音與輸入話音的距離。又,對自適應碼本603和噪聲碼本604的全部音源的取樣,計算由驅(qū)動音源生成單元602和LPC合成單元605所得的多個合成話音與輸入話音601的距離,求該結果所得距離中最小時的音源取樣索引號。將所得最佳增益、音源取樣索引號以及該索引號對應的2個音源送到參數(shù)編碼單元607。在參數(shù)編碼單元607通過進行最佳增益編碼取得增益碼后,將LPC碼、音源取樣索引號匯合在一起送到傳輸線路608。根據(jù)與增益碼和索引號對應的2個音源,生成實際音源信號,將該信號存入自適應碼本603,同時廢棄舊的音源取樣。再者,LPC合成單元605中,通常兼用聽覺加權濾波器,該濾波器采用線性預測系數(shù)、高頻強化濾波器和長期預測系數(shù)(通過對輸入話音進行長期預測分析取得)。一般用將分析區(qū)間進一步細分的區(qū)間(稱為子幀)進行對自適應碼本和噪聲碼本的音源檢索。下面,本實施形態(tài)對LPC分析單元600中的LPC系數(shù)矢量量化進行詳細說明。圖9示出實現(xiàn)在LPC分析單元600執(zhí)行的矢量量化算法用的功能框圖。圖9中所示矢量量化框包括目標提取單元702、量化單元703、失真計算單元704、比較單元705、解碼矢量存儲單元707和矢量平滑單元708。在目標提取單元702中,根據(jù)輸入矢量701,算出量化目標?,F(xiàn)詳細說明提取目標的方法。本實施形態(tài)中的輸入矢量由2種矢量構成分析編碼對象幀所得的參數(shù)矢量;從一個未來幀進行同樣分析取得的參數(shù)矢量。目標提取單元702利用上述輸入矢量和解碼矢量存儲單元707所存先前幀解碼矢量,算出量化目標。式(8)示出運算方法的例子。W)=+pW)+w,';/"/〃+w(8)X(i):目標矢量i:矢量要素號St(i)、St+1(i):輸入矢量t:時間(幀號)p:加權系數(shù)(固定)d(i):先前幀解碼矢量下面示出上述目標提取方法的思路。典型的矢量量化中將當前幀的參數(shù)矢量St(i)作為目標X(i),并用式(9)進行擬合。五"=:fu(力-c/7(力)2w)如oEn:與n號碼矢量的距離X(i):量化目標Cn(i):碼矢量n:碼矢量號i:矢量維數(shù)I:矢量長度于是,至此為止的矢量量化中,編碼失真仍然與音質(zhì)的劣化相聯(lián)系。在即使采取預測矢量量化等對策也不能避免某種程度的編碼失真的超低比特率編碼中,這成為大問題。因此,本實施形態(tài)中,作為聽覺上難以發(fā)現(xiàn)差錯的方向,著眼于前后解碼矢量的中點,在該處導出解碼矢量,由此實現(xiàn)聽覺方面的改善。這是利用參數(shù)矢量內(nèi)插特性良好時,難以聽到時間連續(xù)特性在聽覺上的劣化這種特性。下面參照示出矢量空間的圖IO說明這種情況。首先,該前一幀的解碼矢量為d(i),未來參數(shù)矢量為Sw(i)(實際上最好為未來解碼矢量,但當前幀中不能編碼,所以代用參數(shù)矢量),則碼矢量Cn(i):(1)為碼矢量Cn(i):(2)更接近參數(shù)矢量St(i),但實際上Cn(i):(2)接近在d(i)與Sw(i)的連線上,因而比Cn(i):(1)不易聽到劣化。于是,利用這種特性,如果將目標X(i)取為從St(i)以某種程度接近d(i)與Sw(i)的中點位置上的矢量,則將解碼矢量引導到聽覺上失真小的方向。本實施形態(tài)中,通過導入下面式(10)的估算能實現(xiàn)這種目標的移動。zw=+W〃";/〃+w間X(i):量化目標矢量i:矢量要素號St(i)、St+I(i):輸入矢量t:時間(幀號)p:加權系數(shù)(固定)d(i):先前幀解碼矢量式(10)的前半部分為一般矢量量化估算式,后半部分為聽覺加權分量。為了用上述估算式進行量化,在各X(i)將估算式進行微分,并設微分所得結果為0,則可得式(8)。加權系數(shù)P為正的常數(shù),其值為o時和一般矢量量化相同,無限大時目標完全位于中點。P非常大,則目標大為偏離當前幀的參數(shù)矢量St(i),聽覺清晰度下降。根據(jù)解碼話音信號試聽實驗,證實0.5<<1.0時取得良好的性能。在量化單元703對目標提取單元702所得的量化目標進行量化,求矢量碼,同時求解碼矢量,并和矢量碼一起送到失真計算單元704。本實施形態(tài)中,采用預測矢量量化作為量化的方法。下面說明預測矢量量化。圖11中示出預測矢量量化的功能框圖。預測矢量量化是一種利用過去編碼和解碼所得矢量(合成矢量)進行預測,并對該預測誤差進行矢量量化的算法。預先生成存儲多個預測誤差矢量的中心取樣(碼矢量)的矢量碼本800。通常根據(jù)分析多個話音數(shù)據(jù)所得的多個矢量,利用LBG算法(IEEETRANSACTIONSONCOMMUNICATIONS,VOL.COM-28,NO.1,pp84-95,JANUARY1980),生成該碼本。在預測單元802對量化目標的矢量801進行預測。預測利用狀態(tài)存儲單元803所存的過去合成矢量進行,并將所得預測誤差矢量送到距離計算單元804。這里,作為預測的形態(tài),舉出預測次數(shù)為1次時利用固定系數(shù)進行的預測。下面的式(ll)中示出上此預測時的預測誤差矢量計算式。<formula>formulaseeoriginaldocumentpage22</formula>(11)Y(i):預測誤差矢量X(i):量化目標P:預測系數(shù)(標量)D(i):前1幀的合成矢量i:矢量維數(shù)上式中預測系數(shù)(5的值一般為0<(3<1。在距離計算單元804中,計算預測單元802所得預測誤差矢量與矢量碼本800所存碼矢量的距離。下面的式(12)示出該距離計算公式。五"=C2〃"En:與n號碼矢量的距離T(i):預測誤差矢量Cn(i):碼矢量n:碼矢量號i:矢量維數(shù)I:矢量長度在檢索單元805中比較與各碼矢量的距離,將距離最小的碼矢量的號碼作為矢量碼806加以輸出。即,控制矢量碼本800和距離計算單元804,求矢量碼本800所存全部碼矢量中距離最小的碼矢量的號碼,并將該矢量號作為矢量碼806。進而,根據(jù)最終矢量碼,利用從矢量碼本800所得的碼矢量和狀態(tài)存儲單元803所存的過去解碼矢量,進行矢量解碼,并用所得的合成矢量更新狀態(tài)存儲單元803的內(nèi)容。因此,進行下一次解碼時可將此處解碼的矢量用于預測。利用下面的式(13)進行上述預測形態(tài)例(預測次數(shù)為1次、固定系數(shù))的解碼。Z(i)=CN(i)+pD(i)(13)Z(i):解碼矢量(下一次編碼時作為D(i)使用)N:矢量編碼CN(i):碼矢量P:預測系數(shù)(標量)D(i):前1幀的合成矢量I:矢量維數(shù)另一方面,在解碼器中,通過根據(jù)傳送來的矢量碼求碼矢量,進行解碼。解碼器中預先備有與編碼器相同的矢量碼本和狀態(tài)存儲單元,利用與上述編碼算法中的檢索單元解碼器功能相同的算法,進行解碼。以上是在量化單元703執(zhí)行的矢量量化。在失真計算單元704中根據(jù)量化單元703所得的解碼矢量、輸入矢量701和解碼矢量存儲單元707所存的先前幀解碼矢量,計算聽覺加權編碼失真。下面的式(14)示出計算式?!闣=2YFW+/p+&+/"〃2尸Ew:加權編碼失真St(i),St+1(i):輸入矢量t:時間(幀號)i:矢量要素號V(i):解碼矢量p:加權系數(shù)(固定)d(i):先前幀解碼矢量在式(14)中,加權系數(shù)p與目標提取單元702所用目標計算式的系數(shù)相同。將上述加權編碼失真值、解碼矢量和矢量碼送到比較單元705。比較單元705將失真計算單元704送來的矢量碼送到傳輸線路608,而且用失真計算單元704送來的解碼矢量,更新解碼矢量存儲單元707的內(nèi)容。根據(jù)上述實施形態(tài),在目標提取單元702將目標矢量修正為從S《i)以某種程度接近d(i)和Sw(i)的中點的位置的矢量,因而可進行加權檢索而不覺得聽覺上劣化。至此,說明了本發(fā)明適應于便攜電話等所用低比特率話音信號編碼技術的情況,但本發(fā)明不但是話音信號編碼,而且還能用于音樂編碼器。圖像編碼器中內(nèi)插性較好的參量矢量量化。上述算法中LPC分析單元的LPC編碼通常是變換為一般的LSP(線譜對)等便于編碼的參數(shù)矢量,利用歐幾里德距離和加權歐幾里德距離進行矢量量化(VQ)。本實施形態(tài)中,目標提取單元702接受比較單元705的控制,將輸入矢量701送到矢量平滑單元708,目標提取單元703接收矢量平滑單元708中修改過的輸入矢量,再進行目標的提取。這時,在比較單元705比較失真計算單元704送來的加權編碼失真值和比較單元內(nèi)部準備的基準值。根據(jù)此比較結果,處理分為二種。未達到基準值時,將失真計算單元704送來的矢量碼送到傳輸線路606,而且用失真計算單元704送來的解碼矢量,更新解碼矢量存儲單元707的內(nèi)容。通過用得到的解碼矢量改寫解碼矢量存儲單元707的內(nèi)容,進行此更新。然后,過渡到下一幀參數(shù)編碼處理。反之,在基準值以上時,控制矢量平滑單元708,對輸入矢量加以修改,使目標提取單元702、量化單元703和矢量計算單元704再次起作用'進行重新編碼。在比較單元705中未達到基準值前,反復進行編碼處理。然而,有時會反復進行幾次也不能變成未達到基準值,因而比較單元705內(nèi)部具有計數(shù)器,計算判定為基準值以上的次數(shù),達到一定次數(shù)以上時,中止反復編碼,并進行未達到基準值時的處理和計數(shù)器清零。矢量平滑單元708中,接收比較單元705的控制,根據(jù)由目標提取單元702得到的輸入矢量和從解碼矢量存儲單元707得到的先前幀解碼矢量,利用下面的式(15)修改作為輸入矢量之一的當前幀參數(shù)矢量St(i),并將修改后的輸入矢量送到目標提取單元702。St(i)<~(l—q)S((i)+q(d(i)+St+1(i))/2(15)上述q為平滑系數(shù),表示當前幀參數(shù)矢量接近先前幀解碼矢量與未來幀參數(shù)矢量的中點的程度。根據(jù)編碼實施,證實0.2〈q〈0.4且比較單元705的內(nèi)部反復次數(shù)上限值為5—8次時,可獲得良好的性能。本實施形態(tài)雖然在量化單元703采用預測矢量量化,但借助上述平滑處理,失真計算單元704所得加權編碼失真變小的可能性大。其原因在于利用平滑處理使量化目標更接近先前幀解碼矢量。因此,利用反復進行比較單元705控制的編碼,比較單元705的失真比較中未達到基準值的可能性提高。解碼器中,預先備有與編碼器量化單元對應的解碼單元,根據(jù)從傳輸線路送來的矢量碼進行解碼。本實施形態(tài)也用于CELP型編碼中出現(xiàn)的LSP參數(shù)量化(量化單元進行預測VQ)進行話音信號的編碼和解碼實驗。其結果,證實聽覺上的音質(zhì)當然能提高,而且也能使客觀值(S/N比)提高。這是因為利用具有矢量平滑的反復編碼處理,達到即使頻譜急劇變化時也能抑制預測VQ編碼失真的效果。以往的預測VQ具有的缺點是由于根據(jù)過去合成矢量進行預測,講話開始的部分等頻譜急劇變化部分的頻譜失真反而變大。然而,應用本實施形態(tài),則失真大時進行平滑處理,直到失真變小,因而目標雖然有些偏離實際的參數(shù)矢量,但編碼失真變小,可取得話音信號解碼時總體劣化變小的效果。因此,根據(jù)本實施形態(tài),不僅聽覺上改善音質(zhì),而且也能使客觀值提高。本實施形態(tài)中,可利用比較單元和矢量平滑單元的特征,在矢量量化失真大時,將其劣化的方向控制在聽覺上比較不會覺察的方向上,而且在量化單元采用預測矢量量化時通過反復進行平滑處理+編碼,直到編碼失真變小也能使客觀值提高。至此,說明了本發(fā)明適應于便攜電話等所用低比特率話音編碼技術的情況,但本發(fā)明不僅是話音信號編碼,而且也可用于音樂編碼器和圖像編碼器中內(nèi)插性較好的參數(shù)矢量量化。(第6實施形態(tài))下面說明本發(fā)明第6實施形態(tài)有關的CELP型話音信號編碼器。本實施形態(tài)除量化方法采用多級預測矢量量化的量化單元的量化算法外,其他的結構與上述第5實施形態(tài)相同。即,噪聲碼本采用上述第1實施形態(tài)的音源矢量生成裝置?,F(xiàn)詳細說明量化單元的量化算法。圖12中示出量化單元的功能框圖。多級矢量量化中,進行目標矢量量化后,以量化所得目標碼字利用其碼本進行解碼,求編碼后的矢量與原目標之差(稱為編碼失真矢量),進而將求得的編碼失真矢量加以量化。預先生成存放多個預測誤差矢量中心取樣(碼矢量)的矢量碼本899、矢量碼本900。借助對多個學習用的預測誤差矢量,應用與典型"多級矢量量化"碼本生成方法相同的算法,生成這些碼本。即,通常根據(jù)分析許多話音數(shù)據(jù)所得的多個矢量,利用LBG算法(IEEETRANSACTIONSONCOMMUNICATIONS,VOL.COM-28,NO.l,pp84-95,JANUARY1980)生成上述碼本。但,矢量碼本899的學習總體為許多量化目標的集合,矢量碼本900的學習總體為對上述許多量化目標用量化碼本899進行編碼時的編碼失真矢量的集合。首先,在預測單元902對量化目標矢量901進行預測。預測用狀態(tài)存儲單元903所存過去合成矢量進行,并將得到的預測誤差矢量送到距離計算單元904和距離計算單元905。本實施形態(tài)中,作為預測形態(tài),舉出預測次數(shù)為1次時利用固定系數(shù)進行的預測。下面的式(16)示出用這種預測時的預測誤差矢量運算式。Y(i"X(i)-(5D(i)(16)Y(i):預測誤差矢量X(i):量化目標(3:預測系數(shù)(標量)D(i):前1幀的合成矢量i:矢量維數(shù)上式中,預測系數(shù)p的值通常為o<p<i。在距離計算單元904中,計算預測單元902所得預測誤差矢量與矢量碼本899所存碼矢量A的距離。下面的式(17)示出距離計算式。五"=SU(力-Cln(力)2〃7)En:與n號碼矢量A的距離X(i):預測誤差矢量Cln(i):碼矢量An:碼矢量A的號碼i:矢量維數(shù)I:矢量長度在檢索單元906中,比較與各碼矢量A的距離,將距離最小的碼矢量A的號碼作為碼矢量A的編碼。即,控制矢量碼本899和距離計算單元904求矢量碼本899所存全部碼矢量中距離最小的碼矢量A的號碼,并將該號碼作為碼矢量A的編碼。然后,將碼矢量A的編碼和參照該編碼從矢量碼本899取得的解碼矢量A送到距離計算單元905。又將碼矢量A的編碼送到傳輸線路、檢索單元907。距離計算單元905根據(jù)預測誤差矢量和從檢索單元906取得的解碼矢量A,取得編碼失真矢量,或者參照從檢索單元906取得的碼矢量A的編碼,從幅度存儲單元908取得幅度,然后計算上述編碼失真矢量與矢量碼本900中存儲的碼矢量B乘以上述幅度所得結果的距離,并將該距離送到檢索單元907。下面的式(18)示出距離計算式。柳=柳一C/卿五m=SU(力—s〃C2歷(力rZ(i):解碼失真矢量Y(i):預測誤差矢量ClN(i):解碼矢量AN:碼矢量A的編碼Em:與m號碼矢量B的距離aN與碼矢量A的編碼對應的幅度C2m(i):碼矢量Bm:碼矢量B的號碼i:矢量維數(shù)I:矢量長度在檢索單元907中,比較與各碼矢量B的距離,將距離最小的碼矢量B的號碼作為碼矢量B的編碼。S卩,控制矢量碼本卯0和距離計算單元905,求矢量碼本900所存全部碼矢量B中距離最小的碼矢量B的號碼,并將該號碼作為碼矢量B的編碼。然后,將碼矢量A和碼矢量B的編碼合在一起,作為矢量909。檢索單元907還根據(jù)碼矢量A、B的編碼,用從矢量碼本899和矢量碼本900獲得的解碼矢量A和B、從幅度存儲單元908獲得的幅度,以及狀態(tài)存儲單元903存儲的過去解碼矢量進行矢量的解碼,并利用得到的合成矢量更新狀態(tài)存儲單元903的內(nèi)容。(因此,進行下一次編碼時,將此處解碼的矢量用于預測。)利用下面的式(19)進行本實施形態(tài)預測(預測次數(shù)為1次。固定系數(shù))中的解碼。柳=C7柳+*C2M(%)+〃9)Z(i):解碼矢量(下一次編碼時作為D(i)使用)N:碼矢量A的編碼M:碼矢量B的編碼C1M:解碼矢量AC2M:解碼矢量BaN:與碼矢量A的編碼對應的幅度(3:預測系數(shù)(標量)D(i):前一幀的合成矢量i:矢量維數(shù)預先設定幅度存儲單元908存儲的幅度,下面示出此設定方法。對許多話音數(shù)據(jù)進行編碼,并對第1級碼矢量的各編碼求下面式(20)的總編碼失真后,進行學習,使該失真最小,從而設定幅度。EN=J^(Yt(i)—C1N(i)-aNC2mt(i))2(20)EN:碼矢量A的編碼為N時的編碼失真N:碼矢量A的編碼t:碼矢量A的編碼為N的時間Y"i):時間t的預測誤差矢量ClN(i):解碼矢量AaN:與碼矢量A的編碼對應的幅度C2mt(i):碼矢量Bmt:碼矢量B的號碼i:矢量維數(shù)I:矢量長度艮口,編碼后,設定并修改上述式(20)的失真,使在各幅度微分的值為0,由此,進行幅度學習。然后,反復進行上述編碼+學習,從而求出最佳幅度。另一方面,解碼器中,通過根據(jù)傳遞來的矢量碼,求碼矢量,進行解碼。解碼器具有和編碼器相同的矢量碼本(對應于碼矢量A、B)、幅度存儲單元和狀態(tài)存儲單元,用與上述編碼算法中檢索單元(對應于碼矢量B)的解碼功能相同的算法進行解碼。因此,本實施形態(tài)中,利用幅度存儲單元和距離計算單元的特征以較少的計算量使第2級的碼矢量適應第1級,從而能使幅度失真較小。至此,說明了本發(fā)明適應于便攜電話等所用低比特率話音信號編碼技術的情況,但本發(fā)明不僅是話音信號編碼,而且還可用于音樂編碼器和圖像編碼器等中內(nèi)插性較好的參數(shù)矢量量化。(第7實施形態(tài))下面說明本發(fā)明第7實施形態(tài)有關的CELP型話音信號編碼器。本發(fā)明形態(tài)是一種編碼器的例子,該編碼器可減少采用ACELP型噪聲碼本時碼檢索的運算量。圖13中示出本實施形態(tài)有關CELP型話音編碼器的功能框圖。此CELP型話音信號編碼器中,濾波器系數(shù)分析單元1002對輸入話音信號1001進行線性預測分析,取得合成濾波器系數(shù),并將所得合成濾波器系數(shù)輸出到濾波器系數(shù)量化單元1003。濾波器系數(shù)量化單元1003將輸入的合成濾波器系數(shù)量化后,輸出到合成濾波器1004。合成濾波器1004是根據(jù)濾波器系數(shù)量化單元1003所供給的濾波器系數(shù)建立的,由激勵信號1011驅(qū)動。該激勵信號1011通過將自適應碼本1005輸出的自適應矢量1006乘以自適應增益1007所得結果與噪聲碼本1008輸出的噪聲矢量1009乘以噪聲增益1010所得結果相加而取得。這里,自適應碼本1005是存儲每一音調(diào)周期取出過去對合成濾波器的激勵信號的多個自適應矢量的碼本,噪聲碼本1007是存儲多個噪聲矢量的碼本。噪聲碼本1007可采用上述第1實施形態(tài)的音源矢量生成裝置。失真計算單元1013算出作為激勵信號1011所驅(qū)動合成濾波器1004的輸出的合成話音信號1012與輸入話音信號1001之間的失真,并進行碼檢索處理。碼檢索處理是一種規(guī)定使失真計算單元1013所計算失真最小用的自適應矢量1006的號碼和噪聲矢量1009的號碼,同時算出各輸出矢量所乘自適應增益1007和噪聲增益IOIO的最佳值的處理。編碼輸出單元1014輸出的是將分別與從濾波器系數(shù)量化單元1003得到的濾波器系數(shù)量化值,以及失真計算單元1013中選擇的自適應矢量1006的號碼和噪聲矢量1009的號碼相乘的自適應增益1007和噪聲增益1009編碼后所得的結果。將從編碼輸出單元1014輸出的信息加以傳輸或存儲。失真計算單元1013中的碼檢索處理,通常首先對激勵信號中的自適應碼本分量進行檢索,然后對激勵信號中的噪聲碼本分量進行檢索。上述噪聲分量的檢索使用下面說明的正交檢索。正交檢索中,規(guī)定使式(21)的檢索基準值Eort(=Nort/Dort)最大的噪聲矢<formula>formulaseeoriginaldocumentpage30</formula>Nort:Eort的分子項Dort:Eort的分母項p:已規(guī)定的自適應矢量H:合成濾波器系數(shù)矩陣H1:H的轉(zhuǎn)置矩陣X:目標信號(輸入話音信號與合成濾波器零輸入響應差分所得的結果)C:噪聲矢量正交檢索是對事先規(guī)定自適應矢量為候補的噪聲矢量分別正交,并從正交的多個噪聲矢量規(guī)定1個失真最小的檢索方法。這種檢索方法與非正交檢索相比,其特征在于可提高規(guī)定噪聲矢量的精度,從而能提高合成話音信號的質(zhì)量。ACELP方式中,只用少數(shù)帶極性的脈沖構成噪聲矢量。利用這點,將式(21)所示檢索基準值的分子項(Nort)變換為下面的式(22),由此,可減少分子項的運算。Mw=〖"oi/^W+"/+…十a(chǎn)"-/^("/"-"/a1:第i個脈沖的極性(+1/—l)li:第i個脈沖的位置N:脈沖個數(shù)<formula>formulaseeoriginaldocumentpage30</formula>將式(22)中V的值作為前處理預先計算,并在陣列中展開,則可將陣列V中的(N—1)個要素帶符號進行相加,并對其結果取平方,從而計算式(21)的分子項。下面具體說明可對分母項減少運算量的失真計算單元1013。圖14中示出失真計算單元1013的功能框圖。本實施形態(tài)中的話音信號編碼器,其結構為在圖13的結構中,將自適應矢量1006和噪聲矢量1009輸入失真計算單元1013。在圖14中,作為對所輸入噪聲矢量計算失真時的前處理,進行以下3種處理。(1)算出第1矩陣(N):計算在合成濾波器合成自適應矢量后所得矢量的功率(ptH"Hp)和合成濾波器中濾波器系數(shù)的自相關矩陣(HtH),并將上述功率與上述自相關矩陣各要素相乘,從而算出矩陣N(=(ptH^p)HlH)。(2)算出第2矩陣(M):將在合成濾波器合成自適應矢量后所得的矢量按反時針順序合成,并對其結果所得的信號(pttfH)取矢積后,算出矩陣M。(3)生成第3矩陣(L):對(l)中算出的矩陣N和(2)中算出的矩陣M進行差分,生成矩陣L。又,式(21)的分母項(Dort)可展開為式(23)。Dort=(c怖c)(p怖p)-(p怖c)2(23)=c'Nc-(rlc)2=c'Nc-(一c)1(一c)-clNc-(cWc)=c(Nc-(c'Mc)-ct(N-M)c=etcN:(ptrfHp)HtH—上述前處理(l)r:ptrfHe上述前處理(2)M:一上述前處理(2)L:N—M仨上述前處理(3)C:噪聲矢量由此,將計算式(21)檢索基準值(Eort)時的分母項(Dort)的計算方法置換為式(23),可用較少的運算量規(guī)定噪聲碼本分量。用上述前處理獲得的矩陣L和噪聲矢量1009,進行分母項的計算。這里,為了簡便,對輸入話音信號取樣頻率為8000Hz,代數(shù)結構噪聲碼本檢索的單位時間寬度(幀時間)為10ms,噪聲矢量用每10ms5個單元脈沖(十1/-1)的規(guī)則組合生成的情況,說明基于式(23)的分母項計算方法。又設構成噪聲矢量的5個單位脈沖由處于從表2所示第0組到第4組所規(guī)定位置分別選擇1個位置的脈沖組成,候補噪聲矢量可用下面式(24)記述。<formula>formulaseeoriginaldocumentpage32</formula>(24)ai:第i組所屬脈沖的極性(+l/—l)li:第i組所屬脈沖的位置表2<table>tableseeoriginaldocumentpage32</column></row><table>這時,可用下面的式(25)求式(23)所示的分母項(Dort)。版,=ZiXa^(li,lj)(25)i=0j=0ai:第i組所屬脈沖的極性li:第i組所屬脈沖的位置L(lj,lj):矩陣L中l(wèi)i行、1」列的要素根據(jù)以上說明,證明采用ACELP型噪聲碼本時,可用式(22)計算式(21)的碼檢索基準值的分子項(Nort),可用式(25)計算其分母項(Dort)。因此,采用ACELP型噪聲碼本時,不是原樣計算式(2I)的基準值,而是用(22)和式(25)分別計算其分子項和分母項,從而可大幅度削減碼檢索運算量。以上說明的本實施形態(tài),說明了不帶有預選的噪聲碼本檢索。然而,預選使式(22)的值大的噪聲矢量,并對利用預選收斂為多個候補的噪聲矢量計算式(21),選擇使該值最大的噪聲矢量,這種情況下應用本發(fā)明,也能取得相同的效果。權利要求1、用于話音信號編碼器或話音信號解碼器的擴散矢量發(fā)生器,所述擴散矢量發(fā)生器包括脈沖矢量提供單元,用于提供在矢量軸的某一要素上具有帶極性單元脈沖的脈沖矢量;擴散模式選定單元,用于在開始編碼或解碼處理之前從所預定的波形組選定一擴散模式;和擴散矢量生成單元,用于對所述脈沖矢量和所述選定的擴散模式進行卷積運算生成擴散矢量,所述波形的長度比子幀的長度短。2.如權利要求l所述的擴散矢量發(fā)生器,其特征在于,所述波形中至少一個波形的形狀為脈沖狀。3.如權利要求l所述的擴散矢量發(fā)生器,其特征在于,所述擴散模式選定單元根據(jù)有聲性的強弱選定所述擴散模式。4.用于話音信號編碼器或話音信號解碼器、生成擴散矢量的方法,所述方法包括下述步驟脈沖矢量提供步驟,提供在矢量軸的某一要素上具有帶極性單元脈沖的脈沖矢量;擴散模式選定步驟,在開始編碼或解碼處理之前從所預定的波形組選定一擴散模式;和擴散矢量生成步驟,對所述脈沖矢量和所述選定的擴散模式進行巻積運算生成擴散矢量,所述波形的長度比子幀的長度短。5.如權利要求4所述的生成擴散矢量的方法,其特征在于,所述波形中至少一個波形的形狀為脈沖狀。6.如權利要求4所述的生成擴散矢量的方法,其特征在于,所述擴散模式選定步驟根據(jù)有聲性的強弱選定擴散模式。全文摘要本發(fā)明涉及話音信號編碼器和話音信號解碼器,尤其是用于話音信號編碼器/解碼器的擴散矢量發(fā)生器和生成擴散矢量的方法。本發(fā)明的擴散矢量發(fā)生器包括脈沖矢量提供單元,用于提供在矢量軸的某一要素上具有帶極性單元脈沖的脈沖矢量;擴散模式選定單元,用于在開始編碼或解碼處理之前從所預定的波形組選定一擴散模式;和擴散矢量生成單元,用于對所述脈沖矢量和所述選定的擴散模式進行卷積運算生成擴散矢量,所述波形的長度比子幀的長度短。文檔編號G10L19/00GK101174412SQ20071015299公開日2008年5月7日申請日期1998年10月22日優(yōu)先權日1997年10月22日發(fā)明者安永和敏,森井利幸申請人:松下電器產(chǎn)業(yè)株式會社