聲音信號混合解碼器、聲音信號混合編碼器、聲音信號解碼方法及聲音信號編碼方法

文檔序號：2825598閱讀：172來源：國知局

聲音信號混合解碼器、聲音信號混合編碼器、聲音信號解碼方法及聲音信號編碼方法
【專利摘要】一種對包括通過使用了低延遲濾波器組的音頻編碼處理而被編碼的音頻幀、和通過使用了線性預測系數(shù)的語音編碼處理而被編碼的語音幀的比特流進行解碼的聲音信號混合解碼器，當解碼對象幀是作為從音頻幀切換為語音幀的最初的語音幀的第i幀時，使用作為通過將第i幀解碼而得到的、使用編碼前的第i－1幀的信號生成的信號的子幀（1001），生成作為與編碼前的第i－1幀對應的信號的子幀（1101）及子幀（1102）。
【專利說明】聲音信號混合解碼器、聲音信號混合編碼器、聲音信號解碼方法及聲音信號編碼方法
【技術(shù)領域】
[0001]本發(fā)明涉及能夠切換語音編解碼器(speech codec)和音頻編解碼器(audiocodec)的聲音信號(sound signal)混合解碼器及聲音信號混合編碼器。
【背景技術(shù)】
[0002]混合編解碼器(hybrid codec,參照例如專利文獻I)是結(jié)合了音頻編解碼器與語音編解碼器(參照例如非專利文獻I)的優(yōu)點的編解碼器。根據(jù)混合編解碼器，將語音信號主體的內(nèi)容(content)和音頻信號主體的內(nèi)容混合而成的聲音信號通過切換音頻編解碼器和語音編解碼器而能夠用適合于各自的編碼方法進行編碼。因而，根據(jù)混合編解碼器，能夠以低比特率實現(xiàn)穩(wěn)定的聲音信號的壓縮編碼。
[0003]現(xiàn)有技術(shù)文獻
[0004]專利文獻
[0005]專利文獻 1:Fuchs,Guillaume “Apparatus and method for encoding/decodingand audio signal using an aliasing switch scheme”，國際公開第 2010/003532A1 號
[0006]非專利文獻
[0007]非專利文獻1:Milan Jelinek, “Wideband Speech Coding Advances in VMR —WB Standard，，，IEEE Transactions on Audio, Speech and Language Processing, 15 (4),1167 - 1179 (2007)
[0008]非專利文獻2:Chi — Min Liu and Wen — Chieh Lee, “A unified fastalgorithm for cosine modulated filterbanks in current audio standards，，, J.AudioEngineering47 (12),1061 — 1075 (1999)
發(fā)明概要
[0009]發(fā)明要解決的問題
[0010]為了提高混合編解碼器的音質(zhì)，作為音頻編解碼器，例如通過使用AAC — ELD(Advanced Audio Coding — Enhanced Low Delay:高級音頻編碼-增強低延遲)模式，能夠期待首質(zhì)提聞。
[0011]但是，在AAC — ELD模式那樣的編碼方式中，為了使用與先行幀重疊(overlap)的采樣進行編碼，在切換為僅通過對象幀內(nèi)的采樣編碼完成的語音編解碼器時發(fā)生混疊(aliasing)，產(chǎn)生不自然的聲音。在專利文獻I中，雖然公開了這樣編碼模式切換的部位的信號處理，但這樣的處理并不對應于如AAC - ELD模式那樣的需要通過多個先行幀的重疊處理的編碼方式，通過專利文獻I的方法不能降低上述混疊。
[0012]
【發(fā)明內(nèi)容】

[0013]本發(fā)明的目的是提供一種混合編解碼器(聲音信號混合解碼器及聲音信號混合編碼器)，在作為音頻編解碼器而使用如AAC - ELD模式那樣需要基于多個先行幀的重疊處理的編碼方式的情況下，降低在語音編解碼器和音頻編解碼器的切換部分發(fā)生的混疊。
[0014]用于解決問題的手段
[0015]有關本發(fā)明的一技術(shù)方案的聲音信號混合解碼器，對包括通過使用了低延遲濾波器組的音頻編碼處理而被編碼的音頻幀、和通過使用了線性預測系數(shù)的語音編碼處理而被編碼的語音幀的比特流進行解碼，其特征在于，具備:低延遲變換解碼器，通過低延遲逆濾波器組處理對上述音頻幀進行解碼；語音信號解碼器，對上述語音幀進行解碼；以及塊切換部，進行控制，以便在上述比特流中的解碼對象幀是上述音頻幀的情況下將該解碼對象幀通過上述低延遲變換解碼器解碼、在上述解碼對象幀是上述語音幀的情況下將該解碼對象幀通過上述語音信號解碼器解碼；當上述解碼對象幀是作為從上述音頻幀切換為上述語音幀后的最初的上述語音幀的第i幀時，在上述第i幀中，以編碼后的狀態(tài)包含第I信號，該第I信號是使用比上述第i幀靠前I幀的幀即第i 一 I幀的編碼前的信號而生成的；上述塊切換部(I)進行將如下信號相加的處理而生成與編碼前的上述第i 一 I幀的前半部分對應的信號，所述如下信號包括:將相當于第2信號的幀的前半部分的信號與對相當于上述第2信號的幀的后半部分的信號進行折疊處理后的信號相加、并進行加窗處理后的信號；通過將上述第i幀用上述語音信號解碼器解碼而得到的、對上述第I信號進行加窗處理后的信號；和第3信號的幀的前半部分的信號，其中所述第2信號是對比上述第i幀靠前3幀的幀即第i 一 3幀的重建后的信號進行加窗處理后的信號，該第i 一 3幀的重建后的信號是通過將比上述第i幀靠前2幀的幀即第i 一 2幀用上述低延遲變換解碼器解碼而得到的，所述第3信號是對上述第i 一 I幀進行上述低延遲逆濾波器組處理及加窗處理后的信號的與上述第i 一 3幀對應的部分；以及進行將如下信號相加的處理而生成與編碼前的上述第i 一 I幀的后半部分對應的信號，所述如下信號包括:將相當于上述第2信號的幀的后半部分的信號與對相當于上述第2信號的幀的前半部分的信號進行折疊處理后的信號相力口、并進行加窗處理后的信號；對上述第I信號進行折疊處理及加窗處理后的信號；和相當于上述第3信號的幀的后半部分的信號；或者(2)進行將如下信號相加的處理而生成與編碼前的上述第i 一 I幀的前半部分對應的信號，所述如下信號包括:將相當于上述第2信號的幀的前半部分的信號與對相當于上述第2信號的幀的后半部分的信號進行折疊處理后的信號相加、并進行加窗處理后的信號；對上述第I信號進行折疊處理及加窗處理后的信號；和相當于上述第3信號的幀的前半部分的信號；以及進行將如下信號相加的處理而生成與編碼前的上述第i 一 I幀的后半部分對應的信號，所述如下信號包括:將相當于上述第2信號的幀的后半部分的信號與對相當于上述第2信號的幀的前半部分的信號進行折疊處理后的信號相加、并進行加窗處理后的信號；對上述第I信號進行加窗處理后的信號；和相當于上述第3信號的幀的后半部分的信號。
[0016]另外，這些整體性或具體的技術(shù)方案也可以通過系統(tǒng)、方法、集成電路、計算機程序或計算機能夠讀取的CD — ROM等的記錄介質(zhì)實現(xiàn),也可以通過系統(tǒng)、方法、集成電路、計算機程序及記錄介質(zhì)的任意的組合來實現(xiàn)。
[0017]發(fā)明效果
[0018]根據(jù)本發(fā)明，在使用如AAC - ELD模式那樣需要基于多個先行幀的重疊處理的編碼方式的音頻編解碼器的混合編解碼器(聲音信號混合解碼器及聲音信號混合編碼器)中，能夠降低在語音編解碼器與音頻編解碼器的切換部分中發(fā)生的混疊?！緦＠綀D】

【附圖說明】
[0019]圖1是表示AAC - ELD的編碼器的分析窗的圖。
[0020]圖2是表示AAC - ELD的解碼器的解碼處理的圖。
[0021]圖3是表示AAC - ELD的解碼器的合成窗的圖。
[0022]圖4是表示AAC - ELD的編碼/解碼處理的延遲量的圖。
[0023]圖5是用來說明轉(zhuǎn)變幀的圖。
[0024]圖6是表示有關實施方式I的聲音信號混合編碼器的結(jié)構(gòu)的框圖。
[0025]圖7是表示編碼模式被從FD編碼模式切換為ACELP編碼模式的情況下的編碼的幀的圖。
[0026]圖8A是表示成分X的生成方法的一例的圖。
[0027]圖8B是表示成分X的生成方法的流程圖。
[0028]圖9是表示具備TCX編碼器的聲音信號混合編碼器的結(jié)構(gòu)的框圖。
[0029]圖10是表示有關實施方式I的聲音信號混合解碼器的結(jié)構(gòu)的框圖。
[0030]圖11是表示用FD編碼模式編碼的信號切換為用ACELP編碼模式編碼的信號時的塊切換部的切換控制的示意圖。
[0031]圖12A是表示重建幀i 一 I的信號的方法的圖。
[0032]圖12B是表示重建幀i 一 I的信號的方法的流程圖。
[0033]圖13是表示有關實施方式I的編碼/解碼處理的延遲量的圖。
[0034]圖14是表示具備TCX解碼器的聲音信號混合解碼器的結(jié)構(gòu)的框圖。
[0035]圖15是表示使用合成誤差補償裝置重建幀i 一 I的信號的方法的圖。
[0036]圖16是表示合成誤差信息的解碼處理的圖。
[0037]圖17是表示編碼模式被從ACELP編碼模式切換為FD編碼模式的情況下的編碼的幀的圖。
[0038]圖18是表示用ACELP編碼模式編碼的信號切換為用FD編碼模式編碼的信號時的塊切換部的切換控制的示意圖。
[0039]圖19是表示有關實施方式2的重建幀i 一 I的信號的方法的流程圖。
[0040]圖20A是表不有關實施方式2的重建巾貞i — I的信號的方法的一例的圖。
[0041]圖20B是表不有關實施方式2的重建巾貞i — I的信號的方法的一例的另一個圖。
[0042]圖21是表不有關實施方式2的重建巾貞i的信號的方法的一例的圖。
[0043]圖22是表不有關實施方式2的重建巾貞i+Ι的信號的方法的一例的圖。
[0044]圖23是表示有關實施方式2的編碼/解碼處理的延遲量的圖。
[0045]圖24是表示使用SEC裝置重建幀i 一 I的信號的方法的圖。
[0046]圖25是表示使用SEC裝置重建幀i的信號的方法的圖。
[0047]圖26是表示使用SEC裝置重建幀i 一 I的信號的方法的圖。
[0048]圖27是表示編碼模式被從FD編碼模式切換為TCX編碼模式的情況下的編碼的幀的圖。
[0049]圖28是表示用FD編碼模式編碼的信號切換為用TCX符號模式編碼的信號時的塊切換部的切換控制的示意圖。[0050]圖29是表示有關實施方式3的編碼/解碼處理的延遲量的圖。
[0051]圖30是表示編碼模式從TCX編碼模式切換為FD編碼模式的情況下的編碼的幀的圖。
[0052]圖31是表示編碼模式從TCX編碼模式切換為FD編碼模式的情況下的編碼的幀的圖。
[0053]圖32是表不有關實施方式4的重建巾貞i — I的信號的方法的一例的圖。
[0054]圖33是表示有關實施方式4的編碼/解碼處理的延遲量的圖。
【具體實施方式】
[0055](作為發(fā)明的基礎的認識)
[0056]語音編解碼器是特別用來根據(jù)語音信號(speech signal)的特征將語音信號編碼的編解碼器(參照非專利文獻I)。語音編解碼器在將語音信號以低比特率編碼的情況下，以低延遲實現(xiàn)良好的音質(zhì)。但是，語音編解碼器不適合于音頻信號(audio signal)的編碼。因而，在通過語音編解碼器將音頻信號編碼的情況下，例如與用AAC等的音頻編解碼器編碼的情況相比音質(zhì)下降。
[0057]目前，ACELP編碼模式(Algebraic Code Excited Linear Prediction:代數(shù)碼激勵線性預測)或TCX編碼模式(Transform Coded Excitation:變換碼激勵)等的一般的語音編解碼器基于線性預測域編碼(參照專利文獻I)。在ACELP編碼模式中，在線性預測分析后，將代數(shù)碼本用于激勵信號的編碼。在TCX編碼模式中，在線性預測分析后，對激勵信號使用變換編碼。
[0058]另一方面，音頻編解碼器是適合于音頻信號的編碼的編解碼器。但是，在將音頻編解碼器用于語音信號的情況下，為了實現(xiàn)如語音編解碼器那樣穩(wěn)定的音質(zhì)，通常需要較高的比特率。
[0059]混合編解碼器是結(jié)合了音頻編解碼器和語音編解碼器的優(yōu)點的編碼器。在混合編解碼器中，編碼模式被劃分為兩個系統(tǒng)。一個是相當于上述音頻編解碼器的AAC等的頻率域(FD:Frequency Domain)編碼模式。另一個是相當于上述語音編解碼器的線性預測域(LPD:Linear Prediction Domain)編石馬模式。
[0060]作為FD編碼模式，一般使用AAC — LD編碼模式或AAC編碼模式等的直行變換編碼。此外，作為LPD編碼模式,一般使用作為LPC (Lenear Prediction Coefficient:線性預測系數(shù))殘差的頻率域顯示的TCX編碼模式、和作為LPC殘差的時間域顯示的ACELP編碼模式。
[0061]在混合編解碼器中，根據(jù)編碼對象的信號是語音信號還是音頻信號而切換編碼模式(參照專利文獻I )。另外，選擇ACELP編碼模式和TCX編碼模式的哪個例如基于閉環(huán)分析合成技術(shù)來選擇。
[0062]這里，在進行VoIP (Voice over Internet Protocol:互聯(lián)網(wǎng)協(xié)議語音)或視頻會議等的實時通信的情況下，更希望低延遲的混合編解碼器。這里，為了實現(xiàn)低延遲，作為上述FD編碼模式而使用將AAC及AAC — LD擴展的AAC — ELD編碼方式(以下，也單記作AAC - ELD)ο AAC 一 ELD編碼方式為了實現(xiàn)充分的低延遲而具有下述的特征。
[0063]1.AAC - ELD的I個幀中的采樣數(shù)(幀大小N，在以下本說明書中也同樣)為512時間域采樣及480時間域采樣，是較少的。
[0064]2.使先讀處理及塊切換處理為無效。
[0065]3.為了采用低延遲濾波器組(filter bank)而變更分析及合成濾波器組。具體而言，長度4N的長窗口使與過去的重疊變多、使與未來的重疊變少而使用(值N/4實際是零)。
[0066]4.使比特池(bit reservoir)最小化、或完全不使用比特池。
[0067]5.使時間域噪聲整形及長期預測功能適應于低延遲的幀大小。
[0068]這里，對AAC - ELD低延遲濾波器組的變換及逆變換進行說明。另外，以下說明的背景知識在后續(xù)的記載中也原樣使用。
[0069]如已經(jīng)敘述那樣，在AAC - ELD中使用低延遲分析及合成濾波器組。低延遲濾波器組如以下這樣定義。
[0070][數(shù)式I]
【權(quán)利要求】
1.一種聲音信號混合解碼器，對包括通過使用了低延遲濾波器組的音頻編碼處理而被編碼的音頻幀、和通過使用了線性預測系數(shù)的語音編碼處理而被編碼的語音幀的比特流進行解碼，其特征在于，具備: 低延遲變換解碼器，通過低延遲逆濾波器組處理對上述音頻幀進行解碼；語音信號解碼器，對上述語音幀進行解碼；以及塊切換部，進行控制，以便在上述比特流中的解碼對象幀是上述音頻幀的情況下將該解碼對象幀通過上述低延遲變換解碼器解碼、在上述解碼對象幀是上述語音幀的情況下將該解碼對象幀通過上述語音信號解碼器解碼；當上述解碼對象幀是作為從上述音頻幀切換為上述語音幀后的最初的上述語音幀的第i幀時，在上述第i幀中，以編碼后的狀態(tài)包含第I信號，該第I信號是使用比上述第i幀靠前I幀的幀即第i 一I幀的編碼前的信號而生成的；上述塊切換部 Cl) 進行將如下信號相加的處理而生成與編碼前的上述第i 一 I幀的前半部分對應的信號，所述如下信號包括:將相當于第2信號的幀的前半部分的信號與對相當于上述第2信號的幀的后半部分的信號進行折疊處理后的信號相加、并進行加窗處理后的信號；通過將上述第i幀用上述語音信號解碼器解碼而得到的、對上述第I信號進行加窗處理后的信號；和第3信號的幀的前半部分的信號，其中所述第2信號是對比上述第i幀靠前3幀的幀即第1- 3幀的重建后的信號進行加窗處理后的信號，該第i 一 3幀的重建后的信號是通過將比上述第i幀靠前2幀的幀即第i 一 2幀用上述低延遲變換解碼器解碼而得到的，所述第3信號是對上述第i 一 I幀進行上述低延遲逆濾波器組處理及加窗處理后的信號的與上述第i 一 3幀對應的部分；以及進行將如下信號相加的處理而生成與編碼前的上述第i 一 I幀的后半部分對應的信號，所述如下信號包括:將相當于上述第2信號的幀的后半部分的信號與對相當于上述第2信號的幀的前半部分的信號進行折疊處理后的信號相加、并進行加窗處理后的信號；對上述第I信號進行折疊處理及加窗處理后的信號；和相當于上述第3信號的幀的后半部分的信號；或者
(2) 進行將如下信號相加的處理而生成與編碼前的上述第i 一 I幀的前半部分對應的信號，所述如下信號包括:將相當于上述第2信號的幀的前半部分的信號與對相當于上述第2信號的幀的后半部分的信號進行折疊處理后的信號相加、并進行加窗處理后的信號；對上述第I信號進行折疊處理及加窗處理后的信號；和相當于上述第3信號的幀的前半部分的信號；以及進行將如下信號相加的處理而生成與編碼前的上述第i 一 I幀的后半部分對應的信號，所述如下信號包括:將相當于上述第2信號的幀的后半部分的信號與對相當于上述第2信號的幀的前半部分的信號進行折疊處理后的信號相加、并進行加窗處理后的信號；對上述第I信號進行加窗處理后的信號；和相當于上述第3信號的幀的后半部分的信號。
2.一種聲音信號混合解碼器，對包括通過使用了低延遲濾波器組的音頻編碼處理而被編碼的音頻幀、和通過使用了線性預測系數(shù)的語音編碼處理而被編碼的語音幀的比特流進行解碼，其特征在于，具備: 低延遲變換解碼器，通過低延遲逆濾波器組處理對上述音頻幀進行解碼；語音信號解碼器，對上述語音幀進行解碼；塊切換部，進行控制，以便在上述比特流中的解碼對象幀是上述音頻幀的情況下將該解碼對象幀通過上述低延遲變換解碼器解碼、在上述解碼對象幀是上述語音幀的情況下將該解碼對象幀通過上述語音信號解碼器解碼；當上述解碼對象幀是作為從上述語音幀切換為上述音頻幀后的最初的音頻幀的第i幀時，上述塊切換部進行將第5信號、第7信號、第8信號相加的處理而生成作為與編碼前的比上述第i幀靠前I幀的幀即第i 一 I幀對應的信號的重建信號，其中所述第5信號是將第4信號與對該第4信號進行折疊處理后的信號相加、并進行加窗處理后的信號，所述第4信號是對將上述第i 一 I幀用上述語音信號解碼器解碼得到的信號進行加窗處理后的信號；所述第7信號是將第6信號與對該第6信號進行折疊處理后的信號相加、并進行加窗處理后的信號，所述第6信號是對將比上述第i幀靠前3幀的幀即第i 一 3幀用上述語音信號解碼器解碼得到的信號進行加窗處理后的信號；所述第8信號是對上述第i幀進行上述低延遲逆濾波器組處理及加窗處理后的信號的與上述第i 一 3幀對應的部分。
3.如權(quán)利要求2所述的聲音信號混合解碼器，其特征在于，當上述解碼對象幀是比上述第i幀靠后I幀的幀即第i+Ι幀時，上述塊切換部進行將第9信號、第10信號、第13信號、第15信號相加的處理而生成與編碼前的上述第i幀對應的信號，其中所述第9信號是對上述第i+Ι幀進行上述低延遲逆濾波器組處理及加窗處理后的信號中的、與比上述第i幀靠前2幀的幀即第i 一 2幀對應的部分；所述第10信號是對上述第i幀進行上述低延遲逆濾波器組處理及加窗處理后的信號的與上述第i 一 2幀對應的部分；所述第13信號是對第12信號連結(jié)對該第12信號進行折疊處理后的信號、并進行加窗處理后的信號，其中所述第12信號是通過將相當于對第11信號進行第I加窗處理后的信號的幀的前半部分的信號、與將相當于對上述第11信號進行上述第I加窗處理后的信號的幀的后半部分的信號折疊處理后的信號相加而得到的，而所述第11信號是通過將所述第i 一 2幀用所述語音信號解碼器解碼而得到的；所述第15信號是對第14信號連結(jié)對該第14信號進行折疊處理并將符號反轉(zhuǎn)的信號、并進行加窗處理后的信號，其中所述第14信號是通過將相當于對上述第11信號進行與上述第I加窗處理不同的第2加窗處理后的信號的幀的前半部分的信號、與將相當于對上述第11信號進行上述第2加窗處理后的信號的幀的后半部分的信號折疊處理后的信號相加而得到的。
4.如權(quán)利要求3所述的聲音信號混合解碼器，其特征在于，當上述解碼對象幀是比上述第i幀靠后2幀的幀即第i+2幀時，上述塊切換部進行將第16信號、第17信號、第18信號、第21信號、第23信號相加的處理而生成與編碼前的上述第i+Ι幀對應的信號，其中所述第16信號是對上述i+2幀進行上述低延遲逆濾波器組處理及加窗處理后的信號的與上述第i 一I幀對應的部分；所述第17信號是對上述第i+Ι幀進行上述低延遲逆濾波器組處理及加窗處理后的信號的與上述第i 一 I幀對應的部分；所述第18信號是對上述第i幀進行上述低延遲逆濾波器組處理及加窗處理后的信號的與上述第i 一 I幀對應的部分；所述第21信號是對第20信號連結(jié)對該第20信號進行折疊處理后的信號、并進行加窗處理后的信號，其中所述第20信號是通過將相當于對第19信號進行加窗處理后的信號的幀的前半部分的信號、與將相當于對上述第19信號進行上述加窗處理后的信號的幀的后半部分的信號折疊處理后的信號相加而得到的，而所述第19信號是通過將上述第i 一 3幀用上述語音信號解碼器解碼而得到的；所述第23信號是對第22信號連結(jié)對該第22信號進行折疊處理并將符號反轉(zhuǎn)的信號、并進行加窗處理后的信號，其中所述第22信號是通過將相當于對上述重建信號進行加窗處理后的信號的幀的前半部分的信號、與將相當于對上述重建信號進行上述加窗處理后的信號的幀的后半部分的信號折疊處理后的信號相加而得到的。
5.一種聲音信號混合解碼器，對包括通過使用了低延遲濾波器組的音頻編碼處理而被編碼的音頻幀、和通過使用了線性預測系數(shù)的語音編碼處理而被編碼的語音幀的比特流進行解碼，其特征在于，具備: 低延遲變換解碼器，使用低延遲逆濾波器組處理對上述音頻幀進行解碼； TCX解碼器，對通過TCX變換碼激勵方式編碼的上述語音幀進行解碼；以及塊切換部，進行控制，以便在上述比特流中的解碼對象幀是上述音頻幀的情況下將該解碼對象幀通過上述低延遲變換解碼器解碼、在上述解碼對象幀是上述語音幀的情況下將該解碼對象幀通過上述語音信號解碼器解碼；當上述解碼對象幀是從上述音頻幀切換為上述語音幀后的最初的上述語音幀、而且是作為過渡信號被編碼的幀的第i幀時，在上述第i幀中，以編碼后的狀態(tài)包含第I信號，該第I信號是使用比上述第i幀靠前I幀的幀即第i 一 I幀的編碼前的信號而生成的；上述塊切換部 Cl) 進行將如下信號相加的處理而生成與編碼前的上述第i 一 I幀的前半部分對應的信號，所述如下信號包括:將相當于第2信號的幀的前半部分的信號與對相當于上述第2信號的幀的后半部分的信號進行折疊處理后的信號相加、并進行加窗處理后的信號；通過將上述第i幀用上述語音信號解碼器解碼而得到的、對上述第I信號進行加窗處理后的信號；和第3信號的幀的前半部分的信號，其中所述第2信號是對比上述第i幀靠前3幀的幀即第1- 3幀的重建后的信號進行加窗處理后的信號，該第i 一 3幀的重建后的信號是通過將比上述第i幀靠前2幀的幀即第i 一 2幀用上述低延遲變換解碼器解碼而得到的，所述第3信號是對上述第i 一 I幀進行上述低延遲逆濾波器組處理及加窗處理后的信號的與上述第i 一 3幀對應的部分；以及進行將如下信號相加的處理而生成與編碼前的上述第i 一 I幀的后半部分對應的信號，所述如下信號包括:將相當于上述第2信號的幀的后半部分的信號與對相當于上述第2信號的幀的前半部分的信號進行折疊處理后的信號相加、并進行加窗處理后的信號；對上述第I信號進行折疊處理及加窗處理后的信號；和相當于上述第3信號的幀的后半部分的信號；或者
(2) 進行將如下信號相加的處理而生成與編碼前的上述第i 一 I幀的前半部分對應的信號，所述如下信號包括:將相當于上述第2信號的幀的前半部分的信號與對相當于上述第2信號的幀的后半部分的信號進行折疊處理后的信號相加、并進行加窗處理后的信號；對上述第I信號進行折疊處理及加窗處理后的信號；和相當于上述第3信號的幀的前半部分的信號；以及進行將如下信號相加的處理而生成與編碼前的上述第i 一 I幀的后半部分對應的信號，所述如下信號包括:將相當于上述第2信號的幀的后半部分的信號與對相當于上述第2信號的幀的前半部分的信號進行折疊處理后的信號相加、并進行加窗處理后的信號；對上述第I信號進行加窗處理后的信號；和相當于上述第3信號的幀的后半部分的信號。
6.如權(quán)利要求1~5中任一項所述的聲音信號混合解碼器,其特征在于，上述低延遲變換解碼器是AAC - ELD高級音頻編碼-增強低延遲解碼器，通過對對于上述音頻幀及與該音頻幀在時間上連續(xù)的且靠前的3個幀分別進行低延遲逆濾波器組處理及加窗處理后的信號中的各個信號進行重復相加處理，從而將該音頻幀解碼。
7.如權(quán)利要求1~4中任一項所述的聲音信號混合解碼器，其特征在于，上述語音信號解碼器是ACELP解碼器，對使用ACELP代數(shù)碼激勵線性預測系數(shù)而被編碼的上述語音幀進行解碼。
8.如權(quán)利要求1~4中任一項所述的聲音信號混合解碼器，其特征在于，上述語音信號解碼器是TCX解碼器，對通過TCX方式而被編碼的上述語音幀進行解碼。
9.如權(quán)利要求1~8中任一項所述的聲音信號混合解碼器，其特征在于，還具備對與上述解碼對象幀一起被編碼的合成誤差信息進行解碼的合成誤差補償裝置；上述合成誤差信息是表示上述比特流被編碼之前的信號與將上述比特流解碼后的信號之間的差的信息；上述合成誤差補償裝置將上述塊切換部生成的上述編碼前的上述第i 一 I幀的信號、上述塊切換部生成的上述編碼前的上述第i幀的信號、或上述塊切換部生成的上述編碼前的上述第i+Ι幀的信號使用解碼后的上述合成誤差信息進行修正。
10.一種聲音信號混合編碼器，其特征在于，具備: 信號分類部，分析聲音信號的音頻特性，判斷包含在上述聲音信號中的幀是音頻信號還是語首/[目號；低延遲變換編碼器，使用低延遲濾波器組對上述幀進行編碼；語音信號編碼器，通過計算上述幀的線性預測系數(shù)，對該幀進行編碼；以及塊切換部，進行控制，以便將上述信號分類部判斷為是上述音頻信號的編碼對象幀通過上述低延遲變換編碼器編碼、將上述信號分類部判斷為是上述語音信號的上述編碼對象幀通過上述語音信號編碼器編碼；上述塊切換部 (1)在上述編碼對象幀是作為上述信號分類部判斷為是上述語音信號的幀的第i一 I幀的I幀后的幀、而且是作為上述信號分類部判斷為是上述音頻信號的幀的第i幀時，將如下信號和上述第i幀通過上述語音信號編碼器編碼:該信號是將對相當于上述第1-1幀的前半部分的信號進行加窗處理后的信號、與對相當于上述第i 一 I幀的后半部分的信號進行加窗處理并進行折疊處理后的信號相加而得到的信號；或者 (2)將如下信號和上述第i幀通過上述語音信號編碼器編碼:該信號是將對相當于上述第i 一 I幀的后半部分的信號進行加窗處理后的信號、與對相當于上述第i 一 I幀的前半部分的信號進行加窗處理并進行折疊處理后的信號相加而得到的信號。
11.一種聲音信號混合編碼器，其特征在于，具備: 信號分類部，分析聲音信號的音頻特性，判斷包含在上述聲音信號中的幀是音頻信號還是語首/[目號；低延遲變換編碼器，使用低延遲濾波器組對上述幀進行編碼； TCX編碼器，通過對上述幀的線性預測系數(shù)的殘差進行MDCT改進離散余弦變換處理的TCX方式，對上述幀進行編碼；塊切換部，進行控制，以便將上述信號分類部判斷為是上述音頻信號的編碼對象幀通過上述低延遲變換編碼器編碼、將上述信號分類部判斷為是上述語音信號的上述編碼對象幀通過上述語音信號編碼器編碼；當作為上述編碼對象幀的第i幀是上述信號分類部判斷為是上述音頻信號、并且是能量急劇地變化的過渡信號的幀時，上述塊切換部 (1)將如下信號和上述第i幀通過上述語音信號編碼器編碼:該信號是將將相當于比上述第i幀靠前I幀的幀即第i 一 I幀的前半部分的信號進行加窗處理后的信號、與對相當于上述第i 一I幀的后半部分的信號進行加窗處理并進行折疊處理后的信號相加而得到的信號；或者 (2)將如下信號和上述第i幀通過上述語音信號編碼器編碼:該信號是將對相當于上述第i 一 I幀的后半部分的信號進行加窗處理后的信號、與對相當于上述第i 一 I幀的前半部分的信號進行加窗處理并進行折疊處理后的信號相加而得到的信號。
12.如權(quán)利要求10或11所述的聲音信號混合編碼器，其特征在于，上述低延遲變換編碼器是AAC - ELD編碼器，通過對于將上述幀及與該幀在時間上連續(xù)的且靠前的3個幀連結(jié)而成的擴展幀進行加窗處理及低延遲逆濾波器組處理，從而將上述幀編碼。
13.如權(quán)利要求10~12中任一項所述的聲音信號混合編碼器,其特征在于，上述語音信號編碼器是通過生成ACELP系數(shù)而將上述幀編碼的ACELP編碼器。
14.如權(quán)利要求10~12中任一項所述的聲音信號混合編碼器,其特征在于，上述語音信號編碼器是將上述線性預測系數(shù)的殘差進行MDCT處理而將上述幀編碼的TCX編碼器。
15.如權(quán)利要求10~14中任一項所述的聲音信號混合編碼器,其特征在于,還具備: 本地解碼器，對編碼后的上述聲音信號進行解碼；以及本地編碼器，對作為上述聲音信號與上述本地解碼器解碼后的上述聲音信號之間的差的合成誤差信息進行編碼。
16.一種聲音信號解碼方法，對包括通過使用了低延遲濾波器組的音頻編碼處理而被編碼的音頻幀、和通過使用了線性預測系數(shù)的語音編碼處理而被編碼的語音幀的比特流進行解碼，其特征在于，具備: 低延遲變換解碼步驟，利用低延遲逆濾波器組處理對上述音頻幀進行解碼；語音信號解碼步驟，對上述語音幀進行解碼；以及控制步驟，進行控制，以便在上述比特流中的解碼對象幀是上述音頻幀的情況下將該解碼對象幀通過上述低延遲變換解碼步驟解碼、在上述解碼對象幀是上述語音幀的情況下將該解碼對象幀通過上述語音信號解碼步驟解碼；當上述解碼對象幀是作為從上述音頻幀切換為上述語音幀后的最初的上述語音幀的第i幀時，在上述第i幀中，以編碼后的狀態(tài)包含第I信號，該第I信號是使用比上述第i幀靠前I幀的幀即第i 一I幀的編碼前的信號而生成的；上述控制步驟 Cl) 進行將如下信號相加的處理而生成與編碼前的上述第i 一 I幀的前半部分對應的信號，所述如下信號包括:將相當于第2信號的幀的前半部分的信號與對相當于上述第2信號的幀的后半部分的信號進行折疊處理后的信號相加、并進行加窗處理后的信號；通過將上述第i幀用上述語音信號解碼步驟解碼而得到的、對上述第I信號進行加窗處理后的信號；和第3信號的幀的前半部分的信號，其中所述第2信號是對比上述第i幀靠前3幀的幀即第i 一 3幀的重建后的信號進行加窗處理后的信號，該第i 一 3幀的重建后的信號是通過將比上述第i幀靠前2幀的幀即第i 一 2幀用上述低延遲變換解碼步驟解碼而得到的，所述第3信號是對上述第i 一I幀進行上述低延遲逆濾波器組處理及加窗處理后的信號的與上述第i 一 3幀對應的部分；以及進行將如下信號相加的處理而生成與編碼前的上述第i 一 I幀的后半部分對應的信號，所述如下信號包括:將相當于上述第2信號的幀的后半部分的信號與對相當于上述第2信號的幀的前半部分的信號進行折疊處理后的信號相加、并進行加窗處理后的信號；對上述第I信號進行折疊處理及加窗處理后的信號；和相當于上述第3信號的幀的后半部分的信號；或者
(2) 進行將如下信號相加的處理而生成與編碼前的上述第i 一 I幀的前半部分對應的信號，所述如下信號包括:將相當于上述第2信號的幀的前半部分的信號與對相當于上述第2信號的幀的后半部分的信號進行折疊處理后的信號相加、并進行加窗處理后的信號；對上述第I信號進行折疊處理及加窗處理后的信號；和相當于上述第3信號的幀的前半部分的信號；以及進行將如下信號相加的處理而生成與編碼前的上述第i 一 I幀的后半部分對應的信號，所述如下信號包括:將相當于上述第2信號的幀的后半部分的信號與對相當于上述第2信號的幀的前半部分的信號進行折疊處理后的信號相加、并進行加窗處理后的信號；對上述第I信號進行加窗處理后的信號；和相當于上述第3信號的幀的后半部分的信號。
17.一種聲音信號解碼方法，對包括通過使用了低延遲濾波器組的音頻編碼處理而被編碼的音頻幀、和通過使用了線性預測系數(shù)的語音編碼處理而被編碼的語音幀的比特流進行解碼，其特征在于，具備: 低延遲變換解碼步驟，利用低延遲逆濾波器組處理對上述音頻幀進行解碼；語音信號解碼步驟，對上述語音幀進行解碼；控制步驟，進行控制，以便在上述比特流中的解碼對象幀是上述音頻幀的情況下將該解碼對象幀通過上述低延遲變換解碼步驟解碼、在上述解碼對象幀是上述語音幀的情況下將該解碼對象幀通過上述語音信號解碼步驟解碼；當上述解碼對象幀是作為從上述語音幀切換為上述音頻幀后的最初的音頻幀的第i幀時，上述控制步驟進行將第5信號、第7信號、第8信號相加的處理而生成作為與編碼前的比上述第i幀靠前I幀的幀即第i 一 I幀對應的信號的重建信號，其中所述第5信號是將第4信號與對該第4信號進行折疊處理后的信號相加、并進行加窗處理后的信號，所述第4信號是對將上述第i 一 I幀用上述語音信號解碼步驟解碼得到的信號進行加窗處理后的信號；所述第7信號是將第6信號與對該第6信號進行折疊處理后的信號相加、并進行加窗處理后的信號，所述第6信號是對將比上述第i幀靠前3幀的幀即第i 一 3幀用上述語音信號解碼步驟解碼得到的信號進行加窗處理后的信號；所述第8信號是對上述第i幀進行上述低延遲逆濾波器組處理及加窗處理后的信號的與上述第i 一 3幀對應的部分。
18.一種聲音信號解碼方法，對包括通過使用了低延遲濾波器組的音頻編碼處理而被編碼的音頻幀、和通過使用了線性預測系數(shù)的語音編碼處理而被編碼的語音幀的比特流進行解碼，其特征在于，具備: 低延遲變換解碼步驟，使用低延遲逆濾波器組處理對上述音頻幀進行解碼； TCX解碼步驟，對通過TCX變換碼激勵方式編碼的上述語音幀進行解碼；以及控制步驟，進行控制，以便在上述比特流中的解碼對象幀是上述音頻幀的情況下將該解碼對象幀通過上述低延遲變換解碼步驟解碼、在上述解碼對象幀是上述語音幀的情況下將該解碼對象幀通過上述語音信號解碼步驟解碼；當上述解碼對象幀是從上述音頻幀切換為上述語音幀后的最初的上述語音幀、而且是作為能量急劇變化的過渡信號被編碼的幀的第i幀時，在上述第i幀中，以編碼后的狀態(tài)包含第I信號，該第I信號是使用比上述第i幀靠前I幀的幀即第i 一 I幀的編碼前的信號而生成的；上述控制步驟(1) 進行將如下信號相加的處理而生成與編碼前的上述第i 一I幀的前半部分對應的信號，所述如下信號包括:將相當于第2信號的幀的前半部分的信號與對相當于上述第2信號的幀的后半部分的信號進行折疊處理后的信號相加、并進行加窗處理后的信號；通過將上述第i幀用上述語音信號解碼步驟解碼而得到的、對上述第I信號進行加窗處理后的信號；和第3信號的幀的前半部分的信號，其中所述第2信號是對比上述第i幀靠前3幀的幀即第i 一 3幀的重建后的信號進行加窗處理后的信號，該第i 一 3幀的重建后的信號是通過將比上述第i幀靠前2幀的幀即第i 一 2幀用上述低延遲變換解碼步驟解碼而得到的，所述第3信號是對上述第i 一I幀進行上述低延遲逆濾波器組處理及加窗處理后的信號的與上述第i 一 3幀對應的部分；以及進行將如下信號相加的處理而生成與編碼前的上述第i 一 I幀的后半部分對應的信號，所述如下信號包括:將相當于上述第2信號的幀的后半部分的信號與對相當于上述第2信號的幀的前半部分的信號進行折疊處理后的信號相加、并進行加窗處理后的信號；對上述第I信號進行折疊處理及加窗處理后的信號；和相當于上述第3信號的幀的后半部分的信號；或者
(2) 進行將如下信號相加的處理而生成與編碼前的上述第i 一 I幀的前半部分對應的信號，所述如下信號包括:將相當于上述第2信號的幀的前半部分的信號與對相當于上述第2信號的幀的后半部分的信號進行折疊處理后的信號相加、并進行加窗處理后的信號；對上述第I信號進行折疊處理及加窗處理后的信號；和相當于上述第3信號的幀的前半部分的信號；以及進行將如下信號相加的處理而生成與編碼前的上述第i 一 I幀的后半部分對應的信號，所述如下信號包括:將相當于上述第2信號的幀的后半部分的信號與對相當于上述第2信號的幀的前半部分的信號進行折疊處理后的信號相加、并進行加窗處理后的信號；對上述第I信號進行加窗處理后的信號；和相當于上述第3信號的幀的后半部分的信號。
19.一種聲音信號編碼方法,其特征在于，包括: 判斷步驟，分析聲音信號的音頻特性，判斷包含在上述聲音信號中的幀是音頻信號還是語首?目號; 低延遲變換編碼步驟，使用低延遲濾波器組對上述幀進行編碼；語音信號編碼步驟，通過計算上述幀的線性預測系數(shù)，對該幀進行編碼；以及控制步驟，進行控制，以便將上述判斷步驟判斷為是上述音頻信號的編碼對象幀通過上述低延遲變換編碼步驟編碼、將上述判斷步驟判斷為是上述語音信號的上述編碼對象幀通過上述語音信號編碼步驟編碼；上述控制步驟 (I)在上述編碼對象幀是作為上述判斷步驟判斷為是上述語音信號的幀的第i 一 I幀的I幀后的幀、而且是作為上述判斷步驟判斷為是上述音頻信號的幀的第i幀時，將如下信號和上述第i幀通過上述語音信號編碼步驟編碼:該信號是將對相當于上述第i 一 I幀的前半部分的信號進行加窗處理后的信號、與對相當于上述第i 一 I幀的后半部分的信號進行加窗處理并進行折疊處理后的信號相加而得到的信號；或者 (2)將如下信號和上述第i幀通過上述語音信號編碼步驟編碼:該信號是將對相當于上述第i 一 I幀的后半部分的信號進行加窗處理后的信號、與對相當于上述第i 一 I幀的前半部分的信號進行加窗處理并進行折疊處理后的信號相加而得到的信號。
20.—種聲音信號編碼方法,其特征在于，包括: 判斷步驟，分析聲音信號的音頻特性，判斷包含在上述聲音信號中的幀是音頻信號還是語首?目號; 低延遲變換編碼步驟，使用低延遲濾波器組對上述幀進行編碼； TCX編碼步驟，通過對上述幀的線性預測系數(shù)的殘差進行MDCT改進離散余弦變換處理的TCX方式，對上述幀進行編碼；控制步驟，進行控制，以便將上述判斷步驟判斷為是上述音頻信號的編碼對象幀通過上述低延遲變換編碼步驟編碼、將上述判斷步驟判斷為是上述語音信號的上述編碼對象幀通過上述語音信號編碼步驟編碼；當作為上述編碼對象幀的第i幀是上述判斷步驟判斷為是上述音頻信號、并且是能量急劇地變化的過渡信號的幀時，上述控制步驟 (1)將如下信號和上述第i幀通過上述語音信號編碼步驟編碼:該信號是將將相當于比上述第i幀靠前I幀的幀即第i 一 I幀的前半部分的信號進行加窗處理后的信號、與對相當于上述第i 一I幀的后半部分的信號進行加窗處理并進行折疊處理后的信號相加而得到的信號；或者 (2)將如下信號和上述第i幀通過上述語音信號編碼步驟編碼:該信號是將對相當于上述第i 一 I幀的后半部分的信號進行加窗處理后的信號、與對相當于上述第i 一 I幀的前半部分的信號進行加窗處理并進行折疊處理后的信號相加而得到的信號。
【文檔編號】G10L19/20GK103477388SQ201280004337
【公開日】2013年12月25日申請日期:2012年10月24日優(yōu)先權(quán)日:2011年10月28日
【發(fā)明者】石川智一, 則松武志, 張國成, 趙丹申請人:松下電器產(chǎn)業(yè)株式會社

完整全部詳細技術(shù)資料下載