語音編碼裝置和語音編碼方法

文檔序號：2829221閱讀：245來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：語音編碼裝置和語音編碼方法
技術(shù)領(lǐng)域：
本發(fā)明涉及語音編碼裝置和語音編碼方法。
背景技術(shù)：
在語音編碼中，將時間信號變換到頻域并對變換系數(shù)進(jìn)行編碼的變換編碼，能夠有效率地去除時間信號所包含的冗余性。另外，在變換編碼，通過利用以頻帶表示的人的聽覺特性，即使為低比特率，也能夠?qū)崿F(xiàn)難以感覺到量化失真的編碼。
近年來，在變換編碼中，多利用被稱為重疊正交變換(LOT；LappedOrthogonal Transform)的變換技術(shù)。這種技術(shù)是基于除了塊內(nèi)的正交性以外還考慮與相鄰塊之間的正交性的正交基，進(jìn)行變換的技術(shù)，作為其代表的方法，可以舉MDCT(Modified Discrete Cosine Transform)。在MDCT，以當(dāng)前的分析幀和其前后的分析幀重疊的方式配置分析幀而進(jìn)行分析。這時，變換后的系數(shù)中，只將分析長度的一半的系數(shù)作為編碼對象即可，因此通過利用MDCT能夠有效率地進(jìn)行編碼。并且，在合成時將當(dāng)前幀與相鄰的幀重疊相加，因此有以下特點，即，即使在對每個幀發(fā)生不同的量化失真的情況下，也難以發(fā)生在幀邊界的間斷。
一般來說，在利用MDCT進(jìn)行分析/合成時，將作為窗口函數(shù)的分析窗口和合成窗口分別與對象信號相乘。這時所使用的分析窗口/合成窗口與相鄰幀重疊的位置的部分傾斜(slope)。該重疊區(qū)間的長度(即，斜坡長)與輸入幀的緩存所需的延遲相當(dāng)于因MDCT分析/合成而發(fā)生的延遲的長度。在雙向通信中，如果該延遲變大，使得來自通信對方終端的響應(yīng)達(dá)到本終端為止要費較長時間，無法形成流暢的會話。因此期望延遲盡量短。
下面，說明現(xiàn)有的MDCT。
在MDCT所使用的分析窗口/合成窗口，在滿足式(1)所示的條件時，能夠?qū)崿F(xiàn)完全重構(gòu)(在沒有量化失真的前提下，變換造成的失真為0)。
(式1)
win(i)·wout(i)+win(i+N/2)·wout(i+N/2)＝1(0≤i＜N)作為滿足式(1)的條件的有代表性的窗口，在非專利文獻(xiàn)1提出了式(2)所示的正弦窗口。另外，圖1是用圖表示該正弦窗口的圖。在使用這樣的正弦窗口時，因為正弦窗口的譜特性能夠充分的衰減旁瓣，所以能夠以較高的精度分析頻譜。(式2)w(i)=sin(iπN)]]>(0≤i＜N)另外，在非專利文獻(xiàn)2提出了使用式(3)所示的窗口作為滿足式(1)的條件的窗口，來進(jìn)行MDCT分析/合成的方法。其中，N表示分析窗口的長度，L表示重疊區(qū)間的長度。另外，圖2是用圖表示式(3)所示的窗口的圖。在使用這種窗口時，因為重疊區(qū)間為L，所以由該窗口產(chǎn)生的延遲表示為L。因此，通過將重疊區(qū)間L設(shè)定得短，能夠抑制延遲的發(fā)生。
(式3)w(i)=00≤i<14N-12Lcos(π·(i-N/4-L/2)2L)14N-12L≤i<14N+12L114N+12L≤i<34N-12Lcos(π·(i-3N/4+L/2)2L)34N-12L≤i<34N+12L034N+12L≤i<N]]>(非專利文獻(xiàn)1)守谷健弘著，“音聲符號化”，(社)電子情報通信學(xué)會，1998年10月20日，pp.36-38(非專利文獻(xiàn)2)M.Iwadare，et al.，“A 128 kb/s Hi-Fi Audio CODEC Basedon Adaptive Transform Coding with Adaptive Block Size MDCT，”IEEE Journalon Selected Areas in Communications，Vol.10，No.1，pp.138-144，Jan.1992.

發(fā)明內(nèi)容
本發(fā)明需要解決的問題在使用式(2)所示的正弦窗口時，如圖1所示，相鄰的分析幀的重疊區(qū)間為分析幀的1/2的長度。在本例子中，因為分析幀長為N，所以重疊區(qū)間為N/2。因此，在合成端，合成位于N/2～N-1的信號時，除非獲得下一個分析幀的信息，否則無法合成信號。也就是說，直到獲得位于(3N/2)-1的采樣值為止，不能在下一個分析幀進(jìn)行MDCT分析，獲得(3N/2)-1的位置的樣本后，才能在下一個分析幀進(jìn)行MDCT分析，能夠使用該分析幀的變換系數(shù)來合成N/2～N-1的信號。因此，在使用正弦窗口時，發(fā)生N/2長度的延遲。
另一方面，在使用式(3)所示的窗口時，由于重疊區(qū)間L較短，容易發(fā)生幀間的間斷。對當(dāng)前分析幀和下一個分析幀分別進(jìn)行MDCT分析并量化其變換系數(shù)時，因為分別獨立進(jìn)行量化，在當(dāng)前分析幀和下分析幀分別發(fā)生不同的量化失真。將附加了量化失真的變換系數(shù)逆變換到時域的話，對該時間信號在整個合成幀附加量化失真。也就是說，無相關(guān)地發(fā)生當(dāng)前的合成幀的量化失真和下一個合成幀的量化失真。因此，在重疊區(qū)間較短時，在合成幀間的相鄰部分，不能充分的吸收起因于量化失真的解碼信號的間斷性，而會感覺到幀間的連接失真。使重疊區(qū)間越短，這種傾向越顯著地發(fā)生。
本發(fā)明的目的為提供能夠?qū)⒀舆t量抑制為低延遲，并且能夠減輕連接失真的語音編碼裝置和語音編碼方法。
解決問題的方案本發(fā)明的語音編碼裝置所采用的結(jié)構(gòu)包括第一分析單元，對時域的語音信號的一幀按較長的分析長度和較短的分析長度兩者進(jìn)行MDCT分析，從而獲得頻域的兩種變換系數(shù)；以及編碼單元，對所述兩種變換系數(shù)進(jìn)行編碼。
發(fā)明的有益效果根據(jù)本發(fā)明，能夠?qū)⒀舆t量抑制為低延遲，并且能夠減輕連接失真。

圖1是表示以往的分析窗口的圖。
圖2是表示以往的分析窗口的圖。
圖3是表示本發(fā)明實施方式1的語音編碼裝置和語音解碼裝置的結(jié)構(gòu)的圖。
圖4是表示本發(fā)明實施方式1的語音編碼裝置的結(jié)構(gòu)的方框圖。
圖5是本發(fā)明實施方式1的語音編碼裝置的信號狀態(tài)轉(zhuǎn)移圖。
圖6是表示本發(fā)明實施方式1的分析窗口的圖。
圖7是表示本發(fā)明實施方式1的語音解碼裝置的結(jié)構(gòu)的方框圖。
圖8是本發(fā)明實施方式1的語音解碼裝置的信號狀態(tài)轉(zhuǎn)移圖。
圖9是本發(fā)明實施方式1的語音編碼裝置的動作說明圖。
圖10是表示本發(fā)明實施方式1的分析窗口的圖。
圖11是表示本發(fā)明實施方式1的分析窗口的圖。
圖12是表示本發(fā)明實施方式2的分析窗口的圖。
圖13是表示本發(fā)明實施方式2的語音編碼裝置的結(jié)構(gòu)的方框圖。
圖14是表示本發(fā)明實施方式2的語音解碼裝置的結(jié)構(gòu)的方框圖。
具體實施例方式
下面，參照附圖詳細(xì)地說明本發(fā)明的實施方式。
(實施方式1)本發(fā)明實施方式1的語音編碼裝置和語音解碼裝置的結(jié)構(gòu)為如圖3所示。如該圖所示，語音編碼裝置包括幀構(gòu)成單元10、分析單元20和變換系數(shù)編碼單元30。另外，語音解碼裝置包括變換系數(shù)解碼單元50、合成單元60和幀連接單元70。
在語音編碼裝置中，幀構(gòu)成單元10對所輸入的時域的語音信號進(jìn)行幀化。分析單元20將所幀化的時域的語音信號通過MDCT分析而變換到頻域信號。變換系數(shù)編碼單元30對由分析單元20獲得的變換系數(shù)進(jìn)行編碼，并輸出編碼參數(shù)。該編碼參數(shù)通過傳輸路徑被發(fā)送到語音解碼裝置。
在語音解碼裝置中，變換系數(shù)解碼單元50對通過傳輸路徑發(fā)送來的編碼參數(shù)進(jìn)行解碼。合成單元60通過MDCT合成，由解碼的變換系數(shù)生成時域信號。幀連接單元70連接時域信號以在相鄰的幀間不產(chǎn)生間斷，并輸出解碼語音信號。
接著，進(jìn)一步詳細(xì)地說明語音編碼裝置。語音編碼裝置的更詳細(xì)的結(jié)構(gòu)為如圖4所示，信號的狀態(tài)遷移為如圖5所示。其中，圖4所示的信號A～G分別與圖5所示的信號A～G對應(yīng)。
語音信號A被輸入到幀構(gòu)成單元10后，由幀構(gòu)成單元10決定用于長分析的分析幀區(qū)間(長分析幀)和用于短分析的分析幀區(qū)間(短分析幀)。然后，幀構(gòu)成單元10將長分析幀信號B輸出到長分析單元21的窗口乘法單元211，并將短分析幀信號C輸出到短分析單元22的窗口乘法單元221。另外，長分析幀長(長分析窗口長)和短分析幀長(短分析窗口長)是預(yù)先決定的，這里假設(shè)長分析幀長為M1，短分析幀長為M2(M1＞M2)的情況進(jìn)行說明。因此，產(chǎn)生的延遲為M2/2。
在長分析單元21，窗口乘法單元211對分析長度(分析窗口長)M1的長分析幀信號B乘以分析窗口，并將乘以該分析窗口的信號D輸出到MDCT單元212。作為分析窗口使用如圖6所示的長分析窗口。該長分析窗口是基于式(3)，以分析長度為M1、重疊區(qū)間為M2/2的條件而設(shè)計的分析窗口。
MDCT單元212根據(jù)式(4)對信號D施以MDCT。然后，MDCT單元212將通過該MDCT而獲得的變換系數(shù)F輸出到變換系數(shù)編碼單元30。另外，在式(4)中，{s1(i)；0≤i＜M1}代表長分析幀所包含的時間信號，{X1(k)；0≤k＜M1/2}代表通過長分析而獲得的變換系數(shù)F。
(式4)X1(k)=2M1Σi=0M1-1s1(i)cos(2i+1+M1/2(2k+1)π2·M1)]]>另一方面，在短分析單元22，窗口乘法單元221對分析長度(分析窗口長)M2的短分析幀信號C乘以分析窗口，并將乘以該分析窗口的信號E輸出到MDCT單元222。作為分析窗口使用如圖6所示的短分析窗口。該短分析窗口是基于式(2)以分析長度為M2(M2＜M1)的條件而設(shè)計的分析窗口。
MDCT單元222根據(jù)式(5)對信號E進(jìn)行MDCT。然后，MDCT單元222將通過該MDCT而獲得的變換系數(shù)G輸出到變換系數(shù)編碼單元30。另外，在式(5)中，{s2(i)；0≤i＜M2}表示短分析幀所包含的時間信號，{X2(k)；0≤k＜M2/2}表示通過短分析而獲得的變換系數(shù)G。
(式5)X2(k)=2M2Σi=0M2-1s2(i)cos((2i+1+M2/2)(2k+1)π2·M2)]]>變換系數(shù)編碼單元30對變換系數(shù)F:{X1(k)}和變換系數(shù)G:{X2(k)}進(jìn)行編碼，將各個編碼參數(shù)時分復(fù)用并輸出。這時，變換系數(shù)編碼單元30對變換系數(shù){X2(k)}，進(jìn)行與變換系數(shù){X1(k)}的編碼相比精度更高的(量化誤差更小的)編碼。例如，變換系數(shù)編碼單元30將變換系數(shù){X2(k)}的每個變換系數(shù)的編碼比特數(shù)設(shè)定得比變換系數(shù){X1(k)}的每個變換系數(shù)的編碼比特數(shù)高，從而對變換系數(shù){X1(k)}和變換系數(shù){X2(k)}進(jìn)行編碼。也就是說，在變換系數(shù)編碼單元30，以與變換系數(shù){X1(k)}相比使變換系數(shù){X2(k)}的量化失真較小的方式進(jìn)行編碼。另外，作為在變換系數(shù)編碼單元30的編碼方法，還可采用例如特開2003-323166號公報所記載的編碼方法等。
接著，更詳細(xì)地說明語音解碼裝置。語音解碼裝置的更詳細(xì)的結(jié)構(gòu)為如圖7所示，信號的狀態(tài)遷移為如圖8所示。其中，圖7所示的信號A～I(xiàn)分別與圖8所示的信號A～I(xiàn)對應(yīng)。
編碼參數(shù)被輸入到變換系數(shù)解碼單元50后，在編碼系數(shù)解碼單元50對解碼變換系數(shù)(長分析){X1q(k)；0≤k＜M1/2}:A和解碼變換系數(shù)(短分析){X2q(k)；0≤k＜M2/2}:B進(jìn)行解碼。然后，變換系數(shù)解碼單元50將解碼變換系數(shù){X1q(k)}:A輸出到長合成單元61的IMDCT單元611，并將解碼變換系數(shù){X2q(k)}:B輸出到短合成單元62的IMDCT單元621。
在長合成單元61，IMDCT單元611對解碼變換系數(shù){X1q(k)}進(jìn)行IMDCT(在MDCT單元212進(jìn)行的MDCT的逆變換)而生成長合成信號C，并將該長合成信號C輸出到窗口乘法單元612。
窗口乘法單元612對長合成信號C乘以合成窗口，并將該乘以合成窗口的信號E輸出到幀內(nèi)連接單元71。就合成窗口來說，與語音編碼裝置的窗口乘法單元211相同地，使用如圖6所示的長分析窗口。
另一方面，在短合成單元62，IMDCT單元621對解碼變換系數(shù){X2q(k)}進(jìn)行IMDCT(在MDCT單元222進(jìn)行的MDCT的逆變換)來生成短合成信號D，并將該短合成信號D輸出到窗口乘法單元622。
窗口乘法單元622對短合成信號D乘以合成窗口，并將該乘以合成窗口的信號F輸出到幀內(nèi)連接單元71。就合成窗口來說，與語音編碼裝置的窗口乘法單元211相同地，使用如圖6所示的短分析窗口。
然后，在幀內(nèi)連接單元71生成第n幀的解碼信號G，接著由幀間連接單元73，將第n幀的解碼信號G和第n-1幀的解碼信號H的對應(yīng)的區(qū)間重疊相加，從而生成解碼語音信號。也就是說，在幀內(nèi)連接單元71，將信號E和信號F的對應(yīng)的區(qū)間重疊相加而生成第n幀的解碼信號{sq(i)；0≤i＜M1}:G。并且，在幀間連接單元73，將第n幀的解碼信號G和緩存器72所緩存的第n-1幀的解碼信號H的對應(yīng)的區(qū)間重疊相加，從而生成解碼語音信號I。然后，將第n幀的解碼信號G存儲于緩存器72，以便用于下一幀(第n+1幀)的處理。
接著，圖9表示語音信號的各個幀與分析單元20中的分析位置之間的對應(yīng)關(guān)系。如圖9所示，在本實施方式中，一幀區(qū)間(生成編碼參數(shù)的單位)的語音信號的分析，對任何一幀都必需通過長分析和短分析的組合來進(jìn)行。
這樣，在本實施方式，因為以較長的分析長度(長分析)和較短的分析長度(短分析)的組合方式進(jìn)行MDCT分析，并且，以使通過短分析而獲得的變換系數(shù)的量化誤差較小的方式進(jìn)行編碼處理，所以能夠在延遲較短的狀態(tài)下取較長的分析長度以便高效率地去除冗余性，同時能夠使短分析的變換系數(shù)的量化失真小。由此，能夠?qū)⒀舆t量抑制為M2/2的低延遲，并且能夠減輕連接失真。
另外，有關(guān)在一幀區(qū)間中的長分析窗口和短分析窗口的配置，在圖6中，從時間上來說，在長分析窗口的后面配置短分析窗口，但是也可例如圖10所示，從時間上來說，在短分析窗口的后面配置長分析窗口。即使進(jìn)行如圖10所示的配置，與如圖6所示的配置一樣，也能夠?qū)⒀舆t量抑制為低延遲，并且能夠減輕連接失真。
并且，在本實施方式，基于式(2)來設(shè)計短分析窗口，但只要短分析窗口的分析長度M2和長分析窗口的分析長度M1的關(guān)系為M2＜M1，也可使用式(3)所示的窗口作為短分析窗口。即，也可將基于式(3)以分析長度為M2的條件來設(shè)計的窗口作為短分析窗口使用。圖11表示其一例。在這樣的分析窗口的結(jié)構(gòu)中，也能夠?qū)⒀舆t量抑制為低延遲，并且能夠減輕連接失真。
(實施方式2)在輸入到語音編碼裝置的語音信號是起頭部或特性急劇變化的遷移部時，與頻率分辨率相比，更需要時間分辨率。對于這樣的語音信號，在使用短分析幀分析所有的分析幀時，能夠進(jìn)一步提高語音質(zhì)量。
因此，在本實施方式，將對各個幀進(jìn)行的MDCT分析根據(jù)輸入語音信號的特性切換為(1)由長分析和短分析的組合來進(jìn)行的模式(長短混合分析模式)和(2)多次重復(fù)進(jìn)行短分析的模式(全短分析模式)。圖12表示在全短分析模式時，對各個幀使用的分析/合成窗口的例子。另外，長短混合分析模式的說明為如在實施方式1所述。
圖13表示本發(fā)明實施方式2的語音編碼裝置的結(jié)構(gòu)。如本圖所示，本實施方式的語音編碼裝置除了實施方式1的結(jié)構(gòu)(圖4)以外，還包括判定單元15、復(fù)用單元35、SW(開關(guān))11和SW12。在圖13中，對與圖4相同的結(jié)構(gòu)賦予相同的標(biāo)號，并省略其說明。另外，實際上，如圖4所示并行地進(jìn)行從幀構(gòu)成單元10到分析單元20的輸出和從分析20到變換系數(shù)編碼單元30的輸出，但這里為了圖示上的方便，用一條信號線表示。
判定單元15對輸入語音信號進(jìn)行分析而判定信號的特性。在特性判定中，監(jiān)視語音信號的特征量的時間上的變化，在其變化量低于規(guī)定量時，判定為穩(wěn)定部分，在規(guī)定量以上時，判定為非穩(wěn)定部分。作為語音信號的特征量，例如可以舉短區(qū)間功率、短區(qū)間頻譜等。
然后，判定單元15根據(jù)判定結(jié)果，將MDCT分析的分析模式切換為長短混合分析模式或全部短分析模式。也就是說，判定單元15，在所輸入的語音信號為穩(wěn)定部分時，將SW11和SW12接到分析單元20端，并使用分析單元20以長短混合分析模式進(jìn)行MDCT分析。另一方面，所輸入的語音信號為非穩(wěn)定部分時，將SW11和SW12接到全部短分析單元25端，使用全短分析單元25以全部短分析模式進(jìn)行MDCT分析。通過該切換，對于語音信號的幀，在它是穩(wěn)定部分時如實施方式1所示地由長分析和短分析的組合進(jìn)行分析，在它是非穩(wěn)定部分時多次重復(fù)進(jìn)行短分析。
由判定單元15選擇全部短分析模式時，全部短分析單元25使用式(2)所示的分析窗口，其中假設(shè)分析窗口長為M2，通過式(5)所示的MDCT進(jìn)行分析。
另外，在判定單元15，對表示是穩(wěn)定部分還是非穩(wěn)定部分的判定信息進(jìn)行編碼，并輸出到復(fù)用單元35。由復(fù)用單元35將該判定信息與從變換系數(shù)編碼單元30輸出的編碼參數(shù)復(fù)用并輸出。
另一方面，圖14表示本發(fā)明實施方式2的語音解碼裝置的結(jié)構(gòu)。如本圖所示，本實施方式的語音解碼裝置除了實施方式1的結(jié)構(gòu)(圖7)以外，還包括分離單元45、判定信息解碼單元55、全部短合成單元65、SW21和SW22。在圖14中，對與圖7相同的結(jié)構(gòu)賦予相同的標(biāo)號，并省略其說明。另外，實際上，如圖7所示并行地進(jìn)行從變換系數(shù)解碼單元50到合成單元60的輸出和從合成單元60到幀內(nèi)連接單元71的輸出，但這里為了圖示上的方便，用一條信號線表示。
分離單元45將輸入的編碼參數(shù)分離為表示判定信息的編碼參數(shù)和表示變換系數(shù)的編碼參數(shù)，分別輸出到判定信息解碼單元55和變換系數(shù)解碼單元50。
判定信息解碼單元55對所輸入的判定信息進(jìn)行解碼。然后，判定信息解碼單元55，在判定信息表示穩(wěn)定部分時，將SW21和SW22連接到合成單元60端上，并使用合成單元60來生成合成信號。另外，關(guān)于使用合成單元60的合成信號的生成，如實施方式1所述。另一方面，判定信息表示非穩(wěn)定部分時，將SW21和SW22連接到全部短合成單元65端上，并使用全部短合成單元65來生成合成信號。全部短合成單元65對一幀中的多個解碼變換系數(shù)(短分析)的每一個進(jìn)行IMDCT處理，從而生成合成信號。
這樣，在本實施方式，在一幀中，在輸入語音信號為穩(wěn)定部分而穩(wěn)定時，對該幀的語音信號以長分析和短分析的組合進(jìn)行分析，而在輸入語音信號為非穩(wěn)定部分時(在輸入語音信號急劇變化時)，對該幀的語音信號都以短分析進(jìn)行分析以便提高時間分辨率，因此，能夠根據(jù)輸入語音信號的特性能夠進(jìn)行最適合的MDCT分析，即使在輸入語音信號的特性變化時，也能夠良好地保持語音質(zhì)量。
另外，在本實施方式，使長短混合分析模式的重疊區(qū)間與全短分析模式的重疊區(qū)間為同一區(qū)間。因此，不需使用例如ISO/IEC IS 13818-7 Informationtechnology--Generic coding of moving pictures and associated audio information--Part 7Advanced Audio Coding(AAC)所記載的LONG_START_WINDOW或LONG_STOP_WINDOW等轉(zhuǎn)移用的分析幀。
另外，作為判定是長短混合分析模式還是全部短分析模式的另外一個方法，可以列舉下述方法，即，根據(jù)位于與下一幀的連接部的信號的、相對于原本信號的SNR的大小來判定的方法。通過使用該判定方法，能夠根據(jù)連接部的SNR決定下一幀的分析模式，因此能夠降低分析模式的誤判定。
另外，上述各個實施方式可適用于層數(shù)為二以上的分層編碼的擴(kuò)展層。
另外，上述各個實施方式的語音編碼裝置、語音解碼裝置可裝載于在移動通信系統(tǒng)中所使用的無線通信移動裝置和無線通信基站裝置等無線通信裝置。
另外，在上述實施方式中，舉例說明由硬件構(gòu)成本發(fā)明的情況，但本發(fā)明還可由軟件實現(xiàn)。
另外，用于上述實施方式的說明中的各功能塊通常被作為集成電路的LSI來實現(xiàn)。這些塊既可以被單獨地集成為一個芯片，也可以是一部分或全部被集成為一個芯片。雖然此處稱為LSI，但根據(jù)集成程度，可以被稱為IC、系統(tǒng)LSI、超級LSI(Super LSI)、或特大LSI(Ultra LSI)。
另外，實現(xiàn)集成電路化的方法不僅限于LSI，也可使用專用電路或通用處理器來實現(xiàn)。也可以使用在LSI制造后，可編程的FPGA(Field ProgrammableGate Array)，或者可重構(gòu)LSI內(nèi)部的電路單元的連接和設(shè)定的可重構(gòu)處理器。
再者，隨著半導(dǎo)體的技術(shù)進(jìn)步或隨之派生的其它技術(shù)的出現(xiàn)，如果能夠出現(xiàn)替代LSI集成電路化的新技術(shù)，當(dāng)然可利用新技術(shù)進(jìn)行功能塊的集成化。還存在著適用生物技術(shù)等的可能性。
本說明書是根據(jù)2004年10月26日申請的日本專利申請第2004-311143號。其內(nèi)容全部包含于此。
工業(yè)實用性本發(fā)明可適用于移動通信系統(tǒng)和采用互聯(lián)網(wǎng)協(xié)議的分組通信系統(tǒng)等的通信裝置。
權(quán)利要求
1.一種語音編碼裝置，包括第一分析單元，對時域的語音信號的一幀按較長的分析長度和較短的分析長度兩者進(jìn)行MDCT分析，從而獲得頻域的兩種變換系數(shù)；以及編碼單元，對上述兩種變換系數(shù)進(jìn)行編碼。
2.如權(quán)利要求1所述的語音編碼裝置，其中，所述編碼單元，對第二變換系數(shù)進(jìn)行與對第一變換系數(shù)的編碼相比精度更高的編碼，該第一變換系數(shù)由所述較長的分析長度獲得，該第二變換系數(shù)由所述較短的分析長度獲得。
3.如權(quán)利要求1所述的語音編碼裝置，其中，還包括判定單元，判定所述語音信號是穩(wěn)定部分還是非穩(wěn)定部分；以及第二分析單元，在所述語音信號是非穩(wěn)定部分時，對所述一幀按所述較短的分析長度多次重復(fù)進(jìn)行MDCT分析。
4.一種無線通信移動臺裝置，包括如權(quán)利要求1所述的語音編碼裝置。
5.一種無線通信基站裝置，包括如權(quán)利要求1所述的語音編碼裝置。
6.一種語音編碼方法，包括分析步驟，對時域的語音信號的一幀按較長的分析長度和較短的分析長度兩者進(jìn)行MDCT分析，從而獲得頻域的兩種變換系數(shù)；以及編碼步驟，對所述兩種變換系數(shù)進(jìn)行編碼。
全文摘要
能夠?qū)⒀舆t量抑制為低延遲，并且能夠減輕連接失真的語音編碼裝置。在該裝置中，在長分析單元(21)，由窗口乘法單元(211)對分析長度M1的長分析幀信號乘以分析窗口，并將乘以了該分析窗口的信號輸出到MDCT單元(212)，由MDCT單元(212)對所輸入的信號進(jìn)行MDCT而獲得長分析幀的變換系數(shù)，并輸出到變換系數(shù)編碼單元(30)。另一方面，在短分析單元(22)，窗口乘法單元(221)對分析長度M2(M2＜M1)的短分析幀信號乘以分析窗口，并將乘以了該分析窗口的信號輸出到MDCT單元(222)，由MDCT單元(222)對所輸入的信號進(jìn)行MDCT而獲得短分析幀的變換系數(shù)，并輸出到變換系數(shù)編碼單元(30)。變換系數(shù)編碼單元(30)對這些變換系數(shù)進(jìn)行編碼并輸出。
文檔編號G10L19/022GK101061533SQ20058003527
公開日2007年10月24日申請日期2005年10月25日優(yōu)先權(quán)日2004年10月26日
發(fā)明者押切正浩申請人:松下電器產(chǎn)業(yè)株式會社

完整全部詳細(xì)技術(shù)資料下載