專利名稱:一種處理音頻信號(hào)的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于對(duì)音頻信號(hào)進(jìn)行處理的裝置以及其方法。雖然本發(fā)明適用于廣泛的應(yīng)用范圍,但是其尤其適用于對(duì)音頻信號(hào)進(jìn)行編碼或解碼。
背景技術(shù):
通常,基于音頻特征的編譯方案被應(yīng)用于諸如音樂信號(hào)這樣的音頻信號(hào),而基于語音特征的編譯方案被應(yīng)用于語音信號(hào)。
發(fā)明內(nèi)容
技術(shù)問題然而,如果將規(guī)定的編譯方案應(yīng)用于在其中音頻和語音特征相互混合的信號(hào),那么音頻編碼效率被降低或者音質(zhì)被惡化。技術(shù)方案因此,本發(fā)明是指用于對(duì)音頻信號(hào)進(jìn)行處理的裝置及其方法,其基本上可消除由于現(xiàn)有技術(shù)的局限性和缺點(diǎn)所造成的一個(gè)或多個(gè)問題。本發(fā)明的目的是提供一種用于對(duì)音頻信號(hào)進(jìn)行處理的裝置及其方法,通過其可將至少兩種編譯方案中的一個(gè)應(yīng)用于一個(gè)幀或子幀。本發(fā)明的另一個(gè)目的是提供一種用于對(duì)音頻信號(hào)進(jìn)行處理的裝置及其方法,通過其在將不同編譯方案應(yīng)用于包括一系列幀的音頻信號(hào)的每個(gè)幀或子幀的過程中,可解決由于與每個(gè)編譯方案相對(duì)應(yīng)的窗口形狀的不對(duì)稱所產(chǎn)生的不匹配。本發(fā)明的另一個(gè)目的是提供一種用于對(duì)音頻信號(hào)進(jìn)行處理的裝置及其方法,通過其可在矩形窗口和非矩形窗口相互接觸時(shí),消除混疊等等。本發(fā)明的另一個(gè)目的是提供一種用于對(duì)音頻信號(hào)進(jìn)行處理的裝置及其方法,通過其,如果頻域方案所應(yīng)用的幀跟在線性預(yù)測(cè)域方案所應(yīng)用的幀之后,則可跳過用于對(duì)窗口長(zhǎng)度差進(jìn)行補(bǔ)償?shù)拇翱趥鬏?。本發(fā)明的另一個(gè)目的是提供一種用于對(duì)音頻信號(hào)進(jìn)行處理的裝置及其方法,通過其以根據(jù)隨后幀的編譯方案來對(duì)與當(dāng)前幀相對(duì)應(yīng)的窗口類型進(jìn)行轉(zhuǎn)換的方式,可解決由于窗口形狀的不對(duì)稱所導(dǎo)致的不匹配。本發(fā)明的進(jìn)一步目的是提供一種用于對(duì)音頻信號(hào)進(jìn)行處理的裝置和方法,通過其以根據(jù)先前幀是否是頻域方案的幀來有選擇地應(yīng)用長(zhǎng)期預(yù)測(cè)的方式,可提高線性預(yù)測(cè)域方案的幀中的比特效率。將在隨后的描述中對(duì)本發(fā)明的附加特征和優(yōu)點(diǎn)進(jìn)行闡述,并且其部分地可從該描述顯而易見地得知,或者從本發(fā)明的實(shí)施中學(xué)習(xí)到。通過所寫的描述和其權(quán)利要求以及附圖中所指出的特定結(jié)構(gòu)可實(shí)現(xiàn)并獲得本發(fā)明的目的及其它優(yōu)點(diǎn)。為了實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,如具體體現(xiàn)且廣泛描述地,提供了一種用于處理音頻信號(hào)的方法,其包括通過音頻處理裝置接收音頻信號(hào),所述音頻信號(hào)包括以矩形編譯方案編碼的第一塊的第一數(shù)據(jù),以及以非矩形編譯方案編碼的第二塊的第二數(shù)據(jù);接收與第二塊相對(duì)應(yīng)的補(bǔ)償信號(hào);利用第一數(shù)據(jù)估計(jì)混疊部分的預(yù)測(cè);根據(jù)第二數(shù)據(jù)、補(bǔ)償信號(hào)、以及混疊部分的預(yù)測(cè)來獲得用于第二塊的重建信號(hào)。根據(jù)本發(fā)明,矩形編譯方案以矩形窗口來編碼或解碼,非矩形編譯方案以非矩形窗口來編碼或解碼。根據(jù)本發(fā)明,根據(jù)校正部分以及混疊部分的誤差來產(chǎn)生補(bǔ)償信號(hào),校正部分對(duì)應(yīng)于和矩形窗口與非矩形窗口之間的不對(duì)稱有關(guān)的差異,混疊部分的誤差對(duì)應(yīng)于混疊部分和混疊部分的預(yù)測(cè)之間的差異。根據(jù)本發(fā)明,混疊部分對(duì)應(yīng)于第一塊和用于非矩形編譯方案的非矩形窗口之間的
重疊部分。根據(jù)本發(fā)明,估計(jì)預(yù)測(cè)包括根據(jù)矩形窗口方案利用第一塊的第一數(shù)據(jù)來產(chǎn)生用于第一塊的輸出信號(hào);利用用于第一塊的輸出信號(hào)以及非矩形窗口來獲得混疊部分的預(yù)測(cè)。根據(jù)本發(fā)明,重建信號(hào)近似于以矩形窗口處理的信號(hào),該矩形窗口與用于非矩形編譯方案的非矩形窗口不同。根據(jù)本發(fā)明,獲得重建信號(hào)包括對(duì)第二數(shù)據(jù)進(jìn)行逆頻率變換以產(chǎn)生時(shí)域第二信號(hào);對(duì)補(bǔ)償信號(hào)進(jìn)行逆頻率變換以產(chǎn)生時(shí)域補(bǔ)償信號(hào);通過將時(shí)域補(bǔ)償信號(hào)添加到時(shí)域第二信號(hào)和混疊部分的預(yù)測(cè),而獲得重建信號(hào)。根據(jù)本發(fā)明,第一塊與幀和子幀中的一個(gè)相對(duì)應(yīng),并且第二塊與幀和子幀中的一個(gè)相對(duì)應(yīng)。為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供一種用于處理音頻信號(hào)的裝置,其包括解復(fù)用器,其接收音頻信號(hào),所述音頻信號(hào)包括以矩形編譯方案編碼的第一塊的第一數(shù)據(jù),以及以非矩形編譯方案編碼的第二塊的第二數(shù)據(jù),并且用于接收與第二塊相對(duì)應(yīng)的補(bǔ)償信號(hào);矩形解碼單元,用于利用第一數(shù)據(jù)估計(jì)混疊部分的預(yù)測(cè);以及非矩形解碼單元,用于根據(jù)第二數(shù)據(jù)、補(bǔ)償信號(hào)、以及混疊部分的預(yù)測(cè)來獲得用于第二塊的重建信號(hào)。根據(jù)本發(fā)明,矩形編譯方案以矩形窗口來編碼或解碼,非矩形編譯方案以非矩形窗口來編碼或解碼。根據(jù)本發(fā)明,根據(jù)校正部分以及混疊部分的誤差來產(chǎn)生補(bǔ)償信號(hào),校正部分對(duì)應(yīng)于和矩形窗口與非矩形窗口之間的不對(duì)稱有關(guān)的差異,混疊部分的誤差對(duì)應(yīng)于混疊部分和混疊部分的預(yù)測(cè)之間的差異。根據(jù)本發(fā)明,混疊部分對(duì)應(yīng)于第一塊與用于非矩形編譯方案的非矩形窗口之間的
重疊部分。根據(jù)本發(fā)明,矩形解碼單元被配置成根據(jù)矩形窗口方案,利用第一塊的第一數(shù)據(jù)來產(chǎn)生用于第一塊的輸出信號(hào);并且利用用于第一塊的輸出信號(hào)和非矩形窗口來獲得混疊部分的預(yù)測(cè)。根據(jù)本發(fā)明,重建信號(hào)近似于以矩形窗口處理的信號(hào),該矩形窗口與用于非矩形編譯方案的非矩形窗口不同。根據(jù)本發(fā)明,非矩形解碼單元被配置成對(duì)第二數(shù)據(jù)進(jìn)行逆頻率變換以產(chǎn)生時(shí)域第二信號(hào);對(duì)補(bǔ)償信號(hào)進(jìn)行逆頻率變換以產(chǎn)生時(shí)域補(bǔ)償信號(hào);以及通過將時(shí)域補(bǔ)償信號(hào)添加到時(shí)域第二信號(hào)和混疊部分的預(yù)測(cè),來獲得重建信號(hào)。根據(jù)本發(fā)明,第一塊與幀和子幀中的一個(gè)相對(duì)應(yīng),并且第二塊與幀和子幀中的一個(gè)相對(duì)應(yīng)。為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供了一種用于處理音頻信號(hào)的方法,包括通過音頻處理裝置接收編譯標(biāo)識(shí)信息,所述編譯標(biāo)識(shí)信息表示是將第一編譯方案還是第二編譯方案應(yīng)用于當(dāng)前幀;當(dāng)編譯標(biāo)識(shí)信息表示將第二編譯方案應(yīng)用于當(dāng)前幀時(shí),接收窗口類型信息,該窗口類型信息表示多個(gè)窗口當(dāng)中的用于當(dāng)前幀的特定窗口 ;根據(jù)窗口類型信息識(shí)別出當(dāng)前窗口是長(zhǎng)_起始窗口,其中,長(zhǎng)_起始窗口跟在先前幀的僅長(zhǎng)窗口之后,其中,長(zhǎng)_起始窗口包括平緩的長(zhǎng)_起始窗口以及陡峭的長(zhǎng)_起始窗口 ; 以及當(dāng)將第一編譯方案應(yīng)用于隨后幀時(shí),將平緩的長(zhǎng)_起始窗口應(yīng)用于當(dāng)前幀,其中平緩的長(zhǎng)_起始窗口包括帶有第一斜坡的下降線,陡峭的長(zhǎng)_起始窗口包括帶有第二斜坡的下降線,第一斜坡比第二斜坡平緩。根據(jù)本發(fā)明,第一斜坡的寬度等于第二斜坡的寬度的兩倍。根據(jù)本發(fā)明,第一斜坡的寬度與N/4(其中,N是幀長(zhǎng))相對(duì)應(yīng)。根據(jù)本發(fā)明,第一斜坡的寬度與256個(gè)抽樣相對(duì)應(yīng),并且其中,第一斜坡的寬度等于長(zhǎng)_起始窗口的長(zhǎng)度的1/8。根據(jù)本發(fā)明,僅長(zhǎng)窗口是水平對(duì)稱,并且長(zhǎng)_起始窗口是水平不對(duì)稱,長(zhǎng)_起始窗口在右半邊具有零部分。根據(jù)本發(fā)明,帶有第一斜坡或第二斜坡的下降線的中心點(diǎn)在距長(zhǎng)起始窗口的起始點(diǎn)的3N/2距離處(其中N是幀長(zhǎng))。根據(jù)本發(fā)明,第一編譯方案基于頻域,并且第二編譯方案基于線性預(yù)測(cè)域。為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供了一種用于處理音頻信號(hào)的裝置,其包括解復(fù)用器,用于通過音頻處理裝置接收編譯標(biāo)識(shí)信息,所述編譯標(biāo)識(shí)信息表示是將第一編譯方案還是第二編譯方案應(yīng)用于當(dāng)前幀,并且當(dāng)編譯標(biāo)識(shí)信息表示將第二編譯方案應(yīng)用于當(dāng)前幀時(shí),接收窗口類型信息,該窗口類型信息表示多個(gè)窗口當(dāng)中的用于當(dāng)前幀的特定窗口 ;第二編譯單元,用于根據(jù)窗口類型信息識(shí)別出當(dāng)前窗口是長(zhǎng) _起始窗口,其中,長(zhǎng)_起始窗口跟在先前幀的僅長(zhǎng)窗口之后,其中,長(zhǎng)_起始窗口包括平緩的長(zhǎng)_起始窗口以及陡峭的長(zhǎng)_起始窗口,并且當(dāng)將第一編譯方案應(yīng)用于隨后幀時(shí),將平緩的長(zhǎng)_起始窗口應(yīng)用于當(dāng)前幀,其中平緩的長(zhǎng)_起始窗口包括帶有第一斜坡的下降線,陡峭的長(zhǎng)_起始窗口包括帶有第二斜坡的下降線,第一斜坡比第二斜坡平緩。根據(jù)本發(fā)明,第一斜坡的寬度等于第二斜坡的寬度的兩倍。根據(jù)本發(fā)明,第一斜坡的寬度與N/4(其中N是當(dāng)前幀的長(zhǎng)度)相對(duì)應(yīng)。根據(jù)本發(fā)明,第一斜坡的寬度與256個(gè)抽樣相對(duì)應(yīng),并且其中,第一斜坡的寬度等于長(zhǎng)_起始窗口的長(zhǎng)度的1/8。根據(jù)本發(fā)明,僅長(zhǎng)窗口是水平對(duì)稱,并且長(zhǎng)_起始窗口是水平不對(duì)稱,長(zhǎng)_起始窗口在右半邊具有零部分。根據(jù)本發(fā)明,帶有第一斜坡或第二斜坡的下降線的中心點(diǎn)在距長(zhǎng)起始窗口的起始點(diǎn)的3N/2距離處(其中N是幀長(zhǎng))。
根據(jù)本發(fā)明,第一編譯方案基于頻域,并且第二編譯方案基于線性預(yù)測(cè)域。為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn)并且根據(jù)本發(fā)明的目的,提供了一種用于處理音頻信號(hào)的方法,其包括通過音頻處理裝置接收音頻信號(hào),所述音頻信號(hào)包括第一塊的第一數(shù)據(jù)以及第二塊的第二數(shù)據(jù);接收與第二塊相對(duì)應(yīng)的補(bǔ)償信號(hào);根據(jù)第二數(shù)據(jù)、補(bǔ)償信號(hào)、 以及第二塊的窗口獲得用于第二塊的重建信號(hào),其中當(dāng)以矩形編譯方案對(duì)第一數(shù)據(jù)編碼, 并且第二塊的窗口屬于過渡窗口類別時(shí),第二塊的窗口具有帶有第一斜坡的上升線,其中, 第一斜坡比第二斜坡平緩。根據(jù)本發(fā)明,當(dāng)以非矩形編譯方案對(duì)第一數(shù)據(jù)編碼,并且第二塊的窗口屬于過渡窗口類別時(shí),第二塊的窗口具有帶有第二斜坡的上升線。根據(jù)本發(fā)明,當(dāng)過渡窗口類別包括長(zhǎng)_停止(l0ng_St0p)窗口和停止_起始 (stop_start)窗口時(shí),長(zhǎng)_停止窗口和停止_起始窗口是水平不對(duì)稱的,并且在左半邊具有零部分。根據(jù)本發(fā)明,當(dāng)以矩形編譯方案對(duì)第一數(shù)據(jù)進(jìn)行編碼時(shí),接收補(bǔ)償信號(hào)。根據(jù)本發(fā)明,根據(jù)與矩形窗口與非矩形窗口之間的不對(duì)稱有關(guān)的差異,以及混疊部分與混疊部分的預(yù)測(cè)之間的差異中的至少一個(gè)差異,產(chǎn)生補(bǔ)償信號(hào)。為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供一種用于處理音頻信號(hào)的裝置,其包括解復(fù)用器,用于接收音頻信號(hào),所述音頻信號(hào)包括第一塊的第一數(shù)據(jù)以及第二塊的第二數(shù)據(jù),并且用于接收與第二塊相對(duì)應(yīng)的補(bǔ)償信號(hào);非矩形解碼單元,用于根據(jù)第二數(shù)據(jù)、補(bǔ)償信號(hào)、以及第二塊的窗口獲得用于第二塊的重建信號(hào),其中當(dāng)以矩形編譯方案對(duì)第一數(shù)據(jù)編碼,并且第二塊的窗口屬于過渡窗口類別時(shí),第二塊的窗口具有帶有第一斜坡的上升線,其中,第一斜坡比第二斜坡平緩。根據(jù)本發(fā)明,當(dāng)以非矩形編譯方案對(duì)第一數(shù)據(jù)編碼,并且第二塊的窗口屬于過渡窗口類別時(shí),第二塊的窗口具有帶有第二斜坡的上升線。 根據(jù)本發(fā)明,當(dāng)過渡窗口類別包括長(zhǎng)_停止窗口和停止_起始窗口時(shí),長(zhǎng)_停止窗口和停止_起始窗口是水平不對(duì)稱的,并且在左半邊具有零部分。根據(jù)本發(fā)明,當(dāng)以矩形編譯方案對(duì)第一數(shù)據(jù)編碼時(shí),接收補(bǔ)償信號(hào)。根據(jù)本發(fā)明,根據(jù)與矩形窗口和非矩形窗口之間的不對(duì)稱有關(guān)的差異,以及混疊部分與混疊部分的預(yù)測(cè)之間的差異中的至少一個(gè)差異,產(chǎn)生補(bǔ)償信號(hào)。為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供一種用于處理音頻信號(hào)的方法,包括通過音頻處理裝置接收音頻信號(hào),所述音頻信號(hào)包括第一塊的第一數(shù)據(jù)以及第二塊的第二數(shù)據(jù);接收與第二塊相對(duì)應(yīng)的補(bǔ)償信號(hào);根據(jù)第二數(shù)據(jù)、補(bǔ)償信號(hào)、以及第二塊的窗口獲得用于第二塊的重建信號(hào),其中當(dāng)以矩形編譯方案對(duì)第一數(shù)據(jù)編碼,并且第二塊的窗口屬于過渡窗口類別時(shí),第二塊的窗口具有帶有第一斜坡的上升線,其中,第一斜坡比第二斜坡平緩。根據(jù)本發(fā)明,當(dāng)以非矩形編譯方案對(duì)第一數(shù)據(jù)編碼,并且第二塊的窗口屬于過渡窗口類別時(shí),第二塊的窗口具有帶有第二斜坡的上升線。根據(jù)本發(fā)明,過渡窗口類別包括長(zhǎng)_停止窗口和停止_起始窗口,并且長(zhǎng)_停止窗口和停止_起始窗口是水平不對(duì)稱的,并且在左半邊具有零部分。根據(jù)本發(fā)明,當(dāng)以矩形編譯方案對(duì)第一數(shù)據(jù)編碼時(shí),接收補(bǔ)償信號(hào)。
根據(jù)本發(fā)明,根據(jù)與矩形窗口和非矩形窗口之間的不對(duì)稱有關(guān)的差異,以及混疊部分與混疊部分的預(yù)測(cè)之間的差異中的至少一個(gè)差異,產(chǎn)生補(bǔ)償信號(hào)。為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供一種用于處理音頻信號(hào)的裝置,其包括解復(fù)用器,用于接收音頻信號(hào),所述音頻信號(hào)包括第一塊的第一數(shù)據(jù)以及第二塊的第二數(shù)據(jù),并且用于接收與第二塊相對(duì)應(yīng)的補(bǔ)償信號(hào);非矩形解碼單元,用于根據(jù)第二數(shù)據(jù)、補(bǔ)償信號(hào)、以及第二塊的窗口獲得用于第二塊的重建信號(hào),其中,當(dāng)以矩形編譯方案對(duì)第一數(shù)據(jù)編碼,并且第二塊的窗口屬于過渡窗口類別時(shí),第二塊的窗口具有帶有第一斜坡的上升線,其中,第一斜坡比第二斜坡平緩。根據(jù)本發(fā)明,當(dāng)以非矩形編譯方案對(duì)第一數(shù)據(jù)編碼,并且第二塊的窗口屬于過渡窗口類別時(shí),第二塊的窗口具有帶有第二斜坡的上升線。根據(jù)本發(fā)明,過渡窗口類別包括長(zhǎng)_停止窗口和停止_起始窗口時(shí),長(zhǎng)_停止窗口和停止_起始窗口是水平不對(duì)稱的,并且在左半邊具有零部分。根據(jù)本發(fā)明,當(dāng)以矩形編譯方案對(duì)第一數(shù)據(jù)編碼時(shí),接收補(bǔ)償信號(hào)。根據(jù)本發(fā)明,根據(jù)與矩形窗口和非矩形窗口之間的不對(duì)稱有關(guān)的差異,以及混疊部分與混疊部分的預(yù)測(cè)之間的差異中的至少一個(gè)差異,產(chǎn)生補(bǔ)償信號(hào)。為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供了一種用于處理音頻信號(hào)的方法,其包括當(dāng)將第二編譯方案應(yīng)用于當(dāng)前幀時(shí),通過音頻處理裝置接收窗口類型信息,所述窗口類型信息表示多個(gè)窗口當(dāng)中的用于當(dāng)前幀的特定窗口 ;并且根據(jù)窗口類型信息將當(dāng)前窗口應(yīng)用于當(dāng)前幀,其中,當(dāng)將第一編譯方案應(yīng)用于先前幀時(shí),所述多個(gè)窗口是由短窗口、第一過渡窗口、第二過渡窗口組成的,其中,短窗口具有寬度是N/8的至少一個(gè)上升線,并且第一過渡窗口和第二過渡窗口具有寬度是N/4的上升線(其中N是幀長(zhǎng))。根據(jù)本發(fā)明,短窗口、第一過渡窗口、以及第二過渡窗口的長(zhǎng)度是2N。根據(jù)本發(fā)明,短窗口、第一過渡窗口、以及第二過渡窗口的左半邊與IOM個(gè)抽樣相對(duì)應(yīng)。根據(jù)本發(fā)明,當(dāng)前窗口與先前窗口之間的交叉點(diǎn)在距當(dāng)前窗口的起始的N/2距離處。根據(jù)本發(fā)明,第一過渡窗口在右半邊不具有零部分,第二過渡窗口在右半邊具有零部分,短窗口具有重疊在一起的多個(gè)短部分,并且短部分具有上升線和下降線。為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供了一種用于處理音頻信號(hào)的方法,其包括通過音頻處理裝置接收音頻信號(hào),所述音頻信號(hào)包括以第一編譯方案編碼的當(dāng)前幀以及以第二編譯方案編碼的隨后幀;接收子編譯標(biāo)識(shí)信息,所述子編譯標(biāo)識(shí)信息表示以矩形編譯方案或非矩形編譯方案對(duì)當(dāng)前幀的至少一個(gè)塊進(jìn)行編碼;當(dāng)子編譯標(biāo)識(shí)信息表示以非矩形編譯方案對(duì)當(dāng)前幀的至少最后塊進(jìn)行編碼時(shí),根據(jù)用于隨后幀的隨后窗口是否是短窗口,來確定用于當(dāng)前窗口的包括第一形狀和第二形狀的窗口形狀;將具有所確定的窗口形狀的當(dāng)前窗口應(yīng)用于當(dāng)前幀,其中第一形狀具有帶有第一斜坡的下降線,第二形狀具有帶有第二斜坡的下降線,并且第一斜坡比第二斜坡平緩。根據(jù)本發(fā)明,第一斜坡的寬度與256個(gè)抽樣或N/4相對(duì)應(yīng),并且第二斜坡的寬度與 128個(gè)抽樣或N/8 (N是幀長(zhǎng))相對(duì)應(yīng)。
根據(jù)本發(fā)明,當(dāng)前窗口與隨后窗口之間的交叉點(diǎn)在距隨后窗口的起始的N/2距離處。根據(jù)本發(fā)明,第一斜坡與非短窗口中的上升斜坡的斜坡相匹配,并且第二斜坡與短窗口中的上升斜坡的斜坡相匹配。為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供了一種用于處理音頻信號(hào)的裝置,其包括解復(fù)用器,用于當(dāng)將第二編譯方案應(yīng)用于當(dāng)前幀時(shí)接收窗口類型信息,所述窗口類型信息表示多個(gè)窗口當(dāng)中的用于當(dāng)前幀的特定窗口 ;第二編譯單元,用于根據(jù)窗口類型信息將當(dāng)前窗口應(yīng)用于當(dāng)前幀,其中,當(dāng)將第一編譯方案應(yīng)用于先前幀時(shí),所述多個(gè)窗口是由短窗口、第一過渡窗口、第二過渡窗口組成的,其中,短窗口具有寬度是N/8 的至少一個(gè)上升線,并且第一過渡窗口和第二過渡窗口具有寬度是N/4的上升線(其中N 是幀長(zhǎng))。根據(jù)本發(fā)明,短窗口、第一過渡窗口、以及第二過渡窗口的長(zhǎng)度是2N。根據(jù)本發(fā)明,短窗口、第一過渡窗口、以及第二過渡窗口的左半邊與IOM個(gè)抽樣相對(duì)應(yīng)。根據(jù)本發(fā)明,當(dāng)前窗口與先前窗口之間的交叉點(diǎn)在距當(dāng)前窗口的起始的N/2距離處。根據(jù)本發(fā)明,第一過渡窗口在右半邊不具有零部分,第二過渡窗口在右半邊具有零部分,短窗口具有重疊在一起的多個(gè)短部分,并且短部分具有上升線和下降線。為了進(jìn)一步實(shí)現(xiàn)這些及其它優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,提供了一種用于處理音頻信號(hào)的裝置,其包括解復(fù)用器,用于接收音頻信號(hào),所述音頻信號(hào)包括以第一編譯方案編碼的當(dāng)前幀以及以第二編譯方案編碼的隨后幀,并且用于接收子編譯標(biāo)識(shí)信息,所述子編譯標(biāo)識(shí)信息表示以矩形編譯方案或非矩形編譯方案對(duì)當(dāng)前幀的至少一個(gè)塊進(jìn)行編碼; 第一編譯單元,用于當(dāng)子編譯標(biāo)識(shí)信息表示以非矩形編譯方案對(duì)當(dāng)前幀的至少最后塊進(jìn)行編碼時(shí),根據(jù)用于隨后幀的隨后窗口是否是短窗口,來確定用于當(dāng)前窗口的包括第一形狀和第二形狀的窗口形狀;將具有所確定的窗口形狀的當(dāng)前窗口應(yīng)用于當(dāng)前幀,其中第一形狀具有帶有第一斜坡的下降線,第二形狀具有帶有第二斜坡的下降線,并且第一斜坡比第二斜坡平緩。根據(jù)本發(fā)明,第一斜坡的寬度與256個(gè)抽樣或N/4相對(duì)應(yīng),并且第二斜坡的寬度與 128個(gè)抽樣或N/8 (N是幀長(zhǎng))相對(duì)應(yīng)。根據(jù)本發(fā)明,當(dāng)前窗口與隨后窗口之間的交叉點(diǎn)在距隨后窗口的起始的N/2距離處。根據(jù)本發(fā)明,第一斜坡與非短窗口中的上升斜坡的斜坡相匹配,并且第二斜坡與短窗口中的上升斜坡的斜坡相匹配。應(yīng)該理解的是先前的一般描述和隨后的詳細(xì)說明是示例性和說明性的,并且其被用于提供對(duì)所要求的本發(fā)明的進(jìn)一步說明。有益效果因此,本發(fā)明提供以下效果或優(yōu)點(diǎn)。首先,本發(fā)明對(duì)諸如由于窗口間不對(duì)稱(例如,矩形窗口與非矩形窗口之間不對(duì)稱)等所引起的混疊這樣的缺點(diǎn)進(jìn)行補(bǔ)償,從而顯著改善音頻信號(hào)的音質(zhì)。
其次,當(dāng)應(yīng)用了用于對(duì)混疊等等進(jìn)行補(bǔ)償?shù)姆桨笗r(shí),矩形窗口與非矩形窗口之間 100%重疊變得不必要。因此,非矩形窗口可保持具有平緩斜坡的下降線。第三,本發(fā)明適用于具有包含平緩斜坡的下降線的非矩形窗口,由此同類窗口 (homogeneous window)(例如,非矩形窗口)之間的交叉點(diǎn)與異類窗口 (heterogeneous window)(例如,非矩形窗口和矩形窗口 )之間的交叉點(diǎn)相匹配。第四,因?yàn)橥惔翱诘慕徊纥c(diǎn)與異類窗口的交叉點(diǎn)相匹配,因此用于對(duì)窗口長(zhǎng)度差進(jìn)行補(bǔ)償?shù)倪^渡窗口變得不必要,并且第一編譯方案(例如,線性預(yù)測(cè)域方案)與第二編譯方案(例如,頻域方案)之間的直接過渡成為可能。第五,因?yàn)橹苯舆^渡成為可能,因此可應(yīng)用適用于相應(yīng)塊的音頻信號(hào)特征的窗口, 而無需使用用于解決不匹配的窗口。因此,可顯著地提高音質(zhì)。第六,因?yàn)榕c非矩形窗口類型相對(duì)應(yīng)的窗口的形狀根據(jù)短窗口是存在于先前塊還是存在于隨后塊而變,因此滿足TDAC條件。因此,可提高音質(zhì)。
所附附圖被包括以提供對(duì)本發(fā)明進(jìn)一步了解,并納入且構(gòu)成了該說明書的一部分,所述附圖對(duì)本發(fā)明的實(shí)施例進(jìn)行說明并且與該描述一下對(duì)本發(fā)明的原理進(jìn)行說明。在附圖中圖1是根據(jù)本發(fā)明的音頻信號(hào)處理裝置的示意性方框圖;圖2是根據(jù)本發(fā)明的第一實(shí)施例的編碼器的方框圖;圖3是根據(jù)本發(fā)明的第一實(shí)施例的解碼器的方框圖;圖4是由塊單元配置的音頻信號(hào)的示意圖,按每個(gè)幀(或子幀)可對(duì)其應(yīng)用不同的編譯方案;圖5是用于過渡到異類編譯方案(heterogeneous coding scheme)(即,矩形編譯方案和非矩形編譯方案)的示意圖;圖6是當(dāng)矩形窗口和非矩形窗口相互重疊時(shí)的特征的示意圖;圖7是校正部分(CP),混疊部分(aliasing part) (AP)、以及未補(bǔ)償信號(hào)的示意圖;圖8是具有對(duì)稱性(S卩,TDAC的條件)的非矩形窗口的特征的示意圖;圖9是用于對(duì)校正部分和/或混疊部分進(jìn)行補(bǔ)償?shù)难a(bǔ)償信號(hào)的示例的示意圖;圖10是圖6所示的異類窗口(即,矩形窗口和非矩形窗口)的組合中的非矩形窗口的示例的示意圖;圖11是矩形窗口之后的矩形窗口被重疊的情況的示意圖;圖12是根據(jù)本發(fā)明的第二實(shí)施例的編碼器的方框圖;圖13是根據(jù)本發(fā)明的第二實(shí)施例的解碼器的方框圖;圖14是根據(jù)是否將矩形編譯方案應(yīng)用于先前塊的過渡窗口(transition window)的形狀的示意圖;圖15是根據(jù)本發(fā)明的第三實(shí)施例的編碼器的方框圖;圖16是根據(jù)本發(fā)明的第三實(shí)施例的解碼器的方框圖;圖17是與第一編譯方案窗口或第二編譯方案窗口(短窗口)相結(jié)合的長(zhǎng)_起始窗口的示意圖;圖18是與第一編譯方案窗口或第二編譯方案窗口(例如,長(zhǎng)_停止窗口)相重疊的短窗口的示意圖;圖19是根據(jù)本發(fā)明的第四實(shí)施例的編碼器的方框圖;圖20是根據(jù)本發(fā)明的第四實(shí)施例的解碼器的方框圖;圖21是窗口間路徑或過渡的表格;圖22是過渡到第一編譯方案中的長(zhǎng)_停止窗口的情況的示意圖;圖23是過渡到第一編譯方案中的短窗口的情況的示意圖;圖M是第一編譯方案窗口與新形狀的短窗口相重疊的情況的示意圖;圖25是根據(jù)本發(fā)明的第五實(shí)施例的編碼器的方框圖;圖沈是根據(jù)本發(fā)明的第六實(shí)施例的解碼器的方框圖;圖27是與第一編譯方案(例如TCX)相對(duì)應(yīng)的窗口與短窗口(或長(zhǎng)_停止窗口) 相重疊的情況的示意圖;圖觀是與在形狀1至形狀4之內(nèi)變化的第一編譯方案當(dāng)中的非矩形方案相對(duì)應(yīng)的窗口的表格;圖四是根據(jù)本發(fā)明的第六實(shí)施例的編碼器的方框圖;圖30是根據(jù)本發(fā)明的第六實(shí)施例的解碼器的方框圖;圖31是每個(gè)塊(幀或子幀)的編譯方案的示例的示意圖;圖32是用于與長(zhǎng)期預(yù)測(cè)有關(guān)的信號(hào)波形的一個(gè)示例的示意圖;圖33是根據(jù)本發(fā)明的實(shí)施例的編碼器所應(yīng)用到的音頻信號(hào)編碼裝置的示例的示意圖;圖34是根據(jù)本發(fā)明的實(shí)施例的編碼器所應(yīng)用到的音頻信號(hào)解碼裝置的示例的示意圖;圖35是實(shí)現(xiàn)根據(jù)本發(fā)明的一個(gè)實(shí)施例的音頻信號(hào)處理裝置的產(chǎn)品的示意性方框圖;以及圖36是用于對(duì)實(shí)現(xiàn)根據(jù)本發(fā)明的一個(gè)實(shí)施例的音頻信號(hào)處理裝置的產(chǎn)品之間的關(guān)系進(jìn)行說明的示意圖。
具體實(shí)施例方式在隨后的描述中,對(duì)本發(fā)明的附加特征和優(yōu)點(diǎn)進(jìn)行闡述,并且其部分可從該描述中顯而易見地得知,或者可以從本發(fā)明的實(shí)施中學(xué)習(xí)到。特別地,通過在所寫描述及其權(quán)利要求以及附圖中所指出的結(jié)構(gòu)可實(shí)現(xiàn)并獲得本發(fā)明的目的及其他優(yōu)點(diǎn)。為了實(shí)現(xiàn)這些和其他優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,如具體體現(xiàn)和廣泛描述地,為了進(jìn)一步實(shí)現(xiàn)這些及其他優(yōu)點(diǎn),并且根據(jù)本發(fā)明的目的,很清楚的是先前的一般描述和下面的詳細(xì)描述是示例性和說明性的,并且其旨在提供對(duì)所要求的本發(fā)明的進(jìn)一步說明。本發(fā)明的模式現(xiàn)在對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行詳細(xì)地參考,在附圖中示出了所述優(yōu)選實(shí)施例的示例。首先,不將在該說明書和權(quán)利要求中所使用的術(shù)語或詞語解釋為局限于一般或字典含義,并且應(yīng)解釋為與基于下述原理的本發(fā)明的技術(shù)思想相匹配的含義和概念,所述原理即就是發(fā)明人能夠適當(dāng)?shù)囟x術(shù)語的概念,以最好地方式對(duì)發(fā)明人的發(fā)明進(jìn)行描述。該公開中所公開的實(shí)施例以及附圖中所示的配置僅是一個(gè)優(yōu)選實(shí)施例,并且不表示本發(fā)明的所有技術(shù)思路。因此,很清楚的是本發(fā)明覆蓋本發(fā)明的修改和變化,只要其落入在提交該申請(qǐng)時(shí)的所附權(quán)利要求及其等效體的范圍之內(nèi)。根據(jù)本發(fā)明,應(yīng)將未在該說明書中所公開的術(shù)語解釋為與本發(fā)明的技術(shù)思路相匹配的以下含義和概念。具體地說,可將“編譯(coding)”有選擇地解釋為“編碼”或“解碼”, 并且該公開中的“信息”是通常包括值、參數(shù)、系數(shù)、元素等等的術(shù)語,并且其含義可偶而解釋為不同,本發(fā)明并不受到此限制。在該公開中,在廣義上,音頻信號(hào)在概念上與視頻信號(hào)有區(qū)別,并且表示可聽覺上識(shí)別的各種信號(hào)。從狹義上講,音頻信號(hào)是指不具有或具有少量語音特征的信號(hào)。應(yīng)在廣義上對(duì)本發(fā)明的音頻信號(hào)進(jìn)行解釋。然而,在用作與語音信號(hào)加以區(qū)分的情況下,本發(fā)明的音頻信號(hào)可被理解為狹義上的音頻信號(hào)。雖然規(guī)定編譯(coding)僅是編碼,但是可以將其解釋為包括編碼和解碼。圖1是根據(jù)本發(fā)明的音頻信號(hào)處理裝置的示意性方框圖。參考圖1,根據(jù)本發(fā)明的音頻信號(hào)處理裝置的編碼器100包括一對(duì)編譯單元(即, 矩形編譯單元120R和非矩形編譯單元120N,或第一編譯單元120-1和第二編譯單元 120-2)并且能夠進(jìn)一步包括信號(hào)分類器110和復(fù)用器130。在這種情況下,矩形編譯單元120R是應(yīng)用了矩形編譯方案的編譯單元。尤其是, 矩形編譯方案是指應(yīng)用了具有矩形形狀的窗口的編譯方案,而非矩形編譯方案是指應(yīng)用了具有非矩形形狀的窗口的編譯方案。此外,第一和第二編譯單元120-1和120-2是用于分別根據(jù)不同域來應(yīng)用第一和第二編譯方案的單元。在這種情況下,域可以包括線性預(yù)測(cè)域、頻域、時(shí)域等等。例如,第一編譯方案是基于線性預(yù)測(cè)域的編譯方案,并且第二編譯方案是基于頻域的編譯方案。并且, 隨后對(duì)根據(jù)域類型的定義和性質(zhì)進(jìn)行詳細(xì)地描述。編碼器100可包括三個(gè)特定編譯單元(即,A編譯單元120A、B編譯單元120B、以及C編譯單元120C)。例如圖1所示,應(yīng)用于A編譯單元120A的A編譯方案是矩形編譯方案,并且與第一編譯方案相對(duì)應(yīng)。應(yīng)用于B編譯單元120B的B編譯方案是非矩形編譯方案, 并且與第一編譯方案相對(duì)應(yīng)。應(yīng)用于C編譯單元120C的C編譯方案是非矩形編譯方案,并且與第二編譯方案相對(duì)應(yīng)。如在先前描述中所提到的,圖1所示的圖僅僅是示例性的,本發(fā)明并不受到此限制。為了使以下描述清楚和方便起見,圖1所示的示例用作參考?;蛘?,A,B、C編譯方案分別與ACELP (代數(shù)碼激勵(lì)線性預(yù)測(cè))、TCX (變換碼激勵(lì))、 以及MDCT(修正離散傅里葉變換)相對(duì)應(yīng),但是本發(fā)明并不受到此限制。隨后參考矩形編譯方案、非矩形編譯方案、第一編譯方案、以及第二編譯方案的細(xì)節(jié)對(duì)A、B、C編譯方案進(jìn)行詳細(xì)地描述。信號(hào)分類器110對(duì)輸入音頻信號(hào)的特征進(jìn)行分析,并且此后根據(jù)所分析的特征來確定將上述至少兩個(gè)編譯方案中的哪一個(gè)應(yīng)用到當(dāng)前幀或子幀。根據(jù)該確定,產(chǎn)生編譯方案信息。如在先前描述中提到的,至少兩個(gè)編譯方案與矩形和非矩形編譯方案、第一和第二編譯方案、或者A至C編譯方案相對(duì)應(yīng),但是本發(fā)明并不受到此限制。
例如,在圖1所示的示例的情況下,編譯方案信息可包括編譯標(biāo)識(shí)信息和子編譯標(biāo)iRi言;窗、(subcoding identification information) 在這禾中1"青況下,編譯標(biāo)iRi言;窗、表示用于當(dāng)前幀的第一編譯方案或第二編譯方案。在當(dāng)前幀與第一編譯方案相對(duì)應(yīng)的情況下, 子編譯標(biāo)識(shí)信息是表示對(duì)于每個(gè)幀或子幀而言第一編譯方案是A編譯方案或還是B編譯方案的信息。此后,信號(hào)分類器110產(chǎn)生編譯方案信息,并且此后將其遞送到復(fù)用器130。同時(shí),在信號(hào)分類器110的控制之下,對(duì)每個(gè)幀或子幀的輸入信號(hào)進(jìn)行分類,并且此后將其輸入到矩形/非矩形編譯單元120R/120N或第一 /第二編譯單元120-1/120-2。 在圖1所示的示例的情況下,將輸入信號(hào)輸入到A至C編譯單元102A至120C中的一個(gè)。在圖1所示的示例的情況下,A至C編譯單元120A至120C中的每一個(gè)將由相應(yīng)編譯方案對(duì)輸入信號(hào)進(jìn)行編碼所產(chǎn)生的數(shù)據(jù)遞送到復(fù)用器120。復(fù)用器130通過對(duì)編譯方案信息以及作為通過相應(yīng)單元執(zhí)行編譯的結(jié)果的數(shù)據(jù)進(jìn)行復(fù)用而至少產(chǎn)生比特流。同時(shí),根據(jù)本發(fā)明的音頻信號(hào)處理裝置的解碼器200包括至少兩個(gè)解碼單元220R 和220N,或220-1和220-2,并且可進(jìn)一步包括解復(fù)用器210。在這種情況下,至少兩個(gè)解碼單元是在解碼方面與先前的至少兩個(gè)編譯單元相對(duì)應(yīng),并且分別包括矩形解碼單元220R 和非矩形解碼單元220N(或第一解碼單元220-1和第二解碼單元220- 的部件。按照與編碼器100相似的方式,所述至少兩個(gè)解碼單元可分別包括A至C解碼單元220A至220C。
矩形解碼單元220R所應(yīng)用的矩形編譯方案和非矩形解碼單元220N所應(yīng)用的非矩形編譯方案與在先前描述中所說明的那些幾乎一樣。并且,第一解碼單元220-1所應(yīng)用的第一編譯方案和第二解碼單元220-2所應(yīng)用的第二編譯方案與在先前描述中所說明的那些幾乎一樣。如在先前描述中所提到的,如圖1所示,在包括A至C解碼單元220A至220C 的情況下,隨后對(duì)相應(yīng)編譯單元所使用的A至C編譯方案進(jìn)行詳細(xì)地描述。之后,解復(fù)用器210從至少一個(gè)比特流中提取編譯方案信息以及每個(gè)幀或子幀的數(shù)據(jù)。根據(jù)編譯方案信息,將所提取的數(shù)據(jù)轉(zhuǎn)發(fā)到相應(yīng)解碼單元220A,220B,或220C。最終, 每個(gè)解碼單元通過相應(yīng)解碼方案對(duì)該數(shù)據(jù)進(jìn)行解碼,以產(chǎn)生輸出音頻信號(hào)。在下面的描述中,依次對(duì)根據(jù)圖1所示的本發(fā)明的音頻信號(hào)處理裝置的實(shí)施例進(jìn)行描述。圖2是根據(jù)本發(fā)明的第一實(shí)施例的編碼器的方框圖,并且圖3是根據(jù)本發(fā)明的第一實(shí)施例的解碼器的方框圖。尤其是,第一實(shí)施例涉及用于對(duì)諸如當(dāng)矩形編譯方案所編碼的塊與非矩形編譯方案所編碼的塊相接觸時(shí)的混疊等等這樣的缺陷進(jìn)行補(bǔ)償?shù)膶?shí)施例。參考圖2,像圖1所示的先前編碼器100 —樣,根據(jù)第一實(shí)施例的編碼器100A包括矩形編譯單元120R和非矩形編譯單元120N,并且可進(jìn)一步包括復(fù)用器130。尤其是,矩形編譯單元120R包括矩形方案編譯部分122和矩形方案合成(synthesis)部分124。并且, 非矩形編譯單元120N包括補(bǔ)償信息產(chǎn)生部分128,并且可進(jìn)一步包括非矩形方案編譯部分 126。首先,通過以塊為單元對(duì)輸入信號(hào)進(jìn)行劃分,并且此后對(duì)于每個(gè)塊將其輸入到矩形編譯單元120R或非矩形編譯單元120N。在這種情況下,塊是與幀或子幀相對(duì)應(yīng)的單元。在下面的描述中,參考圖4和圖5對(duì)每幀的編譯方案(例如,矩形編譯方案、非矩形編譯方案)進(jìn)行檢查,并且參考圖6至11對(duì)用于對(duì)由于過渡到異類編譯方案(例如,矩形編譯方案或非矩形編譯方案)所產(chǎn)生的缺陷(例如,混疊等等)進(jìn)行補(bǔ)償?shù)母鞣N方法進(jìn)行描述。優(yōu)先描述圖4至11,并且再描述圖2和圖3所示的部件。圖4示出了音頻信號(hào)的配置單元,以及對(duì)于每個(gè)配置單元而言的編譯方案。參考圖4,可以觀察到音頻信號(hào)被配置成具有包括第i幀(幀i)和第(i+Ι)幀 (幀i+Ι)的一系列幀。尤其是,可認(rèn)識(shí)到單個(gè)幀包括多個(gè)子幀(例如4個(gè)子幀)。此外,圖 4示出了不同編譯方案適用于每個(gè)幀或子幀。尤其是,圖4示出了存在3種編譯方案[艮口, A編譯方案(ACELP)、B編譯方案(TCX)、以及C編譯方案(FD)]的示例。例如,幀可被配置成具有多個(gè)子幀(例如,4個(gè)子幀)。并且,如圖4(A)所示的第i幀所示,A編譯方案(例如ACELP)可應(yīng)用到每個(gè)子幀。如圖4(B)第i幀以及圖4(D)所示的第i幀和第(i+Ι)幀所示,B編譯方案(例如TCX)可應(yīng)用到1子幀、2個(gè)連續(xù)子幀、以及4個(gè)連續(xù)子幀(即,一幀)。如圖4(A)和圖4(B)所示,C編譯方案(例如FD)不通過子幀單元來應(yīng)用,而是通過幀單元來應(yīng)用,但是本發(fā)明并不受到此限制。圖5是過渡到異類編譯方案(即,矩形編譯方案和非矩形編譯方案)的示意圖。參考圖5 (A-I),在第N塊中過渡到矩形編譯方案并且在第(N+1)塊中過渡到非矩形編譯方案。相反地,參考圖5(A-2),在第N塊中過渡到非矩形編譯方案并且在第(N+1)塊中過渡到矩形編譯方案。在這種情況下,塊與在先前描述中所說明的幀或子幀相對(duì)應(yīng)。也就是說,第N或第(N+1)幀或子幀可包括幀或子幀。尤其是,總共4種組合(例如,幀-幀、 幀-子幀、子幀-幀、以及子幀-幀)是可能的。從圖4(A)至圖4(D)所示的先前情況可發(fā)現(xiàn)如圖5 (A_l)所示的從矩形編譯方案過渡到非矩形編譯方案的示例。如在參考圖1的先前描述中所提到的,A編譯方案(ACELP)與矩形編譯方案相對(duì)應(yīng),而B編譯方案(TCX)和C編譯方案(FD)中的每一個(gè)與非矩形編譯方案相對(duì)應(yīng)。從A編譯方案(ACELP)過渡到B編譯方案(TCX)或C編譯方案(FD)的情況(即圖5 (A-I))與圖 5 (B-I)至圖5(B-4)所示的虛線所表示的部分中的一個(gè)相對(duì)應(yīng)。相反地,從非矩形編譯方案過渡到矩形編譯方案的情況[S卩,圖5(A_2)]沒有在圖 5 (B-I)至圖5(B-4)中表示,即,從B編譯方案(TCX)或C編譯方案(FD)過渡到A編譯方案 (ACELP)的情況沒有在圖5 (B-I)至圖5(B-4)中表示,但是可從兩個(gè)或三個(gè)位置(例如,圖 5(B-2)中的第1塊和第2塊等等)中發(fā)現(xiàn)。因此,由于矩形窗口和非矩形窗口彼此接觸的位置的不對(duì)稱,可產(chǎn)生諸如混疊等等這樣的缺陷。在下面的描述中,參考圖6至9對(duì)用于對(duì)該缺陷進(jìn)行補(bǔ)償?shù)姆椒ㄟM(jìn)行描述。圖6是當(dāng)矩形窗口和非矩形窗口彼此重疊時(shí)的特征的示意圖。圖7是校正部分 (CP)、混疊部分(AP)、以及未補(bǔ)償信號(hào)的示意圖。特別地,圖6與矩形窗口后面是非矩形窗口的情況相對(duì)應(yīng)。然而,隨后在該公開中還對(duì)按照非矩形窗口與隨后矩形窗口相重疊的方式,使得非矩形窗口之后跟隨矩形窗口的情況進(jìn)行說明。參考圖6,可以觀察到矩形窗口和非矩形窗口彼此部分重疊。與包括塊A至F的音頻信號(hào)相關(guān),將矩形窗口應(yīng)用于塊B和塊C上,并且將非矩形窗口應(yīng)用于塊C至F上。尤其是,矩形窗口和非矩形窗口在塊C處彼此重疊。圖6(a)至圖6(d)示出了由于依次將窗口化(windowing)、折疊(folding)、展開(unfolding)、以及窗口化應(yīng)用于塊A至F上所造成的結(jié)果。在這種情況下,為了應(yīng)用與非矩形窗口相關(guān)的時(shí)域混疊消除(TDAC),依次將窗口化、折疊、展開、以及窗口化應(yīng)用到相應(yīng)的塊上。參考圖6(a),將矩形窗口應(yīng)用到塊B和塊C的每一個(gè)上(S卩,虛線塊)并且將非矩形窗口應(yīng)用于到塊C至F的每一個(gè)上。C(L1)表示由于將非矩形窗口的部分L1S用于塊 C上所造成的結(jié)果。并且,D(L2)表示由于將非矩形窗口的部分L2S用到塊D上所造成的結(jié)果。隨后,如果對(duì)非矩形窗口應(yīng)用結(jié)果執(zhí)行折疊,那么將導(dǎo)致圖6(b)所示的塊。在這種情況下,Er,Dr等等是指對(duì)相應(yīng)塊執(zhí)行折疊,并且此后參考?jí)K界限使折疊的塊進(jìn)行反轉(zhuǎn)。之后,執(zhí)行展開以導(dǎo)致圖6(c)所示的示意圖。最終,如果將非矩形窗口應(yīng)用到展開塊上,那么產(chǎn)生如圖6(d)所示的相同結(jié)果。尤其是,可如下表示與原始信號(hào)的塊D相對(duì)應(yīng)的未補(bǔ)償信號(hào),S卩,作為僅傳送數(shù)據(jù)所獲取的信號(hào)。[公式1]未補(bǔ)償信號(hào)=(-Cr(L1) r+D (L2)) (L2)在公式1中,“C”表示與塊C相應(yīng)的數(shù)據(jù),“D”表示與塊D相對(duì)應(yīng)的數(shù)據(jù),“r”表示反轉(zhuǎn),“L/’表示由于應(yīng)用非矩形窗口的部分L1所造成的結(jié)果,并且"L2”表示由于應(yīng)用非矩形窗口的部分L2所造成的結(jié)果。在下面的描述中,參考圖7至9對(duì)用于對(duì)未補(bǔ)償信號(hào)進(jìn)行補(bǔ)償以變?yōu)榕c原始信號(hào)相同或相似的方法進(jìn)行描述。首選,參考圖7,示出了與公式1相對(duì)應(yīng)的未補(bǔ)償信號(hào)。同時(shí),非矩形窗口具有對(duì)稱性。如下對(duì)如圖8所示的非矩形窗口的特征進(jìn)行說明。 圖8是具有對(duì)稱性(S卩,TDAC的條件)的非矩形窗口的特征的示意圖。[公式2]!^+Ri2 = 1,其中 i = 1 或 2Llr = R2L2r = R1在公式2中,“L/’表示左邊第一部分,“L2”表示左邊第二部分,“R/’表示右邊第一部分,并且“IV’表示右邊第二部分。因此,如果應(yīng)用非矩形窗口的上述特征,那么可將公式1歸納成以下。[公式3]未補(bǔ)償信號(hào)=("Cr(L1) r+D (L2)) (L2) = D (L2) 2-Cr (R2L2)(因?yàn)?Llr = R2)因此,為了使未補(bǔ)償信號(hào)變成等于原始信號(hào)D,S卩,為了執(zhí)行理想補(bǔ)償,因此需要的信號(hào)如圖7所示,并且可以表示如下。[公式4-1]理想補(bǔ)償?shù)乃栊盘?hào)=原始信號(hào)-未補(bǔ)償信號(hào)= D- (D (L2) 2-Cr (R2L2))同時(shí),利用在公式2中所示的特征,可將公式4-1歸納成以下。[公式4_2]理想補(bǔ)償?shù)乃栊盘?hào)= D (R2) 2+C (R2L2)(因?yàn)?I-L22 = R22)
在公式4-2中,第一個(gè)項(xiàng)(D(ig2)與校正部分相對(duì)應(yīng),并且第二個(gè)項(xiàng)(Cr(R2L2))被稱為混疊部分。如果同類窗口(例如,非矩形窗口和非矩形窗口)彼此重疊,那么校正部分CP和混疊部分AP與按照通過執(zhí)行時(shí)域混疊消除(TDAC)而增加的方式而將被刪除的部分相對(duì)應(yīng)。換句話說,因?yàn)楫愵惔翱?即,矩形窗口和非矩形窗口)彼此重疊,則校正部分CP和混疊部分AP是殘余誤差而沒有被消除。具體地說,校正部分CP與非矩形窗口(具體地說ig所應(yīng)用到的當(dāng)前塊(例如塊 D)(即,窗口交叉點(diǎn)后面的塊)的一部分相對(duì)應(yīng)。并且,混疊部分AP與非矩形窗口(具體地說民和L2)所應(yīng)用到的先前塊(例如塊C) (S卩,窗口交叉點(diǎn)后面的塊)(例如,矩形窗口和非矩形窗口彼此重疊處的塊)的一部分相對(duì)應(yīng)。同時(shí),因?yàn)榻獯a器可利用先前塊的數(shù)據(jù)重建先前塊(例如,塊C),因此可利用所重建的先前塊產(chǎn)生對(duì)混疊部分的預(yù)測(cè)。這被表示為公式5。[公式5]混疊部分的預(yù)測(cè)=qCr (R2L2)同時(shí),可將作為混疊部分的預(yù)測(cè)與原始混疊部分之間的差異(或量化誤差)的混疊部分的誤差表示為公式6。[公式6]混疊部分的誤差=er(R2L2) = Cr (R2L2) -qCr (R2L2)利用公式5和公式6,將公式4-2歸納為公式7。[公式7]理想補(bǔ)償?shù)乃栊盘?hào)= D (R2) 2+Cr (R2L2) = D (R2)2+ (qCr+er) (R2L2)在公式(7)中,D(R2)2表示校正部分CP,QCr(R2L2)表示混疊部分AP的預(yù)測(cè),并且 er(R2L2)表示混疊部分的誤差。因此,如公式7所示,用于理想補(bǔ)償所需的信號(hào)是校正部分CP與混疊部分AP之和。在下面的描述中,參考圖9對(duì)用于對(duì)校正部分CP和混疊部分AP進(jìn)行補(bǔ)償?shù)娜N方法進(jìn)行說明。圖9是用于對(duì)校正部分和/或混疊部分進(jìn)行補(bǔ)償?shù)难a(bǔ)償信號(hào)的實(shí)施例的示意圖。參考圖9,圖9(A)所示的第一實(shí)施例的補(bǔ)償信號(hào)包括校正部分CP和混疊部分的誤差,而圖9(B)所示的第二實(shí)施例的補(bǔ)償信號(hào)僅包括校正部分CP。根據(jù)圖9(B)所示的第三實(shí)施例,不將補(bǔ)償信號(hào)發(fā)送到解碼器,而是通過解碼器對(duì)校正部分CP和混疊部分AP進(jìn)行估計(jì)。[公式8-1]方法A 補(bǔ)償信號(hào)=D (R2) 2+er (R2L2),其中“D”為重建信號(hào)。在根據(jù)第一實(shí)施例的補(bǔ)償信號(hào)的情況下,如在參考公式5的先前描述中所提到的,解碼器根據(jù)先前塊(即,與矩形窗口與非矩形窗口之間的重疊部分相對(duì)應(yīng)的塊)的數(shù)據(jù)可獲得對(duì)混疊部分AP的預(yù)測(cè),而無需從編碼器到解碼器的傳送。即使補(bǔ)償信號(hào)包括校正部分CP和混疊部分的誤差,解碼器也可產(chǎn)生對(duì)混疊部分的預(yù)測(cè)。因此,可獲得用于理想補(bǔ)償?shù)男盘?hào)(參照公式7)。根據(jù)第一實(shí)施例,通過傳送誤差而不是混疊部分AP本身可節(jié)省比特的數(shù)目。此外,通過對(duì)混疊部分AP的誤差進(jìn)行補(bǔ)償可獲得理想的補(bǔ)償信號(hào)。根據(jù)第二實(shí)施例,補(bǔ)償信號(hào)包括僅與相應(yīng)校正部分CP相對(duì)應(yīng)的信號(hào)。[公式8-2]方法B 補(bǔ)償信號(hào)=D ( )2,其中,重建信號(hào)是D-er (R2L2)。如在先前描述中所提到的(或與第一實(shí)施例相似),解碼器產(chǎn)生對(duì)混疊部分AP 的預(yù)測(cè),并且此后利用與校正部分CP相對(duì)應(yīng)的補(bǔ)償信號(hào)與預(yù)測(cè)一起獲得補(bǔ)償?shù)男盘?hào)。根據(jù)第二實(shí)施例,因?yàn)榛殳B部分AP的誤差保持在補(bǔ)償信號(hào)中,因此重建率(reconstruction rate)或音質(zhì)可能被惡化。然而,與第一實(shí)施例相比,補(bǔ)償信號(hào)的壓縮率可以更高地提高。根據(jù)第三實(shí)施例,補(bǔ)償信號(hào)沒有被傳送,而是解碼器估計(jì)矯正部分CP和混疊部分 AP。[公式8-3]方法C:補(bǔ)償信號(hào)=未傳送的、解碼器中產(chǎn)生的補(bǔ)償信號(hào)=CiCr(L2R2)+D (R2)2,其中,重建信號(hào)是D-er (L2)/(R2)。如在先前描述中所提到的(或與第一實(shí)施例和第二實(shí)施例相似),解碼器可產(chǎn)生對(duì)混疊部分AP的預(yù)測(cè)。同時(shí),可按照對(duì)與當(dāng)前塊(例如塊D)相對(duì)應(yīng)的信號(hào)的窗口形狀進(jìn)行補(bǔ)償?shù)姆绞蕉a(chǎn)生校正部分CP。尤其是,與公式1相似,將利用先前塊(qC)的數(shù)據(jù)所產(chǎn)生的QCr(L2R2)添加到未補(bǔ)償信號(hào)上。此后,通過使D (L2) 2-er (L2R2)除以(L2)2 (這與將D (R2)2 加到 D (L2) 2-er (L2R2)上相對(duì)應(yīng)),產(chǎn)生 D (L2) 2-er (L2R2),獲得 D-er (R2) / (L2)。在公式 8-3 中, 沒有表示當(dāng)前塊(塊D)的量化誤差。第三實(shí)施例的重建率低于第一或第二實(shí)施例的重建率。然而,因?yàn)榈谌龑?shí)施例根本不需要用于傳送補(bǔ)償信號(hào)的比特,因此第三實(shí)施例的壓縮率相當(dāng)高。圖10是圖6所示的異類窗口(即,矩形窗口和非矩形窗口)的組合中的非矩形窗口的示例的示意圖。在非矩形窗口的示例中,如圖10(A)至圖10(C)所示,每個(gè)角不是直角而是具有斜坡(slope)的上升線??蓪⑴c圖10(A)至圖10(C)相對(duì)應(yīng)的非矩形窗口的形狀表示為表格1。[表格1]
權(quán)利要求
1.一種用于處理音頻信號(hào)的方法,包括當(dāng)將第二編譯方案應(yīng)用于當(dāng)前幀時(shí),通過音頻處理裝置接收窗口類型信息,所述窗口類型信息表示多個(gè)窗口當(dāng)中的用于當(dāng)前幀的特定窗口 ;并且根據(jù)所述窗口類型信息將當(dāng)前窗口應(yīng)用于所述當(dāng)前幀,其中,當(dāng)將第一編譯方案應(yīng)用于先前幀時(shí),所述多個(gè)窗口由短窗口、第一過渡窗口、第二過渡窗口組成,其中,所述短窗口具有寬度是N/8的至少一個(gè)上升線,并且所述第一過渡窗口和所述第二過渡窗口具有寬度是N/4的上升線,其中,N是幀長(zhǎng)。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述短窗口、所述第一過渡窗口、以及所述第二過渡窗口的長(zhǎng)度是2N。
3.根據(jù)權(quán)利要求1所述的方法,其中,所述短窗口、所述第一過渡窗口、以及所述第二過渡窗口的左半邊與IOM個(gè)抽樣相對(duì)應(yīng)。
4.根據(jù)權(quán)利要求1所述的方法,其中,當(dāng)前窗口與先前窗口之間的交叉點(diǎn)在距所述當(dāng)前窗口的起始的N/2距離處。
5.根據(jù)權(quán)利要求1所述的方法,其中,所述第一過渡窗口在右半邊不具有零部分, 所述第二過渡窗口在右半邊具有零部分,所述短窗口具有重疊在一起的多個(gè)短部分,并且所述短部分具有上升線和下降線。
6.一種用于處理音頻信號(hào)的方法,包括通過音頻處理裝置接收音頻信號(hào),所述音頻信號(hào)包括以第一編譯方案編碼的當(dāng)前幀, 以及以第二編譯方案編碼的隨后幀;接收子編譯標(biāo)識(shí)信息,所述子編譯標(biāo)識(shí)信息表示以矩形編譯方案或非矩形編譯方案對(duì)所述當(dāng)前幀的至少一個(gè)塊進(jìn)行編碼;當(dāng)所述子編譯標(biāo)識(shí)信息表示以非矩形編譯方案對(duì)所述當(dāng)前幀的至少最后塊進(jìn)行編碼時(shí),根據(jù)用于所述隨后幀的隨后窗口是否是短窗口,來確定用于當(dāng)前窗口的包括第一形狀和第二形狀的窗口形狀;將具有所確定的窗口形狀的當(dāng)前窗口應(yīng)用于所述當(dāng)前幀, 其中所述第一形狀具有帶有第一斜坡的下降線, 所述第二形狀具有帶有第二斜坡的下降線,并且所述第一斜坡比所述第二斜坡平緩。
7.根據(jù)權(quán)利要求6所述的方法,其中,所述第一斜坡的寬度與256個(gè)抽樣或N/4相對(duì)應(yīng),并且所述第二斜坡的寬度與1 個(gè)抽樣或N/8相對(duì)應(yīng),其中,N是幀長(zhǎng)。
8.根據(jù)權(quán)利要求6所述的方法,其中,當(dāng)前窗口與隨后窗口之間的交叉點(diǎn)在距所述隨后窗口的起始的N/2距離處。
9.根據(jù)權(quán)利要求6所述的方法,其中,所述第一斜坡與非短窗口中的上升斜坡的斜坡相匹配,并且所述第二斜坡與所述短窗口中的上升斜坡的斜坡相匹配。
10.一種用于處理音頻信號(hào)的裝置,包括解復(fù)用器,用于當(dāng)將第二編譯方案應(yīng)用于當(dāng)前幀時(shí),接收窗口類型信息,所述窗口類型信息表示多個(gè)窗口當(dāng)中的用于所述當(dāng)前幀的特定窗口 ;第二編譯單元,用于根據(jù)所述窗口類型信息將當(dāng)前窗口應(yīng)用于所述當(dāng)前幀, 其中,當(dāng)將第一編譯方案應(yīng)用于先前幀時(shí),所述多個(gè)窗口由短窗口、第一過渡窗口、第二過渡窗口組成,其中,所述短窗口具有寬度是N/8的至少一個(gè)上升線,并且所述第一過渡窗口和所述第二過渡窗口具有寬度是N/4的上升線,其中,N是幀長(zhǎng)。
11.根據(jù)權(quán)利要求10所述的裝置,其中,短窗口、所述第一過渡窗口、以及所述第二過渡窗口的長(zhǎng)度是2N。
12.根據(jù)權(quán)利要求10所述的裝置,其中,短窗口、所述第一過渡窗口、以及所述第二過渡窗口的左半邊與IOM個(gè)抽樣相對(duì)應(yīng)。
13.根據(jù)權(quán)利要求10所述的裝置,其中,當(dāng)前窗口與先前窗口之間的交叉點(diǎn)在距所述當(dāng)前窗口的起始的N/2距離處。
14.根據(jù)權(quán)利要求10所述的裝置,其中,所述第一過渡窗口在右半邊不具有零部分, 所述第二過渡窗口在右半邊具有零部分,所述短窗口具有重疊在一起的多個(gè)短部分,并且所述短部分具有上升線和下降線。
15.一種用于處理音頻信號(hào)的裝置,包括解復(fù)用器,用于接收音頻信號(hào),所述音頻信號(hào)包括以第一編譯方案編碼的當(dāng)前幀以及以第二編譯方案編碼的隨后幀,并且用于接收子編譯標(biāo)識(shí)信息,所述子編譯標(biāo)識(shí)信息表示以矩形編譯方案或非矩形編譯方案對(duì)所述當(dāng)前幀的至少一個(gè)塊進(jìn)行編碼;第一編譯單元,用于當(dāng)所述子編譯標(biāo)識(shí)信息表示以非矩形編譯方案對(duì)所述當(dāng)前幀的至少最后塊進(jìn)行編碼時(shí),根據(jù)用于所述隨后幀的隨后窗口是否是短窗口,來確定用于當(dāng)前窗口的包括第一形狀和第二形狀的窗口形狀;將具有所確定的窗口形狀的當(dāng)前窗口應(yīng)用于所述當(dāng)前幀, 其中所述第一形狀具有帶有第一斜坡的下降線, 所述第二形狀具有帶有第二斜坡的下降線,并且所述第一斜坡比所述第二斜坡平緩。
16.根據(jù)權(quán)利要求15所述的裝置,其中,所述第一斜坡的寬度與256個(gè)抽樣或N/4相對(duì)應(yīng),并且所述第二斜坡的寬度與1 個(gè)抽樣或N/8相對(duì)應(yīng),其中,N是幀長(zhǎng)。
17.根據(jù)權(quán)利要求15所述的裝置,其中,當(dāng)前窗口與隨后窗口之間的交叉點(diǎn)在距所述隨后窗口的起始的N/2距離處。
18.根據(jù)權(quán)利要求15所述的方法,其中,所述第一斜坡與非短窗口中的上升斜坡的斜坡相匹配,并且所述第二斜坡與所述短窗口中的上升斜坡的斜坡相匹配。
全文摘要
公開了一種用于處理音頻信號(hào)的裝置及其方法。本發(fā)明包括當(dāng)將第二編譯方案應(yīng)用于當(dāng)前幀時(shí),通過音頻處理裝置接收窗口類型信息,所述窗口類型信息表示多個(gè)窗口當(dāng)中的用于當(dāng)前幀的特定窗口;并且根據(jù)窗口類型信息將當(dāng)前窗口應(yīng)用于當(dāng)前幀,其中,當(dāng)將第一編譯方案應(yīng)用于先前幀時(shí),所述多個(gè)窗口是由短窗口、第一過渡窗口、第二過渡窗口組成的,其中,短窗口具有寬度是N/8的至少一個(gè)上升線,并且第一過渡窗口和第二過渡窗口具有寬度是N/4的上升線(其中N是幀長(zhǎng))。
文檔編號(hào)G10L19/04GK102576540SQ201080042540
公開日2012年7月11日 申請(qǐng)日期2010年7月27日 優(yōu)先權(quán)日2009年7月27日
發(fā)明者吳賢午, 姜泓求, 宋政旭, 李昌憲 申請(qǐng)人:Lg電子株式會(huì)社, 延世大學(xué)工業(yè)學(xué)術(shù)合作社