專利名稱:利用非一致濾波器庫的音頻編碼的制作方法
技術領域:
本發(fā)明涉及音頻信號的編碼和譯碼。
圖1(a)顯示一個包括傳統(tǒng)的M信道分析濾波器庫10和合成濾波器庫12的系統(tǒng)的基本方框圖。分析濾波器庫包括數(shù)字濾波器Hk(z),k=0...,M-1,的集合,每個具有相關的輸出信道和公共的輸入x(n)。合成濾波器庫包括濾波器Fk(z)的集合,每個具有相關的輸入信道和公共的輸出y(n)。在分析濾波器庫10中,每個信道按因子M被分樣,以及在合成濾波器庫12中,每個信道按因子M被內插。如果內插的程度等于分樣的程度,正如本例中那樣,則濾波器庫被精確(critically)采樣,以及如果所有的濾波器具有相同的帶寬,則濾波器庫是一致的濾波器庫。
由分析濾波器庫10輸出的M信道可以以任意的多種方式被處理。例如,如果分析濾波器庫10形成音頻編碼器的一部分,則對于給定的更新時間間隔,信道數(shù)據(jù)和(可能地)濾波器庫結構可被編碼成代表音頻信號x(n)的比特流。如果合成濾波器庫12形成音頻譯碼器的一部分,則合成濾波器庫結構與信道數(shù)據(jù)相組合,生成信號y(n)。替換地,兩個庫10,12可被包括在一個音頻處理系統(tǒng)中,在其中例如信號x(n)受到某種形式的后處理,而被處理的信號y(n)被存儲在貯存媒體中,或在傳輸媒體上被傳送。
在余弦調制濾波器(CMF)庫中,分析和合成濾波器是單個原型濾波器的余弦調制的型式。用于分析和合成濾波器的已知的公式是hk(n)=2p0(n)cos[(2k+1)2Mπn+ϵk],]]>k=0,...,M-1fk(n)=2p0(n)cos[(2k+1)2Mπn+γk],]]>其中ϵk=-π2M(2k+1)α2+π2β]]>并且γk=π2M(2k+1)α2+π2β]]>其中α∈Z是調制相位,以及對于余弦調制β=0,而對于正弦調制β=1。
已經(jīng)知道,在諸如數(shù)字信號的編碼那樣的應用中利用一致的CMF庫,有時稱為準QMF(正交鏡像濾波器)庫或調制的疊蓋(lapped)變換。術語完全重建(perfect reconstruction,PR)被應用到濾波器庫,其中輸出y(n)是輸入x(n)的縮放的和延時的版本。用于PR一致CMF庫的設計的理論是早已建立的,在以上的情形下,PR性質可以通過適當?shù)剡x擇α和原型濾波器P0而被滿足。對于本說明來說,示例的P0是具有通帶[-π2M+ϵ,π2M-ϵ]]]>(對于ϵ<π2M]]>)和無限衰減的阻帶、長度為N的實系數(shù)線性相位低通濾波器,見圖2,也就是|P0(ejω)|=0 對于|ω|≥π2M+ϵ,ϵ<π2M]]>某些應用要求使用非一致的濾波器庫,即,其濾波器具有變化帶寬的濾波器庫。例如,在音頻編碼中,希望提供可適配于輸入信號的時間-頻率能量分布和特性的濾波器庫。非一致的濾波器庫的設計通常是相當復雜的,但某些最近的方法允許設計非一致的CMF庫。
例如,H.S.Malvar,“Biorthogonal and non-uniform lappedtransforms for transform coding with reduced blocking and ringingartefacts(用于具有減小的阻塞和人工振鈴產(chǎn)物的變換編碼的雙正交和非一致疊蓋變換)”,IEEE Trans.Signal Processing,vol.46,No.4,pp.1043-1053,1998年4月;和H.S.Malvar,“Enhancing theperformance of sub-band audio coders for speech signals(用于語音信號的子帶音頻編碼器的性能增強)”,Proc.Int.Symp.Circuitsand Systems’98,nn.90-101,1998年6月;以及美國專利No.6,115,689,Malvar揭示了用于構建非一致調制的疊蓋變換(MLT)的方法。這牽涉到組合非一致MLT的子帶濾波器,以及這里將稱為子帶合并。組合的子帶濾波器比非組合的濾波器具有更好的時間局部化(timelocalization),但以頻率局部化(frequency localization)的降低為代價。由于非一致濾波器庫是通過簡單地采用一致MLT濾波器的線性組合而得到的,所以該方法允許有效地實施時間變化的變換。Malvar揭示了子帶合并可以在音頻與語音編碼中被有利地使用來減小人工振鈴產(chǎn)物,例如混響和預回波。然而,這種變換的設計在幾個方面受到限制只有2個或4個子帶濾波器可被組合,以及僅僅組合固定數(shù)目的高頻系數(shù)對,即,16×2濾波器,8×4濾波器。而且,沒有揭示系統(tǒng)性設計規(guī)程。具體地,在組合的4子帶濾波器的情形下,困難的參量組被選擇來提供需要的輸出。
按照本發(fā)明,提供了按照權利要求1的方法。
本發(fā)明提供一種子帶合并方法,它允許以系統(tǒng)的方式組合任意數(shù)目的子帶。優(yōu)選實施例顯示,從一致的CMF庫開始,可以采用組成濾波器的線性組合,使得最終得到的組合的濾波器具有良好的頻率選擇特性和平坦的通帶響應。
現(xiàn)在參照附圖描述本發(fā)明的實施例,其中圖1(a)是傳統(tǒng)的分析/合成濾波器庫的方框圖;圖1(b)是按照本發(fā)明優(yōu)選實施例的分析/合成濾波器庫的方框圖;圖2顯示在本發(fā)明的優(yōu)選實施例中采用的原型濾波器P0的特性;圖3(a)和(b)比較優(yōu)選實施例的濾波器庫的時域響應與現(xiàn)有技術的濾波器庫的時域響應,(a)是指現(xiàn)有技術,(b)是指優(yōu)選實施例;圖4(a)和(b)比較優(yōu)選實施例的濾波器庫的幅度響應與現(xiàn)有技術的濾波器庫的幅度響應,(a)是指現(xiàn)有技術,(b)是指優(yōu)選實施例;圖5顯示按照本發(fā)明的濾波器庫的實際的實施例。
在本發(fā)明的優(yōu)選實施例中,圖1(b),M信道最大分樣的一致CMF庫10,12包括理想地通過如圖2所示的單個原型濾波器P0的余弦調制得到的濾波器Hk(z),F(xiàn)k(z)。局部化模塊14根據(jù)在給定的時間間隔內的信號x(n)的時頻能量分布和信號特性而確定為了有利于增加的時間分辨率最好將頻率分段去局部化(delocalization),以提供改進的編碼的信號質量。(替換地,模塊14可確定,如果將頻率分段去局部化,則有可能降低總的比特率,而同時保持相同的質量水平。)因此,在圖1(b)的例子中,模塊14確定,包括一致濾波器庫中任意數(shù)目p<M的相鄰濾波器的x組濾波器,要被組合在分段矩陣S1,...Sx中,以提供非一致的濾波器庫。
(雖然對于本發(fā)明并不必要,但在本說明書中假設,在分段后產(chǎn)生總共M個輸出信道。)包括信道數(shù)據(jù)和在任何給定時間間隔中要被利用的頻率分段的指示的編碼信號在分段逆矩陣S-11,...S-1x漭中被譯碼,以便提供對于一致的合成濾波器庫12的輸入。
對于具有適當?shù)念l率響應的非一致濾波器庫,它的濾波器的幅度特征必須呈現(xiàn)良好的頻率選擇性和平坦的通帶響應。為了說明本發(fā)明提供了這些選擇性和響應特性,我們考慮一個合并的濾波器Hp,k(z)是從一致CMF庫中的第k個濾波器開始的p個相鄰濾波器的線性組合,即,
Hp,k(z)=Σi=0p-1bk+iHk+i(z),k=0,...,M-p]]> 是幅度為1的組合系數(shù)。如果|Hp,k(z)|2(或等價地|Σi=0p-1bk+iHk+i(z)|2]]>)等于Σi=0p-1|Hk+i(z)|2,]]>則Hp,k(z)具有平坦的通帶響應和類似于基礎的均勻間隔開的子帶濾波器的轉換帶寬。如果原型濾波器滿足關于阻帶減小的條件(如示例的P0),則在濾波器Hk(z)與H1(z)(對于k-1>2)之間沒有頻譜重疊,這樣Σi=0p-1|Hk+i(ejω)|2=c,]]>對于|ω|∈[kπ2M+ϵ,(k+p)π2M-ϵ],c≠0]]>,而在它的阻帶中為零。
然而,將會看到,原型濾波器P0在實際的應用中不能被實施,因為它需要無限長度濾波器。所以,在實際的情形下,在非相鄰的濾波器的頻率域中確實存在重疊項,這導致組合的濾波器的通帶中的起伏,然而,通過使原型濾波器的阻帶衰減保持為高,這些起伏可被保持最小。
以下給出關于調制相位(即,關于一致濾波器庫)和組合系數(shù)的必要和充分條件,以使得最終得到的組合濾波器確實展現(xiàn)所需要的頻率行為。
對于圖2的原型濾波器P0和 k=0,...,M-1,我們然后有|Σi=0p-1bk+iHk+i(z)|2=Σi=0p-1|Hk+i(z)|2,]]>對于1≤p≤M和0≤k≤M-p,當且僅當α=(N-1)-M(2m+1),m∈Z,以及k-k+1=nπ,n∈N。
可以看到,關于α的條件是對作為基礎的一致CMF庫的新限制,但情況并非如此。從文獻已知的大多數(shù)CMF庫滿足關于α的條件,因為它抵消了在ω∈{0,π}時的一階混疊和幅度失真。至于bk的條件,這相當于選擇只在正負號上不同的、幅度1的組合系數(shù),組合運算可以由矩陣乘法代表??紤]其中組合兩個濾波器(p=2)的例子。如果我們把包含一致CMF庫分析濾波器的沖擊響應的矩陣A定義為 則包含非一致CMF庫分析濾波器的沖擊響應的矩陣A’可以通過矩陣乘法A’=SA而被創(chuàng)建,其中
組合系數(shù)bk在S的塊-對角線單元的行中找到,在本例中它是尺寸為2的Hadamard矩陣-非奇異矩陣。
在p>2的情形下,S中的非奇異塊-對角線單元尺寸為pxp,具有條目±1。在優(yōu)選實施例中,這樣的非奇異矩陣是尺寸N>p的Hadamard矩陣的pxp主子矩陣。
因此,按照本發(fā)明,代表想要的濾波器庫結構的PR非一致CMF庫可以通過分量濾波器和來自Hadamard矩陣的非奇異塊的矩陣乘法被提供到編碼器中。
在譯碼器中,對于p=2n,n∈N,分段信號A’=SA可以與矩陣S的轉置ST相乘,以提供原始信號的縮放版本。因此,變換AS→STA’可以通過適當?shù)乜s放組合系數(shù)bk而被做成么正的(unitary)(歸一正交的),這樣,假設原先的一致濾波器庫是么正的,則非一致濾波器庫也是么正的。例如,對于p=4,矩陣S是11111-11-111-1-11-1-11]]>把這個矩陣乘以它的轉置矩陣,可以提供具有4的單元幅度的單位矩陣,這樣,在這種情形下,系數(shù)bk=1/2應當被使用于么正系統(tǒng)。類似地,對于p=2,應當使用bk=1/2.]]>對于p≠2n,n∈N,在綜合運算中必須使用逆矩陣而不是轉置矩陣,這樣SS-1給出單位矩陣。(這樣,不會像在p=2n時那樣在計算上有效。)分段矩陣S,S-1可被實施為級聯(lián)到任何的一致濾波器庫。例如,圖5顯示了分析濾波器庫10’在MPEG編碼器中利用的形式。在這種情形下,輸入信號x(n)通過抽頭延時線被連接,使每個接連地延時的信號按因子M被分樣。通過與圖1(a)和(b)所示的方案相比較,本方案意味著只有分樣的信號被濾波,而不是反過來的情況。分樣的信號由各對濾波函數(shù)Gm(-z2)進行濾波,且它們的輸出在余弦調制模塊內被交叉鏈接,該余弦調制模塊產(chǎn)生M個輸出信道。
正如在圖1(b)的情形下,其中局部化模塊14確定,在給定的子帶中的頻率去局部化將通過改進時間分辨率而改進響應的質量,相鄰濾波器輸出信道的一個或多個組隨之在分段矩陣系統(tǒng)S內被相應組合,S包括如上所述的Hadamard矩陣的一個或多個主子矩陣。
因此,在任何更新時間間隔內,這些濾波器輸出信道組可被分段,以組合單獨的濾波器,這樣,使得頻率選擇去局部化而同時提高比特流的時間分辨率。由局部化模塊14用來確定最佳時間-頻率分段的特定方法,超出了本說明書的范圍,但某些內容在例如Malvar的文章中被討論。然而,一般地,這些牽涉到對于比特速率的花費函數(shù)平衡失真,以及可以單獨地被應用于頻率分段,或與自適應時間分段系統(tǒng)組合。
為了把按照本發(fā)明合并的濾波器庫與在Malvar文章中揭示的濾波器庫的結果進行比較,4個子帶濾波器被組合在64信道MLT中。在圖3和4上分別顯示了組合濾波器最終得到的時間和頻率響應。圖3(a)和4(a)顯示了在Malvar文章中揭示的結果,而圖3(b)和4(b)顯示了本發(fā)明的結果。通過觀察附圖,可以看到,對于可比較的時間局部化,本發(fā)明給出更好的頻率響應。
因此,在相對于例如Malvar來說要求可比較的質量水平的場合下,包括按照本發(fā)明優(yōu)選實施例的分段矩陣的音頻編碼器可以降低比特速率,這樣節(jié)省了總的帶寬。替換地,對于相同的比特速率將提供改進的質量。
權利要求
1.一種編碼音頻信號(x(n))的方法,該方法包括以下步驟把所述信號(x(n))作為輸入提供到一致的分析濾波器庫(10),所述分析濾波器庫包括多個余弦調制的濾波器(Hk(z)),每個濾波器提供相應的輸出信號;確定(14)所述分析濾波器庫的非一致的分段,其中三個或多個濾波器的至少一個組要對于所述音頻信號的至少一個時間間隔被組合;把所述至少一個組的濾波器與相應的分段矩陣(S1...Sx)組合,每個矩陣包括Hadamard矩陣的pxp主子矩陣,其中p等于在組內要被組合的濾波器的數(shù)目;以及在比特流中編碼所述濾波器和所述分段矩陣的輸出以及所述分段的相應指示。
2.按照權利要求1的方法,還包括以下步驟把每個Hadamard矩陣的系數(shù)與組合系數(shù)(bk)相乘,以使得所述矩陣組合是正交的。
3.一種解碼比特流的方法,該方法包括以下步驟讀出所述比特流,以提供相應于在非一致合成濾波器庫中的頻帶的多個數(shù)據(jù)信道;根據(jù)所述比特流確定所述合成濾波器庫的非一致分段,其中三個或多個數(shù)據(jù)信道的至少一個組要對于所述比特流的至少一個時間間隔被組合;把所述至少一個組的數(shù)據(jù)信道與相應的分段矩陣(S-11...S-1x)組合,每個矩陣包括Hadamard矩陣的pxp主子矩陣,其中p等于在組內要被組合的濾波器的數(shù)目;以及將所述至少一個組合的輸出作為相應的信道輸入而提供到包括多個余弦調制的濾波器(Fk(z))的一致合成濾波器庫(12),所述濾波器提供公共輸出信號(y(n))。
4.按照權利要求3的方法,其中p等于2的整數(shù)冪,以及其中每個分段矩陣包括pxp的Hadamard矩陣的轉置。
5.按照權利要求3的方法,其中p不等于2的整數(shù)冪,以及其中每個分段矩陣包括pxp的Hadamard矩陣的逆矩陣。
6.按照權利要求4或5的方法,還包括以下步驟把每個Hadamard矩陣的系數(shù)與組合系數(shù)(bk)相乘,以使得所述矩陣組合是么正的。
7.音頻編碼器,包括用于把音頻信號(x(n))作為輸入提供到一致的分析濾波器庫(10)的裝置,所述分析濾波器庫包括多個余弦調制濾波器(Hk(z)),每個濾波器提供相應的輸出信號;用于確定(14)所述分析濾波器庫的非一致分段的裝置,其中三個或多個濾波器的至少一個組要對于所述音頻信號的至少一個時間間隔被組合;用于把所述至少一個組的濾波器與相應的分段矩陣(S1...Sx)組合的裝置,每個矩陣包括Hadamard矩陣的pxp主子矩陣,其中p等于在組內要被組合的濾波器的數(shù)目;以及編碼器,用于在比特流中提供所述濾波器和所述分段矩陣的輸出,以及所述分段的相應指示。
8.音頻播放器,包括用于讀出比特流,以提供相應于在非一致合成濾波器庫中的頻帶的多個數(shù)據(jù)信道的裝置;用于根據(jù)所述比特流確定所述合成濾波器庫的非一致分段的裝置,其中三個或多個數(shù)據(jù)信道的至少一個組要對于所述比特流的至少一個時間間隔被組合;用于把所述至少一個組的數(shù)據(jù)信道與相應的分段矩陣(S-11...S-1x)組合的裝置,每個矩陣包括Hadamard矩陣的pxp主子矩陣,其中p等于在組內要被組合的濾波器的數(shù)目;以及用于將所述至少一個組合的輸出作為相應輸入而提供到包括多個余弦調制的濾波器(Fk(z))的一致合成濾波器庫(12)的裝置,所述濾波器提供公共輸出信號(y(n))。
9.包括如權利要求7中所述的音頻編碼器和如權利要求8中所述的音頻播放器的音頻系統(tǒng)。
10.包括多個信道的數(shù)據(jù)的比特流,該多個信道相應于非一致合成濾波器庫中的頻帶,所述非一致合成濾波器庫包括多個余弦調制的濾波器(Fk(z));所述比特流還包括所述合成濾波器庫的非一致分段的指示,其中三個或多個數(shù)據(jù)信道的至少一個組要對于所述比特流的至少一個時間間隔與相應的分段矩陣(S-11...S-1x)組合,每個矩陣包括pxp的Hadamard矩陣,其中p等于在組內要被組合的濾波器的數(shù)目。
11.其上存儲如在權利要求10中所述的比特流的貯存媒體。
全文摘要
一種編碼音頻信號(x(n))的方法,包括把信號(x(n))作為輸入提供到一致的余弦調制濾波器庫(10)。對于該濾波器庫確定非一致的分段,其中三個或多個濾波器的至少一個組要在音頻信號的至少一個時間間隔內被組合。該至少一個組的濾波器與相應分段矩陣(S
文檔編號G10L19/02GK1545697SQ02816277
公開日2004年11月10日 申請日期2002年8月14日 優(yōu)先權日2001年8月21日
發(fā)明者O·A·尼亞穆特, O A 尼亞穆特, R·休斯登斯, 溝撬 申請人:皇家飛利浦電子股份有限公司