專利名稱:信號處理的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息信號處理,并且更加具體地講,涉及音頻信號的處理。
背景技術(shù):
象DVB或DVD這樣的新系統(tǒng)的引進(jìn)已將數(shù)字多聲道音響效果帶給了大批的用戶。不過多數(shù)用戶仍將在長時間內(nèi)停留在立體聲音響再現(xiàn)的水平上。
為具有雙聲道器材和多聲道器材的消費者同時提供服務(wù)的一種解決方案是所謂的同時聯(lián)播。按照這種方案,并行地發(fā)送兩個獨立的信息信號,其中一個信息信號含有多聲道音響的表示,而另一個包含雙聲道音響的表示。為了實現(xiàn)發(fā)送或存儲能力的經(jīng)濟(jì)利用,在大多數(shù)應(yīng)用中,會采用音頻比特速率降低的技術(shù)。于是所發(fā)送或存儲的信息信號將會具有編碼比特流的形式,這需要有一個解碼器來還原要被再現(xiàn)的音頻信號。不過,就所要求的發(fā)送或存儲能力而言,顯然同時聯(lián)播是一種昂貴的解決方案。這使得在大多數(shù)實際情況下不能接受這種解決方案。
另一種解決方案是僅僅發(fā)送多聲道信息信號,直接為擁有多聲道音響再現(xiàn)器材的用戶提供服務(wù)。那么雙聲道用戶就需要這樣一個解碼器,該解碼器包括一個多聲道解碼器,緊隨其后的是一個下混音模塊,這個下混音模塊產(chǎn)生從多聲道到雙聲道的下混音。因此這樣的雙聲道解碼器要比常規(guī)的多聲道解碼器復(fù)雜。按照這種方案,雙聲道用戶(大多數(shù)用戶)不得不為他人的多聲道性能付費。
不希望這些用戶以較高的成本或較高的功耗來負(fù)擔(dān)系統(tǒng)的多聲道音頻性能。也不希望由于同時聯(lián)播(同時發(fā)送和存儲雙聲道(立體聲)和多聲道流)造成帶寬的浪費。
一種使得單一的編碼多聲道音頻流能夠同時由真立體聲解碼器和多聲道解碼器進(jìn)行解碼的編碼系統(tǒng)是MPEG-2音頻向后兼容多聲道編碼器(MPEG-2BC)。在所有其它的編解碼系統(tǒng)中,立體聲解碼器基本上都是(比較貴的)跟隨有下混音為立體聲的多聲道解碼器。
MPEG-2BC編碼器是通過這樣的過程來實現(xiàn)這一效果的在編碼器端將例如5聲道音響下混音為立體聲信號,將這一立體聲信號編碼為單純的立體聲流,并且還將從五個輸入信號中適當(dāng)選取的三個信號編碼為擴(kuò)展信號。立體聲解碼器僅對單純立體聲流進(jìn)行解碼。多聲道解碼器還對額外的信息進(jìn)行解碼,并且使用一個逆矩陣從下混音聲道和附加的三個聲道中還原原始的5聲道信號。將這個逆矩陣編碼為編碼比特流中的輔助信息。
US 6275589 B1介紹了一種具有與MPEG-1向后兼容能力的MPEG-2,借此對多聲道音響聲道的信號進(jìn)行矩陣變換。然后將在一個處理過程中計算的立體聲信號作為MPEG-1兼容信號發(fā)送,并且將剩余的音頻信號作為輔助數(shù)據(jù)發(fā)送。這種方法稱為“兼容矩陣變換”。
在1994年2月26日-3月1日于阿姆斯特丹召開的第96屆AES會議(AES Convention)上由ten Kate發(fā)表的預(yù)印本3792“多聲道比特速率降低的音頻信號的兼容矩陣變換(Compatibility Matrixingof Multi-Channel Bit Rate Reduced Audio Signal)”中,認(rèn)識到,倘若將多聲道格局中的信號之一下混音到立體聲下混音信號的左右聲道中,則MPEG-2BC系統(tǒng)將無法以最佳的方式工作。對于中置聲道或單音環(huán)繞聲道而言,這種情況尤為明顯。第一種情況一般稱為“占優(yōu)中置”情況。
發(fā)明內(nèi)容
本發(fā)明的一個目的是提供改進(jìn)的采用兼容矩陣變換的多輸入信號的編碼。為此,本發(fā)明提供了如獨立權(quán)利要求中定義的一種編碼的方法、一種解碼的方法、一種用于編碼的設(shè)備、一種用于解碼的設(shè)備、一種信號格式和一種記錄載體。在獨立權(quán)利要求中定義了優(yōu)選的實施方式。
按照本發(fā)明的第一個方面,本目的是通過對N個輸入信號進(jìn)行編碼來實現(xiàn)的,其中N>2,所述編碼包括-從所述N個輸入信號中生成M個信號的合成,其中N>M≥2,-將這M個信號的合成編碼為編碼數(shù)據(jù),-將從N個輸入信號中選出的N-M個信號編碼為編碼數(shù)據(jù),其中在進(jìn)行編碼之前對所述M個信號的合成進(jìn)行正交化。
優(yōu)選地,正交化是通過在獨立編碼及和/差編碼之間進(jìn)行切換完成的。例如,在占優(yōu)中置狀態(tài)或占優(yōu)環(huán)繞狀態(tài)的情況下,使用兼容信號(即,M個信號的合成)的和/差信號編碼,而在其它情況下使用獨立編碼。
按照本發(fā)明的實施例,編碼器在編碼信號中包含有一個控制信號,用于為解碼器指示所述正交化是如何執(zhí)行的,并且從而指明應(yīng)當(dāng)如何執(zhí)行解正交化。
優(yōu)選地,M=2。
優(yōu)選地,正交化是在頻域中完成的。
優(yōu)選地,在獨立編碼與和/差編碼之間的切換可以在每個頻段進(jìn)行選擇。
通過下文中所介紹的優(yōu)選實施例,本發(fā)明的這些和其它的方面以及實施例將變得顯而易見。
通過結(jié)合所附的附圖閱讀下述本發(fā)明的優(yōu)選實施例的說明,本發(fā)明將會得到更加清楚的理解,其中附圖1表示應(yīng)用了本發(fā)明的系統(tǒng)的框圖;附圖2表示由編碼器輸出的信號,和附圖3表示按照本發(fā)明的優(yōu)選實施方式的方法的流程圖。
具體實施例方式
附圖1表示在其中實現(xiàn)本發(fā)明的系統(tǒng)10的總體框圖。系統(tǒng)10包括一個包含下混音和從N個輸入信號中選擇N-M個信號的矩陣變換電路1、一個包括立體聲編碼器2a和環(huán)繞擴(kuò)展編碼器2b的編碼器2、一個多路復(fù)用器/格式化器單元3、一個包含立體聲解碼器4a和一個環(huán)繞擴(kuò)展解碼器4b的解碼器4、一個逆矩陣變換電路5和用于在至少兩個編碼模式之間切換在編碼器2a中執(zhí)行的編碼的切換單元15。附圖1中所示的系統(tǒng)10表示在編碼器中帶有下混音的多聲道編碼器/多聲道解碼器系統(tǒng)。
N個輸入聲道,例如,左聲道L、右聲道R、中置信號C、左環(huán)繞信號LS和右環(huán)繞信號RS,首先被發(fā)送到矩陣變換電路1并且進(jìn)一步發(fā)送到包含立體聲編碼器2a和環(huán)繞編碼器2b的編碼器2。立體聲編碼器2a對M=2個信號的合成進(jìn)行編碼,例如,L0=L+C+LS和R0=R+C+RS。立體聲編碼器2a還包括一個正交化單元12,例如在占優(yōu)中置信號或占優(yōu)環(huán)繞的情況下,通過執(zhí)行切換到L0和R0的和/差編碼,該正交化單元12與切換單元15一起使M=2個信號的合成正交化。正交化單元12還提供了一個用于向解碼器指示正交化是如何執(zhí)行的以及從而應(yīng)當(dāng)如何進(jìn)行解正交化的控制信號。所述編碼優(yōu)選地是所謂的“感知音頻編碼”,從而音頻信號的連續(xù)時域塊中的每一個得以在頻域中進(jìn)行編碼。具體來說,將每個塊的頻域表達(dá)劃分成多個頻帶,基于心理聲學(xué)標(biāo)準(zhǔn)對每個頻帶進(jìn)行編碼,從而使音頻信號得到有效壓縮。也可以采用其它類型的編碼方案,只是在本例中沒有進(jìn)一步介紹。
在多路復(fù)用器/格式化器單元3中對編碼信號進(jìn)行多路復(fù)用/格式化,并且將其作為信號Qout按照第一比特流中的M個信號的合成和第二比特流中選出的N-M個信號的形式(如指向解碼器4的兩個箭頭所示)發(fā)送給解碼器4。附圖2中示出了信號Qout,該附圖表示兩個比特流相互位于彼此“之上”。每個比特流包括一個報頭7和數(shù)據(jù)域8和/或9。指示如何執(zhí)行正交化的控制信號可以包含在第一和/或第二比特流的報頭7中。
可替換地,表示正交化的M個信號的合成的編碼數(shù)據(jù)和表示N-M個信號的選擇的編碼數(shù)據(jù)包含在同一個比特流中,例如,分別包含在數(shù)據(jù)域8和9中。指示正交化如何執(zhí)行的控制信號于是可以包含在報頭7中。
解碼器4包括一個立體聲解碼器4a和一個環(huán)繞擴(kuò)展解碼器4b。矩陣變換電路5從經(jīng)過解碼的立體聲流和附加的經(jīng)過解碼的三個聲道中導(dǎo)出原始的5聲道信號。矩陣變換電路5執(zhí)行與矩陣變換電路1中所執(zhí)行的運算相逆或基本相逆的運算。立體聲解碼器4a還包括一個解正交化單元14,在例如通過依據(jù)向解碼器指示如何執(zhí)行正交化以及從而應(yīng)當(dāng)如何執(zhí)行解正交化的控制信號切換到和/差解碼或獨立解碼而進(jìn)行的解碼之后,該解正交化單元14對M=2個信號的合成進(jìn)行解正交化。這個源自單元12的控制信號包含在編碼數(shù)據(jù)流中。
附圖3表示按照優(yōu)選實施例的對N個輸入信號進(jìn)行編碼的方法的流程圖。在第一步驟101中,在進(jìn)行編碼之前,將N個輸入信號變換為頻域表達(dá)。在第二步驟102中,判斷占優(yōu)中置狀態(tài)或占優(yōu)環(huán)繞狀態(tài)是(由Y表示)否(由N表示)出現(xiàn)。如果是Y,則選擇和/差編碼模式(步驟103)。如果是N,則對信號進(jìn)行獨立編碼。實際的編碼過程發(fā)生在步驟104中。在步驟104中,將M個信號的合成編碼成數(shù)據(jù)的比特流,一般是第一比特流,并且將從N個輸入信號中選出的N-M個信號編碼成數(shù)據(jù)的另一個比特流,一般是數(shù)據(jù)的第二比特流。也將步驟102和103總體稱為正交化步驟。
本領(lǐng)域的技術(shù)人員都清楚,解碼運算與編碼運算相逆或基本相逆。
下面將介紹矩陣方程的例子,以更好地說明本發(fā)明的實施例。矩陣方程1-21說明了沒有應(yīng)用本發(fā)明的情況。給出這些方程是為了在說明本發(fā)明優(yōu)選實施例之前先說明編碼和解碼過程,以便更好地理解本發(fā)明。
示例性的矩陣方程如下所示(為了簡便,省略了增益系數(shù))在編碼器端L0=L+C+LS(1)R0=R+C+RS(2)T3=C (3)T4=LS(4)T5=RS(5)其中發(fā)送聲道為L0、R0、T3、T4和T5。
在解碼器端C′=T3′ (6)LS′=T4′(7)RS′=T5′(8)L′=L0′-C′-LS′=L0′-T3′-T4′(9)R′=R0′-C′-RS′=R0′-T3′-T5′(10)其中符號’表示經(jīng)過解碼的信號。
雖然在解碼器端矩陣求逆是精確的,但是上述方程并不能精確地產(chǎn)生原始的輸入信號,因為發(fā)送聲道L0、R0、T3、T4和T5由于編碼而發(fā)生了改變。
T3、T4和T5的編碼是直接受感知編碼器控制的,因此C’、LS’和RS’不會導(dǎo)致質(zhì)量問題。在上面所給出的例子中,由于進(jìn)行了矩陣變換,L0、T3和T4中的編碼噪聲會出現(xiàn)在L’中,并且R0、T3和T5中的編碼噪聲會出現(xiàn)在R’中。這種編碼噪聲可以通過選擇適當(dāng)?shù)囊cL0和R0一起發(fā)送的額外聲道來實現(xiàn)最小化。如果C、LS和RS是最弱的信號,那么L’和R’中的編碼噪聲將會分別由L0’和R0’支配,這一噪聲將會再次直接受到感知編碼器的控制。如果另一個信號組合是最弱的,則應(yīng)當(dāng)選擇這個信號組合作為T3、T4和T5發(fā)送。
然而,當(dāng)中置信號C是最強(qiáng)的信號(下文中稱為“占優(yōu)中置”狀態(tài))時,L0幾乎等于R0。
可以看出,小信號之一總是需要通過對兩個大的、幾乎相等的信號進(jìn)行相減以得到小信號的方式來得以還原的。這可以由下述公式表示在編碼器端L0=L+C+LS(11)R0=R+C+RS(12)T3=L (13)T4=LS(14)T5=RS(15)在解碼器端L′=T3′ (16)LS′=T4′(17)RS′=T5′(18)C′=L0′-L′-LS′=L0′-T3′-T4′(19)R′=R0′C′-RS′=R0′-C′-T5′ (20)=R0′-L0′+T3′+T4′-T5′ (21)其中R’是小的,R0’和L0’都是大的,而T3’、T4’和T5’全都是小的。顯然,L0和R0中相對較小的誤差就會導(dǎo)致結(jié)果得到的信號R’中的相對較大且可清楚聽見的誤差。質(zhì)量就可以得到保持,不過只能通過對兼容信號L0、R0中的至少一個以比這一信號自身的良好音質(zhì)所必需的比特速率高得多的比特速率進(jìn)行編碼。另一種方法是可以對附加的發(fā)送聲道進(jìn)行編碼,在這種情況下例如四個聲道,不過這通常也是對帶寬的浪費。因此,按照本發(fā)明的一個方面,提供了一種用于在占優(yōu)中置狀態(tài)情況下對兼容信號進(jìn)行和/差編碼的編碼器。這樣,中置信號C將不再是用于兼容信號的方程之一,并且該方程可用于計算第四個小信號。當(dāng)然,對于非占優(yōu)狀態(tài),一切都可以保持原樣。對于占優(yōu)狀態(tài),兼容信號的矩陣變換得到了增加
在編碼器端L0=L+C+LS (22)R0=R+C+RS (23)T3=L (24)T4=LS (25)T5=RS (26)Ch0=L0+R0=L+R+2C+LS+RS(27)Ch1=L0-R0=L-R+LS-RS (28)在解碼器端L′=T3′ (29)LS′=T4′ (30)RS′=T5′ (31)R′=L′+LS′-RS′-Ch1′=T3′+T4′-T5′-Ch1′ (32)2C′=Ch0′-L′-R′-LS′-RS′=Ch0′+Ch1′-2T3′-2T4′ (33)現(xiàn)在R’可以僅從小信號中得到,C’可以從一個強(qiáng)信號(Ch0’)加上多個小信號得到。按照這種方法,強(qiáng)信號彼此相減得到小信號的情況得到了避免。在兼容的立體聲解碼器4a中,需要進(jìn)行下述的矩陣變換L0=(Ch0+Ch1)/2 (34)R0=(Ch0-Ch1)/2 (35)本發(fā)明可以得到應(yīng)用的另一種情況是當(dāng)兼容信號(L0,R0)包括經(jīng)矩陣變換的環(huán)繞信號,即,在下混音中包含單音環(huán)繞(S=f(LS+RS))時,以及當(dāng)S是強(qiáng)信號時。這被稱為所謂的“占優(yōu)環(huán)繞狀態(tài)”。在這種狀態(tài)下,L0在幅度上幾乎等于R0但是相位相反。選擇左聲道L、右聲道R和中置信號C以T3、T4和T5的形式發(fā)送使得無法用逆矩陣還原LS和RS??梢钥闯觯偸怯幸粋€小信號需要通過對L0’和R0’進(jìn)行相加而還原。應(yīng)當(dāng)選擇LS和RS中最弱的信號作為第三附加信號。這在下面的例子中得到了解釋說明在編碼器端L0=L+C-LS-RS(36)R0=R+C+LS+RS (37)T3=C (38)T4=L (39)T5=RS (40)
在解碼器端C′=T3′ (41)L′=T4′ (42)RS′=T5′ (43)LS′=L′+C′-L0′-RS′=T4′+T3′-L0′-T5 (44)R′=R0′-C′-LS′-RS′=R0′-T3′-LS′-T5′(45)由于L0’和R0’相位相反這一情況,這意味著對兩個大的、幾乎相等的信號進(jìn)行相加以獲得一個小信號R’。顯然,L0’和R0’中相對較小的誤差會在結(jié)果得到的信號中導(dǎo)致相對較大且可清楚聽到的誤差。仍舊可以保持質(zhì)量,不過只能通過對兼容信號中的至少一個以遠(yuǎn)高于這一信號本身的良好音質(zhì)所需的比特速率的比特速率進(jìn)行編碼。而且在這種情況下,還有另一種方法,是以浪費帶寬為代價對附加的發(fā)送聲道進(jìn)行編碼。
按照本發(fā)明的另一個優(yōu)選實施例,兼容信號的矩陣變換依照下述方程得到了增加在編碼器端L0=L+C-LS-RS (46)R0=R+C+LS+RS (47)T3=C (48)T4=L (49)T5=RS(50)Ch0=L0+R0=L+R+2C(51)Ch1=L0-R0=L-R-2LS-2RS (52)在解碼器端C′=T3′ (53)L′=T4′ (54)RS′=T5′(55)R′=Ch0′-L′-2C′=Ch0′-T4′-2T3′ (56)2LS′=L′-R′-2RS′-Ch1′=T4′-R′-2T5′-Ch1′ (57)現(xiàn)在R’是僅從小信號中得到的,LS’是從一個強(qiáng)信號(Ch1’)加上多個小信號得到的。通過這種方式,強(qiáng)信號彼此相減以得到小信號的情況得到了避免。在兼容的立體聲解碼器中,需要執(zhí)行下述矩陣
Lo=(Ch0+Ch1)/2 (58)Ro=(Ch0-Ch1)/2 (59)本發(fā)明還可應(yīng)用于例如多聲道音樂發(fā)布。
可以對編碼數(shù)據(jù)進(jìn)行存儲,從而可以對其進(jìn)行讀取、解碼并將其提供給記錄載體的聽眾。
應(yīng)當(dāng)注意,上述的實施例是為了解釋說明而非限制本發(fā)明,并且本領(lǐng)域的技術(shù)人員能夠設(shè)計出很多替換的實施例,而不會超出所附的權(quán)利要求書的范圍。在權(quán)利要求書中,任何置于括號中的附圖標(biāo)記皆不應(yīng)理解為是對權(quán)利要求的限定。詞“包括”并不排除除了權(quán)利要求中所列之元件或步驟之外,還存在其它的元件或步驟。本發(fā)明可以借助包括數(shù)個單獨元件的硬件來實現(xiàn),并且也可以借助適當(dāng)編程的計算機(jī)來實現(xiàn)。在列出數(shù)個裝置的設(shè)備權(quán)利要求中,這些數(shù)個裝置可以由同一個硬件項目來實施。在彼此不同的從屬權(quán)利要求中記載的某些手段這一表面現(xiàn)象并不表示這些手段的組合不能得到有利的使用。
權(quán)利要求
1.一種對N個輸入信號進(jìn)行編碼的方法,其中N>2,所述方法包括下述步驟-從所述N個輸入信號中生成M個信號的合成,其中N>M≥2,-將這M個信號的合成編碼為編碼數(shù)據(jù),-將從N個輸入信號中選出的N-M個信號編碼為編碼數(shù)據(jù),其中在進(jìn)行編碼之前對所述M個信號的合成進(jìn)行正交化。
2.按照權(quán)利要求1所述的方法,其中所述正交化是通過在和/差編碼和獨立編碼之間進(jìn)行切換實現(xiàn)的。
3.按照權(quán)利要求1或2所述的方法,其中在編碼數(shù)據(jù)中包含有控制信號,所述控制信號用于向解碼器指示所述正交化是如何執(zhí)行的。
4.按照權(quán)利要求1-3中任何一項所述的方法,其中將M個信號的合成編碼為第一比特流,而將所選擇的N-M個信號編碼為第二比特流。
5.按照權(quán)利要求1-4中任何一項所述的方法,其中M=2。
6.按照權(quán)利要求1-5中任何一項所述的方法,其中在進(jìn)行編碼之前,將N個輸入信號變換到頻域。
7.按照權(quán)利要求1-6中任何一項所述的方法,其中所述正交化是在每個頻帶執(zhí)行的。
8.一種用于對表示N個信號的編碼數(shù)據(jù)進(jìn)行解碼的方法,所述編碼數(shù)據(jù)包括M個信號的合成和一組N-M個信號,其中N>M≥2,并且其中所述M個信號的合成是正交化的,所述用于解碼的方法包括-對所述編碼數(shù)據(jù)進(jìn)行解碼,以獲得M個信號的合成和所述一組N-M個信號,-從所述M個信號的合成和所述一組N-M個信號生成一組N個輸出信號,其中在生成N個輸出信號之前對所述M個信號的合成進(jìn)行解正交化。
9.按照權(quán)利要求8所述的用于解碼的方法,其中所述解正交化是通過在和/差解碼和獨立解碼之間進(jìn)行切換來實現(xiàn)的。
10.一種用于對N個輸入信號進(jìn)行編碼的設(shè)備,其中N>2,所述設(shè)備包括具有如下用途的裝置-從所述N個輸入信號中生成M個信號的合成,其中N>M≥2,-將這M個信號的合成編碼為編碼數(shù)據(jù),-將從N個輸入信號中選出的N-M個信號編碼為編碼數(shù)據(jù),-在進(jìn)行編碼之前對所述M個信號的合成進(jìn)行正交化。
11.一種用于對表示N個信號的編碼數(shù)據(jù)進(jìn)行解碼的設(shè)備,所述編碼數(shù)據(jù)包括M個信號的合成和一組N-M個信號,其中N>M≥2,并且其中所述M個信號的合成是正交化的,所述用于解碼的設(shè)備包括-對所述編碼數(shù)據(jù)進(jìn)行解碼,以獲得M個信號的合成和所述一組N-M個信號,-從所述M個信號的合成和所述一組N-M個信號生成一組N個輸出信號,其中在生成N個輸出信號之前對所述M個信號的合成進(jìn)行解正交化。
12.一種在發(fā)送表示N個信號的編碼數(shù)據(jù)中使用的信號格式,所述編碼數(shù)據(jù)包括M個信號的合成和一組N-M個信號,其中N>M≥2,并且其中所述M個信號的合成是正交化的。
13.按照權(quán)利要求12所述的信號格式,其中在所述編碼數(shù)據(jù)中包含控制信號,所述控制信號用于向編碼器指示正交化是如何執(zhí)行的。
14.一種記錄載體,在該記錄載體上存儲有如權(quán)利要求12或13所述的信號格式。
全文摘要
兼容信號的和/差編碼,典型地在由立體聲解碼器和由多聲道解碼器進(jìn)行解碼的多聲道音頻流的占優(yōu)中置信號或占優(yōu)環(huán)繞狀態(tài)的情況下,提供了經(jīng)改進(jìn)的采用兼容矩陣變換的多輸入信號的編碼。
文檔編號H04H20/88GK1666572SQ03807326
公開日2005年9月7日 申請日期2003年3月19日 優(yōu)先權(quán)日2002年4月5日
發(fā)明者L·M·范德科霍夫, F·M·J·德邦特, A·W·J·奧門 申請人:皇家飛利浦電子股份有限公司