專利名稱:生成經(jīng)編碼的音頻信號(hào)的方法以及處理音頻信號(hào)的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種多聲道編碼方法,尤其涉及一種生成經(jīng)編碼的音頻信號(hào)的 方法以及一種處理音頻信號(hào)的方法。
背景技術(shù):
一般來說,信號(hào)可以各種方式(例如塊、頻帶和聲道)配置。在信號(hào)得保 持預(yù)定的統(tǒng)計(jì)特性的靜態(tài)時(shí)段內(nèi),上述信號(hào)無需分成若干單元即可被處理,因 為這對(duì)于壓縮信號(hào)是有利的。在信號(hào)特性陡然改變的瞬態(tài)時(shí)段內(nèi)優(yōu)選以分割方式處理信號(hào),因?yàn)榉乐沽?信號(hào)失真。然而,如果用戶想要以分割方式處理前述信號(hào),卻沒有將經(jīng)分割的信息信 令化的詳細(xì)方法。因此,難以有效地處理所述信號(hào)。發(fā)明內(nèi)容因此,本發(fā)明涉及一種能本質(zhì)上消除由于相關(guān)技術(shù)的局限和缺陷造成的一 個(gè)或多個(gè)問題的將分割信息信令化的方法。用于解決問題的本發(fā)明的一個(gè)目的在于一種有效地將經(jīng)分割的信號(hào)信令 化的方法。本發(fā)明的目的可通過提供一種生成經(jīng)編碼的音頻信號(hào)的方法來達(dá)成,所述 方法包括生成基本空間信息,所述基本空間信息包括多聲道音頻編碼過程所 必需的基本配置信息以及與所述基本配置信息對(duì)應(yīng)的基本數(shù)據(jù);以及生成擴(kuò)展 空間信息,所述擴(kuò)展空間信息包括上述多聲道音頻編碼過程選擇性要求的擴(kuò)展 配置信息以及與所述擴(kuò)展配置信息對(duì)應(yīng)的擴(kuò)展數(shù)據(jù)。附圖簡述包括在這里以提供對(duì)本發(fā)明的進(jìn)一步理解的附圖示出本發(fā)明的實(shí)施方式,可與說明書一起解釋本發(fā)明的原理。在附圖中
圖1是示出根據(jù)本發(fā)明一個(gè)實(shí)施方式的塊分割信息的信令化方法的概念圖;圖2和圖3是示出根據(jù)本發(fā)明一個(gè)實(shí)施方式的頻帶和聲道分割信息的信令 化方法的概念圖;圖4是示出根據(jù)本發(fā)明另一實(shí)施方式的創(chuàng)建多聲道信號(hào)的方法的概念圖; 圖5是示出根據(jù)本發(fā)明另一個(gè)實(shí)施方式的聲道分割信息的信令化方法的概念圖。發(fā)明的最佳實(shí)施模式下面將詳細(xì)參考本發(fā)明的優(yōu)選實(shí)施方式,其具體示例圖示于附圖中。 下面結(jié)合附圖對(duì)根據(jù)本發(fā)明的分割信息(也稱為"分拆信息")的信令化 方法進(jìn)行說明。根據(jù)本發(fā)明的分割信息的信令化方法是根據(jù)信號(hào)類別予以分類的。 在描述本發(fā)明之前,應(yīng)當(dāng)指出所述信號(hào)以各種方式配置,例如塊、頻帶和聲道。所述的"信令化方法"可包括"信令化"的含義或者"識(shí)別信令化的信號(hào)" 的含義。術(shù)語"節(jié)點(diǎn)"是指示信號(hào)已分割還是未分割的點(diǎn)。術(shù)語"空間信息"是能夠聲道縮減混音或聲道擴(kuò)展混音多聲道信號(hào)的信息。應(yīng)當(dāng)指出,"空間信息"可表示空間參數(shù),然而它不局限于所述示例,而 是在需要時(shí)能應(yīng)用于其它示例。所述空間參數(shù)是指示兩個(gè)聲道之間能量差的聲道電平差(CLD)、指示兩 個(gè)聲道之間相關(guān)性的聲道間相干性(ICC)、以及用于從兩個(gè)聲道創(chuàng)建三個(gè)聲 道的聲道預(yù)測系數(shù)(CPC)。下面對(duì)塊分割、頻帶分割和聲道分割進(jìn)行詳細(xì)說明。l)塊分割要求用塊處理來以與音頻信號(hào)相同的方式壓縮時(shí)域中的連續(xù)數(shù)據(jù)。 術(shù)語"塊處理"表示在預(yù)定距離的間隔上以分割方式處理輸入信號(hào)。 在這種情形下,所述間隔被定義為"塊",而一個(gè)或多個(gè)塊組合起來構(gòu)成"幀"o所述幀可表示用于發(fā)送/存儲(chǔ)數(shù)據(jù)的單位。術(shù)語"塊分割"或"塊分拆"可表示一種具體過程,在該過程中在信號(hào)處 理期間將輸入信號(hào)變?yōu)椴煌L度的塊。術(shù)語"塊長度信息"是指示在處理輸入信號(hào)將輸入信號(hào)變?yōu)椴煌L度的多 個(gè)塊的時(shí)候所獲得的塊長度的特定信息。一般來說,如果信號(hào)以塊的形式配置,則信號(hào)處理用長塊或短塊完成。在使用短塊的情形下,將若干短塊組合,并使組合后的塊對(duì)應(yīng)于單個(gè)長塊。然而,對(duì)于每個(gè)間隔,信號(hào)具有各種不同的特性,因此難以決定性地確定 所有信號(hào)均能根據(jù)長塊信號(hào)處理方案和短塊信號(hào)處理方案予以處理。優(yōu)選地,在特定間隔內(nèi)從適合信號(hào)特性的不同長度的塊中選擇一個(gè)特定長 度的塊,隨后在所選塊上執(zhí)行塊分割。更詳細(xì)地,諸塊被配置成具有兩種或多種不同的長度??梢愿鞣N方式從幀 中選擇這兩種或多種不同長度塊中的預(yù)定長度的塊。為此,需要指明當(dāng)前幀中包含哪些塊,所以需要用于上述操作的信令化方法。所述信令化方法被分成順序信令化方法和分級(jí)信令化方法。 順序信令化方法預(yù)定義幀長度(即由"N"表示的長度)并使用最小長度塊的數(shù)目M執(zhí)行信令化過程。在這種情形下,幀長度"N"是特定M的倍數(shù)。幀長度可以是固定值或可 以是作為附加信息被發(fā)送至目的地的'4 、V定值。例如,假設(shè)N是2048 (N=2048) , M是256 (M=256),而諸個(gè)塊以256 —256—1024—512的次序排列,則塊長度信息可以按M*l、 M*l、 M*4、 M*2—1、 1、 4、 2 — 0、 0、 3、 1的次序進(jìn)行信令化處理。分級(jí)信令化方法可分為發(fā)送層深度信息的方法和不發(fā)送層深度信息的方 法,下面結(jié)合附圖對(duì)其進(jìn)行詳細(xì)說明。圖1是示出根據(jù)本發(fā)明一個(gè)實(shí)施方式的塊分割信息的信令化方法的概念圖;參照?qǐng)D1,每個(gè)層用"層"表示,且層深度被設(shè)為"5"。 "層l"包括第一塊210,它是用作塊分割的基本單位的最長塊,并且第 一塊210的長度是N。附圖標(biāo)記(l)、 (2)、……、(a)、 (b)、 (c)和(d)表示示例性的二進(jìn)制信令 化序列。根據(jù)本實(shí)施方式,指示塊是否被分割的塊分割信息由分割I(lǐng)D (標(biāo)識(shí)符)和 不分割I(lǐng)D表示。特定數(shù)字"1"被用作分割I(lǐng)D,而特定數(shù)字"0"被用作不分 割I(lǐng)D。所述分割I(lǐng)D和不分割I(lǐng)D在每個(gè)層的節(jié)點(diǎn)中表示。分割I(lǐng)D指示包含在上級(jí)層中的預(yù)定塊被分割成下級(jí)層中的二等份,且還 指示向該下級(jí)層分配了下級(jí)節(jié)點(diǎn)。不分割I(lǐng)D指示上級(jí)層中的預(yù)定塊不被下級(jí)層分割,還指示沒有向該下級(jí) 層分配與由該不分割I(lǐng)D表示的節(jié)點(diǎn)相對(duì)應(yīng)的任何下級(jí)節(jié)點(diǎn)。不分配下級(jí)節(jié)點(diǎn) 意味著不執(zhí)行其它信令化操作。由于在最高層(即層l)中第一塊210的塊分割信息(1)的值為l,因此 對(duì)第一層210執(zhí)行塊分割。作為層1之下級(jí)層的層2包括兩個(gè)塊220和221,每個(gè)塊的長度為N/2。包含在層2中的塊220的塊分割信息(2)具有值"l",而塊221的塊分 割信息(3)具有值"l",從而作為層2之下級(jí)層的層3包括四個(gè)塊230、 231、 232和233,每個(gè)塊長度為N/4。與包含在層3中的塊230相關(guān)聯(lián)的塊分割信息(4)的值為"0"。與塊231 相關(guān)聯(lián)的塊分割信息(5)的值為"1"。與塊232相關(guān)聯(lián)的塊分割信息(6) 的值為"1"。與包含在層3中的塊233相關(guān)聯(lián)的塊分割信息(7)的值為"0"。因此,根據(jù)層3的塊分割信息,不對(duì)層3的塊230和233執(zhí)行塊分割,但 對(duì)層3的塊231和232執(zhí)行塊分割。在這種情形下,沒有向作為層3的所述未經(jīng)塊分割的塊230和233的下級(jí) 層的層4分配下級(jí)節(jié)點(diǎn)。層3的經(jīng)塊分割的塊231和232向下級(jí)層分配下級(jí)節(jié)點(diǎn)。塊分割的存在與 否在下級(jí)節(jié)點(diǎn)中表示出來。層4的長度為N/8,并包括在層3的塊231的基礎(chǔ)上分割出的塊240和241 , 還包括在層3的塊232的基礎(chǔ)上分割出的其它塊242和243。與層4的塊240相關(guān)聯(lián)的塊分割信息(8)的值為"0"。與層4的塊241 相關(guān)聯(lián)的塊分割信息(9)的值為"1"。與層4的塊242相關(guān)聯(lián)的塊分割信息 (a)的值為"0"。與層4的塊243相關(guān)聯(lián)的塊分割信息(b)的值為"0"。因此,根據(jù)層4的塊分割信息,不在層4的塊240、 242和243上執(zhí)行塊 分割,但在層4的塊241上執(zhí)行塊分割。在這種情形下,沒有向作為層4的所述未經(jīng)塊分割的塊240、 242和243 的下級(jí)層的層5分配下級(jí)節(jié)點(diǎn)。層4的經(jīng)塊分割的塊241向?qū)?分配一個(gè)下級(jí)節(jié)點(diǎn),從而其在所述下級(jí)節(jié) 點(diǎn)中指示是否存在塊分割。層5的長度為N/16,且包括在層4的塊241的基礎(chǔ)上分割出的塊250和251。與層5的塊250相關(guān)聯(lián)的塊分割信息(c)的值為"0"。與層5的塊251 相關(guān)聯(lián)的塊分割信息(d)的值為"0"。因此,層4中所含的每個(gè)塊的值為"0",從而不再執(zhí)行分級(jí)塊分割,所以 塊的塊分割深度能夠識(shí)別出來。能被分級(jí)塊分割的塊的布局結(jié)構(gòu)包括N/4塊(即長度為N/4的塊)、N/8 塊、N/16塊、N/16塊、N/8塊、N/8塊和N/8塊。如果信號(hào)長度為N,則經(jīng)塊分割的塊具有式"N/xJ"表示(其中i二l、2、……、 P, P是整數(shù)而x二2)表示的長度中的任何一個(gè)(即N/2、 N/4、 N/8、 N/16和 N/32......)。在表示能根據(jù)二進(jìn)制信令化序列(l) (2) (3) (4) (5) (6) (7) (8) (9) (a) (b) (c) (d)由二進(jìn)制數(shù)表示的塊分割的信息的情形下,塊分割信息可由13個(gè) 比特"1110110010000"表示。上面的說明已公開了一個(gè)示例性情形,其中層的深度信息不被另行表示而 是只通過由分割I(lǐng)D和不分割I(lǐng)D表示的塊分割信息即可予以識(shí)別。然而,應(yīng)當(dāng)注意,另外表示層深度信息的其它塊分割信息也可進(jìn)行信令化 處理。例如,層的深度信息由分割終止ID和分割繼續(xù)ID表示。所述分割終止ID可表示在其中不再執(zhí)行塊分割的最低層。所述分割繼續(xù) ID可表示除卻最低層之外的剩余各層。在這種情形下,分割繼續(xù)ID由"l"表 示,而分割終止ID由"0"表示。圖1中示出的層深度為"5",也可使用分割終止ID"O"和分割繼續(xù)ID"1" 以"11110"來表示。子塊長度可由所述信令化方法予以識(shí)別。這樣,在另行表示深度信息的情形下,在向最低層分配的節(jié)點(diǎn)處僅可表示 不分割I(lǐng)D,從而信令化處理過程可在從當(dāng)前層至最低層的上一層的范圍內(nèi)執(zhí) 行。例如,假設(shè)分割I(lǐng)D由"1"表示而不分割I(lǐng)D由"0"表示,且分割繼續(xù)ID 由"1"表示而分割終止ID由"0"表示,指示向最低層分配的節(jié)點(diǎn)是否被分 割的特定值可由指示分割終止的"0"表示。2)頻帶分割下面結(jié)合圖2-3描述頻帶分割。圖2是示出根據(jù)本發(fā)明另一個(gè)實(shí)施方式的頻帶分割信息的信令化方法的概 念圖。圖2示出配置成子帶濾波器組的樹形結(jié)構(gòu)的分級(jí)頻帶分割。子帶的頻率分辨率可以各種方式定義,下面將對(duì)其進(jìn)行詳細(xì)說明。相比圖1的塊分割,圖2的頻帶分割在最高層中包括多個(gè)頻帶,而圖1的最高層卻由一個(gè)長塊構(gòu)成。根據(jù)本實(shí)施方式,指示頻帶是否被分割的頻帶分割信息由分割I(lǐng)D和不分割I(lǐng)D表示。值"1"作為分割I(lǐng)D,而值"0"作為不分割I(lǐng)D。 分割I(lǐng)D和不分割I(lǐng)D可在每層的節(jié)點(diǎn)處指明。 分割I(lǐng)D指示第M層的頻帶在第(M+l)層被分割成二等份。 不分割I(lǐng)D指示第M層的頻帶在第(M+l)層不被分割,還指示沒有向下級(jí)層分配與由不分割I(lǐng)D表示的節(jié)點(diǎn)相對(duì)應(yīng)的任何下級(jí)節(jié)點(diǎn)。不分配下級(jí)節(jié)點(diǎn)意味著不執(zhí)行其它信令化操作。作為最高層的層1包括第一至第六頻帶310、 311、 312、 313、 314和315。 第一頻帶310的頻帶分割信息(1)由"1"表示。第二頻帶311的頻帶分割信息(2)由"1"表示。第三頻帶312的頻帶分割信息(3)由"0"表示。第四頻帶313的頻帶分割信息(4)由"0"表示。第五頻帶314的頻帶分割信息(5)由"0"表示。第Pq頻帶313的頻帶分割信息(6)由"0"表示。 所述頻帶分割信息被標(biāo)示在向?qū)?分配的節(jié)點(diǎn)處。根據(jù)頻帶分割信息(1)和(2),第一頻帶310產(chǎn)生信號(hào)轉(zhuǎn)換模塊310T, 而第二頻帶311產(chǎn)生信號(hào)轉(zhuǎn)換模塊311T,從而在層2中產(chǎn)生下級(jí)頻帶320、321、 322和同時(shí),未對(duì)其進(jìn)行頻帶分割的第三、第四、第五或第六頻帶312、 313、 314 或315不產(chǎn)生頻帶轉(zhuǎn)換模塊。同樣,在第三、第四、第五或第六頻帶312、 313、 314或315中不產(chǎn)生與層2相對(duì)應(yīng)的下級(jí)頻帶。因此,未向?qū)?分配與312、 313、 314和315相對(duì)應(yīng)的任何下級(jí)節(jié)點(diǎn)。層2包括在層1的頻帶310基礎(chǔ)上分割出的兩個(gè)頻帶320、 321,并且還包 括在層1的頻帶311上分割出的兩個(gè)頻帶322和323。頻帶320的頻帶分割信息(7)由"1"表示。頻帶321的頻帶分割信息(8) 由"1"表示。頻帶322的頻帶分割信息(9)由"0"表示。頻帶323的頻帶 分割信息(10)由"0"表示。根據(jù)所述頻帶分割信息(7)和(8),頻帶320產(chǎn)生頻帶轉(zhuǎn)換模塊320T, 而頻帶321產(chǎn)生頻帶轉(zhuǎn)換模塊321T,從而在層3中產(chǎn)生下級(jí)頻帶330、 331、 332和333。向下級(jí)頻帶330、 331、 332和333分配了下級(jí)節(jié)點(diǎn)。同時(shí),未對(duì)其進(jìn)行頻帶分割的頻帶322和323不產(chǎn)生頻帶轉(zhuǎn)換模塊。在頻 帶322和323中也不產(chǎn)生與層3相對(duì)應(yīng)的下級(jí)頻帶。因此,未向頻帶322和323 分配下級(jí)節(jié)點(diǎn)。層3包括在層2的頻帶320基礎(chǔ)上分割出的兩個(gè)頻帶330、 331,并且還包 括在層2的頻帶321上分割出的兩個(gè)頻帶332和333。頻帶330的頻帶分割信息(11)由"1"表示。頻帶331的頻帶分割信息 (12)由〃0〃表示。第三頻帶332的頻帶分割信息(13)由〃0〃表示。頻帶333 的頻帶分割信息(14)由〃(T表示。根據(jù)所述頻帶分割信息(11),頻帶330產(chǎn)生信號(hào)轉(zhuǎn)換模塊330T,且在層 4中產(chǎn)生下級(jí)頻帶340和341。向下級(jí)頻帶340和341分配了下級(jí)節(jié)點(diǎn)。同時(shí),未對(duì)其進(jìn)行頻帶分割的頻帶331、 332和333不產(chǎn)生頻帶轉(zhuǎn)換模塊。 在頻帶331、 332和333中也不產(chǎn)生與層4相對(duì)應(yīng)的下級(jí)層。因此,也未向頻 帶322和323分配下級(jí)節(jié)點(diǎn)。因此,也未向頻帶331、 332和333分配下級(jí)節(jié) 點(diǎn)。層4包括在層3的頻帶330的基礎(chǔ)上分割出的兩個(gè)頻帶340和341。 頻帶340的頻帶分割信息(15)由"O"表示。頻帶341的頻帶分割信息(16) 由〃0〃表示。因此,不再有能夠執(zhí)行頻帶分割的下級(jí)層,信令化處理過程終止。在這種 情形下,最低層等于層4。在表示能夠由根據(jù)二進(jìn)制信令化序列(l) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) (13) (14) (15) (16)由二進(jìn)制數(shù)表示塊分割信息的情形下, 塊分割信息可由16個(gè)比特"1100001100100000"來表示。圖3是示出根據(jù)本發(fā)明另一實(shí)施方式的頻帶分割信息的信令化方法的方框圖。與圖2相比,就執(zhí)行頻帶分割的方法而言,圖3的頻帶分割與圖2的情形 相似。然而,如圖3所示,圖3中的頻帶分割信息的二進(jìn)制信令化序列與圖2中 的不同。因此,在表示能夠由根據(jù)二進(jìn)制信令化序列(l) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) (13) (14) (15) (16)由二進(jìn)制數(shù)表示塊分割信息的 情形下,塊分割信息可由16個(gè)比特〃1110001001000000〃來表示。上面的說明 已公開了一個(gè)示例性情況,其中未另行表示層深度信息,而是可僅通過由分割 ID和不分割I(lǐng)D表示的頻帶分割信息來識(shí)別層深度信息。然而,應(yīng)當(dāng)注意另行表示層深度信息的其它頻帶分割信息也可被進(jìn)行信令 化處理。例如,層深度信息由分割終止ID和分割繼續(xù)ID表示。所述的分割終止ID表示不再執(zhí)行頻帶分割的最低層。所述分割繼續(xù)ID表 示除最低層之外的剩余各層。在這種情形下,分割繼續(xù)ID由"1"表示,而分 割終止ID由"0表示。"圖2 3中示出的層深度為"4",也可使用分割終止ID "0"和分割繼續(xù) ID "1"以"1110"表示。子帶長度可由所述的信令化方法予以識(shí)別。這樣,在另行表示深度信息的情形下,在向最低層的節(jié)點(diǎn)分配的節(jié)點(diǎn)處僅 可表示不分割I(lǐng)D,從而信令化處理過程可在從當(dāng)前層至最低層的上一層的范圍 內(nèi)執(zhí)行。例如,假設(shè)分割I(lǐng)D由"1"表示而不分割I(lǐng)D由"0"表示,分割繼續(xù)ID 由"1"表示而分割終止ID由"0"表示,則指示向最低層分配的節(jié)點(diǎn)是否被 分割的特定值可由指示分割終止的"0"表示。3)聲道分割聲道分割信息涉及用于聲道配置的聲道配置信息,因此下文將參照所述的聲道配置信息對(duì)聲道分割進(jìn)行詳細(xì)說明。特別地,將詳細(xì)地闡述當(dāng)對(duì)多聲道音頻信號(hào)進(jìn)行編碼和解碼時(shí)所獲得的聲 道配置的一個(gè)示例?;究臻g信息是對(duì)多聲道音頻信號(hào)進(jìn)行編碼時(shí)所需要的。所述基本空間信 息包括能夠表示與基本環(huán)境相關(guān)聯(lián)的配置信息的基本配置信息以及與所述基 本配置信息相對(duì)應(yīng)的基本數(shù)據(jù)。另外,多聲道音頻編碼選擇性地要求擴(kuò)展空間信息。所述擴(kuò)展空間信息包 括指示與擴(kuò)展環(huán)境相關(guān)聯(lián)的配置信息的擴(kuò)展配置信息以及與所述擴(kuò)展配置信 息相對(duì)應(yīng)的擴(kuò)展數(shù)據(jù)。所述擴(kuò)展環(huán)境的配置信息可以存在一個(gè)或多個(gè)。所述擴(kuò) 展環(huán)境可由類型ID標(biāo)識(shí)。同時(shí),由所述多聲道信號(hào)編碼參照的聲道配置主要分為兩種聲道配置,即 基本聲道配置和擴(kuò)展聲道配置。一個(gè)或多個(gè)聲道配置信息被用作所述基本聲道配置信息。特別地,基本聲 道配置信息指示從若干聲道配置信息中選出的一個(gè)聲道配置信息。為便于說明,基本聲道配置信息被稱為"固定聲道配置信息",且根據(jù)固 定的聲道配置信息創(chuàng)建的多個(gè)聲道(即多聲道)被稱為"固定輸出聲道"。固定聲道配置信息和相關(guān)聯(lián)的聲道配置數(shù)據(jù)是創(chuàng)建所述固定的輸出聲道 所要求的。固定聲道配置信息可表示若干預(yù)先建立的聲道配置組元中的一個(gè)聲道配 置組元。所述預(yù)先建立的聲道配置可以各種方式來表示。例如,聲道可以配置成"5-1-5" 、 "5-2-5" 、 "7-2-7"或"7-5-7"的形式。所述"5-2-5"配置可表示一種具體聲道結(jié)構(gòu),其中六個(gè)輸入聲道被聲道 縮減混音(downraixed)成兩個(gè)聲道,且經(jīng)聲道縮減混音的聲道被輸出至六個(gè) 聲道。"5-2-5"配置以外的其余聲道配置具有與"5-2-5"配置相同的聲道結(jié) 構(gòu)。所述固定聲道配置信息被包含在基本配置信息中,而與固定聲道配置信息 相關(guān)聯(lián)的數(shù)據(jù)被包含在基本數(shù)據(jù)中。各種各樣的參數(shù)可用作所述基本數(shù)據(jù),例如,指示兩個(gè)聲道之間能量差的 聲道電平差(CLD)參數(shù)、指示兩個(gè)聲道之間的相關(guān)性的聲道間相干性(ICC) 參數(shù)、以及用來從兩個(gè)聲道創(chuàng)建三個(gè)聲道的聲道預(yù)測系數(shù)(CPC)參數(shù)。所述擴(kuò)展聲道配置指示依照固定聲道配置形成的聲道配置。所述擴(kuò)展聲道配置是由經(jīng)編碼的信號(hào)任意形成的。為便于說明,擴(kuò)展聲道 配置信息被稱為任意聲道配置信息,而由任意聲道配置信息創(chuàng)建的多聲道被稱 為任意輸出聲道。所述任意聲道配置信息被包含在擴(kuò)展配置信息中,并由稱為聲道ID的類 型ID所標(biāo)識(shí)。與任意聲道配置信息相對(duì)應(yīng)的任意聲道配置數(shù)據(jù)被包含在擴(kuò)展數(shù)據(jù)中。 如果需要,為了操作簡單,所述任意聲道配置數(shù)據(jù)可僅使用表示兩個(gè)聲道之間能量差的CLD參數(shù)。任意聲道配置信息由分割I(lǐng)D和不分割I(lǐng)D表示。作為所述任意聲道配置信 息的組成部分的分割I(lǐng)D指示聲道個(gè)數(shù)的增加。不分割I(lǐng)D指示一種特定情況, 其中聲道個(gè)數(shù)沒有改變。例如,分割I(lǐng)D指示一個(gè)輸入聲道被轉(zhuǎn)換成兩個(gè)輸出聲道。不分割I(lǐng)D指示 輸入聲道在聲道個(gè)數(shù)上不作任何改變即被輸出。在向上級(jí)層聲道分配的上級(jí)層節(jié)點(diǎn)處表示了分割I(lǐng)D的情形下,在下級(jí)層 中創(chuàng)建下級(jí)聲道,并且向下級(jí)層分配與所創(chuàng)建的聲道對(duì)應(yīng)的下級(jí)節(jié)點(diǎn)。然而,在向上級(jí)層的聲道分配的上級(jí)層節(jié)點(diǎn)處表示了不分割I(lǐng)D的情形中, 在下級(jí)層中不創(chuàng)建下級(jí)聲道,因此沒有向下級(jí)層分配與下級(jí)聲道相對(duì)應(yīng)的下級(jí) 節(jié)點(diǎn)。下面結(jié)合圖2-3對(duì)使用分割I(lǐng)D和不分割I(lǐng)D表示所述任意聲道配置信息的 方法進(jìn)行說明。圖2 3不僅示出所述頻帶分割還示出聲道分割。 首先對(duì)圖2詳細(xì)說明如下。作為最高層的層1包括六個(gè)頻帶310、 311、 312、 313、 314和315。所述 頻帶310、 311、 312、 313、 314和315可分別充當(dāng)所述固定的多聲道。根據(jù)本 發(fā)明,分割I(lǐng)D由"1"表示而不分割I(lǐng)D由"0"表示。表示任意聲道配置信息的方法順序地表示包含在向?qū)?的聲道310、 311、 312、 313、 314和315分配的節(jié)點(diǎn)中的值"0"或"1"。表示任意聲道配置信息的方法順序地表示包含在向?qū)?的聲道320、 321、 322和323分配的節(jié)點(diǎn)中的值"0"或"1"。表示任意聲道配置信息的方法順序地表示包含在向?qū)?的聲道330、 331、 332和333分配的節(jié)點(diǎn)中的值"0"或"1"。表示任意聲道配置信息的方法順序地表示包含在向?qū)?的聲道340和341 分配的節(jié)點(diǎn)中的值"0"或"1"。換句話說,所述方法在上級(jí)層的節(jié)點(diǎn)處順序地指示聲道個(gè)數(shù)是否增加,并 隨后在下級(jí)層的節(jié)點(diǎn)處順序地指示聲道個(gè)數(shù)是否增加。根據(jù)所述方法的任意聲道配置信息由16比特"1100001100100000"表示。 為便于說明,表示任意聲道配置信息的方法被稱為"分級(jí)優(yōu)先級(jí)方法"。 根據(jù)圖3所示表示任意聲道配置信息的方法,如果當(dāng)從上級(jí)層的第一節(jié)點(diǎn) 獲得信令化結(jié)果時(shí)上級(jí)層的第一節(jié)點(diǎn)由"1"表示,則與上級(jí)層的第一節(jié)點(diǎn)相 對(duì)應(yīng)的諸下級(jí)節(jié)點(diǎn)指示聲道個(gè)數(shù)是否順序地增加。如果當(dāng)從上級(jí)層的第一節(jié)點(diǎn) 獲得信令化結(jié)果時(shí)上級(jí)層的第一節(jié)點(diǎn)由"0"表示,則當(dāng)前節(jié)點(diǎn)移至上級(jí)的第 二節(jié)點(diǎn),以使第二節(jié)點(diǎn)指示聲道個(gè)數(shù)是否順序地增加。因此,由所述方法獲得 的任意聲道配置信息由16比特"1110001001000000"表示。為便于說明,表示任意聲道配置信息的方法被稱為"分支優(yōu)先級(jí)方法"。 下面參照?qǐng)D4詳細(xì)說明創(chuàng)建固定輸出聲道和任意輸出聲道的方法。 圖4是示出根據(jù)本發(fā)明的創(chuàng)建多聲道信號(hào)的方法的概念圖。 參照?qǐng)D4,通過聲道縮減混音信號(hào)(x)與基本矩陣(ml)之間的計(jì)算創(chuàng)建 出任意輸出聲道(y),并通過固定輸出聲道(y)與后置矩陣(m2)之間的計(jì) 算創(chuàng)建出另一任意輸出聲道(z)。在必要時(shí)可以存在兩個(gè)或多個(gè)基本矩陣(ral)。 可使用CLD、 ICC、 CPC中的至少一個(gè)以及所述固定聲道配置信息來獲取基 本矩陣(ml)的配置元素??墒褂肅LD和所述任意聲道配置信息來獲取后置矩陣(m2)的配置元素。 下面將對(duì)創(chuàng)建任意輸出聲道的方法進(jìn)行詳細(xì)說明。 首先,對(duì)使用任意聲道配置信息配置任意聲道的方法進(jìn)行詳細(xì)說明。 下面對(duì)使用所述分支優(yōu)先級(jí)方法表示所述任意聲道配置信息的示例性方 法進(jìn)行說明。所述示例性方法順序地識(shí)別作為任意聲道配置信息的配置組元的分割I(lǐng)D 和不分割I(lǐng)D,并根據(jù)所識(shí)別出的ID執(zhí)行信號(hào)處理。如果所識(shí)別出的ID被確定為分割I(lǐng)D,則一個(gè)輸入聲道被連接至作為信號(hào) 轉(zhuǎn)換的一個(gè)示例的聲道轉(zhuǎn)換模塊,其結(jié)果是創(chuàng)建出兩個(gè)下級(jí)信道。否則,如果所識(shí)別出的ID被確定為不分割I(lǐng)D,則不對(duì)聲道個(gè)數(shù)作出任何 改變地輸出前述輸入聲道。下面將給出其詳細(xì)說明。在第一階段,要被解碼的ID個(gè)數(shù)的初始值被置為"1",且任意輸出聲道 個(gè)數(shù)的初始值被置為"0",并且聲道變換模塊個(gè)數(shù)的初始值被置為"0"。在第二階段,識(shí)別要被解碼的ID。在第三階段,如果所識(shí)別出的ID被確 定為分割I(lǐng)D,則聲道轉(zhuǎn)換模塊個(gè)數(shù)遞增1,并且要被識(shí)別的ID個(gè)數(shù)遞增1。如果所識(shí)別出的ID被確定為不分割I(lǐng)D,則任意輸出聲道個(gè)數(shù)遞增1,并 且要被識(shí)別的ID個(gè)數(shù)遞減1。重復(fù)前述第二和第三階段,直到要被解碼的ID個(gè)數(shù)到達(dá)"0"。根據(jù)固定 的輸出聲道個(gè)數(shù)重復(fù)前述信號(hào)處理方法。例如,當(dāng)任意聲道配置信息由 "11100010010000"表示時(shí)獲得的任意聲道配置示出于圖3中。在這種情形下, "1"表示分割I(lǐng)D而"0"表示不分割I(lǐng)D。"1"的個(gè)數(shù)表示聲道轉(zhuǎn)換模塊(即圖3的信號(hào)轉(zhuǎn)換模塊)的個(gè)數(shù),而"0" 的個(gè)數(shù)表示任意輸出聲道的個(gè)數(shù)。同時(shí),固定輸出聲道可以按不同次序重排(即,重映射),并可隨后如圖 5所示那樣創(chuàng)建出任意輸出聲道。圖5是示出根據(jù)本發(fā)明的聲道分割信息的信令化方法的概念圖。參照?qǐng)D5,固定輸出聲道310、 311、 312、 313、 314和315由重映射模塊 110重排。重排后的固定輸出聲道310' 、311, 、312, 、313, 、314,和315, 作為最上層的聲道,以創(chuàng)建所述任意輸出聲道。勿庸贅言,可以不同次序重排 或重映射所述任意輸出聲道。同時(shí),如果在任意聲道配置信息中包含了將任意聲道配置信息的聲道映射 至揚(yáng)聲器的聲道映射信息,則任意輸出聲道也可被映射至該揚(yáng)聲器。前面的說明公開了一種示例性情況,其中不另行表示層深度信息,而是可 通過由分割I(lǐng)D和不分割I(lǐng)D表示的任意聲道配置信息來識(shí)別層深度信息。然而,應(yīng)當(dāng)注意,也可表示其他能另行表示層深度信息的任意聲道配置信息。例如,層深度信息可由分割終止ID和分割繼續(xù)ID來表示。所述分割終止 ID可表示在其中不再進(jìn)行聲道分割的最低層。所述分割繼續(xù)ID可表示除最低 層之外的其余各層。在這種情形中,分割繼續(xù)ID由"1"表示而分割終止ID 由"0"表示。圖2 3中示出的層深度為"4",也可使用分割終止ID "0"和分割繼續(xù)ID "1"以"1110"予以表示。這樣,在另行表示深度信息的情形中,在向最低層分配的節(jié)點(diǎn)處僅可表示不分割I(lǐng)D,從而信令化處理過程可在從當(dāng)前層至最低層的上一層的范圍之內(nèi)執(zhí) 行。例如,假設(shè)分割I(lǐng)D由"1"表示而不分割I(lǐng)D由"0"表示,分割繼續(xù)ID 由"1"表示而分割終止ID由"0"表示,則指示向最低層分配的節(jié)點(diǎn)是否被 分割的特定值可由指示分割終止的"0"表示。盡管前述情形是實(shí)際發(fā)生的,但最低層可通過所述深度信息來識(shí)別,并推 定存在省卻的值"0",從而所述任意輸出聲道得以配置。同時(shí),盡管所述任意聲道配置信息被發(fā)送至解碼器,但應(yīng)當(dāng)注意,解碼器 必要時(shí)可以不使用接收到的任意聲道配置信息。解碼器的前述操作可能會(huì)發(fā)生 在一種示例性情況中,其中解碼器識(shí)別出任意聲道配置信息和任意聲道配置信 息的大小,但跳過與所述大小相對(duì)應(yīng)的一個(gè)預(yù)定范圍。本領(lǐng)域內(nèi)技術(shù)人員可以 理解,可對(duì)本發(fā)明作出各種修改和變化而不脫離本發(fā)明的精神或范圍。因此, 本發(fā)明旨在覆蓋本發(fā)明的修改和變化,只要它們落在所附權(quán)利要求書及其等效 方案的范圍內(nèi)。工業(yè)應(yīng)用性根據(jù)本發(fā)明的分割信息的信令化方法具有下列效果。首先,如果預(yù)定長度的長塊被分割成不同長度的短塊,則根據(jù)本發(fā)明的所 述信令化方法可使用最少的比特?cái)?shù)來實(shí)現(xiàn)分級(jí)塊分割信息的信令化。其次,根據(jù)本發(fā)明的信令化方法不需要另行發(fā)送指示信號(hào)處理所使用的比特?cái)?shù)的特定信息,并.n.不僅可根據(jù)經(jīng)倍令化的信號(hào)識(shí)別出分割后的s深度而.h. 能識(shí)別經(jīng)^令化的信號(hào)的結(jié)束。再者,根據(jù)本發(fā)明的信令化方法可使用最少的比特?cái)?shù)將多個(gè)f帶分割成多 個(gè)不同大小的子帶(例如具有不同頻率帶寬的子帶)。第四,根據(jù)本發(fā)明的信令化方法可執(zhí)行與聲道擴(kuò)展混音處理過程相關(guān)聯(lián)的 特定信息的信令化,這允許在輸入聲道中接收到的信號(hào)經(jīng)由比輸入聲道個(gè)數(shù)多 得多的輸出聲道輸出。
權(quán)利要求
1.一種生成經(jīng)編碼的音頻信號(hào)的方法,其包括生成基本空間信息,所述基本空間信息包括多聲道音頻編碼處理過程所必需的基本配置信息以及與所述基本配置信息相對(duì)應(yīng)的基本數(shù)據(jù);以及生成擴(kuò)展空間信息,所述擴(kuò)展空間信息包括多聲道音頻編碼處理過程選擇性地要求的擴(kuò)展配置信息以及與所述擴(kuò)展配置信息相對(duì)應(yīng)的擴(kuò)展數(shù)據(jù)。
2. 如權(quán)利要求l所述的方法,其特征在于,所述擴(kuò)展配置信息包括由聲道標(biāo) 識(shí)符(ID)標(biāo)識(shí)的任意聲道配置信息,并且對(duì)應(yīng)于所述任意聲道配置信息的所述擴(kuò) 展數(shù)據(jù)指示兩個(gè)聲道之間的能量差。
3. 如權(quán)利要求2所述的方法,其特征在于,所述基本配置信息包括作為預(yù)定 輸出聲道的配置信息的固定聲道配置信息。
4. 如權(quán)利要求3所述的方法,其特征在于,所述任意聲道配置信息使用分割 標(biāo)識(shí)符(ID)和不分割標(biāo)識(shí)符(ID)指示在層的節(jié)點(diǎn)處聲道個(gè)數(shù)是否增加,并且如 果上級(jí)層的節(jié)點(diǎn)由分割I(lǐng)D表示,則向下級(jí)層分配了個(gè)數(shù)等于分割數(shù)的下級(jí)節(jié)點(diǎn), 而如果上級(jí)層的節(jié)點(diǎn)由不分割I(lǐng)D表示,則沒有向下級(jí)層分配下級(jí)節(jié)點(diǎn)。
5. 如權(quán)利要求4所述的方法,其特征在于,所述任意聲道配置信息順序地指 示在上級(jí)層的節(jié)點(diǎn)處聲道個(gè)數(shù)是否增加,并順序地指示在下級(jí)層的下級(jí)節(jié)點(diǎn)處聲道 個(gè)數(shù)是否增加。
6. 如權(quán)利要求4所述的方法,其特征在于,如果上級(jí)層的第一節(jié)點(diǎn)由分割I(lǐng)D 表示,則所述任意聲道配置信息指示向下級(jí)層分配的與所述上級(jí)層的第一節(jié)點(diǎn)相對(duì) 應(yīng)的下級(jí)節(jié)點(diǎn)的聲道個(gè)數(shù)是否增加,而如果上級(jí)層的所述第一節(jié)點(diǎn)由不分割I(lǐng)D表 示,則所述任意聲道配置信息指示所述上級(jí)層的第二節(jié)點(diǎn)的聲道個(gè)數(shù)是否增加。
7. 如權(quán)利要求4所述的方法,其特征在于,所述任意聲道配置信息進(jìn)一步包 括聲道映射信息,所述聲道映射信息使用所述任意聲道配置信息將任意輸出聲道映 射至揚(yáng)聲器位置。
8. —種處理音頻信號(hào)的方法,包括接收包括多聲道音頻編碼處理過程所必需的基本空間信息以及所述多聲道音 頻編碼處理過程選擇性地要求的擴(kuò)展空間信息的經(jīng)編碼的音頻信號(hào);以及根據(jù)所述經(jīng)編碼的音頻信號(hào)配置多聲道音頻信號(hào)的聲道。
9. 如權(quán)利要求8所述的方法,其特征在于,所述基本空間信息包括擴(kuò)展配置信息,所述擴(kuò)展配置信息包括由聲道標(biāo)識(shí)符(ID)標(biāo)識(shí)的任意聲道配置信息以及與所述任意聲道配置信息相對(duì)應(yīng)的擴(kuò)展數(shù)據(jù)。
10. 如權(quán)利要求9所述的方法,其特征在于,所述擴(kuò)展數(shù)據(jù)指示兩個(gè)聲道間 的能量差。
11. 如權(quán)利要求10所述的方法,其特征在于,所述基本空間信息包括作為預(yù) 定輸出聲道的配置信息的固定聲道配置信息。
12. 如權(quán)利要求ll所述的方法,其特征在于,所述任意聲道配置信息使用分 割標(biāo)識(shí)符(ID)和不分割標(biāo)識(shí)符(ID)指示在層的節(jié)點(diǎn)處聲道個(gè)數(shù)是否增加,并且 如果上級(jí)層的節(jié)點(diǎn)由分割I(lǐng)D表示,則向下級(jí)層分配了個(gè)數(shù)等于分割數(shù)的下級(jí)節(jié)點(diǎn), 而如果上級(jí)層的節(jié)點(diǎn)由不分割I(lǐng)D表示,則沒有向下級(jí)層分配下級(jí)節(jié)點(diǎn)。
13. 如權(quán)利要求12所述的方法,其特征在于,所述任意聲道配置信息順序地 指示在上級(jí)層的節(jié)點(diǎn)處聲道個(gè)數(shù)是否增加,并順序地指示在下級(jí)層的下級(jí)節(jié)點(diǎn)處聲 道個(gè)數(shù)是否增加。
14. 如權(quán)利要求12所述的方法,其特征在于,如果上級(jí)層的第一節(jié)點(diǎn)由分割 ID表示,則所述任意聲道配置信息指示向下級(jí)層分配的與上級(jí)層的所述第一節(jié)點(diǎn) 相對(duì)應(yīng)的下級(jí)節(jié)點(diǎn)的聲道個(gè)數(shù)是否增加,而如果上級(jí)層的所述第一節(jié)點(diǎn)由不分割 ID表示,則所述任意聲道配置信息指示上級(jí)層的第二節(jié)點(diǎn)的聲道個(gè)數(shù)是否增加。
15. 如權(quán)利要求12或14所述的方法,其特征在于,所述任意聲道配置信息 還包括聲道映射信息,所述聲道映射信息使用所述任意聲道配置信息將任意輸出聲 道映射至揚(yáng)聲器位置。
16. 如權(quán)利要求15所述的方法,其特征在于,所述配置多聲道音頻信號(hào)的聲 道包括使用所述固定聲道配置信息生成固定輸出聲道,以及使用所述任意聲道配置 信息生成任意輸出聲道。
17. 如權(quán)利要求16所述的方法,其特征在于,所述任意輸出聲道包括順序 地識(shí)別作為所述任意聲道配置信息的配置組元的分割I(lǐng)D或不分割I(lǐng)D,并根據(jù)識(shí)別 出的ID執(zhí)行信號(hào)處理,并且如果識(shí)別出的ID是分割I(lǐng)D,則一個(gè)輸入聲道連接于 聲道轉(zhuǎn)換模塊并產(chǎn)生兩個(gè)下級(jí)聲道,而如果識(shí)別出ID的是不分割I(lǐng)D,則輸入聲道 在不對(duì)聲道個(gè)數(shù)作任何改變的情況下被輸出。
18. 如權(quán)利要求17所述的方法,其特征在于,所述生成任意輸出聲道包括設(shè) 定ID個(gè)數(shù)的初始值、任意輸出聲道個(gè)數(shù)的初始值、以及聲道轉(zhuǎn)換模塊個(gè)數(shù)的初始值;識(shí)別ID;如果識(shí)別出的ID是分割I(lǐng)D,則將ID個(gè)數(shù)和聲道轉(zhuǎn)換模塊個(gè)數(shù)增加預(yù)定的增量單位,如果識(shí)別出的ID是不分割I(lǐng)D,則將任意輸出聲道個(gè)數(shù)增加預(yù)定的增量單位并將ID個(gè)數(shù)減少預(yù)定的增量單位;并重復(fù)進(jìn)行所述識(shí)別、增加ID個(gè)數(shù)和聲道轉(zhuǎn)換模塊個(gè)數(shù)、以及增加任意輸出聲道個(gè)數(shù)并減少ID個(gè)數(shù),直到ID個(gè)數(shù)到 達(dá)"0"為止。
19. 如權(quán)利要求18所述的方法,其特征在于,所述生成任意輸出聲道還包括 根據(jù)所述聲道映射信息將任意輸出聲道映射至揚(yáng)聲器。
20. 如權(quán)利要求12所述的方法,還包括不經(jīng)解碼所述任意聲道配置信息和與所述任意聲道配置信息對(duì)應(yīng)的任意聲道 配置數(shù)據(jù)的長度地來識(shí)別所述任意聲道配置信息以及任意聲道配置數(shù)據(jù)的長度。
全文摘要
公開一種生成經(jīng)編碼的音頻信號(hào)的方法,以及在多聲道音頻編碼過程中對(duì)其進(jìn)行處理的方法。本發(fā)明提供一種生成經(jīng)編碼的音頻信號(hào)的方法,其包括生成基本空間信息,所述基本空間信息包括多聲道音頻編碼處理所必需的基本配置信息以及與基本配置信息對(duì)應(yīng)的基本數(shù)據(jù);以及生成擴(kuò)展空間信息,所述擴(kuò)展空間信息包括多聲道音頻編碼處理選擇性地要求的擴(kuò)展配置信息以及與擴(kuò)展配置信息對(duì)應(yīng)的擴(kuò)展數(shù)據(jù)。
文檔編號(hào)G10L19/00GK101233568SQ200680027486
公開日2008年7月30日 申請(qǐng)日期2006年7月28日 優(yōu)先權(quán)日2005年7月29日
發(fā)明者吳賢午, 房熙錫, 林宰顯, 鄭亮源, 金東秀, 金孝鎮(zhèn) 申請(qǐng)人:Lg電子株式會(huì)社