專(zhuān)利名稱(chēng)::基于虛擬源位置信息的通道等級(jí)差量化和解量化方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及多通道音頻信號(hào)的空間音頻編碼(SAC)和由SAC生成的音頻比特流的解碼,并且更具體地涉及當(dāng)執(zhí)行多通道音頻信號(hào)的基于SAC的編碼時(shí),用作空間參數(shù)的通道等級(jí)差(CLD)的有效量化和解量化。
背景技術(shù):
:空間音頻編碼(SAC)是用于有效地壓縮多通道音頻信號(hào)同時(shí)維持與現(xiàn)有立體聲音頻系統(tǒng)的兼容性的技術(shù)。在運(yùn)動(dòng)圖像專(zhuān)家組(MPEG)中,SAC技術(shù)自2002年起已經(jīng)被標(biāo)準(zhǔn)化并命名為"環(huán)繞MPEG",并且在ISO/正C工作文獻(xiàn),ISO/IECCD14996-x(2005年2月18日出版,并且此后稱(chēng)為"SAC標(biāo)準(zhǔn)文獻(xiàn)")中詳細(xì)描述。具體地,SAC方法是用于通過(guò)使用下混頻信號(hào)和一組輔助空間參數(shù)編碼N個(gè)多通道音頻信號(hào)(N>2)來(lái)改進(jìn)傳輸效率的編碼方法,其中下混頻信號(hào)被混頻為單聲道或立體聲,輔助空間參數(shù)表示多通道音頻信號(hào)的人類(lèi)知覺(jué)特性。空間參數(shù)可以包括表示按照時(shí)間-頻率在兩個(gè)通道之間的等級(jí)差異的通道等級(jí)差(CLD)、表示按照時(shí)間-頻率在兩個(gè)通道之間的相關(guān)性或相干性的通道間相關(guān)性/相干性(ICC)、使得可以通過(guò)預(yù)測(cè)從兩個(gè)通道再現(xiàn)第三通道的通道預(yù)測(cè)系數(shù)(COC)等。CLD是恢復(fù)每個(gè)通道的功率增益的核心元素,并且在SAC編碼的處理中被以各種方式提取。如圖1A所示,基于一個(gè)參考通道,CLD通過(guò)參考通道與其他通道的每個(gè)的功率比表達(dá)。例如,如果有六個(gè)通道信號(hào)L、R、C、LFE、Ls和Rs,那么可以基于一個(gè)參考通道得到五個(gè)功率比,并且CLDl到CLD5對(duì)應(yīng)通過(guò)將以10為底的對(duì)數(shù)應(yīng)用到五個(gè)功率比的每個(gè)而獲得的等級(jí)。同時(shí),如圖IB所示,多通道被劃分成多個(gè)通道對(duì),并且每個(gè)通道對(duì)基于立體聲被分析,并且在每個(gè)分析步驟中,提取一個(gè)CLD值。這通過(guò)多個(gè)一對(duì)二(OTT)模塊的逐步使用而執(zhí)行,該一對(duì)二模塊對(duì)一個(gè)輸出通道取兩個(gè)輸入通道。在每個(gè)OTT中,任何一個(gè)輸入立體聲信號(hào)被識(shí)別為參考通道,并且參考通道與其他通道的功率比的以IO為底的對(duì)數(shù)值被作為CLD值輸出。CLD值具有從-~到+~的動(dòng)態(tài)范圍。因此,為了用有限位數(shù)表達(dá)CLD值,需要有效的量化。典型地,CLD量化通過(guò)使用歸一化的量化表來(lái)進(jìn)行。這樣的量化表的一個(gè)實(shí)例在SAC標(biāo)準(zhǔn)文獻(xiàn)(見(jiàn)第41頁(yè),表57)中給出。以這種方式,因?yàn)閮H用有限位數(shù)不能表達(dá)所有的CLD值,所以CLD值的動(dòng)態(tài)范圍被限于預(yù)定的等級(jí)或更少。由此,引入量化誤差,并因此頻譜信息失真。例如,當(dāng)使用5位來(lái)進(jìn)行CLD量化時(shí),CLD值的動(dòng)態(tài)范圍將被限于-25dB到十25dB之間的范圍。
發(fā)明內(nèi)容要解決的技術(shù)問(wèn)題本發(fā)明貫注于通道等級(jí)差(CLD)量化和解量化方法,其能夠最小化多通道音頻信號(hào)的基于空間音頻編碼(SAC)的編碼過(guò)程中的聲音劣化。本發(fā)明還貫注于CLD量化和解量化方法,其能夠在多通道音頻信號(hào)的基于SAC編碼的過(guò)程中,使用可用CLD代替的虛擬源位置信息(VSLI)的量化的優(yōu)點(diǎn)最小化聲音劣化。此外,本發(fā)明貫注于通過(guò)提供基于VSLI的CLD量化表改進(jìn)聲音質(zhì)量而沒(méi)有額外的復(fù)雜度,該表可由用于運(yùn)動(dòng)圖像專(zhuān)家組(MPEG)-4SAC系統(tǒng)中的CLD量化和解量化的CLD量化表代替。技術(shù)方案本發(fā)明的第一方面提供了一種方法,用于當(dāng)執(zhí)行N通道音頻信號(hào)(N>1)的基于空間音頻編碼(SAC)的編碼時(shí),量化用作空間參數(shù)的通道等級(jí)差(CLD)參lt。該CLD量化方法包括如下步驟從N通道音頻信號(hào)提取每個(gè)頻帶的CLD;以及通過(guò)參照基于虛擬源位置信息(VSLI)的CLD量化表量化CLD,該量化表是使用從N通道音頻信號(hào)的VSLI量化值得到的CLD量化值設(shè)計(jì)的。本發(fā)明的第二方面提供了一種計(jì)算機(jī)可讀記錄介質(zhì),其上記錄有用于執(zhí)行CLD量化方法的計(jì)算機(jī)程序。本發(fā)明的第三方面提供了一種基于空間音頻編碼(SAC)編碼N通道音頻信號(hào)(N>1)的方法。該方法包括如下步驟下混頻和編碼N通道音頻信號(hào);從N通道音頻信號(hào)為每個(gè)頻帶提取包括通道等級(jí)差(CLD)、通道間相關(guān)性/相干性(ICC)、以及通道預(yù)測(cè)系數(shù)(CPC)的空間參數(shù);以及量化提取的空間參數(shù)。在量化提取的空間參數(shù)的步驟中,通過(guò)參照基于VSLI的CLD量化表來(lái)量化CLD,該量化表是使用從N通道音頻信號(hào)的VSLI量化值得到的CLD量化值來(lái)設(shè)計(jì)的。本發(fā)明的第四方面提供了一種基于空間音頻編碼(SAC)編碼N通道音頻信號(hào)(N>1)的裝置。該裝置包括SAC編碼裝置,用于下混頻N通道音頻信號(hào)以生成下混頻信號(hào),并且從N通道音頻信號(hào)為每個(gè)頻帶提取包括通道等級(jí)差(CLD)、通道間相關(guān)性/相干性(ICC)、以及通道預(yù)測(cè)系數(shù)(CPC)的空間參數(shù);音頻編碼裝置,用于從由SAC編碼裝置生成的下混頻信號(hào)生成壓縮的音頻比特流;空間參數(shù)量化裝置,用于量化由SAC編碼裝置提取的空間參數(shù);以及空間參數(shù)編碼裝置,用于編碼量化的空間參數(shù)等級(jí)。空間參數(shù)量化裝置通過(guò)參照基于虛擬源位置信息(VSLI)的CLD量化表來(lái)量化CLD,該量化表是使用從N通道音頻信號(hào)的VSLI量化值得到的CLD量化值而設(shè)計(jì)的。本發(fā)明的第五方面提供了一種方法,用于當(dāng)基于空間音頻編碼(SAC)對(duì)編碼的N通道音頻比特流(N〉1)解碼時(shí),解量化編碼的通道等級(jí)差(CLD)量化值。該CLD解量化方法包括如下步驟對(duì)編碼的CLD量化值執(zhí)行霍夫曼解碼;以及通過(guò)使用基于虛擬源位置信息(VSLI)的CLD量化表解量化解碼的CLD量化值,該量化表是使用從N通道音頻信號(hào)的VSLI量化值得出的CLD量化值設(shè)計(jì)的。本發(fā)明的第六方面提供了一種計(jì)算機(jī)可讀記錄介質(zhì),其上記錄有用于執(zhí)行CLD解量化方法的計(jì)算機(jī)程序。本發(fā)明的第七方面提供了一種基于空間音頻編碼(SAC)對(duì)編碼的N通道音頻比特流(N>1)解碼的方法。該方法包括如下步驟解碼編碼的N通道音頻比特流;解量化與編碼的N通道音頻比特流一起接收的至少一個(gè)空間參數(shù)的量化值;以及基于解量化的空間參數(shù)合成解碼的N通道音頻比特流,以恢復(fù)N通道音頻信號(hào)。在解量化至少一個(gè)空間參數(shù)的量化值的步驟中,通過(guò)參考基于虛擬源位置信息(VSLI)的CLD量化表來(lái)解量化包括在空間參數(shù)中的通道等級(jí)差(CLD),該量化表是使用從N通道音頻信號(hào)的VSLI量化值得到的CLD量化值設(shè)計(jì)的。本發(fā)明的第八方面提供了一種基于空間音頻編碼(SAC)對(duì)編碼的N通道音頻比特流(N>1)解碼的裝置。該裝置包括用于解碼編碼的N通道音頻比特流的裝置;用于解碼與編碼的N通道音頻比特流一起接收的至少一個(gè)空間參數(shù)的量化值的裝置;用于解量化空間參數(shù)的量化值的裝置;以及用于基于解量化的空間參數(shù)合成解碼的N通道音頻比特流以恢復(fù)N通道音頻信號(hào)的裝置。用于解量化空間參數(shù)的量化值的裝置通過(guò)參照基于虛擬源位置信息(VSLI)的CLD量化表,解量化包括在空間參數(shù)中的通道等級(jí)差(CLD),該量化表是使用從N通道音頻信號(hào)的VSLI量化值得到的CLD量化值設(shè)計(jì)的。有益效果根據(jù)本發(fā)明創(chuàng)建的基于VSLI的CLD量化表可以替代在現(xiàn)有SAC系統(tǒng)中使用的CLD量化表。通過(guò)使用根據(jù)本發(fā)明的基于VSLI的CLD量化表,可以盡可能地防止聲音劣化。此外,通過(guò)在壓縮CLD索引中使用在本發(fā)明中提出的霍夫曼碼本,可以減少傳輸CLD所需的比特率。圖1A和圖1B概念上圖示了從多通道信號(hào)中提取通道等級(jí)差(CLD)值的過(guò)程;圖2示意性地圖示應(yīng)用了本發(fā)明的空間音頻編碼(SAC)系統(tǒng)的配置;圖3A和圖3B是用于解釋用作根據(jù)本發(fā)明的CLD量化的參考的VSLI的概念的視圖;以及圖4是示出從才艮據(jù)本發(fā)明的VSLI量化值轉(zhuǎn)換的CLD量化值的圖。具體實(shí)施方式以下,將詳細(xì)描述本發(fā)明的示例性實(shí)施例。然而,本發(fā)明不限于下面描述的示例性實(shí)施例,而可以以許多形式實(shí)現(xiàn)。因此,提供這些示例性實(shí)施例,用于完整公開(kāi)本發(fā)明,并對(duì)本領(lǐng)域普通技術(shù)人員充分傳達(dá)本發(fā)明的范圍。圖2示意性地圖示應(yīng)用本發(fā)明的空間音頻編碼(SAC)系統(tǒng)的配置。如所示,SAC系統(tǒng)可以被劃分成從N通道音頻信號(hào)生成、編碼和傳輸下混頻信號(hào)和空間參數(shù)的編碼部分、和從由編碼部分傳輸?shù)南禄祛l信號(hào)和空間參數(shù)恢復(fù)N通道音頻信號(hào)的解碼部分。編碼部分包括SAC編碼器210、音頻編碼器220、空間參數(shù)量化器230、和空間參數(shù)編碼器240。解碼部分包括音頻解碼器250、空間參數(shù)解碼器260、空間參數(shù)解量化器270、以及SAC解碼器280。SAC編碼器210從輸入的N通道音頻信號(hào)生成下混頻信號(hào),并且分析N通道音頻信號(hào)的空間特性,由此提取空間參數(shù),如通道等級(jí)差(CLD)、通道間相關(guān)性/相干性(ICC)、以及通道預(yù)測(cè)系數(shù)(CPC)。具體地,輸入到SAC編碼器210的N(N>1)多通道信號(hào)通過(guò)分析濾波器組被分解成各頻帶。為了以低復(fù)雜度將信號(hào)分離成頻域的各子頻帶,使用正交鏡像濾波器(QMF)。與空間感知相關(guān)的空間特性從子頻帶信號(hào)分析,并且根據(jù)編碼操作模式有選擇地提取如CLD、ICC和CPC的空間參數(shù)。此外,子頻帶信號(hào)通過(guò)QMF合成組被下混頻并轉(zhuǎn)換為時(shí)域的下混頻信號(hào)。作為替代,下混頻信號(hào)可以由通過(guò)聲學(xué)工程師預(yù)先產(chǎn)生的下混頻信號(hào)(或藝術(shù)/手動(dòng)混頻的下混頻信號(hào))代替。此時(shí),SAC編碼器210基于預(yù)先產(chǎn)生的下混頻信號(hào)調(diào)整并傳輸空間參數(shù),由此優(yōu)化在解碼器處的多通道恢復(fù)。音頻編碼器220通過(guò)使用現(xiàn)有的音頻壓縮技術(shù)(例如,運(yùn)動(dòng)圖像專(zhuān)家組(MPEG)-4、高級(jí)音頻編碼(AAC)、MPEG-4高效高級(jí)音頻編碼(HE-AAC)、MPEG-4位分割的算法編碼(BSAC)等),壓縮由SAC編碼器210生成的下混頻信號(hào)或藝術(shù)下混頻信號(hào),由此生成壓縮的音頻比特流。同時(shí),由SAC編碼器210生成的空間參數(shù)在被空間參數(shù)量化器230和空間參數(shù)編碼器240量化和編碼后傳輸??臻g參數(shù)量化器230提供有量化表,其被用來(lái)量化每個(gè)CLD、ICC和CPC。如下所述,為了最小化由使用現(xiàn)有歸一化CLD量化表量化CLD而引起的聲音劣化,可以在空間參數(shù)量化器230中使用基于虛擬源位置信息(VSLI)的CLD量化表??臻g參數(shù)編碼器240執(zhí)行熵編碼,以便壓縮由空間參數(shù)量化器230量化的空間參數(shù),并且優(yōu)選地使用霍夫曼碼本對(duì)空間參數(shù)的量化索引執(zhí)行霍夫曼編碼。如下所述,本發(fā)明提出了新的霍夫曼碼本,以便最大化CLD量化索引的傳輸效率。音頻解碼器250解碼通過(guò)現(xiàn)有音頻壓縮技術(shù)(例如,MPEG-4、AAC、MPEG-4HE-AAC、MPEG-4BSAC等)壓縮的音頻比特流。空間參數(shù)解碼器260和空間參數(shù)解量化器270是用于執(zhí)行由空間參數(shù)量化器230和空間參數(shù)編碼器240執(zhí)行的量化和編碼的反向操作的模塊。空間參數(shù)解碼器260基于霍夫曼碼本解碼空間參數(shù)的編碼的量化索引,并且空間參數(shù)解量化器270從量化表獲得對(duì)應(yīng)于量化索引的空間參數(shù)。與空間參數(shù)的量化和編碼類(lèi)似,本發(fā)明中提出的基于VSLI的CLD量化表和霍夫曼碼本用于空間參數(shù)的解碼和解量化的處理。SAC解碼器280通過(guò)合成由音頻解碼器250解碼的音頻比特流和由空間參數(shù)解量化器270獲得的空間參數(shù),恢復(fù)N多通道音頻信號(hào)。作為替代,當(dāng)不可能解碼多通道音頻信號(hào)時(shí),通過(guò)使用現(xiàn)有的音頻解碼器僅可以解碼下混頻信號(hào),使得獨(dú)立的服務(wù)是可能的。因此,SAC系統(tǒng)可以提供與現(xiàn)有單聲道或立體聲音頻編碼系統(tǒng)的兼容性。本發(fā)明涉及提供CLD量化,其能夠通過(guò)利用表示多通道音頻信號(hào)的空間音頻圖像的VSLI的量化優(yōu)點(diǎn),最小化從量化產(chǎn)生的聲音劣化。本發(fā)明基于這樣的事實(shí)在表達(dá)空間音頻圖像的方位角度時(shí),人耳難以識(shí)別3°或更小的誤差。用方位角度表達(dá)的VSLI具有90°的有限動(dòng)態(tài)范圍,使得可以避免在量化時(shí)由動(dòng)態(tài)范圍的限制引起的量化誤差。當(dāng)基于VSLI的量化優(yōu)點(diǎn)設(shè)計(jì)CLD量化表時(shí),可以最小化從量化產(chǎn)生的聲音劣化。圖3A和圖3B是用于解釋用作根據(jù)本發(fā)明的CLD量化參考的VSLI的概念的視圖。圖3A圖示其中兩個(gè)揚(yáng)聲器位于60°的角度的立體聲揚(yáng)聲器環(huán)境,并且圖3B是其中圖3A的立體聲揚(yáng)聲器環(huán)境中的立體聲音頻信號(hào)由下混頻信號(hào)的功率和VSLI表示的視圖。如所示,立體聲或多通道音頻信號(hào)可以由下混頻音頻信號(hào)的幅度向量和VSLI表示,后者可以通過(guò)分析多通道音頻信號(hào)的每個(gè)通道功率獲得。以這種方式表示的多通道音頻信號(hào)可以通過(guò)根據(jù)聲音源的位置向量投影幅度向量來(lái)恢復(fù)。如圖3A和圖3B中所示,假設(shè)左邊揚(yáng)聲器的信號(hào)功率為PL,右邊揚(yáng)聲器的信號(hào)功率為PR,并且左邊揚(yáng)聲器和右邊揚(yáng)聲器的角度分別為Al和Ar,則聲音源的VSLI可以通過(guò)等式1和2得出。等式2以這種方式計(jì)算的VSLI具有Al和Ar之同的但。Pl和Pr可以如下從VSLI恢復(fù)首先,如等式3那樣Y吏用恒定功率搖動(dòng)(CPP,constantpowerpanning)規(guī)則將VSLI映射到0°和90°之間的值VSLI'。等式l<formula>formulaseeoriginaldocumentpage18</formula>通過(guò)使用以這種方式映射的VSLI,和下混頻信號(hào)的功率PD,利用等式4和5奸算Pl和Ph。等式4<formula>formulaseeoriginaldocumentpage18</formula>等式5<formula>formulaseeoriginaldocumentpage18</formula>如前所述,本發(fā)明的主題涉及將VSLI的量化優(yōu)點(diǎn)應(yīng)用到空間參數(shù)CLD的量化。在圖3A的立體聲揚(yáng)聲器環(huán)境中,CLD可以如等式6表達(dá)。等式6<formula>formulaseeoriginaldocumentpage18</formula>CLD可以根據(jù)等式7從VSLI得出。等式7<formula>formulaseeoriginaldocumentpage18</formula>此外,如下面的等式8所定義,CLD可以通過(guò)取VSLI的自然對(duì)數(shù)而不是以10為底的對(duì)數(shù)獲得。等式8<formula>formulaseeoriginaldocumentpage18</formula>通過(guò)等式7和8獲得的CLD值可以直接用作一般SAC系統(tǒng)的空間參數(shù)。如前所述,因?yàn)镃LD具有-w到+oo之間的動(dòng)態(tài)范圍,所以使用有限位數(shù)進(jìn)行量化出現(xiàn)問(wèn)題。主要問(wèn)題是由動(dòng)態(tài)范圍的限制引起的量化誤差。因?yàn)椴荒軆H用有限位數(shù)來(lái)表達(dá)CLD的所有動(dòng)態(tài)范圍,所以CLD的動(dòng)態(tài)范圍被限制在預(yù)定等級(jí)或更低。結(jié)果,引入量化誤差,并且頻譜信息失真。如果使用5位來(lái)用于CLD量化,則CLD的動(dòng)態(tài)范圍被限制于-25dB到+25dB之間。相反,因?yàn)閂SLI具有90。的有限動(dòng)態(tài)范圍,所以可以避免在量化時(shí)由動(dòng)態(tài)范圍的限制引起的這種量化誤差。在一個(gè)實(shí)施例中,在VSLI量化時(shí),如果使用5位來(lái)用于CLD量化,并且應(yīng)用線性量化器,則量化等級(jí)數(shù)為31并且量化間隔為3°。VSLI量化方法的有效性可以從下述事實(shí)驗(yàn)證當(dāng)識(shí)別音頻信號(hào)的空間圖像時(shí),人們不能識(shí)別3°或更小的差別。該VSLI量化的優(yōu)點(diǎn)被應(yīng)用到立體聲編碼方法的CLD量化,現(xiàn)有SAC系統(tǒng)中使用的CLD量化表可以由基于VSLI的量化表代替。在一個(gè)實(shí)施例中,圖1中給出了以3。的量化間隔執(zhí)行5位線性量化的VSLI的量化值和對(duì)應(yīng)于VSLI量化值的CLD轉(zhuǎn)換等級(jí)。表1VSLI量化值和CLD值<table>tableseeoriginaldocumentpage19</column></row><table>此外,通過(guò)相鄰量化值之間的中間值判決VSLI量化的VSLI判決等級(jí)。中間值被轉(zhuǎn)換為CLD并且用作CLD量化的判決等級(jí)。基于VSLI的CLD量化判決等級(jí)具有如表2中所示的相鄰量化值之間的中間值以外的值,不像普通CLD量化那樣判決等級(jí)具有相鄰量化值之間的中間值。圖4是示出從根據(jù)本發(fā)明的VSLI量化值轉(zhuǎn)換的CLD量化值的圖。如所示,當(dāng)在基于45。的統(tǒng)一角度量化VSLI時(shí),量化的角度之間的判決等級(jí)是兩個(gè)角度之間的中間值。然而,當(dāng)該VSLI判決等級(jí)被轉(zhuǎn)換成CLD值時(shí),可以發(fā)現(xiàn)VSLI判決等級(jí)具有兩個(gè)相鄰CLD值之間的中間值以外的值。下表2列出了VSLI量化的判決等級(jí)和相應(yīng)的CLD值。表2<table>tableseeoriginaldocumentpage20</column></row><table>下表3-7是通過(guò)使用表1和表2創(chuàng)建的基于VSLI的CLD量化表,其中表3給出了下到第四小數(shù)位的CLD量化值,表4下到第三小數(shù)位,表5下到第二小數(shù)位,表6下到第一小數(shù)位,并且表7到整數(shù)。使用VSLI的CLD量化值可以通過(guò)取以10為底的對(duì)數(shù)或自然對(duì)數(shù)來(lái)計(jì)算。當(dāng)取自然對(duì)數(shù)時(shí),當(dāng)頻譜信息通過(guò)使用CLD值恢復(fù)時(shí),使用e而不是10作為底。表3基于VSU的CLD量化表(第四小數(shù)位)<table>tableseeoriginaldocumentpage21</column></row><table>表4基于VSLI的CLD量化表(第三小數(shù)位)<table>tableseeoriginaldocumentpage21</column></row><table><table>tableseeoriginaldocumentpage22</column></row><table>表5基于VSLI的CLD量化表(第二小數(shù)位)<table>tableseeoriginaldocumentpage22</column></row><table>表6基于VSLI的CLD量化表(第一小數(shù)位)<table>tableseeoriginaldocumentpage22</column></row><table><table>tableseeoriginaldocumentpage23</column></row><table>表7基于VSLI的CLE)量化表(整數(shù))<table>tableseeoriginaldocumentpage23</column></row><table>-4-3-8121636-3-2-6131945-2-1-4142558-l-0-21565150000接下來(lái),在表8、表9、表IO、表11和表12中給出按小數(shù)位分類(lèi)的基于VSLI的CLD量化表的判決等級(jí)。表8基于VSLI的CLD量化判決等級(jí)(第四小數(shù)位)以10為底的對(duì)數(shù)自然對(duì)數(shù)CLD判決等CLD判決等CLD判決等CLD判決等級(jí)級(jí)級(jí)級(jí)-65.140—o扁o—-150細(xì)0扁0__-31,6380.4550-72.8501.0477-25.6120.9113-58.97402.0982-22細(xì)1.3700-50.8413.1546-19.5671.8326-45.05614.2198-17.6112.3004-40.5515.2968-16.0052.7748-36.85466.3892-14.6403.2573-33.7117.5002-13.4503.7497-30.97098.6339-12.3924.2536-28.5359.7943-11.4394.7712-26.339210.9861-10.5675.3047-24.33312.2146-9.76455.8567-22.483513.4855-9.01706.4301-20,76214駕8-8.31657.0283-19.149316.1833-7.65557.6555-17.62717.6275-7週38.3165-16.183319.1493-6.43019.0170-14.膨20.7625-5.85679.7645-13.485522.4835-5.304710.567-12.21424.3335-4.771211.439-10.986126.3392-4.253612.392-9.794328.5358-3.749713.450-8,633930.9709-3.257314.640-7.500233.7114-2.774816.005-6.389236.8546-2.300417.611-5.296840.5518-1.832619.567-4.219845.0561-1.370022.080-3.154650.8418-0.911325.612-2.098258.9740-0.455031.638-1.047772.85070細(xì)065.1400細(xì)0150扁0————表9基于VSLI的CLD量化判決等級(jí)(第三小數(shù)位)以10為底的對(duì)數(shù)自然對(duì)數(shù)<table>tableseeoriginaldocumentpage25</column></row><table><table>tableseeoriginaldocumentpage26</column></row><table>表11基于VSLI的CLD量化判決等級(jí)(第一小數(shù)位)<table>tableseeoriginaldocumentpage27</column></row><table>表12基于VSLI的CLD量化判決等級(jí)(整數(shù))<table>tableseeoriginaldocumentpage28</column></row><table>如表7和表12所示,當(dāng)通過(guò)取以10為底的對(duì)數(shù)將CLD量化值和CLD量化判決等級(jí)表達(dá)為整數(shù)時(shí),可以看到,存在一些CLD量化值與一些CLD量化判決等級(jí)相等的問(wèn)題。因此,使用自然對(duì)數(shù)的CLD量化值和判決等級(jí)優(yōu)選地用于實(shí)際量化。換句話(huà)說(shuō),當(dāng)意圖使用表達(dá)為整數(shù)的基于VSLI的CLD量化表和基于VSLI的CLD量化判決等級(jí)時(shí),通過(guò)取VSLI的自然對(duì)數(shù)而不是以10為底的對(duì)數(shù)來(lái)得到CLD量化值。以這種方式創(chuàng)建的基于VSLI的CLD量化表在圖2所示的SAC系統(tǒng)的空間參數(shù)量化器230和空間參數(shù)解量化器270中采用,使得可以最小化由CLD量化誤差產(chǎn)生的聲音劣化。此外,本發(fā)明提出了霍夫曼碼本,其能夠優(yōu)化根據(jù)上述基于VSLI的CLD量化表得到的CLD量化索引的霍夫曼編碼。在SAC系統(tǒng)中,多通道音頻信號(hào)在通過(guò)濾波器組被劃分為頻域的子頻帶后被處理。當(dāng)多通道音頻信號(hào)被劃分為20個(gè)子頻帶時(shí),差分編碼方法被應(yīng)用到每個(gè)子頻帶的量化索引,由此將量化索引分類(lèi)為第一子頻帶的量化索引和其他19個(gè)相鄰子頻帶之間的差分索引。作為替代,它們可以被劃分成相鄰幀之間的差分索引。對(duì)以這種方式劃分的三類(lèi)索引的每一類(lèi)計(jì)算概率分布,然后將霍夫曼編碼方法應(yīng)用到三類(lèi)索引的每一類(lèi)。由此,可以獲得下表13和表14中描述的霍夫曼碼本。表13是對(duì)于第一子頻帶的索引的霍夫曼碼本,并且表14是對(duì)于其他相鄰子頻帶之間的索引的霍夫曼碼本。表13<table>tableseeoriginaldocumentpage29</column></row><table>表14<table>tableseeoriginaldocumentpage29</column></row><table><table>tableseeoriginaldocumentpage30</column></row><table>以這種方式,本發(fā)明中提出的霍夫曼碼本被用于圖2中圖示的SAC系統(tǒng)的空間參數(shù)編碼器240和空間參數(shù)解碼器260,使得可以減少傳輸CLD量化索引需要的比特率。作為替代,當(dāng)用于20個(gè)子頻帶的霍夫曼編碼的位數(shù)超過(guò)100時(shí),可以對(duì)每個(gè)子頻帶執(zhí)行5位脈沖碼調(diào)制(PCM)編碼。工業(yè)實(shí)用性本發(fā)明可以被提供為以至少一個(gè)產(chǎn)品(如,軟盤(pán)、硬盤(pán)、CDROM、閃存卡、PROM、RAM、ROM、或磁帶)的形式存儲(chǔ)在至少一個(gè)計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)程序。通常,計(jì)算機(jī)程序可以以任何編程語(yǔ)言(如C、C++、或JAVA)寫(xiě)成。盡管已經(jīng)參照其某些示例性實(shí)施例示出和描述了本發(fā)明,但是本領(lǐng)域技術(shù)人員將理解,其中可以進(jìn)行各種形式和細(xì)節(jié)上的變化而不背離如由附加的權(quán)利要求書(shū)定義的本發(fā)明的精神和范圍。權(quán)利要求1.一種通道等級(jí)差CLD量化方法,用于當(dāng)執(zhí)行N通道音頻信號(hào)(N>1)的基于空間音頻編碼SAC的編碼時(shí),量化用作空間參數(shù)的CLD參數(shù),該CLD量化方法包括如下步驟從N通道音頻信號(hào)提取每個(gè)子頻帶的CLD;以及通過(guò)參照基于虛擬源位置信息VSLI的CLD量化表量化CLD,該量化表是使用從N通道音頻信號(hào)的VSLI量化值得到的CLD量化值設(shè)計(jì)的。2.如權(quán)利要求1所述的CLD量化方法,其中VSLI量化值以0°和90。之間的范圍內(nèi)的預(yù)定量化間隔量化。3.如權(quán)利要求2所述的CLD量化方法,4.如權(quán)利要求1所述的CLD量化方法,式從VSLI量化值得出其中預(yù)定量化間隔是3。。其中CLD量化值根據(jù)下面的等<formula>formulaseeoriginaldocumentpage2</formula>5.如權(quán)利要求1所述的CLD量化方法,式從VSLI量化值得出其中CLD量化值根據(jù)下面的等<formula>formulaseeoriginaldocumentpage2</formula>6.如權(quán)利要求1所述的CLD量化方法,其中CLD量化的判決等級(jí)從VSLI量化的VSLI判決等級(jí)得出。7.如權(quán)利要求1所述的CLD量化方法,其中基于VSLI的CLD量化表如下<table>tableseeoriginaldocumentpage2</column></row><table><table>tableseeoriginaldocumentpage3</column></row><table>8.如權(quán)利要求7所述的CLD量化方法,其中基于VSLI的CLD量化表與如下的CLD量化判決等級(jí)相關(guān)以10為底的對(duì)數(shù)<table>tableseeoriginaldocumentpage3</column></row><table>9.如權(quán)利要求1所述的CLD量化方法,還包括對(duì)CLD的量化索引執(zhí)行霍夫曼編碼的步驟。10.如權(quán)利要求9所述的CLD量化方法,其中霍夫曼編碼通過(guò)參照下面的霍夫曼碼本對(duì)第一子頻帶的量化索引執(zhí)行<table>tableseeoriginaldocumentpage4</column></row><table>11.如權(quán)利要求10所述的CLD量化方法,其中霍夫曼編碼通過(guò)參照下面的霍夫曼碼本,對(duì)第一子頻帶以外的其余子頻帶的量化索引執(zhí)行<table>tableseeoriginaldocumentpage4</column></row><table><table>tableseeoriginaldocumentpage5</column></row><table>12.—種計(jì)算機(jī)可讀記錄介質(zhì),其上記錄有用于執(zhí)行根據(jù)權(quán)利要求1到11的任一的CLD量化方法的計(jì)算機(jī)程序。13.—種基于空間音頻編碼SAC編碼N通道音頻信號(hào)(N>1)的方法,該方法包括如下步驟下混頻和編碼N通道音頻信號(hào);從N通道音頻信號(hào)為每個(gè)子頻帶提取空間參數(shù),包括通道等級(jí)差CLD、通道間相關(guān)性/相干性ICC、以及通道預(yù)測(cè)系數(shù)CPC;以及量化所提取的空間參數(shù),其中,在量化所提取的空間參數(shù)的步驟中,通過(guò)參照基于虛擬源位置信息VSLI的CLD量化表來(lái)量化CLD,該量化表是使用從N通道音頻信號(hào)的VSLI量化值得到的CLD量化值來(lái)設(shè)計(jì)的。14.一種基于空間音頻編碼SAC編碼N通道音頻信號(hào)(N>1)的裝置,該裝置包括SAC編碼裝置,用于下混頻N通道音頻信號(hào)以生成下混頻信號(hào),并且從N通道音頻信號(hào)為每個(gè)子頻帶提取空間參數(shù),包括通道等級(jí)差CLD、通道間相關(guān)性/相干性ICC、以及通道預(yù)測(cè)系數(shù)CPC;音頻編碼裝置,用于從由SAC編碼裝置生成的下混頻信號(hào)生成壓縮的音頻比特流;空間參數(shù)量化裝置,用于量化由SAC編碼裝置提取的空間參數(shù);以及空間參數(shù)編碼裝置,用于編碼量化的空間參數(shù),其中空間參數(shù)量化裝置通過(guò)參照基于虛擬源位置信息VSLI的CLD量化表來(lái)量化CLD,該量化表是使用從N通道音頻信號(hào)的VSLI量化值得到的CLD量化值而設(shè)計(jì)的。15.如權(quán)利要求14所述的裝置,其中基于VSLI的CLD量化表如下<table>tableseeoriginaldocumentpage6</column></row><table>16.如權(quán)利要求15所述的裝置,其中基于VSLI的CLD量化表與下面的CLD量化判決等級(jí)相關(guān)以10為底的對(duì)數(shù)<table>tableseeoriginaldocumentpage7</column></row><table>17.—種方法,用于當(dāng)基于空間音頻編碼SAC對(duì)編碼的N通道音頻比特流(N〉1)解碼時(shí),解量化編碼的通道等級(jí)差CLD量化值,該方法包括如下步驟對(duì)編碼的CLD量化值執(zhí)行霍夫曼解碼;以及通過(guò)使用基于虛擬源位置信息VSLI的CLD量化表解量化解碼的CLD量化值,該量化表是使用從N通道音頻信號(hào)的VSLI量化值得出的CLD量化值設(shè)計(jì)的。18.如權(quán)利要求18所述的方法,其中基于VSLI的CLD量化表如下<table>tableseeoriginaldocumentpage7</column></row><table><table>tableseeoriginaldocumentpage8</column></row><table>19.如權(quán)利要求18所述的方法,其中基于VSLI的CLD量化表與如下CLD量化判決等級(jí)相關(guān)<table>tableseeoriginaldocumentpage8</column></row><table>20.如權(quán)利要求17所述的方法,其中在對(duì)編碼的CLD量化值執(zhí)行霍夫曼解碼的步驟中,通過(guò)參照如下的霍夫曼碼本解碼第一子頻帶的CLD量化值<table>tableseeoriginaldocumentpage9</column></row><table>21.如權(quán)利要求20所述的方法,其中通過(guò)參照如下的霍夫曼碼本,對(duì)第一子頻帶以外的其余子頻帶的量化索引執(zhí)行霍夫曼編碼<table>tableseeoriginaldocumentpage9</column></row><table><table>tableseeoriginaldocumentpage10</column></row><table>22.—種計(jì)算機(jī)可讀記錄介質(zhì),其上記錄有用于執(zhí)行根據(jù)權(quán)利要求17到21中的任一所述的CLD解量化方法的計(jì)算機(jī)程序。23.—種基于空間音頻編碼SAC對(duì)編碼的N通道音頻比特流(N>1)解碼的方法,該方法包括如下步驟對(duì)編碼的N通道音頻比特流解碼;解量化與編碼的N通道音頻比特流一起接收的至少一個(gè)空間參數(shù)的量化值;以及基于解量化的空間參數(shù)合成解碼的N通道音頻比特流,以恢復(fù)N通道音頻信號(hào),其中,在解量化至少一個(gè)空間參數(shù)的量化值的步驟中,通過(guò)參考基于虛擬源位置信息VSLI的CLD量化表來(lái)解量化包括在空間參數(shù)中的CLD,該量化表是使用從N通道音頻信號(hào)的VSLI量化值得到的CLD量化值設(shè)計(jì)的。24.—種基于空間音頻編碼SAC對(duì)編碼的N通道音頻比特流(N>1)解碼的裝置,該裝置包括-.用于對(duì)編碼的N通道音頻比特流解碼的裝置;用于解碼與編碼的N通道音頻比特流一起接收的至少一個(gè)空間參數(shù)的量化值的裝置;用于解量化空間參數(shù)的量化值的裝置;以及基于解量化的空間參數(shù)合成解碼的N通道音頻比特流,以恢復(fù)N通道音頻信號(hào),其中用于解量化空間參數(shù)的量化值的裝置通過(guò)參照基于虛擬源位置信息VSLI的CLD量化表,解量化包括在空間參數(shù)中的CLD,該量化表是使用從N通道音頻信號(hào)的VSLI量化值得到的CLD量化值設(shè)計(jì)的。25.如權(quán)利要求24所述的裝置,其中基于VSLI的CLD量化表如下<table>tableseeoriginaldocumentpage10</column></row><table><table>tableseeoriginaldocumentpage11</column></row><table>26.如權(quán)利要求25所述的裝置,其中基于VSLI的CLD量化表與如下CLD量化判決等級(jí)相關(guān)<table>tableseeoriginaldocumentpage11</column></row><table>全文摘要提供了一種用于多通道音頻信號(hào)的空間音頻編碼(SAC)和SAC生成的音頻比特流的解碼的方法。更具體地,提供了一種方法,其當(dāng)執(zhí)行多通道音頻信號(hào)的基于SAC的編碼時(shí),有效量化和解量化用作空間參數(shù)的通道等級(jí)差(CLD)。CLD量化的方法包括從N通道音頻信號(hào)(N>1)提取子頻帶特定的CLD,并且通過(guò)參照基于虛擬源位置信息(VSLI)的CLD量化表來(lái)量化CLD,該量化表是使用從N通道音頻信號(hào)的VSLI量化值得到的CLD量化值設(shè)的計(jì)。文檔編號(hào)G11B20/10GK101223598SQ200680025984公開(kāi)日2008年7月16日申請(qǐng)日期2006年7月19日優(yōu)先權(quán)日2005年7月19日發(fā)明者姜京玉,徐廷一,成宏模,洪鎮(zhèn)佑,田相培,白承權(quán),金光基,韓敏洙申請(qǐng)人:韓國(guó)電子通信研究院