專利名稱:可伸縮地編解碼音頻數(shù)據(jù)的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及編碼和解碼音頻數(shù)據(jù),尤其特別的是,涉及用于編碼音頻數(shù)據(jù),以便編碼的音頻比特流具有可伸縮的比特率的方法和裝置,以及用于解碼音頻數(shù)據(jù)的方法和裝置。
背景技術(shù):
由于近來(lái)數(shù)字信號(hào)處理技術(shù)的發(fā)展,多數(shù)情況下音頻信號(hào)通常被存儲(chǔ)成數(shù)字信號(hào)并且再現(xiàn)。數(shù)字音頻存儲(chǔ)/恢復(fù)裝置通過(guò)采樣和量化把音頻信號(hào)變換成脈沖編碼調(diào)制(PCM),也就是數(shù)字信號(hào)。通過(guò)這樣的操作,數(shù)字音頻存儲(chǔ)/再現(xiàn)裝置在信息存儲(chǔ)介質(zhì),比如光盤(CD)和數(shù)字化視頻光盤(DVD)中存儲(chǔ)PCM音頻數(shù)據(jù),并響應(yīng)用戶的命令再現(xiàn)存儲(chǔ)的信號(hào)以便用戶能聽(tīng)音頻數(shù)據(jù)。相對(duì)于使用密紋(LP)記錄或磁帶的模擬方法來(lái)說(shuō),數(shù)字存儲(chǔ)/重構(gòu)方法大大地提高了音頻質(zhì)量,并顯著減少了由長(zhǎng)的存儲(chǔ)周期引起的惡化。然而,由于大量的數(shù)字?jǐn)?shù)據(jù),數(shù)字方法在存儲(chǔ)和傳輸方面存在問(wèn)題。
為解決該問(wèn)題,各種壓縮方法被用于壓縮數(shù)字音頻信號(hào)。
在由國(guó)際標(biāo)準(zhǔn)化組織標(biāo)準(zhǔn)化的運(yùn)動(dòng)圖象專家組(MPEG)中,或者由Dolby開(kāi)發(fā)的AC-2/AC-3中,使用音質(zhì)模型減少了數(shù)據(jù)量。作為結(jié)果,數(shù)據(jù)量能被有效地減少而不管信號(hào)的特性如何。就是說(shuō),MPEG/音頻標(biāo)準(zhǔn)或AC-2/AV-3方法能以僅僅64~384 Kbps的比特率提供幾乎與CD相同的音頻質(zhì)量,該比特率是先前數(shù)字編碼方法的比特率的1/6到1/8。
然而,在這些方法中,搜索適用于固定比特率的最佳狀態(tài)并且接著執(zhí)行量化和編碼。因此,如果在通過(guò)網(wǎng)絡(luò)發(fā)送比特流時(shí)由于網(wǎng)絡(luò)條件很差而使得傳輸帶寬被降低,可能會(huì)出現(xiàn)斷開(kāi)和適當(dāng)?shù)姆?wù)不能再提供給用戶。此外,當(dāng)比特流期望被變換成較小尺寸的比特流以更適用于具有有限存儲(chǔ)容量的移動(dòng)裝置時(shí),應(yīng)該執(zhí)行再編碼處理以減少比特流的尺寸,并增加了所需的計(jì)算量。
為解決該問(wèn)題,本發(fā)明的的申請(qǐng)人提出了韓國(guó)專利申請(qǐng)No.97-61298,1997年11月19日,標(biāo)題“使用位切片算法編碼(BSAC)的可伸縮比特率音頻編碼/解碼的方法和裝置”,此專利在2000年4月17日被授權(quán),韓國(guó)專利號(hào)No.261253。根據(jù)BSAC技術(shù),具有高比特率編碼的比特流能被變成具有低比特率的比特流,并能夠只用部分的比特流進(jìn)行重構(gòu)。因此,當(dāng)網(wǎng)絡(luò)過(guò)載時(shí),或者解碼器的性能很差時(shí),或用戶請(qǐng)求低比特率時(shí),通過(guò)只使用部分的比特流,可以把具有一定音頻質(zhì)量的服務(wù)提供給用戶,盡管隨著比特率的下降,質(zhì)量會(huì)不可避免地成比例地下降。
然而,由于BSAC技術(shù)采用修正離散余弦變換(MDCT)變換音頻信號(hào),低層失真變得更嚴(yán)重。原因如下。即,雖然MDCT在層變低的時(shí)候降低了音頻質(zhì)量,但MDCT的頻率分辨率是恒定的。因此,從音質(zhì)模型來(lái)看,關(guān)于人耳不敏感的頻帶的頻率分辨率過(guò)度地增加了。
發(fā)明內(nèi)容
發(fā)明提供了用于可伸縮地(with scalability)編解碼音頻數(shù)據(jù)的一種方法和裝置,通過(guò)該方法和裝置為精細(xì)粒度可伸縮性(FGS)提供較低的復(fù)雜度。
按照本發(fā)明的一個(gè)方面,提供一種對(duì)音頻數(shù)據(jù)進(jìn)行可伸縮性編碼的方法,該方法包括對(duì)包含對(duì)應(yīng)于第一層的定標(biāo)因子信息和編碼模型信息的附加信息進(jìn)行編碼,參考編碼模型信息,按照從MSB(最高有效位)到LSB(最低有效位)和從低頻到高頻的順序,以K比特為單位對(duì)與第一層對(duì)應(yīng)的多個(gè)量化樣本進(jìn)行算術(shù)編碼,其中K是大于或等于1的整數(shù),以及通過(guò)每次逐1增加層的序數(shù)重復(fù)執(zhí)行這些步驟,直到多層的編碼完成。
按照本發(fā)明的另一方面,提供一種編碼方法,它包括,對(duì)音頻數(shù)據(jù)進(jìn)行切片(slicing),使切片的音頻數(shù)據(jù)與多個(gè)層對(duì)應(yīng),獲得與多層的每一層對(duì)應(yīng)的定標(biāo)段信息和編碼段信息,根據(jù)與第一層對(duì)應(yīng)的定標(biāo)段信息和編碼段信息對(duì)包含定標(biāo)因子信息和編碼模型信息的附加信息進(jìn)行編碼,通過(guò)參考定標(biāo)因子信息對(duì)與第一層對(duì)應(yīng)的音頻數(shù)據(jù)進(jìn)行量化而獲得量化樣本,參考編碼模型信息,按照從MSB到LSB和從低頻到高頻的順序,以K比特為單位對(duì)所得到的多個(gè)量化樣本進(jìn)行算術(shù)編碼,其中K是大于或等于1的一個(gè)整數(shù),以及通過(guò)每次逐1增加層的序數(shù)重復(fù)執(zhí)行這些步驟,直到多層的編碼完成。
在附加信息編碼以前,該方法還可包括,獲得多個(gè)層的每一個(gè)層中的可用比特范圍,其中在所獲得的多個(gè)量化樣本的算術(shù)編碼中,編碼比特的數(shù)目被計(jì)數(shù),如果所計(jì)數(shù)的比特的數(shù)目超過(guò)對(duì)應(yīng)于該比特的比特范圍,編碼就停止,如果即使在各量化樣本全部被編碼以后所計(jì)數(shù)的比特的數(shù)目小于該比特范圍,在低層的偏碼完成以后仍未被編碼的比特就被編碼到該比特范圍容許的范圍。
音頻數(shù)據(jù)的切片包括,進(jìn)行音頻數(shù)據(jù)的子波變換,參考截止頻率對(duì)子波變換數(shù)據(jù)進(jìn)行切片,以使切片的數(shù)據(jù)對(duì)應(yīng)于多個(gè)層。
并且,附加信息的編碼可包括對(duì)定標(biāo)因子信息和編碼模型信息的差分編碼。
算術(shù)編碼可包括把多個(gè)量化樣本映射到比特平面上,以及按照從MSB到LSB和從低頻到高頻的順序在與樣本對(duì)應(yīng)的層中容許的比特范圍內(nèi)以K比特為單位對(duì)樣本進(jìn)行算術(shù)編碼。
按照本發(fā)明的另一個(gè)方面,提供一種對(duì)以分層結(jié)構(gòu)編碼的音頻數(shù)據(jù)進(jìn)行可伸縮的解碼的方法,該方法包括,對(duì)包含對(duì)應(yīng)第一層的定標(biāo)因子信息和編碼模型信息的附加信息進(jìn)行解碼,參考編碼模型信息,按照從MSB到LSB和從低頻到高頻的順序,以K比特為單位對(duì)音頻數(shù)據(jù)進(jìn)行算術(shù)解碼,并且獲得量化樣本,其中K是大于或等于1的一個(gè)整數(shù),參考定標(biāo)因子信息反量化所得到的量化樣本,對(duì)反量化樣本執(zhí)行反子波變換,以及通過(guò)每次逐1增加層的序數(shù)重復(fù)執(zhí)行這些步驟,直到多層的解碼完成。
附加信息的解碼可以包括對(duì)定標(biāo)因子信息和編碼模型信息的差分編碼。音頻數(shù)據(jù)的算術(shù)解碼可包括按照從MSB到LSB和從低頻到高頻的順序,以K比特為單位對(duì)音頻數(shù)據(jù)進(jìn)行算術(shù)解碼,以及從解碼的比特中獲得量化樣本。
按照本發(fā)明的另一個(gè)方面,提供一種對(duì)以分層結(jié)構(gòu)編碼的音頻數(shù)據(jù)進(jìn)行可伸縮的解碼的裝置,它包括解封單元,其對(duì)包含對(duì)應(yīng)于第一層的定標(biāo)因子信息和編碼模型信息的附加信息進(jìn)行解碼,以及參考編碼模型信息,按照從MSB到LSB和從低頻到高頻的順序以K比特為單位對(duì)音頻數(shù)據(jù)進(jìn)行解碼,并獲得量化樣本,其中K是一個(gè)大于或等于1的整數(shù);反量化單元,其參考定標(biāo)因子信息對(duì)所獲得的量化樣本進(jìn)行反量化;和反變換單元,其對(duì)反量化樣本執(zhí)行反子波變換。
解封單元最好按照從MSB到LSB和從低頻到高頻的順序在相應(yīng)層所容許的比特范圍內(nèi)以K比特為單位對(duì)定標(biāo)因子信息和編碼模型信息進(jìn)行差值解碼,順序是從MSB到LSB和從低頻到高頻,并從解碼的比特被安排的比特平面上獲得量化樣本。
按照本發(fā)明的另一個(gè)方面,提供一種對(duì)音頻數(shù)據(jù)進(jìn)行可伸縮的編碼的裝置,它包括,變換單元,其對(duì)音頻數(shù)據(jù)進(jìn)行子波變換,量化單元,其參考定標(biāo)因子信息,對(duì)與每層對(duì)應(yīng)的子波變換音頻數(shù)據(jù)進(jìn)行量化,并輸出量化樣本,和封裝單元,其對(duì)包含對(duì)應(yīng)于每層的定標(biāo)因子信息和編碼模型信息的附加信息進(jìn)行編碼,并參考編碼模型信息,按照從MSB到LSB和從低頻到高頻的順序,以K比特為單位對(duì)來(lái)自量化單元的多個(gè)量化樣本進(jìn)行算術(shù)編碼,其中K是一個(gè)大于或等于1的整數(shù)。
封裝單元獲得對(duì)應(yīng)于多個(gè)層的每一層的定標(biāo)段信息和編碼段信息,并根據(jù)和對(duì)應(yīng)于每一層的定標(biāo)段信息編碼段信息對(duì)包含定標(biāo)因子信息和編碼模型信息的附加信息進(jìn)行編碼。并且,封裝單元計(jì)數(shù)編碼比特的數(shù)目,如果所計(jì)數(shù)的比特的數(shù)目超過(guò)對(duì)應(yīng)于該比特的比特范圍,就停止編碼,如果即使在量化樣本全部被編碼以后所計(jì)數(shù)的比特的數(shù)目小于對(duì)應(yīng)于該比特的比特范圍,則將低層編碼完成后仍未編碼的比特編碼到該比特范圍允許的范圍。封裝單元對(duì)定標(biāo)因子信息和編碼模型信息進(jìn)行差分編碼。
封裝單元把多個(gè)量化樣本映射在比特平面上,并按照從MSB到LSB和從低頻到高頻的順序在與樣本對(duì)應(yīng)的層中容許的比特范圍內(nèi)以K比特為單位對(duì)樣本進(jìn)行算術(shù)編碼。
通過(guò)參考附圖詳細(xì)描述其最佳實(shí)施例,本發(fā)明的上述目的和優(yōu)點(diǎn)將會(huì)變得更加明顯,其中圖1是本發(fā)明的最佳實(shí)施例的編碼裝置的方塊圖;圖2是本發(fā)明的最佳實(shí)施例的解碼裝置的方塊圖;圖3是幀的結(jié)構(gòu)圖,所述的幀形成在分層結(jié)構(gòu)中編碼的比特流以便能夠控制比特率;圖4是附加信息的結(jié)構(gòu)的詳圖;圖5是原理地解釋本發(fā)明的編碼和解碼方法的參考圖;圖6是更具體地解釋本發(fā)明的編碼方法的參考圖;圖7是解釋本發(fā)明最佳實(shí)施例的編碼方法的流程圖;圖8是解釋本發(fā)明最佳實(shí)施例的解碼方法的流程圖;和圖9是解釋本發(fā)明另一個(gè)最佳實(shí)施例的解碼方法的流程圖。
具體實(shí)施例方式
參考圖1,按照本發(fā)明,編碼裝置以分層結(jié)構(gòu)編碼音頻數(shù)據(jù),以便能控制編碼的比特流的比特率,并且包括變換單元11,音質(zhì)單元12,量化單元13,和比特封裝單元14。
變換單元11接收作為時(shí)域音頻信號(hào)的脈沖編碼調(diào)制(PCM)音頻數(shù)據(jù),并把信號(hào)變換成頻域信號(hào),其中參照由音質(zhì)單元12提供的有關(guān)音質(zhì)模型的信息。當(dāng)人能感知的音頻信號(hào)的特性之間的差在時(shí)域中不是很大時(shí),在通過(guò)變換獲得的頻域音頻信號(hào)中,人能感知的信號(hào)和不能被人所感知的信號(hào)的特性之間具有大的差別。所以,通過(guò)區(qū)分分配到各個(gè)頻段的比特的數(shù)目,壓縮效率可以被提高。在本發(fā)明實(shí)施例中,變換單元11執(zhí)行子波變換。在MDCT中,由于低頻段中不必要的高頻分辨率,甚至輕微的失真也可引起能由人耳朵感覺(jué)到的降級(jí)。然而,在子波變換中,時(shí)間/頻率分辨率是更合適的,以至于可以提供更穩(wěn)定的音頻質(zhì)量,即使是在具有低頻段的低層中。
音質(zhì)單元12提供音質(zhì)模型的信息,比如沖擊感信息給變換單元11,并把變換單元11變換的音頻信號(hào)組合成適當(dāng)子頻段的信號(hào)。此外,音質(zhì)單元12通過(guò)使用各個(gè)信號(hào)之間的交互作用所引起的屏蔽效應(yīng)計(jì)算每個(gè)子頻段中的屏蔽門限,并提供該門限值給量化單元13。屏蔽門限是由于信號(hào)間的交互作用而不能被人所感覺(jué)到的信號(hào)的最大值。在本實(shí)施例中,音質(zhì)單元12通過(guò)兩耳屏蔽電平降低(binaura1 masking level depression)(BMLD)來(lái)計(jì)算立體聲分量的屏蔽門限。
量化單元13根據(jù)相應(yīng)于音頻信號(hào)的定標(biāo)因子信息在每個(gè)頻段標(biāo)量量化音頻信號(hào),使得頻段中量化噪聲的水平小于音質(zhì)單元12所提供的屏蔽門限,以致人不能感知到噪聲。接著,量化單元13輸出量化的樣本。就是說(shuō),通過(guò)使用音質(zhì)單元12中計(jì)算的屏蔽門限和作為每個(gè)頻段產(chǎn)生的噪聲的比率的噪聲-屏蔽比率(NMR),量化單元13執(zhí)行量化,使得全頻段中的NMR值是0dB或更小。0dB或更小的NMR值意味著人不能感知量化噪聲。
比特封裝單元14編碼屬于每層的量化樣本和附加信息,并以分層結(jié)構(gòu)封裝編碼信號(hào)。附加信息包括每層中的定標(biāo)段信息,編碼段信息,它們的定標(biāo)因子信息,和編碼模型信息。定標(biāo)段信息和編碼段信息可以被封裝成首部信息,并且接著被發(fā)送到解碼裝置。否則,定標(biāo)段信息和編碼段信息可以被編碼和封裝成每層的附加信息,并接著發(fā)送到解碼裝置。定標(biāo)段信息和編碼段信息可以不被發(fā)送到解碼裝置,因?yàn)樵谝恍┣闆r下它們被預(yù)存在解碼裝置中。
更特別地,當(dāng)對(duì)包含與第一層對(duì)應(yīng)的定標(biāo)因子信息和編碼模型信息的附加信息進(jìn)行差分編碼時(shí),比特封裝單元14參考與第一層對(duì)應(yīng)的編碼模型信息,以若干比特為單位對(duì)量化樣本進(jìn)行切片,并按照從最高有效位到最低有效位的順序?qū)Ρ忍氐臉颖具M(jìn)行編碼。要被編碼的兩個(gè)分量是附加信息和量化樣本,附加信息比量化樣本更重要。理由如下。也就是,即使量化樣本被準(zhǔn)確傳送,然而當(dāng)包含定標(biāo)段信息、量化步長(zhǎng)等的附加信息沒(méi)有被正確傳送時(shí),它被重構(gòu)成完全錯(cuò)誤的信號(hào)。不過(guò),當(dāng)僅僅附加信息被準(zhǔn)確重構(gòu)的時(shí)候,則可以被重構(gòu)總輪廓,即使在量化樣本中有微小誤差。因此,附加信息首先被編碼,然后,量化樣本被編碼。在對(duì)附加信息和量化樣本進(jìn)行編碼的時(shí)候,如果所計(jì)數(shù)的比特的數(shù)目大于或等于每一層所容許的比特?cái)?shù),編碼就停止,比特流的形成也終止。仍未編碼的量化樣本在其容許比特?cái)?shù)還有空間的層中編碼。因?yàn)楸忍胤秶蛯訑?shù)是根據(jù)音頻數(shù)據(jù)的大小而適當(dāng)確定的。即使所有的量化樣本不被編碼,而比特流的形成由于編碼期間目標(biāo)層的數(shù)量的變化而被終止,因?yàn)橹匾?significant)信息首先被編碼,音頻質(zhì)量也不會(huì)嚴(yán)重變劣。按照本實(shí)施例,在對(duì)量化樣本編碼的時(shí)候,比特封裝單元14對(duì)多個(gè)量化樣本進(jìn)行比特切片(bit slicing),并以K比特為單位對(duì)經(jīng)過(guò)比特切片的樣本進(jìn)行算術(shù)編碼,順序是從低頻到高頻(K是大于或等于1的一個(gè)整數(shù))。然后,在第二層中,相同的過(guò)程被重復(fù)進(jìn)行。即,編碼隨著層數(shù)的增加來(lái)進(jìn)行,直到多個(gè)預(yù)定層的編碼完成。按本發(fā)明編碼的比特流的分層結(jié)構(gòu)將在下面解釋。
定標(biāo)段信息是指用于按照音頻信號(hào)的頻率特性更合適地執(zhí)行量化的信息。當(dāng)頻率區(qū)域被分成多個(gè)頻段并且一個(gè)合適的定標(biāo)因子被分配到每個(gè)頻段時(shí),定標(biāo)段信息指示相應(yīng)于每層的定標(biāo)段。這樣,每層屬于至少一個(gè)定標(biāo)段。每個(gè)定標(biāo)段具有一個(gè)分配的定標(biāo)因子。通常,因?yàn)槎?biāo)段是按照人的聽(tīng)覺(jué)特性形成的,在低頻時(shí)定標(biāo)段的帶寬較小,它隨著頻率的增加而增加。
此外,編碼段信息是指用于根據(jù)音頻信號(hào)的頻率特性更合適地執(zhí)行無(wú)損編碼的信息。當(dāng)頻率區(qū)域被分成多個(gè)頻段并且適當(dāng)?shù)木幋a模型被分配到每個(gè)頻段時(shí),編碼段信息指示對(duì)應(yīng)于每層的編碼段。因?yàn)槎?biāo)帶寬隨頻率變化,所以很難獲得均勻的概率分布。因此,組合幾個(gè)頻率信號(hào),以使各個(gè)段的信號(hào)具有相似的概率分布。每組這種組合信號(hào)稱為一個(gè)編碼段。通常,在低頻時(shí)多個(gè)定標(biāo)段落在一個(gè)編碼段上。隨著頻率增加,定標(biāo)段與編碼段重合。在實(shí)際中,定標(biāo)段和編碼段按經(jīng)驗(yàn)分開(kāi),并且與之對(duì)應(yīng)的定標(biāo)因子和編碼模型分別按照各段確定。特別是,本發(fā)明基于子波變換,并且劃分編碼段,以便與子波變換的樹(shù)結(jié)構(gòu)的最后節(jié)點(diǎn)相對(duì)應(yīng)。這將在以后詳細(xì)描述。
圖2是本發(fā)明最佳實(shí)施例的解碼裝置的方塊圖。
參考圖2,解碼裝置解碼比特流到由網(wǎng)絡(luò)條件,解碼裝置的性能和用戶的選擇所確定的目標(biāo)層,使得比特流的比特率能被控制。解碼裝置包括解封單元21,反量化單元22,和反變換單元23。
解封單元21解封比特流到目標(biāo)層,并對(duì)每層中的比特流進(jìn)行解碼。即,包含與每一層對(duì)應(yīng)的定標(biāo)因子信息和編碼模型信息的附加信息被解碼,然后根據(jù)所得到的編碼模型信息,屬于該層的編碼量化樣本被解碼,量化樣本被重構(gòu)。在本實(shí)施例中,解封單元21對(duì)定標(biāo)因子信息和算術(shù)編碼模型信息進(jìn)行差分解碼,按照從MSB到LSB和從低頻到高頻的順序,以K比特為單位對(duì)編碼量化樣本進(jìn)行算術(shù)解碼,然后進(jìn)行比特組合,由此獲得量化樣本。這里,K是大于或等于1的一個(gè)整數(shù)。比特組合是編碼期間進(jìn)行的比特切片的反過(guò)程。
同時(shí),從比特流的首部信息,或通過(guò)解碼每層中的附加信息,獲得定標(biāo)段信息和編碼段信息。另一方面,解碼裝置可以事先存儲(chǔ)定標(biāo)段信息和編碼段信息。反量化單元22按照與各樣本對(duì)應(yīng)的定標(biāo)因子信息反量化和重構(gòu)每一層中的量化樣本。反變換單元23通過(guò)子波變換對(duì)重構(gòu)樣本進(jìn)行頻率/時(shí)間映射,以便輸出作為時(shí)域的PCM音頻數(shù)據(jù)的樣本。
圖3是幀的結(jié)構(gòu)圖,所述幀形成以分層結(jié)構(gòu)編碼的比特流,使得可以控制比特率。
參考圖3,按照本發(fā)明的比特流的幀通過(guò)映射量化樣本和附加信息被編碼到分層結(jié)構(gòu),以獲得精細(xì)粒度可伸縮性(FGS)。換句話說(shuō),低層比特流被包括在分層結(jié)構(gòu)的增強(qiáng)層比特流中。每層中需要的附加信息被分配到每層,然后被編碼。
用于存儲(chǔ)首部信息的首部區(qū)域被放在比特流的前面,然后有關(guān)層0的信息在首部區(qū)域之后被封裝,接著,屬于作為增強(qiáng)層的層1-N的信息按順序被封裝。從首部區(qū)域至層0信息的層被稱作基層,從首部區(qū)域至層1信息的層被稱作層1,和從首部區(qū)域至層2信息的層被稱作層2。同樣,最上層表示從首部區(qū)域至層N信息,就是說(shuō),從基層到作為增強(qiáng)層的層N。附加信息和編碼音頻數(shù)據(jù)被存儲(chǔ)成每個(gè)層信息。例如,附加信息2和編碼量化樣本被存儲(chǔ)成層2信息。這里,N是大于或等于1的一個(gè)整數(shù)。
圖4是附加信息的結(jié)構(gòu)的詳圖。
參考圖4,附加信息和編碼量化樣本作為任意附加信息被存儲(chǔ),在本實(shí)施例中,附加信息包括算術(shù)編碼模型信息,量化因子信息,有關(guān)信道的附加信息,和其它附加信息。算術(shù)編碼模型信息是算術(shù)編碼模型的索引信息,應(yīng)該用于編碼或解碼屬于相應(yīng)于該信息的層的量化樣本。定標(biāo)因子信息指示量化步長(zhǎng),該步長(zhǎng)用于量化或反量化屬于相應(yīng)于信息的層的音頻數(shù)據(jù)。有關(guān)信道的附加信息是有關(guān)信道的諸如M/S立體聲的信息。其它附加信息是有關(guān)是否使用M/S立體聲的標(biāo)志信息。
在本實(shí)施例中,比特封裝單元14對(duì)算術(shù)編碼模型信息和定標(biāo)因子信息進(jìn)行無(wú)損編碼。因?yàn)槊總€(gè)定標(biāo)段具有一個(gè)量化段,為了對(duì)量化因子進(jìn)行編碼,屬于每個(gè)定標(biāo)段的量化因子中間的最小值首先被無(wú)損編碼,然后,最小值和另一個(gè)量化因子之間的差被無(wú)損編碼。對(duì)于附加信息的無(wú)損編碼,算術(shù)編碼或Arithmetic編碼可以被使用。在本實(shí)施例中,算術(shù)編碼被執(zhí)行。同樣,對(duì)應(yīng)于每個(gè)編碼段的算術(shù)編碼模型和有關(guān)容許比特范圍的信息可以通過(guò)與量化步長(zhǎng)中相同的編碼方法,即差分編碼進(jìn)行編碼。
在本實(shí)施例中,比特解封單元21執(zhí)行附加信息的無(wú)損解碼,附加信息包括算術(shù)編碼模型信息和定標(biāo)因子信息。因?yàn)槊總€(gè)定標(biāo)段具有一個(gè)量化段,為了對(duì)量化因子進(jìn)行解碼,屬于每個(gè)定標(biāo)段的量化因子中的最小值首先被無(wú)損解碼,然后,該最小值和另一量化因子之間的差被無(wú)損解碼。按照與算術(shù)編碼被用于對(duì)附加信息進(jìn)行無(wú)損編碼的編碼裝置相同的方式,本實(shí)施例的解碼裝置執(zhí)行算術(shù)編碼。同樣,對(duì)應(yīng)于每個(gè)編碼段的算術(shù)編碼模型和有關(guān)容許比特范圍的信息通過(guò)與量化因子中相同的解碼方法被解碼。
圖5是解釋本發(fā)明的編碼方法和解碼方法的參考圖。
參照?qǐng)D5,用斜線矩形表示量化樣本組成的譜線。參考符號(hào)A表示每層的邊界線,B表示對(duì)應(yīng)于子波變換的樹(shù)結(jié)構(gòu)的每個(gè)終端節(jié)點(diǎn)的劃分界線。
在本發(fā)明編碼方法使用的子波變換中,頻率變換是使用樹(shù)結(jié)構(gòu)進(jìn)行的,以便表示類似于與人耳特點(diǎn)對(duì)應(yīng)的濾波器組的形狀的音頻數(shù)據(jù)。樹(shù)結(jié)構(gòu)的最后節(jié)點(diǎn)分別與算術(shù)編碼的定標(biāo)段對(duì)應(yīng)。因此,每個(gè)最后的節(jié)點(diǎn)就與定標(biāo)因子對(duì)應(yīng)。
編碼段是用于算術(shù)編碼的算術(shù)編碼模型信息的傳輸單位,它可以根據(jù)編碼效率來(lái)確定。例如,假設(shè)最后節(jié)點(diǎn)的定標(biāo)段和編碼段相同。然后,層和最后節(jié)點(diǎn)互相映射,如圖5所示。因?yàn)閷?duì)應(yīng)于每個(gè)最后節(jié)點(diǎn)的數(shù)據(jù)出現(xiàn)在同一頻率段的時(shí)間軸上,所以對(duì)應(yīng)于最后節(jié)點(diǎn)的數(shù)據(jù)段在分層時(shí)不被分開(kāi)。
確定層0以使編碼執(zhí)行直到一個(gè)頻率段(a)。確定層1以使編碼執(zhí)行直到一個(gè)頻率段(b)。確定層2以使編碼執(zhí)行直到一個(gè)頻率段(c)。確定層3以使編碼執(zhí)行直到一個(gè)頻率段(d)。確定層4以使編碼執(zhí)行直到一個(gè)頻率段(e)。確定層5以使編碼執(zhí)行直到一個(gè)頻率段(f)。確定層6以使編碼執(zhí)行直到一個(gè)頻率段(g)。確定層7以使編碼執(zhí)行直到一個(gè)頻率段(h)。
首先,屬于層0的量化樣本利用對(duì)應(yīng)的編碼模型在預(yù)定的比特范圍內(nèi)被編碼。同時(shí),作為層0的附加信息,屬于層0的量化樣本被算術(shù)編碼。在以若干比特為單位對(duì)量化樣本進(jìn)行編碼的時(shí)候,比特?cái)?shù)被計(jì)數(shù)。如果所計(jì)數(shù)的比特?cái)?shù)超過(guò)容許的比特范圍,層0的編碼就停止,并且層1被算術(shù)編碼。在層0的量化樣本之中,當(dāng)層0和1中容許的比特?cái)?shù)目中還有空間的時(shí)候,未編碼的量化樣本被編碼。
接著,屬于層1的量化樣本利用對(duì)應(yīng)的編碼模型被編碼。同時(shí),層1的附加信息被算術(shù)編碼。如果即使在對(duì)與層1對(duì)應(yīng)的所有樣本進(jìn)行編碼以后在容許的比特范圍內(nèi)還有空間,層0中仍未編碼的比特就被編碼,直到計(jì)數(shù)到容許的比特。如果編碼所計(jì)數(shù)的比特?cái)?shù)超過(guò)容許的比特范圍,層1的編碼就停止,并且層2的編碼被啟動(dòng)。同一過(guò)程被重復(fù),直到層7的編碼完成。
如果所有的最化樣本被編碼而不考慮每一層的容許比特范圍,即,如果即使在編碼比特?cái)?shù)超過(guò)容許比特范圍之后所有量化樣本被編碼(這意味著下一層的容許比特范圍中的某些比特被用于對(duì)當(dāng)前層進(jìn)行編碼),則通常的情況是,屬于下一層的量化樣本不能被編碼。因此,在可伸縮解碼情況下,如果解碼是在低層,而不是在所有被解碼的層上進(jìn)行,因?yàn)榉秶钡筋A(yù)定頻率的所有量化樣本不被編碼,解碼的量化樣本可能出現(xiàn)波動(dòng),導(dǎo)致“Birdy”效應(yīng),使得音頻質(zhì)量會(huì)變劣。
當(dāng)解碼以和編碼過(guò)程相反的方式進(jìn)行的時(shí)候,比特?cái)?shù)根據(jù)容許比特范圍進(jìn)行計(jì)數(shù)。因此,預(yù)定層的解碼定時(shí)點(diǎn)可被識(shí)別。
當(dāng)編碼沿從msb到Isb的方向的譜線上進(jìn)行的時(shí)候,在子波變換的樹(shù)結(jié)構(gòu)的最后節(jié)點(diǎn)上的同一比特平面上的數(shù)據(jù)應(yīng)該一起編碼。例如,假設(shè)下面的量化樣本在某個(gè)最后節(jié)點(diǎn)上。
000000001010101101011111110000000000000000001100110000000110在基于MDCT的編碼中,量化樣本被分組成下面5個(gè)3*4比特平面,然后編碼向右,向下進(jìn)行。
0000 0000 1010 1011 01011111 1100 0000 0000 00000000 1100 1100 0000 0110在基于子波的編碼中,量化樣本被認(rèn)為是在比特平面上,然后以若干多個(gè)比特為單位,從MSB到LSB和從低頻到高頻依次進(jìn)行編碼。如上所述,MSB 00000000101010110101以K比特為單位從左至右被編碼,然后接下來(lái)的比特11111100000000000000以K比特為單位從左至右被編碼,最后,LSB00001100110000000110以K比特為單位被編碼。這里,K是大于或等于1的一個(gè)整數(shù)。特別是,如果K等于1,二進(jìn)制編碼被執(zhí)行,因?yàn)樵诒景l(fā)明中執(zhí)行算術(shù)編碼。
圖6是更具體地解釋本發(fā)明的編碼方法的參考圖。
參考圖6,編碼裝置分別存儲(chǔ)通過(guò)量化被轉(zhuǎn)化成頻域信號(hào)的樣本X1,X2,X3,X4……而獲得的量化樣本XQ1,XQ2,XQ3,XQ4的符號(hào)值S[XQ1],S[XQ2],S[XQ3],S[XQ4],……,并獲得它們的絕對(duì)值,即|XQ1|,|XQ2|,|XQ3|,|XQ4|,……,使所有量化樣本都是正值。
通常,如所公知的,由于低比特下的1比特差錯(cuò)引起的信息差錯(cuò)大于高比特下所引起的信息差錯(cuò),所以MSB的重要性(significance)就大于LSB。不過(guò),在傳統(tǒng)編碼技術(shù)情況下,進(jìn)行編碼時(shí)不考慮重要性。因此,如果僅僅某些前導(dǎo)的比特流可以被使用,則大量的與包含在未使用的尾部比特流中的信息相比較不太重要的信息會(huì)包含在前導(dǎo)比特流中。因此,在本發(fā)明中,用于每個(gè)段的量化樣本的絕對(duì)值以若干比特為單位被分開(kāi)。當(dāng)|XQ1|是5比特?cái)?shù)據(jù)并且從MSB到LSB以若干比特為單位被分開(kāi)的時(shí)候,給出XO1,5,XO1,4,XO1,3,XO1,2,XO1,1,|XQ2|給出XO2,5,XO2,4,XO2,3,XO2,2,XO2,1,|XQ3|給出XO3,5,XO3,4,XO3,3,XO3,2,XO3,1,而|XQ4|給出XO4,5,XO4,4,XO4,3,XO4,2,XO4,1(???··)。
接著,MSB按照從低頻到高頻的順序被收集并以預(yù)定單位分切以形成向量,然后向量被編碼。這里,C[A1,…,Ak]表示A1,…,Ak構(gòu)成的向量的算術(shù)編碼,K是大于或等于1的一個(gè)整數(shù)。因?yàn)樗阈g(shù)編碼以若干比特為單位進(jìn)行,即使小數(shù)點(diǎn)級(jí)比特分配,例如0.001比特,在對(duì)1比特進(jìn)行編碼中也是容許的,由此可用較少數(shù)量比特對(duì)大量信息進(jìn)行編碼,這表明編碼效率高。Arithmetic編碼是無(wú)損耗編碼的替代形式,它要求每個(gè)符號(hào)至少一個(gè)比特,它的編碼效率比算術(shù)編碼(arithmetic coding)低得多。
符號(hào)值編碼或早于或遲于量化樣本的絕對(duì)值。首先對(duì)符號(hào)值編碼可能導(dǎo)致首先對(duì)較少(重要性)信息編碼。在本實(shí)施例中,符號(hào)值的編碼較后。理由如下。即,從MSB到LSB的順序來(lái)看,如果只對(duì)在1首先到來(lái)以前出現(xiàn)的比特編碼,量化樣本被認(rèn)為是零,它的符號(hào)值沒(méi)有意義。例如,假設(shè)量化樣本是5位二進(jìn)制數(shù)字00011,在5位之中只有3個(gè)最高有效比特被編碼,當(dāng)解碼進(jìn)行的時(shí)候,它們被重構(gòu)為00000。因此,在這種情況下,即使量化樣本具有一個(gè)符號(hào)值,符號(hào)值信息也是無(wú)意義的。不過(guò),如果4個(gè)最高有效比特被編碼,量化樣本被認(rèn)為是00010,并重構(gòu)為00010。在這種情況下,符號(hào)值就具有重要的意義。因此,當(dāng)在1(而不是0)首先到來(lái)的情況下對(duì)MSB形成的量化樣本進(jìn)行編碼時(shí),有關(guān)對(duì)應(yīng)量化樣本是正值還是負(fù)值的信息,即符號(hào)值先于對(duì)其它值的編碼而首先被編碼。MSB構(gòu)成的向量1010首先被編碼,然后確定符號(hào)值的編碼是否需要。從作為4個(gè)量化樣本的MSB組的1010,可以確定在第一和第三量化樣本中是1而不是0首先被編碼。因此,第一和第三量化樣本的符號(hào)值被編碼。接著,次有效比特組被編碼。用同一方式,1首先到來(lái)的量化樣本的符號(hào)值被編碼。用同一方式,進(jìn)行編碼直到LSB。
這樣形成的比特流的解碼是以編碼的相反順序進(jìn)行的。形成比特流的幀的首部被解碼,然后,基層的附加信息被解碼。更具體地,基層的附加信息,即編碼模型信息和定標(biāo)因子信息被解碼。根據(jù)所得到的編碼模型信息和定標(biāo)因子信息,編碼的量化樣本從MSB到LSB和從低頻到高頻依次被解碼。
現(xiàn)在通過(guò)舉例詳細(xì)解釋。
0100
000000000001在上述比特平面中,0出現(xiàn)的概率大于1出現(xiàn)的概率,編碼能以較小的比特?cái)?shù)進(jìn)行。在作為無(wú)損編碼的可選方案的Arithmetic編碼的情況下,為了對(duì)0進(jìn)行編碼,至少一個(gè)比特是需要的。使用算術(shù)編碼允許僅通過(guò)分配小于1的比特?cái)?shù)進(jìn)行編碼,由此實(shí)現(xiàn)至少1位編碼,即,二進(jìn)制編碼。因此,更精細(xì)的分層結(jié)構(gòu)可以形成。
算術(shù)編碼的編碼模型可以根據(jù)上級(jí)向量和當(dāng)前編碼的向量的在前向量進(jìn)行選擇。下面的例子示出本發(fā)明的比特平面的算術(shù)編碼0110001101011000其中比特切片被執(zhí)行,例如,每4個(gè)比特按照從MSB到LSB的順序相連,獲得第一向量0110,第二向量0011,第三向量0101和第4向量1000。在向量被逐位算術(shù)編碼的時(shí)候,第二向量的用于對(duì)第三位1進(jìn)行編碼的編碼模型是根據(jù)最上面的向量,即第一向量0110,和當(dāng)前正編碼的向量的前面的位00選擇的。選擇編碼模型意味著選擇要被用作0/1的算術(shù)編碼信息的0的出現(xiàn)概率。
為了控制比特率,即為了應(yīng)用可伸縮性,考慮到容許被用于每層的比特?cái)?shù),對(duì)應(yīng)于一幀的比特流被切斷,從而僅利用少量的數(shù)據(jù)就可以解碼。例如,在最高比特率是96kbps并且比特流大小是2096比特的情況下,如果僅有對(duì)應(yīng)于48kbps的比特流希望被解碼,則僅有比特流的1048比特被使用,從而對(duì)應(yīng)于48kbps的解碼音頻數(shù)據(jù)可以被獲得。
現(xiàn)在解釋根據(jù)上述結(jié)構(gòu)的本發(fā)明的編碼和解碼方法。
編碼裝置讀取PCM音頻數(shù)據(jù),在存儲(chǔ)器中存儲(chǔ)數(shù)據(jù)(未顯示),并且通過(guò)音質(zhì)建模從存儲(chǔ)的PCM音頻數(shù)據(jù)中獲得屏蔽門限和附加信息。由于PCM音頻數(shù)據(jù)是時(shí)域信號(hào),PCM音頻數(shù)據(jù)被子波變換成頻域信號(hào)。接著,編碼裝置根據(jù)量化段信息和量化因子信息通過(guò)量化子波變換的信號(hào)來(lái)獲得量化樣本。如上所述,量化樣本被比特切片,以K比特為單位被算術(shù)編碼并以分層結(jié)構(gòu)封裝。這里,K是一個(gè)大于或等于1的整數(shù)。
圖7是解釋本發(fā)明最佳實(shí)施例的編碼方法的流程圖。
在本實(shí)施例中,編碼裝置根據(jù)一個(gè)給定的目標(biāo)比特率和附加信息確定目標(biāo)層,并產(chǎn)生與每層對(duì)應(yīng)的信息。換言之,作為截止每一層的基礎(chǔ)的截止頻率,對(duì)應(yīng)于每層的量化段信息和編碼信息被獲得,并且根據(jù)要被編碼的數(shù)據(jù),每層中容許編碼的比特范圍被分配到每層。
參考圖7,PCM音頻數(shù)據(jù)的子波變換在步驟701中執(zhí)行。在步驟702,根據(jù)子波變換數(shù)據(jù)所屬的編碼段的量化步長(zhǎng)進(jìn)行量化。在步驟703,當(dāng)前層被設(shè)定為基層。在步驟704,包括對(duì)應(yīng)于基層的定標(biāo)因子信息和算術(shù)編碼模型信息的附加信息被編碼。
然后,在步驟705,多個(gè)對(duì)應(yīng)于基層的量化樣本通過(guò)比特切片被映射到比特平面,并以K比特為單位進(jìn)行算術(shù)編碼(K≥1),順序是從msb到lsb和從低頻到高頻。編碼比特?cái)?shù)被計(jì)數(shù),如果在步驟706,這個(gè)數(shù)超過(guò)當(dāng)前層的比特范圍,則當(dāng)前層中的編碼被停止,并且開(kāi)始下一層中的編碼。如果所計(jì)數(shù)的比特?cái)?shù)超過(guò)706步驟中的比特范圍,此過(guò)程在步驟707經(jīng)步驟708和709返回到步驟705,以處理下一層。因?yàn)榛鶎硬痪哂懈偷膶樱襟E707不執(zhí)行,但是,如果所計(jì)數(shù)的比特?cái)?shù)不超過(guò)步驟706的比特范圍,則步驟707執(zhí)行。通過(guò)上述步驟,直到達(dá)到目標(biāo)層的所有層都被編碼為止。
圖8是解釋本發(fā)明的最佳實(shí)施例的解碼方法的流程圖。
參考圖8,解碼裝置接收由以分層結(jié)構(gòu)編碼的音頻數(shù)據(jù)形成的比特流,并對(duì)每一幀中的首部信息進(jìn)行解碼。然后在步驟801中,對(duì)包括對(duì)應(yīng)于第一層的定標(biāo)因子信息和算術(shù)編碼模型信息的附加信息進(jìn)行解碼。參考算術(shù)編碼模型信息,在步驟802,量化樣本通過(guò)以K比特為單位從MSB到LSB對(duì)比特流進(jìn)行算術(shù)解碼而獲得。這里,K是大于或等于1的一個(gè)整數(shù)。在步驟803,通過(guò)參考定標(biāo)因子信息,所獲得的量化樣本被反量化。在步驟804,反量化樣本被反子波變換。隨著每次逐1增加每層的序數(shù),步驟801到804重復(fù)執(zhí)行,直到多達(dá)預(yù)定目標(biāo)層的解碼完成為止。
圖9是解釋本發(fā)明的另一最佳實(shí)施的解碼方法的流程圖。
參看圖9,接收由以分層結(jié)構(gòu)編碼的音頻數(shù)據(jù)形成的比特流,根據(jù)每幀中的首部信息解碼相應(yīng)于每層的截止頻率,通過(guò)解碼從首部信息識(shí)別相應(yīng)于每層的量化段信息和編碼段信息,并且每層的允許使用比特范圍被識(shí)別。
在步驟901,層索引被設(shè)定為基層。在步驟902,有關(guān)基層的附加信息被解碼,在步驟903,通過(guò)從MSB到LSB和從低頻到高頻以K比特為單位依次把比特流解碼到每層中容許的比特范圍中而獲得量化樣本。這里,K是大于或等于1的一個(gè)整數(shù)。在步驟904,檢查一層是否是最后一層。在步驟905,隨著層數(shù)逐一增加,在各層中重復(fù)執(zhí)行步驟902和903直到預(yù)定的目標(biāo)層達(dá)到??蛇x地,解碼裝置可事先具有截止頻率、量化段信息、編碼段信息和比特范圍中的至少一個(gè),而不是從所接收的比特流的每一幀中存儲(chǔ)的首部信息中獲得這些信息。
按照上述的本發(fā)明,提供了對(duì)音頻數(shù)據(jù)進(jìn)行可伸縮編碼/解碼的方法和裝置,其復(fù)雜性較低,同時(shí)提供了精細(xì)粒度的可伸縮性(FGS)。換言之,按照本發(fā)明,更高質(zhì)量FGS可以通過(guò)使用算術(shù)編碼而以較少量的數(shù)據(jù)提供,并且更好的音頻質(zhì)量通過(guò)利用子波變換形成類似于人耳傳遞函數(shù)的頻率分辨率也能提供,即使在低層中。
權(quán)利要求
1.一種對(duì)音頻數(shù)據(jù)進(jìn)行可伸縮編碼的方法,包括對(duì)附加信息進(jìn)行編碼,附加信息包含對(duì)應(yīng)于第一層的定標(biāo)因子信息和編碼模型信息;通過(guò)參考編碼模型信息按照從MSB到LSB和從低頻到高頻的順序以K比特為單位對(duì)與第一層對(duì)應(yīng)的多個(gè)量化樣本進(jìn)行算術(shù)編碼,其中K是大于或等于1的一個(gè)整數(shù);通過(guò)每次使層的序數(shù)加1重復(fù)執(zhí)行各步驟,直到多層的編碼被完成。
2.一種編碼方法,包括對(duì)音頻數(shù)據(jù)切片,使得切片的音頻數(shù)據(jù)與多個(gè)層對(duì)應(yīng);獲得與多層的每一層對(duì)應(yīng)的定標(biāo)段信息和編碼段信息;根據(jù)對(duì)應(yīng)于第一層的定標(biāo)段信息和編碼段信息對(duì)包含定標(biāo)因子信息和編碼模型信息的附加信息進(jìn)行編碼;通過(guò)參考定標(biāo)因子信息對(duì)與第一層對(duì)應(yīng)的音頻數(shù)據(jù)進(jìn)行量化而獲得量化樣本;通過(guò)參考編碼模型信息,按照從MSB到LSB和從低頻到高頻的順序以K比特為單位對(duì)所獲得的多個(gè)量化樣本進(jìn)行算術(shù)編碼,其中K是大于或等于1的一個(gè)整數(shù);和通過(guò)每次使層的序數(shù)加1重復(fù)執(zhí)行這些步驟,直到多層的編碼被完成。
3.根據(jù)權(quán)利要求2的方法,其中在算術(shù)編碼中,參考編碼模型信息,所獲得的多個(gè)量化樣本被算術(shù)編碼,使得MSB按照從低頻到高頻的順序以K比特為單位首先被算術(shù)編碼,接著次最高有效位按照從低頻到高頻的順序以K比特為單位被算術(shù)編碼,最后LSB以K比特為單位按照從低頻到高頻的順序被算術(shù)編碼。
4.根據(jù)權(quán)利要求2的方法,還包括,在對(duì)附加信息進(jìn)行編碼以前,獲得多層的每一層中可用的比特范圍,其中在所獲得的多個(gè)量化樣本的算術(shù)編碼中,編碼比特?cái)?shù)被計(jì)數(shù),如果所計(jì)數(shù)的比特?cái)?shù)超過(guò)對(duì)應(yīng)于這些比特的比特范圍,編碼就停止,如果即使在量化樣本全部被編碼以后所計(jì)數(shù)的比特?cái)?shù)少于對(duì)應(yīng)于這些比特的比特范圍,在低層的編碼完成后仍未被編碼的比特被編碼到比特范圍容許的范圍。
5.根據(jù)權(quán)利要求2的方法,其中音頻數(shù)據(jù)的切片包括進(jìn)行音頻數(shù)據(jù)的子波變換;和通過(guò)參考截止頻率對(duì)子波變換數(shù)據(jù)進(jìn)行切片,從而使切片數(shù)據(jù)與多個(gè)層對(duì)應(yīng)。
6.根據(jù)權(quán)利要求2的方法,其中附加信息的編碼包括對(duì)定標(biāo)因子信息和編碼模型信息的差分編碼。
7.根據(jù)權(quán)利要求2的方法,其中算術(shù)編碼包括把多個(gè)量化樣本映射到比特平面上;和按照從MSB到LSB和從低頻到高頻的順序在對(duì)應(yīng)于樣本的層中所容許的比特范圍內(nèi)以K比特為單位對(duì)樣本進(jìn)行算術(shù)編碼。
8.一種對(duì)以分層結(jié)構(gòu)編碼的音頻數(shù)據(jù)進(jìn)行可伸縮解碼的方法,包括對(duì)包含對(duì)應(yīng)于第一層的定標(biāo)因子信息和編碼模型信息的附加信息進(jìn)行解碼;通過(guò)參考編碼模型信息,以K比特為單位按照從MSB到LSB和從低頻到高頻的順序?qū)σ纛l數(shù)據(jù)進(jìn)行算術(shù)解碼,并獲得量化樣本,其中K是一個(gè)大于或等于1的整數(shù);通過(guò)參考定標(biāo)因子信息對(duì)所獲得的量化樣本進(jìn)行反量化;對(duì)反量化樣本進(jìn)行反子波變換;和通過(guò)每次使層的序數(shù)加1,重復(fù)執(zhí)行這些步驟,直到預(yù)定的多個(gè)層的解碼完成。
9.根據(jù)權(quán)利要求8的方法,其中對(duì)附加信息進(jìn)行的解碼包括對(duì)定標(biāo)因子信息和編碼模型信息的差分解碼。
10.根據(jù)權(quán)利要求8的方法,其中音頻數(shù)據(jù)的算術(shù)解碼包括按照從MSB到LSB和從低頻到高頻的順序?qū)σ纛l數(shù)據(jù)進(jìn)行解碼;從解碼的比特獲得量化樣本。
11.根據(jù)權(quán)利要求10的方法,其中進(jìn)行音頻數(shù)據(jù)的解碼,使得首先MSB以K比特為單位按照從低頻到高頻的順序被算術(shù)解碼,接著次最高有效位以K比特為單位按照從低頻到高頻的順序被算術(shù)解碼,最后LSB以K比特為單位按照從低頻到高頻的順序被解碼。
12.一種對(duì)以分層結(jié)構(gòu)編碼的音頻數(shù)據(jù)進(jìn)行可伸縮解碼的裝置,包括解封單元,它對(duì)包含對(duì)應(yīng)于第一層的定標(biāo)因子信息和編碼模型信息的附加信息進(jìn)行解碼,并通過(guò)參考編碼模型信息,以K比特為單位按照從MSB到LSB和從低頻到高頻的順序?qū)σ纛l數(shù)據(jù)進(jìn)行解碼,并獲得量化樣本,其中K是一個(gè)大于或等于1的整數(shù);反量化單元,它通過(guò)參考定標(biāo)因子信息對(duì)所獲得的量化樣本進(jìn)行反量化;和反變換單元,它對(duì)反量化樣本執(zhí)行反子波變換。
13.根據(jù)權(quán)利要求12的裝置,其中解封單元對(duì)定標(biāo)因子信息和編碼模型信息進(jìn)行差分解碼。
14.根據(jù)權(quán)利要求12的裝置,其中解封單元以K比特為單位按照從MSB到LSB和從低頻到高頻的順序在對(duì)應(yīng)層中所容許的比特范圍內(nèi)對(duì)音頻數(shù)據(jù)進(jìn)行解碼,并從在其上安排解碼比特的比特平面獲得量化樣本。
15.根據(jù)權(quán)利要求14的裝置,其中解封單元進(jìn)行算術(shù)解碼,使得MSB首先以K比特為單位按照從低頻到高頻的順序被算術(shù)解碼,接著次最高有效位以K比特為單位按照從低頻到高頻的順序被算術(shù)解碼,最后LSB以K比特為單位按照從低頻到高頻的順序被算術(shù)解碼。
16.一種對(duì)音頻數(shù)據(jù)進(jìn)行可伸縮編碼的裝置,包括變換單元,它對(duì)音頻數(shù)據(jù)進(jìn)行子波變換;量化單元,它通過(guò)參考定標(biāo)因子信息對(duì)與每層對(duì)應(yīng)的子波變換音頻數(shù)據(jù)進(jìn)行量化,并輸出量化樣本;和封裝單元,它對(duì)包含對(duì)應(yīng)于每層的定標(biāo)因子信息和編碼模型信息的附加信息進(jìn)行編碼,并通過(guò)參考編碼模型信息,以K比特為單位按照從MSB到LSB和從低頻到高頻的順序,對(duì)來(lái)自量化單元的多個(gè)量化樣本進(jìn)行算術(shù)編碼,其中K是一個(gè)大于或等于1的整數(shù)。
17.根據(jù)權(quán)利要求16的裝置,其中封裝單元獲得對(duì)應(yīng)于多個(gè)層的每一層的定標(biāo)段信息和編碼段信息,并根據(jù)對(duì)應(yīng)于每層的定標(biāo)段信息和編碼段信息對(duì)包含定標(biāo)因子信息和編碼模型信息的附加信息進(jìn)行編碼。
18.根據(jù)權(quán)利要求17的裝置,其中封裝單元計(jì)數(shù)編碼比特?cái)?shù),如果所計(jì)數(shù)的比特?cái)?shù)超過(guò)對(duì)應(yīng)于該比特的比特范圍,就停止編碼,如果即使在量化樣本全都被編碼以后所計(jì)數(shù)的比特?cái)?shù)小于對(duì)應(yīng)于該比特的比特范圍,則將低層中編碼完成以后仍未被編碼的比特編碼到該比特范圍容許的范圍。
19.根據(jù)權(quán)利要求16的裝置,其中封裝單元對(duì)定標(biāo)因子信息和編碼模型信息進(jìn)行差分編碼。
20.根據(jù)權(quán)利要求16的裝置,其中封裝單元把多個(gè)量化樣本映射到一個(gè)比特平面,并以K比特為單位按照從MSB到LSB和從低頻到高頻的順序在與樣本對(duì)應(yīng)的層中所容許的比特范圍內(nèi)對(duì)樣本進(jìn)行算術(shù)編碼。
全文摘要
對(duì)音頻數(shù)據(jù)進(jìn)行可伸縮編碼/解碼的方法和裝置。對(duì)音頻數(shù)據(jù)進(jìn)行可伸縮編碼的方法包括,對(duì)包含與第一層對(duì)應(yīng)的定標(biāo)因子信息和編碼模型信息的附加信息進(jìn)行編碼,通過(guò)參考編碼模型信息,以K比特為單位按照從MSB到LSB和從低頻到高頻的順序?qū)εc第一層對(duì)應(yīng)的多個(gè)量化樣本進(jìn)行算術(shù)編碼,其中K是大于或等于1的一個(gè)整數(shù),并且通過(guò)每次使層的序數(shù)加1,重復(fù)進(jìn)行這些步驟,直到多層的編碼被完成。按照這個(gè)方法,精細(xì)粒度可伸縮性(FGS)可以具有低的復(fù)雜性,即使在低層也可以獲得較好的音頻質(zhì)量。
文檔編號(hào)G10L19/00GK1527282SQ0316503
公開(kāi)日2004年9月8日 申請(qǐng)日期2003年9月17日 優(yōu)先權(quán)日2003年1月2日
發(fā)明者金重會(huì), 金尚煜, 吳殷美 申請(qǐng)人:三星電子株式會(huì)社