專利名稱:編碼和解碼音頻信號的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種編碼和解碼音頻信號的方法。
背景技術(shù):
最近,在研究和開發(fā)數(shù)字音頻信號的各種編碼方案和方法方面投入了大量的 精力并生產(chǎn)出與各種編碼方案和方法相關(guān)聯(lián)的產(chǎn)品。
另外,用多聲道音頻信號的空間信息將單聲或立體聲音頻信號轉(zhuǎn)換成多聲道 音頻信號的編碼方案己被研發(fā)。
然而,在將音頻信號存入某些記錄介質(zhì)的情形下,用于存儲空間信息的輔助 數(shù)據(jù)區(qū)是不存在的。因此,在這種情形下,由于存儲或發(fā)送單聲或立體聲音頻信號, 因此僅再現(xiàn)單聲或立體聲音頻信號。因此,音質(zhì)是單調(diào)的。
此外,在獨(dú)立存儲或發(fā)送空間信息的情形下,存在與一般單聲或立體聲音頻 信號的播放機(jī)兼容的問題。
發(fā)明內(nèi)容
因此,本發(fā)明針對一種能本質(zhì)上規(guī)避由現(xiàn)有技術(shù)的限制和缺點(diǎn)造成的一個或 多個問題的編碼和解碼音頻信號的裝置及其方法。
本發(fā)明的目的在于提供一種編碼和解碼音頻信號的裝置及其方法,藉此可在 編碼音頻信號中提供與一般單聲或立體聲音頻信號的播放器的兼容。
本發(fā)明的另一目的是提供一種編碼和解碼音頻信號的裝置及其方法,藉此可 存儲或發(fā)送多聲道音頻信號的空間信息而不需要輔助數(shù)據(jù)區(qū)。
本發(fā)明的其它特征和優(yōu)點(diǎn)將在說明書中作如下描述,并且部分內(nèi)容可從說明 書中得出,或通過本發(fā)明的實踐獲知。本發(fā)明的目的和其它優(yōu)點(diǎn)可通過說明書及其 權(quán)利要求書和附圖中具體指出的結(jié)構(gòu)實現(xiàn)和達(dá)成。
為了實現(xiàn)這些和其它的優(yōu)點(diǎn)并根據(jù)本發(fā)明的目的,根據(jù)本發(fā)明的解碼音頻信 號的方法包括步驟如下抽出嵌入于音頻信號分量中的不可識別分量中的輔助信息
(side information)并使用所抽取的輔助信息解碼音頻信號。
為了進(jìn)一步實現(xiàn)這些和其它的優(yōu)點(diǎn)并根據(jù)本發(fā)明的目的,根據(jù)本發(fā)明的編碼 音頻信號的方法包括步驟生成解碼音頻信號必需的輔助信息并將所生成的輔助信 息嵌入到音頻信號的不可識別分量中。
為了進(jìn)一步實現(xiàn)這些和其它的優(yōu)點(diǎn)并根據(jù)本發(fā)明的目的,根據(jù)本發(fā)明的數(shù)據(jù) 結(jié)構(gòu)包括音頻信號和嵌入在音頻信號的不可識別分量中的輔助信息。
為了進(jìn)一步實現(xiàn)這些和其它的優(yōu)點(diǎn)并根據(jù)本發(fā)明的目的,根據(jù)本發(fā)明的編碼 音頻信號的裝置包括評估音頻信號的輔助信息的輔助信息評估單元以及將輔助信 息嵌入音頻信號的不可識別分量中的嵌入單元。
為了進(jìn)一步實現(xiàn)這些和其它的優(yōu)點(diǎn)并根據(jù)本發(fā)明的目的,根據(jù)本發(fā)明的解碼 音頻信號的裝置包括嵌入信號解碼單元,用來抽出嵌入在音頻信號的不可識別分 量中的輔助信息位流;輔助信息解碼單元,它通過解碼輔助信息位流生成輔助信息; 以及多聲道形成單元,它使用輔助信息解碼音頻信號。
應(yīng)當(dāng)理解前面的一般說明和后面的詳細(xì)說明是示例性和闡述性的,并且旨在 如權(quán)利要求所述那樣提供對本發(fā)明進(jìn)一步的說明。
包括于此以提供對本發(fā)明的進(jìn)一步理解、并被結(jié)合在本申請中且構(gòu)成其一部 分的附圖示出本發(fā)明的實施例,并與說明書一起用來解釋本發(fā)明的原理。 在附圖中
圖l是根據(jù)本發(fā)明的、解釋人們識別音頻信號的空間信息的方法的圖; 圖2是根據(jù)本發(fā)明的空間編碼器的方框圖3是根據(jù)本發(fā)明的、構(gòu)成圖2所示空間編碼器的嵌入單元的詳細(xì)方框圖4是根據(jù)本發(fā)明的、重新配置空間信息位流的第一方法的圖5是根據(jù)本發(fā)明的、重新配置空間信息位流的第二方法的圖6A是根據(jù)本發(fā)明的重新構(gòu)形的空間信息位流的圖6B是圖6A所示的空間信息位流的結(jié)構(gòu)的詳圖7是根據(jù)本發(fā)明的空間解碼器的方框圖8是根據(jù)本發(fā)明的、包含在空間解碼器中的嵌入信號解碼器的詳細(xì)方框圖; 圖9是根據(jù)本發(fā)明的、示出一般PCM解碼器再現(xiàn)音頻信號的情形的圖; 圖10是根據(jù)本發(fā)明的、在向下混頻信號中嵌入空間信息的編碼方法的流程圖11是根據(jù)本發(fā)明的、對嵌入到向下混頻信號中的空間信息進(jìn)行解碼的方法 的流程圖12是根據(jù)本發(fā)明的、嵌入到向下混頻信號中的空間信息位流的幀尺寸的圖; 圖13是根據(jù)本發(fā)明的、在向下混頻信號中以固定尺寸嵌入的空間信息位流的
圖14A是解釋解決以固定尺寸嵌入的空間信息位流的時間對準(zhǔn)問題的第一方 法的圖14B是解釋解決以固定尺寸嵌入的空間信息位流的時間對準(zhǔn)問題的第二方 法的圖15是根據(jù)本發(fā)明的、將空間信息位流附加至向下混頻信號的方法的圖16是根據(jù)本發(fā)明的、對向下混頻信號中以變化尺寸嵌入的空間信息位流進(jìn) 行編碼的方法的流程圖17是根據(jù)本發(fā)明的、對向下混頻信號中以固定尺寸嵌入的空間信息位流進(jìn) 行編碼的方法的流程圖18是根據(jù)本發(fā)明的、在至少一個聲道上向下混頻的音頻信號中嵌入空間信 息位流的第一方法的圖19是根據(jù)本發(fā)明的、在至少一個聲道上向下混頻的音頻信號中嵌入空間信 息位流的第二方法的圖20是根據(jù)本發(fā)明的、在至少一個聲道上向下混頻的音頻信號中嵌入空間信 息位流的第三方法的圖21是根據(jù)本發(fā)明的、在至少一個聲道上向下混頻的音頻信號中嵌入空間信 息位流的第四方法的圖22是根據(jù)本發(fā)明的、在至少一個聲道上向下混頻的音頻信號中嵌入空間信 息位流的第五方法的圖23是根據(jù)本發(fā)明的、在至少一個聲道上向下混頻的音頻信號中嵌入空間信 息位流的第六方法的圖24是根據(jù)本發(fā)明的、在至少一個聲道上向下混頻的音頻信號中嵌入空間信 息位流的第七方法的圖25是根據(jù)本發(fā)明的、對將要嵌入到在至少一個聲道上向下混頻的音頻信號 中的空間信息位流進(jìn)行編碼的方法的流程圖26是根據(jù)本發(fā)明的、對嵌入到在至少一個聲道上向下混頻的音頻信號中的
空間信息位流進(jìn)行解碼的方法的流程圖;
具體實施例方式
下面詳細(xì)參照本發(fā)明的較佳實施例,其實例示出于附圖中。
首先,本發(fā)明涉及一種在音頻信號中嵌入解碼該音頻信號所必需的輔助信息 的裝置及其方法。為便于說明,音頻信號和輔助信息在下面的說明中分別被稱為向 下混頻信號和空間信息,這不構(gòu)成對本發(fā)明的限制。在這種情形下,音頻信號包括 PCM信號。
圖l是根據(jù)本發(fā)明的、解釋人們識別音頻信號的空間信息的方法的圖。 參照圖1,基于人們能夠三維地識別音頻信號的事實,多聲道音頻信號的編碼 方案使用音頻信號可通過多種參數(shù)設(shè)定而表示成三維空間信息這一事實。
表示多聲道音頻信號的空間信息的空間參數(shù)包括CLD (聲道能級差)、ICC (聲道間相干)、CTD (聲道時間差)等。CLD表示兩聲道之間的能量差,ICC 表示兩聲道之間的相關(guān)性,而CTD表示兩聲道之間的時間差。
下面結(jié)合圖1解釋人們?nèi)绾慰臻g地識別音頻信號以及空間參數(shù)的概念是如何 形成的。
直達(dá)聲波103從遠(yuǎn)端聲源101到達(dá)人左耳,而另一直達(dá)聲波102在頭部周圍 衍射以到達(dá)人的右耳106。
兩個聲波102和103到達(dá)時間和能級彼此不同。另夕卜,CTD和CLD參數(shù)是通 過使用這些差量產(chǎn)生的。
如果反射的聲波104、 105分別到達(dá)雙耳或者如果聲源是分散的,則兩者間不 具有相關(guān)性的聲波將分別到達(dá)雙耳以產(chǎn)生ICC參數(shù)。
使用如上面解釋的原則產(chǎn)生的空間參數(shù),能夠發(fā)送多聲道音頻信號作為單聲 或立體聲信號并輸出信號為多聲道信號。
本發(fā)明提供一種嵌入空間信息,即單聲或立體聲音頻信號中的空間參數(shù),發(fā) 送嵌入后的信號,并將所發(fā)送的信號再現(xiàn)為多聲道音頻信號的方法。本發(fā)明不僅限 于多聲道音頻信號。在本發(fā)明后面的說明中,對多聲道音頻信號進(jìn)行解釋以便于說 明。
圖2是根據(jù)本發(fā)明的編碼裝置的方框圖。
參照圖2,根據(jù)本發(fā)明的編碼裝置接收多聲道音頻信號201。在這種情形下, "n"指示輸入聲道號。
多聲道音頻信號201通過音頻信號生成單元203被轉(zhuǎn)換成向下混頻信號(Lo 和Ro) 205。向下混頻的信號包括單聲或立體聲音頻信號并且可以是多聲道音頻信 號。在本發(fā)明中,在后面的說明中以立體聲音頻信號為例進(jìn)行說明。然而,本發(fā)明 不局限于立體聲音頻信號。
多聲道音頻信號的空間信息,即通過輔助信息生成單元204從多聲道音頻信 號201生成空間參數(shù)。在本發(fā)明中,空間信息指用于發(fā)送通過向下混頻多聲道(例 如左、右、中、左環(huán)繞、右環(huán)繞等)信號產(chǎn)生的向下混頻信號205并將發(fā)送的向下 混頻信號再次向上混頻為多聲道音頻信號的音頻信號聲道的信息。作為選擇,向下 混頻信號205可用直接從外部提供的向下混頻信號生成,例如美聲向下混頻信號 202。
產(chǎn)生于輔助信息生成單元204中的空間信息通過輔助信息編碼單元206編碼 成空間信息位流以發(fā)送和存儲。
空間信息位流被適當(dāng)?shù)刂貥?gòu)以直接插入到音頻信號中,即由嵌入單元207發(fā) 送向下混頻信號205。如此可使用"數(shù)字音頻嵌入方法"。
例如,在向下混頻信號205是要被存儲在難以存儲空間信息于其中的存儲介 質(zhì)(如立體聲緊密盤)中或由SPDIF (Sony/Philips Digital Interface)發(fā)送的源 PCM音頻信號的情形下,與通過AAC等壓縮編碼的情形不同,用于存儲空間信息 的輔助數(shù)據(jù)字段不存在。
在這種情形下,如果使用"數(shù)字音頻嵌入方法",則空間信息能被嵌入到源 PCM音頻信號中而沒有音質(zhì)失真。另外,具有嵌入于其中的空間信息的音頻信號 就一般解碼器而言在源信號方面沒有區(qū)別。即,具有嵌入于其中的空間信息的輸出 信號Lo'/Ro'208就一般的PCM解碼器而言被認(rèn)為是與輸入信號Lo/Ro相同的信 號。
作為"數(shù)字音頻嵌入方法"存在"位替換編碼方法"、"回聲隱藏方法"、 "基于擴(kuò)頻的方法"等。
位替換編碼方法是通過修正量化的音頻采樣的低位而插入特定信息的方法。 在音頻信號中,低位的修正對音頻信號的質(zhì)量幾乎沒有影響。
回聲隱藏方法是將足夠小以致人耳無法聽到的回聲插入音頻信號的方法。
另外,基于擴(kuò)頻的方法是經(jīng)由離散余弦變換、離散傅立葉變換等將音頻信號 轉(zhuǎn)換至頻域,對特定二進(jìn)制信息執(zhí)行擴(kuò)頻以形成PN (偽噪聲)序列,并將其添加 至轉(zhuǎn)換至頻域的音頻信號。
在本發(fā)明中,在下面的說明中主要圍繞位替換編碼方法進(jìn)行說明。然而,本 發(fā)明不局限于位替換編碼方法。
圖3是根據(jù)本發(fā)明的、構(gòu)成圖2所示空間編碼器的嵌入單元的詳細(xì)方框圖。 參照圖3,在通過位替換編碼方法在向下混頻信號分量的不可理解分量中嵌入
空間信息的過程中,用于嵌入空間信息的插入位長度(下文中稱之為"K-值") 可根據(jù)預(yù)定的方法使用K位(k〉0)而不是僅使用低位的1位。K位可使用向下 混頻信號的低位但不僅限于低位。在這種情形下,預(yù)定的方法是根據(jù)音質(zhì)模型尋找 屏蔽閾值并根據(jù)例如屏蔽閾值分配合適的位。
如圖所示,向下混頻信號Lo/Ro301經(jīng)由嵌入單元中的緩存器303被傳送至音 頻信號編碼單元306。
屏蔽閾值計算單元304將輸入的音頻信號分成預(yù)定的若干段(例如塊)并隨 后尋找相應(yīng)段的屏蔽閾值。
屏蔽閾值計算單元304根據(jù)屏蔽閾值尋找向下混頻信號的插入位長度(即K 值),該插入位長度允許修正但不引起聽覺失真。即,對每個塊分配能夠?qū)⒖臻g信 息嵌入向下混頻信號的位數(shù)位數(shù)。
在本發(fā)明的說明中, 一個塊表示使用一個幀中存在的一個插入位長度(即K 值)插入的數(shù)據(jù)單元。
一個幀中可能存在至少一個或多個塊。如果幀長度是固定的,塊長度根據(jù)塊 數(shù)的增加而減少。
一旦確定K值,則能夠?qū)值納入空間信息位流。g卩,位流重構(gòu)單元305能 夠以允許空間信息位流中包含K值的方式重構(gòu)空間信息位流。在這種情形下,在 空間信息位流中可包括同步字、檢錯碼、糾錯碼等。
重構(gòu)空間信息位流可重新配置為可嵌入形式。重新配置的空間信息位流通過 音頻信號編碼單元306被嵌入到向下混頻信號中并隨后作為具有嵌入于其中的空 間信息位流的音頻信號LoVRo'307被輸出。在這種情形下,空間信息位流可被嵌 入到向下混頻信號的K位中。K值在一個塊中具有一固定值。在任何情形下,在 空間信息位流的重構(gòu)或重新配置過程中,K值被插入到空間信息位流中并隨后被傳 送至解碼裝置。另外,解碼裝置能使用K值抽出空間信息位流。
如前面說明中提到的那樣,空間信息位流經(jīng)歷被嵌入在每個塊的向下混頻信 號中的處理。所述處理由各種方法中的一種實現(xiàn)。
第一方法的實現(xiàn)方式為單純用0代替向下混頻信號的K個低位并添加重新配
置的空間信息位流數(shù)據(jù)。例如,如果K值為3,如果向下混頻信號的采樣數(shù)據(jù)是
11101101并且嵌入的空間信息位流數(shù)據(jù)為lll,則"11101101"的3個低位用0代 替并給出11101000。另外,空間信息位流數(shù)據(jù)"111"被添加至"11101000"以給 出"11101111"。
第二方法是使用抖動方法實現(xiàn)的。首先,重新配置的空間信息位流數(shù)據(jù)從向 下混頻信號的插入?yún)^(qū)減去。然后基于K值重新量化向下混頻的信號。另外,重新 配置的空間信息位流數(shù)據(jù)被加至重新量化的向下混頻信號。例如,如果K值為3, 如果向下混頻信號的采樣數(shù)據(jù)是11101101并且嵌入的空間信息位流數(shù)據(jù)為111, 則"11101101"減去"111"以給出11100110。隨后(通過圓整)重新量化3個低 位以提供"11101000"。另外,將"111"加至"11101000"以給出"11101111"。
由于嵌入到向下混頻信號中的空間信息位流是隨機(jī)位流,因此它可能不具有 白噪聲特征。由于白噪聲型信號添加至向下混頻信號對音質(zhì)特征是有利的,因此空 間信息位流經(jīng)歷白噪聲化處理以添加至向下混頻的信號。另外,白噪聲化處理適用 于除同步字以外的所有空間信息位流。
在本發(fā)明中,"白噪聲化"表示在頻域的所有區(qū)域形成有相同或近乎相同的 音頻信號音質(zhì)的隨機(jī)信號的處理。
此外,在向下混頻信號中嵌入空間信息位流中,通過將噪聲形成方法作用于 空間信息位流可最小化聽覺失真。
在本發(fā)明中,"噪聲形成方法"表示修改聲音特征以使通過量化產(chǎn)生的量化 噪聲的能量移動至高于可聽頻帶之上的高頻帶的處理或者根據(jù)從相應(yīng)音頻信號獲 得的屏蔽閾值產(chǎn)生時變?yōu)V波器并通過所產(chǎn)生的濾波器改變從量化產(chǎn)生的噪聲的特 征的處理。
圖4是根據(jù)本發(fā)明的、重新配置空間信息位流的第一方法的圖。 參照圖4,如前面說明所提到的那樣,空間信息位流用K值被重新配置成可 嵌入形式。在這種情形下,空間信息位流通過以各種方法重新配置而被嵌入到向下 混頻信號中。另外,圖4示出在采樣平面次序(plane order)中嵌入空間信息的方 法。
第一方法以如下方法重新配置空間信息位流通過K位單元分散相應(yīng)塊的空 間信息位流并按次序嵌入分散的空間信息位流。
如果K值為4并且如果一個塊405被構(gòu)造以N個采樣403,則空間信息位流 401可被重新配置以按次序嵌入每個采樣的4個低位中。
如前面說明所提到的那樣,本發(fā)明不局限于在每個采樣的4個低位中嵌入空 間信息位流的情形。
此外,在每個采樣的K個低位中,如圖所示,空間信息位流被首先嵌入到MSB (最高有效位)或首先嵌入到LSB (最低有效位)。
在圖4中,箭頭404表示嵌入方向并且括號中的數(shù)字表示數(shù)據(jù)重新配置序列。 位平面表示以多個位構(gòu)成的特定位層。
在要被嵌入的空間信息位流的位數(shù)小于其中將要嵌入空間信息位流的插入?yún)^(qū) 中的可嵌入位數(shù)的情形下,剩余位以零406填充,隨機(jī)信號插入剩余位中,或者用 原始向下混頻信號代替剩下的位。
例如,如果構(gòu)成一個塊的采樣數(shù)(N)為100并且K值為4,則嵌入到塊中的 位數(shù)(W)是W=N*K= 100*4 = 400。
如果要被嵌入的空間信息位流的位數(shù)(V)為390位(即V<W),則用0填 充IO個位,在剩下的IO個位中插入隨機(jī)信號,或用原始向下混頻信號代替剩下的 IO個位,剩下的IO個位用指示數(shù)據(jù)尾端的尾序列填充,或者以它們的組合填充剩 下的10個位。尾序列表示指示相應(yīng)塊中的空間信息位流的尾部的位序列。盡管圖 4示出對每個塊填充剩余位的情形,然而本發(fā)明包括以上述方式對每個插入幀填充 剩余位的情形。
圖5是根據(jù)本發(fā)明的重新配置空間信息位流的第二方法的圖。 參照圖5,第二方法的實現(xiàn)方式為重新配置在位平面502次序中的空間信息位 流501。在這種情形下,空間信息位流從每個塊的下混頻信號的低位開始按次序被 嵌入,但這并不構(gòu)成對本發(fā)明的限制。
例如,如果構(gòu)成塊的采樣數(shù)(N)為100并且如果K值為4,則構(gòu)成位平面-0 502的100個最低有效位被優(yōu)先填充并且構(gòu)成位平面-1 502的100個位被填充。 在圖5中,箭頭505指嵌入方向并且括號內(nèi)的數(shù)字指數(shù)據(jù)重新配置序號。 第二方法在隨機(jī)位置抽取同步字方面尤為有利。在從重新配置和編碼的信號 中搜索插入的空間信息位流的同步字的過程中,僅抽取LSB以搜索同步字。
另外,第二方法可望根據(jù)要被嵌入的空間信息位流的位數(shù)(V)僅使用最少的 LSB。在這種情形下,如果要被嵌入的空間信息位流的位數(shù)(V)小于其中將要嵌 入空間信息位流的插入?yún)^(qū)中的可嵌入位數(shù)(W),則用零506填充剩下的位,在剩 下位中插入隨機(jī)信號,用原始向下混頻信號代替剩下的位,剩下位被填充以指示數(shù) 據(jù)尾端的尾位序列,或者以它們的組合填充剩下的位。尤其,使用向下混頻信號的
方法是優(yōu)選的。盡管圖5示出對每個塊填充剩余位的實例,然而本發(fā)明包括以上述 方式對每個插入幀填充剩余位的情形。
圖6A示出根據(jù)本發(fā)明的、將空間信息位流嵌入向下混頻信號的位流結(jié)構(gòu)。
參照圖6A,空間信息位流607可由位流重構(gòu)單元305重新配置以包括空間信 息位流的同步字603和K值604。
另外,在重構(gòu)過程中可在重構(gòu)的空間信息位流中包括至少一個檢錯碼606或 糾錯碼608 (此后將說明檢錯碼)。檢錯碼能夠確定空間信息位流607在發(fā)送或存 儲過程中是否失真。
檢錯碼包括CRC (循環(huán)冗余校驗)??赏ㄟ^分成兩級來包含檢錯碼。具有K 值的頭部601的檢錯碼-1和空間信息位流的幀數(shù)據(jù)602的檢錯碼-2可單獨(dú)地包含 在空間信息位流中。此外,其余信息605可單獨(dú)地包含在空間信息位流中。另外, 空間信息位流的重新配置方法的信息等被包含在其余信息605中。
圖6B是圖6A中示出的空間信息位流的結(jié)構(gòu)的詳圖。圖6B示出一個實施例, 其中空間信息位流601的一個幀不構(gòu)成對本發(fā)明限制地包括兩個塊。
參照圖6B,圖6B所示的空間信息位流包括同步字612、 K值(Kl、 K2、 K3、 K4) 613-616、其余信息617以及檢錯碼618、 623。
空間信息位流610包括一對塊。在立體聲信號的情形下,塊-1可分別由左、 右聲道的塊619和620構(gòu)成。另外,塊-2可分別由左、右聲道的塊621和622構(gòu) 成。
盡管圖6B示出立體聲信號,然而本發(fā)明不局限于立體聲信號。 塊的插入位長度(K值)被包含在頭部中。
Kl 613指塊-1的左聲道的插入位長度。K2 614指塊-1的右聲道的插入位長度。 K3 615指示塊-2的左聲道的插入位長度。另外,K4 616指示塊-2的右聲道的插入
位尺寸。
另外,檢錯碼通過分成兩級被包含。例如,其中含K值的頭部609的檢錯碼 -1618以及空間信息位流的幀數(shù)據(jù)611的檢錯碼-2被單獨(dú)包含。 圖7是根據(jù)本發(fā)明的解碼裝置的方框圖。
參照圖7,根據(jù)本發(fā)明的解碼裝置接收其中嵌入空間信息位流的音頻信號 Lo,/Ro' 701。
其中嵌入有空間信息位流的音頻信號可以是單聲、立體聲和多聲道信號中的 一種。為便于說明,在本發(fā)明中以立體聲信號為例,但這不構(gòu)成對本發(fā)明的限制。嵌入信號解碼單元702能夠從音頻信號701抽取空間信息位流。 由嵌入信號解碼單元702抽取的空間信息位流是編碼的空間信息位流。另外,
編碼的空間信息位流可以是至空間信息解碼單元703的輸入信號。
空間信息解碼單元703對編碼的空間信息位流進(jìn)行解碼并隨后將已解碼空間
信息位流輸出至多聲道形成單元704。
多聲道形成單元704接收作為輸入的向下混頻信號701和通過解碼獲得的空
間信息并隨后將接收的輸入作為多聲道音頻信號705輸出。
圖8是根據(jù)本發(fā)明的構(gòu)成解碼裝置的嵌入信號解碼單元702的詳細(xì)方框圖。 參照圖8,其中嵌入空間信息的音頻信號LoVRo'被輸入到嵌入信號解碼單元
702。另外,同步字搜索單元802從音頻信號801檢測同步字。在這種情形下,同
步字可從音頻信號的一個聲道被檢測出。
在已檢測到同步字后,頭部解碼單元803解碼頭部區(qū)。在這種情形下,預(yù)定 長度的信息從頭部區(qū)被抽取并且數(shù)據(jù)逆修正單元804能夠?qū)⒛姘自肼暬桨笐?yīng)用 于頭部區(qū)信息,除了來自抽取的信息的同步字。
接著,可從逆白噪聲化方案作用于其的頭部區(qū)信息獲得頭部區(qū)的長度信息等。 另外,數(shù)據(jù)逆修正單元804能將逆白噪聲化方案應(yīng)用于剩余的空間信息位流。 諸如K值等的信息可通過頭部解碼獲得。原始空間信息位流可通過使用諸如K值 等信息對已重新配置的空間信息位流進(jìn)行再次配置而獲得。另外,可獲得配置向下 混頻信號的幀和空間信息位流的同步位置信息,即幀配置信息806。
圖9是根據(jù)本發(fā)明的、示出一般PCM解碼裝置再現(xiàn)音頻信號的情形的圖。 參照圖9,其中嵌入空間信息位流的音頻信號LoVRo,作為一般PCM解碼裝置 的輸入。
一般PCM解碼裝置將其中嵌入空間信息位流的音頻信號LoVRo,識別為普通 立體聲音頻信號以再現(xiàn)聲音。另外,再現(xiàn)的聲音在空間信息嵌入前就音質(zhì)而言與音 頻信號902沒有區(qū)別。
因此,根據(jù)本發(fā)明的其中嵌入空間信息的音頻信號兼容于一般PCM解碼裝置 中的立體聲信號的正常再現(xiàn)并且其優(yōu)點(diǎn)在于在能夠多聲道解碼的解碼裝置中提供 多聲道音頻信號。
圖10是根據(jù)本發(fā)明的、在向下混頻信號中嵌入空間信息的編碼方法的流程圖。 參照圖10,音頻信號從多聲道信號開始被向下混頻(1001、 1002)。在這種 情形下,向下混頻信號可以是單聲、立體聲和多聲道信號中的一種。
接著,從多聲道信號抽取空間信息(1003)。并且使用空間信息生成空間信
息位流(1004)。
空間信息位流被嵌入到向下混頻信號中(1005)。
另外,包括其中嵌入空間信息位流的向下混頻信號的整個位流被傳送至解碼 裝置(1006)。
特別地,本發(fā)明使用向下混頻信號發(fā)現(xiàn)其中插入空間信息位流的插入?yún)^(qū)的插 入位長度(即K值)并將空間信息位流嵌入到插入?yún)^(qū)中。
圖11是根據(jù)本發(fā)明的對嵌入到向下混頻信號中的空間信息進(jìn)行解碼的方法的 流程圖。
參照圖11,解碼裝置接收包括其中嵌入空間信息位流的向下混頻信號的整個 位流(1101)并從位流抽取向下混頻信號(1102)。
解碼裝置從整個位流中抽取和解碼空間信息位流(1103)。
解碼裝置通過解碼抽取空間信息(1104)并隨后用抽取的空間信息解碼向下 混頻信號(1105)。在這種情形下,向下混頻信號可被解碼為兩個聲道或多個聲道。
特別地,本發(fā)明可抽取空間信息位流嵌入方法的信息以及K值的信息并可使 用抽取的嵌入方法和抽取的K值對空間信息位流進(jìn)行解碼。
圖12是根據(jù)本發(fā)明的嵌入到向下混頻信號中的空間信息位流的幀長度的圖。
參照圖12,"幀"表示具有一個頭部并允許獨(dú)立解碼一預(yù)定長度的單元。在 本發(fā)明的描述中,"幀"表示即將描述的"插入幀"。在本發(fā)明中,"插入幀"表 示在向下混頻信號中嵌入一個空間信息位流的單元。
另外,插入幀的長度可對應(yīng)每個幀定義或使用預(yù)定長度。
例如,使插入幀長度具有與對應(yīng)于解碼和應(yīng)用空間信息(圖12(a))的單元的 空間信息位流的幀長度(下文中稱之為"解碼幀長度")相同的長度,以形成倍數(shù) "S"(圖12(b)),或使"S"成為"N"的倍數(shù)(圖12(c))。
在N二S的情形下,如圖12(a)所示,解碼幀長度(S, 1201)與插入幀長度(N, 1202) —致以便于解碼處理。
在N〉S的情形下,如圖12(b)所示,能通過將多個解碼幀(1203)并在一起 以傳送一個插入幀(N, 1204)的方式減少由于頭部、檢錯碼(例如CRC)等附加 的位數(shù)。
在N〈S的情形下,如圖12(c)所示,可通過將若干插入幀(N, 1206)并在一 起而配置一個解碼幀(S, 1205)。在插入幀頭部中,可插入用于嵌入空間信息的插入位長度的信息、插入幀長 度(N)的信息、包含在插入幀等中的多個子幀的信息等。
圖13是根據(jù)本發(fā)明的、在向下混頻信號中通過插入幀單元嵌入的空間信息位 流的圖。
首先,在圖12(a)、 12(b)、 12(c)中所示的每種情形中,插入幀和解碼幀被配置 成另一方的倍數(shù)。
參照圖13,為了傳送,可配置固定長度的位流,例如以這樣一種格式的數(shù)據(jù) 包配置成傳輸流(TS) 1303。
特別地,空間信息位流1301可由預(yù)定長度的包單元賦值而不管空間信息位流 的解碼幀長度為何。其中插入諸如TS頭部1302的信息等的數(shù)據(jù)包被傳送給一解 碼裝置。插入幀的長度可對每幀定義或使用預(yù)定長度而不是在幀內(nèi)定義。
考慮到因為根據(jù)向下混頻信號的特征每個塊的屏蔽閾值各自不同以及在向下 混頻信號沒有音質(zhì)失真的情況下所能分配的最大位數(shù)(K_max)不同,要改變空間 信息位流的數(shù)據(jù)速率這種方法是必要的。
例如,在K—max不足以完全表征相應(yīng)塊所需的空間信息位流的情形下,直到 高至K_max的數(shù)據(jù)被傳送并且剩下的數(shù)據(jù)之后通過另一塊被傳送。
在K—max足夠的情形下,下一塊的空間信息位流被事先加載。
在這種情形下,每個TS數(shù)據(jù)包具有一個獨(dú)立的頭部。另外,頭部中包含同步 字、TS數(shù)據(jù)包長度信息、包含在TS數(shù)據(jù)包中的多個子幀的信息、分配在數(shù)據(jù)包 內(nèi)的插入位長度的信息等。
圖14A是解釋解決通過插入幀單元嵌入的空間信息位流的時間對準(zhǔn)問題的第 一方法的圖。
參照圖14A,對每幀定義插入幀長度或使用一預(yù)定長度。
通過插入幀單元的嵌入方法可能引起嵌入的空間信息位流的插入幀起始位置 和向下混頻信號幀之間的時間對準(zhǔn)問題。因此,時間對準(zhǔn)問題的解決方案是必需的。
在圖14A所示的第一方法中,空間信息的解碼幀1403的頭部1402 (下文中 稱之為"解碼幀頭部")被分開設(shè)置。
指示是否存在施加空間信息的音頻信號的位置信息的區(qū)別信息被包含在解碼 幀頭部1402中。
例如,在TS數(shù)據(jù)包1404和1405的情形下,指示是否存在解碼幀頭部1402 的區(qū)別信息1408 (例如標(biāo)志)被包含在TS數(shù)據(jù)包頭部1404中。
如果區(qū)別信息1408為1,即如果解碼幀頭部1402存在,則區(qū)別信息指示施加 空間信息位流的向下混頻信號的位置信息是否能從解碼幀頭部中被抽取出來。
接著,施加空間信息位流的向下混頻信號的位置信息1409 (例如延遲信息) 根據(jù)抽取的區(qū)別信息從解碼幀頭部1402被抽取出來。
如果區(qū)別信息1411為0,則TS數(shù)據(jù)包的頭部中可能不包括位置信息。
總地來說,空間信息位流1403較佳地出現(xiàn)在相應(yīng)向下混頻信號1401前面。 因此,位置信息1409可以是延遲的采樣值。
同時,為了防止由于過大的延遲造成的表征采樣值所需的信息量過多增大的 問題,定義表征一組采樣等的采樣組單元(例如粒度單元)。因此,位置信息可用 采樣組單元表示。
如前面描述提及,TS同步字1406、插入位長度1407、指示是否存在解碼幀 頭部的區(qū)別信息以及其余信息140可被包含在TS頭部中。
圖14B是解釋解決由具有對每幀定義的長度的插入幀嵌入的空間信息位流的 時間對準(zhǔn)問題的第二方法的圖。
參照圖14B,在例如TS數(shù)據(jù)包的情形下,第二方法以匹配解碼幀的起點(diǎn)1413、 TS數(shù)據(jù)包的起始點(diǎn)和相應(yīng)向下混頻信號1412的起始點(diǎn)的方式實現(xiàn)。
對于匹配部分,指示三種類型的起始點(diǎn)對準(zhǔn)的區(qū)別信息1420或1422 (例如標(biāo) 志)可被包含在TS數(shù)據(jù)包的頭部1415中。
圖14B示出三種起始點(diǎn)在向下混頻信號的第n幀1412處匹配。在這種情形下, 區(qū)別信息1422可具有值1。
如果三種起始點(diǎn)不匹配,則區(qū)別信息1420具有值O。
為了將這三種起始點(diǎn)匹配到一起,在前一TS數(shù)據(jù)包之后的特定部分1417被 填充以零,其中插入隨機(jī)信號,并由原始向下混頻的音頻信號代替或被填充以它們 的組合形式。
如前面提到的那樣,TS同步字1418、插入位長度1419和其余信息1421可被 包含在TS數(shù)據(jù)包頭部1415中。
圖15是根據(jù)本發(fā)明的將空間信息位流附加至向下混頻信號的方法的圖。
參照圖15,空間信息位流附加于其的幀(下文中稱之為"附加振")的長度 可是為每個幀定義的長度單元或不對每個幀定義的預(yù)定長度單元。
例如,如圖所示,可通過將空間信息的解碼幀長度1504乘以或除以N得到插 入幀長度,其中N是正整數(shù)或者插入幀長度可具有固定長度單元。
如果解碼幀長度1504與插入幀長度不同,能夠不將空間信息位流分段而是隨
機(jī)地切分空間信息位流以配合在插入幀中地形成與解碼幀長度1504具有相同長度
的插入幀。
在這種情形下,空間信息位流被配置成嵌入向下混頻信號或被配置成附加于 向下混頻信號而不是嵌入于向下混頻信號。
在作為PCM信號從模擬信號轉(zhuǎn)換成數(shù)字信號的信號中(下文中稱之為"第一 音頻信號"),空間信息位流被構(gòu)造以嵌入于第一音頻信號中。
在作為MP3信號的進(jìn)一步壓縮的數(shù)字信號(下文中稱之為"第二音頻信號") 中,空間信息位流被配置成附加于第二音頻信號。
在使用第二音頻信號的情形下,例如,向下混頻信號被表示為壓縮格式下的 位流。因此如圖所示,向下混頻信號位流1502以壓縮格式存在并且解碼幀長度1504 的空間信息被附加于向下混頻信號位流1502中。
因此,空間信息位流能夠以脈沖串進(jìn)行傳送。
頭部1503可存在于解碼幀中。另外,空間信息施加于其的向下混頻信號的位 置信息被包含在頭部1503中。
同時,本發(fā)明包括一種情形,即空間信息位流被配置成壓縮格式下的附加幀 (例如TS位流1506)以將附加幀以壓縮的格式附加于向下混頻信號位流1502。
在這種情形下,存在TS位流1506的TS頭部1505。另外,附加幀頭部(例 如TS頭部1505)中可包括附加幀同步信息1507、指示附加幀中是否存在解碼幀 的頭部的區(qū)別信息1508、包含在附加幀中的多個子幀的信息以及其余信息1509中 的至少一個。另外,指示附加幀的起始點(diǎn)和解碼幀的起始點(diǎn)是否匹配的區(qū)別信息被 包含在附加幀中。
如果解碼幀頭部存在于附加幀中,則指示是否存在施加空間信息的向下混頻
信號的位置信息的區(qū)別信息從解碼幀頭部中被抽取出來。
接著,根據(jù)區(qū)別信息將施加空間信息的向下混頻信號的位置信息抽取出。
圖16是根據(jù)本發(fā)明的、對向下混頻信號中嵌入的空間信息位流按多種大小的
插入幀進(jìn)行編碼的方法的流程圖。
參照圖16,音頻信號從多聲道音頻信號被向下混頻(1601、 1602)。在這種
情形下,向下混頻信號可以是單聲、立體聲或多聲道音頻信號。 另外,空間信息從多聲道音頻信號中被抽出(1601、 1603)。 隨后采用抽取的空間信息生成空間信息位流(1604)。所產(chǎn)生的空間信息能
通過具有與每個幀的解碼幀長度的整數(shù)倍對應(yīng)的長度的插入幀單元被嵌入到向下 混頻信號中。
如果解碼幀長度(S)大于插入幀長度(N) (1605),則插入幀長度(N)通過將多 個N連結(jié)在一起而被配置成等于等于一個S (1607)。
如果解碼幀長度(S)小于插入幀長度(N) (1606),則插入幀長度(N)通過將多 個S連結(jié)在一起而被配置成等于一個N (1608)。
如果解碼幀長度(S)等于插入幀長度(N),則插入幀長度(N)被配置成等于解碼 幀長度(S) (1609)。
以上述方式配置的空間信息位流被嵌入到向下混頻信號中(1610)。
最后,包括含嵌入于其中的空間信息位流的向下混頻信號的整個位流被發(fā)送 (1611)。
此外,在本發(fā)明中,空間信息位流的插入幀長度的信息可以被插入到整個位 流中。
圖17是根據(jù)本發(fā)明的、對向下混頻信號中通過固定長度嵌入的空間信息位流 進(jìn)行編碼的方法的流程圖。
參照圖17,音頻信號從多聲道音頻信號(1701、 1702)被向下混頻。在這種 情形下,向下混頻信號可以是單聲、立體聲或多聲道音頻信號。
另外,從多聲道音頻信號抽取空間信息(1701、 1703)。
隨后使用抽取的空間信息生成空間信息位流(1704)。
在空間信息位流已被賦值為具有固定長度(數(shù)據(jù)包單元)的位流、例如傳輸 流(TS) (1705)之后,固定長度的空間信息位流被嵌入到向下混頻信號中(1706)。 接著,包括含嵌入于其中的空間信息位流的向下混頻信號的整個位流被發(fā)送 (1707)。
此外,在本發(fā)明中,其中嵌入空間信息位流的插入?yún)^(qū)的插入位長度(即K值) 是使用向下混頻信號獲得的,并且空間信息位流可被嵌入到插入?yún)^(qū)中。
圖18是根據(jù)本發(fā)明的、在至少一個聲道上向下混頻的音頻信號中嵌入空間信 息位流的第一方法的圖。
在用至少一個聲道配置向下混頻信號的情形下,空間信息被認(rèn)為是與該至少 一個聲道共用的數(shù)據(jù)。因此,需要通過在至少一個聲道上分散空間信息而嵌入空間 信息的方法。
圖18示出在具有至少一個聲道的向下混頻信號的一個聲道上嵌入空間信息的
方法。
參照圖18,空間信息被嵌入到向下混頻信號的K位。特別地,空間信息被嵌 入到僅一個聲道中而不是被嵌入到另一聲道中。另外,每個塊或聲道的K值是不 同的。
如前面內(nèi)容所提到的那樣,與K值對應(yīng)的位可對應(yīng)于向下混頻信號的低位, 但本發(fā)明不僅限于此。在這種情形下,空間信息位流可按從LSB開始的位平面次 序或按采樣平面次序被插入到一個聲道中。
圖19是根據(jù)本發(fā)明的、在至少一個聲道上向下混頻的音頻信號中嵌入空間信 息位流的第二方法的圖。為便于解釋,圖19示出具有兩個聲道的向下混頻信號, 但本發(fā)明不僅限于此。
參照圖19,第二方法的實現(xiàn)方式是依次將空間信息嵌入一個聲道(例如左聲 道)的塊-n、另一聲道(例如右聲道)的塊-n、前一聲道(左聲道)的塊-(n+l)等。 在這種情形下,同步信息僅被嵌入到一個聲道中。
盡管對于每個塊,空間信息位流被嵌入到向下混頻信號,然而也能在解碼處 理中抽取每個塊或幀的空間信息位流。
由于混頻信號的兩個聲道的信令特征彼此不同,因此能通過單獨(dú)發(fā)現(xiàn)兩聲道 的各屏蔽閾值而分別向兩個聲道分配K值。特別地,如圖所示,K1和K2被分別 分配給兩個聲道。
在這種情形下,空間信息被嵌入到從LSB開始的位平面次序中的或采樣平面 次序中的每個聲道中。
圖20是根據(jù)本發(fā)明的、在至少一個聲道上向下混頻的音頻信號中嵌入空間信 息位流的第三方法的圖。圖20示出具有兩個聲道的向下混頻信號,但本發(fā)明不僅 限于此。
參照圖20,第三方法通過將空間信息分散到兩個聲道而將其嵌入。特別地, 空間信息通過由采樣單元改變兩個聲道的相應(yīng)嵌入次序而被嵌入。
由于向下混頻信號的兩個聲道的信令特征彼此不同,因此能通過單獨(dú)地發(fā)現(xiàn) 兩聲道的各自的屏蔽閾值而將K值分別分配到兩聲道中。具體地說,如圖所示, &和K2被分別分配給兩個聲道。
每個塊的K值可彼此不同。例如,空間信息被依次放在一個聲道(例如左聲 道)的采樣一l的K!個低位中、另一聲道(例如右聲道)的采樣一l的K2個低位 中、前一聲道(例如左聲道)的采樣一2的^個低位中以及后一聲道(例如右聲
道)的采樣2的K2個低位中。
在附圖中,括號內(nèi)的數(shù)字指示填充空間信息位流的次序。盡管圖20示出空間 信息位流是從MSB開始填充的,然而空間信息位流也可從LSB開始填充。
圖21是根據(jù)本發(fā)明的、在至少一個聲道上向下混頻的音頻信號中嵌入空間信 息位流的第四方法的圖。圖21示出具有兩個聲道的向下混頻信號,但本發(fā)明不僅 限于此。
參照圖21,第四方法通過將空間信息分散到至少一個聲道而嵌入空間信息。 具體地說,空間信息以通過來自LSB的位平面單元改變兩個聲道的相應(yīng)嵌入次序 的方式被嵌入。
由于向下混頻信號的兩個聲道的信令特征彼此不同,因此能通過單獨(dú)發(fā)現(xiàn)兩 個聲道各自的掩模閾值而將K值(K,和K2)各自不同地分配給兩個聲道。具體地 說,如圖所示,K1和K2能夠各自被分配給兩個聲道。
每個塊的K值可彼此不同。例如,空間信息被逐次放置在一個聲道(例如左 聲道)的釆樣一l的最低有效l位、另一聲道(例如右聲道)的采樣一l的最低有 效1位、前一聲道(例如左聲道)的采樣一2的最低有效1位和后一聲道(例如右 聲道)的采樣一2的最低有效1位中。在附圖中,塊中的數(shù)字指示填充空間信息的 次序。
在音頻信號被存儲在沒有輔助數(shù)據(jù)區(qū)的存儲介質(zhì)(例如立體聲CD)或者通過 SPDIF等發(fā)送的情形下,L/R聲道通過采樣單元被交織。因而,較為有利的是如果 通過第三或第四方法存儲音頻信號,則解碼器根據(jù)所接收的次序處理音頻信號。
另外,第四方法可適用于通過按位平面單元重新配置的方法存儲空間信息位 流的情形。
如前面內(nèi)容中提到的那樣,在空間信息位流通過分散在兩個聲道中而被嵌入 的情形下,則以不同方式將K值分配至諸聲道。在這種情形下,可對位流中的每 個聲道分別傳送K值。在傳送多個K值的情形下,差分編碼可適用于編碼K值的 情形。
圖22是根據(jù)本發(fā)明的、在至少一個聲道上向下混頻的音頻信號中嵌入空間信 息位流的第五方法的圖。圖22示出具有兩個聲道的向下混頻信號,但本發(fā)明不局 限于此。
參照圖22,第五方法通過將空間信息分散到兩個聲道中而嵌入空間信息。具 體地說,第五方法是將相同值反復(fù)插入到兩個聲道的每一個中去。
在這種情形下,具有相同正負(fù)號的值被插入到至少兩個聲道的每一個中,或 者正負(fù)號不同的值被分別插入到至少兩個聲道中。
例如,值1被插入到兩個聲道中的每一個聲道或者值1和一l被輪流地插入到 兩個聲道中。
第五方法的優(yōu)點(diǎn)是利于通過比較至少一個聲道的最低有效插入位(例如K位) 而檢查傳輸錯誤。
具體地說,在將單聲音頻信號轉(zhuǎn)錄至諸如CD的立體聲介質(zhì)的情形下,由于
向下混頻信號的聲道一L(左聲道)和向下混頻信號的聲道一R(右聲道)彼此相
似,因此可通過將插入的空間信息均衡化而提高健全度等。在這種情形下,空間信
息按從LSB開始的位平面次序或按采樣平面次序嵌入到每個聲道中。
圖23是根據(jù)本發(fā)明的、在至少一個聲道上向下混頻的音頻信號中嵌入空間信
息位流的第六方法的圖。
第六方法涉及在每個聲道的幀包括多個塊(長度B)的情形下將空間信息插 入到具有至少一個聲道的向下混頻信號的方法。
參照圖23,每個聲道和塊的插入位長度(即K值)可分別具有不同值或者每 個聲道和塊可具有相同值。
插入位長度(例如K,、 K2、 K3、和K"被存儲在對一個完全幀傳送一次的幀 頭中。另外,幀頭可位于LSB內(nèi)。在這種情形下,頭部可通過位平面單元被插入。 另外,空間信息數(shù)據(jù)可通過采樣單元或塊單元被交替地插入。在圖23中, 一個幀 中的塊數(shù)為2。因此,塊的長度(B)為N/2。在這種情形下,被插入到幀中的位 數(shù)是(Kl+K2+K3+K4) *B。
圖24是根據(jù)本發(fā)明的、在至少一個聲道上向下混頻的音頻信號中嵌入空間信 息位流的第七方法的圖。圖24示出具有兩個聲道的向下混頻信號,但本發(fā)明不僅 限于此。
參照圖22,第七方法通過將空間信息分散到兩個聲道而嵌入空間信息。具體 地說,第七方法的特征在于將空間信息插入從LSB或MSB開始在位平面次序中的 兩個聲道中的方法以及將空間信息通過采樣平面次序輪流插入兩個聲道的方法混 合使用。
該方法按幀單元實現(xiàn)或按塊單元實現(xiàn)。
如圖24所示的陰影部分1一C與頭部對應(yīng)并被插入到位平面次序中的LSB或 MSB以便于搜索插入幀同步字。
其它部分(非陰影部分)C+l和更高位部分對應(yīng)于除頭部以外的部分并通過 采樣單元被輪流插入兩個聲道以便抽取空間信息數(shù)據(jù)。每個聲道和塊的插入位尺寸
(例如K值)可彼此具有不同或相同的值。另外,所有插入位長度被包含在頭部 中。
圖25是根據(jù)本發(fā)明的、對將要嵌入到具有至少一個聲道的向下混頻信號中的 空間信息進(jìn)行編碼的方法的流程圖。
參照圖25,音頻信號從多聲道音頻信號向下混頻至一個聲道中(2501、 2502)。 另外,從多聲道音頻信號抽取空間信息(2501、 2503)。 隨后使用抽取的空間信息生成空間信息位流(2504)。
空間信息位流被嵌入具有至少一個聲道的向下混頻信號(2505)。在這種情 形下,可使用在至少一個聲道中嵌入空間信息位流的七種方法中的一種。
接著,包括具有嵌入于其中的空間信息位流的向下混頻信號的整個流被發(fā)送 (2506)。在這種情形下,本發(fā)明使用向下混頻信號發(fā)現(xiàn)K值并將空間信息位流 嵌入所述K位。
圖26是根據(jù)本發(fā)明的、對嵌入到具有至少一個聲道的向下混頻信號中的空間 信息位流進(jìn)行解碼的方法的流程圖。
參照圖26,空間解碼器接收包括其中嵌入空間信息位流的向下混頻信號的位 流(2601)。
向下混頻信號被檢測自所接收的位流(2602)。
嵌入至具有至少一個聲道的向下混頻信號中的空間信息位流被抽取并通過接 收的位流被解碼(2603)。
接著,使用通過解碼獲得的空間信息將向下混頻信號轉(zhuǎn)換成多聲道信號 (2604)。
本發(fā)明抽取嵌入空間信息位流的次序的區(qū)別信息并使用區(qū)別信息抽取和解碼 空間信息位流。
另外,本發(fā)明從空間信息位流抽取K值的信息并使用K值解碼空間信息位流。 工業(yè)應(yīng)用
因此,本發(fā)明提供下列效果或優(yōu)點(diǎn)。
首先,在根據(jù)本發(fā)明編碼多聲道音頻信號時,空間信息被嵌入到向下混頻信 號中。因此,多聲道音頻信號可被存儲入/再現(xiàn)自不具有輔助數(shù)據(jù)區(qū)的存儲介質(zhì)(例
如立體聲CD)或不具有輔助數(shù)據(jù)區(qū)的音頻格式。
其次,空間信息可通過各種幀長度或固定幀長度被嵌入到向下混頻信號中。 另外,空間信息能夠被嵌入到具有至少一個聲道的向下混頻信號中。因此,本發(fā)明 提高編碼和解碼效率。
盡管在此已結(jié)合其較佳實施例對本發(fā)明進(jìn)行闡述和說明,然而本領(lǐng)域內(nèi)技術(shù) 人員可以理解可在其中作出各種修正和變化而不脫離本發(fā)明的精神和范圍。因此, 本發(fā)明覆蓋本發(fā)明落在所附權(quán)利要求書及其等效物范圍內(nèi)的所有修改和變化。
權(quán)利要求
1.一種解碼音頻信號的方法,包括以下步驟抽取嵌入在音頻信號分量的不可識別分量中的輔助信息;以及使用所抽取的輔助信息解碼所述音頻信號。
2. 如權(quán)利要求1所述的方法,其特征在于,還包括以下步驟從所述輔 助信息的頭部區(qū)抽取具有預(yù)定長度的信息。
3. 如權(quán)利要求2所述的方法,其特征在于,還包括以下步驟將逆白噪 聲化方案應(yīng)用于所抽取的頭部區(qū)信息中除同步字以外的頭部區(qū)信息。
4. 如權(quán)利要求3所述的方法,其特征在于,還包括以下步驟使用已應(yīng) 用了逆白噪聲化方案的所述頭部區(qū)信息來獲得所述頭部區(qū)的長度信息。
5. 如權(quán)利要求1所述的方法,其特征在于,還包括以下步驟抽取所嵌 入的輔助信息的插入位長度。
6. 如權(quán)利要求5所述的方法,其特征在于,所述插入位長度在其中嵌入了所述輔助信息的塊內(nèi)具有一固定值。
7. 如權(quán)利要求1所述的方法,其特征在于,還包括以下步驟將逆白噪 聲化方案應(yīng)用于所述輔助信息。
8. 如權(quán)利要求l所述的方法,其特征在于,還包括以下步驟 抽取嵌入在所述音頻信號中的至少一個檢錯碼或至少一個糾錯碼;使用所抽取的至少一個檢錯碼或所抽取的至少一個糾錯碼來確定所述輔 助信息是否存在損壞。
9. 如權(quán)利要求1所述的方法,其特征在于,所述音頻信號包括向下混頻信號。
10. 如權(quán)利要求l所述的方法,其特征在于,所述輔助信息包括所述音頻信號的空間信息。
11. 一種編碼音頻信號的方法,包括以下步驟(a) 生成解碼所述音頻信號所需的輔助信息;以及(b) 將所生成的輔助信息嵌入到所述音頻信號的不可識別分量中。
12. 如權(quán)利要求ll所述的方法,其特征在于,所述步驟(b)包括以下步 驟將所述輔助信息按采樣平面次序或位平面次序插入到插入?yún)^(qū)中,其中所述 輔助信息被嵌入在所述插入?yún)^(qū)中。
13. 如權(quán)利要求12所述的方法,其特征在于,所述步驟(b)還包括以下步驟從MSB (最高有效位)或LSB (最低有效位)起在所述插入?yún)^(qū)中插入輔助信息。
14. 如權(quán)利要求11所述的方法,其特征在于,對每個嵌入有所述輔助信息的塊使用所述音頻信號的屏蔽閾值,來獲得用于嵌入所述輔助信息的插入位 長度。
15. 如權(quán)利要求ll所述的方法,其特征在于,所述步驟(b)還包括以下步驟在用O替換了其中嵌入輔助信息的插入?yún)^(qū)之后,嵌入所述輔助信息。
16. 如權(quán)利要求11所述的方法,其特征在于,所述步驟(b)還包括以下步驟在從其中嵌入輔助信息的音頻信號減去所述輔助信息,并基于插入位長度 重新量化所述音頻信號之后,嵌入所述輔助信息。
17. 如權(quán)利要求16所述的方法,其特征在于,所述步驟(b)還包括白噪聲化所述輔助信息的步驟。
18. 如權(quán)利要求17所述的方法,其特征在于,所述白噪聲化步驟是在所 述輔助信息的同步字之外的區(qū)域中進(jìn)行的。
19. 如權(quán)利要求ll所述的方法,其特征在于,所述步驟(b)還包括以下步驟如果要被嵌入的輔助信息的位數(shù)小于其中嵌入空間信息的插入?yún)^(qū)中的可嵌入位數(shù),則用零、隨機(jī)信號、原始音頻信號、尾序列或其組合來填充剩余位。
20. 如權(quán)利要求11所述的方法,其特征在于,還包括以下步驟將噪聲整形方案應(yīng)用于所述輔助信息。
21. —種數(shù)據(jù)結(jié)構(gòu),包括 音頻信號;以及嵌入到所述音頻信號分量的不可識別分量中的輔助信息。
22. —種用于編碼音頻信號的裝置,包括 輔助信息抽取單元,用于抽取所述音頻信號的輔助信息;以及 嵌入單元,用于將所述輔助信息嵌入到音頻信號分量的不可識別分量中。
23. —種用于解碼音頻信號的裝置,包括嵌入信號解碼單元,用于將嵌入于音頻信號分量的不可識別分量中的輔助 信息位流抽出;輔助信息解碼單元,用于通過解碼所述輔助信息位流來生成輔助信息;以及多聲道形成單元,用于使用所述輔助信息來解碼所述音頻信號。
全文摘要
公開一種編碼和解碼音頻信號的裝置及其方法,藉此在編碼音頻信號時提供與普通單聲或立體聲音頻信號播放器的兼容性并且能夠存儲或傳送多聲道音頻信號的空間信息而不需要有輔助數(shù)據(jù)區(qū)。本發(fā)明包括抽取嵌入于音頻信號分量的不可識別分量中的輔助信息并使用抽取的輔助信息解碼音頻信號。
文檔編號G10L19/00GK101180674SQ200680018078
公開日2008年5月14日 申請日期2006年5月26日 優(yōu)先權(quán)日2005年5月26日
發(fā)明者吳賢午, 房熙錫, 林宰顯, 鄭亮源, 金東秀 申請人:Lg電子株式會社