專利名稱:解碼音頻信號的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻信號處理,尤其涉及解碼音頻信號的裝置及其方法。雖然本 發(fā)明適用于廣泛的應(yīng)用范圍,但是它尤其適于解碼音頻信號。
背景技術(shù):
一般而言,編碼器在編碼音頻信號時,如果要編碼的音頻信號是一個多聲道 音頻信號,那么該多聲道音頻信號被聲道縮減混音成兩個聲道或一個聲道以生成聲 道縮減混音的音頻信號,且從該多聲道音頻信號中抽取出空間信息??臻g信息是可 用于從聲道縮減混音音頻信號中聲道擴(kuò)展混音出多聲道音頻信號的信息。同時,編 碼器根據(jù)一個預(yù)定的樹狀配置來聲道縮減混音多聲道音頻信號。在這種情況下,預(yù) 定的樹狀配置可以是在音頻信號解碼器與音頻信號編碼器之間達(dá)成一致的結(jié)構(gòu)。特 別地,如果存在指示諸預(yù)定樹狀配置之一的類型的識別信息,則解碼器就能夠知道 已經(jīng)被聲道擴(kuò)展混音的音頻信號的結(jié)構(gòu),例如,聲道的數(shù)目,每個聲道的位置等。
因此,如果編碼器根據(jù)預(yù)定樹狀配置來聲道縮減混音一個多聲道音頻信號, 則在這個過程中抽取出的空間信息也依賴于該結(jié)構(gòu)。所以,如果解碼器使用依賴于 該結(jié)構(gòu)的空間信息來對已聲道縮減混音的音頻信號進(jìn)行聲道擴(kuò)展混音處理,就生成 了根據(jù)該結(jié)構(gòu)的多聲道音頻信號。即,如果解碼器按照原樣使用由編碼器生成的空 間信息,那么聲道擴(kuò)展混音僅僅是根據(jù)在編碼器與解碼器之間達(dá)成一致的結(jié)構(gòu)來執(zhí) 行的。所以,無法生成不遵循所達(dá)成一致的結(jié)構(gòu)的輸出聲道音頻信號。例如,無法 將一個信號聲道擴(kuò)展混音成一個聲道數(shù)與根據(jù)達(dá)成一致的結(jié)構(gòu)所決定的聲道數(shù)不 同(少一些或多一些)的音頻信號。
發(fā)明內(nèi)容
因此,本發(fā)明涉及一種基本上避免了由于相關(guān)技術(shù)的限制和缺點而引起的問 題中的一個或多個的解碼音頻信號的裝置及其方法。
本發(fā)明的一個目標(biāo)是提供一種解碼音頻信號的裝置及其方法,音頻信號藉此
4
可以被解碼成具有與編碼器所決定的結(jié)構(gòu)不同的結(jié)構(gòu)。
本發(fā)明的另一個目標(biāo)是提供一種解碼音頻信號的裝置及其方法,音頻信號藉 此可以使用通過修改由編碼處理生成的先前的空間信息而生成的空間信息來解碼。
本發(fā)明的其它特征和優(yōu)點將在以下說明中陳述,并且部分地將從說明中明了, 或者可以通過本發(fā)明的實踐來掌握。本發(fā)明的目標(biāo)以及其它的優(yōu)點將通過在此書面 說明和所附權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
為了實現(xiàn)這些及其它的優(yōu)點,且根據(jù)本發(fā)明的目標(biāo),如具體表達(dá)和廣泛描述 的,根據(jù)本發(fā)明的一種解碼音頻信號的方法包括接收音頻信號及空間信息,識別 經(jīng)修改空間信息的類型,使用所述空間信息生成經(jīng)修改空間信息,以及使用經(jīng)修改 空間信息來解碼音頻信號,其中經(jīng)修改空間信息的類型包括部分空間信息、組合空 間信息、以及擴(kuò)展空間信息中的至少一種。
為進(jìn)一步實現(xiàn)這些及其它的優(yōu)點,且根據(jù)本發(fā)明的目標(biāo), 一種解碼音頻信號 的方法包括接收空間信息,使用該空間信息生成組合空間信息,以及使用該組合 空間信息解碼音頻信號,其中該組合空間信息是通過將包含于該空間信息中的空間 參數(shù)組合來生成的。
為進(jìn)一步實現(xiàn)這些及其它的優(yōu)點,且根據(jù)本發(fā)明的目標(biāo), 一種解碼音頻信號 的方法包括:接收包含至少一個空間信息的空間信息以及包含至少一個濾波器參數(shù) 的空間濾波器信息;通過將該空間參數(shù)與該濾波器參數(shù)組合來生成具有環(huán)繞效果的 組合空間信息;以及使用該組合空間信息將音頻信號轉(zhuǎn)換成虛擬環(huán)繞信號。
為進(jìn)一步實現(xiàn)這些及其它的優(yōu)點,且根據(jù)本發(fā)明的目標(biāo), 一種解碼音頻信號 的方法包括接收音頻信號,接收包含樹狀配置信息和空間參數(shù)的空間信息,通過 向該空間信息添加擴(kuò)充空間信息生成經(jīng)修改空間信息,以及使用該經(jīng)修改空間信息 對音頻信息進(jìn)行聲道擴(kuò)展混音處理,對音頻信號進(jìn)行聲道擴(kuò)展混音處理包括基于空 間信息將音頻信號轉(zhuǎn)換成初級聲道擴(kuò)展混音音頻信號、并且基于擴(kuò)充空間信息將初 級聲道擴(kuò)展混音音頻信號轉(zhuǎn)換成次級聲道擴(kuò)展混音音頻信號。
應(yīng)當(dāng)理解,以上一般描述以及以下詳細(xì)描述都是示例性和解釋性的,皆意在 提供對主張權(quán)利的本發(fā)明的進(jìn)一步解釋。
附圖簡要說明
包括于此以提供對本發(fā)明的進(jìn)一步理解、并被結(jié)合在本說明書中且構(gòu)成其一 部分的附圖示出本發(fā)明的實施方式,其與說明書一起可用來解釋本發(fā)明的原理。
在附圖中
圖1是根據(jù)本發(fā)明的音頻信號編碼裝置和音頻信號解碼裝置的框圖2是應(yīng)用部分空間信息的一個實施例的示意圖3是應(yīng)用部分空間信息的另一個實施例的示意圖4是應(yīng)用部分空間信息的再一個實施例的示意圖5是應(yīng)用組合空間信息的一個實施例的示意圖6是應(yīng)用組合空間信息的另一個實施例的示意圖7是從揚聲器到聽者的聲徑的示圖,其中示出了各揚聲器的位置;
圖8是解釋為環(huán)繞效果從每個揚聲器位置輸出的信號的示圖9是解釋使用5聲道信號來生成3聲道信號的方法的概念圖IO是基于擴(kuò)充聲道配置信息配置擴(kuò)充聲道的實施例的示圖11是解釋圖IO所示的擴(kuò)充聲道配置及其與擴(kuò)充空間參數(shù)的關(guān)系的示圖12是5.1聲道的多聲道音頻信號與6.1聲道的輸出聲道音頻信號的位置圖;
圖13是解釋虛擬聲源位置與兩個聲道之間的聲級差之間的關(guān)系的圖14是解釋兩個后置聲道的聲級與一個后中置聲道聲級的圖15是解釋5.1聲道的多聲道音頻信號的位置以及7.1聲道的輸出聲道音頻 信號的位置的圖16是解釋兩個左聲道的聲級以及一個左前側(cè)聲道(Lfs)的聲級的圖;以及 圖17是解釋三個前置聲道的聲級以及一個左前側(cè)聲道(Lfs)的聲級的圖。
實施發(fā)明的最佳方式
下面將詳細(xì)參考本發(fā)明的較佳實施方式,其具體示例圖示于附圖中。 當(dāng)前且普遍使用的通用術(shù)語被選作本發(fā)明中使用的術(shù)語。并且,還有申請人 為特殊情況任意性選擇的術(shù)語,其詳細(xì)的含義在本發(fā)明的較佳實施例的描述中詳細(xì) 解釋。因此,不應(yīng)從術(shù)語的字面來理解本發(fā)明,而應(yīng)以術(shù)語的含義來理解。
首先,本發(fā)明使用空間信息生成經(jīng)修改空間信息,然后用所生成的經(jīng)修改空 間信息來解碼音頻信號。在這種情況下,空間信息是在根據(jù)預(yù)定樹狀配置進(jìn)行聲道 縮減混音的過程中抽取出的空間信息,而經(jīng)修改空間信息是用該空間信息新生成的 空間信息。
將結(jié)合圖1對本發(fā)明進(jìn)行如下詳細(xì)解釋。
圖1是根據(jù)本發(fā)明的實施方式的音頻信號編碼裝置和音頻信號解碼裝置的框圖。
參考圖l,編碼音頻信號的裝置(下文簡稱編碼裝置)100包括聲道縮減混音
單元110以及空間信息抽取單元120。而解碼音頻信號的裝置(下文簡稱解碼裝置) 200包括一個輸出聲道生成單元210以及一個經(jīng)修改空間信息生成單元220。
編碼裝置100的聲道縮減混音單元110通過對多聲道音頻信號IN一M作聲道 縮減混音生成聲道縮減混音音頻信號d。聲道縮減混音音頻信號d可以是由聲道縮 減混音單元110通過聲道縮減混音該多聲道音頻信號1]^>1而生成的信號或者是由 用戶任意性地聲道縮減混音該多聲道音頻信號IN—M而生成的任意性聲道縮減混 音音頻信號。
編碼裝置100的空間信息抽取單元120從多聲道音頻信號IN_M中抽取空間 信息s。在這種情況下,空間信息是將聲道縮減混音音頻信號d聲道擴(kuò)展混音成多 聲道音頻信號IN一M所需要的信息。
同時,該空間信息可以是在根據(jù)預(yù)定樹狀配置對多聲道音頻信號IN—M進(jìn)行 聲道縮減混音處理的過程中抽取的信息。在這種情況下,樹狀配置可對應(yīng)于在音頻 信號解碼裝置與音頻信號編碼裝置之間達(dá)成一致的(一個或多個)樹狀配置,本發(fā) 明對此沒有限制。
并且,空間信息能夠包括樹狀配置信息、指示符、空間參數(shù)等等。樹狀配置 信息是關(guān)于樹狀配置類型的信息。所以,多聲道的數(shù)目、每聲道的聲道縮減混音順 序等等根據(jù)樹狀配置的類型而改變。指示符是指示擴(kuò)充空間信息是否存在等的信 息。并且空間參數(shù)可包括在將至少兩個聲道進(jìn)行聲道縮減混音成為至多兩個聲道的 過程中的聲道聲級差(以下簡稱CLD)、聲道間相關(guān)性或相干性(下文簡稱ICC)、 聲道預(yù)測系數(shù)(下文簡稱CPC)等。
同時,除空間信息外,空間信息抽取單元120還能夠進(jìn)一步抽取擴(kuò)充空間信 息。在這種情況下,擴(kuò)充空間信息是對已經(jīng)用空間參數(shù)進(jìn)行了聲道擴(kuò)展混音處理的 聲道縮減混音音頻信號d進(jìn)行額外擴(kuò)充所需要的信息。此外,擴(kuò)充空間信息可包括 擴(kuò)充聲道配置信息和擴(kuò)充空間參數(shù)。擴(kuò)充空間信息不局限于由空間信息抽取單元 120抽取的擴(kuò)充空間信息,下文將會對它進(jìn)行解釋。
除此之外,編碼裝置100能夠進(jìn)一步包括通過將聲道縮減混音音頻信號d解 碼來生成聲道縮減混音音頻比特流的核心編解碼器編碼單元(未在附圖中示出)、 通過編碼空間信息s來生成空間信息比特流的空間信息編碼單元(未在附圖中示 出)、以及通過將聲道縮減混音音頻比特流與空間信息比特流多路復(fù)用來生成音頻
信號比特流的多路復(fù)用單元(未在附圖中示出),在這方面本發(fā)明未作限制。
并且,解碼裝置200能夠進(jìn)一步包括將音頻信號比特流分離成聲道縮減混音
音頻比特流和空間信息比特流的多路分解單元(未在附圖中示出)、對聲道縮減混 音音頻比特流進(jìn)行解碼的核心編解碼器解碼單元(未在附圖中示出)、以及對空間 信息比特流進(jìn)行解碼的空間信息解碼單元(未在附圖中示出),在這方面本發(fā)明未 作限制。
解碼裝置200中的經(jīng)修改空間信息生成單元220使用空間信息識別經(jīng)修改空 間信息的類型,然后基于空間信息生成所識別出的類型的經(jīng)修改空間信息s'。在這 種情況下,空間信息可以是從編碼裝置100傳達(dá)來的空間信息s。并且,經(jīng)修改空 間信息是使用該空間信息新生成的信息。
同時,可能存在各種類型的經(jīng)修改空間信息。并且,各種類型的經(jīng)修改空間 信息可包括a)、 b)和c)中的至少一個a)部分空間信息,b)組合空間信息,c) 擴(kuò)充空間信息,本發(fā)明在這方面未作限制。
部分空間信息包括部分的空間參數(shù),組合空間信息通過組合空間參數(shù)來生成, 而擴(kuò)展空間信息使用該空間信息和擴(kuò)充空間信息來生成。
經(jīng)修改空間信息生成單元220生成經(jīng)修改空間信息的方式可根據(jù)經(jīng)修改空間 信息的類型而不同。并且,按照經(jīng)修改空間信息的類型生成經(jīng)修改空間信息的方法 在下文中會有詳細(xì)的解釋。
同時,決定經(jīng)修改空間信息的類型的基準(zhǔn)可對應(yīng)于空間信息中的樹狀配置信 息、空間信息中的指示符、輸出聲道信息等。樹狀配置信息以及指示符可以被包含 在來自編碼裝置的空間信息s中。輸出聲道信息是關(guān)于互連至解碼裝置200的揚聲 器的信息,且可以包括輸出聲道數(shù)、關(guān)于每個輸出聲道的位置信息等。輸出聲道信 息可以由制造商預(yù)先輸入或由用戶輸入。
使用這些信息來決定經(jīng)修改空間信息的類型的方法將在稍后進(jìn)行詳細(xì)解釋^
解碼裝置200的輸出聲道生成單元210使用經(jīng)修改空間信息s'從聲道縮減混音 音頻信號d生成輸出聲道音頻信號OUT—N。.
空間濾波器信息230是關(guān)于聲徑的信息,并且被提供給經(jīng)修改空間信息生成 單元220。如果經(jīng)修改空間信息生成單元220生成具有環(huán)繞效果的組合空間信息, 則可以使用空間濾波器信息。
在下文中,通過按照經(jīng)修改空間信息的類型生成經(jīng)修改空間信息來解碼音頻 信號的方法按下述次序來如下解釋(l)部分空間信息,(2)組合空間信息,(3)
擴(kuò)展空間信息。
(1)部分空間信息
因為空間參數(shù)是在根據(jù)預(yù)定樹狀配置對多聲道音頻信號進(jìn)行聲道縮減混音處 理的過程中計算出來的,所以如果聲道縮減混音音頻信號是按原樣使用空間參數(shù)來 解碼的,則可以重構(gòu)出進(jìn)行聲道縮減混音處理之前的原始多聲道音頻信號。如果試 圖使輸出聲道音頻信號的聲道數(shù)N小于多聲道音頻信號的聲道數(shù)M,那么可以通 過部分地應(yīng)用空間參數(shù)來解碼聲道縮減混音音頻信號。
這種方法可以根據(jù)在編碼裝置中將多聲道音頻信號進(jìn)行聲道縮減混音的順序 和方法即樹狀配置的類型而改變。并且,樹狀配置類型可以使用空間信息的樹狀配 置信息來查詢。而且這種方法可根據(jù)輸出聲道的數(shù)目而改變。此外,可以使用輸出 聲道信息來查詢輸出聲道的數(shù)目。
下文中,在輸出聲道音頻信號的聲道數(shù)比多聲道音頻信號的聲道數(shù)少的情況 下,在以下的說明中,以各種樹狀配置為例,對一種通過應(yīng)用部分地包括空間參數(shù) 的部分空間信息來解碼音頻信號的方法加以解釋。
(l)-l.樹狀配置的第一實施例(5-2-5樹狀配置) 圖2是應(yīng)用部分空間信息的一個實施例的示意圖。
參考圖2的左半部分,示出了將聲道數(shù)為6 (左前置聲道L、左環(huán)繞聲道U、 中置聲道C、低頻聲道LFE、右前置聲道R、右環(huán)繞聲道R》的多聲道音頻信號聲 道縮減混音成立體聲聲道縮減混音聲道L。和Ro的順序以及多聲道音頻信號與空間 參數(shù)之間的關(guān)系。
首先,執(zhí)行左聲道L與左環(huán)繞聲道U之間的聲道縮減混音、中置聲道C與低 頻聲道LFE之間的聲道縮減混音、以及右聲道R與右環(huán)繞聲道Rs之間的聲道縮減 混音。在此初級聲道縮減混音過程中,生成了左總聲道Lt、中置總聲道Ct以及右 總聲道Rt。并且在此初級聲道縮減混音過程中計算出的空間參數(shù)包括CLD2 (含 ICC2) 、 CLDi (含ICd) 、 CLD。(含ICCo )等。
在此初級聲道縮減混音過程之后的次級過程中,左總聲道Lt、中置總聲道Ct 與右總聲道Rt被聲道縮減混音在一起以生成左聲道Lo以及右聲道Rq。在次級聲道 縮減混音過程中計算的空間參數(shù)包括CLDnr、 CPCTrr、 ICCnr等。
換言之,總計六個聲道的多聲道音頻信號按照上述順序聲道縮減混音,以生 成立體聲聲道縮減混音聲道L。和Ro。
如果原封不動地使用以上述順序方式計算出的空間參數(shù)(cld2、CIXh、CLDo、
CLDttt等),則它們按照與聲道縮減混音的次序相反的順序進(jìn)行聲道擴(kuò)展混音以 生成聲道數(shù)為6 (左前置聲道L、左環(huán)繞聲道Ls、中置聲道C、低頻聲道LFE、右 前置聲道R、右環(huán)繞聲道R》的多聲道音頻信號。
參考圖2的右半部分,如果部分空間信息對應(yīng)于空間參數(shù)(CLD2、CLD。CLDo、 CLDttt等)中的CLDttt,則其被聲道擴(kuò)展混音成左總聲道Lt、中置總聲道Ct以 及右總聲道Rt。如果左總聲道Lt和右總聲道Rt被選擇為輸出聲道音頻信號,則能 夠生成有Lt和Rt兩個聲道的輸出聲道音頻信號。如果左總聲道Lt、中置總聲道Ct 和右總聲道Rt被選擇為輸出聲道音頻信號,則能夠生成有Lt、 Ct和Rt三個聲道的 輸出聲道音頻信號。在額外地用了CU^進(jìn)行聲道擴(kuò)展混音后,如果左總聲道Lt、 右總聲道Rt、中置聲道C以及低頻聲道LFE被選擇,則能夠生成有四個聲道(Lt、 Rt、 C和LFE)的輸出聲道音頻信號。
(1)-2.樹狀配置的第二實施例(5-l-5樹狀配置)
圖3是應(yīng)用部分空間信息的另一個實施例的示意圖。
參考圖3的左半部分,示出了將聲道數(shù)為6 (左前置聲道L、左環(huán)繞聲道Lp 中置聲道C、低頻聲道LFE、右前置聲道R、右環(huán)繞聲道Rs)的多聲道音頻信號聲 道縮減混音成單聲道的聲道縮減混音音頻信號M的順序以及多聲道音頻信號與空 間參數(shù)之間的關(guān)系。
首先,與第一實施例相似,執(zhí)行左聲道L與左環(huán)繞聲道L,之間的聲道縮減混 音、中置聲道C與低頻聲道LFE之間的聲道縮減混音、以及右聲道R與右環(huán)繞聲 道Rs之間的聲道縮減混音。在此初級聲道縮減混音過程中,生成了左總聲道Lt、 中置總聲道Ct以及右總聲道Rt。并且,在此初級聲道縮減混音過程中計算出的空 間參數(shù)包括CLD3 (含ICC3) 、 CLD4 (含ICC4) 、 CLD5 (含ICCs)等。(在本樹 中,CLDx和ICCx區(qū)別于第一實施例中的先前的CLDx)。
在此初級聲道縮減混音過程之后的次級過程中,左總聲道Lt和右總聲道Rt — 起被聲道縮減混音以生成左中置聲道LC,而中置總聲道Ct與右總聲道Rt—起被 聲道縮減混音以生成一個右中置聲道RC。并且,在此次級聲道縮減混音過程中計 算出的空間參數(shù)可包括CLD2 (含ICC2) 、 CIX^ (含ICC。等。
然后,在三級聲道縮減混音過程中,左中置聲道LC和右中置聲道Rt被聲道 縮減混音以生成單聲道的聲道縮減混音信號M。并且,在此三級聲道縮減混音過 程中計算出的空間參數(shù)包括CLDo (含ICCo)等。
參考圖3的右半部分,如果部分空間信息對應(yīng)于空間參數(shù)(CLD3、CLD4、CLD5、CLD。 CLD2、 CLDo等)中的CLD。,則生成左中置聲道LC以及右中置聲道RC。 如果左中置聲道LC和右中置聲道RC被選擇為輸出聲道音頻信號,則能夠生成有 LC和RC兩個聲道的輸出聲道音頻信號。
同時,如果部分空間信息對應(yīng)于空間參數(shù)(CLD3、 CLD4、 CLD5、 CLD。 CLD2、 CLDo等)中的CLDo.CLD,和CLD2,則生成左總聲道Lt、中置總聲道Ct以及右總 聲道Rt。
如果左總聲道Lt和右總聲道Rt被選擇為輸出聲道音頻信號,則能夠生成有Lt 和Rt兩個聲道的輸出聲道音頻信號。如果左總聲道Lt、中置總聲道Ct和右總聲道 Rt被選擇為輸出聲道音頻信號,則能夠生成有Lt、 Ct和Rt三個聲道的輸出聲道音 頻信號。
在部分空間信息還額外包括CLD4的情況下,在聲道擴(kuò)展混音被執(zhí)行至中置聲 道及低頻聲道LEF后,如果左總聲道Lt、右總聲道Rt、中置聲道C和低頻聲道LEF 被選擇為輸出聲道音頻信號,則能夠生成四個聲道(Lt、 Rn C和LFE)的輸出聲 道音頻信號。
(l)-3.樹狀配置的第三實施例(5-l-5樹狀配置)
圖4是應(yīng)用部分空間信息的又一個實施例的示意圖。
參考圖4的左半部分,示出了將聲道數(shù)為6 (左前置聲道L、左環(huán)繞聲道Ls、 中置聲道C、低頻聲道LFE、右前置聲道R、右環(huán)繞聲道R》的多聲道音頻信號聲 道縮減混音成單聲道的聲道縮減混音音頻信號M的順序以及多聲道音頻信號與空 間參數(shù)之間的關(guān)系。
首先,與第一實施例或第二實施例相似,執(zhí)行左聲道L和左環(huán)繞聲道L,之間 的聲道縮減混音、中置聲道C與低頻聲道LFE之間的聲道縮減混音、以及右聲道 R與右環(huán)繞聲道Rs之間的聲道縮減混音。在此初級聲道縮減混音過程中,生成了 左總聲道Lt、中置總聲道Ct以及右總聲道Rt。并且,在此初級聲道縮減混音過程 中計算出的空間參數(shù)包括CLD!(含ICd) 、 CLD2 (含ICC》、CLD3 (含ICQ) 等(在本例中,CLDx和ICCx區(qū)別于第一或第二實施例中先前的CLDx和ICCx)。
在此初級聲道縮減混音過程之后的次級過程中,左總聲道Lt、中置總聲道Ct 以及右總聲道Rt—起被聲道縮減混音以生成左中置聲道LC以及右聲道R。并且空 間參數(shù)CLDrrr (含ICGnr)被計算出來。
然后,在三級聲道縮減混音過程中,左中置聲道LC與右聲道R被聲道縮減 混音以生成單聲道聲道縮減混音信號M。并且空間參數(shù)CLD。(含ICCo)被計算出
來。
參考圖4的右半部分,如果部分空間信息對應(yīng)于空間參數(shù)(CUVCLD2、CLD3、 CLDttt、 CLDo等)中的CLDo和CLDttt,則生成左總聲道Lt、中置總聲道Q以 及右總聲道Rt。
如果左總聲道Lt和右總聲道Rt被選擇為輸出聲道音頻信號,則能夠生成有Lt 和Rt兩個聲道的輸出聲道音頻信號。
如果左總聲道Lt、中置總聲道Ct和右總聲道Rt被選擇為輸出聲道音頻信號, 則能夠生成有Lt、 Ct和Rt三個聲道的輸出聲道音頻信號。
在部分空間信息還額外包含CLD2的情況下,在聲道擴(kuò)展混音已被執(zhí)行至中置 聲道C及低頻聲道LEF后,如果左總聲道Lt、右總聲道Rt、中置聲道C和低頻聲 道LEF被選擇為輸出聲道音頻信號,則能夠生成四個聲道(Lt、 Rt、 C和LFE)的 輸出聲道音頻信號。
在以上描述中,以這三種樹狀配置類型為例,對僅部分地應(yīng)用空間參數(shù)來生 成輸出聲道音頻信號的過程進(jìn)行了解釋。而且,除了部分空間信息之外,還可以額 外地應(yīng)用組合空間信息或擴(kuò)充空間信息。因此,可以應(yīng)對將經(jīng)修改空間信息分級地、 或集體地且綜合地應(yīng)用于音頻信號的過程。
(2)組合空間信息
因為空間信息是在根據(jù)預(yù)定的樹狀配置來聲道縮減混音一多聲道音頻信號的 過程中計算出來的,所以如果照原樣使用空間信息的空間參數(shù)對聲道縮減混音音頻 信號進(jìn)行解碼,則可重構(gòu)出聲道縮減混音之前的原始多聲道音頻信號。如果多聲道 音頻信號的聲道數(shù)M不同于輸出聲道音頻信號的聲道數(shù)N,則通過組合空間信息 生成新的組合空間信息,然后就能夠使用所生成的信息對聲道縮減混音耷頻信號進(jìn) 行聲道擴(kuò)展混音處理。特別地,通過將空間參數(shù)應(yīng)用于轉(zhuǎn)換公式,就能夠生成組合 空間參數(shù)。
此方法可以根據(jù)在編碼裝置中聲道縮減混音一多聲道音頻信號的順序和方法 而改變。并且能夠使用空間信息中的樹狀配置信息來査詢聲道縮減混音的順序和方 法。而且此方法根據(jù)輸出聲道的數(shù)目而改變。此外,可以使用輸出聲道信息來查詢 輸出聲道的數(shù)目等。
接下來,在下文的描述中將解釋修改空間信息的方法的詳細(xì)實施方式和給出 虛擬3-D效果的實施方式。
(2)-1.通用組合空間信息
提供了一種通過組合空間信息的空間參數(shù)來生成組合空間參數(shù)的方法,用于 根據(jù)與聲道縮減混音過程中的樹狀配置不同的樹狀配置進(jìn)行聲道擴(kuò)展混音。因此, 這種方法能應(yīng)用于所有種類的聲道縮減混音音頻信號,而不論根據(jù)樹狀配置信息的 樹狀配置是什么。
如果多聲道音頻信號是5.1聲道的,并且聲道縮減混音音頻信號是1聲道(單 聲道)的,一種生成兩個聲道的輸出聲道音頻信號的方法參考兩種實施例解釋如下。
(2)-1-1.樹狀配置的第四實施例(5-l-5,樹狀配置)
圖5是應(yīng)用組合空間信息的實施例的示意圖。
參考圖5的左半部分,CLD。到CLD4以及ICCo到ICC4 (未在附圖中顯示)可 以被稱為可在對5.1聲道的多聲道音頻信號進(jìn)行聲道縮減混音的過程中計算出的空 間參數(shù)。例如,在空間參數(shù)中,左聲道信號L與右聲道信號R之間的聲道間聲級 差是CLD3, L與R之間的聲道間相關(guān)性是ICC3。并且左環(huán)繞聲道Ls與右環(huán)繞聲 道Rs之間的聲道間聲級差是CLD2, Ls與Rs之間的聲道間相關(guān)性是ICC2。
另一方面,參考圖5的右半部分,如果通過將組合空間參數(shù)CLDa和ICCa應(yīng) 用于單聲道的聲道縮減混音音頻信號m而生成左聲道信號Lt和右聲道信號Rt,則 能夠從單聲道音頻信號m直接生成立體聲輸出聲道音頻信號Lt和Rt。在這種情況 下,組合空間參數(shù)CLDa和ICCa可以通過將CLDo至CLD4以及ICQ)至ICC4組合 來計算。
下文首先解釋通過將CLDo至CLD4組合在一起來計算組合空間參數(shù)中的 CLDa的過程,然后解釋通過將CLD。至CLD4以及ICQ至ICC4組合來計算組合空 間參數(shù)中的ICCa的過程如下。
(2)-l-l-a. CLDa的推導(dǎo)
首先,由于CLDa是左輸出信號Lt與右輸出信號Rt之間的聲級差,因此將左 輸出信號Lt以及右輸出信號R代入到CLD的定義公式得到的結(jié)果如下所示。 [公式1]
CLD。=10"og,。(Pu/PR,),
其中,Pu是Lt的功率,P^是Rt的功率。 [公式2]
CLDa = 10 * log,。(Pu + a / PRi + a>,
其中,Pu是Lt的功率,PRt是Rt的功率,并且'a'是一個非常小的常數(shù)。 因此,CLDa由公式1或者公式2定義。
同時,為了使用空間參數(shù)CLDo到CLD4來表示PLt和PRt,需要輸出聲道音頻 信號的左輸出信號Lt、輸出聲道音頻信號的右輸出信號Rt、與多聲道信號L、 Ls、 R、 Rs、 C以及LFE之間的關(guān)系公式。并且,相對應(yīng)的關(guān)系公式可以定義如下。<formula>formula see original document page 14</formula>
因為如公式3這樣的關(guān)系公式可以根據(jù)如何定義輸出聲道音頻信號而改變, 故其可以用不同于公式3的公式的方式來定義。例如,C/力或LFE/^/2中的'1/V2' 可以是'O'或'1'。
公式3可以引出如下公式4。
<formula>formula see original document page 14</formula>
可以使用Pu和Pm根據(jù)公式1或者公式2表示CLDa。并且,'PLt和Pr/可以使 用Pl、 Pu、 Pc、 Plfe、 PR和Prs根據(jù)公式4表示。所以,需要找出使得能用 空間參數(shù)CLDo到CLD4來表示Pt、 Pu、 Pc、 Pue、 Pr和Prs的失系公式。
同時,如果樹狀配置如圖5所示,那么多聲道音頻信號(L、 R、 C、 LFE、 Ls、 Rs)與單聲道的聲道縮減混音聲道信號m之間的關(guān)系如下所示。<formula>formula see original document page 14</formula><formula>formula see original document page 14</formula>
<formula>formula see original document page 15</formula>
其中,
<formula>formula see original document page 15</formula>
特別地,通過把公式6代入公式4、并把公式4代入公式1或者公式2,就能 夠以將空間參數(shù)CLDo至CLD4組合的方式表示組合空間參數(shù)CLDa。
同時,通過把公式6代入到公式4中的Pc/2+PlFE/2結(jié)果所得的展開在公式7 中示出。
<formula>formula see original document page 15</formula>
在這種情況下,根據(jù)c,和c2的定義(參見公式5),因為(c,J2+(cJ2-l,故 )2+(c2.OTT4)2=l。
所以,公式7可以簡單地歸納如下'
<formula>formula see original document page 15</formula>
因此,通過把公式8和公式6代入公式4、并且把公式4代入公式1,就能夠 以將空間參數(shù)CLDo至CLD4組合的方式來表示組合空間參數(shù)CLDa。 (2)-l-l-b. ICCa的推導(dǎo)
首先,因為ICCa是左輸出信號Lt與右輸出信號Rt之間的相關(guān)性,所以將左 輸出信號Lt和右輸出信號Rt代入到相對應(yīng)的定義公式得到的結(jié)果如下所示。 [公式9]
<formula>formula see original document page 15</formula>
在公式9中,Pu和P&可以使用CLDO至CLD4在公式4、公式6、公式8中 表示。并且,P"Pw能以公式10的方式展開。 [公式10]<formula>formula see original document page 15</formula>
在公式10中,'Pc/2+Pue/2'可根據(jù)公式6表示成CLDo到CLD4。并且,PLR和 Purs可以根據(jù)ICC定義展開如下。 [公式11] ICC3 = PLR/V(PLPR) ICC2 = PiW教sPrs)
在公式11中,如果將火PLPlO或者V(P!j^)進(jìn)行移項,就可以獲得公式12。
PLR = ICCW(PLPR) Plsr,ICCW(PlsPrs)
在公式12中,PL、 PR、 Pb和P^可以根據(jù)公式6表示成CLDo至CLD4。將公 式6代入公式12結(jié)果得到的公式對應(yīng)于公式13。 [公式13]
<formula>formula see original document page 16</formula>
歸納起來,通過把公式6和公式13代入公式10、并把公式10和公式4代入 公式9,就能夠把組合空間參數(shù)ICC。用空間參數(shù)CLDo到CLD3、 ICC2和ICC3來表示。
(2)-1-2.樹狀配置的第五實施方式(5-1-52樹狀配置)
圖6是應(yīng)用組合空間信息的另一個實施例的示意圖。
參考圖6的左半部分,CLDo到CLD4以及ICCo到ICC4 (未在附圖中顯示) 可以被稱為可在對5.1聲道的多聲道音頻信號進(jìn)行聲道縮減混音的過程中計算出的 空間參數(shù)。
在空間參數(shù)中,左聲道信號L與左環(huán)繞聲道信號Ls之間的聲道間聲級差是 CLD3,并且L與Ls之間的聲道間相關(guān)性是ICQ。并且,右聲道R與右環(huán)繞聲道 Rs之間的聲道間聲級差是CLD4, R與Rs之間的聲道間相關(guān)性是ICQ。
另一方面,參考圖6的右半部分,如果通過將組合空間參數(shù)CLDp和ICCp應(yīng) 用于單聲道的聲道縮減混音音頻信號m生成左聲道信號Lt和右聲道信號Rt,則能 夠從單聲道音頻信號m直接生成立體聲輸出聲道音頻信號Lt和K。在這種情況下, 組合空間參數(shù)CLDp禾Q ICCp可以通過將空間參數(shù)CLD。至CLD4以及ICQ)至ICQ 組合來計算。
下文首先解釋通過將CLD(j至CLD4組合在一起計算組合空間參數(shù)中的CLDp 的過程,然后解釋通過將CLDo至CLD4以及ICC。至ICC4組合在一起來計算組合 空間參數(shù)中的ICCp的過程如下。
(2)-l-2-a. CLDp的推導(dǎo)
首先,因為CLDp是左輸出信號Lt與右輸出信號Rt之間的聲道間聲級差,將 左輸出信號Lt以及右輸出信號Rt代入CLD的定義公式的結(jié)果如下所示。 [公式14]
CLDp=10*log10(PLt/PRt),
其中,Pu是Lt的功率,Pm是Rt的功率。 [公式15]
CLDp=10*lOg10(Pu+a/PRt+a),
其中,P^是Lt的功率,PRt是Rt的功率,并且'a'是一個非常小的數(shù)。 因此,CLDp如公式14或公式15地來定義。
同時,為了使用空間參數(shù)CLDo到CLD4來表示PLt和Pju,需要輸出聲道音頻 信號的左輸出信號Lt、輸出聲道音頻信號的右輸出信號Rt、與多聲道信號L、 Ls、 R、 Rs、 C以及LFE之間的關(guān)系公式。并且,相對應(yīng)的關(guān)系公式可以定義如下。
Lt=L+Ls+CA/2+LFE/V2 Rt= R+Rs+CA/2+LFEA/2
因為如公式16那樣的關(guān)系公式可以根據(jù)如何定義輸出聲道音頻信號而改變, 故其可以用不同于公式16的公式的方式來定義。例如,C/V2或LFEW2中的'1A/2' 可以是'O'或'1'。
公式16可以引出如下公式17。
P一Pl+Pls+Pc/2 + P^/2
PRt-PR+PRs+Pc/2 + P^/2
可以使用Pu和PRt根據(jù)公式14或者公式15表示CLDp。并且,'Py和P"可以 使用P^、 P^、 Pc、 PlFE、 PR和Prs根據(jù)公式15來表示。所以,需要找出使得 能用空間參數(shù)CLDo到CLD4來表示Pt、 Pu、 Pc、 PLFE、 Pr和P&的關(guān)系公式。
同時,如果樹狀配置如圖6所示,那么多聲道音頻信號(L、 R、 C、 LFE、 Ls、
Rs)與單聲道的聲道縮減混音聲道信號m之間的關(guān)系如下所示。
<formula>formula see original document page 18</formula>其中,<formula>formula see original document page 18</formula>特別地,通過把公式19代入公式17、并把公式17代入公式14或者公式15, 就能夠以將空間參數(shù)CLDo到CLD4組合的方式來表示組合空間參數(shù)CLDp。
同時,把公式19代入到公式17中的P一P^結(jié)果得到的展開公式表示在公式 20中。 一.
<formula>formula see original document page 18</formula>在這種情況下,根據(jù)d和C2的定義(參見公式5),因為((^)2+((^)2=1,故
<formula>formula see original document page 18</formula>所以,公式20可以簡單地歸納如下。 [公式21]
<formula>formula see original document page 18</formula>另一方面,把公式19代入到公式17中的PR+P&結(jié)果得到的展開公式表示在 公式22中。 [公式22]
Pr +Prs =[(Cl'ott4) +(c2,ott4) Kc1,0tt1 *Cl,ott0) *m
在這種情況下,根據(jù)C,和C2的定義(參見公式5),因為(c^f+(c^^-l,故
(Cl,ott4 ) + (C2,OTT4 ) = 1 。
所以,公式22可以簡單地歸納如下。 [公式23]
Pr— = Pr + Prs 二 (c2,om * ci,orro) * m
另一方面,把公式19代入到公式17中的Pc/2+PlFE/2結(jié)果得到的展開公式表 示在公式24中。 [公式24]
pc/2 + Plfe/2 = [(C!,OTH )2 + (c2,OTH " ](C,o )2 * Hl2/2
在這種情況下,根據(jù)C,和c2的定義(參見公式5),因為((V)2+(^,jz-1,故 (Cl,ott2 ) + (c2,ott2 ) = 1 °
所以,公式24可以簡單地歸納如下。 [公式25]
Pc/2 + PLFE/2 = (c2,OTT0)2*m2/2
因此,通過把公式21、公式23和公式25代入公式17、并把公式17代入公 式14或者公式15,就能夠以將空間參數(shù)CLDo到CLD4組合的方式來表示組合空 間參數(shù)CLDp。
(2)-l-2-b. ICCp的推導(dǎo)
首先,因為ICCp是左輸出信號Lt與右輸出信號Rt之間的相關(guān)性,所以將左輸 出信號Lt和右輸出信號Rt代入到相對應(yīng)的定義公式得到的結(jié)果如下所示。 [公式26]
在公式26中,Pu和PRt可以根據(jù)公式19使用CLDo到CLD4來表示。并且,PuPRt 可以按公式27的方式展開。 [公式27]
PuRt = Pl—r + Pc乂2 + Plfe/2
在公式27中,Pc/2+Pu:e/2'可以根據(jù)公式19用CLDo到CLD4來表示。并且, Plj^可以根據(jù)如下ICC定義來展開。 [公式28]
<formula>formula see original document page 20</formula>
如果將V(PL一P!0移項,可以獲得公式29。 [公式29]
<formula>formula see original document page 20</formula>
在公式29中,Pi^和P、和可以根據(jù)公式21和公式23用CLD。到CLD4來表示。 將公式21和公式23代入公式29得到的公式對應(yīng)于公式30。 [公式30]<formula>formula see original document page 20</formula>
歸納起來,通過把公式30代入公式27、并把公式27和公式17代入公式26, 就能夠把組合空間參數(shù)ICCp用空間參數(shù)CLDQ到CLD4以及ICQ來表示。
以上解釋的空間參數(shù)修改方法只是一個實施方式。并且,在尋找Px或Pxy時, 顯然通過考慮相應(yīng)各聲道之間的相關(guān)性(例如ICC()等)、并以及額外考慮信號能 量,以上解釋的公式即能夠以各種形式來改變。
(2)-2.具有環(huán)繞效果的組合空間信息
首先,如果考慮聲徑來通過將空間信息進(jìn)行組合生成組合空間信息,就能夠 產(chǎn)生虛擬環(huán)繞效果。
虛擬環(huán)繞效果或曰虛擬3D效果能夠在沒有環(huán)繞聲道揚聲器的情況下生成實 質(zhì)上存在環(huán)繞聲道揚聲器的效果。例如,5.1-聲道音頻信號是通過兩個立體聲揚聲 器輸出的。
聲徑可對應(yīng)于空間濾波器信息??臻g濾波器信息能夠使用稱為HRTF (頭部相 關(guān)傳遞函數(shù))的函數(shù),本發(fā)明對此不作限制??臻g濾波器信息能夠包含濾波器參數(shù)。 通過將濾波器參數(shù)和空間參數(shù)代入到一個轉(zhuǎn)換公式中,就能夠生成組合空間參數(shù)。 并且,所生成的組合空間參數(shù)可以包含濾波器系數(shù)。
接下來,假設(shè)多聲道音頻信號是5聲道的,且生成的是三聲道的輸出聲道音 頻信號,考慮聲徑以生成具有環(huán)繞效果的組合空間信息的方法將解釋如下。
圖7是從揚聲器到聽者的聲徑的示圖,其中示出了各揚聲器的位置。
參考圖7,三個揚聲器SPK1、 SPK2和SPK3的位置分別是左前置L、中置C 以及右R。并且虛擬環(huán)繞聲道的位置分別是左環(huán)繞Ls和右環(huán)繞Rs。
分別示出了從三個揚聲器的位置L、 C和R以及虛擬環(huán)繞聲道位置Ls和Rs 到聽者的右耳和左耳位置r和1的聲徑。標(biāo)記'Gx;指示從位置x到位置y的聲徑。 例如,標(biāo)記'GL;指示從左前置L到聽者的右耳r的聲徑。
如果在五個位置上存在揚聲器(即在左環(huán)繞Ls和右環(huán)繞Rs處也存在揚聲器), 并且如果聽者存在于圖7所示位置,那么送入聽者左耳的信號Lo和送入聽者右耳 的信號Ro用公式31來表示。<formula>formula see original document page 21</formula>
其中,L、 C、 R、 Ls和Rs分別是各位置處的聲道,G^表示從位置x到位置 y的聲徑,并且'*'表示巻積。
然而,如以上描述所述,如果揚聲器只存在于三個位置L、 C、和R,那么送
入聽者左耳的信號Lo』ea!和送入聽者右耳的信號R^eal表示如下。
<formula>formula see original document page 21</formula>
因為在公式32中表示的信號沒有考慮環(huán)繞聲道信號Ls和Rs,故不能產(chǎn)生虛 擬環(huán)繞效果。為了產(chǎn)生虛擬環(huán)繞效果,要使得從揚聲器位置Ls到達(dá)聽者位置(1, r)的Ls信號等于與從不同于原始位置Ls的三個位置L、 C和R中的每一個處的 揚聲器到達(dá)聽者位置(1, r)的Ls信號。并且,這也等同地適用于右環(huán)繞聲道信 號Rs。
審視左環(huán)繞聲道信號Ls,如果左環(huán)繞聲道信號Ls是從在作為原始位置的左環(huán) 繞位置Ls的揚聲器輸出的,那么到達(dá)聽者的左、右耳l和r的信號表示如下。 [公式33]
<formula>formula see original document page 21</formula>
并且,如果右環(huán)繞聲道信號Rs是從在作為原始位置的右環(huán)繞位置Rs的揚聲器輸出 的,那么到達(dá)聽者的左、右耳l和r的信號表示如下。 [公式34]
<formula>formula see original document page 21</formula>
如果到達(dá)聽者的左、右耳l和r信號等于公式33和公式34的分量,那么即使 它們是通過任何位置的揚聲器(例如,通過在左前置位置的揚聲器SPK1)來輸出
的,聽者也能夠擁有宛如揚聲器分別存在于左環(huán)繞位置Ls和右環(huán)繞位置RS的感 覺。
同時,如果公式33中的分量是從位于左環(huán)繞位置Ls的揚聲器輸出的,它們 分別是到達(dá)聽者的左耳l和右耳r的信號。所以,如果公式33所示的分量是從位 于左前置位置的揚聲器SPK1原封不動地輸出的,那么到達(dá)聽者的左耳1和右耳r 的信號可以表示如下。
,Ls*GLsl*GLJ'、 'Ls*GLsr*GLr'
審視公式35,添加了對應(yīng)于從左前置位置L到聽者左耳1 (或右耳r)的聲徑 的分量'Gl—卩(或'G^')。
然而,到達(dá)聽者的左耳I和右耳r的信號應(yīng)當(dāng)是公式33而不是公式35中所示 的分量。如果從位于左前置位置L的揚聲器輸出的聲音到達(dá)聽者,要添加分量'Gl」' (或'G」)。因此,如果公式33中所示的分量是從位于左前置位置的揚聲器SPK1 輸出的,那么對于聲徑而言,應(yīng)當(dāng)考慮'Gu'(或'Gu')的反函數(shù)'Gl/'(或'Gl/')。 換言之,如果對應(yīng)于公式33的分量是從位于左前置位置L上的揚聲器SPK1輸出 的,那么這些分量必須按下面的公式修改。
'Ls*GLsJ *GL/'、 'Ls*GLs—r*GL—,1,
如果對應(yīng)于公式34的分量是由位于左前置位置L上的揚聲器SPK1輸出的,, 那么這些分量必須修改成下面的公式。 [公式37]
'Rs*GRsJ ,r1,、 'R^Grs^Glj'1'
所以,從位于左前置位置L上的揚聲器SPK1輸出的信號L'歸納如下。 [公式38]
L' = L + Ls * GLs—, * GL—廣+ Rs * G^j * GL
(分量I^Gls—r*GL—/1和K^Grs—r*GL—r1被省去)
如果公式38所示的要從位于左前置位置L上的揚聲器SPKl輸出的信號到達(dá) 聽者左耳位置L,則添加聲徑因子'Gu'。所以,公式38中的各'Gu'項被抵消,籍 此公式33和公式34所示的因子最終保留。
圖8是解釋從每個揚聲器位置輸出以實現(xiàn)虛擬環(huán)繞效果的信號的圖。
參考圖8,如果通過考慮聲徑,令從環(huán)繞位置Ls和Rs輸出的信號Ls和Rs被包含在從每個揚聲器位置SPK1輸出的信號L'中,那么它們對應(yīng)于公式38。 在公式38中,Gls—^GL 被簡寫為Hui,如下所示。 [公式39]
L' = L + Ls*HLsL+Rs*HRsL
例如,從位于中置位置C的揚聲器SPK2輸出的信號C'被歸納如下。 [公式40]
C' = C + Ls * HLs—c + Rs * c
再例如,從位于右前置位置R的揚聲器SPK3輸出的信號R'被歸納如下。 [公式41]
R' = R + Ls*HLsR+Rs*HRsR
圖9是解釋如公式38,公式39或公式40那樣使用5聲道信號生成3聲道信 號的方法的概念圖。如果使用5聲道信號生成2聲道信號R'和L',或者如果在中置聲道信號C' 中不包含環(huán)繞聲道信號Ls或Rs,則Hl^c或者Hr3—c變成0。
為了方便實現(xiàn),Hxj可以用使Hx一y被G^替代或者通過考慮串話(cross-talk) 來使用HXj的方式進(jìn)行各種修改。
以上詳細(xì)解釋涉及具有環(huán)繞效果的組合空間信息的一個實施例。并且顯然, 它可以根據(jù)應(yīng)用空間濾波器信息的方法以各種形式改變。如以上敘述所述,根據(jù)以 上過程通過揚聲器(在上例中,是左前置聲道L,、右前置聲道R,和中置聲道C,) 輸出的信號可以使用組合空間信息——更具體地是使用組合空間參數(shù)——從聲道 縮減混音音頻信號生成。 (3)擴(kuò)展空間信息
首先,通過將擴(kuò)充空間信息添加到空間信息,就能夠生成擴(kuò)展空間信息。且 能夠使用該擴(kuò)充空間信息對音頻信號進(jìn)行聲道擴(kuò)展混音。在對應(yīng)的擴(kuò)展混音過程 中,音頻信號基于空間信息被轉(zhuǎn)換為初級聲道擴(kuò)展混音音頻信號,然后該初級聲道 擴(kuò)展混音音頻信號基于擴(kuò)充空間信息被轉(zhuǎn)換為次級聲道擴(kuò)展混音音頻信號。
在這種情況下,擴(kuò)充空間信息能夠包含擴(kuò)充聲道配置信息、擴(kuò)充聲道映射信 息和擴(kuò)充空間參數(shù)。
擴(kuò)充聲道配置信息是關(guān)于可配置聲道以及可用空間信息的樹狀配置信息來配 置的聲道的信息。擴(kuò)充聲道配置信息可包含分割標(biāo)識符和不分割標(biāo)識符中的至少一 個,這在下面會詳細(xì)解釋。擴(kuò)充聲道映射信息是配置擴(kuò)充聲道的每個聲道的位置信
息。且,擴(kuò)充空間參數(shù)可以用來將一個聲道進(jìn)行聲道擴(kuò)展混音成至少兩個聲道。擴(kuò) 充空間參數(shù)可包含聲道間聲級差。
以上解釋的擴(kuò)充空間信息可以在(i)由編碼裝置生成或(ii)由解碼裝置自身生成 后被包含在空間信息中。如果擴(kuò)充空間信息系由編碼裝置生成,則擴(kuò)充空間信息的 存在與否可以基于空間信息指示符來判定。如果擴(kuò)充空間信息由解碼裝置自身生 成,則擴(kuò)充空間信息的擴(kuò)充空間參數(shù)可通過使用空間信息的空間參數(shù)進(jìn)行計算來得 到。
同時,使用在空間信息和擴(kuò)充空間信息的基礎(chǔ)上生成的擴(kuò)展空間信息對音頻 信號進(jìn)行聲道擴(kuò)展混音的過程可以順序地且分級地執(zhí)行或者集體地且綜合地執(zhí)行。 如果擴(kuò)展空間信息可以作為基于空間信息和擴(kuò)充空間信息的一個矩陣來計算,則能 夠使用該矩陣來集體且直接地將聲道縮減混音音頻信號聲道擴(kuò)展混音成多聲道音 頻信號。在這種情況下,配置該矩陣的因子可以根據(jù)空間參數(shù)和擴(kuò)充空間參數(shù)來定 義。
下文中,在解釋完使用由編碼裝置生成的擴(kuò)充空間信息的例子之后,將解釋 由解碼裝置自身生成擴(kuò)充空間信息的例子。
(3)-1:使用由編碼裝置生成的擴(kuò)充空間信息的例子任意性樹狀配置
首先,擴(kuò)展空間信息由編碼裝置通過將擴(kuò)充空間信息添加到空間信息來生成 的方式生成。且,將解釋解碼裝置接收該擴(kuò)充空間信息的例子。除此之外,擴(kuò)充空 間信息可以是在編碼裝置對多聲道音頻信號進(jìn)行聲道縮減混音的過程中抽取的信 息。
如以上說明所述,擴(kuò)充空間信息包含擴(kuò)充聲道配置信息、擴(kuò)充聲道映射信息 以及擴(kuò)充空間參數(shù)。在這種情況下,擴(kuò)充聲道配置信息可包含分割標(biāo)識符和不分割 標(biāo)識符中的至少一個。接下來,將對基于分割和不分割標(biāo)識符陣列配置擴(kuò)充聲道的 過程詳細(xì)解釋如下。
圖io是基于擴(kuò)充聲道配置信息來配置擴(kuò)充聲道的實施例的圖。
參考圖10的下半部分,0和1被重復(fù)地編排成一個序列。在這種情況下,'0' 表示不分割標(biāo)識符,而'l'代表分割標(biāo)識符。不分割標(biāo)識符O存在于第一階(1)上, 與第一階的不分割標(biāo)識符O相匹配的聲道是存在于最上端的左聲道L。因此,與此 不分割標(biāo)識符0相匹配的左聲道L被選擇為輸出聲道而不是被分割。在第二階(2) 上存在分割標(biāo)識符1。與分割標(biāo)識符相匹配的聲道是左聲道L旁的左環(huán)繞聲道Ls。 因此,與此分割標(biāo)識符1相匹配的左環(huán)繞聲道Ls被分割成兩個聲道。
因為在第三階(3)和第四階(4)存在不分割標(biāo)識符0,所以從左環(huán)繞聲道Ls分割 出的兩個聲道被原封不動地選擇為輸出聲道而不被分割。 一旦以上過程被重復(fù)至最 后一階(IO),就能夠配置出完整的擴(kuò)充聲道。
此聲道分割過程被重復(fù)的次數(shù)與分割標(biāo)識符1的數(shù)目相同,并且選擇聲道作 為輸出聲道的過程被重復(fù)的次數(shù)與不分割標(biāo)識符O的數(shù)目相同。因此,聲道分割單 元AT0和ATI的數(shù)目等于分割標(biāo)識符1的數(shù)目(2),并且擴(kuò)充聲道(L、 Lfs、 Ls、 R、 Rfs、 Rs、 C和LFE)的數(shù)目等于不分割標(biāo)識符0的數(shù)目(8)。
同時,在配置出了擴(kuò)充聲道后,可以使用擴(kuò)充聲道映射信息來映射每個輸出 聲道的位置。在圖IO的情形中,映射按照左前置聲道L、左前側(cè)聲道Lfs、左環(huán)繞 聲道Ls、右前置聲道R、右前側(cè)聲道Rfs、右環(huán)繞聲道Rs、中置聲道C以及低頻 聲道LFE的順序執(zhí)行。
如以上說明所述,擴(kuò)充聲道可基于擴(kuò)充聲道配置信息進(jìn)行配置。為此,將一 個聲道分割成至少兩個聲道的聲道分割單元是必需的。在將一個聲道分割成至少兩 個聲道時,該聲道分割單元能夠使用擴(kuò)充空間參數(shù)。因為擴(kuò)充空間參數(shù)的數(shù)目等于 聲道分割單元的數(shù)目,所以它也等于分割標(biāo)識符數(shù)。因此,可以抽取數(shù)目與分割標(biāo) 識符數(shù)一樣多的擴(kuò)充空間參數(shù)。
圖11是解釋圖IO所示的擴(kuò)充聲道的配置及其與擴(kuò)充空間參數(shù)關(guān)系的圖。
參考圖11,圖中有兩個聲道分割單元AK和AT^且示出了分別應(yīng)用于它們 的擴(kuò)充空間參數(shù)ATDo和ATDp
如果擴(kuò)充空間參數(shù)是聲道間聲級差,則聲道分割單元能夠使用擴(kuò)充空間參數(shù) 決定兩個分割所得聲道的聲級差。
因此,在通過添加擴(kuò)充空間信息來執(zhí)行聲道擴(kuò)展混音操作時,擴(kuò)充空間參數(shù) 可以不是完全地,而是部分地應(yīng)用。
(3)-2.生成擴(kuò)充空間信息的例子內(nèi)插/外推
首先,能夠通過將擴(kuò)充空間信息添加到空間信息生成擴(kuò)展空間信息。將在下 面的說明中對使用空間信息生成擴(kuò)充空間信息的例子進(jìn)行解釋。特別地,能夠使用 空間信息的空間參數(shù)生成擴(kuò)充空間信息。在這種情形中,可以使用內(nèi)插法、外推法 等等。
(3)-2-1.擴(kuò)充至6.1聲道
如果多聲道音頻信號是5.1聲道,生成6.1聲道的輸出聲道音頻信號的例子參 考以下示例來解釋。
圖12是5.1聲道的多聲道音頻信號的位置及6.1聲道的輸出聲道音頻信號的
位置的圖。
參考圖12 (a),可以看到5.1聲道的多聲道音頻信號的聲道位置分別是左前 置聲道L、右前置聲道R、中置聲道C、低頻聲道(未在附圖中示出)LFE、左環(huán) 繞聲道Ls和右環(huán)繞聲道Rs。
在5.1聲道的多聲道音頻信號是聲道縮減混音音頻信號的情形中,如果將空間 參數(shù)應(yīng)用于聲道縮減混音音頻信號,那么該聲道縮減混音音頻信號再次被聲道擴(kuò)展 混音成5.1聲道的多聲道音頻信號。
然而,應(yīng)該進(jìn)一步生成如附圖12 (b)中所示的后中置RC聲道信號,以將聲 道縮減混音音頻信號作聲道擴(kuò)展混音處理成6.1聲道的多聲道音頻信號。'
后中置RC的聲道信號可以使用與兩個后置聲道(左環(huán)繞聲道Ls和右環(huán)繞聲 道Rs)相關(guān)聯(lián)的空間參數(shù)來生成。特別地,空間參數(shù)中的聲道間聲級差(CLD) 指示兩個聲道之間的聲級差。因此,通過調(diào)節(jié)兩個聲道之間的聲級差,即能夠改變 存在于這兩個聲道之間的虛擬聲源的位置。
虛擬聲音源的位置根據(jù)兩個聲道之間的聲級差而變化的原理解釋如下。
圖13是解釋虛擬聲音源位置與兩個聲道間聲級差之間的關(guān)系的圖,圖中左、 右環(huán)繞聲道Ls和Rs的聲級分別是'a'和'b'。
參考圖13 (a),如果左環(huán)繞聲道Ls的聲級a比右環(huán)繞聲道Rs的聲級b大, 那么可以看到,虛擬聲音源VS的位置相比于右環(huán)繞聲道Rs的位置更靠近左環(huán)繞 聲道Ls的位置。
如果音頻信號從兩個聲道輸出,則聽者感覺虛擬聲源實質(zhì)上存在于這兩個聲 道之間。在這種情況下,虛擬聲源的位置更靠近聲級比另一個聲道的聲級高的聲道 的位置。
在圖13 (b)的情況下,因為左環(huán)繞聲道Ls的聲級與右環(huán)繞聲道Rs的聲級幾
乎相等,所以聽者感覺虛擬聲源的位置存在于左環(huán)繞聲道Ls和右環(huán)繞聲道Rs之
間的中心處。
因此,可以使用上述原理決定后中置的聲級。
圖14是解釋兩個后置聲道的聲級與一個后中置聲道的聲級的圖。
參考圖14,通過在左環(huán)繞聲道Ls的聲級a與右環(huán)繞聲道Rs的聲級b之間內(nèi)
插出一差值,就能夠計算出后中置聲道RC的聲級c。在這種情況下,此計算既可
以使用非線性內(nèi)插法,也可以使用線性內(nèi)插法。
存在于兩個聲道(例如,Ls和Rs)之間的新聲道(例如,后中置聲道RC) 的聲級c可以通過以下公式根據(jù)線性內(nèi)插法進(jìn)行計算。 [公式40]
c = a*k + b* (l-k),
其中'a'和'b'分別是兩個聲道的聲級,并且'k'是聲級-a聲道、聲級-b聲道和聲級 -c聲道之間的相對位置。
如果聲級-c的聲道(例如,后中置聲道RC)定位于聲級-a的聲道(例如,Ls) 與聲級-b的聲道Rs之間的中心處,那么'k'是0.5。如果'k'是0.5,那么公式40得到 公式41。
c = (a + b) /2
根據(jù)公式41,如果聲級-c的聲道(例如,后中置聲道RC)位于聲級-a的聲 道(例如,Ls)與聲級-b的聲道Rs之間的中心處,那么新聲道的聲級-c對應(yīng)于之 前聲道的聲級a和b的平均值。除此之外,公式40和公式41僅僅是示例性的。因 此,也可重新調(diào)整聲級-c的決定及聲級-a和聲級-b的值。
(3)-2-2.擴(kuò)充至7.1聲道
當(dāng)多聲道音頻信號是5.1聲道時,試圖生成7.1聲道的輸出聲道音頻信號的例 子解釋如下。
圖15是解釋5.1聲道的多聲道音頻信號的位置及7.1聲道的輸出聲道音頻信 號的位置的圖。
參考圖15 (a),如同圖12 (a),可以看到5.1聲道的多聲道音頻信號的聲 道位置分別是左前置聲道L、右前置聲道R、中置聲道C、低頻聲道(未在附圖中 示出)LFE、左環(huán)繞聲道Ls和右環(huán)繞聲道Rs。
在5.1聲道的多聲道音頻信號是聲道縮減混音音頻信號的情形中,如果將空間 參數(shù)應(yīng)用于聲道縮減混音音頻信號,那么該聲道縮減混音音頻信號再次被聲道擴(kuò)展 混音成5.1聲道的多聲道音頻信號。
然而,應(yīng)當(dāng)進(jìn)一步生成如圖15 (b)所示的左前側(cè)聲道Lfs和右前側(cè)聲道Rfs 以將多聲道縮減混音音頻信號作擴(kuò)展混音處理成7.1聲道的多聲道音頻信號。
因為左前側(cè)聲道Lfs定位于左前置聲道L與左環(huán)繞聲道Ls之間,所以可以通 過使用左前置聲道L的聲級和左環(huán)繞聲道Ls的聲級藉由內(nèi)插法來決定該左前側(cè)聲 道Lfs的聲級。
圖16是解釋兩個左聲道聲級以及一個左前側(cè)聲道(Lfs)聲級的圖。 參考圖16,可以看到,左前側(cè)聲道Lfs的聲級c是基于左前置聲道L的聲級 a和左環(huán)繞聲道Ls的聲級b的線性內(nèi)插值。
同時,雖然左前側(cè)聲道Lfs是定位于左前置聲道L與左環(huán)繞聲道Ls之間,但 是它可以定位于左前置聲道L、中置聲道C和右前置聲道R之外。因此,可以通 過使用左前置聲道L、中置聲道C和右前置聲道R的聲級藉由外推法來決定左前 側(cè)聲道Lfs的聲級。
圖17是解釋三個前置聲道聲級及一個左前側(cè)聲道的聲級的圖。 參考圖17,可以看到,左前側(cè)聲道Lfs的聲級d是基于左前置聲道L的聲級 a、中置聲道C的聲級c及右前置聲道的聲級b的線性外推值。
在以上描述中,己經(jīng)參考兩個示例對將擴(kuò)充空間信息添加到空間信息來生成 輸出聲道音頻信號的過程進(jìn)行了解釋。如以上說明所述,在添加擴(kuò)充空間信息的聲 道擴(kuò)展混音過程中,擴(kuò)充空間參數(shù)可以不是完全地,而是部分地應(yīng)用。因此,將空 間參數(shù)應(yīng)用于音頻信號的過程可以順序地且分級地執(zhí)行,或者集體地且綜合地執(zhí) 行。
工業(yè)適用性
因此,本發(fā)明提供以下效果。
首先,本發(fā)明能夠生成具有與預(yù)定樹狀配置不同的配置的音頻信號,由此能 夠生成各種配置的音頻信號。
第二,因為能夠生成具有與預(yù)定樹狀配置不同的配置的音頻信號,所以即使 執(zhí)行聲道縮減混音之前多聲道的數(shù)目多于或少于揚聲器數(shù),也能夠從聲道縮減混音 音頻信號中生成數(shù)目與揚聲器數(shù)相等的輸出聲道。
第三,如果生成了數(shù)目比多聲道的數(shù)目少的輸出聲道,那么因為多聲道音頻 信號是直接從聲道縮減混音音頻信號生成的,而不是對來自從聲道擴(kuò)展混音處理一 聲道縮減混音音頻信號所生成的多聲道音頻信號的輸出聲道音頻信號進(jìn)行聲道縮 減混音處理來生成的,所以能夠顯著地減輕解碼音頻信號所需要的操作負(fù)荷。
第四,因為在生成組合空間信息時考慮了聲徑,所以本發(fā)明在環(huán)繞聲道輸出 不可用時提供偽環(huán)繞效果。
盡管本文參考本發(fā)明的優(yōu)選實施例描述和例示說明了本發(fā)明,但本領(lǐng)域的技 術(shù)人員將清楚可在本發(fā)明中作出各種修改和變形而不會脫離本發(fā)明的精神和范圍。 因此,本發(fā)明旨在涵蓋落入所附權(quán)利要求及其等效技術(shù)方案范圍內(nèi)的本發(fā)明的修改 和變形。
權(quán)利要求
1.一種解碼音頻信號的方法,其包括接收所述音頻信號以及空間信息;識別經(jīng)修改空間信息的類型;使用所述空間信息生成所述經(jīng)修改空間信息;以及使用所述經(jīng)修改空間信息來解碼所述音頻信號,其中,所述經(jīng)修改空間信息的類型至少包括部分空間信息、組合空間信息、和擴(kuò)展空間信息中的一者。
2. 如權(quán)利要求1所述的方法,其特征在于,所述經(jīng)修改空間信息的類型是基 于包括在所述空間信息中的指示符來識別的。
3. 如權(quán)利要求l所述的方法,其特征在于,所述經(jīng)修改空間信息的類型是基 于包括在所述空間信息中的樹狀配置信息來識別的。
4. 如權(quán)利要求1所述的方法,其特征在于,所述經(jīng)修改空間信息的類型是基 于輸出聲道信息來識別的。
5. 如權(quán)利要求l所述的方法,其特征在于,所述空間信息包括空間參數(shù),且 所述部分空間信息部分地包括所述空間參數(shù)。
6. 如權(quán)利要求5所述的方法,其特征在于,所述空間參數(shù)是分級的,且所述 部分空間信息包括上層的空間參數(shù)。
7. 如權(quán)利要求6所述的方法,其特征在于,所述部分空間信息還部分地包括 下層的空間參數(shù)。
8. 如權(quán)利要求1所述的方法,其特征在于,所述空間信息包括空間參數(shù),且 所述組合空間信息是通過將所述空間參數(shù)相組合來生成的。
9. 如權(quán)利要求l所述的方法,其特征在于,所述擴(kuò)展空間信息是使用所述空 間信息和擴(kuò)充空間信息來生成的。
10. 如權(quán)利要求9所述的方法,其特征在于,所述空間信息包括空間參數(shù), 其中所述擴(kuò)充空間信息包括擴(kuò)充空間參數(shù),且所述擴(kuò)充空間參數(shù)是使用所述空間參 數(shù)來計算的。
11. 一種解碼音頻信號的裝置,其包括:經(jīng)修改空間信息生成單元,其使用空間信息來識別經(jīng)修改空間信息的類型, 所述經(jīng)修改空間信息生成單元使用所述空間信息來生成所述經(jīng)修改空間信息;以及 輸出聲道生成單元,其使用所述經(jīng)修改空間信息來解碼所述音頻信號, 其中所述經(jīng)修改空間信息的類型包括部分空間信息、組合空間信息、和擴(kuò)展空間信息中的至少一者。
全文摘要
揭示了一種解碼音頻信號的裝置及其方法。本發(fā)明包括接收音頻信號和空間信息,識別經(jīng)修改空間信息的類型,使用空間信息生成經(jīng)修改空間信息,及使用經(jīng)修改空間信息解碼音頻信號,其中經(jīng)修改空間信息的類型至少包括部分空間信息、組合空間信息、以及擴(kuò)展空間信息中的至少一種。因此,音頻信號可以解碼成與編碼裝置所決定的配置不同的配置。即使揚聲器數(shù)少于或者多于在執(zhí)行聲道縮減混音之前的多聲道的數(shù)目,也能夠從聲道縮減混音音頻信號生成與揚聲器數(shù)相等數(shù)目的輸出聲道。
文檔編號G10L19/00GK101351839SQ200680042061
公開日2009年1月21日 申請日期2006年9月14日 優(yōu)先權(quán)日2005年9月14日
發(fā)明者吳賢午, 房熙錫, 林宰顯, 鄭亮源, 金東秀 申請人:Lg電子株式會社