專利名稱:處理音頻信號的方法和裝置的制作方法
技術領域:
本發(fā)明涉及處理音頻信號的方法和裝置。盡管本發(fā)明適用于范圍寬泛的應 用,但它特別適用于處理殘差信號。
背景技術:
一般而言,音頻信號包括聲道縮減混音信號和輔助數(shù)據(jù)信號。且輔助數(shù)據(jù) 信號可包括空間信息信號和擴展信號。在這種情形中,"擴展信號"是指在通 過對聲道縮減混音信號進行聲道擴展處理來生成多聲道信號時使得信號能夠 接近原始信號而重構所需的附加信號。例如,擴展信號可包括殘差信號。"殘 差信號"是指與原始信號和經(jīng)譯碼的信號之間的差相對應的信號。在多聲道音 頻譯碼時,殘差信號可用于以下的情況。例如,殘差信號可用于藝術聲道縮減 混音信號的補償或解碼時的特定聲道補償。且,殘差信號還可用于這兩種補償。 所以,能夠利用殘差信號將輸入的音頻信號重構成更接近原始信號的信號,以 提高聲音質量
發(fā)明內容
技術問題
然而,如果解碼器在擴展信號上無條件地進行解碼,則盡管根據(jù)解碼器的 類型可提高聲音質量,但復雜性上升且運算負荷增加。
此外,因為音頻信號的頭部信息一般是不可變的,所以頭部信息僅被插入 比特流一次。但是在頭部信息僅被插入比特流一次的情形中,如果音頻信號需
要從隨機時間點解碼用于廣播或VOD,則由于沒有頭部信息而不能解碼數(shù)據(jù) 幀信息。
技術方案 因此,本發(fā)明涉及一種基本上消除了一個或多個由于有關技術的局限和缺 點引起的問題的處理音頻信號的方法和裝置。
本發(fā)明的一個目的是提供一種用于處理音頻信號的方法和裝置,藉之音頻 信號的處理效率通過跳過擴展信號的解碼而提高。
本發(fā)明的另一個目的是提供一種用于處理音頻信號的方法和裝置,藉之擴 展信號的解碼利用該擴展信號的長度信息而被跳過。
本發(fā)明的另一個目的是提供一種用于處理音頻信號的方法和裝置,藉之用 于廣播的音頻信號可從隨機時間點再現(xiàn)。
本發(fā)明的又一個目的是提供一種用于處理音頻信號的方法和裝置,藉之音 頻信號根據(jù)級別信息來處理。
有益效果
本發(fā)明具有以下的效果或優(yōu)點。
首先,在進行解碼的情形中,本發(fā)明選擇性地解碼擴展信號以實現(xiàn)更有效 率的解碼。在對擴展信號進行解碼的情形中,本發(fā)明能夠提高音頻信號的聲音 質量。在不對擴展信號進行解碼的情形中,本發(fā)明可降低復雜度。此外,即使 對擴展信號進行解碼,本發(fā)明也能通過僅解碼預定的低頻部分來提高聲音質量 且同樣減少運算負荷。另外,在將音頻信號用于廣播等的情形中,本發(fā)明能夠 以識別音頻信號內存在還是不存在頭部信息的方式,從隨機時間點處理音頻信 號。
附圖簡述
包括于此以提供對本發(fā)明的進一步理解、并被結合在本申請中且構成其一 部分的附圖示出本發(fā)明的實施方式,其與說明書一起可用來解釋本發(fā)明的原 理。
附圖中
圖1是根據(jù)本發(fā)明的一個實施例的音頻信號編碼裝置和音頻信號解碼裝 置的框圖2是根據(jù)本發(fā)明的一個實施例的擴展信號解碼單元90的示意性框圖; 圖3和圖4是根據(jù)本發(fā)明的一個實施例的用于解釋擴展信號長度信息的固 定比特分配的圖5和圖6是根據(jù)本發(fā)明的一個實施例的用于解釋取決于長度類型的擴展
信號長度信息的可變比特分配的圖7和圖8是根據(jù)本發(fā)明的一個實施例用于解釋取決于擴展信號真實長度 的擴展信號長度信息的適應性比特分配的圖9是根據(jù)本發(fā)明的一個實施例用聲道縮減混音信號、輔助信號和擴展信 號配置音頻信號的比特流結構的圖10是根據(jù)本發(fā)明的一個實施例用包括擴展信號在內的輔助信號和聲道 縮減混音信號配置音頻信號的比特流結構的圖11是根據(jù)本發(fā)明的一個實施例用聲道縮減混音信號或輔助信號的配置 立音頻信號的比特流結構的圖12是根據(jù)本發(fā)明的一個實施例用聲道縮減混音信號和輔助信號配置音 頻信號的廣播流結構的圖13是根據(jù)本發(fā)明的一個實施例在將音頻信號用于廣播等的情形中,按 照指示頭部是否被包括在輔助信號中的識別信息來使用擴展信號的長度信息 處理擴展信號的方法的流程圖;以及
圖14是根據(jù)本發(fā)明的一個實施例按照比特流的級別使用擴展信號的長度 信息選擇性地解碼擴展信號的方法的流程圖。
本發(fā)明的最佳實施方式
本發(fā)明的其它特征和優(yōu)點將在以下的描述中闡述,并且部分地將從描述中 顯而易見,或者可從本發(fā)明的實踐中獲知。本發(fā)明的目的和其它優(yōu)點可由書面 說明書及其權利要求書和附圖中具體指出的結構來實現(xiàn)并獲得。
為了實現(xiàn)這些和其它優(yōu)點且根據(jù)本發(fā)明的目的,如具體表達并廣泛描 述的, 一種根據(jù)本發(fā)明的處理音頻信號的方法包括以下步驟從接收的比特 流中提取用于生成音頻信號的輔助信號和包括在該輔助信號中的擴展信號;讀 取該擴展信號的長度信息;基于該長度信息跳過擴展信號的解碼或不使用解碼 的結果;以及利用輔助信號生成音頻信號。
為了進一步實現(xiàn)這些和其它優(yōu)點且根據(jù)本發(fā)明的目的, 一種處理音頻 信號的方法包括以下步驟獲取指示用于生成音頻信號的輔助信號的位置
和包括在該輔助信號中的擴展信號的位置的同步信息;基于該同步信息跳 過擴展信號的解碼或不使用解碼的結果;以及利用該輔助信號生成音頻信號。
為了進一步實現(xiàn)這些和其它優(yōu)點且根據(jù)本發(fā)明的目的, 一種處理音頻
信號的裝置包括信號提取單元,其從接收的比特流中提取用于生成音頻信 號的輔助信號和包括在該輔助信號中的擴展信號;擴展信號長度讀取單元,其 讀取所述擴展信號的長度信息;選擇性解碼單元,其基于該長度信息跳過擴展 信號的解碼或不使用解碼的結果;以及聲道擴展混音單元,其利用輔助信號生 成音頻信號。
為了進一步實現(xiàn)這些和其它優(yōu)點且根據(jù)本發(fā)明的目的, 一種處理音頻 信號的裝置包括同步信息獲取單元,其獲取指示用于生成音頻信號的輔 助信號的位置和包括在該輔助信號中的擴展信號的位置的同步信息;選擇 性解碼單元,其基于該同步信息跳過擴展信號的解碼或不使用解碼的結果;
以及聲道擴展混音單元,其利用該輔助信號生成音頻信號。
應理解,以上的一般描述和以下的詳細描述是示例性和說明性的,并且旨 在提供對如權利要求所述的本發(fā)明的進一步解釋。
本發(fā)明的實施方式
下面將詳細參考本發(fā)明的較佳實施方式,其具體示例圖示于附圖中。 圖1是根據(jù)本發(fā)明的一個實施例的音頻信號編碼裝置和音頻信號解碼裝 置的的框圖。
參考圖1,編碼裝置包括聲道縮減混音單元10、聲道縮減混音信號編碼單 元20、輔助信號編碼單元30、擴展信號編碼單元40和多路復用單元50。
在多源音頻信號X1、X2……Xn被輸入到聲道縮減混音單元10的情形中, 聲道縮減混音單元10通過對該多源信號進行聲道縮減混音處理來生成聲道縮 減混音信號。聲道縮減混音信號包括單聲道信號、立體聲信號和多源音頻信號。 "源"包括聲道,且為了方便起見被描述為聲道。在本發(fā)明的說明書中,解釋
是參考單聲道或立體聲聲道縮減混音信號進行的。然而,本發(fā)明不限于單聲道 或立體聲聲道縮減混音信號。編碼裝置能夠選擇性地且直接地使用從外部提供 的藝術聲道縮減混音信號。在聲道縮減混音過程中,可由多聲道音頻信號生成 輔助信號,且還可生成對應于附加信息的擴展信號。在這種情形中,輔助信號 可包括空間信息信號和擴展信號。所生成的聲道縮減混音信號、輔助信號和擴
展信號分別通過聲道縮減混音信號編碼單元20、輔助信號編碼單元30和擴展 信號編碼單元40編碼,然后傳送到多路復用單元50。
在本發(fā)明中,"空間信息"是指編碼裝置將通過對多聲道信號進行聲道縮 減混音處理所生成的聲道縮減混音信號傳輸?shù)浇獯a裝置時所必需、也是解碼裝 置通過對聲道縮減混音信號進行聲道擴展混音生成多聲道信號時所必需的信 息??臻g信息包括空間參數(shù)。空間參數(shù)包括指示聲道之間能量差的CLD(聲道 電平差)、指示聲道之間相關性的ICC(聲道間相干性)、在由兩聲道生成三聲道 時使用的CPC(聲道預測系數(shù))等。而"擴展信號"是指在通過解碼裝置對聲道 縮減混音信號進行聲道擴展混音來生成多聲道信號時使信號能夠重構得更接 近原始信號所必需的附加信息。例如,附加信息包括殘差信號、藝術聲道縮減 混音殘差信號、藝術樹狀擴展信號等。在這種情形中,殘差信號指示對應于原 始信號和經(jīng)編碼的信號之間的差的信號。在以下的描述中,假設殘差信號包括 一般殘差信號或用于藝術聲道縮減混音信號補償?shù)乃囆g聲道縮減混音殘差信 號。
在本發(fā)明中,聲道縮減混音信號編碼單元20或聲道縮減混音信號解碼單 元70是指編碼或解碼不包括輔助信號的音頻信號的編解碼器。在本發(fā)明中, 將聲道縮減混音音頻信號視為不包括輔助信號的音頻信號的一個例子。并且, 聲道縮減混音信號編碼單元20或聲道縮減混音信號解碼單元70可包括MP3、 AC-3、 DTS或AAC。如果對音頻信號進行編解碼功能,則聲道縮減混音信號 編碼單元20或聲道縮減混音信號解碼單元70可包括未來開發(fā)的編解碼器以及 以前己經(jīng)開發(fā)的編解碼器。
多路復用單元50可通過多路復用聲道縮減混音信號、輔助信號和擴展信 號來生成比特流,然后將所生成的比特流傳輸?shù)浇獯a裝置。在這種情形中,聲 道縮減混音信號和輔助信號兩者都可以以比特流格式傳輸?shù)浇獯a裝置?;蛘撸?br>
輔助信號和聲道縮減混音信號可分別以獨立比特流格式傳輸?shù)浇獯a裝置。將在 圖9至11中解釋比特流的細節(jié)。
在因為音頻信號從隨機時間點開始被解碼而不是像用于廣播的比特流一 樣從開始被解碼,故而不能使用先前傳輸?shù)念^部信息的情形中,就能夠使用插 入于音頻信號中的另一個頭部信息來解碼音頻信號。在傳輸音頻信號期間丟失 頭部信息的情形中,解碼應從接收信號的任意時間點開始。所以,頭部信息可 被插入音頻信號至少一次。如果頭部信息僅在音頻信號的前部存在一次,則對 于在隨機時間點接收音頻信號的情形,由于缺少頭部信息而不能執(zhí)行解碼。在 這種情形中,可根據(jù)預定格式(例如,時間間隔、空間間隔等)引入頭部信息。 可插入指示比特流中是否存在頭部信息的識別信息。且,音頻信號可根據(jù)識別 信息選擇性地包括頭部。例如,輔助信號可根據(jù)頭部識別信息選擇性地引入頭
部。將在圖9至12中解釋比特流結構的細節(jié)。
解碼裝置包括多路分解單元60、聲道縮減混音信號解碼單元70、輔助信 號解碼單元80、擴展信號解碼單元90以及聲道擴展混音單元100。
多路分解單元60接收比特流,然后從所接收的比特流中分離出經(jīng)編碼的 聲道縮減混音信號、經(jīng)編碼的輔助信號以及經(jīng)編碼的擴展信號。聲道縮減混音 信號解碼單元70對經(jīng)編碼的聲道縮減混音信號進行解碼。且輔助信號解碼單 元80對經(jīng)編碼的輔助信號進行解碼。
同時,擴展信號可包括在輔助信號中。需要高效率地解碼擴展信號,以便 高效率地生成多聲道音頻信號。所以,擴展信號解碼單元90能夠選擇性地解 碼經(jīng)編碼的擴展信號。具體地,經(jīng)編碼的擴展信號可以被解碼,或者經(jīng)編碼的 擴展信號的解碼可以被跳過。有時,如果擴展信號的解碼處理被跳過,則經(jīng)編 碼的信號可以被重構得更接近原始信號,且譯碼效率得以提高。
例如,如果解碼裝置的級別(level)低于比特流,則解碼裝置不能解碼所 接收的擴展信號。所以,擴展信號的解碼可以被跳過。即使因為解碼裝置的級 別高于比特流,擴展信號的解碼是可用的,擴展信號的解碼也能通過從音頻信 號獲取的另一個信息而被跳過。在這種情形中,例如,這另一個信息可包括指 示是否執(zhí)行擴展信號的解碼的信息。這將在后面參考圖14詳細解釋。
例如,為了省略擴展信號的解碼,可從比特流中讀取擴展信號的長度信息,
且可利用該長度信息跳過擴展信號的解碼?;蛘?,可利用指示擴展信號的位置
的同步信息跳過擴展信號的解碼。這將在后面參考圖2詳細解釋。
可按各種方式定義擴展信號的長度信息。例如,可分配固定比特,或者可 根據(jù)預定長度信息類型分配可變比特,或者在讀取擴展信號的長度的同時可適 應性地分配適合于真實擴展信號的長度的比特。在圖3和圖4中解釋固定比特 分配的細節(jié)。在圖5和圖6中解釋可變比特的細節(jié)。且在圖7和圖8中解釋適 應性比特分配的細節(jié)。
擴展信號的長度信息可位于輔助數(shù)據(jù)區(qū)內。在這種情形中,輔助數(shù)據(jù)區(qū)指 示一個存在將聲道縮減混音信號重構成原始信號所需的附加信息的區(qū)域。例 如,可將空間信息信號或擴展信號作為輔助數(shù)據(jù)的一個例子。所以,擴展信號 的長度信息可位于輔助信號或輔助信號的擴展區(qū)中。
具體地,擴展信號的長度信息位于輔助信號的頭部擴展區(qū)、輔助信號的幀 數(shù)據(jù)擴展區(qū)或輔助信號的頭部擴展區(qū)和幀數(shù)據(jù)擴展區(qū)兩個區(qū)中。這將在稍后參 考圖9至11詳細解釋。
圖2是根據(jù)本發(fā)明的一個實施例的擴展信號解碼單元90的示意性框圖。 參考圖2,擴展信號解碼單元90包括擴展信號類型信息獲取單元91、擴 展信號長度讀取單元92和選擇性解碼單元93。且,選擇性解碼單元93包括級 別解碼單元94、擴展信號信息獲取單元95以及擴展信號信息跳過單元96。擴 展信號解碼單元90從多路分解單元60接收擴展信號的比特流,然后輸出經(jīng)解 碼的擴展信號。有時,擴展信號解碼單元90可能不輸出擴展信號,或可通過 對擴展信號比特流完整地補零輸出擴展信號。對于不輸出擴展信號的情形,可 使用跳過擴展信號的解碼的方法。擴展信號類型獲取單元91從比特流獲取指 示擴展信號的類型的信息。例如,指示擴展信號的類型的信息可包括殘差信號、 藝術聲道縮減混音殘差信號、藝術樹狀擴展信號等。在本發(fā)明中,殘差信號是 一般殘差信號和用于補償藝術聲道縮減混音信號的藝術聲道縮減混音殘差信 號的通用術語。殘差信號可用于補償多聲道音頻信號中的藝術聲道縮減混音信 號或解碼時的特定聲道補償。任選地,還可使用這兩種情形。如果擴展信號的 類型由擴展信號類型信息確定,則擴展信號長度讀取單元92讀取由擴展信號 的類型信息確定的擴展信號的長度。不管是否進行擴展信號的解碼這都可實 現(xiàn)。 一旦讀取了擴展信號的長度,選擇性解碼單元93就選擇性地對擴展信號 進行解碼。這可由級別確定單元94確定。具體地,級別確定單元94通過將比 特流的級別與解碼裝置的級別相比較來選擇是否執(zhí)行擴展信號的解碼。例如, 如果解碼裝置的級別等于或高于比特流的級別,則解碼裝置經(jīng)由擴展信號信息 獲取單元95獲取關于擴展信號的信息,然后解碼該信息以輸出擴展信號。所 輸出的擴展信號被傳輸至聲道擴展混音單元100,以便在重構原始信號或生成 音頻信號時使用。然而,如果解碼裝置的級別低于比特流的級別,則可經(jīng)由擴 展信號跳過單元96跳過擴展信號的解碼。在這種情形中,可基于由擴展信號 長度讀取單元92讀取的長度信息來跳過擴展信號的解碼。因此,在使用擴展 信號的情形中,可實現(xiàn)更接近原始信號的重構,以提高聲音質量。如果必要的 話,可通過省略擴展信號的解碼來減小解碼裝置的運算量。
作為在擴展信號信息跳過單元96中省略擴展信號的解碼的方法的一個例 子,在使用擴展信號的長度信息的情形中,擴展信號的比特或字節(jié)長度信息可 插入數(shù)據(jù)中。且,解碼可通過跳過與從長度信息獲取的值一樣多的擴展信號的 比特字段而繼續(xù)進行。將參考圖3至8解釋限定擴展信號的長度信息的方法。
作為省略擴展信號的解碼的方法的另一個例子,可基于指示擴展信號的位 置的同步信息跳過擴展信號的解碼。例如,可在擴展信號結束的點插入具有預 定比特的同步字。解碼裝置繼續(xù)搜索殘差信號的比特字段,直到找到擴展信號 的同步字。 一旦找到同步字,解碼裝置就停止搜索過程,然后繼續(xù)進行解碼。 具體地,可跳過擴展信號的解碼直到找到擴展信號的同步字。作為根據(jù)選擇的 進行解碼的方法的另一個例子,在進行擴展信號的解碼的情形中,可在對擴展 信號做語法分析后進行解碼。當進行擴展信號的解碼時,擴展信號的同步字可 被讀取但可能不可用。
圖3和圖4是根據(jù)本發(fā)明的一個實施例用于解釋關于擴展信號的長度信息 的固定比特分配的圖。
擴展信號的長度信息可由比特或字節(jié)單位來定義。如果長度信息由字節(jié)單 元確定,則表示擴展信號被分配了字節(jié)。圖3示出以最簡單的方式定義關于擴 展信號的長度信息的方法。且,圖4示意性地示出圖3所示的方法。定義了用 于指示擴展信號的長度信息的句法要素,并將預定比特分配給句法要素。例如,
"bsResidualSignalLength"被定義為句法要素,且分配16比特作為固定比特。 然而,該方法可能消耗相當大量的比特。所以,圖5、圖6、圖7和圖8中示 出的方法解釋如下。
圖5和圖6是根據(jù)本發(fā)明的一個實施例用于解釋取決于長度類型可變地分 配擴展信號的長度信息的比特的圖。
圖5示出為定義有多少比特要用于"bsResidualSignalLength"而多定義一 個句法要素的方法,以進一步減少比特消耗。而圖6示意性地示出圖5所示的 方法。例如,"bsResidualSignalLengthtype"被新定義為長度類型。如果 "bsResidualSignalLengthtype "的值是0 ,貝lj將4 比特分配給 "bsResidualSignalLength"。如果"bsResidualSignalLengthtype"的值是1,則 將8比特分配給"bsResidualSignalLength"。如果"bsResidualSignalLengthtype" 的值是2 ,則將12比特分配給"bsResidualSignalLength "。如果 "bsResidualSignalLengthtype "的值是3 ,貝U將16比特分配給 "bsResidualSignalLength"。在這種情形中,所分配的比特是示例性的。所以, 可以分配與以上定義的比特不同的比特。為了比以上方法更多地減少比特消 耗,提供了圖7和圖8中所示的方法。
圖7和圖8是根據(jù)本發(fā)明的一個實施例用于解釋取決于擴展信號的真實長 度的適應性地分配擴展信號的長度信息的比特的圖。
如果輸入擴展信號,則可讀取擴展信號的長度信息值直到最初確定的值。 如果長度信息值等于預定值,則可附加地讀取直到另外確定的值。如果長度信 息值等于另一個預定值,則可附加地讀取直到另一個另外確定的值。在這種情 形中,如果長度信息值不是該另一個預定值,則對應的值按原樣輸出作為長度 信息值。因此,根據(jù)真實數(shù)據(jù)長度適應性地讀取擴展信號的長度信息,由此可 最大程度地減少比特消耗。下面解釋圖7和圖8中所示的例子。
在圖7中,以殘差信號作為擴展信號的一個例子。如果輸入殘差信號,則 4比特的殘差信號長度被讀取。如果長度信息值(bsResidualSignalLength)是2、1 (=15),則再讀取8比特作為bsResidualSignalLengthl的值。如果長度信息值 (bsResidualSignalLength)是(24-l) + (28-1) (=15+255),則再讀取12比特作為 bsResidualSignalLength2的值。以相同的方式,如果長度信息值
(bsResidualSignalLength)是(24-l) + (28-1) + (212-1) (=15+255+4095),則再讀取16 比特作為bsResidualSignalLength3的值。
圖8示意性地示出擴展信號的長度信息的適應性比特分配的另一個例子。
在圖8中,如果輸入擴展信號,則優(yōu)先讀取4比特。如果由讀取長度信息 得到的值小于4比特,則對應的值成為長度信息。然而,如果由讀取長度信息 得到的值大于4比特,則另外再讀取8比特。如果另外讀取的值小于8比特, 總的讀取長度信息值對應于12(=4+8)。然而,如果另外讀取的值大于8比特, 則再另外讀取16比特。這將被詳細解釋如下。首先,如果輸入長度信息,則 讀取4比特。真實長度信息值的范圍是0 ~ 14。如果長度信息值變?yōu)?4-1 (=15), 則另外再次讀取擴展信號。在這種情形中,可附加地讀取擴展信號直到28-2 (=254)。然而,如果長度信息值對應于小于24-1 (=15)的值,則讀取的值0 ~ (24-2) (=14)按原樣輸出。 一旦長度信息值變?yōu)?24-1) + (28-1),則另外再次讀取擴展信 號。在這種情形中,可附加地讀取擴展信號直到(216-1)。然而,如果長度信息 值對應于小于216-1的值,則讀取的值0~(216-1)(=14)按原樣輸出。在這種情 形中,如上所述,分配的比特是用于解釋的示例。所以也可分配與上述定義的 比特不同的其它比特。
同時擴展信號的長度信息可以是擴展信號頭部的長度信息或擴展信號幀 數(shù)據(jù)的長度信息。所以,擴展信號的長度信息可位于頭部區(qū)和/或幀數(shù)據(jù)區(qū)中。 將參考圖9至12解釋用于此的比特流結構。
圖9和圖IO示出本發(fā)明的實施例,其中示出了用聲道縮減混音信號、輔 助信號和擴展信號配置音頻信號的比特流結構。
音頻信號包括聲道縮減混音信號和輔助信號。作為輔助信號的一個例子, 可以舉空間信息信號為例。聲道縮減混音信號和輔助信號各自以幀為單位傳 輸。輔助信號可包括頭部信息和數(shù)據(jù)信息,或者可僅包括數(shù)據(jù)信息。因此,在 配置一個音頻信號的文件/通用流結構中,頭部信息在前,隨后是數(shù)據(jù)信息。例 如,在用聲道縮減混音信號和輔助信號配置音頻信號的文件/通用流結構的情形 中,聲道縮減混音信號頭部和輔助信號頭部可作為頭部信息存在于前部。并且, 聲道縮減混音信號數(shù)據(jù)和輔助信號數(shù)據(jù)可配置一個幀,作為前部之后的數(shù)據(jù)信 息。在這種情形中,通過定義輔助數(shù)據(jù)的擴展區(qū),可定位擴展信號。擴展信號
可被包括在輔助信號中或可被用作獨立信號。圖9示出擴展信號被用作獨立信 號的情形,而圖10示出擴展信號位于輔助信號的擴展區(qū)中的情形。所以,在 存在擴展信號的情形中,在文件/通用流結構中,擴展信號的頭部可作為頭部信 息存在于前部,聲道縮減混音頭部和空間信息頭部也一樣。在前部之后,作為 數(shù)據(jù)信息,還可以包括擴展信號數(shù)據(jù),以及聲道縮減混音信號數(shù)據(jù)和輔助信號 數(shù)據(jù),用于配置一個幀。因為擴展信號可被選擇性地解碼,所以它可位于幀的 最后部分,或可連續(xù)地存在于輔助信號之后。圖3至8中解釋的長度信息可存 在于擴展信號的頭部區(qū)中和/或擴展信號的數(shù)據(jù)區(qū)中。在這種情形中,存在于頭 部區(qū)(擴展信號頭部)中的長度信息指示擴展信號頭部的長度信息,而存在于數(shù) 據(jù)區(qū)(擴展信號數(shù)據(jù))中的長度信息指示擴展信號數(shù)據(jù)的長度信息。因此,從比 特流讀取存在于每一個區(qū)中的長度信息,且解碼裝置可基于長度信息跳過擴展 信號的解碼。
圖11是根據(jù)本發(fā)明的一個實施例用聲道縮減混音信號或輔助信號配置獨 立音頻信號的比特流結構的圖。
音頻信號包括聲道縮減混音信號和輔助信號??刹捎每臻g信息信號作為輔 助信號的一個例子。聲道縮減混音信號和輔助信號可分別作為獨立信號傳輸。
在這種情形中,聲道縮減混音信號具有這樣的結構作為頭部信息的聲道縮減
混音信號頭部(聲道縮減混音信號頭部⑥)位于前部,且作為數(shù)據(jù)信息的聲道縮 減混音信號數(shù)據(jù)(聲道縮減混音信號數(shù)據(jù)①、②、③…… )在聲道縮減混音信
號頭部之后。同樣,輔助信號具有這樣的結構作為頭部信息的輔助信號頭部 (輔助信號頭部⑥)位于前部,且作為數(shù)據(jù)信息的輔助信號數(shù)據(jù)(輔助信號數(shù)據(jù) ①、②……頓)在輔助信號頭部之后。因為擴展信號可被包括在輔助信號內, 所以可提供一種擴展信號在輔助信號之后的結構。所以,擴展信號頭部⑥在輔 助信號頭部(g)之后,擴展信號數(shù)據(jù)①在輔助信號數(shù)據(jù)①之后。同樣,擴展信號 數(shù)據(jù)②在輔助信號數(shù)據(jù)②之后。在這種情形中,擴展信號的長度信息可被包括 在擴展信號頭部⑥、擴展信號數(shù)據(jù)①和/或擴展信號數(shù)據(jù)②……以及@中的每一 個之中。
同時,與文件/通用流結構不同,在因為是從隨機時間點解碼音頻信號而 不是從開始解碼而不能使用先前傳輸頭部信息的情形中,可以使用包括在音頻
信號中的另一個頭部信息來解碼。在使用用于廣播等的音頻信號或在傳輸音頻 信號期間丟失了頭部信息的情形中,解碼應當從接收信號的任何時刻開始。所 以,可通過定義指示是否存在頭部的識別信息來提高譯碼效率。以下將參考圖
12解釋用于廣播的流結構。
圖12是根據(jù)本發(fā)明的一個實施例用聲道縮減混音信號和輔助信號配置音 頻信號的廣播流結構的圖。
在廣播流的情形中,如果頭部信息僅在音頻信號的前部存在一次,則在任 意時間點接收音頻信號的情形中,由于缺少頭部信息而不能執(zhí)行解碼。所以, 可將頭部信息插入音頻信號至少一次。在這種情形中,可根據(jù)預定格式(例如, 時間間隔、空間間隔等)引入頭部信息。具體地,可將頭部信息插入到每一個 幀中,以固定間隔周期性地插入每一個幀中,或以隨機隔間非周期性地插入每 一個幀中?;蛘?,可根據(jù)固定時間間隔(例如,2秒)插入頭部信息一次。
配置一個音頻信號的廣播流結構具有這樣的結構頭部信息在數(shù)據(jù)信息之
間至少被插入一次。例如,在配置一個音頻信號的廣播流結構的情形中,聲道 縮減混音信號在前,且輔助信號在該聲道縮減混音信號之后。用于區(qū)分聲道縮 減混音信號和輔助信號的同步信息可位于輔助信號的前部。并且,可定位
(locate)指示關于輔助信號的頭部信息是否存在的識別信息。例如,如果頭 部識別信息是0,則下一個讀取的幀僅具有數(shù)據(jù)幀而沒有頭部信息。如果頭部 識別信息是l,則下一個讀取的幀具有頭部信息和數(shù)據(jù)幀。這可適用于輔助信 號或擴展信號。這些頭部信息可與最初已被傳輸?shù)念^部信息相同或可以是可變 的。在頭部信息可變的情形中,新的頭部信息被解碼,且在新的頭部信息之后 傳輸?shù)臄?shù)據(jù)信息于是根據(jù)經(jīng)解碼的新的頭部信息來解碼。在頭部識別信息是0 的情形中,傳輸?shù)膸瑑H具有數(shù)據(jù)幀而沒有頭部信息。在這種情形中,為了處理 數(shù)據(jù)幀,可使用先前傳輸?shù)念^部信息。例如,如果在圖12中頭部識別信息是1, 則可存在輔助信號頭部①和擴展信號頭部①。然而,如果由于頭部識別信息被 設定為0,下一個輸入的幀不具有頭部信息,則可使用先前傳輸?shù)臄U展信號頭 部①的信息來處理擴展信號數(shù)據(jù)③。
圖13是根據(jù)本發(fā)明的一個實施例在將音頻信號用于廣播等的情形中,按 照指示頭部是否被包括在輔助信號中的識別信息來基于擴展信號的長度信息
處理擴展信號的方法的流程圖。
參考圖13,從所接收的比特流中提取用于生成音頻信號的輔助信號和包 括在該輔助信號中的擴展信號(1301)。擴展信號可被包括在輔助信號中。提取 指示頭部是否被包括在輔助信號中的識別信息(1303)。例如,如果頭部識別信 息是l,則它指示輔助信號頭部被包括在輔助信號中。如果頭部識別信息是O, 則它指示輔助信號頭部沒有被包括在輔助信號中。在擴展信號被包括在輔助信 號中的情形中,如果頭部識別信息是l,則它指示擴展信號頭部被包括在擴展 信號中。如果頭部識別信息是O,則它指示擴展信號頭部沒有被包括在擴展信 號中。根據(jù)頭部識別信息判定頭部是否被包括在輔助信號中(1305)。如果頭部 被包括在輔助信號中,則從頭部提取長度信息(1307)。并且,可基于長度信息 跳過擴展信號的解碼(1309)。在這種情形中,頭部在使每一個輔助信號和/或每 一個擴展信號得到解釋中發(fā)揮著作用。例如,頭部信息可包括關于殘差信號的 信息、關于殘差信號的長度的信息、指示殘差信號的位置的同步信息、采樣頻 率、幀長度、參數(shù)頻帶的號碼、樹狀配置信息、量化模式信息、ICC(聲道間電 平差)、參數(shù)平滑信息、防止剪裁(clip-prevention)的增益信息、與信息相關 聯(lián)的QMF(正交鏡像濾波器)等。此外,如果根據(jù)頭部識別信息,頭部沒有被包 括在輔助信號中,則可基于先前提取的關于頭部的長度信息跳過擴展信號的解 碼(13H)。
圖14是根據(jù)本發(fā)明的一個實施例基于擴展信號的長度信息選擇性地解碼 擴展信號的方法的流程圖。
輪廓文件(profile)意味著譯碼過程中的算法技術要素是標準化的。具體 地,輪廓文件是解碼比特流所必需的一組技術要素,并對應于一類子標準。級 別(level)限定所支持的輪廓文件中規(guī)定的技術要素的范圍。具體地,級別在 限定解碼裝置的能力和比特流的復雜性方面發(fā)揮著作用。在本發(fā)明中,級別信 息可包括輪廓文件和級別的定義。擴展信號的解碼方法可根據(jù)比特流的級別信 息和解碼裝置的級別信息而改變。例如,即使在傳輸?shù)囊纛l信號中存在擴展信 號,作為判定級別信息的結果,可以執(zhí)行或可以不執(zhí)行擴展信號的解碼。此外, 盡管執(zhí)行解碼,可僅使用預定的低頻部分。此外,在擴展信號的解碼中可以跳 過多達擴展信號的長度信息,以便不執(zhí)行擴展信號的解碼?;蛘撸M管擴展信
號被完全讀取,也不能執(zhí)行解碼。此外,讀取一部分擴展信號,僅對讀取部分 進行解碼,且不能對擴展信號的其余部分進行。或者,可完全地讀取擴展信號, 解碼一部分擴展信號,而不解碼其余擴展信號。
例如,參考圖14,從所接收的比特流中提取用于生成音頻信號的輔助信 號和包括在該輔助信號中的擴展信號(1410)。并且,可提取關于擴展信號的信 息。在這種情形中,關于擴展信號的信息可包括指示擴展信號的數(shù)據(jù)類型的擴 展數(shù)據(jù)類型信息。例如,擴展數(shù)據(jù)類型信息包括殘差譯碼數(shù)據(jù)、藝術聲道縮減 混音殘差譯碼數(shù)據(jù)、藝術樹狀擴展數(shù)據(jù)等。所以,判定擴展信號的類型,并能 從音頻信號的擴展區(qū)讀取擴展信號的長度信息(1420)。隨后,判定比特流的級 別。這可參考以下的信息來判定。例如,如果擴展信號的類型是殘差譯碼數(shù)據(jù), 則比特流的級別信息可包括輸出聲道數(shù)、采樣率、殘差信號的帶寬等。所以, 如果以上解釋的級別信息被輸入,則它們與關于解碼裝置的級別信息進行比較 以判定擴展信號是否將被解碼(1430)。在這種情形中,解碼裝置的級別可預先 設定。 一般而言,解碼裝置的級別應等于或大于音頻信號。這是因為,解碼裝 置應當能夠完整地解碼傳輸?shù)囊纛l信號。然而,在對解碼裝置進行限制的情形 中(例如,在解碼裝置的級別小于音頻信號的情形中),解碼有時是可能的。然 而,相應的質量可能劣化。例如,如果解碼裝置的級別低于音頻信號,則解碼 裝置不能解碼音頻信號。然而,在某些情形中,音頻信號可基于解碼裝置的級 別而被解碼。
在判定解碼裝置的級別低于比特流的級別的情形中,可基于擴展信號的長 度信息跳過擴展信號的解碼(1440)。另一方面,在解碼裝置的級別等于或高于 比特流的級別的情形中,可執(zhí)行擴展信號的解碼(1460)。然而,盡管擴展信號 的解碼被執(zhí)行,解碼也可僅在擴展信號的預定低頻部分上執(zhí)行(1450)。例如, 存在這樣的情形由于解碼裝置是低功率解碼器,如果擴展信號被完全解碼, 效率將降級,或者,由于解碼裝置不能解碼整個擴展信息,可使用擴展信號的 預定低頻部分。并且,僅在比特流的級別或解碼裝置的級別滿足指定條件時, 這是可能的。
工業(yè)實用性 因此,編碼和解碼信號的各種環(huán)境可能普遍存在,且可存在根據(jù)各種環(huán)境 條件處理信號的各種方法。在本發(fā)明中,將處理音頻信號的方法作為一個例子, 這不會限制本發(fā)明的范圍。在這種情形中,信號包括音頻信號和/或視頻信號。
盡管已參考本發(fā)明的較佳實施例描述并說明了本發(fā)明,但本領域內技術人員可 以理解,可對本發(fā)明作出各種修改和變化而不脫離本發(fā)明的精神或范圍。因此, 本發(fā)明旨在涵蓋所附權利要求書及其等價技術方案的范圍內的本發(fā)明的所有 這些修改和變化。
權利要求
1.一種用于處理音頻信號的方法,其包括以下步驟從接收的比特流中提取用于生成音頻信號的輔助信號和包括在所述輔助信號中的擴展信號;讀取所述擴展信號的長度信息;基于所述長度信息跳過所述擴展信號的解碼,或不使用所述解碼的結果;以及利用所述輔助信號生成音頻信號。
2. 如權利要求l所述的方法,其特征在于,所述擴展信號是殘差信號。
3. 如權利要求1或2所述的方法,其特征在于,向所述擴展信號的長度 信息分配固定比特。
4. 如權利要求1或2所述的方法,其特征在于,根據(jù)所述擴展信號的長 度類型信息向擴展信號的長度信息分配可變比特。
5. 如權利要求1或2所述的方法,其特征在于,根據(jù)所述擴展信號的長 度向所述擴展信號的長度信息分配適應性比特。
6. —種用于處理音頻信號的方法,其包括以下步驟 獲取指示用于生成音頻信號的輔助信號的位置和包括在所述輔助信號中的擴展信號的位置的同步信息;基于所述同步信息跳過所述擴展信號的解碼,或不使用所述解碼的結果;以及利用所述輔助信號生成音頻信號。
7. 如權利要求6所述的方法,其特征在于,所述同步信息指示所述擴展 信號的起始點和/或結束點。 -
8. 如權利要求6所述的方法,其特征在于,所述擴展信號是殘差信號。
9. 一種用于處理音頻信號的裝置,包括信號提取單元,其從接收的比特流中提取用于生成音頻信號的輔助信號和 包括在所述輔助信號中的擴展信號;擴展信號長度讀取單元,其讀取所述擴展信號的長度信息;選擇性解碼單元,其基于所述長度信息跳過所述擴展信號的解碼,或不使 用所述解碼的結果;以及聲道擴展混音單元,其利用所述輔助信號生成音頻信號。
10. —種用于處理音頻信號的裝置,包括同步信息獲取單元,獲取指示用于生成音頻信號的輔助信號的位置和包括在所述輔助信號中的擴展信號的位置的同步信息;選擇性解碼單元,其基于所述同步信息跳過所述擴展信號的解碼,或不使 用所述解碼的結果;以及聲道擴展混音單元,其利用所述輔助信號生成音頻信號。
全文摘要
一種處理音頻信號的方法,包括以下步驟從接收的比特流中提取用于生成音頻信號的輔助信號和包括在該輔助信號中的擴展信號;讀取擴展信號的長度信息;基于長度信息跳過擴展信號的解碼,或不使用該解碼的結果;以及利用輔助信號生成所述音頻信號。因此,在通過本發(fā)明處理音頻信號的情形中,可減少對應的運算負荷以實現(xiàn)高效率處理并提高聲音質量。
文檔編號H03M7/30GK101361276SQ200780001517
公開日2009年2月4日 申請日期2007年2月16日 優(yōu)先權日2006年2月23日
發(fā)明者吳賢午, 房熙錫, 林宰顯, 鄭亮源, 金東秀 申請人:Lg電子株式會社