專利名稱:通過(guò)選擇性通道解碼的高效多通道信號(hào)處理的制作方法
技術(shù)領(lǐng)域:
本發(fā)明總體涉及音頻和視頻編碼系統(tǒng),并且,更特別地,屬于改進(jìn)的處理并解碼代表音頻和視頻信息的數(shù)據(jù)的方式。
背景技術(shù):
大量的國(guó)際標(biāo)準(zhǔn)定義了對(duì)于記錄和傳送可如何編碼和格式化代表聽(tīng)覺(jué)和視覺(jué)刺激的信息以及對(duì)于重放可如何接收并解碼編碼的信息。為了便于討論,代表聽(tīng)覺(jué)和視覺(jué)刺激的信息在這里分別被稱為音頻和視頻信息。符合這些標(biāo)準(zhǔn)的許多的應(yīng)用以串行的方式作為二進(jìn)制數(shù)據(jù)傳送編碼的音頻和視頻信息。作為結(jié)果,編碼數(shù)據(jù)常被稱為比特流,但是,數(shù)據(jù)的其它的布置是允許的。為了便于討論,這里,不管使用什么數(shù)據(jù)格式或記錄或傳送技術(shù),都使用術(shù)語(yǔ)“比特流”以表示編碼數(shù)據(jù)。由國(guó)際標(biāo)準(zhǔn)組織(International Standards Organization(ISO))公開(kāi)的這些標(biāo)準(zhǔn)的兩個(gè)例子是也稱為MPEG-2的IS0/IEC 13818-7、高級(jí)音頻編碼(Advanced Audio Coding(AAC))和也稱為MPEG-4音頻的IS0/IEC 14496-3,子部分(subpart)4。出于本公開(kāi)的目的,這兩個(gè)標(biāo)準(zhǔn)共享使得它們相互類似的技術(shù)特征。諸如MPEG-2AAC和MPEG-4音頻標(biāo)準(zhǔn)的標(biāo)準(zhǔn)定義了能夠傳輸代表一個(gè)或更多個(gè)音頻通道的編碼數(shù)據(jù)的比特流。音頻通道的概念是公知的。常規(guī)的具有兩個(gè)揚(yáng)聲器的立體聲重放系統(tǒng)是能夠再現(xiàn)常稱為左(L)和右(R)通道的兩個(gè)音頻通道的重放系統(tǒng)的公知的例子。用于所謂的家庭影院應(yīng)用的多通道重放系統(tǒng)能夠再現(xiàn)諸如中心(C)、后左環(huán)繞(BL)、后右環(huán)繞(BR)和低頻效果(LFE)通道的附加的通道。能夠從編碼比特流重放音頻的系統(tǒng)必須包括能夠從比特流提取編碼數(shù)據(jù)并將提取的數(shù)據(jù)解碼為代表各個(gè)音頻通道的信號(hào)的裝置。解碼數(shù)據(jù)并應(yīng)用合成濾波器以獲得輸出信號(hào)所需要的存儲(chǔ)和處理的硬件資源的成本是解碼裝置的總制造成本的相當(dāng)大的部分。作為結(jié)果,解碼器的功率需求和購(gòu)買價(jià)格明顯受解碼器能夠解碼的通道的數(shù)量影響。在降低功率需求和購(gòu)買價(jià)格的努力中,音頻系統(tǒng)制造商構(gòu)建能夠僅解碼在比特流標(biāo)準(zhǔn)中定義的所有通道中的希望的子集的解碼器。參照MPEG-2AAC和MPEG-4音頻標(biāo)準(zhǔn)作為例子,比特流可傳輸代表1 48個(gè)音頻通道的編碼數(shù)據(jù),但是,大多數(shù)的實(shí)際的解碼器,如果不是所有的話,可只解碼最大數(shù)量的通道中的一小部分。典型的解碼器將只有在其具有將在特定比特流中傳輸?shù)乃芯幋a通道解碼的能力時(shí)才處理該特定比特流。如果典型的解碼器接收傳輸代表比它可解碼的音頻通道多的音頻通道的數(shù)據(jù),那么,該解碼器基本上舍棄比特流中的編碼數(shù)據(jù),并且不解碼通道中的任一個(gè)。由于解碼器不具有以智能的方式選擇和處理由比特流傳輸?shù)耐ǖ赖淖蛹枰倪壿?,因此存在這種不幸的情況
發(fā)明內(nèi)容
本發(fā)明的目的是提供如下這樣的解碼器,該解碼器能夠處理并解碼傳輸代表其數(shù)量超過(guò)解碼器能夠解碼的通道的數(shù)量的多個(gè)通道的數(shù)據(jù)的比特流。本發(fā)明的另一目的是,以高效的并且使處理比特流所需要的計(jì)算資源最小化的方式提供該能力。通過(guò)本發(fā)明實(shí)現(xiàn)這些目的。根據(jù)本發(fā)明的一個(gè)方面,解碼器接收傳輸表示一個(gè)或更多個(gè)音頻通道的編碼信息的輸入信號(hào),對(duì)于由編碼信息表示的一個(gè)或更多個(gè)音頻通道確定通道配置圖,使用通道配置圖以獲得規(guī)定一個(gè)或更多個(gè)音頻通道中的哪些要被解碼的通道選擇掩模,并且,根據(jù)通道選擇掩模從輸入信號(hào)提取編碼的信息并且解碼提取的編碼的 fn息ο通過(guò)參照以下的討論和附圖,可以更好地理解本發(fā)明及其優(yōu)選實(shí)施例的各種特征,在這些附圖中,類似的附圖標(biāo)記指的是類似的元素。作為例子闡述以下的討論的內(nèi)容和附圖。對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō),包含于本發(fā)明的范圍內(nèi)的替代性的實(shí)現(xiàn)和等同的特征應(yīng)是容易想到的。
圖1是音頻解碼器的示意性框圖。圖2是用于圖1的音頻解碼器中的通道選擇部件的示意性框圖。圖3和圖4是示出通道選擇部件的示意性實(shí)現(xiàn)的操作的示意性框圖。圖5是可用于實(shí)現(xiàn)本發(fā)明的各方面的裝置的示意性框圖。
具體實(shí)施例方式A.引言圖1是音頻解碼器10的示意性框圖,該音頻解碼器10從通信路徑11接收傳輸代表編碼音頻信息的一個(gè)或更多個(gè)通道的比特流的輸入信號(hào)并且沿通信路徑19產(chǎn)生代表解碼音頻信息的一個(gè)或更多個(gè)通道的輸出信號(hào)。解碼器10具有從輸入信號(hào)比特流提取編碼數(shù)據(jù)的一系列的塊或語(yǔ)法元素的分析部件12,這些塊或語(yǔ)法元素然后沿路徑13被轉(zhuǎn)送到選擇部件14。選擇部件14確定編碼數(shù)據(jù)的哪些語(yǔ)法元素沿路徑15被轉(zhuǎn)送到解碼部件16, 該解碼部件16向編碼數(shù)據(jù)的塊應(yīng)用解碼處理以沿路徑17產(chǎn)生解碼數(shù)據(jù)。濾波器部件18 向解碼數(shù)據(jù)應(yīng)用一個(gè)或更多個(gè)合成濾波器以沿路徑19產(chǎn)生解碼音頻信息。在解碼器10的常規(guī)的實(shí)現(xiàn)中,選擇部件14檢查從路徑13接收的語(yǔ)法元素的內(nèi)容,以確定在輸入信號(hào)中傳輸?shù)木幋a音頻信息的輸入通道的數(shù)量,并將該數(shù)量與解碼器10 能夠解碼的音頻通道的數(shù)量相比。如果在輸入信號(hào)中傳輸?shù)妮斎胪ǖ赖臄?shù)量小于等于解碼器10能夠解碼的通道的數(shù)量,那么選擇部件14沿路徑15將所有通道的語(yǔ)法元素轉(zhuǎn)送到解碼部件16 ;否則,選擇部件14不將任何語(yǔ)法元素轉(zhuǎn)送到解碼部件16,或者它向解碼部件16 提供表示沒(méi)有通道要被解碼的一些信號(hào)。解碼部件16向包含于沿路徑15轉(zhuǎn)送的語(yǔ)法元素中的數(shù)據(jù)應(yīng)用適當(dāng)?shù)慕獯a處理。 解碼處理應(yīng)與用于產(chǎn)生在語(yǔ)法元素中傳輸?shù)木幋a數(shù)據(jù)的編碼處理互補(bǔ)。如果輸入信號(hào)符合 MPEG-2AAC和MPEG-4音頻標(biāo)準(zhǔn),那么,例如,解碼部件16應(yīng)用分別符合IS0/IEC 13818-7或 IS0/IEC 14496-3,子部分4,標(biāo)準(zhǔn)的處理。
從由語(yǔ)法元素傳輸?shù)臄?shù)據(jù)導(dǎo)出的解碼數(shù)據(jù)沿路徑17被轉(zhuǎn)送到濾波器部件18,該濾波器部件18向解碼的語(yǔ)法元素中的數(shù)據(jù)應(yīng)用作為由編碼語(yǔ)法元素中的數(shù)據(jù)的編碼器使用的分析濾波器的逆的合成濾波器??梢砸愿鞣N方式實(shí)現(xiàn)合成濾波器,包括諸如逆修正離散余弦變換Gnverse Modified Discrete Cosine Transform)的變換或諸如正交鏡像濾波器(QMF)的濾波器。B.增強(qiáng)通道選擇包括本發(fā)明的各方面的解碼器使用增強(qiáng)的選擇部件14,以確定限定了要被選擇和處理以便重放的輸入比特流中的音頻通道的通道選擇掩模。以下描述從使用一組的一個(gè)或更多個(gè)通道選擇圖(channel selection map)的處理構(gòu)建通道選擇掩模的一種實(shí)現(xiàn)。這些圖限定了可在不對(duì)于輸入比特流中的通道的數(shù)量施加任何限制的情況下被解碼的輸出通道的數(shù)量和類型的配置。替代性的實(shí)現(xiàn)是可能的。由于在啟動(dòng)計(jì)算密集的解碼算法之前的接收/解碼處理的早期階段基本舍棄不被選擇用于解碼的那些通道的數(shù)據(jù),因此,該通道選擇處理是高效的。換句話說(shuō),僅向被選擇用于解碼的那些通道應(yīng)用全部接收/解碼處理的計(jì)算密集部分。這些方面可與符合MPEG-2AAC和MPEG-4音頻標(biāo)準(zhǔn)的所有當(dāng)前限定的變型以及具有類似的數(shù)據(jù)結(jié)構(gòu)的其它標(biāo)準(zhǔn)的比特流一起使用??梢栽谛枰邮站哂腥我獾臄?shù)量的通道的輸入比特流并處理該比特流以獲得通過(guò)解碼比特流中的一些或所有通道獲得的輸出通道的最佳配置的基本上任何解碼裝置中使用本發(fā)明。1.分析部件分析部件12從輸入信號(hào)比特流提取編碼數(shù)據(jù)的一系列的塊或語(yǔ)法元素。它可使用在現(xiàn)有技術(shù)中公知的常規(guī)的技術(shù)以提取這些語(yǔ)法元素。符合包含上述的MPEG-2AAC和MPEG-4音頻標(biāo)準(zhǔn)的許多不同的標(biāo)準(zhǔn)的比特流在邏輯上被分成稱為幀的段。AAC相容比特流中的數(shù)據(jù)例如限定繼而在邏輯上分成不同的類型的一系列的塊或語(yǔ)法元素的一系列的可變長(zhǎng)度幀。各語(yǔ)法元素中的前3個(gè)比特規(guī)定元素類型。存在8種不同類型的元素。這里描述這些類型中的一些。單通道元素(SCE)傳輸用于單一音頻通道的數(shù)據(jù)。通道對(duì)元素(CPE)傳輸用于一對(duì)音頻通道的數(shù)據(jù)。程序配置元素(PCE)描述由比特流傳輸?shù)臄?shù)據(jù)的通道。低頻效果元素 (在本公開(kāi)中稱為L(zhǎng)FEE)傳輸用于LFE通道或特殊效果通道的數(shù)據(jù)。終端元素(TERM)表示幀中的最后的語(yǔ)法元素。特定的AAC相容比特流可能不包含所有類型的語(yǔ)法元素。例如,僅傳輸用于單一音頻通道的數(shù)據(jù)的比特流不具有任何CPE,并且,不傳輸用于特殊效果或LFE通道的數(shù)據(jù)的比特流不具有LFEE。2.選擇部件圖2是可實(shí)現(xiàn)選擇部件14以實(shí)施本發(fā)明的一種方式的示意圖。在該實(shí)現(xiàn)中,部件 32確定比特流的通道配置。在后面更詳細(xì)地描述這一點(diǎn)。部件;34使用該配置以產(chǎn)生通道配置圖(channel configuration map)。在一個(gè)實(shí)現(xiàn)中,該圖限定輸入比特流中的各音頻通道與要再現(xiàn)該通道的揚(yáng)聲器位置之間的關(guān)系。部件38提供可規(guī)定哪些揚(yáng)聲器位置可被解碼的一組的一個(gè)或更多個(gè)通道選擇圖。在一個(gè)實(shí)現(xiàn)中,通道選擇圖的格式和布置與通道配置圖的格式和布置相同。這可有利于由部件36執(zhí)行的處理,該部件36選擇對(duì)于輸入比特流的通道配置提供最佳匹配的通道選擇圖。部件42使用選擇的通道選擇圖,以構(gòu)建限定解碼輸入比特流中的哪些音頻通道以及如何將它們引導(dǎo)到解碼器10的輸出通道的通道選擇掩模。將在后面更詳細(xì)地討論這些部件。對(duì)于兩個(gè)或更多個(gè)通道選擇圖中的每一個(gè)構(gòu)建通道選擇掩模并且對(duì)于解碼選擇最佳的選擇掩模的替代性的實(shí)現(xiàn)是可能的。不進(jìn)一步討論該實(shí)現(xiàn)。a)提取通道配置部件32可以以三種方式中的一種確定由特定的MPEG-2AAC或MPEG-4音頻相容比特流表示的音頻通道的配置。兩種方式與符合MPEG-2AAC或MPEG-4音頻標(biāo)準(zhǔn)的比特流有關(guān)。第三種方式僅與符合MPEG-2AAC標(biāo)準(zhǔn)的比特流有關(guān)。MPEG-2AAC或MPEG-4音頻符合比特流可通過(guò)使用表示在表I中列出的大量的預(yù)定通道配置中的一個(gè)的一般稱為通道配置指數(shù)(channel configuration index)的指數(shù)值用信號(hào)通知通道配置。對(duì)于MPEG-2AAC相容比特流,指數(shù)值包含3個(gè)比特并且可僅表示表I的前8個(gè)條目中的一個(gè)。對(duì)于MPEG-4音頻相容比特流,指令值是4個(gè)比特,并且,可表示表I的16個(gè)條目中的任一個(gè)。配置中的各通道被用揚(yáng)聲器應(yīng)相對(duì)于收聽(tīng)者被放置以再現(xiàn)該通道的位置來(lái)描述。MPEG-4音頻相容比特流中的指數(shù)值0表示通道配置由PCE規(guī)定。 MPEG-2AAC相容比特流中的指數(shù)值0表示通道配置由PCE規(guī)定或者它被隱含地規(guī)定。如果在任一類型的比特流中存在PCE,則它將在配置過(guò)程中取得優(yōu)先。表 I
指數(shù)通道配置0隱含地或通過(guò)PCE規(guī)定的配置1單個(gè)通道(C)2兩個(gè)通道(L、R)3三個(gè)通道(C、L、R)4四個(gè)通道(C、L、R、BC)5五個(gè)通道(C、L、R、BL、BR)6六個(gè)通道(C、L、R、BL、BR、LFE)7八個(gè)通道(C、L、R、SL、SR、BL、BR、LFE)8~15為將來(lái)使用保留使用以下的通道注釋(C)中前通道;(L)左前通道;(R)右前通道(BC)后中通道;(BL)后左通道;(BR)后右通道(SL)側(cè)左通道;(SR)側(cè)右通道;(LFE)低頻效果通道處于前部通道和側(cè)面通道之間的另外提到的附加的通道被稱為“寬”通道。左寬(wide left, WL)通道處于L位置和SL位置之間,并且,右寬(wide right)通道處于R位置與SR位置之間。MPEG-2AAC和MPEG-4音頻相容比特流也可通過(guò)使用承載比特流中的一個(gè)音頻程序?qū)S玫呐渲眯畔⒌腜CE來(lái)用信號(hào)通知通道配置。為了通過(guò)使用該方法用信號(hào)通知通道配置,通道配置指數(shù)必須被設(shè)為零??蓮腎S0/IEC 14496-3標(biāo)準(zhǔn)的部分4. 5. 1.2獲得更多的細(xì)節(jié)。這些細(xì)節(jié)不是理解本發(fā)明所需要的。對(duì)于MPEG-2AAC相容比特流,可不使用前面描述的通道信號(hào)通知(signaling)方法中的任一個(gè)。在這種情況下,通道配置指數(shù)被設(shè)為零,但是,不存在PCE以限定該配置。 MPEG-2相容解碼器必須通過(guò)使用在IS0/IEC 13818-7的部分8. 5. 3. 3中限定的規(guī)則從通過(guò)音頻通道語(yǔ)法元素規(guī)定的音頻通道的數(shù)量和布置推斷通道配置。這些規(guī)則的細(xì)節(jié)不是理解本發(fā)明所需要的。b)通道配置圖部件34產(chǎn)生限定輸入比特流中的音頻通道與要再現(xiàn)通道的揚(yáng)聲器的位置之間的關(guān)系的通道配置圖。部件38提供規(guī)定可解碼哪些揚(yáng)聲器位置的一組的一個(gè)或更多個(gè)通道選擇圖。優(yōu)選地,通道配置圖和通道選擇圖具有相同的通道的格式和布置。關(guān)于主通道選擇圖中的通道的次序限定通道配置圖中的項(xiàng)目。主通道選擇圖限定解碼器10可處理和解碼的所有可能的通道。MPEG-2AAC和MPEG-4音頻相容比特流可傳輸多達(dá)48個(gè)通道。該數(shù)量遠(yuǎn)大于典型的解碼器可處理的通道的最大數(shù)量。解碼器的典型的最大值為約10個(gè)通道或更少。在優(yōu)選的實(shí)現(xiàn)中,主通道選擇圖不包含限定所有的48個(gè)通道的條目,原因是這些圖中的空間一般不被使用。十個(gè)條目的量級(jí)的較小的圖通常是足夠的。如果遇到傳輸不在主通道選擇圖中限定的一個(gè)或更多個(gè)通道的比特流,那么那些過(guò)量的通道中的每一個(gè)可被舍棄。在表II中示出假設(shè)的限定11個(gè)通道的主通道選擇圖。在大多數(shù)的實(shí)現(xiàn)中,不是主通道選擇圖中的所有通道都可在同時(shí)被解碼。例如,5通道解碼器不能對(duì)于給定的比特流解碼表II的主選擇圖的所有11個(gè)通道,但是,它可解碼這些通道中的多達(dá)5個(gè)通道的各種組合。表II還示出對(duì)于不同的比特流配置的若干示意性通道配置圖。各通道配置圖限定比特流中的通道與主通道選擇圖中的通道之間的關(guān)系。對(duì)于MPEG-2AAC和MPEG-4音頻相容比特流,解碼器10可使用比特流中的通道的位置作為對(duì)于通道配置圖的指數(shù)。通道配置圖中的相應(yīng)的條目可表示主通道選擇圖中的指數(shù)。主通道選擇圖中的條目最終規(guī)定與比特流中的給定通道相關(guān)的揚(yáng)聲器位置。表 II通道配置圖主通道選擇圖中的通道次序 單聲 立體聲 5 5.0 7.1O-(C) 中I-(L)左2-(R)右3 一 (WL)前左寬4 - (WR)前右寬5-(SL)側(cè)左6 - (SR)側(cè)右7-(BL)后左8 - (BR)后右9-(BC)后中IO-(LFE)低頻效果示出用于5個(gè)不同的比特流配置的通道配置圖。在“立體聲”標(biāo)題下的列中表示了用于立體聲比特流的通道配置圖。比特流的兩個(gè)通道被映射到L通道和R通道。在“5.0” 標(biāo)題下的列中表示了所謂的5. 0比特流的通道配置圖。比特流的5個(gè)通道被映射到C、L、 R、BL和BR通道。在“7.1”標(biāo)題下的列中表示了用于所謂的7.1比特流的通道配置圖。比特流的8個(gè)通道被映射到C、L、R、SL、SR、BL、BR和LFE通道。c)通道選擇圖由部件38提供的通道選擇圖限定解碼器10可處理和解碼的主通道選擇圖中的通道的組合。這些圖中的一個(gè)將由部件36選擇,以規(guī)定比特流中的哪些通道要被解碼。參照?qǐng)D3,在該附圖的右上角示出由部件38提供的4個(gè)通道選擇圖。各圖具有用于主通道選擇圖中的各通道的項(xiàng)目(item)。由符號(hào)“1”表示的項(xiàng)目表示相應(yīng)的通道可被處理和解碼。由符號(hào)“0”表示的項(xiàng)目表示相應(yīng)的通道將不被解碼。從左向右的前三個(gè)通道選擇圖均具有5個(gè)“1”項(xiàng)目。如果對(duì)于處理選擇這些圖中的一個(gè),那么,可以解碼最多5個(gè)通道。右側(cè)最遠(yuǎn)的通道選擇圖具有4個(gè)“1”項(xiàng)目。如果對(duì)于處理選擇該圖,那么可以解碼最多4個(gè)通道。d)選擇通道選擇圖部件36檢查由部件38提供的所有的通道選擇圖,并且選擇對(duì)于由部件34產(chǎn)生的通道配置圖提供最佳的匹配的通道選擇圖。在一個(gè)實(shí)現(xiàn)中,通過(guò)識(shí)別允許解碼最大數(shù)量的通道的通道選擇圖來(lái)確定最佳匹配。在圖3和圖4中示意性地示出這一點(diǎn)。參照?qǐng)D3,部件34生成與表II中所示圖一致的8通道比特流的通道配置圖。以黑體字體表示存在于比特流中的配置圖中的通道。以斜體字體表示不存在于比特流中的通道。在該示意性實(shí)現(xiàn)中,部件38如上面討論的那樣提供4個(gè)通道選擇圖。部件36將與通道配置圖中的通道對(duì)應(yīng)的各通道選擇圖中的“ 1”項(xiàng)目的數(shù)量計(jì)數(shù),并且識(shí)別該計(jì)數(shù)。各通道選擇圖的計(jì)數(shù)從左到右為5、5、3和3。部件36選擇可解碼最大數(shù)量的通道的通道選擇圖。在本例子中,最大數(shù)量為5個(gè), 并且,兩個(gè)圖可解碼5個(gè)通道。在優(yōu)選的實(shí)現(xiàn)中,通道選擇圖被賦予優(yōu)先級(jí),并且,在同等 (tie)的情況下,選擇更高優(yōu)先級(jí)的通道選擇圖。在本例子中,從左到右以優(yōu)先級(jí)的次序示出通道選擇圖。作為結(jié)果,對(duì)于處理比特流選擇第一通道選擇圖。
在圖4中表示另一例子。在本例子中,部件34生成用于4通道比特流的通道配置圖。分別以黑體和斜體字體表示存在和不存在于比特流中的通道。部件38同樣如上面討論的那樣提供4個(gè)通道選擇圖。部件36將與通道配置圖中的通道對(duì)應(yīng)的各通道選擇圖中的“I”項(xiàng)目的數(shù)量計(jì)數(shù)。各通道選擇圖的計(jì)數(shù)從左到右為3、3、3和4。部件36選擇解碼4 個(gè)通道的通道選擇掩模。
e)通道選擇掩模
部件42使用選擇的通道選擇圖,以構(gòu)建通道選擇掩模,該通道選擇掩模限定解碼輸入比特流中的哪些音頻通道以及如何將它們引導(dǎo)到解碼器10的輸出通道。掩模禁止某些通道的解碼并且允許其它通道的解碼。在圖3和圖4所示的實(shí)現(xiàn)中,掩模包含分別由“0” 和“X”符號(hào)表示的項(xiàng)目。掩模中的“0”項(xiàng)目允許通道被解碼。掩模中的“X”項(xiàng)目禁止通道被解碼。
對(duì)于比特流中的各通道該通道選擇掩模均具有項(xiàng)目。如果通道選擇圖中的項(xiàng)目是“1”,那么通道選擇掩模被構(gòu)建以對(duì)于相應(yīng)的項(xiàng)目具有“O”。如果通道選擇圖中的項(xiàng)目是 “0”,那么,通道選擇掩模被構(gòu)建為對(duì)于相應(yīng)的項(xiàng)目具有“X”。
參照?qǐng)D3,通道選擇掩模具有8個(gè)項(xiàng)目,各項(xiàng)目用于比特流中的各通道,并且,掩模中的5個(gè)“0”項(xiàng)目與選擇的通道選擇圖中的5個(gè)“I”項(xiàng)目對(duì)應(yīng)。參照?qǐng)D4,通道選擇掩模具有4個(gè)項(xiàng)目,各項(xiàng)目用于比特流中的各通道,并且,掩模中的4個(gè)“0”項(xiàng)目與選擇的通道選擇圖中的4個(gè)“I”項(xiàng)目對(duì)應(yīng)。
f)提取并選擇通道元素
部件44和46根據(jù)通道選擇掩模處理比特流。部件44從比特流提取音頻通道語(yǔ)法元素并將它們轉(zhuǎn)送到部件46。部件46相對(duì)于通道選擇掩模檢查各音頻通道語(yǔ)法元素。 如果相應(yīng)的掩模項(xiàng)目被啟用(enabled),或者是圖示的“0”項(xiàng)目,那么該語(yǔ)法元素沿路徑15 被轉(zhuǎn)送以供解碼。如果相應(yīng)的掩模項(xiàng)目被禁用,或者為圖示的“X”項(xiàng)目,那么語(yǔ)法項(xiàng)目被舍棄。
如果通過(guò)產(chǎn)生可變長(zhǎng)度符號(hào)的諸如HufTmann編碼或算術(shù)編碼的編碼處理來(lái)編碼幀中的或語(yǔ)法元素中的數(shù)據(jù),那么必須向所有編碼的數(shù)據(jù)應(yīng)用適當(dāng)?shù)慕獯a,使得各語(yǔ)法元素和幀的端部可被正確地確定。被選擇用于解碼的通道的數(shù)據(jù)以正常的方式被處理。被禁止進(jìn)一步的解碼的通道的數(shù)據(jù)可如希望的那樣被舍棄或者被暫時(shí)存儲(chǔ)以及重寫(xiě)。
如果在編碼的數(shù)據(jù)中檢測(cè)到不能被校正的任何誤差,那么可能希望減弱(mute) 解碼器的輸出或者采取其它的行動(dòng)以消除誤差。由于誤差可導(dǎo)致解碼器喪失與幀的同步, 因此,即使在與被舍棄的通道對(duì)應(yīng)的數(shù)據(jù)中檢測(cè)到誤差,這可能也是必須的??梢允褂贸R?guī)的誤差恢復(fù)技術(shù)。
如果隱含地確定通道配置圖,那么必須在可確定通道配置之前檢查比特流的整個(gè)幀。作為結(jié)果,第一幀中的音頻通道語(yǔ)法元素不能如上面描述的那樣被解碼,原因是它們?cè)诳蓸?gòu)建通道選擇掩模之前已被處理。僅對(duì)于比特流的第一接收幀出現(xiàn)這種情況。而由于根據(jù)IS0/IEC13818-7標(biāo)準(zhǔn)的部分8. 5. 3. 3 “不允許隱含的重構(gòu)”,因此,不需要隱含地對(duì)于比特流的任何隨后的幀確定通道配置圖。如果通道配置改變,那么必須通過(guò)使用PCE來(lái)指示。
可以以下面描述的各種方法根據(jù)隱含地確定的通道配置來(lái)處理比特流的第一接收幀中的音頻通道語(yǔ)法元素。
一個(gè)方法禁止從第一接收幀解碼音頻。如上所述從第一接收幀確定通道選擇掩模,并且,對(duì)于第二和隨后的幀的解碼使用該掩模。另一方法在處理之前緩存(buffer)各幀的語(yǔ)法元素。該方法需要可能與現(xiàn)有技術(shù)的解碼器那樣多的附加的存儲(chǔ)器,但是,它提供了與如上面描述的那樣從比特流中的明確的信息構(gòu)建其通道配置的解碼器所實(shí)現(xiàn)的計(jì)算復(fù)雜性的降低基本上相同的計(jì)算復(fù)雜性的降低。又一方法通過(guò)使用“平(flat) ”通道選擇掩模處理第一幀中的音頻通道語(yǔ)法元素。 平通道選擇掩模使得能夠?qū)τ谇癗個(gè)通道進(jìn)行解碼,這里,N是由部件38提供的通道選擇圖中的任一個(gè)允許的通道的最大數(shù)量。該方法只能保證對(duì)于第一接收幀,輸出通道的數(shù)量被有效地限制為解碼器可解碼的最大數(shù)量。該方法不能確保各解碼通道與存在于由部件38 提供的通道選擇圖中的一個(gè)中的通道對(duì)應(yīng)?!愕?,使揚(yáng)聲器位置與隱含地配置的通道相關(guān)聯(lián)的嘗試應(yīng)被視為猜測(cè),這是因?yàn)樵诒忍亓髦袥](méi)有明確地傳輸關(guān)于預(yù)期的揚(yáng)聲器位置的信息。然而,由于在IS0/IEC 13818-7部分8. 5. 3. 3中概括的用于分配被隱含地信號(hào)通知的通道的過(guò)程提供某些指導(dǎo), 因此,這些猜測(cè)在許多的情況下產(chǎn)生良好的結(jié)果。C.實(shí)現(xiàn)包含本發(fā)明的各種方面的裝置可被以各種方式實(shí)現(xiàn),包括由計(jì)算機(jī)執(zhí)行的軟件或包含諸如與與在通用計(jì)算機(jī)中發(fā)現(xiàn)的部件類似的部件耦合的數(shù)字信號(hào)處理器(DSP)電路的更多的專用部件的一些其它的裝置。圖5是可用于實(shí)現(xiàn)本發(fā)明的各方面的裝置70的示意性框圖。處理器72提供計(jì)算資源。RAM 73是由處理器72對(duì)于處理而使用的系統(tǒng)隨機(jī)存取存儲(chǔ)器(RAM)。ROM 74表示用于存儲(chǔ)操作裝置70所需要的程序并且可能用于實(shí)施本發(fā)明的各種方面的諸如只讀存儲(chǔ)器(ROM)的一些形式的持久存儲(chǔ)器。I/O控制76表示用于通過(guò)通信路徑11、19接收和傳送信號(hào)的接口電路。在所示的實(shí)施例中,所有的主要系統(tǒng)部件與可表示多于一個(gè)的物理或邏輯總線的總線71連接;但是,總線結(jié)構(gòu)不是實(shí)現(xiàn)本發(fā)明所需要的。實(shí)施本發(fā)明的各方面所需要的功能可由以多種方式實(shí)現(xiàn)的部件執(zhí)行,包括離散邏輯部件、集成電路、一個(gè)或更多個(gè)ASIC和/或程序控制處理器。對(duì)于本發(fā)明,這些部件的實(shí)現(xiàn)方式是不重要的??赏ㄟ^(guò)各種機(jī)器可讀介質(zhì)(諸如貫穿包含超聲波到紫外頻率的頻譜的基帶或調(diào)制通信路徑、或包含磁帶、卡或盤、光卡或盤和包含紙的介質(zhì)上的可檢測(cè)標(biāo)記的通過(guò)使用基本任何記錄技術(shù)傳輸信息的存儲(chǔ)介質(zhì))傳輸本發(fā)明的軟件實(shí)現(xiàn)。
權(quán)利要求
1.一種用于解碼編碼音頻信息的方法,其中,所述方法包括 接收傳輸表示一個(gè)或更多個(gè)音頻通道的編碼信息的輸入信號(hào); 對(duì)于由編碼信息表示的一個(gè)或更多個(gè)音頻通道確定通道配置圖;從使用通道配置圖的處理獲得通道選擇掩模,其中所述通道選擇掩模規(guī)定所述一個(gè)或更多個(gè)音頻通道中的哪些音頻通道要被解碼; 從所述輸入信號(hào)提取編碼信息;以及對(duì)于在所述通道選擇掩模中規(guī)定的那些音頻通道解碼所提取的編碼信息。
2.根據(jù)權(quán)利要求1的方法,通過(guò)使用多個(gè)通道選擇圖獲得通道選擇掩模,其中, 通道配置圖限定所述輸入信號(hào)中的各個(gè)音頻通道中的每一個(gè)與打算再現(xiàn)該音頻通道的相應(yīng)的揚(yáng)聲器位置之間的關(guān)系;各通道選擇圖規(guī)定哪些揚(yáng)聲器位置能夠被解碼,并且, 該方法包括選擇對(duì)于通道配置圖提供最佳匹配的通道選擇圖;以及構(gòu)建通道選擇掩模,使得它規(guī)定通道配置圖中的在所選擇的通道選擇圖中具有相應(yīng)的揚(yáng)聲器位置的各通道。
3.根據(jù)權(quán)利要求2的方法,包括選擇具有最大數(shù)量的存在于通道配置圖中的揚(yáng)聲器位置的通道選擇圖;以及選擇所選擇的通道選擇圖作為對(duì)于通道配置圖提供最佳匹配的通道選擇圖。
4.根據(jù)權(quán)利要求3的方法,其中, 各通道選擇圖具有各自的優(yōu)先級(jí);兩個(gè)或更多個(gè)通道選擇圖具有其數(shù)量等于所述最大數(shù)量的存在于通道配置圖中的多個(gè)揚(yáng)聲器位置;并且,該方法包括從所述兩個(gè)或更多個(gè)通道選擇圖選擇具有最高的優(yōu)先級(jí)的通道選擇圖。
5.根據(jù)權(quán)利要求1的方法,通過(guò)使用多個(gè)通道選擇圖獲得通道選擇圖,其中, 通道配置圖限定所述輸入信號(hào)中的各個(gè)音頻通道中的每一個(gè)與打算再現(xiàn)該音頻通道的相應(yīng)的揚(yáng)聲器位置之間的關(guān)系;各通道選擇圖規(guī)定哪些揚(yáng)聲器位置能夠被解碼,并且, 該方法包括構(gòu)建分別規(guī)定在各通道選擇圖中具有相應(yīng)的揚(yáng)聲器位置的通道的兩個(gè)或更多個(gè)通道選擇掩模;從所述兩個(gè)或更多個(gè)通道選擇掩模選擇對(duì)于通道配置圖提供最佳匹配的通道選擇掩模,其中,所選擇的通道選擇掩模是規(guī)定所述一個(gè)或更多個(gè)音頻通道中的哪些音頻通道要被解碼的通道選擇掩模。
6.根據(jù)權(quán)利要求1 5中的任一項(xiàng)的方法,其中,編碼音頻信息表示第一數(shù)量的音頻通道,通道選擇掩模規(guī)定第二數(shù)量的要被解碼的音頻通道,并且,第一數(shù)量比第二數(shù)量大。
7.根據(jù)權(quán)利要求1 6中的任一項(xiàng)的方法,通過(guò)檢查在輸入信號(hào)中傳輸?shù)臄?shù)據(jù)確定通道配置圖。
8.根據(jù)權(quán)利要求7的方法,從規(guī)定一組預(yù)定義的通道配置的一個(gè)通道配置的輸入信號(hào)中的數(shù)據(jù)確定通道配置圖。
9.根據(jù)權(quán)利要求7的方法,從明確地規(guī)定在輸入信號(hào)中表示的各音頻通道的輸入信號(hào)中的數(shù)據(jù)確定通道配置圖。
10.根據(jù)權(quán)利要求7的方法,通過(guò)確定在輸入信號(hào)中表示的音頻通道的數(shù)量和布置確定通道配置圖。
11.根據(jù)權(quán)利要求10的方法,其中,在多個(gè)幀中布置在輸入信號(hào)中傳輸?shù)木幋a音頻信息,通過(guò)從第一接收幀確定音頻通道的數(shù)量和布置來(lái)確定通道配置圖并且,該方法包括根據(jù)在平通道選擇掩模中規(guī)定的音頻通道解碼從第一接收幀提取的編碼信息,其中, 所述平通道選擇掩模規(guī)定能夠被解碼的音頻通道的最大數(shù)量;以及對(duì)于在通道選擇掩模中規(guī)定的那些音頻通道解碼從第一接收幀后面的幀提取的編碼 fn息ο
12.一種用于解碼編碼音頻信息的設(shè)備,其中,該設(shè)備包括用于執(zhí)行權(quán)利要求1 11中的任一項(xiàng)中的方法的所有步驟的手段。
13.一種存儲(chǔ)介質(zhì),記錄能夠由裝置執(zhí)行以執(zhí)行權(quán)利要求1 11中的任一項(xiàng)中的方法的所有步驟的指令的程序。
全文摘要
傳輸表示一個(gè)或更多個(gè)音頻通道的編碼信息的輸入信號(hào)通過(guò)如下操作被解碼,即確定由編碼的信息表示的通道的配置、從通道配置獲得規(guī)定一個(gè)或更多個(gè)音頻通道中的哪些音頻通道要被解碼的通道選擇掩模、從輸入信號(hào)提取編碼的信息并且對(duì)于在通道選擇掩模中規(guī)定的那些音頻通道解碼提取的編碼信息。
文檔編號(hào)G10L19/00GK102549656SQ201080044877
公開(kāi)日2012年7月4日 申請(qǐng)日期2010年10月5日 優(yōu)先權(quán)日2009年10月6日
發(fā)明者R·特辛 申請(qǐng)人:杜比國(guó)際公司