解碼裝置和方法、編碼裝置和方法、以及程序的制作方法
【專利摘要】本技術(shù)涉及解碼裝置和方法、編碼裝置和方法、以及程序。所述技術(shù)使得能夠?qū)崿F(xiàn)更逼真的高品質(zhì)聲音。編碼裝置將揚(yáng)聲器映射信息存儲(chǔ)在編碼比特流的PCE中的注釋字段中,并且還將同步字和標(biāo)識(shí)信息存儲(chǔ)在注釋字段中,以使得存儲(chǔ)在注釋字段中的其他一般注釋可以區(qū)別于揚(yáng)聲器映射信息。在對(duì)編碼比特流進(jìn)行解碼期間,使用記錄在注釋字段中的同步字和標(biāo)識(shí)信息,確定是否存儲(chǔ)了揚(yáng)聲器映射信息,并且根據(jù)基于確定結(jié)果的揚(yáng)聲器映射,輸出包含在編碼比特流中的音頻數(shù)據(jù)。本技術(shù)可以應(yīng)用于編碼裝置。
【專利說(shuō)明】解碼裝置和方法、編碼裝置和方法、以及程序
【技術(shù)領(lǐng)域】
[0001]本技術(shù)涉及解碼裝置、解碼方法、編碼裝置、編碼方法以及程序,更具體地,涉及能夠獲得高品質(zhì)逼真的聲音的解碼裝置、解碼方法、編碼裝置、編碼方法以及程序。
【背景技術(shù)】
[0002]近年來(lái),世界各國(guó)已經(jīng)提出了運(yùn)動(dòng)圖像分配服務(wù)、數(shù)字電視廣播以及下一代歸檔(next-generation archiving)。除了根據(jù)相關(guān)技術(shù)的立體聲廣播之外,開(kāi)始提出與多聲道,諸如5.1聲道對(duì)應(yīng)的聲音廣播。
[0003]為了進(jìn)一步提高圖像品質(zhì),已經(jīng)研究了具有更大量像素的下一代高清電視。關(guān)于對(duì)下一代高清電視的研究,在聲音處理領(lǐng)域中期望將聲道在水平方向和垂直方向上擴(kuò)展成多于5.1聲道的多個(gè)聲道,以便實(shí)現(xiàn)逼真的聲音。
[0004]作為與音頻數(shù)據(jù)的編碼相關(guān)的技術(shù),提出了以下技術(shù):將來(lái)自不同聲道的多個(gè)窗口分組成一些片(tile),以提高編碼效率(例如,參見(jiàn)專利文獻(xiàn)I)。
[0005]引用列表
[0006]專利文獻(xiàn)
[0007]專利文獻(xiàn)I JP2OlO-2I79OOA
【發(fā)明內(nèi)容】
[0008]本發(fā)明要解決的問(wèn)題
[0009]然而,在上述技術(shù)中,難以獲得高品質(zhì)逼真的聲音。
[0010]例如,在基于作為國(guó)際標(biāo)準(zhǔn)的運(yùn)動(dòng)圖像專家組-2高級(jí)音頻編碼(MPEG-2AAC)標(biāo)準(zhǔn)和MPEG-4AAC標(biāo)準(zhǔn)的多聲道編碼中,僅定義了水平方向上揚(yáng)聲器的布置和關(guān)于從5.1聲道下混(downmix)為立體聲聲道的信息。因此,難以充分地響應(yīng)在平面和垂直方向上的聲道的擴(kuò)展。
[0011]鑒于上述問(wèn)題,做出了本技術(shù),并且本技術(shù)可以獲得高品質(zhì)逼真的聲音。
[0012]問(wèn)題的解決方案
[0013]根據(jù)本技術(shù)的第一方面的解碼裝置包括解碼單元、讀取單元以及輸出單元,該解碼單元對(duì)包括在編碼比特流中的音頻數(shù)據(jù)進(jìn)行解碼,該讀取單元從能夠存儲(chǔ)編碼比特流的任意數(shù)據(jù)的區(qū)域中讀取關(guān)于音頻數(shù)據(jù)的聲源的高度的聲源位置信息,該輸出單元基于聲源位置信息輸出所解碼的音頻數(shù)據(jù)。
[0014]聲源位置信息可以是用于指示聲源的高度基本上等于用戶的高度、大于用戶的高度或者小于用戶的高度的信息。
[0015]用于標(biāo)識(shí)聲源位置信息是否存在的標(biāo)識(shí)信息被存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中,并且讀取單元可以基于標(biāo)識(shí)信息讀取聲源位置信息。
[0016]第一預(yù)定標(biāo)識(shí)信息和基于聲源位置信息計(jì)算的第二標(biāo)識(shí)信息可以作為標(biāo)識(shí)信息被存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中。[0017]當(dāng)包括在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中的第一標(biāo)識(shí)信息是預(yù)定的特定信息,并且從能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中讀取的第二標(biāo)識(shí)信息與基于所讀取的聲源位置信息計(jì)算的第二標(biāo)識(shí)信息相同時(shí),讀取單元可以確定聲源位置信息是有效的。
[0018]第二標(biāo)識(shí)信息可以是基于通過(guò)對(duì)包括聲源位置信息的信息執(zhí)行字節(jié)對(duì)齊所獲得的信息而計(jì)算的。
[0019]根據(jù)本技術(shù)的第一方面的解碼方法或程序包括:對(duì)包括在編碼比特流中的音頻數(shù)據(jù)進(jìn)行解碼的步驟,從能夠存儲(chǔ)編碼比特流的任意數(shù)據(jù)的區(qū)域中讀取關(guān)于音頻數(shù)據(jù)的聲源的高度的聲源位置信息的步驟,以及基于聲源位置信息輸出所解碼的音頻數(shù)據(jù)的步驟。
[0020]在本技術(shù)的第一方面中,對(duì)包括在編碼比特流中的音頻數(shù)據(jù)進(jìn)行解碼,從能夠存儲(chǔ)編碼比特流的任意數(shù)據(jù)的區(qū)域中讀取關(guān)于音頻數(shù)據(jù)的聲源的高度的聲源位置信息,并且基于聲源位置信息輸出所解碼的音頻數(shù)據(jù)。
[0021]根據(jù)本技術(shù)的第二方面的編碼裝置包括獲取單元、編碼單元以及封裝單元,該獲取單元獲取關(guān)于聲源的高度的聲源位置信息,該編碼單元對(duì)音頻數(shù)據(jù)和聲源位置信息進(jìn)行編碼,該封裝單元將所編碼的聲源位置信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中,并且生成包括所編碼的音頻數(shù)據(jù)和所編碼的聲源位置信息的編碼比特流。
[0022]聲源位置信息可以是用于指示聲源的高度基本上等于用戶的高度、大于用戶的高度或者小于用戶的高度的信息。
[0023]聲源位置信息和用于標(biāo)識(shí)聲源位置信息是否存在的標(biāo)識(shí)信息可以被存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中。
[0024]第一預(yù)定標(biāo)識(shí)信息和基于聲源位置信息計(jì)算的第二標(biāo)識(shí)信息可以作為標(biāo)識(shí)信息被存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中。
[0025]用于指示對(duì)包括聲源位置信息的信息執(zhí)行字節(jié)對(duì)齊的信息和用于指示在基于通過(guò)字節(jié)對(duì)齊所獲得的信息而計(jì)算的第二標(biāo)識(shí)信息與存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中的第二標(biāo)識(shí)信息之間進(jìn)行比較的信息可以被進(jìn)一步存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中。
[0026]根據(jù)本技術(shù)的第二方面的編碼方法或程序包括:獲取關(guān)于聲源的高度的聲源位置信息的步驟,對(duì)音頻數(shù)據(jù)和聲源位置信息進(jìn)行編碼的步驟,以及將所編碼的聲源位置信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中并且生成包括所編碼的音頻數(shù)據(jù)和所編碼的聲源位置信息的編碼比特流的步驟。
[0027]在根據(jù)本技術(shù)的第二方面中,獲取關(guān)于聲源的高度的聲源位置信息。對(duì)音頻數(shù)據(jù)和聲源位置信息進(jìn)行編碼。將所編碼的聲源位置信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中,并且生成包括所編碼的音頻數(shù)據(jù)和所編碼的聲源位置信息的編碼比特流。
[0028]本發(fā)明的效果
[0029]根據(jù)本技術(shù)的第一方面和第二方面,可以獲得高品質(zhì)逼真的聲音。
【專利附圖】
【附圖說(shuō)明】
[0030]圖1是示出了揚(yáng)聲器的布置的圖。
[0031]圖2是示出了揚(yáng)聲器映射的示例的圖。
[0032]圖3是示出了編碼比特流的圖。
[0033]圖4 是不出了 height_extension_element 的句法的圖。[0034]圖5是示出了揚(yáng)聲器的布置高度的圖。
[0035]圖6是示出了 MPEG4輔助數(shù)據(jù)的句法的圖。
[0036]圖7是示出了 bs_info()的句法的圖。
[0037]圖8 是不出了 ancillary_data_status O 的句法的圖。
[0038]圖9 是不出了 downmixing_levels_MPEG4O 的句法的圖。
[0039]圖10 是不出了 audio_coding_mode O 的句法的圖。
[0040]圖11 是不出了 MPEG4_ext_ancillary_data O 的句法的圖。
[0041]圖12 是不出了 ext_ancillary_data_status O 的句法的圖。
[0042]圖13 是不出了 ext_downmixing_levels O 的句法的圖。
[0043]圖14是示出了每個(gè)系數(shù)所應(yīng)用到的目標(biāo)的圖。
[0044]圖15 是不出了 ext_downmixing_global_gains O 的句法的圖。
[0045]圖16 是不出了 ext_downmixing_lfe_level O 的句法的圖。
[0046]圖17是示出了下混的圖。
[0047]圖18是示出了針對(duì)dmix_lfe_idx確定的系數(shù)的圖。
[0048]圖19是示出了針對(duì)dmix_a_idx和dmix_b_idx確定的系數(shù)的圖。
[0049]圖20 是不出了 drc_presentation_mode 的句法的圖。
[0050]圖21 是不出了 drc_presentation_mode 的圖。
[0051]圖22是示出了編碼裝置的結(jié)構(gòu)的示例的圖。
[0052]圖23是示出了編碼處理的流程圖。
[0053]圖24是示出了解碼裝置的結(jié)構(gòu)的示例的圖。
[0054]圖25是示出了解碼處理的流程圖。
[0055]圖26是示出了編碼裝置的結(jié)構(gòu)的示例的圖。
[0056]圖27是示出了編碼處理的流程圖。
[0057]圖28是示出了解碼裝置的示例的圖。
[0058]圖29是示出了下混處理單元的結(jié)構(gòu)的示例的圖。
[0059]圖30是示出了下混單元的結(jié)構(gòu)的示例的圖。
[0060]圖31是示出了下混單元的結(jié)構(gòu)的示例的圖。
[0061]圖32是示出了下混單元的結(jié)構(gòu)的示例的圖。
[0062]圖33是示出了下混單元的結(jié)構(gòu)的示例的圖。
[0063]圖34是示出了下混單元的結(jié)構(gòu)的示例的圖。
[0064]圖35是示出了下混單元的結(jié)構(gòu)的示例的圖。
[0065]圖36是示出了解碼處理的流程圖。
[0066]圖37是示出了重新布置處理的流程圖。
[0067]圖38是示出了重新布置處理的流程圖。
[0068]圖39是示出了下混處理的流程圖。
[0069]圖40是示出了計(jì)算機(jī)的結(jié)構(gòu)的示例的圖。
【具體實(shí)施方式】
[0070]在下文中,將參考附圖對(duì)本技術(shù)所應(yīng)用到的實(shí)施方式進(jìn)行描述。[0071]〈第一實(shí)施方式〉
[0072][關(guān)于本技術(shù)的概述]
[0073]首先,將對(duì)本技術(shù)的概述進(jìn)行描述。
[0074]本技術(shù)涉及音頻數(shù)據(jù)的編碼和解碼。例如,在基于MPEG-2AAC或MPEG-4AAC標(biāo)準(zhǔn)的多聲道編碼中,難以獲得用于在水平平面和垂直方向上聲道擴(kuò)展的信息。
[0075]在多聲道編碼中,不存在聲道擴(kuò)展內(nèi)容的下混信息,并且不知道聲道的適當(dāng)?shù)幕旌媳嚷?。因此,?duì)于具有少量再現(xiàn)聲道的便攜式設(shè)備來(lái)說(shuō)難以再現(xiàn)聲音。
[0076]本技術(shù)可以使用以下特征(I)至特征(4)來(lái)獲得高品質(zhì)逼真的聲音。
[0077](I)在由現(xiàn)有AAC標(biāo)準(zhǔn)定義的PCE (Program_config_element)中的注釋區(qū)域中記錄了與垂直方向上揚(yáng)聲器的布置有關(guān)的信息。
[0078](2)在特征(I)的情況下,為了將公共注釋區(qū)別于垂直方向上揚(yáng)聲器布置信息,編碼裝置對(duì)兩個(gè)標(biāo)識(shí)信息項(xiàng),即同步字和CRC校驗(yàn)碼,進(jìn)行編碼,并且解碼裝置比較這兩個(gè)標(biāo)識(shí)信息項(xiàng)。當(dāng)這兩個(gè)標(biāo)識(shí)信息項(xiàng)彼此相同時(shí),解碼裝置獲取揚(yáng)聲器布置信息。
[0079](3)在輔助數(shù)據(jù)區(qū)域(DSE(data_stream_element))中記錄音頻數(shù)據(jù)的下混信息。
[0080](4)從6.1聲道或7.1聲道下混為2聲道是兩級(jí)處理,包括從6.1聲道或7.1聲道下混為5.1聲道,以及從5.1聲道下混為2聲道。
[0081]因此,使用與垂直方向上揚(yáng)聲器的布置有關(guān)的信息可以除了平面中的聲音圖像之夕卜,還再現(xiàn)垂直方向上的聲音圖像,并且可以再現(xiàn)比根據(jù)相關(guān)技術(shù)的平面多聲道更逼真的聲音。
[0082]另外,當(dāng)傳輸與從6.1聲道或7.1聲道下混為5.1聲道或2聲道有關(guān)的信息時(shí),使用一個(gè)編碼數(shù)據(jù)項(xiàng)可以使得利用最適合于每個(gè)再現(xiàn)環(huán)境的聲道數(shù)來(lái)再現(xiàn)聲音。在根據(jù)與本技術(shù)不對(duì)應(yīng)的相關(guān)技術(shù)的解碼裝置中,垂直方向上的信息被作為公共注釋而忽略,并且音頻數(shù)據(jù)被解碼。因此,不損壞兼容性。
[0083][關(guān)于揚(yáng)聲器的布置]
[0084]接著,將描述在再現(xiàn)音頻數(shù)據(jù)時(shí)揚(yáng)聲器的布置。
[0085]例如,如圖1所示,假定用戶從前側(cè)觀察諸如電視機(jī)的顯示裝置的顯示屏TVS。也就是說(shuō),在圖1中假定用戶位于顯示屏TVS的前面。
[0086]在這種情況下,假定13 個(gè)揚(yáng)聲器 Lvh、Rvh> Lrs、Ls、L、Lc、C、Re、R、Rs、Rrs、Cs 和
LFE被布置成環(huán)繞用戶。
[0087]在下文中,由揚(yáng)聲器Lvh> Rvh> Lrs、Ls、L、Lc、C、Re、R、Rs、Rrs、Cs 和 LFE 再現(xiàn)的音頻數(shù)據(jù)(聲音)的聲道分別被稱為L(zhǎng)vh、Rvh、Lrs、Ls、L、Lc、C、Re、R、Rs、Rrs、Cs和LFE。
[0088]如圖2所示,聲道L是“前左”,聲道R是“前右”,而聲道C是“前中心”。
[0089]另外,聲道Ls是“左環(huán)繞”,聲道Rs是“右環(huán)繞”,聲道Lrs是“左后”,聲道Rrs是“右后”,而聲道Cs是“后中心”。
[0090]聲道Lvh是“左高前”,聲道Rvh是“右高前”,而聲道LFE是“低頻效果”。
[0091]返回參考圖1,揚(yáng)聲器Lvh和揚(yáng)聲器Rvh被布置在用戶的前上左側(cè)和前上右側(cè)。布置有揚(yáng)聲器Rvh和揚(yáng)聲器Lvh的層是“頂層”。
[0092]揚(yáng)聲器L、揚(yáng)聲器C和揚(yáng)聲器R被布置在用戶的左邊、中心和右邊。揚(yáng)聲器Lc和揚(yáng)聲器Re分別被布置在揚(yáng)聲器L與揚(yáng)聲器C之間以及揚(yáng)聲器R與揚(yáng)聲器C之間。另外,揚(yáng)聲器Ls和揚(yáng)聲器Rs分別被布置在用戶的左側(cè)和右側(cè),而揚(yáng)聲器Lrs、揚(yáng)聲器Rrs和揚(yáng)聲器Cs分別被布置在用戶的左后、右后和后面。
[0093]揚(yáng)聲器Lrs、Ls、L、Lc、C、Re、R、Rs、Rrs和Cs被布置在以下平面內(nèi)以環(huán)繞用戶,該平面基本上設(shè)置在用戶耳朵的高度處。布置有這些揚(yáng)聲器的層是“中層”。
[0094]揚(yáng)聲器LFE被布置在用戶的前下側(cè),并且布置有揚(yáng)聲器LFE的層是“LFE層”。
[0095][關(guān)于編碼比特流]
[0096]當(dāng)編碼每個(gè)聲道的音頻數(shù)據(jù)時(shí),例如獲得了圖3中所示的編碼比特流。也就是說(shuō),圖3示出了 AAC幀的編碼比特流的句法。
[0097]圖3 中所示的編碼比特流包括 “ Header/side info”、“ PCE ”、“ SCE ”、“ CPE ”、“ LFE ”、“DSE”、“FIL (DRC) ”和“FIL(END) ”。在本示例中,編碼比特流包括三個(gè)“CPE”。
[0098]例如,“PCE”包括關(guān)于每個(gè)聲道的音頻數(shù)據(jù)的信息。在本示例中,“PCE”包括“Matrix-mixdown”,其是關(guān)于音頻數(shù)據(jù)的下混的信息,以及包括“高度信息”,其是關(guān)于揚(yáng)聲器的布置的信息。另外,“PCE”包括“COmment_field_data”,其是可以存儲(chǔ)自由注釋的注釋區(qū)域(注釋字段),并且 “comment_f ield_data” 包括 “height_extension_element”,其是擴(kuò)展的區(qū)域。注釋區(qū)域可以存儲(chǔ)任意數(shù)據(jù),如公共注釋?!癶eight_extension_element”包括“高度信息”,其是關(guān)于揚(yáng)聲器的布置的高度的信息。
[0099]“SCE”包括單聲道的音頻數(shù)據(jù),“CPE”包括聲道對(duì),即兩個(gè)聲道,的音頻數(shù)據(jù),而“LFE”包括例如聲道LFE的音頻數(shù)據(jù)。例如,“SCE”存儲(chǔ)聲道C或聲道Cs的音頻數(shù)據(jù),而“CPE”包括聲道L或R或者聲道Lvh或Rvh的音頻數(shù)據(jù)。
[0100]另外,“DSE”是輔助數(shù)據(jù)區(qū)域?!癉SE”存儲(chǔ)自由數(shù)據(jù)。在本示例中,“DSE”包括“5.1聲道下混為2聲道”、“動(dòng)態(tài)范圍控制”、“DRC呈現(xiàn)模式”、“6.1聲道和7.1聲道下混為5.1聲道”、“全局增益下混”和“LFE下混”,作為關(guān)于音頻數(shù)據(jù)的下混的信息。
[0101]另外,“FIL(DRC) ”包括關(guān)于聲音的動(dòng)態(tài)范圍控制的信息。例如,“FIL(DRC) ”包括“節(jié)目參考水平”和“動(dòng)態(tài)范圍控制”。
[0102][關(guān)于注釋字段]
[0103]如上所述,“PCE”的 “comment_f ield_data,,包括 “height_extension_element,,。因此,通過(guò)關(guān)于垂直方向上揚(yáng)聲器布置的信息來(lái)實(shí)現(xiàn)多聲道再現(xiàn)。也就是說(shuō),通過(guò)布置在具有各個(gè)高度的層(如“頂層”或“中層”)中的揚(yáng)聲器來(lái)再現(xiàn)高品質(zhì)逼真的聲音。
[0104]例如,如圖4所示,“height_extension_element”包括用于與其他公共注釋區(qū)別的同步字。也就是說(shuō),圖4是示出了 “height_extension_element”的句法的圖。
[0105]在圖4 中,“PCE_HEIGHT_EXTENSION_SYNC” 指示同步字。
[0106]另外,“front_element_height_info[i],,、“side_element_height_info [i] ” 和“back_element_height_info[i] ”指示被布置在觀察者的前面、側(cè)面以及后面的揚(yáng)聲器的聞度,即多個(gè)層。
[0107]此外,“byte_alignmentO ” 指不字節(jié)對(duì)齊,而 “height_info_crc_check” 指不被用作為標(biāo)識(shí)信息的CRC校驗(yàn)碼。另外,CRC校驗(yàn)碼是基于在“PCE_HEIGHT_EXTENSION_SYNC”與“byte_alignment() ”之間讀取的信息,即同步字、關(guān)于每個(gè)揚(yáng)聲器的布置的信息(關(guān)于每個(gè)聲道的信息)、以及字節(jié)對(duì)齊而計(jì)算的。然后,確定所計(jì)算的CRC校驗(yàn)碼是否與“height_info_crc_check”所指示的CRC校驗(yàn)碼相同。當(dāng)CRC校驗(yàn)碼彼此相同時(shí),確定正確地讀取了關(guān)于每個(gè)揚(yáng)聲器的布置的信息。另外,“crc_cal() ! =height_info_crc_check”指示CRC校驗(yàn)碼之間的比較。
[0108]例如,作為與聲源的位置,即揚(yáng)聲器的布置(高度)有關(guān)的信息的“fr0nt_element_height_info[i] ”、“ side_element_height_info[i],, 以及 “back_element_height_info[i] ”如圖5所示被設(shè)置。
[0109]也就是說(shuō),當(dāng)關(guān)于“front_element_height_info [i] ”、“side_element_height_info[i] ” 以及“baCk_element_height_inf0[i] ” 的信息是“O”、“I”及“2” 時(shí),揚(yáng)聲器的高度分別是“正常高度”、“頂部揚(yáng)聲器”和“底部揚(yáng)聲器”。也就是說(shuō),布置有揚(yáng)聲器的層是“中層”、“頂層”和“LFE層”。
[0110][關(guān)于DSE]
[0111]接著,將描述“MPEG4輔助數(shù)據(jù)”,其是包括在“DSE”中的輔助數(shù)據(jù)區(qū)域,即“data_stream_element () 1tJ“data_stream_byte[] ”??梢酝ㄟ^(guò)“MPEG4 輔助數(shù)據(jù)”來(lái)執(zhí)行音頻數(shù)據(jù)從6.1聲道或7.1聲道到5.1聲道或2聲道的下混DRC控制。
[0112]圖6是示出了 “MPEG4輔助數(shù)據(jù)”的句法的圖?!癕PEG4輔助數(shù)據(jù)”包括“bs_info O ”、“ancillary_data_status () ”、“downmixing_levels_MPEG4 O,,、“audio_coding_mode() ”、“Compression_value” 以及 “MPEG4_ext_ancillary_data O ”。
[0113]此處,“Compression_value”對(duì)應(yīng)于圖3中所示的“動(dòng)態(tài)范圍控制”。另外,“bs_info () ”、“ancillary_data_status () ”、“downmixing_levels_MPEG4 () ”、“audio_coding_mode () ”以及“MPEG4_ext_ancillary_data() ”的句法分別如圖7至圖11所不。
[0114]例如,如圖7 所不,“bs_info O ” 包括 “mpeg_audio_type”、“dolby_sur;round_mode,,、“drc_presentation_mode,,以及 “pseudo_surround_enable,,。
[0115]另外,“drc_presentation_m`ode”對(duì)應(yīng)于圖3 中所不的“DRCPresentation Mode”。另外,“pseudo_surround_enable”包括用于指示從5.1聲道下混為2聲道的過(guò)程的信息,即,用于指示要被用于下混的多種下混方法中的一種下混方法的信息。
[0116]例如,處理取決于圖8中示出的“ancillary_data_status O ”中所包括的“ancillary_data_extension_status” 是“O” 還是“I” 而變化。當(dāng) “ancillary_data_extension_status”為I時(shí),執(zhí)行對(duì)圖6中所示的“MPEG4輔助數(shù)據(jù)”中的“MPEG4_ext_ancillary_data() ”的訪問(wèn),并且執(zhí)行下混DRC控制。另一方面,當(dāng)“ancillary_data_extensior^status”為O時(shí),執(zhí)行根據(jù)相關(guān)技術(shù)的處理。以這種方式,可以確保與現(xiàn)有標(biāo)準(zhǔn)的兼容性。
[0117]另外,包括在圖8 中所不的 “ancillary_data_status O ” 中的 “downmixing_levels_MPEG4_status”是用于指定被用于將5.1聲道下混為2聲道的系數(shù)(混合比率)的信息。也就是說(shuō),當(dāng)“downmixing_levels_MPEG4_status”為I時(shí),通過(guò)存儲(chǔ)在圖9中所示的“downmixing_levels_MPEG4 O ”中的信息而確定的系數(shù)被用于下混。
[0118]此外,圖9 中所不的 “downmixing_levels_MPEG4 O ” 包括“center_mix_level_value”和“surround_mix_level_value”,作為用于指定下混系數(shù)的信息。例如,與“center_mix_level_value” 和 “surround_mix_level_value” 對(duì)應(yīng)的系數(shù)的值是由下文將描述的圖19中所示的表來(lái)確定的。
[0119]另外,圖9中所不的“downmixing_levels_MPEG4() ”對(duì)應(yīng)于圖3中所不的“5.1聲道下混為2聲道”。
[0120]此外,圖11 中所不的 “MPEG4_ext_ancillary_data O ” 包括 “ext_ancillary_data_statusO ”、“ext_downmixing_levelsO ”、“ext_downmixing_global_gains() ” 和“ext_downmixing_lfe_levelO ”。
[0121]擴(kuò)展聲道的數(shù)量以使得5.1聲道的音頻數(shù)據(jù)被擴(kuò)展成7.1聲道或6.1聲道的音頻數(shù)據(jù)所需要的信息被存儲(chǔ)在“MPEG4_ext_ancillary_data() ”中。
[0122]具體地,“ext_ancillary_data_status O ”包括用于指示是否將大于5.1聲道的聲道下混為5.1聲道的信息(標(biāo)記)、用于指示是否在下混期間執(zhí)行增益控制的信息、以及用于指示是否在下混期間使用LFE聲道的信息。
[0123]用于指定在下混期間所使用的系數(shù)(混合比率)的信息被存儲(chǔ)在“ ext_downmixing_levels O ”中,并且與增益調(diào)整期間的增益相關(guān)的信息被包括在“ext_downmixing_global_gains O ”中。另外,用于指定在下混期間所使用LEF聲道的系數(shù)(混合比率)的信息被存儲(chǔ)在“ext_downmixing_lfe_level O ”中。
[0124]具體地,例如,“ext_ancillary_data_statusO ” 的句法是如圖 12 所示,在 “ext_ancillary_data_status O ” 中,“ext_downmixing_levels_status” 指不是否將 6.1 聲道或 7.1 聲道下混為 5.1 聲道。也就是說(shuō),“ext_downmixing_levels_status” 指不“ext_downmixing_levels O ”是否存在?!癳xt_downmixing_levels_status” 對(duì)應(yīng)于圖 3 所不的“6.1聲道和7.1聲道下混為5.1聲道”。
[0125]另外,“ext_downmixing_global_gains_status”指示是否執(zhí)行全局增益控制,并且與圖3所示的“全局增益下混”對(duì)應(yīng)。也就是說(shuō),“ext_downmixing_global_gains_status”指不“ext_downmixing_global_gains O ”是否存在。另外,“ext_downmixing_lfe_level_status”指示在5.1聲道被下混為2聲道時(shí)是否使用LFE聲道,并且與圖3所示的“LFE下混”對(duì)應(yīng)。
[0126]圖 11 中所不的 “MPEG4_ext_ancillary_data O ” 中的 “ext_downmixing_levels O ”的句法是如圖13所示,并且圖13中所示的“dmix_a_idx”和“dmix_b_idx”是指示下混期間的混合比率(系數(shù))的信息。
[0127]圖14 不出了 由 “ext_downmixing_levels O ” 確定的 “dmix_a_idx” 與 “dmix_b_idx”之間的對(duì)應(yīng)關(guān)系,并且示出了在7.1聲道的音頻數(shù)據(jù)被下混時(shí)“dmix_a_idx”和“dmix_b_idx”所應(yīng)用到的分量。
[0128]圖 11 所不的 “MPEG4_ext_ancillary_data(),,中的 “ext_downmixing_global_gains () ” 和 “ext_downmixing_lfe_level O ” 的句法是如圖 15 和圖 16 所不。
[0129]例如,圖15所示的“ext_downmixing_global_gains O ”包括用于指示在下混為
5.1聲道期間增益的符號(hào)的“dmx_gain_5_sign”,增益“dmx_gain_5_idx”、用于指示在下混為2聲道期間增益的符號(hào)的“dmx_gain_2_sign”、以及增益“dmx_gain_2_idx”。
[0130]另外,圖16 中所不的“ext_downmixing_lfe_level O ”包括“dmix_lfe_idx”,并且“dmiX_lfe_idX”是用于指示在下混期間LFE聲道的混合比率(系數(shù))的信息。
[0131][關(guān)于下混]
[0132]另外,圖7中所不的“bs_info O ”的句法中的“pseudo_sur;round_enable”指不下混處理的過(guò)程,并且該處理的過(guò)程如圖17所示。此處,圖17示出了當(dāng)“pseudo_surround_enable” 為 O 時(shí)和當(dāng) “pseudo_surround_enable” 為 I 時(shí)的兩個(gè)過(guò)程。
[0133]接著,將描述音頻數(shù)據(jù)下混處理。
[0134]首先,將描述從5.1聲道下混為2聲道。在這種情況下,當(dāng)L聲道和R聲道在下混之后分別是L’道和R’聲道時(shí),執(zhí)行以下處理。
[0135]也就是說(shuō),當(dāng)“pseudo_surround_enable”為O時(shí),L’道和R’聲道的音頻數(shù)據(jù)通過(guò)以下表達(dá)式(I)來(lái)計(jì)算。
[0136]L’ =L+CXb+LsXa+LFEXc
[0137]R,=R+CXb+RsXa+LFEXc...(I)
[0138]當(dāng)“pseudo_surround_enable”為I時(shí),L’道和R’聲道的音頻數(shù)據(jù)通過(guò)以下表達(dá)式(2)來(lái)計(jì)算。
[0139]L,=L+CXb_aX (Ls+Rs) +LFEX c
[0140]R,=R+CXb+aX (Ls+Rs) +LFEXe...(2)
[0141]在表達(dá)式(I)和表達(dá)式(2)中,L、R、C、Ls、Rs和LFE是形成5.1聲道的聲道,并且分別指示參考圖1和圖2已經(jīng)描述過(guò)的聲道L、R、C、Ls、Rs及LFE。
[0142]在表達(dá)式(I)和表達(dá)式(2)中,“c”是由圖16中示出的“ext_downmixing_lfe_level O”中所包括的“dmix_lfe_idx”的值確定的常量。例如,與“dmix_lfe_idx”的每個(gè)值對(duì)應(yīng)的常量c的值如圖18所示。具體地,當(dāng)圖12中所示的“ext_ancillary_data_status O ” 中的“ext_downmixing_lfe_level_status” 為 O 時(shí),在使用表達(dá)式(I)和表達(dá)式
(2)的計(jì)算中不使用LFE聲道。當(dāng)“ext_downmixing_lfe_level_status”為I時(shí),基于圖18中所示的表來(lái)確定乘以LFE聲道的常量c的值。
[0143]在表達(dá)式(I)和表達(dá)式(2)中,“a”和“b”是由圖13中示出的“ext_downmixing_levels () ”中所包括的“dmix_a_idx”和“dmix_b_idx”的值確定的常量。另外,在表達(dá)式(I)和表達(dá)式(2)中,“a”和“b”可以是由圖9中不出的“downmixing_levels_MPEG4 O ”中的 “center_mix_level_value,,和 “surround_mix_level_value” 的值確定的常量。
[0144]例如,與“dmix_a_idx”和“dmix_b_idx” 的值或者“center_mix_level_value” 和“surround_mix_level_value”的值有關(guān)的常量a和b的值如圖19所示。在本示例中,由于“dmix_a_idx,lPI“dmix_b_idx,,以及 “center_mix_level_value,lPI“su;r;round_mix_level_value”參考同一表,所以用于下混的常量(系數(shù))a和b具有相同的值。
[0145]然后,將描述從7.1聲道或6.1聲道下混為5.1聲道。
[0146]當(dāng)包括布置在用戶后面的揚(yáng)聲器的聲道Lrs和Rrs的聲道C、L、R、Ls、Rs、Lrs、Rrs及LFE的音頻數(shù)據(jù)被轉(zhuǎn)換成包括聲道C’、L’、R’、Ls’、Rs’及LFE’的5.1聲道的音頻數(shù)據(jù)時(shí),由以下表達(dá)式(3)執(zhí)行計(jì)算。此處,聲道C’、L’、R’、LS’、RS’及LFE’分別指示在下混之后的聲道C、L、R、Ls、Rs及LFE。另外,在表達(dá)式(3)中,C、L、R、Ls、Rs、Lrs、Rrs及LFE指示聲道C、L、R、Ls、Rs、Lrs、Rrs及LFE的音頻數(shù)據(jù)。
[0147]C,=C
[0148]L,=L
[0149]R’ =R
[0150]Ls’ =Ls X dl+Lrs X d2
[0151]Rs’ =Rs X dl+Rrs X d2[0152]LFE,=LFE...(3)
[0153]在表達(dá)式(3)中,dl和d2是常量。例如,常量dl和d2是針對(duì)圖19所示的“dmix_a_i dx ”和“ dmix_b_i dx ”的值而確定的。
[0154]當(dāng)包括布置在用戶前面的揚(yáng)聲器的聲道Lc和Re的聲道C、L、R、Lc、Re、Ls、Rs及LFE的音頻數(shù)據(jù)被轉(zhuǎn)換成包括聲道C’、L’、R’、Ls’、Rs’及LFE’的5.1聲道的音頻數(shù)據(jù)時(shí),由以下表達(dá)式(4)執(zhí)行計(jì)算。此處,聲道C’、L’、R’、LS’、RS’及LFE’分別指示在下混之后的聲道C、L、R、Ls、Rs及LFE。在表達(dá)式(4)中,C、L、R、Lc、Re、Ls、Rs及LFE指示聲道C、L、R、Lc、Re、Ls、Rs 及 LFE 的音頻數(shù)據(jù)。
[0155]C,=C+el X (Lc+Rc)
[0156]L,=L+LcXe2
[0157]R’=R+RcXe2
[0158]Ls ’ =Ls
[0159]Rs ’ =Rs
[0160]LFE,=LFE...(4)
[0161]在表達(dá)式(4)中,el和e2是常量。例如,常量el和e2是針對(duì)圖19所示的“dmix_a_i dx ”和“ dmix_b_i dx ”的值而確定的。
[0162]當(dāng)包括布置在用戶前上側(cè)的揚(yáng)聲器的聲道Lvh和Rvh的聲道C、L、R、Lvh、Rvh、Ls、Rs及LFE的音頻數(shù)據(jù)被轉(zhuǎn)換成包括聲道C’、L’、R’、Ls’、Rs’及LFE’的5.1聲道的音頻數(shù)據(jù)時(shí),由以下表達(dá)式(5)執(zhí)行計(jì)算。此處,聲道C’、L’、R’、LS’、RS’及LFE’分別指示在下混之后的聲道C、L、R、Ls、Rs及LFE0在表達(dá)式(5)中,C、L、R、Lvh、Rvh、Ls、Rs及LFE指示聲道C、L、R、Lvh、Rvh、Ls、Rs及LFE的音頻數(shù)據(jù)。
[0163]C,=C
[0164]L’ =LXfl+LvhXf2
[0165]R’ =RXfl+RvhXf2
[0166]Ls,=Ls
[0167]Rs,=Rs
[0168]LFE,=LFE...(5)
[0169]在表達(dá)式(5)中,fl和f2是常量。例如,常量fl和f2是針對(duì)圖19所示的“dmix_a_i dx ”和“ dmix_b_i dx ”的值而確定的。
[0170]在進(jìn)行從6.1聲道下混為5.1聲道時(shí),執(zhí)行以下處理。也就是說(shuō),當(dāng)聲道C、L、R、Ls、Rs、Cs及LFE的音頻數(shù)據(jù)被轉(zhuǎn)換成包括聲道C’、L’、R’、Ls’、Rs’及LFE’的5.1聲道的音頻數(shù)據(jù)時(shí),由以下表達(dá)式(6)執(zhí)行計(jì)算。此處,聲道C’、L’、R’、LS’、RS’及LFE’分別指示在下混之后的聲道C、L、R、Ls、Rs及LFE。在表達(dá)式(6)中,C、L、R、Ls、Rs、Cs及LFE指示聲道C、L、R、Ls、Rs、Cs及LFE的音頻數(shù)據(jù)。
[0171]C,=C
[0172]L,=L
[0173]R’ =R
[0174]Ls,=Ls X gl+Cs X g2
[0175]Rs ’ =Rs X gl+Cs X g2[0176]LFE’ =LFE...(6)
[0177]在表達(dá)式(6)中,gl和g2是常量。例如,常量gl和g2是針對(duì)圖19所示的“dmix_a_i dx ”和“ dmix_b_i dx ”的值而確定的。
[0178]接著,將描述在下混期間用于音量校正的全局增益。
[0179]全局下混增益用于校正通過(guò)下混被增大或減小的聲音音量。此處,dmx_gain5指示用于從7.1聲道或6.1聲道下混為5.1聲道的校正值,而dmx_gain2指示用于從5.1聲道下混為2聲道的校正值。另外,dmx_gain2支持不與7.1聲道對(duì)應(yīng)的解碼裝置或比特流。
[0180]其應(yīng)用和操作與DRC重壓縮類似。另外,編碼裝置可以針對(duì)音頻幀太長(zhǎng)的時(shí)段或者音頻幀太短的時(shí)段適當(dāng)?shù)貓?zhí)行選擇性評(píng)估以確定全局下混增益。
[0181]在從7.1聲道下混為2聲道期間,應(yīng)用組合增益,即(dmx_gain5+dmx_gain2)。例如,6比特?zé)o符號(hào)整數(shù)被用作為dmx_gain5和dmx_gain2,并且以0.25dB的間隔量化dmx_gain5 和 dmx_gain2。
[0182]因此,當(dāng)dmx_gain5和dmx_gain2相互組合時(shí),組合增益在±15.75dB的范圍內(nèi)。增益值被應(yīng)用于解碼的當(dāng)前幀的音頻數(shù)據(jù)的樣本。
[0183]具體地,在下混為5.1聲道期間,執(zhí)行以下處理。也就是說(shuō),當(dāng)針對(duì)通過(guò)下混所獲得的聲道C’、L’、R’、Ls’、Rs’及LFE’的音頻數(shù)據(jù)執(zhí)行增益校正,以獲得聲道C’ ’、L’ ’、R’ ’、Ls’’、Rs’’及LFE’’的音頻數(shù)據(jù)時(shí),由以下表達(dá)式(7)執(zhí)行計(jì)算。
[0184]L’’ =L’ Xdmx_gain5
[0185]R’’ =R’ Xdmx_ga`in5
[0186]C’’ =C’ Xdmx_gain5
[0187]Ls,,=Ls,Xdmx_gain5
[0188]Rs,,=Rs,Xdmx_gain5
[0189]LFE’’=LFE’ Xdmx_gain5...(7)
[0190]此處,dmx_gain5是標(biāo)量值,并且是通過(guò)以下表達(dá)式(8)根據(jù)圖15所示的“dmx_gain_5_sign” 和 “dmx_gain_5_idx” 計(jì)算的增益值。
[0191]dmx_gain5=10(dmx-gain-5-ldx/20)如果 dmx_gain_5_sign==l
[0192]dmx_gain5=10(-dmx-gain-5-ldx/20)如果 dmx_gain_5_sign==0 …(8)
[0193]類似地,在下混為2聲道期間,執(zhí)行以下處理。也就是說(shuō),當(dāng)針對(duì)通過(guò)下混所獲得的聲道L’和聲道R’的音頻數(shù)據(jù)執(zhí)行增益校正,以獲得聲道L’ ’和聲道R’ ’的音頻數(shù)據(jù)時(shí),由以下表達(dá)式(9)執(zhí)行計(jì)算。
[0194]L’’ =L’ Xdmx_gain2
[0195]R,,=R,Xdmx_gain2...(9)
[0196]此處,dmx_gain2是標(biāo)量值,并且是通過(guò)以下表達(dá)式(10)根據(jù)圖15所示的“dmx_gain_2_sign” 和 “dmx_gain_2_idx” 計(jì)算的增益值。
[0197]dmx_gain2=10(dmx-gain-2-1dx/20)如果 dmx_gain_2_sign==l
[0198]dmx_gain2=10(-dDlx-gain-2-1dx/20)如果 dmx_gain_2_sign==0...(10)
[0199]在從7.1聲道下混為2聲道期間,在7.1聲道被下混為5.1聲道并且5.1聲道被下混為2聲道之后,可以針對(duì)所獲得的信號(hào)(數(shù)據(jù))執(zhí)行增益調(diào)整。在此情況下,應(yīng)用于音頻數(shù)據(jù)的增益值dmx_gain_7to2可以通過(guò)組合dmx_gain5和dmx_gain2而獲得,如以下表達(dá)式(11)所描述的。
[0200]dmx_gain_7to2=dmx_gain_2 X dmx_gain_5...(11)
[0201]與從7.1聲道下混為2聲道類似,執(zhí)行從6.1聲道下混為2聲道。
[0202]例如,在從7.1聲道下混為2聲道期間,當(dāng)通過(guò)表達(dá)式(7)或表達(dá)式(9)以兩級(jí)執(zhí)行增益校正時(shí),可以輸出5.1聲道的音頻數(shù)據(jù)和2聲道的音頻數(shù)據(jù)。
[0203][關(guān)于DRC呈現(xiàn)模式]
[0204]另外,包括在圖7 所不的“bs_info () ” 中的“drc_presentation_mode” 如圖 20 所示。也就是說(shuō),圖20是示出了 “drc_presentation_mode”的句法的圖。
[0205]當(dāng)“drc_presentation_mode” 為 “01” 時(shí),模式是“DRC 呈現(xiàn)模式 I”。當(dāng) “drc_presentation.mode"為“ 10”時(shí),模式是“DRC呈現(xiàn)模式2”。在“DRC呈現(xiàn)模式I ”和“DRC呈現(xiàn)模式2”中,如圖21所示執(zhí)行增益控制。
[0206][編碼裝置的示例結(jié)構(gòu)]
[0207]接著,將對(duì)本技術(shù)所應(yīng)用到的【具體實(shí)施方式】進(jìn)行描述。
[0208]圖22是示出了根據(jù)本技術(shù)所應(yīng)用到的實(shí)施方式的編碼裝置的結(jié)構(gòu)的示例的圖。編碼裝置11包括輸入單元21、編碼單元22以及封裝單元23。
[0209]輸入單元21從外部獲取音頻數(shù)據(jù)和關(guān)于音頻數(shù)據(jù)的信息,并且將音頻數(shù)據(jù)和該信息提供給編碼單元22。例如,獲取關(guān)于揚(yáng)聲器的布置(布置高度)的信息,作為關(guān)于音頻數(shù)據(jù)的信息。
[0210]編碼單元22對(duì)從輸入單元21提供的音頻數(shù)據(jù)和關(guān)于音頻數(shù)據(jù)的信息進(jìn)行編碼,并且將編碼的音頻數(shù)據(jù)和信息提供給封裝單元23。封裝單元23對(duì)從編碼單元22提供的音頻數(shù)據(jù)或關(guān)于音頻數(shù)據(jù)的信息進(jìn)行封裝,以生成圖3中所示的編碼比特流,并且輸出編碼比特流。
[0211][編碼處理的描述]
[0212]接著,將參考圖23所示的流程圖對(duì)編碼裝置11的編碼處理進(jìn)行描述。
[0213]在步驟Sll中,輸入單元21獲取音頻數(shù)據(jù)和關(guān)于音頻數(shù)據(jù)的信息,并且將音頻數(shù)據(jù)和該信息提供給編碼單元22。例如,獲取了 7.1聲道當(dāng)中的每個(gè)聲道的音頻數(shù)據(jù),以及要存儲(chǔ)在圖4中所示的“height_extension_element”中的關(guān)于揚(yáng)聲器布置的信息(下文中,稱為揚(yáng)聲器布置信息)。
[0214]在步驟S12中,編碼單元22對(duì)從輸入單元21提供的每個(gè)聲道的音頻數(shù)據(jù)進(jìn)行編碼。
[0215]在步驟S13中,編碼單元22對(duì)從輸入單元21提供的揚(yáng)聲器布置信息進(jìn)行編碼。在這種情況下,編碼單元22生成要存儲(chǔ)在圖4示出的“height_extension_element”中所包括的“PCE_HEIGHT_EXTENSION_SYNC”中的同步字,或者CRC校驗(yàn)碼,該CRC校驗(yàn)碼是要存儲(chǔ)在“height_info_crc_check”中的標(biāo)識(shí)信息,并且編碼單元22將同步字或CRC校驗(yàn)碼以及編碼揚(yáng)聲器布置信息提供給封裝單元23。
[0216]另外,編碼單元22生成了生成編碼比特流所需的信息,并且將所生成的信息和編碼的音頻數(shù)據(jù)或揚(yáng)聲器布置信息提供給封裝單元23。
[0217]在步驟S14中,封裝單元23針對(duì)從編碼單元22提供的音頻數(shù)據(jù)或揚(yáng)聲器布置信息執(zhí)行比特封裝,以生成圖3中所示的編碼比特流。在這種情況下,封裝單元23將例如揚(yáng)聲器布置信息或同步字以及CRC校驗(yàn)碼存儲(chǔ)在“PCE”中,并且將音頻數(shù)據(jù)存儲(chǔ)在“SCE”或“CPE” 中。
[0218]在輸出編碼比特流時(shí),編碼處理結(jié)束。
[0219]以這種方式,編碼裝置11將揚(yáng)聲器布置信息插入到編碼比特流中并且輸出編碼的音頻數(shù)據(jù),該揚(yáng)聲器布置信息是關(guān)于每層中揚(yáng)聲器的布置的信息。因此,當(dāng)使用關(guān)于垂直方向上揚(yáng)聲器布置的信息時(shí),除了平面中的聲音圖像之外,還可以再現(xiàn)垂直方向上的聲音圖像。因此,可以再現(xiàn)更逼真的聲音。
[0220][解碼裝置的示例結(jié)構(gòu)]
[0221]接著,將描述接收從編碼裝置11輸出的編碼比特流,并且對(duì)編碼比特流進(jìn)行解碼的解碼裝置。
[0222]圖24是示出了解碼裝置的結(jié)構(gòu)的示例的圖。解碼裝置51包括分離單元61、解碼單元62以及輸出單元63。
[0223]分離單元61接收從編碼單元11傳輸?shù)木幋a比特流,對(duì)編碼比特流執(zhí)行比特解封,并且將解封的編碼比特流提供給解碼單元62。
[0224]解碼單元62對(duì)例如從分離單元61提供的編碼比特流,即每個(gè)聲道的音頻數(shù)據(jù)或揚(yáng)聲器布置信息,進(jìn)行解碼,并且將解碼的音頻數(shù)據(jù)提供給輸出單元63。例如,如果需要,解碼單元62對(duì)音頻數(shù)據(jù)進(jìn)行下混。
[0225]輸出單元63基于由解碼單元62指定的揚(yáng)聲器的布置(揚(yáng)聲器映射)來(lái)輸出從解碼單元62提供的音頻數(shù)據(jù)。從輸出單元63輸出的每個(gè)聲道的音頻數(shù)據(jù)被提供給每個(gè)聲道的揚(yáng)聲器并且然后被再現(xiàn)。
[0226][解碼操作的描述]
[0227]接著,將參考圖25所示的流程圖對(duì)解碼裝置51的解碼處理進(jìn)行描述。
[0228]在步驟S41中,解碼單元62對(duì)音頻數(shù)據(jù)進(jìn)行解碼。
[0229]也就是說(shuō),分離單元61接收從編碼單元11傳輸?shù)木幋a比特流,并且對(duì)編碼比特流執(zhí)行比特解封。然后,分離單元61將通過(guò)比特解封所獲得音頻數(shù)據(jù)以及各種信息,諸如揚(yáng)聲器布置信息,提供給解碼單元62。解碼單元62對(duì)從分離單元61提供的音頻數(shù)據(jù)進(jìn)行解碼,并且將解碼的音頻數(shù)據(jù)提供給輸出單元63。
[0230]在步驟S42中,解碼單元62根據(jù)從分離單元61提供的信息檢測(cè)同步字。具體地,從圖4中所不的“height_extension_element”檢測(cè)同步字。
[0231]在步驟S43中,解碼單元62確定是否檢測(cè)到同步字。當(dāng)在步驟S43中確定檢測(cè)到同步字時(shí),在步驟S44中解碼單元62對(duì)揚(yáng)聲器布置信息進(jìn)行解碼。
[0232]也就是說(shuō),解碼單元62從圖4中所示的“height_extension_element”讀取信息,諸如 “front_element_height_info[i],,、“side_element_height_info[i] ” 和 “back_element_height_info[i] ”。以這種方式,可以找到能夠以高品質(zhì)再現(xiàn)每個(gè)音頻數(shù)據(jù)項(xiàng)的揚(yáng)聲器的位置(聲道)。
[0233]在步驟S45中,解碼單元62生成標(biāo)識(shí)信息。也就是說(shuō),解碼單元62基于在“height_extension_element” 中的 “PCE_HEIGHT_EXTENSION_SYNC” 與 “byte_alignment O ”之間讀取的信息,即同步字、揚(yáng)聲器布置信息以及字節(jié)對(duì)齊,來(lái)計(jì)算CRC校驗(yàn)碼,并且獲得標(biāo)識(shí)息。[0234]在步驟S46中,解碼單元62將步驟S45中生成的標(biāo)識(shí)信息與圖4中示出的“height_extension_element” 的 “height_info_crc_check” 中所包括的標(biāo)識(shí)信息進(jìn)行比較,并且確定標(biāo)識(shí)信息項(xiàng)是否彼此相同。
[0235]當(dāng)步驟S46中確定標(biāo)識(shí)信息項(xiàng)彼此相同時(shí),解碼單元62將解碼的音頻數(shù)據(jù)提供給輸出單元63,并且基于所獲得的揚(yáng)聲器布置信息來(lái)指令輸出音頻數(shù)據(jù)。然后,處理前進(jìn)至步驟 S47。
[0236]在步驟S47中,輸出單元63基于由解碼單元62指示的揚(yáng)聲器布置(揚(yáng)聲器映射)來(lái)輸出從解碼單元62提供的音頻數(shù)據(jù)。然后,解碼處理結(jié)束。
[0237]另一方面,當(dāng)步驟S43中確定沒(méi)有檢測(cè)到同步字時(shí)或者當(dāng)步驟S46中確定標(biāo)識(shí)信息項(xiàng)彼此不相同時(shí),在步驟S48中輸出單元63基于預(yù)定的揚(yáng)聲器布置來(lái)輸出音頻數(shù)據(jù)。
[0238]也就是說(shuō),當(dāng)從“height_extension_element”正確地讀取揚(yáng)聲器布置信息時(shí),執(zhí)行步驟S48中的處理。在這種情況下,解碼單元62將音頻數(shù)據(jù)提供給輸出單元63,并且指令輸出音頻數(shù)據(jù),以使得通過(guò)每個(gè)預(yù)定聲道的揚(yáng)聲器再現(xiàn)每個(gè)聲道的音頻數(shù)據(jù)。然后,輸出單元63響應(yīng)于來(lái)自解碼單元62的指令來(lái)輸出音頻數(shù)據(jù),并且解碼處理結(jié)束。
[0239]以這種方式,解碼裝置51對(duì)包括在編碼比特流中的揚(yáng)聲器布置信息或音頻數(shù)據(jù)進(jìn)行解碼,并且基于揚(yáng)聲器布置信息輸出音頻數(shù)據(jù)。由于揚(yáng)聲器布置信息包括關(guān)于垂直方向上揚(yáng)聲器的布置的信息,所以除了平面中的聲音圖像之外還可以再現(xiàn)垂直方向上的聲音圖像。因此,可以再現(xiàn)更逼真的聲音。
[0240]具體地,當(dāng)音頻數(shù)據(jù)被解碼時(shí),例如,如果需要,還執(zhí)行對(duì)音頻數(shù)據(jù)進(jìn)行下混的處理。
[0241]在這種情況下,例如,在圖6中所示的“MPEG4輔助數(shù)據(jù)”的“ancillary_data_status O ”中的“ancillary_data_extension_status,,為“I,,時(shí),解碼單兀 62 讀取“MPEG4_ext_anci I lary_data O ”。然后,解碼單元62讀取包括在圖11中所示的“MPEG4_ext_ancillary_data() ”中的每個(gè)信息項(xiàng),并且執(zhí)行音頻數(shù)據(jù)下混處理或增益校正處理。
[0242]例如,解碼單元62將7.1聲道或6.1聲道的音頻數(shù)據(jù)下混為5.1聲道的音頻數(shù)據(jù),或者進(jìn)一步將5.1聲道的音頻數(shù)據(jù)下混為2聲道的音頻數(shù)據(jù)。
[0243]在這種情況下,如果需要,解碼單元62使用LFE聲道的音頻數(shù)據(jù)用于進(jìn)行下混。每個(gè)聲道乘以的系數(shù)是參考圖13中所示的“ext_downmixing_levels O ”或者圖16中所示的“ext_downmixing_lfe_level O ” 而確定的。另外,參考圖 15 中所不的 “ext_downmixing_global_gains O ”執(zhí)行下混期間的增益校正。
[0244][編碼裝置的示例結(jié)構(gòu)]
[0245]接著,將對(duì)上述的編碼裝置和解碼裝置的詳細(xì)結(jié)構(gòu)的示例和這些裝置的詳細(xì)操作進(jìn)行描述。
[0246]圖26是示出了編碼裝置的詳細(xì)結(jié)構(gòu)的示例的圖。
[0247]編碼裝置91包括輸入單元21、編碼單元22以及封裝單元23。在圖26中,與圖22中所示部件對(duì)應(yīng)的部件被用相同的附圖標(biāo)記來(lái)表示,并且將不再重復(fù)對(duì)其的描述。
[0248]編碼單元22包括PCE編碼單元10UDSE編碼單元102以及音頻元素編碼單元103。
[0249]PCE編碼單元101基于從輸入單元21提供的信息對(duì)PCE進(jìn)行編碼。也就是說(shuō),如果需要,PCE編碼單元101生成要存儲(chǔ)在PCE中的每個(gè)信息項(xiàng)同時(shí)對(duì)每個(gè)信息項(xiàng)進(jìn)行編碼。PCE編碼單元101包括同步字編碼單元111、布置信息編碼單元112以及標(biāo)識(shí)信息編碼單元113。
[0250]同步字編碼單元111對(duì)同步字進(jìn)行編碼,并且使用編碼的同步字作為要存儲(chǔ)在擴(kuò)展區(qū)域中的信息,該擴(kuò)展區(qū)域包括在PCE的注釋區(qū)域中。布置信息編碼單元112對(duì)揚(yáng)聲器布置信息進(jìn)行編碼,該揚(yáng)聲器布置信息指示用于每個(gè)音頻數(shù)據(jù)項(xiàng)的揚(yáng)聲器的高度(層)并且被從輸入單元21提供,并且布置信息編碼單元112使用編碼的揚(yáng)聲器布置信息作為要存儲(chǔ)在注釋區(qū)域的擴(kuò)展區(qū)域中的信息。
[0251]標(biāo)識(shí)信息編碼單元113對(duì)標(biāo)識(shí)信息進(jìn)行編碼。例如,如果需要,標(biāo)識(shí)信息編碼單元113基于同步字和揚(yáng)聲器布置信息來(lái)生成CRC校驗(yàn)碼作為標(biāo)識(shí)信息,并且使用CRC校驗(yàn)碼作為要存儲(chǔ)在注釋區(qū)域的擴(kuò)展區(qū)域中的信息。
[0252]DSE編碼單元102基于從輸入單元21提供的信息對(duì)DSE進(jìn)行編碼。也就是說(shuō),如果需要,DSE編碼單元102生成要存儲(chǔ)在DSE中的每個(gè)信息項(xiàng)同時(shí)對(duì)每個(gè)信息項(xiàng)進(jìn)行編碼。DSE編碼單元102包括擴(kuò)展信息編碼單元114和下混信息編碼單元115。
[0253]擴(kuò)展信息編碼單元114對(duì)用于指示擴(kuò)展信息是否被包括在“MPEG4_ext_ancillary_data O ” 中的信息(標(biāo)記)進(jìn)行編碼,該 “MPEG4_ext_ancillary_data O ”是 DSE的擴(kuò)展區(qū)域。下混信息編碼單元115對(duì)關(guān)于音頻數(shù)據(jù)的下混的信息進(jìn)行編碼。音頻元素編碼單元103對(duì)從輸入單元21提供的音頻數(shù)據(jù)進(jìn)行編碼。
[0254]編碼單元22將通過(guò)對(duì)每種類型的數(shù)據(jù)進(jìn)行編碼而獲得的、要存儲(chǔ)在每個(gè)元素中的信息提供給封裝單元23。
[0255][編碼處理的描述]
[0256]接著,將參考圖27所示的流程圖對(duì)編碼裝置91的編碼處理進(jìn)行描述。該編碼處理比參考圖23所示的流程圖已經(jīng)描述過(guò)的處理更詳細(xì)。
[0257]在步驟S71中,輸入單元21獲取音頻數(shù)據(jù)以及編碼音頻數(shù)據(jù)所需要的信息,并且將音頻數(shù)據(jù)和信息提供給編碼單元22。
[0258]例如,輸入單元21獲取每個(gè)聲道的脈沖編碼調(diào)制(PCM)數(shù)據(jù)、用于指示每個(gè)聲道揚(yáng)聲器的布置的信息、用于指定下混系數(shù)的信息、以及用于指示編碼比特流的比特率的信息,作為音頻數(shù)據(jù)。此處,用于指定下混系數(shù)的信息是用于指示在從7.1聲道或6.1聲道下混為5.1聲道以及從5.1聲道下混為2聲道期間每個(gè)聲道的音頻數(shù)據(jù)所乘以的系數(shù)的信
肩、O
[0259]另外,輸入單元21獲取要獲得的編碼比特流的文件名。文件名由編碼裝置適當(dāng)?shù)厥褂谩?br>
[0260]在步驟S72中,音頻元素編碼單元103對(duì)從輸入單元21提供的音頻數(shù)據(jù)進(jìn)行編碼,并且編碼的音頻數(shù)據(jù)將被存儲(chǔ)在每個(gè)元素中,諸如SCE、CPE及LFE。在這種情況下,以下述比特率來(lái)編碼音頻數(shù)據(jù):通過(guò)從輸入單元21提供給編碼單元22的比特率以及除了音頻數(shù)據(jù)以外的信息中的代碼數(shù)量來(lái)確定所述比特率。
[0261]例如,C聲道的音頻數(shù)據(jù)或Cs聲道的音頻數(shù)據(jù)被編碼并且存儲(chǔ)在SCE中。L聲道的音頻數(shù)據(jù)或R聲道的音頻數(shù)據(jù)被編碼并且存儲(chǔ)在CPE中。另外,LFE聲道的音頻數(shù)據(jù)被編碼并且存儲(chǔ)在LFE中。
[0262]在步驟S73中,同步字編碼單元111基于從輸入單元21提供的信息對(duì)同步字進(jìn)行編碼,并且編碼的同步字是要存儲(chǔ)在圖4所示的“height_extension_element”的“PCE_HEIGHT_EXTENSION_SYNC” 中的信息。
[0263]在步驟S74中,布置信息編碼單元112對(duì)從輸入單元21提供的每個(gè)音頻數(shù)據(jù)的揚(yáng)聲器布置信息進(jìn)行編碼。
[0264]在封裝單元23中在聲源位置處在“height_extension_element”中存儲(chǔ)編碼的揚(yáng)聲器布置信息,也就是說(shuō),按照與揚(yáng)聲器的布置對(duì)應(yīng)的順序存儲(chǔ)。也就是說(shuō),用于指示布置在用戶前面的揚(yáng)聲器所再現(xiàn)的每個(gè)聲道的揚(yáng)聲器高度(聲源的高度)的揚(yáng)聲器布置信息被存儲(chǔ)作為 “height_extension_element,,中的 “front_element_height_info [i] ”。
[0265]另外,在“front_element_height_info[i] ”之后,用于指示布置在用戶側(cè)面的揚(yáng)聲器所再現(xiàn)的每個(gè)聲道的揚(yáng)聲器高度的揚(yáng)聲器布置信息被存儲(chǔ)作為“height_extension_element” 中的“side_element_height_info[i]”。然后,在“side_element_height_info[i]”之后,用于指示布置在用戶后面的揚(yáng)聲器所再現(xiàn)的每個(gè)聲道的揚(yáng)聲器高度的揚(yáng)聲器布置信息被存儲(chǔ)作為 “height_extension_element” 中的 “back_element_height_info [i] ”。
[0266]在步驟S75中,標(biāo)識(shí)彳目息編碼單兀113對(duì)標(biāo)識(shí)/[目息進(jìn)行編碼。例如,如果需要,標(biāo)識(shí)信息編碼單元113基于同步字和揚(yáng)聲器布置信息生成CRC校驗(yàn)碼作為標(biāo)識(shí)信息。CRC校驗(yàn)碼是要存儲(chǔ)在“height_extension_element%9“height_info_crc_check”* 的信息。同步字和CRC校驗(yàn)碼是用于標(biāo)識(shí)揚(yáng)聲器布置信息是否存在于編碼比特流中的信息。
[0267]另外,標(biāo)識(shí)信息編碼單元113生成用于指令執(zhí)行字節(jié)對(duì)齊的信息,作為要存儲(chǔ)在 “height_extension_element” 的 “byte_alignment O ” 中的信息。標(biāo)識(shí)信息編碼單元113生成用于指令比較標(biāo)識(shí)信息的信息,作為要存儲(chǔ)在“height_extension_eIement ”的“if (crc_cal O ! =height_info_crc_check) ” 中的信息。
[0268]要存儲(chǔ)在PCE的注釋區(qū)域中所包括的擴(kuò)展區(qū)域中的信息,即“height_extension_element”是通過(guò)從步驟S73至步驟S75的處理而生成的。
[0269]在步驟S76中,PCE編碼單元101基于例如從輸入單元21提供的信息或者存儲(chǔ)在擴(kuò)展區(qū)域中的生成的信息來(lái)對(duì)PCE進(jìn)行編碼。
[0270]例如,PCE編碼單元101生成用于指示前面揚(yáng)聲器、側(cè)面揚(yáng)聲器以及后面揚(yáng)聲器所再現(xiàn)的聲道的數(shù)量的信息,或者用于指示每個(gè)音頻數(shù)據(jù)項(xiàng)屬于C聲道、L聲道和R聲道中的哪個(gè)聲道的信息,作為要存儲(chǔ)在PCE中的信息。
[0271]在步驟S77中,擴(kuò)展信息編碼單元114基于從輸入單元21提供的信息,對(duì)用于指示擴(kuò)展信息是否被包括在DSE的擴(kuò)展區(qū)域中的信息進(jìn)行編碼,并且編碼的信息要被存儲(chǔ)在圖 8 所不的“ancillary_data_status O ” 的“ancillary_data_extension_status” 中。例如,由于用于指示是否包括擴(kuò)展信息的信息,即用于指示是否存在擴(kuò)展信息的信息被存儲(chǔ),所以將 “O,,或 “ I,,存儲(chǔ)在 “ancillary_data_extension_status” 中。
[0272]在步驟S78中,下混信息編碼單元115基于從輸入單元21提供的信息對(duì)關(guān)于音頻數(shù)據(jù)的下混的信息進(jìn)行編碼。
[0273]例如,下混信息編碼單元115對(duì)用于指定從輸入單元21提供的下混系數(shù)的信息進(jìn)行編碼。具體地,下混信息編碼單元115對(duì)用于指示在從5.1聲道下混為2聲道期間每個(gè)聲道的音頻數(shù)據(jù)所乘以的系數(shù)的信息進(jìn)行編碼,所述系數(shù)是存儲(chǔ)在圖9所示的“downmiXing_levels_MPEG4 () ” 中的 “center_mix_level_value” 和 “surround_mix_level_value,,。
[0274]另外,下混信息編碼單元115對(duì)用于指示在從5.1聲道下混為2聲道期間LFE聲道的音頻數(shù)據(jù)所乘以的系數(shù)的信息進(jìn)行編碼,所述系數(shù)是存儲(chǔ)在圖16所示的“ext_downmixing_lfe_level O ”中的“dmix_lfe_idx”。類似地,下混信息編碼單元115對(duì)用于指示下混為2聲道的過(guò)程的信息進(jìn)行編碼,所述信息是從輸入單元21提供的,并且是存儲(chǔ)在圖 7 所不的 “bs_info O ” 中的 “pseudo_sur;round_enable,,。
[0275]下混信息編碼單元115對(duì)用于指示在從7.1聲道或6.1下混為5.1聲道期間每個(gè)聲道的音頻數(shù)據(jù)所乘以的的系數(shù)的信息進(jìn)行編碼,所述系數(shù)是存儲(chǔ)在圖13所示的“ext_downmixing_levels” 中的 “dmix_a_idx” 和 “dmix_b_idx,,。
[0276]下混信息編碼單元115對(duì)用于指示在從5.1聲道下混為2聲道期間是否使用LFE聲道的信息進(jìn)行編碼。編碼的信息將被存儲(chǔ)在圖11所示的“eXt_ancillary_data_status O ” 中所包括的圖 12 所不的 “ext_downmixing_lfe_level_status” 中,所述 “ext_anciIlary_data_status O ” 是擴(kuò)展區(qū)域。
[0277]下混信息編碼單元115對(duì)在下混期間的增益調(diào)整所需要的信息進(jìn)行編碼。編碼的信息將被存儲(chǔ)在圖 11 所不的 “MPEG4_ext_ancillary_data() ” 中的 “ext_downmixing_global_gains,,中。
[0278]在步驟S79中,DSE編碼單元102基于從從輸入單元21提供的信息或者所生成的關(guān)于下混的信息對(duì)DSE進(jìn)行編碼。
[0279]要存儲(chǔ)在每個(gè)元素,諸如PCE、SCE、CPE、LFE和DSE中的信息是通過(guò)上述處理而獲得的。編碼單元22將要存儲(chǔ)在每個(gè)元素中的信息提供給封裝單元23。另外,如果需要,編碼單元22生成元素,諸如“Header/Sideinfo”,“FIL (DRC) ”及“FIL(END) ”,并且將所生成的元素提供給封裝單元23。
[0280]在步驟S80中,封裝單元23對(duì)從編碼單元22提供的音頻數(shù)據(jù)或揚(yáng)聲器布置信息執(zhí)行比特封裝,以生成圖3中所示的編碼比特流,并且輸出編碼比特流。例如,封裝單元23將從編碼單元22提供的信息存儲(chǔ)在PCE或DSE中以生成編碼比特流。當(dāng)輸出編碼比特流時(shí),編碼處理結(jié)束。
[0281]以這種方式,編碼裝置91將例如揚(yáng)聲器布置信息、關(guān)于下混的信息、以及用于指示擴(kuò)展信息是否被包括在擴(kuò)展區(qū)域中的信息插入到編碼比特流中,并且輸出經(jīng)編碼的音頻數(shù)據(jù)。因此,當(dāng)揚(yáng)聲器布置信息和關(guān)于下混的信息被存儲(chǔ)在編碼比特流中時(shí),可以在編碼比特流的解碼側(cè)獲得聞品質(zhì)逼真的聲首。
[0282]例如,當(dāng)關(guān)于垂直方向上揚(yáng)聲器布置的信息被存儲(chǔ)在編碼比特流中時(shí),在解碼側(cè),可以再現(xiàn)平面中的聲音圖像以及垂直方向上的聲音圖像。因此,可以再現(xiàn)逼真的聲音。
[0283]另外,編碼比特流包括用于標(biāo)識(shí)揚(yáng)聲器布置信息的多個(gè)標(biāo)識(shí)信息項(xiàng)(標(biāo)識(shí)碼),以便標(biāo)識(shí)存儲(chǔ)在注釋區(qū)域的擴(kuò)展區(qū)域中的信息是否是揚(yáng)聲器布置信息或文本信息,諸如其他注釋。在本實(shí)施方式中,編碼比特流包括緊接在揚(yáng)聲器布置信息之前布置的同步字以及由所存儲(chǔ)的信息,諸如揚(yáng)聲器布置信息的內(nèi)容而確定的CRC校驗(yàn)碼,作為標(biāo)識(shí)信息。
[0284]當(dāng)兩個(gè)標(biāo)識(shí)信息項(xiàng)被包括在編碼比特流中時(shí),可以可靠地指定包括在編碼比特流中的信息是否是揚(yáng)聲器布置信息。因此,可以使用所獲得的揚(yáng)聲器布置信息來(lái)獲得高品質(zhì)逼真的聲音。[0285]另外,在編碼比特流中,“pseudo_surround_enable”被包括在DSE中,作為用于對(duì)音頻數(shù)據(jù)進(jìn)行下混的信息。該信息使得可以指定多種方法中的任一種方法作為從5.1聲道下混為2聲道的方法。因此,可以在解碼側(cè)提高音頻數(shù)據(jù)的靈活性。
[0286]具體地,在本實(shí)施方式中,作為從5.1聲道下混為2聲道的方法,存在使用表達(dá)式(O的方法和使用表達(dá)式(2)的方法。例如,在解碼側(cè),通過(guò)下混獲得的2聲道的音頻數(shù)據(jù)被傳輸給再現(xiàn)裝置,并且再現(xiàn)裝置將2聲道的音頻數(shù)據(jù)轉(zhuǎn)換成5.1聲道的音頻數(shù)據(jù),并且再現(xiàn)轉(zhuǎn)換的音頻數(shù)據(jù)。
[0287]在這種情況下,在使用表達(dá)式(I)的方法和使用表達(dá)式(2)的方法中,不太可能從通過(guò)兩種方法中任一種方法而獲得的音頻數(shù)據(jù)來(lái)獲得在再現(xiàn)5.1聲道的最終音頻數(shù)據(jù)時(shí)預(yù)先假定的適當(dāng)?shù)囊繇懶Ч?br>
[0288]然而,在由編碼裝置91獲得的編碼比特流中,能夠獲得在解碼側(cè)所假定的音響效果的下混方法可以由“pseudo_surround_enable”來(lái)指定。因此,可以在解碼側(cè)獲得高品質(zhì)
逼真的聲音。
[0289]另外,在編碼比特流中,用于指示是否包括擴(kuò)展信息的信息(標(biāo)記)被存儲(chǔ)在“ancillary_data_extension_status”中。因此,參考該信息,可以指定擴(kuò)展信息是否被包括在作為擴(kuò)展區(qū)域的“MPEG4_ext_ancillary_data() ”中。
[0290]例如,在本不例中,如果需要,“ext_ancillary_data_status() ”、“ext_downmixing_levels O ”、“ext_downmixing_global_gains,,以及“ext_downmixing_lfe_level O,,被存儲(chǔ)在擴(kuò)展區(qū)域中,作為擴(kuò)展信息。
[0291]當(dāng)能夠獲得擴(kuò)展信息時(shí),可以提高在音頻數(shù)據(jù)的下混中的靈活性,并且可以在解碼側(cè)獲得各種音頻數(shù)據(jù)。因此,可以獲得高品質(zhì)逼真的聲音。
[0292][解碼裝置的示例結(jié)構(gòu)]
[0293]接著,將對(duì)解碼裝置的詳細(xì)結(jié)構(gòu)進(jìn)行描述。
[0294]圖28是示出了解碼裝置的詳細(xì)結(jié)構(gòu)的示例的圖。在圖28中,與圖24中所示部件對(duì)應(yīng)的部件被用相同的附圖標(biāo)記來(lái)表示,并且將不再重復(fù)對(duì)其的描述。
[0295]解碼裝置141包括分離單元61、解碼單元62、切換單元151、下混處理單元152以及輸出單元63。
[0296]分離單元61接收從編碼裝置91輸出的編碼比特流,對(duì)編碼比特流進(jìn)行解封,并且將編碼比特流提供給解碼單元62。另外,分離單元61獲取下混形式參數(shù)以及音頻數(shù)據(jù)的文件名。
[0297]下混形式參數(shù)是用于指示在解碼裝置141中包括在編碼比特流中的音頻數(shù)據(jù)的下混形式的信息。例如,指示從7.1聲道或6.1聲道下混為5.1聲道的信息、指示從7.1聲道或6.1聲道下混為2聲道的信息、指示從5.1聲道下混為2聲道的信息、或者指示不執(zhí)行下混的信息被包括作為下混形式參數(shù)。
[0298]由分離單元61獲取的下混形式參數(shù)被提供給切換單元151和下混處理單元152。另外,在解碼裝置141中適當(dāng)?shù)厥褂糜煞蛛x單元61獲取的文件名。
[0299]解碼單元62對(duì)從分離單元61提供的編碼比特流進(jìn)行解碼。解碼單元62包括PCE解碼單元161、DSE解碼單元162以及音頻元素解碼單元163。
[0300]PCE解碼單元161對(duì)包括在編碼比特流中的PCE進(jìn)行解碼,并且將通過(guò)解碼獲得的信息提供給下混處理單元152和輸出單元63。PCE解碼單元161包括同步字檢測(cè)單元171和標(biāo)識(shí)信息計(jì)算單元172。
[0301]同步字檢測(cè)單元171從PCE的注釋區(qū)域中的擴(kuò)展區(qū)域檢測(cè)同步字,并且讀取同步字。標(biāo)識(shí)信息計(jì)算單元172基于從PCE的注釋區(qū)域中的擴(kuò)展區(qū)域讀取的信息來(lái)計(jì)算標(biāo)識(shí)信
肩、O
[0302]DSE解碼單元162對(duì)包括在編碼比特流中的DSE進(jìn)行解碼,并且將通過(guò)解碼獲得的信息提供給下混處理單元152。DSE解碼單元162包括擴(kuò)展檢測(cè)單元173和下混信息解碼單元174。
[0303]擴(kuò)展檢測(cè)單元173檢測(cè)擴(kuò)展信息是否包括在DSE的“MPEG4_ancillary_data O ”中。下混信息解碼單元174對(duì)包括在DSE中的關(guān)于下混的信息進(jìn)行解碼。
[0304]音頻元素解碼單元163對(duì)包括在編碼比特流中的音頻數(shù)據(jù)進(jìn)行解碼,并且將音頻數(shù)據(jù)提供給切換單元151。
[0305]切換單元151基于從分離單元61提供的下混形式參數(shù),將從解碼單元62提供的音頻數(shù)據(jù)的輸出目的地改變?yōu)橄禄焯幚韱卧?52或輸出單元63。
[0306]下混處理單元152基于來(lái)自分離單元61的下混形式參數(shù)和來(lái)自解碼單元62的信息,對(duì)從切換單元151提供的音頻數(shù)據(jù)進(jìn)行下混,并且將下混的音頻數(shù)據(jù)提供給輸出單元63。
[0307]輸出單元63基于從解碼單元62提供的信息來(lái)輸出從切換單元151或下混處理單元152提供的音頻數(shù)據(jù)。輸出單元63包括重新布置處理單元181。重新布置處理單元181基于從PCE解碼單元161提供的信息來(lái)重新布置從切換單元151提供的音頻數(shù)據(jù),并且輸出音頻數(shù)據(jù)。`
[0308][下混處理單元的結(jié)構(gòu)的示例]
[0309]圖29示出了圖28所示的下混處理單元152的詳細(xì)結(jié)構(gòu)。也就是說(shuō),下混處理單元152包括切換單元211、切換單元212、下混單元213-1至213-4、切換單元214、增益調(diào)整單元215、切換單元216、下混單元217-1、下混單元217-2以及增益調(diào)整單元218。
[0310]切換單元211將從切換單元151提供的音頻數(shù)據(jù)提供給切換單元212或切換單元216。例如,當(dāng)音頻數(shù)據(jù)是7.1聲道或6.1聲道的數(shù)據(jù)時(shí),音頻數(shù)據(jù)的輸出目的地是切換單元212,而當(dāng)音頻數(shù)據(jù)是5.1聲道的數(shù)據(jù)時(shí),音頻數(shù)據(jù)的輸出目的地是切換單元216。
[0311]切換單元212將從切換單元211提供的音頻數(shù)據(jù)提供給下混單元213_1至213_4中的任一下混單元。例如,當(dāng)音頻數(shù)據(jù)是6.1聲道的數(shù)據(jù)時(shí),切換單元212將音頻數(shù)據(jù)輸出至下混單元213-1。
[0312]當(dāng)音頻數(shù)據(jù)是聲道L、LC、C、RC、R、LS、RS和LFE的數(shù)據(jù)時(shí),切換單元212將來(lái)自切換單元211的音頻數(shù)據(jù)提供給下混單元213-2。當(dāng)音頻數(shù)據(jù)是聲道L、R、C、Ls、Rs、Lrs、Rrs和LFE的數(shù)據(jù)時(shí),切換單元212將來(lái)自切換單元211的音頻數(shù)據(jù)提供給下混單元213-3。
[0313]當(dāng)音頻數(shù)據(jù)是聲道1^、1?、(:、1^、1^、1^11、1^1和LFE的數(shù)據(jù)時(shí),切換單元212將來(lái)自切換單元211的音頻數(shù)據(jù)提供給下混單元213-4。
[0314]下混單元213-1至213-4將從切換單元212提供的音頻數(shù)據(jù)下混為5.1聲道的音頻數(shù)據(jù),并且將音頻數(shù)據(jù)提供給切換單元214。下文中,當(dāng)下混單元213-1至213-4不需要特別地相互區(qū)分時(shí),它們被簡(jiǎn)稱為下混單元213。[0315]切換單元214將從下混單元213提供的音頻數(shù)據(jù)提供給增益調(diào)整單元215或切換單元216。例如,當(dāng)包括在編碼比特流中的音頻數(shù)據(jù)被下混為5.1聲道的音頻數(shù)據(jù)時(shí),切換單元214將音頻數(shù)據(jù)提供給增益調(diào)整單元215。另一方面,當(dāng)包括在編碼比特流中的音頻數(shù)據(jù)被下混為2聲道的音頻數(shù)據(jù)時(shí),切換單元214將音頻數(shù)據(jù)提供給切換單元216。
[0316]增益調(diào)整單元215對(duì)從切換單元214提供的音頻數(shù)據(jù)的增益進(jìn)行調(diào)整,并且將音頻數(shù)據(jù)提供給輸出單元63。
[0317]切換單元216將從切換單元211或切換單元214提供的音頻數(shù)據(jù)提供給下混單元217-1或下混單元217-2。例如,切換單元216取決于包括在編碼比特流的DSE中的“pseudo_surround_enable”的值來(lái)改變音頻數(shù)據(jù)的輸出目的地。
[0318]下混單元217-1和下混單元217-2將從切換單元216提供的音頻數(shù)據(jù)下混為2聲道的數(shù)據(jù),并且將數(shù)據(jù)提供給增益調(diào)整單元218。下文中,當(dāng)下混單元217-1和下混單元217-2不需要特別地相互區(qū)分時(shí),它們被簡(jiǎn)稱為下混單元217。
[0319]增益調(diào)整單元218對(duì)從下混單元217提供的音頻數(shù)據(jù)的增益進(jìn)行調(diào)整,并且將音頻數(shù)據(jù)提供給輸出單元63。
[0320][下混單元的結(jié)構(gòu)的示例]
[0321]接著,將描述圖29所示的下混單元213和下混單元217的詳細(xì)結(jié)構(gòu)的示例。
[0322]圖30是示出了圖29所示的下混單元213_1的結(jié)構(gòu)的示例的圖。
[0323]下混單元213-1包括輸入端子241-1至241-7、乘法單元242至244、加法單元245、加法單元246以及輸出端子247-1至247-6。
[0324]聲道L、R、C、Ls、Rs、Cs和LFE的音頻數(shù)據(jù)從切換單元212提供給輸入端子241-1至 241-7。
[0325]在音頻數(shù)據(jù)沒(méi)有任何改變的情況下,輸入端子241-1至241-3通過(guò)輸出端子247_1至247-3將從切換單元212提供的音頻數(shù)據(jù)提供給切換單元214。也就是說(shuō),提供給下混單元213-1的聲道L、R和C的音頻數(shù)據(jù)被下混并且被作為在下混之后聲道L、R和C的音頻數(shù)據(jù)而輸出至下一級(jí)。
[0326]輸入端子241-4至241_6將從切換單元212提供的音頻數(shù)據(jù)提供給乘法單元242至244。乘法單元242將從輸入端子241-4提供的音頻數(shù)據(jù)乘以下混系數(shù),并且將音頻數(shù)據(jù)提供給加法單元245。
[0327]乘法單元243將從輸入端子241-5提供的音頻數(shù)據(jù)乘以下混系數(shù),并且將音頻數(shù)據(jù)提供給加法單元246。乘法單元244將從輸入端子241-6提供的音頻數(shù)據(jù)乘以下混系數(shù),并且將音頻數(shù)據(jù)提供給加法單元245和加法單元246。
[0328]加法單元245將從乘法單元242提供的音頻數(shù)據(jù)與從乘法單元244提供的音頻數(shù)據(jù)相加,并且將相加的音頻數(shù)據(jù)提供給輸出端子247-4。輸出端子247-4將從加法單元245提供的音頻數(shù)據(jù)作為在下混之后Ls聲道的音頻數(shù)據(jù)提供給切換單元214。
[0329]加法單元246將從乘法單元243提供的音頻數(shù)據(jù)與從乘法單元244提供的音頻數(shù)據(jù)相加,并且將相加的音頻數(shù)據(jù)提供給輸出端子247-5。輸出端子247-5將從加法單元246提供的音頻數(shù)據(jù)作為在下混之后Rs聲道的音頻數(shù)據(jù)提供給切換單元214。
[0330]在音頻數(shù)據(jù)沒(méi)有任何改變的情況下,輸入端子241-7通過(guò)輸出端子247-6將從切換單元212提供的音頻數(shù)據(jù)提供給切換單元214。也就是說(shuō),提供給下混單元213-1的LFE聲道的音頻數(shù)據(jù)在沒(méi)有任何改變的情況下作為在下混之后LFE聲道的音頻數(shù)據(jù)而輸出至下一級(jí)。
[0331]下文中,當(dāng)輸入端子241-1至241-7不需要特別地相互區(qū)分時(shí),它們被簡(jiǎn)稱為輸入端子241。當(dāng)輸出端子247-1至247-6不需要特別地相互區(qū)分時(shí),它們被簡(jiǎn)稱為輸出端子247。
[0332]因此,在下混單元213-1中,執(zhí)行與使用上述表達(dá)式(6)的計(jì)算相對(duì)應(yīng)的處理。
[0333]圖31是示出了圖29中所示的下混單元213_2的結(jié)構(gòu)的示例的圖。
[0334]下混單元213-2包括輸入端子271-1至271-8、乘法單元272至275、加法單元276、加法單元277、加法單元278以及輸出端子279-1至279-6。
[0335]聲道L、Lc、C、Re、R、Ls、Rs和LFE的音頻數(shù)據(jù)從切換單元212分別提供給輸入端子 271-1 至 271-8。
[0336]輸入端子271-1至271-5將從切換單元212提供的音頻數(shù)據(jù)分別提供給加法單元276、乘法單元272和273、加法單元277、乘法單元274和275以及加法單元278。
[0337]乘法單元272和乘法單元273將從輸入端子271_2提供的音頻數(shù)據(jù)乘以下混系數(shù),并且將音頻數(shù)據(jù)分別提供給加法單元276和加法單元277。乘法單元274和乘法單元275將從輸入端子271-4提供的音頻數(shù)據(jù)乘以下混系數(shù),并且將音頻數(shù)據(jù)分別提供給加法單元277和加法單元278。
[0338]加法單元276將從輸入端子271-1提供的音頻數(shù)據(jù)與從乘法單元272提供的音頻數(shù)據(jù)相加,并且將相加的音頻數(shù)據(jù)提供給輸出端子279-1。輸出端子279-1將從加法單元276提供的音頻數(shù)據(jù)作為在下混之后L聲道的音頻數(shù)據(jù)提供給切換單元214。
[0339]加法單元277將從輸入端子271-3提供的音頻數(shù)據(jù)、從乘法單元273提供的音頻數(shù)據(jù)以及從乘法單元274提供的音頻數(shù)據(jù)相加,并且將相加的音頻數(shù)據(jù)提供給輸出端子279-2。輸出端子279-2將從加法單元277提供的音頻數(shù)據(jù)作為在下混之后C聲道的音頻數(shù)據(jù)提供給切換單元214。
[0340]加法單元278將從輸入端子271-5提供的音頻數(shù)據(jù)與從乘法單元275提供的音頻數(shù)據(jù)相加,并且將相加的音頻數(shù)據(jù)提供給輸出端子279-3。輸出端子279-3將從加法單元278提供的音頻數(shù)據(jù)作為在下混之后R聲道的音頻數(shù)據(jù)提供給切換單元214。
[0341 ] 在音頻數(shù)據(jù)沒(méi)有任何改變的情況下,輸入端子271-6至271-8通過(guò)輸出端子279_4至279-6將從切換單元212提供的音頻數(shù)據(jù)提供給切換單元214。也就是說(shuō),從下混單元213-2提供的聲道Ls、Rs和LFE的音頻數(shù)據(jù)在沒(méi)有任何改變的情況下作為在下混之后聲道Ls、Rs和LFE的音頻數(shù)據(jù)被提供至下一級(jí)。
[0342]下文中,當(dāng)輸入端子271-1至271-8不需要特別地相互區(qū)分時(shí),它們被簡(jiǎn)稱為輸入端子271。當(dāng)輸出端子279-1至279-6不需要特別地相互區(qū)分時(shí),它們被簡(jiǎn)稱為輸出端子279。
[0343]因此,在下混單元213-2中,執(zhí)行與使用上述表達(dá)式(4)的計(jì)算相對(duì)應(yīng)的處理。
[0344]圖32是示出了圖29中所示的下混單元213_3的結(jié)構(gòu)的示例的圖。
[0345]下混單元213-3包括輸入端子301-1至301-8、乘法單元302至305、加法單元306、加法單元307以及輸出端子308-1至308-6。
[0346]聲道L、R、C、Ls、Rs、Lrs、Rrs和LFE的音頻數(shù)據(jù)從切換單元212分別提供給輸入端子 301-1 至 301-8。
[0347]在音頻數(shù)據(jù)沒(méi)有任何改變的情況下,輸入端子301-1至301-3分別通過(guò)輸出端子308-1至308-3將從切換單元212提供的音頻數(shù)據(jù)提供給切換單元214。也就是說(shuō),提供給下混單元213-3的聲道L、R和C的音頻數(shù)據(jù)作為在下混之后聲道L、R和C的音頻數(shù)據(jù)被輸出至下一級(jí)。
[0348]輸入端子301-4至301-7將從切換單元212提供的音頻數(shù)據(jù)分別提供給乘法單元302至305。乘法單元302至305將從輸入端子301-4至301-7提供的音頻數(shù)據(jù)乘以下混系數(shù),并且將音頻數(shù)據(jù)分別提供給加法單元306、加法單元307、加法單元306和加法單元307。
[0349]加法單元306將從乘法單元302提供的音頻數(shù)據(jù)與從乘法單元304提供的音頻數(shù)據(jù)相加,并且將音頻數(shù)據(jù)提供給輸出端子308-4。輸出端子308-4將從加法單元306提供的音頻數(shù)據(jù)作為在下混之后Ls聲道的音頻數(shù)據(jù)提供給切換單元214。
[0350]加法單元307將從乘法單元303提供的音頻數(shù)據(jù)與從乘法單元305提供的音頻數(shù)據(jù)相加,并且將音頻數(shù)據(jù)提供給輸出端子308-5。輸出端子308-5將從加法單元307提供的音頻數(shù)據(jù)作為在下混之后Rs聲道的音頻數(shù)據(jù)提供給切換單元214。
[0351]在音頻數(shù)據(jù)沒(méi)有任何改變的情況下,輸入端子301-8通過(guò)輸出端子308-6將從切換單元212提供的音頻數(shù)據(jù)提供給切換單元214。也就是說(shuō),提供給下混單元213-3的LFE聲道的音頻數(shù)據(jù)在沒(méi)有任何改變的情況下作為在下混之后LFE聲道的音頻數(shù)據(jù)被輸出至下一級(jí)。
[0352]下文中,當(dāng)輸入端子301-1至301-8不需要特別地相互區(qū)分時(shí),它們被簡(jiǎn)稱為輸入端子301。當(dāng)輸出端子308-1至308-6不需要特別地相互區(qū)分時(shí),它們被簡(jiǎn)稱為輸出端子308。
[0353]因此,在下混單元213-3中,執(zhí)行與使用上述表達(dá)式(3)的計(jì)算相對(duì)應(yīng)的處理。
[0354]圖33是示出了圖29中所示的下混單元213_4的結(jié)構(gòu)的示例的圖。
[0355]下混單元213-4包括輸入端子331-1至331-8、乘法單元332至335、加法單元336、加法單元337以及輸出端子338-1至338-6。
[0356]聲道L、R、C、Ls、Rs、Lvh、Rvh和LFE的音頻數(shù)據(jù)從切換單元212分別提供給輸入端子 331-1 至 331-8。
[0357]輸入端子331-1和輸入端子331-2將從切換單元212提供的音頻數(shù)據(jù)分別提供給乘法單元332和乘法單元333。輸入端子331-6和輸入端子331-7將從切換單元212提供的音頻數(shù)據(jù)分別提供給乘法單元334和乘法單元335。
[0358]乘法單元332至335將從輸入端子331_1、輸入端子331_2、輸入端子331_6及輸入端子331-7提供的音頻數(shù)據(jù)乘以下混系數(shù),并且將音頻數(shù)據(jù)分別提供給加法單元336、加法單元337、加法單元336和加法單元337。
[0359]加法單元336將從乘法單元332提供的音頻數(shù)據(jù)與從乘法單元334提供的音頻數(shù)據(jù)相加,并且將音頻數(shù)據(jù)提供給輸出端子338-1。輸出端子338-1將從加法單元336提供的音頻數(shù)據(jù)作為在下混之后L聲道的音頻數(shù)據(jù)提供給切換單元214。
[0360]加法單元337將從乘法單元333提供的音頻數(shù)據(jù)與從乘法單元335提供的音頻數(shù)據(jù)相加,并且將音頻數(shù)據(jù)提供給輸出端子338-2。輸出端子338-2將從加法單元337提供的音頻數(shù)據(jù)作為在下混之后R聲道的音頻數(shù)據(jù)提供給切換單元214。[0361]在音頻數(shù)據(jù)沒(méi)有任何改變的情況下,輸入端子331-3至331-5和輸入端子331_8分別通過(guò)輸出端子338-3至338-5及輸出端子338-6,將從切換單元212提供的音頻數(shù)據(jù)提供給切換單元214。也就是說(shuō),提供給下混單元213-4的聲道C、Ls、Rs和LFE的音頻數(shù)據(jù)在沒(méi)有任何改變的情況下作為在下混之后聲道C、Ls、Rs和LFE的音頻數(shù)據(jù)被輸出至下一級(jí)。
[0362]下文中,當(dāng)輸入端子331-1至331-8不需要特別地相互區(qū)分時(shí),它們被簡(jiǎn)稱為輸入端子331。當(dāng)輸出端子338-1至338-6不需要特別地相互區(qū)分時(shí),它們被簡(jiǎn)稱為輸出端子338。
[0363]因此,在下混單元213-4中,執(zhí)行與使用上述表達(dá)式(5)的計(jì)算相對(duì)應(yīng)的處理。
[0364]然后,將描述圖29所示的下混單元217的詳細(xì)結(jié)構(gòu)的示例。
[0365]圖34是示出了圖29所示的下混單元217_1的結(jié)構(gòu)的示例的圖。
[0366]下混單元217-1包括輸入端子361-1至361_6、乘法單元362至365、加法單元366至371、輸出端子372-1以及輸出端子372-2。
[0367]聲道L、R、C、Ls、Rs和LFE的音頻數(shù)據(jù)從切換單元216分別提供給輸入端子361-1至 361-6。
[0368]輸入端子361-1至361-6將從切換單元216提供的音頻數(shù)據(jù)分別提供給加法單元366、加法單元369以及乘法單元362至365。
[0369]乘法單元362至365將從輸入端子361_3至361_6提供的音頻數(shù)據(jù)乘以下混系數(shù),并且將音頻數(shù)據(jù)分別提供給加法單元366和369、加法單元367、加法單元370以及加法單元 368 和 371。
[0370]加法單元366將從輸入端子361-1提供的音頻數(shù)據(jù)與從乘法單元362提供的音頻數(shù)據(jù)相加,并且將相加的音頻數(shù)據(jù)提供給加法單元367。加法單元367將從加法單元366提供的音頻數(shù)據(jù)與從乘法單元363提供的音頻數(shù)據(jù)相加,并且將相加的音頻數(shù)據(jù)提供給加法單元368。
[0371]加法單元368將從加法單元367提供的音頻數(shù)據(jù)與從乘法單元365提供的音頻數(shù)據(jù)相加,并且將相加的音頻數(shù)據(jù)提供給輸出端子372-1。輸出端子372-1將從加法單元368提供的音頻數(shù)據(jù)作為在下混之后L聲道的音頻數(shù)據(jù)提供給增益調(diào)整單元218。
[0372]加法單元369將從輸入端子361-2提供的音頻數(shù)據(jù)與從乘法單元362提供的音頻數(shù)據(jù)相加,并且將相加的音頻數(shù)據(jù)提供給加法單元370。加法單元370將從加法單元369提供的音頻數(shù)據(jù)與從乘法單元364提供的音頻數(shù)據(jù)相加,并且將相加的音頻數(shù)據(jù)提供給加法單元371。
[0373]加法單元371將從加法單元370提供的音頻數(shù)據(jù)與從乘法單元365提供的音頻數(shù)據(jù)相加,并且將相加的音頻數(shù)據(jù)提供給輸出端子372-2。輸出端子372-2將從加法單元371提供的音頻數(shù)據(jù)作為在下混之后R聲道的音頻數(shù)據(jù)提供給增益調(diào)整單元218。
[0374]下文中,當(dāng)輸入端子361-1至361-6不需要特別地相互區(qū)分時(shí),它們被簡(jiǎn)稱為輸入端子361。當(dāng)輸出端子372-1和輸出端子372-2不需要特別地相互區(qū)分時(shí),它們被簡(jiǎn)稱為輸出端子372。
[0375]因此,在下混單元217-1中,執(zhí)行與使用上述表達(dá)式(I)的計(jì)算相對(duì)應(yīng)的處理。
[0376]圖35是示出了圖29所示的下混單元217_2的結(jié)構(gòu)的示例的圖。[0377]下混單元217-2包括輸入端子401-1至401-6、乘法單元402至405、加法單元406、減法單元407、減法單元408、加法單元409至413、輸出端子414-1以及輸出端子414-2。
[0378]聲道L、R、C、Ls、Rs和LFE的音頻數(shù)據(jù)從切換單元216分別提供給輸入端子401_1至 401-6。
[0379]輸入端子401-1至401-6將從切換單元216提供的音頻數(shù)據(jù)分別提供給加法單元406、加法單元410以及乘法單元402至405。
[0380]乘法單元402至405將從輸入端子401_3至401_6提供的音頻數(shù)據(jù)乘以下混系數(shù),并且將音頻數(shù)據(jù)分別提供給加法單元406和410、減法單元407和加法單元411、減法單元408和加法單元412、以及加法單元409和413。
[0381]加法單元406將從輸入端子401-1提供的音頻數(shù)據(jù)與從乘法單元402提供的音頻數(shù)據(jù)相加,并且將相加的音頻數(shù)據(jù)提供給減法單元407。減法單元407從由加法單元406提供的音頻數(shù)據(jù)中減去由乘法單元403提供的音頻數(shù)據(jù),并且將相減的音頻數(shù)據(jù)提供給減法單元408。
[0382]減法單元408從由減法單元407提供的音頻數(shù)據(jù)中減去由乘法單元404提供的音頻數(shù)據(jù),并且將相減的音頻數(shù)據(jù)提供給加法單元409。加法單元409將從減法單元408提供的音頻數(shù)據(jù)與從乘法單元405提供的音頻數(shù)據(jù)相加,并且將相加的音頻數(shù)據(jù)提供給輸出端子414-1。輸出端子414-1將從加法單元409提供的音頻數(shù)據(jù)作為在下混之后L聲道的音頻數(shù)據(jù)提供給增益調(diào)整單元218。
[0383]加法單元410將從輸入端子401-2提供的音頻數(shù)據(jù)與從乘法單元402提供的音頻數(shù)據(jù)相加,并且將相加的音頻數(shù)據(jù)提供給加法單元411。加法單元411將從加法單元410提供的音頻數(shù)據(jù)與從乘法單元403提供的音頻數(shù)據(jù)相加,并且將相加的音頻數(shù)據(jù)提供給加法單元412。
[0384]加法單元412將從加法單元411提供的音頻數(shù)據(jù)與從乘法單元404提供的音頻數(shù)據(jù)相加,并且將相加的音頻數(shù)據(jù)提供給加法單元413。加法單元413將從加法單元412提供的音頻數(shù)據(jù)與從乘法單元405提供的音頻數(shù)據(jù)相加,并且將相加的音頻數(shù)據(jù)提供給輸出端子414-2。輸出端子414-2將從加法單元413提供的音頻數(shù)據(jù)作為在下混之后R聲道的音頻數(shù)據(jù)提供給增益調(diào)整單元218。
[0385]下文中,當(dāng)輸入端子401-1至401-6不需要特別地相互區(qū)分時(shí),它們被簡(jiǎn)稱為輸入端子401。當(dāng)輸出端子414-1和輸出端子414-2不需要特別地相互區(qū)分時(shí),它們被簡(jiǎn)稱為輸出端子414。
[0386]因此,在下混單元217-2中,執(zhí)行與使用上述表達(dá)式(2)的計(jì)算相對(duì)應(yīng)的處理。
[0387][解碼操作的描述]
[0388]接著,將參考圖36所示的流程圖對(duì)解碼裝置141的解碼處理進(jìn)行描述。
[0389]在步驟Slll中,分離單元61獲取從編碼裝置91輸出的編碼比特流以及下混形式參數(shù)。例如,下混形式參數(shù)是從包括解碼裝置的信息處理裝置獲取的。
[0390]分離單元61將所獲取的下混形式參數(shù)提供給切換單元151和下混處理單元152。另外,如果需要,分離單元61獲取音頻數(shù)據(jù)的輸出文件名,并且適當(dāng)?shù)厥褂迷撦敵鑫募?br>
[0391]在步驟SI 12中,分離單元61對(duì)編碼比特流進(jìn)行解封,并且將通過(guò)解封所獲得的每個(gè)元素提供給解碼單元62。[0392]在步驟S113中,PCE解碼單元161對(duì)從分離單元61提供的PCE進(jìn)行解碼。例如,PCE解碼單元161從PCE的注釋區(qū)域讀取作為擴(kuò)展區(qū)域的“height_extension_element”,或者從PCE讀取關(guān)于揚(yáng)聲器布置的信息。此處,例如,布置在用戶前面、側(cè)面和后面的揚(yáng)聲器所再現(xiàn)的聲道的數(shù)量或者用于指示每個(gè)音頻數(shù)據(jù)項(xiàng)屬于C聲道、L聲道和R聲道中的哪個(gè)聲道的信息用作為關(guān)于揚(yáng)聲器布置的信息。
[0393]在步驟S114中,DSE解碼單元162對(duì)從分離單元61提供的DSE進(jìn)行解碼。例如,DSE解碼單元162從DSE讀取“MPEG4輔助數(shù)據(jù)”,或者從“MPEG4輔助數(shù)據(jù)”讀取必要信息。
[0394]具體地,例如,DSE解碼單元162的下混信息解碼單元174從圖9所示的“downmixing_levels_MPEG4O,,讀取“center_mix_level_value” 或“surround_mix_levelvalue”作為用于指定下混所使用的系數(shù)的信息,并且將所讀取的信息提供給下混處理單元152。
[0395]在步驟SI 15中,音頻元素解碼單元163對(duì)存儲(chǔ)在從分離單元61提供的SCE、CPE和LFE中的每個(gè)中的音頻數(shù)據(jù)進(jìn)行解碼。以這種方式,獲得了每個(gè)聲道的PCM數(shù)據(jù)作為音頻數(shù)據(jù)。
[0396]例如,解碼的音頻數(shù)據(jù)的聲道,即水平平面上的布置位置,可以通過(guò)元素來(lái)指定,該元素諸如存儲(chǔ)音頻數(shù)據(jù)的SCE,或者通過(guò)對(duì)DSE解碼而獲得的關(guān)于揚(yáng)聲器布置的信息。然而,此時(shí),由于揚(yáng)聲器布置信息沒(méi)有被讀取,該揚(yáng)聲器布置信息是關(guān)于揚(yáng)聲器的布置高度的信息,所以不指定每個(gè)聲道的高度(層)。
[0397]音頻元素解碼單元163將通過(guò)解碼獲得的音頻數(shù)據(jù)提供給切換單元151。
[0398]在步驟SI 16中,切換單元151基于從分離單元61提供的下混形式參數(shù)來(lái)確定是否對(duì)音頻數(shù)據(jù)進(jìn)行下混。例如,當(dāng)下混形式參數(shù)指示不執(zhí)行下混時(shí),切換單元151確定不執(zhí)行下混。
[0399]在步驟S116中,當(dāng)確定不執(zhí)行下混時(shí),切換單元151將從解碼單元62提供的音頻數(shù)據(jù)提供給重新布置處理單元181,并且處理前進(jìn)至步驟S117。
[0400]在步驟S117中,解碼裝置141基于揚(yáng)聲器的布置執(zhí)行重新布置處理以重新布置每個(gè)音頻數(shù)據(jù)項(xiàng),并且輸出音頻數(shù)據(jù)。當(dāng)音頻數(shù)據(jù)被輸出時(shí),解碼處理結(jié)束。另外,下文將詳細(xì)描述重新布置處理。
[0401]另一方面,當(dāng)在步驟S116中確定執(zhí)行下混時(shí),切換單元151將從解碼單元62提供的音頻數(shù)據(jù)提供給下混處理單元152的切換單元211,并且處理前進(jìn)至步驟S118。
[0402]在步驟SI 18中,解碼裝置141執(zhí)行下混處理,以將每個(gè)音頻數(shù)據(jù)項(xiàng)下混為與下混形式參數(shù)所指示的聲道數(shù)量對(duì)應(yīng)的音頻數(shù)據(jù),并且輸出音頻數(shù)據(jù)。當(dāng)音頻數(shù)據(jù)被輸出時(shí),解碼處理結(jié)束。另外,下文將詳細(xì)描述下混處理。
[0403]以這種方式,解碼裝置141對(duì)編碼比特流進(jìn)行解碼并且輸出音頻數(shù)據(jù)。
[0404][重新布置處理的描述]
[0405]接著,將參考圖37和圖38所示的流程圖來(lái)描述與圖36的步驟S117中的處理相對(duì)應(yīng)的重新布置處理。
[0406]在步驟S141中,同步字檢測(cè)單元171將用于從PCE的注釋區(qū)域(擴(kuò)展區(qū)域)讀取同步字的參數(shù)cmt_byte設(shè)定成cmt_byte等于PCE的注釋區(qū)域中的字節(jié)數(shù)量。也就是說(shuō),注釋區(qū)域中的字節(jié)數(shù)量被設(shè)定為參數(shù)cmt_byte的值。[0407]在步驟S142中,同步字檢測(cè)單元171從PCE的注釋區(qū)域讀取與預(yù)定同步字的數(shù)據(jù)量對(duì)應(yīng)的數(shù)據(jù)。例如,在圖4所示的示例中,由于作為同步字的“PCE_HEIGHT_EXTENSION_SYNC”是8比特,即I字節(jié),所以從PCE的注釋區(qū)域的頭部讀取I字節(jié)數(shù)據(jù)。
[0408]在步驟S143中,PCE解碼單元161確定步驟S142中所讀取的數(shù)據(jù)與同步字是否一致。也就是說(shuō),確定所讀取的數(shù)據(jù)是否是同步字。
[0409]當(dāng)在步驟S143中確定所讀取的數(shù)據(jù)與同步字不相同時(shí),在步驟S144中同步字檢測(cè)單元171將參數(shù)cmt_byte的值減少與所讀取的數(shù)據(jù)的量對(duì)應(yīng)的值。在這種情況下,參數(shù)cmt_byte的值被減少I(mǎi)字節(jié)。
[0410]在步驟S145中,同步字檢測(cè)單元171確定參數(shù)cmt_byte的值是否大于O。也就是說(shuō),確定參數(shù)cmt_byte的值是否大于0,即,是否讀取了注釋區(qū)域中的所有數(shù)據(jù)。
[0411]當(dāng)在步驟S145中確定參數(shù)cmt_byte的值大于O時(shí),沒(méi)有從注釋區(qū)域讀取所有數(shù)據(jù),并且處理返回至步驟S142。然后,重復(fù)上述處理。也就是說(shuō),在從注釋區(qū)域讀取的數(shù)據(jù)之后讀取與同步字的數(shù)據(jù)量對(duì)應(yīng)的數(shù)據(jù),并且將其與同步字進(jìn)行比較。
[0412]另一方面,當(dāng)在步驟S145中確定參數(shù)cmt_byte的值不大于O時(shí),處理前進(jìn)至步驟S146。因此,當(dāng)讀取了注釋區(qū)域中的所有數(shù)據(jù),但從注釋區(qū)域沒(méi)有檢測(cè)到同步字時(shí),處理前進(jìn)至步驟S146。
[0413]在步驟S146中,PCE解碼單元161確定不存在揚(yáng)聲器布置信息,并且將用于指示不存在揚(yáng)聲器布置信息的信息提供給重新布置處理單元181。處理前進(jìn)至步驟S164。因此,由于緊接在“1^18111:_ 61七6118;[011_6161116111:”中的揚(yáng)聲器布置信息之前布置同步字,所以可以簡(jiǎn)單地并且可靠地指定注釋區(qū)域中所包括的信息是否是揚(yáng)聲器布置信息。
[0414]當(dāng)在步驟S143中確定從注釋區(qū)域讀取的數(shù)據(jù)與同步字相同時(shí),檢測(cè)到同步字。因此,處理前進(jìn)至步驟S147,以便讀取緊跟在同步字之后的揚(yáng)聲器布置信息。
[0415]在步驟S147中,PCE解碼單元161將參數(shù)num_fr_elem的值設(shè)定為屬于前面的元素的數(shù)量,參數(shù)num_fr_elem用于讀取布置在用戶前面的揚(yáng)聲器所再現(xiàn)的音頻數(shù)據(jù)的揚(yáng)聲器布置信息。
[0416]此處,屬于前面的元素的數(shù)量是布置在用戶前面的揚(yáng)聲器所再現(xiàn)的音頻數(shù)據(jù)項(xiàng)的數(shù)量(聲道的數(shù)量)。將元素的數(shù)量存儲(chǔ)在PCE中。因此,參數(shù)num_fr_elem的值是從“height_extension_element”讀取的、并且由布置在用戶前面的揚(yáng)聲器再現(xiàn)的音頻數(shù)據(jù)的揚(yáng)聲器布置信息項(xiàng)的數(shù)量。
[0417]在步驟S148中,PCE解碼單元161確定參數(shù)num_fr_elem的值是否大于O。
[0418]當(dāng)在步驟S148中確定參數(shù)num_fr_elem的值大于O時(shí),由于沒(méi)有讀取所有的揚(yáng)聲器布置信息,所以處理前進(jìn)至步驟S149。
[0419]在步驟S149中,PCE解碼單元161讀取與注釋區(qū)域中在同步字之后布置的一個(gè)元素對(duì)應(yīng)的揚(yáng)聲器布置信息。在圖4所示的示例中,由于一個(gè)揚(yáng)聲器布置信息項(xiàng)是2比特,所以緊跟在從注釋區(qū)域讀取的數(shù)據(jù)之后布置的2比特?cái)?shù)據(jù)被讀取,作為一個(gè)揚(yáng)聲器布置信息項(xiàng)。
[0420]可以基于例如“height_extension_element”中的揚(yáng)聲器布置信息的布置位置或者存儲(chǔ)音頻數(shù)據(jù)的元素,諸如SCE,來(lái)指定關(guān)于音頻數(shù)據(jù)的每個(gè)揚(yáng)聲器布置信息項(xiàng)。
[0421]在步驟S150中,由于讀取了一個(gè)揚(yáng)聲器布置信息項(xiàng),所以PCE解碼單元161使參數(shù)num_fr_elem的值減少I(mǎi)。在更新參數(shù)num_fr_elem之后,處理返回至步驟S148并且重復(fù)上述處理。也就是說(shuō),讀取下一個(gè)揚(yáng)聲器布置信息。
[0422]當(dāng)在步驟S148中確定參數(shù)num_fr_elem的值不大于O時(shí),由于已經(jīng)讀取了所有的關(guān)于前面元素的揚(yáng)聲器布置信息,所以處理前進(jìn)至步驟S151。
[0423]在步驟S151中,PCE解碼單元161將參數(shù)num_side_elem的值設(shè)定作為屬于側(cè)面的元素的數(shù)量,參數(shù)num_Side_elem用于讀取布置在用戶側(cè)面的揚(yáng)聲器所再現(xiàn)的音頻數(shù)據(jù)的揚(yáng)聲器布置信息。
[0424]此處,屬于側(cè)面的元素的數(shù)量是由布置在用戶側(cè)面的揚(yáng)聲器再現(xiàn)的音頻數(shù)據(jù)項(xiàng)的數(shù)量。將元素的數(shù)量存儲(chǔ)在PCE中。
[0425]在步驟S152中,PCE解碼單元161確定參數(shù)num_side_elem的值是否大于O。
[0426]當(dāng)在步驟S152中確定參數(shù)num_side_elem的值大于O時(shí),在步驟S153中PCE解碼單元161讀取與一個(gè)元素對(duì)應(yīng)的、并且在從注釋區(qū)域讀取的數(shù)據(jù)之后布置的揚(yáng)聲器布置信息。步驟S153中所讀取的揚(yáng)聲器布置信息是在用戶側(cè)面的聲道的揚(yáng)聲器布置信息,即“side_element_height_info [i] ”。
[0427]在步驟S154中,PCE解碼單元161使參數(shù)num_side_elem的值減少I(mǎi)。在更新參數(shù)num_side_elem之后,處理返回至步驟S152并且重復(fù)上述處理。
[0428]另一方面,當(dāng)在步驟S152中確定參數(shù)num_side_elem的值不大于O時(shí),由于已經(jīng)讀取了所有的側(cè)面元素的揚(yáng)聲器布置信息,所以處理前進(jìn)至步驟S155。
[0429]在步驟S155中,PCE解碼單元161將參數(shù)num_back_elem的值設(shè)定為屬于后面的元素的數(shù)量,參數(shù)num_baCk_elem用于讀取布置在用戶后面的揚(yáng)聲器所再現(xiàn)的音頻數(shù)據(jù)的揚(yáng)聲器布置信息。
[0430]此處,屬于后面的元素的數(shù)量是由布置在用戶后面的揚(yáng)聲器再現(xiàn)的音頻數(shù)據(jù)項(xiàng)的數(shù)量。將元素的數(shù)量存儲(chǔ)在PCE中。
[0431]在步驟S156中,PCE解碼單元161確定參數(shù)num_back_elem的值是否大于O。
[0432]當(dāng)在步驟S156中確定參數(shù)num_back_elem的值大于O時(shí),在步驟S157中PCE解碼單元161讀取與一個(gè)元素對(duì)應(yīng)的、并且在從注釋區(qū)域讀取的數(shù)據(jù)之后布置的揚(yáng)聲器布置信息。步驟S157中所讀取的揚(yáng)聲器布置信息是布置在用戶后面的聲道的揚(yáng)聲器布置信息,即 “back_element_height_info[i]”。
[0433]在步驟S158中,PCE解碼單元161使參數(shù)num_back_elem的值減少I(mǎi)。在更新參數(shù)num_back_elem之后,處理返回至步驟S156并且重復(fù)上述處理。
[0434]當(dāng)在步驟S156中確定參數(shù)num_back_elem的值不大于O時(shí),由于已經(jīng)讀取了所有的關(guān)于后面元素的揚(yáng)聲器布置信息,所以處理前進(jìn)至步驟S159。
[0435]在步驟S159中,標(biāo)識(shí)信息計(jì)算單元172執(zhí)行字節(jié)對(duì)齊。
[0436]例如,在圖4所不的“height_extension_element”中的揚(yáng)聲器布置信息之后存儲(chǔ)用于指令執(zhí)行字節(jié)對(duì)齊的信息“byte_alignment() ”。因此,當(dāng)讀取該信息時(shí),標(biāo)識(shí)信息計(jì)算單元172執(zhí)行字節(jié)對(duì)齊。
[0437]具體地,標(biāo)識(shí)信息計(jì)算單元172將預(yù)定數(shù)據(jù)添加在“height_extension_element”中,該預(yù)定數(shù)據(jù)緊跟在“PCE_HEIGHT_EXTENSION_SYNC”與“byte_alignment O ”之間所讀取的信息之后,以使得所讀取的信息的數(shù)據(jù)量是8比特的整數(shù)倍。也就是說(shuō),執(zhí)行字節(jié)對(duì)齊以使得所讀取的同步字、揚(yáng)聲器布置信息以及所添加的數(shù)據(jù)的總數(shù)據(jù)量是8比特的整數(shù)倍。
[0438]在本示例中,音頻數(shù)據(jù)的聲道的數(shù)量,即包括在編碼比特流中的揚(yáng)聲器布置信息項(xiàng)的數(shù)量在預(yù)定范圍內(nèi)。因此,通過(guò)字節(jié)對(duì)齊獲得的數(shù)據(jù),即包括同步字、揚(yáng)聲器布置信息以及所添加的數(shù)據(jù)的一個(gè)數(shù)據(jù)項(xiàng)(下文中,也稱為對(duì)齊數(shù)據(jù))必定是預(yù)定數(shù)據(jù)量。
[0439]換言之,對(duì)齊數(shù)據(jù)的量必然是預(yù)定數(shù)據(jù)量,而不管包括在“height_extension_element”中的揚(yáng)聲器布置信息項(xiàng)的數(shù)目,即音頻數(shù)據(jù)的聲道的數(shù)目。因此,如果在生成對(duì)齊數(shù)據(jù)時(shí)對(duì)齊數(shù)據(jù)的量不是預(yù)定數(shù)據(jù)量,那么PCE解碼單元161確定所讀取的揚(yáng)聲器布置信息不是正確的揚(yáng)聲器布置信息,也就是說(shuō),所讀取的揚(yáng)聲器布置信息是無(wú)效的。
[0440]在步驟S160中,標(biāo)識(shí)信息計(jì)算單元172讀取在步驟S159中所讀取的“byte_alignment () ” 之后的標(biāo)識(shí)信息,即存儲(chǔ)在 “height_extension_element” 中的 “height_info_crc_check”中的信息。此處,例如,讀取CRC校驗(yàn)碼作為標(biāo)識(shí)信息。
[0441]在步驟S161中,標(biāo)識(shí)信息計(jì)算單元172基于步驟S159中所獲得的對(duì)齊數(shù)據(jù)來(lái)計(jì)算標(biāo)識(shí)信息。例如,計(jì)算CRC校驗(yàn)碼作為標(biāo)識(shí)信息。
[0442]在步驟S162中,PCE解碼單元161確定步驟S160中所讀取的標(biāo)識(shí)信息與步驟S161中所計(jì)算的標(biāo)識(shí)信息是否相同。
[0443]當(dāng)對(duì)齊數(shù)據(jù)的量不是預(yù)定數(shù)據(jù)量時(shí),PCE解碼單元161不執(zhí)行步驟S160和步驟S161,并且在步驟S162中確定標(biāo)識(shí)信息項(xiàng)彼此不相同。
[0444]當(dāng)在步驟S162中確定標(biāo)識(shí)信息項(xiàng)彼此不相同時(shí),在步驟S163中PCE解碼單元161使所讀取的揚(yáng)聲器布置信息無(wú)效,并且將用于指示所讀取的揚(yáng)聲器布置信息無(wú)效的信息提供給重新布置處理單元181和下混處理單元152。然后,處理前進(jìn)至步驟S164。
[0445]當(dāng)執(zhí)行步驟S163中的處理或步驟S146中的處理時(shí),在步驟S164中重新布置處理單元181以預(yù)定的揚(yáng)聲器布置輸出從切換單元151提供的音頻數(shù)據(jù)。
[0446]在這種情況下,例如,重新布置處理單元181基于從PCE讀取的、并且從PCE解碼單元161提供的關(guān)于揚(yáng)聲器布置的信息,來(lái)確定每個(gè)音頻數(shù)據(jù)項(xiàng)的揚(yáng)聲器布置。由重新布置處理單元181使用以確定揚(yáng)聲器的布置的信息的參考目的地取決于使用音頻數(shù)據(jù)的服務(wù)或應(yīng)用,并且基于音頻數(shù)據(jù)的聲道數(shù)量而被預(yù)定。
[0447]當(dāng)執(zhí)行步驟S164中的處理時(shí),重新布置處理結(jié)束。然后,圖36的步驟S117中的處理結(jié)束。因此,解碼處理結(jié)束。
[0448]另一方面,當(dāng)在步驟S162中確定標(biāo)識(shí)信息項(xiàng)彼此相同時(shí),在步驟S165中PCE解碼單元161使所讀取的揚(yáng)聲器布置信息有效,并且將揚(yáng)聲器布置信息提供給重新布置處理單元181和下混處理單元152。在這種情況下,PCE解碼單元161還將從PCE讀取的關(guān)于揚(yáng)聲器布置的信息提供給重新布置處理單元181和下混處理單元152。
[0449]在步驟S166中,重新布置處理單元181根據(jù)由例如從PCE解碼單元161提供的揚(yáng)聲器布置信息所確定的揚(yáng)聲器的布置,來(lái)輸出從切換單元151提供的音頻數(shù)據(jù)。也就是說(shuō),按照由例如揚(yáng)聲器布置信息確定的順序來(lái)重新布置每個(gè)聲道的音頻數(shù)據(jù),并且然后將每個(gè)聲道的音頻數(shù)據(jù)輸出至下一級(jí)。當(dāng)執(zhí)行步驟S166中的處理時(shí),重新布置處理結(jié)束。然后,圖36所示的步驟S117中的處理結(jié)束。因此,解碼處理結(jié)束。
[0450]以這種方式,解碼裝置141檢查來(lái)自PCE的注釋區(qū)域的同步字或CRC校驗(yàn)碼,讀取揚(yáng)聲器布置信息,并且根據(jù)與揚(yáng)聲器布置信息對(duì)應(yīng)的布置來(lái)輸出解碼的音頻數(shù)據(jù)。[0451]因此,由于讀取了揚(yáng)聲器布置信息并且確定了揚(yáng)聲器的布置(聲源的位置),所以可以再現(xiàn)垂直方向上的聲音圖像并且獲得高品質(zhì)逼真的聲音。
[0452]另外,由于使用同步字和CRC校驗(yàn)碼讀取了揚(yáng)聲器布置信息,所以可以從例如很可能存儲(chǔ)其他文本信息的注釋區(qū)域可靠地讀取揚(yáng)聲器布置信息。也就是說(shuō),可以可靠地區(qū)分揚(yáng)聲器布置信息和其他信息。
[0453]特別地,解碼裝置141使用三個(gè)元素,即同步字的相同、CRC校驗(yàn)碼的相同以及對(duì)齊數(shù)據(jù)量的相同,來(lái)區(qū)分揚(yáng)聲器布置信息和其他信息。因此,可以防止在檢測(cè)揚(yáng)聲器布置信息中的錯(cuò)誤。因此,由于防止了在檢測(cè)揚(yáng)聲器布置信息中的錯(cuò)誤,所以可以根據(jù)揚(yáng)聲器的正確布置來(lái)再現(xiàn)音頻數(shù)據(jù),并且獲得高品質(zhì)逼真的聲音。
[0454][下混處理的描述]
[0455]接著,將參考圖39所示的流程圖來(lái)描述與圖36的步驟S118中的處理對(duì)應(yīng)的下混處理。在這種情況下,每個(gè)聲道的音頻數(shù)據(jù)從切換單元151提供給下混處理單元152的切換單元211。
[0456]在步驟S191中,DSE解碼單元162的擴(kuò)展檢測(cè)單元173從DSE的“MPEG4_ancillary_data () ” 中的“ancillary_data_status O,,讀取“ancillary_data_extension_status,,。
[0457]在步驟S192中,擴(kuò)展檢測(cè)單元173確定所讀取的“ancillary_data_extension_status”是否為I ο
[0458]當(dāng)在步驟S192 中確定 “ancillary_data_extension_status” 不為 1,也就是說(shuō),“ancillary_data_extension_status”為O時(shí),在步驟S193中下混處理單兀152使用預(yù)定方法對(duì)音頻數(shù)據(jù)進(jìn)行下混。
[0459]例如,下混處理單元152使用從下混信息解碼單元174提供的“center_miX_level_value”或“surround_mix_level_value”所確定的系數(shù),對(duì)從切換單元151提供的音頻數(shù)據(jù)進(jìn)行下混,并且將音頻數(shù)據(jù)提供給輸出單元63。
[0460]當(dāng)“ancillary_data_extension_status”為O時(shí),可以由任何方法執(zhí)行下混處理。
[0461]在步驟S194中,在音頻數(shù)據(jù)沒(méi)有任何改變的情況下,輸出單元63將從下混處理單元152提供的音頻數(shù)據(jù)輸出至下一級(jí)。然后,下混處理結(jié)束。以這種方式,圖36的步驟S118中的處理結(jié)束。因此,解碼處理結(jié)束。
[0462]另一方面,當(dāng)在步驟S192 中確定 “ancillary_data_extension_status” 為 I 時(shí),處理前進(jìn)至步驟S195。
[0463]在步驟S195中,下混信息解碼單元174讀取圖11所示的“MPEG4_ext_ancillary_data O ”的“ext_downmixing_levels O ”中的信息,并且將所讀取的信息提供給下混處理單元152。以這種方式,例如,讀取了圖13中所示的“dmix_a_idx”和“dmix_b_idx”。
[0464]當(dāng)包括在“MPEG4_ext_ancillary_data O ” 中的圖 12 所不的 “ext_downmixing_levels_status” 為 O 時(shí),不執(zhí)行對(duì) “dmix_a_idx” 和 “dmix_b_idx” 的讀取。
[0465]在步驟S196中,下混信息解碼單元174讀取“MPEG4_ext_ancillary_data O ”的“ext_downmixing_global_gains O ”中的信息,并且將所讀取的信息輸出給下混處理單元152。以這種方式,例如,讀取了圖15中所示的信息項(xiàng),即“dmx_gain_5_sign”、“dmx_gain_5_idx,,、“dmx_gain_2_sign,,以及 “dmx_gain_2_idx,,。[0466]當(dāng)包括在“MPEG4_ext_ancillary_data O ” 中的圖 12 所不的 “ext_downmixing_global_gains_status”為O時(shí),不執(zhí)行對(duì)信息項(xiàng)的讀取。
[0467]在步驟S197中,下混信息解碼單元174讀取“MPEG4_ext_ancillary_data O ”的“ext_downmixing_lfe_level O ”中的信息,并且將所讀取的信息輸出給下混處理單元152。以這種方式,例如,讀取了圖16中所示的“dmix_lfe_idx”。
[0468]具體地,下混信息解碼單元174讀取圖12中所示的“ext_downmixing_lfe_level_status” 并且基于 “ext_downmixing_lfe_level_status” 的值讀取 “dmix_lfe_idx,,。
[0469]也就是說(shuō),當(dāng)包括在“MPEG4_ext_ancillary_dataO ” 中的 “ext_downmixing_lfe_level_status”為O時(shí),不執(zhí)行對(duì)“dmix_lfe_idx”的讀取。在這種情況下,在音頻數(shù)據(jù)從5.1聲道下混為2聲道中不使用LFE聲道的音頻數(shù)據(jù),這將在下文中描述。也就是說(shuō),LFE聲道的音頻數(shù)據(jù)所乘以的系數(shù)是O。
[0470]在步驟S198中,下混信息解碼單元174從圖7中所示的“MPEG4輔助數(shù)據(jù)”的“bs_info O ”讀取存儲(chǔ)在“pseudo_surround_enable”中的信息,并且將所讀取的信息提供給下混處理單元152。
[0471]在步驟S199中,下混處理單元152基于從分離單元61提供的下混形式參數(shù)來(lái)確定音頻數(shù)據(jù)是否是來(lái)自2聲道的輸出。
[0472]例如,當(dāng)下混形式參數(shù)指示從7.1聲道或6.1聲道下混為2聲道或者從5.1聲道下混為2聲道時(shí),確定音頻數(shù)據(jù)是來(lái)自2聲道的輸出。
[0473]當(dāng)步驟S199中確定了音頻數(shù)據(jù)是來(lái)自2聲道的輸出時(shí),處理前進(jìn)至步驟S200。在這種情況下,切換單元214的輸出目的地被改變?yōu)榍袚Q單元216。
[0474]在步驟S200中,下混處理單元152基于從分離單元61提供的下混形式參數(shù)來(lái)確定音頻數(shù)據(jù)的輸入是否是5.1聲道。例如,當(dāng)下混形式參數(shù)指示從5.1聲道下混為2聲道時(shí),確定輸入是5.1聲道。
[0475]當(dāng)步驟S200中確定了輸入不是5.1聲道時(shí),處理前進(jìn)至步驟S201,并且執(zhí)行從7.1聲道或6.1聲道下混為2聲道。
[0476]在這種情況下,切換單元211將從切換單元151提供的音頻數(shù)據(jù)提供給切換單元212。切換單元212基于從PCE解碼單元161提供的關(guān)于揚(yáng)聲器布置的信息,將從切換單元211提供的音頻數(shù)據(jù)提供給下混單元213-1至213-4中的任一下混單元。例如,當(dāng)音頻數(shù)據(jù)是6.1聲道的數(shù)據(jù)時(shí),將每個(gè)聲道的音頻數(shù)據(jù)提供給下混單元213-1。
[0477]在步驟S201中,下混單元213基于從“ext_downmixing_levels O ”讀取的、并且從下混信息解碼單元174提供的“dmix_a_idx”和“dmix_b_idx”,執(zhí)行下混為5.1聲道。
[0478]例如,當(dāng)音頻數(shù)據(jù)被提供給下混單元213-1時(shí),下混單元213-1參考圖19中所示的表,將針對(duì)“dmix_a_idx”和“dmix_b_idx”的值確定的常量分別設(shè)定為常量gl和常量g2。然后,下混單元213-1分別使用常量gl和常量g2作為在乘法單元242和243以及乘法單元244中使用的系數(shù),使用表達(dá)式(6)生成5.1聲道的音頻數(shù)據(jù),并且將音頻數(shù)據(jù)提供給切換單元214。
[0479]類似地,當(dāng)音頻數(shù)據(jù)被提供給下混單元213-2時(shí),下混單元213_2將針對(duì)“dmix_a_idx”和“dmix_b_idx”的值確定的常量分別設(shè)定為常量el和常量e2。然后,下混單元213-2分別使用常量el和常量e2作為在乘法單元273和274以及乘法單元272和275中使用的系數(shù),使用表達(dá)式(4)生成5.1聲道的音頻數(shù)據(jù),并且將所獲得的5.1聲道的音頻數(shù)據(jù)提供給切換單元214。
[0480]當(dāng)音頻數(shù)據(jù)被提供給下混單元213-3時(shí),下混單元213-3將針對(duì)“dmix_a_idx”和“dmix_b_idx”的值確定的常量分別設(shè)定為常量dl和常量d2。然后,下混單元213-3分別使用常量dl和常量d2作為在乘法單元302和303以及乘法單元304和305中使用的系數(shù),使用表達(dá)式(3)生成音頻數(shù)據(jù),并且將所獲得的音頻數(shù)據(jù)提供給切換單元214。
[0481]當(dāng)音頻數(shù)據(jù)被提供給下混單元213-4時(shí),下混單元213-4將針對(duì)“dmix_a_idx”和“dmix_b_idx”的值確定的常量分別設(shè)定為常量Π和常量f2。然后,下混單元213-4使用常量fl和常量f2作為在乘法單元332和333以及乘法單元334和335中使用的系數(shù),使用表達(dá)式(5)生成音頻數(shù)據(jù),并且將所獲得的音頻數(shù)據(jù)提供給切換單元214。
[0482]當(dāng)5.1聲道的音頻數(shù)據(jù)被提供給切換單元214時(shí),切換單元214將從下混單元213提供的音頻數(shù)據(jù)提供給切換單元216。切換單元216基于從下混信息解碼單元174提供的“pseudo_surround_enable”的值,將從切換單元214提供的音頻數(shù)據(jù)提供給下混單元217-1或下混單元217-2。
[0483]例如,當(dāng)“pseudo_surround_enable”的值為O時(shí),音頻數(shù)據(jù)被提供給下混單元217-1。當(dāng)“pseudo_surround_enable”的值為I時(shí),音頻數(shù)據(jù)被提供給下混單元217-2。
[0484]在步驟S202中,下混單元217基于從下混信息解碼單元174提供的關(guān)于下混的信息來(lái)執(zhí)行將從切換單元216提供的音頻數(shù)據(jù)下混為2聲道的處理。也就是說(shuō),下混為2聲道是基于 “downmixing_levels_MPEG4 O ” 中的信息和 “ext_downmixing_lfe_level O ” 中的信息執(zhí)行的。
[0485]例如,當(dāng)音頻數(shù)據(jù)被提供給下混單元217-1時(shí),下混單元217-1參考圖19中所示的表,將針對(duì) “center_mix_level_value” 和 “surround_mix_level_value” 的值確定的常量分別設(shè)定為常量a和常量b。另外,下混單元217-1參考圖18中所示的表將針對(duì)“dmix_lfe_idx”的值確定的常量設(shè)定為常量C。
[0486]然后,下混單元217-1分別使用常量a、常量b和常量c作為在乘法單元363和364、乘法單元362以及乘法單元365中使用的系數(shù),使用表達(dá)式(I)生成音頻數(shù)據(jù),并且將所獲得的2聲道的音頻數(shù)據(jù)提供給增益調(diào)整單元218。
[0487]當(dāng)音頻數(shù)據(jù)被提供給下混單元217-2時(shí),下混單元217_2確定常量a、常量b及常量C,與下混單元217-1類似。然后,下混單元217-2分別使用常量a、常量b和常量c作為在乘法單元403和404、乘法單元402以及乘法單元405中使用的系數(shù),使用表達(dá)式(2)生成音頻數(shù)據(jù),并且將所獲得的音頻數(shù)據(jù)提供給增益調(diào)整單元218。
[0488]在步驟S203 中,增益調(diào)整單元 218 基于從“ext_downmixing_global_gains O ”讀取的、并且從下混信息解碼單元174提供的信息,對(duì)來(lái)自下混單元217的音頻數(shù)據(jù)的增益進(jìn)行調(diào)整。
[0489]具體地,增益調(diào)整單元218基于從“ext_downmixing_global_gains() ”讀取的“ dmx_ga i n_5_s i gn,,、“ dmx_ga i n_5_ i dx,,、“ dmx_ga i n_2_s i gn,,及“ dmx_ga i n_2_ i dx,,來(lái)計(jì)算表達(dá)式(11),并且計(jì)算增益值dmX_gain_7to2。然后,增益調(diào)整單元218將每個(gè)聲道的音頻數(shù)據(jù)乘以增益值dmX_gain_7to2,并且將音頻數(shù)據(jù)提供給輸出單元63。
[0490]在步驟S204中,在音頻數(shù)據(jù)沒(méi)有任何改變的情況下,輸出單元63將從增益調(diào)整單元218提供的音頻數(shù)據(jù)輸出至下一級(jí)。然后,下混處理結(jié)束。以這種方式,圖36的步驟S118中的處理結(jié)束。因此,解碼處理結(jié)束。
[0491]在沒(méi)有任何改變的情況下當(dāng)音頻數(shù)據(jù)從重新布置處理單元181輸出時(shí)以及當(dāng)音頻數(shù)據(jù)從下混處理單元152輸出時(shí),音頻數(shù)據(jù)從輸出單元63輸出。在輸出單元63之后的級(jí)中,可以預(yù)定要使用的音頻數(shù)據(jù)的兩個(gè)輸出中的一個(gè)輸出。
[0492]當(dāng)在步驟S200中確定輸入是5.1聲道時(shí),處理前進(jìn)至步驟S205,并且執(zhí)行從5.1聲道下混為2聲道。
[0493]在這種情況下,切換單元211將從切換單元151提供的音頻數(shù)據(jù)提供給切換單元216。切換單元216基于從下混信息解碼單元174提供的“pseudo_surround_enable”的值,將從切換單元211提供的音頻數(shù)據(jù)提供給下混單元217-1或下混單元217-2。
[0494]在步驟S205中,下混單元217基于從下混信息解碼單元174提供的關(guān)于下混的信息來(lái)執(zhí)行將從切換單元216提供的音頻數(shù)據(jù)下混為2聲道的處理。另外,在步驟S205中,執(zhí)行與步驟S202中的處理相同的處理。
[0495]在步驟S206 中,增益調(diào)整單元 218 基于從“ext_downmixing_global_gains O ”讀取的、并且從下混信息解碼單元174提供的信息,對(duì)從下混單元217提供的音頻數(shù)據(jù)的增益進(jìn)行調(diào)整。
[0496]具體地,增益調(diào)整單元218基于從“ext_downmixing_global_gains() ”讀取的“dmx_gain_2_sign”及“dmx_gain_2_idx”來(lái)計(jì)算表達(dá)式(9),并且將通過(guò)計(jì)算獲得的音頻數(shù)據(jù)提供給輸出單元63。
[0497]在步驟S207中,在音頻數(shù)據(jù)沒(méi)有任何改變的情況下,輸出單元63將從增益調(diào)整單元218提供的音頻數(shù)據(jù)輸出至下一級(jí)。然后,下混處理結(jié)束。以這種方式,圖36的步驟S118中的處理結(jié)束。因此,解碼處理結(jié)束。
[0498]當(dāng)在步驟S199中確定音頻數(shù)據(jù)不是來(lái)自2聲道的輸出,即音頻數(shù)據(jù)是來(lái)自5.1聲道的輸出時(shí),處理前進(jìn)至步驟S208,并且執(zhí)行從7.1聲道或6.1聲道下混為5.1聲道。
[0499]在這種情況下,切換單元211將從切換單元151提供的音頻數(shù)據(jù)提供給切換單元212。切換單元212基于從PCE解碼單元161提供的關(guān)于揚(yáng)聲器布置的信息,將從切換單元211提供的音頻數(shù)據(jù)提供給下混單元213-1至213-4中的任一個(gè)。另外,切換單元214的輸出目的地是增益調(diào)整單元215。
[0500]在步驟S208中,下混單元213基于從“ext_downmixing_levels O ”讀取的、并且從下混信息解碼單元174提供的“dmix_a_idx”和“dmix_b_idx”,執(zhí)行下混為5.1聲道。在步驟S208中,執(zhí)行與步驟S201中的處理相同的處理。
[0501]當(dāng)執(zhí)行下混為5.1聲道并且音頻數(shù)據(jù)從下混單元213提供給切換單元214時(shí),切換單元214將所提供的音頻數(shù)據(jù)提供給增益調(diào)整單元215。
[0502]在步驟S209 中,增益調(diào)整單元 215 基于從“ext_downmixing_global_gains O ”讀取的、并且從下混信息解碼單元174提供的信息,對(duì)從切換單元214提供的音頻數(shù)據(jù)的增益進(jìn)行調(diào)整。
[0503]具體地,增益調(diào)整單元215基于從“ext_downmixing_global_gains() ”讀取的“dmx_gain_5_sign”和“dmx_gain_5_idx”來(lái)計(jì)算表達(dá)式(7),并且將通過(guò)計(jì)算獲得的音頻數(shù)據(jù)提供給輸出單元63。[0504]在步驟S210中,在音頻數(shù)據(jù)沒(méi)有任何改變的情況下,輸出單元63將從增益調(diào)整單元215提供的音頻數(shù)據(jù)輸出至下一級(jí)。然后,下混處理結(jié)束。以這種方式,圖36的步驟S118中的處理結(jié)束。因此,解碼處理結(jié)束。
[0505]以這種方式,解碼裝置141基于從編碼比特流中讀取的信息對(duì)音頻數(shù)據(jù)進(jìn)行下混。
[0506]例如,在編碼比特流中,由于“pseudo_surround_enable”包括在DSE中,所以可以使用多種方法之中最適合于音頻數(shù)據(jù)的方法來(lái)執(zhí)行從5.1聲道到2聲道的下混處理。因此,在解碼側(cè)可以獲得高品質(zhì)逼真的聲音。
[0507]另外,在編碼比特流中,將用于指示是否包括擴(kuò)展信息的信息存儲(chǔ)在“ancillary_data_extension_status”中。因此,可以參考該信息來(lái)指定擴(kuò)展信息是否被包括在擴(kuò)展區(qū)域中。當(dāng)可以獲得擴(kuò)展信息時(shí),可以提高在音頻數(shù)據(jù)的下混中的靈活性。因此,可以獲得高
品質(zhì)逼真的聲音。
[0508]可以通過(guò)硬件或者通過(guò)軟件執(zhí)行上述一系列的處理。在通過(guò)軟件執(zhí)行這一系列處理時(shí),將形成軟件的程序安裝在計(jì)算機(jī)中。此處,計(jì)算機(jī)的示例包括結(jié)合到專用硬件中的計(jì)算機(jī)以及通用個(gè)人計(jì)算機(jī),在通用個(gè)人計(jì)算機(jī)中安裝有各種程序并且其能夠執(zhí)行各種功倉(cāng)泛。
[0509]圖40是示出了執(zhí)行程序以執(zhí)行上述一系列處理的計(jì)算機(jī)的硬件結(jié)構(gòu)的示例的框圖。
[0510]在計(jì)算機(jī)中,中央處理單元(CPU) 501、只讀存儲(chǔ)器(ROM) 502和隨機(jī)存取存儲(chǔ)器(RAM) 503通過(guò)總線504彼此連接。
[0511]輸入/輸出接口 505連接到總線504。輸入單元506、輸出單元507、記錄單元508、通信單元509以及驅(qū)動(dòng)器510連接到輸入/輸出接口 505。
[0512]輸入單元506包括例如鍵盤(pán)、鼠標(biāo)、麥克風(fēng)以及成像元件。輸出單元507包括例如顯示器和揚(yáng)聲器。記錄單元508包括硬盤(pán)和非易失性存儲(chǔ)器。通信單元509是例如網(wǎng)絡(luò)接口。驅(qū)動(dòng)器510驅(qū)動(dòng)可移除介質(zhì)511,諸如磁盤(pán)、光盤(pán)、磁光盤(pán)或者半導(dǎo)體存儲(chǔ)器。
[0513]在具有上述結(jié)構(gòu)的計(jì)算機(jī)中,例如,CPU501通過(guò)輸入/輸出接口 505和總線504將記錄在記錄單元508上的程序加載到RAM503。然后,執(zhí)行上述一系列處理。
[0514]由計(jì)算機(jī)(CPU501)執(zhí)行的程序可以被記錄在作為封裝介質(zhì)的可移除介質(zhì)511上并且然后被提供?;蛘?,程序可以通過(guò)有線傳輸介質(zhì)或無(wú)線傳輸介質(zhì),諸如局域網(wǎng)、互聯(lián)網(wǎng)或者數(shù)字衛(wèi)星廣播來(lái)提供。
[0515]在計(jì)算機(jī)中,可以將可移除介質(zhì)511插入驅(qū)動(dòng)器510中,以通過(guò)輸入/輸出接口505將程序安裝在記錄單元508中。另外,可以通過(guò)有線傳輸介質(zhì)或無(wú)線傳輸介質(zhì)由通信單元509接收程序,并且然后將程序安裝在記錄單元508中?;蛘撸梢灶A(yù)先將程序安裝在R0M502或記錄單元508中。
[0516]由計(jì)算機(jī)執(zhí)行的程序可以是根據(jù)在本說(shuō)明書(shū)中所描述的順序按時(shí)間先后順序執(zhí)行操作的程序,或者可以是并行地執(zhí)行操作或者在必要時(shí)(例如,當(dāng)存在請(qǐng)求時(shí))執(zhí)行操作的程序。
[0517]本技術(shù)的實(shí)施方式不限于上述實(shí)施方式,而是可以在不偏離本技術(shù)的范圍和精神的情況下進(jìn)行對(duì)實(shí)施方式的各種修改和變化。[0518]例如,本技術(shù)可以具有云計(jì)算結(jié)構(gòu),在云計(jì)算結(jié)構(gòu)中一個(gè)功能被多個(gè)裝置通過(guò)網(wǎng)絡(luò)共享,并且由多個(gè)裝置協(xié)作處理。
[0519]在上述實(shí)施方式中,由一個(gè)裝置執(zhí)行上述流程圖中所描述的每個(gè)步驟。然而,每個(gè)步驟可以由多個(gè)裝置共享和執(zhí)行。
[0520]在上述實(shí)施方式中,當(dāng)一個(gè)步驟包括多個(gè)處理時(shí),包括在一個(gè)步驟中的多個(gè)處理由一個(gè)裝置執(zhí)行。然而,多個(gè)處理可以由多個(gè)裝置共享和執(zhí)行。
[0521 ] 另外,本技術(shù)可以具有以下結(jié)構(gòu)。
[0522][I] 一種解碼裝置,包括:
[0523]解碼單元,所述解碼單元對(duì)包括在編碼比特流中的音頻數(shù)據(jù)進(jìn)行解碼;
[0524]讀取單元,所述讀取單元從能夠存儲(chǔ)所述編碼比特流的任意數(shù)據(jù)的區(qū)域中讀取關(guān)于所述音頻數(shù)據(jù)的聲源的高度的聲源位置信息;以及
[0525]輸出單元,所述輸出單元基于所述聲源位置信息輸出所解碼的音頻數(shù)據(jù)。
[0526][2]在根據(jù)[I]所述的解碼裝置中,所述聲源位置信息是用于指示所述聲源的高度基本上等于用戶的高度、大于用戶的高度或者小于用戶的高度的信息。
[0527][3]在根據(jù)[I]或[2]所述的解碼裝置中,用于標(biāo)識(shí)所述聲源位置信息是否存在的標(biāo)識(shí)信息被存儲(chǔ)在所述能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中,并且所述讀取單元基于所述標(biāo)識(shí)信息讀取所述聲源位置信息。
[0528][4]在根據(jù)[3]所述的解碼裝置中,第一預(yù)定標(biāo)識(shí)信息和基于所述聲源位置信息計(jì)算的第二標(biāo)識(shí)信息作為所述標(biāo)識(shí)信息被存儲(chǔ)在所述能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中。
[0529][5]在根據(jù)[4]所述的解碼裝置中,當(dāng)包括在所述能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中的第一標(biāo)識(shí)信息是預(yù)定的特定信息,并且從所述能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中讀取的第二標(biāo)識(shí)信息與基于所讀取的聲源位置信息計(jì)算的第二標(biāo)識(shí)信息相同時(shí),所述讀取單元確定所述聲源位置信息是有效的。
[0530][6]在根據(jù)[5]所述的解碼裝置中,所述第二標(biāo)識(shí)信息是基于通過(guò)對(duì)包括所述聲源位置信息的信息執(zhí)行字節(jié)對(duì)齊所獲得的信息而計(jì)算的。
[0531][7] 一種解碼方法,包括:
[0532]對(duì)包括在編碼比特流中的音頻數(shù)據(jù)進(jìn)行解碼的步驟;
[0533]從能夠存儲(chǔ)所述編碼比特流的任意數(shù)據(jù)的區(qū)域中讀取關(guān)于所述音頻數(shù)據(jù)的聲源的高度的聲源位置信息的步驟;以及
[0534]基于所述聲源位置信息輸出所解碼的音頻數(shù)據(jù)的步驟。
[0535][8] 一種使計(jì)算機(jī)執(zhí)行下述處理的程序,所述處理包括:
[0536]對(duì)包括在編碼比特流中的音頻數(shù)據(jù)進(jìn)行解碼的步驟;
[0537]從能夠存儲(chǔ)所述編碼比特流的任意數(shù)據(jù)的區(qū)域中讀取關(guān)于所述音頻數(shù)據(jù)的聲源的高度的聲源位置信息的步驟;以及
[0538]基于所述聲源位置信息輸出所解碼的音頻數(shù)據(jù)的步驟。
[0539][9] 一種編碼裝置,包括:
[0540]獲取單元,所述獲取單元獲取關(guān)于聲源的高度的聲源位置信息;
[0541]編碼單元,所述編碼單元對(duì)音頻數(shù)據(jù)和所述聲源位置信息進(jìn)行編碼;以及
[0542]封裝單元,所述封裝單元將所編碼的聲源位置信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中,并且生成包括所編碼的音頻數(shù)據(jù)和所編碼的聲源位置信息的編碼比特流。
[0543][10]在根據(jù)[9]所述的編碼裝置中,所述聲源位置信息是用于指示所述聲源的高度基本上等于用戶的高度、大于用戶的高度或者小于用戶的高度的信息。
[0544][11]在根據(jù)[9]或[10]所述的編碼裝置中,所述聲源位置信息和用于標(biāo)識(shí)所述聲源位置信息是否存在的標(biāo)識(shí)信息被存儲(chǔ)在所述能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中。
[0545][12]在根據(jù)[11]所述的編碼裝置中,第一預(yù)定標(biāo)識(shí)信息和基于所述聲源位置信息計(jì)算的第二標(biāo)識(shí)信息作為所述標(biāo)識(shí)信息被存儲(chǔ)在所述能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中。
[0546][13]在根據(jù)[12]所述的編碼裝置中,用于指示對(duì)包括所述聲源位置信息的信息執(zhí)行字節(jié)對(duì)齊的信息和用于指示在基于通過(guò)字節(jié)對(duì)齊所獲得的信息而計(jì)算的第二標(biāo)識(shí)信息與存儲(chǔ)在所述能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中的第二標(biāo)識(shí)信息之間進(jìn)行比較的信息被進(jìn)一步存儲(chǔ)在所述能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中。
[0547][14] 一種編碼方法,包括:
[0548]獲取關(guān)于聲源的高度的聲源位置信息的步驟;
[0549]對(duì)音頻數(shù)據(jù)和所述聲源位置信息進(jìn)行編碼的步驟;以及
[0550]將所編碼的聲源位置信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中并且生成包括所編碼的音頻數(shù)據(jù)和所編碼的聲源位置信息的編碼比特流的步驟。
[0551][15] 一種使計(jì)算機(jī)執(zhí)行下述處理的程序,所述處理包括:
[0552]獲取關(guān)于聲源的高度的聲源位置信息的步驟;
[0553]對(duì)音頻數(shù)據(jù)和所述聲源位置信息進(jìn)行編碼的步驟;以及
[0554]將所編碼的聲源位置信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中并且生成包括所編碼的音頻數(shù)據(jù)和所編碼的聲源位置信息的編碼比特流的步驟。
[0555]附圖標(biāo)記列表
[0556]11編碼裝置
[0557]21輸入單元
[0558]22編碼單元
[0559]23封裝單元
[0560]51解碼裝置
[0561]61分離單元
[0562]62解碼單元
[0563]63輸出單元
[0564]91編碼裝置
[0565]101 PCE編碼單元
[0566]102 DSE編碼單元
[0567]103音頻元素編碼單元
[0568]111同步字編碼單元
[0569]112布置信息編碼單元
[0570]113標(biāo)識(shí)信息編碼單元
[0571]114擴(kuò)展信息編碼單元
[0572]115下混信息編碼單元[0573]141解碼裝置
[0574]152下混處理單元
[0575]161 PCE解碼單元
[0576]162 DSE解碼單元
[0577]163音頻元素解碼單元
[0578]171同步字檢測(cè)單元
[0579]172標(biāo)識(shí)信息計(jì)算單元
[0580]173擴(kuò)展檢測(cè)單元
[0581]174下混信息解碼單元
[0582]181重新布置處理單元
【權(quán)利要求】
1.一種解碼裝置,包括: 解碼單元,所述解碼單元對(duì)包括在編碼比特流中的音頻數(shù)據(jù)進(jìn)行解碼; 讀取單元,所述讀取單元從能夠存儲(chǔ)所述編碼比特流的任意數(shù)據(jù)的區(qū)域中讀取關(guān)于所述音頻數(shù)據(jù)的聲源的高度的聲源位置信息;以及 輸出單元,所述輸出單元基于所述聲源位置信息輸出所解碼的音頻數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的解碼裝置,其中,所述聲源位置信息是用于指示所述聲源的高度基本上等于用戶的高度、大于用戶的高度或者小于用戶的高度的信息。
3.根據(jù)權(quán)利要求2所述的解碼裝置,其中,用于標(biāo)識(shí)所述聲源位置信息是否存在的標(biāo)識(shí)信息被存儲(chǔ)在所述能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中,并且 所述讀取單元基于所述標(biāo)識(shí)信息讀取所述聲源位置信息。
4.根據(jù)權(quán)利要求3所述的解碼裝置,其中,第一預(yù)定標(biāo)識(shí)信息和基于所述聲源位置信息計(jì)算的第二標(biāo)識(shí)信息作為所述標(biāo)識(shí)信息被存儲(chǔ)在所述能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中。
5.根據(jù)權(quán)利要求4所述的解碼裝置,其中,當(dāng)包括在所述能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中的第一標(biāo)識(shí)信息是預(yù)定的特定信息,并且從所述能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中讀取的第二標(biāo)識(shí)信息與基于所讀取的聲源位置信息而計(jì)算的第二標(biāo)識(shí)信息相同時(shí),所述讀取單元確定所述聲源位置信息是有效的。
6.根據(jù)權(quán)利要求5所述的解碼裝置,其中,所述第二標(biāo)識(shí)信息是基于通過(guò)對(duì)包括所述聲源位置信息的信息執(zhí)行字節(jié)對(duì)齊所獲得的信息而計(jì)算的。
7.一種解碼方法,包括:` 對(duì)包括在編碼比特流中的音頻數(shù)據(jù)進(jìn)行解碼的步驟; 從能夠存儲(chǔ)所述編碼比特流的任意數(shù)據(jù)的區(qū)域中讀取關(guān)于所述音頻數(shù)據(jù)的聲源的高度的聲源位置信息的步驟;以及 基于所述聲源位置信息輸出所解碼的音頻數(shù)據(jù)的步驟。
8.一種使計(jì)算機(jī)執(zhí)行下述處理的程序,所述處理包括: 對(duì)包括在編碼比特流中的音頻數(shù)據(jù)進(jìn)行解碼的步驟; 從能夠存儲(chǔ)所述編碼比特流的任意數(shù)據(jù)的區(qū)域中讀取關(guān)于所述音頻數(shù)據(jù)的聲源的高度的聲源位置信息的步驟;以及 基于所述聲源位置信息輸出所解碼的音頻數(shù)據(jù)的步驟。
9.一種編碼裝置,包括: 獲取單元,所述獲取單元獲取關(guān)于聲源的高度的聲源位置信息; 編碼單元,所述編碼單元對(duì)音頻數(shù)據(jù)和所述聲源位置信息進(jìn)行編碼;以及封裝單元,所述封裝單元將所編碼的聲源位置信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中,并且生成包括所編碼的音頻數(shù)據(jù)和所編碼的聲源位置信息的編碼比特流。
10.根據(jù)權(quán)利要求9所述的編碼裝置,其中,所述聲源位置信息是用于指示所述聲源的高度基本上等于用戶的高度、大于用戶的高度或者小于用戶的高度的信息。
11.根據(jù)權(quán)利要求10所述的編碼裝置,其中,所述聲源位置信息和用于標(biāo)識(shí)所述聲源位置信息是否存在的標(biāo)識(shí)信息被存儲(chǔ)在所述能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中。
12.根據(jù)權(quán)利要求11所述的編碼裝置,其中,第一預(yù)定標(biāo)識(shí)信息和基于所述聲源位置信息計(jì)算的第二標(biāo)識(shí)信息作為所述標(biāo)識(shí)信息被存儲(chǔ)在所述能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中。
13.根據(jù)權(quán)利要求12所述的編碼裝置,其中,用于指示對(duì)包括所述聲源位置信息的信息執(zhí)行字節(jié)對(duì)齊的信息和用于指示在基于通過(guò)所述字節(jié)對(duì)齊所獲得的信息而計(jì)算的第二標(biāo)識(shí)信息與存儲(chǔ)在所述能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中的第二標(biāo)識(shí)信息之間進(jìn)行比較的信息被進(jìn)一步存儲(chǔ)在所述能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中。
14.一種編碼方法,包括: 獲取關(guān)于聲源的高度的聲源位置信息的步驟; 對(duì)音頻數(shù)據(jù)和所述聲源位置信息進(jìn)行編碼的步驟;以及 將所編碼的聲源位置信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中并且生成包括所編碼的音頻數(shù)據(jù)和所編碼的聲源位置信息的編碼比特流的步驟。
15.一種使計(jì)算機(jī)執(zhí)行下述處理的程序,所述處理包括: 獲取關(guān)于聲源的高度的聲源位置信息的步驟; 對(duì)音頻數(shù)據(jù)和所述聲源位置信息進(jìn)行編碼的步驟;以及 將所編碼的聲源位置信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中并且生成包括所編碼的音頻數(shù)據(jù)和所編碼 的聲源位置信息的編碼比特流的步驟。
【文檔編號(hào)】G10L19/00GK103782339SQ201380002774
【公開(kāi)日】2014年5月7日 申請(qǐng)日期:2013年6月24日 優(yōu)先權(quán)日:2012年7月2日
【發(fā)明者】畠中光行, 知念徹 申請(qǐng)人:索尼公司