亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

解碼裝置和方法、編碼裝置和方法、以及程序的制作方法

文檔序號(hào):2827097閱讀:216來(lái)源:國(guó)知局
解碼裝置和方法、編碼裝置和方法、以及程序的制作方法
【專利摘要】本技術(shù)涉及一種解碼裝置和方法、編碼裝置和方法、以及程序。所述技術(shù)使得能夠?qū)崿F(xiàn)更具現(xiàn)場(chǎng)感的高質(zhì)量聲音。編碼裝置將揚(yáng)聲器映射信息存儲(chǔ)在編碼比特流的PCE中的注釋字段中,并且還將同步字和標(biāo)識(shí)信息存儲(chǔ)在注釋字段中,使得可以對(duì)在注釋字段中所存儲(chǔ)的其他一般注釋與揚(yáng)聲器映射信息進(jìn)行區(qū)分。在編碼比特流的解碼期間,使用在注釋字段中所記錄的同步字和標(biāo)識(shí)信息來(lái)確定是否存儲(chǔ)了揚(yáng)聲器映射信息,并且依照基于確定結(jié)果的揚(yáng)聲器映射來(lái)輸出編碼比特流中所包含的音頻數(shù)據(jù)。本技術(shù)可以應(yīng)用到編碼裝置。
【專利說(shuō)明】解碼裝置和方法、編碼裝置和方法、以及程序
【技術(shù)領(lǐng)域】
[0001]本技術(shù)涉及一種解碼裝置、解碼方法、編碼裝置、編碼方法以及程序,并且更具體地,涉及一種可以獲得高質(zhì)量真實(shí)感聲音的解碼裝置、解碼方法、編碼裝置、編碼方法以及程序。
【背景技術(shù)】
[0002]近年,世界上所有的國(guó)家引入了運(yùn)動(dòng)圖像分發(fā)服務(wù)、數(shù)字電視廣播、以及下一代歸檔。除了根據(jù)現(xiàn)有技術(shù)的立體聲廣播之外,開始引入與多通道(諸如,5.1通道)相對(duì)應(yīng)的聲
音廣播。
[0003]為了進(jìn)一步改進(jìn)圖像質(zhì)量,已經(jīng)推進(jìn)了具有更大的像素?cái)?shù)量的下一代高清晰度電視。隨著對(duì)下一代高清晰度電視的推進(jìn),期望在聲音處理領(lǐng)域中為了實(shí)現(xiàn)真實(shí)感的聲音、在水平方向和垂直方向上將通道擴(kuò)展為多于5.1通道的多通道。
[0004]作為與音頻數(shù)據(jù)的編碼有關(guān)的技術(shù),已經(jīng)提出了下述一種技術(shù):該技術(shù)將來(lái)自不同通道的多個(gè)窗口分組到一些圖塊(tile)中,以改進(jìn)編碼效率(例如,參見專利文獻(xiàn)I)。
[0005]引用列表
[0006]專利文獻(xiàn)
[0007]專利文獻(xiàn)I JP2OlO-2I79OOA
【發(fā)明內(nèi)容】

[0008]本發(fā)明要解決的問題
[0009]然而,在以上提及的技術(shù)中,難以獲得高質(zhì)量真實(shí)感的聲音。
[0010]例如,在基于作為國(guó)際標(biāo)準(zhǔn)的運(yùn)動(dòng)圖像專家組-2先進(jìn)音頻編碼(MPEG-2AAC)標(biāo)準(zhǔn)和MPEG-4AAC標(biāo)準(zhǔn)的多通道編碼中,僅限定了在水平方向上揚(yáng)聲器的布置和關(guān)于從5.1通道到立體聲通道的降混的信息。因此,難以對(duì)在平面上和垂直方向上通道的擴(kuò)展作出充分地響應(yīng)。
[0011]鑒于以上提及的問題提出了本技術(shù),并且本技術(shù)可以獲得高質(zhì)量真實(shí)感的聲音。
[0012]要解決的問題
[0013]根據(jù)本技術(shù)的第一方面的解碼裝置包括:標(biāo)識(shí)信息檢測(cè)單元,從能夠存儲(chǔ)編碼比特流的任意數(shù)據(jù)的區(qū)域讀出用于標(biāo)識(shí)是否存在預(yù)定信息的標(biāo)識(shí)信息;以及讀出單元,基于多個(gè)標(biāo)識(shí)信息、從能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域讀出預(yù)定信息。
[0014]可以將預(yù)定第一標(biāo)識(shí)信息和基于預(yù)定信息計(jì)算出的第二標(biāo)識(shí)信息作為標(biāo)識(shí)信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中。
[0015]當(dāng)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中所包括的第一標(biāo)識(shí)信息是預(yù)定特定信息、并且從能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域所讀出的第二標(biāo)識(shí)信息與基于所讀出的預(yù)定信息計(jì)算出的第二標(biāo)識(shí)信息相同時(shí),讀出單元可以確定預(yù)定信息是有效信息。
[0016]當(dāng)所讀出的第一標(biāo)識(shí)信息是預(yù)定特定信息時(shí),讀出單元可以開始讀出布置在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中的第一標(biāo)識(shí)信息之后的預(yù)定信息。
[0017]可以基于通過對(duì)于包括預(yù)定信息的信息執(zhí)行字節(jié)對(duì)齊所獲得的信息,計(jì)算第二標(biāo)識(shí)息。
[0018]在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中可以包括在預(yù)定范圍中的任意數(shù)量的預(yù)定信息。當(dāng)通過字節(jié)對(duì)齊所獲得的信息不具有預(yù)定大小時(shí),讀出單元可以確定預(yù)定信息是無(wú)效信息。
[0019]預(yù)定信息可以是與音頻數(shù)據(jù)有關(guān)的信息。解碼裝置還可以包括解碼單元,其對(duì)在編碼比特流中所包括的音頻數(shù)據(jù)進(jìn)行解碼。
[0020]根據(jù)本技術(shù)的第一方面的解碼方法或程序包括下述步驟:從能夠存儲(chǔ)編碼比特流的任意數(shù)據(jù)的區(qū)域讀出用于標(biāo)識(shí)是否存在預(yù)定信息的標(biāo)識(shí)信息的步驟;以及基于多個(gè)標(biāo)識(shí)信息、從能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域讀出預(yù)定信息的步驟。
[0021]在本技術(shù)的第一方面中,從能夠存儲(chǔ)編碼比特流的任意數(shù)據(jù)的區(qū)域讀出用于標(biāo)識(shí)是否存在預(yù)定信息的標(biāo)識(shí)信息;以及,基于多個(gè)標(biāo)識(shí)信息、從能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域讀出預(yù)定信息。
[0022]根據(jù)本技術(shù)的第二方面的編碼裝置包括:編碼單元,對(duì)用于標(biāo)識(shí)是否存在預(yù)定信息的多個(gè)標(biāo)識(shí)信息和預(yù)定信息進(jìn)行編碼;以及打包單元,將編碼預(yù)定信息和編碼標(biāo)識(shí)信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中,并且生成編碼比特流。
[0023]可以將預(yù)定第一標(biāo)識(shí)信息和基于預(yù)定信息計(jì)算出的第二標(biāo)識(shí)信息作為標(biāo)識(shí)信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中。
[0024]當(dāng)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中所包括的第一標(biāo)識(shí)信息是預(yù)定特定信息、并且從能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域所讀出的第二標(biāo)識(shí)信息與基于所讀出的預(yù)定信息計(jì)算出的第二標(biāo)識(shí)信息相同時(shí),預(yù)定信息可以被確定為有效信息。
[0025]預(yù)定信息可以布置在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中的第一標(biāo)識(shí)信息之后。當(dāng)所讀出的第一標(biāo)識(shí)信息是預(yù)定特定信息時(shí),可以開始讀出預(yù)定信息。
[0026]可以進(jìn)一步將如下信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中:用于指示執(zhí)行用于包括預(yù)定信息的信息的字節(jié)對(duì)齊的信息、和用于指示在基于通過字節(jié)對(duì)齊所獲得的信息計(jì)算出的第二標(biāo)識(shí)信息與在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中所存儲(chǔ)的第二標(biāo)識(shí)信息之間進(jìn)行比較的信息。
[0027]在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中可以存儲(chǔ)在預(yù)定范圍中的任意數(shù)量的預(yù)定信息。當(dāng)通過字節(jié)對(duì)齊所獲得的信息不具有預(yù)定大小時(shí),預(yù)定信息可以被確定為無(wú)效信息。
[0028]預(yù)定信息可以是與音頻數(shù)據(jù)有關(guān)的信息。編碼單元可以對(duì)音頻數(shù)據(jù)進(jìn)行編碼,并且打包單元可以將編碼音頻數(shù)據(jù)存儲(chǔ)在編碼比特流中。
[0029]根據(jù)本技術(shù)的第二方面的編碼方法或程序包括下述步驟:對(duì)用于標(biāo)識(shí)是否存在預(yù)定信息的多個(gè)標(biāo)識(shí)信息和預(yù)定信息進(jìn)行編碼的步驟;以及將編碼預(yù)定信息和編碼標(biāo)識(shí)信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中、并且生成編碼比特流的步驟。
[0030]在本技術(shù)的第二方面中,對(duì)用于標(biāo)識(shí)是否存在預(yù)定信息的多個(gè)標(biāo)識(shí)信息和預(yù)定信息進(jìn)行編碼。將編碼預(yù)定信息和編碼標(biāo)識(shí)信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中、并且生成編碼比特流。
[0031]發(fā)明的效果
[0032]根據(jù)本技術(shù)的第一方面和第二方面,可以獲得高質(zhì)量真實(shí)感的聲音。【專利附圖】

【附圖說(shuō)明】
[0033]圖1是示出揚(yáng)聲器的布置的圖。
[0034]圖2是示出揚(yáng)聲器映射的示例的圖。
[0035]圖3是示出編碼比特流的圖。
[0036]圖4 是不出 height_extension_element 的語(yǔ)法的圖。
[0037]圖5是示出揚(yáng)聲器的布置高度的圖。
[0038]圖6是示出MPEG4輔助數(shù)據(jù)的語(yǔ)法的圖。
[0039]圖7是示出bs_info O的語(yǔ)法的圖。
[0040]圖8 是不出 ancillary_data_status O 的語(yǔ)法的圖。
[0041]圖9 是不出 downmixing_levels_MPEG4O 的語(yǔ)法的圖。
[0042]圖10是示出audio_coding_mode O的語(yǔ)法的圖。
[0043]圖11 是不出 MPEG4_ext_ancillary_data()的語(yǔ)法的圖。
[0044]圖12 是不出 ext_ancillary_data_status O 的語(yǔ)法的圖。
[0045]圖13 是不出 ext_downmixing_levels O 的語(yǔ)法的圖。
[0046]圖14是示出應(yīng)用了每個(gè)系數(shù)的對(duì)象的圖。
[0047]圖15 是不出 ext_downmixing_global_gains O 的語(yǔ)法的圖。
[0048]圖16 是不出 ext_downmixing_lfe_level O 的語(yǔ)法的圖。
[0049]圖17是示出降混(downmixing)的圖。
[0050]圖18是示出針對(duì)dmix_lfe_idx所確定的系數(shù)的圖。
[0051]圖19是示出針對(duì)dmix_a_idx和dmix_b_idx所確定的系數(shù)的圖。
[0052]圖20 是不出 drc_presentation_mode 的語(yǔ)法的圖。
[0053]圖 21 是不出 drc_presentation_mode 的圖。
[0054]圖22是示出編碼裝置的結(jié)構(gòu)的示例的圖。
[0055]圖23是示出編碼處理的流程圖。
[0056]圖24是示出解碼裝置的結(jié)構(gòu)的示例的圖。
[0057]圖25是示出解碼處理的流程圖。
[0058]圖26是示出編碼裝置的結(jié)構(gòu)的示例的圖。
[0059]圖27是示出編碼處理的流程圖。
[0060]圖28是示出解碼裝置的示例的圖。
[0061]圖29是示出降混處理單元的結(jié)構(gòu)的示例的圖。
[0062]圖30是示出降混單元的結(jié)構(gòu)的示例的圖。
[0063]圖31是示出降混單元的結(jié)構(gòu)的示例的圖。
[0064]圖32是示出降混單元的結(jié)構(gòu)的示例的圖。
[0065]圖33是示出降混單元的結(jié)構(gòu)的示例的圖。
[0066]圖34是示出降混單元的結(jié)構(gòu)的示例的圖。
[0067]圖35是示出降混單元的結(jié)構(gòu)的示例的圖。
[0068]圖36是示出解碼處理的流程圖。
[0069]圖37是示出重排(rearrangement)處理的流程圖。[0070]圖38是示出重排處理的流程圖。
[0071]圖39是示出降混處理的流程圖。
[0072]圖40是示出計(jì)算機(jī)的結(jié)構(gòu)的示例的圖。
【具體實(shí)施方式】
[0073]在下文中,將參照附圖描述應(yīng)用了本技術(shù)的實(shí)施例。
[0074]<第一實(shí)施例>
[0075][本技術(shù)的概要]
[0076]首先,將描述本技術(shù)的概要。
[0077]本技術(shù)涉及對(duì)音頻數(shù)據(jù)的編碼和解碼。例如,在基于MPEG-2AAC或MPEG-4AAC標(biāo)準(zhǔn)的多通道編碼中,難以獲得用于在水平平面上和在垂直方向上進(jìn)行通道擴(kuò)展的信息。
[0078]在多通道編碼中,不存在通道擴(kuò)展內(nèi)容的降混信息,并且通道的適當(dāng)?shù)幕旌媳壤俏粗摹R虼?,具有很小?shù)量的再現(xiàn)通道的便攜式設(shè)備難以對(duì)聲音進(jìn)行再現(xiàn)。
[0079]本技術(shù)可以使用下面的特征(I)至特征(4)來(lái)獲得高質(zhì)量真實(shí)感的聲音。
[0080](I)將關(guān)于在垂直方向上的揚(yáng)聲器的布置的信息記錄在由現(xiàn)有的AAC標(biāo)準(zhǔn)所限定的 PCE (Program_config_eIement)中的注釋區(qū)域中。
[0081](2)在特征(I)的情況下,為了區(qū)分公用(public)注釋與在垂直方向上的揚(yáng)聲器布置信息,編碼裝置對(duì)兩個(gè)標(biāo)識(shí)信息(即,同步字和CRC校驗(yàn)碼(check code))進(jìn)行編碼,并且解碼裝置將兩個(gè)標(biāo)識(shí)信息進(jìn)行比較。當(dāng)兩個(gè)標(biāo)識(shí)信息彼此相同時(shí),解碼裝置獲取揚(yáng)聲器布置信息。
[0082](3)將音頻數(shù)據(jù)的降混信息記錄在輔助數(shù)據(jù)區(qū)域(DSE (data_stream_eIement))中。
[0083](4)從6.1通道或7.1通道到2通道的降混是兩階段處理,其包括從6.1通道或7.1通道到5.1通道的降混以及從5.1通道到2通道的降混。
[0084]同樣地,關(guān)于在垂直方向上的揚(yáng)聲器的布置的信息的使用使得除了可以對(duì)在平面內(nèi)的聲音圖像進(jìn)行再現(xiàn)之外、還可以對(duì)在垂直方向上的聲音圖像進(jìn)行再現(xiàn),并且可以相比根據(jù)現(xiàn)有技術(shù)的平面多通道、再現(xiàn)更具真實(shí)感的聲音。
[0085]另外,當(dāng)傳送關(guān)于從6.1通道或7.1通道到5.1通道或2通道的降混的信息時(shí),單個(gè)編碼數(shù)據(jù)的使用使得可以以最適合每個(gè)再現(xiàn)環(huán)境的通道數(shù)量來(lái)對(duì)聲音進(jìn)行再現(xiàn)。在根據(jù)不對(duì)應(yīng)于本技術(shù)的現(xiàn)有技術(shù)的解碼裝置中,忽略作為公用注釋的垂直方向上的信息,并且對(duì)音頻數(shù)據(jù)進(jìn)行解碼。因此,不損壞兼容性。
[0086][揚(yáng)聲器的布置]
[0087]接下來(lái),將描述對(duì)音頻數(shù)據(jù)進(jìn)行再現(xiàn)時(shí)的揚(yáng)聲器的布置。
[0088]例如,如圖1所示假定用戶從正面觀看諸如電視機(jī)的顯示裝置的顯示屏幕TVS。即,假定用戶置于圖1中的顯示屏幕TVS的前方。
[0089]在這種情況下,假定布置有13個(gè)揚(yáng)聲器Lvh、Rvh、Lrs、Ls、L、Lc、C、Rc、R、Rs、Rrs、Cs以及LFE,以便環(huán)繞用戶。
[0090]在下文中,由揚(yáng)聲器Lvh> Rvh> Lrs、Ls、L、Lc、C、Re、R、Rs、Rrs> Cs 以及 LFE 所再現(xiàn)的音頻數(shù)據(jù)(聲音)的通道分別地稱為L(zhǎng)vh、Rvh、Lrs、Ls、L、Lc、C、Re、R、Rs、Rrs、Cs以及LFE。
[0091]如圖2所示,通道L是“左前方”,通道R是“右前方”、以及通道C是“正前方”。
[0092]另外,通道Ls是“左環(huán)繞”,通道Rs是“右環(huán)繞”,通道Lrs是“左后方”、通道Rrs是“右后方”,以及通道Cs是“正后方”。
[0093]通道Lvh是“左前方高處”,通道Rvh是“右前方高處”,以及通道LEF是“低頻音效”。
[0094]返回到圖1,揚(yáng)聲器Lvh和揚(yáng)聲器Rvh布置在用戶的左前方上方和右前方上方。布置有揚(yáng)聲器Rvh和Lvh的層是“頂部層”。
[0095]揚(yáng)聲器L、C、以及R布置在用戶的左側(cè)、中心以及右側(cè)。揚(yáng)聲器Lc和Re分別地布置在揚(yáng)聲器L與揚(yáng)聲器C之間以及揚(yáng)聲器R與揚(yáng)聲器C之間。另外,揚(yáng)聲器Ls和揚(yáng)聲器Rs分別地布置在用戶的左側(cè)和右側(cè),以及揚(yáng)聲器Lrs、Rrs以及Cs分別地布置在用戶的左后方、右后方、以及后方。
[0096]揚(yáng)聲器Lrs、Ls、L、Lc、C、Re、R、Rs、Rrs、以及Cs布置在基本上放置在用戶的耳朵的高度處的平面中,以便環(huán)繞用戶。布置有這些揚(yáng)聲器的層被稱為“中間層”。
[0097]揚(yáng)聲器LFE布置在用戶的前方下側(cè),并且布置有揚(yáng)聲器LEF的層被稱為“LFE層”。
[0098][編碼比特流]
[0099]例如,當(dāng)對(duì)每個(gè)通道的音頻數(shù)據(jù)進(jìn)行編碼時(shí),獲得了圖3所示的編碼比特流。SP,圖3示出了 AAC幀的編碼比特流的語(yǔ)法。
[0100]圖3所示的編碼比特流包括“數(shù)據(jù)頭/邊信息(sideinf0)”、“PCE”、“SCE”、“CPE”、“LFE”、“DSE”、“FIL (DRC)”、以及“FIL (END)”。在此示例中,編碼比特流包括三個(gè)“CPE”。
[0101]例如,“PCE”包括關(guān)于音頻數(shù)據(jù)的每個(gè)通道的信息。在此示例中,“PCE”包括:“矩陣降混”,其為關(guān)于音頻數(shù)據(jù)的降混的信息;以及“高度信息”,其為關(guān)于揚(yáng)聲器的布置的信息。另外,“PCE”包括“co_ent_field_data”,其為可以存儲(chǔ)自由注釋(free comment)的注釋區(qū)域(注釋字段),并且 “comment_f ield_data” 包括 “height_extension_element”,其為擴(kuò)展區(qū)域。注釋區(qū)域可以存儲(chǔ)任意數(shù)據(jù),諸如公用注釋?!癶eight_extension_element”包括“高度信息”,其為關(guān)于揚(yáng)聲器的布置的高度的信息。
[0102]“SCE”包括單一通道的音頻數(shù)據(jù),“CPE”包括通道對(duì)(S卩,兩個(gè)通道)的音頻數(shù)據(jù),以及“LFE”包括例如通道LFE的音頻數(shù)據(jù)。例如,“SCE”存儲(chǔ)通道C或Cs的音頻數(shù)據(jù),并且“CPE”包括通道L或R或通道Lvh或Rvh的音頻數(shù)據(jù)。
[0103]另外,“DSE”是輔助數(shù)據(jù)區(qū)域。“DSE”存儲(chǔ)自由數(shù)據(jù)。在此示例中,“DSE”包括作為關(guān)于音頻數(shù)據(jù)的降混的信息的“將5.1通道降混到2通道”、“動(dòng)態(tài)范圍控制”、“DRC呈現(xiàn)模式”、“將6.1通道和7.1通道降混到5.1通道”、“全局增益降混”以及“LFE降混”。
[0104]另外,“FIL (DRC)”包括關(guān)于聲音的動(dòng)態(tài)范圍控制的信息。例如,“FIL (DRC)”包括“程序參考等級(jí)”和“動(dòng)態(tài)范圍控制”。
[0105][注釋字段]
[0106]如上所述,“PCE”的 “comment_f ield_data,,包括 “height_extension_element,,。因此,根據(jù)關(guān)于在垂直方向上的揚(yáng)聲器的布置的信息來(lái)實(shí)現(xiàn)多通道再現(xiàn)。即,通過在每個(gè)高度的層(諸如“頂部層”或“中間層”)中所布置的揚(yáng)聲器來(lái)對(duì)高質(zhì)量真實(shí)感的聲音進(jìn)行再現(xiàn)。
[0107]例如,如圖4所示,“height_extension_element”包括用于與其他公用注釋進(jìn)行區(qū)分的同步字。即,圖4是示出“height_extension_element”的語(yǔ)法的圖。
[0108]在圖4 中,“PCE_HEIGHT_EXTENSION_SYNC” 指示同步字。
[0109]另外,“front_element_height_info[i],,、“side_element_height_info [i] ”、以及“back_element_height_info[i] ”指示布置在觀看者的前方、側(cè)方以及后方的揚(yáng)聲器(即,層)的高度。
[0110]此外,“byte_alignmentO ” 指不字節(jié)對(duì)齊,并且 “height_info_crc_check” 指不被用作標(biāo)識(shí)信息的CRC校驗(yàn)碼。另外,基于在“PCE_HEIGHT_EXTENSION_SYNC”與“byte_alignment O間所讀出的信息(即,同步字、關(guān)于每個(gè)揚(yáng)聲器的布置的信息(關(guān)于每個(gè)通道的信息)、以及字節(jié)對(duì)齊)來(lái)計(jì)算CRC校驗(yàn)碼。然后,確定所計(jì)算出的CRC校驗(yàn)碼是否與由“height_info_crc_check”所指示的CRC校驗(yàn)碼相同。當(dāng)CRC校驗(yàn)碼彼此相同時(shí),確定正確地讀出了關(guān)于每個(gè)揚(yáng)聲器的布置的信息。另外,“crc_cal O ! =height_info_crc_check”指示CRC校驗(yàn)碼之間的比較。
[0111]例如,如圖5所示地設(shè)置作為關(guān)于聲音源的位置(即,揚(yáng)聲器的布置(高度))的信息的 “front_element_height_info [i] ”、“side_element_height_info[i] ”、以及 “back_element_height_info [i] ”。
[0112]即,當(dāng)關(guān)于“front_element_height_info [i],,、“side_element_height_info [i] ”、以及 “back_eIement_height_infο [i] ” 的信息為 “O”、“ I”、以及 “2” 時(shí),揚(yáng)聲器的高度分別地為“正常高度”、“頂部揚(yáng)聲器”、以及“底部揚(yáng)聲器”。即,布置有揚(yáng)聲器的層為“中間層”、“頂部層”、以及“LFE層”。
[0113][DSE]
[0114]接下來(lái),將描述作為在“DSE”(即 “data_stream_element O ” 的 “data_stream_byte[]”)中所包括的輔助數(shù)據(jù)區(qū)域的“MPEG4輔助數(shù)據(jù)”??梢愿鶕?jù)“MPEG4輔助數(shù)據(jù)”執(zhí)行用于從6.1通道或7.1通道到5.1通道或2通道的音頻數(shù)據(jù)的降混DRC控制。
[0115]圖6是示出了 “MPEG4輔助數(shù)據(jù)”的語(yǔ)法的圖?!癕PEG4輔助數(shù)據(jù)”包括“bs_info O ”、“ancillary_data_status () ”、“downmixing_levels_MPEG4 O,,、“audio_coding_mode() ”、“Compression_value,,、以及 “MPEG4_ext_ancillary_data() ”。
[0116]在此,“Compression_value”對(duì)應(yīng)于圖3所示的“動(dòng)態(tài)范圍控制”。另外,“bs_info O ”、“ancillary_data_statusO ”、“downmixing_levels_MPEG4() ”、“audio_coding_mode O ”以及MPEG4_ext_ancillary_data()的語(yǔ)法分別地如圖7至圖11所示。
[0117]例如,如圖7 所不,“bs_info O ” 包括 “mpeg_audio_type”、“dolby_sur;round_mode,,、“drc_presentation_mode,,、以及 “pseudo_surround_enable,,。
[0118]另外,“drc_presentation_mode”對(duì)應(yīng)于圖3所示的“DRC呈現(xiàn)模式”。此外,“pseudo_surround_enable”包括指示從5.1通道到2通道的降混的過程的信息,即,指示要被用于降混的多個(gè)降混方法中的一個(gè)的信息。
[0119]例如,處理依賴于圖8所示的“ancillary_data_status O ”中所包括的“ancillary_data_extension_status,,是O還是 I 而變化。當(dāng)“ancillary_data_extension_status”為I時(shí),執(zhí)行對(duì)圖6所示的“MPEG4輔助數(shù)據(jù)”中的“MPEG4_ext_ancillary_dataO ”的存取,并且執(zhí)行降混DRC控制。另一方面,當(dāng)“ancillary_data_extension_status”為O時(shí),執(zhí)行根據(jù)現(xiàn)有技術(shù)的處理。以這種方式,可以確保與現(xiàn)有標(biāo)準(zhǔn)的兼容性。[0120]另外,圖8 所不的“ancillary_data_status O ”中所包括的“downmixing_levels_MPEG4_status”是用于指定被用于將5.1通道降混到2通道的系數(shù)(混合比例)的信息。即,當(dāng) “downmixing_levels_MPEG4_status” 為 I 時(shí),由圖 9 所不的 “downmixing_levels_MPEG4 0 ”中所存儲(chǔ)的信息所確定的系數(shù)被用于降混。
[0121]此外,圖9所示的“downmixing_levels_MPEG4() ”包括作為用于指定降混系數(shù)的信息的 “center_mix_level_value” 和 “surround_mix_level_value,,。例如,與 “center_mix_level_value”和“surround_mix_level_value”相對(duì)應(yīng)的系數(shù)值由以下將描述的圖19所示的表確定。
[0122]另夕卜,圖9中所不的“downmixing_levels_MPEG4O ”對(duì)應(yīng)于圖3所不的“將5.1通道降混到2通道”。
[0123]此外,圖11 中所不的 “MPEG4_ext_ancillary_data O ” 包括 “ext_ancillary_data_status O ”、“ext_downmixing_levels O,,、“ext_downmixing_global_gains() ”、以及“ext_downmixing_lfe_level() ”。
[0124]對(duì)通道的數(shù)量進(jìn)行擴(kuò)展以使得5.1通道的音頻數(shù)據(jù)擴(kuò)展到7.1通道或6.1通道的音頻數(shù)據(jù)所需要的信息被存儲(chǔ)在“MPEG4_ext_ancillary_data() ”中。
[0125]具體地,“ext_ancillary_data_status O ”包括指示是否將大于5.1通道的通道降混到5.1通道的信息(標(biāo)志)、指示在降混期間是否執(zhí)行增益控制的信息、以及指示在降混期間是否使用LFE通道的信息。
[0126]用于指定在降混期間所使用的系數(shù)(混合比例)的信息被存儲(chǔ)在“ ext_downmixing_levels O ”中,并且與增益調(diào)整期間的增益有關(guān)的信息被包括在“ext_downmixing_global_gains O ”中。另外,用于指定在降混期間所使用的LEF通道的系數(shù)(混合比例)的信息被存儲(chǔ)在“ext_downmixing_lef_level O ”中。
[0127]具體地,例如,“ext_ancillary_data_statusO ” 的語(yǔ)法如圖 12 所示。在 “ext_ancillary_data_status () ” 中,“ext_downmixing_levels_status” 指不是否將 6.1 通道或7.1通道降混到5.1通道。即,“ext_downmixing_levels_status”指不“是否存在ext_downmixing_levels O ”?!癳xt_downmixing_levels_status” 對(duì)應(yīng)于圖 3 中所不的“將 6.1通道和7.1通道降混到5.1通道”。
[0128]另外,“ext_downmixing_global_gains_status”指示是否執(zhí)行全局增益控制,并且對(duì)應(yīng)于圖3所示的“全局增益降混”。即,“ext_downmixing_global_gains_status”指不是否存在 “ext_downmixing_global_gains O ”。另夕卜,“ext_downmixing_lfe_level_status”指示當(dāng)將5.1通道降混到2通道時(shí)是否使用LFE通道,并且對(duì)應(yīng)于圖3所示的“LFE降混”。
[0129]圖11 所不的 “MPEG4_ext_ancillary_data O ” 中的 “ext_downmixing_levels O ”的語(yǔ)法如圖13所示,并且圖13所示的“dmix_a_idx”和“dmix_b_idx”是指示降混期間混合比例(系_的信息。
[0130]圖14 不出了 由“ext_downmixing_levels O ”所確定的“dmix_a_idx”和“dmix_b_idx”與當(dāng)對(duì)7.1通道的音頻數(shù)據(jù)進(jìn)行降混時(shí)應(yīng)用了“dmix_a_idx”和“dmix_b_idx”的分量之間的對(duì)應(yīng)關(guān)系。
[0131]圖 11 所不的 “MPEG4_ext_ancillary_data(),,中的 “ext_downmixing_global_gains O ” 和 “ext_downmixing_lfe_level O ” 的語(yǔ)法如圖 15 和圖 16 所不。
[0132]例如,圖15所示的“ext_downmixing_global_gains O ”包括指示在降混到5.1通道期間增益的符號(hào)的“ dmx_ga i n_5_s i gn ”、增益“ dmx_ga i n_5_i dx ”、指示在降混到2通道期間增益的符號(hào)的 “ dmx_ga i n_2_s i gn ”、以及增益“ dmx_ga i n_2_ i dx ”。
[0133]另外,圖16 所不的 “ext_downmixing_lfe_level O ” 包括“dmix_lfe_idx”,并且“dmiX_lfe_idX”是指示在降混期間LEF通道的混合比例(系數(shù))的信息。
[0134][降混]
[0135]另外,圖7 所不的 “bs_info O ” 的語(yǔ)法中的 “pseudo_sur;round_enable” 指不降混處理的過程,并且該處理的過程如圖17所示。在此,圖17示出了當(dāng)“pseudo_surround_enable” 為 O 時(shí)和當(dāng) “pseudo_surround_enable” 為 I 時(shí)的兩個(gè)過程。
[0136]接下來(lái),將描述音頻數(shù)據(jù)降混處理。
[0137]首先,將描述從5.1通道到2通道的降混。在這種情況下,當(dāng)降混之后的L通道和R通道分別為L(zhǎng)’通道和R’通道時(shí),執(zhí)行下面的處理。
[0138]即,當(dāng)“pseudo_surround_enable”為O時(shí),根據(jù)下面的表達(dá)式(I)來(lái)計(jì)算L’通道和R’通道的音頻數(shù)據(jù)。
[0139]L,=L+CXb+LsXa+L FEXc
[0140]R,=R+CXb+RsXa+LFEXc...(I)
[0141]當(dāng)“pseudo_surround_enable”為I時(shí),根據(jù)下面的表達(dá)式(2)來(lái)計(jì)算L’通道和R’通道的音頻數(shù)據(jù)。
[0142]L’ =L+CXb - aX (Ls+Rs) +LFEXc
[0143]R,=R+CXb+aX (Ls+Rs)+LFEX c...(2)
[0144]在表達(dá)式(I)和表達(dá)式(2)中,L、R、C、Ls、Rs、以及LFE是構(gòu)成5.1通道的通道,并且分別地指示參照?qǐng)D1和圖2所描述的通道L、R、C、Ls、Rs、以及LFE。
[0145]在表達(dá)式(I)和表達(dá)式(2)中,“c”是根據(jù)圖16所示的“ext_downmixing_lfe_level O”中所包括的“dmix_lfe_idx”的值所確定的常數(shù)。例如,與“dmix_lfe_idx”的每個(gè)值相對(duì)應(yīng)的常數(shù)c的值如圖18所示。具體地,當(dāng)圖12所示的“ext_ancillary_data_status O ” 中的“ext_downmixing_lfe_level_status” 為 O 時(shí),在使用表達(dá)式(I)和表達(dá)式(2)進(jìn)行的計(jì)算中未使用LEF通道。當(dāng)“ext_downmixing_lfe_level_status”為I時(shí),基于圖18所示的表來(lái)確定與LFE通道相乘的常數(shù)c的值。
[0146]在表達(dá)式(I)和表達(dá)式(2)中,“a”和“b”是根據(jù)圖13所示的“ext_downmixing_I eve I s O ”中所包括的“ dmix_a_i dx ”和“ dmi x_b_i dx ”的值所確定的常數(shù)。另外,在表達(dá)式(I)和表達(dá)式(2)中,“a”和“b”可以是根據(jù)圖9所示的“downmixing_levels_MPEG4O ”中的 “center_mix_level_values,,和 “surround_mix_level_value” 的值確定的常數(shù)。
[0147]例如,關(guān)于“dmix_a_idx” 和 “dmix_b_idx” 的值或關(guān)于 “center_mix_level_value”和“surround_mix_level_value”的值的常數(shù)a和b的值如圖19所不。在此不例中,因?yàn)椤癲mix_a_idx” 和“dmix_b_idx” 與“。61^61'_1111叉_16¥61_^1116” 和“sur;round_mix_leveljalue”參考同一個(gè)表,所以用于降混的常數(shù)(系數(shù))a和b具有相同的值。
[0148]然后,將描述從7.1通道或6.1通道到5.1通道的降混。
[0149]當(dāng)包括布置在用戶的后方的揚(yáng)聲器Lrs和Rrs的通道的通道C、L、R、Ls、Rs、Lrs、Rrs、以及LFE的音頻數(shù)據(jù)被轉(zhuǎn)換為包括通道C’、L’、R’、Ls’、Rs’、以及LFE’的5.1通道的音頻數(shù)據(jù)時(shí),根據(jù)下面的表達(dá)式(3)執(zhí)行計(jì)算。在此,通道C’、L’、R’、Ls’、Rs’以及LFE’分別地指示降混之后的通道C、L、R、Ls、Rs以及LFE。另外,在表達(dá)式(3)中,C、L、R、Ls、Rs、Lrs、Rrs、以及LFE指示通道C、L、R、Ls、Rs、Lrs、Rrs、以及LFE的音頻數(shù)據(jù)。
[0150]C,=C
[0151]L’ =L
[0152]R’ =R
[0153]Ls’ =Ls X dl+Lrs X d2 [0154]Rs’ =Rs X dl+Rrs X d2
[0155]LFE,=LFE …(3)
[0156]在表達(dá)式(3)中,dl和d2是常數(shù)。例如,針對(duì)圖19所示的“dmix_a_idx”和“dmix_b_idx”的值確定常數(shù)dl和d2。
[0157]當(dāng)包括布置在用戶的前方的揚(yáng)聲器Lc和Re的通道的通道C、L、R、Lc、Re、Ls、Rs、以及LFE的音頻數(shù)據(jù)被轉(zhuǎn)換為包括通道C’、L’、R’、Ls’、Rs’、以及LFE’的5.1通道的音頻數(shù)據(jù)時(shí),根據(jù)下面的表達(dá)式(4)執(zhí)行計(jì)算。在此,通道(:’、1/、1?’、1^’、1^’以及LFE’分別地指示降混之后的通道C、L、R、Ls、Rs以及LFE。在表達(dá)式(4)中,C、L、R、Lc、Re、Ls、Rs、以及LFE指示通道C、L、R、Lc、Re、Ls、Rs、以及LFE的音頻數(shù)據(jù)。
[0158]C,=C+elX (Lc+Rc)
[0159]L,=L+LcXe2
[0160]R’=R+RcXe2
[0161]Ls,=Ls
[0162]Rs ’ =Rs
[0163]LFE,=LFE...(4)
[0164]在表達(dá)式(4)中,el和e2是常數(shù)。例如,針對(duì)圖19所示的“dmix_a_idx”和“dmix_b_idx”的值確定常數(shù)el和e2。
[0165]當(dāng)包括布置在用戶的前方上方側(cè)的揚(yáng)聲器Lvh和Rvh的通道的通道C、L、R、Lvh、Rvh、Ls、Rs、以及LFE的音頻數(shù)據(jù)被轉(zhuǎn)換為包括通道C’、L’、R’、Ls’、Rs’、以及LFE’的5.1通道的音頻數(shù)據(jù)時(shí),根據(jù)下面的表達(dá)式(5)執(zhí)行計(jì)算。在此,通道C’、L’、R’、Ls’、Rs’以及LFE’分別地指示降混之后的通道C、L、R、Ls、Rs以及LFE。在表達(dá)式(5)中,C、L、R、Lvh、Rvh、Ls、Rs、以及LFE指示通道C、L、R、Lvh、Rvh、Ls、Rs、以及LFE的音頻數(shù)據(jù)。
[0166]C,=C
[0167]L’ =LXfl+LvhXf2
[0168]R’ =RXfl+RvhXf2
[0169]Ls,=Ls
[0170]Rs,=Rs
[0171]LFE,=LFE...(5)
[0172]在表達(dá)式(5)中,fl和f2是常數(shù)。例如,針對(duì)圖19所示的“dmix_a_idx”和“dmix_b_idx”的值確定常數(shù)fl和f2。
[0173]當(dāng)執(zhí)行從6.1通道到5.1通道的降混時(shí),執(zhí)行下面的處理。即,當(dāng)將通道C、L、R、Ls、Rs、Cs、以及LFE的音頻數(shù)據(jù)轉(zhuǎn)換為包括通道C’、L’、R’、Ls’、Rs’、以及LFE’的5.1通道的音頻數(shù)據(jù)時(shí),根據(jù)下面的表達(dá)式(6)執(zhí)行計(jì)算。在此,通道C’、L’、R’、Ls’、Rs’、以及LFE’分別地指示降混之后的通道C、L、R、Ls、Rs、以及LFE。在表達(dá)式(6)中,C、L、R、Ls、Rs、Cs、以及LFE指示通道C、L、R、Ls、Rs、Cs、以及LFE的音頻數(shù)據(jù)。
[0174]C, =C
[0175]L,=L
[0176]R’ =R
[0177]Ls,=Ls X gl+Cs X g2
[0178]Rs’ =Rs X gl+Cs X g2
[0179]LFE’ =LFE...(6)
[0180]在表達(dá)式(6)中,gl和g2是常數(shù)。例如,針對(duì)圖19所示的“dmix_a_idx”和“dmix_b_idx”的值確定常數(shù)gl和g2。
[0181]接下來(lái),將描述在降混期間用于音量校正的全局增益。
[0182]全局降混增益被用來(lái)對(duì)通過降混而增加或降低的聲音音量進(jìn)行校正。在此,dmx_gain5指示用于從7.1通道或6.1通道到5.1通道的降混的校正值,并且dmx_gain2指示用于從5.1通道到2通道的降混的校正值。另外,dmx_gain2支持不對(duì)應(yīng)于7.1通道的解碼裝置或編碼比特流。
[0183]其應(yīng)用和操作類似于DRC深度壓縮。另外,編碼裝置可以針對(duì)音頻幀較長(zhǎng)的時(shí)間段或音頻幀過短的時(shí)間段適當(dāng)?shù)貓?zhí)行選擇性評(píng)估,以確定全局降混增益。
[0184]在從7.1通道到2通道的降混期間,應(yīng)用組合增益,即(dmx_gain5+dmx_gain2)。例如,6位無(wú)符號(hào)整數(shù)被用作dmx_gain5和dmx_gain2,并且以0.25dB的間隔對(duì)dmx_gain5和dmx_gain2進(jìn)行量化。
[0185]因此,當(dāng)將dmx_gain5與dmx_gain2彼此組合時(shí),組合增益在±15.75dB的范圍中。將該增益值應(yīng)用到解碼當(dāng)前幀的音頻數(shù)據(jù)的采樣中。
[0186]具體地,在到5.1通道的降混期間,執(zhí)行下面的處理。即,當(dāng)針對(duì)通過降混所獲得的通道(:’、1/、1?’、1^’、1^’以及LFE’的音頻數(shù)據(jù)執(zhí)行增益校正以獲得通道(:’’、1/’、1?’’、Ls’’、Rs’’以及LFE’’的音頻數(shù)據(jù)時(shí),根據(jù)下面的表達(dá)式(7)執(zhí)行計(jì)算。
[0187]L,,=L,Xdmx_gain5
[0188]R’’ =R’ Xdmx_gain5
[0189]C’’ =C’ Xdmx_gain5
[0190]Ls,,=Ls,Xdmx_gain5
[0191]Rs,,=Rs,Xdmx_gain5
[0192]LFE,,=LFE,Xdmx_gain5...(7)
[0193]在此,dmx_gain5是標(biāo)量值,并且是根據(jù)下面的表達(dá)式(8)、由圖15所示的“dmx_gain_5_sign” 和 “dmx_gain_5_idx” 所計(jì)算出的增益值。
[0194]如果dmx_gain_5_sign==l,則 dmx_gain5=10 (dmx—gam—5—ldx/20)
[0195]如果dmx_gain_5_sign==0,則 dmx_gain5=10 (-dmx-gain-5-ldx/2CI)...(8)
[0196]類似地,在到2通道的降混期間,執(zhí)行下面的處理。即,當(dāng)針對(duì)通過降混所獲得的通道L’和R’的音頻數(shù)據(jù)執(zhí)行增益校正以獲得通道L’’和R’’的音頻數(shù)據(jù)時(shí),根據(jù)下面的表達(dá)式(9)執(zhí)行計(jì)算。
[0197]L,,=L,Xdmx_gain2
[0198]R,,=R,Xdmx_gain2...(9)
[0199]在此,dmx_gain2是標(biāo)量值,并且是根據(jù)下面的表達(dá)式(10)、由圖15所示的“dmx_gain_2_sign” 和 “dmx_gain_2_idx” 所計(jì)算出的增益值。
[0200]如果dmx_gain_2_sign==l,則 dmx_gain2=10 (dmx—sam—2—ldx/20)
[0201]如果dmx_gain_2_sign==0,則 dmx_gain2=10 (-dmx-gain-2-ldx/2CI)...(10)
[0202]在從7.1通道降混到2通道期間,在從7.1通道降混到5.1通道以及從5.1通道降混到2通道之后,可以針對(duì)所獲得的信號(hào)(數(shù)據(jù))執(zhí)行增益調(diào)整。在這種情況下,如在下面的表達(dá)式(11)中所描述地,可以通過將dmx_gain5與dmx_gain2進(jìn)行組合而獲得被應(yīng)用到音頻數(shù)據(jù)的增益值dmx_gain7to2。
[0203]dmx_gain7to2=dmx_gain_2 X dmx_gain_5 …(11)
[0204]與從7.1通道到2通道的降混類似地執(zhí)行從6.1通道到2通道的降混。
[0205]例如,在從7.1通道到2通道的降混期間,當(dāng)根據(jù)表達(dá)式(7)或表達(dá)式(9)在兩階段中執(zhí)行增益校正時(shí),可以輸出5.1通道的音頻數(shù)據(jù)和2通道的音頻數(shù)據(jù)。[0206][DRC呈現(xiàn)模式]
[0207]另外,圖7 所不的“bs_info () ” 中所包括的“drc_presentation_mode” 如圖 20 所不。即,圖20是不出“drc_presentation_mode”的語(yǔ)法的圖。
[0208]當(dāng)“drc_presentation_mode” 為 “01” 時(shí),模式為 “DRC 呈現(xiàn)模式 1”。當(dāng) “drc_presentation.mode"為“ 10”時(shí),模式為“DRC呈現(xiàn)模式2”。在“DRC呈現(xiàn)模式1 ”和“DRC呈現(xiàn)模式2”中,如圖21所示地執(zhí)行增益控制。
[0209][編碼裝置的示例結(jié)構(gòu)]
[0210]接下來(lái),將描述應(yīng)用了本技術(shù)的具體的實(shí)施例。
[0211]圖22是示出根據(jù)應(yīng)用了本技術(shù)的實(shí)施例的編碼裝置的結(jié)構(gòu)的示例的圖。編碼裝置11包括輸入單元21、編碼單元22、以及打包單元23。
[0212]輸入單元21從外部獲取音頻數(shù)據(jù)和關(guān)于該音頻數(shù)據(jù)的信息,并且將音頻數(shù)據(jù)和信息提供給編碼單元22。例如,獲取關(guān)于揚(yáng)聲器的布置(布置高度)的信息作為關(guān)于音頻數(shù)據(jù)的信息。
[0213]編碼單元22對(duì)從輸入單元21所提供的音頻數(shù)據(jù)和關(guān)于該音頻數(shù)據(jù)的信息進(jìn)行編碼,并且將編碼音頻數(shù)據(jù)和信息提供給打包單元23。打包單元23對(duì)從編碼單元22所提供的音頻數(shù)據(jù)或關(guān)于該音頻數(shù)據(jù)的信息進(jìn)行打包,以生成圖3所示的編碼比特流并且輸出編碼比特流。
[0214][編碼處理的說(shuō)明]
[0215]接下來(lái),將參照?qǐng)D23所示的流程圖描述編碼裝置的編碼處理。
[0216]在步驟S11中,輸入單元21獲取音頻數(shù)據(jù)和關(guān)于該音頻數(shù)據(jù)的信息,并且將音頻數(shù)據(jù)和信息提供給編碼單元22。例如,獲取7.1通道中每個(gè)通道的音頻數(shù)據(jù)和關(guān)于要存儲(chǔ)在圖4所示的“height_extension_element”中的揚(yáng)聲器的布置的信息(在下文中,被稱為揚(yáng)聲器布置信息)。
[0217]在步驟S12中,編碼單元22對(duì)從輸入單元21所提供的每個(gè)通道的音頻數(shù)據(jù)進(jìn)行編碼。
[0218]在步驟S13中,編碼單元22對(duì)從輸入單元21所提供的揚(yáng)聲器布置信息進(jìn)行編碼。在這種情況下,編碼單元22生成要存儲(chǔ)在圖4所示的“height_extension_element”中所包括的“PCE_HEIGHT_EXTENSION_SYNC”中的同步字、或生成作為要存儲(chǔ)在“height_info_crc_check”中的標(biāo)識(shí)信息的CRC校驗(yàn)碼,并且將同步字或CRC校驗(yàn)碼以及編碼揚(yáng)聲器布置信息提供給打包單元23。
[0219]另外,編碼單元22生成了對(duì)于生成編碼比特流所需要的信息,并且將所生成的信息和編碼音頻數(shù)據(jù)或揚(yáng)聲器布置信息提供給打包單元23。
[0220]在步驟S14中,打包單元23針對(duì)從編碼單元22所提供的音頻數(shù)據(jù)或揚(yáng)聲器布置信息執(zhí)行比特打包,以生成圖3所示的編碼比特流。在這種情況下,例如,打包單元23將揚(yáng)聲器布置信息或同步字以及CRC校驗(yàn)碼存儲(chǔ)在“PCE”中,并且將音頻數(shù)據(jù)存儲(chǔ)在“SCE”或“CPE” 中。
[0221]當(dāng)輸出編碼比特流時(shí),編碼處理結(jié)束。
[0222]以這種方式,編碼裝置11將作為關(guān)于每個(gè)層中揚(yáng)聲器的布置的信息的揚(yáng)聲器布置信息插入到編碼比特流中,并且輸出編碼音頻數(shù)據(jù)。同樣地,當(dāng)使用關(guān)于在垂直方向上的揚(yáng)聲器的布置的信息時(shí),除了可以對(duì)平面內(nèi)的聲音圖像進(jìn)行再現(xiàn)之外還可以對(duì)在垂直方向上的聲音圖像進(jìn)行再現(xiàn)。因此,可以對(duì)更具真實(shí)感的聲音進(jìn)行再現(xiàn)。
[0223][解碼裝置的示例結(jié)構(gòu)]
[0224]接下來(lái),將描述接收從編碼裝置11所輸出的編碼比特流并且對(duì)編碼比特流進(jìn)行解碼的解碼裝置。
[0225]圖24是示出解碼裝置的結(jié)構(gòu)的示例的圖。解碼裝置51包括分離單元61、解碼單元62、以及輸出單元63。
[0226]分離單元61接收從編碼裝置11所傳送的編碼比特流,針對(duì)編碼比特流執(zhí)行比特解包(bit unpacking),以及將解包后的編碼比特流提供給解碼單元62。
[0227]例如,解碼單元62對(duì)從分離單元61所提供的編碼比特流(即,每個(gè)通道的音頻數(shù)據(jù)或揚(yáng)聲器布置信息)進(jìn)行解碼,并且將解碼音頻數(shù)據(jù)提供給輸出單元63。例如,如果需要,解碼單元62對(duì)音頻數(shù)據(jù)進(jìn)行降混。
[0228]輸出單元63基于由解碼單元62所指定的揚(yáng)聲器的布置(揚(yáng)聲器映射)將從解碼單元62所提供的音頻數(shù)據(jù)輸出。將從輸出單元63所輸出的每個(gè)通道的音頻數(shù)據(jù)提供給每個(gè)通道的揚(yáng)聲器,并且然后對(duì)其進(jìn)行再現(xiàn)。
[0229][解碼操作的說(shuō)明]
[0230]接下來(lái),將參照?qǐng)D25所示的流程圖描述解碼裝置51的解碼處理。
[0231]在步驟S41中,解碼單元62對(duì)音頻數(shù)據(jù)進(jìn)行解碼。
[0232]S卩,分離單元61接收從編碼裝置11所傳送的編碼比特流,并且針對(duì)編碼比特流執(zhí)行比特解包。然后,分離單元61將通過比特解包所獲得的音頻數(shù)據(jù)和諸如揚(yáng)聲器布置信息的各種信息提供給解碼單元62。解碼單元62對(duì)從分離單元61所提供的音頻數(shù)據(jù)進(jìn)行解碼,并且將解碼音頻數(shù)據(jù)提供給輸出單元63。
[0233]在步驟S42中,解碼單元62在從分離單元61所提供的信息中檢測(cè)同步字。具體地,從圖4所不的“height_extension_element”中檢測(cè)同步字。[0234]在步驟S43中,解碼單元62確定是否檢測(cè)到同步字。當(dāng)在步驟S43中確定檢測(cè)到同步字時(shí),解碼單元62在步驟S44中對(duì)揚(yáng)聲器布置信息進(jìn)行解碼。
[0235]S卩,解碼單兀62從圖4所不的“height_extension_element”中讀出諸如“front_element_height_info [i],,、“side_element_heigth_info[i] ”、 以 及 “back_element_height_info[i] ”的信息。以這種方式,可以找到可以以高質(zhì)量對(duì)每個(gè)音頻數(shù)據(jù)進(jìn)行再現(xiàn)的揚(yáng)聲器的位置(通道)。
[0236]在步驟S45中,解碼單元62生成標(biāo)識(shí)信息。即,解碼單元62基于在“height_extension_element,,中的 “PCE_HEIGHT_EXTENSION_SYNC” 與 “byte_alignment () ” 之間所讀出的信息(即,同步字、揚(yáng)聲器布置信息、以及字節(jié)對(duì)齊)來(lái)計(jì)算CRC校驗(yàn)碼,并且獲得標(biāo)識(shí)信息。
[0237]在步驟S46中,解碼單元62將在步驟S45中所生成的標(biāo)識(shí)信息與在圖4所示的“height_extension_element” 的 “height_info_crc_check” 中所包括的標(biāo)識(shí)信息進(jìn)行比較,并且確定標(biāo)識(shí)信息是否彼此相同。
[0238]當(dāng)在步驟S46中確定標(biāo)識(shí)信息彼此相同時(shí),解碼單元62將解碼音頻數(shù)據(jù)提供給輸出單元63,并且基于所獲得的揚(yáng)聲器布置信息指示音頻數(shù)據(jù)的輸出。然后,處理繼續(xù)到步驟S47。
[0239]在步驟S47中,輸出單元63基于由解碼單元62所指示的揚(yáng)聲器布置(揚(yáng)聲器映射)將從解碼單元62所提供的音頻數(shù)據(jù)輸出。然后,解碼處理結(jié)束。
[0240]另一方面,當(dāng)在步驟S43中確定未檢測(cè)到同步字時(shí),或當(dāng)在步驟S46中確定標(biāo)識(shí)信息彼此不同時(shí),輸出單元63在步驟S48中基于預(yù)定的揚(yáng)聲器布置輸出音頻數(shù)據(jù)。
[0241]即,當(dāng)從“height_extension_element”正確地讀出揚(yáng)聲器布置信息時(shí),執(zhí)行步驟S48中的處理。在這種情況下,解碼單元62將音頻數(shù)據(jù)提供給輸出單元63,并且指示音頻數(shù)據(jù)的輸出,以使得由每個(gè)預(yù)定通道的揚(yáng)聲器對(duì)每個(gè)通道的音頻數(shù)據(jù)進(jìn)行再現(xiàn)。然后,輸出單元63響應(yīng)于來(lái)自解碼單元62的指示輸出音頻數(shù)據(jù),并且解碼處理結(jié)束。
[0242]以這種方式,解碼裝置51對(duì)在編碼比特流中所包括的音頻數(shù)據(jù)或揚(yáng)聲器布置信息進(jìn)行解碼,并且基于揚(yáng)聲器布置信息輸出音頻數(shù)據(jù)。因?yàn)閾P(yáng)聲器布置信息包括關(guān)于在垂直方向上的揚(yáng)聲器布置的信息,所以除了可以對(duì)在平面內(nèi)的聲音圖像進(jìn)行再現(xiàn)之外還可以對(duì)在垂直方向上的聲音圖像進(jìn)行再現(xiàn)。因此,可以對(duì)更具真實(shí)感的聲音進(jìn)行再現(xiàn)。
[0243]具體地,當(dāng)對(duì)音頻數(shù)據(jù)進(jìn)行解碼時(shí),例如,如果需要,還可以執(zhí)行對(duì)音頻數(shù)據(jù)進(jìn)行降混的處理。
[0244]在這種情況下,例如,當(dāng)圖6所示的“MPEG4輔助數(shù)據(jù)”的“ancillary_data_status (),,中的“ancillary_data_extension_status,,為“ 1,,時(shí),解碼單兀 62 讀出 “MPEG4_ext_ancillary_data() ”。然后,解碼單兀 62 讀出圖 11 所不的 “MPEG4_ext_ancillary_data() ”中所包括的每個(gè)信息,并且執(zhí)行音頻數(shù)據(jù)降混處理或增益校正處理。
[0245]例如,解碼單元62將7.1通道或6.1通道的音頻數(shù)據(jù)降混到5.1通道的音頻數(shù)據(jù),或進(jìn)一步將5.1通道的音頻數(shù)據(jù)降混到2通道的音頻數(shù)據(jù)。
[0246]在這種情況下,如果需要,解碼單元62使用LFE通道的音頻數(shù)據(jù)用于降混。參照?qǐng)D 13 所不的“ext_downmixing_levels () ”或圖 16 所不的“ext_downmixing_lfe_level () ”確定與每個(gè)通道相乘的系數(shù)。另外,參照?qǐng)D15所示的“ext_downmixing_global_gains () ”執(zhí)行降混期間的增益校正。
[0247][編碼裝置的示例結(jié)構(gòu)]
[0248]接下來(lái),將描述以上提及的編碼裝置和解碼裝置的詳細(xì)結(jié)構(gòu)的示例以及這些裝置的詳細(xì)操作。
[0249]圖26是示出了編碼裝置的詳細(xì)結(jié)構(gòu)的示例的圖。
[0250]編碼裝置91包括輸入單元21、編碼單元22、以及打包單元23。在圖26中,采用相同的附圖標(biāo)記表示與圖22所示的那些組件相對(duì)應(yīng)的組件,并且將不再重復(fù)對(duì)其的說(shuō)明。
[0251]編碼單元22包括PCE編碼單元101、DSE編碼單元102、以及音頻要素(element)編碼單元103。
[0252]PCE編碼單元101基于從輸入單元21所提供的信息對(duì)PCE進(jìn)行編碼。即,如果需要,PCE編碼單元101在對(duì)每個(gè)信息進(jìn)行編碼的同時(shí)生成要存儲(chǔ)在PCE中的每個(gè)信息。PCE編碼單元101包括同步字編碼單元111、布置信息編碼單元112、以及標(biāo)識(shí)信息編碼單元113。
[0253]同步字編碼單元111對(duì)同步字進(jìn)行編碼,并且使用編碼同步字作為要存儲(chǔ)在PCE的注釋區(qū)域中所包括的擴(kuò)展區(qū)域中的信息。布置信息編碼單元112對(duì)指示用于每個(gè)音頻數(shù)據(jù)的揚(yáng)聲器的高度(層)的并且從輸入單元21所提供的揚(yáng)聲器布置信息進(jìn)行編碼,以及使用編碼揚(yáng)聲器布置信息作為要存儲(chǔ)在注釋區(qū)域的擴(kuò)展區(qū)域中的信息。
[0254]標(biāo)識(shí)信息編碼單元113對(duì)標(biāo)識(shí)信息進(jìn)行編碼。例如,如果需要,標(biāo)識(shí)信息編碼單元113基于同步字和揚(yáng)聲器布置信息生成CRC校驗(yàn)碼作為標(biāo)識(shí)信息,并且使用CRC校驗(yàn)碼作為要存儲(chǔ)在注釋區(qū)域的擴(kuò)展區(qū)域中的信息。
[0255]DSE編碼單元102基于從輸入單元21所提供的信息對(duì)DSE進(jìn)行編碼。即,如果需要,DSE編碼單元102在對(duì)每個(gè)信息進(jìn)行編碼的同時(shí)生成要存儲(chǔ)在DSE中的每個(gè)信息。DSE編碼單元102包括擴(kuò)展信息編碼單元114和降混信息編碼單元115。
[0256]擴(kuò)展信息編碼單元114對(duì)指示在作為DSE的擴(kuò)展區(qū)域的“MPEG4_ext_ancillary_data() ”中是否包括擴(kuò)展信息的信息(標(biāo)志)進(jìn)行編碼。降混信息編碼單元115對(duì)關(guān)于音頻數(shù)據(jù)的降混的信息進(jìn)行編碼。音頻要素編碼單元103對(duì)從輸入單元21所提供的音頻數(shù)據(jù)進(jìn)行編碼。
[0257]編碼單元22將通過對(duì)每個(gè)類型的數(shù)據(jù)進(jìn)行編碼所獲得的、要被存儲(chǔ)在每個(gè)要素中的信息提供給打包單元23。
[0258][編碼處理的說(shuō)明]
[0259]接下來(lái),將參照?qǐng)D27所示的流程圖描述編碼裝置91的編碼處理。該編碼處理比參照?qǐng)D23所示的流程圖所描述的處理更加詳細(xì)。
[0260]在步驟S71中,輸入單元21獲取音頻數(shù)據(jù)和對(duì)音頻數(shù)據(jù)進(jìn)行編碼所需要的信息,并且將音頻數(shù)據(jù)和信息提供給編碼單元22。
[0261]例如,輸入單元21獲取作為音頻數(shù)據(jù)的每個(gè)通道的脈沖編碼調(diào)制(PCM)數(shù)據(jù)、指示每個(gè)通道揚(yáng)聲器的布置的信息、用于指定降混系數(shù)的信息、以及指示編碼比特流的比特率的信息。在此,用于指定降混系數(shù)的信息是指示在從7.1通道或6.1通道到5.1通道的降混以及從5.1通道到2通道的降混期間與每個(gè)通道的音頻數(shù)據(jù)相乘的系數(shù)的信息。
[0262]另外,輸入單元21獲取要獲得的編碼比特流的文件名稱。該文件名稱由編碼裝置適當(dāng)?shù)厥褂谩?br> [0263]在步驟S72中,音頻要素編碼單元103對(duì)從輸入單元21所提供的音頻數(shù)據(jù)進(jìn)行編碼,并且編碼音頻數(shù)據(jù)被存儲(chǔ)在諸如SCE、CPE、以及LFE的每個(gè)要素中。在這種情況下,以由從輸入單元21提供給編碼單元22的比特率和除了音頻數(shù)據(jù)之外的信息的碼數(shù)量所確定的比特率對(duì)音頻數(shù)據(jù)進(jìn)行編碼。
[0264]例如,要對(duì)C通道或Cs通道的音頻數(shù)據(jù)進(jìn)行編碼,并且將其存儲(chǔ)在SCE中。要對(duì)L通道或R通道的音頻數(shù)據(jù)進(jìn)行編碼,并且將其存儲(chǔ)在CPE中。另外,要對(duì)LFE通道的音頻數(shù)據(jù)進(jìn)行編碼,并且將其存儲(chǔ)在LFE中。
[0265]在步驟S73中,同步字編碼單元111基于從輸入單元21所提供的信息對(duì)同步字進(jìn)行編碼,并且編碼同步字是要存儲(chǔ)在圖4所示的“height_extension_element”的“PCE_HEIGHT_EXTENSION_SYNC” 中的信息。
[0266]在步驟S74中,布置信息編碼單元112對(duì)從輸入單元21所提供的每個(gè)音頻數(shù)據(jù)的揚(yáng)聲器布置信息進(jìn)行編碼。
[0267]以打包單元23中的聲音源位置,即以與揚(yáng)聲器的布置相對(duì)應(yīng)的順序,將編碼揚(yáng)聲器布置信息存儲(chǔ)在“height_extension_element”中。即,將指示由布置在用戶前方的揚(yáng)聲器所再現(xiàn)的每個(gè)通道的揚(yáng)聲器高度(聲音源的高度)的揚(yáng)聲器布置信息存儲(chǔ)為“height_extension_element” 中的 “front_element_height_info [i] ”。
[0268]另外,在“front_element_height_info[i] ”之后,將指示由布置在用戶側(cè)方的揚(yáng)聲器所再現(xiàn)的每個(gè)通道的揚(yáng)聲器高度的揚(yáng)聲器布置信息存儲(chǔ)為“height_extenSi0n_element” 中的“side_element_height_info[i]”。然后,在“side_element_height_info [i] ”之后,將指示由布置在用戶后方的揚(yáng)聲器所再現(xiàn)的每個(gè)通道的揚(yáng)聲器高度的揚(yáng)聲器布置信息存儲(chǔ)為 “height_extension_element,,中的 “back_element_height_info [i] ”。
[0269]在步驟S75中,標(biāo)識(shí)彳目息編碼單兀113對(duì)標(biāo)識(shí)/[目息進(jìn)行編碼。例如,如果需要,標(biāo)識(shí)信息編碼單元113基于同步字和揚(yáng)聲器布置信息生成CRC校驗(yàn)碼作為標(biāo)識(shí)信息。CRC校驗(yàn)碼是要存儲(chǔ)在“height_extension_element%9“height_info_crc_check”* 的信息。同步字和CRC校驗(yàn)碼是用于標(biāo)識(shí)在編碼比特流中是否存在揚(yáng)聲器布置信息的信息。
[0270]另外,標(biāo)識(shí)信息編碼單元113生成指示執(zhí)行字節(jié)對(duì)齊的信息作為要存儲(chǔ)在“height_extension_element” 的 “byte_alignment () ” 中的信息。標(biāo)識(shí)信息編碼單元113生成指示對(duì)標(biāo)識(shí)信息進(jìn)行比較的信息作為要存儲(chǔ)在“height_extension_element”的“if (crc_cal () ! =height_info_crc_check) ” 中的信息。
[0271]通過從步驟S73至步驟S75的處理,生成要存儲(chǔ)在PCE的注釋區(qū)域中所包括的擴(kuò)展區(qū)域(即,“height_extension_element”)中的信息。
[0272]在步驟S76中,PCE編碼單元101例如基于從輸入單元21所提供的信息或在擴(kuò)展區(qū)域中所存儲(chǔ)的所生成的信息,對(duì)PCE進(jìn)行編碼。
[0273]例如,PCE編碼單元101生成指示由前方、側(cè)方以及后方的揚(yáng)聲器所再現(xiàn)的通道數(shù)量的信息、或指示每個(gè)音頻數(shù)據(jù)屬于C、L、以及R通道中的哪個(gè)的信息作為要存儲(chǔ)在PCE中的信息。
[0274]在步驟S77中,擴(kuò)展信息編碼單元114基于從輸入單元21所提供的信息、對(duì)指示在DSE的擴(kuò)展區(qū)域中是否包括擴(kuò)展信息的信息進(jìn)行編碼,并且編碼信息要存儲(chǔ)在圖8所不的 “ancillary_data_status () ” 的 “ancillary_data_extension_status” 中。例如,“0”或“ 1 ”作為指示是否包括擴(kuò)展信息的信息、即指示是否存在擴(kuò)展信息的信息,要存儲(chǔ)在“ancillary_data_extension_status,,中。
[0275]在步驟S78中,降混信息編碼單元115基于從輸入單元21所提供的信息來(lái)對(duì)關(guān)于音頻數(shù)據(jù)的降混的信息進(jìn)行編碼。
[0276]例如,降混信息編碼單元115對(duì)于用于指定從輸入單元21所提供的降混系數(shù)的信息進(jìn)行編碼。具體地,降混信息編碼單元115對(duì)指示在從5.1通道到2通道的降混期間與每個(gè)通道的音頻數(shù)據(jù)相乘的系數(shù)的信息進(jìn)行編碼,并且要作為在圖9所示的“downmiXing_levels_MPEG4()” 中所存儲(chǔ)的“center_mix_level_value” 和“surround_mix_level_value,,。
[0277]另外,降混信息編碼單元115對(duì)指示在從5.1通道到2通道的降混期間與LFE通道的音頻數(shù)據(jù)相乘的系數(shù)的信息進(jìn)行編碼,并且要作為在圖16所示的“eXt_d0WnmiXing_lfe_level () ”中所存儲(chǔ)的“dmix_lfe_idx”。類似地,降混信息編碼單元115對(duì)從輸入單元21所提供的指示降混到2通道的過程的信息進(jìn)行編碼,并且要作為在圖7所示的“bs_info () ” 中所存儲(chǔ)的 “pseudo_surround_enable,,。
[0278]降混信息編碼單元115對(duì)指示在從7.1通道或6.1通道到5.1通道的降混期間與每個(gè)通道的音頻數(shù)據(jù)相乘的系數(shù)的信息進(jìn)行編碼,并且要作為圖13所示的“ext_downmixing_levels” 中所存儲(chǔ)的 “dmix_a_idx” 和 “dmix_b_idx”。
[0279]降混信息編碼單元115對(duì)指示在從5.1通道到2通道的降混期間是否使用LFE通道的信息進(jìn)行編碼。編碼信息要被存儲(chǔ)在作為擴(kuò)展區(qū)域的圖11所示的“eXt_anCillary_data_status () ” 中所包括的圖 12 所不的 “ext_downmixing_lfe_level_status” 中。
[0280]降混信息編碼單元115對(duì)在降混期間用于增益調(diào)整所需要的信息進(jìn)行編碼。編碼信息要被存儲(chǔ)在圖 11 所不的 “MPEG4_ext_ancillary_data() ” 中的 “ext_downmixing_global_gains,,中。
[0281]在步驟S79中,DSE編碼單元102基于從輸入單元21所提供的信息或所生成的關(guān)于降混的信息來(lái)對(duì)DSE進(jìn)行編碼。
[0282]通過以上所提及的處理獲得了在諸如PCE、SCE、CPE、LFE、以及DSE的每個(gè)要素中要存儲(chǔ)的信息。編碼單元22將要存儲(chǔ)在每個(gè)要素中的信息提供給打包單元23。另外,如果需要,編碼單元22生成諸如“頭數(shù)據(jù)/邊信息”、“FIL (DRC)”、以及“FIL (END)”的要素,并且將所生成的要素提供給打包單元23。
[0283]在步驟S80中,打包單元23針對(duì)從編碼單元22所提供的音頻數(shù)據(jù)或揚(yáng)聲器布置信息執(zhí)行比特打包、以生成圖3所示的編碼比特流,并且輸出編碼比特流。例如,打包單元23將從編碼單元22所提供的信息存儲(chǔ)在PCE或DSE中以生成編碼比特流。當(dāng)輸出編碼比特流時(shí),編碼處理結(jié)束。
[0284]以這種方式,編碼裝置91將例如揚(yáng)聲器布置信息、關(guān)于降混的信息、以及指示在擴(kuò)展區(qū)域中是否包括擴(kuò)展信息的信息插入到編碼比特流中,并且輸出編碼音頻數(shù)據(jù)。同樣地,當(dāng)將揚(yáng)聲器布置信息和關(guān)于降混的信息存儲(chǔ)在編碼比特流中時(shí),可以在編碼比特流的解碼側(cè)獲得高質(zhì)量真實(shí)感的聲音。
[0285]例如,當(dāng)將關(guān)于在垂直方向上揚(yáng)聲器的布置的信息存儲(chǔ)在編碼比特流中時(shí),在解碼側(cè),可以對(duì)在平面內(nèi)的聲音圖像以及在垂直方向上的聲音圖像進(jìn)行再現(xiàn)。因此,可以對(duì)真實(shí)感的聲音進(jìn)行再現(xiàn)。
[0286]另外,為了標(biāo)識(shí)在注釋區(qū)域的擴(kuò)展區(qū)域中所存儲(chǔ)的信息是揚(yáng)聲器布置信息還是諸如其他注釋的文本信息,編碼比特流包括用于標(biāo)識(shí)揚(yáng)聲器布置信息的多個(gè)標(biāo)識(shí)信息(標(biāo)識(shí)碼)。在本實(shí)施例中,編碼比特流包括緊接揚(yáng)聲器布置信息之前而布置的同步字以及由諸如揚(yáng)聲器布置信息的所存儲(chǔ)的信息的內(nèi)容所確定的CRC校驗(yàn)碼作為標(biāo)識(shí)信息。
[0287]當(dāng)在編碼比特流中包括兩個(gè)標(biāo)識(shí)信息時(shí),可以可靠地指定在編碼比特流中所包括的信息是否是揚(yáng)聲器布置信息。作為結(jié)果,可以使用所獲得的揚(yáng)聲器布置信息獲得高質(zhì)量真實(shí)感的聲音。
[0288]另外,在編碼比特流中,在DSE中包括“pseudo_surround_enable”作為用于對(duì)音頻數(shù)據(jù)進(jìn)行降混的信息。此信息使得可以將多個(gè)方法中的任一個(gè)指定為將通道從5.1通道降混到2通道的方法。因此,可以在解碼側(cè)改進(jìn)音頻數(shù)據(jù)的靈活性。
[0289]具體地,在本實(shí)施例中,作為將通道從5.1通道降混到2通道的方法,存在使用表達(dá)式(1)的方法和使用表達(dá)式(2)的方法。例如,在解碼側(cè),通過降混所獲得的2通道的音頻數(shù)據(jù)被傳送到再現(xiàn)裝置,并且再現(xiàn)裝置將2通道的音頻數(shù)據(jù)轉(zhuǎn)換為5.1通道的音頻數(shù)據(jù),以及對(duì)所轉(zhuǎn)換的音頻數(shù)據(jù)進(jìn)行再現(xiàn)。
[0290]在這種情況下,在使用表達(dá)式(1)的方法和使用表達(dá)式(2)的方法中,不太可能從根據(jù)兩個(gè)方法中的任一個(gè)所獲得的音頻數(shù)據(jù)獲得對(duì)5.1通道的最終音頻數(shù)據(jù)進(jìn)行再現(xiàn)時(shí)預(yù)先假定的適當(dāng)?shù)穆晫W(xué)效果。
[0291 ] 然而,在由編碼裝置91所獲得的編碼比特流中,可以由“pseudo_surround_enable”來(lái)指定能夠在解碼側(cè)獲得所假定的聲學(xué)效果的降混方法。因此,可以在解碼側(cè)獲得
高質(zhì)量真實(shí)感的聲音。
[0292]另外,在編碼比特流中,將指示是否包括擴(kuò)展信息的信息(標(biāo)志)存儲(chǔ)在“ancillary_data_extension_status”中。因此,可以參照此信息,指定在作為擴(kuò)展區(qū)域的“MPEG4_ext_ancillary_data() ” 中是否包括擴(kuò)展信息。
[0293]例如,在本示例中,如果需要,將“ext_ancillary_data_status () ”、“ext_downmixing_levels () ”、“ext_downmixing_global_gains,,、以及 “ext_downmixing_lfe_level () ”作為擴(kuò)展信息存儲(chǔ)在擴(kuò)展區(qū)域中。
[0294]當(dāng)可以獲得擴(kuò)展信息時(shí),可以改進(jìn)音頻數(shù)據(jù)的降混的靈活性,并且在解碼側(cè)可以獲得各種音頻數(shù)據(jù)。作為結(jié)果,可以獲得高質(zhì)量真實(shí)感的聲音。
[0295][解碼裝置的示例結(jié)構(gòu)]
[0296]接下來(lái),將描述解碼裝置的詳細(xì)結(jié)構(gòu)。
[0297]圖28是示出解碼裝置的詳細(xì)結(jié)構(gòu)的示例的圖。在圖28中,采用相同的附圖標(biāo)記表示與圖24所示的那些組件相對(duì)應(yīng)的組件,并且將不再重復(fù)對(duì)其的說(shuō)明。
[0298]解碼裝置41包括分離單元61、解碼單元62、切換單元51、降混處理單元152、以及輸出單元63。
[0299]分離單元61接收從編碼裝置91所輸出的編碼比特流,對(duì)編碼比特流進(jìn)行解包、以及將編碼比特流提供給解碼單元62。另外,分離單元61獲取降混形式參數(shù)和音頻數(shù)據(jù)的文件名稱。[0300]降混形式參數(shù)是在解碼裝置141中指示編碼比特流中所包括的音頻數(shù)據(jù)的降混形式的信息。例如,作為降混形式參數(shù),包括:指示從7.1通道或6.1通道到5.1通道的降混的信息、指示從7.1通道或6.1通道到2通道的降混的信息、指示從5.1通道到2通道的降混的信息、或指示未執(zhí)行降混的信息。
[0301]將由分離單元61所獲取的降混形式參數(shù)提供給切換單元51和降混處理單元152。另外,在解碼裝置141中適當(dāng)?shù)厥褂糜煞蛛x單元61所獲取的文件名稱。
[0302]解碼單元62對(duì)從分離單元61所提供的編碼比特流進(jìn)行解碼。解碼單元62包括PCE解碼單元161、DSE解碼單元162、以及音頻要素解碼單元163。
[0303]PCE解碼單元161對(duì)在編碼比特流中所包括的PCE進(jìn)行解碼,并且將通過解碼所獲得的信息提供給降混處理單元152和輸出單元63。PCE解碼單元161包括同步字檢測(cè)單元171和標(biāo)識(shí)信息計(jì)算單元172。
[0304]同步字檢測(cè)單元171從PCE的注釋區(qū)域中的擴(kuò)展區(qū)域中檢測(cè)同步字,并且讀出同步字。標(biāo)識(shí)信息計(jì)算單元172基于從PCE的注釋區(qū)域中的擴(kuò)展區(qū)域中所讀出的信息來(lái)計(jì)算標(biāo)識(shí)信息。
[0305]DSE解碼單元162對(duì)在編碼比特流中所包括的DSE進(jìn)行解碼,并且將通過解碼所獲得的信息提供給降混處理單元152。DSE解碼單元162包括擴(kuò)展檢測(cè)單元173和降混信息解碼單元174。
[0306]擴(kuò)展檢測(cè)單元173檢測(cè)在DSE的“MPEG4_ancillary_data() ”中是否包括擴(kuò)展信息。降混信息解碼單元174對(duì)在DSE中所包括的關(guān)于降混的信息進(jìn)行解碼。
[0307]音頻要素解碼單元163對(duì)在編碼比特流中所包括的音頻數(shù)據(jù)進(jìn)行解碼,并且將音頻數(shù)據(jù)提供給切換單元151。
[0308]切換單元151基于從分離單元61所提供的降混形式參數(shù),將從解碼單元62所提供的音頻數(shù)據(jù)的輸出目的地改變?yōu)榻祷焯幚韱卧?52或輸出單元63。
[0309]降混處理單元152基于來(lái)自分離單元61的降混形式參數(shù)和來(lái)自解碼單元62的信息對(duì)從切換單元151所提供的音頻數(shù)據(jù)進(jìn)行降混,并且將降混后的音頻數(shù)據(jù)提供給輸出單元63。
[0310]輸出單元63基于從解碼單元62所提供的信息、輸出從切換單元151或降混處理單元152所提供的音頻數(shù)據(jù)。輸出單元63包括重排處理單元181。重排處理單元181基于從PCE解碼單元161所提供的信息對(duì)從切換單元151所提供的音頻數(shù)據(jù)進(jìn)行重排,并且輸出音頻數(shù)據(jù)。
[0311 ][降混處理單元的結(jié)構(gòu)的示例]
[0312]圖29示出了圖28所示的降混處理單元152的詳細(xì)結(jié)構(gòu)。S卩,降混處理單元152包括切換單元211、切換單元212、降混單元213-1至213-4、切換單元214、增益調(diào)整單元215、切換單元216、降混單元217-1、降混單元217-2、以及增益調(diào)整單元218。
[0313]切換單元211將從切換單元151所提供的音頻數(shù)據(jù)提供給切換單元212或切換單元216。例如,當(dāng)音頻數(shù)據(jù)是7.1通道或6.1通道的數(shù)據(jù)時(shí)、音頻數(shù)據(jù)的輸出目的地是切換單元212,并且當(dāng)音頻數(shù)據(jù)是5.1通道的數(shù)據(jù)時(shí)、音頻數(shù)據(jù)的輸出目的地是切換單元216。
[0314]切換單元212將從切換單元211所提供的音頻數(shù)據(jù)提供給降混單元213_1至降混單元213-4中的任一個(gè)。例如,當(dāng)音頻數(shù)據(jù)是6.1通道的數(shù)據(jù)時(shí),切換單元212將音頻數(shù)據(jù)輸出到降混單元213-1。
[0315]當(dāng)音頻數(shù)據(jù)是通道L、Lc、C、Rc、R、Ls、Rs、以及LFE的數(shù)據(jù)時(shí),切換單元212將來(lái)自切換單元211的音頻數(shù)據(jù)提供給降混單元213-2。當(dāng)音頻數(shù)據(jù)是通道L、R、C、Ls、Rs、Lrs、Rrs、以及LFE的數(shù)據(jù)時(shí),切換單元212將來(lái)自切換單元211的音頻數(shù)據(jù)提供給降混單兀 213_3。
[0316]當(dāng)音頻數(shù)據(jù)是通道L、R、C、Ls、Rs、Lvh、Rvh、以及LFE的數(shù)據(jù)時(shí),切換單元212將來(lái)自切換單元211的音頻數(shù)據(jù)提供給降混單元213-4。
[0317]降混單元213-1至降混單元213-4將從切換單元212所提供的音頻數(shù)據(jù)降混為
5.1通道的音頻數(shù)據(jù),并且將音頻數(shù)據(jù)提供給切換單元214。在下文中,當(dāng)降混單元213-4至213-4不需要彼此特別地區(qū)分時(shí),其被簡(jiǎn)稱為降混單元213。
[0318]切換單元214將從降混單元213所提供的音頻數(shù)據(jù)提供給增益調(diào)整單元215或切換單元216。例如,當(dāng)在編碼比特流中所包括的音頻數(shù)據(jù)被降混到5.1通道的音頻數(shù)據(jù)時(shí),切換單元214將音頻數(shù)據(jù)提供給增益調(diào)整單元215。另一方面,當(dāng)在編碼比特流中所包括的音頻數(shù)據(jù)被降混到2通道的音頻數(shù)據(jù)時(shí),切換單元214將音頻數(shù)據(jù)提供給切換單元216。
[0319]增益調(diào)整單元215對(duì)從切換單元214所提供的音頻數(shù)據(jù)的增益進(jìn)行調(diào)整,并且將音頻數(shù)據(jù)提供給輸出單元63。
[0320]切換單元216將從切換單元211或切換單元214所提供的音頻數(shù)據(jù)提供給降混單元217-1或降混單元217-2。例如,切換單元216依賴于在編碼比特流的DSE中所包括的“pseudo_surround_enable”的值來(lái)改變音頻數(shù)據(jù)的輸出目的地。
[0321]降混單元217-1和降混單元217-2將從切換單元216所提供的音頻數(shù)據(jù)降混到2通道的數(shù)據(jù),并且將數(shù)據(jù)提供給增益調(diào)整單元218。在下文中,當(dāng)降混單元217-1和降混單元217-2不需要彼此特別地區(qū)分時(shí),其被簡(jiǎn)稱為降混單元217。
[0322]增益調(diào)整單元218對(duì)從降混單元217所提供的音頻數(shù)據(jù)的增益進(jìn)行調(diào)整,并且將音頻數(shù)據(jù)提供給輸出單元63。
[0323][降混單元的結(jié)構(gòu)的示例]
[0324]接下來(lái),將描述圖29所示的降混單元213和降混單元217的詳細(xì)結(jié)構(gòu)的示例。
[0325]圖30是示出圖29所示的降混單元213_1的結(jié)構(gòu)的示例的圖。
[0326]降混單元213-1包括輸入端子241-1至241-7、乘法單元242至244、加法單元245、加法單元246、以及輸出端子247-1至247-6。
[0327]將通道L、R、C、Ls、Rs、Cs、以及LFE的音頻數(shù)據(jù)從切換單元212提供給輸入端子241-1 至 241-7。
[0328]輸入端子241-1至241-3將從切換單元212所提供的音頻數(shù)據(jù)通過輸出端子247-1至247-3提供給切換單元214,而不對(duì)音頻數(shù)據(jù)進(jìn)行任何改變。即,對(duì)被提供給降混單元213-1的通道L、R、以及C的音頻數(shù)據(jù)進(jìn)行降混,并且將其作為降混之后的通道L、R、以及C的音頻數(shù)據(jù)輸出到下一階段。
[0329]輸入端子241-4至241_6將從切換單元212所提供的音頻數(shù)據(jù)提供給乘法單元242至244。乘法單元242將從輸入端子241-4所提供的音頻數(shù)據(jù)與降混系數(shù)相乘,并且將音頻數(shù)據(jù)提供給加法單元245。
[0330]乘法單元243將從輸入端子241-5所提供的音頻數(shù)據(jù)與降混系數(shù)相乘,并且將音頻數(shù)據(jù)提供給加法單元246。乘法單元244將從輸入端子241-6所提供的音頻數(shù)據(jù)與降混系數(shù)相乘,并且將音頻數(shù)據(jù)提供給加法單元245和加法單元246。
[0331]加法單元245將從乘法單元242所提供的音頻數(shù)據(jù)與從乘法單元244所提供的音頻數(shù)據(jù)相加,并且將相加后的音頻數(shù)據(jù)提供給輸出端子247-4。輸出端子247-4將從加法單元245所提供的音頻數(shù)據(jù)作為降混之后的Ls通道的音頻數(shù)據(jù)提供給切換單元214。
[0332]加法單元246將從乘法單元243所提供的音頻數(shù)據(jù)與從乘法單元244所提供的音頻數(shù)據(jù)相加,并且將相加后的音頻數(shù)據(jù)提供給輸出端子247-5。輸出端子247-5將從加法單元246所提供的音頻數(shù)據(jù)作為降混之后的Rs通道的音頻數(shù)據(jù)提供給切換單元214。
[0333]輸入端子241-7將從切換單元212所提供的音頻數(shù)據(jù)通過輸出端子247_6提供給切換單元214,而不對(duì)音頻數(shù)據(jù)進(jìn)行任何改變。即,將被提供給降混單元213-1的LFE通道的音頻數(shù)據(jù)作為降混之后的LFE通道的音頻數(shù)據(jù)輸出到下一階段,而不進(jìn)行任何改變。
[0334]在下文中,當(dāng)輸入端子241-1至241-7不需要彼此特別地區(qū)分時(shí),其被簡(jiǎn)稱為輸入端子241。當(dāng)輸出端子247-1至247-6不需要彼此特別地區(qū)分時(shí),其被簡(jiǎn)稱為輸出端子247。
[0335]同樣地,在降混單元213-1中,執(zhí)行與使用以上提及的表達(dá)式(6)進(jìn)行的計(jì)算相對(duì)應(yīng)的處理。
[0336]圖31是示出圖29所示的降混單元213_2的結(jié)構(gòu)的示例的圖。
[0337]降混單元213-2包括輸入端子271-1至271-8、乘法單元272至275、加法單元276、加法單元277、加法單元278、以及輸出端子279-1至279-6。
[0338]將通道L、Lc、C、Rc、R、Ls、Rs、以及LFE的音頻數(shù)據(jù)從切換單元212分別地提供給輸入端子271-1至271-8。
[0339]輸入端子271-1至271-5將從切換單元212所提供的音頻數(shù)據(jù)分別地提供給加法單元276、乘法單元272和273、加法單元277、乘法單元274和275、以及加法單元278。
[0340]乘法單元272和乘法單元273將從輸入端子271_2所提供的音頻數(shù)據(jù)與降混系數(shù)相乘,并且將音頻數(shù)據(jù)分別地提供給加法單元276和加法單元277。乘法單元274和乘法單元275將從輸入端子271-4所提供的音頻數(shù)據(jù)與降混系數(shù)相乘,并且將音頻數(shù)據(jù)分別地提供給加法單元277和加法單元278。
[0341]加法單元276將從輸入端子271-1所提供的音頻數(shù)據(jù)與從乘法單元272所提供的音頻數(shù)據(jù)相加,并且將相加后的音頻數(shù)據(jù)提供給輸出端子279-1。輸出端子279-1將從加法單元276所提供的音頻數(shù)據(jù)作為降混之后L通道的音頻數(shù)據(jù)提供給切換單元214。
[0342]加法單元277將從輸入端子271-3所提供的音頻數(shù)據(jù)、從乘法單元273所提供的音頻數(shù)據(jù)、以及從乘法單元274所提供的音頻數(shù)據(jù)相加,并且將相加后的音頻數(shù)據(jù)提供給輸出端子279-2。輸出端子279-2將從加法單元277所提供的音頻數(shù)據(jù)作為降混之后C通道的音頻數(shù)據(jù)提供給切換單元214。
[0343]加法單元278將從輸入端子271-5所提供的音頻數(shù)據(jù)與從乘法單元275所提供的音頻數(shù)據(jù)及相加,并且將相加后的音頻數(shù)據(jù)提供給輸出端子279-3。輸出端子279-3將從加法單元278所提供的音頻數(shù)據(jù)作為降混之后R通道的音頻數(shù)據(jù)提供給切換單元214。
[0344]輸入端子271-6至271_8將從切換單元212所提供的音頻數(shù)據(jù)通過輸出端子279-4至279-6提供給切換單元214,而不對(duì)音頻數(shù)據(jù)進(jìn)行任何改變。即,將從降混單元213-1所提供的通道Ls、Rs、以及LFE的音頻數(shù)據(jù)作為降混之后的通道Ls、Rs、以及LFE的音頻數(shù)據(jù)輸出到下一階段,而不進(jìn)行任何改變。
[0345]在下文中,當(dāng)輸入端子271-1至271-8不需要彼此特別地區(qū)分時(shí),其被簡(jiǎn)稱為輸入端子271。當(dāng)輸出端子279-1至279-6不需要彼此特別地區(qū)分時(shí),其被簡(jiǎn)稱為輸出端子279。
[0346]同樣地,在降混單元213-2中,執(zhí)行與使用以上提及的表達(dá)式(4)進(jìn)行的計(jì)算相對(duì)應(yīng)的處理。
[0347]圖32是示出圖29所示的降混單元213_3的結(jié)構(gòu)的示例的圖。
[0348]降混單元213-3包括輸入端子301-1至301-8、乘法單元302至305、加法單元306、加法單元307、以及輸出端子308-1至308-6。
[0349]將通道L、R、C、Ls、Rs、Lrs、Rrs、以及LFE的音頻數(shù)據(jù)從切換單元212分別地提供給輸入端子301-1至301-8。
[0350]輸入端子301-1至301-3將從切換單元212所提供的音頻數(shù)據(jù)分別地通過輸出端子308-1至308-3提供給切換單元214,而不對(duì)音頻數(shù)據(jù)進(jìn)行任何改變。即,將被提供給降混單元213-3的通道L、R、以及C的音頻數(shù)據(jù)作為降混之后的通道L、R、以及C的音頻數(shù)據(jù)輸出到下一階段。
[0351]輸入端子301-4至301-7將從切換單元212所提供的音頻數(shù)據(jù)分別地提供給乘法單元302至305。乘法單元302至305將從輸入端子301-4至301-7所提供的音頻數(shù)據(jù)與降混系數(shù)相乘,并且將音頻數(shù)據(jù)分別地提供給加法單元306、加法單元307、加法單元306、以及加法單元307。
[0352]加法單元306將從乘法單元302所提供的音頻數(shù)據(jù)與從乘法單元304所提供的音頻數(shù)據(jù)相加,并且將音頻數(shù)據(jù)提供給輸出端子308-4。輸出端子308-4將從加法單元306所提供的音頻數(shù)據(jù)作為降混之后的Ls通道的音頻數(shù)據(jù)提供給切換單元214。
[0353]加法單元307將從乘法單元303所提供的音頻數(shù)據(jù)與從乘法單元305所提供的音頻數(shù)據(jù)相加,并且將音頻數(shù)據(jù)提供給輸出端子308-5。輸出端子308-5將從加法單元307所提供的音頻數(shù)據(jù)作為降混之后的Rs通道的音頻數(shù)據(jù)提供給切換單元214。
[0354]輸入端子301-8將從切換單元212所提供的音頻數(shù)據(jù)通過輸出端子308-6提供給切換單元214,而不對(duì)音頻數(shù)據(jù)進(jìn)行任何改變。即,將被提供給降混單元213-3的LFE通道的音頻數(shù)據(jù)作為降混之后的LFE通道的音頻數(shù)據(jù)輸出到下一階段,而不進(jìn)行任何改變。
[0355]在下文中,當(dāng)輸入端子301-1至301-8不需要彼此特別地區(qū)分時(shí),其被簡(jiǎn)稱為輸入端子301。當(dāng)輸出端子308-1至308-6不需要彼此特別地區(qū)分時(shí),其被簡(jiǎn)稱為輸出端子308。
[0356]同樣地,在降混單元213-3中,執(zhí)行與使用以上提及的表達(dá)式(3)進(jìn)行的計(jì)算相對(duì)應(yīng)的處理。
[0357]圖33是示出圖29所示的降混單元213_4的結(jié)構(gòu)的示例的圖。
[0358]降混單元213-4包括輸入端子331-1至331-8、乘法單元332至335、加法單元336、加法單元337、以及輸出端子338-1至338-6。
[0359]將通道L、R、C、Ls、Rs、Lvh、Rvh、以及LFE的音頻數(shù)據(jù)從切換單元212分別地提供給輸入端子331-1至331-8。
[0360]輸入端子331-1和輸入端子331-2將從切換單元212所提供的音頻數(shù)據(jù)分別地提供給乘法單元332和乘法單元333。輸入端子331-6和輸入端子331-7將從切換單元212所提供的音頻數(shù)據(jù)分別地提供給乘法單元334和乘法單元335。[0361]乘法單元332至335將從輸入端子331-1、輸入端子331-2、輸入端子331-6、以及輸入端子331-7所提供的音頻數(shù)據(jù)與降混系數(shù)相乘,并且將音頻數(shù)據(jù)分別地提供給加法單元336、加法單元337、加法單元336、以及加法單元337。
[0362]加法單元336將從乘法單元332所提供的音頻數(shù)據(jù)與從乘法單元334所提供的音頻數(shù)據(jù)相加,并且將音頻數(shù)據(jù)提供給輸出端子338-1。輸出端子338-1將從加法單元336所提供的音頻數(shù)據(jù)作為降混之后的L通道的音頻數(shù)據(jù)輸出到切換單元214。
[0363]加法單元337將從乘法單元333所提供的音頻數(shù)據(jù)與從乘法單元335所提供的音頻數(shù)據(jù)相加,并且將音頻數(shù)據(jù)提供給輸出端子338-2。輸出端子338-2將從加法單元337所提供的音頻數(shù)據(jù)作為降混之后的R通道的音頻數(shù)據(jù)提供給切換單元214。
[0364]輸入端子331-3至331_5和輸入端子331_8將從切換單元212所提供的音頻數(shù)據(jù)分別地通過輸出端子338-3至338-5和輸出端子338-6提供給切換單元214,而不對(duì)音頻數(shù)據(jù)進(jìn)行任何改變。即,將被提供給降混單元213-4的通道C、Ls、Rs以及LFE的音頻數(shù)據(jù)作為降混之后的通道C、Ls、Rs以及LFE的音頻數(shù)據(jù)輸出到下一階段,不進(jìn)行任何改變。
[0365]在下文中,當(dāng)輸入端子331-1至331-8不需要彼此特別地區(qū)分時(shí),其被簡(jiǎn)稱為輸入端子331。當(dāng)輸出端子338-1至338-6不需要彼此特別地區(qū)分時(shí),其被簡(jiǎn)稱為輸出端子338。
[0366]同樣地,在降混單元213-4中,執(zhí)行與使用以上提及的表達(dá)式(5)進(jìn)行的計(jì)算相對(duì)應(yīng)的處理。
[0367]然后,將描述圖29所示的降混單元217的詳細(xì)結(jié)構(gòu)的示例。
[0368]圖34是示出圖29所示的降混單元217_1的結(jié)構(gòu)的示例的圖。
[0369]降混單元217-1包括輸入端子361-1至361_6、乘法單元362至365、加法單元366至371、輸出端子372-1、以及輸出端子372-2。
[0370]將通道L、R、C、Ls、Rs、以及LFE的音頻數(shù)據(jù)從切換單元216分別地提供給輸入端子 361-1 至 361-6。
[0371]輸入端子361-1至361-6將從切換單元216所提供的音頻數(shù)據(jù)分別地提供給加法單元366、加法單元369、以及乘法單元362至365。
[0372]乘法單元362至365將從輸入端子361_1至361_6所提供的音頻數(shù)據(jù)與降混系數(shù)相乘,并且將音頻數(shù)據(jù)分別地提供給加法單元366和369、加法單元367、加法單元370、以及加法單元368和371。
[0373]加法單元366將從輸入端子361-1所提供的音頻數(shù)據(jù)與從乘法單元362所提供的音頻數(shù)據(jù)相加,并且將相加后的音頻數(shù)據(jù)提供給加法單元367。加法單元367將從加法單元366所提供的音頻數(shù)據(jù)與從乘法單元363所提供的音頻數(shù)據(jù)相加,并且將相加后的音頻數(shù)據(jù)提供給加法單元368。
[0374]加法單元368將從加法單元367所提供的音頻數(shù)據(jù)與從乘法單元365所提供的音頻數(shù)據(jù)相加,并且將相加后的音頻數(shù)據(jù)提供給輸出端子372-1。輸出端子372-1將從加法單元368所提供的音頻數(shù)據(jù)作為降混之后L通道的音頻數(shù)據(jù)提供給增益調(diào)整單元218。
[0375]加法單元369將從輸入端子361-2所提供的音頻數(shù)據(jù)與從乘法單元362所提供的音頻數(shù)據(jù)相加,并且將相加后的音頻數(shù)據(jù)提供給加法單元370。加法單元370將從加法單元369所提供的音頻數(shù)據(jù)與從乘法單元364所提供的音頻數(shù)據(jù)相加,并且將相加后的音頻數(shù)據(jù)提供給加法單元371。[0376]加法單元371將從加法單元370所提供的音頻數(shù)據(jù)與從乘法單元365所提供的音頻數(shù)據(jù)相加,并且將相加后的音頻數(shù)據(jù)提供給輸出端子372-2。輸出端子372-2將從加法單元371所提供的音頻數(shù)據(jù)作為降混之后R通道的音頻數(shù)據(jù)提供給增益調(diào)整單元218。
[0377]在下文中,當(dāng)輸入端子361-1至361-6不需要彼此特別地區(qū)分時(shí),其被簡(jiǎn)稱為輸入端子361。當(dāng)輸出端子372-1和372-2不需要彼此特別地區(qū)分時(shí),其被簡(jiǎn)稱為輸出端子372。
[0378]同樣地,在降混單元217-1中,執(zhí)行與使用以上提及的表達(dá)式(1)進(jìn)行的計(jì)算相對(duì)應(yīng)的處理。
[0379]圖35是示出圖29所示的降混單元217_2的結(jié)構(gòu)的示例的圖。
[0380]降混單元217-2包括輸入端子401-1至401-6、乘法單元402至405、加法單元406、減法單元407、減法單元408、加法單元409至413、輸出端子414-1以及輸出端子414-2。
[0381]將通道L、R、C、Ls、Rs、以及LFE的音頻數(shù)據(jù)從切換單元216分別地提供給輸入端子 401-1 至 401-6。
[0382]輸入端子401-1至401-6將從切換單元216所提供的音頻數(shù)據(jù)分別地提供給加法單元406、加法單元410、以及乘法單元402至405。
[0383]乘法單元402至405將從輸入端子401_3至401_6所提供的音頻數(shù)據(jù)與降混系數(shù)相乘,并且將音頻數(shù)據(jù)分別地提供給加法單元406和410、減法單元407和加法單元411、減法單元408和加法單元412、以及加法單元409和413。
[0384]加法單元406將從輸入端子401-1所提供的音頻數(shù)據(jù)與從乘法單元402所提供的音頻數(shù)據(jù)相加,并且將相加后的音頻數(shù)據(jù)提供給減法單元407。減法單元407將從加法單元406所提供的音頻數(shù)據(jù)中減去從乘法單元403所提供的音頻數(shù)據(jù),并且將相減后的音頻數(shù)據(jù)提供給減法單元408。
[0385]減法單元408將從減法單元407所提供的音頻數(shù)據(jù)中減去從乘法單元404所提供的音頻數(shù)據(jù),并且將相減后的音頻數(shù)據(jù)提供給加法單元409。加法單元409將從減法單元408所提供的音頻數(shù)據(jù)與從乘法單元405所提供的音頻數(shù)據(jù)相加,并且將相加后的音頻數(shù)據(jù)提供給輸出端子414-1。輸出端子414-1將從加法單元409所提供的音頻數(shù)據(jù)作為降混之后L通道的音頻數(shù)據(jù)提供給增益調(diào)整單元218。
[0386]加法單元410將從輸入端子401-2所提供的音頻數(shù)據(jù)與從乘法單元402所提供的音頻數(shù)據(jù)相加,并且將相加后的音頻數(shù)據(jù)提供給加法單元411。加法單元411將從加法單元410所提供的音頻數(shù)據(jù)與從乘法單元403所提供的音頻數(shù)據(jù)相加,并且將相加后的音頻數(shù)據(jù)提供給加法單元412。
[0387]加法單元412將從加法單元411所提供的音頻數(shù)據(jù)與從乘法單元404所提供的音頻數(shù)據(jù)相加,并且將相加后的音頻數(shù)據(jù)提供給加法單元413。加法單元413將從加法單元412所提供的音頻數(shù)據(jù)與從乘法單元405所提供的音頻數(shù)據(jù)相加,并且將相加后的音頻數(shù)據(jù)提供給輸出端子414-2。輸出端子414-2將從加法單元413所提供的音頻數(shù)據(jù)作為降混之后R通道的音頻數(shù)據(jù)提供給增益調(diào)整單元218。
[0388]在下文中,當(dāng)輸入端子401-1至401-6不需要彼此特別地區(qū)分時(shí),其被簡(jiǎn)稱為輸入端子401。當(dāng)輸出端子414-1和414-2不需要彼此特別地區(qū)分時(shí),其被簡(jiǎn)稱為輸出端子414。
[0389]同樣地,在降混單元217-2中,執(zhí)行與使用以上提及的表達(dá)式(2)進(jìn)行的計(jì)算相對(duì)應(yīng)的處理。[0390][解碼操作的描述]
[0391]接下來(lái),將參照?qǐng)D36所示的流程圖來(lái)描述解碼裝置141的解碼處理。
[0392]在步驟S111中,分離單元61獲取從編碼裝置91所輸出的編碼比特流和降混形式參數(shù)。例如,從包括解碼裝置的信息處理裝置獲取降混形式參數(shù)。
[0393]分離單元61將所獲取的降混形式參數(shù)提供給切換單元151和降混處理單元152。另外,如果需要,分離單元61獲取音頻數(shù)據(jù)的輸出文件名稱,并且適當(dāng)?shù)厥褂幂敵鑫募Q。
[0394]在步驟S112中,分離單元61對(duì)編碼比特流進(jìn)行解包,并且將通過解包所獲得的每個(gè)要素提供給解碼單元62。
[0395]在步驟S113中,PCE解碼單元161對(duì)從分離單元61所提供的PCE進(jìn)行解碼。例如,PCE解碼單元161從PCE的注釋區(qū)域中讀取作為擴(kuò)展區(qū)域的“height_extension_element”或從PCE中讀出關(guān)于揚(yáng)聲器的布置的信息。在此,作為關(guān)于揚(yáng)聲器的布置的信息,讀出例如由布置在用戶的前方、側(cè)方、以及后方的揚(yáng)聲器所再現(xiàn)的通道的數(shù)量、或指示每個(gè)音頻數(shù)據(jù)屬于C、L、以及R通道中的哪個(gè)的信息。
[0396]在步驟S114中,DSE解碼單元162對(duì)從分離單元61所提供的DSE進(jìn)行解碼。例如,DSE解碼單元162從DSE中讀出“MPEG4輔助數(shù)據(jù)”或從“MPEG4輔助數(shù)據(jù)”中讀出需要的信息。
[0397]具體地,例如,DSE解碼單元162的降混信息解碼單元174從圖9所示的“downmixing_levels_MPEG4 (),,讀出 “center_mix_level_value” 或 “surround_mix_levelvalue”作為用于指定用于降混的系數(shù)的信息,并且將所讀出的信息提供給降混處理單元152。
[0398]在步驟S115中,音頻要素解碼單元163對(duì)從分離單元61所提供的、在SCE、CPE、以及LFE的每個(gè)中所存儲(chǔ)的音頻數(shù)據(jù)進(jìn)行解碼。以這種方式,獲得每個(gè)通道的PCM數(shù)據(jù)作為音頻數(shù)據(jù)。
[0399]例如,可以通過諸如存儲(chǔ)音頻數(shù)據(jù)的SCE的要素或通過DSE的解碼所獲得的關(guān)于揚(yáng)聲器的布置的信息,指定解碼音頻數(shù)據(jù)的通道(即,在水平平面上的布置位置)。然而,此時(shí),因?yàn)槲醋x出作為關(guān)于揚(yáng)聲器的布置高度的信息的揚(yáng)聲器布置信息,所以未指定每個(gè)通道的高度(層)。
[0400]音頻要素解碼單元163將通過解碼所獲得的音頻數(shù)據(jù)提供給切換單元151。
[0401]在步驟S116中,切換單元151基于從分離單元61所提供的降混形式參數(shù)來(lái)確定是否對(duì)音頻數(shù)據(jù)進(jìn)行降混。例如,當(dāng)降混形式參數(shù)指示未執(zhí)行降混時(shí),切換單元151確定不執(zhí)行降混。
[0402]在步驟S116中,當(dāng)確定未執(zhí)行降混時(shí),切換單元151將從解碼單元62所提供的音頻數(shù)據(jù)提供給重排處理單元181并且處理繼續(xù)到步驟S117。
[0403]在步驟S117中,解碼裝置141基于揚(yáng)聲器的布置來(lái)執(zhí)行對(duì)每個(gè)音頻數(shù)據(jù)進(jìn)行重排的重排處理,并且輸出音頻數(shù)據(jù)。當(dāng)輸出音頻數(shù)據(jù)時(shí),解碼處理結(jié)束。另外,以下將詳細(xì)地描述重排處理。
[0404]另一方面,當(dāng)在步驟S116中確定執(zhí)行降混時(shí),切換單元151將從解碼單元62所提供的音頻數(shù)據(jù)提供給降混處理單元152的切換單元211,并且處理繼續(xù)到步驟S118。[0405]在步驟SI 18中,解碼裝置141執(zhí)行將每個(gè)音頻數(shù)據(jù)降混到與由降混形式參數(shù)所指示的通道的數(shù)量相對(duì)應(yīng)的音頻數(shù)據(jù)的降混處理,并且輸出音頻數(shù)據(jù)。當(dāng)輸出音頻數(shù)據(jù)時(shí),解碼處理結(jié)束。另外,以下將詳細(xì)描述降混處理。
[0406]以這種方式,解碼裝置141對(duì)編碼比特流進(jìn)行解碼,并且輸出音頻數(shù)據(jù)。
[0407][重排處理的描述]
[0408]接下來(lái),將參照?qǐng)D37和圖38所示的流程圖來(lái)描述與圖36的步驟S117中的處理相對(duì)應(yīng)的重排處理。
[0409]在步驟S141中,同步字檢測(cè)單元171設(shè)置用于從PCE的注釋區(qū)域(擴(kuò)展區(qū)域)中讀出同步字的參數(shù)cmt_byte,使得cmt_byte等于PCE的注釋區(qū)域中字節(jié)的數(shù)量。S卩,將注釋區(qū)域中字節(jié)的數(shù)量設(shè)置為參數(shù)cmt_byte的值。
[0410]在步驟S142中,同步字檢測(cè)單元171從PCE的注釋區(qū)域中讀出與預(yù)定同步字的數(shù)據(jù)量相對(duì)應(yīng)的數(shù)據(jù)。例如,在圖4所示的示例中,因?yàn)樽鳛橥阶值摹癙CE_HEIGHT_EXTENSION_SYNC”為8比特(S卩,1字節(jié)),所以從PCE的注釋區(qū)域的頭部中讀出1字節(jié)數(shù)據(jù)。
[0411]在步驟S143中,PCE解碼單元161確定在步驟S142中所讀出的數(shù)據(jù)與同步字是否相同。即,確定所讀出的數(shù)據(jù)是否為同步字。
[0412]當(dāng)在步驟S143中確定所讀出的數(shù)據(jù)與同步字不同時(shí),在步驟S144中,同步字檢測(cè)單元171將參數(shù)cmt_byte的值減少與所讀出的數(shù)據(jù)量相對(duì)應(yīng)的值。在這種情況下,參數(shù)cm_byte的值減少1字節(jié)。
[0413]在步驟S145中,同步字檢測(cè)單元171確定參數(shù)cmt_byte的值是否大于0。S卩,確定參數(shù)cmt_byte的值是否大于0,也即,確定是否讀出了注釋區(qū)域中的所有數(shù)據(jù)。
[0414]當(dāng)在步驟S145中確定參數(shù)cmt_byte的值大于0時(shí),貝U未讀出注釋區(qū)域中的所有數(shù)據(jù),并且處理返回到步驟S142。然后,重復(fù)以上提及的處理。即,在從注釋區(qū)域中所讀出的數(shù)據(jù)之后,讀出與同步字的數(shù)據(jù)量相對(duì)應(yīng)的數(shù)據(jù),并且將其與同步字進(jìn)行比較。
[0415]另一方面,當(dāng)在步驟S145中確定參數(shù)cmt_byte的值不大于0時(shí),處理繼續(xù)到步驟S146。同樣地,當(dāng)讀出了注釋區(qū)域中的所有數(shù)據(jù)但是未從注釋區(qū)域中檢測(cè)到同步字時(shí),處理繼續(xù)到步驟S146,。
[0416]在步驟S146中,PCE解碼單元161確定不存在揚(yáng)聲器布置信息,并且將指示不存在揚(yáng)聲器布置信息的信息提供給重排處理單元181。處理繼續(xù)到步驟S164。同樣地,因?yàn)橥阶直徊贾迷诰o接“height_extension_element”中的揚(yáng)聲器布置信息之前,所以也可以簡(jiǎn)單地并且可靠地指定在注釋區(qū)域中所包括的信息是否是揚(yáng)聲器布置信息。
[0417]當(dāng)在步驟S143中確定從注釋區(qū)域中所讀出的數(shù)據(jù)與同步字相同時(shí),檢測(cè)到同步字。因此,為了讀出緊接在同步字之后的揚(yáng)聲器布置信息,處理繼續(xù)到步驟S147。
[0418]在步驟S147中,PCE解碼單元161將用于讀出由布置在用戶前方的揚(yáng)聲器所再現(xiàn)的音頻數(shù)據(jù)的揚(yáng)聲器布置信息的參數(shù)num_fr_elem的值,設(shè)置為屬于前方的要素的數(shù)量。
[0419]在此,屬于前方的要素的數(shù)量是由布置在用戶前方的揚(yáng)聲器所再現(xiàn)的音頻數(shù)據(jù)的數(shù)量(通道的數(shù)量)。要素的數(shù)量被存儲(chǔ)在PCE中。因此,參數(shù)num_fr_elem的值為從“height_extension_element”所讀出的、并且由布置在用戶前方的揚(yáng)聲器所再現(xiàn)的音頻數(shù)據(jù)的揚(yáng)聲器布置信息的數(shù)量。
[0420]在步驟S148中,PCE解碼單元161確定參數(shù)num_fr_elem的值是否大于0。[0421]當(dāng)在步驟S148中確定參數(shù)num_fr_elem的值大于0時(shí),因?yàn)槲醋x出所有揚(yáng)聲器布置信息,所以處理繼續(xù)到步驟S149。
[0422]在步驟S149中,PCE解碼單元161讀出與布置在注釋區(qū)域中的同步字之后的一個(gè)要素相對(duì)應(yīng)的揚(yáng)聲器布置信息。在圖4所示的示例中,因?yàn)橐粋€(gè)揚(yáng)聲器布置信息是2比特,所以緊接在從注釋區(qū)域所讀出的數(shù)據(jù)之后布置的2比特的數(shù)據(jù)被讀出作為揚(yáng)聲器布置信
肩、Ο
[0423]例如,可以基于“height_extension_element”中的揚(yáng)聲器布置信息的布置位置或諸如SCE的存儲(chǔ)音頻數(shù)據(jù)的要素,指定關(guān)于音頻數(shù)據(jù)的每個(gè)揚(yáng)聲器布置信息。
[0424]在步驟S150中,因?yàn)樽x出了一個(gè)揚(yáng)聲器布置信息,所以PCE解碼單元161將參數(shù)num_fr_elem的值減少1。在對(duì)參數(shù)num_fr_elem進(jìn)行更新之后,處理返回到步驟S148,并且重復(fù)以上提及的處理。即,讀出下一個(gè)揚(yáng)聲器布置信息。
[0425]當(dāng)在步驟S148中確定參數(shù)num_fr_elem不大于0時(shí),因?yàn)樽x出了關(guān)于前方要素的所有揚(yáng)聲器布置信息,所以處理繼續(xù)到步驟S151。
[0426]在步驟S151中,PCE解碼單元161將用于讀出由布置在用戶側(cè)方的揚(yáng)聲器所再現(xiàn)的音頻數(shù)據(jù)的揚(yáng)聲器布置信息的參數(shù)num_Side_elem的值,設(shè)置為屬于側(cè)方的要素的數(shù)量。
[0427]在此,屬于側(cè)方的要素的數(shù)量是由布置在用戶側(cè)方的揚(yáng)聲器所再現(xiàn)的音頻數(shù)據(jù)的數(shù)量。要素的數(shù)量被存儲(chǔ)在PCE中。
[0428]在步驟S152中,PCE解碼單元161確定參數(shù)num_side_elem的值是否大于0。
[0429]當(dāng)在步驟S152中確定參數(shù)num_side_elem的值大于0時(shí),PCE解碼單元161在步驟S153中讀出與一個(gè)要素相對(duì)應(yīng)的、并且布置在從注釋區(qū)域中所讀出的數(shù)據(jù)之后的揚(yáng)聲器布置信息。在步驟S153中所讀出的揚(yáng)聲器布置信息是在用戶側(cè)方的通道的揚(yáng)聲器布置信息,即 “side_element_height_info [i] ”。
[0430]在步驟S154中,PCE解碼單元161將參數(shù)num_side_elem的值減少1。在對(duì)參數(shù)nUm_Side_elem進(jìn)行更新之后,處理返回到步驟S152,并且重復(fù)以上提及的處理。
[0431]另一方面,當(dāng)在步驟S152中確定參數(shù)num_side_elem的值不大于0時(shí),因?yàn)樽x出了側(cè)方要素的所有揚(yáng)聲器布置信息,所以處理繼續(xù)到步驟S155。
[0432]在步驟S155中,PCE解碼單元161將用于讀出由布置在用戶后方的揚(yáng)聲器所再現(xiàn)的音頻數(shù)據(jù)的揚(yáng)聲器布置信息的參數(shù)num_baCk_elem的值,設(shè)置為屬于后方的要素的數(shù)量。
[0433]在此,屬于后方的要素的數(shù)量是由布置在用戶后方的揚(yáng)聲器所再現(xiàn)的音頻數(shù)據(jù)的數(shù)量。要素的數(shù)量被存儲(chǔ)在PCE中。
[0434]在步驟S156中,PCE解碼單元161確定參數(shù)num_back_elem的值是否大于0。
[0435]當(dāng)在步驟S156中確定參數(shù)num_back_elem的值大于0時(shí),PCE解碼單元161在步驟S157中讀出與一個(gè)要素相對(duì)應(yīng)的、并且布置在從注釋區(qū)域中所讀出的數(shù)據(jù)之后的揚(yáng)聲器布置信息。在步驟S157中所讀出的揚(yáng)聲器布置信息是布置在用戶后方的通道的揚(yáng)聲器布置信息,即 “back_element_height_info [i] ”。
[0436]在步驟S158中,PCE解碼單元161將參數(shù)num_back_elem的值減少1。在對(duì)參數(shù)num_back_elem進(jìn)行更新之后,處理返回到步驟S156,并且重復(fù)以上提及的處理。[0437]當(dāng)在步驟S156中確定參數(shù)num_back_elem的值不大于0時(shí),因?yàn)樽x出了關(guān)于后方要素的所有揚(yáng)聲器布置信息,所以處理繼續(xù)到步驟S159。
[0438]在步驟S159中,標(biāo)識(shí)信息計(jì)算單元172執(zhí)行字節(jié)對(duì)齊。
[0439]例如,在圖4所不的“height_extension_element”中的揚(yáng)聲器布置信息之后存儲(chǔ)用于指示執(zhí)行字節(jié)對(duì)齊的信息“byte_alignment() ”。因此,當(dāng)讀出此信息時(shí),標(biāo)識(shí)信息計(jì)算單元172執(zhí)行字節(jié)對(duì)齊。
[0440]具體地,標(biāo)識(shí)信息計(jì)算單元172將預(yù)定數(shù)據(jù)加到緊接在“height_extension_element” 中的 “PCE_HEIGHT_EXTENSION_SYNC” 與 “byte_alignment () ”之間所讀出的信息之后,使得所讀出的信息的數(shù)據(jù)量是8比特的整數(shù)倍數(shù)。即,執(zhí)行字節(jié)對(duì)齊,使得所讀出的同步字、揚(yáng)聲器布置信息、以及相加的數(shù)據(jù)的數(shù)據(jù)總量為8比特的整數(shù)倍數(shù)。
[0441]在此示例中,音頻數(shù)據(jù)的通道的數(shù)量(S卩,在比編碼比特流中所包括的揚(yáng)聲器布置信息的數(shù)量)在預(yù)定范圍中。因此,通過字節(jié)對(duì)齊所獲得的數(shù)據(jù)(即,包括同步字、揚(yáng)聲器布置信息、以及相加的數(shù)據(jù)的一個(gè)數(shù)據(jù)(在下文中,也被稱為對(duì)齊數(shù)據(jù)))必定是預(yù)定的數(shù)據(jù)量。
[0442]換言之,對(duì)齊數(shù)據(jù)的量必定是預(yù)定的數(shù)據(jù)量,而與在“height_extension_element”中所包括的揚(yáng)聲器布置信息的數(shù)量(即,音頻數(shù)據(jù)的通道數(shù)量)無(wú)關(guān)。因此,如果生成對(duì)齊數(shù)據(jù)時(shí),對(duì)齊數(shù)據(jù)的量不是預(yù)定的數(shù)據(jù)量,則PCE解碼單元161確定所讀出的揚(yáng)聲器布置信息不是正確的揚(yáng)聲器布置信息,即,所讀出的揚(yáng)聲器布置信息無(wú)效。
[0443]在步驟S160中,標(biāo)識(shí)信息計(jì)算單元172讀出“height_extension_element”中的、在步驟 S159 中所讀出的“byte_alignment”之后的標(biāo)識(shí)信息(S|],“heigh_info_crc_check”中所存儲(chǔ)的信息)。在此,例如,CRC校驗(yàn)碼被讀出作為標(biāo)識(shí)信息。
[0444]在步驟S161中,標(biāo)識(shí)信息計(jì)算單元172基于在步驟S159中所獲得的對(duì)齊數(shù)據(jù)來(lái)計(jì)算標(biāo)識(shí)信息。例如,將CRC校驗(yàn)碼計(jì)算為標(biāo)識(shí)信息。
[0445]在步驟S162中,PCE解碼單元161確定在步驟S160中所讀出的標(biāo)識(shí)信息是否與在步驟S161中所計(jì)算出的標(biāo)識(shí)信息相同。
[0446]當(dāng)對(duì)齊數(shù)據(jù)的量不是預(yù)定的數(shù)據(jù)的量時(shí),PCE解碼單元161不執(zhí)行步驟S160和步驟S161,并且在步驟S162中確定標(biāo)識(shí)信息彼此不同。
[0447]當(dāng)在步驟S162中確定標(biāo)識(shí)信息彼此不同時(shí),PCE解碼單元161使得所讀出的揚(yáng)聲器布置信息無(wú)效,并且在步驟S163中將指示所讀出的揚(yáng)聲器信息無(wú)效的信息提供給重排處理單元181和降混處理單元152。然后,處理繼續(xù)到步驟S164。
[0448]當(dāng)執(zhí)行步驟S163中的處理或步驟S146中的處理時(shí),重排處理單元181在步驟S164中按照預(yù)定的揚(yáng)聲器布置輸出從切換單元151所提供的音頻數(shù)據(jù)。
[0449]在這種情況下,例如,重排處理單元181基于從PCE解碼單元161所提供的以及從PCE所讀出的關(guān)于揚(yáng)聲器布置的信息,確定每個(gè)音頻數(shù)據(jù)的揚(yáng)聲器布置。由重排處理單元181所使用以確定揚(yáng)聲器的布置的信息的參考目的地依賴于使用音頻數(shù)據(jù)的服務(wù)或應(yīng)用,并且是基于音頻數(shù)據(jù)的通道數(shù)量而預(yù)定的。
[0450]當(dāng)執(zhí)行步驟S164中的處理時(shí),重排處理結(jié)束。然后,圖36的步驟S117中的處理結(jié)束。因此,解碼處理結(jié)束。
[0451]另一方面,當(dāng)在步驟S162中確定標(biāo)識(shí)信息彼此相同時(shí),在步驟S165中,PCE解碼單元161使得所讀出的揚(yáng)聲器布置信息有效,并且將揚(yáng)聲器布置信息提供給重排處理單元181和降混處理單元152。在這種情況下,PCE解碼單元161還將從PCE所讀出的關(guān)于揚(yáng)聲器的布置的信息提供給重排處理單元181和降混處理單元152。
[0452]在步驟S166中,重排處理單元181根據(jù)例如由從PCE解碼單元161所提供的揚(yáng)聲器布置信息所確定的揚(yáng)聲器的布置,輸出從切換單元151所提供的音頻數(shù)據(jù)。即,按照例如由揚(yáng)聲器布置信息所確定的順序重排每個(gè)通道的音頻數(shù)據(jù),并且然后將其輸出到下一個(gè)階段。當(dāng)執(zhí)行步驟S166中的處理時(shí),重排處理結(jié)束。然后,圖36所示的步驟S117中的處理結(jié)束。因此,解碼處理結(jié)束。
[0453]以這種方式,解碼裝置141從PCE的注釋區(qū)域中檢查同步字或CRC校驗(yàn)碼,讀出揚(yáng)聲器布置信息,以及根據(jù)與揚(yáng)聲器布置信息相對(duì)應(yīng)的布置輸出解碼音頻數(shù)據(jù)。
[0454]同樣地,因?yàn)樽x出了揚(yáng)聲器布置信息并且確定了揚(yáng)聲器的布置(聲音源的位置),所以可以在垂直方向上對(duì)聲音圖像進(jìn)行再現(xiàn),并且可以獲得高質(zhì)量真實(shí)感的聲音。
[0455]另外,因?yàn)槭褂猛阶趾虲RC校驗(yàn)碼讀出揚(yáng)聲器布置信息,所以可以可靠地從注釋區(qū)域中讀出揚(yáng)聲器布置信息,在注釋區(qū)域中,例如很可能存儲(chǔ)有其他文本信息。即,可以可靠地區(qū)分揚(yáng)聲器布置信息與其他信息。
[0456]具體地,解碼裝置141使用三個(gè)要素(即,同步字的一致、CRC校驗(yàn)碼的一致、以及對(duì)齊數(shù)據(jù)量的一致)來(lái)區(qū)分揚(yáng)聲器布置信息與其他信息。因此,可以防止揚(yáng)聲器布置信息的檢測(cè)的錯(cuò)誤。同樣地,因?yàn)榉乐沽藫P(yáng)聲器布置信息的檢測(cè)的錯(cuò)誤,所以可以根據(jù)正確的揚(yáng)聲器的布置對(duì)音頻數(shù)據(jù)進(jìn)行再現(xiàn),并且可以獲得高質(zhì)量真實(shí)感的聲音。
[0457][降混處理的說(shuō)明]
[0458]接下來(lái),將參照?qǐng)D39所示的流程圖來(lái)描述與圖36的步驟S118中的處理相對(duì)應(yīng)的降混處理。在這種情況下,將每個(gè)通道的音頻數(shù)據(jù)從切換單元151提供給降混處理單元152的切換單元211。
[0459]在步驟S191中,DSE解碼單元162的擴(kuò)展檢測(cè)單元173從DSE的“MPEG4_ancillary_data () ” 中的 “ancillary_data_status () ” 中讀出 “ancillary_data_extension_status,,。
[0460]在步驟S192中,擴(kuò)展檢測(cè)單元173確定所讀出的“ancillary_data_extension_status”是否為1。
[0461]當(dāng)在步驟S192 中確定“ancillary_data_extension_status” 不為 1、即,“ancillary_data_extension_status”為0時(shí),降混處理單兀152在步驟S193中使用預(yù)定方法來(lái)對(duì)音頻數(shù)據(jù)進(jìn)行降混。
[0462]例如,降混處理單元152使用由從降混信息解碼單元174所提供的“Center_mix_level_value”或“surround_mix_level_value”所確定的系數(shù),對(duì)從切換單元151所提供的音頻數(shù)據(jù)進(jìn)行降混,并且將音頻數(shù)據(jù)提供給輸出單元63。
[0463]當(dāng)ancillary_data_extension_status”為0時(shí),可以根據(jù)任一方法執(zhí)行降混處理。
[0464]在步驟S194中,輸出單元63將從降混處理單元152所提供的音頻數(shù)據(jù)輸出到下一階段,而不對(duì)音頻數(shù)據(jù)進(jìn)行任何改變。然后,降混處理結(jié)束。以這種方式,圖36的步驟S118中的處理結(jié)束。因此,解碼處理結(jié)束。[0465]另一方面,當(dāng)在步驟S192 中確定 “ancillary_data_extension_status” 為 1 時(shí),處理繼續(xù)到步驟S195。
[0466]在步驟S195中,降混信息解碼單元174讀出圖11所示的“MPEG4_ext_ancillary_data () ”的“ext_downmixng_levels () ”中的信息,并且將所讀出的信息提供給降混處理單元152。以這種方式,例如,讀出圖13所示的“dmix_a_idx”和“dmix_b_idx”。
[0467]當(dāng)圖12 所不的、在“MPEG4_ext_ancillary_data() ”中所包括的“ext_downmixng_levels_status” 為 0 時(shí),不執(zhí)行 “dmix_a_idx” 和 “dmix_b_idx” 的讀出。
[0468]在步驟S196中,降混信息解碼單元174讀出“MPEG4_ext_ancillary_data () ”的“ext_downmixng_global_gains () ”中的信息,并且將所讀出的信息輸出到降混處理單元152。以這種方式,例如,讀出圖15所示的信息,即“dmx_gain5_sign”、“dmx_gain_5_idx”、“dmx_gain_2_sign”、以及 “dmx_gain_2_idx”。
[0469]當(dāng)圖12 所不的、在“MPEG4_ext_ancillary_data() ”中所包括的“ext_downmixng_global_gains_status”為0時(shí),不執(zhí)行信息的讀出。
[0470]在步驟S197中,降混信息解碼單元174讀出“MPEG4_ext_ancillary_data () ”的“ext_downmixng_lfe_level () ”中的信息,并且將所讀出的信息提供給降混處理單元152。以這種方式,例如,讀出圖16所示的“dmix_lfe_idx”。
[0471]具體地,降混信息解碼單元174讀出圖12所示的“ext_downmixng_lfe_level_status”,并且基于 “ext_downmixng_lfe_level_status” 的值讀出 “dmix_lfe_idx,,。
[0472]即,當(dāng)“MPEG4_ext_ancillary_data () ” 中所包括的 “ext_downmixng_lfe_level_status”為0時(shí),不執(zhí)行“dmix_lfe_idx”的讀出。以這種方式,在以下將描述的、從5.1通道到2通道的音頻數(shù)據(jù)的降混中不使用LFE通道的音頻數(shù)據(jù)。即,與LFE通道的音頻數(shù)據(jù)相乘的系數(shù)為0。
[0473]在步驟S198中,降混信息解碼單元174從圖7所示的“MPEG4輔助數(shù)據(jù)”的“bs_info () ”中讀出在“pseudo_surround_enable”中所存儲(chǔ)的信息,并且將所讀出的信息提供給降混處理單元152。
[0474]在步驟S199中,降混處理單元152基于從分離單元61所提供的降混形式參數(shù),確定是否從2通道輸出音頻數(shù)據(jù)。
[0475]例如,當(dāng)降混形式參數(shù)指示從7.1通道或6.1通道到2通道的降混或從5.1通道到2通道的降混時(shí),確定從2通道輸出音頻數(shù)據(jù)。
[0476]當(dāng)在步驟S199中確定音頻數(shù)據(jù)是來(lái)自2通道的輸出時(shí),處理繼續(xù)到步驟S200。在這種情況下,將切換單元214的輸出目的地改變?yōu)榍袚Q單元216。
[0477]在步驟S200中,降混處理單元152基于從分離單元61所提供的降混形式參數(shù),確定音頻數(shù)據(jù)的輸入是否是5.1通道。例如,當(dāng)降混形式參數(shù)指示從5.1通道到2通道的降混時(shí),確定輸入是5.1通道。
[0478]當(dāng)在步驟S200中確定輸入不是5.1通道時(shí),處理繼續(xù)到步驟S201,并且執(zhí)行從
7.1通道或6.1通道到2通道的降混。
[0479]在這種情況下,切換單元211將從切換單元151所提供的音頻數(shù)據(jù)提供給切換單元212。切換單元212基于從PCE解碼單元161所提供的、關(guān)于揚(yáng)聲器布置的信息,將從切換單元211所提供的音頻數(shù)據(jù)提供給降混單元213-1至213-4中的任一個(gè)。例如,當(dāng)音頻數(shù)據(jù)是6.1通道的數(shù)據(jù)時(shí),將每個(gè)通道的音頻數(shù)據(jù)提供給降混單元213-1。
[0480]在步驟S201中,降混單元213基于從降混信息解碼單元174所提供的以及從“ext_downmixng_levels () ” 所讀出的 “dmix_a_idx” 和 “dmix_b_idx”,執(zhí)行到 5.1 通道的降混。
[0481]例如,當(dāng)將音頻數(shù)據(jù)提供給降混單元213-1時(shí),降混單元213-1參照?qǐng)D19所示的表、將針對(duì)“dmix_a_idx”和“dmix_b_idx”的值所確定的常數(shù)分別地設(shè)置為常數(shù)gl和g2。然后,降混單元213-1分別地使用常數(shù)gl和g2作為在乘法單元242和243以及乘法單元244中所使用的系數(shù),使用表達(dá)式(6)生成5.1通道的音頻數(shù)據(jù),以將音頻數(shù)據(jù)提供給切換單元214。
[0482]類似地,當(dāng)將音頻數(shù)據(jù)提供給降混單元231-2時(shí),降混單元213_2將針對(duì)dmix_a_idx”和“dmix_b_idx”的值所確定的常數(shù)分別地設(shè)置為常數(shù)el和e2。然后,降混單元213-2分別地使用常數(shù)el和e2作為在乘法單元273和274以及乘法單元272和275中所使用的系數(shù),使用表達(dá)式(4)生成5.1通道的音頻數(shù)據(jù),以及將所獲得的5.1通道的音頻數(shù)據(jù)提供給切換單元214。
[0483]當(dāng)將音頻數(shù)據(jù)提供給降混單元213-3時(shí),降混單元213_3將針對(duì)“dmix_a_idx”和“dmix_b_idx”的值所確定的常數(shù)分別地設(shè)置為常數(shù)dl和d2。然后,降混單元213-3分別地使用常數(shù)dl和d2作為在乘法單元302和303以及乘法單元304和305中所使用的系數(shù),使用表達(dá)式(3)生成音頻數(shù)據(jù),以及將所獲得的音頻數(shù)據(jù)提供給切換單元214。
[0484]當(dāng)將音頻數(shù)據(jù)提供給降混單元213-4時(shí),降混單元213_4將針對(duì)“dmix_a_idx”和“dmix_b_idx”的值所確定的常數(shù)分別地設(shè)置為常數(shù)Π和f2。然后,降混單元213-4分別地使用常數(shù)fl和f2作為在乘法單元332和333以及乘法單元334和335中所使用的系數(shù),使用表達(dá)式(5)生成音頻數(shù)據(jù),以及將所獲得的音頻數(shù)據(jù)提供給切換單元214。
[0485]當(dāng)將5.1通道的音頻數(shù)據(jù)提供給切換單元214時(shí),切換單元214將從降混單元213所提供的音頻數(shù)據(jù)提供給切換單元216。切換單元216基于從降混信息解碼單元174所提供的“pseudo_surround_enable”的值,將從切換單元214所提供的音頻數(shù)據(jù)提供給降混單元217-1或降混單元217-2。
[0486]例如,當(dāng)“pseudo_surround_enable”的值為0時(shí),將音頻數(shù)據(jù)提供給降混單元217-1。當(dāng)“pseudo_surround_enable”的值為1時(shí),將音頻數(shù)據(jù)提供給降混單元217-2。
[0487]在步驟S202中,降混單元217基于從降混信息解碼單元174所提供的關(guān)于降混的信息,執(zhí)行將從切換單元216所提供的音頻數(shù)據(jù)降混到2通道的處理。S卩,基于“downmixing_levels_MPEG4 () ”中的信息和“ext_downmixing_lfe_level () ”中的信息執(zhí)行到2通道的降混。
[0488]例如,當(dāng)將音頻數(shù)據(jù)提供給降混單元217-1時(shí),降混單元217-1參照?qǐng)D19所示的表、將針對(duì) “center_mix_level_value” 和 “surround_mix_level_value” 的值所確定的常數(shù)分別地設(shè)置為常數(shù)a和b。另外,降混單元217-1參照?qǐng)D18所示的表、將針對(duì)“dmiX_lfe_idx”的值所確定的常數(shù)設(shè)置為常數(shù)c。
[0489]然后,降混單元217-1分別地使用常數(shù)a、b、以及c作為在乘法單元363和364、乘法單元362、以及乘法單元365中所使用的系數(shù),使用表達(dá)式(1)生成音頻數(shù)據(jù)、以及將所獲得的2通道的音頻數(shù)據(jù)提供給增益調(diào)整單元218。[0490]當(dāng)將音頻數(shù)據(jù)提供給降混單元217-2時(shí),降混單元217-2與降混單元217_1類似地確定常數(shù)a、b、以及c。然后,降混單元217-2分別地使用常數(shù)a、b、以及c作為在乘法單元403和404、乘法單元402以及乘法單元405中所使用的系數(shù),使用表達(dá)式(2)生成音頻數(shù)據(jù),以及將所獲得的音頻數(shù)據(jù)提供給增益調(diào)整單元218。
[0491]在步驟S203中,增益調(diào)整單元218基于從降混信息解碼單元174所提供的以及從“ext_downmixing_global_gains () ”中所讀出的信息,調(diào)整來(lái)自降混單元217的音頻數(shù)據(jù)的增益。
[0492]具體地,增益調(diào)整單元218基于從“6乂1:_(10¥1111^1;[叩_81(^31_83;[118 0 ”所讀出的“ dmx_ga i n 5_s i gn,,、“ dmx_ga i n_5_ i dx,,、“ dmx_ga i n_2_s i gn,,、以及“ dmx_ga i n_2_ i dx,,來(lái)計(jì)算表達(dá)式(11),并且計(jì)算增益值dmX_gain_7to2。然后,增益調(diào)整單元218將每個(gè)通道的音頻數(shù)據(jù)乘以增益值dmx_gain_7to2,并且將音頻數(shù)據(jù)提供給輸出單元63。
[0493]在步驟S204中,輸出單元63將從增益調(diào)整單元218所提供的音頻數(shù)據(jù)輸出到下一階段,而不對(duì)音頻數(shù)據(jù)進(jìn)行任何改變。然后,降混處理結(jié)束。以這種方式,圖36的步驟S118中的處理結(jié)束。因此,結(jié)束解碼處理。
[0494]當(dāng)從重排處理單元181輸出音頻數(shù)據(jù)時(shí)以及當(dāng)從降混處理單元152輸出音頻數(shù)據(jù)而不進(jìn)行任何改變時(shí),從輸出單元63輸出音頻數(shù)據(jù)。在輸出單元63之后的階段中,可以預(yù)定要使用的音頻數(shù)據(jù)的兩個(gè)輸出中的一個(gè)。
[0495]當(dāng)在步驟S200中確定輸入是5.1通道時(shí),處理繼續(xù)到步驟S205,并且執(zhí)行從5.1通道到2通道的降混。
[0496]在這種情況下,切換單元211將從切換單元151所提供的音頻數(shù)據(jù)提供給切換單元216。切換單元216基于從降混信息解碼單元174所提供的“pseudo_surround_enable”的值,將從切換單 元211所提供的音頻數(shù)據(jù)提供給降混單元217-1或降混單元217-2。
[0497]在步驟S205中,降混單元217基于從降混信息解碼單元174所提供的關(guān)于降混的信息,執(zhí)行將從切換單元216所提供的音頻數(shù)據(jù)降混到2通道的處理。另外,在步驟S205中,執(zhí)行與步驟S202中的處理相同的處理。
[0498]在步驟S206中,增益調(diào)整單元218基于從降混信息解碼單元174所提供的以及從“ext_downmixing_global_gains () ”所讀出的信息,調(diào)整從降混單元217所提供的音頻數(shù)據(jù)的增益。
[0499]具體地,增益調(diào)整單元218基于從“6乂1:_(10¥11111丨1;[叩_81(^31_83;[118 0 ”所讀出的“dmx_gain_2_sign”和“dmx_gain_2_idx”計(jì)算表達(dá)式(9),并且將通過計(jì)算所獲得的音頻數(shù)據(jù)提供給輸出單元63。
[0500]在步驟S207中,輸出單元63將從增益調(diào)整單元218所提供的音頻數(shù)據(jù)輸出到下一階段,而不對(duì)音頻數(shù)據(jù)進(jìn)行任何改變。然后降混處理結(jié)束。以這種方式,圖36的步驟S118中的處理結(jié)束。因此,解碼處理結(jié)束。
[0501 ] 當(dāng)在步驟S199中確定音頻數(shù)據(jù)不是來(lái)自2通道的輸出時(shí),即,音頻數(shù)據(jù)是來(lái)自5.1通道的輸出時(shí),處理繼續(xù)到步驟S208,并且執(zhí)行從7.1通道或6.1通道到5.1通道的降混。
[0502]在這種情況下,切換單元211將從切換單元151所提供的音頻數(shù)據(jù)提供給切換單元212。切換單元212基于從PCE解碼單元161所提供的關(guān)于揚(yáng)聲器布置的信息,將從切換單元211所提供的音頻數(shù)據(jù)提供給降混單元213-1至213-4中的任一個(gè)。另外,切換單元214的輸出目的地是增益調(diào)整單元215。
[0503]在步驟S208中,降混單元213基于從降混信息解碼單元174所提供的以及從“ext_downmixing_levels () ”所讀出的 “dmix_a_idx” 和 “dmix_b_idx” 執(zhí)行到 5.1 通道的降混。在步驟S208中,執(zhí)行與步驟S201中的處理相同的處理。
[0504]當(dāng)執(zhí)行到5.1通道的降混并且將音頻數(shù)據(jù)從降混單元213提供給切換單元214時(shí),切換單元214將所提供的音頻數(shù)據(jù)提供給增益調(diào)整單元215。
[0505]在步驟S209中,增益調(diào)整單元215基于從降混信息解碼單元174所提供的以及從“ext_downmixing_global_gains () ”所讀出的信息,調(diào)整從切換單元214所提供的音頻數(shù)據(jù)的增益。
[0506]具體地,增益調(diào)整單元215基于從“6乂1:_(10¥11111丨1;[叩_81(^31_83;[118 0 ”所讀出的“dmx_gain_5_sign”和“dmx_gain_5_idx”來(lái)計(jì)算表達(dá)式(7),并且將通過計(jì)算所獲得的音頻數(shù)據(jù)提供給輸出單元63。
[0507]在步驟S210中,輸出單元63將從增益調(diào)整單元215所提供的音頻數(shù)據(jù)輸出到下一階段,而不對(duì)音頻數(shù)據(jù)進(jìn)行任何改變。然后,降混處理結(jié)束。以這種方式,圖36的步驟S118中的處理結(jié)束。因此,解碼處理結(jié)束。
[0508]以這種方式,解碼裝置141基于從編碼比特流所讀出的信息對(duì)音頻數(shù)據(jù)進(jìn)行降混。
[0509]例如,在編碼比特 流中,因?yàn)椤皃seudo_surround_enable”包括在DSE中,所以可以使用在多種方法中最適合音頻數(shù)據(jù)的方法來(lái)執(zhí)行從5.1通道到2通道的降混處理。因此,可以在解碼側(cè)獲得高質(zhì)量真實(shí)感的聲音。
[0510]另外,在編碼比特流中,將指示是否包括擴(kuò)展信息的信息存儲(chǔ)在“ancillary_data_extension_status”中。因此,可以參考該信息來(lái)指定在擴(kuò)展區(qū)域中是否包括擴(kuò)展信息。當(dāng)可以獲得擴(kuò)展信息時(shí),可以改進(jìn)音頻數(shù)據(jù)的降混的靈活性。因此,可以獲得高質(zhì)量真實(shí)感的聲音。
[0511]以上提及的處理系列可以由硬件或軟件執(zhí)行。當(dāng)由軟件執(zhí)行處理系列時(shí),構(gòu)成軟件的程序被安裝在計(jì)算機(jī)中。在此,計(jì)算的示例包括專用硬件中所包含的計(jì)算機(jī)、以及其中安裝有各種程序并且可以執(zhí)行各種功能的通用個(gè)人計(jì)算機(jī)。
[0512]圖40是示出運(yùn)行程序以執(zhí)行以上提及的處理系列的計(jì)算機(jī)的硬件結(jié)構(gòu)的示例的框圖。
[0513]在計(jì)算機(jī)中,中央處理單元(CPU) 501、只讀存儲(chǔ)器(ROM) 502、以及隨機(jī)存取存儲(chǔ)器(RAM) 503通過總線504彼此連接。
[0514]輸入/輸出接口 505連接到總線504。輸入單元506、輸出單元507、記錄單元508、通信單元509、以及驅(qū)動(dòng)器510連接到輸入/輸出接口 505。
[0515]輸入單元506包括例如鍵盤、鼠標(biāo)、麥克風(fēng)、以及成像元件。輸出單元507包括例如顯示器和揚(yáng)聲器。記錄單元508包括硬盤和非易失性存儲(chǔ)器。通信單元509是例如網(wǎng)絡(luò)接口。驅(qū)動(dòng)器510驅(qū)動(dòng)諸如磁盤、光盤、磁光盤、或半導(dǎo)體磁存儲(chǔ)的可移除介質(zhì)511。
[0516]在具有以上提及的結(jié)構(gòu)的計(jì)算機(jī)中,例如,CPU501將在記錄單元508上所記錄的程序通過輸入/輸出接口 505和總線504載入到RAM503。然后,執(zhí)行以上提及的處理系列。
[0517]由計(jì)算機(jī)(CPU501)所運(yùn)行的程序可以記錄在作為封裝介質(zhì)的可移除介質(zhì)511上,并且然后被提供。替選地,可以經(jīng)由有線的或無(wú)線的傳輸介質(zhì)(諸如局域網(wǎng)、互聯(lián)網(wǎng)、或數(shù)字衛(wèi)星廣播)來(lái)提供該程序。
[0518]在計(jì)算機(jī)中,可移除介質(zhì)511可以插入到驅(qū)動(dòng)器510中,以通過輸入/輸出接口505將程序安裝到記錄單元508中。另外,程序可以由通信單元509通過有線的或無(wú)線的傳輸介質(zhì)所接收,并且然后安裝在記錄單元508中。替選地,程序可以預(yù)先地安裝在R0M502或記錄單元508中。
[0519]要由計(jì)算機(jī)所運(yùn)行的程序可以是用于依照在本說(shuō)明書中所描述的序列、按照時(shí)間順序執(zhí)行操作的程序,或可以是用于并行地執(zhí)行操作或當(dāng)需要時(shí)(諸如當(dāng)存在調(diào)用時(shí))執(zhí)行操作的程序。
[0520]本技術(shù)的實(shí)施例不限于以上所述的實(shí)施例,而且還可以在不背離本技術(shù)的范圍和精神的情況下對(duì)實(shí)施例進(jìn)行各種修改和改變。
[0521]例如,本技術(shù)可以具有云計(jì)算結(jié)構(gòu),在云計(jì)算結(jié)構(gòu)中,由多個(gè)裝置通過網(wǎng)絡(luò)分擔(dān)一個(gè)功能,并且由多個(gè)裝置協(xié)作地處理該一個(gè)功能。
[0522]在以上所述的實(shí)施例中,由一個(gè)裝置執(zhí)行在以上提及的流程圖中所描述的每個(gè)步驟。然而,可以由多個(gè)裝置分擔(dān)并且執(zhí)行每個(gè)步驟。
[0523]在以上所述的實(shí)施例中,當(dāng)一個(gè)步驟包括多個(gè)處理時(shí),在一個(gè)步驟中所包括的多個(gè)處理由一個(gè)裝置執(zhí)行。然而,該多個(gè)處理可以由多個(gè)裝置分擔(dān)并且執(zhí)行。
[0524]另外,本技術(shù)可以具有下面的結(jié)構(gòu)。
[0525][1].一種解碼裝置,包括:
[0526]標(biāo)識(shí)信息檢測(cè)單元,從能夠存儲(chǔ)編碼比特流的任意數(shù)據(jù)的區(qū)域讀出用于標(biāo)識(shí)是否存在預(yù)定信息的標(biāo)識(shí)信息;以及
[0527]讀出單元,基于多個(gè)所述標(biāo)識(shí)信息、從能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域讀出所述預(yù)
定信息。
[0528][2],根據(jù)[1]所述的解碼裝置,將預(yù)定第一標(biāo)識(shí)信息和基于所述預(yù)定信息計(jì)算出的第二標(biāo)識(shí)信息作為所述標(biāo)識(shí)信息存儲(chǔ)在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中。
[0529][3],根據(jù)[2]所述的解碼裝置,當(dāng)在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中所包括的所述第一標(biāo)識(shí)信息是預(yù)定特定信息、并且從能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域所讀出的所述第二標(biāo)識(shí)信息與基于所讀出的預(yù)定信息計(jì)算出的所述第二標(biāo)識(shí)信息相同時(shí),所述讀出單元確定所述預(yù)定息是有效息。
[0530][4],根據(jù)[2]或[3]所述的解碼裝置,當(dāng)所讀出的第一標(biāo)識(shí)信息是預(yù)定特定信息時(shí),所述讀出單元開始讀出布置在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中的所述第一標(biāo)識(shí)信息之后的所述預(yù)定信息。
[0531][5],根據(jù)[2]至[4]中任一項(xiàng)所述的解碼裝置,基于通過對(duì)于包括所述預(yù)定信息的信息執(zhí)行字節(jié)對(duì)齊所獲得的信息,計(jì)算所述第二標(biāo)識(shí)信息。
[0532][6],根據(jù)[5]所述的解碼裝置,在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中包括在預(yù)定范圍中的任意數(shù)量的所述預(yù)定信息,以及當(dāng)通過所述字節(jié)對(duì)齊所獲得的信息不具有預(yù)定大小時(shí),所述讀出單元確定所述預(yù)定信息是無(wú)效信息。
[0533][7],根據(jù)[1]至[6]中任一項(xiàng)所述的解碼裝置,所述預(yù)定信息是與音頻數(shù)據(jù)有關(guān)的信息,以及所述解碼裝置還包括解碼單元,其對(duì)在所述編碼比特流中所包括的所述音頻數(shù)據(jù)進(jìn)行解碼。
[0534][8].—種解碼方法,包括:
[0535]從能夠存儲(chǔ)編碼比特流的任意數(shù)據(jù)的區(qū)域讀出用于標(biāo)識(shí)是否存在預(yù)定信息的標(biāo)識(shí)信息的步驟;以及
[0536]基于多個(gè)所述標(biāo)識(shí)信息、從能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域讀出所述預(yù)定信息的步驟。
[0537][9].一種使得計(jì)算機(jī)執(zhí)行處理的程序,所述處理包括:
[0538]從能夠存儲(chǔ)編碼比特流的任意數(shù)據(jù)的區(qū)域讀出用于標(biāo)識(shí)是否存在預(yù)定信息的標(biāo)識(shí)信息的步驟;以及
[0539]基于多個(gè)所述標(biāo)識(shí)信息、從能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域讀出所述預(yù)定信息的步驟。
[0540][10].—種編碼裝置,包括:
[0541]編碼單元,對(duì)用于標(biāo)識(shí)是否存在預(yù)定信息的多個(gè)標(biāo)識(shí)信息和所述預(yù)定信息進(jìn)行編碼;以及
[0542]打包單元,將編碼預(yù)定信息和編碼標(biāo)識(shí)信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中,并且生成編碼比特流。
[0543][11].根據(jù)[10]所述的編碼裝置,將預(yù)定第一標(biāo)識(shí)信息和基于所述預(yù)定信息計(jì)算出的第二標(biāo)識(shí)信息作為所述標(biāo)識(shí)信息存儲(chǔ)在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中。
[0544][12].根據(jù)[11]所述的編碼裝置,當(dāng)在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中所包括的所述第一標(biāo)識(shí)信息是預(yù)定特定信息、并且從能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域所讀出的所述第二標(biāo)識(shí)信息與基于所讀出的預(yù)定信息計(jì)算出的所述第二標(biāo)識(shí)信息相同時(shí),所述預(yù)定信息被確定為有效信息。
[0545][13].根據(jù)[11]或[12]所述的編碼裝置,所述預(yù)定信息布置在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中的所述第一標(biāo)識(shí)信息之后,以及當(dāng)所讀出的第一標(biāo)識(shí)信息是預(yù)定特定信息時(shí),開始讀出所述預(yù)定信息。
[0546][14].根據(jù)[11]至[13]中任一項(xiàng)所述的編碼裝置,進(jìn)一步將如下信息存儲(chǔ)在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中:用于指示執(zhí)行用于包括所述預(yù)定信息的信息的字節(jié)對(duì)齊的信息、和用于指示在基于通過所述字節(jié)對(duì)齊所獲得的信息計(jì)算出的所述第二標(biāo)識(shí)信息與在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中所存儲(chǔ)的所述第二標(biāo)識(shí)信息之間進(jìn)行比較的信息。
[0547][15].根據(jù)[14]所述的編碼裝置,在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中存儲(chǔ)在預(yù)定范圍中的任意數(shù)量的所述預(yù)定信息,以及當(dāng)通過所述字節(jié)對(duì)齊所獲得的信息不具有預(yù)定大小時(shí),所述預(yù)定信息被確定為無(wú)效信息。
[0548][16].根據(jù)[10]至[15]所述的編碼裝置,所述預(yù)定信息是與音頻數(shù)據(jù)有關(guān)的信息,所述編碼單元對(duì)所述音頻數(shù)據(jù)進(jìn)行編碼,以及所述打包單元將編碼音頻數(shù)據(jù)存儲(chǔ)在所述編碼比特流中。
[0549][17].—種編碼方法,包括:
[0550]對(duì)用于標(biāo)識(shí)是否存在預(yù)定信息的多個(gè)標(biāo)識(shí)信息和所述預(yù)定信息進(jìn)行編碼的步驟;以及
[0551]將編碼預(yù)定信息和編碼標(biāo)識(shí)信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中、并且生成編碼比特流的步驟。
[0552][18].一種使得計(jì)算機(jī)執(zhí)行處理的程序,所述處理包括:
[0553]對(duì)用于標(biāo)識(shí)是否存在預(yù)定信息的多個(gè)標(biāo)識(shí)信息和所述預(yù)定信息進(jìn)行編碼的步驟;以及
[0554]將編碼預(yù)定信息和編碼標(biāo)識(shí)信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中、并且生成編碼比特流的步驟。
[0555]附圖標(biāo)記列表
[0556]11編碼裝置
[0557]21輸入單元
[0558]22編碼單元
[0559]23打包單元
[0560]51解碼裝置
[0561]61分離單元
[0562]62解碼單元
[0563]63輸出單元
[0564]91編碼裝置
[0565]101 PCE編碼單元
[0566]102 DSE編碼單元
[0567]103音頻要素編碼單元
[0568]111同步字編碼單元
[0569]112布置信息編碼單元
[0570]113標(biāo)識(shí)信息編碼單元
[0571]114擴(kuò)展信息編碼單元
[0572]115降混信息編碼單元
[0573]141解碼裝置
[0574]152降混處理單元
[0575]161 PCE解碼單元
[0576]162 DSE解碼單元
[0577]163音頻要素解碼單元
[0578]171同步字檢測(cè)單元
[0579]172標(biāo)識(shí)信息計(jì)算單元
[0580]173擴(kuò)展檢測(cè)單元
[0581]174降混信息解碼單元
[0582]181重排處理單元
【權(quán)利要求】
1.一種解碼裝置,包括: 標(biāo)識(shí)信息檢測(cè)單元,從能夠存儲(chǔ)編碼比特流的任意數(shù)據(jù)的區(qū)域讀出用于標(biāo)識(shí)是否存在預(yù)定信息的標(biāo)識(shí)信息;以及 讀出單元,基于多個(gè)所述標(biāo)識(shí)信息、從能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域讀出所述預(yù)定信肩、O
2.根據(jù)權(quán)利要求1所述的解碼裝置, 其中,將預(yù)定第一標(biāo)識(shí)信息和基于所述預(yù)定信息計(jì)算出的第二標(biāo)識(shí)信息作為所述標(biāo)識(shí)信息存儲(chǔ)在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中。
3.根據(jù)權(quán)利要求2所述的解碼裝置, 其中,當(dāng)在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中所包括的所述第一標(biāo)識(shí)信息是預(yù)定特定信息、并且從能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域所讀出的所述第二標(biāo)識(shí)信息與基于所讀出的預(yù)定信息計(jì)算出的所述第二標(biāo)識(shí)信息相同時(shí),所述讀出單元確定所述預(yù)定信息是有效信息。
4.根據(jù)權(quán)利要求3所述的解碼裝置, 其中,當(dāng)所讀出的第一標(biāo)識(shí)信息是預(yù)定特定信息時(shí),所述讀出單元開始讀出布置在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中的所述第一標(biāo)識(shí)信息之后的所述預(yù)定信息。
5.根據(jù)權(quán)利要求4所述的解碼裝置, 其中,基于通過對(duì)于包括所述預(yù)定信息的信息執(zhí)行字節(jié)對(duì)齊所獲得的信息,計(jì)算所述第二標(biāo)識(shí)信息。
6.根據(jù)權(quán)利要求5所述的解碼裝置, 其中,在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中包括在預(yù)定范圍中的任意數(shù)量的所述預(yù)定信息,以及 當(dāng)通過所述字節(jié)對(duì)齊所獲得的信息不具有預(yù)定大小時(shí),所述讀出單元確定所述預(yù)定信息是無(wú)效息。
7.根據(jù)權(quán)利要求6所述的解碼裝置, 其中,所述預(yù)定信息是與音頻數(shù)據(jù)有關(guān)的信息,以及 所述解碼裝置還包括解碼單元,其對(duì)在所述編碼比特流中所包括的所述音頻數(shù)據(jù)進(jìn)行解碼。
8.一種解碼方法,包括: 從能夠存儲(chǔ)編碼比特流的任意數(shù)據(jù)的區(qū)域讀出用于標(biāo)識(shí)是否存在預(yù)定信息的標(biāo)識(shí)信息的步驟;以及 基于多個(gè)所述標(biāo)識(shí)信息、從能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域讀出所述預(yù)定信息的步驟。
9.一種使得計(jì)算機(jī)執(zhí)行處理的程序,所述處理包括: 從能夠存儲(chǔ)編碼比特流的任意數(shù)據(jù)的區(qū)域讀出用于標(biāo)識(shí)是否存在預(yù)定信息的標(biāo)識(shí)信息的步驟;以及 基于多個(gè)所述標(biāo)識(shí)信息、從能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域讀出所述預(yù)定信息的步驟。
10.一種編碼裝置,包括: 編碼單元,對(duì)用于標(biāo)識(shí)是否存在預(yù)定信息的多個(gè)標(biāo)識(shí)信息和所述預(yù)定信息進(jìn)行編碼;以及 打包單元,將編碼預(yù)定信息和編碼標(biāo)識(shí)信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中,并且生成編碼比特流。
11.根據(jù)權(quán)利要求10所述的編碼裝置, 其中,將預(yù)定第一標(biāo)識(shí)信息和基于所述預(yù)定信息計(jì)算出的第二標(biāo)識(shí)信息作為所述標(biāo)識(shí)信息存儲(chǔ)在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中。
12.根據(jù)權(quán)利要求11所述的編碼裝置, 其中,當(dāng)在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中所包括的所述第一標(biāo)識(shí)信息是預(yù)定特定信息、并且從能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域所讀出的所述第二標(biāo)識(shí)信息與基于所讀出的預(yù)定信息計(jì)算出的所述第二標(biāo)識(shí)信息相同時(shí),所述預(yù)定信息被確定為有效信息。
13.根據(jù)權(quán)利要求12所述的編碼裝置, 其中,所述預(yù)定 信息布置在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中的所述第一標(biāo)識(shí)信息之后,以及 當(dāng)所讀出的第一標(biāo)識(shí)信息是預(yù)定特定信息時(shí),開始讀出所述預(yù)定信息。
14.根據(jù)權(quán)利要求13所述的編碼裝置, 其中,進(jìn)一步將如下信息存儲(chǔ)在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中:用于指示執(zhí)行用于包括所述預(yù)定信息的信息的字節(jié)對(duì)齊的信息、和用于指示在基于通過所述字節(jié)對(duì)齊所獲得的信息計(jì)算出的所述第二標(biāo)識(shí)信息與在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中所存儲(chǔ)的所述第二標(biāo)識(shí)信息之間進(jìn)行比較的信息。
15.根據(jù)權(quán)利要求14所述的編碼裝置, 其中,在能夠存儲(chǔ)所述任意數(shù)據(jù)的區(qū)域中存儲(chǔ)在預(yù)定范圍中的任意數(shù)量的所述預(yù)定信息,以及 當(dāng)通過所述字節(jié)對(duì)齊所獲得的信息不具有預(yù)定大小時(shí),所述預(yù)定信息被確定為無(wú)效信肩、O
16.根據(jù)權(quán)利要求15所述的編碼裝置, 其中,所述預(yù)定信息是與音頻數(shù)據(jù)有關(guān)的信息, 所述編碼單元對(duì)所述音頻數(shù)據(jù)進(jìn)行編碼,以及 所述打包單元將編碼音頻數(shù)據(jù)存儲(chǔ)在所述編碼比特流中。
17.—種編碼方法,包括: 對(duì)用于標(biāo)識(shí)是否存在預(yù)定信息的多個(gè)標(biāo)識(shí)信息和所述預(yù)定信息進(jìn)行編碼的步驟;以及將編碼預(yù)定信息和編碼標(biāo)識(shí)信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中、并且生成編碼比特流的步驟。
18.一種使得計(jì)算機(jī)執(zhí)行處理的程序,所述處理包括: 對(duì)用于標(biāo)識(shí)是否存在預(yù)定信息的多個(gè)標(biāo)識(shí)信息和所述預(yù)定信息進(jìn)行編碼的步驟;以及將編碼預(yù)定信息和編碼標(biāo)識(shí)信息存儲(chǔ)在能夠存儲(chǔ)任意數(shù)據(jù)的區(qū)域中、并且生成編碼比特流的步驟。
【文檔編號(hào)】G10L19/20GK103748628SQ201380002770
【公開日】2014年4月23日 申請(qǐng)日期:2013年6月24日 優(yōu)先權(quán)日:2012年7月2日
【發(fā)明者】畠中光行, 知念徹 申請(qǐng)人:索尼公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1