亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

傳輸設(shè)備、傳輸方法、接收設(shè)備以及接收方法與流程

文檔序號:12513544閱讀:557來源:國知局
傳輸設(shè)備、傳輸方法、接收設(shè)備以及接收方法與流程

本公開涉及傳輸設(shè)備、傳輸方法、接收設(shè)備以及接收方法,并且具體涉及用于傳輸多種類型的音頻數(shù)據(jù)的傳輸設(shè)備等。



背景技術(shù):

常規(guī)地,作為立體(3D)聲技術(shù),已經(jīng)設(shè)計了用于通過基于元數(shù)據(jù)將編碼采樣數(shù)據(jù)映射到存在于任意位置的揚聲器來執(zhí)行渲染的技術(shù)(例如參見專利文獻1)。

引用列表

專利文獻

專利文獻1:日本專利申請國家公布(公開)第2014-520491號



技術(shù)實現(xiàn)要素:

本發(fā)明要解決的問題

可以認為包括編碼采樣數(shù)據(jù)和元數(shù)據(jù)的對象編碼數(shù)據(jù)與5.1信道、7.1信道等的信道編碼數(shù)據(jù)一起傳輸,并且可以在接收側(cè)實現(xiàn)具有增強的真實感的聲再現(xiàn)。

本技術(shù)的目的是當傳輸多種類型的音頻數(shù)據(jù)時減少接收側(cè)的處理負荷。

問題的解決方案

本技術(shù)的概念在于

傳輸設(shè)備,包括:

傳輸單元,用于傳輸具有包括多個組編碼數(shù)據(jù)的預(yù)定數(shù)量的音頻流的預(yù)定格式的容器;以及

信息插入單元,用于將表示多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息插入到容器的層中。

在本技術(shù)中,具有包括多個組編碼數(shù)據(jù)的預(yù)定數(shù)量的音頻流的預(yù)定格式的容器通過傳輸單元傳輸。例如,多個組編碼數(shù)據(jù)可以包括信道編碼數(shù)據(jù)和對象編碼數(shù)據(jù)中的任一個或兩個。

通過信息插入單元將表示多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息插入到容器的層中。例如,容器可以是在數(shù)字廣播標準中采用的傳送流(MPEG-2TS)。另外,例如,容器可以是在因特網(wǎng)傳遞等中使用的MP4的容器,或者是另一種格式的容器。

如上所述,在本技術(shù)中,表示包括在預(yù)定數(shù)量的音頻流中的多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息插入到容器的層中。因此,在接收側(cè),可以在對編碼數(shù)據(jù)進行解碼之前容易地辨識多個組編碼數(shù)據(jù)中的每一個的屬性,并且可以選擇性地僅解碼必要的組編碼數(shù)據(jù)以使用,并且可以減少處理負荷。

順便提及,在本技術(shù)中,例如,信息插入單元可以進一步將表示音頻流的流對應(yīng)信息插入到容器的層中,音頻流包括多個組編碼數(shù)據(jù)中的每一個。在這種情況下,例如,容器可以是MPEG2-TS,并且信息插入單元可以將屬性信息和流對應(yīng)信息插入到與存在于節(jié)目映射表之下的預(yù)定數(shù)量的音頻流中的任何一個音頻流對應(yīng)的音頻基本流循環(huán)。如上所述,流對應(yīng)信息插入到容器的層中,從而可以容易地辨識包括必要的組編碼數(shù)據(jù)的音頻流,并且可以在接收側(cè)減少處理負荷。

例如,流對應(yīng)信息可以是表示用于識別多個組編碼數(shù)據(jù)中的每一個的組標識符與用于識別預(yù)定數(shù)量的音頻流中的每一個的流的流標識符之間的對應(yīng)性的信息。在這種情況下,例如,信息插入單元可以進一步將表示預(yù)定數(shù)量的音頻流中的每一個的流標識符的流標識符信息插入到容器的層中。例如,容器可以是MPEG2-TS,并且信息插入單元可以將流標識符信息插入到與存在于節(jié)目映射表之下的預(yù)定數(shù)量的音頻流中的每一個對應(yīng)的音頻基本流循環(huán)中。

另外,例如,流對應(yīng)信息可以是表示用于識別多個組編碼數(shù)據(jù)中的每一個的組標識符與在對預(yù)定數(shù)量的音頻流中的每一個進行分包期間要附加的數(shù)據(jù)包標識符之間的對應(yīng)性的信息。另外,例如,流對應(yīng)信息可以是表示用于識別多個組編碼數(shù)據(jù)中的每一個的組標識符與表示預(yù)定數(shù)量的音頻流中的每一個的流類型的類型信息之間的對應(yīng)性的信息。

另外,本技術(shù)的另一個概念在于

接收設(shè)備,包括:

接收單元,用于接收具有包括多個組編碼數(shù)據(jù)的預(yù)定數(shù)量的音頻流的預(yù)定格式的容器,表示多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息被插入到容器的層中;以及

處理單元,用于基于屬性信息處理包括在所接收的容器中的預(yù)定數(shù)量的音頻流。

在本技術(shù)中,具有包括多個組編碼數(shù)據(jù)的預(yù)定數(shù)量的音頻流的預(yù)定格式的容器由接收單元接收。例如,多個組編碼數(shù)據(jù)可以包括信道編碼數(shù)據(jù)和對象編碼數(shù)據(jù)中的任一個或兩個。表示多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息被插入到容器的層中。通過處理單元基于屬性信息處理包括在所接收的容器中的預(yù)定數(shù)量的音頻流。

如上所述,在本技術(shù)中,基于表示插入到容器的層中的多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息,對包括在所接收的容器中的預(yù)定數(shù)量的音頻流執(zhí)行處理。為此,可以選擇性地僅解碼必要的組編碼數(shù)據(jù)以使用,并且可以減少處理負荷。

順便提及,在本技術(shù)中,例如,表示包括多個組編碼數(shù)據(jù)中的每一個的音頻流的流對應(yīng)信息可以進一步被插入到容器的層中,并且處理單元可以基于除了屬性信息之外的流對應(yīng)信息處理預(yù)定數(shù)量的音頻流。在這種情況下,可以容易地辨識包括必要的組編碼數(shù)據(jù)的音頻流,并且可以減少處理負荷。

另外,在本技術(shù)中,例如,處理單元可以基于屬性信息和流對應(yīng)信息,對包括組編碼數(shù)據(jù)的音頻流選擇性地執(zhí)行解碼處理,該組編碼數(shù)據(jù)保持符合揚聲器配置的屬性和用戶選擇信息。

另外,本技術(shù)的又一個概念在于

接收設(shè)備,包括:

接收單元,用于接收具有包括多個組編碼數(shù)據(jù)的預(yù)定數(shù)量的音頻流的預(yù)定格式的容器,表示多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息被插入到容器的層中;

處理單元,用于從包含在所接收的容器中的預(yù)定數(shù)量的音頻流中基于屬性信息選擇性地獲取預(yù)定組編碼數(shù)據(jù),并且重新配置包括預(yù)定組編碼數(shù)據(jù)的音頻流;以及

流傳輸單元,用于將在處理單元中重新配置的音頻流傳輸?shù)酵獠吭O(shè)備。

在本技術(shù)中,具有包括多個組編碼數(shù)據(jù)的預(yù)定數(shù)量的音頻流的預(yù)定格式的容器由接收單元接收。表示多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息被插入到容器的層中。通過處理單元從預(yù)定數(shù)量的音頻流中基于屬性信息選擇性地獲取預(yù)定組編碼數(shù)據(jù),并且重新配置包括預(yù)定組編碼數(shù)據(jù)的音頻流。然后,通過流傳輸單元將重新配置的音頻流傳輸?shù)酵獠吭O(shè)備。

如上所述,在本技術(shù)中,基于表示插入到容器的層中的多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息,從預(yù)定數(shù)量的音頻流中選擇性地獲取預(yù)定組編碼數(shù)據(jù),并且重新配置要傳輸?shù)酵獠吭O(shè)備的音頻流??梢匀菀椎孬@取必要的組編碼數(shù)據(jù),并且可以減少處理負荷。

順便提及,在本技術(shù)中,例如,表示包括多個組編碼數(shù)據(jù)中的每一個的音頻流的流對應(yīng)信息可以進一步被插入到容器的層中,并且處理單元可以基于除了屬性信息之外的流對應(yīng)信息從預(yù)定數(shù)量的音頻流中選擇性地獲取預(yù)定組編碼數(shù)據(jù)。在這種情況下,可以容易地辨識包括預(yù)定組編碼數(shù)據(jù)的音頻流,并且可以減少處理負荷。

本發(fā)明的效果

根據(jù)本技術(shù),當傳輸多種類型的音頻數(shù)據(jù)時,可以減少接收側(cè)的處理負荷。順便提及,本說明書中描述的有利效果僅僅是示例,并且本技術(shù)的有利效果不限于此,并且可以包括額外的效果。

附圖說明

圖1是示出作為實施方式的傳輸/接收系統(tǒng)的示例配置的框圖。

圖2是示出3D音頻傳輸數(shù)據(jù)中的音頻幀(1024個采樣)的結(jié)構(gòu)的圖。

圖3是示出3D音頻傳輸數(shù)據(jù)的示例配置的圖。

圖4(a)和圖4(b)是分別示意性地示出當以一個流執(zhí)行3D音頻傳輸數(shù)據(jù)的傳輸時以及當以多個流執(zhí)行傳輸時的音頻幀的示例配置的圖。

圖5是示出當在3D音頻傳輸數(shù)據(jù)的示例配置中以三個流執(zhí)行傳輸時的組劃分實例的圖。

圖6是示出在組劃分實例(三個劃分)等中的組和子流之間的對應(yīng)性的圖。

圖7是示出在3D音頻傳輸數(shù)據(jù)的示例配置中以兩個流執(zhí)行傳輸?shù)慕M劃分實例的圖。

圖8是示出在組劃分實例(兩個劃分)等中的組和子流之間的對應(yīng)性的圖。

圖9是示出服務(wù)傳輸器中包括的流生成單元的示例配置的框圖。

圖10是示出3D音頻流配置描述符的結(jié)構(gòu)實例的圖。

圖11是示出3D音頻流配置描述符的結(jié)構(gòu)實例中的主要信息的細節(jié)的圖。

圖12(a)和圖12(b)是分別示出3D音頻子流ID描述符的結(jié)構(gòu)實例和結(jié)構(gòu)實例中的主要信息的細節(jié)的圖。

圖13是示出傳送流的示例配置的圖。

圖14是示出服務(wù)接收器的示例配置的框圖。

圖15是示出服務(wù)接收器中的CPU的音頻解碼控制處理的實例的流程圖。

圖16是示出服務(wù)接收器的另一示例配置的框圖。

具體實施方式

以下是對實現(xiàn)本發(fā)明的模式的描述(在下文中將該模式稱為“實施方式”)。順便提及,將按照以下順序進行說明。

1.實施方式

2.變形

<1.實施方式>

[傳輸/接收系統(tǒng)的示例配置]

圖1示出作為實施方式的傳輸/接收系統(tǒng)10的示例配置。傳輸/接收系統(tǒng)10由服務(wù)傳輸器100和服務(wù)接收器200配置。服務(wù)傳輸器100傳輸加載在廣播波或網(wǎng)絡(luò)數(shù)據(jù)包上的傳送流TS。傳送流TS具有視頻流和包括多個組編碼數(shù)據(jù)的預(yù)定數(shù)量的音頻流。

圖2示出了在該實施方式中處理的3D音頻傳輸數(shù)據(jù)中的音頻幀(1024個采樣)的結(jié)構(gòu)。音頻幀包括多個MPEG音頻流數(shù)據(jù)包(mpeg Audio Stream Packet)。MPEG音頻流數(shù)據(jù)包中的每一個通過報頭(Header)和有效載荷(Payload)配置。

報頭保持諸如數(shù)據(jù)包類型(Packet Type)、數(shù)據(jù)包標簽(Packet Label)以及數(shù)據(jù)包長度(Packet Length)的信息。由報頭的數(shù)據(jù)包類型定義的信息布置在有效載荷中。在有效載荷信息中,存在與同步開始碼對應(yīng)的“SYNC”信息、作為3D音頻傳輸數(shù)據(jù)的實際數(shù)據(jù)的“幀(Frame)”信息以及表示“幀”信息的配置的“Config”信息。

“幀”信息包括配置3D音頻傳輸數(shù)據(jù)的對象編碼數(shù)據(jù)和信道編碼數(shù)據(jù)。這里,信道編碼數(shù)據(jù)通過諸如單信道元素(SCE)、信道對元素(CPE)以及低頻元素(LFE)的編碼采樣數(shù)據(jù)配置。另外,對象編碼數(shù)據(jù)通過單通道元素(SCE)的編碼采樣數(shù)據(jù)以及用于通過將編碼采樣數(shù)據(jù)映射到存在于任意位置的揚聲器而執(zhí)行渲染的元數(shù)據(jù)來配置。元數(shù)據(jù)包括為擴展元素(Ext_element)。

圖3示出3D音頻傳輸數(shù)據(jù)的示例配置。該實例包括一個信道編碼數(shù)據(jù)和兩個對象編碼數(shù)據(jù)。該一個信道編碼數(shù)據(jù)是5.1信道的信道編碼數(shù)據(jù)(CD),并且包括SCE1、CPE1.1、CPE1.2、LFE1的編碼采樣數(shù)據(jù)。

兩個對象編碼數(shù)據(jù)是沉浸式音頻對象(Immersive audio object:IAO)編碼數(shù)據(jù)和語音對話對象(Speech Dialog object:SDO)編碼數(shù)據(jù)。沉浸式音頻對象編碼數(shù)據(jù)是用于沉浸式聲音的對象編碼數(shù)據(jù),并且包括編碼采樣數(shù)據(jù)SCE2以及用于通過將編碼采樣數(shù)據(jù)映射到存在于任意位置的揚聲器來執(zhí)行渲染的元數(shù)據(jù)EXE_E1(Object metadata(對象元數(shù)據(jù)))2。

語音對話對象編碼數(shù)據(jù)是用于語音語言的對象編碼數(shù)據(jù)。在該實例中,存在分別對應(yīng)于語言1和語言2的語音對話對象編碼數(shù)據(jù)。對應(yīng)于語言1的語音對話對象編碼數(shù)據(jù)包括編碼采樣數(shù)據(jù)SCE3以及用于通過將編碼采樣數(shù)據(jù)映射到存在于任意位置的揚聲器來執(zhí)行渲染的元數(shù)據(jù)EXE_E1(Object metadata)3。另外,對應(yīng)于語言2的語音對話對象編碼數(shù)據(jù)包括編碼采樣數(shù)據(jù)SCE4以及用于通過將編碼采樣數(shù)據(jù)映射到存在于任意位置的揚聲器來執(zhí)行渲染的元數(shù)據(jù)EXE_E1(Object metadata)4。

編碼數(shù)據(jù)通過組(Group)以類型的概念來區(qū)分。在所示的實例中,5.1信道的編碼信道數(shù)據(jù)在組1中,沉浸式音頻對象編碼數(shù)據(jù)在組2中,語言1的語音對話對象編碼數(shù)據(jù)在組3中,并且語言2的語音對話對象編碼數(shù)據(jù)在組4中。

另外,可以在接收側(cè)的組之間選擇的數(shù)據(jù)注冊到切換組(SW Group),并對該數(shù)據(jù)進行編碼。另外,可以將組捆綁到預(yù)設(shè)組(preset Group)中,并且可以根據(jù)用戶情況來再現(xiàn)組。在所示實例中,組1、組2和組3捆綁到預(yù)設(shè)組1中,并且組1、組2和組4捆綁到預(yù)設(shè)組2中。

返回圖1,如上所述,服務(wù)傳輸器100以一個流或多個流(Multiple stream)傳輸包括多個組編碼數(shù)據(jù)的3D音頻傳輸數(shù)據(jù)。

圖4(a)示意性地示出在圖3的3D音頻傳輸數(shù)據(jù)的示例配置中當以一個流執(zhí)行傳輸時的音頻幀的示例配置。在這種情況下,該一個流包括信道編碼數(shù)據(jù)(CD)、沉浸式音頻對象編碼數(shù)據(jù)(IAO)、和語音對話對象編碼數(shù)據(jù)(SDO)、以及“SYNC”信息和“Config”信息。

圖4(b)示意性地示出在圖3的3D音頻傳輸數(shù)據(jù)的示例配置中當以多個流(如果適當?shù)脑?,流中的每一個稱為“子流”)(這里是三個流)執(zhí)行傳輸時的音頻幀的示例配置。在這種情況下,子流1包括信道編碼數(shù)據(jù)(CD)以及“SYNC”信息和“Config”信息。另外,子流2包括沉浸式音頻對象編碼數(shù)據(jù)(IAO)以及“SYNC”信息和“Config”信息。此外,子流3包括語音對話對象編碼數(shù)據(jù)(SDO)以及“SYNC”信息和“Config”信息。

圖5示出在圖3的3D音頻傳輸數(shù)據(jù)的示例配置中當以三個流執(zhí)行傳輸時的組劃分實例。在這種情況下,子流1包括區(qū)分為組1的信道編碼數(shù)據(jù)(CD)。此外,子流2包括區(qū)分為組2的沉浸式音頻對象編碼數(shù)據(jù)(IAO)。此外,子流3包括區(qū)分為組3的語言1的語音對話對象編碼數(shù)據(jù)(SDO)以及區(qū)分為組4的語言2的語音對話對象編碼數(shù)據(jù)(SDO)。

圖6示出圖5的組劃分實例(三個劃分)中的組和子流之間的對應(yīng)性等。這里,組ID(group ID)是用于識別組的標識符。屬性(attribute)表示組編碼數(shù)據(jù)中的每一個的屬性。切換組ID(switch Group ID)是用于識別切換組的標識符。預(yù)設(shè)組ID(preset Group ID)是用于識別預(yù)設(shè)組的標識符。子流ID(sub Stream ID)是用于識別子流的標識符。

所示的對應(yīng)表示屬于組1的編碼數(shù)據(jù)是信道編碼數(shù)據(jù)、不配置切換組、并且數(shù)據(jù)包括在子流1中。另外,所示的對應(yīng)表示屬于組2的編碼數(shù)據(jù)是用于沉浸式聲音的對象編碼數(shù)據(jù)(沉浸式音頻對象編碼數(shù)據(jù))、不配置切換組、并且數(shù)據(jù)包括在子流2中。

另外,所示的對應(yīng)表示屬于組3的編碼數(shù)據(jù)是用于語言1的語音語言的對象編碼數(shù)據(jù)(語音對話對象編碼數(shù)據(jù))、配置切換組1、并且數(shù)據(jù)包括在子流3中。另外,所示的對應(yīng)表示屬于組4的編碼數(shù)據(jù)是用于語言2的語音語言的對象編碼數(shù)據(jù)(語音對話對象編碼數(shù)據(jù))、配置切換組1、并且數(shù)據(jù)包括在子流3中。

另外,所示的對應(yīng)表示預(yù)設(shè)組1包括組1、組2和組3。此外,所示的對應(yīng)表示預(yù)設(shè)組2包括組1、組2和組4。

圖7示出在圖3的3D音頻傳輸數(shù)據(jù)的示例配置中以兩個流執(zhí)行傳輸?shù)慕M劃分實例。在這種情況下,子流1包括區(qū)分為組1的信道編碼數(shù)據(jù)(CD)以及區(qū)分為組2的沉浸式音頻對象編碼數(shù)據(jù)(IAO)。另外,子流2包括區(qū)分為組3的語言1的語音對話對象編碼數(shù)據(jù)(SDO)以及區(qū)分為組4的語言2的語音對話對象編碼數(shù)據(jù)(SDO)。

圖8示出圖7的組劃分實例(兩個劃分)中的組和子流之間的對應(yīng)性等。所示的對應(yīng)表示屬于組1的編碼數(shù)據(jù)是信道編碼數(shù)據(jù)、不配置切換組、并且數(shù)據(jù)包括在子流1中。另外,所示的對應(yīng)表示屬于組2的編碼數(shù)據(jù)是用于沉浸式聲音的對象編碼數(shù)據(jù)(immersive audio object encoded data(沉浸式音頻對象編碼數(shù)據(jù)))、不配置切換組、并且數(shù)據(jù)包括在子流1中。

另外,所示的對應(yīng)表示屬于組3的編碼數(shù)據(jù)是用于語言1的語音語言的對象編碼數(shù)據(jù)(speech dialog object encoded data(語音對話對象編碼數(shù)據(jù)))、配置切換組1、并且數(shù)據(jù)包括在子流2中。另外,所示的對應(yīng)表示屬于組4的編碼數(shù)據(jù)是用于語言2的語音語言的對象編碼數(shù)據(jù)(speech dialog object encoded data(語音對話對象編碼數(shù)據(jù)))、配置切換組1、并且數(shù)據(jù)包括在子流2中。

另外,所示的對應(yīng)表示預(yù)設(shè)組1包括組1、組2和組3。此外,所示的對應(yīng)表示預(yù)設(shè)組2包括組1、組2和組4。

返回圖1,服務(wù)傳輸器100將表示包括在3D音頻傳輸數(shù)據(jù)中的多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息插入到容器的層中。另外,服務(wù)傳輸器100將表示包括多個組編碼數(shù)據(jù)中的每一個的音頻流的流對應(yīng)信息插入到容器的層中。在本實施方式中,例如,流對應(yīng)信息是表示組ID與流標識符之間的對應(yīng)性的信息。

例如,服務(wù)傳輸器100將這些屬性信息和流對應(yīng)信息作為描述符插入存在于節(jié)目映射表(Program Map Table:PMT)之下的預(yù)定數(shù)量的音頻流中的任何一個音頻流(例如對應(yīng)于最基礎(chǔ)流的音頻基本流循環(huán))內(nèi)。

另外,服務(wù)傳輸器100將表示預(yù)定數(shù)量的音頻流中的每一個的流標識符的流標識符信息插入到容器的層中。例如,服務(wù)傳輸器100將流標識符信息作為描述符插入到與存在于節(jié)目映射表(Program Map Table:PMT)之下的預(yù)定數(shù)量的音頻流中的每一個對應(yīng)的音頻基本流循環(huán)中。

服務(wù)接收器200接收加載在廣播波或網(wǎng)絡(luò)數(shù)據(jù)包上并從服務(wù)傳輸器100傳輸?shù)膫魉土鱐S。如上所述,除了視頻流之外,傳送流TS還具有預(yù)定數(shù)量的音頻流,音頻流包括配置3D音頻傳輸數(shù)據(jù)的多個組編碼數(shù)據(jù)。然后,表示包括在3D音頻傳輸數(shù)據(jù)中的多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息以及表示包括多個組編碼數(shù)據(jù)中的每一個的音頻流的流對應(yīng)信息插入到容器的層中。

服務(wù)接收器200基于屬性信息和流對應(yīng)信息對包括組編碼數(shù)據(jù)的音頻流選擇性地執(zhí)行解碼處理并且獲得3D音頻的音頻輸出,其中該組編碼數(shù)據(jù)保持符合揚聲器配置的屬性和用戶選擇信息。

[服務(wù)傳輸器的流生成單元]

圖9示出包括在服務(wù)傳輸器100中的流生成單元110的示例配置。流生成單元110具有視頻編碼器112、音頻編碼器113以及復用器114。這里,假設(shè)音頻傳輸數(shù)據(jù)由一個編碼信道數(shù)據(jù)和兩個對象編碼數(shù)據(jù)構(gòu)成,如圖3所示。

視頻編碼器112輸入視頻數(shù)據(jù)SV,并且對視頻數(shù)據(jù)SV執(zhí)行編碼以生成視頻流(視頻基本流)。音頻編碼器113輸入信道數(shù)據(jù)和沉浸式音頻和語音對話對象數(shù)據(jù)作為音頻數(shù)據(jù)SA。

音頻編碼器113對音頻數(shù)據(jù)SA執(zhí)行編碼,并獲得3D音頻傳輸數(shù)據(jù)。3D音頻傳輸數(shù)據(jù)包括信道編碼數(shù)據(jù)(CD)、沉浸式音頻對象編碼數(shù)據(jù)(IAO)以及語音對話對象編碼數(shù)據(jù)(SDO),如圖3所示。然后,音頻編碼器113生成包括多個(這里是四個)組編碼數(shù)據(jù)(參見圖4(a)、圖4(b))的一個或多個音頻流(音頻基本流)。

復用器114將從音頻編碼器113輸出的預(yù)定數(shù)量的音頻流和從視頻編碼器112輸出的視頻流中的每一個分包為PES數(shù)據(jù)包,并且進一步分包為傳送數(shù)據(jù)包以對流進行復用,并獲得傳送流TS作為復用流。

另外,復用器114將表示多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息和表示包括多個組編碼數(shù)據(jù)中的每一個的音頻流的流對應(yīng)信息插入到節(jié)目映射表(PMT)之下。例如,復用器114通過使用3D音頻流配置描述符(3Daudio_stream_config_descriptor)將這些條信息插入到對應(yīng)于最基礎(chǔ)流的音頻基本流循環(huán)中。稍后將詳細描述描述符。

另外,復用器114將表示預(yù)定數(shù)量的音頻流中的每一個的流標識符的流標識符信息插入到節(jié)目映射表(PMT)之下。復用器114通過使用3D音頻子流ID描述符(3Daudio_substreamID_descriptor)將信息插入到與預(yù)定數(shù)量的音頻流中的每一個對應(yīng)的音頻基本流循環(huán)中。稍后將詳細描述描述符。

現(xiàn)在簡要描述圖9所示的流生成單元110的操作。將視頻數(shù)據(jù)提供給視頻編碼器112。在視頻編碼器112中,對視頻數(shù)據(jù)SV執(zhí)行編碼,并且生成包括編碼視頻數(shù)據(jù)的視頻流。將視頻流提供給復用器114。

音頻數(shù)據(jù)SA提供給音頻編碼器113。音頻數(shù)據(jù)SA包括信道數(shù)據(jù)以及沉浸式音頻和語音對話對象數(shù)據(jù)。在音頻編碼器113中,對音頻數(shù)據(jù)SA執(zhí)行編碼,并且獲得3D音頻傳輸數(shù)據(jù)。

除了信道編碼數(shù)據(jù)(CD)(參見圖3)之外,3D音頻傳輸數(shù)據(jù)還包括沉浸式音頻對象編碼數(shù)據(jù)(IAO)和語音對話對象編碼數(shù)據(jù)(SDO)。然后,在音頻編碼器113中,生成包括四個組編碼數(shù)據(jù)的一個或多個音頻流(參見圖4(a)、圖4(b))。

由視頻編碼器112生成的視頻流提供給復用器114。另外,由音頻編碼器113生成的音頻流提供給復用器114。在復用器114中,將從每個編碼器提供的流分包為PES數(shù)據(jù)包,并且進一步分包為要進行復用的傳送數(shù)據(jù)包,并且獲得傳送流TS作為復用流。

另外,在復用器114中,例如,3D音頻流配置描述符插入到對應(yīng)于最基礎(chǔ)流的音頻基本流循環(huán)中。描述符包括表示多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息以及表示包括多個組編碼數(shù)據(jù)中的每一個的音頻流的流對應(yīng)信息。

另外,在復用器114中,3D音頻子流ID描述符插入到與預(yù)定數(shù)量的音頻流中的每一個對應(yīng)的音頻基本流循環(huán)中。描述符包括表示預(yù)定數(shù)量的音頻流中的每一個的流標識符的流標識符信息。

[3D音頻流配置描述符的細節(jié)]

圖10示出3D音頻流配置描述符(3Daudio_stream_config_descriptor)的結(jié)構(gòu)實例(語法)。另外,圖11示出結(jié)構(gòu)實例中的主要信息(語義)的細節(jié)。

“descriptor_tag”的8位字段表示描述符類型。這里,表示描述符是3D音頻流配置描述符?!癲escriptor_length”的8位字段表示描述符的長度(大小),并且表示后續(xù)字節(jié)的數(shù)量作為描述符的長度。

“NumOfGroups,N”的8位字段表示組的數(shù)量?!癗umOfPresetGroups,P”的八位字段表示預(yù)設(shè)組的數(shù)量。“groupID”的8位字段、“attribute_of_groupID”的8位字段、“SwitchGroupID”的8位字段以及“audio_substreamID”的8位字段按組的數(shù)量重復。

“groupID”的字段表示組標識符?!癮ttribute_of_groupID”的字段表示組編碼數(shù)據(jù)的屬性?!癝witchGroupID”的字段是表示該組所屬的切換組的標識符。“0”表示該組不屬于任何切換組。除了“0”之外的,表示被引起屬于的切換組?!癮udio_substreamID”是表示包括該組的音頻子流的標識符。

另外,“presetGroupID”的8位字段和“NumOfGroups_in_preset,R”的8位字段按預(yù)設(shè)組的數(shù)量重復?!皃resetGroupID”的字段是表示預(yù)先設(shè)置組的捆綁的標識符?!癗umOfGroups_in_preset,R”的字段表示屬于預(yù)設(shè)組的組的數(shù)量。然后,對于每個預(yù)設(shè)組,“groupID”的8位字段按屬于該預(yù)設(shè)組的組的數(shù)量重復,并且表示了屬于預(yù)設(shè)組的組。描述符可以布置在擴展描述符之下。

[3D音頻子流ID描述符的細節(jié)]

圖12(a)示出3D音頻子流ID描述符(3Daudio_substreamID_descriptor)的結(jié)構(gòu)實例(語法)。另外,圖12(b)示出結(jié)構(gòu)實例中的主要信息(語義)的細節(jié)。

“descriptor_tag”的8位字段表示描述符類型。這里,表示描述符是3D音頻子流ID描述符?!癲escriptor_length”的8位字段表示描述符的長度(大小),并且表示后續(xù)字節(jié)的數(shù)量作為描述符的長度?!癮udio_substreamID”的8位字段表示音頻子流標識符。描述符可以布置在擴展描述符之下。

[傳送流TS的配置]

圖13示出傳送流TS的示例配置。該示例配置對應(yīng)于在3D音頻傳輸數(shù)據(jù)的兩個流中執(zhí)行傳輸?shù)那闆r(參見圖7)。在示例配置中,存在由PID1識別的視頻流PES數(shù)據(jù)包“視頻PES”。另外,在示例配置中,存在分別由PID2、PID3識別的兩個音頻流(音頻子流)PES數(shù)據(jù)包“音頻PES”。PES數(shù)據(jù)包包括PES報頭(PES_header)和PES有效載荷(PES_payload)。在PES報頭中,插入DTS、PTS的時間戳。適當?shù)馗郊覲ID2和PID3的時間戳,使得在復用期間時間戳彼此匹配,從而可以為整個系統(tǒng)確保時間戳之間的同步。

這里,由PID2識別的音頻流PES數(shù)據(jù)包“音頻PES”包括區(qū)分為組1的信道編碼數(shù)據(jù)(CD)和區(qū)分為組2的沉浸式音頻對象編碼數(shù)據(jù)(IAO)。此外,由PID3識別的音頻流PES數(shù)據(jù)包“音頻PES”包括區(qū)分為組3的語言1的語音對話對象編碼數(shù)據(jù)(SDO)和區(qū)分為組4的語言2的語音對話對象編碼數(shù)據(jù)(SDO)。

另外,傳送流TS包括作為節(jié)目特定信息(PSI)的節(jié)目映射表(PMT)。PSI是表示包括在傳送流中的每個基本流所屬的節(jié)目的信息。在PMT中,存在描述與整個節(jié)目相關(guān)的信息的節(jié)目循環(huán)(節(jié)目循環(huán)(Program loop))。

另外,在PMT中,存在保持與每個基本流相關(guān)的信息的基本流循環(huán)。在示例配置中,存在對應(yīng)于視頻流的視頻基本流循環(huán)(video ES loop),并且分別存在對應(yīng)于兩個音頻流的音頻基本流循環(huán)(audio ES loop)。

在視頻基本流循環(huán)(video ES loop)中,布置對應(yīng)于視頻流的諸如流類型和PID(數(shù)據(jù)包標識符)的信息,并且還布置描述與視頻流相關(guān)的信息的描述符。如上所述,視頻流的“Stream_type”的值設(shè)為“0x24”,并且PID信息表示被賦予視頻流PES數(shù)據(jù)包“video PES”的PID1。HEVC描述符布置為描述符之一。

另外,在音頻基本流循環(huán)(audio ES loop)中,布置對應(yīng)于音頻流的諸如流類型和PID(數(shù)據(jù)包標識符)的信息,并且還布置描述與音頻相關(guān)的信息的描述符。如上所述,音頻流的“Stream_type”的值設(shè)為“0x2C”,并且PID信息表示被賦予音頻流PES數(shù)據(jù)包“audio PES”的PID2。

在與由PID2識別的音頻流對應(yīng)的音頻基本流循環(huán)(audio ES loop)中,布置上述3D音頻流配置描述符和3D音頻子流ID描述符兩者。另外,在與由PID2識別的音頻流對應(yīng)的音頻基本流循環(huán)(audio ES loop)中,僅布置上述3D音頻子流ID描述符。

[服務(wù)接收器的示例配置]

圖14示出服務(wù)接收器200的示例配置。服務(wù)接收器200具有接收單元201、解復用器202、視頻解碼器203、視頻處理電路204、面板驅(qū)動電路205以及顯示面板206。另外,服務(wù)接收器200具有復用緩沖器211-1至211-N、組合器212、3D音頻解碼器213、音頻輸出處理電路214以及揚聲器系統(tǒng)215。另外,服務(wù)接收器200具有CPU 221、閃速ROM 222、DRAM 223、內(nèi)部總線224、遠程控制接收單元225以及遠程控制傳輸器226。

CPU 221控制服務(wù)接收器200中的每個單元的操作。閃速ROM 222存儲控制軟件并保持數(shù)據(jù)。DRAM 223配置CPU 221的工作區(qū)域。CPU 221將從閃速ROM 222讀取的軟件和數(shù)據(jù)部署在DRAM 223上,并激活軟件以控制服務(wù)接收器200的每個單元。

遠程控制接收單元225接收從遠程控制傳輸器226傳輸?shù)倪h程控制信號(遠程控制代碼),并將該信號提供給CPU 221。CPU 221基于遠程控制代碼控制服務(wù)接收器200的每個單元。CPU 221、閃速ROM 222以及DRAM 223連接到內(nèi)部總線224。

接收單元201接收加載在廣播波或網(wǎng)絡(luò)數(shù)據(jù)包上并從服務(wù)傳輸器100傳輸?shù)膫魉土鱐S。除了視頻流之外,傳送流TS還具有預(yù)定數(shù)量的音頻流,音頻流包括配置3D音頻傳輸數(shù)據(jù)的多個組編碼數(shù)據(jù)。

解復用器202從傳送流TS提取視頻流數(shù)據(jù)包,并將數(shù)據(jù)包傳輸?shù)揭曨l解碼器203。視頻解碼器203對來自通過解復用器202提取的視頻數(shù)據(jù)包的視頻流進行重新配置,并且執(zhí)行解碼處理以獲得未壓縮的視頻數(shù)據(jù)。

視頻處理電路204對通過視頻解碼器203獲得的視頻數(shù)據(jù)執(zhí)行縮放處理、圖像質(zhì)量調(diào)節(jié)處理等,并獲得用于顯示的視頻數(shù)據(jù)。面板驅(qū)動電路205基于通過視頻處理電路204獲得的用于顯示的圖像數(shù)據(jù)來驅(qū)動顯示面板206。例如,顯示面板206由液晶顯示器(LCD)、有機電致發(fā)光(EL)顯示器配置。

另外,解復用器202從傳送流TS提取諸如各種描述符的信息,并將該信息傳輸?shù)紺PU 221。各種描述符包括上述3D音頻流配置描述符(3Daudio_stream_config_descriptor)和3D音頻子流ID描述符(3Daudio_substreamID_descriptor)(參見圖13)。

CPU 221基于包括在這些描述符中的表示組編碼數(shù)據(jù)中的每一個的屬性的屬性信息、表示包括每個組的音頻流(子流)的流關(guān)系信息等,辨識包括保持符合揚聲器配置的屬性和觀看者(用戶)選擇信息的組編碼數(shù)據(jù)的音頻流。

另外,在CPU 221的控制下,解復用器202通過PID過濾器選擇性地提取包括在傳送流TS中的預(yù)定數(shù)量的音頻流中的一個或多個音頻流數(shù)據(jù)包,其中音頻流數(shù)據(jù)包包括保持符合揚聲器配置的屬性和觀看者(用戶)選擇信息的組編碼數(shù)據(jù)。

復用緩沖器211-1至211-N分別接納由解復用器202提取的音頻流。這里,復用緩沖器211-1至211-N的數(shù)量N是必要且充分的數(shù)量,并且由解復用器202提取的音頻流的數(shù)量在實際操作中使用。

組合器212從分別接納由復用緩沖器211-1至211-N的解復用器202提取的音頻流的復用緩沖器中的每一個讀取對于每個音頻幀的音頻流,并將音頻流作為保持符合揚聲器配置的屬性和觀看者(用戶)選擇信息的組編碼數(shù)據(jù)提供給3D音頻解碼器213。

3D音頻解碼器213對從組合器212提供的編碼數(shù)據(jù)執(zhí)行解碼處理,并且獲得用于驅(qū)動揚聲器系統(tǒng)215中的每個揚聲器的音頻數(shù)據(jù)。這里可以考慮三種情況,其中要經(jīng)歷解碼處理的編碼數(shù)據(jù)僅包括信道編碼數(shù)據(jù)的情況、編碼數(shù)據(jù)僅包括對象編碼數(shù)據(jù)的情況以及進一步編碼數(shù)據(jù)包括信道編碼數(shù)據(jù)和對象編碼數(shù)據(jù)兩者的情況。

當對信道編碼數(shù)據(jù)進行解碼時,3D音頻解碼器213對揚聲器系統(tǒng)215的揚聲器配置執(zhí)行下混和上混的處理,并獲得用于驅(qū)動每個揚聲器的音頻數(shù)據(jù)。另外,當對對象編碼數(shù)據(jù)進行解碼時,3D音頻解碼器213基于對象信息(元數(shù)據(jù))計算揚聲器渲染(對于每個揚聲器的混合比率),并且根據(jù)計算結(jié)果將對象音頻數(shù)據(jù)與用于驅(qū)動每個揚聲器的音頻數(shù)據(jù)混合。

音頻輸出處理電路214對通過3D音頻解碼器213獲得的用于驅(qū)動每個揚聲器的音頻數(shù)據(jù)執(zhí)行必要的處理(諸如D/A轉(zhuǎn)換和放大),并將音頻數(shù)據(jù)提供給揚聲器系統(tǒng)215。揚聲器系統(tǒng)215包括多個信道的多個揚聲器,例如2信道、5.1信道、7.1信道以及22.2信道。

現(xiàn)在簡要描述圖14所示的服務(wù)接收器200的操作。在接收單元201中,接收加載在廣播波或網(wǎng)絡(luò)數(shù)據(jù)包上并從服務(wù)傳輸器100傳輸?shù)膫魉土鱐S。除了視頻流之外,傳送流TS還具有預(yù)定數(shù)量的音頻流,音頻流包括配置3D音頻傳輸數(shù)據(jù)的多個組編碼數(shù)據(jù)。傳送流TS提供給解復用器202。

在解復用器202中,從傳送流TS提取視頻流數(shù)據(jù)包,并且將頻流數(shù)據(jù)包提供給視頻解碼器203。在視頻解碼器203中,從由解復用器202提取的視頻數(shù)據(jù)包重新配置視頻流,并且執(zhí)行解碼處理,并獲得未壓縮的視頻數(shù)據(jù)。視頻數(shù)據(jù)提供給視頻處理電路204。

在視頻處理電路204中,對通過視頻解碼器203獲得的視頻數(shù)據(jù)執(zhí)行縮放處理、圖像質(zhì)量調(diào)節(jié)處理等,并且獲得用于顯示的視頻數(shù)據(jù)。用于顯示的視頻數(shù)據(jù)提供給面板驅(qū)動電路205。在面板驅(qū)動電路205中,基于用于顯示的視頻數(shù)據(jù)來驅(qū)動顯示面板206。因此,在顯示面板206上顯示與用于顯示的視頻數(shù)據(jù)對應(yīng)的圖像。

另外,在解復用器202中,從傳送流TS提取諸如各種描述符的信息,并且將該信息傳輸?shù)紺PU 221。各種描述符包括3D音頻流配置描述符和3D音頻子流ID描述符。在CPU 221中,基于包括在這些描述符中的屬性信息、流關(guān)系信息等,辨識包括保持符合揚聲器配置的屬性和觀看者(用戶)選擇信息的組編碼數(shù)據(jù)的音頻流(子流)。

另外,在解復用器202中,在CPU 221的控制下,通過PID過濾器選擇性地提取包括在傳送流TS中的預(yù)定數(shù)量的音頻流中的一個或多個音頻流數(shù)據(jù)包,音頻流數(shù)據(jù)包包括保持符合揚聲器配置的屬性和觀看者選擇信息的組編碼數(shù)據(jù)。

通過解復用器202提取的音頻流分別接納在復用緩沖器211-1至211-N的對應(yīng)的復用緩沖器中。在組合器212中,從分別接納音頻流的復用緩沖器中的每一個對于每個音頻幀讀取音頻流,并且將音頻流作為保持符合揚聲器配置的屬性和觀看者選擇信息的組編碼數(shù)據(jù)提供給3D音頻解碼器213。

在3D音頻解碼器213中,對從組合器212提供的編碼數(shù)據(jù)執(zhí)行解碼處理,并且獲得用于驅(qū)動揚聲器系統(tǒng)215中的每個揚聲器的音頻數(shù)據(jù)。

這里,當解碼了信道編碼數(shù)據(jù)時,對揚聲器系統(tǒng)215的揚聲器配置執(zhí)行下混和上混的處理,并且獲得用于驅(qū)動每個揚聲器的音頻數(shù)據(jù)。另外,當解碼了對象編碼數(shù)據(jù)時,基于對象信息(元數(shù)據(jù))計算揚聲器渲染(對于每個揚聲器的混合比率),并且根據(jù)計算結(jié)果將對象音頻數(shù)據(jù)與用于驅(qū)動每個揚聲器的音頻數(shù)據(jù)混合。

通過3D音頻解碼器213獲得的用于驅(qū)動每個揚聲器的音頻數(shù)據(jù)提供給音頻輸出處理電路214。在音頻輸出處理電路214中,對用于驅(qū)動每個揚聲器的音頻數(shù)據(jù)執(zhí)行必要的處理(諸如D/A轉(zhuǎn)換和放大)。然后,處理之后的音頻數(shù)據(jù)提供給揚聲器系統(tǒng)215。因此,從揚聲器系統(tǒng)215獲得與顯示面板206上的顯示圖像對應(yīng)的音頻輸出。

圖15示出圖14所示的服務(wù)接收器200中的CPU 221的音頻解碼控制處理的實例。在步驟ST1中,CPU 221開始處理。然后,在步驟ST2中,CPU 221檢測接收器揚聲器配置,即揚聲器系統(tǒng)215的揚聲器配置。接下來,在步驟ST3中,CPU 221獲得與觀看者(用戶)輸出的音頻相關(guān)的選擇信息。

接下來,在步驟ST4中,CPU 221讀取3D音頻流配置描述符(3Daudio_stream_config_descriptor)的“groupID”、“attribute_of_GroupID”、“switchGroupID”、“presetGroupID”以及“Audio_substreamID”。然后,在步驟ST5中,CPU 221辨識保持符合揚聲器配置的屬性和觀看者選擇信息的組所屬的音頻流(子流)的子流ID(subStreamID)。

接下來,在步驟ST6中,CPU 221將所辨識的子流ID(subStreamID)與每個音頻流(子流)的3D音頻子流ID描述符(3Daudio_substreamID_descriptor)的子流ID(subStreamID)進行核對,并且通過PID濾波器(PID filter)選擇匹配的一個子流ID,并且在復用緩沖器中的每一個內(nèi)獲取該子流ID。然后,在步驟ST7中,CPU 221從復用緩沖器中的每一個內(nèi)讀取對于每個音頻幀的音頻流(子流),并將必要的組編碼數(shù)據(jù)提供給3D音頻解碼器213。

接下來,在步驟ST8中,CPU 221確定是否對對象編碼數(shù)據(jù)進行解碼。當對對象編碼數(shù)據(jù)進行解碼時,在步驟ST9中,CPU 221基于對象信息(元數(shù)據(jù)),通過方位(方位信息)和仰角(仰角信息)計算揚聲器渲染(對于每個揚聲器的混合比)。之后,CPU 221進行到步驟ST10。順便提及,當在步驟ST8中不對對象編碼數(shù)據(jù)進行解碼時,CPU 221立即進行到步驟ST10。

在步驟ST10中,CPU 221確定是否對信道編碼數(shù)據(jù)進行解碼。當對信道編碼數(shù)據(jù)進行解碼時,在步驟ST11中,CPU 221對揚聲器系統(tǒng)215的揚聲器配置執(zhí)行下混和上混的處理,并獲得用于驅(qū)動每個揚聲器的音頻數(shù)據(jù)。之后,CPU 221進行到步驟ST12。順便提及,當在步驟ST10中不對對象編碼數(shù)據(jù)進行解碼時,CPU 221立即進行到步驟ST12。

當對對象編碼數(shù)據(jù)進行解碼時,CPU 221根據(jù)步驟ST9中的計算結(jié)果將對象音頻數(shù)據(jù)與用于驅(qū)動每個揚聲器的音頻數(shù)據(jù)混合,并然后在步驟ST12中執(zhí)行動態(tài)范圍控制。之后,在步驟ST13中,CPU 21結(jié)束處理。順便提及,當不對對象編碼數(shù)據(jù)進行解碼時,CPU 221跳過步驟ST12。

如上所述,在圖1所示的傳輸/接收系統(tǒng)10中,服務(wù)傳輸器100將表示包括在預(yù)定數(shù)量的音頻流中的多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息插入到容器的層中。因此,在接收側(cè),可以在編碼數(shù)據(jù)的解碼之前容易地辨識多個組編碼數(shù)據(jù)中的每一個的屬性,并且可以選擇性地僅解碼必要的組編碼數(shù)據(jù)以使用,并且可以減少處理負荷。

另外,在圖1所示的傳輸/接收系統(tǒng)10中,服務(wù)傳輸器100將表示包括多個組編碼數(shù)據(jù)中的每一個的音頻流的流對應(yīng)信息插入到容器的層中。因此,在接收側(cè),可以容易地辨識包括必要的組編碼數(shù)據(jù)的音頻流,并且可以減少處理負荷。

<2.變形>

順便提及,在上述實施方式中,服務(wù)接收器200配置為從自服務(wù)傳輸器100傳輸?shù)亩鄠€音頻流(子流)中選擇性地提取包括保持符合揚聲器配置的屬性和觀看者選擇信息的組編碼數(shù)據(jù)的音頻流,并且執(zhí)行解碼處理以獲得用于驅(qū)動預(yù)定數(shù)量的揚聲器的音頻數(shù)據(jù)。

然而,也可以考慮作為服務(wù)接收器從自服務(wù)傳輸器100傳輸?shù)亩鄠€音頻流(子流)中選擇性地提取一個或多個音頻流,該音頻流保持符合揚聲器配置的屬性和觀看者選擇信息的組編碼數(shù)據(jù),以重新配置具有保持符合揚聲器配置的屬性和觀看者選擇信息的組編碼數(shù)據(jù)的音頻流,并將重新配置的音頻流傳遞到連接至本地網(wǎng)絡(luò)的設(shè)備(包括DLNA設(shè)備)。

圖16示出用于將重新配置的音頻流傳遞到如上所述連接至本地網(wǎng)絡(luò)的設(shè)備的服務(wù)接收器200A的示例配置。在圖16中,等同于圖14所示的部件的部件由與圖14中所使用的參考標號相同的參考標號來表示,并且這里不再重復對它們進行詳細說明。

在解復用器202中,在CPU 221的控制下,通過PID過濾器選擇性地提取包括在傳送流TS中的預(yù)定數(shù)量的音頻流中的一個或多個音頻流數(shù)據(jù)包,音頻流數(shù)據(jù)包包括保持符合揚聲器配置的屬性和觀看者選擇信息的組編碼數(shù)據(jù)。

由解復用器202提取的音頻流分別接納在復用緩沖器211-1至211-N中的對應(yīng)的復用緩沖器內(nèi)。在組合器212中,從分別接納音頻流的復用緩沖器中的每一個內(nèi)對于每個音頻幀讀取音頻流,并且將該音頻流提供給流重配置單元231。

在流重配置單元231中,選擇性地獲取保持符合揚聲器配置的屬性和觀看者選擇信息的預(yù)定組編碼數(shù)據(jù),并且重新配置保持預(yù)定組編碼數(shù)據(jù)的音頻流。重新配置的音頻流提供給傳遞接口232。然后,從傳遞接口232到連接至本地網(wǎng)絡(luò)的設(shè)備300執(zhí)行傳遞(傳輸)。

本地網(wǎng)絡(luò)連接包括以太網(wǎng)連接和諸如“WiFi”或“Bluetooth”的無線連接。順便提及,“WiFi”和“Bluetooth”是注冊商標。

另外,設(shè)備300包括附接到網(wǎng)絡(luò)終端的環(huán)繞揚聲器、第二顯示器以及音頻輸出設(shè)備。接收重新配置的音頻流的傳遞的設(shè)備300執(zhí)行與圖14的服務(wù)接收器200中的3D音頻解碼器213類似的解碼處理,并獲得用于驅(qū)動預(yù)定數(shù)量的揚聲器的音頻數(shù)據(jù)。

另外,作為服務(wù)接收器,還可以考慮這樣的配置,其中上述重新配置的音頻流傳輸?shù)浇?jīng)由數(shù)字接口(諸如“高清晰度多媒體接口(HDMI)”、“移動高清晰度鏈接(MHL)”或“DisplayPort”)連接的設(shè)備。順便提及,“HDMI”和“MHL”是注冊商標。

另外,在上述實施方式中,插入到容器的層中的流對應(yīng)信息是表示組ID與子流ID之間的對應(yīng)性的信息。也就是說,子流ID用于將組和音頻流(子流)彼此關(guān)聯(lián)。然而,還可以考慮使用用于將組和音頻流(子流)彼此關(guān)聯(lián)的數(shù)據(jù)包標識符(Packet ID:PID)或流類型(stream_type)。順便提及,當使用流類型時,需要改變每個音頻流(子流)的流類型。

另外,在上述實施方式中,已示出了通過提供“attribute_of_groupID”(參見圖10)的字段來傳輸組編碼數(shù)據(jù)中的每一個的屬性信息的實例。然而,本技術(shù)包括這樣的方法,其中通過定義傳輸器與接收器之間的組ID(GroupID)本身的值的特定含義,當辨識了特定組ID時,可以辨識編碼數(shù)據(jù)的類型(屬性)。在這種情況下,組ID用作組標識符,并且還用作組編碼數(shù)據(jù)的屬性信息,使得“attribute_of_groupID”的字段是不必要的。

另外,在上述實施方式中,已示出了多個組編碼數(shù)據(jù)包括信道編碼數(shù)據(jù)和對象編碼數(shù)據(jù)兩者的實例(參見圖3)。然而,本技術(shù)也可以類似地應(yīng)用于其中多個組編碼數(shù)據(jù)僅包括信道編碼數(shù)據(jù)或僅包括對象編碼數(shù)據(jù)的情況。

另外,在上述實施方式中,已示出了容器是傳送流(MPEG-2TS)的實例。然而,本技術(shù)也可以類似地應(yīng)用于通過MP4或另一格式的容器執(zhí)行傳遞的系統(tǒng)。例如,其是基于MPEG-DASH的流傳遞系統(tǒng)、或處理MPEG媒體傳輸(MMT)結(jié)構(gòu)傳輸流的傳輸/接收系統(tǒng)。

順便提及,本技術(shù)還可以以下面描述的結(jié)構(gòu)體現(xiàn)。

(1)一種傳輸設(shè)備,包括:

傳輸單元,用于傳輸具有包括多個組編碼數(shù)據(jù)的預(yù)定數(shù)量的音頻流的預(yù)定格式的容器;以及

信息插入單元,用于將表示多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息插入到容器的層中。

(2)根據(jù)(1)所述的傳輸設(shè)備,其中,

信息插入單元進一步將表示包括多個組編碼數(shù)據(jù)中的每一個的音頻流的流對應(yīng)信息插入到容器的層中。

(3)根據(jù)(2)所述的傳輸設(shè)備,其中,

流對應(yīng)信息是表示用于識別多個組編碼數(shù)據(jù)中的每一個的組標識符與用于識別預(yù)定數(shù)量的音頻流中的每一個的流標識符之間的對應(yīng)性的信息。

(4)根據(jù)(3)所述的傳輸設(shè)備,其中,

信息插入單元進一步將表示預(yù)定數(shù)量的音頻流中的每一個的流標識符的流標識符信息插入到容器的層中。

(5)根據(jù)(4)所述的傳輸設(shè)備,其中,

容器是MPEG2-TS,并且

信息插入單元將流標識符信息插入到與存在于節(jié)目映射表之下的預(yù)定數(shù)量的音頻流中的每一個對應(yīng)的音頻基本流循環(huán)中。

(6)根據(jù)(2)所述的傳輸設(shè)備,其中,

流對應(yīng)信息是表示用于識別多個組編碼數(shù)據(jù)中的每一個的組標識符與在預(yù)定數(shù)量的音頻流中的每一個的分包期間要附加的數(shù)據(jù)包標識符之間的對應(yīng)性的信息。

(7)根據(jù)(2)所述的傳輸設(shè)備,其中,

流對應(yīng)信息是表示用于識別多個組編碼數(shù)據(jù)中的每一個的組標識符與表示預(yù)定數(shù)量的音頻流中的每一個的流類型的類型信息之間的對應(yīng)性的信息。

(8)根據(jù)(2)至(7)中任一項所述的傳輸設(shè)備,其中,

容器是MPEG2-TS,并且

信息插入單元將屬性信息和流對應(yīng)信息插入到與存在于節(jié)目映射表之下的預(yù)定數(shù)量的音頻流中的任何一個音頻流對應(yīng)的音頻基本流循環(huán)中。

(9)根據(jù)(1)至(8)中任一項所述的傳輸設(shè)備,其中,

多個組編碼數(shù)據(jù)包括信道編碼數(shù)據(jù)和對象編碼數(shù)據(jù)中的任一個或兩個。

(10)一種傳輸方法,包括:

傳輸步驟,用于從傳輸單元傳輸具有包括多個組編碼數(shù)據(jù)的預(yù)定數(shù)量的音頻流的預(yù)定格式的容器;以及

信息插入步驟,用于將表示多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息插入到容器的層中。

(11)一種接收設(shè)備,包括:

接收單元,用于接收具有包括多個組編碼數(shù)據(jù)的預(yù)定數(shù)量的音頻流的預(yù)定格式的容器,表示多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息被插入到容器的層中;以及

處理單元,用于基于屬性信息處理包括在所接收的容器中的預(yù)定數(shù)量的音頻流。

(12)根據(jù)(11)所述的接收設(shè)備,其中,

表示包括多個組編碼數(shù)據(jù)中的每一個的音頻流的流對應(yīng)信息進一步被插入到容器的層中,并且

除了屬性信息之外,處理單元基于流對應(yīng)信息處理預(yù)定數(shù)量的音頻流。

(13)根據(jù)(12)所述的接收設(shè)備,其中,

處理單元基于屬性信息和流對應(yīng)信息,對包括組編碼數(shù)據(jù)的音頻流選擇性地執(zhí)行解碼處理,該組編碼數(shù)據(jù)保持符合揚聲器配置的屬性和用戶選擇信息。

(14)根據(jù)(11)至(13)中任一項所述的接收設(shè)備,其中,

多個組編碼數(shù)據(jù)包括信道編碼數(shù)據(jù)和對象編碼數(shù)據(jù)中的任一個或兩個。

(15)一種接收方法,包括:

接收步驟,用于通過接收單元接收具有包括多個組編碼數(shù)據(jù)的預(yù)定數(shù)量的音頻流的預(yù)定格式的容器,表示多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息被插入到容器的層中;以及

處理步驟,用于基于屬性信息處理包括在所接收的容器中的預(yù)定數(shù)量的音頻流。

(16)一種接收設(shè)備,包括:

接收單元,用于接收具有包括多個組編碼數(shù)據(jù)的預(yù)定數(shù)量的音頻流的預(yù)定格式的容器,表示多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息被插入到容器的層中;

處理單元,用于基于屬性信息從包括在所接收的容器中的預(yù)定數(shù)量的音頻流中選擇性地獲取預(yù)定組編碼數(shù)據(jù),并且重新配置包括預(yù)定組編碼數(shù)據(jù)的音頻流;以及

流傳輸單元,用于將在處理單元中重新配置的音頻流傳輸?shù)酵獠吭O(shè)備。

(17)根據(jù)(16)所述的接收設(shè)備,其中,

表示包括多個組編碼數(shù)據(jù)中的每一個的音頻流的流對應(yīng)信息進一步被插入到容器的層中,并且

除了屬性信息之外,處理單元基于流對應(yīng)信息從預(yù)定數(shù)量的音頻流中選擇性地獲取預(yù)定組編碼數(shù)據(jù)。

(18)一種接收方法,包括:

接收步驟,用于通過接收單元接收具有包括多個組編碼數(shù)據(jù)的預(yù)定數(shù)量的音頻流的預(yù)定格式的容器,表示多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息被插入到容器的層中;

處理步驟,用于基于屬性信息從包括在所接收的容器中的預(yù)定數(shù)量的音頻流中選擇性地獲取預(yù)定組編碼數(shù)據(jù),并且重新配置包括預(yù)定組編碼數(shù)據(jù)的音頻流;以及

流傳輸步驟,用于將在處理步驟中重新配置的音頻流傳輸?shù)酵獠吭O(shè)備。

本技術(shù)的主要特征在于,通過將表示包括在預(yù)定數(shù)量的音頻流中的多個組編碼數(shù)據(jù)中的每一個的屬性的屬性信息以及表示包括多個組編碼數(shù)據(jù)中的每一個的音頻流的流對應(yīng)信息插入到容器的層中(參見圖13),可以減少接收側(cè)的處理負荷。

參考符號列表

10 傳輸/接收系統(tǒng)

100 服務(wù)傳輸器

110 流生成單元

112 視頻編碼器

113 音頻編碼器

114 復用器

200、200A 服務(wù)接收器

201 接收單元

202 解復用器

203 視頻解碼器

204 視頻處理電路

205 面板驅(qū)動電路

206 顯示面板

211-1至211-N 復用緩沖器

212 組合器

213 3D音頻解碼器

214 音頻輸出處理電路

215 揚聲器系統(tǒng)

221 CPU

222 閃速ROM

223 DRAM

224 內(nèi)部總線

225 遠程控制接收單元

226 遠程控制傳輸器

231 流重配置單元

232 傳遞接口

300 設(shè)備

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1