專利名稱:發(fā)信號(hào)通知用于多路復(fù)用視頻分量的數(shù)據(jù)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及經(jīng)編碼視頻數(shù)據(jù)的存儲(chǔ)及輸送。
背景技術(shù):
數(shù)字視頻能力可并入到廣泛范圍的裝置中,包括數(shù)字電視、數(shù)字直播系統(tǒng)、無(wú)線廣播系統(tǒng)、個(gè)人數(shù)字助理(PDA)、膝上型或桌上型計(jì)算機(jī)、數(shù)碼相機(jī)、數(shù)字記錄裝置、數(shù)字媒體播放器、視頻游戲裝置、視頻游戲控制臺(tái)、蜂窩式或衛(wèi)星無(wú)線電電話、視頻電話會(huì)議裝置及其類似者。數(shù)字視頻裝置實(shí)施視頻壓縮技術(shù)(例如,由MPEG-2、MPEG-4、ITU-T H. 263或ITU-T H. 264/MPEG-4第10部分高級(jí)視頻譯碼(AVC)定義的標(biāo)準(zhǔn)及這些標(biāo)準(zhǔn)的擴(kuò)展中所描述的視頻壓縮技術(shù)),以較有效地發(fā)射及接收數(shù)字視頻信息。視頻壓縮技術(shù)執(zhí)行空間預(yù)測(cè)及/或時(shí)間預(yù)測(cè),以減少或移除視頻序列中所固有的冗余。對(duì)于基于塊的視頻譯碼來(lái)說(shuō),可將視頻幀或切片分割為多個(gè)宏塊。可進(jìn)一步分割每一宏塊。使用相對(duì)于相鄰宏塊的空間預(yù)測(cè)來(lái)編碼經(jīng)幀內(nèi)譯碼(I)幀或切片中的宏塊。經(jīng)幀間譯碼(P或B)幀或切片中的宏塊可使用相對(duì)于同一幀或切片中的相鄰宏塊的空間預(yù)測(cè)或相對(duì)于其它參考幀中的宏塊的時(shí)間預(yù)測(cè)。在視頻數(shù)據(jù)已被編碼之后,可將視頻數(shù)據(jù)包化以供發(fā)射或存儲(chǔ)??勺裾斩喾N標(biāo)準(zhǔn)中的任一者(例如,國(guó)際標(biāo)準(zhǔn)化 組織(ISO)基礎(chǔ)媒體文件格式及其擴(kuò)展(例如,AVC))將視頻數(shù)據(jù)組合成視頻文件。一直在努力開(kāi)發(fā)出基于H. 264/AVC的新視頻譯碼標(biāo)準(zhǔn)。一個(gè)此類標(biāo)準(zhǔn)為可縮放視頻譯碼(SVC)標(biāo)準(zhǔn),其為H.264/AVC的可縮放擴(kuò)展。另一標(biāo)準(zhǔn)為多視圖視頻譯碼(MVC),其已變成H. 264/AVC的多視圖擴(kuò)展。MVC的聯(lián)合草案描述于JVT-AB204的“關(guān)于多視圖視頻譯碼的聯(lián)合草案 8. O (Joint Draft8. Oon Multiview Video Coding) ”(2008 年 7 月在德國(guó)漢諾威舉辦的第28屆JVT會(huì)議)中,此文獻(xiàn)可從http://wftp3.1tu.1nt/av-arch/jvt-site/2008_07_Hannover/JVT-AB204. zip 獲得。AVC 標(biāo)準(zhǔn)的版本描述于 JVT-AD007的“對(duì)ITU-T Rec. H. 264 | IS0/IEC14496-10高級(jí)視頻譯碼的編者修正草案-為ITU-TSG16AAP 同意做準(zhǔn)備(以綜合形式)(Editors’draft revision to ITU-T Rec. Η. 264 | ISO/IEC14496-10Advanced Video Coding-1n preparation for ITU-T SG16AAP Consent(inintegrated form)) ”(2009年2月在瑞士日內(nèi)瓦舉辦的第30屆JVT會(huì)議)中,此文獻(xiàn)可從http://wftp3.1tu.1nt/av-arch/jvt-site/2009_01_Geneva/JVT-AD007. zip 獲得。本文獻(xiàn)將SVC及MVC整合到AVC規(guī)范中
發(fā)明內(nèi)容
大體來(lái)說(shuō),本發(fā)明描述用于(例如)經(jīng)由網(wǎng)絡(luò)串流協(xié)議(例如,超文本傳送協(xié)議(HTTP)串流)來(lái)輸送視頻數(shù)據(jù)的技術(shù)。在一些情況下,視頻內(nèi)容可包括音頻及視頻數(shù)據(jù)的多個(gè)可能組合。舉例來(lái)說(shuō),所述內(nèi)容可具有多個(gè)可能的音頻軌道(例如,呈例如英語(yǔ)、西班牙語(yǔ)及法語(yǔ)等不同語(yǔ)言)及多個(gè)可能的視頻軌道(例如,用不同譯碼參數(shù)來(lái)編碼,例如各種位速率、各種幀速率及/或其它各種特性)。這些軌道可被稱作分量,例如,音頻分量及視頻分量。分量的每一組合可形成多媒體內(nèi)容的唯一呈現(xiàn),且可作為服務(wù)而遞送到客戶端。本發(fā)明的技術(shù)允許服務(wù)器在單一數(shù)據(jù)結(jié)構(gòu)中發(fā)信號(hào)通知各種表示或多媒體分量的特性。以此方式,客戶端裝置可檢索所述數(shù)據(jù)結(jié)構(gòu)且選擇所述表示中的一者以向服務(wù)器進(jìn)行請(qǐng)求(例如,根據(jù)串流網(wǎng)絡(luò)協(xié)議)。在一個(gè)實(shí)例中,一種發(fā)送經(jīng)封裝視頻數(shù)據(jù)的方法包括將視頻內(nèi)容的多個(gè)表示的分量的特性發(fā)送到客戶端裝置,其中所述特性包含幀速率、簡(jiǎn)檔指示符、層級(jí)指示符、所述分量之間的相依性及3D表示的目標(biāo)輸出視圖的數(shù)目中的至少一者;在發(fā)送所述特性之后從所述客戶端裝置接收對(duì)所述分量中的至少一者的請(qǐng)求;及響應(yīng)于所述請(qǐng)求而將所述所請(qǐng)求分量發(fā)送到所述客戶端裝置。在另一實(shí)例中,一種用于發(fā)送經(jīng)封裝視頻數(shù)據(jù)的設(shè)備包括處理器,其經(jīng)配置以確定視頻內(nèi)容的多個(gè)表示的分量的特性,其中所述特性包含幀速率、簡(jiǎn)檔指示符、層級(jí)指示符及所述分量之間的相依性中的至少一者;及一個(gè)或一個(gè)以上接口,其經(jīng)配置以將所述特性發(fā)送到客戶端裝置,在發(fā)送所述特性之后從所述客戶端裝置接收對(duì)所述分量中的至少一者的請(qǐng)求,且響應(yīng)于所述請(qǐng)求而將所述所請(qǐng)求分量發(fā)送到所述客戶端裝置。在另一實(shí)例中,一種用于發(fā)送經(jīng)封裝視頻數(shù)據(jù)的設(shè)備包括用于將視頻內(nèi)容的多個(gè)表示的分量的特性發(fā)送到客戶端裝置的裝置,其中所述特性包含幀速率、簡(jiǎn)檔指示符、層級(jí)指示符及所述分量之間的相依性中的至少一者;用于在發(fā)送所述特性之后從所述客戶端裝置接收對(duì)所述分量中的至少一者的請(qǐng)求的裝置;及用于響應(yīng)于所述請(qǐng)求而將所述所請(qǐng)求分量發(fā)送到所述客戶端裝置的裝置。在另一實(shí)例中,一種計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)可讀存儲(chǔ)媒體,所述計(jì)算機(jī)可讀存儲(chǔ)媒體包含在執(zhí)行 時(shí)致使用于發(fā)送經(jīng)封裝視頻數(shù)據(jù)的源裝置的處理器進(jìn)行以下操作的指令將視頻內(nèi)容的多個(gè)表示的分量的特性發(fā)送到客戶端裝置,其中所述特性包含幀速率、簡(jiǎn)檔指示符、層級(jí)指示符及所述分量之間的相依性中的至少一者;在發(fā)送所述特性之后從所述客戶端裝置接收對(duì)所述分量中的至少一者的請(qǐng)求;及響應(yīng)于所述請(qǐng)求而將所述所請(qǐng)求分量發(fā)送到所述客戶端裝置。在另一實(shí)例中,一種接收經(jīng)封裝視頻數(shù)據(jù)的方法包括向源裝置請(qǐng)求視頻內(nèi)容的多個(gè)表示的分量的特性,其中所述特性包含幀速率、簡(jiǎn)檔指示符、層級(jí)指示符及所述分量之間的相依性中的至少一者;基于所述特性來(lái)選擇所述分量中的一者或一者以上;請(qǐng)求所述選定分量的樣本;及在已接收所述樣本之后解碼并呈現(xiàn)所述樣本。在另一實(shí)例中,一種用于接收經(jīng)封裝視頻數(shù)據(jù)的設(shè)備包括一個(gè)或一個(gè)以上接口,其經(jīng)配置以向源裝置請(qǐng)求視頻內(nèi)容的多個(gè)表示的分量的特性,其中所述特性包含幀速率、簡(jiǎn)檔指示符、層級(jí)指示符及所述分量之間的相依性中的至少一者;及處理器,其經(jīng)配置以基于所述特性來(lái)選擇所述分量中的一者或一者以上,且致使所述一個(gè)或一個(gè)以上接口將對(duì)所述選定分量的樣本的請(qǐng)求提交到所述源裝置。
在另一實(shí)例中,一種用于接收經(jīng)封裝視頻數(shù)據(jù)的設(shè)備包括用于向源裝置請(qǐng)求視頻內(nèi)容的多個(gè)表示的分量的特性的裝置,其中所述特性包含幀速率、簡(jiǎn)檔指示符、層級(jí)指示符及所述分量之間的相依性中的至少一者;用于基于所述特性來(lái)選擇所述分量中的一者或一者以上的裝置;用于請(qǐng)求所述選定分量的樣本的裝置;及用于在已接收所述樣本之后解碼并呈現(xiàn)所述樣本的裝置。在另一實(shí)例中,一種計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)可讀存儲(chǔ)媒體,所述計(jì)算機(jī)可讀存儲(chǔ)媒體包含致使用于接收經(jīng)封裝視頻數(shù)據(jù)的裝置的處理器進(jìn)行以下操作的指令向源裝置請(qǐng)求視頻內(nèi)容的多個(gè)表示的分量的特性,其中所述特性包含幀速率、簡(jiǎn)檔指示符、層級(jí)指示符及所述分量之間的相依性中的至少一者;基于所述特性來(lái)選擇所述分量中的一者或一者以上;請(qǐng)求所述選定分量的樣本;及在已接收所述樣本之后解碼并呈現(xiàn)所述樣本。一個(gè)或一個(gè)以上實(shí)例的細(xì)節(jié)陳述于附圖及以下描述中。其它特征、目的及優(yōu)點(diǎn)將從所述描述及圖式以及從權(quán)利要求書顯而易見(jiàn)。
圖1為說(shuō)明音頻/視頻(A/V)源裝置將音頻及視頻數(shù)據(jù)傳送到A/V目的地裝置的實(shí)例系統(tǒng)的框圖。圖2為說(shuō)明適合用于圖1中所展示的A/V源裝置中的實(shí)例封裝單元的組件的框圖。圖3為說(shuō)明可用于圖1的系統(tǒng)中的實(shí)例分量映射盒及實(shí)例分量布置盒的概念圖。圖4為說(shuō)明用于多路復(fù)用圖1的系統(tǒng)中的實(shí)例視頻分量及實(shí)例音頻分量的實(shí)例時(shí)序間隔的概念圖。圖5為說(shuō)明用于將分 量映射盒及分量布置盒從服務(wù)器提供到客戶端的實(shí)例方法的流程圖。
具體實(shí)施例方式大體來(lái)說(shuō),本發(fā)明描述用于輸送視頻內(nèi)容的技術(shù)。本發(fā)明的技術(shù)包括使用例如超文本傳送協(xié)議(HTTP)串流等串流協(xié)議來(lái)輸送視頻內(nèi)容。盡管出于說(shuō)明的目的而描述HTTP,但本發(fā)明中所呈現(xiàn)的技術(shù)可供其它類型的串流使用。視頻內(nèi)容可封裝于特定文件格式(例如,ISO基礎(chǔ)媒體文件格式或其擴(kuò)展)的視頻文件中。還可用MPEG-2輸送流來(lái)封裝視頻內(nèi)容。內(nèi)容服務(wù)器可提供多媒體服務(wù),所述多媒體服務(wù)包括不同類型的媒體數(shù)據(jù)(例如,音頻及視頻)及每一類型的各種數(shù)據(jù)集合(例如,不同語(yǔ)言(例如,英語(yǔ)、西班牙語(yǔ)及德語(yǔ)音頻)及/或視頻的不同編碼類型(例如,MPEG-2、MPEG-4、H. 264/AVC或H. 265))。本發(fā)明的技術(shù)可尤其對(duì)發(fā)信號(hào)通知可如何組合及多路復(fù)用各種類型及每一類型的數(shù)據(jù)集合為有用的。本發(fā)明將場(chǎng)景的相關(guān)多媒體數(shù)據(jù)的集合稱作“內(nèi)容”,其可含有多個(gè)視頻及/或音頻內(nèi)容分量。術(shù)語(yǔ)“內(nèi)容分量”或(簡(jiǎn)單地)“分量”指代單一類型的媒體,例如,視頻或音頻數(shù)據(jù)。數(shù)據(jù)的分量可指代數(shù)據(jù)的軌道、子軌道,或軌道或子軌道的集合。大體來(lái)說(shuō),“軌道”可對(duì)應(yīng)于相關(guān)經(jīng)編碼圖片樣本的序列,而子軌道可對(duì)應(yīng)于軌道的經(jīng)編碼樣本的子集。作為實(shí)例,內(nèi)容分量可對(duì)應(yīng)于視頻軌道、音頻軌道或電影字幕。HTTP串流服務(wù)器可將內(nèi)容分量的集合作為對(duì)客戶端的服務(wù)而遞送到客戶端。
服務(wù)可對(duì)應(yīng)于從可用于所述內(nèi)容的所有視頻內(nèi)容分量選擇一個(gè)視頻內(nèi)容分量及從可用于所述內(nèi)容的所有音頻內(nèi)容分量選擇一個(gè)音頻內(nèi)容分量。舉例來(lái)說(shuō),作為存儲(chǔ)于HTTP服務(wù)器中的內(nèi)容,足球比賽節(jié)目可具有多個(gè)視頻內(nèi)容分量(例如,具有不同位速率(512kbps或IMbps)或具有不同巾貞速率)及多個(gè)音頻分量(例如,英語(yǔ)、西班牙語(yǔ)或中文)。因此,提供到客戶端的服務(wù)可對(duì)應(yīng)于選擇一個(gè)視頻分量及一個(gè)音頻分量,例如,伴隨有512kbps視頻的西班牙語(yǔ)音頻。還可將視頻及音頻分量的組合稱作內(nèi)容的表示。作為實(shí)例,在HTTP串流中,客戶端裝置產(chǎn)生呈HTTP獲取請(qǐng)求或部分獲取請(qǐng)求的形式的對(duì)數(shù)據(jù)的一個(gè)或一個(gè)以上請(qǐng)求。HTTP獲取請(qǐng)求指定文件的統(tǒng)一資源定位符(URL)或統(tǒng)一資源名稱(URN)。HTTP部分獲取請(qǐng)求指定文件的URL或URN,以及文件的待檢索的字節(jié)范圍。HTTP串流服務(wù)器可通過(guò)輸出(例如,發(fā)送)所請(qǐng)求URL或URN處的文件或在HTTP部分獲取請(qǐng)求的情況下輸出所述文件的所請(qǐng)求字節(jié)范圍來(lái)對(duì)HTTP獲取請(qǐng)求作出響應(yīng)。為了使客戶端適當(dāng)?shù)禺a(chǎn)生HTTP獲取及部分獲取請(qǐng)求,服務(wù)器可將關(guān)于對(duì)應(yīng)于內(nèi)容分量的文件的URL及/或URN的信息以及所述分量的特性提供到客戶端,使得客戶端可選擇所要內(nèi)容分量且適當(dāng)?shù)禺a(chǎn)生對(duì)所述分量的HTTP獲取及/或部分獲取請(qǐng)求。本發(fā)明的技術(shù)包括發(fā)信號(hào)通知內(nèi)容分量的特性,例如,發(fā)信號(hào)通知各種內(nèi)容分量的數(shù)據(jù)的位置。以此方式,客戶端裝置可選擇內(nèi)容的表示且產(chǎn)生對(duì)各種類型的內(nèi)容分量的組合的請(qǐng)求。舉例來(lái)說(shuō),根據(jù)以上實(shí)例,用戶可選擇觀看伴隨有西班牙語(yǔ)音頻的512kbps視頻。觀看者的客戶端裝置可提交對(duì)這兩個(gè)分量的請(qǐng)求。也就是說(shuō),客戶端裝置可使用來(lái)自服務(wù)器的發(fā)信號(hào)通知的數(shù)據(jù)來(lái)確定512kbps視頻及西班牙語(yǔ)音頻的數(shù)據(jù)的位置,且接著產(chǎn)生對(duì)這些內(nèi)容分量所對(duì)應(yīng)的數(shù)據(jù)的請(qǐng)求。響應(yīng)于所述請(qǐng)求,服務(wù)器可將這兩個(gè)分量作為服務(wù)遞送到客戶端裝置。ISO基礎(chǔ)媒體文件格式經(jīng)設(shè)計(jì)以含有呈靈活、可擴(kuò)展的格式的表示的時(shí)控媒體信息,所述時(shí)控媒體信息促進(jìn)媒體的互換、管理、編輯及表示。ISO基礎(chǔ)媒體文件格式(ISO/IEC14496-12:2004)在MPEG-4第12部分中指定,MPEG-4第12部分定義針對(duì)基于時(shí)間的媒體文件的一般結(jié)構(gòu)。ISO基礎(chǔ)媒體文件格式用作所述系列中的例如以下各項(xiàng)等其它文件格式的基礎(chǔ)經(jīng)定義以支持 H. 264/MPEG-4AVC視頻壓縮的AVC文件格式(IS0/IEC14496-15)、3GPP文件格式、SVC文件格式及MVC文件格式。3GPP文件格式及MVC文件格式為AVC文件格式的擴(kuò)展。ISO基礎(chǔ)媒體文件格式含有用于媒體數(shù)據(jù)的時(shí)控序列(例如,音頻視覺(jué)表示)的時(shí)序、結(jié)構(gòu)及媒體信息。所述文件結(jié)構(gòu)可為面向?qū)ο蟮???蓸O其簡(jiǎn)單地將文件分解成基本對(duì)象且對(duì)象的結(jié)構(gòu)由其類型暗示。遵照ISO基礎(chǔ)媒體文件格式(及其擴(kuò)展)的文件可形成為一連串對(duì)象,稱作“盒”。呈ISO基礎(chǔ)媒體文件格式的數(shù)據(jù)可含于盒中,使得所述文件內(nèi)不需要含有其它數(shù)據(jù),且文件內(nèi)不需要在盒之外的數(shù)據(jù)。此包括特定文件格式所需的任何初始簽名?!昂小笨蔀橥ㄟ^(guò)唯一類型識(shí)別符及長(zhǎng)度定義的面向?qū)ο蟮臉?gòu)造塊。通常,表示含于一個(gè)文件中,且媒體表示為自含式的。電影容器(電影盒)可含有媒體的元數(shù)據(jù),且視頻及音頻幀可含于媒體數(shù)據(jù)容器中且可在其它文件中。根據(jù)本發(fā)明的技術(shù),服務(wù)器可提供發(fā)信號(hào)通知各種內(nèi)容分量的特性的分量映射盒。所述分量映射盒可對(duì)應(yīng)于可存儲(chǔ)于與存儲(chǔ)各種內(nèi)容分量的經(jīng)編碼樣本的文件分離的文件中的數(shù)據(jù)結(jié)構(gòu)。所述分量映射盒可發(fā)信號(hào)通知內(nèi)容分量的特性,常規(guī)地,并不針對(duì)視頻數(shù)據(jù)而在存儲(chǔ)于實(shí)際上包括經(jīng)譯碼視頻樣本的文件外部的數(shù)據(jù)結(jié)構(gòu)中發(fā)信號(hào)通知所述特性。還可在信息列表文件或HTTP串流的媒體呈現(xiàn)描述中發(fā)信號(hào)通知此數(shù)據(jù)結(jié)構(gòu)(如在分量映射盒中)。所述特性可包括(例如)幀速率、簡(jiǎn)檔指示符、層級(jí)指示符,及分量之間的相依性。通過(guò)分量映射盒發(fā)信號(hào)通知的特性還可包括3D視頻的三維特性,例如視圖的數(shù)目及視圖(例如,形成立體對(duì)的兩個(gè)視圖)之間的關(guān)系。除了針對(duì)內(nèi)容分量常規(guī)地發(fā)信號(hào)通知的特性(例如,所述內(nèi)容分量的位速率及分辨率)以外,分量映射盒還可發(fā)信號(hào)通知這些特性。所述分量映射盒還可提供唯一地識(shí)別內(nèi)容的服務(wù)的服務(wù)識(shí)別符(例如,Content_id值)。所述服務(wù)的每一分量可與所述服務(wù)識(shí)別符相關(guān)聯(lián)。源裝置 可經(jīng)配置以為視頻內(nèi)容提供分量映射盒,而不管所述內(nèi)容如何被封裝。也就是說(shuō),源裝置可將分量映射盒提供到客戶端裝置,而不管視頻內(nèi)容是否根據(jù)以下格式來(lái)封裝高級(jí)視頻譯碼(AVC)文件格式、可縮放視頻譯碼(SVC)文件格式、多視圖視頻譯碼(MVC)文件格式、第三代合作伙伴計(jì)劃(3GPP)文件格式或其它文件格式。分量映射盒可發(fā)信號(hào)通知特定內(nèi)容的內(nèi)容分量的特性。在一些實(shí)例中,每一分量可對(duì)應(yīng)于文件的視頻或音頻軌道、一連串小文件中的軌道、軌道片段、軌道的組合(例如,在SVC或MVC中),或軌道的子集。大體來(lái)說(shuō),分量映射盒可與其所描述的視頻數(shù)據(jù)分離地存儲(chǔ)。在一些實(shí)例中,分量映射盒可包括于單獨(dú)文件中或包括作為包括內(nèi)容分量的一個(gè)電影文件(例如,mp4或3GP文件)或支持本發(fā)明中所描述的功能性的其它文件的部分。分量映射盒的位置可通過(guò)封裝文件類型而變化。此外,可將分量映射盒擴(kuò)展到ISO基礎(chǔ)媒體文件格式或其擴(kuò)展中的一者或一者以上。還可在信息列表文件或HTTP串流的媒體呈現(xiàn)描述中發(fā)信號(hào)通知此數(shù)據(jù)結(jié)構(gòu)(如在分量映射盒中)。默認(rèn)地,分量映射盒可適用于相關(guān)聯(lián)內(nèi)容的整個(gè)持續(xù)時(shí)間。然而,在一些情況下,分量映射盒可僅應(yīng)用于內(nèi)容的特定時(shí)序間隔。在這些情況下,服務(wù)器可提供多個(gè)分量映射盒,且針對(duì)每一者發(fā)信號(hào)通知所述分量映射盒所對(duì)應(yīng)的時(shí)序間隔。在一些實(shí)例中,當(dāng)服務(wù)器提供多個(gè)分量映射盒時(shí),服務(wù)器可以靜態(tài)模式來(lái)配置,在所述靜態(tài)模式中,所述分量映射盒以時(shí)序間隔次序連續(xù)地布置于同一文件中。在一些實(shí)例中,服務(wù)器可以動(dòng)態(tài)模式來(lái)配置,在所述動(dòng)態(tài)模式中,所述分量映射盒可提供于單獨(dú)文件中及/或提供于彼此不連續(xù)位置中。所述動(dòng)態(tài)模式可提供實(shí)況串流的優(yōu)點(diǎn),而靜態(tài)模式可提供關(guān)于在較大時(shí)間范圍中進(jìn)行搜尋的優(yōu)點(diǎn)。本發(fā)明還提供分量布置盒,所述分量布置盒可包括于每一文件內(nèi)以發(fā)信號(hào)通知所述文件的軌道與各種分量之間的關(guān)系。舉例來(lái)說(shuō),在包括兩個(gè)或兩個(gè)以上軌道的數(shù)據(jù)的文件中的分量布置盒可發(fā)信號(hào)通知所述文件中的軌道的軌道識(shí)別符與對(duì)應(yīng)內(nèi)容分量的分量識(shí)別符之間的關(guān)系。以此方式,客戶端裝置可首先從服務(wù)器裝置檢索分量映射盒??蛻舳搜b置可接著基于由分量映射盒發(fā)信號(hào)通知的特性來(lái)選擇表示的一個(gè)或一個(gè)以上分量。接著,客戶端裝置可從存儲(chǔ)由分量映射盒所描述的分量的文件檢索分量布置盒。通過(guò)使用可包括段信息(例如,特定分量的片段的字節(jié)范圍)的分量映射盒,客戶端可確定選定分量的片段存儲(chǔ)于文件中何處。基于此確定,客戶端可提交對(duì)選定分量所對(duì)應(yīng)的軌道或子軌道的片段的請(qǐng)求(例如,HTTP獲取或部分獲取請(qǐng)求)。
以此方式,替代在分量映射盒中發(fā)信號(hào)通知關(guān)于每一文件或每一軌道如何與內(nèi)容分量相關(guān)聯(lián)的信息,可將此信息存儲(chǔ)于與相應(yīng)文件相關(guān)聯(lián)的分量布置盒中。分量映射盒可發(fā)信號(hào)通知內(nèi)容的所有分量的分量識(shí)別符(例如,component_id值),而分量布置盒可發(fā)信號(hào)通知存儲(chǔ)于對(duì)應(yīng)于分量布置盒的文件內(nèi)的分量的component_id值與相關(guān)聯(lián)于所述component_id值的content_id值之間的關(guān)系。在一些情況下,分量映射盒還可存儲(chǔ)段信息。另外,分量映射盒可包括指示分量映射盒是否包括段信息的旗標(biāo)??蛻舳搜b置可經(jīng)配置以假定如果分量映射盒不包括段信息,則所述表示的媒體數(shù)據(jù)含于相依表示中。服務(wù)器可將唯一 component_id值指派給每一類型的媒體,從而確保component_id值對(duì)于同一服務(wù)中的任何視頻或音頻分量來(lái)說(shuō)為唯一的。特定類型的分量可為可彼此切換的。也就是說(shuō),客戶端可(例如)響應(yīng)于變化的網(wǎng)絡(luò)條件或其它因素而在各種視頻分量之間切換??蛻舳瞬恍枰?qǐng)求每一可用類型的分量。舉例來(lái)說(shuō),客戶端可省略請(qǐng)求包括隱藏式輔助字幕分量的內(nèi)容的輔助字幕。此外,在一些情況下,可請(qǐng)求同一媒體類型的多個(gè)分量以(例如)支持3D視頻或畫中畫。服務(wù)器可提供額外發(fā)信號(hào)通知以支持例如畫中畫等特定功能性。舉例來(lái)說(shuō),服務(wù)器可提供指示分量是否包括畫中畫數(shù)據(jù)的描述的旗標(biāo)。如果所述旗標(biāo)指示所述分量包括畫中畫數(shù)據(jù),則分量映射盒可提供某一表示的識(shí)別符,所述表示將連同當(dāng)前表示一起展示以形成畫中畫顯示。一個(gè)表示可對(duì)應(yīng)于大圖片,而另一表示可對(duì)應(yīng)于與所述大圖片重疊的較小圖片。如上文所提,服務(wù)器可在包括對(duì)應(yīng)于一個(gè)或一個(gè)以上分量的經(jīng)編碼樣本的每一文件中提供分量布置盒。分量布置盒可提供于文件的標(biāo)頭數(shù)據(jù)中。分量布置盒可指示包括于文件中的分量及所述分量如何存儲(chǔ)(例如,作為文件內(nèi)的軌道)。分量布置盒可提供分量識(shí)別符值與文件中的對(duì)應(yīng)軌道的軌道識(shí)別符值之間的映射。分量映射盒還可發(fā)信號(hào)通知內(nèi)容分量之間的相依性,其中所述發(fā)信號(hào)通知的相依性可包括針對(duì)存取單元內(nèi)部的 內(nèi)容分量的解碼次序的與當(dāng)前內(nèi)容分量的相依性次序。關(guān)于當(dāng)前表示的相依性的發(fā)信號(hào)通知的信息可包括相依于當(dāng)前表示的表示及/或當(dāng)前表示所相依于的表示中的任一者或兩者。還可在時(shí)間維度上在內(nèi)容分量之間存在相依性。然而,簡(jiǎn)單地指示每一視頻分量的temporaljd值可能并不足夠,因?yàn)樵谕耆?dú)立的替代視頻位流中的時(shí)間子層未必具有彼此的幀速率的映射。舉例來(lái)說(shuō),一個(gè)視頻分量可具有24fps的中貞速率及等于O的temporal_id,且可具有12fps的子層(假定兩個(gè)時(shí)間層),而另一視頻分量可具有30fps的巾貞速率連同等于O的temporal_id,且可具有7. 5fps的子層(假定三個(gè)時(shí)間層)。服務(wù)器可因此在發(fā)信號(hào)通知兩個(gè)視頻分量的相依性時(shí)指示時(shí)間層的差。大體來(lái)說(shuō),分量的發(fā)信號(hào)通知的特性可包括(例如)平均位速率、最大位速率(例如,在一秒內(nèi))、分辨率、幀速率、對(duì)其它分量的相依性及/或保留擴(kuò)展(例如,針對(duì)多視圖視頻),所述擴(kuò)展可包括以輸出為目標(biāo)的視圖的數(shù)目及那些視圖的識(shí)別符。還可發(fā)信號(hào)通知關(guān)于形成內(nèi)容分量的一連串媒體片段的信息。每一媒體片段的發(fā)信號(hào)通知的信息可包括媒體片段的字節(jié)偏移、所述媒體片段中的第一樣本的解碼時(shí)間、所述片段中的隨機(jī)存取點(diǎn)以及所述隨機(jī)存取點(diǎn)的解碼時(shí)間及表示時(shí)間,及/或用以指示所述片段是否屬于內(nèi)容分量的新段(且因此屬于不同URL)的旗標(biāo)。在一些情況下,音頻數(shù)據(jù)的片段在時(shí)間上并不與視頻數(shù)據(jù)的片段對(duì)準(zhǔn)。本發(fā)明提供用于基于特定時(shí)間間隔來(lái)多路復(fù)用多個(gè)內(nèi)容分量的技術(shù)。分量映射盒可提供所支持的多路復(fù)用間隔的列表,或多路復(fù)用間隔的范圍??蓪⑺龆嗦窂?fù)用間隔指明為T,且所述多路復(fù)用間隔可表示經(jīng)多路復(fù)用音頻及視頻數(shù)據(jù)的時(shí)間長(zhǎng)度。假設(shè)待請(qǐng)求的下一時(shí)間間隔為[η*τ,(η+1)*Τ]??蛻舳搜b置可確定每一內(nèi)容分量中是否存在具有開(kāi)始時(shí)間t使得(n*T)〈=t〈=((n+l)*T)的某片段。如果存在所述片段,則客戶端裝置可請(qǐng)求那個(gè)片段。可在當(dāng)前多路復(fù)用間隔n*T之前請(qǐng)求在η*Τ之前開(kāi)始的片段,而可在稍后多路復(fù)用間隔處請(qǐng)求在間隔(η+1)*Τ之后開(kāi)始的片段。以此方式,仍可多路復(fù)用不具有彼此對(duì)準(zhǔn)或與所請(qǐng)求多路復(fù)用間隔對(duì)準(zhǔn)的片段邊界的內(nèi)容分量。此外,多路復(fù)用間隔可在服務(wù)期間改變,而不阻止內(nèi)容分量的多路復(fù)用??蛻舳搜b置可經(jīng)配置以通過(guò)改變多路復(fù)用間隔而適應(yīng)變化的網(wǎng)絡(luò)條件。舉例來(lái)說(shuō),當(dāng)帶寬變得相對(duì)較為可用時(shí),客戶端裝置可增大多路復(fù)用間隔。另一方面,當(dāng)帶寬變得相對(duì)較不可用時(shí),客戶端裝置可減小多路復(fù)用間隔。客戶端裝置可進(jìn)一步經(jīng)配置以基于某一時(shí)序間隔及瞬時(shí)位速率來(lái)請(qǐng)求經(jīng)多路復(fù)用片段??蛻舳搜b置可基于片段中的字節(jié)的數(shù)目及片段的持續(xù)時(shí)間來(lái)計(jì)算瞬時(shí)位速率。在一些實(shí)例中,服務(wù)器可將同一分量識(shí)別符指派給兩個(gè)連續(xù)的媒體表示(例如,具有順序時(shí)序信息的兩個(gè)視頻文件)以支持時(shí)間拼接。如上文所提,在一些情況下,表示可包括存儲(chǔ)于不同文件中的內(nèi)容分量。因此,客戶端裝置可能需要提交檢索內(nèi)容的特定時(shí)間間隔的數(shù)據(jù)的多個(gè)獲取或部分獲取請(qǐng)求。也就是說(shuō),客戶端可能需要提交涉及存儲(chǔ)所述表示的內(nèi)容分量的各種文件的多個(gè)獲取或部分獲取請(qǐng)求。當(dāng)需要多個(gè)請(qǐng)求來(lái)獲得待在某一時(shí)間間隔中多路復(fù)用的數(shù)據(jù)時(shí),客戶端裝置可管線遞送所述請(qǐng)求以確保在當(dāng)前時(shí)間間隔中的所要媒體片段數(shù)據(jù)之間不接收另一時(shí)間間隔中的數(shù)據(jù)。以此方式,可在網(wǎng)絡(luò)串流上下文(例如,HTTP串流)中支持具有多個(gè)文件中的分量的媒體內(nèi)容。也就是說(shuō),所述媒體內(nèi)容的表示可包括一個(gè)文件中的一個(gè)分量及單獨(dú)文件中的另一分量。服務(wù)器可在單一數(shù)據(jù)結(jié)構(gòu)(例如,分量映射盒)中發(fā)信號(hào)通知不同文件中的分量的特性。此情況可 使得客戶端能夠請(qǐng)求任何目標(biāo)內(nèi)容分量或請(qǐng)求目標(biāo)內(nèi)容分量的任何持續(xù)時(shí)間。類似于本發(fā)明的分量映射盒及分量布置盒的數(shù)據(jù)結(jié)構(gòu)的使用還可提供其它優(yōu)點(diǎn)。舉例來(lái)說(shuō),不同分量中的兩個(gè)媒體軌道可在相應(yīng)分量?jī)?nèi)具有相同軌道識(shí)別符(track_id)值。然而,如上文所提,分量映射盒可涉及使用與軌道識(shí)別符值不同的分量識(shí)別符的單獨(dú)分量。因?yàn)槊恳晃募砂▽⒎至孔R(shí)別符映射到軌道識(shí)別符的分量布置盒,所以分量映射盒可涉及使用獨(dú)立于軌道識(shí)別符值的分量識(shí)別符的分量。分量布置盒還可提供用于(例如)在內(nèi)容遞送網(wǎng)絡(luò)(CDN)服務(wù)器存儲(chǔ)對(duì)應(yīng)于許多不同內(nèi)容的多個(gè)文件時(shí)指定哪一文件對(duì)應(yīng)于哪一內(nèi)容的有效機(jī)制。此外,本發(fā)明的技術(shù)可支持具有不同網(wǎng)絡(luò)緩沖器大小的客戶端。也就是說(shuō),一些客戶端可(例如)歸因于網(wǎng)絡(luò)條件、客戶端能力及其類似者而需要大小與其它客戶端不同的緩沖器。因此,在一些情況下,可能需要以不同時(shí)間間隔多路復(fù)用特定表示的多種類型的分量。本發(fā)明提供以下技術(shù)使服務(wù)器發(fā)信號(hào)通知不同的可能多路復(fù)用時(shí)間間隔,且因此(例如)根據(jù)使用HTTP的客戶端與服務(wù)器之間的來(lái)回時(shí)間來(lái)考慮所請(qǐng)求數(shù)據(jù)的大小的變化并因此考慮發(fā)射的性能。
此外,在一些情況下,一個(gè)文件中的內(nèi)容分量可相依于一個(gè)或一個(gè)以上其它文件中的若干其它內(nèi)容分量。此相依性可發(fā)生于存取單元內(nèi)。作為實(shí)例,視頻內(nèi)容分量可對(duì)應(yīng)于相依于通用接口格式(CIF)層及四分之一通用接口格式(QCIF)層的CIF SVC增強(qiáng)層。CIF層及QCIF層兩者可在一個(gè)文件中,而4CIF增強(qiáng)層可在另一文件中。本發(fā)明的技術(shù)可確??蛻舳四軌蜻m當(dāng)?shù)卣?qǐng)求CIF、QCIF及4CIF層的數(shù)據(jù),使得客戶端的解碼器基于相依性以適當(dāng)解碼次序接收來(lái)自這些層的樣本。在一些實(shí)例中,可使用動(dòng)態(tài)服務(wù)器來(lái)動(dòng)態(tài)地建立一起多路復(fù)用內(nèi)容分量的文件。舉例來(lái)說(shuō),動(dòng)態(tài)服務(wù)器可支持遵循通用網(wǎng)關(guān)接口(CGI)服務(wù)以一起多路復(fù)用分量且使得當(dāng)前時(shí)間間隔的數(shù)據(jù)為動(dòng)態(tài)文件的連續(xù)部分的方法。CGI描述于可在http://t00ls.1etf.org/html/rfc3875處獲得的意見(jiàn)請(qǐng)求3875中。通過(guò)使用例如CGI等服務(wù),服務(wù)器可針對(duì)內(nèi)容的表示動(dòng)態(tài)地產(chǎn)生包括各種內(nèi)容分量的組合的文件。表示(運(yùn)動(dòng)序列)可含于若干文件中。時(shí)序及成幀(位置及大小)信息大體上在ISO基礎(chǔ)媒體文件中,且輔助文件可實(shí)質(zhì)上使用任何格式。此表示可在含有所述表示的系統(tǒng)的“本地”,或可經(jīng)由網(wǎng)絡(luò)或其它流遞送機(jī)制來(lái)提供。所述文件可具有邏輯結(jié)構(gòu)、時(shí)間結(jié)構(gòu)及物理結(jié)構(gòu),且這些結(jié)構(gòu)不需要耦合。文件的邏輯結(jié)構(gòu)可為電影或視頻剪輯(可能包括視·頻數(shù)據(jù)及音頻數(shù)據(jù)兩者)的,其又含有一組時(shí)間并行的軌道。文件的時(shí)間結(jié)構(gòu)可使得軌道含有按時(shí)間的樣本的序列,且那些序列通過(guò)任選的編輯列表而映射到整個(gè)電影的時(shí)間線中。文件的物理結(jié)構(gòu)可將邏輯、時(shí)間及結(jié)構(gòu)分解所需的數(shù)據(jù)與媒體數(shù)據(jù)樣本自身分離。此結(jié)構(gòu)信息可集中于電影盒中,可能在時(shí)間上由電影片段盒擴(kuò)展。所述電影盒可加注樣本的邏輯及時(shí)序關(guān)系,且還可含有到其所處位置的指針。那些指針可指向同一文件中或另一文件中(例如,通過(guò)URL參考)。每一媒體流可含于專門用于那個(gè)媒體類型(音頻、視頻等)的軌道中,且可進(jìn)一步通過(guò)樣本項(xiàng)目來(lái)參數(shù)化。所述樣本項(xiàng)目可含有確切媒體類型(解碼流所需的解碼器的類型)的“名稱”及那個(gè)所需解碼器的任何參數(shù)化。所述名稱還可采取四字符碼(例如,“moov”或“trak”)的形式。存在不僅用于MPEG-4媒體而且用于使用此文件格式系列的其它組織所使用的媒體類型的經(jīng)定義的樣本項(xiàng)目格式。對(duì)元數(shù)據(jù)的支持大體上采取兩種形式。首先,可將時(shí)控元數(shù)據(jù)存儲(chǔ)于適當(dāng)軌道中,且在需要時(shí)與其所描述的媒體數(shù)據(jù)同步。其次,可存在對(duì)附接到電影或個(gè)別軌道的非時(shí)控元數(shù)據(jù)的一般支持。所述結(jié)構(gòu)支持為一般的,且允許元數(shù)據(jù)資源以與媒體數(shù)據(jù)(即,經(jīng)譯碼視頻圖片)的存儲(chǔ)類似的方式存儲(chǔ)于所述文件中的別處或存儲(chǔ)于另一文件中。另外,可為這些資源指定名稱且可保護(hù)這些資源。術(shù)語(yǔ)“漸進(jìn)式下載”用以描述通常使用HTTP協(xié)議的數(shù)字媒體文件從服務(wù)器到客戶端的傳送。當(dāng)由計(jì)算機(jī)起始時(shí),所述計(jì)算機(jī)可在下載完成之前開(kāi)始重放媒體。串流媒體與漸進(jìn)式下載之間的一個(gè)差別在于,正存取數(shù)字媒體的最終用戶裝置如何接收并存儲(chǔ)數(shù)字媒體數(shù)據(jù)。能夠進(jìn)行漸進(jìn)式下載重放的媒體播放器依賴于位于文件的標(biāo)頭中的元數(shù)據(jù)為完整的且在數(shù)字媒體文件是從網(wǎng)絡(luò)服務(wù)器下載時(shí)依賴于數(shù)字媒體文件的本地緩沖。在指定量的經(jīng)緩沖數(shù)據(jù)變得可為本地重放裝置所用時(shí),所述裝置可開(kāi)始播放所述媒體。此指定量的經(jīng)緩沖數(shù)據(jù)可通過(guò)編碼器設(shè)定中的內(nèi)容的制作者嵌入到文件中,且可通過(guò)客戶端計(jì)算機(jī)的媒體播放器所強(qiáng)加的額外緩沖器設(shè)定來(lái)加強(qiáng)。
在漸進(jìn)式下載或HTTP串流中,替代提供包括所有媒體數(shù)據(jù)(包括視頻及音頻樣本)的單一電影盒(moov盒),支持電影片段(moof)含有除了所述電影盒中所含有的那些樣本以外的額外樣本。通常,電影片段含有在某一時(shí)間段內(nèi)的樣本。通過(guò)使用所述電影片段,客戶端可快速地搜尋所要時(shí)間。電影片段可含有文件的連續(xù)字節(jié),使得根據(jù)串流協(xié)議(例如,HTTP串流),客戶端可發(fā)出檢索電影片段的部分獲取請(qǐng)求。關(guān)于作為實(shí)例的3GPP,支持3GPP文件的HTTP/TCP/IP輸送以進(jìn)行下載及漸進(jìn)式下載。此外,使用HTTP進(jìn)行視頻串流可提供一些優(yōu)點(diǎn),且基于HTTP的視頻串流服務(wù)正變得風(fēng)行。HTTP串流可提供某些優(yōu)點(diǎn),包括可使用現(xiàn)有因特網(wǎng)組件及協(xié)議,使得不需要作出新的努力來(lái)開(kāi)發(fā)用于經(jīng)由網(wǎng)絡(luò)輸送視頻數(shù)據(jù)的新技術(shù)。其它輸送協(xié)議(例如,實(shí)時(shí)協(xié)議(RTP)有效負(fù)載格式)需要中間網(wǎng)絡(luò)裝置(例如,中間盒)知曉媒體格式及發(fā)信號(hào)通知上下文。而且,HTTP串流可為客戶端驅(qū)動(dòng)的,此可避免控制問(wèn)題。使用HTTP在實(shí)施HTTP1.1的網(wǎng)絡(luò)服務(wù)器處還未必需要新的硬件或軟件實(shí)施方案。HTTP串流還提供TCP易用性及防火墻穿越。在HTTP串流中,媒體表示可為客戶端可存取的數(shù)據(jù)的結(jié)構(gòu)化集合。所述客戶端可請(qǐng)求并下載媒體數(shù)據(jù)信息以向用戶呈現(xiàn)串流服務(wù)。服務(wù)由客戶端的用戶體驗(yàn)為電影的表示,所述電影的表示由客戶端從由服務(wù)器遞送的內(nèi)容分量解碼并再現(xiàn)。在HTTP串流中,替代響應(yīng)于一個(gè)請(qǐng)求而接收完整內(nèi)容,客戶端可請(qǐng)求內(nèi)容分量的段。以此方式,HTTP串流可提供內(nèi)容的更靈活遞送。段可包括可通過(guò)一個(gè)URL請(qǐng)求的連續(xù)電影片段的集合。舉例來(lái)說(shuō),段可為可含有視頻及音頻的整個(gè)小文件。作為另一實(shí)例,段可對(duì)應(yīng)于可含有一個(gè)視頻軌道片段及一個(gè)音頻軌道片段的一個(gè)電影片段。作為又一實(shí)例,段可對(duì)應(yīng)于若干電影片段,所述若干電影片段中的任一者或全部可具有一個(gè)視頻片段及一個(gè)音頻片段,且所述電影片段可在解碼時(shí)間上為連續(xù)的。還被稱作內(nèi)容散布網(wǎng)絡(luò)的內(nèi)容遞送網(wǎng)絡(luò)(CDN)可包括含有數(shù)據(jù)的復(fù)本的計(jì)算機(jī)的系統(tǒng),所述計(jì)算機(jī)放置于網(wǎng)絡(luò)中的各點(diǎn)處以便使用于由客戶端貫穿網(wǎng)絡(luò)而存取數(shù)據(jù)的帶寬最大化。與所有客戶端存取同一中央服務(wù)器相反,客戶端可存取客戶端附近的數(shù)據(jù)的復(fù)本,此可避免個(gè)別服務(wù)器附近的瓶頸。內(nèi)容類型可包括網(wǎng)絡(luò)對(duì)象、可下載對(duì)象(媒體文件、軟件、文檔及其類似者)、應(yīng)用程序、實(shí)時(shí)媒體流及因特網(wǎng)遞送的其它組件(DNS、路由及數(shù)據(jù)庫(kù)查詢)。存在僅依賴于HTTP協(xié)議的許多成功⑶N,更具體來(lái)說(shuō),基于HTTP1.1的原始服務(wù)器、代理及高速緩沖存儲(chǔ)器。在HTTP串流中,頻繁使用的操作包括獲取及部分獲取。獲取操作檢索與給定統(tǒng)一資源定位符(URL)或統(tǒng)一資源名稱(URN)相關(guān)聯(lián)的整個(gè)文件。部分獲取操作接收字節(jié)范圍作為輸入?yún)?shù)且檢索文件的對(duì)應(yīng)于所接收到的字節(jié)范圍的連續(xù)數(shù)目個(gè)字節(jié)。因此,可提供電影片段以進(jìn)行HTTP串流,因?yàn)椴糠肢@取操作可取得一個(gè)或一個(gè)以上個(gè)別電影片段。電影片段可含有來(lái)自不同軌道的若干軌道片段。在HTTP串流的上下文中,段可作為對(duì)獲取請(qǐng)求或部分獲取請(qǐng)求的響應(yīng)而遞送(在HTTP1.1中)。在⑶N中,例如代理及高速緩沖存儲(chǔ)器等計(jì)算裝置可響應(yīng)于請(qǐng)求而存儲(chǔ)段。因此,如果所述段由另一客戶端(或同一客 戶端)請(qǐng)求,且所述客戶端具有經(jīng)由此代理裝置的路徑,則所述代理裝置可將段的本地復(fù)本遞送到客戶端,而不再次從原始服務(wù)器檢索所述段。在HTTP串流中,如果代理裝置支持HTTP1. 1,則作為對(duì)請(qǐng)求的響應(yīng),字節(jié)范圍可在存儲(chǔ)于代理裝置的高速緩沖存儲(chǔ)器中時(shí)進(jìn)行組合,或在用作對(duì)請(qǐng)求的響應(yīng)的本地復(fù)本時(shí)提取。每一內(nèi)容分量可包括連續(xù)片段的部分,其中的每一者可通過(guò)由客戶端裝置所發(fā)送的HTTP獲取或部分獲取來(lái)請(qǐng)求。內(nèi)容分量的此片段可被稱作媒體片段。在HTTP串流中可存在一個(gè)以上媒體表示,以支持各種位速率及各種裝置,以及適應(yīng)各種用戶偏好。表示的描述可描述于媒體呈現(xiàn)描述(MPD)數(shù)據(jù)結(jié)構(gòu)中,所述媒體呈現(xiàn)描述(MPD)數(shù)據(jù)結(jié)構(gòu)可對(duì)應(yīng)于分量映射盒(如由服務(wù)器產(chǎn)生且發(fā)送到客戶端)。也就是說(shuō),如在本發(fā)明中所描述,常規(guī)MH)數(shù)據(jù)結(jié)構(gòu)可包括對(duì)應(yīng)于分量映射盒的數(shù)據(jù)。在其它實(shí)例中,除了在本發(fā)明中關(guān)于分量映射盒所描述的數(shù)據(jù)以外,分量映射盒還可進(jìn)一步包括類似于MPD數(shù)據(jù)結(jié)構(gòu)的數(shù)據(jù)。所描述的表示可包括含于一個(gè)或一個(gè)以上電影文件中的內(nèi)容分量。如果使用靜態(tài)內(nèi)容服務(wù)器,則服務(wù)器可存儲(chǔ)電影文件。如果支持動(dòng)態(tài)內(nèi)容服務(wù)器,則服務(wù)器可響應(yīng)于所接收到的請(qǐng)求而產(chǎn)生動(dòng)態(tài)文件(內(nèi)容)。盡管動(dòng)態(tài)內(nèi)容可由服務(wù)器在運(yùn)作中產(chǎn)生,但其對(duì)計(jì)算裝置(例如,代理及高速緩沖存儲(chǔ)器)為透明的。因此,還可高速緩存響應(yīng)于對(duì)動(dòng)態(tài)內(nèi)容服務(wù)器的請(qǐng)求而提供的段。動(dòng)態(tài)內(nèi)容服務(wù)器可具有更復(fù)雜的實(shí)施方案且在服務(wù)器側(cè)處的存儲(chǔ)可能為次最佳的或在內(nèi)容的遞送期間的高速緩存可能為次有效的。另外,本發(fā)明還包括用于在MPD中發(fā)信號(hào)通知特定表示(例如,分量的組合)是否為完整操作點(diǎn)的技術(shù)。也就是說(shuō),服務(wù)器可在MPD中提供旗標(biāo)以向客戶端指示表示是否可被選擇作為完整視頻操作點(diǎn)。操作點(diǎn)可對(duì)應(yīng)于MVC子位流,即,包含在某一時(shí)間層級(jí)處的視圖的子集且自身表示有效位流的MVC位流的子集。操作點(diǎn)可表示某一時(shí)間及視圖可縮放性層級(jí)且僅含有用以表示在某一時(shí)間層級(jí)處的視圖的某一子集的有效位流所需的NAL單元。操作點(diǎn)可通過(guò)視圖的子集的視圖識(shí)別符值及視圖的子集的最高時(shí)間識(shí)別符來(lái)描述。MPD還可描述多媒體內(nèi)容的個(gè)別表示。舉例來(lái)說(shuō),對(duì)于每一表示,MH)可發(fā)信號(hào)通知表示識(shí)別符、默認(rèn)屬性表示識(shí)別符、表示的簡(jiǎn)檔及層級(jí)指示符、表示的幀速率、相依性群組識(shí)別符及時(shí)間識(shí)別符。所述表示識(shí)別符可提供多媒體內(nèi)容的相關(guān)聯(lián)表示的唯一識(shí)別符。所述默認(rèn)屬性表示識(shí)別符可提供具有將用作當(dāng)前表示的默認(rèn)屬性的屬性的表示的識(shí)別符,所述屬性可包括以下各項(xiàng)中的任一者或全部簡(jiǎn)檔及層級(jí)指示符、帶寬、寬度、高度、幀速率、相依性群組識(shí)別符、時(shí) 間識(shí)別符及/或3D視頻的幀封裝類型。所述幀速率識(shí)別符可指定對(duì)應(yīng)表示的視頻分量的幀速率。所述相依性群組識(shí)別符可指定相依性群組,對(duì)應(yīng)表示被指派給所述群組。相依性群組中的具有一個(gè)時(shí)間識(shí)別符值的表示可相依于同一相依性群組中的具有較低時(shí)間識(shí)別符值的表示。對(duì)于3D視頻表示(例如,對(duì)應(yīng)于多視圖視頻)來(lái)說(shuō),分量映射盒可描述供輸出的目標(biāo)視圖的數(shù)目。也就是說(shuō),分量映射盒可包括表示用于表示的目標(biāo)輸出視圖的數(shù)目的值。在一些實(shí)例中,分量映射盒可提供單一視圖的深度信息連同所述單一視圖的經(jīng)譯碼樣本,使得客戶端裝置可從所述單一視圖及所述深度信息構(gòu)造第二視圖??纱嬖谄鞓?biāo)以指示所述表示為視圖加深度表示。在一些實(shí)例中,多個(gè)視圖可含于所述表示中,每一視圖與深度信息相關(guān)聯(lián)。以此方式,所述視圖中的每一者可用作用于建立立體視圖對(duì)的基礎(chǔ),從而針對(duì)所述表示的所述視圖中的每一者產(chǎn)生兩個(gè)視圖。因此,盡管多個(gè)視圖可含于所述表示中,但所述視圖中的兩者未必形成立體視圖對(duì)。在一些實(shí)例中,可包括旗標(biāo)以指示表示是否僅為相依表示,相依表示自身不可形成對(duì)應(yīng)多媒體內(nèi)容的有效表示。圖1為說(shuō)明其中音頻/視頻(A/V)源裝置20將音頻及視頻數(shù)據(jù)輸送到A/V目的地裝置40的實(shí)例系統(tǒng)10的框圖。圖1的系統(tǒng)10可對(duì)應(yīng)于視頻電話會(huì)議系統(tǒng)、服務(wù)器/客戶端系統(tǒng)、廣播臺(tái)/接收器系統(tǒng),或其中將視頻數(shù)據(jù)從源裝置(例如,A/V源裝置20)發(fā)送到目的地裝置(例如,A/V目的地裝置40)的任何其它系統(tǒng)。在一些實(shí)例中,A/V源裝置20及A/V目的地裝置40可執(zhí)行雙向信息交換。也就是說(shuō),A/V源裝置20及A/V目的地裝置40可能夠進(jìn)行以下兩者編碼及解碼(以及發(fā)射及接收)音頻及視頻數(shù)據(jù)。在一些實(shí)例中,音頻編碼器26可包含語(yǔ)音編碼器,還被稱作聲碼器。在圖1的實(shí)例中,A/V源裝置20包含音頻源22及視頻源24。舉例來(lái)說(shuō),音頻源22可包含麥克風(fēng),所述麥克風(fēng)產(chǎn)生表示待由音頻編碼器26編碼的所俘獲音頻數(shù)據(jù)的電信號(hào)?;蛘?,音頻源22可包含存儲(chǔ)先前記錄的音頻數(shù)據(jù)的存儲(chǔ)媒體、例如計(jì)算機(jī)化合成器等音頻數(shù)據(jù)產(chǎn)生器,或任何其它音頻數(shù)據(jù)源。視頻源24可包含產(chǎn)生待由視頻編碼器28編碼的視頻數(shù)據(jù)的攝像機(jī)、編碼有先前記錄的視頻數(shù)據(jù)的存儲(chǔ)媒體、視頻數(shù)據(jù)產(chǎn)生單元或任何其它視頻數(shù)據(jù)源。原始音頻及視頻數(shù)據(jù)可包含模擬或數(shù)字?jǐn)?shù)據(jù)。在通過(guò)音頻編碼器26及/或視頻編碼器28編碼之前,模擬數(shù)據(jù)可經(jīng)數(shù)字化。在講話參與者正在講話時(shí),音頻源22可獲得來(lái)自講話參與者的音頻數(shù)據(jù),且視頻源24可同時(shí)獲得所述講話參與者的視頻數(shù)據(jù)。在其它實(shí)例中,音頻源22可包含包括所存儲(chǔ)的音頻數(shù)據(jù)的計(jì)算機(jī)可讀存儲(chǔ)媒體,且視頻源24可包含包括所存儲(chǔ)的視頻數(shù)據(jù)的計(jì)算機(jī)可讀存儲(chǔ)媒體。以此方式,本發(fā)明中所描述的技術(shù)可應(yīng)用于實(shí)況、串流、實(shí)時(shí)音頻及視頻數(shù)據(jù)或應(yīng)用于經(jīng)存檔、預(yù)先記錄的音頻及視頻數(shù)據(jù)。此外,所述技術(shù)可應(yīng)用于計(jì)算機(jī)產(chǎn)生的音頻及視頻數(shù)據(jù)。對(duì)應(yīng)于視頻幀的音頻幀大體上為含有與在視頻幀內(nèi)所含有的由視頻源24所俘獲的視頻數(shù)據(jù)同時(shí)地由音頻源22所俘獲的音頻數(shù)據(jù)的音頻幀。舉例來(lái)說(shuō),當(dāng)講話參與者大體上通過(guò)講話而產(chǎn)生音頻數(shù)據(jù)時(shí),音頻源22俘獲音頻數(shù)據(jù),且視頻源24同時(shí)(即,在音頻源22正俘獲音頻數(shù)據(jù)的同時(shí))俘獲講話參與者的視頻數(shù)據(jù)。因此,音頻幀可在時(shí)間上對(duì)應(yīng)于一個(gè)或一個(gè)以上特定視頻幀。因此,音頻幀對(duì)應(yīng)于視頻幀大體上對(duì)應(yīng)于同時(shí)俘獲到音頻數(shù)據(jù)及視頻數(shù)據(jù)且音頻幀及視頻幀分別包含音頻數(shù)據(jù)及同時(shí)俘獲到的視頻數(shù)據(jù)的情形。在一些實(shí)例 中,音頻編碼器26可將表示記錄每一經(jīng)編碼音頻幀的音頻數(shù)據(jù)的時(shí)間的時(shí)戳編碼于所述經(jīng)編碼音頻幀中,且類似地,視頻編碼器28可將表示記錄每一經(jīng)編碼視頻幀的視頻數(shù)據(jù)的時(shí)間的時(shí)戳編碼于所述經(jīng)編碼視頻幀中。在這些實(shí)例中,音頻幀對(duì)應(yīng)于視頻幀可包含音頻幀包含一個(gè)時(shí)戳且視頻幀包含同一時(shí)戳。A/V源裝置20可包括內(nèi)部時(shí)鐘,音頻編碼器26及/或視頻編碼器28可從所述內(nèi)部時(shí)鐘產(chǎn)生時(shí)戳,或音頻源22及視頻源24可使用所述內(nèi)部時(shí)鐘來(lái)使音頻及視頻數(shù)據(jù)分別與時(shí)戳相關(guān)聯(lián)。在一些實(shí)例中,音頻源22可將對(duì)應(yīng)于記錄音頻數(shù)據(jù)的時(shí)間的數(shù)據(jù)發(fā)送到音頻編碼器26,且視頻源24可將對(duì)應(yīng)于記錄視頻數(shù)據(jù)的時(shí)間的數(shù)據(jù)發(fā)送到視頻編碼器28。在一些實(shí)例中,音頻編碼器26可將序列識(shí)別符編碼于經(jīng)編碼音頻數(shù)據(jù)中以指示經(jīng)編碼音頻數(shù)據(jù)的相對(duì)時(shí)間排序但不必指示記錄音頻數(shù)據(jù)的絕對(duì)時(shí)間,且類似地,視頻編碼器28也可使用序列識(shí)別符來(lái)指示經(jīng)編碼視頻數(shù)據(jù)的相對(duì)時(shí)間排序。類似地,在一些實(shí)例中,序列識(shí)別符可經(jīng)映射或以其它方式與時(shí)戳相關(guān)。本發(fā)明的技術(shù)大體上是針對(duì)經(jīng)編碼多媒體(例如,音頻及視頻)數(shù)據(jù)的輸送,以及經(jīng)輸送的多媒體數(shù)據(jù)的接收以及后續(xù)解譯及解碼。明確地說(shuō),封裝單元30可產(chǎn)生多媒體內(nèi)容的分量映射盒,以及對(duì)應(yīng)于所述多媒體內(nèi)容的每一文件的分量布置盒。在一些實(shí)例中,處理器可執(zhí)行對(duì)應(yīng)于封裝單元30的指令。也就是說(shuō),用以執(zhí)行歸封裝單元30所有的功能性的指令可存儲(chǔ)于計(jì)算機(jī)可讀媒體上且由處理器執(zhí)行。在其它實(shí)例中,其它處理電路也可經(jīng)配置以執(zhí)行歸封裝單元30所有的功能??膳c內(nèi)容的分量(例如,音頻分量、視頻分量或其它分量)分尚地存儲(chǔ)分量映射盒。因此,目的地裝置40可請(qǐng)求多媒體內(nèi)容的分量映射盒。目的地裝置40可使用分量映射盒來(lái)基于用戶的偏好、網(wǎng)絡(luò)條件、目的地裝置40的解碼及再現(xiàn)能力或其它因素確定待請(qǐng)求的分量以執(zhí)行內(nèi)容的重放。A/V源裝置20可將“服務(wù)”提供到A/V目的地裝置40。服務(wù)大體上對(duì)應(yīng)于一個(gè)或一個(gè)以上音頻及視頻內(nèi)容分量的組合,其中所述音頻及視頻內(nèi)容分量為完整內(nèi)容的可用內(nèi)容分量的子集。一個(gè)服務(wù)可對(duì)應(yīng)于具有兩個(gè)視圖的立體視頻,而另一服務(wù)可對(duì)應(yīng)于四個(gè)視圖,且又一服務(wù)可對(duì)應(yīng)于八個(gè)視圖。大體來(lái)說(shuō),服務(wù)對(duì)應(yīng)于源裝置20提供可用內(nèi)容分量的組合(即,子集)。內(nèi)容分量的組合還被稱作內(nèi)容的表示。封裝單元30從音頻編碼器26及視頻編碼器28接收經(jīng)編碼樣本且從所述經(jīng)編碼樣本形成對(duì)應(yīng)網(wǎng)絡(luò)抽象層(NAL)單元,所述網(wǎng)絡(luò)抽象層(NAL)單元可采取包化基本流(PES)包的形式。在H.264/AVC(高級(jí)視頻譯碼)的實(shí)例中,經(jīng)譯碼視頻段組織成NAL單元,此提供“網(wǎng)絡(luò)易用”視頻表示尋址應(yīng)用,例如視頻電話、存儲(chǔ)、廣播或串流。NAL單元可分類為視頻譯碼層(VCL) NAL單元及非VCL NAL單元。VCL單元可含有來(lái)自核心壓縮引擎的數(shù)據(jù),且可包括塊、宏塊及/或切片層級(jí)數(shù)據(jù)。其它NAL單元可為非VCL NAL單元。在一些實(shí)例中,一個(gè)時(shí)間實(shí)例中的經(jīng)譯碼圖片(通常呈現(xiàn)為主要經(jīng)譯碼圖片)可含于存取單元中,所述存取單元可包括一個(gè)或一個(gè)以上NAL單元。根據(jù)本發(fā)明的技術(shù),封裝單元30可構(gòu)造描述內(nèi)容分量的特性的分量映射盒。封裝單元30還可構(gòu)造一個(gè)或一個(gè)以上視頻文件的分量布置盒。封裝單元30可使每一分量布置盒與對(duì)應(yīng)視頻文件相關(guān)聯(lián),且可 使分量映射盒與視頻文件集合相關(guān)聯(lián)。以此方式,分量布置盒與視頻文件之間可存在1:1對(duì)應(yīng)性,且分量映射盒與視頻文件之間可存在1:N對(duì)應(yīng)性。如上文所提,分量映射盒可描述為內(nèi)容所共有的分量的特性。舉例來(lái)說(shuō),所述內(nèi)容可包括音頻分量、視頻分量及例如隱藏式輔助字幕等其它分量。某一類型的分量中的每一者可為可彼此切換的。舉例來(lái)說(shuō),兩個(gè)視頻分量可為可切換的,因?yàn)榭蓹z索來(lái)自兩個(gè)分量中的任一者的數(shù)據(jù)而不阻礙內(nèi)容的重放。各種分量可以各種方式以及以各種質(zhì)量來(lái)編碼。舉例來(lái)說(shuō),各種視頻分量可以各種幀速率、位速率、使用不同編碼器(例如,對(duì)應(yīng)于不同編解碼器)來(lái)編碼,以各種文件類型(例如,H. 264/AVC或MPEG-2輸送流(TS))來(lái)封裝,或以其它方式而彼此不同。然而,例如,視頻分量的選擇大體上獨(dú)立于音頻分量的選擇。通過(guò)分量映射盒發(fā)信號(hào)通知的分量的特性可包括平均位速率、最大位速率(例如,在分量的一秒的重放時(shí)間內(nèi))、分辨率、幀速率、對(duì)其它分量的相依性,及/或各種文件類型(例如,多視圖視頻)的擴(kuò)展(例如,以輸出為目標(biāo)的視圖的數(shù)目及所述視圖中的每一者的識(shí)別符)??沙洚?dāng)服務(wù)器(例如,HTTP服務(wù)器)的源裝置20可存儲(chǔ)同一內(nèi)容的多個(gè)表示供調(diào)適。一些表示可含有多個(gè)內(nèi)容分量。所述分量可存儲(chǔ)于源裝置20的存儲(chǔ)裝置(例如,一個(gè)或一個(gè)以上硬盤驅(qū)動(dòng)器)上的不同文件中,且因此,表示可包括來(lái)自不同文件的數(shù)據(jù)。通過(guò)發(fā)信號(hào)通知各種分量的特性,封裝單元30可向目的地裝置40提供選擇每一可切換分量的一者以再現(xiàn)及重放對(duì)應(yīng)內(nèi)容的能力。也就是說(shuō),目的地裝置40可從源裝置20檢索特定內(nèi)容的分量映射盒,選擇所述內(nèi)容的對(duì)應(yīng)于所述內(nèi)容的特定表示的分量,接著從源裝置20檢索選定分量的數(shù)據(jù)(例如,根據(jù)串流協(xié)議(例如,HTTP串流))。目的地裝置40可基于網(wǎng)絡(luò)條件(例如,可用帶寬)及分量的特性選擇表示。此外,目的地裝置40可使用由源裝置20發(fā)信號(hào)通知的數(shù)據(jù)來(lái)適應(yīng)變化的網(wǎng)絡(luò)條件。也就是說(shuō),因?yàn)橥活愋偷姆至靠杀舜饲袚Q,所以當(dāng)網(wǎng)絡(luò)條件改變時(shí),目的地裝置40可選擇更適合于新近確定的網(wǎng)絡(luò)條件的特定類型的不同分量。封裝單元30將分量識(shí)別符值指派給多媒體內(nèi)容的每一分量。所述分量識(shí)別符值對(duì)于所述分量為唯一的,而與類型無(wú)關(guān)。也就是說(shuō),例如,不應(yīng)存在具有同一分量識(shí)別符的音頻分量及視頻分量。分量識(shí)別符還未必與個(gè)別文件內(nèi)的軌道識(shí)別符有關(guān)。舉例來(lái)說(shuō),內(nèi)容可具有各自存儲(chǔ)于不同文件中的兩個(gè)視頻分量。所述文件中的每一者可使用同一軌道識(shí)別符來(lái)識(shí)別視頻分量,因?yàn)榫窒抻谔囟ㄎ募淖R(shí)別符對(duì)于那個(gè)文件的范圍(并非在外部)為特定的。然而,因?yàn)楸景l(fā)明的技術(shù)涉及提供可駐留于多個(gè)文件內(nèi)的分量的特性,所以本發(fā)明提議唯一地指派未必與軌道識(shí)別符有關(guān)的分量識(shí)別符。分量映射盒還可針對(duì)文件中的每一分量/軌道指示如何存儲(chǔ)片段,例如,片段在何處開(kāi)始、所述片段是否包括隨機(jī)存取點(diǎn)(且所述隨機(jī)存取點(diǎn)是瞬時(shí)解碼刷新(IDR)圖片還是開(kāi)放解碼刷新(ODR)圖片)、到每一片段的開(kāi)始的字節(jié)偏移、每一片段中的第一樣本的解碼時(shí)間、隨機(jī)存取點(diǎn)的解碼及呈現(xiàn)時(shí)間,及用以指示特定片段是否屬于新段的旗標(biāo)。每一段可為可獨(dú)立檢索的。舉例來(lái)說(shuō),封裝單元30可存儲(chǔ)分量的每一段,使得可使用唯一統(tǒng)一資源定位符(URL)或統(tǒng)一資源名稱(URN)來(lái)檢索每一段。此外,封裝單元30可在 所述文件中的每一者中提供分量布置盒,分量布置盒提供內(nèi)容的分量識(shí)別符與對(duì)應(yīng)文件內(nèi)的軌道識(shí)別符之間的映射。封裝單元30還可發(fā)信號(hào)通知同一類型的分量之間的相依性。舉例來(lái)說(shuō),某些分量可相依于同一類型的其它分量來(lái)正確解碼。作為一個(gè)實(shí)例,在可縮放視頻譯碼(SVC)中,基礎(chǔ)層可對(duì)應(yīng)于一個(gè)分量,且所述基礎(chǔ)層的增強(qiáng)層可對(duì)應(yīng)于另一分量。作為另一實(shí)例,在多視圖視頻譯碼(MVC)中,一個(gè)視圖可對(duì)應(yīng)于一個(gè)分量,且同一場(chǎng)景的另一視圖可對(duì)應(yīng)于另一分量。作為又一實(shí)例,一個(gè)分量的樣本可相對(duì)于另一分量的樣本來(lái)編碼。舉例來(lái)說(shuō),在MVC中,可存在對(duì)應(yīng)于使得能夠進(jìn)行視圖間預(yù)測(cè)的不同視圖的分量。以此方式,目的地裝置40可確定分量之間的相依性,且除了所要分量以外,還檢索相依于父代分量的分量的父代分量,以便適當(dāng)?shù)亟獯a及/或再現(xiàn)所述分量。封裝單元30可進(jìn)一步發(fā)信號(hào)通知相依性的排序及/或分量的解碼次序,使得目的地裝置40可以適當(dāng)次序請(qǐng)求分量的數(shù)據(jù)。此外,封裝單元30可發(fā)信號(hào)通知具有相依性的分量之間的時(shí)間層差,使得目的地裝置40可適當(dāng)?shù)貙?duì)準(zhǔn)分量的樣本以供解碼及/或再現(xiàn)。舉例來(lái)說(shuō),一個(gè)視頻分量可具有巾貞速率24及等于O的temporal_id、12fps的子層,而另一視頻分量可具有巾貞速率30 及等于 O 的 temporal_id、7. 5fps 的子層。封裝單元30可發(fā)信號(hào)通知用以形成表示的分量的組合的各種可能多路復(fù)用間隔。以此方式,目的地裝置40可選擇所述可能多路復(fù)用間隔中的一者,以便在足夠時(shí)間段內(nèi)請(qǐng)求各種分量的數(shù)據(jù),從而允許在正解碼及顯示所述分量的先前段時(shí)檢索分量的即將到來(lái)的段的數(shù)據(jù)。也就是說(shuō),目的地裝置40可預(yù)先足夠提前地請(qǐng)求分量的數(shù)據(jù)使得不存在中斷的重放(假定無(wú)網(wǎng)絡(luò)條件的即刻改變),但不會(huì)預(yù)先提前地過(guò)多而使得緩沖器溢出。如果存在網(wǎng)絡(luò)條件的改變,則目的地裝置40可選擇不同多路復(fù)用間隔而非完全地切換分量,以確保在等待更多后續(xù)數(shù)據(jù)的發(fā)射時(shí)檢索足量的數(shù)據(jù)以供解碼及再現(xiàn)。封裝單元30可基于明確地發(fā)信號(hào)通知的間隔或間隔范圍而發(fā)信號(hào)通知多路復(fù)用間隔,且可在分量映射盒內(nèi)發(fā)信號(hào)通知這些多路復(fù)用間隔。在一些實(shí)例中,源裝置20可接收指定多個(gè)字節(jié)范圍的請(qǐng)求。也就是說(shuō),目的地裝置40可在一個(gè)請(qǐng)求中指定多個(gè)字節(jié)范圍以實(shí)現(xiàn)文件內(nèi)的各種分量的多路復(fù)用。目的地裝置40可在分量處于多個(gè)文件中時(shí)發(fā)送多個(gè)請(qǐng)求,所述多個(gè)請(qǐng)求中的任一者或全部可指定一個(gè)或一個(gè)以上字節(jié)范圍。作為實(shí)例,目的地裝置40可將多個(gè)HTTP獲取或部分獲取請(qǐng)求提交到多個(gè)URL或URN,其中所述部分獲取請(qǐng)求中的任一者或全部可指定請(qǐng)求的URL或URN內(nèi)的多個(gè)字節(jié)范圍。源裝置20可通過(guò)將所請(qǐng)求數(shù)據(jù)提供到目的地裝置40而進(jìn)行響應(yīng)。在一些實(shí)例中,源裝置20可(例如)通過(guò)以下操作而支持動(dòng)態(tài)多路復(fù)用實(shí)施通用網(wǎng)關(guān)接口(CGI)以一起多路復(fù)用表示的分量從而動(dòng)態(tài)地形成文件,源裝置20可接著將所述文件提供到目的地裝置40。封裝單元30還可指定分量映射盒所對(duì)應(yīng)的內(nèi)容的持續(xù)時(shí)間。默認(rèn)地,目的地裝置40可經(jīng)配置以確定當(dāng)無(wú)持續(xù)時(shí)間經(jīng)發(fā)信號(hào)通知時(shí),分量映射盒應(yīng)用于整個(gè)內(nèi)容。然而,在發(fā)信號(hào)通知持續(xù)時(shí)間的情況下,目的地裝置40可經(jīng)配置以請(qǐng)求內(nèi)容的多個(gè)分量映射盒,每一分量映射盒對(duì)應(yīng)于內(nèi)容的不同持續(xù)時(shí)間。封裝單元30可連續(xù)地將所述分量映射盒存儲(chǔ)在一起,或?qū)⑵浯鎯?chǔ)于單獨(dú)位置中。在一些情況下,可將分量的各種部分(例如,段)存儲(chǔ)于單獨(dú)文件(例如,URL或URN可檢索數(shù)據(jù)結(jié)構(gòu))中。在這些情況下,同一分量識(shí)別符可用以識(shí)別每一文件中的分量,例如在文件的分量布置盒內(nèi)。所述文件可具有順序時(shí)序信息,即,指示文件中的一者緊跟在另一文件之后的時(shí)序信息。目的地裝置40可基于某一時(shí)序間隔及瞬時(shí)位速率來(lái)產(chǎn)生對(duì)經(jīng)多路復(fù)用片段的請(qǐng)求。目的地裝置40可基于分量的片段中的字節(jié)的數(shù)目來(lái)計(jì)算瞬時(shí)位速率。如同多數(shù)視頻 譯碼標(biāo)準(zhǔn)一樣,H. 264/AVC定義無(wú)錯(cuò)誤位流的語(yǔ)法、語(yǔ)義及解碼過(guò)程,其中的任一者遵照某一簡(jiǎn)檔或?qū)蛹?jí)。H. 264/AVC不指定編碼器,但編碼器的任務(wù)為保證所產(chǎn)生的位流對(duì)于解碼器來(lái)說(shuō)為符合標(biāo)準(zhǔn)的。在視頻譯碼標(biāo)準(zhǔn)的上下文中,“簡(jiǎn)檔”對(duì)應(yīng)于算法、特征或工具及施加于算法、特征或工具的約束的子集。如由H. 264標(biāo)準(zhǔn)所定義,例如,“簡(jiǎn)檔”為由H. 264標(biāo)準(zhǔn)指定的整個(gè)位流語(yǔ)法的子集。“層級(jí)”對(duì)應(yīng)于解碼器資源消耗的限制,例如與圖片的分辨率、位速率及宏塊(MB)處理速率有關(guān)的解碼器存儲(chǔ)器及計(jì)算??捎胮r0file_idC (簡(jiǎn)檔指示符)值發(fā)信號(hào)通知簡(jiǎn)檔,而可用Ievelidc (層級(jí)指示符)值發(fā)信號(hào)通知層級(jí)。舉例來(lái)說(shuō),H. 264標(biāo)準(zhǔn)認(rèn)識(shí)到,在由給定簡(jiǎn)檔的語(yǔ)法強(qiáng)加的邊界內(nèi),仍有可能需要編碼器及解碼器的性能的大變化,此視位流中的語(yǔ)法元素所采取的值(例如,經(jīng)解碼圖片的指定大小)而定。H. 264標(biāo)準(zhǔn)進(jìn)一步認(rèn)識(shí)到,在許多應(yīng)用中,實(shí)施能夠處理特定簡(jiǎn)檔內(nèi)的語(yǔ)法的所有假設(shè)使用的解碼器既不實(shí)用也不經(jīng)濟(jì)。因此,H. 264標(biāo)準(zhǔn)將“層級(jí)”定義為強(qiáng)加于位流中的語(yǔ)法元素的值的約束的指定集合。這些約束可為對(duì)各值的簡(jiǎn)單限制?;蛘撸@些約束可采取對(duì)各值的算術(shù)組合(例如,圖片寬度乘以圖片高度乘以每秒經(jīng)解碼的圖片的數(shù)目)的約束的形式。H. 264標(biāo)準(zhǔn)進(jìn)一步提供,個(gè)別實(shí)施方案可針對(duì)每一所支持簡(jiǎn)檔支持不同層級(jí)。遵照簡(jiǎn)檔的解碼器通常支持所述簡(jiǎn)檔中定義的所有特征。舉例來(lái)說(shuō),作為譯碼特征,B圖片譯碼在H. 264/AVC的基線簡(jiǎn)檔中未受到支持,但在H. 264/AVC的其它簡(jiǎn)檔中受到支持。遵照層級(jí)的解碼器應(yīng)能夠解碼不需要超出所述層級(jí)中定義的限制的資源的任何位流。簡(jiǎn)檔及層級(jí)的定義可有助于可解譯性。舉例來(lái)說(shuō),在視頻發(fā)射期間,可針對(duì)整個(gè)發(fā)射會(huì)話來(lái)協(xié)商一對(duì)簡(jiǎn)檔及層級(jí)定義并實(shí)現(xiàn)一致。更具體來(lái)說(shuō),在H. 264/AVC中,層級(jí)可定義(例如)對(duì)以下各項(xiàng)的限制需要加以處理的宏塊的數(shù)目、經(jīng)解碼圖片緩沖器(DPB)大小、經(jīng)譯碼圖片緩沖器(CPB)大小、垂直運(yùn)動(dòng)向量范圍、每?jī)蓚€(gè)連續(xù)MB的運(yùn)動(dòng)向量的最大數(shù)目,及B塊是否可具有少于8X8個(gè)像素的子宏塊分割區(qū)。以此方式,解碼器可確定所述解碼器是否能夠適當(dāng)?shù)亟獯a所述位流。媒體表示可包括媒體表示描述(MPD),其可含有不同替代表示(例如,具有不同質(zhì)量的視頻服務(wù))的描述,且所述描述可包括(例如)編解碼器信息、簡(jiǎn)檔值及層級(jí)值。目的地裝置40可檢索媒體表示的MPD以確定如何存取各種表示的電影片段。電影片段可位于視頻文件的電影片段盒(moof盒)中。視頻壓縮標(biāo)準(zhǔn)(例如,ITU-TH. 261、H. 262、H. 263、MPEG-U MPEG-2 及 H. 264/MPEG-4第10部分)利用運(yùn)動(dòng)補(bǔ)償時(shí)間預(yù)測(cè)來(lái)減少時(shí)間冗余。編碼器使用來(lái)自一些先前經(jīng)編碼圖片(本文中還被稱作幀)的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)以根據(jù)運(yùn)動(dòng)向量來(lái)預(yù)測(cè)當(dāng)前經(jīng)譯碼圖片。在典型視頻譯碼中,存在三種主要圖片類型。所述三種主要圖片類型為經(jīng)幀內(nèi)譯碼圖片(“I圖片”或“I幀”)、預(yù)測(cè)圖片(“P圖片”或“P幀”)及雙向預(yù)測(cè)圖片(“B圖片”或“B幀”)。P圖片僅使用在時(shí)間次序上在當(dāng)前圖片之前的參考圖片。在B圖片中,可從一個(gè)或兩個(gè)參考圖片來(lái)預(yù)測(cè)所述B圖片的每一塊。這些參考圖片在時(shí)間次序上可位于當(dāng)前圖片之前或之后。根據(jù)H. 264譯碼標(biāo)準(zhǔn),作為實(shí)例,B圖片使用先前經(jīng)譯碼參考圖片的兩個(gè)列表,即列表O及列表I。這兩個(gè)列表可各自含有在時(shí)間次序上的過(guò)去及/或未來(lái)的經(jīng)譯碼圖片。可按以下若干方式中的一者來(lái) 預(yù)測(cè)B圖片中的塊從列表O參考圖片的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)、從列表I參考圖片的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè),或從列表O參考圖片及列表I參考圖片兩者的組合的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)。為了得到列表O參考圖片及列表I參考圖片兩者的組合,分別從列表O參考圖片及列表I參考圖片獲得兩個(gè)運(yùn)動(dòng)補(bǔ)償參考區(qū)域??墒褂闷浣M合來(lái)預(yù)測(cè)當(dāng)前塊。ITU-T H. 264標(biāo)準(zhǔn)支持各種塊大小的幀內(nèi)預(yù)測(cè)(例如,對(duì)于明度分量的16乘16、8乘8或4乘4,以及對(duì)于色度分量的8X8)以及各種塊大小的幀間預(yù)測(cè)(例如,對(duì)于明度分量的16X16、16X8、8X16、8X8、8X4、4X8及4X4,以及對(duì)于色度分量的對(duì)應(yīng)經(jīng)縮放大小)。在本發(fā)明中,“NXN”與“N乘N”可互換使用以指代就垂直及水平維度來(lái)說(shuō)的塊的像素尺寸,例如,16X16個(gè)像素或16乘16個(gè)像素。大體來(lái)說(shuō),16X16塊將在垂直方向上具有16個(gè)像素(y=16)且在水平方向上具有16個(gè)像素(x=16)。同樣,NXN塊大體上在垂直方向上具有N個(gè)像素且在水平方向上具有N個(gè)像素,其中N表示非負(fù)整數(shù)值。可將塊中的像素排列成行及列。塊在水平及垂直維度上可具有不同數(shù)目個(gè)像素。也就是說(shuō),塊可包括NXM個(gè)像素,其中N未必等于M。小于16乘16的塊大小可被稱作16乘16宏塊的分割區(qū)。視頻塊可包含像素域中的像素?cái)?shù)據(jù)的塊,或變換域中的變換系數(shù)的塊,例如,在應(yīng)用如下變換之后,例如離散余弦變換(DCT)、整數(shù)變換、小波變換,或針對(duì)殘余視頻塊數(shù)據(jù)的概念上類似的變換,所述殘余視頻塊數(shù)據(jù)表示經(jīng)譯碼視頻塊與預(yù)測(cè)性視頻塊之間的像素差。在一些情況下,視頻塊可包含變換域中的經(jīng)量化變換系數(shù)的塊。較小視頻塊可提供較好分辨率,且可用于包括高細(xì)節(jié)等級(jí)的視頻幀的位置。大體來(lái)說(shuō),可將宏塊及各種分割區(qū)(有時(shí)被稱作子塊)視為視頻塊。另外,可將切片視為多個(gè)視頻塊,例如宏塊及/或子塊。每一切片可為視頻幀的可獨(dú)立解碼單元?;蛘?,幀自身可為可解碼單元,或幀的其它部分可被定義為可解碼單元。術(shù)語(yǔ)“經(jīng)譯碼單元”或“譯碼單元”可指代視頻幀的任何可獨(dú)立解碼單元,例如整個(gè)幀、幀的切片、還稱作序列的圖片群組(GOP),或根據(jù)適用的譯碼技術(shù)定義的另一可獨(dú)立解碼單元。術(shù)語(yǔ)“宏塊”指代用于根據(jù)包含16X 16個(gè)像素的二維像素陣列編碼圖片及/或視頻數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)。每一像素包含色度分量及明度分量。因此,宏塊可界定四個(gè)明度塊(各自包含8X8個(gè)像素的二維陣列)、兩個(gè)色度塊(各自包含16X16個(gè)像素的二維陣列)及標(biāo)頭,所述標(biāo)頭包含語(yǔ)法信息,例如經(jīng)譯碼塊模式(CBP)、編碼模式(例如,幀內(nèi)(I)或幀間(P或B)編碼模式)、經(jīng)幀內(nèi)編碼塊的分割區(qū)的分割區(qū)大小(例如,16 X 16、16 X 8、8 X 16、8 X 8、8X4、4X8或4X4),或經(jīng)幀間編碼宏塊的一個(gè)或一個(gè)以上運(yùn)動(dòng)向量。視頻編碼器28、視頻解碼器48、音頻編碼器26、音頻解碼器46、封裝單元30及解封裝單元38在適當(dāng)時(shí)各自可實(shí)施為多種合適處理電路中的任一者,例如一個(gè)或一個(gè)以上微處理器、數(shù)字信號(hào)處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、離散邏輯電路、軟件、硬件、固件或其任何組合。視頻編碼器28及視頻解碼器48中的每一者可包括于一個(gè)或一個(gè)以上編碼器或解碼器中,其中的任一者可集成為組合式視頻編碼器/解碼器(編解碼器)的部分。同樣,音頻編碼器26及音頻解碼器46中的每一者可包括于一個(gè)或一個(gè)以上編碼器或解碼器中,其中的任一者可集成為組合式編解碼器的部分。包括視頻編碼器28、視頻解碼器48、音頻編碼器26、音頻解碼器46、封裝單元30及/或解封裝單元38的設(shè)備可包含一個(gè)或一個(gè)以上集成電路、微處理器及/或無(wú)線通信裝置(例如,蜂窩式電話)的任何組合。在封裝單元30已 基于接收到的數(shù)據(jù)組合視頻文件之后,封裝單元30將所述視頻文件傳遞到輸出接口 32以供輸出。在一些實(shí)例中,封裝單元30可在本地存儲(chǔ)所述視頻文件或經(jīng)由輸出接口 32將所述視頻文件發(fā)送到遠(yuǎn)程服務(wù)器,而非直接將所述視頻文件發(fā)送到目的地裝置40。舉例來(lái)說(shuō),輸出接口 32可包含發(fā)射器、收發(fā)器、用于將數(shù)據(jù)寫入到計(jì)算機(jī)可讀媒體的裝置(例如光盤驅(qū)動(dòng)器、磁性媒體驅(qū)動(dòng)器(例如,軟盤驅(qū)動(dòng)器))、通用串行總線(USB)端口、網(wǎng)絡(luò)接口或其它輸出接口。輸出接口 32將所述視頻文件輸出到計(jì)算機(jī)可讀媒體34,例如發(fā)射信號(hào)、磁性媒體、光學(xué)媒體、存儲(chǔ)器、快閃驅(qū)動(dòng)器或其它計(jì)算機(jī)可讀媒體。輸出接口 32可實(shí)施HTTP1.1以響應(yīng)HTTP獲取及部分獲取請(qǐng)求。以此方式,源裝置20可充當(dāng)HTTP串流服務(wù)器。最終,輸入接口 36從計(jì)算機(jī)可讀媒體34檢索數(shù)據(jù)。輸入接口 36可包含(例如)光盤驅(qū)動(dòng)器、磁性媒體驅(qū)動(dòng)器、USB端口、接收器、收發(fā)器或其它計(jì)算機(jī)可讀媒體接口。輸入接口 36可將數(shù)據(jù)提供到解封裝單元38。解封裝單元38可解封裝視頻文件的元素以檢索經(jīng)編碼數(shù)據(jù)且將所述經(jīng)編碼數(shù)據(jù)發(fā)送到音頻解碼器46或視頻解碼器48,此取決于所述經(jīng)編碼數(shù)據(jù)是音頻分量的部分還是視頻分量的部分。音頻解碼器46解碼經(jīng)編碼音頻數(shù)據(jù)且將所述經(jīng)解碼音頻數(shù)據(jù)發(fā)送到音頻輸出42,而視頻解碼器48解碼經(jīng)編碼視頻數(shù)據(jù)且將所述經(jīng)解碼視頻數(shù)據(jù)(其可包括多個(gè)視圖)發(fā)送到視頻輸出44。圖2為說(shuō)明實(shí)例封裝單元30的組件的框圖。在圖2的實(shí)例中,封裝單元30包括視頻輸入接口 80、音頻輸入接口 82、文件建立單元60及視頻文件輸出接口 84。在此實(shí)例中,文件建立單元60包括分量組合單元62、分量映射盒構(gòu)造器64及分量布置(arr’ t)盒構(gòu)造器66。視頻輸入接口 80及音頻輸入接口 82分別接收經(jīng)編碼視頻及音頻數(shù)據(jù)。當(dāng)數(shù)據(jù)經(jīng)編碼時(shí),視頻輸入接口 80及音頻輸入接口 82可接收經(jīng)編碼視頻及音頻數(shù)據(jù),或可從計(jì)算機(jī)可讀媒體檢索經(jīng)編碼視頻及音頻數(shù)據(jù)。在接收到經(jīng)編碼視頻及音頻數(shù)據(jù)后,視頻輸入接口80及音頻輸入接口 82即刻將經(jīng)編碼視頻及音頻數(shù)據(jù)傳遞到文件建立單元60用于組合到視頻文件中。文件建立單元60可對(duì)應(yīng)于控制單元,所述控制單元包括經(jīng)配置以執(zhí)行歸其所有的功能及程序的硬件、軟件及/或固件。所述控制單元可進(jìn)一步執(zhí)行大體上歸封裝單元30所有的功能。對(duì)于文件建立單元60是以軟件及/或固件體現(xiàn)的實(shí)例來(lái)說(shuō),封裝單元30可包括計(jì)算機(jī)可讀媒體,其包含用于與文件建立單元60 (以及分量組合單元62、分量映射盒構(gòu)造器64及分量布置盒構(gòu)造器66)相關(guān)聯(lián)的一個(gè)或一個(gè)以上處理器的指令;及用以執(zhí)行所述指令的處理單元。文件建立單元60的子單元(在此實(shí)例中為分量組合單元62、分量映射盒構(gòu)造器64及分量布置盒構(gòu)造器66)中的每一者可實(shí)施為個(gè)別硬件單元及/或軟件模塊,且可在功能上集成或進(jìn)一步分離成額外子單元。文件建立單元60可對(duì)應(yīng)于任何合適處理單元或處理電路,例如一個(gè)或一個(gè)以上微處理器、專用集成電路(ASIC)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、數(shù)字信號(hào)處理器(DSP)或其任何組合。文件建立單元60可進(jìn)一步包括非暫時(shí)性計(jì)算機(jī)可讀媒體,其存儲(chǔ)用于分量組合單元62、分量映射盒構(gòu)造器64及分量布置盒構(gòu)造器66中的任一者或全部的指令;以及用于執(zhí)行所述指令的處理器。大體來(lái)說(shuō),文件建立單元60可建立包括所接收到的音頻及視頻數(shù)據(jù)的一個(gè)或一個(gè)以上視頻文件。分量組合單元62可從所接收到的經(jīng)編碼視頻及音頻樣本產(chǎn)生內(nèi)容的分量。所述分量可對(duì)應(yīng)于若干段,所述若干段中的每一者可包括一個(gè)或一個(gè)以上視頻片段。所述段中的每一者可為可由客戶端裝置(例如,目的地裝置40)獨(dú)立檢索的。舉例來(lái)說(shuō),文件建立單元60可將唯一 URL或URN指派給包括段的文件。分量組合單元62可大體上確保屬于同一分量的經(jīng)編碼樣本與那個(gè)分量組合在一起。分量組合單元62還可將唯一分量識(shí)別符指派給內(nèi)容的每一分量。文件建立單元60可包括文件中的一個(gè)以上分量的數(shù)據(jù),且一個(gè)分量可橫跨多個(gè)文件。文件建立單元60可將分量的數(shù)據(jù)存儲(chǔ)為視頻文件內(nèi)的軌道。分量映射盒構(gòu)造器64可根據(jù)本發(fā)明的技術(shù)產(chǎn)生多媒體內(nèi)容的分量映射盒。舉例來(lái)說(shuō),分量映射盒可發(fā)信號(hào)通知所述內(nèi)容的分量的特性。這些特性可包括分量的平均位速率、分量的最大位速率、分量的分辨率及幀速率(假定所述分量為視頻分量)、對(duì)其它分量的相依性,或其它特性。當(dāng)發(fā)信號(hào)通知相依性時(shí),分量映射盒構(gòu)造器64還可指定具有相依關(guān)系的分量之間的時(shí)間層差。分量映射盒還可發(fā)信號(hào)通知潛在多路復(fù)用間隔的集合或可用于所述分量的多路復(fù)用間隔的范圍。在一些 實(shí)例中,文件建立單元60可將分量映射盒存儲(chǔ)于與包括內(nèi)容的經(jīng)譯碼樣本的所有其它文件分離的文件中。在其它實(shí)例中,文件建立單元60可將分量映射盒包括于視頻文件中的一者的標(biāo)頭中。默認(rèn)地,分量映射盒應(yīng)用于整個(gè)內(nèi)容。然而,當(dāng)分量映射盒僅應(yīng)用于所述內(nèi)容的一部分時(shí),分量映射盒構(gòu)造器64可發(fā)信號(hào)通知所述分量映射盒所應(yīng)用于的內(nèi)容的持續(xù)時(shí)間。分量映射盒構(gòu)造器64可接著在靜態(tài)模式或動(dòng)態(tài)模式中產(chǎn)生內(nèi)容的多個(gè)分量映射盒。在靜態(tài)模式中,分量映射盒構(gòu)造器64以對(duì)應(yīng)于分量映射盒所對(duì)應(yīng)的內(nèi)容的持續(xù)時(shí)間的次序?qū)⑺蟹至坑成浜蟹纸M在一起。在動(dòng)態(tài)模式中,分量映射盒構(gòu)造器64可將每一分量映射盒置于不同位置(例如,不同文件)中。分量映射盒還可發(fā)信號(hào)通知媒體片段是否屬于分量的新段。因?yàn)榉至康拿恳欢伟ǚ至孔R(shí)別符,所以可識(shí)別屬于同一分量的段,即使在所述段存儲(chǔ)于單獨(dú)文件中時(shí)也是如此。分量映射盒可進(jìn)一步發(fā)信號(hào)通知在包括分量的經(jīng)編碼樣本的文件內(nèi)的所述分量的部分的時(shí)序信息。因此,必然支持時(shí)間拼接。舉例來(lái)說(shuō),客戶端裝置(例如,目的地裝置40)可確定兩個(gè)相異文件包括同一分量的數(shù)據(jù)及所述兩個(gè)文件的時(shí)間排序。分量布置盒構(gòu)造器66可針對(duì)由文件建立單元60所產(chǎn)生的每一文件產(chǎn)生分量布置盒。大體來(lái)說(shuō),分量布置盒構(gòu)造器66可識(shí)別哪些分量包括于所述文件內(nèi),以及分量識(shí)別符與所述文件的軌道識(shí)別符之間的對(duì)應(yīng)性。以此方式,分量布置盒可提供內(nèi)容的分量識(shí)別符與文件的軌道識(shí)別符之間的映射。軌道識(shí)別符可對(duì)應(yīng)于所述文件的具有在所述映射中所指定的分量的經(jīng)編碼樣本的軌道。
·
分量布置盒還可指示如何將每一分量的片段存儲(chǔ)于文件中。舉例來(lái)說(shuō),分量布置盒構(gòu)造器66可指定文件中的分量的片段的字節(jié)范圍、到特定片段的字節(jié)偏移、媒體片段中的第一樣本的解碼時(shí)間、隨機(jī)存取點(diǎn)是否存在于所述片段中,及(如果存在)所述隨機(jī)存取點(diǎn)的解碼及呈現(xiàn)時(shí)間以及所述隨機(jī)存取點(diǎn)是IDR圖片還是ODR圖片。在文件建立單元60已產(chǎn)生文件之后,文件輸出接口 84可輸出所述文件。在一些實(shí)例中,文件輸出接口 84可將文件存儲(chǔ)到計(jì)算機(jī)可讀存儲(chǔ)媒體(例如,硬盤)。在一些實(shí)例中,文件輸出接口 84可經(jīng)由輸出接口 32(圖1)將文件發(fā)送到經(jīng)配置以充當(dāng)服務(wù)器(例如,實(shí)施HTTP1.1的HTTP串流服務(wù)器)的另一裝置。在一些實(shí)例中,文件輸出接口 84可將文件存儲(chǔ)到本地存儲(chǔ)媒體,使得輸出接口 32可響應(yīng)于(例如)HTTP串流請(qǐng)求而將文件提供到客戶端裝置(例如,目的地裝置40)。圖3為說(shuō)明實(shí)例分量映射盒100及分量布置盒152A的概念圖。在此實(shí)例中,分量映射盒100包括視頻分量110及音頻分量140。應(yīng)注意,分量映射盒100自身包括視頻分量110及音頻分量140的發(fā)信號(hào)通知的特性。如關(guān)于圖2所提,分量映射盒100及分量布置盒152可由文件建立單元60 (例如,分別由分量映射盒構(gòu)造器64及分量布置盒構(gòu)造器66)產(chǎn)生。以此方式,封裝單元30可發(fā)信號(hào)通知多媒體內(nèi)容的特性及包括所述多媒體內(nèi)容的數(shù)據(jù)的文件。舉例來(lái)說(shuō),視頻分量110包括分量112的發(fā)信號(hào)通知的特性,且音頻分量140包括分量142的發(fā)信號(hào)通知的特性。如在此實(shí)例中所展示,分量112A包括分量特性114A。在此實(shí)例中,分量特性114A包括位速率信息116、分辨率信息118、幀速率信息120、編解碼器信息122、簡(jiǎn)檔及層級(jí)信息124、相依性信息126、段信息128、多路復(fù)用間隔信息130及3D視頻信息132。位速率信息116可包括分量112A的平均位速率及最大位速率中的任一者或兩者。位速率信息116還可包括指示是否發(fā)信號(hào)通知平均及/或最大位速率信息的旗標(biāo)。舉例來(lái)說(shuō),位速率信息116可包括平均位速率旗標(biāo)及最大位速率旗標(biāo),其中所述平均位速率旗標(biāo)指示是否針對(duì)分量112A發(fā)信號(hào)通知平均位速率,且最大位速率旗標(biāo)指示是否針對(duì)分量112A發(fā)信號(hào)通知最大位速率。位速率信息116還可包括指示分量112A的平均位速率的平均位速率值。同樣,位速率信息116可包括指示在某一時(shí)間段內(nèi)(例如,在一秒的間隔內(nèi))的最大位速率值的最大位速率值。分辨率信息118可(例如)依據(jù)圖片的像素寬度及像素高度來(lái)描述分量112A的分辨率。在一些情況下,可能未針對(duì)分量112A來(lái)明確地發(fā)信號(hào)通知分辨率信息118。舉例來(lái)說(shuō),分量特性114A可包括默認(rèn)特性旗標(biāo),其指示具有索引i的分量是否具有與同一內(nèi)容的具有索引i_l的分量相同的特性。當(dāng)所述旗標(biāo)指示所述特性相同時(shí),不需要發(fā)信號(hào)通知所述特性。所述默認(rèn)特性可對(duì)應(yīng)于可用特性(例如,分辨率、幀速率、編解碼器信息、簡(jiǎn)檔信息及層級(jí)信息)的子集,或可通過(guò)分量映射盒(例如,分量映射盒100)發(fā)信號(hào)通知的特性的其它組合。在一些實(shí)例中,對(duì)于每一潛在分量,包括指示所述分量的對(duì)應(yīng)特性是否與先前分量相同的個(gè)別旗標(biāo)。在一些實(shí)例中,如上文所描述,可將幀速率信息120指明為默認(rèn)特性。或者,幀速率信息120可指定分量112A的幀速率。可以視頻分量的每256秒的幀數(shù)來(lái)指定幀速率。如上文所描述,還可將編解碼器信息122指明為默認(rèn)特性。或者,編解碼器信息122可指定用以編碼分量112A的編碼器。類似地,可將簡(jiǎn)檔及層級(jí)信息124指明為默認(rèn)特性或明確地指定(例如)為簡(jiǎn)檔指示符(profile_idc)及層級(jí)指示符(level_idc)值。相依性信息126可指示分量112A是否相依于分量110中的其它分量。如果相依于其它分量,則相依性信息126可包括指示分量112A的時(shí)間識(shí)別符及分量112A的時(shí)間識(shí)別符與分量112A所相依于的分量的時(shí)間識(shí)別符之間的差的信息。段信息128描述分量112A的段。所述段可存儲(chǔ)于文件(例如,文件150)中。在圖3的實(shí)例中,分量112A的段的數(shù) 據(jù)可存儲(chǔ)于文件150A中,具體來(lái)說(shuō)可存儲(chǔ)于視頻軌道158中,如下文更詳細(xì)描述。在一些情況下,分量112A的段可存儲(chǔ)于多個(gè)文件中。每一段可對(duì)應(yīng)于一個(gè)或一個(gè)以上片段。對(duì)于每一片段來(lái)說(shuō),段信息128可發(fā)信號(hào)通知以下各項(xiàng)所述片段是否包括隨機(jī)存取點(diǎn)、所述隨機(jī)存取點(diǎn)的類型(例如,IDR或0DR)、所述片段是否對(duì)應(yīng)于新文件(例如,新段)、到所述片段的開(kāi)始的字節(jié)偏移、所述片段的第一樣本的時(shí)序信息(例如,解碼及/或顯示時(shí)間)、到下一片段的字節(jié)偏移、到所述隨機(jī)存取點(diǎn)(如果存在)的字節(jié)偏移,及當(dāng)在ODR RAP處開(kāi)始流時(shí)跳過(guò)解碼的樣本的數(shù)目。多路復(fù)用間隔信息130可指定分量112A的多路復(fù)用間隔的集合或范圍。當(dāng)分量112A待用以(例如)通過(guò)同時(shí)或幾乎同時(shí)顯示場(chǎng)景的兩個(gè)或兩個(gè)以上略微不同的視圖而產(chǎn)生三維效果時(shí),可包括3D視頻信息132。3D視頻信息132可包括以下各項(xiàng)待顯示的視圖的數(shù)目、對(duì)應(yīng)于所述視圖的分量的識(shí)別符、特定基礎(chǔ)視頻分量的3D表示的開(kāi)始時(shí)間的開(kāi)始時(shí)間、所述3D表示的持續(xù)時(shí)間、目標(biāo)分辨率(例如,當(dāng)最終顯示時(shí)所述3D表示的目標(biāo)寬度及目標(biāo)高度)、定位信息(例如,在顯示窗口中的水平偏移及垂直偏移)、指示用于呈現(xiàn)的經(jīng)解碼視頻分量的層的窗口層,及透明因數(shù)。大體來(lái)說(shuō),較低窗口層值可指示相關(guān)聯(lián)視頻分量將較早再現(xiàn)且可由具有較高層值的視頻分量覆蓋。透明度信息可與窗口層級(jí)信息組合。當(dāng)所述分量與具有較低窗口層值的另一分量組合時(shí),可用值[透明度]/255對(duì)另一分量中的每一像素進(jìn)行加權(quán),且可用值(255-[透明度])/255對(duì)當(dāng)前分量中的經(jīng)共置像素進(jìn)行加權(quán)。
圖3說(shuō)明分量112、142與包括分量112、142的數(shù)據(jù)的各種文件150之間的對(duì)應(yīng)性。在此實(shí)例中,文件150A包括呈視頻軌道158的形式的視頻分量112A的經(jīng)編碼樣本及呈音頻軌道160的形式的音頻分量142A的經(jīng)編碼樣本。文件150A還包括分量布置盒152A。如此實(shí)例中進(jìn)一步說(shuō)明,分量布置盒152A包括分量到視頻軌道映射154及分量到音頻軌道映射156。分量到視頻軌道映射154指示分量112A的分量識(shí)別符映射到文件150A的視頻軌道158。類似地,分量到音頻軌道映射156指示分量142A的分量識(shí)別符映射到文件150A的音頻軌道160。在此實(shí)例中,分量112B對(duì)應(yīng)于文件150B的視頻軌道162,且分量142B對(duì)應(yīng)于文件150C的音頻軌道164。因此,分量布置盒152B可包括分量112B與視頻軌道162之間的映射,而分量布置盒152C可包括分量142B與音頻軌道164之間的映射。以此方式,客戶端裝置可檢索分量映射盒100及分量布置盒152以確定待請(qǐng)求哪些分量,及如何從文件150存取分量的經(jīng)編碼數(shù)據(jù)。以下偽碼為用于分量映射盒的數(shù)據(jù)結(jié)構(gòu)的一個(gè)實(shí)例實(shí)施方案。
權(quán)利要求
1.一種發(fā)送經(jīng)封裝視頻數(shù)據(jù)的方法,所述方法包含 將視頻內(nèi)容的多個(gè)表示的分量的特性發(fā)送到客戶端裝置,其中所述特性包含幀速率、簡(jiǎn)檔指示符、層級(jí)指示符及所述分量之間的相依性中的至少一者; 在發(fā)送所述特性之后從所述客戶端裝置接收對(duì)所述分量中的至少一者的請(qǐng)求;及響應(yīng)于所述請(qǐng)求而將所述所請(qǐng)求分量發(fā)送到所述客戶端裝置。
2.根據(jù)權(quán)利要求1所述的方法,其中所述分量中的至少兩者存儲(chǔ)于分離的文件中,且其中發(fā)送所述特性包含發(fā)送包含所述分量中的所述至少兩者中的每一者的特性的數(shù)據(jù)結(jié)構(gòu)。
3.根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包含 將所述分量的所述特性存儲(chǔ)于文件中,所述文件與存儲(chǔ)所述分量的經(jīng)編碼樣本的一個(gè)或一個(gè)以上文件分離, 其中發(fā)送所述特性包含 接收對(duì)存儲(chǔ)所述特性的所述文件的第一請(qǐng)求;及 響應(yīng)于所述第一請(qǐng)求而獨(dú)立于存儲(chǔ)所述經(jīng)編碼樣本的所述一個(gè)或一個(gè)以上文件發(fā)送所述文件,且 其中對(duì)所述視頻分量中的所述至少一者的所述請(qǐng)求包含第二不同請(qǐng)求。
4.根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包含 將所述分量中的每一者的所述特性存儲(chǔ)于單一數(shù)據(jù)結(jié)構(gòu)中,其中所述數(shù)據(jù)結(jié)構(gòu)與所述分量分離; 將識(shí)別符指派給所述數(shù)據(jù)結(jié)構(gòu),所述識(shí)別符使所述數(shù)據(jù)結(jié)構(gòu)與包含所述多個(gè)表示的多媒體內(nèi)容相關(guān)聯(lián);及 將唯一識(shí)別符指派給所述多媒體內(nèi)容的所述表示, 其中發(fā)送所述特性包含發(fā)送所述數(shù)據(jù)結(jié)構(gòu)。
5.根據(jù)權(quán)利要求1所述的方法,其中發(fā)送所述特性進(jìn)一步包含發(fā)送所述分量的分量識(shí)別符值,其中所述分量識(shí)別符值中的至少一者不同于對(duì)應(yīng)于所述分量識(shí)別符值中的所述至少一者的所述分量的軌道識(shí)別符值。
6.根據(jù)權(quán)利要求5所述的方法,其進(jìn)一步包含發(fā)送指示所述分量的分量識(shí)別符值與一個(gè)或一個(gè)以上文件中的所述分量的軌道識(shí)別符值之間的對(duì)應(yīng)性的信息,所述一個(gè)或一個(gè)以上文件存儲(chǔ)所述分量的經(jīng)編碼樣本。
7.根據(jù)權(quán)利要求6所述的方法,其進(jìn)一步包含針對(duì)所述一個(gè)或一個(gè)以上文件的所述分量中的每一者發(fā)送指示以下各項(xiàng)的信息到所述分量?jī)?nèi)的片段的字節(jié)偏移、所述片段中的第一樣本的解碼時(shí)間、所述片段中的隨機(jī)存取點(diǎn),及所述片段是否屬于所述分量的新段的指示。
8.根據(jù)權(quán)利要求1所述的方法,其中發(fā)送所述特性包含發(fā)送指示一組所述分量可彼此切換的信息,且其中所述請(qǐng)求指定所述組分量中的至少一者。
9.根據(jù)權(quán)利要求1所述的方法,其中發(fā)送所述特性包含發(fā)送指示以下各項(xiàng)的信息所述分量之間的所述相依性,及針對(duì)存取單元中的所述分量的解碼次序的所述分量之間的所述相依性的排序。
10.根據(jù)權(quán)利要求1所述的方法,其中發(fā)送所述特性包含發(fā)送指示以下各項(xiàng)的信息所述分量之間的所述相依性,及第一分量與相依于所述第一分量的第二分量之間的時(shí)間層差。
11.根據(jù)權(quán)利要求1所述的方法,其中發(fā)送所述特性包含發(fā)送指示所述多個(gè)表示中的一者或一者以上的供輸出的目標(biāo)視圖的數(shù)目的信息。
12.根據(jù)權(quán)利要求1所述的方法,其中發(fā)送所述特性包含發(fā)送指示所述分量中的兩者或兩者以上的組合的可能多路復(fù)用間隔的信息,且其中所述請(qǐng)求指定所述分量中的所述兩者或兩者以上中的任一者的具有在所述多路復(fù)用間隔中的共同一者內(nèi)的解碼時(shí)間的片段。
13.根據(jù)權(quán)利要求1所述的方法,其中所述特性包含第一組特性,且其中發(fā)送所述特性包含發(fā)送指示所述第一組特性所對(duì)應(yīng)的所述分量的第一持續(xù)時(shí)間的信息,所述方法進(jìn)一步包含發(fā)送所述分量的第二組特性及所述第二組特性所對(duì)應(yīng)的所述分量的第二持續(xù)時(shí)間。
14.一種用于發(fā)送經(jīng)封裝視頻數(shù)據(jù)的設(shè)備,所述設(shè)備包含 處理器,其經(jīng)配置以確定視頻內(nèi)容的多個(gè)表示的分量的特性,其中所述特性包含幀速率、簡(jiǎn)檔指示符、層級(jí)指示符及所述分量之間的相依性中的至少一者;及 一個(gè)或一個(gè)以上接口,其經(jīng)配置以將所述特性發(fā)送到客戶端裝置,在發(fā)送所述特性之后從所述客戶端裝置接收對(duì)所述分量中的至少一者的請(qǐng)求,且響應(yīng)于所述請(qǐng)求而將所述所請(qǐng)求分量發(fā)送到所述客戶端裝置。
15.根據(jù)權(quán)利要求14所述的設(shè)備,其中所述特性進(jìn)一步包含所述分量的分量識(shí)別符值,其中所述分量識(shí)別符值中的至少一者不同于對(duì)應(yīng)于所述分量識(shí)別符值中的所述至少一者的所述分量的軌道識(shí)別符值,且其中所述特性包含指示所述分量的分量識(shí)別符值與一個(gè)或一個(gè)以上文件中的所述分量的軌道識(shí)別符值之間的對(duì)應(yīng)性的信息,所述一個(gè)或一個(gè)以上文件存儲(chǔ)所述分量的經(jīng)編碼樣本。
16.根據(jù)權(quán)利要求15所述的設(shè)備,其中針對(duì)所述一個(gè)或一個(gè)以上文件的所述分量中的每一者,所述特性進(jìn)一步包含指示以下各項(xiàng)的信息到所述分量?jī)?nèi)的片段的字節(jié)偏移、所述片段中的第一樣本的解碼時(shí)間、所述片段中的隨機(jī)存取點(diǎn),及所述片段是否屬于所述分量的新段的指示。
17.根據(jù)權(quán)利要求14所述的設(shè)備,其中所述特性包含指示以下各項(xiàng)的信息所述分量之間的所述相依性,及針對(duì)存取單元中的所述分量的解碼次序的所述分量之間的所述相依性的排序。
18.根據(jù)權(quán)利要求14所述的設(shè)備,其中所述特性包含指示以下各項(xiàng)的信息所述分量之間的所述相依性,及第一分量與相依于所述第一分量的第二分量之間的時(shí)間層差。
19.根據(jù)權(quán)利要求14所述的設(shè)備,其中所述特性包含指示所述多個(gè)表示中的一者或一者以上的供輸出的目標(biāo)視圖的數(shù)目的信息。
20.根據(jù)權(quán)利要求14所述的設(shè)備,其中所述特性包含指示所述分量中的兩者或兩者以上的組合的可能多路復(fù)用間隔的信息,且其中所述請(qǐng)求指定所述分量中的所述兩者或兩者以上中的任一者的具有在所述多路復(fù)用間隔中的共同一者內(nèi)的解碼時(shí)間的片段。
21.根據(jù)權(quán)利要求14所述的設(shè)備,其中所述特性包含第一組特性,且其中所述一個(gè)或一個(gè)以上接口經(jīng)配置以發(fā)送指示所述第一組特性所對(duì)應(yīng)的所述分量的第一持續(xù)時(shí)間的信息,且其中所述處理器進(jìn)一步經(jīng)配置以產(chǎn)生所述分量的第二組特性及所述第二組特性所對(duì)應(yīng)的所述分量的第二持續(xù)時(shí)間,且其中所述一個(gè)或一個(gè)以上接口經(jīng)配置以發(fā)送所述第二組特性。
22.根據(jù)權(quán)利要求14所述的設(shè)備,其中所述設(shè)備包含以下各項(xiàng)中的至少一者 集成電路; 微處理器;及 無(wú)線通信裝置,其包括所述處理器。
23.一種用于發(fā)送經(jīng)封裝視頻數(shù)據(jù)的設(shè)備,所述設(shè)備包含 用于將視頻內(nèi)容的多個(gè)表示的分量的特性發(fā)送到客戶端裝置的裝置,其中所述特性包含幀速率、簡(jiǎn)檔指示符、層級(jí)指示符及所述分量之間的相依性中的至少一者; 用于在發(fā)送所述特性之后從所述客戶端裝置接收對(duì)所述分量中的至少一者的請(qǐng)求的裝置;及 用于響應(yīng)于所述請(qǐng)求而將所述所請(qǐng)求分量發(fā)送到所述客戶端裝置的裝置。
24.根據(jù)權(quán)利要求23所述的設(shè)備,其中用于發(fā)送所述特性的裝置進(jìn)一步包含 用于發(fā)送所述分量的分量識(shí)別符值的裝置,其中所述分量識(shí)別符值中的至少一者不同于對(duì)應(yīng)于所述分量識(shí)別符值中的所述至少一者的所述分量的軌道識(shí)別符值; 用于發(fā)送指示所述分量的分量識(shí)別符值與一個(gè)或一個(gè)以上文件中的所述分量的軌道識(shí)別符值之間的對(duì)應(yīng)性的信息的裝置,所述一個(gè)或一個(gè)以上文件存儲(chǔ)所述分量的經(jīng)編碼樣本;及 用于針對(duì)所述一個(gè)或一個(gè)以上文件的所述分量中的每一者發(fā)送指示以下各項(xiàng)的信息的裝置到所述分量?jī)?nèi)的片段的字節(jié)偏移、所述片段中的第一樣本的解碼時(shí)間、所述片段中的隨機(jī)存取點(diǎn),及所述片段是否屬于所述分量的新段的指示。
25.根據(jù)權(quán)利要求23所述的設(shè)備,其中所述用于發(fā)送所述特性的裝置包含用于發(fā)送指示以下各項(xiàng)的信息的裝置所述分量之間的所述相依性,及針對(duì)存取單元中的所述分量的解碼次序的所述分量之間的所述相依性的排序。
26.根據(jù)權(quán)利要求23所述的設(shè)備,其中所述用于發(fā)送所述特性的裝置包含用于發(fā)送指示以下各項(xiàng)的信息的裝置所述分量之間的所述相依性,及第一分量與相依于所述第一分量的第二分量之間的時(shí)間層差。
27.根據(jù)權(quán)利要求23所述的設(shè)備,其中所述用于發(fā)送所述特性的裝置包含用于發(fā)送指示所述分量中的兩者或兩者以上的組合的可能多路復(fù)用間隔的信息的裝置,且其中所述請(qǐng)求指定所述分量中的所述兩者或兩者以上中的任一者的具有在所述多路復(fù)用間隔中的共同一者內(nèi)的解碼時(shí)間的片段。
28.根據(jù)權(quán)利要求23所述的設(shè)備,其中所述特性包含第一組特性,且其中所述用于發(fā)送所述特性的裝置包含用于發(fā)送指示所述第一組特性所對(duì)應(yīng)的所述分量的第一持續(xù)時(shí)間的信息的裝置,所述設(shè)備進(jìn)一步包含用于發(fā)送所述分量的第二組特性及所述第二組特性所對(duì)應(yīng)的所述分量的第二持續(xù)時(shí)間的裝置。
29.一種計(jì)算機(jī)程序產(chǎn)品,其包含上面存儲(chǔ)有指令的計(jì)算機(jī)可讀存儲(chǔ)媒體,所述指令在執(zhí)行時(shí)致使用于發(fā)送經(jīng)編碼視頻數(shù)據(jù)的源裝置的處理器 將視頻內(nèi)容的多個(gè)表示的分量的特性發(fā)送到客戶端裝置,其中所述特性包含幀速率、簡(jiǎn)檔指示符、層級(jí)指示符及所述分量之間的相依性中的至少一者; 在發(fā)送所述特性之后從所述客戶端裝置接收對(duì)所述分量中的至少一者的請(qǐng)求;及響應(yīng)于所述請(qǐng)求而將所述所請(qǐng)求分量發(fā)送到所述客戶端裝置。
30.根據(jù)權(quán)利要求29所述的計(jì)算機(jī)程序產(chǎn)品,其中所述致使所述處理器發(fā)送所述特性的指令進(jìn)一步包含致使所述處理器進(jìn)行以下操作的指令 發(fā)送所述分量的分量識(shí)別符值,其中所述分量識(shí)別符值中的至少一者不同于對(duì)應(yīng)于所述分量識(shí)別符值中的所述至少一者的所述分量的軌道識(shí)別符值; 發(fā)送指示所述分量的分量識(shí)別符值與一個(gè)或一個(gè)以上文件中的所述分量的軌道識(shí)別符值之間的對(duì)應(yīng)性的信息,所述一個(gè)或一個(gè)以上文件存儲(chǔ)所述分量的經(jīng)編碼樣本;及 針對(duì)所述一個(gè)或一個(gè)以上文件的所述分量中的每一者發(fā)送指示以下各項(xiàng)的信息到所述分量?jī)?nèi)的片段的字節(jié)偏移、所述片段中的第一樣本的解碼時(shí)間、所述片段中的隨機(jī)存取點(diǎn),及所述片段是否屬于所述分量的新段的指示。
31.根據(jù)權(quán)利要求29所述的計(jì)算機(jī)程序產(chǎn)品,其中所述致使所述處理器發(fā)送所述特性的指令包含致使所述處理器發(fā)送指示以下各項(xiàng)的信息的指令所述分量之間的所述相依性、針對(duì)存取單元中的所述分量的解碼次序的所述分量之間的所述相依性的排序,及第一分量與相依于所述第一分量的第二分量之間的時(shí)間層差。
32.根據(jù)權(quán)利要求29所述的計(jì)算機(jī)程序產(chǎn)品,其中所述致使所述處理器發(fā)送所述特性的指令包含致使所述處理器發(fā)送指示所述多個(gè)表示中的一者或一者以上的供輸出的目標(biāo)視圖的數(shù)目的信息的指令。
33.根據(jù)權(quán)利要求29所述的計(jì)算機(jī)程序產(chǎn)品,其中所述致使所述處理器發(fā)送所述特性的指令包含致使所述處理器發(fā)送指示所述分量中的兩者或兩者以上的組合的可能多路復(fù)用間隔的信息的指令,且其中所述請(qǐng)求指定所述分量中的所述兩者或兩者以上中的任一者的具有在所述多路復(fù)用間隔中的共同一者內(nèi)的解碼時(shí)間的片段。
34.根據(jù)權(quán)利要求29所述的計(jì)算機(jī)程序產(chǎn)品,其中所述特性包含第一組特性,且其中發(fā)送所述特性包含致使所述處理器發(fā)送指示所述第一組特性所對(duì)應(yīng)的所述分量的第一持續(xù)時(shí)間的信息的指令,進(jìn)一步包含發(fā)送所述分量的第二組特性及所述第二組特性所對(duì)應(yīng)的所述分量的第二持續(xù)時(shí)間。
35.一種接收經(jīng)封裝視頻數(shù)據(jù)的方法,所述方法包含 向源裝置請(qǐng)求視頻內(nèi)容的多個(gè)表示的分量的特性,其中所述特性包含幀速率、簡(jiǎn)檔指示符、層級(jí)指示符及所述分量之間的相依性中的至少一者; 基于所述特性來(lái)選擇所述分量中的一者或一者以上; 請(qǐng)求所述選定分量的樣本;及 在已接收所述樣本之后解碼并呈現(xiàn)所述樣本。
36.根據(jù)權(quán)利要求35所述的方法,其進(jìn)一步包含 接收指示所述選定分量的分量識(shí)別符值與一個(gè)或一個(gè)以上文件中的所述分量的軌道識(shí)別符值之間的對(duì)應(yīng)性的信息,所述一個(gè)或一個(gè)以上文件存儲(chǔ)所述分量的經(jīng)編碼樣本;及 接收指示以下各項(xiàng)的信息到所述選定分量中的每一者內(nèi)的片段的字節(jié)偏移、所述片段中的第一樣本的解碼時(shí)間、所述片段中的隨機(jī)存取點(diǎn),及所述片段是否屬于所述相應(yīng)分量的新段的指示; 其中請(qǐng)求所述樣本包含基于所述字節(jié)偏移、所述解碼時(shí)間、所述隨機(jī)存取點(diǎn)及所述片段是否屬于新段的所述指示來(lái)請(qǐng)求來(lái)自所述一個(gè)或一個(gè)以上文件的對(duì)應(yīng)于所述軌道識(shí)別符值的軌道的樣本,所述軌道識(shí)別符值對(duì)應(yīng)于所述選定分量的所述分量識(shí)別符值。
37.根據(jù)權(quán)利要求35所述的方法,其進(jìn)一步包含 接收指示所述選定分量中的至少一者相依于另一分量的信息;及 請(qǐng)求所述選定分量中的所述一者所相依于的所述分量的樣本。
38.根據(jù)權(quán)利要求35所述的方法,其中請(qǐng)求所述選定分量的所述樣本包含 確定下一多路復(fù)用間隔; 確定所述選定分量中具有開(kāi)始于所述下一多路復(fù)用間隔中的片段的分量;及 請(qǐng)求來(lái)自所述選定分量中的所述經(jīng)確定分量的開(kāi)始于所述下一多路復(fù)用間隔中的所述片段。
39.根據(jù)權(quán)利要求35所述的方法,其中所述特性包含第一組特性,所述方法進(jìn)一步包含 接收指示所述第一組特性所對(duì)應(yīng)的所述分量的第一持續(xù)時(shí)間的信息; 請(qǐng)求對(duì)應(yīng)于第二組特性所對(duì)應(yīng)的所述分量的第二持續(xù)時(shí)間的所述分量的所述第二組特性;及基于所述第二組特性來(lái)請(qǐng)求來(lái)自對(duì)應(yīng)于所述第二持續(xù)時(shí)間的所述分量的樣本。
40.一種用于接收經(jīng)封裝視頻數(shù)據(jù)的設(shè)備,所述設(shè)備包含 一個(gè)或一個(gè)以上接口,其經(jīng)配置以向源裝置請(qǐng)求視頻內(nèi)容的多個(gè)表示的分量的特性,其中所述特性包含幀速率、簡(jiǎn)檔指示符、層級(jí)指示符及所述分量之間的相依性中的至少一者;及 處理器,其經(jīng)配置以基于所述特性來(lái)選擇所述分量中的一者或一者以上,且致使所述一個(gè)或一個(gè)以上接口將對(duì)所述選定分量的樣本的請(qǐng)求提交到所述源裝置。
41.根據(jù)權(quán)利要求40所述的設(shè)備,其中所述處理器經(jīng)配置以接收指示所述選定分量的分量識(shí)別符值與一個(gè)或一個(gè)以上文件中的所述分量的軌道識(shí)別符值之間的對(duì)應(yīng)性的信息,所述一個(gè)或一個(gè)以上文件存儲(chǔ)所述分量的經(jīng)編碼樣本;接收指示以下各項(xiàng)的信息到所述選定分量中的每一者內(nèi)的片段的字節(jié)偏移、所述片段中的第一樣本的解碼時(shí)間、所述片段中的隨機(jī)存取點(diǎn),及所述片段是否屬于所述相應(yīng)分量的新段的指示;且基于所述字節(jié)偏移、所述解碼時(shí)間、所述隨機(jī)存取點(diǎn)及所述片段是否屬于新段的所述指示來(lái)構(gòu)造對(duì)來(lái)自所述一個(gè)或一個(gè)以上文件的對(duì)應(yīng)于所述軌道識(shí)別符值的軌道的所述樣本的所述請(qǐng)求,所述軌道識(shí)別符值對(duì)應(yīng)于所述選定分量的所述分量識(shí)別符值。
42.根據(jù)權(quán)利要求40所述的設(shè)備,其中所述處理器經(jīng)配置以接收指示所述選定分量中的至少一者相依于另一分量的信息,且請(qǐng)求所述選定分量中的所述一者所相依于的所述分量的樣本。
43.根據(jù)權(quán)利要求40所述的設(shè)備,其中為了產(chǎn)生對(duì)所述選定分量的所述樣本的所述請(qǐng)求,所述處理器經(jīng)配置以確定下一多路復(fù)用間隔,確定所述選定分量中具有開(kāi)始于所述下一多路復(fù)用間隔中的片段的分量,且請(qǐng)求來(lái)自所述選定分量中的所述經(jīng)確定分量的開(kāi)始于所述下一多路復(fù)用間隔中的所述片段。
44.根據(jù)權(quán)利要求40所述的設(shè)備,其中所述特性包含第一組特性,且其中所述處理器經(jīng)配置以接收指示所述第一組特性所對(duì)應(yīng)的所述分量的第一持續(xù)時(shí)間的信息,請(qǐng)求對(duì)應(yīng)于第二組特性所對(duì)應(yīng)的所述分量的第二持續(xù)時(shí)間的所述分量的所述第二組特性,且基于所述第二組特性來(lái)請(qǐng)求來(lái)自對(duì)應(yīng)于所述第二持續(xù)時(shí)間的所述分量的樣本。
45.一種用于接收經(jīng)封裝視頻數(shù)據(jù)的設(shè)備,所述設(shè)備包含 用于向源裝置請(qǐng)求視頻內(nèi)容的多個(gè)表示的分量的特性的裝置,其中所述特性包含幀速率、簡(jiǎn)檔指示符、層級(jí)指示符及所述分量之間的相依性中的至少一者; 用于基于所述特性來(lái)選擇所述分量中的一者或一者以上的裝置; 用于請(qǐng)求所述選定分量的樣本的裝置;及 用于在已接收所述樣本之后解碼并呈現(xiàn)所述樣本的裝置。
46.根據(jù)權(quán)利要求45所述的設(shè)備,其進(jìn)一步包含 用于接收指示所述選定分量的分量識(shí)別符值與一個(gè)或一個(gè)以上文件中的所述分量的軌道識(shí)別符值之間的對(duì)應(yīng)性的信息的裝置,所述一個(gè)或一個(gè)以上文件存儲(chǔ)所述分量的經(jīng)編碼樣本 '及 用于接收指示以下各項(xiàng)的信息的裝置到所述選定分量中的每一者內(nèi)的片段的字節(jié)偏移、所述片段中的第一樣本的解碼時(shí)間、所述片段中的隨機(jī)存取點(diǎn),及所述片段是否屬于所述相應(yīng)分量的新段的指示; 其中所述用于請(qǐng)求所述樣本的裝置包含用于基于所述字節(jié)偏移、所述解碼時(shí)間、所述隨機(jī)存取點(diǎn)及所述片段是否屬于新段的所述指示來(lái)請(qǐng)求來(lái)自所述一個(gè)或一個(gè)以上文件的對(duì)應(yīng)于所述軌道識(shí)別符值的軌道的樣本的裝置,所述軌道識(shí)別符值對(duì)應(yīng)于所述選定分量的所述分量識(shí)別符值。
47.根據(jù)權(quán)利要求45所述的設(shè)備,其進(jìn)一步包含 用于接收指示所述選定分量中的至少一者相依于另一分量的信息的裝置;及 用于請(qǐng)求所述選定分量中的所述一者所相依于的所述分量的樣本的裝置。
48.根據(jù)權(quán)利要求45所述的設(shè)備,其中所述用于請(qǐng)求所述選定分量的所述樣本的裝置包含 用于確定下一多路復(fù)用間隔的裝置; 用于確定所述選定分量中具有開(kāi)始于所述下一多路復(fù)用間隔中的片段的分量的裝置;及 用于請(qǐng)求來(lái)自所述選定分量中的所述經(jīng)確定分量的開(kāi)始于所述下一多路復(fù)用間隔中的所述片段的裝置。
49.根據(jù)權(quán)利要求45所述的設(shè)備,其中所述特性包含第一組特性,所述設(shè)備進(jìn)一步包含 用于接收指示所述第一組特性所對(duì)應(yīng)的所述分量的第一持續(xù)時(shí)間的信息的裝置;用于請(qǐng)求對(duì)應(yīng)于第二組特性所對(duì)應(yīng)的所述分量的第二持續(xù)時(shí)間的所述分量的所述第二組特性的裝置;及 用于基于所述第二組特性來(lái)請(qǐng)求來(lái)自對(duì)應(yīng)于所述第二持續(xù)時(shí)間的所述分量的樣本的裝置。
50.一種計(jì)算機(jī)程序產(chǎn)品,其包含上面存儲(chǔ)有指令的計(jì)算機(jī)可讀存儲(chǔ)媒體,所述指令在執(zhí)行時(shí)致使用于接收經(jīng)封裝視頻數(shù)據(jù)的裝置的處理器 向源裝置請(qǐng)求視頻內(nèi)容的多個(gè)表示的分量的特性,其中所述特性包含幀速率、簡(jiǎn)檔指示符、層級(jí)指示符及所述分量之間的相依性中的至少一者;基于所述特性來(lái)選擇所述分量中的一者或一者以上; 請(qǐng)求所述選定分量的樣本;及 在已接收所述樣本之后解碼并呈現(xiàn)所述樣本。
51.根據(jù)權(quán)利要求50所述的計(jì)算機(jī)程序產(chǎn)品,其進(jìn)一步包含致使所述處理器進(jìn)行以下操作的指令 接收指示所述選定分量的分量識(shí)別符值與一個(gè)或一個(gè)以上文件中的所述分量的軌道識(shí)別符值之間的對(duì)應(yīng)性的信息,所述一個(gè)或一個(gè)以上文件存儲(chǔ)所述分量的經(jīng)編碼樣本;及 接收指示以下各項(xiàng)的信息到所述選定分量中的每一者內(nèi)的片段的字節(jié)偏移、所述片段中的第一樣本的解碼時(shí)間、所述片段中的隨機(jī)存取點(diǎn),及所述片段是否屬于所述相應(yīng)分量的新段的指示; 其中所述致使所述處理器請(qǐng)求所述樣本的指令包含致使所述處理器進(jìn)行以下操作的指令基于所述字節(jié)偏移、所述解碼時(shí)間、所述隨機(jī)存取點(diǎn)及所述片段是否屬于新段的所述指示來(lái)請(qǐng)求來(lái)自所述一個(gè)或一個(gè)以上文件的對(duì)應(yīng)于所述軌道識(shí)別符值的軌道的樣本,所述軌道識(shí)別符值對(duì)應(yīng)于所述選定分量的所述分量識(shí)別符值。
52.根據(jù)權(quán)利要求50所述的計(jì)算機(jī)程序產(chǎn)品,其進(jìn)一步包含致使所述處理器進(jìn)行以下操作的指令 接收指示所述選定分量中的至少一者相依于另一分量的信息;及 請(qǐng)求所述選定分量中的所述一者所相依于的所述分量的樣本。
53.根據(jù)權(quán)利要求50所述的計(jì)算機(jī)程序產(chǎn)品,其中所述致使所述處理器請(qǐng)求所述選定分量的所述樣本的指令包含致使所述處理器進(jìn)行以下操作的指令 確定下一多路復(fù)用間隔; 確定所述選定分量中具有開(kāi)始于所述下一多路復(fù)用間隔中的片段的分量;及 請(qǐng)求來(lái)自所述選定分量中的所述經(jīng)確定分量的開(kāi)始于所述下一多路復(fù)用間隔中的所述片段。
54.根據(jù)權(quán)利要求50所述的計(jì)算機(jī)程序產(chǎn)品,其中所述特性包含第一組特性,所述計(jì)算機(jī)程序產(chǎn)品進(jìn)一步包含致使所述處理器進(jìn)行以下操作的指令 接收指示所述第一組特性所對(duì)應(yīng)的所述分量的第一持續(xù)時(shí)間的信息; 請(qǐng)求對(duì)應(yīng)于第二組特性所對(duì)應(yīng)的所述分量的第二持續(xù)時(shí)間的所述分量的所述第二組特性;及 基于所述第二組特性來(lái)請(qǐng)求來(lái)自對(duì)應(yīng)于所述第二持續(xù)時(shí)間的所述分量的樣本。
全文摘要
服務(wù)器可將描述音頻分量及視頻分量的特性的信息與所述音頻分量及視頻分量自身的經(jīng)編碼樣本分離地提供到客戶端。所述客戶端可使用所述信息來(lái)選擇分量,且接著例如根據(jù)串流網(wǎng)絡(luò)協(xié)議來(lái)請(qǐng)求所述選定分量。在一個(gè)實(shí)例中,一種用于發(fā)送經(jīng)封裝視頻數(shù)據(jù)的設(shè)備包括處理器,其經(jīng)配置以確定視頻內(nèi)容的多個(gè)表示的分量的特性,其中所述特性包含幀速率、簡(jiǎn)檔指示符、層級(jí)指示符及所述分量之間的相依性中的至少一者;及一個(gè)或一個(gè)以上接口,其經(jīng)配置以將所述特性發(fā)送到客戶端裝置,在發(fā)送所述特性之后從所述客戶端裝置接收對(duì)所述分量中的至少一者的請(qǐng)求,且響應(yīng)于所述請(qǐng)求而將所述所請(qǐng)求分量發(fā)送到所述客戶端裝置。
文檔編號(hào)H04N7/46GK103069799SQ201180038542
公開(kāi)日2013年4月24日 申請(qǐng)日期2011年7月15日 優(yōu)先權(quán)日2010年7月15日
發(fā)明者陳盈, 馬爾塔·卡切維奇, 王永 申請(qǐng)人:高通股份有限公司