專利名稱:用于多媒體顯示的容器格式的制作方法
技術(shù)領(lǐng)域:
本發(fā)明通常涉及媒體對(duì)象,尤其涉及包括協(xié)調(diào)的媒體對(duì)象的多媒體顯示。
背景技術(shù):
多媒體可有多種不同類型,例如,視頻、音頻、靜止圖像、向量圖。典型地,每一種媒體具有本來(lái)的文件格式,根據(jù)該媒體格式將媒體存儲(chǔ)在計(jì)算機(jī)系統(tǒng)中。
對(duì)于多媒體,還存在大量的壓縮格式,它們利用空間和/或時(shí)間的冗余來(lái)獲得該媒體的壓縮格式。視頻文件例如可以根據(jù)H.263壓縮標(biāo)準(zhǔn)[1]來(lái)壓縮,將音頻文件壓縮為AMR[2]或AAC[3],將圖象壓縮為JPEG[4]。
目前存在許多不同的通常用于存儲(chǔ)和/或發(fā)送文件的方法,并且更特別地用于存儲(chǔ)和/或發(fā)送媒體文件的方法。一個(gè)已知的這種方法是將文件包含在所謂的文件容器中。這種容器的例子包括用于UNIX系統(tǒng)和Zip文件的TAR(磁帶檔案)。雖然這些可以包含媒體文件,但是它們?nèi)狈?duì)顯示、與定時(shí)媒體的同步、和交插媒體的可能性的控制功能。另一種已知的方法是將文件作為電子郵件附件(所謂的多部分MIME)包含進(jìn)來(lái)。這里,指出在起始位置用于顯示是可能的,但是其它方式也具有上述的限制。還存在另一種不存儲(chǔ)媒體文件本身而是存儲(chǔ)某些媒體類型的幀媒體內(nèi)容的多媒體格式。這些格式缺乏能夠存儲(chǔ)和恢復(fù)媒體文件的容器格式的透明性和完整性。這種多媒體格式的例子包括ASF(高級(jí)流格式)和FLASH。
第三代合作項(xiàng)目(3GPP)已經(jīng)基于ISO基本媒體文件格式[6]使3GPP文件格式(2GP)[5]標(biāo)準(zhǔn)化,以用于定時(shí)多媒體(音頻和視頻)的傳輸。它由所謂的多媒體消息業(yè)務(wù)(MMS)和透明的端到端分組交換流業(yè)務(wù)(PSS)用于分發(fā)多媒體[9]。此外,用于提供流媒體的流業(yè)務(wù)可使用3GP文件。
發(fā)明內(nèi)容
本發(fā)明的目的是實(shí)現(xiàn)改進(jìn)的對(duì)多媒體顯示的發(fā)送。
特別地,希望實(shí)現(xiàn)改進(jìn)的對(duì)包括不同文件格式的多媒體顯示的發(fā)送。
本發(fā)明的一個(gè)特定目的是為完整媒體顯示的容器格式提供一種解決方案,其中,完整媒體顯示包括例如起始點(diǎn)、離散媒體對(duì)象和連續(xù)的媒體軌道,存儲(chǔ)MIME類型并具有壓縮單獨(dú)的媒體對(duì)象的可能性。
本發(fā)明的另一特定目的是提供一種容器,該容器能夠存儲(chǔ)通過(guò)將媒體對(duì)象分成多個(gè)交插的分段而被交插的媒體對(duì)象。
本發(fā)明的又一特定目的是提供一種能夠?qū)崿F(xiàn)混合媒體對(duì)象的漸進(jìn)式下載的解決方案,其中混合媒體對(duì)象包括連續(xù)的媒體軌道(例如,音頻和視頻)和/或離散文件(單獨(dú)的圖像)。
本發(fā)明的再一個(gè)特定目的是提供一種用于使用新容器格式和保護(hù)信息箱來(lái)加密的解決方案。
本發(fā)明的另外一個(gè)特定目的是提供一種包括用于解密單獨(dú)的文件、媒體軌道、整個(gè)數(shù)據(jù)箱(“mdat”)或其一部分的信息的解決方案。
根據(jù)附帶的一套權(quán)利要求來(lái)實(shí)現(xiàn)這些目的以及其它目的。
本發(fā)明能夠?qū)⑺蓄愋偷拿襟w類型組合進(jìn)一種類型的文件,例如3GP。本發(fā)明能夠以透明方式對(duì)此進(jìn)行執(zhí)行,在單獨(dú)的媒體對(duì)象已經(jīng)包含進(jìn)3GP文件之后保存這些單獨(dú)的媒體對(duì)象的地址、文件名和MIME類型。
本發(fā)明還能夠?qū)⑺忻襟w交插進(jìn)容器內(nèi)以便能夠漸進(jìn)下載到用戶,即,以一種格式下載以便能夠在下載過(guò)程中帶有一些延遲地再現(xiàn)該媒體。這通過(guò)取決于傳輸比特率的初始延遲的信息來(lái)提供,所述信息被成對(duì)表示。對(duì)于特定值之間的比特率,可通過(guò)線性內(nèi)插來(lái)獲得對(duì)初始下載延遲的上估計(jì)。另一個(gè)特征是使用例如gzip來(lái)壓縮單獨(dú)的文件的可能性。
本發(fā)明的一些優(yōu)點(diǎn)是簡(jiǎn)單方便的容器格式(只傳輸和播放一個(gè)文件);被優(yōu)化為短延遲/漸進(jìn)式下載的容器格式(所有媒體都能被交插);再用現(xiàn)有技術(shù)的容器格式(基于ISO的媒體文件格式和3GP文件格式、SMIL、媒體類型);能夠以不同媒體類型來(lái)使用的容器格式。
通過(guò)參考附圖連同以下的描述可以更好地理解本發(fā)明以及其另外的目的和優(yōu)點(diǎn)圖1是涉及3GPP的現(xiàn)有技術(shù)的示意性圖示;圖2是本發(fā)明實(shí)施例的示意性概括圖示;圖3是在其內(nèi)可實(shí)現(xiàn)本發(fā)明的通信系統(tǒng)的示意性框圖;圖4是根據(jù)本發(fā)明的方法實(shí)施例的示意性流程圖;圖5是根據(jù)本發(fā)明的設(shè)備實(shí)施例的示意性框圖;圖6是根據(jù)本發(fā)明的多媒體容器實(shí)施例的示意性圖示;圖7是根據(jù)本發(fā)明的多媒體容器另一實(shí)施例的示意性圖示;圖8是根據(jù)本發(fā)明的多媒體容器的一個(gè)特定實(shí)施例的示意性圖示;圖9是圖8中多媒體容器一部分的實(shí)施例的示意性圖示;具體實(shí)施方式
將在把現(xiàn)有技術(shù)的3GPP文件格式(3GP)擴(kuò)展到用于多媒體顯示的一般容器格式的環(huán)境下描述本發(fā)明。然而本發(fā)明可體現(xiàn)為多種不同形式,并且不應(yīng)解釋為局限于這里描述的例子和實(shí)施例,提供這些例子和實(shí)施例,以便使所公開(kāi)的內(nèi)容將是詳盡的,并將會(huì)把本發(fā)明傳達(dá)給本領(lǐng)域技術(shù)人員。
應(yīng)當(dāng)理解的是,文件格式(或多個(gè)文件格式)可表現(xiàn)在例如計(jì)算機(jī)存儲(chǔ)器一樣的存儲(chǔ)介質(zhì)中,或表現(xiàn)在例如電信號(hào)或無(wú)線電信號(hào)一樣的物理信號(hào),以便例如用于在本地系統(tǒng)內(nèi)發(fā)送,或用于通過(guò)本地或全球網(wǎng)絡(luò)傳輸。在下文中,將在整個(gè)公開(kāi)中使用術(shù)語(yǔ)“文件”或“媒體對(duì)象”,其中,術(shù)語(yǔ)“文件”或“媒體對(duì)象”的含義是既包括用于在存儲(chǔ)介質(zhì)內(nèi)存儲(chǔ)的數(shù)據(jù)文件,又包括用于傳輸或分發(fā)的信號(hào)。
根據(jù)現(xiàn)有技術(shù),3GP文件格式的范圍是用于承載定時(shí)多媒體(視頻、音頻和定時(shí)文本)和這種媒體的流式線索(stream hint)。3GP文件用于-交換與音頻相關(guān)的視頻剪輯(MMS)-下載定時(shí)文本(PSS)-通過(guò)漸進(jìn)式下載傳遞音頻-視頻顯示(PSS)-提供音頻-視頻RTP流會(huì)話(PSS)-將流會(huì)話從內(nèi)容創(chuàng)建器傳遞到流送服務(wù)器(PSS)現(xiàn)有技術(shù)中的共同點(diǎn)是3GP文件被定時(shí)一個(gè)3GP文件包含定時(shí)多媒體或線索的一個(gè)或多個(gè)平行軌道。每一個(gè)軌道被劃分成可單獨(dú)訪問(wèn)的時(shí)間單位,這使得同步和隨機(jī)訪問(wèn)成為可能。在能夠構(gòu)成在MSS中的顯示或在PSS中的會(huì)話的所有媒體類型當(dāng)中,3GP文件只能承載視頻、音頻和定時(shí)文本。
處理若干文件或媒體對(duì)象例,如用于顯示或用于漸進(jìn)式下載這種顯示的問(wèn)題包括1)起始點(diǎn)在哪里必須是清楚的(例如,SMIL文件的名稱和位置)。
2)內(nèi)容創(chuàng)建器必須向操作員傳遞具有相關(guān)性的幾個(gè)文件或?qū)ο蟆.?dāng)涉及也需要以某種方式存儲(chǔ)以保存其相關(guān)性的多個(gè)文件時(shí),這會(huì)引起問(wèn)題。如果一個(gè)文件丟失,則使用該顯示是完全不可能的。因此,能夠?qū)⒍嗝襟w顯示的所有媒體對(duì)象組織在一個(gè)容器中將是有利的。
3)用戶需要處理幾個(gè)文件,而不是處理一個(gè)“項(xiàng)”。將幾個(gè)文件移動(dòng)或發(fā)送到對(duì)等端,并仍然保持文件之間的相對(duì)結(jié)構(gòu),這被識(shí)別為是有問(wèn)題的。
4)用于請(qǐng)求幾個(gè)文件的定時(shí)可能是有問(wèn)題的,因?yàn)樗鼈兛赡芫哂胁煌拇笮?,并跨越不同的時(shí)間范圍。缺乏那些考慮了準(zhǔn)備用于及時(shí)傳遞的媒體的交錯(cuò)文件格式。此外,客戶端將需要知道對(duì)于一個(gè)發(fā)送帶寬,在開(kāi)始重放之前將下載多少個(gè)字節(jié)或多少秒(以避免中斷)。
除了由3GP文件承載的多媒體之外,在PSS中還有許多媒體類型,這些媒體類型以它們本來(lái)的文件格式存儲(chǔ)靜止圖像(JPEG)、位形(GIF和PNG)、向量圖(SVG)、合成音頻(SP-MIDI)和文本(XHTML和SMIL)。在現(xiàn)有技術(shù)中,由于在PSS會(huì)話中只有音頻和視頻流送,必須通過(guò)HTTP將這些媒體類型一個(gè)文件接一個(gè)文件地傳遞到PSS客戶端。
如果可漸進(jìn)下載的文件是該顯示的一部分,例如,可漸進(jìn)下載的SVG文件,那么可用長(zhǎng)持續(xù)時(shí)間的其它軌道或文件來(lái)拆分或交插這樣的文件。
還需要一種能夠用一般文字顯現(xiàn)編碼內(nèi)容的內(nèi)容類型的加密機(jī)制。
基本上來(lái)說(shuō),本發(fā)明定義了一種用于多媒體顯示的容器格式,其中包括例如靜態(tài)媒體文件和/或動(dòng)態(tài)媒體流一樣的媒體對(duì)象的整個(gè)多媒體顯示以及可識(shí)別的場(chǎng)景描述文件可作為一個(gè)單元來(lái)發(fā)送和存儲(chǔ)。
根據(jù)本發(fā)明的一個(gè)特定實(shí)施例,容器格式是一種交插式單元,其被優(yōu)化以用于漸進(jìn)式下載。因此,整個(gè)多媒體顯示可由所謂的漸進(jìn)式下載或流送來(lái)發(fā)送或下載。
參見(jiàn)圖1和圖2,本發(fā)明能夠?qū)F(xiàn)有技術(shù)的3GPP文件格式(3GP)擴(kuò)展到用于多媒體顯示的一般容器格式。根據(jù)本發(fā)明的擴(kuò)展的3GP文件或容器不局限于只包含連續(xù)媒體或定時(shí)多媒體,而是還可包括場(chǎng)景描述文件(例如,SMIL)和靜態(tài)媒體(圖像、圖形)。在MSS和PSS中使用的任何類型的多媒體原則上能夠作為二進(jìn)制文件存儲(chǔ)進(jìn)擴(kuò)展的3GP文件中。
將在圖3中圖示的一般通信系統(tǒng)的環(huán)境下描述本發(fā)明。但是本發(fā)明不局限于這些具體圖示。被稱為多媒體顯示管理器的MMP管理器單元提供根據(jù)本發(fā)明的功能,將構(gòu)成多媒體顯示的媒體對(duì)象組織成為一個(gè)單位,以用于例如整個(gè)多媒體顯示的發(fā)送、存儲(chǔ)、或顯示。
基本來(lái)說(shuō),參考圖4,根據(jù)本發(fā)明,用于發(fā)送包括許多媒體對(duì)象的多媒體顯示的方法包括在步驟S10中,將媒體對(duì)象打包或組織進(jìn)一個(gè)多媒體容器或容器格式中。為了能夠定位媒體對(duì)象,在步驟S20中將許多相應(yīng)的標(biāo)識(shí)符或定位器組織在相同容器中。隨后,為了定義多媒體顯示的結(jié)構(gòu),在步驟S30中將協(xié)調(diào)媒體對(duì)象的所謂的場(chǎng)景描述文件提供到同一多媒體容器中。最后,在步驟S33中,將帶有合并的或包含的多媒體顯示的整個(gè)容器發(fā)送到某些接收單元。
該場(chǎng)景描述應(yīng)當(dāng)是可明顯識(shí)別的,以便接收單元將能夠?qū)?chǎng)景描述文件定位作為起始位置或起始文件。
通過(guò)根據(jù)本發(fā)明的方法,可以將整個(gè)多媒體顯示打包進(jìn)一個(gè)容器中,然后該容器能夠作為一個(gè)單元或文件從發(fā)送單元Tx發(fā)送和/或下載。
根據(jù)本發(fā)明方法的一個(gè)特定實(shí)施例,可以應(yīng)用漸進(jìn)式下載,即,接收單元Rx能夠在其余部分仍然正在被發(fā)送的同時(shí)開(kāi)始再現(xiàn)該顯示的接收部分,這就是所謂的漸進(jìn)式下載。
根據(jù)本發(fā)明方法的一個(gè)特定實(shí)施例,媒體對(duì)象可包括媒體文件,例如,JPEG、GIF、SVG、PNG、SPMIDI、XHTML、SMIL和3GP。
根據(jù)本發(fā)明方法的另一實(shí)施例,媒體文件可包括包含在軌道中的動(dòng)態(tài)媒體對(duì)象,例如視頻、音頻和定時(shí)文本。
可根據(jù)任何適當(dāng)?shù)臉?biāo)準(zhǔn)(例如,SMIL、XHTML和SVG中的任何一個(gè))來(lái)格式化場(chǎng)景描述文件。
另外的一個(gè)實(shí)施例包括將靜態(tài)媒體和/或動(dòng)態(tài)媒體流都組織到同一容器中。
根據(jù)另外的一個(gè)特定實(shí)施例,將媒體對(duì)象作為交插的連續(xù)片段的數(shù)據(jù)組織到多媒體容器中。用于“分段”的其它術(shù)語(yǔ)包括“部分”、“區(qū)域”和“組塊”。
在整篇描述中,術(shù)語(yǔ)靜態(tài)、二進(jìn)制和離散媒體文件將可交替地使用,而不將媒體文件的范圍限定到某個(gè)類型。
為了使接收單元Rx能夠應(yīng)用漸進(jìn)式下載,根據(jù)本發(fā)明方法的實(shí)施例包括提供使得能夠再現(xiàn)的控制信息的步驟S31。控制信息可包括例如基于預(yù)定下載速率的諸如初始或緩沖延遲的參數(shù)。
為了能夠?qū)⒓用芪募诟鶕?jù)本發(fā)明的新容器中,本發(fā)明的一個(gè)實(shí)施例包括提供用于解密或識(shí)別加密媒體文件的加密方式的密鑰信息的步驟S32。
相似地,同樣參考圖4,步驟S10-S30表示用于根據(jù)本發(fā)明管理多媒體顯示的方法的一個(gè)實(shí)施例。該方法與用于發(fā)送的方法密切相關(guān),但是沒(méi)有發(fā)送步驟。使用術(shù)語(yǔ)“管理”以便表示例如發(fā)送、存儲(chǔ)、加密等等的動(dòng)作,但是術(shù)語(yǔ)“管理”也可看作是用于這些動(dòng)作的媒體對(duì)象和相關(guān)信息的準(zhǔn)備。
由于整個(gè)媒體顯示包含在一個(gè)文件或容器中,因此將該顯示存儲(chǔ)在存儲(chǔ)設(shè)施上非常容易。類似地,容易將容器例如從系統(tǒng)的一部分移動(dòng)到另一部分,以將該容器分發(fā)到多個(gè)用戶。
根據(jù)本發(fā)明實(shí)施例,3GP文件格式的擴(kuò)展通常包括將頂層文件樹(shù)包含在3GP文件內(nèi)。這樣,由幾個(gè)文件(例如,SMIL文件、音頻軌道和一些圖像)組成的PSS顯示可被打包進(jìn)單個(gè)3GP文件內(nèi)。然后可通過(guò)(漸進(jìn)式)下載將整個(gè)多媒體作為一個(gè)實(shí)體顯示傳遞到例如客戶端,并在本地播放。此外,擴(kuò)展的3GP格式可用于將作為一個(gè)實(shí)體的全部PSS會(huì)話包含并傳遞到PSS服務(wù)器。然后,該服務(wù)器可讀取擴(kuò)展的3GP文件,并通過(guò)HTTP將SMIL文件和圖像傳遞到客戶端,并通過(guò)RTP將數(shù)據(jù)流和音頻軌道傳遞到客戶端。
根據(jù)本發(fā)明,將二進(jìn)制文件打包或組織到3GP文件中被設(shè)計(jì)為保存二進(jìn)制文件的目錄結(jié)構(gòu),以便文件之間的關(guān)系對(duì)于分開(kāi)的文件和擴(kuò)展的3GP文件是相同的。然而,一旦已經(jīng)將二進(jìn)制文件包含在3GP文件中,則不需要拆包這些二進(jìn)制文件,以便播放或提供信息。以相同方式從3GP文件內(nèi)部或外部引用所有包含的文件。
二進(jìn)制文件或靜態(tài)媒體文件通常不包含在普通軌道中,它們被設(shè)計(jì)用于定時(shí)的多媒體,但是由3GP文件頂層上的文件樹(shù)中的標(biāo)識(shí)符來(lái)引用引用。然而,所包含的文件自身能夠與普通軌道交插,以便整個(gè)3GP文件能夠用于漸進(jìn)式下載。
將參考圖5描述根據(jù)本發(fā)明實(shí)施例的用于發(fā)送多媒體顯示的設(shè)備10。
設(shè)備10包括用于將許多多媒體顯示的媒體對(duì)象組織到多媒體容器中的單元11。此外,該設(shè)備10典型地包括某種用于將引用所組織媒體對(duì)象的標(biāo)識(shí)符組織到同一多媒體容器中的單元12。另外,該設(shè)備包括用于為容器提供可識(shí)別的場(chǎng)景描述文件的單元13,該場(chǎng)景描述文件基于標(biāo)識(shí)符協(xié)調(diào)媒體對(duì)象。最后,設(shè)備10包括用于將帶有所合并的多媒體顯示的容器單元14。在這個(gè)特定實(shí)施例中,發(fā)送單元14由I/O單元表示。
媒體對(duì)象可包括二進(jìn)制媒體文件(例如,MPEG、SVG、PNG、SP-MIDI、XHTML、SMIL、3GP、JPEG、GIF)和/或包含在軌道中的動(dòng)態(tài)媒體對(duì)象或流(例如,音頻、視頻、和定時(shí)文本)。
在本發(fā)明的一個(gè)特定實(shí)施例中,媒體組織器11被配置為適于將媒體對(duì)象組織成為交插的連續(xù)數(shù)據(jù)分段。用于“分段”的其他名稱包括“部分”、“區(qū)域”和“組塊”。
根據(jù)另一特定實(shí)施例,該設(shè)備包括某種用于提供控制信息的裝置,該控制信息使接收單元Rx能夠在接收該容器時(shí)使用漸進(jìn)式下載,即,接收單元Rx能夠在仍然下載其余部分的同時(shí)再現(xiàn)或顯示或執(zhí)行多媒體顯示內(nèi)容的一些部分。一些控制信息可包括,但不局限于基于某些預(yù)定下載速率的初始延遲或緩沖延遲。
根據(jù)本發(fā)明,擴(kuò)展3GP文件格式允許包括場(chǎng)景描述、音頻、視頻和其它類型的媒體類型的自包含多媒體顯示存儲(chǔ)在一個(gè)文件中。這樣,擴(kuò)展的3GP文件可包含完整的顯示,這使得傳輸和存儲(chǔ)具有相關(guān)性的幾個(gè)文件更容易。此外,由于在這種文件中的所有媒體可以被交插,這將對(duì)漸進(jìn)式下載尤其有用。包含混合的多媒體顯示的擴(kuò)展3GP文件可被-在客戶端上漸進(jìn)式下載(和同時(shí)播放)(PSS),-在傳遞之后在本地播放(PSS和MSS),和-用作普通分發(fā)格式的多媒體顯示(MBMS)。
此外,帶有用于RTP流的線索軌道和用于HTTP下載的媒體文件的完整PSS會(huì)話可包含在一個(gè)擴(kuò)展的3GP文件中。
概念上,每個(gè)會(huì)話分發(fā)一個(gè)文件并在會(huì)話期間將一個(gè)文件用作流送和下載的源將會(huì)更簡(jiǎn)單。擴(kuò)展的服務(wù)器文件不旨在用于分發(fā)到客戶端,而是-從內(nèi)容創(chuàng)建器傳遞到操作員,-由PSS服務(wù)器使用,用于流送(軌道)和HTTP傳遞(媒體文件)。
要指出的是,根據(jù)本發(fā)明,3GP文件也能作為二進(jìn)制文件包含在擴(kuò)展的3GP文件中。例如,包含用于提供音頻和定時(shí)文本[6]的PSS會(huì)話的3GP文件包括用于音頻的RTP線索軌道和用于定時(shí)文本的單獨(dú)的3GP文件。原因在于,在版本5的PSS中,定時(shí)文本不是經(jīng)由HTTP流送的,而是經(jīng)由HTTP傳遞的。
將參考圖6描述多媒體容器的一個(gè)實(shí)施例。
多媒體容器20包括許多媒體對(duì)象、引用媒體對(duì)象的標(biāo)識(shí)符或定位器、和基于標(biāo)識(shí)符協(xié)調(diào)媒體對(duì)象的場(chǎng)景描述文件。
根據(jù)一個(gè)特定實(shí)施例,靜態(tài)媒體文件和/或包含在軌道中的動(dòng)態(tài)媒體對(duì)象都能夠包含在多媒體容器20中。媒體對(duì)象可作為一個(gè)或多個(gè)交插的連續(xù)數(shù)據(jù)分段被包含,或以它們本來(lái)的格式被包含。
根據(jù)另一特定實(shí)施例,參考圖7,引用動(dòng)態(tài)媒體對(duì)象的標(biāo)識(shí)符位于容器的第一部分21中,并且引用靜態(tài)媒體文件的標(biāo)識(shí)符位于容器的第二部分22中。交插的媒體對(duì)象(靜態(tài)的和動(dòng)態(tài)的)位于該容器的第三部分中。這些部分的實(shí)際順序不局限于該實(shí)施例。另外,優(yōu)選地,將場(chǎng)景描述文件當(dāng)作靜態(tài)或二進(jìn)制文件來(lái)對(duì)待,并因此包含在容器20的第二部分22中。然而,多媒體容器中各個(gè)部分的個(gè)體順序不由該實(shí)施例來(lái)反映。
將參考圖8和圖9描述多媒體容器的另一特定實(shí)施例。
在該實(shí)施例中,第一部分21由電影箱moove表示,第二部分22由文件樹(shù)箱ftre表示,第三部分23由媒體數(shù)據(jù)箱mdat表示。另外,根據(jù)本發(fā)明,容器20包括文件類型箱ftyp,其包括關(guān)于容器格式類型的信息。
根據(jù)本發(fā)明,對(duì)3GP的擴(kuò)展包括用于文件樹(shù)的新簡(jiǎn)檔標(biāo)記、文件目錄結(jié)構(gòu)、和在擴(kuò)展的3GP文件中尋址文件的規(guī)則。
文件-目錄簡(jiǎn)檔(標(biāo)記為“3gd6”)被定義用于包括文件目錄的3GP文件。符合文件-目錄簡(jiǎn)檔的文件應(yīng)包括具有一個(gè)或多個(gè)文件條目的文件樹(shù)。這些文件條目之一可以是起始文件,即,包含用于顯示或流式會(huì)話的場(chǎng)景描述。
根據(jù)該容器的一個(gè)實(shí)施例,靜態(tài)媒體文件和包含在軌道中的動(dòng)態(tài)媒體對(duì)象都被包含進(jìn)容器中。文件-目錄簡(jiǎn)檔可與其它3GP簡(jiǎn)檔組合使用,只要文件符合那些簡(jiǎn)檔。特別地-文件-目錄簡(jiǎn)檔和基本簡(jiǎn)檔一起意味著該文件既具有文件目錄,又具有一個(gè)或多個(gè)帶有音頻、視頻和文本的軌道,-文件-目錄簡(jiǎn)檔、基本簡(jiǎn)檔和漸進(jìn)式下載簡(jiǎn)檔一起意味著包括軌道和所包含文件的整個(gè)3GP文件適于漸進(jìn)式下載。在該文件中提供了漸進(jìn)式下載延遲的進(jìn)一步細(xì)節(jié)。
-文件-目錄簡(jiǎn)檔和流送服務(wù)器簡(jiǎn)檔一起意味著服務(wù)器文件-包含一個(gè)或多個(gè)用于通過(guò)RTP提供媒體流的線索軌道,-包含一個(gè)或多個(gè)將通過(guò)HTTP傳遞的二進(jìn)制文件。
在包含在服務(wù)器文件中的二進(jìn)制文件當(dāng)中,一個(gè)文件可包括PSS會(huì)話的場(chǎng)景描述(SMIL,HTML)。另外的文件可以是該會(huì)話的一部分,即,圖像、SP-MIDI、定時(shí)文本等等。
將參考具體的和例證性的例子來(lái)更詳細(xì)地描述本發(fā)明。
根據(jù)容器的另一個(gè)實(shí)施例,容器只包括靜態(tài)媒體文件。除了將媒體目錄增加到具有軌道的3GP文件以外,文件-目錄簡(jiǎn)檔可用于那些只包含文件目錄而不包含軌道(沒(méi)有電影箱)的文件,換句話說(shuō),靜態(tài)文件或二進(jìn)制媒體文件。這樣的3GP文件對(duì)于產(chǎn)生自包含的顯示是非常有用的,其中,自包含的顯示不必包括由軌道承載的連續(xù)媒體。例子包括用于本地播放、或基于圖像、合成音頻或文本的PSS會(huì)話的幻燈片放映。
文件-目錄簡(jiǎn)檔是3GP簡(jiǎn)檔,并應(yīng)當(dāng)與文件擴(kuò)展名‘.3gp’一起使用。
文件樹(shù)用于二進(jìn)制文件存儲(chǔ)的文件目錄通常包含在擴(kuò)展的3GP文件的頂層上。該樹(shù)看起來(lái)像個(gè)普通目錄,并且可包括任何類型的二進(jìn)制文件和/或子目錄。該文件目錄作為元數(shù)據(jù)存儲(chǔ)在文件-樹(shù)箱中,而所包含文件的二進(jìn)制內(nèi)容作為組塊存儲(chǔ)在該所包含文件的媒體-數(shù)據(jù)箱‘mdat’中。
圖9中示出文件樹(shù)的一個(gè)例子,其對(duì)應(yīng)于圖8中的文件條目。以下的部分解釋圖9中每一個(gè)箱的功能。
文件-樹(shù)箱‘ftre’是容器箱。它是頂層箱,并將在3GP文件中位于文件-類型箱‘ftyp’之后,并且優(yōu)選地位于電影箱‘moov’之前。(參考圖8)為了考慮到將來(lái)的修改,文件-樹(shù)箱基于的是所謂的帶有版本號(hào)的滿箱,如表1所示。
表1文件樹(shù)箱
文件-樹(shù)箱定義3GP文件樹(shù)的根層。目錄箱‘diry’的層次定義了文件樹(shù)的較低層。在文件-樹(shù)箱或其它箱中包含以下根據(jù)表2的目錄箱。
表2目錄箱
需要每一個(gè)目錄箱包含一個(gè)根據(jù)表3的目錄-名稱箱‘dirn’表3目錄名稱箱
目錄名是帶有目錄名的UTF-8字符的以空值結(jié)尾的字符串。
文件條目文件樹(shù)中的文件由文件-條目箱‘fent’來(lái)定義,文件-條目箱‘fent’可存儲(chǔ)在文件樹(shù)中包括根層的任何層上。文件條目箱是容器箱,并在下面的表4中定義。
表4文件條目箱
每一個(gè)文件條目箱應(yīng)包括如表5和表6中定義的文件信息箱‘finf’和組塊信息箱‘chin’。
表5文件信息箱
文件名和內(nèi)容類型是UTF-8字符的以空值結(jié)尾的字符串。對(duì)于該文件,內(nèi)容類型應(yīng)當(dāng)是MIME類型。內(nèi)容編碼是可選的以空值結(jié)尾的字符串,用于指示在該3GP文件中存儲(chǔ)的文件是否被編碼、和在被解譯之前是否需要解碼,這與HTTP/1.1的內(nèi)容編碼相似。一些可能的值是“gzip”、“compress”、“deflate”,但是由于互用性的原因,使用到的條目只有“gzip”。
表6組塊信息箱
所包含文件的實(shí)際內(nèi)容作為一個(gè)或多個(gè)連續(xù)的數(shù)據(jù)分段(即,組塊,區(qū)域)存儲(chǔ)在媒體數(shù)據(jù)箱‘mdat’中。組塊偏移量是64位的整數(shù),其給出該組塊的起始點(diǎn)到該包含3GP文件內(nèi)的偏移量,并且組塊大小是64位的整數(shù),其給出該組塊的大小,即,由文件-條目箱定義的文件長(zhǎng)度。要指出的是,組塊偏移量總是涉及該所包含的文件,即,3GP文件。我們已經(jīng)禁止使用數(shù)據(jù)-參考箱來(lái)指示可能的外部數(shù)據(jù)位置,因?yàn)樵?GP文件中包含二進(jìn)制文件的點(diǎn)將具有自包含文件。
原則上,任何類型的文件都可包含在文件樹(shù)中。對(duì)于PSS,可能使用隨后的媒體文件靜止圖像(JPEG)、位圖(GIF和PNG)、向量圖(SVG)、和合成的音頻(SP-MIDI)、文本(XHTML和SMIL)、以及承載定時(shí)文本的3GP文件。PSS所采用的任何新類型的媒體文件也將可能存儲(chǔ)在文件樹(shù)中。這例如包括DLS(可下載的聲音)。
起始位置擴(kuò)展的3GP文件可包含位于文件樹(shù)內(nèi)任何地方的場(chǎng)景描述。如果存在場(chǎng)景描述,則文件-樹(shù)箱將包含根據(jù)表7的起始位置箱。
表7起始位置箱
起始文件位置是以UTF-8字符表示的以空值結(jié)尾的字符串,包含與頂層相對(duì)的到該文件目錄中起始文件的路徑。作為例子,為了表明存儲(chǔ)在頂層(在文件樹(shù)箱內(nèi))的文件是一個(gè)場(chǎng)景描述,起始文件位置將正好包含該文件名,例如start.smil。
漸進(jìn)式下載信息擴(kuò)展的3GP文件可包含位于文件樹(shù)箱內(nèi)的漸進(jìn)式下載信息箱‘pdin’,正如在以下在表8中所定義的表8漸進(jìn)式下載信息箱
該箱包含N對(duì)數(shù)(到箱的末端),其指定以100比特/秒為單元的傳輸帶寬與以毫秒為單位的初始下載延遲的組合,接收方可通過(guò)在成對(duì)的數(shù)之間的線性內(nèi)插來(lái)獲得初始延遲的上估計(jì)。
尋址可在3GP文件內(nèi)或從外部一致地尋址在該3GP文件內(nèi)的文件和軌道。3GP文件的文件目錄和所有軌跡存在于頂層上,例如,example.3gp/toplevelfile.smil和example.3gp/軌道ID=2作為3GP文件內(nèi)尋址的例子,考慮圖8中列出的多媒體容器show.3gp。它包含-H.263軌道(假定軌道ID=1),-AMR軌道(假定軌道ID=2),-根-層SMIL文件(start.smil),和-在目錄(img)中的兩個(gè)圖像(cat.jpg和dog.jpg)。
在SMIL文件內(nèi)位于3GP文件頂層的場(chǎng)景描述將引用如下的圖8中的媒體文件H.263當(dāng)軌道ID=1時(shí)AMR當(dāng)軌道ID=2時(shí)cat.jpg當(dāng)是img/cat.jpg時(shí)dog.jpg當(dāng)img/dog.jpg時(shí)根據(jù)本發(fā)明,3GP文件的內(nèi)容從外面被如下尋址SMIL當(dāng)是show.3gp/start.smil時(shí)H.263當(dāng)是show.3gp/軌道ID=1時(shí)AMR當(dāng)是show.3gp/軌道ID=2時(shí)cat.jpg當(dāng)是show.3gp/img/cat.jpg時(shí)dog.jpg當(dāng)是show.3gp/img/dog.jpg時(shí)現(xiàn)在考慮將以前例子中的SMIL文件移動(dòng)到包含這些圖像的目錄img。相對(duì)于該SMIL文件,該媒體當(dāng)前被如下引用H.263 當(dāng)是../軌道ID=1時(shí)AMR 當(dāng)是../軌道ID=2時(shí)cat.jpg 當(dāng)是cat.jpg時(shí)dog.jpg 當(dāng)是dog.jpg時(shí)現(xiàn)在,3GP文件的內(nèi)容將從外面被如下尋址
SMIL 當(dāng)是show.3gp/img/start.smil時(shí)H.263 當(dāng)是show.3gp/軌道ID=1時(shí)AMR 當(dāng)是show.3gp/軌道ID=2時(shí)cat.jpg 當(dāng)是show.3gp/img/cat.jpg時(shí)dog.jpg 當(dāng)是show.3gp/img/dog.jpg時(shí)可在PSS會(huì)話之前或PSS會(huì)話期間通過(guò)HTTP傳遞包含在文件樹(shù)中的文件。傳遞存儲(chǔ)在3GP內(nèi)部文件的HTTP服務(wù)器將-將內(nèi)容-類型設(shè)置為文件條目箱的值-將內(nèi)容-位置設(shè)置為在3GP文件內(nèi)部的二進(jìn)制文件的URI。
作為例子,圖8中所包括的線索軌道的3GP文件可包含PSS會(huì)話。當(dāng)客戶端通過(guò)HTTP訪問(wèn)SMIL文件時(shí),它還接收SMIL文件的內(nèi)容-位置,例如,http//mediaportal/show.3gp/。然后,在SMIL文件內(nèi)的所有HTTP引用將基于該內(nèi)容-位置,這使HTTP GET能夠引用3GP文件內(nèi)的二進(jìn)制文件。
客戶端將以相同方式基于SMIL文件的內(nèi)容-位置來(lái)解析RTSP的URI。這使RTSP DESCRIBE能夠引用3GP文件,使RTSP SETUP能夠引用軌道。
例子檢索SMIL文件和解析在該SMIL文件中指出的資源的URI。GET/exampledir/show.3gp/img/start.smil HTTP/1.1Hostwww.example.comHTTP/1.1 200 OK內(nèi)容-位置http//www.example.com/exampledir/show.3gp/img/start.smil內(nèi)容-大小xxxxxx內(nèi)容-類型application/smil<smil>
<body>
<sep>
<image src=“catjpg”dur=“3s”/>
<image src=“dogjpg”dur=“5s”/>
</sep>
</body></smil>
這樣,將為上述得到的SMIL顯示提供基礎(chǔ)URIhttp//www.example.com/exampledir/show.3gp/img/start.smil當(dāng)執(zhí)行該SMIL文件的處理時(shí),該基礎(chǔ)URI將產(chǎn)生解析出的URI“http//www.example.com/exampledir/show.3gp/img/cat.jpg”“http//www.example.com/exampledir/show.3gp/img/dog.jpg”文件格式和加密根據(jù)現(xiàn)有技術(shù),可使用存儲(chǔ)加密媒體的機(jī)制來(lái)擴(kuò)展3GP文件格式。另外,定義了應(yīng)用于文本軌道加密的具體3GPP擴(kuò)展以及加密3GP文件的3GP簡(jiǎn)檔標(biāo)記。關(guān)于加密方案的細(xì)節(jié)存儲(chǔ)在保護(hù)信息箱中。為了使用OMA DRM版本2的加密3GP文件,該方案的具體細(xì)節(jié)將由OMA來(lái)定義。
該擴(kuò)展后面的一般思想是使用加密媒體的普通碼點(diǎn)(編解碼器標(biāo)識(shí)符)來(lái)代替加密媒體的碼點(diǎn)。這防止了傳統(tǒng)播放機(jī)和其它對(duì)加密沒(méi)有意識(shí)的播放機(jī)訪問(wèn)那些在能夠被解碼之前需要被解密的比特流。然而,對(duì)于對(duì)加密沒(méi)有意識(shí)的播放機(jī)來(lái)說(shuō),新的碼點(diǎn)包括關(guān)于密鑰管理信息和解密加密媒體要求的信息。另外,一旦已被解密,新的碼點(diǎn)復(fù)制初始的編解碼器標(biāo)識(shí)符和解碼比特流所需要的其它解碼參數(shù)。
加密的3GP文件還可用于流送服務(wù)器,以通過(guò)RTP提供加密媒體。這種3GP文件的線索軌道本身不被加密,PSS服務(wù)器不必非要解密任何東西,以便提供加密的內(nèi)容。關(guān)于密鑰管理和解密的信息被送達(dá)到在SDP描述中的客戶端,同時(shí)將相關(guān)部分存儲(chǔ)在3GP文件的線索軌道中。然而,由于內(nèi)容提供商可能想要將指服務(wù)器采取某些動(dòng)作,例如,在數(shù)據(jù)被流送之前提供完整性保護(hù);仍然需要重定義用于線索軌道的碼點(diǎn)。新碼點(diǎn)在提供關(guān)于要求完整性保護(hù)的信息的同時(shí)復(fù)制初始碼點(diǎn)信息。這樣將防止了對(duì)加密沒(méi)意識(shí)的服務(wù)器提供那些認(rèn)為被完整性保護(hù)的加密數(shù)據(jù)。
用于加密3GP文件的簡(jiǎn)檔發(fā)信號(hào)通知3GP文件中的加密媒體的一種方式是定義和使用加密簡(jiǎn)檔(標(biāo)記為‘3ge6’)。另外,關(guān)于這類加密文件的更多細(xì)節(jié)由其它標(biāo)記給出,例如,用于音頻和/或視頻顯示的基本簡(jiǎn)檔標(biāo)記或用于提供加密內(nèi)容的流送服務(wù)器簡(jiǎn)檔。
符合加密簡(jiǎn)檔的文件將使用加密-樣本描述條目(碼點(diǎn))用于包含加密媒體的媒體軌道。符合加密簡(jiǎn)檔的文件既可包含加密軌道又可包含未加密軌道,但是如果它們是同一媒體類型,則不可。
加密簡(jiǎn)檔應(yīng)用作主要標(biāo)記。它該可以與其它3GP簡(jiǎn)檔結(jié)合使用,只要文件符合那些簡(jiǎn)檔。
特別地-加密簡(jiǎn)檔和基本簡(jiǎn)檔一起意味著軌道的最大數(shù)量是一個(gè)用于視頻、一個(gè)用于音頻、和一個(gè)用于文本,文件既可包含加密軌道,又可包含未加密軌道。然而,要指出的是,對(duì)加密沒(méi)有意識(shí)的播放機(jī)將忽略加密軌道。
-加密簡(jiǎn)檔和漸進(jìn)式下載的簡(jiǎn)檔一起意味著該文件已加密,并適于漸進(jìn)式下載。
-加密簡(jiǎn)檔和流送服務(wù)器簡(jiǎn)檔一起意味著由一個(gè)或多個(gè)線索軌跡引用的內(nèi)容被加密。如果要求PSS服務(wù)器采取特殊動(dòng)作,例如,提供完整性保護(hù),將使用線索軌道的加密樣本來(lái)描述條目(碼點(diǎn))。
要指出的是,普通簡(jiǎn)檔被定義為包括加密簡(jiǎn)檔的所有簡(jiǎn)檔的超集。(只有)符合普通簡(jiǎn)檔的3GP文件可包含任何數(shù)量的還未組合進(jìn)適于下載、或流送或不具有關(guān)于密鑰管理的必要信息的3GP文件中的加密軌道。
加密-基本簡(jiǎn)檔是3GP簡(jiǎn)檔,并應(yīng)與文件擴(kuò)展名‘.3gp’一起使用。
用于加密數(shù)據(jù)的碼點(diǎn)在3GP文件內(nèi)的媒體軌道的樣本描述條目識(shí)別已編碼媒體的格式,例如,編解碼器和其它編碼參數(shù)。因此,通過(guò)簡(jiǎn)單分析樣本描述,播放機(jī)可判定那個(gè)軌道能夠播放。
來(lái)源于ISO基礎(chǔ)媒體文件格式的所有音頻和視頻樣本條目包含一組強(qiáng)制字段。另外,它們可包含特別用于正在討論的編解碼器的箱。MPEG-4編解碼器(可視的和AAC)使用ESDBox,而AMR和H.263分別使用AMRSpecificBox和H263SpecificBox。
在軌道內(nèi)存儲(chǔ)加密媒體背后的原則是使用加密媒體的普通碼點(diǎn)來(lái)“偽裝”初始樣本描述條目。我們定義了三個(gè)用于發(fā)信號(hào)通知如下表9中的加密視頻、音頻和文本的碼點(diǎn)(樣本描述條目的四-字符碼)表9碼點(diǎn)
樣本描述的“加密”版本復(fù)制初始樣本描述,并包括保護(hù)信息箱,該保護(hù)信息箱具有關(guān)于初始格式和解密編碼媒體的所有要求的信息。在表10和表11中定義了加密視頻樣本條目和加密音頻樣本條目,其中,保護(hù)信息箱被簡(jiǎn)單地增加到在樣本條目中所包含箱的列表中。
表10加密視頻樣本條目
表11加密音頻樣本條目
加密視頻樣本條目和加密音頻樣本條目也能與任何增加到3GP文件格式的另外編解碼器一起使用。只要它們的樣本條目基于ISO基礎(chǔ)媒體文件格式的樣本條目。
加密文本樣本條目在表12中定義。文本軌道對(duì)3GP文件來(lái)說(shuō)是特殊的,并由26.245的定時(shí)文本格式來(lái)定義。與音頻和視頻的例子類似,我們?cè)诮Y(jié)尾增加保護(hù)信息箱。
表12加密文本樣本條目
密鑰管理解密媒體的必需要求存儲(chǔ)在保護(hù)信息箱內(nèi)。它包含識(shí)別解密媒體的編解碼器的初始格式箱、標(biāo)識(shí)用于保護(hù)媒體的保護(hù)方案的方案類型箱、和包含具體的方案數(shù)據(jù)(為每一個(gè)方案定義)的方案信息箱。保護(hù)信息箱和它所包含的箱在表13-16中定義。
表13保護(hù)信息箱
表14初始格式箱
數(shù)據(jù)格式識(shí)別已解密的編碼數(shù)據(jù)的格式(編解碼器)。當(dāng)前在3GP<p>表V突發(fā)到達(dá)的效果
在本發(fā)明的實(shí)施例中,有對(duì)正常(相對(duì)于類似嚴(yán)格優(yōu)先級(jí))AF加權(quán)的需要-這個(gè)實(shí)施例尋求保護(hù)盡力服務(wù)(或“最優(yōu)服務(wù)”,在這個(gè)實(shí)施例中為AF3)業(yè)務(wù)。由此,在許可判定中考慮了AF加權(quán)。仿真顯示,靜態(tài)的AF加權(quán)導(dǎo)致比較自適應(yīng)AF加權(quán)更低的瓶頸鏈路利用率。此外,自適應(yīng)預(yù)約限制是保護(hù)自己防止突發(fā)連接到達(dá)并維持高瓶頸鏈路利用率的有效方式。
現(xiàn)在將描述可以與前述實(shí)施例聯(lián)合使用的本發(fā)明另外的實(shí)施例。為ITRM/帶寬經(jīng)紀(jì)人提供了CAC算法,該算法再次沒(méi)有為AF4隊(duì)列假定“類似嚴(yán)格優(yōu)先級(jí)”加權(quán)。AF調(diào)度加權(quán)的設(shè)置對(duì)給定ITRM/帶寬經(jīng)紀(jì)人管理之下的所有鏈路可以是相同的,或者該加權(quán)分別針對(duì)每條鏈路調(diào)整。然而,后一種方法比較復(fù)雜而且有振蕩傾向。
調(diào)度加權(quán)&CAC算法調(diào)整過(guò)程接收有關(guān)阻塞/提供的AF連接的比率以及ITRM/帶寬經(jīng)紀(jì)人區(qū)域內(nèi)的每一條鏈路的未使用AF4帶寬<p>方案版本0特殊方案箱OMADRM樣本格式箱和OMADRM報(bào)頭箱,參見(jiàn)表17和表18。
表17OMADRM樣本格式箱
表18OMADRM報(bào)頭箱
加密服務(wù)器文件PSS服務(wù)器也能使用3GP文件用于流送加密媒體。這里的原則是分組-然后-加密??傮w來(lái)說(shuō),在來(lái)自3GP服務(wù)器文件的加密媒體與未加密媒體之間沒(méi)有差別。在兩種情況中,PSS服務(wù)器能夠簡(jiǎn)單地遵從該文件的線索指令。經(jīng)由SDP描述將關(guān)于使用流媒體的所有必要信息送達(dá)到客戶端。對(duì)于加密媒體,這還包括對(duì)解密媒體流的要求。
加密根據(jù)本發(fā)明的特定實(shí)施例,還可以在擴(kuò)展的3GP文件中包括加密媒體文件。因此,以下將描述使用容器文件格式和保護(hù)信息箱來(lái)加密和解密的解決方案。
默認(rèn)地,二進(jìn)制文件“不受阻礙”地被存儲(chǔ)。然而,在3GP文件的文件目錄中包括加密二進(jìn)制文件也是可能的。保護(hù)信息箱存在于文件條目箱中表示二進(jìn)制文件的內(nèi)容(媒體數(shù)據(jù))被加密。此外,保護(hù)信息箱識(shí)別加密方案和解密相應(yīng)媒體數(shù)據(jù)所需要的所有信息。
這里,保護(hù)信息箱與在表13-表18中為加密軌道提出的保護(hù)信息箱相同。盡管對(duì)于二進(jìn)制文件將忽略(不應(yīng)包含)初始格式箱,但定義是相同的。要指出的是,用于二進(jìn)制文件的保護(hù)信息箱的目的有兩重指示媒體加密,以及給出對(duì)其解密的要求。
保護(hù)信息箱‘sint’包含方案類型箱‘schm’,其識(shí)別用于保護(hù)該媒體的保護(hù)方案、和方案信息箱‘schi’,其包含具體的方案數(shù)據(jù)(為每一個(gè)方案定義)。
由方案信息箱包含的箱由方案類型定義。相似地,定義應(yīng)用于整個(gè)‘mdat’和‘mdat’內(nèi)部的字節(jié)范圍是可能的。這對(duì)于用多個(gè)小文件顯示可能是不錯(cuò)的。
根據(jù)本發(fā)明,通過(guò)包含用于二進(jìn)制文件的文件樹(shù)將3GP文件擴(kuò)展到普通容器格式,包括例如它們的MIME類型一樣的信息。因此,在MMS和PSS中使用的任何類型的多媒體數(shù)據(jù)能夠與場(chǎng)景描述一起存儲(chǔ)在3GP文件中。以考慮漸進(jìn)式下載整個(gè)多媒體顯示或會(huì)話的這種方式來(lái)構(gòu)建容器格式。因而,擴(kuò)展的3GP文件可通過(guò)下載或漸進(jìn)式下載來(lái)傳遞,并由3GP播放機(jī)播放。這種帶有線索軌道的擴(kuò)展3GP文件能夠包含整個(gè)PSS會(huì)話,并可由PSS服務(wù)器提供服務(wù),其中,通過(guò)RTP流送連續(xù)媒體,并通過(guò)HTTP來(lái)傳遞媒體文件。
根據(jù)本發(fā)明來(lái)擴(kuò)展并包含文件樹(shù)的3GP文件可定義3GP簡(jiǎn)檔(標(biāo)記)。在文件樹(shù)內(nèi)的文件可“不受阻礙”地被存儲(chǔ),或者可與關(guān)于怎樣對(duì)其解密的要求一起被加密。
對(duì)于分段的文件,整個(gè)顯示被分成多于一的分段。然后,該顯示將可以逐段地(漸進(jìn)式)下載,其中,較后的分段將用更多的文件或媒體軌道或者文件或媒體軌道的延續(xù)來(lái)增強(qiáng)先前的分段。也可以通過(guò)逐段發(fā)送顯示來(lái)實(shí)時(shí)下載。對(duì)于總的顯示結(jié)構(gòu),在幾個(gè)分段中具有SMIL文件,并且關(guān)于怎樣更新、增強(qiáng)或替換SMIL文件的方案可以做到此。
此外,本發(fā)明涉及現(xiàn)實(shí)怎樣才能與場(chǎng)景描述相組合、以及怎樣才能用作用于混合會(huì)話的容器格式,其中在用于混合會(huì)話的容器中,一些媒體被流送,而其它媒體被下載。
本領(lǐng)域技術(shù)人員將會(huì)理解的是,可在不偏離由附帶權(quán)利要求限定的本發(fā)明范圍的情況下對(duì)本發(fā)明做出各種修改和改變。
參考文件[1]ITU-T建議H.263(2001),用于低比特率通信的視頻編解碼器。
3GPP TS 26.071強(qiáng)制性語(yǔ)音編解碼器語(yǔ)音處理功能;AMR語(yǔ)音編解碼器,一般描述。
ISO/IEC 14496-22001,信息技術(shù)-音頻-視頻對(duì)象的編碼-部分3音頻(MPEG-4部分3)。
ITU-T建議T.81(1992)。
3GPP TS 26.244透明的端到端分組交換流業(yè)務(wù)(PSS);3GPP文件格式(3GP)。
ISO/IEC 14496-122003|15444-122003信息技術(shù)-音頻-視頻對(duì)象的編碼-部分12ISO基本媒體文件格式|信息技術(shù)-JPEG2000圖像編碼系統(tǒng)-部分12ISO基本媒體文件格式。
US專利2003/0053416 A1,用于圖像或視頻處理的通用參考解碼器,Ribas-Corbera等人,美國(guó)微軟公司。
3GPP TS 26.234透明的端到端分組交換流業(yè)務(wù)(PSS);協(xié)議和編解碼器。
權(quán)利要求
1.一種用于發(fā)送包括多個(gè)媒體對(duì)象的多媒體顯示的方法,所述方法包括將所述多個(gè)媒體對(duì)象組織進(jìn)多媒體容器中(S10);將引用所述多個(gè)媒體對(duì)象中的每一個(gè)的標(biāo)識(shí)符組織進(jìn)所述多媒體容器中(S20);將基于所述標(biāo)識(shí)符協(xié)調(diào)所述多個(gè)媒體對(duì)象的可識(shí)別文件提供到所述多媒體容器中(S30);發(fā)送所述多媒體容器和所合并的多媒體顯示(S33)。
2.根據(jù)權(quán)利要求1的方法,其中所述媒體對(duì)象包括至少一個(gè)靜態(tài)媒體文件。
3.根據(jù)權(quán)利要求2的方法,其中所述組織媒體對(duì)象的步驟(S10)包括將媒體文件作為交插的連續(xù)數(shù)據(jù)分段組織進(jìn)多媒體容器中。
4.根據(jù)權(quán)利要求1的方法,其中所述媒體對(duì)象既包括軌道中的動(dòng)態(tài)媒體對(duì)象,又包括靜態(tài)媒體文件。
5.根據(jù)權(quán)利要求4的方法,其中所述組織媒體對(duì)象的步驟(S10)包括將靜態(tài)媒體文件和動(dòng)態(tài)媒體對(duì)象都作為交插的連續(xù)數(shù)據(jù)分段組織進(jìn)多媒體容器中。
6.根據(jù)權(quán)利要求5的方法,其中該容器被漸進(jìn)地發(fā)送到至少一個(gè)接收機(jī)。
7.根據(jù)權(quán)利要求1-6中任何一個(gè)的方法,其中接收機(jī)在發(fā)送期間再現(xiàn)所述容器的可識(shí)別文件和媒體對(duì)象。
8.根據(jù)權(quán)利要求7的方法,其中所述方法進(jìn)一步包括步驟(S31)提供使接收機(jī)能夠在發(fā)送期間再現(xiàn)所述多媒體容器的可識(shí)別文件和媒體對(duì)象的下載控制信息。
9.根據(jù)權(quán)利要求1的方法,其中所述媒體對(duì)象中的至少一個(gè)被加密,并且所述方法進(jìn)一步包括提供使得能夠解密所述至少一個(gè)加密媒體對(duì)象的解密數(shù)據(jù)(S32)。
10.一種用于管理多個(gè)協(xié)作媒體對(duì)象的方法,所述方法包括將所述多個(gè)媒體對(duì)象組織進(jìn)多媒體容器中(S10);將引用所述多個(gè)媒體對(duì)象中的每一個(gè)的標(biāo)識(shí)符組織進(jìn)所述多媒體容器中(S20);將協(xié)調(diào)所述多個(gè)媒體對(duì)象的可識(shí)別文件提供到所述多媒體容器中(S30)。
11.根據(jù)權(quán)利要求10的方法,其中所述媒體對(duì)象包括靜態(tài)媒體文件。
12.根據(jù)權(quán)利要求11的方法,其中所述組織多個(gè)媒體對(duì)象(S10)包括將靜態(tài)媒體文件作為交插的連續(xù)數(shù)據(jù)分段組織進(jìn)多媒體容器中。
13.根據(jù)權(quán)利要求10的方法,其中所述組織媒體對(duì)象的步驟(S10)包括將軌道中的動(dòng)態(tài)媒體對(duì)象和靜態(tài)媒體文件都組織進(jìn)所述多媒體容器中。
14.根據(jù)權(quán)利要求13的方法,其中所述組織媒體對(duì)象的步驟(S10)包括將靜態(tài)媒體文件和動(dòng)態(tài)媒體對(duì)象都作為交插的連續(xù)數(shù)據(jù)分段組織進(jìn)多媒體容器中。
15.一種用于發(fā)送包括多個(gè)媒體對(duì)象的多媒體顯示的設(shè)備(10),所述設(shè)備包括用于將多個(gè)媒體對(duì)象組織進(jìn)多媒體容器中的裝置(11);用于將引用所述多個(gè)媒體對(duì)象的標(biāo)識(shí)符組織進(jìn)所述多媒體容器中的裝置(12);用于將基于所述標(biāo)識(shí)符協(xié)調(diào)多個(gè)媒體對(duì)象的可識(shí)別文件提供進(jìn)所述多媒體容器中的裝置(13);和用于發(fā)送所述多媒體容器和所合并的多媒體顯示,從而使得能夠從該發(fā)送的容器直接顯示多媒體顯示的裝置(14)。
16.根據(jù)權(quán)利要求15的設(shè)備,其中所述媒體對(duì)象包括至少一個(gè)靜態(tài)媒體文件。
17.根據(jù)權(quán)利要求16的設(shè)備,其中所述用于組織多個(gè)媒體對(duì)象的裝置(11)被配置用于將靜態(tài)媒體文件作為交插連續(xù)數(shù)據(jù)分段組織進(jìn)多媒體容器中。
18.根據(jù)權(quán)利要求17的設(shè)備,其中所述媒體對(duì)象既包括軌道中的動(dòng)態(tài)媒體對(duì)象,又包括靜態(tài)媒體文件。
19.根據(jù)權(quán)利要求18的設(shè)備,其中所述用于組織媒體對(duì)象的裝置(11)適于將靜態(tài)媒體文件和動(dòng)態(tài)媒體對(duì)象都作為交插的連續(xù)數(shù)據(jù)分段來(lái)組織。
20.根據(jù)權(quán)利要求15的設(shè)備,其中所述多媒體容器被配置為使接收機(jī)能夠在發(fā)送期間再現(xiàn)所述多媒體容器的可識(shí)別文件和媒體對(duì)象。
21.根據(jù)權(quán)利要求15的設(shè)備,其中所述媒體文件中的至少一個(gè)被加密,并且所述設(shè)備進(jìn)一步包括用于提供解密數(shù)據(jù)的裝置,該解密數(shù)據(jù)用于使得能夠解密所述至少一個(gè)加密的媒體對(duì)象。
22.根據(jù)權(quán)利要求20的設(shè)備,其中所述設(shè)備包括用于提供使接收機(jī)能夠在發(fā)送期間再現(xiàn)所述容器的可識(shí)別文件和媒體對(duì)象的下載控制信息的裝置。
23.根據(jù)權(quán)利要求22的設(shè)備,其中所述用于提供下載控制信息的裝置被配置為提供關(guān)于基于預(yù)定下載速度的緩沖延遲的信息。
24.一種用于包括多個(gè)媒體對(duì)象的多媒體顯示的多媒體容器(20),所述多媒體容器包括所述多個(gè)媒體對(duì)象;引用所述多個(gè)媒體對(duì)象的標(biāo)識(shí)符;基于所述標(biāo)識(shí)符協(xié)調(diào)所述多個(gè)媒體對(duì)象的可識(shí)別文件。
25.根據(jù)權(quán)利要求24的多媒體容器,其中所述媒體對(duì)象包括靜態(tài)媒體文件和軌道中的動(dòng)態(tài)媒體對(duì)象中的至少一個(gè)。
26.根據(jù)權(quán)利要求25的多媒體容器,其中所述媒體對(duì)象既包括靜態(tài)媒體文件,又包括動(dòng)態(tài)媒體對(duì)象。
27.根據(jù)權(quán)利要求24-26中任何一個(gè)的多媒體容器,其中將所述媒體對(duì)象作為交插的連續(xù)數(shù)據(jù)分段組織進(jìn)多媒體容器(20)的一部分中(23)。
28.根據(jù)權(quán)利要求25的多媒體容器,其中引用靜態(tài)媒體文件的標(biāo)識(shí)符位于多媒體容器的第二部分(21)中;引用動(dòng)態(tài)媒體對(duì)象的標(biāo)識(shí)符位于多媒體容器(20)的第三部分(22)中。
29.根據(jù)權(quán)利要求28的多媒體容器,其中所述可識(shí)別文件位于多媒體容器的所述第二部分(21)中。
30.根據(jù)權(quán)利要求24的多媒體容器,其中所述容器(20)包括使接收機(jī)能夠在所述多媒體容器的發(fā)送期間再現(xiàn)所述容器的可識(shí)別文件和媒體對(duì)象的下載控制信息。
31.根據(jù)權(quán)利要求30的多媒體容器,其中所述下載控制信息位于多媒體容器的單獨(dú)的第四部分中。
32.根據(jù)權(quán)利要求24的多媒體容器,其中根據(jù)MPEG、SVG、JPEG、GIF、PNG、SP-MIDI、XHEML、SMIL和3GP中的任何一個(gè)來(lái)格式化所述媒體對(duì)象。
33.根據(jù)權(quán)利要求24的多媒體容器,其中根據(jù)SMI、HTML、XHTML和SVG中的任何一個(gè)來(lái)格式化所述可識(shí)別文件。
34.根據(jù)權(quán)利要求24的多媒體容器,其中所述多媒體容器被配置用于以透明方式包括不同類型的媒體對(duì)象,從而各個(gè)媒體對(duì)象的尋址、文件名、和MIMO類型被保存。
全文摘要
一種用于發(fā)送包括多個(gè)媒體對(duì)象的多媒體顯示的方法將媒體對(duì)象組織進(jìn)S10多媒體容器或容器格式中;將引用媒體對(duì)象的標(biāo)識(shí)符組織進(jìn)S20同一容器中;和將協(xié)調(diào)媒體對(duì)象的可識(shí)別文件也提供S30到容器中。
文檔編號(hào)H04N7/167GK1868184SQ200480030497
公開(kāi)日2006年11月22日 申請(qǐng)日期2004年10月14日 優(yōu)先權(quán)日2003年10月17日
發(fā)明者P·弗勒德, M·韋斯特隆德, T·艾納松 申請(qǐng)人:艾利森電話股份有限公司