專利名稱::可擴(kuò)展性信息的編碼、存儲和信號發(fā)送的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明針對一種編碼器、解碼器、設(shè)備、方法、數(shù)據(jù)記錄、模塊、計算機(jī)程序產(chǎn)品以及系統(tǒng),用于對包括至少兩個擴(kuò)展性層的可擴(kuò)展數(shù)據(jù)流進(jìn)行數(shù)據(jù)編碼、解碼、存儲和傳送。
背景技術(shù):
:多媒體應(yīng)用包括本地回放、流傳送或點播的、交談性和廣播/組播服務(wù)。協(xié)同性對于每個多媒體應(yīng)用的快速部署以及大規(guī)模市場形成非常重要。為了實現(xiàn)較高的協(xié)同性,規(guī)定了不同的標(biāo)準(zhǔn)。涉及多媒體應(yīng)用的技術(shù)包括但不限于媒體編碼、存儲和傳送。媒體類型包括語音、音頻、圖像、視頻、圖形以及時間文本。已經(jīng)為不同技術(shù)規(guī)定了不同標(biāo)準(zhǔn)。視頻編碼標(biāo)準(zhǔn)包括ITU-TH.261、ISO/IECMPEG-1Visual、ITU-TH.262或ISO/IECMPEG-2Visual、ISO/IECMPEG-4Visual、ITU-TH.264orISO/IECMPEG-4AVC(在此文檔中縮寫為AVC、AVC/H.264或H.264/AVC)以及可能的未來標(biāo)準(zhǔn),例如ISO/IECMPEG-21SVC、中國AVS、ITU-TH.265、以及ISO/IECMPEG3DAV??捎玫拿襟w文件格式標(biāo)準(zhǔn)包括ISO文件格式(ISO/IEC14496-12)、MPEG-4文件格式(ISO/IEC14496-14)、AVC文件格式(ISO/IEC14496-15)以及3GPP文件格式(3GPPTS16.244)。3GPPTS26.140規(guī)定3GPP系統(tǒng)中多媒體消息服務(wù)(MMS)的媒體類型、格式和編解碼器。3GPPTS26.234規(guī)定3GPP系統(tǒng)中分組交換流傳送服務(wù)(PSS)的協(xié)議和編解碼器。正進(jìn)行的3GPPTS26.346規(guī)定了3GPP系統(tǒng)中多媒體廣播/組播服務(wù)(MBMS)的協(xié)議和編解碼器。典型的音頻和視頻編碼標(biāo)準(zhǔn)規(guī)定"配置"和"水平"。"配置"是該標(biāo)準(zhǔn)的算法特征的子集,而"水平"是對編碼參數(shù)的一組限制,其對解碼器資源消耗施加了一組限制。所指示的配置和水平可用于發(fā)送媒體流的特性以及發(fā)送媒體解碼器的能力。通過配置和水平的組合,解碼器能夠判斷其是否能夠在不經(jīng)過嘗試解碼的情況下對流進(jìn)行解碼,但如果解碼器不能對該流進(jìn)行解碼,則這可能會使解碼器沖突、低于實時地操作和/或由于緩沖器溢出而丟棄數(shù)據(jù)。每一對配置和水平都形成"協(xié)同點"。某些編碼標(biāo)準(zhǔn)允許創(chuàng)建可擴(kuò)展比特流。通過僅對可擴(kuò)展比特流的特定部分進(jìn)行解碼,可以產(chǎn)生有意義的解碼后的表示。可擴(kuò)展比特流可用于流傳送服務(wù)器中預(yù)編碼單播流的速率自適應(yīng),并用于將單一比特流傳送至具有不同能力和/或不同網(wǎng)絡(luò)條件的終端??蓴U(kuò)展視頻編碼的其他使用情況的列表可以在2005年1月中國香港第71屆MPEG會議的ISO/IECJTClSC29WGll(MPEG)輸出文檔N6880"ApplicationsandRequirementsforScalableVideoCoding"中找到。可擴(kuò)展編碼技術(shù)包括常規(guī)的分層可擴(kuò)展編碼技術(shù)和精粒度可擴(kuò)展編碼。這些l支術(shù)的回顧可以在2001年3月的作者為WeipingLi的下列文章中找到"OverviewoffinegranularityscalabilityinMPEG-4videostandard,"IEEETransactionsonCircuitsandSystemsforVideoTechnology,vol.11,no.3,pp.301-317。對于在采用具備寬范圍處理能力的解碼器的系統(tǒng)中使用的很多多媒體應(yīng)用以及服務(wù)而言,可擴(kuò)展視頻編碼是期望的特征。已經(jīng)提出了若干種類型的視頻可擴(kuò)展性方案,例如時間、空間和品質(zhì)可擴(kuò)展性。這些所提出的類型包括基礎(chǔ)層和增強層?;A(chǔ)層是對視頻流進(jìn)行解碼所需的最少量數(shù)據(jù),而增強層是提供增強型視頻信號所需的附加數(shù)據(jù)。對H.264/AVC的可擴(kuò)展延伸的工作草稿當(dāng)前支持對多個可擴(kuò)展層進(jìn)行編碼。該工作草稿在下列文檔中進(jìn)行了描述JVT-N020,"Scalablevideocoding-workingdraft1,"14thmeeting,HongKong,Jan2005,并且也稱為MPEG文檔w6901,"WorkingDraft1.0of14496-10:200x/AMDlScalableVideoCoding,"HongKongmeeting,January2005。在該多個可擴(kuò)展層的編碼中,在比特流中發(fā)送的變量DependencyID用于指示不同可擴(kuò)展層的編碼依賴性??蓴U(kuò)展比特流包含至少兩個可擴(kuò)展層,基礎(chǔ)層以及一個或多個增強層。如果一個可擴(kuò)展比特流包含一個以上的可擴(kuò)展層,則其具有相同數(shù)量的備選用于解碼和回放。每個層都是解碼備選。層0,基礎(chǔ)層,是第一解碼備選。層l,第一增強層,是第二解碼備選。這種模式通過后繼層而繼續(xù)。通常,較低的層包含在較高的層中。例如層0包含在層1中,而層1包含在層2中。每個層的特征在于可以是不同于整個流的特性的至少一個特性的集合,例如精粒度可擴(kuò)展性(FGS)信息、感興趣區(qū)域(ROI)可擴(kuò)展性信息、子樣本可擴(kuò)展層信息、解碼依賴性信息以及初始參數(shù)設(shè)定。在先前的系統(tǒng)中,不可能以比特流自身的形式、以文本格式或通過傳輸協(xié)議來發(fā)送針對可擴(kuò)展比特流的特定層的下列可擴(kuò)展信息精粒度可擴(kuò)展性(FGS)信息;感興趣區(qū)域(ROI)可擴(kuò)展性信息;子樣本或子圖片可擴(kuò)展層信息;解碼依賴性信息;以及初始參數(shù)設(shè)定。
發(fā)明內(nèi)容本發(fā)明允許對可擴(kuò)展比特流進(jìn)行編碼、解碼、存儲以及傳送,其中存在至少兩個可擴(kuò)展性層,并且每個層的特征在于可以是不同于整個流的特性的至少一個特性的集合,例如FGS信息、ROI可擴(kuò)展性信息、子樣本可擴(kuò)展層信息、解碼依賴性信息以及初始參數(shù)設(shè)定,并且其中,該至少一個特性的集合針對不同于整個流的至少一個層而被發(fā)送,其中所述至少一個特性的集合的信號發(fā)送可以是在所述可擴(kuò)展比特流中、在包含所述可擴(kuò)展比特流的文件格式容器(container)中、或在用于傳送或控制所述可擴(kuò)展比特流的至少一個層的傳輸或控制協(xié)議中。利用本發(fā)明,通過檢驗該比特流,服務(wù)器或客戶端不需要分析流的每個層的FGS信息、ROI可擴(kuò)展性信息、子樣本可擴(kuò)展層信息、解碼依賴性信息以及初始參數(shù)設(shè)定,從而降低計算復(fù)雜度。對于不能夠從該比特流中分析層特性的設(shè)備,例如當(dāng)要求ROI信息但該信息不可用時,利用本發(fā)明,包含設(shè)備子單元以便支持該能力就得到了避免。本發(fā)明的一個示例性實施方式公開了一種方法和設(shè)備,用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層。該方法包括:生成可擴(kuò)展數(shù)據(jù)流的一個層或多個層,其中所述層的特征在于與可擴(kuò)展數(shù)據(jù)流的編碼特性不同的編碼特性,以及利用該特性化編碼特性來信號發(fā)送該層,使得它們可由解碼器讀取而無需對整個層進(jìn)行解碼。本發(fā)明的另一示例性實施方式公開了一種方法和設(shè)備,用于對可擴(kuò)展比特流進(jìn)行編碼,其中存在至少兩個可擴(kuò)展性層,并且每個層的特征在于至少一個特性的集合,例如FGS信息、ROI可擴(kuò)展性信息、子樣本可擴(kuò)展層信息、解碼依賴性信息以及初始參數(shù)設(shè)定,這些參數(shù)可以與整個流的有所不同,并且其中,該至少一個特性的集合針對不同于整個流的至少一個層而被信號發(fā)送,其中在所述可擴(kuò)展比特流中信號發(fā)送該至少一個特性的集合。該方法包括生成可擴(kuò)展比特流以包含在至少兩個層中,每個層的特征在于可以是不同于整個流的特性的至少一個特性的集合,例如FGS信息、ROI可擴(kuò)展性信息、子樣本可擴(kuò)展層信息、解碼依賴性信息以及初始參數(shù)設(shè)定,并且針對不同于整個流的至少一個層而在所述可擴(kuò)展比特流中信號發(fā)送所述至少一個特性的集合,使得所迷至少一個特性的集合是可讀的而無需分析所述至少一個特性的集合,或者嘗試對所述可擴(kuò)展比特流的層進(jìn)行解碼而無需知道是否該設(shè)備具有對該層進(jìn)行解碼的能力,這可能會引起設(shè)備沖突。本發(fā)明的另一示例性實施方式公開了一種方法和設(shè)備,用于分析可擴(kuò)展比特流,其中存在至少兩個可擴(kuò)展性層,并且每個層的特征在于可以是不同于整個流的特性的至少一個特性的集合,例如FGS信息、ROI可擴(kuò)展性信息、子樣本可擴(kuò)展層信息、解碼依賴性信息以及初始參數(shù)設(shè)定。該方法包括分析所述至少一個特性的集合,使得所述至少一個特性的集合可以在所述可擴(kuò)展比特流中、在包含所述可擴(kuò)展比特流的文件格式容器中、或在用于傳送或控制所述可擴(kuò)展比特流的至少一個層的傳輸或控制協(xié)議中進(jìn)行信號發(fā)送。本發(fā)明的另一示例性實施方式公開了一種方法和設(shè)備,用于對可擴(kuò)展比特流進(jìn)行轉(zhuǎn)換,其中存在至少兩個可擴(kuò)展性層并且每個層的特征在于可以是不同于整個流的特性的至少一個特性的集合,例如FGS信息、ROI可擴(kuò)展性信息、子樣本可擴(kuò)展層信息、解碼依賴性信息以及初始參數(shù)設(shè)定,并且其中,該至少一個特性的集合針對不同于整個流的至少一個層而被信號發(fā)送,其中所述至少一個特性的集合的信號發(fā)送可以是在所述可擴(kuò)展比特流中、在包含所述可擴(kuò)展比特流的文件格式容器中、或在用于傳送或控制所述可擴(kuò)展比特流的至少一個層的傳輸或控制協(xié)議中。該方法包括創(chuàng)建非可擴(kuò)展比特流,其包含所述可擴(kuò)展比特流的基礎(chǔ)層;創(chuàng)建第二可擴(kuò)展比特流,其包含所述可擴(kuò)展比特流的增強層。本發(fā)明的另一示例性實施方式公開了一種方法和設(shè)備,用于對可擴(kuò)展比特流進(jìn)行解碼,其中存在至少兩個可擴(kuò)展性層并且每個層的特征在于可以是不同于整個流的特性的至少一個特性的集合,例如FGS信息、ROI可擴(kuò)展性信息、子樣本可擴(kuò)展層信息、解碼依賴性信息以及初始參數(shù)設(shè)定,并且其中,該至少一個特性的集合針對不同于整個流的至少一個層而被信號發(fā)送,其中所述至少一個特性的集合的信號發(fā)送可以是在所述可擴(kuò)展比特流中、在包含所述可擴(kuò)展比特流的文件格式容器中、或在用于傳送或控制所述可擴(kuò)展比特流的至少一個層的傳輸或控制協(xié)議中。該設(shè)備包括第一組件,用于接收所述可擴(kuò)展比特流;第二組件,用于識別所述可擴(kuò)展比特流中的至少一個層,并讀取所述至少一個層的所述至少一個特性的集合;第三組件,用于根據(jù)所述至少一個特性的集合來確定解碼器是否能夠?qū)λ鲋辽僖粋€層進(jìn)行解碼;以及第四組件,用于如果所述第三組件確定所述解碼器能夠?qū)λ鲋辽僖粋€層進(jìn)行解碼,則對所述至少一個層進(jìn)行解碼。本發(fā)明的另一示例性實施方式公開了一種方法和設(shè)備,用于存儲可擴(kuò)展數(shù)據(jù)流,其中存在至少兩個可擴(kuò)展性層,并且每個層的特征在于可以是不同于整個流的特性的至少一個特性的集合,例如FGS信息、ROI可擴(kuò)展性信息、子樣本可擴(kuò)展層信息、解碼依賴性信息以及初始參數(shù)設(shè)定。該方法包括如果未在所述可擴(kuò)展比特流中信號發(fā)送所述至少一個特性,則分析該至少一個特性;將所述至少一個特性以及具有或不具有比特流中所述至少一個特性的所述可擴(kuò)展比特流存儲到根據(jù)文件格式規(guī)范的文件格式容器中。本發(fā)明的另一示例性實施方式公開了一種方法和設(shè)備,用于傳送可擴(kuò)展比特流的至少一個層,其中存在至少兩個可擴(kuò)展性層并且每個層的特征在于可以是不同于整個流的特性的至少一個特性的集合,例如FGS信息、ROI可擴(kuò)展性信息、子樣本可擴(kuò)展層信息、解碼依賴性信息以及初始參數(shù)設(shè)定,并且其中,該至少一個特性的集合針對不同于整個流的至少一個層而被信號發(fā)送,其中所述至少一個特性的集合的信號發(fā)送可以是在所述可擴(kuò)展比特流中或在包含所述可擴(kuò)展比特流的文件格式容器中。該設(shè)備包括第一組件,用于形成關(guān)于可用層的當(dāng)前信息或用于對至少一個接收器的集合進(jìn)行解碼和回放的備選,其中所述接收器可以劃分為至少一個接收器群組,每個接收器群組包括至少一個接收器;第二組件,用于從所述可用層中決定至少一個層,以根據(jù)關(guān)于接收器或接收器群組的請求和/或信息服務(wù)于接收器或接收器群組;以及第三組件,用于傳送和控制所述至少一個層至所述接收器或接收器群組。相比于早期設(shè)計,所提議的設(shè)計更加完整,這是由于附加地包括了下列可擴(kuò)展性信息類型感興趣區(qū)域(ROI)可擴(kuò)展性信息;緩沖器信息;精粒度可擴(kuò)展性(FGS)信息;子樣本可擴(kuò)展層信息;解碼依賴性信息以及初始參數(shù)設(shè)定。從隨后詳細(xì)描述中,本發(fā)明的其他特性和優(yōu)點將對本領(lǐng)域技術(shù)人員變得清楚明了。然而應(yīng)該理解的是,該詳細(xì)描述和具體示例盡管指示了本發(fā)明的優(yōu)選實施方式,但僅以示意而非限制性的方式給出。在本發(fā)明范圍內(nèi)可以做出很多改變和修改,而不偏離其實質(zhì),并且本發(fā)明包括所有的此類修改。當(dāng)參考隨后的詳細(xì)描述以及附圖時,本發(fā)明的前述優(yōu)點和特性將變得清楚明了,其中圖1是示意了可以應(yīng)用本發(fā)明的系統(tǒng)的示圖;圖2是示意了本發(fā)明示例性實施方式的針對可擴(kuò)展比特流的至少一個特性信息的集合的信號發(fā)送的示圖;圖3是示意了本發(fā)明示例性實施方式中編碼設(shè)備的示圖;圖4是示意了本發(fā)明示例性實施方式中轉(zhuǎn)換器設(shè)備的示圖;以及圖5是示意了本發(fā)明示例性實施方式中解碼器設(shè)備的示圖。具體實施方式在示例性實施方式中,本發(fā)明通過針對可擴(kuò)展比特流的一個層來信號發(fā)送與整個系統(tǒng)的特性有所不同的至少一個特性的集合而解決上述問題,所述特性例如是FGS信息、ROI可擴(kuò)展性信息、子樣本可擴(kuò)展層信息、解碼依賴性信息以及初始參數(shù)設(shè)定。所述至少一個特性的集合的信號發(fā)送可以是在所述可擴(kuò)展比特流中、在包含所述可擴(kuò)展比特流的文件格式容器中、或在用于傳送或控制所述可擴(kuò)展比特流的至少一個層的傳輸或控制協(xié)議中。涉及多媒體應(yīng)用的技術(shù)包括但不限于媒體編碼、存儲和傳輸。媒體類型包括語音、音頻、圖像、視頻、圖形以及時間文本。盡管在這里描述視頻編碼作為本發(fā)明的示例應(yīng)用,但本發(fā)明并不限于此。本領(lǐng)域技術(shù)人員將認(rèn)識到本發(fā)明可應(yīng)用于所有媒體類型而不僅僅是視頻。圖2示意了本發(fā)明示例性實施方式中針對可擴(kuò)展比特流200的每個層的至少一個特性信息的集合的信號發(fā)送。可擴(kuò)展比特流的每個層的特征在于針對該層而發(fā)送的至少一個特性信息的集合,從而允許選擇一個層以根據(jù)該至少一個特性信息的集合來解碼或傳輸。這些特征可以存儲在報頭204中。多個層202表示可擴(kuò)展比特流中的多個層。在本發(fā)明使用的第一示例中,對可擴(kuò)展比特流進(jìn)行編碼并存儲在流發(fā)送服務(wù)器中。每個層的至少一個特性信息的集合,例如精粒度可擴(kuò)展性信息、感興趣區(qū)域可擴(kuò)展性信息、子樣本或子圖片可擴(kuò)展層信息、解碼依賴性信息以及初始參數(shù)設(shè)定,可以在所存儲的文件中被信號發(fā)送。當(dāng)描述可用會話的時候,服務(wù)器可以為每個層或同一文件中可擴(kuò)展比特流的備選創(chuàng)建SDP(會話描述協(xié)議)描迷,根據(jù)SDP描述來進(jìn)行流發(fā)送回放。如果服務(wù)器對接收器能力沒有預(yù)先的了解,則有利的是從同一內(nèi)容創(chuàng)建多個SDP描述,這些描述則被稱為備選。然后客戶端可以拾取最佳地適合其能力的描述。在本發(fā)明使用的第二示例中,諸如在第一示例中描述的流被組播或廣播到多個終端。該組播/廣播服務(wù)器可以宣告所有的可用層或解碼以及回放備選,其中的每一個的特征在于精粒度可擴(kuò)展性信息、感興趣區(qū)域可擴(kuò)展性信息、子樣本或子圖片可擴(kuò)展層信息、解碼依賴性信息以及初始參數(shù)設(shè)定的組合。然后,客戶端可以從廣播/組播會話宣告中獲知是否有針對它的理想層,并選擇該理想層用于回放。在本發(fā)明使用的第三示例中,對于本地回放應(yīng)用,即使不能對整個發(fā)送的流進(jìn)行解碼,仍然可以對部分流進(jìn)行解碼并享用該部分流。圖3是示意了本發(fā)明示例性實施方式中編碼設(shè)備的示圖。編碼設(shè)備304接收原始數(shù)據(jù)流302。通過編碼器304的可擴(kuò)展數(shù)據(jù)編碼器306對數(shù)據(jù)流進(jìn)行編碼并生成一個或多個層。然后這些層通過信號發(fā)送組件308進(jìn)行發(fā)送。某些層已經(jīng)通過可擴(kuò)展數(shù)據(jù)編碼器306進(jìn)行了發(fā)送并且該信號發(fā)送組件將針對這種情況進(jìn)行檢查。編碼特性指示的數(shù)據(jù)流310從編碼器304輸出,從而允許接收設(shè)備(MMSC或解碼器)讀取信號以確定數(shù)據(jù)流的層的編碼特性。圖4是示意了本發(fā)明示例性實施方式中轉(zhuǎn)換器設(shè)備的示圖。該轉(zhuǎn)換器設(shè)備404在接收器406處接收可擴(kuò)展數(shù)據(jù)流402。接收器406還讀取與所接收數(shù)據(jù)流的層相關(guān)聯(lián)的編碼特性指示符。編碼特性比較器410將編碼特性指示符與數(shù)據(jù)流的目的網(wǎng)絡(luò)或解碼設(shè)備的已知能力進(jìn)行比較。通過該比較,確定目的地設(shè)備將能夠?qū)κ裁磳舆M(jìn)行解碼。然后在數(shù)據(jù)流修改器412中修改該數(shù)據(jù)流從而使得該數(shù)據(jù)流可由目的地設(shè)備進(jìn)行解碼。這可以包括從數(shù)據(jù)流中去除在元件410中確定的不能被目的地設(shè)備解碼的層。然后該修改后數(shù)據(jù)流由傳送器414進(jìn)行傳送。該修改后數(shù)據(jù)流416從目的地為接收設(shè)備(MMSC或解碼器)的轉(zhuǎn)換器404中輸出。圖5是示意了本發(fā)明示例性實施方式中解碼器的示圖。該解碼設(shè)備504在接收器506處接收編碼特性指示的數(shù)據(jù)流502。編碼特性識別器510指示所接收數(shù)據(jù)流中的一個或多個層以及它們相應(yīng)的編碼特性。基于至少一個層的編碼特性,解碼器能力檢驗器512確定該解碼器是否能夠?qū)υ搶舆M(jìn)行解碼。如果能夠,則其允許解碼組件514繼續(xù)對數(shù)據(jù)流的那層進(jìn)行解碼。如果不能,則其防止解碼組件514企圖對該層進(jìn)行解碼,從而避免解碼器的潛在沖突。在圖中示出的解碼后的數(shù)據(jù)流516從解碼器514中輸出。數(shù)據(jù)流中的信號發(fā)送優(yōu)選地,在圖片序列或圖片組(GOP)水平中發(fā)送層特征,例如通過序列或GOP報頭、序列參數(shù)設(shè)置、補充性增強信息(SEI)消息、用戶數(shù)據(jù)和其它序列水平語法。在JSVM1.0(JVT-N023)中,可擴(kuò)展性信息SEI被規(guī)定為幫助比特流提取器來分析該比特流的可擴(kuò)展性特性。當(dāng)SEI在JSVM1.0中時其對于JSVM參考軟件中的當(dāng)前SVC實現(xiàn)而言可能太特別。在下文中,提出了針對可擴(kuò)展性信息SEI的新語法,并且該語法支持隨后的系統(tǒng)水平操作而無需解析和分析成任何編碼的片段NAL單元(僅有的例外為基于子圖片可擴(kuò)展層的感興趣區(qū)域可擴(kuò)展性)-文件格式編輯器,用于將可擴(kuò)展性信息元數(shù)據(jù)寫入文件;-流發(fā)送服務(wù)器,用于將所有可能的可擴(kuò)展表達(dá)點提供給接收器;-比特流提取器,用于提取任何期望的可擴(kuò)展表達(dá)點;以及一可殺口々某體網(wǎng)元(media-awarenetworkelement)(侈寸長口網(wǎng)關(guān)),用于決定對于期望的可擴(kuò)展表達(dá)點來說將要拋棄哪些NAL單元(因此將不進(jìn)行傳送)。新語法示出在表1中并且進(jìn)行如下描述。當(dāng)然,對于本領(lǐng)域技術(shù)人員而言很明顯的是,其他方式的信號發(fā)送也是可行的,并且本發(fā)明并不限于具體的信號發(fā)送方法。類目(在表l中表示為C)規(guī)定了將片段數(shù)據(jù)劃分為至少三個片段數(shù)據(jù)劃分,并且描述符規(guī)定了對每個語法元素的解析處理。該類目和描述符在上述文檔"WorkingDraft1.0of14496-10:200x/AMDlScalableVideoCoding"中進(jìn)行了描述。<table>tableseeoriginaldocumentpage29</column></row><table><table>tableseeoriginaldocumentpage30</column></row><table>表1語義被進(jìn)行如下規(guī)定。當(dāng)存在的時候,此SEI消息將出現(xiàn)在IDR訪問單元中。該消息的語義有效直到同一類型的下一SEI消息為止。num_layers_minusl加1指示比特流所支持的可擴(kuò)展層或者表達(dá)點的數(shù)量。num—layers—minus1的值的范圍在0-255之間,0和255也包含在內(nèi)。每個可擴(kuò)展層與層ID相關(guān)聯(lián)。該層ID被如下指派。較大的層ID值指示較高的層。值0指示最低的層。層的解碼和表達(dá)獨立于任何較高的層但可以依賴于較低的層。因此,最低的層可以獨立地進(jìn)行解碼和表達(dá),解碼和表達(dá)層1可以依賴于層0,解碼和表達(dá)層2可以依賴于層0和層1,等等??蓴U(kuò)展層的表示要求可擴(kuò)展層本身以及可擴(kuò)展層直接或間接依賴的所有較低層的存在。在下文中,可擴(kuò)展層和該可擴(kuò)展層直接或間接依賴的所有較低層統(tǒng)一稱為可擴(kuò)展層表示。每個編碼圖片到可擴(kuò)展層的映射可以通過子序列信息SEI消息來發(fā)送。fgsjayer—flag[i]等于1指示的是層ID等于1的可擴(kuò)展層是精粒度可擴(kuò)展(FGS)層。值O指示的是可擴(kuò)展層不是FGS層。FGS層的編碼的片段NAL單元可以在任何字節(jié)對準(zhǔn)的位置處進(jìn)行截斷。由于NAL單元報頭和FGS片段的片段報頭的截斷和傳送并不提升品質(zhì),所以可能需要在比特流和/或在文件格式兩者中包括NAL單元報頭以及每個FGS片段的片段報頭的大小以及針對每個FGS層的最小有意義(meaningful)比特速率,以便不可知々某體網(wǎng)元進(jìn)行FGS。sub_pic_layer_flag[i]等于1指示的是層ID等于i的可擴(kuò)展層包括子圖片,每個子圖片包括訪問單元的編碼片段的子集。值O指示的是可擴(kuò)展層包括整個訪問單元。編碼圖片的每個子圖片對可擴(kuò)展層的映射可以通過子圖片層信息SEI消息進(jìn)行發(fā)送。sub_region_layer_flag[i]等于1指示的是層ID等于i的可擴(kuò)展層表示整個比特流所表示的整個區(qū)域的子區(qū)域。值0指示的是可擴(kuò)展層表示整個比特流所表示的整個區(qū)域。profile—level—infojresenUlag[i]等于1指示的是,在SEI消息中存在針對層ID等于i的可擴(kuò)展層的配置和水平信息。值0指示的是在SEI消息中不存在針對層ID等于i的可擴(kuò)展層的配置和水平信息。decoding—dependency—info_present_flag[i]等于1指示的是在SEI消息中存在針對層ID等于i的可擴(kuò)展層的解碼依賴性信息。值0指示的是在SEI消息中不存在針對層ID等于i的可擴(kuò)展層的解碼依賴性信息。bitrate—info_present_flag[i]等于1指示的是在SEI消息中存在針對層ID等于i的可擴(kuò)展層的比特速率信息。值0指示的是SEI消息中不存在針對層ID等于i的可擴(kuò)展層的比特速率信息。frm_rate—info_present—flag[i]等于1指示的是在SEI消息中存在針對層ID等于i的可擴(kuò)展層的幀速率信息。值0指示的是在SEI消息中不存在針對層ID等于i的可擴(kuò)展層的幀速率信息。frm_size—info_present—flag[i]等于1指示的是在SEI消息中存在針對層ID等于i的可擴(kuò)展層的幀大小信息。值0指示的是在SEI消息中不存在針對層ID等于i的可擴(kuò)展層的幀大小信息。layer—dependency—info_present—flag[i]等于1指示的是在SEI消息中存在針對層ID等于i的可擴(kuò)展層的層依賴性信息。值0指示的是在SEI消息中不存在針對層ID等于i的可擴(kuò)展層的層依賴性信息。init_parameter—sets—info_present—flag[i]等于1指示的是在SEI消息中存在針對層ID等于i的可擴(kuò)展層的初始參數(shù)設(shè)定信息。值0指示的是在SEI消息中不存在針對層ID等于i的可擴(kuò)展層的初始參數(shù)設(shè)定信阜、初始參數(shù)設(shè)定指的是可以在會話的開始處進(jìn)行傳送的那些參數(shù)設(shè)定。消息成分layer_profileidc[i]、layer—constraint—setO一flag[i]、layer—constraint—setl—flag[i]、layer_constraint_set2—flag[i]、layer—constraint一set3—flag[i]和layer—level一idc[i]指示的是層ID等于i的可擴(kuò)展層的表示的比特流的配置和水平一致性(compliancy)。layer_profile—idc[i]、layer一constraint—setO一flag[i]、layer—constraint—set1—flag[i]、layer—constraint_set2—flag[i]、layer一constraint一set3—flag[i]以及l(fā)ayer_level_idc[i]的i吾義分別與profile_idc、constraint—setO—flag、constraint一setl一flag、constraint—set2—flag、constraint—set2—flag和level-idc的語義一致,除非在這里目標(biāo)比特流是可擴(kuò)展層表示的比特流。dependencyjd[i]和temporaljevel[i]分別等于層ID等于i的可擴(kuò)展層中NAL單元中的Dependencyld和TemproalLevel。avg_bitrate[i]指示的是層ID等于i的可擴(kuò)展層的表示的比特流以每秒千比特為單位的平均比特速率。當(dāng)accurate—statistics—flag等于1的時候,avg—bitrate[i]的語義與在子序列層特征SEI消息中的average_bit—rate的語義一致,除非在這里目標(biāo)比特流是可擴(kuò)展層表示的比特流。在訪問單元去除時間的任何一個一秒鐘時間窗口中,max_bitrate[i]指示的是層ID等于i的可擴(kuò)展層的表示的比特流以每秒千比特為單位的最大比特速率。constant—frm—rate—idc[i]指示的是層ID等于i的可擴(kuò)展層的表示的幀速率是否是恒定的。如果下面規(guī)定的avg一frm—rate的值是恒定的,無論可擴(kuò)展表示的哪個時間部分用于計算,則該幀速率是恒定的,否則該幀速率是非恒定的。值0表示非恒定的幀速率。值1表示恒定的幀速率,值2表示的是不確定該幀速率恒定與否。constantFrameRate的數(shù)值范圍是0-2,其中包括0和2。avg—frm—rate[i]指示的是層ID等于i的可擴(kuò)展層的表示的幀速率以幀每秒為單位的平均幀速率。當(dāng)accurate—statistics—flag等于1的時候,avg—frm—rate[i]的語義與在子序列層特征SEI消息中的average_frame—rate的語義一致,除非在這里目標(biāo)比特流是可擴(kuò)展層表示的比特:流。frm—width—in_mbs—minus1[i]加上1指示的是層ID等于i的可擴(kuò)展層的表示中的編碼幀以宏塊為單位的最大寬度。frm—height—in—mbs—minusl[i]加上1指示的是層ID等于i的可擴(kuò)展層的表示中的編碼幀以宏塊為單位的最大高度。horizontal_offset[i]和verticial_offset[i]分別給出由層ID等于i的可擴(kuò)展層的表示所表示的矩形區(qū)域左上像素相對于整個比特流所表示的整個區(qū)域的左上像素的水平偏移和垂直偏移。單位是以最高空間解析度度量的luma樣本。region_width[i]和region_height[i]分別給出了由層ID等于i的可擴(kuò)展層的表示所表示的矩形區(qū)域的寬度和高度,單位是以最高空間解析度度量的luma樣本。num_directly—dependent—layers[i]指示的是層ID等于i的可擴(kuò)展層所直4妾依賴的可擴(kuò)展層的l丈量。num_directly—dependent—layers的值在范圍0-255之間,其中包括0和255。directly—dependent—layer—id—delta[i][j]指示的是層ID等于i的可擴(kuò)展層直接依賴的第j個可擴(kuò)展層的層ID與i之間的差異。直接依賴的可擴(kuò)展層的層ID等于(directy_dependent—layer_id—delta+i)。num—init—seq__parameter—set—minusl[i]力口1才旨示的是用于對層ID等于i的可擴(kuò)展層的表示進(jìn)行解碼的初始序列參數(shù)設(shè)定的數(shù)量。init_seq_parameter—set—id—delta[i][j]指示的是如果j等于0,其指示對層ID等于i的可擴(kuò)展層的表示進(jìn)行解碼的第j個初始序列參凄史i殳定的seq_parameter—set—id的值。如果j大于O,貝'Jinit—seq_parameter_set—id—delta[i][j]指示的是第j個初始序列參數(shù)設(shè)定的seq_parameter—set—id的值與第(j-1)個初始序列參數(shù)設(shè)定的seq_parameter—set—id的值之間的差。初始序列參數(shù)設(shè)定在邏輯上以seq_parameter—set_id值的升序4非歹廿。使用子序列信息SEI消息來發(fā)送訪問單元對可擴(kuò)展層的映射。在子序列信息SEI消息中的sub—seqjayer—num指示的是當(dāng)前訪問單元所屬的可擴(kuò)展層的層ID。為了將子圖片映射到可擴(kuò)展層,如表2中所示定義新的SEI消息。該設(shè)計非常簡單,但需要解析為圖片參數(shù)設(shè)定和片段以識別片段是否屬于運動受限的片段群組設(shè)定。可替換地,可以設(shè)計子圖片水平SEI來發(fā)送層ID。<table>tableseeoriginaldocumentpage34</column></row><table>表2當(dāng)存在的時候,此SEI消息將出現(xiàn)在包含運動受限片段群組設(shè)定SEI消息的同一SEI有效載荷中,并立刻以解碼次序接續(xù)(succeed)運動受限片段群組設(shè)定SEI消息。由運動受限片段群組設(shè)定SEI消息所標(biāo)識的該片段群組設(shè)定稱為子圖片層信息SEI消息的關(guān)聯(lián)片段群組設(shè)定。layer—id指示的是關(guān)聯(lián)片段群組設(shè)定中編碼片段NAL單元所屬的可擴(kuò)展層的層ID。又例如,通過使用序列參數(shù)設(shè)定和NAL單元報頭或片段報頭的隨后方法可以實現(xiàn)對信號發(fā)送的支持。以文件格式的信號發(fā)送由于下列任意一種原因,在比特流中可能不存在信號發(fā)送信息1)信號發(fā)送得不到編碼技術(shù)或標(biāo)準(zhǔn)的支持;2)信號發(fā)送得到支持但并不存在;3)文件格式規(guī)范不允許在包含于文件格式容器中的比特流中包括一些信息,例如AVC文件格式規(guī)范不允許在存儲于媒體軌跡中的數(shù)據(jù)流中包括三種類型的子序列SEI消息。因此,以文件格式對信息的信號發(fā)送進(jìn)行支持是非常重要的。實際上,即使信息以比特流的形式是可用的,使信息以文件格式可用對于認(rèn)識媒體編碼格式的服務(wù)器來說也是有幫助的。流,因此可以被認(rèn)為是對ISO基本媒體文件格式的擴(kuò)展。出于文件識別的目的,標(biāo)志'svcl,可用于指示該擴(kuò)展用于文件中。為了支持信號發(fā)送,ISO文件應(yīng)當(dāng)包含grouping_type等于scif的零個或一個SampleToGroupBox(每個軌跡)的示例。該SampleToGroupBox示例將每個樣本映射到一個或多個可擴(kuò)展層。針對每個可擴(kuò)展層的可擴(kuò)展性信息存儲在相應(yīng)的樣本群組描述條目(ScalabilitylnfoEntry)中,該樣本群組描述條目包含在群組類型'scif的SampleGroupDescriptionBox中??蓴U(kuò)展性信息包括層ID、配置和水平、比特速率、幀速率、緩沖器參數(shù)以及依賴性信息。而且,每個可擴(kuò)展層與層ID相關(guān)聯(lián)。該層ID按如下進(jìn)行分配。較大的層ID值指示較高的層。值0指示最低的層。層的解碼和表達(dá)獨立于任何較高的層但可以依賴于較低的層。因此,最低的層可以被獨立地解碼和表達(dá),而層1的表達(dá)和解碼依賴于層0,層2的表達(dá)和解碼可以依賴于層0和1,等等??蓴U(kuò)展層的表示要求可擴(kuò)展層自身以及該擴(kuò)展層直接或間接依賴的較低層的存在。在下文中,可擴(kuò)展層和該擴(kuò)展層直接或間接依賴的所有較低層統(tǒng)一稱為可擴(kuò)展層表示。ISO基礎(chǔ)媒體文件格式的擴(kuò)展的語法可以如下。ScalabilitylnfoEntry包括ProfileLevelBox、BitRateBox、FrameRateBox、FrameSizeBox、RectRegionBox、BufferingBox和LayerDependencyBox.。這些沖匡(Box)的定義如表3和表4所示BoxTypes:、pflv',、bitr',、frmr,,,fmsz',、rrgn',、buff',、ldep'Container:ScalabieLayerEntryorotherdata,structuresMandatory:NoQuantity:0or1表3ProfileLevelBox包含可擴(kuò)展層表示與之適應(yīng)的配置和水平,BitRateBox包含比特速率信息,F(xiàn)rameRateBox包含幀速率信息,F(xiàn)rameSizeBox包含空間解析度信息,BufferingBox包含緩沖器信息,LayerDependencyBox包含可擴(kuò)展層所依賴的那些層。在這些框中,BufferingBox是摘要框,從ISO基礎(chǔ)媒體文件格式中推導(dǎo)出的文件格式將根據(jù)視頻編碼標(biāo)準(zhǔn)所規(guī)定的緩沖模型來定義緩沖器信息數(shù)據(jù)結(jié)構(gòu)。對于特定的可擴(kuò)展層,如果任意的可選框不存在,則上述信息與最高可擴(kuò)展層相同。<formula>formulaseeoriginaldocumentpage36</formula>unsignedint(16)frm一heiglit;}classRectRegionBoxextendsBox(、rrgn"《unsignedint《16》fiorizontal—offset'*unsignedint(16^ve'rtical—offset,'unsignedintil6)region_widthu緣i諷edint(16》iregion—height'')abstractclassBufferingBoxextendsBox('buff*){classLayerDependencyBoxextendsBox《、1d'ep'){unsignedint《8)entry—countjfor<i0;i<entry一count;{unsigned.irvt(8>dependencyLayecId;}classScalableLayerEntry()extendsVisualSampleGroupEntry('scif"unsignedint(8)layei:工dfunsigiieciint(liIsFgsIiayer-unsignedint^l)IsSubsampleLayei:unsignedint<6>reserved謙0;ProfileLeve丄Box,'//optionalBitRateBox(》;;//optionalFrameRateBox()z〃optionalFraraeSizeBox《jf//optionalRectRegicmBox()/〃optionalBuffering'Box0z〃optionalLayerD鄰ende:ncyBox(》7//optional}表4語義如下。Layerld給出下列信息所描述的可擴(kuò)展層的標(biāo)識符。IsFgsLayer等于1指示的是可擴(kuò)展層是精粒度可擴(kuò)展(FGS)層,其比特流數(shù)據(jù)單元可以在任意字節(jié)對準(zhǔn)的位置處被截斷。值0指示的是可擴(kuò)展層不是FGS層。IsSubsampleLayer等于1指示的是可擴(kuò)展層僅由映射到該層的樣本的子樣本而形成。在子樣本信息框中信號發(fā)送該層中包含的子樣本的有關(guān)信息。值0指示的是可擴(kuò)展層由映射到該層的樣本來形成。Profileldc和levelldc分別規(guī)定了配置和水平,可擴(kuò)展層表示的比特流是與其適應(yīng)的。avgBitrate給出了可擴(kuò)展層表示的比特速率以比特/秒為單位的平均比特速率。maxBitrate給出了一秒鐘的任意時間窗口中可擴(kuò)展層表示的比特速率以比特/秒為單位的最大比特速率。constantFrameRate指示的是可擴(kuò)展層表示的幀速率是否恒定。如果下面失見定的FrameRate的值是恒定的,無論可擴(kuò)展層表示的哪個時間部分用于計算,則該幀速率是恒定的,否則該幀速率是非恒定的。值O表示非恒定的幀速率,值l表示恒定的幀速率,值2表示的是不確定該幀速率恒定與否。constantFrameRate的值的范圍是0-2,其中包括0和2。frameRate給出了以幀/(256秒)為單位的平均幀速率。在計算中將可擴(kuò)展層表示中的所有NAL單元納入了考慮。在下文中,C是可擴(kuò)展層表示中幀的數(shù)量,t!是按照表達(dá)次序的可擴(kuò)展層表示中第一圖片的表達(dá)時間戳,而t2是按照表達(dá)次序的可擴(kuò)展層表示中最后圖片的表達(dá)時間戳。然后,假設(shè)L-t2,則frameRate計算如下frameRate=round(C*256+^2-^))。如果m,則frameRate將是0。值0指示的是未規(guī)定的幀速率。frm—width和frm一height分別給出了可擴(kuò)展層表示的3見頻幀的、以luma樣本為單位的最大寬度和高度。術(shù)語"幀"的解釋方式和SVC編碼規(guī)范中的相同。horizontal—offset和vertical—offset分別給出了由可擴(kuò)展層表示所表示的矩形區(qū)域左上像素相對于由最高可擴(kuò)展層表示所表示的整個區(qū)域的左上像素以luma樣本為單位的垂直和水平偏移。region_width和region—height分別給出了由可擴(kuò)展層表示所表示的矩形區(qū)域的寬度和高度,單位是由最高可擴(kuò)展層表示所表示的整個區(qū)域的相同度量的luma樣本。entry—count給出了下表中條目的數(shù)量。dependencyLayerld給出了當(dāng)前可擴(kuò)展層直接或間接依賴的可擴(kuò)展層的layerld。該dependencyLayerld的值^!夸小于當(dāng)前可擴(kuò)展層的layerld。當(dāng)前可擴(kuò)展層的表示要求dependencyLayer所指示的可擴(kuò)展層的存在。在表5中表達(dá)了子樣本信息框的語法<table>tableseeoriginaldocumentpage39</column></row><table>表5在示例實施方式中,32比特預(yù)留字^^殳的前8比特用于信號發(fā)送子樣本所屬的可擴(kuò)展層標(biāo)識符,即上述最后的語法元素被劃分為兩個語法元素,如表6所示。unsignediM(g)la戸Id;unsignediitt(24)reserved=0;表6類似的方法也應(yīng)用于支持其他文件格式的信號發(fā)送。如果在ISO文件格式中得到支持,則其自然在推導(dǎo)出的文件格式(例如MPEG-4文件格式、AVC文件格式和3GPP文件格式)中得到支持。SVC文件格式(AVCFFAmd.2):在ISO基礎(chǔ)媒體文件格式中樣本定義如下在無暗示(non-hint)軌跡中,樣本是單個^L頻幀、視頻幀的時間連續(xù)系列或音頻的時間連續(xù)壓縮部分。在暗示軌跡中,樣本定義一個或多個流發(fā)送包的格式。在軌跡中沒有兩個樣本可以共享同一時間戳。在可擴(kuò)展視頻中,特別是對于空間和品質(zhì)的可擴(kuò)展性,關(guān)于在軌跡中沒有兩個樣本可以共享同一時間戳的上述限制不再適用,因為一個以上的圖片(例如基礎(chǔ)層圖片和空間增強層圖片)可以共享同一時間戳。如果這些圖片在同一樣本中形成,則對于服務(wù)器而言進(jìn)行可擴(kuò)展截斷是很不方便的,因為總是需要解析為樣本。在SVCWD1.0中,圖片的定義如下從一組具有一致值的圖片次序計數(shù)和D印endencyld的NAL單元中解碼出圖片。相應(yīng)的NAL單元將包括用于圖片的所有宏塊的片段NAL單元以及可能還包括漸進(jìn)修正(progressiverefinement)片段NAL單元。根據(jù)上述定義,漸進(jìn)修正片段(即FGS片段)處于與相應(yīng)的基礎(chǔ)層相同的圖片中。如果FGS片段和相應(yīng)的基礎(chǔ)層在同一樣本中形成,則對于服務(wù)器而言進(jìn)行可擴(kuò)展截斷是很不方便的,因為即使對于非FGS操作而言也需要解析為樣本。因此,在示例實施方式中,每個FGS增強面或相應(yīng)的基礎(chǔ)層被分離為其自己的圖片。子樣本被定義為一個樣本中一個或多個連續(xù)的NAL單元。ProfileLevelBox中預(yù)留字段的前8個比特用于包含配置兼容性信息,從而語法如下classProfiieltevslBcMcextendLsBox(、pflv'>■('unsignedint(16》profileldc;unsigned,int(16》levelldc,'unsignedint.Wprofile—compatibility,,unsignedint《24》reserved=■O'.表7Profile—compatibility是這樣的字節(jié),即其定義與序列參數(shù)設(shè)定中profile—idc和level—idc之間發(fā)生的字節(jié)的定義相同,如SVC一見頻-見范所定義。下列可擴(kuò)展性信息類型專用于SVC編碼格式-Dependencyld和TemporalLevel-所用的初始參數(shù)設(shè)定-緩沖器信息為了存儲該信息,可以定義一些新的框以包含該信息,并在需要的時候?qū)⑺鼈兎胖迷赟calabilitylnfoEntry中。BoxTypes:、ddep、,ipms、、sbufContainer:ScalsbileliayerEntryorotherdatastructuresMandatory:HoQuantity:0or1classDecodiiigDependencylnfoBoxextendsBox(,dd鄰"《unsignedint(3)dependency—id;unsignedint《3》temporal—levelf'unsignedint《2)reserved=0^}classInitialParainetei:SetBoxextendsBox《、ip師"{unsignedint(5)n讓0fSequenoeParainetei:Sets;!unsignedint:<3>reserved=0/for(i=0;i<numOfSequenceParameterSets;《unsignedint(16)sequencedarrameterSetljength-bit(8糴sequenceParameterSetl!ength》seguencePaxameterSetNALUnit,unsignedint(8>numQfPieturePairametGirSetSi;for(i=0/i<nuniOfPictureParameterSets,'{unsignedint(16)pictureParameterSetXength,'bit(各*picturePaucameteirSet:Length)pictureParameteirS經(jīng)tNA3UJnitclassSvcBufferingBoxextendsBufferingBox(、sbuf'Hunsignedint(16》operatioixjpoint—countfor《i=0,'i<operation_j>oint—GOunt;i++Mt^O^yte—rateunsignedint(32》unsignedint^32》unsignedint(32》unsignedint《32》signedint《32)cpb—sizedpb—sizeinit—qpb—1ayinit—dpb一de1ay表8語義如下dependency—id和temporal—level分別給出了SVC視頻規(guī)范中定義的Dependencyld和TemporalLevel的可擴(kuò)展層的值。numOfSequenceParameterSets指示的是用作序列參數(shù)設(shè)定的初始設(shè)定的序列參數(shù)設(shè)定的數(shù)量,以對可擴(kuò)展層表示進(jìn)行解碼。sequenceParameterSetLength指示的是在SVC視頻規(guī)范中定義的序列參數(shù)設(shè)定NAL單元的字節(jié)長度。sequenceParameterSetNALUnit包含SVC視頻規(guī)范所定義的序列參數(shù)設(shè)定NAL單元。序列參數(shù)設(shè)定將以具有允許的間隙的參數(shù)設(shè)定標(biāo)識符的升序發(fā)生。numOfPictureParameterSets指示的是用作圖片參數(shù)設(shè)定的初始設(shè)定的圖片參數(shù)設(shè)定的數(shù)量,以對可擴(kuò)展層表示進(jìn)行解碼。picturePammeterSetLength指示的是SVC視頻規(guī)范中定義的圖片參數(shù)設(shè)定NAL單元的字節(jié)長度。pictureParameterSetNALUnit包含SVC視頻規(guī)范所定義的圖片參數(shù)設(shè)定NAL單元。圖片參數(shù)設(shè)定將以具有允許的間隙的參數(shù)設(shè)定標(biāo)識符的升序發(fā)生。operationjx)intj:ount規(guī)定了操作點的數(shù)量。SVCHRD參數(shù)的值針對每個操作點而被單獨規(guī)定。operation_point_count的值將大于0。tx—byte_rate指示的是對SVCHRD的編碼圖片緩沖器(CPB)的輸入字節(jié)速率(單位為字節(jié)每秒)??蓴U(kuò)展層表示的比特流受到BitRate值的限制,該BitRate值等于8*SVC視頻規(guī)范中所規(guī)定的針對NALHRD參數(shù)的tx—byte—rate的值。對于VCLHRD參數(shù),BitRate的值等于tx—byte—rate*40/6。tx—byte—rate的值4夸大于0。cpb—size給出了編碼的圖片緩沖器以字節(jié)為單位的所需大小。可擴(kuò)展層表示的比特流受到CpbSize值的限制,該CbpSize值對于SVC視頻規(guī)范中規(guī)定的針對NALHRD參數(shù)等于cpb—size*8。對于VCLHRD參數(shù),CpbSize的值等于cpb_size*40/6。dpb—size給出了解碼的圖片緩沖器以字節(jié)為單位的所需大小。可擴(kuò)展層表示的比特流受到max—dec一framejuffering值的限制,該值等于Min(16,Floor(post—dec—buf_size)/(PicWidthMbs*FrameHeightInMbs*256*ChromaFormatFactor))),如SVC^L頻頭見范所^見定。同一操作點的tx_byte_rate,cpb—size和dpb—size值的至少一個i殳定將遵循可擴(kuò)展層表示的比特流的配置和水平所設(shè)定的限制。init—cpb—delay給出了第一訪問單元的第一比特的預(yù)解碼器緩沖器中的到達(dá)時間與第一訪問單元的預(yù)編碼器緩沖器中的移除時間之間的所需延遲。其以90kHz時鐘為單位??蓴U(kuò)展層表示的比特流受到第一訪問單元從編碼的圖片緩沖器(CPB)中標(biāo)稱移除時間值tr,n(O)的限制,其中tr,n(0)等于SVC視頻規(guī)范中所規(guī)定的init—cpb—delay。init—dpb一delay給出了在第一解碼的圖片的后置解碼器緩沖器中的到達(dá)時間與從第一解碼的圖片的后置解碼器緩沖器中的輸出時間之間的所要求的延遲。其以90kHz時鐘為單位。針對輸出次序等于init—dpb_delay的第一解碼的圖片,可擴(kuò)展層表示的比特流受到dpb—output—delay的值的限制,其中init—dpb—delay如在假設(shè)時鐘周期變量tc等于1/90000的SVC視頻規(guī)范所規(guī)定。下面,給出以文件格式或比特流來存儲可擴(kuò)展性信息的一些動機(jī)。選的,因為如果不這樣的話,對于一個可擴(kuò)展流而言可能會有數(shù)百個軌跡。將樣本/圖片映射到可擴(kuò)展層是分組概念。該樣本群組設(shè)計提供了一種良好的方式來信號發(fā)送映射信息以及可擴(kuò)展層的可擴(kuò)展性層信息。在很多應(yīng)用中,可擴(kuò)展層的可擴(kuò)展性信息的某些部分與整個基本流或最高可擴(kuò)展層完全相同。通過在不同的可選框中將可擴(kuò)展性信息歸類和信號發(fā)送,那些信息部分不需要進(jìn)行冗余存儲。此外,以下列方式使用框是很靈活的即如果需要更多的可擴(kuò)展性信息,則通過在樣本群組描述條目中產(chǎn)生新框而可以很好地將這些信息包括進(jìn)來。假設(shè)流發(fā)送服務(wù)器已經(jīng)存儲了配置P和水平L的可擴(kuò)展流,流的可擴(kuò)展層可以是配置PI和Ll,適合于L1@P1的解碼器的實現(xiàn)要求比適合于L@P的解碼器簡單。如果該服務(wù)器將要把視頻內(nèi)容饋送到具有適合于L1@P1的解碼器的客戶端,則該服務(wù)器必須檢查該流是否存在適合于L1⑨P1的可擴(kuò)展層,例如通過運行假設(shè)參考解碼器,這對流發(fā)送服務(wù)器施加了附加的實現(xiàn)和計算復(fù)雜性。針對每個可擴(kuò)展層使得配置和水平信息得以信號發(fā)送支持了上述具有更簡化的服務(wù)器實現(xiàn)的應(yīng)用。對于比特速率、時間和空間可擴(kuò)展性而言自然需要比特速率、幀速率和幀大小信息。該區(qū)域信息可用于支持如N6880中所要求的感興趣區(qū)域(ROI)可擴(kuò)展性。對不同可擴(kuò)展層表示進(jìn)行解碼要求不同的緩沖器大小和緩沖延遲。緩沖器信息的存在使得可擴(kuò)展層表示的接收器/解碼器能夠分配較少的存儲器用于解碼或能夠具有較短的初始延遲,這兩者均有助于改進(jìn)最終用戶的體驗。盡管已知對于特定的可擴(kuò)展層表示而言不需要所有的較高層,但默認(rèn)情況下并不知道不需要哪些較低層。層依賴性信息使得流發(fā)送服務(wù)器能夠在不分析流的情況下不發(fā)送不必要的較低層,這要求復(fù)雜的實現(xiàn)。為了支持精粒度可擴(kuò)展性。該信息指示該可擴(kuò)展層是否是精粒度可擴(kuò)展(FGS)層,其比特流數(shù)據(jù)單元可以在任何字節(jié)對準(zhǔn)的位置處截斷??梢允褂肁VC中常規(guī)的編碼技術(shù)(即,并非新的SVC擴(kuò)展)來實現(xiàn)ROI可擴(kuò)展性,例如通過使用運動受限的片段群組設(shè)定。然而,要求在于(在N6880的第4部分中)SVC文件格式應(yīng)當(dāng)與AVC文件格式向后兼容。為了滿足該要求并同時支持ROI可擴(kuò)展性,需要子樣本信息,因為基礎(chǔ)層(ROI區(qū)域)和增強層(其余區(qū)域)必須處于相同樣本中。因此,子圖片層可用于此目的。解碼依賴性信息包含在可擴(kuò)展擴(kuò)展層NAL單元的NAL單元報頭中。在某些應(yīng)用中,期望的是讓可知々某體網(wǎng)元或接收器知道可以拋棄哪些可擴(kuò)展層的信息。為了幫助可知媒體網(wǎng)元或接收器拋棄不必要的NAL單元,需要解碼依賴性信息和可擴(kuò)展層標(biāo)識符之間的映射。由于可擴(kuò)展層表示可以不使用整個流的所有初始參數(shù)設(shè)定是事實,所以傳送所有的那些參數(shù)設(shè)定會S1起傳輸帶寬浪費和較長的初始設(shè)定延遲,特別是由于通常初始參數(shù)設(shè)定在帶外進(jìn)行可靠的傳輸,這意味著使用了接收應(yīng)答并且可以使用重新傳輸。針對每個可擴(kuò)展層表示的初始參數(shù)設(shè)定的信號發(fā)送解決了此問題。對于服務(wù)器而言還可以通過分析比特流來獲取該信息。然而,這要求服務(wù)器是可知媒體的并且進(jìn)4亍即時(on-the-fly)的比特流分析。在傳輸和控制協(xié)議中的信號發(fā)送在單播流發(fā)送例如3GPPPSS中,服務(wù)器可以通過多個SDP描述,其中每個SDP描述包含一個或多個備選,或通過包含多個備選的一個SDP描述,并基于可擴(kuò)展性信息來創(chuàng)建用于同一流的多個備選。接收終端選擇一個備選或不選擇。如果選擇了一個備選,則月艮務(wù)器知道將要傳送哪些層。在組播/廣播應(yīng)用中,可以有具有不同能力和/或處于不同網(wǎng)絡(luò)狀況的接收終端,其結(jié)果是流的不同備選對于不同的接收終端是理想的。在此情況下,可能的是將接收器劃分為不同的組播/廣播群組,并且每個群組中的接收器共享相同的備選。使用該方法,對每個接收終端可用的帶寬可以得到有效利用。對于其中所有接收器共享同一備選的組播/廣播群組而言,類似于單播情況,從服務(wù)器傳送相關(guān)的層。然而,如果有一個以上的組播/廣播群組,則服務(wù)器應(yīng)當(dāng)通過服務(wù)宣告來表達(dá)什么備選是可用的,從而每個接收器可以選擇一個備選的服務(wù)來訂制。這例如可以通過以類似于單播情況下的方式使用SDP來實現(xiàn)。還可能的是,在一個特定的組播/廣播群組中,傳送具有多個層的一個備選,同時接收器選擇解碼其中的一個層并拋棄其余數(shù)據(jù)。使用該方法,用于發(fā)送設(shè)備的可用帶寬可以得到有效利用,因為傳送了較少的流。在此情況下,利用相同的組播/廣播群組,服務(wù)器不需要知道不同接收終端的不同優(yōu)選項。然而,對于服務(wù)器而言,仍然有必要通過服務(wù)器宣告來表達(dá)備選信息,從而該接收器可以得出其是否能夠?qū)θ我鈧溥x進(jìn)行解碼的結(jié)論。上述的兩個方法可一起應(yīng)用。亦即,可以具有多個組播/廣播群組。在某些群組中,所有的接收器可以解碼相同的備選,而在其他群組中,某些接收器可以拋棄某些接收到的比特流層。該結(jié)合的方法可用于全局地優(yōu)化服務(wù)器中可用帶寬的效率以及接收器中可用帶寬的效率兩者。如上所述,本發(fā)明范圍內(nèi)的實施方式包括程序產(chǎn)品,該程序產(chǎn)品包括計算機(jī)可讀介質(zhì),用于攜帶或具有存儲于其上的計算機(jī)可執(zhí)行指令或數(shù)據(jù)結(jié)構(gòu)。此計算機(jī)可讀介質(zhì)可以是任何能夠被通用計算機(jī)或?qū)S糜嬎銠C(jī)訪問的可用介質(zhì)。例如,此計算機(jī)可讀介質(zhì)可以包括RAM、ROM、EPROM、EEPROM、CD-ROM或其他光盤存儲、磁盤存儲或其他磁性存儲設(shè)備,或任何其他能夠用于以計算機(jī)可執(zhí)行指令或數(shù)據(jù)結(jié)構(gòu)的方式攜帶或存儲期望的程序代碼并且可以由通用計算機(jī)或?qū)S糜嬎銠C(jī)訪問的介質(zhì)。當(dāng)通過網(wǎng)絡(luò)或其他通信連接(有線、無線或有線或無線的組合)來傳輸或提供信息到計算機(jī)的時候,計算機(jī)適當(dāng)?shù)貙⒃撨B接視為計算機(jī)可讀介質(zhì)。因此,任何此類連接可以被適當(dāng)?shù)胤Q為計算機(jī)可讀介質(zhì)。以上的組合可以包括在計算機(jī)可讀介質(zhì)的范圍之中。計算機(jī)可執(zhí)行指令包括例如使通用計算機(jī)、專用計算機(jī)或?qū)S锰幚碓O(shè)備執(zhí)行特定功能或功能組的指令和數(shù)據(jù)。可以應(yīng)用本發(fā)明的系統(tǒng)的示例在圖1中示出。該系統(tǒng)包括傳送服務(wù)器101,其具有例如存儲介質(zhì)102,該存儲介質(zhì)102包含文件103,該文件103包含根據(jù)本發(fā)明進(jìn)行編碼的媒體流。文件103作為一個或多個信號被傳送至例如移動通信網(wǎng)絡(luò)的網(wǎng)絡(luò)104。在網(wǎng)絡(luò)104中,可以具有網(wǎng)關(guān)105,其例如在MMSC107的控制下接收文件103并將其轉(zhuǎn)發(fā)到例如網(wǎng)絡(luò)的基站106。接收器108可以接收一個或多個信號并對可擴(kuò)展性信息以及一個或多個信號中包括的一些其他信息進(jìn)行解碼。本發(fā)明以方法步驟地一般上下文來進(jìn)行描述,其在一個實施方式中可以通過包括可由聯(lián)網(wǎng)環(huán)境中的計算機(jī)執(zhí)行的計算機(jī)可執(zhí)行指令(例如程序代碼)的程序產(chǎn)品來實現(xiàn)。通常,程序模塊包括例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等等,它們執(zhí)行特定的任務(wù)或?qū)崿F(xiàn)特定的抽象數(shù)據(jù)類型。與數(shù)據(jù)結(jié)構(gòu)相關(guān)聯(lián)的計算機(jī)可執(zhí)行指令以及程行指令或相關(guān)數(shù)據(jù)結(jié)構(gòu)的特定序列表^用于實現(xiàn)此步驟中所述:能的相應(yīng)動作。本發(fā)明的軟件和web實現(xiàn)可以通過具有基于規(guī)則邏輯和其他邏輯的標(biāo)準(zhǔn)編程技術(shù)來完成,以完成各種數(shù)據(jù)庫搜索步驟、相關(guān)步驟、比較步驟以及決定步驟。還需要注意的是,這里所使用的以及權(quán)利要求中的單詞"組件"和"模塊"旨在包括使用一行或多行軟件代碼的實現(xiàn),和/或硬件實現(xiàn),和/或用于接收手動輸入的設(shè)備。已經(jīng)就示意和描述的目的而給出了本發(fā)明實施方式的以上描述。并不旨在于窮盡或?qū)⒈景l(fā)明限制在所公開的精確形式,并且,著眼于上述教導(dǎo)的修改和變化也是可行的,或者可以從本發(fā)明的實踐中獲取。所選擇和描述的實施方式旨在解釋本發(fā)明的原理及其實際應(yīng)用,以使得本領(lǐng)域技術(shù)人員能夠在各種實施方式中利用本發(fā)明并具有各種適合于預(yù)期的特定使用的修改。例如,本發(fā)明實施方式的描述大多針對時間上的可擴(kuò)展性進(jìn)行了表達(dá)。然而,其適用于各種類型的可擴(kuò)展性,例如空間可擴(kuò)展性、計算可擴(kuò)展性、品質(zhì)(信噪比)可擴(kuò)展性。此外,很多傳輸協(xié)議可應(yīng)用于本發(fā)明。傳輸協(xié)議的一些非限制性示例是會話描述協(xié)議(SDP)、實時流發(fā)送協(xié)議(RTSP)以及會話發(fā)起協(xié)議(SIP)。權(quán)利要求1.一種用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的方法,所述方法包括生成所述可擴(kuò)展數(shù)據(jù)流的至少一個層,其中所述至少一個層的特征在于編碼特性,其中所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參數(shù)設(shè)定,并且信號發(fā)送具有所述特性化編碼特性的所述至少一個層,使得其可由解碼器讀取而無需對整個層進(jìn)行解碼。2.根據(jù)權(quán)利要求1所述的用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的方法,其中,所述信號發(fā)送在所述可擴(kuò)展數(shù)據(jù)流的比特流中執(zhí)行。3.根據(jù)權(quán)利要求1所述的用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的方法,其中,所述信號發(fā)送在能夠存儲所述可擴(kuò)展數(shù)據(jù)流的文件格式中執(zhí)行。4.根據(jù)權(quán)利要求1所述的用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的方法,其中,所述信號發(fā)送至少根據(jù)下表形成<table>tableseeoriginaldocumentpage3</column></row><table>5.根據(jù)權(quán)利要求1所述的用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的方法,其中,所述信號發(fā)送在能夠傳送所述可擴(kuò)展數(shù)據(jù)流的傳輸協(xié)議中執(zhí)行。6.根據(jù)權(quán)利要求5所述的用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的方法,其中,所述傳輸協(xié)議是下列的群組之一會話描述協(xié)議(SDP)、實時流發(fā)送協(xié)議(RTSP)以及會話發(fā)起協(xié)議(SIP)。7.—種用于對包括具有編碼特性的至少一個層的可擴(kuò)展數(shù)據(jù)流進(jìn)4亍編碼的方法,所述方法包括接收所述可擴(kuò)展數(shù)據(jù)流的至少一個層,其中,所述至少一個層的特征在于編碼特性,其中,所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參數(shù)設(shè)定,并且信號發(fā)送具有所述特性化編碼特性的所述至少一個層,使得其可由解碼器讀取而無需對整個層進(jìn)行解碼,其中所述方法進(jìn)一步包括-檢查至少一個層的所述編碼特性;-在所述檢查的基礎(chǔ)上確定對該層進(jìn)行解碼是否可行;如果確定該解碼是可行的;則—對所述至少一個層進(jìn)行解碼。8.根據(jù)權(quán)利要求7所述的用于對包括具有編碼特性的至少一個層的可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼的方法,所述信號發(fā)送已經(jīng)在所述可擴(kuò)展數(shù)據(jù)流的數(shù)據(jù)流中執(zhí)行,其中,所述檢查包括檢查所述比特流。9.根據(jù)權(quán)利要求7所述的用于對包括具有編碼特性的至少一個層的可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼的方法,所述信號發(fā)送已經(jīng)在能夠存儲所述可擴(kuò)展數(shù)據(jù)流的文件格式中執(zhí)行,其中,所述檢查包括檢查所述存儲的可擴(kuò)展數(shù)據(jù)流。10.根據(jù)權(quán)利要求7所述的用于對包括具有編碼特性的至少一個層的可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼的方法,其中,所述信號發(fā)送至少包括根據(jù)下列語法形成的數(shù)據(jù),<table>tableseeoriginaldocumentpage5</column></row><table><image>imageseeoriginaldocumentpage6</image>a,i錢ttpicpara堪eterM咖in狄sUfor(j鵬0;J《eiujirLpiepmOT說^setmfaiuslUJ++)mitpicparametersetWdelta〖i〗〖j〗》11.根據(jù)權(quán)利要求7所述的用于對包括具有編碼特性的至少一個層的可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼的方法,其中,所述信號發(fā)送在能夠傳送所述可擴(kuò)展數(shù)據(jù)流的傳輸協(xié)議中執(zhí)行。12.根據(jù)權(quán)利要求11所述的用于對包括具有編碼特性的至少一個層的可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼的方法,其中,所述傳輸協(xié)議是下列的群組之一會話描述協(xié)議(SDP)、實時流發(fā)送協(xié)議(RTSP)以及會話發(fā)起協(xié)議(SIP)。13.根據(jù)權(quán)利要求11所述的用于對包括具有編碼特性的至少一個層的可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼的方法,所述信號發(fā)送包括緩沖器信息,其中所述方法包括-檢查所述緩沖器信息以確定將要為解碼而分配的存儲器數(shù)量;以及-分配該確定的存儲器數(shù)量。14.一種用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的編碼器,所述編碼器包括第一組件,用于生成所述可擴(kuò)展數(shù)據(jù)流的至少一個層,其中所述至少一個層的特征在于編碼特性,其中所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參數(shù)設(shè)定;以及第二組件,用于信號發(fā)送具有所述特性化編碼特性的所述層,使得其可由解碼器讀取而無需對整個層進(jìn)行解碼。15.根據(jù)權(quán)利要求14所述的用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包6括具有不同編碼特性的層的編碼器,其中,所述第二組件被配置為使得所述信號發(fā)送在所述可擴(kuò)展數(shù)據(jù)流的比特流中執(zhí)行。16.根據(jù)權(quán)利要求14所述的用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的編碼器,其中,所述第二組件被配置為使得所述信號發(fā)送在能夠存儲所述可擴(kuò)展數(shù)據(jù)流的文件格式中執(zhí)行。17.根據(jù)權(quán)利要求14所述的用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的編碼器,其中,所述第二組件被配置為使得所述信號發(fā)送在能夠傳送所述可擴(kuò)展數(shù)據(jù)流的傳輸協(xié)議中執(zhí)行。18.根據(jù)權(quán)利要求14所述的用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的編碼器,其中,所述數(shù)據(jù)流包括視頻數(shù)據(jù)。19.一種用于對包括具有不同編碼特性的層的可擴(kuò)展數(shù)據(jù)流進(jìn)行解碼的解碼器,所述解碼器包括第一組件,用于接收所述可擴(kuò)展數(shù)據(jù)流;第二組件,用于識別所述可擴(kuò)展數(shù)據(jù)流中的至少一個層,并讀取與所述層相關(guān)聯(lián)的其編碼特性的指示,其中,所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參數(shù)設(shè)定;第三組件,用于確定所述解碼器是否能夠基于所述編碼特性來解碼所述層;以及第四組件,用于如果所述第三組件確定所述解碼器能夠基于所述編碼特性來解碼所述層,則對所述層進(jìn)行解碼。20.根據(jù)權(quán)利要求19所述的用于對包括具有不同編碼特性的層的可擴(kuò)展數(shù)據(jù)流進(jìn)行解碼的解碼器,其中,所述數(shù)據(jù)流包括視頻數(shù)據(jù)。21.—種用于實現(xiàn)可擴(kuò)展數(shù)據(jù)流的數(shù)據(jù)結(jié)構(gòu),包括第一數(shù)據(jù)層,具有第一編碼特性,其中所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參數(shù)設(shè)定;第一指示,與所述第一層相關(guān)聯(lián),以識別所述第一編碼特性;第二數(shù)據(jù)層,具有第二編碼特性;以及第二指示,與所述第二層相關(guān)聯(lián),以識別所述第二編碼特性。22.根據(jù)權(quán)利要求21所述的用于實現(xiàn)可擴(kuò)展數(shù)據(jù)流的數(shù)據(jù)結(jié)構(gòu),其中,所述第一指示與所述可擴(kuò)展數(shù)據(jù)流的比特流相關(guān)聯(lián)。23.根據(jù)權(quán)利要求21所述的用于實現(xiàn)可擴(kuò)展數(shù)據(jù)流的數(shù)據(jù)結(jié)構(gòu),其中,所述第一指示與能夠存儲所述可擴(kuò)展數(shù)據(jù)流的文件格式相關(guān)聯(lián)。24.根據(jù)權(quán)利要求21所述的用于實現(xiàn)可擴(kuò)展數(shù)據(jù)流的數(shù)據(jù)結(jié)構(gòu),其中,所述第一指示與能夠傳送所述可擴(kuò)展數(shù)據(jù)流的傳輸協(xié)議相關(guān)聯(lián)。25.根據(jù)權(quán)利要求21所述的用于實現(xiàn)可擴(kuò)展數(shù)據(jù)流的數(shù)據(jù)結(jié)構(gòu),其中,所述可擴(kuò)展數(shù)據(jù)流包括視頻數(shù)據(jù)。26.—種用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的程序產(chǎn)品,所述程序產(chǎn)品包括機(jī)器可讀程序代碼,用于在執(zhí)行的時候使一個或多個設(shè)備執(zhí)行下列步驟生成所述可擴(kuò)展數(shù)據(jù)流的至少一個層,其中所述至少一個層的特征在于編碼特性,其中所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參數(shù)設(shè)定;并且信號發(fā)送具有所述特性化編碼特性的所述至少一個層,使得其可由解碼器讀取而無需對整個層進(jìn)行解碼。27.根據(jù)權(quán)利要求26所述的用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的程序產(chǎn)品,其中,所述信號發(fā)送在所述可擴(kuò)展數(shù)據(jù)流的比特流中執(zhí)行。28.根據(jù)權(quán)利要求26所述的用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的程序產(chǎn)品,其中,所述信號發(fā)送在能夠存儲所述可擴(kuò)展數(shù)據(jù)流的文件格式中執(zhí)行。29.根據(jù)權(quán)利要求26所述的用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的程序產(chǎn)品,其中,所述信號發(fā)送在能夠傳送所述可擴(kuò)展數(shù)據(jù)流的傳輸協(xié)議中執(zhí)行。30.根據(jù)權(quán)利要求26所述的用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的程序產(chǎn)品,其中,所述數(shù)據(jù)流包括視頻數(shù)據(jù)。31.—種用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的設(shè)備,所述設(shè)備包括用于生成所述可擴(kuò)展數(shù)據(jù)流的至少一個層的裝置,其中所述至少一個層的特征在于編碼特性,該編碼特性不同于所述可擴(kuò)展數(shù)據(jù)流的編碼特性,其中所述至少一個層的所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參數(shù)設(shè)定;以及用于信號發(fā)送具有所述特性化編碼特性的所述層的裝置,使得其可由解碼器讀取而無需對整個層進(jìn)行解碼。32.根據(jù)權(quán)利要求31所述的用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的設(shè)備,其中,所述信號發(fā)送在所述可擴(kuò)展數(shù)據(jù)流的比特流中執(zhí)行。33.根據(jù)權(quán)利要求31所述的用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的設(shè)備,其中,所述信號發(fā)送在所述可擴(kuò)展數(shù)據(jù)流的文件格式中執(zhí)行。34.根據(jù)權(quán)利要求31所述的用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的設(shè)備,其中,所述信號發(fā)送在所述可擴(kuò)展數(shù)據(jù)流的傳輸協(xié)議中執(zhí)行。35.根據(jù)權(quán)利要求31所述的用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的設(shè)備,其中,所述數(shù)據(jù)流包括視頻數(shù)據(jù)。36.—種用于修改包括層的可擴(kuò)展數(shù)據(jù)流以便于進(jìn)行解碼的轉(zhuǎn)換器,所述轉(zhuǎn)換器包括第一組件,用于接收所述數(shù)據(jù)流并讀取與所述數(shù)據(jù)流的層相關(guān)聯(lián)的編碼特性指示符,其中,所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參數(shù)設(shè)定;以及第二組件,用于將所述編碼特性指示符與目的地解碼器的能力進(jìn)行比較,以確定該目的地解碼器可對哪些層進(jìn)行解碼;第三組件,用于修改所述數(shù)據(jù)流使得可由該目的地解碼器進(jìn)行解碼;以及第四組件,用于將所述修改后的數(shù)據(jù)流傳送至該目的地解碼器。37.根據(jù)權(quán)利要求36所述的用于修改包括層的可擴(kuò)展數(shù)據(jù)流以便于進(jìn)行解碼的轉(zhuǎn)換器,其中,所述第三組件被配置為移除不可由該目的地解碼器解碼的所述數(shù)據(jù)流的層。38.根據(jù)權(quán)利要求1所述的方法,其中,所述至少一個層是增強層。39.根據(jù)權(quán)利要求14所述的編碼器,其中,所述至少一個層是增強層。40.根據(jù)權(quán)利要求19所述的解碼器,其中,所述至少一個層是增強層。41.根據(jù)權(quán)利要求21所述的數(shù)據(jù)結(jié)構(gòu),其中,所述至少一個層是增強層。42.根據(jù)權(quán)利要求26所述的程序產(chǎn)品,其中,所述至少一個層是增強層。43.根據(jù)權(quán)利要求31所迷的設(shè)備,其中,所述至少一個層是增強層。44.根據(jù)權(quán)利要求37所述的轉(zhuǎn)換器,其中,所述至少一個層是增強層。45.—種用于對包括具有不同編碼特性的層的可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼的編碼器,所述編碼器包括用于生成所述可擴(kuò)展數(shù)據(jù)流的至少一個層的裝置,其中所述至少一個層的特征在于編碼特性,其中所述編碼特性包括下列中至少其-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參數(shù)設(shè)定;以及用于信號發(fā)送具有所述特性化編碼特性的所述層,使得其可由解碼器讀取而無需對整個層進(jìn)行解碼的裝置。46.—種用于在解碼器中對可擴(kuò)展數(shù)據(jù)流進(jìn)行解碼的方法,所述數(shù)據(jù)流包括具有不同編碼特性的層,所述方法包括接收所述可擴(kuò)展數(shù)據(jù)流;識別所述可擴(kuò)展數(shù)據(jù)流中的至少一個層,并讀取與所述層相關(guān)聯(lián)的其編碼特性的指示,其中,所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及—初始參lti殳定;確定所述解碼器是否能夠基于所述編碼特性來解碼所述層;以及如果確定所述解碼器能夠基于所述編碼特性來解碼所述層,則對所述層進(jìn)行解碼。47.—種對包括具有不同編碼特性的層的可擴(kuò)展數(shù)據(jù)流進(jìn)行解碼的解碼器,所述設(shè)備包括用于接收所述可擴(kuò)展數(shù)據(jù)流的裝置;用于識別所述可擴(kuò)展數(shù)據(jù)流中的至少一個層,并讀取與所述層相關(guān)聯(lián)的其編碼特性的指示的裝置,其中,所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參數(shù)設(shè)定;用于確定所述解碼器是否能夠基于所述編碼特性來解碼所述層的裝置;以及用于如果所述第三組件確定所述解碼器能夠基于所述編碼特性來解碼所述層,則對所述層進(jìn)行解碼的裝置。48.—種包括解碼器的設(shè)備,該解碼器用于對包括具有不同編碼特性的層的可擴(kuò)展數(shù)據(jù)流進(jìn)行解碼,所述設(shè)備包括接收器,適用于接收所述可擴(kuò)展數(shù)據(jù)流;識別器,適用于識別所述可擴(kuò)展數(shù)據(jù)流中的至少一個層,并讀取與所述層相關(guān)聯(lián)的其編碼特性的指示,其中,所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參數(shù)設(shè)定;以及確定器,適用于確定所述解碼器是否能夠基于所述編碼特性來解碼所述層;其中,所述解碼器適用于如果所述確定器確定所述解碼器能夠基于所述編碼特性來解碼所述層,則對所述層進(jìn)行解碼。49.一種用于將可擴(kuò)展數(shù)據(jù)流傳送到接收器的系統(tǒng),所述系統(tǒng)包括編碼器,用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層,所述編碼器包括第一組件,用于生成所述可擴(kuò)展數(shù)據(jù)流的至少一個層,其中所述至少一個層的特征在于編碼特性,其中所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參數(shù)設(shè)定;以及第二組件,用于信號發(fā)送具有所述特性化編碼特性的所述層,使得其可由解碼器讀取而無需對整個層進(jìn)行解碼;解碼器,用于對包括具有不同編碼特性的層的可擴(kuò)展數(shù)據(jù)流進(jìn)行解碼,所述解碼器包括第五組件,用于接收所述可擴(kuò)展數(shù)據(jù)流;讀取與所述層相關(guān)聯(lián)的其編碼特性的指示,其中,所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參數(shù)設(shè)定;第七組件,用于確定所述解碼器是否能夠基于所述編碼特性來解碼所述層;以及第八組件,用于如果所述第七組件確定所述解碼器能夠基于所述編碼特性來解碼所述層,則對所述層進(jìn)行解碼。50.—種用于在解碼器中對可擴(kuò)展數(shù)據(jù)流進(jìn)行解碼的程序產(chǎn)品,所述數(shù)據(jù)流包括具有不同編碼特性的層,所述程序產(chǎn)品包括機(jī)器可讀程序代碼,用于在執(zhí)行的時候使一個或多個設(shè)備執(zhí)行下列步驟接收所述可擴(kuò)展數(shù)據(jù)流;識別所述可擴(kuò)展數(shù)據(jù)流中的至少一個層,并讀取與所述層相關(guān)聯(lián)的其編碼特性的指示,其中,所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參數(shù)設(shè)定;確定所述解碼器是否能夠基于所述編碼特性來解碼所述層;以及如果確定所述解碼器能夠基于所述編碼特性來解碼所述層,則對所述層進(jìn)行解碼。51.—種用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層的模塊,所述模塊包括第一組件,用于生成所述可擴(kuò)展數(shù)據(jù)流的至少一個層,其中所述至少一個層的特征在于編碼特性,其中所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參數(shù)設(shè)定;以及第二組件,用于信號發(fā)送具有所述特性化編碼特性的所述層,使得其可由解碼器讀取而無需對整個層進(jìn)行解碼。52.—種用于對包括具有不同編碼特性的層的可擴(kuò)展數(shù)據(jù)進(jìn)行解碼的解碼器模塊,所述模塊包括第一組件,用于接收所述可擴(kuò)展數(shù)據(jù)流;第二組件,用于識別所述可擴(kuò)展數(shù)據(jù)流中的至少一個層,并讀取與所述層相關(guān)聯(lián)的其編碼特性的指示,其中,所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及—初始參lt沒定;第三組件,用于確定所述解碼器是否能夠基于所述編碼特性來解碼所述層;以及第四組件,用于如果所述第三組件確定所述解碼器能夠基于所述編碼特性來解碼所述層,則對所述層進(jìn)行解碼。53.—種用于對可擴(kuò)展層數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性并對可擴(kuò)展數(shù)據(jù)流進(jìn)行解碼的方法,其中,所述編碼包括生成所述可擴(kuò)展數(shù)據(jù)流的至少一個層,其中所述至少一個層的特征在于編碼特性,其中所述編碼特性包括下列中至少其-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參數(shù)設(shè)定,以及信號發(fā)送具有所述特性化編碼特性的所述至少一個層,使得其可由解碼器讀取而無需對整個層進(jìn)行解碼;以及所述解碼包括接收所述可擴(kuò)展數(shù)據(jù)流的至少一個層,其中所述至少一個層的特征在于編碼特性,其中所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參數(shù)設(shè)定;以及信號發(fā)送具有所述特性化編碼特性的所述至少一個層,使得其可由解碼器讀取而無需對整個層進(jìn)行解碼;其中,所述方法進(jìn)一步包括檢查至少一個層的所述編碼特性;在所述檢查的基礎(chǔ)上確定對該層進(jìn)行解碼是否可行;如果確定所述解碼是可行的,則對所述至少一個層進(jìn)行解碼。54.—種具有編碼器的設(shè)備,該編碼器用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼以包括具有不同編碼特性的層,所述編碼器包括第一組件,用于生成所述可擴(kuò)展數(shù)據(jù)流的至少一個層,其中所述至少一個層的特征在于編碼特性,其中所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參數(shù)設(shè)定,以及第二組件,用于信號發(fā)送具有所述特性化編碼特性的所述至少一個層,使得其可由解碼器讀取而無需對整個層進(jìn)行解碼。55.—種具有解碼器的設(shè)備,該解碼器用于對包括具有不同編碼特性的層的可擴(kuò)展數(shù)據(jù)流進(jìn)行解碼,所述解碼器包括第一組件,用于接收所述可擴(kuò)展數(shù)據(jù)流;第二組件,用于識別所述可擴(kuò)展數(shù)據(jù)流中的至少一個層,并讀取與所述層相關(guān)聯(lián)的其編碼特性的指示,其中,所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參lti殳定;第三組件,用于確定所述解碼器是否能夠基于所述編碼特性來解碼所述層;以及第四組件,用于如果所述第三組件確定所述解碼器能夠基于所述編碼特性來解碼所述層,則對所述層進(jìn)行解碼。56.—種包括可擴(kuò)展數(shù)據(jù)流的信號,該可擴(kuò)展數(shù)據(jù)流包括至少一個層,其中所述至少一個層的特征在于編碼特性,其中所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參lt沒定;具有所述特性化編碼特性的所述至少一個層的形式為其可由解碼器進(jìn)行讀取而無需對整個層進(jìn)行解碼。57.—種具有記錄于其上的信號的載體,所述信號包括可擴(kuò)展數(shù)據(jù)流,該可擴(kuò)展數(shù)據(jù)流包括至少一個層,其中所述至少一個層的特征在于編碼特性,其中所述編碼特性包括下列中至少其一-精粒度可擴(kuò)展性信息;-感興趣區(qū)域(ROI)可擴(kuò)展性信息;-子樣本可擴(kuò)展層信息;-解碼依賴性信息;以及-初始參數(shù)設(shè)定,以及具有所述特性化編碼特性的所述至少一個層的形式為其可由解碼器進(jìn)行讀取而無需對整個層進(jìn)行解碼。全文摘要一種用于對可擴(kuò)展數(shù)據(jù)流進(jìn)行編碼、解碼、存儲和傳送以包括具有不同編碼特性的層的方法和設(shè)備。該方法包括生成可擴(kuò)展數(shù)據(jù)流的一個或多個層,其中編碼特性包括下列中至少其一精粒度可擴(kuò)展性信息;感興趣區(qū)域可擴(kuò)展性信息;子樣本可擴(kuò)展層信息;解碼依賴性信息;以及初始參數(shù)設(shè)定;并且信號發(fā)送具有特性化編碼特性的所述層,使得其可由解碼器讀取而無需對整個層進(jìn)行解碼。此外,一種對可擴(kuò)展比特流的編碼、解碼、存儲和傳送的方法,其中存在至少兩個可擴(kuò)展性層,每個層的特征在于可以是不同于整個流的特性的至少一個特性的集合,例如精粒度可擴(kuò)展性信息;感興趣區(qū)域可擴(kuò)展性信息;子樣本可擴(kuò)展層信息;解碼依賴性信息;以及初始參數(shù)設(shè)定;并且其中針對不同于整個流的至少一個層來信號發(fā)送該至少一個特性的集合,其中信號發(fā)送該至少一個特性的集合可以是在可擴(kuò)展比特流中、包含可擴(kuò)展比特流的文件格式容器中、或用于傳輸和控制可擴(kuò)展比特流的至少一個層的傳輸或控制協(xié)議中。文檔編號G06T9/00GK101120593SQ200680004747公開日2008年2月6日申請日期2006年4月10日優(yōu)先權(quán)日2005年4月13日發(fā)明者M(jìn)·安尼克塞拉,王業(yè)奎申請人:諾基亞公司