專利名稱:與編碼視聽數(shù)據(jù)分離地存儲或傳輸編碼參數(shù)的方法和設備的制作方法
技術領域:
本發(fā)明涉及一種用于與已編碼視聽數(shù)據(jù)分離地存儲和傳輸編碼參數(shù)的方法和設備。
背景技術:
在壓縮視聽(AV)數(shù)據(jù)領域,技術趨勢日益趨向于面向參數(shù)的描述。從編碼的觀點來看,壓縮參數(shù)通常規(guī)定了應當以幾種可能模式中的哪一種,對編碼器輸入的特定部分(AV數(shù)據(jù))進行處理。因此,從解碼的觀點來看,相同的壓縮參數(shù)表示,應當根據(jù)幾種允許規(guī)則中的哪一種,將給定的壓縮比特流部分轉換回AV數(shù)據(jù)。壓縮參數(shù)可以是不同種類的;假設其中將畫面細分為片段的壓縮方案,其可以是“全局參數(shù)(GP)”、“畫面層參數(shù)(PLP)”和“片段層參數(shù)(SLP)”。期望GP通常是恒定的,因為其表示如畫面尺寸或顏色空間等參數(shù)。但是,其可以在隨機存取單元的開始發(fā)生改變,如GOP。因此,將從AV比特流中引用不同GP集合的小集合。PLP表示可能會更為頻繁地發(fā)生變化的參數(shù),最多基于每個畫面。因此,每個已編碼畫面將引用來自這種PLP的潛在更大集合的一個。類似地,可以由已編碼畫面中的每個已編碼片段引用不同的SLP。期望GP通常由進行了壓縮的特定AV材料的種類預先確定,而PLP和SLP可以自由地進行選擇,以便作為編碼器優(yōu)化的一部分。對于編碼器優(yōu)化,選擇可能基于對編碼錯誤或壓縮比特率或這二者進行量化的一些壓縮效率措施。上述技術將被用在正在開發(fā)的MPEG-4 Part 10中,也被稱為H.26L或JVT編解碼器。
發(fā)明內容
本發(fā)明基于對以下事實的認知。
除了規(guī)定和適當?shù)剡x擇壓縮參數(shù)之外,在大多數(shù)情況下,其必須與適當?shù)腁V數(shù)據(jù)一起傳輸或存儲,以便實現(xiàn)有意義的解碼。需要與每個應用領域分離地解決此任務,其中壓縮參數(shù)的傳輸或存儲不得不滿足幾個、部分沖突的要求。
·緊湊性在全局和局部上,壓縮參數(shù)描述必須保持緊湊,從而使AV加上參數(shù)所需的總帶寬并不超過通過參數(shù)化方案所獲得的壓縮效率上的任何收益。這包括避免任何不必要的重復或其他冗余出現(xiàn)在壓縮參數(shù)中的強烈動機。
因此,從已編碼畫面或片段到參數(shù)集合的索引機制將限制能夠尋址的每種類型的參數(shù)集合的數(shù)量,以便實現(xiàn)緊湊性的目的。因此,必須規(guī)定是否或何時能夠以相同的參數(shù)集合標識符(數(shù)字或其他標記)標識兩個不同的參數(shù)集合。換句話說,需要建立參數(shù)集合標識符的名稱范圍。
·可解碼性對于AV數(shù)據(jù),尤其是在存儲介質上,傾向于以非順序的隨機方式進行存取,任何參數(shù)集合分配方案都必須確保當在任意入口點輸入和解碼比特流時,全部所需壓縮參數(shù)都是可用的。這包括各類特技播放的重要情況,并可以限定實現(xiàn)數(shù)據(jù)冗余的特定可控形式。
·兼容性在設計現(xiàn)有規(guī)范的擴展時,如用于光學存儲的DVD,需要保持盡可能多的已經得到了很好理解的和已經建立的系統(tǒng)概念??紤]到此因素的解決方案更容易在標準化過程中得到認定。
因此,本發(fā)明要解決的問題在于存儲/傳輸針對比特率進行了優(yōu)化的壓縮參數(shù)集合,以及用在應用領域中的邏輯結構的兼容性。
通過權利要求1中所公開的方法來解決此問題。在權利要求9中公開了利用此方法的設備。在權利要求10和11中分別請求對相應的解碼方法和設備進行保護。
根據(jù)本發(fā)明的方法,使用從已編碼數(shù)據(jù)中引用的多個壓縮參數(shù)集合。將壓縮參數(shù)集合存儲在輔助數(shù)據(jù)文件中,所述輔助數(shù)據(jù)文件與包含主AV比特流的文件或流惟一相關聯(lián)。在所述輔助數(shù)據(jù)文件和包含主AV比特流的關聯(lián)文件或流中,壓縮參數(shù)集合的標識符和主AV比特流中對這些標識符的相應引用是惟一的。
有利地,擴展與包含主AV比特流的文件或流相關的現(xiàn)有輔助數(shù)據(jù)文件,以承載壓縮參數(shù)集合。
有利地,創(chuàng)建針對包含主AV比特流的所述文件或流的輔助數(shù)據(jù)文件的額外同構集合,以承載額外的信息,如所述壓縮參數(shù)集合,從而不犧牲與不能處理對現(xiàn)有輔助數(shù)據(jù)文件的擴展的舊設備的兼容性。
此外,有利的是,明確地用信號通知所述壓縮參數(shù)集合標識符的有效時間段。
有利地,壓縮參數(shù)集合標識符的有效時間段的信令基于與主AV比特流部分相關聯(lián)的顯示或解碼時間信息。但是,壓縮參數(shù)集合標識符的有效時間段的信令也可以基于與主AV比特流部分相關聯(lián)的文件名。此外,壓縮參數(shù)集合標識符的有效時間段的信令可以基于與其中所承載的主AV比特流部分相關聯(lián)的潛在傳送或存儲實體(如分組或扇區(qū))的現(xiàn)有標識。
根據(jù)另一有利實施例,間接引用壓縮參數(shù)集合,其中a.定義每組AV材料部分的AV比特流中的參數(shù)集合標識符,以引用第二表的表格項;b.第二表每部分單獨可用,并以每部分進行重復的數(shù)據(jù)結構,被存儲在輔助文件中;c.定義所述AV材料的所有第二表的表格項,從而使其自身反過來成為引用每個所述AV材料曾經提供的公共參數(shù)集合表的表格項的標識符。
本發(fā)明的其他有利實施例將從以下的描述中得到。
參照附圖對本發(fā)明的典型實施例進行描述,其中圖1具有分離參數(shù)集合的AV流;圖2具有仿造AV數(shù)據(jù)的帶外參數(shù)集合的AV流;
圖3DVD中現(xiàn)有的PGCI文件的內部結構;圖4被擴展為包括參數(shù)集合的PGCI文件的內部結構;圖5包括參數(shù)集合的PGCI文件和并行文件的內部結構;圖6具有添加范圍時間段信息的參數(shù)集合;圖7間接引用機制。
具體實施例方式
對于如MPEG-4 Part 10等視頻壓縮方案,在視頻編碼處理期間,產生壓縮參數(shù)集合,并與主AV比特流分開進行存儲,然后由此加以引用,如圖1所示。具有單獨產生的參數(shù)集合的AV流的獨立可訪問數(shù)據(jù)單元(IADU)包括畫面p1、p2、p3、pi、…,每一個均被分為片段s1、s2、…、sn。對于片段,存在對分離產生的壓縮參數(shù)的指針,典型地,對全局參數(shù)GP1和GP2、畫面層參數(shù)PLP1、PLP2和PLP3、以及片段層參數(shù)SLP1、SLP2、SLP4和SLP5的指針。
IADU共同起始于入口畫面p1(內編碼幀),可以從AV比特流中的任何其他數(shù)據(jù)獨立解碼,除對所需參數(shù)集合的引用之外,例如,針對全局參數(shù)GP1、畫面層參數(shù)PLP1和針對該畫面中的每個已編碼片段的片段層參數(shù)SLP1、SLP2的每個引用之一。
如圖2所示,帶外存儲壓縮參數(shù)集合,即,存儲在與主AV文件分離的文件或文件集合中(等價于分離地傳送參數(shù)集合,并在AV數(shù)據(jù)的任何隨后傳輸之前)。典型示出的是具有第一IADU的AV數(shù)據(jù)AV_IADU_1和第二IADU的AV_IADU_2的兩個IADU。參數(shù)集合位于帶外,具有在IADU 1的入口畫面p1中引用的參數(shù)集合PSp1,其后為在IADU1的其他畫面中引用的參數(shù)集合PSo。還示出了未在IDAU中引用的參數(shù)集合PSn和在IADU 2中引用的參數(shù)集合PS_IADU_2。
優(yōu)選地,這種參數(shù)集合文件/流的內部結構應當緊密地遵循其與之相關的AV數(shù)據(jù)的內部結構,如圖2所示。典型地,參數(shù)集合標識符必須在“編碼會話”內保持惟一。換句話說,在編碼會話中,相同的標識符不能用于兩個不同的參數(shù)集合。因此,編碼會話構成了這些標識符的范圍。
將“編碼會話”映射到如DVD等存儲介質上的有意義的實體,如下DVD標識語義實體的層次,其中有“節(jié)目鏈”、“單元”和“視頻對象單元(VOBU)”。為了使參數(shù)集合的不必要重復最小,參數(shù)集合標識符的范圍受限于這些實體的最大可能。在DVD中,與實體有關的信息構成了導航數(shù)據(jù)的一部分,并組裝在“視頻管理器信息(VMGI)”和“視頻標題集合信息(VTSI)”文件中,此后將其統(tǒng)稱為PGCI文件。圖3示出了這些PGCI文件的內部結構。
此外,可以通過將壓縮參數(shù)集合直接包括在其中(圖4),如DVD中所定義的那樣擴展PGCI文件,或有利地,為了保持與現(xiàn)有DVD播放器的兼容性,創(chuàng)建具有類似于PGCI文件的內部結構但只包含壓縮參數(shù)集合的內部結構的分離文件(圖5)。
在創(chuàng)作期間,可以在記錄在存儲介質上之前,已經對節(jié)目鏈的不同部分分別進行編碼。在這種情況下,非??赡艿氖?,在這些部分之間,將相同的參數(shù)集合標識符分配給不同的參數(shù)集合。為了支持這種組合內容的簡易創(chuàng)作,可以添加與參數(shù)集合標識符的范圍時間段有關的清晰標識。將這種標識添加到正在引用壓縮參數(shù)集合的AV比特流中并不是很好的選擇,因為這將需要更多地解析比特流,并將增加比特率。因此,提出以規(guī)定了其范圍時間段的信息修改每個壓縮參數(shù)集合或存儲在帶外文件中的這種參數(shù)集合的群(圖6)。這種范圍時間段信息可以基于AV材料內的時標,基于標識AV比特流不同部分的文件名(DVD上的VOB文件),或基于盤上的扇區(qū)號。
在上述組合內容的情況下,盡管參數(shù)集合標識符分配可能在整個AV材料的分離編碼部分之間變化,仍然可能的是,許多參數(shù)集合,如果不是全部參數(shù)集合的話,盡管帶有不同的標識符,實際上是等同的;由于已采用的編碼設備可以內部使用,并從預定參數(shù)集合的有限集合中進行選擇。在這種情況下,作為避免壓縮參數(shù)集合的不必要重復的另一種方式,額外地提出了采用引用參數(shù)集合的間接機制,其中定義每部分的AV比特流中的參數(shù)集合標識符,以引用每部分單獨可用的較小第二表,以每部分重復的數(shù)據(jù)結構形式,將此第二表存儲在帶外文件中,并且定義整個AV材料的全部第二表的表格項,從而使其自身反過來成為引用曾經提供的公共參數(shù)集合表的表格項的標識符(圖7)。
本發(fā)明具有消除了將已創(chuàng)作的AV比特流格式化到存儲介質上以及比特率效率的優(yōu)點??善谕氖牵瑒?chuàng)作工具將與AV數(shù)據(jù)的比特流分離地存儲參數(shù)集合,因為這是使用參數(shù)集合的最初目的。每個參數(shù)集合只需被存儲一次,并能夠從存儲介質上的任何已編碼畫面多次引用。采用間接引用方案,參數(shù)集合管理保持有效,即使AV資產來自異類源。
本發(fā)明對于AV比特流的傳送或存儲尤為有用。但是,本發(fā)明也可以應用于其他類型的比特流。
權利要求
1.一種視頻編碼方法,使用多個從已編碼數(shù)據(jù)中引用的壓縮參數(shù)集合,其中將所述壓縮參數(shù)集合存儲在與包含主AV比特流的文件或流惟一相關聯(lián)的輔助數(shù)據(jù)文件中,并且所述壓縮參數(shù)集合的標識符和主AV比特流中對這些標識符的相應引用在所述輔助數(shù)據(jù)文件和包含主AV比特流的關聯(lián)文件或流內是惟一的。
2.根據(jù)權利要求1所述的視頻編碼方法,其特征在于擴展與包含主AV比特流的所述文件或流有關的現(xiàn)有輔助數(shù)據(jù)文件,以承載所述壓縮參數(shù)集合。
3.根據(jù)權利要求1所述的視頻編碼方法,其特征在于創(chuàng)建針對包含主AV比特流的所述文件或流的輔助數(shù)據(jù)文件的額外同構集合,以承載額外的信息,如所述壓縮參數(shù)集合,從而不犧牲與不能處理對現(xiàn)有輔助數(shù)據(jù)文件的擴展的舊設備的兼容性。
4.根據(jù)權利要求1到3之一所述的視頻編碼方法,其特征在于明確地用信號通知所述壓縮參數(shù)集合標識符的有效時間段。
5.根據(jù)權利要求4所述的視頻編碼方法,其特征在于壓縮參數(shù)集合標識符的有效時間段的信令基于與主AV比特流部分相關聯(lián)的顯示或解碼時間信息。
6.根據(jù)權利要求4所述的視頻編碼方法,其特征在于壓縮參數(shù)集合標識符的有效時間段的信令基于與主AV比特流部分相關聯(lián)的文件名。
7.根據(jù)權利要求4所述的視頻編碼方法,其特征在于壓縮參數(shù)集合標識符的有效時間段的信令基于與其中所承載的主AV比特流部分相關聯(lián)的潛在傳送或存儲實體的現(xiàn)有標識,如分組或扇區(qū)。
8.根據(jù)權利要求4到7之一所述的視頻編碼方法,其特征在于間接引用所述壓縮參數(shù)集合,其中a.定義每組AV材料部分的AV比特流中的參數(shù)集合標識符,以引用第二表的表格項;b.所述第二表所述每部分單獨可用,并以所述每部分進行重復的數(shù)據(jù)結構形式,被存儲在輔助文件中;c.定義所述AV材料的所有所述第二表的表格項,從而使其自身反過來成為引用每個所述AV材料曾經提供的公共參數(shù)集合表的表格項的標識符。
9.一種使用根據(jù)權利要求1到8之一所述的方法的視頻編碼設備。
10.一種用于解碼根據(jù)權利要求1到8之一進行了編碼的視頻信號的視頻解碼方法。
11.一種使用根據(jù)權利要求10所述的方法的視頻解碼設備。
全文摘要
將壓縮參數(shù)集合存儲在與主AV分離的文件中,或分離地進行傳輸,并在AV數(shù)據(jù)的任何隨后傳輸之前。將參數(shù)集合標識符的范圍限制于不多于節(jié)目鏈。通過直接包括壓縮參數(shù)集合,擴展現(xiàn)有文件,或者創(chuàng)建包含壓縮參數(shù)集合的分離文件。為了支持組合內容的簡易創(chuàng)作,提出了以可以基于時標、文件名或盤上的扇區(qū)號的范圍時間段信息修改每個壓縮參數(shù)集合或這些參數(shù)集合的群。額外地提出了采用間接引用機制,其中參數(shù)集合標識符引用第二表,并且定義第二表的表格項,從而使其自身反過來成為引用曾經提供的公共參數(shù)集合表的表格項的標識符。
文檔編號H04N7/24GK1682538SQ03817114
公開日2005年10月12日 申請日期2003年7月12日 優(yōu)先權日2002年7月22日
發(fā)明者卡斯滕·赫佩爾, 哈拉爾德·席勒, 拉爾夫·奧斯特曼, 埃德加·彼得斯, 阿克塞爾·科哈爾 申請人:湯姆森許可貿易公司