專利名稱:Mpeg-4視頻數(shù)據(jù)的編碼方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及根據(jù)MPEG-4標(biāo)準(zhǔn)對由一個(gè)或多個(gè)比特流組成的視頻數(shù)據(jù)進(jìn)行編碼的方法。本發(fā)明還涉及相應(yīng)的編碼裝置以及由至少一個(gè)在這種編碼裝置輸出端獲得的視頻比特流組成的編碼MPEG-4信號。
在諸如因特網(wǎng)或UMTS無線電信道的有損耗網(wǎng)絡(luò)上的音頻-視頻數(shù)據(jù)傳輸需要使用編碼技術(shù),編碼技術(shù)在其比特的使用和強(qiáng)有力地防止傳輸誤差兩方面都是有效的。在此環(huán)境中設(shè)計(jì)的MPEG-4標(biāo)準(zhǔn)提供表示自然或合成源的音頻-視頻對象(AVO)的標(biāo)準(zhǔn)化方法,采用在自然和合成視頻序列中發(fā)現(xiàn)的時(shí)間和空間冗余性。出于這種目的,對于在視頻流中出現(xiàn)的三種視頻對象面(VOP)類型(內(nèi)部VOP或I VOP;預(yù)測VOP或P VOP;雙向VOP或B VOP),使用特定編碼技術(shù)。通過除去視頻信號中的冗余從而降低帶寬要求的這些編碼技術(shù),在所述信號在傳輸層中被劃分為分組時(shí),變得對比特誤差和傳輸層分組丟失相當(dāng)敏感(例如,單個(gè)比特誤差可使得不可能對信息進(jìn)行解碼,或者,由于傳輸層的分組丟失,后續(xù)分組中預(yù)測編碼的運(yùn)動(dòng)信息可能變得不可解碼)。另外,由于編碼器的預(yù)測特性,發(fā)生在I或P VOP中的誤差將趨向于傳播到后繼的P VOP和周圍的B VOP。
容錯(cuò)是MPEG-4視頻標(biāo)準(zhǔn)為了解決上述缺點(diǎn)而提供的無數(shù)選項(xiàng)之一它提供一組允許根據(jù)它們的敏感度對編碼數(shù)據(jù)按等級進(jìn)行分類的工具(這種容錯(cuò)模式特別包括提高解碼器定位誤差的能力的功能性它根據(jù)數(shù)據(jù)分區(qū),通過將運(yùn)動(dòng)和宏塊標(biāo)題信息與結(jié)構(gòu)信息分開而實(shí)現(xiàn),這樣,如果結(jié)構(gòu)信息丟失,則允許借助于預(yù)先解碼VOP的運(yùn)動(dòng)補(bǔ)償利用運(yùn)動(dòng)信息來隱蔽這種誤差)。為了利用這種特征的優(yōu)點(diǎn),傳輸層必須考慮由視頻層提供的分級信息。
傳統(tǒng)上,MPEG-4視頻比特流由許多元素組成,例如視頻對象(VO)、視頻對象層(VOL)、視頻對象面、VOP組(GOV)、視頻分組(VP)、視頻數(shù)據(jù)分區(qū)(VDP)等,同時(shí)MPEG-4系統(tǒng)操作以下實(shí)體例如DecoderSpecificInfo(解碼器特定信息)、接入單元(AU)、SL分組。為此,為了正常工作,如何將視頻元素映射到系統(tǒng)元素中是關(guān)鍵重點(diǎn)。具體地說,這里描述了視頻數(shù)據(jù)分區(qū)到系統(tǒng)的映射。視頻數(shù)據(jù)分區(qū)以特定視頻比特流語法模式對應(yīng)于視頻分組的段,該模式使它們具有容錯(cuò)能力;具體地說,每個(gè)視頻分組有兩個(gè)視頻數(shù)據(jù)分區(qū)。但是,數(shù)據(jù)分區(qū)語法的一個(gè)缺點(diǎn)是它不是字節(jié)對準(zhǔn)的,即視頻分組的第一和第二數(shù)據(jù)分區(qū)之間的邊界沒有字節(jié)對準(zhǔn)它不是以8的倍數(shù)比特開始的。這種情況對有效的機(jī)器實(shí)現(xiàn)是未達(dá)最佳標(biāo)準(zhǔn)的的,并且當(dāng)考慮網(wǎng)絡(luò)傳輸時(shí)可能導(dǎo)致問題,因?yàn)榫W(wǎng)絡(luò)協(xié)議傳輸字節(jié)(即8比特的分片)。
因此,本發(fā)明的第一個(gè)目的是提議一種避免這種缺點(diǎn)的方法。
為此,本發(fā)明涉及一種根據(jù)MPEG-4標(biāo)準(zhǔn)對由一個(gè)或多個(gè)比特流組成的視頻數(shù)據(jù)進(jìn)行編碼的方法,其中選擇了特定的對準(zhǔn)/分段機(jī)制,根據(jù)這種機(jī)制,當(dāng)利用對應(yīng)于將包括在所述視頻數(shù)據(jù)中的所述視頻對象平面(VOP)分段為視頻分組(VP),以及將視頻分組分段為數(shù)據(jù)分區(qū)(DP)的語法模式,對所述視頻比特流進(jìn)行編碼時(shí),視頻數(shù)據(jù)分區(qū)被映射到一個(gè)或多個(gè)SL分組中,即使大的視頻數(shù)據(jù)分區(qū)被分為多個(gè)SL分組,第一個(gè)視頻數(shù)據(jù)分區(qū)的開始也總是被映射到SL分組的開始,并且傳輸?shù)谝粋€(gè)數(shù)據(jù)分區(qū)的最后一個(gè)SL分組包括分隔標(biāo)記(DC標(biāo)記或運(yùn)動(dòng)標(biāo)記,取決于VOP類型)以及多達(dá)7個(gè)后續(xù)第二數(shù)據(jù)分區(qū)比特,以獲得字節(jié)對準(zhǔn),下一SL分組開始于第二數(shù)據(jù)分區(qū)的下一比特。
本發(fā)明的另一目標(biāo)是提議一種相應(yīng)的編碼裝置。
為此,本發(fā)明涉及一種用于根據(jù)MPEG-4標(biāo)準(zhǔn)對由一個(gè)或多個(gè)比特流組成的視頻數(shù)據(jù)進(jìn)行編碼的裝置,所述裝置包括特定的對準(zhǔn)/分段機(jī)制,根據(jù)這種機(jī)制,當(dāng)利用對應(yīng)于將包括在所述視頻數(shù)據(jù)中的所述視頻對象平面(VOP)分段為視頻分組(VP),以及將視頻分組分段為數(shù)據(jù)分區(qū)(DP)的語法模式,對所述視頻比特流進(jìn)行編碼時(shí),視頻數(shù)據(jù)分區(qū)被映射到一個(gè)或多個(gè)同步層分組(SL分組)中,即使大的視頻數(shù)據(jù)分區(qū)被分為多個(gè)SL分組,第一個(gè)視頻數(shù)據(jù)分區(qū)的開始也總是被映射到一個(gè)SL分組的開始,并且傳輸?shù)谝粩?shù)據(jù)分區(qū)的最后一個(gè)SL分組包括分隔標(biāo)記以及多達(dá)7個(gè)后續(xù)第二數(shù)據(jù)分區(qū)比特,以獲得字節(jié)對準(zhǔn),下一SL分組開始于第二數(shù)據(jù)分區(qū)的下一比特。
本發(fā)明還涉及一種由至少一個(gè)從編碼裝置的輸出端上獲得的視頻比特流組成的編碼MPEG-4信號,其中選擇了特定的對準(zhǔn)/分段機(jī)制,根據(jù)這種機(jī)制,當(dāng)利用對應(yīng)于將包括在所述視頻數(shù)據(jù)中的所述視頻對象平面(VOP)分段為視頻分組(VP),以及將視頻分組分段為數(shù)據(jù)分區(qū)(DP)的語法模式,對所述視頻比特流進(jìn)行編碼時(shí),視頻數(shù)據(jù)分區(qū)被映射到一個(gè)或多個(gè)同步層分組(SL分組)中,即使大的視頻數(shù)據(jù)分區(qū)被分為多個(gè)SL分組,第一個(gè)視頻數(shù)據(jù)分區(qū)的開始也總是被映射到一個(gè)SL分組的開始,并且傳輸?shù)谝粩?shù)據(jù)分區(qū)的最后一個(gè)SL分組包括分隔標(biāo)記以及多達(dá)7個(gè)后續(xù)第二數(shù)據(jù)分區(qū)比特,以獲得字節(jié)對準(zhǔn),下一SL分組開始于第二數(shù)據(jù)分區(qū)的下一比特。
現(xiàn)在通過例示,參考附圖對本發(fā)明進(jìn)行描述,其中
圖1給出了多媒體終端的主處理層;圖2說明了依照本發(fā)明的對準(zhǔn)/分段機(jī)制。
如上所述,MPEG-4標(biāo)準(zhǔn)提供表示自然或合成源的AVO的標(biāo)準(zhǔn)方法,從而將它們組合在一起以產(chǎn)生形成音頻-視頻場景的復(fù)合AVO(音頻-視頻場景一般由多個(gè)AVO組成,以分級方式組織),從而對與AVO相關(guān)的數(shù)據(jù)進(jìn)行多路復(fù)用和同步,并且影響在接收器端生成或重建的音頻-視頻場景。圖1中說明了允許再現(xiàn)和顯示這種音頻視頻場景的多媒體視聽終端的主處理部分,其中終端是多層架構(gòu),由以下三層組成復(fù)用轉(zhuǎn)換(TransMux)層21、靈活復(fù)用(FlexMux)22以及接入單元層23。
復(fù)用轉(zhuǎn)換層21由保護(hù)子層和復(fù)用子層組成(盡管在某些復(fù)用轉(zhuǎn)換實(shí)例中,也許不可能分開標(biāo)識這些子層,但是保護(hù)子層特別用于提供適合給定網(wǎng)絡(luò)和存儲(chǔ)媒體的誤差保護(hù)和誤差檢測工具)。在MPEG-4的環(huán)境中未定義的層21,實(shí)際上是與網(wǎng)絡(luò)或存儲(chǔ)媒體的接口,并且允許提供與所請求的業(yè)務(wù)質(zhì)量(QoS)相匹配的傳輸業(yè)務(wù)。在其輸出端上可得到靈活復(fù)用流,即靈活復(fù)用分組序列(由信頭和凈荷組成的小數(shù)據(jù)實(shí)體)。
完全由MPEG-4規(guī)定的靈活復(fù)用層22由用于交織數(shù)據(jù)的靈活工具組成(將一個(gè)或多個(gè)基本數(shù)據(jù)流組合到一個(gè)靈活復(fù)用流中),并且允許標(biāo)識用于多路傳輸數(shù)據(jù)的不同信道。在所述層22的輸出端上可得到SL分組流,即封裝一個(gè)基本流的SL分組序列(SL分組或同步層分組=由下一層23管理的最小數(shù)據(jù)實(shí)體,或同步層,所述實(shí)體包括可配置的信頭和凈荷,凈荷自身由全部或部分接入單元組成)。
提供層23或同步層,以修改基本流數(shù)據(jù)用于通信?;玖髯鳛镾L分組流傳送,并且這種分組表示法還提供定時(shí)和同步信息以及分段和隨機(jī)訪問信息。該層23之后是壓縮層24,壓縮層24從數(shù)據(jù)的編碼格式將其恢復(fù),并且允許執(zhí)行必要的操作以對編碼信號進(jìn)行解碼并且重建原始信息。然后根據(jù)解碼信息的顯示(以便被顯示)和一些用戶交互處理這些解碼信息(合成、再現(xiàn))。
根據(jù)圖2所示的對準(zhǔn)/分段機(jī)制的本發(fā)明,提議了以下解決方法。當(dāng)利用對應(yīng)于將VOP分段為視頻分組,以及將這些視頻分組分段為數(shù)據(jù)分區(qū)(DP1,DP2)的語法模式,對視頻比特流進(jìn)行編碼時(shí),視頻數(shù)據(jù)分區(qū)應(yīng)該被映射到一個(gè)或多個(gè)SL分組(SL1、SL2、SL3、SL4等)中,這些SL分組是字節(jié)對準(zhǔn)的(在這些SL分組各自的第一比特之間,即SL分組的字節(jié)分界BB之間有8比特或8的倍數(shù)比特的距離)。具體地說,允許將大的視頻數(shù)據(jù)分區(qū)分為多個(gè)SL分組,但是第一個(gè)視頻數(shù)據(jù)分區(qū)DP1的開始必須總是被映射到SL分組的開始。
另外,因?yàn)槿绻谝粋€(gè)數(shù)據(jù)分區(qū)丟失,第二個(gè)數(shù)據(jù)分區(qū)是無用的,但是解碼器需要標(biāo)記M以安全地識別第一個(gè)數(shù)據(jù)分區(qū)DP1的結(jié)束,應(yīng)該使用以下對準(zhǔn)規(guī)則傳輸?shù)谝粋€(gè)數(shù)據(jù)分區(qū)的最后一個(gè)SL分組必須包括分隔標(biāo)記M(DC標(biāo)記或運(yùn)動(dòng)標(biāo)記,取決于VOP類型)以及多達(dá)7個(gè)后續(xù)第二個(gè)數(shù)據(jù)分區(qū)比特,從而獲得字節(jié)對準(zhǔn)。下一SL分組開始于第二個(gè)數(shù)據(jù)分區(qū)的下一比特。所述的特定對準(zhǔn)/分段允許將視頻元素映射到系統(tǒng)元素中,并且在這種情況下避免任何文件結(jié)構(gòu)互換問題或任何網(wǎng)絡(luò)問題。
權(quán)利要求
1.一種用于根據(jù)MPEG-4標(biāo)準(zhǔn)對由一個(gè)或多個(gè)比特流組成的視頻數(shù)據(jù)進(jìn)行編碼的方法,其特征在于,選擇特定的對準(zhǔn)/分段機(jī)制,根據(jù)這種機(jī)制,當(dāng)利用對應(yīng)于將包括在所述視頻數(shù)據(jù)中的所述視頻對象平面(VOP)分段為視頻分組(VP),以及將視頻分組分段為數(shù)據(jù)分區(qū)(DP)的語法模式,對所述視頻比特流進(jìn)行編碼時(shí),視頻數(shù)據(jù)分區(qū)被映射到一個(gè)或多個(gè)同步層分組(SL分組)中,視頻數(shù)據(jù)分區(qū)被映射到一個(gè)或多個(gè)同步層分組(SL分組)中,即使大的視頻數(shù)據(jù)分區(qū)被分為多個(gè)SL分組,所述第一個(gè)視頻數(shù)據(jù)分區(qū)的開始總是被映射到SL分組的開始,并且傳輸所述第一個(gè)數(shù)據(jù)分區(qū)的最后一個(gè)SL分組包括分隔標(biāo)記以及多達(dá)7個(gè)后續(xù)的所述第二數(shù)據(jù)分區(qū)比特,以獲得字節(jié)對準(zhǔn),下一SL分組開始于所述第二數(shù)據(jù)分區(qū)的下一比特。
2.一種用于根據(jù)MPEG-4標(biāo)準(zhǔn)對由一個(gè)或多個(gè)比特流組成的視頻數(shù)據(jù)進(jìn)行編碼的裝置,所述裝置包括特定的對準(zhǔn)/分段機(jī)制,根據(jù)這種機(jī)制,當(dāng)利用對應(yīng)于將包括在所述視頻數(shù)據(jù)中的所述視頻對象平面(VOP)分段為視頻分組(VP),以及將視頻分組分段為數(shù)據(jù)分區(qū)(DP)的語法模式,對所述視頻比特流進(jìn)行編碼時(shí),視頻數(shù)據(jù)分區(qū)被映射到一個(gè)或多個(gè)同步層分組(SL分組)中,即使大的視頻數(shù)據(jù)分區(qū)被分為多個(gè)SL分組,所述第一個(gè)視頻數(shù)據(jù)分區(qū)的開始也總是被映射到SL分組的開始,并且傳輸所述第一數(shù)據(jù)分區(qū)的最后一個(gè)SL分組包括分隔標(biāo)記以及多達(dá)7個(gè)后續(xù)的所述第二數(shù)據(jù)分區(qū)比特,以獲得字節(jié)對準(zhǔn),下一SL分組開始于所述第二數(shù)據(jù)分區(qū)的下一比特。
3.一種由至少一個(gè)從編碼裝置的輸出端上獲得的視頻比特流組成的編碼MPEG-4信號,其中選擇特定的對準(zhǔn)/分段機(jī)制,根據(jù)這種機(jī)制,當(dāng)利用對應(yīng)于將包括在所述視頻數(shù)據(jù)中的所述視頻對象平面(VOP)分段為視頻分組(VP),以及將視頻分組分段為數(shù)據(jù)分區(qū)(DP)的語法模式,對所述視頻比特流進(jìn)行編碼時(shí),視頻數(shù)據(jù)分區(qū)被映射到一個(gè)或多個(gè)同步層分組(SL分組)中,即使大的視頻數(shù)據(jù)分區(qū)被分為多個(gè)SL分組,所述第一個(gè)視頻數(shù)據(jù)分區(qū)的開始也總是被映射到SL分組的開始,并且傳輸所述第一數(shù)據(jù)分區(qū)的最后一個(gè)SL分組包括所述分隔標(biāo)記以及多達(dá)7個(gè)后續(xù)的所述第二數(shù)據(jù)分區(qū)比特,以獲得字節(jié)對準(zhǔn),下一SL分組開始于所述第二數(shù)據(jù)分區(qū)的下一比特。
全文摘要
本發(fā)明涉及一種用于根據(jù)MPEG-4標(biāo)準(zhǔn)對由一個(gè)或多個(gè)比特流組成的視頻數(shù)據(jù)進(jìn)行編碼的方法和裝置。為了避免當(dāng)將視頻元素映射到系統(tǒng)元素中的任何問題,選擇特定的對準(zhǔn)/分段機(jī)制。根據(jù)這種機(jī)制,當(dāng)利用對應(yīng)于將包括在視頻數(shù)據(jù)中的視頻對象平面(VOP)分段為視頻分組(VP),以及將視頻分組分段為數(shù)據(jù)分區(qū)(DP)的語法模式,對所述視頻比特流進(jìn)行編碼時(shí),視頻數(shù)據(jù)分區(qū)被映射到一個(gè)或多個(gè)SL分組中(SL1、SL2、SL3、SL4...),第一個(gè)視頻數(shù)據(jù)分區(qū)(DP1)的開始總是被映射到SL分組的開始,并且傳輸?shù)谝粋€(gè)數(shù)據(jù)分區(qū)的最后一個(gè)SL分組包括分隔標(biāo)記以及多達(dá)7個(gè)后續(xù)第二數(shù)據(jù)分區(qū)(DP2)比特,從而獲得字節(jié)對準(zhǔn),下一SL分組開始于第二數(shù)據(jù)分區(qū)的下一比特。
文檔編號H04N7/24GK1457602SQ02800255
公開日2003年11月19日 申請日期2002年2月25日 優(yōu)先權(quán)日2001年2月27日
發(fā)明者P·根特里克, B·尼佐特, Y·拉曼津 申請人:皇家菲利浦電子有限公司