專利名稱:用于使用切片內(nèi)再同步點的錯誤恢復(fù)的方法及設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于使用錯誤管理方案來對數(shù)字?jǐn)?shù)據(jù)進行編碼及解碼的方法和設(shè)備。
背景技術(shù):
在移動通信系統(tǒng)中,對更高數(shù)據(jù)速率及更高服務(wù)質(zhì)量的需求日益迅速增長。然而, 例如有限的發(fā)射功率、有限的帶寬及多路徑衰落等因素仍在繼續(xù)限制實際系統(tǒng)所處理 的數(shù)據(jù)速率。在多媒體通信中,特別是在易出錯環(huán)境中,所傳輸媒體的錯誤恢復(fù)力在 提供期望的服務(wù)質(zhì)量方面至關(guān)重要,這是因為甚至是單個經(jīng)解碼值中的錯誤也可能導(dǎo) 致解碼假象在空間及時間上傳播。人們已使用了各種編碼措施以在維持必要的數(shù)據(jù)速
率的同時使錯誤最小化,然而,所有這些技術(shù)均存在錯誤會到達解碼器側(cè)的問題。
混合編碼標(biāo)準(zhǔn),例如MPEG-1、 MPEG-2、 MPEG-4 (統(tǒng)稱為MPEG-x)、 H.261、 H.262、 H.263及H.264 (統(tǒng)稱為H.26x)描述了數(shù)據(jù)處理及操縱技術(shù)(在本文中稱作 混合編碼),所述數(shù)據(jù)處理及操縱技術(shù)非常適用于使用固定或可變長度源編碼技術(shù)來壓 縮及遞送視頻、音頻及其它信息。特定而言,以上所提及的標(biāo)準(zhǔn)及其它混合編碼標(biāo)準(zhǔn) 和技術(shù)說明性地使用幀內(nèi)熵編碼技術(shù)(例如,運行長度編碼、哈夫曼(Huffman)編 碼及類似技術(shù))及幀間編碼技術(shù)(例如,正向及反向預(yù)測性編碼、運動補償及類似技 術(shù))來壓縮視頻信息。具體而言,在視頻處理系統(tǒng)情況下,混合視頻編碼系統(tǒng)的特征 是使用幀內(nèi)及/或幀間運動補償編碼對視頻幀進行基于預(yù)測的壓縮編碼。
熵編碼能夠?qū)τ呻S機信息源所產(chǎn)生的符號實施非常有效的無損表示。因此,其是 無損數(shù)據(jù)壓縮方案與有損數(shù)據(jù)壓縮方案二者中必不可少的組元。熵編碼盡管對壓縮效 率非常有益,然而其也會使解碼過程復(fù)雜化。所有不同熵編碼方法的共同特征是使單 個或一系列源符號與二進制圖案(即,稱作碼字的一系列1及0)相關(guān)聯(lián)并由所述二 進制圖案表示,而所述碼字的長度會隨符號似然性的降低而增大。因而,更似然的符
號會指配到更緊湊的表示形式,從而平均而言,能夠相對于基于固定長度表示法的直 接符號字母大小實現(xiàn)明顯的節(jié)約。
關(guān)于位流(即,信息源的輸出的熵編碼表示形式)中下一符號將耗用多少個位的 多義性對于解碼器而言頗為復(fù)雜。然而,更為重要的是,倘若位流中存在錯誤,則將 可變大小的碼字與已翻轉(zhuǎn)位(因為出現(xiàn)錯誤)結(jié)合使用可能常常會導(dǎo)致仿效不正確碼 字長度且因而,剖析/解碼過程可能會喪失其與位流的同步,即,可能會開始不能對碼 字邊界進行正確識別且因而不能對位流進行正確解譯。
假定執(zhí)行基本程度錯誤檢測措施的解碼器在解碼位流中遇到問題并喪失同步。最 終,或者由于違背語法(即,碼字無效),或者由于語義不對(例如,參數(shù)值無效或出 現(xiàn)不期望的位流對象),所述解碼器可能開始意識到所述問題并釆取必要措施來使其自 身與所述位流重新同步化。這可能會導(dǎo)致數(shù)據(jù)丟失的程度遠遠超過開始就觸發(fā)數(shù)據(jù)丟 失的訛誤。由于在數(shù)字壓縮中所使用的空間預(yù)測,數(shù)據(jù)丟失可能會在整個幀中在空間 上蔓延。如果所丟失數(shù)據(jù)是用于運動補償預(yù)測區(qū)域的參考幀的一部分,則數(shù)^丟失還 會加劇,從而導(dǎo)致錯誤在時間上的傳播。
'MPEG-x及H.26x混合編碼標(biāo)準(zhǔn)通常提供在^ALU (網(wǎng)絡(luò)抽象層單元)邊界處再 同步點(RSP),最常見的NALU是切片。切片可是一群組呈光柵掃描次序的連續(xù)宏塊, 其中宏塊由16x16個像素構(gòu)成。像素是由亮度值(Y)及兩個色度值(Cr及Cb)來界 定。在H.264中,以4:2:0格式來存儲Y、 Cr及Cb分量,其中Cr及Cb分量是沿X 及Y方向按2倍縮減取樣。因而,每一宏塊也將由256個Y分量、64個Cr分量及64 個Cb分量組成。H.264通過引入切片群組及撓性宏塊排序(FMO)來對切片概念進行 了歸納。切片群組及FMO使切片與宏塊的關(guān)聯(lián)性能夠完全隨意,從而提供遠遠超過 傳統(tǒng)連續(xù)宏塊結(jié)構(gòu)的靈活性。切片是始于稱作前綴碼的RSP。 RSP前綴碼是字節(jié)定位 的保留位串碼字,所述碼字為三個字節(jié)長的數(shù)量級。為用作真實的再同步點,所有編 碼間預(yù)測鏈避免提及所述RSP之前的數(shù)據(jù)。因前綴碼字節(jié)所引起的開銷以及因預(yù)測性 編碼鏈中斷或劣化所引起的編碼效率損失是頻繁使用切片(即,使用短切片)的缺點 所在,所述缺點抹煞了其在支持錯誤恢復(fù)力方面的優(yōu)點。根據(jù)所述關(guān)切因素,作為缺 省編碼器行為,將整個幀編碼成單個切片并不罕見。另一種流行的更短切片結(jié)構(gòu)是使 每一宏塊行構(gòu)成切片。短于宏塊行的切片則很少使用且當(dāng)使用時,理由大多是使切片 大小(以位數(shù)量為單位)與所需運送的分組大小相匹配。
在傳統(tǒng)的基于切片的再同步方案中,如果在解碼器處檢測到數(shù)據(jù)中存在錯誤,例 如語義或語法錯誤(例如),則使得在錯誤之后出現(xiàn)的整個切片無用。這不是期望狀態(tài), 對于例如整個幀的更長切片尤其如此。需要一種可搶救包含于訛誤切片中的某些視頻 數(shù)據(jù)的片內(nèi)再同步點(IS-RSP)。另外,需要以智能方式對IS-RSP加以定位以使錯誤 恢復(fù)力最大化、同時減小開銷
發(fā)明內(nèi)容
200680014472.6
說明書第3/15頁
一種用于視頻編碼的方法及設(shè)備包括用于如下的方法及裝置對再同步點信息進 行編碼,其中所述再同步點信息包括用于識別再同步點在視頻位流的區(qū)段內(nèi)的位置的 信息、及用于對跟在所述再同步點后的位流進行解碼的信息;及傳輸所述經(jīng)編碼的再 同步點信息。
在另一方面, 一種用于視頻編碼的設(shè)備包括編碼器,其用于對再同步點信息進 行編碼,其中所述再同步點信息包括用于識別再同步點在視頻位流的區(qū)段內(nèi)的位置的 信息、及用于對跟在所述再同步點后的位流進行解碼的信息;及通信器,其經(jīng)配置以 傳輸所述經(jīng)編碼的再同步點信息。
在以上方面,所述用于視頻編碼的方法及設(shè)備可進一步包括用于如下的方法或裝 置計算多個候選位置的速率失真成本;及根據(jù)所述計算的速率失真成本來選擇所述 候選位置中的至少一者作為所述再同步點的位置。所述用于視頻編碼的方法及設(shè)備可 進一步包括用于如下的方法或裝置選擇所述再同步點在所述視頻位流的區(qū)段內(nèi)的位 置,其中所述區(qū)段是由子宏塊、宏塊、切片、幀、及幀序列組成的群組的成員。所述
用于視頻編碼的方法及設(shè)備可進一步包括用于如下的方法或裝置選擇所述再同步點 在所述視頻'位流的區(qū)段內(nèi)的位置,其中所述再同步點是宏塊的開始。
所述用于對所述位流進行解碼的信息可包括與鄰近視頻區(qū)段相關(guān)的信息。所述用 于對所述位流進行解碼的信息可包括由量化參數(shù)、空間預(yù)測模式標(biāo)識符及若干非零系 數(shù)組成的群組的成員。所述用于對所述位流進行解碼的信息可包括與其中所述位流跟 在所述再同步點后的上下文相關(guān)的信息。
所述用于視頻編碼的方法及設(shè)備可進一步包括用于如下的方法或裝置將所述再 同步點信息編碼于數(shù)據(jù)消息中,其中所述數(shù)據(jù)消息是帶內(nèi)應(yīng)用消息、用戶專用私有數(shù) 據(jù)消息、輔助增強信息消息、及MPEG用戶數(shù)據(jù)消息中的一者。所述用于對所述位流 進行解碼的信息可包括與其中所述位流跟在所述再同步點后的上下文相關(guān)的信息。
在另一方面, 一種用于解碼的方法及設(shè)備包括用于如下的方法或裝置接收包括 再同步點信息的經(jīng)編碼位流,其中所述再同步點信息包括用于識別再同步點的位置的 信息及用于對跟在所述再同步點后的位流進行解碼的信息;及對所述接收的位流進行 解碼。
在又一方面, 一種用于對視頻進行解碼的設(shè)備包括接收機,其用于接收包括再 同步點信息的經(jīng)編碼位流,其中所述再同步點信息包括用于識別再同步點的位置的信
息及用于對跟在所述再同步點后的位流進行解碼的信息;及解碼器,其用于對所述接
收的位流進行解碼。
在上文中,所述用于解碼的方法及設(shè)備可進一步包括用于如下的方法或裝置根 據(jù)所述再同步點信息定位所述位流中的再同步點。所述用于對所述位流進行解碼的信 息可包括與其中對跟在所述再同步點后的位流進行編碼的上下文相關(guān)的信息。所述用 于解碼的方法及設(shè)備可進一步包括用于如下的方法或裝置將所述經(jīng)解碼位流的當(dāng)前 上下文與包含于所述再同步點信息中的所接收上下文信息相比較;及如果所述比較顯
示所述當(dāng)前上下文與所述接收的上下文信息不相同,則停止對所述位流進行解碼并在 所述再同步點處重新開始對所述位流進行解碼。所述再同步點的位置可處于視頻區(qū)段 內(nèi),所述視頻區(qū)段選自由子宏塊、宏塊、切片、幀、及幀序列組成的群組中的成員。 所述再同步點的位置可是宏塊的開始。
所述用于對所述位流進行解碼的信息可包括與鄰近視頻區(qū)段相關(guān)的信息。所述用 于對所述位流進行解碼的信息可包括由量化參數(shù)、空間預(yù)測模式標(biāo)識符及若干非零系 數(shù)組成的群組的成員。
所述用于解碼的方法及設(shè)備可進一步包括用于如下的方法或裝置接收數(shù)據(jù)消息 中的再同步點信息,其中所述數(shù)據(jù)消息是由帶內(nèi)應(yīng)用消息、用戶專用私有數(shù)據(jù)消息、 輔助增強信息消息、及MPEG用戶數(shù)據(jù)消息組成的群組中的成員。所述用于解碼的方 法及設(shè)備可進一步包括用于如下的方法或裝置接收使用可變長度代碼所編碼的再同 步點信息。所述用于解碼的方法及設(shè)備可進一步包括用于如下的方法或裝置檢測所 述位流中的錯誤;停止對所述位流的解碼;及在所述經(jīng)定位的再同步點處繼續(xù)進行解 碼。
在又一方面, 一種用于對多媒體數(shù)據(jù)進行編碼的方法及設(shè)備包括用于如下的方法 或裝置對再同步點數(shù)據(jù)進行編碼;及將所述再同步點數(shù)據(jù)插入多媒體流切片中。所 述用于編碼的方法及設(shè)備可進一步包括用于如下的方法或裝置選擇所述切片內(nèi)的再 同步點的位置;且其中所述插入包括將所述再同步點插入所述選定的位置中。所述用 于選擇的方法及裝置可包括計算多個候選位置的速率失真成本;及根據(jù)所述速率失 真成本來選擇至少一個候選位置。所述再同步點可包括所述多媒體數(shù)據(jù)的上下文信息。
在又一方面, 一種用于處理多媒體流的方法及設(shè)備包括用于如下的方法或裝置 接收多媒體流切片中的再同步點數(shù)據(jù);及根據(jù)所述再同步點數(shù)據(jù)來重組多媒體數(shù)據(jù)。 所述再同步點可包括所述多媒體數(shù)據(jù)的上下文信息。
在以上方面,可使用經(jīng)配置以執(zhí)行所述方法或執(zhí)行所述設(shè)備的功能的計算機可讀 媒體及/或處理器來構(gòu)建所述方法及/或設(shè)備。
圖1是用于遞送流式視頻的通信系統(tǒng)的實例的圖解; 圖2描繪16x16像素宏塊及鄰近的16x16像素宏塊的實例; 圖3圖解說明用于對IS-RSP進行編碼的過程的實例; 圖4描繪其中通過利用IS-RSP來遏制錯誤傳播的視頻幀; 圖5是用于識別最佳候選IS-RSP位置的IS-RSP編碼方案的實例; 圖6描繪供在用于識別最佳候選IS-RSP位置的速率失真分析中使用的錯誤機率 及關(guān)聯(lián)失真的實例;
圖7是利用IS-RSP的解碼器過程的實例的圖解;及
圖8是利用IS-RSP的解碼器過程的另一實例的圖解。
圖9-10圖解說明用于對IS-RSP進行編碼的實例性方法及設(shè)備。
圖11-12圖解說明用于解碼的實例性方法及設(shè)備。
圖13-14圖解說明用于對IS-RSP進行編碼的實例性方法及設(shè)備。
圖15-16圖解說明用于處理多媒體流的實例性方法及設(shè)備。
具體實施例方式
本發(fā)明描述用于在視頻位流(例如,切片)的區(qū)段內(nèi)提供改進的再同步點的方法 及設(shè)備。編碼器可提供再同步點信息,所述再同步點信息包含用于定位所述再同步點 的信息、以及用于跟在對所述再同步點后的位流進行解碼的信息。由于所述再同步點 位于所述視頻位流的區(qū)段內(nèi),因而解碼器可在所述再同步點處再同步化而不會犧牲所 述區(qū)段中的其余數(shù)據(jù)。其實例適用于包括視頻、音頻、或視頻及音頻數(shù)據(jù)二者的多媒 體數(shù)據(jù)。在下文說明中,為提供對所述實施例的透徹理解而給出特定細節(jié)。然而,所 屬領(lǐng)域的技術(shù)人員應(yīng)了解,所述實施例可在不具備所述特定細節(jié)的情況下實施。仔,如, 電組件可按方塊圖形式加以顯示,以免以不必要的細節(jié)形式使所述實施例不分明。'在 其它例示中,可詳細顯示此類組件、其它結(jié)構(gòu)及技術(shù)以進一步解釋所述實施例。
也應(yīng)注意,可將所述實施例描述為過程,所述過程被描繪為流程圖、工藝流程圖、 結(jié)構(gòu)圖或方塊圖。盡管流程圖可將各作業(yè)描述為順序性過程,然而還可平行或同時實 施所述作業(yè)中的許多作業(yè)并可重復(fù)所述過程。另外,可重新排列各作業(yè)的次序。當(dāng)其 作業(yè)完成時,所述過程即告結(jié)束。 一個過程可對應(yīng)于一種方法、功能、程序、子例程、 子程序等。當(dāng)一個過程對應(yīng)于一種功能時,其結(jié)束對應(yīng)于所述功能返回到調(diào)用功能或 主功能。
圖1是用于遞送流式視頻的通信系統(tǒng)的實例的圖解。系統(tǒng)100包含編碼器裝置105 及解碼器裝置iio。編碼器裝置105進一步包含變換器/量化器組件115、熵編碼器組 件120、 IS-RSP定位器組件125、存儲器組件130、處理器組件135、及通信組件140。 處理器135提供計算平臺以實施其它組件的過程。變換器/量化器組件115將視頻數(shù)據(jù) 從空間域變換到另一個域,例如在DCT (離散余弦變換)情形中為頻域。將對其進行 變換的數(shù)據(jù)可是經(jīng)幀內(nèi)編碼的數(shù)據(jù)(其中對實際視頻數(shù)據(jù)實施變換)或者其可是經(jīng)幀 間編碼的數(shù)據(jù)(其中對運動向量及殘余錯誤實施變換)。其它數(shù)字變換包括哈達馬德 (Hadamard)變換、DWT (離散小波變換)、及整數(shù)變換(例如,在H.264中所用的 變換)。
變換器/量化器組件115分配用于表示每一經(jīng)變換系數(shù)的位數(shù)量。對經(jīng)變換系數(shù)的 量化可因每一宏塊而異。熵編碼器組件120使用上下文自適應(yīng)性可變長度編碼 (CAVLC)方案對殘余塊數(shù)據(jù)進行編碼而其它經(jīng)可變長度編碼的單元可使用 Exp-Golomb代碼來進行編碼。殘余塊數(shù)據(jù)是預(yù)測與正被編碼的原始塊像素信息之間的
差。在切片層以上,將語法要素編碼成固定長度或可變長度的二進制碼。在切片層及 以下,則使用可變長度代碼(VLC)對各要素進行編碼。H.264標(biāo)準(zhǔn)還支持基于上下 文的自適應(yīng)性二進制算術(shù)編碼(CABAC)作為熵編碼方案。本文所論述的實例性方法 涉及CAVLC熵編碼方案,但類似方法也可與CABAC熵編碼一起使用。IS-RSP定位 器組件125實施用于在切片內(nèi)識別一組可用作IS-RSP的宏塊邊界的計算。在一種方案 中,在尋找IS-RSP的最佳位置時實施速率失真成本優(yōu)化分析。存儲器組件130用于存 儲例如要編碼的原始視頻數(shù)據(jù)、要傳輸?shù)慕?jīng)編碼視頻數(shù)據(jù)、或正由各種編碼器組件處 理的中間數(shù)據(jù)等信息。
通信組件140 (例如接收機)含有用于從外部源145接收要編碼數(shù)據(jù)的電路及/ 或邏輯。外部源145可是例如外部存儲器、因特網(wǎng)、實況視頻及/或音頻饋入,且接收 數(shù)據(jù)可包含有線及/或無線通信。通信組件140也含有用于通過網(wǎng)絡(luò)150來發(fā)射(TX) 經(jīng)編碼數(shù)據(jù)的電路及/或邏輯,例如發(fā)射機。網(wǎng)絡(luò)150可是例如電話、電纜及光纖等有 線系統(tǒng)或者無線系統(tǒng)的一部分。在無線通信系統(tǒng)的情況下,網(wǎng)絡(luò)150可包括(例如) 碼分多址(CDMA或CDMA2000)通信系統(tǒng)的一部分,或另一選擇為,所述系統(tǒng)可是 頻分多址(FDMA)系統(tǒng);時分多址(TDM'A)系統(tǒng),例如用于服務(wù)行業(yè)的GSM/GPRS (通用分組無線電服務(wù))/EDGE (加強型數(shù)據(jù)GSM環(huán)境)或TETRA (地面中繼無線 電)移動電話技術(shù);寬帶碼分多址(WCDMA);高數(shù)據(jù)速率(lxEV-DO或lxEV-DO 金牌多播)系統(tǒng);或一般而言,任一采用各種技術(shù)的組合的無線通信系統(tǒng)??蓪⒕幋a 器裝置105中的一個或一個以上元件予以省略、重新排列及/或加以組合。例如,處理 器組件135可位于編碼器裝置105外部。
解碼器裝置110含有與編碼器裝置105相似的組件,包含反變換器/解量化器組件 155、熵解碼器組件160、錯誤恢復(fù)組件165、存儲器組件170、通信組件175及處理 器組件180。解碼器裝置110接收已通過網(wǎng)絡(luò)150或從外部存儲器185傳輸?shù)慕?jīng)編碼 數(shù)據(jù)。通信組件175含有用于與網(wǎng)絡(luò)150相結(jié)合來接收(Rx)經(jīng)編碼數(shù)據(jù)的電路及/ 或邏輯(例如,接收機)、以及用于從外部存儲器185接收經(jīng)編碼數(shù)據(jù)的邏輯。外部存 儲器185可是(例如)外部RAM或ROM、或者遠程服務(wù)器。首先由熵解碼組件160 對經(jīng)幀內(nèi)編碼的數(shù)據(jù)進行解碼。在熵解碼之后,由反變換器/解量化器組件155將所述 數(shù)據(jù)解量化及反變換,從而得到可顯示于顯示器組件190上的已解碼圖片。
在對從其預(yù)測經(jīng)幀間編碼的數(shù)據(jù)的參考幀進行解碼后,可對所述經(jīng)幀間編碼的數(shù)
據(jù)進行解碼。熵解碼器組件160對所述數(shù)據(jù)進行解碼,從而得到經(jīng)量化/變換的殘余錯 誤系數(shù)。反變換器/解量化器組件155對所述殘余錯誤系數(shù)進行解量化及反變換,從而 得到經(jīng)解碼的殘余錯誤。然后,將所述殘余錯誤與來自所述參考幀的最佳匹配宏塊相 組合,所述最佳匹配宏塊是使用所接收的運動向量信息來識別。經(jīng)解碼的幀可通過顯 示器組件190加以顯示,并存儲于外部存儲器185中或存儲于處理器組件180的內(nèi)部 存儲器中。顯示器組件190可是含有例如視頻顯示硬件及邏輯(包括顯示屏幕)等部 件的解碼裝置的整體部分,或者其可是外部外圍裝置。通信組件175也含有用于將經(jīng)
解碼幀傳送到外部存儲組件185或顯示器組件190的邏輯。
熵解碼器組件160也含有用于實施各種語法及語義檢查的邏輯。語法及語義檢查 用于識別違背任何數(shù)條規(guī)則的的訛誤碼字。如果確定位流出現(xiàn)訛誤,則錯誤恢復(fù)組件 165定位所述位流中下一最接近的非訛誤IS-RSP的位置,以允許繼續(xù)進行解碼。由 IS-RSP定位器組件125及錯誤恢復(fù)組件165所實施的過程的細節(jié)將在下文中予以論 述??蓪⒕幋a器裝置110中的一個或一個以上元件予以省略、重新排列及/或加以組合。 例如,處理器組件180可位于編碼器裝置105外部。
在H.264中引入上下文自適應(yīng)性可變長度編碼(CAVLC)會使再同步問題復(fù)雜化。 在H.264中,在上下文中對許多個符號進行編碼,且每一符號的機率隨其在被編碼時 所處的上下文(也就是說,在符號之前己處理過什么)而異。由于存在此種上下文相 依性,因此不僅丟失符號將存在喪失同步的風(fēng)險,且丟失其它用于確定所述符號在被 編碼時所處上下文的數(shù)據(jù)也將存在喪失同步的風(fēng)險。因此,為在CAVLC位流中提供 再同步點(IS-RSP),解碼器不僅需要位流中査看的位置,且其也可能需要后續(xù)符號所 依賴的上下文信息。
'現(xiàn)在將論述顯示在IS-RSP中需要什么信息以啟用H.264上下文自適應(yīng)性位流中 的再同步的實例。圖2描繪16x16像素宏塊及鄰近16x16宏塊的實例。宏塊200含有 16個4x4像素塊201至216。在這個實例中,假定宏塊200是經(jīng)幀內(nèi)編碼的宏塊。經(jīng) 幀內(nèi)編碼的宏塊與經(jīng)幀間編碼的宏塊的上下文相依性有所不同。用于經(jīng)幀內(nèi)編碼的宏 塊200的上下文自適應(yīng)性編碼相依于鄰近宏塊220及230的參數(shù)。對宏塊200的編碼 及解碼相依于鄰近的四個4x4像素塊221到224中及鄰近的四個4x4像素塊231到234 中非零系數(shù)(Y、 Cr及Cb系數(shù))的數(shù)量。對宏塊200的編碼及解碼還相依于用于對 宏塊220進行編碼的量化參數(shù)值且在某些情況下相依于塊221到224及塊231到234 的幀內(nèi)預(yù)測模式。如果在對塊200的CAVLC經(jīng)編碼符號進行解碼時,宏塊220或230 的上下文參數(shù)丟失,則解碼器將無法繼續(xù)進一步解碼并需要進行再同步。在H.264中, 因使用NALU前綴碼進行再同步,含有宏塊200的切片的其余部分可能會丟失。然而, 如果宏塊200是再同步點,則無論宏塊220及230的狀態(tài)如何,解碼也可繼續(xù)進行, 這是因為IS-RSP含有關(guān)于鄰近塊的必要上下文參數(shù),如下文所述。
可通過對包括用于在視頻位流的區(qū)段內(nèi)識別再同步點位置的信息的再同步點信 息進行編碼、并對用于對跟在所述再同步點后的位流進行解碼的信息進行編碼,來形 成再同步點。
例如,為使宏塊200成為再同步點,可用解碼器用于定位IS-RSP標(biāo)記240且因 此定位宏塊200的信息對IS-RSP消息進行編碼。為提供健壯的再同步點,所述IS-RSP 消息可含有使解碼器對宏塊200進行解碼所需的鄰近MB信息(即,為對宏塊200進 行解碼所需的相依性信息)、以及與宏塊在幀內(nèi)的位置相關(guān)的信息和與宏塊在位流內(nèi)的 位置相關(guān)的信息。
作為實例,為在例如H.264中使經(jīng)幀內(nèi)編碼的宏塊200用作再同步點,IS-RSP分
組可含有以下H.264特定參數(shù)
MB位偏移量,其給出所述IS-RSP宏塊在位流內(nèi)的開始的位置。
MB地址偏移量或索引,其標(biāo)識所述IS-RSP宏塊的空間位置。
位于所述IS-RSP宏塊頂部左側(cè)的8個4x4塊塊的非零系數(shù)的數(shù)量。
位于所述IS-RSP宏塊頂部左側(cè)的8個4x4塊的幀內(nèi)預(yù)測模式。(如果IS-RSP 指向以幀內(nèi)16x16模式編碼的宏塊,則可省略所述信息)。
位于所述IS-RSP宏塊左側(cè)的MB的量化參數(shù)(QP)值。 其中最后三項識別如上文所論述的上下文自適應(yīng)性參數(shù)。
將用作再同步點的經(jīng)幀間編碼宏塊可具有相同的MB位偏移量及MB地址偏移量 信息,但可具有不同的與鄰近宏塊相關(guān)的信息或其它上下文自適應(yīng)性相依量。經(jīng)幀間 編碼的MB的上下文自適應(yīng)性參數(shù)包含以下信息
鄰近MB的模式(頂部及底部的宏塊)。
鄰近4x4塊中非零系數(shù)的數(shù)量。
鄰近4x4塊的運動向量及參考圖片索引。
在一個實^J中,可在"用戶數(shù)據(jù)未登記(user—data—unregistered)"輔助增強信息 (SEI)消息中發(fā)送IS-RSP數(shù)據(jù),借此維持H.264位流的相符性。盡管以上實例是具 體針對H.264標(biāo)準(zhǔn),然而IS-RSP的基本原理也可容易地應(yīng)用于其它混合視頻編碼標(biāo)準(zhǔn), 例如,MPEG-x及H.26x。由于所有這些標(biāo)準(zhǔn)的語法也以某種或其它方式為載送帶內(nèi) 應(yīng)用數(shù)據(jù)/用戶專用私有數(shù)據(jù)(例如,H.264中的SEI消息或MPEG-2中的用戶數(shù)據(jù) (user—data))提供條件,因而確實能夠如此。還可使用壓縮編碼技術(shù)對IS-RSP數(shù)據(jù) 進行編碼來提高編碼效率。例如,如果IS-RSP在幀中在空間上彼此靠近,則可使用空 間預(yù)測技術(shù)對IS-RSP數(shù)據(jù)進行編碼來提高編碼效率。
可將切片內(nèi)再同步點或IS-RSP擴展到視頻區(qū)段而非切片。切片、或者在MPEG-x 標(biāo)準(zhǔn)中將其稱為塊群組的是H.264或MPEG-x視頻序列體系架構(gòu)中許多個經(jīng)分隔的區(qū) 段中的一者。H.264體系架構(gòu)包含由一個或一個以上圖片(或幀)構(gòu)成的序列,其中 圖片是由一個或一個以上切片構(gòu)成且其中切片是由一個或一個以上宏塊構(gòu)成??蓪⒑?塊進一步分隔成各種大小的子宏塊。再同步點可含有能在任一層經(jīng)分隔的視頻(例如 序列內(nèi)、幀內(nèi)以及切片內(nèi))上啟用再同步的信息。例如,如果切片標(biāo)題信息出現(xiàn)訛誤, 則能在所述訛誤切片處啟用再同步的RSP將需要所述切片標(biāo)題信息且RSP將有效地為 幀內(nèi)RSP。
并不需要對每一宏塊發(fā)送IS-RSP,這是因為將需要巨大量的開銷數(shù)據(jù)。編碼器裝 置可使用一種算法(例如下文所述的一種算法)來智能地選擇將IS-RSP定位于何處。 下文所述的算法是一種用于使開銷保持最小、同時改進錯誤恢復(fù)力的方法的實例。
可通過編碼過程來產(chǎn)生再同步點并將再同步點提供到解碼過程來解決信道損傷 (根據(jù)下文將要說明的折衷而盡可能頻繁地進行)。同樣,再同步點還可在位流中唯一 地加以識別。此外,其結(jié)構(gòu)可提供相當(dāng)好的抗干擾水準(zhǔn)來抵抗因噪音引起的仿效以及
因噪音引起達到使其不能可靠檢測程度的修改(就統(tǒng)計意義而言)。再同步點可用于通 過將所有預(yù)測器初始化到能限制將來的空間及/或時間預(yù)測涉及IS-RSP之前的宏塊的 適當(dāng)缺省值,來阻止預(yù)測性編碼相依性的傳播。
對用于識別切片內(nèi)再同步點的編碼過程的綜合且正確的設(shè)計可將如下考慮在內(nèi) 1)信道模型,2)針對特定應(yīng)用的帶寬及質(zhì)量(失真)約束條件,及3)幀的內(nèi)容。
視應(yīng)用而定,可能期望存在內(nèi)容相依性。在一種可能的應(yīng)用中,可利用特定切片 不存在片內(nèi)再同步點來向解碼器暗示倘若在所述切片中出現(xiàn)錯誤及隨之出現(xiàn)的數(shù)據(jù) 丟失,則可非常令人滿意地實施為解碼器與編碼器兩者所已知的適當(dāng)(空間或時間) 隱匿算法。
下文提供并入有內(nèi)容自適應(yīng)性形式的實例性IS-RSP編碼方案。所述方案也可用
于圖解說明將由編碼器采用的用于識別再同步點的位置的總體架構(gòu)及原理。
圖3圖解說明用于對IS-RSP進行編碼的實例性過程的實例。過程300包含用于 從多個候選位置中識別出最優(yōu)或接近最優(yōu)的IS-RSP位置的迭代循環(huán)。這允許以可變方 式或自適應(yīng)性方式選擇IS-RSP的位置。這種可變性或自適應(yīng)性會提供優(yōu)于其中使連續(xù) 再同步點相隔固定距離定'位(例如,每100個宏塊一個再同步點)的方法的優(yōu)點。可 由編碼裝置(例如,IS-RSP定位組件125)與圖1中的處理器135 —起實施過程300。 在步驟305處,編碼器(或選擇器)選擇IS-RSP的候選位置。選擇IS-RSP候選位置 的方法的細節(jié)將在下文中予以論述。在步驟310處,計算量度,例如,速率失真成本。 在步驟310中所用的量度,例如在下文中所論述的速率失真成本,是用于衡量因IS-RSP
而增加的位數(shù)量與由預(yù)期錯誤所造成的潛在失真之間的折衷。使用對各候選位置的速 率失真成本的比較來選擇315所述IS-RSP位置??蓪⑺x定位置(根據(jù)成本計算310) 存儲于存儲器中。決策塊320測試是否還有候選位置要測試,如果還存在更多的候選 位置,則重復(fù)步驟305、 310及315,而如果不再存在更多的候選位置,則通過在步驟 325中對IS-RSP信息進行編碼來結(jié)束過程300??蓪⑦^程300中的一個或一個以上要 素予以省略、重新排列及/或加以組合。
圖4描繪其中通過利用IS-RSP來控制錯誤傳播的視頻幀。幀400表示由單個切 片及六個行420a-420f構(gòu)成的經(jīng)內(nèi)編碼的幀,其中行420a-420f由若干宏塊(未顯示) 構(gòu)成。例如圖3中所示的編碼過程已在幀400中定位了多個IS-RSP405。如在上文中 所述及在圖2中所描繪,對每一經(jīng)內(nèi)編碼的宏塊的解碼也相依于包含于正被解碼的宏 塊左側(cè)及上方鄰近宏塊中的知識。如果在幀400中不包含IS-RSP405,則錯誤410將 在經(jīng)歷所述錯誤后得到解碼的整個幀中傳播。由于解碼器將被迫在下一切片(下一 NALU前綴碼)處再同步,這將導(dǎo)致丟失第二行420b的大部分及所有行420c-420f。 而通過如圖所示來定位IS-RSP,則可將錯誤傳播限制在位于IS-RSP 405b左側(cè)及下方 的區(qū)415。在所述再同步點IS-RSP405b之后,在行420b中,可對所述行的其余部分 進行解碼。在行420c中,位于訛誤宏塊下面的宏塊直到下一再同步點處405c處才能 被重組,這是因為其相依于上面的鄰近宏塊。由于行420c中的IS-RSP405c位于行420b
中IS-RSP405b的左側(cè),因而行420c中的錯誤415更早地得到遏制。這是遠比由切片 再同步NALU所提供失真條件更為有利的失真條件。
圖5是用于識別候選IS-RSP位置的IS-RSP編碼方法的實例。幀500由若干個行 505構(gòu)成,其中每一行505也構(gòu)成切片。在這個實例中,編碼器將在每一切片中提供 兩個IS-RSP,每一IS-RSP也位于窄的宏塊區(qū)域內(nèi)。第一區(qū)域包含三個宏塊位置510、 515及520,而第二區(qū)域包含三個宏塊位置525、 530及535。通過如圖所示將切片定 位于居中定位的切片部分中,可減輕錯誤的傳播。
下文所述的速率失真(R-D)優(yōu)化問題可利用以下命名法、量值及標(biāo)記法。假定 由下式求出的R-D成本函數(shù)的一般(復(fù)合)形式R+D
fi+zlZ [1〗 作為在尋找IS-RSP良好位置時要最小化的量。
R及D分別表示速率(為對IS-RSP進行編碼所需的位數(shù)量)及與選擇特定編碼 模式相關(guān)聯(lián)的失真(重組錯誤),且A是拉格朗日(Lagrange)乘數(shù),其描述速率與在 特定R-D優(yōu)化設(shè)定中將經(jīng)受的失真之間的折衷。因此,所述成本函數(shù)估計對再同步點 進行編碼所引起的額外成本與失真a小所帶來的節(jié)約之間的折衷。
在混合視頻編碼器中所實施的一種標(biāo)準(zhǔn)R-D優(yōu)化是一種在確定宏塊編碼+莫式時 所用的R-D優(yōu)化。 一般而言,這是具有多個參數(shù)的向量量,假定再同步點未施加任何 約束條件。針對緊靠位置i (其中ie(510, 515, 520}或^{525, 530, 535}右側(cè)的宏 塊對編碼器的標(biāo)準(zhǔn)R-D優(yōu)化公式求解會分別得到速率Rs,i及失真Ds,i。因而,假定不 存在再同步點插入及不存在數(shù)據(jù)丟失,則由下式求出總成本對于不可靠信道而言,公式2 (假定無數(shù)據(jù)丟失)不恰當(dāng),須加以修改。任何恰 當(dāng)?shù)墓揭岔毧紤]隨機信道行為,且因而,總成本可變?yōu)轭A(yù)期量(概率平均數(shù))而非 如在上面公式[2]中計算出的確定量。
更現(xiàn)實的丟失知曉分析可在選擇所述標(biāo)準(zhǔn)R-D優(yōu)化問題的解的同時使因錯誤而 引起的預(yù)期成本相關(guān)聯(lián)(即在位置i處不插入再同步點但可能存在丟失)。假定切片出 現(xiàn)錯誤的機率可加以確定并由Pe表示。還假定當(dāng)切片出現(xiàn)錯誤時,已在單個點處且在 數(shù)個位范圍內(nèi)出現(xiàn)訛誤。通過使用適當(dāng)(數(shù)據(jù)/符號)的交錯技術(shù),可實際上使所述兩 個假定非常精確,在數(shù)字無線通信情況下尤其如此。作為最后一個簡化,將假定當(dāng)切 片出現(xiàn)錯誤時,所述切片內(nèi)的確切錯誤位置相對于宏塊單元均勻地分布。更精確的模 型可能還己考慮到了所述切片中每一宏塊的編碼表示形式的大小(位數(shù)量)。根據(jù)上述
假定,可將與無再同步點插入相關(guān)聯(lián)的信道知曉預(yù)期總成本修改如下
+ ;i ( (l少》"5;, +嶺義。+IM) ) [3]
其中在公式[3]中新引入的參數(shù)描繪于圖6中。圖6描繪在用于識別最佳候選IS-RSP 位置的速率失真分析中使用的錯誤機率及關(guān)聯(lián)失真的實例。條件概率Pi (610)是在所
述切片中存在錯誤(其中Pe是出現(xiàn)錯誤的概率)條件下在位置"i"之前出現(xiàn)錯誤的概
率。DL,b (620)是因錯誤615而引起的與在即將插入的候選IS-RSP之前丟失的切片 數(shù)據(jù)相關(guān)聯(lián)的失真。Du是與在所述即將插入的候選IS-RSP之后丟失的數(shù)據(jù)相關(guān)聯(lián)的失真。
切片在針對位置"i" (605)所考慮的候選再同步點之后出現(xiàn)訛誤的機率并不會促 使插入所述候選再同步點,這是因為其將亳無益處。因此,為避免出現(xiàn)不公平的偏向, 在公式[3]中不存在因在位置"i" (605)右側(cè)發(fā)生可能的錯誤而造成切片數(shù)據(jù)丟失所引 起的失真成分。
在位置"i" (605)處存在片內(nèi)再同步點并不會避免在錯誤位置(610)與位置"i" (605)之間出現(xiàn)切片數(shù)據(jù)丟失。因此,倘若在所述候選再同步點之前出現(xiàn)錯誤,則因 丟失所述區(qū)段切片數(shù)據(jù)所可能引起的失真Du3 (620)是確定的。因而,將D"b (620) 包含于用于估計是否在"i" (605)處插入再同步點的預(yù)期總成本函數(shù)中。
量D^ (625)將會減小可供解碼器利用的適當(dāng)空間或時間隱匿算法的影響的失真 考慮在內(nèi)??紤]"未隱匿"及"完全隱匿"兩種極端情況(此將在下文中加以論述) 將頗為有趣且有所幫助。 '
理想的情況是,如果存在關(guān)于其將來用途的先驗信息,則量D^(625)也反映會 減小同一切片中后續(xù)IS-RSP的影響的失真。
下一步驟是計算(在一個實例中是使用速率失真計算器組件)與在位置"i" (605) 處實際插入IS-RSP相關(guān)聯(lián)的預(yù)期"信道知曉"R-D成本。編碼器在處理緊接在再同步 點之后(g卩,位于右側(cè))的宏塊時,須遵守支持上述再同步的實現(xiàn)的編碼約束條件(例 如,將所有預(yù)測器初始化到適當(dāng)缺省值)。假定根據(jù)這些約束條件,編碼器已將如下形 式的R-D優(yōu)化問題(非常類似于上文所述的標(biāo)準(zhǔn)R-D優(yōu)化問題)公式化并)f寸其求解.-(i W +及W)+線,'.4]
在公式[4]中,F(xiàn)^,i及DR,i分別是與為所述再同步點宏塊所選定的受約束編碼模式 相關(guān)聯(lián)的速率及失真(重組錯誤),且Ro,i是與將包含于所述位流中的所需開銷信息相 關(guān)聯(lián)的速率(例如,包含于SEI消息中的IS-RSP信息)。如上文所論述,公式[4]中的 R-D成本表達式并非信道知曉,且可將其作如下修改來引入信道知曉性--
(及W +及O,f ) + A ( £ jf,f + i7e.0 i.(JDilfl+ Dw》〉 [5〗
由于可在位置"i" (605)處重新開始解碼,因而可將失真DL,a (625)設(shè)定為0。 所得到的與將再同步點插入于位置"i"處相關(guān)聯(lián)的"信道既知"預(yù)期R-D成本由下式
求出
(及w +及o") + A < + A.(pf"i》)) [6]
因此,用于識別良好宏塊位置來定位IS-RSP的總體算法是將在無IS-RSP情況下 (參見如下公式[7])由公式[3]求出的R-D成本與在包含IS-RSP情況下(參見如下公 式[8])由公式[6]求出的R-D成本相比較。編碼器可計算以下兩個量 Cwo + 2 ( + &.0 義。+ ))) [7]
Q的- ( +) + A ( <1卞》.+ ) [81
可針對所有用于定位IS-RSP的候選位置(包括圖5中的Vie (510, 515, 520) 或Vie (525, 530, 535))來計算公式[7]及[8]。如果在所述候選位置的至少一個候選 位置中滿足不等式CRSP,^CN。j^p,i,則編碼器即決定插入IS-RSP。而如果在多于一個候 選位置處滿足不等式CKSp,^Q^Mp,i,則編碼器須作出選擇(如在圖3中的步驟315中 所示),所述選擇可有利于得到最小CRsp,i值的位置。這會在一定程度上實現(xiàn)內(nèi)容自適 應(yīng)性,因為當(dāng)再同步點與適當(dāng)圖像形體(例如豎直邊緣,來自所述豎直邊緣左側(cè)鄰近 者的水平預(yù)測跨越其已無法提供滿意的效能且因此是不期望的)對齊時,與再同步點 相關(guān)聯(lián)的編碼約束條件的重要性可能要小得多。在這些情況下,Riu及DK,i可能分別非 常接近Rs,i及Ds,i的值,從而會減小以完全靈活性編碼的效能優(yōu)點、并擴大因失真分
量(Pe.Pi.DL,a)而引起的CRSP,i與CN。jsp,i之間的差,由此增大IS-RSP插入的似然性。 如果考慮一種反映出顯著的失真關(guān)切因素(也就是說,假定其邊界遠離零的M直)
(^應(yīng)用及相匹配的編碼器設(shè)計,則會出現(xiàn)有趣的情形。還假定信道的Pe不可忽略不計。 ^解碼器處"無隱匿"的極端情況中,代表總信號'損失的失真分量DL,a可能非常大,
從而使項(pe.Pi.DL,a)成為支配項并使CN。_RSP,i (由公式[7]求出)大于CRSP,i (由公式[8]
求出),并因而建議插入再同步點。在另一極端情況中,如果假定"完全隱匿"(其可 通過成功的隱匿算法及適合的圖像內(nèi)容來很好地逼近),則所有因切片數(shù)據(jù)丟失而引起
的失真分量(Dl,*)也可消失,從而剩下以下成本(分別從公式[7]及[8]得出) Qvo貝F及s,i + A ( )91
C卿=(及jf.,. + ) + ^ ( (l-p》.Au ) 〖10]
需要為用于識別IS_RSP的開銷信息分配的額外速率Ro,i、以及根據(jù)由再同步點
所施加的約束條件來執(zhí)行的編碼的次優(yōu)化效能,可使CRSP,^CN。j^p,i,此意味著不需要
使用再同步點。對于介于所述兩種情況之間的其它情況,公式[7]及[8]會提供簡單但有 用的框架來用于定位片內(nèi)再同步點。
圖7是利用IS-RSP的解碼器過程的實例的圖解。過程700可由解碼器裝置(例 如圖1中的解碼器裝置110)來實施。所述解碼器裝置首先在步驟705處接收以如在 上文實例中所述的方式使用IS-RSP編碼的經(jīng)編碼視頻位流。接收裝置(例如圖1中的 通信組件175)可實施作業(yè)705。所述解碼器裝置在步驟710處使用在例如H.26x及 MPEG-x等標(biāo)準(zhǔn)中所概述的在對所述位流進行編碼時所用的方法來對所述接收的視頻 位流進行解碼。解碼裝置(例如圖1中的反變換器/解量化器組件155)可實施作業(yè)710。 H.26x及MPEG-x標(biāo)準(zhǔn)也清楚地說明了依從標(biāo)準(zhǔn)的編碼器及解碼器所必須遵f盾的語義 及語法準(zhǔn)則。所述解碼器在步驟715處將經(jīng)解碼的變數(shù)的值與通過語義及語法規(guī)則所 設(shè)定的值范圍相比較,以識別所述位流是否已出現(xiàn)訛誤。比較裝置(例如圖1中的熵 解碼裝置160及錯誤恢復(fù)組件165)可實施步驟715的語義及語法比較檢査。語義比
較檢查包含但不限于以下各項
NAL單元標(biāo)題字節(jié)語法要素。
SPS (序列參數(shù)集合)語法要素。
PPS (圖片參數(shù)集合)語法要素。
切片標(biāo)題語法要素。
切片層存取單元描述符。
所解碼宏塊的總數(shù)。
宏塊層語法要素。
可用性旗標(biāo)(以上下文相依方式)。
位流緩沖器中的數(shù)據(jù)不足以進行連續(xù)解碼。
外部提供的參考幀緩沖器(大小及數(shù)量)與當(dāng)前(即有效)SPS寓意的比較。 語法比較檢査包含與對CAVLC熵碼字進行解碼相關(guān)聯(lián)的解碼失敗。如果違背任
何語義或語法規(guī)則或者以任一其它方式檢測到錯誤位,則步驟720檢測這些失敗并啟 動再同步。如果在步驟720處未違背規(guī)則,則步驟725檢査是否還有更多數(shù)據(jù)要解碼。 解碼裝置(知J如圖1中的錯誤恢復(fù)組件165)實施步驟720及725的作業(yè)。如果還存 在更多的數(shù)據(jù),則繼續(xù)進行步驟705到725 (且可能730),直到不再存在更多的數(shù)據(jù) 為止,且所述過程結(jié)束。
如果檢測到位錯誤,則實施再同步。為實施再同步,解碼器在步驟730處對位流 中下一非訛誤IS-RSP進行定位并重新開始解碼,從所定位的下一非訛誤IS-RSP重復(fù) 步驟705到730。定位裝置(例如圖1中的錯誤恢復(fù)組件165)實施步驟730的定位作 業(yè)。解碼器可能已在步驟705中接收到位流中的IS-RSP信息。在一個實例中,IS-RSP 信息可包含于帶內(nèi)應(yīng)用消息或用戶專用私有數(shù)據(jù)消息(例如H.264中的SEI消息或 MPEG-2中的用戶數(shù)據(jù)消息)中。如上文所論述,所述消息含有與IS-RSP宏塊在視頻 幀內(nèi)的位置相關(guān)的信息、以及與IS-RSP在位流內(nèi)的位置相關(guān)的信息。如上文所論述, 所述消息也含有為使解碼器在IS-RSP經(jīng)識別宏塊位置處繼續(xù)解碼(步驟710)所需的 數(shù)據(jù)。可將過程700中的一個或一個以上要素予以省略、重新排列及減加以組合。
圖8是利用IS-RSP的解碼器過程的另一實例的圖解。過程800含有與圖7的過 程700相似的步驟,但IS-RSP是用于以一種方式識別先前未檢測到訛誤的位流,而非 如在圖7中所示檢測位流中的訛誤并隨后對IS-RSP進行定位。步驟805、 810及820 分別類似于圖7的步驟705、 710及725。在對位流進行解碼的過程中,解碼器可遇到 已在IS-RSP信息消息中被識別為IS-RSP的點。當(dāng)解碼器在步驟815處以這種方式來 定位IS-RSP時,其將當(dāng)前位流的上下文與包含于IS-RSP消息中的上下文信息相比較 825。如果所述上下文不一致,則對所述位流中的當(dāng)前數(shù)據(jù)與包含于IS-RSP中的數(shù)據(jù) 兩者實施對由語義及語法規(guī)則所設(shè)定的值范圍的比較檢査(未圖示)。通過將包含于當(dāng) 前位流中的數(shù)據(jù)值及包含于IS-RSP中的數(shù)據(jù)與由語義及語法規(guī)則所容許的值范圍相 比較,解碼器可確定當(dāng)前位流及/或IS-RSP數(shù)據(jù)是否出現(xiàn)訛誤。如果在步驟830處發(fā)
現(xiàn)所述位流出現(xiàn)訛誤,則解碼器可停止其當(dāng)前解碼并在步驟835處在其剛剛定位出的 IS-RSP處重新開始解碼,并繼續(xù)進行到步驟805。而如果確定是IS-RSP而非位流出現(xiàn) 訛誤,則所述過程在步驟805處繼續(xù)進行。如果確定位流與IS-RSP兩者均出現(xiàn)說誤(未 顯示),則可對下一 IS-RSP進行定位且所述過程可在805處繼續(xù)進行。此外,如果所 述當(dāng)前上下文與包含于IS-RSP中的上下文之間的上下文比較顯示一致,則未識別出i化 誤且所述過程在步驟805處繼續(xù)進行。比較裝置(例如圖1中的熵解碼組件160及錯 誤恢復(fù)組件165)可實施步驟825的上下文及/或語義及語法比較檢査??蓪⑦^程800 的一個或一個以上要素予以省略、重新排列及減加以組合。
上文所述的各實例是對IS-RSP利用16x16像素宏塊。如所屬領(lǐng)域的技術(shù)人員所 知,還可對上文所論述的IS-RSP方法利用其它塊大小。
圖9圖解說明一種用于視頻編碼的實例性方法900。方法900包括對再同步點 信息進行編碼910,其中所述再同步點信息包括用于識別再同步點在視頻位流的區(qū)段 內(nèi)的位置的信息、及用于對跟在所述再同步點后的位流進行解碼的信息;及傳輸920 所述經(jīng)編碼的再同步點信息。圖10圖解說明一種用于視頻編碼的實例性設(shè)備1000。 設(shè)備1000包括經(jīng)配'置以對再同步點信息進行編碼的編碼模塊1010,其中所述再同 步點信息包括用于識別再同步點在視頻位流的區(qū)段內(nèi)的位置的信息、及用于對跟在所 述再同步點后的位流進行解碼的信息;及傳輸模塊1020,其經(jīng)配置以傳輸所述經(jīng)編碼 的再同步點信息。
圖11圖解說明一種用于對視頻數(shù)據(jù)進行解碼的實例性方法HOO。方法1100包括 接收1100包括再同步點信息的經(jīng)編碼位流,其中所述再同步點信息包括用于識別再同 步點的位置的信息及用于對跟在所述再同步點后的位流進行解碼的信息;及對所述接 收的位流進行解碼1120。圖12圖解說明對視頻進行解碼的實例性設(shè)備1200。設(shè)備1200 包括接收器模塊1210,其經(jīng)配置以接收包括再同步點信息的經(jīng)編碼位流,其中所述 再同步點信息包括用于識別再同步點的位置的信息及用于對跟在所述再同步點后的位
流進行解碼的信息;及解碼模塊,其經(jīng)配置以對所述接收的位流進行解碼。
圖13圖解說明一種用于對多媒體數(shù)據(jù)進行編碼的實例性方法1300。方法1300包 括對再同步點數(shù)據(jù)進行編碼1310;及將所述再同步點數(shù)據(jù)插入1320多^!某體流切片 中。所述方法可進一步包括選擇再同步點在所述切片內(nèi)的位置;且其中插入包括在所 述選定的位置中插入所述再同步點。所述選擇可包括計算多個候選位置的速率失真 成本;及根據(jù)所述速率失真成本選擇至少一個候選位置。圖14圖解說明用于執(zhí)行對多 媒體數(shù)據(jù)的編碼的實例性設(shè)備1400。設(shè)備1400包括編碼模塊1410,其經(jīng)配置以對 再同步點數(shù)據(jù)進行編碼;及插入模塊1420,其經(jīng)配置以將所述再同步點數(shù)據(jù)插入多媒 體流切片中。
圖15圖解說明一種用于處理多媒體流的實例性方法1500。方法1500包括接收 1510多媒體流切片中的再同步點數(shù)據(jù);及根據(jù)所述再同步點數(shù)據(jù)重組1520多媒體數(shù) 據(jù)。圖16圖解說明用于處理多媒體流的實例性設(shè)備1600。設(shè)備1600包括接收模塊,
其經(jīng)配置以接收多媒體流切片中的再同步點數(shù)據(jù);及重組模塊,其根據(jù)所述再同步點 數(shù)據(jù)重組多媒體數(shù)據(jù)。
上文所述各實例僅使用視頻作為實例。上文所述各方法及設(shè)備還可用于其它流式 數(shù)據(jù)形式,包含音頻、圖形、圖像、文本及其組合。
所屬領(lǐng)域的技術(shù)人員應(yīng)了解,可使用眾多種不同技術(shù)及技法中的任一種來表示信 息及信號。例如,整個上述說明中可能提及的數(shù)據(jù)、指令、命令、信息、信號、位、 符號和碼片可由電壓、電流、電磁波、磁場或粒子、光場或粒子、或其任一會且合來表 示。
所屬領(lǐng)域的技術(shù)人員應(yīng)進一步了解,結(jié)合本文所揭示實例所闡述的各種例示性邏 輯塊、模塊、及算法步驟可構(gòu)建為電子硬件、計算機軟件或兩者的組合。為清晰地顯 示硬件與軟件的互換性,上文是基于功能性來概述各種例示性組件、塊、模塊、電路、 及步驟。此種功能性實施為硬件還是軟件取決于特定應(yīng)用及施加于整個系統(tǒng)的設(shè)計制 約條件。所屬領(lǐng)域的技術(shù)人員可針對每一特定應(yīng)用以不同的方式構(gòu)建所述功能性,但 此種實施方案決不應(yīng)視為背離所揭示方法的范圍。
結(jié)合本文所揭示實例描述的各種例示性邏輯塊、模塊及電路可使用通用處理器、 數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、場可編程門陣列(FPGA)或其它 可編程邏輯裝置、離散門或晶體管邏輯、離散硬件元件、或設(shè)計用于實施本文^f述功 能的其任一組合來構(gòu)建或?qū)嵤?。通用處理器可為微處理器,但另一選擇為,處理器還 可為任何常規(guī)處理器、控制器、微控制器或狀態(tài)機。處理器還可構(gòu)建為計算裝置的組 合,例如,DSP與微處理器的組合、多個微處理器的組合、 一個或一個以上微處理器 與DSP核心的聯(lián)合,或任一其它此類配置。
結(jié)合本文所揭示實例來描述的方法或算法的步驟可直接實施于硬件中、由處理器 執(zhí)行的軟件模塊中或兩者的組合中。軟件模塊可駐存于RAM存儲器、快閃存儲器、 ROM存儲器、EPROM存儲器、EEPROM存儲器、寄存器、硬磁盤、可裝卸磁盤、 CD-ROM、或現(xiàn)有技術(shù)中已知的任一其它形式的存儲媒體中。實例性存儲媒體耦接到 處理器,以使所述處理器可自所述存儲媒體讀取信息及向所述存儲媒體寫入^f言息。另 一選擇為,所述存儲媒體可為處理器的組成部分。處理器及存儲媒體可駐存于專用集 成電路(ASIC)中。ASIC可駐存于無線調(diào)制解調(diào)器中。另一選擇為,處理器及存儲 媒體可作為離散組件駐存于無線調(diào)制解調(diào)器中。
上文對所揭示實例的說明旨在使所屬領(lǐng)域的技術(shù)人員均可制作或利用戶萬揭示方 法與設(shè)備。所屬領(lǐng)域的技術(shù)人員將易知對所述實例的各種修改,且本文所界定的一般 原理還可應(yīng)用于其它實例,這并不背離所揭示方法與設(shè)備的精神或范圍。
因此,已描述了各種用于在視頻位流的區(qū)段內(nèi)提供再同步點以使解碼器能夠定位 所述再同步點并對跟在所述再同步點后的位流進行解碼的方法及設(shè)備。
權(quán)利要求
1、一種視頻編碼的方法,其包括對再同步點信息進行編碼,其中所述再同步點信息包括識別再同步點在視頻位流的區(qū)段內(nèi)的位置的信息及用于對跟在所述再同步點后的所述位流進行解碼的信息;及傳輸所述經(jīng)編碼的再同步點信息。
2、 如權(quán)利要求1所述的方法,其進一步包括 計算多個候選位置的速率失真成本;及根據(jù)所述計算的速率失真成本選擇所述候選位置中的至少一者作為所述再同步 點的位置。
3、 如權(quán)利要求1所述的方法,其進一步包括選擇所述再同步點在所述視頻位流 的區(qū)段內(nèi)的位置,其中所述區(qū)段是由子宏塊、宏塊、切片、幀及幀序列組成的群組中 的成員。
4、 如權(quán)利要求1所述的方法,其進一步包括選擇所述再同步點在所述視頻位流 的區(qū)段內(nèi)的位置,其中所述再同步點是宏塊的開始。
5、 如權(quán)利要求1所述的方法,其中所述用于對所述位流進行解碼的信息包括與 鄰近視頻區(qū)段相關(guān)的信息。
6、 如權(quán)利要求1所述的方法,其中所述用于對所述位流進行解碼的信息包括由 量化參數(shù)、空間預(yù)測模式標(biāo)識符及若干非零系數(shù)組成的群組中的成員。
7、 如權(quán)利要求1所述的方法,其進一步包括將所述再同步點信息編碼于數(shù)據(jù)消息中,其中所述數(shù)據(jù)消息是帶內(nèi)應(yīng)用消息、用戶專用私有數(shù)據(jù)消息、輔助增強信息消息及MPEG用戶數(shù)據(jù)消息中的 一者。
8、 如權(quán)利要求1所述的方法,其中所述用于對所述位流進行解碼的信息包括與 其中所述位流跟在所述再同步點后的上下文相關(guān)的信息。
9、 一種用于視頻編碼的設(shè)備,其包括編碼裝置,其用于對再同步點信息進行編碼,其中所述再同步點信息包括用于識 別再同步點在視頻位流的區(qū)段內(nèi)的位置的信息及用于對跟在所述再同步點后的位流進行解碼的信息;及傳輸裝置,其用于傳輸所述經(jīng)編碼的再同步點信息。
10、 如權(quán)利要求9所述的設(shè)備,其進一步包括 計算裝置,其用于計算多個候選位置的速率失真成本;及選擇裝置,其用于根據(jù)所述計算的速率失真成本選擇所述候選位置中的至少一者 作為所述再同步點的位置。
11、 如權(quán)利要求9所述的設(shè)備,其進一步包括用于選擇所述再同步點在所述視頻 位流的區(qū)段內(nèi)的位置的裝置,其中所述區(qū)段是由子宏塊、宏塊、切片、幀及幀序列組 成的群組中的成員。
12、 如權(quán)利要求9所述的設(shè)備,其進一步包括用于選擇所述再同步點在戶;f述視頻位流的區(qū)段內(nèi)的位置的裝置,其中所述再同步點是宏塊的開始。
13、 如權(quán)利要求9所述的設(shè)備,其中所述用于對所述位流進行解碼的信息包括與 鄰近視頻區(qū)段相關(guān)的信息。
14、 如權(quán)利要求9所述的設(shè)備,其中所述用于對所述位流進行解碼的信息包括由 量化參數(shù)、空間預(yù)測模式標(biāo)識符及若干非零系數(shù)組成的群組中的成員。
15、 如權(quán)利要求9所述的設(shè)備,其進一步包括將所述再同步點信息編碼于數(shù)據(jù)消 息中的裝置,其中所述數(shù)據(jù)消息是帶內(nèi)應(yīng)用消息、用戶專用私有數(shù)據(jù)消息、輔助增強 信息消息及MPEG用戶數(shù)據(jù)消息中的一者。
16、 如權(quán)利要求9所述的設(shè)備,其中所述用于對所述位流進行解碼的信息包括與 其中所述位流跟在所述再同步點后的上下文相關(guān)的信息。
17、 一種用于視頻編碼的處理器,所述處理器經(jīng)配置以控制 對再同步點信息進行編碼,其中所述再同步點信息包括用于識別再同步點在視頻位流的區(qū)段內(nèi)的位置的信息及用于對跟在所述再同步點后的所述位流進行解碼的信息;及傳輸所述經(jīng)編碼的再同步點信息。
18、 如權(quán)利要求17所述的處理器,其進一步經(jīng)配置以控制-計算多個候選位置的速率失真成本;及根據(jù)所述計算的速率失真成本選擇所述候選位置中的至少一者作為所述再同歩 點的位置。
19、 如權(quán)利要求17所述的處理器,其進一步經(jīng)配置以控制選擇所述再同步點在 所述視頻位流的區(qū)段內(nèi)的位置,其中所述區(qū)段是由子宏塊、宏塊、切片、幀及幀序列 組成的群組中的成員。
20、 如權(quán)利要求17所述的處理器,其進一步經(jīng)配置以控制選擇所述再同步點在 所述視頻位流的區(qū)段內(nèi)的位置,其中所述再同步點是宏塊的開始。
21、 如權(quán)利要求17所述的處理器,其中所述用于對所述位流進行解碼的信息包 括與鄰近視頻區(qū)段相關(guān)的信息。
22、 如權(quán)利要求17所述的處理器,其中所述用于對所述位流進行解碼的信息包 括由量化參數(shù)、空間預(yù)測模式標(biāo)識符及若干非零系數(shù)組成的群組中的成員。
23、 如權(quán)利要求17所述的處理器,其進一步經(jīng)配置以控制將所述再同步點信息 編碼于數(shù)據(jù)消息中,其中所述數(shù)據(jù)消息是帶內(nèi)應(yīng)用消息、用戶專用私有數(shù)據(jù)消息、輔 助增強信息消息及MPEG用戶數(shù)據(jù)消息中的一者。
24、 如權(quán)利要求17所述的處理器,其中所述用于對所述位流進行解碼的信息包 括與其中所述位流跟在所述再同步點后的上下文相關(guān)的信息。
25、 一種用于視頻編碼的設(shè)備,其包括-編碼器,其用于對再同步點信息進行編碼,其中所述再同步點信息包括用于識別 再同步點在視頻位流的區(qū)段內(nèi)的位置的信息及用于對跟在所述再同步點后的位流進行 解碼的信息;及通信器,其經(jīng)配置以傳輸所述經(jīng)編碼的再同步點信息。
26、 如權(quán)利要求25所述的設(shè)備,其進一步包括選擇器以選擇所述再同步點在所 述視頻位流的區(qū)段內(nèi)的位置,其中所述區(qū)段是由子宏塊、宏塊、切片、幀及幀序列組 成的群組中的成員。
27、 如權(quán)利要求25所述的設(shè)備,其進一步包括選擇器以選擇所述再同步點在所 述視頻位流的區(qū)段內(nèi)的位置,其中所述再同步點是宏塊的開始。
28、 如權(quán)利要求25所述的設(shè)備,其中所述用于對所述位流進行解碼的信息包括 與鄰近視頻區(qū)段相關(guān)的信息。
29、 如權(quán)利要求25所述的設(shè)備,其中所述用于對所述位流進行解碼的信息包括 由量化參數(shù)、空間預(yù)測模式標(biāo)識符及若干非零系數(shù)組成的群組中的成員。
30、 如權(quán)利要求25所述的設(shè)備,其中所述編碼器將所述再同步點信息編碼于數(shù) 據(jù)消息中,其中玩述數(shù)據(jù)消息是由帶內(nèi)應(yīng)用消息、用戶專用私有數(shù)據(jù)消息、輔助增強 信息消息及MPEG用戶數(shù)據(jù)消息組成的群組中的成員。
31、 如權(quán)利要求25所述的設(shè)備,其中所述編碼器使用可變長度編碼對所述再同 步點信息進行編碼。
32、 如權(quán)利要求25所述的設(shè)備,其進一步包括 選擇器;及計算器,其用于計算多個候選位置的速率失真成本;其中所述選擇器根據(jù)所述計算的速率失真成本來選擇所述候選位置中的至少一 者作為所述再同步點的位置。
33、 一種計算機可讀媒體,其實施一種用于視頻編碼的方法,所述方法包括 對再同步點信息進行編碼,其中所述再同步點信息包括用于識別再同步點在視頻位流的區(qū)段內(nèi)的位置的信息及用于對跟在所述再同步點后的位流進行解碼的信息;及 傳輸所述經(jīng)編碼的再同步點信息。
34、 如權(quán)利要求33所述的計算機可讀媒體,其中所述方法進一步包括 計算多個候選位置的速率失真成本;及根據(jù)所述計算的速率失真成本選擇所述候選位置中的至少一者作為所述再同步 點的位置。
35、 如權(quán)利要求33所述的計算機可讀媒體,其中所述方法進一步包括選擇所述 再同步點在所述視頻位流的區(qū)段內(nèi)的位置,其中所述區(qū)段是由子宏塊、宏塊、切片、 幀及幀序列組成的群組中的成員。
36、 如權(quán)利要求33所述的計算機可讀媒體,其中所述方法進一步包括選擇所述 再同步點在所述視頻位流的區(qū)段內(nèi)的位置,其中所述再同步點是宏塊的開始。
37、 如權(quán)利要求33所述的計算機可讀媒體,其中所述用于對所述位流進^f亍解碼 的信息包括與鄰近視頻區(qū)段相關(guān)的信息。
38、 如權(quán)利要求33所述的計算機可讀媒體,其中所述用于對所述位流進行解碼 的信息包括由量化參數(shù)、空間預(yù)測模式標(biāo)識符及若干非零系數(shù)組成的群組中的成員。
39、 如權(quán)利要求33所述的計算機可讀媒體,其中所述方法進一步包括將所述再 同步點信息編碼于數(shù)據(jù)消息中,其中所述數(shù)據(jù)消息是帶內(nèi)應(yīng)用消息、用戶專用私有數(shù) 據(jù)消息、輔助增強信息消息及MPEG用戶數(shù)據(jù)消息中的一者。
40、 如權(quán)利要求33所述的計算機可讀媒體,其中所述用于對所述位流進行解碼 的信息包括與其中所述位流跟在所述再同步點后的上下文相關(guān)的信息。
41、 一種用于對視頻數(shù)據(jù)進行解碼的方法,其包括接收包括再同步點信息的經(jīng)編碼的位流,其中所述再同步點信息包括用于識別再 同步點的位置的信息及用于對跟在所述再同步點后的位流進行解碼的信息;及 對所述接收的位流進行解碼。
42、 如權(quán)利要求41所述的方法,其中所述方法進一步包括 根據(jù)所述再同步點信息定位所述位流中的再同步點。
43、 如權(quán)利要求41所述的方法,其中所述用于對所述位流進行解碼的《言息包括 與其中對跟在所述再同步點后的位流進行編碼的上下文相關(guān)的信息。
44、 如權(quán)利要求43所述的方法,其中所述方法進一步包括 將所述經(jīng)解碼位流的當(dāng)前上下文與包含于所述再同步點信息中的所接收上下文信息進行比較;及如果所述比較顯示所述當(dāng)前上下文與所述接收的上下文信息不相同,則停止對所 述位流進行解碼并在所述再同步點處重新開始對所述位流進行解碼。
45、 如權(quán)利要求41所述的方法,其中所述再同步點的位置處于視頻區(qū)段內(nèi),所 述視頻區(qū)段選自由子宏塊、宏塊、切片、幀及幀序列組成的群組中的成員。
46、 如權(quán)利要求41所述的方法,其中所述再同步點的位置是宏塊的開始。
47、 如權(quán)利要求41所述的方法,其中所述用于對所述位流進行解碼的信息包括 與鄰近視頻區(qū)段相關(guān)的信息。
48、 如權(quán)利要求41所述的方法,其中所述用于對所述位流進行解碼的信息包括 由量化參數(shù)、空間預(yù)測模式標(biāo)識符及若干非零系數(shù)組成的群組中的成員。
49、 如權(quán)利要求41所述的方法,其中所述方法進一步包括 接收數(shù)據(jù)消息中的所述再同步點信息,其中所述數(shù)據(jù)消息是由帶內(nèi)應(yīng)用消息、用戶專用私有數(shù)據(jù)消息、輔助增強信息消息及MPEG用戶數(shù)據(jù)消息組成的群組中的成員。
50、 如權(quán)利要求41所述的方法,其中所述方法進一步包括 接收使用可變長度代碼編碼的再同步點信息。
51、 如權(quán)利要求41所述的方法,其中所述方法進一步包括 檢測所述位流中的錯誤; 停止對所述位流的解碼;及 在所述經(jīng)定位的再同步點處繼續(xù)進行解碼。
52、 一種用于對視頻進行解碼的設(shè)備,其包括.-接收裝置,其用于接收包括再同步點信息的經(jīng)編碼位流,其中所述再同步點信息 包含用于識別再同步點的位置的信息及用于對跟在所述再同步點后的位流進行解碼的 信息;及解碼裝置,其用于對所述接收的位流進行解碼。
53、 如權(quán)利要求52所述的設(shè)備,其進一步包括定位裝置,其用于根據(jù)所述再同步點信息定位所述位流中的再同步點。
54、 如權(quán)利要求52所述的設(shè)備,其中所述用于對所述位流進行解碼的信息包括 與其中對跟在所述再同步點后的位流進行編碼的上下文相關(guān)的信息。
55、 如權(quán)利要求54所述的設(shè)備,其進一步包括比較裝置,其用于將所述經(jīng)解碼位流的當(dāng)前上下文與包含于所述再同步點信息中 的所接收上下文信息進行比較;及停止裝置,其用于在所述比較顯'示所述當(dāng)前上下文與所述接收的上下文信息不相 同時,停止對所述位流進行解碼并在所述再同步點處重新開始對所述位流進行解碼。
56、 如權(quán)利要求52所述的設(shè)備,其中所述再同步點的位置處于視頻區(qū)段內(nèi),所 述視頻區(qū)段選自由子宏塊、宏塊、切片、幀及幀序列組成的群組中的成員。
57、 如權(quán)利要求52所述的設(shè)備,其中所述再同步點的位置是宏塊的開始。
58、 如權(quán)利要求52所述的設(shè)備,其中所述用于對所述位流進行解碼的信息包括 與鄰近視頻區(qū)段相關(guān)的信息。
59、 如權(quán)利要求52所述的設(shè)備,其中所述用于對所述位流進行解碼的信息包括 由量化參數(shù)、空間預(yù)測模式標(biāo)識符及若干非零系數(shù)組成的群組中的成員。
60、 如權(quán)利要求52所述的設(shè)備,其進一步包括接收裝置,其用于接收數(shù)據(jù)消息中的再同步點信息,其中所述數(shù)據(jù)消息是由帶內(nèi) 應(yīng)用消息、用戶專用私有數(shù)據(jù)消息、輔助增強信息消息及MPEG用戶數(shù)據(jù)消息組成的 群組中的成員。
61、 如權(quán)利要求52所述的設(shè)備,其進一步包括接收裝置,其用于接收使用可變長度代碼所編碼的再同步點信息。
62、 如權(quán)利要求52所述的設(shè)備,其進一步包括 檢測裝置,其用于檢測所述位流中的錯誤; 停止裝置,其用于停止對所述位流的解碼;及繼續(xù)裝置,其用于在所述經(jīng)定位的再同步點處繼續(xù)進行解碼。
63、 一種用于對視頻進行解碼的處理器,所述處理器經(jīng)配置以控制 接收包括再同步點信息的經(jīng)編碼位流,其中所述再同步點信息包括用于識別再同步點的位置的信息及用于對跟在所述再同步點后的位流進行解碼的信息;及 對所述接收的位流進行解碼。
64、 如權(quán)利要求63所述的處理器,其中所述處理器進一步經(jīng)配置以控制根據(jù)所述再同步點信息定位所述位流中的再同步點。
65、 如權(quán)利要求63所述的處理器,其中所述用于對所述位流進行解碼的《言息包 括與其中對跟在所述再同步點后的位流進行編碼的上下文相關(guān)的信息。
66、 如權(quán)利要求64所述的處理器,其中所述處理器進一步經(jīng)配置以控制 將所述經(jīng)解碼位流的當(dāng)前上下文與包含于所述再同步點信息中的所接收上下文信息進行比較;及如果所述比較顯示所述當(dāng)前上下文與所述接收的上下文信息不相同,則停止對所 述位流進行解碼并在所述再同步點處重新開始對所述位流進行解碼。
67、 如權(quán)利要求63所述的處理器,其中所述再同步點的位置處于視步頁區(qū)段內(nèi), 所述視頻區(qū)段選自由子宏塊、宏塊、切片、幀及幀序列組成的群組中的成員。
68、 如權(quán)利要求63所述的處理器,其中所述再同步點的位置是宏塊的開始。
69、 如權(quán)利要求63所述的處理器,其中所述用于對所述位流進行解碼的信息包 括與鄰近視頻區(qū)段相關(guān)的信息。
70、 如權(quán)利要求63所述的處理器,其中所述用于對所述位流進行解碼的《言息包 括由量化參數(shù)、空間預(yù)測模式標(biāo)識符及若干非零系數(shù)組成的群組中的成員。
71、 如權(quán)利要求63所述的處理器,其中所述處理器進一步經(jīng)配置以控制 接收數(shù)據(jù)消息中的再同步點信息,其中所述數(shù)據(jù)消息是由帶內(nèi)應(yīng)用消息、用戶專用私有數(shù)據(jù)消息、輔助增強信息消息及MPEG用戶數(shù)據(jù)消息組成的群組中的成員。
72、 如權(quán)利要求63所述的處理器,其中所述方法進一步包括--接收使用可變長度代碼編碼的再同步點信息。
73、 如權(quán)利要求63所述的處理器,其中所述方法進一步包括 檢測所述位流中的錯誤;停止對所述位流的解碼;及 在所述經(jīng)定位的再同步點處繼續(xù)進行解碼。
74、 一種用于對視頻進行解碼的設(shè)備,其包括接收機,其用于接收包括再同步點信息的經(jīng)編碼位流,其中所述再同步點信息包 括用于識別再同步點的位置的信息及用于對跟在所述再同步點后的位流進行解碼的信 息;及解碼器,其用于對所述接收的位流進行解碼。
75、 如權(quán)利要求74所述的設(shè)備,其中所述解碼器進一步經(jīng)配置以根據(jù)所述再同 步點信息定位所述位流中的再同步點。
76、 如權(quán)利要求74所述的設(shè)備,其中所述用于對所述位流進行解碼的信息包括 與其中對跟在所述再同步點后的位流進行編碼的上下文相關(guān)的信息。
77、 如權(quán)利要求76所述的設(shè)備,其中所述解碼器進一步經(jīng)配置以將所述經(jīng)解碼位流的當(dāng)前上下文與包含于所述再同步點信息中的所接收上下文 信息進行比較;及如果所述比較顯示所述當(dāng)前上下文與所述接收的上下文信息不相同,則停止對所 述位流進行解碼并在所述再同步點處重新開始對所述位流進行解碼。
78、 如權(quán)利要求74所述的設(shè)備,其中所述再同步點的位置處于視頻區(qū)段內(nèi),所述視頻區(qū)段選自由子宏塊、宏塊、切片、幀及幀序列組成的群組中的成員。
79、 如權(quán)利要求74所述的設(shè)備,其中所述再同歩點的位置是宏塊的開始。
80、 如權(quán)利要求74所述的設(shè)備,其中所述用于對所述位流進行解碼的信息包括 與鄰近視頻區(qū)段相關(guān)的信息。
81、 如權(quán)利要求74所述的設(shè)備,其中所述用于對所述位流進行解碼的信息包括 由量化參數(shù)、空間預(yù)測模式標(biāo)識符及若干非零系數(shù)組成的群組中的成員。
82、 如權(quán)利要求74所述的設(shè)備,其中所述接收機進一步經(jīng)配置以接收數(shù)據(jù)消息 中的再同步點信息,其中所述數(shù)據(jù)消息是由帶內(nèi)應(yīng)用消息、用戶專用私有數(shù)據(jù)消息、 輔助增強信息消息及MPEG用戶數(shù)據(jù)消息組成的群組中的成員。
83、 '如權(quán)利要求74所述的設(shè)備,其中所述解碼器進一步經(jīng)配置以-檢測所述位流中的錯誤;停止對所述位流的解碼;及在所述經(jīng)定位的再同步點處繼續(xù)進行解碼。
84、 一種計算機可讀媒體,其實施一種用于對視頻進行解碼的方法,所述方法包括接收包括再同步點信息的經(jīng)編碼位流,其中所述再同步點信息包括用于識別再同 步點的位置的信息及用于對跟在所述再同步點后的位流進行解碼的信息;及 對所述接收的位流進行解碼。
85、 如權(quán)利要求84所述的計算機可讀媒體,其中所述方法進一步包括 根據(jù)所述再同步點信息定位所述位流中的再同步點。
86、 如權(quán)利要求84所述的計算機可讀媒體,其中所述用于對所述位流進行解碼 的信息包括與其中對跟在所述再同步點后的位流進行編碼的上下文相關(guān)的信息。
87、 如權(quán)利要求86所述的計算機可讀媒體,其中所述方法進一步包括-將所述經(jīng)解碼位流的當(dāng)前上下文與包含于所述再同步點信息中的所接收上下文信息進行比較;及如果所述比較顯示所述當(dāng)前上下文與所述接收的上下文信息不相同,則停止對所 述位流進行解碼并在所述再同步點處重新開始對所述位流進行解碼。
88、 如權(quán)利要求84所述的計算機可讀媒體,其中所述再同步點的位置處于視頻 區(qū)段內(nèi),所述視頻區(qū)段選自由子宏塊、宏塊、切片、幀及幀序列組成的群組中的成員。
89、 如權(quán)利要求84所述的計算機可讀媒體,其中所述再同步點的位置是宏塊的 開始。
90、 如權(quán)利要求84所述的計算機可讀媒體,其中所述用于對所述位流進行解碼 的信息包括與鄰近視頻區(qū)段相關(guān)的信息。
91、 如權(quán)利要求84所述的計算機可讀媒體,其中所述用于對所述位流進行解碼 的信息包括由量化參數(shù)、空間預(yù)測模式標(biāo)識符及若干非零系數(shù)組成的群組中的成員。
92、 如權(quán)利要求84所述的計算機可讀媒體,其中所述方法進一步包括 接收數(shù)據(jù)消息中的再同步點信息,其中所述數(shù)據(jù)消息是由帶內(nèi)應(yīng)用消息、用戶專用私有數(shù)據(jù)消息、輔助增強信息消息及MPEG用戶數(shù)據(jù)消息組成的群組中的成員。
93、 如權(quán)利要求84所述的計算機可讀媒體,其中所述方法進一步包括-接收使用可變長度代碼編碼的再同步點信息。
94、 如權(quán)利要求84所述的計算機可讀媒體,其中所述方法進一步包括 檢測所述位流中的錯誤;停止對所述位流的解碼;及 在所述經(jīng)定位的再同步點處繼續(xù)進行解碼。
95、 一種用于對多媒體數(shù)據(jù)進行編碼的方法,其包括-對再同步點ii據(jù)進行編碼;及將所述再同步點數(shù)據(jù)插入多媒體流的切片中。
96、 如權(quán)利要求95所述的方法,其進一步包括 選擇再同步點在所述切片內(nèi)的位置;且其中插入包括將所述再同步點插入所述選定的位置中。
97、 如權(quán)利要求96所述的方法,其進一步包括計算多個候選位置的速率失真成本;及根據(jù)所述速率失真成本選擇至少一個候選位置。
98、 如權(quán)利要求95所述的方法,其中所述再同步點包括所述多媒體數(shù)據(jù)的上下 文信息。
99、 一種用于對多媒體數(shù)據(jù)進行編碼的設(shè)備,其包括 編碼裝置,其用于對再同步點數(shù)據(jù)進行編碼;及插入裝置,其用于將所述再同步點數(shù)據(jù)插入多媒體流的切片中。
100、 如權(quán)利要求99所述的設(shè)備,其進一步包括選擇裝置,其用于選擇再同步點在所述切片內(nèi)的位置;且其中插入包括插入裝置,其用于將所述再同步點插入所述選定的位置中。
101、 如權(quán)利要求100所述的設(shè)備,其中所述用于選擇的裝置包括計算裝置,其用于計算多個候選位置的速率失真成本;及選擇裝置,其用于根據(jù)所述速率失真成本選擇至少一個候選位置。
102、 如權(quán)利要求99所述的設(shè)備,其中所述再同步點包括所述多媒體數(shù)據(jù)的上下 文信息。
103、 一種用于處理多媒體流的方法,其包括接收多媒體流的切片中的再同步點數(shù)據(jù);及 根據(jù)所述再同步點數(shù)據(jù)重組多媒體數(shù)據(jù)。
104、 如權(quán)利要求103所述的方法,其中所述再同步點包括所述多媒體數(shù)據(jù)的上 下文信息。
105、 一種用于處理多媒體流的設(shè)備,其包括接收裝置,其用于接收多媒體流的切片中的再同步點數(shù)據(jù);及 重組裝置,其用于根據(jù)所述再同步點數(shù)據(jù)來重組多媒體數(shù)據(jù)。
106、 如權(quán)利要求105所述的設(shè)備,其中所述再同步點包括所述多媒體數(shù)據(jù)的上 下文信息。
全文摘要
本發(fā)明涉及一種視頻編碼的方法,其包括對再同步點信息進行編碼,其中所述再同步點信息包含用于識別再同步點在視頻位流的區(qū)段內(nèi)的位置的信息及用于對跟在所述再同步點后的位流進行解碼的信息。此外,本發(fā)明還涉及一種用于對數(shù)字視頻進行解碼的方法,其包括接收包含再同步點信息的經(jīng)編碼位流,其中所述再同步點信息包含用于識別再同步點的位置的信息及用于對跟在所述再同步點后的位流進行解碼的信息;對所述接收的位流進行解碼;及根據(jù)所述再同步點信息定位所述位流中的所述再同步點。
文檔編號H04N7/26GK101185336SQ200680014472
公開日2008年5月21日 申請日期2006年3月10日 優(yōu)先權(quán)日2005年3月10日
發(fā)明者塞伊富拉·哈立德·奧古茲, 維賈雅拉克希米·R·拉韋恩德拉恩, 蘇密特·辛格·塞蒂 申請人:高通股份有限公司