專(zhuān)利名稱(chēng):對(duì)具有多個(gè)圖像的圖像序列進(jìn)行編碼的方法及設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字視頻內(nèi)容的編碼和解碼。更具體來(lái)說(shuō),本發(fā)明涉及在如 MPEG-4PartlOAVC/H. 264視頻編碼標(biāo)準(zhǔn)中所使用的在圖像級(jí)上對(duì)數(shù)字視頻內(nèi)容按幀模式和
場(chǎng)模式的編碼和解碼。
背景 視頻壓縮在許多當(dāng)前和正在出現(xiàn)的產(chǎn)品中被使用。它是數(shù)字電視機(jī)頂盒(STB)、數(shù)
字衛(wèi)星系統(tǒng)(DSS)、高清晰度電視(HDTV)解碼器、數(shù)字多用盤(pán)(DVD)播放器、視頻會(huì)議、因特
網(wǎng)視頻和多媒體內(nèi)容、以及其它數(shù)字視頻應(yīng)用的核心。如果沒(méi)有視頻壓縮,數(shù)字視頻內(nèi)容就
可能極其龐大,使得難以、甚至不可能有效地存儲(chǔ)、傳送或觀看數(shù)字視頻內(nèi)容。 數(shù)字視頻內(nèi)容包含圖像流,所述圖像能被在電視接收器、計(jì)算機(jī)監(jiān)視器或能顯示
數(shù)字視頻內(nèi)容的其它某種電子裝置上顯示為一個(gè)影像。 一個(gè)在時(shí)間上在某特定圖像之前被
顯示的圖像,相對(duì)于該特定圖像來(lái)說(shuō),是在"向前的方向"上。同樣,一個(gè)在時(shí)間上在某特定
圖像之后被顯示的圖像,相對(duì)于該特定圖像來(lái)說(shuō),是在"向后的方向"上。 視頻壓縮是在一個(gè)視頻編碼過(guò)程中完成的,在該過(guò)程中每個(gè)圖像或者按幀或者按
兩個(gè)場(chǎng)被編碼。每個(gè)幀包含多行的空間信息。例如,一個(gè)典型的幀含有480個(gè)水平行。每
個(gè)場(chǎng)含有幀中行數(shù)的一半的行。例如,如果幀含有480個(gè)水平行,則每個(gè)場(chǎng)含有240個(gè)水平
行。在一個(gè)典型的配置中,一個(gè)場(chǎng)含有幀中的奇數(shù)編號(hào)的行,另一個(gè)場(chǎng)含有幀中的偶數(shù)編號(hào)
的行。在下文中以及在后附的權(quán)利要求書(shū)中,除非特別地另外指明,否則將把含有奇數(shù)編號(hào)
的行的場(chǎng)稱(chēng)作"頂"(top)場(chǎng)。同樣,在下文中以及在后附的權(quán)利要求書(shū)中,除非特別地另外
指明,否則將把含有偶數(shù)編號(hào)的行的場(chǎng)稱(chēng)作"底"(bottom)場(chǎng)。這兩個(gè)場(chǎng)可被交織在一起,
形成一個(gè)交織幀。 支持視頻編碼的大體思想,是從數(shù)字視頻內(nèi)容中除去"非必要的"的內(nèi)容。被減少 的數(shù)據(jù)量于是要求更少的用于廣播或傳輸?shù)膸挕T趬嚎s的視頻數(shù)據(jù)被傳送后,必須對(duì)其 進(jìn)行解碼,或解壓。在這個(gè)過(guò)程中,對(duì)所傳送的視頻數(shù)據(jù)進(jìn)行處理,以生成被代入該視頻數(shù) 據(jù)的近似數(shù)據(jù),用于代替在編碼過(guò)程中被去除的"非必要的"數(shù)據(jù)。 視頻編碼將數(shù)字視頻內(nèi)容轉(zhuǎn)變成一種壓縮的形式,與不壓縮的數(shù)字視頻內(nèi)容相 比,其能用較少空間存儲(chǔ)并用較少的帶寬傳送。這樣做是利用了視頻內(nèi)容的圖像中的時(shí)間 上和空間上的冗余??梢詫?shù)字視頻內(nèi)容存儲(chǔ)在諸如硬驅(qū)、DVD的存儲(chǔ)介質(zhì)中,或者某個(gè)其 它的非易失性存儲(chǔ)單元中。 有許多壓縮數(shù)字視頻內(nèi)容的視頻編碼方法。因此,開(kāi)發(fā)出了視頻編碼標(biāo)準(zhǔn)來(lái)標(biāo)準(zhǔn) 化各種視頻編碼方法,以便壓縮的數(shù)字視頻內(nèi)容以大多數(shù)視頻編碼器和解碼器能識(shí)別的格 式被提供。例如,運(yùn)動(dòng)圖像專(zhuān)家組(MPEG)和國(guó)際電信聯(lián)盟(ITU-T)已經(jīng)開(kāi)發(fā)了正在廣泛應(yīng) 用的視頻編碼標(biāo)準(zhǔn)。這些標(biāo)準(zhǔn)的例子包括MPEG-1、 MPEG-2、 MPEG-4、 ITU-T H261和ITU-TH263標(biāo)準(zhǔn)。 多數(shù)現(xiàn)代視頻編碼標(biāo)準(zhǔn)一諸如由MPEG和ITU-T開(kāi)發(fā)的視頻編碼標(biāo)準(zhǔn)一部分根據(jù) 的是一種具有運(yùn)動(dòng)補(bǔ)償(MC)算法的時(shí)間預(yù)測(cè)。具有運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間預(yù)測(cè)被用來(lái)在數(shù)字視 頻廣播中去除連續(xù)的圖像之間的時(shí)間冗余。 具有運(yùn)動(dòng)補(bǔ)償算法的時(shí)間預(yù)測(cè)一般利用一個(gè)或兩個(gè)基準(zhǔn)圖像來(lái)編碼一個(gè)特定的 圖像?;鶞?zhǔn)圖像是一個(gè)已經(jīng)被編碼的圖像。通過(guò)把要被編碼的特定圖像與基準(zhǔn)圖像中的一 個(gè)相比較,具有運(yùn)動(dòng)補(bǔ)償算法的時(shí)間預(yù)測(cè)能利用在該基準(zhǔn)圖像與要被編碼的特定圖像之間 存在的時(shí)間冗余,并以高于不使用具有運(yùn)動(dòng)補(bǔ)償算法的時(shí)間預(yù)測(cè)編碼該圖像時(shí)的壓縮量來(lái) 編碼該圖像?;鶞?zhǔn)圖像的其中之一可以位于相對(duì)要被編碼的特定圖像來(lái)說(shuō)的向后方向上。 另一個(gè)基準(zhǔn)圖像位于相對(duì)要被編碼的特定圖像來(lái)說(shuō)的向前方向上。 然而,隨著對(duì)更高分辨率、更復(fù)雜圖像內(nèi)容、更快傳送速度的需求的增加,對(duì)更好 的視頻編碼方法的需要也增加。為此,目前正在開(kāi)發(fā)一種新的視頻編碼標(biāo)準(zhǔn)。這個(gè)新的視 頻編碼標(biāo)準(zhǔn)叫作MPEG-4Part 10AVC/H. 264標(biāo)準(zhǔn)。 該新的MPEG-4Part 10AVC/H. 264標(biāo)準(zhǔn)要求許多新的視頻壓縮方法。例如,新的 MPEG-4Part 10AVC/H. 264標(biāo)準(zhǔn)的特點(diǎn)之一時(shí),它允許有多個(gè)基準(zhǔn)圖像,而不是僅僅兩個(gè)基 準(zhǔn)圖像。多個(gè)基準(zhǔn)圖像的使用,允許編碼器找到與要被編碼的圖像最接近地匹配的基準(zhǔn)圖 像,從而改善具有運(yùn)動(dòng)補(bǔ)償算法的時(shí)間預(yù)測(cè)的性能。通過(guò)在編碼過(guò)程中使用與要被編碼的 圖像最接近地匹配的基準(zhǔn)圖像,在該圖像的編碼中就有可能獲得最大的壓縮量。基準(zhǔn)圖像 被存儲(chǔ)在幀緩存器和/或場(chǎng)緩存器中。 如前文所述,編碼器能按一個(gè)幀或按兩個(gè)場(chǎng)來(lái)編碼一個(gè)圖像。如果在一個(gè)要被編 碼的圖像序列中,有些圖像被按幀編碼,有些圖像被按場(chǎng)編碼,則可能實(shí)現(xiàn)更大程度的壓 縮。
發(fā)明概要 在許多可能實(shí)施例的一個(gè)中,本發(fā)明提供一種數(shù)字視頻內(nèi)容的編碼、解碼和位流 生成的方法。數(shù)字視頻內(nèi)容包含一個(gè)圖像流,所述圖像分別可能是幀內(nèi)的(intra)、預(yù)測(cè)的 (predicted)、或雙預(yù)測(cè)的(bi-predicted)圖像。每個(gè)圖像包含能被進(jìn)一步劃分成更小的 塊的宏塊。該方法要求或者以幀模式或者以場(chǎng)模式編碼和解碼所述圖像流中的每個(gè)圖像。
附圖簡(jiǎn)述 各附圖例示本發(fā)明的各種實(shí)施例,并且是說(shuō)明書(shū)的一部分。連同以下說(shuō)明各附圖, 展現(xiàn)和解釋本發(fā)明的原理。所例示的實(shí)施例都是本發(fā)明的例子,不限制本發(fā)明的范圍。
圖1表示由例如MPEG-4Part 10AVC/H. 264標(biāo)準(zhǔn)之類(lèi)的示例性視頻編碼標(biāo)準(zhǔn)所定 義的、能被用來(lái)實(shí)現(xiàn)本發(fā)明的一個(gè)示例性的三種類(lèi)型圖像的序列。 圖2表示的是按照本發(fā)明的實(shí)施例、優(yōu)選地將每個(gè)圖像劃分成含有宏塊的片 (slices)。 圖3a表示的是按照本發(fā)明的實(shí)施例、可以將一個(gè)宏塊進(jìn)一步劃分成16X8像素的 塊尺寸。 圖3b表示的是按照本發(fā)明的實(shí)施例、可以將一個(gè)宏塊進(jìn)一步劃分成8X16像素的 塊尺寸。
圖3c表示的是按照本發(fā)明的實(shí)施例、可以將一個(gè)宏塊進(jìn)一步劃分成8X8像素的塊 尺寸。 圖3d表示的是按照本發(fā)明的實(shí)施例、可以將一個(gè)宏塊進(jìn)一步劃分成8X4像素的塊 尺寸。 圖3e表示的是按照本發(fā)明的實(shí)施例、可以將一個(gè)宏塊進(jìn)一步劃分成4X8像素的塊 尺寸。 圖3f表示的是按照本發(fā)明的實(shí)施例、可以將一個(gè)宏塊進(jìn)一步劃分成4X4像素的塊 尺寸。 圖4表示的是一個(gè)解釋本發(fā)明的實(shí)施例的使用具有運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間預(yù)測(cè)的圖像 構(gòu)造例子。 圖5表示的是解釋按照本發(fā)明的實(shí)施例、在具有運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間預(yù)測(cè)中使用多個(gè) 基準(zhǔn)圖像的優(yōu)點(diǎn)的一個(gè)示例性圖像流。 圖6表示的是按照本發(fā)明的實(shí)施例、根據(jù)幀緩存器中的每個(gè)基準(zhǔn)幀與正在以幀模
式被編碼的當(dāng)前幀的距離向幀緩存器中的每個(gè)基準(zhǔn)幀分配一個(gè)唯一的基準(zhǔn)幀號(hào)。 圖7a表示按照本發(fā)明的實(shí)施例的一個(gè)示例性基準(zhǔn)場(chǎng)編號(hào)配置,其中,給予場(chǎng)奇偶
性與當(dāng)前場(chǎng)的相同的基準(zhǔn)場(chǎng)比它們對(duì)應(yīng)的第二場(chǎng)更小的編號(hào)。 圖7b表示一個(gè)示例性的基準(zhǔn)場(chǎng)編號(hào)配置,其中,當(dāng)前場(chǎng)是要被按兩個(gè)場(chǎng)編碼的圖 像的第二場(chǎng)。 圖8表示在按照本發(fā)明的實(shí)施例的場(chǎng)緩存器中的一個(gè)替代的基準(zhǔn)場(chǎng)編號(hào)配置。
圖9表示一個(gè)直接模式矢量計(jì)算的方法,其中,當(dāng)前宏塊和與其共同定位的 (co-loc8ted)宏塊二者都處于幀模式。 圖10表示一個(gè)直接模式矢量計(jì)算的方法,其中,當(dāng)前宏塊和與其共同定位的宏塊 二者都處于場(chǎng)模式。 圖11表示另一個(gè)直接模式矢量計(jì)算的方法,其中,當(dāng)前宏塊和與其共同定位的宏 塊二者都處于場(chǎng)模式。 圖12表示一個(gè)直接模式矢量計(jì)算的方法,其中,當(dāng)前宏塊處于場(chǎng)模式,與其共同 定位的宏塊處于幀模式。 圖13表示一個(gè)直接模式矢量計(jì)算的方法,其中,當(dāng)前宏塊處于幀模式,與其共同 定位的宏塊處于場(chǎng)模式。 圖14表示按照本發(fā)明實(shí)施例的在時(shí)間上的向前方向上具有兩個(gè)基準(zhǔn)圖像的B圖像。 圖15表示按照本發(fā)明實(shí)施例的在時(shí)間上的向后方向上具有兩個(gè)基準(zhǔn)圖像的B圖 像。 圖16表示在時(shí)間上的向前方向上具有一個(gè)前向基準(zhǔn)圖像和在時(shí)間上的向后方向 具有一個(gè)后向基準(zhǔn)圖像的B圖像。 在各附圖中,相同的標(biāo)注號(hào)代表相似的一但未必是相同的一部件。
發(fā)明的實(shí)施例詳述 本發(fā)明提供一種在圖像級(jí)對(duì)包含一個(gè)圖像流的數(shù)字視頻內(nèi)容的自適應(yīng)幀/場(chǎng) (AFF)編碼的方法。在圖像級(jí)上的AFF編碼過(guò)程中,要被編碼的圖像流中的每個(gè)圖像或者被按幀模式或者被按場(chǎng)模式編碼,而不管其它圖像的幀或場(chǎng)編碼模式。如果一個(gè)圖像是按幀 模式被編碼的,則構(gòu)成一個(gè)交織幀的兩個(gè)場(chǎng)被共同地編碼。相反,如果一個(gè)圖像是按場(chǎng)模式 被編碼的,則構(gòu)成一個(gè)交織幀的兩個(gè)場(chǎng)被分開(kāi)編碼。編碼器確定對(duì)每個(gè)圖像來(lái)說(shuō)幀模式編 碼和場(chǎng)模式編碼中的哪一種編碼更有益,并為該圖像選擇該種編碼模式。在幀模式與場(chǎng)模 式之間進(jìn)行選擇的具體方法對(duì)本發(fā)明來(lái)說(shuō)并不重要,因此將不再這里詳述。
如上所述,MPEG-4Part 10AVC/H. 264標(biāo)準(zhǔn)是一種編碼和壓縮數(shù)字視頻內(nèi)容的新 標(biāo)準(zhǔn)。建立MPEG-4Part 10AVC/H. 264標(biāo)準(zhǔn)的文件在這里作為參考引用,包括聯(lián)合視頻組 (JVT) (Joint Video Team) 2002年8月10日發(fā)布的"Joint Final Committee Draft (JFCD) of JointVideo Specification"(ITU-T Rec. H. 264&IS0/IEC 14496-1OAVC)。該JVT由ISO 或MPEG和ITU-T的專(zhuān)家組成。由于MPEG-4Part 10AVC/H. 264標(biāo)準(zhǔn)的公開(kāi)性質(zhì),本發(fā)明說(shuō) 明書(shū)將不試圖展示MPEG-4PartlOAVC/H. 264視頻編碼的所有現(xiàn)有的方面,而是依賴(lài)該標(biāo)準(zhǔn) 的所引用的說(shuō)明書(shū)。 盡管這個(gè)AFF編碼方法是與MPEG-4Part 10AVC/H. 264標(biāo)準(zhǔn)指南相容的,并且將要
利用后者作解釋?zhuān)摲椒ㄒ部梢员恍薷牡米钸m合于某個(gè)標(biāo)準(zhǔn)或應(yīng)用。
現(xiàn)在將利用各附圖來(lái)解釋本發(fā)明的各優(yōu)選實(shí)施例。 圖1表示由例如MPEG-4Part 10AVC/H. 264標(biāo)準(zhǔn)之類(lèi)的示例性視頻編碼標(biāo)準(zhǔn)所定 義的、能被用來(lái)實(shí)現(xiàn)本發(fā)明的一個(gè)示例性的三種類(lèi)型圖像的序列。如前文提到的那樣,編碼 器編碼圖像,解碼器解碼圖像。編碼器或解碼器可以是處理器、專(zhuān)用集成電路(ASIC)、現(xiàn)場(chǎng) 可編程門(mén)陣列(FPGA)、編解碼器(CODEC)、數(shù)字信號(hào)處理器(DSP)、或能編碼圖像流的某種 其它電子裝置。然而,在下文中以及在后附的權(quán)利要求書(shū)中,除非特別地另外指明,否則將 用術(shù)語(yǔ)"編碼器"來(lái)泛指編碼包含一個(gè)圖像流的數(shù)字視頻內(nèi)容的所有電子裝置。同樣,在下 文中以及在后附的權(quán)利要求書(shū)中,除非特別地另外指明,否則將用術(shù)語(yǔ)"解碼器"來(lái)泛指解 碼包含一個(gè)圖像流的數(shù)字視頻內(nèi)容的所有電子裝置。 如圖1中所示,優(yōu)選地有三種類(lèi)型的圖像能被用于視頻編碼方法中。定義三種類(lèi) 性的圖像,以在利用具有運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間預(yù)測(cè)探索最大冗余減少的同時(shí)支持對(duì)被存儲(chǔ)的 數(shù)字視頻內(nèi)容的隨機(jī)訪問(wèn)。這三種類(lèi)型的圖像是幀內(nèi)(I)圖像(100)、預(yù)測(cè)的(P)圖像 (102a, b)、雙預(yù)測(cè)的(B)圖像(101a-d)。 I圖像(100)提供一個(gè)用于隨機(jī)訪問(wèn)被存儲(chǔ)的數(shù) 字視頻內(nèi)容的訪問(wèn)點(diǎn)并且只能以輕微的壓縮被編碼。對(duì)幀內(nèi)圖像(100)編碼時(shí)不參考基準(zhǔn) 圖像。 編碼一個(gè)預(yù)測(cè)的圖像(102a,b)時(shí),用一個(gè)已經(jīng)被編碼的I、P或B圖像作為基準(zhǔn)圖 像。該基準(zhǔn)圖像可以在相對(duì)于正在被編碼的P圖像的向前或向后的時(shí)間方向上。預(yù)測(cè)的圖 像(102a,b)能被編碼得比幀內(nèi)圖像(100)有更多的壓縮。 編碼 一 個(gè)雙預(yù)測(cè)的圖像(101a-d)時(shí),使用兩個(gè)時(shí)間基準(zhǔn)圖像(temporal reference pictures):—個(gè)前向基準(zhǔn)圖像和一個(gè)后向基準(zhǔn)圖像。前向基準(zhǔn)圖像有時(shí)被稱(chēng)作 過(guò)去基準(zhǔn)圖像,后向基準(zhǔn)圖像有時(shí)被稱(chēng)作將來(lái)基準(zhǔn)圖像。本發(fā)明的一個(gè)實(shí)施例是,前向基準(zhǔn) 圖像和后向基準(zhǔn)圖像可以位于相對(duì)于正在被編碼的B圖像的相同的時(shí)間方向上。雙預(yù)測(cè)的 圖像(101a-d)能被編碼得在這三種圖像類(lèi)型中具有最大的壓縮。 這三種圖像類(lèi)型之間的基準(zhǔn)關(guān)系(103)在圖1中表示。例如,P圖像(102a)能被 用編碼的I圖像(100)作為其基準(zhǔn)圖像而編碼。如圖1中所示,B圖像(101a-b)能被用編碼的I圖像(100)和/或編碼的P圖像(102a)作為其基準(zhǔn)圖像而編碼。按照本發(fā)明的一 個(gè)實(shí)施例的原理,編碼的B圖像(lOla-d)也能被用作其它要被編碼的B圖像的基準(zhǔn)圖像。 例如,圖1顯示,B圖像(101c)有兩個(gè)其它的B圖像(101b和101d)作為其基準(zhǔn)圖像。
圖1中所示的1(100)、B(101a-d)及P(102a,b)圖像的數(shù)量和特定次序是作為一 個(gè)示例性的圖像配置而給出的,但是對(duì)于實(shí)現(xiàn)本發(fā)明來(lái)說(shuō)并不是必需的??梢允褂冒慈魏?次序的任何數(shù)量的I、 B禾P P圖像,以最好地適合于特定的應(yīng)用。MPEG-4Part 10AVC/H. 264 標(biāo)準(zhǔn)并不限制兩個(gè)基準(zhǔn)圖像之間的B圖像數(shù),也不限制兩個(gè)I圖像之間的圖像數(shù)。
圖2表示優(yōu)選地將每個(gè)圖像劃分成片(202)。 一個(gè)片(202)含有一組宏塊(201)。 一個(gè)宏塊是一個(gè)矩形的像素組。如圖2中所示,一個(gè)優(yōu)選的宏塊(201)大小是16X16像素。
圖3a-f表示可以將一個(gè)宏塊進(jìn)一步劃分成大小更小的塊。例如,如圖3a-f中所 示,可以將一個(gè)宏塊進(jìn)一步劃分成如下的塊尺寸16X8像素(圖3a ;300) 、8X16像素(圖 3b ;301) 、8X8像素(圖3c ;302) 、8X4像素(圖3d ;303) 、4X8像素(圖3e ;304)、或4X4像 素(圖3f ;305)。 圖4表示的是一個(gè)解釋本發(fā)明的實(shí)施例的使用具有運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間預(yù)測(cè)的圖像 構(gòu)造例子。具有運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間預(yù)測(cè)假設(shè),可以將一個(gè)當(dāng)前圖像一圖像N(400)—局部地建 模為另一個(gè)圖像一圖像N-1(401)—的一個(gè)平移。圖像N-1(401)是用于對(duì)圖像N(400)的編 碼的基準(zhǔn)圖像,可位于相對(duì)于圖像N(400)的向前或向后的時(shí)間方向上。
如圖4中所示,優(yōu)選地將每個(gè)圖像劃分成含有宏塊(201a,b)的片。圖像N-1(401) 含有一個(gè)將要在圖像N(400)中被顯示的圖像(403)。如圖4中所示,圖像(403)在圖像 N(400)中將處于一個(gè)與它在圖像N-1(401)中所處的不同的時(shí)間位置(402)。圖像N(400) 的每個(gè)宏塊(201a)的圖像內(nèi)容,是根據(jù)圖像N-1(401)的每個(gè)對(duì)應(yīng)宏塊(201b)的圖像內(nèi)容 預(yù)測(cè)的,具體是通過(guò)估計(jì)圖像(403)移動(dòng)到其在圖像N(400)中的新的時(shí)間位置(402)所需 的圖像N-1(401)的每個(gè)宏塊(201b)的圖像內(nèi)容的時(shí)間運(yùn)動(dòng)的量進(jìn)行預(yù)測(cè)。實(shí)際被編碼并 傳送的,不是原始的圖像(402),而是圖像(402)與其預(yù)測(cè)(403)之間的差(404)。
對(duì)于圖像N(400)中的每個(gè)圖像(402)來(lái)說(shuō),時(shí)間預(yù)測(cè)常??梢杂纱韴D像(403) 移動(dòng)到其在圖像N(400)中的新位置(402)所需的時(shí)間運(yùn)動(dòng)量的運(yùn)動(dòng)矢量表示。被用于具 有運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間預(yù)測(cè)的運(yùn)動(dòng)矢量(406)需要被編碼和傳送。 圖4表示圖像N(400)中的圖像(402)可由所述圖像和它的預(yù)測(cè)之間的差(404) 以及相關(guān)聯(lián)的運(yùn)動(dòng)矢量(406)表示。可以有不同的使用運(yùn)動(dòng)矢量進(jìn)行編碼的具體方法以最 適于某一特定應(yīng)用,所述具體方法可以由本領(lǐng)域熟練技術(shù)人員很容易地實(shí)現(xiàn)。
圖5表示的是解釋按照本發(fā)明的實(shí)施例、在具有運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間預(yù)測(cè)中使用多個(gè) 基準(zhǔn)圖像的優(yōu)點(diǎn)的一個(gè)示例性圖像流。多個(gè)基準(zhǔn)圖像的使用,增加了圖像N(400)以可能最 大的壓縮被編碼的可能性。在這個(gè)例子中,圖像N-l (401) 、 N-2(500) 、 N-3(501)已經(jīng)被編 碼。如圖5中所示,圖像N-3(501)中的一個(gè)圖像(540)與圖像N-2(500)和N-1(401)的圖 像(503,502)分別相比,和圖像N(400)中的圖像(402)更相似。多個(gè)基準(zhǔn)圖像的使用,允 許用圖像N-3(501)而不是圖像N-1(401)作為基準(zhǔn)圖像對(duì)圖像N(400)編碼。
現(xiàn)在將更詳細(xì)地解釋對(duì)一個(gè)圖像流的圖像級(jí)的AFF編碼。 一個(gè)交織序列的幀含有 兩個(gè)場(chǎng),即交替的并在時(shí)間上間隔一個(gè)場(chǎng)周期的上場(chǎng)和下場(chǎng)。該場(chǎng)周期是幀周期時(shí)間的一 半。在圖像級(jí)AFF編碼過(guò)程中,一個(gè)交織幀的兩個(gè)場(chǎng)能被共同地或者分開(kāi)地編碼。如果被共同地編碼,采用幀模式編碼。相反地,如果這兩個(gè)場(chǎng)被分開(kāi)地編碼,則采用場(chǎng)模式編碼。
另一方面,固定的幀/場(chǎng)編碼,只以一種模式編碼一個(gè)圖像流的所有圖像。該模式 可以是幀模式,也可以是場(chǎng)模式。圖像級(jí)的AFF編碼優(yōu)選地是固定的幀/場(chǎng)編碼,因?yàn)樗?許編碼器根據(jù)數(shù)字視頻材料的內(nèi)容來(lái)選擇要用幀模式和場(chǎng)模式中的哪一個(gè)模式來(lái)編碼圖 像流中的每個(gè)圖像。 幀模式編碼用已經(jīng)被編碼了的圖像作為基準(zhǔn)幀。該基準(zhǔn)幀可以是任何編碼了的I 、 P或B幀。在作為編碼器一部分的幀緩存器中存儲(chǔ)所述基準(zhǔn)幀。本發(fā)明的一個(gè)實(shí)施例是, 如圖6中的示例性格局所示的那樣,根據(jù)幀緩存器中的每個(gè)基準(zhǔn)幀與正在以幀模式被編碼 的當(dāng)前圖像之間的距離,向幀緩存器中的每個(gè)基準(zhǔn)幀分配一個(gè)唯一的基準(zhǔn)幀號(hào)。例如,如 圖6中所示,一個(gè)要按一個(gè)幀(600)編碼的當(dāng)前圖像有多個(gè)在幀緩存器(601)中的基準(zhǔn)幀 (0-5)。圖6也示出了與該當(dāng)前幀(600)和基準(zhǔn)幀(0-5)對(duì)應(yīng)的場(chǎng)(fl, f2)。用虛線標(biāo)記 的fl是第一場(chǎng),用虛線標(biāo)記的f2是第二場(chǎng)。第一場(chǎng)是在一個(gè)有兩個(gè)場(chǎng)的圖像中被編碼的 第一個(gè)場(chǎng)。同樣,第二場(chǎng)是在一個(gè)有兩個(gè)場(chǎng)的圖像中被編碼的第二個(gè)場(chǎng)。本發(fā)明的一個(gè)實(shí) 施例是,第一場(chǎng)可以是頂場(chǎng)或者是底場(chǎng)。在本發(fā)明的另一個(gè)實(shí)施例中,第二場(chǎng)也可以是頂場(chǎng) 或者是底場(chǎng)。各幀由實(shí)線表示。如圖6中所示,基準(zhǔn)幀0是時(shí)間上最靠近當(dāng)前幀(600)的 基準(zhǔn)幀?;鶞?zhǔn)幀在時(shí)間上離當(dāng)前幀(600)越遠(yuǎn),其基準(zhǔn)幀號(hào)越大。 按照本發(fā)明一個(gè)實(shí)施例的原理,一個(gè)被按一個(gè)幀編碼的B圖像可有多個(gè)前向和后
向的基準(zhǔn)圖像。其中為每個(gè)所述前向和后向基準(zhǔn)圖像分配唯一的編號(hào)。 在具有運(yùn)動(dòng)補(bǔ)償算法的時(shí)間預(yù)測(cè)中,對(duì)被按一個(gè)幀編碼的圖像中的每一個(gè)像素進(jìn)
行子像素內(nèi)插(sub-pelinterpolation)。也可以通過(guò)重復(fù)幀邊界上的像素而對(duì)按幀編碼的
基準(zhǔn)圖像施行填充。在具有運(yùn)動(dòng)補(bǔ)償算法的時(shí)間預(yù)測(cè)中,填充有時(shí)是適當(dāng)?shù)???梢詫?duì)幀塊
應(yīng)用循環(huán)濾波(loop filtering)或去分塊(de-blocking)方案,以解決相鄰塊的邊沿處像
素值不連續(xù)的問(wèn)題。 按照本發(fā)明的另一個(gè)實(shí)施例,在AFF編碼過(guò)程中可以跳過(guò)一個(gè)P圖像中的一個(gè)宏 塊。如果某宏塊被跳過(guò),它的數(shù)據(jù)在對(duì)圖像的編碼過(guò)程中不被傳送。通過(guò)復(fù)制已經(jīng)被最近 編碼的I或P基準(zhǔn)圖像中共同定位的具有運(yùn)動(dòng)補(bǔ)償?shù)暮陦K來(lái)重構(gòu)P圖像中一個(gè)被跳過(guò)的宏 塊。 場(chǎng)模式編碼用已經(jīng)被編碼的圖像作為基準(zhǔn)場(chǎng)?;鶞?zhǔn)場(chǎng)可以是任何編碼的I、P或B 場(chǎng)?;鶞?zhǔn)場(chǎng)被存儲(chǔ)在作為編碼器一部分的場(chǎng)緩存器中。本發(fā)明的一個(gè)實(shí)施例是,根據(jù)場(chǎng)緩 存器中的每個(gè)基準(zhǔn)場(chǎng)與正在被作為兩個(gè)場(chǎng)編碼的當(dāng)前圖像的距離向場(chǎng)緩存器中的每個(gè)基 準(zhǔn)場(chǎng)分配一個(gè)唯一的基準(zhǔn)場(chǎng)號(hào)。圖7a和7b表示按照本發(fā)明的實(shí)施例的示例性基準(zhǔn)場(chǎng)編號(hào) 配置,其中,給予場(chǎng)奇偶性與當(dāng)前場(chǎng)的相同的基準(zhǔn)場(chǎng)比它們對(duì)應(yīng)的第二場(chǎng)更小的號(hào)。如果兩 個(gè)場(chǎng)都是頂場(chǎng)或者都是底場(chǎng),則這兩個(gè)場(chǎng)具有相同的場(chǎng)奇偶性。在圖7a和7b的例子中,如 果要被編碼的當(dāng)前圖像的第一場(chǎng)是個(gè)頂場(chǎng),則各基準(zhǔn)圖像的第一場(chǎng)也是頂場(chǎng)。于是第二場(chǎng) 則是底場(chǎng)。第一場(chǎng)也可以都是底場(chǎng),而第二場(chǎng)可以都是頂場(chǎng)。 如圖7a中所示,一個(gè)要按場(chǎng)模式被編碼的當(dāng)前圖像有多個(gè)在場(chǎng)緩存器(701)中的 基準(zhǔn)場(chǎng)(0-10)。用虛線標(biāo)記的fl是第一場(chǎng),用虛線標(biāo)記的f2是第二場(chǎng)。與場(chǎng)對(duì)應(yīng)的幀也 在圖7a中顯示,并被用實(shí)線表示。如圖7a中所示,如果要被編碼的圖像的第一個(gè)場(chǎng)是當(dāng)前 幀(700),則向場(chǎng)緩存器(701)中的第一個(gè)圖像的第一場(chǎng)分配編號(hào)O,同時(shí)向場(chǎng)緩存器(701)中的第一個(gè)圖像的第二場(chǎng)分配編號(hào)1?;鶞?zhǔn)場(chǎng)在時(shí)間上離當(dāng)前場(chǎng)(700)越遠(yuǎn),其基準(zhǔn)場(chǎng)號(hào)就 越大。場(chǎng)緩存器中的各圖像的第一場(chǎng)比它們對(duì)應(yīng)的第二場(chǎng)有更低的基準(zhǔn)號(hào)。
圖7b表示一個(gè)示例性的基準(zhǔn)場(chǎng)編號(hào)配置,其中,當(dāng)前場(chǎng)(702)是要被按兩個(gè)場(chǎng)編 碼的圖像的第二場(chǎng)。用虛線標(biāo)記的H是第一場(chǎng),用虛線標(biāo)記的f2是第二場(chǎng)。當(dāng)前圖像的 第一場(chǎng)已經(jīng)被編碼。如圖7b中所示,因?yàn)楫?dāng)前場(chǎng)(702)是個(gè)第二場(chǎng),場(chǎng)緩存器(701)中的 第一個(gè)圖像的第二場(chǎng)被分配編號(hào)O。當(dāng)前圖像的第一已編碼的場(chǎng)被分配編號(hào)l?;鶞?zhǔn)場(chǎng)在 時(shí)間上離當(dāng)前場(chǎng)(702)越遠(yuǎn),其基準(zhǔn)場(chǎng)號(hào)就越大。場(chǎng)緩存器中的各圖像的第二場(chǎng)比它們對(duì) 應(yīng)的第一場(chǎng)有更低的基準(zhǔn)號(hào)。 圖8表示在按照本發(fā)明的實(shí)施例的場(chǎng)緩存器中的一個(gè)替代的基準(zhǔn)場(chǎng)編號(hào)配置。在
這個(gè)配置中,并不特殊對(duì)待場(chǎng)奇偶性與當(dāng)前場(chǎng)的相同的場(chǎng)。例如,如圖8中所示,當(dāng)前場(chǎng)
(800)是個(gè)第一場(chǎng)。場(chǎng)緩存器中的最近編碼的圖像的最近編碼的場(chǎng)被賦予基準(zhǔn)號(hào)O?;鶞?zhǔn)
場(chǎng)在時(shí)間上離當(dāng)前場(chǎng)(800)越遠(yuǎn),其基準(zhǔn)場(chǎng)號(hào)就越大,不管它們的場(chǎng)奇偶性如何。 按照本發(fā)明另一個(gè)實(shí)施例,如果編碼器為某個(gè)特定P圖像選擇場(chǎng)編碼,編碼器可
用被作為一個(gè)基準(zhǔn)場(chǎng)編碼的第一場(chǎng)來(lái)對(duì)第二場(chǎng)編碼。如果該圖像是個(gè)B圖像,則被編碼的
第一場(chǎng)可被用作用于對(duì)第二場(chǎng)編碼的兩個(gè)基準(zhǔn)場(chǎng)的其中之一。 對(duì)于自適應(yīng)雙預(yù)測(cè)(ABP)來(lái)說(shuō),可以在場(chǎng)模式下編碼兩個(gè)基準(zhǔn)圖像。在這種情況 下,在計(jì)算被定標(biāo)的(scaled)運(yùn)動(dòng)矢量時(shí)所用的時(shí)間距離是以場(chǎng)間隔計(jì)的。在ABP編碼過(guò) 程中,兩個(gè)基準(zhǔn)幀在相同的方向上。 在具有運(yùn)動(dòng)補(bǔ)償算法的時(shí)間預(yù)測(cè)中,對(duì)一個(gè)被按場(chǎng)模式編碼的圖像中的每一個(gè)像 素進(jìn)行子像素內(nèi)插。也可以通過(guò)重復(fù)場(chǎng)邊界上的像素而對(duì)按場(chǎng)編碼的基準(zhǔn)圖像施加填充。 在具有運(yùn)動(dòng)補(bǔ)償算法的時(shí)間預(yù)測(cè)中,填充有時(shí)是適當(dāng)?shù)?。可以?duì)場(chǎng)塊應(yīng)用循環(huán)濾波或去分 塊方案,以解決相鄰塊的邊沿處像素值不連續(xù)的問(wèn)題。 按照本發(fā)明的另一個(gè)實(shí)施例,在AFF編碼過(guò)程中可以跳過(guò)一個(gè)P圖像中的一個(gè)宏 塊。如果某個(gè)宏塊被跳過(guò),它的數(shù)據(jù)在對(duì)圖像的編碼過(guò)程中不被傳送。通過(guò)復(fù)制相同場(chǎng)奇 偶性的最近編碼的I或P基準(zhǔn)場(chǎng)中共同定位的具有運(yùn)動(dòng)補(bǔ)償?shù)暮陦K來(lái)重構(gòu)P圖像中一個(gè)被 跳過(guò)的宏塊。另一個(gè)實(shí)施例是,通過(guò)復(fù)制場(chǎng)奇偶性可能是不同的最近編碼的基準(zhǔn)場(chǎng)中共同 定位的宏塊來(lái)重構(gòu)P圖像中該被跳過(guò)的宏塊。 本發(fā)明的另一個(gè)實(shí)施例是對(duì)B圖像的直接模式編碼。在直接模式編碼過(guò)程中,一 個(gè)B圖像中的宏塊的前向和后向運(yùn)動(dòng)矢量是從在一個(gè)后向基準(zhǔn)圖像的對(duì)應(yīng)的、或共同定位 的宏塊中所使用的運(yùn)動(dòng)矢量中被導(dǎo)出的。在兩個(gè)圖像中共同定位的宏塊在這兩個(gè)圖像中都 占據(jù)相同的幾何位置。后向基準(zhǔn)圖像有時(shí)被稱(chēng)作前向基準(zhǔn)圖像,盡管按照本發(fā)明一個(gè)實(shí)施 例,后向基準(zhǔn)圖像不必在時(shí)間上先于正在被編碼的當(dāng)前圖像。 直接編碼模式比其它編碼方法有利,這是因?yàn)?,在幀間模式編碼中,一個(gè)宏塊可以 有多達(dá)16個(gè)運(yùn)動(dòng)矢量和多達(dá)4個(gè)基準(zhǔn)幀。幀間模式編碼利用具有運(yùn)動(dòng)補(bǔ)償?shù)臅r(shí)間預(yù)測(cè)編 碼一個(gè)宏塊。如果用幀間編碼對(duì)一個(gè)宏塊進(jìn)行編碼,MPEG-4Part 10AVC/H. 264標(biāo)準(zhǔn)允許 圖3a-f的6個(gè)較小的塊尺寸(16X8像素、8X16像素、8X8像素、8X4像素、4X8像素、4X4像 素)中的每一個(gè)有其自己的運(yùn)動(dòng)矢量。16X16像素的塊尺寸也可以有其自己的運(yùn)動(dòng)矢量。 MPEG-4Part 10AVC/H. 264標(biāo)準(zhǔn)也允許16X16像素、16X8像素、8X16像素、8X8像素的塊尺寸 有其自己的基準(zhǔn)幀。因此,一個(gè)宏塊可以有多達(dá)16個(gè)運(yùn)動(dòng)矢量和多達(dá)4個(gè)基準(zhǔn)幀。由于有這么多潛在運(yùn)動(dòng)矢量,從后向基準(zhǔn)圖像的共同定位的宏塊的已經(jīng)被計(jì)算的運(yùn)動(dòng)矢量導(dǎo)出一個(gè)要被編碼的宏塊的運(yùn)動(dòng)矢量是有利的。在直接模式編碼過(guò)程中,一個(gè)要被編碼的宏塊的前向運(yùn)動(dòng)矢量和后向運(yùn)動(dòng)矢量,被當(dāng)作后向基準(zhǔn)圖像中共同定位的宏塊的前向運(yùn)動(dòng)矢量的已定標(biāo)的版本(scaled versions)計(jì)算。 在圖像級(jí)的AFF編碼中, 一個(gè)B圖像和它的后向基準(zhǔn)圖像各自都能按幀模式或按場(chǎng)模式被編碼。因此,就幀編碼模式和場(chǎng)編碼模式而言,對(duì)該B圖像中的一對(duì)宏塊和在后向基準(zhǔn)圖像中它的共同定位的一個(gè)宏塊來(lái)說(shuō),可能有四種不同組合。在第一種情形中,當(dāng)前宏塊和它的共同定位的宏塊二者都是幀模式。在第二種情形中,當(dāng)前宏塊和它的共同定位的宏塊二者都是場(chǎng)模式。在第三種情形中,當(dāng)前宏塊是場(chǎng)模式,它的共同定位的宏塊是幀模式。最后,在第四種情形中,當(dāng)前宏塊是幀模式,它的共同定位的宏塊是場(chǎng)模式。對(duì)要被編碼的宏塊的直接模式運(yùn)動(dòng)矢量計(jì)算的方法在這四種情形中的每一個(gè)中都不同。以下將詳細(xì)說(shuō)明這4種對(duì)B圖像中的宏塊的直接模式運(yùn)動(dòng)矢量計(jì)算的方法。 將結(jié)合圖9說(shuō)明在第一種情形中的直接模式矢量計(jì)算的方法。如圖9中所示,一個(gè)當(dāng)前B圖像(900),要用一個(gè)已經(jīng)被按幀模式編碼的后向基準(zhǔn)圖像(901)和一個(gè)前向基準(zhǔn)圖像(902)作為基準(zhǔn)圖像,按幀模式被編碼。圖9中的各幀用豎實(shí)線表示,它們對(duì)應(yīng)的場(chǎng)fl和f2用縱向虛線表示。按照本發(fā)明一個(gè)實(shí)施例,后向基準(zhǔn)圖像(901)可以是一個(gè)已經(jīng)被按幀模式編碼的I、P或B圖像。類(lèi)似地,前向基準(zhǔn)圖像(902)也可以是一個(gè)編碼的I、P或B圖像。 如圖9中所示,當(dāng)前B圖像(900)中有一個(gè)塊(903),在后向基準(zhǔn)圖像(901)中有與其共同定位的塊(904)。塊(903)和共同定位的塊(904)有相等的像素尺度。這些尺度可以是16X16像素、16X8像素、8X16像素、8X8像素、8X4像素、4X8像素、或4X4像素。按照本發(fā)明一個(gè)實(shí)施例,編碼器為當(dāng)前B圖像(900)中的塊(903)導(dǎo)出兩個(gè)在具有運(yùn)動(dòng)補(bǔ)償算法的時(shí)間預(yù)測(cè)中使用的運(yùn)動(dòng)矢量。其中一個(gè)運(yùn)動(dòng)矢量MVp指向前向基準(zhǔn)圖像(902)。另一個(gè)運(yùn)動(dòng)矢量MVe指向后向基準(zhǔn)圖像(901)。這兩個(gè)運(yùn)動(dòng)矢量被按下面的公式計(jì)算
MVF = TRB MV/TRD MVB = (TRB_TRD) MV/TRD (公式1和2) 在公式1和2中,TRB是要被按幀模式編碼的當(dāng)前B圖像(900)與前向基準(zhǔn)圖像(902)之間的時(shí)間距離、該時(shí)間距離的近似值、與該時(shí)間距離成比例的距離、或與該時(shí)間距離的該近似值成比例的近似值。TR。是已經(jīng)被按幀模式編碼的前向基準(zhǔn)圖像(902)與后向基準(zhǔn)圖像(901)之間的時(shí)間距離、該時(shí)間距離的近似值、與該時(shí)間距離成比例的距離、或與該時(shí)間距離的該近似值成比例的近似值。下面將解釋計(jì)算基準(zhǔn)圖像之間的時(shí)間距離的優(yōu)選方法。MV是已經(jīng)為后向基準(zhǔn)圖像(901)中的共同定位的塊(904)計(jì)算出來(lái)的、指向前向基準(zhǔn)圖像(902)的運(yùn)動(dòng)矢量。 將結(jié)合圖10和11說(shuō)明在第二種情形中的直接模式矢量計(jì)算的方法。如圖10和圖11中所示,一個(gè)當(dāng)前B圖像(900),要用一個(gè)已經(jīng)被按場(chǎng)模式編碼的后向基準(zhǔn)圖像(901)和一個(gè)前向基準(zhǔn)圖像(902)作為基準(zhǔn)圖像,按場(chǎng)模式被編碼。圖10和11中的各幀用豎實(shí)線表示,它們對(duì)應(yīng)的場(chǎng)fl和f2用縱向虛線表示。按照本發(fā)明一個(gè)實(shí)施例,后向基準(zhǔn)圖像(901)可以是一個(gè)已經(jīng)被按場(chǎng)模式編碼的I、 P或B圖像。類(lèi)似地,前向基準(zhǔn)圖像(902)也可以是一個(gè)編碼的I 、 P或B圖像。
如圖10中所示,當(dāng)前B圖像(900)的第一場(chǎng)中有一個(gè)塊(905)。它的運(yùn)動(dòng)矢量是從后向基準(zhǔn)圖像(901)中與其共同定位的塊(906)的前向運(yùn)動(dòng)矢量M^導(dǎo)出的。按照?qǐng)D10中所示的實(shí)施例,共同定位的塊(906)位于一個(gè)與當(dāng)前B圖像(900)中的塊(905)所在場(chǎng)的奇偶性相同的場(chǎng)中。塊(905)和共同定位的塊(906)有相等的像素尺度。這些尺度可以是16X16像素、16X8像素、8X16像素、8X8像素、8X4像素、4X8像素、或4X4像素。
按照本發(fā)明一個(gè)實(shí)施例,編碼器為當(dāng)前B圖像(900)中的塊(905)導(dǎo)出兩個(gè)在具有運(yùn)動(dòng)補(bǔ)償算法的時(shí)間預(yù)測(cè)中使用的運(yùn)動(dòng)矢量。其中一個(gè)運(yùn)動(dòng)矢量MV^指向所指向的前向基準(zhǔn)圖像(902)中的場(chǎng)。另一個(gè)運(yùn)動(dòng)矢量MV^指向后向基準(zhǔn)圖像(901)中共同定位的塊(906)的場(chǎng)。這兩個(gè)運(yùn)動(dòng)矢量被按下面的公式計(jì)算
MVF, i = TRB, i MV乂TRd,丄 MVB, i = (TRB, 「TRD,》 MV乂TRd,丄 (公式3和4) 在公式3和4中,下標(biāo)i是場(chǎng)標(biāo)記(index)。第一場(chǎng)具有場(chǎng)標(biāo)記l,第二場(chǎng)具有場(chǎng)標(biāo)記2。因此,在圖10的示例性情形中,場(chǎng)標(biāo)記之所以為l,是因?yàn)榈谝粓?chǎng)正在被編碼。MVi是后向基準(zhǔn)圖像(901)的場(chǎng)i中共同定位的宏塊的前向運(yùn)動(dòng)矢量。TR吣是當(dāng)前B幀(900)的第i場(chǎng)與MVi所指向的基準(zhǔn)場(chǎng)之間的時(shí)間距離、該時(shí)間距離的近似值、與該時(shí)間距離成比例的距離、或與該時(shí)間距離的該近似值成比例的近似值。TR。,i是后向基準(zhǔn)圖像(901)的第i場(chǎng)與M、所指向的基準(zhǔn)場(chǎng)之間的時(shí)間距離、該時(shí)間距離的近似值、與該時(shí)間距離成比例的距離、或與該時(shí)間距離的該近似值成比例的近似值。 如圖10中所示,當(dāng)前B圖像(900)的第二場(chǎng)中有一個(gè)塊(907)。它在后向基準(zhǔn)圖像(901)的第二場(chǎng)中有一個(gè)共同定位的塊(908)。如果該共同定位的塊(908)的前向運(yùn)動(dòng)矢量指向除其自己的圖像以外的任何圖像中的一個(gè)以前編碼的場(chǎng),則前向運(yùn)動(dòng)矢量和后向運(yùn)動(dòng)矢量的計(jì)算遵循公式3和4,只是場(chǎng)標(biāo)記等于2。 然而,如圖11中所示,按照本發(fā)明一個(gè)實(shí)施例,后向基準(zhǔn)圖像(901)的第二場(chǎng)中的共同定位的塊(908)的前向運(yùn)動(dòng)矢量也可以指向同一個(gè)后向基準(zhǔn)圖像(901)的第一場(chǎng)。圖ll表示共同定位的塊(908)有一個(gè)指向后向基準(zhǔn)圖像(901)的第一場(chǎng)的前向運(yùn)動(dòng)矢量MV2。在這種情況下,當(dāng)前塊(907)的兩個(gè)運(yùn)動(dòng)矢量按下式計(jì)算
MVF,2 = _TRB,2 MV2/TRD,2 MVB,2 = _(TRB,2+TRD,2) MV2/TRD,2 (公式5和6) 在公式5禾P 6中,TRB,2是當(dāng)前B幀(900)的第2場(chǎng)與MV2所指向的基準(zhǔn)場(chǎng)之間的時(shí)間距離、該時(shí)間距離的近似值、與該時(shí)間距離成比例的距離、或與該時(shí)間距離的該近似值成比例的近似值。TR。,2是后向基準(zhǔn)圖像(901)的第2場(chǎng)與MV2所指向的基準(zhǔn)場(chǎng)之間的時(shí)間距離、該時(shí)間距離的近似值、與該時(shí)間距離成比例的距離、或與該時(shí)間距離的該近似值成比例的近似值。如圖11中所示,在這種情況下,這兩個(gè)運(yùn)動(dòng)矢量都指向向后的方向。
將結(jié)合圖12說(shuō)明在第三種情形中的直接模式矢量計(jì)算的方法。如圖12中所示,一個(gè)當(dāng)前B圖像(900),要用一個(gè)已經(jīng)被按幀模式編碼的后向基準(zhǔn)圖像(901)和一個(gè)前向基準(zhǔn)圖像(902)作為基準(zhǔn)圖像,按場(chǎng)模式被編碼。圖12中的各幀用豎實(shí)線表示,它們對(duì)應(yīng)的場(chǎng)fl和f2用縱向虛線表示。按照本發(fā)明一個(gè)實(shí)施例,后向基準(zhǔn)圖像(901)可以是一個(gè)已經(jīng)被按幀模式編碼的1、P或B圖像。類(lèi)似地,前向基準(zhǔn)圖像(902)也可以是一個(gè)編碼的I、P或B圖像。
如圖12中所示,當(dāng)前B圖像(900)的第一場(chǎng)中有一個(gè)塊(905)。按照?qǐng)D12中所示的實(shí)施例,共同定位的塊(904)是按幀模式編碼的。按照本發(fā)明一個(gè)實(shí)施例,編碼器為當(dāng)前B圖像(900)中的塊(905)導(dǎo)出兩個(gè)在具有運(yùn)動(dòng)補(bǔ)償算法的時(shí)間預(yù)測(cè)中使用的運(yùn)動(dòng)矢量。如圖12中所示,其中一個(gè)運(yùn)動(dòng)矢量MVw指向前向基準(zhǔn)圖像(902)中的具有與當(dāng)前塊(905)的場(chǎng)奇偶性相同的奇偶性的場(chǎng)。在圖12的例子中,當(dāng)前塊(905)位于當(dāng)前B圖像(900)的第一場(chǎng)中。另一個(gè)運(yùn)動(dòng)矢量MV^指向后向基準(zhǔn)圖像(901)中類(lèi)似奇偶性的場(chǎng)。這兩個(gè)運(yùn)動(dòng)矢量被按下面的公式計(jì)算
MVF, i = TRB, i MV/TRD MVB, i = (TRB, 「TRD) MV/TRD(公式7和8) 在公式7和8中,MV是通過(guò)將共同定位的塊(904)的基于幀的前向運(yùn)動(dòng)矢量在縱向方向上除以2而得出的。這就彌補(bǔ)了事實(shí)上共同定位的塊(904)是幀模式的、而當(dāng)前塊
(905) 是場(chǎng)模式的這樣的差異。下標(biāo)i是場(chǎng)標(biāo)記。第一場(chǎng)具有場(chǎng)標(biāo)記l,第二場(chǎng)具有場(chǎng)標(biāo)記2。因此,在圖12的示例性情形中,場(chǎng)標(biāo)記之所以為1,是因?yàn)榈谝粓?chǎng)正在被編碼。TR。是后向基準(zhǔn)圖像(901)的第i場(chǎng)與前向基準(zhǔn)幀(902)的第i場(chǎng)之間的時(shí)間距離、該時(shí)間距離的近似值、與該時(shí)間距離成比例的距離、或與該時(shí)間距離的該近似值成比例的近似值。TRB,i是當(dāng)前B圖像(900)的第i場(chǎng)與后向基準(zhǔn)圖像(901)中共同定位的塊(904)的基準(zhǔn)幀的第i場(chǎng)之間的時(shí)間距離、該時(shí)間距離的近似值、與該時(shí)間距離成比例的距離、或與該時(shí)間距離的該近似值成比例的近似值。用相同的公式計(jì)算當(dāng)前B圖像(900)中第二場(chǎng)中的塊(907)的運(yùn)動(dòng)矢量。 將結(jié)合圖13說(shuō)明在第四種情形中的直接模式矢量計(jì)算的方法。如圖13中所示,一個(gè)當(dāng)前B圖像(900),要用一個(gè)已經(jīng)被按場(chǎng)模式編碼的后向基準(zhǔn)圖像(901)和一個(gè)前向基準(zhǔn)圖像(902)作為基準(zhǔn)圖像,按幀模式被編碼。圖13中的各幀用豎實(shí)線表示,它們對(duì)應(yīng)的場(chǎng)fl和f2用縱向虛線表示。按照本發(fā)明一個(gè)實(shí)施例,后向基準(zhǔn)圖像(901)可以是一個(gè)已經(jīng)被按場(chǎng)模式編碼的1、P或B圖像。類(lèi)似地,前向基準(zhǔn)圖像(902)也可以是一個(gè)編碼的I、P或B圖像。 如圖13中所示,要被按幀編碼的當(dāng)前B圖像(900)有一個(gè)塊(903)。它的運(yùn)動(dòng)矢量是從它在后向基準(zhǔn)圖像(901)中共同定位的塊(906)的前向運(yùn)動(dòng)矢量MVJ尋出的。按照本發(fā)明一個(gè)實(shí)施例,編碼器為當(dāng)前B圖像(900)中的塊(903)導(dǎo)出兩個(gè)在具有運(yùn)動(dòng)補(bǔ)償算法的時(shí)間預(yù)測(cè)中使用的運(yùn)動(dòng)矢量。這兩個(gè)運(yùn)動(dòng)矢量被按下面的公式計(jì)算
MVF = TRB MV乂TRd,工MVB = (TRb-TR。,》 MV/TR^ (公式9和10) 在公式9和10中,M^是通過(guò)將后向基準(zhǔn)圖像(901)的第一場(chǎng)中共同定位的塊
(906) 的基于場(chǎng)的運(yùn)動(dòng)矢量在縱向方向上加倍而得出的。TRb是當(dāng)前B圉像(900)和基準(zhǔn)幀(902)之間的時(shí)間距離、該時(shí)間距離的近似值、與該時(shí)間距離成比例的距離、或與該時(shí)間距離的該近似值成比例的近似值,所述共同定位的塊(906)的前向運(yùn)動(dòng)矢量指向它的一個(gè)場(chǎng)。在圖13中,這個(gè)運(yùn)動(dòng)矢量是MV^ TR吣是后向基準(zhǔn)圖像(901)的第一場(chǎng)與共同定位的塊(906)的前向運(yùn)動(dòng)矢量所指向的前向基準(zhǔn)圖像(902)中的場(chǎng)之間的時(shí)間距離、該時(shí)間距離的近似值、與該時(shí)間距離成比例的距離、或與該時(shí)間距離的該近似值成比例的近似值。
本發(fā)明的另一個(gè)實(shí)施例將直接模式編碼擴(kuò)展到P圖像。在圖像級(jí)的AFF編碼中,一個(gè)P圖像和它的前向基準(zhǔn)圖像可以被按幀模式或者按場(chǎng)模式編碼。因此,就幀編碼模式和場(chǎng)編碼模式而言,對(duì)該P(yáng)圖像中的一對(duì)宏塊和在前向基準(zhǔn)圖像中它的共同定位的一個(gè)宏塊來(lái)說(shuō),可能有四種不同組合。第一種情形,當(dāng)前宏塊和它的共同定位的宏塊二者都是幀模式。第二種情形,當(dāng)前宏塊和它的共同定位的宏塊二者都是場(chǎng)模式。第三種情形,當(dāng)前宏塊是場(chǎng)模式,它的共同定位的宏塊是幀模式。最后,第四種情形,當(dāng)前宏塊是幀模式,它的共同定位的宏塊是場(chǎng)模式。P圖像中的塊只有一個(gè)運(yùn)動(dòng)矢量,即前向運(yùn)用矢量。對(duì)要被編碼的宏塊的直接模式運(yùn)動(dòng)矢量計(jì)算的方法在這四種情形中的每一個(gè)中都不同。以下將詳細(xì)說(shuō)明這4種對(duì)P圖像中的宏塊的直接模式運(yùn)動(dòng)矢量計(jì)算的方法。 第一種情形,當(dāng)前P圖像和它的前向基準(zhǔn)圖像二者都以幀模式被編碼。當(dāng)前P圖
像的一個(gè)塊的前向基準(zhǔn)圖像與前向基準(zhǔn)圖像中它的共同定位的塊所使用的是同一個(gè)圖像。
當(dāng)前塊的前向運(yùn)動(dòng)矢量MVp與它的共同定位的塊的前向運(yùn)動(dòng)矢量是相同的。 第二種情形,當(dāng)前P圖像和它的前向基準(zhǔn)圖像二者都以場(chǎng)模式被編碼。在對(duì)當(dāng)前P
圖像的一個(gè)場(chǎng)中的一個(gè)塊的直接模式編碼中的運(yùn)動(dòng)矢量,是根據(jù)前向基準(zhǔn)圖像中具有相同
奇偶性的場(chǎng)中的共同定位的塊的前向運(yùn)動(dòng)矢量計(jì)算出來(lái)的。當(dāng)前P圖像的第i場(chǎng)的塊的前
向運(yùn)動(dòng)矢量MVu,與前向基準(zhǔn)圖像中第i場(chǎng)中的它的共同定位的塊的前向運(yùn)動(dòng)矢量是相同的。 第三種情形,當(dāng)前P圖像是場(chǎng)模式,后向基準(zhǔn)圖像是幀模式。由于當(dāng)前P圖像中的
其中一個(gè)場(chǎng)中的一個(gè)塊的共同定位的塊是按幀編碼的,通過(guò)將共同定位塊的運(yùn)動(dòng)矢量在縱
向方向上除以2,就得出當(dāng)前P圖像中的其中一個(gè)場(chǎng)中的一個(gè)塊的前向運(yùn)動(dòng)矢量。 第四種情形,當(dāng)前P圖像是幀模式,前向基準(zhǔn)圖像是場(chǎng)模式。前向基準(zhǔn)圖像的第一
場(chǎng)中的共同定位的塊,被用于計(jì)算按幀模式的當(dāng)前P圖像中塊的前向運(yùn)動(dòng)矢量。通過(guò)將前
向基準(zhǔn)圖像的第一場(chǎng)中的共同定位塊的基于場(chǎng)的運(yùn)動(dòng)矢量在縱向方向上加倍,就得出按幀
模式的當(dāng)前P圖像中的一個(gè)塊的前向運(yùn)動(dòng)矢量MVp。 本發(fā)明的另一個(gè)實(shí)施例是多幀插值的(multi-frameinterpolative)預(yù)測(cè)模式(MFIP)。 MFIP是一種通用的幀插值預(yù)測(cè)架構(gòu)。如前文解釋過(guò)的那樣,一個(gè)按幀模式或者按場(chǎng)模式編碼的B圖像有兩個(gè)按幀模式或者按場(chǎng)模式編碼的基準(zhǔn)圖像。這兩個(gè)基準(zhǔn)圖像可以都是前向基準(zhǔn)圖像,如圖14中所示。圖14表示一個(gè)要被編碼的、有兩個(gè)基準(zhǔn)圖像的B圖像(140)。其中一個(gè)基準(zhǔn)圖像是前向基準(zhǔn)圖像(141),另一個(gè)是后向基準(zhǔn)圖像(142)。如圖14中所示,他們兩個(gè)都處于相同的時(shí)間上向前的方向上。這兩個(gè)基準(zhǔn)圖像也可以雙雙都處于相同的時(shí)間上向后的方向上,如圖15中所示。在圖15中,B圖像(140)有兩個(gè)都在時(shí)間上向后的方向上的一個(gè)前向基準(zhǔn)圖像(141)和一個(gè)后向基準(zhǔn)圖像(142)。圖16表示本發(fā)明的另一個(gè)實(shí)施例。如圖16中所示,B圖像(140)具有在時(shí)間上向前的方向上的一個(gè)前向基準(zhǔn)圖像(141)和在時(shí)間上向后的方向上的一個(gè)后向基準(zhǔn)圖像(142)。 在MFIP中, 一個(gè)預(yù)測(cè)信號(hào)是運(yùn)動(dòng)補(bǔ)償信號(hào)的一個(gè)線性插值。 一個(gè)B圖像的MPIF
中的預(yù)測(cè)信號(hào)(pred)可以按下式計(jì)算 pred = Wiref^ref^+d (公式11) 在公式11中,變量refi和ref2是兩個(gè)基準(zhǔn)圖像。變量巧和w2是加權(quán)因子。變量d的缺省值被設(shè)定為0。可以明確地為每個(gè)宏塊確定線性插值系數(shù)Wl、 w2、 d。如果re^和ref2兩個(gè)都是前向基準(zhǔn)圖像或者都是后向基準(zhǔn)圖像,則基準(zhǔn)圖像re^是就時(shí)間距離來(lái)說(shuō)更靠近B圖像的基準(zhǔn)圖像。對(duì)于雙向的基準(zhǔn)圖像來(lái)說(shuō),re^和ref2分別是前向基準(zhǔn)圖像和后向基準(zhǔn)圖像。 —個(gè)MFIP宏塊的兩個(gè)運(yùn)動(dòng)矢量被彼此相對(duì)地編碼。ref2的運(yùn)動(dòng)矢量MV2,是用下面的公式,通過(guò)將一個(gè)補(bǔ)償量DMV加到re^的成比例的運(yùn)動(dòng)矢量MVi而生成的 ,2 = VD +"緣(公式12) 在公式12中,變量DMV是增量(S)運(yùn)動(dòng)矢量并是一個(gè)補(bǔ)償值。變量TI^和TR2分別是當(dāng)前圖像與最近的基準(zhǔn)圖像re^和與最遠(yuǎn)的基準(zhǔn)圖像re&之間的時(shí)間距離、該時(shí)間距離的近似值、與該時(shí)間距離成比例的距離、或與該時(shí)間距離的該近似值成比例的近似值。
在圖像級(jí)AFF中,一個(gè)B圖像可以被按一個(gè)B幀圖像或者按兩個(gè)B場(chǎng)圖像編碼。按場(chǎng)模式處理MFIP—其中要被編碼的當(dāng)前B圖像按場(chǎng)結(jié)構(gòu)一的規(guī)則,在下文給出
用公式11生成預(yù)測(cè)信號(hào)。然而,refi和re&是由基準(zhǔn)場(chǎng)編號(hào)ref」dx—fws和ref—idx_bwd標(biāo)記的場(chǎng)。場(chǎng)re^和ref2既可以是頂場(chǎng),也可以是底場(chǎng)。缺省的加權(quán)因子Wl和w2分別是(.5, .5,0)和(2,-1,0)。 用公式12生成M、。由于兩個(gè)基準(zhǔn)圖像都是場(chǎng)結(jié)構(gòu)的,根據(jù)基準(zhǔn)場(chǎng)和當(dāng)前場(chǎng)之間的時(shí)間距離確定TRi和TR2。 MFIP模式中基準(zhǔn)場(chǎng)編號(hào)ref_idx_fwd和ref_idx_bwd的代碼編號(hào)(code number)遵循對(duì)場(chǎng)圖像的已知的常規(guī)約定。 AFF編碼中的圖像之間的時(shí)間距離,可以用變量一時(shí)間基準(zhǔn)(TR)—計(jì)算,或者通過(guò)計(jì)算圖像編號(hào)并計(jì)算它們的差而計(jì)算。本發(fā)明的一個(gè)實(shí)施例是,對(duì)于圖像級(jí)AFF,TR按每個(gè)場(chǎng)遞增l,并由一個(gè)常數(shù)(例如256)限制(wraped) 。 TR是場(chǎng)間隔(in field interval)。設(shè)n為幀標(biāo)記或幀號(hào)。變量n每幀遞增l。如果某個(gè)具有幀標(biāo)記n的幀是按幀模式編碼的,則這個(gè)幀的TR是2n。如果某個(gè)具有幀標(biāo)記n的幀是按場(chǎng)模式編碼的,則這個(gè)幀的第一場(chǎng)的TR是2n,第二場(chǎng)的TR是2n+l 。 前面所作的說(shuō)明僅是為了解釋和描述本發(fā)明的實(shí)施例。上述說(shuō)明并非是窮舉性的,也不是要把本發(fā)明限制到所公開(kāi)的任何具體形式。按照以上教導(dǎo)可以有許多修改和變體。 選擇上述實(shí)施例加以說(shuō)明是為了解釋本發(fā)明的原理和一些實(shí)際應(yīng)用。前面的說(shuō)明使所述技術(shù)領(lǐng)域的其他熟練人員能把本發(fā)明應(yīng)用于各種實(shí)施例并考慮到各種適合特定用途的修改。本發(fā)明的范圍應(yīng)由接下來(lái)的權(quán)利要求書(shū)限定。
權(quán)利要求
一種對(duì)具有多個(gè)圖像的圖像序列進(jìn)行編碼的方法,包括以幀編碼模式編碼所述多個(gè)圖像中的至少一個(gè)圖像;以場(chǎng)編碼模式編碼所述多個(gè)圖像中的至少一個(gè)圖像;其中所述以幀編碼模式編碼和以場(chǎng)編碼模式編碼的步驟各自包括編碼或解碼,并且當(dāng)所述多個(gè)圖像中的至少一個(gè)圖像以幀編碼模式編碼時(shí),則所述多個(gè)圖像中的至少一個(gè)圖像以場(chǎng)編碼模式編碼,并且當(dāng)所述多個(gè)圖像中的至少一個(gè)圖像以幀編碼模式解碼時(shí),則所述多個(gè)圖像中的至少一個(gè)圖像以場(chǎng)編碼模式解碼。
2. 如權(quán)利要求l的方法,其中如果所述多個(gè)圖像的所述至少一個(gè)圖像中的圖像以幀編 碼方式編碼,則構(gòu)成該圖像的兩個(gè)場(chǎng)被共同編碼,并且如果所述多個(gè)圖像的所述至少一個(gè)圖像中的圖像以場(chǎng)編碼模式編碼,則形成所述圖像 的兩個(gè)場(chǎng)被分開(kāi)編碼,其中所述兩場(chǎng)中的一個(gè)場(chǎng)是頂場(chǎng),另一個(gè)場(chǎng)是底場(chǎng)。
3. 如權(quán)利要求2的方法,其中在該幀編碼模式中,所述圖像被編碼為幀內(nèi)(I)圖像、預(yù) 測(cè)的(P)圖像、或雙預(yù)測(cè)的(B)圖像之一 ;并且其中所述預(yù)測(cè)的(P)圖像或所述雙預(yù)測(cè)的(B)圖像使用幀內(nèi)(I)圖像、預(yù)測(cè)的(P)圖 像、和雙預(yù)測(cè)的(B)圖像中的至少之一被編碼為已經(jīng)編碼的基準(zhǔn)圖像。
4. 如權(quán)利要求3的方法,其中所述基準(zhǔn)圖像處在相對(duì)于所述預(yù)測(cè)的(P)圖像或所述雙 預(yù)測(cè)的(B)圖像的向前或向后時(shí)間方向上。
5. 如權(quán)利要求3的方法,其中所述雙預(yù)測(cè)的(B)圖像根據(jù)至少兩個(gè)時(shí)間基準(zhǔn)圖像被編 碼,其中所述至少兩個(gè)時(shí)間基準(zhǔn)圖像同時(shí)處在相對(duì)于所述雙預(yù)測(cè)的(B)圖 >像的相同或不同 時(shí)間方向上。
6. 如權(quán)利要求2的方法,其中在所述場(chǎng)編碼模式中,所述圖像的所述兩場(chǎng)的一個(gè)當(dāng)前 場(chǎng)被編碼為幀內(nèi)(I)場(chǎng)、預(yù)測(cè)的(P)場(chǎng)、或雙預(yù)測(cè)的(B)場(chǎng)之一 ;禾口其中所述預(yù)測(cè)的(P)場(chǎng)和所述雙預(yù)測(cè)的(B)場(chǎng)中至少之一根據(jù)幀內(nèi)(I)場(chǎng)、預(yù)測(cè)的(P) 場(chǎng)、和雙向預(yù)測(cè)的(B)場(chǎng)中至少之一被編碼為已經(jīng)編碼的基準(zhǔn)場(chǎng)。
7. 如權(quán)利要求6的方法,其中所述基準(zhǔn)場(chǎng)處在相對(duì)于所述預(yù)測(cè)的(P)場(chǎng)或所述雙預(yù)測(cè) 的(B)場(chǎng)的向前或向后時(shí)間方向上。
8. 如權(quán)利要求6的方法,其中所述雙預(yù)測(cè)的(B)場(chǎng)根據(jù)至少兩個(gè)時(shí)間基準(zhǔn)場(chǎng)被編碼,其 中所述至少兩個(gè)時(shí)間基準(zhǔn)場(chǎng)同時(shí)處在相對(duì)于所述雙預(yù)測(cè)的(B)場(chǎng)的相同或不同時(shí)間方向 上。
9. 如權(quán)利要求6的方法,其中如果所述多個(gè)圖像中的所述至少一個(gè)圖像的第一場(chǎng)被編 碼為基準(zhǔn)場(chǎng),則所述多個(gè)圖像中的所述至少一個(gè)圖像的所述第一場(chǎng)被用作為對(duì)所述多個(gè)圖 像中的所述至少一個(gè)圖像的第二場(chǎng)進(jìn)行編碼的基準(zhǔn)場(chǎng)。
10. —種用于對(duì)具有多個(gè)圖像的圖像序列進(jìn)行編碼的設(shè)備,包括 一個(gè)編碼單元,被配置成以幀編碼模式編碼所述多個(gè)圖像中的至少一個(gè)圖像,和以場(chǎng)編碼模式編碼所述多個(gè)圖像中的至少一個(gè)圖像;其中所述編碼單元被配置成執(zhí)行編碼或解碼,或者執(zhí)行編碼和解碼兩者; 其中當(dāng)所述多個(gè)圖像中的至少一個(gè)圖像以幀編碼模式被編碼時(shí),則所述多個(gè)圖像中的至少一個(gè)圖像以場(chǎng)編碼模式被編碼;當(dāng)所述多個(gè)圖像中的至少一個(gè)圖像以幀編碼模式被解碼時(shí),則所述多個(gè)圖像中的至少 一個(gè)圖像以場(chǎng)編碼模式被解碼。
11. 如權(quán)利要求10的設(shè)備,其中如果所述多個(gè)圖像中的至少一個(gè)圖像以所述幀編碼模 式被編碼,則構(gòu)成所述圖像的兩個(gè)場(chǎng)被共同編碼;禾口其中如果所述多個(gè)圖像中的所述至少一個(gè)圖像以場(chǎng)編碼模式被編碼,則構(gòu)成所述圖像 的兩場(chǎng)被分開(kāi)編碼,其中所述兩場(chǎng)之一是頂場(chǎng),并且另一個(gè)是底場(chǎng)。
12. 如權(quán)利要求ll的設(shè)備,其中在所述幀編碼模式中,所述圖像被編碼為幀內(nèi)(I)圖 像、預(yù)測(cè)的(P)圖像、或雙預(yù)測(cè)的(B)圖像之一 ;禾口其中所述預(yù)測(cè)的(P)圖像和所述雙預(yù)測(cè)的(B)圖像中的至少一個(gè)使用幀內(nèi)(I)圖像、 預(yù)測(cè)的(P)圖像和雙預(yù)測(cè)的(B)圖像中的至少一個(gè)被編碼為已經(jīng)編碼的基準(zhǔn)圖像。
13. 如權(quán)利要求12的設(shè)備,其中所述基準(zhǔn)圖像處在相對(duì)于所述預(yù)測(cè)的(P)圖像或所述 雙預(yù)測(cè)的(B)圖像的向后或向前時(shí)間方向上。
14. 如權(quán)利要求12的設(shè)備,其中所述雙向預(yù)測(cè)的(B)圖像根據(jù)至少兩個(gè)時(shí)間基準(zhǔn)圖像 被編碼,其中所述至少兩個(gè)時(shí)間基準(zhǔn)圖像都同時(shí)處在相對(duì)于所述雙預(yù)測(cè)的(B)圖像的相同 或不同方向上。
15. 如權(quán)利要求ll的設(shè)備,其中在所述場(chǎng)編碼模式中,所述圖像的所述兩場(chǎng)中的當(dāng)前 場(chǎng)被編碼為幀內(nèi)(I)場(chǎng)、預(yù)測(cè)的(P)場(chǎng)、和雙預(yù)測(cè)的(B)場(chǎng)之一 ;禾口其中所述預(yù)測(cè)的(P)場(chǎng)和所述雙預(yù)測(cè)的(B)場(chǎng)中至少之一根據(jù)幀內(nèi)(I)場(chǎng)、預(yù)測(cè)的(P) 場(chǎng)、和雙向預(yù)測(cè)的(B)場(chǎng)中至少之一被編碼為已經(jīng)編碼的基準(zhǔn)場(chǎng)。
16. 如權(quán)利要求15的設(shè)備,其中所述基準(zhǔn)場(chǎng)處在相對(duì)于所述預(yù)測(cè)的(P)場(chǎng)或所述雙預(yù) 測(cè)的(B)場(chǎng)的向前或向后的時(shí)間方向上。
17. 如權(quán)利要求15的設(shè)備,其中所述雙預(yù)測(cè)的(B)場(chǎng)根據(jù)至少兩個(gè)時(shí)間基準(zhǔn)場(chǎng)而被編 碼,其中所述至少兩個(gè)時(shí)間場(chǎng)同時(shí)處在相對(duì)于所述雙預(yù)測(cè)的(B)場(chǎng)的相同或相反方向上。
18. 如權(quán)利要求15的設(shè)備,其中如果所述多個(gè)圖像中的所述至少一個(gè)圖像的第一場(chǎng)被 編碼為基準(zhǔn)場(chǎng),則所述多個(gè)圖像中的所述至少一個(gè)圖像的所述第一場(chǎng)被使用作為對(duì)所述多 個(gè)圖像的所述至少一個(gè)圖像的第二場(chǎng)進(jìn)行編碼的基準(zhǔn)場(chǎng)。
全文摘要
一種編碼或解碼數(shù)字視頻內(nèi)容的方法和系統(tǒng)。數(shù)字視頻內(nèi)容包含一個(gè)圖像流,每個(gè)圖像可能是幀內(nèi)的、預(yù)測(cè)的、或雙預(yù)測(cè)的圖像。每個(gè)圖像包含能被進(jìn)一步劃分成更小的塊的宏塊。該方法要求以幀模式或場(chǎng)模式編碼和解碼所述圖像流中的每個(gè)圖像。
文檔編號(hào)G06T9/00GK101715128SQ20091025413
公開(kāi)日2010年5月26日 申請(qǐng)日期2002年11月21日 優(yōu)先權(quán)日2001年11月21日
發(fā)明者A·盧斯拉, K·帕努索龐, L·王, R·甘希, Y·于 申請(qǐng)人:通用儀器公司