專利名稱:數(shù)字視頻編碼用可變精度圖像間定時(shí)規(guī)定的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及多媒體壓縮系統(tǒng)的領(lǐng)域。具體來說,本發(fā)明公開了一種用于規(guī)定可變精度圖像間(inter-picture)定時(shí)的方法和系統(tǒng)。
背景技術(shù):
基于數(shù)字的電子媒體格式最終在尖端在很大程度上取代模擬電子媒體格式。數(shù)字壓縮磁盤(CD)很早以前就取代了模擬乙烯唱片。模擬盒式磁帶越來越稀少。第二和第三代數(shù)字音頻系統(tǒng),例如MD盤和MP3 (MPEG音頻第三層)正在從壓縮磁盤的第一代數(shù)字音頻格式中分享市場(chǎng)份額。視頻媒體轉(zhuǎn)向數(shù)字存儲(chǔ)和傳輸格式的速度比音頻媒體慢。很大程度上是由于大量的數(shù)字信息需要以數(shù)字形式精確地表達(dá)視頻。需要精確地表達(dá)視頻的大量數(shù)字信息需要非常高容量的數(shù)字存儲(chǔ)系統(tǒng)和高帶寬的傳輸系統(tǒng)。然而,視頻正在迅速地向數(shù)字存儲(chǔ)和傳輸格式轉(zhuǎn)變。更快的計(jì)算機(jī)處理器、高密度存儲(chǔ)系統(tǒng),和新型有效的壓縮和編碼算法最終使數(shù)字視頻適合于消費(fèi)者物價(jià)點(diǎn)。DVD(數(shù)字多功能光盤),即一種數(shù)字視頻系統(tǒng),在幾年間已成為最為暢銷的消費(fèi)者電子產(chǎn)品之一。DVD 以其高視頻質(zhì)量、非常高的音頻質(zhì)量、方便性和額外特征已經(jīng)迅速取代了盒式錄像機(jī)(VCR) 成為預(yù)錄制視頻回放系統(tǒng)的選擇。老式的模擬NTSC(國(guó)家電視標(biāo)準(zhǔn)委員會(huì))視頻傳輸系統(tǒng)正在被數(shù)字ATSC(先進(jìn)電視標(biāo)準(zhǔn)委員會(huì))視頻傳輸系統(tǒng)所取代。計(jì)算機(jī)系統(tǒng)已經(jīng)使用許多年各種不同的數(shù)字編碼格式。計(jì)算機(jī)系統(tǒng)使用的最好的數(shù)字視頻壓縮和編碼系統(tǒng)是眾所周知的縮寫為MPEG的活動(dòng)圖像專家組(Motion Pictures Expert Group)所支持的數(shù)字視頻格式。MPEG的最著名并被最廣泛應(yīng)用的三種數(shù)字媒體格式被簡(jiǎn)稱為MPEG-1,MPEG-2和MPEG-4。視頻CD(VCD)和早期的消費(fèi)者級(jí)數(shù)字視頻編輯系統(tǒng)使用早期的MPEG-I數(shù)字視頻編碼格式。數(shù)字多功能光盤(DVD)和Dish Network牌直播衛(wèi)星(DBS)電視廣播系統(tǒng)使用更高質(zhì)量的MPEG-2數(shù)字視頻壓縮和編碼系統(tǒng)。MPEG-4編碼系統(tǒng)迅速地被最新的基于計(jì)算機(jī)的數(shù)字視頻編碼器改進(jìn)并與數(shù)字視頻播放器相關(guān)聯(lián)。MPEG-2和MPEG-4標(biāo)準(zhǔn)壓縮一系列視頻幀或視頻場(chǎng)并且隨后將壓縮的幀或場(chǎng)編碼為數(shù)字比特流。當(dāng)對(duì)視頻幀或場(chǎng)用MPEG-2和MPEG-4系統(tǒng)進(jìn)行編碼時(shí),視頻幀或場(chǎng)將被分成宏塊的矩形網(wǎng)格。每個(gè)宏塊被獨(dú)立地壓縮或編碼。當(dāng)壓縮視頻幀或場(chǎng)時(shí),該MPEG-4標(biāo)準(zhǔn)可以將幀或場(chǎng)壓縮成三種壓縮的幀或場(chǎng)的一種幀內(nèi)編碼幀(I-幀),單向預(yù)測(cè)幀(P幀),或雙向預(yù)測(cè)幀(B幀)。幀內(nèi)編碼幀在不參照其它視頻幀的情況下完全獨(dú)立地將獨(dú)立視頻幀編碼。P幀參照單一先前顯示的視頻幀限定一個(gè)視頻幀。B幀參照當(dāng)前幀之前顯示的視頻幀和在當(dāng)前幀后顯示的視頻幀限定一個(gè)視頻幀。由于對(duì)冗余視頻信息的有效利用,P幀和B幀通常提供最好的壓縮。
發(fā)明內(nèi)容
用于數(shù)字視頻編碼的可變精度圖像間定時(shí)規(guī)定的方法和裝置被公開。具體來說, 本發(fā)明公開了一種使臨近的視頻圖像的相對(duì)時(shí)間以相當(dāng)有效的方式進(jìn)行編碼的系統(tǒng)。在一個(gè)實(shí)施方式中,確定當(dāng)前視頻圖像和臨近視頻圖像之間的顯示時(shí)間差。該顯示時(shí)間差隨后被編碼為視頻圖像的數(shù)字表示。在一個(gè)優(yōu)選實(shí)施方式中,臨近的視頻圖像是最新傳輸?shù)拇鎯?chǔ)圖像。為有效地進(jìn)行編碼,顯示時(shí)間差可以用可變長(zhǎng)度的編碼系統(tǒng)或算術(shù)編碼進(jìn)行編碼。在一個(gè)可選擇實(shí)施方式中,顯示時(shí)間差被編碼為2的冪來減少傳輸?shù)谋忍氐臄?shù)目。從附圖和以下的詳細(xì)說明中可以使本發(fā)明的其它目的、特征和優(yōu)點(diǎn)顯而易見。
本領(lǐng)域的技術(shù)人員參照以下的詳細(xì)說明將很容易地理解本發(fā)明的目的,特性和優(yōu)
點(diǎn)ο圖1表示一種可能的數(shù)字視頻編碼系統(tǒng)的高級(jí)框圖。圖2表示一系列圖像應(yīng)該播放的順序排列的視頻圖像,其中連接不同圖像的箭頭代表用運(yùn)動(dòng)補(bǔ)償創(chuàng)建的圖像間相關(guān)性。圖3表示以圖像的優(yōu)選傳輸順序排列的圖2中的視頻圖像,其中連接不同圖像的箭頭表示用運(yùn)動(dòng)補(bǔ)償創(chuàng)建的圖像間相關(guān)性。圖4表示一系列視頻圖像,其中視頻圖像間互相參照的距離被選為2的冪。
具體實(shí)施例方式一種多媒體壓縮和編碼系統(tǒng)中用于制定變化精度的圖像間定時(shí)的方法和系統(tǒng)被公開。在以下的描述中,為了說明的目的,所闡述的特定術(shù)語(yǔ)為本發(fā)明提供全面理解。然而, 對(duì)于本領(lǐng)域的技術(shù)人員,實(shí)施本發(fā)明并不需要這些具體細(xì)節(jié)。例如,本發(fā)明是參照MPEG-4 多媒體壓縮和編碼系統(tǒng)來進(jìn)行說明的。然而,相同的技術(shù)可以容易地應(yīng)用在其它類型的壓縮和編碼系統(tǒng)中。多媒體壓縮和編碼綜述圖1表示技術(shù)領(lǐng)域中所熟知的典型的數(shù)字視頻編碼器100的高級(jí)框圖。該數(shù)字視頻編碼器100接收在框圖的左側(cè)的視頻幀105的輸入視頻流。每個(gè)視頻幀被離散余弦變換 (DCT)單元110所處理。該幀可以獨(dú)立地(幀內(nèi))處理或者參照運(yùn)動(dòng)補(bǔ)償單元(幀間)接收來自其它幀的信息來處理。然后,一個(gè)量化器(Q)單元120將來自離散余弦變換單元110 的信息量化。最后,量化的視頻幀用熵編碼器(H)單元180編碼來生成編碼的比特流。該熵編碼器(H)單元180可以用可變長(zhǎng)度編碼(VLC)系統(tǒng)。由于幀間編碼的視頻幀是參照其它臨近視頻幀來限定的,所以數(shù)字視頻編碼器 100需要?jiǎng)?chuàng)建一個(gè)將出現(xiàn)在數(shù)字視頻解碼器中的每個(gè)幀怎樣解碼的復(fù)本,這樣幀間就可以被編碼。因此,數(shù)字視頻編碼器100的下部實(shí)際為一個(gè)數(shù)字視頻解碼器系統(tǒng)。具體來說,一個(gè)反量化(Q_0單元130將視頻幀信息的量化倒置,并且反離散余弦變換(DCT)單元140 將視頻幀信息的離散余弦變換進(jìn)行倒置。在所有DCT系數(shù)從iDCT中重建時(shí),該運(yùn)動(dòng)補(bǔ)償單元將使用信息以及運(yùn)動(dòng)矢量來重建隨后將被用作下一幀運(yùn)動(dòng)評(píng)估的參考幀的編碼幀。該解碼幀可隨后用于對(duì)相對(duì)于解碼視頻幀中的信息限定的幀間(P幀或B幀)進(jìn)行編碼。具體來說,一種運(yùn)動(dòng)補(bǔ)償(MC)單元150和運(yùn)動(dòng)評(píng)估(ME)單元160被用來確定運(yùn)動(dòng)矢量并產(chǎn)生用于編碼幀間的不同數(shù)值。一個(gè)速率控制器190接收來自數(shù)字視頻編碼器100 的不同分量的信息并使用該信息為每個(gè)視頻幀分配比特預(yù)算。該速率控制器190應(yīng)按照以下方式分配比特預(yù)算,使其產(chǎn)生最高質(zhì)量的遵循一系列指定的限制的數(shù)字視頻比特流。具體來說,該速率控制器190在沒有溢出緩沖(通過發(fā)射比能夠存儲(chǔ)的更多的信息來超過解碼器中可訪問的存儲(chǔ)量)或下溢緩沖(發(fā)送視頻幀不夠快因此使解碼器缺少進(jìn)行顯示的視頻幀)的情況下產(chǎn)生最高質(zhì)量的壓縮視頻流。多媒體壓縮與編碼綜述在一些視頻信號(hào)中,連續(xù)視頻圖像(幀或場(chǎng))之間的時(shí)間可以不恒定。(注意本文將用術(shù)語(yǔ)視頻圖像來一般地指視頻幀或視頻場(chǎng))。例如,一些視頻圖像可能由于傳輸帶寬的限制而丟掉。此外,該視頻定時(shí)還可能由于攝像機(jī)的不規(guī)則或特殊效果,如慢動(dòng)作或快動(dòng)作等而改變。在一些視頻流中,原始視頻源可以通過設(shè)計(jì)簡(jiǎn)單地具有非一致圖像間時(shí)間。 例如,由于沒有通過例如視頻攝像系統(tǒng)等統(tǒng)一的視頻捕捉系統(tǒng)來創(chuàng)建非任意視頻定時(shí),所以如計(jì)算機(jī)圖像動(dòng)畫等合成視頻可具有非一致的定時(shí)。靈活的數(shù)字視頻編碼系統(tǒng)應(yīng)能夠處理非一致的定時(shí)。許多數(shù)字視頻編碼系統(tǒng)將視頻圖像分成宏塊的矩形網(wǎng)格。視頻圖像中的每個(gè)個(gè)體宏塊被獨(dú)立地壓縮和編碼。在某些實(shí)施方式中,使用熟知的“像素區(qū)塊”的宏塊中的子塊。 這樣的像素塊可以具有其本身的可內(nèi)插的運(yùn)動(dòng)矢量。即使本發(fā)明的說明被等同地應(yīng)用在宏塊和像素區(qū)塊中,本文將涉及宏塊。某些視頻編碼標(biāo)準(zhǔn),如,ISO MPEG標(biāo)準(zhǔn)或ITU H. 264標(biāo)準(zhǔn),使用不同類型的預(yù)測(cè)宏塊來將視頻圖像編碼。在預(yù)期中,宏塊可以為以下三種類型中的一種。1. I宏塊——一個(gè)內(nèi)(I)宏塊在其編碼中不使用來自任何其它視頻圖像的信息 (完全自定義的);2.P宏塊——一種單向預(yù)測(cè)(P)宏塊是指來自一在前視頻圖像的圖像信息;或3. B宏塊——一種雙向預(yù)測(cè)(B)宏塊使用一在前圖像和一在后視頻圖像的信息。如果視頻圖像中所有的宏塊為內(nèi)宏塊,則視頻圖像為幀內(nèi)編碼幀。如果一個(gè)視頻圖像僅包括單向預(yù)測(cè)宏塊或內(nèi)宏塊,則視頻圖像被已知為P幀。如果視頻圖像包括任何雙向預(yù)測(cè)宏塊,那么視頻圖像已知為B幀。為簡(jiǎn)單起見,本文將考慮所給圖像中的所有宏塊為同一類型的情況。將編碼的視頻圖像的一個(gè)樣本順序可以表示為I1B2B3B4P5B6B7B8B9P10B11P12B13I14...其中字母(I,P或B)代表如果視頻圖像為I幀,P幀,或B幀,且數(shù)字代表以視頻圖像的順序的視頻圖像的攝像順序。該攝像的順序?yàn)閿z像機(jī)記錄視頻圖像的順序,因此也是視頻圖像應(yīng)該被顯示的順序(顯示順序)。視頻圖像的在前樣本系列在圖2中圖解表示。參考圖2,箭頭表示來自存儲(chǔ)圖像的宏塊(在此種情況下I幀或P幀)被用在其它圖像的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)中。
在圖2的情況中,在幀內(nèi)視頻圖像I1的編譯中沒有來自其它圖像的信息。視頻圖像P5是在其編碼過程中使用來自在前視頻圖像I1的視頻信息的P巾貞,因此從視頻圖像I1到視頻圖像P5繪制了一個(gè)箭頭。視頻圖像B2、視頻圖像B3、視頻像B4在其編譯過程中都使用來自視頻圖像I1和視頻圖像P5的信息,因此從視頻圖像I1和視頻圖像P5到視頻圖像 B2、視頻圖像B3和視頻圖像B4繪制了箭頭。如上所述該圖像間時(shí)間通?;ゲ幌嗤?由于B圖像使用來自在后圖像(隨后將被顯示的圖像)的信息時(shí),傳輸順序通常與顯示順序不同。具體來說,構(gòu)建其它圖像所需的視頻圖像應(yīng)首先被傳輸。對(duì)于以上順序, 傳輸順序應(yīng)為I1P5B2B3B4P10B6B7B8B9P12B11I14B13...圖3圖解說明了圖2中的視頻圖像的上述傳輸順序。再次地,圖中的箭頭指示來自存儲(chǔ)的圖像的宏塊(此種情況下為I或P)被用在其它視頻圖像的運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)中。參照?qǐng)D3,該系統(tǒng)首先傳輸并不依賴于任何其它幀的I幀Ip隨后,該系統(tǒng)傳輸依賴于視頻圖像I1的P幀視頻圖像p5。隨后,即使視頻圖像B2將在視頻圖像P5前被顯示,系統(tǒng)仍將在視頻圖像P5后傳輸B幀視頻圖像B2。其原因是,當(dāng)應(yīng)對(duì)B2進(jìn)行解碼時(shí),解碼器將已經(jīng)接收并存儲(chǔ)了將視頻圖像B2進(jìn)行解碼所必須的視頻圖像I1和P5中的信息。類似地, 視頻圖像Ip P5已準(zhǔn)備好來將隨后的視頻圖像B3和視頻圖像B4進(jìn)行解碼。該接收器/解碼器記錄用于正確顯示的視頻圖像順序。在本操作中,I和P圖像通常指存儲(chǔ)的圖像。P幀圖像的編碼過程典型地使用運(yùn)動(dòng)補(bǔ)償,其中在圖像中為每個(gè)宏塊來計(jì)算運(yùn)動(dòng)矢量。使用計(jì)算出的運(yùn)動(dòng)矢量,預(yù)測(cè)宏塊(P宏塊)可以通過轉(zhuǎn)變上述在前圖像中的像素來進(jìn)行。在P幀圖像中的實(shí)際宏塊和預(yù)測(cè)宏塊之間的差別隨后被編碼以進(jìn)行傳輸。每個(gè)運(yùn)動(dòng)矢量也可以通過預(yù)測(cè)編碼來傳輸。例如,一個(gè)運(yùn)動(dòng)矢量預(yù)測(cè)可以用臨近的運(yùn)動(dòng)矢量形成。在此種情況下,在實(shí)際運(yùn)動(dòng)矢量和運(yùn)動(dòng)矢量預(yù)測(cè)之間的差別被編碼以進(jìn)行傳輸。每個(gè)B宏塊使用兩個(gè)運(yùn)動(dòng)矢量第一運(yùn)動(dòng)矢量是指上述在前視頻圖像,第二運(yùn)動(dòng)矢量是指在后視頻圖像。從這兩個(gè)運(yùn)動(dòng)矢量中,計(jì)算兩個(gè)預(yù)測(cè)宏塊。此兩個(gè)預(yù)測(cè)宏塊隨后用某一函數(shù)結(jié)合在一起來形成最終的預(yù)測(cè)宏塊。如上所述,在B幀圖像中的實(shí)際宏塊和最終預(yù)測(cè)宏塊之間的差別隨后被編碼以進(jìn)行傳輸。由于具有P宏塊,B宏塊的每個(gè)運(yùn)動(dòng)矢量(MV)可以通過預(yù)測(cè)編碼來傳輸。具體來說,一個(gè)預(yù)測(cè)運(yùn)動(dòng)矢量用臨近的運(yùn)動(dòng)矢量來形成。隨后,在實(shí)際運(yùn)動(dòng)矢量和預(yù)測(cè)的之間的差別被編碼以進(jìn)行傳輸。然而,由于B宏塊,存在著從最近的存儲(chǔ)圖像宏塊中內(nèi)插運(yùn)動(dòng)矢量的機(jī)會(huì)。在數(shù)字視頻編碼和數(shù)字視頻解碼中都進(jìn)行這樣的內(nèi)插。該運(yùn)動(dòng)矢量在從攝影機(jī)緩慢掃過靜態(tài)背景的視頻順序的視頻圖像中工作得非常好。實(shí)際上,這樣的運(yùn)動(dòng)矢量?jī)?nèi)插足夠好以致可以單獨(dú)使用。具體來說,這意味著對(duì)于這些使用內(nèi)插的編碼的B宏塊運(yùn)動(dòng)矢量無需計(jì)算或傳輸任何差別信息。為進(jìn)一步說明,在上述情況中,我們將圖像i和j之間的圖像間顯示時(shí)間表示為Di, j,即,如果圖像的顯示時(shí)間分別為Ti和Tj,則Dy = Ti-Tj 隨后為Dijk = Dijj^Djjk
Dijk = -Dkji注意Diij在某些情況下可以取負(fù)值。 因此,如果MV5il為參考I1的P5宏塊 的運(yùn)動(dòng)矢量,則對(duì)于B2、B3和B4中對(duì)應(yīng)的宏塊, 參考I1和P5的運(yùn)動(dòng)矢量應(yīng)分別地插入MV2a = MV5, ^D2, !/D5aMV5j2 = MV5^D5VD5JMV3jl = MV5JD3VD5ilMV5j3 = MV5,^D5j3ZD5aMV4a = MV5j ^D4j !/D5aMV5j4 = MV5^D5VD5il注意,由于顯示時(shí)間的比率被用于運(yùn)動(dòng)矢量預(yù)測(cè),所以不需要絕對(duì)顯示時(shí)間。因此,相對(duì)顯示時(shí)間可以用做Di,」顯示時(shí)間值。本情況作為H. 264標(biāo)準(zhǔn)中的實(shí)例被概括。在概括中,一個(gè)P或B圖像可以使用任何先前傳輸?shù)膱D像用于運(yùn)動(dòng)矢量預(yù)測(cè)。因此,在上述情況下,圖像B3可以在其預(yù)測(cè)中使用圖像I1和圖像B2。此外,運(yùn)動(dòng)圖像不僅可被內(nèi)插還可被外推。因此,在此種情況下我們將得到MV3jl = MV2,^D3,!/D2a此種運(yùn)動(dòng)矢量外推(或內(nèi)插)也可以應(yīng)用在預(yù)測(cè)過程中來用于運(yùn)動(dòng)矢量的預(yù)測(cè)編碼過程。在任何情況下,在非一致圖像間時(shí)間的問題是將Di, j的相對(duì)顯示時(shí)間傳輸?shù)浇邮掌魃?,這也是本發(fā)明的主題。在本發(fā)明的一個(gè)實(shí)施方式中,在第一圖像之后對(duì)于每個(gè)圖像, 我們將傳輸當(dāng)前圖像和最新傳輸?shù)拇鎯?chǔ)圖像之間的顯示時(shí)間差。為了錯(cuò)誤恢復(fù),在圖像中應(yīng)將傳輸重復(fù)幾次,例如,在MPEG或H. 264標(biāo)準(zhǔn)的所謂切片頭部(slice header)中。如果所有的切片頭部丟失,那么推測(cè)起來,用于解碼信息的依賴于丟失圖像的其它圖像也不能被解碼。因此,在上述情況中,我們應(yīng)傳輸以下1D2, 503,504,5^10, 5^6,10^7,10^8,10^9,10^12. 10^11,12^14,12^13,14' · ·為了運(yùn)動(dòng)矢量的評(píng)估,用于Dm的精度需要可以在各圖像間改變。例如,如果在兩個(gè)P幀圖像P5和P7之間的中途只有一個(gè)單一 B幀圖像B6,則發(fā)送D7,5 = 2 禾口 D6,7 = -1 就足夠了。其中Dm顯示時(shí)間值為相對(duì)時(shí)間值。如果,作為替換,視頻圖像B6僅在視頻圖像P5 和視頻圖像P7之間距離的1/4處,則將發(fā)送的適當(dāng)?shù)腄y顯示時(shí)間值為D7,5 = 4 禾口 D6,7 =-1注意在以上兩個(gè)例子中,在視頻圖像B6和視頻圖像P7之間的顯示時(shí)間是作為顯示時(shí)間“單位”來使用,并且在視頻圖像P5和視頻圖像P7之間的顯示時(shí)間差為4個(gè)顯示時(shí)間 “單位”??傊?,如果除數(shù)為2的冪則運(yùn)動(dòng)矢量評(píng)估的復(fù)雜性較小。如果如圖4中所圖解的, 兩個(gè)存儲(chǔ)圖像之間的Dm (圖像間時(shí)間)被選為2的冪,則在我們的實(shí)施方式中很容易完成。 可選擇地,該評(píng)估過程可以被定義為將所有除數(shù)取截取或近似為2的冪。
當(dāng)圖像間的時(shí)間為2的冪時(shí),如果只有(2的)整數(shù)次冪被傳輸,而不是圖像間時(shí)間的全數(shù)值被傳輸,數(shù)據(jù)比特的數(shù)目能夠被減少。圖4中圖解說明了圖像間的距離被選為 2的冪的情況。在此種情況下,在視頻圖像P1和視頻圖像P3之間的D3il顯示時(shí)間值2傳輸為1 (因?yàn)?1 = 2),并且在視頻圖像P7和視頻圖像P3之間的D7,3顯示時(shí)間值4可以傳輸為 2(由于 22 = 4)。在某些情況下,可以不使用運(yùn)動(dòng)矢量?jī)?nèi)插。然而,仍然需要將視頻圖像的顯示順序傳輸?shù)浇邮掌?播放器系統(tǒng)中,這樣接收器/播放器將按照適當(dāng)?shù)捻樞蝻@示視頻圖像。在此種情況下,不考慮實(shí)際顯示的時(shí)間,用于Dm的簡(jiǎn)單有符號(hào)整數(shù)就足夠。在某些應(yīng)用中可以只需要符圖像間時(shí)間Diij可以簡(jiǎn)單地作為簡(jiǎn)單有符號(hào)整數(shù)值傳輸。然而,可以使用許多方法來將Dy數(shù)值編碼來完成額外壓縮。例如,一個(gè)可變長(zhǎng)度編碼數(shù)量之前的符號(hào)位相對(duì)容易實(shí)施和提供編碼效率。可以使用的一個(gè)此種可變長(zhǎng)度編碼系統(tǒng)是所熟知的UVLC(通用可變長(zhǎng)度編碼)。 該UVLC可變長(zhǎng)度編碼系統(tǒng)由編碼詞給出1 = 12 = 0103 = 0114 = 001005 = 001016 = 001107 = 001118 = 0001000...用于將圖像間時(shí)間編碼的另一種方法可以用算術(shù)編碼方法。典型地,算術(shù)編碼使用條件可能性來實(shí)現(xiàn)數(shù)據(jù)比特的非常高的壓縮。因此,本發(fā)明介紹了一種將圖像間顯示時(shí)間進(jìn)行編碼和傳輸?shù)暮?jiǎn)單但有效的方法。圖像間的顯示時(shí)間的編碼過程可以通過使用可變長(zhǎng)度編碼或算術(shù)編碼而變得非常有效。此外,所需的精度可以選為符合視頻解碼器的需要,而不再更多。 上述內(nèi)容說明了一種用于在多媒體壓縮和編碼系統(tǒng)中指定各種精度的圖像間時(shí)間的系統(tǒng)。應(yīng)該理解的是本領(lǐng)域的普通技術(shù)人員可以在不背離本發(fā)明范圍的情況下對(duì)本發(fā)明元件的材料和排列進(jìn)行改變和改進(jìn)。
權(quán)利要求
1.一種用于解碼視頻序列中的多個(gè)視頻圖像的方法,所述方法包括在解碼器處,接收包括編碼的第一視頻圖像和編碼的第二視頻圖像的比特流,其中所述編碼的第一視頻圖像包括至少一個(gè)雙向預(yù)測(cè)宏塊,且所述編碼的第二視頻圖像不包括雙向預(yù)測(cè)宏塊,但包括至少一個(gè)參考所述編碼的第一視頻圖像中的宏塊的單向預(yù)測(cè)宏塊;以及通過使用所述第一視頻圖像作為參考來解碼所述第二視頻圖像。
2.如權(quán)利要求1所述的方法,其中解碼所述第二視頻圖像包括 使用與參考所述第一視頻圖像的所述第二視頻圖像相關(guān)的運(yùn)動(dòng)矢量。
3.如權(quán)利要求2所述的方法,其中所述第二視頻圖像的運(yùn)動(dòng)矢量是從所述比特流接收的。
4.如權(quán)利要求2所述的方法,其中所述第二視頻圖像的運(yùn)動(dòng)矢量是由所述解碼器計(jì)算的。
5.如權(quán)利要求4所述的方法,其中基于所述第一視頻圖像的運(yùn)動(dòng)矢量?jī)?nèi)插所述第二視頻圖像的運(yùn)動(dòng)矢量。
6.如權(quán)利要求4所述的方法,其中基于所述第一視頻圖像的運(yùn)動(dòng)矢量外插所述第二視頻圖像的運(yùn)動(dòng)矢量。
7.如權(quán)利要求1所述的方法,其中所述第一視頻圖像是B視頻圖像,且所述第二視頻圖像是P視頻圖像。
8.一種用于解碼視頻序列中的多個(gè)視頻圖像的設(shè)備,所述設(shè)備包括用于接收包括編碼的第一視頻圖像和編碼的第二視頻圖像的比特流的裝置,其中所述編碼的第一視頻圖像包括至少一個(gè)雙向預(yù)測(cè)宏塊,且所述編碼的第二視頻圖像不包括雙向預(yù)測(cè)宏塊,但包括至少一個(gè)參考所述編碼的第一視頻圖像中的宏塊的單向預(yù)測(cè)宏塊;以及用于通過使用所述第一視頻圖像作為參考來解碼所述第二視頻圖像的裝置。
9.如權(quán)利要求8所述的設(shè)備,其中用于解碼所述第二視頻圖像的裝置包括 用于使用與參考所述第一視頻圖像的所述第二視頻圖像相關(guān)的運(yùn)動(dòng)矢量的裝置。
10.如權(quán)利要求9所述的設(shè)備,其中所述第二視頻圖像的運(yùn)動(dòng)矢量是從所述比特流接收的。
11.如權(quán)利要求9所述的設(shè)備,其中用于解碼所述第二視頻圖像的裝置還包括 用于計(jì)算所述第二視頻圖像的運(yùn)動(dòng)矢量的裝置。
12.如權(quán)利要求11所述的設(shè)備,其中基于所述第一視頻圖像的運(yùn)動(dòng)矢量?jī)?nèi)插所述第二視頻圖像的運(yùn)動(dòng)矢量。
13.如權(quán)利要求11所述的設(shè)備,其中基于所述第一視頻圖像的運(yùn)動(dòng)矢量外插所述第二視頻圖像的運(yùn)動(dòng)矢量。
14.如權(quán)利要求8所述的設(shè)備,其中所述第一視頻圖像是B視頻圖像,且所述第二視頻圖像是P視頻圖像。
全文摘要
本發(fā)明公開了一種數(shù)字視頻編碼中用于可變精度圖像間定時(shí)規(guī)定的方法和裝置。具體來說,本發(fā)明提供一種允許臨近視頻圖像的相對(duì)時(shí)間可以按各種有效的方式進(jìn)行編碼的系統(tǒng)。在一個(gè)實(shí)施方式中,確定了當(dāng)前視頻圖像(105)和臨近視頻圖像中的顯示時(shí)間差。顯示時(shí)間差隨后被編碼(180)為視頻圖像的數(shù)字表達(dá)。在一個(gè)優(yōu)選實(shí)施方式中,該臨近視頻圖像為最新傳輸?shù)拇鎯?chǔ)圖像。為有效進(jìn)行編碼,顯示時(shí)間差可以用可變長(zhǎng)度編碼系統(tǒng)或算術(shù)編碼進(jìn)行編碼。在一個(gè)可選擇實(shí)施方式中,該顯示時(shí)間差被作為2的冪來進(jìn)行編碼以減少傳輸比特的數(shù)目。
文檔編號(hào)G06T9/00GK102427535SQ20121000945
公開日2012年4月25日 申請(qǐng)日期2003年7月11日 優(yōu)先權(quán)日2002年7月14日
發(fā)明者A·普里, A·杜米特拉斯, B·G·哈斯克爾, D·W·辛格 申請(qǐng)人:蘋果公司