專利名稱:重新編碼視頻數(shù)據(jù)流的設(shè)備和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及重新編碼視頻數(shù)據(jù)流的設(shè)備和方法。
背景技術(shù):
多媒體應(yīng)用的發(fā)展和數(shù)據(jù)網(wǎng)絡(luò)的多樣性使得數(shù)據(jù)編碼系統(tǒng)更加復(fù)雜。不同種類網(wǎng)絡(luò)的相互連接常需要重新編碼它們輸送的數(shù)據(jù)流,通常,涉及代碼轉(zhuǎn)換。重新編碼可以用不同于來自最初壓縮標(biāo)準(zhǔn)的壓縮標(biāo)準(zhǔn)實(shí)現(xiàn)(例如,根據(jù)MPEG-4AVC標(biāo)準(zhǔn)(“先進(jìn)的視頻編碼”只取首字母的縮寫詞)的重新編碼最初根據(jù)MPEG-2或MPEG-4標(biāo)準(zhǔn)編碼的數(shù)據(jù)流)。
重新編碼主要地用于有相當(dāng)比特率限制的網(wǎng)絡(luò)。因此,此重新編碼系統(tǒng)可能適應(yīng)要求網(wǎng)絡(luò)和限制網(wǎng)絡(luò)的輸入流的比特率。
由調(diào)節(jié)作用于圖像塊的DCT系數(shù)(DCT是“離散余弦變換”取首字母的縮寫詞)的量化步長(zhǎng)的環(huán)的方式,承擔(dān)調(diào)節(jié)用于MPEG型視頻編碼器或代碼轉(zhuǎn)換器的比特率。此調(diào)節(jié)的質(zhì)量和穩(wěn)定性很大的依賴于對(duì)下一組圖像預(yù)測(cè)要編碼的圖像的復(fù)雜性的質(zhì)量。
在源圖像的前后關(guān)系中,已研發(fā)許多的雙路編碼技術(shù),第一編碼通路提供精確的要編碼圖像的復(fù)雜性的知識(shí),然后第二編碼通路編碼圖像作為此復(fù)雜性的函數(shù)。
此雙路編碼技術(shù)是非常有效的,但代碼轉(zhuǎn)換系統(tǒng)是昂貴的。
發(fā)明內(nèi)容
因此,本發(fā)明的目的是提供一種基于估算要重新編碼的圖像的代碼轉(zhuǎn)換前和后的復(fù)雜性,重新編碼圖像序列的設(shè)備。
因此,本發(fā)明根據(jù)給定的視頻流的預(yù)置比特率,提供一種重新編碼的設(shè)備,包括根據(jù)至少一個(gè)模式編碼開始編碼圖像序列的,包括
裝置,用于提取關(guān)聯(lián)圖像重新編碼的信息,所述信息表示至少每個(gè)圖像重新編碼的復(fù)雜性(Xrecod);裝置,用于提取信息,所提取的信息是關(guān)聯(lián)圖像的最初編碼的編碼復(fù)雜性的信息(Xinit);設(shè)備包括裝置,用于計(jì)算根據(jù)所述模式以前重新編碼圖像的重新編碼的復(fù)雜性(Xrecod)與這些圖像的最初編碼的復(fù)雜性(Xinit)的比率(Ratiox),稱為復(fù)雜性比率;裝置,用于更新所述模式的平均復(fù)雜性比率(SmoothedRatiox[mode])作為復(fù)雜性比率(Ratiox)的函數(shù);裝置,由估算要重新編碼的每個(gè)圖像的復(fù)雜性(Xpred)為圖像的最初編碼的復(fù)雜性(Xinit)乘以模式的平均復(fù)雜性比率(SmoothedRatiox[mode])的積,根據(jù)模式重新編碼每個(gè)圖像。
與編碼前后關(guān)系中眾所周知的概念相反,發(fā)明人認(rèn)識(shí)到在圖像的代碼轉(zhuǎn)換前后關(guān)系中圖像的復(fù)雜性不是常數(shù)—在一個(gè)和同樣的壓縮標(biāo)準(zhǔn)中的代碼轉(zhuǎn)換的情況中,復(fù)雜性依賴于作用于圖像的量化步長(zhǎng)大小,因此依賴于圖像序列的編碼比特率。
—在有壓縮標(biāo)準(zhǔn)改變的代碼轉(zhuǎn)換的情況中,復(fù)雜性依賴于每個(gè)壓縮算法本身的特性和以前的參數(shù)。
另一方面,在代碼轉(zhuǎn)換的兩種情況中,最初的和重新編碼的圖像的復(fù)雜性的比率是相對(duì)穩(wěn)定的。
在重新編碼前提取測(cè)量使得可能最小化獲得足夠編碼質(zhì)量要求的信息,在重新編碼后提取測(cè)量使得可能獲得比特率調(diào)節(jié)環(huán)好的運(yùn)行,同時(shí)保證了預(yù)測(cè)重新編碼的圖像的復(fù)雜性的質(zhì)量。
從編碼和從重新編碼引起的信息使得可能查明圖像的復(fù)雜性,因此,可以為將來要編碼的圖像定義新的重新編碼參數(shù)。
在此方式中,相對(duì)于使用雙路編碼器的設(shè)備,本發(fā)明可降低成本。
根據(jù)優(yōu)選的實(shí)施例,設(shè)備包括,對(duì)定義為參考周期的幾個(gè)連續(xù)圖像,裝置,用于存儲(chǔ)與最初編碼關(guān)聯(lián)的信息,所述信息是參考周期的圖像的最初編碼的復(fù)雜性(GlobalXinit),
參考周期的圖像的最初編碼的不可壓縮開銷(GlobalOverheadinit)。
對(duì)要編碼的當(dāng)前圖像,根據(jù)優(yōu)選的實(shí)施例,設(shè)備存儲(chǔ)一定數(shù)目的要重新編碼的并屬于確定的參考周期的輸入圖像的復(fù)雜性,并使用前面一定數(shù)目的重新編碼的圖像的重新編碼的復(fù)雜性,確定作用于當(dāng)前要重新編碼的圖像的量化步長(zhǎng)。
根據(jù)優(yōu)選的實(shí)施例,重新編碼每個(gè)圖像的裝置依賴于關(guān)聯(lián)屬于參考周期的圖像的最初編碼的信息。
因此,重新編碼基于從幾個(gè)以前重新編碼的圖像產(chǎn)生的編碼和重新編碼的信息,獲得暫時(shí)的穩(wěn)定性是可能的。
本發(fā)明也涉及根據(jù)給定的預(yù)置視頻流的比特率重新編碼圖像的方法,其中,根據(jù)至少一個(gè)模式編碼最初圖像序列,包括步驟提取關(guān)聯(lián)重新編碼某些圖像的信息,信息表示至少每個(gè)圖像的重新編碼的復(fù)雜性(Xrecod);提取信息,所提取的信息是關(guān)聯(lián)某些圖像的最初編碼的編碼復(fù)雜性的信息(Xinit);方法包括步驟計(jì)算根據(jù)所述模式以前重新編碼圖像的重新編碼的復(fù)雜性(Xrecod)與這些圖像的最初編碼的復(fù)雜性(Xinit)的比率Ratiox,稱為復(fù)雜性比率;更新模式的平均復(fù)雜性比率(SmoothedRatiox[mode])作為復(fù)雜性比率(Ratiox)的函數(shù);—由估算要重新編碼的每個(gè)圖像的復(fù)雜性(Xpred)為圖像的最初編碼的復(fù)雜性(Xinit)乘以模式的平均復(fù)雜性比率(SmoothedRatiox[mode])的積,根據(jù)模式所述重新編碼每個(gè)圖像。
參考附圖從下面的實(shí)施例的詳細(xì)描述中,不限于此例子,本發(fā)明的優(yōu)點(diǎn)和其它特點(diǎn)會(huì)更明晰。
圖1表示包括本發(fā)明設(shè)備的系統(tǒng)的實(shí)施例;圖2表示本發(fā)明設(shè)備的實(shí)施例。
具體實(shí)施例方式
在圖1中描述表示編碼視頻圖像序列的設(shè)備1和重新編碼同樣序列的設(shè)備2的系統(tǒng)。
編碼設(shè)備1是一通路型的編碼器。
編碼設(shè)備1傳送數(shù)據(jù)流,特別是音頻/視頻流到重新編碼設(shè)備2。在給定的實(shí)施例中,編碼1和重新編碼2,兩個(gè)設(shè)備由通信網(wǎng)絡(luò)的方式互相連接,因此遠(yuǎn)離,但在另一實(shí)施例中可以本地的互相連接。
重新編碼設(shè)備2也接收與輸入視頻流的每個(gè)圖像關(guān)聯(lián)的復(fù)雜性,Xini,和不可壓縮的開銷,Overheadini,表示由在視頻流中的編碼設(shè)備1執(zhí)行的最初編碼各自的復(fù)雜性和不可壓縮的開銷。
重新編碼設(shè)備2也使用由重新編碼輸出流引起的重新編碼信息。此重新編碼信息是重新編碼的復(fù)雜性,Xrecod,和重新編碼的不可壓縮的開銷,Overheadinit。
圖2表示根據(jù)本發(fā)明的重新編碼設(shè)備的實(shí)施例框圖。
設(shè)備包括連接到重新編碼環(huán)4和先期測(cè)量裝備9的解碼器3。解碼器3和先期測(cè)量裝備9接收由如在圖1中表示的編碼設(shè)備1發(fā)送的二進(jìn)制流為輸入。二進(jìn)制流由表示編碼的圖像的序列組成。圖像可以根據(jù)各種模式編碼,例如根據(jù)MPEG-2,MPEG-4ASP標(biāo)準(zhǔn)(“Advanced Simple Profile”只取首字母的縮寫詞)或MPEG-4AVC標(biāo)準(zhǔn)(“Advanced Video Coding”只取首字母的縮寫詞)。在下文詳細(xì)描述的優(yōu)選實(shí)施例中,圖像可以根據(jù)三種模式編碼,內(nèi)部,雙向的或根據(jù)MPEG-2標(biāo)準(zhǔn)預(yù)側(cè)的。
解碼器3輸出進(jìn)入重新編碼環(huán)4的視頻流。
重新編碼環(huán)4基于解碼器3產(chǎn)生的視頻流和由重新量化裝備6提供的量化值Qrecod產(chǎn)生重新編碼的二進(jìn)制流。
重新編碼環(huán)4連接到后測(cè)量裝備5。此裝備負(fù)責(zé)測(cè)量由重新編碼環(huán)4輸出的流的復(fù)雜性Xrecod,和不可壓縮的開銷,Overheadrecod。
先期測(cè)量裝備9接收順序或別的方式組織的圖像。
先期測(cè)量裝備9提取每個(gè)圖像的可壓縮開銷,Enccostinit。
先期測(cè)量裝備9提取每個(gè)圖像的復(fù)雜性,Xinit。復(fù)雜性表示為壓縮開銷,Enccostinit乘以量化步長(zhǎng),Qinit的積。
在給定為例子的實(shí)施例中,在視頻流中傳送復(fù)雜性,復(fù)雜性與每個(gè)圖像關(guān)聯(lián)。
在不同的實(shí)施例中,每個(gè)圖像的復(fù)雜性不隨流傳送,先期測(cè)量裝備9計(jì)算其為二進(jìn)制流的函數(shù)。
先期測(cè)量裝備9也提取每個(gè)圖像的不可壓縮的開銷,也涉及為語法開銷,Overheadinit。
在給出為例子的實(shí)施例中,在視頻流中傳送不可壓縮的開銷,不可壓縮的開銷、Overheadinit與每個(gè)圖像關(guān)聯(lián)。
在不同的實(shí)施例中,每個(gè)圖像的最初編碼的不可壓縮的開銷不隨流傳送,先期測(cè)量裝備計(jì)算它為二進(jìn)制流的函數(shù)。
因此,應(yīng)當(dāng)理解,提取最初編碼的復(fù)雜性或不可壓縮的開銷意思是恢復(fù)二進(jìn)制流或基于二進(jìn)制流恢復(fù)復(fù)雜性的計(jì)算。
當(dāng)先期測(cè)量裝備9接收形成參考周期的一定數(shù)量圖像時(shí),因此獲得整個(gè)時(shí)間上更好的穩(wěn)定性,對(duì)每個(gè)參考周期,計(jì)算它的復(fù)雜性,GlobalXinit,和它的不可壓縮開銷,GlobalOverheadinit。一旦接收到所有的圖像時(shí),開始重新編碼序列的每個(gè)圖像。
編碼開銷一方面由可壓縮開銷和另一方面由語法造成的不可壓縮開銷和矢量的開銷組成。
在MPEG-2或MPEG-4ASP編碼的情況中,可壓縮開銷主要是離散余弦變換DCT的系數(shù)。在MPEG-4AVC編碼的情況中,可壓縮開銷是近似DCT變換的整個(gè)變換。
先期測(cè)量裝備9提供每個(gè)輸入編碼圖像的最初復(fù)雜性,Xinit,和最初不可壓縮開銷,Overheadinit到預(yù)測(cè)裝備8。
后測(cè)量裝備5為每個(gè)圖像從重新編碼的輸出流中恢復(fù)—不可壓縮開銷Overheadinit,—量化步長(zhǎng)大小Qrecod。
計(jì)算每個(gè)圖像的重新編碼的復(fù)雜性(Xrecod),這是可壓縮開銷乘以量化步長(zhǎng)大小的積。
在優(yōu)選的實(shí)施例中,使用的編碼是DCT型,這是代替“離散余弦變換”取首字母的縮寫。在此優(yōu)選的模式中,可壓縮開銷相應(yīng)于根據(jù)可變長(zhǎng)代碼(VLC)編碼的離散余弦變換(DCT)的系數(shù)。
模塊5輸出不可壓縮開銷Overheadinit和量化步長(zhǎng)大小Qrecod到模塊7和8。
預(yù)測(cè)裝備8為每個(gè)圖像計(jì)算編碼圖像的最初不可壓縮開銷與重新編碼的圖像的不可壓縮開銷的比率(Ratiooverhead)和編碼圖像的最初復(fù)雜性與重新編碼圖像的復(fù)雜性的比率(Ratiox)。
因此存儲(chǔ)計(jì)算的比率。
Ratiooverhead=OverheadrecodOverheadinit]]>Ratiox=XrecodXinit]]>模塊8基于存儲(chǔ)的最新的比率更新平均的復(fù)雜性比率,SmoothedRatiox,平均不可壓縮開銷比率,SmoothedRatiooverhead。在不同于參考周期的周期上估算使用的比率Ratiox和Ratiooverhead。特別是,在接收要重新編碼的視頻序列時(shí),重新編碼值Overheadrecod和Xrecod是不知道的,因?yàn)檫@些是重新編碼設(shè)備正要計(jì)算的重新編碼值。因此用于計(jì)算不可壓縮開銷與復(fù)雜性的平均比率的比率是基于以前計(jì)算的值和重新編碼前后更新的值。
對(duì)每個(gè)編碼模式計(jì)算這兩個(gè)因子。因此,估算根據(jù)模式要重新編碼的每個(gè)圖像作為根據(jù)同樣編碼模式以前重新編碼圖像的函數(shù)。
預(yù)測(cè)裝備8,對(duì)當(dāng)前圖像和它存在的參考周期,由計(jì)算重新編碼的復(fù)雜性,Xpred的估計(jì)和重新編碼的不可壓縮開銷Overheadpred的估計(jì),計(jì)算要重新編碼的圖像的開銷的估計(jì)。
Overheadpred=SmoothedRatiooverhead[mode]×OverheadinitXpred=SmoothedRatiox[mode]×Xinit模塊8也計(jì)算當(dāng)前圖像存在的參考周期的不可壓縮開銷(GlobalOverheadpred)和重新編碼的復(fù)雜性(GlobalXpred)。
GlobalOverheadpred=ΣmodeSmoothedRatiooverhead[mode]×GlobalOverheadinit[mode]]]>GlobalXpred=ΣmodeSmoothedRatiox[mode]×GlobalXinit[mode]]]>因此,基于這些測(cè)量,此裝備能在圖像參考周期提供要重新編碼的圖像的相對(duì)權(quán)重的估計(jì)。
圖像水平調(diào)節(jié)裝備7計(jì)算圖像預(yù)置可壓縮開銷(Targetcost)作為由外部管理模塊(沒有示出)提供的預(yù)置比特率的函數(shù),使得用戶能控制重新編碼、圖像的預(yù)測(cè)和全局復(fù)雜性。
Targetcost=XpredGlobalXpred×GlobalTargetcost]]>和GlobalTargetcost=[Drecodframe_rate×Nbimages]-GlobalOverheadpred]]>這里—Drecod是重新編碼預(yù)置比特率,以bit/s表示。
—Nbimages是在參考周期中的圖像數(shù)。
—frame_rate是每秒的圖像數(shù)。
在不同的壓縮標(biāo)準(zhǔn)的代碼轉(zhuǎn)換的情況中,以前計(jì)算的圖像預(yù)置比特率(Targetcost)使得量化裝備6能基于下面的公式,計(jì)算作用到要重新編碼的圖像的平均量化步長(zhǎng)QrecodXpred=Targetcost×Qrecod在一個(gè)和同樣的壓縮標(biāo)準(zhǔn)中的代碼轉(zhuǎn)換的情況中,圖像預(yù)置比特率使得可能降低壓縮增益,可適用于計(jì)算作用于要重新編碼的圖像的每個(gè)宏數(shù)據(jù)塊的重新編碼量化步長(zhǎng)大小Qrecod。圖像水平調(diào)節(jié)裝備7根據(jù)下面的公式,從那里降低在圖像上要獲得的壓縮增益(GainC)GainC=Enccostinit-TargetcostEnccostinit]]>圖像水平調(diào)節(jié)裝備7傳送增益,GainC到重新量化裝備6。
基于增益,GainC,重新量化裝備6基于下面的公式,計(jì)算要作用到要重新編碼的圖像(全局或每個(gè)宏數(shù)據(jù)塊)上的量化步長(zhǎng)QrecodXpred=Targetcost×QrecodXinit=Enccostinit×QinitXpred=Xinit×SmoothedRatiox[mode]這里Qrecod=SmoothedRatiox[mode]1-GainC×Qinit]]>因此,重新編碼環(huán)使用新的重新編碼量化步長(zhǎng)Qrecod,以便重新編碼進(jìn)入重新編碼環(huán)的新的輸入圖像。
1.下面給出的例子描述了在MPEG-2到MPEG-4型的代碼轉(zhuǎn)換器中的特殊的實(shí)施例。
參考周期的長(zhǎng)度是稱為圖像組(GOP)的長(zhǎng)度,是“Group Of Picture”首字母的縮寫詞。
各種編碼模式是內(nèi)部(I)、雙向(B)或預(yù)測(cè)(P)模式。
在MPEG-2型的編碼情況中,顆粒度有時(shí)比圖像型的顆粒度細(xì),可位于宏數(shù)據(jù)塊水平。在此情況中,圖像的每個(gè)宏數(shù)據(jù)塊用它自己的量化步長(zhǎng)編碼。
因此,先期測(cè)量裝備9為每個(gè)圖像的宏數(shù)據(jù)塊提取—最初的可壓縮開銷和最初的不可壓縮開銷,—量化步長(zhǎng)大小,下一步為每個(gè)宏數(shù)據(jù)塊計(jì)算宏數(shù)據(jù)塊復(fù)雜性,它是可壓縮開銷乘以量化步長(zhǎng)的積。
下一步為各圖像計(jì)算—最初的可壓縮開銷,Enccostinit,—最初的不可壓縮開銷,Overheadinit,—最初的圖像復(fù)雜性,Xinit,通過分別加上可壓縮開銷、不可壓縮開銷和宏數(shù)據(jù)塊的最初復(fù)雜性形成該圖像。
下一步,測(cè)量裝備計(jì)算每個(gè)圖像組(GOP)
—I圖像的最初的可壓縮開銷的總計(jì),—B圖像的最初的可壓縮開銷的總計(jì),—P圖像的最初的可壓縮開銷的總計(jì),—I圖像的最初的不可壓縮開銷的總計(jì),IGOPOverheadinit,—B圖像的最初的不可壓縮開銷的總計(jì),BGOPOverheadinit,—P圖像的最初的不可壓縮開銷的總計(jì),PGOPOverheadinit,—I圖像的最初的復(fù)雜性的總計(jì),IGOPXinit,—B圖像的最初的復(fù)雜性的總計(jì),BGOPXinitt,—P圖像的最初的復(fù)雜性的總計(jì),PGOPXinitt,—GOP的最初的總開銷,GOPcost。
先期測(cè)量裝備5為重新編碼圖像的每個(gè)宏數(shù)據(jù)塊計(jì)算—可壓縮開銷,—量化步長(zhǎng)大小,—宏數(shù)據(jù)塊復(fù)雜性,為可壓縮開銷乘以量化步長(zhǎng)大小的積。
模塊8計(jì)算重新編碼環(huán)4的輸出比特率MeanBpprecod的比率與輸入比特率MeanBppinit的比率之比。
基于由管理裝備提供的預(yù)置比特率計(jì)算輸出比特率,MeanBpprecodMeanBpprecod=Drecodframe_rate×nbimages]]>其中—Drecod是重新編碼預(yù)置比特率,以bit/s表示。
—Nbimages是在參考周期中的圖像數(shù)。
—frame_rate是每秒的圖像數(shù)。
MeanBpprecod=GOPcostNbimages_GOP]]>其中—GOPcost表示GOP的總開銷(可壓縮開銷和不可壓縮開銷)—Nbimages_GOP表示在GOP中的圖像數(shù)。
模塊8估算要重新編碼的每個(gè)圖像,和要重新編碼的圖像屬于的當(dāng)前GOP的復(fù)雜性和不可壓縮開銷。
如在一般實(shí)施例中前面指出的,預(yù)測(cè)裝備8對(duì)每個(gè)圖像計(jì)算編碼的圖像的最初的不可壓縮開銷與重新編碼的圖像的不可壓縮開銷的比率(Ratiooverhead),并計(jì)算編碼的圖像的最初的復(fù)雜性與重新編碼的圖像的復(fù)雜性的比率(Ratiox)。
為了避免必須考慮前面的比率之一突然中斷,其可能存在于外部可接受的限制,例如這可能由不良的測(cè)量或由表示點(diǎn)特征的圖像引起的,根據(jù)下面的公式限制比率RedFactoroverhead=Ratiooverhead∈[MINRatiooverhead,1]RedFactorx=Ratiox∈[MINRatiox,1]其中MINRatiooverhead=(1-Weightoverhead[mode])+Weightoverhead[mode]×ratiorateMINRatiox=(1-Weightx[mode])+Weightx[mode]×ratiorate其中Weightoverhead[mode]和Weightx[mode]是常數(shù)。
選擇的最大限制是“1”,因?yàn)橹匦戮幋a不引起增加的復(fù)雜性。
復(fù)雜性和編碼開銷比率依賴于進(jìn)入重新編碼環(huán)的比特率的比率和離開重新編碼環(huán)的比特率的比率,也不同的依賴于編碼模式。
模塊8對(duì)各編碼模式計(jì)算平均的不可壓縮開銷的比率和平均的復(fù)雜性比率對(duì)在內(nèi)部(I)模式中編碼的圖像SmoothedRatiooverhead=RedFactoroverheadSmoothedRatiox=RedFactorx對(duì)在雙向的(B)或預(yù)測(cè)(P)模式中編碼的圖像SmoothedRatiooverhead=2×SmoothedRatiooverhead+RedFactoroverhead3]]>SmoothedRatiox=2×SmoothedRatiox+RedFactorx3]]>這兩個(gè)比率分別初始化為下面的值(1-Weightoverhead[mode])+Weightoverhead[mode]×ratiorate
(1-Weightx[mode])+Weightx[mode]×ratiorate模塊8下一步估算如在一般例子的實(shí)施例中指出的要重新編碼的當(dāng)前圖像的復(fù)雜性,Xpred,和不可壓縮的重新編碼開銷,Overheadpred。
下一步,根據(jù)下面的公式估算當(dāng)前GOP的復(fù)雜性,GOPpred,和不可壓縮開銷,GOPOverheadpredGOPOverheadpred=SmoothedRatiooverhead[I]×IGOPOverheadinit+SmoothedRatiooverhead[B]×BGOPOverheadinit+SmoothedRatiooverhead[P]×PGOPOverheadinitGOPXpred=ZI×SmoothedRatiox[I]×IGOPXinit+ZP×SmoothedRatiox[P]×PGOPXinit+ZB×SmoothedRatiox[B]×BGOPXinit權(quán)重常數(shù)ZI,ZB,ZP是服從下面規(guī)則的常數(shù)ZI×QI=ZP×QP=ZB×QP這些常數(shù)表明為了得到編碼質(zhì)量的常數(shù)表達(dá),I,B和P圖像應(yīng)該不同的量化,更嚴(yán)格地量化B圖像。
調(diào)節(jié)裝備7計(jì)算圖像預(yù)置開銷作為根據(jù)下面的公式估算的復(fù)雜性的函數(shù)。
Targetcost=Z[mode]GoPXpred×Xpred×GOPTargetcost]]>和GOPTargetcost=[MeanBPPrecord×Nbimages]-GOPOverheadpred也根據(jù)下面的公式計(jì)算在要重新編碼的圖像上獲得的為百分比的增益,GainCGainC=Enccostinit-TargetcostEnccostinit]]>此增益?zhèn)魉偷礁鶕?jù)下面的公式計(jì)算重新編碼量化步長(zhǎng)Qrecod的量化裝備6
Qrecod=SmoothedRatiox[mode]1-GainC×Qinit]]>2.下面給出的例子描述在MPEG-2到MPEG-4AVC型的代碼轉(zhuǎn)換器中的特殊的實(shí)施例。
各種編碼模式仍是,內(nèi)部(I),雙向的(B)或預(yù)測(cè)(P)模式。
先期測(cè)量裝備9對(duì)圖像的每個(gè)宏數(shù)據(jù)塊提取如在前面的例子中的—最初的可壓縮開銷和最初的不可壓縮開銷,—量化步長(zhǎng)大小,下一步計(jì)算每個(gè)宏數(shù)據(jù)塊的宏數(shù)據(jù)塊復(fù)雜性,為可壓縮開銷乘以量化步長(zhǎng)的積。
對(duì)每個(gè)圖像計(jì)算—最初的可壓縮開銷,Enccostinit,—最初的不可壓縮開銷,Overheadinit,—最初的圖像復(fù)雜性,Xinit,通過分別加上可壓縮開銷、不可壓縮開銷和宏數(shù)據(jù)塊的最初的復(fù)雜性形成該圖像。
測(cè)量裝備下一步計(jì)算每個(gè)圖像組(GOP)—I圖像的最初的可壓縮開銷的總計(jì),—B圖像的最初的可壓縮開銷的總計(jì),—P圖像的最初的可壓縮開銷的總計(jì),—I圖像的最初的不可壓縮開銷的總計(jì),IGOPOverheadinit,—B圖像的最初的不可壓縮開銷的總計(jì),BGOPOverheadinit,—P圖像的最初的不可壓縮開銷的總計(jì),PGOPOverheadinit,—I圖像的最初的復(fù)雜性的總計(jì),IGOPXinit,—B圖像的最初的復(fù)雜性的總計(jì),BGOPXinitt,—P圖像的最初的復(fù)雜性的總計(jì),PGOPXinitt,—GOP,GOPcost的最初的總開銷。
先期測(cè)量裝備5對(duì)重新編碼的圖像的每個(gè)宏數(shù)據(jù)塊計(jì)算—可壓縮開銷,
—量化步長(zhǎng),—宏數(shù)據(jù)塊復(fù)雜性,為可壓縮開銷乘以量化步長(zhǎng)的積。
模塊8計(jì)算重新編碼環(huán)4的輸出比特率MeanBpprecod的比率與輸入比特率MeanBppinit的比率之比。
基于由管理裝備提供的預(yù)置比特率計(jì)算輸出比特率,MeanBpprecodMeanBpprecod=Drecodframe_rate×nbimages]]>其中—Drecod是重新編碼預(yù)置比特率,以bit/s表示。
—Nbimages是在參考周期中的圖像數(shù)。
—frame_rate是每秒的圖像數(shù)。
MeanBpprecod=GOPcostNbimages_GOP]]>其中—GOPcost表示GOP的總開銷(可壓縮開銷和不可壓縮開銷)—NbimagesGOP表示在GOP中的圖像數(shù)。
模塊8估算要重新編碼的每個(gè)圖像,和要重新編碼的圖像屬于的當(dāng)前GOP的復(fù)雜性和不可壓縮開銷。
如在一般實(shí)施例中前面指出的一樣,預(yù)測(cè)裝備8對(duì)每個(gè)圖像計(jì)算編碼圖像的最初的不可壓縮開銷與重新編碼的圖像的不可壓縮開銷的比率(Ratiooverhead),并計(jì)算編碼的圖像的最初的復(fù)雜性與重新編碼的圖像的復(fù)雜性的比率(Ratiox)。
為了避免必須考慮前面的比率之一突然中斷,其可能存在于外部可接受的限制,例如可能由不良的測(cè)量或由表示點(diǎn)特征的圖像引起的,根據(jù)下面的公式限制比率RedFactoroverhead=Ratiooverhead∈[MINRatiooverhead,1]RedFactorx=Ratiox∈[MINRatiox,1]其中MINRatiooverhead=(1-Weightoverhead[mode])+Weightoverhead[mode]×ratiorate
MINRatiox=(1-Weightx[mode])+Weightx[mode]×ratiorate其中Weightoverhead[mode]和Weightx[mode]是常數(shù)。
復(fù)雜性和編碼開銷比率依賴于進(jìn)入重新編碼環(huán)的比特率的比率和離開重新編碼環(huán)的比特率的比率,也不同的依賴于編碼模式。
模塊8對(duì)各編碼模式計(jì)算平均的不可壓縮開銷的比率和平均的復(fù)雜性比率對(duì)在內(nèi)部(I)模式中編碼的圖像SmoothedRatiooverhead=RedFactoroverheadSmoothedRatiox=RedFactorx對(duì)在雙向的(B)或預(yù)測(cè)(P)模式中編碼的圖像SmoothedRatiooverhead=2×SmoothedRatiooverhead+RedFactoroverhead3]]>SmoothedRatiox=2×SmoothedRatiox+RedFactorx3]]>這兩個(gè)比率分別初始化為下面的值(1-Weightoverhead[mode])+Weightoverhead[mode]×ratiorate(1-Weightx[mode])+Weightx[mode]×ratiorate如在一般例子的實(shí)施例中指出的,下一步,模塊8估算要重新編碼的當(dāng)前圖像的復(fù)雜性,Xpred和不可壓縮的重新編碼的開銷,Overheadpred。
下一步,根據(jù)下面的公式估算當(dāng)前GOP的復(fù)雜性,GOPXpred,和不可壓縮開銷,GOPOverheadpredGOPOverheadpred=SmoothedRatiooverhead[I]×IGOPOverheadinit+SmoothedRatiooverhead[B]×BGOPOverheadinit+SmoothedRatiooverhead[P]×PGOPOverheadinitGOPXpred=ZI×SmoothedRatiox[I]×IGOPXinit+ZP×SmoothedRatiox[P]×PGOPXinit+ZB×SmoothedRatiox[B]×BGOPXinit權(quán)重常數(shù)ZI,ZB,ZP是服從下面規(guī)則的常數(shù)
ZI×QI=ZP×QP=ZB×QP這些常數(shù)表明,為了得到編碼質(zhì)量的常數(shù)表達(dá),I,B和P圖像應(yīng)該不同的量化,更嚴(yán)格地量化B圖像。
調(diào)節(jié)裝備7計(jì)算圖像預(yù)置開銷作為根據(jù)下面的公式估算的復(fù)雜性的函數(shù)Targetcost=Z[mode]GoPXpred×Xpred×GOPTargetcost]]>和GOPTargetcost=[MeanBPPrecord×Nbimages]-GOPOverheadpred此圖像預(yù)置開銷傳送到量化模塊6。作為此預(yù)置開銷的函數(shù),模塊6量化要重新編碼的圖像。
權(quán)利要求
1.一種根據(jù)視頻流的給定預(yù)置比特率的重新編碼圖像的設(shè)備,其中,根據(jù)至少一個(gè)模式編碼最初圖像序列,包括裝置,用于提取關(guān)聯(lián)圖像的重新編碼的信息,信息表示至少每個(gè)圖像的重新編碼的復(fù)雜性(Xrecod);裝置,用于提取信息,所述提取的信息是關(guān)聯(lián)圖像的最初編碼的編碼復(fù)雜性的信息(Xinit);其特征在于包括裝置,根據(jù)所述模式,計(jì)算以前重新編碼圖像的重新編碼的復(fù)雜性(Xrecod)與這些圖像的最初編碼的復(fù)雜性(Xinit)的比率(Ratiox),稱為復(fù)雜性比率;裝置,用于更新模式的平均復(fù)雜性比率(SmoothedRatiox[mode])作為復(fù)雜性比率(Ratiox)的函數(shù);裝置,由估算要編碼的每個(gè)圖像的復(fù)雜性(Xpred)作為圖像的最初編碼的復(fù)雜性(Xinit)乘以模式的平均復(fù)雜性比率(SmoothedRatiox[mode])的積,根據(jù)所述模式重新編碼每個(gè)圖像。
2.根據(jù)權(quán)利要求1所述的重新編碼設(shè)備,其特征在于包括裝置,用于提取每個(gè)圖像最初編碼的不可壓縮開銷(Overheadinit);裝置,用于提取每個(gè)重新編碼圖像的重新編碼的不可壓縮開銷(Overheadrecod);裝置,根據(jù)所述模式,計(jì)算以前重新編碼的圖像的重新編碼不可壓縮開銷(Overheadrecod)與這些圖像的最初編碼的不可壓縮開銷(Overheadinit)的比率(Ratiooverhead),稱為不可壓縮開銷比率;裝置,更新模式的平均不可壓縮開銷比率(SmoothedRatiooverhead[mode])作為不可壓縮開銷比率(Ratiooverhead)的函數(shù);裝置,估算要重新編碼的每個(gè)圖像的不可壓縮開銷(Overheadpred)作為圖像的最初的編碼不可壓縮開銷(Overheadinit)乘以各模式的平均不可壓縮開銷(SmoothedRatiooverhead)的積,根據(jù)模式重新編碼每個(gè)圖像。
3.根據(jù)權(quán)利要求1或2所述的重新編碼設(shè)備,其特征在于包括裝置,對(duì)定義為參考周期的幾個(gè)連續(xù)圖像,存儲(chǔ)與最初編碼關(guān)聯(lián)的信息,所述信息是參考周期圖像的最初編碼的復(fù)雜性(GlobalXinit);參考周期圖像的最初編碼的不可壓縮開銷(GlobalOverheadinit)。
4.根據(jù)權(quán)利要求3所述的重新編碼設(shè)備,其特征在于重新編碼每個(gè)圖像的裝置依賴于關(guān)聯(lián)屬于參考周期圖像的最初編碼的信息。
5.根據(jù)權(quán)利要求3或4所述的重新編碼設(shè)備,其特征在于包括裝置,用于估算每個(gè)參考周期的總不可壓縮重新編碼開銷(GlobalOverheadpred)。
6.根據(jù)權(quán)利要求3到5之一所述的重新編碼設(shè)備,其特征在于包括裝置,用于估算每個(gè)參考周期的重新編碼的總復(fù)雜性(GlobalXpred)。
7.根據(jù)權(quán)利要求6所述的重新編碼設(shè)備,其特征在于包括裝置,用于計(jì)算每個(gè)要重新編碼的圖像的預(yù)置可壓縮開銷(Targetcost)作為至少關(guān)于參考周期重新編碼的總復(fù)雜性的相對(duì)估算的重新編碼的復(fù)雜性(GlobalXpred)的函數(shù)。
8.根據(jù)權(quán)利要求7所述的重新編碼設(shè)備,其特征在于包括裝置,用于提取圖像最初編碼的開銷(Enccostinit);裝置,用于計(jì)算作用于要重新編碼的每個(gè)圖像的壓縮增益(GainC)作為所述圖像的預(yù)置可壓縮開銷(Targetcost)和最初編碼的可壓縮開銷(Enccostinit)的函數(shù)。
9.根據(jù)權(quán)利要求8所述的重新編碼設(shè)備,其特征在于包括裝置,用于計(jì)算作用于要重新編碼的每個(gè)圖像的平均量化(Qrecod)作為壓縮增益(GainC)、要重新編碼的圖像的編碼模式的平均復(fù)雜性比率(SmoothedRatiox[mode])和作用于要重新編碼的圖像的最初編碼的平均量化(Qinit)的函數(shù)。
10.一種根據(jù)視頻流的給定預(yù)置比特率的重新編碼圖像的方法,其中,根據(jù)至少一個(gè)模式編碼最初圖像序列,包括步驟提取關(guān)聯(lián)某些圖像的重新編碼的信息,所述信息表示至少每個(gè)圖像的重新編碼的復(fù)雜性(Xrecod);提取信息,所述提取的信息是關(guān)聯(lián)某些圖像的最初編碼的編碼復(fù)雜性的信息(Xinit);根據(jù)所述模式,計(jì)算以前重新編碼的圖像的重新編碼的復(fù)雜性(Xrecod)與這些圖像的最初編碼的復(fù)雜性(Xinit)的比率(Ratiox),稱為復(fù)雜性比率;更新模式的平均復(fù)雜性比率(SmoothedRatiox[mode])作為復(fù)雜性比率(Ratiox)的函數(shù);由估算要重新編碼的每個(gè)圖像的復(fù)雜性(Xpred)為圖像的最初編碼的復(fù)雜性(Xinit)乘以模式的平均復(fù)雜性比率(SmoothedRatiox[mode])的積,根據(jù)模式重新編碼每個(gè)圖像。
全文摘要
本發(fā)明涉及根據(jù)視頻流給定預(yù)置比特率重新編碼圖像的設(shè)備,其中,至少一個(gè)模式編碼最初圖像序列,包括裝置,提取關(guān)聯(lián)圖像重新編碼的信息,信息表示至少每個(gè)圖像的重新編碼的復(fù)雜性(Xrecod);裝置,提取信息,所述提取的信息是關(guān)聯(lián)圖像的最初編碼的編碼復(fù)雜性的信息(X
文檔編號(hào)H04N7/26GK1628464SQ03803209
公開日2005年6月15日 申請(qǐng)日期2003年2月10日 優(yōu)先權(quán)日2002年2月11日
發(fā)明者格扎維?!さ峡吮R, 帕特里斯·亞歷山大, 帕特里克·迪梅爾 申請(qǐng)人:法國(guó)耐思訊公司