專利名稱:視頻編碼的量化方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻編碼的量化方法,該量化一般用在數(shù)據(jù)壓縮期間。
如公知的,數(shù)據(jù)壓縮方法實(shí)現(xiàn)以下功能,將圖像劃分為圖像塊,對(duì)這些塊作離散余弦變換以提供亮度和色度系數(shù)宏塊,量化這些系數(shù)以及作可變長(zhǎng)度編碼。
按照上述方法,內(nèi)部型編碼僅利用圖像的固有內(nèi)容。
中間型編碼估計(jì)例如先前圖像與當(dāng)前圖像之間的運(yùn)動(dòng),以提供先前圖像的運(yùn)動(dòng)補(bǔ)償,由此提供一預(yù)測(cè)圖像,然后按當(dāng)前圖像與預(yù)測(cè)圖像之間的差來執(zhí)行編碼。
余弦變換能去除空間冗余和運(yùn)動(dòng)補(bǔ)償去除時(shí)間冗余。
為了控制編碼器數(shù)據(jù)速率,使量化級(jí)隨該數(shù)據(jù)速率變化是已知的。通常所采用算法的目的在于獲得最佳圖像質(zhì)量的最低可能速率同時(shí)考慮實(shí)際編碼成本。
對(duì)于給定速率,改進(jìn)圖像質(zhì)量要求去除空間和時(shí)間冗余。這一類型的算法遇到編碼類型上所固有的問題,用術(shù)語塊效應(yīng)表示缺陷的出現(xiàn)。由于量化級(jí)從一個(gè)塊到另一個(gè)塊是不同的,解壓縮的圖像可示出圖像塊的邊界,如果壓縮因子大并且因此相繼宏塊的量化級(jí)之間的偏差大則更是如此。
本發(fā)明的目的是通過優(yōu)化控制算法、亦即通過改進(jìn)給定傳輸速率的圖像質(zhì)量限制前述缺點(diǎn)。
為此,本發(fā)明涉及視頻圖像數(shù)據(jù)壓縮的方法,包含將當(dāng)前圖像劃分為宏塊和通過按設(shè)定速率的函數(shù)計(jì)算量化級(jí)量化每一宏塊中的數(shù)據(jù),其特征在于所計(jì)算的量化級(jí)按宏塊編碼成本的函數(shù)被校正。
本發(fā)明還涉及一種視頻圖像數(shù)據(jù)壓縮的方法,包含將當(dāng)前圖像劃分為宏塊和通過按設(shè)定速率的函數(shù)計(jì)算量化級(jí)量化每一宏塊中的數(shù)據(jù),其特征在于所計(jì)算的量化級(jí)按當(dāng)前圖像的宏塊相對(duì)于前一或后一圖像中相匹配的那一個(gè)的估計(jì)或計(jì)算的運(yùn)動(dòng)的函數(shù)加以校正的。
本發(fā)明還涉及實(shí)現(xiàn)該方法的裝置。
由于眼睛的整體效應(yīng),觀察者的眼睛對(duì)運(yùn)動(dòng)的圖像區(qū)域的塊效應(yīng)不太敏感。其對(duì)非均勻區(qū)的塊效應(yīng)也不太敏感,因?yàn)閳D像的這種均勻性或“規(guī)則性,,使前述缺陷加大。
本發(fā)明的意圖是通過對(duì)這些主觀圖像感知準(zhǔn)則加以考慮而采納圖像量化方法。對(duì)于均勻和/或穩(wěn)定的或具有非常小運(yùn)動(dòng)的區(qū)域減少量化級(jí),由此更好地進(jìn)行編碼。對(duì)于這一類型的區(qū)域而言,從一個(gè)宏塊到另一宏塊量化級(jí)的變化因此更小。對(duì)那些不均勻和/或運(yùn)動(dòng)的編碼區(qū)域說來量化級(jí)增加,以保持圖像的相同速率分配。
對(duì)圍繞被處理宏塊的圖像區(qū)中的量化校正執(zhí)行過濾使得有可能限制躍變,從而對(duì)于解壓縮的圖像質(zhì)量,編碼結(jié)果主觀上顯現(xiàn)出均勻。由此在不增加平均速率的情況下改進(jìn)解壓縮圖像質(zhì)量。
本發(fā)明的其他特征和優(yōu)點(diǎn)通過以下結(jié)合附圖對(duì)本發(fā)明優(yōu)選實(shí)施例所作的非限定性描述而更為顯而易見,其中
圖1示出圖像中的一個(gè)宏塊及其過濾窗;圖2a示出P型幀的一個(gè)運(yùn)動(dòng)矢量;圖2b示出P型幀的兩個(gè)運(yùn)動(dòng)矢量;圖3示出按照本發(fā)明方法的一種算法;圖4示出按照本發(fā)明的裝置。
如上所述,要編碼的圖像被分為構(gòu)成宏塊的圖像塊。
按照本發(fā)明,對(duì)應(yīng)于輸入視頻序列的圖像n的宏塊的行i和列i的每個(gè)宏塊(n,i,j)被用量化級(jí)編碼,所述量化級(jí)是按照下列方程局部調(diào)整的Q[n][i][j]=Q[n][i]·αw/p[n][i][j]β2w/p[n][i][j]利用標(biāo)準(zhǔn)MPEG術(shù)語,Q[n][i]是對(duì)圖像n的“切片”i計(jì)算的量化級(jí)。調(diào)整系數(shù)αw/p[n][i][j]是在已編碼序列的空間特性、尤其是宏塊的編碼成本的基礎(chǔ)上計(jì)算的,系數(shù)β2w/p[n][i][j]是在已編碼序列的時(shí)間特性、尤其是賦予宏塊的運(yùn)動(dòng)的基礎(chǔ)上計(jì)算的,如后面將進(jìn)一步解釋的。
空間調(diào)整系數(shù)的計(jì)算該系數(shù)直接與圖像的內(nèi)部編碼成本相聯(lián)系。
宏塊(n,i,j)的編碼成本α[n][i][j]一般在圖像的預(yù)分析期間確定,圖像的預(yù)分析包括對(duì)具有恒定量化級(jí)的圖像編碼和測(cè)量宏塊產(chǎn)生的速率。為了衰減從給定空間特性的一個(gè)區(qū)域到另一個(gè)區(qū)域的躍變效應(yīng),隨后在宏塊周圍的尺寸為w的窗中過濾相應(yīng)于編碼成本的這一數(shù)值。因此能夠衰減在鄰近宏塊的量化級(jí)中的急劇變化,這在經(jīng)過一種類型的區(qū)域到另一區(qū)域時(shí),例如從一個(gè)均勻的區(qū)域到一個(gè)有紋理的區(qū)域時(shí)確實(shí)是可能在邊界上發(fā)生的,并且可能導(dǎo)致邊緣效應(yīng),類似于塊效應(yīng)但限于這些邊界。區(qū)域中的塊效應(yīng)是同量衰減的。
圖1示出一個(gè)這種類型的窗。
整個(gè)圖1包括每切片M個(gè)宏塊和S個(gè)切片。
對(duì)于位于圖像n的第i片和第j宏塊列的給定宏塊2(n,i,j)來說,考慮離所討論宏塊的距離小于或等于w的相鄰宏塊,定義了尺寸為w的一個(gè)窗3,亦即,這些宏塊既屬于包含在i-w與i+w之間的切片,也屬于包含在j-w與j+w之間的列。因此w對(duì)應(yīng)于被處理宏塊周圍的偏移。
應(yīng)用下列方程在窗W上對(duì)編碼成本α(n,i,j)取平均αw(n,i,j)=1(2W+1)2Σu=i-wi+wΣv=j-wj+wα(n,u,v)]]>為了量化級(jí)的校正不令作為設(shè)定平均速率的函數(shù)的步驟計(jì)算無效,亦即常規(guī)控制算法,在尺寸為w的窗上平均的校正系數(shù)αw通過將它除以整個(gè)圖像上系數(shù)α的平均值αp在整個(gè)圖像上被加權(quán)。αp(n)=1M.SΣu=1SΣv=1Mα(n,u,v)]]>然后對(duì)于宏塊(n,i,j)空間系數(shù)假定為下列值αw/p(n,i,j)=αw(n,i,j)αp(n)]]>可以用S行和P列的矩陣表示圖像n,行i和列j的矩陣系數(shù)對(duì)應(yīng)于αw/p(n,i,j)。該矩陣Sp是在圖像n的宏塊的編碼成本矩陣的基礎(chǔ)上計(jì)算的,該編碼成本矩陣是在該圖像n的第一遍內(nèi)部編碼期間獲得的。內(nèi)部系數(shù)的這一矩陣稱為校正屏蔽,矩陣中的每一系數(shù)被應(yīng)用于相應(yīng)宏塊以在對(duì)該宏塊編碼期間校正由常規(guī)壓縮算法計(jì)算的量化級(jí)。
由于圖像n上系數(shù)αw/p(n,i,j)的和等于1,可能證明控制算法不受將這一空間系數(shù)應(yīng)用于量化級(jí)的干擾。
所計(jì)算的系數(shù)受到約束以避免過校正,過校正可能與使用的控制算法有聯(lián)系,并且為與設(shè)定速率相符,例如在編碼圖像的最后一些切片時(shí),可能迫使量化級(jí)不考慮圖像的復(fù)雜性。在我們的實(shí)例中,系數(shù)限制在從0.67延伸到1.5的區(qū)域中。
時(shí)間調(diào)整系數(shù)的計(jì)算為了使運(yùn)動(dòng)得少的區(qū)域與運(yùn)動(dòng)得大的區(qū)域相比具有更好的編碼質(zhì)量,有必要檢測(cè)這些區(qū)域,這是通過恢復(fù)運(yùn)動(dòng)信息的數(shù)量而實(shí)現(xiàn)的。
可供圖像的每一宏塊使用的運(yùn)動(dòng)矢量類型取決于圖像(該宏塊所屬圖像)的類型。以MPEG標(biāo)準(zhǔn)定義的圖像類型取決于圖像編碼,即對(duì)于內(nèi)部圖像編碼,為類型I、即內(nèi)部,對(duì)于僅考慮前一圖像基準(zhǔn)的圖像編碼,為類型P、即預(yù)測(cè),以及對(duì)于考慮前一和/或后一圖像基準(zhǔn)的圖像編碼為類型B、即雙向。
因此這些矢量可以為-對(duì)于P型圖像,圖像矢量參考前一內(nèi)部或P型圖像;-對(duì)于B型圖像,正向或反向圖像矢量取決于它們是否參考前一圖像或后一圖像。
如果對(duì)圖像幀而非重構(gòu)圖像執(zhí)行處理,計(jì)算的矢量參考這些幀而不是圖像。因此可得到的幀矢量是具有相同或者相反奇偶性的幀矢量。
所有這些矢量通過塊匹配獲得。用運(yùn)動(dòng)估值器計(jì)算矢量。
考慮用于計(jì)算時(shí)間調(diào)整系數(shù)的信息是圖像運(yùn)動(dòng)矢量的模方或模。V[n][i][j]=VX2[n][i][j]+VY2[n][i][j]]]>Vx和Vy是運(yùn)動(dòng)矢量的水平和垂直分量。
然后這一模信息作為將當(dāng)前圖像從用于計(jì)算當(dāng)前圖像的運(yùn)動(dòng)場(chǎng)的參考圖像分離的圖像數(shù)的函數(shù)被歸一化,或者,如果計(jì)算是在幀的等級(jí)上執(zhí)行的,則作為將當(dāng)前幀與參考幀分離的幀數(shù)的函數(shù)被歸一化,這是為了獲得在整個(gè)序列上最相似的矢量場(chǎng)。
該歸一化矢量為
V′[n][i][j]=ηV[n][i][j]η是歸一化因子。
所選擇的參考持續(xù)時(shí)間是分離兩個(gè)P型圖像的持續(xù)時(shí)間。設(shè)M是分離兩個(gè)P型圖像的圖像間隔數(shù),設(shè)Bpos是從前一P型(或I型)圖像分離B型圖像的間隔數(shù),也就是在兩P型圖像之間B的位置。
圖2a表示P型圖像的矢量4。因此該矢量參考前一圖像I。當(dāng)前圖像P與參考圖像I之間的間隙對(duì)應(yīng)于M。
當(dāng)應(yīng)用于圖像時(shí),運(yùn)動(dòng)矢量的歸一化因子為-當(dāng)相應(yīng)于前一P型(或I型)圖像對(duì)一B型圖像編碼時(shí),亦即對(duì)于向前類型的矢量η=MBpos]]>-當(dāng)相應(yīng)于下一P型(或I型)圖像對(duì)一B型圖像編碼時(shí),亦即對(duì)于向后類型的矢量η=MM-Bpos]]>當(dāng)對(duì)一P型圖像編碼時(shí)(在圖2a的情況下)η=1圖2b示出參考前一I型圖像第二幀的P型圖像的第一幀的第一運(yùn)動(dòng)矢量5,和參考前一I型圖像的第一幀的P型圖像的第二幀的第二運(yùn)動(dòng)矢量6。
當(dāng)應(yīng)用于幀時(shí),運(yùn)動(dòng)矢量場(chǎng)的歸一化因子取決于幀的場(chǎng)位置和奇偶性,并為-對(duì)于P型幀(在圖2b的情況下)η=2·M2·M+[2·M·(1-field)+(-1)field]·parity]]>-對(duì)于B型幀和前向預(yù)測(cè)η=2·M2·Bpos+(-1)field·parity]]>-對(duì)于B型幀和后向預(yù)測(cè)η=2·M2·(M-Bpos)-(-1)field·parity]]>根據(jù)圖像中包含的是第一幀還是第二幀,“場(chǎng)”等于1或2,根據(jù)是包含相同奇偶性還是相反奇偶性,奇偶性等于0或1。
在雙向類型圖像的情況下,圖像宏塊可以在僅有正向矢量、僅有反向矢量或可選擇地為這兩者的組合的基礎(chǔ)上編碼。在這種情況下,對(duì)應(yīng)于最大值的那些將被選擇,而兩個(gè)矢量的平均值可以被同樣好地采用。
因此通過將分配給圖像或幀的運(yùn)動(dòng)矢量V(n,i,j)的模乘以相應(yīng)系數(shù)η獲得歸一化運(yùn)動(dòng)矢量V′(n,i,i)。
然后通過在尺寸為W的窗上過濾矢量V′和通過在整個(gè)圖像上加權(quán)來計(jì)算時(shí)間調(diào)整系數(shù)βlw/p(n,i,j)的矩陣,如前面對(duì)系數(shù)α所說明的。βlw/p[n][i][j]=1(2W+1)2Σu=i-Wi+WΣv=j-Wj+WV′[n][u][v]1M·SΣu=1SΣv=1MV′[n][u][v]]]>換言之,βlw/p(n)(i)(j)對(duì)應(yīng)于尺寸為W的窗中局部運(yùn)動(dòng)的平均值被圖像中運(yùn)動(dòng)的平均值加權(quán)。βlw/p[n][i][j]=V′w-V′p[n]=1-V′p(n)--V′w-[n][i][j]V′p[n]-=1-λlw/p[n][i][j]]]>表示量化級(jí)的校正因子的λ1w/p(n)(i)(j)因此對(duì)應(yīng)于圖像中運(yùn)動(dòng)的平均值與由圖像中運(yùn)動(dòng)的平均值加權(quán)的局部運(yùn)動(dòng)值之間的差。
校正的目的是有利于具有少量運(yùn)動(dòng)的區(qū)域,代價(jià)是那些高度運(yùn)動(dòng)的區(qū)域。對(duì)于較低等級(jí)的局部運(yùn)動(dòng)V′w(n)(i)(j),時(shí)間系數(shù)(因此量化級(jí))較小并且對(duì)應(yīng)于該局部運(yùn)動(dòng)的宏塊的編碼質(zhì)量較好。而且,由于對(duì)圖像的固定速率分配,運(yùn)動(dòng)少的這一區(qū)域如同圖像V′p(n)中平均運(yùn)動(dòng)增加時(shí)被同樣較好地加以編碼。
對(duì)于高度運(yùn)動(dòng)的序列,校正因子最佳地起到其作用。但是,也為了適應(yīng)運(yùn)動(dòng)少的場(chǎng)景,有必要調(diào)整這一系數(shù)。一個(gè)實(shí)例能夠使這點(diǎn)得到證明。
考慮一個(gè)為“汽車日歷”型、在數(shù)據(jù)壓縮領(lǐng)域公知的運(yùn)動(dòng)少的場(chǎng)景。圖像的平均運(yùn)動(dòng)矢量是3,是一小的數(shù)值,因?yàn)閷?duì)于水平分量按8位以及對(duì)于垂直分量按7位編碼的運(yùn)動(dòng)矢量最大值為143的數(shù)量級(jí)。對(duì)于等于1的宏塊相對(duì)運(yùn)動(dòng),該值給出0.33的校正因子。因此在自身運(yùn)動(dòng)少的序列中運(yùn)動(dòng)少的區(qū)域的校正加權(quán)過于大。
因此可以這樣推斷,校正系數(shù)λ1應(yīng)該用因子
加權(quán),其中V表示對(duì)高度運(yùn)動(dòng)序列的圖像上運(yùn)動(dòng)的平均值的估計(jì),其降低系數(shù)λ1,因此衰減對(duì)具有小的平均運(yùn)動(dòng)(V′p(n)<V)的場(chǎng)景的校正(通過設(shè)β1趨近于1),而對(duì)于高度運(yùn)動(dòng)的場(chǎng)景則保持它。
一秒期間圖像總寬度上圖像像素的運(yùn)動(dòng)已經(jīng)從實(shí)驗(yàn)上規(guī)定為對(duì)V的良好估值V-=picture_widthFR·M]]>“picture width”是按像素?cái)?shù)(例如720)表示的這一寬度,F(xiàn)R是圖像頻率(例如50Hz)。
M使得歸一化平均值成為可能(因此這是在參考時(shí)間距離上的平均運(yùn)動(dòng))。
最后,局部時(shí)間調(diào)整系數(shù)β21w/p(n,i,j)可以寫為β2w/p[n][i][j]=1-λlw/p[n][i][j]V′p[n]V-=v--(V′p[n]-)+V′w-[n][i][j]V-]]>如果采用表達(dá)式V″[n][i][j]=V′[n][i][j]+(V-V′p[n]),則β2w/p[n][i][j]=V′′w-[n][i][j]V-=V′′w-[n][i][j]V′′p[n]-]]>
換言之,局部時(shí)間調(diào)整系數(shù)β21w/p(n,i,j)對(duì)應(yīng)于在尺寸為W的窗上歸一化矢量V″的過濾,V″是通過將代表高度運(yùn)動(dòng)序列的平均速度矢量周圍的歸一化矢量V′再集中而得到的。
最后,用常規(guī)控制算法計(jì)算的當(dāng)前宏塊的量化級(jí)由總調(diào)整系數(shù)校正,總調(diào)整系數(shù)是考慮圖像的空間和時(shí)間復(fù)雜性的乘積αw/p(n,i,j)×β2w/p(n)(i)(j)。
通過注意該乘積中的每一項(xiàng)可以用同一算子計(jì)算,用于計(jì)算系數(shù)的算法可得到簡(jiǎn)化,所述算子如下
對(duì)于系數(shù)α,項(xiàng)d(n)(u)(v)代表宏塊(n,u,v)的編碼成本,對(duì)于系數(shù)β,它代表分配給宏塊(n,u,v)的矢量V″的模。
圖3示出用于計(jì)算量化系數(shù)的算法。
標(biāo)號(hào)為7的步驟在關(guān)于輸入端I1上接收的并在圖像的第一遍編碼或預(yù)分析期間計(jì)算的內(nèi)部圖像塊的編碼成本的信息的基礎(chǔ)上計(jì)算空間調(diào)整系數(shù)。然后在步驟8期間在尺寸為w的窗中過濾這些系數(shù),以給出被送至步驟9的空間調(diào)整系數(shù)矩陣。
步驟10在正向和反向矢量的基礎(chǔ)上計(jì)算圖像運(yùn)動(dòng)矢量的模,正向和反向矢量是由運(yùn)動(dòng)估值器提供的并在輸入端I2上獲得。下一步驟11按照?qǐng)D像組上相應(yīng)圖像的位置的函數(shù)歸一化這些矢量的模。它按賦予每一圖像的值M的函數(shù)計(jì)算歸一化因子η。下一步驟12計(jì)算高度運(yùn)動(dòng)的序列在整個(gè)圖像上運(yùn)動(dòng)的平均值,如以上所定義的。然后在步驟13將歸一化的矢量在這一平均值周圍再集中,然后在尺寸為w的窗上將它們過濾。進(jìn)而對(duì)于源自步驟13的信息,相關(guān)于圖像序列中的切割部分,步驟14接收從輸入端I3發(fā)出的信息。如果為被處理的當(dāng)前圖像發(fā)送“切割”信息項(xiàng),通過發(fā)送等于1的系數(shù)矩陣,步驟14停止對(duì)量化級(jí)按時(shí)間調(diào)整系數(shù)的函數(shù)的校正。在另一情況下,它是在前一步驟計(jì)算的系數(shù),是以時(shí)間調(diào)整系數(shù)的矩陣的形式發(fā)送的。步驟9將每一時(shí)間調(diào)整系數(shù)乘以相應(yīng)的空間調(diào)整系數(shù)(同一行,同一列),以給出它應(yīng)被再調(diào)用的、相應(yīng)于正被處理的圖像中宏塊的新系數(shù)矩陣。這一步驟也考慮送至輸入端I4的量化級(jí),它是在常規(guī)控制算法的基礎(chǔ)上計(jì)算的那一量化級(jí)。乘以對(duì)于當(dāng)前宏塊所獲得的新系數(shù)的這一量化級(jí)給出在步驟9輸出S提供的新的被調(diào)整的量化級(jí)。
圖4表示實(shí)施上述方法的裝置的說明性實(shí)施例。
視頻預(yù)處理電路15接收其輸入端上的視頻信息,也是該裝置的輸入端。其輸出端連接到預(yù)分析或“第一遍”電路16的輸入端,運(yùn)動(dòng)估值器17的輸入端和中間/內(nèi)部編碼回路18的輸入端。預(yù)分析電路的第一輸出端連接到用于計(jì)算量化級(jí)的電路19的第一輸入端,而預(yù)分析電路的第二輸出端連接到用于調(diào)整量化級(jí)的電路20的第一輸入端。運(yùn)動(dòng)估值器17的輸出端并聯(lián)連接到量化級(jí)調(diào)整電路20的第二輸入端和中間/內(nèi)部編碼回路18的第二輸入端。在第二輸入端,量化級(jí)計(jì)算電路19接收從輸出緩沖器或緩沖存儲(chǔ)器21發(fā)出的存儲(chǔ)容量信息。量化級(jí)計(jì)算電路19的輸出端連接到量化級(jí)調(diào)整電路20的第三輸入端。該電路的輸出端連接到編碼回路18的第三輸入端。編碼回路的輸出端連接到輸出緩沖器或緩沖存儲(chǔ)器21,其第一輸出端是該裝置的輸出,其第二輸出端連接到量化級(jí)計(jì)算電路19。
以常規(guī)方式,預(yù)處理電路在圖像組級(jí)別重新排列圖像,如MPEG標(biāo)準(zhǔn)中所定義的,然后將圖像分為宏塊。預(yù)分析器執(zhí)行第一遍,亦即在恒定量化級(jí)的基礎(chǔ)上對(duì)圖像作內(nèi)部編碼,恒定量化級(jí)是作為正被處理的圖像組(MPEG標(biāo)準(zhǔn)的GOP)的先前圖像的編碼復(fù)雜性的函數(shù)預(yù)先定義或調(diào)整的,在GOP級(jí)別實(shí)現(xiàn)控制,以為量化級(jí)計(jì)算電路19提供每圖像編碼成本。預(yù)分析器還將每宏塊編碼成本供給局部調(diào)整量化級(jí)的電路20,以計(jì)算空間調(diào)整系數(shù)。該電路20還接收在運(yùn)動(dòng)估值器17的基礎(chǔ)上計(jì)算的運(yùn)動(dòng)矢量,以確定時(shí)間調(diào)整系數(shù)。中間/內(nèi)部編碼回路18從預(yù)處理電路15接收宏塊形式的視頻信息,并從運(yùn)動(dòng)估值器接收分配給每一宏塊的運(yùn)動(dòng)矢量,以便計(jì)算中間宏塊。依據(jù)通過計(jì)算這些宏塊固有的能量確定的中間或內(nèi)部模式,它對(duì)中間或內(nèi)部宏塊執(zhí)行離散余弦變換。利用由量化級(jí)調(diào)整電路20送出的已調(diào)整的量化級(jí)信息對(duì)獲得的系數(shù)進(jìn)行量化。然后將量化后的系數(shù)傳送到緩沖存儲(chǔ)器21然后到本裝置的輸出端。緩沖存儲(chǔ)器使得能夠控制本裝置的輸出速率。關(guān)于該存儲(chǔ)器的存儲(chǔ)容量的信息被傳送到量化級(jí)計(jì)算電路19,其也具有關(guān)于該裝置設(shè)定輸出速率的信息。如其名稱所暗示的,這一量化級(jí)計(jì)算電路19具有按該設(shè)定速率的函數(shù)計(jì)算每一圖像的量化級(jí)的作用,該速率是在圖像組級(jí)產(chǎn)生的并也是緩沖存儲(chǔ)器裝載的程度。然后將這一步驟送至量化級(jí)調(diào)整電路,該電路的作用尤其是按為所討論的宏塊所計(jì)算的空間和時(shí)間調(diào)整系數(shù)的函數(shù)校正其值。
自然,這些是說明性實(shí)施例,準(zhǔn)數(shù)α可以是任何表示圖像復(fù)雜性的系數(shù),例如宏塊的能量或亮度梯度。對(duì)于準(zhǔn)數(shù)β來說同樣如此,其可以是任何給出運(yùn)動(dòng)信息的系數(shù)。
如上所述,時(shí)間準(zhǔn)數(shù)的應(yīng)用假定被編碼的場(chǎng)景中的連續(xù)性。因此,在例如通過由運(yùn)動(dòng)估值器計(jì)算的運(yùn)動(dòng)矢量的相干(則矢量場(chǎng)是非均勻的)檢測(cè)的景的變化期間,系數(shù)β的使用被停止。按時(shí)間準(zhǔn)數(shù)的函數(shù)調(diào)整量化級(jí)被停止,這樣就不會(huì)損害觀察算法,尤其是該算法的變換速率。在內(nèi)部模式的宏塊編碼期間(一般與景的變化相關(guān)),將系數(shù)β例如限制為1。
過濾窗的尺寸取決于量化級(jí)校正的所需級(jí)別窗越寬,系數(shù)越趨近于1。這一尺寸可以按正被處理區(qū)域的函數(shù)進(jìn)行調(diào)整,亦即它們的均勻性和/或它們的運(yùn)動(dòng)取決于它們需要的量化級(jí)的校正度。
利用同一過濾器計(jì)算空間和時(shí)間校正系數(shù)不需要實(shí)現(xiàn)同一過濾窗。關(guān)于時(shí)間準(zhǔn)數(shù),當(dāng)一個(gè)宏塊所獲得的運(yùn)動(dòng)矢量(無論是正向型還是反向型)相對(duì)于相鄰宏塊獲得的那些是均勻的時(shí),可將過濾窗減小為其最小尺寸。
該方法可適合于運(yùn)用亮度數(shù)據(jù)量化的任何類型的編碼器,不管是在空間域還是在頻域中。描述的實(shí)例涉及變換塊的系數(shù),但本發(fā)明可能應(yīng)用于圖像塊的亮度值。
該方法還可適合于對(duì)量化級(jí)起作用的任何類型的控制算法。我們已假定按照MPEG標(biāo)準(zhǔn),量化級(jí)對(duì)于切片是恒定的,但本發(fā)明能夠應(yīng)用于為每個(gè)宏塊計(jì)算一個(gè)量化級(jí)的算法。
權(quán)利要求
1.視頻圖像的數(shù)據(jù)壓縮方法,包含將當(dāng)前圖像劃分為宏塊和通過按設(shè)定速率的函數(shù)計(jì)算量化級(jí)量化每個(gè)宏塊中的數(shù)據(jù),其特征在于將所計(jì)算的量化級(jí)作為當(dāng)前圖像的宏塊相對(duì)于前一或后一圖像(10,11,12,13,14,9)中匹配的那一個(gè)所作的估計(jì)或計(jì)算的運(yùn)動(dòng)的函數(shù),并作為宏塊(7,8,9)編碼成本的函數(shù)來加以修改。
2.視頻圖像的數(shù)據(jù)壓縮方法,包含將當(dāng)前圖像劃分為宏塊并通過作為設(shè)定速率的函數(shù)來計(jì)算量化級(jí)而量化每一宏塊中的數(shù)據(jù),其特征在于作為運(yùn)動(dòng)信息的函數(shù)來修改(10,11,12,13,14,9)所計(jì)算的量化級(jí),所述運(yùn)動(dòng)信息包括當(dāng)前圖像的宏塊相對(duì)于前一或后一圖像中匹配的那一個(gè)所作的估計(jì)或計(jì)算的運(yùn)動(dòng),并用相應(yīng)于對(duì)于具有高度運(yùn)動(dòng)的序列估計(jì)的平均運(yùn)動(dòng)與宏塊(13)所屬的圖像中的平均運(yùn)動(dòng)之間的偏差的值加以校正。
3.如權(quán)利要求1所述的方法,其特征在于在集中在當(dāng)前宏塊上的窗上平均(8)宏塊的編碼成本。
4.如權(quán)利要求3所述的方法,其特征在于通過將對(duì)宏塊計(jì)算的量化級(jí)乘以等于在窗上平均的宏塊的編碼成本的空間調(diào)整系數(shù),除以在整個(gè)圖像上平均的編碼成本來實(shí)行修改。
5.如權(quán)利要求2所述的方法,其特征在于在集中在當(dāng)前宏塊上的窗上來平均(13)已校正的運(yùn)動(dòng)。
6.如權(quán)利要求5所述的方法,其特征在于通過將對(duì)宏塊計(jì)算的量化級(jí)乘以等于相應(yīng)于在尺寸為w的窗上平均的已校正運(yùn)動(dòng)的運(yùn)動(dòng)矢量的模的時(shí)間調(diào)整系數(shù),除以在整個(gè)圖像上平均的已校正的運(yùn)動(dòng)矢量的模來實(shí)行修改。
7.如前述權(quán)利要求之一所述的方法,其特征在于每一宏塊中的數(shù)據(jù)是由圖像塊的離散余弦變換產(chǎn)生的系數(shù)。
8.視頻圖像的數(shù)據(jù)壓縮裝置,包含對(duì)圖像的宏塊進(jìn)行中間和內(nèi)部編碼的電路(18),其自身包括一個(gè)圖像宏塊的離散余弦變換電路和一個(gè)基于由電路(19)計(jì)算的量化級(jí)的已變換系數(shù)的量化器,電路(19)用于作為該裝置輸出速率的函數(shù)計(jì)算量化級(jí),其特征在于它包括接收所計(jì)算的量化級(jí)的裝置(20),以便按已編碼宏塊編碼成本(16)的函數(shù)調(diào)整該量化級(jí),并將其提供到中間和內(nèi)部編碼電路(18)和作為分配給已編碼宏塊的運(yùn)動(dòng)(17)的函數(shù)。
全文摘要
視頻編碼的量化方法和裝置。本發(fā)明涉及視頻數(shù)據(jù)壓縮方法,包含將當(dāng)前圖像劃分為宏塊和通過按設(shè)定速率的函數(shù)計(jì)算量化級(jí)來量化每個(gè)宏塊中的數(shù)據(jù),其特征在于量化級(jí)作為宏塊編碼成本的函數(shù)被校正。還可按照所計(jì)算的或所估計(jì)的宏塊運(yùn)動(dòng)的函數(shù)來校正量化級(jí)。
文檔編號(hào)H04N7/30GK1176562SQ97117599
公開日1998年3月18日 申請(qǐng)日期1997年9月4日 優(yōu)先權(quán)日1996年9月6日
發(fā)明者澤維爾·杜克勞克斯, 菲利普·吉洛特爾, 盧多維克·諾布里特, 皮埃爾·魯洛 申請(qǐng)人:湯姆森多媒體公司