專利名稱:譯碼方法以及使用該方法的設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于將符合某種壓縮方法的數(shù)字位流轉(zhuǎn)換成符合不同(或相同)壓縮方法的數(shù)字位流的譯碼設(shè)備,具體地說,涉及用于將符合利用不帶死區(qū)的量化器執(zhí)行的壓縮方法的數(shù)字位流轉(zhuǎn)換成符合利用帶死區(qū)的量化器的壓縮方法的數(shù)字位流的譯碼方法,以及使用該方法的設(shè)備。
已經(jīng)將運(yùn)動(dòng)圖象專家組(MPEG)-4規(guī)程作為適用于新型的英特網(wǎng)視頻(Internet video)、移動(dòng)式視頻(mobile video)和智能介質(zhì)(smart media)的應(yīng)用的基本壓縮方法確定了下來。同時(shí),大多數(shù)現(xiàn)有數(shù)字視頻內(nèi)容是根據(jù)MPEG-1規(guī)程壓縮過的,并且MPEG-2規(guī)程被選作數(shù)字電視廣播或高清晰度電視(HDTV)的基本視頻壓縮方法。因此,很希望大量數(shù)字視頻內(nèi)容根據(jù)MPEG-2規(guī)程進(jìn)行壓縮。因而,為了提供大量數(shù)字視頻內(nèi)容給涉及下游數(shù)字視頻的各種終端,將根據(jù)現(xiàn)有MPEG-1規(guī)程或MPEG-2規(guī)程編碼的數(shù)字視頻內(nèi)容轉(zhuǎn)換為符合MPEG-4規(guī)程的數(shù)字視頻內(nèi)容將是很重要的。
為了解決以上問題,本發(fā)明的第一目的是提供一種將根據(jù)運(yùn)動(dòng)圖像專家組(MPEG)-1規(guī)程或MPEG-2規(guī)程編碼的數(shù)字視頻內(nèi)容轉(zhuǎn)換為符合MPEG-4規(guī)程的數(shù)字視頻內(nèi)容的方法。
本發(fā)明的第二目的是提供一種方法將根據(jù)不帶死區(qū)的量化器所量化的離散余弦變換(DCT)系數(shù),轉(zhuǎn)換為符合帶死區(qū)的量化器所量化的DCT系數(shù)。
本發(fā)明的第三目的是提供一種適合以上方法的設(shè)備。
因此,為了實(shí)現(xiàn)本發(fā)明的第一目的,提供一種在各種至少具有語法元素和對應(yīng)于視頻數(shù)據(jù)的視頻元素壓縮位流之間執(zhí)行轉(zhuǎn)換的譯碼方法。該譯碼方法包括步驟a)解碼根據(jù)第一壓縮方法壓縮的第一位流,并分析語法元素和視頻元素;b)將分析過的語法元素映射到符合目標(biāo)的第二壓縮方法的語法元素;c)從分析過的視頻元素中部分地重建符合第一壓縮方法的視頻數(shù)據(jù);d)根據(jù)第二壓縮方法重新量化在步驟c)中重建的視頻數(shù)據(jù);以及e)編碼已映射的語法元素和重新量化過的視頻數(shù)據(jù),以獲得符合第二壓縮方法的位流。
為了實(shí)現(xiàn)本發(fā)明的第二目的,提供一種重新量化的方法,在該方法中關(guān)于輸入的DCT系數(shù)x的輸出y表達(dá)成 量化步長Δi設(shè)為 ,i=0,l,2…,63(Qp為量化參數(shù)),當(dāng)x屬于區(qū)間[tm,tm+1]時(shí)判定電平tm設(shè)為 m≥1,xm={x|x∈[tm,tm+1]},xm的振幅電平λm表達(dá)成 關(guān)于所輸入的DCT系數(shù)y的輸出x′表達(dá)成 其中所輸入的DCT系數(shù)y是由具有死區(qū)的MPEG-1量化器量化過的,而在這種量化器中xm的重建電平即逆量化DCT系數(shù)rm設(shè)為 ,量化步長Δ′設(shè)為△′=2Qp,當(dāng)輸出y屬于區(qū)間[t′n,t′n+1]時(shí)判定電平設(shè)為t′n=n·△′,n≥1,yn={y|y∈[t′n,t′n+l]},以及yn的振幅電平即逆量化DCT系數(shù)λ′n由具有死區(qū)的MPEG-4量化器量化成為 并轉(zhuǎn)換成MPEG-4 DCT系數(shù)。該量化方法包括步驟d-1)將下標(biāo)值定義為集合P={[p|t′p∈[tm,tm+1]}使得判定電平屬于區(qū)間[tm,tm+1];d-2)將候選的判定電平的下標(biāo)值定義為集合K=P∪{min{P}-1},其中符號∪表示“并”,而運(yùn)算符min{A}表示集合A各元素中的最小值;以及d-3)從候選下標(biāo)值中選擇滿足一代價(jià)函數(shù)的一個(gè)成員作為最終下標(biāo)值,這種代價(jià)函數(shù)表達(dá)成k=argk∈Kmin|Cm-r′k|]]>其中Cm=∫tmtm+1x·p(x)dx∫tmtm+1p(x)dx]]>這里的Cm是區(qū)間[tm,tm+1]中,由Lloyd-Max量化器所使用的、按均方差最優(yōu)的重建電平,p(x)為Laplacian分布函數(shù)。
為了實(shí)現(xiàn)本發(fā)明的第三目的,提供一種在各種至少具有語法元素和對應(yīng)于視頻數(shù)據(jù)的視頻元素壓縮的位流之間執(zhí)行轉(zhuǎn)換的譯碼設(shè)備。該譯碼設(shè)備包括解碼器,用于從符合第一壓縮方法的第一位流重建語法元素和視頻元素;逆量化器,根據(jù)第一壓縮方法逆量化從所述解碼器提供的視頻元素重建視頻數(shù)據(jù);量化器,用于根據(jù)第二壓縮方法重新量化所述視頻數(shù)據(jù);語法發(fā)生器,用于將從解碼器提供的語法元素映射到符合第二壓縮方法的語法元素;以及編碼器,用于根據(jù)第二壓縮方法編碼從所述量化器提供的重新量化過的視頻編碼器,用于根據(jù)第二壓縮方法編碼從所述量化器提供的重新量化過的視頻數(shù)據(jù)符合第二壓縮方法的視頻元素和從所述語法發(fā)生器提供的語法元素,從而輸出第二位流。
通過借助附圖詳細(xì)描述本發(fā)明的優(yōu)選實(shí)施例,本發(fā)明的上數(shù)目的和優(yōu)點(diǎn)將會(huì)更容易明白,其中
圖1是圖解應(yīng)用到運(yùn)動(dòng)圖像專家組(MPEG)-1壓縮的譯碼設(shè)備的原理的圖;圖2和圖3是圖解圖1的譯碼設(shè)備的常規(guī)實(shí)施例的圖;圖4是圖解根據(jù)本發(fā)明的譯碼方法的過程的圖,MPEG-1位流通過該過程轉(zhuǎn)換為MPEG-4位流;圖5是圖解根據(jù)本發(fā)明的、重新量化DCT系數(shù)的方法的流程;圖6A至6E是用于解釋根據(jù)本發(fā)明的量化原理的圖;圖7A和7B是用于解釋根據(jù)本發(fā)明的重新量化的圖;圖8A和8B是圖解根據(jù)本發(fā)明的重新量化的效果的曲線圖;圖9A至9C分別圖解了一幅原始圖像、對應(yīng)于根據(jù)常規(guī)方法譯碼的位流的圖像以及對應(yīng)于根據(jù)本發(fā)明譯碼的位流的圖像;圖10至圖12是圖解測試根據(jù)本發(fā)明的譯碼方法的結(jié)果的曲線圖;以及圖13是圖解根據(jù)本發(fā)明的譯碼設(shè)備的方框圖。
圖1圖解了應(yīng)用到運(yùn)動(dòng)圖像專家組(MPEG)-1壓縮的譯碼設(shè)備的一個(gè)實(shí)例。圖1的譯碼設(shè)備將輸入的MPEG-1位流轉(zhuǎn)換為具有不同畫面寬高比或不同位速率的MPEG-1位流。這里的MPEG-1位流指示的是已經(jīng)根據(jù)MPEG-1壓縮規(guī)程壓縮過的數(shù)字視頻位流。
譯碼器100包括內(nèi)部MPEG-1解碼器104和內(nèi)部MPEG-1編碼器106。內(nèi)部MPEG-1解碼器104解碼從外接MPEG-1編碼器102提供的MPEG-1位流以形成視頻數(shù)據(jù)。內(nèi)部MPEG-1編碼器106編碼由內(nèi)部MPEG-1解碼器104重建的視頻數(shù)據(jù)、以形成具有不同畫面寬高比或不同位速率的MPEG-1位流。外接MPEG-1解碼器108解碼從內(nèi)部MPEG-1編碼器106輸出的MPEG-1位流以形成視頻數(shù)據(jù)。由于譯碼器100的操作,輸入到譯碼器100的MPEG-1位流的畫面寬高比或位速率不同于從其輸出的MPEG-1位流的畫面寬高比或位速率。
外接MPEG-1編碼器102可以安裝在諸如視頻點(diǎn)播(VoD)服務(wù)提供者這樣的節(jié)目提供者一方,外接MPEG-1解碼器108可以安裝在接收由VoD服務(wù)提供者提供的節(jié)目的那一方。換句話說,譯碼器100將節(jié)目提供者提供的位流轉(zhuǎn)換為具有適合于配備在接收方的顯示單元的位速率和畫面寬高比的位流。
圖2和圖3是圖解圖1的譯碼設(shè)備的常規(guī)實(shí)施例的圖。圖2和圖3分別圖解了一開環(huán)譯碼器和一閉環(huán)譯碼器。這里的開環(huán)譯碼器僅重建來自一位流的視頻數(shù)據(jù)的一部分,例如一宏塊(MB)。另一方面,閉環(huán)譯碼器重建來自一位流的整個(gè)視頻數(shù)據(jù)并編碼該視頻數(shù)據(jù)。在MPEG壓縮規(guī)程中,MB一般由4個(gè)亮度塊和2個(gè)色差塊組成。
由于輸入和輸出位流由相同的方法壓縮或者具有相同的語法,所以圖2和圖3的設(shè)備的操作的解釋限制在視頻元素的轉(zhuǎn)換、具體地說,限制在多個(gè)MB的轉(zhuǎn)換。每個(gè)MB包括一根據(jù)可變長編碼法編碼的離散余弦變換(DCT)系數(shù)、一運(yùn)動(dòng)矢量和MB信息。
圖2的開環(huán)譯碼器以MB為單位執(zhí)行轉(zhuǎn)換。每個(gè)MB的運(yùn)動(dòng)矢量和MB信息在轉(zhuǎn)換之前從MB中分離出來,而在轉(zhuǎn)換之后又將其合并到MB中。用可變長度解碼器(VLD)202解碼MB的DCT系數(shù),然后用一逆量化器(IQ1)204進(jìn)行逆量化。IQ1 204恢復(fù)每個(gè)DCT塊的DCT系數(shù)。量化器(Q2)206量化由IQ1 204所恢復(fù)的每個(gè)DCT塊的DCT系數(shù),以便適合于設(shè)置的位速率。可變長度編碼器(VLC)208變長度編碼由Q2 206量化過的DCT系數(shù)。將從VLC 208輸出的DCT系數(shù)與在轉(zhuǎn)換之前分出來的運(yùn)動(dòng)矢量和MB信息合并起來。
圖3的設(shè)備重建來自MPEG-1位流的整個(gè)視頻數(shù)據(jù)并重新編碼該視頻數(shù)據(jù)、以便具有所希望的畫面寬高比和位速率。解碼器300從輸入的MPEG-1位流重建視頻數(shù)據(jù)。被重建的視頻數(shù)據(jù)由編碼器320重新編碼。由于編碼器320的操作,可以獲得相應(yīng)于所希望的畫面寬高比和位速率的位流。解碼器300是一普通的MPEG-1解碼器,它包括逆量化器(IQ1)302、逆DCT轉(zhuǎn)換器(IDCT1)304、加法器306、存儲(chǔ)器(MEM1)308和運(yùn)動(dòng)補(bǔ)償器(MC1)310。編碼器302是一普通的MPEG-1編碼器,它包括減法器322、DCT轉(zhuǎn)換器(DCT2)324、量化器(Q2)326、逆量化器(IQ2)328、逆DCT轉(zhuǎn)換器(IDCT2)330、減法器332、存儲(chǔ)器(MEM2)334和運(yùn)動(dòng)補(bǔ)償器(MC2)336。
圖2所示的開環(huán)譯碼器在視頻編碼方法為畫內(nèi)(I-picture)編碼法時(shí),表現(xiàn)出極好的性能而且并不復(fù)雜。然而在視頻編碼方法為畫間(P-picture或B-picture)編碼法時(shí),開環(huán)譯碼器存在這樣一個(gè)問題,即由于在運(yùn)動(dòng)補(bǔ)償期間量化誤差改變而改變基準(zhǔn)圖像,導(dǎo)致誤差累積(稱為漂移)。結(jié)果,降低了畫面質(zhì)量。
圖3所示的閉環(huán)譯碼器遵守圖1所圖解的原理。解碼整個(gè)位流以重建視頻數(shù)據(jù)(通過解碼器300),然后重新編碼該數(shù)據(jù)視頻以生成具有所希望的格式的位流(通過編碼器320)。這樣的閉環(huán)譯碼器的優(yōu)點(diǎn)是可以穩(wěn)定地生成具有所希望的位速率的位流,而缺點(diǎn)是該設(shè)備結(jié)構(gòu)很復(fù)雜并且計(jì)算量很大。
此外,圖2和3的譯碼器是在同一編碼方法之間執(zhí)行轉(zhuǎn)換,所以它們不能應(yīng)用到MPEG-4終端,而這些MPEG-4終端對于一系列涉及英特網(wǎng)視頻、移動(dòng)式(mobile)網(wǎng)絡(luò)、智能介質(zhì)等的多媒體通信和存儲(chǔ)來說是必需的。
為了克服這些問題,本發(fā)明提供一種將根據(jù)MPEG-1或MPEG-2規(guī)程所生成的位流轉(zhuǎn)換成根據(jù)MPEG-4規(guī)程所生成的位流的設(shè)備和方法。此外,本發(fā)明提供一種最優(yōu)重新量化方法,用于在重新量化DCT系數(shù)期間盡可能地保持圖像的質(zhì)量。
根據(jù)本發(fā)明的譯碼按下列方式執(zhí)行a)輸入的MPEG-1(或MPEG-2)位流按可變長度進(jìn)行解碼,并且分析MPEG-1(或MPEG-2)語法元素和DCT系數(shù)和將它們從該輸入位流中提取出來。在本說明書中,這一過程的描述限制為語法元素和DCT系數(shù)。
b)映射所提取的MPEG-1(或MPEG-2)語法元素以便適合MPEG-4規(guī)程。
c)根據(jù)MPEG-1(或MPEG-2)規(guī)程逆量化所提取的DCT系數(shù)。
d)根據(jù)MPEG-4規(guī)程重新量化逆量化過的DCT系數(shù)以便滿足所希望的位速率。在此重新量化期間設(shè)置一位速率。
e)將映射成符合MPEG-4規(guī)程的語法元素和根據(jù)MPEG-4規(guī)程重新量化過的DCT系數(shù)按可變長度進(jìn)行編碼,從而獲得符合MPEG-4規(guī)程的位流。
圖4是圖解根據(jù)本發(fā)明的譯碼方法的過程的圖,MPEG-1流通過該過程轉(zhuǎn)換為MPEG-4流。在圖4中,第一行示出了用于分析MPEG-1語法元素的詳細(xì)過程,以及逆量化DCT系數(shù)的過程。第二行示出了將MPEG-1的語法元素映射到MPEG-4語法元素的過程。第三行示出了從MPEG-4語法元素和通過重新量化所獲得的量化過的DCT系數(shù)形成MPEG-4位流的過程。
在步驟402中,分析序列的首標(biāo)。在步驟404中,分析一組畫面(GOP)的首標(biāo)。在步驟406中,分析一畫面的首標(biāo)。在步驟408中,分析一個(gè)片斷的首標(biāo)。在步驟410中,分析MB的首標(biāo)。在步驟402至410中,依次將序列的首標(biāo)、組畫面(GOP)的首標(biāo)、畫面的首標(biāo)、片斷的首標(biāo)、MB的首標(biāo)從所輸入的MPEG-1位流中分離出來。在MPEG-1(或MPEG-2)規(guī)程,圖象具有按尺寸的增長次序由DCT塊、MB、片斷、畫面和GOP組成的層次結(jié)構(gòu)。在將MB轉(zhuǎn)換成DCT的步驟412中,以MB為單位重建DCT系數(shù)。
在目標(biāo)層語法元素映射步驟420中,基于包含在通過執(zhí)行步驟402所獲得的分析過的MPEG-1序列首標(biāo)中的信息,將MPEG-1序列層的語法元素映射到MPEG-4序列層的語法元素vop_width、vop_height、bit_rate、fixed_vop_rate和aspect_ratio_info。在目標(biāo)平面語法元素映射步驟422中,基于包含在通過執(zhí)行步驟406所獲得的分析過的MPEG-1畫面首標(biāo)中的信息,將MPEG-1目標(biāo)平面層的語法元素映射到MPEG-4的目標(biāo)平面層的語法元素vop_coding_type、vop_fcode和vop_quant。在片斷層元素映射步驟424中,基于包含在通過執(zhí)行步驟408所獲得的分析過的MPEG-1片斷首標(biāo)中的信息,將MPEG-1片斷層的語法元素映射到MPEG-4的片斷層的語法元素slice_quant。在MB層元素映射步驟426中,基于包含在通過執(zhí)行步驟410所獲得的分析過的MPEG-1的MB首標(biāo)中的信息,將MPEG-1的MB層的語法元素映射到MPEG-4的MB層的語法元素COD、DQUANT、CBPC、CBPY和MV。在重新量化步驟428中,通過執(zhí)行步驟412獲得的MPEG-1規(guī)程的DCT系數(shù),根據(jù)MPEG-4規(guī)程被重新量化。
在目標(biāo)首標(biāo)生成步驟430中,生成包含通過步驟420獲得的MPEG-4目標(biāo)層語法元素vop_width、vop_height、bit_rate、fixed_vop_rate和aspect_ratio_info的目標(biāo)首標(biāo)。在目標(biāo)平面首標(biāo)生成步驟432中,生成包含通過步驟422獲得的MPEG-4目標(biāo)平面語法元素yop_coding_type、vop_fcode和vop_quant的目標(biāo)平面首標(biāo)。在MB首標(biāo)生成步驟434中,生成包含通過步驟426所獲得的MPEG-4 MB層語法元素COD、DQUANT、CBPC、CBPY和MV的MB首標(biāo)。在編碼步驟436中,將通過步驟428獲得的重新量化的DCT系數(shù)、在步驟430中生成的目標(biāo)首標(biāo)、在步驟432中生成的目標(biāo)平面首標(biāo)以及在步驟434中生成的MB首標(biāo)合并,并按可變長度編碼,從而生成MPEG-4位流。
在本發(fā)明中,將MPEG-1(或MPEG-2)語法元素映射到MPEG-4的語法元素的程序如下。
b-1)由于MPEG-1中的語法元素f_code(表示運(yùn)動(dòng)矢量的運(yùn)動(dòng)范圍)與MPEG-4中的同一語法元素意義不同,因此,將MPEG-1的f_code轉(zhuǎn)換成MPEG-4的f_code。在表1中,將由MPEG-1和MPEG-2中的運(yùn)動(dòng)矢量和代碼所表示的運(yùn)動(dòng)范圍比較。
表1
如表1所示,在同樣的運(yùn)動(dòng)范圍內(nèi),MPEG-4的vop_f_code_forward的值比MPEG-1的forward_f_code值小1。此外,對應(yīng)于MPEG-4的vop_f_code_forward的最小值1的運(yùn)動(dòng)范圍覆蓋了對應(yīng)于MPEG-1的forward_f_code的最小值1的運(yùn)動(dòng)范圍。這可以用等式(1)表達(dá)。
vop_f_code_forward=max((forward_f_code-1),1)…(1)其中max(a,b)是在a和b之間選擇較大那一個(gè)的運(yùn)算符。
b-2)將MPEG-1的MB類型轉(zhuǎn)換成MPEG-4的MB類型。
表2比較了MPEG-1規(guī)程和MPEG-4規(guī)程之間的MB類型。
表2
如表2所示,在MPEG-4中除了“stuffing”和“inter+4v”外,還存在6中MB類型,而在MEPG-1中存在8種類型。
在MPEG-1的8中MB類型中有“nomc+coded”、“nomc+coded+q”和“mc+notcoded”不在MPEG-4中。為了實(shí)現(xiàn)這些性質(zhì),根據(jù)下列規(guī)則執(zhí)行轉(zhuǎn)換。
(i)MB類型“nomc+coded”被設(shè)置成MPEG-4的“inter”類型,然后運(yùn)動(dòng)矢量設(shè)置成(0,0)。
(ii)MB類型“nomc+coded+q”被設(shè)置成MPEG-4的“inter+q”類型,然后運(yùn)動(dòng)矢量設(shè)置成(0,0)。
(iii)MB類型“mc+not coded”被設(shè)置成MPEG-4的“inter”類型。使用原來的運(yùn)動(dòng)矢量?!癱bpy”和“cbpc”被設(shè)置成零。
(iv)對于跳過的那些MB,確定MPEG-4中的“not coded”的“code”的值設(shè)置成零,例如“cod=0”出現(xiàn)所跳過的MB的個(gè)數(shù)那么多次。
b-3)MPEG-1的CBP轉(zhuǎn)換成MPEG-4的CBP。
MPEG-4中的兩種類型的信息cbpy(Y的被編碼的塊格式,這里Y為亮度信號)和cbpc(C的被編碼的塊格式,這里C為色度信號)在MPEG-1中合并成一個(gè)語法元素cbp。對于包括在MB中的DCT塊,MPEG-1中的語法元素cbp指示包括非零DCT系數(shù)的DCT塊的存在/不存在,并且MPEG-1中的語法元素cbp具有與包括在MB中的DCT塊數(shù)一樣多的位數(shù)。每一位指示是否在對應(yīng)的DCT塊中存在非零DCT系數(shù)。一般地,MB由4個(gè)亮度DCT塊和2個(gè)色差DCT塊組成,因此語法元素cbp用6位表示。
MPEG-4中的語法元素cbpy對應(yīng)于與MPEG-1的cbp中的亮度DCT塊對應(yīng)的位(4位),MPEG-4中的語法元素cbpc對應(yīng)于與MPEG-1的cbp中的色差DCT塊對應(yīng)的位(2位)。
單獨(dú)編碼語法元素cbpy,這可以用等式(2)表達(dá)。
cbpy=(cbp&0x3c)>>2 …(2)這里“&”表示以位為單位執(zhí)行的“AND”運(yùn)算,“0x3c”表示十六進(jìn)制數(shù)“3c”,而“>>n”表示右移n位的運(yùn)算。
語法元素cbpc可以用等式(3)表示。
cbpc=(cbp&0x03)>>2 …(3)語法元素cbpc與在上述步驟(b-2)中獲得的MB類型合并,并編碼以符合對應(yīng)于MPEG-4的I_VOP和P_VOP的mcbpc VLC表。
b-4)MPEG-1的MQUANT值轉(zhuǎn)換成MPEG-4的DQUANT值。
MPEG-4的DQUANT值是相鄰MB之間量化參數(shù)(QUANT)的差。QUANT出現(xiàn)在范圍[1,31]內(nèi),并且應(yīng)該滿足關(guān)系|Qn-Qn-1|≤2。將MPEG-1的MQUANT值轉(zhuǎn)換成MPEG-4的DQUANT值可以表達(dá)成等式(4)。
Dquant=min(max((當(dāng)前MB的mquant-前一MB的mquant),-2),2)…(4)這里“mquant”表示MPEG-1量化參數(shù)。
當(dāng)完全反映當(dāng)前mquant的范圍以保證更高的精度時(shí),可以使用根據(jù)MPEG-4規(guī)程的重新同步產(chǎn)生器(resynchroniation maker)。
在MPEG-1和MPEG-4中,量化步長隨著量化權(quán)值以及量化參數(shù)變化。通常,MPEG-1的量化步長Δ總是大于MPEG-4的量化步長Δ'。因此,當(dāng)重新量化從MPEG-1的位流根據(jù)MPEG-4規(guī)程重建的DCT系數(shù)時(shí),MPEG-1和MPEG-4在量化步長方面的不一致應(yīng)該得到適當(dāng)?shù)目刂?,以便使從被轉(zhuǎn)換過的MPEG-4位流重建的圖像的質(zhì)量最優(yōu)。
圖5是圖解根據(jù)本發(fā)明的、重新量化DCT系數(shù)的方法的流程?,F(xiàn)在參考圖5描述在根據(jù)本發(fā)明的譯碼方法中重新量化DCT系數(shù)的程序。在步驟502中,從MPEG-1的位流中按MB為單位重建DCT系數(shù)。在步驟504中,估計(jì)DCT系數(shù)的Laplacian分布。在步驟506中,使用所估計(jì)的DCT系數(shù)的Laplacian分布特征確定重建電平。在步驟508中,使用所確定的重建電平、根據(jù)MPEG-4執(zhí)行量化。
圖6A至6E是用于解釋根據(jù)本發(fā)明的量化原理的圖。圖6A解釋了MPEG-1量化器。圖6B圖解了用于量化幀內(nèi)MB所使用的亮度分量的基本量化表的量化加權(quán)因子Wi?;诹炕淼牧炕訖?quán)因子,按如下方式確定量化步長。Δi=Wi·Qp8,i=0,1,2...,63----(5)]]>這里Qp為量化參數(shù)。
在圖6A中,關(guān)于任意DCT系數(shù)的量化器的輸入x和輸出y之間的關(guān)系可以表達(dá)成y=Q1(x)=[[xΔ+12]·Δ]----(6)]]>這里運(yùn)算符[a]表示最接近“a”的整數(shù)。
判定電平tm由等式(7)表達(dá)。tm=(m-12)·Δ,m≥1----(7)]]>當(dāng)x屬于范圍[tm,tm+1]時(shí),xm={x|x∈[tm,tm+1]}。xm的振幅電平λm由等式(8)設(shè)定。λm=[xmΔ+12]----(8)]]>從等式(8)和(6)可知,xm根據(jù)等式(9)映射到第m個(gè)重建電平。rm=[λm·Δ]----(9)]]>具有負(fù)值的輸入x有下列量化映射關(guān)系。
y=-Q1(|x|)…(10)且沒有死區(qū)。換句話說,包括原點(diǎn)的區(qū)域的長度與垂直軸上的其它區(qū)域的長度相同。
圖6D圖解了MPEG-4量化器。關(guān)于輸入y的、MPEG-4的輸出x′由等式(11)給定。 量化步長Δ′按等式(12)給定。
Δ′=2Qp…(12)這里Qp為量化參數(shù)。
判定電平t′n由等式(13)給定。
t'n=n·Δ′,n≥1…(13)當(dāng)輸出y屬于區(qū)間[t′n,t′n+1]時(shí),yn={y|y∈[t′n,t′n+1]}。yn的振幅電平λ’由等式(14)給定。λ′n=[ynΔ′]----(14)]]>圖6E示出了MPEG-4量化器的特征。在圖6E中確認(rèn)了死區(qū)的存在性。換句話說,包括原點(diǎn)的區(qū)域的長度與垂直軸上的任何其它區(qū)域都不相同。
在等式(5)中,除了量化參數(shù)Qp之外還用量化表值Wi加權(quán)MPEG-1的量化步長Δ。另一方面,在MPEG-4的情況下,量化參數(shù)Qp根據(jù)等式(12)加倍,并且將其結(jié)果值設(shè)置成量化步長Δ′。
因此,除了量化表值Wi為16的情況外,MPEG-1的量化步長Δ總是大于MPEG-4的量化步長Δ′。參考圖6B,只有當(dāng)量化索引i為1、8或9時(shí),MPEG-1的量化步長才與MPEG-4的量化步長相同。雖然當(dāng)量化索引i為1、8或9時(shí),MPEG-1的量化步長才與MPEG-4的量化步長相同,但如圖6C和6E所示,量化器Q1的死區(qū)與量化器Q2的死區(qū)不相同,因此,可以注意到這些量化器具有不同的特征。
圖7A和7B是用于解釋根據(jù)本發(fā)明的重新量化的圖。圖7A圖解了一相鄰量化結(jié)構(gòu),在該結(jié)構(gòu)中圖6A和6D的量化器Q1和Q2被組合起來以便示出應(yīng)該針對譯碼器進(jìn)行考慮的重新量化。圖7B圖解了量化器Q1和Q2在MPEG-1的量化步長Δ大于MPEG-4的量化步長Δ′時(shí)的通常狀態(tài)下的量化特征。當(dāng)原始DCT系數(shù)x為[tm,tm+1]時(shí),在圖7B中y=rm。當(dāng)將這個(gè)值輸入量化器Q2時(shí),將r′n作為x’的值重建。這里,如圖7B所示,存在重建電平的三個(gè)候選值r′n-1、r′n和r′n+1,它們可以由量化器Q2獲取。換句話說,通過讓量化器Q2選取一最優(yōu)的重建電平,可以減少失真。
如上所述,由于量化器Q1和Q2之間的死區(qū)和量化步長的不一致,因此量化器Q2具有多個(gè)候選振幅電平,量化器Q2必須在這些候選電平之間確定一個(gè)最優(yōu)的振幅電平。最優(yōu)的振幅電平使得失真和所生成的位的數(shù)量達(dá)到最小。為了確定這樣的最優(yōu)振幅電平,本發(fā)明提出了如下所述的最優(yōu)振幅電平選擇算法。
使得判定電平屬于圖7B中的區(qū)間[tm,tm+1]的下標(biāo)值由按如下所示的集合P定義。
P={p|t'p∈[tm,tm+1]} …(15)判定電平的下標(biāo)值的候選者由下述的集合K定義。
K=P∪{min{P}-1} …(16)這里符號∪表示“并”,運(yùn)算符min{A}表示集合A的元素中的最小值。
在候選下標(biāo)值,集合K的元素之間,選擇滿足下列代價(jià)函數(shù)的下標(biāo)值。k=argk∈Kmin|Cm-r′k|]]>其中Cm=∫tmtm+1x·p(x)dx∫tmtm+1p(x)dx----(17)]]>可變長地編碼與按照由等式(17)所表達(dá)的代價(jià)函數(shù)所確定的下標(biāo)k對應(yīng)的振幅電平λ’。等式(17)中的代價(jià)函數(shù)中的平衡點(diǎn)Cm為從均方差觀點(diǎn)出發(fā)的Lloyd-Max量化器所使用的區(qū)間[tm,tm+1]中的最優(yōu)重建電平。因此,該平衡點(diǎn)Cm可以從x的分布p(x)中計(jì)算出來。
但是,譯碼器不能獲得分布p(x)的精確統(tǒng)計(jì)特征。為了解決這一問題,當(dāng)產(chǎn)生MPEG-1位流時(shí)必須事先計(jì)算原始DCT系數(shù)的統(tǒng)計(jì)特征,并且傳送帶有MPEG-1位流的信息到譯碼器。或者,必須將譯碼器設(shè)計(jì)成使其能夠估計(jì)分布p(x)的統(tǒng)計(jì)特征。前一方法的缺點(diǎn)是增加了附加信息的總開銷(overhead)位的數(shù)量。本發(fā)明使用后一方法。
一般來說都知道AC DCT系數(shù)符合下列Laplacian分布。p(x)=λ2·e-λ|x|----(18)]]>這里,分布p(x)的統(tǒng)計(jì)特征由λ值確定。在每個(gè)數(shù)據(jù)塊中,將不同的λp(x)=λ2·e-λ|x|----(18)]]>這里,分布p(x)的統(tǒng)計(jì)特征由λ值確定。在每個(gè)數(shù)據(jù)塊中,將不同的λ值指定給63個(gè)AC系數(shù)。
當(dāng)使用等式(18)時(shí),隨機(jī)變量|x|的平均值由等式(19)給定。E(|x|)=∫-∞∞|x|·p(x)dx=∫-∞∞|x|·λ2·e-λ|x|dx=1λ----(19)]]>從等式(19)知道,λ可以表達(dá)成下列等式。λ=1E(|x|)----(20)]]>為了驗(yàn)證等式(20),使用等式(20)估計(jì)根據(jù)SIF標(biāo)準(zhǔn)的花園序列(flowergarden sequence)的第一幀的λ,并將結(jié)果示出在表3中。
表3
圖8A和8B是圖解估計(jì)根據(jù)本發(fā)明的λ值的精度的圖。為了確認(rèn)表3所示的結(jié)果,將λ=0.046時(shí)的Laplacian分布與關(guān)于圖8A中的系數(shù)(1,3)的真實(shí)分布進(jìn)行比較,并將λ=0.166時(shí)的Laplacian分布與關(guān)于圖8B中的系數(shù)(5,6)的真實(shí)分布進(jìn)行比較。可以看出,當(dāng)AC分量降低頻率時(shí)λ值變小。原因是DCT的能量分組(energy packing)特征而導(dǎo)致具有較大的值的DCT系數(shù)在低頻率時(shí)出現(xiàn)的概率高。
雖然λ的值可以從等式19)計(jì)算出來,但不能獲得x的值,而只有重建的y的值可以在譯碼器中獲得。因此,必須根據(jù)等式(21)近似E(|x|)的值。E(|x|)≅E(|y|)+E(|z|)Δ2----(21)]]>
在等式(21)中添加第二項(xiàng)的目的是補(bǔ)償|x|的平均值并按等式(22)定義,其中的|x|的值在量化后被重建成零,原因是它們屬于死區(qū)。E(|z|)Δ2=∫-Δ2Δ2|z|·p(z)dz----(22)]]>計(jì)算等式(21)中的第二項(xiàng)的所必需的p(z)的值由等式(23)給定。p(z)=λ′2·e-λ′|z|]]>其中λ′=1E(|y|)----(23)]]>根據(jù)等式(24)計(jì)算等式(23)中的
E(|z|)Δ2=2·∫0λ2z·λ′2·e-λ′/|z|dz=1λ′-e-λ′Δ/2(1λ′+Δ2)----(24)]]>因此,由根據(jù)本發(fā)明的譯碼器估計(jì)的λ值表達(dá)如下。λ=1E(|x|)≅1E(|y|)+E(|z|)Δ2=λ′2-e-λ′Δ/2(1+Δ2λ′)----(25)]]>如果死區(qū)不出現(xiàn),則在等式(25)中Δ=0,因此λ=λ’。
為了驗(yàn)證等式(25)的有效性,對符合SIF標(biāo)準(zhǔn)的第一花園圖像進(jìn)行測試。表4示出了使用等式(25)計(jì)算出來的關(guān)于每個(gè)AC系數(shù)的λ值。可以看出在該實(shí)驗(yàn)中λ的計(jì)算值非常類似于示出在表3中的值,只有關(guān)于幾個(gè)高頻分量在數(shù)值上出現(xiàn)小誤差。但是這些誤差可以忽略。
表4
在MPEG-1編碼器采用速率控制模式的情況下,量化參數(shù)值指定為關(guān)于整個(gè)圖像的量化參數(shù)的平均值,以便計(jì)算等式(6)中的Δ。為了使用等式(17),必須估計(jì)λ值,并且當(dāng)根據(jù)等式(25)計(jì)算λ值時(shí)出現(xiàn)一幀延遲。
圖9A至9C分別圖解了一幅原始圖像、對應(yīng)于根據(jù)常規(guī)方法譯碼的位流的圖像以及對應(yīng)于根據(jù)本發(fā)明譯碼的位流的圖像。
圖10至圖12是圖解測試根據(jù)本發(fā)明的譯碼方法的結(jié)果的曲線圖。在第一試驗(yàn)中,針對符合SIF標(biāo)準(zhǔn)的10個(gè)花園序列執(zhí)行仿真。所有幀都按MPEG-1幀內(nèi)模式編碼,并且對整個(gè)圖像應(yīng)用相同的量化參數(shù)。圖10示出了由所建議的依靠Qp值的變化譯碼的序列的平均峰值信噪比(PSNR)。為了便于對照,將輸入的MPEG-1序列的平均PSNR和由常規(guī)方法譯碼的序列的平均PSNR一起示出。PSNR的增益大約為0.3-0.6dB。表5示出了上述三種情況生成的位的平均數(shù)量。
表5
從表5可以推導(dǎo)出兩種有趣的結(jié)果。一個(gè)是所提出的方法中生成的位的數(shù)量比常規(guī)方法所生成的位的數(shù)量小3.6-7.5%。這個(gè)結(jié)果可以基于DCT系數(shù)的分布進(jìn)行解釋。DCT系數(shù)受Laplacian分布支配,在其中具有正值的平衡點(diǎn)Cm位于tm和tm+1之間的中心的左邊。由于rm處于tm和tm+1的中心,因此Cm一般小于rm。所以,選中較小重建電平的概率增加。由于使用小重建電平,所生成的位的數(shù)量減少。
第二個(gè)有趣的結(jié)果是譯碼后的位數(shù)總是大于所輸入的MPEG-1的位數(shù)。這是因?yàn)閷τ谕涣炕瘏?shù)來說,MPEG-4的量化步長總是比MPEG-1的量化步長小。因此,MPEG-4使用更精確的量化步長,因此所生成的位的數(shù)量增加。
第二試驗(yàn)是針對乒乓球試驗(yàn)序列在與第一試驗(yàn)同樣條件下執(zhí)行的。與圖10一樣,圖11示出了平均PSNR。根據(jù)所提出的本方法的增益大約為0.2-0.4dB。在表6中,比較了圖10所述的三種情況下的位數(shù)??梢钥闯龉?jié)約了常規(guī)使用的位的大約5-7%。
表6
第三試驗(yàn)是針對符合SIF標(biāo)準(zhǔn)的足球序列執(zhí)行的。每個(gè)足球序列有一個(gè)尺寸為10的GOP,并且按1.5Mbps的速率編碼。圖12圖解了第11、21、31……幀各自的PSNR,這些幀都是I-畫面。從圖12可以看出,與常規(guī)的方法相比,所提出的方法具有大約0.3-0.5dB的增益。根據(jù)常規(guī)方法生成的位的數(shù)量為195805,根據(jù)所提出的方法生成的位的數(shù)量為183731。因此,節(jié)約大約6%的位。
圖13是圖解根據(jù)本發(fā)明的譯碼設(shè)備的方框圖。參考圖13,譯碼設(shè)備1300根據(jù)參考圖4至7B所描述的譯碼方法執(zhí)行譯碼。因此,現(xiàn)在參考根據(jù)參考圖4至7B所描述的上述內(nèi)容來描述各個(gè)部件的詳細(xì)操作。
譯碼設(shè)備1300包括可變長度解碼器(VLD)1302、MPEG-1逆量化器1304、MPEG-4量化器1305、可變長度編碼器(VLC)1308和MPEG-4語法生成器1310。VLD 1302從所輸入的MPEG-1位流重建語法元素和量化的DCT系數(shù),并將其提供給MPEG-4語法生成器1310和MPEG-1逆量化器1304。MPEG-1逆量化器1304根據(jù)MPEG-1逆量化已經(jīng)量化過的DCT系數(shù)以便重建DCT系數(shù),并將重建的DCT系數(shù)提供給MPEG-4量化器1306。MPEG-4量化器1306根據(jù)MPEG-4量化被重建的DCT系數(shù)以便獲得量化過的DCT系數(shù),并將其提供給VLC 1308。通過控制MPEG-4量化器1306的量化步長,可以改變位速率。
同時(shí),MPEG-4語法生成器1310映射從VLD 1302提供的語法元素到符合MPEG-4的語法元素,并將這些MPEG-4語法元素提供給VLC 1308。MPEG-4語法生成器1310的映射操作已經(jīng)參考圖4和表1和2進(jìn)行了詳細(xì)描述。
VLC 1308根據(jù)MPEG-4、可變長度地編碼從MPEG-4量化器1306提供的量化過的DCT系數(shù)和從MPEG-4語法生成器1310提供的語法元素,并輸出該結(jié)果。從VLC 1308輸出的位流已經(jīng)根據(jù)MPEG-4進(jìn)行了壓縮并具有所希望的畫面寬高比和位速率。
根據(jù)本發(fā)明的譯碼設(shè)備執(zhí)行根據(jù)不同壓縮方法壓縮過的位流之間的轉(zhuǎn)換。在以上實(shí)施例中,已經(jīng)描述了用于將MPEG-1位流轉(zhuǎn)換成MPEG-4位流的方法和設(shè)備,但很明顯,本發(fā)明可以用于將MPEG-2位流轉(zhuǎn)換為MPEG-4位流的情況,以及應(yīng)用于根據(jù)同一方法壓縮過的位流之間的轉(zhuǎn)換。此外,本發(fā)明還能應(yīng)用于將MPEG-4轉(zhuǎn)換為MPEG-1或MPEG-2位流的情況。
如上所述,本發(fā)明有利于根據(jù)不同方法或同一方法壓縮過的位流之間的轉(zhuǎn)換。因此,根據(jù)本發(fā)明的譯碼方法和設(shè)備使得符合MPEG-1和MPEG-2的現(xiàn)有數(shù)字視頻內(nèi)容能被用于為使用諸如英特網(wǎng)視頻、移動(dòng)式視頻和智能介質(zhì)之類的MPEG-4數(shù)字視頻內(nèi)容而設(shè)計(jì)的終端。
權(quán)利要求
1.一種在各種至少具有語法元素和對應(yīng)于視頻數(shù)據(jù)的視頻元素的壓縮位流之間執(zhí)行轉(zhuǎn)換的譯碼方法,該譯碼方法包括步驟a)解碼根據(jù)第一壓縮方法壓縮的第一位流,并分析語法元素和視頻元素;b)將分析過的語法元素映射到符合目標(biāo)的第二壓縮方法的語法元素;c)從分析過的視頻元素部分地重建符合第一壓縮方法的視頻數(shù)據(jù);d)根據(jù)第二壓縮方法重新量化在步驟c)中重建的視頻數(shù)據(jù);以及e)編碼已映射的語法元素和重新量化過的視頻數(shù)據(jù),以獲得符合第二壓縮方法的位流。
2.如權(quán)利要求1所述的譯碼方法,其中第一壓縮方法是運(yùn)動(dòng)圖像專家組(MPEG)-1壓縮方法,第二壓縮方法為MPEG-4壓縮方法,并且步驟b)包括b-1)將MPEG-1的f_code轉(zhuǎn)換成MPEG-4的f_code;b-2)將MPEG-1的宏數(shù)據(jù)塊(MB)類型轉(zhuǎn)換成MPEG-4的MB類型;b-3)MPEG-1編碼的數(shù)據(jù)塊格式(CBP)轉(zhuǎn)換成MPEG-4的CBP;以及b-4)MPEG-1的MQUANT(MPEG-1中的量化參數(shù))值轉(zhuǎn)換成MPEG-4的DQUANT(量化參數(shù)之差)值。
3.如權(quán)利要求2所述的譯碼方法,其中步驟b-1)根據(jù)下列等式執(zhí)行轉(zhuǎn)換,vop_f_code_forward=max((forward_f_code-1),1),其中max(a,b)是在“a”和“b”之間選擇較大那一個(gè)的運(yùn)算符。
4.如權(quán)利要求2所述的譯碼方法,其中步驟b-2)包括步驟(i)將“nomc+coded”設(shè)置成MPEG-4的“inter”類型,并將運(yùn)動(dòng)矢量設(shè)置成(0,0);(ii)將“nomc+coded+q”設(shè)置成MPEG-4的“inter+q”類型,并將運(yùn)動(dòng)矢量設(shè)置成(0,0);(iii)將“mc+not coded”設(shè)置成MPEG-4的“inter”類型,使用原來的運(yùn)動(dòng)矢量,并將“cbpy”和“cbpc”設(shè)置為零;以及(iv)將在MPEG-4中確定的“not coded”的“code”的值設(shè)置為零,使“cod=0”出現(xiàn)所跳過的MB的個(gè)數(shù)那么多次。
5.如權(quán)利要求2所述的譯碼方法,其中步驟b-3)包括步驟b-3-1)單獨(dú)根據(jù)下列等式編碼cbpy,cbpy=(cbp&0x3c)>>2這里“&”表示以位為單位執(zhí)行的“AND”運(yùn)算,“0x3c”表示十六進(jìn)制數(shù)“3c”,而“>>”表示右移n位的運(yùn)算;以及b-3-2)根據(jù)下列等式編碼cbpc,cbpc=(cbp&0x03)>>2,并且cbpc與在上述步驟b-2)中獲得的MB類型合并,并編碼以符合對應(yīng)于MPEG-4的I_VOP和P_VOP的mcbpc VLC表。
6.如權(quán)利要求2所述的譯碼方法,其中步驟b-4)根據(jù)下列等式執(zhí)行轉(zhuǎn)換,dquant=min(max((當(dāng)前MB的mquant-前一MB的mquant),-2),2)。
7.如權(quán)利要求2所述的譯碼方法,其中步驟d)包括步驟估計(jì)從MPEG-1位流重建的離散余弦(DCT)系數(shù)的Laplacian分布;使用估計(jì)的DCT系數(shù)的Laplacian分布確定重建電平;使用所確定的重建電平、根據(jù)MPEG-4執(zhí)行量化。
8.如權(quán)利要求2所述的譯碼方法,其中當(dāng)對應(yīng)于輸入DCT系數(shù)x的輸出y表達(dá)成 時(shí),量化步長Δi給定為 i=0,1,2…,63(Qp為量化參數(shù)),當(dāng)x屬于區(qū)間[tm,tm+1]時(shí)判定電平tm設(shè)為 m≥1,xm={x|x∈[tm,tm+1]},xm的振幅電平λm表達(dá)成 對應(yīng)于輸入的DCT系數(shù)y的輸出x'表達(dá)成 其中所輸入的DCT系數(shù)y是由具有死區(qū)的MPEG-1量化器量化過的,而在這種量化器中xm的重建電平即逆量化DCT系數(shù)rm設(shè)為 ,量化步長Δ'設(shè)為Δ'=2Qp,當(dāng)輸出y屬于區(qū)間[t'n,t'n+1]時(shí)判定電平設(shè)為t'n=n·Δ',n≥1,yn={y|y∈[t′n,t′n+1]},以及yn的振幅電平即逆量化DCT系數(shù)λ′n由具有死區(qū)的MPEG-4量化器量化成為 并轉(zhuǎn)換成MPEG-4 DCT系數(shù),步驟d)包括步驟d-1)將下標(biāo)值定義為集合P={p|t′p∈[tm,tm+1]}使得判定電平屬于區(qū)間[tm,tm+1];d-2)將候選的判定電平的下標(biāo)值定義為集合K=P∪{min{p}-1},其中符號∪表示“并”,而運(yùn)算符min{A}表示集合A各元素中的最小值;以及d-3)從候選下標(biāo)值中選擇滿足一代價(jià)函數(shù)的一個(gè)成員作為最終下標(biāo)值,這種代價(jià)函數(shù)表達(dá)成k=argk∈Kmin|Cm-r′k|]]>其中Cm=∫tmtm+1x·p(x)dx∫tmtm+1p(x)dx]]>這里的Cm是區(qū)間[tm,tm+1]中,由Lloyd-Max量化器所使用的、按均方差最優(yōu)的重建電平,p(x)為Laplacian分布函數(shù)。
9.如權(quán)利要求8所述的譯碼方法,其中在步驟d-3)種,通過分析p(x)的統(tǒng)計(jì)特征獲得Cm。
10.如權(quán)利要求9所述的譯碼方法,其中當(dāng)假定AC DCT系數(shù)符合下列Laplacian分布p(x)=λ2·e-λ|x|]]>時(shí),確定p(x)的統(tǒng)計(jì)特征的λ值的確定步驟包括步驟d-3-1)根據(jù) 計(jì)算隨機(jī)變量|x|的平均值;以及d-3-2)根據(jù) 確定λ。
11.如權(quán)利要求10所述的譯碼方法,其中步驟d-3-2)包括步驟d-3-2-1)根據(jù)等式 和 近似E(|x|)的值,其中E(|z|)Δ2=∫-Δ2Δ2|z|·p(z)dz,]]>λ′=1E(|y|);]]>d-3-2-2)根據(jù) 計(jì)算 以及d-3-2-3)根據(jù) 估計(jì)λ值。
12.一種重新量化方法,其中對應(yīng)于輸入DCT系數(shù)x的輸出y表達(dá)成 量化步長Δi給定為 ,i=0,1,2…,63(Qp為量化參數(shù)),當(dāng)x屬于區(qū)間[tm,tm+1]時(shí)判定電平tm設(shè)為 m≥1,xm={x|x∈[tm,tm+1]},xm的振幅電平λm表達(dá)成 對應(yīng)于輸入的DCT系數(shù)y的輸出x'表達(dá)成 其中所輸入的DCT系數(shù)y是由具有死區(qū)的MPEG-1量化器量化過的,而在這種量化器中xm的重建電平即逆量化DCT系數(shù)rm設(shè)為 ,量化步長Δ'設(shè)為Δ'=2Qp,當(dāng)輸出y屬于區(qū)間[t'n,t'n+1]時(shí)判定電平設(shè)為t'n=n·Δ',n≥1,yn={y|y∈[t'n,t'n+1]},以及yn的振幅電平即逆量化DCT系數(shù)λ'n由具有死區(qū)的MPEG-4量化器量化成為 并轉(zhuǎn)換成MPEG-4 DCT系數(shù),該量化方法包括步驟d-1)將下標(biāo)值定義為集合P={p|t'p∈[tm,tm+1]}使得判定電平屬于區(qū)間[tm,tm+1];d-2)將候選的判定電平的下標(biāo)值定義為集合K=P∪{min{P}-1},其中符號∪表示“并”,而運(yùn)算符min{A}表示集合A各元素中的最小值;以及d-3)從候選下標(biāo)值中選擇滿足一代價(jià)函數(shù)的一個(gè)成員作為最終下標(biāo)值,這種代價(jià)函數(shù)表達(dá)成k=argk∈Kmin|Cm-r′k|]]>其中Cm=∫tmtm+1x·p(x)dx∫tmtm+1p(x)dx]]>這里的Cm是區(qū)間[tm,tm+1]中,由Lloyd-Max量化器所使用的、按均方差最優(yōu)的重建電平,p(x)為Laplacian分布函數(shù)。
13.如權(quán)利要求12所述的重新量化方法,其中在步驟d-3)中,通過分析p(x)的統(tǒng)計(jì)特征獲得Cm。
14.如權(quán)利要求13所述的重新量化方法,其中當(dāng)假定AC DCT系數(shù)符合下列Laplacian分布p(x)=λ2·e-λ|x|]]>時(shí),確定p(x)的統(tǒng)計(jì)特征的λ值的確定步驟包括步驟d-3-1)根據(jù) 計(jì)算隨機(jī)變量|x|的平均值;以及d-3-2)根據(jù) 確定λ。
15.如權(quán)利要求14所述的重新量化方法,其中步驟d-3-2)包括步驟d-3-2-1)根據(jù)等式 和 近似E(|x|)的值,其中E(|z|)Δ2=∫Δ2Δ2|z|·p(z)dz,]]>λ′=1E(|y|);]]>d-3-2-2)根據(jù) 計(jì)算 以及d-3-2-3)根據(jù) 估計(jì)λ值。
16.一種在各種至少具有語法元素和對應(yīng)于視頻數(shù)據(jù)的視頻元素的壓縮的位流之間執(zhí)行轉(zhuǎn)換的譯碼設(shè)備,該譯碼設(shè)備包括解碼器,用于從符合第一壓縮方法的第一位流重建語法元素和視頻元素;逆量化器,根據(jù)第一壓縮方法逆量化從所述解碼器提供的視頻元素重建視頻數(shù)據(jù);量化器,用于根據(jù)第二壓縮方法重新量化所述視頻數(shù)據(jù);語法發(fā)生器,用于將從解碼器提供的語法元素映射到符合第二壓縮方法的語法元素;以及編碼器,用于根據(jù)第二壓縮方法編碼從所述量化器提供的重新量化過的視頻數(shù)據(jù)符合第二壓縮方法的視頻元素和從所述語法發(fā)生器提供的語法元素,從而輸出第二位流。
17.如權(quán)利要求16的譯碼設(shè)備,其中第一壓縮方法是運(yùn)動(dòng)圖像專家組(MPEG)-1或MPEG-2壓縮方法,第二壓縮方法為MPEG-4壓縮方法。
全文摘要
提供一種在各種至少具有語法元素和對應(yīng)于視頻數(shù)據(jù)的視頻元素的壓縮的位流之間執(zhí)行轉(zhuǎn)換的譯碼方法及其設(shè)備,該設(shè)備包括用于從符合第一壓縮方法的第一位流重建語法元素和視頻元素的解碼器;根據(jù)第一壓縮方法逆量化從解碼器提供的視頻元素重建視頻數(shù)據(jù)的逆量化器;用于根據(jù)第二壓縮方法重新量化所述視頻數(shù)據(jù)的量化器;用于將從解碼器提供的語法元素映射到符合第二壓縮方法的語法元素的語法發(fā)生器;以及用于根據(jù)第二壓縮方法編碼重新量化過的視頻數(shù)據(jù)和語法元素,從而輸出第二位流的編碼器。
文檔編號H04N7/50GK1358031SQ01117680
公開日2002年7月10日 申請日期2001年5月14日 優(yōu)先權(quán)日2000年12月8日
發(fā)明者劉國烈, 金潤秀, 金在均, 徐光德, 盧奎燦, 許盛喆 申請人:三星電子株式會(huì)社