專利名稱:用于編碼和/或解碼運(yùn)動圖像的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于編碼和/或解碼運(yùn)動圖像的方法和裝置,尤其涉及一種能夠通過考慮輸入到運(yùn)動圖像編碼器的圖像特性而適應(yīng)性地選擇量化矩陣從而提高編碼運(yùn)動圖像的效率的編碼和/或解碼運(yùn)動圖像的方法和裝置。
背景技術(shù):
圖1是用于編碼運(yùn)動圖像的編碼單元120和用于解碼被編碼的運(yùn)動圖像的解碼單元140的方框圖。
為了提供視頻點(diǎn)播(VOD)服務(wù)或進(jìn)行運(yùn)動圖像的通信,編碼單元120創(chuàng)建通過壓縮技術(shù)編碼的位流,而解碼單元140從輸入到其中的位流來恢復(fù)原始圖像。
為了去除來自輸入圖像數(shù)據(jù)的空間相關(guān)性,離散余弦變換(DCT)單元122以8×8的象素塊為單元對輸入到其中的圖像數(shù)據(jù)進(jìn)行DCT操作。量化單元(Q)124通過使用由DCT單元122獲得的DCT系數(shù)對輸入圖像數(shù)據(jù)進(jìn)行量化和用幾個(gè)代表值來表示量化數(shù)據(jù)來執(zhí)行高效的有損數(shù)據(jù)壓縮。
逆量化單元(IQ)126對由量化單元124提供的量化的圖像數(shù)據(jù)進(jìn)行逆量化。逆離散余弦變換(IDCT)單元128對由逆量化單元126提供的逆量化的圖像數(shù)據(jù)進(jìn)行IDCT運(yùn)算。幀存儲器單元130以逐幀的方式存儲由IDCT單元128提供的IDCT變換后的圖像數(shù)據(jù)。
運(yùn)動估計(jì)和補(bǔ)償單元(ME/MC)132通過使用輸入至其中的當(dāng)前幀的圖像數(shù)據(jù)和存儲在幀存儲器單元130中的前一幀的圖像數(shù)據(jù),來估計(jì)關(guān)于每個(gè)宏塊的運(yùn)動向量(MV)和相應(yīng)于每一個(gè)塊匹配誤差的絕對差的總和(SAD)。
可變長度編碼單元(VLC)134根據(jù)由運(yùn)動估計(jì)和補(bǔ)償單元132提供的估計(jì)的運(yùn)動向量來從數(shù)字余弦變換和量化后的圖像數(shù)據(jù)中去掉統(tǒng)計(jì)冗余。
通過解碼單元140解碼由編碼單元120編碼的位流。解碼單元140包括可變長度解碼單元(VLD)142、逆量化單元144、IDCT單元146、幀存儲器單元148和運(yùn)動估計(jì)單元150。
美國專利申請第No.6480539號公開了用于編碼運(yùn)動圖像的裝置的一個(gè)例子。
最近開發(fā)了一種機(jī)頂盒,其接收模擬地面廣播節(jié)目并隨后使用諸如MPEG2或MPEG4的數(shù)據(jù)壓縮方法來解碼和存儲所接收到的節(jié)目。然而,在地面廣播的情形下,到達(dá)接收終端的圖像會由于信道噪聲而被扭曲。舉個(gè)例子來說,圖像會看起來似乎向其中加入了白高斯噪聲。如果這樣壓縮圖像的話,壓縮圖像的效率將會因?yàn)榘赘咚乖肼暤挠绊懚兊梅浅5牡汀?br>
因此,為了去除傳統(tǒng)的編碼運(yùn)動圖像的方法中的噪聲,在編碼器的輸入端口處提供了一個(gè)預(yù)處理濾波器。然而,如果使用該預(yù)處理濾波器,就需要一個(gè)附加的對運(yùn)動圖像進(jìn)行編碼的計(jì)算過程。
另外,在這一傳統(tǒng)的編碼運(yùn)動圖像的方法中,不考慮輸入圖像的特性而確定量化矩陣,并且通過以逐個(gè)圖像的方式將量化矩陣應(yīng)用至輸入圖像來對輸入圖像進(jìn)行量化,在這一情形中編碼輸入圖像的效率是很低的。
發(fā)明內(nèi)容
本發(fā)明提供了一種用于編碼和/或解碼運(yùn)動圖像的方法和裝置,其能夠提高壓縮運(yùn)動圖像的效率和性能。
本發(fā)明還提供了一種用于編碼和/或解碼運(yùn)動圖像的方法和裝置,其能夠去除噪聲而不增加所進(jìn)行計(jì)算次數(shù)。
根據(jù)本發(fā)明的一個(gè)方面,提供了一種利用多個(gè)量化矩陣編碼運(yùn)動圖像的方法。該方法包括(a)考慮輸入圖像的至少一個(gè)特征來選擇多個(gè)量化矩陣中的一個(gè),所述輸入圖像的至少一個(gè)特征是噪聲信息或者是該輸入圖像的空間特征;(b)變換所述輸入圖像;(c)利用所選擇的量化矩陣來量化變換后的輸入圖像。
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種利用多個(gè)量化矩陣來編碼運(yùn)動圖像的方法。該方法包括(a)對編碼的圖像數(shù)據(jù)進(jìn)行可變長度解碼;(b)從可變長度解碼后的圖像數(shù)據(jù)中提取指定根據(jù)輸入圖像的至少一個(gè)特征進(jìn)行分類的多個(gè)量化矩陣中的一個(gè)的索引信息,所述輸入圖像的至少一個(gè)特征是噪聲信息或者是該輸入圖像的空間特征;(c)基于所提取的索引信息選擇多個(gè)量化矩陣中的一個(gè);(d)使用所選擇的量化矩陣對可變長度解碼后的圖像數(shù)據(jù)的每一個(gè)宏塊進(jìn)行逆量化。
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種通過適應(yīng)性地將多個(gè)量化加權(quán)矩陣應(yīng)用到宏塊來解碼運(yùn)動圖像的方法,該方法包括(a)接收輸入圖像的編碼流,該編碼流包括至少一個(gè)宏塊,每個(gè)宏塊包括指定多個(gè)量化加權(quán)矩陣的信息,其中所述多個(gè)量化加權(quán)矩陣包括專門地用于輸入圖像的U和V分量的量化矩陣;(b)對于編碼的圖像數(shù)據(jù)執(zhí)行可變長度解碼;和(c)通過使用為相應(yīng)宏塊指定的多個(gè)量化加權(quán)矩陣來逆量化每個(gè)可變長度解碼的宏塊。
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種利用多個(gè)量化矩陣來編碼運(yùn)動圖像的裝置。該裝置包括量化矩陣確定單元,其考慮輸入圖像的至少一個(gè)特征來為每一個(gè)宏塊選擇多個(gè)量化矩陣中的一個(gè),并關(guān)于每一個(gè)宏塊產(chǎn)生指示所選擇的量化矩陣的索引信息;量化矩陣存儲單元,其存儲根據(jù)輸入圖像的特征分類的多個(gè)量化矩陣,并且根據(jù)由所述量化矩陣確定單元產(chǎn)生的索引信息來為每一個(gè)宏塊輸出一個(gè)量化矩陣;圖像變換單元,其變換所述輸入圖像;量化單元,利用所選擇的量化矩陣來量化變換后的輸入圖像。
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種利用多個(gè)量化矩陣來解碼運(yùn)動圖像的裝置。該裝置包括可變長度解碼單元,其接收編碼的圖像流、對輸入圖像流進(jìn)行可變長度解碼、從可變長度解碼后的圖像流的每一個(gè)宏塊中提取指示根據(jù)輸入圖像的至少一個(gè)特征分類的多個(gè)的量化矩陣中的一個(gè)的索引信息,所述輸入圖像的至少一個(gè)特征是噪聲信息或者是該輸入圖像的空間特征;量化矩陣存儲單元,其存儲多個(gè)量化矩陣、基于所提取的索引信息選擇多個(gè)量化矩陣中的一個(gè)、輸出所選擇的量化矩陣;逆量化單元,其利用從所述量化矩陣存儲單元輸出的量化單元來逆量化可變長度解碼的圖像流的每一個(gè)宏塊。
根據(jù)本發(fā)明的另一個(gè)方面,提供了一種通過適應(yīng)性地應(yīng)用被應(yīng)用于宏塊的多個(gè)量化加權(quán)矩陣來解碼運(yùn)動圖像的裝置,該裝置包括可變長度解碼單元,用于接收編碼的圖像流,以對輸入圖像流執(zhí)行可變長度解碼,所述編碼流包括至少一個(gè)宏塊,每個(gè)宏塊包括指定多個(gè)量化加權(quán)矩陣的信息;量化加權(quán)矩陣存儲單元,用于存儲量化加權(quán)矩陣,以根據(jù)所述信息來選擇多個(gè)量化加權(quán)矩陣中的一個(gè),并且輸出選擇的量化加權(quán)矩陣;和逆量化單元,用于使用從量化加權(quán)矩陣存儲單元輸出的量化加權(quán)矩陣來逆量化可變長度解碼的圖像流的每一個(gè)宏塊,其中多個(gè)量化加權(quán)矩陣包括專門地用于輸入圖像的U和V分量的量化矩陣。
本發(fā)明的其它方面和/或優(yōu)點(diǎn)的一部分將在以下的說明中闡明,一部分將從說明書中顯而易見,或者可以從本發(fā)明的實(shí)際應(yīng)用中領(lǐng)會。
結(jié)合附圖,通過下面對實(shí)施例的詳細(xì)描述,本發(fā)明的這些和/或其他方面和特征將變得更加清楚和明白,其中圖1是傳統(tǒng)的MPEG編碼器和傳統(tǒng)的MPEG解碼器的方框圖;圖2是對平均值不為0的圖像進(jìn)行處理的近似廣義維納(Wiener)濾波器的方框圖;圖3是在DCT塊中對平均值不為0的圖像進(jìn)行處理的近似廣義維納濾波器的方框圖;圖4A到圖4C是用于內(nèi)部塊編碼的不同類型的近似廣義維納濾波器的大致的框圖;圖5是用于中間塊編碼的典型視頻編碼器的框圖;圖6是用于根據(jù)本發(fā)明的實(shí)施例來編碼運(yùn)動圖像的裝置的方框圖;圖7是用于根據(jù)本發(fā)明的實(shí)施例來編碼運(yùn)動圖像的裝置的方框圖;圖8是用于根據(jù)本發(fā)明的實(shí)施例來編碼運(yùn)動圖像的裝置的方框圖;具體實(shí)施方式
下面將對在附圖中圖示了其示例的本發(fā)明的實(shí)施例進(jìn)行詳細(xì)的介紹,其中相同的參考數(shù)字始終表示相同的元件。以下將通過參照附圖對實(shí)施例進(jìn)行說明以便解釋本發(fā)明。
在編碼運(yùn)動圖像時(shí),預(yù)處理濾波是很重要的,因?yàn)樗芡ㄟ^從圖像中去除噪聲而提高編碼運(yùn)動圖像的效率。傳統(tǒng)的用于從圖像中去除噪聲的預(yù)處理濾波技術(shù)通常在空間像素塊中執(zhí)行,而在本發(fā)明中,在用于編碼運(yùn)動圖像的裝置的DCT塊中執(zhí)行噪聲去除技術(shù)。
在本發(fā)明中,使用近似廣義維納濾波處理方法從圖像中去除噪聲。在近似廣義維納濾波處理方法中,通過利用例如離散余弦變換(DCT)的快速酉變換(unitary transformation)來實(shí)現(xiàn)維納濾波。然而,可以選擇性地使用除了近似廣義維納濾波處理方法之外的、在DCT塊中執(zhí)行濾波的濾波方法。
圖2是對平均值不為0的圖像進(jìn)行處理的近似廣義維納濾波器的方框圖。
在圖2中,v代表一個(gè)包含噪聲的圖像塊, 代表濾波后的圖像塊的按行排列的列向量。因?yàn)閳D像塊v的平均值不為0,因此平均值估計(jì)單元210估計(jì)圖像塊v的平均值 并且減法單元220從圖像塊v中減去該估計(jì)的平均值 通過濾波單元230對從減法單元220中輸出的作為相減結(jié)果的z進(jìn)行濾波,并且濾波單元230輸出濾波后的數(shù)據(jù) 作為濾波的結(jié)果。加法單元240將圖像塊v的估計(jì)平均值 加入到該濾波后的數(shù)據(jù)中,并隨后輸出期望的濾波數(shù)據(jù) 作為相加的結(jié)果。
下文中,將對用于處理平均值為0的圖像模式的近似廣義維納濾波方法進(jìn)行更詳細(xì)的描述。
用于處理平均值為0的圖像模式的近似廣義維納濾波方法可以通過下面的等式(1)來表達(dá) 在等式(1)中,L~=ALA*T,L=[I+σn2R-1]-1,]]>R=E[yyT],Z=Az,并且σn2代表噪聲變化量。另外,在等式(1)中,A表示酉變換。由于在本實(shí)施例中,DCT被用作酉變換,因此此處A代表DCT。假設(shè)C8和代表8×8的DCT矩陣和Kronecher算子,則A=C8C8。
由于在大多數(shù)情況下,在酉變換中將 對角化,因此等式(1)可以改寫為下面的等式(2)。
y^=A*TY^---(2)]]>在等式(2)中,Y^=L~Z≈[DiagL~]Z.]]>因此,通過將等式(2)應(yīng)用到一個(gè)8×8的塊中可以得到下面的等式(3)。
p~(k,l)≅11+σn2σ2ψ(k,l)-1---(4)]]>在等式(4)中,ψ(k,l)代表沿著ALA*T的對角線放置的標(biāo)準(zhǔn)化的元素,σ2代表原始圖像y的變化量。通常,σ2是未知的。因此,用從變化量z中減去噪聲變化量σn2的結(jié)果來代替σ2。
如等式(3)所示,通過用 乘以二維DCT系數(shù)Z(k,l)來對平均值為0的圖像塊進(jìn)行近似廣義維納濾波。一旦確定了 則通過將 加到 來得到最終的濾波的圖像。
下文中,將對用于處理平均值不為0的圖像模式的近似廣義維納濾波方法進(jìn)行更詳細(xì)的描述。
假定通過用S(k,l),即滿足下述等式(5)的平均塊乘以一個(gè)包含噪聲的輸入DCT塊而得到平均值。然后,在DCT塊中進(jìn)行加法和減法運(yùn)算的圖3中的近似廣義維納濾波器方法可以被重新調(diào)整為圖4A,4B或4C中的近似廣義維納濾波器。
通過使用等式(3)和等式(5),可以通過下面的等式(6)來表示在DCT塊中濾波的圖像塊。
=F(k,l)·V(k,l)]]>等式(6)中的F(k,l)可以由下面的等式(7)來表達(dá)。
F(k,l)=p~(k,l)·(1-S(k,l))+S(k,l)=1+S(k,l)·σn2σ2·1ψ(k,l)1+σn2σ2·1ψ(k,l)---(7)]]>如等式(6)所示,整個(gè)的濾波過程可以被簡化為F(k,l)的乘法。等式(7)顯示F(k,l)是由信噪比(SNR)、協(xié)方差矩陣、平均值矩陣共同確定的。
為了確定F(k,l),必須獲得平均值矩陣S(k,l)。在本實(shí)施例中,在關(guān)于平均值矩陣S(k,l)的所有可能候選中,選擇滿足等式(5)的一個(gè)??梢杂孟旅娴牡仁?8)來表示平均矩陣S(k,l)。等式(8)顯示了可以在DCT塊中采用的平均矩陣S(k,l)的多種形式中最簡單的一種。
S(k,l)=1000000000000000000000000000000000000000000000000000000000000000---(8)]]>
下文中,將參考圖4和5更加詳細(xì)地描述在用于編碼運(yùn)動圖像的裝置中進(jìn)行的預(yù)處理過程。
如上所述,可以通過將圖像塊與DCT值相乘來對平均值不為0的圖像塊進(jìn)行近似廣義維納濾波處理。
圖4A到4C是在用于編碼運(yùn)動圖像的裝置中的幾種不同類型的近似廣義維納濾波器的方框圖。更特別的是,圖4A到4C描述了一種處理內(nèi)部塊的編碼裝置的結(jié)構(gòu)。圖4A和4B描述了通過對DCT塊的內(nèi)部塊進(jìn)行濾波,并對濾波后的內(nèi)部塊進(jìn)行量化和可變長度編碼(VLC)而不對該濾波后的內(nèi)部塊進(jìn)行逆DCT來編碼內(nèi)部塊。換句話說,圖4A和4B描述了通過用F(k,l)乘以DCT系數(shù)來完成濾波。同時(shí),通過參考量化表用某一數(shù)值去乘或去除DCT系數(shù)來執(zhí)行量化。如圖4C所示,通過用F(k,l)乘以DCT系數(shù)來進(jìn)行的濾波和通過用某一數(shù)值乘以DCT系數(shù)來進(jìn)行的量化可以結(jié)合為一個(gè)操作。
如圖5所示,在圖4A到4C中所描述的本發(fā)明的構(gòu)想可以直接應(yīng)用到當(dāng)用于編碼運(yùn)動圖像的裝置處理一個(gè)中間塊的場合,只要已經(jīng)從運(yùn)動補(bǔ)償塊信息P(m,n)中去除了噪聲。
依賴于輸入圖像塊是中間塊還是內(nèi)部塊來確定協(xié)方差值ψ(k,l)。因此,圖5中的F(k,l)可以依賴于所述輸入圖像塊是中間塊還是內(nèi)部塊而變化。
下文中,將參考下面的等式(9)詳細(xì)描述一種獲取多個(gè)內(nèi)部塊或中間塊的估計(jì)的變化量的方法,其中已從所述多個(gè)內(nèi)部塊或中間塊的每一個(gè)中減去了它們的平均值。假設(shè)S表示一個(gè)已經(jīng)從其中減去了相應(yīng)塊的平均值的N×N(其中N=8)的塊,可以使用等式(9)獲得該N×N塊的可變矩陣。
C^=12N2trace(STS)(STS+SST)---(9)]]>W.Niehsen和M.Brunig在“運(yùn)動補(bǔ)償?shù)膸町惖膮f(xié)方差分析(CovarianceAnalysis of Motion-compensated Frame Differences)”,IEEE Trans.Circ.Syst.For Video Technol.,1999年6月,中已經(jīng)公開了等式(9)。
通過將等式(9)應(yīng)用于實(shí)驗(yàn)圖像的變化,可以得到一個(gè)估計(jì)的變化量。當(dāng)原始圖像塊為內(nèi)部塊時(shí),原始圖像被劃分為8×8的塊,并且隨后計(jì)算出每個(gè)8×8的塊的變化量。另一方面,當(dāng)原始圖像塊為中間塊時(shí),通過將上面的等式(9)應(yīng)用于每一個(gè)被確定為中間塊的圖像塊來計(jì)算估計(jì)的變化量。
通過使用估計(jì)的協(xié)方差值,可以得到等式R=E[yyT]。下面,通過對R執(zhí)行DCT,可以得到等式ψ=ARA*T。
下面將描述一種計(jì)算等式(7)中的 的方法。
在等式7中,可以通過使用噪聲測量器來獲取噪聲變化量σn2。假定噪聲和原始圖像象素是獨(dú)立的隨機(jī)變量,則可以使用下面的等式(10)計(jì)算出原始圖像的變化量σ2的估計(jì)值 在等式(10)中,σz2表示每一個(gè)宏塊(MB)的變化量。在用于編碼運(yùn)動圖像的典型裝置中,以逐個(gè)宏塊的方式來計(jì)算σz2。在本實(shí)施例中,假定相同宏塊中的8×8的塊具有相同的變化量。從而,不需要進(jìn)行附加的計(jì)算以獲得每一個(gè)8×8塊的變化量。
圖6是根據(jù)本發(fā)明的實(shí)施例來編碼運(yùn)動圖像的裝置的框圖,其考慮輸入圖像的特征而對該輸入圖像進(jìn)行編碼。
在本實(shí)施例中,在量化矩陣中適當(dāng)?shù)姆从沉税谳斎雸D像中的噪聲的級別。
下文中,將參考圖1到圖6詳細(xì)描述根據(jù)本發(fā)明優(yōu)選實(shí)施例的、用于編碼運(yùn)動圖像的裝置的結(jié)構(gòu)和操作。
圖6所示的裝置包括分別對應(yīng)于圖1的編碼單元120中的DCT單元122、量化單元124、VLC單元134、逆量化單元126、逆DCT單元128、幀存儲器130以及運(yùn)動估計(jì)和補(bǔ)償單元132的離散余弦變換單元610、量化單元(Q)620、可變長度編碼單元(VLC)670、逆量化單元(IQ)630、逆DCT單元(IDCT)640、幀存儲器單元650以及運(yùn)動估計(jì)和補(bǔ)償單元660。另外,該裝置進(jìn)一步包括噪聲估計(jì)單元680、量化加權(quán)矩陣確定單元692和量化加權(quán)矩陣存儲單元694。
因?yàn)镈CT單元610、逆DCT單元(IDCT)640、幀存儲器單元650以及運(yùn)動估計(jì)和補(bǔ)償單元660提供和圖1中它們各自的對應(yīng)部分相同的功能,因此不再重復(fù)它們的描述。
量化加權(quán)矩陣確定單元692基于從噪聲估計(jì)單元680接收到的噪聲變化量σn2以及從運(yùn)動估計(jì)和補(bǔ)償單元660接收到的預(yù)定的宏塊的變化量σz2,來確定相應(yīng)于預(yù)定的宏塊的量化加權(quán)矩陣。然后,量化加權(quán)矩陣確定單元692將相應(yīng)于確定的量化加權(quán)矩陣的索引信息發(fā)送到量化加權(quán)矩陣存儲單元694和VLC單元670。
下面,將對基于從噪聲估計(jì)單元680接收到的σn2以及從運(yùn)動估計(jì)和補(bǔ)償單元660接收到的σz2來確定相應(yīng)于預(yù)定的宏塊的量化加權(quán)矩陣的方法進(jìn)行詳細(xì)的描述。
如上面參考等式(8)以及圖4和圖5所描述的,可以通過等式(7)來確定F(k,l)。一旦確定了F(k,l),則在量化過程中,用F(k,l)去乘8×8塊的DCT系數(shù)V(k,l),并用預(yù)定的量化加權(quán)矩陣去除所得的相乘結(jié)果 圖6所示的裝置將用DCT系數(shù)V(k,l)去乘F(k,l)的處理和用預(yù)定的量化加權(quán)矩陣去除 的處理合并為一個(gè)單一處理,并執(zhí)行這一處理。換句話說,如果用Q(k,l)來表示加權(quán)矩陣QT的(k,l)的位置分量,那么(k,l)的位置在新的量化加權(quán)矩陣QT’中為Q(k,l)/F(k,l)。
在本實(shí)施例中,通過將兩個(gè)分離的處理合并為一個(gè)單一的處理,預(yù)先計(jì)算出利用σn2和σz2獲得的多個(gè)F矩陣,然后利用所述多個(gè)F矩陣來計(jì)算新的量化加權(quán)矩陣QT’并隨后將其存儲在量化加權(quán)矩陣存儲單元694中。
另外,在本實(shí)施例中,利用σn2和σz2所獲得的五個(gè)新的量化加權(quán)矩陣被存儲在量化加權(quán)矩陣存儲單元694中。一旦σn2和σz2被確定,則可以使用等式(10)計(jì)算 的值。
如等式(7)所示,F(xiàn)(k,l)由S(k,l),ψ(k,l)和 來確定。使用等式(8)計(jì)算S(k,l),并取決于輸入圖像是內(nèi)部塊還是中間塊來變化地設(shè)定ψ(k,l)。因此,只剩一個(gè)變量來確定F(k,l),即 在本實(shí)施例中,提供了 的五個(gè)不同的估計(jì)值以及它們各自的量化加權(quán)矩陣QT’。所提供的量化加權(quán)矩陣QT’存儲在量化加權(quán)矩陣存儲單元694中。
量化加權(quán)矩陣確定單元692基于從噪聲估計(jì)單元680接收的σn2以及從運(yùn)動估計(jì)和補(bǔ)償單元660接收的σz2來量化 將量化后的結(jié)果作為相應(yīng)于預(yù)定的宏塊的量化矩陣的索引信息發(fā)送到量化加權(quán)矩陣存儲單元692和VLC單元670。
舉例來說,如果存儲在量化加權(quán)矩陣存儲單元694中的量化加權(quán)矩陣根據(jù) 被分為五個(gè)不同的類型,則以五個(gè)級別來執(zhí)行 均量化,并且五個(gè)量化加權(quán)矩陣的每一個(gè)的索引信息被設(shè)置為0、1、2、3或4。
在一個(gè)存在有大量噪聲的圖像中,特別是對于具有很小的變化量的塊來說, 是非常大的。當(dāng) 非常大時(shí),F(xiàn)(k,l)接近0,導(dǎo)致嚴(yán)重的區(qū)塊現(xiàn)象(blocking phenomenon)。為了防止所述區(qū)塊現(xiàn)象,如下面的等式(11)所示使用了Tcutoff。
σn2σ2=min(Tcutoff,σn2σ2)---(11)]]>通常,Tcutoff具有介于1和2之間的數(shù)值。
量化加權(quán)矩陣存儲單元694將與從量化加權(quán)矩陣確定單元692接收到的索引信息相對應(yīng)的量化加權(quán)矩陣發(fā)送到量化單元620和逆量化單元630。
量化單元620使用從量化加權(quán)矩陣存儲單元694接收到的量化加權(quán)矩陣來量化預(yù)定的宏塊。
逆量化單元630使用接收到的量化加權(quán)值來逆量化預(yù)定的宏塊。
VLC單元670對由量化單元620量化后的輸入圖像數(shù)據(jù)執(zhí)行VLC,并將從量化加權(quán)矩陣確定單元692中接收到的量化加權(quán)矩陣的索引信息插入到宏塊的首部。
在本實(shí)施例中,將相應(yīng)的量化加權(quán)矩陣的索引信息插入到宏塊的首部并發(fā)送該宏塊的首部。如果在量化加權(quán)矩陣存儲單元694中存儲有十個(gè)量化加權(quán)矩陣,那么每一個(gè)宏塊需要4位數(shù)據(jù)。
假定相鄰的宏塊之間有相似的圖像特征并且按照推測在它們的索引值之間存在相關(guān)性。因此,可以將一個(gè)宏塊的索引值和相鄰宏塊的索引值之間的差異用作索引信息。在將單一的量化加權(quán)矩陣應(yīng)用至整個(gè)序列的情況下,將被傳送的索引信息的數(shù)量會大大的縮減。
在本實(shí)施例中,存儲在量化加權(quán)矩陣存儲單元694中的多個(gè)量化加權(quán)矩陣還應(yīng)當(dāng)被存儲在解碼單元中。也可以使用基于逐個(gè)圖像的方式利用圖像擴(kuò)展首部發(fā)送到解碼單元或者基于逐個(gè)序列的方式利用序列擴(kuò)展首部發(fā)送到解碼單元的多個(gè)量化加權(quán)矩陣。
如上所述,可以從輸入圖像中去除噪聲,并且根據(jù)包含在輸入圖像中的噪聲的級別通過適當(dāng)?shù)貙⒘炕仃噾?yīng)用到每一個(gè)宏塊來提高對輸入圖像進(jìn)行編碼的效率。
對于用戶來說,也可以任意地確定量化加權(quán)矩陣。在本實(shí)施例中,已經(jīng)將噪聲去除描述為是對DCT塊中的輸入圖像塊的Y分量進(jìn)行的。然而,噪聲去除也可以應(yīng)用到輸入圖像塊的U或V分量,在這種情況下,對于輸入圖像塊的U或V分量來說,還專門地需要附加的量化加權(quán)矩陣。
圖7是根據(jù)本發(fā)明的另外一個(gè)優(yōu)選實(shí)施例的、用于編碼運(yùn)動圖像的裝置的方框圖,其考慮輸入圖像的特征而對輸入圖像進(jìn)行編碼。
更為特別的是,在輸入圖像的不同的特征中,本實(shí)施例中考慮了輸入圖像的每一個(gè)宏塊的邊緣特征。
參照圖7,根據(jù)本發(fā)明的另一個(gè)實(shí)施例的、用于編碼運(yùn)動圖像的裝置包括分別與圖1的編碼單元120中的DCT單元122、量化單元124、VLC單元134、逆量化單元126、逆DCT單元128、幀存儲器130以及運(yùn)動估計(jì)和補(bǔ)償單元132相對應(yīng)的DCT單元710、量化單元720、VLC單元770、逆量化單元730、逆DCT單元740、幀存儲器單元750以及運(yùn)動估計(jì)和補(bǔ)償單元760。另外,該裝置進(jìn)一步包括量化矩陣確定單元780和量化矩陣存儲單元790。因?yàn)镈CT單元710、逆DCT單元740、幀存儲器單元750、運(yùn)動估計(jì)和補(bǔ)償單元760以及VLC單元770提供和圖1中他們各自的對應(yīng)部分相同的功能,因此不再重復(fù)它們的描述。
量化矩陣確定單元780考慮輸入圖像的特征為每一個(gè)宏塊選擇最佳量化矩陣,然后將所選擇的量化矩陣的索引信息發(fā)送到量化矩陣存儲單元790和VLC單元770。
量化矩陣確定單元780考慮每一個(gè)宏塊的邊緣特征,將其作為從預(yù)定數(shù)量的量化矩陣中選擇一個(gè)的基準(zhǔn)。
下面將詳細(xì)描述考慮宏塊的邊緣特征來選擇一個(gè)量化矩陣的方法。
當(dāng)輸入圖像的預(yù)定的宏塊是內(nèi)部塊時(shí),將邊緣檢測器用作蘇貝爾(sobel)算子來計(jì)算預(yù)定的宏塊的每一個(gè)象素中的邊緣的大小和方向。等式(12)可以表示所述sobel運(yùn)算。
H1=-101-202-101,H2=-1-2-1002121---(12)]]>
量化矩陣確定單元780使用等式(12)來計(jì)算垂直邊的長度和水平邊的長度,并且使用水平邊和垂直邊的長度來計(jì)算預(yù)定的宏塊的邊緣的強(qiáng)度和方向。之后,量化矩陣確定單元780考慮預(yù)定宏塊的邊緣的強(qiáng)度和方向以及編碼效率,從預(yù)定數(shù)量的量化矩陣中選擇一個(gè)。換句話說,在預(yù)定的宏塊包含水平或者垂直邊的情況下,量化矩陣確定單元780全面考慮預(yù)定宏塊的水平或者垂直邊來選擇一個(gè)能夠使能量化的量化矩陣。
在預(yù)定的宏塊為中間塊的情形下,將這樣的邊緣檢測器用作sobel算子也可以獲得預(yù)定的宏塊中包含的一個(gè)邊的強(qiáng)度和方向。
在本實(shí)施例中,將sobel檢測器用來計(jì)算在預(yù)定宏塊中包含的一個(gè)邊的強(qiáng)度和方向。然而,也可以使用例如差分濾波器或羅波特濾波器的空間濾波器來計(jì)算在預(yù)定宏塊中包含的邊的強(qiáng)度和方向。
另外,在本實(shí)施例中,考慮預(yù)定的宏塊的邊緣特征來選擇量化矩陣。然而,在為預(yù)定宏塊適當(dāng)?shù)剡x擇最優(yōu)的量化矩陣時(shí),可以考慮會影響編碼效率或輸出圖像質(zhì)量的預(yù)定宏塊的其它特征。
量化矩陣存儲單元790基于從量化矩陣確定單元780接收到的索引信息來選擇量化矩陣,并將所選擇的量化矩陣傳送到量化單元720和逆量化單元730。
量化單元720使用從量化矩陣存儲單元790接收到的量化矩陣來進(jìn)行量化。
逆量化單元730使用從量化矩陣存儲單元790接收到的量化矩陣來進(jìn)行逆量化。
VLC單元770對從量化單元720接收到的量化后的輸入數(shù)據(jù)以及從量化加權(quán)矩陣確定單元780接收到的對應(yīng)于預(yù)定宏塊的量化矩陣的索引信息進(jìn)行VLC。所述索引信息被插入到宏塊的首部。
在本實(shí)施例中,將對應(yīng)于預(yù)定宏塊的量化加權(quán)矩陣的索引信息插入到預(yù)定的宏塊的首部,并隨后進(jìn)行發(fā)送??梢詫⒁粋€(gè)宏塊的索引值和相鄰的宏塊的索引值之間的差異用作索引信息。
在本實(shí)施例中,存儲在量化矩陣存儲單元790中的多個(gè)量化加權(quán)矩陣也存儲在解碼單元中。但是,也可以使用以逐圖像的方式使用圖像擴(kuò)展首部發(fā)送到解碼單元或者以逐序列的方式使用序列擴(kuò)展首部發(fā)送到解碼單元的多個(gè)量化加權(quán)矩陣。
圖8是根據(jù)本發(fā)明一個(gè)實(shí)施例的用于解碼運(yùn)動圖像的裝置的框圖。參照圖8,該裝置包括分別與圖1的解碼單元140中的可變長度解碼單元142、逆量化單元144、逆DCT單元146、幀存儲器單元148和運(yùn)動補(bǔ)償單元150相對應(yīng)的可變長度解碼單元810、逆量化單元820、逆DCT單元830、幀存儲單元840和運(yùn)動補(bǔ)償單元850。另外,該裝置進(jìn)一步包括量化加權(quán)矩陣確定單元860。逆DCT單元830、幀存儲器單元840和運(yùn)動補(bǔ)償單元850提供和圖1中他們各自的對應(yīng)部分相同的功能,因此不再重復(fù)他們的描述。
可變長度解碼單元810對輸入流進(jìn)行可變長度解碼、從預(yù)定的宏塊的首部提取與該輸入流相對應(yīng)的預(yù)定宏塊的量化加權(quán)矩陣的索引信息,并且輸出該提取的索引信息至量化加權(quán)矩陣存儲單元860。
量化加權(quán)矩陣存儲單元860將與從可變長度解碼單元810接收的索引信息相對應(yīng)的量化加權(quán)矩陣輸出到逆量化單元820。量化加權(quán)矩陣存儲單元860存儲根據(jù)由編碼單元處理的輸入圖像的特征來分類的多個(gè)量化加權(quán)矩陣,所述由編碼單元處理的輸入圖像的特征例如作為輸入圖像變化量和該輸入圖像的邊緣特征之間的比值的噪聲變化量。
可以以逐圖像的方式使用圖像擴(kuò)展首部來發(fā)送在量化加權(quán)矩陣存儲單元860中存儲的多個(gè)量化加權(quán)矩陣,或以逐序列的方式使用序列擴(kuò)展首部將所述量化加權(quán)矩陣發(fā)送到解碼單元。如由圖8中的虛線所標(biāo)記的,將多個(gè)量化加權(quán)矩陣從可變長度解碼單元810發(fā)送到量化加權(quán)矩陣存儲單元860。
本發(fā)明能夠應(yīng)用到不同類型的用于編碼和/或解碼運(yùn)動圖像的方法和裝置中,例如MPEG-1,MPEG-2或MPEG-4。另外,本發(fā)明可以實(shí)現(xiàn)為寫入在計(jì)算機(jī)可讀的記錄介質(zhì)上的計(jì)算機(jī)可讀代碼。所述計(jì)算機(jī)可讀記錄介質(zhì)包括任何類型的、可以以計(jì)算機(jī)可讀方式在其上寫入數(shù)據(jù)的記錄設(shè)備。舉例來說,計(jì)算機(jī)可讀記錄介質(zhì)包括ROM、RAM、CD-ROM、磁帶、硬盤、軟盤、閃存、光數(shù)據(jù)存儲器和載波(例如通過因特網(wǎng)進(jìn)行的數(shù)據(jù)傳輸)。另外,計(jì)算機(jī)可讀的記錄介質(zhì)可以經(jīng)由相互通過網(wǎng)絡(luò)方式連接的多個(gè)計(jì)算機(jī)系統(tǒng)來分發(fā),以便以分散的方式將計(jì)算機(jī)可讀代碼存儲在計(jì)算機(jī)可讀記錄介質(zhì)上。
如上所述,在根據(jù)本發(fā)明實(shí)施例的編碼和/或解碼運(yùn)動圖像的方法中,考慮輸入圖像的特征將量化矩陣適當(dāng)?shù)貞?yīng)用到該輸入圖像的每一個(gè)宏塊中。因此,可能提高編碼輸入圖像的效率和性能。
雖然已經(jīng)示出和描述了本發(fā)明的一些實(shí)施例,但本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)明白,可以在不背離本發(fā)明的原理和精神的前提下對這些實(shí)施例作出改變,其中本發(fā)明的范圍由隨后的權(quán)利要求及其等價(jià)物所限定。
權(quán)利要求
1.一種通過適應(yīng)性地將多個(gè)量化加權(quán)矩陣應(yīng)用到宏塊來解碼運(yùn)動圖像的方法,該方法包括接收輸入圖像的編碼流,該編碼流包括至少一個(gè)宏塊,每個(gè)宏塊包括指定多個(gè)量化加權(quán)矩陣的信息,其中所述多個(gè)量化加權(quán)矩陣包括專門地用于輸入圖像的U和V分量的量化矩陣;對于編碼的圖像數(shù)據(jù)執(zhí)行可變長度解碼;和通過使用為相應(yīng)宏塊指定的多個(gè)量化加權(quán)矩陣來逆量化每個(gè)可變長度解碼的宏塊。
2.根據(jù)權(quán)利要求1所述的方法,其中所述執(zhí)行可變長度解碼包括從宏塊的首部提取多個(gè)量化加權(quán)矩陣的每一個(gè)的索引信息。
3.根據(jù)權(quán)利要求2所述的方法,其中所述索引信息是與一個(gè)宏塊對應(yīng)的量化加權(quán)矩陣的索引和與相鄰宏塊對應(yīng)的量化加權(quán)矩陣的索引之間的差異。
4.一種通過適應(yīng)性地應(yīng)用被應(yīng)用于宏塊的多個(gè)量化加權(quán)矩陣來解碼運(yùn)動圖像的裝置,該裝置包括可變長度解碼單元,用于接收編碼的圖像流,以對輸入圖像流執(zhí)行可變長度解碼,所述編碼流包括至少一個(gè)宏塊,每個(gè)宏塊包括指定多個(gè)量化加權(quán)矩陣的信息;量化加權(quán)矩陣存儲單元,用于存儲量化加權(quán)矩陣,以根據(jù)所述信息來選擇多個(gè)量化加權(quán)矩陣中的一個(gè),并且輸出選擇的量化加權(quán)矩陣;和逆量化單元,用于使用從量化加權(quán)矩陣存儲單元輸出的量化加權(quán)矩陣來逆量化可變長度解碼的圖像流的每一個(gè)宏塊,其中多個(gè)量化加權(quán)矩陣包括專門地用于輸入圖像的U和V分量的量化矩陣。
5.根據(jù)權(quán)利要求4所述的裝置,其中所述可變長度解碼單元從宏塊的首部提取多個(gè)量化加權(quán)矩陣的每一個(gè)的索引信息。
6.根據(jù)權(quán)利要求5所述的裝置,其中所述索引信息是與一個(gè)宏塊對應(yīng)的量化加權(quán)矩陣的索引和與相鄰宏塊對應(yīng)的量化加權(quán)矩陣的索引之間的差異。
全文摘要
一種通過適應(yīng)性地將多個(gè)量化加權(quán)矩陣應(yīng)用到宏塊來解碼運(yùn)動圖像的方法和裝置。所述方法包括接收輸入圖像的編碼流,該編碼流包括至少一個(gè)宏塊,每個(gè)宏塊包括指定多個(gè)量化加權(quán)矩陣的信息,其中所述多個(gè)量化加權(quán)矩陣包括專門地用于輸入圖像的U和V分量的量化矩陣;對于編碼的圖像數(shù)據(jù)執(zhí)行可變長度解碼;和通過使用為相應(yīng)宏塊指定的多個(gè)量化加權(quán)矩陣來逆量化每個(gè)可變長度解碼的宏塊。
文檔編號H04N7/24GK1758764SQ20051011614
公開日2006年4月12日 申請日期2004年1月14日 優(yōu)先權(quán)日2003年1月14日
發(fā)明者宋秉哲, 千畺旭 申請人:三星電子株式會社