亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于圖像和視頻壓縮的正交變換方法

文檔序號:7954359閱讀:255來源:國知局
專利名稱:用于圖像和視頻壓縮的正交變換方法
技術(shù)領(lǐng)域
本發(fā)明涉及信息技術(shù)領(lǐng)域,具體涉及一種用于數(shù)字圖像和數(shù)字視頻壓縮編碼變換方法。
背景技術(shù)
隨著計算機(jī)、微電子、信息處理、通信以及激光等技術(shù)的迅猛發(fā)展,集圖文、聲音、圖像于一體的多媒體技術(shù)更是迅速滲透到計算機(jī)、通信、廣播電視以及消費娛樂業(yè),在上述各領(lǐng)域中,越來越多地采用通過數(shù)字信號傳輸之?dāng)?shù)字設(shè)備。數(shù)字信號有很多優(yōu)點,但當(dāng)模擬信號數(shù)字化后其頻帶會大大加寬,如一路6MHz的普通電視信號數(shù)字化后,其數(shù)碼率將高達(dá)167Mbps,這對儲存器容量和傳輸帶寬要求很大,從而使數(shù)字信號失去實用價值。數(shù)字壓縮技術(shù)很好地解決了上述困難,壓縮后信號所占用的頻帶大大低于原模擬信號的頻帶。因此說,數(shù)字壓縮編碼技術(shù)是使數(shù)字信號走向?qū)嵱没年P(guān)鍵技術(shù)之一,數(shù)字圖像和數(shù)字視頻之所以能傳輸和保存的一個關(guān)鍵因素在于數(shù)字圖像和數(shù)字視頻的這種可壓縮性。這種壓縮是以降低圖像或視頻的質(zhì)量為前提的,以犧牲圖像或視頻的質(zhì)量換取寶貴的存儲空間或傳輸帶寬。當(dāng)然,這種壓縮不能過度,以致圖像或視頻的視覺效果變得不可接受,這就要求在一定的質(zhì)量條件下,不斷提高壓縮效率。此外,壓縮行為應(yīng)該是規(guī)范的,這樣將有利于信息的傳輸與共享。為了規(guī)范這種壓縮編碼行為,目前出臺了不少國際標(biāo)準(zhǔn),如圖像壓縮標(biāo)準(zhǔn)JPEG(國際標(biāo)準(zhǔn)ISO/ICE IS 10918,大量使用在數(shù)碼相機(jī)和國際互聯(lián)網(wǎng)),視頻壓縮標(biāo)準(zhǔn)MPEG-1(國際標(biāo)準(zhǔn)ISO/ICE 11172,在VCD里使用)、MPEG-2(國際標(biāo)準(zhǔn)ISO/ICE 13818,使用在DVD和數(shù)字電視里)和MPEG-4(國際標(biāo)準(zhǔn)ISO/ICE 14496,使用在流媒體技術(shù)中)等。這些標(biāo)準(zhǔn)除了規(guī)范了壓縮行為外,壓縮效率也在不斷提高。如MPEG-2的壓縮效率高于MPEG-1,MPEG-4的壓縮效率高于MPEG-2。
在這些壓縮標(biāo)準(zhǔn)和技術(shù)里,有一個通用的方法,那就是使用了正交變換技術(shù)。目前,在JPEG、MPEG-1、MPEG-2和MPEG-4里,所用的正交變換方法都是離散余弦變換(Discrete Cosine Transformation,簡稱DCT)。DCT是經(jīng)典譜分析常采用的工具,它的問世,對數(shù)字圖像和視頻壓縮技術(shù)而言具有里程碑式的意義。它是先將整體圖像分成N×N像素塊,然后對N×N像素塊逐一進(jìn)行離散余弦變換。然后舍棄對視覺不敏感的的頻率信息,只保留最為重要的數(shù)據(jù)信息。這樣,壓縮過程對圖像細(xì)膩平滑程度方面必然有所損失。人們也試圖研究和尋找其它更好更有效的正交變換來取代DCT,如傅立葉變換,離散正弦變換,哈達(dá)姆變換等等。可這些變換在性能上都無法超越DCT,甚至相差還較遠(yuǎn)。理論上也有一些證據(jù)證明DCT“幾乎是最優(yōu)變換”了。所以,三十幾年來,全世界一直在研究在圖像和視頻壓縮上是否有更好的變換這個問題,并沒有得到一個肯定的答案。

發(fā)明內(nèi)容本發(fā)明所要解決的技術(shù)問題是提供一種與離散余弦變換不同之用于圖像和視頻壓縮的正交變換方法,在壓縮性能和軟硬件實現(xiàn)代價上都優(yōu)于離散余弦變換。
本發(fā)明所提出的技術(shù)方案是一種用于圖像和視頻壓縮的正交變換方法,先將圖像分成8×8的小塊M,然后用8×8正交變換矩陣D對每一個圖像塊M作二維變換,得到變換系數(shù)矩陣N,再對N的每一個系數(shù)量化后熵編碼,其特征在于所述變換系數(shù)矩陣表達(dá)式為N=DMDT,其中DT為D之轉(zhuǎn)置矩陣;所述8×8正交變換矩陣D為D=1/81/81/81/81/81/81/81/8-7/168-5/168-3/168-1/1681/1683/1685/1687/1687/1681/168-3/168-5/168-5/168-3/1681/1687/168-7/2645/2647/2643/264-3/264-7/264-5/2647/2647/616-13/616-3/6169/6169/616-3/616-13/6167/616-7/218423/2184-17/2184-15/218415/218417/2184-23/21847/21841/264-5/2649/264-5/264-5/2649/264-5/2641/264-1/34327/3432-21/343235/3432-35/343221/3432-7/34321/3432.]]>上述矩陣D中,任何一行全體改變符號,為與該矩陣D之等效變換;
上述矩陣D之近似矩陣為0.3535530.3535530.3535530.3535530.3535530.3535530.3535530.353553-0.540062-0.385758-0.231455-0.07715170.07715170.2314550.3857580.5400620.5400620.0771517-0.231455-0.385758-0.385758-0.2314550.07715170.540062-0.430820.3077290.430820.184637-0.184637-0.43082-0.3077290.430820.282038-0.523785-0.1208730.362620.36262-0.120873-0.5237850.282038-0.1497860.492155-0.363766-0.320970.320970.363766-0.4921550.1497860.0615457-0.3077290.553912-0.307729-0.3077290.553912-0.3077290.0615457-0.01706970.119488-0.3584640.59744-0.597440.358464-0.1194880.0170697]]>本發(fā)明對用于靜止圖像壓縮編碼的量化矩陣為QUAND=17172627342636392221252532364154192927334138505034263334366252462732374151716164292745625762927531455060809090755586708090858080]]>本發(fā)明對經(jīng)過熵解碼和反量化后的數(shù)據(jù)塊 亦可用上述矩陣D正交變換,其二維反變換恢復(fù)圖像數(shù)據(jù)塊為M~=DTN~D.]]>作為本發(fā)明之進(jìn)一步方案,用于軟件和集成電路實現(xiàn)的變換整數(shù)實現(xiàn)表達(dá)式為設(shè)d1=8,d2=168,d3=168,d4=264,d5=616,d6=2184,d7=264,d8=3432,]]>定義一個對角矩陣(E)和整數(shù)矩陣(P)為
E=1/d11/d2O1/d31/d41/d5O1/d61/d71/d8,P=11111111-7-5-3-1135771-3-5-5-317-7573-3-7-577-13-399-3-137-723-17-151517-2371-59-5-59-51-17-2135-3521-71]]>將矩陣(D)分解為D=EP,則變換系數(shù)矩陣表達(dá)式N=DMDT為N=DMDT=E(PMPT)E,其中的PMPT為僅含加法和移位的整數(shù)運算,非常方便。
同時,所述表達(dá)式N=E(PMPT)E具有反變換。
本發(fā)明基于8-進(jìn)正交小波理論,設(shè)計了一個新的8×8正交變換矩陣,用這個正交變換壓縮圖像和視頻,不僅能得到比DCT更好的壓縮效果,而且在軟件和集成電路實現(xiàn)上更加經(jīng)濟(jì)和高效?;诒景l(fā)明,可以產(chǎn)生一條與基于離散余弦變換完全不同的新的壓縮編碼技術(shù)方案,且性能優(yōu)于被廣泛使用的離散余弦變換的性能。

圖1為JPEG壓縮編碼流程;圖2為本發(fā)明正交矩陣變換與JPEG2000正交矩陣變換壓縮圖像平均峰值信噪比圖。
具體實施方式在圖像和視頻壓縮中,圖像壓縮是最核心的基礎(chǔ),正交變換方法是圖像和視頻壓縮技術(shù)中的最核心的技術(shù)。在圖像壓縮標(biāo)準(zhǔn)JPEG(國際標(biāo)準(zhǔn)ISO/ICE IS 10918)和視頻壓縮標(biāo)準(zhǔn)MPEG-1(國際標(biāo)準(zhǔn)ISO/ICE 11172)、MPEG-2(國際標(biāo)準(zhǔn)ISO/ICE 13818)以及MPEG-4(國際標(biāo)準(zhǔn)ISO/ICE 14496)里,目前,所采用的正交變換方法是8×8的離散余弦變換(DCT,即Discrete Cosine Transform)。
本發(fā)明設(shè)計了一個8×8的正交變換,完全不同于8×8的離散余弦變換DCT,具有優(yōu)于DCT之壓縮性能。
下面詳述本發(fā)明。
(1)本發(fā)明之正交變換矩陣用D表示,即D=1/81/81/81/81/81/81/81/8-7/168-5/168-3/168-1/1681/1683/1685/1687/1687/1681/168-3/168-5/168-5/168-3/1681/1687/168-7/2645/2647/2643/264-3/264-7/264-5/2647/2647/616-13/616-3/6169/6169/616-3/616-13/6167/616-7/218423/2184-17/2184-15/218415/218417/2184-23/21847/21841/264-5/2649/264-5/264-5/2649/264-5/2641/264-1/34327/3432-21/343235/3432-35/343221/3432-7/34321/3432]]>從數(shù)學(xué)理論中可以知道,對于一個離散序列[bk],k=1,...,8,如果Σk=07knbk+1=0]]>對n=0,1,...,r-1成立,我們就說[bk]具有r階消失矩。該定義和小波理論的連續(xù)消失矩概念是等價的。
假設(shè)8-進(jìn)小波的一支低通濾波器為[hi](i為整數(shù)),七支高通濾波器為[gi,j](i為整數(shù),j=1,...,7)。我們考慮一個特殊的8-進(jìn)正交小波系統(tǒng),它的低通和所有高通濾波器的長度都為8,即i=1,...,8。同時,對每個j(j=1,...,7),[gi,j]有j階消失矩。
現(xiàn)在,用[hi]作為矩陣D的第1行,用[gi,j]作為矩陣D的第j+1行(j=1,...,7),因此,根據(jù)8-進(jìn)小波理論,所得到的矩陣D就是正交的。
關(guān)于D的正交性,我們只需驗證DDT=I即可,這里DT是D的轉(zhuǎn)置矩陣,I是一個單位矩陣。這個矩陣的特征可以概括為一個8×8的正交矩陣,它的第i行具有i-1階消失矩(i=1,...,8)。這樣的矩陣在每一行的系數(shù)可以整體取反的意義下是唯一的。
因此,上述矩陣中任何一行全體改變符號,被視為等效變換。如第二行改變符號后的形式為1/81/81/81/81/81/81/81/8-7/168-5/168-3/168-1/1681/1683/1685/1687/1687/1681/168-3/168-5/168-5/168-3/1681/1687/168-7/2645/2647/2643/264-3/264-7/264-5/2647/2647/616-13/616-3/6169/6169/616-3/616-13/6167/616-7/218423/2184-17/2184-15/218415/218417/2184-23/21847/21841/264-5/2649/264-5/264-5/2649/264-5/2641/264-1/34327/3432-21/343235/3432-35/343221/3432-7/34321/3432.]]>同樣地,其他任意一行全體改變符號,也是與D等效的。
在軟件或集成電路實現(xiàn)中,都是使用上述變換的一個近似。如下面的矩陣就是D的一個近似0.3535530.3535530.3535530.3535530.3535530.3535530.3535530.353553-0.540062-0.385758-0.231455-0.07715170.07715170.2314550.3857580.5400620.5400620.0771517-0.231455-0.385758-0.385758-0.2314550.07715170.540062-0.430820.3077290.430820.184637-0.184637-0.43082-0.3077290.430820.282038-0.523785-0.1208730.362620.36262-0.120873-0.5237850.282038-0.1497860.492155-0.363766-0.320970.320970.363766-0.4921550.1497860.0615457-0.3077290.553912-0.307729-0.3077290.553912-0.3077290.0615457-0.01706970.119488-0.3584640.59744-0.597440.358464-0.1194880.0170697.]]>如果某個矩陣的元素小數(shù)點后的5位有效數(shù)字與D的元素小數(shù)點后的5位有效數(shù)字完全相同,這樣的變換與D是等效的。對于改變D的某行的符號得到的等效變換的此類情形也一樣。
(2)對被壓縮的圖像數(shù)據(jù)塊M(8×8矩陣),用(1)中的正交變換對這個數(shù)據(jù)塊作二維變換,變換結(jié)果用N(8×8矩陣)表示,即N=DMDT,以便完成后續(xù)的壓縮編碼過程。這里,“DT”表示D的轉(zhuǎn)置矩陣。
(3)在(2)的基礎(chǔ)上,具體實現(xiàn)N=DMDT有許多等效的矩陣運算方法,即相同的輸入M導(dǎo)致相同的輸出N的實現(xiàn)方法,這樣的等效方法視為同一方法。同時,該變換每一行的元素具有對稱性或反對稱性。這個性質(zhì)有利于快速實現(xiàn)變換或反變換運算,在增加少量存儲器的前提下,計算量減半。
為了說明這個問題,我們用[di,j](i=1,...,8,j=1,...,8)來表示(1)中的矩陣D,用m=[mi](i=1,...,8)來表示一個列向量,用n=[ni](i=1,...,8)來表示變換結(jié)果。我們考慮一個一維變換n=Dm,它的具體表示為ni=Σj=18di,jmj(i=1,...,8).]]>這就是變換的直接計算法。但是,如果我們考慮矩陣D的一些特點,如它的奇數(shù)行是對稱的,即di,j=di+4,j(i=1,3,5,7,j=1,...,8),偶數(shù)行是反對稱的即di,j=-di+4,j(i=2,4,6,8,j=1,...,8),這個變換有另外的等價表示ni=Σj=14di,j(mj+mj+4)(i=1,3,5,7)]]>和ni=Σj=14di,j(mj-mj+4)(i=2,4,6,8)]]>這種實現(xiàn)方法和直接計算方法是不同的,但它們是等效的。對于直接計算方法,用軟件和集成電路實現(xiàn)時,計算量要大些,存儲器需要少些;而對于等效計算方法,計算量要小些,存儲器需要多些。
由大學(xué)線性代數(shù)知識可知,對于二維變換,在實際應(yīng)用中可以轉(zhuǎn)化為16個一維變換來實現(xiàn)。
還有許多其它的等效變換。
(4)在(2)和(3)的基礎(chǔ)上,本發(fā)明提出了一種特定的變換整數(shù)實現(xiàn)方法。設(shè)d1=8,d2=168,d3=168,d4=264,d5=616,d6=2184,d7=264,d8=3432.]]>定義一個對角矩陣E和整數(shù)矩陣P如下E=1/d11/d2O1/d31/d41/d5O1/d61/d71/d8,P=11111111-7-5-3-1135771-3-5-5-317-7573-3-7-577-13-399-3-137-723-17-151517-2371-59-5-59-51-17-2135-3521-71.]]>則(1)中的矩陣可以分解為D=EP,從而(2)中的變換N=DMDT可以寫成N=DMDT=E(PMPT)E。
注意,P的元素都是小整數(shù),M的元素也是整數(shù),在集成電路設(shè)計中,這樣的整數(shù)運算都可以化為移位運算。如35=32+2+1=25+2+1,21=16+4+1=24+22+1,等等。從而(PMPT)可以全是移位運算和加法運算,避免了浮點運算和乘法運算,有利于計算方法的集成電路的高效實現(xiàn)。而矩陣E的左乘和右乘可以和量化步驟合并。
(5)經(jīng)過熵解碼后,對已經(jīng)壓縮了的數(shù)據(jù)塊 用(1)中的正交變換,作如下的二維反變換恢復(fù)圖像數(shù)據(jù)塊M~=DTN~D.]]>這里,“DT”表示D的轉(zhuǎn)置矩陣。
(6)在(5)的基礎(chǔ)上,具體實現(xiàn)M~=DTN~D]]>有許多等效的矩陣運算方法,即相同的輸入 導(dǎo)致相同的輸出 的實現(xiàn)方法。這樣的等效方法視為同一方法。有關(guān)這個問題的理解與(3)類似,但不完全相同。我們同樣只需要考慮一維反變換。記號為n~=[n~i]]]>(i=1,...,8)為輸入列向量,m~=[m~i]]]>(i=1,...,8)表示輸出列向量。一個一維的反變換為m~=DTn~,]]>它的直接計算法是
m~i=Σj=18dj,in~j(i=1,...,8).]]>同樣根據(jù)D的對稱性,我們可以有如下的等效計算方法。計算過程分兩步。首先,計算如下的兩組數(shù)m~i(1)=Σj=1,3,5,7dj,in~j(i=1,2,3,4)]]>和m~i(2)=Σj=2,4,6,8dj,in~j(i=1,2,3,4).]]>然后,計算m~i=m~i(1)+m~i(2)]]>和m~9-i=m~i(1)-m~i(2)(i=1,2,3,4).]]>這個等效反變換節(jié)省了計算量,但增加了存儲器數(shù)量。
由大學(xué)線性代數(shù)知識可知,二維反變換可以轉(zhuǎn)化為16個一維反變換來實現(xiàn)。
還有許多其它等效的反變換。
(7)在(5)和(6)的基礎(chǔ)上,本發(fā)明還可實現(xiàn)反變換整數(shù)運算,這里依舊使用(4)里的記號。同樣,M~=DTN~D=PT(EN~E)P]]>完全是整數(shù)運算。
我們可以對比一下JPEG的DCT與本發(fā)明里矩陣的性質(zhì)差異。下面是著名的8×8離散余弦變換(精確到小數(shù)點后5位有效數(shù)字)DCT8=0.3535530.3535530.3535530.3535530.3535530.3535530.3535530.3535530.4903930.4157350.2777850.0975452-0.0975452-0.277785-0.415735-0.4903930.461940.191342-0.191342-0.46194-0.46194-0.1913420.1913420.461940.415735-0.0975452-0.490393-0.2777850.2777850.4903930.0975452-0.4157350.353553-0.353553-0.3535530.3535530.353553-0.353553-0.3535530.3535530.277785-0.4903930.09754520.415735-0.415735-0.09754520.490393-0.2777850.191342-0.461940.46194-0.191342-0.1913420.46194-0.461940.1913420.0975452-0.2777850.415735-0.4903930.490393-0.4157350..277785-0.0975452.]]>而本發(fā)明D的近似為
0.3535530.3535530.3535530.3535530.3535530.3535530.3535530.353553-0.540062-0.385758-0.231455-0.07715170.07715170.2314550.38575805400620.5400620.0771517-0.231455-0.385758-0.385758-0.2314550.07715170.540062-0.430820.3077290.430820.184637-0.184637-0.43082-0.3077290.430820.282038-0.523785-0.1208730.362620.36262-0.120873-0.5237850.282038-0.1497860.492155-0.363766-0.320970.320970.363766-0.4921550.1497860.0615457-0.3077290.553912-0.307729-0.3077290.553912-0.3077290.0615457-0.01706970.119488-0.3584640.59744-0.597440.358464-0.1194880.0170697.]]>簡單比較可知,除了第1行與本發(fā)明的第1行相同外,其余的行與本發(fā)明的完全不同。所以,這兩個矩陣是完全不同的矩陣。從數(shù)學(xué)特征看,可以驗證,離散余弦變換的第2行到第7行的消失矩的階數(shù)不超過2。這一性質(zhì)反映了兩個變換矩陣的數(shù)學(xué)性質(zhì)的巨大差異。
根據(jù)8-進(jìn)小波理論,DCT8也構(gòu)成一個特殊的8-進(jìn)小波結(jié)構(gòu)。只是本發(fā)明構(gòu)造的變換達(dá)到了最高階數(shù)的消失矩,而DCT8的消失矩就不夠高。在消失矩意義下,本發(fā)明構(gòu)造的變換矩陣是最優(yōu)的。這在理論上解釋了為什么試驗中我們的變換性能要超過DCT8的。
在JPEG、MPEG-1、MPEG-2和MPEG-4里,實施離散余弦變換都是最重要、最基本的一環(huán)。所以,凡所用到離散余弦變換的地方都可以使用本發(fā)明中的變換。利用這個變換,本發(fā)明完成了圖像或視頻的壓縮或解壓縮中最主要的一個環(huán)節(jié),從而可以產(chǎn)生一條與基于離散余弦變換完全不同的新的技術(shù)路線,并且本發(fā)明壓縮編碼方法優(yōu)于傳統(tǒng)的基于離散余弦變換的技術(shù)。當(dāng)然,在下面我們也將看到,由于變換技術(shù)不同,導(dǎo)致壓縮編碼解碼過程中相關(guān)的后續(xù)技術(shù)也產(chǎn)生了相應(yīng)的變化,以利于提高編碼效率。這也是本發(fā)明突出的實質(zhì)性特點。事實上,不同的變換技術(shù)導(dǎo)致不同的量化技術(shù)和不同的編碼技術(shù),變換技術(shù)在壓縮編碼技術(shù)里始終是處于樹根的地位。
本發(fā)明用圖像壓縮編碼作為具體實施例,來檢驗本發(fā)明的編碼效果。為了便于對比,本發(fā)明利用JPEG框架來實施。
在JPEG里,圖像的壓縮流程分為四個大的步驟,如圖1所示,包括離散余弦變換(DCT),量化變換系數(shù),Z字掃描和熵編碼。其具體步驟為先將圖像分成8×8的小塊X,然后用上述8×8離散余弦變換(DCT8)對每一個圖像塊X作二維變換,即Y=(DCT8)×(DCT8T),其中(DCT8T)為(DCT8)的轉(zhuǎn)置矩陣。
由上式得到變換系數(shù)矩陣Y,再對Y的每一個系數(shù)除以一個數(shù)值(這個過程稱為量化),這些被除數(shù)構(gòu)成的矩陣稱為量化矩陣,如JPEG里對應(yīng)DCT8的默認(rèn)量化矩陣為QUANDCT=1611101624405161121214192658605514131624405769561417222951878062182237566810910377243555648110411392496478871031211201017292959811210010399.]]>量化后,對量化后的系數(shù)從左上角到右下角作所謂的Z字掃描,然后,用游長編碼和Huffman編碼(通常有一組固定的Huffman碼表)完成對量化后的系數(shù)的壓縮編碼輸出。關(guān)于這些內(nèi)容,在JPEG的標(biāo)準(zhǔn)文件里均能找到。
為了檢驗和對比變換D的性能,我們依舊維持上述的JPEG壓縮編碼流程,只不過我們將DCT8換成了D,也就是在Y=(DCT8)×(DCT8T)中將DCT8換成D,變換公司相應(yīng)地成了Y=DXDT。由于DCT8和D的性質(zhì)完全不同,替換掉DCT8后,隨之改變的應(yīng)該是量化矩陣和Huffman碼表。但在JPEG標(biāo)準(zhǔn)中,量化矩陣是包含在圖像壓縮文件中的。因此,量化矩陣的變化是許可的。
對應(yīng)本發(fā)明的變換矩陣的量化矩陣為QUAND=17172627342636392221252532364154192927334138505034263334366252462732374151716164292745625762927531455060809090755586708090858080.]]>比較這兩個量化矩陣,可以看出它們是有很大差異的。
由于本發(fā)明中的變換有非常好的性質(zhì),在具體實現(xiàn)中效率非常高,這一點是DCT所不及的。
測試結(jié)果為使研究具有可比性和客觀性,我們在實驗中采用JPEG標(biāo)準(zhǔn)基本系統(tǒng)的框架,進(jìn)行本發(fā)明中的D與DCT8的實驗對比。使用DCT8變換的壓縮軟件是JPEG組織提供的JPEG基本系統(tǒng)編/解碼測試軟件(可以在WWW.JPEG.ORG下載),而使用D變換的壓縮軟件只是在JPEG基本系統(tǒng)編/解碼測試軟件中做了兩項修改第一,空間域到頻率域的變換方法用D替換了DCT8;第二,用QUAND取代了QUANDCT。
可以用國際上通用的“標(biāo)準(zhǔn)測試圖”來檢驗壓縮效果好壞。其方法是,在不同的壓縮率下對多幅圖像作壓縮處理,然后解壓縮,得到恢復(fù)的圖像?;謴?fù)的圖像與原始圖像是有差異的,我們可以計算原始圖像與解壓縮圖像的峰值信噪比(PSNR,單位為dB),PSNR越高,解壓圖像與原始圖像的之間的失真度越小。
分別計算出13個幅面大小均為512×512灰度標(biāo)準(zhǔn)測試圖像,在壓縮比5倍、10倍以及20倍情況下的峰值信噪比。實驗結(jié)果見表1。
表1DCT8與D壓縮圖像對比結(jié)果
上述列表中,第一列為不同的圖像名,表內(nèi)地數(shù)據(jù)為PSNR(dB),“D”的下方對應(yīng)的是采用本發(fā)明的變換的結(jié)果,“DCT8”的下方對應(yīng)的是采用DCT8的結(jié)果,最后一行是13幅圖像的平均PSNR。
有關(guān)D和DCT8壓縮圖像的平均峰值信噪比見圖2。圖中由圓點連接的線段為D壓縮圖像的平均峰值信噪比,叉連接的線段為DCT8壓縮圖像的平均峰值信噪比。
從實驗結(jié)果看,在壓縮比小于或等于20倍時,D的峰值信噪比明顯優(yōu)于DCT8。在壓縮比為5倍時,對13幅圖像,D的結(jié)果比DCT8平均高出0.45個dB,這個結(jié)果是有顯著意義的。事實上,對于數(shù)碼相機(jī),一般沒有壓縮到這個倍率(灰度圖像壓縮5倍時,彩色圖像可壓縮10倍左右)。在壓縮比為10倍時,對13幅圖像,D的結(jié)果比DCT8平均高出0.16個dB。壓縮比等于20倍時,D的結(jié)果與DCT8的相當(dāng)(DCT8平均比D的只高了0.07個dB)。在MPEG-2或MPEG-4中,I幀采用高保真壓縮,并用I幀的解碼圖像去預(yù)測B和P幀。顯然,D對I幀的壓縮效率比DCT8更高,并且,I幀的解碼圖像質(zhì)量越好,對B和P幀的壓縮越有利。
權(quán)利要求
1.一種用于圖像和視頻壓縮的正交變換方法,先將圖像分成8×8的小塊(M),然后用8×8正交變換矩陣(D)對每一個圖像塊(M)作二維變換,得到變換系數(shù)矩陣(N),再對(N)的每一個系數(shù)量化后熵編碼,其特征在于所述變換系數(shù)矩陣表達(dá)式為N=DMDT,其中(DT)為(D)之轉(zhuǎn)置矩陣,所述8×8正交變換矩陣(D)為D=1/81/81/81/81/81/81/81/8-7/168-5/168-3/168-1/1681/1683/1685/1687/1687/1681/168-3/168-5/168-5168-3/1681/1687/168-7/2645/2647/2643/264-3/264-7/264-5/2647/2647/616-13/616-3/6169/6169/616-3/616-13/6167/616-7/218423/2184-17/2184-15/218415/218417/2184-23/21847/21841/264-5/2649/264-5/264-5/2649/264-5/2641/264-/34327/3432-21/343235/3432-35/343221/3432-7/34321/3432.]]>
2.根據(jù)權(quán)利要求1所述的用于圖像和視頻壓縮的正交變換方法,其特征在于所述8×8正交變換矩陣(D)中任何一行全體改變符號,為與上述正交變換矩陣(D)之等效變換。
3.根據(jù)權(quán)利要求1所述的用于圖像和視頻壓縮的正交變換方法,其特征在于所述8×8正交變換矩陣(D)之近似矩陣為0.3535530.3535530.3535530.3535530.3535530.3535530.3535530.353553-0.540062-0.385758-0.231455-0.07715170.07715170.2314550.3857580.5400620.5400620.0771517-0.231455-0.385758-0.385758-0.2314550.07715170.540062-0.430820.3077290.430820.184637-0.184637-0.43082-0.3077290.430820.282038-0.523785-0.1208730.362620.36262-0.120873-0.5237850.282038-0.149786-0.492155-0.363766-0.320970.320970.363766-0.4921550.1497860.0615457-0.3077290.553912-0.307729-0.3077290.553912-0.3077290.0615457-0.01706970.119488-0.3584640.59744-0.597440.358464-0.1194880.0170697.]]>
4.根據(jù)權(quán)利要求1或2或3所述的用于圖像和視頻壓縮的正交變換方法,其特征在于用于靜止圖像壓縮編碼的量化矩陣為QUAND=17172627342636392221252532364154192927334138505034263334366252462732374151716164292745625762927531455060809090755586708090858080.]]>
5.根據(jù)權(quán)利要求1或2或3所述的用于圖像和視頻壓縮的正交變換方法,其特征在于對經(jīng)過熵解碼和反量化后的數(shù)據(jù)塊 ,用所述矩陣(D)正交變換,其二維反變換恢復(fù)圖像數(shù)據(jù)塊為M~=DTN~D.]]>
6.根據(jù)權(quán)利要求1或2或3所述的用于圖像和視頻壓縮的正交變換方法,其特征在于用于軟件和集成電路實現(xiàn)的變換整數(shù)實現(xiàn)表達(dá)式為設(shè)d1=8,d2=168,d3=168,d4=264,d5=616,d6=2184,d7=264,d8=3432,]]>定義一個對角矩陣(E)和整數(shù)矩陣(P)為E=1/d11/d2O1/d31/d41/d5O1/d61/d71/d8,P=11111111-7-5-3-1135771-3-5-5-317-7573-37-577-13-399-3-137-723-17-151517-2371-59-5-59-51-17-2135-3521-71]]>將矩陣(D)分解為D=EP,則變換系數(shù)矩陣表達(dá)式N=DMDT為N=DMDT=E(PMPT)E,其中的PMPT為僅含加法和移位的整數(shù)運算。
7.根據(jù)權(quán)利要求6所述的用于圖像和視頻壓縮的正交變換方法,其特征在于所述表達(dá)式N=E(PMPT)E具有反變換。
全文摘要
一種用于圖像和視頻壓縮的正交變換方法,它是先將圖像分成8×8的小塊M,然后用8×8正交變換矩陣D對每一個圖像塊M作二維變換,得到變換系數(shù)矩陣N,再對N的每一個系數(shù)量化后熵編碼,完成圖像和視頻壓縮過程。本發(fā)明基于8-進(jìn)正交小波理論,設(shè)計了一個新的8×8正交變換矩陣,用這個正交變換壓縮圖像和視頻,不僅能得到比現(xiàn)有技術(shù)中離散余弦變換更好的壓縮效果,而且在軟件和集成電路實現(xiàn)上更加經(jīng)濟(jì)和高效?;诒景l(fā)明,可以產(chǎn)生一條與基于離散余弦變換完全不同的新的壓縮編碼技術(shù)方案,且性能優(yōu)于被廣泛使用的離散余弦變換的性能。
文檔編號H04N7/26GK1878308SQ20061003195
公開日2006年12月13日 申請日期2006年7月13日 優(yōu)先權(quán)日2006年7月13日
發(fā)明者王國秋, 呼金明, 黃堅, 陳寶民 申請人:王國秋, 呼金明, 黃堅, 陳寶民
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1