專利名稱:全相位反余弦雙正交變換及其對(duì)jpeg的改進(jìn)方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計(jì)算機(jī)圖像處理技術(shù)領(lǐng)域。
背景技術(shù):
JPEG壓縮標(biāo)準(zhǔn)(ISO/IEC 10918-1|ITU-T Rec.T.81 Digitalcompression and coding of continuoustone still images)廣泛應(yīng)用于靜止圖像編碼,在JPEG中,基于離散余弦變換(DCT)的圖像壓縮編碼的過(guò)程稱為基本順序過(guò)程。編碼過(guò)程主要步驟為圖像的8×8方塊化、二維離散余弦變換(Discrete CosineTransform,DCT)、根據(jù)量化表量化、“之”(Zig-Zag)字形掃描、游程編碼、哈夫曼(Huffman)熵編碼。接收端解壓縮是編碼的逆過(guò)程,經(jīng)過(guò)反量化和反DCT變換,得到重建圖像。8×8像塊[f]的二維DCT變換公式為[F]=[C][f][CT],其中,[C]為8×8的DCT變換矩陣,[CT]為[C]的轉(zhuǎn)置。DCT變換是正交變換,[C]的轉(zhuǎn)置即為[C]的逆,即[CT]=[C-1]。因此,由[f]=[CT][F][C]重建圖像。[C]的行向量是分解基矢量,[CT]的列向量是合成基矢量,DCT變換和反變換中的分解基矢量和合成基矢量是相同的。
JPEG壓縮編碼算法中DCT變換是一種常用的變換編碼方法,在數(shù)字圖像壓縮領(lǐng)域得到了廣泛的應(yīng)用。然而我們發(fā)現(xiàn),對(duì)于圖像壓縮編碼來(lái)說(shuō)正交變換并不是最優(yōu)的選擇,其缺點(diǎn)之一是對(duì)不同的DCT系數(shù)采用不同的量化間隔,量化特別是改變壓縮率時(shí)的量化需要較復(fù)雜的計(jì)算,量化表也需要占一定的內(nèi)存空間。
發(fā)明內(nèi)容本發(fā)明的目的是解決現(xiàn)有技術(shù)對(duì)不同的DCT系數(shù)采用不同的量化間隔,且量化表復(fù)雜,需要進(jìn)行大量計(jì)算的問(wèn)題,提供一種全相位反余弦雙正交變換及其對(duì)JPEG的改進(jìn)方法。
本發(fā)明提供的全相位反余弦雙正交變換法,是將二維全相位反余弦雙正交變換定義為[F]=[V][f][VT],反變換定義為[f]=[V-1][F][(VT)-1],其中[V]是全相位反余弦雙正交變換矩陣,一般形式為
V(m,n)=1m=00≤n≤N-1N-m+2-1Ncosm(2n+1)π2N1≤m≤N-10≤n≤N-1,]]>m,n代表矩陣V的行和列。
當(dāng)N=8時(shí),全相位反余弦雙正交變換矩陣為V=1.00001.00001.00001.00001.00001.00001.00001.00000.90880.77040.51520.1808-0.1808-0.5152-0.7704-0.90880.74080.3072-0.3072-0.7408-0.7408-0.30720.30720.74080.5624-0.1320-0.6640-0.37600.37600.66400.1320-0.56240.3904-0.3904-0.39040.39040.3904-0.3904-0.39040.39040.2368-0.41840.08320.3552-0.3552-0.08320.4184-0.23680.1152-0.27920.2792-0.1152-0.11520.2792-0.27920.11520.0344-0.09840.1472-0.17360.1736-0.14720.0984-0.0344.]]>一種采用上述全相位反余弦雙正交變換法對(duì)JPEG的改進(jìn)方法,本發(fā)明對(duì)JPEG的改進(jìn)之處是,用全相位反余弦雙正交變換代替二維離散余弦變換,對(duì)所有變換系數(shù)采用均一的量化間隔量化,具體過(guò)程如下——輸入原始圖像及比特率;——分成8×8像素塊,分別進(jìn)行全相位反余弦雙正交變換;——根據(jù)比特率確定量化間隔,對(duì)變換系數(shù)進(jìn)行均一量化;——直流系數(shù)的預(yù)測(cè)編碼和交流系數(shù)的“之”字形掃描、可變長(zhǎng)編碼;——哈夫曼熵編碼;——輸出壓縮圖像的比特序列。
接收端解壓縮過(guò)程如下——接收輸入的經(jīng)變換后的壓縮圖像比特序列;——哈夫曼熵解碼;——對(duì)直流系數(shù)和交流系數(shù)可變長(zhǎng)解碼;
——反量化;——反全相位反余弦雙正交變換;——得到重建圖像。
本發(fā)明的優(yōu)點(diǎn)和積極效果1、本發(fā)明基于全相位數(shù)字濾波理論和傳統(tǒng)的反余弦正交變換提出了一種新型變換即全相位反余弦雙正交變換,并將其成功應(yīng)用于圖像壓縮領(lǐng)域。2、全相位反余弦雙正交變換矩陣[V]與DCT正交變換矩陣[C]的相似之處是基矢量的列率隨行序號(hào)的增加而增加,不同之處是[C]的各個(gè)基矢量是等模的,而[V]的基矢量的模隨列率的增高而衰減。這就使得全相位反余弦雙正交變換系數(shù)具有高頻衰減的性質(zhì)。當(dāng)對(duì)各變換系數(shù)采用均一的量化間隔量化時(shí),相當(dāng)于DCT變換低頻系數(shù)細(xì)量化、高頻系數(shù)粗量化的效果。因此可以去掉基于DCT變換的JPEG算法中的復(fù)雜的量化表。3、本發(fā)明提出的改進(jìn)JPEG方法與標(biāo)準(zhǔn)JPEG方法相比的最大優(yōu)點(diǎn)是,去掉了量化表,由于DCT變換的量化表有47種量化步長(zhǎng),而采用全相位反余弦雙正交變換僅需要一種量化步長(zhǎng),節(jié)省了內(nèi)存占用量。簡(jiǎn)化了計(jì)算,提高了編解碼速度,大大縮短了運(yùn)算時(shí)間,采用全相位反余弦雙正交變換和均一量化比采用DCT變換和相應(yīng)量化的運(yùn)算時(shí)間平均快9.6713s。硬件實(shí)現(xiàn)也比較簡(jiǎn)單,并且能達(dá)到與DCT變換基本相同的圖像壓縮效果。
圖1是用本發(fā)明方法對(duì)圖像進(jìn)行壓縮與重建的方框圖;圖2是兩種方案下圖像“l(fā)ena”的率失真曲線。
具體實(shí)施方式實(shí)施例1本發(fā)明將二維全相位反余弦雙正交變換定義為[F]=[V][f][VT],反變換定義為[f]=[V-1][F][(VT)-1],其中[V]是全相位反余弦雙正交變換矩陣。與正交變換矩陣不同,這里[V-1]≠[VT],即分解基矢量([V]的行向量)與合成基矢量([V-1]的列向量)是不同的,然而二者之間是雙正交的,構(gòu)成對(duì)偶基向量。本發(fā)明定義的全相位反余弦雙正交變換矩陣[V]的一般形式為V(m,n)=1m=00≤n≤N-1N-m+2-1Ncosm(2n+1)π2N1≤m≤N-10≤n≤N-1,]]>m,n代表矩陣V的行和列。
當(dāng)N=8時(shí)V=1.00001.00001.00001.00001.00001.00001.00001.00000.90880.77040.51520.1808-0.1808-0.5152-0.7704-0.90880.74080.3072-0.3072-0.7408-0.7408-0.30720.30720.74080.5624-0.1320-0.6640-0.37600.37600.66400.1320-0.56240.3904-0.3904-0.39040.39040.3904-0.3904-0.39040.39040.2368-0.41840.08320.3552-0.3552-0.08320.4184-0.23680.1152-0.27920.2792-0.1152-0.11520.2792-0.27920.11520.0344-0.09840.1472-0.17360.1736-0.14720.0984-0.0344]]>實(shí)施例2本發(fā)明首先提出了一種新型變換,即全相位反余弦雙正交變換,并且用全相位反余弦雙正交變換代替JPEG壓縮算法中的DCT變換,應(yīng)用于圖像壓縮。本發(fā)明對(duì)所有變換系數(shù)采用均一量化,圖像壓縮編碼的其他部分與JPEG相同。本發(fā)明基于軟件實(shí)現(xiàn)。
如圖1所示,首先,輸入原始圖像和所要求的比特率,把圖像分成8×8的塊,分塊進(jìn)行全相位反余弦雙正交變換,根據(jù)設(shè)定的比特率選定量化間隔,把變換系數(shù)進(jìn)行均一量化,再對(duì)DC系數(shù)進(jìn)行差分預(yù)測(cè)編碼,對(duì)AC系數(shù)進(jìn)行Zig-Zag掃描和可變長(zhǎng)編碼,然后根據(jù)標(biāo)準(zhǔn)的Huffman碼表進(jìn)行熵編碼,輸出壓縮圖像的碼流,實(shí)現(xiàn)了圖像壓縮。在接收端,經(jīng)過(guò)Huffman熵解碼,DC系數(shù)和AC系數(shù)可變長(zhǎng)解碼、反量化后,再進(jìn)行反全相位反余弦雙正交變換即可得到重建圖像。
需要注意的是,在圖1的程序流程圖中,進(jìn)行Huffman編碼時(shí),對(duì)于DC系數(shù),因?yàn)槭菍?duì)相鄰圖像塊之間的差值進(jìn)行編碼的,所以在量化后掃描之前要先對(duì)DC系數(shù)進(jìn)行預(yù)處理。將量化后DC的原始值替換成相鄰圖像塊之間的差值。在對(duì)AC系數(shù)進(jìn)行編碼時(shí),又要考慮63個(gè)系數(shù)全是零和連續(xù)出現(xiàn)16個(gè)連零這兩種特殊情況等等。
在Matlab 6.5環(huán)境下對(duì)本發(fā)明提出的技術(shù)方案進(jìn)行了計(jì)算機(jī)仿真實(shí)驗(yàn)。實(shí)驗(yàn)得到以下結(jié)論1.采用全相位反余弦雙正交變換、均一量化間隔取為58時(shí)的圖像壓縮率和重建圖像信噪比指標(biāo),與采用DCT變換、用JPEG標(biāo)準(zhǔn)中的量化表進(jìn)行量化的指標(biāo)近似。
2.在其他編碼比特率下,本發(fā)明提出的技術(shù)方案與標(biāo)準(zhǔn)JPEG方案在重建圖像的主觀效果和峰值信噪比方面也大致相同。
如表1和表2所示表1 標(biāo)準(zhǔn)壓縮率下兩種方案性能比較
表1給出了對(duì)512×512的七幅圖像采用DCT變換、用JPEG標(biāo)準(zhǔn)中的量化表進(jìn)行量化和采用全相位反余弦雙正交變換(APIDCBT)、均一量化間隔取為58進(jìn)行圖像編碼和重建的實(shí)驗(yàn)結(jié)果。
表2不同壓縮率下兩種方案性能比較
表2給出了對(duì)圖像“l(fā)ena”,這兩種變換和量化方案在不同的編碼比特率和重建圖像峰值信噪比下的實(shí)驗(yàn)結(jié)果。由表1可以看出,二者壓縮效果基本相同。
由表2數(shù)據(jù)繪制的兩種變換和量化方案下圖像“l(fā)ena”的率失真曲線如圖2所示。由圖2可以看出,在相近編碼比特率時(shí),本發(fā)明提出的改進(jìn)JPEG方法略優(yōu)于標(biāo)準(zhǔn)JPEG方法。
權(quán)利要求
1.一種全相位反余弦雙正交變換法,其特征是本發(fā)明將二維全相位反余弦雙正交變換定義為[F]=[V][f][VT],反變換定義為[f]=[V-1][F][(VT)-1],其中[V]是全相位反余弦雙正交變換矩陣,一般形式為V(m,n)=1m=00≤n≤N-1N-m+2-1Ncosm(2n+1)π2N1≤m≤N-10≤n≤N-1,]]>m,n代表矩陣V的行和列。
2.根據(jù)權(quán)利要求1所述的全相位反余弦雙正交變換法,其特征是當(dāng)取N=8時(shí),全相位反余弦雙正交變換矩陣為V=1.00001.00001.00001.00001.00001.00001.00001.00000.90880.77040.51520.1808-0.1808-0.5152-0.7704-0.90880.74080.3072-0.3072-0.7408-0.7408-0.30720.30720.74080.5624-0.1320-0.6640-0.37600.37600.66400.1320-0.56240.3904-0.3904-0.39040.39040.3904-0.3904-0.39040.39040.2368-0.41480.08320.3552-0.3552-0.08320.4148-0.23680.1152-0.27920.2792-0.1152-0.11520.2792-0.27920.11520.0344-0.09840.1472-0.17360.1736-0.14720.0984-0.0344.]]>
3.一種采用權(quán)利要求1所述的全相位反余弦雙正交變換法對(duì)JPEG的改進(jìn)方法,其特征是本發(fā)明對(duì)JPEG的改進(jìn)之處是,用全相位反余弦雙正交變換代替二維離散余弦變換,對(duì)所有變換系數(shù)采用均一的量化間隔量化,具體過(guò)程如下——輸入原始圖像及比特率;——分成8×8像素塊,分別進(jìn)行全相位反余弦雙正交變換;——根據(jù)比特率確定量化間隔,對(duì)變換系數(shù)進(jìn)行均一量化;——直流系數(shù)的預(yù)測(cè)編碼和交流系數(shù)的“之”字形掃描、可變長(zhǎng)編碼;——哈夫曼熵編碼;——輸出壓縮圖像的比特序列。
4.根據(jù)權(quán)利要求3所述的對(duì)JPEG的改進(jìn)方法,其特征是接收端解壓縮過(guò)程如下——接收輸入的經(jīng)變換后的壓縮圖像比特序列;——哈夫曼熵解碼;——對(duì)直流系數(shù)和交流系數(shù)可變長(zhǎng)解碼;——反量化;——反全相位反余弦雙正交變換;——得到重建圖像。
全文摘要
全相位反余弦雙正交變換法,將變換定義為[F]=[V][f][V
文檔編號(hào)G06T9/00GK1822050SQ200610013348
公開日2006年8月23日 申請(qǐng)日期2006年3月22日 優(yōu)先權(quán)日2006年3月22日
發(fā)明者侯正信, 潘霞 申請(qǐng)人:天津大學(xué)