專利名稱:一種基于人眼視覺特性的圖像編碼方法
技術(shù)領(lǐng)域:
本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,具體涉及一種基于人眼視覺特性的圖像編碼方法。
背景技術(shù):
隨著通信信道及計(jì)算機(jī)容量和速度的提高,圖像信息已經(jīng)成為計(jì)算機(jī)系統(tǒng)處理的 一個(gè)重要的處理對(duì)象。與文字信息不同,圖像信息需要大的存儲(chǔ)容量和寬的傳輸信道,對(duì)圖 像數(shù)據(jù)的壓縮就成為了迫切需求。圖像壓縮是指以較少的比特表示原來(lái)的像素矩陣的技 術(shù),也稱圖像編碼。圖像數(shù)據(jù)之所以能被壓縮,就是因?yàn)閿?shù)據(jù)中存在著冗余。圖像數(shù)據(jù)的冗 余主要表現(xiàn)為圖像中相鄰像素間的相關(guān)性引起的空間冗余;圖像序列中不同幀之間存在 相關(guān)性引起的時(shí)間冗余;不同彩色平面或頻譜帶的相關(guān)性引起的頻譜冗余。數(shù)據(jù)壓縮的目 的就是通過(guò)去除這些數(shù)據(jù)冗余來(lái)減少表示數(shù)據(jù)所需的比特?cái)?shù)。 對(duì)于一副給定數(shù)字圖像,它的原始表示一般是空間像素陣列,這是它的空間域表 示。在空間域表示中,由于相鄰像素之間很大的相關(guān)性,冗余信息分布在較大范圍的空間 像素集中,直接處理比較困難。最常用的處理方法是通過(guò)一種變換,將圖像從空間與映射 到變換域中,在變換域中進(jìn)行簡(jiǎn)捷有效的處理。小波變換是20世紀(jì)80年代中期出現(xiàn)的新 的時(shí)/頻域信號(hào)分析工具,1989年Mallat將小波變換用于信號(hào)處理,提出了多分辨率分析 的概念,并將小波分析首次應(yīng)用于圖像編碼中。之后小波變換以其良好的時(shí)頻局部特性和 去相關(guān)能力以及具有與人眼視覺特性相符的多分辨分析能力,在圖像壓縮編碼領(lǐng)域逐漸得 到廣泛應(yīng)用,并取得了很好的效果。1993年Shapiro根據(jù)小波零樹的概念提出了嵌入式零 樹小波編碼(EZW)算法,該算法以其高效的編碼效率和良好的圖像還原質(zhì)量被認(rèn)為是編碼 效率最好的圖像壓縮算法之一。在EZW算法基礎(chǔ)上Said和Pearlman提出了分層樹的集劃 分(SPIHT)圖像編碼算法,它是對(duì)EZW算法的一種更一般化的表示,它吸取了零樹的許多思 想,其目的也是通過(guò)方向樹最為有效的表示有效值映射,通過(guò)對(duì)樹的劃分,將盡可能多的無(wú) 效值系數(shù)匯集在一個(gè)子集中,用一個(gè)單位符號(hào)表示。隨后不少EZW的改進(jìn)算法也被相繼推 出,但是經(jīng)典EZW算法以及這些改進(jìn)算法沒(méi)有充分考慮人眼視覺特性,影響了圖像復(fù)原質(zhì) 量。若能在圖像編碼過(guò)程中充分利用人眼的視覺特性,則根據(jù)Shannon率失真理論可以采 用更低的編碼比特率使得圖像的主觀質(zhì)量保持不變。 研究表明,人眼對(duì)圖像邊緣區(qū)信息的失真很敏感,對(duì)圖像平滑區(qū)信息的失真比較 敏感,而對(duì)圖像紋理區(qū)信息的失真不敏感。本方法在經(jīng)典EZW算法的基礎(chǔ)上,對(duì)圖像邊緣和 極平滑區(qū)小波系數(shù)分配更多的比特?cái)?shù)使之量化更精細(xì)。由于更加注重圖像邊緣和極平滑區(qū) 的信息,重構(gòu)恢復(fù)的圖像具有更佳的主觀視覺效果。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于人眼視覺特性的圖像編碼方法,提高有損壓縮重建 圖像的主觀視覺質(zhì)量,使得原始圖像在進(jìn)行高壓縮率的有損壓縮編碼后所恢復(fù)的圖像具有更佳的視覺觀測(cè)效果。
本發(fā)明的目的通過(guò)下述方法和步驟實(shí)現(xiàn) 首先對(duì)原始圖像進(jìn)行小波分解,然后對(duì)小波系數(shù)根據(jù)熵值和方差進(jìn)行分類,劃分 出視覺重要系數(shù)和普通系數(shù),據(jù)此根據(jù)劃分結(jié)果利用算術(shù)編碼將兩類系數(shù)分類量化編碼得 到最終碼流。
以下對(duì)本發(fā)明的內(nèi)容作進(jìn)一步闡述 1、對(duì)原始圖像進(jìn)行小波分解,并對(duì)小波變換后系數(shù)根據(jù)熵和方差進(jìn)行分類,劃分 出視覺重要系數(shù)和普通系數(shù) 小波變換以其良好的時(shí)頻局部特性和去相關(guān)能力以及具有與人眼視覺特性相符 的多分辨分析能力,在圖像壓縮編碼領(lǐng)域逐漸得到廣泛應(yīng)用。小波變換將圖像分解成小波 基函數(shù)加權(quán)和的形式,保持原圖像在各種分辨率下的精細(xì)結(jié)構(gòu)。圖像經(jīng)過(guò)小波變換后被分 割成4個(gè)頻帶水平、垂直、對(duì)角線和低頻,低頻部分還可以繼續(xù)分解。圖像經(jīng)過(guò)小波變換后 生成的小波圖像的數(shù)據(jù)總量與原圖像的數(shù)據(jù)總量相等,但由于生成的小波圖像具有與原圖 像不同的特性,即圖像能量主要集中在低頻部分,水平、垂直和對(duì)角線部分的能量則很少。 水平、垂直和對(duì)角線高頻子帶表征了原始圖像在水平、垂直和對(duì)角線方向的邊緣、輪廓和紋 理信息,低頻子帶是對(duì)原始圖像的逼近。由于將大多數(shù)重要的可視信息壓縮到少量的系數(shù) 中,則剩下的系數(shù)可以被粗略地量化或截取為O,而圖像幾乎沒(méi)有失真。如圖l為L(zhǎng)ena圖像 三級(jí)小波分解效果圖。由于人眼對(duì)圖像邊緣區(qū)信息的失真很敏感,對(duì)圖像平滑區(qū)信息的失 真比較敏感,而對(duì)圖像紋理區(qū)信息的失真不敏感,據(jù)此將小波分解后的系數(shù)分為邊緣系數(shù), 平滑區(qū)系數(shù)以及紋理區(qū)系數(shù)。由于圖像平滑區(qū)的熵值較小,而熵值較大的區(qū)域則屬于圖像 邊緣區(qū)或紋理區(qū),同時(shí)紋理區(qū)對(duì)應(yīng)的方差較小,而邊緣區(qū)對(duì)應(yīng)的方差較大,所以可以選擇合 適的熵閾值和方差閾值來(lái)確定圖像不同區(qū)域。通過(guò)計(jì)算小波系數(shù)的四個(gè)子節(jié)點(diǎn)的熵值和方 差的大小來(lái)反映該小波系數(shù)是否屬于邊緣系數(shù),平滑系數(shù)還是紋理系數(shù)。若某小波系數(shù)X 的4個(gè)子節(jié)點(diǎn)系數(shù)為XI, X2, X3和X4,該四個(gè)子節(jié)點(diǎn)系數(shù)的熵值定義為
<formula>formula see original document page 4</formula>其中<formula>formula see original document page 4</formula>
同時(shí)定義四個(gè)子節(jié)點(diǎn)系數(shù)的方差為<formula>formula see original document page 4</formula>
其中<formula>formula see original document page 4</formula>
當(dāng)子節(jié)點(diǎn)系數(shù)的熵值小于某個(gè)閾值S (取值較小)時(shí),則父節(jié)點(diǎn)系數(shù)為極平滑區(qū) 系數(shù),(簡(jiǎn)稱為平滑區(qū)系數(shù)),否則為邊緣或紋理區(qū)系數(shù),而同時(shí)當(dāng)子節(jié)點(diǎn)系數(shù)方差大于某 個(gè)閾值A(chǔ)時(shí),則父節(jié)點(diǎn)系數(shù)為邊緣區(qū)系數(shù),否則為紋理區(qū)系數(shù)。而對(duì)于最高頻系數(shù),則以其 父節(jié)點(diǎn)系數(shù)的性質(zhì)來(lái)判定,即父節(jié)點(diǎn)系數(shù)為邊緣區(qū)系數(shù),則其為邊緣區(qū)系數(shù)。本方法將邊緣 區(qū)系數(shù)和極平滑區(qū)系數(shù)視為視覺重要系數(shù),紋理區(qū)系數(shù)則視為普通系數(shù)。
2、用算術(shù)編碼將兩類系數(shù)分類量化編碼 根據(jù)上面的小波系數(shù)分類結(jié)果,定義6種符號(hào)零樹根T、孤立零值Z、正重要系數(shù) P,負(fù)重要系數(shù)N,正視覺重要系數(shù)R和負(fù)視覺重要系數(shù)S。通過(guò)逐次逼近量化完成嵌入式編碼。也即設(shè)置普通閾值序列T。, 1\,…,V工來(lái)決定重要系數(shù),其中Ti二Ti—乂2且初始閾值 T。 = 2M,M= 1og2[Max(abs(Xi))],Xi是小波系數(shù)。同時(shí)設(shè)置視覺閾值系列DT。, Dl\,…, DTN—!來(lái)決定視覺重要系數(shù),其中Dl\ = DT卜乂2,而Dl\ = T乂2。這樣在某一量化級(jí)1\,對(duì)于 相同大小的小波系數(shù),視覺重要系數(shù)由于量化更精細(xì)而具有更小的量化誤差(普通小波系 數(shù)最大量化誤差為Ti/4,而邊緣和平滑區(qū)系數(shù)為DT乂4 = T乂8),同時(shí)更小一級(jí)的視覺重要 系數(shù)(因?yàn)橐曈X重要系數(shù)量化級(jí)DTi = T乂2)也被同時(shí)量化。顯然當(dāng)設(shè)定某一特定比特率 后,視覺重要系數(shù)(邊緣和極平滑區(qū)系數(shù))分配了更多的比特率。 本發(fā)明所提出的基于人眼視覺特性的圖像編碼方法,有效地提高了有損壓縮重建 圖像的主觀視覺質(zhì)量,使得在滿足一定圖像質(zhì)量條件下,用盡可能少的比特?cái)?shù)來(lái)表示原始 圖像,以提高圖像傳輸?shù)男屎蜏p少圖像存儲(chǔ)的容量。
圖1是小波系數(shù)樹狀結(jié)構(gòu)。 圖2是Lena圖像三級(jí)小波分解效果圖。 圖3是本發(fā)明與EZW算法直觀重構(gòu)圖像比較,其中(a)、 (b)分別為Man標(biāo)準(zhǔn)灰度 圖像在比特率0. 25b卯下的EZW算法的重構(gòu)圖像和本發(fā)明的重構(gòu)圖像。
具體實(shí)施方案 以下結(jié)合具體的實(shí)施例,對(duì)本發(fā)明做進(jìn)一步的闡述。實(shí)施例僅用于對(duì)本發(fā)明做說(shuō)
明而不是對(duì)本發(fā)明的限制。
實(shí)施例1 本實(shí)施例以512X512X8bit的標(biāo)準(zhǔn)Man灰度圖像為例,介紹整個(gè)圖像編碼過(guò)程,
并在最后用表格及圖像形式表示編碼結(jié)果和重建圖像的主觀視覺質(zhì)量效果。 1、對(duì)小波變換后的系數(shù)進(jìn)行主掃描 選取標(biāo)準(zhǔn)Man灰度圖像(原始圖像)作為編碼對(duì)象,采用D (9, 7)雙正交小波進(jìn)行
小波變換,掃描每一個(gè)小波系數(shù)以產(chǎn)生系數(shù)符號(hào)。
(1)如果系數(shù)幅度大于閾值T且為正數(shù),輸出符號(hào)P ; (2)如果系數(shù)幅度大于閾值T且為負(fù)數(shù),,輸出符號(hào)N ; (3)如果系數(shù)幅度小于閾值T但大于閾值T/2且為正數(shù),而樹枝中的4個(gè)孩子節(jié)點(diǎn) 系數(shù)熵值小于閾值S或者方差大于閾值A(chǔ),輸出符號(hào)R; (4)如果系數(shù)幅度小于閾值T但大于閾值T/2且為負(fù)數(shù),而樹枝中的4個(gè)孩子節(jié)點(diǎn) 系數(shù)熵值小于閾值S或者方差大于閾值A(chǔ),輸出符號(hào)S; (5)如果系數(shù)不滿足上面四者之一,而樹枝中有子節(jié)點(diǎn)系數(shù)值大于閾值T,則用符 號(hào)Z表示; (6)如果系數(shù)及其所有節(jié)點(diǎn)系數(shù)均小于T,而且該系數(shù)又不滿足邊緣平滑區(qū)系數(shù) 條件,則該系數(shù)為零樹根,輸出T。 2、對(duì)小波系數(shù)輔掃描,量化帶符號(hào)P、 N、 R和S的系數(shù)并進(jìn)行編碼 (l)對(duì)于P和N的量化。在量化系數(shù)之前要構(gòu)造量化器。量化器的輸入間隔為 (2)對(duì)于符號(hào)R和S,由于它們對(duì)應(yīng)了圖像邊緣或平滑區(qū),量化器的輸入間隔為 在完成主掃描和輔掃描之后輸出是符號(hào)集{P,N,R,S,T,Z,0,1}中的一系列符號(hào)。
最后采用Huffman編碼可得到最終的可傳輸編碼碼流。 3、結(jié)果分析 由于PSNR對(duì)評(píng)價(jià)圖像的主觀視覺效果具有一定的局限性,本方法采用更接近主 觀視覺評(píng)價(jià)質(zhì)量的MSSIM值以及VIF值作為圖像質(zhì)量評(píng)價(jià)指標(biāo)來(lái)衡量重構(gòu)圖像的實(shí)際主觀 視覺質(zhì)量,其中MSSIM和VIF值越大,表明恢復(fù)圖像的主觀質(zhì)量越好。圖3中的(a)和(b) 分別是Man標(biāo)準(zhǔn)灰度圖像在比特率O. 25b卯下的EZW算法的恢復(fù)圖像和本發(fā)明的恢復(fù)圖 像。圖(b)的邊緣比圖(a)的邊緣更加清晰,如手表,手背,帽子,頭發(fā),衣服花紋等邊緣區(qū) 更清晰,具有更好的視覺效果。表1是不同碼率下重構(gòu)圖像的MSSIM和VIF值比較。由表l 可以看出對(duì)于平滑圖像和邊緣豐富圖像本方法相對(duì)于經(jīng)典EZW算法,重構(gòu)圖像具有更好的 主觀視覺質(zhì)量。而對(duì)于紋理豐富圖像在低比特率下本方法同樣可以得到更好視覺質(zhì)量的重 構(gòu)圖像。 表1、本發(fā)明所述的方法與EZW算法的編碼結(jié)果(即MSSIM/VIF值)比較
比特率 /bppLena圖像Man圖像Mandrill圖像EZW本方法EZW本方法EZW本方法
0.1000.758/0.160.761/0.160.621/0.110.631/0.120.382/0.060.419/0.07
90219
0.2000.816/0.250.824/0.260.704/0.190.719/0.210.493/0.110.512/0.13
814991
0.2500.840/0.310.853/0.310.726/0.230.744/0.240.546/0.140.554/0.14
184880
0.5000.890/0.480.901/0.500.817/0.360.831/0.400.636/0.210.659/0.22
33了489
l細(xì)0.927/0.660.935/0.680.904/0.570.卯5/0.580.791/0.350.783/0.32
639864 實(shí)驗(yàn)結(jié)果表明,本發(fā)明能很好地提高有損壓縮重建圖像的主觀視覺質(zhì)量,使得原 始圖像在進(jìn)行高壓縮率的有損壓縮編碼后所恢復(fù)的圖像具有更佳的視覺觀測(cè)效果。
權(quán)利要求
一種基于人眼視覺特性的圖像編碼方法,其特征在于首先對(duì)原始圖像進(jìn)行小波分解,然后對(duì)小波系數(shù)根據(jù)熵值和方差進(jìn)行分類,劃分出視覺重要系數(shù)和普通系數(shù),據(jù)此根據(jù)劃分結(jié)果利用算術(shù)編碼將兩類系數(shù)分類量化編碼得到最終碼流。
2. 根據(jù)權(quán)利要求1所述的基于人眼視覺特性的圖像編碼方法,其特征在于對(duì)原始圖像 小波分解后的小波系數(shù)進(jìn)行分類特征如下原始圖像經(jīng)過(guò)小波變換后被分割成水平、垂直、對(duì)角線和低頻4個(gè)頻帶,小波系數(shù)的分 布呈樹狀形式分布,水平、垂直和對(duì)角線高頻子帶表征了原始圖像在水平、垂直和對(duì)角線方 向的邊緣、輪廓和紋理信息,低頻子帶是對(duì)原始圖像的逼近,將大多數(shù)重要的可視信息壓縮 到少量的系數(shù)中,剩下的系數(shù)被粗略地量化或截取為0 ;將小波分解后的系數(shù)分為邊緣系數(shù),平滑區(qū)系數(shù)以及紋理區(qū)系數(shù),圖像平滑區(qū)的熵值 較小,熵值較大的區(qū)域則屬于圖像邊緣區(qū)或紋理區(qū),同時(shí)紋理區(qū)對(duì)應(yīng)的方差較小,邊緣區(qū)對(duì) 應(yīng)的方差較大;通過(guò)計(jì)算小波系數(shù)的四個(gè)子節(jié)點(diǎn)的熵值和方差的大小來(lái)反映該小波系數(shù)是 否屬于邊緣系數(shù),平滑系數(shù)還是紋理系數(shù);若某小波系數(shù)X的4個(gè)子節(jié)點(diǎn)系數(shù)為XI, X2, X3 和X4,該四個(gè)子節(jié)點(diǎn)系數(shù)的熵值定義為 <formula>formula see original document page 2</formula>其中 I(i) = -1og2(probs(Xi))同時(shí)定義四個(gè)子節(jié)點(diǎn)系數(shù)的方差為 D(X)= J]("-柳)2i=U,3,4其中<formula>formula see original document page 2</formula>當(dāng)子節(jié)點(diǎn)系數(shù)的熵值小于某個(gè)閾值s (取值較小)時(shí),則父節(jié)點(diǎn)系數(shù)為極平滑區(qū)系數(shù), 否則為邊緣或紋理區(qū)系數(shù),而同時(shí)當(dāng)子節(jié)點(diǎn)系數(shù)方差大于某個(gè)閾值A(chǔ)時(shí),則父節(jié)點(diǎn)系數(shù)為 邊緣區(qū)系數(shù),否則為紋理區(qū)系數(shù);對(duì)于最高頻系數(shù),則以其父節(jié)點(diǎn)系數(shù)的性質(zhì)來(lái)判定,即父 節(jié)點(diǎn)系數(shù)為邊緣區(qū)系數(shù),則其為邊緣區(qū)系數(shù);邊緣區(qū)系數(shù)和極平滑區(qū)系數(shù)為視覺重要系數(shù), 紋理區(qū)系數(shù)視為普通系數(shù)。
3. 根據(jù)權(quán)利要求1所述的基于人眼視覺特性的圖像編碼方法,其特征在于利用算術(shù)編 碼將兩類系數(shù)分類量化編碼,根據(jù)小波系數(shù)分類結(jié)果,定義6種符號(hào)零樹根T、孤立零值Z、 正重要系數(shù)P,負(fù)重要系數(shù)N,正視覺重要系數(shù)R和負(fù)視覺重要系數(shù)S,通過(guò)逐次逼近量化完 成嵌入式編碼,設(shè)置普通閾值序列T。, 1\,…,TN—工來(lái)決定重要系數(shù),其中1\ = T卜乂2且初始閾 值T。 = 2M,M= 1og2[Max(abs關(guān)],Xi是小波系數(shù),同時(shí)設(shè)置視覺閾值系列DT。,Dl\,…, DTN—i來(lái)決定視覺重要系數(shù),其中Dl\ = DT卜乂2,而DTi = T乂2 ;在某一量化級(jí)1\,對(duì)于相同大 小的小波系數(shù),視覺重要系數(shù)由于量化更精細(xì)而具有更小的量化誤差,更小一級(jí)的視覺重 要系數(shù)也被同時(shí)量化。
全文摘要
本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,涉及一種基于人眼視覺特性的圖像編碼方法。本發(fā)明根據(jù)人眼對(duì)圖像邊緣和平滑區(qū)信息的失真要比紋理區(qū)失真更敏感這一視覺特性,首先對(duì)原始圖像進(jìn)行小波分解,然后將小波變換后的系數(shù)利用熵值和方差進(jìn)行分類為視覺重要系數(shù)和普通系數(shù),最后采用算術(shù)編碼將不同系數(shù)分類編碼得到最終碼流。本發(fā)明提高了有損壓縮重建圖像的主觀視覺質(zhì)量,使得原始圖像在進(jìn)行高壓縮率的有損壓縮編碼后所恢復(fù)的圖像具有更佳的視覺觀測(cè)效果,因此在大規(guī)模圖像存儲(chǔ)及圖像數(shù)據(jù)傳輸上具有較強(qiáng)的可行性。
文檔編號(hào)H04N7/26GK101783939SQ20091004549
公開日2010年7月21日 申請(qǐng)日期2009年1月16日 優(yōu)先權(quán)日2009年1月16日
發(fā)明者付偉, 顧曉東, 馬成才 申請(qǐng)人:復(fù)旦大學(xué)