一種基于人眼視覺特性的圖像編碼方法

文檔序號(hào)：7946520閱讀：124來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：一種基于人眼視覺特性的圖像編碼方法
技術(shù)領(lǐng)域：
本發(fā)明屬于圖像處理技術(shù)領(lǐng)域，具體涉及一種基于人眼視覺特性的圖像編碼方法。
背景技術(shù)：
隨著通信信道及計(jì)算機(jī)容量和速度的提高，圖像信息已經(jīng)成為計(jì)算機(jī)系統(tǒng)處理的一個(gè)重要的處理對(duì)象。與文字信息不同，圖像信息需要大的存儲(chǔ)容量和寬的傳輸信道，對(duì)圖像數(shù)據(jù)的壓縮就成為了迫切需求。圖像壓縮是指以較少的比特表示原來(lái)的像素矩陣的技術(shù)，也稱圖像編碼。圖像數(shù)據(jù)之所以能被壓縮，就是因?yàn)閿?shù)據(jù)中存在著冗余。圖像數(shù)據(jù)的冗余主要表現(xiàn)為圖像中相鄰像素間的相關(guān)性引起的空間冗余；圖像序列中不同幀之間存在相關(guān)性引起的時(shí)間冗余；不同彩色平面或頻譜帶的相關(guān)性引起的頻譜冗余。數(shù)據(jù)壓縮的目的就是通過(guò)去除這些數(shù)據(jù)冗余來(lái)減少表示數(shù)據(jù)所需的比特?cái)?shù)。對(duì)于一副給定數(shù)字圖像，它的原始表示一般是空間像素陣列，這是它的空間域表示。在空間域表示中，由于相鄰像素之間很大的相關(guān)性，冗余信息分布在較大范圍的空間像素集中，直接處理比較困難。最常用的處理方法是通過(guò)一種變換，將圖像從空間與映射到變換域中，在變換域中進(jìn)行簡(jiǎn)捷有效的處理。小波變換是20世紀(jì)80年代中期出現(xiàn)的新的時(shí)/頻域信號(hào)分析工具，1989年Mallat將小波變換用于信號(hào)處理，提出了多分辨率分析的概念，并將小波分析首次應(yīng)用于圖像編碼中。之后小波變換以其良好的時(shí)頻局部特性和去相關(guān)能力以及具有與人眼視覺特性相符的多分辨分析能力，在圖像壓縮編碼領(lǐng)域逐漸得到廣泛應(yīng)用，并取得了很好的效果。1993年Shapiro根據(jù)小波零樹的概念提出了嵌入式零樹小波編碼(EZW)算法，該算法以其高效的編碼效率和良好的圖像還原質(zhì)量被認(rèn)為是編碼效率最好的圖像壓縮算法之一。在EZW算法基礎(chǔ)上Said和Pearlman提出了分層樹的集劃分(SPIHT)圖像編碼算法，它是對(duì)EZW算法的一種更一般化的表示，它吸取了零樹的許多思想，其目的也是通過(guò)方向樹最為有效的表示有效值映射，通過(guò)對(duì)樹的劃分，將盡可能多的無(wú) 效值系數(shù)匯集在一個(gè)子集中，用一個(gè)單位符號(hào)表示。隨后不少EZW的改進(jìn)算法也被相繼推出，但是經(jīng)典EZW算法以及這些改進(jìn)算法沒(méi)有充分考慮人眼視覺特性，影響了圖像復(fù)原質(zhì) 量。若能在圖像編碼過(guò)程中充分利用人眼的視覺特性，則根據(jù)Shannon率失真理論可以采用更低的編碼比特率使得圖像的主觀質(zhì)量保持不變。研究表明，人眼對(duì)圖像邊緣區(qū)信息的失真很敏感，對(duì)圖像平滑區(qū)信息的失真比較敏感，而對(duì)圖像紋理區(qū)信息的失真不敏感。本方法在經(jīng)典EZW算法的基礎(chǔ)上，對(duì)圖像邊緣和極平滑區(qū)小波系數(shù)分配更多的比特?cái)?shù)使之量化更精細(xì)。由于更加注重圖像邊緣和極平滑區(qū) 的信息，重構(gòu)恢復(fù)的圖像具有更佳的主觀視覺效果。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于人眼視覺特性的圖像編碼方法，提高有損壓縮重建圖像的主觀視覺質(zhì)量，使得原始圖像在進(jìn)行高壓縮率的有損壓縮編碼后所恢復(fù)的圖像具有更佳的視覺觀測(cè)效果。
本發(fā)明的目的通過(guò)下述方法和步驟實(shí)現(xiàn) 首先對(duì)原始圖像進(jìn)行小波分解，然后對(duì)小波系數(shù)根據(jù)熵值和方差進(jìn)行分類，劃分出視覺重要系數(shù)和普通系數(shù)，據(jù)此根據(jù)劃分結(jié)果利用算術(shù)編碼將兩類系數(shù)分類量化編碼得到最終碼流。
以下對(duì)本發(fā)明的內(nèi)容作進(jìn)一步闡述 1、對(duì)原始圖像進(jìn)行小波分解，并對(duì)小波變換后系數(shù)根據(jù)熵和方差進(jìn)行分類，劃分出視覺重要系數(shù)和普通系數(shù) 小波變換以其良好的時(shí)頻局部特性和去相關(guān)能力以及具有與人眼視覺特性相符的多分辨分析能力，在圖像壓縮編碼領(lǐng)域逐漸得到廣泛應(yīng)用。小波變換將圖像分解成小波基函數(shù)加權(quán)和的形式，保持原圖像在各種分辨率下的精細(xì)結(jié)構(gòu)。圖像經(jīng)過(guò)小波變換后被分割成4個(gè)頻帶水平、垂直、對(duì)角線和低頻，低頻部分還可以繼續(xù)分解。圖像經(jīng)過(guò)小波變換后生成的小波圖像的數(shù)據(jù)總量與原圖像的數(shù)據(jù)總量相等，但由于生成的小波圖像具有與原圖像不同的特性，即圖像能量主要集中在低頻部分，水平、垂直和對(duì)角線部分的能量則很少。水平、垂直和對(duì)角線高頻子帶表征了原始圖像在水平、垂直和對(duì)角線方向的邊緣、輪廓和紋理信息，低頻子帶是對(duì)原始圖像的逼近。由于將大多數(shù)重要的可視信息壓縮到少量的系數(shù) 中，則剩下的系數(shù)可以被粗略地量化或截取為O，而圖像幾乎沒(méi)有失真。如圖l為L(zhǎng)ena圖像三級(jí)小波分解效果圖。由于人眼對(duì)圖像邊緣區(qū)信息的失真很敏感，對(duì)圖像平滑區(qū)信息的失真比較敏感，而對(duì)圖像紋理區(qū)信息的失真不敏感，據(jù)此將小波分解后的系數(shù)分為邊緣系數(shù)，平滑區(qū)系數(shù)以及紋理區(qū)系數(shù)。由于圖像平滑區(qū)的熵值較小，而熵值較大的區(qū)域則屬于圖像邊緣區(qū)或紋理區(qū)，同時(shí)紋理區(qū)對(duì)應(yīng)的方差較小，而邊緣區(qū)對(duì)應(yīng)的方差較大，所以可以選擇合適的熵閾值和方差閾值來(lái)確定圖像不同區(qū)域。通過(guò)計(jì)算小波系數(shù)的四個(gè)子節(jié)點(diǎn)的熵值和方差的大小來(lái)反映該小波系數(shù)是否屬于邊緣系數(shù)，平滑系數(shù)還是紋理系數(shù)。若某小波系數(shù)X 的4個(gè)子節(jié)點(diǎn)系數(shù)為XI， X2， X3和X4，該四個(gè)子節(jié)點(diǎn)系數(shù)的熵值定義為
<formula>formula see original document page 4</formula>其中<formula>formula see original document page 4</formula>
同時(shí)定義四個(gè)子節(jié)點(diǎn)系數(shù)的方差為<formula>formula see original document page 4</formula>
其中<formula>formula see original document page 4</formula>
當(dāng)子節(jié)點(diǎn)系數(shù)的熵值小于某個(gè)閾值S (取值較小)時(shí)，則父節(jié)點(diǎn)系數(shù)為極平滑區(qū) 系數(shù)，(簡(jiǎn)稱為平滑區(qū)系數(shù))，否則為邊緣或紋理區(qū)系數(shù)，而同時(shí)當(dāng)子節(jié)點(diǎn)系數(shù)方差大于某個(gè)閾值A(chǔ)時(shí)，則父節(jié)點(diǎn)系數(shù)為邊緣區(qū)系數(shù)，否則為紋理區(qū)系數(shù)。而對(duì)于最高頻系數(shù)，則以其父節(jié)點(diǎn)系數(shù)的性質(zhì)來(lái)判定，即父節(jié)點(diǎn)系數(shù)為邊緣區(qū)系數(shù)，則其為邊緣區(qū)系數(shù)。本方法將邊緣區(qū)系數(shù)和極平滑區(qū)系數(shù)視為視覺重要系數(shù)，紋理區(qū)系數(shù)則視為普通系數(shù)。
2、用算術(shù)編碼將兩類系數(shù)分類量化編碼根據(jù)上面的小波系數(shù)分類結(jié)果，定義6種符號(hào)零樹根T、孤立零值Z、正重要系數(shù) P，負(fù)重要系數(shù)N，正視覺重要系數(shù)R和負(fù)視覺重要系數(shù)S。通過(guò)逐次逼近量化完成嵌入式編碼。也即設(shè)置普通閾值序列T。， 1\，…，V工來(lái)決定重要系數(shù)，其中Ti二Ti—乂2且初始閾值 T。 = 2M，M= 1og2[Max(abs(Xi))]，Xi是小波系數(shù)。同時(shí)設(shè)置視覺閾值系列DT。， Dl\，…， DTN—!來(lái)決定視覺重要系數(shù)，其中Dl\ = DT卜乂2，而Dl\ = T乂2。這樣在某一量化級(jí)1\，對(duì)于相同大小的小波系數(shù)，視覺重要系數(shù)由于量化更精細(xì)而具有更小的量化誤差(普通小波系數(shù)最大量化誤差為Ti/4，而邊緣和平滑區(qū)系數(shù)為DT乂4 = T乂8)，同時(shí)更小一級(jí)的視覺重要系數(shù)(因?yàn)橐曈X重要系數(shù)量化級(jí)DTi = T乂2)也被同時(shí)量化。顯然當(dāng)設(shè)定某一特定比特率后，視覺重要系數(shù)(邊緣和極平滑區(qū)系數(shù))分配了更多的比特率。本發(fā)明所提出的基于人眼視覺特性的圖像編碼方法，有效地提高了有損壓縮重建圖像的主觀視覺質(zhì)量，使得在滿足一定圖像質(zhì)量條件下，用盡可能少的比特?cái)?shù)來(lái)表示原始圖像，以提高圖像傳輸?shù)男屎蜏p少圖像存儲(chǔ)的容量。

圖1是小波系數(shù)樹狀結(jié)構(gòu)。圖2是Lena圖像三級(jí)小波分解效果圖。圖3是本發(fā)明與EZW算法直觀重構(gòu)圖像比較，其中(a)、 (b)分別為Man標(biāo)準(zhǔn)灰度圖像在比特率0. 25b卯下的EZW算法的重構(gòu)圖像和本發(fā)明的重構(gòu)圖像。
具體實(shí)施方案以下結(jié)合具體的實(shí)施例，對(duì)本發(fā)明做進(jìn)一步的闡述。實(shí)施例僅用于對(duì)本發(fā)明做說(shuō)
明而不是對(duì)本發(fā)明的限制。
實(shí)施例1 本實(shí)施例以512X512X8bit的標(biāo)準(zhǔn)Man灰度圖像為例，介紹整個(gè)圖像編碼過(guò)程，
并在最后用表格及圖像形式表示編碼結(jié)果和重建圖像的主觀視覺質(zhì)量效果。 1、對(duì)小波變換后的系數(shù)進(jìn)行主掃描選取標(biāo)準(zhǔn)Man灰度圖像(原始圖像)作為編碼對(duì)象，采用D (9， 7)雙正交小波進(jìn)行
小波變換，掃描每一個(gè)小波系數(shù)以產(chǎn)生系數(shù)符號(hào)。
(1)如果系數(shù)幅度大于閾值T且為正數(shù)，輸出符號(hào)P ; (2)如果系數(shù)幅度大于閾值T且為負(fù)數(shù)，，輸出符號(hào)N ; (3)如果系數(shù)幅度小于閾值T但大于閾值T/2且為正數(shù)，而樹枝中的4個(gè)孩子節(jié)點(diǎn) 系數(shù)熵值小于閾值S或者方差大于閾值A(chǔ)，輸出符號(hào)R; (4)如果系數(shù)幅度小于閾值T但大于閾值T/2且為負(fù)數(shù)，而樹枝中的4個(gè)孩子節(jié)點(diǎn) 系數(shù)熵值小于閾值S或者方差大于閾值A(chǔ)，輸出符號(hào)S; (5)如果系數(shù)不滿足上面四者之一，而樹枝中有子節(jié)點(diǎn)系數(shù)值大于閾值T，則用符號(hào)Z表示； (6)如果系數(shù)及其所有節(jié)點(diǎn)系數(shù)均小于T，而且該系數(shù)又不滿足邊緣平滑區(qū)系數(shù) 條件，則該系數(shù)為零樹根，輸出T。 2、對(duì)小波系數(shù)輔掃描，量化帶符號(hào)P、 N、 R和S的系數(shù)并進(jìn)行編碼 (l)對(duì)于P和N的量化。在量化系數(shù)之前要構(gòu)造量化器。量化器的輸入間隔為 (2)對(duì)于符號(hào)R和S，由于它們對(duì)應(yīng)了圖像邊緣或平滑區(qū)，量化器的輸入間隔為在完成主掃描和輔掃描之后輸出是符號(hào)集{P，N，R，S，T，Z，0，1}中的一系列符號(hào)。
最后采用Huffman編碼可得到最終的可傳輸編碼碼流。 3、結(jié)果分析由于PSNR對(duì)評(píng)價(jià)圖像的主觀視覺效果具有一定的局限性，本方法采用更接近主觀視覺評(píng)價(jià)質(zhì)量的MSSIM值以及VIF值作為圖像質(zhì)量評(píng)價(jià)指標(biāo)來(lái)衡量重構(gòu)圖像的實(shí)際主觀視覺質(zhì)量，其中MSSIM和VIF值越大，表明恢復(fù)圖像的主觀質(zhì)量越好。圖3中的(a)和(b) 分別是Man標(biāo)準(zhǔn)灰度圖像在比特率O. 25b卯下的EZW算法的恢復(fù)圖像和本發(fā)明的恢復(fù)圖像。圖(b)的邊緣比圖(a)的邊緣更加清晰，如手表，手背，帽子，頭發(fā)，衣服花紋等邊緣區(qū) 更清晰，具有更好的視覺效果。表1是不同碼率下重構(gòu)圖像的MSSIM和VIF值比較。由表l 可以看出對(duì)于平滑圖像和邊緣豐富圖像本方法相對(duì)于經(jīng)典EZW算法，重構(gòu)圖像具有更好的主觀視覺質(zhì)量。而對(duì)于紋理豐富圖像在低比特率下本方法同樣可以得到更好視覺質(zhì)量的重構(gòu)圖像。表1、本發(fā)明所述的方法與EZW算法的編碼結(jié)果(即MSSIM/VIF值)比較
比特率 /bppLena圖像Man圖像Mandrill圖像EZW本方法EZW本方法EZW本方法
0.1000.758/0.160.761/0.160.621/0.110.631/0.120.382/0.060.419/0.07
90219
0.2000.816/0.250.824/0.260.704/0.190.719/0.210.493/0.110.512/0.13
814991
0.2500.840/0.310.853/0.310.726/0.230.744/0.240.546/0.140.554/0.14
184880
0.5000.890/0.480.901/0.500.817/0.360.831/0.400.636/0.210.659/0.22
33了489
l細(xì)0.927/0.660.935/0.680.904/0.570.卯5/0.580.791/0.350.783/0.32
639864 實(shí)驗(yàn)結(jié)果表明，本發(fā)明能很好地提高有損壓縮重建圖像的主觀視覺質(zhì)量，使得原始圖像在進(jìn)行高壓縮率的有損壓縮編碼后所恢復(fù)的圖像具有更佳的視覺觀測(cè)效果。
權(quán)利要求
一種基于人眼視覺特性的圖像編碼方法，其特征在于首先對(duì)原始圖像進(jìn)行小波分解，然后對(duì)小波系數(shù)根據(jù)熵值和方差進(jìn)行分類，劃分出視覺重要系數(shù)和普通系數(shù)，據(jù)此根據(jù)劃分結(jié)果利用算術(shù)編碼將兩類系數(shù)分類量化編碼得到最終碼流。
2. 根據(jù)權(quán)利要求1所述的基于人眼視覺特性的圖像編碼方法，其特征在于對(duì)原始圖像小波分解后的小波系數(shù)進(jìn)行分類特征如下原始圖像經(jīng)過(guò)小波變換后被分割成水平、垂直、對(duì)角線和低頻4個(gè)頻帶，小波系數(shù)的分布呈樹狀形式分布，水平、垂直和對(duì)角線高頻子帶表征了原始圖像在水平、垂直和對(duì)角線方向的邊緣、輪廓和紋理信息，低頻子帶是對(duì)原始圖像的逼近，將大多數(shù)重要的可視信息壓縮到少量的系數(shù)中，剩下的系數(shù)被粗略地量化或截取為0 ;將小波分解后的系數(shù)分為邊緣系數(shù)，平滑區(qū)系數(shù)以及紋理區(qū)系數(shù)，圖像平滑區(qū)的熵值較小，熵值較大的區(qū)域則屬于圖像邊緣區(qū)或紋理區(qū)，同時(shí)紋理區(qū)對(duì)應(yīng)的方差較小，邊緣區(qū)對(duì) 應(yīng)的方差較大；通過(guò)計(jì)算小波系數(shù)的四個(gè)子節(jié)點(diǎn)的熵值和方差的大小來(lái)反映該小波系數(shù)是否屬于邊緣系數(shù)，平滑系數(shù)還是紋理系數(shù)；若某小波系數(shù)X的4個(gè)子節(jié)點(diǎn)系數(shù)為XI， X2， X3 和X4，該四個(gè)子節(jié)點(diǎn)系數(shù)的熵值定義為 <formula>formula see original document page 2</formula>其中 I(i) = -1og2(probs(Xi))同時(shí)定義四個(gè)子節(jié)點(diǎn)系數(shù)的方差為 D(X)= J]("-柳)2i=U,3,4其中<formula>formula see original document page 2</formula>當(dāng)子節(jié)點(diǎn)系數(shù)的熵值小于某個(gè)閾值s (取值較小)時(shí)，則父節(jié)點(diǎn)系數(shù)為極平滑區(qū)系數(shù)，否則為邊緣或紋理區(qū)系數(shù)，而同時(shí)當(dāng)子節(jié)點(diǎn)系數(shù)方差大于某個(gè)閾值A(chǔ)時(shí)，則父節(jié)點(diǎn)系數(shù)為邊緣區(qū)系數(shù)，否則為紋理區(qū)系數(shù)；對(duì)于最高頻系數(shù)，則以其父節(jié)點(diǎn)系數(shù)的性質(zhì)來(lái)判定，即父節(jié)點(diǎn)系數(shù)為邊緣區(qū)系數(shù)，則其為邊緣區(qū)系數(shù)；邊緣區(qū)系數(shù)和極平滑區(qū)系數(shù)為視覺重要系數(shù)，紋理區(qū)系數(shù)視為普通系數(shù)。
3. 根據(jù)權(quán)利要求1所述的基于人眼視覺特性的圖像編碼方法，其特征在于利用算術(shù)編碼將兩類系數(shù)分類量化編碼，根據(jù)小波系數(shù)分類結(jié)果，定義6種符號(hào)零樹根T、孤立零值Z、正重要系數(shù)P，負(fù)重要系數(shù)N，正視覺重要系數(shù)R和負(fù)視覺重要系數(shù)S，通過(guò)逐次逼近量化完成嵌入式編碼，設(shè)置普通閾值序列T。， 1\，…，TN—工來(lái)決定重要系數(shù)，其中1\ = T卜乂2且初始閾值T。 = 2M，M= 1og2[Max(abs關(guān)]，Xi是小波系數(shù)，同時(shí)設(shè)置視覺閾值系列DT。，Dl\，…， DTN—i來(lái)決定視覺重要系數(shù)，其中Dl\ = DT卜乂2，而DTi = T乂2 ;在某一量化級(jí)1\，對(duì)于相同大小的小波系數(shù)，視覺重要系數(shù)由于量化更精細(xì)而具有更小的量化誤差，更小一級(jí)的視覺重要系數(shù)也被同時(shí)量化。
全文摘要
本發(fā)明屬于圖像處理技術(shù)領(lǐng)域，涉及一種基于人眼視覺特性的圖像編碼方法。本發(fā)明根據(jù)人眼對(duì)圖像邊緣和平滑區(qū)信息的失真要比紋理區(qū)失真更敏感這一視覺特性，首先對(duì)原始圖像進(jìn)行小波分解，然后將小波變換后的系數(shù)利用熵值和方差進(jìn)行分類為視覺重要系數(shù)和普通系數(shù)，最后采用算術(shù)編碼將不同系數(shù)分類編碼得到最終碼流。本發(fā)明提高了有損壓縮重建圖像的主觀視覺質(zhì)量，使得原始圖像在進(jìn)行高壓縮率的有損壓縮編碼后所恢復(fù)的圖像具有更佳的視覺觀測(cè)效果，因此在大規(guī)模圖像存儲(chǔ)及圖像數(shù)據(jù)傳輸上具有較強(qiáng)的可行性。
文檔編號(hào)H04N7/26GK101783939SQ20091004549
公開日2010年7月21日申請(qǐng)日期2009年1月16日優(yōu)先權(quán)日2009年1月16日
發(fā)明者付偉, 顧曉東, 馬成才申請(qǐng)人:復(fù)旦大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：付偉;顧曉東;馬成才
技術(shù)所有人：復(fù)旦大學(xué)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

人眼視覺特性相關(guān)技術(shù)

人眼的視覺特性相關(guān)技術(shù)

人眼的基本視覺特性相關(guān)技術(shù)

視覺特性相關(guān)技術(shù)

人的視覺特性相關(guān)技術(shù)

駕駛員視覺特性相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于人眼視覺特性的圖像編碼方法