專利名稱:基于感興趣區(qū)域的圖像序列無損壓縮的編解碼方法
技術領域:
本發(fā)明涉及基于感興趣區(qū)域的圖像序列的無損壓縮方法,主要應用于運動圖像序列。
技術背景-視頻所包含的信息量是人類感知的所有信息中最大的,但用于表示視頻的數(shù)據(jù)量也是 非常大的,如果不進行壓縮編碼,其存儲與網絡傳輸都存在很大的問題。多媒體技術和Internet的應用與發(fā)展所面臨的主要問題之一就是解決對龐大的圖像信息的表示、傳輸和存 儲,而解決這一問題的根本方法就是圖像壓縮,圖像壓縮就是在沒有失真或者沒有明顯失 真的前提下,將圖像的位圖信息轉變成另外一種能將圖像數(shù)據(jù)量縮減的表示形式。圖像壓 縮分為無損壓縮和有損壓縮兩大類,無損壓縮可以無失真地重構圖像信息。 一些成像設備 價格極其昂貴,圖像的獲取代價很大,實際中有些應用要求這種壓縮是無損的,每是其壓 縮圖像的壓縮比很低,隨著圖像數(shù)據(jù)量的增長,對整幅圖像都進行無損壓縮這種方法不能 滿足實際應用中對高壓縮比的要求。有損壓縮可以獲得較高的壓縮比,但是它不能保證圖 像的有用信息不丟失,圖像重構質量也相對較差。在實際應用中, 一幅圖像中的部分信息較重要,該區(qū)域稱為感興趣區(qū)域(ROI)。在醫(yī)學 圖像中,醫(yī)生只對病變部分感興趣,在遙感圖像中,只對目標存在的區(qū)域感興趣?;诟?興趣區(qū)域(ROI)的圖像序列無損壓縮方法,就是在圖像的感興趣區(qū)域采用無損壓縮,從而保 證了重要信息不丟失,而在其他區(qū)域為了提高圖像的壓縮比,則采用有損壓縮,兼顧了圖 像質量和壓縮比的要求。JPEG-IS是ISO/ITU —新批準的圖像無損壓縮標準。其實早在JPEG2000中就提出來圖 像無損壓縮的國際標準。而針對視頻的無損壓縮方法標準較少, 一種是單獨對每一幀采用無損壓縮方法,完全 不考慮時間軸上的相關性,另外主要是在現(xiàn)有的有損壓縮標準基礎上,例如MPEG-2, H. 264, AVS等,將其中有損的子算法去掉,實現(xiàn)視頻的無損壓縮功能。而目前的國際標準以及其它 非標準壓縮方法都是采用運動預測等技術來去除時間軸上的相關性的。
發(fā)明內容
本發(fā)明的目的在于提供基于感興趣區(qū)域的運動圖像序列的無損壓縮的編解碼方法,在 保證感興趣區(qū)域圖像信號無失真恢復的前提下,大大地提高了圖像的壓縮比。 本發(fā)明是通過如下步驟來完成對感興趣區(qū)域圖像序列信號進行壓縮的感興趣區(qū)域提取步驟根據(jù)需要手動選擇或者以圖像識別的結果作為參考,在視頻中 確定感興趣區(qū)域。分塊步驟根據(jù)輸入信號,對圖像序列,也就是多維數(shù)據(jù)信號各個分量進行分塊,在 行、列以及時間軸上,選擇合適的塊的大小,組成一個立方體塊,或者稱為三維矩陣塊。 根據(jù)計算復雜度和方塊效應及與現(xiàn)有標準的兼容,通常分為8X8X8的塊。矩陣變換步驟對三維子矩陣進行四維n階正交變換,計算出三維圖像序列子塊的變 換系數(shù)矩陣;熵編碼步驟對正交變換完的三維矩陣進行掃描、熵編碼,得到圖像序列信號三維矩 陣的編碼矩陣,完成對視頻信號的壓縮。四維n階正交變換哈達瑪矩陣生成步驟根據(jù)給出的低階四維哈達瑪正交矩陣,利用 多維克羅內科乘積的方法,產生高階的四維正交哈達瑪矩陣。所說的四維n階矩陣正交變換包括四維n階矩陣正變換四維n階矩陣逆變換所說的四維n階正交哈達瑪矩陣,其四維二階正交哈達瑪矩陣表述如下1 1 1 1—1廠—1 -1—-l -l1 -1_1 -1—-l 1所說的多維克羅內科乘積的產生辦法A和B是同維的多維矩陣,則稱如下的分塊矩陣爿②B二(a,,,司,,,,,,為A與\ <1'2 、 〃乂]x/2^2X…x/丄B的多維克羅內科積直積和張量積;根據(jù)四維二階的哈達瑪正交矩陣和多維克羅內科乘積方法,可以產生四維四階、四維 八階等哈達瑪正交矩陣。技術效果是本發(fā)明全面考慮了圖像序列信號的行與行之間,列與列之間,時間軸上 幀與幀之間的冗余信息,并考慮了時間、空間的整體變換性,從而在保證信號無失真恢復的前提下提高了數(shù)字視頻信號的壓縮比。
圖1本發(fā)明所指的基于感興趣區(qū)域的圖像序列無損壓縮的編解碼方法的流程圖。
具體實施例方式以下結合附圖進一步說明本發(fā)明的具體內容及其實施方式。本發(fā)明的核心內容是在圖像序列信號壓縮方法中引入了四維n階矩陣的定義及其算法 的定義,并引入了相應的四維n階矩陣正交變換,并全新提出了哈達瑪四維n階正交矩陣, 以及它的克羅內科乘積產生辦法。而感興趣區(qū)域的提取和熵編碼均為現(xiàn)有技術。若無特別聲明,本文將用R表示實數(shù)域,用C表示復數(shù)域,用H表示四元數(shù)域,F(xiàn)e{R;C; H}。四維矩陣定義F上的四維數(shù)據(jù)排列表[fl^]稱為IxJxSxT階四維矩陣。 四維n階矩陣定義對于任意的IxJxSxT階四維矩陣A,若其階數(shù)滿足I=J=S=T=n,艮卩J/x./xSxr =["y,,] x x x 時,則稱A為四維n階矩陣,記為4^=["扭]^。顯然,四維n階矩陣就是四維n階方 陣,是一類特殊的四維矩陣。以下用大寫字母A, B, C等來表示一個四維n階矩陣。當需要說明四維矩陣的階數(shù)n 時,可用符號4v,n來表示。四維n階矩陣性質(1) 當^v,n 二[a一;U,n四個變量zV,W中的任何一個取為常數(shù),而其余的三個變量從最小值變到最大值時,就構成了一個三維立方體矩陣數(shù)據(jù)表,稱為立方體向量;(2) 當四個變量中的任何兩個取為常數(shù),而其余的兩個變量從最小值變到 最大值時,就構成了一個平面方形數(shù)據(jù)表,稱為平面方形向量(類似于通常意義上的二 維方陣);四維n階矩陣運算準則1、 相等如果對于任意的四維n階矩陣4v,n ^a一]^和^vn =[ JIV,n,若它們的對應元素相等,即"樹=6扭,(1S K w;w; " w; l《K w) 我們就說四維n階矩陣A與B相等,并記之為A=B。每一個元素都是零的四維n階矩陣叫做零四維n階矩陣,仍用符號0來表示。2、 加法設四維n階矩陣<formula>formula see original document page 6</formula>,則四維n階矩陣的加法定義為<formula>formula see original document page 6</formula>我們把上式稱為A與B的和,記為C:A+B。
3、 數(shù)乘設meF,neF ; A、 B是任意四維n階矩陣,則其數(shù)乘定義為[wx]IVn ,記為mA, 即四維n階矩陣的每一個元素都乘以數(shù)m。
4、 四維n階矩陣乘法為不失一般性,設有四維n階矩陣4^ = [%]IV,n , &, = [~JIV,n , CIV,n = n ,則四維n階矩陣乘法定義為以下等式成立<formula>formula see original document page 6</formula>可記為C二^8。
5、 四維n階單位矩陣已知四維n階矩陣<formula>formula see original document page 6</formula>單位矩陣,記為£,如果"輛<formula>formula see original document page 6</formula>則稱4v,n為四維n階
易證,對于任意四維n階矩陣4v,恒有:<formula>formula see original document page 6</formula>
6、 四維n階矩陣的轉置運算準則設四維II階矩陣<formula>formula see original document page 6</formula>如果滿足<formula>formula see original document page 6</formula>則稱SIVn為4Vn轉置矩陣,記為wIV,n)T。若<formula>formula see original document page 6</formula>)T ,則稱4v^為四維II階對稱矩陣。
7、 多維矩陣的克羅內科積設<formula>formula see original document page 6</formula>A和B是同維的多維矩陣'則稱如下的分塊矩陣為A與B的克羅內科積(直積、張量積)。哈達瑪矩陣是一類特殊的正交方陣,其元素由+1和-1構成,并且矩陣的任意兩行相互 正交。利用西爾維斯特構造法,我們可以生成階數(shù)為2K的哈達瑪矩陣<formula>formula see original document page 7</formula>2S《e7V,符號" "表示多維克羅內克乘c8、四維n階矩陣變換 四維n階矩陣正變換 5T,'III,n四維n階矩陣逆變換其中^H,n為上一步驟-分塊步驟中分好塊的圖像序列三維子塊,A^為變換后的三維系 數(shù),//n,n為通常意義下的二維哈達瑪正交變換矩陣,//^n為本發(fā)明給出的四維n階哈達瑪 正交變換矩陣。因此,圖像序列的三個分量分別由三維矩陣的三個縱向平面表示。圖像序列的這種表 示就把他的各象素的位置關系、時間方向的相關性建筑在同一模型中。我們就可以用多維 矩陣的方法處理運動圖像序列,充分利用了各個分量間的相關性,從而實現(xiàn)進一步的能量 壓縮。
權利要求
1、一種基于感興趣區(qū)域的圖像序列無損壓縮的編解碼方法,其特征在于通過如下步驟來完成對感興趣區(qū)域圖像序列信號進行壓縮的感興趣區(qū)域提取步驟根據(jù)需要手動選擇或者以圖像識別的結果作為參考,在視頻中確定感興趣區(qū)域;分塊步驟根據(jù)輸入信號,對圖像序列,即多維數(shù)據(jù)信號各個分量進行分塊,在行、列以及時間軸上,選擇2m的塊的大小,m取正整數(shù),組成一個立方體塊,即為三維矩陣塊;根據(jù)計算復雜度和方塊效應及與現(xiàn)有標準的兼容,通常取m=3,即8×8×8的塊;矩陣變換步驟對三維子矩陣進行四維n階矩陣正交變換,計算出三維圖像序列子塊的變換系數(shù)矩陣;熵編碼步驟對正交變換完的三維矩陣進行掃描、熵編碼,得到圖像序列信號三維矩陣的編碼矩陣,完成對視頻信號的壓縮;四維n階正交變換哈達瑪矩陣生成步驟根據(jù)給出的低階四維哈達瑪正交矩陣,利用多維克羅內科乘積的方法,產生高階的四維正交哈達瑪矩陣。
2、 根據(jù)權利要求l所述的基于感興趣區(qū)域的圖像序列無損壓縮的編解碼方法,其特征 在于所說的四維n階矩陣正交變換包括四維ll階矩陣正變換 <formula>formula see original document page 2</formula>四維n階矩陣逆變換<formula>formula see original document page 2</formula> 。
3、 根據(jù)根據(jù)權利要求l所述的基于感興趣區(qū)域的圖像序列無損壓縮的編解碼方法,其 特征在于所說的四維n階正交哈達瑪矩陣,其四維二階正交哈達瑪矩陣表述如下<formula>formula see original document page 2</formula>
4、根據(jù)權利要求1所述的基于感興趣區(qū)域的圖像序列無損壓縮的編解碼方法,其特征在于所說的多維克羅內科乘積的產生辦法A和B是同維的多維矩陣,則稱如下的分塊矩陣爿(S)S-(a,, ,5),,,,,, 為A與B的多維克羅內科積直積和張量積;根據(jù)四維二階的哈達瑪正交矩陣和多維克羅內科乘積方法,可以產生四維四階、四維 八階等哈達瑪正交矩陣。
全文摘要
本發(fā)明涉及基于感興趣區(qū)域的圖像序列的無損壓縮方法,主要應用于運動圖像序列?;诟信d趣區(qū)域的運動圖像序列的無損壓縮的編解碼方法,在保證感興趣區(qū)域圖像信號無失真恢復的前提下,大大地提高了圖像的壓縮比。具體步驟如下感興趣區(qū)域提取步驟;分塊步驟;矩陣變換步驟;熵編碼步驟;四維n階正交變換哈達瑪矩陣生成步驟。本發(fā)明的核心內容是在圖像序列信號壓縮方法中引入了四維n階矩陣的定義及其算法的定義,并引入了相應的四維n階矩陣正交變換,并全新提出了哈達瑪四維n階正交矩陣,以及它的克羅內科乘積產生辦法。
文檔編號H04N7/26GK101257629SQ20081005039
公開日2008年9月3日 申請日期2008年2月26日 優(yōu)先權日2008年2月26日
發(fā)明者鶴 張, 桑愛軍, 巖 趙, 陳綿書, 陳賀新 申請人:吉林大學