專利名稱:一種快速的雙目立體視頻分形壓縮與解壓縮方法
技術(shù)領(lǐng)域:
本發(fā)明屬于視頻壓縮編碼領(lǐng)域,涉及雙目立體視頻的壓縮編碼,在保證峰值信噪比PSNR基本保持不變的前提下,極大地降低了運算復(fù)雜度和提高壓縮比,為雙目立體視頻編碼的實時性應(yīng)用奠定了基礎(chǔ),進一步提高了分形視頻壓縮編碼的性能。
背景技術(shù):
分形理論最初由Mandelbrot于上世紀70年代提出(參見Benoit B. Mandelbrot. The Fractal Geometry of Nature[M]. New York H. Freeman and Company,1982.)。 分形編碼的數(shù)學(xué)基礎(chǔ)是迭代函數(shù)系統(tǒng)(IFS)理論。Barnsley首先將分形編碼用于交互式圖像壓縮(參見 Michael F. Barns ley, Alan D. Sloan. A better way to compress image [J]. Byte Magazine,1988,13 (1) :215_233.)。Jacqain 提出了全自動的分形圖像壓縮方法(參見 Arnaud E. Jacquin. A novel fractal blocking-coding technique for digital image[C]. IEEE International Conference on Acoustics,Speech and Signal Processing,1990,4 2225~2228.),(參見 Arnaud Ε.Jacquin. Fractal image coding a review[J]. Proceeding of the IEEE,1993,81 (10) :1451_1465.),該方法釆用基于圖像分塊的方式以局部的仿射變換代替全局的仿射變換。之后,F(xiàn)isher利用四叉樹改進了這一方法(參見 Y. Fisher. Fractal Image Compression [J]. Fractals,1994,2 (3) 347-361.),(參見 Y. Fisher,E. W. Jacobs. Image compression :A study the iterated transform method[J]. Signal Processing,1992,29 (3),251-263.),(參見 Y.Fisher. Fractal Image Compression Theory and application to digital images[M]. New York =Spring-Verlag, 1995,55-77.),大大提高了編碼效率,并成為目前分形圖像編碼中的主流方法。 在此基礎(chǔ)之上,一些學(xué)者和研究人員把分形圖像壓縮的方法應(yīng)用到視頻序列的壓縮上。Meiqing Wang等提出了綜合基于數(shù)據(jù)立方體和基于幀的分形視頻壓縮方法(參見 Meiqing Wang, Choi-Hong Lai. A hybrid fractal video compression method[J]. Computers Mathematics with Applications,2005,50 (3-4) :611_62L),(參見 Meiqing Wang,Zhehuang Huang,Choi—Hong Lai. Matching search in fractal video compression and its parallel implementation in distributed computing environments[J]. Applied Mathematical Modeling,2006,30 (8) :677-687.), ( # B Meiqing Wang, Rong Liu, Choi-Hong Lai. Adaptive partition and hybrid method in fractal video compression[J]. Computers & Mathematics with Applications,2006,51(11) 1715-1726.) ο 其中最為經(jīng)典和影響較大的參見(C.S.Kim,R.C.Kim,S. U. Lee. Fractal coding of video sequence using circular prediction mapping and noncontractive interframe mapping[J]. IEEE Transactions on Image Processing,1998,7(4) 601-605.)。該方法采用類似于標準視頻編碼方法所采用的運動估計/補償技術(shù),該方法利用了相鄰幀之間的時間強相關(guān)性,對視頻序列壓縮取得了較好的效果。在CPM和NCIM中,子塊域中的每個圖像塊都由來自相鄰幀相同大小的父塊域通過運動補償?shù)玫?。CPM和NCIM 兩者間最大的不同在于CPM在解碼的過程中需要具備收斂性,而NCIM不需要。但是在循環(huán)預(yù)測編碼(CPM)方法中,為了保證起始幀經(jīng)過自身的循環(huán)解碼能夠近似收斂到原來的圖像,壓縮過程需要經(jīng)過復(fù)雜變換、搜索和迭代等,壓縮時間和圖像質(zhì)量難以達到要求。目前典型的分形圖像和視頻壓縮方法的運算量很大,編碼速度較慢,并且解碼的質(zhì)量有待提高, 使得分形圖像和視頻壓縮方法還需要進一步的改進和提高。
隨著多媒體技術(shù)的不斷發(fā)展,多視點視頻因其具有單目視頻無法比擬的優(yōu)越性漸漸成為研究的熱點。而雙目立體視頻是多視點視頻中應(yīng)用最為廣泛的一種形式,它增加了場景的深度信息,使欣賞到的圖像有強烈的現(xiàn)實感和逼真感,可以應(yīng)用于立體電視,遠程教育,遠程工業(yè)控制,遠程醫(yī)學(xué)診斷和虛擬現(xiàn)實等眾多領(lǐng)域(參見A Schertz. Source coding of stereoscopic television pictures[C]. Proceedings of the IEEE International Conference on Image Processing and its Applications. Maastricht, The Netherlands,1992,462-464)。雙目立體視頻是利用人眼睛的雙目視差原理,雙目各自獨立地接收來自同一場景的特定攝像點的左右圖像,左眼看偏左的圖像,右眼看偏右的圖像,形成雙目視差,大腦能得到圖像的深度信息,使欣賞到的圖像有強烈深度感、逼真感,觀眾能欣賞到超強的立體視覺效果。但是相對于單目視頻,雙目立體視頻系統(tǒng)必須傳輸和存儲翻番的數(shù)據(jù)量,所以必須對其進行有效地壓縮。(參見Shigang Wang,Xuejun Wang,Hexin Chen.Stereoscopic video compression coding based on H. 264[J]. Chinese Journal of Stereology and Image Analysis,2008,13 (1) :11_16)在雙目立體視頻編碼過程中,不但要考慮各通道內(nèi)前后幀圖像之間的時域相關(guān)性和幀內(nèi)圖像的空域相關(guān)性,還要充分利用通道之間的空域相關(guān)性進行編碼。前者可以利用運動補償預(yù)測(MCP)去除冗余,后者可以采用視差補償預(yù)測(DCP)去除通道間冗余。DCP 與MCP相比要復(fù)雜的多,其中的關(guān)鍵技術(shù)是視差匹配。Michael Ε. Lukaces是雙目立體視頻編碼的早期研究者,他探索了將視差補償(DC-based)(指使用雙目視差關(guān)系在兩幅圖像之間建立對應(yīng))用于從雙目立體視頻序列中的一個視頻序列預(yù)測另一個視頻序列,并提出了多種基于視差補償?shù)姆椒?參見 Lukacs M E. Predictive coding of multi-viewpoint image sets[C]. IEEE International Conference on Acoustics, Speech and Signal Processing, 1986,521-524)。Perkins將基于視差補償?shù)姆椒w納為一種條件編碼方法,對于無損編碼來說是最優(yōu)的,對于有損編碼則是次優(yōu)的(參見Perkins M G. Data compression of stereo pairs[J]. IEEE Transactions on Communications,1992,40(4) 684-696)。Tzovaras等人提出了視差估計的分層塊匹配以及運動視差雙向補償方法,稱之為聚合估計(參見 Tzovaras D,Grammalidis N, Strintzis M G. Object-based coding of stereoscopic image sequences using joint 3D motion/disparity segmentation[C]. Proceedings of SPIE :Visual Communication and Image Processing,1995,1678-1689)。 另外Franich還提出了基于通用塊匹配算法的視差估計方法,并引入一種平滑檢測手段來 if ^EKlifif ( Franch R E H, Lagendijk R L, Biemond J. Stereo-enhanced displacement estimation by genetic block matching[C]. Proceedings of SPIE Volume 2094-Visual Communications and Image Processing. Cambridge, MA, USA, 1993, 362-371)。Siram Sethuramn以及M. Siegel等人提出了基于視差和運動的可變塊四叉樹多分辨率分割方法,針對基于MPEG視頻編碼標準的雙目立體視頻流的編碼,按在解碼端是否有合成中間視圖的需要,提出了兩個雙目立體視頻流的混合分辨率編碼方法(參見 Sethuraman S, SiegelM W, Jordan A G. Segmentation based coding of stereoscopic image sequences[C]. Proceedings of SPIE :Volume 2668-Digital Video Compression Algorithms and Technologies. San Jose,CA,USA,1996,420-429)。常用的雙目立體視頻編碼方案有獨立 MCP(Motion Compensated Prediction)編碼,層間 DCP(Disparity Compensated Prediction)編碼和MCP與DCP相結(jié)合編碼。其中在MCP與DCP相結(jié)合編碼中,基本層采用獨立MCP編碼,增強層采用MCP與DCP兩種方式進行預(yù)測,從中選擇誤差較小的一種作為預(yù)測結(jié)果。本專利申請人已于2010年10月申請了兩個有關(guān)分形雙目視頻編碼的專利一種基于分形的雙目立體視頻壓縮編解碼方法(201010522161. 9 CN 101980538 A)和一種基于對象和分形的雙目立體視頻壓縮編解碼方法(201010522152. X CN 101980537 A)。本發(fā)明與上述公開文獻不同在于1)利用了預(yù)搜索限定條件;2)利用了分數(shù)像素塊匹配;3)利用了基于運動矢量場的自適應(yīng)六邊形搜索算法;4)DCP編碼方式時,充分利用視差分布約束條件;5)解碼中,利用了去方塊環(huán)路濾波。因此,編碼性能有了很大的改善和提高。
發(fā)明內(nèi)容
本發(fā)明提出了一種快速的雙目立體視頻分形壓縮與解壓縮方法,在編碼中以左通道為基本層,采用單獨的運動補償預(yù)測方式(MCP)進行編碼,首先對左目的起始幀采用塊 DCT變換編碼,對左目的非I幀進行塊運動估計/補償編碼,計算與子塊域和父塊域相關(guān)子塊的像素和與像素平方和,同時計算分數(shù)像素內(nèi)插值對應(yīng)塊的像素和、像素平方和,然后進行預(yù)搜索限制條件判斷,并在前一幀搜索窗中利用分數(shù)像素塊匹配和基于運動矢量場的自適應(yīng)六邊形搜索算法尋找最相似的匹配塊。右通道為增強層,采用MCP加視差補償預(yù)測方式(DCP)進行編碼,選擇誤差最小的作為預(yù)測結(jié)果。在進行DCP編碼方式時,充分利用分數(shù)像素塊匹配和視差分布約束條件。在解碼過程中利用去方塊環(huán)路濾波進行解碼。一種快速的雙目立體視頻分形壓縮方法,包括以下步驟步驟一對于左目,首先判斷是否為I幀,若是I幀,則對該幀進行互不重疊的固定大小的塊劃分,對每一個圖像塊分別采用基于塊DCT變換的I幀幀內(nèi)圖像壓縮方法,對圖像進行單獨編碼和解碼,轉(zhuǎn)到步驟十一;否則,轉(zhuǎn)到步驟二 ;所述I幀為視頻序列起始幀或者視頻序列中只進行幀內(nèi)編碼的圖像幀;所述將當前幀劃分為固定大小的互不重疊的圖像塊稱為宏塊;所述將當前宏塊進行樹狀劃分得到的塊稱為小塊;所述當前幀為正在進行壓縮的幀,所述參考幀為當前幀的已經(jīng)編碼并重建的前一幀;所述當前幀所有塊的集合稱為子塊域;所述前一幀的所有塊的集合稱為父塊域;所述塊DCT變換中的塊采用固定大小模式; 對于右目,轉(zhuǎn)到步驟七;步驟二 若左目為非I幀,用常規(guī)單目的運動補償預(yù)測(MCP)編碼,對該幀進行互不重疊的宏塊劃分,然后計算這些宏塊以及經(jīng)樹狀劃分得到的小塊的像素和、像素平方和, 以及左目前一幀重建圖像即參考幀中,按照設(shè)定步長劃分的所有宏塊以及經(jīng)樹狀劃分得到的小塊的像素和、像素平方和,同時計算分數(shù)像素內(nèi)插值對應(yīng)塊的像素和、像素平方和,轉(zhuǎn)到步驟三;
步驟三依次對當前幀的所有宏塊進行編碼,在父塊域中的搜索窗內(nèi)首先對該宏塊進行塊匹配;在進行子塊與父塊的匹配過程中,子塊的位置作為父塊的起始搜索點,父塊的大小與子塊的大小相同,轉(zhuǎn)到步驟四;步驟四利用基于運動矢量場的自適應(yīng)六邊形搜索算法,然后利用分數(shù)像素塊匹配,搜索分數(shù)像素內(nèi)插值對應(yīng)小塊處的RMS點,搜索出最佳的匹配誤差RMS,轉(zhuǎn)到步驟五;步驟五預(yù)搜索限制條件判斷對于特定的子塊,若與父塊對應(yīng)值滿足預(yù)搜索限制條件,則轉(zhuǎn)到步驟六;否則直接保存當前的迭代函數(shù)系統(tǒng)系數(shù)即IFS系數(shù),轉(zhuǎn)入步驟三編碼下一宏塊;步驟六如果匹配誤差RMS小于開始設(shè)定的閾值Y,保存當前的迭代函數(shù)系統(tǒng)系數(shù)即IFS系數(shù),轉(zhuǎn)入步驟三編碼下一宏塊;否則,依次按照樹狀結(jié)構(gòu)對該塊進行劃分,并對各個劃分得到的小塊利用分數(shù)像素塊匹配和基于運動矢量場的自適應(yīng)六邊形搜索算法,分別計算匹配誤差RMS,如果RMS小于設(shè)定閾值Y,則停止劃分并記錄該小塊IFS系數(shù),轉(zhuǎn)入步驟三編碼下一宏塊;否則繼續(xù)劃分,直到將當前塊劃分為預(yù)先設(shè)定的最小塊,記錄IFS系數(shù);轉(zhuǎn)入步驟三編碼下一宏塊;所述搜索窗為在參考幀中的矩形搜索區(qū)域;所述IFS系數(shù)包括父塊位置(x,y)和比例因子s、偏移因子0 ;如果當前幀所有的宏塊都已編碼完畢,且是左目,則轉(zhuǎn)到步驟十一;若是右目,則執(zhí)行步驟八;步驟七對右目圖像,首先進行互不重疊的宏塊劃分,然后計算這些宏塊以及經(jīng)樹狀劃分得到的小塊的像素和、像素平方和,以及右目前一幀重建圖像參考幀,按照設(shè)定步長劃分的所有宏塊以及經(jīng)樹狀劃分得到的小塊的像素和、像素平方和,同時計算分數(shù)像素內(nèi)插值對應(yīng)塊的像素和、像素平方和,以減少塊匹配過程中的重復(fù)計算,轉(zhuǎn)到步驟三;步驟八計算左目中對應(yīng)幀圖像參考幀,按照設(shè)定步長劃分的所有宏塊以及經(jīng)樹狀劃分得到的小塊的像素和、像素平方和,同時計算分數(shù)像素內(nèi)插值對應(yīng)塊的像素和、像素平方和,以減少塊匹配過程中的重復(fù)計算,轉(zhuǎn)到步驟九;步驟九首先對與當前子塊位置相同的父塊進行塊匹配,得到RMS,并保存迭代函數(shù)系統(tǒng)系數(shù),該系數(shù)包括父塊與子塊的相對位移矢量(X,y),比例因子S和偏移因子O;依次對當前幀的所有宏塊進行編碼,在父塊域中的搜索窗內(nèi)首先對該宏塊進行塊匹配;在進行子塊與父塊的匹配過程中,子塊的位置作為父塊的起始搜索點,父塊的大小與子塊的大小相同并轉(zhuǎn)入步驟十,執(zhí)行完步驟十返回之后,如果所得的匹配誤差RMS小于開始設(shè)定的閾值Y,則保存當前的迭代函數(shù)系統(tǒng)系數(shù)即IFS系數(shù),轉(zhuǎn)入步驟九編碼下一宏塊;否則,依次按照樹狀結(jié)構(gòu)對該塊進行劃分,并對各個劃分得到的小塊分別轉(zhuǎn)入步驟十,執(zhí)行完步驟十返回之后計算匹配誤差RMS,如果RMS小于設(shè)定閾值Y,則停止劃分并記錄該小塊IFS系數(shù),轉(zhuǎn)入步驟九編碼下一宏塊;否則繼續(xù)劃分,直到將當前塊劃分為預(yù)先設(shè)定的最小塊,轉(zhuǎn)入步驟十計算RMS,執(zhí)行完步驟十返回之后記錄IFS系數(shù),轉(zhuǎn)入步驟九編碼下一宏塊;最后與步驟六所得結(jié)果比較,選擇誤差最小的作為預(yù)測結(jié)果;所述搜索窗為在參考幀中的矩形搜索區(qū)域;所述IFS系數(shù)包括父塊位置(X,y)和比例因子s、偏移因子ο ;如果當前幀所有的宏塊都已編碼完畢,則轉(zhuǎn)到步驟十一;步驟十充分利用分數(shù)像素塊匹配和視差分布約束條件將上一個視差估計矢量作為當前幀的搜索中心,在水平方向沿初始點的右側(cè)進行搜索,在搜索過程中進行跳躍式搜索;點匹配完之后,向右間隔三個點進行搜索,進行比較,直到找到最小的RMS ;同時對分數(shù)像素位置進行相同的操作,比較得到更小的RMS,結(jié)束DCP搜索過程;步驟十一對所有IFS系數(shù)進行Huffman編碼,降低IFS系數(shù)數(shù)據(jù)的統(tǒng)計冗余;判斷當前幀是否為最后一幀,如果是最后一幀結(jié)束編碼;否則,返回步驟一繼續(xù)處理下一幀圖像。所述一種快速的雙目立體視頻分形壓縮方法,處理的視頻序列為YUV格式,分別對3個分量中的每個采用上述十一個步驟進行處理。所述步驟四中分數(shù)像素塊匹配,包括以下三個步驟1)對參考幀中搜索區(qū)域內(nèi)的像素進行內(nèi)插形成一個更高分辨率的區(qū)域;2)在內(nèi)插區(qū)域進行整數(shù)像素和半像素位置搜索找到最佳匹配;3)用匹配塊的仿射變換來替代當前塊。所述步驟四中基于運動矢量場的自適應(yīng)六邊形搜索算法,充分根據(jù)分形編碼的特點,具體如下1)在小十字模式中的五個搜索點中搜索最小匹配誤差所在點;應(yīng)用塊匹配準則搜索,如果最小匹配誤差點在小十字模式的中心,此時即得到最終要求的最佳匹配誤差;否則,轉(zhuǎn)入步驟2);2)以步驟1)搜索到的最小匹配誤差點為中心構(gòu)造新的小十字模式,應(yīng)用塊匹配準則,搜尋3個新的搜索點;再搜索最小匹配誤差點,如果搜索到的最小匹配誤差點在小十字模式的中心,即得到最終要求的最佳匹配誤差;否則,進入步驟3);3)搜索大十字模式3個還沒有搜索到的點,應(yīng)用塊匹配準則,搜索新的最小匹配誤差點,以作為下一步搜索的中心;4)以上一步的最小匹配誤差點為中心,構(gòu)造六邊形搜索模式,應(yīng)用塊匹配準則搜索,找出新的最小匹配誤差點,如果該點在六邊形的中心,進入步驟5);否則,繼續(xù)步驟4), 直到最小匹配誤差點在六邊形的中心;5)以步驟4)所搜索到的位于六邊形的中心的最小匹配誤差點為中心,構(gòu)造小十字搜索模式,應(yīng)用塊匹配準則搜索,找出最小匹配誤差點,即得到最終要求的最佳匹配誤差。所述步驟五中預(yù)搜索限制條件為以下形式,其中,bi為子塊的像素值, 為父塊的
像素值
權(quán)利要求
1. 一種快速的雙目立體視頻分形壓縮方法,其特征在于具體步驟如下 步驟一對于左目,首先判斷起始幀是否為I幀,若是I幀,則對該幀進行互不重疊的固定大小的塊劃分,對每一個圖像塊分別采用基于塊DCT變換的I幀幀內(nèi)圖像壓縮方法,對圖像進行單獨編碼和解碼,轉(zhuǎn)到步驟十一;否則,轉(zhuǎn)到步驟二 ;所述I幀為視頻序列起始幀或者視頻序列中只進行幀內(nèi)編碼的圖像幀;所述將當前幀劃分為固定大小的互不重疊的圖像塊稱為宏塊;所述將當前宏塊進行樹狀劃分得到的塊稱為小塊;所述當前幀為正在進行壓縮的幀,所述參考幀為當前幀的已經(jīng)編碼并重建的前一幀;所述當前幀所有塊的集合稱為子塊域;所述前一幀的所有塊的集合稱為父塊域;所述塊DCT變換中的塊采用固定大小模式;對于右目,轉(zhuǎn)到步驟七;步驟二 若左目為非I 幀,用常規(guī)單目的運動補償預(yù)測(MCP)編碼,對該幀進行互不重疊的宏塊劃分,然后計算這些宏塊以及經(jīng)樹狀劃分得到的小塊的像素和、像素平方和,以及左目前一幀重建圖像即參考幀中,按照設(shè)定步長劃分的所有宏塊以及經(jīng)樹狀劃分得到的小塊的像素和、像素平方和,同時計算分數(shù)像素內(nèi)插值對應(yīng)塊的像素和、像素平方和,轉(zhuǎn)到步驟三;步驟三依次對當前幀的所有宏塊進行編碼,在父塊域中的搜索窗內(nèi)首先對該宏塊進行塊匹配;在進行子塊與父塊的匹配過程中,子塊的位置作為父塊的起始搜索點,父塊的大小與子塊的大小相同,轉(zhuǎn)到步驟四;步驟四利用基于運動矢量場的自適應(yīng)六邊形搜索算法,然后利用分數(shù)像素塊匹配,搜索分數(shù)像素內(nèi)插值對應(yīng)小塊處的RMS點,搜索出最佳的匹配誤差RMS,轉(zhuǎn)到步驟五;步驟五預(yù)搜索限制條件判斷對于特定的子塊,若與父塊對應(yīng)值滿足預(yù)搜索限制條件,則轉(zhuǎn)到步驟六;否則直接保存當前的迭代函數(shù)系統(tǒng)系數(shù)即IFS系數(shù),轉(zhuǎn)入步驟三編碼下一宏塊;步驟六如果匹配誤差RMS小于開始設(shè)定的閾值Y,保存當前的迭代函數(shù)系統(tǒng)系數(shù)即 IFS系數(shù),轉(zhuǎn)入步驟三編碼下一宏塊;否則,依次按照樹狀結(jié)構(gòu)對該塊進行劃分,并對各個劃分得到的小塊利用分數(shù)像素塊匹配和基于運動矢量場的自適應(yīng)六邊形搜索算法,分別計算匹配誤差RMS,如果RMS小于設(shè)定閾值Y,則停止劃分并記錄該小塊IFS系數(shù),轉(zhuǎn)入步驟三編碼下一宏塊;否則繼續(xù)劃分,直到將當前塊劃分為預(yù)先設(shè)定的最小塊,記錄IFS系數(shù); 轉(zhuǎn)入步驟三編碼下一宏塊;所述搜索窗為在參考幀中的矩形搜索區(qū)域;所述IFS系數(shù)包括父塊位置(X,y)和比例因子s、偏移因子ο;如果當前幀所有的宏塊都已編碼完畢,且是左目,則轉(zhuǎn)到步驟十一;若是右目,則執(zhí)行步驟八;步驟七對右目圖像,首先進行互不重疊的宏塊劃分,然后計算這些宏塊以及經(jīng)樹狀劃分得到的小塊的像素和、像素平方和,以及右目前一幀重建圖像參考幀,按照設(shè)定步長劃分的所有宏塊以及經(jīng)樹狀劃分得到的小塊的像素和、像素平方和,同時計算分數(shù)像素內(nèi)插值對應(yīng)塊的像素和、像素平方和,以減少塊匹配過程中的重復(fù)計算,轉(zhuǎn)到步驟三;步驟八計算左目中對應(yīng)幀圖像的參考幀,按照設(shè)定步長劃分的所有宏塊以及經(jīng)樹狀劃分得到的小塊的像素和、像素平方和,同時計算分數(shù)像素內(nèi)插值對應(yīng)塊的像素和、像素平方和,以減少塊匹配過程中的重復(fù)計算,轉(zhuǎn)到步驟九;步驟九首先對與當前子塊位置相同的父塊進行塊匹配,得到RMS,并保存迭代函數(shù)系統(tǒng)系數(shù),該系數(shù)包括父塊與子塊的相對位移矢量(x,y),比例因子s和偏移因子ο ;依次對當前幀的所有宏塊進行編碼,在父塊域中的搜索窗內(nèi)首先對該宏塊進行塊匹配;在進行子塊與父塊的匹配過程中,子塊的位置作為父塊的起始搜索點,父塊的大小與子塊的大小相同并轉(zhuǎn)入步驟十,執(zhí)行完步驟十返回之后,如果所得的匹配誤差RMS小于開始設(shè)定的閾值Y, 則保存當前的迭代函數(shù)系統(tǒng)系數(shù)即IFS系數(shù),轉(zhuǎn)入步驟九編碼下一宏塊;否則,依次按照樹狀結(jié)構(gòu)對該塊進行劃分,并對各個劃分得到的小塊分別轉(zhuǎn)入步驟十,執(zhí)行完步驟十返回之后計算匹配誤差RMS,如果RMS小于設(shè)定閾值Y,則停止劃分并記錄該小塊IFS系數(shù),轉(zhuǎn)入步驟九編碼下一宏塊;否則繼續(xù)劃分,直到將當前塊劃分為預(yù)先設(shè)定的最小塊,轉(zhuǎn)入步驟十計算RMS,執(zhí)行完步驟十返回之后記錄IFS系數(shù),轉(zhuǎn)入步驟九編碼下一宏塊;最后與步驟六所得結(jié)果比較,選擇誤差最小的作為預(yù)測結(jié)果;所述搜索窗為在參考幀中的矩形搜索區(qū)域; 所述IFS系數(shù)包括父塊位置(X,y)和比例因子s、偏移因子ο ;如果當前幀所有的宏塊都已編碼完畢,則轉(zhuǎn)到步驟十一;步驟十充分利用分數(shù)像素塊匹配和視差分布約束條件將上一個視差估計矢量作為為當前幀的搜索中心,在水平方向沿初始點的右側(cè)進行搜索,在搜索過程中進行跳躍式搜索;點匹配完之后,向右間隔三個點進行搜索,進行比較,直到找到最小的RMS ;然后對分數(shù)像素位置進行相同的操作,比較得到更小的RMS,結(jié)束DCP搜索過程;步驟十一對所有IFS系數(shù)進行Huffman編碼,降低IFS系數(shù)數(shù)據(jù)的統(tǒng)計冗余;判斷當前幀是否為最后一幀,如果是最后一幀結(jié)束編碼;否則,返回步驟一繼續(xù)處理下一幀圖像。
2.根據(jù)權(quán)利要求1所述的一種快速的雙目立體視頻分形壓縮方法,其特征在于處理的視頻序列為YUV格式,分別對3個分量中的每個采用上述十一個步驟進行處理。
3.根據(jù)權(quán)利要求1所述的一種快速的雙目立體視頻分形壓縮方法,其特征在于所述步驟四中分數(shù)像素塊匹配,包括以下步驟1)對參考幀中搜索區(qū)域內(nèi)的像素進行內(nèi)插形成一個更高分辨率的區(qū)域;2)在內(nèi)插區(qū)域進行整數(shù)像素和半像素位置搜索找到最佳匹配;3)用匹配塊的仿射變換來替代當前塊。
4.根據(jù)權(quán)利要求1所述的一種快速的雙目立體視頻分形壓縮方法,其特征在于所述步驟四中基于運動矢量場的自適應(yīng)六邊形搜索算法,充分根據(jù)分形編碼的特點,具體如下1)在小十字模式中的五個搜索點中搜索最小匹配誤差所在點;應(yīng)用塊匹配準則搜索, 如果最小匹配誤差點在小十字模式的中心,此時即得到最終要求的最佳匹配誤差;否則,轉(zhuǎn)入步驟2);2)以步驟1)搜索到的最小匹配誤差點為中心構(gòu)造新的小十字模式,應(yīng)用塊匹配準則, 搜尋3個新的搜索點;再搜索最小匹配誤差點,如果搜索到的最小匹配誤差點在小十字模式的中心,即得到最終要求的最佳匹配誤差;否則,進入步驟3);3)搜索大十字模式3個還沒有搜索到的點,應(yīng)用塊匹配準則,搜索新的最小匹配誤差點,以作為下一步搜索的中心;4)以上一步的最小匹配誤差點為中心,構(gòu)造六邊形搜索模式,應(yīng)用塊匹配準則搜索,找出新的最小匹配誤差點,如果該點在六邊形的中心,進入步驟5);否則,繼續(xù)步驟4),直到最小匹配誤差點在六邊形的中心;5)以步驟4)所搜索到的位于六邊形的中心的最小匹配誤差點為中心,構(gòu)造小十字搜索模式,應(yīng)用塊匹配準則搜索,找出最小匹配誤差點,即得到最終要求的最佳匹配誤差。
5.根據(jù)權(quán)利要求1所述的一種快速的雙目立體視頻分形壓縮方法,其特征在于所述步驟五中預(yù)搜索限制條件為以下形式,其中,h為子塊的像素值,Bi為父塊的像素值
6.根據(jù)權(quán)利要求1所述的一種快速的雙目立體視頻分形壓縮方法,其特征在于所述步驟六中對宏塊采用樹狀劃分,塊匹配采用匹配誤差準則,子塊與父塊的匹配誤差RMS為
7.根據(jù)權(quán)利要求1所述的一種快速的雙目立體視頻分形壓縮方法,其特征在于所述步驟十中視差分布約束條件如下1)外極線約束對于左目中的圖像上的一點,通過相對定向參數(shù)找出右目中的圖像上與其對應(yīng)的極線,其對應(yīng)點在上述極線上搜索;對于平行系統(tǒng)的視差搜索,只需沿掃描線,進行χ方向的搜索即可;最佳匹配點位于偏振線上即水平線上;在立體平行攝像系統(tǒng)中,沿水平方向進行DCP搜索;兩攝像機在同一時刻觀看空間同一特征點P (χ。,Jc, ζ。),在左目中的圖像和右目中的圖像的坐標分別Spleft= (Xleft,Yleft) ,Pright= (Xright,Yright);其中點 P(x。,y。,z。)與兩個光心所確定的平面稱為偏振平面,偏振平面與左右圖像的交線稱為偏振線;由幾何關(guān)系得到,其中f表示攝像機的焦距,B為兩攝像機的投影中心連線的距離,即基線距,zc為世界坐標系下特征點P的Z坐標
8.一種快速的雙目立體視頻分形解壓縮方法,包含以下步驟步驟I 首先讀入左目壓縮信息,包括壓縮幀數(shù),每幀圖像的寬和高,I幀壓縮質(zhì)量和插入I幀的間隔;步驟II 判斷解碼幀是否為I幀,若是I幀轉(zhuǎn)入步驟III,否則轉(zhuǎn)入步驟IV ; 步驟III 對于I幀,從壓縮文件中讀入碼流進行解碼,幀數(shù)加一轉(zhuǎn)入步驟VIII ; 步驟IV 對于非I幀,計算左目前一幀中按照設(shè)定步長劃分的所有宏塊以及經(jīng)樹狀劃分得到的小塊的像素和、像素平方和;步驟V 讀入右目壓縮信息,包括壓縮幀數(shù),每幀圖像的寬和高,I幀壓縮質(zhì)量和插入I 幀的間隔;計算右目前一幀和左目對應(yīng)幀中按照設(shè)定步長劃分的所有宏塊以及經(jīng)樹狀劃分得到的小塊的像素和、像素平方和,轉(zhuǎn)入步驟VI ;步驟VI 從對應(yīng)的壓縮文件中讀入塊的劃分信息和Huffman碼流,從而得到該幀所有宏塊的劃分方式和每一個小塊的迭代函數(shù)系統(tǒng)系數(shù),轉(zhuǎn)入步驟VII ;步驟VII 采用去方塊環(huán)路濾波方法首先對邊界的類型進行判斷,定義參數(shù)塊邊緣強度,針對不同強度的塊邊緣,選擇的濾波器和所需要濾波的像素點數(shù)也不一樣,如果為幀內(nèi)編碼且為宏塊邊界,則采用強濾波;若不是幀內(nèi)編碼且不是宏塊邊界,仿射塊邊界采用一級濾波,非仿射塊邊界不需要濾波;其他情況采用二級濾波;最后按照每一宏塊進行解碼;步驟VIII 判斷此時所有幀是否都已解碼,若都解碼完畢,結(jié)束解碼過程,否則轉(zhuǎn)入步驟II。
9.根據(jù)權(quán)利要求8所述的一種快速的雙目立體視頻分形解壓縮方法,其特征在于對于每一個宏塊進行解壓縮時,首先判斷該宏塊在編碼時的劃分方式,對于每一個子塊,首先在父塊域找到與該子塊相對應(yīng)的區(qū)域,然后利用下面的公式獲得該子塊的像素值,Ti = S* di+o(7)其中A為待解碼子塊的像素值,di為父塊域中的像素值,S為比例因子,O為偏移因子。
10.根據(jù)權(quán)利要求8所述的一種快速的雙目立體視頻分形解壓縮方法,所述步驟VII中的塊邊緣強度用BS表示;其中,Pc/ ,Q0' ,P1' ,Q1'表示濾波后的像素值,PwPnQc^Q1表示原始的像素值,不同的BS和對應(yīng)的濾波器如下BS = 3時,需要進行強濾波,濾波器表示為
11.根據(jù)權(quán)利要求8所述的一種快速的雙目立體視頻分形解壓縮方法,其特征在于在快速的雙目分形視頻解壓縮方法過程中,左目用常規(guī)單目的運動補償預(yù)測(MCP)編碼,右目的每個圖像塊通過運動補償預(yù)測(MCP)和視差補償預(yù)測(DCP)兩種方式進行預(yù)測,從中選擇誤差較小的一種作為預(yù)測結(jié)果。
12.根據(jù)權(quán)利要求8所述的一種快速的雙目立體視頻分形解壓縮方法,其特征在于處理的視頻序列為YUV格式,分別對3個分量中的每個采用上述八個步驟進行處理。
全文摘要
本發(fā)明提出了一種快速的雙目立體視頻分形壓縮與解壓縮方法,在編碼中以左通道為基本層,采用單獨的運動補償預(yù)測方式(MCP)進行編碼,首先對左目的起始幀采用塊DCT變換編碼,對左目的非I幀進行塊運動估計/補償編碼,計算與子塊域和父塊域相關(guān)子塊的像素和與像素平方和,同時計算分數(shù)像素內(nèi)插值對應(yīng)塊的像素和、像素平方和,然后進行預(yù)搜索限制條件判斷,并在前一幀搜索窗中利用分數(shù)像素塊匹配和基于運動矢量場的自適應(yīng)六邊形搜索算法尋找最相似的匹配塊。右通道為增強層,采用MCP加視差補償預(yù)測方式(DCP)進行編碼,選擇誤差最小的作為預(yù)測結(jié)果。在進行DCP編碼方式時,充分利用分數(shù)像素塊匹配和視差分布約束條件。在解碼過程中利用去方塊環(huán)路濾波進行解碼。
文檔編號H04N7/50GK102316323SQ20111018875
公開日2012年1月11日 申請日期2011年7月6日 優(yōu)先權(quán)日2011年7月6日
發(fā)明者侯仰拴, 王再闊, 祝世平, 陳菊嬙 申請人:北京航空航天大學(xué)