專利名稱::一種基于對(duì)象的分形視頻壓縮與解壓縮方法
技術(shù)領(lǐng)域:
:本發(fā)明屬于視頻壓縮編碼領(lǐng)域,涉及分形視頻壓縮編碼,特別涉及一種基于對(duì)象的分形視頻壓縮編碼方法。
背景技術(shù):
:基于對(duì)象(Object-Based,簡(jiǎn)稱0B)編碼的概念最早由MPEG-4標(biāo)準(zhǔn)提出,使用基于對(duì)象的視頻壓縮編碼方法使得每一幀視頻的前景對(duì)象和背景對(duì)象得以獨(dú)立的進(jìn)行編碼,可以進(jìn)一步提高壓縮比,同時(shí)在解碼端可以實(shí)現(xiàn)一些新的功能,比如針對(duì)每一個(gè)視頻對(duì)象的獨(dú)立的傳輸和解碼、對(duì)象和背景的替換、基于對(duì)象的視頻檢索、特別是相對(duì)于標(biāo)準(zhǔn)的編碼方法,在對(duì)象的邊界上可以獲得更好的圖像質(zhì)量,因?yàn)槲矬w的邊界通常和圖像中的邊緣相重合是編碼困難的部分?;趯?duì)象的視頻編碼方法可以提高視頻壓縮編碼的性能并使其具有更多的靈活性。分形理論最初由Mandelbrot于上世紀(jì)70年代提出(參見BenoHB.Mandelbrot.TheFractalGeometryofNature[Μ].NewYorkH.FreemanandCompany,1982.)。分形編碼的數(shù)學(xué)基礎(chǔ)是迭代函數(shù)系統(tǒng)(IFS)理論。Barnsley首先將分形編碼用于交互式圖像壓縮(參見MichaelF.BarnsleyiAlanD.Sloan.Abetterwaytocompressimage[J].ByteMagazine,1988,13(1):215_233·)。Jacqain提出了全自動(dòng)的分形圖像壓縮方法(參見ArnaudE.Jacquin.Anovelfractalblocking-codingtechniquefordigitalimage[C].IEEEInternationalConferenceonAcoustics,SpeechandSignalProcessing,1990,42225~2228.),(參見ArnaudΕ.Jacquin.Fractalimagecodingareview[J].ProceedingoftheIEEE,1993,81(10):1451_1465.),該方法釆用基于圖像分塊的方式以局部的仿射變換代替全局的仿射變換。之后,F(xiàn)isher利用四叉樹改進(jìn)了這一方法(參見Y.Fisher.FractalImageCompression[J].Fractals,1994,2(3)347-361.),(參JALY.Fisher,E.W.Jacobs.Imagecompression:Astudytheiteratedtransformmethod[J].SignalProcessing,1992,29(3),251-263.),(參見Y.Fisher.FractalImageCompression:Theoryandapplicationtodigitalimages[M].NewYorkSpring-Verlag,1995,55-77.),大大提高了編碼效率,并成為目前分形圖像編碼中的主流方法。在此基礎(chǔ)之上,一些學(xué)者和研究人員把分形圖像壓縮的方法應(yīng)用到視頻序列的壓縮上。MeiqingWang等提出了結(jié)合基于數(shù)據(jù)立方體和基于幀的分形視頻壓縮方法(參見MeiqingWang,Choi-HongLai.Ahybridfractalvideocompressionmethod[J].Computers&MathematicswithApplications,2005,50(3-4):611_62L),(參見MeiqingWang,ZhehuangHuang,Choi-HongLai.Matchingsearchinfractalvideocompressionanditsparallelimplementationindistributedcomputingenvironments[J].AppliedMathematicalModeling,2006,30(8):677-687.),(#BMeiqingWang,RongLiu,Choi-HongLai.Adaptivepartitionandhybridmethodinfractalvideocompression[J].Computers&MathematicswithApplications,2006,51(11)1715-1726.)ο其中最為經(jīng)典和影響較大的參見(C.S.Kim,R.C.Kim,S.U.Lee.Fractalcodingofvideosequenceusingcircularpredictionmappingandnoncontractiveinterframemapping[J].IEEETransactionsonImageProcessing,1998,7(4)601-605.)。該方法采用類似于標(biāo)準(zhǔn)視頻編碼方法所采用的運(yùn)動(dòng)估計(jì)/補(bǔ)償技術(shù),該方法利用了相鄰幀之間的時(shí)間強(qiáng)相關(guān)性,對(duì)視頻序列壓縮取得了較好的效果。在CPM和NCIM中,子塊域中的每個(gè)圖像塊都由來自相鄰幀相同大小的父塊域通過運(yùn)動(dòng)補(bǔ)償?shù)玫?。CPM和NCIM兩者間最大的不同在于CPM在解碼的過程中需要具備收斂性,而NCIM不需要。但是在循環(huán)預(yù)測(cè)編碼(CPM)方法中,為了保證起始幀經(jīng)過自身的循環(huán)解碼能夠近似收斂到原來的圖像,壓縮過程需要經(jīng)過復(fù)雜變換、搜索和迭代等,壓縮時(shí)間和圖像質(zhì)量難以達(dá)到要求。目前典型的分形圖像和視頻壓縮方法的運(yùn)算量很大,編碼速度較慢,并且解碼的質(zhì)量有待提高,使得分形圖像和視頻壓縮方法還需要進(jìn)一步的改進(jìn)和提高。
發(fā)明內(nèi)容本發(fā)明提出了一種基于對(duì)象的分形視頻壓縮與解壓縮方法,該方法是基于視頻內(nèi)容,利用分形迭代原理進(jìn)行視頻編碼的一種新型視頻壓縮編碼方法。首先利用視頻分割方法獲得視頻對(duì)象分割平面即Alpha平面,對(duì)起始幀采用塊DCT變換編碼,對(duì)非I幀進(jìn)行塊運(yùn)動(dòng)估計(jì)/補(bǔ)償編碼,首先計(jì)算與子塊域和父塊域相關(guān)子塊的像素和與像素平方和,然后在前一幀搜索窗中利用全搜索方法尋找最相似的匹配塊,最后利用Huffman編碼方法壓縮迭代函數(shù)系統(tǒng)系數(shù)。對(duì)應(yīng)的解壓縮過程為對(duì)I幀采用反DCT變換的方式解碼,對(duì)非I幀進(jìn)行Huffman反編碼獲得迭代函數(shù)系統(tǒng)系數(shù),然后進(jìn)行基于宏塊的解碼,首先計(jì)算父塊域相關(guān)子塊的像素和與像素平方和,然后依次對(duì)當(dāng)前幀中的每一個(gè)宏塊進(jìn)行解碼。本方法引入了基于對(duì)象編碼的方法并改進(jìn)了傳統(tǒng)分形視頻壓縮方法,不但大大提高了壓縮比和峰值信噪比,而且提高了編碼速度,進(jìn)一步提高了分形視頻壓縮編碼的性能,使其更加具有靈活性和實(shí)用性。一種基于對(duì)象的分形視頻壓縮方法,包括以下步驟步驟一利用自動(dòng)視頻對(duì)象分割方法對(duì)視頻序列進(jìn)行自動(dòng)分割,獲取每一幀的視頻對(duì)象分割平面即Alpha平面,根據(jù)得到的視頻對(duì)象分割平面確定要編碼的視頻對(duì)象區(qū)域把正在進(jìn)行壓縮的幀稱為當(dāng)前幀,把當(dāng)前幀的已經(jīng)編碼并重建的前一幀稱為參考幀;步驟二若當(dāng)前幀為I幀,則采用基于塊DCT變換的I幀幀內(nèi)圖像壓縮方法,對(duì)其進(jìn)行單獨(dú)編碼和解碼,解碼之后的像素若屬于Alpha平面中待編碼的視頻對(duì)象則保留該像素值,否則置零;轉(zhuǎn)入步驟七;所述I幀為視頻序列的起始幀或者視頻序列中只進(jìn)行幀內(nèi)編碼的圖像幀;所述塊DCT變換中的塊采用固定大小模式;步驟三若當(dāng)前幀為非I幀,在進(jìn)行塊匹配之前,則首先對(duì)當(dāng)前幀進(jìn)行互不重疊的宏塊劃分,然后計(jì)算這些宏塊及其經(jīng)樹狀劃分得到的小塊的像素和與像素平方和,以及前一幀重建圖像即參考幀中按照設(shè)定步長(zhǎng)劃分的所有宏塊及其經(jīng)樹狀劃分得到的小塊的像素和與像素平方和,以減少塊匹配過程中的重復(fù)計(jì)算;轉(zhuǎn)到步驟四,即從第一個(gè)宏塊開始處理;所述宏塊為將當(dāng)前幀劃分為固定大小的互不重疊的圖像塊;所述小塊為將當(dāng)前宏塊進(jìn)行樹狀劃分得到的塊;所述當(dāng)前幀的所有塊的集合稱為子塊域,所述前一幀的所有塊的集合稱為父塊域;步驟四對(duì)當(dāng)前正在處理的圖像塊即當(dāng)前塊,利用Alpha平面判別該圖像塊的區(qū)域?qū)傩裕蝗绻搲K不在當(dāng)前編碼的視頻對(duì)象區(qū)域內(nèi),對(duì)該塊不做處理;如果該塊全部都在當(dāng)前編碼的視頻對(duì)象區(qū)域內(nèi),轉(zhuǎn)入步驟五;如果該塊的部分像素在當(dāng)前編碼的視頻對(duì)象區(qū)域內(nèi),部分像素不在當(dāng)前編碼的視頻對(duì)象區(qū)域內(nèi),需要單獨(dú)處理,轉(zhuǎn)入步驟六;如果所有的宏塊都已處理完畢,則轉(zhuǎn)到步驟七;所述不在當(dāng)前編碼的視頻對(duì)象區(qū)域內(nèi)的塊稱為外部塊,所述全部都在當(dāng)前編碼的視頻對(duì)象區(qū)域內(nèi)的塊稱為內(nèi)部塊,所述部分像素不在當(dāng)前編碼的視頻對(duì)象區(qū)域內(nèi)的塊為邊界塊;步驟五在父塊域中的搜索窗口內(nèi)首先對(duì)當(dāng)前塊進(jìn)行塊匹配,如果匹配誤差RMS小于開始設(shè)定的閾值Y,保存當(dāng)前的迭代函數(shù)系統(tǒng)系數(shù)即IFS系數(shù),返回步驟四,進(jìn)行下一宏塊的匹配;否則,依次按照樹狀結(jié)構(gòu)對(duì)該塊進(jìn)行劃分,并對(duì)各個(gè)劃分得到的小塊分別計(jì)算匹配誤差RMS,如果RMS小于設(shè)定閾值Y,停止劃分并記錄該小塊IFS系數(shù),返回步驟四,進(jìn)行下一宏塊的匹配;否則繼續(xù)劃分,直到將當(dāng)前塊劃分為預(yù)先設(shè)定的最小塊,記錄IFS系數(shù);返回步驟四,進(jìn)行下一宏塊的匹配;步驟六該步驟單獨(dú)處理邊界塊,當(dāng)前幀的邊界塊只在父塊中的屬于邊界塊和內(nèi)部塊中搜索匹配,當(dāng)前塊和父塊的像素選取準(zhǔn)則是在當(dāng)前塊中只計(jì)算位于當(dāng)前編碼的視頻對(duì)象區(qū)域內(nèi)的像素值,只在參考幀的相同視頻對(duì)象區(qū)域內(nèi)進(jìn)行塊匹配;對(duì)于父塊中,如果與當(dāng)前塊的相對(duì)應(yīng)位置的父塊中的某一像素也屬于該視頻對(duì)象區(qū)域,則采用原像素值,否貝U,用其它屬于該視頻對(duì)象區(qū)域像素的平均值代替;按照所述當(dāng)前塊和父塊的像素選取準(zhǔn)則確定當(dāng)前塊和父塊的像素值后,計(jì)算子塊與父塊的匹配誤差RMS,如果RMS小于閾值γ,則保存當(dāng)前所得系數(shù),否則將當(dāng)前的邊界塊劃分為小塊,對(duì)每個(gè)小塊分別返回步驟四進(jìn)行處理;步驟七對(duì)所有IFS系數(shù)進(jìn)行Huffman編碼,降低IFS系數(shù)數(shù)據(jù)的統(tǒng)計(jì)冗余;判斷當(dāng)前幀是否為最后一幀,如果是最后一幀結(jié)束編碼;否則,返回步驟二繼續(xù)處理下一幀圖像。所述一種基于對(duì)象的分形視頻壓縮方法,處理的視頻序列為YUV格式,分別對(duì)3個(gè)分量中的每個(gè)采用上述七個(gè)步驟進(jìn)行處理。所述步驟五中對(duì)宏塊采用樹狀劃分,塊匹配采用匹配誤差準(zhǔn)則;子塊與父塊的匹配誤差RMS為<formula>formulaseeoriginaldocumentpage7</formula>其中參數(shù)8和0分別為<formula>formulaseeoriginaldocumentpage7</formula>其中,N為子塊和父塊像素的個(gè)數(shù),r,為子塊的像素值,Cli為父塊的像素值;計(jì)算當(dāng)前宏塊在參考幀中的塊匹配誤差RMS,其中ri是子塊的像素值,Cli是父塊的像素值;如果RMS小于預(yù)先設(shè)定的閾值Y,記錄IFS系數(shù),IFS系數(shù)包括匹配塊的位移矢量(X,y)和公式2,3中的s和0,處理下一宏塊;否則,對(duì)當(dāng)前宏塊進(jìn)行樹狀劃分,計(jì)算劃分后小塊的RMS,如果小于閾值Y,則停止劃分,否則繼續(xù)劃分,直到子塊達(dá)到預(yù)先設(shè)定的最小塊為止。一種基于對(duì)象的分形視頻解壓縮方法,包括以下步驟步驟I首先從壓縮文件中讀入壓縮信息,包括壓縮幀數(shù),每幀圖像的寬和高,I幀壓縮質(zhì)量,插入I幀數(shù)量和搜索范圍;步驟II由讀入壓縮信息和當(dāng)前待解碼幀號(hào)判斷該待解碼幀是否為I幀,若是I幀轉(zhuǎn)入步驟III,否則轉(zhuǎn)入步驟IV;步驟III對(duì)于I幀,從壓縮文件中讀入碼流,并讀入該幀的Alpha平面,采用基于塊DCT變換的I幀幀內(nèi)圖像解壓縮方法進(jìn)行解碼,解碼之后的文件包括基于不同對(duì)象的視頻文件和完整的視頻文件,在基于對(duì)象的視頻文件中,根據(jù)Alpha平面,屬于該對(duì)象的像素保留,不屬于該對(duì)象的像素置零,幀數(shù)加一轉(zhuǎn)入步驟V;步驟IV對(duì)于非I幀,首先計(jì)算參考幀中按照設(shè)定步長(zhǎng)劃分的所有宏塊以及經(jīng)樹狀劃分得到的小塊的像素和、像素平方和,然后從壓縮文件中讀入塊的劃分信息和Huffman碼流以及該幀的Alpha平面,并根據(jù)塊的劃分信息和Huffman碼流以及該幀的Alpha平面得到該幀所有宏塊的劃分方式和每一個(gè)小塊的迭代函數(shù)系統(tǒng)系數(shù),按照每一宏塊進(jìn)行解碼;步驟V判斷此時(shí)所有幀是否都已解碼,若都已解碼完畢,則結(jié)束解碼過程,否則轉(zhuǎn)入步驟II。對(duì)于每一個(gè)宏塊進(jìn)行解碼時(shí),首先判斷該宏塊在編碼時(shí)的劃分方式,對(duì)于每一個(gè)子塊,首先在父塊域找到與該子塊相對(duì)應(yīng)的區(qū)域,然后利用下面的公式獲得該子塊的像素值,T1=s^di+o其中ri為待解碼子塊的像素值,d,為父塊域中的像素值,s為比例因子,ο為偏移因子。在基于對(duì)象的解碼過程中,當(dāng)前塊中只有屬于該對(duì)象區(qū)域的像素才進(jìn)行解碼,同樣,在父塊域中只利用屬于同一對(duì)象區(qū)域的像素進(jìn)行解碼,假如父塊域中的某個(gè)子塊中部分像素不屬于該視頻對(duì)象,那么這部分像素的值用該子塊中屬于該對(duì)象區(qū)域的像素的平均值代替。處理的視頻序列為YUV格式,分別對(duì)3個(gè)分量中的每個(gè)采用上述五個(gè)步驟進(jìn)行處理。本發(fā)明所提出的一種基于對(duì)象的分形視頻壓縮方法的優(yōu)點(diǎn)在于(1)本方法中對(duì)起始幀采用幀內(nèi)塊DCT變換編碼,相對(duì)于CPM/NCIM編碼方案,不但大幅度減少了壓縮時(shí)間和塊效應(yīng),而且提高了峰值信噪比。(2)本方法先將一幀圖像劃分為互不重疊的、由若干固定大小尺寸的宏塊組成的棋盤格式,然后根據(jù)匹配準(zhǔn)則與設(shè)定閾值的關(guān)系,對(duì)宏塊進(jìn)行樹狀結(jié)構(gòu)劃分,相對(duì)于四叉樹劃分準(zhǔn)則,大大降低了計(jì)算復(fù)雜度,提高了編碼速度。(3)本方法在進(jìn)行子塊的塊匹配之前,計(jì)算當(dāng)前幀互不重疊的宏塊及其經(jīng)樹狀劃分之后得到的小塊的像素和與像素平方和。在參考幀中,按照匹配步長(zhǎng)分別計(jì)算各宏塊以及經(jīng)樹狀劃分以后得到的小塊的像素和與像素平方和。這樣就避免了在塊匹配過程中出現(xiàn)重復(fù)計(jì)算的弊端,大大節(jié)約了子塊的匹配時(shí)間。(4)本方法引入了基于對(duì)象的視頻編碼方法,基于對(duì)象的編碼方法在非基于對(duì)象方法的基礎(chǔ)之上又進(jìn)一步提高了分形壓縮的性能,不但增加了壓縮比和峰值信噪比,而且使得壓縮具有更大的靈活性。圖Ia為本發(fā)明一種基于對(duì)象的分形視頻壓縮與解壓縮方法的壓縮流程圖;圖Ib為本發(fā)明一種基于對(duì)象的分形視頻壓縮與解壓縮方法的解壓縮流程圖;圖2a為標(biāo)準(zhǔn)測(cè)試視頻序列“foreman,cif”的第9幀;圖2b為本發(fā)明一種基于對(duì)象的分形視頻壓縮與解壓縮方法得到的標(biāo)準(zhǔn)測(cè)試視頻序列“foreman,cif”的第9幀的Alpha分割平面;圖2c為本發(fā)明一種基于對(duì)象的分形視頻壓縮與解壓縮方法單獨(dú)解碼經(jīng)本發(fā)明方法壓縮編碼以后的標(biāo)準(zhǔn)測(cè)試視頻序列“foreman,cif”的第9幀的前景視頻對(duì)象的結(jié)果圖像;圖2d為本發(fā)明一種基于對(duì)象的分形視頻壓縮與解壓縮方法單獨(dú)解碼經(jīng)本發(fā)明方法壓縮編碼以后的標(biāo)準(zhǔn)測(cè)試視頻序列“foreman,cif”的第9幀的背景視頻對(duì)象的結(jié)果圖像;圖2e為本發(fā)明一種基于對(duì)象的分形視頻壓縮與解壓縮方法解碼經(jīng)本發(fā)明方法壓縮編碼以后的標(biāo)準(zhǔn)測(cè)試視頻序列“foreman,cif”的第9幀全部視頻對(duì)象的結(jié)果圖像;圖3a為標(biāo)準(zhǔn)測(cè)試視頻序列“foreman,cif”的起始幀圖像;圖3b為本發(fā)明一種基于對(duì)象的分形視頻壓縮與解壓縮方法解碼經(jīng)本發(fā)明方法壓縮編碼以后的標(biāo)準(zhǔn)測(cè)試視頻序列“foreman,cif”第1幀的結(jié)果圖像;圖4a為本發(fā)明一種基于對(duì)象的分形視頻壓縮與解壓縮方法對(duì)宏塊的四種劃分模式圖;圖4b為本發(fā)明一種基于對(duì)象的分形視頻壓縮與解壓縮方法對(duì)宏塊的劃分模式四進(jìn)一步進(jìn)行劃分的四種劃分模式圖;圖5為本發(fā)明一種基于對(duì)象的分形視頻壓縮與解壓縮方法對(duì)邊界塊屬于不同視頻對(duì)象區(qū)域的像素的標(biāo)記圖;圖6為本發(fā)明一種基于對(duì)象的分形視頻壓縮與解壓縮方法子塊與父塊的像素匹配映射圖;圖7a為本發(fā)明一種基于對(duì)象的分形視頻壓縮與解壓縮方法對(duì)標(biāo)準(zhǔn)測(cè)試視頻序列"foreman,cif"的前15幀分別基于對(duì)象1,基于對(duì)象2和非基于對(duì)象進(jìn)行壓縮的峰值信噪比的對(duì)比圖;圖7b為本發(fā)明一種基于對(duì)象的分形視頻壓縮與解壓縮方法對(duì)標(biāo)準(zhǔn)測(cè)試視頻序列"foreman,cif"的前15幀分別基于對(duì)象1,基于對(duì)象2和非基于對(duì)象進(jìn)行壓縮的壓縮比的對(duì)比圖;圖7c為本發(fā)明一種基于對(duì)象的分形視頻壓縮與解壓縮方法對(duì)標(biāo)準(zhǔn)測(cè)試視頻序列"foreman,cif"的前15幀分別基于對(duì)象1,基于對(duì)象2和非基于對(duì)象進(jìn)行壓縮的壓縮時(shí)間的對(duì)比圖;圖8a為本發(fā)明一種基于對(duì)象的分形視頻壓縮與解壓縮方法與傳統(tǒng)的CPM/NCIM方法對(duì)標(biāo)準(zhǔn)測(cè)試視頻序列“foreman,cif”的前15幀進(jìn)行壓縮的峰值信噪比的對(duì)比圖;圖8b為本發(fā)明一種基于對(duì)象的分形視頻壓縮與解壓縮方法與傳統(tǒng)的CPM/NCIM方法對(duì)標(biāo)準(zhǔn)測(cè)試視頻序列“foreman,cif”的前15幀進(jìn)行壓縮的壓縮比的對(duì)比圖;圖8c為本發(fā)明一種基于對(duì)象的分形視頻壓縮與解壓縮方法與傳統(tǒng)的CPM/NCIM方法對(duì)標(biāo)準(zhǔn)測(cè)試視頻序列“foreman,cif”的前15幀進(jìn)行壓縮的壓縮時(shí)間的對(duì)比圖。圖8d為本發(fā)明一種基于對(duì)象的分形視頻壓縮與解壓縮方法與傳統(tǒng)的CPM/NCIM方法對(duì)標(biāo)準(zhǔn)測(cè)試視頻序列“foreman,cif”的前15幀進(jìn)行解壓縮時(shí)間的對(duì)比圖。具體實(shí)施例方式下面將結(jié)合附圖對(duì)本發(fā)明方法作進(jìn)一步的詳細(xì)說明,僅以亮度分量Y為例,色差分量U和V的壓縮步驟與亮度分量相同。本發(fā)明提出了一種基于對(duì)象的分形視頻壓縮與解壓縮方法,該方法是基于視頻內(nèi)容,利用分形迭代原理進(jìn)行視頻編碼的一種新型視頻壓縮編碼方法。首先利用視頻分割方法獲得視頻對(duì)象分割平面即Alpha平面,對(duì)起始幀采用塊DCT變換編碼,對(duì)非I幀進(jìn)行塊運(yùn)動(dòng)估計(jì)/補(bǔ)償編碼,首先計(jì)算與子塊域和父塊域相關(guān)子塊的像素和與像素平方和,然后在前一幀搜索窗中利用全搜索方法尋找最相似的匹配塊,最后利用Huffman編碼方法壓縮迭代函數(shù)系統(tǒng)系數(shù)。對(duì)應(yīng)的解壓縮過程為對(duì)I幀采用反DCT變換的方式解碼,對(duì)非I幀進(jìn)行Huffman反編碼獲得迭代函數(shù)系統(tǒng)系數(shù),然后進(jìn)行基于宏塊的解碼,首先計(jì)算父塊域相關(guān)子塊的像素和與像素平方和,然后依次對(duì)當(dāng)前幀中的每一個(gè)宏塊進(jìn)行解碼。本方法引入了基于對(duì)象編碼的方法并改進(jìn)了傳統(tǒng)分形視頻壓縮方法,不但大大提高了壓縮比和峰值信噪比,而且提高了編碼速度,進(jìn)一步提高了分形視頻壓縮編碼的性能,使其更加具有靈活性和實(shí)用性。如附圖Ia所示,一種基于對(duì)象的分形視頻壓縮方法,包括以下步驟步驟一以標(biāo)準(zhǔn)測(cè)試視頻序列“foreman,cif”的前15幀為例,利用自動(dòng)視頻對(duì)象分割方法對(duì)視頻序列進(jìn)行自動(dòng)分割,獲取Alpha平面。視頻中的對(duì)象可以通過Alpha平面進(jìn)行定義,并且可以獨(dú)立進(jìn)行壓縮編碼。附圖2a是標(biāo)準(zhǔn)測(cè)試視頻序列“foreman,cif”的第9幀,附圖2b為該幀的Alpha平面,前景用白色表示,背景用黑色表示。如附圖2a所示,圖像中有兩個(gè)視頻對(duì)象,那么Alpha平面就可以是一個(gè)二值圖像,用白色代表前景,黑色代表背景。每個(gè)對(duì)象都可以獨(dú)立地進(jìn)行壓縮,使得每個(gè)對(duì)象組成一個(gè)碼流。所以在解壓縮時(shí),不需要得到整幅圖像,而是可以單獨(dú)恢復(fù)和控制每個(gè)對(duì)象。單獨(dú)解壓縮前景視頻對(duì)象的結(jié)果為附圖2c,單獨(dú)解壓縮背景視頻對(duì)象的結(jié)果為附圖2d,整幀解壓縮的結(jié)果為附圖2e。引入基于對(duì)象的編碼不但提高了壓縮性能,而且增加了視頻編碼方法的靈活性。所述把正在進(jìn)行壓縮的幀稱為當(dāng)前幀,所述把當(dāng)前幀的已經(jīng)壓縮并重建的前一幀稱為參考幀。步驟二若當(dāng)前幀為I幀,則采用基于塊DCT變換的I幀幀內(nèi)圖像壓縮方法,對(duì)其進(jìn)行單獨(dú)編碼和解碼,解碼之后的像素若屬于Alpha平面中待編碼的視頻對(duì)象則保留該像素值,否則置零;轉(zhuǎn)入步驟七;所述I幀為視頻序列的起始幀或者視頻序列中只進(jìn)行幀內(nèi)編碼的圖像幀;所述塊DCT變換中的塊采用固定大小模式。例如,對(duì)視頻序列“foreman,cif”起始幀采用基于塊DCT變換的I幀幀內(nèi)圖像壓縮方法,將起始幀劃分為8X8的互不重疊的小塊,對(duì)每一小塊分別進(jìn)行DCT變換。離散余弦變換將8X8的圖像樣本X,變換成8X8的系數(shù)矩陣Y。變換過程(包括反變換)可以用變換矩陣A來表示。8X8樣本塊的正向DCT(FDCT)變換如下Y=AXAT(3)反向DCT(IDCT)如下X=AtYA(4)其中A是8X8的變換矩陣。A中的各個(gè)元素如下<formula>formulaseeoriginaldocumentpage11</formula>其中<formula>formulaseeoriginaldocumentpage11</formula>i,j分別為矩陣A的行和列。對(duì)變換系數(shù)進(jìn)行量化和編碼。附圖3a為標(biāo)準(zhǔn)測(cè)試視頻序列“foreman,cif”的起始幀,利用本方法解壓縮DCT變換編碼之后的解壓縮圖像為附圖3b。轉(zhuǎn)入步驟七。步驟三對(duì)當(dāng)前非I幀圖像進(jìn)行互不重疊的16X16宏塊劃分,分別計(jì)算當(dāng)前幀互不重疊的16X16,16X8,8X16,8X8,8X4,4X8,4X4的小塊的像素和與像素的平方和。然后分別計(jì)算參考幀也就是前一幀的解壓縮圖像中以1為步長(zhǎng)的大小分別為16X16,16X8,8X16,8X8,8X4,4X8,4X4的小塊的像素和與像素的平方和,以減少塊匹配過程中的重復(fù)計(jì)算。轉(zhuǎn)到步驟四,即從第一個(gè)宏塊開始處理。所述當(dāng)前幀的所有塊的集合稱為子塊域,所述前一幀的所有塊的集合稱為父塊域;所述宏塊為將當(dāng)前幀劃分為固定大小的互不重疊的圖像塊;所述小塊為將當(dāng)前宏塊進(jìn)行樹狀劃分得到的塊。步驟四在當(dāng)前幀中按照互不重疊的16X16的宏塊進(jìn)行塊匹配,根據(jù)該宏塊的類型,做出如下的選擇,如果該宏塊不在Alpha平面內(nèi),對(duì)該塊不做處理,繼續(xù)處理下一宏塊;如果該宏塊全部位于Alpha平面內(nèi),轉(zhuǎn)入步驟五;如果該宏塊部分位于Alpha平面內(nèi),轉(zhuǎn)入步驟六。如果當(dāng)前幀宏塊全部匹配完畢后,轉(zhuǎn)入步驟七。所述不在當(dāng)前編碼的視頻對(duì)象區(qū)域內(nèi)的塊稱為外部塊,所述全部都在當(dāng)前編碼的視頻對(duì)象區(qū)域內(nèi)的塊稱為內(nèi)部塊,所述部分像素不在當(dāng)前編碼的視頻對(duì)象區(qū)域內(nèi)的塊為邊界塊。步驟五在父塊域中的搜索窗口內(nèi)對(duì)整個(gè)宏塊進(jìn)行塊運(yùn)動(dòng)估計(jì)/補(bǔ)償。匹配的依據(jù)是分形迭代函數(shù)系統(tǒng)原理,簡(jiǎn)要介紹一下分形圖像壓縮的數(shù)學(xué)基礎(chǔ)一迭代函數(shù)系統(tǒng)(IFS=IterativeFunctionSystem)理論。設(shè)D是Rn歐氏空間的子集,ω為D—D的映射,如果存在一個(gè)實(shí)數(shù)C,0<C<1,使得對(duì)于Rn上的度量d,滿足對(duì)任意X,yeD,有d(ω(χ),ω(γ))^C(d(x,y)),則稱ω為壓縮映射,實(shí)數(shù)C稱為ω的壓縮因子。完備的度量空間(X,d)以及η個(gè)壓縮映射Coi:Χ—Χ(其壓縮因子分別為C1,C2,...Cn)—起,就組成一個(gè)迭代函數(shù)系統(tǒng)(IteratedFunctionSystem),簡(jiǎn)稱IFS,記作{Χ:ω”ω2,···,ωJ。C=max(C1,C2,...,Cn)稱為IFS的壓縮因子。因此{(lán)R2=Q1,ω2,ω3}就是一個(gè)IFS。分形圖像壓縮中,一般的匹配準(zhǔn)則是RMS,即<formula>formulaseeoriginaldocumentpage12</formula>其中s,ο分別為<formula>formulaseeoriginaldocumentpage12</formula><formula>formulaseeoriginaldocumentpage12</formula>其中,N為子塊和父塊像素的個(gè)數(shù),r,為子塊的像素值,Cli為父塊的像素值。首先設(shè)定子塊的匹配誤差閾值Y=t0lXt0lXn0,其中tol根據(jù)不同的子塊大小而改變,大的子塊tol就越大,小的子塊tol就小。在本例中,我們?nèi)?6X16宏塊的tol為10.0,8X8子塊的tol為8.0,4X4子塊的tol為6.Ο,ηο為當(dāng)前子塊屬于該視頻對(duì)象區(qū)域的像素個(gè)數(shù)。首先設(shè)定16X16宏塊的匹配誤差閾值Y16=10.OX10.ΟΧηο,在參考幀的父塊域中以當(dāng)前子塊的位置開始在15X15的搜索窗口內(nèi)對(duì)整個(gè)宏塊進(jìn)行塊匹配,如果匹配誤差RMS小于開始設(shè)定的閾值Y16,保存當(dāng)前的IFS系數(shù)包括比例因子s,偏移0,父塊相對(duì)于當(dāng)前子塊的坐標(biāo)偏移X,y,返回步驟四,繼續(xù)下一宏塊的匹配;否則,按照樹狀結(jié)構(gòu)對(duì)該宏塊進(jìn)行劃分,對(duì)宏塊的劃分有四種模式,如附圖4a,模式一為一個(gè)16X16小塊,模式二為兩個(gè)8X16的小塊,模式三為兩個(gè)16X8的小塊,模式四為四個(gè)8X8的小塊。1、首先按模式二的劃分計(jì)算,若模式二中兩個(gè)小塊都滿足RMS<Y16,保存當(dāng)前的IFS系數(shù)包括比例因子s,偏移0,以及父塊相對(duì)于當(dāng)前子塊的坐標(biāo)偏移X,y,并停止塊的劃分,轉(zhuǎn)到5;2、否則按模式三劃分,若模式三中兩個(gè)小塊都滿足RMS<γ16,保存當(dāng)前的IFS系數(shù)包括比例因子s,偏移0,以及父塊相對(duì)于當(dāng)前子塊的坐標(biāo)偏移χ,y,并停止塊的劃分,轉(zhuǎn)到5;3、否則按照模式四對(duì)當(dāng)前宏塊進(jìn)行劃分,此時(shí)匹配誤差閾值設(shè)置為Y8=8.0X8.ΟΧηο,如果模式四中的4個(gè)小塊都滿足RMS<Y8,保存當(dāng)前的IFS系數(shù)包括比例因子s,偏移0,以及父塊相對(duì)于當(dāng)前子塊的坐標(biāo)偏移X,y,并停止塊的劃分,轉(zhuǎn)到5;4、否則對(duì)模式四中的每一個(gè)小塊按照附圖4b中的模式劃分順序進(jìn)行劃分,可依次劃分為1個(gè)8X8的小塊,2個(gè)4X8的小塊,2個(gè)8X4的小塊,4個(gè)4X4的小塊。這里只對(duì)第一個(gè)8X8小塊的匹配過程進(jìn)行闡述,其它三個(gè)8X8小塊的匹配過程與第一個(gè)相同,不再贅述。首先按照兩個(gè)4X8的小塊劃分,進(jìn)行塊匹配,如果兩個(gè)子塊的匹配誤差RMS全部小于Y8時(shí),保存當(dāng)前的IFS系數(shù)包括比例因子s,偏移0,以及父塊相對(duì)于當(dāng)前子塊的坐標(biāo)偏移x,y,并停止塊的劃分。否則,按照兩個(gè)8X4的劃分方式進(jìn)行塊的劃分,對(duì)這兩個(gè)子塊進(jìn)行塊匹配,如果兩個(gè)子塊的匹配誤差RMS全部小于γ8時(shí),保存當(dāng)前的IFS系數(shù)包括比例因子s,偏移0,以及父塊相對(duì)于當(dāng)前子塊的坐標(biāo)偏移X,y,并停止塊的劃分。否則,對(duì)該子塊劃分為四個(gè)4X4的小塊,同時(shí)匹配誤差閾值設(shè)為Y4=6.0X6.ΟΧηο,對(duì)四個(gè)小塊分別進(jìn)行塊匹配,并分別記錄每個(gè)子塊的IFS系數(shù)包括比例因子s,偏移0,以及父塊相對(duì)于當(dāng)前子塊的坐標(biāo)偏移X,y,并停止塊的劃分,轉(zhuǎn)到5;5、返回步驟四,繼續(xù)下一宏塊的編碼。如果所有的宏塊都已編碼完畢,則轉(zhuǎn)到步驟七;步驟六為了在匹配子塊與父塊時(shí),避免將屬于不同對(duì)象的像素相混淆,對(duì)每一個(gè)像素在Alpha平面中做一個(gè)標(biāo)記,標(biāo)明被標(biāo)記的像素是屬于哪一對(duì)象的,如附圖5a所示,此邊界塊的像素被標(biāo)記為Sl和S2兩個(gè)部分。邊界塊的具體壓縮方法假設(shè)當(dāng)前壓縮的是對(duì)象1(壓縮對(duì)象2時(shí),方法相同),即Sl所在的對(duì)象。對(duì)于與子塊相關(guān)的量,只計(jì)算在Sl區(qū)域內(nèi)的像素值,而S2區(qū)域內(nèi)的像素不予以考慮;對(duì)于與父塊有關(guān)的量,若與子塊相對(duì)應(yīng)的位置的父塊中的某一像素Cli也屬于Sl區(qū)域,則使用Cli的原像素值,否則,按照特定的計(jì)算值來代替屯,本發(fā)明中使用的是父塊中屬于Sl區(qū)域的像素均值來代替屯。匹配映射效果如附圖6所示。需要說明的是,匹配映射只在同類塊之間進(jìn)行,即子塊和父塊必須同時(shí)是邊界塊或者同時(shí)是內(nèi)部塊(外部塊)。按照所述當(dāng)前塊和父塊的像素選取準(zhǔn)則確定當(dāng)前塊和父塊的像素值后,計(jì)算匹配誤差RMS,如果RMS小于閾值Y,則保存當(dāng)前所得系數(shù),否則將當(dāng)前的邊界塊劃分為小塊,對(duì)每個(gè)小塊分別返回步驟四進(jìn)行處理;步驟七對(duì)所有IFS系數(shù)進(jìn)行huffman編碼,huffman編碼是根據(jù)出現(xiàn)的概率將每個(gè)符號(hào)映射到一個(gè)變長(zhǎng)碼字的集合(VLC)上,降低IFS系數(shù)數(shù)據(jù)的統(tǒng)計(jì)冗余。判斷當(dāng)前幀是否為最后一幀,如果是最后一幀結(jié)束編碼,否則,轉(zhuǎn)入步驟二繼續(xù)處理下一幀圖像。如附圖Ib所示,一種基于對(duì)象的分形視頻解壓縮方法,包括以下步驟步驟I首先從壓縮文件中讀入壓縮信息,包括壓縮幀數(shù),每幀圖像的寬和高,I幀壓縮質(zhì)量,插入I幀數(shù)量和搜索范圍;步驟II由讀入壓縮信息和當(dāng)前待解碼幀號(hào)判斷該待解碼幀是否為I幀,若是I幀轉(zhuǎn)入步驟III,否則轉(zhuǎn)入步驟IV;步驟III對(duì)于I幀,從壓縮文件中讀入解碼該幀所需碼流,并讀入該幀的Alpha平面,采用基于塊DCT變換的I幀幀內(nèi)圖像解壓縮方法進(jìn)行解碼,進(jìn)行反DCT變換,得到每一個(gè)8X8的塊的像素值,解碼之后的文件包括基于不同對(duì)象的視頻文件和完整的視頻文件,在基于對(duì)象的視頻文件中,根據(jù)Alpha平面,屬于該對(duì)象的像素保留,不屬于該對(duì)象的像素置零,幀數(shù)加一轉(zhuǎn)入步驟V;步驟IV對(duì)于非I幀,首先計(jì)算參考幀中按照設(shè)定步長(zhǎng)劃分的所有宏塊以及經(jīng)樹狀劃分得到的小塊的像素和、像素平方和,然后從壓縮文件中讀入塊的劃分信息和Huffman碼流,并根據(jù)塊劃分信息和Huffman碼流得到該幀所有宏塊的劃分方式和每一個(gè)小塊的迭代函數(shù)系統(tǒng)系數(shù),按照每一宏塊進(jìn)行解碼。對(duì)于每一個(gè)宏塊進(jìn)行解壓縮時(shí),首先判斷該宏塊在編碼時(shí)的劃分方式,對(duì)于每一個(gè)子塊,首先在父塊域找到與該子塊相對(duì)應(yīng)的區(qū)域,然后利用下面的公式獲得該子塊的像素值,T1=s^di+o其中ri為待解碼子塊的像素值,Cli為父塊域中的像素值,s為比例因子,ο為偏移因子。在基于對(duì)象的解碼過程中,當(dāng)前塊中只有屬于該對(duì)象區(qū)域的像素才進(jìn)行解碼,同樣,在父塊域中只利用屬于同一對(duì)象區(qū)域的像素進(jìn)行解碼,假如父塊域中的某個(gè)子塊中部分像素不屬于該視頻對(duì)象,那么這部分像素的值用該子塊中屬于該對(duì)象區(qū)域的像素的平均值代替;步驟V:判斷此時(shí)所有幀是否都已解碼,若都已解碼完畢,則結(jié)束解碼過程,否則轉(zhuǎn)入步驟II。本發(fā)明選擇VisualC++6.0作為所述方法的實(shí)現(xiàn)語(yǔ)言,CPU為IntelCore2DuoT8300,2.4GHz主頻,內(nèi)存大小為2G,對(duì)標(biāo)準(zhǔn)測(cè)試視頻序列“foreman,cif”分別進(jìn)行了基于對(duì)象1即前景對(duì)象,基于對(duì)象2即背景對(duì)象和非基于對(duì)象的編碼實(shí)驗(yàn)。表1為在同等條件下,利用CPM/NCIM方法和本發(fā)明方法對(duì)標(biāo)準(zhǔn)測(cè)試視頻序列"foreman,cif”的起始幀的壓縮對(duì)比實(shí)驗(yàn)結(jié)果。<table>tableseeoriginaldocumentpage14</column></row><table>表1CPM/NCIM方法和本發(fā)明方法的起始幀壓縮結(jié)果對(duì)比表2為基于對(duì)象1,對(duì)象2及非基于對(duì)象的前15幀壓縮的平均峰值信噪比、平均壓縮比、平均壓縮時(shí)間和平均解碼時(shí)間的比較。利用本方法對(duì)“foreman,cif”的前15幀分別基于對(duì)象1、基于對(duì)象2、以及非基于對(duì)象壓縮的峰值信噪比的對(duì)比如附圖7a所示;利用本方法對(duì)“foreman,cif”的前15幀分別基于對(duì)象1、基于對(duì)象2、以及非基于對(duì)象壓縮的壓縮比的對(duì)比如附圖7b所示;利用本方法對(duì)“foreman,cif”的前15幀分別基于對(duì)象1、基于對(duì)象2、以及非基于對(duì)象壓縮的壓縮時(shí)間的對(duì)比如附圖7c所示。<table>tableseeoriginaldocumentpage14</column></row><table>表2"foreman,cif”的非基于對(duì)象壓縮與基于對(duì)象壓縮的性能對(duì)比由于基于對(duì)象的壓縮在邊界塊的劃分更為細(xì)致以致匹配結(jié)果好于非基于對(duì)像的對(duì)應(yīng)塊。并且對(duì)象2的PSNR高于對(duì)象1,因?yàn)閷?duì)象2是背景,圖像的變化不大,故重建的圖像質(zhì)量好。由以上實(shí)驗(yàn)結(jié)果說明基于對(duì)象的壓縮編碼方法相對(duì)于非基于對(duì)象的壓縮編碼方法,不但提高了峰值信噪比和壓縮比,同時(shí)減少了壓縮時(shí)間。分別采用傳統(tǒng)的CPM/NCIM方法和本發(fā)明方法對(duì)“foreman,cif”的前15幀進(jìn)行壓縮編碼的峰值信噪比的對(duì)比圖如附圖8a所示;分別采用傳統(tǒng)的CPM/NCIM方法和本發(fā)明方法對(duì)“foreman,cif”的前15幀進(jìn)行壓縮編碼的壓縮比的對(duì)比圖如附圖8b所示;分別采用傳統(tǒng)的CPM/NCIM方法和本發(fā)明方法對(duì)“foreman,cif”的前15幀進(jìn)行壓縮編碼的壓縮時(shí)間的對(duì)比圖如附圖8c所示;分別采用傳統(tǒng)的CPM/NCIM方法和本發(fā)明方法對(duì)“foreman,cif"的前15幀進(jìn)行解壓縮的時(shí)間的對(duì)比圖如附圖8d所示。從附圖8可以看出,本發(fā)明方法與傳統(tǒng)的CPM/NCIM方法相比,不但增加了峰值信噪比和壓縮比,而且減少了壓縮時(shí)間。對(duì)5個(gè)典型的視頻序列“foreman.cif","news,cif”,“paris.cif","bus.cif","bridge-far.cif"(圖像尺寸為352X288像素的CIF格式,取15幀圖像),宏塊尺寸為16X16像素,最小分塊尺寸為4X4像素。采用的對(duì)比方法如下,CPM/NCIM方法中CPM幀數(shù)取為2。壓縮和解壓縮性能對(duì)比結(jié)果如表3所示,各項(xiàng)指標(biāo)均為15幀的均值。本發(fā)明提出的方法明顯好于傳統(tǒng)的CPM/NCIM方法,如PSNR值提高了3_5dB,壓縮比提高了近4倍,壓縮時(shí)間卻減少為原來的1/10。這是因?yàn)楸景l(fā)明方法利用了編碼幀和參考幀之間的強(qiáng)互相似性,能夠準(zhǔn)確快速地找到最佳匹配塊,結(jié)果表現(xiàn)為解壓縮圖像質(zhì)量高、壓縮比高以及壓縮所用時(shí)間少等。本方法可以根據(jù)應(yīng)用目的的不同來選擇匹配誤差閾值,在低比特率的條件下,可以選擇大的匹配閾值,使分塊的數(shù)目減少,從而增加壓縮比。在對(duì)解壓縮視頻圖像要求較高的情況下,可以減小匹配誤差閾值,增加分塊的數(shù)目,使塊的匹配更加準(zhǔn)確,從而保證視頻質(zhì)量。并且可以根據(jù)需要選擇特定的視頻對(duì)象進(jìn)行壓縮編碼,不但提高了壓縮比、峰值信噪比和壓縮速度,而且增加了編碼的靈活性。<table>tableseeoriginaldocumentpage15</column></row><table>表3CPM/NCIM方法和本發(fā)明方法對(duì)5個(gè)視頻序列壓縮和解壓縮性能均值對(duì)比。權(quán)利要求一種基于對(duì)象的分形視頻壓縮方法,其特征在于用宏塊劃分規(guī)則替代傳統(tǒng)的四叉樹劃分規(guī)則;簡(jiǎn)化了塊的搜索策略和范圍,極大的提高了計(jì)算速度;使用了H.264標(biāo)準(zhǔn)中的I幀方法;減少重復(fù)計(jì)算;提出了一種在分形視頻壓縮方法中的基于對(duì)象壓縮的實(shí)現(xiàn)方法,所述在分形視頻壓縮方法中的基于對(duì)象壓縮的實(shí)現(xiàn)方法可以對(duì)任意一個(gè)對(duì)象單獨(dú)進(jìn)行壓縮編碼,能極大的提高壓縮比和壓縮速度,降低比特率并節(jié)省數(shù)據(jù)傳輸時(shí)的帶寬;該基于對(duì)象的分形視頻壓縮方法的具體步驟如下步驟一利用自動(dòng)視頻對(duì)象分割方法對(duì)視頻序列進(jìn)行自動(dòng)分割,獲取每一幀的視頻對(duì)象分割平面即Alpha平面,根據(jù)得到的視頻對(duì)象分割平面確定要編碼的視頻對(duì)象區(qū)域;把正在進(jìn)行壓縮的幀稱為當(dāng)前幀,把當(dāng)前幀的已經(jīng)編碼并重建的前一幀稱為參考幀;步驟二若當(dāng)前幀為I幀,則采用基于塊DCT變換的I幀幀內(nèi)圖像壓縮方法,對(duì)其進(jìn)行單獨(dú)編碼和解碼,解碼之后的像素若屬于Alpha平面中待編碼的視頻對(duì)象則保留該像素值,否則置零;轉(zhuǎn)入步驟七;所述I幀為視頻序列的起始幀或者視頻序列中只進(jìn)行幀內(nèi)編碼的圖像幀;所述塊DCT變換中的塊采用固定大小模式;步驟三若當(dāng)前幀為非I幀,在進(jìn)行塊匹配之前,則首先對(duì)當(dāng)前幀進(jìn)行互不重疊的宏塊劃分,然后計(jì)算這些宏塊及其經(jīng)樹狀劃分得到的小塊的像素和與像素平方和,以及前一幀重建圖像即參考幀中按照設(shè)定步長(zhǎng)劃分的所有宏塊及其經(jīng)樹狀劃分得到的小塊的像素和與像素平方和,以減少塊匹配過程中的重復(fù)計(jì)算;轉(zhuǎn)到步驟四,即從第一個(gè)宏塊開始處理;所述宏塊為將當(dāng)前幀劃分為固定大小的互不重疊的圖像塊;所述小塊為將當(dāng)前宏塊進(jìn)行樹狀劃分得到的塊;所述當(dāng)前幀的所有塊的集合稱為子塊域,所述前一幀的所有塊的集合稱為父塊域;步驟四對(duì)當(dāng)前正在處理的圖像塊即當(dāng)前塊,利用Alpha平面判別該圖像塊的區(qū)域?qū)傩?;如果該塊不在當(dāng)前編碼的視頻對(duì)象區(qū)域內(nèi),對(duì)該塊不做處理;如果該塊全部都在當(dāng)前編碼的視頻對(duì)象區(qū)域內(nèi),轉(zhuǎn)入步驟五;如果該塊的部分像素在當(dāng)前編碼的視頻對(duì)象區(qū)域內(nèi),部分像素不在當(dāng)前編碼的視頻對(duì)象區(qū)域內(nèi),需要單獨(dú)處理,轉(zhuǎn)入步驟六;如果所有的宏塊都已處理完畢,則轉(zhuǎn)到步驟七;所述不在當(dāng)前編碼的視頻對(duì)象區(qū)域內(nèi)的塊稱為外部塊,所述全部都在當(dāng)前編碼的視頻對(duì)象區(qū)域內(nèi)的塊稱為內(nèi)部塊,所述部分像素不在當(dāng)前編碼的視頻對(duì)象區(qū)域內(nèi)的塊為邊界塊;步驟五在父塊域中的搜索窗口內(nèi)首先對(duì)當(dāng)前塊進(jìn)行塊匹配,如果匹配誤差RMS小于開始設(shè)定的閾值γ,保存當(dāng)前的迭代函數(shù)系統(tǒng)系數(shù)即IFS系數(shù),返回步驟四,進(jìn)行下一宏塊的匹配;否則,依次按照樹狀結(jié)構(gòu)對(duì)該塊進(jìn)行劃分,并對(duì)各個(gè)劃分得到的小塊分別計(jì)算匹配誤差RMS,如果RMS小于設(shè)定閾值γ,停止劃分并記錄該小塊IFS系數(shù),返回步驟四,進(jìn)行下一宏塊的匹配;否則繼續(xù)劃分,直到將當(dāng)前塊劃分為預(yù)先設(shè)定的最小塊,記錄IFS系數(shù);返回步驟四,進(jìn)行下一宏塊的匹配;步驟六該步驟單獨(dú)處理邊界塊,當(dāng)前幀的邊界塊只在父塊中的屬于邊界塊和內(nèi)部塊中搜索匹配,當(dāng)前塊和父塊的像素選取準(zhǔn)則是在當(dāng)前塊中只計(jì)算位于當(dāng)前編碼的視頻對(duì)象區(qū)域內(nèi)的像素值,只在參考幀的相同視頻對(duì)象區(qū)域內(nèi)進(jìn)行塊匹配;對(duì)于父塊中,如果與當(dāng)前塊的相對(duì)應(yīng)位置的父塊中的某一像素也屬于該視頻對(duì)象區(qū)域,則采用原像素值,否則,用其它屬于該視頻對(duì)象區(qū)域像素的平均值代替;按照所述當(dāng)前塊和父塊的像素選取準(zhǔn)則確定當(dāng)前塊和父塊的像素值后,計(jì)算子塊與父塊的匹配誤差RMS,如果RMS小于閾值γ,則保存當(dāng)前所得系數(shù),否則將當(dāng)前的邊界塊劃分為小塊,對(duì)每個(gè)小塊分別返回步驟四進(jìn)行處理;步驟七對(duì)所有IFS系數(shù)進(jìn)行Huffman編碼,降低IFS系數(shù)數(shù)據(jù)的統(tǒng)計(jì)冗余;判斷當(dāng)前幀是否為最后一幀,如果是最后一幀結(jié)束編碼;否則,返回步驟二繼續(xù)處理下一幀圖像。2.根據(jù)權(quán)利要求1所述一種基于對(duì)象的分形視頻壓縮方法,其特征在于處理的視頻序列為YUV格式,分別對(duì)3個(gè)分量中的每個(gè)采用上述七個(gè)步驟進(jìn)行處理。3.根據(jù)權(quán)利要求1所述一種基于對(duì)象的分形視頻壓縮方法,其特征在于所述步驟五中對(duì)宏塊采用樹狀劃分,塊匹配采用匹配誤差準(zhǔn)則;子塊與父塊的匹配誤差RMS為<formula>formulaseeoriginaldocumentpage3</formula>其中參數(shù)8和0分別為二^^——“1⑵<formula>formulaseeoriginaldocumentpage3</formula>其中,N為子塊和父塊像素的個(gè)數(shù),r,為子塊的像素值,屯為父塊的像素值;計(jì)算當(dāng)前宏塊在參考幀中的塊匹配誤差RMS,其中ri是子塊的像素值,屯是父塊的像素值;如果RMS小于預(yù)先設(shè)定的閾值、,記錄IFS系數(shù),IFS系數(shù)包括匹配塊的位移矢量(x,y)和公式2,3中的s和0,處理下一宏塊;否則,對(duì)當(dāng)前宏塊進(jìn)行樹狀劃分,計(jì)算劃分后小塊的RMS,如果小于閾值Y,則停止劃分,否則繼續(xù)劃分,直到子塊達(dá)到預(yù)先設(shè)定的最小塊為止。4.一種基于對(duì)象的分形視頻解壓縮方法,其特征在于包含以下步驟步驟I首先從壓縮文件中讀入壓縮信息,包括壓縮幀數(shù),每幀圖像的寬和高,I幀壓縮質(zhì)量,插入I幀數(shù)量和搜索范圍;步驟II由讀入壓縮信息和當(dāng)前待解碼幀號(hào)判斷該待解碼幀是否為I幀,若是I幀轉(zhuǎn)入步驟III,否則轉(zhuǎn)入步驟IV;步驟III對(duì)于I幀,從壓縮文件中讀入碼流,并讀入該幀的Alpha平面,采用基于塊DCT變換的I幀幀內(nèi)圖像解壓縮方法進(jìn)行解碼,解碼之后的文件包括基于不同對(duì)象的視頻文件和完整的視頻文件,在基于對(duì)象的視頻文件中,根據(jù)Alpha平面,屬于該對(duì)象的像素保留,不屬于該對(duì)象的像素置零,幀數(shù)加一轉(zhuǎn)入步驟V;步驟IV對(duì)于非I幀,首先計(jì)算參考幀中按照設(shè)定步長(zhǎng)劃分的所有宏塊以及經(jīng)樹狀劃分得到的小塊的像素和、像素平方和,然后從壓縮文件中讀入塊的劃分信息和Huffman碼流以及該幀的Alpha平面,并根據(jù)塊的劃分信息和Huffman碼流以及該幀的Alpha平面得到該幀所有宏塊的劃分方式和每一個(gè)小塊的迭代函數(shù)系統(tǒng)系數(shù),按照每一宏塊進(jìn)行解碼;步驟V判斷此時(shí)所有幀是否都已解碼,若都已解碼完畢,則結(jié)束解碼過程,否則轉(zhuǎn)入步驟II。5.根據(jù)權(quán)利要求4所述一種基于對(duì)象的分形視頻解壓縮方法,其特征在于對(duì)于每一個(gè)宏塊進(jìn)行解碼時(shí),首先判斷該宏塊在編碼時(shí)的劃分方式,對(duì)于每一個(gè)子塊,首先在父塊域找到與該子塊相對(duì)應(yīng)的區(qū)域,然后利用下面的公式獲得該子塊的像素值,A=其中巧為待解碼子塊的像素值,di為父塊域中的像素值,S為比例因子,0為偏移因子。6.根據(jù)權(quán)利要求4所述一種基于對(duì)象的分形視頻解壓縮方法,其特征在于在基于對(duì)象的解碼過程中,當(dāng)前塊中只有屬于該對(duì)象區(qū)域的像素才進(jìn)行解碼,同樣,在父塊域中只利用屬于同一對(duì)象區(qū)域的像素進(jìn)行解碼,假如父塊域中的某個(gè)子塊中部分像素不屬于該視頻對(duì)象,那么這部分像素的值用該子塊中屬于該對(duì)象區(qū)域的像素的平均值代替。7.根據(jù)權(quán)利要求4所述一種基于對(duì)象的分形視頻解壓縮方法,其特征在于處理的視頻序列為YUV格式,分別對(duì)3個(gè)分量中的每個(gè)采用上述五個(gè)步驟進(jìn)行處理。全文摘要本發(fā)明提出了一種基于對(duì)象的分形視頻壓縮與解壓縮方法,該方法是基于視頻內(nèi)容,利用分形迭代原理進(jìn)行視頻編碼的一種新型視頻壓縮編碼方法。首先利用視頻分割方法獲得視頻對(duì)象分割平面即Alpha平面,對(duì)起始幀采用塊DCT變換編碼,對(duì)非I幀進(jìn)行塊運(yùn)動(dòng)估計(jì)/補(bǔ)償編碼,首先計(jì)算與子塊域和父塊域相關(guān)子塊的像素和與像素平方和,然后在前一幀搜索窗中利用全搜索方法尋找最相似的匹配塊,最后利用Huffman編碼方法壓縮迭代函數(shù)系統(tǒng)系數(shù)。對(duì)應(yīng)的解壓縮過程為對(duì)I幀采用反DCT變換的方式解碼,對(duì)非I幀進(jìn)行Huffman反編碼獲得迭代函數(shù)系統(tǒng)系數(shù),然后進(jìn)行基于宏塊的解碼,首先計(jì)算父塊域相關(guān)子塊的像素和與像素平方和,然后依次對(duì)當(dāng)前幀中的每一個(gè)宏塊進(jìn)行解碼。本方法引入了基于對(duì)象編碼的方法并改進(jìn)了傳統(tǒng)分形視頻壓縮方法,不但大大提高了壓縮比和峰值信噪比,而且提高了編碼速度,進(jìn)一步提高了分形視頻壓縮編碼的性能,使其更加具有靈活性和實(shí)用性。文檔編號(hào)H04N7/26GK101827268SQ20101016723公開日2010年9月8日申請(qǐng)日期2010年4月30日優(yōu)先權(quán)日2010年4月30日發(fā)明者候仰拴,王再闊,祝世平申請(qǐng)人:北京航空航天大學(xué)