一種基于dct系數(shù)的圖像篡改定位方法
【專利摘要】本發(fā)明公開了一種基于DCT系數(shù)的圖像篡改區(qū)域定位方法,該方法包括以下步驟:建立待測圖像的DCT系數(shù)概率分布模型;對(duì)于DCT系數(shù)概率分布模型的未知參數(shù)進(jìn)行估計(jì);計(jì)算得到待測圖像中某一DCT塊DCT系數(shù)被篡改的概率;利用篡改區(qū)域的先驗(yàn)知識(shí),得到待測圖像中不同DCT塊被篡改的概率,進(jìn)而得到待測圖像中篡改區(qū)域的最終定位結(jié)果。由于本發(fā)明不需要事先向圖像中嵌入水印信息,只需分析圖像本身而且不需要大量訓(xùn)練庫進(jìn)行機(jī)器學(xué)習(xí),故可在大規(guī)模數(shù)據(jù)通信、多媒體傳輸?shù)葍?nèi)容取證環(huán)境下得到有效的應(yīng)用。
【專利說明】一種基于DCT系數(shù)的圖像篡改定位方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像被動(dòng)盲取證領(lǐng)域,特別涉及一種基于DCT (離散余弦變換)系數(shù)的圖像篡改區(qū)域定位方法。
【背景技術(shù)】
[0002]數(shù)字化盛行的今天,人們比以往任何時(shí)期都依賴數(shù)字媒體以快速高效地掌握訊息。然而數(shù)字媒體卻有個(gè)至關(guān)重要的問題亟需解決——內(nèi)容的真實(shí)性和完整性。由于近年大量數(shù)字圖像處理軟件(例如Photoshop等)的涌現(xiàn),使得數(shù)字圖像的篡改、偽造輕而易舉,數(shù)字媒體不再像傳統(tǒng)媒體那樣具有較高的可信度。特別是在新聞報(bào)道,攝影比賽,甚至是法律證據(jù)中,往往會(huì)看到篡改圖像的身影。如果該問題無法得到較好的解決,很可能會(huì)擾亂社會(huì)秩序,破壞新聞媒體及司法的公信力。隨著數(shù)字圖像處理軟件功能的日益強(qiáng)大,以及操作的日趨簡化,越來越多的人開始篡改圖像,而且篡改的圖像越來越難被人眼檢測出來。因此,對(duì)于數(shù)字圖像內(nèi)容真實(shí)性認(rèn)證技術(shù)的需求迫在眉睫。
[0003]目前,數(shù)字圖像內(nèi)容認(rèn)證技術(shù)主要有兩大類:主動(dòng)方式和被動(dòng)方式。主動(dòng)方式需要在真實(shí)圖像生成過程中(拍照時(shí))或發(fā)布之前,向其中嵌入水印(或數(shù)字簽名)信息。在圖像真實(shí)性需要驗(yàn)證時(shí),只需從圖像中提取水印(數(shù)字簽名)信息,如果水印(或數(shù)字簽名)信息被破壞,則說明圖像有可能被篡改,水印(或數(shù)字簽名)被破壞的位置就是篡改發(fā)生的位置。但是這種方式在實(shí)際應(yīng)用中較為不便,無法做到使所有的數(shù)字成像設(shè)備都配備水印(數(shù)字簽名)嵌入模塊。被動(dòng)方式直接從圖像本身收集數(shù)據(jù),不需要上述的硬件模塊配置,這使得其得到較大的關(guān)注。比如篡改操作破壞了圖像成像過程中的一致性,可參考文獻(xiàn):A.C.Popescu and H.Farid, “Exposing digital forgeries in color filter arrayinterpolated images,,,IEEE Transactions on Signal Processing, vol.53, n0.10, pp.3948-3959,2005,或者使圖像中的相機(jī)固有噪聲改變或消失,可參考文獻(xiàn):J.Lukas, J.Fridrich, M.Goljan, “Detecting digital image forgeries using sensor patternnoise,,,Society of Photo-Optical Instrumentation Engineers (SPIE) ConferenceSeries.,vol.6072,pp.362-372,2006,或者使圖像的高階統(tǒng)計(jì)量發(fā)生改變,可參考文獻(xiàn):Y.Q.Shi, W.Chen, and C.Chen, “A natural image model approach to splicingdetection,,,Proceedings of the9th workshop on Multimedia&security, pp.51-62, 2007等等。實(shí)際上,篡改區(qū)域定位比僅僅檢測出篡改的發(fā)生更具有實(shí)際意義,更可信,它可以定位出篡改所發(fā)生的位置,而不僅僅是判斷圖像是否有篡改發(fā)生。
【發(fā)明內(nèi)容】
[0004]基于上述現(xiàn)有技術(shù)中存在的問題,本發(fā)明的目的是提供一種基于DCT系數(shù)對(duì)篡改圖像進(jìn)行篡改區(qū)域定位的方法,該方法對(duì)于一幅由圖像操作生成的篡改圖像(包括彩色和灰度圖像),能夠快速準(zhǔn)確地檢測并定位篡改區(qū)域。
[0005]為了實(shí)現(xiàn)上述目的,本發(fā)明提出的一種基于DCT系數(shù)的篡改區(qū)域定位方法包括以下步驟:
[0006]步驟S1:建立待測圖像的DCT系數(shù)概率分布模型;
[0007]步驟S2:對(duì)于所述DCT系數(shù)概率分布模型的未知參數(shù)進(jìn)行估計(jì);
[0008]步驟S3:利用估計(jì)得到的所述DCT系數(shù)概率分布模型中的未知參數(shù),計(jì)算得到所述待測圖像中某一 DCT塊DCT系數(shù)被篡改的概率;
[0009]步驟S4:基于所述DCT系數(shù)被篡改的概率,利用篡改區(qū)域的先驗(yàn)知識(shí),得到待測圖像中不同DCT塊被篡改的概率,進(jìn)而得到所述待測圖像中篡改區(qū)域的最終定位結(jié)果。
[0010]由于本發(fā)明不需要事先向圖像中嵌入水印信息,只需分析圖像本身而且不需要大量訓(xùn)練庫進(jìn)行機(jī)器學(xué)習(xí),故可在大規(guī)模數(shù)據(jù)通信、多媒體傳輸?shù)葍?nèi)容取證環(huán)境下得到有效的應(yīng)用。
【專利附圖】
【附圖說明】
[0011]圖1是本發(fā)明基于DCT系數(shù)的篡改區(qū)域定位方法的流程圖;
[0012]圖2是圖割算法的示意圖;
[0013]圖3是利用本發(fā)明方法對(duì)于某一待測圖像進(jìn)行篡改區(qū)域定位的結(jié)果示例圖?!揪唧w實(shí)施方式】
[0014]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,以下結(jié)合具體實(shí)施例,并參照附圖,對(duì)本發(fā)明進(jìn)一步詳細(xì)說明。
[0015]對(duì)于任意一幅由JPEG圖像操作生成的篡改圖像,可以利用其非篡改區(qū)域和篡改區(qū)域的DCT系數(shù)量化方式的不同,來定位其篡改區(qū)域。具體來說,在圖像壓縮中,DCT變化和其系數(shù)的量化是關(guān)鍵操作,多次量化和一次量化所產(chǎn)生的效應(yīng)是不同的。對(duì)于篡改圖像保存為JPEG格式的情況,其非篡改區(qū)域DCT系數(shù)經(jīng)歷過兩次量化過程,而篡改區(qū)域DCT系數(shù)可以認(rèn)為只經(jīng)歷過一次量化過程。原因在于,如果它來自無損壓縮圖像(之前沒有經(jīng)歷過JPEG壓縮中的量化損失),則顯然篡改完成保存為JPEG圖像時(shí),DCT系數(shù)只經(jīng)歷一次量化;如果來自JPEG壓縮圖像,篡改區(qū)域與非篡改區(qū)域未按照8X8的DCT塊對(duì)齊時(shí)(對(duì)齊概率非常小),篡改完成保存為JPEG圖像時(shí),圖像塊內(nèi)參與DCT變化的像素已經(jīng)發(fā)生變化,即之前的量化效應(yīng)已基本不存在,所以可認(rèn)為其DCT系數(shù)只經(jīng)歷一次量化。通過對(duì)兩次量化DCT系數(shù)和一次量化DCT系數(shù)的概率分布進(jìn)行數(shù)學(xué)建模,可以得到篡改圖像DCT系數(shù)概率分布的混合模型,并利用最大似然法則估計(jì)得到模型參數(shù),進(jìn)而得到DCT系數(shù)被篡改的后驗(yàn)概率。結(jié)合篡改區(qū)域集中且圖像內(nèi)容一致等先驗(yàn)知識(shí),定義取證能量函數(shù),通過最小化能量函數(shù)來精確定位篡改區(qū)域。對(duì)于篡改圖像保存為無損壓縮格式的情況,對(duì)其進(jìn)行JPEG壓縮,按照J(rèn)PEG格式的情況處理。同時(shí),在壓縮過程中,計(jì)算高頻DCT系數(shù)的量化噪聲,利用篡改區(qū)域和非篡改區(qū)域高頻DCT系數(shù)量化噪聲的不同,得到新的定位結(jié)果,將這兩個(gè)定位結(jié)果進(jìn)行融合,可以得到最終的定位結(jié)果。
[0016]本發(fā)明利用非篡改區(qū)域和篡改區(qū)域的DCT系數(shù)特性的不同來定位篡改區(qū)域。圖1是本發(fā)明基于DCT系數(shù)的篡改區(qū)域定位方法的流程圖,如圖1所示,所述方法包括以下步驟:
[0017]步驟S1:建立待測圖像的DCT系數(shù)概率分布模型;[0018]所述待測圖像為JPEG圖像。
[0019]該步驟中,記待測圖像中篡改區(qū)域的面積比例為a i,則待測圖像的DCT系數(shù)概率分布表不為:
[0020]P {X=x} = a (X1=X) + α 2Ρ2 {Χ2=χ},χ e Z,
[0021]其中,α2為待測圖像中非篡改區(qū)域的面積比例,α ^α2=1,Χ為待測圖像的DCT系數(shù),X1為一次量化DCT系數(shù),X2為兩次量化DCT系數(shù),P1 (X1=Xl為一次量化DCT系數(shù)X1取值為χ時(shí)的概率分布,P2 {Χ2=χ}為兩次量化DCT系數(shù)X2取值為χ時(shí)的概率分布。
[0022]量化之前的交流DCT系數(shù)采用Laplacian概率分布模型建模,即:
[0023]
【權(quán)利要求】
1.一種基于DCT系數(shù)的篡改區(qū)域定位方法,其特征在于,該方法包括以下步驟: 步驟S1:建立待測圖像的DCT系數(shù)概率分布模型; 步驟S2:對(duì)于所述DCT系數(shù)概率分布模型的未知參數(shù)進(jìn)行估計(jì); 步驟S3:利用估計(jì)得到的所述DCT系數(shù)概率分布模型中的未知參數(shù),計(jì)算得到所述待測圖像中某一 DCT塊DCT系數(shù)被篡改的概率; 步驟S4:基于所述DCT系數(shù)被篡改的概率,利用篡改區(qū)域的先驗(yàn)知識(shí),得到待測圖像中不同DCT塊被篡改的概率,進(jìn)而得到所述待測圖像中篡改區(qū)域的最終定位結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述待測圖像為JPEG圖像。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟SI中,記待測圖像中篡改區(qū)域的面積比例為Ci1,則待測圖像的DCT系數(shù)概率分布表示為:
P {X=x} = a (X1=X) + α 2Ρ2 {Χ2=χ}, χ e Z, 其中,Ci2為待測圖像中非篡改區(qū)域的面積比例,a ^a2=LX為待測圖像的DCT系數(shù),X1為一次量化DCT系數(shù),X2為兩次量化DCT系數(shù),P1 (X1=Xj為一次量化DCT系數(shù)X1取值為χ時(shí)的概率分布:
P1 [Xx = jc} = ? f 令 exp (-A1JC0 }--:0, P2 {X2=x}為兩次量化DCT系數(shù)X2取值為X時(shí)的概率分布:
汴 / \? 、P2{X2=x} = j' /^exp{-^x0)i/x0, 粉剩2
I I[ x / J 其中,qi和q2分別為待測圖像DCT系數(shù)第一次量化和第二次量化的量化步長;λ i和λ 2分別為篡改區(qū)域和非篡改區(qū)域所對(duì)應(yīng)的Laplacian分布模型參數(shù);Χ(Ι為未經(jīng)量化的DCT系數(shù)取值。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S3中,所述待測圖像中某一DCT塊DCT系數(shù)被篡改的概率表示為:小;, 其中,Ii指示第i個(gè)DCT塊是否被篡改,Xi為第i個(gè)DCT塊中某一頻率上的DCT系數(shù)取值,P1 (Xi)為第i個(gè)DCT塊中相應(yīng)頻率上DCT系數(shù)經(jīng)過一次量化取值為Xi的概率,P2 (Xi)為第i個(gè)DCT塊中相應(yīng)頻率上DCT系數(shù)經(jīng)過兩次量化取值為Xi的概率。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟S4進(jìn)一步包括以下步驟: 步驟S41,基于待測圖像某一 DCT塊DCT系數(shù)的概率分布和篡改區(qū)域的先驗(yàn)知識(shí)定義取證能量函數(shù); 步驟S42,對(duì)所述取證能量函數(shù)進(jìn)行最小化,得到所述待測圖像中篡改區(qū)域的最終定位結(jié)果。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述取證能量函數(shù)表示為:
E(A) = CoR(A) +B(A),其中,
7.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述步驟S42中,利用圖割算法對(duì)所述取證能量函數(shù)進(jìn)行最小化。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述利用圖割算法對(duì)所述取證能量函數(shù)進(jìn)行最小化包括: 首先,提取相同頻域不同DCT塊上的DCT系數(shù)來構(gòu)造圖結(jié)構(gòu); 然后,利用圖割算法求解圖的最小割,實(shí)現(xiàn)所述取證能量函數(shù)的最小化,得到篡改區(qū)域的初步定位結(jié)果; 最后,對(duì)于某一 DCT塊中前N個(gè)最低頻率的DCT系數(shù)對(duì)應(yīng)的定位結(jié)果求取平均,得到該DCT塊被篡改的概率,對(duì)其進(jìn)行閾值化處理,即得到篡改區(qū)域的最終定位結(jié)果。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,如果所述待測圖像為無損壓縮圖像,則所述步驟SI之前還包括步驟SO:對(duì)所述無損壓縮圖像進(jìn)行JPEG壓縮,作為待測圖像。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,如果所述待測圖像為無損壓縮圖像,則在所述步驟S4得到待測圖像中不同DCT塊被篡改的概率之后還包括以下步驟: 步驟S4a:計(jì)算所述待測圖像壓縮前與壓縮后高頻DCT系數(shù)的量化損失作為高頻量化噪聲ni;J:
【文檔編號(hào)】G06T1/00GK103679626SQ201310680361
【公開日】2014年3月26日 申請(qǐng)日期:2013年11月28日 優(yōu)先權(quán)日:2013年11月28日
【發(fā)明者】譚鐵牛, 董晶, 王偉 申請(qǐng)人:中國科學(xué)院自動(dòng)化研究所