一種jpeg格式圖像來(lái)源鑒別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)圖像處理技術(shù)領(lǐng)域,特別是一種針對(duì)JPEG格式圖像的來(lái)源鑒 別方法。
【背景技術(shù)】
[0002] 近幾年,數(shù)碼照相機(jī)的逐漸普及以及網(wǎng)絡(luò)技術(shù)越來(lái)越發(fā)達(dá),數(shù)字圖像已被廣泛 應(yīng)用于人們的日常工作和生活中,同時(shí)數(shù)字圖像在網(wǎng)絡(luò)信息傳遞中所占比例也越來(lái)越 大。然而,隨著技術(shù)的進(jìn)步,功能強(qiáng)大的圖像處理和編輯軟件如Photoshop、Photoimpact、 CorelDraw、AutoCAD、FreeHand等的廣泛應(yīng)用,人們可以利用各種圖像處理工具和編輯軟 件,對(duì)圖像進(jìn)行篡改和偽造而不留下人眼可以識(shí)別出來(lái)的痕跡,自然真實(shí)的圖像很容易被 偽造和篡改,使數(shù)字圖像變得真假難辨。雖然大多數(shù)圖像處理者的動(dòng)機(jī)可能是合法的,但是 不排除有些人故意散布一些經(jīng)過(guò)偽造或篡改技術(shù)處理過(guò)的照片,來(lái)實(shí)現(xiàn)自己的某種目的。 這也使得越來(lái)越多高品質(zhì)的,足夠以假亂真的非自然場(chǎng)景的圖片通過(guò)Internet網(wǎng)廣為流 傳。偽造或篡改的圖片使人們對(duì)新聞的真實(shí)性產(chǎn)生懷疑,嚴(yán)重的可能會(huì)歪曲事實(shí)、影響歷 史、危害社會(huì)公共安全,數(shù)字多媒體取證技術(shù)就是在這種背景下孕育而生的。
[0003] 目前,數(shù)字多媒體取證技術(shù)大致可以分為兩類:主動(dòng)取證與被動(dòng)取證。其中,主動(dòng) 取證技術(shù)是在多媒體信息制作過(guò)程中,主動(dòng)加入一些特有的驗(yàn)證數(shù)據(jù),即可在接收端通過(guò) 驗(yàn)證上述信息達(dá)到驗(yàn)證媒體完整性的目的,其代表技術(shù)是數(shù)字簽名技術(shù)和數(shù)字水印技術(shù)。 但它們往往要求媒體獲取設(shè)備本身具有生成簽名或添加水印的功能(通常要求生產(chǎn)廠商 在設(shè)備中添加相應(yīng)的軟硬件模塊),這種設(shè)備一般比較昂貴,屬于高端產(chǎn)品,且目前絕大多 數(shù)設(shè)備并無(wú)簽名或水印功能。被動(dòng)取證技術(shù)則是僅根據(jù)獲取的數(shù)字媒體資源以及相關(guān)設(shè)備 的特征,分析自然媒體與被篡改媒體之間的差異,從中尋找篡改后可能留下的各種痕跡,從 而區(qū)分出自然媒體與被篡改媒體,并進(jìn)一步對(duì)篡改操作進(jìn)行定性或定量分析。由于它的應(yīng) 用領(lǐng)域更具普遍性,涵蓋了現(xiàn)有的媒體資源,因此更具實(shí)用價(jià)值。
[0004] 由于圖像數(shù)據(jù)量大,在照相機(jī)內(nèi)部的圖像后處理模塊中會(huì)引入JPEG (Joint Photographic Experts Group)后壓縮處理操作,將圖像壓縮在很小的儲(chǔ)存空間。但同時(shí) JPEG壓縮過(guò)程會(huì)導(dǎo)致量化誤差,降低了模式噪聲的精度。
[0005] 發(fā)明目的
[0006] 本發(fā)明的目的在于針對(duì)現(xiàn)有技術(shù)的不足,提供一種JPEG格式圖像來(lái)源鑒別方法。
[0007] 實(shí)現(xiàn)本發(fā)明目的的技術(shù)方案為:一種JPEG格式圖像來(lái)源鑒別方法,它利用照相機(jī) 在產(chǎn)生數(shù)字圖像的過(guò)程中引入的模式噪聲,并充分考慮JPEG壓縮的量化誤差影響,對(duì)模式 噪聲的每一點(diǎn)計(jì)算其可靠性因子,提出了一種自適應(yīng)加權(quán)相關(guān)檢測(cè)算法判斷待測(cè)JPEG格 式圖像來(lái)源于哪個(gè)照相機(jī),包括以下五個(gè)步驟:
[0008] (1)建立一個(gè)已知相機(jī)的圖像庫(kù),而后分別提取圖像庫(kù)與待測(cè)JPEG格式圖像的模 式噪聲,且對(duì)圖像庫(kù)的模式噪聲取平均得到相機(jī)的參考噪聲模板;已知相機(jī)的圖像庫(kù)中的 圖像為bmp格式。
[0009] (2)建立頻域量化噪聲模型,估計(jì)JPEG格式圖像的量化噪聲方差;
[0010] (3)建立模式噪聲的可信度評(píng)價(jià)函數(shù),計(jì)算模式噪聲的可信度因子;
[0011] ⑷利用可信度因子,求取待測(cè)JPEG格式圖像的模式噪聲與參考噪聲模板之間的 自適應(yīng)加權(quán)相關(guān);
[0012] (5)利用成熟的分類器判斷待測(cè)JPEG格式圖像來(lái)源于哪個(gè)相機(jī)。
[0013] 本發(fā)明步驟(1)的模式噪聲提取方法,具體包含以下步驟:
[0014] (a)對(duì)圖像P做小波分解,得到4個(gè)子頻帶,分別為:低低頻帶LU低高頻帶LH、高 低頻帶HL、高高頻帶HH ;且分別對(duì)LH、HL、HH三個(gè)子頻帶進(jìn)行后續(xù)處理;
[0015] (b)提取某一子頻帶的小波系數(shù)局部方差:定義一個(gè)尺寸為WXW的檢測(cè)窗口, W e {3, 5, 7, 9},用最大似然估計(jì)算法和最小均方誤差算法估計(jì)每個(gè)小波系數(shù)的局部方差 〇1",./),其計(jì)算公式如下:
[0016]
(1)1
[0017] 其中〇"為加性高斯白噪聲方差,用噪聲估計(jì)的方法估計(jì)出來(lái),為快速處理,可將 σ n= 3, h (i,j)為每個(gè)子頻帶的小波系數(shù),i,j為圖像像素的橫坐標(biāo)和縱坐標(biāo),從局部方差 序列= 中選擇最小的值作為該點(diǎn)的局部方差〇2(i,j),計(jì)算公式為:
[0018]
(2)
[0019] (C)對(duì)三個(gè)高頻子頻帶做小波局部維納濾波hf(i,j):
[0020]
C3)
[0021] (d)對(duì)LL,以及處理過(guò)的LH、HL、HH三個(gè)子頻帶進(jìn)行小波逆變換,得到去噪圖像 F (P),并與原始圖像P做差,獲取模式噪聲N :
[0022] N = P-F (P) (4)
[0023] (e)去除模式噪聲中包含的CFA插值噪聲:先對(duì)每一列減去該列的均值,再對(duì)每一 行減去該行的均值;
[0024] (f)對(duì)圖像庫(kù)中M幅參考圖像的模式噪聲進(jìn)行平均處理,得到參考模式噪聲模板 Pc(i,j):
[0025] (5 J
[0026] Nk (i,j)表示第k畐Ij圖像位于(i,j)位置的模式噪聲,k取值1~Μ。
[0027] 本發(fā)明步驟(2)的頻域量化噪聲模型,其依據(jù)的是DCT(DCT for Discrete Cosine Transform,離散余玄變換)系數(shù)1的分布情況,提出了一種混合量化噪聲模型:
[0028]
(每
[0029] 其中γ是歸一化常數(shù),X表示積分變量,1是當(dāng)前圖像像素(u,V)位置處的量化 DCT系數(shù)值,q(l+l)、q(l)分別是1對(duì)應(yīng)的DCT系數(shù)量化區(qū)間上限與下限,F(xiàn)(X)是拉普拉斯 概率分布函數(shù)。對(duì)于給定的一副JPEG格式圖像,其量化DCT系數(shù)值、量化參數(shù)等都是已知 的,可以計(jì)算得到q(l)值。
[0030] 基于頻域量化噪聲模型<;(〃.V),對(duì)頻域噪聲做8 X 8的DCT逆變換,得到空域量化 噪聲40',./),其計(jì)算公式如下:
[0031]
0)
[0032] 其中aU)為變換常量函數(shù),a(u)、a(v)都是該類型常量函數(shù)。因?yàn)镴PEG圖像壓 縮過(guò)程采用的是8x8的DCT變換矩陣,所以反變換也是8X8的IDCT變換矩陣,因此u,V對(duì) 的上限是7。參數(shù)λ為判斷參數(shù)。
[0033] 本發(fā)明步驟(3)的模式噪聲可信度評(píng)價(jià)函數(shù)。可信度評(píng)價(jià)函數(shù)是用來(lái)估計(jì)壓縮圖 像中模式噪聲的可靠性,可信性函數(shù)r (i,j)定義為參考模式噪聲大于量化噪聲的概率,其 計(jì)算公式如下:
[0034]
(8)
[0035] 本發(fā)明步驟(4)的自適應(yīng)加權(quán)相關(guān)函數(shù)??紤]到JPEG壓縮過(guò)程帶來(lái)的影響,減弱 壓縮圖像中量化噪聲對(duì)模式噪聲的影響,加權(quán)相關(guān)計(jì)算公式如下:
[0036]
C9)
[0037] 其中為向量?jī)?nèi)積操作,I |X| I為計(jì)算向量X的二階模,N(i,j)為待測(cè)JPEG格式 圖像的模式噪聲,r(i, j)為可信度因子,隊(duì)(i, j)為修正后的模式噪聲,死為所有隊(duì)(i, j) 的算術(shù)平均值,Pji,j)為參考模式噪聲模板,1為所有Pji,j)的算術(shù)平均值。
[0038] 申請(qǐng)人發(fā)現(xiàn),鑒別數(shù)字圖像的來(lái)源是數(shù)字圖像多媒體被動(dòng)取證的第一步,主要提 供有關(guān)數(shù)字圖像收集、處理、輸出設(shè)備的信息,簡(jiǎn)而言之,就是研究數(shù)字圖像資源從哪個(gè)照 相機(jī)拍攝而來(lái)的。雖然在視覺(jué)上不同類型的設(shè)備產(chǎn)生的數(shù)字圖像差別并不明顯,但是由于 各種圖像生成設(shè)備有著內(nèi)在的不同特性,這些特性可以通過(guò)對(duì)輸出的數(shù)字圖像進(jìn)行分析來(lái) 區(qū)別。其中,圖像傳感器作為光電轉(zhuǎn)換的核心部件,其好壞往往對(duì)最后輸出圖像的質(zhì)量有很 大影響。研究工作者發(fā)現(xiàn)圖像傳感器存在各種固有缺陷,如灰塵特性、暗電流引起的固定模 式噪聲、光敏材料的光響應(yīng)非均勻性引起的隨機(jī)噪聲等等,這些缺陷最終會(huì)造成輸出圖像 含有獨(dú)特的噪聲模式,不同的相機(jī)具有不同的獨(dú)有噪聲模式。在JPEG壓縮過(guò)程中,這些獨(dú) 有的噪聲模式會(huì)被量化噪聲干擾,從待測(cè)JPEG格式圖像中提取可靠的噪聲模式,與已知照 相機(jī)的參考噪聲模式相匹配,可得知圖像的來(lái)源于哪個(gè)照相機(jī)。
[0039] 本發(fā)明與現(xiàn)有技術(shù)相比,其顯著優(yōu)點(diǎn)為:
[0040] (1)新穎性。本發(fā)明充分考慮到JPEG量化過(guò)程的影響,提出了一種量化噪聲的混 合模型,利用該模型建立了模式噪聲的可信度評(píng)價(jià)函數(shù),估計(jì)模式噪聲的可信度,設(shè)計(jì)了一 種自適應(yīng)加權(quán)相關(guān)檢測(cè)算法,大大提升了檢測(cè)精度。
[0041] ⑵適應(yīng)性廣。以往的圖像來(lái)源鑒別檢測(cè)技術(shù)往往針對(duì)未壓縮的原始圖像,當(dāng)圖像 經(jīng)過(guò)JPEG壓縮后,其檢測(cè)效果大大降低;而本發(fā)明檢測(cè)的對(duì)象主要是JPEG格式圖像,未壓 縮圖像是JPEG格式圖像中的一種,故適應(yīng)性廣。
[0042] (3)可信度高。本發(fā)明利用的是照相機(jī)固有的特性一一模式噪聲,其產(chǎn)生的原因是 光電傳感器在制造過(guò)程中會(huì)存在不可避免的缺陷,導(dǎo)致不同位置的像素點(diǎn)對(duì)光線的敏感程 度不一。本發(fā)明正是檢測(cè)這種像素的不均勻性來(lái)判別數(shù)字圖像的來(lái)源,具有明確的物理依 據(jù),且充分考慮到了 JPEG壓縮過(guò)程的影響,故可信度比較高。
【附圖說(shuō)明】
[0043] 圖1是本發(fā)明的JPEG格式圖像來(lái)源鑒別系統(tǒng)的整體流程圖;
[0044] 圖2是本系統(tǒng)的模式噪聲提取流程圖;
[0045] 圖3是一相機(jī)拍攝的原始圖像;
[0046] 圖4是圖3的小波二維分解結(jié)果;
[0047] 圖5是相關(guān)性計(jì)算結(jié)果散點(diǎn)圖。
【具體實(shí)施方式】
[0048] 圖1說(shuō)明本發(fā)明的JPEG格式圖像來(lái)源鑒別系統(tǒng)的整體流程圖。在步驟A,通過(guò)模 式噪聲提取模塊獲取待鑒定JPEG格式圖像的模式噪聲,首先對(duì)圖像做小波變換,生成四個(gè) 子帶,而后針對(duì)包含高頻的子帶做低通濾波操作,最后做小波逆變換得到濾波后圖像,并與 原始圖像做差得到圖像的模式噪聲。在步驟B,利用混合量化噪聲模型估計(jì)圖像的量化噪聲 大小,隨后在步驟C中估計(jì)每個(gè)像素的模式噪聲可靠性因子,并在步驟D中計(jì)算待測(cè)JPEG 格式圖像的模式噪聲與參考噪聲模板之間的加權(quán)相關(guān)性。最后,在步驟E中利用一個(gè)成熟 的分類器依據(jù)步驟D中的相關(guān)性程度來(lái)判斷待測(cè)JPEG格式圖像的來(lái)源。
[0049] 結(jié)合圖1,本發(fā)明的圖像模式噪聲提取主要針對(duì)小波高頻子帶,處理流程如圖2所 示,具體步驟如下:
[0050] (a)對(duì)圖像P做小波分解,得到4個(gè)子頻帶,分別為低低頻帶(記為L(zhǎng)L)、低高頻帶 (記為L(zhǎng)H)、高低頻帶(記為HL)、高高頻帶(記為_(kāi),以下分別對(duì)LH、HL、HH子頻帶進(jìn)行后 續(xù)處理。
[0051] (b)提取子頻帶的小波系數(shù)局部方差。首先定義一個(gè)尺寸為WXW的檢測(cè)窗口, We {3, 5, 7, 9},用最大似然估計(jì)(ML Maximum Likelihood)算法和最小均方誤差(MMSE Minimum Mean Square Error)算法估計(jì)每個(gè)小波系數(shù)的局部方差,其計(jì)算公式如下:
[0052]
⑴
[0053] 其中〇 "為加性高斯