專利名稱::一種基于圖像信息損失量的bmp圖像壓縮歷史檢測方法
技術(shù)領域:
:本發(fā)明屬于信號與信息處理
技術(shù)領域:
,涉及到檢測BMP(bitmap)圖像壓縮歷史的數(shù)字圖像取證方法。技術(shù)背景目前主要有兩種方法對BMP圖像的壓縮歷史進行檢測。一種是基于由JPEG(JointPhotographicExpertsGroup)壓縮所產(chǎn)生的塊效應進行BMP圖像壓縮歷史檢測的算法。Fan等人在"Identificationofbitmapcompressionhistory:JPEGdetectionandquantizerestimation"中提出一幅BMP圖像之前若沒有經(jīng)過JPEG壓縮,則塊之間的像素值差應該相近,反之像素值差則會因為JPEG壓縮的塊效應而不同,利用這一特性檢測出BMP圖像的壓縮歷史之后還可利用最大相似原理來估計原始量化階梯。盡管文中的方法得到了一個比較好的檢測結(jié)果,但是這種方法計算復雜性較大,而且隨著壓縮質(zhì)量因數(shù)的增大,不能判斷BMP圖像之前是否經(jīng)過JPEG壓縮的概率變大,尤其當質(zhì)量因數(shù)大于95后,由于塊效應不明顯導致算法檢測準確率急劇下降。另一種典型方法是基于Benford法則的檢測方法。2007年,F(xiàn)u等人通過大量實驗發(fā)現(xiàn)單次壓縮的JPEG圖像的JPEG系數(shù)的第一位有效數(shù)字符合廣義Benford法則分布。Benford法則是經(jīng)濟學中常用的一個公式。Fu等人在"AgeneralizedBenford,slawforJPEGcoefficientsanditsapplicationsinimageforensics"—文中利用JPEG系數(shù)首位有效數(shù)字的這一分布特性通過SVM(SupportVectorMachine)分類器進行分類可以檢測BMP圖像之前是否經(jīng)過JPEG壓縮,并粗略估計原始壓縮質(zhì)量因數(shù)。文中實驗結(jié)果表明此方法在原始壓縮質(zhì)量因數(shù)高達99時,檢測準確率仍能達到100%。但是Benford法則的應用有很多限制條件,如數(shù)據(jù)不能設置最大值與最小值的限制,數(shù)值在一個很寬的范圍里連續(xù)變動,既不完全隨機,也不過度地集中等。因此雖然此種方法在文獻的實驗中達到了很高的準確率,但是這些限制條件使得這一方法的使用有一定的局限性,如色調(diào)單一圖像如大片藍天、綠地等圖像并不符合這一規(guī)律,圖像尺寸較小時也會有影響。
發(fā)明內(nèi)容本發(fā)明要解決的技術(shù)問題是提供一種對單幅或大批BMP圖像進行JPEG壓縮歷史檢測的方法。本發(fā)明的技術(shù)方案如下1.JPEG壓縮對圖像JPEG系數(shù)的影響圖像經(jīng)過分塊DCT(DiscreteCosineTransform)變換和量化之后的DCT系數(shù)稱為JPEG系數(shù),它可以從JPEG圖像文件中直接讀取。JPEG系數(shù)中0的個數(shù)是影響JPEG壓縮質(zhì)量的一個主要因素。通過實驗發(fā)現(xiàn),若將同一幅BMP圖像壓縮為不同質(zhì)量因數(shù)的JPEG圖像,隨著JPEG壓縮質(zhì)量因數(shù)的增大,圖像質(zhì)量隨之不斷變好,64個JPEG系數(shù)中0的百分比也會隨之不斷減小。因此將0的在64個DCT位置上的個數(shù)百分比定義為圖像經(jīng)過JPEG壓縮后的信息損失量,則圖像信息損失量越大,JPEG圖像質(zhì)量越差。設n(力為所有DCT塊中第/個JPEG系數(shù)位置上0的個數(shù)和,m為8+8DCT塊的個數(shù),則圖像信息損失量可表示為^/)我/=1,2"",64(1)附平均信息損失量表示為<formula>formulaseeoriginaldocumentpage6</formula>圖1中顯示了任取一幅BMP圖像將其壓縮為質(zhì)量因數(shù)Q=75~100的JPEG圖像后計算平均信息損失量average的結(jié)果,可見隨著Q的增大,average不斷減小。因此,將一幅待測BMP圖像/一壓縮為Q=100的JPEG圖像/》^,若/—之前經(jīng)過質(zhì)量因數(shù)為Q1(QK100)的JPEG壓縮,則圖像信息損失量會大于一幅原始BMP圖像直接轉(zhuǎn)換為Q=100的JPEG圖像的圖像信息損失量。只要通過比較待測BMP圖像與原始BMP的圖像信息損失量,便可判斷出待測BMP圖像之前是否經(jīng)過JPEG壓縮。因為JPEG壓縮是有損壓縮,我們無法從一幅之前經(jīng)過JPEG壓縮的圖像中恢復到之前的原始圖像,因此申請人采用了對待測圖像剪切4行4列的方法估計原始BMP圖像。2.剪切4行4列估計原始圖像一幅JPEG圖像剪切四行四列后可以看做是校準后的圖像,如圖2所示。因為將一幅圖像剪切4行4列后,圖像信息損失量不大,若圖像之前經(jīng)過JPEG壓縮,對其剪切4行4列后,會破壞原JPEG壓縮的8*8分塊結(jié)構(gòu),再次進行JPEG壓縮之后,則僅只有最后一次壓縮可見。將一幅待測BMP圖像剪切4行4列,則若圖像之前經(jīng)過JPEG壓縮,剪切之后會破壞原來的壓縮效應,可近似看做一幅原來未經(jīng)過JPEG壓縮的原始圖像;若圖像之前未經(jīng)過JPEG壓縮,則即使經(jīng)過4行4列的剪切操作,因為圖像信息損失量不大,仍可看做一幅原始圖像。因此本發(fā)明通過對待測圖像剪切四行四列來近似估計原始圖像,并通過與待測圖像的信息損失量比較來提取待測圖像的統(tǒng)計特征進行BMP圖像壓縮歷史檢測。3.反映圖像信息損失量的特征提取根據(jù)JPEG壓縮對圖像JPEG系數(shù)的影響,本發(fā)明提取了待測BMP圖像和估計原圖壓縮為Q=100的JPEG圖像后的JPEG系數(shù)統(tǒng)計特征來進行BMP圖像壓縮歷史檢測。將一幅由相機攝取的TIFF(TaggedImageFileFormat)圖像壓縮為質(zhì)量因數(shù)為卯的JPEG圖像后,再重新讀取并解壓縮為一幅BMP圖像,如圖3所示,從視覺角度看無法感覺到它與原始TIFF圖像之間的差異,但是通過分別提取二者的64維^)特征之后,可發(fā)現(xiàn)同一DCT系數(shù)位置上0的個數(shù)百分比有很大差另lj,原TIFF圖像64個位置上JPEG系數(shù)中0的比重均遠小于之前經(jīng)過JPEG壓縮的BMP圖像,如圖4所示。因此本發(fā)明利用這一現(xiàn)象,假設給定一幅待測BMP圖像/一,對其剪切四行四列后得到估計原圖L,分別將這兩幅圖像壓縮為Q=100的JPEG圖像A一和/肖2,通過分別讀取這兩幅JPEG圖像的Y通道的JPEG系數(shù),按照公式1計算得到&(刀和/^(/),J=1,2,...,64,即64個DCT系數(shù)位置上的圖像信息損失量。令<formula>formulaseeoriginaldocumentpage7</formula>其中WM(O為求個數(shù)函數(shù)。從而得到2維特征4和Z,,作為圖像信息損失量增減少的度量。若待測BMP圖像/之前未經(jīng)過JPEG壓縮,則圖像4,與/的圖像信息損失量應該近似,表現(xiàn)為Z^Z^若/—之前經(jīng)過JPEG壓縮,則因為JPEG壓縮是有損壓縮,即使解壓縮為BMP圖像,還是會損失一些細節(jié),所以再將其壓縮為質(zhì)量因數(shù)為100的JPEG圖像之后,圖像信息損失量增大,導致乙,中某些位置上的圖像信息損失量會增大,因此,所求的2維特征會表現(xiàn)為Z,》Z:。綜上所述,本發(fā)明對BMP圖像壓縮歷史檢測的具體步驟如下要檢測一幅BMP圖像/,之前是否經(jīng)過JPEG壓縮,首先要將其剪切4行4列后得到一幅估計原圖L,再分別將這兩幅圖像壓縮為Q=100的JPEG圖像4w和/*2,利用它們的JPEG系數(shù)中圖像信息損失量進行特征提取,最后可利用Fisher線性分類器進行分類訓練和測試檢測BMP圖像的壓縮歷史,也可利用提取特征的比例關系進行閾值分割,無需訓練和測試就可對單幅圖像進行判斷。本發(fā)明的具體實現(xiàn)步驟如圖5所示。本發(fā)明的效果益處是數(shù)字圖像作為司法證據(jù),最重要的就是要判斷其是否經(jīng)過篡改。通過判斷一幅BMP圖像之前是否經(jīng)過JPEG壓縮,可以對圖像的真實性做出初步的判別,為司法部門的證據(jù)監(jiān)督鏈提供有效的技術(shù)保障。本發(fā)明適用于信息安全領域,可以有效地對一幅給定的BMP圖像進行壓縮歷史的檢測。圖1是圖像平均信息損失量average隨JPEG壓縮質(zhì)量因數(shù)的變化圖。圖中橫坐標是75-100的質(zhì)量因數(shù),縱坐標是average的值。圖2是原圖估計方法即校準圖像的獲取方法圖。圖3是原始TIFF圖像與原來經(jīng)過Q=90的JPEG壓縮的BMP圖像的視覺對比圖。圖中(a)為原始TIFF圖像,(b)為原來經(jīng)過Q-90的JPEG壓縮的BMP圖像。圖4是64個DCT位置上JPEG系數(shù)中0的比重圖。圖中十字線條為原始壓縮質(zhì)量因數(shù)為90的bmp圖像經(jīng)過Q=100的壓縮后JPEG系數(shù)中0的比重,方塊線條為原始TIFF圖像。圖5是本發(fā)明方法的整體實現(xiàn)步驟示意圖。具體實施例方式以下結(jié)合技術(shù)方案和附圖,詳細敘述本發(fā)明的具體實施方式。實驗中選擇了由KodakDC290相機攝取的300幅TIFF圖像作為原始的無損圖像,包含兩種分辨率,分別為720*480和1440*960,并將這300幅TIFF原圖分別壓縮為Q={60,70,80,85,90,95,96,97,98,99}的JPEG圖像后再轉(zhuǎn)成BMP圖像,作為原先經(jīng)過JPEG壓縮的BMP圖像。因為隨著壓縮質(zhì)量因數(shù)Q的減小,圖像損失信息越多,圖像質(zhì)量也會越差,從理論上講,算法的檢測效果也會越好,所以,本發(fā)明選擇了3個較低的常用壓縮質(zhì)量因數(shù)Q^60,70,80,85}用來測試算法的有效性,選擇了最大到99的6個較高的壓縮質(zhì)量因數(shù)Q^卯,95,96,97,98,99}。這樣總共得到了300*10=3000幅圖像。利用提取的2維JPEG系數(shù)特征,考慮到特征維數(shù)少,實驗中使用fisher線性分類器,300幅圖像中200幅用來訓練,100幅用來測試,對原始TIFF圖像與原先經(jīng)過質(zhì)量因數(shù)分別為Q={60,70,80,85,卯,95,96,97,98,99}的JPEG壓縮的BMP圖像進行一對一的分類測試。測試結(jié)果如表1所示。表l本發(fā)明一對一實驗結(jié)果Q=60708085卯95%979899原圖(%)10010010010010010010010010099原先經(jīng)過壓縮的BMP圖像(%)1001001001001000010010010091平均準確率(%)100100100謂10010010010010095本發(fā)明所提出的方法即使在原始壓縮質(zhì)量因數(shù)Q高達98時,仍能100%準確分類,因為Q-99時,JPEG壓縮損失信息較少,檢測較為困難,但是準確率也達到了95%。在實際情況中,原先壓縮的質(zhì)量因數(shù)是未知的,因此我們對本方法進行了混測實驗,即從原始壓縮質(zhì)量因數(shù)為Q={60,70,80,85,卯,95,96,97,98,99}的BMP圖像中分別選取20幅不同的圖像組成200幅訓練圖像,再從剩下的100幅圖像中每種質(zhì)量因數(shù)分別選取10幅圖像組成測試集,原TIFF圖像選擇200幅作為訓練,IOO幅作為測試,利用fisher線性分類器進行分類,則原始BMP圖像分類準確率為100%,而之前經(jīng)過壓縮的BMP圖像分類準確率較低,為92%,考慮原因是訓練和測試圖像中Q-99的圖像較多,而實際應用中之前壓縮質(zhì)量因數(shù)Q=99的圖像所占比例很小,因此去除Q=99之后的混測模型準確率均達到了100%。選擇5幅藍天,綠地的原始圖像,利用本發(fā)明的混測模型進行測試,5幅圖像全部準確判斷為原始圖像。另外,通過實驗發(fā)現(xiàn),原始圖像與之前經(jīng)過JPEG壓縮的BMP圖像的特征Z,與^的比例有較大差別,因此,可以考慮無須訓練,用閾值分割方法來判斷圖像之前是否經(jīng)過JPEG壓縮。設Z二,,表2顯示了對300幅圖像分別計算Z值的結(jié)果。表2300幅圖像的Z值計算結(jié)果<table>tableseeoriginaldocumentpage10</column></row><table>表中列出了300幅原始圖像和之前經(jīng)過不同質(zhì)量因數(shù)壓縮的BMP圖像的Z值的最大值和最小值,其中Inf表示無窮大,說明22=0。Q-99時Z〈2.0的圖像300幅中僅有35幅,0=98時2<2.0的圖像300幅中僅有2幅,原圖中Z〉2.0的圖像300幅中僅有2幅。因此,可將2.0作為區(qū)分原始圖像與原先經(jīng)過壓縮的BMP圖像的一個閾值,給定一幅BMP圖像,只需計算其Z值,便可初步判斷它原先是否經(jīng)過JPEG壓縮。分別計算藍天、草地的原始圖像和這5幅原始圖像壓縮為()={85,95,99}的JPEG圖像再解壓縮為BMP圖像后得Z值結(jié)果如表3所示。表35幅藍天、綠地圖像Z值結(jié)果z值原圖Q=85q=95Q=99第1幅0.97MInf20.33第2幅0.68InfInf4.17第3幅0.97Inf637.00第4幅0.72MInf4.18第5幅1.2763613.29可見原始圖像的Z值均在閾值2.0以下,而之前經(jīng)過JPEG壓縮的BMP圖像即使是原始壓縮質(zhì)量因數(shù)高達99時,仍在閾值2.0以上,因此本發(fā)明對大片單一色調(diào)圖像仍然適用。權(quán)利要求1.一種基于圖像信息損失量的BMP圖像壓縮歷史檢測方法,其特征在于僅獲得數(shù)字圖像的情況下,通過對待測BMP圖像剪切4行4列后估計原始圖像,并將待測圖像和估計原圖壓縮為質(zhì)量因數(shù)為100的JPEG圖像,比較這兩幅JPEG圖像的圖像信息損失量提取特征,然后可通過這2維特征之比利用閾值分割對單幅BMP圖像壓縮歷史進行判別或利用Fisher線性分類器對大量BMP圖像進行分類檢測。2.根據(jù)權(quán)利要求1所述的一種基于圖像信息損失量的BMP圖像壓縮歷史檢測方法,其特征在于計算待測圖像和估計的原圖經(jīng)過Q=100的JPEG壓縮后JPEG系數(shù)中64個位置上0的比重衡量圖像信息損失量,通過比較兩者圖像信息損失量大小得到2維特征;S2-1.2維特征=M/M(&(力>乃2(刀),Z2=M/M(;^(y)<幾2(刀)其中M/M(.)為求個數(shù)函數(shù),p力')和&(力,/=1,2,...,64,分別為待測圖像與估計原圖在64個DCT系數(shù)位置上的圖像信息損失量;S2-2.圖像信息損失量P(力J,風2,…,64附其中n(y')為所有DCT塊中第/個JPEG系數(shù)位置上0的個數(shù)和,m為圖像中8*80<^塊的個數(shù)。3.根據(jù)權(quán)利要求1所述的一種基于圖像信息損失量的BMP圖像壓縮歷史檢測方法,其特征在于將待測圖像剪切4行4列重新保存為BMP圖像用來消除原JPEG壓縮效應,得到近似于原BMP圖像統(tǒng)計特征的估計原圖。4.根據(jù)權(quán)利要求1所述的一種基于圖像信息損失量的BMP圖像壓縮歷史檢測方法,其特征在于通過計算2維特征之比進行閾值分割可對單幅BMP圖像進行壓縮歷史判別或使用Fisher線性分類器可對多幅BMP圖像進行分類檢測。全文摘要本發(fā)明涉及到一種基于圖像信息損失量的BMP圖像壓縮歷史檢測方法,屬于信號與信息處理
技術(shù)領域:
,其特征是在僅獲得數(shù)字圖像的情況下,通過對待測BMP圖像剪切4行4列后估計原始圖像,并將待測圖像和估計原圖壓縮為質(zhì)量因數(shù)為100的JPEG圖像,通過比較這兩幅JPEG圖像的圖像信息損失量提取特征,最后利用Fisher線性分類器對大批圖像進行分類檢測壓縮歷史,或利用閾值分割對原始壓縮質(zhì)量因數(shù)單幅BMP圖像進行壓縮歷史判別。本發(fā)明的效果益處是能夠在僅獲得數(shù)字圖像的情況下,對多幅或單幅BMP圖像的壓縮歷史進行準確的鑒別和取證。本發(fā)明適合于信息安全領域。文檔編號H04N1/41GK101674389SQ200910187789公開日2010年3月17日申請日期2009年9月30日優(yōu)先權(quán)日2009年9月30日發(fā)明者孔祥維,郭一平申請人:大連理工大學