檢測(cè)之前壓縮過(guò)的圖像中的合成的制作方法

文檔序號(hào)：6454276閱讀：165來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：檢測(cè)之前壓縮過(guò)的圖像中的合成的制作方法
技術(shù)領(lǐng)域：
本發(fā)明一般涉及數(shù)字圖像處理領(lǐng)域，更具體涉及檢測(cè)之前壓縮過(guò)的圖像中的合成的方法和系統(tǒng)。
背景技術(shù)：
在圖像處理領(lǐng)域，經(jīng)常發(fā)生必需為期望的應(yīng)用調(diào)整圖像大小的情
況。例如，特定的打印機(jī)可能具有250dpi (每英寸的點(diǎn)數(shù))的固定分辨率。為了在這種打印機(jī)上將由500x750像素構(gòu)成的圖像打印到4x6英寸的打印輸出，必須用因子2調(diào)整圖像的大小。類似地，很多顯示器裝置具有按每英寸像素?cái)?shù)量的固定分辨率。換言之，必須確定圖像在原始樣本點(diǎn)之間的位置的值。確定不與圖像的原始樣本符合的位置處的圖像信號(hào)的值的過(guò)程稱為插值或重新采樣。插值的因子N,指的是輸出圖像的采樣率與輸入圖像的采樣率的比值。在之前的示例中，插值因子N二2。
插值過(guò)程產(chǎn)生期望數(shù)量的行和列像素的圖像。然而，插值過(guò)程涉及在很多位置"猜測(cè)"信號(hào)值。結(jié)果，經(jīng)過(guò)插值的圖像通常質(zhì)量沒(méi)有以期望的分辨率原始地捕捉的圖像那么高。例如，以500x750像素捕捉并接著插值到1000x1500像素的圖像，通?？雌饋?lái)比從原始地以1000x1500 像素捕捉同一場(chǎng)景得到的圖像更柔和且質(zhì)量差。
由于插值的圖像通常較低的質(zhì)量，會(huì)期望知道圖像是已經(jīng)經(jīng)過(guò)插值以便在后續(xù)的數(shù)字處理和其它程序中更好地處理圖像。授予Gallagher 的美國(guó)專利No. 6904180，結(jié)合在這里作為參考，揭示了確定數(shù)字成像信道是否使用與圖像的相鄰像素的值相關(guān)的信號(hào)進(jìn)行了插值的方法。該方法查找從具有指示了插值的周期的提取信號(hào)計(jì)算的傅里葉變換信號(hào)中的峰值。該方法不處理過(guò)去的壓縮-解壓縮對(duì)圖像的影響。
隨著低成本和高分辨率數(shù)字相機(jī)和復(fù)雜的編輯軟件的出現(xiàn)，可以容易地處理和改變數(shù)字圖像。數(shù)字偽造品通常沒(méi)有篡改的視覺(jué)跡象，并且不能與真正的照片區(qū)分開(kāi)。結(jié)果，照片不再保持作為事件的確定記錄的獨(dú)特地位。例如，在2003年3月，Los Angeles Times在其首頁(yè)上發(fā)表了一張戲劇性的照片，一名士兵指揮一個(gè)伊拉克市民來(lái)接管(take cover)。然而，該照片是偽造的，它是通過(guò)將兩張照片拼接在一起而數(shù)字地創(chuàng)造的。這和類似的事件自然的使人想知道每天看到的圖像有多少經(jīng)過(guò)了數(shù)字修改。對(duì)于關(guān)于數(shù)字偽造品的更多。
盡管已經(jīng)提出了數(shù)字水印技術(shù)來(lái)驗(yàn)證圖像的真實(shí)性，這些技術(shù)產(chǎn)生的標(biāo)記必須被預(yù)先植入到原始圖像中。這些標(biāo)記也容易受到圖像處理的操作，這些操作可以將標(biāo)記著色成不可檢測(cè)。因此，需要這樣一種技術(shù)，用于在完全沒(méi)有任何形式的數(shù)字水印或簽名的情況下檢測(cè)數(shù)字篡改的痕跡。
盡管數(shù)字偽造品可能沒(méi)有留下已經(jīng)被篡改的視覺(jué)跡象，然而，它們可能改變圖像的基本統(tǒng)計(jì)。例如，考慮在同一圖像中顯示一對(duì)臉的數(shù)字偽造品的創(chuàng)建。這種圖像可能是通過(guò)合成制作的，例如，拼接來(lái)自一張原始照片的臉部，并對(duì)其重新采樣來(lái)匹配目標(biāo)圖像的構(gòu)成，并插入它。為了產(chǎn)生使人相信的匹配，通常需要對(duì)圖像的各部分進(jìn)行調(diào)整大小，旋轉(zhuǎn)或者拉伸。該過(guò)程需要將原始圖像重新采樣或者插值到新的采樣點(diǎn)陣上。盡管該重新采樣通常是覺(jué)察不到的，但它改動(dòng)了圖像像素值的統(tǒng)計(jì) 關(guān)系，這種改動(dòng)在祐j企測(cè)到時(shí)可以作為數(shù)字篡改的證據(jù)。"Exposing digital forgeries by detecting traces of resampling，， , A.C.Popescu andH. Farid， IEEE Transact ions on Signal Process ing, Vol. 53， No. 2 pages 758-767， 2005就是針對(duì)沖企測(cè)由于偽造產(chǎn)生的重新采樣。
大部分?jǐn)?shù)字圖像或者以壓縮形式存儲(chǔ)，或者在其存在期限中的某個(gè) 點(diǎn)處受過(guò)圖像壓縮。很多基于塊的圖像壓縮技術(shù)是已知的。最常見(jiàn)的圖像壓縮形式為JPEG壓縮。另一種基于塊的圖像壓縮為矢量量化(參見(jiàn) R.M.Gray, "Vector Quantization" , IEEE ASSP Magazine, pages 4 -29， (April 1984 ))。基于塊的圖像壓縮產(chǎn)生偽像，這對(duì)數(shù)字水印的檢測(cè)，以及具有被壓縮過(guò)的歷史的圖像中插值的檢測(cè)提出挑戰(zhàn)。
授予Yu等的美國(guó)專利No. 6643410，在這里引入作為參考，揭示了才企測(cè)數(shù)字圖像中方塊效應(yīng)(blocking artifact)程度的方法。
從而期望提供檢測(cè)合成的方法和系統(tǒng)，即使圖像之前經(jīng)過(guò)壓縮也能檢測(cè)到圖像插值。

發(fā)明內(nèi)容
本發(fā)明由權(quán)利要求定義。本發(fā)明在廣的方面提供了用于才企測(cè)數(shù)字圖像合成的方法和系統(tǒng)，其中在未經(jīng)壓縮的數(shù)字圖像中檢測(cè)第一偽像。第一偽像是之前用預(yù)定的壓縮算法對(duì)數(shù)字圖像壓縮的特征。評(píng)估圖像中的
插值標(biāo)記來(lái)提供插值結(jié)果。在該評(píng)估期間，4氐消(counteract )壓縮算法的第二偽像。根據(jù)插值結(jié)果對(duì)圖像分類。第一偽像可以是方塊效應(yīng)，而第二偽像和插值標(biāo)記可以是圖像中不同的周期性。
本發(fā)明針對(duì)于克服上面提出的一個(gè)或多個(gè)問(wèn)題。本發(fā)明的一個(gè)有益效果是提供了用于檢測(cè)合成的改進(jìn)的方法和系統(tǒng)，即使圖像之前經(jīng)過(guò)壓縮該方法和系統(tǒng)也能檢測(cè)到圖像插值。

通過(guò)參考結(jié)合附圖做出的本發(fā)明的實(shí)施例的下列描述，本發(fā)明的上迷和其它特征和目標(biāo)以及獲得它們的方式將變得明顯，并且本發(fā)明本身將更容易理解，附圖中
圖1是本方法的實(shí)施例的流程圖。
圖2是本系統(tǒng)的實(shí)施例的示意圖。僅示出了對(duì)應(yīng)于圖l的方法的特征邏輯組件。
圖3是圖2的插值檢測(cè)器用來(lái)檢測(cè)插值的信號(hào)的曲線圖。該信號(hào)是用于經(jīng)JPEG壓縮但是沒(méi)有插值的圖像。
圖4是圖2的插值檢測(cè)器用來(lái)檢測(cè)插值的信號(hào)的曲線圖。該信號(hào)是用于經(jīng)JPEG壓縮并且用因子2. 8插值的圖像。
圖5是圖2的壓縮檢測(cè)器使用的程序的流程圖。
圖6是包括兩張臉的圖像的示例數(shù)字圖像的部分圖解 (semi-diagrammat ical view)圖。
圖7是與圖6相同的圖示，但是感興趣的區(qū)域用方框示出。
圖8是示出現(xiàn)有技術(shù)插值檢測(cè)方法的概覽的框圖。
圖9和圖IO是示出圖8所示信號(hào)生成器的兩個(gè)替代的框圖。
圖11是圖8的插值確定器的框圖。
圖12是一圖像處理鏈的框圖，其具有幾個(gè)分支并且使用圖8的插值才企測(cè)方法的輸出。
圖13是另一圖像處理鏈的框圖，其包括從圖8所示的插值檢測(cè)方法的輸出中恢復(fù)原始的數(shù)字圖像信號(hào)。
圖14是示出圖1的系統(tǒng)的物理組件的部分圖解圖。
具體實(shí)施例方式
在本發(fā)明的方法和系統(tǒng)中，使用數(shù)字圖像合成來(lái)檢測(cè)數(shù)字圖像是否用插值重新采樣過(guò)，即使該重新采樣在圖像壓縮之前發(fā)生。(除非明顯與上下文內(nèi)容相反，可以假定這里討論的圖像壓縮是廣意的，其包括編碼和解碼數(shù)字圖像的步驟。)這使得在特定圖像用插值重新采樣過(guò)的情
況下將該特定的圖像分類為經(jīng)過(guò)插值的，或者在該特定圖像沒(méi)有被重新采樣過(guò)的情況下將其分類為沒(méi)有經(jīng)過(guò)插值的。在特定的使用中，在經(jīng)過(guò) 插值和沒(méi)有經(jīng)過(guò)插值之間分類等價(jià)于在"偽造品"和"非偽造品"之間分類。從而，除了用于識(shí)別由于之前的重新采樣而不適合特定的圖像處理技術(shù)的真實(shí)圖像之外，該方法和系統(tǒng)可以應(yīng)用于為了惡意的目的而準(zhǔn) 備的假冒品或者偽造圖像的檢測(cè)。
在下面的描述中，將本發(fā)明或者本發(fā)明的一部分描述為軟件程序。本領(lǐng)域技術(shù)人員將容易理解也可以以硬件構(gòu)造這種軟件的等價(jià)體。由于圖像處理算法和系統(tǒng)是熟知的，本描述將特別針對(duì)形成根據(jù)本發(fā)明的方法的一部分或者更直接與該方法協(xié)作的算法和系統(tǒng)。數(shù)字靜態(tài)和視頻攝像機(jī)以及數(shù)據(jù)庫(kù)硬件特征同樣也是熟知的，本說(shuō)明書(shū) 一般限于與本發(fā)明的方法直接相關(guān)的那些方面。這里沒(méi)有具體說(shuō)明或描述的這種算法和裝置的其它方面，以及用于產(chǎn)生或者處理其中涉及的圖像信號(hào)的硬件和/ 或軟件，可以從本領(lǐng)域已知的這種系統(tǒng)，算法，組件和元件中選擇。給出如在下面的說(shuō)明書(shū)中呈現(xiàn)的描述，其所有的軟件實(shí)施是傳統(tǒng)的并且在該領(lǐng)域的普通技術(shù)之內(nèi)。
本發(fā)明可以計(jì)算機(jī)硬件和計(jì)算機(jī)化的設(shè)備實(shí)施。例如，可以使用包括一個(gè)或多個(gè)掃描儀或者其它捕捉裝置以及一個(gè)或多個(gè)個(gè)人計(jì)算機(jī)的系統(tǒng)執(zhí)行該方法。參照?qǐng)D14,示出了用于實(shí)施本發(fā)明的計(jì)算機(jī)系統(tǒng)110。盡管為了示出優(yōu)選實(shí)施例的目的示出了計(jì)算機(jī)系統(tǒng)110,本發(fā)明不限于示出的計(jì)算機(jī)系統(tǒng)110,而是可以與任何電子處理系統(tǒng)一起使用，諸如建立在數(shù)碼相機(jī)，蜂窩攝像機(jī)電話以及其它移動(dòng)設(shè)備，家用計(jì)算機(jī)，售貨亭，零售或批發(fā)照片洗印服務(wù)中的電子處理系統(tǒng)，或者用于數(shù)字圖像的處理的任何其它系統(tǒng)。計(jì)算機(jī)系統(tǒng)110包括基于微處理器的單元112(這里也稱為數(shù)字圖像處理器)，用于接收和處理軟件程序并用于執(zhí)行
其它處理功能。顯示器114電連接到基于微處理器的單元112,用于顯示與軟件關(guān)聯(lián)的用戶相關(guān)信息，例如通過(guò)圖形用戶界面。鍵盤(pán)116也連接到基于微處理器的單元112,用于允許用戶輸入信息到軟件。作為使用鍵盤(pán)116來(lái)輸入的替代，可以使用鼠標(biāo)118在顯示器114上移動(dòng)選擇器120并選擇選擇器120位于其上的項(xiàng)目，如本領(lǐng)域所熟知的。
可以包括任何形式的移動(dòng)存儲(chǔ)器，示出為光盤(pán)只讀存儲(chǔ)器(CD-ROM) 124,其可以包括軟件程序，該移動(dòng)存儲(chǔ)器被插入基于微處理器的單元，以便提供輸入軟件程序和其它信息到基于微處理器的單元112的手段。可以提供多種類型的移動(dòng)存儲(chǔ)器(這里用軟盤(pán)126表示)，并且數(shù)據(jù)可以寫(xiě)到任何適合類型的移動(dòng)存儲(chǔ)器。存儲(chǔ)器可以是外部的并且可以使用有線或者無(wú)線連接，或者直接或者經(jīng)由局域網(wǎng)或者諸如因特網(wǎng)的廣域網(wǎng) 訪問(wèn)。更進(jìn)一步，可以編程基于孩i處理器的單元112,如本領(lǐng)域所熟知的，來(lái)內(nèi)部地存儲(chǔ)軟件程序。打印機(jī)128或者其它輸出裝置也可以連接到基于微處理器的單元112，用于打印從計(jì)算機(jī)系統(tǒng)110的輸出的硬拷貝?；谖⑻幚砥鞯膯卧?12可以具有網(wǎng)絡(luò)連接127,諸如電話線或者無(wú)線鏈接，到外部網(wǎng)絡(luò)，諸如局域網(wǎng)或者因特網(wǎng)。
圖像也可以經(jīng)由存儲(chǔ)器卡，諸如個(gè)人計(jì)算機(jī)卡(PC卡)130顯示在顯示器114上，PC卡130諸如以前所知的PCMCIA卡(基于個(gè)人計(jì)算機(jī) 存儲(chǔ)卡國(guó)際協(xié)會(huì)的規(guī)定)，其包含電子地內(nèi)含在卡130中的數(shù)字化的圖像。PC卡130最終被插入到基于微處理器的單元112,以便允許在顯示器ll4上可視地顯示圖像。替代的，可以將PC卡130插入連接到基于微處理器的單元112的位于外部的PC卡讀卡器132。也可以經(jīng)由光盤(pán) 124,軟盤(pán)126或者網(wǎng)絡(luò)連接127輸入圖像。PC卡130,軟盤(pán)126或者光盤(pán)124中存儲(chǔ)的，或者通過(guò)網(wǎng)絡(luò)連接127輸入的任何圖像，可以從各種源得到，諸如數(shù)碼相機(jī)(未示出)或者掃描儀(未示出)。也可以經(jīng) 由連接到基于微處理器的單元112的攝像機(jī)對(duì)接端口 136直接從數(shù)碼相機(jī)134,或者經(jīng)由到基于微處理器的單元112的電纜連接138或者經(jīng)由到基于微處理器的單元112的無(wú)線連接140直接從數(shù)字相機(jī)134,輸入圖像。本發(fā)明可以與多個(gè)產(chǎn)生數(shù)字圖像的捕捉裝置一起使用。例如，圖 14可以代表數(shù)字照片沖洗系統(tǒng)或者具有掃描儀的售貨亭。
輸出裝置提供最終的圖像或者輸出信號(hào)。輸出裝置可以是打印機(jī)或者是提供紙張或者其它硬拷貝最終圖像的其它輸出裝置。輸出裝置也可以是作為數(shù)字文件提供最終圖像的輸出裝置。輸出裝置也可以包括輸出
的組合，諸如打印的圖像和在存儲(chǔ)器單元，諸如CD或者DVD上的數(shù)字文件。
數(shù)字圖像包括一個(gè)或多個(gè)數(shù)字圖像通道或者色彩分量。每個(gè)數(shù)字圖像通道是像素的二維陣列。盡管數(shù)字圖像通道被描述為按照行和列布置的像素值的二維陣列，本領(lǐng)域技術(shù)人員將理解本發(fā)明可以應(yīng)用于非直線陣列而具有同等的效果，并且本發(fā)明可以應(yīng)用于但不限于這里提到的任
何應(yīng)用的數(shù)字圖像通道。
作為這里所使用的，術(shù)語(yǔ)"數(shù)字圖像"指的是所有通道的二維陣列，或者任何單獨(dú)的陣列，或者單獨(dú)地對(duì)待的陣列的任何部分。諸如視頻序列的圖像序列的每個(gè)幀也被認(rèn)為是"數(shù)字圖像"。
為了方便起見(jiàn)，這里一般或者關(guān)于紅，綠和藍(lán)像素值的二維陣列，或者對(duì)應(yīng)于光強(qiáng)的單色值的陣列討論數(shù)字圖像。為了討論方便的分辨率為1024行像素和1536線像素的圖像，盡管本領(lǐng)域技術(shù)人員將理解可以使用不同分辨率和尺寸的數(shù)字圖像而具有同等的或者至少可接受的成功。對(duì)于圖像通道的其他組合也是一樣。
關(guān)于命名法的問(wèn)題，數(shù)字圖像位于坐標(biāo)(x, y)處的像素值，這里應(yīng)當(dāng)分別包括值[r(x，y),g(x,y),b(x，y)]的三元組，坐標(biāo)(x, y)是指數(shù)字圖像的第x行和第y列,[r(x，y),g(x，y),b(x，y)]分別指在位置(x, y)處紅色，綠色和藍(lán)色數(shù)字圖像通道的值。在此方面，認(rèn)為數(shù)字圖像包括紅色，綠色和藍(lán)色二維陣列或者紅色，綠色和藍(lán)色通道?？梢詮纳?彩通道形成亮度通道p。數(shù)字圖像通道n位于坐標(biāo)(x, y)處的像素值這里應(yīng)當(dāng)是稱為p (x, y)的單個(gè)值，坐標(biāo)(x, y)指數(shù)字圖像通道的第x行和第y列。
圖14所示的通用控制計(jì)算機(jī)可以存儲(chǔ)具有存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ) 介質(zhì)中的程序的計(jì)算機(jī)程序產(chǎn)品，計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)例如可以包括諸如磁盤(pán)(諸如軟盤(pán))或磁帶的磁存儲(chǔ)介質(zhì)；諸如光盤(pán)，光帶或者機(jī)器可讀條形碼的光存儲(chǔ)介質(zhì)；諸如隨機(jī)訪問(wèn)存儲(chǔ)器(RAM),或者只讀存儲(chǔ)器(ROM)的固態(tài)電子存儲(chǔ)裝置。相關(guān)的計(jì)算機(jī)程序也可以存儲(chǔ)在由離線存儲(chǔ)器裝置表示的用來(lái)存儲(chǔ)計(jì)算機(jī)程序的任何其它物理裝置或介質(zhì)上。還應(yīng)當(dāng)注意，本發(fā)明可以軟件和/或硬件的組合來(lái)實(shí)施，并且不限
于物理地連接的和/或位于同一物理位置的裝置。圖3示出的一個(gè)或多個(gè)裝置可以位于遠(yuǎn)程的位置并可以經(jīng)由網(wǎng)絡(luò)連接。一個(gè)或多個(gè)裝置可以無(wú)線地連接，諸如或者直接地或者經(jīng)由網(wǎng)絡(luò)地通過(guò)射頻鏈接。
本發(fā)明可以用于各種用戶情境和環(huán)境。示例的情境和環(huán)境不限制地包括，批發(fā)數(shù)字照片沖洗(涉及諸如膠片進(jìn)入，數(shù)字處理，印出的示例處理步驟或階段)，零售數(shù)字照片沖洗(膠片進(jìn)入，數(shù)字處理，印出)，家庭打印(家庭掃描的膠片或者數(shù)字圖像，數(shù)字處理，打印出)，桌面軟件(對(duì)數(shù)字打印輸出應(yīng)用算法以使它們更好或者甚至就是改變它們的軟件)，數(shù)字實(shí)現(xiàn)(數(shù)字圖像輸入-從介質(zhì)或者甚至在web上，數(shù)字處理，圖像輸出-以介質(zhì)上的數(shù)字形式，web上的數(shù)字形式，或者打印在硬拷貝打印輸出上)，售貨亭(數(shù)字或掃描的輸入，數(shù)字處理，數(shù)字或硬拷貝輸出)，移動(dòng)裝置(例如可以用作處理單元，顯示器單元，或者給出處理指令的單元的攝像機(jī)，PDA,或者蜂窩電話)，以及經(jīng)由萬(wàn)維網(wǎng)提供的業(yè)務(wù)。
在每種情境中，本發(fā)明可以是獨(dú)立的或者可以是較大系統(tǒng)解決方案中的一個(gè)組件。此外，人界面，例如掃描或輸入、數(shù)字處理、顯示給用戶(如果需要)、用戶請(qǐng)求或者處理指令的輸入(如果需要)、輸出，每個(gè)可以在相同或者不同的裝置和物理位置上，這些裝置和位置之間的通信可以是經(jīng)由公用或者私人的網(wǎng)絡(luò)連接，或者基于介質(zhì)的通信。在符合本發(fā)明的前述揭示的情況下，本發(fā)明的方法可以是完全自動(dòng)的，可以具有用戶輸入(完全或者部分手動(dòng))，可以讓用戶或操作員查看以便接受/拒絕結(jié)果，或者可以由元數(shù)據(jù)(可以是用戶提供的，測(cè)量裝置(例如在攝像機(jī)內(nèi))提供的，或者由算法確定的元數(shù)據(jù))協(xié)助。此外，(多個(gè))算法可以與各種工作流程用戶界面方案相接口。
現(xiàn)在參考圖1-2，在一特定實(shí)施例中，提供(10)數(shù)字圖像給系統(tǒng) 存儲(chǔ)器的單元12,并做出確定(14)該數(shù)字圖像當(dāng)前是否被壓縮。如果發(fā)現(xiàn)該數(shù)字圖像是被壓縮的，解壓縮(16)該數(shù)字圖像。用于確定圖像當(dāng)前是否^L壓縮的協(xié)議對(duì)于本領(lǐng)域技術(shù)人員是熟知的。例如，數(shù)字圖像可以作為包括圖像信息以及指示最終的狀態(tài)是壓縮的還是未壓縮的元數(shù)據(jù)，以及解壓縮該圖像所需要的信息和與圖像相關(guān)的其它元數(shù)據(jù)的數(shù) 字文件被提供?，F(xiàn)在參考圖2，可以將數(shù)字圖像接著發(fā)送到興趣區(qū)域選擇器18,如下文將會(huì)詳細(xì)討論，興趣區(qū)域選擇器18確定感興趣的區(qū)域?？梢栽谟?戶的選擇下繞開(kāi)興趣區(qū)域選擇器，在此情況下使用整個(gè)圖像。替代的，興趣區(qū)域選擇器可以從系統(tǒng)中省略，如圖1的實(shí)施例所示的。
再次參考圖1和2,接著將不知道之前被壓縮過(guò)的數(shù)字圖像發(fā)送到壓縮檢測(cè)器20,并確定(22)該圖像是否在其歷史上的某個(gè)點(diǎn)受過(guò)壓縮。這通過(guò)確定是否存在第一壓縮偽像而完成。該第一壓縮偽像是由基于塊的壓縮技術(shù)造成的方塊效應(yīng)。已知很多基于塊的圖像壓縮技術(shù)。最常見(jiàn) 的圖像壓縮格式為JPEG標(biāo)準(zhǔn)下的JPEG壓縮。另一種基于塊的圖像壓縮為矢量量化，諸如R.M. Gray, "Vector Quantization" ， IEEE ASSP Magazine,4-29頁(yè)，(1984年4月)中揭示的方法。
將數(shù)字圖像直接發(fā)送到壓縮檢測(cè)(22)的替代路徑(24)由圖1中的虛線箭頭指示。該替代路徑(24)如果在提供的圖像已知是未經(jīng)壓縮的情況下是有用的。例如，如果在解壓縮圖像或者排除壓縮過(guò)的圖像的的較早圖像處理之后接收?qǐng)D像的情況下，替代路徑可以是有用的。該替代路徑可以作為選擇提供，或者是自動(dòng)的，基于較早的圖像處理等，或者作為用戶選項(xiàng)，例如當(dāng)用戶知道大的批次中的所有圖像都是未經(jīng)壓縮的時(shí)。如果知道在接收的時(shí)候?qū)⒁邮盏乃袌D像都將是未經(jīng)壓縮的，那么可以省略確定圖像是否被壓縮以及解壓縮該圖像的步驟。
如果沒(méi)有檢測(cè)到壓縮，數(shù)字圖像被發(fā)送到第一插值檢測(cè)器26。如果檢測(cè)到壓縮，數(shù)字圖像被發(fā)送到第二專用插值檢測(cè)器28。在兩個(gè)插值檢測(cè)器中都評(píng)估(30)數(shù)字圖像中插值標(biāo)記的存在。只有在第二插值檢測(cè) 器中，抵消(32)第二壓縮偽像。插值評(píng)估的結(jié)果被發(fā)送到結(jié)果分析器 -分類器34,其分析(36)該結(jié)果并接著分類該數(shù)字圖像。
數(shù)字圖像中方塊效應(yīng)的存在可以用各種技術(shù)確定，諸如美國(guó)專利 No. 6427031和No. 6643410中所揭示的(美國(guó)專利No. 6427031結(jié)合在這里作為參考)。
授予Yu等的美國(guó)專利No. 6643410中揭示了一種當(dāng)前優(yōu)選的方法，其聯(lián)系具有亮度分量的灰階圖像或者具有RGB分量的彩色圖像進(jìn)行描述。對(duì)于彩色圖像，可以在圖像壓縮之前進(jìn)行色彩轉(zhuǎn)換以利用人類視覺(jué) 系統(tǒng)(HVS)在色彩感知上的冗余度。例如，在JPEG壓縮中，首先用以下方程將彩色圖像從RGB轉(zhuǎn)換到Y(jié)CbCr色空間Y=16+65. 481*R+128. 553*G+24. 966*B; Cb=128-37. 797*R-74. 203*G+112*B; Cr=128+112*R-93. 786*G-18. 214*B; 其中
Y為亮度分量，
Cb和Cr為兩個(gè)色度分量，并且 R， G和B都?xì)w一化到1。
圖5示出使用美國(guó)專利No. 664341 0的程序來(lái);f企測(cè)JPEG壓縮方塊效應(yīng)。該程序也可以用于檢測(cè)其它基于塊的圖像壓縮，諸如矢量量化。對(duì) 于每個(gè)圖像分量，首先在步驟1110通過(guò)計(jì)算兩個(gè)相鄰列之間的絕對(duì)差生成列差(column difference)圖像。例如通過(guò)從圖像的第一列的像素值減去圖像的笫二列的像素值以生成一差值列，并接著將列差圖像的第一列的像素值設(shè)定為該差值列的絕對(duì)值，生成列差圖像。重復(fù)同一程序來(lái)設(shè)定列差圖像除了最后一列之外的其他列，最后一列的所有值被設(shè) 為零。
進(jìn)一步在步驟1112中在垂直方向平均該列差圖像以生成一維列差陣歹']VA。假定原始圖像具有M行和N列圖像數(shù)據(jù)，列差陣列VA應(yīng)當(dāng)具有N個(gè)條目。為了防止圖像邊緣貢獻(xiàn)于檢測(cè)，在原始圖像分量中的對(duì)應(yīng) 像素的亮度梯度的幅度大于閾值T的情況下放棄列差圖像中的像素的貢獻(xiàn)。使用Sobel算子作為亮度梯度算子來(lái)生成亮度梯度圖像，其中亮度梯度等于來(lái)自水平和垂直Sobel算子的絕對(duì)值的和。在本發(fā)明的當(dāng)前實(shí) 施例中，計(jì)算亮度梯度圖像的標(biāo)準(zhǔn)偏差(SD),并且閾值T設(shè)定為標(biāo)準(zhǔn) 偏差SD的兩倍。
進(jìn)一步在步驟III4中使用JPEG塊寬度的周期性平均該列差陣列 VA,以生成塊平均列差陣列VAA,其具有8個(gè)條目。換言之，每八個(gè)列差陣列VA的條目將被平均，結(jié)果將被用于設(shè)定塊平均列差陣列VAA的八個(gè)條目。根據(jù)JPEG圖像壓縮通常使用的，塊尺寸為8x8個(gè)像素。替代的，可以使用16x16的塊。類似地，在其它基于塊的壓縮方案中也可以使用其它塊尺度。
首先在步驟1116中從塊平均列差陣列VAA定位最大值，并將其定義為列峰值，接著在步驟1118計(jì)算塊平均列差陣列VAA排除峰值的均值。該均值被定義為列基值。最后，在步驟1120計(jì)算列峰值和列基值之間的比率，以生成列比率。
類似地在步驟1110， - 1120，的系列中計(jì)算行峰值，行基值和行比率，
其中共用的附圖標(biāo)記表示對(duì)行進(jìn)行的對(duì)應(yīng)的操作類似于對(duì)列進(jìn)行的那些操作。更具體地，分別在塊1112，和1114，生成行差陣列HA和塊平均行差陣列HAA,并且在塊1116， - 1120，中展開(kāi)類似的基于這些陣列的度量。
列和行比率分別是列和行方向上存在方塊效應(yīng)的良好指示器。因此，方塊效應(yīng)的程度的優(yōu)選度量(在步驟1122中計(jì)算的)為，具有統(tǒng) 計(jì)上平均分布的水平和垂直結(jié)構(gòu)的圖像的列和行比率的平均值。更積極的度量為列和行比率的最小值。
方塊效應(yīng)的可見(jiàn)性會(huì)依賴于圖像中的實(shí)際結(jié)構(gòu)。例如，帶有紋理的區(qū)域趨向于比平坦區(qū)域更好地隱藏方塊效應(yīng)。列和行基值是紋理量的良好指示器。為了實(shí)現(xiàn)較高程度的穩(wěn)健性，方塊效應(yīng)程度的度量可以被定義為行/列比率和行/列基值兩者的函數(shù)。一般，基值越高，表示越高程度的紋理活動(dòng)(能夠隱藏較大程度的方塊效應(yīng))，對(duì)于偽像度量應(yīng)當(dāng)使用較高的閾值。實(shí)際上，可以建立查找表以便量化地表征基值和閾值之間的關(guān)系。
如果方塊效應(yīng)的程度的度量超過(guò)了預(yù)定閾值，則檢測(cè)到JPEG壓縮。此外，塊平均列差陣列VAA和塊平均行差陣列HAA中的峰值的索引，為圖像分量的水平和垂直方向上JPEG塊邊界位置。例如，如果塊平均列差陣列VAA的峰值的索引為4,那么假定JPEG塊邊界將在該圖像分量中的第4, 12，...列出現(xiàn)。(注意，在該實(shí)施例中，對(duì)于圖像分量的列，以及對(duì)于塊平均列差陣列VAA和塊平均行差陣列HAA的索引從零開(kāi)始)。
在數(shù)字圖像在原始數(shù)據(jù)壓縮操作之后不僅經(jīng)過(guò)裁剪還經(jīng)過(guò)縮放(收縮或放大)的情況下，塊尺寸不再是原始的JPEG塊尺寸8。對(duì)于可能經(jīng) 過(guò)放大的數(shù)字圖像，上面的確定JPEG方塊效應(yīng)的程度的過(guò)程可以被重復(fù)假定塊寬度值的預(yù)定系列，以便產(chǎn)生一系列峰值和基值之間的比率。產(chǎn)生最大偽像度量的假定塊寬度被選擇為縮放之后的有效塊尺寸。接著縮放因子被確定為有效塊尺寸和原始?jí)K尺寸(即8)之間的比率。
具有壓縮引起的方塊效應(yīng)的數(shù)字圖像還遭受到作為圖像數(shù)據(jù)中的特定周期所呈現(xiàn)的第二偽像。兩種偽像都是之前用在該數(shù)字圖像上的特定壓縮方案的特征。從而，檢測(cè)到第一偽像證明圖像中存在第二偽像。在本發(fā)明的方法和系統(tǒng)中，對(duì)特定壓縮方案的第一偽像的存在的檢測(cè)被假定為確定該數(shù)字圖像中該壓縮方案的使用以及相關(guān)的第二偽像的存
在。認(rèn)識(shí)到方塊效應(yīng)可能潛在地由與壓縮無(wú)關(guān)的其它程序產(chǎn)生；然而，已經(jīng)確定作為大部分使用的事實(shí)，可以認(rèn)為特定的壓縮方案的方塊效應(yīng) 特征的存在是過(guò)去使用該壓縮方案或者等同的壓縮方案而不是與壓縮無(wú)關(guān)的技術(shù)的決定性的證據(jù)。
插值檢測(cè)器評(píng)估插值標(biāo)記來(lái)提供插值結(jié)果。插值結(jié)果可以是二元的或者可以提供插值因子。特定數(shù)字圖像的后續(xù)分類可以類似地為檢測(cè)到或者未檢測(cè)到的二元分類，或者可以提供多點(diǎn)尺度上的值，諸如該數(shù)字圖像經(jīng)過(guò)或沒(méi)有經(jīng)過(guò)插值的概率。JPEG壓縮通常具有類似于在每個(gè)維度上以因子8插值圖像的效果。當(dāng)JPEG編碼實(shí)施中等或者大的量化時(shí)，本發(fā)明常常會(huì)將該圖像分類為用因子8插值過(guò)。
兩個(gè)插值檢測(cè)器都評(píng)估特定數(shù)字圖像中的周期性。第二檢測(cè)器還消除作為圖像之前的壓縮結(jié)果在數(shù)字圖像中存在的周期性，即第二偽像的影響。該消除通過(guò)將由于第二偽像的周期性從插值的考慮中排除而執(zhí) 行。相對(duì)于第一檢測(cè)器，這稍微損害(compromise) 了第二檢測(cè)器，但是消除了圖像壓縮而不是插值導(dǎo)致的偽信號(hào)。由于第二檢測(cè)器的操作相對(duì) 于第一檢測(cè)器稍微受到了損害，不期望也不需要對(duì)從來(lái)沒(méi)有被壓縮過(guò)的圖像使用笫二插值檢測(cè)器。
第一插值檢測(cè)器可以美國(guó)專利6904180中揭示的方式工作，如圖8 -ll所示。參照?qǐng)D8所示的插值檢測(cè)器的概覽，數(shù)字圖像通道p(x, y) 輸入到信號(hào)生成器210。數(shù)字圖像通道p (x， y)或者落在沒(méi)有經(jīng)過(guò)插值的圖像范疇或者落在經(jīng)過(guò)插值的圖像的范疇。如果已經(jīng)從一些其它的源數(shù)字圖像通道m(xù)(x， y)得出(derive from),并且如果p(x, y)的采樣率高于m (x, y)的采樣率，那么數(shù)字圖像通道p (x, y)是經(jīng)過(guò) 插值的圖像。此外，除非涉及裁剪步驟，一般地，數(shù)字圖像通道p(x, y)的尺寸(在數(shù)字圖像通道中的像素?cái)?shù)量方面)將大于源數(shù)字圖像通道m(xù)(x, y)。輸入圖像通道信號(hào)生成器210從輸入的數(shù)字圖像通道p (x, y)創(chuàng)建并輸出一維信號(hào)mddp (k)。如果數(shù)字圖像通道p(x， y) 是在被輸入到信號(hào)生成器210之前的插值操作的結(jié)果，那么信號(hào)mddp (k)包含對(duì)應(yīng)于插值因子N和方法的周期性，如下文將進(jìn)一步詳細(xì)討論的。然而，如果數(shù)字圖像通道m(xù)(x， y)是沒(méi)有經(jīng)過(guò)插值的數(shù)字圖像通道，那么信號(hào)mddp(k)將不包含任何特定的周期性。信號(hào)生成器210 的用途是僅在輸入的數(shù)字圖像通道p (x, y)已被插值的情況下，產(chǎn)生包含對(duì)應(yīng)于插值因子N的周期分量的信號(hào)。信號(hào)生成器210在下文將更詳細(xì)地描述。注意輸入的數(shù)字圖像通道p ( x, y )由R行像素和C列像素構(gòu)成。
從信號(hào)生成器210輸出的數(shù)字信號(hào)mddp (k)被輸入到DFT計(jì)算機(jī) 216來(lái)計(jì)算離散傅里葉變換。時(shí)間或空間信號(hào)的離散傅里葉變換是信號(hào) 的頻域表示。mddp (k)信號(hào)中的周期性可以通過(guò)查找DFT計(jì)算才幾216 輸出的DFT[mddp (k)]信號(hào)中的峰值而確定。mddp (k)信號(hào)的離散傅里葉變換DFT[mddp (k)],被輸入到插值確定器222來(lái)進(jìn)行分析。離散傅里葉變換的計(jì)算是信號(hào)處理領(lǐng)域熟知的，從而不再進(jìn)一步討論。在該優(yōu)選實(shí)施例中，用零填充mddp (k)信號(hào)直到其長(zhǎng)度是2的冪。DFT的樣本的數(shù)量這里將稱為M,其中M是等于或大于C-2的最小的2的冪。
分析輸入到插值確定器222的DFT[mddp(k)]信號(hào)來(lái)確定是否存在顯著的峰。DFT[mddp (k)]信號(hào)中存在峰指示了數(shù)字圖像通道p (x, y) 是經(jīng)過(guò)插值的數(shù)字圖像通道。插值確定器的輸出是圖像p (x, y)是否是經(jīng)過(guò)插值的數(shù)字圖像通道的指示，并且是在p(x， y)是經(jīng)過(guò)插值的數(shù)字圖像通道的情況下的插值因子N的指示。下面描述插值確定器222 的操作。
插值確定器222接受信號(hào)DFT[mddp (k)]作為輸入。插值確定器 222檢查輸入信號(hào)的幅度來(lái)確定是否存在任何峰。圖11示出了插值確定器的詳細(xì)視圖，其中示出峰值檢測(cè)器246,其定位輸入的信號(hào)DFT[mddp
(k)]的各峰，以及閾值檢測(cè)器252，其將峰值檢測(cè)器輸出信號(hào)的幅度與特定的閾值比較。存在很多峰值檢測(cè)方法。本領(lǐng)域技術(shù)人員將理解峰值檢測(cè)器2"可以使用任意數(shù)量的峰值檢測(cè)算法來(lái)確定信號(hào)DFT[mddp
(k)]的最大峰的位置k。。在該優(yōu)選實(shí)施例中，對(duì)于要分類為峰的位置 k。， k。必須在M/x-l和M/2+l之間，其中在該優(yōu)選實(shí)施例中x = 12。此外，信號(hào)DFT[mddp (k)]的幅度必須大于在k。的(M) /12個(gè)樣本中所有位置處的幅度。此外，閾值應(yīng)用器252要求信號(hào)DFT[mddp (k)]的幅度必須大于Tcj ,其中cj為DFT[mddp ( k)]信號(hào)的幅度在(M) /12 - 1到(M) /2 + 1之間估值的標(biāo)準(zhǔn)偏差。C7的值由統(tǒng)計(jì)計(jì)算器258確定。本領(lǐng)域才支術(shù)人員將理解統(tǒng)計(jì)計(jì)算器258的4艮多變化，例如平均絕對(duì)偏差而不是標(biāo)準(zhǔn)偏差，將得到可接受的結(jié)果。T為任意的常數(shù)。在一特定實(shí)施例中，T =4。插值因子N的估計(jì)N。st的值，用對(duì)應(yīng)于最大幅度的峰值k。的位置確定。如果插值確定器222沒(méi)有找到與信號(hào)DFT[mddp (k)]關(guān)聯(lián)的峰，那么插值確定器輸出指示相信數(shù)字圖像通道p (x， y)沒(méi)有經(jīng)過(guò)插值的信息?；蛘撸绻逯荡_定器222找到一個(gè)或多個(gè)峰，那么插值確定器222 輸出指示相信數(shù)字圖像通道p (x, y)經(jīng)過(guò)了插值的信息。此外，插值確定器222輸出N。st。用下面的公式找到Nwt的值，其中k。是峰值的索引而M是DFT[mddp (k)]信號(hào)中樣本的數(shù)量
<formula>formula see original document page 17</formula>
注意關(guān)于DFT的索引，索引O指的是DFT的第一樣本，從而是DC項(xiàng)。
圖9示出信號(hào)生成器210的詳細(xì)框圖。如之前所說(shuō)明的，信號(hào)生成器210的目的是，從僅在數(shù)字圖像通道被插值的情況下會(huì)表現(xiàn)出周期屬性的數(shù)字圖像通道提取信號(hào)。數(shù)字圖像通道p(x, y)被輸入到lD差分器228i。 1D差分器228,的用途是計(jì)算圖像中局部的像素到像素變化。在一特定實(shí)施例中，這些像素到像素差異通過(guò)沿?cái)?shù)字圖像通道的每一行計(jì) 算兩個(gè)相繼的導(dǎo)數(shù)來(lái)確定。注意處理可以沿圖^f象列扭J亍而獲得同樣的成功。1D差分器228,計(jì)算數(shù)字圖像通道每行的導(dǎo)數(shù)來(lái)建立導(dǎo)數(shù)數(shù)字圖像通道dp(x, y) 。 1D差分器228d吏用下面的公式建立導(dǎo)數(shù)數(shù)字圖像通道 dp ( x， y)。
dp(x, y) =p(x + l, y) -p(x, y)
接著，將導(dǎo)數(shù)數(shù)字圖像通道dp (x, y)輸入到第二 1D差分器2282來(lái)第二次計(jì)算每行的導(dǎo)數(shù)。該第二 1D差分器2282的輸出為代表數(shù)字圖像通道p(x, y)的每一行的二階導(dǎo)數(shù)的數(shù)字圖像通道。1D差分器2282使用下面的公式建立二階導(dǎo)數(shù)數(shù)字圖像通道ddp (x, y):
ddp (x, y) =dp(x + l, y) -dp(x, y) =p(x + 2, y) -2p(x+l， y ) +p (x， y )
注意到可以組合1D差分器的兩級(jí)來(lái)直接從p ( x, y )計(jì)算ddp ( x， y),如之前的等式所示。
1D差分器228的兩級(jí)的用途是在平均起來(lái)的信號(hào)值在對(duì)應(yīng)于原始數(shù)字圖像通道m(xù) (x, y) (p (x, y)是從m (x, y)插值的)的樣本的像素位置具有不同屬性的情況下生成二維信號(hào)。該信號(hào)ddp (x, y) — 般在對(duì)應(yīng)于原始數(shù)字圖像通道m(xù) (x, y)的樣本的位置具有大的平均值，而在原始數(shù)字圖像通道的樣本之間的位置具有小的平均值。
ddp(x, y )信號(hào)接著被輸入到1D痕跡提取器240。 1D痕跡提取器的用途是從ddp (x, y)信號(hào)產(chǎn)生高信噪比一維痕跡，其表現(xiàn)出與插值因子N直接相關(guān)的周期性。在該優(yōu)選實(shí)施例中，1D痕跡提取器240通過(guò) 跨列對(duì)各值的大小進(jìn)行平均來(lái)產(chǎn)生一維痕跡mddp (k),如下面的公式所示
<formula>formula see original document page 18</formula>
本領(lǐng)域技術(shù)人員將理解信號(hào)生成器21G的用途可以通過(guò)很多方法實(shí) 現(xiàn)。本領(lǐng)域技術(shù)人員還將理解目的是從數(shù)字圖像通道p (x, y)產(chǎn)生表現(xiàn)出與插值因子N相關(guān)的周期性的信號(hào)的方法，不偏離本發(fā)明的范圍。
圖10示出信號(hào)生成器210的替代實(shí)施例，其中僅使用單個(gè)ID差分器228。該實(shí)施例產(chǎn)生精確的結(jié)果，盡管不像優(yōu)選實(shí)施例那么相當(dāng)可靠。
對(duì)于1D痕跡提取器240同樣存在;f艮多替代實(shí)施例。例如，信號(hào)mddp (k)可以通過(guò)找到輸入ID痕跡提取器240的信號(hào)的每行或每列的標(biāo)準(zhǔn) 偏差(或方差)來(lái)計(jì)算。一般，輸入ID痕跡提取器240的數(shù)字圖像通道的列或行的方差，在該行或該列與從其插值p (x， y)的原始數(shù)字圖像通道m(xù)(x, y)的樣本一致時(shí)最高。從而ID痕跡提取器240可以用以下基于方差的公式計(jì)算mddp (k)信號(hào)
<formula>formula see original document page 18</formula>
通過(guò)重新排列已經(jīng)示出的框圖還有其它替代實(shí)施例。例如，可以計(jì)
算ddp (x, y)信號(hào)每行的DFT,并接著將這些DFT —起平均，以產(chǎn)生一維信號(hào)輸入到插值確定器222。類似地，也可以計(jì)算ddp (x, y)信號(hào)每行的DFT，并接著輸入每個(gè)DFT到插值確定器222進(jìn)行峰值檢測(cè)。從而數(shù)字圖像通道p(x， y )的每行將具有N。st。接著可以用圖案識(shí)別領(lǐng)域的技術(shù)人員熟悉的方法組合這些多個(gè)N^的值，來(lái)獲得整個(gè)圖像的單
個(gè)N。st值。
第一插值檢測(cè)器即使在插值因子N不是整數(shù)值的情況下也能成功地檢測(cè)N。插值檢測(cè)的一種替代方法包括步驟基本地選擇數(shù)字圖像通道 p (x, y)的樣本(以規(guī)則的間隔)，以及建議這些采樣點(diǎn)構(gòu)成原始圖像通道。接著可以利用各種插值方法來(lái)從這些樣本重構(gòu)"高分辨率，，圖像。接著可以將該插值的版本與數(shù)字圖像通道比較來(lái)進(jìn)行相關(guān)。高的相關(guān)性將指示正確地確定了插值方法和因子。盡管該替代方法將直觀地提供期望的結(jié)果，檢測(cè)隨機(jī)的非整數(shù)插值因子將是困難的。
第二插值檢測(cè)器可以與第一插值檢測(cè)器相同的方式操作，除了第二插值檢測(cè)器包括抵消第二偽像第二壓縮偽像的影響的特征。目前優(yōu)選的是需要第二插值檢測(cè)器一般以圖8 - 11上描述的方式操作。在該情況下，抵消第二偽像可以通過(guò)修改從圖像中提取的信號(hào)來(lái)去除與圖像之前的壓縮相關(guān)的周期性而執(zhí)行。接著檢查該修改過(guò)的信號(hào)查找插值的證據(jù)。在一特定實(shí)施例中，第二插值檢測(cè)器中插值的估計(jì)包括步驟從圖像生成一維周期性信號(hào)；計(jì)算該周期性信號(hào)的離散傅里葉變換(DFT信號(hào))；從DFT信號(hào)排除對(duì)應(yīng)于第二偽像的峰來(lái)產(chǎn)生經(jīng)過(guò)修改的DFT信號(hào)；以及評(píng)估該經(jīng)過(guò)修改的DFT信號(hào)來(lái)查看與壓縮的類型關(guān)聯(lián)的第一組峰的存在，該壓縮是由之前4企測(cè)到的方塊效應(yīng)證實(shí)的。
例如，當(dāng)將利用8x8編碼塊的JPEG壓縮應(yīng)用到圖像時(shí)，即使沒(méi)有插值已被應(yīng)用到該圖像，得到的DFT[ mddp (k)]信號(hào)(圖3中所示) 也具有位于頻i普的1/8, 1/4, 3/8, 5/8， 3/4，和7/8處的峰。因此，為了避免可能通過(guò)檢測(cè)這些偽峰而發(fā)生錯(cuò)誤檢測(cè)的問(wèn)題，專門的插值檢測(cè)器124首先確保信號(hào)mddp ( k)的長(zhǎng)度是2的冪，并且可以由8整除，
從而這些峰的能量集中在DFT[]信號(hào)中的單個(gè)點(diǎn)上。接著，在頻譜的位置1/8, 1/4, 3/8， 5/8， 3/4,和7/8處將DFT [ mddp ( k )]的值設(shè)定為0。這允許檢測(cè)到與實(shí)際的插值關(guān)聯(lián)的峰，而同時(shí)忽略與圖像壓縮關(guān) 聯(lián)的峰值。然而，這使得更難才企測(cè)8， 4, 8/3, 8/5， 4/3和8/7的插值率。圖4示出與用因子2. 8插值，接著經(jīng)過(guò)JPEG壓縮的圖像關(guān)聯(lián)的示例DFT[mddp (k)]信號(hào)。通過(guò)忽略與JPEG壓縮關(guān)聯(lián)的峰，正確地識(shí)別了與插值關(guān)聯(lián)的峰值(用箭頭指示)。
在較少可能發(fā)生的其中JPEG編碼塊不是8x8,例如是16x16的情況中，這種信息可以通過(guò)壓縮檢測(cè)器IIO獲得，并傳送到專門的插值檢測(cè)
器124。在該示例中，得到的DFT[ mddp (k)]信號(hào)將具有位于頻譜的 1/16, 1/8, 3/16, 1/4, 5/16， 3/8, 7/16, 9/16, 5/8, 11/16， 3/4， 13/16, 7/18和15/16處的峰。
如之前所討論的，該方法中提供的分類可以是在真實(shí)的或者非偽造的圖像和偽造圖像之間進(jìn)行。也可以提供其它分類。可以使用該分類以便在不同的參數(shù)組之間選擇。例如，銳化算法會(huì)在輸入圖像是沒(méi)有插值過(guò)的情況下要求一組參數(shù)，而在輸入圖像已插值過(guò)的情況下要求第二組參數(shù)。該分類可以確定將與圖像關(guān)聯(lián)的元數(shù)據(jù)。例如，如果數(shù)字圖像通道p(x, y)用因子4插值過(guò)，那么該歷史信息可以附加到與該數(shù)字圖像通道關(guān)聯(lián)的元數(shù)據(jù)上。元數(shù)據(jù)可以但不一定存儲(chǔ)在與數(shù)字圖像通道數(shù) 據(jù)相同的文件中。
圖12示出具有分支步驟的圖像處理鏈，其中從兩個(gè)分支中的一個(gè) 選擇(40)到圖像轉(zhuǎn)換程序42或44的圖像處理路徑，是基于相應(yīng)的插值檢測(cè)器的輸出的。例如，很多web照片沖洗站點(diǎn)包含在顧客請(qǐng)求低于 150dpi的分辨率的照片打印時(shí)的分辨率警告。不了解情況的顧客可能試圖通過(guò)使用圖像處理軟件來(lái)插值圖像并增加圖像分辨率而避免該警告，相信引起"分辨率警告"的問(wèn)題已經(jīng)被解決了。本發(fā)明的方法將識(shí)別出圖像經(jīng)過(guò)了插值并允許系統(tǒng)發(fā)出分辨率警告給顧客。此外，本發(fā)明的方法允許系統(tǒng)教育顧客，以便解釋盡管插值增加了數(shù)字圖像通道中的像素數(shù)量，但一般并不引入新的信息。
檢測(cè)插值圖像的本方法的另一個(gè)應(yīng)用示于圖13中。如之前提到的，圖像插值通常通過(guò)雙三次和雙線性插值來(lái)進(jìn)行。然而，存在過(guò)多的聲稱提供改進(jìn)的圖像插值的算法。例如，很多時(shí)候，當(dāng)或者使用雙三次或者使用雙線性插值時(shí)以整數(shù)因子N的插值在圖像p (x, y)中保留數(shù)字圖像通道m(xù)(x, y)的每個(gè)采樣點(diǎn)的值。接著可以用本方法指示圖像p (x, y)是插值過(guò)的圖像的情況。在它是插值過(guò)的圖像的情況下，那么當(dāng)N 是整數(shù)的時(shí)候通常可以確切地恢復(fù)原始數(shù)字圖像通道m(xù) (x， y)。這通過(guò)用圖像采樣器46以Ne"指示的比率采樣圖像p (x， y)來(lái)實(shí)現(xiàn)。接著可以用圖像插值器48使用比之前用過(guò)的更先進(jìn)的圖像插值算法，將該低分辨率版本p (x, y)插值到p (x， y)的圖像尺寸。
如之前提到過(guò)的，數(shù)字圖像可以是較大的圖像中感興趣的區(qū)域。感興趣的區(qū)域可以使用興趣區(qū)域選擇器自動(dòng)確定或者由操作員手動(dòng)確定。興趣區(qū)域選擇器可以替代地或者附加地選擇并在圖形用戶界面上呈現(xiàn) 一個(gè)或多個(gè)感興趣的區(qū)域給用戶，用戶可以在呈現(xiàn)的區(qū)域中進(jìn)行選擇，手動(dòng)地選擇區(qū)域，或者選擇整個(gè)圖像。將區(qū)域呈現(xiàn)給用戶的方式不重要。例如，可以可3見(jiàn)i也列出區(qū);或。
興趣區(qū)域選擇器可以對(duì)整個(gè)圖像操作，或者各種尺寸的掃描窗口可以滑過(guò)數(shù)字圖像以自動(dòng)找到感興趣的區(qū)域。可以使用各種興趣區(qū)域選擇
器，諸如臉部檢測(cè)器，主題(main subject)檢測(cè)器，皮膚區(qū)域檢測(cè)器，天空檢測(cè)器，其它目標(biāo)(汽車，道路，草地，建筑等)檢測(cè)器，或者這些檢測(cè)器的組合。
興趣區(qū)域選擇器選擇一個(gè)或多個(gè)感興趣的區(qū)域，和，可選地，比4交區(qū)域或多個(gè)比較區(qū)域。該比較區(qū)域或多個(gè)比較區(qū)域可以是或者可以不是較不感興趣的或者在圖像的背景中。在檢測(cè)偽造品的使用中，有時(shí)候優(yōu) 選比較區(qū)域是背景，或者手動(dòng)選擇的、相比感興趣的區(qū)域不太可能是插值過(guò)的區(qū)域。這一般是圖像的背景的一部分。在一些使用中，將來(lái)自兩個(gè)或多個(gè)選定的感興趣的區(qū)域的插值進(jìn)行比較是方便的。在對(duì)所有圖像插值評(píng)估之后，單獨(dú)地或者一起分析插值結(jié)果，或者都進(jìn)行。在該分析中，可以將感興趣的區(qū)域的插值結(jié)果與比較區(qū)域的插值結(jié)果比較，來(lái)確定結(jié)果中是否有差異。同樣的插值檢測(cè)器對(duì)來(lái)自同一大圖像的兩個(gè)不同的"圖像指示"的響應(yīng)的差異，是從超過(guò)一個(gè)源進(jìn)行的圖像合成存在的證據(jù)。
參考圖6-7，在一特定實(shí)施例中，使用臉部檢測(cè)來(lái)找到感興趣的區(qū) 域。偽造的圖像通常涉及人臉。很多不同的臉部檢測(cè)技術(shù)是已知的(參見(jiàn)Ming-Hsuan Yang, David Kriegman,和Narendra Ahuja, "Detecting Faces in Images: A Survey" , IEEE Transact ions on Pat tern Ana lys i s and Machine Intelligence ( PAMI) , Vol.24， no. 1, pp. 34-58， 2002 )。使用的特定臉部檢測(cè)技術(shù)并不重要。
圖6示出示例數(shù)字圖像310，包含第一臉部330和第二臉部334。圖7示出具有與兩個(gè)臉部關(guān)聯(lián)的兩個(gè)感興趣的區(qū)域340， 341以及比較區(qū)域342的圖像，感興趣的區(qū)域340, 341和比較區(qū)域342適合用于確定圖像310是否是由來(lái)自其它源圖像的內(nèi)容構(gòu)成的偽造品。盡管這些區(qū) 域被示出為矩形，本領(lǐng)域技術(shù)人員將理解，可以使用包括任意形狀的其它形狀。檢查數(shù)字圖像310是否之前壓縮過(guò)，接著使用兩個(gè)插值檢測(cè)器中的一個(gè)在不同的區(qū)域評(píng)估插值，得到對(duì)每個(gè)區(qū)域的插值的估計(jì)。如之前所述，插值檢測(cè)器確定是否用另一個(gè)采樣點(diǎn)陣對(duì)圖像進(jìn)行過(guò)重新采
樣。例如如果發(fā)現(xiàn)區(qū)域340插值過(guò)而確定區(qū)域341和342沒(méi)有插值過(guò)，那么將該圖像分類為偽造品。此外，可以辨別出偽造區(qū)域?yàn)閰^(qū)域340。然而，如果發(fā)現(xiàn)所有三個(gè)區(qū)域都插值過(guò)(例如，旋轉(zhuǎn)10度)，那么該圖像不被劃分為偽造品，因?yàn)榭梢杂迷谡麄€(gè)圖像上一致地應(yīng)用了重新采樣格點(diǎn)而沒(méi)有添加新內(nèi)容，來(lái)解釋該情況。
本發(fā)明適用于數(shù)字視頻，數(shù)字視頻是以快速的連續(xù)性，例如以每 1 / 3 0秒一個(gè)圖像的幀速率捕捉的各個(gè)的幀的序列。可以對(duì)視頻序列中的每個(gè)幀執(zhí)行該方法。如果對(duì)于幀的一部分4企測(cè)到插值，那么該一見(jiàn)頻是合成過(guò)的或者偽造的。此外，物體趨向于在視頻中逐漸移動(dòng)，如果在多個(gè) 幀的期間上的場(chǎng)景中的同一物體或區(qū)域的檢測(cè)到插值，則是更合成或偽造的強(qiáng)烈的指示。
已經(jīng)特別參照其特定的優(yōu)選實(shí)施例詳細(xì)描述了本發(fā)明，但是將理解在本發(fā)明的精神和范圍內(nèi)可以實(shí)現(xiàn)很多修改和變化。部件列表
4 插值檢測(cè)器
10 信號(hào)生成器
16 DFT計(jì)算器
22 插值確定器
28 1D差分器
40 1D痕跡提取器
46 峰值;險(xiǎn)測(cè)器
52 閾值應(yīng)用器
58 統(tǒng)計(jì)計(jì)算器
70 圖像采樣器
76 圖像插值器
110數(shù)字圖像
114興趣區(qū)域選擇器
120壓縮檢測(cè)器
124專門的插值檢測(cè)器
126結(jié)果分析器
128偽造品分類
130第一臉部
134笫二臉部
140示出感興趣的區(qū)域的圖像
142與第一臉部關(guān)聯(lián)的區(qū)域
144與第二臉部關(guān)聯(lián)的區(qū)域
146背景區(qū)域
1110形成列差圖像
1112產(chǎn)生列差陣列
1114產(chǎn)生塊平均的列差陣列
1116定位列峰值
1118計(jì)算列平均值
1120計(jì)算列比率
1122計(jì)算圖像分量的方塊效應(yīng)的程度的度量1110'形成行差圖像
1112，產(chǎn)生行差陣列
1114，產(chǎn)生塊平均的行差陣列
1116，定位行峰值
1118'計(jì)算行平均值
1120，計(jì)算行比率
權(quán)利要求
1. 一種檢測(cè)數(shù)字圖像合成的方法，所述方法包括步驟在未經(jīng)壓縮的數(shù)字圖像中檢測(cè)第一偽像，所述第一偽像是之前用預(yù)定的壓縮算法對(duì)所述數(shù)字圖像壓縮的特征；評(píng)估所述圖像中的插值標(biāo)記來(lái)提供插值結(jié)果；在所述評(píng)估期間，抵消所述壓縮算法的第二偽像；以及響應(yīng)所述插值結(jié)果對(duì)所述圖像分類。
2. 根據(jù)權(quán)利要求1所述的方法，其中所述第二偽像和所述插值標(biāo) 記是所述圖像中不同的周期性。
3. 根據(jù)權(quán)利要求2所述的方法，其中所述第一偽像是方塊效應(yīng)。
4. 根據(jù)權(quán)利要求1所述的方法，其中所述第一偽像是方塊效應(yīng)。
5. 根據(jù)權(quán)利要求1所述的方法，其中所述提供還包括解壓縮所述數(shù)字圖像。
6. 根據(jù)權(quán)利要求1所述的方法，其中所述未經(jīng)壓縮的數(shù)字圖像是較大數(shù)字圖像的一部分。
7. 根據(jù)權(quán)利要求6所述的方法，還包括使用興趣區(qū)域檢測(cè)器在所述較大數(shù)字圖像中找到所述未經(jīng)壓縮的數(shù)字圖像。
8. 根據(jù)權(quán)利要求7所述的方法，其中所述興趣區(qū)域檢測(cè)器選自包括臉部檢測(cè)器，主題檢測(cè)器，皮膚區(qū)域檢測(cè)器，天空檢測(cè)器，其它目標(biāo) 才企測(cè)器的組，以及所述組中的所述沖企測(cè)器的兩個(gè)或多個(gè)的組合。
9. 根據(jù)權(quán)利要求1所述的方法，還包括以兩個(gè)或更多另外的數(shù)字圖像重復(fù)所述提供、檢測(cè)、評(píng)估和抵消步驟。
10. 根據(jù)權(quán)利要求9所述的方法，其中所述未經(jīng)壓縮的數(shù)字圖像以及所述另外的數(shù)字圖像每個(gè)都是較大數(shù)字圖像的不同部分；并且其中所述分類還包括響應(yīng)于所述插值結(jié)果分類所述較大數(shù)字圖像。
11. 根據(jù)權(quán)利要求10所述的方法，還包括接受指定所述未經(jīng)壓縮的數(shù)字圖像以及所述另外的數(shù)字圖像中的一個(gè)或多個(gè)的用戶輸入。
12. 根據(jù)權(quán)利要求9所述的方法，其中所述未經(jīng)壓縮的數(shù)字圖像以及所述附加的數(shù)字圖像每個(gè)都是視頻序列的幀。
13. 根據(jù)權(quán)利要求1所述的方法，其中所述評(píng)估還包括從圖像生成一維周期性信號(hào)；計(jì)算所述周期性信號(hào)的離散傅里葉變換；以及檢測(cè)所述離散傅里葉變換中的第一組峰值；以及其中所述抵消還包括從所述檢測(cè)排除所述離散傅里葉變換中的第二組峰值。
14. 一種用于檢測(cè)數(shù)字圖像合成的計(jì)算機(jī)程序產(chǎn)品，該計(jì)算機(jī)程序產(chǎn)品包括其上存儲(chǔ)了計(jì)算機(jī)程序的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，該計(jì)算機(jī)程序用于執(zhí)行根據(jù)權(quán)利要求1所述的步驟。
15. —種檢測(cè)數(shù)字圖像合成的系統(tǒng)，所述方法包括步驟提供未經(jīng)壓縮的數(shù)字圖像的裝置；在所述數(shù)字圖像中檢測(cè)第一偽像的裝置，所述第一偽像是之前用預(yù) 定的壓縮算法對(duì)所述數(shù)字圖像壓縮的特征；評(píng)估所述圖像中的插值標(biāo)記來(lái)提供插值結(jié)果的裝置；在所述評(píng)估期間，抵消所述壓縮算法的第二偽像的裝置；以及響應(yīng)于所述插值結(jié)果對(duì)所述圖像分類的裝置。
16. —種檢測(cè)數(shù)字圖像合成的方法，所述方法包括步驟提供未經(jīng)壓縮的數(shù)字圖像；在所述數(shù)字圖像中檢測(cè)第一偽像的存在，所述第一偽像是之前用預(yù) 定的壓縮算法對(duì)所述數(shù)字圖像壓縮的特征；評(píng)估所述圖像中兩個(gè)或更多不同區(qū)域中的插值標(biāo)記來(lái)提供每個(gè)所述區(qū)域的插值結(jié)果；當(dāng)所述第一偽像存在于所述數(shù)字圖像中時(shí)，在所述評(píng)估期間抵消所述壓縮算法的第二偽像；以及響應(yīng)于所述插值結(jié)果對(duì)所述圖像分類。
17. 根據(jù)權(quán)利要求16所述的方法，其中所述第一偽像是方塊效應(yīng)，所述第二偽像和所述插值標(biāo)記是所述圖像中不同的周期性。
18. 根據(jù)權(quán)利要求16所述的方法，還包括使用興趣區(qū)域檢測(cè)器在所述未經(jīng)壓縮的數(shù)字圖像中找到一個(gè)或多個(gè)所述區(qū)域。
19. 根據(jù)權(quán)利要求16所述的方法，其中所述分類還包括比較每個(gè) 所述區(qū)域的插值結(jié)果。
20. 根據(jù)權(quán)利要求16所述的方法，其中每個(gè)所述區(qū)域的所述評(píng)估還包括從圖像生成一維周期性信號(hào)；計(jì)算所述周期性信號(hào)的離散傅里葉變換；以及檢測(cè)所述離散傅里葉變換中的第一組峰值；以及其中所述抵消還包括從所述檢測(cè)排除所述離散傅里葉變換中的第二組峰值。
21. —種檢測(cè)數(shù)字圖像合成的方法，所述方法包括步驟檢測(cè)未經(jīng)壓縮的數(shù)字圖像中的方塊效應(yīng)；確定與所述方塊效應(yīng)關(guān)聯(lián)的壓縮導(dǎo)致的周期性偽像；評(píng)估所述圖像中的周期性來(lái)提供插值結(jié)果；在所述評(píng)估期間，抵消所述壓縮導(dǎo)致的周期性偽像；以及響應(yīng)于所述插值結(jié)果分類所述圖像。
22. 據(jù)權(quán)利要求21所述的方法，其中所述未經(jīng)壓縮的數(shù)字圖像是較大數(shù)字圖像的一部分。
23. 根據(jù)權(quán)利要求22所述的方法，還包括使用興趣區(qū)域檢測(cè)器在所述較大數(shù)字圖像中找到所述未經(jīng)壓縮的數(shù)字圖像。
全文摘要
在檢測(cè)數(shù)字圖像合成的方法和系統(tǒng)中，在未經(jīng)壓縮的數(shù)字圖像中檢測(cè)第一偽像。第一偽像是之前用預(yù)定的壓縮算法對(duì)數(shù)字圖像壓縮的特征。評(píng)估圖像中的插值標(biāo)記來(lái)提供插值結(jié)果。在該評(píng)估期間，抵消壓縮算法的第二偽像。根據(jù)插值結(jié)果對(duì)圖像分類。第一偽像可以是方塊效應(yīng)，而第二偽像和插值標(biāo)記可以是圖像中不同的周期性。
文檔編號(hào)G06K9/00GK101443785SQ200780009882
公開(kāi)日2009年5月27日申請(qǐng)日期2007年3月12日優(yōu)先權(quán)日2006年3月21日
發(fā)明者A·C·加拉赫爾, J·羅申請(qǐng)人:伊斯曼柯達(dá)公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：J.羅;A.C.加拉赫爾
技術(shù)所有人：伊斯曼柯達(dá)公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

圖像壓縮相關(guān)技術(shù)

圖像壓縮算法相關(guān)技術(shù)

圖像壓縮編碼相關(guān)技術(shù)

圖像壓縮技術(shù)相關(guān)技術(shù)

圖像壓縮工具相關(guān)技術(shù)

圖像壓縮比相關(guān)技術(shù)

圖像可逆壓縮相關(guān)技術(shù)

jpeg圖像壓縮算法代碼相關(guān)技術(shù)

圖像無(wú)損壓縮算法相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

檢測(cè)之前壓縮過(guò)的圖像中的合成的制作方法