專利名稱:一種基于圖像搜索的合成圖像檢測方法
技術(shù)領(lǐng)域:
本發(fā)明屬于圖像檢測技術(shù)領(lǐng)域,具體涉及基于內(nèi)容的圖像內(nèi)容可信度度量領(lǐng)域。
背景技術(shù):
隨著各種圖像處理技術(shù)的快速發(fā)展,圖像辨?zhèn)我仓饾u成為圖形圖像領(lǐng)域的重要問題。以往辨別合成圖像經(jīng)常使用的一個辦法,就是取色比較法,該方法主要是查看顏色信息,可以把圖像用專門軟件擴(kuò)大,分析其中有可能或者看起來令人懷疑的顏色區(qū)域,分析顏色的真實程度,缺點是時間花費較大,且沒有可行的系統(tǒng)可以應(yīng)用。
發(fā)明內(nèi)容
本發(fā)明的目的是克服現(xiàn)有技術(shù)的上述不足,提供一種簡單易行的合成圖像檢測方法。為此,本發(fā)明采用如下的技術(shù)方案
一種基于圖像搜索的合成圖像檢測方法,在已經(jīng)建立了基于內(nèi)容的圖像檢索系統(tǒng)圖的基礎(chǔ)上進(jìn)行,該圖像檢索系統(tǒng)的圖像數(shù)據(jù)庫已經(jīng)存儲有充分多圖像,能夠搜索到與待檢測是否為合成圖像的圖像相同或者相似的圖像,該方法包括下列步驟 步驟一圖像搜索
將待檢測是否為合成圖像的圖像,輸入到基于內(nèi)容的圖像檢索系統(tǒng)中進(jìn)行搜索, 從檢索出的與其相匹配的圖像中,選擇匹配度最高的圖像; 步驟二 圖像相減
將上一步驟中的輸入的待檢測圖像和檢索到的匹配度最高的圖像調(diào)整到相同大小后, 以矩陣的方式分別讀入并進(jìn)行相減,將相減后的圖像然后轉(zhuǎn)換成灰度圖像顯示出來,觀察相減后的圖像,根據(jù)圖像中黑白區(qū)域的分布做判斷
a.如果相減后的圖像有大面積的黑色部分或者小面積的連續(xù)的黑色部分出現(xiàn),并且同時有大面積的連續(xù)的白色區(qū)域出現(xiàn),則可以證明兩張圖像中至少有一張是經(jīng)過處理的。b.如果相減后的圖像存在大面積的白色區(qū)域,黑色區(qū)域很少且分布零散,則可判斷兩幅圖像聯(lián)系很小,即圖像沒有經(jīng)過處理。本發(fā)明首先建立了一種基于內(nèi)容的檢索系統(tǒng),該系統(tǒng)通過提取圖像的SIFT特征,并對特征進(jìn)行聚類得到視覺關(guān)鍵字,然后利用基于文本搜索的相關(guān)方法,根據(jù)Bag of words模型對圖像按照視覺關(guān)鍵字進(jìn)行索引,從而達(dá)到高效而準(zhǔn)確的查找結(jié)果。與傳統(tǒng)的基于文本搜索的方法比較的優(yōu)點是
1.圖像是對客觀對象的一種相似性的、生動性的描述,它包含了被描述對象的直觀信息,它是人們最主要的信息源。據(jù)統(tǒng)計,一個人獲取的信息大約有75%來自視覺?;趦?nèi)容的檢索可以查找到一個人對所查找圖像中物體的直觀印象的相似對象,而基于文本的搜索只能查找到對物體的描述的相似對象,缺乏直觀性。2.基于文本的搜索需要將對象的特征用文字描述出來,在用于查詢數(shù)量眾多的對象時,描述不夠全面,基于不同的描述會產(chǎn)生不同的查詢結(jié)果;而基于內(nèi)容的檢索則會綜合考慮圖像的局部特征,同一張圖像檢索返回相同的查詢結(jié)果。本發(fā)明在基于圖像檢索系統(tǒng)的基礎(chǔ)上,進(jìn)行圖像的搜索與檢測,方法簡單,直觀, 時間復(fù)雜度低,易于應(yīng)用。
圖1 (a) (b) (c) (d)分別為經(jīng)過人物臉部替換、部分人物替換、將原圖像中所有人物都覆蓋、在原圖中加人物進(jìn)去四種處理后的四組圖像匹配結(jié)果。每組圖像的左圖為輸入的圖像(原圖像),中圖為與其匹配度最高的圖像,右圖為兩個圖像相減后得到的圖像。圖2未經(jīng)過處理的圖像兩個圖像的相減后的結(jié)果。左圖和中圖為兩個相似的圖像,右圖為兩個圖像相減后得到的圖像。
具體實施例方式本發(fā)明提供了一種在基于內(nèi)容檢索系統(tǒng)簡單的合成圖像檢測方法先將所要鑒別的圖像輸入到檢索系統(tǒng),搜索到特征相似的許多圖像,然后利用圖像的矩陣表示技術(shù)將所輸入的圖像與搜索到的圖像相減,根據(jù)相減圖像零值的分布,判斷圖像是否經(jīng)過合成處理。下面首先介紹一下本發(fā)明采用的圖像檢索系統(tǒng)。隨著數(shù)字圖像應(yīng)用領(lǐng)域的飛速發(fā)展,準(zhǔn)確高效的圖像檢索技術(shù)越來越受到重視。 對于目前的搜索引擎系統(tǒng),通常是用戶提交文本,然后系統(tǒng)返回與該文本相關(guān)的圖像;而對基于內(nèi)容的圖像檢索系統(tǒng),用戶提交的是圖像,而系統(tǒng)返回在數(shù)據(jù)庫中與該圖像內(nèi)容近似的圖像,即“視覺近似”,因此能夠完成一些文本搜索不能滿足的需求?;趦?nèi)容的圖像檢索是一項非常困難的任務(wù),其中有很多原因。首先,表示圖像內(nèi)容的特征信息往往維數(shù)很高,數(shù)目眾多,給特征的存儲和匹配速度帶來了很大的挑戰(zhàn),如何降低特征的維度同時又保持較高的區(qū)分度是基于內(nèi)容的圖像檢索領(lǐng)域的一大難點;其次, 在檢索系統(tǒng)中,隨著圖像數(shù)量的不斷增加,如何組織圖像的索引和查詢系統(tǒng)使其能夠在海量圖像庫中快速的檢索出與目標(biāo)內(nèi)容相似的圖像,也是一個不小的難題。本發(fā)明所采用的基于內(nèi)容的檢索系統(tǒng)中,通過提取圖像的SIFT特征,并對特征進(jìn)行聚類得到視覺關(guān)鍵字, 然后利用基于文本搜索的相關(guān)方法,根據(jù)Bag of words模型,對圖像按照視覺關(guān)鍵字進(jìn)行索引,從而達(dá)到高效而準(zhǔn)確的查找。具體檢索方法分為下面的四個步驟
步驟一提取圖像的特征
圖像的特征在一定程度上反映了圖像的內(nèi)容,對于基于內(nèi)容的圖像搜索系統(tǒng),特征的提取至關(guān)重要。在本發(fā)明中,采用kale-invariant feature transform(簡稱SIFT)算法提取圖像特征,SIFT算法由David. G. Lowe于1999年提出,2004年完善總結(jié)。SIFT特征是圖像的局部特征,其對旋轉(zhuǎn)、尺度縮放、亮度變化保持不變性,對視角變化、仿射變換、噪聲也保持一定程度的穩(wěn)定性。因而基于SIFT特征的圖像內(nèi)容匹配具有較高的準(zhǔn)確性和可靠性。本發(fā)明中采用1 維SIFT特征向量。步驟二 對圖像的特征進(jìn)行聚類得到視覺關(guān)鍵字
類似于文本索引,我們要按照關(guān)鍵字對數(shù)據(jù)庫中的圖像進(jìn)行索引。由于提取出的圖像特征具有很高的區(qū)分度,如果直接以特征作為關(guān)鍵字建立索引,則造成倒排索引鏈表的平均長度很短,失去了圖像匹配的意義。在本發(fā)明中,采用K-Means方法對圖像的特征進(jìn)行聚類,并以聚類最后得到的各個中心作為視覺關(guān)鍵字。步驟三通過視覺關(guān)鍵字對特征進(jìn)行量化,利用bag of words模型索引圖像得到視覺關(guān)鍵字后,將圖像的特征量化為視覺關(guān)鍵字,忽略特征間的空間位置上的關(guān)
系,則圖像可以看作為視覺關(guān)鍵字的集合,對應(yīng)于文本搜索中的bag of words模型。借鑒文本搜索成熟的技術(shù),根據(jù)視覺關(guān)鍵字為圖像建立倒排索引,可有效的對圖像數(shù)據(jù)庫進(jìn)行內(nèi)容檢索。同時,為了彌補圖像特征量化為視覺關(guān)鍵字在區(qū)分度上的損失,在倒排索引中對每個視覺關(guān)鍵字附屬64維的漢明碼作為區(qū)分度的補償,定義漢明距離為兩個漢明碼之間不同的位數(shù),則漢明距離超出閾值的特征認(rèn)定為不匹配。漢明碼的生成過程如下,
1)生成隨機正定矩陣,維數(shù)為128*64
2)對于屬于同一視覺關(guān)鍵字的特征,通過隨機正定矩陣映射為64維特征
3)計算生成的64維特征集合每一維上的中位數(shù)
4)對于圖像的64維特征,若大于等于該維的中位數(shù),則對應(yīng)位設(shè)為1,否則設(shè)為0,由此得到64維漢明碼。采用漢明碼的優(yōu)點是既不會給空間上帶來過多的負(fù)擔(dān),同時又極大提高了檢索的精確度。步驟四查詢
對于用戶提交的圖像,查詢過程如下
1.提取圖像的SIFT特征
2.將圖像特征量化為視覺關(guān)鍵字,并計算其漢明碼
3.利用倒排索引對數(shù)據(jù)庫進(jìn)行檢索,并按照關(guān)鍵字的權(quán)重對庫中的圖像進(jìn)行加權(quán)積分。此處不同于文本搜索的是,對于一個視覺關(guān)鍵字,在同一張圖像中只進(jìn)行一次加分,即相似于圖像匹配中特征一對一的對應(yīng)關(guān)系,經(jīng)實驗,這種加權(quán)方法極大地提高了查詢的準(zhǔn)確率。4.按圖像積分對圖像進(jìn)行相關(guān)度排序,作為返回結(jié)果。下面在采用上述方法建立的圖像搜索系統(tǒng)的基礎(chǔ)上,對本發(fā)明的檢測方法進(jìn)行說明
步驟一圖像搜索
得到一張圖像,需要判斷其是否做過處理,將其輸入到基于內(nèi)容的圖像檢索系統(tǒng)中,進(jìn)行搜索,系統(tǒng)會將與其所匹配的圖像進(jìn)行打分,并按照分?jǐn)?shù)從高到低顯示出來,排在第一位的圖像即為匹配度最高的圖像,將其進(jìn)行存儲,為下一步做準(zhǔn)備。在這里有一個大前提,在圖像數(shù)據(jù)庫充分大的前提下,所輸入的圖像一定能找到前景或者背景相同的圖像。因為當(dāng)?shù)玫揭粡垐D像,需要對其進(jìn)行真假檢測時,那么這張圖像一定有其利用價值,所以進(jìn)行搜索時,一定能搜索到其相同或者相似的圖像。步驟二圖像相減
利用軟件,將上一步驟中的輸入圖像和存儲的匹配度最高的圖像調(diào)整到相同大小后, 以矩陣的方式讀入并進(jìn)行相減,然后轉(zhuǎn)換成灰度圖像顯示出來,觀察相減后的圖像,根據(jù)圖像中黑白區(qū)域的分布做判斷1.如果相減后的圖像有大面積的黑色部分或者小面積的連續(xù)的黑色部分出現(xiàn),并且同時有大面積的連續(xù)的白色區(qū)域出現(xiàn),則可以證明兩張圖像中至少有一張是經(jīng)過處理的。2.如果矩陣中的非零值大量出現(xiàn)且充滿整個矩陣,即圖像上大面積都是白色區(qū)域,黑色區(qū)域很少且分布零散,則可判斷兩幅圖像聯(lián)系很小,即圖像沒有經(jīng)過處理。下面通過驗證實驗來說明本發(fā)明的方法的可行性。實驗的基礎(chǔ)工作本發(fā)明是在基于圖像的檢索系統(tǒng)上進(jìn)行的實驗,為了讓效果更具說服力,選取一些具有代表性的圖像,運用軟件將所提取圖像進(jìn)行合成處理,最后選擇50 張作為測試集。對圖像分別作了四種不同方式的處理,并將做了處理的多張圖輸入檢索系統(tǒng)中 (這里沒有列出各個原圖像和經(jīng)過處理后的各個相應(yīng)圖像)
1.將原圖中人物的臉部做替換
2.將原圖像中的部分人物替換
3.將原圖像中所有人物都覆蓋
4.在原圖中加人物進(jìn)去
步驟一,圖像搜索將測試集中的圖像輸入到檢索系統(tǒng)中,然后將匹配度最好的圖像進(jìn)行存儲。
步驟二,圖像相減運用軟件,將輸入的圖像與檢索結(jié)果中匹配度最高的圖像相減。說明
1.相減的前提是要求兩張圖像的尺寸相同,如不相同,可先統(tǒng)一尺寸,再進(jìn)行相減。對圖像尺寸進(jìn)行變換時,由于放大或者壓縮會影響圖像的像素質(zhì)量,所以相減后的圖像效果會不如預(yù)想的結(jié)果好,但是影響不大。2.相減后的圖像白色為兩張圖像像素值不相等的部分,黑色為像素值相等的部分。下面給出沒有經(jīng)過處理和經(jīng)過處理的兩種類型圖像的結(jié)果
1.圖1為經(jīng)過處理的圖像的結(jié)果(順序與上面介紹的四種處理情況相對應(yīng)) 說明框框部分為經(jīng)過處理的地方。2.圖2是未經(jīng)過處理的圖像的結(jié)果
說明左圖和中圖兩張圖像是把相機固定,連續(xù)拍攝的,不通過技術(shù)手段很難分辨出兩張圖像的區(qū)別,然而,經(jīng)過相減之后發(fā)現(xiàn),兩張圖像相同的地方很少,這是由于光的照射發(fā)生了變化,圖像每一點的像素值都發(fā)生了變化的緣故。當(dāng)?shù)玫揭粡垐D像,將其輸入到基于圖像檢索的系統(tǒng)中,在圖像庫中的圖像足夠多的前提下,應(yīng)該可以得到背景或者前景相同,或者極其相似的圖像,利用上面介紹的方法, 通過軟件就可作出初步的判斷
1.如果相減后的圖像有大面積的黑色部分或者小面積的連續(xù)的黑色部分出現(xiàn),并且同時有大面積的連續(xù)的白色區(qū)域出現(xiàn),則可以證明兩張圖像中至少有一張是經(jīng)過處理的。2.如果矩陣中的非零值大量出現(xiàn)且充滿整個矩陣,即圖像上大面積都是白色區(qū)域,黑色區(qū)域很少且分布零散,則可判斷兩幅圖像聯(lián)系很小,即圖像沒有經(jīng)過處理。
權(quán)利要求
1. 一種基于圖像搜索的合成圖像檢測方法,在已經(jīng)建立了基于內(nèi)容的圖像檢索系統(tǒng)圖的基礎(chǔ)上進(jìn)行,該圖像檢索系統(tǒng)的圖像數(shù)據(jù)庫已經(jīng)存儲有充分多圖像,能夠搜索到與待檢測是否為合成圖像的圖像相同或者相似的圖像,該方法包括下列步驟步驟一圖像搜索將待檢測是否為合成圖像的圖像,輸入到基于內(nèi)容的圖像檢索系統(tǒng)中進(jìn)行搜索, 從檢索出的與其相匹配的圖像中,選擇匹配度最高的圖像;步驟二 圖像相減將上一步驟中的輸入的待檢測圖像和檢索到的匹配度最高的圖像調(diào)整到相同大小后, 以矩陣的方式分別讀入并進(jìn)行相減,將相減后的圖像然后轉(zhuǎn)換成灰度圖像顯示出來,觀察相減后的圖像,根據(jù)圖像中黑白區(qū)域的分布做判斷a.如果相減后的圖像有大面積的黑色部分或者小面積的連續(xù)的黑色部分出現(xiàn),并且同時有大面積的連續(xù)的白色區(qū)域出現(xiàn),則可以證明兩張圖像中至少有一張是經(jīng)過處理的。b.如果相減后的圖像存在大面積的白色區(qū)域,黑色區(qū)域很少且分布零散,則可判斷兩幅圖像聯(lián)系很小,即圖像沒有經(jīng)過處理。
全文摘要
本發(fā)明屬于圖像檢測技術(shù)領(lǐng)域,涉及一種基于圖像搜索的合成圖像檢測方法,該方法包括下列步驟將待檢測是否為合成圖像的圖像,輸入到基于內(nèi)容的圖像檢索系統(tǒng)中進(jìn)行搜索,從檢索出的與其相匹配的圖像中,選擇匹配度最高的圖像;將待檢測圖像和檢索到的匹配度最高的圖像調(diào)整到相同大小后相減,并做如下的判斷a.如果相減后的圖像有大面積的黑色部分或者小面積的連續(xù)的黑色部分出現(xiàn),并且同時有大面積的連續(xù)的白色區(qū)域出現(xiàn),則可以證明兩張圖像中至少有一張是經(jīng)過處理的;b.如果相減后的圖像存在大面積的白色區(qū)域,黑色區(qū)域很少且分布零散,則可判斷兩幅圖像聯(lián)系很小,即圖像沒有經(jīng)過處理。本發(fā)明的檢測方法具有簡單,直觀,時間復(fù)雜度低,易于應(yīng)用的優(yōu)點。
文檔編號G06F17/30GK102194124SQ20101028319
公開日2011年9月21日 申請日期2010年9月16日 優(yōu)先權(quán)日2010年9月16日
發(fā)明者張曉婧, 操曉春, 李原 申請人:天津大學(xué)