本發(fā)明涉及計(jì)算機(jī)視覺(jué)與圖像識(shí)別技術(shù)領(lǐng)域,具體涉及一種圖像篡改檢測(cè)方法及裝置。
背景技術(shù):
數(shù)字圖像處理軟件可以用于對(duì)圖像進(jìn)行編輯處理,相應(yīng)地,也有利于圖像的篡改和偽造,使得篡改圖像大量增加,甚至篡改圖像還會(huì)出現(xiàn)在新聞報(bào)道和法律證據(jù)中,降低新聞媒體和司法的公信力。
目前,可以采用數(shù)字圖像內(nèi)容認(rèn)證技術(shù)檢測(cè)圖像是否為篡改圖像,數(shù)字圖像內(nèi)容認(rèn)證技術(shù)主要包括主動(dòng)認(rèn)證方式和被動(dòng)認(rèn)證方式。
其中:主動(dòng)認(rèn)證方式指的是在圖像生成過(guò)程中或發(fā)布之前,嵌入水印或數(shù)字簽名。但是,主動(dòng)認(rèn)證方式需要數(shù)字成像設(shè)備配備水印或數(shù)字簽名的嵌入模型,使用較為不便。
被動(dòng)認(rèn)證方式指的是直接依據(jù)圖像內(nèi)容判斷圖像是否為篡改圖像。但是,被動(dòng)認(rèn)證方式極易受到圖像的像素級(jí)、格式級(jí)和場(chǎng)景級(jí)等反篡改工具的制約,不能準(zhǔn)確檢測(cè)圖像的真實(shí)性。
技術(shù)實(shí)現(xiàn)要素:
為了解決現(xiàn)有技術(shù)中的上述問(wèn)題,即為了解決圖像篡改檢測(cè)技術(shù)不易實(shí)施及檢測(cè)準(zhǔn)確性低的技術(shù)問(wèn)題,本發(fā)明提供了一種圖像篡改檢測(cè)方法及裝置。
第一方面,本發(fā)明中一種圖像篡改檢測(cè)方法的技術(shù)方案是:
所述方法包括:
依據(jù)預(yù)設(shè)的細(xì)粒度圖像描述模型,獲取待檢測(cè)圖像的語(yǔ)義描述信息;
對(duì)所獲取的語(yǔ)義描述信息與預(yù)設(shè)的反常規(guī)則庫(kù)進(jìn)行匹配:若所述預(yù)設(shè)的反常規(guī)則庫(kù)包含所述語(yǔ)義描述信息,則判斷所述待檢測(cè)圖像為篡改圖像;
其中:
所述預(yù)設(shè)的細(xì)粒度圖像描述模型的輸出包括預(yù)設(shè)的真實(shí)圖像對(duì)應(yīng)的語(yǔ)義描述信息、預(yù)設(shè)的篡改圖像對(duì)應(yīng)的語(yǔ)義描述信息;
所述反常規(guī)則庫(kù)包括預(yù)設(shè)的多個(gè)語(yǔ)義描述信息,且所述的多個(gè)語(yǔ)義描述信息所包含的信息內(nèi)容為異常信息。
進(jìn)一步地,本發(fā)明提供的一個(gè)優(yōu)選技術(shù)方案為:
所述對(duì)所獲取的語(yǔ)義描述信息與預(yù)設(shè)的反常規(guī)則庫(kù)進(jìn)行匹配之前,包括:
判斷所獲取的語(yǔ)義描述信息中是否存在包含同一信息內(nèi)容的多個(gè)語(yǔ)義描述信息:若存在,則去除包含該同一信息內(nèi)容的一個(gè)或多個(gè)語(yǔ)義描述信息,且保留一個(gè)包含該同一信息內(nèi)容的語(yǔ)義描述信息;
依據(jù)所獲取的語(yǔ)義描述信息的置信度由高到低的順序,選擇預(yù)設(shè)數(shù)量的語(yǔ)義描述信息;
對(duì)所獲取的語(yǔ)義描述信息進(jìn)行標(biāo)準(zhǔn)化處理,包括:去除所述語(yǔ)義描述信息中包含的冠詞和形容詞,并將去除冠詞和形容詞后語(yǔ)義描述信息中的各單詞轉(zhuǎn)換為對(duì)應(yīng)的預(yù)設(shè)單詞。
進(jìn)一步地,本發(fā)明提供的一個(gè)優(yōu)選技術(shù)方案為:
所述語(yǔ)義描述信息還包括與其包含的信息內(nèi)容對(duì)應(yīng)的圖像區(qū)域坐標(biāo)。
進(jìn)一步地,本發(fā)明提供的一個(gè)優(yōu)選技術(shù)方案為:
所述獲取待檢測(cè)圖像的語(yǔ)義描述信息之前,包括采用深度卷積神經(jīng)網(wǎng)絡(luò)算法、細(xì)粒度圖像分類方法構(gòu)建細(xì)粒度圖像描述模型。
進(jìn)一步地,本發(fā)明提供的一個(gè)優(yōu)選技術(shù)方案為:
所述獲取待檢測(cè)圖像的語(yǔ)義描述信息之前,包括采用遞歸神經(jīng)網(wǎng)絡(luò)算法,并依據(jù)預(yù)設(shè)的真實(shí)圖像、預(yù)設(shè)的篡改圖像依次對(duì)細(xì)粒度圖像描述模型進(jìn)行第一數(shù)據(jù)訓(xùn)練和第二數(shù)據(jù)訓(xùn)練;
其中:
所述第一數(shù)據(jù)訓(xùn)練包括:
依據(jù)預(yù)設(shè)的細(xì)粒度圖像描述模型、預(yù)設(shè)的真實(shí)圖像,獲取所述預(yù)設(shè)的真實(shí)圖像的第一語(yǔ)義描述信息;獲取對(duì)所述預(yù)設(shè)的真實(shí)圖像進(jìn)行人工標(biāo)注后,得到的第二語(yǔ)義描述信息;計(jì)算所述第一語(yǔ)義描述信息和第二語(yǔ)義描述信息之間的第一損失函數(shù)值,依據(jù)所述第一損失函數(shù)值、反向傳播算法優(yōu)化所述細(xì)粒度圖像描述模型;
所述第二數(shù)據(jù)訓(xùn)練包括:
依據(jù)預(yù)設(shè)的細(xì)粒度圖像描述模型、預(yù)設(shè)的篡改圖像,獲取所述預(yù)設(shè)的篡改圖像的第三語(yǔ)義描述信息;獲取對(duì)所述預(yù)設(shè)的篡改圖像進(jìn)行人工標(biāo)注后,得到的第四語(yǔ)義描述信息;計(jì)算所述第三語(yǔ)義描述信息和第四語(yǔ)義描述信息之間的第二損失函數(shù)值,依據(jù)所述第二損失函數(shù)值、反向傳播算法優(yōu)化所述細(xì)粒度圖像描述模型。
第二方面,本發(fā)明中一種圖像篡改檢測(cè)裝置的技術(shù)方案是:
所述裝置包括:
信息獲取模塊,配置為依據(jù)預(yù)設(shè)的細(xì)粒度圖像描述模型,獲取待檢測(cè)圖像的語(yǔ)義描述信息;
信息匹配模塊,配置為對(duì)所獲取的語(yǔ)義描述信息與預(yù)設(shè)的反常規(guī)則庫(kù)進(jìn)行匹配:若所述預(yù)設(shè)的反常規(guī)則庫(kù)包含所述語(yǔ)義描述信息,則判斷所述待檢測(cè)圖像為篡改圖像;
其中:
所述預(yù)設(shè)的細(xì)粒度圖像描述模型包括預(yù)設(shè)的真實(shí)圖像對(duì)應(yīng)的語(yǔ)義描述信息、預(yù)設(shè)的篡改圖像對(duì)應(yīng)的語(yǔ)義描述信息;
所述反常規(guī)則庫(kù)包括預(yù)設(shè)的多個(gè)語(yǔ)義描述信息,且所述的多個(gè)語(yǔ)義描述信息所包含的信息內(nèi)容為異常信息。
進(jìn)一步地,本發(fā)明提供的一個(gè)優(yōu)選技術(shù)方案為:
所述裝置還包括:
信息去重模塊,配置為判斷所述信息獲取模塊所獲取的語(yǔ)義描述信息中是否存在包含同一信息內(nèi)容的多個(gè)語(yǔ)義描述信息:若存在,則去除包含該同一信息內(nèi)容的一個(gè)或多個(gè)語(yǔ)義描述信息,且保留一個(gè)包含該同一信息內(nèi)容的語(yǔ)義描述信息;
信息選擇模塊,配置為依據(jù)所述信息獲取模塊所獲取的語(yǔ)義描述信息的置信度由高到低的順序,選擇預(yù)設(shè)數(shù)量的語(yǔ)義描述信息;
信息處理模塊,配置為對(duì)所述信息獲取模塊所獲取的語(yǔ)義描述信息進(jìn)行標(biāo)準(zhǔn)化處理,包括:去除所述語(yǔ)義描述信息中包含的冠詞和形容詞,并將去除冠詞和形容詞后語(yǔ)義描述信息中的各單詞轉(zhuǎn)換為對(duì)應(yīng)的預(yù)設(shè)單詞。
進(jìn)一步地,本發(fā)明提供的一個(gè)優(yōu)選技術(shù)方案為:
所述信息獲取模塊所獲取的語(yǔ)義描述信息還包括與其包含的信息內(nèi)容對(duì)應(yīng)的圖像區(qū)域坐標(biāo)。
進(jìn)一步地,本發(fā)明提供的一個(gè)優(yōu)選技術(shù)方案為:
所述裝置還包括模型構(gòu)建模塊;所述模型構(gòu)建模塊,配置為采用深度卷積神經(jīng)網(wǎng)絡(luò)算法、細(xì)粒度圖像分類方法構(gòu)建細(xì)粒度圖像描述模型。
進(jìn)一步地,本發(fā)明提供的一個(gè)優(yōu)選技術(shù)方案為:
所述裝置還包括模型訓(xùn)練模塊;所述模型訓(xùn)練模塊包括第一模型訓(xùn)練單元和第二模型訓(xùn)練單元;
所述模型訓(xùn)練模塊,配置為采用遞歸神經(jīng)網(wǎng)絡(luò)算法,并依據(jù)預(yù)設(shè)的真實(shí)圖像、預(yù)設(shè)的篡改圖像依次對(duì)細(xì)粒度圖像描述模型進(jìn)行第一數(shù)據(jù)訓(xùn)練和第二數(shù)據(jù)訓(xùn)練;
所述第一模型訓(xùn)練單元包括第一信息獲取子單元、第二信息獲取子單元和第一模型優(yōu)化子單元;所述第一信息獲取子單元,配置為依據(jù)預(yù)設(shè)的細(xì)粒度圖像描述模型、預(yù)設(shè)的真實(shí)圖像,獲取所述預(yù)設(shè)的真實(shí)圖像的第一語(yǔ)義描述信息;所述第二信息獲取子單元,配置為獲取對(duì)所述預(yù)設(shè)的真實(shí)圖像進(jìn)行人工標(biāo)注后,得到的第二語(yǔ)義描述信息;所述第一模型優(yōu)化子單元,配置為計(jì)算所述第一語(yǔ)義描述信息和第二語(yǔ)義描述信息之間的第一損失函數(shù)值,依據(jù)所述第一損失函數(shù)值、反向傳播算法優(yōu)化所述細(xì)粒度圖像描述模型;
所述第二模型訓(xùn)練單元包括第三信息獲取子單元、第四信息獲取子單元和第二模型優(yōu)化子單元;所述第三信息獲取子單元,配置為依據(jù)預(yù)設(shè)的細(xì)粒度圖像描述模型、預(yù)設(shè)的篡改圖像,獲取所述預(yù)設(shè)的篡改圖像的第三語(yǔ)義描述信息;所述第四信息獲取子單元,配置為獲取對(duì)所述預(yù)設(shè)的篡改圖像進(jìn)行人工標(biāo)注后,得到的第四語(yǔ)義描述信息;所述第二模型優(yōu)化子單元,配置為計(jì)算所述第三語(yǔ)義描述信息和第四語(yǔ)義描述信息之間的第二損失函數(shù)值,依據(jù)所述第二損失函數(shù)值、反向傳播算法優(yōu)化所述細(xì)粒度圖像描述模型。
第三方面,本發(fā)明中另一種圖像篡改檢測(cè)裝置的技術(shù)方案是:
所述裝置包括:
處理器,用于執(zhí)行各指令;
存儲(chǔ)設(shè)備,用于存儲(chǔ)多條指令;所述指令適用于由處理器加載并執(zhí)行權(quán)利要求1-5所述圖像篡改檢測(cè)方法中的各步驟。
與現(xiàn)有技術(shù)相比,上述技術(shù)方案至少具有以下有益效果:
1、本發(fā)明提供的一種圖像篡改檢測(cè)方法,可以依據(jù)預(yù)設(shè)的細(xì)粒度圖像描述模型獲取待檢測(cè)圖像的語(yǔ)義描述信息,并將所獲取的語(yǔ)義描述信息與預(yù)設(shè)的反常規(guī)則庫(kù)進(jìn)行匹配,依據(jù)匹配結(jié)果判斷待檢測(cè)圖像是否為篡改圖像,該方法不受底層像素級(jí)、格式級(jí)、場(chǎng)景級(jí)等反篡改工具的制約,可以更加準(zhǔn)確的檢測(cè)圖像的真實(shí)性。
2、本發(fā)明提供的一種圖像篡改檢測(cè)裝置,其信息獲取模塊可以依據(jù)預(yù)設(shè)的細(xì)粒度圖像描述模型獲取待檢測(cè)圖像的語(yǔ)義描述信息,信息匹配模塊可以將所獲取的語(yǔ)義描述信息與預(yù)設(shè)的反常規(guī)則庫(kù)進(jìn)行匹配,依據(jù)匹配結(jié)果判斷待檢測(cè)圖像是否為篡改圖像,該裝置可以不受底層像素級(jí)、格式級(jí)、場(chǎng)景級(jí)等反篡改工具的制約,可以更加準(zhǔn)確的檢測(cè)圖像的真實(shí)性。
3、本發(fā)明提供的另一種圖像篡改檢測(cè)裝置,其可以通過(guò)處理器執(zhí)行上述圖像篡改檢測(cè)方法的各步驟,有利于圖像篡改檢測(cè)的實(shí)施和推廣。
附圖說(shuō)明
圖1是本發(fā)明實(shí)施例中一種圖像篡改檢測(cè)方法的實(shí)施流程圖;
圖2是本發(fā)明實(shí)施例中第一數(shù)據(jù)訓(xùn)練實(shí)施過(guò)程中真實(shí)圖像的示意圖;
圖3是本發(fā)明實(shí)施例中待檢測(cè)圖像的示意圖;
圖4是本發(fā)明實(shí)施例中細(xì)粒度圖像描述模型的輸出結(jié)果示意圖;
圖5是本發(fā)明實(shí)施例中一種圖像篡改檢測(cè)裝置的結(jié)構(gòu)示意圖;
圖6是本發(fā)明實(shí)施例中另一種圖像篡改檢測(cè)裝置的結(jié)構(gòu)示意圖;
圖7是本發(fā)明實(shí)施例中再一種圖像篡改檢測(cè)裝置的結(jié)構(gòu)示意圖;
圖8是本發(fā)明實(shí)施例中第一模型訓(xùn)練單元的結(jié)構(gòu)示意圖;
圖9是本發(fā)明實(shí)施例中第二模型訓(xùn)練單元的結(jié)構(gòu)示意圖;
其中,11:第一圖像區(qū)域;12:第二圖像區(qū)域;13:第三圖像區(qū)域;14:第四圖像區(qū)域;15:第五圖像區(qū)域;21:信息獲取模塊;22:信息匹配模塊;23:信息去重模塊;24:信息選擇模塊;25:信息處理模塊;26:模型構(gòu)建模塊;27:模型訓(xùn)練模塊;271:第一模型訓(xùn)練單元;2711:第一信息獲取子單元;2712:第二信息獲取子單元;2713:第一模型優(yōu)化子單元;272:第二模型訓(xùn)練單元;2721:第三信息獲取子單元;2722:第四信息獲取子單元;2723:第二模型優(yōu)化子單元。
具體實(shí)施方式
下面參照附圖來(lái)描述本發(fā)明的優(yōu)選實(shí)施方式。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解的是,這些實(shí)施方式僅僅用于解釋本發(fā)明的技術(shù)原理,并非旨在限制本發(fā)明的保護(hù)范圍。
當(dāng)前圖像篡改檢測(cè)方法,很容易受到圖像的像素級(jí)、格式級(jí)和場(chǎng)景級(jí)等反篡改工具的制約,不能準(zhǔn)確檢測(cè)圖像的真實(shí)性。基于此,本發(fā)明提供了一種對(duì)圖像的像素級(jí)、格式級(jí)和場(chǎng)景級(jí)要求較低的圖像篡改檢測(cè)方法,首先通過(guò)細(xì)粒度圖像描述模型獲取待檢測(cè)圖像的語(yǔ)義描述信息,然后將待檢測(cè)圖像的語(yǔ)義描述信息與反常規(guī)則庫(kù)進(jìn)行匹配,依據(jù)匹配結(jié)果判斷待檢測(cè)圖像是否為篡改圖像。
下面結(jié)合附圖,對(duì)本發(fā)明實(shí)施例中一種圖像篡改檢測(cè)方法進(jìn)行說(shuō)明,具體為:
圖1示例性示出了本實(shí)施例中圖像篡改檢測(cè)方法的實(shí)施路程,如圖所示,本實(shí)施例中可以按照下述步驟對(duì)待檢測(cè)圖像進(jìn)行篡改檢測(cè):
步驟s101:依據(jù)預(yù)設(shè)的細(xì)粒度圖像描述模型,獲取待檢測(cè)圖像的語(yǔ)義描述信息。
本實(shí)施例中細(xì)粒度圖像描述模型的輸入數(shù)據(jù)為待檢測(cè)圖像,輸出數(shù)據(jù)為語(yǔ)義描述信息,其可以采用深度卷積神經(jīng)網(wǎng)絡(luò)算法、細(xì)粒度圖像分類方法構(gòu)建,具體過(guò)程為:
采用深度卷積神經(jīng)網(wǎng)絡(luò)算法、細(xì)粒度圖像分類方法提取圖像特征,并將所提取的圖像特征經(jīng)過(guò)自定義的定位層得到感興趣區(qū)域特征,將每個(gè)感興趣區(qū)域特征轉(zhuǎn)換成向量輸入至全連接層得到多個(gè)向量特征,最后將所得到的多個(gè)向量特征輸入至長(zhǎng)短期記憶單元(longshort-termmemory,lstm),得到語(yǔ)義描述信息及其對(duì)應(yīng)的圖像區(qū)域。其中:采用深度卷積神經(jīng)網(wǎng)絡(luò)算法、細(xì)粒度圖像分類方法提取圖像特征的方法為常規(guī)方法,例如,文獻(xiàn)“imagenetclassificationwithdeepconvolutionalneuralnetworks,”inadvancesinneuralinformationprocessingsystems,2012,pp.1097–1105.alexkrizhevsky,ilyasutskever,andgeoffreyehinton,公開(kāi)了一種采用深度卷積神經(jīng)網(wǎng)絡(luò)算法提取有效特征用于分類任務(wù)的方法。
本實(shí)施例中語(yǔ)義描述信息指的是包含圖像所示出的畫面內(nèi)容的信息,同時(shí)語(yǔ)義描述信息還包括與其所包含的信息內(nèi)容對(duì)應(yīng)的圖像區(qū)域坐標(biāo),從而可以更加準(zhǔn)確的描述圖像的所示出的畫面內(nèi)容。例如,語(yǔ)義描述信息可以為喝水的大象、坐在沙漠中的貓等。
進(jìn)一步地,本實(shí)施例中在采用深度卷積神經(jīng)網(wǎng)絡(luò)算法、細(xì)粒度圖像分類方法構(gòu)建細(xì)粒度圖像描述模型時(shí),還需要對(duì)其進(jìn)行數(shù)據(jù)訓(xùn)練,才可以準(zhǔn)確的輸出待檢測(cè)圖像的語(yǔ)義描述信息。
本實(shí)施例中可以采用遞歸神經(jīng)網(wǎng)絡(luò)算法、并依據(jù)預(yù)設(shè)的真實(shí)圖像、預(yù)設(shè)的篡改圖像依次對(duì)細(xì)粒度圖像描述模型進(jìn)行第一數(shù)據(jù)訓(xùn)練和第二數(shù)據(jù)訓(xùn)練。其中,遞歸神經(jīng)網(wǎng)絡(luò)算法為常規(guī)算法,例如,文獻(xiàn)“acriticalreviewofrecurrentneuralnetworksforsequencelearning,”arxivpreprintarxiv:1506.00019,2015,zacharyclipton,johnberkowitz,andcharleselkan,公開(kāi)了遞歸神經(jīng)網(wǎng)絡(luò)算法的實(shí)施方法。文獻(xiàn)“densecap:fullyconvolutionallocalizationnetworksfordensecaptioning,”arxivpreprintarxiv:1511.07571,2015,justinjohnson,andrejkarpathy,andlifei-fei,公開(kāi)了結(jié)合深度卷積神經(jīng)網(wǎng)絡(luò)算法與遞歸神經(jīng)網(wǎng)絡(luò)算法的實(shí)施方法。
具體地,本實(shí)施例中采用遞歸神經(jīng)網(wǎng)絡(luò)算法、并依據(jù)預(yù)設(shè)的真實(shí)圖像對(duì)細(xì)粒度圖像描述模型進(jìn)行第一數(shù)據(jù)訓(xùn)練的實(shí)施過(guò)程為:
1、依據(jù)預(yù)設(shè)的細(xì)粒度圖像描述模型、預(yù)設(shè)的真實(shí)圖像,獲取預(yù)設(shè)的真實(shí)圖像的第一語(yǔ)義描述信息。
圖2示例性示出了本實(shí)施例中第一數(shù)據(jù)訓(xùn)練實(shí)施過(guò)程中采用的真實(shí)圖像,如圖所示,黑色方框所示的圖像區(qū)域?qū)?yīng)的第一語(yǔ)義描述信息為“大象的耳朵”。
2、獲取對(duì)預(yù)設(shè)的真實(shí)圖像進(jìn)行人工標(biāo)注后,得到的第二語(yǔ)義描述信息。本實(shí)施例中對(duì)圖2所示的真實(shí)圖像進(jìn)行人工標(biāo)注,得到黑色方框所示的圖像區(qū)域?qū)?yīng)的第二語(yǔ)義描述信息為“大耳朵”。
3、計(jì)算第一語(yǔ)義描述信息和第二語(yǔ)義描述信息之間的第一損失函數(shù)值,依據(jù)第一損失函數(shù)值、反向傳播算法優(yōu)化細(xì)粒度圖像描述模型。本實(shí)施例中損失函數(shù)值指的是深度學(xué)習(xí)技術(shù)所公開(kāi)的損失函數(shù)的值。
具體地,本實(shí)施例中采用遞歸神經(jīng)網(wǎng)絡(luò)算法、并依據(jù)預(yù)設(shè)的篡改圖像對(duì)細(xì)粒度圖像描述模型進(jìn)行第二數(shù)據(jù)訓(xùn)練的實(shí)施過(guò)程為:
1、依據(jù)預(yù)設(shè)的細(xì)粒度圖像描述模型、預(yù)設(shè)的篡改圖像,獲取預(yù)設(shè)的篡改圖像的第三語(yǔ)義描述信息。
2、獲取對(duì)預(yù)設(shè)的篡改圖像進(jìn)行人工標(biāo)注后,得到的第四語(yǔ)義描述信息。
3、計(jì)算第三語(yǔ)義描述信息和第四語(yǔ)義描述信息之間的第二損失函數(shù)值,依據(jù)第二損失函數(shù)值、反向傳播算法優(yōu)化細(xì)粒度圖像描述模型。本實(shí)施例中第二數(shù)據(jù)訓(xùn)練過(guò)程與第一數(shù)據(jù)訓(xùn)練過(guò)程的實(shí)施過(guò)程相同,為了描述簡(jiǎn)潔,在此不再贅述。
綜上所述,本實(shí)施例中細(xì)粒度圖像描述模型包括預(yù)設(shè)的真實(shí)圖像對(duì)應(yīng)的語(yǔ)義描述信息、預(yù)設(shè)的篡改圖像對(duì)應(yīng)的語(yǔ)義描述信息。
步驟s102:對(duì)所獲取的語(yǔ)義描述信息與預(yù)設(shè)的反常規(guī)則庫(kù)進(jìn)行匹配:若預(yù)設(shè)的反常規(guī)則庫(kù)包含語(yǔ)義描述信息,則判斷待檢測(cè)圖像為篡改圖像。
本實(shí)施例中反常規(guī)則庫(kù)包括預(yù)設(shè)的多個(gè)語(yǔ)義描述信息,且所述的多個(gè)語(yǔ)義描述信息所包含的信息內(nèi)容為異常信息。其中:異常信息可以為不符合社會(huì)常識(shí)的信息,例如,桌子在天空飛行。
本實(shí)施例中通過(guò)細(xì)粒度圖像描述模型獲取待檢測(cè)圖像的語(yǔ)義描述信息,并依據(jù)反常規(guī)則庫(kù)對(duì)所獲取的語(yǔ)義描述信息進(jìn)行匹配,依據(jù)匹配結(jié)果判斷待檢測(cè)圖像是否為篡改圖像,可以不受底層像素級(jí)、格式級(jí)、場(chǎng)景級(jí)等反篡改工具的制約。
進(jìn)一步地,本實(shí)施例提供的一個(gè)優(yōu)選實(shí)施方案中,圖像篡改檢測(cè)方法可以按照下述步驟實(shí)施,具體為:
步驟s201:依據(jù)預(yù)設(shè)的細(xì)粒度圖像描述模型,獲取待檢測(cè)圖像的語(yǔ)義描述信息。本實(shí)施例中獲取待檢測(cè)圖像的語(yǔ)義描述信息與前述步驟s101中所公開(kāi)的方法相同,在此不再贅述。
步驟s202:對(duì)所獲取的待檢測(cè)圖像的語(yǔ)義描述信息進(jìn)行去重、選擇和標(biāo)準(zhǔn)化處理。本實(shí)施例中去重、選擇和標(biāo)準(zhǔn)化處理可以按照任一種排列順序依次進(jìn)行,例如,可以對(duì)語(yǔ)義描述信息依次進(jìn)行去重、選擇和標(biāo)準(zhǔn)化處理,也可以對(duì)語(yǔ)義描述信息依次進(jìn)行去重、標(biāo)準(zhǔn)化處理和選擇,還可以對(duì)語(yǔ)義描述信息依次進(jìn)行選擇、去重和標(biāo)準(zhǔn)化處理。
具體地,本實(shí)施例中去重的實(shí)施步驟為:
判斷所獲取的語(yǔ)義描述信息中是否存在包含同一信息內(nèi)容的多個(gè)語(yǔ)義描述信息:若存在,則去除包含該同一信息內(nèi)容的一個(gè)或多個(gè)語(yǔ)義描述信息,且保留一個(gè)包含該同一信息內(nèi)容的語(yǔ)義描述信息。即保留一個(gè)語(yǔ)義描述信息,刪除其他重復(fù)的語(yǔ)義描述信息。
具體地,本實(shí)施例中選擇的實(shí)施步驟為:
依據(jù)所獲取的語(yǔ)義描述信息的置信度由高到低的順序,選擇預(yù)設(shè)數(shù)量的語(yǔ)義描述信息。本實(shí)施例中假設(shè)預(yù)設(shè)數(shù)量為k,則選擇k個(gè)語(yǔ)義描述信息的過(guò)程可以為:將所獲取的語(yǔ)義描述信息按照對(duì)應(yīng)的置信度由高到低排列,然后選擇第1~k個(gè)語(yǔ)義描述信息。
具體地,本實(shí)施例中標(biāo)準(zhǔn)化處理的實(shí)施步驟為:
對(duì)所獲取的語(yǔ)義描述信息進(jìn)行標(biāo)準(zhǔn)化處理,包括:去除語(yǔ)義描述信息中包含的冠詞和形容詞,并將去除冠詞和形容詞后語(yǔ)義描述信息中的各單詞轉(zhuǎn)換為對(duì)應(yīng)的預(yù)設(shè)單詞。其中:預(yù)設(shè)單詞指的是單詞的基本形式,也可以描述為一個(gè)單詞所描述信息所屬的類別名稱。例如,折疊椅是一個(gè)固定的單詞,而折疊椅這個(gè)單詞的基本形式為“椅”,或者折疊椅所描述的可以折疊的椅子所屬的類別名稱為“椅”,因此本實(shí)施例中折疊椅對(duì)應(yīng)的預(yù)設(shè)單詞即為“椅”。
本實(shí)施例中假設(shè)語(yǔ)義描述信息所包含的信息內(nèi)容為一只黃色的小貓坐在撒哈拉沙漠上。去除語(yǔ)義描述信息中包含的冠詞和形容詞后剩余各單詞分別為貓、坐在、撒哈拉沙漠,將撒哈拉沙漠轉(zhuǎn)換為其預(yù)設(shè)單詞“沙漠”,可以得到標(biāo)準(zhǔn)化處理后的語(yǔ)義描述信息為“貓坐在沙漠”。
下面以圖3所示的待檢測(cè)圖像為例,對(duì)本實(shí)施例中圖像檢測(cè)方法的實(shí)施過(guò)程進(jìn)行說(shuō)明,如圖所示,該待檢測(cè)圖像所示畫面信息包括貓和沙漠,采用篡改圖像檢測(cè)方法對(duì)其進(jìn)行檢測(cè)的具體步驟為:
1、依據(jù)預(yù)設(shè)的細(xì)粒度圖像描述模型,獲取圖3的語(yǔ)義描述信息。
2、對(duì)步驟1得到的語(yǔ)義描述信息進(jìn)行去重、選擇和標(biāo)準(zhǔn)化處理。
圖4示例性示出了細(xì)粒度圖像描述模型的輸出結(jié)果示意圖,如圖所示,本實(shí)施例中選擇步驟中預(yù)設(shè)數(shù)量為5,即選擇5個(gè)置信度最高的語(yǔ)義描述信息,且各語(yǔ)義描述信息分別為第一圖像區(qū)域11、第二圖像區(qū)域12、第三圖像區(qū)域13、第四圖像區(qū)域14和第五圖像區(qū)域15對(duì)應(yīng)的語(yǔ)義描述信息。
為了描述簡(jiǎn)潔,本實(shí)施例中僅以第一圖像區(qū)域11對(duì)應(yīng)的語(yǔ)義描述信息為例進(jìn)行說(shuō)明。本實(shí)施例中經(jīng)細(xì)粒度圖像描述模型所得到的第一圖像區(qū)域11對(duì)應(yīng)的語(yǔ)義描述信息為“一只花貓坐在黃色的沙漠中”,對(duì)其進(jìn)行標(biāo)準(zhǔn)化處理可以得到第一圖像區(qū)域11對(duì)應(yīng)的語(yǔ)義描述信息為“貓坐在沙漠”。
3、將步驟2得到語(yǔ)義描述信息“貓坐在沙漠”與反常規(guī)則庫(kù)匹配,且匹配結(jié)果為反常規(guī)則庫(kù)包含語(yǔ)義描述信息“貓坐在沙漠”,因此可以判斷圖3為篡改圖像。
上述實(shí)施例中雖然將各個(gè)步驟按照上述先后次序的方式進(jìn)行了描述,但是本領(lǐng)域技術(shù)人員可以理解,為了實(shí)現(xiàn)本實(shí)施例的效果,不同的步驟之間不必按照這樣的次序執(zhí)行,其可以同時(shí)(并行)執(zhí)行或以顛倒的次序執(zhí)行,這些簡(jiǎn)單的變化都在本發(fā)明的保護(hù)范圍之內(nèi)。
基于與方法實(shí)施例相同的技術(shù)構(gòu)思,本發(fā)明實(shí)施例還提供了一種圖像篡改檢測(cè)裝置。下面結(jié)合附圖對(duì)該圖像篡改檢測(cè)裝置進(jìn)行具體說(shuō)明。
圖5示例性示出了本實(shí)施例中一種圖像篡改檢測(cè)裝置的結(jié)構(gòu),如圖所示,本實(shí)施例中圖像篡改檢測(cè)裝置可以包括信息獲取模塊21和信息匹配模塊22。其中,信息獲取模塊21可以配置為依據(jù)預(yù)設(shè)的細(xì)粒度圖像描述模型,獲取待檢測(cè)圖像的語(yǔ)義描述信息。信息匹配模塊22可以配置為對(duì)所獲取的語(yǔ)義描述信息與預(yù)設(shè)的反常規(guī)則庫(kù)進(jìn)行匹配:若預(yù)設(shè)的反常規(guī)則庫(kù)包含所述語(yǔ)義描述信息,則判斷待檢測(cè)圖像為篡改圖像。
進(jìn)一步地,本實(shí)施例中圖像篡改檢測(cè)裝置還可以包括下述結(jié)構(gòu),具體為:
圖6示例性示出了本實(shí)施例中另一種圖像篡改檢測(cè)裝置的結(jié)構(gòu),如圖所示,本實(shí)施例中圖像篡改檢測(cè)裝置還可以包括信息去重模塊23、信息選擇模塊24和信息處理模塊25。其中,信息去重模塊23可以配置為判斷信息獲取模塊所獲取的語(yǔ)義描述信息中是否存在包含同一信息內(nèi)容的多個(gè)語(yǔ)義描述信息:若存在,則去除包含該同一信息內(nèi)容的一個(gè)或多個(gè)語(yǔ)義描述信息,且保留一個(gè)包含該同一信息內(nèi)容的語(yǔ)義描述信息。信息選擇模塊24可以配置為依據(jù)信息獲取模塊所獲取的語(yǔ)義描述信息的置信度由高到低的順序,選擇預(yù)設(shè)數(shù)量的語(yǔ)義描述信息。信息處理模塊25可以配置為對(duì)信息獲取模塊所獲取的語(yǔ)義描述信息進(jìn)行標(biāo)準(zhǔn)化處理,包括:去除語(yǔ)義描述信息中包含的冠詞和形容詞,并將去除冠詞和形容詞后語(yǔ)義描述信息中的各單詞轉(zhuǎn)換為對(duì)應(yīng)的預(yù)設(shè)單詞。
進(jìn)一步地,本實(shí)施例中圖像篡改檢測(cè)裝置還可以包括下述結(jié)構(gòu),具體為:
圖7示例性示出了本實(shí)施例中又一種圖像篡改檢測(cè)裝置的結(jié)構(gòu),如圖所示,本實(shí)施例中圖像篡改檢測(cè)裝置還可以包括模型構(gòu)建模塊26和模型訓(xùn)練模塊27。
其中:
模型構(gòu)建模塊26可以配置為采用深度卷積神經(jīng)網(wǎng)絡(luò)算法、細(xì)粒度圖像分類方法構(gòu)建細(xì)粒度圖像描述模型。
模型訓(xùn)練模塊27可以配置為采用遞歸神經(jīng)網(wǎng)絡(luò)算法,并依據(jù)預(yù)設(shè)的真實(shí)圖像、預(yù)設(shè)的篡改圖像依次對(duì)細(xì)粒度圖像描述模型進(jìn)行第一數(shù)據(jù)訓(xùn)練和第二數(shù)據(jù)訓(xùn)練。本實(shí)施例中模型訓(xùn)練模塊27可以包括第一模型訓(xùn)練單元271和第二模型訓(xùn)練單元272。
圖8示例性示出了本實(shí)施例中第一模型訓(xùn)練單元271的結(jié)構(gòu),如圖所示,本實(shí)施例中第一模型訓(xùn)練單元271可以包括第一信息獲取子單元2711、第二信息獲取子單元2712和第一模型優(yōu)化子單元2713。其中,第一信息獲取子單元2711可以配置為依據(jù)預(yù)設(shè)的細(xì)粒度圖像描述模型、預(yù)設(shè)的真實(shí)圖像,獲取預(yù)設(shè)的真實(shí)圖像的第一語(yǔ)義描述信息。第二信息獲取子單元2712可以配置為獲取對(duì)預(yù)設(shè)的真實(shí)圖像進(jìn)行人工標(biāo)注后,得到的第二語(yǔ)義描述信息。第一模型優(yōu)化子單元2713可以配置為計(jì)算所述第一語(yǔ)義描述信息和第二語(yǔ)義描述信息之間的第一損失函數(shù)值,依據(jù)第一損失函數(shù)值、反向傳播算法優(yōu)化細(xì)粒度圖像描述模型。
圖9示例性示出了本實(shí)施例中第二模型訓(xùn)練單元272的結(jié)構(gòu),如圖所示,本實(shí)施例中第二模型訓(xùn)練單元272可以包括第三信息獲取子單元2721、第四信息獲取子單元2722和第二模型優(yōu)化子單元2723。其中,第三信息獲取子單元2721可以配置為依據(jù)預(yù)設(shè)的細(xì)粒度圖像描述模型、預(yù)設(shè)的篡改圖像,獲取預(yù)設(shè)的篡改圖像的第三語(yǔ)義描述信息。第四信息獲取子單元2722可以配置為獲取對(duì)預(yù)設(shè)的篡改圖像進(jìn)行人工標(biāo)注后,得到的第四語(yǔ)義描述信息。第二模型優(yōu)化子單元可以配置為計(jì)算第三語(yǔ)義描述信息和第四語(yǔ)義描述信息之間的第二損失函數(shù)值,依據(jù)第二損失函數(shù)值、反向傳播算法優(yōu)化細(xì)粒度圖像描述模型。
上述圖像篡改檢測(cè)裝置實(shí)施例可以用于執(zhí)行上述圖像篡改檢測(cè)方法實(shí)施例,其技術(shù)原理、所解決的技術(shù)問(wèn)題及產(chǎn)生的技術(shù)效果相似,所屬技術(shù)領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述的圖像篡改檢測(cè)的具體工作過(guò)程及有關(guān)說(shuō)明,可以參考前述圖像篡改檢測(cè)方法實(shí)施例中的對(duì)應(yīng)過(guò)程,在此不再贅述。
本領(lǐng)域技術(shù)人員可以理解,上述圖像篡改檢測(cè)裝置還包括一些其他公知結(jié)構(gòu),例如處理器、控制器、存儲(chǔ)器等,其中,存儲(chǔ)器包括但不限于隨機(jī)存儲(chǔ)器、閃存、只讀存儲(chǔ)器、可編程只讀存儲(chǔ)器、易失性存儲(chǔ)器、非易失性存儲(chǔ)器、串行存儲(chǔ)器、并行存儲(chǔ)器或寄存器等,處理器包括但不限于cpld/fpga、dsp、arm處理器、mips處理器等,為了不必要地模糊本公開(kāi)的實(shí)施例,這些公知的結(jié)構(gòu)未在圖5~9中示出。
應(yīng)該理解,圖5~9中的各個(gè)模塊的數(shù)量?jī)H僅是示意性的。根據(jù)實(shí)際需要,各模塊可以具有任意的數(shù)量。
本領(lǐng)域技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過(guò)程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的所有特征以及如此公開(kāi)的任何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述,本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來(lái)代替。
基于與方法實(shí)施例相同的技術(shù)構(gòu)思,本發(fā)明實(shí)施例還提供了另一種圖像篡改檢測(cè)裝置,該圖像篡改檢測(cè)裝置可以包括處理器和存儲(chǔ)設(shè)備。其中,處理器可以用于執(zhí)行各指令。存儲(chǔ)設(shè)備可以用于存儲(chǔ)多條指令,這些指令適用于由處理器加載并執(zhí)行上述圖像篡改檢測(cè)方法中的各步驟。
上述圖像篡改檢測(cè)裝置實(shí)施例可以用于執(zhí)行上述圖像篡改檢測(cè)方法實(shí)施例,其技術(shù)原理、所解決的技術(shù)問(wèn)題及產(chǎn)生的技術(shù)效果相似,所屬技術(shù)領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述的圖像篡改檢測(cè)的具體工作過(guò)程及有關(guān)說(shuō)明,可以參考前述圖像篡改檢測(cè)方法實(shí)施例中的對(duì)應(yīng)過(guò)程,在此不再贅述。
此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在本發(fā)明的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來(lái)使用。
本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(dsp)來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的服務(wù)器、客戶端中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,pc程序和pc程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在pc可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。
應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說(shuō)明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的pc來(lái)實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過(guò)同一個(gè)硬件項(xiàng)來(lái)具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
至此,已經(jīng)結(jié)合附圖所示的優(yōu)選實(shí)施方式描述了本發(fā)明的技術(shù)方案,但是,本領(lǐng)域技術(shù)人員容易理解的是,本發(fā)明的保護(hù)范圍顯然不局限于這些具體實(shí)施方式。在不偏離本發(fā)明的原理的前提下,本領(lǐng)域技術(shù)人員可以對(duì)相關(guān)技術(shù)特征作出等同的更改或替換,這些更改或替換之后的技術(shù)方案都將落入本發(fā)明的保護(hù)范圍之內(nèi)。