本發(fā)明涉及數(shù)字圖像隱寫分析技術(shù)領(lǐng)域,更具體地,涉及一種基于卷積神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像隱寫分析方法。
背景技術(shù):
數(shù)字圖像隱寫分析是信息安全領(lǐng)域一個(gè)非常重要的研究方向。所謂隱寫分析,是指采用一定的方法實(shí)現(xiàn)對運(yùn)用隱寫算法嵌入了秘密信息的圖像進(jìn)行檢測的技術(shù)。由于隱寫算法在設(shè)計(jì)上著重考慮了嵌入信息后對原始圖像所造成的影響,因而對于載密圖像來說,無論在視覺上還是統(tǒng)計(jì)上,它都是與原始圖像非常接近的。為了防止隱寫技術(shù)被運(yùn)用于不法途徑,需要有行之有效的方法對這種隱秘通信行為進(jìn)行檢測。高效的隱寫分析方法,能夠從圖像中提取到區(qū)分度高的統(tǒng)計(jì)特征,從而能夠捕獲到隱寫對圖像進(jìn)行修改時(shí)遺留的痕跡。
目前來說,圖像隱寫分析方法主要有兩大類,分別是基于統(tǒng)計(jì)信號檢測的方法和基于特征提取和機(jī)器學(xué)習(xí)的方法。前者首先是對原始圖像數(shù)據(jù)的統(tǒng)計(jì)分布進(jìn)行建模,再利用假設(shè)檢驗(yàn)來對待檢圖像進(jìn)行判定。為了使得該方法在數(shù)學(xué)上易于求解,所采用的原始圖像模型必須足夠的簡單,這在很大程度上限制了模型的準(zhǔn)確性。由于簡單的模型無法反映出圖像像素間復(fù)雜的相關(guān)性,因而這類方法目前大多用于檢測較為簡單的隱寫算法,如lsb替換和lsb匹配。對于現(xiàn)代自適應(yīng)圖像隱寫算法,例如wow和s-uniward,這種隱寫分析方法難以獲得滿意的檢測性能。因?yàn)閷@些自適應(yīng)隱寫算法的檢測要求所采用的模型能夠?qū)︵徲蛳袼亻g的復(fù)雜統(tǒng)計(jì)相關(guān)性進(jìn)行表征。此時(shí),由于自然圖像內(nèi)容上的高度不穩(wěn)定,想要估計(jì)這些統(tǒng)計(jì)模型的參數(shù)是不切實(shí)際的。
后一種基于特征提取和機(jī)器學(xué)習(xí)的隱寫分析方法,則是目前現(xiàn)代隱寫分析的主流算法。這種方法無須考慮原始圖像的潛在分布模型,它直接把原始圖像和載密圖像的檢測化為一個(gè)二分類問題,并通過機(jī)器學(xué)習(xí)的方式來優(yōu)化求解。這種類型的算法有著同樣的一套檢測流程:殘差計(jì)算、特征提取以及二元分類。其中,最為重要的步驟在于特征提取。一個(gè)檢測方法的優(yōu)劣,很大程度上取決于特征構(gòu)建的過程。只有很好地發(fā)掘出原始圖像與載密圖像之間的差別,并構(gòu)造出具有高度區(qū)分性的特征,才能使得最后使用機(jī)器學(xué)習(xí)的方法進(jìn)行二元分類時(shí)獲得滿意的結(jié)果。目前性能領(lǐng)先的隱寫分析算法,采用集合多種殘差并在此基礎(chǔ)上構(gòu)建共生矩陣對殘差的聯(lián)合分布進(jìn)行表征,從而獲得了高達(dá)30000維以上的特征。從隱寫分析的角度來看,為了獲得對原始圖像更加完全的統(tǒng)計(jì)描述,使用高維的特征是不可避免的。這就意味著有效的特征變得越來越復(fù)雜,而依靠人工經(jīng)驗(yàn)啟發(fā)式地設(shè)計(jì)這些特征則變得愈發(fā)困難。與此同時(shí),在這種隱寫分析框架下,特征提取與分類器訓(xùn)練是各自獨(dú)立的。也就是說,分類器訓(xùn)練的結(jié)果難以反饋用于指導(dǎo)特征的提取過程,兩者無法同時(shí)進(jìn)行優(yōu)化。
另一方面,卷積神經(jīng)網(wǎng)絡(luò)是近年來深度學(xué)習(xí)領(lǐng)域中最為常見的模型之一。該模型能夠從高維的輸入圖像中提取出有效的高層特征表達(dá),因此在機(jī)器視覺領(lǐng)域方面有著廣泛的應(yīng)用。由于隱寫信號與一般的機(jī)器視覺任務(wù)中的有效信號存在很大的差異,因此將卷積神經(jīng)網(wǎng)絡(luò)用于隱寫分析還需要根據(jù)隱寫分析的技術(shù)特點(diǎn)對現(xiàn)有的網(wǎng)絡(luò)進(jìn)行優(yōu)化改進(jìn)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明為解決以上現(xiàn)有技術(shù)提供的方法在進(jìn)行隱寫分析時(shí)所存在的分析性能低下或有效特征設(shè)計(jì)復(fù)雜的技術(shù)缺陷,提供了一種基于卷積神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像隱寫分析方法。
為實(shí)現(xiàn)以上發(fā)明目的,采用的技術(shù)方案是:
一種基于卷積神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像隱寫分析方法,包括以下步驟:
s1.構(gòu)建由多層卷積層串聯(lián)形成的卷積神經(jīng)網(wǎng)絡(luò);
s2.對于第一層卷積層,采用高通濾波器對其卷積核和偏置進(jìn)行初始化,然后采用截?cái)嗑€性單元激活函數(shù)作為卷積層的激活函數(shù);
s3.將數(shù)字圖像輸入至卷積神經(jīng)網(wǎng)絡(luò)中,卷積神經(jīng)網(wǎng)絡(luò)輸出其是否經(jīng)過隱寫的結(jié)果。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
本發(fā)明提供的基于卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像隱寫分析無需進(jìn)行復(fù)雜特征的設(shè)計(jì),在進(jìn)行檢測時(shí),輸入圖像經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)后能夠直接被映射為類標(biāo),從而直接判斷出圖像是否存在隱秘信息。與傳統(tǒng)的隱寫分析方法不同的是,卷積神經(jīng)網(wǎng)絡(luò)是作為一個(gè)整體在訓(xùn)練的過程中對模型的性能進(jìn)行優(yōu)化,從而使得卷積神經(jīng)網(wǎng)絡(luò)在區(qū)分載體圖像和載密圖像上獲得更高的準(zhǔn)確率。
附圖說明
圖1為卷積操作的示意圖。
圖2為池化操作卷積操作的示意圖。
圖3為卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意圖。
圖4為relu激活函數(shù)和tlu激活函數(shù)的函數(shù)圖像的對比圖。
具體實(shí)施方式
附圖僅用于示例性說明,不能理解為對本專利的限制;
以下結(jié)合附圖和實(shí)施例對本發(fā)明做進(jìn)一步的闡述。
實(shí)施例1
如圖3所示,卷積神經(jīng)網(wǎng)絡(luò)由多個(gè)串聯(lián)起來的卷積層組成,后一層的輸入是前一層的輸出。而每個(gè)卷積層包含以下三個(gè)基本操作:卷積、非線性激活、池化。
卷積操作的過程如圖1所示。對輸入的數(shù)據(jù),采用一個(gè)預(yù)先定義大小的卷積核進(jìn)行卷積,便能夠得到對應(yīng)的卷積特征圖。一個(gè)卷積核對應(yīng)一張?zhí)卣鲌D,當(dāng)使用多個(gè)卷積核時(shí),則會輸出多張?zhí)卣鲌D。
非線性激活,則是對于卷積得到的特征圖,使用一個(gè)非線性的激活函數(shù)將其進(jìn)行逐點(diǎn)的變換。一個(gè)常用的激活函數(shù)為校正線性單元(rectifiedlinearunit,relu),其定義為:
f(x)=max(0,x)
即保留所有大于0的信號,并將所有負(fù)值信號設(shè)置為0。
池化操作的計(jì)算過程如圖2所示。常見的池化有兩種:最大值池化和平均值池化。最大值池化提取出窗口中的最大值作為輸出,而平均值池化則將窗口內(nèi)所有值的平均數(shù)作為輸出。
三種操作組合在一起則形成了一個(gè)卷積層。因此,對于一個(gè)有著多個(gè)卷積層的卷積神經(jīng)網(wǎng)絡(luò)來說,令f(n)(x)表示第n個(gè)卷積層的輸出,則有:
f(n)(x)=pooling(f(n)(f(n-1)(x)*w(n)+b(n)))(2)
其中,f(n-1)(x)為第n-1層的輸出,f(0)(x)=x為輸入圖像?!?’表示卷積操作,w(n)為該卷積層中使用的卷積核,b(n)為偏置,f(n)(·)表示該層的激活函數(shù),pooling(·)為池化操作。需要注意的是,池化和非線性操作在一個(gè)卷積層中是可選的。
經(jīng)過恰當(dāng)?shù)脑O(shè)計(jì),將多個(gè)卷積層串聯(lián)在一起,便可以得到一個(gè)卷積神經(jīng)網(wǎng)絡(luò)。如圖3所示,是本發(fā)明中提出的用于數(shù)字圖像隱寫分析的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。該網(wǎng)絡(luò)一共有10層,其中前9層為卷積層,第10層為全連接層。卷積層的方框內(nèi)顯示了相關(guān)的參數(shù)設(shè)置,“conv”表示卷積操作,其下的數(shù)字表示所使用的卷積核的尺寸,“stride”表示卷積核或池化窗口的滑動步長,tlu和relu表示所使用的激活函數(shù)。下面對該網(wǎng)絡(luò)中的關(guān)鍵技術(shù)進(jìn)行說明。
對于一個(gè)卷積神經(jīng)網(wǎng)絡(luò)來說,公式(2)中的w(n)和b(n)需要通過訓(xùn)練來不斷更新優(yōu)化。一般而言,w(n)采用隨機(jī)數(shù)進(jìn)行初始化。但是,這種初始化策略在隱寫分析中難以使用,因?yàn)殡[寫信號的信噪比極低,采用隨機(jī)初始化的方式,卷積神經(jīng)網(wǎng)絡(luò)無法從輸入圖像中提取到有效的信號。因此,為了提高信噪比,壓縮圖像內(nèi)容,對第一層的權(quán)值,采用高通濾波器進(jìn)行初始化,從而獲得圖像的噪聲殘差。根據(jù)現(xiàn)有的隱寫分析研究成果,較為有效的高通濾波器可以有以下幾類:
一階:k1=[-11];
二階:k2=[1-21];
三階:k2=[1-33-1];
square3×3:
edge3×3:
square5×5:
edge5×5:
這些濾波器及其旋轉(zhuǎn)后的副本,在周圍添加0使其尺寸擴(kuò)充至5×5,一共可以得到30個(gè)不同的高通濾波器(一階:8個(gè),二階:4個(gè),三階:8個(gè),square3×3:1個(gè),edge3×3:4個(gè),square5×5:1個(gè),edge5×5:4個(gè))。此時(shí),對于卷積神經(jīng)網(wǎng)絡(luò)第一層的權(quán)值,有
卷積層的計(jì)算中,需要經(jīng)過一個(gè)非線性函數(shù)映射,從而增加網(wǎng)絡(luò)的非線性表達(dá)能力。目前來說,最為常見的激活函數(shù)為校正線性單元relu。此激活函數(shù)非常適用于高信噪比情況下的信號特征提取,使神經(jīng)網(wǎng)絡(luò)中各個(gè)節(jié)點(diǎn)選擇性地對有效的信號進(jìn)行響應(yīng),因而可以得到稀疏的特征。但是,對于隱寫分析而言,由于隱寫過程相當(dāng)于對原始圖像添加高頻的低幅值噪聲,因此隱寫信號的信噪比極低,故而需要采用更加合適的激活函數(shù)??紤]到隱寫信號總是在[-1,1]之間,因此,為了進(jìn)一步提高隱寫信號的信噪比,將傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中使用的relu激活函數(shù)改進(jìn)為截?cái)嗑€性單元(tlu)激活函數(shù),其定義如下:
其中,t為截?cái)嗟拈撝?,可通過實(shí)驗(yàn)進(jìn)行確定。relu和tlu的對比如圖4所示。使用tlu能夠幫助卷積神經(jīng)網(wǎng)絡(luò)適應(yīng)隱寫信號的分布,并迫使它學(xué)習(xí)到更加有效的高通濾波器。
實(shí)施例2
本發(fā)明所使用的卷積神經(jīng)網(wǎng)絡(luò),無須進(jìn)行復(fù)雜的人工特征設(shè)計(jì),并且能夠在一套框架內(nèi)完成特征的提取和分類,使得各個(gè)步驟能夠同時(shí)進(jìn)行優(yōu)化,大大降低了隱寫分析算法設(shè)計(jì)的難度。為了驗(yàn)證所提出的算法性能,本發(fā)明基于深度學(xué)習(xí)框架caffe實(shí)現(xiàn)了所提出的算法。以下將所提出的網(wǎng)絡(luò)稱為tlu-cnn。所有實(shí)驗(yàn)均在隱寫分析常用的圖像庫bossbase和bows2上進(jìn)行。為了能夠用gpu進(jìn)行計(jì)算,訓(xùn)練和測試的圖像尺寸均從512×512縮放為256×256。
本實(shí)施例選擇了目前領(lǐng)先的數(shù)字圖像隱寫分析算法——srm來作為對比,在三種目前最為安全的三種自適應(yīng)隱寫算法(wow、s-uniward、hill)上,得到的實(shí)驗(yàn)結(jié)果如表1所示。
表1srm和tlu-cnn(t=3)在三種隱寫算法那上的檢測錯(cuò)誤率
從表1可以看到,本發(fā)明所提出的方法在這三種算法的兩種嵌入容量下,其檢測錯(cuò)誤率都顯著低于srm特征集。
顯然,本發(fā)明的上述實(shí)施例僅僅是為清楚地說明本發(fā)明所作的舉例,而并非是對本發(fā)明的實(shí)施方式的限定。對于所屬領(lǐng)域的普通技術(shù)人員來說,在上述說明的基礎(chǔ)上還可以做出其它不同形式的變化或變動。這里無需也無法對所有的實(shí)施方式予以窮舉。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明權(quán)利要求的保護(hù)范圍之內(nèi)。