本發(fā)明涉及圖像處理,尤其涉及用于不匹配隱寫分析的可判別性中間域訓練方法及裝置。
背景技術:
1、圖像隱寫術是指通過稍微修改像素值或頻率系數(shù),將秘密數(shù)據(jù)隱藏到覆蓋圖像中;圖像隱寫術的對抗者是圖像隱寫分析,它試圖揭示可疑圖像中隱藏數(shù)據(jù)的存在。
2、圖像隱寫分析的發(fā)展從通過傳統(tǒng)的手工制作的特征統(tǒng)計差異來進行判別,傳統(tǒng)的基于手工特征的方法強烈依賴于大量的特征構建經驗,隨著深度學習的流行,且基于深度學習的方法消除了對手工特征的需要,同時提升了隱寫分析的性能,因此大量的基于深度學習的隱寫分析方法被提出。
3、雖然在實驗室的環(huán)境下,基于深度學習的隱寫分析方法性能達到了很高的檢測率,但是現(xiàn)實生活充滿了不確定性,實驗室的環(huán)境過于理想,當基于深度學習的隱寫分析方法使用的測試集與訓練集的分布不同時,通常情況下對于不同分布測試集的檢測率有著大幅度的下降,而現(xiàn)實生活中通常檢測的圖片一般是不容易與訓練集的分布相同的,因此這個問題需要我們去進行克服,這種情況我們稱其為載體源失配(csm)。
4、目前已經有相關的方法被提出來解決csm情況,例如isnet使用漸進中間域來做橋梁,使得分類器逐漸從源域適應到目標域,而isnet對于中間域的混合區(qū)域部分生成依靠的是伯努利分布的隨機采樣,在將隨機采樣的點擴大為邊長一樣的正方形區(qū)域,該方法忽略了隱寫術在圖片內容中嵌入隱藏信號的特性,目前流行的自適應隱寫術會將隱藏信息嵌入到圖像紋理復雜的區(qū)域,其他紋理簡單的區(qū)域存在的隱寫信號較少或沒有,通過隨機采樣的方法容易丟失隱寫信號密集的區(qū)域且容易導致混合區(qū)域中包含了大量不存在隱寫信號或者隱寫信號少的圖片內容,這種情況會導致生成的中間域的可判別性較低,對分類器的訓練造成不利的影響。
技術實現(xiàn)思路
1、本發(fā)明的目的在于提供用于不匹配隱寫分析的可判別性中間域訓練方法及裝置。
2、本發(fā)明采用的技術方案是:
3、用于不匹配隱寫分析的可判別性中間域訓練方法,中間域網絡包括gdmr模塊、dilm模塊、特征提取器g(·)和分類器c(·),特征提取器g(·)和分類器c(·)組成骨干網絡srnet,且在域適應時特征提取器g(·)加載預訓練的權重,分類器c(·)則初始化權重;訓練方法為:目標域圖片先經過特征提取器g(·)提取出特征圖后輸入到gdmr模塊中,gdmr模塊對接收的特征圖進行最大池化處理得到隱寫注意圖,并通過區(qū)域級混合比λ來控制中間域圖像中混合區(qū)域的大小,以便增大混合區(qū)域中隱寫信號的密度;生成混合區(qū)域后同源域圖片和目標域圖片輸入到dilm模塊中,使用像素級混合比γ來控制局部圖像的混合比例,最后得到中間域圖片;最后將中間域圖片、源域圖片和目標域圖片共同輸入到特征提取器g(·)和分類器c(·)中,逐漸使分類器適應目標域。
4、進一步地,訓練方法包括以下步驟:
5、步驟1:將數(shù)量為bs的有標簽源域圖片和bt的無標簽目標域圖片輸入到隱寫分析網絡srnet中,輸出源域圖片的特征圖fsi和預測標簽以及目標域圖片的特征圖ftj和預測標簽其中表示數(shù)量為bs的源域圖片中第i張圖片,表示源域圖片中第i張圖片的標簽,表示數(shù)量為bt的目標域圖片中第j張圖片;0代表載體圖像,1代表載密圖像;
6、步驟2:將目標域特征圖ftj輸入到gdmr中獲取隱寫關注圖通過與區(qū)域級混合比λ生成與特征圖尺寸相同的特征級二進制掩碼最后將特征級二進制掩碼上采樣為圖像級二進制掩碼oj,二進制掩碼oj包含k個大小相同的且元素值均為1的區(qū)域;
7、步驟3:將二進制掩碼oj、源域圖片和目標域圖片同時輸入到dilm模塊中,將oj與和逐元素相乘得到源域與目標域需要進行混合操作的區(qū)域,而1-oj與逐元素相乘得到源域圖片的保留區(qū)域;其中1代表與圖片尺寸大小相同的元素值全為1的矩陣;
8、步驟4:利用像素級混合比γ來作為區(qū)域級混合比λ的補充,按照γ的大小來調節(jié)目標域圖片進行混合操作的區(qū)域部分對生成的中間域圖片的影響。
9、步驟5:將源域圖片保留區(qū)域與利用γ進行混合的混合區(qū)域進行相加得到了完整的中間域圖片
10、步驟6:按照中間域圖片的構成來生成中間域的對應標簽
11、步驟7:通過交叉熵損失函數(shù)計算源域與中間域的損失,并相加得到總損失函數(shù);
12、步驟8:通過總損失函數(shù)訓練隱寫分析網絡。
13、進一步地,步驟2的二進制掩碼oj的生成步驟如下:
14、步驟2-1:對目標域的特征圖ftj進行通道上的最大池化操作得到隱寫關注圖中每個位置的像素值代表網絡對對應位置的關注程度,即代表對應位置的圖片中所在區(qū)域的隱寫信號的密度;
15、步驟2-2:找出中像素值最大的k個位置,k=round(λ×h×w),h與w分別是特征圖的高和寬,round(·)代表四舍五入操作,λ服從beta分布且λ~beta(t,1+t),其中,t代表當前訓練次數(shù)與總訓練次數(shù)的比值;
16、步驟2-3:將一個與特征圖相同尺寸大小的二進制掩碼所對應的k個位置的元素值變?yōu)?,其他位置變?yōu)?,得到特征級二進制掩碼
17、步驟2-4:通過使用“nearest”的上采樣方法對特征級二進制掩碼進行上采樣得到二進制掩碼oj。
18、進一步地,步驟3中混合區(qū)域與保留區(qū)域的生成步驟如下:
19、步驟3-1:利用二進制掩碼oj來生成源域圖片的混合區(qū)域和目標域圖片的混合區(qū)域,公式分別為和其中⊙是逐元素乘法;
20、步驟3-2:利用1-oj得到源域的保留區(qū)域,對應的公式為進一步地,步驟4中的γ同樣服從beta分布,且γ~beta(1-t+ε,t+ε),其中ε是控制γ所服從的beta分布保持單調下降的趨勢,且能夠有效的防止beta參數(shù)為0,在實驗中設置為0.5;
21、t代表當前訓練次數(shù)與總訓練次數(shù)的比值。
22、進一步地,步驟5中間域圖片的生成步驟如下:
23、步驟5-1:先對混合區(qū)域進行像素級混合,對應的公式為
24、步驟5-2:將混合后的區(qū)域與保留區(qū)域相加得到中間域圖片對應的公式為
25、進一步地,步驟6中對于中間域圖片的標簽的生成步驟如下:
26、步驟6-1:先生成混合區(qū)域的標簽,對應的公式為
27、步驟6-2:再計算保留區(qū)域的標簽,對應的公式為
28、步驟6-3:最后將兩個區(qū)域的標簽加起來得到中間域圖片的標簽,公式為
29、進一步地,總的損失函數(shù)為源域的交叉熵損失和中間域的交叉熵損失,總的交叉熵損失為:
30、
31、其中,bs為輸入的源域圖片數(shù)量,ω是權重參數(shù),實驗中設置為0.8,lce(·)是交叉熵損失函數(shù),y與分別代表真實標簽和預測標簽。
32、本發(fā)明還公開了用于不匹配隱寫分析的可判別性中間域訓練裝置,包括處理器和存儲器,存儲器中存儲有計算機指令,處理器用于執(zhí)行存儲器中存儲的計算機指令,當計算機指令被處理器執(zhí)行時裝置實現(xiàn)所述的用于不匹配隱寫分析的可判別性中間域訓練方法所實現(xiàn)的步驟。
33、本發(fā)明采用以上技術方案,提出了gdmr模塊和dlim模塊,通過針對隱寫術的特性,使用隱寫關注圖來尋找隱寫信號密集的區(qū)域,再利用服從beta分布的λ和γ來協(xié)作控制中間域圖片中混合區(qū)域上隱寫信號更為密集和減少隱寫信號較少或沒有的區(qū)域對分類器的影響,從而生成了更具有可判別性的中間域作為橋梁來橋接域差異較大的源域與目標域,使得分類器能夠更好的適應到目標域,增強網絡的泛化能力,達到緩解csm情況的目的。