一種用于文檔類圖像可視水印的擦除方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)字水印以及圖像去噪、圖像修復(fù)技術(shù)領(lǐng)域,具體是一種用于文檔類 圖像可視水印的擦除方法。
【背景技術(shù)】
[0002] 數(shù)字水印技術(shù)的主要思想是將諸如序列號、代碼或者圖標(biāo)等標(biāo)識信息嵌入圖像、 音頻或視頻等數(shù)字載體中,達(dá)到版權(quán)保護(hù)的目的。這些標(biāo)識信息就稱為數(shù)字水印。然而,在 一些特殊情況下,需要一定的技術(shù)將數(shù)字媒介的水印擦除掉,例如,水印版權(quán)已過期,但嵌 有水印的產(chǎn)品依然具有存在和使用價值。此時水印設(shè)計單位已不再提供技術(shù)支持和對數(shù)字 水印擦除技術(shù)純粹的科學(xué)研宄;又如,水印設(shè)計單位需要進(jìn)行水印的魯棒性測試。水印擦除 技術(shù)在這些應(yīng)用背景下應(yīng)運而生。
[0003] 在圖像中嵌入水印信息可以認(rèn)為是對原始圖像人為的加入噪聲,從而得到一幅 "含有噪聲"的圖片??梢越梃b在圖像去噪領(lǐng)域的經(jīng)典方法來擦除水印,將水印擦除后,圖片 內(nèi)容會受損丟失,需要采用圖像修復(fù)技術(shù)來進(jìn)行圖像的修復(fù)。
[0004] 目前市面上對于自然圖像可視水印擦除軟件有很多,譬如光影魔術(shù)手、Photoshop 等圖像處理軟件。在可查詢的方法中,有些采用視頻作為載體,在發(fā)送端,改變可視水印的 每個DCT系數(shù),然后將改變后的每個DCT系數(shù)圖像加到視頻數(shù)據(jù)的DCT系數(shù)上,含有水印的 視頻數(shù)據(jù)通過廣播網(wǎng)傳輸?shù)浇邮斩?,供接收端預(yù)覽;接收端與發(fā)送端交互;用戶在接收端 利用接收到的水印密鑰來擦除可視水印,恢復(fù)高質(zhì)量的視頻數(shù)據(jù)。
[0005]而現(xiàn)如今,在各種應(yīng)用平臺中,將word、pdf等文字文檔信息拍攝成圖片的場景廣 泛可見,在這些文檔類圖像添加可視水印的場景也很多。市面上針對文檔類圖像的可視水 印的擦除軟件卻很少。相比于自然圖像的水印擦除,文檔類圖像的水印擦除不僅需要視覺 上使得原可視水印不可見,同時需要高保真度地維持原水印區(qū)域背景文字的上下文語義可 讀性。而以往針對自然圖像和視頻幀水印擦除的方法,不適合文檔類圖像處理。由此使得 研宄文檔類圖像可視水印擦除方法具有比較不錯的產(chǎn)品轉(zhuǎn)化空間和應(yīng)用前景。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的目的在于提供一種用于文檔類圖像可視水印的擦除方法,該方法能夠應(yīng) 用于word、pdf等文檔類圖像(非原word、pdf文檔)上的可視水印擦除,譬如文檔版權(quán)標(biāo) 識、公司logo或單位公章類水印以及一些個性化的文檔水印等的擦除,同時可以高保真度 地維持原水印區(qū)域背景文字的上下文語義可讀性,能夠最大程度上恢復(fù)原始背景文字。
[0007] 本發(fā)明的技術(shù)方案為:
[0008] 一種用于文檔類圖像可視水印的擦除方法,包括以下步驟:
[0009] (1)對目標(biāo)圖像進(jìn)行二值化預(yù)處理,得到特征圖像,所述目標(biāo)圖像為嵌入可視水印 的待修復(fù)文檔類圖像;
[0010] (2)確定目標(biāo)圖像和特征圖像的水印區(qū)域和非水印區(qū)域;
[0011] (3)分別將目標(biāo)圖像和特征圖像的非水印區(qū)域劃分成若干個重疊的分塊,并對每 個分塊進(jìn)行采樣,得到目標(biāo)圖像非水印區(qū)域分塊樣本集Xb和特征圖像非水印區(qū)域分塊樣本 集Yf:
[0012] Xb= [x !,i = 1,2,…,m]
[0013] Yf= [y p i = 1,2,…,m]
[0014] 其中,Xi表示由目標(biāo)圖像非水印區(qū)域每個分塊的像素組成的列向量,
[0015] yi表示由特征圖像非水印區(qū)域每個分塊的像素組成的列向量;
[0016] (4)構(gòu)建稀疏表不板型:
[0018] 其中,
Db表示目標(biāo)圖像非水印區(qū)域分塊對應(yīng)的字典,Df 表示特征圖像非水印區(qū)域分塊對應(yīng)的字典,Z表示懲罰項,X表示正則參數(shù),df:表示護(hù)中 的每個原子;
[0019] (5)利用字典學(xué)習(xí)的方法對構(gòu)建的稀疏表示模型進(jìn)行優(yōu)化,得到壓縮的Db和Df; [0020] (6)根據(jù)#與Df的相似匹配度,自適應(yīng)地采用字典相似塊擦除算法或局部擦除算 法來擦除目標(biāo)圖像中的可視水印。
[0021] 所述的用于文檔類圖像可視水印的擦除方法,所述步驟(2)還包括按照以下步驟 確定分塊大?。?br>[0022] (21)采用形態(tài)學(xué)連通度方法檢測特征圖像的背景文字大??;
[0023] (22)按照背景文字大小確定分塊大小。
[0024] 所述的用于文檔類圖像可視水印的擦除方法,所述步驟(6)包括:
[0025] (31)計算013與Df之間的歐氏距離;
[0026] (32)判斷計算得到的歐氏距離是否小于預(yù)設(shè)閾值,若是,則采用字典相似塊擦除 算法來擦除目標(biāo)圖像中的可視水印,若否,則采用局部擦除算法來擦除目標(biāo)圖像中的可視 水印。
[0027] 所述的用于文檔類圖像可視水印的擦除方法,所述步驟(6)中,采用字典相似塊 擦除算法來擦除目標(biāo)圖像中的可視水印,包括:
[0028] (41)分別將目標(biāo)圖像和特征圖像的水印區(qū)域劃分成若干個非重疊的分塊,并對每 個分塊進(jìn)行采樣,得到目標(biāo)圖像水印區(qū)域分塊樣本集X'b和特征圖像水印區(qū)域分塊樣本集 Yrf:
[0029] X'b=[x' j,j=l,2,...,n]
[0030] Y'f=[y1 j,j = l,2,...,n]
[0031] 其中,x'」表示由目標(biāo)圖像水印區(qū)域每個分塊的像素組成的列向量,y'」表示由 特征圖像水印區(qū)域每個分塊的像素組成的列向量;
[0032] (42)對特征圖像水印區(qū)域的各個分塊求解如下優(yōu)化方程,得到其對應(yīng)的稀疏表示 系數(shù):
[0033] min | | a』| | A | | e | |!,s. t. y ' 』=D f a j+e
[0034] 其中,a」表示y'」的稀疏表示系數(shù),e表示高斯噪聲;
[0035] (43)通過以下公式利用Db對目標(biāo)圖像水印區(qū)域的各個分塊進(jìn)行修復(fù):
[0037] 其中,Xf表示x'」的修復(fù)值;
[0038] (44)用X/替換x'』,完成修復(fù)。
[0039] 所述的用于文檔類圖像可視水印的擦除方法,所述步驟(6)中,采用局部擦除算 法來擦除目標(biāo)圖像中的可視水印,包括:
[0040] (51)采用形態(tài)學(xué)連通度方法檢測特征圖像水印區(qū)域的連通區(qū)域,判斷各個連通區(qū) 域的連通度是否大于門限,若是,則相應(yīng)的連通區(qū)域?qū)儆趯嵕€水印區(qū)域,跳轉(zhuǎn)步驟(52),若 否,則相應(yīng)的連通區(qū)域?qū)儆谔摼€水印區(qū)域,對其采用形態(tài)學(xué)膨脹方法處理后,標(biāo)記為待修復(fù) 區(qū)域,跳轉(zhuǎn)步驟(53);
[0041] (52)對各個實線水印區(qū)域,判斷其比特平面復(fù)雜度是否高于門限,若是,則不作處 理,若否,則將其標(biāo)記為待修復(fù)區(qū)域;某個實線水印區(qū)域的比特平面復(fù)雜度定義為該實線水 印區(qū)域黑白邊界點像素數(shù)與所有實線水印區(qū)域邊界點像素數(shù)的比值;
[0042] (53)根據(jù)目標(biāo)圖像與特征圖像的位置對應(yīng)關(guān)系,確定目標(biāo)圖像水印區(qū)域中的各個 待修復(fù)區(qū)域;
[0043] (54)估計目標(biāo)圖像各個待修復(fù)區(qū)域的背景文字像素值;
[0044] (55)用估計的背景文字像素值填充相應(yīng)的待修復(fù)區(qū)域。
[0045] 由上述技術(shù)方案可知,鑒于文檔類圖像的背景文字往往有一定的文檔格式,不同 于一般的自然圖像的紋理特性,本發(fā)明利用文檔類圖像本身有一定的自相似特性,采用形 態(tài)學(xué)方法和信號稀疏表示的優(yōu)化模型,提出了一種自適應(yīng)圖像修復(fù)方法,該方法能夠在不 同噪聲情況下精確修復(fù)適應(yīng)于字典的圖像分塊,較好地解決文本環(huán)境下的可視水印擦除問 題,極大地改進(jìn)擦除效果,提高圖像恢復(fù)質(zhì)量。
【附圖說明】
[0046] 圖1是本發(fā)明的方法流程圖;
[0047] 圖2是本發(fā)明的訓(xùn)練分塊示意圖;
[0048]圖3是本發(fā)明采用稀疏表示、字典相似塊擦除算法的流程圖;
[0049] 圖4是本發(fā)明的效果示意例圖。
【具體實施方式】
[0050] 下面,結(jié)合附圖和具體實施例進(jìn)一步說明本發(fā)明。
[0051] 如圖1所示,一種用于文檔類圖像可視水印的擦除方法,包括以下步驟:
[0052]S1、對目標(biāo)圖像進(jìn)行二值化預(yù)處理,然后對得到的二值圖像再進(jìn)行邊界細(xì)化和梯 度計算得到特征圖像。
[0053]這里,目標(biāo)圖像指的是嵌入可視水印的歸一化的待修復(fù)文檔類圖像,對其進(jìn)行二 值化預(yù)處理是為了避免歸一化圖像背景局部亮度不一致的情況,進(jìn)一步對二值圖像進(jìn)行邊 界細(xì)化和梯度計算是為了增強下述分塊的魯棒性。
[0054] S2、將目標(biāo)圖像劃分為水印區(qū)域和非水印區(qū)域(人為觀測設(shè)定),由于特征圖像是 由目標(biāo)圖像經(jīng)過預(yù)處理得到的,所以根據(jù)特征圖像與目標(biāo)圖像的位置對應(yīng)關(guān)系,特征圖像 的水印區(qū)域和非水印區(qū)域也就確定了。采用形態(tài)學(xué)連通度方法檢測特征圖像的背景文字大 小,按照文字大小確定分塊大小,一般分塊大小比文字平均大小略大。采用這種分塊方法, 可以減少無意義分塊數(shù)目,訓(xùn)練分塊如圖2所示。
[0055] S3、按照步驟S2確定的分塊大小,分別對目標(biāo)圖像和特征圖像的非水印區(qū)域進(jìn)行 重疊分塊(即分別將目標(biāo)圖像和特征圖像的非水印區(qū)域劃分成若干個重疊的分塊),基于 位置對應(yīng)關(guān)系,目標(biāo)圖像和特征圖像的分塊劃分軌跡完全一致。
[0056] 分別對目標(biāo)圖像和特征圖像非水印區(qū)域的分塊進(jìn)行采樣,處于兩個圖像上相同位 置的分塊采樣結(jié)果組成一個樣本對(Xi,yi),其中,\表示由目標(biāo)圖像非水印區(qū)域第i個分 塊的像素組成的列向量,71表示由特征圖像非水印區(qū)域第i個分塊的像素組成的列向量。
[0057] 假設(shè)有m組樣本對:Xb=[x"i= 1,2,…,m] = [X!,x2,…,xm],Yf=[y"i= 1,2,…,,…,ym],定義訓(xùn)練樣本集為:
[0058]Xc= {Xb,Yf}
[0059] 稀疏編碼的目的就是通過對浐的學(xué)習(xí)來估計學(xué)習(xí)字典,并且將目標(biāo)圖像非水印區(qū) 域分塊Xb和特征圖像非水印區(qū)域分塊Yf統(tǒng)一到一個稀疏編碼框架中,使其具有相同的稀疏 表示,其目標(biāo)函數(shù)為:
[0061] 上式可簡化表示為:
[0063] 其中,Db表示目標(biāo)圖像非水印區(qū)域分塊對應(yīng)的字典,下面簡稱為目標(biāo)圖像分 塊字典,Df表示特征圖像非水印區(qū)域分塊對應(yīng)的字典,下面簡稱為特征圖像分塊字典,
De中每個原子(列向量)dG|的12范數(shù)歸一化約束的目的是為 了避免原子的尺度歧義性,Z表示懲罰項,用于避免過擬合,X表示正則參數(shù)。
[0064]S4、利用字典學(xué)習(xí)的方法優(yōu)化下式:
[0066] 得到壓縮的原子集合字典Db和Df。
[0067]S5、采用歐氏距離度量計算目標(biāo)圖像分塊字典Db和特征圖像分塊字典DMA相似匹 配度,若爐與Df之間的歐氏距離小于閾值T,則認(rèn)為兩者的相似匹配度高,轉(zhuǎn)至步驟S6,采 用字典相似塊擦除算法來擦除目標(biāo)圖像中的可視水印,若爐與〇{之間的歐氏距離大于等于 閾值T,則認(rèn)為兩者的相似匹配度低,轉(zhuǎn)至步驟S7,采用局部擦除算法來擦除目標(biāo)圖像中的 可視水印。
[0068] S6、采用字典相似塊擦除算法來擦除目標(biāo)圖像中的可視水印,如圖3所示,包括以 下步驟:
[0069]S61、按照步驟S2確定的分塊大小,分別對目標(biāo)圖像和特