專利名稱:一種基于Opentype矢量輪廓字體的文檔水印版權(quán)信息保護裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種文檔水印版權(quán)信息保護裝置,屬于信息安全中的數(shù)字水印技術(shù)和文檔信息保護領(lǐng)域。
背景技術(shù):
文檔水印作為數(shù)字水印技術(shù)的一個方面,自1995年以來受到人們的關(guān)注,并且成為水印技術(shù)的一個熱點。根據(jù)嵌入原理和不同的載體形式,目前的文檔水印算法有基于字移、行移的水印算法,字符特征水印算法等幾類?;谧忠啤⑿幸频乃∷惴ň褪峭ㄟ^輕微的改變文檔中字與字、行與行之間的距離來嵌入水印,此類算法適用于Postkript描述的電子文檔如PDF、PS文件等。此類算法可以抵抗二值化攻擊,一定程度上抵抗打印、掃描的攻擊。但是通過剪切文檔的部分幅面,或者在文檔上劃線、涂改等方式很容易破壞水印信肩、ο字符特征水印算法的特點是通過修改文檔中某些字符的字符特征來實現(xiàn)水印嵌入。這類方法可以適應中文這樣的方塊字,通過適當選擇嵌入筆劃和所修改的字符特征,提高水印算法的容量。但是如何保證特征修改的強度和修改的方式在不影響讀者的觀感的同時使水印能夠抵抗打印、掃描的攻擊,并能夠在掃描之后監(jiān)測出圖像的改動以及如何被改動,這是一個關(guān)鍵難題。由此看出現(xiàn)在的各種主流的文檔水印算法的思想都還只是傳統(tǒng)圖像水印算法的延續(xù),都需要在嵌入水印之前將文檔轉(zhuǎn)化為圖像來處理。這樣的處理方式?jīng)]有考慮到文檔作為水印載體的特殊性,不符合現(xiàn)有的文檔操作習慣,所以導致現(xiàn)有文檔水印算法具有魯棒性不高、操作復雜的缺點。雖然也有像PDF文檔水印算法等少數(shù)算法利用了文檔的格式特征,但這些算法只能應用于電子文檔,而且對格式調(diào)整攻擊十分脆弱。
發(fā)明內(nèi)容
本發(fā)明的目的是針對在嵌入水印之前需將文檔先轉(zhuǎn)化為圖像來處理,導致現(xiàn)有文檔水印算法具有魯棒性不高、操作復雜的缺點的問題,提出一種基于Opentype矢量輪廓字體的文檔水印版權(quán)信息保護裝置。一種基于Opentype矢量輪廓字體的文檔水印版權(quán)信息保護裝置,它包括如下模塊字庫管理中心模塊、文檔水印版權(quán)信息嵌入模塊、文檔水印版權(quán)信息提取模塊、打印文檔預處理模塊、文檔水印版權(quán)信息抗掃描打印檢測模塊和標準Opentype字體庫模塊;所述的字庫管理中心模塊,是管理未嵌入任何水印信息的原始標準字體庫信息, 為文檔水印版權(quán)信息提取模塊和文檔水印版權(quán)信息抗掃描打印檢測模塊提供需要的比對 fn息;所述的文檔水印版權(quán)信息嵌入模塊,是通過選擇的Opentype字體和要嵌入的版權(quán)信息按照一定算法生成具體的水印文字;
所述的文檔水印版權(quán)信息提取模塊,是通過待提取文檔中的水印文字進行參數(shù)抽取,并通過相應的算法依據(jù)字庫管理中心模塊中的比對參數(shù)來提取版權(quán)信息;所述的打印文檔預處理模塊,是對打印文檔進行掃描、圖像二值化、去除噪聲、定位、細化,最終形成打印文檔的文字用連續(xù)單像素曲線表示,并將結(jié)果交由文檔水印版權(quán)信息抗掃描打印檢測模塊進行信息提??;所述的文檔水印版權(quán)信息抗掃描打印檢測模塊,是通過對打印文檔預處理模塊中的處理結(jié)果提取筆畫參數(shù),依據(jù)字庫管理中心模塊中的比對參數(shù)來提取版權(quán)信息。所述的文檔水印版權(quán)信息嵌入模塊實現(xiàn)水印版權(quán)信息嵌入的步驟為步驟一用戶設(shè)定生成條件,選擇Opentype字體類型、文檔中具體的文字、嵌入的版權(quán)信息和字體修改尺度;步驟二根據(jù)用戶選擇的文字類型與文檔中具體的文字,解析字體文件并提取文字的矢量輪廓,生成描敘該文字的N條二次Bezier曲線,其中N為正整數(shù),當嵌入的版權(quán)信息字符數(shù)量大于N時,提示用戶跳到步驟一縮減版權(quán)信息或者重新選擇文字,當嵌入的版權(quán)信息字符數(shù)量不大于N時,執(zhí)行步驟三;步驟三將確定的版權(quán)信息中的所有字符映射成一組唯一的二進制數(shù),按設(shè)定的字體修改尺度進行壓縮,從確定的文字中提取出N條二次Bezier曲線按從左到右、從上到下的順序存放起來,用生成的二進制數(shù)按順序依次對各條二次Bezier曲線的參數(shù)進行修改,將字體修改尺度存入到文字二進制格式中的固定位置;步驟四用戶預覽生成的嵌入了版權(quán)信息的水印文字,不滿意生成的水印文字,跳到步驟一通過調(diào)整字體修改尺度、縮減版權(quán)信息、重新選擇文字的方法重復進行如上步驟, 滿意則執(zhí)行步驟五;步驟五生成嵌入合理版權(quán)信息水印文字。所述文檔水印版權(quán)信息提取模塊的實現(xiàn)水印版權(quán)信息提取方法的步驟為步驟A 用戶提取帶有版權(quán)信息的水印字體,如果無法確定,對待提取的水印文字進行格式解析,提取字體修改尺度;步驟B 對待提取水印文字進行格式解析,提取出N條二次Bezier曲線按從左到右、從上到下的順序存放起來,其中N為正整數(shù);
步驟C 通過用戶設(shè)定的字體類型從字庫管理中心模塊中提取對應原始文字的矢量輪廓,提取出N條二次Bezier曲線按從左到右、從上到下的順序存放起來;步驟D 比對水印文字與原始文字的N條二次Bezier曲線,依次從中提取出一組二進制數(shù)組;步驟E 通過提取的字體修改尺度對提取的二進制數(shù)組進行解壓縮,并將解壓縮的二進制數(shù)組通過嵌入時候的映射規(guī)則還原成字符,提取了嵌入到該文字的版權(quán)信息。所述的文檔水印版權(quán)信息抗掃描打印檢測模塊的實現(xiàn)版權(quán)信息抗掃描打印檢測的步驟為步驟a:經(jīng)過打印、復印、掃描后得到的文檔圖像,進行圖像預處理,處理過程如下一、圖像二值化將得到的灰度圖的文檔圖像進行3X3的中值濾波來消除噪聲, 畫出灰度直方圖,以概率最低點為閾值把得到的灰度圖的文檔圖像變?yōu)橹挥?、1灰度值的二值圖像;二、去除噪聲這一步中要去除二值化后圖像中的椒鹽噪聲,采用3X3中值濾波或膨脹與腐蝕的處理的方法來消除;三、定位處理后的圖像需要旋轉(zhuǎn)定位;使用投影定位法,將一行漢字向縱軸投影,當投影區(qū)域最小時,為最后的旋轉(zhuǎn)位置;四、細化在經(jīng)過處理后的文檔圖像上,把不同的線寬調(diào)整為1象素寬,使用 Hilditch算法,從粗邊緣線的外側(cè)開始逐層地削去各個象素,直到成為連續(xù)單象素曲線為止;步驟b 筆畫提取階段采用長度比率的方法,即曲線兩端點間直線距離和曲線長度之比,并采用線性最小二乘法逼近曲線,得到曲線的直線擬合方程;步驟c 經(jīng)過以上的處理,得到曲線擬合方程;依據(jù)所述的字庫管理中心模塊中的對應原始的矢量輪廓,通過檢測曲線夾角變化來判斷所嵌入的水印信息。本發(fā)明的優(yōu)點本發(fā)明通過對系統(tǒng)Opentype字體文件的管理和操作將水印嵌入和驗證工具進行了集成,使之不必將文檔轉(zhuǎn)化為圖像就能夠嵌入水印。而且因為通過改變字符的字形來嵌入水印,能夠使保證版權(quán)信息在電子文檔或打印的文檔中都存在,能夠同時有效的抵抗格式調(diào)整攻擊與打印掃描攻擊,具有魯棒性高、操作簡單的優(yōu)點。
圖1是本發(fā)明的結(jié)構(gòu)示意圖;圖2是本發(fā)明的文檔水印版權(quán)信息嵌入的流程圖;圖3是本發(fā)明的文檔水印版權(quán)信息提取的流程圖;圖4是本發(fā)明的文檔水印版權(quán)信息抵抗打印掃描攻擊的流程圖。
具體實施例方式具體實施方式
一下面結(jié)合圖1-4說明本實施方式。一種基于Opentype矢量輪廓字體的文檔水印版權(quán)信息保護裝置包括如下模塊 字庫管理中心模塊1、文檔水印版權(quán)信息嵌入模塊2、文檔水印版權(quán)信息提取模塊3、打印文檔預處理模塊4、文檔水印版權(quán)信息抗掃描打印檢測模塊5、標準Opentype字體庫模塊6和含版權(quán)信息的打印文檔模塊7 ;所述的字庫管理中心模塊1,是管理未嵌入任何水印信息的原始標準字體庫信息, 為文檔水印版權(quán)信息提取模塊3和文檔水印版權(quán)信息抗掃描打印檢測模塊5提供需要的比對信息;所述的文檔水印版權(quán)信息嵌入模塊2,是通過選擇的Opentype字體和要嵌入的版權(quán)信息按照一定算法生成具體的水印文字;所述的文檔水印版權(quán)信息提取模塊3,是通過待提取文檔中的水印文字進行參數(shù)抽取,并通過相應的算法依據(jù)字庫管理中心模塊1中的比對參數(shù)來提取版權(quán)信息;所述的打印文檔預處理模塊4,是對打印文檔進行掃描、圖像二值化、去除噪聲、定位、細化,最終形成打印文檔的文字用連續(xù)單像素曲線表示,并將結(jié)果交由文檔水印版權(quán)信息抗掃描打印檢測模塊5進行信息提??;所述的文檔水印版權(quán)信息抗掃描打印檢測模塊5,是通過對打印文檔預處理模塊 4中的處理結(jié)果提取筆畫參數(shù),依據(jù)字庫管理中心模塊1中的比對參數(shù)來提取版權(quán)信息。
具體實施方式
二 下面結(jié)合圖2說明本實施方式,本實施方式與實施方式一不同之處是所述的文檔水印版權(quán)信息嵌入模塊2實現(xiàn)水印版權(quán)信息嵌入的步驟為步驟一用戶設(shè)定生成條件,選擇Opentype字體類型、具體的文字、嵌入的版權(quán)信息、字體修改尺度;步驟二根據(jù)用戶選擇的文字類型與文檔中具體的文字,解析字體文件并提取文字的矢量輪廓,生成描敘該文字的N條二次Bezier曲線,其中N為正整數(shù),當嵌入的版權(quán)信息字符數(shù)量大于N時,提示用戶跳到步驟一縮減版權(quán)信息或者重新選擇文字,當嵌入的版權(quán)信息字符數(shù)量不大于N時,執(zhí)行步驟三;步驟三將確定的版權(quán)信息中的所有字符映射成一組唯一的二進制數(shù),按設(shè)定的字體修改尺度進行壓縮,從確定的文字中提取出N條二次Bezier曲線按從左到右、從上到下的順序存放起來,用生成的二進制數(shù)按順序依次對各條二次Bezier曲線的參數(shù)進行修改,將字體修改尺度存入到文字二進制格式中的固定位置;步驟四用戶預覽生成的嵌入了版權(quán)信息的水印文字,不滿意生成的水印文字,跳到步驟一通過調(diào)整字體修改尺度、縮減版權(quán)信息、重新選擇文字的方法重復進行如上步驟, 滿意則執(zhí)行步驟五;步驟五生成嵌入合理版權(quán)信息水印文字。
具體實施方式
三下面結(jié)合圖3說明本實施方式,本實施方式與實施方式一不同之處是所述文檔水印版權(quán)信息提取模塊3的實現(xiàn)水印版權(quán)信息提取方法的步驟為步驟A 用戶提取帶有版權(quán)信息的水印字體,如果無法確定,對待提取的水印文字進行格式解析,提取字體修改尺度;步驟B 對待提取水印文字進行格式解析,提取出N條二次Bezier曲線按從左到右、從上到下的順序存放起來,其中N為正整數(shù);步驟C 通過用戶設(shè)定的字體類型從字庫管理中心1中提取對應原始文字的矢量輪廓,提取出N條二次Bezier曲線按從左到右、從上到下的順序存放起來;步驟D 比對水印文字與原始文字的N條二次Bezier曲線,依次從中提取出一組二進制數(shù)組;步驟E 通過提取的字體修改尺度對提取的二進制數(shù)組進行解壓縮,并將解壓縮的二進制數(shù)組通過嵌入時候的映射規(guī)則還原成字符,既提取了嵌入到該文字的版權(quán)信息。
具體實施方式
四下面結(jié)合圖4說明本實施方式,本實施方式與實施方式一不同之處是所述的文檔水印版權(quán)信息抗掃描打印檢測模塊5的實現(xiàn)版權(quán)信息抗掃描打印檢測的步驟為步驟a:經(jīng)過打印、復印、掃描后得到的文檔圖像,需要進行圖像預處理,處理過程如下一、圖像二值化將得到的灰度圖的文檔圖像進行3X3的中值濾波來消除噪聲, 畫出灰度直方圖,以概率最低點為閾值把得到的灰度圖的文檔圖像變?yōu)橹挥?、1灰度值的
二值圖像;
二、去除噪聲這一步中要去除二值化后圖像中的椒鹽噪聲,采用3X3中值濾波或膨脹與腐蝕的處理的方法來消除;三、定位處理后的圖像需要旋轉(zhuǎn)定位;使用投影定位法,將一行漢字向縱軸投影,當投影區(qū)域最小時,為最后的旋轉(zhuǎn)位置;四、細化在經(jīng)過處理后的文檔圖像上,把不同的線寬調(diào)整為1象素寬,使用 Hilditch算法,從粗邊緣線的外側(cè)開始逐層地削去各個象素,直到成為連續(xù)單象素曲線為止;步驟b 筆畫提取階段采用長度比率的方法,即曲線兩端點間直線距離和曲線長度之比,并采用線性最小二乘法逼近曲線,得到曲線的直線擬合方程;步驟c 經(jīng)過以上的處理,得到曲線擬合方程,依據(jù)所述的字庫管理中心1中的對應原始的矢量輪廓,通過檢測曲線夾角變化來判斷所嵌入的水印信息。本發(fā)明不局限于上述實施方式,還可以是上述各實施方式中所述技術(shù)特征的合理組合。
權(quán)利要求
1.一種基于Opentype矢量輪廓字體的文檔水印版權(quán)信息保護裝置,其特征在于它包括如下模塊字庫管理中心模塊(1)、文檔水印版權(quán)信息嵌入模塊O)、文檔水印版權(quán)信息提取模塊(3)、打印文檔預處理模塊G)、文檔水印版權(quán)信息抗掃描打印檢測模塊( 和標準Opentype字體庫模塊(6);所述的字庫管理中心模塊(1),是管理未嵌入任何水印信息的原始標準字體庫信息,為文檔水印版權(quán)信息提取模塊(3)和文檔水印版權(quán)信息抗掃描打印檢測模塊(5)提供需要的比對信息;所述的文檔水印版權(quán)信息嵌入模塊O),是通過選擇的Opentype字體和要嵌入的版權(quán)信息按照一定算法生成具體的水印文字;所述的文檔水印版權(quán)信息提取模塊C3),是通過待提取文檔中的水印文字進行參數(shù)抽取,并通過相應的算法依據(jù)字庫管理中心模塊(1)中的比對參數(shù)來提取版權(quán)信息;所述的打印文檔預處理模塊G),是對打印文檔進行掃描、圖像二值化、去除噪聲、定位、細化,最終形成打印文檔的文字用連續(xù)單像素曲線表示,并將結(jié)果交由文檔水印版權(quán)信息抗掃描打印檢測模塊(5)進行信息提?。凰龅奈臋n水印版權(quán)信息抗掃描打印檢測模塊(5),是通過對打印文檔預處理模塊 (4)中的處理結(jié)果提取筆畫參數(shù),依據(jù)字庫管理中心模塊(1)中的比對參數(shù)來提取版權(quán)信息。
2.使用權(quán)利要求1所述的一種基于Opentype矢量輪廓字體的文檔水印版權(quán)信息保護裝置的水印版權(quán)信息嵌入方法,其特征在于所述的文檔水印版權(quán)信息嵌入模塊(2)實現(xiàn)水印版權(quán)信息嵌入的步驟為步驟一用戶設(shè)定生成條件,選擇Opentype字體類型、文檔中具體的文字、嵌入的版權(quán)信息和字體修改尺度;步驟二 根據(jù)用戶選擇的文字類型與文檔中具體的文字,解析字體文件并提取文字的矢量輪廓,生成描敘該文字的N條二次Bezier曲線,其中N為正整數(shù),當嵌入的版權(quán)信息字符數(shù)量大于N時,提示用戶跳到步驟一縮減版權(quán)信息或者重新選擇文字,當嵌入的版權(quán)信息字符數(shù)量不大于N時,執(zhí)行步驟三;步驟三將確定的版權(quán)信息中的所有字符映射成一組唯一的二進制數(shù),按設(shè)定的字體修改尺度進行壓縮,從確定的文字中提取出N條二次Bezier曲線按從左到右、從上到下的順序存放起來,其中N為正整數(shù),用生成的二進制數(shù)按順序依次對各條二次Bezier曲線的參數(shù)進行修改,將字體修改尺度存入到文字二進制格式中的固定位置;步驟四用戶預覽生成的嵌入了版權(quán)信息的水印文字,如果不滿意生成的水印文字,跳到步驟一通過調(diào)整字體修改尺度、縮減版權(quán)信息、重新選擇文字的方法重復進行如上步驟, 如果滿意則執(zhí)行步驟五;步驟五生成嵌入合理版權(quán)信息水印文字。
3.使用權(quán)利要求1所述的一種基于Opentype矢量輪廓字體的文檔水印版權(quán)信息保護裝置的水印版權(quán)信息提取方法,其特征在于所述文檔水印版權(quán)信息提取模塊(3)的實現(xiàn)水印版權(quán)信息提取方法的步驟為步驟A 用戶提取帶有版權(quán)信息的水印字體,如果無法確定,對待提取的水印文字進行格式解析,提取字體修改尺度;步驟B 對待提取水印文字進行格式解析,提取出N條二次Bezier曲線按從左到右、從上到下的順序存放起來,其中N為正整數(shù);步驟C:通過用戶設(shè)定的字體類型從字庫管理中心模塊(1)中提取對應原始文字的矢量輪廓,提取出N條二次Bezier曲線按從左到右、從上到下的順序存放起來;步驟D 比對水印文字與原始文字的N條二次Bezier曲線,依次從中提取出一組二進制數(shù)組;步驟E 通過提取的字體修改尺度對提取的二進制數(shù)組進行解壓縮,并將解壓縮的二進制數(shù)組通過嵌入時候的映射規(guī)則還原成字符,提取了嵌入到該文字的版權(quán)信息。
4.使用權(quán)利要求1所述的一種基于Opentype矢量輪廓字體的文檔水印版權(quán)信息保護裝置的水印版權(quán)信息抗掃描打印檢測方法,其特征在于所述的文檔水印版權(quán)信息抗掃描打印檢測模塊(5)的實現(xiàn)版權(quán)信息抗掃描打印檢測的步驟為步驟a 經(jīng)過打印、復印、掃描后得到的文檔圖像,進行圖像預處理,處理過程如下一、圖像二值化將得到的灰度圖的文檔圖像進行3X3的中值濾波來消除噪聲,畫出灰度直方圖,以概率最低點為閾值把得到的灰度圖的文檔圖像變?yōu)橹挥?、1灰度值的二值圖像;二、去除噪聲這一步中要去除二值化后圖像中的椒鹽噪聲,采用3X3中值濾波或膨脹與腐蝕的處理的方法來消除;三、定位處理后的圖像需要旋轉(zhuǎn)定位;使用投影定位法,將一行漢字向縱軸投影,當投影區(qū)域最小時,為最后的旋轉(zhuǎn)位置;四、細化在經(jīng)過處理后的文檔圖像上,把不同的線寬調(diào)整為1象素寬,使用Hilditch 算法,從粗邊緣線的外側(cè)開始逐層地削去各個象素,直到成為連續(xù)單象素曲線為止;步驟b 筆畫提取階段采用長度比率的方法,即曲線兩端點間直線距離和曲線長度之比,并采用線性最小二乘法逼近曲線,得到曲線的直線擬合方程;步驟c:經(jīng)過以上的處理,得到曲線擬合方程;依據(jù)所述的字庫管理中心模塊(1)中的對應原始的矢量輪廓,通過檢測曲線夾角變化來判斷所嵌入的水印信息。
全文摘要
一種基于Opentype矢量輪廓字體的文檔水印版權(quán)信息保護裝置,屬于信息安全中的數(shù)字水印技術(shù)和文檔信息保護領(lǐng)域。為了解決在嵌入水印之前需將文檔先轉(zhuǎn)化為圖像導致的現(xiàn)有文檔水印技術(shù)具有魯棒性不高、操作復雜問題。字庫管理中心模塊管理未嵌入任何水印信息的原始標準字體庫信息,提供比對信息;文檔水印版權(quán)信息嵌入模塊通過選擇的Opentype字體和嵌入的版權(quán)信息生成具體的水印文字;文檔水印版權(quán)信息提取模塊依據(jù)比對參數(shù)提取版權(quán)信息;打印文檔預處理模塊對打印文檔進行掃描、圖像二值化、去除噪聲、定位和細化,形成連續(xù)單像素曲線;文檔水印版權(quán)信息抗掃描打印檢測模塊提取筆畫參數(shù)。本發(fā)明是用于文檔水印版權(quán)信息的信息保護。
文檔編號G06F17/22GK102495833SQ20111039038
公開日2012年6月13日 申請日期2011年11月30日 優(yōu)先權(quán)日2011年11月30日
發(fā)明者李瓊, 牛夏牧, 王莘, 石振鋒, 韓琦 申請人:哈爾濱工業(yè)大學