一種基于拓?fù)洳蛔冃院蛨D像變形的打印文檔信息追溯方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種打印文檔信息追溯方法,具體涉及一種基于拓?fù)洳蛔冃院蛨D像變 形的打印文檔信息追溯方法。
【背景技術(shù)】
[0002] 目前,存放在信息系統(tǒng)上的重要信息被竊取和盜用,已經(jīng)成為信息系統(tǒng)使用的頭 等威脅。打印設(shè)備作為政府部門、軍隊(duì)、軍工、企業(yè)等組織的標(biāo)準(zhǔn)配置,已經(jīng)成為信息泄漏的 重要途徑,給組織帶來(lái)巨大的風(fēng)險(xiǎn),甚至危害國(guó)家安全。為此,許多組織研發(fā)或部署了打印 審計(jì)系統(tǒng),試圖彌補(bǔ)這個(gè)漏洞。但由于打印審計(jì)系統(tǒng)只是管控和審計(jì)打印的行為,存在自身 的缺陷:(1)打印追溯的缺陷,當(dāng)一個(gè)組織發(fā)現(xiàn)本組織打印的文件流出后,通過(guò)打印審計(jì)系 統(tǒng)一般只能發(fā)現(xiàn)是哪些人打印過(guò)這份文件,而不能確定流出的這份文件到底是誰(shuí)打印流出 的,特別是當(dāng)打印出的文件被別人復(fù)印或拍照再流出后。(2)顯式水印的缺陷,傳統(tǒng)打印審 計(jì)輸出的文檔通常顯式的嵌入水印信息,一般包括標(biāo)示密級(jí)的標(biāo)志、誰(shuí)打印或何時(shí)打印,打 印者可以在打印件上看到嵌入的水印信息,因此也容易被泄漏者有意的隱藏或掩蓋,使流 出的文件無(wú)法被追溯??傊?,現(xiàn)有的打印審計(jì)系統(tǒng)無(wú)法追溯是誰(shuí)打印的文件發(fā)生泄漏,無(wú)法 追溯到源頭,也就無(wú)法消除信息泄漏的通道。
【發(fā)明內(nèi)容】
[0003] 發(fā)明目的:本發(fā)明目的在于針對(duì)現(xiàn)有技術(shù)的不足,提供一種基于拓?fù)洳蛔冃院蛨D 像變形的打印文檔信息追溯方法,可以有效的追溯泄漏文件的打印源頭,有效的定位或者 消除信息泄漏的通道。
[0004] 技術(shù)方案:本發(fā)明所述一種基于拓?fù)洳蛔冃院蛨D像變形的打印文檔信息追溯方 法,在文檔的打印輸出件中隱性嵌入打印信息,并預(yù)先提取所述打印信息的特征進(jìn)行存儲(chǔ), 通過(guò)嵌入的打印信息和存儲(chǔ)的打印信息的特征追溯打印件的來(lái)源;
[0005] 所述在文檔的打印輸出件中隱性嵌入打印信息步驟通過(guò)如下兩種方法實(shí)現(xiàn):
[0006] (1)將原始文件中字間/行間/頁(yè)白距離進(jìn)行編碼并做微小調(diào)整,隱性嵌入打印信 息;
[0007] (2)將原始文件中的特定字進(jìn)行字體的改變使每個(gè)人有屬于自己的字體,隱性嵌 入打印信息。
[0008] 本發(fā)明技術(shù)方案的進(jìn)一步限定為,所述將原始文件中字間/行間/頁(yè)白距離進(jìn)行 編碼并做微小調(diào)整,隱性嵌入打印信息的具體方法為:
[0009] S1、定義原始文件中字間距離為D = {a,b} (a〈b),每行文字距離D為常值,即對(duì)每 行文字R所有字間距離D只能同時(shí)取值為a或b ;
[0010] S2、對(duì)每行文字R做如下編碼映射:
【主權(quán)項(xiàng)】
1. 一種基于拓?fù)洳蛔冃院蛨D像變形的打印文檔信息追溯方法,其特征在于,在文檔的 打印輸出件中隱性嵌入打印信息,并預(yù)先提取所述打印信息的特征進(jìn)行存儲(chǔ),通過(guò)嵌入的 打印信息和存儲(chǔ)的打印信息的特征追溯打印件的來(lái)源; 所述在文檔的打印輸出件中隱性嵌入打印信息步驟通過(guò)如下兩種方法實(shí)現(xiàn): (1) 將原始文件中字間/行間/頁(yè)白距離進(jìn)行編碼并做微小調(diào)整,隱性嵌入打印信息; (2) 將原始文件中的特定字進(jìn)行字體的改變使每個(gè)人有屬于自己的字體,隱性嵌入打 印信息。
2. 根據(jù)權(quán)利要求1所述的一種基于拓?fù)洳蛔冃院蛨D像變形的打印文檔信息追溯方法, 其特征在于,所述將原始文件中字間/行間/頁(yè)白距離進(jìn)行編碼并做微小調(diào)整,隱性嵌入打 印信息的具體方法為: 51、 定義原始文件中字間距離為D = {a,b} (a〈b),每行文字距離D為常值,即對(duì)每行文 字R所有字間距離D只能同時(shí)取值為a或b ; 52、 對(duì)每行文字R做如下編碼映射:
53、 對(duì)一頁(yè)文檔,取該頁(yè)文檔中特定的N行,對(duì)每一行文字按式(I. 1)進(jìn)行編碼,并按下 式(1. 2)構(gòu)成表示ID :
其中Ri (i = 1,2···,N)表示所取N行文字中第i行文字; 54、 對(duì)于一個(gè)需要N_ID個(gè)ID號(hào)的系統(tǒng),由(1. 2)式可計(jì)算出能編碼N_ID個(gè)ID號(hào)所需 的最少的行數(shù)N_R為: N_R = Iog2 (N_ID) (I. 3) 即: 2°= N_ID (1.4); 對(duì)每行文字R做如下編碼映射:
則對(duì)一頁(yè)文檔,取特定的N'行文字,對(duì)每一行文字按式(1.5)進(jìn)行編碼,并按下式 (I. 6)構(gòu)成 ID :
對(duì)于一個(gè)需要N_ID個(gè)ID號(hào)的系統(tǒng),由(I. 6)式可計(jì)算出能編碼N_ID個(gè)ID號(hào)所需的 最少的行數(shù)N_R'為: N_R,= log4(N_ID) (1. 7) 即: 4n-e,= N_ID (I. 8) 〇
3. 根據(jù)權(quán)利要求2所述的一種基于拓?fù)洳蛔冃院蛨D像變形的打印文檔信息追溯方法, 其特征在于,步驟S4中,若對(duì)于N_ID較大而N_R較小不能滿足式(1. 3),(1. 4)時(shí),可將每 行文字R分為兩部分:前半行R1和后半行R 2,并規(guī)定& (j = 1,2)中字間距離D為常值,即 所有字間距離D只可能同時(shí)取值a或b。
4. 根據(jù)權(quán)利要求2所述的一種基于拓?fù)洳蛔冃院蛨D像變形的打印文檔信息追溯方法, 其特征在于,步驟S3中,采用式(1. 2)進(jìn)行編碼的,編碼加入校驗(yàn)位,方法為:將生成的二進(jìn) 制ID碼中N位二進(jìn)制數(shù)字進(jìn)行二進(jìn)制相加,其和記為C,校驗(yàn)位計(jì)算如下: c = Cmod(Ol) = {0, 1} (1. 10) 在原來(lái)的用來(lái)編碼ID號(hào)的N_R行文字的基礎(chǔ)上再取一行,使得新加的這行文字Rn-k+1 的字間距離滿足下式: D(W1) = Ifl,C = 0 P,C = 1 (Ul)。
5. 根據(jù)權(quán)利要求2所述的一種基于拓?fù)洳蛔冃院蛨D像變形的打印文檔信息追溯方法, 其特征在于,步驟S4中,采用式(1. 5)進(jìn)行編碼的,編碼加入校驗(yàn)位,方法為:將生成的ID 碼中奇數(shù)為二進(jìn)制數(shù)字取出并相加,其和記為C1,再將偶數(shù)位二進(jìn)制數(shù)字取出并相加,其和 記為C2,并按下式計(jì)算: C1=C^od(IO) = {0,1} (1. 12) C2= C 2mod(01) = {1,0} (1. 13) 按下式構(gòu)成校驗(yàn)位: c' =C1C2= {00,01,10,11} (I. 14) 在原來(lái)的用來(lái)編碼ID號(hào)的N_R'行文字的基礎(chǔ)上再取一行,使得新加的這行文字Rn-k^ 1的字間距離滿足下式:
6.根據(jù)權(quán)利要求1所述的一種基于拓?fù)洳蛔冃院蛨D像變形的打印文檔信息追溯方法, 其特征在于,所述將原始文件中的特定字進(jìn)行字體的改變使每個(gè)人有屬于自己的字體,隱 性嵌入打印信息的具體方法為: L1、取漢字中出現(xiàn)頻率最高的前N個(gè)漢字,記為S,并將該N個(gè)漢字分為2組: S1= {ff|W e S且W在文檔中必定出現(xiàn)} S2={W\WeSKW^S} = S-Sl (2. 1) S1I = N1, Is2I = N21N^N2= N 其中IsiI表示SiQ = 1,2)中所含文字的個(gè)數(shù);對(duì)于&中的文字,我們可以認(rèn)為至少 有一個(gè)會(huì)出現(xiàn)在文檔中; L2、對(duì)于S1中的每個(gè)文字,設(shè)計(jì)該文字的字體,使其有NljG = 1,2,…,N1)種寫法; 對(duì)于S2中的所有文字規(guī)定都只有Na= C(k = 1,2,…,N2)種寫法,C為常量; 1^3、對(duì)S1中的第j個(gè)字,對(duì)構(gòu)成該字的筆畫進(jìn)行分析,使得每個(gè)可改變寫法的筆畫有兩 種寫法,并假設(shè)有Iilj (j = 1,2,…,N1)個(gè)可以改變寫法的筆畫,則有: 2~=?,其中(j = 1,2,…,N1) (2. 2); 對(duì)于S2中的第k個(gè)字,可改變寫法的筆畫個(gè)數(shù)為n 2k= c個(gè),其中c為常量,則有: =2' =C:,其中(k = 1,2,...,N2) (2. 3); L4、編碼時(shí)對(duì)同一個(gè)筆畫用"0"表示兩種寫法中的一種寫法,用"1"表示另一種寫法, 則對(duì)S1中的第j個(gè)文字W n,可采用長(zhǎng)度為1^_的二進(jìn)制數(shù)的不同值來(lái)表示該文字的不同寫 法,即將該文字每一種寫法映射為一個(gè)二進(jìn)制數(shù):
對(duì)S2中所有的文字,都采用長(zhǎng)度為c的二進(jìn)制數(shù)表示文字的不同寫法,這不同于S 的每個(gè)文字用長(zhǎng)度不同的二進(jìn)制數(shù)進(jìn)行表示,對(duì)&中的任何一個(gè)字W2k,映射如下: 、 I-
L5、對(duì)文檔編碼時(shí)采用分層編碼:對(duì)S1*的所有字編碼,從S2中選擇一個(gè)在文檔中出現(xiàn) 的文字用來(lái)編碼,把這兩個(gè)編碼結(jié)合起來(lái)形成最終的編碼ID :
L6、對(duì)于給定的文檔,打印時(shí)按不同的ID號(hào)將SjP S2中文字按對(duì)應(yīng)的寫法打印,完成 打印信息的隱性嵌入。
【專利摘要】本發(fā)明公開一種基于拓?fù)洳蛔冃院蛨D像變形的打印文檔信息追溯方法,在文檔的打印輸出件中隱性嵌入打印信息,并預(yù)先提取所述打印信息的特征進(jìn)行存儲(chǔ),通過(guò)嵌入的打印信息和存儲(chǔ)的打印信息的特征追溯打印件的來(lái)源;所述在文檔的打印輸出件中隱性嵌入打印信息步驟通過(guò)如下兩種方法實(shí)現(xiàn):(1)將原始文件中字間/行間/頁(yè)白距離進(jìn)行編碼并做微小調(diào)整,隱性嵌入打印信息;(2)將原始文件中的特定字進(jìn)行字體的改變使每個(gè)人有屬于自己的字體,隱性嵌入打印信息。本發(fā)明作為常規(guī)打印審計(jì)系統(tǒng)的補(bǔ)充和擴(kuò)展,能在重要文檔的打印輸出件中嵌入隱藏信息,實(shí)現(xiàn)對(duì)打印的文檔進(jìn)行追溯,解決公司重要信息保護(hù)的安全挑戰(zhàn)。
【IPC分類】G06F21-60
【公開號(hào)】CN104834864
【申請(qǐng)?zhí)枴緾N201510167454
【發(fā)明人】郭英凱
【申請(qǐng)人】南京安斯克信息科技有限公司
【公開日】2015年8月12日
【申請(qǐng)日】2015年4月9日