且,即使同一個打印機、同一個蓋章機、同一個印刷機、同一個人所產(chǎn)生的“印跡”也不相同。也就是說,“印跡”具有唯一性。
[0016]圖1是實際激光打印機的印跡的例子。101為英文字母P的下半部分的放大圖,即理想狀態(tài)下打印機應(yīng)該輸出的圖樣。102為使用分辨率為600dpi的HP LaserJet 8100激光打印機打印字母P的實際效果,可以看出出現(xiàn)在字母邊緣的不規(guī)則輪廓和散開的墨粉。103為使用同一打印機再次打印字母P的情況,103和102之間的不同顯而易見。104為使用更高分辨率(1200dpi)的HP LaserJet 4100打印的效果。105為使用同為600dpi的Minolta Dil52f復(fù)印機復(fù)印102后的結(jié)果。觀察發(fā)現(xiàn),同一打印機多次打印同一文件,不同打印機打印同一文件,打印文件與其復(fù)印件,及同一文件的不同復(fù)印件之間都普遍存在微觀上的差別。用本發(fā)明的術(shù)語,同一內(nèi)容,由不同的打印機,或同一打印機,或復(fù)印后所產(chǎn)生的文件,其印跡都不相同。這樣,就可以鑒定文件是否為復(fù)印件件或復(fù)制件,進而鑒定文件的原始性。
[0017]需要指出,不僅激光打印機的輸出存在這種微觀的隨機現(xiàn)象,其它類型打印機,如噴墨打印機,針式打印機,以及印刷設(shè)備的輸出中均可觀測到微觀隨機現(xiàn)象。類似的隨機現(xiàn)象也可以在印章,簽名等非打印設(shè)備蓋/簽的文件中觀測得到。這些隨機現(xiàn)象均可以產(chǎn)生“印跡”,因此也都可以應(yīng)用于本發(fā)明中。
[0018]二、印跡標識、印跡的微觀特征和表示
如前所述,印跡對于一文件,猶如指紋于人。鑒定印跡即能鑒定一文件的真?zhèn)魏蜕矸荨榱吮阌谧詣犹幚?,如指紋自動識別,我們要建立印跡的數(shù)字特征標識。圖2所示是圓點的幾個印跡,印跡的邊緣呈無規(guī)狀,并有墨點的隨機出現(xiàn)。因此,我們可以以如下方法構(gòu)造“印跡標識”和“印跡特征矢量”:
1.選定文件中的關(guān)鍵筆畫、字符、圖等,或設(shè)計特定的圖形作為印跡標識,并進而確定其被描述輪廓。印跡標識可簡單如圖2中的圓點。這時,其輪廓應(yīng)為其外圓;印跡標識若選定一直線或曲線,如一圖章的外圍,其被描述輪廓可為一側(cè)或兩側(cè);印跡標識若選定一字苻,其被描述輪廓可為其外側(cè)或某一個或幾個內(nèi)側(cè)或它們的級聯(lián)。
[0019]2.選定基點或基線。如圖2,其基點即為圓心。在處理程序中可以選擇其質(zhì)心。若為直線或曲線,可選擇其中線。
[0020]3.選擇取樣方式和取樣率。圖2中的點,我們選擇小扇型區(qū)域為一樣點,其黑點所及最大半徑即為該點取值。若為直線或曲線,則可選擇與中線垂直等間隔采樣。采樣率主要考慮兩個因素:一是應(yīng)用乃奎斯特采樣準則,能反映隨機特征;二是視應(yīng)用要求,與需要鑒別的文件數(shù)相匹配。若需要鑒別的文件數(shù)很大,則所形成的印跡特征矢量也應(yīng)該相應(yīng)增大。
[0021]4.順序讀取各樣點值,形成印跡特征矢量。
[0022]印跡標識的打印和一般字符和圖形一樣。只是為了識別的方便,可以把印跡標識放在特別的位置,并在特定位置加以標識符號。例如,在外圍四角放上十字標識。
[0023]印跡標識的識別和印跡特征的提取首先需要用高分辨率攝像機或掃描儀獲取文件圖像,然后用圖像處理方法,識別和定位印跡標識,實現(xiàn)以上所述印跡特征矢量提取方法。圖像處理方法見《數(shù)字圖像處理》R薩雷斯等著,阮秋琦阮宇智等譯,電子工業(yè)出版社,2003-03-01,ISBN:750538236。
[0024]三、打印文件的完整性和原件保護系統(tǒng)
基于上述的文件印跡,結(jié)合密碼學(xué)原理與應(yīng)用,打印文件的完整性和原件保護系統(tǒng)方框圖見圖3。系統(tǒng)接收兩種文件作為輸入,一是數(shù)字文件312,另一種是已經(jīng)是打印好的文件311。這里,如圖3所示的打印文件的完整性和原件保護方法的步驟是:(這里,我們假定給定的數(shù)字文件和打印文件已經(jīng)進行了原件和內(nèi)容的認證)
1.為了保護文件的完整性,從數(shù)字文件312中,或從已打印好文件311中提取內(nèi)容的摘要(digest)。提取摘要的方法很多,常用的方法是對文件的主要內(nèi)容使用加密技術(shù)中的散列(hash)的方法求內(nèi)容的摘要,即文件摘要323。它是該文件內(nèi)容的唯一性的表示。求摘要(digest)的方法見Afred J.Menezes, Paul C.van Oorschot 以及 Scott A.Vanstone所著“應(yīng)用加密技術(shù)手冊(Handbook of Applied Cryptography”,1996 年由 CRC Press 出版)。求摘要時,文件內(nèi)容應(yīng)為數(shù)字形式。對于打印文件311,可以在掃描后使用自動文字識別技術(shù),求得數(shù)字內(nèi)容。
[0025]若無保護文件完整性要求,或認為保護了文件的合法性或原件后,完整性也就在其中了,可以跳過這一步。
[0026]2.打印印跡標識,并求印跡標識的特征矢量。對數(shù)字文件和沒有印跡標識的打印文件來說,首先是打印文件,并將選好的印跡標識按選好的打印方案打印到文件上,形成打印文件和印跡標識321。然后按照前述印跡標識和印跡特征矢量提取的方法提取印跡特征矢量322。它是該打印文件唯一性的表示。
[0027]3.文件摘要和文件印跡特征矢量的加密。在獲得該文件原件的唯一性標識,即印跡特征矢量;以及文件內(nèi)容的唯一性表示,即文件摘要后,我們需要一權(quán)威機構(gòu)來確認整個保護的合法性和保護過程的安全性。我們稱此權(quán)威機構(gòu)為認證中心。由認證中心向本發(fā)明中的打印文件的完整性和原件保護和驗證系統(tǒng)核發(fā)密匙,即密匙313。它可以是共用密匙,也可以是公共密要系統(tǒng)。為敘述的方便,我們假定用共用密匙。以此對印跡特征矢量和內(nèi)容摘要加密,形成數(shù)字簽字332。至此,我們獲得了該文件的權(quán)威的原件(合法性)和完整性的證明材料。
[0028]4.數(shù)字簽字的保存。文件的數(shù)字簽字332是該文件的權(quán)威的合法性和完整性的證明材料。保存文件的數(shù)字簽字以待驗證非常重要。有兩種保存文件數(shù)字簽字的方法。一種很自然的方法是將文件的數(shù)字簽字送往認證中心。這樣,文件合法性和完整性的驗證就必須由認證中心來完成。這樣做的好處是統(tǒng)一、權(quán)威。缺點是都必須在線進行。另一種方法是將數(shù)字簽字使用條碼或字符等方式打印在文件上。這樣,若用條碼,打印文件、印跡標識和簽字條碼就形成了最后的文件輸出331。當(dāng)然,如果選擇將數(shù)字簽字送往認證中心,不打印在文件上,最后的輸出文件將只包括打印文件和印跡標識,不包括簽字條碼。
[0029]四、打印文件的完整性和合法性驗證
圖4所示為打印文件的完整性和合法性驗證的流程。給定待驗證文件411,其完整性和合法性驗證過程如下:
1.首先確定有無完整性保護,若無完整性保護,則僅做合法性驗證。
[0030]2.從待驗證文件中提取內(nèi)容摘要和印跡標識,并進而提取印跡特征矢量。檢查待驗證文件有無簽字條碼,若無,則將所提取內(nèi)容摘要和印跡特征矢量送往認證中心驗證。
[0031]3.從待驗證文件411中提取簽字條碼,并解出數(shù)字簽字412。
[0032]4.使用從認證中心來的密匙413,來解開數(shù)字簽字412,從而得到原文件的內(nèi)容摘要422和印跡特征矢量421。同樣,如何使用共用密匙或公共密匙加密和解密,請參考AfredJ.Menezes, Paul C.van Oorschot 以及 Scott A.Vanstone 所著“應(yīng)用加密技術(shù)手冊(Handbook of Applied Cryptography”,1996 年由 CRC