專利名稱:用于檢測、分析和使用可見認(rèn)證圖樣的改進(jìn)技術(shù)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般地涉及打印文檔中的安全性特征,更具體而言,涉及打印文檔中的可見認(rèn)證圖樣??梢娬J(rèn)證圖樣可被用于區(qū)分原始打印文檔和這些打印的文檔的影印拷貝,以檢測文檔的更改并且攜帶隱藏的和/或可見的消息。
背景技術(shù):
可見認(rèn)證圖樣(Visible Authentication Pattern,VAP)可被用于確定打印的文檔是否已經(jīng)被更改或文檔是原本(original)還是拷貝(copy)。VAP是數(shù)字文檔的一部分中的有噪聲(noisy)圖樣。它被用于通過將從模擬形式作出的數(shù)字記錄的一部分與模擬形式的該部分的原始數(shù)字表示形式相比較以確定記錄的部分和該部分的原始數(shù)字表示形式之間的相異(或相似)程度并且利用所述相異(或相似)程度確定模擬形式是否是原始模擬形式,從而來確定文檔的真實性。
VAP及其使用是上述美國專利申請10/514,271的主題。有關(guān)VAP的更進(jìn)一步經(jīng)驗引起了多個領(lǐng)域的改進(jìn)·在不影響VAP區(qū)分拷貝和原本的屬性的情況下在VAP中存儲信息;·利用VAP的平均信息量(entropy)在文檔圖像中定位它;·減輕將VAP結(jié)合到文檔中的審美影響;·應(yīng)對以下事實VAP可能經(jīng)歷多種打印和掃描過程,并且這些過程會修改出現(xiàn)在原始模擬拷貝和非原始模擬形式上的VAP;·在涉及數(shù)模變換和模數(shù)變換甚至數(shù)字到數(shù)字拷貝的其他應(yīng)用中使用VAP的類似物。
這里所公開的發(fā)明的一個目的是提供就這些和其他領(lǐng)域來說有所改進(jìn)的VAP。
發(fā)明內(nèi)容
在一個方面中,本發(fā)明的目的是通過用于在對數(shù)字認(rèn)證圖樣的平均信息量產(chǎn)生最小限度的影響的情況下將消息結(jié)合到數(shù)字認(rèn)證圖樣中的技術(shù)來實現(xiàn)的。在該技術(shù)中,VAP中的多組圖樣元素攜帶消息的消息元素。在攜帶消息元素的每組圖樣元素中,圖樣元素的值被設(shè)置,以便它們代表消息元素。設(shè)計圖樣元素的方式對于圖樣元素的平均信息量和它們的其他所需屬性具有最小限度的影響。本發(fā)明的這個方面包括用于創(chuàng)建具有消息的數(shù)字認(rèn)證圖樣和用于讀取消息的方法和裝置,以及利用該技術(shù)制成的包含消息的數(shù)字認(rèn)證圖樣。
在另一個方面中,本發(fā)明的目的是通過用于在不參考模擬形式的拷貝檢測圖樣的原本的數(shù)字表示形式的情況下確定包括拷貝檢測圖樣的模擬形式是否是原始模擬形式的技術(shù)來實現(xiàn)的。該技術(shù)掃描模擬文檔上的拷貝檢測圖樣,以制作拷貝檢測圖樣的數(shù)字表示形式,并利用數(shù)字表示形式的一個或多個全局屬性來制作初步確定模擬形式是否是原始模擬形式。
另一個方面是用于確定數(shù)字表示形式之間的拷貝關(guān)系的技術(shù)。數(shù)字表示形式中的每一個包括對由拷貝過程產(chǎn)生的更改敏感的部分,該技術(shù)修改來自數(shù)字表示形式之一的該部分,以使它更可以與來自其他數(shù)字表示形式的該部分相比擬。修改考慮到了由拷貝過程產(chǎn)生的更改。當(dāng)進(jìn)行修改時,這些部分被比較,以確定數(shù)字表示形式之間的拷貝關(guān)系。
其他方面包括·用于文檔的可視認(rèn)證圖樣,其被細(xì)分為分布在文檔上的多個單元;·用于利用可視認(rèn)證圖樣的平均信息量來定位圖樣的技術(shù);·模擬信號的數(shù)字表示形式,其包括對由模數(shù)和數(shù)模轉(zhuǎn)換產(chǎn)生的變換敏感的拷貝檢測信號的一種表示形式;以及·包括第一部分和第二部分的數(shù)字表示形式,在第一部分中數(shù)據(jù)具有差錯校正,在第二部分中數(shù)據(jù)沒有差錯校正并且數(shù)據(jù)對于由制作數(shù)字表示形式的數(shù)字拷貝的過程產(chǎn)生的更改敏感。
本發(fā)明相關(guān)領(lǐng)域的技術(shù)人員在熟讀下面的“具體實施方式
”和附圖之后,將會清楚看到本發(fā)明的其他目的和優(yōu)點。
圖1是關(guān)于如何生成可見認(rèn)證圖樣(VAP)并將其插入到文檔中的概況;圖2示出如何從文檔記錄VAP;圖3是示出如何將VAP用于認(rèn)證中的概況的流程圖;圖4是原始和非原始模擬形式的打印和認(rèn)證的概況;圖5示出用于水印檢測和更改檢測的GUI;圖6是示出VAP的原始數(shù)字表示形式和從非原始文檔記錄的VAP的頻帶中的能量之間的相互關(guān)系的圖;圖7是示出VAP的原始數(shù)字表示形式和從原始文檔記錄的VAP的頻帶中的能量之間的相互關(guān)系的圖;
圖8示出如何用基于消息的密鑰(key)來將無內(nèi)容水印嵌入到圖像中;圖9示出如何可將VAP結(jié)合到條形碼或標(biāo)識物(logo)中;功能一般是固定的,并且在每個測試CDP被恢復(fù)之后被應(yīng)用到其上;圖10示出示例性直方圖轉(zhuǎn)換函數(shù);圖11示出被掃描的經(jīng)恢復(fù)的CDP上的直方圖轉(zhuǎn)換的作用;圖12示出利用不同密鑰生成的若干個CDP;圖13示出具有平均分布的模板直方圖;圖14是利用分布式CDP進(jìn)行的檢查;圖15是CDP的校準(zhǔn)圖像;圖16示出分布在整個文檔中或文檔內(nèi)的對象中的CDP;圖17示出插入了消息的一組像素的變換;以及圖18示出如何可將VAP用于可視加密。
圖中的標(biāo)號有三個或更多個數(shù)字右邊兩個數(shù)字是由剩余的數(shù)位所指示的圖之中的標(biāo)號。從而,標(biāo)號為203的項目首先作為項目203出現(xiàn)在圖2中。
具體實施例方式
以下直到“VAP與其他安全性技術(shù)的結(jié)合”部分為止的“具體實施方式
”是從上述Picard,Zhao和Thorwirth的標(biāo)題為“Visible AuthenticationPatterns fir Printed Documents”的U.S.S.N.10/514,271獲得的。正如該專利申請中所說明的,數(shù)字水印在文檔中的一種用途是用來檢測由于打印-掃描過程導(dǎo)致的修改,并從而確定文檔是原本還是拷貝。另一個用途是用來檢測文檔是否已被更改。水印的這兩個用途的特性是它們是基于水印的存在與否的,而不是基于其內(nèi)容的。
可見認(rèn)證圖樣當(dāng)僅僅是水印的存在性被用于確定模擬形式的真實性時,水印被用作無內(nèi)容圖樣。由于圖樣沒有內(nèi)容,因此它就不需要是不可見的;相反,它可以作為可見元素被添加到文檔中。在下文中,用于認(rèn)證的可見圖樣被稱為可見以證圖樣或VAP。由于VAP是可見的,因此比起水印來它容易檢測得多,并且由于原始文檔的拷貝而導(dǎo)致的惡化量可以被更好地估計。但是,它仍能夠執(zhí)行不可見水印的所有認(rèn)證功能,并且還能使文檔的消費者知道文檔的真實性是受到保護(hù)的。
術(shù)語下面的術(shù)語將被用于“具體實施方式
”中,以闡明數(shù)字表示形式和模擬形式之間的關(guān)系。
對象的數(shù)字表示形式(digital representation)是對象的一種形式,在這種形式中,對象可以被存儲在數(shù)字處理系統(tǒng)中,并且可以被數(shù)字處理系統(tǒng)操縱。對象可以是或者可以包括文檔、圖像、音頻、視頻或其數(shù)字表示形式能夠被制成的任何其他媒體。
數(shù)字表示形式的模擬形式(analog form)是在數(shù)字表示形式被輸出到模擬設(shè)備時產(chǎn)生的對象或成分的形式,所述模擬設(shè)備例如是顯示器、打印機、揚聲器、燒制器(高密盤或DVD盤)、雕刻(engraving)或壓紋(embossing)設(shè)備。
模擬形式的數(shù)字記錄(digital recording)是從模擬形式制成的數(shù)字表示形式。制作數(shù)字記錄的方式依賴于媒體;例如,對于文檔或圖像,數(shù)字記錄是通過對從文檔或圖像的模擬形式制成的圖像進(jìn)行數(shù)字化來完成的。
原始數(shù)字表示形式(original digital representation)是由被授權(quán)者制成或重新創(chuàng)建成的數(shù)字表示形式;原始模擬形式(original analog form)是從原始數(shù)字表示形式制成的模擬形式。
非原始數(shù)字表示形式(non-original digital representation)是通過數(shù)字地記錄模擬形式而制成的數(shù)字表示形式;非原始模擬形式(non-originalanalog form)是從非原始數(shù)字表示形式制成的或通過對模擬形式進(jìn)行影印而制成的模擬形式。
文檔(document)將會被賦予以下特殊意義由打印過程產(chǎn)生的任何模擬形式,其中包括通常意義上的自身帶有特征的文字、標(biāo)志、包裝和對象。這里所使用的打印(printing)包括例如雕刻或壓紋這樣的過程。在可以進(jìn)行合理類推的范圍內(nèi),下面所說的任何關(guān)于文檔的內(nèi)容都同樣適用于其他媒體。例如,音頻模擬形式可以包括作為VAP的音頻等同物的可聽認(rèn)證圖樣。
制作可見認(rèn)證圖樣圖1可見認(rèn)證圖樣的矛盾之處在于雖然圖樣是可見的,但可能的造假者必須不能修改圖樣以使它認(rèn)證不真實的文檔。在優(yōu)選實施例中,這一目標(biāo)是通過使圖樣有噪聲來實現(xiàn)的,即構(gòu)成圖樣的像素的值的大部分明顯是隨機確定的。由于圖樣是有噪聲的,因此如果不訪問圖樣的原始數(shù)字表示形式就不可能辨別構(gòu)成圖樣的數(shù)字表示形式的像素應(yīng)當(dāng)具有什么樣的值。另一方面,在給定VAP的原始數(shù)字表示形式的情況下,可以將來自文檔的VAP的數(shù)字記錄與VAP的原始數(shù)字表示形式相比較,確定記錄的VAP相對于VAP的原始數(shù)字表示形式經(jīng)歷了怎樣的更改,并且可以從差異確定所討論的文檔經(jīng)歷了怎樣的更改。從下面可以更詳細(xì)看出,能夠檢測到的更改包括在制作非原始文檔時涉及的更改以及在更改文檔中的信息時涉及的更改。
圖1示出制作可見認(rèn)證圖樣并將其插入到文檔中的一種方式。有三個步驟·生成圖樣的數(shù)字表示形式,如101處所示;·可選的步驟將可見標(biāo)識物或圖例添加到認(rèn)證圖樣中,如107處所示;以及·將認(rèn)證圖樣插入到文檔中,如113處所示。
圖樣105的原始數(shù)字表示形式可以用任何產(chǎn)生以下結(jié)果的方式來生成圖樣的像素看起來擁有具有強隨機成分的值。圖樣105的數(shù)字表示形式可以是灰度級圖樣,或者它可以采用彩色像素。采用密鑰來生成圖樣尤其有用;密鑰103被用作偽隨機數(shù)生成器的種子,該生成器產(chǎn)生被賦給圖樣中的像素的值的序列。后面將詳細(xì)說明密鑰的使用。圖樣105的原始數(shù)字表示形式還可以包括幫助在通過掃描包含圖樣105的文檔制成的數(shù)字表示形式中定位圖樣的成分。在圖樣105中,黑邊106執(zhí)行該功能。
可見標(biāo)識物或圖例109可以被添加到圖樣105的原始數(shù)字表示形式,以便在不損害圖樣105的噪聲性的情況下制成圖樣111的原始數(shù)字表示形式,這是因為構(gòu)成圖樣的像素的值中只有一部分需要隨機的確定。從而,可以通過以保持標(biāo)識物或圖例的隨機性同時使得標(biāo)識物或圖例顯現(xiàn)的方式操縱構(gòu)成標(biāo)識物或圖例的像素的值來將標(biāo)識物或圖例疊加在圖樣105中。例如,如果圖樣105是灰度級圖樣,則可以通過使圖例或標(biāo)識物的像素相對于其原始隨機值均勻地更暗或更亮來制作圖例或標(biāo)識物。該技術(shù)與向圖像添加可見水印類似,只不過它保持了圖樣105的噪聲性。
一旦圖樣111的原始數(shù)字表示形式已經(jīng)被制成,它就被插入到文檔115的原始數(shù)字表示形式中,如113處所示。當(dāng)從原始數(shù)字表示形式115打印文檔117時,文檔117包括打印的可見認(rèn)證圖樣119。當(dāng)然,文檔可以被打印到其上已經(jīng)有打印的材料的基底上。從而,圖樣119可以被添加到預(yù)打印的基底。
利用可見認(rèn)證圖樣來認(rèn)證文檔;圖2和圖3當(dāng)包含打印的VAP 119的文檔被認(rèn)證時,發(fā)生下面步驟·在文檔中檢測到打印的VAP 119.
·制作檢測到的打印的VAP 119的數(shù)字記錄。
·將打印的VAP的數(shù)字記錄與VAP的原始數(shù)字表示形式相比較;以及·基于比較確定真實性。
打印的VAP的數(shù)字記錄與VAP的原始數(shù)字表示形式相比較的方式依賴于所進(jìn)行的認(rèn)證的種類;此外,對給定文檔的認(rèn)證可以包括在數(shù)字記錄和原始數(shù)字表示形式之間進(jìn)行的若干個不同種類的比較。例如,支票的數(shù)量字段上的可見認(rèn)證圖樣的數(shù)字記錄可以首先與原始數(shù)字表示形式相比較,以確定支票是否是偽造品,然后確定數(shù)量字段中的數(shù)量是否被更改過。
圖2示出優(yōu)選實施例中的檢測打印的VAP和制作VAP的數(shù)字記錄。這兩者都是利用可從MediaSec Technologies獲得的“Scanread”應(yīng)用程序完成的。也可以采用檢測文檔的一部分并制作其數(shù)字記錄的其他應(yīng)用。Scanread 201利用黑邊106來檢測打印的文檔117中可見認(rèn)證圖樣119的存在,然后制作可見認(rèn)證圖樣119的數(shù)字記錄203。圖3示出了利用數(shù)字記錄203和VAP 119的原始數(shù)字表示形式111來確定真實性的程序的一般流程圖301。VAP的原始數(shù)字表示形式111可以是原本本身、原本的拷貝,或者是用與第一原始數(shù)字表示形式完全相同的方式制作的新的原始數(shù)字表示形式111。通過這些方法中的任何一種獲得的原始數(shù)字表示形式當(dāng)然是完全等同的,使用哪種方法是實現(xiàn)方式方面的問題,例如VAP的原始數(shù)字表示形式的存儲成本、在網(wǎng)絡(luò)上傳輸VAP的原始數(shù)字表示形式的成本,以及每次需要時生成原始數(shù)字表示形式的成本。
從303處開始,在305處,數(shù)字記錄203和原始數(shù)字表示形式111的特征被比較;比較哪些特征以及如何比較這些特征依賴于所進(jìn)行的認(rèn)證的種類。如果數(shù)字記錄203和原始數(shù)字表示形式111之間的差異超過閾值(307),則存在認(rèn)證問題,并且取分支309。閾值也將依賴于所進(jìn)行的認(rèn)證的種類。在分支309中,在311處,向進(jìn)行認(rèn)證的應(yīng)用程序指示問題的存在。如果有用的話,程序還可以提供關(guān)于比較的信息(315);同樣,信息的各種和提供信息的方式將會依賴于認(rèn)證種類。例如,如果數(shù)量字段中的數(shù)量看起來曾被更改,則程序可以顯示一幅圖像,該圖像示出在可見認(rèn)證圖樣的數(shù)字記錄中原始數(shù)字表示形式的哪些像素看起來曾被更改。如果差異不超過閾值,則取分支317。在這里,向進(jìn)行認(rèn)證的應(yīng)用程序指示未檢測到認(rèn)證問題這一事實。兩條分支和程序都終止于321處。
利用可見認(rèn)證圖樣來區(qū)分原始文檔和非原始文檔圖4、圖5,將可見認(rèn)證圖樣用于認(rèn)證文檔的一種方式是通過確定文檔是原本,即是從原始數(shù)字表示形式打印來的,還是非原本,即是從文檔影印來的或從非原始數(shù)字表示形式打印來的,也就是從對文檔的未經(jīng)授權(quán)的數(shù)字記錄制成的數(shù)字表示形式??梢杂眠@種方式來使用可見認(rèn)證圖樣的原因是從文檔的數(shù)字表示形式打印文檔并從其數(shù)字記錄制作文檔的數(shù)字表示形式或影印文檔總是會導(dǎo)致可見認(rèn)證圖樣中信息的損耗,不論打印、數(shù)字記錄或影印過程多么精確都是如此;因此,可以通過將可見認(rèn)證圖樣的原始數(shù)字表示形式與通過從文檔記錄可見認(rèn)證圖樣制成的數(shù)字表示形式相比較,來確定文檔是原本還是非原本。在原始文檔的情況下,可見認(rèn)證圖樣已經(jīng)被打印一次并被數(shù)字地記錄一次;在非原始文檔的情況下,可見認(rèn)證圖樣已經(jīng)被打印和數(shù)字地記錄一次以產(chǎn)生用來制作非原始文檔的原始文檔,然后依賴于如何制作非原始文檔,可見認(rèn)證圖樣被影印或者再次被打印和數(shù)字地記錄,從而在非原始文檔的可見認(rèn)證圖樣中產(chǎn)生比原始文檔的可見認(rèn)證圖樣中更大的信息損耗。
基本技術(shù)在圖4中詳細(xì)示出。在401處,示出了利用可見認(rèn)證圖樣進(jìn)行的認(rèn)證如何對原始文檔起作用。文檔的原始數(shù)字表示形式403包含原始可見認(rèn)證圖樣(ovap)405。然后,在407處,原始數(shù)字表示形式403被打印以產(chǎn)生原始模擬形式409。打印操作導(dǎo)致模擬形式409中的原始模擬可見認(rèn)證圖樣(oavap)411中的loss1。當(dāng)認(rèn)證者421認(rèn)證模擬形式409時,它制作oavap 411的數(shù)字記錄,從而導(dǎo)致loss2。記錄顯現(xiàn)為roavap 415。然后認(rèn)證者421采用比較器417來比較ovap 406和roavap 415。其間的差異是loss1和loss2的和。這在將任何未受其他損毀的roavap 415與ovap415相比較時都是成立的,而這樣大小的差異是對模擬形式409確實是原始模擬形式的可靠指示。
在420處,可以看出認(rèn)證如何對非原始文檔起作用。原始文檔和非原始文檔之間的差異在于非原始文檔不是直接從文檔的原始數(shù)字表示形式403打印成的,而是從文檔的非原始數(shù)字表示形式423打印成的,其中文檔的非原始數(shù)字表示形式423是通過數(shù)字地記錄原始文檔409而制成的(422)。作為數(shù)字記錄的結(jié)果,數(shù)字表示形式423中的非原始可見認(rèn)證圖樣425經(jīng)歷了額外的信息損耗,這在圖4中顯現(xiàn)為loss3。當(dāng)從數(shù)字表示形式423打印(427)非原始模擬形式429時,在非原始模擬可視認(rèn)證圖樣中出現(xiàn)另一個損耗,其被表示為loss4。當(dāng)如上所述非原始模擬形式429被認(rèn)證者421認(rèn)證,并且從noavap 431制成的rnoavap 435被與ovap 405相比較時,loss3和loss4的效果將會作為ovap 405和rnovap 435之間的比ovap 405和roavap 415之間的差異更大的差異出現(xiàn)。由于非原始模擬形式429中的noavap 431將會始終經(jīng)歷額外的loss3和loss4,因此更大的差異是對非原始文檔的可靠指示。
非原始模擬形式429當(dāng)然可以通過影印過程產(chǎn)生,也可以通過記錄原始模擬形式(422)以制作非原始數(shù)字表示形式423,然后打印(427)數(shù)字表示形式423以產(chǎn)生非原始模擬形式429的過程產(chǎn)生。獲取原始模擬形式409的圖像然后從圖像打印非原始模擬形式429的過程導(dǎo)致像loss3和loss4那樣的額外的損耗,因此,以這種方式產(chǎn)生的rnoavap 435與ovap405的相似程度仍將比roavap 425與ovap的相似程度更低。
當(dāng)然,如果非原始數(shù)字表示形式423本身是從非原始數(shù)字表示形式制成的,則rnovap 435也將會包括由對該非原始數(shù)字表示形式的影印或者打印和數(shù)字記錄而導(dǎo)致的額外損耗。顯然,如果loss1和loss2是固定值,則檢測器將始終能夠確定文檔是原始的還是非原始的。但是,一般來說每個損耗都會發(fā)生一些變化,例如某些原本比起其他原本來能夠以更好的質(zhì)量(保真度)打印。于是看起來應(yīng)當(dāng)采用統(tǒng)計檢測方法。
關(guān)于區(qū)分原始和非原始文檔的細(xì)節(jié)圖6和圖7認(rèn)證技術(shù)的價值實際上就在于其可靠性。使檢測差錯的概率最小化的關(guān)鍵是用于測量從文檔記錄的可視認(rèn)證圖樣與可視認(rèn)證圖樣的原始數(shù)字表示形式之間的“差異”的方法。所選擇的測量方法必須基于受制作非原始文檔的過程影響的VAP的屬性,并且必須清楚地區(qū)分原始文檔和非原始文檔。
我們的方法是將影印、記錄和打印過程考慮成濾波器,更具體地說是低通濾波器。從而,比起低頻來,高頻被打印和記錄過程衰減的程度將會更高,并且在每個記錄和打印或影印頻率將會損耗更多信息。對于其中記錄和打印或影印過程保留幾乎所有能量的低頻,非原始文檔中的VAP擁有的信息可能不會比原始文檔中的VAP少很多。很高的頻率可能也是沒有幫助的,這是因為VAP中在這些頻率下的大部分能量在VAP首次被打印時就損耗了。因此,即使是原始文檔的VAP也只包含著很少的來自這些頻率的信息。因此,必須對檢測器使用的頻率進(jìn)行適當(dāng)?shù)倪x擇和/或加權(quán)。對用于比較的頻率的選擇以及對用于確定文檔是原始還是非原始的閾值的選擇一般是通過在來自原始文檔的VAP上訓(xùn)練比較軟件來完成的。
在這里應(yīng)當(dāng)指出,上述技術(shù)不需要特殊的可視認(rèn)證圖樣。相反,整個文檔或其一部分可以被用作圖樣。但是,由于許多文檔可能不包含處于確定文檔是原本還是拷貝所需的能量級別的信息,因此最好使用包含處于適當(dāng)能量級別的信息的可視認(rèn)證圖樣。在下文中,這種可視認(rèn)證圖樣將被稱為拷貝檢測圖樣(copy detection pattern),或CDP。CDP中的信息分布在適當(dāng)?shù)念l率中。在優(yōu)選實施例中,CDP的原始數(shù)字表示形式是通過密鑰以偽隨機方式生成的,因此能夠訪問該密鑰的程序就隨時能夠創(chuàng)建CDP的原始數(shù)字表示形式的新拷貝。該密鑰可以被保密,或者只被透露給受信任的當(dāng)事人??截悪z測圖樣被插入或打印在要保護(hù)的文檔上。在優(yōu)選實施例中,對來自文檔的拷貝檢測圖樣的分析是通過數(shù)字地記錄文檔的CDP、利用密鑰生成CDP的原始數(shù)字表示形式的新拷貝,并且將記錄的CDP與CDP的原始數(shù)字表示形式相比較來完成的。在其他實施例中,可以簡單地將記錄的CDP與CDP的原始數(shù)字表示形式的先前存在的拷貝相比較。
該技術(shù)中使用的算法本部分描述用于進(jìn)行以下操作的算法(1)生成CDP的原始數(shù)字表示形式;(2)從文檔檢測和提取CDP;(3)將CDP的原始數(shù)字表示形式與記錄的CDP相比較;以及(4)確定CDP是原始的還是非原始的。算法(4)中比較CDP的方式以及用于確定CDP是原始的還是非原始的閾值是通過訓(xùn)練過程來確定的,在該訓(xùn)練過程中,算法(3)被用于收集訓(xùn)練數(shù)據(jù)。
生成CDP的原始數(shù)字表示形式函數(shù)make_pattern被用于創(chuàng)建可以用從其制作原始文檔的數(shù)字表示形式的源標(biāo)識的拷貝檢測圖樣的數(shù)字表示形式(pattern_img)。make_pattern生成有噪聲灰度級或彩色圖樣。黑邊也可以被添加到圖樣,以幫助在文檔中檢測它。CDP還可以可選地顯示標(biāo)識物。標(biāo)識物一般將會影響最低頻帶,因此其對檢測的影響將會是有限的。典型值在對參數(shù)的說明中給出。
pattern_img=make_pattern(type,height,width,key,filename,border,logo_img,logo_weight)。
用于圖樣生成的參數(shù)必需1.Type生成的隨機數(shù)值的類型,例如“randn”(高斯型N(0,1)),“rand”(等概率分布)、“randint”(二元+1或-1分布),或MD5、SHA算法(0-255整數(shù))。隨機數(shù)值隨后被用于構(gòu)成灰度級或彩色圖像。
2.Height圖樣高度,以像素為單位(例如104)。
3.Width圖樣寬度,以像素為單位(例如304)。
4.Key用作隨機數(shù)生成器的種子的整數(shù)值秘密密鑰(secret key)或口令。
可選5.Filename保存圖樣圖像的文件的名稱。
6.Registration mark(例如添加到圖樣圖像邊緣的黑邊,添加到圖樣圖像四角的點)。
7.Logo_img要用作背景標(biāo)識物的圖像,自動縮放到圖樣圖像的尺寸。
8.Logo_weight0到1之間的值,用于對疊加在圖樣圖像上的標(biāo)識物圖像的能量加權(quán)(例如0.2)。
圖樣生成算法的使用示例1.在特定域中生成圖樣(例如彩色RGB模式中的空間或DCT亮度)pattern=generate_pattern(type,height,width,key);2.如果步驟1中的域不是空間域,則將圖樣變換到空間域(例如逆DCT)
pattern_img=transform(pattern);3.如果需要,將像素值p舍入到整數(shù)值0<p<255。
4.將標(biāo)識物與圖樣相結(jié)合,例如混合方程可以如下pattern_img=(1-logo_weight)*pattern_img+logo_weight*logo_img;5.添加配準(zhǔn)標(biāo)記(例如黑邊)。
6.轉(zhuǎn)儲圖像。
圖樣圖像可以由多個分量/通道構(gòu)成,例如紅、藍(lán)、綠或YUV,它們可以按上述步驟1和2的方式產(chǎn)生。
為了將CDP與標(biāo)識物或背景圖像相結(jié)合,可以采用各種混合函數(shù)。例如,當(dāng)CDP與條形碼(圖像)合并時,CDP只替換條形碼的黑色區(qū)域,而保持白色區(qū)域不變。
可以生成任何形狀(例如圓形、橢圓形)的圖樣圖像。一種簡單的方法是使用“形狀掩膜”,其限定由“1”和“0”構(gòu)成的二維陣列所代表的任意形狀。通過將“形狀掩膜”應(yīng)用到矩形圖樣圖像,可以創(chuàng)建任何形狀。
從文檔檢測和提取VAP在本實現(xiàn)方式中,制作被認(rèn)證的文檔的數(shù)字記錄,并且用VAP上的黑邊來定位數(shù)字記錄中的VAP。黑邊導(dǎo)致過渡區(qū)域的強烈亮度變化,這是很容易檢測到的。也可以使用其他的用于確定VAP的位置的技術(shù)(例如文檔中的現(xiàn)有特征、黑點等等)。一旦檢測到VAP,就制作它的數(shù)字表示形式,該數(shù)字表示形式可以與VAP的原始數(shù)字表示形式相比較。數(shù)字表示形式是記錄的VAP。
利用以下函數(shù)比較VAP的原始數(shù)字表示形式和記錄的VAP。該函數(shù)測量記錄的VAP與VAP的原始數(shù)字表示形式的“接近”程度的指標(biāo)。VAP的原始數(shù)字表示形式可以被存儲在檢測器的存儲器中,或者如果用于創(chuàng)建原始數(shù)字表示形式的參數(shù)和函數(shù)make_pattern(..)對于檢測器可用,則VAP的原始數(shù)字表示形式可以被重新生成。當(dāng)將圖樣與標(biāo)識物相結(jié)合時使用的可選參數(shù)可能不是必需的,因為標(biāo)識物一般只會輕微地影響圖樣的屬性。用于進(jìn)行比較的函數(shù)是analyze_pattern,其返回Results,并且可以根據(jù)實際應(yīng)用的場景取不同的參數(shù)Results=analyze_pattern(type,height,width,key,...,test_img);或者Results=analyze_pattern(orig_img,test_img);參數(shù)和輸出1.type、height、width和key這些與對圖樣生成的說明一致。
2.test_img從文檔提取的測試圖樣圖像。
3.orig_img圖樣的原始數(shù)字表示形式。
4.Results包含分析的所有結(jié)果。例如,它可以包括為圖像的不同元素(例如不同的頻率、不同的區(qū)域、不同的顏色通道等等)計算的相關(guān)性和統(tǒng)計數(shù)據(jù)的不同度量。
下面的示例示出重新生成原始數(shù)字圖樣的算法的頻率以及算法所需的子函數(shù)1.(可選)從測試CDP去除黑邊2.將測試圖樣圖像變換到它的原始生成域中,例如8×8塊DCTtest_pattern=transform(test_img);3.重新生成原始CDP;pattern=make_pattern(type,height,width,key);4.(可選)在本地將測試CDP與原始CDP同步,如下所述。(可選)向測試CDP應(yīng)用某些圖像濾波器(例如銳化),以產(chǎn)生與原始CDP的更好的相關(guān)性。
5.如果需要,將原始CDP和測試CDP轉(zhuǎn)換到進(jìn)行比較的域(例如8×8塊DCT)。注意比較可以在多于一個域中進(jìn)行,例如既在空間域中進(jìn)行,又在頻域中進(jìn)行。
6.為變換后的域中的每個通道計算原始CDP和測試CDP之間的相似性的若干個測量結(jié)果。例如,如果圖樣是在彩色RGB域中生成和記錄的,則分析在8×8塊DCT域中進(jìn)行。于是有192(即8×8×3)個組合,通過這些組合兩個圖樣被比較,從而可以執(zhí)行對相似性的192次測量。相似性度量本身可以用若干種方式來計算,例如通過對值進(jìn)行分級并且只保留有較高的相關(guān)性的值,以便排除測試CDP中可能已受破壞的區(qū)域。
7.收集和組合基于其他圖像特征的所有一個或多個相似性度量,以測量測試CDP的質(zhì)量或測試CDP與原始CDP的“接近度”的一個或多個指標(biāo)。組合函數(shù)可以是任何組合不同輸入的函數(shù),例如通過向原始CDP和測試CDP之間更有區(qū)分力的特征分配更高的權(quán)重或重要性來組合相似性度量的函數(shù)。
如上所述,復(fù)制過程總是會有損原始CDP,并且一般預(yù)期對于從模擬形式記錄的CDP,接近度或質(zhì)量的不同度量會更低。但是,由于統(tǒng)計變化,在確定測試CDP是從原始模擬形式記錄的還是從非原始模擬形式記錄的時,對不同度量的充分選擇和組合將會更有效。
圖6示出對于30個頻帶(在603處示出),來自被認(rèn)證的文檔的原始CDP和測試CDP中的頻率的能量之間的相關(guān)性(在605處示出)。正如預(yù)期,能量之間的相關(guān)性在低頻帶中最高,而在高頻帶中最低,其中,在拷貝過程中從低頻帶只損耗很少的信息,而在高頻帶中,即使是單個打印操作也會導(dǎo)致大部分信息的損耗。如果在中頻帶中的相關(guān)性比來自原始文檔的CDP的平均值低得多,則CDP不是原本,因此被認(rèn)證的文檔也不是原本。這是圖6的圖線的情況,該圖因而示出了被認(rèn)證的文檔不是原本。
當(dāng)相關(guān)性值本身不足以確定文檔是原始模擬形式還是非原始模擬形式時,也可以考慮其他圖像特征??梢杂糜诋a(chǎn)生原始CDP和測試CDP之間的相關(guān)性值的額外的圖像特征包括-顏色直方圖-邊緣、線條和輪廓-其他域(例如傅立葉和小波域)中的頻率-亮度和對比度檢測CDP是來自原始文檔還是非原始文檔函數(shù)detect_pattern分析由analyze_pattern返回的結(jié)果,并且返回值Output,該值指示CDP是來自原始文檔還是非原始文檔。
Output=detect_pattern(Results,Parameters)Results可以是標(biāo)量值或向量,函數(shù)analyze_pattern的輸出。
Parameters調(diào)節(jié)檢測函數(shù)的行為所需的值,它可以依賴于應(yīng)用的要求和執(zhí)行檢測的條件。
Output可能有不同的輸出值。就其最簡單的形式而言,Output可以取三個值ORIGINAL、NON-ORIGINAL或PROCESSING-ERROR。最后的輸出可能發(fā)生在圖樣被惡劣地記錄時。Output可以返回更詳細(xì)的信息,例如NON-ORIGINAL可以進(jìn)一步指示來自非原始文檔的測試圖樣是如何產(chǎn)生的(例如復(fù)制、影印、重新生成等等)。Output還可以提供質(zhì)量或接近度的指標(biāo)。
以下是簡單檢測函數(shù)的算法的示例1.組合由analyze_pattern返回的各種Results值,以獲得標(biāo)量值S。做到這一點的一種方式將會是通過對返回的Results求和來產(chǎn)生S。
2.如果S>T1,則輸出ORIGINAL,否則如果S>T2則輸出為NON_ORIGINAL,否則輸出為PROCESSING ERROR。
在這里T1和T2是兩個標(biāo)量參數(shù),它們一般是經(jīng)由訓(xùn)練過程獲得的,其中一般T1>T2。
來自文檔的CDP與原始CDP的本地重同步為了將從文檔記錄的CDP與原始CDP相比較,記錄的CDP必須與原始CDP同步。做到這一點的一種方式是使用記錄的CDP中的同步點,例如黑邊601,來同步原本。一旦CDP被同步,其間的比較就被逐像素或逐塊地進(jìn)行。
當(dāng)在文檔中打印CDP時或在從文檔數(shù)字地記錄CDP時發(fā)生差錯時,就不能用這個方法來完全地同步CDP。例如,在原始CDP和從文檔記錄CDP之間必然有少于一個像素的移位。此外,在圖樣上移位可能發(fā)生變化在某些情況下,記錄的CDP的上半部分與原始CDP相比可能向下移位,而下半部分向上移位(當(dāng)然也可能反之)。這些移位可能很難注意到,可能不會一貫地發(fā)生,或者可能在記錄的圖樣中發(fā)生本地變化。它們一般是由打印機中的輕微不穩(wěn)定性導(dǎo)致的,但是也可能由記錄設(shè)備中的類似的不穩(wěn)定性導(dǎo)致。
這些不可預(yù)測的亞像素移位可能降低檢測器的性能由于這些失準(zhǔn)(misalignment),某些來自原始文檔的CDP可能被檢測成來自非原始文檔的。一種應(yīng)對這些來自原始文檔的“病態(tài)”CDP的方法以及一般來說改進(jìn)CDP檢測的穩(wěn)定性的方法是在本地對CDP進(jìn)行重同步,以校正本地失準(zhǔn)。存在若干種執(zhí)行本地重同步的方式,但是一般概念是利用記錄的CDP本身來進(jìn)行本地重同步。
一種執(zhí)行本地重同步的方式是將原始CDP劃分成塊(不交迭的塊是優(yōu)選的,但是塊也可以交迭),并且找出記錄的CDP中的哪個塊與原始CDP的給定塊具有最接近的匹配。如果沒有失準(zhǔn),則記錄的CDP的與給定塊最接近匹配的塊在記錄的CDP中的位置將會與給定塊在原始CDP中的位置相同例如原始CDP的具有開始位置(80,80)和結(jié)束位置(89,89)的10×10塊的最佳匹配將會是記錄的CDP的相應(yīng)的塊(80,80)到(89,89)。但是,如果存在失準(zhǔn),則最佳匹配也可能是與塊(81,80)到(90,89)(向右移位一個像素)。如果是這樣的話,則記錄的圖樣將會使塊(81,80)到(90,89)向左移位1個像素到位置(80,80)到(89,89)。同樣的概念可以應(yīng)用到記錄的CDP中的每個塊,以產(chǎn)生“經(jīng)本地重同步的”CDP。
本地重同步要求幾個參數(shù)和函數(shù)。首先,我們必須定義原始CDP的每個塊和記錄的CDP的具有相同尺寸的塊之間的距離的度量。用于此目的的方便的度量是標(biāo)準(zhǔn)相關(guān)系數(shù)。還有必要設(shè)置原始CDP被劃分成的塊的尺寸;一般可以使用尺寸為8×8或16×16的塊,但是一般來說可以使用尺寸為N×M的塊。如前所述,塊可以是交迭的,在這種情況下,需要定義連續(xù)的塊之間的交迭量。要設(shè)置的另一個參數(shù)是搜索范圍或搜索區(qū)域從匹配位置開始,算法為了搜索匹配塊應(yīng)當(dāng)進(jìn)行到何種程度?這是用參數(shù)n來設(shè)置的,其中對于開始于原始CDP的位置(x,y)的塊,所有位置為(x+/-i,y+/-i)(0<i<n)的塊都被測試。
還可以在進(jìn)行本地重同步之前對數(shù)字和記錄的CDP進(jìn)行縮放這允許了顆粒更細(xì)的匹配。例如,通過將兩個CDP放大2,可以恢復(fù)半像素移位。最后,可以對經(jīng)重同步的CDP迭代應(yīng)用同步算法,直到不再發(fā)現(xiàn)進(jìn)一步的改善。
一旦執(zhí)行了重同步,就可以執(zhí)行經(jīng)重同步的記錄的CDP和原始CDP之間的相似性/距離的任意度量??梢詧?zhí)行簡單的相關(guān)或本地頻率分析,其中可能利用基于訓(xùn)練集合的參數(shù)。這些度量一般在整個CDP上對某個量取平均,但是對于可能發(fā)生在某些應(yīng)用中的對掃描的CDP的某些本地?fù)p毀并不是始終魯棒。例如,在某些情況下,CDP的一個區(qū)域可能是惡劣地打印的,或者可能受到了刮擦、書寫或水的損毀。在其他情況下,掃描設(shè)備可能向掃描的CDP插入了失真,這個問題一般發(fā)生在饋通型設(shè)備上,并且是在文檔未被正確插入時發(fā)生的。為了使得CDP對于這些種類的失真更為魯棒,可以使用相似性的更魯棒的度量一個這種度量是中值本地相關(guān)系數(shù),其中為CDP的每個塊計算一個相關(guān)系數(shù),并且計算所有本地相關(guān)系數(shù)的中值。在這里,計算中值而不是平均值使得檢測器對于本地更改明顯更加魯棒。為了對付CDP中的大量經(jīng)破壞的區(qū)域,還可以只計算能夠被假定為非經(jīng)破壞的20%的最佳本地相關(guān)系數(shù)的平均值。在一種實現(xiàn)方式中,計算此類“有偏”平均值的這個計算過程被單獨應(yīng)用到每個頻率通道,并且可選地應(yīng)用到不同的顏色通道。當(dāng)然,前述同步技術(shù)不僅可以用于CDP,還可以用于任何記錄的需要與原始可見認(rèn)證圖樣同步的可見認(rèn)證圖樣。
CDP的應(yīng)用CDP可以用于任何它有助于區(qū)分原始文檔和非原始文檔的情形。CDP可以通過任何以充分的保真度打印CDP的過程來打印,以便CDP的數(shù)字記錄能夠與CDP的原始數(shù)字表示形式相比較。圖樣可能尤其適合于檢測由特定的影印、掃描或打印技術(shù)制成的非原始文檔。CDP的特殊使用包括1.將CDP打印在包裝中以進(jìn)行商標(biāo)保護(hù)2.將CDP打印在支票或貨幣上以進(jìn)行拷貝檢測3.將CDP打印在包括證書、合同之類的貴重文檔上,以驗證文檔是原本還是拷貝。
4.將CDP打印在全息圖上5.將CDP打印在貴重貨物上,例如航空/汽車零件或藥物。
更一般而言,CDP可以用于任何需要能夠確定向文檔應(yīng)用了什么過程的應(yīng)用中。圖樣當(dāng)然可以根據(jù)需要而改變以最佳地檢測感興趣的過程。
CDP也可用于下面的應(yīng)用1.打印質(zhì)量的基準(zhǔn)檢查當(dāng)讀取CDP時,CDP的數(shù)字記錄的質(zhì)量指標(biāo)被計算。該質(zhì)量指標(biāo)將會根據(jù)打印質(zhì)量、紙張/基底質(zhì)量或數(shù)字化/掃描(設(shè)備)質(zhì)量而改變。CDP質(zhì)量指標(biāo)于是可以用于量化某個打印過程、某個襯底或某個掃描儀的質(zhì)量。
2.質(zhì)量控制同樣,CDP讀取器可以被用在打印生產(chǎn)過程中,用于自動質(zhì)量控制。CDP與手動檢查相比的優(yōu)點在于它給出了對質(zhì)量的自動、客觀且準(zhǔn)確的度量。
3.跟蹤CDP具有與打印機、紙張、照相機和使用和磨損相關(guān)聯(lián)的結(jié)構(gòu)和特性。原則上,對CDP的分析可以確定文檔的一般“歷史”它是如何被打印的,以及它經(jīng)歷了什么樣的“磨損”。
VAP的實現(xiàn)細(xì)節(jié)文檔中VAP的形式用VAP來檢測模擬形式中的更改所需的只是模擬形式中存在著具有會達(dá)到此目的的圖樣的區(qū)域并且該圖樣的原始數(shù)字表示形式能夠與從模擬形式記錄的圖樣相比較。因此,在某些情況下可以將模擬形式中的先前存在的圖樣用于該技術(shù)。雖然更通常的情況是VAP將會作為新模擬形式的設(shè)計的一部分被包括。當(dāng)然不需要將VAP隱藏在模擬形式中,并且在某些情況下,其實可以宣傳其存在以向消費者保證可以非法模擬形式能夠被檢測到。另一方面,VAP可以具有任何形狀,從而可以很容易被構(gòu)建到模擬形式的其他特征中。圖8示出兩個示例。在801處示出了條形碼,其條形構(gòu)成了VAP。在803處是包含VAP的標(biāo)識物。當(dāng)然,在文檔中可以有多個VAP,并且多個VAP可以共享一個位置。這可以通過向每個圖樣賦予加權(quán)值以使所有圖樣的權(quán)重加起來為1來完成,例如Final_pattern=a*pattern1+(1-a)*pattern2,其中0<a<1多個圖樣的一個應(yīng)用是合同的認(rèn)證,其中每個當(dāng)事人在簽署合同或以其他方式終止協(xié)商中的一個階段時添加其自己的圖樣。
還可以將一般以不同密鑰產(chǎn)生的若干個CDP插入到文檔上的不同位置,以使得多個當(dāng)事人能夠驗證其自己的CDP,而無需能夠驗證其他當(dāng)事人的CDP(因此無需能夠復(fù)制它們)。甚至還可以利用不同的密鑰來生成CDP(每個密鑰可以控制CDP的不同空間區(qū)域和頻率區(qū)域),以使得不同當(dāng)事人能夠驗證CDP。這樣,如果一個當(dāng)事人發(fā)布其密鑰,這個密鑰不足以對CDP進(jìn)行原樣復(fù)制(所有密鑰都是必需的),并且安全性不會受到危害。這與“共享秘密”的概率類似。
VAP的配準(zhǔn)優(yōu)選實施例采用黑盒106作為VAP的配準(zhǔn)。但是,也可以采用許多其他配準(zhǔn)技術(shù)。例如,可以使用已經(jīng)顯示在包裝上的諸如邊框、條形碼之類的可見圖樣來定位VAP,以及OCR。還可以使用UV標(biāo)記或8/24/04授權(quán)的Zhao等人的標(biāo)題為“Apparatus and methods for improving detection ofwatermarks in content that undergone a lossy transformation”的美國專利6,782,2116中描述的任何技術(shù)。此外,還可以對記錄的VAP進(jìn)行傅立葉-梅林變換,并將其與VAP的原始數(shù)字表示形式相匹配。
對于某些應(yīng)用,難以得知VAP的數(shù)字記錄的方向是否正確,或者在讀取前它是否應(yīng)當(dāng)被顛倒過來(180度旋轉(zhuǎn))。為了避免必須分析VAP一次,然后如果分析不成功又必須在相反的垂直方向上旋轉(zhuǎn)它并再次分析它,可以設(shè)計對稱VAP下半部分是上半部分的鏡像。于是可以獨立于其垂直方向來分析VAP。
VAP的圖樣的屬性圖樣可以是灰度級圖樣或者可以是彩色圖樣。在后一情況下,可以采用不同的顏色通道,例如RGB和YUV。圖樣也可以在各種頻率域中生成,例如空間、小波、DFT或DCT域。
生成VAPVAP的噪聲性(即隨機性)正是使得造假者和偽造者難以應(yīng)對的性質(zhì)。任何能夠產(chǎn)生隨機或偽隨機圖樣的技術(shù)都可以用來生成VAP。在優(yōu)選實施例中,是通過向偽隨機數(shù)生成器提供值來完成生成的,該偽隨機數(shù)生成器生成對該值為說唯一的隨機數(shù)序列。從而該值充當(dāng)可用于生成圖樣的新拷貝的密鑰。在不同的實施例中可以使用不同的偽隨機數(shù)生成器,并且可以從不同的概率分布中取得生成隨機數(shù)的概率頻率值。密鑰也可以用于確定在VAP中執(zhí)行分析的位置。正如下文中對利用VAP來攜帶其他信息的論述中所說明的,密鑰可以包括這種其他信息。在某些應(yīng)用中,用于設(shè)計圖樣的密鑰可能不被透露給其他當(dāng)事人。在這種情況下,可以使用任何有用的分發(fā)密鑰的方式,例如非對稱密鑰或公鑰-私鑰對。
通過將標(biāo)識物添加到圖樣或者反之,可以使圖樣與標(biāo)識物相結(jié)合。標(biāo)識物可以是任何現(xiàn)有的圖像或文檔,包括用于其他目的的圖像(2-D條形碼,帶水印的圖像,等等)。還可以按標(biāo)識物將會最低限度地干擾記錄的VAP與VAP的原始數(shù)字表示形式的比較的方式向圖樣或標(biāo)識物應(yīng)用例如濾波之類的任何過程。
打印VAP由VAP提供的認(rèn)證的質(zhì)量完全依賴于VAP被打印在文檔上時的保真度。如果在打印過程結(jié)束時添加了“質(zhì)量控制”步驟以保證VAP的保真度,則可以減少認(rèn)證差錯1.每個打印的VAP將會被傳遞到自動驗證過程,以檢查認(rèn)證圖樣是否具有將其識別為原本所需的最低質(zhì)量。
2.如果質(zhì)量低于最低質(zhì)量,則將發(fā)出警告,并且將重新打印包含認(rèn)證圖樣的文檔/包裝。
3.這種驗證也可以充當(dāng)用于由打印機引起的打印質(zhì)量或差錯的“質(zhì)量控制”。
VAP的生成可以適應(yīng)于打印技術(shù)。例如,如果采用只打印二元點的激光打印機,則可以生成二元點VAP以更好地利用打印機的潛力。此外,在打印機的顏色空間中,VAP可能被更充分地生成和打印。如果某個打印機使用特定的墨水(例如CMYK),則在該域中生成VAP將比在RGB域中生成VAP更有效。如果VAP是用只能產(chǎn)生二元點的激光雕刻機刻在金屬中的,則生成二元VAP將會更有意義。
利用VAP來攜帶其他信息下面論述三種利用VAP來攜帶其他信息的方法預(yù)留VAP的某些區(qū)域以保存信息,利用其他信息來生成用于制作原始VAP的密鑰,以及向VAP添加水印。添加水印的不利之處在于它減小了VAP檢測非原始模擬形式或VAP中的修改的能力。
預(yù)留VAP中的區(qū)域以保存信息VAP的某些區(qū)域(例如8×8塊)可以被預(yù)留以用于保存信息。在某些區(qū)域中,VAP的結(jié)構(gòu)/特性實際上并不用于驗證其真實性,而是用于存儲某些信息比特。可以利用密鑰來偽隨機地選擇這些區(qū)域,以便沒有密鑰的實體不能確定VAP中的區(qū)域?qū)嶋H上是用于存儲信息還是用于確定VAP的真實性。在用于保存信息的區(qū)域中,VAP的某個結(jié)構(gòu)/特性可以對應(yīng)于信息的某個比特值(“0”或“1”)。這些依賴于比特的結(jié)構(gòu)/特性當(dāng)然可以根據(jù)密鑰所確定的而改變。注意,預(yù)留的區(qū)域和它們包含的信息是生成的VAP的一部分。從而它們不會降低VAP檢測非真實文檔的能力。預(yù)留的區(qū)域的一種用途是存儲用于生成VAP的密鑰。
利用信息來生成VAP的密鑰本論述使用以下術(shù)語VAP是用密鑰P創(chuàng)建和檢測的;如上文針對預(yù)留區(qū)域或下文針對水印所描述的,可能希望使用不同密鑰S來將消息嵌入到圖樣中;消息M被用密鑰S嵌入在VAP中;最后,附加的信息I可以按可見的方式打印在文檔上(序列號、條形碼等)圖樣之內(nèi)或之外,或以不可見地方式被UV編碼在圖樣之內(nèi)或之外,或者從外部源獲得。
固定圖樣密鑰在一個實施例中,VAP創(chuàng)建密鑰是固定P。標(biāo)準(zhǔn)偏移打印技術(shù)通常就是這種情況,其中打印技術(shù)沒有為每個封裝/產(chǎn)品/文檔動態(tài)地改變圖樣的能力。密鑰可以如上所述被保密,或者可以被結(jié)合到其他安全性特征中。例如,可以用UV墨水將其打印在文檔上。固定圖樣密鑰一般可以用于商標(biāo)保護(hù)或者文檔保護(hù)。
可變圖樣密鑰在另一個實施例中,VAP的密鑰依賴于秘密密鑰S和某個其他信息I。這個其他信息I可以被顯示在文檔上(在圖樣之內(nèi)或之外),或者從外部源獲得。來自文檔的信息例如可以是序列號、文本、條形碼等。來自外部源的信息例如可以是一個值,該值與VAP相關(guān)聯(lián),并且為檢查包含VAP的文檔是否真實的人所知。圖樣密鑰可以是秘密密鑰和信息I這兩個參數(shù)的任何任意函數(shù)P=f(S,I)。一個簡單的函數(shù)是對兩個參數(shù)的連結(jié)或求和,但是許多其他函數(shù)也是可能的,例如兩個參數(shù)的組合的散列值,等等。在檢測時,利用適當(dāng)?shù)募夹g(shù)-條形碼讀取器、OCR等等-提取打印的信息I。然后,按P=f(S,I)生成圖樣密鑰。典型用途包括利用數(shù)字打印的商標(biāo)保護(hù)。
VAP中的水印可以利用任何水印技術(shù)將可見的或不可見的水印嵌入在VAP中。水印可以用于多個目的。它可以包含任何信息,其中包括只是單個比特,如上所述,或者幫助圖樣的配準(zhǔn)??梢岳糜糜谏蒝AP的密鑰或利用其讀取局限于另一用戶或用戶群組的另一個密鑰來檢測水印。在下文說明的第三種可能是利用水印攜帶的消息來導(dǎo)出用于生成VAP的密鑰。
當(dāng)數(shù)字水印被嵌入到VAP中時,VAP將會被輕微地修改。結(jié)果,當(dāng)同樣的VAP被用于真實性驗證時,它就該目的而言的可靠性將會降低。作為替換,數(shù)字水印可以被嵌入到VAP中如上所述的預(yù)留用于存儲信息區(qū)域中。
水印和密鑰在另一個實施例中,圖樣創(chuàng)建密鑰P是從秘密密鑰S和作為數(shù)字水印嵌入在拷貝檢測圖樣中的消息M導(dǎo)出的。在這種情況下,M取代上述用于創(chuàng)建可變圖樣密鑰的信息I。在創(chuàng)建時,圖樣密鑰P可以是秘密密鑰S和消息M的任何函數(shù)g(M,S)。以通常方式生成圖樣,然后將水印插入到圖樣中,其中水印利用秘密密鑰S作為參數(shù)來對消息M進(jìn)行編碼。在檢測時,首先必須利用秘密密鑰S從圖樣中讀取水印消息M。一旦M已知,圖樣密鑰P=g(M,S)就被導(dǎo)出,并且圖樣被分析。
在這個應(yīng)用框架中,不需要用輔助技術(shù)來提取打印在包裝上的更多信息。但是,可以在這里描述的原理內(nèi)以若干種方式使用打印在包裝上的信息I。例如,秘密密鑰S可以與信息I結(jié)合使用,以產(chǎn)生水印密鑰W,即h(S,I)=W,它被用于將消息嵌入在圖樣中。然后,以與先前相同的方式生成圖樣密鑰,P=f(M,W)=f(F,h(S,I))。一般來說,VAP可以與水印技術(shù)和其他讀取技術(shù)(例如OCR或條形碼讀取器)相結(jié)合,以產(chǎn)生不同級別的驗證。
比較VAP記錄的VAP如何與VAP的原始數(shù)字表示形式相比較將會依賴于VAP是如何制成的以及它的用途是什么。某些普遍適用的變化包括獨立地評價某個區(qū)域,以便擁有關(guān)于應(yīng)用到該文檔的過程的更多線索,或者找出安全性特征。如上所述,VAP可以包含不止一個認(rèn)證圖樣,并且不同的圖樣可以被不同的群組分析。
在VAP能夠被有意義地比較之前,比較程序必須被用從原始文檔記錄的VAP“訓(xùn)練”,如上文針對CDP所述。訓(xùn)練確立用于確定從其真實性正在受到檢查的文檔記錄的VAP是否真實的閾值。閾值的意義當(dāng)然將會依賴于用VAP來檢測的更改的種類。每當(dāng)打印原始文檔的方式以影響VAP比較的方式發(fā)生變化,就需要重新訓(xùn)練。可以通過p將多個VAP打印在一張紙上,掃描這張紙,并且將掃描結(jié)果提供給訓(xùn)練軟件,來自動地完成訓(xùn)練。
在另一個實施例中,不是將測試VAP的數(shù)字記錄與相應(yīng)的數(shù)字表示形式相比較以測量其質(zhì)量指示,而是可以將數(shù)字記錄與另一個VAP的數(shù)字記錄(一般是被掃描的原始VAP)相比較。
執(zhí)行VAP分析的環(huán)境進(jìn)行VAP分析所需要的是能夠從文檔記錄VAP以制作記錄的VAP的設(shè)備,VAP的原始數(shù)字表示形式的拷貝,以及能夠?qū)⒂涗浀腣AP與VAP的原始數(shù)字表示形式相比較的處理器。記錄器和處理器可以在彼此本地,或者可以通過網(wǎng)絡(luò)連接。網(wǎng)絡(luò)可以是局域網(wǎng)(LAN)或廣域網(wǎng)(WAN)。本地環(huán)境的示例是具有掃描儀的PC、分析代碼的拷貝以及VAP的原始數(shù)字表示形式的拷貝。VAP的原始數(shù)字表示形式的拷貝可以是下載的、預(yù)先存儲在本地的或者利用密鑰在本地生成的。分析結(jié)果被輸出到PC的顯示設(shè)備。
在網(wǎng)絡(luò)環(huán)境中,掃描、分析和VAP的原始數(shù)字表示形式可以按任何方式在網(wǎng)絡(luò)上分發(fā)。維護(hù)VAP的原始數(shù)字表示形式的安全性并簡化本地級別上所需的設(shè)備的分發(fā)是這樣的分發(fā)在這種分發(fā)中,掃描是在連接到WAN的設(shè)備中完成的。當(dāng)文檔上的VAP已經(jīng)被掃描以產(chǎn)生記錄的VAP時,記錄的VAP被發(fā)送到WAN中的一個位置,在該位置處分析代碼和VAP的原始數(shù)字表示形式兩者都是可用的。原始數(shù)字表示形式可以被存儲或者可以根據(jù)需要重新生成。分析在該位置處完成,并且只有分析結(jié)果經(jīng)由WAN被返回到用于掃描的設(shè)備。在網(wǎng)絡(luò)環(huán)境中,一般來說,記錄的VAP中攜帶的信息或與記錄的VAP一起發(fā)送的信息可被用于取得供分析時使用的信息。例如,文檔可以包含序列號,并且序列號可以與記錄的VAP一起被發(fā)送到進(jìn)行分析的位置。如果在VAP和序列號之間存在關(guān)聯(lián),則序列號可以被應(yīng)用到該位置處的數(shù)據(jù)庫或網(wǎng)絡(luò)中的其他位置,以取得用于應(yīng)當(dāng)與記錄的VAP相比較的VAP的原始數(shù)字表示形式的密鑰或VAP本身的原始數(shù)字表示形式的拷貝。如上所述,序列號可以作為VAP中的可見水印在包含VAP的條形碼中指定,可以是從文檔OCR來的,或者甚至可以是由進(jìn)行掃描的人輸入的。
照相機(網(wǎng)絡(luò)照相機、便攜式攝像機等)也可以用于捕捉VAP的圖像。在這種情況下,VAP檢測器不僅接收一個圖像作為輸入,還接收恒定的圖像流作為輸入。由若干個圖像提供的額外的信息在分析時可能是非常有用的。但是,由于分析一個圖像所需的時間可能遠(yuǎn)大于兩個連續(xù)的圖像之間的時間,因此圖像流的使用可以被優(yōu)化。例如,可以從流中選擇看起來具有用于正確讀取的屬性(良好的銳度、VAP完全包含在圖片中)的圖像,并將其用于分析。
將VAP與其他安全性技術(shù)相結(jié)合VAP可以與旨在使模擬形式更安全的其他技術(shù)相結(jié)合。例如,VAP可以與例如數(shù)字水印這樣的信息隱藏技術(shù)、例如1-D或2-D條形碼這樣的機器可讀信息、全息圖或者能夠應(yīng)用到模擬形式的任何其他技術(shù)一起使用。技術(shù)之間的關(guān)系可能是各種各樣的例如,2-D條形碼可以包含獨立的信息,或者圖樣分析所需的秘密密鑰,或者反之,VAP可以保存對2-D條形碼進(jìn)行解碼所需的密鑰,或者2-D條形碼可以包含VAP。
檢測VAP的位置當(dāng)模擬形式被掃描時,在掃描開始時不是總有可能得知VAP位于何處。這可能是因為使用VAP的應(yīng)用必須支持具有不同格式的文檔和/或放置在不同位置的VAP,因為將文檔放置在掃描儀上的最終用戶不知道如何將文檔放置在其上;配備有照相機的便攜式照相機/計算機被用于捕捉文檔的圖像,而在圖像捕捉時存在固有的人類變異性;或者就只是因為在每次掃描中存在天然的變異性,并且文檔中靠近VAP的圖樣干擾了VAP。在一個“最壞情形應(yīng)用”中,letter大小的模擬形式的整個區(qū)域被掃描,并且VAP可能位于模擬形式上的任何位置并且可能具有任何方向。
但是,可以利用VAP的一般統(tǒng)計屬性來在模擬形式中定位它。區(qū)分VAP與大多數(shù)其他圖像或文檔特征的屬性是其直方圖的分布。由于VAP是有噪聲的,因此原始數(shù)字VAP的像素值(對于灰度級圖像有256個;對于二元圖像有2個;對于彩色圖像有24位或更多)中的每一個一般是等概率的,或者可以具有特定的分布。雖然VAP的打印和掃描確實會修改其像素值的分布,但是這樣產(chǎn)生的修改是非常特殊的。通過在校準(zhǔn)過程中打印和掃描一定數(shù)目的VAP,可以制作一個直方圖,該圖是對從模擬形式掃描VAP中的像素值的平均分布的估計。圖13示出了一個這種分布1301,在下文中它被稱為“模板直方圖”。由于VAP的有噪聲性質(zhì),模板直方圖中像素的分布一般將會比文檔中像素的分布寬得多。
文檔的掃描圖像可以被劃分成塊,這些塊的大小一般是50×50像素。對于以300dpi掃描的letter大小的掃描儀,3300×2550像素的掃描圖像被劃分成66×51=3366個塊。這3366個塊中每一個的直方圖被計算,并且被與模板直方圖相關(guān)。正如從文檔的大多數(shù)部分的非隨機性可以預(yù)期的,已經(jīng)根據(jù)經(jīng)驗觀察到掃描的模擬形式的圖像中的大多數(shù)塊的直方圖與模板直方圖的相關(guān)性接近零,而VAP的塊與模板直方圖的相關(guān)性就明顯是正的。與模板直方圖的相關(guān)性最高的塊一般可以被假定為屬于VAP,尤其在相鄰塊也顯示高相關(guān)性的情況下更是如此。本地搜索算法可以被應(yīng)用來檢測屬于該VAP的所有相鄰塊,然后包含VAP的區(qū)域可被剪切下來并被提供作為恢復(fù)函數(shù)的輸入。
上述方法要求擁有關(guān)于給定打印-掃描環(huán)境的足夠的知識來產(chǎn)生模板直方圖。但不是總有可能擁有這種知識;在這種情況下,VAP的特有的高平均信息量可以被用來檢測它。這里所使用的平均信息量(entropy)是灰度級圖像的塊中的像素具有大量不同值之一的概率。例如,在包含印跡(打印的文本或圖形)的塊中,像素一般將會集中在兩個值附近,即,如果代表紙則接近白,如果代表印跡則接近黑,從而像素會具有大量值之一的概率就較低,因此平均信息量也較低。因為數(shù)字表示形式中的VAP是有噪聲的,因此VAP中的像素會具有大量值之一的概率較高,從而VAP的平均信息量較高。雖然數(shù)字表示形式中的VAP的平均信息量由于打印-掃描而減小,但通常具有VAP的區(qū)域仍保持為掃描圖像中具有最高平均信息量的區(qū)域。因此,通過測量掃描圖像的每個區(qū)域中的平均信息量并選擇具有最高平均信息量的區(qū)域,可以在不使用模板直方圖的情況下導(dǎo)出VAP的位置。
在某些情況下,這個方法不起作用,因為包含VAP的數(shù)字表示形式包括其他含豐富紋理的區(qū)域,在這些區(qū)域中,在打印-掃描期間紋理被很好地保持,因此平均信息量被很好地保持。在這種情況下,避免檢測這種區(qū)域的一種方式是對進(jìn)入平均信息量計算的那組可能的像素值設(shè)置某些限制。例如,如果在掃描圖像中VAP通常具有0到150之間的值,則可以從平均信息量計算中排除所有亮度高于150的值。當(dāng)然可以具體地將VAP設(shè)計為具有與帶紋理的區(qū)域中的值范圍不同的值范圍。
VAP的其他屬性,例如其大小、其相對于其他安全性特征的位置或它是以特定墨水打印的這一屬性,可以被用作額外的因素,以進(jìn)一步區(qū)分VAP和非VAP區(qū)域。
這種方法對于定位較低質(zhì)量的拷貝或偽造品可能不起作用,這是因為VAP屬性可能嚴(yán)重受擾。在這種情況下,另一個方法是利用VAP一般比圖像的任何其他部分都大得多的動態(tài)范圍(dynamics),即使它被拷貝也是如此。為了測量一個區(qū)域(例如50×50像素的區(qū)域)的“動態(tài)范圍”,可以測量像素和相鄰的每個像素之間的平均差異。
對于所使用的任何方法,一旦一個塊被識別為是VAP的一部分,則仍有必要在該塊周圍進(jìn)行搜索以找出屬于VAP的所有其他相鄰塊。任何本地搜索算法都可用于找出具有給定屬性的一組相連的塊,其中所述屬性是該塊對于上述函數(shù)具有“顯著”輸出。
利用CDP來檢測非原始數(shù)字表示形式和非原始模擬形式圖10和圖11打印和掃描的效果可以被視為本質(zhì)上對應(yīng)于將一定量的隨機噪聲添加到文檔和文檔的CDP的每個像素值。由于模擬形式總是在其被打印和掃描之后被評價,因此預(yù)期打印和掃描過程向非原始模擬形式添加了比原始模擬形式更多的噪聲。因此,一般可以通過測量CDP的數(shù)字原本和來自掃描的模擬形式的CDP之間在空間域中的簡單差異來區(qū)分原始模擬形式和非原始模擬形式。如果CDP是來自非原始模擬形式的,則將預(yù)期較高的距離。位于第i列第j行的像素x(i,j)和y(i,j)分別是數(shù)字原本和測試圖樣的像素值,數(shù)字原本和測試圖樣之間的距離度量為D=Sum_j Sum_i|x(I,j)-y(I,j)|^p/(N*M)其中p是任意正數(shù),N和M是圖樣上的以像素為單位的寬度和高度。如上所述,原本的距離D始終會高于拷貝的。
雖然可以從數(shù)學(xué)上證明上述度量對于區(qū)分拷貝和原本幾乎是最優(yōu)的,但是如果不對來自模擬形式的CDP進(jìn)行某些處理,這就不能適用。其原因是打印和掃描導(dǎo)致模擬形式中的像素值的非線性變換。這些變換隨著打印機和掃描儀而發(fā)生變化,甚至隨著打印/掃描參數(shù)而發(fā)生變化。一般來說,來自模擬形式的CDP像素值的頻譜將會被打印掃描序列壓縮,使得來自模擬形式的CDP的頻譜的極值比來自原始數(shù)字表示形式的CDP中的極值稀少得多。
但是,這個問題可以通過向來自模擬形式的CDP應(yīng)用直方圖轉(zhuǎn)換函數(shù)來克服。直方圖轉(zhuǎn)換函數(shù)修改來自模擬形式的CDP的每個像素,從而使得直方圖等同于來自原始數(shù)字表示形式的CDP的直方圖。這個變換函數(shù)一般是在校準(zhǔn)步驟中利用一組打印的CDP來估計的。變換函數(shù)一般是固定的,并且被應(yīng)用到每個來自模擬形式的CDP。圖10在1001處示出了示例性直方圖轉(zhuǎn)換函數(shù)。圖11示出了向來自模擬形式的CDP應(yīng)用直方圖函數(shù)的效果。來自原始數(shù)字表示形式的CDP在1101處示出;從模擬形式掃描的CDP在1103處示出;通過應(yīng)用變換函數(shù)而校正的CDP 1103在1105處示出。從圖11明顯而見,經(jīng)校正的CDP 1105比起CDP 1103來更接近來自原始數(shù)字表示形式的CDP 1101。
模擬形式中的CDP的平均亮度一般具有某些變化,這是由于掃描儀中的不同照明條件和/或噴射到紙中的不同墨量。這種變異性是自然發(fā)生的,無法被控制。為了使這種變異性的效果最小化,可以確定來自原始數(shù)字表示形式的CDP的平均亮度,確定掃描的CDP的實際亮度,然后向掃描的CDP的每個像素添加固定值或從中減去固定值,從而使得其平均亮度等于來自原始數(shù)字表示形式的CDP的平均亮度。例如,如果來自原始數(shù)字表示形式的CDP中的像素的平均值是127,而掃描的CDP中的像素亮度的平均值實際上是118,則向掃描的CDP中的每個像素加上9。這種像素亮度調(diào)節(jié)一般是在直方圖轉(zhuǎn)換之前應(yīng)用的。
在這種變換被應(yīng)用之后,來自模擬形式的CDP的像素值將會與來自原始數(shù)字表示形式的CDP的像素值具有相的頻譜。因此它們是可比較的,并且方程1可以適用。如果f()是直方圖轉(zhuǎn)換函數(shù),則距離D由下式給出D=Sum_j Sum_i|x(I,j)-f(y(I,j))|^p/(N*M)注意此距離函數(shù)只是一個示例;也可以使用若干個其他距離函數(shù)。
例如,可以向數(shù)字表示形式而不是模擬表示形式應(yīng)用變換,即D2=Sum_j Sum_i|g(x(I,j))-y(I,j)|^p/(N*M)應(yīng)對打印-掃描環(huán)境的變化在某些應(yīng)用中,在用于打印模擬拷貝的打印-掃描環(huán)境中可能有大量變化。發(fā)生變化的原因包括以下·包含CDP的模擬形式是在不同打印機上打印的;·模擬形式是打印在不同紙張或基底上的,或者不同的層被覆蓋在CDP上。
·不同的掃描儀被用于掃描模擬形式。
·對模擬形式的不同物理處理。
在不同模擬形式的CDP中產(chǎn)生這種變化的應(yīng)用的一個示例是在由具有不同屬性的不同紙張制成的不同類型的信封上打印CDP,有時甚至在不同的打印機上打印CDP的郵資計算器。
在這種應(yīng)用中,直方圖轉(zhuǎn)換函數(shù)可能受上述屬性的每個組合的影響。應(yīng)用錯誤的直方圖轉(zhuǎn)換函數(shù)一般將會來自模擬形式的CDP和來自原始數(shù)字表示形式的CDP之間的距離的失真。于是,一種解決方案是使用若干個直方圖轉(zhuǎn)換函數(shù),并且在驗證來自模擬形式的CDP時,將每個直方圖轉(zhuǎn)換函數(shù)應(yīng)用到CDP,找出被直方圖轉(zhuǎn)換函數(shù)修改的與來自原始數(shù)字表示形式的CDP具有最短距離的來自模擬形式的CDP,并且只將這個修改的CDP與來自原始數(shù)字表示形式的CDP相比較。如果其他參數(shù)依賴于特定的打印機-紙張-掃描儀組合(例如閾值),則對“最佳”直方圖轉(zhuǎn)換函數(shù)的選擇將會意味著對其他參數(shù)的選擇。
也可以用其他方式來使不穩(wěn)定的打印-掃描環(huán)境的影響最小化。考慮用于一個應(yīng)用的一組可能的直方圖轉(zhuǎn)換函數(shù),其中可以為每個來自模擬形式的CDP生成一個轉(zhuǎn)換函數(shù),則存在不同的方式來綜合自然的變化。一個解決方案包括測量每個像素的標(biāo)準(zhǔn)偏差,然后利用它作為在測量來自模擬形式的CDP和來自原始數(shù)字表示形式的CDP之間的距離時考慮的歸一化因子。另一個解決方案包括估計每個像素亮度的典型值的上界和下界(例如亮度100在掃描圖像中應(yīng)當(dāng)具有90到110之間的典型值,而亮度40可能具有20到60之間的典型值,其范圍是兩倍大),并且更重地處罰位于這些邊界之外的像素。另一種解決方案包括具有忠誠地代表應(yīng)用中可能發(fā)生的不同轉(zhuǎn)換函數(shù)的頻譜的一組不同的轉(zhuǎn)換函數(shù),并且每次都使用最適當(dāng)?shù)哪莻€,從而產(chǎn)生來自模擬形式的CDP和來自原始數(shù)字表示形式的CDP之間的最小距離。
甚至更保守的解決方案也是可能的。一種解決方案是使用預(yù)先估計的參數(shù),但是在來自模擬形式的CDP上估計它們。這允許了對變化的更大的容限,但是這種方法有兩個潛在的局限性·由于參數(shù)是在來自模擬形式的CDP上估計的,因此這允許了模擬形式的更大的容限,而這種模擬形式不重視來自原始數(shù)字表示形式的CDP的典型直方圖,因此可能是非原始模擬形式。
·由于參數(shù)是只從一個來自模擬形式的CDP估計的,因此可以預(yù)期對參數(shù)的估計不那么準(zhǔn)確。例如,對于具有255個等概率的亮度值的10000個像素CDP,對于每個亮度值平均將會有少于40個樣本,并且由于自然統(tǒng)計變化,某些亮度值可能具有遠(yuǎn)少于40個樣本。
可以按不同方式來對待第一問題。一種方式是像標(biāo)準(zhǔn)方法中那樣擁有預(yù)先估計的轉(zhuǎn)換函數(shù),但是不是用它來轉(zhuǎn)換來自模擬形式的CDP,而只是用來測量與為CDP模擬形式估計的轉(zhuǎn)換函數(shù)的距離。轉(zhuǎn)換函數(shù)之間的距離的一種可能的度量為D(f’,f)=1/256*Sum(lum=0 to lum=255)abs(f’(lum)-f(lum))其中f’(.)和f(.)分別是自估計的轉(zhuǎn)換函數(shù)和平均轉(zhuǎn)換函數(shù)。還可以輸入與每個像素的自然變化相對應(yīng)的歸一化因子g(lum),例如Dn(f’,f)=1/256*Sum(lum=0 to lum=255)abs(f’(lum)-f(lum))/g(lum)該距離可以用作可以進(jìn)入判決的額外的證據(jù)。例如,在利用自估計參數(shù)轉(zhuǎn)換計算與來自原始數(shù)字表示形式的CDP的距離時,兩個不同的來自模擬形式的CDP可能具有相同的相似度78。但是,它們的自估計轉(zhuǎn)換函數(shù)可能與平均轉(zhuǎn)換函數(shù)有不同的距離,例如對于第一CDP,Dn(f’,f)=2.5,對于第二CDP,D(f’,f)=0.5。第一CDP的較大的距離可用于確定它是非原始模擬形式(雖然其質(zhì)量較高),而對于相同的質(zhì)量指標(biāo),第二CDP將會被認(rèn)為是原始模擬形式。
通過假定轉(zhuǎn)換函數(shù)的模型,例如轉(zhuǎn)換函數(shù)遵循某個回歸函數(shù),例如多項式回歸函數(shù)或?qū)?shù)回歸函數(shù),可以應(yīng)對第二個問題。這使得要估計的參數(shù)的數(shù)目最小化,并且給出了沒有不連續(xù)點的更平滑的函數(shù)。
最后,在某些情況下,打印-掃描屬性可能隨時間而演變,以及/或者最初不可能校準(zhǔn)CDP檢測器。在這種情況下,可行的方法包括結(jié)合每次新掃描的數(shù)據(jù),在開始不知道環(huán)境參數(shù)時允許更大的容限,并且逐漸減小該容限,這是因為新數(shù)據(jù)的添加允許了對基本參數(shù)的更準(zhǔn)確估計。該方法在本質(zhì)上是通用的,并且對于與CDP檢測有關(guān)的所有參數(shù)(轉(zhuǎn)換函數(shù)、閾值等)都是有效的。為了結(jié)合新的知識,在分配給先驗指示的重要性逐漸減小的情況下可以應(yīng)用貝葉斯學(xué)習(xí)。通過估計獲得的信息可以被存儲在數(shù)據(jù)庫中,或者在不同驗證站之間共享。這種方法允許了將與打印時的CDP質(zhì)量相關(guān)的信息與掃描參數(shù)解除耦合。信息是在發(fā)生驗證時估計的,從而該解決方案能夠具有更靈活的綜合過程。
在應(yīng)用若干個估計策略并且對結(jié)果進(jìn)行加權(quán)以導(dǎo)出用于所得到的與來自模擬形式的CDP的質(zhì)量相關(guān)的判決的概率時,上述方法的組合是可能的。
關(guān)于打印-掃描環(huán)境和可能影響CDP質(zhì)量的屬性(見上)的信息可以按經(jīng)編碼的、機器可讀的方式被存儲在模擬形式上?;蛘?,它可以被編碼在CDP中。在這種情況下,將這樣的關(guān)于打印機的信息結(jié)合到CDP中的一種方式是讓打印機(例如桌面打印機)驅(qū)動器自動將唯一標(biāo)識打印機的代碼(“打印機標(biāo)識符”)添加到被打印的CDP中。在掃描和驗證一方,CDP檢測器讀取打印機標(biāo)識符并接收來自掃描儀的信息(或者是從掃描儀本身、本地或遠(yuǎn)程數(shù)據(jù)庫獲得的,或者是由用戶輸入的)。然后CDP檢測器可以基于打印機標(biāo)識符和關(guān)于掃描儀的信息從數(shù)據(jù)庫(本地的或遠(yuǎn)程的)獲得與打印-掃描環(huán)境相對應(yīng)的校準(zhǔn)數(shù)據(jù)以便進(jìn)行判決。從而,可以對所有類型的打印機和掃描儀自動進(jìn)行校準(zhǔn)過程。
最后,在若干種情況下,可以進(jìn)行模擬和數(shù)字表示形式之間的相關(guān)。以這種方式,完全避開了變換模擬或數(shù)字CDP的步驟。一個可能的相關(guān)函數(shù)是Dc=Sum_j Sun_i((x(i,j)-mean_x)*(y(i,j)-mean_y))sqrt(var_x,var_y)其中-mean_x是x信號的平均值-mean_y是y信號的平均值-var_x是x信號的方差-var_y是y信號的方差先前給出的技術(shù)可以單獨應(yīng)用到VAP的小部分,然后可以被聚集以起來,以輸出“全局得分”。例如,VAP可以被劃分成小塊(例如10×10像素),并且相似性或相異性度量被應(yīng)用到該塊,以計算塊的“塊得分”。然后,各個塊得分可以被聚集在一起,以用多種方式輸出VAP的整體得分。一種明顯的聚集是對所有塊得分的簡單平均,但是其他度量也可能是有利的;例如,可以按從最高值到最低值的方式挑選出塊得分,例如,只有最佳的25%塊得分被用于計算作為全局得分的平均值;或者全局得分被設(shè)置為第25個百分點處的塊得分。
選擇進(jìn)入計算的塊得分的有利之處在于可以從計算中排除VAP中更受模擬轉(zhuǎn)換影響的區(qū)域。希望不會影響其得分的對VAP的更改為磨損,例如筆跡和紙張折疊;影響VAP的某些區(qū)域的聚焦不良的圖像捕捉。如果不從全局得分的計算中排除這些更改-或者如果它們的影響不被最小化,則原始VAP可能具有太低的全局得分以至于不能被識別為原始的。
這里論述的技術(shù)還增大了對在打印和掃描期間通常發(fā)生的不那么明顯、察覺不到的更改的魯棒性。
在與來自模擬形式的CDP相比較之前利用關(guān)于打印-掃描過程的信息來修改來自原始數(shù)字表示形式的CDP的方法一般,來自模擬形式的CDP被與來自原始數(shù)字表示形式的CDP相比較。但是,來自原始數(shù)字表示形式的CDP沒有考慮到打印和掃描對來自模擬形式的CDP的作用。這些作用一般可以被描述為應(yīng)用到來自原始數(shù)字表示形式的CDP的低通或帶通濾波器。將來自模擬形式的CDP與已經(jīng)被修改以模擬打印和掃描作用的來自原始數(shù)字表示形式的CDP相比較可以允許對來自模擬形式的CDP的質(zhì)量進(jìn)行更準(zhǔn)確的測量。例如,正如一般觀察到的,來自原始數(shù)字表示形式的CDP中具有低亮度的像素一般在來自模擬形式的CDP中顯現(xiàn)為具有低亮度的像素;但是,如果在來自原始數(shù)字表示形式的CDP中來自模擬形式的CDP中的像素被亮像素所圍繞,則其亮度一般會高于被暗像素圍繞的情況。修改來自數(shù)字表示形式的CDP以模擬打印-掃描過程可以考慮來自模擬形式的CDP中的像素的鄰居對該像素亮度的影響。
有若干種估計打印-掃描過程的方式。它們一般可以被劃分成三個類別1.可以通過查看大量來自模擬形式的CDP中的每個像素的平均亮度值來模擬打印-掃描過程。
2.可以將打印-掃描過程估計為具有特定頻率響應(yīng)的濾波器。然后將該濾波器應(yīng)用到來自數(shù)字表示形式的CDP,并且在檢測過程中使用經(jīng)修改的來自數(shù)字表示形式的CDP。
3.打印機、紙張和掃描儀的物理屬性有時可能是已知的,并且可用于估計來自模擬形式的CDP的像素值。例如,熱打印機在打印每個像素或點之后一般具有余熱,并且這個余熱可能對于之后的像素有影響,所述之后的像素可能被過熱地打印,從而導(dǎo)致比起所需的像素來較暗??梢钥紤]這些物理作用,以及許多其他與特定打印和掃描設(shè)備和紙張的吸墨屬性相關(guān)的作用。
獲得由于打印和掃描導(dǎo)致的變換的參數(shù)在下文中,公開了用于獲得對由來自模擬形式的CDP中的打印和掃描導(dǎo)致的變換進(jìn)行補償所需的參數(shù)的多種不同技術(shù)。這些技術(shù)一般分成兩個不同的群組用于將參數(shù)信息包括在CDP本身或模擬形式中的技術(shù)以及用于訓(xùn)練CDP檢測器的技術(shù)。
從模擬形式本身獲得參數(shù)從模擬形式的CDP獲得參數(shù)可以獲得分析來自模擬形式的CDP所需的參數(shù)的一個地方是CDP本身。如前所述,CDP可能攜帶消息,并且參數(shù)可以被包括CDP中攜帶的消息中。例如,就像直方圖轉(zhuǎn)換函數(shù)規(guī)格一樣,一個質(zhì)量閾值可以被存儲在CDP中,在該質(zhì)量閾值之上或之下來自模擬形式的CDP可以被判斷為來自原始模擬形式或來自非原始模擬形式。
通用文檔認(rèn)證(始終真實)每個打印機將新的CDP打印在每個被打印的模擬形式上。
打印機提供的CDP可以默認(rèn)地打印在打印機上正打印的每個模擬形式上。如果打印機上打印的模擬形式是從具有CDP的原始數(shù)字表示形式制成的,則模擬形式將會具有兩個CDP一個由打印機提供,一個來自原始數(shù)字表示形式。由打印機提供的CDP當(dāng)然記錄了由于將模擬形式打印在打印機上而導(dǎo)致的變換,并且這些變換可以用于確定模擬形式的來自原始數(shù)字表示形式的CDP是否指示模擬形式是打印-掃描-打印過程的結(jié)果,因此不是原始模擬形式。
關(guān)于打印過程的信息也可以被存儲在遠(yuǎn)程數(shù)據(jù)庫中,并且CDP或文檔可以包含允許檢測設(shè)備訪問遠(yuǎn)程數(shù)據(jù)庫中的該信息的標(biāo)識。
CDP和其他安全性特征VAP可以用“不可見墨水”打印在文檔上,即,對于人類來說通常不可見但是具有容易檢測的物理特性的薄的透明涂層,所述物理特性例如是導(dǎo)電性、電阻抗、電容或電致發(fā)光性。此外,可以用在安全文檔部門廣泛使用的專業(yè)墨水來打印VAP。這些專業(yè)墨水包括從使用多種顏色到使用高強度紫外光來創(chuàng)建在可見或紫外光之下發(fā)熒光的圖樣中的任何一種。
物理安全性特征,例如纖維或墨水,可以攜帶用于CDP的密鑰。CDP也可以與諸如智能卡、2D條形碼、磁卡之類的安全性存儲設(shè)備將結(jié)合。秘密密鑰和依賴于打印機屬性的校準(zhǔn)數(shù)據(jù)可以被存儲在這些存儲設(shè)備中。
CDP與物理、化學(xué)或光學(xué)防拷貝特征(例如出現(xiàn)在非原始模擬形式上的“VOID”縮放圖(pantograph))也是互補的。
校準(zhǔn)數(shù)據(jù)的自動選擇與打印機或掃描儀驅(qū)動器一樣,CDP讀取器(驗證器)可以手動地或自動地選擇適當(dāng)?shù)男?zhǔn)數(shù)據(jù)。例如,當(dāng)CDP被打印時,唯一地標(biāo)識打印機或打印機的類別(打印機型號)代碼被嵌入到CDP中,存儲在數(shù)據(jù)庫中或打印CDP的文檔上。在驗證階段,讀取器首先檢測代碼,然后選擇適當(dāng)?shù)男?zhǔn)數(shù)據(jù)以用于驗證??梢园搭愃频姆绞阶詣舆x擇依賴于掃描儀的參數(shù),例如驗證的閾值。
自動校準(zhǔn)-訓(xùn)練階段為了優(yōu)化由打印機/掃描儀的固定設(shè)置限定的特定應(yīng)用的CDP的檢測,需要評估該應(yīng)用的打印輸出的掃描的各種參數(shù)。例如,上述直方圖轉(zhuǎn)換函數(shù)依賴于打印機和掃描儀設(shè)置,并且檢測器進(jìn)行判決所使用的質(zhì)量或相似性閾值也依賴于掃描儀設(shè)置。但是,由于打印-掃描過程本質(zhì)上是有噪聲的,并且對于不同打印和不同掃描會在統(tǒng)計邊界內(nèi)變化,因此有必要從統(tǒng)計上估計參數(shù)值。但是,打印和掃描三十個或更多個CDP以估計參數(shù)是困難、煩冗且易出錯的。因此,使設(shè)置每個應(yīng)用所需的這一過程自動化以允許任何人創(chuàng)建利用CDP檢測拷貝的應(yīng)用,很明顯是有利的。
使從統(tǒng)計上估計參數(shù)的過程自動化的一種方式是創(chuàng)建所謂的校準(zhǔn)圖像,該圖像是包含從相同的數(shù)字表示形式制成的來自模擬形式的CDP或具有其中變化已知的特定密鑰或有效載荷的CDP的若干個拷貝的數(shù)字圖像。一個這種圖像1501在圖15中示出。該圖像隨后被以應(yīng)用的打印機和掃描儀設(shè)置打印和掃描。然后,打印的校準(zhǔn)圖像被用CDP校準(zhǔn)軟件掃描和處理。如果校準(zhǔn)成功,則校準(zhǔn)軟件輸出應(yīng)用的參數(shù)和檢測器的判決閾值。判決閾值一般是通過以下方式計算的首先測量質(zhì)量指標(biāo)的均值和方差,然后將統(tǒng)計模型擬合到這些數(shù)據(jù)以確定在10000個實例中不會導(dǎo)致例如1個差錯的閾值(假定統(tǒng)計分布成立)。用戶可給出假警報(將原本檢測為拷貝)的概率的上界作為參數(shù),其將被用于計算中以確定閾值。
每次新檢測的迭代學(xué)習(xí)可以被結(jié)合到檢測器中。在一個實施例中,可以要求用戶使用具有五個不同的原始模擬表示形式的檢測器。原始模擬表示形式的各種有效的統(tǒng)計數(shù)據(jù)和參數(shù)(例如判決閾值)被計算。在操作模式中,該判決閾值和其他參數(shù)和統(tǒng)計數(shù)據(jù)可以被用于判決,并被迭代地調(diào)節(jié)。
利用來自模擬形式的CDP本身來粗略確定模擬形式是否是原始模擬形式為了測量模擬形式和原始CDP之間的質(zhì)量差異,首先必須將通過掃描來自模擬形式的CDP制成的CDP的數(shù)字表示形式恢復(fù)到允許將來自模擬形式的CDP的數(shù)字表示形式與原始數(shù)字CDP相比較的形式。該過程通常成本較高,并且有時由于模擬形式的損壞而非常困難。在某些情況下,可能只需要對模擬形式是原始的還是非原始的模擬形式進(jìn)行粗略的估計,或者就簡單地是在沒有成本高昂的相關(guān)(恢復(fù)和比較)過程的情況下不可能作出準(zhǔn)確估計。其原因可能是計算成本太高,CDP已經(jīng)被損壞、缺少密鑰或其他關(guān)鍵參數(shù),或者檢測軟件由于安全性原因而不可用,等等。粗略估計可以通過直接測量通過掃描來自模擬形式的CDP制成的CDP的數(shù)字表示形式的全局屬性來進(jìn)行這些全局屬性中的某些是直方圖分布、平均亮度、兩個連續(xù)像素之間的平均變化程度、二元CDP的黑像素和白像素的密度和分布,等等。由于這些全局屬性一般在旋轉(zhuǎn)、縮放和平移時是不變的,因此不需要恢復(fù)來自模擬形式的CDP的數(shù)字表示形式以測量這種全局屬性。從而,對這些屬性的測量既不需要原始數(shù)字CDP,也不需要用來生成它的密鑰。粗略估計是通過比較這些全局屬性和依賴于CDP的隨機性和高平均信息量的某些預(yù)定屬性之間的相似性來進(jìn)行的。
雖然判決模擬形式是原始模擬形式還是非原始模擬形式時的可靠程度不會像判決僅僅基于測量這些全局屬性時那么高,但是大多數(shù)利用低端數(shù)字成像設(shè)備制作的非原始模擬形式是能夠被檢測到的。對來自模擬形式的CDP執(zhí)行全局檢查的檢測器還可用于篩選出可疑模擬形式,并使其經(jīng)歷利用能夠訪問恢復(fù)來自模擬形式的CDP所需的信息的檢測器進(jìn)行的進(jìn)一步調(diào)查。
作為前述技術(shù)的示例的郵資計算器應(yīng)用CDP可以被自動插入到郵戳的數(shù)字圖像中。然后圖像一般被打印在粘到信封上的粘貼物上,或者直接打印在信封上。來自郵戳的CDP隨后可被用于自動檢測郵戳是原始模擬形式還是非原始模擬形式。利用來自郵戳的CDP測量的質(zhì)量指標(biāo)可以與郵戳的其他特征一起,例如確定產(chǎn)生郵戳的打印機、分析字母的字體和/或讀取打印的數(shù)字水印,被結(jié)合到用于自動地或手動地確定郵戳是否是原始模擬形式的全局得分中。
打印的郵戳上的CDP可以用于法庭驗證,例如當(dāng)可疑郵戳被拿到配備有平頭掃描儀和檢測軟件的站時。當(dāng)高速掃描儀(例如WFOV)對每個郵戳進(jìn)行圖像捕捉時,它還可以用于自動驗證。
在這種應(yīng)用中,用于CDP的密鑰可以是固定的或可變的。如果它是可變的,則密鑰可以(部分地)從郵戳中包含的其他信息導(dǎo)出,所述其他信息例如是發(fā)送者名稱。
用于將信息插入到VAP中的技術(shù)如前所述,VAP可以攜帶信息。當(dāng)VAP被創(chuàng)建時,消息被結(jié)合到VAP中。由于VAP是以消息創(chuàng)建的,因此每條不同的消息導(dǎo)致不同VAP的生成。將消息結(jié)合到VAP中的一種方式是利用秘密密鑰和消息作為用來生成VAP的偽隨機數(shù)生成器的輸入。一般希望以保持VAP的直方圖或平均信息量的方式將消息結(jié)合到VAP中。所有前述用于將消息結(jié)合到VAP中的方案都具有與不包含信息的VAP類似的直方圖和平均信息量。但是即使保持VAP的直方圖或平均信息量能夠有某些優(yōu)點,例如VAP辨別拷貝和原本的能力不應(yīng)當(dāng)受到影響,但是保持平均信息量和直方圖并不是必要條件。換言之,在不保持VAP的平均信息量或直方圖的情況下仍有可能創(chuàng)建包含信息的VAP并利用它們來辨別拷貝和原本。
在一個實施例中,VAP被劃分成不同的不交迭的區(qū)域,例如劃分成相鄰的固定大小的塊。大小是任意的,例如1×1像素、4×4像素或8×4像素都可以。如果塊大小太大,則消息大小將會受限;如果太小,則消息將會難以讀取。例如,如果每個塊攜帶消息的單個比特,“1”或“0”,則VAP中的每個像素或者屬于保存“1”的像素的類別,或者屬于保存“0”的像素的類別。用于偽隨機數(shù)生成器中的像素所屬的類別“c”、其位置“p”和秘密密鑰“key”被用于函數(shù)G中,以產(chǎn)生像素值x,即x=G(key,p,c)對于二元像素值,x是0或1,對于灰度級像素值,x是0到255之間的整數(shù)。x的所有值都等概率的。
可以將函數(shù)G分解成兩個函數(shù)G1和H,其中G1是以密鑰和像素位置作為輸入的偽隨機數(shù)生成器,H是根據(jù)像素所屬的類別調(diào)節(jié)像素值的函數(shù)x=H(G1(key,p),c)在一個可能的實現(xiàn)方式中,H是這樣的當(dāng)塊攜帶比特“0”(或者換言之其類別為“0”)時,H保持像素值不變H(G1(key,p),’0’)=G1(key,p)。
但是當(dāng)塊攜帶“1”時,H“顛倒”像素值,即
如果像素值是二元的,則H(G1(key,p),’1’)=1-G1(key,p)如果像素值是灰度級的,則H(G1(key,p),’1’)=255-G1(key,p)描述塊如何能夠攜帶消息元素的另一種方式是,通過限定塊的兩個類別B1和B0,一個塊中可以攜帶一個比特。B1是攜帶比特“1”的塊類別,B0是攜帶比特“0”的另一塊類別。B1和B0優(yōu)選地是以這樣的方式定義的,即類別為B1的任何塊(b1)與類別為B0的任何塊(b0)具有最小的相關(guān)性。創(chuàng)建b0或b1的像素值的一種簡單的方式是將比特值作為除密鑰和像素位置之外的隨機數(shù)生成器種子。為了減少b0和b1之間的潛在“交迭”,尤其是對于具有少量像素的塊,可以按b0的值與b1的值很不相同的方式來控制隨機數(shù)生成器。在檢測期間為了讀取比特值,來自模擬形式的塊被與b1和b0相比較。如果與b1的相關(guān)性好于與b0的,則比特值“1”被讀取。否則比特值“0”被讀取。
有許多方法可以用來將來自模擬形式的塊與b0和b1相比較;但一般來說,相關(guān)性或距離度m量將會提供滿意的結(jié)果。更一般地說,如果塊類別數(shù)從2增大到N,則塊可以對N個值中的任何一個進(jìn)行編碼。注意在N個塊類別的情況下,塊可以包含多達(dá)log2(N)個比特。例如,如果N=4,依賴于塊屬于四個類別中的哪一個,具有“1”值的塊可以對0到3之間的值進(jìn)行編碼,因此包含2個比特。為了使該技術(shù)對于N個值也能起作用,在代表值的類別的塊和不代表值的類別的塊之間需要最小的相關(guān)性?!皦K”的定義可以延伸到代表從1×1像素到像素的任意不連通集合中的任何一種。
圖17示出插入了消息的一組像素的變換。具有未被修改的像素值的塊在1701處示出。在1702處是在塊被修改以攜帶具有值“1”的比特之后1701處所示的像素塊。
易于驗證,以上述方式插入了信息的VAP的像素值的直方圖或頻率分布保持不變。圖12在1201處示出了利用密鑰“test”生成的VAP,在1203處示出了利用相同的密鑰生成并添加了信息(整數(shù)值123456789)的VAP,在1205處示出了差異圖像。差異圖像的黑區(qū)域(實際上是4×4像素的塊)對應(yīng)于未被信息插入所修改(顛倒)的像素值它們對應(yīng)于嵌入“0”的塊。很明顯,類似噪聲的經(jīng)修改的區(qū)域?qū)?yīng)于嵌入“1”的區(qū)域。
執(zhí)行檢測的一種可能的方式包括在第一步驟中生成不包含信息的數(shù)字VAP。然后經(jīng)掃描、恢復(fù)和直方圖轉(zhuǎn)換的VAP的每個塊被與(1)原始數(shù)字VAP的相應(yīng)塊和(2)具有顛倒的像素值的相同塊相比較??梢允褂貌煌谋容^函數(shù)歐幾里得距離、絕對距離等等。然后,如果最接近的塊是經(jīng)顛倒的那個,則該塊的比特值被假定為“1”,否則被假定為“0”。
例如,圖17中的1703示出從模擬形式掃描、恢復(fù)和轉(zhuǎn)換后的像素塊。當(dāng)該塊與來自原始數(shù)字表示形式的VAP的相應(yīng)塊和具有顛倒的像素值的相同塊相比較時,絕對距離為對于“0”(|243-44|+|228-36|+...+|104-172|)/16=132.81對于“1”(|12-44|+|27-26|+...+|151-172|)/16=22.93在這種情況下,檢測到的比特為“1”。
如果某個比特在VAP中的不同位置被嵌入若干次,則可以跟蹤每個位置處的“0”和“1”的距離,以便每個塊對最終關(guān)于比特值的判決的貢獻(xiàn)被加權(quán)。這樣,其中對于“0”發(fā)現(xiàn)距離為55.32而對于“1”發(fā)現(xiàn)距離為51.34的塊的貢獻(xiàn)將會小于其計算如上所示的塊,其中有利于“1”的評劇更強(距離22.93對132.81)。
由于消息的存在影響VAP的外觀,因此,如果消息的結(jié)合對VAP的影響未被考慮到,則包含消息的掃描的VAP就不能與來自原始數(shù)字表示形式的VAP相比較以確定掃描的VAP是來自原始模擬拷貝還是來自非原始模塊拷貝。這可以在一旦消息已知時通過以下方式來完成重新創(chuàng)建具有消息的來自原始數(shù)字表示形式的VAP,然后將重新創(chuàng)建的具有消息的VAP與掃描的具有消息的VAP相比較。在某些情況下,消息不能被讀取,這例如是因為打印的質(zhì)量太低。但仍希望確定VAP是否是經(jīng)損毀的原本,或拷貝,或者甚至是看起來像VAP但卻是以不同方式(例如利用不同的密鑰)生成的圖樣。為了允許進(jìn)行該確定,可以預(yù)留VAP中的一部分,這一部分的塊不包含消息元素。塊的該部分可以針對給定秘密密鑰確定,并且該部分可以用于進(jìn)行確定,即使消息不能被讀取也是如此。
在每個塊中檢測到的個體比特值可以用于以魯棒且安全的方式對特定消息進(jìn)行編碼。例如,為了將由標(biāo)識數(shù)字“123456789”構(gòu)成的消息嵌入到VAP中,可以使用下述過程·以4字節(jié)或32比特表示消息,這允許了表示2^32個整數(shù)值中的任何一個。
·向32比特消息添加差錯校正/差錯檢測碼;如果使用(8,28)BCH碼,則帶有差錯校正碼的消息由28×4=112比特表示·計算VAP中的可用塊的數(shù)目;對于劃分成4塊的100×100像素圖像,這總共是625塊。112比特中的每一個可以在VAP中的5個位置處插入(625-112*5=65,剩下的塊可以不用,或用于第6次嵌入某些比特)。
·利用秘密密鑰對112比特流加擾,并將其插入到VAP的偽隨機選擇的塊中,其中利用上述方式之一來插入比特1或0。
為了從VAP的模擬表示形式檢測消息,一般可以按相反的順序來執(zhí)行步驟。注意對于非原始VAP頻率是相同的。
·確定如果嵌入了0或嵌入了1則每個塊中VAP的值應(yīng)當(dāng)是什么;·對于模擬VAP中的每個塊,測量兩個得分,一個對應(yīng)于塊包含“1”的可能性,另一個對應(yīng)于它包含“0”的可能性;·由于消息的每個比特一般被表示若干次(在這種情況下112個比特被表示5次),因此累積來自嵌入比特的不同位置的個體得分(這些位置可以用秘密密鑰來得知)。基于累積得分選擇最可能的比特。
·向112個比特應(yīng)用差錯校正,以得到32比特消息·將32比特消息轉(zhuǎn)換為整數(shù),在這種情況下為“123456789”。
分布式VAP對于某些文檔,VAP的可視方面可能與審美要求是不兼容的。例如,鈔票的審美方面是非常重要的,并且一般這些文檔的安全性特征必須是不明顯的,或者是不會產(chǎn)生干擾的,或者自然地融合到文檔設(shè)計中。向這種文檔應(yīng)用VAP的一種方式是將它們分布在文檔上。圖14示出了具有分布式VAP 1403的支票1401。分布式VAP由多個VAP單元1405構(gòu)成。在支票1401中,每個VAP單元1405(i)的大小為10×10像素,并且VAP單元1405在分布式VAP 1403中按100像素的間隔規(guī)則分布。當(dāng)放在一起時,VAP單元1405中的像素等同于大小為240×100像素的非分布式VAP。支票1401的VAP單元是很明顯的,但是通過利用紋理更重的VAP單元、通過利用較小的VAP單元和/或通過使VAP單元的位置隨機化,可以使它們不那么明顯。當(dāng)創(chuàng)建VAP單元時,可以向單元的像素賦予某個范圍的值,該范圍與文檔在單元在文檔中的位置處提供的背景相混和。還可以調(diào)節(jié)文檔的給定區(qū)域中的VAP單元的密度,以使VAP單元更不易察覺。可以用秘密密鑰來確定VAP單元的位置。
具有像素大小或點太小的VAP單元的分布式VAP分布式VAP可以由像素大小或點大小的VAP單元構(gòu)成。在這種分布式VAP中,像素大小或點大小的VAP單元(在下文中都稱為“點”)分散在模擬形式上,并且每個點具有隨機的像素亮度值。點可以按規(guī)則圖樣分布,或者可以具有隨機或偽隨機的分布。分布可以用秘密密鑰來確定。像其他VAP那樣,點是在模擬形式被打印時打印的。圖16示出了具有隨機分布的點1602的模擬形式1601。偽隨機點和點值的圖樣可以是固定大小的,例如2×2英寸,并且圖樣可以平鋪在整個模擬形式上。
在檢測時,可以應(yīng)用點檢測算法來檢測模擬形式的數(shù)字化圖像中的所有點或大部分點。用于定位點的技術(shù)在8/24/04授權(quán)的Zhao等人的標(biāo)題為“Apparatus and methods for improving detection of watermarks in content thathas undergone a lossy transformation”的美國專利6,782,2116中描述,這里通過引用將其結(jié)合進(jìn)來用于所有目的。一旦檢測到一組點,就應(yīng)用搜索算法來找出具有特定屬性的點群組。一個這種屬性可以是點的像素的值與文檔在點位置處提供的背景之間的關(guān)系。一旦找出這種點的一個群組,點圖樣的配準(zhǔn)就已知了,來自模擬形式的點的圖樣就可以與來自原始數(shù)字表示形式的點的圖樣相比較,并且模擬形式的質(zhì)量指標(biāo)就可被確定。
在包含文本和圖形的區(qū)域上分布分布式VAP通過將分布式VAP的像素分布在包含文本或圖形的區(qū)域上,可以使之更不明顯,如圖16中的1603處所示。這種VAP可以大體上針對分布式VAP按所述方式來處理。分布式VAP的單元也可以形成文檔中的特定可視圖樣,例如可見水印。
在包含其他安全性特征的區(qū)域上分布分布式VAP分布式VAP的像素可以用于形成安全性特征,例如縮放圖、活動圖、全息圖或微縮文本(微縮打印)。
利用非灰度級打印機打印VAP某些類型的打印機只能打印純黑像素,而不能夠打印具有0到255之間的任何可能的像素亮度值的灰度級VAP。對于這類打印機,用于生成VAP像素值的偽隨機數(shù)生成器可以被設(shè)置成使得像素值或者是“0”(黑)或者是“1”(白)。上述算法均可應(yīng)用于二元VAP。
應(yīng)當(dāng)注意,某些打印機,比如噴墨或激光打印機,實際上通過采用數(shù)字中間色方法產(chǎn)生了某個范圍的灰色調(diào),即,通過以高分辨率(例如1200dpi)打印微小的二元(黑?)點獲得較低分辨率(例如300ppi)的灰度級圖像。對于這些打印機,圖像的二元表示形式是由打印機從輸入的灰度級表示形式產(chǎn)生的,最終它是被打印的二元黑白圖像。不是生成和打印必須經(jīng)歷打印機的變換的灰度級VAP,可以產(chǎn)生由打印機按原樣打印(沒有數(shù)字中間色過程)的較高分辨率(例如1200dpi)的二元VAP。
為了降低較高打印分辨率下黑像素之間潛在的干擾(主要是由墨的融化或紙張對墨的吸收造成的),可以在創(chuàng)建VAP時控制黑白比率。對于其中黑像素和白像素的數(shù)目幾乎相等的正常二元VAP,比率應(yīng)當(dāng)約為1.0。降低的比率導(dǎo)致具有較少像素的VAP。出于上述原因,對于某些應(yīng)用這可能更為適當(dāng)。
要打印二元VAP,重要的是要使用適當(dāng)?shù)拇蛴》直媛?,即每英寸像?PPI)。如果PPI被設(shè)計得太高,則打印機和/或打印介質(zhì)(即紙張)可能不能夠提供這種分辨率,從而原始模擬形式的質(zhì)量可能低于預(yù)期。另一方面,如果PPI被設(shè)置得太低,則在模擬形式上打印的每個像素可能很容易被掃描儀拾取,從而質(zhì)量惡化量可能太小,以至于不能辨別拷貝和原本。選擇適當(dāng)?shù)腜PI,以便以最佳的質(zhì)量打印CDP。因此PPI常常依賴于打印機的分辨率和用于特定應(yīng)用的打印介質(zhì)的質(zhì)量。
最后,存在其他能夠打印二元VAP的二元打印過程例如,金屬、玻璃塑料或其他材料的激光雕刻、某些全息圖,等等。
將VAP用于可視加密VAP的一個有趣的屬性是,除了它們自動辨別拷貝和原本的用途之外,它們還可以用于被稱為可視加密的過程中的手動認(rèn)證,其中可視加密首先在Moni Naor and Adi Shamir,Visual Cryptograph,Eurocrypt 94中描述。
為了能夠利用VAP進(jìn)行可視加密,按通常的方式創(chuàng)建和打印VAP。讓我們把打印的VAP稱為VAP0。然后,需要判定在合法的VAP中希望看到哪個可視消息(或圖像)。一般來說,可視消息是數(shù)字黑/白圖像,它與數(shù)字VAP具有相同的像素大小(可視消息總是能被調(diào)節(jié)到匹配數(shù)字VAP的大小)。讓我們稱該可視消息為VM。然后,創(chuàng)建與VAP0和VM具有相同的像素大小的被稱為VAPk的新VAP,以使得對于每個像素(x,y)VAPk(x,y)=1-VAP0(x,y)如果VM(x,y)=0VAPk(x,y)=VAP0(x,y) 如果VM(x,y)=1VPKk是可視密鑰如果它是在透明片上打印的(值為“1”的像素將會使光通過),則當(dāng)它被準(zhǔn)確地放置在打印的VAP之上時,它會揭露消息。實際上,在這種情況下,觀察者所感知到的亮度值(我們將其稱為I(x,y))將會是打印的VAP和VAP手動密鑰中最暗的那個I(x,y)=min(VAP(x,y),VAPk(x,y))易于驗證,在消息的黑區(qū)域中(其中VM(x,y)=0),I(x,y)將始終為0,而在消息的白區(qū)域中,I(x,y)將具有與打印的VAP(x,y)相同的值。對于具有等概率的值0和1的二元VAP,這意味著在消息的白區(qū)域中,I(x,y)的50%的像素將會具有明亮值??偟膩碚f,在觀察者看來,可視消息的對比度比其原始版本稍小,但仍是可辨別的。
圖18示出二元VAP0 1801,可視消息“1234”1805,從二元VAP和可視消息創(chuàng)建的可視密鑰VAPk 1803。最后,當(dāng)VAPk 1803被覆蓋在VAP0 1801上時,可視消息被揭露的方式。
一般原理引起VAP的上述改進(jìn)的工作也闡明了VAP中體現(xiàn)的多個關(guān)于拷貝檢測的一般原理。VAP中體現(xiàn)的一個一般原理是由拷貝過程產(chǎn)生的假象可以用于確定數(shù)字表示形式已經(jīng)經(jīng)歷了多少次拷貝過程。該原理的一個示例是利用由在制作非原始模擬形式時涉及的打印和掃描所產(chǎn)生的假象來檢測模擬形式是否非原始。正如下文將更詳細(xì)描述的,該原理的另一個示例是使用數(shù)字表示形式中不具有差錯校正的一部分來確定整個數(shù)字表示形式已經(jīng)經(jīng)歷了多少次拷貝過程。兩個示例的根本之處都在于存在禁用差錯校正的拷貝。在所關(guān)注的是涉及數(shù)字和模擬形式之間的變換的拷貝的情況下,數(shù)字差錯校正對于模擬域沒有影響;在數(shù)字到數(shù)字拷貝的情況下,必須規(guī)定在數(shù)字表示形式的一部分中禁用數(shù)字差錯校正。
VAP中體現(xiàn)的另一個一般原理是用于拷貝檢測的區(qū)域具有平均信息量較高的隨機圖樣。該圖樣是由圖樣元素構(gòu)成的,這些圖樣元素可以采取任何形式,但是一般是包含VAP的數(shù)字表示形式的素元。例如,如果數(shù)字表示形式是圖像,則圖樣元素可以是像素,如果它是視頻,則圖樣元素可以是用于代表視頻圖像的塊。圖樣一般是用秘密密鑰產(chǎn)生的。圖樣的隨機性和平均信息量使得難以看到由拷貝產(chǎn)生的假象,因此難以修改圖樣以隱藏由拷貝過程產(chǎn)生的假象。隨機圖樣的屬性被仔細(xì)地選擇,以考慮到由拷貝過程產(chǎn)生的假象的特性。在VAP的情況下,例如,所選擇的屬性一方面從拷貝過程幸存,另一方面卻受到它的顯著影響。
用于涉及數(shù)字和模擬域之間的變換的拷貝的認(rèn)證圖樣在下文中,這種認(rèn)證圖樣將被稱為模擬-數(shù)字認(rèn)證圖樣。
模擬-數(shù)字認(rèn)證圖樣的一般原理模擬-數(shù)字認(rèn)證圖樣基于下面兩個原理1)非原始模擬形式始終經(jīng)歷模擬輸出過程的模擬輸出-數(shù)字記錄,而原始模擬形式僅被輸出。這導(dǎo)致了原始模擬形式和非原始模擬形式之間的可檢測的質(zhì)量差異。
2)模擬-數(shù)字認(rèn)證圖樣(ADAP)是以密鑰生成的圖形,它被設(shè)計為對由模擬和數(shù)字域之間的轉(zhuǎn)換產(chǎn)生的變換具有最大程度的敏感性,并且被設(shè)計為以使得在來自模擬形式的ADAP的數(shù)字化表示形式上工作的自動檢測器能夠測量ADAP的質(zhì)量惡化指標(biāo)從而能夠確定模擬形式是原始還是非原始模擬形式的方式示出這些變換。
容易看出,這兩個原理可以應(yīng)用到任何從原始數(shù)字表示形式產(chǎn)生的模擬形式。在所有情況下,模擬形式都是從數(shù)字表示形式制成的。任何這種模擬形式都可能包含偽隨機有噪聲信號,這是圖像中VAP的功能等同物。ADAP從而是不同模擬形式的VAP的等同物。類似地,CDP的等同物可被稱為拷貝檢測信號(CDS)。
與VAP一樣,ADAP所要求的是ADAP能夠與模擬形式的其他內(nèi)容相區(qū)分。例如,對于無線電信號,某些頻帶可以攜帶ADAP。對于諸如磁或光帶、盤或條紋之類的介質(zhì),帶、盤或條紋的預(yù)定的區(qū)域可以包含VAP,而對于多媒體模擬形式,ADAP可以包含在多媒體模擬形式的一個軌道中。
ADAP的示例性應(yīng)用利用CDS檢測偽造的RFID信號射頻識別設(shè)備(RFID)被附著到任意個體物品,并且發(fā)射充當(dāng)物品的唯一標(biāo)識的唯一信號。雖然該技術(shù)剛剛起步,并且RFID的成本仍然較高,但是預(yù)期該技術(shù)的各種應(yīng)用將會出現(xiàn),尤其是在零售、發(fā)行和存儲領(lǐng)域。
對于造假者,RFID的廣泛使用意味著偽造品必須有發(fā)射偽造的信號的偽造的RFID。RFID信號的偽造可以通過捕捉原始RFID信號并創(chuàng)建再現(xiàn)捕捉的RFID信號的RFID設(shè)備來完成。
與用VAP來檢測非原始模擬形式的情形的相似性是顯著的假定通過制作要偽造的RFID信號的原始模擬形式的數(shù)字化表示形式來捕捉要偽造的RFID信號,并且將數(shù)字化表示形式用于產(chǎn)生偽造(非原始)模擬形式,然后,RFID信號的原始模擬形式在其真實性被分析之前經(jīng)歷一次模數(shù)變換;非原始模擬形式經(jīng)歷了兩次模數(shù)變換,一次是在產(chǎn)生偽造模擬形式的過程期間,另一次是在其真實性被分析之前。額外的模數(shù)轉(zhuǎn)換一般會導(dǎo)致RFID信號的質(zhì)量或信息的額外損耗。因此,可以創(chuàng)建拷貝檢測信號(CDS),該信號對于由模數(shù)轉(zhuǎn)換產(chǎn)生的變換具有最大程度的敏感性,并且將被RFID發(fā)射。該信號將被RFID檢測器分析,以按與分析VAP很相同的方式檢測RFID設(shè)備是真實的還是偽造的。
利用ADAP大體上確定信號經(jīng)歷了多少次數(shù)模轉(zhuǎn)換和模數(shù)轉(zhuǎn)換每次信號經(jīng)歷A/D或D/A轉(zhuǎn)換時,轉(zhuǎn)換設(shè)備將會引入“噪聲”。一般來說,這樣引入的噪聲具有特定的“噪聲”圖樣。通過在信號中包括ADAP以測量由轉(zhuǎn)換引入的噪聲,分析“噪聲”的特性,并將ADAP與原始ADAP相比較,可以確定是否將包含ADAP的模擬形式或數(shù)字表示形式視為剽竊拷貝,還可以確定關(guān)于用來制作剽竊拷貝的機制的某些信息。此外,還可以通過測量質(zhì)量惡化量了解拷貝的生成。
利用CDS堵塞數(shù)字表示形式的防拷貝的“模擬漏洞”“模擬漏洞”是指打算用模擬裝置重放的數(shù)字內(nèi)容的防拷貝方案中的一個基本弱點。當(dāng)信息被轉(zhuǎn)換到模擬形式時,所有數(shù)字拷貝防護(hù)機制(數(shù)字表示形式的防拷貝)都丟失了,對于產(chǎn)生的模擬信號沒有限制,并且內(nèi)容能夠在無限制的情況下被捕捉回數(shù)字形式。通過向要保護(hù)的數(shù)字表示形式添加CDS,設(shè)備(例如DVD播放器或DVD記錄器)可以包含CDS檢測器,該CDS檢測器自動讀取CDS的質(zhì)量,并且如果CDS檢測器指示數(shù)字表示形式是原始數(shù)字表示形式或非原始數(shù)字表示形式,則許可或拒絕操作。CDS可以按多種方式放置在多個位置。例如,它可以在電影開始處以“著作權(quán)警告”幀的形式以可見方式插入,或者可以以分布式PAP的形式不明顯地放置在電影的特定位置。該原理還可用于檢測在電影院中以便攜式攝像機捕捉并被轉(zhuǎn)換和壓縮到數(shù)字文件的電影拷貝,這是因為便攜式攝像機記錄也被稱為“拷貝”過程。當(dāng)嘗試播放或拷貝用便攜式攝像機剽竊的電影時,包括CDS檢測器的設(shè)備將會停止播放或拷貝。此外,如果所有便攜式攝像機都配備有CDS插入器,則在記錄期間這種CDS插入器將會自動將CDS插入到某些幀中,同時這種CDS攜帶唯一標(biāo)識便攜式攝像機(例如便攜式攝像機ID)的消息。從而,從用便攜式攝像機剽竊的電影中,CDS檢測器不僅檢測到它是拷貝,而且還識別出剽竊的源。
利用認(rèn)證圖樣在數(shù)字介質(zhì)上實施“一次拷貝”規(guī)定當(dāng)原始信息以數(shù)字形式被記錄到諸如計算機硬盤、數(shù)字帶、高密盤或DVD盤之類的存儲介質(zhì)時,額外的盤級別差錯校正碼(例如ReedSolomon碼)一般被添加以校正記錄或讀取設(shè)備或存儲介質(zhì)的物理損毀(例如CD或DVD的刮擦)可能引入的差錯。由于盤級別差錯校正,在校正上述差錯后,可從存儲介質(zhì)讀出與原始信息完全相同的數(shù)字表示形式。也可以從存儲介質(zhì)制作原始信息的完全相同的拷貝。但是,如果沒有這種盤級別差錯校正,從其中存儲了原始信息的存儲介質(zhì)制作的拷貝將會由于記錄、讀取和介質(zhì)本身引入的差錯而經(jīng)歷“惡化”。由于即使數(shù)字到數(shù)字拷貝也會導(dǎo)致拷貝相對于原本的惡化,因此CDS可以用于實施許可用戶進(jìn)行單次數(shù)字拷貝的“一次拷貝”規(guī)定。可以利用密鑰以偽隨機方式生成CDS,這使得其內(nèi)容不可預(yù)測。為了確保CDS將由于拷貝過程而質(zhì)量降低,它不包含差錯校正方案。例如,可以被插入到高密盤或DVD的“用戶數(shù)據(jù)”部分,插入/分布到視頻或音頻壓縮格式(例如MPEG-2或H.264)的“用戶數(shù)據(jù)”字段,或者作為原始信息的一部分(例如電影開始處的視頻幀)插入或分布。當(dāng)制作原始數(shù)字表示形式的拷貝時,CDS將被以質(zhì)量降低的方式再現(xiàn)。如果制作拷貝的拷貝,則CDS將會經(jīng)歷兩次質(zhì)量降低,從而具有更低的質(zhì)量。給定CDS的這個質(zhì)量,將構(gòu)造出這樣的設(shè)備,其自動地讀取CDS的質(zhì)量,并且只在CDS指示數(shù)字表示形式是原始數(shù)字表示形式而本身不是非原始數(shù)字表示形式時才許可用戶制作拷貝。這種拷貝檢測信號的一個使用領(lǐng)域是只許可作為原始數(shù)字表示形式的DVD被拷貝的拷貝設(shè)備上的拷貝檢測機中。
結(jié)論前述“具體實施方式
”向相關(guān)技術(shù)領(lǐng)域的技術(shù)人員公開了發(fā)明人的利用拷貝檢測信號來主要確定數(shù)字表示形式是原本還是拷貝的技術(shù),用于確定對象的模擬形式是原始模擬形式還是非原始模擬形式的技術(shù),它們的經(jīng)改進(jìn)的用于定位和分析VAP的技術(shù),以及它們的用于將消息包括在VAP中的新技術(shù),并且還向相關(guān)技術(shù)領(lǐng)域的技術(shù)人員公開了發(fā)明人目前知道的用于實踐這些技術(shù)的最佳模式。相關(guān)技術(shù)領(lǐng)域的技術(shù)人員立即可以明白,除了這里公開的那些實施例外,申請人的技術(shù)的許多其他實施例也是可能的。拷貝檢測圖樣的基本技術(shù)可以和任何數(shù)字介質(zhì)以及圖樣元素、尺寸、形狀、位置一起使用,并且拷貝檢測圖樣的圖樣以及用于分析拷貝檢測信號的技術(shù)將由與拷貝檢測圖樣一起使用的介質(zhì)的性質(zhì)以及拷貝檢測圖樣的目的確定。VAP或CDS如何攜帶額外的信息,該信息是什么,以及它如何用于分析過程中也將由應(yīng)用CDS的介質(zhì)的性質(zhì)以及應(yīng)用的目的來確定。一般來說,CDS可以用于任何要檢測由拷貝過程導(dǎo)致的變化的情形中。
由于以上所有原因,“具體實施方式
”應(yīng)當(dāng)被視為從任何意義上來說都是示例性的而不是限制性的,并且這里公開的發(fā)明的范圍不由“具體實施方式
”確定,而是由以專利法所許可的完整范圍解釋的權(quán)利要求書來確定。
權(quán)利要求
1.一種確定包括具有隨機性和高平均信息量的拷貝檢測圖樣的模擬形式是否是原始模擬形式的方法,該方法包括掃描所述拷貝檢測圖樣以產(chǎn)生其數(shù)字表示形式;以及將掃描的拷貝檢測圖樣的數(shù)字表示形式的一組全局屬性中的至少一個與所述拷貝檢測圖樣的依賴于其隨機性和高平均信息量的預(yù)定屬性相比較,以至少初步確定所述模擬形式是否是所述原始模擬形式。
2.如權(quán)利要求1所述的方法,其中所述全局屬性組至少包括以下之一直方圖分布、平均亮度、兩個相鄰像素之間的平均變化程度,以及黑像素和白像素的密度分布。
3.如權(quán)利要求1所述的方法,還包括當(dāng)所述初步確定確定出所述模擬形式可能不是所述原始模擬形式時,將所述掃描的拷貝檢測圖樣與所述拷貝檢測圖樣的原始數(shù)字表示形式相比較。
4.一種存儲設(shè)備,其特征在于所述存儲設(shè)備包含在被處理器執(zhí)行時執(zhí)行如權(quán)利要求1所述的方法的代碼。
5.一種用于確定包括具有隨機性和高平均信息量的拷貝檢測圖樣的模擬形式是否是原始模擬形式的裝置,該裝置包括處理器;所述處理器可以訪問的存儲器,其中所述存儲器包含通過掃描所述拷貝檢測圖樣而產(chǎn)生的數(shù)字表示形式,并且所述處理器將掃描的拷貝檢測圖樣的數(shù)字表示形式的一組全局屬性中的至少一個與所述拷貝檢測圖樣的依賴于其隨機性和高平均信息量的預(yù)定屬性相比較,以至少初步確定所述模擬形式是否是所述原始模擬形式。
6.如權(quán)利要求5所述的裝置,其中所述全局屬性組包括直方圖分布、平均亮度、兩個相鄰像素之間的平均變化程度,以及黑像素和白像素的密度分布。
7.如權(quán)利要求5所述的裝置,其中,當(dāng)所述初步確定確定出所述模擬形式可能不是所述原始模擬形式時,所述處理器還將所述掃描的拷貝檢測圖樣與所述拷貝檢測圖樣的原始數(shù)字表示形式相比較。
8.一種存儲設(shè)備,其特征在于所述存儲設(shè)備包含在被處理器執(zhí)行時實現(xiàn)如權(quán)利要求5所述的裝置的代碼。
9.一種使用數(shù)字表示形式的拷貝檢測部分來確定拷貝關(guān)系的方法,所述拷貝檢測部分對由拷貝過程產(chǎn)生的更改敏感,所述方法包括修改所述拷貝檢測部分以使所述拷貝檢測部分更可以與另一個拷貝檢測部分相比擬;以及將所述拷貝檢測部分與所述另一個拷貝檢測部分相比較以確定所述拷貝關(guān)系。
10.如權(quán)利要求9所述的方法,其中所述修改考慮到了所述更改。
11.如權(quán)利要求9所述的方法,其中所述拷貝檢測部分是來自由所述拷貝過程產(chǎn)生的非原始數(shù)字表示形式的。
12.如權(quán)利要求9所述的方法,其中所述拷貝檢測部分是來自原始數(shù)字表示形式的。
13.如權(quán)利要求9所述的方法,其中所述修改動作是由轉(zhuǎn)換函數(shù)執(zhí)行的,所述轉(zhuǎn)換函數(shù)修改所述拷貝檢測部分以考慮到由所述拷貝過程引起的改變。
14.如權(quán)利要求13所述的方法,其中,通過測量所述拷貝檢測部分和所述另一個拷貝檢測部分之間的距離來比較它們,并且還包括在修改所述拷貝檢測部分之后測量所述拷貝檢測部分和所述另一個拷貝檢測部分的像素之間的標(biāo)準(zhǔn)偏差并且將所述標(biāo)準(zhǔn)偏差用作測量所述距離時的歸一化因子。
15.如權(quán)利要求13所述的方法,其中,通過測量所述拷貝檢測部分和所述另一個拷貝檢測部分之間的距離來比較它們,并且還包括設(shè)置所述拷貝檢測部分中的每個像素的亮度的上界和下界;以及增大其亮度位于所設(shè)置的界限之外的像素的距離。
16.根據(jù)權(quán)利要求13所述的方法,其中,存在多個所述轉(zhuǎn)換函數(shù),所述修改動作是為所述多個轉(zhuǎn)換函數(shù)中的每一個執(zhí)行的;并且所述比較動作還包括選擇由所述多個轉(zhuǎn)換函數(shù)之一所產(chǎn)生的經(jīng)修改的拷貝檢測部分以確定所述拷貝關(guān)系。
17.如權(quán)利要求16所述的方法,其中所述選擇動作選擇與所述另一個拷貝檢測部分具有最小距離的經(jīng)修改的拷貝檢測部分。
18.如權(quán)利要求13所述的方法,還包括校準(zhǔn)所述轉(zhuǎn)換函數(shù)。
19.如權(quán)利要求18所述的方法,其中所述校準(zhǔn)動作采用對由拷貝過程產(chǎn)生的更改敏感的拷貝檢測部分的兩組數(shù)字圖像,第一組屬于數(shù)字校準(zhǔn)圖像,第二組是通過打印、拷貝和掃描所述第一組來制作的。
20.如權(quán)利要求18所述的方法,其中所述拷貝檢測部分包含用于所述轉(zhuǎn)換函數(shù)的校準(zhǔn)信息,并且還包括從所述拷貝檢測部分獲得所述校準(zhǔn)信息;以及將所述獲得的校準(zhǔn)信息用于校準(zhǔn)所述轉(zhuǎn)換函數(shù)。
21.如權(quán)利要求19所述的方法,其中所述校準(zhǔn)動作是在每次確定拷貝關(guān)系時利用被相信是拷貝的數(shù)字表示形式來執(zhí)行的。
22.如權(quán)利要求13所述的方法,其中所述轉(zhuǎn)換函數(shù)基于所述拷貝檢測部分之一的直方圖。
23.如權(quán)利要求13所述的方法,其中所述轉(zhuǎn)換函數(shù)基于所述拷貝檢測部分和所述另一個拷貝檢測部分之一的平均亮度。
24.如權(quán)利要求23所述的方法,其中,存在多個轉(zhuǎn)換函數(shù),包括基于平均亮度的轉(zhuǎn)換函數(shù)和基于直方圖的轉(zhuǎn)換函數(shù),并且在所述修改動作中,在所述基于直方圖的轉(zhuǎn)換函數(shù)被應(yīng)用之前,所述基于平均亮度的轉(zhuǎn)換函數(shù)被應(yīng)用。
25.一種存儲設(shè)備,其特征在于所述存儲設(shè)備包含在被能夠訪問所述存儲設(shè)備的處理器執(zhí)行時實現(xiàn)如權(quán)利要求9所述的方法的代碼。
26.一種確定數(shù)字表示形式之間的拷貝關(guān)系的方法,所述數(shù)字表示形式中的每一個包括對由拷貝過程產(chǎn)生的更改敏感的拷貝檢測部分,所述方法包括將所述拷貝檢測部分的特征相關(guān);以及從相關(guān)程度確定所述拷貝關(guān)系。
27.如權(quán)利要求26所述的確定拷貝關(guān)系的方法,其中所述特征是在所述拷貝檢測部分的細(xì)分中被相關(guān)的,并且還包括聚集所述細(xì)分的相關(guān)程度;以及其中所述拷貝關(guān)系是從聚集的相關(guān)程度確定出來的。
28.如權(quán)利要求27所述的確定拷貝關(guān)系的方法,其中在所述聚集動作中,某些具有較低的相關(guān)程度的細(xì)分的相關(guān)程度不被包括。
29.一種存儲設(shè)備,其特征在于所述存儲設(shè)備包含在被能夠訪問所述存儲設(shè)備的處理器執(zhí)行時實現(xiàn)如權(quán)利要求26所述的方法的代碼。
全文摘要
用于制作拷貝檢測圖樣并用它們來檢測數(shù)字表示形式之間的拷貝關(guān)系的改進(jìn)技術(shù)。這些技術(shù)包括用于在不更改拷貝檢測圖樣平均信息量的情況下將消息包括在拷貝檢測圖樣中以及用于讀取消息的技術(shù),用于在不參考模擬形式的拷貝檢測圖樣的原本的數(shù)字表示形式的情況下利用模擬形式上的拷貝檢測圖樣來確定模擬形式是否是原始模擬形式的技術(shù),用于通過修改被比較的兩個拷貝檢測圖樣之一以考慮到由拷貝過程導(dǎo)致的更改來增大利用拷貝檢測圖樣進(jìn)行拷貝檢測的靈敏性的技術(shù),用于將拷貝檢測圖樣分布在文檔上的技術(shù),以及用于利用拷貝檢測圖樣的平均信息量來定位拷貝檢測圖樣的技術(shù)。還公開了涉及數(shù)字形式和模擬形式之間的變換的拷貝和數(shù)字-數(shù)字拷貝對拷貝檢測圖樣的應(yīng)用。
文檔編號H04N1/32GK1952978SQ200610152108
公開日2007年4月25日 申請日期2005年1月6日 優(yōu)先權(quán)日2004年1月6日
發(fā)明者賈斯廷·皮卡德, 趙健 申請人:湯姆遜許可證公司