專利名稱:識別媒體來源的方法、加指紋的裝置和系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及識別媒體來源的方法,用于為媒體加指紋的加指紋系統(tǒng)或裝置。
背景技術:
因特網(wǎng)的迅速發(fā)展以及所產(chǎn)生的數(shù)字數(shù)據(jù)復制和散布的可能性導致對于防止這些非法活動以及使版權所有者免于與盜版副本關聯(lián)的問題的方式的不斷增長的需求。例如,未授權副本可能由數(shù)字數(shù)據(jù)的授權分發(fā)副本(例如商業(yè)副本)制成。通過比較給定的數(shù)字數(shù)據(jù)文檔與未授權或非法散布的副本,水印能夠為版權所有者提供該文檔是版權所有者自己的知識產(chǎn)權的證明。為了壓制、防止或禁止未授權副本的擴散,通過確定用來制作未授權副本的具體分發(fā)副本來了解未授權副本的來源往往是有用的。但是,可能難以采用加水印來識別用于產(chǎn)生未授權副本的分發(fā)副本。數(shù)字加水印可用來確定未授權或非法散布副本的來源。例如,當文檔采用數(shù)字加水印來保護時,標識要接收文檔的電子分發(fā)副本的顧客的標識符可通過察覺不到的方式與版權所有者的水印一起嵌入文檔中。如果顧客違反版權所有者的利益而散布分發(fā)副本的副本,則可根據(jù)數(shù)字水印來識別該顧客,它將被包含在所有未授權或非法散布副本中。但是, 當許多分發(fā)副本要合法地散布到許多不同顧客時,對每個分發(fā)副本分別進行數(shù)字加水印通常證明是不便且費時的。
發(fā)明內(nèi)容
本發(fā)明提供用于實現(xiàn)為數(shù)據(jù)加指紋的方法及裝置。在一個實現(xiàn)中,加指紋的方法包括接收多個輸入數(shù)據(jù)集,所述多個輸入數(shù)據(jù)集中的每個被分為多個輸入段,所述多個輸入數(shù)據(jù)集中至少一個被唯一地標記;從所述多個輸入數(shù)據(jù)集中的至少兩個不同輸入數(shù)據(jù)集其中之一中選擇至少一個輸入段;以及排列所述選擇的至少一個輸入段,從而產(chǎn)生具有多個輸出段的輸出數(shù)據(jù)集,使得輸出段的數(shù)量等于各輸入數(shù)據(jù)集中的輸入段的數(shù)量。在另一個實現(xiàn)中,加指紋裝置包括多個接收單元,接收多個輸入數(shù)據(jù)集,多個輸入數(shù)據(jù)集中的每個被分為多個輸入段,多個輸入數(shù)據(jù)集中至少一個被唯一地標記;選擇器, 從多個輸入數(shù)據(jù)集中的至少兩個不同輸入數(shù)據(jù)集其中之一中選擇至少一個輸入段;以及至少一個組合器,排列所選的至少一個輸入段,從而產(chǎn)生具有多個輸出段的輸出數(shù)據(jù)集,使得輸出段的數(shù)量等于各輸入數(shù)據(jù)集中的輸入段的數(shù)量。在另一個實現(xiàn)中,用于為媒體加指紋的加指紋系統(tǒng)包括接收器,接收分為多個媒體段的所述媒體;標記所述媒體的第一編碼器,所述第一編碼器產(chǎn)生至少一個已標記媒體, 至少一個已標記媒體中的每個被分為多個已標記媒體段;第二編碼器,比較所述媒體和至少一個已標記媒體;選擇器,從所述媒體和至少一個已標記媒體其中之一中選擇至少一個媒體或已標記媒體段;以及至少一個組合器,排列所選的至少一個媒體或已標記媒體段,從而產(chǎn)生具有多個加指紋段的加指紋媒體,使得加指紋段的數(shù)量等于各媒體或已標記媒體中的媒體或已標記媒體段的數(shù)量。在另一個實現(xiàn)中,識別媒體的來源的方法包括接收所述媒體,并且識別經(jīng)過排列而形成所述媒體的多個段;從多個段的排列中產(chǎn)生典型正本密鑰(RMK);接收指紋和鏈接到指紋的源;以及比較RMK與指紋。
圖1說明用于采用兩個正本來產(chǎn)生加指紋內(nèi)容的過程的實現(xiàn)。圖2說明用于實現(xiàn)數(shù)據(jù)的加指紋的方法。圖3說明把各有五個段的三個正本組合的表示。圖4說明用于產(chǎn)生DVD封裝媒體的加指紋過程的一種可能的實現(xiàn)。圖5說明根據(jù)一種實現(xiàn)、用于產(chǎn)生DVD封裝媒體的加指紋過程的另一種可能的實現(xiàn)。圖6說明配置成處理輸入正本的段的段重組器的詳細示圖。圖7說明逐段組合兩個媒體文件以產(chǎn)生下載媒體的唯一加指紋版本的一種實現(xiàn)。圖8說明逐段組合兩個媒體文件以產(chǎn)生視頻點播內(nèi)容的唯一加指紋版本的一種實現(xiàn)。圖9說明根據(jù)采用RMK和KS的一種實現(xiàn)來識別媒體來源的一種方法。
具體實施例方式本公開描述在加指紋媒體生成和系統(tǒng)健壯性方面提供更高效率的系統(tǒng)及方法。在一種實現(xiàn)中,加指紋系統(tǒng)采用已標記和未標記內(nèi)容的偽隨機組合來提供數(shù)據(jù)的加指紋。已加指紋數(shù)據(jù)則可用來唯一識別內(nèi)容使用爭論。系統(tǒng)適用于各種類型的數(shù)據(jù),例如視頻和音頻基本數(shù)據(jù)或復用流。系統(tǒng)還可應用于封裝媒體,例如DVD和錄像帶、從因特網(wǎng)下載的內(nèi)容和/或其它任何介質。圖1說明用于采用第一正本100和第二正本102來產(chǎn)生已加指紋內(nèi)容的過程的實現(xiàn)。在其它實現(xiàn)中,可采用不同數(shù)量的正本,例如三個或三個以上。該過程包括產(chǎn)生多個正本(Hii),其中下標i表示第i個正本。第一正本100是未標記的。第二正本102例如通過采用數(shù)字加水印技術來唯一標記。在具有三個或三個以上正本的另一種實現(xiàn)中,一個正本是未標記的,而其它正本中的每個被唯一地標記(例如,第二正本以不同于第三正本的方式來標記)。在另一種實現(xiàn)中,每個正本被唯一地標記。正本100、102則被分為η個部分或段。未標記正本100中的各段為相同大小,并且具有與已標記正本102的相應段相同的內(nèi)容(例如,正本100的段1與正本102的段1的大小相同并且包括相同內(nèi)容)。這樣,副本104、106可通過偽隨機組合來自不同正本100、 102的段來產(chǎn)生,下面進行描述。雖然未標記正本100的內(nèi)容與已標記正本102的內(nèi)容相同,但每個正本將具有不同的標記。例如,未標記正本100的第一段具有與已標記正本102 的第一段相同的內(nèi)容,但是,未標記正本100的第一段沒有被標記,而已標記正本102的第一段則被標記。因此,相應段中的基本信息是相同的,但是數(shù)據(jù)可能以不影響內(nèi)容但允許段被區(qū)分的方式不同(在比較未標記和加水印數(shù)據(jù)時通常是這樣的)。根據(jù)來自m個正本的η個相應段的組合的偽隨機生成,產(chǎn)生正本的副本,它包括與正本相同的η個相應段,但各段取自偽隨機選取的正本。這些段以偽隨機方式來選取和組合(連接),使得那η個段產(chǎn)生具有偽隨機生成的段序列作為指紋的副本。副本的指紋標識副本中各段的源正本。因此,偽隨機生成經(jīng)過配置,使得可為各副本產(chǎn)生截然不同的指紋。 多個偽隨機數(shù)被產(chǎn)生,它偽隨機地分配來自正本的段,使得截然不同的指紋可分配給所有副本,而沒有重復段組合的模式。因此,所產(chǎn)生的偽隨機數(shù)的數(shù)量必須等于或超過預期副本數(shù)量。在圖2所示的流程圖中說明一種用于實現(xiàn)上述數(shù)據(jù)加指紋的方法。在200接收多個正本,在其中,每個正本被分為多個段,以及每個正本被唯一地標記(例如數(shù)字加水印)。 在一個實現(xiàn)中,一個正本保持未標記。正本中的第一段對應于其它正本中的每個的第一段。 在一個實現(xiàn)中,各段因段中的相應標記(或沒有標記)而可與其它正本的相應段區(qū)分開 (可確定那個段所屬的正本)。在另一個實現(xiàn)中,不是所有的段都可與相應的段區(qū)分開。在202,選取來自至少兩個不同正本之一的至少一個段。在204,則產(chǎn)生指紋。在一種實現(xiàn)中,指紋是偽隨機數(shù)序列。在206,根據(jù)指紋來排列所選段,從而產(chǎn)生輸出數(shù)據(jù)集, 使得輸出數(shù)據(jù)集中的段的數(shù)量等于每個正本中的段的數(shù)量。下面參照圖3來描述選擇和排列段的一個實例。在208,所產(chǎn)生的輸出數(shù)據(jù)集存儲在一種媒體產(chǎn)品、如封裝介質中(例如燒錄到⑶或DVD上、復制到VHS磁帶上),從而產(chǎn)生分發(fā)副本。在210,指紋被鏈接到封裝介質,以及鏈接被存儲(例如指紋、標識特定媒體項的ID代碼以及標識要接收該媒體項的顧客的ID代碼存儲在數(shù)據(jù)庫表條目中)。偽隨機數(shù)生成器確定要選取和排列段的模式。因此,生成器必須沒有重復地產(chǎn)生足夠多數(shù)量的偽隨機數(shù)。在一個實現(xiàn)中,生成器產(chǎn)生數(shù)字,其中包括用于各段的一位,以及每位具有從1到正本數(shù)量的范圍。各位對應副本中的某個段,以及位的值表明從哪個正本復制了該段。在另一種實現(xiàn)中,生成器產(chǎn)生適合于各段的數(shù)字作為一位,并把各位共同收集到模式中。例如,如圖3所示,如果存在三個正本1、2和3,并且每個正本被分為五段,則偽隨機數(shù)生成器產(chǎn)生五位數(shù)字,其中每位的值的范圍為1至3,從而產(chǎn)生例如‘13213’和‘22131’ 之類的數(shù)模式。這些偽隨機數(shù)模式可用于分別產(chǎn)生副本1和副本2的段,其中數(shù)模式的各位表明源正本的段。例如,正本1的段由范圍從1至5的數(shù)序列表示,正本2的段由范圍從1’至5’的數(shù)序列表示,以及正本3的段由范圍從1”至5”的數(shù)序列表示。在圖3的所述實例中,偽隨機數(shù)生成器已經(jīng)把偽隨機數(shù)序列‘13213’分配給副本1,以及把偽隨機數(shù)序列‘22131’分配給副本2。這樣,副本1的序列‘13213’表明段1將從正本1中復制,段2將從正本3中復制,依次類推。因此,副本1的段可作為1-2”_3’-4-5”來產(chǎn)生。副本2的段可類似地作為1’ -2’ -3-4”-5來產(chǎn)生。各副本的偽隨機數(shù)序列則可存儲在數(shù)據(jù)庫中,并且鏈接到請求該數(shù)據(jù)的特定用戶和/或鏈接到存儲數(shù)據(jù)的一種媒體產(chǎn)品。這些數(shù)據(jù)庫條目可在后來用于源識別。為了提供對于已加指紋媒體生成的效率和系統(tǒng)健壯性的了解,可分析確定偽隨機數(shù)序列的數(shù)量的因素。例如,可能的各個指紋的數(shù)量由三個因素來確定正本數(shù)量(m)、正本中的段的數(shù)量(η)以及可交換的段的最小數(shù)量(k)。采用這些因素,組合的數(shù)量(c)可如下確定。如果多達η個段是可交換的,則組合的數(shù)量被確定為c=tr"'~l如果η中的多達k個段是可交換的,則組合的數(shù)量被確定為
C^m-If. "C,
k^l
P]如果η中正好k個段是可交換的,則組合的數(shù)量被確定為c = (m-l)k. nCk [3]其中11Ck,表示η個中一次取k’個的組合,而11Ck則表示η個中一次取k個的組合。例如,如果對于120分鐘的影片有兩個正本(m = 2),以及每個正本被分為60個段 (n = 60)并且60個段中只有20個段(k = 20)是可交換的,則利用等式[2],唯一組合的數(shù)量被確定為4,191,844,505,805,495 (超過4000萬億)。對于更簡單的設置,假定有兩個正本(m = 2),每個正本具有20個段(η = 20),以及全部20個段都是可交換的。利用等式 [1],可能的組合的數(shù)量被確定為1,048,576。表1說明組合如何隨著正本和段的數(shù)量來縮放(c的值對于較大數(shù)進行了近似)。
mηC2201,048,5763203,486,784,40152095,367,431,640,6251020100,000,000,000,000,000,0002101,0242201,048,5762601,152,921,504,606,847,000299633,825,300,114,114,700,000,000,000,000
表 1上述數(shù)據(jù)加指紋技術可應用于其中為傳輸而產(chǎn)生物理封裝的各種不同的媒體。例如,數(shù)據(jù)的加指紋可應用于提交給奧斯卡評審員以便審查影片的DVD封裝媒體(“奧斯卡篩選者”)、應用于從因特網(wǎng)下載的內(nèi)容媒體或者應用于電纜傳遞的視頻點播(VOD)。下面詳細描述這些應用的每一個。其它應用包括家庭組網(wǎng)、定制隨選CD/DVD編制、客戶機端“燒錄”到CD/DVD可記錄媒體上以及其它相關媒體。此外,加指紋技術可移植到采用轉換開關的模擬程序分塊。來自奧斯卡篩選者媒體(例如DVD封裝媒體或VHS磁帶)的盜版問題得到理解和承認。已經(jīng)提出的一種解決方案是分別標記(例如采用唯一水印)每一個發(fā)出的副本,使得電影被標記、編碼以及分別“燒錄”到各DVD上或者錄制到VHS。但是,如上所述,采用不同水印分別標記各副本可能是非常繁重且費時的。圖4說明分別標記DVD封裝媒體的典型方法的一種可能實現(xiàn)。該過程以未標記視頻文件400開始。要產(chǎn)生的所有DVD副本的標識符(ID)存儲在數(shù)據(jù)庫402中。視頻文件400在水印編碼器404中采用唯一 ID加水印,從而產(chǎn)生已加水印視頻文件406。唯一 ID存儲在數(shù)據(jù)庫條目中。然后,已加水印視頻文件406采用視頻編碼器408 進行編碼,它產(chǎn)生壓縮視頻文件410。在一個實現(xiàn)中,視頻編碼器可配置為MPEG-2編碼器。壓縮視頻文件410與壓縮音頻文件420在復用器412中組合,從而產(chǎn)生一個或多個組合視頻-音頻文件及元數(shù)據(jù)文件414。一個或多個組合視頻-音頻文件與元數(shù)據(jù)文件 414 一起在DVD燒錄器416中被燒錄到DVD上,從而產(chǎn)生DVD副本418。標識特定DVD的ID 存儲在那個DVD上的水印的唯一 ID所用的數(shù)據(jù)庫條目中。雖然依照產(chǎn)生分別標記的DVD副本來描述上述過程,但是應當理解,這個過程通常必須為待制作的預期數(shù)量(χ)的DVD副本重復。因此,上述過程在技術上是可行的,但在實際上實現(xiàn)此過程是繁重且昂貴的。例如,對于2小時影片,水印編碼器404的加水印過程通常可能耗用多達八小時。視頻編碼器408中的MPEG-2編碼過程可能耗用多達兩小時。復用器412中的音頻-視頻組合過程可能耗用多達大約30分鐘,以及DVD燒錄過程可能耗用多達另外30分鐘。因此可以看到,每個DVD副本的產(chǎn)生可能耗用多達大約11個小時。雖然可部署附加資源并行創(chuàng)建分別標記的副本,但是對于大量的副本,并行性可能變得昂貴。圖5說明用于產(chǎn)生DVD封裝媒體的加指紋過程的一種實現(xiàn)。采用圖5的實現(xiàn),可顯著加快產(chǎn)生DVD副本的過程。在圖5的實現(xiàn)中,過程以視頻正本500開始。然后產(chǎn)生視頻正本500的兩個副本 504。視頻正本的第一副本504A未被標記,而第二副本504B則由水印編碼器502加水印。 特定加水印標識符(ID)用來對標記副本504B編碼。在另一個實現(xiàn)中,可采用不同的標記過程。然后,視頻正本的兩個副本504A、504B分別采用視頻編碼器506A、506B來編碼。視頻編碼器506A、506B分別產(chǎn)生壓縮視頻文件508A、508B。壓縮視頻文件508A未被標記,而壓縮視頻文件508B被標記。在一個實現(xiàn)中,視頻編碼器配置為MPEG-2編碼器。壓縮視頻文件508A、508B與壓縮音頻文件520分別在一對復用器510A、510B中被組合,從而分別產(chǎn)生組合視頻-音頻文件532A、532B。復用器510配置為以稱作視頻對象 (VOB)的段來處理壓縮文件508。組合視頻-音頻文件532A是具有多個段的未標記DVD文件。組合視頻-音頻文件532B是具有與未標記文件532A相同數(shù)量的段的已標記DVD文件。 這樣,DVD文件532A、532B在它們的關系方面實際上與圖1所示的兩個正本100、102之間的關系相似。下面詳細描述VOB段。段重組器534A、534B采用兩個正本DVD文件532A、532B來產(chǎn)生與圖1所示的副本 104、106相似的加指紋副本。每個段重組器534采用唯一標識符來重組(連接)每個正本 532的不同段。如上所述,各標識符由偽隨機數(shù)生成器產(chǎn)生,并存儲在數(shù)據(jù)庫522中,以便標識每個副本和/或每種媒體的接收方。這樣,圖1實際上表示塊530的一種實現(xiàn)的操作。然后,在段重組器534A、534B的輸出上產(chǎn)生的已加指紋副本分別采用DVD燒錄器 M0A、540B燒錄到DVD 542A.542B上。為了制作附加副本,來自未標記和已標記正本532A、 B的段的不同組合在重組器534A、B中任一個中被組合,然后被燒錄到DVD上。由水印編碼器502加水印、由編碼器506編碼以及由復用器510復用和處理沒有對每個副本重復進行。 因此,在圖5的實現(xiàn)中,與圖4的實現(xiàn)不同,重組器對段的重組以及到DVD的燒錄被重復進行,以便產(chǎn)生預期數(shù)量(χ)的DVD副本M2,而不是重復整個過程中的每個步驟。這樣,圖5 所示的過程應當耗用實質上更少的時間,因為加水印僅對一個視頻正本進行一次。因此,塊 530和540所表示的過程應當對于每個DVD耗用不到一個小時。圖6說明根據(jù)DVD特定的實現(xiàn)、配置成處理輸入正本的段的段重組器534的詳細示圖。但是,圖6所示的實現(xiàn)可擴展到其它封裝媒體、如錄像帶。DVD段在某些預定的視頻對象單元(VOBU)邊界上產(chǎn)生,并分組為‘V0BU組’。每個 VOBU組是獨立的復用單元,并且沒有與先前或以后單元的相關性。此外,VOBU由一個或多個圖片組(GOP)構成。如DVD-VIDEO格式中定義的,VOBU可能是0. 4至1. 2秒長。VOBU組可能具有必需數(shù)量的V0BU。VOBU組被組合以形成VOB文件集。對于每個VOB文件集產(chǎn)生元數(shù)據(jù)(IFO)文件。 元數(shù)據(jù)文件提供的細節(jié)之一是VOB文件集中的VOBU的偏移信息。對于最終用戶,從這個 VOB重放看起來就像從任何常規(guī)DVD上的VOB重放。然而在內(nèi)部,VOB是VOBU組的組合,各 VOBU組由從兩個不同視頻(MPEG-2)編碼的部分復用的數(shù)據(jù)構成。這樣,VOB遵循DVD規(guī)范限制,并且實質上是相符的。因此,如果這些DVD其中之一通過剖解或者通過重新編碼被盜版(例如以如DiVx或Xvid之類的格式),則系統(tǒng)可通過分析視頻流并定位其中存在已標記視頻段的點來識別盜版副本的來源。系統(tǒng)可比較這些位置與燒錄DVD時創(chuàng)建的、數(shù)據(jù)庫服務器中存儲的位置。各DVD對于已標記段具有唯一模式,因此各DVD被有效地“加指紋”。與圖5所示的實現(xiàn)相似的一種實現(xiàn)可用來對于從因特網(wǎng)下載的內(nèi)容媒體加指紋。 在圖7的所示實現(xiàn)700中,一個未標記702A和一個加水印702B的兩個媒體文件被分為若干段,以及組合器704以唯一模式組合這些段,從而為每個下載產(chǎn)生內(nèi)容的唯一加指紋版本。每個唯一組合采用標識符來產(chǎn)生,所述標識符由偽隨機數(shù)生成器所產(chǎn)生,并且存儲在數(shù)據(jù)庫706中以標識加指紋副本。已加指紋副本通過萬維網(wǎng)服務器708來存儲或者流式傳輸, 以便通過因特網(wǎng)710下載到客戶PC 712。對于客戶PC 712,重組/加指紋文件714表現(xiàn)為一個連續(xù)文件??蛻舨涣私庠谌f維網(wǎng)服務器708上發(fā)生的重組(即加指紋)。與圖7的實現(xiàn)相似,VOD(視頻點播)內(nèi)容可加指紋,如圖8所示。在這個實現(xiàn)中, VOD服務器從分為段的兩個媒體文件、即一個未標記802A和一個加水印802B來創(chuàng)建加指紋文件。兩個媒體文件802A、802B在組合器804中逐段被組合,從而對每個傳遞產(chǎn)生內(nèi)容的唯一加指紋版本。由于VOD媒體文件通常是經(jīng)過分組化的MPEG-2傳輸流數(shù)據(jù),這些文件是這種加指紋的優(yōu)良候選者。在圖8的所述實現(xiàn)中,兩個媒體文件802A、802B在VOD服務器808中被組合。因此,所述情況稱作單播情況,即數(shù)據(jù)在來源處被組合,然后被發(fā)送到特定目的地,其中目的地不了解其它分發(fā)副本。在另一個實現(xiàn)中(未示出),衛(wèi)星可向每個衛(wèi)星接收器盒廣播多個正本(即,向每個盒的多個正本的同時聯(lián)播)。這種實現(xiàn)稱作多播情況。在這種實現(xiàn)中,衛(wèi)星接收器盒從服務器接收RMK信息,并且在把數(shù)據(jù)提供給TV之前執(zhí)行組合。這樣,在這種實現(xiàn)中,在VOD機頂盒812上發(fā)生組合。每個唯一組合采用由偽隨機數(shù)生成器所產(chǎn)生并且存儲在數(shù)據(jù)庫806中以標識加指紋副本的標識符來產(chǎn)生。已加指紋副本通過電纜網(wǎng)絡810被送到VOD機頂盒812。已加指紋副本經(jīng)過處理并傳遞給客戶TV 814。對于客戶TV 814,重組/加指紋文件816表現(xiàn)為一個相連文件。客戶不了解在VOD服務器808上發(fā)生的重組(即加指紋)??蓤?zhí)行數(shù)據(jù)的加指紋以為系統(tǒng)提供健壯性以及媒體來源識別的方法。具體來說, 來自m個正本的η個段的組合的偽隨機生成可有效地配置成提供對于通過采用多個或部分副本生成單一未授權副本來避開來源標識的企圖的預防。在一個實現(xiàn)中,產(chǎn)生偽隨機序列, 使得來源可以僅采用未授權副本的一小部分來標識。在另一個實現(xiàn)中,對于基于組合多個來源的未授權副本,多個來源可通過相似方式來標識。在一個實現(xiàn)中,典型正本密鑰(RMK)就來源標識而言用于系統(tǒng)的健壯性。RMK是構造(副本)的段的依次讀出。如上所述,來自m個正本的η個段用來構建副本。讀出包括 η位(對于η個段),其中,每位的值的范圍從1到m。位也可能具有X值,意味著它的值無關緊要(即“無關的”)。這樣,具有從八個正本產(chǎn)生的十段的分發(fā)副本可能具有“1,4,2,5, X,6,X,1,6,2"的 RMK。RMK也可被定義為‘元組’的序列,在其中,各元組的形式是(X,y)。項χ為段號 (從1到η依次改變),以及項y為段值(值的范圍從1到m,或者具有X值)。在這種情況中,上述 RMK 可寫作“(1,1) (2,4) (3,2) (4,5) (5,X) (6,6) (7,X) (8,1) (9,6) (10,2)”。因此, RMK也可寫作形式為(元組順序,正本編號)的元組序列。制作具有不同指紋標識符的兩個或兩個以上分發(fā)副本的一種方法是為副本提供不同的RMK。這樣,當被提供未知來源的副本時,系統(tǒng)可對副本的RMK進行解碼或解密(例如,通過分析副本中的每個段的標記,以便確定那個段的源正本),并從查找表/數(shù)據(jù)庫確定那個副本的來源(例如原始分發(fā)的副本的接收方)。但是,如果未授權副本已經(jīng)從多個分發(fā)副本或者從分發(fā)副本的一部分中產(chǎn)生,則未授權副本可能具有未在數(shù)據(jù)庫中注冊的RMK, 或者具有注冊為另一個顧客的RMK,它表明錯誤肯定標識。因此,如何構建RMK的決定在數(shù)據(jù)加指紋過程中可能是重要的。在一個實現(xiàn)中,RMK具有一個或多個密鑰集(KS)。每個KS的長度范圍從1到段的總數(shù)(η),以及以元組列表的形式從RMK中讀出,并以“元組順序”的升序排列,如上所述。 RMK的不同KS可能是不同長度。這樣,在一個實例中,KS可能是如下所示KS1 = (2,4) (3, 2) (4,5) ;KS2 = (1,1) (2,4) (6,6) (10,2) ;KS3 = (1,1) (2,4) (3,2) (4,5) (5,X) (6,6) (7,X) (8,1) (9,6) (10,2) ;KS4 = (4,5);等等。當未知副本的RMK無法匹配查找表中列出的分發(fā)副本的任一個的RMK時,系統(tǒng)可執(zhí)行數(shù)學計算,以便確定未知副本的多少KS匹配查找表中的分發(fā)副本的KS。未知副本的源分發(fā)副本將被確定為提供高于所選門限值的KS匹配數(shù)量的分發(fā)副本。不同的KS可能具有不同的生成技術。為了確定KS的值,那個KS的生成技術應用于副本的RMK。例如,這些技術的一部分是比較簡單的,使得對不同的RMK產(chǎn)生特定長度的 KS0在KS生成技術的一種實現(xiàn)中,如果KS4是第四元組,則對于RMK = “(1,1) (2,4) (3,2) (4,5) (5,X) (6,6) (7,X) (8,1) (9,6) (10,2) ”,KS4 = (4,5)。但是,對于另一個 RMK, KS4 可能是KS4 = 0,7),等等。其它KS可具有更詳細的生成過程。在KS生成技術的另一種實現(xiàn)中,KS12可能以具有RMK中存在的最高正本編號的最低順序元組開始,之后跟隨比第一個具有較低正本編號的較高順序元組,之后跟隨正本編號的降序中的下一個。對于RMK = “(1,1) (2,4) (3,2) (4,5) (5,X) (6,6) (7,X) (8,1) (9,6) (10,2)”,由于當前的最高正本編號為6,因此在(6,6) 和(9,6)中,該過程選擇(6,6),因為它具有比(9,6)更低的順序。所選的下一個元組將是具有比6更低的正本編號、但具有較高順序的元組,這把過程引導到(10, 。隨后,不存在匹配集合規(guī)則的其它元組,因此過程以KS12= (6,6) (10,2)結束。在KS12的情況中,KS的長度由于此過程的選擇而不是固定的。上述過程只是可用于獲得優(yōu)良KS的許多可能性中的幾個。因此,加指紋系統(tǒng)將具有RMK以及引用數(shù)據(jù)庫中所存儲的各分發(fā)副本的RMK的多個KS。給定未知來源的副本,系統(tǒng)獲得未知副本的RMK。如果在數(shù)據(jù)庫中沒有RMK匹配,則系統(tǒng)產(chǎn)生那個RMK的KS。由于某些KS將在某些區(qū)域中定位,因此,存在系統(tǒng)能夠識別可能產(chǎn)生那個特定RMK的來源的至少一部分的可能性??梢钥吹?,上述KS生成技術可以相反地用于產(chǎn)生難以隱藏的優(yōu)良RMK集合。RMK 集合可用來構建用于分發(fā)副本的一組偽隨機數(shù),使得副本包括難以隱藏的某些KS。存在其它方式來增加加指紋系統(tǒng)的健壯性。在一種實現(xiàn)中,數(shù)據(jù)形式的RMK和/ 或一個或多個KS可被插入分發(fā)副本本身中。在分發(fā)副本的生成時間中,插入可在不同位置以及在不同方面進行。這將允許系統(tǒng)識別未知副本,即使該副本具有分發(fā)副本的極小部分。 如果那個小部分包括RMK的一個或多個部分和/或在任何方面插入的一個或多個KS數(shù)據(jù), 則未知副本可被識別為源自分發(fā)副本。在向加指紋系統(tǒng)提供健壯性的另一個實現(xiàn)中,在分發(fā)副本的生成時間中,偽數(shù)據(jù)可以數(shù)據(jù)形式在不同位置以及在不同方面被插入分發(fā)副本本身中。插入可以偽隨機方式進行,以便阻止通過模式匹配兩個或兩個以上分發(fā)副本來避開指紋的企圖。在又一個實現(xiàn)中,分發(fā)副本的某些或所有方面可采用RMK的標識符和/或一個或多個KS來標記。在這種情況中,即使副本從其它許多分發(fā)副本中重新制作,也可查詢分發(fā)副本的所需方面,從而識別重新制作的副本的來源。圖9說明根據(jù)采用RMK和KS的一種實現(xiàn)、識別媒體來源的一種方法。一開始,在 900接收要識別的媒體,以及識別經(jīng)排列以形成媒體的段。然后,在902,從段的排列中產(chǎn)生典型正本密鑰(RMK)。數(shù)據(jù)庫存儲所產(chǎn)生的分發(fā)副本的指紋以及鏈接到指紋、表明接收了與所鏈接指紋對應的分發(fā)副本的來源的標識符。在一個實現(xiàn)中,鏈接到指紋的來源可能是接收分發(fā)副本的人的名字。
在906,從數(shù)據(jù)庫接收指紋和鏈接到指紋的來源。RMK和指紋在906進行比較。如果比較產(chǎn)生匹配(即在908的“是”結果),則在910輸出所鏈接來源。否則,如果RMK與指紋之間的比較沒有產(chǎn)生匹配(即在908的“否”結果),則在912,從數(shù)據(jù)庫接收下一個指紋和所鏈接來源。如果已經(jīng)針對RMK檢查了所有指紋,并且沒有匹配,則在914,從RMK產(chǎn)生密鑰集。 這樣,當RMK與指紋之間不存在匹配時,它表示所關注媒體可能不是完全從一個分發(fā)副本中復制的。因此產(chǎn)生密鑰集,以便分析媒體的各部分,從而識別來源。在916,從數(shù)據(jù)庫接收指紋和鏈接到指紋的來源。在918,從指紋產(chǎn)生密鑰集。從 RMK產(chǎn)生的密鑰集以及從指紋產(chǎn)生的密鑰集在920進行比較。如果在922,密鑰集之間匹配的數(shù)量超過某個門限值,則在924,鏈接到指紋的來源被記錄。在926,從數(shù)據(jù)庫接收下一個指紋和所鏈接來源,以及產(chǎn)生那個指紋的密鑰集供比較,并返回到918。當所有指紋的密鑰集已經(jīng)與RMK的密鑰集進行了比較,則在擬8輸出在擬4記錄的來源,作為在900所接收的媒體的至少一部分的可能來源?;蛘?,一旦發(fā)現(xiàn)指紋之一具有在922滿足匹配的門限的密鑰集,則鏈接到那個指紋的來源被輸出。在又一個實施例中,被插入分發(fā)副本的數(shù)據(jù)形式的RMK和/或一個或多個KS可用來標識媒體的來源。此外,嵌入的RMK和/或KS另外還可用于圖9的上述識別過程來提高加指紋系統(tǒng)的健壯性。本發(fā)明的各種實現(xiàn)通過電子硬件、計算機軟件或者這些技術的組合來實現(xiàn)。大部分實現(xiàn)包括由可編程計算機執(zhí)行的一個或多個計算機程序。例如,在一個實現(xiàn)中,用于標識分發(fā)副本的系統(tǒng)包括實現(xiàn)上述標識過程的一種或多種計算機執(zhí)行軟件。在另一個實現(xiàn)中, 用于給數(shù)據(jù)加指紋的系統(tǒng)可包括實現(xiàn)上述加指紋過程的一種或多種計算機執(zhí)行軟件。一般來說,每個計算機包括一個或多個處理器、一個或多個數(shù)據(jù)存儲組件(例如易失性或非易失性存儲模塊以及永久光和磁存儲裝置,諸如硬盤和軟盤驅動器、CD-ROM驅動器以及磁帶驅動器)、一個或多個輸入裝置(例如鼠標和鍵盤)以及一個或多個輸出裝置(例如顯示控制臺和打印機)。計算機程序包括可執(zhí)行代碼,它們通常存儲在永久存儲媒體中,然后在運行時復制到存儲器中。處理器通過以規(guī)定順序從存儲器中檢索程序指令來執(zhí)行代碼。當執(zhí)行程序代碼時,計算機從輸入和/或存儲裝置接收數(shù)據(jù),對數(shù)據(jù)執(zhí)行操作,然后把所得數(shù)據(jù)傳遞給輸出和/或存儲裝置。雖然已經(jīng)描述了本發(fā)明的各種說明性實現(xiàn),但是本領域的普通技術人員會看到, 其它實現(xiàn)也是可行的,并且落入本發(fā)明的范圍之內(nèi)。例如,雖然以上說明描述了為媒體數(shù)據(jù) (例如電影)加指紋的若干實現(xiàn),但是在其它實現(xiàn)中,可采用其它類型的數(shù)據(jù),例如可執(zhí)行軟件或科學數(shù)據(jù)。因此,本發(fā)明不是僅限于上述那些實現(xiàn)。
1權利要求
1.一種加指紋裝置,包括用于接收多個輸入數(shù)據(jù)集的部件,所述多個輸入數(shù)據(jù)集中的每一個被分為多個輸入段,所述多個輸入數(shù)據(jù)集中的至少一個被唯一標記;用于從所述多個輸入數(shù)據(jù)集中的至少兩個不同的輸入數(shù)據(jù)集的其中之一中選擇至少一個輸入段的部件;以及至少一個部件,用于排列所選擇的至少一個輸入段,從而產(chǎn)生具有多個輸出段的輸出數(shù)據(jù)集,使得輸出段的數(shù)量等于每個輸入數(shù)據(jù)集中的輸入段的數(shù)量。
2.一種用于為媒體加指紋的加指紋系統(tǒng),包括 用于接收分為多個媒體段的所述媒體的部件;用于標記分為多個媒體段的所述媒體并產(chǎn)生至少一個已標記媒體的部件,所述至少一個已標記媒體中的每一個被分為多個已標記媒體段;用于壓縮分為多個媒體段的所述媒體以及至少一個已標記媒體的部件; 用于從分為多個媒體段的所述媒體和至少一個已標記媒體的其中之一中選擇至少一個分為多個媒體段的媒體或已標記媒體段的部件;以及至少一個部件,用于排列所選擇的至少一個分為多個媒體段的媒體或已標記媒體段, 從而產(chǎn)生具有多個已加指紋段的已加指紋媒體,使得已加指紋段的數(shù)量等于所述媒體中的媒體段的數(shù)量或者已標記媒體中的已標記媒體段的數(shù)量。
全文摘要
本發(fā)明涉及識別媒體來源的方法、加指紋的裝置和系統(tǒng)。一種加指紋裝置,包括多個接收單元,接收多個輸入數(shù)據(jù)集,多個輸入數(shù)據(jù)集中的每個被分為多個輸入段,多個輸入數(shù)據(jù)集中至少一個被唯一地標記;選擇器,從多個輸入數(shù)據(jù)集中的至少兩個不同輸入數(shù)據(jù)集其中之一中選擇至少一個輸入段;以及至少一個組合器,排列所選的至少一個輸入段,從而產(chǎn)生具有多個輸出段的輸出數(shù)據(jù)集,使得輸出段的數(shù)量等于各輸入數(shù)據(jù)集中的輸入段的數(shù)量。
文檔編號G06FGK102509031SQ20111027663
公開日2012年6月20日 申請日期2004年3月31日 優(yōu)先權日2003年6月23日
發(fā)明者R·薩希, S·馬利克 申請人:索尼株式會社, 索尼電影娛樂公司