專利名稱:水印嵌入方法和裝置的制作方法
技術(shù)領域:
本發(fā)明總體上涉及媒體測量,更具體來說,涉及用于在壓縮數(shù)字數(shù)據(jù)流中嵌入水印的方法和裝置。
背景技術(shù):
在現(xiàn)代電視或無線電廣播站中,一般使用壓縮數(shù)字數(shù)據(jù)流承載要傳輸?shù)囊曨l和/或音頻數(shù)據(jù)。例如,美國的用于數(shù)字電視(DTV)廣播的高級電視制式委員會(ATSC)標準,其采用用于承載視頻內(nèi)容的活動畫面專家組(MPEG)標準(如MPEG-1、MPEG-2、MPEG-3、MPEG-4等)和用于承載音頻內(nèi)容的數(shù)字音頻壓縮標準(如AC-3,也被稱為DolbyDigital)(即,ATSC標準數(shù)字音頻壓縮(AC-3),修訂版A,2001年8月)。AC-3壓縮標準基于這樣一種感知數(shù)字音頻編碼技術(shù),即,該技術(shù)在使感知失真最小化的同時減少了再現(xiàn)原音頻信號所需的數(shù)據(jù)量。具體來說,AC-3壓縮標準認識到人耳無法感知比特定譜頻率處的掩蔽能量要小的該特定譜頻率處的譜能量變化。該掩蔽能量是取決于音頻段的音調(diào)和類噪聲特性的音頻段特性。可以使用不同的公知心理聲學模型來確定特定譜頻率處的掩蔽能量。此外,AC-3壓縮標準提供了用于數(shù)字電視(DTV)、高清晰度電視(HDTV)、數(shù)字多功能盤(DVD)、數(shù)字電纜以及衛(wèi)星傳輸?shù)亩嗦暤罃?shù)字音頻格式(例如,5.1聲道格式),該多聲道數(shù)字音頻格式使得可以對特殊聲音效果(例如,環(huán)繞聲)進行廣播。
現(xiàn)有電視或無線電廣播站采用水印技術(shù)把水印嵌入根據(jù)諸如AC-3壓縮標準和MPEG高級音頻編碼(AAC)壓縮標準等的壓縮標準而壓縮的視頻和/或音頻數(shù)據(jù)流內(nèi)。典型地,水印是用于唯一地標識廣播商和/或節(jié)目的數(shù)字數(shù)據(jù)。典型地,在一個或更多個接收點(例如,家庭或其他媒體消費點)處使用解碼操作提取水印,由此,可以將該水印用于評估單個家庭和/或家庭組的收看特性,以生成收視率信息。
然而,許多現(xiàn)有水印技術(shù)被設計成與模擬廣播系統(tǒng)一起使用。具體來說,現(xiàn)有加水印技術(shù)將模擬節(jié)目數(shù)據(jù)轉(zhuǎn)換成解壓縮的數(shù)字數(shù)據(jù)流,將水印數(shù)據(jù)插入解壓縮數(shù)字數(shù)據(jù)流中,并在傳輸之前將加水印的數(shù)據(jù)流轉(zhuǎn)換成模擬格式。隨著正在向全數(shù)字廣播環(huán)境(其中通過廣播網(wǎng)絡把壓縮視頻和音頻流傳輸?shù)奖镜芈?lián)播臺)的轉(zhuǎn)變,可能需要將水印數(shù)據(jù)直接嵌入或插入壓縮數(shù)字數(shù)據(jù)流中?,F(xiàn)有加水印技術(shù)可以將壓縮數(shù)字數(shù)據(jù)流解壓縮成時域樣本,將水印數(shù)據(jù)插入這些時域樣本中,并將這些加水印的時域樣本再壓縮成加水印的壓縮數(shù)字數(shù)據(jù)流。這種解壓/壓縮可能導致壓縮數(shù)字數(shù)據(jù)流中的媒體內(nèi)容的質(zhì)量劣化。此外,現(xiàn)有解壓/壓縮技術(shù)需要附加設備并導致在某些情況下可能無法接受的廣播音頻分量的延遲。此外,本地聯(lián)播臺所采用的用于從它們的父網(wǎng)絡接收壓縮數(shù)字數(shù)據(jù)流并通過復雜拼接(splicing)設備插入本地內(nèi)容的方法不允許在對數(shù)字數(shù)據(jù)流進行再壓縮之前把壓縮數(shù)字數(shù)據(jù)流轉(zhuǎn)換成時域(解壓縮)信號。
圖1是一示例媒體監(jiān)視系統(tǒng)的框圖表示;圖2是一示例水印嵌入系統(tǒng)的框圖表示;圖3是與圖2的示例水印嵌入系統(tǒng)相關(guān)聯(lián)的示例解壓縮數(shù)字數(shù)據(jù)流的框圖表示;圖4是可用于實現(xiàn)圖2的示例水印嵌入系統(tǒng)的示例嵌入裝置的框圖表示;圖5示出了與圖4的示例嵌入裝置相關(guān)聯(lián)的示例壓縮數(shù)字數(shù)據(jù)流;圖6示出了可用于實現(xiàn)圖2的示例水印嵌入系統(tǒng)的示例量化查找表;圖7示出了可以使用圖2的示例水印嵌入系統(tǒng)來壓縮然后處理的另一示例解壓縮數(shù)字數(shù)據(jù)流;
圖8示出了與圖7的示例解壓縮數(shù)字數(shù)據(jù)流相關(guān)聯(lián)的示例壓縮數(shù)字數(shù)據(jù)流;圖9示出了其中可以對圖2的示例水印嵌入系統(tǒng)進行配置以嵌入水印的一種方式;圖10示出了其中可以實現(xiàn)圖9的修改過程的一種方式;圖11示出了其中可以處理數(shù)據(jù)幀的一種方式;圖12示出了其中可以將水印嵌入壓縮數(shù)字數(shù)據(jù)流中的一種方式;圖13示出了可用于實現(xiàn)圖2的示例水印嵌入系統(tǒng)的示例編碼頻率指數(shù)表;以及圖14是可用于實現(xiàn)圖2的示例水印嵌入系統(tǒng)的示例處理器系統(tǒng)的框圖表示。
具體實施例方式
總體上,本文公開了用于將水印嵌入壓縮數(shù)字數(shù)據(jù)流中的方法和裝置??梢詫⑦@里公開的方法和裝置用于把水印嵌入壓縮數(shù)字數(shù)據(jù)流中而不必預先對壓縮數(shù)字數(shù)據(jù)流進行解壓縮。因此,這里公開的方法和裝置無需對壓縮數(shù)字數(shù)據(jù)流進行多次解壓/壓縮循環(huán),由于多次解壓/壓縮循環(huán)可能顯著劣化壓縮數(shù)字數(shù)據(jù)流中的媒體內(nèi)容質(zhì)量,因此,這一般對于例如電視廣播網(wǎng)絡的聯(lián)播臺來說是不可接受的。
在進行廣播之前,例如,可以將這里公開的方法和裝置用于對改進型離散余弦變換(MDCT)系數(shù)組(其與根據(jù)諸如AC-3壓縮標準的數(shù)字音頻壓縮標準而格式化的壓縮數(shù)字數(shù)據(jù)流相關(guān)聯(lián))進行解包(unpack)??梢孕薷慕獍龅腗DCT系數(shù)組的尾數(shù)以嵌入水印,該水印不可感知地增大了壓縮數(shù)字數(shù)據(jù)流。當接收到壓縮數(shù)字數(shù)據(jù)流時,接收裝置(如在媒體消費點處的機頂電視計量裝置)可以從解壓縮的模擬輸出(例如,從電視機喇叭發(fā)出的輸出)提取嵌入的水印信息。可以將提取的水印信息用于識別與在媒體消費點處當前正在消費(如收看、收聽等)的媒體相關(guān)聯(lián)的媒體源和/或節(jié)目(如廣播站)。接著,可以按公知的方式將該源和節(jié)目識別信息用于生成收視率信息和/或任何其他信息,這些信息可用于評估與單個家庭和/或家庭組相關(guān)聯(lián)的收看特性。
參照圖1,使用受眾測量系統(tǒng)計量示例廣播系統(tǒng)100,該示例廣播系統(tǒng)100包括業(yè)務提供商110、電視120、遙控裝置125以及接收裝置130。可以按任何公知方式連接廣播系統(tǒng)100的多個部分。例如,將電視120置于位于住有一個或更多個人的家庭中的收看區(qū)150中,將這些人稱為家庭成員160,這些人中的一些或所有人已同意參與受眾測量調(diào)查研究。接收裝置130可以是連接到電視120的機頂盒(STB)、磁帶錄像機、數(shù)字錄像機、個人錄像機、個人計算機、數(shù)字視頻盤播放器等。收看區(qū)150包括電視120所在的區(qū)域,位于收看區(qū)150中的一個或更多個家庭成員160可以從收看區(qū)150收看電視120。
在所例示的示例中,將計量裝置140構(gòu)造成根據(jù)從接收裝置130傳送到電視120的視頻/音頻輸出信號識別收看信息。計量裝置140通過網(wǎng)絡170把該收看信息以及其他調(diào)諧和/或人口統(tǒng)計數(shù)據(jù)提供給數(shù)據(jù)收集設備180。可以使用硬件和無線通信鏈路(例如包括因特網(wǎng)、以太網(wǎng)連接、數(shù)字用戶線(DSL)、電話線、蜂窩電話系統(tǒng)、同軸電纜等)的任何期望的組合實現(xiàn)網(wǎng)絡170??梢詫?shù)據(jù)收集設備180設計成處理并且/或者存儲從計量裝置140接收的數(shù)據(jù)以生成收視率信息。
業(yè)務提供商110可以通過任何業(yè)務提供商實現(xiàn),例如有線電視業(yè)務提供商112、射頻(RF)電視業(yè)務提供商114和/或衛(wèi)星電視業(yè)務提供商116。電視120接收由業(yè)務提供商110通過多個頻道發(fā)送的多個電視信號,并且可以使電視120適合于處理和顯示按任何格式提供的電視信號,該格式為如國家電視標準委員會(NTSC)電視信號格式、高清晰度電視(HDTV)信號格式、高級電視制式委員會(ATSC)電視信號格式、逐行倒相(PAL)電視信號格式、數(shù)字視頻廣播(DVB)電視信號格式、無線電工商業(yè)協(xié)會(ARIB)電視信號格式等。
用戶操作的遙控裝置125使得用戶(例如,家庭成員160)可以將電視120調(diào)諧到期望的頻道并接收在該期望頻道上發(fā)送的信號,并使得電視120處理并呈現(xiàn)或放出在該期望頻道上發(fā)送的信號中所包含的節(jié)目或媒體內(nèi)容。電視120執(zhí)行的處理例如可以包括提取經(jīng)由接收信號傳遞的視頻和/或音頻分量、使得在與電視120相關(guān)聯(lián)的屏幕/顯示器上顯示視頻分量以及使得由與電視120相關(guān)聯(lián)的喇叭發(fā)出音頻分量。包含在電視信號中的節(jié)目內(nèi)容例如可以包括電視節(jié)目、電影、廣告、視頻游戲、網(wǎng)頁、靜態(tài)圖像和/或由業(yè)務提供商110當前提供的或?qū)硪峁┑钠渌?jié)目內(nèi)容的預演。
盡管圖1所示的多個部分被示為廣播系統(tǒng)100內(nèi)的多個獨立部分,但是可以把由這些結(jié)構(gòu)中的某些結(jié)構(gòu)執(zhí)行的功能集成在單個單元內(nèi),或者可以使用兩個或更多個獨立部分來實現(xiàn)這些功能。例如,盡管電視120和接收裝置130被示為獨立結(jié)構(gòu),但是可以將電視120和接收裝置130集成在單個單元(如集成數(shù)字電視機)中。在另一示例中,可以將電視120、接收裝置130和/或記錄裝置140集成在單個單元中。
為了評估單個家庭成員160和/或家庭組的收看特性,水印嵌入系統(tǒng)(如圖2的水印嵌入系統(tǒng)200)可以把用于唯一地識別廣播商和/或節(jié)目的水印編碼到來自業(yè)務提供商110的廣播信號中??梢栽跇I(yè)務提供商110處實現(xiàn)水印嵌入系統(tǒng),使得由業(yè)務提供商110發(fā)送的多個媒體信號(例如,電視信號)中的每一個都包括一個或更多個水印。根據(jù)家庭成員160的選擇,接收裝置130可以調(diào)諧到期望的頻道并接收在期望的頻道上發(fā)送的媒體信號,并使得電視120處理并呈現(xiàn)在期望的頻道上發(fā)送的信號中所包含的節(jié)目內(nèi)容。計量裝置140可以根據(jù)從接收裝置130傳送到電視120的視頻/音頻輸出信號識別水印信息。因此,計量裝置140可以通過網(wǎng)絡170向數(shù)據(jù)收集設備180提供該水印信息和其他調(diào)諧和/或人口統(tǒng)計數(shù)據(jù)。
在圖2中,示例水印嵌入系統(tǒng)200包括嵌入裝置210和水印源220。將嵌入裝置210構(gòu)造成把來自水印源220的水印信息230插入壓縮數(shù)字數(shù)據(jù)流240中??梢愿鶕?jù)音頻壓縮標準(如AC-3壓縮標準和/或MPEG-AAC壓縮標準,可以使用這兩者中的任何一個來通過使用來自多個音頻信號塊中每一塊的預定數(shù)量個數(shù)字化樣本來處理音頻信號塊)對壓縮數(shù)字數(shù)據(jù)流240進行壓縮。可以按例如48千赫(kHZ)的速率對壓縮數(shù)字數(shù)據(jù)流240的源(未示出)進行采樣,以形成如下所述的音頻塊。
典型地,音頻壓縮技術(shù)(諸如基于AC-3壓縮標準的音頻壓縮技術(shù))使用交疊音頻塊和MDCT算法將音頻信號轉(zhuǎn)換成壓縮數(shù)字數(shù)據(jù)流(如圖2的壓縮數(shù)字數(shù)據(jù)流240)。根據(jù)樣本音頻信號的動態(tài)特性可以使用兩個不同的塊大小(即,短塊和長塊)。例如,可以使用AC-3短塊以使音頻信號的瞬變段的前回聲最小化,而可以使用AC-3長塊以實現(xiàn)用于音頻信號的非瞬變段的高壓縮增益。根據(jù)AC-3壓縮標準,AC-3長塊對應于512時域音頻樣本塊,而AC-3短塊對應于256個時域音頻樣本。根據(jù)在AC-3壓縮標準中使用的MDCT算法的交疊結(jié)構(gòu),在AC-3長塊的情況下,通過把前一(舊)塊的256個時域樣本與當前(新)塊的256個時域樣本連接起來以獲得512個時域樣本,從而創(chuàng)建512個時域樣本的音頻塊。然后使用MDCT算法對AC-3長塊進行變換以生成256個變換系數(shù)。根據(jù)同一標準,從一對連續(xù)的時域樣本音頻塊類似地獲得AC-3短塊。然后使用MDCT算法對AC-3短塊進行變換以生成128個變換系數(shù)。然后使與兩個相鄰短塊對應的該128個變換系數(shù)交錯以生成一組256個變換系數(shù)。因此,對AC-3長塊或AC-3短塊中的任何一個的處理都得到相同數(shù)量個MDCT系數(shù)。根據(jù)作為另一示例的MPEG-AAC壓縮標準,短塊含有128個樣本,長塊含有1024個樣本。
在圖3的示例中,解壓縮數(shù)字數(shù)據(jù)流300包括多個256樣本時域音頻塊310,通常如A0、A1、A2、A3、A4以及A5所示。MDCT算法對音頻塊310進行處理以生成MDCT系數(shù)組320,例如如MA0、MA1、MA2、MA3、MA4以及MA5(其中未示出MA5)所示。例如,MDCT算法可以對音頻塊A0和A1進行處理以生成MDCT系數(shù)組MA0。將音頻塊A0與A1連接起來以生成512樣本音頻塊(如AC-3長塊),使用MDCT算法對該512樣本音頻塊進行MDCT變換以生成包括256個MDCT系數(shù)的MDCT系數(shù)組MA0。類似地,可以對音頻塊A1和A2進行處理以生成MDCT系數(shù)組MA1。因此,音頻塊A1是交疊音頻塊,因為它被用于生成MDCT系數(shù)組MA0和MA1兩者。按類似的方式,使用MDCT算法對音頻塊A2和A3進行變換以生成MDCT系數(shù)組MA2,對音頻塊A3和A4進行變換以生成MDCT系數(shù)組MA3,對音頻塊A4和A5進行變換以生成MDCT系數(shù)組MA4等。因此,音頻塊A2是用于生成MDCT系數(shù)組MA1和MA2的交疊音頻塊,音頻塊A3是用于生成MDCT系數(shù)組MA2和MA3的交疊音頻塊,音頻塊A4是用于生成MDCT系數(shù)組MA3和MA4的交疊音頻塊等。多個MDCT系數(shù)組320一起形成了壓縮數(shù)字數(shù)據(jù)流240。
如下詳細描述的,圖2的嵌入裝置210可以將來自水印源220的水印信息或水印230嵌入或插入壓縮數(shù)字數(shù)據(jù)流240中。例如,水印230可以用于唯一地識別廣播商和/或節(jié)目,使得可以生成媒體消費信息(如收看信息)和/或收視率信息。因此,嵌入裝置210生成了要傳輸?shù)募铀〉膲嚎s數(shù)字數(shù)據(jù)流250。
在圖4的示例中,嵌入裝置210包括識別單元410、解包單元420、修改單元430以及再打包單元440。盡管以下根據(jù)AC-3壓縮標準對嵌入裝置210的操作進行描述,但是可以將嵌入裝置210實現(xiàn)為通過另外或其他壓縮標準(如MPEG-AAC壓縮標準)來操作。結(jié)合圖5更詳細地描述嵌入裝置210的操作。
首先,將識別單元410構(gòu)造成識別與壓縮數(shù)字數(shù)據(jù)流240相關(guān)聯(lián)的一個或更多個幀510,這些幀中的一部分幀例如被示為圖5中的幀A和幀B。如前所述,壓縮數(shù)字數(shù)據(jù)流240可以是根據(jù)AC-3標準壓縮的數(shù)字數(shù)據(jù)流(以下稱為“AC-3數(shù)據(jù)流”)。盡管AC-3數(shù)據(jù)流240可以包括多個聲道,但是,為簡明起見,以下示例將AC-3數(shù)據(jù)流240描述成只包括一個聲道。在AC-3數(shù)據(jù)流240中,各幀510包括多個MDCT系數(shù)組520。根據(jù)AC-3壓縮標準,例如,各幀510包括6個MDCT系數(shù)組(即,6個“audblk(音頻塊)”)。例如,幀A包括MDCT系數(shù)組MA0、MA1、MA2、MA3、MA4以及MA5,幀B包括MDCT系數(shù)組MB0、MB1、MB2、MB3、MB4以及MB5。
還將識別單元410構(gòu)造成識別與各幀510相關(guān)聯(lián)的報頭信息,例如,與AC-3數(shù)據(jù)流240相關(guān)聯(lián)的聲道數(shù)。盡管示例AC-3數(shù)據(jù)流240如上所述只包括一個聲道,但是以下結(jié)合圖7和8對具有多個聲道的示例壓縮數(shù)字數(shù)據(jù)流進行描述。
參照圖5,將解包單元420構(gòu)造成對MDCT系數(shù)組520進行解包以確定壓縮信息,例如原壓縮過程的參數(shù)(即,音頻壓縮技術(shù)壓縮音頻信號或音頻數(shù)據(jù)以形成壓縮數(shù)字數(shù)據(jù)流240的方式)。例如,解包單元420可以確定使用了多少位來表示MDCT系數(shù)組520內(nèi)的各MDCT系數(shù)。此外,壓縮參數(shù)可以包括用于限制AC-3數(shù)據(jù)流240可被修改的程度的信息,以確保通過AC-3數(shù)據(jù)流240傳送的媒體內(nèi)容具有足夠高的質(zhì)量級。嵌入裝置210隨后使用解包單元420所識別的壓縮信息將期望的水印信息230嵌入/插入到AC-3數(shù)據(jù)流240中,從而確保按與信號中提供的壓縮信息相一致的方式執(zhí)行水印插入。
如在AC-3壓縮標準中詳細描述的那樣,壓縮信息還包括與各MDCT系數(shù)相關(guān)聯(lián)的尾數(shù)和冪。AC-3壓縮標準采用技術(shù)來減少用于表示各MDCT系數(shù)的位數(shù)。心理聲學掩蔽是可被這些技術(shù)利用的一個因子。例如,在特定頻率k(如音調(diào))處或跨越靠近該特定頻率k的頻帶(如類噪聲特性)存在的聲能Ek產(chǎn)生了掩蔽效應。即,如果在頻率k處或跨越靠近該頻率k的頻帶的頻譜區(qū)中的能量變化小于給定能量閾值ΔEk,那么人耳無法感知該能量變化。由于人耳的該特性,可以利用與ΔEk有關(guān)的步長對與頻率k相關(guān)聯(lián)的MDCT系數(shù)mk進行量化,而不存在給音頻內(nèi)容帶來任何人類可感知變化的風險。對于AC-3數(shù)據(jù)流240,將各MDCT系數(shù)mk表示成尾數(shù)Mk和冪Xk,使得mk=Mk·2-Xk。根據(jù)在AC-3壓縮標準中公布的已知量化查找表(如圖6的量化查找表600)可以確定用于表示MDCT系數(shù)組520的各MDCT系數(shù)的尾數(shù)Mk的位數(shù)。在圖6的示例中,量化查找表600給出了MDCT系數(shù)的由四位數(shù)表示的尾數(shù)碼或位模式和對應的尾數(shù)值。如下詳細描述的,可以改變(如增大)尾數(shù)Mk以表示MDCT系數(shù)的修改值,以將水印嵌入AC-3數(shù)據(jù)流240中。
回到圖5,將修改單元430構(gòu)造成對各MDCT系數(shù)組520執(zhí)行逆變換以生成時域音頻塊530,例如如TA0’、TA3”、TA4’、TA4”、TA5’、TA5”、TB0’、TB0”、TB1’、TB1”以及TB5’所示(未示出TA0”到TA3’和TB2’到TB4”)。修改單元430執(zhí)行逆變換操作以生成與多個256樣本時域音頻塊(將這些256樣本時域音頻塊連接起來以形成AC-3數(shù)據(jù)流240的MDCT系數(shù)組520)相關(guān)聯(lián)的前一(舊)時域音頻塊(被表示為主塊(prime block))組和當前(新)時域音頻塊(被表示為雙主塊(double-prime block))組。例如,修改單元430對MDCT系數(shù)組MA5執(zhí)行逆變換以生成時域塊TA4”和TA5’,對MDCT系數(shù)組MB0執(zhí)行逆變換以生成TA5”和TB0’,對MDCT系數(shù)組MB1執(zhí)行逆變換以生成TB0”和TB1’等。按此方式,修改單元430生成經(jīng)重構(gòu)的時域音頻塊540,該經(jīng)重構(gòu)的時域音頻塊540提供了對被壓縮的原時域音頻塊的重構(gòu),以形成AC-3數(shù)據(jù)流240。為了生成經(jīng)重構(gòu)的時域音頻塊540,修改單元430可以例如根據(jù)如以下文獻所描述的公知的Princen-Bradley時域混疊抵消(TDAC)技術(shù)添加時域音頻塊Princen等人,Analysis/Synthesis FilterBank Design Based on Time Domain Aliasing Cancellation,Institute ofElectrical and Electronics Engineers(IEEE)Transactions on Acoustics,Speech and Signal Processing,Vol.ASSP-35,No.5,pp.1153-1161(1996)。例如,通過使用Princen-Bradley TDAC技術(shù)添加主時域音頻塊TA5’和雙主時域音頻塊TA5”,修改單元430可以重構(gòu)時域音頻塊TA5(即,TA5R)。類似地,通過使用Princen-Bradley TDAC技術(shù)添加主音頻塊TB0’和雙主音頻塊TB0”,修改單元430可以重構(gòu)時域音頻塊TB0(即,TB0R)。按此方式,重構(gòu)用于形成AC-3數(shù)據(jù)流240的原時域音頻塊以使得可以將水印230直接嵌入或插入AC-3數(shù)據(jù)流240中。
還將修改單元430構(gòu)造成將水印230插入經(jīng)重構(gòu)的時域音頻塊540中以生成加水印的時域音頻塊550,例如如TA0W、TA4W、TA5W、TB0W、TB1W以及TB5W所示(未示出塊TA1W、TA2W、TA3W、TB2W、TB3W以及TB4W))。為了插入水印230,修改單元430通過把兩個相鄰的經(jīng)重構(gòu)的時域音頻塊連接起來生成可修改時域音頻塊,以創(chuàng)建512樣本音頻塊。例如,修改單元430可以把經(jīng)重構(gòu)的時域音頻塊TA5R與TB0R(各為256樣本音頻塊)連接起來以形成512樣本音頻塊。然后修改單元430可以把水印230插入由經(jīng)重構(gòu)的時域音頻塊TA5R和TB0R形成的512樣本音頻塊中,以生成加水印的時域音頻塊TA5W和TB0W。可以使用諸如在美國專利No.6,272,176、No.6,504,870以及No.6,621,881中描述的編碼過程將水印230插入經(jīng)重構(gòu)的時域音頻塊540中。因此通過引用將美國專利No.6,272,176、No.6,504,870以及6,621,881的全部公開并入于此。
在美國專利No.6,272,176、No.6,504,870以及No.6,621,881中所描述的示例編碼方法和設備中,可以將水印插入512樣本音頻塊中。例如,各512樣本音頻塊承載水印230的一位嵌入或插入數(shù)據(jù)。具體來說,可以修改或增大指數(shù)為f1和f2的譜頻率分量以插入與水印230相關(guān)聯(lián)的數(shù)據(jù)位。例如,為了插入二進制“1”,可以增強或增大與指數(shù)f1相關(guān)聯(lián)的第一譜頻率處的功率以使其成為在頻率鄰域內(nèi)的譜功率最大值(如由指數(shù)f1-2、f1-1、f1、f1+1、f1+2定義的頻率鄰域)。此時,衰減或增大與指數(shù)f2相關(guān)聯(lián)的第二譜頻率處的功率以使其成為在頻率鄰域內(nèi)的譜功率最小值(如由指數(shù)f2-2、f2-1、f2、f2+1、f2+2定義的頻率鄰域)。相反,為了插入二進制“0”,衰減與指數(shù)f1相關(guān)聯(lián)的第一譜頻率處的功率以使其成為局部譜功率最小值,而增強與指數(shù)f2相關(guān)聯(lián)的第二譜頻率處的功率以使其成為局部譜功率最大值。
回到圖5,根據(jù)加水印的時域音頻塊550,修改單元430生成加水印的MDCT系數(shù)組560,例如如MA0W、MA4W、MA5W、MB0W以及MB5W所示(未示出塊MA1W、MA2W、MA3W、MB1W、MB2W、MB3W以及MB4W)。按照上述示例,修改單元430根據(jù)加水印的時域音頻塊TA5W和TB0W生成加水印的MDCT系數(shù)組MA5W。具體來說,修改單元430將加水印的時域音頻塊TA5W與TB0W連接起來以形成512樣本音頻塊,并將該512樣本音頻塊轉(zhuǎn)換成加水印的MDCT系數(shù)組MA5W,如以下更加詳細描述的,該加水印的MDCT系數(shù)組MA5W可以用于修改原MDCT系數(shù)組MA5。
MDCT系數(shù)組520與加水印的MDCT系數(shù)組560之間的差別表示由于嵌入或插入水印230而產(chǎn)生的AC-3數(shù)據(jù)流240的變化。如結(jié)合圖6所描述的那樣,例如,修改單元430可以根據(jù)對應的加水印的MDCT系數(shù)組MA5W中的系數(shù)與原MDCT系數(shù)組MA5中的系數(shù)之間的差別,修改MDCT系數(shù)組MA5中的尾數(shù)值。量化查找表(如圖6的查找表600)可以用于確定與加水印的MDCT系數(shù)組560的MDCT系數(shù)相關(guān)聯(lián)的新尾數(shù)值,以替代與MDCT系數(shù)組520的MDCT系數(shù)相關(guān)聯(lián)的舊尾數(shù)值。由此,新尾數(shù)值表示由于嵌入或插入水印230而產(chǎn)生的AC-3數(shù)據(jù)流240的變化或增大。需要特別指出的是,在本示例實現(xiàn)中,MDCT系數(shù)的冪未改變。改變該冪可能需要重新計算基本的壓縮信號表示,從而要求對該壓縮信號進行真正的解壓/壓縮循環(huán)。如果只對尾數(shù)進行修改不足以完全反映加水印的MDCT系數(shù)與原MDCT系數(shù)之間的差,那么合適的話將受到影響的MDCT尾數(shù)設置為最大或最小值。在存在這種編碼限制的情況下,加水印過程中所包含的冗余使得可以對正確的水印進行解碼。
返回到圖6,示例量化查找表600包括在-0.9333到+0.9333范圍內(nèi)的示例尾數(shù)Mk的15級量化的尾數(shù)碼和尾數(shù)值。盡管示例量化查找表600給出了與MDCT系數(shù)相關(guān)聯(lián)的使用4位表示的尾數(shù)信息,但是AC-3壓縮標準提供了與每個MDCT系數(shù)的其他適當位數(shù)相關(guān)聯(lián)的量化查找表。為了例示其中修改單元430可以修改包含在MDCT系數(shù)組MA5中的尾數(shù)為Mk的特定MDCT系數(shù)mk的一種方式,假設原尾數(shù)值為-0.2666(即,-4/15)。使用量化查找表600,將與MDCT系數(shù)組MA5中的特定MDCT系數(shù)mk對應的尾數(shù)碼確定為0101。加水印的MDCT系數(shù)組MA5W包括尾數(shù)值為WMk的加水印的MDCT系數(shù)wmk。此外,假設加水印的MDCT系數(shù)組MA5W中的對應加水印的MDCT系數(shù)wmk的新尾數(shù)值是-0.4300,該值在尾數(shù)碼0011與0100之間。換句話說,在本示例中,水印230導致在原尾數(shù)值-0.2666與加水印的尾數(shù)值-0.4300之間產(chǎn)生了-0.1667的差。
為了將水印230嵌入或插入AC-3數(shù)據(jù)流240中,修改單元430可以使用加水印的MDCT系數(shù)組MA5W來修改或增大MDCT系數(shù)組MA5中的MDCT系數(shù)。接著上述示例,由于與對應的加水印的MDCT系數(shù)wmk相關(guān)聯(lián)的加水印的尾數(shù)WMk在尾數(shù)碼0011與0100之間(因為對應于加水印的MDCT系數(shù)wmk的尾數(shù)值是-0.4300),因此尾數(shù)碼0011或尾數(shù)碼0100均可以代替與MDCT系數(shù)mk相關(guān)聯(lián)的尾數(shù)碼0101。對應于尾數(shù)碼0011的尾數(shù)值是-0.5333(即,-8/15),對應于尾數(shù)碼0100的尾數(shù)值是-0.4(即,-6/15)。在本示例中,由于對應于尾數(shù)碼0100的尾數(shù)值-0.4最接近于期望的加水印的尾數(shù)值-0.4300,因此修改單元430選擇尾數(shù)碼0100而非尾數(shù)碼0011來代替與MDCT系數(shù)mk相關(guān)聯(lián)的尾數(shù)碼0101。結(jié)果,與加水印的MDCT系數(shù)wmk的加水印的尾數(shù)WMk對應的新尾數(shù)位模式0100代替原尾數(shù)位模式0101。類似地,按上述方式可以修改MDCT系數(shù)組MA5中的各MDCT系數(shù)。如果加水印的尾數(shù)值在尾數(shù)值量化范圍以外(即,大于0.9333或小于-0.9333),那么合適的話選擇正極限值1110或負極限值0000作為新尾數(shù)碼。此外,如上所述,盡管可以如上所述地修改與MDCT系數(shù)組的各MDCT系數(shù)相關(guān)聯(lián)的尾數(shù)碼,但是與MDCT系數(shù)相關(guān)聯(lián)的冪保持不變。
將再打包單元440構(gòu)造成對與要傳輸?shù)腁C-3數(shù)據(jù)流240的各幀相關(guān)聯(lián)的加水印的MDCT系數(shù)組560進行再打包。具體來說,再打包單元440識別出AC-3數(shù)據(jù)流240的幀內(nèi)的各MDCT系數(shù)組的位置,使得可以把對應的加水印的MDCT系數(shù)組用于修改MDCT系數(shù)組。例如,為了重建加水印的幀A,再打包單元440可以識別出MDCT系數(shù)組MA0到MA5的位置,并根據(jù)在對應識別位置處的對應加水印的MDCT系數(shù)組MA0W到MA5W修改MDCT系數(shù)組MA0到MA5。利用這里所描述的解包、修改以及再打包過程,AC-3數(shù)據(jù)流240仍然是壓縮數(shù)字數(shù)據(jù)流,同時把水印230嵌入或插入了AC-3數(shù)據(jù)流240中。結(jié)果,在不進行可能劣化AC-3數(shù)據(jù)流240中的媒體內(nèi)容質(zhì)量的附加解壓/壓縮循環(huán)的情況下,嵌入裝置210將水印230插入了AC-3數(shù)據(jù)流240中。
為簡單起見,結(jié)合圖5描述了包括單個聲道的AC-3數(shù)據(jù)流240。然而,如下所述,可以將這里所公開的方法和裝置應用于具有與多個聲道(如5.1聲道(即,5個全帶寬聲道))相關(guān)聯(lián)的音頻塊的壓縮數(shù)字數(shù)據(jù)流。在圖7的示例中,解壓縮的數(shù)字數(shù)據(jù)流700可以包括多個音頻塊組710。各音頻塊組710可以包括與多個聲道720和730相關(guān)聯(lián)的音頻塊,這些聲道720和730例如包括前左聲道、前右聲道、中央聲道、環(huán)繞左聲道、環(huán)繞右聲道以及低頻效果(LFE)聲道(例如,重低音聲道)。例如,音頻塊組AUD0包括與前左聲道相關(guān)聯(lián)的音頻塊A0L、與前右聲道相關(guān)聯(lián)的音頻塊A0R、與中央聲道相關(guān)聯(lián)的音頻塊A0C、與環(huán)繞左聲道相關(guān)聯(lián)的音頻塊A0SL、與環(huán)繞右聲道相關(guān)聯(lián)的音頻塊A0SR以及與LFE聲道相關(guān)聯(lián)的音頻塊A0LFE。類似地,音頻塊組AUD1包括與前左聲道相關(guān)聯(lián)的音頻塊A1L、與前右聲道相關(guān)聯(lián)的音頻塊A1R、與中央聲道相關(guān)聯(lián)的音頻塊A1C、與環(huán)繞左聲道相關(guān)聯(lián)的音頻塊A1SL、與環(huán)繞右聲道相關(guān)聯(lián)的音頻塊A1SR以及與LFE聲道相關(guān)聯(lián)的音頻塊A1LFE。
可以按與以上結(jié)合圖5和6描述的方式類似的方式對與音頻塊組710中的特定聲道相關(guān)聯(lián)的各音頻塊進行處理。例如,可以對與圖8的中央聲道810相關(guān)聯(lián)的多個音頻塊(例如如A0C、A1C、A2C以及A3C所示)進行變換以生成與壓縮數(shù)字數(shù)據(jù)流800相關(guān)聯(lián)的MDCT系數(shù)組820。如上所指出的,可以根據(jù)把前一(舊)256樣本音頻塊與當前(新)256樣本音頻塊連接起來而形成的512樣本音頻塊導出各MDCT系數(shù)組820。然后MDCT算法可以對時域音頻塊810(如A0C到A5C)進行處理以生成MDCT系數(shù)組(如M0C到M5C)。
根據(jù)壓縮數(shù)字數(shù)據(jù)流800的MDCT系數(shù)組820,識別單元410如上所述識別出多個幀(未示出)以及與各幀相關(guān)聯(lián)的報頭信息。該報頭信息包括與壓縮數(shù)字數(shù)據(jù)流800相關(guān)聯(lián)的壓縮信息。對于各幀,解包單元420對MDCT系數(shù)組820進行解包以確定與MDCT系數(shù)組820相關(guān)聯(lián)的壓縮信息。例如,解包單元420可以識別出由原壓縮過程用來表示各MDCT系數(shù)組820中的各MDCT系數(shù)的尾數(shù)的位數(shù)。如以上結(jié)合圖6所描述的那樣,可以將這種壓縮信息用于嵌入水印230。然后修改單元430生成經(jīng)逆變換的時域音頻塊830,例如如TA0C”、TA1C’、TA1C”、TA2C’、TA2C”以及TA3C’所示。時域音頻塊830包括前一(舊)時域音頻塊(被表示為主塊)組和當前(新)時域音頻塊(被表示為雙主塊)組。通過例如根據(jù)Princen-Bradley TDAC技術(shù)添加對應的主塊和雙主塊,可以重構(gòu)被壓縮以形成AC-3數(shù)字數(shù)據(jù)流800的原時域音頻塊(即,經(jīng)重構(gòu)的時域音頻塊840)。例如,修改單元430可以添加時域音頻塊TA1C’和TA1C”以重構(gòu)時域音頻塊TA1C(即,TA1CR)。類似地,修改單元430可以添加時域音頻塊TA2C’和TA2C”以重構(gòu)時域音頻塊TA2C(即,TA2CR)。
為了插入來自水印源220的水印230,修改單元430將兩個相鄰的經(jīng)重構(gòu)的時域音頻塊連接起來以創(chuàng)建512樣本音頻塊(即,可修改時域音頻塊)。例如,修改單元430可以將經(jīng)重構(gòu)的時域音頻塊TA1CR與TA2CR(均為256樣本短塊)連接起來以形成512樣本音頻塊。然后修改單元430將水印230插入由經(jīng)重構(gòu)的時域音頻塊TA1CR和TA2CR形成的512樣本音頻塊以生成加水印的時域音頻塊TA1CW和TA2CW。
根據(jù)加水印的時域音頻塊850,修改單元430可以生成加水印的MDCT系數(shù)組860。例如,修改單元430可以將加水印的時域音頻塊TA1CW與TA2CW連接起來以生成加水印的MDCT系數(shù)組M1CW。修改單元430根據(jù)多個加水印的MDCT系數(shù)組860中的對應一個修改MDCT系數(shù)組820。例如,修改單元430可以使用加水印的MDCT系數(shù)組M1CW來修改原MDCT系數(shù)組M1C。然后修改單元430可以針對與各聲道相關(guān)聯(lián)的音頻塊重復上述過程以將水印230插入壓縮數(shù)字數(shù)據(jù)流800中。
圖9是示出其中可以將圖2的示例水印嵌入系統(tǒng)構(gòu)造成把水印嵌入或插入壓縮數(shù)字數(shù)據(jù)流中的一種方式的流程圖。利用存儲在機器可訪問介質(zhì)(如易失性或非易失性存儲器)或其他大容量存儲裝置(例如,軟盤、CD以及DVD)的任何組合上的許多不同編程代碼中的任何編程代碼,可以將圖9的示例過程實現(xiàn)為機器可訪問指令。例如,可以在以下機器可訪問介質(zhì)中實現(xiàn)該機器可訪問指令可編程門陣列、專用集成電路(ASIC)、可擦除可編程只讀存儲器(EPROM)、只讀存儲器(ROM)、隨機存取存儲器(RAM)、磁介質(zhì)、光介質(zhì)和/或任何其他合適類型的介質(zhì)。此外,盡管圖9例示了特定次序的動作,但是也可以按其他時間順序執(zhí)行這些動作。而且,所給出并結(jié)合圖2到5描述的流程圖900僅僅是作為用于將系統(tǒng)構(gòu)造成把水印嵌入壓縮數(shù)字數(shù)據(jù)流中的一種方式的示例。
在圖9的示例中,該過程開始于識別單元410(圖4)識別與壓縮數(shù)字數(shù)據(jù)流240(圖2)相關(guān)聯(lián)的幀(如幀A(圖5))(塊910)。所識別的幀可以包括通過交疊和連接多個音頻塊而形成的多個MDCT系數(shù)組。例如,根據(jù)AC-3壓縮標準,一幀可以包括6個MDCT系數(shù)組(即,6個“audblk”)。此外,識別單元410(圖4)還識別與該幀相關(guān)聯(lián)的報頭信息(塊920)。例如,識別單元410可以識別與壓縮數(shù)字數(shù)據(jù)流240相關(guān)聯(lián)的聲道數(shù)。
然后解包單元420對該多個MDCT系數(shù)組進行解包以確定與用于生成壓縮數(shù)字數(shù)據(jù)流240的原壓縮過程相關(guān)聯(lián)的壓縮信息(塊930)。具體來說,解包單元420識別各MDCT系數(shù)組的各MDCT系數(shù)mk的尾數(shù)Mk和冪Xk。然后可以按與AC-3壓縮標準相適應的方式對MDCT系數(shù)的冪進行分組。解包單元420(圖4)還確定用于表示各MDCT系數(shù)的尾數(shù)的位數(shù),使得可以如以上結(jié)合圖6所描述的那樣可以使用由AC-3壓縮標準指定的合適的量化查找表來修改或增大所述多個MDCT系數(shù)組。然后控制進行到塊940,以下結(jié)合圖10對該塊940進行更詳細的描述。
如圖10所示,修改過程940這樣開始利用修改單元430(圖4)對MDCT系數(shù)組執(zhí)行逆變換以生成經(jīng)逆變換的時域音頻塊(塊1010)。具體來說,修改單元430生成與用于生成對應的MDCT系數(shù)組的各256樣本原時域音頻塊相關(guān)聯(lián)的前一(舊)時域音頻塊(例如,被表示為圖5中的主塊)和當前(新)時域音頻塊(被表示為圖5中的雙主塊)。如結(jié)合圖5所描述的那樣,例如,修改單元430可以根據(jù)MDCT系數(shù)組MA5生成TA4”和TA5’,根據(jù)MDCT系數(shù)組MB0生成TA5”和TB0’,根據(jù)MDCT系數(shù)組MB1生成TB0”和TB1’。對于各時域音頻塊,修改單元430例如根據(jù)Princen-Bradley TDAC技術(shù)添加對應的主塊和雙主塊以重構(gòu)時域音頻塊(塊1020)。根據(jù)上述示例,可以添加主塊TA5’和雙主塊TA5”以重構(gòu)時域音頻塊TA5(即,經(jīng)重構(gòu)的時域音頻塊TA5R),而可以添加主塊TB0’和雙主塊TB0”以重構(gòu)時域音頻塊TB0(即,經(jīng)重構(gòu)的時域音頻塊TB0R)。
為了插入水印230,修改單元430使用經(jīng)重構(gòu)的時域音頻塊生成可修改時域音頻塊(塊1030)。修改單元430使用兩個相鄰的經(jīng)重構(gòu)的時域音頻塊生成可修改的512樣本時域音頻塊。例如,修改單元430可以通過將圖5的經(jīng)重構(gòu)的時域音頻塊TA5R與TB0R連接起來生成可修改時域音頻塊。
通過實現(xiàn)編碼過程,例如在美國專利No.6,272,176、No.6,504,870和/或6,621,881中所描述的一個或更多個編碼方法和裝置,修改單元430將來自水印源220的水印230插入可修改時域音頻塊中(塊1040)。例如,修改單元430可以將水印230插入通過使用經(jīng)重構(gòu)的時域音頻塊TA5R和TB0R而生成的512樣本時域音頻塊中,以生成加水印的時域音頻塊TA5W和TB0W。根據(jù)這些加水印的時域音頻塊和壓縮信息,修改單元430生成加水印的MDCT系數(shù)組(塊1050)。如上所指出的,兩個加水印的時域音頻塊(其中各塊均包括256個樣本)可以用于生成加水印的MDCT系數(shù)組。例如,可以把加水印的時域音頻塊TA5W與TB0W連接起來然后把它們用于生成加水印的MDCT系數(shù)組MA5W。
如以上結(jié)合圖6描述的那樣,根據(jù)與壓縮數(shù)字數(shù)據(jù)流240相關(guān)聯(lián)的壓縮信息,修改單元430計算與加水印的MDCT系數(shù)組MA5W中的各加水印的MDCT系數(shù)相關(guān)聯(lián)的尾數(shù)值。按此方式,修改單元430可以使用加水印的MDCT系數(shù)組修改或增大原MDCT系數(shù)組以將水印230嵌入或插入壓縮數(shù)字數(shù)據(jù)流240中(塊1060)。按照以上示例,修改單元430可以根據(jù)圖5的加水印的MDCT系數(shù)組MA5W代替原MDCT系數(shù)組MA5。例如,修改單元430可以將MDCT系數(shù)組MA5中的原MDCT系數(shù)置換為來自加水印的MDCT系數(shù)組MA5W中的對應加水印的MDCT系數(shù)(其具有增大的尾數(shù)值)。另選地,修改單元430可以計算在與原MDCT系數(shù)和對應加水印的MDCT系數(shù)相關(guān)聯(lián)的尾數(shù)碼之間的差(即,ΔMk=Mk-WMk)并根據(jù)該差ΔMk修改原MDCT系數(shù)。在任一情況下,在修改了原MDCT系數(shù)組之后,修改過程940結(jié)束并且控制返回到塊950。
回到圖9,再打包單元440對壓縮數(shù)字數(shù)據(jù)流的幀進行再打包(塊950)。再打包單元440識別MDCT系數(shù)組在幀內(nèi)的位置,使得可以在原MDCT系數(shù)組的位置處替換為經(jīng)修改的MDCT系數(shù)組以重建該幀。在塊960處,如果嵌入裝置210確定需要處理壓縮數(shù)字數(shù)據(jù)流240的其他幀,那么控制返回到塊910。而如果已處理完壓縮數(shù)字數(shù)據(jù)流240的所有幀,那么過程900結(jié)束。
如上所指出的,典型地,公知的加水印技術(shù)將壓縮數(shù)字數(shù)據(jù)流解壓縮成解壓縮的時域樣本,將水印插入該時域樣本,并將加水印的時域樣本再壓縮成加水印的壓縮數(shù)字數(shù)據(jù)流。與之對照的是,在這里所描述的示例解包、修改以及再打包過程中,數(shù)字數(shù)據(jù)流240保持壓縮狀態(tài)。結(jié)果,在不進行可能劣化壓縮數(shù)字數(shù)據(jù)流500中的內(nèi)容質(zhì)量的附加解壓/壓縮循環(huán)的情況下,將水印230嵌入了壓縮數(shù)字數(shù)據(jù)流240中。
為了進一步說明圖9和10的示例修改過程,圖11示出了其中可以處理數(shù)據(jù)幀(如AC-3幀)的一種方式。示例幀處理過程1100這樣開始嵌入裝置210讀取所獲得的幀(如AC-3幀)的報頭信息(塊1110)并將MDCT系數(shù)組計數(shù)初始化成0(塊1120)。在處理的是AC-3幀的情況下,每個AC-3幀都包括具有壓縮域數(shù)據(jù)的6個MDCT系數(shù)組(如圖5的MA0、MA1、MA2、MA3、MA4以及MA5,在AC-3標準中也被稱為“audblk”)。因此,嵌入裝置210確定MDCT系數(shù)組計數(shù)是否等于6(塊1130)。如果MDCT系數(shù)組計數(shù)尚不等于6,則表示至少還有一個MDCT系數(shù)組需要處理,嵌入裝置210提取與該幀的MDCT系數(shù)相關(guān)聯(lián)的冪(塊1140)和尾數(shù)(塊1150)(如以上結(jié)合圖6所描述的原尾數(shù)Mk)。嵌入裝置210計算出與在塊1220處讀取的碼符號相關(guān)聯(lián)的新尾數(shù)(如以上結(jié)合圖6所描述的新尾數(shù)WMk)(塊1160),并根據(jù)該新尾數(shù)修改與該幀相關(guān)聯(lián)的原尾數(shù)(塊1170)。例如,可以根據(jù)該新尾數(shù)與原尾數(shù)之差(但是限制在與原尾數(shù)的位表示相關(guān)聯(lián)的范圍之內(nèi))修改原尾數(shù)。嵌入裝置210使MDCT系數(shù)組計數(shù)加1(塊1180)并且控制返回到塊1130。盡管將以上圖11的示例過程描述成包括6個MDCT系數(shù)組(如MDCT系數(shù)組計數(shù)的閾值為6),但是也可以使用利用了更多或更少個MDCT系數(shù)組的過程。在塊1130處,如果MDCT系數(shù)組計數(shù)等于6,那么已處理完所有MDCT系數(shù)組,從而已嵌入了水印并且嵌入裝置210對幀進行了再打包(塊1190)。
如上所指出的,已知很多用于將人耳不可感知的水印(如不可聽碼)嵌入解壓縮音頻信號中的方法。例如,在Jensen等人的美國專利No.6,421,445中描述的一種公知方法,通過引用將其全部公開內(nèi)容并入于此。具體來說,如Jensen等人所述,碼信號(如水印)可以包括按10個不同頻率組合的信息,這些頻率可以由解碼器使用音頻樣本序列(例如,如下詳細描述的12,288個音頻樣本序列)的傅立葉譜分析而檢測到。例如,可以按48千赫(kHz)的速率對音頻信號進行采樣以輸出可被處理(如使用傅立葉變換)的12,288個音頻樣本的音頻序列,以獲得對經(jīng)解壓縮的音頻信號的相對高分辨率(如3.9Hz)的頻域表示。然而,根據(jù)Jensen等人公開的方法的編碼過程,在整個音頻樣本序列上具有常數(shù)幅值的正弦碼信號是不可接受的,因為人耳可以感知到正弦碼信號。為了滿足掩蔽能量限制(即,為了確保正弦碼信號信息保持不可被感知),使用掩蔽能量分析在整個12,288個音頻樣本的序列上對正弦碼信號進行合成,該掩蔽能量分析用于確定各音頻樣本塊內(nèi)的局部正弦幅值(例如,其中每個音頻樣本塊都可以包括512個音頻樣本)。由此,根據(jù)該掩蔽能量分析,局部正弦波形在12,288個音頻樣本序列上可以是(相位)相干,但是具有變化的幅值。
然而,與Jensen等人公開的方法相比,可以將這里所描述的方法和裝置用于按這樣的方式把水印或其他碼信號嵌入壓縮音頻信號中,即,使得在解包、修改以及再打包過程中包含有壓縮音頻信號的壓縮數(shù)字數(shù)據(jù)流保持壓縮狀態(tài)。圖12示出了其中可以將水印(如Jensen等人公開的水印)插入壓縮音頻信號的一種方式。該示例過程1200開始于將幀計數(shù)初始化為0(塊1210)??梢詫Ρ硎靖饕纛l聲道的總共12,288個音頻樣本的8個幀(如AC-3幀)進行處理,以將一個或更多個碼符號(例如,圖13所示并且由Jensen等人描述的一個或更多個符號“0”、“1”、“S”以及“E”)嵌入音頻信號中。盡管這里所描述的壓縮數(shù)字數(shù)據(jù)流包括12,288個音頻樣本,但是該壓縮數(shù)字數(shù)據(jù)流可以具有更多或更少個音頻樣本。嵌入裝置210(圖2)可以從水印源220讀取水印230以將一個或更多個碼符號插入幀序列中(塊1220)。嵌入裝置210可以獲得這些幀中的一個幀(塊1230)并進行到上述幀處理操作1100以對獲得的幀進行處理。因此,示例幀處理操作1100結(jié)束,并且控制回到塊1250以使幀計數(shù)加1。嵌入裝置210確定該幀計數(shù)是否為8(塊1260)。如果幀計數(shù)不是8,則嵌入裝置210返回去獲得該序列中的另一幀并重復如以上結(jié)合圖11所描述的示例幀處理操作1100來處理另一幀。而如果幀計數(shù)為8,則嵌入裝置210返回到塊1210以將幀計數(shù)重新初始化為0并重復過程1200以處理另一幀序列。
如以上指出的,可以將碼信號(如水印230)嵌入或插入壓縮數(shù)字數(shù)據(jù)流(如AC-3數(shù)據(jù)流)。如圖13的示例表1300所示和由Jensen等人描述的那樣,碼信號可以包括與頻率指數(shù)f1到f10對應的10個正弦分量的組合以表示4個碼符號“0”、“1”、“S”以及“E”中的一個。例如,碼符號“0”可以表示二進制值0,碼符號“1”可以表示二進制值1。此外,碼符號“S”可以表示消息的開始,碼符號“E”可以表示消息的結(jié)束。盡管圖13只示出了4個碼符號,但是也可以使用更多或更少個碼符號。此外,表1300列出了與各符號的10個正弦分量大致所在的中心頻率對應的變換位(transform bins)。例如,512樣本中心頻率指數(shù)(如10、12、14、16、18、20、22、24、26以及28)與壓縮數(shù)字數(shù)據(jù)流的低分辨率頻域表示相關(guān)聯(lián),12,288樣本中心頻率指數(shù)(如240、288、336、384、432、480、528、576、624以及672)與壓縮數(shù)字數(shù)據(jù)流的高分辨率頻域表示相關(guān)聯(lián)。
如以上所指出的,可以使用與表1300所示的頻率指數(shù)f1到f10相關(guān)聯(lián)的10個正弦分量形成各碼符號。例如,用于插入或嵌入碼符號“0”的碼信號包括分別與頻率指數(shù)237、289、339、383、429、481、531、575、621以及673對應的10個正弦分量。類似地,用于插入或嵌入碼符號“1”的碼信號包括分別與頻率指數(shù)239、291、337、381、431、483、529、573、623以及675對應的10個正弦分量。如示例表1300所示,頻率指數(shù)f1到f10中的每一個都具有位于或靠近12,288樣本中心頻率指數(shù)中每一個的唯一頻率值。
使用這里描述的方法和裝置可以在時域中對與頻率指數(shù)f1到f10相關(guān)聯(lián)的10個正弦分量中的每一個進行合成。例如,用于插入或嵌入碼符號“0”的碼信號可以包括正弦曲線c1(k)、c2(k)、c3(k)、c4(k)、c5(k)、c6(k)、c7(k)、c8(k)、c9(k)以及c10(k)??梢栽跁r域中將第一正弦曲線c1(k)合成為如下樣本序列c1(k)=cos2π*237k12288,]]>對于k=0到12287。但是,按此方式生成的正弦曲線c1(k)在整個12,288樣本窗口上將具有常數(shù)幅值。相反地,為了生成其幅值可以隨音頻塊變化的正弦曲線,可以如下計算與第一正弦曲線c1(k)相關(guān)聯(lián)的512樣本音頻塊(如長AC-3塊)中的樣本值c1p(m)=w(m)cos2π*237*(p*256+m)12288,]]>對于m=0到511和p=0到46,其中w(m)是在上述AC-3壓縮中使用的窗口函數(shù)。本領域的技術(shù)人員將理解,可以直接使用前一公式來計算c1p(m),或者可以預先計算c1(k)并提取合適的段以生成c1p(m)。在任一情況下,c1p(m)的MDCT變換都包括一組MDCT系數(shù)值(如256個實數(shù))。接著前一示例,對于對應于符號“0”的c1p(m),與512樣本頻率指數(shù)9、10以及11相關(guān)聯(lián)的MDCT系數(shù)值可以具有很大的量級,這是因為c1p(m)與12,288樣本中心頻率指數(shù)240(其對應于512樣本中心頻率指數(shù)10)相關(guān)聯(lián)。對于c1p(m)的情況,相對于與512樣本頻率指數(shù)9、10以及11相關(guān)聯(lián)的MDCT系數(shù)值來說,將忽略與其他512樣本頻率指數(shù)相關(guān)聯(lián)的MDCT系數(shù)值。通常,把與c1p(m)(以及其他正弦分量c2p(m),...,c10p(m))相關(guān)聯(lián)的MDCT系數(shù)值除以如下歸一化因子QQ=5124=128,]]>其中512是與各塊相關(guān)聯(lián)的樣本數(shù)。該歸一化使得12,288樣本中心頻率指數(shù)240處的單位幅值的時域余弦波可以生成512樣本中心頻率指數(shù)10處的單位幅值MDCT系數(shù)。
接著前一示例,對于與碼符號“0”相關(guān)聯(lián)的c1p(m),碼頻率指數(shù)237(如,與關(guān)聯(lián)于碼符號“0”的頻率指數(shù)f1對應的頻率值)使得512樣本中心頻率指數(shù)10具有相對于512樣本頻率指數(shù)9和11的最高MDCT量級,這是因為512樣本中心頻率指數(shù)10對應于12,288樣本中心頻率指數(shù)240并且碼頻率指數(shù)237接近于12,288樣本中心頻率指數(shù)240。類似地,與碼頻率指數(shù)289對應的第二頻率指數(shù)f2可以在512樣本頻率指數(shù)11、12以及13中生成具有很大MDCT量級的MDCT系數(shù)。碼頻率指數(shù)289可以使得512樣本中心頻率指數(shù)12具有最高MDCT量級,這是因為512樣本中心頻率指數(shù)12對應于12,288樣本中心頻率指數(shù)288并且碼頻率指數(shù)289接近于12,288樣本中心頻率指數(shù)288。類似地,與碼頻率指數(shù)339對應的第三頻率指數(shù)f3可以在512樣本頻率指數(shù)13、14以及15中生成具有很大MDCT量級的MDCT系數(shù)。碼頻率指數(shù)339可以使得512樣本中心頻率指數(shù)14具有最高MDCT量級,這是因為512樣本中心頻率指數(shù)14對應于12,288樣本中心頻率指數(shù)336并且碼頻率指數(shù)339接近于12,288樣本中心頻率指數(shù)336。根據(jù)在10個頻率指數(shù)f1到f10中的每一個處的正弦分量,表示實際加水印的碼信號的MDCT系數(shù)將對應于從9到29的范圍內(nèi)的512樣本頻率指數(shù)。某些512樣本頻率指數(shù)(如9、11、13、15、17、19、21、23、25、27以及29)可能受到來自兩個相鄰碼頻率指數(shù)的能量溢出的影響,其中溢出量是根據(jù)掩蔽能量分析而應用于各正弦分量的權(quán)重的函數(shù)。因此,在壓縮數(shù)字數(shù)據(jù)流的各512樣本音頻塊中,可以如下所述地計算MDCT系數(shù)以表示碼信號。
在壓縮AC-3數(shù)據(jù)流中,例如,各AC-3幀包括具有6個MDCT系數(shù)(例如,圖5的MA0、MA1、MA2、MA3、MA4以及MA5)的MDCT系數(shù)組,其中每個MDCT系數(shù)都對應于512樣本音頻塊。如以上結(jié)合圖5和6描述的,將每個MDCT系數(shù)表示成mk=Mk*2-Xk=(sk*Nk)*2-Xk,]]>其中Xk是冪,Mk是尾數(shù)。尾數(shù)Mk是尾數(shù)步長sk與整數(shù)值Nk之積??梢詫⑽矓?shù)步長sk和冪Xk用于形成量化步長Sk=sk*2-Xk.]]>參照圖6的查找表600,例如,當原尾數(shù)值為-0.2666(即,-4/15)時,尾數(shù)步長sk是2/15,整數(shù)值Nk是-2。
為了將碼信號插入壓縮AC-3數(shù)據(jù)流中,確定對k=9到29的尾數(shù)組Mk進行了修改。例如,考慮k=9到29的尾數(shù)組Mk的子集,其中與加水印的MDCT系數(shù)wm9、wm10以及wm11對應的MDCT系數(shù)量級C9、C10以及C11分別是-0.3、0.8以及0.2(具有基于局部掩蔽能量的變化幅值)。此外,假設與512樣本中心頻率指數(shù)11相關(guān)聯(lián)的碼MDCT量級C11是具有整個尾數(shù)組(Ck,k=9到29)的最低絕對量級(如絕對值0.2)的MDCT系數(shù)。由于碼MDCT量級C11具有最低絕對量級,因此將碼MDCT量級C11的值用于對MDCT系數(shù)m9、m10以及m11(以及組m9到m29中的其他MDCT系數(shù))的值進行歸一化和修改。首先,將C11歸一化為1.0然后將其用于進行歸一化,例如,將C9和C10歸一化為G9=-0.3/C11=-1.5以及C10=0.8/C11=4.0。然后,使與原MDCT系數(shù)m11對應的尾數(shù)整數(shù)值N11增大1,因為1是最小量(由于尾數(shù)步長量化),利用該最小值可以修改m11以反映與C11對應的水印碼的添加。最后,如下相對于N11修改與原MDCT系數(shù)m9和m10對應的尾數(shù)整數(shù)值N9和N10N9->N9+-1.5*S11S9]]>和N10->N10+4.0*S11S10.]]>因此,可以把經(jīng)修改的尾數(shù)整數(shù)值N9、N10以及N11(以及把經(jīng)類似修改的尾數(shù)整數(shù)N12到N29)用于修改對應的原MDCT系數(shù)以嵌入水印碼。而且,如上所述,對于任何MDCT系數(shù),最大改變受其尾數(shù)整數(shù)值Nk的上限和下限的限制。例如,參照圖6,表600示出了下限值-0.9333到上限值+0.9333。
由此,前述示例例示了如何可以將局部掩蔽能量用于確定待嵌入壓縮音頻信號數(shù)字數(shù)據(jù)流中的碼符號的碼量級。此外,在這里所描述的方法和裝置的編碼過程中,在不對MDCT系數(shù)執(zhí)行解壓縮的情況下修改了壓縮數(shù)字數(shù)據(jù)流的8個連續(xù)幀。
圖14是可用于實現(xiàn)這里所公開的方法和裝置的示例處理器系統(tǒng)2000的框圖。處理器系統(tǒng)2000可以是臺式計算機、膝上型計算機、筆記本計算機、個人數(shù)字助理(PDA)、服務器、因特網(wǎng)設備或任何其他類型的計算設備。
圖14所示的處理器系統(tǒng)2000包括芯片組2010,該芯片組2010包括存儲控制器2012和輸入/輸出(I/O)控制器2014。如所公知的,芯片組一般提供存儲器和I/O管理功能,以及可由處理器2020訪問或使用的多個通用和/或?qū)S眉拇嫫?、計時器等。使用一個或更多個處理器來實現(xiàn)處理器2020。另選地,可以將其他處理技術(shù)用于實現(xiàn)處理器2020。處理器2020包括高速緩存2022,其可以使用第一級統(tǒng)一高速緩存(L1)、第二級統(tǒng)一高速緩存(L2)、第三級統(tǒng)一高速緩存(L3)和/或任何其他合適的結(jié)構(gòu)來實現(xiàn),以存儲數(shù)據(jù)。
常規(guī)上,存儲控制器2012用于執(zhí)行使得處理器2020可以通過總線2040訪問包括易失性存儲器2032和非易失性存儲器2034的主存儲器2030并與其通信的功能??梢酝ㄟ^同步動態(tài)隨機存取存儲器(SDRAM)、動態(tài)隨機存取存儲器(DRAM)、RAMBUS動態(tài)隨機存取存儲器(RDRAM)和/或任何其他類型的隨機存取存儲裝置實現(xiàn)易失性存儲器2032??梢允褂瞄W存、只讀存儲器(ROM)、電可擦除可編程只讀存儲器(EEPROM)和/或任何其他期望類型的存儲裝置實現(xiàn)非易失性存儲器2034。
處理器系統(tǒng)2000還包括連接到總線2040的接口電路2050??梢允褂萌魏晤愋偷墓涌跇藴?如以太網(wǎng)接口、通用串行總線(USB)、第三代輸入/輸出接口(3GIO)接口和/或任何其他合適類型的接口)實現(xiàn)接口電路2050。
將一個或更多個輸入裝置2060連接到接口電路2050。輸入裝置2060允許用戶把數(shù)據(jù)和命令輸入到處理器2020中。例如,可以通過鍵盤、鼠標、觸敏顯示器、跟蹤板、跟蹤球、等點(isopoint)和/或語音識別系統(tǒng)實現(xiàn)輸入裝置2060。
還將一個或更多個輸出裝置2070連接到接口電路2050。例如,可以通過媒體呈現(xiàn)裝置(如發(fā)光顯示器(LED)、液晶顯示器(LCD)、陰極射線管(CRT)顯示器、打印機和/或揚聲器)實現(xiàn)輸出裝置2070。因此,除其他裝置以外,典型地,接口電路2050包括圖形驅(qū)動卡。
處理器系統(tǒng)2000還包括用于存儲軟件和數(shù)據(jù)的一個或更多個大容量存儲裝置2080。這種大容量存儲裝置2080的示例包括軟盤及其驅(qū)動器、硬盤驅(qū)動器、光盤及其驅(qū)動器以及數(shù)字多功能盤(DVD)及其驅(qū)動器。
接口電路2050還包括通信裝置(如調(diào)制解調(diào)器或網(wǎng)絡接口卡)以便于通過網(wǎng)絡與外部計算機交換數(shù)據(jù)。處理器系統(tǒng)2000與網(wǎng)絡之間的通信鏈路可以是任何類型的網(wǎng)絡連接,如以太網(wǎng)連接、數(shù)字用戶線(DSL)、電話線、蜂窩電話系統(tǒng)、同軸電纜等。
在常規(guī)方式中,一般通過I/O控制器2014控制對輸入裝置2060、輸出裝置2070、大容量存儲裝置2080和/或網(wǎng)絡的訪問。具體來說,I/O控制器2014執(zhí)行使得處理器2020可以通過總線2040和接口電路2050與輸入裝置2060、輸出裝置2070、大容量存儲裝置2080和/或網(wǎng)絡通信的功能。
盡管將圖14所示的多個部分被示為處理器系統(tǒng)2000內(nèi)的獨立塊,但是可以把由這些塊中的某些塊執(zhí)行的功能集成在單個半導體電路內(nèi)或者可以使用兩個或更多個獨立集成電路來實現(xiàn)這些功能。例如,盡管將存儲控制器2012和I/O控制器2014示為芯片組2010內(nèi)的獨立塊,但是可以將存儲控制器2012和I/O控制器2014集成在單個半導體電路內(nèi)。
這里所公開的方法和裝置特別適合于與根據(jù)AC-3標準實現(xiàn)的數(shù)據(jù)流一起使用。但是,可以將這里所公開的方法和裝置應用于其他數(shù)字音頻編碼技術(shù)。
此外,盡管針對示例電視系統(tǒng)給出了本公開,但是應當明白,很容易將所公開的系統(tǒng)應用于許多其他媒體系統(tǒng)。因此,盡管本公開描述了示例系統(tǒng)和過程,但是所公開的示例并非這些系統(tǒng)的唯一實現(xiàn)方式。
盡管這里描述了某些示例方法、裝置以及制造品,但是本專利的覆蓋范圍并不限于此。相反,本專利覆蓋完全落在所附權(quán)利要求的范圍(在文字上或者在等價物原理方面)之內(nèi)的所有方法、裝置以及制造品。例如,盡管本公開描述了包括在硬件上執(zhí)行的軟件以及其他部分的示例系統(tǒng),但是應當注意,這些系統(tǒng)僅僅是示例性的而不應被視為限制性的。具體來說,認為可以將任何或所有公開的硬件和軟件組件只實現(xiàn)為專用硬件、只實現(xiàn)為固件、只實現(xiàn)為軟件或者實現(xiàn)為硬件、固件和/或軟件的某一組合。
權(quán)利要求
1.一種水印嵌入方法,其包括以下步驟識別與壓縮數(shù)字數(shù)據(jù)流相關(guān)聯(lián)的一個或更多個幀;對該一個或更多個幀中的每個幀進行解包以識別多個變換系數(shù)組;以及對該多個變換系數(shù)組進行修改以嵌入水印。
2.如權(quán)利要求1所述的方法,其中,所述對所述多個變換系數(shù)組進行修改的步驟包括用加水印的變換系數(shù)組替換多個變換系數(shù)組中的至少一個組。
3.如權(quán)利要求1所述的方法,其中,所述對所述多個變換系數(shù)組進行修改的步驟包括以下步驟確定與多個加水印的變換系數(shù)組中的一個組的加水印的變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼;以及用與該加水印的變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼替換與所述多個變換系數(shù)組中的一個組的對應變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼。
4.如權(quán)利要求3所述的方法,其中,所述確定與所述多個加水印的變換系數(shù)組中的一個組的加水印的變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼的步驟包括以下步驟根據(jù)待嵌入的數(shù)據(jù)選擇待編碼到所述多個變換系數(shù)組的碼信號頻率;確定與該待編碼到所述多個變換系數(shù)組的碼信號頻率相關(guān)聯(lián)的掩蔽能量;根據(jù)該掩蔽能量選擇所述加水印的變換系數(shù)的量級;以及根據(jù)該量級確定與所述加水印的變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼。
5.如權(quán)利要求4所述的方法,其中,所述碼信號頻率包括與多個高分辨率頻域表示中的一個對應的頻率。
6.如權(quán)利要求4所述的方法,其中,所述碼信號包括一個或更多個正弦分量,并且其中各正弦分量具有基于所期望碼的頻率。
7.如權(quán)利要求1所述的方法,其中,所述修改所述多個變換系數(shù)組的步驟包括以下步驟根據(jù)所述多個變換系數(shù)組生成多個時域音頻塊;根據(jù)該多個時域音頻塊生成多個經(jīng)重構(gòu)的音頻塊;以及根據(jù)該多個經(jīng)重構(gòu)的音頻塊生成多個加水印的音頻塊。
8.如權(quán)利要求7所述的方法,其中,所述生成所述多個時域音頻塊的步驟包括生成與一音頻塊相關(guān)聯(lián)的第一時域音頻塊和第二時域音頻塊。
9.如權(quán)利要求7所述的方法,其中,所述根據(jù)所述多個時域音頻塊生成所述多個經(jīng)重構(gòu)的音頻塊的步驟包括根據(jù)第一時域音頻塊和第二時域音頻塊生成與一音頻塊對應的經(jīng)重構(gòu)的時域音頻塊。
10.如權(quán)利要求9所述的方法,其中,所述根據(jù)所述第一時域音頻塊和第二時域音頻塊生成與第一音頻塊對應的第一經(jīng)重構(gòu)的時域音頻塊的步驟包括加入所述第一時域音頻塊和第二時域音頻塊。
11.如權(quán)利要求7所述的方法,其中,所述根據(jù)所述多個經(jīng)重構(gòu)的音頻塊生成所述多個加水印的音頻塊的步驟包括以下步驟根據(jù)所述多個經(jīng)重構(gòu)的音頻塊生成可修改時域音頻塊;以及根據(jù)該可修改時域音頻塊和所述水印生成第一加水印的音頻塊和第二加水印的音頻塊。
12.如權(quán)利要求11所述的方法,其中,所述根據(jù)所述多個經(jīng)重構(gòu)的音頻塊生成所述可修改時域音頻塊的步驟包括將第一經(jīng)重構(gòu)的音頻塊與第二經(jīng)重構(gòu)的音頻塊連接起來以形成512樣本音頻塊。
13.如權(quán)利要求1所述的方法,其中,所述修改所述多個變換系數(shù)組的步驟包括根據(jù)多個加水印的變換系數(shù)組修改所述多個變換系數(shù)組。
14.如權(quán)利要求1所述的方法,其中,所述修改所述多個變換系數(shù)組的步驟包括根據(jù)第一加水印的音頻塊和第二加水印的音頻塊生成多個加水印的變換系數(shù)組。
15.如權(quán)利要求14所述的方法,其中,所述根據(jù)第一加水印的音頻塊和第二加水印的音頻塊生成所述多個加水印的系數(shù)組的步驟包括以下步驟根據(jù)與所述壓縮數(shù)字數(shù)據(jù)流相關(guān)聯(lián)的壓縮信息確定與所述多個加水印的變換系數(shù)組中的每一個組的加水印的變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼。
16.如權(quán)利要求1所述的方法,其中,所述多個變換系數(shù)組中的每一個組都包括一個或更多個經(jīng)修改的離散余弦變換系數(shù)。
17.如權(quán)利要求1所述的方法,其中,根據(jù)音頻壓縮標準對所述壓縮數(shù)字數(shù)據(jù)流進行壓縮。
18.如權(quán)利要求1所述的方法,其中,所述識別與所述壓縮數(shù)字數(shù)據(jù)流相關(guān)聯(lián)的一個或更多個幀的步驟包括識別與多個音頻聲道中的至少一個音頻聲道相關(guān)聯(lián)的音頻塊。
19.如權(quán)利要求1所述的方法,其中,所述對所述一個或更多個幀中的每個幀進行解包以識別所述多個變換系數(shù)組的步驟包括識別與所述壓縮數(shù)字數(shù)據(jù)流相關(guān)聯(lián)的壓縮信息。
20.如權(quán)利要求1所述的方法,還包括根據(jù)多個加水印的變換系數(shù)組對所述一個或更多個幀進行再打包。
21.如權(quán)利要求1所述的方法,其中,所述水印與媒體源和媒體節(jié)目中的一個相關(guān)聯(lián)。
22.一種水印嵌入裝置,包括識別器,用于識別與壓縮數(shù)字數(shù)據(jù)流相關(guān)聯(lián)的一個或更多個幀;解包器,用于對該一個或更多個幀中的每個幀進行解包以識別多個變換系數(shù)組;以及修改器,用于對該多個變換系數(shù)組進行修改以嵌入水印。
23.如權(quán)利要求22所述的裝置,其中,所述修改器確定與多個加水印的變換系數(shù)組中的一個組的加水印的變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼,并用與該加水印的變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼替換與所述多個變換系數(shù)組中的一個組的對應變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼。
24.如權(quán)利要求23所述的裝置,其中,所述修改器根據(jù)待嵌入的數(shù)據(jù)選擇待編碼到所述多個變換系數(shù)組的碼信號頻率、確定與該待編碼到所述多個變換系數(shù)組的碼信號頻率相關(guān)聯(lián)的掩蔽能量、根據(jù)該掩蔽能量選擇所述加水印的變換系數(shù)的量級以及根據(jù)該量級確定與所述加水印的變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼。
25.如權(quán)利要求24所述的裝置,其中,所述碼信號頻率包括與多個高分辨率頻域表示中的一個對應的頻率。
26.如權(quán)利要求24所述的裝置,其中,所述碼信號包括一個或更多個正弦分量,并且其中各正弦分量具有基于所期望碼的頻率。
27.如權(quán)利要求22所述的裝置,其中,所述修改器生成多個時域音頻塊、根據(jù)該多個時域音頻塊生成多個經(jīng)重構(gòu)的音頻塊以及根據(jù)該多個經(jīng)重構(gòu)的音頻塊生成多個加水印的音頻塊。
28.如權(quán)利要求27所述的裝置,其中,所述修改器生成與音頻塊相關(guān)聯(lián)的主音頻塊和雙主音頻塊。
29.如權(quán)利要求27所述的裝置,其中,所述修改器根據(jù)第一時域音頻塊和第二時域音頻塊生成與一音頻塊對應的經(jīng)重構(gòu)的時域音頻塊。
30.如權(quán)利要求29所述的裝置,其中,所述修改器加入第一和第二時域音頻塊。
31.如權(quán)利要求27所述的裝置,其中,所述修改器根據(jù)所述多個經(jīng)重構(gòu)的音頻塊生成可修改時域音頻塊,并根據(jù)該可修改時域音頻塊和所述水印生成第一加水印的音頻塊和第二加水印的音頻塊。
32.如權(quán)利要求31所述的裝置,其中,所述修改器將第一經(jīng)重構(gòu)的音頻塊與第二經(jīng)重構(gòu)的音頻塊連接起來以形成512樣本音頻塊。
33.如權(quán)利要求32所述的裝置,其中,所述修改器根據(jù)所述壓縮數(shù)字數(shù)據(jù)流的壓縮信息確定與所述多個加水印的系數(shù)組中的所述一個組的各加水印的改進型離散余弦變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼。
34.如權(quán)利要求22所述的裝置,其中,所述修改器根據(jù)多個加水印的變換系數(shù)組修改所述多個變換系數(shù)組。
35.如權(quán)利要求34所述的裝置,其中,所述修改器根據(jù)第一加水印的音頻塊和第二加水印的音頻塊生成所述多個加水印的變換系數(shù)組中的一個組。
36.如權(quán)利要求34所述的裝置,其中,所述修改器用所述多個加水印的變換系數(shù)組中的一個組替換所述多個變換系數(shù)組中的一個組。
37.如權(quán)利要求22所述的裝置,其中,所述多個變換系數(shù)組中的每一個組都包括一個或更多個經(jīng)修改的離散余弦變換系數(shù)。
38.如權(quán)利要求22所述的裝置,其中,所述壓縮數(shù)字數(shù)據(jù)流是根據(jù)音頻壓縮標準而壓縮的。
39.如權(quán)利要求22所述的裝置,其中,所述識別單元識別與多個音頻聲道相關(guān)聯(lián)的音頻塊。
40.如權(quán)利要求22所述的裝置,其中,所述解包單元識別與所述壓縮數(shù)字數(shù)據(jù)流相關(guān)聯(lián)的壓縮信息。
41.如權(quán)利要求22所述的裝置,其中,所述水印包括與媒體源和媒體節(jié)目中的一個相關(guān)聯(lián)的水印。
42.如權(quán)利要求22所述的裝置,還包括幀再打包器,用于根據(jù)多個加水印的變換系數(shù)組對一個或更多個幀進行再打包。
43.一種具有多條指令的機器可訪問介質(zhì),當執(zhí)行這些指令時,這些指令使得機器識別與壓縮數(shù)字數(shù)據(jù)流相關(guān)聯(lián)的一個或更多個幀;對該一個或更多個幀中的每個幀進行解包以識別多個變換系數(shù)組;以及對該多個變換系數(shù)組進行修改以嵌入水印。
44.如權(quán)利要求43所述的機器可訪問介質(zhì),其中,當執(zhí)行所述指令時,所述指令使得所述機器通過用加水印的變換系數(shù)組替換所述多個變換系數(shù)組中的至少一個組來修改所述多個變換系數(shù)組。
45.如權(quán)利要求43所述的機器可訪問介質(zhì),其中,當執(zhí)行所述指令時,所述指令使得所述機器通過以下步驟修改所述多個變換系數(shù)組確定與多個加水印的變換系數(shù)組中的一個組的加水印的變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼;以及用與該加水印的變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼替換與所述多個變換系數(shù)組中的一個組的對應變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼。
46.如權(quán)利要求45所述的機器可訪問介質(zhì),其中,當執(zhí)行所述指令時,所述指令使得所述機器通過以下步驟確定與所述多個加水印的變換系數(shù)組中的一個組的加水印的變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼根據(jù)待嵌入的數(shù)據(jù)選擇待編碼到所述多個變換系數(shù)組的碼信號頻率;確定與該待編碼到所述多個變換系數(shù)組的碼信號頻率相關(guān)聯(lián)的掩蔽能量;根據(jù)該掩蔽能量選擇所述加水印的變換系數(shù)的量級;以及根據(jù)該量級確定與所述加水印的變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼。
47.如權(quán)利要求46所述的機器可訪問介質(zhì),其中,所述碼信號頻率包括與多個高分辨率頻域表示中的一個對應的頻率。
48.如權(quán)利要求46所述的機器可訪問介質(zhì),其中,所述碼信號包括一個或更多個正弦分量,并且其中各正弦分量具有基于所期望碼的頻率。
49.如權(quán)利要求43所述的機器可訪問介質(zhì),其中,當執(zhí)行所述指令時,所述指令使得所述機器通過以下步驟修改所述多個變換系數(shù)組根據(jù)所述多個變換系數(shù)組生成多個時域音頻塊;根據(jù)該多個時域音頻塊生成多個經(jīng)重構(gòu)的音頻塊;以及根據(jù)該多個經(jīng)重構(gòu)的音頻塊生成多個加水印的音頻塊。
50.如權(quán)利要求49所述的機器可訪問介質(zhì),其中,當執(zhí)行所述指令時,所述指令使得所述機器通過生成與一音頻塊相關(guān)聯(lián)的第一時域音頻塊和第二時域音頻塊來生成所述多個時域音頻塊。
51.如權(quán)利要求49所述的機器可訪問介質(zhì),其中,當執(zhí)行所述指令時,所述指令使得所述機器根據(jù)所述多個時域音頻塊通過以下步驟生成多個經(jīng)重構(gòu)的音頻塊根據(jù)第一時域音頻塊和第二時域音頻塊生成與一音頻塊對應的經(jīng)重構(gòu)的時域音頻塊。
52.如權(quán)利要求51所述的機器可訪問介質(zhì),其中,當執(zhí)行所述指令時,所述指令使得所述機器根據(jù)第一時域音頻塊和第二時域音頻塊通過加入第一時域音頻塊和第二時域音頻塊生成與第一音頻塊對應的第一經(jīng)重構(gòu)的時域音頻塊。
53.如權(quán)利要求49所述的機器可訪問介質(zhì),其中,當執(zhí)行所述指令時,所述指令使得所述機器根據(jù)所述多個經(jīng)重構(gòu)的音頻塊通過以下步驟生成多個加水印的音頻塊根據(jù)所述多個經(jīng)重構(gòu)的音頻塊生成可修改時域音頻塊;以及根據(jù)該可修改時域音頻塊和所述水印生成第一加水印的音頻塊和第二加水印的音頻塊。
54.如權(quán)利要求53所述的機器可訪問介質(zhì),其中,當執(zhí)行所述指令時,所述指令使得所述機器根據(jù)所述多個經(jīng)重構(gòu)的音頻塊通過以下步驟生成所述可修改時域音頻塊將第一經(jīng)重構(gòu)的音頻塊與第二經(jīng)重構(gòu)的音頻塊連接起來以形成512樣本音頻塊。
55.如權(quán)利要求49所述的機器可訪問介質(zhì),其中,當執(zhí)行所述指令時,所述指令使得所述機器通過以下步驟生成所述多個加水印的變換系數(shù)組根據(jù)第一加水印的音頻塊和第二加水印的音頻塊生成多個加水印的變換系數(shù)組中的一個組。
56.如權(quán)利要求55所述的機器可訪問介質(zhì),其中,當執(zhí)行所述指令時,所述指令使得所述機器根據(jù)第一加水印的音頻塊和第二加水印的音頻塊通過以下步驟生成所述多個加水印的變換系數(shù)組中的一個組根據(jù)與所述壓縮數(shù)字數(shù)據(jù)流相關(guān)聯(lián)的壓縮信息確定與所述多個加水印的變換系數(shù)組中的所述一個組的各加水印的變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼。
57.如權(quán)利要求43所述的機器可訪問介質(zhì),其中,所述多個變換系數(shù)組中的每一個組都包括一個或更多個經(jīng)修改的離散余弦變換系數(shù)。
58.如權(quán)利要求43所述的機器可訪問介質(zhì),其中,所述壓縮數(shù)字數(shù)據(jù)流是根據(jù)音頻壓縮標準壓縮的。
59.如權(quán)利要求43所述的機器可訪問介質(zhì),其中,當執(zhí)行所述指令時,所述指令使得所述機器通過識別與多個音頻聲道中的至少一個相關(guān)聯(lián)的音頻塊來識別與所述壓縮數(shù)字數(shù)據(jù)流相關(guān)聯(lián)的一個或更多個幀。
60.如權(quán)利要求43所述的機器可訪問介質(zhì),其中,所述指令使得所述機器通過識別與所述壓縮數(shù)字數(shù)據(jù)流相關(guān)聯(lián)的壓縮信息,解包所述一個或更多個幀中的每個幀以識別所述多個變換系數(shù)組。
61.如權(quán)利要求43所述的機器可訪問介質(zhì),其中,當執(zhí)行所述指令時,所述指令使得所述機器根據(jù)多個加水印的變換系數(shù)組對所述一個或更多個幀進行再打包。
62.如權(quán)利要求43所述的機器可訪問介質(zhì),其中,所述水印與媒體源和媒體節(jié)目中的一個相關(guān)聯(lián)。
63.如權(quán)利要求43所述的機器可訪問介質(zhì),其為可編程門陣列、專用集成電路、可擦除可編程只讀存儲器、只讀存儲器、隨機存取存儲器、磁介質(zhì)以及光介質(zhì)中的一個。
全文摘要
公開了用于嵌入水印的方法和裝置。在示例方法中,識別與壓縮數(shù)字數(shù)據(jù)流(240)相關(guān)聯(lián)的一個或更多個幀。對該一個或更多個幀中的每個幀進行解包以確定多個變換系數(shù)組(320)。修改該多個變換系數(shù)組(320)以嵌入水印(230)。
文檔編號G06F17/14GK1823482SQ200480020200
公開日2006年8月23日 申請日期2004年6月14日 優(yōu)先權(quán)日2003年6月13日
發(fā)明者韋努高博·斯里尼瓦桑 申請人:尼爾遜媒介研究股份有限公司