音頻水印的制作方法
【專利摘要】一種系統(tǒng),包括處理器,用于確定用于將水印編碼到具有分段的音頻流中的時機,當在頻域中被表示時,每個分段包括幅度相對于頻率的信號,所述處理器可操作為針對每個分段識別基頻f,該基頻f是在一個分段中具有信號的最大幅度的頻率,基頻f確定諧波頻率,每個諧波頻率位于頻率f/2n或2fn處,n是正整數(shù),以及若一個分段的信號的幅度對于在一個或多個不同頻率范圍內(nèi)的所有頻率來說小于值v,則將這一分段確定為用于編碼至少部分水印的時機,每個不同的頻率范圍在以不同的一個諧波頻率為中心的周圍。還描述了相關(guān)的設(shè)備和方法。
【專利說明】音頻水印
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及音頻水印。
【背景技術(shù)】
[0002]通過介紹,水印可用于檢測非法分布的內(nèi)容并判定非法分布的來源。
[0003]認為以下參考文獻能代表本技術(shù)的現(xiàn)狀。
[0004]Hoguchi的美國公開專利申請2006/0048633 ;
[0005]Petrovic等的美國公開專利申請2006/0239501 ;
[0006]明治大學(xué)的日本公開專利申請2005049409 ;以及
[0007]首爾工業(yè)合作基金大學(xué)的韓國公開專利申請20090093530。
【發(fā)明內(nèi)容】
[0008]在本發(fā)明的某些實施方式中,本發(fā)明力圖提供一種改進的音頻水印系統(tǒng)。
[0009]通過介紹,當一個音符分成兩個八度音階同時播放時,對大多數(shù)聽眾來說,這兩個音符聽起來基本上是一樣的。在下一個(較高)八度音階中的同樣的音符是當前音符的頻率的兩倍,在先前的(較低)八度音階中,同樣的音符是當前音符的頻率的一半。在不同的八度音階中,諧波是相同的音符。
[0010]在本發(fā)明的實施方式中,本發(fā)明包括一種水印系統(tǒng),該水印系統(tǒng)用于將水印數(shù)據(jù)在或接近于音頻內(nèi)容項的不同分段的一個或多個諧波頻率處編碼,從而減小嵌入的音頻水印對聽眾的聽覺的干擾。
[0011]具體地,該水印系統(tǒng)包括通過分析音頻內(nèi)容的各個分段的組成頻率來識別用于將音頻水印編碼在音頻內(nèi)容中的合適的編碼時機(opportunity,機會)。
[0012]因此,根據(jù)本發(fā)明的實施方式提供了一種系統(tǒng),所述系統(tǒng)包括:處理器,用于確定用于將水印編碼到音頻流中的多個時機,所述音頻流具有多個分段,當在頻域中被表示時,每個所述分段包括幅度相對于頻率的信號,所述處理器針對所述音頻流的每一個所述分段可操作為:識別一個分段的基頻f,所述基頻是在所述一個分段中具有所述信號的最大幅度的頻率,所述基頻f確定多個諧波頻率,每個所述諧波頻率位于頻率f/2n或2fn處,η為正整數(shù);以及若所述一個分段的所述信號的幅度對于在多個不同頻率范圍中的一個或多個中的所有頻率來說小于值V,則將所述一個分段確定為用于編碼至少部分所述水印的時機,每個所述不同頻率范圍以不同的一個所述諧波頻率為中心。
[0013]進一步地,根據(jù)本發(fā)明的實施方式,所述值V小于或等于所述信號在所述一個分段的所述基頻處的所述幅度的25%。
[0014]更近一步地,根據(jù)本發(fā)明的實施方式,每個所述不同頻率范圍的大小分別等于每個所述不同頻率范圍的中心處的頻率的6%。
[0015]另外,根據(jù)本發(fā)明的實施方式,所述諧波頻率在從20Hz到20,OOOHz的頻率范圍內(nèi)。[0016]此外,根據(jù)本發(fā)明的實施方式,所述處理器可操作為準備用于傳輸至另一裝置的數(shù)據(jù),所述數(shù)據(jù)包括:在頻域或時域中格式化的所述音頻流;以及標示所確定的時機的信
肩、O
[0017]進一步地,根據(jù)本發(fā)明的實施方式,所述系統(tǒng)包括用于將所述數(shù)據(jù)傳輸至所述另一裝置的傳輸設(shè)備。
[0018]更進一步地,根據(jù)本發(fā)明的實施方式,所述處理器可操作為針對所述音頻流的被確定為所述時機之一的每一個所述分段準備所述數(shù)據(jù)以便包括:所述一個分段的定時信息;在所述一個分段的所述基頻處的所述信號的幅度;所述一個分段的一個或多個不同的所述諧波頻率。
[0019]另外,根據(jù)本發(fā)明的實施方式,所述處理器可操作為準備所述數(shù)據(jù)以包括確定已被確定為用于編碼所述水印的一個所述時機的多對所述分段的數(shù)據(jù)。
[0020]此外,根據(jù)本發(fā)明的實施方式,所述系統(tǒng)包括水印編碼器,用于將所述水印編碼到所述音頻流中,所述編碼包括將音頻添加至被確定為編碼時機的至少一些所述分段,所添加的音頻被添加成使得對于每一所確定的分段,所添加的音頻被添加至每個所述不同頻率范圍或一個所述不同頻率范圍中的某處。
[0021]進一步地,根據(jù)本發(fā)明的實施方式,所添加的音頻具有等于所述信號在所述一個分段的所述基頻處的所述幅度的25%的最大幅度。
[0022]根據(jù)本發(fā)明的又一實施方式,還提供了一種方法,所述方法包括確定用于將水印編碼到音頻流中的多個時機,所述音頻流具有多個分段,當在頻域中被表示時,每個所述分段包括幅度相對于頻率的信號;以及針對所述音頻流的每一個所述分段:識別一個分段的基頻f,所述基頻是在所述一個分段中具有所述信號的最大幅度的頻率,所述基頻f確定多個諧波頻率,每個所述諧波頻率位于頻率f/2n或2fn處,η為正整數(shù);以及若所述一個分段的所述信號的幅度對于在多個不同頻率范圍中的一個或多個中的所有頻率來說小于值V,則將所述一個分段確定為用于編碼至少部分所述水印的時機,每個所述不同頻率范圍以不同的一個所述諧波頻率為中心。
【專利附圖】
【附圖說明】
[0023]結(jié)合附圖,從以下詳細描述中將更充分地理解并領(lǐng)會本發(fā)明,在附圖中:
[0024]圖1是根據(jù)本發(fā)明的實施方式構(gòu)造和操作的水印系統(tǒng)的部分圖示的部分框圖示圖;
[0025]圖2是示出在圖1的系統(tǒng)中識別水印編碼時機的示圖;
[0026]圖3是示出在圖1的系統(tǒng)中編碼部分水印之后的分段的示圖;
[0027]圖4是示出圖1的系統(tǒng)中的第一編碼方法的圖表;以及
[0028]圖5是示出圖1的系統(tǒng)中的第二編碼方法的圖表。
【具體實施方式】
[0029]遍及本說明書和權(quán)利要求書,術(shù)語“編碼”以其所有的語法形式被用以指代任何類型的數(shù)據(jù)流編碼,該數(shù)據(jù)流編碼包括例如(但并不限制定義的范圍)熟知的編碼類型,諸如但不限于,MPEG-2編碼、H.264編碼、VC-1編碼以及諸如可縮放矢量圖形(SVG)和LASER(IS0/IEC14496-20)的合成編碼等。應(yīng)理解,相比未被編碼的數(shù)據(jù)流,編碼的數(shù)據(jù)流通常需要更多的處理并且通常需要更多的時間來讀取。編碼數(shù)據(jù)的任何接收器至少在不需要密碼分析的情況下潛在的能夠讀取編碼數(shù)據(jù),而不管編碼數(shù)據(jù)的接收器是否為預(yù)期的接收器。應(yīng)理解可分幾個步驟進行編碼并可包括大量不同的處理,包括但無需限于:壓縮數(shù)據(jù);將數(shù)據(jù)轉(zhuǎn)換為其他形式;以及使數(shù)據(jù)更強健(例如,復(fù)制數(shù)據(jù)或使用糾錯機制)。
[0030]遍及本說明書及權(quán)利要求書,術(shù)語“壓縮”以其所有的語法形式被用以指代任何類型的數(shù)據(jù)流壓縮。壓縮通常是編碼的一部分并且可包括圖像壓縮和移動補償。通常,數(shù)據(jù)的壓縮減少了包含數(shù)據(jù)的比特的數(shù)量。由于壓縮是編碼的子集,所以遍及本說明書和權(quán)利要求書,術(shù)語“編碼”和“壓縮”以它們所有的語法形式經(jīng)常被交替使用。
[0031]類似地,遍及本說明書和權(quán)利要求書,術(shù)語“解碼”和“解壓”以它們所有的語法形式被用以指代所有語法形式的“編碼”和“壓縮”的反面。
[0032]遍及本說明書和權(quán)利要求書,術(shù)語“加擾”和“加密”以它們所有的語法形式被交替使用以指代用于加擾和/或加密數(shù)據(jù)流的任何合適的加擾和/或加密方法,和/或用于旨在使數(shù)據(jù)流很難理解(除了對其預(yù)期的接收器)的任何其他合適的方法。熟知的加擾或加密類型包括但不限于DES、3DES以及AES。類似地,遍及本說明書和權(quán)利要求書,術(shù)語“解擾”和“解密”以它們所有的語法形式被用以指代所有語法形式的“加擾”和“加密”的反面。
[0033]依據(jù)上述定義,術(shù)語“編碼”、“壓縮”以及術(shù)語“加擾”和“加密”用于指代不同的專有類型的處理。因而,特定的數(shù)據(jù)流可以是,例如:
[0034]編碼的,但既不加擾也不加密的;
[0035]壓縮的,但既不加擾也不加密的;
[0036]加擾的或加密的,但未被編碼的;
[0037]加擾的或加密的,但未被壓縮的;
[0038]編碼的和加擾的或加密的;或者
[0039]壓縮的和加擾的或加密的。
[0040]同樣地,一方面術(shù)語“解碼”和“解壓”,以及另一方面術(shù)語“解擾”和“解密”被用于指代不同的專有類型的處理。
[0041]現(xiàn)參照圖1,它是根據(jù)本發(fā)明的實施方式構(gòu)造和操作的水印系統(tǒng)10的部分圖示的部分框圖的示圖。
[0042]介紹一下,當一個音符以兩個八度音階同時播放時,對大多數(shù)聽眾來說,這兩個音符聽起來基本上是一樣的。在下一個(較高)八度音階中的同樣的音符是當前音符的頻率的兩倍,在先前的(較低)八度音階中,同樣的音符是當前音符的頻率的一半。在不同的八度音階中,諧波是相同的音符。
[0043]水印系統(tǒng)10可操作為利用不同聲音之間的相似性來將水印數(shù)據(jù)14在或接近于音頻流12的不同分段的一個或多個諧波頻率處編碼,從而減小嵌入的音頻水印對聽眾的聽覺的干擾。
[0044]具體地,水印系統(tǒng)10包括通過分析音頻流12的各個分段的組成頻率來識別用于將音頻水印14編碼在音頻流12中的合適的編碼時機。
[0045]現(xiàn)將更詳細地描述水印系統(tǒng)10。
[0046]水印系統(tǒng)10通常包括內(nèi)容服務(wù)器16和多個渲染裝置18 (為簡便起見,只示出了一個)。
[0047]內(nèi)容服務(wù)器16通常包括處理器20和傳輸設(shè)備22。
[0048]處理器20通??刹僮鳛榇_定用于將水印14編碼至音頻流12中的多個時機。該時機標示音頻流12的哪個分段適合于將水印14編碼在其中。處理器20通??刹僮鳛闇蕚溆糜趥鬏斨龄秩狙b置18的數(shù)據(jù)24。數(shù)據(jù)24通常包括在頻域或時域中格式化的音頻流12以及標示所確定的時機26的信息。參照圖2更詳細地描述標示所確定的時機26的信息。
[0049]傳輸設(shè)備22通??刹僮鳛閷?shù)據(jù)24傳輸至渲染裝置18??梢允褂萌魏魏线m的通信方法(例如但不限于,衛(wèi)星、電纜、網(wǎng)絡(luò)協(xié)議、地面或蜂窩通信系統(tǒng)或其任何合適的組合)來傳輸數(shù)據(jù)24。
[0050]每個渲染裝置18通常包括接收器28和水印編碼器30。每個渲染裝置18也可包括其他合適的元件,例如但不限于,內(nèi)容播放器和合適的驅(qū)動器??蓮娜魏魏线m的渲染裝置(例如但不限于,機頂盒、適當配置的計算機和移動裝置)中選擇渲染裝置18。
[0051]接收器28通??刹僮鳛閺膬?nèi)容服務(wù)器16接收數(shù)據(jù)24。
[0052]每個渲染裝置18通常與標示渲染裝置18和/或渲染裝置18的使用者/用戶的身份標識32有關(guān)。身份標識32可部分或全部設(shè)置于安全芯片(諸如SM卡或智能卡)中,該安全芯片可被設(shè)置于渲染裝置18中或可拆卸地安插于渲染裝置18中。水印編碼器30通??刹僮鳛榇_定水印數(shù)據(jù)14從而使至少部分水印數(shù)據(jù)14通?;谥辽俨糠稚矸輼俗R32。作為通過水印編碼器30形成水印數(shù)據(jù)14的處理的一部分,可使用任何合適密碼散列(hash)打亂至少一些身份標識32。
[0053]水印編碼器30通??刹僮鳛榛诮邮盏降臉耸舅_定的時機的信息26將水印14編碼至音頻流12中(框34)。換言之,水印數(shù)據(jù)14只在音頻流12的被確定為編碼時機的那些分段中進行編碼。
[0054]圖1示出了確定時機的處理器20以及將標示所確定的時機的信息26發(fā)送至渲染裝置18以用于編碼的傳輸設(shè)備22。
[0055]在內(nèi)容服務(wù)器16中確定時機以及在渲染裝置18中編碼音頻流12至少因以下原因是有利的。首先,渲染裝置18可能不具有確定時機所需的處理能力。第二,由于內(nèi)容服務(wù)器16已經(jīng)知道時機的位置,所以在內(nèi)容服務(wù)器16中標示時機可提高水印數(shù)據(jù)14的后續(xù)識別,即使是在噪聲環(huán)境下。
[0056]本領(lǐng)域普通技術(shù)人員將會理解,必要時,也可在渲染裝置18中確定時機和編碼水印數(shù)據(jù)14。
[0057]現(xiàn)參照圖2,它是示出在圖1的系統(tǒng)10中識別水印編碼時機的示圖。
[0058]音頻流12具有多個分段38,例如但不限于,音頻幀。當在頻域中表示時,每個分段38包括幅度42相對于頻率44的信號40。在圖2中信號40被不出為一系列垂直線,其為圖2中的最粗的線。為簡便起見,只標記了信號40的某些垂直線。每個分段38可具有任何合適的持續(xù)時間,例如但不限于,30毫秒和100毫秒之間。
[0059]若音頻流12在其到達處理器20 (圖1)時尚未被分成分段38,則處理器20通??刹僮鳛閷⒁纛l流12劃分成分段38。
[0060]類似地,若音頻流12不是在頻域中表示,則處理器20 (圖1)執(zhí)行變換(諸如傅里葉變換)以產(chǎn)生音頻流12的每個分段38的頻域表示。[0061]應(yīng)注意,MPEG編碼的音頻通常被編碼為分段38的傅里葉變換,且因此針對合適的編碼時機來分析MPEG音頻幀通常需要較少的處理。
[0062]處理器20 (圖1)可操作為分析分段38的頻域表示以識別用于編碼水印數(shù)據(jù)14(圖1)的良好候選。
[0063]現(xiàn)更詳細地描述確定編碼時機。
[0064]處理器20 (圖1)通??刹僮鳛樽R別音頻流12的每個分段38的基頻46,f。每個分段38的基頻46是具有信號40的最大幅度的頻率。每個分段38的基頻f確定多個諧波頻率48。每個諧波頻率48位于頻率f/2n或2fn處,η是正整數(shù)。諧波頻率48通常在從20Hz至20,OOOHz的頻率范圍內(nèi)。
[0065]若任一分段38的信號40的幅度對于在多個不同頻率范圍50中的一個或多個不同頻率范圍中的所有頻率來說小于一值V,則處理器20(圖1)通??刹僮鳛閷⒃摲侄?8確定為用于編碼至少部分水印14 (圖1)的時機。每個不同頻率范圍50在以該分段38的不同諧波頻率48為中心的周圍。因此例如,一個頻率范圍50可在以f/2為中心的周圍,并且另一個頻率范圍50可在以2f為中心的周圍。
[0066]僅舉例來說,可以依據(jù)由內(nèi)容供應(yīng)商或廣播公司所選的編碼標準將水印數(shù)據(jù)14(圖1)編碼在一個頻率范圍50中或多個頻率范圍50中。因此,處理器20 (圖1)將依據(jù)編碼標準檢查一個頻率范圍50或多個頻率范圍50來看信號40是否小于值V。舉例來說,處理器20可尋找其中信號40在以頻率f/2為中心的周圍的頻率范圍50中總是低于值V的分段38??商娲?,處理器20可尋找其中信號40在以頻率f/2為中心的周圍的頻率范圍50和以頻率2f為中心的周圍的頻率范圍這兩者中總是低于值V的分段38,且因此,只有其中信號40在以頻率f/2和2f兩者為中心的周圍的頻率范圍50中總是低于值V的那些分段38將會被選擇為時機。
[0067]現(xiàn)在進行關(guān)于值V的選擇的討論。
[0068]為了將水印數(shù)據(jù)14從音頻流12中去除,渲染裝置18 (圖1)的用戶可決定記錄音頻流12并隨后回放具有編碼在其中的水印數(shù)據(jù)14 (圖1)的音頻流12以用于輸出至另一裝置。另一裝置可隨后對所接收到的音頻流12再編碼。若水印數(shù)據(jù)14的編碼不是用足夠大的幅度來編碼的,則通過另一裝置對音頻流12的再編碼可以掩蓋該編碼。因此,通過水印編碼器30 (圖1)的水印編碼需要足夠大以防止被掩蓋,但還要足夠小以便不干擾聽眾。發(fā)明人提出通過添加幅度近似等于基頻46幅度的四分之一的音頻來對所選擇的時機進行編碼。然而,所添加的音頻的精確幅度可以依據(jù)你不想干擾的聽眾的類型和你想保護以對抗的再編碼算法以及其他可能的因素。
[0069]要考慮的另一個因素是在編碼水印數(shù)據(jù)14(圖1)后的分段38的相關(guān)頻率范圍50中的信號40的幅度需要足夠小以使該分段的基頻46不會被淹沒(這可能嚴重改變聲音)。
[0070]因此,考慮到上述要求,為了決定是否在特定分段38 (B卩,該分段38為時機)中編碼部分水印數(shù)據(jù)14,可能用于在其中編碼部分水印數(shù)據(jù)14的可用頻率范圍50需要具有足夠富余的幅度,使得可添加更多的用于編碼的音頻。發(fā)明人提出值V通常等于b/4,其中,b是該分段38的基頻46的幅度。
[0071]每個不同的頻率范圍50的大小通常分別等于在每個不同頻率范圍50的中心處的頻率48的6%。因此例如,若在頻率范圍50中心處的諧波頻率48具有500Hz的頻率,則頻率范圍50是500Hz的6%(其等于30Hz)。因此,頻率范圍50從470Hz延伸至530Hz。發(fā)明人提出值6%是因為它通常是兩個相鄰音符之間的步幅。
[0072]圖2示出針對音頻流12的兩個分段38 (B卩,分段52和分段54)的信號40。
[0073]將首先假定編碼標準要求水印編碼發(fā)生在諧波頻率48,f/2和2f兩者周圍并且V等于b/4來分析分段52、54。
[0074]分段52表示在以頻率f/2為中心的周圍的頻率范圍50中信號40的幅度為O并且在以頻率2f為中心的周圍的頻率范圍50中的信號40包括信號40的兩個部分(部分56和部分58)。兩個部分56、58都低于b/4。因此,分段52將被選擇為編碼時機。
[0075]關(guān)于分段54,在以頻率f/2為中心的周圍的頻率范圍50中,信號40的幅度為0,并且在以頻率2f為中心的周圍的頻率范圍50中,信號40包括信號40的兩個部分(部分60和部分62)。部分60具有小于b/4的幅度,但部分62具有大于b/4的幅度。因此,分段52將不會被選擇為編碼時機。
[0076]若假定編碼標準要求水印編碼只出現(xiàn)在諧波頻率f/2處或其附近并且V等于b/4來分析分段52、54,則分段52、54都將被選為編碼時機。
[0077]對于由處理器20 (圖1)確定為編碼時機的每個分段38,處理器20通常可操作為準備標示所確定的時機的信息26 (圖1),該信息26包括:相關(guān)分段38的定時信息;在相關(guān)分段38的基頻46處的信號40的幅度(因為為了編碼部分水印數(shù)據(jù)14 (圖1)而被添加至信號40的音頻的幅度可被確定為基頻46的一部分);以及編碼將發(fā)生在相關(guān)分段38中的一個或多個諧波頻率48或者將能夠計算諧波頻率48的基頻46的頻率。
[0078]根據(jù)本發(fā)明的實施方式,對水印數(shù)據(jù)14 (圖1)的一個比特的編碼基于其中編碼時機是成對的兩個編碼時機。參照圖5更詳細地描述該編碼方法。因此,根據(jù)該實施方式,處理器20 (圖1)可操作為準備標示所確定的時機的信息26 (圖1)以包括確定被確定為編碼水印14的時機的多對分段38的數(shù)據(jù)。
[0079]現(xiàn)參照圖3,它是示出在圖1的系統(tǒng)10中編碼部分水印數(shù)據(jù)14 (圖1)之后的圖2的分段52的示圖。
[0080]水印編碼器30(圖1)通??刹僮鳛榛诮邮盏降臉耸舅_定的時機的信息26(圖1)將水印14編碼至音頻流12 (圖2)中。編碼通常包括將音頻64添加至被確定為編碼時機的至少一些分段38。根據(jù)編碼標準,所添加的音頻64通常被添加成使得對于每個分段38(確定為時機),所添加的音頻64被添加至每個不同頻率范圍50或一個頻率范圍50中的某處。盡管所添加的音頻64可被添加至所選擇的頻率范圍中的任意位置,但為了最小化對聽眾的干擾,音頻64通常被添加至盡可能地接近諧波頻率48。
[0081]對于每個被編碼的分段38,所添加的音頻64通常具有等于該分段38的基頻46處的信號40的幅度的25%的最大幅度。
[0082]通常通過修改每個相關(guān)分段38的信號40來添加音頻64。換言之,音頻64被添加在頻域中,例如,通過為每個音頻幀修改MPEG編碼的音頻數(shù)據(jù)來添加。
[0083]若渲染裝置18 (圖1)沒有權(quán)限訪問頻域中的音頻流12 (圖2)的數(shù)據(jù),則渲染裝置18可基于標示被確定的時機的信息26 (圖1)在特定頻率特定時間處生成聲音。
[0084]現(xiàn)參照圖4,它是示出圖1的系統(tǒng)10中的第一編碼方法的圖表。同樣也參照圖3。
[0085]水印數(shù)據(jù)14可表示為比特流,一系列“O”和“I”。比特流中的每個比特通常被編碼在被選為編碼時機的不同的分段38中。
[0086]圖4示出了十二個分段38。在這十二個分段中,分段1、4_6、10和12被確定為編碼時機。
[0087]通過在諧波頻率或頻率48 (根據(jù)編碼標準,例如在頻率f/2和/或2f)處添加音頻64來將“I”編碼在一個分段38中。通過不添加音頻64來將“O”編碼在一個分段38中。如此,各個“ I”和“O”可被編碼在編碼時機中。
[0088]因此對于分段1、5、6和12,通過添加音頻64 (圖3)來編碼“I”。對于分段4和
10,通過不添加音頻來編碼“ O ”。
[0089]該編碼法可能會導(dǎo)致錯誤,由此出現(xiàn)“O”事實上是編碼錯誤,諸如“ I ”被錯誤地編碼或跳過。
[0090]此外,由于不可能或很難知道它是否是容易跳過的時機或者它是否是0,通常不可能隨機跳過時機,除非跳過時機是編碼方法的一部分。
[0091]現(xiàn)參照圖5,它是示出圖1的系統(tǒng)10中第二編碼方法的圖表。同樣也參照圖3。
[0092]圖5示出了十二個分段38。在這十二個分段38中,分段1、4-6、8_10和12被確定為編碼時機。
[0093]此外,為了編碼的目的而將時機配對。
[0094]圖5示出了形成一對的分段I和分段4、形成一對的分段5和分段6、形成一對的分段8和分段9以及形成一對的分段10和分段12。
[0095]通過在諧波頻率或頻率48 (根據(jù)編碼標準,例如在頻率f/2和/或2f)處添加音頻64來將“ I ”編碼在一對分段38中的第一分段38內(nèi)。
[0096]通過在諧波頻率或頻率48 (根據(jù)編碼標準,例如在頻率f/2和/或2f)處添加音頻64來將“O”編碼在一對分段38中的第二分段38內(nèi)。
[0097]因此為了編碼“I”而將音頻64添加至分段I而不是分段4中。為了編碼“O”而將音頻64添加至分段9而不是分段8中。
[0098]音頻64已被添加至分段5和分段6兩者中。因此,包括分段5和6的一對的編碼是無效的。音頻64未被添加至分段10或分段12中。因此,包括分段10和12的一對的編碼被跳過。
[0099]為防止對嵌入在音頻流12中的水印數(shù)據(jù)14的檢測,老道的黑客可以決定通過一個或更多的八度音階來增加或減少音頻頻率。使用對數(shù)仍可檢測出這一變化。若初始頻率是F且篡改頻率是mXF (m取決于音頻被偏移了多少個八度音階),則log (mF)在算數(shù)上等于log m加上log F。初始信號被偏移了確定的數(shù)量,且因此可檢測出篡改。
[0100]實際上,某些或全部的這些功能可被結(jié)合在單個物理部件中,或者可替代地,使用多個物理部件來實施。這些物理部件可包括硬連線或可編程裝置或這兩者的結(jié)合。在某些實施方式中,至少某些處理電路的功能可以在合適的軟件控制下通過可編程處理器來執(zhí)行。例如,該軟件可以電子形式通過網(wǎng)絡(luò)下載至裝置26??商娲鼗蝾~外地,軟件可以存儲在有形的、非暫時性的計算機可讀存儲介質(zhì)中,諸如光存儲器、磁存儲器或電子存儲器。
[0101]應(yīng)當理解,如果需要的話,本發(fā)明的軟件部件可以ROM (只讀存儲器)形式來實施。如果需要的話,軟件部件可通常使用常規(guī)技術(shù)在硬件中實施。應(yīng)進一步理解,軟件部件例如可示例為計算機程序產(chǎn)品;在有形的介質(zhì)上;或可由合適的計算機解譯的信號。[0102]將理解,為清晰起見,在單獨的實施方式的上下文中描述的本發(fā)明的各個特征也可在單個實施方式中以組合的形式來提供。相反,為簡便起見,在單個實施方式的上下文中描述的本發(fā)明的各個特征也可單獨地或者以任何適合的子組合來提供。
[0103]本領(lǐng)域技術(shù)人員將理解,本發(fā)明不由上文具體示出和描述的內(nèi)容來限制。而是由所附權(quán)利要求及其等價物來限定本發(fā)明的范圍。
【權(quán)利要求】
1.一種系統(tǒng),包括處理器,用于確定用于將水印編碼到音頻流中的多個時機,所述音頻流具有多個分段,當在頻域中被表示時,每個所述分段包括幅度相對于頻率的信號,所述處理器針對所述音頻流的每一個所述分段可操作為: 識別一個分段的基頻f,所述基頻是在所述一個分段中具有所述信號的最大幅度的頻率,所述基頻f確定多個諧波頻率,每個所述諧波頻率位于頻率f/2n或2fn處,η為正整數(shù);以及 若所述一個分段的所述信號的幅度對于在多個不同頻率范圍中的一個或多個中的所有頻率來說小于值V,則將所述一個分段確定為用于編碼至少部分所述水印的時機,每個所述不同頻率范圍以不同的一個所述諧波頻率為中心。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其中,所述值V小于或等于所述信號在所述一個分段的所述基頻處的幅度的25%。
3.根據(jù)權(quán)利要求1或權(quán)利要求2所述的系統(tǒng),其中,每個所述不同頻率范圍的大小分別等于每個所述不同頻率范圍的中心處的頻率的6%。
4.根據(jù)權(quán)利要求1至3中任一項所述的系統(tǒng),其中,所述諧波頻率在從20Hz到20, OOOHz的頻率范圍內(nèi)。
5.根據(jù)權(quán)利要求1至4中任一項所述的系統(tǒng),其中,所述處理器可操作為準備用于傳輸至另一裝置的數(shù)據(jù),所述數(shù)據(jù)包括:在頻域或時域中格式化的所述音頻流;以及標示所確定的時機的信息。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),進一步包括用于將所述數(shù)據(jù)傳輸至所述另一裝置的傳輸設(shè)備。
7.根據(jù)權(quán)利要求5或權(quán)利要求6所述的系統(tǒng),其中,所述處理器可操作為針對所述音頻流的被確定為所述時機之一的每一個所述分段準備所述數(shù)據(jù)以便包括:所述一個分段的定時信息;在所述一個分段的所述基頻處的所述信號的幅度;所述一個分段的一個或多個不同的所述諧波頻率。
8.根據(jù)權(quán)利要求5至7中任一項所述的系統(tǒng),其中,所述處理器可操作為準備所述數(shù)據(jù)以包括確定已被確定為用于編碼所述水印的一個所述時機的多對所述分段的數(shù)據(jù)。
9.根據(jù)權(quán)利要求1至8中任一項所述的系統(tǒng),進一步包括水印編碼器,用于將所述水印編碼到所述音頻流中,所述編碼包括將音頻添加至被確定為編碼時機的至少一些所述分段,所添加的音頻被添加成使得對于每一所確定的分段,所添加的音頻被添加至每個所述不同頻率范圍或一個所述不同頻率范圍中的某處。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其中,所添加的音頻具有等于所述信號在所述一個分段的所述基頻處的幅度的25%的最大幅度。
11.一種方法,包括: 確定用于將水印編碼到音頻流中的多個時機,所述音頻流具有多個分段,當在頻域中被表示時,每個所述分段包括幅度相對于頻率的信號;以及 針對所述音頻流的每一個所述分段: 識別一個分段的基頻f,所述基頻是在所述一個分段中具有所述信號的最大幅度的頻率,所述基頻f確定多個諧波頻率,每個所述諧波頻率位于頻率f/2n或2fn處,η為正整數(shù);以及若所述一個分段的所述信號的幅度對于在多個不同頻率范圍中的一個或多個中的所有頻率來說小于值V,則將所述一個分段確定為用于編碼至少部分所述水印的時機,每個所述不同頻率范圍以不同的一 個所述諧波頻率為中心。
【文檔編號】G10L25/90GK103548079SQ201280024995
【公開日】2014年1月29日 申請日期:2012年6月11日 優(yōu)先權(quán)日:2011年8月3日
【發(fā)明者】澤夫·蓋澤爾 申請人:Nds有限公司