專利名稱:基于音頻水印識別媒體節(jié)目的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及多媒體信號處理,尤其涉及用于基于音頻水印識別媒體節(jié)目的方法和裝置。
背景技術(shù):
目前,經(jīng)由電視網(wǎng)絡(luò)、廣播網(wǎng)絡(luò)等各種網(wǎng)絡(luò)廣播著各種各樣的媒體節(jié)目。這里所使用的術(shù)語“媒體節(jié)目”是指包含音頻信號的電視節(jié)目、無線電節(jié)目等等。媒體節(jié)目的示例包括產(chǎn)品廣告、天氣預(yù)報和新聞報導(dǎo)。這種媒體節(jié)目一般包括一些廣播片段。例如,產(chǎn)品廣告節(jié)目包括各種產(chǎn)品廣告,其中一個廣播片段一般對應(yīng)于一個廣告。一般而言,這些廣播片段的時間是很短暫的(約30-60秒/剪輯),并且只提供簡短的介紹。在許多情況下,觀看者并不滿意于廣播片段所提供的簡短信息,而希望獲得更多相關(guān)信息。
例如,當(dāng)觀眾正在收看電視上的“新聞報導(dǎo)”節(jié)目時,他突然聽到了一段吸引其注意的新聞并且希望能夠獲得關(guān)于該新聞的詳細信息。但是它所收看的電視節(jié)目給出的只是關(guān)于該新聞的簡要概括。此時觀眾可以打電話給電視臺以查詢該新聞,也可以花時間在互聯(lián)網(wǎng)上搜索該新聞的背景信息。但這些方式都是很麻煩的。
考慮到移動設(shè)備的日益普及,如果此時觀眾能夠朝著電視機按下其移動設(shè)備上的幾個按鈕,幾秒之后電話上就會接收到該新聞的完整內(nèi)容,或者該觀眾的默認(rèn)電子郵件地址接收到關(guān)于該新聞的補充信息,則將會是非常方便的。這里所使用的術(shù)語“移動設(shè)備”覆蓋了各種配備有音頻記錄裝置(例如麥克風(fēng))的便攜式終端,例如蜂窩電話、個人數(shù)字助理(PDA)等。
上述場景的一個關(guān)鍵的方面是識別包含音頻信號的媒體節(jié)目。在現(xiàn)有技術(shù)中,存在許多識別包含音頻信號的媒體節(jié)目的方法。一種可能識別包含音頻信號的廣播片段的方法涉及音頻指紋(audio fingerprinting),其中每個片段應(yīng)當(dāng)在廣播之前被分析,以形成它的“指紋”。在識別階段,解碼器嘗試分析被廣播的片段的特性,并將其與指紋之一相匹配,即識別其模式。這種方法使用的技術(shù)相對復(fù)雜,并且實現(xiàn)起來較為麻煩,因為若要識別新的廣播片段則它需要更新模式。尤其該方法無法應(yīng)用在實況廣播情況下,因為沒有相應(yīng)的模式可用。
另一種識別方法涉及音頻水印。從技術(shù)來說,數(shù)字音頻水印是以不可感知的方式將秘密信號隱藏到宿主信號中的技術(shù)。無法通過標(biāo)準(zhǔn)的處理、傳輸和/或記錄從宿主信號中去除秘密信號,并且只能通過專門設(shè)計的水印檢測器來提取秘密信號。在現(xiàn)有技術(shù)中,存在一些相關(guān)發(fā)明,它們論述了通過音頻水印來進行媒體節(jié)目識別。例如,在Cox的標(biāo)題為“SpreadSpectrum Watermark for Embedded Signaling”的美國專利No.5,848,155中,通過使用擴展頻譜技術(shù)將水印嵌入到音頻/圖像/視頻/多媒體數(shù)據(jù)中。Lee的標(biāo)題為“Digital System for Embedding a Pseudo-randomly ModulatedAuxiliary Data Sequence in Digital Samples”的美國專利No.6,792,542,B1公開了一種通過采用偽隨機序列來調(diào)制宿主信號的連續(xù)多比特樣本的感知性最低比特(LPSB)而嵌入輔助數(shù)字信息的方案。Bender的標(biāo)題為“Method and Apparatus for Echo Data Hiding in Audio Signals”的美國專利No.5,893,067將一個或多個回聲嵌入到宿主音頻信號中。Fardeau的標(biāo)題為“Method And Apparatus for Automatically Identifying a Program Including aSound Signal”的美國專利No.5,581,800公開了一種通過以預(yù)定且重復(fù)的特性方式改變某些頻率成分的能量來將消息編碼到聲音信號中的方法。此外,Yoiti Suzuki的標(biāo)題為“Digital Watermark System”的美國專利US2003/0172277A1公開了一種通過在時間軸上擴展回聲信號來將生成的回聲信號插入到原始音頻信號中的數(shù)字水印嵌入方法。
Cox專利的擴展頻譜方法將隱藏數(shù)據(jù)調(diào)制到嵌入在宿主音頻信號中的一組偽隨機序列中。該方法的優(yōu)點是易于實現(xiàn)、安全性高、對各種攻擊的魯棒性高等等。但是擴展頻譜方法的一個嚴(yán)重缺點阻礙了它的實際應(yīng)用,即它對于水印檢測中的失同步攻擊來說很脆弱。Bender的回聲隱藏方法通過在時間域引入回聲來將隱藏數(shù)據(jù)嵌入到宿主信號中。這種方法得到了廣泛使用,因為它具有許多出色特征,例如能夠有效抵抗同步攻擊、易于實現(xiàn)盲檢測,并且引入的噪聲很小。但是,回聲隱藏的缺點是容量很低并且解碼過程不安全。
Lee的方案雖然通過結(jié)合擴展頻譜和感知性最低比特技術(shù)來提高了帶水印的信號的不可感知性,但是卻由于易受環(huán)境噪聲影響而不能令人滿意。具體而言,它采用了校驗碼來滿足自同步的要求,即解碼器在接收到的水印加上校驗碼與計算出的檢驗碼相匹配時達到同步。該過程需要逐樣本地、無遺漏地搜索同步。Fardeau的方案要求專門的類似尋呼機的設(shè)備,來檢測嵌入的標(biāo)識消息。此外,注意對音頻信號進行編碼的頻率成分被選擇成處于接近100Hz的范圍中,從而它可能受到低通濾波攻擊的影響,而低通濾波是各種音頻壓縮算法中的常見預(yù)處理操作。Yoiti的方法結(jié)合了回聲隱藏和擴展頻譜,以提高容量和安全性。但是,考慮到媒體交互場景中的下采樣攻擊,所允許的嵌入回聲陣列的長度是有限的,從而它不能提供長度足以保證良好的統(tǒng)計屬性的PN序列。另一方面,這種方法對于回聲抖動攻擊來說是脆弱的。
因此,現(xiàn)有技術(shù)未能提供一種通過基于音頻水印識別媒體節(jié)目從而獲得媒體節(jié)目相關(guān)信息的有效方法和裝置。
就水印技術(shù)而言,在媒體與移動設(shè)備交互的場景中,一般存在隨機剪切、AD/DA轉(zhuǎn)換、重采樣、音頻壓縮、環(huán)境噪聲、混響等攻擊。對于本發(fā)明背景下的水印系統(tǒng),隨機剪切、AD/DA轉(zhuǎn)換和重采樣是最嚴(yán)重的攻擊。其原因如下 1)觀眾可能會隨機地記錄帶有水印的音頻剪輯,其長度可能只是幾秒,而這僅構(gòu)成宿主信號的一小部分。
2)編碼后的音頻的捕獲是在移動設(shè)備方以模塊方式進行的,而水印嵌入是以數(shù)字方式進行的。
3)水印嵌入必須工作在44.1K采樣率下,以確保宿主信號的質(zhì)量。但是移動設(shè)備一般只允許較低的(例如8K)采樣率。
因此,需要一種基于音頻水印識別媒體節(jié)目從而獲得關(guān)于媒體節(jié)目的相關(guān)信息的方法和裝置,其使得能夠方便地獲得媒體節(jié)目的相關(guān)信息,不會對媒體節(jié)目的質(zhì)量產(chǎn)生影響,并且能夠抵御各種環(huán)境攻擊。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于音頻水印識別媒體節(jié)目從而獲得關(guān)于媒體節(jié)目的相關(guān)信息的裝置和方法,其使得能夠方便地獲得媒體節(jié)目的相關(guān)信息,不會對媒體節(jié)目的質(zhì)量產(chǎn)生影響,并且能夠抵御各種環(huán)境攻擊。
根據(jù)本發(fā)明的一個方面,提供了一種用于獲得關(guān)于包括音頻信號的媒體節(jié)目的相關(guān)信息的方法,包括嵌入步驟,該步驟向媒體節(jié)目的音頻信號中嵌入包含媒體節(jié)目的標(biāo)識信息的音頻水??;發(fā)送步驟,該步驟發(fā)送媒體節(jié)目;記錄步驟,該步驟通過用戶記錄媒體節(jié)目的嵌入了音頻水印的音頻信號的一部分;提取步驟,該步驟從所記錄的那部分音頻信號中提取音頻水印以獲得標(biāo)識信息,并將標(biāo)識信息提供給存儲了相關(guān)信息的服務(wù)器;以及相關(guān)信息提供步驟,該步驟通過服務(wù)器根據(jù)標(biāo)識信息向用戶提供關(guān)于媒體節(jié)目的相關(guān)信息,其中嵌入步驟包括標(biāo)識信息預(yù)處理步驟,該步驟對媒體節(jié)目的標(biāo)識信息執(zhí)行預(yù)處理,以獲得媒體節(jié)目的經(jīng)預(yù)處理的標(biāo)識信息;回聲延遲陣列確定步驟,該步驟確定將多對正負(fù)回聲嵌入音頻信號中時使用的回聲延遲陣列;幅度調(diào)制步驟,該步驟用媒體節(jié)目的經(jīng)預(yù)處理的標(biāo)識信息對多對正負(fù)回聲進行幅度調(diào)制;回聲重復(fù)步驟,該步驟重復(fù)經(jīng)幅度調(diào)制的多對正負(fù)回聲;以及回聲嵌入步驟,該步驟沿回聲延遲陣列將經(jīng)重復(fù)和經(jīng)幅度調(diào)制的多對正負(fù)回聲嵌入音頻信號中。
根據(jù)本發(fā)明的另一個方面,提供了一種用于獲得關(guān)于包括音頻信號的媒體節(jié)目的相關(guān)信息的系統(tǒng),包括嵌入裝置,用于向媒體節(jié)目的音頻信號中嵌入包含媒體節(jié)目的標(biāo)識信息的音頻水??;發(fā)送裝置,用于發(fā)送媒體節(jié)目;記錄裝置,用于記錄媒體節(jié)目的嵌入了音頻水印的音頻信號的一部分;提取裝置,用于從所記錄的那部分音頻信號中提取音頻水印以獲得標(biāo)識信息,并將標(biāo)識信息提供給存儲了相關(guān)信息的服務(wù)器;以及相關(guān)信息提供裝置,其位于服務(wù)器上,用于通過服務(wù)器根據(jù)標(biāo)識信息提供關(guān)于媒體節(jié)目的相關(guān)信息,其中嵌入裝置包括標(biāo)識信息預(yù)處理裝置,用于對媒體節(jié)目的標(biāo)識信息執(zhí)行預(yù)處理,以獲得媒體節(jié)目的經(jīng)預(yù)處理的標(biāo)識信息;回聲延遲陣列確定裝置,用于確定將多對正負(fù)回聲嵌入音頻信號中時使用的回聲延遲陣列;幅度調(diào)制裝置,用于用媒體節(jié)目的經(jīng)預(yù)處理的標(biāo)識信息對多對正負(fù)回聲進行幅度調(diào)制;回聲重復(fù)裝置,用于重復(fù)經(jīng)幅度調(diào)制的多對正負(fù)回聲;回聲嵌入裝置,用于沿回聲延遲陣列將經(jīng)重復(fù)和經(jīng)幅度調(diào)制的多對正負(fù)回聲嵌入音頻信號中。
根據(jù)本發(fā)明的另一個方面,提供了一種用于向音頻信號嵌入音頻水印的裝置,包括標(biāo)識信息預(yù)處理裝置,用于對與音頻信號相關(guān)的標(biāo)識信息執(zhí)行預(yù)處理,以獲得經(jīng)預(yù)處理的標(biāo)識信息;回聲延遲陣列確定裝置,用于確定將多對正負(fù)回聲嵌入音頻信號中時使用的回聲延遲陣列;幅度調(diào)制裝置,用于用經(jīng)預(yù)處理的標(biāo)識信息對多對正負(fù)回聲進行幅度調(diào)制;回聲重復(fù)裝置,用于重復(fù)經(jīng)幅度調(diào)制的多對正負(fù)回聲;以及回聲嵌入裝置,用于沿回聲延遲陣列將經(jīng)重復(fù)和經(jīng)幅度調(diào)制的多對正負(fù)回聲嵌入音頻信號中。
根據(jù)本發(fā)明的另一個方面,提供了一種用于向音頻信號嵌入音頻水印的方法,包括標(biāo)識信息預(yù)處理步驟,該步驟對與音頻信號相關(guān)的標(biāo)識信息執(zhí)行預(yù)處理,以獲得經(jīng)預(yù)處理的標(biāo)識信息;回聲延遲陣列確定步驟,該步驟確定將多對正負(fù)回聲嵌入音頻信號中時使用的回聲延遲陣列;幅度調(diào)制步驟,該步驟用經(jīng)預(yù)處理的標(biāo)識信息對多對正負(fù)回聲進行幅度調(diào)制;回聲重復(fù)步驟,該步驟重復(fù)經(jīng)幅度調(diào)制的多對正負(fù)回聲;以及回聲嵌入步驟,該步驟沿回聲延遲陣列將經(jīng)重復(fù)和經(jīng)幅度調(diào)制的多對正負(fù)回聲嵌入音頻信號中。
根據(jù)本發(fā)明的另一個方面,提供了一種用于從音頻信號中提取音頻水印的裝置,音頻水印是通過用經(jīng)過預(yù)處理的與音頻信號相關(guān)的標(biāo)識信息對嵌入音頻信號的回聲進行幅度調(diào)制而嵌入音頻信號中的,該設(shè)備包括對數(shù)倒譜分析裝置,用于通過對音頻信號進行對數(shù)倒譜分析來獲取經(jīng)預(yù)處理的標(biāo)識信息;以及標(biāo)識信息恢復(fù)裝置,用于通過對經(jīng)預(yù)處理的標(biāo)識信息執(zhí)行預(yù)處理的逆處理,以恢復(fù)標(biāo)識信息。
根據(jù)本發(fā)明的另一個方面,提供了一種用于從音頻信號中提取音頻水印的方法,音頻水印是通過用經(jīng)過預(yù)處理的與音頻信號相關(guān)的標(biāo)識信息對嵌入音頻信號的回聲進行幅度調(diào)制而嵌入音頻信號中的,該方法包括對數(shù)倒譜分析步驟,該步驟通過對音頻信號進行對數(shù)倒譜分析來獲取經(jīng)預(yù)處理的標(biāo)識信息;以及標(biāo)識信息恢復(fù)步驟,該步驟通過對經(jīng)預(yù)處理的標(biāo)識信息執(zhí)行預(yù)處理的逆處理,以恢復(fù)標(biāo)識信息。
因此,與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點 1)本發(fā)明的基于音頻水印的媒體節(jié)目識別技術(shù)使得觀眾能夠很方便地從媒體節(jié)目獲得其所感興趣的相關(guān)信息。
2)本發(fā)明的基于音頻水印的媒體節(jié)目識別技術(shù)尤其適合于實況媒體節(jié)目,例如新聞報導(dǎo)。
3)本發(fā)明的基于音頻水印的媒體節(jié)目識別技術(shù)是安全的,即,在沒有關(guān)于嵌入的水印序列的先驗知識的情況下,是無法檢測水印的,這是因為引入了偽隨機序列和置換。
4)本發(fā)明的基于音頻水印的媒體節(jié)目識別技術(shù)可以提供高數(shù)據(jù)容量,以識別大量媒體節(jié)目,這是由于正負(fù)回聲過程加寬了回聲嵌入范圍。
5)本發(fā)明的基于音頻水印的媒體節(jié)目識別技術(shù)可以提供針對各種失真的更強的魯棒性,這是由于采用了ECC和冗余處理。
6)本發(fā)明提供了一種綜合分析方法,用于找出不同采樣率之間回聲偏移的映射關(guān)系,從而能夠抵抗重采樣攻擊。
7)本發(fā)明的基于音頻水印的媒體節(jié)目識別技術(shù)防止了解碼器方回聲偏移位置的抖動,這是因為采用了回聲重復(fù)過程。
本發(fā)明的這些和其他優(yōu)點和特征將從以下結(jié)合附圖的詳細描述中顯現(xiàn)出來。
圖1示出了根據(jù)本發(fā)明實施例的系統(tǒng)100的示意框圖; 圖2示出根據(jù)本發(fā)明實施例的編碼器2的示意性框圖; 圖3示出嵌入序列生成單元21中的示意框圖; 圖4示出序列嵌入單元22的示意框圖; 圖5示出正負(fù)回聲陣列調(diào)制過程的濾波器表示; 圖6示出本發(fā)明的綜合分析方法的流程圖; 圖7示出根據(jù)本發(fā)明實施例的解碼器5的示意框圖; 圖8示出根據(jù)本發(fā)明實施例的用于獲取與媒體節(jié)目相關(guān)的信息的方法的流程圖; 圖9示出根據(jù)本發(fā)明實施例的用于向音頻信號嵌入音頻水印的方法的流程圖; 圖10示出根據(jù)本發(fā)明實施例的用于從音頻信號中提取音頻水印的方法的流程圖。
具體實施例方式 以下參考附圖描述本發(fā)明的實施例。
圖1示出了根據(jù)本發(fā)明的系統(tǒng)100的示意框圖。如圖所示,根據(jù)本發(fā)明的系統(tǒng)100包括節(jié)目源1、編碼器2、傳輸介質(zhì)3、移動設(shè)備4、解碼器5、數(shù)據(jù)庫6和輸出設(shè)備7。節(jié)目源1提供包含音頻信號的媒體節(jié)目。節(jié)目源1所提供的包含音頻信號的媒體節(jié)目被輸入到編碼器2,在編碼器2中,標(biāo)識碼(Identification Code,本文中也稱為ID碼)被嵌入到音頻信號部分中。這里的標(biāo)識碼是標(biāo)識信息的一種示例形式。這個編碼過程可以在音頻部分上進行,而保持媒體節(jié)目的其他部分不變。經(jīng)編碼的信號經(jīng)由傳輸介質(zhì)3被發(fā)送,然后被施加到輸出設(shè)備7。傳輸介質(zhì)3可以是任何能夠傳輸媒體節(jié)目的有線或無線傳輸介質(zhì),輸出設(shè)備7例如是揚聲器。在系統(tǒng)的接收方,移動設(shè)備4的音頻記錄設(shè)備(未示出)拾取從揚聲器播放的音頻信號,所述音頻記錄設(shè)備例如是麥克風(fēng)。然后在解碼器5處對經(jīng)編碼的音頻信號進行解碼,以提取出隱藏的標(biāo)識碼。注意,圖3中所示的解碼器5位于服務(wù)器處(未示出),移動設(shè)備4所記錄的音頻信號是經(jīng)由第二傳輸介質(zhì)(未示出)傳輸?shù)椒?wù)器的。但是,這僅僅是一種示例性實現(xiàn)方式。實際上,解碼器5也可以位于移動設(shè)備4內(nèi)部,此時,不需要經(jīng)由第二傳輸介質(zhì)傳輸音頻信號,解碼過程可以在移動設(shè)備4內(nèi)部進行。由解碼過程提取出的ID碼被用作到數(shù)據(jù)庫6的鏈接,該數(shù)據(jù)庫6包含關(guān)于媒體節(jié)目本身的相關(guān)信息。因此,可以將相關(guān)信息發(fā)送回移動設(shè)備4,從而向用戶提供媒體節(jié)目的相關(guān)信息。提供相關(guān)信息的形式包括但不限于文本、圖片、音頻、視頻或多媒體等等,所有這些形式都被視為是在本發(fā)明的范圍內(nèi)的。本發(fā)明可以以多種方式來實現(xiàn),例如實現(xiàn)為混合信號集成電路、實現(xiàn)為分立元件電子設(shè)備、通過對數(shù)字處理器進行軟件編碼實現(xiàn),或者以這些實現(xiàn)方式的組合來實現(xiàn)。
圖2示出根據(jù)本發(fā)明的編碼器2的示意性框圖。如圖2所示,編碼器2包括嵌入序列生成單元21和序列嵌入單元22。嵌入序列生成單元21用于對k比特ID碼進行編碼,以輸出長度為N的嵌入序列。k比特ID與一個媒體節(jié)目相關(guān)聯(lián)。然后,在序列嵌入單元22中,嵌入序列被嵌入到原始音頻信號中。具體而言,在序列嵌入單元22中,根據(jù)嵌入序列生成單元21所生成的嵌入序列,對沿預(yù)定的回聲延遲陣列被時間擴展的一組正負(fù)回聲進行幅度調(diào)制。
圖3示出嵌入序列生成單元21中的示意框圖。
嵌入序列生成單元21包括糾錯編碼(Error Correction Coding,縮寫為ECC)模塊31、冗余模塊32、二進制相位鍵控(Binary Phase ShiftKeying,縮寫為BPSK)模塊33、直接序列擴展頻譜(Direct SequenceSpread Spectrum,縮寫為DS-SS)調(diào)制模塊34和置換模塊35。
ECC模塊31對k比特ID碼進行糾錯編碼(ECC),以生成n比特碼字{c1,c2,c3,...cn},并將其提供給冗余模塊32。在本實施例中,ECC模塊31可以采用許多現(xiàn)有糾錯編碼方法,例如CRC和漢明方法。典型示例是以參數(shù)(n,k,p)構(gòu)造的BCH編解碼器,其中n是碼字的長度,k是ID碼的長度,p是可以糾正的比特差錯的數(shù)目。
在冗余模塊32中,利用預(yù)定的整數(shù)值N,將碼字的每個比特cj重復(fù)l=N/n次,以產(chǎn)生長度為N的冗余的序列,并將其提供給BPSK模塊33,如下所示
BPSK模塊33通過使用BPSK調(diào)制按(1->+1;0->-1)將以上數(shù)據(jù)的每個比特映射到比特流中,其輸出被提供給DS-SS調(diào)制模塊34。
DS-SS調(diào)制模塊34為每個j=1...n和長度為N的序列準(zhǔn)備長度為l的偽隨機序列其中{ri}通過下式獲得
然后通過載波信號{ri}對BPSK模塊33所提供的重復(fù)的消息{bi}進行調(diào)制。該調(diào)制被稱為直接序列擴展頻譜(DS-SS)調(diào)制,它按照下式進行 si=biri(i=1,...,N)(3) 置換模塊35接收DS-SS調(diào)制模塊34的輸出,并對其進行偽隨機確定的置換,如下 通過置換,打亂了{si}元素的順序,并且獲得以下嵌入序列{ai} 通過嵌入序列生成單元21中的上述過程,實現(xiàn)了基于DS-SS調(diào)制的魯棒性,這是因為在解碼器處若要恢復(fù)標(biāo)識信息則需要編碼器處使用的偽隨機序列,這為標(biāo)識信息添加了安全性措施。此外,置換擾亂是以交錯編碼實現(xiàn)的,從而降低了比特間魯棒性的不平衡。
圖4示出序列嵌入單元22的示意框圖。序列嵌入單元22包括延遲模塊41、回聲嵌入模塊42、回聲重復(fù)模塊43、幅度調(diào)制模塊44,掩蔽模塊45和加法模塊46。在延遲模塊41中,原始音頻信號被延遲不同的時間偏移,這些偏移是預(yù)先通過綜合分析方法(Analysis-By-Synthesis,ABS)方法搜索回聲陣列來確定的,其目的是在重采樣之后能夠準(zhǔn)確地檢測到水印。延遲后的信號被輸入到回聲嵌入模塊42。在回聲嵌入模塊42中,執(zhí)行回聲嵌入過程,其中,對于每個預(yù)定的延遲偏移,經(jīng)延遲的宿主信號被乘以正增益參數(shù),以獲得宿主信號的正衰減版本。相應(yīng)地,在非常鄰近的預(yù)定延遲偏移處,產(chǎn)生負(fù)衰減版本,以便對宿主信號的質(zhì)量的影響最小?;芈暻度肽K42的輸出被提供到回聲重復(fù)模塊43,在這里正負(fù)回聲過程被重復(fù)若干次,以防止回聲抖動問題。從而,回聲重復(fù)模塊43的輸出是一組正負(fù)衰減的宿主信號,該信號被提供到幅度調(diào)制模塊44。在幅度調(diào)制模塊44中,通過嵌入序列生成單元21所生成的嵌入序列對這些經(jīng)延遲的信號進行幅度調(diào)制。在調(diào)制之前,在掩蔽模塊45中,對嵌入序列執(zhí)行抑制處理,以防止對音頻信號的質(zhì)量產(chǎn)生可聽的影響。最后,在加法模塊46處,經(jīng)調(diào)制的信號與原始的音頻信號相加,以提供帶水印的音頻信號。
從濾波操作的角度來看,以上正負(fù)回聲陣列調(diào)制過程可以由圖5示出。從數(shù)學(xué)上來說,圖5所示的濾波器的沖擊響應(yīng)可以由式(6)表示。
其中g(shù)Pδ(τ-dim)-gEδ(τ-dim′)代表正負(fù)回聲。gP和gE分別是正負(fù)回聲中的正回聲和負(fù)回聲的增益參數(shù)。一般來說gP總是大于gE,從而使得第一回聲是主導(dǎo)的,而第二回聲是次要的。dim是第i個正回聲的第m次重復(fù)的延遲偏移,dim’是第i個負(fù)回聲的第m次重復(fù)的延遲偏移。M是重復(fù)次數(shù)。在本實施例中,使用M=2,但這只是示例性的,M也可以取任何其他大于2的值。另一方面,在本實施例中,d和d’的距離小于3,即|d’-d|<=3。{αi,i=1...,N}是長度為N的嵌入序列。將嵌入序列映射到濾波函數(shù)上的方式是利用嵌入序列的元素來調(diào)制正負(fù)回聲信號的幅度。一般希望這些回聲的幅度具有較小的增益值,以使經(jīng)調(diào)制的信號對宿主信號的感知者透明。因此,|α*g|應(yīng)當(dāng)小于0.2。
H.O.Oh等人在“New Echo Embedding Technique for Robust andImperceptible Audio Watermarking”,Proc.IEEE Int.Conf.Acoustics,Speech,and Signal Processing,vol.3,2001,pp.1341-1344中描述的正負(fù)回聲技術(shù)與傳統(tǒng)信號回聲技術(shù)相比,會導(dǎo)致音頻信號的較低頻帶的最小失真。應(yīng)當(dāng)注意,低頻帶響應(yīng)在確定聲音信號方面至關(guān)重要,特別是幾個最低頻帶處的形狀確定了帶回聲的音頻信號的音色。正負(fù)回聲技術(shù)的優(yōu)點是加寬了回聲嵌入的范圍,從而提供了高容量,而不會使宿主信號的質(zhì)量惡化。在實踐中,為了確保正負(fù)回聲幾乎不導(dǎo)致可察覺的音頻失真,第二延遲與第一延遲的距離一般小于3個樣本,即|d’-d|<=3。另一方面,gP總是大于gN,以便第一回聲是主導(dǎo)的,第二回聲是次要的。
在回聲重復(fù)模塊43中,重復(fù)進行正負(fù)回聲過程。這一過程是由以下事實所激發(fā)的在解碼器5處,重采樣操作總會導(dǎo)致回聲偏移位置的抖動,即在重采樣操作之前或之后,回聲位置會變化一個樣本左右。這個問題被稱為“失同步”。尤其是在媒體交互的場景中,移動設(shè)備4只允許在8K采樣率下進行記錄,而水印必須以44.1K的采樣率嵌入,以保證宿主信號的質(zhì)量。從而,當(dāng)記錄帶水印的音頻信號時,在移動設(shè)備4處會執(zhí)行下采樣操作。在解碼器5處,檢測是基于以下規(guī)則的解碼器5知道8K采樣率下的確切回聲偏移位置。但是,當(dāng)應(yīng)用各種麥克風(fēng)時,回聲位置可能發(fā)生抖動。從而,在本發(fā)明中采用了回聲重復(fù)過程來防止這個問題,在這個過程中,兩個正負(fù)回聲信號被插入到宿主信號中,而它們只相距一個樣本。
圖6示出本發(fā)明的綜合分析方法流程圖。綜合分析方法的目的是找出44.1K和8K采樣率下回聲偏移之間的映射關(guān)系,以確保解碼器5準(zhǔn)確地定位不同采樣率下的回聲延遲偏移,然后根據(jù)相應(yīng)的解碼方法恢復(fù)出隱藏的標(biāo)識信息。注意,44.1K和8K采樣率只是示例性的,本發(fā)明的綜合分析方法也適用于其他采樣率。
在本發(fā)明中,針對44.1K采樣率下90到350樣本范圍內(nèi)的回聲延遲進行了計算,這是因為該范圍被認(rèn)為是聲音透明區(qū)域,當(dāng)正負(fù)回聲被嵌入到該區(qū)域中時,原始音頻信號的質(zhì)量不會受損。
在步驟S601中,初始化EchoPos,將其設(shè)置為90。在步驟S602中,執(zhí)行雙回聲嵌入,即嵌入延遲間隔為2個樣本的正負(fù)回聲。在步驟S603中,在8K采樣率下對帶水印的音頻信號進行記錄和下采樣。
在步驟S604中,對帶水印的信號進行解碼。解碼基于式(7)的對數(shù)倒譜計算 q(w)=real[IDFT[log(DFT(x(t)))]](7) 其中x(t)是接收到的信號,DFT()是離散傅立葉變換,IDFT()是逆DFT,real()返回復(fù)數(shù)的實部。應(yīng)當(dāng)指出,下采樣操作會使44.1K下的正負(fù)回聲合并成一個,并使得回聲延遲位置移動。8K下的回聲延遲可以通過搜索對數(shù)倒譜值的自相關(guān)峰值來確定,如下式所示 在步驟S605中,移動一個樣本,即令EchoPos=EchoPos+1。在步驟S606中,判斷EchoPos是否不大于350,如果是,則返回步驟S602,重復(fù)步驟S602至S605,直到所有回聲偏移都已經(jīng)被處理。如果否,則前進到步驟S607。
在步驟S607中,定位44.1K下與8K情況下的最大峰值相對應(yīng)的確切嵌入位置。例如,在下表1中,左列是與8K情況下的回聲偏移18相對應(yīng)的44.1K下的回聲偏移,而右列示出8K采樣率下回聲延遲為18時相應(yīng)的對數(shù)倒譜自相關(guān)系數(shù)。在這里,延遲100可以被選擇為回聲嵌入位置,因為在8K情況下延遲18處,它具有最大的對數(shù)倒譜自相關(guān)值。對8K下的每個延遲都執(zhí)行這個過程,然后回聲延遲候選中選出N個點,從而產(chǎn)生了用于嵌入和檢測水印的N維回聲延遲陣列。
表1與8K下位置18相對應(yīng)的44.1K下的回聲延遲 圖7是示出根據(jù)本發(fā)明的解碼器5的示意框圖。解碼器5包括對數(shù)倒譜分析單元71和標(biāo)識碼恢復(fù)單元72。標(biāo)識碼恢復(fù)單元72又包括置換解調(diào)模塊73、DS-SS解調(diào)模塊74和糾錯解碼模塊75。
接收到的信號被移動設(shè)備4從媒體節(jié)目中記錄,并被發(fā)送到解碼器5。在解碼器5中,首先,對數(shù)倒譜分析單元71通過沿預(yù)定的回聲延遲陣列應(yīng)用如式(7)所示的對數(shù)倒譜分析來獲得接收到的信號的實對數(shù)倒譜的自相關(guān)系數(shù){qi}(i=1,...,N)。
在標(biāo)識碼恢復(fù)單元72的置換解調(diào)模塊73中,利用式(4)的偽隨機置換,通過式(9)的逆置換對{qi}的元素的順序進行解擾 在DS-SS解調(diào)模塊74中,通過式(10)獲得{gi}的長度為l=N/n的子序列 對于每個j=1,...,n,{yi(j)}是根據(jù)式(1)中的cj的間隔從{gi}提取的序列。并且,{yi(j)}被歸一化為具有均值0和方差1。給定與編碼器2方相同的偽隨機序列{ri(j)},執(zhí)行DS-SS解調(diào)。通過式(11)獲得與比特位置j相對應(yīng)的相關(guān)值ρi 然后按式12確定檢測到的比特值c′j
在糾錯解碼模塊75中,將檢測到的比特流{c′j}構(gòu)造為檢測到的碼字,執(zhí)行糾錯解碼。這樣,適當(dāng)?shù)丶m正了可糾正的比特差錯,并且獲得了k比特的ID碼。
圖8示出根據(jù)本發(fā)明實施例的用于獲取與媒體節(jié)目相關(guān)的信息的方法的流程圖。如圖所示,在步驟S801中,編碼方的編碼器2向媒體節(jié)目的音頻信號中嵌入包含媒體節(jié)目的標(biāo)識信息的音頻水印。在本實施例中,標(biāo)識信息是ID碼。嵌入步驟S801的流程將在以下參考圖9更詳細說明。在步驟S802中,通過傳輸介質(zhì)3和輸出設(shè)備7發(fā)送和輸出帶音頻信號(其中嵌入了音頻水印)的媒體節(jié)目。在步驟S803中,移動設(shè)備4的音頻記錄裝置記錄媒體節(jié)目的嵌入了音頻水印的音頻信號的一部分。在步驟S804中,解碼方的解碼器5從所記錄的那部分音頻信號中提取音頻水印以獲得標(biāo)識信息,即ID碼,并將ID碼提供給存儲了相關(guān)信息的數(shù)據(jù)庫6。解碼器5提取ID碼的流程將在以下參考圖10更詳細說明。在步驟S805中,從數(shù)據(jù)庫6中獲得關(guān)于媒體節(jié)目的相關(guān)信息,并將其提供給移動設(shè)備4。從而,通過嵌入和提取音頻水印,識別媒體節(jié)目,從而能夠獲取與媒體節(jié)目相關(guān)的信息。
圖9示出了根據(jù)本發(fā)明實施例的用于向音頻信號嵌入音頻水印的方法的流程圖,即圖8中的步驟S801的詳細流程。在步驟S901中,嵌入序列生成單元21對ID碼進行如上所述的包括糾錯編碼、冗余、BPSK、DS-SS調(diào)制和置換在內(nèi)的預(yù)處理,以輸出嵌入序列,即經(jīng)預(yù)處理的標(biāo)識信息。在步驟S902中,延遲模塊41將原始音頻信號延遲不同的時間偏移,這些偏移是預(yù)先通過如上所述的綜合分析方法來確定的。在步驟S903中,回聲嵌入模塊42執(zhí)行回聲嵌入過程,并將輸出提供到回聲重復(fù)模塊43。在步驟S904中,在回聲重復(fù)模塊43中正負(fù)回聲過程被重復(fù)若干次。在步驟S905中,在幅度調(diào)制模塊44中,通過用嵌入序列生成單元21所生成的嵌入序列對這些經(jīng)延遲的信號進行幅度調(diào)制。注意,如上所述,在調(diào)制之前可在掩蔽模塊45中對嵌入序列執(zhí)行抑制處理。在步驟S906中,在加法模塊46處,經(jīng)調(diào)制的信號與原始的音頻信號相加,以提供帶水印的音頻信號。注意以上嵌入步驟S903、回聲重復(fù)步驟S904和幅度調(diào)制步驟S905的順序不一定局限于本實施例中所描述的。實際上,也可以先進行幅度調(diào)制步驟,然后是回聲重復(fù)步驟,最后再進行回聲嵌入,這也是包含在本發(fā)明的范圍內(nèi)的。
圖10示出了根據(jù)本發(fā)明實施例的用于從音頻信號中提取音頻水印的方法的流程圖,即圖8中的步驟S804的詳細流程。在步驟S1001中,在對數(shù)倒譜分析單元71中,通過沿預(yù)定的回聲延遲陣列應(yīng)用對數(shù)倒譜分析來獲得接收到的信號的實對數(shù)倒譜的自相關(guān)系數(shù)。然后,在步驟S1002中,標(biāo)識碼恢復(fù)單元72通過執(zhí)行包括置換解調(diào)、DS-SS解調(diào)和糾錯解碼在內(nèi)的處理,從而恢復(fù)出ID碼。
盡管已參考特定實施例詳細描述了本發(fā)明,但是應(yīng)當(dāng)理解,在不脫離本發(fā)明的精神和范圍的情況下,可以對本發(fā)明作出各種其他改變、替代和更改。本領(lǐng)域技術(shù)人員可以確定各種其他改變、替代、變動、更改和修改,并且本發(fā)明想要包括所有這些改變、替代、變動、更改和修改,只要它們落入本發(fā)明的精神和范圍內(nèi)。
權(quán)利要求
1.一種用于獲得關(guān)于包括音頻信號的媒體節(jié)目的相關(guān)信息的方法,包括
嵌入步驟,該步驟向所述媒體節(jié)目的音頻信號中嵌入包含所述媒體節(jié)目的標(biāo)識信息的音頻水?。?br>
發(fā)送步驟,該步驟發(fā)送所述媒體節(jié)目;
記錄步驟,該步驟通過用戶記錄所述媒體節(jié)目的嵌入了音頻水印的音頻信號的一部分;
提取步驟,該步驟從所記錄的那部分音頻信號中提取所述音頻水印以獲得所述標(biāo)識信息,并將所述標(biāo)識信息提供給存儲了所述相關(guān)信息的服務(wù)器;以及
相關(guān)信息提供步驟,該步驟通過所述服務(wù)器根據(jù)所述標(biāo)識信息向用戶提供關(guān)于所述媒體節(jié)目的相關(guān)信息,
其中所述嵌入步驟包括
標(biāo)識信息預(yù)處理步驟,該步驟對所述媒體節(jié)目的標(biāo)識信息執(zhí)行預(yù)處理,以獲得所述媒體節(jié)目的經(jīng)預(yù)處理的標(biāo)識信息;
回聲延遲陣列確定步驟,該步驟確定將多對正負(fù)回聲嵌入所述音頻信號中時使用的回聲延遲陣列;
幅度調(diào)制步驟,該步驟用所述媒體節(jié)目的經(jīng)預(yù)處理的標(biāo)識信息對所述多對正負(fù)回聲進行幅度調(diào)制;
回聲重復(fù)步驟,該步驟重復(fù)經(jīng)幅度調(diào)制的多對正負(fù)回聲;以及
回聲嵌入步驟,該步驟沿所述回聲延遲陣列將經(jīng)重復(fù)和經(jīng)幅度調(diào)制的多對正負(fù)回聲嵌入所述音頻信號中。
2.如權(quán)利要求1所述的方法,其中所述標(biāo)識信息包括所述媒體節(jié)目的標(biāo)識碼,并且所述標(biāo)識信息預(yù)處理步驟包括
對所述標(biāo)識碼執(zhí)行糾錯編碼,以獲得碼字;
對所述碼字執(zhí)行冗余處理,以產(chǎn)生冗余序列;
利用二進制相移鍵控調(diào)制將所述冗余序列映射到比特流;
通過利用偽隨機序列調(diào)制所述比特流來對所述比特流執(zhí)行直接序列擴展頻譜調(diào)制;以及
對經(jīng)直接序列擴展頻譜調(diào)制的比特流執(zhí)行置換以擾亂其順序,從而獲得經(jīng)預(yù)處理的標(biāo)識信息。
3.如權(quán)利要求1或2所述的方法,其中所述回聲延遲陣列確定步驟包括通過綜合分析方法確定所述回聲延遲陣列。
4.如權(quán)利要求3所述的方法,其中所述綜合分析方法包括對于記錄步驟的采樣率下的每個回聲延遲,定位發(fā)送步驟的采樣率下的相應(yīng)嵌入位置,該嵌入位置使得在記錄步驟的采樣率下的該回聲延遲處,所記錄的那部分音頻信號的對數(shù)倒譜的自相關(guān)的值最大。
5.如權(quán)利要求1或2所述的方法,其中所述提取步驟包括
對數(shù)倒譜分析步驟,該步驟通過對所記錄的那部分音頻信號進行對數(shù)倒譜分析,來獲取所述媒體節(jié)目的經(jīng)預(yù)處理的標(biāo)識信息;以及
標(biāo)識信息恢復(fù)步驟,該步驟通過對所述媒體節(jié)目的經(jīng)預(yù)處理的標(biāo)識信息執(zhí)行所述預(yù)處理的逆處理,來恢復(fù)所述媒體節(jié)目的標(biāo)識信息。
6.如權(quán)利要求5所述的方法,其中所述經(jīng)預(yù)處理的標(biāo)識信息包括所述媒體節(jié)目的經(jīng)預(yù)處理的標(biāo)識碼,并且所述標(biāo)識信息恢復(fù)步驟包括
對所述經(jīng)預(yù)處理的標(biāo)識碼執(zhí)行置換解調(diào),以獲得解擾后的比特流;
利用與對所述標(biāo)識碼進行預(yù)處理時使用的偽隨機序列相同的偽隨機序列對所述解擾后的比特流執(zhí)行直接序列擴展頻譜解調(diào),以獲得碼字;以及
對所述碼字進行糾錯解碼,以恢復(fù)所述標(biāo)識碼。
7.如權(quán)利要求1所述的方法,其中所述重復(fù)的次數(shù)為2次。
8.一種用于獲得關(guān)于包括音頻信號的媒體節(jié)目的相關(guān)信息的系統(tǒng),包括
嵌入裝置,用于向所述媒體節(jié)目的音頻信號中嵌入包含所述媒體節(jié)目的標(biāo)識信息的音頻水印;
發(fā)送裝置,用于發(fā)送所述媒體節(jié)目;
記錄裝置,用于記錄所述媒體節(jié)目的嵌入了音頻水印的音頻信號的一部分;
提取裝置,用于從所記錄的那部分音頻信號中提取所述音頻水印以獲得所述標(biāo)識信息,并將所述標(biāo)識信息提供給存儲了所述相關(guān)信息的服務(wù)器;以及
相關(guān)信息提供裝置,其位于所述服務(wù)器上,用于通過所述服務(wù)器根據(jù)所述標(biāo)識信息提供關(guān)于所述媒體節(jié)目的相關(guān)信息,
其中所述嵌入裝置包括
標(biāo)識信息預(yù)處理裝置,用于對所述媒體節(jié)目的標(biāo)識信息執(zhí)行預(yù)處理,以獲得所述媒體節(jié)目的經(jīng)預(yù)處理的標(biāo)識信息;
回聲延遲陣列確定裝置,用于確定將多對正負(fù)回聲嵌入所述音頻信號中時使用的回聲延遲陣列;
幅度調(diào)制裝置,用于用所述媒體節(jié)目的經(jīng)預(yù)處理的標(biāo)識信息對所述多對正負(fù)回聲進行幅度調(diào)制;
回聲重復(fù)裝置,用于重復(fù)經(jīng)幅度調(diào)制的多對正負(fù)回聲;
回聲嵌入裝置,用于沿所述回聲延遲陣列將經(jīng)重復(fù)和經(jīng)幅度調(diào)制的多對正負(fù)回聲嵌入所述音頻信號中。
9.如權(quán)利要求8所述的系統(tǒng),其中所述標(biāo)識信息包括所述媒體節(jié)目的標(biāo)識碼,并且所述標(biāo)識信息預(yù)處理裝置包括
用于對所述標(biāo)識碼執(zhí)行糾錯編碼以獲得碼字的裝置;
用于對所述碼字執(zhí)行冗余處理以產(chǎn)生冗余序列的裝置;
用于利用二進制相移鍵控調(diào)制將所述冗余序列映射到比特流的裝置;
用于通過利用偽隨機序列調(diào)制所述比特流來對所述比特流執(zhí)行直接序列擴展頻譜調(diào)制的裝置;以及
用于對經(jīng)直接序列擴展頻譜調(diào)制的比特流執(zhí)行置換以擾亂其順序,從而獲得經(jīng)預(yù)處理的標(biāo)識信息的裝置。
10.如權(quán)利要求8或9所述的系統(tǒng),其中所述回聲延遲陣列確定裝置通過綜合分析方法確定所述回聲延遲陣列。
11.如權(quán)利要求10所述的系統(tǒng),其中所述綜合分析方法包括對于記錄裝置中的采樣率下的每個回聲延遲,定位發(fā)送裝置中的采樣率下的相應(yīng)嵌入位置,該嵌入位置使得在記錄步驟的采樣率下的該回聲延遲處,所記錄的那部分音頻信號的對數(shù)倒譜的自相關(guān)的值最大。
12.如權(quán)利要求8或9所述的系統(tǒng),其中所述提取裝置包括
對數(shù)倒譜分析裝置,用于通過對所記錄的那部分音頻信號進行對數(shù)倒譜分析,來獲取所述媒體節(jié)目的經(jīng)預(yù)處理的標(biāo)識信息;以及
標(biāo)識信息恢復(fù)裝置,用于通過對所述媒體節(jié)目的經(jīng)預(yù)處理的標(biāo)識信息執(zhí)行所述預(yù)處理的逆處理,來恢復(fù)所述媒體節(jié)目的標(biāo)識信息。
13.如權(quán)利要求12所述的系統(tǒng),其中所述經(jīng)預(yù)處理的標(biāo)識信息包括所述媒體節(jié)目的經(jīng)預(yù)處理的標(biāo)識碼,并且所述標(biāo)識信息恢復(fù)裝置包括
用于對所述經(jīng)預(yù)處理的標(biāo)識碼執(zhí)行置換解調(diào)以獲得解擾后的比特流的裝置;
用于利用與對所述標(biāo)識碼進行預(yù)處理時使用的偽隨機序列相同的偽隨機序列對所述解擾后的比特流執(zhí)行直接序列擴展頻譜解調(diào)以獲得碼字的裝置;以及
用于對所述碼字進行糾錯解碼以恢復(fù)所述標(biāo)識碼的裝置。
14.如權(quán)利要求8所述的系統(tǒng),其中所述重復(fù)的次數(shù)為2次。
15.一種用于向音頻信號嵌入音頻水印的裝置,包括
標(biāo)識信息預(yù)處理裝置,用于對與所述音頻信號相關(guān)的標(biāo)識信息執(zhí)行預(yù)處理,以獲得經(jīng)預(yù)處理的標(biāo)識信息;
回聲延遲陣列確定裝置,用于確定將多對正負(fù)回聲嵌入所述音頻信號中時使用的回聲延遲陣列;
幅度調(diào)制裝置,用于用所述經(jīng)預(yù)處理的標(biāo)識信息對所述多對正負(fù)回聲進行幅度調(diào)制;
回聲重復(fù)裝置,用于重復(fù)經(jīng)幅度調(diào)制的多對正負(fù)回聲;以及
回聲嵌入裝置,用于沿所述回聲延遲陣列將經(jīng)重復(fù)和經(jīng)幅度調(diào)制的多對正負(fù)回聲嵌入所述音頻信號中。
16.如權(quán)利要求15所述的裝置,其中與所述音頻信號相關(guān)的標(biāo)識信息包括與所述音頻信號相關(guān)的標(biāo)識碼,并且所述標(biāo)識信息預(yù)處理裝置包括
用于對所述標(biāo)識碼執(zhí)行糾錯編碼以獲得碼字的裝置;
用于對所述碼字執(zhí)行冗余處理以產(chǎn)生冗余序列的裝置;
用于利用二進制相移鍵控調(diào)制將所述冗余序列映射到比特流的裝置;
用于通過利用偽隨機序列調(diào)制所述比特流來對所述比特流執(zhí)行直接序列擴展頻譜調(diào)制的裝置;以及
用于對經(jīng)直接序列擴展頻譜調(diào)制的比特流執(zhí)行置換以擾亂其順序,從而獲得經(jīng)預(yù)處理的標(biāo)識信息的裝置。
17.如權(quán)利要求15或16所述的裝置,其中所述回聲延遲陣列確定裝置通過綜合分析方法確定所述回聲延遲陣列。
18.如權(quán)利要求17所述的裝置,其中所述綜合分析方法包括對于記錄所述音頻信號的記錄采樣率下的每個回聲延遲,定位發(fā)送所述音頻信號的發(fā)送采樣率下的相應(yīng)嵌入位置,該嵌入位置使得在所述記錄采樣率下的該回聲延遲處,所記錄的音頻信號的對數(shù)倒譜的自相關(guān)的值最大。
19.如權(quán)利要求15所述的裝置,其中所述重復(fù)的次數(shù)為2次。
20.一種用于向音頻信號嵌入音頻水印的方法,包括
標(biāo)識信息預(yù)處理步驟,該步驟對與所述音頻信號相關(guān)的標(biāo)識信息執(zhí)行預(yù)處理,以獲得經(jīng)預(yù)處理的標(biāo)識信息;
回聲延遲陣列確定步驟,該步驟確定將多對正負(fù)回聲嵌入所述音頻信號中時使用的回聲延遲陣列;
幅度調(diào)制步驟,該步驟用所述經(jīng)預(yù)處理的標(biāo)識信息對所述多對正負(fù)回聲進行幅度調(diào)制;
回聲重復(fù)步驟,該步驟重復(fù)經(jīng)幅度調(diào)制的多對正負(fù)回聲;以及
回聲嵌入步驟,該步驟沿所述回聲延遲陣列將經(jīng)重復(fù)和經(jīng)幅度調(diào)制的多對正負(fù)回聲嵌入所述音頻信號中。
21.如權(quán)利要求20所述的方法,其中與所述音頻信號相關(guān)的標(biāo)識信息包括與所述音頻信號相關(guān)的標(biāo)識碼,并且所述標(biāo)識信息預(yù)處理步驟包括
對所述標(biāo)識碼執(zhí)行糾錯編碼,以獲得碼字;
對所述碼字執(zhí)行冗余處理,以產(chǎn)生冗余序列;
利用二進制相移鍵控調(diào)制將所述冗余序列映射到比特流;
通過利用偽隨機序列調(diào)制所述比特流來對所述比特流執(zhí)行直接序列擴展頻譜調(diào)制;以及
對經(jīng)直接序列擴展頻譜調(diào)制的比特流執(zhí)行置換以擾亂其順序,從而獲得經(jīng)預(yù)處理的標(biāo)識信息。
22.如權(quán)利要求20或21所述的方法,其中所述回聲延遲陣列確定步驟包括通過綜合分析方法確定所述回聲延遲陣列。
23.如權(quán)利要求22所述的方法,其中所述綜合分析方法包括對于記錄所述音頻信號的記錄采樣率下的每個回聲延遲,定位發(fā)送所述音頻信號的發(fā)送采樣率下的相應(yīng)嵌入位置,該嵌入位置使得在所述記錄采樣率下的該回聲延遲處,所記錄的音頻信號的對數(shù)倒譜的自相關(guān)的值最大。
24.如權(quán)利要求20所述的方法,其中所述重復(fù)的次數(shù)為2次。
25.一種用于從音頻信號中提取音頻水印的裝置,所述音頻水印是通過用經(jīng)過預(yù)處理的與所述音頻信號相關(guān)的標(biāo)識信息對嵌入所述音頻信號的回聲進行幅度調(diào)制而嵌入所述音頻信號中的,該設(shè)備包括
對數(shù)倒譜分析裝置,用于通過對所述音頻信號進行對數(shù)倒譜分析來獲取所述經(jīng)預(yù)處理的標(biāo)識信息;以及
標(biāo)識信息恢復(fù)裝置,用于通過對所述經(jīng)預(yù)處理的標(biāo)識信息執(zhí)行所述預(yù)處理的逆處理,以恢復(fù)所述標(biāo)識信息。
26.如權(quán)利要求25所述的裝置,其中所述經(jīng)預(yù)處理的標(biāo)識信息包括與所述音頻信號相關(guān)的經(jīng)預(yù)處理的標(biāo)識碼,并且所述標(biāo)識信息恢復(fù)裝置包括
用于對所述經(jīng)預(yù)處理的標(biāo)識碼執(zhí)行置換解調(diào)以獲得解擾后的比特流的裝置;
用于利用與對所述標(biāo)識碼進行預(yù)處理時使用的偽隨機序列相同的偽隨機序列對所述解擾后的比特流執(zhí)行直接序列擴展頻譜解調(diào)以獲得碼字的裝置;以及
用于對所述碼字進行糾錯解碼以恢復(fù)所述標(biāo)識碼的裝置。
27.一種用于從音頻信號中提取音頻水印的方法,所述音頻水印是通過用經(jīng)過預(yù)處理的與所述音頻信號相關(guān)的標(biāo)識信息對嵌入所述音頻信號的回聲進行幅度調(diào)制而嵌入所述音頻信號中的,該方法包括
對數(shù)倒譜分析步驟,該步驟通過對所述音頻信號進行對數(shù)倒譜分析來獲取所述經(jīng)預(yù)處理的標(biāo)識信息;以及
標(biāo)識信息恢復(fù)步驟,該步驟通過對所述經(jīng)預(yù)處理的標(biāo)識信息執(zhí)行所述預(yù)處理的逆處理,以恢復(fù)所述標(biāo)識信息。
28.如權(quán)利要求27所述的方法,其中所述經(jīng)預(yù)處理的標(biāo)識信息包括與所述音頻信號相關(guān)的經(jīng)預(yù)處理的標(biāo)識碼,并且所述標(biāo)識信息恢復(fù)步驟包括
對所述經(jīng)預(yù)處理的標(biāo)識碼執(zhí)行置換解調(diào),以獲得解擾后的比特流;
利用與對所述標(biāo)識碼進行預(yù)處理時使用的偽隨機序列相同的偽隨機序列對所述解擾后的比特流執(zhí)行直接序列擴展頻譜解調(diào)以獲得碼字;以及
對所述碼字進行糾錯解碼以恢復(fù)所述標(biāo)識碼。
全文摘要
一種獲得關(guān)于包括音頻信號的媒體節(jié)目的相關(guān)信息的方法包括向媒體節(jié)目的音頻信號嵌入包含媒體節(jié)目的標(biāo)識信息的音頻水??;發(fā)送媒體節(jié)目;通過用戶記錄媒體節(jié)目的嵌入了音頻水印的音頻信號的一部分;從所記錄的那部分音頻信號中提取音頻水印以獲得標(biāo)識信息,并將其提供給存儲相關(guān)信息的服務(wù)器;以及通過服務(wù)器根據(jù)標(biāo)識信息向用戶提供關(guān)于媒體節(jié)目的相關(guān)信息,其中嵌入步驟包括對標(biāo)識信息執(zhí)行預(yù)處理以獲得經(jīng)預(yù)處理的標(biāo)識信息;確定將多對正負(fù)回聲嵌入音頻信號中時使用的回聲延遲陣列;用經(jīng)預(yù)處理的標(biāo)識信息對多對正負(fù)回聲進行幅度調(diào)制;重復(fù)經(jīng)幅度調(diào)制的多對正負(fù)回聲;以及沿回聲延遲陣列將經(jīng)重復(fù)和經(jīng)幅度調(diào)制的多對正負(fù)回聲嵌入音頻信號。
文檔編號G10L19/00GK101115124SQ20061009952
公開日2008年1月30日 申請日期2006年7月26日 優(yōu)先權(quán)日2006年7月26日
發(fā)明者趙軍輝, 魏育成, 薛敏宇 申請人:日電(中國)有限公司