一種基于聽覺模型的自適應(yīng)音頻盲水印方法與流程

文檔序號(hào)：12128611閱讀：446來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明涉及信息隱藏領(lǐng)域。特別是涉及一種用于音頻作品版權(quán)管理的基于聽覺模型的自適應(yīng)音頻盲水印方法。

背景技術(shù)：

信息技術(shù)和計(jì)算機(jī)網(wǎng)絡(luò)的快速發(fā)展引發(fā)了一系列信息安全問題、盜版問題等，使得多媒體內(nèi)容的版權(quán)保護(hù)和內(nèi)容認(rèn)證成為了亟待解決的問題。數(shù)字水印技術(shù)作為一種有效的解決方案獲得了迅速的發(fā)展，并且已經(jīng)成為學(xué)術(shù)界的一個(gè)研究熱點(diǎn)。由于人耳具有更高的靈敏度，使得音頻水印技術(shù)相比視頻和圖像水印技術(shù)具有更大的挑戰(zhàn)。音頻水印技術(shù)就是將一種特殊的標(biāo)志信息嵌入到原始數(shù)字音頻作品中，用以辨識(shí)音頻作品的版權(quán)和合法使用者，從而達(dá)到音頻作品版權(quán)保護(hù)的作用。音頻水印技術(shù)需要滿足三個(gè)基本要求，即水印的不可感知性、魯棒性和水印容量，三者之間是相互矛盾的。如何設(shè)計(jì)方法，使得三者之間達(dá)到最佳的平衡一直是音頻水印技術(shù)的一個(gè)難點(diǎn)。當(dāng)前，數(shù)字水印技術(shù)大致可以分為兩種不同的類型，包括時(shí)間域水印嵌入方法和變換域水印嵌入方法。早期的方法選擇嵌入在時(shí)域部分。它的特點(diǎn)是算法簡(jiǎn)單，易于實(shí)現(xiàn)，但魯棒性和不可感知性較差。當(dāng)前主流的音頻水印算法是變換域算法，變換域算法在嵌入水印前需要將音頻載體信號(hào)從時(shí)域變換到頻域。由于變換域算法考慮了音頻載體特性和人耳聽覺特性，具有比時(shí)域算法更好的魯棒性和不可感知性。而對(duì)于音頻這樣的時(shí)變信號(hào)，利用小波分析的多分辨率特性和時(shí)頻局部特性，相比其他變換域算法具有更好的魯棒性，已經(jīng)成為音頻水印算法的研究熱點(diǎn)。近年來有不少學(xué)者將壓縮感知、奇異值分解、量化索引調(diào)制、神經(jīng)網(wǎng)絡(luò)和人耳掩蔽效應(yīng)等方法應(yīng)用到變換域算法中，進(jìn)一步提高了變換域算法的性能。

盡管當(dāng)前水印算法已經(jīng)獲得了很好的魯棒性和不可感知性，但是多數(shù)算法對(duì)水印嵌入容量問題考慮較少。如何設(shè)計(jì)算法使得水印在魯棒性、不可感知性和嵌入容量三者之間達(dá)到最佳的平衡依然需要做進(jìn)一步的研究和探索。此外，大多數(shù)算法根據(jù)一般經(jīng)驗(yàn)和實(shí)驗(yàn)效果選擇將水印嵌入在整個(gè)音頻段的固定頻率點(diǎn)，嵌入位置不是自適應(yīng)的。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明所要解決的技術(shù)問題是提供了一種魯棒性和透明性好、隱藏容量大的基于聽覺模型的自適應(yīng)音頻盲水印方法。

本發(fā)明所采用的技術(shù)方案是：一種基于聽覺模型的自適應(yīng)音頻盲水印方法，包括如下步驟：

1)對(duì)水印信號(hào)進(jìn)行Arnold變換、降維處理和混沌變換，得到水印信息w：

w＝{w(i),0≤i≤M×N}；

其中，w(i)表示加密后的水印序列，M×N表示水印序列總數(shù)；

2)計(jì)算人耳聽覺掩蔽閾值；

3)自適應(yīng)選取水印嵌入段和嵌入位置：

將水印信息嵌入到頻域系數(shù)X(jw)的中、低頻系數(shù)中，計(jì)算每個(gè)子帶中能量值S_pz(z)低于掩蔽閾值T_hr(z)的中、低頻頻率分量的總數(shù)，選擇頻率分量總數(shù)高于所設(shè)門限值T的音頻段作為水印嵌入段，將能量值小于掩蔽閾值的頻率分量從大到小進(jìn)行排序，選取前L位頻率分量F_k＝{f_k(i),1≤i≤L}進(jìn)行水印嵌入；

4)進(jìn)行數(shù)字水印的嵌入

采用量化索引調(diào)制的方法將L位水印嵌入到所選頻域系數(shù)中，對(duì)嵌入水印后的音頻段做逆離散余弦變換和逆離散小波包變換，小波包逆變換后的音頻信號(hào)表示為A^*(k)，用A^*(k)代替A(k)完成一段音頻信號(hào)的水印嵌入。然后，繼續(xù)在滿足條件的下一段載體音頻中嵌入水印，直至實(shí)現(xiàn)所有的水印嵌入；

5)進(jìn)行音頻段重組

將所有未嵌入水印的音頻段和嵌入水印的音頻段進(jìn)行重組，組合成含有全部水印的音頻信號(hào)；

6)提取數(shù)字水印，包括：

(1)采用步驟2)的方法對(duì)含水印音頻信號(hào)進(jìn)行分段處理和小波包變換，并計(jì)算每一段音頻信號(hào)的聽覺掩蔽閾值；

(2)采用步驟3)的方法找到水印嵌入段和嵌入位置；

(3)采用如下公式提取水印序列：

式中f_k^*(i)是第k段待測(cè)音頻信號(hào)的頻域系數(shù)，△^*是第k段待測(cè)音頻信號(hào)的量化步長(zhǎng)；

(4)對(duì)提取的水印序列進(jìn)行升維、逆Arnold變換和Logistic解密操作，得到最終的水印圖像。

驟2)包括：

(1)設(shè)原始音頻信號(hào)為A＝{a(i),1≤i<N}，N為采樣點(diǎn)個(gè)數(shù)，a(i)為音頻信號(hào)，對(duì)音頻信號(hào)進(jìn)行分段處理，每段包含2048個(gè)采樣點(diǎn)，設(shè)第k段原始音頻信號(hào)表示為A(k)，采用db8小波基對(duì)每一段音頻信號(hào)進(jìn)行8級(jí)小波包變換，將0～22kHz的頻帶劃分為26個(gè)非等寬的子帶；

(2)對(duì)每個(gè)子帶的小波包系數(shù)進(jìn)行離散余弦變換，得到頻域系數(shù)X(jw)：

X(jw)＝DCT(w_i(k))

其中，w_i(k)表示小波包分解后第i個(gè)子帶中的第k個(gè)小波包系數(shù)，X(jw)表示DCT變換后的頻域系數(shù)；

(3)將頻域系數(shù)X(jw)映射到巴克域：

z＝round{13arctan(0.76f/1000)+3.5arctan[(f/7500)²]}，

其中，f表示頻率，z表示巴克域各子帶編號(hào)，

計(jì)算各個(gè)子帶的能量值S_pz(z)：

其中，|X(jw)|²表示臨界頻帶對(duì)應(yīng)采樣點(diǎn)的功率值，h_bz和l_bz分別表示各子帶的上下邊界頻率；

(4)將各個(gè)子帶的能量值S_pz(z)調(diào)整為S_m(z)＝S_pz(z)×B(z)，

其中B(z)為擴(kuò)展函數(shù)，B(z)＝15.91+7.5(z+0.474)+17.5[1+(z+0.474)²]^1/2；

(5)計(jì)算每個(gè)子帶的噪聲特性因子a(z)：a(z)＝min[10lg(G/A)/S_max,1]

其中，A為功率譜的算術(shù)平均值，G為功率譜的幾何平均值，當(dāng)音頻信號(hào)為純音時(shí)，a(z)＝1；白噪聲時(shí)，a(z)＝0；考慮噪聲特性因子后的掩蔽閾值修正值為O(z)：O(z)＝(14.5+z)a+5.5(1-a)；

計(jì)算每個(gè)子帶的實(shí)際掩蔽閾值T(z)：求實(shí)際掩蔽閾值T(z)與子帶樣點(diǎn)個(gè)數(shù)的商，并將所述的商與絕對(duì)掩蔽閾值進(jìn)行比較，將二者中值大的作為最終的掩蔽閾值T_hr(z)：T_hr(z)＝max(T,TH)。

步驟4)包括：

設(shè)第k段音頻信號(hào)量化后的頻域系數(shù)表示為F_k＝{f_k^*(i),1≤i≤L}，量化規(guī)則為：

式中，w是水印信息，f_k^*(i)是第k段音頻信號(hào)量化后的系數(shù)，f_k(i)是原始音頻的頻域系數(shù)，△是量化步長(zhǎng)，根據(jù)量化原理，最大量化誤差為0.5△。

根據(jù)權(quán)利要求3所述的一種基于聽覺模型的自適應(yīng)音頻盲水印方法，其特征在于，所述的量化步長(zhǎng)，是根據(jù)噪聲掩蔽比為每一個(gè)臨界子帶確定一個(gè)量化步長(zhǎng)，

本發(fā)明的一種基于聽覺模型的自適應(yīng)音頻盲水印方法，將水印嵌入在DWPT和DCT的混合域，利用掩蔽閾值確定水印嵌入段和具體嵌入位置。根據(jù)噪聲掩蔽比對(duì)水印嵌入強(qiáng)度進(jìn)行了調(diào)制，保證水印信號(hào)不影響音頻質(zhì)量的前提下嵌入較大能量的水印信息，實(shí)現(xiàn)了水印嵌入段、水印嵌入位置和水印嵌入強(qiáng)度的自適應(yīng)選取，在保證算法不可感知性的同時(shí)提高了水印魯棒性和水印嵌入容量。本發(fā)明更為精細(xì)的利用了人耳聽覺特性，具有更好的隱藏性能。對(duì)于數(shù)字水印，采用Logistic加密，同時(shí)結(jié)合Arnold變換實(shí)現(xiàn)了水印雙重加密，進(jìn)一步保證了水印的安全性。實(shí)驗(yàn)表明本發(fā)明所提算法不僅具有較好的不可感知性和較大的水印容量，而且能夠有效抵抗常見信號(hào)處理的攻擊，具有很好的魯棒性。

附圖說明

圖1是本發(fā)明一種基于聽覺模型的自適應(yīng)音頻盲水印方法的流程圖；

圖2是本發(fā)明實(shí)施例原始音頻信號(hào)波形圖；

圖3是本發(fā)明實(shí)施例含水印音頻信號(hào)波形圖；

圖4是本發(fā)明實(shí)施例含水印音頻信號(hào)與原始音頻信號(hào)差值波形圖。

具體實(shí)施方式

下面結(jié)合實(shí)施例和附圖對(duì)本發(fā)明的一種基于聽覺模型的自適應(yīng)音頻盲水印方法做出詳細(xì)說明。

如圖1所示，本發(fā)明的一種基于聽覺模型的自適應(yīng)音頻盲水印方法，包括如下步驟：

1)對(duì)水印信號(hào)進(jìn)行Arnold變換、降維處理和混沌變換，得到水印信息w。

設(shè)M₀是原始水印信號(hào)，表示為M₀＝{m₀(i,j),0≤i<M,0≤j<N}。其中，m₀(i,j)∈{0,1}表示二值水印圖像的象素灰度值。為消除水印圖像的空間相關(guān)性，我們將水印作Arnold置亂，表示為M₁＝{m₁(i,j),0≤i<M,0≤j<N}。經(jīng)Arnold變換后，即使部分水印受到攻擊，依然能夠提取出整個(gè)水印輪廓。此外，如果不知道Arnold變換的次數(shù)，即使攻擊者提取出水印也無(wú)法恢復(fù)出水印圖像，從而增強(qiáng)了水印的安全性。由于音頻信號(hào)是一維信號(hào)，還需要對(duì)Arnold置亂后的水印序列進(jìn)行降維處理V＝{v(k)＝m₁(i,j),1≤i≤M,1≤j≤N,k＝(i-1)×N+j}。

為了進(jìn)一步提高水印的抗攻擊能力，本發(fā)明使用Logistic方程得到混沌序列，將此序列與降維后的圖像水印序列v(k)做異或運(yùn)算。經(jīng)Logistic加密后的水印表示為：

w＝{w(i),0≤i≤M×N}

其中，w(i)表示加密后的水印序列，M×N為水印序列總數(shù)。

本發(fā)明將混沌序列的初值、參數(shù)和Arnold變換次數(shù)作為秘鑰，在提取水印時(shí)利用這些秘鑰可以重新獲得水印序列。

2)計(jì)算人耳聽覺掩蔽閾值

人耳存在掩蔽效應(yīng)，當(dāng)存在能量相差一定程度的兩個(gè)或多個(gè)激勵(lì)聲音同時(shí)作用于人類聽覺系統(tǒng)時(shí)，弱音就會(huì)被強(qiáng)音掩蔽掉，變得不可感知，這種現(xiàn)象稱為同時(shí)掩蔽(或頻率掩蔽)效應(yīng)。當(dāng)水印能量被限制在掩蔽閾值以下時(shí)，就能保證水印的不可感知性。心理聲學(xué)模型中子帶劃分應(yīng)盡可能接近人耳臨界頻帶，而小波包分解的多分辨率特性滿足這個(gè)要求，所以本發(fā)明選擇在小波包域中計(jì)算掩蔽閾值。本發(fā)明采用了文獻(xiàn)[1]提出的一種簡(jiǎn)單的心理聲學(xué)模型，并在此基礎(chǔ)上進(jìn)行了改進(jìn)，將小波包變換引入了心理聲學(xué)模型，將整個(gè)頻帶劃分成26個(gè)不等寬的子帶，使得子帶帶寬接近人耳臨界頻帶帶寬。具體計(jì)算步驟如下：

(2)對(duì)每個(gè)子帶的小波包系數(shù)進(jìn)行離散余弦變換(DCT)，得到頻域系數(shù)X(jw)：

X(jw)＝DCT(w_i(k))

其中，w_i(k)表示小波包分解后第i個(gè)子帶中的第k個(gè)小波包系數(shù)，X(jw)表示DCT變換后的頻域系數(shù)；

(3)將頻域系數(shù)X(jw)映射到巴克(Bark)域：

z＝round{13arctan(0.76f/1000)+3.5arctan[(f/7500)²]}

其中，f表示頻率，z表示巴克(Bark)域各子帶編號(hào)。

計(jì)算各個(gè)子帶的能量值S_pz(z)：

其中|X(jw)|²表示臨界子帶對(duì)應(yīng)采樣點(diǎn)的功率值，h_bz和l_bz分別表示各子帶的上下邊界頻率。

(4)由人耳感知特性知，某個(gè)子帶內(nèi)的信號(hào)會(huì)受到相鄰子帶信號(hào)的影響，將各個(gè)子帶的能量值S_pz(z)調(diào)整為

S_m(z)＝S_pz(z)×B(z)

其中B(z)為擴(kuò)展函數(shù)，B(z)＝15.91+7.5(z+0.474)+17.5[1+(z+0.474)²]^1/2；

(5)掩蔽閾值的計(jì)算與音頻的噪聲特性有關(guān)，計(jì)算每個(gè)子帶的噪聲特性因子a(z)：

a(z)＝min[10lg(G/A)/S_max,1]

其中，A為功率譜的算術(shù)平均值，G為功率譜的幾何平均值，當(dāng)音頻信號(hào)為純音時(shí)，a(z)＝1；白噪聲時(shí)，a(z)＝0。

由人耳掩蔽效應(yīng)知，當(dāng)純音掩蔽噪聲時(shí)，掩蔽閾值大約下降14.5+zdb；當(dāng)噪聲掩蔽純音時(shí)，掩蔽閾值下降5.5db?？紤]噪聲特性因子后的掩蔽閾值修正值為：O(z)＝(14.5+z)a+5.5(1-a)

計(jì)算每個(gè)子帶的實(shí)際掩蔽閾值T(z)：求實(shí)際掩蔽閾值T(z)與子帶樣點(diǎn)個(gè)數(shù)的商，并將所述的商與絕對(duì)掩蔽閾值進(jìn)行比較，將二者中值大的作為最終的掩蔽閾值T_hr(z)：T_hr(z)＝max(T,TH)。本發(fā)明根據(jù)所求掩蔽閾值自適應(yīng)確定水印嵌入段、具體嵌入位置和水印嵌入強(qiáng)度。

3)根據(jù)聽覺掩蔽閾值自適應(yīng)選取水印嵌入段和嵌入位置：

音頻信號(hào)是非平穩(wěn)信號(hào)，每個(gè)音頻段對(duì)噪聲的敏感程度不同，如果水印嵌入在整個(gè)音頻段，勢(shì)必降低音頻信號(hào)的信噪比。為此，本發(fā)明提出一種水印嵌入段選擇方案來提高水印的性能。在確定水印嵌入位置上，已有算法大多根據(jù)人耳掩蔽效應(yīng)給出大致的嵌入范圍，沒有精確給出不容易被感知的頻率位置。本發(fā)明所提算法利用頻域掩蔽效應(yīng)來精確確定水印嵌入位置，具有更好的不可感知性。

根據(jù)聽覺模型,當(dāng)一幀音頻信號(hào)中可被掩蔽的頻率分量足夠多時(shí)，說明該音頻段噪聲敏感度低，可用來隱藏水印信息。由于中低頻系數(shù)集中了音頻信號(hào)的大部分能量，而常見音頻信號(hào)處理大多在高頻部分進(jìn)行(如壓縮、濾波等)。考慮到算法的魯棒性，本發(fā)明將水印信息嵌入到頻域系數(shù)X(jw)的中、低頻系數(shù)(第0～12Bark)中，計(jì)算每個(gè)子帶中能量值S_pz(z)低于掩蔽閾值T_hr(z)的中、低頻頻率分量的總數(shù)，選擇頻率分量總數(shù)高于所設(shè)門限值T的音頻段作為水印嵌入段，由頻域掩蔽效應(yīng)知：幅值越大的頻域系數(shù)，它兩側(cè)的頻率分量越容易被掩蔽。因此，本算法在選定音頻數(shù)據(jù)段后，將能量值小于掩蔽閾值的頻率分量從大到小進(jìn)行排序，選取前L位頻率分量F_k＝{f_k(i),1≤i≤L}進(jìn)行水印嵌入。

4)進(jìn)行數(shù)字水印的嵌入

采用量化索引調(diào)制的方法將水印嵌入到所選頻域系數(shù)中；包括：

設(shè)第k段音頻信號(hào)量化后的頻域系數(shù)表示為F_k＝{f_k^*(i),1≤i≤L}，量化規(guī)則為：

這里，量化步長(zhǎng)的選取關(guān)系算法的不可感知性和魯棒性，量化步長(zhǎng)越小不可感知性越好，但降低了魯棒性；量化步長(zhǎng)越大抗攻擊能力越強(qiáng)，但不可感知性越差。本發(fā)明利用心理聲學(xué)模型的噪聲掩蔽比為每一個(gè)臨界子帶自適應(yīng)確定水印嵌入強(qiáng)度。

文獻(xiàn)[2]通過對(duì)嵌入水印的音頻信號(hào)設(shè)置不同的噪聲掩蔽比，分析了嵌入水印對(duì)音頻質(zhì)量的影響。實(shí)驗(yàn)結(jié)果證明如果嵌入水印后的音頻噪聲掩蔽比NMR小于等于-5db，則音頻失真將是不可感知的?；诖耍景l(fā)明設(shè)計(jì)了一種根據(jù)噪聲掩蔽比自適應(yīng)確定水印嵌入強(qiáng)度的方法。

所述的量化步長(zhǎng)，是根據(jù)噪聲掩蔽比為每一個(gè)臨界子帶確定一個(gè)量化步長(zhǎng)，本發(fā)明中臨界子帶的量化噪聲由該子帶內(nèi)的頻帶引入量化噪聲的最大值確定，每個(gè)臨界子帶的噪聲掩蔽比為：

NMR(i)＝E_ns(i)-T_hr(i)

其中，i表示臨界子帶號(hào)，j表示嵌入水印的頻率點(diǎn)。E_ns(i)和NMR(i)分別表示第i個(gè)臨界子帶的噪聲和噪聲掩蔽比。E₀(i,j)為原始音頻信號(hào)能量，E_w(i,j)為含水印音頻信號(hào)能量，T_hr(i)為第i個(gè)臨界子帶的掩蔽閾值。根據(jù)量化策略，每個(gè)系數(shù)的量化誤差不超過△/2，即e_q∈[0,△/2)。

由于|f_k^*-f_k|≤△/2，則有E_ns≤△²/4，為使得臨界子帶內(nèi)信號(hào)的失真不被人耳感知，需滿足據(jù)此可得出水印量化步長(zhǎng)滿足本發(fā)明取

由上式可知，水印嵌入強(qiáng)度隨掩蔽閾值的變化而變化。掩蔽閾值越大，越容易掩蔽噪聲，所以可以有較大的量化步長(zhǎng)，從而實(shí)現(xiàn)了水印嵌入強(qiáng)度與掩蔽效應(yīng)的自適應(yīng)性。

重復(fù)上述過程直到L位水印信息全部嵌入后，對(duì)嵌入水印的音頻段頻域系數(shù)作做逆離散余弦變換和離散小波包重構(gòu)，小波包逆變換后的音頻信號(hào)表示為A^*(k)，用A^*(k)代替A(k)完成一段音頻信號(hào)的水印嵌入。然后，繼續(xù)在滿足條件的下一段嵌入水印，直至實(shí)現(xiàn)所有的水印嵌入。

5)進(jìn)行音頻段重組

將所有未嵌入水印的音頻段和嵌入水印的音頻段進(jìn)行重組，組合成含有全部水印的音頻信號(hào)。

6)提取數(shù)字水印，本發(fā)明采用的數(shù)字水印提取方法是一種盲水印算法，即水印提取過程不需要原始音頻載體。包括：

(1)采用步驟2)的方法對(duì)含水印音頻信號(hào)進(jìn)行分段處理和小波包變換，并計(jì)算每一段音頻信號(hào)的聽覺掩蔽閾值；

(2)采用步驟3)的方法找到水印嵌入段和嵌入位置，由于水印對(duì)宿主信號(hào)的影響較小，使得水印嵌入前后的掩蔽閾值誤差基本可以忽略；

(3)采用如下公式提取水印序列：

式中f_k^*(i)是第k段待測(cè)音頻信號(hào)的頻域系數(shù)，△^*是第k段待測(cè)音頻信號(hào)的量化步長(zhǎng)；

(4)對(duì)提取的水印序列進(jìn)行升維、逆Arnold變換和Logistic解密操作，得到最終的水印圖像。

下面給出最佳實(shí)例：

1.選取40×40的二值圖像做為水印，對(duì)水印信號(hào)進(jìn)行Arnold變換、降維處理和混沌變換，得到水印信息w：

w＝{w(i),0≤i≤M×N}

其中，w(i)表示加密后的水印序列，M×N表示水印序列總數(shù)。

2.計(jì)算人耳聽覺掩蔽閾值；

表1小波包變換的子帶分解

(2)對(duì)每個(gè)子帶的小波包系數(shù)進(jìn)行離散余弦變換，得到頻域系數(shù)X(jw)：

X(jw)＝DCT(w_i(k))

其中，w_i(k)表示小波包分解后第i個(gè)子帶中的第k個(gè)小波包系數(shù)，X(jw)表示DCT變換后的頻域系數(shù)；

(3)將頻域系數(shù)X(jw)映射到巴克域：

z＝round{13arctan(0.76f/1000)+3.5arctan[(f/7500)²]}

其中，f表示頻率，z表示巴克域各子帶編號(hào)。

計(jì)算各個(gè)子帶的能量值S_pz(z)：

其中，|X(jw)|²表示臨界子帶對(duì)應(yīng)采樣點(diǎn)的功率值，h_bz和l_bz分別表示各子帶的上下邊界頻率；

(4)將各個(gè)子帶的能量值S_pz(z)調(diào)整為S_m(z)＝S_pz(z)×B(z)，

其中B(z)為擴(kuò)展函數(shù)，B(z)＝15.91+7.5(z+0.474)+17.5[1+(z+0.474)²]^1/2；

(5)計(jì)算每個(gè)子帶的噪聲特性因子a(z)：a(z)＝min[10lg(G/A)/S_max,1]

其中，A為功率譜的算術(shù)平均值，G為功率譜的幾何平均值，當(dāng)音頻信號(hào)為純音時(shí)，a(z)＝1；白噪聲時(shí)，a(z)＝0；考慮噪聲特性因子后的掩蔽閾值修正值為：

O(z)＝(14.5+z)a+5.5(1-a)。

3.根據(jù)掩蔽閾值自適應(yīng)選取水印嵌入段和嵌入位置：

將水印信息嵌入到頻域系數(shù)X(jw)的中、低頻系數(shù)中，計(jì)算每個(gè)子帶中能量值S_pz(z)低于掩蔽閾值T_hr(z)的中、低頻頻率分量的總數(shù)，選擇頻率分量總數(shù)高于61的音頻段作為水印嵌入段，將能量值小于掩蔽閾值的頻率分量從大到小進(jìn)行排序，選取前46位頻率分量F_k＝{f_k(i),1≤i≤L}進(jìn)行水印嵌入。

4.進(jìn)行數(shù)字水印的嵌入

采用量化索引調(diào)制的方法將46位水印嵌入到所選頻域系數(shù)中，設(shè)第k段音頻信號(hào)量化后的頻域系數(shù)表示為F_k＝{f_k^*(i),1≤i≤L}，量化規(guī)則為：

本發(fā)明利用心理聲學(xué)模型的噪聲掩蔽比為每一個(gè)臨界子帶自適應(yīng)確定水印嵌入強(qiáng)度，量化步長(zhǎng)取

對(duì)嵌入水印后的音頻段做逆離散余弦變換和逆離散小波包變換，小波包逆變換后的音頻信號(hào)表示為A^*(k)，用A^*(k)代替A(k)完成一段音頻信號(hào)的水印嵌入。然后，繼續(xù)在滿足條件的下一段音頻信號(hào)中嵌入水印，直至實(shí)現(xiàn)所有的水印嵌入。

5.進(jìn)行音頻段重組

將所有未嵌入水印的音頻段和嵌入水印的音頻段進(jìn)行重組，組合成含有全部水印的音頻信號(hào)。

6.提取數(shù)字水印，包括：

(1)采用步驟2的方法對(duì)含水印音頻信號(hào)進(jìn)行分段處理和小波包變換，并計(jì)算每一段音頻信號(hào)的聽覺掩蔽閾值；

(2)采用步驟3的方法找到水印嵌入段和嵌入位置；

(3)采用如下公式提取水印序列：

式中f_k^*(i)是第k段待測(cè)音頻信號(hào)的頻域系數(shù)，△^*是第k段待測(cè)音頻信號(hào)的量化步長(zhǎng)；

(4)對(duì)提取的水印序列進(jìn)行升維、逆Arnold變換和Logistic解密操作，得到最終的水印圖像。

為了測(cè)試本發(fā)明的性能，選取了三種不同類型的載體音頻文件分別為流行音樂、古典音樂和搖滾音樂，它們的采樣頻率均為44.1kHz；量化精度為16位；格式為單聲道。以流行音樂為例，圖2、圖3、圖4分別是原始音頻信號(hào)、含水印音頻信號(hào)和二者的差值信號(hào)的波形圖。由圖可見，含水印的音頻信號(hào)波形圖與原始音頻信號(hào)波形圖之間差異很小。水印嵌入后基本察覺不到音頻質(zhì)量的失真。為了更好的評(píng)價(jià)本方法性能,我們將本發(fā)明提出的基于DWPT-DCT的水印方法與傳統(tǒng)的基于心理聲學(xué)模型的水印方法和當(dāng)前流行的DWT-SVD方法，從不可感知性、水印容量和魯棒性三個(gè)方面進(jìn)行了比較。

(1)不可感知性對(duì)比

本發(fā)明采用信噪比和平均分段信噪比來評(píng)價(jià)水印對(duì)宿主信號(hào)的影響。定義如下：

其中S'(i)為嵌入水印后的系數(shù)，S(i)為原始音頻信號(hào)系數(shù)，K為水印嵌入所需音頻幀數(shù)，N為一幀音頻信號(hào)包含的采樣點(diǎn)個(gè)數(shù)。SegSNR表示每幀含水印音頻信號(hào)的信噪比均值，相比SNR，SegSNR能夠更好的反映水印信息對(duì)原始音頻信號(hào)的影響。由公式可知，頻域系數(shù)的改變量決定了信噪比。設(shè)某個(gè)頻域系數(shù)的修改增量為e，其引入的噪聲能量為e²，根據(jù)量化原理，系數(shù)的量化噪聲是均勻分布的，它的期望值設(shè)某幀音頻信號(hào)的能量為E_g，我們可以據(jù)此來估計(jì)嵌入水印幀的信噪比上限為：

聯(lián)立量化步長(zhǎng)的求解公式，可得嵌入水印的每幀音頻信噪比上限為：

SNR≤10lg{4E_g/(T_hr·L)}+5

針對(duì)流行音樂、古典音樂、搖滾音樂三種音樂類型，實(shí)測(cè)的信噪比分別為34.23db，29.62db，32.81db；分段信噪比均值分別為32.58db，28.26db，30.95db。實(shí)驗(yàn)表明本方法所得分段信噪比均在理論上限值之下，并且大于20db。本發(fā)明信噪比平均高于文獻(xiàn)[3]7～8db，高于文獻(xiàn)[4]1～4db。

(2)水印容量分析

水印嵌入容量的計(jì)算公式為其中，N_w＝40×40，它表示嵌入的水印量，T為水印嵌入完成所需要的時(shí)間。水印嵌入率為100％時(shí)，不同類型音頻載體的水印嵌入容量分別為流行音樂(689.5bps)，古典音樂(576.7bps)，搖滾音樂(668.9bps)。文獻(xiàn)[3]在1600個(gè)采樣點(diǎn)中嵌入1bit水印信息，水印嵌入容量只有27.56bps。文獻(xiàn)[4]在512個(gè)采樣點(diǎn)中嵌入8bit水印，水印嵌入容量為689.06bps，相比之下本發(fā)明水印嵌入容量遠(yuǎn)遠(yuǎn)高于文獻(xiàn)[3]提出的方法，與文獻(xiàn)[4]提出的方法嵌入容量相當(dāng)。

(3)水印魯棒性分析

為了測(cè)試水印抵抗常見信號(hào)處理的攻擊能力，本發(fā)明對(duì)嵌入水印的音頻信號(hào)做如下處理：(1)疊加噪聲：對(duì)數(shù)字音頻信號(hào)在時(shí)域中加入高斯白噪聲，信噪比為20db。(2)重采樣：先下采樣至22.05kHz，再上采樣至44.1kHz。(3)重量化：先將音頻信號(hào)從16bit量化為8bit，再?gòu)?bit量化為16bit。(4)mp3音頻壓縮：先對(duì)音頻信號(hào)進(jìn)行壓縮，再解壓縮(比特率為128kbps)。(5)低通濾波，截止頻率為8kHz。本發(fā)明比較了所提方法與文獻(xiàn)[3]和[4]對(duì)常見信號(hào)處理與攻擊的抵抗能力，對(duì)三種方法選取相同的宿主音樂(流行音樂)和水印圖像，在滿足水印不被感知的條件下測(cè)得它們的NC值如表3所示。由表可知，本發(fā)明與文獻(xiàn)[4]水印容量相當(dāng)?shù)那闆r下具有更好的魯棒性。盡管本發(fā)明在水印容量上要遠(yuǎn)遠(yuǎn)高于文獻(xiàn)[3]，但是水印魯棒性并不差于文獻(xiàn)[3]。

表2不同音樂類型的抗攻擊能力

表3不同方法的抗攻擊能力

相關(guān)文獻(xiàn)如下：

1、Johnston J D.Transform coding of audio signals using perceptual noise criteria[J].IEEE Journal on Selected Areas in Communications,1988,6(2):314-323.

2、Arnold M.Quality evaluation of watermarked audio tracks[J].Proceedings of SPIE-The International Society for Optical Engineering,2002,4675:91-101.

3、Cai Y M,Guo W Q,Ding H Y.An audio blind watermarking scheme based on DWT-SVD[J].Journal of Software,2013,8(7).1801-1808.

4、李榕,王宏霞,趙鵬君.基于心理聲學(xué)模型的自適應(yīng)音頻數(shù)字水印算法[C].全國(guó)信息隱藏暨多媒體信息安全學(xué)術(shù)大.2010.

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3