本發(fā)明涉及信息隱藏領(lǐng)域。特別是涉及一種用于音頻作品版權(quán)管理的基于聽覺模型的自適應(yīng)音頻盲水印方法。
背景技術(shù):
信息技術(shù)和計(jì)算機(jī)網(wǎng)絡(luò)的快速發(fā)展引發(fā)了一系列信息安全問題、盜版問題等,使得多媒體內(nèi)容的版權(quán)保護(hù)和內(nèi)容認(rèn)證成為了亟待解決的問題。數(shù)字水印技術(shù)作為一種有效的解決方案獲得了迅速的發(fā)展,并且已經(jīng)成為學(xué)術(shù)界的一個(gè)研究熱點(diǎn)。由于人耳具有更高的靈敏度,使得音頻水印技術(shù)相比視頻和圖像水印技術(shù)具有更大的挑戰(zhàn)。音頻水印技術(shù)就是將一種特殊的標(biāo)志信息嵌入到原始數(shù)字音頻作品中,用以辨識(shí)音頻作品的版權(quán)和合法使用者,從而達(dá)到音頻作品版權(quán)保護(hù)的作用。音頻水印技術(shù)需要滿足三個(gè)基本要求,即水印的不可感知性、魯棒性和水印容量,三者之間是相互矛盾的。如何設(shè)計(jì)方法,使得三者之間達(dá)到最佳的平衡一直是音頻水印技術(shù)的一個(gè)難點(diǎn)。當(dāng)前,數(shù)字水印技術(shù)大致可以分為兩種不同的類型,包括時(shí)間域水印嵌入方法和變換域水印嵌入方法。早期的方法選擇嵌入在時(shí)域部分。它的特點(diǎn)是算法簡(jiǎn)單,易于實(shí)現(xiàn),但魯棒性和不可感知性較差。當(dāng)前主流的音頻水印算法是變換域算法,變換域算法在嵌入水印前需要將音頻載體信號(hào)從時(shí)域變換到頻域。由于變換域算法考慮了音頻載體特性和人耳聽覺特性,具有比時(shí)域算法更好的魯棒性和不可感知性。而對(duì)于音頻這樣的時(shí)變信號(hào),利用小波分析的多分辨率特性和時(shí)頻局部特性,相比其他變換域算法具有更好的魯棒性,已經(jīng)成為音頻水印算法的研究熱點(diǎn)。近年來有不少學(xué)者將壓縮感知、奇異值分解、量化索引調(diào)制、神經(jīng)網(wǎng)絡(luò)和人耳掩蔽效應(yīng)等方法應(yīng)用到變換域算法中,進(jìn)一步提高了變換域算法的性能。
盡管當(dāng)前水印算法已經(jīng)獲得了很好的魯棒性和不可感知性,但是多數(shù)算法對(duì)水印嵌入容量問題考慮較少。如何設(shè)計(jì)算法使得水印在魯棒性、不可感知性和嵌入容量三者之間達(dá)到最佳的平衡依然需要做進(jìn)一步的研究和探索。此外,大多數(shù)算法根據(jù)一般經(jīng)驗(yàn)和實(shí)驗(yàn)效果選擇將水印嵌入在整個(gè)音頻段的固定頻率點(diǎn),嵌入位置不是自適應(yīng)的。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是提供了一種魯棒性和透明性好、隱藏容量大的基于聽覺模型的自適應(yīng)音頻盲水印方法。
本發(fā)明所采用的技術(shù)方案是:一種基于聽覺模型的自適應(yīng)音頻盲水印方法,包括如下步驟:
1)對(duì)水印信號(hào)進(jìn)行Arnold變換、降維處理和混沌變換,得到水印信息w:
w={w(i),0≤i≤M×N};
其中,w(i)表示加密后的水印序列,M×N表示水印序列總數(shù);
2)計(jì)算人耳聽覺掩蔽閾值;
3)自適應(yīng)選取水印嵌入段和嵌入位置:
將水印信息嵌入到頻域系數(shù)X(jw)的中、低頻系數(shù)中,計(jì)算每個(gè)子帶中能量值Spz(z)低于掩蔽閾值Thr(z)的中、低頻頻率分量的總數(shù),選擇頻率分量總數(shù)高于所設(shè)門限值T的音頻段作為水印嵌入段,將能量值小于掩蔽閾值的頻率分量從大到小進(jìn)行排序,選取前L位頻率分量Fk={fk(i),1≤i≤L}進(jìn)行水印嵌入;
4)進(jìn)行數(shù)字水印的嵌入
采用量化索引調(diào)制的方法將L位水印嵌入到所選頻域系數(shù)中,對(duì)嵌入水印后的音頻段做逆離散余弦變換和逆離散小波包變換,小波包逆變換后的音頻信號(hào)表示為A*(k),用A*(k)代替A(k)完成一段音頻信號(hào)的水印嵌入。然后,繼續(xù)在滿足條件的下一段載體音頻中嵌入水印,直至實(shí)現(xiàn)所有的水印嵌入;
5)進(jìn)行音頻段重組
將所有未嵌入水印的音頻段和嵌入水印的音頻段進(jìn)行重組,組合成含有全部水印的音頻信號(hào);
6)提取數(shù)字水印,包括:
(1)采用步驟2)的方法對(duì)含水印音頻信號(hào)進(jìn)行分段處理和小波包變換,并計(jì)算每一段音頻信號(hào)的聽覺掩蔽閾值;
(2)采用步驟3)的方法找到水印嵌入段和嵌入位置;
(3)采用如下公式提取水印序列:
式中fk*(i)是第k段待測(cè)音頻信號(hào)的頻域系數(shù),△*是第k段待測(cè)音頻信號(hào)的量化步長(zhǎng);
(4)對(duì)提取的水印序列進(jìn)行升維、逆Arnold變換和Logistic解密操作,得到最終的水印圖像。
驟2)包括:
(1)設(shè)原始音頻信號(hào)為A={a(i),1≤i<N},N為采樣點(diǎn)個(gè)數(shù),a(i)為音頻信號(hào),對(duì)音頻信號(hào)進(jìn)行分段處理,每段包含2048個(gè)采樣點(diǎn),設(shè)第k段原始音頻信號(hào)表示為A(k),采用db8小波基對(duì)每一段音頻信號(hào)進(jìn)行8級(jí)小波包變換,將0~22kHz的頻帶劃分為26個(gè)非等寬的子帶;
(2)對(duì)每個(gè)子帶的小波包系數(shù)進(jìn)行離散余弦變換,得到頻域系數(shù)X(jw):
X(jw)=DCT(wi(k))
其中,wi(k)表示小波包分解后第i個(gè)子帶中的第k個(gè)小波包系數(shù),X(jw)表示DCT變換后的頻域系數(shù);
(3)將頻域系數(shù)X(jw)映射到巴克域:
z=round{13arctan(0.76f/1000)+3.5arctan[(f/7500)2]},
其中,f表示頻率,z表示巴克域各子帶編號(hào),
計(jì)算各個(gè)子帶的能量值Spz(z):
其中,|X(jw)|2表示臨界頻帶對(duì)應(yīng)采樣點(diǎn)的功率值,hbz和lbz分別表示各子帶的上下邊界頻率;
(4)將各個(gè)子帶的能量值Spz(z)調(diào)整為Sm(z)=Spz(z)×B(z),
其中B(z)為擴(kuò)展函數(shù),B(z)=15.91+7.5(z+0.474)+17.5[1+(z+0.474)2]1/2;
(5)計(jì)算每個(gè)子帶的噪聲特性因子a(z):a(z)=min[10lg(G/A)/Smax,1]
其中,A為功率譜的算術(shù)平均值,G為功率譜的幾何平均值,當(dāng)音頻信號(hào)為純音時(shí),a(z)=1;白噪聲時(shí),a(z)=0;考慮噪聲特性因子后的掩蔽閾值修正值為O(z):O(z)=(14.5+z)a+5.5(1-a);
計(jì)算每個(gè)子帶的實(shí)際掩蔽閾值T(z):求實(shí)際掩蔽閾值T(z)與子帶樣點(diǎn)個(gè)數(shù)的商,并將所述的商與絕對(duì)掩蔽閾值進(jìn)行比較,將二者中值大的作為最終的掩蔽閾值Thr(z):Thr(z)=max(T,TH)。
步驟4)包括:
設(shè)第k段音頻信號(hào)量化后的頻域系數(shù)表示為Fk={fk*(i),1≤i≤L},量化規(guī)則為:
式中,w是水印信息,fk*(i)是第k段音頻信號(hào)量化后的系數(shù),fk(i)是原始音頻的頻域系數(shù),△是量化步長(zhǎng),根據(jù)量化原理,最大量化誤差為0.5△。
根據(jù)權(quán)利要求3所述的一種基于聽覺模型的自適應(yīng)音頻盲水印方法,其特征在于,所述的量化步長(zhǎng),是根據(jù)噪聲掩蔽比為每一個(gè)臨界子帶確定一個(gè)量化步長(zhǎng),
本發(fā)明的一種基于聽覺模型的自適應(yīng)音頻盲水印方法,將水印嵌入在DWPT和DCT的混合域,利用掩蔽閾值確定水印嵌入段和具體嵌入位置。根據(jù)噪聲掩蔽比對(duì)水印嵌入強(qiáng)度進(jìn)行了調(diào)制,保證水印信號(hào)不影響音頻質(zhì)量的前提下嵌入較大能量的水印信息,實(shí)現(xiàn)了水印嵌入段、水印嵌入位置和水印嵌入強(qiáng)度的自適應(yīng)選取,在保證算法不可感知性的同時(shí)提高了水印魯棒性和水印嵌入容量。本發(fā)明更為精細(xì)的利用了人耳聽覺特性,具有更好的隱藏性能。對(duì)于數(shù)字水印,采用Logistic加密,同時(shí)結(jié)合Arnold變換實(shí)現(xiàn)了水印雙重加密,進(jìn)一步保證了水印的安全性。實(shí)驗(yàn)表明本發(fā)明所提算法不僅具有較好的不可感知性和較大的水印容量,而且能夠有效抵抗常見信號(hào)處理的攻擊,具有很好的魯棒性。
附圖說明
圖1是本發(fā)明一種基于聽覺模型的自適應(yīng)音頻盲水印方法的流程圖;
圖2是本發(fā)明實(shí)施例原始音頻信號(hào)波形圖;
圖3是本發(fā)明實(shí)施例含水印音頻信號(hào)波形圖;
圖4是本發(fā)明實(shí)施例含水印音頻信號(hào)與原始音頻信號(hào)差值波形圖。
具體實(shí)施方式
下面結(jié)合實(shí)施例和附圖對(duì)本發(fā)明的一種基于聽覺模型的自適應(yīng)音頻盲水印方法做出詳細(xì)說明。
如圖1所示,本發(fā)明的一種基于聽覺模型的自適應(yīng)音頻盲水印方法,包括如下步驟:
1)對(duì)水印信號(hào)進(jìn)行Arnold變換、降維處理和混沌變換,得到水印信息w。
設(shè)M0是原始水印信號(hào),表示為M0={m0(i,j),0≤i<M,0≤j<N}。其中,m0(i,j)∈{0,1}表示二值水印圖像的象素灰度值。為消除水印圖像的空間相關(guān)性,我們將水印作Arnold置亂,表示為M1={m1(i,j),0≤i<M,0≤j<N}。經(jīng)Arnold變換后,即使部分水印受到攻擊,依然能夠提取出整個(gè)水印輪廓。此外,如果不知道Arnold變換的次數(shù),即使攻擊者提取出水印也無(wú)法恢復(fù)出水印圖像,從而增強(qiáng)了水印的安全性。由于音頻信號(hào)是一維信號(hào),還需要對(duì)Arnold置亂后的水印序列進(jìn)行降維處理V={v(k)=m1(i,j),1≤i≤M,1≤j≤N,k=(i-1)×N+j}。
為了進(jìn)一步提高水印的抗攻擊能力,本發(fā)明使用Logistic方程得到混沌序列,將此序列與降維后的圖像水印序列v(k)做異或運(yùn)算。經(jīng)Logistic加密后的水印表示為:
w={w(i),0≤i≤M×N}
其中,w(i)表示加密后的水印序列,M×N為水印序列總數(shù)。
本發(fā)明將混沌序列的初值、參數(shù)和Arnold變換次數(shù)作為秘鑰,在提取水印時(shí)利用這些秘鑰可以重新獲得水印序列。
2)計(jì)算人耳聽覺掩蔽閾值
人耳存在掩蔽效應(yīng),當(dāng)存在能量相差一定程度的兩個(gè)或多個(gè)激勵(lì)聲音同時(shí)作用于人類聽覺系統(tǒng)時(shí),弱音就會(huì)被強(qiáng)音掩蔽掉,變得不可感知,這種現(xiàn)象稱為同時(shí)掩蔽(或頻率掩蔽)效應(yīng)。當(dāng)水印能量被限制在掩蔽閾值以下時(shí),就能保證水印的不可感知性。心理聲學(xué)模型中子帶劃分應(yīng)盡可能接近人耳臨界頻帶,而小波包分解的多分辨率特性滿足這個(gè)要求,所以本發(fā)明選擇在小波包域中計(jì)算掩蔽閾值。本發(fā)明采用了文獻(xiàn)[1]提出的一種簡(jiǎn)單的心理聲學(xué)模型,并在此基礎(chǔ)上進(jìn)行了改進(jìn),將小波包變換引入了心理聲學(xué)模型,將整個(gè)頻帶劃分成26個(gè)不等寬的子帶,使得子帶帶寬接近人耳臨界頻帶帶寬。具體計(jì)算步驟如下:
(1)設(shè)原始音頻信號(hào)為A={a(i),1≤i<N},N為采樣點(diǎn)個(gè)數(shù),a(i)為音頻信號(hào),對(duì)音頻信號(hào)進(jìn)行分段處理,每段包含2048個(gè)采樣點(diǎn),設(shè)第k段原始音頻信號(hào)表示為A(k),采用db8小波基對(duì)每一段音頻信號(hào)進(jìn)行8級(jí)小波包變換,將0~22kHz的頻帶劃分為26個(gè)非等寬的子帶;
(2)對(duì)每個(gè)子帶的小波包系數(shù)進(jìn)行離散余弦變換(DCT),得到頻域系數(shù)X(jw):
X(jw)=DCT(wi(k))
其中,wi(k)表示小波包分解后第i個(gè)子帶中的第k個(gè)小波包系數(shù),X(jw)表示DCT變換后的頻域系數(shù);
(3)將頻域系數(shù)X(jw)映射到巴克(Bark)域:
z=round{13arctan(0.76f/1000)+3.5arctan[(f/7500)2]}
其中,f表示頻率,z表示巴克(Bark)域各子帶編號(hào)。
計(jì)算各個(gè)子帶的能量值Spz(z):
其中|X(jw)|2表示臨界子帶對(duì)應(yīng)采樣點(diǎn)的功率值,hbz和lbz分別表示各子帶的上下邊界頻率。
(4)由人耳感知特性知,某個(gè)子帶內(nèi)的信號(hào)會(huì)受到相鄰子帶信號(hào)的影響,將各個(gè)子帶的能量值Spz(z)調(diào)整為
Sm(z)=Spz(z)×B(z)
其中B(z)為擴(kuò)展函數(shù),B(z)=15.91+7.5(z+0.474)+17.5[1+(z+0.474)2]1/2;
(5)掩蔽閾值的計(jì)算與音頻的噪聲特性有關(guān),計(jì)算每個(gè)子帶的噪聲特性因子a(z):
a(z)=min[10lg(G/A)/Smax,1]
其中,A為功率譜的算術(shù)平均值,G為功率譜的幾何平均值,當(dāng)音頻信號(hào)為純音時(shí),a(z)=1;白噪聲時(shí),a(z)=0。
由人耳掩蔽效應(yīng)知,當(dāng)純音掩蔽噪聲時(shí),掩蔽閾值大約下降14.5+zdb;當(dāng)噪聲掩蔽純音時(shí),掩蔽閾值下降5.5db??紤]噪聲特性因子后的掩蔽閾值修正值為:O(z)=(14.5+z)a+5.5(1-a)
計(jì)算每個(gè)子帶的實(shí)際掩蔽閾值T(z):求實(shí)際掩蔽閾值T(z)與子帶樣點(diǎn)個(gè)數(shù)的商,并將所述的商與絕對(duì)掩蔽閾值進(jìn)行比較,將二者中值大的作為最終的掩蔽閾值Thr(z):Thr(z)=max(T,TH)。本發(fā)明根據(jù)所求掩蔽閾值自適應(yīng)確定水印嵌入段、具體嵌入位置和水印嵌入強(qiáng)度。
3)根據(jù)聽覺掩蔽閾值自適應(yīng)選取水印嵌入段和嵌入位置:
音頻信號(hào)是非平穩(wěn)信號(hào),每個(gè)音頻段對(duì)噪聲的敏感程度不同,如果水印嵌入在整個(gè)音頻段,勢(shì)必降低音頻信號(hào)的信噪比。為此,本發(fā)明提出一種水印嵌入段選擇方案來提高水印的性能。在確定水印嵌入位置上,已有算法大多根據(jù)人耳掩蔽效應(yīng)給出大致的嵌入范圍,沒有精確給出不容易被感知的頻率位置。本發(fā)明所提算法利用頻域掩蔽效應(yīng)來精確確定水印嵌入位置,具有更好的不可感知性。
根據(jù)聽覺模型,當(dāng)一幀音頻信號(hào)中可被掩蔽的頻率分量足夠多時(shí),說明該音頻段噪聲敏感度低,可用來隱藏水印信息。由于中低頻系數(shù)集中了音頻信號(hào)的大部分能量,而常見音頻信號(hào)處理大多在高頻部分進(jìn)行(如壓縮、濾波等)。考慮到算法的魯棒性,本發(fā)明將水印信息嵌入到頻域系數(shù)X(jw)的中、低頻系數(shù)(第0~12Bark)中,計(jì)算每個(gè)子帶中能量值Spz(z)低于掩蔽閾值Thr(z)的中、低頻頻率分量的總數(shù),選擇頻率分量總數(shù)高于所設(shè)門限值T的音頻段作為水印嵌入段,由頻域掩蔽效應(yīng)知:幅值越大的頻域系數(shù),它兩側(cè)的頻率分量越容易被掩蔽。因此,本算法在選定音頻數(shù)據(jù)段后,將能量值小于掩蔽閾值的頻率分量從大到小進(jìn)行排序,選取前L位頻率分量Fk={fk(i),1≤i≤L}進(jìn)行水印嵌入。
4)進(jìn)行數(shù)字水印的嵌入
采用量化索引調(diào)制的方法將水印嵌入到所選頻域系數(shù)中;包括:
設(shè)第k段音頻信號(hào)量化后的頻域系數(shù)表示為Fk={fk*(i),1≤i≤L},量化規(guī)則為:
式中,w是水印信息,fk*(i)是第k段音頻信號(hào)量化后的系數(shù),fk(i)是原始音頻的頻域系數(shù),△是量化步長(zhǎng),根據(jù)量化原理,最大量化誤差為0.5△。
這里,量化步長(zhǎng)的選取關(guān)系算法的不可感知性和魯棒性,量化步長(zhǎng)越小不可感知性越好,但降低了魯棒性;量化步長(zhǎng)越大抗攻擊能力越強(qiáng),但不可感知性越差。本發(fā)明利用心理聲學(xué)模型的噪聲掩蔽比為每一個(gè)臨界子帶自適應(yīng)確定水印嵌入強(qiáng)度。
文獻(xiàn)[2]通過對(duì)嵌入水印的音頻信號(hào)設(shè)置不同的噪聲掩蔽比,分析了嵌入水印對(duì)音頻質(zhì)量的影響。實(shí)驗(yàn)結(jié)果證明如果嵌入水印后的音頻噪聲掩蔽比NMR小于等于-5db,則音頻失真將是不可感知的?;诖耍景l(fā)明設(shè)計(jì)了一種根據(jù)噪聲掩蔽比自適應(yīng)確定水印嵌入強(qiáng)度的方法。
所述的量化步長(zhǎng),是根據(jù)噪聲掩蔽比為每一個(gè)臨界子帶確定一個(gè)量化步長(zhǎng),本發(fā)明中臨界子帶的量化噪聲由該子帶內(nèi)的頻帶引入量化噪聲的最大值確定,每個(gè)臨界子帶的噪聲掩蔽比為:
NMR(i)=Ens(i)-Thr(i)
其中,i表示臨界子帶號(hào),j表示嵌入水印的頻率點(diǎn)。Ens(i)和NMR(i)分別表示第i個(gè)臨界子帶的噪聲和噪聲掩蔽比。E0(i,j)為原始音頻信號(hào)能量,Ew(i,j)為含水印音頻信號(hào)能量,Thr(i)為第i個(gè)臨界子帶的掩蔽閾值。根據(jù)量化策略,每個(gè)系數(shù)的量化誤差不超過△/2,即eq∈[0,△/2)。
由于|fk*-fk|≤△/2,則有Ens≤△2/4,為使得臨界子帶內(nèi)信號(hào)的失真不被人耳感知,需滿足據(jù)此可得出水印量化步長(zhǎng)滿足本發(fā)明取
由上式可知,水印嵌入強(qiáng)度隨掩蔽閾值的變化而變化。掩蔽閾值越大,越容易掩蔽噪聲,所以可以有較大的量化步長(zhǎng),從而實(shí)現(xiàn)了水印嵌入強(qiáng)度與掩蔽效應(yīng)的自適應(yīng)性。
重復(fù)上述過程直到L位水印信息全部嵌入后,對(duì)嵌入水印的音頻段頻域系數(shù)作做逆離散余弦變換和離散小波包重構(gòu),小波包逆變換后的音頻信號(hào)表示為A*(k),用A*(k)代替A(k)完成一段音頻信號(hào)的水印嵌入。然后,繼續(xù)在滿足條件的下一段嵌入水印,直至實(shí)現(xiàn)所有的水印嵌入。
5)進(jìn)行音頻段重組
將所有未嵌入水印的音頻段和嵌入水印的音頻段進(jìn)行重組,組合成含有全部水印的音頻信號(hào)。
6)提取數(shù)字水印,本發(fā)明采用的數(shù)字水印提取方法是一種盲水印算法,即水印提取過程不需要原始音頻載體。包括:
(1)采用步驟2)的方法對(duì)含水印音頻信號(hào)進(jìn)行分段處理和小波包變換,并計(jì)算每一段音頻信號(hào)的聽覺掩蔽閾值;
(2)采用步驟3)的方法找到水印嵌入段和嵌入位置,由于水印對(duì)宿主信號(hào)的影響較小,使得水印嵌入前后的掩蔽閾值誤差基本可以忽略;
(3)采用如下公式提取水印序列:
式中fk*(i)是第k段待測(cè)音頻信號(hào)的頻域系數(shù),△*是第k段待測(cè)音頻信號(hào)的量化步長(zhǎng);
(4)對(duì)提取的水印序列進(jìn)行升維、逆Arnold變換和Logistic解密操作,得到最終的水印圖像。
下面給出最佳實(shí)例:
1.選取40×40的二值圖像做為水印,對(duì)水印信號(hào)進(jìn)行Arnold變換、降維處理和混沌變換,得到水印信息w:
w={w(i),0≤i≤M×N}
其中,w(i)表示加密后的水印序列,M×N表示水印序列總數(shù)。
2.計(jì)算人耳聽覺掩蔽閾值;
(1)設(shè)原始音頻信號(hào)為A={a(i),1≤i<N},N為采樣點(diǎn)個(gè)數(shù),a(i)為音頻信號(hào),對(duì)音頻信號(hào)進(jìn)行分段處理,每段包含2048個(gè)采樣點(diǎn),設(shè)第k段原始音頻信號(hào)表示為A(k),采用db8小波基對(duì)每一段音頻信號(hào)進(jìn)行8級(jí)小波包變換,將0~22kHz的頻帶劃分為26個(gè)非等寬的子帶;表1所示為每個(gè)子帶對(duì)應(yīng)的小波包系數(shù)節(jié)點(diǎn)和頻率邊界值。由表可知子帶帶寬接近人耳臨界頻帶帶寬。
表1小波包變換的子帶分解
(2)對(duì)每個(gè)子帶的小波包系數(shù)進(jìn)行離散余弦變換,得到頻域系數(shù)X(jw):
X(jw)=DCT(wi(k))
其中,wi(k)表示小波包分解后第i個(gè)子帶中的第k個(gè)小波包系數(shù),X(jw)表示DCT變換后的頻域系數(shù);
(3)將頻域系數(shù)X(jw)映射到巴克域:
z=round{13arctan(0.76f/1000)+3.5arctan[(f/7500)2]}
其中,f表示頻率,z表示巴克域各子帶編號(hào)。
計(jì)算各個(gè)子帶的能量值Spz(z):
其中,|X(jw)|2表示臨界子帶對(duì)應(yīng)采樣點(diǎn)的功率值,hbz和lbz分別表示各子帶的上下邊界頻率;
(4)將各個(gè)子帶的能量值Spz(z)調(diào)整為Sm(z)=Spz(z)×B(z),
其中B(z)為擴(kuò)展函數(shù),B(z)=15.91+7.5(z+0.474)+17.5[1+(z+0.474)2]1/2;
(5)計(jì)算每個(gè)子帶的噪聲特性因子a(z):a(z)=min[10lg(G/A)/Smax,1]
其中,A為功率譜的算術(shù)平均值,G為功率譜的幾何平均值,當(dāng)音頻信號(hào)為純音時(shí),a(z)=1;白噪聲時(shí),a(z)=0;考慮噪聲特性因子后的掩蔽閾值修正值為:
O(z)=(14.5+z)a+5.5(1-a)。
計(jì)算每個(gè)子帶的實(shí)際掩蔽閾值T(z):求實(shí)際掩蔽閾值T(z)與子帶樣點(diǎn)個(gè)數(shù)的商,并將所述的商與絕對(duì)掩蔽閾值進(jìn)行比較,將二者中值大的作為最終的掩蔽閾值Thr(z):Thr(z)=max(T,TH)。
3.根據(jù)掩蔽閾值自適應(yīng)選取水印嵌入段和嵌入位置:
將水印信息嵌入到頻域系數(shù)X(jw)的中、低頻系數(shù)中,計(jì)算每個(gè)子帶中能量值Spz(z)低于掩蔽閾值Thr(z)的中、低頻頻率分量的總數(shù),選擇頻率分量總數(shù)高于61的音頻段作為水印嵌入段,將能量值小于掩蔽閾值的頻率分量從大到小進(jìn)行排序,選取前46位頻率分量Fk={fk(i),1≤i≤L}進(jìn)行水印嵌入。
4.進(jìn)行數(shù)字水印的嵌入
采用量化索引調(diào)制的方法將46位水印嵌入到所選頻域系數(shù)中,設(shè)第k段音頻信號(hào)量化后的頻域系數(shù)表示為Fk={fk*(i),1≤i≤L},量化規(guī)則為:
式中,w是水印信息,fk*(i)是第k段音頻信號(hào)量化后的系數(shù),fk(i)是原始音頻的頻域系數(shù),△是量化步長(zhǎng),根據(jù)量化原理,最大量化誤差為0.5△。
本發(fā)明利用心理聲學(xué)模型的噪聲掩蔽比為每一個(gè)臨界子帶自適應(yīng)確定水印嵌入強(qiáng)度,量化步長(zhǎng)取
對(duì)嵌入水印后的音頻段做逆離散余弦變換和逆離散小波包變換,小波包逆變換后的音頻信號(hào)表示為A*(k),用A*(k)代替A(k)完成一段音頻信號(hào)的水印嵌入。然后,繼續(xù)在滿足條件的下一段音頻信號(hào)中嵌入水印,直至實(shí)現(xiàn)所有的水印嵌入。
5.進(jìn)行音頻段重組
將所有未嵌入水印的音頻段和嵌入水印的音頻段進(jìn)行重組,組合成含有全部水印的音頻信號(hào)。
6.提取數(shù)字水印,包括:
(1)采用步驟2的方法對(duì)含水印音頻信號(hào)進(jìn)行分段處理和小波包變換,并計(jì)算每一段音頻信號(hào)的聽覺掩蔽閾值;
(2)采用步驟3的方法找到水印嵌入段和嵌入位置;
(3)采用如下公式提取水印序列:
式中fk*(i)是第k段待測(cè)音頻信號(hào)的頻域系數(shù),△*是第k段待測(cè)音頻信號(hào)的量化步長(zhǎng);
(4)對(duì)提取的水印序列進(jìn)行升維、逆Arnold變換和Logistic解密操作,得到最終的水印圖像。
為了測(cè)試本發(fā)明的性能,選取了三種不同類型的載體音頻文件分別為流行音樂、古典音樂和搖滾音樂,它們的采樣頻率均為44.1kHz;量化精度為16位;格式為單聲道。以流行音樂為例,圖2、圖3、圖4分別是原始音頻信號(hào)、含水印音頻信號(hào)和二者的差值信號(hào)的波形圖。由圖可見,含水印的音頻信號(hào)波形圖與原始音頻信號(hào)波形圖之間差異很小。水印嵌入后基本察覺不到音頻質(zhì)量的失真。為了更好的評(píng)價(jià)本方法性能,我們將本發(fā)明提出的基于DWPT-DCT的水印方法與傳統(tǒng)的基于心理聲學(xué)模型的水印方法和當(dāng)前流行的DWT-SVD方法,從不可感知性、水印容量和魯棒性三個(gè)方面進(jìn)行了比較。
(1)不可感知性對(duì)比
本發(fā)明采用信噪比和平均分段信噪比來評(píng)價(jià)水印對(duì)宿主信號(hào)的影響。定義如下:
其中S'(i)為嵌入水印后的系數(shù),S(i)為原始音頻信號(hào)系數(shù),K為水印嵌入所需音頻幀數(shù),N為一幀音頻信號(hào)包含的采樣點(diǎn)個(gè)數(shù)。SegSNR表示每幀含水印音頻信號(hào)的信噪比均值,相比SNR,SegSNR能夠更好的反映水印信息對(duì)原始音頻信號(hào)的影響。由公式可知,頻域系數(shù)的改變量決定了信噪比。設(shè)某個(gè)頻域系數(shù)的修改增量為e,其引入的噪聲能量為e2,根據(jù)量化原理,系數(shù)的量化噪聲是均勻分布的,它的期望值設(shè)某幀音頻信號(hào)的能量為Eg,我們可以據(jù)此來估計(jì)嵌入水印幀的信噪比上限為:
聯(lián)立量化步長(zhǎng)的求解公式,可得嵌入水印的每幀音頻信噪比上限為:
SNR≤10lg{4Eg/(Thr·L)}+5
針對(duì)流行音樂、古典音樂、搖滾音樂三種音樂類型,實(shí)測(cè)的信噪比分別為34.23db,29.62db,32.81db;分段信噪比均值分別為32.58db,28.26db,30.95db。實(shí)驗(yàn)表明本方法所得分段信噪比均在理論上限值之下,并且大于20db。本發(fā)明信噪比平均高于文獻(xiàn)[3]7~8db,高于文獻(xiàn)[4]1~4db。
(2)水印容量分析
水印嵌入容量的計(jì)算公式為其中,Nw=40×40,它表示嵌入的水印量,T為水印嵌入完成所需要的時(shí)間。水印嵌入率為100%時(shí),不同類型音頻載體的水印嵌入容量分別為流行音樂(689.5bps),古典音樂(576.7bps),搖滾音樂(668.9bps)。文獻(xiàn)[3]在1600個(gè)采樣點(diǎn)中嵌入1bit水印信息,水印嵌入容量只有27.56bps。文獻(xiàn)[4]在512個(gè)采樣點(diǎn)中嵌入8bit水印,水印嵌入容量為689.06bps,相比之下本發(fā)明水印嵌入容量遠(yuǎn)遠(yuǎn)高于文獻(xiàn)[3]提出的方法,與文獻(xiàn)[4]提出的方法嵌入容量相當(dāng)。
(3)水印魯棒性分析
為了測(cè)試水印抵抗常見信號(hào)處理的攻擊能力,本發(fā)明對(duì)嵌入水印的音頻信號(hào)做如下處理:(1)疊加噪聲:對(duì)數(shù)字音頻信號(hào)在時(shí)域中加入高斯白噪聲,信噪比為20db。(2)重采樣:先下采樣至22.05kHz,再上采樣至44.1kHz。(3)重量化:先將音頻信號(hào)從16bit量化為8bit,再?gòu)?bit量化為16bit。(4)mp3音頻壓縮:先對(duì)音頻信號(hào)進(jìn)行壓縮,再解壓縮(比特率為128kbps)。(5)低通濾波,截止頻率為8kHz。本發(fā)明比較了所提方法與文獻(xiàn)[3]和[4]對(duì)常見信號(hào)處理與攻擊的抵抗能力,對(duì)三種方法選取相同的宿主音樂(流行音樂)和水印圖像,在滿足水印不被感知的條件下測(cè)得它們的NC值如表3所示。由表可知,本發(fā)明與文獻(xiàn)[4]水印容量相當(dāng)?shù)那闆r下具有更好的魯棒性。盡管本發(fā)明在水印容量上要遠(yuǎn)遠(yuǎn)高于文獻(xiàn)[3],但是水印魯棒性并不差于文獻(xiàn)[3]。
表2不同音樂類型的抗攻擊能力
表3不同方法的抗攻擊能力
相關(guān)文獻(xiàn)如下:
1、Johnston J D.Transform coding of audio signals using perceptual noise criteria[J].IEEE Journal on Selected Areas in Communications,1988,6(2):314-323.
2、Arnold M.Quality evaluation of watermarked audio tracks[J].Proceedings of SPIE-The International Society for Optical Engineering,2002,4675:91-101.
3、Cai Y M,Guo W Q,Ding H Y.An audio blind watermarking scheme based on DWT-SVD[J].Journal of Software,2013,8(7).1801-1808.
4、李榕,王宏霞,趙鵬君.基于心理聲學(xué)模型的自適應(yīng)音頻數(shù)字水印算法[C].全國(guó)信息隱藏暨多媒體信息安全學(xué)術(shù)大.2010.