基于svd和ann的魯棒盲音頻水印算法
【專利摘要】隨著互聯(lián)網(wǎng)應(yīng)用的普及,大量的音頻信息以各種形式在網(wǎng)絡(luò)上快速的交流和傳播。為防止音頻的盜版、復(fù)制等非法操作,本發(fā)明提出了一種結(jié)合ANN和SVD的音頻盲水印算法,以實現(xiàn)對音頻信息的版權(quán)保護。本發(fā)明先對原始音頻分成長度為1600個樣點的段。對角矩陣的元素標(biāo)記由下式求得:嵌入強度α=0.2,wk為數(shù)字水印。對修改后的對角矩陣進行ISVD,得到矩陣。將降為一維信號,得到修改后的DCT系數(shù),然后進行IDCT,再進行逆二級離散小波包分解,將他們轉(zhuǎn)換回時域的音頻信號。用已訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)計算出W':原始音頻與嵌入了水印音頻間的區(qū)別,并得到了一個映射,其輸入為期望輸出為。實驗表明本發(fā)明具有較好的透明性,見摘要附圖1,同時對常規(guī)音頻信號處理攻擊具有較強的魯棒性。
【專利說明】基于SVD和ANN的魯棒盲音頻水印算法
[0001]【技術(shù)領(lǐng)域】本發(fā)明提出一種基于奇異值分解和神經(jīng)網(wǎng)絡(luò)的音頻盲水印算法,該算法具有較好的魯棒性和隱蔽性。屬于數(shù)字水印領(lǐng)域。
[0002]【背景技術(shù)】隨著多媒體業(yè)務(wù),如電子商務(wù)的發(fā)展,按次視圖,視頻點播,電子報紙,和P2P媒體共享,多媒體數(shù)據(jù)可以快速通過高速的網(wǎng)絡(luò)連接獲得。然而,作者,出版社,所有人和多媒體數(shù)據(jù)的提供者都不愿意將他們的文件在網(wǎng)絡(luò)環(huán)境中的發(fā)布,因為這些文件很容易被攔截、復(fù)制并重組信息進入原文件,造成版權(quán)侵犯。
[0003]隨著互聯(lián)網(wǎng)應(yīng)用的普及,越來越多的數(shù)字化多媒體內(nèi)容信息紛紛以各種形式在網(wǎng)絡(luò)上快速的交流和傳播。如何對數(shù)字化多媒體內(nèi)容進行有效的管理和保護,成為信息安全領(lǐng)域的研究熱點。信息隱藏可以在載體中嵌入難以被感知的秘密信息以保護數(shù)字內(nèi)容的版權(quán)或用于保密通信,可以很好的解決上述問題。信息隱藏不同于傳統(tǒng)的數(shù)據(jù)加密,數(shù)據(jù)加密隱藏信息的內(nèi)容,讓第三方看不懂;信息隱藏不但隱藏了信息的內(nèi)容,而且隱藏了信息的存在性,讓第三方看不見。隱寫術(shù)與數(shù)字水印是信息隱藏的兩個重要研究分支,采用的原理都是將一定量的信息嵌入到載體數(shù)據(jù)中,但由于應(yīng)用環(huán)境和應(yīng)用場合的不同,對具體的性能要求不同。
[0004]數(shù)字水印是通過對載體進行難以被感知的改動,從而嵌入與載體有關(guān)的信息,嵌入的信息不一定是秘密的,也有可能是可見。數(shù)字水印的目的是保護數(shù)字內(nèi)容的所有權(quán)。音頻水印嵌入的信息可以是音頻版權(quán)保護信息、作品序列號、藝術(shù)家和歌曲名字等,用于音頻的版權(quán)保護、盜版追蹤和擁有者識別等。
[0005]目前的音頻盲水印算法是建立在擴頻原理上的。盡管該方法允許可靠的通信甚至強攻擊,但解碼器和盲檢測擴頻水印是不知道主機信號是否受到嚴重的數(shù)據(jù)干擾時,擴頻為基礎(chǔ)的系統(tǒng)魯棒性較差。當(dāng)前的水印方案的魯棒性是遠遠不能滿足需要,特別是音頻水印方案。他們中的大多數(shù)能抵御只有某些有限的攻擊。
`[0006]
【發(fā)明內(nèi)容】
針對以上問題,本發(fā)明提出了一種基于奇異值分解(SVD)和人工神經(jīng)網(wǎng)絡(luò)(ANN)的音頻盲水印算法,該算法具有較好的隱蔽性和較強的魯棒性。同時,由于神經(jīng)網(wǎng)絡(luò)具有記憶和適應(yīng)能力,該方案可以提取水印信息,而無需原始音頻。
[0007]本發(fā)明包括兩個主要算法,水印嵌入算法、水印提取算法。
[0008]水印嵌入算法中:先將水印圖像降維,然后對原始音頻進行分成N塊,每塊包含1600個樣點。從N個塊中選出M1XM2個塊,每塊嵌入到一比特的水印信息中。求得對角矩陣的元素標(biāo)記后對對角矩陣進行逆奇異值分解,得到矩陣S ,將矩陣降為一維信號,然后對其進行逆離散余弦變換,再進行逆二級離散小波包分解,以將他們轉(zhuǎn)換回時域的音頻信號。最后用已訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)計算出W’。實驗中:假設(shè)數(shù)字水印信息是一個二進制圖像W,包含M1XM2比特。
[0009]水印提取算法中:將音頻分為N個塊,每塊有1600個采樣點。從N個塊中選出M1XM2個塊,每塊嵌入到一比特的水印信息中。對每個塊進行2級離散小波包分解,然后選擇包含400個樣點的近似子帶系數(shù)Calw。近似子帶系數(shù)Calw由離散余弦變換分解而來,第一象限的離散余弦變換系數(shù)轉(zhuǎn)換為一個10*10階矩陣ju:/; (/< =1,2,…,/W1 χΜ:)。對矩陣進行奇異值分解,得到10*10階的對角矩陣swJi^><+/:)。根據(jù)TNN的輸入可以得到實體輸出Μ、。根據(jù)數(shù)字水印樣本
Sw,;(1J),(A: =1,2,...,M1 χΛ/2)以及相應(yīng)的實體輸出,TNN可估算出每一比特所提取出的
數(shù)字水印,并獲得二進制圖像。
[0010]本發(fā)明是一個盲水印算法,水印提取時不需要原始音頻文件的參與。但嵌入水印時分段的長度大小需要作為密鑰傳遞給提取方以完成水印信息的提取。
[0011]本發(fā)明具有易于實現(xiàn)、執(zhí)行效率高等優(yōu)點,在實踐中具有較高的理論與應(yīng)用價值。
[0012]【專利附圖】
【附圖說明】下面結(jié)合附圖和【具體實施方式】,對本發(fā)明做進一步的詳細說明。
[0013]圖1是本發(fā)明提出的音頻水印嵌入算法流程圖。
[0014]圖2音頻的奇異值分解系數(shù)S (I, I)。
[0015]圖3是本發(fā)明提出的音頻水印提取算法流程圖。
[0016]圖4、5是本發(fā)明提出的音頻水印嵌入算法的隱蔽性實驗驗證結(jié)果。
【具體實施方式】
[0017]圖1表示了本發(fā)明提出的水印嵌入算法,具體步驟如下:
[0018]定義X = (X1, X2, , xM)為主機音頻,定義 W (i, j), (O ≤ i < M1, O ≤ j < M2)為
數(shù)字水印信息。
[0019]步驟1:水印圖像的降維。因為音頻信號是一維的,但數(shù)字水印W(i,j)是二維的。
因此數(shù)字水印應(yīng)該變換為一維信號:
【權(quán)利要求】
1.基于SVD和ANN的魯棒盲音頻水印算法,其特征在于:結(jié)合奇異值分解(SVD)和人工神經(jīng)網(wǎng)絡(luò)(ANN)的音頻盲水印方法。
2.如權(quán)利要求1所說的基于SVD-ANN的音頻盲水印算法的水印嵌入算法,其特征在于:先將水印圖像降維,然后對原始音頻進行分成N塊,每塊包含1600個樣點。從N個塊中選出M1XM2個塊,每塊嵌入到一比特的水印信息中。求得對角矩陣的元素標(biāo)記后對對角矩陣進行逆奇異值分解,得到矩陣5mA,將矩陣降為一維信號,然后對其進行逆離散余弦變換,再進行逆二級離散小波包分解,以將他們轉(zhuǎn)換回時域的音頻信號。最后用已訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)計算出W’。實驗中:假設(shè)數(shù)字水印信息是一個二進制圖像W,包含M1XM2比特。
3.如權(quán)利要求1所說的基于SVD-ANN的音頻盲水印算法的的水印提取算法,其特征在于:將音頻分為N個塊,每塊有1600個采樣點。從N個塊中選出M1XM2個塊,每塊嵌入到一比特的水印信息中。對每個塊進行2級離散小波包分解,然后選擇包含400個樣點的近似子帶系數(shù)Calw。近似子帶系數(shù)Calw由離散余弦變換分解而來,第一象限的離散余弦變換系數(shù)轉(zhuǎn)換為一個 10*10 階矩陣=H^M1 xM2)。對矩陣 = 1,2,行奇異值分解,得到10*10階的對角矩陣= 1 二…,Μι xM2)。根據(jù)TNN的輸入可以得到實體輸出?Λ。根據(jù)數(shù)字水印樣本*Swa(1,1),認=1,2,...,M1 χΜ2)以及相應(yīng)的實體輸出《Sw、,TNN可估算出每一比特所提取出的數(shù)字水印,并獲得二進制圖像。
4.本發(fā)明是一個盲水印算法,水印提取時不需要原始音頻文件的參與。但嵌入水印時分段的長度大小需要作為密鑰傳遞給提取方以`完成水印信息的提取。
【文檔編號】G10L19/018GK103854652SQ201410107951
【公開日】2014年6月11日 申請日期:2014年3月21日 優(yōu)先權(quán)日:2014年3月21日
【發(fā)明者】雷敏, 楊榆, 劉博懷, 王劍鋒 申請人:北京郵電大學(xué)