專利名稱:用于聲頻文件的數(shù)字水印制作及識別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種數(shù)字聲頻水印嵌入與檢測方法,屬于信息安全、多媒體信息處理領(lǐng)域。
背景技術(shù):
多媒體技術(shù)和網(wǎng)絡技術(shù)的發(fā)展,顯著地提高了信息傳播的效率。但隨之而來的副作用是,有惡意的個人和團體有可能在沒有得到作品所有者許可的情況下,隨意復制、篡改、銷售有版權(quán)的內(nèi)容。數(shù)字水印技術(shù)的提出是為了保護網(wǎng)絡環(huán)境下的多媒體產(chǎn)品,被認為是解決版權(quán)問題的有效方式之一。它是利用人類視覺和聽覺系統(tǒng)的冗余,在多媒體文件中嵌入與版權(quán)所有者相關(guān)的秘密信息,以證實信息的版權(quán)歸屬。從應用范圍上可把水印分為圖像、視頻、聲頻水印。從目前來看,關(guān)于圖像水印和視頻水印研究很多,而對聲頻水印的研究卻鮮有報道。
聲頻水印算法有LSB法、相位編碼法、回聲隱藏法、離散傅立葉變換法、離散余弦變換法和小波變換法等。尤其在變換域的聲頻信息的嵌入技術(shù)方面,由于能將信息嵌入到載體的敏感區(qū)域,大大提高了水印的魯棒性,使得研究結(jié)果日趨實用。數(shù)字聲頻水印的最重要的特性是1)不可感知性,即含水印的數(shù)字聲頻信號和原始聲頻信號在聽覺上無差別;2)穩(wěn)健性,經(jīng)過信號處理操作后,如壓縮、加噪、濾波、采樣等,仍可靠地檢測到水印。
目前的聲頻水印方法一般存在如下問題 (1)水印的用途不明確,實用性不強。大多數(shù)現(xiàn)有聲頻水印系統(tǒng)都宣稱具有版權(quán)保護、真?zhèn)蚊襟w判斷以及傳播跟蹤、拷貝控制等。然而在實際應用中,要達到上述所有的功能,實現(xiàn)的復雜度大、耗費時間長。
(2)嵌入的水印形式抽象,不利于法庭對數(shù)字聲頻作品版權(quán)的認證?,F(xiàn)有聲頻水印系統(tǒng)中使用的水印一般是根據(jù)某種規(guī)則得到的數(shù)據(jù),大多為偽隨機序列。利用其偽隨機性,根據(jù)相關(guān)性的測量來判斷聲頻中是否具有水印。也有技術(shù)中用一些二值圖像或者灰度圖像作為聲頻水印,這些水印圖像大多是一些簡單的很容易被偽造的圖像,且這些水印圖像不具備唯一性,也就無法明確說明版權(quán)所有權(quán)。
因而,現(xiàn)有的聲頻水印方法實用性不強、形式抽象,不適于數(shù)字聲頻作品的版權(quán)保護與版權(quán)認證。
發(fā)明內(nèi)容
本發(fā)明目的是提供一種具備唯一性的用于聲頻文件的數(shù)字水印制作及識別方法,用于數(shù)字聲頻作品的版權(quán)保護與版權(quán)認證。
為達到上述目的,本發(fā)明采用的技術(shù)方案是一種用于聲頻文件的數(shù)字水印制作方法,在待處理的聲頻數(shù)字文件中添加水印作為版權(quán)標記信息,所述的水印采用經(jīng)轉(zhuǎn)換的聲紋信息實現(xiàn),制作方法包括下列步驟 (1)采集一段標識版權(quán)的語音信號,將采樣的語音加窗、分幀,經(jīng)離散傅立葉變換和灰度映射后,獲得聲紋水印圖像; (2)將聲紋水印圖像的二維矩陣轉(zhuǎn)換成一維二值序列組,其中,每一矩陣單元的灰度值采用一個8位二進制數(shù)表示; (3)從待處理的聲頻數(shù)字文件中截取待插入水印部分,根據(jù)步驟(2)中獲得的一維二值序列組的位數(shù)將待插入水印部分分成等長度的對應數(shù)量的段,對每段聲頻分別進行頻域變換,獲得頻譜文件; (4)在每段頻譜文件中嵌入一位步驟(2)中獲得的一維二值序列組水印數(shù)據(jù),所述嵌入方法是量化修改頻譜文件系數(shù)的方法; (5)對步驟(4)得到的頻譜文件進行反變換,獲得嵌入水印的聲頻數(shù)據(jù),與其余未處理的聲頻數(shù)據(jù)組合,即得到帶有數(shù)字水印的聲頻數(shù)字文件。
聲紋又稱“聲音圖像”。1945年美國貝爾電話研究所伯塔博士等發(fā)明了一種能夠區(qū)別聲音的儀器裝置——“聲音攝譜儀”(簡稱“聲譜儀”),聲譜儀能將一個人的講話聲音記錄并轉(zhuǎn)換成電磁振動,然后在熒屏或紙帶上顯示出可供人們觀察、比較、鑒別的坐標式靜態(tài)聲音頻譜圖像。這種靜止圖象即為“聲紋”。聲紋圖中橫軸表示發(fā)音時間,單位為秒(s);縱軸表示聲音頻率,單位為千赫茲(KHz)。
研究結(jié)果表明每個人的聲紋如同其指紋生理特征,在世界上也是獨一無二的,而且每個人獨具的聲紋特殊性在其童年變聲期末直至老年變聲期這段漫長的人生歲月里保持穩(wěn)定不變,故聲紋在司法鑒定活動中又享有“第二指紋”的美譽。由于通過聲紋比較檢驗可以進行人身同一認定,因此自從聲譜儀問世后聲紋技術(shù)于六十年代取得了突破性發(fā)展,七十年代它便在各國法庭科學以及軍事偵察領(lǐng)域得到廣泛應用。
上述技術(shù)方案中,通過采集用于標識版權(quán)的語音信號,轉(zhuǎn)換獲得聲紋圖像后嵌入到聲紋數(shù)據(jù)文件中,來實現(xiàn)防偽。
上述技術(shù)方案中,所述步驟(1)中,通過麥克風和計算機聲卡采集語音信號x(n),采樣頻率fs大于等于8000Hz,小于等于44100Hz,采樣點數(shù)為L=T×fs,T為采樣時間; 所述加窗處理采用漢明窗,漢明窗序列的長度N根據(jù)采樣頻率fs確定,先獲得N1=T×fs,再取最接近于N1的2的整數(shù)次方數(shù)字為N,例如,采樣時間T為30ms,則N1=0.03×8000=240個點,與240最接近的2的整數(shù)次方為256,故此時選取的漢明窗長度為N=256; 所述離散傅立葉變換采用快速傅立葉變換算法實現(xiàn),每一幀中取前N/2+1個數(shù)據(jù)。
上述技術(shù)方案中,所述頻域變換為分段離散余弦變換,水印的嵌入通過對所選擇的離散余弦變換直流系數(shù)進行量化完成。
為實現(xiàn)用于聲頻文件的數(shù)字水印的識別,采用的技術(shù)方案是,根據(jù)制作水印時的分段長度,將待識別的聲頻數(shù)據(jù)分段,采用與制作時相對應的方法對分段后的文件進行頻域變換,獲得含有水印信息的直流系數(shù),提取出一維二值序列組;將提取的一維二值序列組每8位為一組,合成一個8位二進制數(shù),表示一個像素點的灰度值,由此轉(zhuǎn)換為二維象素灰度值矩陣,得到恢復的聲紋水印圖像;與制作水印時的聲紋水印圖像進行比較,實現(xiàn)數(shù)字水印的識別。
上述技術(shù)方案中,根據(jù)獲得的聲紋水印圖像進行反變換,獲得水印聲頻文件,進行播放比對,實現(xiàn)識別。
如上所述,聲頻水印圖像具有唯一性,明確用于數(shù)字聲頻作品中的版權(quán)保護和版權(quán)認證,不但隱蔽性好,即使經(jīng)過聲頻壓縮、疊加噪聲、低通濾波、重新采樣或者重新量化等常見的信號處理攻擊后,還能保留水印圖像的特征,選用的方法能夠使水印圖像在原始聲頻中的嵌入和提取相對簡單、快捷和實用。
本發(fā)明基于聲紋的數(shù)字聲頻水印方法的總體構(gòu)思是利用聲紋圖像具有唯一性的特征將其嵌入到數(shù)字聲頻作品中。將原始聲頻數(shù)據(jù)在時域分幀,并將每一幀做離散余弦變換(DCT),通過量化修改每一幀中DCT直流系數(shù)實現(xiàn)將聲紋作為水印嵌入,再將調(diào)整后的每幀DCT直流系數(shù)做反離散余弦變換(IDCT)轉(zhuǎn)換至時域,即得嵌入聲紋水印的聲頻數(shù)據(jù)。其具體實現(xiàn)方式舉例如下 一、產(chǎn)生聲紋水印圖像 (1)、采集版權(quán)所有者的一段時長為T秒的語音信號x(n),采樣頻率為fsHz,即每秒鐘采樣fs個數(shù)據(jù)。以fs=8000為例,x(n)的總采樣點數(shù)為L=T×8000。語音信號的采樣頻率可以根據(jù)實際情況而定,通常為8000Hz、11025Hz、16000HZ、22050Hz、32000Hz、44100Hz等。
(2)、取定漢明窗的長度N,N的大小視fs而定,N一般取10~30ms長,且N取2的整數(shù)次方,以fs=8000為例,若取30ms長,則N=0.03×8000=240個點,與240最接近的2的整數(shù)次方為256,故此時選取的漢明窗長度為N=256;長度為N的漢明窗序列w(n),其表達式為 從x(n)的起始點x(0)處開始,w(n)分別與x(n)的第0~N-1個采樣點對應相乘,得到第一幀加窗的語音信號序列x1(n),x1(n)=x(n)×w(n),(0≤n≤N-1),然后將漢明窗序列w(n)起始點向n>0的方向移動
點,再與x(n)的第個采樣點對應相乘,得到第二幀加窗的語音信號x2(n),依次類推可以得到x3(n)。。。xp(n),當x(n)中余下參加上述運算的點數(shù)小于w(n)的長度N時停止,共計得到p幀加窗語音信號,每幀加窗的語音信號長度均為N點; (3)、對得到的每一個xm(n),(1≤m≤p)做離散傅立葉變換(DFT),其結(jié)果可以表示為 即每一個Xm(k)包含了N個數(shù)據(jù),為提高計算效率,在計算機上是通過快速傅立葉變換(FFT)的算法來實現(xiàn)的;考慮到DFT的對稱性,每一個Xm(k)中只保存時的部分,即保留前
個數(shù)據(jù),再求出Xm(k)的功率譜Pm(k)=|Xm(k)|2;|Xm(k)|為Xm(k)的幅度值; (4)對得到的功率譜實施灰度映射,為增強聲紋顯示的動態(tài)范圍,把Pm(k)轉(zhuǎn)換為P′m(k), 下面是灰度映射的數(shù)學表示式 其中 Base為一經(jīng)驗值,Max(Bm(k))是指Bm(k),(1≤m≤p,0≤k≤128)的最大值,在二維的平面坐標上,將m作為橫坐標,k作為縱坐標,把Cm(k)的值作為灰度作圖,則就能夠得到語音信號x(n)的聲紋圖像V。
二、嵌入聲紋水印圖像 (1)、將聲紋圖像的二維像素矩陣轉(zhuǎn)換為一維二值序列組W,聲紋圖像可以表示為其中v(i,j)表示圖像的第i行、第j列的像素的灰度值,任意一個v(i,j)都在0~255范圍內(nèi),即v(i,j)∈{0,1,Λ255},將每一個v(i,j)用8位二進制數(shù)來表示,得到待嵌入的二值序列W的長度為
(2)、聲頻信號的分段處理,原始聲頻數(shù)據(jù)為A,需要嵌入聲紋水印圖像的聲頻數(shù)據(jù)表示為Ae={ae(i),0≤i≤Length},將Ae劃分為
段,每段聲頻數(shù)據(jù)的長度為len,為保證嵌入水印的魯棒性,每段聲頻數(shù)據(jù)中僅嵌入一位二進制數(shù),要使得所有的W值完全嵌入到聲頻數(shù)據(jù)中,則必須滿足關(guān)系式每段聲頻數(shù)據(jù)表示為Ael(i),(0≤i≤len-1),len長度一般取大于8的偶數(shù); (3)、聲頻信號的分段離散余弦變換(DCT)及DCT系數(shù)的選取,對上述Ael(i)做DCT變換,得到 Dl(k)=DCT(Ael(i))(0≤k≤len-1),(0≤i≤len-1) 每段聲頻數(shù)據(jù)Ael(i)包含len個數(shù)據(jù)點,其DCT結(jié)果Dl(k)包含len個DCT系數(shù),選取每段聲頻數(shù)據(jù)DCT結(jié)果Dl(k)的直流系數(shù)即Dl(0)用于水印序列W的嵌入; (4)、二值水印序列的嵌入,水印的嵌入是通過對所選擇的DCT直流系數(shù)Dl(0)進行特殊量化完成的,量化后的直流系數(shù)表示為D′l(0),用w(i),表示待嵌入的二值序列,定義量化步長Δ,Δ根據(jù)經(jīng)驗確定,量化的嵌入過程如下 對待量化的系數(shù)Dl(0)做取模求余運算, mdl(0)=Dl(0)modΔ rel(0)=Dl(0)-mdl(0)×Δ 上述mdl(0)表示Dl(0)對Δ的模值,rel(0)表示Dl(0)除以Δ的余數(shù)。
當Dl(0)≥0,且需要嵌入的二值序列w(i)為1時 當Dl(0)≥0,且需要嵌入的二值序列w(i)為0時 當Dl(0)<0,且需要嵌入的二值序列w(i)為1時 當Dl(0)<0,且需要嵌入的二值序列w(i)為0時 上述表達式中所有的q均為非負整數(shù); (5)反離散余弦變換(IDCT),聲頻數(shù)據(jù)段的重新組合,用D′l(0)代替原來的Dl(0),得到新的DCT系數(shù)D′l(k),表示為 對D′l(k)做IDCT,得到嵌入了水印信息的聲頻數(shù)據(jù)Ae′,表示為 Ae′l(i)=IDCT(D′l(k)),其中0≤i≤len-1,0≤k≤len-1 用Ae′代替Ae,再結(jié)合未嵌入水印的原始聲頻數(shù)據(jù)部分,最終得到含有水印信號的聲頻數(shù)據(jù)。
三、當版權(quán)所有者需要提取聲紋水印圖像進行版權(quán)認證時,提取聲紋水印的過程包括 (1)、將含有聲紋水印圖像的聲頻數(shù)據(jù)取出并且對其進行分段,每段長度為len,共分段;表示為 Ae′l(i),(0≤i≤len-1), 對Ae′l(i)做離散余弦變換(DCT),找到含有水印信息的DCT直流系數(shù)D″l(0); (2)、根據(jù)量化規(guī)則提取水印信息,計算含有水印信息的DCT系數(shù)對量化步長的模值md′l(0),md′l(0)=D″l(0)modΔ; 當md′l(0)≥0時,且md′l(0)為偶數(shù)時,D″l(0)包含的水印信息為1; 當md′l(0)≥0時,且md′l(0)為奇數(shù)時,D″l(0)包含的水印信息為0; 當md′l(0)<0時,且md′l(0)為偶數(shù)時,D″l(0)包含的水印信息為0; 當md′l(0)<0時,且md′l(0)為奇數(shù)時,D″l(0)包含的水印信息為1; (3)聲紋水印圖像的恢復,將提取的二值水印序列每8位分一組,合成一個8位二進制數(shù),表示一個像素點的灰度值,然后將一維的像素灰度值組轉(zhuǎn)換為二維象素灰度值矩陣,恢復出嵌入的聲紋水印圖像。
由于上述技術(shù)方案運用,本發(fā)明與現(xiàn)有技術(shù)相比具有下列優(yōu)點 本發(fā)明基于聲紋的數(shù)字聲頻水印方法,將版權(quán)者的聲紋圖像作為水印嵌入到數(shù)字聲頻產(chǎn)品中,能夠有效地解決數(shù)字聲頻產(chǎn)品的版權(quán)認證問題;所采用的技術(shù)方法基于聲頻數(shù)據(jù)的分段離散余弦變換(DCT),通過量化修改原始聲頻數(shù)據(jù)DCT域中的直流分量實現(xiàn)將聲紋圖像水印序列嵌入到聲頻數(shù)據(jù)中,保證了聲紋水印的魯棒性,量化的思想還可以保證較快地完成聲紋水印的嵌入和提取工作,且提取聲紋水印不需要原始聲頻數(shù)據(jù),即使經(jīng)過聲頻壓縮、疊加噪聲、低通濾波、重新采樣或者重新量化等常見的信號處理攻擊后,還能保留聲紋水印圖像的特征,可以作為法律認可的證據(jù)使用。
將聲紋圖像作為聲頻水印嵌入數(shù)字聲頻作品與現(xiàn)有數(shù)字水印技術(shù)相比有以下幾個特點 (1)不可偽造性聲紋是可靠、穩(wěn)定的生物特征,可以唯一地確定一個人,不容易被他人盜用,具有不可偽造性; (2)可鑒別身份普通的聲頻水印大都不是直接見面,所以身份不能確定,而語音簽名的接受者可以通過一定的技術(shù)聽到簽名者的聲音,可以鑒別其身份; (3)不可抵賴性因為本技術(shù)采用如同指紋的人的聲譜圖作為鑒定,任何兩個人都不可能具有排列關(guān)系和大小完全相同的聲譜圖; (4)不可更改性聲紋的產(chǎn)生需要一定的理論水平和技術(shù),一旦被修改是很難得到和原來一樣的聲紋圖像。
圖1是本發(fā)明實施例一聲紋水印的產(chǎn)生、嵌入、提取方法的流程示意圖; 圖2是版權(quán)者的聲紋圖像; 圖3是原始載體聲頻的時域波形圖; 圖4是嵌入水印后的聲頻時域波形圖; 圖5是低通濾波后提取的聲紋水印圖像; 圖6是疊加噪聲后提取的聲紋水印圖像; 圖7是重新量化后提取的聲紋水印圖像; 圖8是重新采樣后提取的聲紋水印圖像。
具體實施例方式 下面結(jié)合附圖及實施例對本發(fā)明作進一步描述 實施例一 參見附圖1現(xiàn)將圖1中框圖文字按流程加以解釋 一、首先是聲紋圖像的產(chǎn)生部分 (1)、采集版權(quán)所有者的一段語音x(n),采樣頻率為fsHz,x(n)的總采樣點數(shù)為L=T×fs;(2)、然后是對版權(quán)者語音進行分幀加窗操作,也就是用一個長度為N的漢明窗序列w(n),其表達式為 從x(n)的起始點x(0)處開始,分別與x(n)的第0~N-1個采樣點對應相乘,得到第一幀加窗的語音信號序列x1(n),x1(n)=x(n)×w(n),(0≤n≤N-1),然后將漢明窗序列w(n)起始點向n>0的方向移動
點,再與x(n)的第個采樣點對應相乘,得到第二幀加窗的語音信號x2(n),,依次類推可以得到x3(n)。。。xp(n),當x(n)中余下參加上述運算的點數(shù)小于漢明窗序列w(n)的長度N時停止,共計得到p幀加窗語音信號,每幀加窗語音信號的長度均為N點; (3)、然后就是快速傅立葉變換(FFT)部分,對得到的每一個xm(n),(1≤m≤p)做離散傅立葉變換(DFT),其結(jié)果可以表示為 即每一個Xm(k)包含了N個數(shù)據(jù),為提高計算效率,在計算機上是通過快速傅立葉變換(FFT)的算法來實現(xiàn)的;考慮到DFT的對稱性,每一個Xm(k)中只取即取前
個數(shù)據(jù),再求出Xm(k)的功率譜Pm(k)=|Xm(k)|2;|Xm(k)|為Xm(k)的幅度值; (4)最后是灰度映射部分,對得到的功率譜實施灰度映射,為增強聲紋顯示的動態(tài)范圍,把Pm(k)轉(zhuǎn)換為P′m(k), 下面是灰度映射的數(shù)學表示式 其中 Base為一經(jīng)驗值,Max(Bm(k))是指Bm(k),(1≤m≤p,)的最大值,在二維的平面坐標上,將m作為橫坐標,k作為縱坐標,把Cm(k)的值作為灰度作圖,則就能夠得到語音信號x(n)的聲紋圖像V。
二、聲紋水印圖像的嵌入部分 (1)、二值水印序列的生成,將聲紋圖像的二維像素矩陣轉(zhuǎn)換為一維二值序列組W,聲紋圖像可以表示為其中v(i,j)表示圖像的第i行、第j列的像素的灰度值,任意一個v(i,j)都在0~255范圍內(nèi),即v(i,j)∈{0,1,Λ255},將每一個v(i,j)用8位二進制數(shù)來表示,得到待嵌入的二值序列W的長度為
(2)、讀取原始聲頻數(shù)據(jù),選擇一部分聲頻數(shù)據(jù)作為嵌入的載體,對這部分聲頻數(shù)據(jù)進行音分段處理,原始聲頻數(shù)據(jù)可以表示為A,需要嵌入聲紋水印圖像的聲頻數(shù)據(jù)表示為Ae={ae(i),0≤i≤Length},每段聲頻數(shù)據(jù)的長度為len,將Ae劃分為
段,且這樣當一段聲頻數(shù)據(jù)嵌入一位二進制數(shù)時,所有的W值就能夠完全嵌入到聲頻數(shù)據(jù)中,每段聲頻數(shù)據(jù)表示為Ael(i),(0≤i≤len-1) (3)、聲頻信號的分段離散余弦變換(DCT)及DCT系數(shù)的選取,對Ael(i),(0≤i≤len-1)做DCT變換, 得到Dl(k)=DCT(Ael(i))(0≤k≤len-1),(0≤i≤len-1) 每一段聲頻數(shù)據(jù)Ael(i)包含len個數(shù)據(jù)點,每一個Dl(k)包含len個DCT系數(shù),選取Dl(k)的直流系數(shù)Dl(0)作為水印序列W的嵌入; (4)、二值水印序列通過量化的方式嵌入,水印的嵌入是通過對所選擇的DCT直流系數(shù)Dl(0)進行特殊量化完成的,量化后的直流系數(shù)表示為D′l(0),w(i),表示待嵌入的二值序列,定義量化步長Δ,Δ為一經(jīng)驗值,量化的嵌入過程如下對待量化的系數(shù)Dl(0)做取模求余運算, mdl(0)=Dl(0)modΔ,mdl(0)表示Dl(0)對Δ的模值 rel(0)=Dl(0)-mdl(0)×Δ,rel(0)表示Dl(0)除以Δ的余數(shù) 當Dl(0)≥0,且需要嵌入的二值序列w(i)為1時 當Dl(0)≥0,且需要嵌入的二值序列w(i)為0時 當Dl(0)<0,且需要嵌入的二值序列w(i)為1時 當Dl(0)<0,且需要嵌入的二值序列w(i)為0時 上述表達式中所有的q均為非負整數(shù); (5)反離散余弦變換(IDCT),聲頻數(shù)據(jù)段的重新組合,用D′l(0)代替原來的Dl(0),得到新的DCT系數(shù)D′l(k),表示為 對D′l(k)做IDCT,得到嵌入了水印信息的聲頻數(shù)據(jù)Ae′,表示為 Ae′l(i)=IDCT(D′l(k)),其中0≤i≤len-1,0≤k≤len-1 用Ae′代替Ae,再結(jié)合未嵌入水印的原始聲頻數(shù)據(jù)部分,最終得到含有水印信號的聲頻數(shù)據(jù); 三、聲紋水印圖像的提取部分 (1)、將待檢測的含有聲紋水印圖像的聲頻數(shù)據(jù)分段,每段長度為len,共分段;表示為 Ae′l(i),(0≤i≤len-1), (2)對Ae′l(i)做離散余弦變換(DCT),找到含有水印信息的DCT直流系數(shù)D″l(0); (3)、使用量化的規(guī)則提取水印信息,計算md′l(0)=D″l(0)modΔ, 當md′l(0)≥0時,且md′l(0)為偶數(shù)時,D″l(0)包含的水印信息為1; 當md′l(0)≥0時,且md′l(0)為奇數(shù)時,D″l(0)包含的水印信息為0; 當md′l(0)<0時,且md′l(0)為偶數(shù)時,D″l(0)包含的水印信息為0; 當md′l(0)<0時,且md′l(0)為奇數(shù)時,D″l(0)包含的水印信息為1; (4)、將提取的二值水印序列每8位分一組,合成一個8位二進制數(shù),表示一個像素點的灰度值,然后將一維的像素灰度值組轉(zhuǎn)換為二維象素灰度值矩陣,最終恢復出了嵌入的聲紋水印圖像; 舉一實例 采集一段版權(quán)者的語音,按照上述過程產(chǎn)生聲紋圖像,圖2為版權(quán)者的聲紋圖像,選取一段采樣率為44.1KHz、16bit的聲頻信號作為聲紋水印嵌入的載體語音,圖3是原始載體聲頻的時域波形圖,圖4是嵌入水印后的聲頻時域波形圖,可以看出本方法對原始聲頻數(shù)據(jù)的修改在時域上沒有明顯差別。
為檢測嵌入聲紋水印的魯棒性,對嵌入聲紋水印的聲頻信號做如下的處理(1)低通濾波用截止頻率為5KHz的9階切比雪夫低通濾波器對嵌入水印的聲頻信號低通濾波;(2)疊加噪聲在嵌入水印的聲頻信號上疊加均值為0,方差為0.01的高斯白噪聲;(3)重新量化先將嵌入水印的聲頻信號從16比特量化為8比特,再量化為16比特;(4)重新采樣先將嵌入水印的聲頻數(shù)據(jù)按1∶2降采樣,然后按1∶2升采樣。
圖5是低通濾波后提取的聲紋水印圖像; 圖6是疊加噪聲后提取的聲紋水印圖像; 圖7是重新量化后提取的聲紋水印圖像; 圖8是重新采樣后提取的聲紋水印圖像; 可見,本方法在經(jīng)過常見信號處理攻擊后,仍然能夠提取清晰的水印圖像,證明版權(quán)的歸屬。
權(quán)利要求
1.一種用于聲頻文件的數(shù)字水印制作方法,在待處理的聲頻數(shù)字文件中添加水印作為版權(quán)標記信息,其特征在于所述的水印采用經(jīng)轉(zhuǎn)換的聲紋信息實現(xiàn),制作方法包括下列步驟
(1)采集一段標識版權(quán)的語音信號,將采樣的語音加窗、分幀,經(jīng)離散傅立葉變換和灰度映射后,獲得聲紋水印圖像;
(2)將聲紋水印圖像的二維矩陣轉(zhuǎn)換成一維二值序列組,其中,每一矩陣單元的灰度值采用一個8位二進制數(shù)表示;
(3)從待處理的聲頻數(shù)字文件中截取待插入水印部分,根據(jù)步驟(2)中獲得的一維二值序列組的位數(shù)將待插入水印部分分成等長度的對應數(shù)量的段,對每段聲頻分別進行頻域變換,獲得頻譜文件;
(4)在每段頻譜文件中嵌入一位步驟(2)中獲得的一維二值序列組水印數(shù)據(jù),所述嵌入方法是量化修改頻譜文件系數(shù)的方法;
(5)對步驟(4)得到的頻譜文件進行反變換,獲得嵌入水印的聲頻數(shù)據(jù),與其余未處理的聲頻數(shù)據(jù)組合,即得到帶有數(shù)字水印的聲頻數(shù)字文件。
2.根據(jù)權(quán)利要求1所述的數(shù)字水印的制作方法,其特征在于所述步驟(1)中,通過麥克風和計算機聲卡采集語音信號x(n),采樣頻率fs大于等于8000Hz,小于等于44100Hz,采樣點數(shù)為L=T×fs,T為采樣時間;
所述加窗處理采用漢明窗,漢明窗序列的長度N根據(jù)采樣頻率fs確定,先獲得N1=T×fs,再取最接近于N1的2的整數(shù)次方數(shù)字為N;
所述離散傅立葉變換采用快速傅立葉變換算法實現(xiàn),每一幀中取前N/2+1個數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的數(shù)字水印的制作方法,其特征在于所述頻域變換為分段離散余弦變換,水印的嵌入通過對所選擇的離散余弦變換直流系數(shù)進行量化完成。
4.一種用于聲頻文件的數(shù)字水印識別方法,其特征在于根據(jù)制作水印時的分段長度,將待識別的聲頻數(shù)據(jù)分段,采用與制作時相對應的方法對分段后的文件進行頻域變換,獲得含有水印信息的直流系數(shù),提取出一維二值序列組;將提取的一維二值序列組每8位為一組,合成一個8位二進制數(shù),表示一個像素點的灰度值,由此轉(zhuǎn)換為二維象素灰度值矩陣,得到恢復的聲紋水印圖像;與制作水印時的聲紋水印圖像進行比較,實現(xiàn)數(shù)字水印的識別。
5.根據(jù)權(quán)利要求2所述的數(shù)字水印識別方法,其特征在于根據(jù)獲得的聲紋水印圖像進行反變換,獲得水印聲頻文件,進行播放比對,實現(xiàn)識別。
全文摘要
本發(fā)明公開了一種用于聲頻文件的數(shù)字水印制作方法及識別方法。在待處理的聲頻數(shù)字文件中添加水印作為版權(quán)標記信息,其特征在于所述的水印采用經(jīng)轉(zhuǎn)換的聲紋信息實現(xiàn),包括采集一段標識版權(quán)的語音信號并獲得聲紋水印圖像;轉(zhuǎn)換成一維二值序列組,每一矩陣單元的灰度值采用一個8位二進制數(shù)表示;待插入水印的聲頻文件分段,對每段聲頻分別進行頻域變換,獲得頻譜文件;在每段頻譜文件中嵌入一位一維二值序列組水印數(shù)據(jù),所述嵌入方法是量化修改頻譜文件系數(shù)的方法;進行反變換,獲得嵌入水印的聲頻數(shù)據(jù),與其余未處理的聲頻數(shù)據(jù)組合,即得到帶有數(shù)字水印的聲頻數(shù)字文件。識別時進行反向分離操作。本發(fā)明有效解決了數(shù)字聲頻產(chǎn)品的版權(quán)認證問題。
文檔編號G10L19/00GK101345054SQ20081019625
公開日2009年1月14日 申請日期2008年8月25日 優(yōu)先權(quán)日2008年8月25日
發(fā)明者智 陶, 顧濟華, 趙鶴鳴, 俊 吳 申請人:蘇州大學