專(zhuān)利名稱(chēng):一種基于偽Zernike矩的語(yǔ)音內(nèi)容認(rèn)證方法
技術(shù)領(lǐng)域:
本發(fā)明涉及ー種語(yǔ)音識(shí)別,尤其是語(yǔ)音內(nèi)容真實(shí)性和完整性認(rèn)證問(wèn)題的解決方法。
背景技術(shù):
近年來(lái),數(shù)字化語(yǔ)音通信的迅猛發(fā)展和各種語(yǔ)音產(chǎn)品的廣泛普及,以及各種功能強(qiáng)大的音頻處理軟件的出現(xiàn),使得數(shù)字語(yǔ)音的傳輸與應(yīng)用日益變得頻繁與廣泛。與此同吋,篡改傳輸和存儲(chǔ)的語(yǔ)音內(nèi)容數(shù)據(jù)變得相對(duì)容易。例如,一段重要的法庭證詞錄音,在存儲(chǔ)、傳輸過(guò)程中如果要害部分內(nèi)容被惡意篡改,其后果可想而知!。因此,如何鑒別一段重要或敏感的語(yǔ)音內(nèi)容是否被篡改過(guò),哪里被篡改了,語(yǔ)音記錄來(lái)源是否真實(shí) 、可信,這些涉及數(shù)字語(yǔ)音真實(shí)性的認(rèn)證問(wèn)題,引起了國(guó)內(nèi)外學(xué)者極大的研究興趣。音頻水印技術(shù)作為ー種保護(hù)音頻的技術(shù)手段,從上世紀(jì)90年代出現(xiàn)就受到了人們的重視,并成為信息安全研究領(lǐng)域的熱點(diǎn)。與音頻信號(hào)相比,語(yǔ)音信號(hào)具有采樣率低,對(duì)常規(guī)信號(hào)處理更加敏感等特點(diǎn)。因此,現(xiàn)有的很多音頻內(nèi)容認(rèn)證算法無(wú)法用于語(yǔ)音內(nèi)容認(rèn)證,或者用于語(yǔ)音內(nèi)容認(rèn)證的效果不是很理想。現(xiàn)實(shí)生活中,針對(duì)音頻更多的是解決版權(quán)保護(hù)問(wèn)題,而針對(duì)語(yǔ)音則更多的是解決內(nèi)容真實(shí)性和完整性認(rèn)證問(wèn)題?;跀?shù)字水印的語(yǔ)音內(nèi)容認(rèn)證技術(shù),如果嵌入的水印與語(yǔ)音自身內(nèi)容無(wú)關(guān),一方面會(huì)増加信息的傳輸量,另ー方面也存在一定的安全隱患,所以基于語(yǔ)音自身特征或內(nèi)容來(lái)生成水印的語(yǔ)音認(rèn)證算法就更具有研究意義和實(shí)用價(jià)值。偽Zernike矩(Zernike矩)的幅值具有旋轉(zhuǎn)不變性的特征,該特征已廣泛地應(yīng)用于圖像表不、圖像檢索和圖像水印等領(lǐng)域,而在首頻上的應(yīng)用還很少。文獻(xiàn)“Robustaudio watermarking based on low-order Zernike moments,. (Xiang Shi-jun, HuangJi-wu, Yang Rui, 5th International Workshop on Digital Watermarking, pp226-240,Oct. 2006)首先對(duì)音頻進(jìn)行ー維到ニ維的變換,然后對(duì)相應(yīng)的ニ維信號(hào)進(jìn)行Zernike變換。通過(guò)實(shí)驗(yàn)證明了 Zernike矩的幅值對(duì)常規(guī)信號(hào)處理具有很強(qiáng)的魯棒性;同時(shí)分析了Zernike矩的幅值和音頻樣本值的線(xiàn)性關(guān)系,由此提出了基于低階Zernike矩的魯棒音頻7jC印算法。又獻(xiàn)“A pseudo-Zernike moments based audio watermarking scheme robustagainst desynchronization attacks,, (Wang Xiang-yang, Ma Tian-xiao, Niu Pan-pan,Computers and Electrical Engineering, vol.37, no.4, pp. 425-443, July 2011)首先在時(shí)域基于統(tǒng)計(jì)均值嵌入同步碼,然后量化偽Zernike矩的幅值嵌入水印,提出了基于偽Zernike矩的抗同步攻擊的音頻水印算法。對(duì)于上述的基于偽Zernike矩(Zernike矩)的水印算法,一方面,需要計(jì)算所有樣本點(diǎn)的偽Zernike矩,計(jì)算量較大,耗費(fèi)的時(shí)間較長(zhǎng)。水印的嵌入是通過(guò)同比例地縮放各音頻段的樣本值來(lái)完成的。分析表明,直接縮放音頻樣本值對(duì)原始音頻的改變量較大,對(duì)原始音頻信號(hào)的質(zhì)量造成較大的破壞;另ー方面,水印的嵌入位置和方法是公開(kāi)的,各音頻幀的特征(偽Zernike矩)的計(jì)算也是已知的。于是,攻擊者可以找到各音頻幀的位置并計(jì)算每幀的特征,重新量化偽Zernike矩來(lái)去除嵌入的水印,使算法失去保護(hù)版權(quán)的作用。或者,攻擊者可以使用其它的音頻段來(lái)替換含水印的音頻,然后量化替換后的音頻內(nèi)容,使其滿(mǎn)足水印正確提取的條件,對(duì)其內(nèi)容實(shí)施攻擊。因此,研究基于內(nèi)容的抗攻擊能力強(qiáng)的語(yǔ)音內(nèi)容認(rèn)證算法具有重要的現(xiàn)實(shí)意義。
發(fā)明內(nèi)容
鑒于現(xiàn)有技術(shù)的不足,本發(fā)明的目的在于提供ー種基于偽Zernike矩的語(yǔ)音內(nèi)容認(rèn)證算法,該算法能夠有效地區(qū)分對(duì)語(yǔ)音的常規(guī)信號(hào)處理操作和惡意攻擊,井能有效定位語(yǔ)音內(nèi)容惡意篡改的位置,從而實(shí)現(xiàn)語(yǔ)音內(nèi)容的真實(shí)性和完整性認(rèn)證。為實(shí)現(xiàn)這樣的目的,本發(fā)明以DCT低頻系數(shù)的偽Zernike矩幅值對(duì)常規(guī)信號(hào)處理的魯棒性為依據(jù),設(shè)計(jì)了一種新的水印生成和嵌入方法。
—種基于偽Zernike矩的語(yǔ)音內(nèi)容認(rèn)證方法,能夠有效區(qū)分常規(guī)信號(hào)處理操作和惡意攻擊,同時(shí)對(duì)惡意攻擊能夠有效地篡改定位。從而實(shí)現(xiàn)語(yǔ)音內(nèi)容的真實(shí)性和完整性認(rèn)證,包括如下具體步驟(I)水印嵌入首先從語(yǔ)音信號(hào)的第K個(gè)樣本點(diǎn)開(kāi)始將原始語(yǔ)音信號(hào)A分為P幀(K作為水印系統(tǒng)的密鑰),并將每幀分為N段。然后計(jì)算每幀前N/2段DCT低頻系數(shù)的η階偽Zernike矩幅值之和,并求出偽Zernike矩幅值的均值,由均值生成水印W。將得到的水印通過(guò)量化DCT低頻系數(shù)的偽Zernike矩嵌入在每幀的后Ν/2段中,得到的含水印的語(yǔ)音信號(hào)記為A'(2)語(yǔ)音內(nèi)容認(rèn)證過(guò)程與水印嵌入過(guò)程類(lèi)似,首先從待檢測(cè)語(yǔ)音信號(hào)的第Ic1個(gè)樣本點(diǎn)開(kāi)始將A*分為P幀,每幀分為N段。計(jì)算每幀前N/2段DCT低頻系數(shù)的η階偽Zernike矩幅值之和,并求其均值,由均值生成水印W'。計(jì)算每幀后Ν/2段DCT低頻系數(shù)的η階偽Zernike矩幅值,由Zernike矩的幅值提取出水印W*。比較W*和W',判斷那些對(duì)應(yīng)位不同的地方為語(yǔ)音信號(hào)被篡改過(guò)的位置,從而實(shí)現(xiàn)了語(yǔ)音內(nèi)容真實(shí)性和完整性認(rèn)證。與現(xiàn)有的用于內(nèi)容認(rèn)證的語(yǔ)音水印算法相比,本發(fā)明利用語(yǔ)音的內(nèi)容來(lái)生成水印,接收端在收到語(yǔ)音信號(hào)的同時(shí)也收到了嵌入在語(yǔ)音信號(hào)中的水印。從而減少了傳輸帶寬,節(jié)約了資源;同時(shí)也增強(qiáng)了水印傳送的安全性。水印的嵌入只需要對(duì)DCT低頻系數(shù)進(jìn)行偽Zernike變換,提高了算法的效率和水印容忍常規(guī)信號(hào)處理的能力。于是本發(fā)明更易于實(shí)際應(yīng)用。
圖I為本發(fā)明實(shí)施例的含水印語(yǔ)音信號(hào)圖。圖2為對(duì)圖I部分語(yǔ)音內(nèi)容靜音攻擊后的語(yǔ)音信號(hào)圖。圖3為對(duì)圖I部分內(nèi)容替換攻擊后對(duì)應(yīng)的語(yǔ)音信號(hào)圖。圖4為圖2的篡改定位結(jié)果。圖5為圖3的篡改定位結(jié)果。圖6為不可聽(tīng)性測(cè)試結(jié)果列表。圖7為對(duì)常規(guī)信號(hào)處理的魯棒性測(cè)試結(jié)果列表。
具體實(shí)施例方式以下結(jié)合附錄和實(shí)施例對(duì)本發(fā)明的技術(shù)方案作進(jìn)ー步描述。
I、水印的生成和嵌入(I)語(yǔ)音數(shù)據(jù)的分幀以及每幀語(yǔ)音段的劃分。將原始語(yǔ)音信號(hào)A= {a(l),I彡I彡LA+K}分為P幀(K作為水印系統(tǒng)的密鑰),每幀長(zhǎng)為I = LA/P,第i幀記為A⑴(i=I,2,. . .,P)。每幀等分為N段,每段的長(zhǎng)為I/N,第i幀第j段記為A (i,j),I彡i彡P(guān),I < j < N。(2)DCT變換。對(duì)A(i,j)做DCT變換,D(i,j)表示第i幀第j段的DCT系數(shù),取i幀前N/2段的DCT系數(shù)記為D1 (i,j)。(3)計(jì)算η階m重偽Zernike矩。將D1 (i, j)的前Iii1 Xm1個(gè)低頻系數(shù)變換為ニ維信號(hào)。按照如下方法計(jì)算其η階m重偽Zernike矩記IV1J為偽Zernike多項(xiàng)式,它是一系列復(fù)值多項(xiàng)式構(gòu)成的集合,IVnJ構(gòu)成單位圓內(nèi)的完備正交基,其定義如下式 Vnm (x, y) = Vnm ( P , Θ ) = Rnm ( p ) exp (im Θ )其中η為非負(fù)整數(shù),m為滿(mǎn)足I m I彡η的整數(shù)。記坐標(biāo)原點(diǎn)到點(diǎn)(x,y)的向量為1,P = I I I,Θ為X軸正向到向量I逆時(shí)針?lè)较虻膴A角。Rnm(P)為徑向多項(xiàng)式,即
剛尺》,^SBffcrs坐標(biāo)平面內(nèi)的ニ維信號(hào)f (X,y) (x2+y2 く I)可以表示為Vnm(x,y)的線(xiàn)性組合,如下式/(X, ν) = Σ Σ A-V:(ろ y)
n=0 m=—n其中Fこ和Vnm(Xd)互為共軛復(fù)數(shù),Anm為η階m重偽Zernike矩,定義如下
Λ =—ΣΣ/(χ^y)rニ(ろタ),χ2 + タ2く1
X y(4)語(yǔ)音水印的生成。取各幀的前N/2段來(lái)生成水印。記Q(U)=ZM-1,
m=-n
I彡i彡P(guān), I彡j彡N/2為η階偽Zernike矩的幅值之和,計(jì)算C1 (i, j)的均值
_ mI
C1 =。記Ιζρ)」的最高位為札⑴,MJi)對(duì)應(yīng)的ニ進(jìn)制設(shè)為W1Q)=
{Wl(i,t),l彡t彡N/2}, W1 (i)即為i幀生成的水印。(5)水印的嵌入。取i幀后N/2段的DCT系數(shù)記為D2(i,j),N2+1彡j彡N,將D2 (i, j)的前m2Xm2個(gè)低頻系數(shù)變換為ニ維信號(hào),并計(jì)算其η階偽Zernike矩幅值之和,記為(2(しj)。記1(^0,ゾ)」的最高位為ル(し」),水印按照下面的方法嵌入當(dāng)W1 (i,t) = I 時(shí)
,,、丨ル/, (L11), M., (/', /) mod 2 = IM'Mj) = \ 八t [八t [
I Μ、I /) + 1, Μ, (/, j) mod 2 = 0當(dāng)W1 (i, j) = 0 時(shí)
[M7(ZJ), M2(i,j)mod2 = 0M'2(i,j) = \ '、
A/. (/./) +1. M-,(/,/lmod2 = l
上式中,當(dāng)M2 (i, j) = 9 時(shí),M2' (i, j) = M2 (i, j)-I ; j = t+N2,1 く t く Ν2。用M2, (i,j)替換C2(i,j)整數(shù)部分最高位,并將次高位量化為5,對(duì)應(yīng)的值記為C2' (i,j)。將ら(しj)的前Hi2Xm2個(gè)低頻系數(shù)擴(kuò)大a2(i,j)倍,對(duì)應(yīng)的值記為Dノ (i,j),a2(i, j)可由下式得到
權(quán)利要求
1. 一種基于偽Zernike矩的語(yǔ)音內(nèi)容認(rèn)證方法,用以區(qū)分常規(guī)信號(hào)處理操作和惡意攻擊,同時(shí)對(duì)惡意攻擊能夠有效地篡改定位,具體步驟包括 (1)水印嵌入首先從語(yǔ)音信號(hào)的第K個(gè)樣本點(diǎn)開(kāi)始將原始語(yǔ)音信號(hào)A分為P幀,并將每幀分為N段;然后計(jì)算每幀前N/2段離散余弦變DCT低頻系數(shù)的η階偽Zernike矩幅值之和,并求出偽Zernike矩幅值的均值,由均值生成水印W ;將得到的水印通過(guò)量化DCT低頻系數(shù)的偽Zernike矩嵌入在每幀的后Ν/2段中,得到含水印語(yǔ)音A'; (2)語(yǔ)音內(nèi)容認(rèn)證過(guò)程與水印嵌入過(guò)程類(lèi)似,首先從待檢測(cè)語(yǔ)音信號(hào)k*的第Ic1個(gè)樣本點(diǎn)開(kāi)始將語(yǔ)音分為P幀,每幀分為N段。計(jì)算每幀前N/2段DCT低頻系數(shù)的η階偽Zernike矩幅值之和,并求其均值,由均值生成水印r ;計(jì)算每幀后N/2段DCT低頻系數(shù)的η階偽Zernike矩幅值,由Zernike矩的幅值提取出水印W* ;比較W*和f,判斷對(duì)應(yīng)位不同的地方為語(yǔ)音信號(hào)被篡改過(guò)的位置,從而實(shí)現(xiàn)了語(yǔ)音內(nèi)容真實(shí)性和完整性認(rèn)證。
全文摘要
本發(fā)明公開(kāi)了一種基于偽Zernike矩的語(yǔ)音內(nèi)容認(rèn)證方法,水印嵌入時(shí)將原始語(yǔ)音信號(hào)A分為P幀,每幀分為N段。然后,由每幀前N/2段DCT低頻系數(shù)的n階偽Zernike矩幅值的平均值生成水印W,并通過(guò)量化每幀的后N/2段DCT低頻系數(shù)的偽Zernike矩來(lái)嵌入水印,得到含水印語(yǔ)音A′。本發(fā)明充分利用了語(yǔ)音信號(hào)DCT低頻系數(shù)的偽Zernike矩幅值與語(yǔ)音內(nèi)容緊密相關(guān)的特性,以及對(duì)常規(guī)語(yǔ)音信號(hào)處理的魯棒性,既保證了對(duì)惡意篡改攻擊的敏感性,又保證了良好的容忍一定常規(guī)語(yǔ)音信號(hào)處理能力。
文檔編號(hào)G10L17/00GK102867513SQ20121027872
公開(kāi)日2013年1月9日 申請(qǐng)日期2012年8月7日 優(yōu)先權(quán)日2012年8月7日
發(fā)明者王宏霞, 劉正輝 申請(qǐng)人:西南交通大學(xué)