一種基于偽Zernike矩的語(yǔ)音內(nèi)容認(rèn)證方法

文檔序號(hào)：2833322閱讀：261來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專(zhuān)利名稱(chēng)：一種基于偽Zernike矩的語(yǔ)音內(nèi)容認(rèn)證方法
技術(shù)領(lǐng)域：
本發(fā)明涉及ー種語(yǔ)音識(shí)別，尤其是語(yǔ)音內(nèi)容真實(shí)性和完整性認(rèn)證問(wèn)題的解決方法。
背景技術(shù)：
近年來(lái)，數(shù)字化語(yǔ)音通信的迅猛發(fā)展和各種語(yǔ)音產(chǎn)品的廣泛普及，以及各種功能強(qiáng)大的音頻處理軟件的出現(xiàn)，使得數(shù)字語(yǔ)音的傳輸與應(yīng)用日益變得頻繁與廣泛。與此同吋，篡改傳輸和存儲(chǔ)的語(yǔ)音內(nèi)容數(shù)據(jù)變得相對(duì)容易。例如，一段重要的法庭證詞錄音，在存儲(chǔ)、傳輸過(guò)程中如果要害部分內(nèi)容被惡意篡改，其后果可想而知！。因此，如何鑒別一段重要或敏感的語(yǔ)音內(nèi)容是否被篡改過(guò)，哪里被篡改了，語(yǔ)音記錄來(lái)源是否真實(shí) 、可信，這些涉及數(shù)字語(yǔ)音真實(shí)性的認(rèn)證問(wèn)題，引起了國(guó)內(nèi)外學(xué)者極大的研究興趣。音頻水印技術(shù)作為ー種保護(hù)音頻的技術(shù)手段，從上世紀(jì)90年代出現(xiàn)就受到了人們的重視，并成為信息安全研究領(lǐng)域的熱點(diǎn)。與音頻信號(hào)相比，語(yǔ)音信號(hào)具有采樣率低，對(duì)常規(guī)信號(hào)處理更加敏感等特點(diǎn)。因此，現(xiàn)有的很多音頻內(nèi)容認(rèn)證算法無(wú)法用于語(yǔ)音內(nèi)容認(rèn)證，或者用于語(yǔ)音內(nèi)容認(rèn)證的效果不是很理想。現(xiàn)實(shí)生活中，針對(duì)音頻更多的是解決版權(quán)保護(hù)問(wèn)題，而針對(duì)語(yǔ)音則更多的是解決內(nèi)容真實(shí)性和完整性認(rèn)證問(wèn)題?；跀?shù)字水印的語(yǔ)音內(nèi)容認(rèn)證技術(shù)，如果嵌入的水印與語(yǔ)音自身內(nèi)容無(wú)關(guān)，一方面會(huì)増加信息的傳輸量，另ー方面也存在一定的安全隱患，所以基于語(yǔ)音自身特征或內(nèi)容來(lái)生成水印的語(yǔ)音認(rèn)證算法就更具有研究意義和實(shí)用價(jià)值。偽Zernike矩(Zernike矩)的幅值具有旋轉(zhuǎn)不變性的特征，該特征已廣泛地應(yīng)用于圖像表不、圖像檢索和圖像水印等領(lǐng)域，而在首頻上的應(yīng)用還很少。文獻(xiàn)“Robustaudio watermarking based on low-order Zernike moments，. (Xiang Shi-jun, HuangJi-wu, Yang Rui, 5th International Workshop on Digital Watermarking, pp226-240,Oct. 2006)首先對(duì)音頻進(jìn)行ー維到ニ維的變換，然后對(duì)相應(yīng)的ニ維信號(hào)進(jìn)行Zernike變換。通過(guò)實(shí)驗(yàn)證明了 Zernike矩的幅值對(duì)常規(guī)信號(hào)處理具有很強(qiáng)的魯棒性；同時(shí)分析了Zernike矩的幅值和音頻樣本值的線(xiàn)性關(guān)系，由此提出了基于低階Zernike矩的魯棒音頻7jC印算法。又獻(xiàn)“A pseudo-Zernike moments based audio watermarking scheme robustagainst desynchronization attacks，， (Wang Xiang-yang, Ma Tian-xiao, Niu Pan-pan,Computers and Electrical Engineering, vol.37, no.4, pp. 425-443, July 2011)首先在時(shí)域基于統(tǒng)計(jì)均值嵌入同步碼，然后量化偽Zernike矩的幅值嵌入水印，提出了基于偽Zernike矩的抗同步攻擊的音頻水印算法。對(duì)于上述的基于偽Zernike矩(Zernike矩)的水印算法，一方面，需要計(jì)算所有樣本點(diǎn)的偽Zernike矩，計(jì)算量較大，耗費(fèi)的時(shí)間較長(zhǎng)。水印的嵌入是通過(guò)同比例地縮放各音頻段的樣本值來(lái)完成的。分析表明，直接縮放音頻樣本值對(duì)原始音頻的改變量較大，對(duì)原始音頻信號(hào)的質(zhì)量造成較大的破壞；另ー方面，水印的嵌入位置和方法是公開(kāi)的，各音頻幀的特征(偽Zernike矩)的計(jì)算也是已知的。于是，攻擊者可以找到各音頻幀的位置并計(jì)算每幀的特征，重新量化偽Zernike矩來(lái)去除嵌入的水印，使算法失去保護(hù)版權(quán)的作用。或者，攻擊者可以使用其它的音頻段來(lái)替換含水印的音頻，然后量化替換后的音頻內(nèi)容，使其滿(mǎn)足水印正確提取的條件，對(duì)其內(nèi)容實(shí)施攻擊。因此，研究基于內(nèi)容的抗攻擊能力強(qiáng)的語(yǔ)音內(nèi)容認(rèn)證算法具有重要的現(xiàn)實(shí)意義。

發(fā)明內(nèi)容
鑒于現(xiàn)有技術(shù)的不足，本發(fā)明的目的在于提供ー種基于偽Zernike矩的語(yǔ)音內(nèi)容認(rèn)證算法，該算法能夠有效地區(qū)分對(duì)語(yǔ)音的常規(guī)信號(hào)處理操作和惡意攻擊，井能有效定位語(yǔ)音內(nèi)容惡意篡改的位置，從而實(shí)現(xiàn)語(yǔ)音內(nèi)容的真實(shí)性和完整性認(rèn)證。為實(shí)現(xiàn)這樣的目的，本發(fā)明以DCT低頻系數(shù)的偽Zernike矩幅值對(duì)常規(guī)信號(hào)處理的魯棒性為依據(jù)，設(shè)計(jì)了一種新的水印生成和嵌入方法。
—種基于偽Zernike矩的語(yǔ)音內(nèi)容認(rèn)證方法，能夠有效區(qū)分常規(guī)信號(hào)處理操作和惡意攻擊，同時(shí)對(duì)惡意攻擊能夠有效地篡改定位。從而實(shí)現(xiàn)語(yǔ)音內(nèi)容的真實(shí)性和完整性認(rèn)證，包括如下具體步驟(I)水印嵌入首先從語(yǔ)音信號(hào)的第K個(gè)樣本點(diǎn)開(kāi)始將原始語(yǔ)音信號(hào)A分為P幀(K作為水印系統(tǒng)的密鑰)，并將每幀分為N段。然后計(jì)算每幀前N/2段DCT低頻系數(shù)的η階偽Zernike矩幅值之和,并求出偽Zernike矩幅值的均值，由均值生成水印W。將得到的水印通過(guò)量化DCT低頻系數(shù)的偽Zernike矩嵌入在每幀的后Ν/2段中，得到的含水印的語(yǔ)音信號(hào)記為A'(2)語(yǔ)音內(nèi)容認(rèn)證過(guò)程與水印嵌入過(guò)程類(lèi)似，首先從待檢測(cè)語(yǔ)音信號(hào)的第Ic1個(gè)樣本點(diǎn)開(kāi)始將A*分為P幀，每幀分為N段。計(jì)算每幀前N/2段DCT低頻系數(shù)的η階偽Zernike矩幅值之和，并求其均值，由均值生成水印W'。計(jì)算每幀后Ν/2段DCT低頻系數(shù)的η階偽Zernike矩幅值，由Zernike矩的幅值提取出水印W*。比較W*和W'，判斷那些對(duì)應(yīng)位不同的地方為語(yǔ)音信號(hào)被篡改過(guò)的位置，從而實(shí)現(xiàn)了語(yǔ)音內(nèi)容真實(shí)性和完整性認(rèn)證。與現(xiàn)有的用于內(nèi)容認(rèn)證的語(yǔ)音水印算法相比，本發(fā)明利用語(yǔ)音的內(nèi)容來(lái)生成水印，接收端在收到語(yǔ)音信號(hào)的同時(shí)也收到了嵌入在語(yǔ)音信號(hào)中的水印。從而減少了傳輸帶寬，節(jié)約了資源；同時(shí)也增強(qiáng)了水印傳送的安全性。水印的嵌入只需要對(duì)DCT低頻系數(shù)進(jìn)行偽Zernike變換，提高了算法的效率和水印容忍常規(guī)信號(hào)處理的能力。于是本發(fā)明更易于實(shí)際應(yīng)用。

圖I為本發(fā)明實(shí)施例的含水印語(yǔ)音信號(hào)圖。圖2為對(duì)圖I部分語(yǔ)音內(nèi)容靜音攻擊后的語(yǔ)音信號(hào)圖。圖3為對(duì)圖I部分內(nèi)容替換攻擊后對(duì)應(yīng)的語(yǔ)音信號(hào)圖。圖4為圖2的篡改定位結(jié)果。圖5為圖3的篡改定位結(jié)果。圖6為不可聽(tīng)性測(cè)試結(jié)果列表。圖7為對(duì)常規(guī)信號(hào)處理的魯棒性測(cè)試結(jié)果列表。
具體實(shí)施例方式以下結(jié)合附錄和實(shí)施例對(duì)本發(fā)明的技術(shù)方案作進(jìn)ー步描述。
I、水印的生成和嵌入(I)語(yǔ)音數(shù)據(jù)的分幀以及每幀語(yǔ)音段的劃分。將原始語(yǔ)音信號(hào)A= {a(l),I彡I彡LA+K}分為P幀(K作為水印系統(tǒng)的密鑰)，每幀長(zhǎng)為I = LA/P，第i幀記為A⑴(i=I，2，. . .，P)。每幀等分為N段，每段的長(zhǎng)為I/N，第i幀第j段記為A (i，j)，I彡i彡P(guān)，I < j < N。(2)DCT變換。對(duì)A(i，j)做DCT變換，D(i，j)表示第i幀第j段的DCT系數(shù)，取i幀前N/2段的DCT系數(shù)記為D1 (i，j)。(3)計(jì)算η階m重偽Zernike矩。將D1 (i, j)的前Iii1 Xm1個(gè)低頻系數(shù)變換為ニ維信號(hào)。按照如下方法計(jì)算其η階m重偽Zernike矩記IV1J為偽Zernike多項(xiàng)式,它是一系列復(fù)值多項(xiàng)式構(gòu)成的集合，IVnJ構(gòu)成單位圓內(nèi)的完備正交基，其定義如下式 Vnm (x, y) = Vnm ( P , Θ ) = Rnm ( p ) exp (im Θ )其中η為非負(fù)整數(shù)，m為滿(mǎn)足I m I彡η的整數(shù)。記坐標(biāo)原點(diǎn)到點(diǎn)(x，y)的向量為1，P = I I I，Θ為X軸正向到向量I逆時(shí)針?lè)较虻膴A角。Rnm(P)為徑向多項(xiàng)式，即
剛尺》,^SBffcrs坐標(biāo)平面內(nèi)的ニ維信號(hào)f (X，y) (x2+y2 く I)可以表示為Vnm(x，y)的線(xiàn)性組合，如下式/(X, ν) = Σ Σ A-V:(ろ y)
n=0 m=—n其中Fこ和Vnm(Xd)互為共軛復(fù)數(shù)，Anm為η階m重偽Zernike矩，定義如下
Λ =—ΣΣ/(χ^y)rニ(ろタ)，χ2 + タ2く1
X y(4)語(yǔ)音水印的生成。取各幀的前N/2段來(lái)生成水印。記Q(U)=ZM-1，
m=-n
I彡i彡P(guān), I彡j彡N/2為η階偽Zernike矩的幅值之和，計(jì)算C1 (i, j)的均值
_ mI
C1 =。記Ιζρ)」的最高位為札⑴，MJi)對(duì)應(yīng)的ニ進(jìn)制設(shè)為W1Q)=
{Wl(i，t)，l彡t彡N/2}, W1 (i)即為i幀生成的水印。(5)水印的嵌入。取i幀后N/2段的DCT系數(shù)記為D2(i，j)，N2+1彡j彡N，將D2 (i, j)的前m2Xm2個(gè)低頻系數(shù)變換為ニ維信號(hào)，并計(jì)算其η階偽Zernike矩幅值之和,記為(2(しj)。記1(^0,ゾ)」的最高位為ル(し」)，水印按照下面的方法嵌入當(dāng)W1 (i，t) = I 時(shí)
,,、丨ル/, (L11)， M., (/', /) mod 2 = IM'Mj) = \ 八t [八t [
I Μ、I /) + 1, Μ, (/, j) mod 2 = 0當(dāng)W1 (i, j) = 0 時(shí)
[M7(ZJ), M2(i,j)mod2 = 0M'2(i,j) = \ '、
A/. (/./) +1. M-,(/,/lmod2 = l
上式中，當(dāng)M2 (i, j) = 9 時(shí)，M2' (i, j) = M2 (i, j)-I ; j = t+N2,1 く t く Ν2。用M2, (i，j)替換C2(i，j)整數(shù)部分最高位，并將次高位量化為5，對(duì)應(yīng)的值記為C2' (i，j)。將ら(しj)的前Hi2Xm2個(gè)低頻系數(shù)擴(kuò)大a2(i，j)倍，對(duì)應(yīng)的值記為Dノ (i，j)，a2(i, j)可由下式得到
權(quán)利要求
1. 一種基于偽Zernike矩的語(yǔ)音內(nèi)容認(rèn)證方法，用以區(qū)分常規(guī)信號(hào)處理操作和惡意攻擊，同時(shí)對(duì)惡意攻擊能夠有效地篡改定位，具體步驟包括 (1)水印嵌入首先從語(yǔ)音信號(hào)的第K個(gè)樣本點(diǎn)開(kāi)始將原始語(yǔ)音信號(hào)A分為P幀，并將每幀分為N段；然后計(jì)算每幀前N/2段離散余弦變DCT低頻系數(shù)的η階偽Zernike矩幅值之和，并求出偽Zernike矩幅值的均值，由均值生成水印W ;將得到的水印通過(guò)量化DCT低頻系數(shù)的偽Zernike矩嵌入在每幀的后Ν/2段中，得到含水印語(yǔ)音A'； (2)語(yǔ)音內(nèi)容認(rèn)證過(guò)程與水印嵌入過(guò)程類(lèi)似，首先從待檢測(cè)語(yǔ)音信號(hào)k*的第Ic1個(gè)樣本點(diǎn)開(kāi)始將語(yǔ)音分為P幀，每幀分為N段。計(jì)算每幀前N/2段DCT低頻系數(shù)的η階偽Zernike矩幅值之和，并求其均值，由均值生成水印r ;計(jì)算每幀后N/2段DCT低頻系數(shù)的η階偽Zernike矩幅值，由Zernike矩的幅值提取出水印W* ;比較W*和f，判斷對(duì)應(yīng)位不同的地方為語(yǔ)音信號(hào)被篡改過(guò)的位置，從而實(shí)現(xiàn)了語(yǔ)音內(nèi)容真實(shí)性和完整性認(rèn)證。
全文摘要
本發(fā)明公開(kāi)了一種基于偽Zernike矩的語(yǔ)音內(nèi)容認(rèn)證方法，水印嵌入時(shí)將原始語(yǔ)音信號(hào)A分為P幀，每幀分為N段。然后，由每幀前N/2段DCT低頻系數(shù)的n階偽Zernike矩幅值的平均值生成水印W，并通過(guò)量化每幀的后N/2段DCT低頻系數(shù)的偽Zernike矩來(lái)嵌入水印，得到含水印語(yǔ)音A′。本發(fā)明充分利用了語(yǔ)音信號(hào)DCT低頻系數(shù)的偽Zernike矩幅值與語(yǔ)音內(nèi)容緊密相關(guān)的特性，以及對(duì)常規(guī)語(yǔ)音信號(hào)處理的魯棒性，既保證了對(duì)惡意篡改攻擊的敏感性，又保證了良好的容忍一定常規(guī)語(yǔ)音信號(hào)處理能力。
文檔編號(hào)G10L17/00GK102867513SQ20121027872
公開(kāi)日2013年1月9日申請(qǐng)日期2012年8月7日優(yōu)先權(quán)日2012年8月7日
發(fā)明者王宏霞, 劉正輝申請(qǐng)人:西南交通大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王宏霞;劉正輝
技術(shù)所有人：西南交通大學(xué)
我是此專(zhuān)利的發(fā)明人

上一篇：信息處理設(shè)備、信息處理方法和程序的制作方法
上一篇：延音復(fù)振琴的制作方法

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于偽Zernike矩的語(yǔ)音內(nèi)容認(rèn)證方法