一種基于視覺注意機制的視頻水印方法
【專利摘要】本發(fā)明公開一種基于視覺注意機制的視頻水印方法,選擇MPEG-2視頻關(guān)鍵幀的視覺非顯著區(qū)域的DCT域嵌入二進制水印信息,實現(xiàn)視頻版權(quán)保護的目的。本發(fā)明包括以下步驟:解碼載體視頻,獲取視頻關(guān)鍵幀I幀;采用Koch?and?Itti視覺顯著模型分析視頻關(guān)鍵幀的視覺顯著性,劃分視覺顯著區(qū)域;選擇人眼不太敏感的視覺非顯著區(qū)域,對亮度分量的DCT直流系數(shù)進行固定步長的奇偶量化索引調(diào)制,嵌入水印信息。分析已嵌入水印的視頻關(guān)鍵幀的視覺顯著性,判斷水印嵌入?yún)^(qū)域,根據(jù)水印嵌入規(guī)則提取水印信息。本發(fā)明有效利用了人眼視覺注意特性,提高了視頻水印的不可見性,且對常見的視頻攻擊有較好的魯棒性,有效緩解了水印不可見性與魯棒性之間的矛盾。
【專利說明】一種基于視覺注意機制的視頻水印方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種多媒體信息版權(quán)保護方法,具體是一種基于視覺注意機制的視頻水印方法,屬于信息安全【技術(shù)領(lǐng)域】。
【背景技術(shù)】
[0002]數(shù)字水印是一種有效解決知識產(chǎn)權(quán)糾紛的手段之一。視頻是互聯(lián)網(wǎng)上用戶生成內(nèi)容(UGC)的主要形式,便捷的獲取方式滋生了眾多侵權(quán)、盜版行為,因此如何使用視頻水印維護版權(quán)所有者的合法權(quán)益成為當下熱門的研究課題,權(quán)衡水印不可見性和魯棒性之間的矛盾依然是所有水印算法共同的目標。
[0003]視頻是一系列與時間相關(guān)的圖像序列,因此很多圖像水印算法也被運用到視頻水印中來[1]。同時由于視頻本身的特殊性:數(shù)據(jù)量大,數(shù)據(jù)結(jié)構(gòu)復(fù)雜,實時性要求,壓縮編碼標準,運動區(qū)域與非運動區(qū)域不均勻,遭受特定種類攻擊等,使得視頻水印的發(fā)展相對滯后
[2]。不同的視頻編碼標準對視頻水印造成局限性,成熟的MPEG-2,MPEG-4與最新的H.264/AVC視頻編碼標準對應(yīng)的視頻需各不相同的水印方案,這些都成為在視頻中嵌入魯棒的不可見水印的難以攻克的技術(shù)障礙。
[0004]視覺注意機制[3]在圖像水印中已經(jīng)有了較多研究,而視頻由于其復(fù)雜性,很少有算法在視頻水印中運用人眼視覺模型,大多數(shù)現(xiàn)有算法僅僅在變換域上或者運動矢量中嵌入水印,這樣得到的視頻往往畫質(zhì)變化較明顯,人眼容易察覺到視頻的失真,不能滿足水印的不可見性。根據(jù)人眼視覺特性,每一幀畫面上的信息都有視覺焦點區(qū)域和背景區(qū)域之分,焦點區(qū)域的內(nèi)容更吸引人眼的注意,因此如果在焦點區(qū)域嵌入水印,人眼十分容易感知到畫面的變化。
[0005]人眼具有快速從畫面中選取感興趣區(qū)域的能力,該興趣區(qū)域往往包含了整幅圖像中最重要的信息。Koch and Itti視覺顯著模型通過模擬人眼視覺注意過程,提取底層特征自動解析畫面中的視覺顯著區(qū)域,將顯著信息從背景區(qū)域分離出來。對視頻而言,視頻以特定幀率播放時,一個場景中人眼往往只會注意某一部分重要畫面,大部分背景被忽略。人眼感興趣區(qū)域中嵌入的水印對畫面造成的失真比其它區(qū)域更有可能引起人眼注意,水印嵌在人眼不太敏感的視覺非顯著區(qū)域更能保證水印的不可見性。引入視覺注意機制的視頻水印方案,劃分顯著區(qū)域后嵌入水印對緩解水印不可見性和魯棒性的矛盾有積極的作用。
[0006]參考文獻:
[0007][I] Πυ^?Γ Gj Dugelay J L.A guide tour of video watermarking [J].Signalprocessing:丄mage communicat1n.18(4):263-282,2003.
[0008][2]張江,趙黎,楊士強.視頻水印技術(shù)綜述[J].計算機應(yīng)用,04:850-852, 2005.
[0009][3]Borji A,Itti L State-of-the-art in visual attent1n modeling[J].1EEE Transact1ns on Pattern Analysis and Machine Intelligence.35(I):185-207,2013.
[0010][4]Itti L,Koch C,Niebur E.A model of saliency-based visual attent1nfor rapid scene analysis[J].1EEE Transact1ns on Pattern Analysis and MachineIntelligence.20(11):1254-1259,1998.
[0011][5]Itti L, Koch C.A saliency-based search mechanism for overt and covertshifts of visual attent1n[J].Vis1n research.40 (10):1489-1506, 2000.
【發(fā)明內(nèi)容】
[0012]發(fā)明目的:為了緩解視頻水印不可見性和魯棒性之間的矛盾,本發(fā)明提供一種基于視覺注意機制的視頻水印算法。采用Koch and Itti視覺顯著模型分析視頻關(guān)鍵幀的視覺顯著性,在視覺非顯著區(qū)域嵌入水印,降低人眼察覺水印嵌入的可能,提高水印不可見性。采用奇偶量化索引調(diào)制規(guī)則嵌入水印信息,保證算法對常見的視頻攻擊:高斯噪聲、椒鹽噪聲、乘性噪聲、亮度飽和度調(diào)節(jié)、均值濾波、幀刪除幀插入等具有較強的魯棒性。
[0013]技術(shù)方案:一種基于視覺注意機制的視頻水印方法,包括以下幾個步驟:
[0014]步驟A、解碼MPEG-2載體視頻,獲取待嵌水印的視頻關(guān)鍵幀;
[0015]步驟B、采用Koch and Itti視覺顯著模型分析視頻關(guān)鍵幀的視覺顯著性,劃分視覺顯著區(qū)域;
[0016]步驟C、選擇人眼不敏感的視覺非顯著區(qū)域作為水印嵌入?yún)^(qū)域,將亮度分量的DCT直流系數(shù)進行固定步長的奇偶量化索引調(diào)制嵌入置亂的二進制水印;
[0017]步驟D、以T幀為周期重復(fù)嵌入多次水印,每新嵌入一個水印,在第一個關(guān)鍵幀中嵌入真正的水印之前先嵌入一段標志序列P(N),用于定位提取水印時的幀起始位置;嵌完水印,重新編碼輸出含水印的MPEG-2視頻;
[0018]步驟E、解碼嵌入了水印的載體視頻,根據(jù)嵌入的標志序列定位已嵌水印的起始關(guān)鍵幀。分析水印嵌入幀的視覺顯著性判斷水印嵌入?yún)^(qū)域,根據(jù)奇偶量化索引調(diào)制的特點,從亮度分量的DCT直流系數(shù)中提取嵌入的水印。
[0019]作為本發(fā)明的一個優(yōu)選方案,利用視覺顯著模型劃分關(guān)鍵幀的視覺顯著區(qū)域,來確定水印的嵌入?yún)^(qū)域,具體步驟如下:
[0020]步驟B1、原始視頻幀通過線性濾波器分解為顏色、強度和方向三種特征。
[0021]其中,顏色特征將原來的RGB色彩空間的紅r、綠g、藍b重新定義為四色通道:紅R、綠G、藍B、黃Y,他們之間的關(guān)系如公式⑴所示:
[0022]R = T- (g+b) /2
[0023]G = g- (r+b) /2(I)
[0024]B = b- (r+g) /2
[0025]Y= (r+g)/2-1 r_g I/2_b
[0026]Koch and Itti模型通過計算顏色對之間的色差來表示顏色特征,定義紅綠(RG)和藍黃(BY)兩種對比通道。
[0027]RG = R-G(2)
[0028]BY = B-Y
[0029]強度特征由顏色分量決定,定義為:
[0030]I = (r+g+b) /3(3)
[0031]方向特征由二維Gabor濾波器對強度特征濾波,得到不同方向的局部特征。模型提取4個方向的方向特征圖0( θ ),Θ = {0°,45° ,90° ,135° }。
[0032]步驟Β2、采用高斯金字塔模型對濾波得到的顏色、強度、方向7種子特征進行逐級高斯濾波和降采樣,金字塔層級設(shè)為σ =0,1,2…8,層級O表示原圖,層級每增加一級,對上一級的圖像進行一次濾波和降采樣,橫向和縱向尺寸降為原來的一半,得到不同分辨率的特征子圖。
[0033]步驟Β3、采用中央-周邊差異算子將高斯金字塔模型得到的九層特征子圖進行跨尺度相減,計算中央?yún)^(qū)域與周邊區(qū)域的對比度。選取金字塔模型中的層級c = {2,3,4}作為中間層,選取s = c+S作為周邊層,δ = {2, 3}為差異因子,依次計算每個特征6對尺度間的特征圖,即{2-4,2-5,3-5 ,3-6,4-6,4-7}??绯叨认鄿p操作符用Θ表示。
[0034]I (c, s) = I I (C) Θ I (s)
[0035]RG (c, s) = I RG (C) Θ RG (s) |(4)
[0036]BY (c, s) = I BY (c) Θ BY (s) I
[0037]0(c, s, θ ) = |0(c, θ ) 0O(s, θ ) θ = {0。,45。,90。,135。}
[0038]其中,I (c)、I (s)表示高斯金字塔模型中中央層c層和周邊層s層上的強度特征,I (c,s)表示兩個層級間的強度對比特征;RG(c)、BY(C)和RG(S)、BY(S)分別表示中央層c層和周邊層s層上的紅綠和藍黃兩種顏色通道的特征,RG (c,s)、BY (c,s)表示兩個層級間的兩種顏色對比特征;0(c,0)、O(s,θ )表示方向為θ時中央層c層和周邊層s層上的方向特征,0(c,s,θ)表示方向為θ時兩個層級間的方向?qū)Ρ忍卣鳌?br>
[0039]最終,模型得到不同尺度下強度特征子圖6張,顏色特征子圖12張,方向特征子圖24張,共計42張顯著圖。
[0040]步驟Β4、將每個特征不同尺度下的顯著子圖合成一張顯著圖,采用非線性迭代歸一化算子Ν(.)依次處理42張顯著子圖,設(shè)置合適的迭代次數(shù)加強顯著區(qū)域,忽略平緩區(qū)域,步驟如下:
[0041](I)每張子圖的特征值歸一化至固定的區(qū)間[0,1];
[0042](2)尋找子圖中的全局最大值Μ,及除M外其余局部最大值的均值
[0043](3)圖中每個位置乘以放大系々(M-歷),若小于M的1/10,則置零;
[0044]經(jīng)過迭代歸一化操作得到每個特征不同尺度下的突出圖,將每個尺度映射至同一金字塔層級,選取層級σ = 3,進行跨尺度疊加,用符號Φ表示,分別得到強度、顏色、方向特征的突出圖。
[0045]強度突出圖:7=十二十:=+3iV(/(Cj))(5)
[0046]顏色突出圖:C=十;U 十:=[Λ/(抓(U)HA/(價(r..v))](6)
[0047]方向突出圖,=Σ(7).θ-{0%45\90°
[0048]將三個特征突出圖各自歸一化后線性疊加,得到最終的綜合視覺顯著圖SM:
【權(quán)利要求】
1.一種基于視覺注意機制的視頻水印方法,其特征在于:利用人眼視覺注意特性,將視頻關(guān)鍵幀劃分為視覺顯著區(qū)域和非顯著區(qū)域,選擇視覺非顯著區(qū)域的亮度分量作為水印嵌入?yún)^(qū)域,采用奇偶量化索引調(diào)制的方式嵌入水??;該方法具體包括以下步驟: 步驟A、解碼MPEG-2載體視頻,獲取待嵌水印的視頻關(guān)鍵幀; 步驟B、采用Koch and Itti視覺顯著模型分析視頻關(guān)鍵幀的視覺顯著性,劃分視覺顯著區(qū)域; 步驟C、選擇視覺非顯著區(qū)域作為水印嵌入?yún)^(qū)域,將亮度分量的DCT直流系數(shù)進行固定步長的奇偶量化索引調(diào)制嵌入置亂的二進制水??; 步驟D、以T幀為周期重復(fù)嵌入多次水印,每新嵌入一個水印,在第一個關(guān)鍵幀中嵌入真正的水印之前先嵌入一段標志序列P(N),用于定位提取水印時的幀起始位置;嵌完水印,重新編碼輸出含水印的MPEG-2視頻; 步驟E、解碼嵌入了水印的載體視頻,根據(jù)嵌入的標志序列定位已嵌水印的起始關(guān)鍵幀;分析水印嵌入幀的視覺顯著性判斷水印嵌入?yún)^(qū)域,根據(jù)奇偶量化索引調(diào)制的特點,從亮度分量的DCT直流系數(shù)中提取嵌入的水印。
2.如權(quán)利要求1所述的基于視覺注意機制的視頻水印方法,其特征在于,采用音視頻快速轉(zhuǎn)換平臺FFMPEG實現(xiàn)步驟A,具體過程如下: 采用FFMPEG系統(tǒng)構(gòu)建視頻水印嵌入、提取仿真平臺;首先將MPEG-2載體視頻解碼成YUV序列;然后根據(jù)關(guān)鍵巾貞標志位key_frame = l,pic_type = I,鎖定視頻關(guān)鍵巾貞I巾貞;最后根據(jù)一個完整的水印是否已嵌完和嵌入周期T,判斷當前關(guān)鍵幀是否為待嵌水印幀。
3.如權(quán)利要求1所述的基于視覺注意機制的視頻水印方法,其特征在于,采用Kochand Itti視覺顯著模型劃分人眼視覺顯著區(qū)域,步驟B具體包括以下步驟: 步驟B1、原始視頻幀通過線性濾波器分解為顏色、強度和方向三種特征; 其中,顏色特征將原來的RGB色彩空間的紅r、綠g、藍b重新定義為四色通道:紅R、綠G、藍B、黃Y,他們之間的關(guān)系如公式⑴所示:
R = r- (g+b)/2 G = g-(r+b)/2(I)
B = b- (r+g) /2
Y= (r+g)/2-|r-g|/2-b Koch and Itti模型通過計算顏色對之間的色差來表示顏色特征,定義紅綠(RG)和藍黃(BY)兩種對比通道; RG = R-G(2)
BY = B-Y 強度特征由顏色分量決定,定義為: I = (r+g+b)/3(3) 方向特征由二維Gabor濾波器對強度特征濾波,得到不同方向的局部特征;模型提取4個方向的方向特征圖0( Θ ),Θ = {O。,45°,90° ,135° }。 步驟B2、采用高斯金字塔模型對濾波得到的顏色、強度、方向7種子特征進行逐級高斯濾波和降采樣,金字塔層級設(shè)為σ =0,1,2…8,層級O表示原圖,層級每增加一級,對上一級的圖像進行一次濾波和降采樣,橫向和縱向尺寸降為原來的一半,得到不同分辨率的特征子圖; 步驟B3、采用中央-周邊差異算子將高斯金字塔模型得到的九層特征子圖進行跨尺度相減,計算中央?yún)^(qū)域與周邊區(qū)域的對比度;選取金字塔模型中的層級c = {2,3,4}作為中間層,選取s = c+S作為周邊層,δ = {2, 3}為差異因子,依次計算每個特征6對尺度間的特征圖,即{2-4,2-5,3-5,3-6,4-6,4-7};跨尺度相減操作符用Θ表示;
I (c, s) = 11 (c) Θ I (s) I RG (c, s) = I RG (c) Θ RG (s) |(4)
by (c, s) = |by(c) oby(s) 0(c, S,θ ) = |o(c, θ ) 00(S, θ ) I θ = {0。,45。,90。,135。} 最終,模型得到不同尺度下強度特征子圖6張,顏色特征子圖12張,方向特征子圖24張,共計42張顯著圖; 步驟B4、將每個特征不同尺度下的顯著子圖合成一張顯著圖,采用非線性迭代歸一化算子N(.)依次處理42張顯著子圖,設(shè)置合適的迭代次數(shù)加強顯著區(qū)域,忽略平緩區(qū)域,步驟如下: (1)每張子圖的特征值歸一化至固定的區(qū)間[0,1]; (2)尋找子圖中的全局最大值M,及除M外其余局部最大值的均值 (3)圖中每個位置乘以放大系數(shù)(M-,若小于M的1/10,則置零; 經(jīng)過迭代歸一化操作得到每個特征不同尺度下的突出圖,將每個尺度映射至同一金字塔層級,選取層級σ =3,進行跨尺度疊加,用符號Θ表示,分別得到強度、顏色、方向特征的突出圖; 強度突出圖:Γ = 0^2 十=+3 N(/(c,s))(5) 顏色突出圖:f =十;U 十.:=;[/VM(U) +.V))](6) 方向突出圖 0= Σ "Κ,3"_.,λ.,Θ))]Π)
'e={0\45\90M35J} 將三個特征突出圖各自歸一化后線性疊加,得到最終的綜合視覺顯著圖SM: SM = ^(AH/-)+.V(C) + N(O))(8) 步驟B5、采用Winner-Take-All競爭機制找出視覺最顯著焦點和半徑為R的圓形視覺最顯著區(qū)域;采用返回抑制策略屏蔽當前顯著區(qū)域,在剩余區(qū)域使用Winner-Take-All得到視覺第二焦點和第二顯著區(qū)域,依次劃分出視頻幀的前三個視覺最顯著區(qū)域。
4.如權(quán)利要求3所述的基于視覺注意機制的視頻水印方法,其特征在于,在人眼視覺不敏感的非顯著區(qū)域嵌入水印,所述步驟C具體包括以下步驟: 步驟Cl、根據(jù)步驟B中視覺顯著區(qū)域劃分的結(jié)果,選擇除三個視覺最顯著區(qū)域之外的區(qū)域作為視覺非顯著區(qū)域,將視覺非顯著區(qū)域作為水印嵌入?yún)^(qū)域; 步驟C2、將原始水印圖像轉(zhuǎn)換成置亂的二進制水印比特流;將關(guān)鍵幀亮度分量進行8X8DCT變換,獲取視覺非顯著區(qū)域第k個分塊的DCT直流系數(shù)DCTtlGO及當前待嵌水印W⑴; 步驟C3、采用奇偶量化索引調(diào)制規(guī)則,以固定步長D均勻量化DCTtlGO,修改系數(shù)嵌入水印,最終滿足公式(9):
其中,L.」表示向下取整; 若當前直流系數(shù)滿足公式(9),則調(diào)整后的直流系數(shù)為公式(10)所示:
若不滿足,根據(jù)系數(shù)在量化區(qū)間的位置,將直流系數(shù)調(diào)整為公式(11)所示:
步驟C4、將量化后的系數(shù)作為新的直流系數(shù),進行逆DCT變換,得到嵌入水印后視頻幀。
5.如權(quán)利要求1所述的基于視覺注意機制的視頻水印方法,其特征在于,所述步驟D具體包括以下步驟: 以T幀為周期重復(fù)嵌入多次水印,減少視覺顯著模型穩(wěn)定性對水印魯棒性的影響;若一個水印沒有全部嵌完,則選擇下一個相鄰關(guān)鍵幀的視覺非顯著區(qū)域繼續(xù)嵌入;若一個水印已嵌完,則根據(jù)周期T,搜索下一個周期的關(guān)鍵幀,重新開始嵌入水印;每次新嵌入一個水印時,在第一個嵌入幀中真正嵌入水印前,先嵌入一段標志序列P(N),以便提取水印時定位一個完整水印嵌入幀的起始位置。
6.如權(quán)利要求1所述的基于視覺注意機制的視頻水印方法,其特征在于,從嵌入水印的視覺非顯著區(qū)域提取水印,所述步驟E具體包括以下步驟: 步驟E1、輸入嵌入水印的MPEG-2載體視頻,解碼成YUV序列,根據(jù)關(guān)鍵幀標志位key_frame = 1,pic_type = I,鎖定視頻關(guān)鍵幀I中貞; 步驟E2、采用Koch and Itti視覺顯著模型分析關(guān)鍵幀的視覺顯著性,劃分前三個半徑為R的圓形視覺最顯著區(qū)域; 步驟E3、將關(guān)鍵幀的亮度分量進行8X8DCT變換,選擇不在視覺顯著區(qū)域內(nèi)的分塊的DCT直流系數(shù)DCTtl (k),根據(jù)奇偶量化索引調(diào)制后的特點,公式(12)提取當前分塊中嵌入的水印:
其中,W’ (i)表示當前塊中提出的二進制水印,L.」表示向下取整,D表示量化步長; 步驟E4、將關(guān)鍵幀起始位置提取的水印序列與標志序列P(N)比較,判斷當前幀是否已嵌入水?。? 若無水印嵌入,則判斷下一個關(guān)鍵幀,直至定位至一個水印的起始嵌入幀; 若有水印嵌入,則提取該幀中非顯著區(qū)域分塊內(nèi)的水印,當前幀提取結(jié)束,繼續(xù)從下一個關(guān)鍵幀中提取,直到提取的水印量等于一個完整水印的大??; 步驟E5、將重復(fù)嵌入的水印全部提取后,經(jīng)反置亂生成二進制文件,轉(zhuǎn)換成圖片形式的水印信息。
【文檔編號】H04N19/467GK104168484SQ201410407187
【公開日】2014年11月26日 申請日期:2014年8月19日 優(yōu)先權(quán)日:2014年8月19日
【發(fā)明者】嚴勤, 施杰, 呂勇, 鄧舒宇, 潘陽續(xù), 董巒 申請人:河海大學(xué)