專利名稱:一種基于梯度向量的h.264幀內(nèi)模式選擇方法
技術領域:
本發(fā)明涉及多媒體視頻編碼領域,具體涉及一種針對H. 264標準的幀內(nèi)預測模式選擇算法。它可以保證在編碼輸出信噪比基本不變的情況下加快幀內(nèi)預測過程,提高編碼速度。
(二)
背景技術:
H. 264是ITU-T的VCEG (視頻編碼專家組)和IS0/IEC的MPEG (活動圖像專家組) 的聯(lián)合視頻組(JVT/Joint Video Team)開發(fā)的視頻編碼標準。它等同于ISO的MPEG-4的第十部分,于2003年5月正式批準。和傳統(tǒng)的視頻編碼方式相比,H. 264標準有著更高的編碼效率和算法復雜度。
H. 264標準采用16X16亮度宏塊和8X8色度宏塊作為編碼的基本單元,根據(jù)不同的編碼算法,每個16X16宏塊還可以進一步劃分為4X4亮度子塊,進一步提升編碼效率。
H. 264標準主要定義了三種幀類型,I幀、P幀和B幀。I幀只能采用幀內(nèi)預測方式編碼,P幀可以采用幀內(nèi)預測和前向幀間預測方式進行編碼,B幀在采用幀內(nèi)預測和前向幀間預測編碼方式外還可以采用雙向預測方式編碼。其中幀內(nèi)編碼利用了圖像的空間相關性壓縮了冗余信息,幀間編碼利用了視頻序列的時間相關性起到壓縮冗余信息的目的,兩者是相互獨立的。本發(fā)明主要涉及幀內(nèi)預測編碼方式。
在H. 264標準中,幀內(nèi)預測模式包含了 9種4 X 4亮度預測模式
權利要求
1.一種基于梯度向量的H. 264幀內(nèi)模式選擇方法,包括下列步驟1)把宏塊分成16個4X4子塊,計算每個子塊橫軸、縱軸以及兩個對角線的梯度值 GradH, GradV, GradXl 和 GradX2 ;2)對各子塊的方向梯度值進行向量合成,得出梯度向量;3)計算各子塊的梯度向量坐標比值λ和梯度強度stren;4)根據(jù)λ的取值確定候選4X4候選預測模式;5)在候選預測模式中進行RDO運算,計算各模式率失真代價,得出最佳4X4預測模式;6)對16個4X4子塊的最佳模式進行統(tǒng)計分析,進一步得到16X16候選預測模式;7)對16X 16候選預測模式采用RDO運算得到最佳16 X 16預測模式;8)比較4X4最佳預測模式和16X16最佳預測模式的率失真代價,得到當前宏塊的最佳幀內(nèi)預測模式。
2.根據(jù)權利要求1所述的方法,其特征在于,所述步驟1)中計算梯度值的算法分別為1)橫向梯度值GradH = -0. 5ΧΑ2「0· 5ΧΑ22+0. 5ΧΑ23+0. 5 X A24-O. 5 X A31-O. 5ΧΑ32+0. 5 ΧΑ33+0. 5 X A34 ;2)縱向梯度值GradV = _0· 5 X A12-O. 5ΧΑ22+0. 5ΧΑ32+0. 5 X A42-O. 5 X A13-O. 5ΧΑ23+0. 5 ΧΑ33+0. 5 X A43 ;3)左上右下對角梯度值GradXl = _0· 5 X A11-O. 5ΧΑ22+0. 5ΧΑ33+0· 5 X A44 ;4)左下右上對角梯度值GradX2 = _0· 5ΧΑ4「0· 5ΧΑ32+0. 5ΧΑ23+0. 5 X A14 ;其中A為4X4子塊的一個像素的亮度信息,下標表示該像素在子塊中的行列位置。
3.根據(jù)權利要求1所述的方法,其特征在于,所述步驟幻中由方向梯度值合成得出梯度向量的算法如下vecGrad = (vecX, vecY)=(GradH, 0) + (0,GradV) + {GradXl / ^2, GradXl / ^2) + {-GradX2 / ^2, GradXl / ^2) 其中vecGrad為4X4子塊的梯度向量。
4.根據(jù)權利要求1所述的方法,其特征在于,所述步驟幻中描述梯度向量坐標比值 vecX
5.根據(jù)權利要求1所述的方法,其特征在于,所述步驟幻中描述梯度強度stren= |vecX|+|vecY|。
6.根據(jù)權利要求1所述的方法,其特征在于,所述步驟4)中根據(jù)λ的取值確定候選 4X4候選預測模式方法如下1)λ G (-5,-c )或λ e (5,①)時,候選預測模式為0、2、5、7 ;2)λ e (-1. 5,-5)時,候選預測模式為:0、2、3、7 ;3)λ e (-0. 67,-1. 5)時,候選預測模式為:2、3、7、8 ;4)λ e (-0. 2,-0. 67)時,候選預測模式為:1、2、3、8 ;5)λ e (-0. 2,0. 2)時,候選預測模式為:1、2、6、8 ;6)λ e (0. 2,0. 67)時,候選預測模式為:1、2、4、6 ;7)λ e (0. 67,1.5)時,候選預測模式為2、4、5、6 ;8)λ e (1.5,5)時,候選預測模式為0、2、4、5。
7.根據(jù)權利要求1所述的方法,其特征在于,所述步驟6)中根據(jù)4X4子塊的最佳模式統(tǒng)計分析結果確定16 X 16候選預測模式方法如下1)統(tǒng)計各4X4子塊的最佳預測模式,如果模式2即DC模式總數(shù)大于10時,則當前 16X16宏塊的候選模式為2、3,否則繼續(xù)下面步驟;2)計算當前宏塊中16個4X4子塊的平均梯度強度
3)計算當前宏塊中16個4X4子塊梯度強度和其均值殘差的SAD值
4)如果strenSAD> DCThreshold,則排除DC預測模式,其中DCThreshold為直流預測門限值,由用戶自己定義;5)如果4X4子塊的最佳模式中7、8、9預測模式總數(shù)小于等于2,則排除16X16預測模式0;6)如果4X4子塊的最佳模式中1、6、8預測模式總數(shù)小于等于2,則排除16X16預測模式1;7)把剩余的16X16預測模式作為16X 16候選預測模式。
全文摘要
本發(fā)明提供一種基于梯度向量的H.264幀內(nèi)模式選擇方法,包括下列步驟1)計算每個子塊橫軸、縱軸以及兩個對角線的梯度值;2)對各子塊的方向梯度值進行向量合成,得出梯度向量;3)根據(jù)梯度向量計算得到4×4候選預測模式,進而得出最佳4×4預測模式;4)根據(jù)各子塊最佳4×4預測模式得出16×16候選模式;5)計算出16×16最佳預測模式,和最佳4×4預測模式對比率失真代價,從而得到最佳幀內(nèi)預測模式,本發(fā)明在對編碼信噪比影響較小的情況下簡化了幀內(nèi)模式選擇算法,加快了編碼速度。
文檔編號H04N7/32GK102186081SQ20111012154
公開日2011年9月14日 申請日期2011年5月11日 優(yōu)先權日2011年5月11日
發(fā)明者毛峽, 閆晗 申請人:北京航空航天大學