一種基于區(qū)域特征分析的由h264到hevc的視頻轉(zhuǎn)碼方法
【專利摘要】本發(fā)明公開了一種基于區(qū)域特征分析的由H264到HEVC的視頻轉(zhuǎn)碼方法,包括以下步驟:對原始H.264視頻流進(jìn)行解碼,提取出當(dāng)前解碼幀的宏塊編碼比特數(shù)、宏塊編碼模式以及運(yùn)動矢量場;將HEVC編碼樹單元覆蓋的區(qū)域?qū)?yīng)至當(dāng)前解碼幀的各個宏塊,計算每個區(qū)域的編碼復(fù)雜度,并確定每個HEVC編碼樹單元的搜索深度范圍;針對每個編碼樹單元,按照對應(yīng)的搜索深度范圍逐級進(jìn)行運(yùn)動估計,若預(yù)測單元的模式為Inter模式時,進(jìn)行區(qū)域特征分析,得到分割模式;將每個預(yù)測單元按照保留的各種分割模式進(jìn)行運(yùn)動搜索,選擇率失真最小的分割模式和運(yùn)動矢量進(jìn)行HEVC重編碼。本發(fā)明在保持幾乎相同率失真前提下,轉(zhuǎn)碼速度獲得了大幅提高。
【專利說明】 —種基于區(qū)域特征分析的由H264到HEVC的視頻轉(zhuǎn)碼方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及視頻轉(zhuǎn)碼領(lǐng)域,具體來說是一種基于區(qū)域特征分析的由H264到HEVC的視頻轉(zhuǎn)碼方法。
【背景技術(shù)】
[0002]隨著不同網(wǎng)絡(luò)類型、接收終端和內(nèi)容表現(xiàn)形式的多樣化,不同系統(tǒng)和網(wǎng)絡(luò)之間的交互變得越來越重要,但由于用戶的視頻接收設(shè)備具有多樣性,在屏幕大小計算,存儲設(shè)備容量和功耗要求等方面差異巨大,再加上不同種類的網(wǎng)絡(luò)特性各異,用戶所擁有的傳輸帶寬各不相同,對視頻的時間空間分辨率要求也都不盡相同,致使同一視頻片源需要在廣播電視網(wǎng),電信網(wǎng)和通信網(wǎng)中同時或協(xié)同播出,在不同的網(wǎng)絡(luò)設(shè)備之間無縫切換。以上需求均迫使視頻碼流能夠動態(tài)調(diào)整,從而支持不同網(wǎng)絡(luò),滿足各種用戶的要求。網(wǎng)關(guān)、多點(diǎn)控制單元和服務(wù)器等設(shè)備擔(dān)負(fù)起為內(nèi)容提供商和用戶之間提供無縫交互的重要任務(wù),而視頻轉(zhuǎn)碼技術(shù)使這些設(shè)備高效完成這一任務(wù)成為可能。
[0003]H.264作為目前應(yīng)用最為廣泛的視頻編碼標(biāo)準(zhǔn),在提高編碼效率和靈活性方面取得了巨大成功,它使數(shù)字視頻有效地應(yīng)用在各種各樣的網(wǎng)絡(luò)類型和工程領(lǐng)域,然而,多樣化的服務(wù)、高清視頻的普及、以及超高清格式(4KX 2K或8KX4K分辨率)的出現(xiàn)對于比H.264編碼效率更高的下一代視頻編碼標(biāo)準(zhǔn)提出了強(qiáng)烈的需求。
[0004]在這樣的背景下,MPEG和VCEG組織于2010年成立了視頻編碼聯(lián)合協(xié)作小組(JCT-VC),經(jīng)過多年的努力研發(fā)出了 H.264標(biāo)準(zhǔn)的繼承者,新一代視頻編碼標(biāo)準(zhǔn)HEVC,成為數(shù)字視頻壓縮技術(shù)史上新的里程碑。
[0005]現(xiàn)有技術(shù)的完善與新技術(shù)的不斷推出,極大地推動了數(shù)字視頻技術(shù)的實用化和產(chǎn)業(yè)化。然而HEVC為了提高編碼效率,引入了一系列相當(dāng)耗時的編碼算法,給實時視頻轉(zhuǎn)碼應(yīng)用帶來了新的挑戰(zhàn)。
[0006]針對H.264到HEVC轉(zhuǎn)碼復(fù)雜度高的問題,一些新的快速轉(zhuǎn)碼方法被提出,Shen等人提出了一種利用多核處理器實現(xiàn)波前并行處理和SMD加速的超快速H.264/AVC到HEVC轉(zhuǎn)碼器;Shanableh等人提出了第一種基于內(nèi)容的機(jī)器學(xué)習(xí)方法預(yù)測HEVC編碼單元深度的快速H.264到HEVC轉(zhuǎn)碼方法;而Peixoto等人則提出了一種基于新的矩陣度量H.264運(yùn)動矢量相似性的復(fù)雜度可分級的H.264到HEVC視頻轉(zhuǎn)碼方法。
[0007]這些方法都大幅度降低了轉(zhuǎn)碼過程的計算復(fù)雜度,但是,H.264到HEVC的轉(zhuǎn)碼過程還需要進(jìn)一步以更少的質(zhì)量損失達(dá)到更高的速度提升。
【發(fā)明內(nèi)容】
[0008]本發(fā)明提供了一種基于區(qū)域特征分析的由H.264到HEVC的視頻轉(zhuǎn)碼方法,相比現(xiàn)有的標(biāo)準(zhǔn)轉(zhuǎn)碼算法和參考轉(zhuǎn)碼算法,在保持相同的率失真的前提下,轉(zhuǎn)碼速度獲得了大幅提聞。
[0009]一種基于區(qū)域特征分析的由H.264到HEVC的視頻轉(zhuǎn)碼方法,包括以下步驟:[0010](I)輸入原始H.264視頻流,并對該視頻流進(jìn)行解碼,在解碼過程中,提取出當(dāng)前解碼幀的宏塊編碼比特數(shù)、DCT塊熵編碼系數(shù)以及運(yùn)動矢量場;
[0011](2)將HEVC編碼樹單元覆蓋的區(qū)域?qū)?yīng)至當(dāng)前解碼幀的各個宏塊,計算每個區(qū)域的編碼復(fù)雜度,并依據(jù)編碼復(fù)雜度確定每個HEVC編碼樹單元的搜索深度范圍;
[0012](3)針對每個編碼樹單元,按照對應(yīng)的搜索深度范圍逐級進(jìn)行運(yùn)動估計,若預(yù)測單元的模式為Inter模式時,進(jìn)行步驟3_1:
[0013]若預(yù)測單元的模式為Skip模式或者Intra模式時,利用現(xiàn)有技術(shù)進(jìn)行HEVC重編碼。
[0014]3-1、利用步驟(1)中得到的H.264碼流中當(dāng)前預(yù)測單元的DCT塊,計算相應(yīng)DCT塊的能量En4x4 (i, j),公式如下:
[0015]En4x4 (i,j) = DC (i, j) | +1AC01 (i, j) | +1AC10 (i, j) | +1AC11 (i, j)
[0016]其中,DC,AC01, AC10和AC11為每個DCT塊的左上角熵編碼系數(shù);
[0017](i,j)為DCT塊在當(dāng)前解碼幀中的坐標(biāo);
[0018]3-2、利用下式對步驟(1)中得到的運(yùn)動矢量進(jìn)行濾波:
[0019]
【權(quán)利要求】
1.一種基于區(qū)域特征分析的由H264到HEVC的視頻轉(zhuǎn)碼方法,其特征在于,包括以下步驟: (1)輸入原始H.264視頻流,并對該視頻流進(jìn)行解碼,在解碼過程中,提取出當(dāng)前解碼幀的宏塊編碼比特數(shù)、DCT塊熵編碼系數(shù)以及運(yùn)動矢量場; (2)將HEVC編碼樹單元覆蓋的區(qū)域?qū)?yīng)至當(dāng)前解碼幀的各個宏塊,計算每個區(qū)域的編碼復(fù)雜度,并依據(jù)編碼復(fù)雜度確定每個HEVC編碼樹單元的搜索深度范圍; (3)針對每個編碼樹單元,按照對應(yīng)的搜索深度范圍逐級進(jìn)行運(yùn)動估計,若預(yù)測單元的模式為Inter模式時,進(jìn)行步驟3_1: 3-1、利用步驟(1)中得到的H.264碼流中當(dāng)前預(yù)測單元的DCT塊,計算相應(yīng)DCT塊的能量En4x4 (i, j),公式如下:
En4x4 (i, j) = I DC (i, j) I +1AC01 (i, j) I +1AC10 (i, j) | +1AC11 (i, j) 其中,DC,AC01, AC10和AC11為每個DCT塊的左上角熵編碼系數(shù); (i,j)為DCT塊在當(dāng)前解碼幀中的坐標(biāo); 3-2、利用下式對步驟(1)中得到的運(yùn)動矢量進(jìn)行濾波:
2.如權(quán)利要求1所述的基于區(qū)域特征分析的由H264到HEVC的視頻轉(zhuǎn)碼方法,其特征在于,所述步驟(2)中計算每個區(qū)域的編碼復(fù)雜度,計算規(guī)則如下:
3.如權(quán)利要求2所述的基于區(qū)域特征分析的由H264到HEVC的視頻轉(zhuǎn)碼方法,其特征在于,所述步驟(2)中依據(jù)編碼復(fù)雜度確定每個HEVC編碼樹單元的搜索深度范圍,確定規(guī)則如下:
4.如權(quán)利要求3所述的基于區(qū)域特征分析的由H264到HEVC的視頻轉(zhuǎn)碼方法,其特征在于,所述步驟3-2中閾值Thav的計算公式如下:
Thw = -0.0087 X QP2-0.0058XQP+15.06
其中,QP為量化系數(shù)。
5.如權(quán)利要求4所述的基于區(qū)域特征分析的由H264到HEVC的視頻轉(zhuǎn)碼方法,其特征在于,所述步驟3-3中,兩個基準(zhǔn)種子塊的中心在預(yù)測單元中所處的位置為: 第一基準(zhǔn)種子塊位于距離預(yù)測單元左上頂點(diǎn)四分之一寬度和四分之一高度的位置; 第二基準(zhǔn)種子塊位于距離預(yù)測單元右下頂點(diǎn)四分之一寬度和四分之一高度的位置。
6.如權(quán)利要求5所述的基于區(qū)域特征分析的由H264到HEVC的視頻轉(zhuǎn)碼方法,其特征在于,所述步驟(4)中將每個預(yù)測單元按照保留的各種分割模式進(jìn)行運(yùn)動搜索時,利用步驟(I)中獲得的H.264碼流中的運(yùn)動矢量確定HEVC的搜索起點(diǎn),確定規(guī)則如下: 對于分割模式為2NX2N:
7.如權(quán)利要求1~6任一所述的基于區(qū)域特征分析的由H.264到HEVC的視頻轉(zhuǎn)碼方法,其特征在于,所述步驟(4)中將每個預(yù)測單元按照保留的各種分割模式進(jìn)行運(yùn)動搜索時,利用步驟(1)中獲得的H.264碼流中的運(yùn)動矢量確定HEVC的搜索范圍,搜索范圍SRpu如下:
SRpu = max {SR0/8, max {MVmaxx, MVmaxy}} 式中,MVmaxX為預(yù)測單元對應(yīng)編碼區(qū)域的H.264運(yùn)動矢量X方向的最大值; MVmaxy為預(yù)測單元對應(yīng)編碼區(qū)域的H.264運(yùn)動矢量y方向的最大值; SR。是預(yù)先設(shè)定的原始搜索范圍。
【文檔編號】H04N19/169GK103491334SQ201310413576
【公開日】2014年1月1日 申請日期:2013年9月11日 優(yōu)先權(quán)日:2013年9月11日
【發(fā)明者】陳耀武, 蔣煒, 田翔, 周凡 申請人:浙江大學(xué)