一種視頻數(shù)據(jù)傳輸方法
【專(zhuān)利摘要】本發(fā)明提供了一種視頻數(shù)據(jù)傳輸方法,該方法包括:利用運(yùn)動(dòng)向量場(chǎng)進(jìn)行全局運(yùn)動(dòng)估計(jì);對(duì)視頻中的局部運(yùn)動(dòng)進(jìn)行分割;對(duì)ROI圖像進(jìn)行修正;基于修正的ROI圖像進(jìn)行視頻編碼并傳輸。本發(fā)明準(zhǔn)確完整地檢測(cè)出視頻中的關(guān)注區(qū)域;降低了編碼比特率,同時(shí)保持了主觀(guān)質(zhì)量。
【專(zhuān)利說(shuō)明】一種視頻數(shù)據(jù)傳輸方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及視頻編碼,特別涉及一種視頻數(shù)據(jù)傳輸方法。
【背景技術(shù)】
[0002] 隨著信息技術(shù)的發(fā)展,生活中人們接觸到的視頻信息量越來(lái)越龐大,如何高效提 取視頻中顯著物體引起了越來(lái)越多研究者的關(guān)注,R0I (感興趣區(qū)域)在視頻信號(hào)處理方面 有著廣泛的應(yīng)用,比如視頻檢索、視頻壓縮、視頻監(jiān)控、視頻跟蹤等領(lǐng)域。視頻傳輸方面,由 于現(xiàn)在視頻分辨率越來(lái)越高,因此高效的視頻傳輸方法也是研究的熱點(diǎn)之一。同時(shí)結(jié)合人 眼視覺(jué)模型的視頻編碼方法是下一代視頻編解碼的關(guān)鍵技術(shù)之一,因此R0I作為人眼視覺(jué) 模型的一個(gè)重要方面也就顯得尤為重要。
[0003] R0I在視頻信號(hào)處理方面有著廣泛的應(yīng)用,因此對(duì)R0I技術(shù)的開(kāi)發(fā)有非常重要的 意義。目前圖像R0I方法主要利用圖像的顏色、亮度等特征計(jì)算圖像的顯著性,但是圖像的 R0I方法沒(méi)有利用視頻的運(yùn)動(dòng)特征,因此將圖像R0I方法直接應(yīng)用視頻檢測(cè)時(shí)效果不好。然 而對(duì)視頻R0I方法研究較少,并且存在方法復(fù)雜度較高的缺點(diǎn),已有技術(shù)并未考慮視頻的 紋理特征以及人眼視覺(jué)所關(guān)注區(qū)域的整體性,導(dǎo)致壓縮率不高或主觀(guān)質(zhì)量不佳。
[0004] 因此,針對(duì)相關(guān)技術(shù)中所存在的上述問(wèn)題,目前尚未提出有效的解決方案。
【發(fā)明內(nèi)容】
[0005] 為解決上述現(xiàn)有技術(shù)所存在的問(wèn)題,本發(fā)明提出了一種視頻數(shù)據(jù)傳輸方法,包 括:
[0006] 步驟一,利用視頻碼流中的運(yùn)動(dòng)向量場(chǎng)進(jìn)行全局運(yùn)動(dòng)估計(jì);
[0007] 步驟二,在對(duì)運(yùn)動(dòng)矢量場(chǎng)進(jìn)行全局運(yùn)動(dòng)估計(jì)之后,對(duì)視頻中的局部運(yùn)動(dòng)進(jìn)行分 割;
[0008] 步驟三,對(duì)得到的全局運(yùn)動(dòng)背景下提取的局部運(yùn)動(dòng)的R0I圖像進(jìn)行修正;
[0009] 步驟四,基于修正的R0I圖像進(jìn)行視頻編碼并傳輸。
[0010] 優(yōu)選地,所述步驟一采用參數(shù)為8維向量v= [V(l,Vl,…,v7]的投影模型,該模型 的透視變換定義為:
[0011] xK = (VoXc+vjc+vJ/GjjXc+vjc+l);
[0012] yE = (v3xc+v4yc+v5)/(v 6xc+v7yc+l);
[0013] 其中(xe,y。)和(xK,yK)分別為當(dāng)前幀和參考幀的坐標(biāo),對(duì)于當(dāng)前幀中每一個(gè)坐標(biāo) 為(X。,y。)的對(duì)應(yīng)運(yùn)動(dòng)模型v的塊,其運(yùn)動(dòng)分量定義為 :
[0014] Vx(xc, yc ;v) = xE-xc ;
[0015] VY(xc, yc ;v) = yE-yc ;
[0016] 其中Vx和VY分別代表運(yùn)動(dòng)向量V的水平和垂直分量,
[0017] 去除向量場(chǎng)中全局運(yùn)動(dòng)模型的第一偏差值和第二偏差值;所述第一偏差值為視頻 編碼過(guò)程中運(yùn)動(dòng)估計(jì)的運(yùn)動(dòng)向量噪聲;所述第二偏差值為不符合背景運(yùn)動(dòng)模型的運(yùn)動(dòng)向 量。
[0018] 優(yōu)選地,所述步驟二進(jìn)一步包括:
[0019] 步驟3. 1以單個(gè)聚類(lèi)即整幀所有的運(yùn)動(dòng)向量開(kāi)始,計(jì)算它的中心V。= (ΣΛ)/Ν, 然后分別以新的中心1±1/2生成兩個(gè)新的聚類(lèi);
[0020] 步驟3. 2以最近最相似原則劃分整幀的運(yùn)動(dòng)向量到現(xiàn)有的聚類(lèi)中,然后更新第i 個(gè)聚類(lèi)的中心為<Σκ,ν〇/Ν?,其中隊(duì)是第i個(gè)聚類(lèi)Q中運(yùn)動(dòng)向量的個(gè)數(shù);
[0021] 步驟3.3計(jì)算每個(gè)聚類(lèi)的失真,即〇^=2_^£5||¥^¥〇|||分別以¥£^^ 為中心,繼續(xù)把具有最大失真的聚類(lèi)(;劃分為兩個(gè)聚類(lèi),其中P= ((Xmax-Xmin)/2(M-1), (Ymax-Ym J /2 (M-l)),Μ為劃分之前聚類(lèi)的總數(shù),Xmin,Xmax,Ymin和Y max分別為中心點(diǎn)向量中最 大和最小水平和垂直分量;
[0022] 步驟3. 4重復(fù)步驟3. 2和3. 3,直到聚類(lèi)失真的變化小于預(yù)先設(shè)定的閾值。
[0023] 優(yōu)選地,所述步驟四進(jìn)一步包括:
[0024] 采用自適應(yīng)頻率系數(shù)壓制的方法,針對(duì)每個(gè)變換單元,定義:CP=.C?W,
[0025] 其中Cp為壓制后的頻率系數(shù)矩陣;@表示兩個(gè)矩陣對(duì)應(yīng)元素相乘;W為頻率系數(shù)
【權(quán)利要求】
1. 一種視頻數(shù)據(jù)傳輸方法,其特征在于,包括: 步驟一,利用視頻碼流中的運(yùn)動(dòng)向量場(chǎng)進(jìn)行全局運(yùn)動(dòng)估計(jì); 步驟二,在對(duì)運(yùn)動(dòng)矢量場(chǎng)進(jìn)行全局運(yùn)動(dòng)估計(jì)之后,對(duì)視頻中的局部運(yùn)動(dòng)進(jìn)行分割; 步驟三,對(duì)得到的全局運(yùn)動(dòng)背景下提取的局部運(yùn)動(dòng)的ROI圖像進(jìn)行修正; 步驟四,基于修正的ROI圖像進(jìn)行視頻編碼并傳輸。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟一采用參數(shù)為8維向量v= [V(l, Vi,…,v7]的投影模型,該模型的透視變換定義為: xE = (voXc+ViYc+v^/^eXc+v^c+l); yE = (v3Xc+V4yc+V5)/(v6Xc+V7yc+l); 其中(X。,y。)和(XK,yK)分別為當(dāng)前幀和參考幀的坐標(biāo),對(duì)于當(dāng)前幀中每一個(gè)坐標(biāo)為 (X。,y。)的對(duì)應(yīng)運(yùn)動(dòng)模型V的塊,其運(yùn)動(dòng)分量定義為: vx(xc,yc ;v) = xr-xc ; vY(xc,yc ;v) = yR-yc; 其中vx和vY分別代表運(yùn)動(dòng)向量v的水平和垂直分量, 去除向量場(chǎng)中全局運(yùn)動(dòng)模型的第一偏差值和第二偏差值;所述第一偏差值為視頻編碼 過(guò)程中運(yùn)動(dòng)估計(jì)的運(yùn)動(dòng)向量噪聲;所述第二偏差值為不符合背景運(yùn)動(dòng)模型的運(yùn)動(dòng)向量。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述步驟二進(jìn)一步包括: 步驟3. 1以單個(gè)聚類(lèi)即整幀所有的運(yùn)動(dòng)向量開(kāi)始,計(jì)算它的中心V。= (Skvk)/N,然后 分別以新的中心火±火/2生成兩個(gè)新的聚類(lèi); 步驟3. 2以最近最相似原則劃分整幀的運(yùn)動(dòng)向量到現(xiàn)有的聚類(lèi)中,然后更新第i個(gè)聚 類(lèi)的中心為iXn.VjyNi,其中隊(duì)是第i個(gè)聚類(lèi)Q中運(yùn)動(dòng)向量的個(gè)數(shù); 步驟3.3計(jì)算每個(gè)聚類(lèi)的失真,即II Vj-VG II;分別以UP為 中心,繼續(xù)把具有最大失真的聚類(lèi)(;劃分為兩個(gè)聚類(lèi),其中P = ((Xmax-Xmin)/2(M-1), (Ymax-Ym J /2 (M-l)),Μ為劃分之前聚類(lèi)的總數(shù),Xmin,Xmax,Ymin和Y max分別為中心點(diǎn)向量中最 大和最小水平和垂直分量; 步驟3. 4重復(fù)步驟3. 2和3. 3,直到聚類(lèi)失真的變化小于預(yù)先設(shè)定的閾值。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述步驟四進(jìn)一步包括: 采用自適應(yīng)頻率系數(shù)壓制的方法,針對(duì)每個(gè)變換單元,定義:CP=C ? W, 其中(;為壓制后的頻率系數(shù)矩陣;?表示兩個(gè)矩陣對(duì)應(yīng)元素相乘;W為頻率系數(shù)壓制 w, W, w3 矩陣,w= % ; w2 w3 w4 w5 _W3 w4 w5 14? _ Wi(i e [〇,6])取0或者1,并且滿(mǎn)足約束wi+1彡Wi ; 針對(duì)大小不同的變換單元,設(shè)定了 5種頻率系數(shù)壓制矩陣: wfkv.= {1 ((i + j) = ((k + l)N/4.i)) ()lJ [0 It他 其中i,j分別為塊的橫坐標(biāo)和縱坐標(biāo),1(1〇^是頻率系數(shù)壓制矩陣;N是塊大小,取值 分別為4,8,16和32 ;k是5種候選矩陣的索引; 對(duì)應(yīng)于5種候選矩陣,將非ROI區(qū)域TU的視覺(jué)感知權(quán)重WTU歸一化為五個(gè)等級(jí)LTU : LTU = ceil[ffTU/(128STU/5)], 其中STU分別對(duì)應(yīng)四種塊大小取值為1,4,16和64, 確定TU的頻率系數(shù)壓制矩陣: ffTU = ff {min[max (LTU+ffinit, 0), 4]}, 其中Winit是控制頻率系數(shù)壓制的強(qiáng)度的選擇頻率系數(shù)矩陣的起始索引,取[-4,4]之間 的整數(shù)值,根據(jù)編碼QP動(dòng)態(tài)更新,Winit = -(Qp-C^^/S^p+CU其中C_vs,STEP和OeM分別表 示非ROI區(qū)域常量值、步長(zhǎng)和全局運(yùn)動(dòng)偏移。
【文檔編號(hào)】H04N19/567GK104125470SQ201410385517
【公開(kāi)日】2014年10月29日 申請(qǐng)日期:2014年8月7日 優(yōu)先權(quán)日:2014年8月7日
【發(fā)明者】高冬 申請(qǐng)人:成都瑞博慧窗信息技術(shù)有限公司