一種視頻塊劃分方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種視頻塊劃分方法及裝置,其中,所述方法包括將視頻分辨率為H*V的原始視頻中連續(xù)的F幀作為一個GOP畫面組,對所述每個GOP單獨進(jìn)行3D DCT三維離散余弦變換,得到F幀二維DCT系數(shù)矩陣;所述F幀二維DCT系數(shù)矩陣在每幀內(nèi)按對角線向上逐次對半劃分為視頻塊,且視頻塊數(shù)目滿足逐幀遞減。利用DCT系數(shù)的幅值分布規(guī)律,綜合考慮前后幀不同的幅值分布特性來劃分視頻塊,提高視頻接收質(zhì)量。
【專利說明】一種視頻塊劃分方法及裝置
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉無線高清視頻傳輸領(lǐng)域,尤其涉及一種視頻塊劃分方法及裝置。
【背景技術(shù)】
[0002] 近年來無線視頻組播傳輸受到人們廣泛關(guān)注。傳統(tǒng)的點對點傳輸方案要求發(fā)送端 了解接收端的信道條件,選擇相應(yīng)的編碼調(diào)制方案達(dá)到最好的接收效果。但在組播場景下, 這種方案很容易產(chǎn)生"滑坡"現(xiàn)象,即信噪比小于某一門限后,接收質(zhì)量急劇下降。
[0003] 2009年,美國學(xué)者S. Jakubczak和D. Katabi提出一種名為SoftCast的傳輸方案。 與傳統(tǒng)方案不同的是,SoftCast采取無損壓縮有損傳輸。在發(fā)送端,首先,對原始信號進(jìn)行 3D DCT (離散余弦變換),消除視頻幀的時間冗余和空間冗余;然后,將變換后的系數(shù)劃分 為大小相等的視頻塊(chunk),并以塊為單位對每個視頻塊內(nèi)的系數(shù)進(jìn)行加權(quán),實現(xiàn)功率分 配和不均等差錯保護(hù);第三步,進(jìn)行哈達(dá)瑪變換,保證每個傳輸包的能量和重要性相等;最 后,對變換后的系數(shù)做近似模擬調(diào)制的稠密QAM星座映射。上述步驟均為線性變換,保證了 信道中實際傳輸?shù)男盘柡驮家曨l像素值呈線性關(guān)系,因此視頻的接收質(zhì)量只取決于當(dāng)前 用戶自身的信道條件,避免了"滑坡"現(xiàn)象。不過,DCT變換后的系數(shù)在從直流分量向低頻 和高頻分量過渡時幅值會急劇降低,分布不均勻。SoftCast采用的均等視頻塊劃分方案沒 有考慮這一規(guī)律,為獲得理想的功率分配和差錯保護(hù)效果就需要把每個視頻塊劃分得足夠 小,因此會產(chǎn)生大量需要傳輸?shù)脑獢?shù)據(jù)消耗信道資源(因為元數(shù)據(jù)數(shù)量與視頻塊的數(shù)目保 持正比關(guān)系)。
[0004] 為此,有一種二維自適應(yīng)劃分視頻塊的方法被提出,可以明顯減少獲得同樣傳輸 性能時所需要的視頻塊數(shù)量。但是該方法復(fù)雜度很高,需要針對每一幀視頻數(shù)據(jù)反復(fù)迭代 才能得到最佳劃分方案。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明實施例的目的是提供一種視頻塊劃分方法及裝置,實現(xiàn)提高視頻接收質(zhì) 量。
[0006] 本發(fā)明實施例的目的是通過以下技術(shù)方案實現(xiàn)的:
[0007] -種視頻塊劃分方法,包括:
[0008] 將視頻分辨率為H*V的原始視頻中連續(xù)的F幀作為一個GOP畫面組,對所述每個 GOP單獨進(jìn)行3D DCT,得到F幀二維DCT系數(shù)矩陣;
[0009] 所述F幀二維DCT系數(shù)矩陣在每幀內(nèi)按對角線向上逐次對半劃分為視頻塊,且視 頻塊數(shù)目滿足逐幀遞減。
[0010] 一種視頻塊劃分裝置,包括:
[0011] 3D DCT變換單元,用于將視頻分辨率為H*V的原始視頻中連續(xù)的F幀作為一個GOP 畫面組,對所述每個GOP單獨進(jìn)行3D DCT,得到F幀二維DCT系數(shù)矩陣;
[0012] 視頻塊劃分單元,用于所述F幀二維DCT系數(shù)矩陣在每幀內(nèi)按對角線向上逐次對 半劃分為視頻塊,且視頻塊數(shù)目滿足逐幀遞減。
[0013] 由上述本發(fā)明實施例提供的技術(shù)方案可以看出,利用DCT系數(shù)的幅值分布規(guī)律, 綜合考慮前后幀不同的幅值分布特性來劃分視頻塊,提高視頻接收質(zhì)量。
【專利附圖】
【附圖說明】
[0014] 為了更清楚地說明本發(fā)明實施例的技術(shù)方案,下面將對實施例描述中所需要使用 的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本 領(lǐng)域的普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他 附圖。
[0015] 圖1為本發(fā)明實施例視頻塊劃分方法的流程示意圖。
[0016] 圖2為本發(fā)明實施例視頻塊劃分裝置的構(gòu)成示意圖。
[0017] 圖3為本發(fā)明實施例視頻塊劃分方法的原理框圖。
[0018] 圖4為本發(fā)明實施例視頻塊劃分方法中視頻塊對角劃分示意圖。
[0019] 圖5為本發(fā)明實施例視頻塊劃分方法與現(xiàn)有技術(shù)均等劃分方法、自適應(yīng)劃分方法 的性能對比圖。
[0020] 圖6為本發(fā)明實施例視頻塊劃分方法與現(xiàn)有技術(shù)均等劃分方法的性能對比圖。
【具體實施方式】
[0021] 下面結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整 地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒?發(fā)明的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施 例,都屬于本發(fā)明的保護(hù)范圍。
[0022] 如圖1所示,本發(fā)明實施例提供一種視頻塊劃分方法,包括:
[0023] 11、將視頻分辨率為H*V的原始視頻中連續(xù)的F幀作為一個GOP (Group of Pictures,畫面組),對所述每個 GOP 單獨進(jìn)行 3D DCT(3Dimension Discrete Cosine Transform,三維離散余弦變換),得到F巾貞二維DCT系數(shù)矩陣;
[0024] 12、所述F幀二維DCT系數(shù)矩陣在每幀內(nèi)按對角線向上逐次對半劃分為視頻塊,且 視頻塊數(shù)目滿足逐幀遞減。
[0025] 由上述本發(fā)明實施例提供的技術(shù)方案可以看出,根據(jù)DCT系數(shù)的幅值不均勻分布 規(guī)律,對二維DCT系數(shù)矩陣做不均等的對角劃分,并將其擴(kuò)展到3D DCT場景下,改善視頻接 收質(zhì)量,且復(fù)雜度低。
[0026] 本發(fā)明實施例視頻塊劃分方法的執(zhí)行主體可以為視頻發(fā)送端。
[0027] 本領(lǐng)域技術(shù)人員可以理解,假設(shè)原始視頻分辨率為H*V,每幀視頻用一個H*V的 二維矩陣表示,其中每個元素代表一個像素值。定義連續(xù)的F幀為一個G0P(Group of Pictures),并對每個GOP單獨進(jìn)行3D DCT。對每個GOP單獨進(jìn)行3D DCT變換之后得到頻 域上的一個H*V*F三維矩陣,其中每個元素對應(yīng)3D DCT變換之后的一個頻域系數(shù)。為便于 說明,將這個頻域上的三維矩陣表示成F幀二維DCT系數(shù)矩陣。
[0028] 由視頻特性可知,在每個二維DCT系數(shù)矩陣中,從低頻變化到高頻時系數(shù)幅值下 降明顯;同時整個二維DCT系數(shù)矩陣的平均能量也在逐幀遞減。
[0029] 本領(lǐng)域技術(shù)人員可以理解,F(xiàn)幀的個數(shù)不做嚴(yán)格限制,考慮到3DDCT變換的計算復(fù) 雜,F(xiàn)取值區(qū)間為1-6。
[0030] 具體的,F(xiàn)幀二維DCT系數(shù)矩陣在每幀內(nèi)按對角線向上逐次對半劃分為視頻塊,且 視頻塊數(shù)目滿足逐幀遞減,可以包括:
[0031] 在每幀二維DCT系數(shù)矩陣內(nèi),按對角線折半確定視頻塊邊界;
[0032] 根據(jù)視頻塊邊界,得到"L"形視頻塊以及方形視頻塊(如,按對角線折半之后的右 下半部分系數(shù)作為一個"L"形視頻塊,左上半部分系數(shù)作為一個方形視頻塊);
[0033] 在方形視頻塊內(nèi)繼續(xù)按對角線折半確定視頻塊邊界;
[0034] 直至將二維DCT系數(shù)矩陣劃分為分配數(shù)目的視頻塊。
[0035] 其中,根據(jù)預(yù)設(shè)的F幀二維DCT系數(shù)矩陣的視頻塊總數(shù)以及每幀二維DCT系數(shù)矩 陣內(nèi)視頻塊數(shù)目逐幀遞減,確定為每幀二維DCT系數(shù)矩陣分配的視頻塊數(shù)目。
[0036] 可見,每幀二維DCT系數(shù)矩陣內(nèi),最終得到的將是一個方形視頻塊和若干個"L"形 視頻塊。
[0037] 參見現(xiàn)有技術(shù)均等視頻塊劃分方法,示例性的,每一幀圖像的分辨率為256*256, 圖像為灰度圖像,每個像素點的系數(shù)代表像素亮度。指定4幀為一個G0P,則一個GOP中的 DCT系數(shù)組成一個256*256*4的三維矩陣,對于3D DCT變換后的3維系數(shù)矩陣,每幀圖像被 劃分為8*8個視頻塊,每個視頻塊包含32*32個像素,將每個視頻塊轉(zhuǎn)化為一列,即X i [k], k = 1,2, 3,…,32*32。
[0038] 現(xiàn)有技術(shù)均等視頻塊劃分方法沒有考慮到系數(shù)幅值的不均勻分布特性。實際上, 多數(shù)視頻塊系數(shù)的幅值較為接近,尤其是大量高頻分量幾乎都趨近于零,這些系數(shù)的重要 性很低,可以合并為一個視頻塊。因此視頻塊的數(shù)量可以減少,相應(yīng)地減少待傳輸?shù)脑獢?shù) 據(jù),節(jié)約信道資源;或者在維持視頻塊數(shù)不變的前提下,提高視頻傳輸質(zhì)量。
[0039] 本發(fā)明實施例視頻塊劃分方法,將一個GOP對應(yīng)的F幀二維DCT系數(shù)矩陣劃分成 較小的視頻塊,以便于后續(xù)處理??紤]到二維DCT系數(shù)矩陣的平均能量逐幀遞減,分配給每 幀的視頻塊數(shù)目也保持逐幀遞減趨勢,例如后一幀比前一幀的視頻塊數(shù)始終少一或少二。 進(jìn)一步地,在每一幀內(nèi),按對角線向上逐次進(jìn)行對半劃分,以產(chǎn)生所需數(shù)量的視頻塊。
[0040] 以圖4為例,考慮到一個GOP內(nèi)幀間系數(shù)的分布規(guī)律是從第一幀向第四幀幅值逐 步遞減,所以對系數(shù)相對較大的第一幀劃分應(yīng)最為細(xì)致,之后可以逐幀減少每幀包含的視 頻塊數(shù)目。若需要劃分共14個視頻塊,可以分別分配5, 4, 3, 2個視頻塊給四個視頻幀,若 需劃分共16個視頻塊,可以分別分配6, 5, 3, 2個或6, 4, 4, 2個視頻塊,具體分配情況不做 硬性規(guī)定,可以視情況自行分配。
[0041] 仍以圖4為例,按對角線向上逐次對半劃分的方法(可以簡稱對角劃分方法):
[0042] 假設(shè)每個視頻幀的分辨率為W*W,在每幀DCT系數(shù)矩陣內(nèi),按對角線折半確定視頻 塊邊界,則每個視頻幀內(nèi)的劃分邊界依次為W/2,W/4,W/8···,每次根據(jù)劃分邊界將一個矩 形視頻塊劃分為兩部分:右下部分系數(shù)作為一個"L"形視頻塊42,然后在左上部分矩陣41 內(nèi)繼續(xù)按對角線進(jìn)行折半,直至獲得所需數(shù)目的視頻塊。
[0043] 經(jīng)過實驗比較,在視頻塊總數(shù)相同的前提下,逐幀減少視頻塊數(shù)時獲得的視頻接 收質(zhì)量要好于每幀保持相同視頻塊數(shù)的情況。
[0044] 可選的,本發(fā)明實施例視頻塊劃分方法,還可以包括:
[0045] 為每個視頻塊內(nèi)的所有二維DCT系數(shù)分配一個加權(quán)系數(shù)gi :
[0046]
【權(quán)利要求】
1. 一種視頻塊劃分方法,其特征在于,包括: 將視頻分辨率為H*v的原始視頻中連續(xù)的F幀作為一個GOP畫面組,對所述每個GOP 單獨進(jìn)行3DDCT三維離散余弦變換,得到F幀二維DCT系數(shù)矩陣; 所述F幀二維DCT系數(shù)矩陣在每幀內(nèi)按對角線向上逐次對半劃分為視頻塊,且視頻塊 數(shù)目滿足逐幀遞減。
2. 如權(quán)利要求1所述的視頻塊劃分方法,其特征在于,所述F幀二維DCT系數(shù)矩陣在每 幀內(nèi)按對角線向上逐次對半劃分為視頻塊,且視頻塊數(shù)目滿足逐幀遞減,包括: 在每幀二維DCT系數(shù)矩陣內(nèi),按對角線折半確定視頻塊邊界; 根所述據(jù)視頻塊邊界,得到L形視頻塊以及方形視頻塊; 在所述方形視頻塊內(nèi)繼續(xù)按對角線折半確定視頻塊邊界; 直至將所述二維DCT系數(shù)矩陣劃分為分配數(shù)目的視頻塊; 其中,根據(jù)預(yù)設(shè)的F幀二維DCT系數(shù)矩陣的視頻塊總數(shù)以及每幀二維DCT系數(shù)矩陣內(nèi) 視頻塊數(shù)目逐幀遞減,確定為每幀二維DCT系數(shù)矩陣分配的視頻塊數(shù)目。
3. 如權(quán)利要求1或2所述的視頻塊劃分方法,其特征在于,所述視頻塊劃分方法,還包 括: 為每個視頻塊內(nèi)的所有二維DCT系數(shù)分配一個加權(quán)系數(shù)gi :
其中,M為視頻塊總數(shù),Coj為視頻塊j內(nèi)的二維DCT系數(shù)占一個GOP內(nèi)所有二維DCT 系數(shù)的比例,λ i = E[Xi2]為視頻塊i的能量,μ i = E[yi2]為功率調(diào)節(jié)后視頻塊i的能量, 入j = E[x/]為視頻塊j的能量,P為發(fā)送信號功率上界。
4. 如權(quán)利要求3所述的視頻塊劃分方法,其特征在于,所述視頻塊劃分方法,還包括: 每個視頻塊內(nèi)加權(quán)后相鄰的一對二維DCT系數(shù)映射到QAM正交振幅調(diào)制符號的實部和 虛部上作為復(fù)信號傳輸。
5. -種視頻塊劃分裝置,其特征在于,包括: 3D DCT變換單元,用于將視頻分辨率為H*V的原始視頻中連續(xù)的F幀作為一個GOP畫 面組,對所述每個GOP單獨進(jìn)行3D DCT,得到F幀二維DCT系數(shù)矩陣; 視頻塊劃分單元,用于所述F幀二維DCT系數(shù)矩陣在每幀內(nèi)按對角線向上逐次對半劃 分為視頻塊,且視頻塊數(shù)目滿足逐幀遞減。
6. 如權(quán)利要求5所述的視頻塊劃分裝置,其特征在于,所述視頻塊劃分單元,具體用 于: 在每幀二維DCT系數(shù)矩陣內(nèi),按對角線折半確定視頻塊邊界; 根所述據(jù)視頻塊邊界,得到L形視頻塊以及方形視頻塊; 在所述方形視頻塊內(nèi)繼續(xù)按對角線折半確定視頻塊邊界; 直至將所述二維DCT系數(shù)矩陣劃分為分配數(shù)目的視頻塊; 其中,根據(jù)預(yù)設(shè)的F幀二維DCT系數(shù)矩陣的視頻塊總數(shù)以及每幀二維DCT系數(shù)矩陣內(nèi) 視頻塊數(shù)目逐幀遞減,確定為每幀二維DCT系數(shù)矩陣分配的視頻塊數(shù)目。
7. 如權(quán)利要求5或6所述的視頻塊劃分裝置,其特征在于,所述視頻塊劃分裝置,還包 括: 功率加權(quán)單元,用于為每個視頻塊內(nèi)的所有二維DCT系數(shù)分配一個加權(quán)系數(shù)gi :
其中,M為視頻塊總數(shù),Coj為視頻塊j內(nèi)的二維DCT系數(shù)占一個GOP內(nèi)所有二維DCT 系數(shù)的比例,λ i = E[Xi2]為視頻塊i的能量,μ i = E[yi2]為功率調(diào)節(jié)后視頻塊i的能量, 入j = E[x/]為視頻塊j的能量,P為發(fā)送信號功率上界。
8. 如權(quán)利要求7所述的視頻塊劃分裝置,其特征在于,所述視頻塊劃分裝置,還包括: 稠密星座映射單元,用于每個視頻塊內(nèi)加權(quán)后相鄰的一對二維DCT系數(shù)映射到QAM正 交振幅調(diào)制符號的實部和虛部上作為復(fù)信號傳輸。
【文檔編號】H04N21/6405GK104378653SQ201410706053
【公開日】2015年2月25日 申請日期:2014年11月27日 優(yōu)先權(quán)日:2014年11月27日
【發(fā)明者】王莉莎, 劉丹譜, 張志龍, 尹長川, 郝建軍, 羅濤, 李劍峰 申請人:北京郵電大學(xué)