專利名稱:一種基于空域分解的視頻幀內(nèi)編碼方法
技術領域:
本發(fā)明涉及一種用于視頻幀內(nèi)編碼方法,尤其涉及一種在視頻I幀 編碼過程中,將I幀在空域上分解成基本子幀和預測子幀,利用子幀內(nèi) 的空間相關性對基本子幀進行子幀內(nèi)預測與補償,利用子幀間存在的時 間相關性對預測子幀進行子幀間預測與補償,從而將重建子幀合成I幀 重建幀的視頻幀內(nèi)編碼方法,屬于視頻處理技術領域。
背景技術:
視頻圖像具有直觀生動、內(nèi)容豐富等特點,是人類最重要的信息載 體之一。特別是在今天的信息社會,數(shù)字化的視頻圖像已廣泛應用于工 農(nóng)業(yè)生產(chǎn)、日常生活和軍事偵察等各個方面。隨著信息技術的快速發(fā)展, 各種視頻應用對視頻圖像的分辨率、清晰度和色彩等的要求越來越高, 相應地,視頻圖像的數(shù)據(jù)量也急劇增加,遠遠超過了傳輸信道帶寬和存 儲容量的增長速度。因此,視頻編碼(即視頻壓縮)技術已成為信息領 域的重點研究課題,受到了廣泛的關注。
在現(xiàn)有視頻編碼技術中,將視頻編碼幀分為I幀、P幀和B幀。其中
I幀為幀內(nèi)編碼幀,只利用本幀信息進行編碼,在解碼時,僅用I幀的碼 流數(shù)據(jù)就可重構(gòu)出I幀的重建圖。p幀為前向預測編碼幀,它是以I幀為 參考幀,在I幀中找出p幀編碼塊的最佳預測值和運動向量,壓縮比較
高,時間復雜度較高。B幀是雙向預測幀,它以前面的I或P幀和后面的 P幀為參考幀,找出B幀參考塊的最佳預測值和運動矢量,壓縮比最高, 復雜度也最高。I幀只利用本幀視頻信息除去空間冗余進行編碼,因此與
預測幀相比,具有兩個明顯的特點第一,I幀具有較強的獨立性,能夠 方便地進行視頻快進、快退、暫停以及切換等操作,有效地提高了恢復 視頻的主觀質(zhì)量;第二, I幀只能利用本幀的空間相關性進行視頻壓縮, 與預測幀相比,在質(zhì)量相當?shù)那闆r下,I幀的碼流量是P幀碼流量的3倍 左右或者更大,壓縮比率較低。
在MPEG-2標準中,I幀編碼采用了簡單的空域預測算法。由于沒有 利用I幀本身信息進行有效的預測,而一概采用像素值128進行預測, 對于大多數(shù)視頻序列預測誤差較大,因此I幀的壓縮效率很低。在MPEG-4
標準中,I幀編碼塊采用了基于頻域的AC/DC預測算法,編碼塊首先進行 DCT變換,像素值從空域變換到頻域,利用相鄰塊的AC/DC系數(shù),對當前 編碼塊的系數(shù)進行預測,I幀壓縮效率有了一定的提高。在H. 264標準中, 幀內(nèi)預測首先利用周圍鄰近的像素值來預測當前的像素值,然后對預測 誤差進行編碼。這種幀內(nèi)預測基于不同尺寸的塊進行,并對不同的塊尺 寸采用不同的預測模式。對于亮度分量,塊尺寸有16X16和4X4兩種, 16X16塊有4種預測模式,4X4塊有9種預測模式;對于色度分量,預 測對整個8X8塊進行,有4種預測模式。
隨著技術的不斷發(fā)展,幀內(nèi)編碼的性能也逐漸提高,但是,現(xiàn)有的 幀內(nèi)編碼方法仍然沒有充分利用像素間存在的空間相關性,I幀的壓縮效 率遠低于預測幀的壓縮效率。因此,充分利用視頻圖像的空間相關性對I 幀編碼方法進行改進,從而在滿足I幀獨立性要求的前提下,有效提高I 幀的壓縮比率,具有重要的理論意義和實踐意義。
發(fā)明內(nèi)容
針對現(xiàn)有技術沒有充分利用I幀內(nèi)固有的空間相關性,存在壓縮比 率低的缺陷,本發(fā)明的目的在于提出一種新的基于空域分解/合成的視頻 幀內(nèi)編碼方法。
為實現(xiàn)上述發(fā)明目的,本發(fā)明采用下述的技術方案。 一種基于空域分解的視頻幀內(nèi)編碼方法,其特征在于包括如下的步
驟
步驟一對于視頻圖像中的I幀進行分解,形成基本子幀、水平子 幀、垂直子幀和對角子幀;
步驟二對所述基本子幀,對其中的宏塊利用子幀內(nèi)的空間相關性 進行子幀內(nèi)預測與補償,對殘差進行變換、量化,對量化系數(shù)進行反量 化反變換得到重建的基本子幀;
步驟三利用所述水平子幀與所述重建的基本子幀之間的時間相關 性進行子幀間預測與補償,對殘差進行變換、量化,對量化系數(shù)進行反 量化反變換得到重建的水平子幀;
步驟四利用所述垂直子幀與所述重建的基本子幀、所述重建的水 平子幀之間的時間相關性進行子幀間預測與補償,對殘差進行變換、量
化,對量化系數(shù)進行反量化反變換得到重建的水平子幀;
步驟五利用所述對角子幀與所述重建的水平子幀、所述重建的垂
直子幀之間的時間相關性進行子幀間預測與補償,對殘差進行變換、量 化,對量化系數(shù)進行反量化反變換得到重建的對角子幀;
步驟六利用步驟二 五所得到的重建的基本子幀、水平子幀、垂 直子幀和對角子幀,合成重建為新的I幀。
所述步驟一中,對I幀按照如下方法進行分解在組成所述I幀的 像素陣列中,以左上角的像素點為基準,隔行隔列選取相鄰的像素點組 成基本子幀;以所述基本子幀中的像素點為基準,由水平方向上的相鄰 像素點組成水平子幀,垂直方向上的相鄰像素點組成垂直子幀,對角方 向上的相鄰像素點組成對角子幀。
所述步驟二中,對于所述基本子幀中宏塊的亮度分量,首先計算編 碼塊的紋理復雜度,結(jié)合預設的閾值判斷編碼塊的尺寸,如果編碼塊紋 理簡單,則按照16X16塊大小進行編碼。如果編碼塊的模式選擇尺寸為 4X4塊大小,則通過相鄰塊估計最佳預測模式,結(jié)合環(huán)形滑動窗口將窗 口內(nèi)的預測模式追加為候選的預測模式,進行動態(tài)模式選擇。
步驟三 步驟五所述的水平子幀、垂直子幀和對角子幀的編碼過程 中,首先進行Interl6X16模式的匹配搜索,然后進行Skip模式的判斷。 在Interl6X16模式的匹配搜索過程中,首先進行整像素匹配搜索,求得 最優(yōu)的整像素匹配向量,然后在最優(yōu)的整像素匹配向量的基礎上進行亞 像素匹配搜索,求得最優(yōu)的亞像素匹配向量。
本發(fā)明所提供的視頻幀內(nèi)編碼方法能夠明顯提高I幀編碼的壓縮效 率。對于分辨率為720X576的視頻,與H. 264算法相比,PSNR值可提 高0.5 2dB,在PSNR值相同的情況下,本發(fā)明可節(jié)約10% 40%的碼流 量,重建幀的主觀質(zhì)量明顯好于H.264參考軟件JM9中算法的重建幀; 與MPEG-4采用的AC/DC預測算法相比,本方法的優(yōu)勢更加突出,客觀 質(zhì)量提高1.5 3.5dB,可節(jié)約25%~55%的碼流量,主觀質(zhì)量明顯提高。
圖1為本發(fā)明所述的基于空域分解的視頻幀內(nèi)編碼方法的基本流程 示意圖2為I幀的分解示意圖,用于描述I幀分解的過程; 圖3為預測子幀進行子幀間預測及補償?shù)牧鞒虉D,描述子幀間預測 包括Skip模式預判、整像素匹配搜索、亞像素匹配搜索的過程;
圖4為Foreman序列在不同幀內(nèi)編碼方法下的率失真曲線; 圖5為Houseriding序列在不同幀內(nèi)編碼方法下的率失真曲線。
具體實施例方式
下面結(jié)合附圖和具體實施方式
對本發(fā)明作進一步的說明。
圖1顯示了本視頻幀內(nèi)編碼方法的基本實施過程。
在I幀編碼過程中,視頻數(shù)據(jù)經(jīng)過預測、變換量化、熵編碼后產(chǎn)生 的碼流存入碼流緩存區(qū),該碼流可用于存儲或者傳輸;同時,對于量化 后系數(shù)要進行反量化變換、補償,產(chǎn)生重建塊,該重建塊作為后續(xù)幀的 參考幀編碼時可作為參考幀。其中,變換量化是對輸入的視頻數(shù)據(jù)以塊 為單位進行二維整數(shù)DCT變換和量化操作,消除了數(shù)據(jù)冗余,在H. 264 中,將變化和量化兩個過程中的乘法合并,減少了運算量,提高了編碼 器的運算速度,反量化變換是變換量化的逆過程。熵編碼是無損壓縮編 碼方法,有效消除了視頻數(shù)據(jù)的冗余信息。位率控制根據(jù)率失真模型為 視頻序列合理地分配目標位數(shù),有效提高恢復視頻的質(zhì)量。上述概念的 詳細解釋可參閱相關書籍,如畢厚杰主編的《新一代視頻壓縮編碼標準 一H. 264/AVC》(ISBN7-115-13064-7/TN. 2415, 2005年5月第一版,人民 郵電出版社)。
參見圖1所示,本視頻幀內(nèi)編碼方法首先對I幀進行空域上的分解, 得到四個子幀基本子幀、水平子幀、垂直子幀和對角子幀。然后,對
于基本子幀利用子幀內(nèi)的空間相關性進行子幀內(nèi)預測與補償,對于作為 預測子幀的水平子幀、垂直子幀和對角子幀則利用子幀間存在的時間相 關性進行子幀間預測與補償。具體的,首先對基本子幀進行編碼,即利 用編碼塊的上邊一行或者左邊一列像素進行子幀內(nèi)預測與補償,對補償 后殘差進行變換、量化,對量化系數(shù)進行熵編碼后寫入碼流緩存區(qū),同 時對量化系數(shù)進行反量化反變換得到重建的基本子幀,用作后續(xù)預測子 幀的參考幀。接著,分別對作為預測子幀的水平子幀、垂直子幀和對角 子幀進行編碼,利用重建的基本子幀與預測子幀的相關性,進行子幀間 預測與補償,對殘差系數(shù)進行變換、量化,對量化系數(shù)進行熵編碼寫入
碼流緩存區(qū),同時對量化系數(shù)進行反量化反變換得到重建的預測子幀, 用作后續(xù)預測子幀的參考幀。對各預測子幀的處理要分別進行,在本方 法中一共處理三次。最后,將得到的多個重建子幀進行合成,產(chǎn)生重建
的I幀。該I幀可以作為后續(xù)預測幀編碼的參考幀。這樣可以充分利用 子幀內(nèi)或子幀間存在的數(shù)據(jù)相關性,有效消除I幀的數(shù)據(jù)冗余,提高I 幀編碼的效率。
下面對上述過程展開詳細的說明。
1. 把I幀分解成一個基本子幀和三個預測子幀
由于已有的幀內(nèi)編碼方法沒有充分利用子幀內(nèi)或子幀間存在的數(shù)據(jù)
相關性,使得I幀的壓縮比率較低。如圖2所示,本發(fā)明按照隔行隔列
的原則將I幀中的每一個像素劃分到四個子幀中,形成水平和垂直分辨
率減半的基本子幀、水平子幀、垂直子幀和對角子幀。此處的子幀劃分
原則是指在構(gòu)成I幀的像素陣列中,以位于左上角的像素點為基準,隔
行隔列選取其相鄰的像素點,這些像素點組成基本子幀。以基本子幀中
的像素點為基準,其水平方向上的相鄰像素點組成水平子幀,垂直方向
上的相鄰像素點組成垂直子幀,而對角方向上的相鄰像素點組成對角子
幀。假設I幀的分辨率為2MX2N,產(chǎn)生的子幀的分辨率為MXN。 P (x,y)、
PB(x,y)、 PH(x,y)、 Pv(x,y)和P。(x,y)分別表示I幀、基本子幀、水平子幀、
垂直子幀和對角子幀的(x,y)處的像素值。則 PB(x,y) = P(2x,2y) (0"<M,0《y<N)
PH(x,y) = P(2x + l,2y) (0"<M,0《y<N)
,、 (1) Pv(x,y) = P(2x,2y + l)(0《x < M,O《y < N)
PD( x, y) = P(2x + l,2y + 1)(0《x < M,O S y < N)
按照圖2所示方法進行I幀分解后得到水平子幀、垂直子幀和對角 子幀。由于各子幀間的數(shù)據(jù)冗余較大,因此,在分別編碼三個預測子幀 的時候,參考己經(jīng)重建的預測子幀,可以極大提高預測子幀的壓縮比率, 提高I幀的編碼效率。
2. 對基本子幀進行子幀內(nèi)預測、補償以及后續(xù)編碼 在本實施例中,對于基本子幀中宏塊的亮度分量(即亮度塊)按照
16X16大小和4X4大小進行預測,色度分量(即色度塊)按照8X8大 小進行預測,模式定義與H. 264標準中定義相同。
一般地,紋理簡單的編碼塊適合按照16X16大小進行預測,而紋理 復雜,細節(jié)豐富的編碼塊適合按照4X4大小進行預測。本視頻幀內(nèi)編碼
方法用數(shù)學工具方差預先估計圖像的復雜程度,避免幀內(nèi)預測算法因搜
索全部9種4X4模式和4種16X16模式帶來的計算開銷,降低計算復雜 度。設NXN大小的圖像塊,、是像素的灰度值,5是像素灰度值的均值, 則方差S2為
<formula>formula see original document page 9</formula>
S2值越大,表示像素灰度值偏離均值越大,圖像就越復雜??紤]到
公式(2)中含有NXN個乘法和一個除法,計算復雜度高,本視頻幀內(nèi)編 碼方法作如下處理根據(jù)空域相關性,按照隔行隔列取像素計算;平方 計算改為絕對值計算;不除以像素總數(shù)??焖偎惴ㄒ院喕蟮墓?3) 計算圖像的復雜度。公式(3)中的5是隔行隔列選擇的部分像素的灰度 均值,abs表示絕對值操作。
<formula>formula see original document page 9</formula> (3)
在本方法中,設定兩個閾值T,和T"每個宏塊編碼前,首先按照公式 (3)計算T值,如果TST,,則按照16X16塊大小進行幀內(nèi)預測;如果 T》T2,則以4X4塊大小進行預測,如果T,〈T〈T2,則仍以兩種塊預測。 通過大量實驗,取T,二550, T2=950時算法性能最佳。
如果編碼塊按4X4預測,本視頻幀內(nèi)編碼方法利用中值法和滑動窗 口縮小模式選擇范圍,可進一步提高預測速度。利用圖像的空間相關性, 綜合參考作為相鄰塊的左鄰塊,上鄰塊和對角鄰快的紋理趨勢,估計出 當前塊的紋理方向,通過鄰塊的預測模式計算出當前塊的預測模式,稱 為預測模式的中值法估計。為了提高預測精度,以估計的預測模式作為 環(huán)形滑動窗口的中心做一定寬度的窗口 ,窗口內(nèi)的預測模式追加為候選 的預測模式,稱為滑動窗口動態(tài)模式選擇。預測模式的選擇范圍縮小之 后,本方法的時間復雜度大大降低,通過簡化塊匹配準則,可以進一步 提高運行速度。本方法中使用的子幀內(nèi)預測的詳細過程可參閱論文《適 用于H.264/AVC的快速幀內(nèi)預測算法》(電子學報,2007, Vol.34 No. 4, P668-672)。
按照亮度塊和色度塊選擇的最佳模式進行子幀內(nèi)補償,變換量化、
熵編碼。對于量化后系數(shù)進行反量化變換、補償?shù)玫骄幋a塊的重建塊。 在后續(xù)預測子幀編碼時用作參考幀。
3.對各個預測子幀進行子幀內(nèi)預測、補償以及后續(xù)編碼 前已述及,在本發(fā)明中,通過I幀分解產(chǎn)生的各子幀間存在極強的 數(shù)據(jù)相關性。與基于空域的多模式幀內(nèi)預測方法相比,子幀間預測能夠 更有效地消除數(shù)據(jù)冗余,提高編碼效率。因此,本視頻幀內(nèi)編碼方法在 對基本子幀進行編碼之后,以基本子幀的重建子幀為參考,對水平子幀 進行編碼,然后以基本子幀和水平子幀的重建子幀為參考,對垂直子幀 進行編碼,接著以水平和垂直子幀的重建子幀為參考,對對角子幀進行 編碼。
在H.264標準中,為了提高編碼效率,采用了多模式預測。如在編 碼p幀中的過程中,編碼塊需要進行Interl6X16、 Interl6X8 Inter8X16、 Inter8X8、 Inter8X4、 Inter4X8、 Inter4X4禾卩Skip模 式的選擇,計算量非常大。本方法中,由于子幀間數(shù)據(jù)相關性極強,沒 有必要進行多種模式的搜索,因此,與H.264中預測幀編碼相比,預測 子幀中宏塊的編碼模式只有兩種Interl6X16模式和Skip模式。極大 地降低了編碼計算量。
如圖3所示,本視頻幀內(nèi)編碼方法先進行Interl6X16模式的匹配搜 索,然后進一步判斷是否可以按照Skip模式進行編碼,最后按照選定的 編碼模式,整數(shù)DCT變換、量化、熵編碼。對于量化后系數(shù)進行反量化、 反變換、補償?shù)玫骄幋a塊的重建塊。
下面對此進行詳細的說明。 (1)整像素和亞像素匹配搜索
由于本方法中各個子幀是從同一個I幀分解得到,具有極強的相關 性,當前編碼塊與最匹配參考塊的相似程度高,匹配向量的模一般很小。 因此,為了提高匹配速度,匹配塊搜索的窗口可以設定的小一些。已有 運動估計算法中搜索窗口的大小設置為32X 32或者更大,本方法的一個 實施例設置窗口大小為6X6。本視頻幀內(nèi)編碼方法中的編碼塊采用16X 16大小,在匹配搜索過程中,采用具有起點預測的小菱形匹配搜索,搜 索窗口大小為6X6,通過編碼塊的左邊塊,上邊塊和右上塊的匹配向量 預測當前塊的初始匹配向量,首先進行整像素匹配搜索,求得最優(yōu)的整
像素匹配向量,然后在最優(yōu)的整像素匹配向量的基礎上進行亞像素匹配 搜索,求得最優(yōu)的亞像素匹配向量。
確定搜索起點常用的方法有中值法、加權平均法和誤差函數(shù)值比較 法三種。因為在多數(shù)情況下預測效果是第一位的,準確的預測能為后續(xù) 的搜索提供良好的起點,可以較快地到達搜索終點;各預測匹配向量對 應的點相關性較強,都有可能成為最優(yōu)匹配點,對它們進行搜索也是必 要的。因此,本方法采用了誤差函數(shù)值比較法的預測方式。亞像素位置 的點是通過整像素點插值得到,綜合考慮預測效果和計算量,本方法采 用線性插值。為了提高編碼速度,在不影響搜索精度的情況下,本方法 只搜索整像素周圍上下左右四個亞像素位置。
(2) Skip模式判斷
宏塊的最佳匹配模式是Skip模式的條件是最優(yōu)參考幀是前一個參 考幀;最優(yōu)匹配向量是預測的匹配向量;16X16塊的變換系數(shù)全部是零 或者近似為零。當按照Skip模式編碼時,不用向碼流中寫入匹配向量和 變換系數(shù),只寫入模式信息即可,這樣可以大大節(jié)省碼流量。由于編碼 子幀與參考子幀存在著極強的相關性,大多數(shù)編碼塊的編碼模式為Skip
模式,經(jīng)統(tǒng)計,35% 65%的編碼塊最終按照Skip模式編碼。因此,本方 法在進行完整像素和亞像素匹配搜索后,按照上述條件進行Skip模式判 斷。
(3) 獲得編碼塊的重建塊
如果編碼塊采用Skip模式,將模式信息寫入碼流緩存區(qū);直接復制 預測匹配向量指向的參考塊可形成重建塊,用于后續(xù)子幀的預測。如果 編碼塊不采用Skip模式,在求得的最優(yōu)亞像素匹配向量的基礎上,對亮 度分量、色度分量進行匹配補償,對補償后的殘差進行變換量化,得到 量化后編碼系數(shù),該系數(shù)進行熵編碼后寫入碼流緩沖區(qū)。對前述步驟求 得的量化后編碼系數(shù)進行反量化反變換,然后同最優(yōu)匹配向量對應的參 考塊做補償可形成重建塊,用于后續(xù)子幀的預測。
4.利用重建子幀合成重建的I幀。
將前述各步驟中重建出來的基本子幀、水平子幀、垂直子幀和對角 子幀按照分解的相反過程合成重建的I幀。具體的,此處的I幀合成原 則是指在構(gòu)成I幀重建幀的像素陣列中,以位于第一行、第一列像素點
位置為基準,隔行隔列位置的像素點依次來自重建的基本子幀。以位于 第一行、第二列像素點位置為基準,隔行隔列位置的像素點值依次來自 重建的水平子幀。以位于第二行、第一列的像素點位置為基準,隔行隔 列位置的像素點值依次來自重建的垂直子幀。以位于第二行、第二列的 像素點位置為基準,隔行隔列位置的像素點依次來自重建的對角子幀。 上述合成重建的I幀可作為后續(xù)預測幀編碼的參考幀。
圖4顯示了 Foreman序列在不同幀內(nèi)編碼方法下的率失真曲線。圖 5顯示了 Houseriding序列在不同幀內(nèi)編碼方法下的率失真曲線??梢钥?出,本發(fā)明所提供的視頻幀內(nèi)編碼方法能夠明顯提高I幀編碼的壓縮效 率。對于分辨率為720X 576的視頻,與H. 264算法相比,PSNR值可提 高0.5 2dB,在PSNR值相同的情況下,本發(fā)明可節(jié)約10% 40%的碼流 量,重建幀的主觀質(zhì)量明顯好于H.264參考軟件JM9中算法的重建幀; 與MPEG-4采用的AC/DC預測算法相比,本方法的優(yōu)勢更加突出,客觀 質(zhì)量提高1.5 3.5dB,可節(jié)約25%~55%的碼流量,主觀質(zhì)量明顯提高。
對本領域的一般技術人員而言,在不背離本發(fā)明實質(zhì)精神的前提下 對它所做的任何顯而易見的改動,都將構(gòu)成對本發(fā)明專利權的侵犯,將 承擔相應的法律責任。
權利要求
1. 一種基于空域分解的視頻幀內(nèi)編碼方法,其特征在于包括如下的步驟步驟一對于視頻中的I幀進行分解,形成基本子幀、水平子幀、垂直子幀和對角子幀;步驟二對所述基本子幀,對其中的宏塊利用子幀內(nèi)的空間相關性進行子幀內(nèi)預測與補償,對殘差進行變換、量化,對量化系數(shù)進行反量化反變換得到重建的基本子幀;步驟三利用所述水平子幀與所述重建的基本子幀之間的時間相關性進行子幀間預測與補償,對殘差進行變換、量化,對量化系數(shù)進行反量化反變換得到重建的水平子幀;步驟四利用所述垂直子幀與所述重建的基本子幀、所述重建的水平子幀之間的時間相關性進行子幀間預測與補償,對殘差進行變換、量化,對量化系數(shù)進行反量化反變換得到重建的水平子幀;步驟五利用所述對角子幀與所述重建的水平子幀、所述重建的垂直子幀之間的時間相關性進行子幀間預測與補償,對殘差進行變換、量化,對量化系數(shù)進行反量化反變換得到重建的對角子幀;步驟六利用步驟二~五所得到的重建的基本子幀、水平子幀、垂直子幀和對角子幀,合成重建為新的I幀。
2. 如權利要求1所述的基于空域分解的視頻幀內(nèi)編碼方法,其特征在于所述步驟一中,對I幀按照如下方法進行分解在組成所述I幀的像素陣列中,以左上角的像素點為基準,隔行隔列選取相鄰的像素點組 成基本子幀;以所述基本子幀中的像素點為基準,由水平方向上的相鄰像素點組成水平子幀,垂直方向上的相鄰像素點組成垂直子幀,對角方 向上的相鄰像素點組成對角子幀。
3. 如權利要求1所述的基于空域分解的視頻幀內(nèi)編碼方法,其特征在于所述步驟二中,對于所述基本子幀中宏塊的亮度分量,首先計算編碼塊的紋理復雜度(T),結(jié)合預設的閾值(T,)、 (T2)判斷編碼塊的模 式選擇尺寸,如果TST,則按照16X16塊大小進行模式選擇,如果 T,<TST2,按照16X16和4X4塊大小進行模式選擇,如果T>T2,則按照4X4塊大小分別進行模式選擇。
4. 如權利要求3所述的基于空域分解的視頻幀內(nèi)編碼方法,其特征 在于如果編碼塊的模式選擇尺寸為4X4塊大小,則通過相鄰塊估計最佳 預測模式,結(jié)合環(huán)形滑動窗口將窗口內(nèi)的預測模式追加為候選的預測模 式,進行動態(tài)模式選擇。
5. 如權利要求1所述的基于空域分解的視頻幀內(nèi)編碼方法,其特征 在于在所述水平子幀、垂直子幀和對角子幀中,編碼宏塊只采用 Interl6X16模式和Skip模式。首先進行Interl6 X 16模式搜索,然后 進行Skip模式的判斷。
6. 如權利要求5所述的基于空域分解的視頻幀內(nèi)編碼方法,其特征 在于在Interl6X16模式的匹配搜索過程中,首先進行搜索窗口范圍較小 的整像素匹配搜索,求得最優(yōu)的整像素匹配向量,然后在最優(yōu)的整像素 匹配向量的基礎上進行亞像素匹配搜索,求得最優(yōu)的亞像素匹配向量。
全文摘要
本發(fā)明公開了一種基于空域分解的視頻幀內(nèi)編碼方法。該方法將I幀分解為一個基本子幀和三個預測子幀,先后對四個子幀進行編碼。對基本子幀采用快速模式選擇算法進行子幀內(nèi)預測,按照選擇的最優(yōu)模式進行子幀內(nèi)補償。以重建的子幀為參考幀,對預測子幀進行子幀間預測和補償,先進行較小范圍的整像素匹配搜索和亞像素匹配搜索,然后進行Skip模式判斷,按照選中的模式重建出預測子幀。對四個子幀的重建子幀進行合成,形成I幀的重建幀。實驗結(jié)果表明,在PSNR值相同的情況下,重建幀的主觀質(zhì)量明顯好于H.264參考軟件JM9中推薦算法的重建幀。
文檔編號H04N7/50GK101389028SQ20081022408
公開日2009年3月18日 申請日期2008年10月15日 優(yōu)先權日2008年10月15日
發(fā)明者喬淑娟, 宋建斌, 波 李 申請人:北京航空航天大學