專利名稱:一種視頻壓縮編碼搜索算法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種視頻編碼方法,具體指一種在保證視頻編碼效率的前提下大幅度節(jié)減軟硬件實(shí)現(xiàn)中亞象素運(yùn)動(dòng)的部分運(yùn)算量的算法。
背景技術(shù):
在現(xiàn)有視頻壓縮編碼的亞象素搜索算法中,廣泛使用的技術(shù)是基于空間域的全搜索算法或是全搜索的各種快速算法,這些算法在搜索窗內(nèi)以象素塊為單位查找最匹配塊,以均方差和或絕對(duì)差值和為判斷法則,其搜索過(guò)程中需要作多次濾波插值,并反復(fù)計(jì)算代價(jià)函數(shù),計(jì)算復(fù)雜度非常高。實(shí)驗(yàn)顯示,進(jìn)入亞象素精度計(jì)算后,運(yùn)動(dòng)搜索過(guò)程的計(jì)算開(kāi)銷往往要超出原整象素搜索的一倍以上。不僅如此,匹配的準(zhǔn)確度還取決于插值算法的精度,從一定程度上影響編碼效率。在傳統(tǒng)視頻編碼中,編碼圖象首先需要進(jìn)行空間域-頻域變換,在頻域中完成量化、熵編碼,然后再做頻域-空間域變換,回到空間域進(jìn)行運(yùn)動(dòng)搜索及存儲(chǔ)。這樣的全搜索算法在亞象素搜索中的計(jì)算復(fù)雜度高,花銷的時(shí)間和效率低下,還影響視頻編碼的精度。
發(fā)明內(nèi)容
本發(fā)明針對(duì)現(xiàn)有的搜索算法復(fù)雜度高,精度低的缺陷提出一種新穎的搜索算法,在頻域直接利用相位的相關(guān)性預(yù)測(cè)和搜索運(yùn)動(dòng)矢量,該算法在亞象素搜索過(guò)程中由于不需要回到空間域,不需做插值計(jì)算,避免計(jì)算代價(jià)函數(shù),從而極大削減視頻編碼中運(yùn)動(dòng)搜索帶來(lái)的計(jì)算開(kāi)銷,適用于需要視頻內(nèi)容服務(wù)的嵌入式平臺(tái)。
目前被各視頻編碼標(biāo)準(zhǔn)普遍采用的是DCT變換,DCT域的亞象素運(yùn)動(dòng)搜索算法的算法流程如下 7)確定搜索窗為N,提取在x方向上以參考圖像整象素點(diǎn)F為起始的一維信號(hào)x1(n)及當(dāng)前圖像中對(duì)應(yīng)位置的x2(n); 8)根據(jù)DCT和DST變換公式,計(jì)算x1(n)和x2(n)的四個(gè)離散DCT/DST變換系數(shù); 9)計(jì)算在[1,N]區(qū)間的gmS,由DCT和DST變換公式、及滿足方程得到 10)根據(jù)gm的方程分析δ響應(yīng)的正負(fù)方向,得出mx的正負(fù)方向上的位移; 11)在y方向上重復(fù)以上步驟,得出y方向上的my的正負(fù)方向上的位移; 12)攜帶參數(shù)mx、my查詢表1,確定在亞象素空間位置圖中的匹配點(diǎn),同時(shí)確定半象素運(yùn)動(dòng)矢量。
表1 m與運(yùn)動(dòng)矢量 上述gm的方程 上述所述的DCT和DST變換公式,定義如下的DCT和DST變換為 上式中, 上述所述的滿足方程 其中, 上述滿足方程能改寫為能夠證明Z(k)是一個(gè)正交矩陣,并且有λZT(k)Z(k)=I2,I2是一個(gè)2×2的單位矩陣;這樣可以解出方程從而可以解出gmC、gmS。
將
近似代替
將
近似代替
以進(jìn)一步降低計(jì)算量。
如果需要1/4象素精度的運(yùn)動(dòng)矢量,按6)中所得的運(yùn)動(dòng)矢量使用雙線性濾波器插值,在所得象素塊上重復(fù)1)-6)步驟。
從上述算法及公式能分析出gmC、gmS這兩個(gè)屬于頻域的變量包含了平動(dòng)信息m,并從中提取出m,就能實(shí)現(xiàn)DCT域的運(yùn)動(dòng)搜索?;陬l域的快速運(yùn)動(dòng)搜索算法通過(guò)分析在頻域的相位來(lái)檢測(cè)物體運(yùn)動(dòng)信息,比起空間域的搜索算法,這種分析技術(shù)更接近物體運(yùn)動(dòng)的本質(zhì),擁有其極低的計(jì)算復(fù)雜度,本發(fā)明提出的基于頻域的亞象素運(yùn)動(dòng)搜索算法的計(jì)算復(fù)雜度大約是空間域亞象素全搜索算法的5%到2 0%之間,特別適用于嵌入式平臺(tái)或手持終端。
圖1為物體向右平動(dòng)m時(shí)的δ響應(yīng)示意圖; 圖2為物體向左平動(dòng)m時(shí)的δ響應(yīng)示意圖; 圖3為各標(biāo)準(zhǔn)測(cè)試序列下的計(jì)算性能復(fù)雜度比較; 圖4為亞象素空間位置示意圖。
具體實(shí)施方式
目前被各視頻編碼標(biāo)準(zhǔn)普遍采用的是DCT變換,DCT變換具有接近K-L變換的能量收斂性能,能夠?qū)⒋蟛糠帜芰考性谥绷骱偷皖l部分,在通過(guò)低通濾波器后,可以在高壓縮比下保證圖像質(zhì)量。針對(duì)這點(diǎn),本發(fā)明主要從DCT變換域的相位來(lái)推算空間的平動(dòng),由于DCT變換的特殊性,在DCT域不再像傅立葉那樣有簡(jiǎn)單的對(duì)應(yīng)關(guān)系。
有一維離散信號(hào){x1(n)|n∈
}(N為搜索窗的大小),經(jīng)右移m后,形成信號(hào){x2(n)|n∈
} 根據(jù)定義如下的DCT和DST變換式, 上式中, 容易證明,這四個(gè)變換滿足如下方程 其中, 將(8)中的方程改寫為可以證明,Z(k)是一個(gè)正交矩陣,并且有 λZT(k)Z(k)=I2(9) I2是一個(gè)2×2的單位矩陣。這樣,我們可以解出方程 從而可以解出gmC、gmS。
根據(jù)正弦函數(shù)的正交法則,有如下定律 其中,δ(n)是離散沖激函數(shù)。
根據(jù)式(8)、(10-12),可以得出關(guān)于gm的方程 我們看到,這兩個(gè)屬于頻域的變量包含了平動(dòng)信息m。如果能夠找到快速算法解出gmC、gmS,并從中提取出m,就能實(shí)現(xiàn)DCT域的運(yùn)動(dòng)搜索。
分析式(13)、(14),當(dāng)m大于0,且位于搜索窗
時(shí),總能在n=m處找到正的δ響應(yīng),同時(shí)在n=-m-1處找到負(fù)的δ響應(yīng);當(dāng)m<0,且位于搜索窗的負(fù)鏡象[-N,0)時(shí),總能在n=m處找到負(fù)的δ響應(yīng),同時(shí)在n=-m-1處找到正的δ響應(yīng)。如圖1(a)、圖1(b)所示,灰色區(qū)域?yàn)樗阉鞔?,如果在搜索?br>
發(fā)現(xiàn)正的δ響應(yīng),則意味著物體有向右的平動(dòng),m>0;如果在搜索窗
發(fā)現(xiàn)負(fù)的δ響應(yīng),則意味著物體有向左的平動(dòng),m<0。下文表1顯示,當(dāng)僅知m的正負(fù)方向,不需求解m的具體取值即可確定亞象素運(yùn)動(dòng)矢量,大大降低了計(jì)算量。
在具體計(jì)算時(shí),可將
近似代替
將
近似代替
以進(jìn)一步降低計(jì)算量。
在上文建立的各式基礎(chǔ)上,DCT域的亞象素運(yùn)動(dòng)搜索算法的算法流程如下第一步確定搜索窗為N,提取在x方向上以參考圖像整象素點(diǎn)F為起始的一維信號(hào)x1(n)及當(dāng)前圖像中對(duì)應(yīng)位置的x2(n); 第二步根據(jù)式(3-6),計(jì)算x1(n)和x2(n)的四個(gè)離散DCT/DST變換系數(shù); 第三步計(jì)算在[1,N]區(qū)間的gmS,由式(3-6)、(8)得到 第四步根據(jù)式(13)根據(jù)δ響應(yīng)的正負(fù)方向,得出mx的正負(fù)方向的位移; 第五步與上步驟同理,得出y方向上的my的正負(fù)方向位移; 第六步攜帶參數(shù)mx、my查詢表1,確定在亞象素空間位置示意圖中的匹配點(diǎn), 同時(shí)確定半象素運(yùn)動(dòng)矢量。
表1 m與運(yùn)動(dòng)矢量 如果需要1/4象素精度的運(yùn)動(dòng)矢量,按6)中所得的運(yùn)動(dòng)矢量使用雙線性濾波器插值,在所得象素塊上重復(fù)1)-6)步驟。
實(shí)驗(yàn)在H.264編碼平臺(tái)上進(jìn)行,使用的測(cè)試視頻編碼軟件的版本是JM8.6(JVT官方發(fā)布),編碼參數(shù)為量化參數(shù)=26、1幀參考圖像。使用的標(biāo)準(zhǔn)測(cè)試序列是大小為QCIF,長(zhǎng)度均為100幀的Foreman、Container、News、Silent、Carphone。圖3是本文的算法與全搜索算法在亞象素搜索中的計(jì)算復(fù)雜度比較。由于各測(cè)試序列的圖像構(gòu)成各異,計(jì)算復(fù)雜度各不相同,為方便起見(jiàn),將各個(gè)測(cè)試序列中的全搜索算法計(jì)算復(fù)雜度設(shè)為1,作為比較基準(zhǔn)。由圖3中可看出,本發(fā)明提出的基于頻域的亞象素運(yùn)動(dòng)搜索算法的計(jì)算復(fù)雜度大約是空間域亞象素全搜索算法的5%到20%之間。
對(duì)算法的編碼性能的測(cè)試數(shù)據(jù)下表所示,對(duì)于不同的圖像測(cè)試序列使用該算法編碼后圖像的峰值信噪比與全搜索算法相比,下降0.04到0.65dB。
下表為在不同測(cè)試序列下的編碼性能變化 基于頻域的快速運(yùn)動(dòng)搜索算法通過(guò)分析在頻域的相位來(lái)檢測(cè)物體運(yùn)動(dòng)信息,比起空間域的搜索算法,這種分析技術(shù)更接近物體運(yùn)動(dòng)的本質(zhì)。由于其極低的計(jì)算復(fù)雜度,特別適用于嵌入式平臺(tái)或手持終端。
在上述實(shí)施例中,僅對(duì)本發(fā)明進(jìn)行了示范性描述,但是本領(lǐng)域技術(shù)人員在不脫離本發(fā)明所保護(hù)的范圍和精神的情況下,可根據(jù)不同的實(shí)際需要設(shè)計(jì)出各種實(shí)施方式。
權(quán)利要求
1.一種視頻壓縮編碼搜索算法,其算法流程如下
1)確定搜索窗為N,提取在x方向上以參考圖像整象素點(diǎn)F為起始的一維信號(hào)x1(n)及當(dāng)前圖像中對(duì)應(yīng)位置的x2(n);
2)根據(jù)DCT和DST變換公式,計(jì)算x1(n)和x2(n)的四個(gè)離散DCT/DST變換系數(shù);
3)計(jì)算在[1,N]區(qū)間的gms,由DCT和DST變換公式、及滿足方程得到
4)根據(jù)gm方程分析δ響應(yīng)的正負(fù)方向,得出mx的正負(fù)方向上的位移;
5)在y方向上重復(fù)以上步驟,得出y方向上的my的正負(fù)方向上的位移;
6)攜帶參數(shù)mx、my查詢表1,確定在亞象素空間位置圖中的匹配點(diǎn),同時(shí)確定半象素運(yùn)動(dòng)矢量。
表1m與運(yùn)動(dòng)矢量
2.要求1所述的視頻壓縮編碼搜索算法,其特征在于上述步驟4)中的gm方程為
3.權(quán)利要求1述的視頻壓縮編碼搜索算法,其特征在于上述步驟2)、3)中所述的DCT和DST變換公式為
上式中,
4.要求1所述的視頻壓縮編碼搜索算法,其特征在于上述步驟3)所述的滿足方程其中,
5.根據(jù)權(quán)利要求4述的視頻壓縮編碼搜索算法,其特征在于上述滿足方程能改寫為能夠證明Z(k)是一個(gè)正交矩陣,并且有λZT(k)Z(k)=I2,I2是一個(gè)2×2的單位矩陣;這樣能解出方程從而可以解出gmC、gmS。
6.根據(jù)權(quán)利要求2所述的視頻壓縮編碼搜索算法,其特征在于將
近似代替將
近似代替以進(jìn)一步降低計(jì)算量。
7.根據(jù)權(quán)利要求1所述的視頻壓縮編碼搜索算法,其特征在于當(dāng)需要1/4象素精度的運(yùn)動(dòng)矢量,按步驟6)中所得的運(yùn)動(dòng)矢量使用雙線性濾波器插值,在所得象素塊上重復(fù)步驟1)-6)。
全文摘要
本發(fā)明涉及一種視頻編碼方法,具體指一種在保證視頻編碼效率的前提下大幅度節(jié)減軟硬件實(shí)現(xiàn)中亞象素運(yùn)動(dòng)的部分運(yùn)算量的算法。基于頻域的快速運(yùn)動(dòng)搜索算法通過(guò)分析在頻域的相位來(lái)檢測(cè)物體運(yùn)動(dòng)信息,比起空間域的搜索算法,這種分析技術(shù)更接近物體運(yùn)動(dòng)的本質(zhì),擁有其極低的計(jì)算復(fù)雜度,通過(guò)gmC、gmS這兩個(gè)屬于頻域的變量包含了平動(dòng)信息m,并從中提取出m,就能實(shí)現(xiàn)DCT域的運(yùn)動(dòng)搜索。本發(fā)明提出的基于頻域的亞象素運(yùn)動(dòng)搜索算法的計(jì)算復(fù)雜度大約是空間域亞象素全搜索算法的5%到20%之間,特別適用于嵌入式平臺(tái)或手持終端。
文檔編號(hào)H04N7/32GK101583028SQ200810067220
公開(kāi)日2009年11月18日 申請(qǐng)日期2008年5月14日 優(yōu)先權(quán)日2008年5月14日
發(fā)明者馬國(guó)強(qiáng) 申請(qǐng)人:深圳市融合視訊科技有限公司