專利名稱:基于正交分布模型的快速運(yùn)動(dòng)估計(jì)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻編碼技術(shù)領(lǐng)域,特別是基于正交分布模型的快速運(yùn)動(dòng)估計(jì)方法。
背景技術(shù):
目前流行的視頻編碼標(biāo)準(zhǔn)如國(guó)際電信聯(lián)盟(ITU)制定的H系列和國(guó)際標(biāo)準(zhǔn)組織(ISO)制定的MPEG系列采用的都是基于塊匹配的混合編碼模型。視頻數(shù)據(jù)壓縮通過(guò)去除掉相鄰塊或者是相鄰幀之間的空間或者時(shí)間冗余,以減少存儲(chǔ)空間或者傳輸帶寬。運(yùn)動(dòng)估計(jì)通過(guò)運(yùn)動(dòng)矢量搜索得到運(yùn)動(dòng)矢量的最佳估計(jì)。運(yùn)動(dòng)搜索分為整像素運(yùn)動(dòng)搜索和子像素運(yùn)動(dòng)搜索。眾所周知的,全搜索方法的精度最高,但是其運(yùn)算量大,實(shí)現(xiàn)復(fù)雜度高,故在一定的重建圖像質(zhì)量的要求下,可以設(shè)計(jì)快速整像素運(yùn)動(dòng)搜索方法來(lái)達(dá)到加速運(yùn)動(dòng)搜索的目的。目前最優(yōu)秀、最具有代表性的快速整像素運(yùn)動(dòng)搜索方法有鉆石形搜索法(DS)以及六邊形搜索法(HEXBS)。
一般整像素運(yùn)動(dòng)搜索方法的處理過(guò)程是,對(duì)于圖像序列當(dāng)前幀中給定的圖像數(shù)據(jù)塊(連續(xù)像素點(diǎn)組成的矩形塊),在圖像序列其它重建圖像幀(參考幀)的某個(gè)大小的搜索窗口中按照一定最佳匹配準(zhǔn)則搜索最佳匹配塊。搜索窗口范圍相對(duì)于當(dāng)前幀中的當(dāng)前塊的中心位置為中心,范圍分別定義為wx和wy,則其窗口大小為(2wx+1)*(2wy+1)。如果wx=wy=w,則稱搜索窗±w。上述的最佳匹配的準(zhǔn)則有多種定義,目前大多采用的是代價(jià)函數(shù)SAD,如式1所示SAD(P)=Σi=0N-1Σj=0M-1|f(i,j,t)-f(i-x,j-y,t-1)|---(1)]]>式(1)中NxM是當(dāng)前塊(當(dāng)前塊中待匹配的圖像塊)的大小,也是參考幀中搜索塊(參考幀中的圖像數(shù)據(jù)塊)的大??;f(i,j,t)是t時(shí)刻的圖像幀在(i,j)坐標(biāo)位置處的像素的亮度值;(x,y)表示當(dāng)前塊位置指向參考幀中像素點(diǎn)P位置的運(yùn)動(dòng)矢量的兩個(gè)分量。
前面提到,目前速度與搜索精度表現(xiàn)最為優(yōu)秀的快速算法的主要代表有鉆石形搜索法(DS)和六邊形搜索法(HEXBS)。下面先分別介紹這兩種方法的搜索過(guò)程。
鉆石形搜索法(DS)的搜索模板以及搜索策略如圖1所示,六邊形搜索法(HEXBS)的搜索模板以及搜索策略如圖2所示。由于兩者在搜索算法上非常類似,所不同的只是搜索模板的選取,故下面以六邊形搜索法(HEXBS)為例來(lái)說(shuō)明其搜索過(guò)程(1)以當(dāng)前塊為中心,搜索六邊形模板的6個(gè)點(diǎn),得到6個(gè)代價(jià)函數(shù)值。在這6個(gè)代價(jià)函數(shù)值與起始點(diǎn)的代價(jià)函數(shù)值中,代價(jià)函數(shù)值最小者為最佳匹配點(diǎn)。如果最佳匹配點(diǎn)處于六邊形的中心,則轉(zhuǎn)到第三步,否則到第二步;(2)以前一步搜索得到的最佳匹配點(diǎn)為起始點(diǎn),搜索六邊形模板的6個(gè)點(diǎn)(此時(shí)已經(jīng)搜索過(guò)的點(diǎn)并不再進(jìn)行搜索),得到6個(gè)代價(jià)函數(shù)值。在這6個(gè)代價(jià)函數(shù)值與起始點(diǎn)的代價(jià)函數(shù)值中,代價(jià)函數(shù)值最小者為最佳匹配點(diǎn)。如果最佳匹配點(diǎn)位于六邊形的中心,則轉(zhuǎn)到第三步,否則重復(fù)這一步;(3)以前一步搜索得到的最佳匹配點(diǎn)為起始點(diǎn),搜索鉆石形模板的4上點(diǎn)得到4個(gè)代價(jià)函數(shù)值,取該4個(gè)代價(jià)函數(shù)值與起始點(diǎn)的代價(jià)函數(shù)值最小者為最佳匹配點(diǎn),最佳匹配點(diǎn)對(duì)應(yīng)的運(yùn)動(dòng)矢量即為最終的運(yùn)動(dòng)矢量。
由圖1可以看出當(dāng)鉆石形搜索法(DS)大模板共有9個(gè)搜索點(diǎn),如果第一級(jí)大模板搜索結(jié)束后的最佳匹配點(diǎn)位于角點(diǎn)和邊點(diǎn)時(shí),新增搜索點(diǎn)數(shù)目是不相同的,當(dāng)前一步搜索位于大模板的角點(diǎn)時(shí),下一步新增加5個(gè)搜索點(diǎn);當(dāng)前一步搜索最佳匹配點(diǎn)位于大模板的邊點(diǎn)時(shí),下一步新增加3個(gè)搜索點(diǎn)。而由圖2C和圖2D發(fā)現(xiàn),鉆石形搜索法(HEXBS)的大模板共有七個(gè)搜索點(diǎn),而且無(wú)論第一步搜索后的最佳匹配點(diǎn)是在六邊形上的任何一點(diǎn)時(shí),在下一步搜索都只是增加3個(gè)搜索點(diǎn)。從以上兩點(diǎn)可以看出,鉆石形搜索法(DS)在搜索點(diǎn)數(shù)上比六邊形搜索法(HEXBS)要少,而且對(duì)于不同運(yùn)動(dòng)的序列,鉆石形搜索法(DS)在搜索點(diǎn)數(shù)上要比六邊形搜索法(HEXBS)要波動(dòng)得大。
但是即使是目前快速運(yùn)動(dòng)搜索算法中最優(yōu)秀、最具有代表性的菱形搜索算法(DS)和六邊形搜索算法(HEXBS),在一定重建圖像質(zhì)量的情況下,其運(yùn)動(dòng)搜索部分所耗費(fèi)的計(jì)算量仍然是整個(gè)編碼器所耗費(fèi)計(jì)算量的60%以上。
發(fā)明內(nèi)容
為解決現(xiàn)有技術(shù)中存在的問(wèn)題,本發(fā)明提供了一種用于視頻壓縮的快速運(yùn)動(dòng)搜索方法,既達(dá)到大幅度提高搜索速度的目的,又保證與現(xiàn)有快速運(yùn)動(dòng)估計(jì)算法(DS、HEXBS等)相當(dāng)?shù)乃阉骶?,但該方法并不僅僅局限于提供了一種快速運(yùn)動(dòng)搜索的方法,還提供了一種運(yùn)動(dòng)矢量的分布特性,運(yùn)用該特性,還可與現(xiàn)在的快速運(yùn)動(dòng)搜索方法(如DS、HEXBS等)相結(jié)合,進(jìn)一步對(duì)現(xiàn)在的算法性能進(jìn)行提升。
本發(fā)明的一個(gè)方面,提出了一種新的研究運(yùn)動(dòng)矢量分布特性的方法,根據(jù)誤差曲面分布具有局部的特征,而沒(méi)有全局的特征的表示,本發(fā)明摒棄了一般的采用誤差曲面分布作為研究運(yùn)動(dòng)矢量分布特性的研究對(duì)象的方法,而是直接采用,更具有一般的能夠全面的反映運(yùn)動(dòng)矢量分布的方法,即采用所有的運(yùn)動(dòng)矢量來(lái)研究運(yùn)動(dòng)矢量的統(tǒng)計(jì)分布規(guī)律。
根據(jù)本發(fā)明的另一個(gè)方面,提出了一個(gè)運(yùn)動(dòng)矢量分布的一個(gè)正交分布模型,這是一個(gè)基于統(tǒng)計(jì)的分布模型。其提出的依據(jù)是因?yàn)槿阉鞯木茸罡撸ㄟ^(guò)采用全搜索所得到的大量的運(yùn)動(dòng)矢量作為研究對(duì)象,統(tǒng)計(jì)其分布的規(guī)律;考慮到現(xiàn)有的快速運(yùn)動(dòng)搜索算法都會(huì)不可避免的陷入局部最優(yōu)點(diǎn),我們可以對(duì)這個(gè)運(yùn)動(dòng)矢量的分布進(jìn)行一個(gè)理想化,通過(guò)把絕大部分的運(yùn)動(dòng)矢量的分布都包括在分布模型當(dāng)中,而把極少量的運(yùn)動(dòng)矢量的分布情況排除在外,這樣我們可以得到一個(gè)運(yùn)動(dòng)矢量的基于正交分布的理想分布模型。
根據(jù)本發(fā)明的另一個(gè)方面,根據(jù)本發(fā)明提出的正交分布模型,提出了一種與現(xiàn)有二級(jí)搜索方法不同的搜索方法。本發(fā)明提出了一種新的搜索方法,在該搜索方法里,首先搜索中心處周?chē)乃阉鼽c(diǎn),這與現(xiàn)有的傳統(tǒng)搜索方法是一致的,但是在這一步搜索過(guò)后,根據(jù)當(dāng)前搜索的最佳匹配點(diǎn)的位置,分別對(duì)于兩個(gè)正交方向采用各自的搜索模板,再次分別進(jìn)行二級(jí)搜索,即是一種現(xiàn)有的二級(jí)搜索方法里面嵌套另一種二級(jí)搜索的方法。其中嵌套的二級(jí)搜索方法是根據(jù)正交分布模型而采用的搜索方法,具有搜索點(diǎn)數(shù)少,方向明確且快速定位的特征。
本方法的主要思想是通過(guò)對(duì)全搜索得到的運(yùn)動(dòng)矢量分布進(jìn)行統(tǒng)計(jì)分析找出其分布規(guī)律,建立一個(gè)運(yùn)動(dòng)矢量的理想分布模型,并依照該模型設(shè)計(jì)了相應(yīng)的搜索模板與搜索策略。該方法在保證編碼質(zhì)量與編碼后的比特率與現(xiàn)有的方法相當(dāng)?shù)那闆r下,大大提升搜索速度。在保證搜索精度的前提下大幅度降低視頻壓縮中運(yùn)動(dòng)搜索時(shí)平均每塊的搜索點(diǎn)數(shù)。
技術(shù)方案一種基于運(yùn)動(dòng)矢量理想正交分布模型的快速整像素運(yùn)動(dòng)搜索方法,包括搜索模板的選擇依據(jù)于正交分布模型,利用運(yùn)動(dòng)矢量的正交分布特性,快速定位到最優(yōu)點(diǎn)的附近,在各級(jí)搜索模板所對(duì)應(yīng)的多個(gè)運(yùn)動(dòng)搜索點(diǎn)上進(jìn)行運(yùn)動(dòng)搜索;根據(jù)運(yùn)動(dòng)搜索的結(jié)果找到多個(gè)運(yùn)動(dòng)搜索點(diǎn)中最小的運(yùn)動(dòng)搜索點(diǎn);再根據(jù)這個(gè)最小的運(yùn)動(dòng)搜索點(diǎn)在第一級(jí)(初始)搜索模板中所處的位置來(lái)決定下一步運(yùn)動(dòng)搜索所采用的搜索模板。
所述的基于運(yùn)動(dòng)矢量理想正交分布模型的快速整像素運(yùn)動(dòng)搜索方法,首先搜索中心處周?chē)乃阉鼽c(diǎn),這一步搜索過(guò)后,根據(jù)當(dāng)前搜索的最佳匹配點(diǎn)的位置,分別對(duì)于兩個(gè)正交方向采用各自的搜索模板,再次分別進(jìn)行二級(jí)搜索,即二級(jí)搜索方法里面嵌套另一種二級(jí)搜索的方法,其中嵌套的二級(jí)搜索方法是根據(jù)正交分布模型而采用的搜索方法。
所述的基于運(yùn)動(dòng)矢量理想正交分布模型的快速整像素運(yùn)動(dòng)搜索方法,依據(jù)第一級(jí)最佳匹配點(diǎn)的位置,其搜索可分為二級(jí)或者三級(jí)搜索,具體如下(a)將上一級(jí)搜索得到的最佳匹配點(diǎn)作為本級(jí)搜索的起始點(diǎn),再依據(jù)該點(diǎn)是在上一級(jí)搜索模板中的位置決定采用下一級(jí)的搜索模板;
(b)如果采用初始模板搜索得到的最佳匹配點(diǎn)位于初始搜索模板的中心點(diǎn),則以該點(diǎn)為本級(jí)搜索的起始點(diǎn),直接采用最終搜索模板進(jìn)行最終的精細(xì)搜索,得到每個(gè)點(diǎn)的代價(jià)函數(shù)值,代價(jià)函數(shù)值最小者即為最終的運(yùn)動(dòng)矢量;(c)如果采用初始模板搜索得到的最佳匹配點(diǎn)位于初始搜索模板的垂直或者水平方向上的位置時(shí),則以該點(diǎn)作為本級(jí)搜索的起始點(diǎn),直接在垂直或者水平軸向上進(jìn)行快速搜索定位到最接近最終運(yùn)動(dòng)矢量的位置,該點(diǎn)為最終搜索模板的中心進(jìn)行搜索,如果最終搜索模板搜索的最佳匹配點(diǎn)位置不在中心時(shí),就以上級(jí)搜索得到的最佳匹配點(diǎn)作為最終搜索模板的中心,重新進(jìn)行最終模板搜索,直到搜索得到的最佳匹配點(diǎn)位于最終搜索模板的中心為止。
所述的基于運(yùn)動(dòng)矢量理想正交分布模型的快速整像素運(yùn)動(dòng)搜索方法,所說(shuō)的模板選取突出了方向的特征,所說(shuō)的模板定義如下首先定義一個(gè)基本的5點(diǎn)菱形搜索模板,也就是本發(fā)明的初始搜索模板,此模板上的各點(diǎn)的坐標(biāo)集合ΩO-5為ΩO-5={(x,y)|(±2,0),(0,±2),(0,0)}當(dāng)搜索初始搜索模板的5個(gè)搜索點(diǎn)后,得到5個(gè)代價(jià)函數(shù),如果代價(jià)函數(shù)值最小對(duì)應(yīng)的搜索點(diǎn)在第一級(jí)的5個(gè)搜索模板的中心時(shí),則直接搜索下述的小菱形搜索模板即方法中所說(shuō)的最終搜索模板,該模板搜索后得到的最佳匹配點(diǎn)即為最終的運(yùn)動(dòng)矢量所指向的塊,這個(gè)小菱形搜索模板的各點(diǎn)的坐標(biāo)集合Ωoo-5為Ωoo-5={(x,y)|(±1,0),(0,±1),(0,0)}當(dāng)搜索完初始搜索模板的5個(gè)搜索點(diǎn)后,得到5個(gè)代價(jià)函數(shù),如果代價(jià)函數(shù)最小對(duì)應(yīng)的搜索點(diǎn)在初始搜索模板的水平或者垂直方向上時(shí),則分別采用以下模板進(jìn)行搜索,水平和垂直方向上的搜索模板分別定義如下Ωh-2={(x,y)|(0,0),(±2,0)}Ωv-2={(x,y)|(0,0),(0,±2)}在水平和垂直方向搜索過(guò)后,最后一級(jí)采用的與初始搜索后最佳匹配點(diǎn)在中心時(shí)的搜索模板一致,即均為Ωoo-5,只是考慮到最佳匹配點(diǎn)在初始搜索模板過(guò)后,最終的匹配塊就中心點(diǎn)附近,故一次搜索即可,而水平或者垂直方向搜索后,只是搜索到一個(gè)在軸向上比較接近最終匹配塊的位置,故要一直搜索到最佳匹配塊位于模板中心為止。故最后一級(jí)搜索的模板均為Ωoo-5,只是不同位置采用的策略不同。
所述的基于正交模型的快速整像素運(yùn)動(dòng)搜索方法,所述的搜索策略,具體如下(a)以當(dāng)前位置為起點(diǎn),搜索初始搜索模板的5個(gè)點(diǎn),得到5個(gè)搜索點(diǎn)的代價(jià)函數(shù)值;取代價(jià)函數(shù)值最小者為本步驟最佳匹配點(diǎn),作為下一步搜索的起點(diǎn);如果最佳匹配點(diǎn)在初始搜索模板的中心,則轉(zhuǎn)到步驟(b);如果最佳匹配點(diǎn)在初始搜索模板的水平方向兩點(diǎn)時(shí),轉(zhuǎn)到步驟(c);如果最佳匹配點(diǎn)在初始大菱形搜索模板的垂直方向兩點(diǎn)時(shí),轉(zhuǎn)到步驟(d);(b)以前一步搜索所得的最佳匹配點(diǎn)作為起始點(diǎn),搜索最終搜索模板的5個(gè)點(diǎn),得到5個(gè)搜索點(diǎn)的代價(jià)函數(shù)值;代價(jià)函數(shù)值最小的點(diǎn)即為最終的運(yùn)動(dòng)矢量所指向的點(diǎn),搜索終止;(c)以前一步搜索所得的最佳匹配點(diǎn)作為起始點(diǎn),搜索水平方向搜索模板的3個(gè)點(diǎn),得到3個(gè)搜索點(diǎn)的代價(jià)函數(shù)值,取代價(jià)函數(shù)值最小者為本步驟最佳匹配點(diǎn);如果本步驟的最佳匹配點(diǎn)不位于中心點(diǎn),則轉(zhuǎn)到步驟(c);如果本步驟的最佳匹配點(diǎn)位于中心點(diǎn),則轉(zhuǎn)到步驟(e);(d)以前一步搜索所得的最佳匹配點(diǎn)作為起始點(diǎn),搜索垂直方向搜索模板的3個(gè)點(diǎn),得到3個(gè)搜索點(diǎn)的代價(jià)函數(shù)值,取代價(jià)函數(shù)值最小者為本步驟最佳匹配點(diǎn);如果本步驟的最佳匹配點(diǎn)不位于中心點(diǎn),則轉(zhuǎn)到步驟(d);如果本步驟的最佳匹配點(diǎn)位于中心點(diǎn),則轉(zhuǎn)到步驟(e);(e)以前一步搜索所得的最佳匹配點(diǎn)作為起始點(diǎn),搜索最終搜索模板的5個(gè)點(diǎn),得到5個(gè)搜索的代價(jià)函數(shù)值,代價(jià)函數(shù)值最小的點(diǎn)即為本步驟所得的最佳匹配點(diǎn);如果本步驟的最佳匹配點(diǎn)不位于中心點(diǎn),則重復(fù)步驟(e);如果本步驟的最佳匹配點(diǎn)位于中心點(diǎn),則此最佳匹配點(diǎn)即為最終的運(yùn)動(dòng)矢量所指向的點(diǎn),搜索終止。
隨后的詳細(xì)說(shuō)明及附圖將更全面的闡述本發(fā)明,但是它們不應(yīng)該被理解為將所附權(quán)利要求限制為所示出的具體實(shí)施,而僅僅是用于解釋和理解。
圖1A示出了鉆石形搜索法的第一級(jí)搜索模板圖。
圖1B示出了鉆石形搜索法的第二級(jí)搜索模板他圖。
圖1C示出了鉆石形搜索法第一級(jí)搜索后的最佳匹配點(diǎn)位于角點(diǎn)時(shí)的搜索策略圖。
圖1D示出了鉆石形搜索法第一級(jí)搜索后的最佳匹配點(diǎn)位于邊點(diǎn)時(shí)的搜索策略圖。
圖2A示出了六邊形搜索法的第一級(jí)搜索模板圖。
圖2B示出了六邊形搜索法的第二級(jí)搜索模板他圖。
圖2C示出了六邊形搜索法第一級(jí)搜索后的最佳匹配點(diǎn)位于水平方向點(diǎn)時(shí)的搜索策略圖。
圖2D示出了六邊形搜索法第一級(jí)搜索后的最佳匹配點(diǎn)位于垂直方向上的點(diǎn)時(shí)的搜索策略圖。
圖3示出了基于正交分布模型的整像素快速運(yùn)動(dòng)搜索的搜索流程圖。
圖4示出了基于正交分布模型的整像素快速運(yùn)動(dòng)搜索方法的搜索模板圖。
圖5示出了基于正交分布模型的整像素快速運(yùn)動(dòng)搜索方法的搜索策略示意圖。
圖6示出了一個(gè)正交搜索方法的搜索實(shí)例。
具體實(shí)施例方式
這里公開(kāi)了一種基于正交分布模型的快速整像素搜索方法。用于進(jìn)行正交分布模型的快速整像素搜索方法的一個(gè)實(shí)施例包括以下操作在各級(jí)搜索模板所對(duì)應(yīng)的多個(gè)運(yùn)動(dòng)搜索點(diǎn)上進(jìn)行運(yùn)動(dòng)搜索;根據(jù)運(yùn)動(dòng)搜索的結(jié)果找到多個(gè)運(yùn)動(dòng)搜索點(diǎn)中最小的運(yùn)動(dòng)搜索點(diǎn);再根據(jù)這個(gè)最小的運(yùn)動(dòng)搜索點(diǎn)在初始搜索模板中所處的位置來(lái)決定下一步運(yùn)動(dòng)搜索所采用的搜索模板。
接下來(lái)將詳細(xì)描述基于正交分布模型的快速整像素搜索方法參見(jiàn)圖3。
首先是選擇搜索的起始點(diǎn),起始點(diǎn)的選擇是一個(gè)單獨(dú)的內(nèi)容,在本發(fā)明中,采用的是以當(dāng)前塊位置為搜索的起始點(diǎn),而為了提高搜索的精度,可以加入現(xiàn)有的任何一種初始運(yùn)動(dòng)矢量預(yù)測(cè)算法,這并不影響本發(fā)明在同等條件下與同類算法的性能比較;其次就是搜索模板的設(shè)計(jì)以及搜索策略,在本發(fā)明中,為了體現(xiàn)出本發(fā)明所強(qiáng)調(diào)的運(yùn)動(dòng)矢量的分布是具有非常明顯特征的特點(diǎn),在本發(fā)明中提到的模板是直接采用具有上下左右四個(gè)搜索點(diǎn)外加一個(gè)中心點(diǎn)的菱形搜索模板,但本發(fā)明在這里所要表示的是一種方法,是一種具有方向搜索的方法,并不表示局限于此模板;再次就是本發(fā)明分別針對(duì)第一級(jí)搜索后最佳匹配點(diǎn)的位置,分別采用了不同的搜索策略。
附圖詳細(xì)步驟說(shuō)明1.以當(dāng)前搜索窗的中心采用初始搜索模板進(jìn)行搜索,得到MBD點(diǎn),依據(jù)MBD點(diǎn)在初始搜索模板中的位置分別采用不同的搜索模板和搜索策略,如圖中步驟一;2.若MBD點(diǎn)位于初始搜索模板的中心,則采用最終搜索模板再進(jìn)行一次搜索,這步得到的即為最終的運(yùn)動(dòng)矢量,搜索終止,如圖中步驟二;3.若MBD不位于初始搜索模板的中心,根據(jù)本方法提出的一個(gè)運(yùn)運(yùn)矢量正交分布的模型,則需要在水平或者是垂直方向快速定位到最佳匹配塊的附近,這一步即圖中所示的水平方向(如圖中步驟三)或者垂直方向搜索(如圖中步驟四),這也是本方法所提到的一個(gè)在二級(jí)搜索里再嵌套的另一個(gè)二級(jí)搜索。
4.本方法中,初始搜索得到的點(diǎn)位置不同導(dǎo)致接下來(lái)的搜索模板不同和搜索策略不同,還表現(xiàn)在最終搜索模板的處理上,初始模板搜索后,若MBD點(diǎn)位于中心,則僅僅再搜索一次最終搜索模板即可,而為了提高精度,本方法對(duì)于水平或者垂直方向的搜索后,采用的最終搜索卻是要一直迭代(如圖中步驟五所示),直到MBD點(diǎn)位于最終搜索模板的中心點(diǎn)才終止搜索。
圖4示出了基于正交分布模型的整像素快速運(yùn)動(dòng)搜索方法的搜索模板圖。其中(a),(b)為對(duì)應(yīng)于中心點(diǎn)的二級(jí)搜索模板,(c),(d)為對(duì)應(yīng)于第一級(jí)搜索后的最佳匹配點(diǎn)位于水平方向時(shí)的二級(jí)搜索模板,(e),(f)為對(duì)應(yīng)于第一級(jí)搜索后的最佳匹配點(diǎn)位于垂直方向時(shí)的二級(jí)搜索模板。
圖5示出了基于正交分布模型的整像素快速運(yùn)動(dòng)搜索方法的搜索策略示意圖。其中(a)表示第一級(jí)搜索后最佳匹配點(diǎn)位于中心位置時(shí)的搜索策略,(b)表示第一級(jí)搜索后最佳匹配點(diǎn)位于水平邊點(diǎn)時(shí)的搜索策略,(c)表示第一級(jí)搜索后最佳匹配點(diǎn)位于垂直邊點(diǎn)時(shí)的搜索策略。
這一過(guò)程將在下面通過(guò)兩個(gè)具體的實(shí)施例詳細(xì)說(shuō)明首先分析第一步搜索后最佳匹配點(diǎn)位于中心位置的實(shí)施例,如圖5(a)所示,首先搜索初始搜索模板的5個(gè)點(diǎn),即圖5(a)中的圓形實(shí)心點(diǎn),比較5個(gè)點(diǎn)所得的最小誤差值,取值最小的作為該步所得的最佳匹配點(diǎn),若最佳匹配點(diǎn)位于中心位置,則采用小菱形模板即圖5(a)中的方形實(shí)心點(diǎn),作為最終搜索模板,該步搜索后的最佳匹配點(diǎn)即為最終的運(yùn)動(dòng)矢量所對(duì)應(yīng)的塊。
說(shuō)明圓點(diǎn)為第一步搜索點(diǎn),正方形點(diǎn)為第二步搜索點(diǎn)下面著重以一個(gè)具體的實(shí)施例來(lái)說(shuō)明第一級(jí)搜索后最佳匹配點(diǎn)不在中心位置時(shí)的搜索過(guò)程。在附圖6中,若最終要搜索到的運(yùn)動(dòng)矢量為(+4,-4)。首先,采用如圖4(a)所示的初始搜索模板進(jìn)行第一級(jí)搜索后,該步搜索所得的最佳匹配點(diǎn)位于垂直軸上的點(diǎn),如圖6中的第一步所示的(0,-2)點(diǎn),接下來(lái),采用圖4(d)所示的垂直搜索模板在軸向上進(jìn)行搜索,快速定位到最接近的軸向位置上,如圖6中的(0,-4)點(diǎn),此時(shí)因?yàn)樵摬剿阉魉玫淖罴哑ヅ潼c(diǎn)位于圖4(d)垂直搜索模板的中心位置,故以當(dāng)前的最佳匹配點(diǎn)為中心位置,改用圖4(b)所示的最終搜索模板搜索,如果其最佳匹配點(diǎn)不在小菱形的中心位置,則以該最佳匹配點(diǎn)作為新的最終搜索模板的中心,重新搜索該最終搜索模板,直到最佳匹配點(diǎn)位于小菱形搜索模板的中心為止,此時(shí)最終搜索所得的最佳匹配點(diǎn)如圖6中的(4,-4)點(diǎn)。更詳細(xì)的過(guò)程,參照附圖6。
搜索過(guò)程描述首先搜索初始搜索模板的五個(gè)搜索點(diǎn)(圖中第1步所示),其MBD點(diǎn)為垂直方向角點(diǎn)時(shí),采用垂直搜索模板,此時(shí)僅新增一個(gè)搜索點(diǎn)(圖中第2步所示),若該步后,所得的MBD點(diǎn)不位于垂直搜索模板的中心點(diǎn),則繼續(xù)以上步所得的MBD點(diǎn)作為新的垂直搜索模板的中心,繼續(xù)搜索(圖中第3步所示),若搜索所得的MBD點(diǎn)位于當(dāng)前垂直搜索模板的中心點(diǎn)時(shí),則采用最終模板(圖中第4步所示),此時(shí)新增4個(gè)搜索點(diǎn),若搜索后所得的MBD點(diǎn)不是當(dāng)前搜索模板的中心,則以當(dāng)前的MBD點(diǎn)為中心繼續(xù)采用最終搜索模板進(jìn)行搜索,直到搜索所得的MBD點(diǎn)位于中心時(shí),搜索終止。
(搜索過(guò)程最終定位于運(yùn)動(dòng)矢量為(+4,-4))前述的一些討論僅僅描述了本發(fā)明的一些示例實(shí)施例。從這樣的討論、附圖和權(quán)利要求中,本領(lǐng)域的技術(shù)人員將容易認(rèn)識(shí)到,在不脫離所附權(quán)利要求的精神和范圍的要求下,可以進(jìn)行各種修改。因而,本說(shuō)明應(yīng)被看作是說(shuō)明性的而不是限制性的。
本發(fā)明方法在H.264的測(cè)試平臺(tái)JM96基礎(chǔ)上進(jìn)行了實(shí)驗(yàn),選擇了具有代表性的分辨率從QCIF(176×144)到CIF(352×288),運(yùn)動(dòng)劇烈程序從緩慢到劇烈的各種序列進(jìn)行了測(cè)試,本發(fā)明的實(shí)驗(yàn)結(jié)果表明在各種參數(shù)配置(如參考幀數(shù)、量化參數(shù)、搜索范圍等)的情況下,本發(fā)明方法與DS相比,平均psnr以及bit-rate,基本相當(dāng),搜索點(diǎn)數(shù)比DS下降了45%左右;與HEXBS相比,平均psnr值基本相當(dāng),bit-rate略有下降,搜索點(diǎn)數(shù)下降了25%左右。實(shí)驗(yàn)結(jié)果還表明,本發(fā)明方法在量化參數(shù)變化的情況下,在平均每塊搜索點(diǎn)數(shù)上,比DS、HEXBS具有更好的魯棒性。
權(quán)利要求
1.一種基于運(yùn)動(dòng)矢量理想正交分布模型的快速整像素運(yùn)動(dòng)搜索方法,其特征在于,包括搜索模板的選擇依據(jù)于正交分布模型,利用運(yùn)動(dòng)矢量的正交分布特性,快速定位到最優(yōu)點(diǎn)的附近,在各級(jí)搜索模板所對(duì)應(yīng)的多個(gè)運(yùn)動(dòng)搜索點(diǎn)上進(jìn)行運(yùn)動(dòng)搜索;根據(jù)運(yùn)動(dòng)搜索的結(jié)果找到多個(gè)運(yùn)動(dòng)搜索點(diǎn)中最小的運(yùn)動(dòng)搜索點(diǎn);再根據(jù)這個(gè)最小的運(yùn)動(dòng)搜索點(diǎn)在第一級(jí)初始搜索模板中所處的位置來(lái)決定下一步運(yùn)動(dòng)搜索所采用的搜索模板。
2.如權(quán)利要求1所述的基于運(yùn)動(dòng)矢量理想正交分布模型的快速整像素運(yùn)動(dòng)搜索方法,其特征在于,首先搜索中心處周?chē)乃阉鼽c(diǎn),這一步搜索過(guò)后,根據(jù)當(dāng)前搜索的最佳匹配點(diǎn)的位置,分別對(duì)于兩個(gè)正交方向采用各自的搜索模板,再次分別進(jìn)行二級(jí)搜索,即二級(jí)搜索方法里面嵌套另一種二級(jí)搜索的方法,其中嵌套的二級(jí)搜索方法是根據(jù)正交分布模型而采用的搜索方法。
3.如權(quán)利要求1所述的基于運(yùn)動(dòng)矢量理想正交分布模型的快速整像素運(yùn)動(dòng)搜索方法,其特征在于,依據(jù)第一級(jí)最佳匹配點(diǎn)的位置,其搜索可分為二級(jí)或者三級(jí)搜索,具體如下(a)將上一級(jí)搜索得到的最佳匹配點(diǎn)作為本級(jí)搜索的起始點(diǎn),再依據(jù)該點(diǎn)是在上一級(jí)搜索模板中的位置決定采用下一級(jí)的搜索模板;(b)如果初始模板搜索得到的最佳匹配點(diǎn)位于初始搜索模板的中心點(diǎn),則以該點(diǎn)為本級(jí)搜索的起始點(diǎn),直接采用最終搜索模板進(jìn)行最終的精細(xì)搜索,得到每個(gè)點(diǎn)的代價(jià)函數(shù)值,代價(jià)函數(shù)值最小者即為最終的運(yùn)動(dòng)矢量;(c)如果初始搜索得到的最佳匹配點(diǎn)位于初始搜索模板的垂直或者水平方向上的位置時(shí),則以該點(diǎn)作為新搜索模板的中心點(diǎn),直接在垂直或者水平軸向上進(jìn)行快速搜索定位到最接近最終運(yùn)動(dòng)矢量的位置,該點(diǎn)為最終搜索模板的中心進(jìn)行搜索,如果最終搜索模板搜索的最佳匹配點(diǎn)位置不在中心時(shí),就以上級(jí)搜索得到的最佳匹配點(diǎn)作為新的最終搜索模板的搜索中心,重新進(jìn)行最終模板搜索,直到搜索得到的最佳匹配點(diǎn)位于最終搜索模板的中心為止。
4.如權(quán)利要求1或2所述的基于運(yùn)動(dòng)矢量理想正交分布模型的快速整像素運(yùn)動(dòng)搜索方法,其特征在于,所說(shuō)的模板選取突出了方向的特征,所說(shuō)的模板定義如下首先定義一個(gè)基本的5點(diǎn)菱形搜索模板,也就是本發(fā)明的初始搜索模板,此模板上的各點(diǎn)的坐標(biāo)集合ΩO-5為ΩO-5={(x,y)|(±2,0),(0,±2),(0,0)}當(dāng)搜索完初始搜索模板的5個(gè)搜索點(diǎn)后,得到5個(gè)代價(jià)函數(shù),如果代價(jià)函數(shù)值最小對(duì)應(yīng)的搜索點(diǎn)在第一級(jí)的5個(gè)搜索模板的中心時(shí),則直接搜索下述的小菱形搜索模板,該模板搜索后得到的最佳匹配點(diǎn)即為最終的運(yùn)動(dòng)矢量所指向的塊,這個(gè)小菱形搜索模板的各點(diǎn)的坐標(biāo)集合Ωoo-5為Ωoo-5={(x,y)|(±1,0),(0,±1),(0,0)}當(dāng)搜索完初始搜索模板的5個(gè)搜索點(diǎn)后,得到5個(gè)代價(jià)函數(shù),如果代價(jià)函數(shù)最小對(duì)應(yīng)的搜索點(diǎn)在初始搜索模板的5個(gè)搜索模板的水平或者垂直方向上時(shí),則分別采用以下模板進(jìn)行搜索,水平和垂直方向上的搜索模板分別定義如下Ωh-2={(x,y)|(0,0),(±2,0)}Ωv-2={(x,y)|(0,0),(0,±2)}在水平和垂直方向搜索過(guò)后,最終搜索采用的初始搜索后最佳匹配點(diǎn)在中心時(shí)的搜索模板一致,即均為Ωoo-5,只是考慮到最佳匹配點(diǎn)在初始搜索模板過(guò)后,最終的匹配塊就中心點(diǎn)附近,故一次搜索即可,而水平或者垂直方向搜索后,僅搜索到一個(gè)在軸向上比較接近最終匹配塊的位置,故要一直迭代搜索直到最佳匹配塊位于模板中心為止。故最后一級(jí)搜索的模板均為Ωoo-5,只是不同位置采用的策略不同。
5.如權(quán)利要求3所述的基于正交模型的快速整像素運(yùn)動(dòng)搜索方法,其特征在于,所述的搜索策略,具體如下(a)以當(dāng)前位置為起點(diǎn),搜索初始搜索模板的5個(gè)點(diǎn),得到5個(gè)搜索點(diǎn)的代價(jià)函數(shù)值;取代價(jià)函數(shù)值最小者為本步驟最佳匹配點(diǎn),作為下一步搜索的起點(diǎn);如果最佳匹配點(diǎn)在初始搜索模板的中心,則轉(zhuǎn)到步驟(b);如果最佳匹配點(diǎn)初始搜索模板的水平方向兩點(diǎn)時(shí),轉(zhuǎn)到步驟(c);如果最佳匹配點(diǎn)在初始搜索模板的垂直方向兩點(diǎn)時(shí),轉(zhuǎn)到步驟(d);(b)以前一步搜索所得的最佳匹配點(diǎn)作為起始點(diǎn),搜索小菱形模板的5個(gè)點(diǎn),得到5個(gè)搜索點(diǎn)的代價(jià)函數(shù)值;代價(jià)函數(shù)值最小的點(diǎn)即為最終的運(yùn)動(dòng)矢量所指向的點(diǎn),搜索終止;(c)以前一步搜索所得的最佳匹配點(diǎn)作為起始點(diǎn),搜索水平方向搜索大模板的3個(gè)點(diǎn),得到3個(gè)搜索點(diǎn)的代價(jià)函數(shù)值,取代價(jià)函數(shù)值最小者為本步驟最佳匹配點(diǎn);如果本步驟的最佳匹配點(diǎn)不位于中心點(diǎn),則轉(zhuǎn)到步驟(c);如果本步驟的最佳匹配點(diǎn)位于中心點(diǎn),則轉(zhuǎn)到步驟(e);(d)以前一步搜索所得的最佳匹配點(diǎn)作為起始點(diǎn),搜索垂直方向搜索模板的3個(gè)點(diǎn),得到3個(gè)搜索點(diǎn)的代價(jià)函數(shù)值,取代價(jià)函數(shù)值最小者為本步驟最佳匹配點(diǎn);如果本步驟的最佳匹配點(diǎn)不位于中心點(diǎn),則轉(zhuǎn)到步驟(d);如果本步驟的最佳匹配點(diǎn)位于中心點(diǎn),則轉(zhuǎn)到步驟(e);(e)以前一步搜索所得的最佳匹配點(diǎn)作為起始點(diǎn),搜索最終搜索模板的5個(gè)點(diǎn),得到5個(gè)搜索的代價(jià)函數(shù)值,代價(jià)函數(shù)值最小的點(diǎn)即為本步驟所得的最佳匹配點(diǎn);如果本步驟的最佳匹配點(diǎn)不位于中心點(diǎn),則重復(fù)步驟(e);如果本步驟的最佳匹配點(diǎn)位于中心點(diǎn),則此最佳匹配點(diǎn)即為最終的運(yùn)動(dòng)矢量所指向的點(diǎn),搜索終止。
6.如權(quán)利要求3所述的基于運(yùn)動(dòng)矢量理想正交分布模型的快速整像素運(yùn)動(dòng)搜索方法,其具體步驟步驟一,以當(dāng)前搜索窗的中心采用初始搜索模板進(jìn)行搜索,得到MBD點(diǎn),依據(jù)MBD點(diǎn)在初始搜索模板中的位置分別采用不同的搜索模板和搜索策略;步驟二,若MBD點(diǎn)位于初始搜索模板的中心,則采用最終搜索模板再進(jìn)行一次搜索,這步得到的即為最終的運(yùn)動(dòng)矢量,搜索終止;步驟三和步驟四,若MBD不位于初始搜索模板的中心,根據(jù)本方法提出的一個(gè)運(yùn)運(yùn)矢量正交分布的模型,則需要在水平或者是垂直方向快速定位到最佳匹配塊的附近,即水平方向或者垂直方向搜索,這也是本方法所提到的一個(gè)在二級(jí)搜索里再嵌套的另一個(gè)二級(jí)搜索;步驟五,初始搜索得到的點(diǎn)位置不同導(dǎo)致接下來(lái)的搜索模板不同和搜索策略不同,還表現(xiàn)在最終搜索模板的處理上,初始模板搜索后,若MBD點(diǎn)位于中心,則僅僅再搜索一次最終搜索模板即可,而為了提高精度,對(duì)于水平或者垂直方向的搜索后,采用的最終搜索卻是要一直迭代,直到MBD點(diǎn)位于最終搜索模板的中心點(diǎn)才終止搜索。
全文摘要
本發(fā)明涉及視頻編碼技術(shù)領(lǐng)域,特別是基于正交分布模型的快速運(yùn)動(dòng)估計(jì)方法。包括搜索模板的選擇依據(jù)于正交分布模型,利用運(yùn)動(dòng)矢量的正交分布特性,快速定位到最優(yōu)點(diǎn)的附近,在各級(jí)搜索模板所對(duì)應(yīng)的多個(gè)搜索點(diǎn)上進(jìn)行運(yùn)動(dòng)搜索;在運(yùn)動(dòng)搜索的結(jié)果找到搜索點(diǎn)中具有最小誤差的運(yùn)動(dòng)搜索點(diǎn);再根據(jù)該最小誤差的運(yùn)動(dòng)搜索點(diǎn)在第一級(jí)搜索模板中所處的位置來(lái)決定下一步運(yùn)動(dòng)搜索所采用的搜索模板。
文檔編號(hào)H04N7/26GK1941909SQ200510105259
公開(kāi)日2007年4月4日 申請(qǐng)日期2005年9月28日 優(yōu)先權(quán)日2005年9月28日
發(fā)明者杜清秀, 鄭海波, 盧漢清 申請(qǐng)人:中國(guó)科學(xué)院自動(dòng)化研究所